利用AI辅助医生诊断影响儿童的罕见遗传疾病

📅 2026 年 6 月 19 日 📖 约 9 分钟 OpenAI AI医疗研究

利用AI辅助医生诊断影响儿童的罕见遗传疾病
即使经过基因组测序，许多罕见病患者从未获得明确的基因诊断。在大量检测和专家评审后，大约一半的人仍然无法确诊。他们的医疗数据可能包含线索，但找到这些线索需要从数千到数百万个可能的基因变异、零散的临床记录以及快速变化的科学文献中进行筛选。随着新的基因-疾病关系、病例报告和分类证据的积累，未解决的病例可能会变得可重新解释。
来自波士顿儿童医院Manton孤儿疾病研究中心、哈佛大学和OpenAI的研究人员使用OpenAI o3 Deep Research推理模型，分析了376个此前分析过但仍未解决的病例的去识别临床和基因组信息。该模型为研究人员和临床医生提供了带有证据支持的候选解释以供审查。经过专家评审、额外检测和临床确认，医生在18个病例中建立了诊断——这比之前由专家分析后的额外诊断率增加了4.8%。这项研究于2026年6月18日发表在《NEJM AI》上，展示了AI辅助研究流程如何帮助专家在重新审视一些最困难的病例时产生线索。
许多这些病例多年来逃避了专家的分析。在这项研究中，OpenAI o3 Deep Research帮助研究人员识别了线索，这些线索后来通过既定的临床流程进行了评估，表明随着知识的发展，专家主导的定期重新分析可能变得更加可扩展。该模型未对任何患者进行诊断或做出任何临床决策。它提出了带有证据支持的假设，供专家审查，并在适当的情况下通过额外检测进行调查，并在临床实验室中确认。
为什么一个旧病例可能包含新答案
不确定的基因检测结果并不总是永久性的发现。患者的表型描述、检测结果和家族史可能分散在使用不同标识符、格式和词汇的数据库中。连接这些记录很困难，因此即使是专家也可能错过诊断。专家也可能在相关基因或其变异与疾病关联之前就对孩子的基因组进行测序。随着科学知识的进步，相同的数据可以揭示以前无法发现的答案。
罕见病重新分析既是一个科学问题，也是一个维护问题。患者的基因组可能保持不变，但围绕它的证据不断变化：研究人员将新的基因和变异与疾病联系起来，实验室重新分类旧变异，病例数据库和论文积累新的观察结果。每次更新都可能使一个旧的未确诊病例值得重新审视，因此许多机构积累了大量需要与不断变化的知识库同步的基因组。
在这项研究中，研究人员设计了工作流程，使模型作为现有基因组流程之上的解释优先推理层。它不是只返回一个排序的基因，而是被要求将临床特征、遗传模式、变异证据和科学文献连接成一个人类审查者可以质疑的论证。
重新分析如何工作
对于每个病例，团队整理了一个去识别的数据包，包含标准的人类表型本体术语来描述患者的临床表现、偶尔的临床医生笔记和任何描述性临床诊断、元数据（如年龄和性别）以及过滤后的变异表。该表记录了每个变异的稀有性、对编码蛋白质的预测效应、ClinVar分类以及可用家庭成员中的信号质量。大多数病例包括孩子和亲生父母双方的数据。
团队要求模型提出最合理的分子解释并展示其推理过程。然后，研究人员使用临床实验室用于分类基因变异的相同ACMG/AMP框架审查输出。每个候选结果由至少两名团队成员审查，分歧通过共识解决，模型输出从未被视为诊断。只有在合格专家审查证据、变异被分类为致病或可能致病、CLIA认证实验室确认、并且临床团队将结果返回给家庭后，发现才被计为诊断。
在分析未解决病例之前，团队在已确诊的病例上完善了工作流程。在包含各种罕见疾病的51个病例中，它通过重复运行恢复了48个病例的正确基因和变异。在一组57个神经肌肉病例中，该工作流程通过重复运行在45个病例中返回了正确诊断。在一个15个长读长基因组集合中，它在每个病例中命名了正确的基因，并在12个病例中命名了两个疾病等位基因。这些评估有助于提示开发，并显示了专家审查仍然至关重要的地方。
模型自我报告的置信度分数与这些先前已解决病例中的正确诊断相吻合：一致正确调用的平均最低分数为85.6，错误或未知调用为42.1。这些分数不是校准概率，团队也没有将它们用作证据或临床裁决的替代品。但它们有助于引导专家审查者关注最有希望的候选诊断。
研究人员的发现
然后，团队将该工作流程应用于四组先前未解决的病例：患有神经发育问题的儿童、患有罕见神经肌肉疾病的人、患有早期精神病的儿童和青少年以及儿童意外猝死病例。这些不是等待首次审查的新病例。许多已经通过多个商业或机构流程进行了检查，并由多学科团队进行了讨论。
按队列划分的结果
队列\t病例数\t发现的诊断\t诊断率
神经发育\t100\t10\t10.0%
神经肌肉疾病\t61\t4\t6.6%
儿童意外猝死\t200\t2\t1.0%
早期精神病\t15\t2\t13.3%
总计\t376\t18\t4.8%
早期精神病队列很小，因此其百分比具有较宽的置信区间。诊断率也反映了每个队列具有单基因解释的可能性。
在模型提出候选结果且专家完成审查和临床确认后，医生在4.8%的病例中建立了诊断。这个比率虽然不大，但在这个人群中具有重要意义，因为先前的专家审查未能解决这些病例。类似的重新分析研究报告在经过大量审查的病例中只有个位数增长；较高的诊断率通常来自包含新病例或等待遗传确认的已知疾病的研究。
在18个诊断中，有7个是重新发现：即在本地研究流程之外建立的诊断，但在团队审查的记录中缺失。在几个病例中，变异已被公开数据库列为致病或可能致病，这突显了跨数据源综合信息的操作挑战。
展示识别变异的灵活性
在一个早期精神病病例中，模型推断了基因组中的一个结构事件，该事件未在输入数据中列出。它将22号染色体上的一系列低质量调用与孩子的心脏、免疫、神经发育和精神特征联系起来，然后假设存在与DiGeorge综合征相关的22q11.2缺失。这个假设的变异通过后续基因组测序得到确认。
虽然提示要求一个单基因原因，但模型有时会提出两个基因，更好地解释复杂表现。LAMA2和FOXP1的变异共同帮助解释了一个病例的肌肉和神经发育特征；另一个病例有先前未识别的涉及TTN和SRPK3的双基因解释。
产生可测试的、生物学上合理的假设
除了诊断之外，模型还确定了一种可能的新的机制解释，用于一种称为白癜风的疾病。在一个神经发育病例中，模型突出了S1PR1中11个氨基酸的缺失，该患者患有白癜风。S1PR1编码一个参与信号传导、免疫细胞移动和组织生物学的细胞表面受体。模型综合了证据，表明该缺失可能改变受体结构和信号传导方式，从而减少色素产生，同时帮助免疫细胞在皮肤中持续存在。
提出的S1PR1-白癜风关系需要额外的实验验证，但它展示了AI在将结构生物学、免疫学和临床遗传学的零散发现转化为具体、可测试假设方面的强大作用。
团队在神经肌肉队列中也看到了可能的表型扩展。HSPB8和CDK13的有害变异并不完全匹配这些基因最著名的疾病，表明存在更广泛的临床谱，需要更多病例和实验室工作来测试。
局限性
这项研究表明，一个通用推理模型可以通过将表型、遗传模式、变异注释、数据质量模式和科学文献结合成可审查的假设，为回顾性基因组重新分析做出贡献。它也表明了为什么定期重新分析很重要：一些答案只有在知识进步或碎片化记录被整合后才出现。
这项研究并非证据表明患者、临床医生或客户应使用OpenAI模型来诊断疾病或做出医疗决策。它不描述或认可将OpenAI o3 Deep Research、ChatGPT或任何其他OpenAI产品用于诊断的预期客户用途。该模型未对任何参与者进行诊断；医生和其他合格的临床专家通过既定的审查、检测和临床确认流程做出了每个诊断。
该研究是回顾性的，队列具有异质性，审查者未对模型置信度进行盲法。研究人员没有测量节省的时间、成本、临床医生工作量、假阳性负担或护理变化。他们也没有系统评估其他形式的遗传变异，如结构变异、重复扩增、深内含子变化或嵌合体。
大型语言模型可能会误读上下文或产生看似合理但在仔细检查时失败的解釋。因此，每个结果都经过人类裁决和临床确认。模型扩大了搜索范围，并聚焦了随后的人工分析；它没有决定应向家庭返回哪些信息或诊断。
本研究使用了去识别信息，未在批准环境之外使用或传输受保护的健康信息。更广泛的临床部署将需要对所有医疗护理适用的隐私、安全、可审计性和当地法规给予同等关注。模型访问不能取代测序基础设施、遗传咨询、确认性检测或专家判断。
Catherine Brownstein博士，波士顿儿童医院Manton孤儿疾病研究中心
Alan Beggs，Manton孤儿疾病研究中心主任
下一步是什么
前瞻性、多中心研究应将LLM辅助重新分析与标准实践进行比较，比较指标包括诊断率、找到候选结果的时间、临床医生工作量、假阳性负担、成本和对护理的影响。版本化的提示、参考检查、审计日志和校准的不确定性对于可重复性和安全性至关重要。此类研究仍需要合格的临床医生来评估证据、安排适当的检测并做出任何诊断或治疗决策。
本研究使用了OpenAI o3 Deep Research。较新的通用模型可以搜索和综合更多的科学材料，而专门的系统如GPT-Rosalind则设计用于更深入的生命科学工作，包括变异对蛋白质结构和功能的影响。这些能力在此未进行测试，将需要它们自己的评估和访问控制。
虽然OpenAI帮助支持了这项初步研究，但Manton中心将通过OpenAI基金会的资助领导下一阶段的工作。该资助将支持该中心更广泛的努力，开发一个平台无关、低成本的遗传学AI助手，帮助临床团队更快速、更一致地分析罕见病病例。
长期的研究机会是探索专家主导的AI辅助重新分析是否有助于科学理解跟上发现的步伐。前景不是AI取代医生的诊断，而是经过仔细评估的研究工具可以帮助专家识别值得调查的证据。对于成千上万的家庭来说，今天未解答的问题不必永远得不到答案。

阅读原文

📚 相关主题医疗研究

订阅 AI Pulse