哈佛临床试验显示:AI 在急诊分诊中超越人类医生
哈佛医学院发表在《科学》杂志上的一项突破性临床试验显示,AI 系统在急诊医学分诊这一高压场景中表现优于人类医生,在患者被紧急送入医院后的关键诊断时刻更为准确。
试验设计
研究团队在波士顿一家医院的急诊室开展实验。76 名患者的电子健康记录(包括生命体征数据、人口统计信息和护士的简要说明)被同时提供给 OpenAI 的 o1 推理模型和一对人类医生。
关键数据
- 初始分诊阶段:AI 在 67% 的案例中给出准确或非常接近的诊断,而人类医生仅为 50%-55%。
- 更多信息可用时:AI 准确率升至 82%,人类专家为 70%-79%(但此差异未达到统计显著性)。
- 长期治疗方案:AI 评分 89%,而使用搜索引擎等常规工具的人类医生仅为 34%。
AI 的优势在需要”快速决策、信息有限”的分诊场景中尤为突出。
一个具体案例
一名肺栓塞患者病情恶化。人类医生认为抗凝治疗失败,但 AI 注意到患者有狼疮病史,判断可能是狼疮引起的肺部炎症——这个判断最终被证实是正确的。
意义与局限
哈佛医学院研究员 Arjun Manrai 表示,这并不意味着 AI 将取代医生,而是意味着”我们正见证一项将重塑医学的深刻技术变革”。
研究主要负责人之一 Adam Rodman 博士预测,未来十年将出现一种新的”三方护理模式”——医生、患者和 AI 系统共同协作。他强调,患者最终”希望由人类引导他们做出生死攸关的决定”。
值得注意的是,该研究仅测试了 AI 处理文本数据的能力,并未涉及医生在诊室中通过观察患者痛苦程度和外观获得的视觉信息。AI 的表现更接近于一个基于病历资料提供第二意见的临床助手。
爱丁堡大学医学信息学联合主任 Ewen Harrison 教授指出,这项研究表明”这些系统不再仅仅是通过医学考试或解决人工测试案例,它们开始看起来像是有用的临床第二意见工具”。
现实渗透
根据美国医学会发布的研究,近五分之一美国医生已在用 AI 辅助诊断。在英国,16% 的医生每日使用 AI,另有 15% 每周使用,“临床决策”是最常见的应用场景之一。
但随着 AI 加速进入临床场景,责任归属框架的缺失仍是最大隐忧。谢菲尔德大学的 Wei Xing 博士也提醒,部分研究发现医生可能无意识地倾向于采纳 AI 的建议而非独立思考——这种倾向可能随着 AI 的常规化使用而加剧。