AI尚不具备独立临床诊疗的能力

科技日报
5次浏览

 X9a速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

科技日报北京4月13日电 (记者张佳欣)尽管人工智能(AI)在医疗领域的应用日益增多,但其“像医生一样思考”的能力仍存在明显短板。由美国麻省总医院MESH孵化器团队开展的一项最新研究发现,生成式AI在临床推理关键环节仍显不足,尚不具备独立承担临床诊疗任务的能力。相关成果发表在最新一期《JAMA Network Open》上。X9a速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

团队选取包括ChatGPT、DeepSeek、Claude、Gemini和Grok在内的21种大语言模型,在29个已发表的临床病例中进行测试,并通过逐步提供患者信息(从基本症状到实验室和影像结果)来模拟真实诊疗过程。结果显示,当获得完整信息时,所有模型在超过90%的案例中能给出正确的最终诊断。X9a速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

然而,在关键的早期诊断阶段,这些模型普遍表现欠佳。研究发现,超过80%的情况下,模型未能提出合理的“鉴别诊断”,即对多种可能疾病进行系统性分析与筛选。这一能力被认为是临床推理的核心,也是医生决策的重要基础。X9a速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

为更全面评估模型能力,团队提出了一种名为PrIME-LLM的新指标,从提出潜在诊断、选择检查手段、给出最终诊断到制定治疗方案等多个环节对模型进行综合评价。结果显示,各模型整体评分在64%至78%之间,表现存在明显差异。X9a速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

团队指出,大语言模型更擅长在信息完备的情况下“给出答案”,但在信息不充分、需要开放性推理的情境中表现较弱。随着实验室数据和影像资料的加入,模型表现有所提升,且新一代模型整体优于旧版本,表明相关技术正在持续改进。X9a速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

团队表示,当前大语言模型尚不适合在缺乏监督的情况下直接用于临床实践,其价值更在于辅助医生决策,而非取而代之。X9a速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://www.gihot.com/show-11-33573-0.htmlAI尚不具备独立临床诊疗的能力

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

官改车型来了:比亚迪方程豹豹 5 两款改装版亮相,突出露营、越野属性
3 月 8 日消息,据方程豹汽车官微,在 2024 方程豹深圳国际定制改装车展期间,两款深度定制的豹 5 新车亮相。据介绍,这两款新车由方程豹汽车联手改装厂牌运良越野、ARCANE WARRIOR 深度定制,官方称“打造个性多样的
搭载比亚迪第五代DM-i混动!全新秦L无伪实车曝光:油耗更低
3月9日消息,据“迪粉之家”爆料,近日网络上曝光了接近量产状态的比亚迪秦L路试谍照,该车已经完全去掉了伪装。这款车的定位要高于秦PLUS,同时低于汉,定位于入门级中型轿车,起售价或在12-13万元,最大的亮
人社部部长王晓萍:人工智能、大数据等专业人才需求旺盛 我国就业结构性矛盾仍待破解
21世纪经济报道记者 缴翼飞 实习生 张晓慧 北京报道3月9日,人力资源和社会保障部部长王晓萍在第十四届人大二次会议的民生主题记者会上表示,过去一年我国就业局势持续改善,全年城镇新增
乘联会:2月新能源车出口环比降20%
  中新经纬3月8日电 “乘联会”微信号8日披露2024年2月份全国乘用车市场分析。其中提到,2月新能源车出口7.9万辆,同比增长0.1%,环比下降20.0%。  零售方面,2月乘用车市场零售109.5万辆,同比下降21.0%,环比下降46.2%;今年
谍照显示多台小米 SU7 汽车疑似已在运输途中:可见海湾蓝、雅灰、橄榄绿三种配色款
3 月 10 日消息,据小伙伴投稿,今日有多张疑似小米SU7汽车运输“谍照”现身网络,画面中显示数辆滚装车上运有多款小米SU7车型,其中包含“海湾蓝”、“雅灰”、“橄榄绿”三款“预发布”的配色,不过没有出现此前报道
快要露真容了 曝阿尔卑斯首款SUV假想图
3月8日,有国内媒体曝光了一张蔚来第二品牌“阿尔卑斯”首款SUV的假想图,并附文:“今天给阿尔卑斯1的研发高层看了这张图,回复是「真像」,好了,外观就是这个样子,大差不差了,就等前脸了,我觉得侧后还是不错的。”根据此前官

热点精选

最新推荐

您可能感兴趣