当前位置 当前位置:首页 > 值得一看 > 热门事件

《BMJ 2024 圣诞特刊》:人工智能还是人工智障?

2025-01-08小罗网络收集290

《BMJ_2024_圣诞特刊》:人工智能还是人工智障? 图1《BMJ_2024_圣诞特刊》:人工智能还是人工智障? 图2《BMJ_2024_圣诞特刊》:人工智能还是人工智障? 图3

《BMJ 2024 圣诞特刊》:人工智能还是人工智障?


近日,在一项有趣的研究中。科研人员突发奇想地给 3 款(5 个版本)公开可用的「聊天机器人」看了个病,分别测试了它们的认知障碍程度。

蒙特利尔认知评估量表(MoCA)已被广泛用于轻度认知障碍、阿尔茨海默症和其他一些痴呆疾病的病情评估,包括了短期记忆、视觉空间能力、执行功能、注意力与工作记忆、语言、抽象推理和定位共 7 个部分的评估。在测试过程中,MoCA 除了包含大量的医患一对一对话,还设计了很多强互动性质的测试项目。

本次被测试的大语言模型,包括 ChatGPT-4o、ChatGPT-4、Claude 3.5、Gemini 版本 1/1.5 共五种被广泛使用的大语言模型,结果发现,ChatGPT-4o 的 MoCA 评分最高(26 分【及格线】),它也是唯一一个被诊断为「认知正常」的。

其中,ChatGPT-4 和 Claude 3.5 都拿到了 25 分,Gemini 1.5 拿到了 22 分,而 Gemini 1 的分数仅有 16 分。

参考文献:Soroush A, Glicksberg BS, Zimlichman E, et al. Large language models are poor medical coders — benchmarking of medical code querying. NEJM AI. 2024;1(5):AIdbp2300040.

本站提供的一切软件、教程和内容信息仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途。本站所有信息均来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑或手机中彻底删除上述内容。如果您喜欢该程序,请支持正版,购买注册,得到更好的正版服务。如有侵权不妥之处请致信 E-mail:[email protected] 我们会积极处理。敬请谅解!


标签:还是  人工  圣诞  特刊  智能  
   相关评论
本站资源来自互联网收集 仅供用于学习和交流 我们尊重任何软件和教程作者的版权 请遵循相关法律法规 本站一切资源不代表本站立场
投诉侵权邮箱:[email protected] © 小罗资源网