广告

ChatGPT参加美国医疗执照考试,人工智能医生即将上岗?

2023-02-13 15:15:55 综合报道 阅读:
美国执业医师资格考试以难度大著称,但根据一项研究发现,聊天机器人ChatGPT无需经过专门训练或加强学习,就能在美国医学执照考试中取得及格或接近及格的成绩。有专家认为:“社会即将发生变化,我们可能很快就会从 Google 医生或 Bing 护士那里获得专业的医疗建议。”

美国执业医师资格考试以难度大著称,但根据一项研究发现,聊天机器人ChatGPT无需经过专门训练或加强学习,就能在美国医学执照考试中取得及格或接近及格的成绩。hnmednc

发表在美国《科学公共图书馆·数字健康》杂志上的这篇文章称,ChatGPT在没有经过专门训练或加强学习的情况下就能通过或接近通过美国执业医师资格考试(USMLE)。此外,ChatGPT还在考试中表现出高度的一致性和洞察力。这些结果表明,大型语言模型可能有辅助医学教育、甚至临床决策的潜力。hnmednc

hnmednc

为进行这项研究,总部设在加利福尼亚州的安西布尔健康公司的研究人员测试了ChatGPT在考试中的表现。该考试分为三部分,是由美国医学生和培训医师参加的,第一部分侧重于考察基础科学和药理学,考生通常是完成300至400小时专业学习的医学生;第二部分一般由四年级医学生参加,重点考察临床诊断推理能力、医疗管理水平和生物伦理方面内容;最后一部分考试对象是完成至少6至12个月研究生医学教育的实习医生。得分率60%左右即可视为通过考试。hnmednc

研究报告称,标准化考试测试多个医学学科的知识,从基础科学到生物化学,再到诊断推理再到生物伦理学。研究人员就2022年6月那场考试的376道公共试题中的350道对这个人工智能系统进行了测试,它没有提前接受过任何专门训练。hnmednc

在考试的三个部分中,ChatGPT的得分在52.4%至75%之间。hnmednc

考题以各种形式呈现给ChatGPT,包括开放式提问,比如“根据所提供的信息,患者的诊断结果是怎样的?”也有多个选择题,比如:“患者的病情主要是由以下哪一种病原体引起的?”hnmednc

这些问题以各种形式呈现给 ChatGPT,包括开放式提示,例如“根据所提供的信息,患者的诊断是什么?”hnmednc

还有多项选择题,例如:“患者的病情主要是由下列哪种病原体引起的?”hnmednc

研究称,两名互不知情的医师评审员审查了最终成绩的回答。hnmednc

在一致性上,由两名评审人员负责评定,总体而言,ChatGPT 输出的答案和见解在所有问题中的一致性为 94.6%。值得注意的是,ChatGPT有88.9%的主观回答产生了“至少一个重要的见解”。hnmednc

新西兰惠灵顿维多利亚大学软件工程高级讲师、外部专家 Simon McCallum指出,谷歌使用名为 Med-PaLM 的人工智能医疗工具取得了令人惊讶的结果。hnmednc

“ChatGPT 可能会通过考试,但 Med-PaLM 能够为患者提供与专业 GP 一样好的建议,”McCallum 说。“这两个系统都在改进。hnmednc

“社会即将发生变化,我们可能很快就会从 Google 医生或 Bing 护士那里获得专业的医疗建议。”hnmednc

参考链接:Performance of ChatGPT on USMLE: Potential for AI-assisted medical education using large language modelshnmednc

责编:Demi
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
  • 具有双频控制的E类谐振升压DC/DC转换器 Power Electronics News分析了一个以E类双频信号驱动运行的DC/DC升压转换器。
  • 国产SSD主控芯片发布,让存算一体与可信计算兼得 忆芯科技高端企业级芯片及方案发布会在合肥举行。“集成电路是整个可信根的根。没有集成电路是不行的,尽管软件定义,但是一定要软硬结合,以硬件为根。”沈昌祥院士认为。
  • A17 Bionic最新基准测试曝光,多核性能比早期结果慢11%? 据称网上出现了A17 Bionic的新性能数据,显示它在多核工作负载中比之前曝光的数据慢了11%,所谓的Geekbench 6分数是由Revengus发现的,他在韩国网站DCInside上偶然发现了新的A17 Bionic数字。通过下面给出的图片,苹果的第一个3纳米SoC在单核和多核结果中获得了3,019分和7,860分,值得一提的是,此前曝光的基准测试数据单核和多核分数分别为3,986和8,841。
  • 一种高性能半导体材料可以帮助减少热量排放 研究团队创造了一种氧化物陶瓷材料,解决了长期困扰热电发电机的效率问题。这些设备可以从热能中发电,包括发电厂的热能排放,这导致了全球变暖。
  • 三星也玩“P”月亮,“空间变焦”技术被指造假 很多网友一定已经看过三星 Galaxy S23 Ultra 的视频广告了,一位女士拍摄了一张月球的详细照片——陨石坑等等,她对面的邻居握着望远镜问道:“Can you send me that?”。而这段视频,也被一位网友指认为三星“空间变焦”(Space Zoom)登月照片造假的证据。
  • AC/DC电源尺寸在继续缩小 无论AC/DC电源是开放式还是封闭式,甚至是台式适配器,用于医疗应用和工业应用的最新电源设备都有一些共同点:它们提供了更小的解决方案尺寸并实现了更高的功率密度,同时提供更高的效率。
  • 从“吸血鬼设备”中节省家庭用电 家用电器浪费了大约20%的电力。这些能源吸血鬼有可能通过减少不断增长的需求来节省资金和能源。
  • 激光显示的四大核心器件国产化进程:自研芯片技术亟待提 激光显示的四大核心器件国产化程度从高到低依次为抗光幕布、激光光源、镜头、光成像芯片。技术突破下,预计未来3-5年内激光产业链国产化程度从45-55%提高至75%-80%,实现从技术领先到产业领先的跨越。
  • 中国科学家刷新纪录,达成百兆比特率的实时量子密钥分发 近日,中国科学技术大学潘建伟、徐飞虎等与上海微系统所、济南量子技术研究院、哈尔滨工业大学等单位的科研人员合作,通过发展高保真度集成光子学量子态调控、高计数率超导单光子探测等关键技术,首次在国际上实现百兆比特率的实时量子密钥分发,实验结果将此前的成码率纪录提升一个数量级。
  • PUF技术进展:可省去ID注册阶段的新PUF IP问世 物理不可克隆功能(physically unclonable function, PUF)技术运用了简单、经济高效且灵活、无需存储密钥的方式,建立信任根(Root of Trust)。然而,当PUF应用于替芯片产生特定密钥,还要确保不同芯片间ID的低重复率仍具有挑战性... 
  • 磁子电子学新突破,可用于芯片和雷达的光诱导磁子态 日前,据上海科技大学官网消息,上海科技大学物质科学与技术学院陆卫教授课题组在光子-磁子相互作用及强耦合调控方向取得重要进展。研究团队首次在铁磁绝缘体单晶中发现了一种全新的磁共振,命名为光诱导磁子态(pump-induced magnon mode, PIM)。
  • 原子钟在数据中心的作用:原子从对数据造成不利影响到带 利用原子钟授时现已成为数据中心不可或缺的组成部分。目前,通过全球定位系统(GPS)和其他全球导航卫星系统(GNSS)网络传输的原子钟时间已使全球各地的服务器实现了同步,并且部署在各个数据中心的原子钟可在传输时间不可用时保持同步。
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了