距离谷歌大模型(MedPaLM 2)拿下美国医学执照考试已经快两年了,人工智能(AI)够资格成为临床医生的“假想敌”了吗?
今年7月,一篇发表于Nature Medicine的论文显示,即使是目前最先进的大语言模型(LLM)也无法为所有患者作出准确诊断,且诊断正确率(73%)明显差于人类医生(89%);在极端情况(胆囊炎诊断)下,LLM的正确率仅为13%。
但对于北京清华长庚医院神经中心医师邳靖陶来说,他今年刚被AI“上了一课”。8月下旬,邳靖陶参与的灵犀医学脑血管病专病大模型正式发布,该模型由其所在医院的神经中心武剑教授团队主导研发,是国内首个基于专病的医学人工智能模型。