【新智元导读】清华团队竟把医院搬进了AI世界!首个AI医院小镇——Agent Hospital,可以完全模拟医患看病的全流程。更重要的是,AI医生可以自主进化,仅用几天的时间治疗大约1万名患者。
斯坦福AI小镇曾火遍了全网,25个智能体生活交友,堪称现实版的「西部世界」。
而现在,AI「医院小镇」也来了!
最近,来自清华团队的研究人员开发了一个名为「Agent Hospital」的模拟医院。
论文地址:https://arxiv.org/pdf/2405.02957
在这个虚拟世界中,所有的医生、护士、患者都是由LLM驱动的智能体,可以自主交互。
它们模拟了整个诊病看病的过程,包括分诊、挂号、咨询、检查、诊断、治疗、随访等环节。
而在这项研究中,作者的核心目标是,让AI医生学会在模拟环境中治疗疾病,并且能够实现自主进化。
由此,他们开发了一种MedAgent-Zero系统,能够让医生智能体,不断从成功和失败的病例积累经验。
值得一提的是,AI医生可以在几天内完成对1万名患者的治疗。
而人类医生需要2年的时间,才能达到类似的水平。
另外,进化后的医生智能体,在涵盖主要呼吸道疾病的MedQA数据集子集上,实现高达93.06%的最新准确率。
不得不说,AI进化在虚拟世界中默默进化,真有淘汰人类之势。
有网友表示,「AI模拟将探索人类根本没有时间,或能力探索的道路」。
想象一下,数千家全自动化医院,将会拯救数百万人的生命。这很快就会到来。
首个AI医院登场?
其实,智能体,早已成为业界看好的一个领域。
不论是在虚拟世界中的模拟,还是能够解决实际任务(比如Devin)的智能体,都将给我们世界带来巨变。
然而,这些多智能体通常用于「社会模拟」,或者「解决问题」。
那么,是否有将这两种能力结合起来的智能体?
也就是说,社会模拟过程能否,提升LLM智能体在特定任务的表现?
受此启发,研究人员开发了一个几乎涵盖所有医学领域的治疗流程的模拟。
与真实世界看病的流程一样,当患者生病后,就会去医院挂号就诊。
在此期间,它们还会经历一系列阶段,包括检查、分诊、会诊、诊断、治疗。
患者在拿到治疗方案后,LLM会帮助预测患者的健康状况变化。一旦康复,它便会主动向医院汇报进行随访。
如下是Kenneth Morgan前往医院就诊的示意图。
首先是,分诊护士Katherine Li对Morgan进行了初步的评估,并将他分诊到皮肤科就诊。
随后,Morgan在医院柜台进行登记,被安排与皮肤科医生Robert Thompson进行会诊。
在完成规定的体检之后,AI医生为Morgan开出药物治疗,并敦促回家休息,同时还要监测病情的改善情况。
在模拟环境中,研究人员希望训练一个熟练的医生智能体,来处理诸如诊断、治疗等医疗任务。
传统的方法是,将巨量的医学数据喂给LLM/智能体,经过预训练、微调、RAG之后,以构建强大的医学模型。
最新研究中,作者提出了一种新策略——在虚拟环境中模拟医患互动,来训练医生智能体。
在这个过程中,研究人员没有使用手动标记数据,因此最新系统被命名为MedAgent-Zero。
这一策略包含了两个重要的模块,即「病历库」和「经验库」。
诊疗成功的案例被整理,并存储在病历库中,作为今后医疗干预的参考。
而对于治疗失败的情况,AI医生有责任反思、分析诊断不正确的原因,总结出指导原则,作为后续治疗过程中的警示。
简言之,MedAgent-Zero可以让生智能体通过与患者智能体互动。
通过积累成功案例的记录,和从失败案例中获得经验,进化成更优秀的「医生」。
以上结果表明,模拟环境可以有效地帮助LLM智能体在处理特定任务时完成进化。
MedAgent-Zero在使用GPT-3.5时,比SOTA方法Medprompt高出2.78%,在使用GPT-4时比SOTA方法MedAgents高出1.39%。
最后,研究人员还提到了这项研究的局限性。
- 只采用GPT-3.5作为Agent Hospital和评估的模拟器
- 由于智能体之间的交互及其演化涉及API调用,AI医院的运作效率受到LLM生成的限制
- 每个患者的健康记录和检查结果,是在没有领域知识的情况下,模拟真实的电子健康记录生成的,但仍与现实世界的记录仍存在一些差异。
在未来,研究者们对Agent Hospital的计划将会包括:
第一,扩大规模覆盖的疾病范围,延伸到更多的医疗科室,旨在反映真实医院提供的全面服务,以供进一步研究。
第二,在加强智能体社会模拟方面,比如纳入医疗专业人员的全面晋升制度、随时间改变疾病的分布、纳入病人的历史病历等。
第三,优化基础LLM的选择和实施,旨在通过利用功能强大的开源模型,更高效地执行整个模拟过程。
参考资料:
https://x.com/emollick/status/1787896361276571660
非常感谢您的观看!如果您对这个话题有任何想法或问题,请及时留下评论!同时,请关注我们的频道以获取更多有趣的内容,并点赞分享这篇文章。
```