《“电子病历智能体”: 代码赋能大语言模型进行电子病历少样本复杂表格推理》
2024年10月25日
本文提出了一个名为“电子病历智能体”的新型大语言模型(LLM)智能体,旨在通过自然语言直接与电子病历系统交互,以提高临床医生检索复杂患者信息的效率。该项研究由佐治亚理工学院、埃默里大学和华盛顿大学的研究人员共同完成。该项研究得到了多家的支持和资助。
在临床实践和临床研究中,医生依赖数据工程师从电子病历系统中检索复杂的患者信息,这一过程既低效又耗时。“电子病历智能体”通过累积的领域知识和强大的编码能力,实现了自主代码生成和执行,从而简化了医生与电子病历系统的交互流程。研究人员将基于电子病历的多表推理任务视为工具使用规划过程,将复杂任务有效分解为一系列可管理的行动,并利用外部工具集来实现。
“电子病历智能体”的核心在于其能够理解给定的查询,识别并提取所需记录,并将这一过程转化为代码生成、执行、调试和优化的迭代过程。首先,通过注入相关的医疗信息,“电子病历智能体”能够有效地从给定查询中进行推理,并从适当的表格中提取所需记录。然后,通过交互式编码和执行反馈,“电子病历智能体”从错误信息中学习,并逐步改进最初生成的代码。
在三个真实世界的电子病历数据集上的实验表明,“电子病历智能体”的成功率高达85.86%,比最强大的基线模型提高了29.6%,验证了其在处理复杂临床任务时的强大能力,并且只需要极少的示例。这一成果对于提高临床工作效率和患者医疗质量具有重要意义。
1、提出了一个增强型大语言模型智能体,它结合了外部工具和领域知识,能够在仅有四次示例的情况下解决基于电子病历的少样本多表推理任务;
2、通过代码界面进行规划,“电子病历智能体”将复杂的临床问题解决过程转化为可执行的代码计划行动序列,并配有代码执行器;
3、引入了大语言模型智能体和代码执行器之间的交互式编码,通过深入检查环境反馈来迭代优化计划生成和代码执行;
4、在三个电子病历数据集上的实验表明,“电子病历智能体”在多跳推理任务上的成功率比最强基线模型提高了29.6%。
总而言之,“电子病历智能体”通过自主代码生成和执行,利用累积的领域知识和交互式环境反馈,显著提高了电子病历上的多表推理能力。“电子病历智能体”的提出不仅提高了电子病历系统中多表格推理的效率和准确性,还为临床决策支持、患者队列定义、临床试验招募和病例审查选择等临床任务提供了新的解决方案。这一研究为临床数据集成和机器学习技术在医学诊断中的应用提供了新的视角和工具,有望在未来的临床实践中发挥更大的作用。