图片

大语言模型(LLMs)已成为包括医疗保健在内的各个领域的强大工具。这些模型是在大量文本数据上训练的,使它们能够在多个领域对广泛的知识进行编码。在医学领域,大语言模型利用其编码医学知识的能力在最近的诸多研究中得到了展示和验证,在医学问答、临床文本摘要和临床决策支持等任务上表现出色。某些非常大的语言模型展示了一种新兴的少样本学习能力,该模型可以利用它们现有的理解,通过有限的示例快速适应新任务。这就提出了一个问题,即大语言模型是否可以直接应用于利用电子病历数据进行少样本疾病预测。

 

图片

电子病历包含大量用于预测建模任务的患者数据,这类任务如疾病预测、再住院风险评估和死亡率预测等。现有的基于电子病历的预测方法主要依赖于监督学习方法,包括传统的机器学习模型、表征学习和基于图的模型。虽然有效,但这些监督方法需要在大型标注数据集上进行训练,由于获取高质量标注电子病历数据的高成本和难度,这可能会导致计算成本高昂,而且很难获得。相比之下,少样本学习的能力使大语言模型能够以最少的数据适应新任务,而无需任何微调。这种适应能力提高了利用大语言模型进行电子病历的少样本疾病预测的可能性,这是使医疗保健更加精确和高效的重要一步。

 

图片

本项研究提出了一种基于大语言模型的新型疾病预测方法,该方法结合了预测智能体推理和批评智能体指导,通过电子病历进行少量样本的疾病预测。这项研究旨在探索大语言模型在医疗保健预测任务中的应用潜力,尤其是在少量标注数据的情况下。

 

研究团队首先将结构化的电子病历数据(如诊断、实验室检查、处方等)转换为自然语言叙述,以便于大语言模型更好地理解和处理。接着,他们评估了大语言模型在零样本(Zero-Shot)和少样本(Few-Shot)情况下的诊断性能,并尝试了多种针对电子病历预测任务的提示语策略。

 

图片

本研究的创新之处在于提出了一种名为“电子病历-协同智能体”的新方法,该方法利用两个具有不同角色的大语言模型智能体,即:“预测智能体”和“批评智能体”。“预测智能体”负责做出预测并生成推理过程,而“批评智能体”则分析错误的预测并提供改进推理的指导。通过将“批评智能体”的反馈整合到“预测智能体”的提示语中,系统能够从错误中学习并适应电子病历数据的疾病预测任务,实现了一个基于反馈的学习过程,持续提升疾病预测的准确性。

 

图片

研究团队利用两个数据集进行了实验,评估了“电子病历-协同智能体”方法在不同设置下的性能。实验结果显示,与传统的监督学习方法相比,“电子病历-协同智能体”在少样本学习设置下表现出色,甚至在某些情况下超过了完全监督的机器学习模型。这表明大语言模型在电子病历数据的疾病预测任务中具有很大的潜力。

 

研究得出结论,大语言模型可以作为临床决策支持工具,有助于开发高效、有效的疾病预测系统,尤其是在标注数据有限的情况下。此外,本项研究还强调了在电子病历数据疾病预测任务中利用大语言模型的实用性,并提供了在不同设置下大语言模型性能的见解和实际指导。

 

图片

总之,这项研究为大语言模型在医疗保健领域的应用提供了新的视角,特别是在疾病预测这一关键任务上,展示了大语言模型在处理少量标注数据时的有效性和潜力。通过“电子病历-协同智能体”方法,研究团队展示了如何通过合作协同智能体框架来提高预测的准确性,为未来大语言模型在医疗保健领域的研究和实践提供了有价值的参考。