图片

临床试验对于推进科学发现、改善患者治疗和推动医学创新至关重要。它们的重要性在肿瘤学领域尤为明显,因为它们可以为替代治疗方案有限的肿瘤患者提供可能的治疗选择。尽管如此,大量临床试验仍面临招募方面的挑战。只有大约7%的成年人参加癌症临床试验。造成这一招募瓶颈的主要因素之一是,医生在根据可用试验列表系统地审查每位患者时遇到了相当大的挑战。这项繁琐的任务导致试验推荐率较低,这通常是由于根据这些试验的细致入微的纳入和排除标准来辨认患者的资格所涉及的错综复杂性。

 

图片

与临床试验纳入和排除标准相关的核心信息主要存在于非结构化的电子病历中,如医疗记录。最近的一项研究表明,这与肿瘤学特别相关,在结构化的电子病历中,临床试验筛选的关键参数实际上是缺失的。这些情况给大规模的解释带来了巨大的挑战。即使在处理结构化电子病历时,使用试用标准创建查询也常常具有挑战性。为了解决这种复杂性,已经出现了几项利用自然语言处理(NLP)的研究,旨在提高临床试验匹配过程的效率。
一种常见的方法是将试验的纳入和排除标准转换为结构化查询。然后,可以利用这些查询从专用的临床数据仓库中高效地检索相关数据。另一种策略侧重于从患者记录中提取关键数据元素,并将这些信息重新格式化为结构化布局,以帮助过滤临床试验。

 

图片
虽然这两种方法在临床试验匹配中都表现出了有效性,但它们也都有局限性。这两种方法通常都依赖于基于规则的工程,这既繁琐又不灵活。此外,将这些方法扩展到涵盖各种临床试验和各种可能的患者场景,也是一项挑战。利用大语言模型进行患者试验匹配的最新进展显示出相当好的前景。然而,这些研究主要利用相对简单或合成的患者记录和临床试验设置,这些记录和设置并不能准确反映现实世界场景的复杂性。此外,它们不处理单个患者在电子病历中可能有数百条记录的长期上下文场景。在试图处理整个患者旅程时,它们将自己限制在一个定义明确的变量中,同时使用经过泛泛训练的模型提取变量。再者,这些方法中的大多数(如果不是全部的话)都依赖于专有的大语言模型,而这些大语言模型很难部署在敏感和注重隐私的医疗保健领域。

 

图片

据本文作者所知,他们的研究首次提出了一个全面而综合的管道,以展示使用真实世界患者电子病历数据和大语言模型的端到端的临床匹配系统。这种方法完全依赖于直接将非结构化的患者记录和详细的临床试验纳入和排除标准输入大语言模型。

 

本项研究的贡献可归纳概括为如下几点:

 

1、可扩展的端到端管道:他们引入了一种新的管道,该管道执行患者记录解释,并在临床试验中直接使用纳入和排除标准的语义,通过一种机制将自由文本标准直接摄取到管道中,而无需任何基于规则的处理,从而匹配患者。

 

2、微调大语言模型:他们定制的“肿瘤大语言模型”的性能优于GPT-3.5,有与GPT-4相当的功效。但“肿瘤大语言模型”比两者都小得多,可以托管在私有基础设施中以解决隐私问题。

 

3、与医生对标:他们首次提出证据表明,大语言模型在临床试验匹配任务中几乎可以与合格医生的表现相匹配。这一发现表明,大语言模型在实际临床应用中具有潜力。

 

4、综合评价:他们对所提出的管道进行了广泛的评估,不仅在临床试验排序分数方面,而且在针对特定试验标准的患者资格提供详细解释方面。

 

5、临床试验排序算法:他们提出了一种新的临床试验排序算法,与基线法相比,显著提升了相关试验的平均位置。

 

6、两种搜索方向:他们证明了,用于识别患者试验的相同管道(以患者为中心的搜索)也可以使研究人员为试验创建合格的患者队列(以试验为中心的检索)。既可以为患者找到合适的临床试验,也可以为某个临床试验找到合适的患者。这是首次在同一系统中展示这两个方向。

 

图片

总之,该项研究证明了利用大型语言模型进行临床试验匹配的潜力,尤其是在提高效率和准确性方面。尽管存在挑战,但该研究为未来的临床试验匹配系统提供了有价值的见解和方法,对于推进临床试验的自动化匹配具有重要意义。