4月17日,真实世界数据(RWD)和肿瘤学分析领域企业Cota Healthcare宣布与赛诺菲达成战略合作,将利用RWD数据和AI提高包括多发性骨髓瘤在内的肿瘤学药物研发效率。
MNC不是第一次盯上RWD这块蛋糕,早在2017年诺华就与Cota达成了为期多年的战略合作,在乳腺癌领域展开丰富应用。
罗氏更在2018年先后以19亿美元和24亿美元重金收购了Flatiron Health与Foundation medicine两家RWD企业。

 

收购报告中,罗氏提到RWD平台在帮助识别临床试验的准确患者群体方面,能帮助企业节省数百万美元,其规范的真实世界数据源和建模能力更是对于加快癌症治疗技术和新药的研发至关重要。

 

时间来到2019年,FDA首次基于RWD批准了辉瑞Ibrance的新适应症,至此RWD彻底颠覆了行业对药物研究模式的传统认知。

 

毕竟传统的随机对照实验(RCT)涉及到的患者不及目标患者群的5%,剩余95%的宝贵数据资产都埋藏在了巨大的真实世界患者群体里。

 

从数据集 到生成式AI
Bringing clarity to cancer。
这是COTA写在官网上的一句话,简洁而有力。
这家由医生、工程师和数据科学家共同创立的企业,目标是从碎片化且难以访问的海量癌症领域数据中,找寻到清晰、可靠的真实世界数据。

 

在浩瀚无垠的数据海洋中,COTA通过电子健康记录(HER)收集到针对不同癌种的人口统计学、病理学、基因组学以及临床治疗数据。

 

收集只是第一步,难点在于如何处理电子健康记录中虚假、错漏甚至不可追溯来源的干扰数据。

 

COTA研发出一套名为Cota Nodal Address (CNA) 分类系统,能通过大数据技术进行临床数据与成本分析,使用简洁的数字代码区分患者及其疾病,并提供监管级的肿瘤RWD。

 

COTA 提供的数据可以通过 ISO 认证,符合 HIPAA 标准,并符合 21 CFR Part 11 法规。
这套专利系统为COTA 的RWD赋予了商业价值,经过迭代后形成了两套成熟的服务模式。
其中Focus属于定制化服务,用户可以根据需求定制纳入真实世界数据。
主要应用于吸纳外部数据补充临床试验结果、生成和探索假设、患者病史描述、概览临床试验数据等场景。

 

而Vantage则是会员制服务,可以订阅特定癌种数据池,数据会按季度更新。
主要应用于简化临床试验研究设计、实时验证假设、支持HEOR研究、优化商业策略等场景。

 

去年COTA更推出了一款适用于癌症研发和护理的生成式AI
这个名为Vista的生成式人工智能数据集,可以使用自动数据抽象技术和机器学习算法直接从电子健康记录(EHR)中获取数据,再由COTA的肿瘤学家提供对数据的程序化监督,以确保信息在临床上准确和相关。

 

这一产品是COTA现有的、更有针对性的数据集Vantage和Focus的前身,能使研究人员能够从广泛的假设生成无缝过渡到特定患者队列的深入临床研究。
Vista也是COTA迄今为止最完整的数据集,包括广泛的合并症信息,超越了肿瘤学疾病,以便提供真实世界癌症人群的真实画像。
在COTA首席执行官Miruna Sasu的构想中,如果能在肿瘤学中建立起可信的大型语言模型,生成式人工智能将会为全球数百万人提供治疗选择。
高质量数据与临床试验的化学反应
在过去几年中,生物制药公司已经能够从各种来源访问越来越多的真实世界数据。
然而,药企往往缺乏能够有效利用这些数据的技能和技术。直到机器和深度学习(ML/DL)方法为分析大型、多维的RWD提供了新的策略。
使用预测性 AI 模型和分析工具解锁 RWD 可以加速对疾病的理解,确定合适的患者和关键研究人员,为选址提供信息,并支持新颖的临床研究设计。
人工智能算法与有效的数字基础设施相结合,可以使连续的临床试验数据流得到清理、汇总、编码、存储和管理。

 

同时使用自然语言处理(NLP)方法能从非结构化临床记录中提取不良事件。对于80%的临床信息都是以文本形式记录的EHR,拥有文本挖掘能力的AI是一种理想工具。
此外,电子数据采集(EDC)还能减少数据收集中人为错误的影响,并促进与其他数据库的无缝集成。
虽然在当下及接下来的很长一段时间,RCTs仍然是验证新化合物在大量人群中的疗效和安全性的金标准。
但相信人工智能蕴含着改变临床发展的强大潜力,更快、更安全、更便宜的临床试验将成为现实。