图片

在生物制造领域,AI技术已在帮助研究者解决一些重大难题。

 

例如中国农业科学院深圳农业基因组研究所研究员闫建斌团队,该团队在今年初领衔破解了“紫杉醇生物合成”——这一世界级难题。

 

图片

成果已发布在《Science》上,通过对紫杉醇生物合成的关键酶的发现,揭示了合成调控的新机制,进而实现了重要生产原料巴卡亭III的异源生物合成。

关键酶的背后 AI功不可没

在媒体采访中,闫建斌谈到了研究中的困难,其中就有关键酶的问题。

 

紫杉醇生物合成中大约20步反应中有一半都是P450细胞色素酶,这类酶结构和活性复杂,自然界中有20万种P450细胞色素酶,要从中找到紫杉醇合成酶,如同大海捞针。
这一研究过程中,AI技术起到至关重要的作用,尤其是在效率上提升明显。

 

紫杉烷类分子众多,化学空间巨大,难以分离出所有化合物,团队便做了AI算法模型,用AI预测化学结构

 

当细胞里人工加入的酶产生紫杉烷类分子时,在没有标准品的情况下,AI也能判定是否生成了紫杉烷类分子

图片

紫杉烷氧杂环丁烷合酶的筛选与鉴定

代谢工程中,很多酶的结构也用到AI技术预测和人工改造
此外,在做基因组及基因组对应的基因表达调控网络分析时,当受原有算法限制而不能得到更精准数据的时候,AI技术也能有所帮助。
在闫建斌的描述中,此前紫杉醇合成生物学领域还没有人用过AI辅助。
当AI技术包括AlphaFold出来时,该团队的合作者包括北京大学、复旦大学的合作团队就在探讨基因组学、代谢组学怎样与AI更好地融合。

 

AI+生物制造 回归数据问题

 

合成生物学和AI的合作,首先是两者拥有根本上的共通点——数据

 

AI与生物技术最大的共性就是都依赖数据,来确定和实现某种功能,其中AI以模型、代码等形式存在于外部,而生物体的数据存储在DNA序列或基因中。

 

最简单的生物体也有超过100000个碱基对的DNA,人类这样复杂的生命体则有超过30亿个碱基对,这些碱基就像数据点,AI可以使用它来训练、创建和输出。

 

图片

 

而且,种类繁多的DNA组合拥有人类大脑难以理解的复杂性和可选性。

 

但AI擅长发现规律并相互联系,进行足够的训练后,可以从海量的DNA组合中识别出最有希望的候选者。

 

哪怕是出于成本考虑,实验室的试错过程漫长且昂贵,通过AI实现的虚拟和自动化测试能更快、更便宜的完成测试,反过来使合成生物学具有经济效益

 

AI的新发展,尤其是生成式 AI 的出现和改进,其实是为生物制造打开了创造力的大门。

 

但另一方面来说,目前AI的表现情况仍直接取决于人类给予它学习的数据,现阶段对AI应用来说,最重要的还是由实验人员产生足够的数据。

 

—The End—