使用 AI 的研究人员正在挖掘长毛猛象和巨型树懒等早已绝迹的物种的 DNA,寻找古代基因组学的秘密,以帮助对抗当今最具感染力的病原体。
根据世界卫生组织(WHO)的数据,全球每年有超过 125 万人死于对抗生素等药物有免疫力的感染。到 2050 年,这一数字可能上升到 1000 万人。此外,在 6 年内,由于治疗传染病的高昂费用,大约 2400 万人可能会陷入极端贫困。
Cesar de la Fuente 博士是宾夕法尼亚大学的教授,他领导着一个研究团队,利用人工智能从已绝迹的史前生物中探测 DNA,以确定危险的耐药微生物的新解决方案。
2024 年 6 月,de la Fuente 博士和一个团队在《自然生物医学工程》( Nature Biomedical Engineering ) 上发表的一篇论文中详细介绍了这项技术,并将其称为“分子去灭绝”。
“在整个进化过程中探索和比较分子可以获得新的生物学见解,”德拉富恩特博士说,“我们的 AI 驱动的分子去灭工作让我们能够带回过去的分子,帮助应对当代挑战。”
使用一组NVIDIA A100 GPUs,de la Fuente 博士和他在宾夕法尼亚州大学机器生物学团队的团队训练了一套深度学习模型,以挖掘活体和灭绝物种的蛋白质组。科学家们假设,当今花费了几十年时间适应和对抗现代药物的病原体可能会受到隐藏在灭绝生物的古代基因组中的抗菌防御的影响。
研究人员对 40 种名为 APEX 的深度学习模型进行了训练,这些模型的 DNA 取自已绝迹的熊和企鹅的化石、古代的木兰树、直牙象、海牛、巨型麋鹿、毛绒猛犸和巨型树懒的化石。
该训练使用了研究人员在内部创建的 988 个肽,以及分别为 5093 个和 5500 个公开可用的抗菌肽(AMP)和非抗菌肽。研究人员指出,内部数据集包含从 34 种细菌中获取的 14738 个抗菌活动数据值。
研究人员使用 cuDNN-加速的 PyTorch 深度学习框架和单个 NVIDIA A100 GPU 进行训练。
训练后,模型预测了加密的肽序列,即免疫系统用来对抗感染的蛋白质片段。
具体来说,APEX 预测了超过 37,000 个具有广泛抗菌应用的肽序列;其中 11,000 个没有在活生物体中发现,这意味着它们的起源或基因组灵感来自于已灭绝的生物。
研究人员缩小了数据范围,然后从 APEX 生成的肽中合成了 69 种潜在的抗生素。
在实验室测试中,小鼠感染了通常会感染人类烧伤患者的细菌病原体,这些古老的、复活的肽能够对抗当代感染。
研究人员发现,使用源自巨树突的实验性抗生素(名为 mylodonin-2)的小鼠在开始治疗后 2 天内健康状况得到改善。事实上,使用这种树突衍生药物治疗的小鼠的改善速度与使用常见抗生素 Polymyxin 治疗的对照组小鼠相同。
de la Fuente 博士说:“通过探索已绝迹的有机体,我们可以接触到当代病原体从未遇到过的大量分子。分子去灭绝可以提供新的化合物库,以对抗人类面临的最大威胁之一的抗微生物药物耐药性。”
研究人员在论文中指出,已绝迹的抗菌分子通过使病原体细胞的内膜去极化来攻击微生物,这与之前描述的大多数抗菌肽不同。
研究人员承认,这种从绝种生物中回收 DNA 的新方法似乎取自迈克尔·克莱顿的惊悚片。直到最近,随着图形处理单元、并行工作负载和人工智能的广泛应用,这一过程几乎是不可能的。
de la Fuente 博士认为,生成式 AI 有可能彻底改变传统和新型药物研发方法的各个方面。
使用传统方法(包括 wetlabs 和 CPU 驱动的计算机)开发一种新的抗菌药物可能需要 10 到 15 年的时间,成本超过 10 亿美元。根据 de la Fuente 博士的说法,通过使用生成式 AI,可以显著减少成本和开发时间。
“GPU 正在改变我们在实验室中的工作方式,”Dr. de la Fuente 博士说,“过去需要 6 年的研究才能完成的工作,我们可以在几个小时内完成。这使我们能够大幅加速抗生素的发现。这就像将科幻小说变为现实。”
de la Fuente 博士正处于成立一家公司的早期阶段,该公司可以将其研究团队发现的最具前景的抗菌药物推向市场。机器生物学团队继续使用其 APEX 模型来探索有前景的抗菌肽,可以帮助人类对抗耐药性病原体。这项工作在 GitHub 上是开源的。
阅读《Nature》中的论文。
查看 Dr. de la Fuente 博士实验室的更多研究成果。