从300亿分子中筛出6款,结构新且易合成,斯坦福抗生素设计AI模型登Nature子刊

全球每年有近 500 万人死于抗生素耐药性,因此迫切需要新的方法来对抗耐药菌株。

AI 方法可以发现新的抗生素,但现有方法有明显的局限性。性质预测模型很难扩展到大型化学空间。直接设计分子的生成模型可以快速探索广阔的化学空间,但生成的分子难以合成。

在此,斯坦福大学和麦克马斯特大学(McMaster University)的研究人员发明了一种新的生成式 AI 模型 SyntheMol,可以设计数十亿种新的抗生素分子,这些分子价格低廉且易于在实验室中合成。

SyntheMol 可以从近 300 亿个分子的化学空间中设计易于合成的新化合物。该模型可以设计新的抗生素来阻止鲍曼不动杆菌的传播。发现 6 个结构新颖的分子表现出对鲍曼不动杆菌的抗菌活性。

论文作者、斯坦福大学生物医学数据科学副教授 James Zou 说,「SyntheMol 不仅设计了有希望的候选药物的新颖分子,而且还生成了如何制造每种新分子的配方。」

全球健康药物研发中心(GHDDI)首席科学官张儒民博士表示:「生成式 AI 模型 SyntheMol 在短短三个月之内,设计出六款活性不错(当然有待进一步改进)的结构新颖且易于合成的抗生素候选分子。我们因此有理由乐观地预期,在不远的将来,AI 必将大幅提升制药成功率,缩短制药周期,降低研发成本,更快造福人类。」

相关研究以《Generative AI for designing and validating easily synthesizable and structurally novel antibiotics 》为题,于 2024 年 3 月 22 日发布在《Nature Machine Intelligence》上。

论文链接:www.nature.com/articles/s4...

耐药细菌在全球范围内的传播迫切需要新的抗生素,但即使是现代 AI 方法在分离有希望的化合物方面也受到限制,特别是当研究人员还必须找到制造这些新的 AI 引导药物并在实验室中测试它们的方法时。

众所周知,鲍曼不动杆菌很难根除,可引起肺炎、脑膜炎和伤口感染,所有这些都可能导致死亡。世界卫生组织已将鲍曼不动杆菌确定为世界上最危险的耐抗生素细菌之一。但几乎没有什么治疗选择。

该论文的第一作者,麦克马斯特大学生物医学与生物化学系助理教授 Jonathan Stokes 说,「抗生素是一种独特的药物。一旦我们开始在临床上使用它们,我们就会在药物失效之前开始计时,因为细菌会迅速进化以抵抗它们。我们需要强大的抗生素管道,需要快速且廉价地发现它们。这就是 AI 发挥关键作用的地方。」

SyntheMol 设计出 6 个结构新颖且易于合成的抗生素分子

研究人员开发了生成模型,可以快速、廉价地获取数百亿个有希望的分子。

SyntheMol 使用蒙特卡洛树搜索(MCTS),从包含 132,000 个分子片段的库中提取数据,这些片段像乐高积木一样拼凑在一起,但本质上却截然不同。

然后,他们将这些分子片段与一组 13 个化学反应进行交叉引用,使其能够识别 300 亿个片段的双向组合,从而设计出具有最有希望的抗菌特性的新分子。

图示:SyntheMol 模型。(来源:论文)

研究训练 SyntheMol 来设计对鲍曼不动杆菌具有抗生素活性的分子,合成并通过实验验证了所生成的 58 个分子。

该模型设计的每个分子依次通过另一个经过训练来预测毒性的人工智能模型。该过程产生了六种分子,它们对鲍曼不动杆菌具有有效的抗菌活性,而且无毒。

图示:生成式 AI 用于抗生素发现。(来源:论文)

科学家们能够进一步测试六种化合物中的两种对小鼠的毒性,因为其他四种不溶于水。他们测试的两个似乎是安全的;下一步是在感染鲍曼不动杆菌的小鼠身上测试这些药物,看看它们是否在活体中起作用。

难得一见的 10% 高成功率

张儒民博士认为,该研究有至少如下几个可资学习的亮点:

(1)作者首先实测了一万多种化合物对鲍曼不动杆菌的抑菌活性,用这些可靠数据训练「活性预测」模型。这是非常必要的、扎扎实实的基本功。

(2)从头就着眼于「易于合成、结构新颖的小分子」,使用常见的 13 个化学反应和 132,000 个小分子构建块,可以虚拟搭建高达近 300 亿个易于合成的小分子。当然,绝大多数化合物并不具有生物活性。

(3)用生成式人工智能 SyntheMol 模型,基于上述实测数据的「活性预测」建模,在短短八个半小时内完成的 20,000 次迭代分子生成中,设计出近 3,000 款预期具有抗菌活性的候选分子(其中三分之一在头 2,000 次迭代中即生成了)。

(4)最后遴选出 58 个新颖、多元、预测有高活性的分子,并在实验室实际合成出来。其中 6 个分子有相当好的广谱抗菌活性,且有足够低的耐药几率。这代表了难得一见的 10% 高成功率!

图示:生成模型开发。(来源:论文)

张儒民博士补充道:「该研究也存在一定局限性,SyntheMol 模型还不能一步或寥寥几步到位,快速优化设计最后具备完整成药性的、可推到人体临床试验的新颖药物分子。AI 赋能制药的科技革命尚未成功,药业同仁仍需努力。」

研究人员也正在改进 SyntheMol 并扩大其范围。他们正在与其他研究小组合作,利用该模型来发现治疗心脏病的药物,并为实验室研究创造新的荧光分子。

参考内容:phys.org/news/2024-0...

techxplore.com/news/2024-0...

相关推荐
小于小于大橙子2 小时前
视觉SLAM数学基础
人工智能·数码相机·自动化·自动驾驶·几何学
封步宇AIGC4 小时前
量化交易系统开发-实时行情自动化交易-3.4.2.Okex行情交易数据
人工智能·python·机器学习·数据挖掘
封步宇AIGC4 小时前
量化交易系统开发-实时行情自动化交易-2.技术栈
人工智能·python·机器学习·数据挖掘
陌上阳光4 小时前
动手学深度学习68 Transformer
人工智能·深度学习·transformer
OpenI启智社区4 小时前
共筑开源技术新篇章 | 2024 CCF中国开源大会盛大开幕
人工智能·开源·ccf中国开源大会·大湾区
AI服务老曹4 小时前
建立更及时、更有效的安全生产优化提升策略的智慧油站开源了
大数据·人工智能·物联网·开源·音视频
YRr YRr4 小时前
PyTorch:torchvision中的dataset的使用
人工智能
love_and_hope5 小时前
Pytorch学习--神经网络--完整的模型训练套路
人工智能·pytorch·python·深度学习·神经网络·学习
思通数据5 小时前
AI与OCR:数字档案馆图像扫描与文字识别技术实现与项目案例
大数据·人工智能·目标检测·计算机视觉·自然语言处理·数据挖掘·ocr
兔老大的胡萝卜5 小时前
关于 3D Engine Design for Virtual Globes(三维数字地球引擎设计)
人工智能·3d