介绍TxGemma:提升药物研发效率的AI模型

什么是TxGemma?

TxGemma是一组由Google DeepMind开发的开源AI模型,旨在通过利用大型语言模型(LLMs)来提高药物研发的效率。药物研发是一个高风险、耗时且昂贵的过程,90%的药物候选物在第一阶段试验后失败。TxGemma基于Gemma-2模型,专门训练用于理解和预测治疗实体的性质,从识别潜在靶点到预测临床试验结果。

TxGemma的主要特点

  • 模型大小:TxGemma提供3种模型大小:2B、9B和27B参数,每种都有"预测"版本,适用于特定任务,如预测分子毒性。
  • 任务类型:支持分类(例如,分子是否能穿过血脑屏障)、回归(例如,预测药物的结合亲和力)和生成(例如,给定反应产物生成反应物)。
  • 性能:27B模型在66个治疗开发任务中表现优于或与现有最佳模型相似,超越了许多专用模型。

TxGemma如何提升药物研发?

加速药物发现

TxGemma通过预测药物性质、识别潜在靶点和优化临床试验设计来加速药物发现过程。

增强可解释性和互动性

TxGemma-Chat版本可以解释其预测的理由,回答复杂问题,并进行多轮讨论。例如,研究人员可以询问为什么某个分子被预测为有毒,并获得基于分子结构的解释。

如何使用TxGemma?

获取和使用模型

TxGemma模型可在Vertex AI Model Garden和Hugging Face上获取。开发者可以使用这些模型进行推理、微调,并将其集成到自己的研究工作流中。

示例代码

以下是如何使用TxGemma进行预测的示例代码:

ini 复制代码
python
import json
from huggingface_hub import hf_hub_download

# 加载任务模板
tdc_prompts_filepath = hf_hub_download(
    repo_id="google/txgemma-27b-predict",
    filename="tdc_prompts.json"
)

with open(tdc_prompts_filepath, "r") as f:
    tdc_prompts_json = json.load(f)

# 设置任务和输入
task_name = "BBB_Martins"
input_type = "{Drug SMILES}"
drug_smiles = "CN1C(=O)CN=C(C2=CCCCC2)c2cc(Cl)ccc21"

# 构造提示
TDC_PROMPT = tdc_prompts_json[task_name].replace(input_type, drug_smiles)

print(TDC_PROMPT)

微调TxGemma

开发者可以使用自己的数据对TxGemma进行微调,以适应特定的研究需求。例如,使用TrialBench数据集来预测临床试验不良事件。

TxGemma在复杂研究中的应用

TxGemma可以集成到Agentic-Tx系统中,用于解决需要多步骤推理的复杂问题。Agentic-Tx配备了18种工具,包括TxGemma、PubMed、Wikipedia和特定分子工具等。它在包括Humanity's Last Exam和ChemBench在内的多个基准测试中取得了最先进的结果。

相关推荐
zjeweler7 分钟前
网安护网面试-2-国誉护网面试
web安全·网络安全·面试·职场和发展·护网行动·护网面试
2301_822703209 分钟前
光影进度条:鸿蒙Flutter实现动态光影效果的进度条
算法·flutter·华为·信息可视化·开源·harmonyos
人道领域9 分钟前
【LeetCode刷题日记】383 赎金信
算法·leetcode·职场和发展
炽烈小老头17 分钟前
【每天学习一点算法 2026/04/11】Pow(x, n)
学习·算法
旖-旎19 分钟前
哈希表(存在重复元素)(3)
数据结构·c++·学习·算法·leetcode·散列表
明月醉窗台20 分钟前
[jetson] AGX Xavier 安装Ubuntu18.04及jetpack4.5
人工智能·算法·nvidia·cuda·jetson
计算机安禾21 分钟前
【数据结构与算法】第39篇:图论(三):最小生成树——Prim算法与Kruskal算法
开发语言·数据结构·c++·算法·排序算法·图论·visual studio code
weixin_5134499624 分钟前
walk_these_ways项目学习记录第九篇(通过行为多样性 (MoB) 实现地形泛化)--学习算法
学习·算法·机器学习
fish_xk25 分钟前
c++内存管理
开发语言·c++·算法
Tisfy30 分钟前
LeetCode 3740.三个相等元素之间的最小距离 I:今日先暴力,“明日“再哈希
算法·leetcode·哈希算法·题解·模拟·遍历·暴力