更强的蛋白质突变效应预测!一键推理 DePLM 去噪蛋白质语言模型

为了设计出具备更高热稳定性、催化效率的蛋白质,科学家们可以通过改造蛋白质的氨基酸序列来改进其功能,这称为蛋白质优化。浙江大学陈华钧教授、张强研究员、王泽元博士等人提出的全新的去噪蛋白质语言模型 (DePLM),可以将蛋白质语言模型捕捉到的进化信息视为与优化目标特性相关和无关的混合体,其中无关信息被视为「噪音」并消除,进而提高模型在预测蛋白质适应性景观时的准确性,帮助识别功能最优序列以进行优化。

教程链接:https://go.openbayes.com/KXCsB

使用云平台:OpenBayes
http://openbayes.com/console/signup?r=sony_0m6v

登录 http://OpenBayes.com,在「公共教程」页面,选择键部署 「DePLM:用去噪的语言模型优化蛋白质(小样本)」教程。

页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。

选择「NVIDIA GeForce RTX 4090」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。可以使用文章开头的邀请链接,获得 RTX 4090 使用时长!

稍等片刻,待系统分配好资源,当状态变为「运行中」后,点击「打开工作空间」,即可进入 Jupyter 工作页面。

进入 Jupyter 工作空间后,可以点击「README.ipynb」查看具体的操作步骤。

该演示选取数据集为 ProteinGym,已经被预处理为适合批量训练的格式。

模型为 ESM-2 (Evolutionary Scale Modeling 2),这是 Meta AI 开发的一种蛋白质语言模型。

平台已将所需要的环境与数据集配置完成。大家可通过直接执行下面命令进行训练和推理。

复制代码
!python ./archive/src/train.py data=batched_proteingym data.assay_index=196 data.split_index=0 dat
相关推荐
大学生毕业题目33 分钟前
毕业项目推荐:83-基于yolov8/yolov5/yolo11的农作物杂草检测识别系统(Python+卷积神经网络)
人工智能·python·yolo·目标检测·cnn·pyqt·杂草识别
居7然38 分钟前
美团大模型“龙猫”登场,能否重塑本地生活新战局?
人工智能·大模型·生活·美团
说私域1 小时前
社交新零售时代本地化微商的发展路径研究——基于开源AI智能名片链动2+1模式S2B2C商城小程序源的创新实践
人工智能·开源·零售
IT_陈寒1 小时前
Python性能优化:5个被低估的魔法方法让你的代码提速50%
前端·人工智能·后端
Deng_Xian_Sheng1 小时前
有哪些任务可以使用无监督的方式训练深度学习模型?
人工智能·深度学习·无监督
数据科学作家4 小时前
学数据分析必囤!数据分析必看!清华社9本书覆盖Stata/SPSS/Python全阶段学习路径
人工智能·python·机器学习·数据分析·统计·stata·spss
CV缝合救星5 小时前
【Arxiv 2025 预发行论文】重磅突破!STAR-DSSA 模块横空出世:显著性+拓扑双重加持,小目标、大场景统统拿下!
人工智能·深度学习·计算机视觉·目标跟踪·即插即用模块
TDengine (老段)7 小时前
从 ETL 到 Agentic AI:工业数据管理变革与 TDengine IDMP 的治理之道
数据库·数据仓库·人工智能·物联网·时序数据库·etl·tdengine
蓝桉8028 小时前
如何进行神经网络的模型训练(视频代码中的知识点记录)
人工智能·深度学习·神经网络
星期天要睡觉8 小时前
深度学习——数据增强(Data Augmentation)
人工智能·深度学习