在药物研发与合成生物学领域,"从头设计"(de novo design)正从理论走向实践。过去,我们习惯于基于天然分子进行修饰优化;而如今,科晶生物借助生成式AI模型,可以帮助研究人员在计算机中直接"创造"具有特定功能的全新分子------这不是科幻,而是正在发生的科研现实。
近期,我们观察到一批高质量的计算设计案例,其方法论展现出清晰的技术演进路径:生成模型设计 → 多层次计算筛选 → 结构验证闭环。这一流程已在多类生物分子设计中验证有效,包括:
1. 高亲和力多肽与环肽:扩散模型驱动的精准结合
- 采用 RFdiffusion 或 Evobind2 等扩散生成模型,在目标蛋白活性位点(如B35--50、B272--297)定向生成数千个候选多肽(8--20 aa);
- 通过 Hdock 或 AutoDock Vina 进行第一轮高通量对接筛选(结合能 < -200 或 < -10 kcal/mol 为高潜力信号);
- 再以 AlphaFold 3 对Top候选进行复合物结构建模,用 pTM + ipTM > 0.75 作为结构可靠性阈值;
- 关键发现:多肽的 pLDDT值 与建模可信度正相关;GRAVY/等电点/稳定性指数 可辅助评估成药性潜力。
技术启示:短肽设计已从"经验猜测"转向"可计算可验证"的范式,尤其适合靶向蛋白-蛋白相互作用界面(PPI)等传统小分子难成药靶点。

科晶生物从头设计多肽技术概要
2. 核酸结合多肽:面向基因调控的新工具
- 针对启动子/翻译起始区(如A1--12),使用 Boltzgen 全原子扩散模型生成结合蛋白;
- 同样采用 Hdock + AlphaFold 3 验证流程,重点评估 界面预测TM分(ipTM);
- 结果显示:高置信度(Confidence_score > 0.7)结合体在结构上呈现密集氢键网络,提示其可能具备抑制/激活转录的潜力2。
延伸价值:为CRISPR递送、反义寡核苷酸增强、RNA靶向调控等提供新思路------不再依赖天然RNA结合域,而是"定制化"设计。

科晶生物核酸设计结合多肽技术概要
3. 小分子化合物:MegaMolBART + DiffDock 的双引擎策略
- 针对明确结合口袋,使用 MegaMolBART(等变扩散模型)生成300+候选分子;
- 先经 AutoDock Vina 高通量初筛,再对Top 50进行精细化对接;
- 最终用 DiffDock 深度学习对接模型校验结合构象,其优势在于:避免传统搜索空间爆炸,直接生成物理可行的结合姿势;
- 实测中最高结合能达 -11.34 kcal/mol ,进入"强结合"区间(< -10 kcal/mol)3。
方法论亮点:DiffDock 与 Vina 形成互补------前者擅长构象生成,后者擅长能量排序,联合使用显著提升假阳性过滤效率。

科晶生物从头设计化合物技术概要
4. 纳米抗体:CDR区"生成+进化"双阶段设计
- 以天然纳米抗体骨架为基础,用 RFdiffusion 设计CDR3区(7/11/15 aa);
- 拼接后对CDR1/CDR2进行 100轮随机突变+Hdock再筛,最终获得结合能普遍 < -200 的候选体;
- AF3验证显示:高亲和力纳米抗体在界面形成大量氢键与疏水簇,结构稳定且特异性强4。
产业意义:大幅缩短抗体发现周期(从数月→数周),为双特异性、细胞因子偶联等新型生物药提供源头素材。

科晶生物从头设计纳米抗体技术概要
为何这套流程值得重视?
- 可复现性高:所有步骤均基于公开工具(RFdiffusion/Boltzgen/MegaMolBART/Hdock/Vina/AlphaFold3),代码与协议日益成熟;
- 成本显著降低:计算筛选替代90%以上的湿实验初筛,仅需对Top 5--10候选进行体外验证;
- 设计自由度提升:不再受限于天然序列库,可探索"非天然"化学空间(如D-型氨基酸、非标准侧链);
- 多模态验证闭环:从能量(Docking Score)、结构(pTM/ipTM)、理化性质(GRAVY/pI/稳定性)三维度交叉印证,降低误判风险。
当然,我们也需清醒认识到:计算预测 ≠ 生物活性。对接分数是必要非充分条件,最终仍需SPR、ITC、细胞功能实验确认。但不可否认,生成式AI正将"理性设计"推向新高度------从"试错式优化"迈向"目标导向创造"。
对于科研人员与产业界而言,理解并掌握这一技术栈,或许已成为下一代分子设计者的"基础配置"。

科晶生物技术服务