在单克隆抗体研发与保存过程中,抗体序列是核心核心知识产权与后续实验开发的基础。常规获取抗体重链、轻链全长序列的主流方式为细胞遗传物质测序,适用于杂交瘤细胞、噬菌体展示、酵母展示、单细胞筛选等各类抗体开发体系,具备成本低、稳定性高、结果可靠的优势。
但在实际实验与长期保存中,经常会出现杂交瘤细胞污染、活性下降、细胞丢失等问题,导致原始抗体遗传信息永久丢失,无法通过核酸扩增获取抗体基因。针对这一痛点,抗体全长蛋白测序技术成为唯一有效的补救方案。通过埃德曼降解、质谱从头测序等蛋白测序手段,可直接从抗体蛋白样本中复原完整重链、轻链序列,实现优质抗体资源的永久保存,为后续抗体重组表达、人源化改造、专利申报及文章发表提供核心数据支撑。
一、抗体测序技术主要分类及特点
目前主流抗体测序技术主要分为埃德曼降解测序、质谱测序两大类,同时根据检测目的可分为肽谱分析与抗体从头测序,各类技术适用场景与性能差异明显。
1. Edman降解测序技术
Edman降解法是经典的蛋白末端测序技术,技术体系成熟稳定。其工作原理是从抗体蛋白N端开始,逐一切割并识别单个氨基酸残基,实现序列读取。该技术最大优势是样品需求量极低,通常仅需不足1μg样品即可完成检测。
但该技术存在明显短板,随着测序氨基酸数量增加,检测误差会不断累积,测序质量持续下降。因此Edman降解法仅适用于检测抗体前端30--50个氨基酸残基,只能用于末端序列鉴定,无法完成抗体全长测序。
2. 基于质谱的抗体测序技术
质谱测序是当前抗体全长测序的核心主流技术。其核心流程是将完整抗体蛋白通过蛋白酶切,降解为15--20个氨基酸长度的短肽片段,再利用质谱仪采集肽段离子图谱。通过解析海量片段图谱,结合生物信息学分析推导抗体序列。
为规避单一切割方式导致的序列盲区,实验会选用多种不同酶切位点的蛋白酶同步切割,生成大量相互重叠的肽段序列。借鉴基因组鸟枪法组装原理,通过重叠肽段拼接、比对、矫正,最终组装出完整的抗体全长序列,是目前未知抗体序列解析的核心手段。
3. 肽谱分析与抗体从头测序
肽谱分析与从头测序功能定位完全不同。肽谱分析主要用于验证已知抗体序列,仅需少量酶切与质谱检测即可完成比对验证,实验流程简单、成本更低。抗体从头测序属于全新序列解析技术,主要针对无基因序列、无参考数据库的未知抗体,依靠质谱片段图谱从零推导完整氨基酸序列,技术难度、实验复杂度与检测精度要求更高,是抢救丢失细胞株抗体序列的关键技术。
蛋白质从头测序(De Novo Sequencing)是不依赖参考数据库、直接解析蛋白序列的高精度质谱技术。其核心原理是利用串联质谱(MS/MS)获取肽段碎裂离子,通过计算不同片段离子之间的精准质量差,匹配对应氨基酸残基分子量,逐步推导肽段氨基酸排列顺序,最终拼接组装为完整蛋白序列。该技术不仅适用于抗体序列解析,还可广泛应用于动植物、细菌、真菌等各类物种的未知蛋白与基因组研究,通过文库构建、序列拼接、功能注释,实现未知生物序列的完整解析,通用性极强。
二、抗体从头测序完整实验流程
抗体全长从头测序拥有标准化、高精度的实验流程,全程依托高分辨质谱平台完成,具体步骤如下:
首先对纯化后的抗体样品进行多酶联合酶解,利用多种蛋白酶切割蛋白,获得丰富、重叠度高的肽段片段;随后通过液相色谱与Orbitrap Fusion高分辨质谱仪联用,完成肽段分离与质谱数据采集,保障低丰度肽段的识别灵敏度。
在肽段碎裂环节,采用HCD与ETD双模式碎裂结合的方式,大幅提升碎片完整性,同时解决同分异构体识别难题。最后利用De Novo算法解析质谱图谱,获取单条肽段序列,通过多序列比对、矫正、拼接,从蛋白N端至C端完整组装出抗体轻重链全长序列。
三、抗体测序核心数据分析要点
1. 全覆盖肽段获取
数据分析的基础是保障蛋白全覆盖。实验选用胰蛋白酶、胰凝乳蛋白酶、Glu-C、Lys-C、胃蛋白酶、弹性蛋白酶等多种特异性与非特异性蛋白酶同步酶切,生成丰富多样的重叠肽段,使抗体蛋白覆盖率达到100%,彻底消除序列盲区,为精准拼接提供充足数据支撑。
2. 肽段筛选与序列推导
质谱检测会产生海量冗余、低质量肽段数据,需进行严格筛选。数据分析优先保留高峰度肽段,结合b/y二级离子碎裂特征判断肽段有效性。针对碎片离子缺失导致的序列模糊问题,通过整合多组碎裂模式图谱、多轮数据矫正,大幅提升序列推导的准确性。
3. 亮氨酸与异亮氨酸精准区分
亮氨酸(Leu)与异亮氨酸(Ile)分子量完全一致,是传统质谱测序的最大难点。而二者大量分布在抗体CDR功能区,一旦识别错误,会直接导致抗体亲和力下降、特异性缺失,严重影响抗体功能。
依托HCD与ETD双碎裂模式可实现精准区分:ETD碎裂产生c/z离子,结合HCD碎裂形成特征w离子。其中亮氨酸碎裂后发生43Da质量丢失,异亮氨酸碎裂后发生29Da质量丢失,通过特征质量差可精准分辨两种同分异构体,保障CDR区序列完全准确。
4. 多重数据验证
为确保测序结果真实可靠,需进行双重验证。一是分子量验证,通过检测抗体完整态、还原态、脱糖态等不同形态的分子量,校对氧化、脱酰胺、糖基化、N端环化、C端碱基缺失等修饰信息,排除序列误差。二是数据库回验,利用全新测序序列自建参考数据库,重新匹配质谱原始数据,最终实现近乎100%的序列匹配率,确保抗体全长序列精准无误。
四、总结
抗体全长从头测序是挽救缺失细胞株抗体资源、解析未知抗体序列、支撑抗体改造与专利申报的核心技术。相较于传统Edman末端测序,基于多酶解、高分辨质谱的从头测序技术可实现抗体全长精准解析,同时通过双碎裂模式解决氨基酸同分异构体识别难题。结合全覆盖肽段筛选、精准序列拼接、多重数据校验的分析体系,能够稳定输出高准确度的抗体重链、轻链全长序列,为抗体重组表达、人源化改造、亲和力优化及临床前研发提供坚实的数据基础。