读书笔记:《生物信息学与功能基因组学》第十章(第二部分)
标题:多序列比对的策略与方法
渐进比对方法
- Feng和Doolittle的渐进比对:这是一种常用的多序列比对方法,它首先计算所有序列之间的两两比对分值,然后从最相似的一对序列开始,逐步加入其他序列。
比对过程详解
- 阶段1:产生一系列的两两比对,通过Needleman和Wunsch算法进行原始相似性分值的计算。
- 阶段2:基于相似度矩阵或距离矩阵产生辅助导向树,使用UPGMA或邻接法建立树结构,反映序列间的进化关系。
- 阶段3:根据导向树的位置关系,逐步建立多重比对,遵循"一旦是空白,永远是空白"的规则。
隐马模型(HMM)
- 定义:HMM是一个描述在每个位点氨基酸残基出现概率的概率模型,可以用于序列比对和数据库搜索。
- 应用:HMM可以定义蛋白质或基因家族,并用于基于HMM的数据库搜索,如Pfam、SMART、TIGRFAMS。
多序列比对的实际应用
- 构建系统发育树:多序列比对是构建系统发育树的关键步骤,有助于理解物种间的进化关系。
- 基因组数据分析:在基因组测序完成后,多序列比对用于定义所有基因产物所属的蛋白家族。
软件工具
- ClustalW:一个通用的多序列比对程序,能够对DNA或蛋白质序列进行比对,并展示生物学意义上的多重序列比对。
网络资源
- CustalW在线服务:提供了一个界面,用户可以上传序列并进行多序列比对。
结论
多序列比对不仅是生物信息学中的一个基础工具,而且对于理解蛋白质功能、指导实验设计以及揭示生物分子的进化历史都具有重要意义。随着技术的发展,比对算法和软件工具的不断改进,使得这一过程更加高效和准确。
我创建了一个生信行业交流群,有兴趣的小伙伴可以加v bbplayer2021,或者后台私信,大家共同进步