Biopython学习笔记

chenxy022026-05-29 9:55

简介

Biopython （Biopython · Biopython - Biopython 文档）是一个专门用于计算分子生物学的开源工具包。旨在通过提供高质量、可复用的模块和类，让使用Python处理生物数据变得更容易。

其核心功能包括：序列处理、文件格式解析、序列比对、结构生物学、系统发育分析、群体遗传学等。

序列处理

Bio.Seq 提供核心的Seq类，用于处理序列等信息，支持转录、翻译等常见操作。代码示例如下：

python 复制代码

from Bio.Seq import Seq

def seq_lab():
    # 创建一个DNA序列对象
    my_seq = Seq("AGTACACTG")

    # 打印序列
    print("原始序列：", my_seq)

    # 反向互补
    # 1、先反转序列：GTCACATGA
    # 2、碱基互补（A↔T、G↔C），最终反向互补序列：CAGTGTACT
    print("反向互补链：", my_seq.reverse_complement())

    # 转录为RNA
    # 转录以 DNA 反向互补链为模板链，碱基配对：DNA的T→RNA的U，A↔U，G↔C。
    print("转录后RNA序列: ", my_seq.transcribe())

    # 翻译为蛋白质（氨基酸序列）
    # 每三个碱基为一组（密码子），翻译出的氨基酸序列为：丝氨酸 - 苏氨酸 - 亮氨酸 ( Ser-Thr-Leu ，或简写为 STL )
    print("翻译后的氨基酸序列：", my_seq.translate())



if __name__ == '__main__':
    seq_lab()