简介
Biopython (Biopython · Biopython - Biopython 文档)是一个专门用于 计算分子生物学的开源工具包。旨在通过提供高质量、可复用的模块和类,让使用Python处理生物数据变得更容易。
其核心功能包括:序列处理、文件格式解析、序列比对、结构生物学、系统发育分析、群体遗传学等。
序列处理
Bio.Seq 提供核心的Seq类,用于处理序列等信息,支持转录、翻译等常见操作。代码示例如下:
python
from Bio.Seq import Seq
def seq_lab():
# 创建一个DNA序列对象
my_seq = Seq("AGTACACTG")
# 打印序列
print("原始序列:", my_seq)
# 反向互补
# 1、先反转序列:GTCACATGA
# 2、碱基互补(A↔T、G↔C),最终反向互补序列:CAGTGTACT
print("反向互补链:", my_seq.reverse_complement())
# 转录为RNA
# 转录以 DNA 反向互补链为模板链,碱基配对:DNA的T→RNA的U,A↔U,G↔C。
print("转录后RNA序列: ", my_seq.transcribe())
# 翻译为蛋白质(氨基酸序列)
# 每三个碱基为一组(密码子),翻译出的氨基酸序列为:丝氨酸 - 苏氨酸 - 亮氨酸 ( Ser-Thr-Leu ,或简写为 STL )
print("翻译后的氨基酸序列:", my_seq.translate())
if __name__ == '__main__':
seq_lab()