什么是16S rRNA,rDNA, 菌群研究为什么用16S测序,细菌如何命名分类?

谷禾健康

当谈到肠道菌群研究 时,16S测序是一种常用的方法 ,它在了解微生物组成和多样性方面 非常重要且实用。

16S rRNA是细菌和古细菌中的一个高度保守的基因片段 ,同时具有一定的变异性 。通过对16S rRNA基因进行测序,可以确定微生物群落中存在的不同菌属和菌种 ,并评估它们的相对丰度

针对肠道菌群16s测序概括起来可以了解以下内容:

揭示微生物组成: 通过16S rRNA测序,可以获得关于肠道菌群中存在的不同菌属和菌种的信息。这有助于了解菌群的组成 ,包括有益菌、有害菌和其他微生物的相对丰度。

探索微生物多样性: 16S rRNA测序可以评估微生物群落的多样性水平。通过分析不同样本中的菌群组成和多样性指标 ,可以比较不同个体、不同健康状态或不同治疗干预对微生物多样性的影响。

鉴定潜在病原菌: 通过16S rRNA测序,可以鉴定肠道中存在的潜在病原菌 。这有助于了解潜在的疾病风险,并为相关疾病的预防和治疗提供指导。

监测治疗效果: 在临床研究中,通过定期进行16S rRNA测序,可以监测治疗干预对肠道菌群的影响 。这有助于评估治疗效果,并为个体化治疗提供依据。

指导个体化营养干预: 通过16S rRNA测序,可以了解个体的肠道菌群状态,进而指导个体化的营养干预 。根据菌群组成和功能,可以制定相应的饮食方案 ,促进肠道健康和营养吸收

以上总结了16s对于了解肠道菌群的重要价值,今天本文主要分享和介绍16s测序相关的定义和术语, 以及菌群命名 的规则等。

01 什么是16S rRNA 和16S rDNA ?

正确的说法是16S rRNA (不是16s rRNA或16s rDNA)。

16S rRNA 代表16S核糖体核糖核酸 (rRNA) ,其中S(Svedberg) 是测量单位 (沉降率)。该rRNA是原核核糖体小亚基(SSU) 以及线粒体叶绿体的重要组成部分。

下图显示了16S rRNA(简称16S)如何参与原核核糖体。

•16S rRNA在原核生物中发挥重要功能

16S rRNA是一种细菌古细菌 中常见的核糖体RNA分子 。它在细胞中起着重要的功能,包括参与蛋白质合成的核糖体组装识别启动子序列 的功能。

由于16S rRNA在细菌和古细菌中具有高度保守的序列区域和变异的序列区域 ,因此它被广泛用于细菌分类进化研究中。

相比之下,16S rDNA这个术语并不常用 。rDNA是指编码核糖体RNA的DNA序列 ,因此16S rDNA可以理解为指代编码16S rRNA的DNA序列。

•科研中通常使用16S rRNA

在科研文献和学术讨论中, 通常更常见 地使用16S rRNA测序或16S ribosomal RNA测序。这种测序通常针对编码16S rRNA的DNA序列 进行扩增测序 ,用来研究微生物的多样性和进化关系,特别是细菌和古细菌。

通过对16S rRNA基因 进行测序,可以对微生物群落的组成和结构 进行分析。这项技术在微生物学 、生态学、医学农业等领域有广泛的应用。

02 为什么选择16S rRNA作为分类学和 生态学的DNA条形码分子?

要用作DNA条形码,基因应具有以下特征:

•已知的细菌和古细菌都具有16S rRNA

它应该无处不在 。否则,我们不能包括所有生物。已知细菌和古细菌的所有成员都具有16S基因

它应该包含足够的系统发育信息。16S大约有1500bp长,不算太短也不算太长。

原核生物中发现的16S基因内的遗传变异足以用于广泛分类范围的系统发育分析 。它成功地用于推断门之间的系统发育关系 ,同时也用于同一属的物种之间的比较。

•容易通过PCR扩增

它应该很容易通过PCR扩增 。16S基因有多个保守区域可以作为引发位点。这成为基于NGS的短读长测序的一个显著优势

经过多年的国内外研究和检测积累,我们拥有几乎所有已知细菌和古菌 物种的16S序列数据库。通过在这些数据库中搜索16S序列 ,即使没有严格的分类学知识,也可以识别新分离的菌

03 16S的可变区和该选择什么样的PCR

引物 用于扩增

已知细菌16S之间的序列变异分布不均匀 。在细菌中鉴定出9个高变区,分别命名为V1至V9。

从长度来看,全长16S长度为1.5kb左右 ,单菌落的16S全长sanger一代测序仍然是菌种鉴定 的主要手段,纳米孔和Pacbio的三代测序可以高通量的获得全长序列,对于希望 高分辨率的分析菌种的研究有一定优势。

•三代测序建库成本较高,测序深度较低

三代的测序准确度目前逐渐改进,直接测序准确度可以在90%以上 ,纠错后可以提高到97~99% 以上,已足够提供高精度的分类。三代目前主要问题在于建库成本相对较高 ,通过使用barcode可以降低部分但仍然偏高,此外普遍测序深度 相对于二代测序要低许多

•二代测序由于读长限制需要引物进行扩增

由于二代测序读长限制 ,无法使用高通量测序技术对16S rRNA整个基因全长进行测序 ,因此必须针对基因的某一片段设计引物进行扩增测序

注:虽然有大量的文献研究不同片段的优缺点,但由于采用的样本类型区域引物 以及分析角度的不同,尚没有针对所有样本的最佳可变区片段的共识。

基于大量项目经验和文献调研, 目前最主要的可变区选择是V4区和V3V4区 ,V4区长度为256bp左右,加上两侧引物长度为290bp左右,使用双端2x250bp或2x150bp可以测通,此外如454、life、Illumina Hiseq 4000, Illumina Novaseq 6000的测序平台读长也可以主要涵盖该区段读长。

•16S V4 引物通用性是所有可变区中最高的

传统的认知中,普遍认为测序片段越长,测到物种数据就越多,故倾向选择16S V3V4。然而16S V4(515-806)引物通用性相对是所有可变区中最高的 。且在大规模菌群调查研究 中,如人体菌群研究HMP ,地球微生物计划EMP ,欧洲的FGFP 、美国肠道计划AGP 以及全球土壤菌群 调查,都采用V4区作为检测区域 。16S V4目前仍然是国际研究中使用最广泛和认可的检测区域。

04 细菌名称的控制

细菌的命名法和命名受**《国际原核生物命名法典》 (简称《原核生物法典》)** 的约束 ,但实际物种的分类则不然。例如,大肠杆菌(Escherichia coli )这个名称受**《原核生物守则》** 的规范,但物种本身的特性和分类学分类不受规范。这意味着没有官方分类法 ,只有名称受到控制

因此,"有效物种"、"正式物种"或"官方物种" 等术语没有意义。只能验证名称,因此可以使用 "具有有效发布名称的物种"。

05 物种名称是如何形成的?

物种名称应由二项式系统的两部分组成:

(1)通用名称 和(2)特定词缀

如下示例:

该组合代表"物种名称",并且在命名系统中应该是唯一的。 所有分类群的学名必须被视为拉丁文 ;物种等级以上的属群名称是单个词

•生物分类按照不同等级

名称被组织成一个层次系统。

门(Phylum):门是细菌分类的最高级别之一 ,代表着细菌的大类别。细菌门包括了多个相关的纲和目。

纲(Class):纲是细菌分类的次级别 ,比门更具体。同一纲的细菌通常具有一些共同的特征和特性

目(Order):目是细菌分类的更具体级别,比纲更详细。同一目的细菌通常具有更相似的形态、生理特征和生态习性。

科(Family):科是细菌分类的更具体级别,比目更详细。同一科的细菌通常具有更相似的基因组组成和代谢途径。

属(Genus):属是细菌分类的更具体级别,比科更详细。同一属的细菌通常具有相似的形态生理特征和基因组组成。

种(Species):种是细菌分类的基本单位,代表着具有相似形态和生理特征的细菌群体。

亚种(Subspecies):亚种是种的更具体级别,用于进一步划分具有细微差异的细菌

目前,门等级不受原核代码控制 。提议将"门"纳入守则,但该提案尚未得到控制原核生物守则的机构国际原核生物系统学委员会(ICSP)的讨论和批准。

在细菌分类中,门、纲、目、科、属、种和亚种的命名规则和方法遵循国际细菌命名法。

以下是一些要注意的事项:

命名规则:细菌的命名应该是拉丁化 的,以便在全球范围内使用和理解。通常使用斜体字体或以斜体书写。

门、纲、目、科、属、种和亚种的命名:这些分类级别的名称通常是基于拉丁词根、描述性词语、地名、科学家的名字或其他相关特征 来命名的。例如,属名可以以科学家的姓氏 命名,种名可以以形容词或名词来描述特定的特征。

•每个细菌分类级别的名称是唯一的

命名的唯一性: 为了避免混淆,每个细菌分类级别的名称必须是唯一的 。这意味着同一级别下的不同分类单元不能有相同的名称

命名的正式发表: 细菌分类的名称需要通过正式的科学出版物发表,以确保其被广泛认可和接受。这有助于维护分类的一致性和准确性。

命名的修订和更新: 随着科学研究的进展和新的发现,细菌分类可能需要进行修订和更新 。新的分类单元可能会被提出或已有的分类单元可能会被重新归类。这些修订和更新需要经过科学界的讨论和认可

例如下面是假单胞菌菌名称和分类:

这些名称是由提出物种并将其分配给属的科学家 给出的。例如, Thermacanus属已被提出,但并未将其归属于已知科。在NCBI分类学中,它属于芽孢杆菌目的暂定科" Bacillales Family X. Incertae Sedis " 。

EzBioCloud数据库 将每个物种分配在完整的等级系统下,Thermicanus 被分配在暂定创建的家族" Thermicanus_f "下(请注意,这是一个无效名称,并且不是斜体)。当然,任何人都可以通过发表提案来提出Thermacanaceae家族的建议。

06 如何验证名称(有效发布)?

如前所述,名称由原核代码控制。要验证名称,该名称应包含在下述列表之一中。

▸ 批准的细菌名称列表

该论文由Skerman、McGowan 和 Sneath于1980年发表 ,标志着原核生物命名法的新开始。

此列表中的任何后续更改均由《国际系统与进化微生物学杂志》(IJSEM)(前身为《国际系统细菌学杂志》(IJSB))发布。

IJSEM中发布了两种类型的更新列表,即**"通知列表"和"验证列表"。**

▸ 通知列表

IJSEM国际原核生物系统学委员会 (ICSP)和国际微生物学会联盟 (IUMS)细菌学和应用微生物学部的官方期刊 。这意味着IJSEM是原核生物命名法 的官方期刊。但是注意,没有官方的细菌分类法

任何包含在IJSEM中发布的名称更改(新分类群或名称更改)的分类提案 都将自动由IJSEM的列表编辑进行审核。 如果论文符合《原核生物守则》的要求,则拟议的更改将被列入**"通知列表"并被正式"验证"。**

▸ 验证列表

原核代码还允许科学家有效验证在IJSEM以外的期刊 上发表的名称。一旦名称被公布,就被称为**"有效公布"。**

任何关心科学的人都应该确保任何有效发布 的名称都得到验证,方法是将出版物PDF发送给 IJSEM,并证明(对于物种和亚种 )指定的类型菌株可以不受限制地从位于不同地区的至少两个公共培养物种保藏中心获得。

这可以由包括作者在内的任何人来完成。不这样做的带来的后果可能是有害的,因为该名称**"有效发布"但从未"验证"。**如果满足原核生物守则的所有要求(对于新物种和亚种,特别是规则27和30),IJSEM 的列表编辑将在验证列表中添加名称。

▸ 无效名称

不幸的是,在某些情况下名称无法验证。例如:

•一个名称在1980年之前被广泛使用,但在1980年没有被列入批准的细菌名称列表。

•一个名字在IJSEM之外发布,但从未被验证。

•没有人将PDF和进一步所需的文档发送给 IJSEM 进行验证。

•该出版物不符合准则的最低要求。

注:未有效公布的名称要用引号括起来,例如"Selenomonas Massiliensis"以区别于有效公布的名称。

•验证新物种的最低且唯一要求

根据原核生物守则, 验证新物种和亚种名称的最低且唯一的要求是:

必须指定类型菌株 。有时,描述新物种的论文不会提及哪个菌株是模式菌株。在这种情况下,名称无法验证。

•模式菌株应保藏于两个不同国家的两个培养物保藏中心。这确保了典型菌株仍然可用,例如当培养物保藏中心停止其活动或丢失菌株时。

•模式菌株必须通过培养物保藏中心可供任何人使用。专利菌株不能作为模式菌株。如果您想为某个菌株申请专利并限制其分布,则它不能作为物种或亚种的命名类型。

小结

以上总结起来如下:

确认命名规范: 首先,确保您了解国际微生物学命名规范,如IJSEM国际原核生物系统学委员会。 这些规范包括命名原则、命名要求和规则,以确保新细菌名称的准确性和一致性

检查已有命名: 在确定您的新细菌名称之前,进行一次详细的文献调研,以确保该名称没有被其他研究人员使用或已经被正式命名。搜索相关数据库和文献,如国际细菌命名索引(International Journal of Systematic and Evolutionary Microbiology)和PubMed,以避免重复命名

提交命名申请: 一旦您确认您的新细菌名称符合命名规范并且尚未被使用,您可以准备提交命名申请 。通常情况下,命名申请需要包括详细的描述 、分类学特征、基因序列数据等相关信息。您可以向国际微生物学协会或相关的命名委员会(前面说的IJSEM)提交命名申请。

**合作与审查:**在提交命名申请之前,建议与其他研究人员、领域专家或命名委员会进行合作和讨论。这样确保命名申请符合规范。

审核和正式发布: 一旦命名申请被提交,相关的命名委员会将对其进行审查。如果您的命名申请符合规范,经过审核后,新细菌名称将被正式发布 ,并被纳入相应的细菌命名索引和数据库中。

07 为什么使用正确的名称和庞大菌群

数据 很重要?

细菌名称的设计或命名是为了科学地组织,以提供基于系统发育的生物学见解;使用分层分类系统可以实现这一点。

•正确的名称对于解释微生物与其他数据的关联非常重要

例如,我们认为大肠杆菌与其他大肠杆菌物种比与芽孢杆菌物种有更多的 表型特征。因此,使用正确的名称 对于解释微生物组和其他类型的数据 至关重要。

不幸的是,在当前的命名法中仍然有许多名称位于错误的位置。 例如,Clostridium scindens 因其在人类肠道菌群胆汁酸代谢 中的重要作用而闻名,并且仍然保留着Clostridium 的名称。然而,它甚至与梭状芽胞杆菌属 并不接近 ,应归类为毛螺菌科的一个新属

真正的梭菌属(Clostridium)属于梭菌科(Clostridiaceae) 。例如Ruminococcus Sp(梭状芽胞杆菌

梭状芽胞杆菌簇XIVa和IV 是已知在人类微生物组发挥主要作用 的细菌群。这些细菌簇在1994年才进入16S rRNA系统发育。

然而梭菌簇XIVa和IV 不代表正式命名法 ,也不表示单个分类群 ,例如属或科。自1994年以来,许多最初指定的属于梭状芽胞杆菌簇XIVa和IV 的物种已被重新分类为新属

•一些细菌存在错误的命名和分类

然而,这些簇中仍然存在错误分类的梭菌属物种,从而保留了旧名称。比如:Faecalibacterium prausnitzii (普拉梭菌),革兰氏阴性,对氧极度敏感,属于梭菌科,厚壁菌门。

该物种就是属于Clostridium clusterIV 分组的Clostridium leptum group柔嫩梭菌类群,是该类群的最优势菌种 。一般中文翻译柔嫩梭菌指的就是这个类群,其代表物种就是普氏栖粪杆菌,又名普拉梭菌。

以下是当前EzBioCloud数据库 中对应于梭状芽胞杆菌簇XIVa和IV的分类群。

"Candidatus "是一个拉丁语词汇,通常用于微生物学中。它表示对一种微生物的命名 ,表示该微生物是一个新发现的候选物种 ,尚未被正式分类或命名。在中文中,"Candidatus "通常被翻译为"候选物种"或"候选菌种"。 这个术语用于描述那些已经被发现但尚未被完全分类的微生物,通常是由于它们的特殊性质或难以培养。

总结来说,使用正确的细菌名称可以确保科学研究准确性和一致性 。细菌命名规范旨在为每个细菌物种提供唯一的、明确的名称,以避免混淆和误解 。通过使用正确的名称,研究人员可以准确地标识和描述细菌物种,使得研究结果具有可比性,并促进科学交流和合作。

使用庞大的菌群的数据库 ,便于数据整合和共享 。通过将新细菌与已知的细菌物种 进行比对,可以确定其在分类学上的位置和相关信息。这有助于构建细菌分类树、建立物种间的关系,并为进一步的研究提供基础数据。

此外,正确的细菌命名和细菌样本数据库的比对可以促进研究进展和新的发现 。通过对新细菌进行分类和命名,研究人员可以更好地理解细菌的多样性、生态学角色和潜在的应用价值

人体肠道菌群健康检测 需要依托本地化人群菌群样本检测的大数据库,区分菌群的组成和功能个体间存在差异 ,并且与本地人体的生理状态 、生化代谢、免疫炎症 以及疾病风险 等建立关联。通过建立大数据库,可以收集大量的菌群样本和相关数据,进行统计学分析和模式识别,从而揭示不同菌群组成与人体健康之间的关联。

总之,使用正确的细菌名称和拥有庞大的细菌样本数据库 进行比对是确保科学研究准确性、促进数据整合和共享、推动研究进展和发现的关键步骤。

08 候选物种

在某些情况下 ,即使一个物种是真实的并且具有科学重要性,也无法满足原核生物守则的基本要求

根据正式命名法,这些物种的名字永远不会得到有效的公布。因此,分类学家创造了"Candidatus"一词来支持暂定命名。

对于Candidatus名称,没有纯培养物或分离株 ,因此没有典型菌株。由于Candidatus不属于正式命名法,因此不受原核法典管辖。

一个典型的例子是Candidatus Pelagibacter ubique 该物种含有来自海洋的未培养或培养的细菌 ,可能是地球上最丰富的物种,因此它一定非常重要。

它从未得到验证的原因是该物种可以培养,但不能以培养物保藏所可用于长期储存 的方式或规模进行培养。因此,无法满足该准则的最低要求。此外,特定的加词(ubique)格式错误。

并非所有Candidatus类群 都得到了很好的表征,因为Candidatus的等级不受原核生物守则的规定

•一般Candidatus的最低标准:

•提供全长高质量16S 序列,因为该基因是细菌和古细菌分类学的框架。

未受污染且相当完整的基因组序列的可用性(通过域级核心基因的存在进行检查)。

•应提供最低限度的生态和代谢特征

09 如何命名一个新的分类单元?

名称最好能代表该物种的典型特征 。例如, Plasticicumulans 这个名字的意思是**"积累的塑料"。** 该属因积累生物塑料聚羟基脂肪酸酯 而得名。

命名新分类单元的另一种流行方式是以人的名字 命名。这个人应该有对科学做出贡献,尤其在微生物方面 。著名的**埃希氏菌(Escherich )和沙门氏菌(Salmon)**是以微生物学家埃舍里奇(Theodor Escherich)和萨蒙(Salmon, D.E.)的名字命名的。

此外,以地理位置命名也很流行,但一般不鼓励。

相关推荐
sp_fyf_2024几秒前
人工智能-大语言模型-微调技术-LoRA及背后原理简介
人工智能·语言模型·自然语言处理
RaidenQ4 分钟前
2024.9.20 Python模式识别新国大EE5907,PCA主成分分析,LDA线性判别分析,GMM聚类分类,SVM支持向量机
python·算法·机器学习·支持向量机·分类·聚类
xuehaishijue6 分钟前
射击靶标检测系统源码分享
人工智能·计算机视觉·目标跟踪
Kenneth風车9 分钟前
【机器学习(九)】分类和回归任务-多层感知机 (MLP) -Sentosa_DSML社区版
人工智能·算法·低代码·机器学习·分类·数据分析·回归
_平凡之路_12 分钟前
解决ubuntu22.04 gnome-terminal 无法启动的问题
linux·运维·python
知来者逆12 分钟前
ChemChat——大语言模型与化学的未来,以及整合外部工具和聊天机器人的潜力
人工智能·gpt·语言模型·自然语言处理·机器人·llm·大语言模型
AI领航者12 分钟前
大型语言模型的结构性幻觉:不可避免的局限性
人工智能·语言模型·自然语言处理·llm·大语言模型·ai大模型·大模型幻觉
fydw_71512 分钟前
PyTorch 池化层详解
人工智能·深度学习
豆本-豆豆奶14 分钟前
23个Python在自然语言处理中的应用实例
开发语言·python·自然语言处理·编程语音
迈威通信14 分钟前
从EtherCAT到PROFINET,迈威通信带你解锁工业网络!
网络·自动化·信息与通信