宏基因组以环境样品中全部微生物的混合基因组序列或者 16S rDNA 等基因序列,以及最新发展起来的以环境中所有转录本为研究对象。因此宏基因组发展了基于 16S rDNA等基因测序、宏基因组测序和宏转录组测序方法。
宏基因组分析就是利用非培养的微生物群落,对群落个体基因频段或全基因组进行系统测定和研究,即分析微生物在环境中的基因组集合,研究其群落结构域生态功能等。
1. 基于基因(16S rRNA/ITS测序数据)
用于宏基因组学分析的基因主要包括16S rRNA、ITS等。
16S rDNA(16S ribosome RNA gene)是指编码核糖体上 16S rDNA 亚基的基因。需要说明的一点是 rRNA 通常指 rDNA 的转录产物,它是构成核糖体的重要成分,核糖体由许多小的 rRNA 分子组装而成,16S rRNA 是其中一个组件。一般所分析的对象都是 16S rDNA,因为 DNA 提取容易,也比较稳定。
以环境样品中的16S rDNA序列为研究对象,基本流程为:
- 从环境样品中提取全部微生物的基因组DNA;
- PCR扩增16S rDNA的可变区;
- 构建质粒文库进行测序;
- 对测序数据进行去噪处理(如去除接头、序列标签、引物序列、低质量的序列及嵌合体序列等);
- 对去噪序列进行聚类分析,生成分类单元(OTU),并进一步进行后续生物信息学分析(如多样性分析及系统发育树构建等),同时可以结合荧光定量PCR进行菌群分布定量及差异比较分析。
质控
OTU聚类及物种注释
物种多样性估计
群落结构分析
2. 宏基因组(全基因组序列数据)
以环境样品中全部DNA序列为研究对象,基本流程为:
- 根据研究内容,从环境样品中直接提取全部微生物的基因组DNA;
- 用酶切或超声波方法打断DNA,构建质粒文库,然后上机测序;
- 对测序数据进行预处理以去除低质量和污染的序列;
- 用组装软件对质控后的序列进行组装,得到contig和scaffold拼接序列;
- 对组装好的DNA序列进行基因预测;
- 通过比对分析和数据库搜索分析对预测基因进行物种分类和功能注释。
3. 宏转录组
4. 宏蛋白组
参考
《生物信息学》樊龙江