技术贴 | 微生太宏基因组报告解读 | 第五篇:EggNOG、CAZy、CARD等7大数据库助力宏基因组功能分析
本文由阿童木根据实践经验而整理,希望对大家有帮助。
原创微文,欢迎转发转载。
环境样品中的微生物物种种类多,培养难度大,而且很多是功能未知的微生物,因此与一般的动植物组学相比,微生物组学研究难度更大。虽然16S扩增子测序已经广泛应用于微生物群研究,但是由于技术的局限性该方法只能获得微生物群的一小部分信息,即群落组成信息。通过对微生物群落中的所有DNA进行高通量测序,宏基因组测序分析技术不仅能获得环境样品中所有微生物的分类信息、丰度信息,还能获得16S扩增子测序难以获得的功能信息。而且,随着功能基因组学的发展,出现了很多可以注释基因功能的数据库,例如, KEGG、GO、EggNOG/COG、Metacyc、ENZYME、CAZy和CARD等。利用这些数据库注释宏基因组功能有助于科研工作者从多个角度探索微生物群在一些观测中的功能机制,推动功能宏基因组学研究。
微生太宏基因组功能分析分为基于Reads和基于组装两种方法,这两种方法的详细介绍和比较请见:(宏基因组专题 | 宏基因组分析流程,基于reads VS 基于组装?)。我将在以后的篇章逐一详细介绍基于KEGG、GO、EggNOG/COG、Metacyc、ENZYME、CAZy和CARD这7大数据库的宏基因组功能分析,本篇仅以KEGG注释分析为例展示微生太宏基因组功能分析中的部分结果文件。
一、 丰度概况
根据数据库的注释结果,绘制了各功能在各样品中的丰度统计堆叠图。

二、 LEfSe差异分析
用LEfSe寻找在一个分组中丰度较高,而在其他分组中丰度较低的功能biomarker。

三、 聚类分析
选取关注的功能(如高丰度功能),根据样品的功能丰度进行聚类,以此考察功能丰度在不同样品或者分组间的相似或差异性。

四、 功能物种来源分析
用LEfSe进行分组间显著性差异分析的方法可以将各个分组的特征功能挑出来,将此结果结合HUMAnN2的分析结果可进行功能物种来源分析。

五、 Circos图分析
Circos图可以用于展示每个样本中各个功能的比例,以及各个功能在各个样本中的比例。

六、 相关分析
相关性热图分析可以用于分析环境因子与宏组学数据之间是否显著相关。

七、 RDA分析
RDA分析可以检测环境因子、样品、功能三者之间的关系或者两两之间的关系,可得到影响样品分布的重要环境驱动因子。

RDA(展示功能)

RDA(展示样品)
八、 关键KEGG通路可视化
根据KO (KEGG Orthologous groups) LEfSe组间差异比较结果,我们可以进一步给通路图上色,在通路图中标注出检测到的基因,以及各个分组的特征基因。

KEGG、GO、EggNOG/COG、Metacyc、ENZYME、CAZy和CARD这7大数据库的详细介绍,以及基于这些数据库的更加详细的分析结果的讲解将在后续篇章中进行。感兴趣的朋友别忘了关注哦。
感谢阅读~

你可能还喜欢

1 初学者如何深入解读16S rDNA扩增子测序数据,从而选择自己的分析步骤
2 技术贴 | 微生太宏基因组报告解读(开篇)
3 技术贴 | 微生太宏基因组报告解读 | 第一篇:测序数据过滤
4 技术贴 | 微生太宏基因组报告解读 | 第二篇:物种组成分析
5 技术贴 | 微生太宏基因组报告解读 | 第三篇:物种分组统计分析
