技术贴 | 微生太宏基因组报告解读 | 第十一篇:功能分析-基于ENZYME数据库

本文由阿童木根据实践经验而整理,希望对大家有帮助。

原创微文,欢迎转发转载。

导读

ENZYME收录了7大类酶的四级分类信息。EC编号或EC号是酶学委员会(Enzyme Commission)为酶所制作的一套编号分类法,每一个酶的编号都以字母“EC”起头,接着以四个号码来表示,这些号码代表逐步更细致的为酶作出分类。就如三肽胺基蛋白酶的编号为EC3.4.11.4,当中的“EC3”是指水解酶(即以水来将分子分解的酶);“EC3.4”是那些与肽键产生作用的水解酶;“EC3.4.11”是单指那些从多胜肽中分开胺基末端的水解酶;“EC3.4.11.4”则是从三肽中分开胺基末端的水解酶。

ENZYME命名数据库:

https://enzyme.expasy.org/

EC编号与ENZYME命名查询:

https://www.qmul.ac.uk/sbcs/iubmb/enzyme/

EC1:氧化还原酶类

EC2:转移酶类

EC3:水解酶类

EC4:裂解酶类

EC5:异构酶类

EC6:连接/合成酶类

EC7:移位酶类

一、组成概况

根据数据库的注释结果,绘制各样品EC酶相对丰度统计图。图1是相对丰度前20的EC酶相对丰度柱形图,其中不同的颜色代表不同的EC酶类别。

图 1 EC酶相对丰度柱形图

二、LEfSe差异分析

LEfSe是一种结合了非参数检验和线性判别分析的方法,常被用于寻找可以区分多组样品的Biomarker。LEfSe分析结果中的EC酶的LDA>阈值,表示该EC酶在相应分组中丰度较高,而在其他分组中丰度较低。图2是EC酶的LEfSe分析LDA柱形图。

图2 EC酶的LEfSe分析LDA柱形图

三、功能物种来源分析

LEfSe分析得到的差异EC酶结合HUMAnN2的分析结果,可进行功能物种来源分析,分析特征EC酶在每个样品的物种中的分布情况。图3是EC酶物种来源组成柱形图,其中横坐标对应样本,以及样本分组,不同分组用不同颜色标出。纵坐标对应各个样本该功能的相对丰度,不同物种来源用不同颜色标出。

图3 EC酶物种来源组成柱形图

四、聚类分析

从EC酶的相对丰度表中筛选出丰度排名前20的EC酶,接着通过对多个样品的EC酶进行丰度聚类来考察EC酶丰度在不同样品或者分组间的相似或差异性。下图图4是EC酶聚类热图。

图4 EC酶聚类热图

五、Circos图分析

Circos图可以用于展示每个样本中EC酶的丰度,以及各个EC酶分别在各个样本中的比例。下图是EC酶在各个样本中的分布Circos图。其中左半圈为丰度最高的十个EC酶,每个EC酶内,不同颜色代表不同样本来源的比例;右边半圈为样本,样本内不同颜色代表不同EC酶的比例。

图5 EC酶Circos图

六、相关分析

相关分析可用于分析环境因子或其它组学数据与宏组学数据之间的相关性。先选出丰度较高的EC酶,再计算环境因子与抗性基因间的Spearman相关系数进行,最后选出与环境因子相关最多的EC酶,可以得到如下的EC酶与环境因子之间的相互关系热图。其中X轴上为环境因子,Y轴为EC酶。R值(相关系数)在图中以不同颜色展示,右侧图例是不同R值的颜色区间。* 0.01≤ P <0.05,** 0.001≤P < 0.01,*** P < 0.001。

图6 EC酶与环境因子之间的相互关系热图

七、RDA分析

RDA分析可用于研究环境因子、样品、功能三者之间的关系,寻找影响样品分布的重要环境驱动因子。RDA分析更多的描述请见前面的篇章。下图图7和图8是EC酶 RDA分析的结果。

图7 RDA图:环境因子与功能的关系

图8 RDA图:环境因子与样品的关系

感谢阅读~




你可能还喜欢

技术贴 | 16S专题 | 简单介绍如何用自己的笔记本处理高通量16S数据

2 技术贴 | 宏基因组专题 | 组装工具盘点和比较

3 技术贴 | R语言菌群Alpha多样性分析和绘图

技术贴 | 宏转录组专题 | DDBJ数据库:宏转录组测序数据下载

技术贴 | R语言pheatmap聚类分析和热图


(0)

相关推荐