科研 | Industrial Crops & Products:转录组和代谢组联合分析银杏幼叶和成熟叶片代谢水平(国人作品)
编译:冬日暖阳,编辑:十九、江舜尧。
原创微文,欢迎转发转载。
植物次生代谢产物是有机化合物,对于植物应对非生物胁迫以及植物发育和生长很有用。次生代谢产物主要在叶片中产生,其中具有(C5H8)n通式的萜类衍生物和饱和度不同的氧构成草药中的一类重要化合物。与萜类化合物相似,类黄酮在动植物中也起着重要作用。由于这些次生代谢产物的功能多样性,全球范围内的许多植物都受到了广泛关注。银杏(Ginkgo biloba L.)是一种独特的药用树种,主要依赖于叶片中的类黄酮和萜类化合物,这些药用成分在应对非生物胁迫和银杏的植物发育中也起着重要作用。银杏通常被称为“活化石”,起源于中国,是银杏属中唯一剩下的物种。银杏树在中生代侏罗纪期间在北半球广泛分布,在白垩纪晚期开始下降,由于第四次冰期而灭绝,奇迹般地仅在中国保存。银杏因其药用特性和观赏价值而被种植了数千年,近年来,它已成为在中国以及世界上许多国家和地区流行的药用植物。银杏叶提取物(GBE)以其显著的治疗功效和药理活性而闻名,已被用于治疗心血管,脑血管和阿尔茨海默氏病。GBE含有非常复杂的成分,其中萜类和黄酮类是主要的医疗化合物。类黄酮槲皮素,儿茶素和山emp酚通常起源于苯基丙烷。银杏内酯和双叶内酯属于一类萜类,是通过类异戊二烯生物合成途径合成的银杏次生代谢产物。许多基因共同作用以调节次生代谢产物的生物合成,这通常使用基因组方法进行检测。
高通量测序技术为分子水平变异提供了新的见解,在这些技术中,转录组测序已被广泛用作常规实验方法。RNA测序(RNA-seq)为新型基因发现和转录本鉴定提供了解决方案。这些平台的应用为发现和鉴定参与次生代谢产物生物合成的基因做出了杰出贡献。许多植物通过转录组测序对许多功能基因进行了注释,如山茶,龙血树,丹参。尽管许多研究都考虑了银杏转录组中的差异表达,但未考虑幼嫩和成熟叶片中的分子调控途径和次级代谢产物。代谢组学与转录组学和蛋白质组学相似,是系统生物学的重要组成部分,致力于生物体中所有代谢物的定量分析。代谢组学提供了对正在进行的由代谢物调节的细胞内活动的见解,例如细胞信号传导和能量转移。在过去的几年中,新陈代谢和其他组学工具的结合为功能基因的鉴定和阐明植物新陈代谢过程所涉及的途径做出了贡献。例如,通过代谢组学和转录组学分析了绿色和紫色芦笋中花青素的积累,并进行了相关基因的分析。人们已经达成了广泛的共识,即幼嫩叶片与成熟叶片之间的生理和生化特征存在显著差异。然而,很少有研究试图调查植物中幼嫩和成熟叶片之间的基因表达和代谢差异。在这项研究中,作者系统地研究了幼嫩和成熟银杏叶之间的基因表达和代谢差异。对银杏的两个生长阶段(幼叶和成熟叶)进行了转录组学分析,以鉴定与次级代谢相关的差异表达基因(DEG)。另外,为了进一步了解幼嫩叶片和成熟叶片之间的代谢差异,试验进行了代谢组学分析。研究结果将丰富植物数据库,帮助指导选择用于提取的银杏次生物质,并为银杏叶在实际制药行业中的应用提供更多有用的信息。
论文ID
原名:Integrated analysis of the transcriptome andmetabolome in young and mature leaves of Ginkgo biloba L.
译名:借助转录组和代谢组综合分析银杏幼叶和成熟叶片代谢水平
期刊:Industrial Crops and Products
发表时间:2019.11.12
影响因子:4.191
通讯作者: 汪贵斌
通讯作者单位:南京林业大学
DOI号:10.1016/j.indcrop.2019.111906
实验设计
选取南京林业大学校园内三棵显示均匀生长的三十年银杏树进行采样。选定的树木属于同一品种,没有病虫害。在同一时间点分别从每棵树上收集成熟的完全展开的叶子(从一岁树枝的根开始的第二个健康叶子)和幼嫩的叶子(从一岁树枝的顶部到第二个健康叶子)。将新鲜收集的叶片立即保存在液氮中,然后保存在-80℃用于RNA和代谢物提取分析。
结果
1 代谢组学分析
所有样品的总离子流(TIC)显示比较好的信号,通过GC-MS检测确定了嫩叶和成熟叶中必需代谢物的组成,该分析鉴定了叶中的283种化合物。根据成分分析,有机酸是最丰富的代谢产物,占总量的33.21%。总体而言,主要代谢物的种类和数量大于次要代谢物,这表明其是银杏叶主要活性的代谢物质。对于这些代谢物,主成分分析(PCA)将所有样品准确地分为不同的簇,这反映了幼叶和成熟叶之间的明显差异(图1.A)。从偏最小二乘DA(PLS-DA)和OPLS-DA获得的得分分别如图1.B和C所示。如图1D所示,对OPLS-DA模型进行了200次响应排序测试。通常,如果R2Y和Q2Y线的斜率更接近水平线,则该模型更可能过拟合。结合多维分析和一维分析来筛选Gb_M和Gb_Y组之间的差异代谢物,获得38种差异代谢物(图1E)。其中,Gb_Y组的3羟基-3-甲基戊二酸和乳糖醇的含量分别是Gb_M组的215和84倍。谷氨酸含量是Gb_M和Gb_Y组中最显著的差异代谢物(P = 8.5096E-05),只有两个差异代谢物(与丝氨酸一起)在Gb_M组中含量较高。

2. 银杏转录组的组装和注释
试验准备并分析了六个RNA文库(成熟叶的Gb_M1,Gb_M2和Gb_M3以及幼叶的Gb_Y1,Gb_Y2和Gb_Y3)。从这六个库中总共获得了5920万个原始读取。本研究中的原始读物存放在美国国家生物技术信息中心(NCBI)序列阅读档案(SRA)数据库中(登录号:SRP178917)。为了进一步分析,低质量的序列被滤出,获得5750万次纯净读数,其中平均GC含量为45.39%(表1)。使用Trinity软件组装获得的纯净读段,得到39,404个单基因,N50长度为2,165bp,平均长度为1,365 bp(最小长度:304,最大长度:15,729)。这些单基因的9148个(23.22%)长度超过2kb。

通过对七个公共数据库(NR,Swiss-Prot,KEGG,EuKaryotic Orthologous Groups(KOG),eggNOG,Gene Ontology(GO)和Pfam)的BLAST比对,对总共39,404个银杏单基因进行了注释。综上所述,获得了与Nr数据库显著匹配的23,820个单基因,占总数的60.45%,最高(图2)。根据序列同源性分析,获得了具有47个GO术语的三个类别,并包括了13,044个带注释的单基因。将生物过程(BP),细胞成分(CC)和分子功能(MF)定义为三类。在BP类别中,基因与21个GO术语匹配,最大的子类别是“细胞过程”。在CC类别中,基因与15个GO术语匹配,最大的子类别是“细胞”。对于MF类别,两个最丰富的子类别是“绑定”和“催化活性”,包含11个GO术语。通过KOG分析,这些单基因分为25组(图S3)。在这些组中,仅考虑一般功能预测的R是最大的组。 KEGG注释系统用于通过绘制组装的单基因来确定银杏中生物活性成分的合成途径。 “信号转导”(795个单基因),“翻译”(768)和“碳水化合物代谢”(748个单基因)途径的单基因数量明显高于其他途径。

3. DEG的GO富集和KEGG途径分析
FPKM方法用于计算单基因表达。通过DEG的分层聚类,在Gb_M和Gb_Y库之间总共检测到1,256个重要的DEG(561个上调的基因和695个下调的基因)(图3A,B)。在热图中,由DEG显示的相似颜色表示较高的相关系数。红色表示最高表达水平,蓝色表示最低表达水平。并比较了幼叶和成熟叶文库的表达模式,发现Gb_Y1,Gb_Y2和Gb_Y3的颜色相似,并且这些库被分类为同一簇。

使用GO术语对差异表达的单基因进行功能分类。注释了总共948个DEG单基因,包括在两个丰富的GO术语库中的420个上调和528个下调的单基因。富集直方图中显示,富集度最高的子类别是“细胞过程”,其次是“代谢过程”,然后是“单一生物过程”,这是三个。“细胞”,“细胞部分”和“细胞器”是CC类别中富集度最高的三个子类别。在MF类别中,“结合”和“催化活性”子类别代表了两个具有最高富集度的最大类别(图4A)。有向无环图(DAG)用于显示GO结构的结果;节点代表GO项,箭头代表父节点(图4B),与功能类别相似,构建了三个GO DAG。在BP,CC和MF类别的DAG中获得的丰富的GO项分别为2、1,和3。KEGG分析是一个至关重要的工具,使我们能够在转录组水平上全面了解特定代谢物的合成过程,相关的基因功能以及多个基因的相互作用。根据KEGG富集分析,最显著的富集途径是“环境信息处理-信号传导”。该途径主要由上调的DEG组成,而“遗传信息处理-复制和修复”和“代谢-核苷酸代谢”途径主要由上调的DEG组成。

4. 鉴定与苯丙烷,类黄酮和萜类生物合成有关的单基因
5. 编码转录因子(TF)的转录本分析
通过将序列与已知的TF基因家族进行比较来进行TF鉴定。总共鉴定出了13849个与银杏TF基因相似的转录本。例如,TF系列中包括WRKY,v-Myb禽成纤维细胞病病毒致癌基因同源物(MYB)和基本区域-亮氨酸拉链(bZIP)等。在这些TF中,螺旋-环-螺旋(bHLH)和NAC基因最丰富。MYB和bHLH家族成员调节银杏中的类黄酮生物合成,分别鉴定出这些家族中的393和2,412单基因。编码bZIP蛋白的四个单基因在银杏的幼叶和成熟叶之间差异表达。在这些DEG中,有3个上调,有1个下调。6个MYB相关基因表现出差异表达,3个MYB基因被下调。检测到23个bHLH基因的差异表达,其中8个被上调。编码WRKY蛋白的5个基因的表达存在显著差异。对于ERF家族,4个基因被上调,7个基因被下调。
6. 差异表达的qRT-PCR验证
为了验证转录组数据的可靠性,通过三个生物重复的qRT-PCR确定了14个 unigenes的转录组水平(图5)。这些单基因中的13个显示的表达模式与RNA-Seq分析中获得的表达模式相似。因此,完整的RNA-seq分析结果显示出较高的重现性和可靠性,并将有助于那些侧重于参与银杏幼嫩和成熟叶片中苯丙烷,类黄酮和类萜积累的关键基因的进一步研究。此外,RNA-Seq和qRT-PCR结果表明,该数据能够评估基因表达的上调和下调。

7.转录组和代谢组的综合分析
38种差异代谢物主要分布在10条KEGG途径中。在大多数差异代谢物之间都获得了高度正相关,唯一的例外是丝氨酸与所有其他差异代谢物均呈负相关。 DEG与差异代谢产物之间的相关性分析还显示,丝氨酸与所有DEG呈负相关(图6A)。组合的代谢组学和转录组分析表明,在代谢物中TRINITY_DN23031_c0_g1_i4_2基因与丝氨酸之间存在显著的负相关(相关系数= -0.93)(图6B)。此外,TF(MYB相关)和代谢产物甘露糖6磷酸显著正相关。4个基因(TRINITY_DN30689_c0_g1_i1_2,TRINITY_DN28755_c0_g1_i1_1,TRINITY_DN26876_c0_g1_i1_1和TRINITY_DN2726_c0_g1_i1_1)与许多代谢产物(图6B)显著相关,需要进一步研究其调节关系。

结论
在这项研究中,试验测序并分析了成熟和幼嫩银杏叶片的转录组和代谢组。试验共获得了39404个单基因,在银杏转录组中共鉴定出1,256个DEG,包括成熟叶片中的561个上调基因和695个下调的基因。可检测的代谢物总数为283个,其中包括38种差异代谢物。通过Swiss-Prot数据库注释分别鉴定出总共141、51和59个单基因参与了苯丙烷,类黄酮和萜类化合物的生物合成。在苯丙氨酸途径中的一个基因与代谢产物中的丝氨酸之间检测到显著的负相关。代谢组和转录组的组合分析是一种分析生物合成途径中关键基因与代谢产物之间关系的有效方法。这项研究还提供了有关银杏(幼嫩叶片和成熟叶片)中苯丙烷,类黄酮和萜类化合物合成的有价值的数据和结果,但具体机理仍需进一步研究和探索。
评论
银杏(Ginkgo biloba L.)是一种独特的药用树种,主要依赖于叶片中的类黄酮和类萜。然而,这些代谢物的生物合成是受基因作用控制和调节的,而基因作用至今仍知之甚少。为了提高我们对这一过程的理解,在本研究中,作者使用Illumina HiSeq X 10测序平台从银杏树的幼叶和成熟叶中进行了转录组文库构建及测序。总共获得了39404个带注释的单基因。通过GO和KEGG代谢途径分析,探索了银杏幼嫩和成熟叶片中的关键差异表达基因(DEG)。与幼嫩叶片相比,在成熟叶片的银杏转录组中总共获得了1,256个DEG,包括561个上调基因和695个下调基因。这些基因包括23个bHLH,9个MYB,5个WRKY和4个bZIP基因,它们在类黄酮和萜类生物合成中起调节作用。其中参与二萜途径的一个关键基因被下调,苯丙烷生物合成途径中的一个基因显著上调,并且与代谢产物中的丝氨酸显著负相关。此外,代谢组学分析检测到283种代谢物,并且鉴定出38种显著不同的代谢物。这项研究中采用的代谢组和转录组相结合的方法构成了一种评估关键基因表达与生物合成途径相关代谢产物之间关系的有效方法。该研究为在分子水平上分析生物合成提供了新思路,并将促进银杏相关制药行业的进一步发展。
更多推荐
1 科研 | PNAS:转录组学揭示急性和慢性饮酒对肝脏昼夜新陈代谢有不同的影响
