科研 | 南京农业大学:基于RNA-Seq全长转录组分析鉴定意大利黑麦草根中植物镉胁迫响应基因(国人佳作)
编译:冬日暖阳,编辑:十九、江舜尧。
原创微文,欢迎转发转载。
禾本科属的黑麦草属原产于欧洲,北非和亚洲温带地区,已被引入世界几乎所有温带地区。意大利黑麦草和多年生黑麦草是两个重要物种,它们都是有价值的牧草。由于其理想的特性,例如高收率,对放牧的耐受性,快速建立以及反刍动物的适口性和易消化性,它们在近一百年来通过杂交或分子育种进行了培育。而且,分子育种在近来的育种计划中发挥了越来越重要的作用,在许多植物中,它显示出有望增加产量以及对多种生物和非生物胁迫的抗性。但是,分子育种取决于参考基因组的可用性。迄今为止,在黑麦草属的物种中,仅报道了多年生黑麦草的基因组草图。另外,基因组中仍然存在缺口,这限制了对分子调控机制的理解,特别是对于紧密相关的物种,例如意大利黑麦草,因此其参考价值很小。意大利黑麦草,也称为一年生黑麦草,在发生侵蚀时用于草皮,草料和快速覆盖物,并且还有一些新用途,例如木质纤维素乙醇转化程序和植物修复。
镉是自然界中一种广泛的重金属元素,对几乎所有动植物都具有剧毒,并且没有任何已知的生物学功能。植物从受Cd污染的土壤中吸收Cd相对容易,导致人类通过食物链接触Cd,由于土壤镉对植物生长的直接不利影响以及农产品安全性的不确定性,已经引起了公众的关注。先前的许多研究表明,镉的暴露可能对植物造成一系列损害,例如脂质过氧化,酶失活,活性氧(ROSs)过量产生,基本元素(例如铜,铁和锌),激活的程序性细胞死亡(PCD)以及膜和DNA损伤。此外,这些损害最终导致各种毒性表型,例如叶片发黄,生长减少,植物枯萎甚至死亡。近年来,已经揭示了响应Cd胁迫的常见植物机制,例如Cd转运蛋白,Cd细胞分隔和螯合。RNA-seq作为一种高通量的下一代测序(NGS)技术,已成为在转录组范围内分析差异基因表达和基因调控网络的必不可少的工具。最近,它已被广泛用于研究柳枝,水稻和苜蓿链球菌等植物对各种胁迫(包括镉胁迫)的响应。然而,RNA-seq的局限性(即短读长和扩增偏差)限制了研究人员准确获得全长转录本和mRNA的差异剪接,特别是对于多倍体物种或缺乏高质量参考转录组的物种。作为第三代测序技术,单分子实时(SMRT)测序可通过产生较长的读数而无需进一步组装即可克服这些限制。它非常适合从头转录组分析中的异构体发现。依赖SMRT测序平台的PacBio异构形式测序(ISO-seq)已用于分析高粱、玉米、水稻、紫檀和胡椒的全长转录组。对于在受Cd污染的土壤中生长的植物而言,根是Cd暴露的首要障碍。鉴定意大利黑麦草根中可诱导Cd的基因可以加深我们对响应Cd胁迫的分子调控途径的了解。本研究使用ISO-seq技术为意大利黑麦草的根构建了从头开始的全长转录组数据库。与RNA序列整合,鉴定了差异表达基因(DEG),并分析了与Cd耐受性和翻译相关的调控网络。DEG LmAUX1的功能已在拟南芥中得到验证。该基因的过表达显著降低了植物对Cd的耐受性并提高了植物Cd的浓度。因此,有可能将该基因用于调节意大利黑麦草中Cd的积累。
论文ID
原名:Full-Length Transcriptome Assembly of Italian Ryegrass Root Integrated with RNA-Seq to Identify Genes in Response to Plant Cadmium Stress
译名:基于RNA-Seq全长转录组分析鉴定意大利黑麦草根中植物镉胁迫响应基因
期刊:International Journal of Molecular Sciences
发表时间:2020.2.6
影响因子:4.183
通讯作者:娄来清
通讯作者单位:南京农业大学
DOI号:10.3390/ijms21031067
结果
1. 意大利黑麦草的全长参考转录组数据库的组装
根是第一个接触镉胁迫的器官,为了鉴定最能调节植物Cd吸收和耐受性的基因组成,研究者用50 µmol L-1 Cd处理了意大利黑麦草6小时。镉对意大利黑麦草根的金属含量有显著影响(图1)。锌,铁,锰和铜的含量显著增加,镉的含量达到291.60 mg k-1。为了分析转录组信息,在用镉处理6小时后,提取了意大利黑麦草根的总RNA,然后将三个对照和三个处理过的样品等量合并为一个样品。随后,根据实验前的结果,意大利黑麦草的mRNA的长度大部分富集在小于4 kb的范围内。作者准备了两个重叠的cDNA文库,分别插入了1–4 kb和3–10 kb的插入片段,并扩增了3个10–10 kb文库的20个循环LD-PCR循环。利用PacBio Sequel平台通过SMRT细胞对文库进行测序。总而言之,科研人员分别获得了1–4 kb库和3–10 kb库的415,985和386,341条插入片段的读数。此外,它们中的69.06%和40.47%是全长读段,其具有poly(A)尾信号,5'衔接子序列和3'衔接子序列。对于1–4 kb库和3–10 kb库,平均全长非嵌合(FLNC)读数分别为1711和3540个碱基对(bps)。通常,每个cDNA文库的FLNC读数都包含重复的同工型。根据同工型水平聚类算法(ICE)分析,对FLNC读段进行比对,并将相似性序列分配给聚类。每个簇被鉴定为统一的同工型。然后将同工型序列进行修饰,并与非全长非嵌合读段整合。预测的准确度> 99%的同工型被认为是高质量的同工型,其他同工型被认为是低质量的同工型。在1–4 kb和3–10 kb的文库中,共有同工型读段的平均长度分别修改为1756和3653 bp。
为了进一步提高PacBio ISO-seq数据的准确性,作者在Illumina Hiseq X 10平台上意大利黑麦草根的六个样品进行了与PacBio ISO-seq相同的处理测序。每个RNA-seq样品产生了超过39,340,473个读数。使用LSC软件(http://augroup.org/LSC/LSC/),使用RNA-seq短读法对ICE校对产生的低质量同工型进行校正,然后将高质量同工型和校正性低质量同工型合并作为整个全长同工型。在标准ISO-seq分析中,转录本可能生成不同的同工型,并且这些同工型可能分配给不同的文库,因此使用CD-HIT-EST软件(http://www.bioinformatics.org/cd-hit /)。最后,获得了非冗余的高质量转录本,并将其视为参考转录组,大小为340 Mb。

图1. 意大利黑麦草根的金属含量
将参考转录组的所有同工型与蛋白质和核苷酸数据库进行比对,包括NCBI非冗余蛋白(NR),NCBI非冗余核苷酸(NT),Swiss-Prot,Gene Ontology(GO),KEGG和KOG。如表1所示,总共注释了146,545种亚型。GO数据库中有123,344个同工型标注,KEGG数据库中有72,725个同工型标注。在NR数据库中找到了145,825个同工型。

表1.功能注释信息

表2. RNA-seq clean reads的信息。
总体而言,在至少三个数据库中映射了30,797个同工型,而在四个数据库(KOG,NR,KEGG和Swiss-Prot)中存在46,902个同工型(图2A)。对于GO分析,将同工型标注为三类:生物学过程(BP,352,144个同工型),细胞成分(CC,353,049个同工型)和分子功能(MF,156,073个同工型)。在功能分类中,细胞过程(GO:0009987,81,045个同工型)和代谢过程(GO:0008152,74,167个同工型)是BP中两个功能最多的术语。细胞(GO:0005623,79,012个亚型)和细胞部分(GO:0044464,78,846个亚型)是CC中两个功能最强大的术语。催化活性(GO:0003824,63,137个同工型)和结合(GO:0005488,70,972个同工型)是MF中功能最丰富的功能术语(图2B)。为了进一步剖析所有同工型参与的途径,将注释丰富于KEGG数据库中的同工型的KEGG正交标识符(KOs)分为五个代谢途径(等级1)。在细胞过程中,同工型主要与转运和分解代谢途径有关(6254个同工型,8.6%)。共有2269个亚型(3.1%)参与了环境信息处理KO。在遗传信息处理中,共有20,447个同工型(28.1%)参与,主要集中在折叠,分类和降解途径上。不到5.4%(3891)的同工型被归入有机体系统KOs,并参与环境适应途径(图2C)。

图2.全长参考转录组的功能注释


3. 差异表达基因的鉴定和功能概况
将来自Illumina RNA-seq的过滤后的纯读物映射到由PacBio ISO-seq生成的参考转录组。在所有读取中,有68.73–71.43%被定位到参考转录组,9.22–10.29%是唯一定位的读取,而98.71–90.78%是多重比对读取(表2)。通过RESM软件计算所有同工型的表达水平,并显示为FPKM值。使用edgeR软件包,根据阈值(FDR值<0.001)评估了同工型的不同表达水平。响应Cd胁迫共获得2367个差异表达基因(DEG),显著上调1944个DEG,显著下调423个DEG(图3),并使用qRT-PCR进一步验证了20个随机选择的DEG的相对表达水平。为了表征DEG的功能,进行了GO富集分析以对潜在功能进行分类。表3,表4和表5中显示了在BP,MF和CC类别的前20个术语中显著标注的DEG。对于BP类别,四个最富集的GO术语与氧化还原过程相关(GO:0055114),对热的响应(GO:0009408),蛋白质折叠(GO:0006457)和对氧化应激的响应(GO:0006979)。涉及未折叠蛋白结合(GO:0051082)和血红素结合(GO:0020037)的两个术语被指定为MF类别。细胞外区域(GO:0005576)和液泡(GO:0005773)是CC类中两个最重要的术语。还对DEG进行了KEGG分析,将1094个DEG分配给205个途径。图4显示了在前20个重要KO中显著富集的DEG。DEG的高度富集途径是内质网中的蛋白质加工(ko04141)和抗原加工和呈递(ko04612)。内吞作用(ko04144)和谷胱甘肽代谢(ko00480)也出现在DEG的主要KEGG途径中。



研究者根据blastp结果克隆了一个显著下调的基因,并将其命名为LmAUX1。并假设它可能影响植物Cd的吸收和分布。该基因的预测CDS(Multiflorum_1-4k_c11285_f6p6_2149)分离并在拟南芥中过表达(Col-0和aux1-7突变体)。 从RNA-seq获得的FPKM值和通过DEG的qRT-PCR验证的相对表达水平(Multiflorum_1-4k_c11285_f6p6_2149)分别显示在图5A,B中。根据系统发育树的分析,它是拟南芥,短枝曲霉,玉米和水稻中AUX1的同源基因(图5C)。通过带有35S:lmAUX1的T-DNA插入片段产生了拟南芥的多个转基因品系(Col-0生态型和aux1-7突变体)。两个独立的转基因品系分别表现为对Cd的耐受性。在1/2 MS培养基中,在有和没有50 µM CdCl2的情况下,处理了T3代转基因品系,aux1-7突变体和Col-0(图6A),结果清楚地表明了根的相对长度转基因品系中的延伸率显著低于aux1-7突变体和Col-0(图6B)。Col-0,aux1-7突变体和过表达品系分别在灌溉用水或100或500 µM CdCl2溶液的土壤中生长(图7A),与之相比,转基因品系的Cd浓度显著增加。aux1-7突变体(图7B)和Col-0。与aux1-7突变体和Col-0相比,转基因品系的芽Zn,Mn和Cu浓度没有显著影响,但与aux1-7突变体相比,转基因品系的Fe浓度发生了显著变化和Col-0,但用500 µM Cd处理的aux1-7及其过表达线(L1和L2)除外。

图5. AUX1的表达水平和系统树分析。

图6. LmAUX1板上的镉耐受性实验。

图7. LmAUX1在土壤中的镉迁移实验。
5. 替代拼接识别
PacBio ISO-seq的固有优势使得即使在没有参考基因组的情况下,也可以了解整个转录组范围内可变剪接(AS)的复杂性。在这项研究中,作者使用全长参考转录组学数据库,通过名为全长UniTransModels的cogent软件重建了所有转录本的独特模型。通过将单个ISO-seq共有同工型映射回重建的全长UniTransModel,将意大利黑麦草的转录同工型聚类。总而言之,总共29.76%的UniTransModel具有一个以上的同工型,几乎一半的UniTransModel(14.33%)具有两个同工型。仍然有一些UniTransModels具有超过10个同工型(797,1.12%)(图8A)。基于UniTransModels(而不是基于规范的基因组的AS事件)作为参考,评估了不同类型的AS事件。保留内含子(RI)是大多数AS事件,并且与备选5'端或3'端AS事件一起,这三种类型的AS事件构成了检测到的事件的90%以上(图8B)。通过将Illumina的短读段与转录本模型(UniTransModels)进行比对,可以进一步验证在没有参考基因组的情况下通过管线检测到的同工型的可靠性,并且对照和Cd胁迫处理中UniTransModels中某些同工型的不同AS事件如图7所示。

图8.使用ISO-seq对多花黑麦草全长转录组进行选择性剪接(AS)分析。
结论
根据对RNA-seq数据的分析,构建了高质量的意大利黑麦草参考转录组,并揭示了镉胁迫下意大利黑麦草的调控网络的全面情况。然后,表征了拟南芥中Cd的积累使DEG(LmAUX1)的表达大大增强,该基因有可能被用于繁殖高镉积累的意大利黑麦草品种。这项工作加深了我们对意大利黑麦草应对Cd胁迫机理的理解,并有助于其基因鉴定和分子育种。
评论
镉(Cd)是有毒的重金属元素,它相对容易被植物吸收并进入食物链,导致人体接触到镉。意大利黑麦草是在全球温带地区广泛种植的重要草料,具有用于植物修复的潜力。但是,尚未完全了解调节该物种中Cd易位和积累的基因。本研究优化了PacBio ISO-seq,并将其与RNA-seq集成,以构建从头开始的未测序同源四倍体物种的全长转录组数据库。利用该数据库,作者鉴定了2367个差异表达基因(DEG),并通过GO和KEGG分析了意大利黑麦草应对Cd胁迫的分子调控途径。DEG LmAUX1在拟南芥中的过表达显著提高了植物Cd的浓度。本研究还揭示了无基因组策略的选择性剪接(AS)的复杂性。研究者使用参考转录组重建了全长UniTransModels,并且29.76%的全长模型具有一个以上的同工型。结果加深了我们对镉胁迫下意大利黑麦草的遗传多样性和复杂性的理解,并为其基因鉴定和分子育种提供了宝贵的遗传资源。
更多推荐
1 科研 | PNAS:转录组学揭示急性和慢性饮酒对肝脏昼夜新陈代谢有不同的影响