编译:橙子,编辑:小菌菌、江舜尧。
原创微文,欢迎转发转载。
导读
高通量测序和单细胞基因组学技术的发展,使得许多不可培养菌群被分离出来。特别是利用单细胞基因组学和宏基因组学,研究人员可以大大提高从复杂微生物群落中获取单体基因组信息的效率和准确性,不仅可以识别微生物,而且可以将功能与物种联系起来,识别亚种变异,研究宿主-病毒相互作用等。在这里,本文回顾了单细胞宏基因组学的最新发展和需要克服的挑战,包括潜在的污染、reads覆盖不均匀、嵌合体、基因组装和注释等。随着测序技术和算法的发展,单细胞宏基因组学无疑将拓宽其在各种微生物研究中的应用。
原名:Single-cell metagenomics: challenges and applications
期刊:Protein&Cell
IF:7.575
发表时间:2018.4
通讯作者:赵方庆
近年来,随着测序技术的发展和生物信息学的进步,高通量测序被广泛应用于研究各种环境微生物的组成、功能、进化和相互作用。它直接促进了微生物生态学的发展,特别是在肠道菌群和人体健康方面,产生了许多可应用的科学成果。依据科学问题,测序技术在环境微生物学中的应用主要分为目标测序、宏基因组测序和单细胞基因组测序。
1、目标测序
目标测序也称为扩增子测序,对微生物的特异性标记基因进行测序,例如16S核糖体RNA(16S rRNA),ITS,氨单加氧酶亚基A或甲基辅酶M还原酶α亚基等。16SrRNA基因在扩增子测序中应用最广泛,通过将reads比对到16S rRNA数据库(green genes、SILVA、RDP),可以分析物种组成。但是,扩增子测序难以达到物种或菌株水平,而且也无法得知这些微生物的功能。
2、宏基因组测序
宏基因组测序又称环境基因组测序或菌群基因组测序,即对环境中所有微生物的全基因组进行测序。该方法通过将reads注释到已知的功能数据库如NR、KEGG、eggNOG等,可以进行物种组成和功能注释分析。有助于我们全面了解微生物群落的代谢途径和群落结构。然而,宏基因组组装和功能注释是宏基因组测序需要克服的挑战。
3、单细胞基因组测序
由于扩增子测序和宏基因组测序的不足,单细胞测序正成为一种强有力的补充手段,其目标是在单细胞水平上对目标菌株进行测序。单细胞基因组测序是通过连续稀释、微流体、流式细胞术或显微操作从环境样品中分离单细胞,再进行DNA提取、16S rRNA测序进行系统发育分析、多重置换扩增(MDA)、文库构建、测序和数据分析。其主要优点是可以很容易地将代谢功能与特定物种联系起来。此外,还可以获取低丰度物种的基因组,而使用宏基因组测序方法可能会丢失这些基因组。其缺点如下:首先,获取单细胞过程复杂且耗时;其次,MDA过程可能导致高不均匀的reads覆盖率和较高的嵌合比例;最后,被污染的细菌或DNA可能会导致整个实验的失败。如上所述,这些测序技术各有利弊,在实际应用中可以相互补充。例如,宏基因组测序不受单细胞获取、嵌合体和reads覆盖不均匀等问题的困扰。同时,单细胞基因组学可以提供物种及其功能的直接联系,这是宏基因组测序需要解决的重要问题。这两种技术的结合可以极大地解决它们各自面临的挑战。在这里,本文概述单细胞基因组学和宏基因组学联合使用方法及其应用和潜在挑战。
二、单细胞宏基因组方法
图1 单细胞宏基因组工作流程
1、MDA法进行全基因组扩增
单个细菌通常含有毫微微克的DNA,而对高通量测序的最低要求是微克,全基因组扩增是单细胞基因组学的重要步骤。MDA法利用随机六聚体引物和Phi29 DNA聚合酶在等温条件下产生大片段DNA。
图2 MDA扩增
Phi29 DNA聚合酶可以通过一个简单的分支迁移反应,取代下游5 ' -端DNA链,延伸3 ' -端DNA链, 3 ' -端也可以以类似的方式延伸。然而,这种方法有其自身的局限性,如污染物的扩增、嵌合体形成和reads覆盖不均匀。然而,所有这些问题都可以通过下游的计算分析来解决。
2、去除DNA污染和序列
DNA污染是MDA之前需要克服的主要挑战之一,因为MDA扩增可能会放大污染,最终导致实验失败。一般来说,污染有三种来源,细胞分选,实验中使用的污染试剂或设备,实验过程中不适宜的环境。有3种应对措施来解决污染问题。第一种解决方案是采用严格的清洗措施保证实验过程,包括环氧乙烷处理实验室一次性用品、热敏DNA核酸酶或紫外线照射处理试剂或使用高效空气过滤器保障实验环境洁净度。第二种解决方案是减少反应体积,可以增加单细胞DNA与污染DNA的比例,因为它降低了基于试剂的污染。最后一种方法是通过计算方法进行DNA测序后的鉴定和去除。例如,通过将所有reads与参考基因组进行比对,可以识别和去除污染DNA。然而,如果污染DNA与目标基因组相似,这种策略有丢失序列的风险。此外,基于四聚物频率的成分分析可以用于去除污染序列,但是计算成本大,而在基因组组装后进行这一步可以降低计算成本。
3、基因组覆盖不均匀
基因组覆盖不均匀是单细胞基因组学的另一个关键问题,这是由随机引物结合和MDA步骤中某些区域的优先扩增引起的。有两种可能的策略来克服这一问题:其一是优化实验过程,如减少反应量来增加有效的模板;或结合同一物种的DNA样本;或使用duplex-specific核酸酶降解MDA扩增后高丰富序列,该策略不仅提高了reads覆盖的均匀度,而且可以增加目标基因组的覆盖度;其二是使用生物信息学方法对测序reads进行标准化。
4、MDA导致嵌合体
嵌合体是另一个严重的问题,在扩增过程中,同一或不同基因组的不同区域可能被错误地扩增成一个片段。嵌合体可分为4个类型:第一类和第二类嵌合体是沿着参考基因组的原始方向倒转时出现的,占嵌合体总数的85%。后两种类型的嵌合体是由两个部分直接连接而成,占嵌合体总数的15%。在DNA重排过程中,两个片段的顺序也可能发生逆转。也就是说,嵌合体的第一个片段可以连接到基因组序列的下游或上游。
图3 嵌合体类型
嵌合体一旦产生并测序,将导致DNA重排并使下游基因组组装复杂化。因此在基因组组装之前,需要使用生物信息学方法从数据集中识别和删除它们。
5、基因组组装
近年来,微生物基因组数据的积累迅速增加。然而,完整的微生物基因组数量的增长要慢得多。其主要原因是测序reads短、环境样品的高复杂性和不均匀性是宏基因组组装的限制因素。组装是将重叠的短reads合并成较长的连续序列的过程。目前的组装算法主要基于reads重叠或de-Bruijn方法,这两种算法的结合主导了高通量测序基因组。从微生物多样性高的环境样品中获取完整的微生物基因组比较困难。一般来说,研究人员只得到一堆以基因为中心的数据,很难断定哪些基因集中在一个有机体中。有时,当样本很简单,如极端环境样本,研究人员可能得到优势物种更完整的基因组。然而,这些样本中的稀有物种很难获得完整的基因组,由于存在亚种或水平基因转移事件,组装后的基因组通常只能代表一个泛基因组。有几种特异性的宏基因组组装软件如Meta-IDBA,MetaVelvet,metaSPAdes,Ray Meta。Meta-Velvet和Meta-IDBA通过基于k-mer覆盖度对de-Brujin进行分解,并分别组装,从而区分不同物种的reads。Ray Meta不能对de-Brujin进行分解,它使用启发式图解方法找到组装最优法。不同软件的组装结果可以用Bambus2生成scaffolds,通过检测重复和基因组变异来避免亲缘较远的有机体之间的错接。单细胞基因组组装可以避免宏基因组测序组装碰到的难题。然而, reads覆盖不均匀、污染DNA和嵌合体带来了新的组装挑战。单细胞组装也有专属组装软件,如Velvet-SC、EULER+Velvet-SC、IDBA-UD、SPAdes,所有这些软件都是基于de-Bruijn分析,适用于reads覆盖率不均匀样本。虽然上述的单细胞基因组组装软件也可以进行宏基因组组装,但是最近的研究表明,宏基因组与单细胞基因组的联合组装拼接可以大大提高拼接的连续性和完整性。例如,单细胞DNA提取可能会导致染色体断裂或DNA损伤,导致一些基因组区域的丢失,这些区域可以从宏基因组数据中获取。另一方面,单细胞基因组的reads可以为宏基因组的组装提供线索。总的来说,宏基因组学和单细胞基因组学的结合为环境中不可培养微生物的组装提供了一个有前途的方向。
6、宏基因组分箱
在宏基因组学研究中,获得完整基因组的一个主要挑战是将宏基因组组装的contigs聚类到种或株系水平。通常有两种策略,依赖分类学法和不依赖分类学法。依赖分类学法是基于序列比对、系统发育模型等。然而,不依赖分类学法从contigs中提取特征,根据序列组成、丰度、标记基因等来推断分箱。然而,不依赖分类学法在低丰度物种的样品上表现不佳。MetaCluster 5.0解决了这一问题,它将高丰度物种reads与低丰度物种reads分离,并使用两轮分箱方法。由于缺乏宏基因组依赖分类学法的参考基因组,不依赖分类学法是宏基因组分箱的主要策略。近年来,单细胞基因组学成为依赖分类学法分箱的一个重要支柱,与传统的分箱方法相比,该方法可以显著提高组装的完整性。
7、基因组分类注释
SSU rRNA基因被广泛用于分析环境样品中某些细菌的系统发育地位。然而,基因的水平转移有时会使结果变得模糊。利用多个单拷贝基因串联起来进行系统发育分析结果优于单个SSU rRNA基因分析结果,因为多个基因串联更有利于消除随机误差。单细胞宏基因组学还可以识别蛋白编码基因,注释它们的功能,重建它们的代谢途径,从而了解它们的生理和代谢特征。GLIMMER广泛应用于细菌基因组注释步骤,其原理是与KEGG、COG、EggNOG、NR等公共数据库进行同源搜索。
三、单细胞宏基因组学的应用
1、在病毒-宿主相互作用研究中的应用
病毒-宿主相互作用是环境中常见的一种过程,包括感染、共生和捕食,可以动态地改变宿主的进化、多样性和代谢潜能,最终影响这种相互作用的功能。对病毒-宿主相互作用的传统研究主要基于实验室纯培养方法或使用宏基因组方法进行间接分析。然而,大多数微生物的不可培养特性限制了对病毒-宿主相互作用的分析,同样,宏基因组学也不允许对单个病毒-宿主对进行明确的识别。单细胞基因组学不依赖培养,可以同时获取细胞内的细菌核序列和染色体外遗传元件信息,极大地促进了病毒-宿主相互作用研究。
2、微生物亚种比较研究
宏基因组方法很难确定亚种之间的差异,单细胞基因组学可以帮助我们研究这些差异
单细胞基因组学和宏基因组学或宏转录组学联合可以极大地提高我们对病毒-宿主相互作用、亚种多样性和不可培养细菌基因表达的理解,还可以在空间和时间尺度上扩展我们对微生物和功能多样性的视野。我们相信,在很长一段时间内,单细胞基因组学与宏基因组学联合的益处是无法取代的。随着新的测序技术和更好的细胞分选方法的发展,单细胞宏基因组学无疑将成为微生物组研究中越来越重要的方法。
你可能还喜欢
综述 | Cell:炎症性肠病的治疗机遇:宿主 - 微生物关系的机制解析
2019年度回顾 | 微生态人体/动物微生物类微文大合辑
2019年度回顾 | 技术贴合辑大放送
这些或许也适合你哦👇
最低250元!微生太扩增子(16S/18S/ITS)测序+分析服务!
福利大放送 | 宏基因组分箱 (Binning)基础与应用免费直播课程开课啦