Barcoding || 海量单细胞的关键技术

男,

一个长大了才会遇到的帅哥,

稳健,潇洒,大方,靠谱。

一段生信缘,一棵技能树。

生信技能树核心成员,单细胞天地特约撰稿人,简书创作者,单细胞数据科学家。

海量单细胞技术涉及到三大底层技术:

  • 微流控技术
  • Barcode 技术
  • UMI技术

故事要从第一届单细胞培训班开始讲起,还记得在讲完第一场单细胞技术简介及应用之后,问大家有没有什么问题可以讨论。有位老师问:请问什么叫Barcode?

我们知道海量单细胞技术是在微孔或液滴中物理隔离单个细胞,在这个小格子中裂解细胞,释放mRNA(或其他细胞内小分子信息),这里第一步就是用Barcode来对每个小格子里面的细胞来加标签。目前的技术是把成千上万的Barcode种在一个磁珠上,把这个磁珠放到小格子里标记细胞。

今天我们讨论的就是这个barcode。

  • barcode 多长是合理的?
  • barcode之间的汉明距离对单细胞实验的影响
  • barcode 还可以标记其他生物信息吗?可以,已经在用了。

作为一种标记技术,DNA条形码(DNA barcode)是指生物体内能够代表该物种的、标准的、有足够变异的、易扩增且相对较短的DNA片段。DNA条形码已经成为生态学研究的重要工具,不仅用于物种鉴定,同时也帮助生物学家进一步了解生态系统内发生的相互作用。随着时间的推移,条形码越来越多地用于追踪单个细胞,并定量评估它们对克隆的贡献。尽管条形码定量完全依赖于计数测序读数,但对该方法准确性的详细研究仍然有限。

barcode 本质上是一串碱基序列,如AAAAA、ATCAAGTTC等等。作为细胞的标签,我们认为这段分子标签至少要是稳定的,如果是一段有许多GC碱基组成的序列,那么它的稳定性很可能达不到要求。这段分子标签要从细胞裂解,经过UMI标记分子,RT,建库测序。所以我们在设计这个段序列的时候,要考虑它的用处。同时还要考虑它的可合成性。

另一个主要的问题就是关于生产的,在固定了barcode的长度之后,就要考虑合成什么样的序列了,如果合成的序列太相似,就很可能把不同的磁珠标记上一样的barcede。这样磁珠一旦形成,就会使得不同的油滴或微孔形成带有一样的barcode,从而形成另一种双细胞(不是一个微孔或者液滴包含两个细胞的那种)。所以我们可以根据barcode的距离推断这种可能性,衡量序列相似性的一种方法就是汉明距离。

汉明距离是以理查德·卫斯里·汉明的名字命名的。在信息论中,两个等长字符串之间的汉明距离是两个字符串对应位置的不同字符的个数。换句话说,它就是将一个字符串变换成另外一个字符串所需要替换的字符个数。下面我们来算一下几个例子:

library(stringdist) # 至少你应该知道我用的是R语言
stringdist('ATGCCTAA','ATGCCTAA', method = "hamming")
[1] 0
stringdist('AAAAAAAA','ATGCCTAA', method = "hamming")
[1] 5
stringdist('AAAAAACC','ATGCCTAA', method = "hamming")
[1] 7

那么barcode列表的最小汉明距离越大,那么这个系统就更加稳定。目前市场上主流的两款技术10X和新格元的barcode列表都是可以在其开源软件查到的,所以可以比较一下。

新格元的barcode 列表在其定量软件CeleScope软件(可以在github或gitee)中的路径是:CeleScope/celescope/data/chemistry/scopeV2.0.0 #新格元的barcode是组合起来的,具体可以阅读CeleScope源码了解其结构。

10X 的定量软件Cellranger(可在其官网下载)中Barcode列表在:cellranger-X.X.X/lib/python/cellranger/barcodes

分享一个粗略的方法来寻在其barcode的最小值:

seq1 = barcodelist
library(tidyverse)
min(unlist(map(1:10000,function(i){
    x = sample(seq1,1)
    y = sample(seq1,1)
    while(x==y){y=sample(seq1,1)}
    stringdist(x,y, method = "hamming")
    })))

汉明距离的另一个应用场景是用来做barcode的纠错,二代测序不是完美的测序技术肯定会有测错的情况,那么如何判断测出来的序列是不是一个细胞的barcode呢?一般的方法是在其定量软件里面内置一个白名单,拿测的序列和这个白名单比较,来矫正barcode。对于没有出现在白名单的barcode允许某个汉明距离的差异。

所以在你的单细胞系统里面,这些关键问题思考全面了吗?


References

[1] Thielecke, L., Aranyossy, T., Dahl, A. et al. Limitations and challenges of genetic barcode quantification. Sci Rep 7, 43249 (2017).: https://doi.org/10.1038/srep43249
[2] https://bookdown.org/lambdamoses/museumst/current-techs.html:
[3] https://bioinformatics.stackexchange.com/questions/5183/why-are-there-more-barcodes-than-gems-in-10x-chromium-data
[4] https://kb.10xgenomics.com/hc/en-us/articles/115003133812-How-does-cellranger-count-process-and-filter-UMIs-
[5] https://kb.10xgenomics.com/hc/en-us/articles/115004037743-How-does-Cell-Ranger-correct-for-amplification-bias-
[6] https://github.com/singleron-RD/CeleScope

(0)

相关推荐

  • 新格元创始人方南:格物致知,识微通元

    "德国爆发新冠肺炎最严重的地方就在我家附近的小镇.目前唯一的重病号还有几十个确诊患者都来自这个小镇,但我感觉大家还没有特别紧张." 没想到,对方南的在线访谈是这样开始的. 访谈是在 ...

  • 仅3个单细胞测序样本怎么撑起6分的文章?

    导语 今天和大家分享的是2020年1月份发表在SCIENTIFIC DATA杂志上的一篇文章(IF=5.929)"Single-cell RNA sequencing of human ki ...

  • 使用单分子标签的RNA-Seq会最小化序列偏好和扩增噪音

    研究内容 这项工作讨论了如何最小化PCR扩增偏好性(就是Duplication)对测序数据,特别是低拷贝序列,定量分析的干扰.研究团队开发出了一种称为Digital RNA sequencing的方法 ...

  • 10X单细胞测序之cellranger介绍

    简介目前10X单细胞测序算是测序行业最热门的方向之一,它可以在低测序深度的情况下一次性的获得成千上万的细胞及其每个细胞内的基因表达情况,对了解细胞异质性和新的细胞类型非常有利.官网介绍的功能和优势如下 ...

  • 数字孪生车间的概念、运行机制及关键技术

    引自:<数字孪生及车间实践>(作者:陶飞,戚庆林,张萌,程江峰) 「 1. 数字孪生车间概念模型 」 数字孪生车间(digital twin shop-floor, DTS)的概念模型如图 ...

  • 中国矿业大学:孙彦景教授——矿山动态协同作业场景无线通信关键技术

    随着智能化装备和工业机器人技术的发展,矿山开采过程逐渐趋向无人/少人化,亟需解决数据的高效连续传输问题,如矿山动态协同作业场景下大量的数据采集和传输.多样的用户设备接入以及低时延的控制操作等. 1 矿 ...

  • 林下中蜂养殖关键技术

    黄龙县属温带大陆性半湿润季风气候,年平均气温8.6℃,极端最高温度为36.7℃,极端最低温为-23.7℃,年均降水量602mm,无霜期126-186d,一年四季,三季有花,四季常青.林草覆盖率92%, ...

  • 人工智能领域关键技术和流行语

    一般来说想要成为人工智能工程师,需要不断的了解人工智能相关信息,这包括相关技术.技术应用以及发展趋势等.那么在人工智能领域中关键技术和流行语有哪些呢? 计算机视觉.关键技术和流行语 :卷积神经网络(C ...

  • 藻类的管理关键技术(一)

    藻类的管理是养殖成败的关键因素,藻类的管理主要有直接管理和间接管理两种方法.直接管理主要指藻相的管理,有益藻占优势,平衡和稳定:间接管理主要指通过藻类管理,管理水质指标,包括溶解氧.氨氮.亚硝酸盐pH ...

  • 7项关键技术将在2021年国际消费电子展上亮相

    消费电子展将于1月11日至14日举行,但这是历史上第一次全部采用虚拟方式.即使是在虚拟的形式中,这次活动仍然会展示一些今年最受期待的技术和产品. 在过去的几年里,我们看到索尼发布了他们的概念车,三星推 ...

  • 广西创新驱动重大专项“广西特色药用资源金花茶产业发展关键技术与应用示范研究”成果“善清金花”袋泡茶健...

    2021年4月8日上午,广西中药药效研究重点实验室与广西尔舜国际贸易有限责任公司于广西中医药大学仙葫校区举行了"善清金花"袋泡茶健康食品成果转化交付仪式. 广西中药药效研究重点实验 ...

  • 解码“镜面混凝土”背后的关键技术!

    来源:道路瞭望.中国三峡集团.路桥网 日前,世界在建规模最大.施工难度最大的巨型水电站--白鹤滩水电站向全线到顶发起冲刺,800万m³混凝土开浇以来无一温度裂缝,备受行业赞叹!该工程混凝土施工中,还有 ...

  • Ⅳ型车载储氢气瓶关键技术研究进展

     责编:张松  编辑:张赢 氢燃料电池汽车(FCV)以其零排放的特点成为未来汽车的发展趋势,用于存储高压氢气的储氢气瓶是燃料电池汽车必不可少的关键零部件之一.氢能俱乐部整理归纳了Ⅳ型储氢气瓶研发所面临 ...