综述 | 南京大学:生物纳米孔法用于单分子蛋白质测序(国人佳作)
编译:阿温,编辑:Tracy、江舜尧。
原创微文,欢迎转发转载。
蛋白质与许多疾病的发生和治疗有关,因此蛋白质测序将给蛋白质组学和临床诊断带来革命性的变化。纳米孔电化学已被证明是成功的单分子DNA测序,基于当前的阻塞和它们在纳米孔限制的易位持续时间,它解决了4个天然脱氧核糖核苷酸的身份,然而,由于20个蛋白原性氨基酸在电荷、体积、疏水性和结构上的固有复杂性,生物纳米孔在顺序识别单个蛋白质的每个氨基酸(AA)方面仍然面临着开放的挑战。在本文中,我们重点介绍了生物纳米孔法用于单分子蛋白测序(SMPS)的最新进展:天然蛋白的展开、肽易位的控制、AA识别到疾病检测的应用等。
论文ID
实验结果
1. 前言
蛋白质的功能或功能障碍很大程度上取决于其一级结构,即AA序列。蛋白质测序将为疾病诊断和治疗提供重要信息,Edman降解最初被发明用于基于环状化学反应的从N端测序蛋白质,在N端没有一个自由的α-氨基基团的情况下无法工作(例如N-乙酰化蛋白),难以分解的蛋白>50 aa。质谱(MS)是目前蛋白质测序的标准方法,但需要酶切和/或片段化。蛋白质浓度变化范围很广(~1010),细胞内复制数低至10-100个分子,而质谱的动态范围有限,质谱只能在较低的蛋白质组覆盖范围内工作(~105),因此,质谱通常需要高成本的设备和大量的样品才能准确检测,然而,基于靶向生物材料(如抗体)的蛋白质富集并非适用于所有种类的蛋白质,此外,目前还没有类似于DNA聚合酶链反应(PCR)的蛋白质扩增方法,它的其他缺点有对相同或相似质量的原子吸收光谱的敏感性不足,以及蛋白质的翻译后修饰(PTMs)等。
近年来,基于电化学技术的纳米孔已成为实现蛋白质测序的有力选择,因为它们可以提供纳米封闭空间和可设计的单分子传感接口,使蛋白质组分析具有高的时空分辨率和最终灵敏度。单分子与纳米孔传感界面的相互作用诱导了典型的离子电流调制,反映出了易位分子的组成、电荷分布、结构和序列,因此,纳米孔可以根据分辨良好的离子电流变化直接读取单个蛋白质的序列(图1),而纳米孔阵列将有助于低丰度蛋白的高通量并行检测,挽救缺乏体外扩增方法的肽/蛋白,这也预示了不需要标记和/或浓缩就能破译长度蛋白质的光明前景,此外,这种技术也可以提供集成检测中无法提供的蛋白质异质性动态视图,有利于明确识别蛋白质变异,如PTMs,而且纳米孔传感界面的特定修改可用于优化纳米孔特征(如大小和电荷分布),以原子级精度,允许以高空间和时间分辨率精确测定原子吸收光谱。

图1 生物纳米孔单分子蛋白测序示意图
上图:单个易位蛋白的生物纳米孔测序示意图。下图:理想的电流读出,赋予每个AA独特的特征,概念上实时调用单个蛋白质的线性序列。
与DNA不同,蛋白质有更复杂的组成部分——20个蛋白原性原子吸收光谱(AAs)和数百种变体,包括异构体、对映体和PTM——它们在体积和结构上有非常细微的差异。这些AAs依次构成蛋白质的初级结构,然后折叠成高阶结构,显示出精致的功能。与近期成功的DNA测序相比,基于生物纳米孔的蛋白质测序仍处于早期阶段,迫切需要解决多重挑战:
(i) 结构蛋白的展开。常用的生物纳米孔有α-溶血素(α-HL)、耻垢分枝杆菌孔A (MspA)、气溶素(AeL)和香曲霉毒素C (FraC)纳米孔,它们的内部收缩太小(直径为1- 2 nm),无法容纳天然蛋白的大的二级、三级和四级结构,因此,基于纳米孔的蛋白质测序(NPS)的一个基本要求是展开蛋白质的三维拓扑结构,使其能够以拉伸的轮廓进入和分割到纳米孔约束中。
(ii) 肽易位控制。一般来说,应提供足够长的单分子驻留时间,以允许对时间序列信号进行高信噪比记录,从而有序地排列每个AA。如图2所示,肽以很高的速度穿过生物纳米孔(例如,据估计大多数< 1 ms aa-1),然而,目前商业化的纳米孔仪器的时间分辨率阻碍了对单肽不同元素的准确区分,因此,适时的主题为NPS控制单个肽在纳米孔传感界面内的转运。

图2 多肽通过常用生物纳米孔的转运速度
(iii)氨基酸鉴定。20个蛋白原性原子吸收光谱(AAs)的测定范围从0.06(甘氨酸)到0.23 nm3(色氨酸),差异小至0.001 nm3(蛋氨酸和异亮氨酸)。它们通过肽键连接,平均间距为0.38 nm,组成蛋白质的线性序列。除此之外,磷酸化、乙酰化、甲基化、糖基化和泛素化等PTMs的普遍存在,使得直接SMPS的目标对生物纳米孔技术更具挑战性,因此,一个巨大的挑战是提高空间分辨率,为所分析蛋白质的不同原子吸收光谱提供特征鲜明的电流信号。
有实验证明了α-HL纳米孔具有运输和识别具有单螺旋、双螺旋或类胶原蛋白三螺旋的肽(GPP)n的能力,而随后的研究详细阐述了α-HL纳米孔与阳离子α-螺旋肽(AAKAA)n的相互作用动力学。其中一项特别的研究表明,α-螺旋肽Fmoc-DxAyKz在α-HL和AeL纳米孔中的转运速度不同可能是由疏水肽-纳米孔相互作用的差异造成的;而另一项研究表明,纳米孔传感界面的静电结合位点可促进带正电荷的多肽的易位。
在过去的十年中,生物纳米孔在多肽和蛋白质传感方面投入了大量的努力,包括构象/结构表征,变体识别,相互作用研究和蛋白激酶的探索,然而,尽管目前在蛋白质组学分析方面取得了许多成就,但SMPS的发展仍有很长的路要走。本综述重点介绍了生物纳米孔方法用于SMPS的最新进展,并试图对目前的实验工作和克服NPS主要障碍的策略进行全面概述。最后,我们总结了我们对新工艺领域未来发展的见解和展望。
2. 结构蛋白的展开
为了让单个蛋白质进入纳米孔限制,研究者们已经提出了一些方法来破坏折叠的蛋白质结构,例如,使用刚果红(CR)作为抑制剂,防止β-淀粉样蛋白42 (Aβ42)聚集成纤维和斑块(图3a);此外,一个更简便的选择是使用变性剂打开现成的蛋白质折叠,用盐酸胍(Gdm-HCl)展开WT麦芽糖结合蛋白(MalEwt)和一个变体MalE219,当Gdm-HCl增加到~1.0 M时,α-HL和AeL纳米孔仅对部分折叠的蛋白质进行长阻断,对完全折叠的蛋白质进行短阻断(图3b)。既往病例表明高浓度(≥2.0 M)尿素可以降解蛋白质,但在极端变性条件下(如1.5 M Gdm-HCl或4 M尿素),蛋白质的纳米孔变性还是值得关注。
于是作者提出了替代策略,在图3c中,当温度从20℃提高到70℃时,MalE219展开,α-HL和AeL纳米孔的熔化温度相同,均为~45℃,然而,高温会使脂质双分子层失稳,加速分子动力学。由于现有纳米孔仪器分辨率的限制,肽的快速易位阻碍了准确的电流记录,最近的研究表明,在酸性溶液(如pH = 4.5)中,研究人员通过调节AA残基(如组氨酸)的质子化,可使多肽的发夹状结构失稳,此外,通过调节金属离子和氨基酸残基(如Cu2+-组氨酸)之间的特异性结合,蛋白质的折叠状态也会发生改变。
为了使蛋白质逐步通过纳米孔,早期有一种尝试是加入一种运动酶来介导天然蛋白的展开和易位,例如,放置在trans室中的AAA+展开酶ClpX被用于机械变性位于α-HL纳米孔前厅上方的Smt3蛋白(图3d),其中Smt3是通过在其C端附加一个非结构化聚阴离子和一个ssrA肽标签来修饰的,该标签允许特殊的蛋白- clpx结合。ClpX将纳米孔内的Smt3拉出并线性化,导致离子电流逐渐减小,然后迅速返回开孔电流,而进一步的研究应用展开酶ClpXP来调节由一个绿色荧光蛋白(GFP)、一个肌质片段(肌质I27)和两个Smt3组成的结构化S2-GT蛋白的顺序展开,而将带电荷的聚合物标签结合在一起,可以使蛋白质在电驱动下拉伸和穿过纳米孔。在最近的研究中,poly(dC)30寡核苷酸被标记,通过α-HL纳米孔支持模型硫氧还蛋白的多步展开和单向转位(图3e)。

图3 单个蛋白质的纳米孔展开策略
(a)分别在启动子β-环糊精(β-CD)和抑制剂刚果红存在下β-淀粉样蛋白42 (aβ42)的聚集转变。(b)变性剂辅助展开麦芽糖结合蛋白变体(MalE219)。(c) MalE219的热展开。AeL和α-HL纳米孔获得了相同的熔化温度(45°C左右)。(d)展开酶clpx介导的蛋白Smt3的展开和易位。(e)硫氧还蛋白(Trx)的共转位展开。
3. 肽易位的控制
带电多肽的易位和捕获时间可以通过调节外加电压的大小和极性来主动或被动地控制,如图4a所示,电泳促进了带负电荷的肽(YEQ)3,而阻碍了带正电荷的肽(YKQ)3进入AeL纳米孔内迁移。在这种情况下,减缓肽旅程的其中一种可行方法是调节分子本身的电荷分布,在最近的研究中,研究者引入了带相反电荷的尾部来创建偶极特征,通过改变介电泳来控制α- hl纳米孔内的肽逗留(如CP2a,N’-(E)12-(N)12-(R)12- c’)(图4b),当介质电泳补偿电渗流量(EOF)时,偶极样肽可以在纳米孔内以较低的施加电压停滞。
与电泳驱动的DNA易位不同,结合电泳和EOF解释了电荷分布不均匀的多肽/蛋白质的转运。通过平衡电渗透力和电泳力,研究人员提出了延长肽驻留时间的可行方法,例如,EOF和电泳的协同作用减慢了肽CAMA P6 (N '-KWKLFKKIGIGKFLQSAKKF-C ')的运动。通过将中性pH值降低到5以下,由于关键残基(如天冬氨酸)的质子化诱导α-HL纳米孔的电荷调节,EOF增强,而增强的EOF不利于电泳,阻碍了CAMA P6的反顺式取向运动,导致了由肽从孔前庭到β-桶结构域来回迁移引起的B1和B2状态之间的电流振荡(图4c)。同样,一些报告显示,蛋白质可以在生物纳米孔(如ClyA纳米孔)内停留数秒,最高可达几十微米。
另一种可能强大的方法是操纵肽和纳米孔之间的局部相互作用。在图4d中,研究人员设计了M113F和2FN (M113F/K147N/T145F)α-HL纳米孔,通过引入额外的芳香相互作用来降低肽(Y)6的转运速度。最近有报道称,T232K/K238Q突变型AeL纳米孔比WT AeL纳米孔捕获tau肽(N ' -SKIGSTENL-C ')的时间更长,其中T232K位点被设计为增加与带电肽的静电相互作用,K238Q位点增强斥力屏障(图4e),非磷酸化和磷酸化tau肽的识别准确率接近100%。据我们所知,这个突变的AeL纳米孔在不受溶液环境调节的情况下,给出了最慢的多肽转运速度(约5- 70ms aa-1);同样,肽/蛋白质的转运特性可以通过操纵纳米孔的几何形状和纳米孔敏感区域的直径来调节。

图4 通过生物纳米孔电记录肽易位
(a) AeL纳米孔检测带负电荷(YEQ)3和带正电荷(YKQ)3肽。(b)利用单个α-HL纳米孔检测偶极样肽CP2a。(c) EOF调节的肽CAMA P6易位。:(d)淀粉样蛋白-β肽通过α-HL纳米孔转运的研究。(e)利用T232K/K238Q突变体AeL纳米孔定位tau肽的磷酸化位点。
4. 氨基酸的鉴定
虽然已经实现了对4个天然脱氧核糖核苷酸的测序,但生物纳米孔技术仍然缺乏有效的时空敏感性来鉴定20个蛋白原性AAs和多种PTMs。近年来,针对SMPS的纳米孔蛋白质组学研究取得了令人鼓舞的进展,例如,不同于单个aa的6个精氨酸肽(长度为5-10个aa)可以独立或在等摩尔混合物中使用WT AeL纳米孔进行分解(图5a)。阳离子多肽的居留选择性增加了近3倍,采用阴离子金属簇Au25(SG)18,伴随着通过调节溶液条件(pH或混沌盐)电流波动减少近2倍。
另一个值得注意的尝试性研究是使用AeL纳米孔检测20种天然AAs(图5b),在这项工作中,不同的终端“X”被化学连接到精氨酸七肽上,作为聚阳离子载体,以确保XR7肽的单向进入和旅行。为了获得精确的灵敏度,“X”被电限制在小的纳米孔传感体积内,最多可达数十毫秒,允许AeL识别13个自然AAs(即R、W、F、K、L、N、T、P、D、A、C、S和G),并分配到小的亚组。尽管在混合溶液中能够很好地识别出带电族(RR7, KR7, HR7,ER7和DR7),但在等摩尔混合溶液中识别全部20种天然原子吸收光谱仍然是一个很大的困难。
与此同时,人们也在致力于直接识别没有任何附件的单一原子吸收体。在最初的尝试中,研究者发现当单个半胱氨酸(Cys, 0.11 nm3)穿过WT AeL纳米孔时,会产生长时间的明显电流阻断(例如在120 mV时0.11±0.02 ms)(图5c)。而体积较大的天冬酰胺(Asn, 0.12 nm3)和谷氨酰胺(Gln, 0.15 nm3)只诱导难以区分的电流变化,这表明空间位阻效应对单个AA感应的主导作用相对较小。为了提高纳米孔的敏感性,人们还需要考虑其他因素,特别是特定的残基间相互作用。如前所述,T232K/K238Q突变体AeL 纳米孔通过调节残基间静电相互作用实现了非磷酸化、单磷酸化和二磷酸化tau肽的分化。
到目前为止,一些研究小组已经实现了肽/蛋白变体的纳米孔传感,如图5d所示,Cys和同型半胱氨酸(Hcy)与5′-苯甲醛聚(dA)4 (AHA4)结合,在K238Q突变AeL纳米孔内产生可读电流响应和长时间(~10 ms);另一个工作采取了E10 N端的偶极结构和积极的R10糖基东方和减缓整个Fragaceatoxin C肽段(压裂)纳米孔,平衡EOF和电泳负责修改的的区别,磷酸化和糖基化的丝氨酸(S)在一个平衡位置11 (N端) (图5e)。

图5 用生物纳米孔鉴定单个氨基酸的差异
(a)利用AeL纳米孔在等摩尔混合物中检测不同长度的精氨酸肽。(b)肽XR7中终止蛋白原性氨基酸(X)的识别。(c)用AeL纳米孔分析单个氨基酸。(d)用K238Q突变体AeL纳米孔鉴别半胱氨酸(Cys)和同型半胱氨酸(Hcy)。(e)利用FraC纳米孔检测磷酸化和糖基化。
5. 在疾病检测中的应用
在实现NPS最终目标的过程中,越来越多的研究揭示了纳米孔蛋白质组学的潜在机遇,特别是最近报道的用于疾病诊断的应用,例如,α-synuclein(α-syn)的结构转变在其早期纤颤中被探测,这表明这是帕金森病的病理标志(图6a)。如果被捕获在α-HL纳米孔内,天然展开的α-syn单体要么在纳米孔腔内短暂易位,要么转变成部分折叠的中间体,从纳米孔前庭退出;同样,α-HL纳米孔被用于研究阿尔茨海默病(AD)相关的Aβ聚集,揭示了Aβ淀粉样变过程受到其初始结构特征的影响,并可被β-CD抑制。人们也采用WT和突变的FraC纳米孔检测肽/蛋白生物标志物,W116S压裂纳米孔识别血管紧张素I (Ang I),II (Ang II),III (Ang III)和IV (Ang IV)肽同时在混合物中,这是调节血压和流体平衡的关键角色(图6b)。蛋白质激酶的纳米孔传感是另一个新兴的领域,它是许多疾病的潜在治疗靶点,包括癌症和白血病。如图6c所示,人们利用AeL纳米孔体系直接监测蛋白激酶A (PKA)的催化作用,导致底物肽(S-peptide,N’-LRRASLG-C’)发生丝氨酸磷酸化,此研究通过分析磷酸化肽(P-peptide,N’-LRRApSLG-C’)的相对事件频率f/f1μM来定量PKA活性,其中f1μM对应于1μM P肽的内标记所导致的事件频率增强。进一步的纳米孔实验表明,H-89抑制PKA活性的半数抑制浓度(IC50)为104 nM,而结合FsK和IBMX触发MCF-7细胞裂解液中PKA的激活。
协同绑定Pim-1激酶MgATP和传感器连接到一个工程α-HL纳米孔测量,这产生了符合一级协会速率常数k的60±10 + 2μMPim-1-sensor二进制复杂和k '的35±5μM + 3 Pim-1-MgATP-sensor三元复杂(图6d)。atp竞争性Pim激酶抑制剂1被滴定以抑制Pim-1对抗Pim-1传感器复合物的形成。在162 nM Pim-1、100μM ATP和10 mM MgCl2的作用下,抑制剂1的抑制常数为130±30 nM。最近的一项工作研究了Pim-1和一种蛋白磷酸酶诱导的感应肽的可逆磷酸化/去磷酸化;此外,工程设计的phi29纳米孔与上皮细胞粘附分子(EpCAM)肽探针结合,以特异性检测血清中的EpCAM抗体(Ab),证明了生物纳米孔在疾病诊断和医疗应用方面的可行性和通用性。

图6 生物纳米孔在疾病诊断中的应用
(a)表征早期纤维性颤动从天然展开的α-syn单体到通过α-HL纳米孔部分折叠的α-syn中间体。(b)利用工程的W116S压裂纳米孔同时测量血管紧张素(Ang)肽生物标志物。(c)通过气溶素纳米孔评价PKA活性。(d)利用α-HL纳米孔传感器研究Pim-1激酶动力学。
6. 总结与展望
本文综述了近年来促进NPS发展的方法,包括靶肽/蛋白修饰、生物纳米孔工程以及实验条件的改变(如电场、pH值和温度)。突变的生物纳米孔使多肽的转运速度降低了约1-4个数量级(图2),突变的生物纳米孔使多肽的转运速度降低了约1-4个数量级(图2),所导致一个直接的结果是多肽因单个AA而不同。然而,由于纳米孔的传感体积对于AAs(例如甘氨酸为0.06 nm3)来说太大,例如AeL纳米孔的传感区域为~2.4 nm,内径为~1 nm,因此开发蛋白质测序器仍有困难;此外,纳米孔与单个AAs之间的相互作用差异并不足以产生相应的当前特性,在这方面,纳米孔传感界面的定点操作已出现提高时空敏感性,低噪声和高带宽的电化学仪器的发展也有利于蛋白质分析的高信噪比。
与生物纳米孔相比,固态纳米孔具有广泛的环境耐受性,包括电压、温度、pH值和变性剂,因此可以在hash条件下提供肽/蛋白质传感的补充选项,而将生物纳米孔测序仪与可扩展的固态纳米孔相结合,可开发出用于高通量并行蛋白检测的集成纳米孔阵列;此外,纳米孔和其他正在进行的方法(如荧光指纹和隧穿电流)之间的深入对话,将扩大SMPS的机会。有条件的公司可以开发一种纳米孔耦合多室装置,用于同时监测高精确度SMPS的横向隧穿电流和纵向离子阻塞电流。
跨学科领域的共同努力将为新核电站开辟新的可能性。近年来,蛋白质工程和计算酶设计等领域的研究合作,创造了一种名为“Edmanase”的酶,该酶能够在生物相容性条件下逐步裂解N端原子吸收,这一发现为基于外肽酶的NPS的可行性提供了实验证据,纳米孔以可控的速度逐个识别AAs,考虑到大量纳米孔数据的复杂性,人们也提出了机器学习算法。
利用生物纳米孔制备SMPS的途径充满了挑战和机遇,下一个十年将强调高成本效益和高度并行化的NPS。理论、方法和技术上的创新正在进行中,以提高NPS的灵敏度、选择性和可靠性,从而促进个体细胞中蛋白质组的无标记、多路复用和高通量分析。NPS的实现无疑将给单细胞蛋白质组学在理解细胞表型特性、对细胞异质性进行无偏蛋白质组成像、研究细胞动态发育等方面带来巨大变革。纳米孔电化学的创新技术也可以扩展到临床应用,如鉴别PTMs和蛋白质生物标志物,为单一AA水平的蛋白质功能/功能障碍提供了新的见解,如果将NPS与单分子DNA/RNA测序结合起来,将为分子诊断和个性化医疗提供前所未有的视角。
