(CRISPR interference)慢病毒载体系统
Clustered Regularly Interspaced Short Palindromic Repeats / CRISPR Associated Protein 9(CRISPR/Cas9)系统是近年新兴的基因编辑工具之一,另外两种是ZFN和TALEN。由于CRISPR/Cas9的构建更简易,超越了更早开发的ZFN和TALEN技术,成为现今基因编辑领域最炙手可热的技术。CRISPR/Cas9技术源于原核免疫系统CRISPR/Cas。在自然界中,细菌利用CRISPR/Cas抵抗质粒和噬菌体等外源遗传物质的入侵,从而保持自身基因组的完整性。
两个生物大分子,Cas9蛋白和gRNA(guide RNA)组成了CRISPR/Cas9基因编辑系统。在细胞内,Cas9蛋白与gRNA形成复合物,能特异性鉴别出靶序列。此过程中,Cas9蛋白负责将复合物定点到靶DNA和剪切靶DNA。Cas9蛋白有6个结构域,分别是Rec I、Rec II、Bridge Helix、PAM Interacting、HNH和RuvC。Rec I是6个中最大的一个结构域,负责结合gRNA。一旦结合了靶DNA,Bridge Helix就负责启动剪切。PAM interacting结构域赋予Cas9对PAM序列的特异性要求,负责启动与靶DNA的结合。HNH和RuvC都是核酸酶结构域,剪切单链DNA。

图1. Cas9蛋白结构域
在没有结合gRNA的情况下,Cas9蛋白保持失活状态。gRNA是一条单链RNA,会形成一个T型结构。在这个T结构里,有几个显著的特征:tetraloop、3个stem loop和5’ 端与靶DNA互补的序列。


图2. gRNA结构
一旦gRNA结合上Cas9蛋白,就会引起Cas9蛋白的构象改变。这种构象的改变使得Cas9蛋白从失活状态变成了活性状态。

图3. Cas9构象改变
一旦Cas9蛋白被激活,它就开始寻找靶DNA。此过程中,它首先结合到含有PAM(protospacer adjacent motif)序列的序列。一段PAM序列就是2个或者3个碱基序列,位于与gRNA互补的靶DNA序列的下游,紧跟着靶DNA序列。不同的CRISPR系统含有不同的PAM序列,例如:广泛应用的Streptococcus pyogenes Cas9的PAM序列是5′-NGG-3′。Jiang等人证明SpCas9也可以识别NAG,但是效率较低。当Cas9结合到含有PAM序列的潜在靶DNA序列,它会解开PAM的上游双链DNA序列。此时,gRNA的5’ 端序列与解开的序列配对。一旦配对成功,RuvC和HNH核酸酶结构域就会在PAM序列上游的第3个碱基和第4个碱基之间切开。RuvC剪切下链,HNH剪切上链。

图4. Cas9结合并剪切靶DNA
CRISPRi技术依靠生成一个没有核酸酶活性的Cas9蛋白。这是通过往RuvC和NHN两个核酸酶结构域分别导入氨基酸突变D10A和H840A,使得Cas9蛋白失去切割DNA活性,但仍保留结合DNA的能力,这样的Cas9 称之为dCas9(Dead Cas9)。

图5. dCas9结构域
当dCas9被引导到某个基因的转录起始位点TSS(transcription start site)时,dCas9能够物理性阻碍RNA聚合酶的通过,导致基因沉默。为了进一步提高转录抑制的效率,dCas9融合了一个基因抑制结构域,如KRAB(krüppel-associated box)结构域,这样的蛋白称之为dCas9-KRAB。此外,dCas9也可以融合双抑制结构域(bipartite repressor domain)KRAB-MeCP2,抑制效果更佳。

图6. dCas9-KRAB CRISPRi工作原理
一个完整的dCas9-KRAB CRISPRi慢病毒载体系统包含两个部分,gRNA表达载体和dCas9-KRAB(或者dCas9-KRAB-MeCP2)表达载体。设计基因抑制实验时,只需要设计打靶目的基因的gRNA表达载体即可。

图7. dCas9-KRAB CRISPRi慢病毒载体系统
