CRISPR/Cas9-based genome editing technology
A CRISPR/Cas9 vector system for multiplex targeting of gene
sites in monocot plants
亚热带农业生物资源保护与利用国家重点实验室
华南农业大学 生命科学学院 刘耀光课题组
(ygliu@scau.edu.cn)
1. CRISPR/Cas9核酸酶切靶序列原理图
Cas9 nucleaseRuvC-like domainHNH domainTarget Site PAMNGGNNNNNNNNNNNN-3’5’ NNNNNNNNNNNN3’ NNNNNNNNNNNNGNNNNNNNNNNNNNNNNNNNCleavage siteNNNNNNNNNNNNNNNNNNNNgenome NCCNNNNNNNNNNNN-5’sequence5’-G/ANNNNNNNNNNNNNNNNNNNNGUUUUAGAGCUAGAACUAUUGCCUGAUCGGAAUAAAAUUCGAUAGAACUUGAAAAAGUGGCACCGAAAUUUUU-3’CGUGGCUG
1
2 相关载体图谱
2.1 CRISPR/gRNA vectors (单子叶植物用) (sgRNA: single guide RNA,简称gRNA):
pUC18 backboneAmprBsaIpYLgRNA-OsU3/LacZgRNAdownIstream primersMluE.coliPrgRNABamHILacZU3/6up stream primersOsU3BsaI(2)BsaI(1)HindIIIpUC18 backboneAmprBsaIpYLgRNA-OsU6a~c ; -OsU3gRNAdownstream primersgRNABamHIOsU3, OsU6a,b,c U3/6up stream primersBsaI(2)BsaI(1)HindIIIBsaI cutting :NNNggtctcNNNNNNN-33-NNNccagagNNNNNNNRice small nuclear RNA promotersLacZOsU3Transcription initiation sitesGGCAGCCGGTTGTCAG BsaI(1)pUC18 backboneOsU6aOsU6bOsU6cagagaccTCTGA----GCGTCggtctcaGTTTtctctggAGACT----CGCAGccagagaCAAABsaI(2)gRNA
注:用载体骨架长片段隔开U3/U6启动子和gRNA区可避免未切断质粒被PCR扩增(短时延伸20秒)见后面)。这些质粒在E.coli DH10B繁殖。
2.2 CRISPR/Cas9双元载体(单子叶植物用)
pYLCRISPR/Cas9-MH,原命名pYLCRISPR/Cas9-MTmono (M=monocot; H=HPT,抗
潮霉素基因)
pYLCRISPR/Cas9-MB (B=Bar, 抗草苷膦基因)
本套载体系统的pCas9为本实验室设计合成的植物优化密码子基因。双元载体骨架(LB—RB非T-DNA序列)为pCAMBIA-1300(ACCESSION: AF234296)
与以前的载体相比,这2个载体改造了原来的融合型ccdB即LacZ/ccdB为ccdBs(shorten
ccdB,即删除了LacZ序列)及其相对方向反过来,其它部分不变。
2
注: 这些质粒保存在 E. coli TOP10F’(LacIq) 菌株繁殖,以使ccdB(大肠杆菌致死基因)能够被LacIq 产生高水平阻碍蛋白抑制其表达。
(Nuclear Localization Signal)NLSNotIPubiNLSpCas9BsaI(B-L)BsaI (B-R)ccdBsAscITnosRBNotIPCR/Sequencing primer (SP-ML, 原命名SP2)GCGCGGTGTCATCTATGTTACTAGATCGGGAGCACCGGTAAGGCGCGCCGTAGTGCTCGAGAGACCTCTGAAG(ccdBs,657bp)GAGCGTGGGTCTCGCGGTATCATTGGCGCGCCTCTCGAGCTAGCGGCCGCATGCATCGATCTCCTACATCGTATAAATTAGCCTATACGAAGTTATTGCATCTATGTCGGGPCR/Sequencing primer (SP-R, 原命名SP1):P35:HPTP35:Bar
pYLCRISPR/Cas9-MH (~16.5kb)LBKanrpVS1repliconpBR322 oripBR322 bornNLSNotIPubiNLSpCas9BsaI(B-L)BsaI (B-R)ccdBsAscITnosRBNotIpYLCRISPR/Cas9-MB (~16.5kb)LBKanrpBR322 oripVS1repliconpBR322 bornAscI B-L BsaI BsaI B-R AscI NotI CCCGACATAGATGCAATAACTTC-3
3. 基因组靶位点选择和双链接头设计 3.1 靶位点选择
(1)在目标区如果能够找到NGG上游第20碱基是A(用U3启动子)或G (用U6a~c启动子)的序列 (A,G分别为U3和U6启动子的转录起始碱基),优先选为靶序列
19nt如果这里存在4碱基酶切位点,有利于检测打靶效果PAM5-NNNNNNNNNANNNNNNNNNNNNNNNNNNNNGGNNNNNNNNN-3G靶位点3
19nt接头正向引物19nt5-gccGNNNNNNNNNNNNNNNNNNN-3’5-ggcANNNNNNNNNNNNNNNNNNN-3’3-NNNNNNNNNNNNNNNNNNNCAAA-5’3-NNNNNNNNNNNNNNNNNNNCAAA-5’反向引物合成接头的形式(左:连接U3启动子;右:连接U6a启动子)
注意:接头正向引物F和反向R命名命名是根据靶点在gRNA表达盒的连接方向决定,不是基因方向决定,否则这些引物用于检测阳性克隆时容易搞错方向; 另外注意设计引物(尤其反向引物)时的5’---3’方向。
(2) 如果在NGG上游第20碱基不是A或G,可选20碱基为靶序列(参考Kabin Xie and Yinong Yang, 2013, Molecular Plant)合成接头的形式
PAM5-NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGGNNNNNNNNN-320nt20nt5-gccGNNNNNNNNNNNNNNNNNNNN-33-NNNNNNNNNNNNNNNNNNNNCAAA-5(连接U6a启动子)
也就是说,所用启动子的转录起始点与NGG上游第20碱基相同的靶点就是19碱基(19+A/G=20),不相同的靶点就是20碱基。
(3)为了提高突变效率,可以对一个目的基因设计2个靶点(尤其只有一个靶基因)。建议在ORF 5’区和功能结构域各设计1个靶点,使之任何1个靶点的突变都可以产生功能缺失,或2个靶点之间的序列被敲除。靶点序列GC%偏高可提高打靶效率,因此靶点最好含有11-14个C/G(包括U6转
录起始点G)。
几个靶位点设计例:
起始密码PAMTTGCGAGCGAGATCGAGCGATGGCGACGGGG-3Cas9切点外显子切点TAAGAGCATAAGAACGGCGTTAAAAGGGTATGATAATGCAGTATGGTTA-3内含子左图:切点在起始密码附近或尽量在ORF上游,或在特定的功能域 (可能引起密码子缺失和移码)
右图:切点在外显子末端或前端(可能引起移码,或内含子识别位点缺失使内含子不被剪切)
(4)靶点特异性检查:虽然对植物基因打靶的特异性不是重要的问题(万一产生有负面作用的非特异打靶,把突变体与原受体亲本杂交(和回交)就可分离排除非特异打靶位点),但应该将候选靶序列+NGG(上下游加几十碱基)对目标基因组做Blast (选Somewhat similar sequences (blastn),避免在靶序列
4
3’端+NGG与其它功能基因和基因组序列有相似性。但是打算用一个靶序列敲除2个或以上的同源基因时,就选择几个目标基因完全相同的区域为靶位点。
3.2 靶位点接头引物设计例
ExonborderIntron5’-gcctacggccatggtaagtgcccccatcctcttctacccctttgattt-3’3’-ggtaccattcacgggggtaggag-5’PAMForU3-gRNA20bp20bp5’-ggcAgaggatgggggcacttacca-3’3’-ctcctacccccgtgaatggtcaaa-5’19bp5’-gccGaggatgggggcacttacca-3’3’--tcctacccccgtgaatggtcaaa-5’5’-gttGaggatgggggcacttacca-3’3’--tcctacccccgtgaatggtcaaa-5’5’-tcaGaggatgggggcacttacca-3’3’--tcctacccccgtgaatggtcaaa-5’ForU6a-gRNAForU6b-gRNAForU6c-gRNA
4. 多靶点pYLCRISPR/Cas9-MH (B)载体构建
4.1 gRNA表达盒构建示意图
BsaI(1)U3BsaI(2)pUC8 backbonegRNABsaIdigestionTarget-1 (T1)U3gRNAligationU3gRNABsaI(B1’)PCRU3gRNABsaI(B2)Nested PCRBsaI(B1’)U3gRNA
BsaI(B2)
4.2 靶点引物接头与gRNA表达盒的实际连接方式和扩增
为了提高接头连接效率,使用较高浓度(0.05-0.1 ?M)的靶点接头,实际上大部分产生线性单端连接,而环状(双端)连接较少。另外,过度酶切,星活性,过度连接等可能产生破坏的平滑末端,有可能连接产生双接头产物或的空载产物(下图的产物IV和产物V)。连接接头后,有3种方法扩增gRNA表达盒片段:(1)直接用位置特异引物做一轮PCR扩增; (2)做2轮巢式PCR,第一轮PCR用通用的
5