1、(19)中华人民共和国国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 201210057073.5 (22)申请日 2012.03.06 (65)同一申请的已公布的文献号 申请公布号 CN 103305498 A (43)申请公布日 2013.09.18 (73)专利权人 中国科学院上海生命科学研究院 地址 200031 上海市徐汇区岳阳路319号 专利权人 国家人类基因组南方研究中心 (72)发明人 陈威华赵国屏 (74)专利代理机构 上海专利商标事务所有限公 司 31100 代理人 陈静 (51)Int.Cl. C12N 15/10(2006.01
2、) C12N 15/11(2006.01) (56)对比文件 CN 102286512 A,2011.12.21,全文. Cohen-Karni D, et al.The MspJI family of modification-dependent restriction endonucleases for epigenetic studies. PNAS .2011,第108卷(第27期),参见 第11040-11045页, 表1、 图S1、 图S3、 表S1-8. Peisajovich SG, et al.BBF RFC 28: A method for combinatorial mu
3、lti-part assembly based on the Type IIs restriction enzyme AarI. http:/ dspace.mit.edu/bitstream/handle/1721.1/ 46721/BBFRFC28.pdf .2009,参见全文, 特别是 “4 Description” 和 “5 Methods” 部分. 审查员 潘有礼 (54)发明名称 在双链DNA片段末端产生预定粘性末端的方 法 (57)摘要 本发明涉及在双链DNA片段末端产生预定粘 性末端的方法。 揭示了一种新的在双链DNA片段 末端产生预定粘性末端的方法, 所述方法通过构 造修饰状
4、态与双链DNA内部不同的含可切割酶切 识别位点的双链DNA末端, 可以特异性地将双链 DNA的末端转变成预设的粘性末端, 不需要考虑 DNA内部的序列组成和酶切位点组成。 利用本发 明的方法, 可方便、 快捷、 准确地获得预定的粘性 末端, 从而实现长链DNA连接, 且不引入多余的 DNA序列。 权利要求书2页 说明书21页 序列表10页 附图6页 CN 103305498 B 2016.10.05 CN 103305498 B 1.一种在双链DNA片段末端产生预定粘性末端序列的方法, 包括: (i)提供一种DNA链包括式(I)结构的双链DNA片段: BX-Y(I); 其中, B为核酸内切酶识
5、别位点序列; B序列与Y序列的修饰状态不同, 所述的核酸内切 酶特异性识别修饰状态如B的位点序列; 所述的核酸内切酶是基团修饰依赖性核酸内切酶; X为核酸内切酶切割位点序列; 该切割位点序列经所述核酸内切酶切割后形成预定粘 性末端序列; Y为与所述预定粘性末端序列相连接的来自双链DNA片段的非粘性末端序列; 表示B与X-Y之间存在的化学键或碱基; -表示化学键; (ii)利用所述的核酸内切酶切割步骤(i)的DNA链包括式(I)结构的双链DNA片段, 从而 获得末端为预定粘性末端序列的双链DNA片段; 并且, 在步骤(i)之前, 还包括扩增所述DNA链包括式(I)结构的双链DNA片段的步骤: (
6、 i)提供待扩增的DNA链包括式(I)结构的双链DNA片段的上游和下游引物, 所述的上 游引物和下游引物中包括式(II)结构: BX-Y (II); 其中, Y 为与粘性末端序列相连接的且与Y的5 端1-60个碱基相同的序列; 和 以包含Y序列的DNA作为模板, 利用所述的上游和下游引物进行PCR扩增, 获得所述DNA 链包括式(I)结构的双链DNA片段扩增产物。 2.如权利要求1所述的方法, 其特征在于, 步骤(i)中, B被包含在式(III)结构的Seq中: Seq -H-Seq(III); 其中, Seq是1-30个核苷酸的序列, Seq 为与Seq互补的序列; H为Seq和Seq 之间
7、的间隔序列, 所述间隔序列与Seq和Seq 不互补; 该间隔序列为6-30 个碱基。 3.如权利要求1所述的方法, 其特征在于, 所述的基团修饰依赖性核酸内切酶选自: MspJI, FspEI, LpnPI, AspBHI, RlaI, SgrTI; 且, (1)当所述的基团修饰依赖性核酸内切酶是MspJI时: B为*CNNR, 其中N为A或C或G或T, R 为G或A, *C为已设的甲基化、 羟甲基化; B与X-Y之间存在9个任意碱基; X为4个碱基的序列; 或 (2)当所述的基团修饰依赖性核酸内切酶是FspEI时: B为C*C, 其中*C为已设的甲基化、 羟甲基化; B与X-Y之间存在12个
8、任意碱基; X为4个碱基的序列; 或 (3)当所述的基团修饰依赖性核酸内切酶是LpnPI时: B为C*CDG, 其中D为A或G或T, *C为 已设的甲基化、 羟甲基化; B与X-Y之间存在10个任意碱基; X为4个碱基的序列; 或 (4)当所述的基团修饰依赖性核酸内切酶是AspBHI时: B为YS*CNS, Y为C或T, S为C或G, N 为A或C或G或T, *C为已设的甲基化、 羟甲基化; B与X-Y之间存在9个任意碱基; X为4个碱基的 序列; 或 (5)当所述的基团修饰依赖性核酸内切酶是RlaI时: B为S*CW, 其中S为C或G, W为A或T, 其中*C为已设的甲基化、 羟甲基化、 或
9、糖化羟甲基化修饰的胞嘧啶; B与X-Y之间存在12个任 意碱基; X为4个碱基的序列; 或 权利要求书 1/2 页 2 CN 103305498 B 2 (6)当所述的基团修饰依赖性核酸内切酶是SgrTI时: B为C*CDS, 其中D为A或G或T, S为C 或G, 其中*C为已设的甲基化、 羟甲基化、 或糖化羟甲基化修饰的胞嘧啶; B与X-Y之间存在12 个任意碱基; X为4个碱基的序列。 4.一种制备长链DNA的方法, 包括: (a)将待制备的长链DNA分成两条或两条以上的序列片段, 依次为序列1、 、 序列n; 其 中n为等于或大于2的正整数; (b)针对步骤(a)分段的每一序列片段, 以
10、权利要求1-3任一所述的方法分别制备末端 为预定粘性末端序列的双链DNA片段; 所述的预定粘性末端序列来自于各序列片段的末段, 且针对序列n-1获得的双链DNA片段的3 末端预定粘性末端序列与针对序列n获得的双链 DNA片段的5 末端预定粘性末端序列相互补; (c)将步骤(b)获得的末端为预定粘性末端序列的双链DNA片段进行连接, 从而获得长 链DNA。 5.一种用于扩增双链DNA片段的引物, 所述的引物中包括式(II)结构: BX-Y (II) 其中, B和X的定义同权利要求1; Y 为与粘性末端序列相连接的且与Y的5 端1-60个碱基相同的序列, Y的定义同权利要 求1。 6.权利要求5所
11、述的引物的用途, 用于制备末端为预定粘性末端序列的双链DNA片段。 7.一种DNA接头, 包含式(III)所示的结构: Seq -H-Seq(III); 其中, Seq是1-30个核苷酸的序列, 且其中包含有权利要求1的通式(I)中的B序列; Seq 为与Seq互补的序列; H为Seq和Seq 之间的间隔序列, 所述间隔序列与Seq和Seq 不互补; 该间隔序列为6-30 个碱基。 8.权利要求7所述的DNA接头的用途, 用于与双链DNA片段连接, 将通式(I)中B序列引入 双链DNA片段。 权利要求书 2/2 页 3 CN 103305498 B 3 在双链DNA片段末端产生预定粘性末端的方
12、法 技术领域 0001 本发明属于生物技术以及基因重组领域; 更具体地, 本发明涉及在双链DNA片段末 端产生预定粘性末端的方法。 背景技术 0002 人工合成生命的诞生是合成生物学领域里程碑式的成就, 标志着科学家已经能够 合成人工设计的全基因组。 在全基因组的合成过程中, 文特课题组发展出了一系列的DNA合 成组装拼接的关键技术, 这些技术将开创人类改造和设计生命的新时代。 DNA合成相关技术 的发展已经在合成生物学的其他领域产生了重要影响, 例如合成青蒿素药物前体, 合成复 杂的遗传回路, 抗生素的组合生物化学合成。 在巨大的科学远景和经济预期下, DNA合成相 关技术将会飞速发展。 而
13、DNA合成相关技术的完善和发展将极大推动合成生物学的繁荣。 0003 文特课题组发展的体外酶法拼接技术, 以及更早期的不依赖特定序列和连接酶的 体外重组克隆技术, 都能够实现在体外有序同步拼接多个片段, 这大大缩短了基因组的拼 接时间, 在合成人工设计的全基因组中优势明显。 而且能够为大片段基因和基因簇的研究 和改造提供技术可行性。 这对那些相对较大的人类和动植物的基因功能研究和改造特别有 价值, 对那些相对较大的微生物基因簇的功能研究和改造同样有价值。 不过这些技术要求 被拼接的DNA要存在较长的(15-100碱基对)末端同源序列作为重组连接的连接点。 如果能 够摆脱拼接技术对末端长同源序列
14、的要求, 就可以增加连接点选择的灵活性, 简化拼接连 接的设计, 扩大拼接技术实用的材料来源范围。 0004 限制性核酸内切酶被广泛用来切割双链DNA分子, 产生可以用来连接的4碱基突出 粘性末端, 最常用的IIP型限制性内切酶一般识别对称的回文序列, 并在识别位置处切割双 链DNA分子, 产生的回文粘性末端可以被重组连接, 但是连接的次序和方向不能够完全确 定, 在这种重组连接双链DNA反应过程中有很多非目的产物。 0005 IIS型限制性内切酶可以在识别位点的邻旁确定位置切割双链DNA分子, 可以产生 非回文的粘性末端。 利用这种内切酶可以实现在体外定向定序高通量连接双链DNA分子, 还
15、可以实现重复序列较多的基因的合成。 不过在这个技术中, 为了使IIS酶特异性地作用在 DNA双链分子的末端, 仅在双链DNA分子末端产生可用于连接的粘性末端, 在基因合成过程 中设计连接实验的时候需要避免基因内部有多余的酶切位点的存在, 这就限制了基因合成 的连接点的选择和设计, 使得这个方法在合成一些大的基因片段的时候很不方便。 0006 所以人们借助RecA辅助的酶切技术来保护DNA的内部多余酶切位点, 但是这个技 术涉及较多步骤不仅复杂, 而且这个技术中使用的内切酶的识别位点与切割位点只有1-2 个碱基的差距, 不能够用来去除酶切制备双链DNA时末端通常具有的多余酶切位点。 另外也 有使
16、用长的识别序列的人工设计的杂合内切酶来减少内部酶切位点带来的限制, 但是这个 技术中的识别位点与切割位点也只有1-2个碱基的差距, 不能够用来去除酶切制备双链DNA 时末端通常具有的多余酶切位点。 这两个技术中连接点的选择和设计的灵活性都有一定的 限制。 说明书 1/21 页 4 CN 103305498 B 4 0007 综上, 本领域还有必要对于长链DNA的拼接方法进行改进, 以实现方便、 快捷、 准确 的长链DNA连接。 发明内容 0008 本发明的目的在于提供在双链DNA片段末端产生预定粘性末端的方法。 0009 在本发明的第一方面, 提供一种在双链DNA片段末端产生预定粘性末端序列的
17、方 法, 包括: 0010 (i)提供一种双链DNA片段, 其DNA链(较佳地为两条链各自)包括式(I)结构: 0011 BX-Y(I); 0012 其中, B为核酸内切酶识别位点序列; B序列与Y序列的修饰状态不同, 所述的核酸 内切酶特异性识别修饰状态如B的位点序列; 0013 X为核酸内切酶切割位点序列; 该切割位点序列经所述核酸内切酶切割后形成预 定粘性末端序列; 0014 Y为与所述预定粘性末端序列相连接的来自双链DNA片段的非粘性末端序列(也称 为内部序列, 该序列的末端需连接预定粘性末端); 0015 表示B与X-Y之间存在的化学键或碱基; 0016 -表示化学键; 0017 (
18、ii)利用所述的核酸内切酶切割步骤(i)的双链DNA片段, 从而获得末端(一个或 两个末端)为预定粘性末端序列的双链DNA片段。 0018 在一个优选例中, 式(I)为: 5 BX-Y3 。 0019 在另一优选例中, 当式(I)存在于两条DNA链时, 预定粘性末端序列相同或不同; 较 佳地为不同。 0020 在另一优选例中, B或X各自独立地由若干个碱基组成, 一般1-10个, 如1、 2、 3、 4、 5、 6或8个。 0021 在另一优选例中, 所述的核酸内切酶对于DNA序列的识别位点和切割位点不相同。 0022 在另一优选例中, 根据所述核酸内切酶的识别和切割特性, B位于X-Y的5
19、端或3 端。 较佳地, B位于X-Y的5 端。 0023 在另一优选例中, 根据所述核酸内切酶的识别和切割特性, B与X-Y之间存在若干 个碱基, 一般1-20个, 如1、 2、 3、 4、 5、 6、 7、 8、 9、 10、 11、 12、 13、 14、 15、 16、 18个。 0024 在另一优选例中, 根据双链DNA片段上所需产生的粘性末端的位置设计引物; 如仅 需在一个末端形成粘性末端, 则在相应的末端设计式(II)结构的引物; 引物与模板的互补 配对关系是本领域公知技术。 0025 在另一优选例中, 步骤(ii)中, 加入酶切激活寡核苷酸, 启动基团修饰依赖性核酸 内切酶对扩增
20、产物的酶切; 较佳地, 所述的酶切激活寡核苷酸可以退火形成具有基团修饰 依赖性核酸内切酶识别位点的发夹结构。 0026 在另一优选例中, 在步骤(i)之前, 还包括扩增双链DNA片段的步骤: 0027 ( i)提供待扩增双链DNA片段的上游和下游引物, 所述的上游引物或下游引物中 包括式(II)结构: 0028 BX-Y (II); 说明书 2/21 页 5 CN 103305498 B 5 0029 其中, Y 为与粘性末端序列相连接的且与Y的5 端1-60个(较佳地1-40个, 如30个、 20个、 15个、 10个、 5个、 3个)碱基相同的序列; 和 0030 以包含Y序列(含Y及其互
21、补链)的DNA作为模板, 利用所述的上游和下游引物进行 PCR扩增, 获得包含式(I)结构的扩增产物。 0031 在另一优选例中, B序列为预设的或已设的基团修饰状态, Y序列为基团非修饰状 态; 且所述的核酸内切酶是基团修饰依赖性核酸内切酶; 且, 步骤(i)中, 当B序列为预设的 基团修饰状态时, 在B序列加上基团修饰后进行步骤(ii); 当B序列为已设的基团修饰状态 时, 直接进行步骤(ii)。 0032 在另一优选例中, 步骤(i)中, B被包含在式(III)结构的Seq中: 0033 Seq -H-Seq(III); 0034 其中, Seq是1-30个(如25个、 20个、 15个
22、、 12个、 10个、 8个、 6个)核苷酸的序列, Seq 为与Seq互补的序列; 0035 H为Seq和Seq 之间的间隔序列(通常1-30个碱基; 如25个、 20个、 15个、 12个、 10个、 8个、 6个), 所述间隔序列与Seq和Seq 不互补。 0036 在另一优选例中, 式(III)可以形成如下二级结构: 0037 0038 其中, |表示在Seq和Seq 之间形成的氢键。 0039 在另一优选例中, 式(III)为: 5 Seq -H-Seq3 。 0040 在另一优选例中, 通过在Seq 末端设置可连接的DNA末端(如常规限制性内切酶酶 切位点), 将式(III)结构拼
23、接于所述双链DNA片段的链的末端, 从而形成包含式(III)结构 的式(I)结构。 0041 在另一优选例中, 在B与X-Y之间, 还包含常规限制性内切酶(为非基团修饰依赖性 核酸内切酶)酶切位点序列。 0042 在另一优选例中, 所述的基团修饰选自: 甲基化修饰, 羟甲基化修饰、 糖化羟甲基 化修饰、 甲酰化、 羧基化、 硫化。 0043 在另一优选例中, 在B序列加上基团修饰的方法是: 以步骤(i)的双链DNA片段为模 板, 以包含已设基团修饰的B序列的引物进行PCR扩增, 从而在B序列加上基团修饰。 0044 在另一优选例中, 所述的基团修饰依赖性核酸内切酶选自(但不限于): MspJI
24、, FspEI, LpnPI, AspBHI, RlaI, SgrTI; 且, 0045 (1)当所述的基团修饰依赖性核酸内切酶是MspJI时: B为*CNNR, 其中R为G或A, *C为 预设的或已设的甲基化(mC)、 羟甲基化(hmC); B与X-Y之间存在9个任意碱基; X为4个碱基的 序列; 或 0046 (2)当所述的基团修饰依赖性核酸内切酶是FspEI时: B为C*C, 其中*C为预设的或已 设的甲基化、 羟甲基化; B与X-Y之间存在12个任意碱基; X为4个碱基的序列; 或 0047 (3)当所述的基团修饰依赖性核酸内切酶是LpnPI时: B为C*CDG, 其中D为A或G或T,
25、 * C为预设的或已设的甲基化(mC)、 羟甲基化(hmC); B与X-Y之间存在10个任意碱基; X为4个碱 基的序列; 或 0048 (4)当所述的基团修饰依赖性核酸内切酶是AspBHI时: B为YS*CNS, 其中R为G或A, Y 说明书 3/21 页 6 CN 103305498 B 6 为C或T, S为C或G, N为A或C或G或T, *C为预设的或已设的甲基化(mC)、 羟甲基化(hmC); B与X- Y之间存在9个任意碱基; X为4个碱基的序列; 或 0049 (5)当所述的基团修饰依赖性核酸内切酶是RlaI时: B为S*CW, 其中S为C或G, W为A 或T, 其中*C为预设的或
26、已设的甲基化、 羟甲基化、 或糖化羟甲基化修饰的胞嘧啶; B与X-Y之 间存在12个任意碱基; X为4个碱基的序列; 或 0050 (6)当所述的基团修饰依赖性核酸内切酶是SgrTI时: B为C*CDS, 其中D为A或G或T, S为C或G, 其中*C为预设的或已设的甲基化、 羟甲基化、 或糖化羟甲基化修饰的胞嘧啶; B与 X-Y之间存在12个任意碱基; X为4个碱基的序列。 0051 在本发明的另一方面, 提供一种制备长链DNA的方法, 包括: 0052 (a)将待制备的长链DNA分成两条或两条以上的序列片段, 依次为序列1、 .、 序列 n; 其中n为等于或大于2的正整数(如n2-100,
27、更例如n3、 4、 5、 10、 15、 20、 30、 40、 50、 60、 70、 80); 0053 (b)针对步骤(a)分段的每一序列片段, 以前面任一所述的方法分别制备末端为预 定粘性末端序列的双链DNA片段; 所述的预定粘性末端序列来自于各序列片段的末段, 且针 对序列n-1获得的双链DNA片段的3 末端预定粘性末端序列与针对序列n获得的双链DNA片 段的5 末端预定粘性末端序列相互补; (较佳地, 针对每一序列片段设置的预定粘性末端序 列不同) 0054 (c)将步骤(b)获得的末端为预定粘性末端序列的双链DNA片段进行连接, 从而获 得长链DNA。 0055 在一个优选例中,
28、 所述的长链DNA选自(但不限于): 基因组DNA, 部分序列的基因组 DNA, 重组质粒的DNA。 0056 在另一优选例中, 步骤(b)中, 在B序列及其上游和/或下游, 预设通用配对引物序 列(, 从而便于多序列片段批量操作)。 0057 在本发明的另一方面, 提供一种用于扩增双链DNA片段的引物, 所述的引物中包括 式(II)结构: 0058 BX-Y (II) 0059 其中, B和X的定义同前述; 0060 Y 为与粘性末端序列相连接的且与Y的5 端1-60个(较佳地1-40个, 如30个、 20个、 15个、 10个、 5个、 3个)碱基相同的序列, Y的定义同前述。 0061
29、在本发明的另一方面, 提供所述的引物的用途, 用于制备末端为预定粘性末端序 列的双链DNA片段。 0062 在本发明的另一方面, 提供一种DNA接头, 包含式(III)所示的结构: 0063 Seq -H-Seq(III); 0064 其中, Seq是1-30个(如25个、 20个、 15个、 12个、 10个、 8个、 6个)核苷酸的序列, 且其 中包含有通式(I)中B序列; 0065 Seq 为与Seq互补的序列; 0066 H为Seq和Seq 之间的间隔序列(通常1-30个碱基; 如25个、 20个、 15个、 12个、 10个、 8个、 6个), 所述间隔序列与Seq和Seq 不互补。
30、 0067 在另一优选例中, 所述的DNA接头的一个末端为粘性末端(如Seq 的末端), 从而可 说明书 4/21 页 7 CN 103305498 B 7 与双链DNA片段或引物互补连接。 0068 在本发明的另一方面, 提供所述的DNA接头的用途, 用于与双链DNA片段连接, 将通 式(I)中B序列(如基团修饰依赖性核酸内切酶的识别位点序列)引入双链DNA片段。 0069 本发明的其它方面由于本文的公开内容, 对本领域的技术人员而言是显而易见 的。 附图说明 0070 图1的示意图显示用一对通用的甲基修饰引物将可被核酸内切酶识别切割的修饰 碱基引入到双链DNA的末端, 通过修饰依赖性的酶切
31、, 实现DNA的无痕拼接。 0071 图2的示意图显示用合成的带甲基化识别位点的引物直接将修饰碱基引入到双链 DNA的末端, 通过修饰依赖性的酶切, 实现DNA的无痕拼接。 0072 图3A的示意图显示用合成的带甲基化识别位点的寡核苷酸接头(发夹状)将识别 位点加入到待组装双链DNA末端, 通过修饰依赖性的酶切, 实现内部无甲基化修饰依赖型切 割的双链DNA的无痕拼接。 0073 图3B的示意图显示用合成的带可切割识别位点的寡核苷酸接头(发夹状)将识别 位点加入到待组装双链DNA, 实现双链DNA(内部的识别位点被修饰保护后不能被选用的限 制性内切酶切割)的拼接。 0074 图4、 实施例1中
32、, 经酶切处理以及体外连接后各种片段连接产物的琼脂糖凝胶电 泳结果。 0075 图5、 实施例1中, 经酶切处理以及体外连接后各种片段连接产物的琼脂糖凝胶电 泳结果。 0076 图6、 实施例2中, 经酶切处理以及体外连接后各种片段连接产物的琼脂糖凝胶电 泳结果。 0077 图7、 实施例2中, 经酶切处理以及体外连接后各种片段连接产物的琼脂糖凝胶电 泳结果。 0078 图8、 实施例3、 3.1中, 经酶切处理以及体外连接后各种片段连接产物的琼脂糖凝 胶电泳结果。 0079 图9、 实施例3、 3.2中, 经酶切处理以及体外连接后各种片段连接产物的琼脂糖凝 胶电泳结果。 0080 图10、
33、实施例2中, 经酶切处理以及体外连接后各种片段连接产物的琼脂糖凝胶电 泳结果。 具体实施方式 0081 本发明人致力于DNA拼接方法的研究, 开发了一种新的在双链DNA片段末端产生预 定粘性末端的方法, 所述方法通过构造修饰状态与双链DNA内部不同的含酶切识别位点的 双链DNA末端, 可以特异性地将双链DNA的末端转变成为预定的粘性末端, 不需要考虑DNA内 部的序列组成和酶切位点组成。 利用本发明的方法, 可方便、 快捷、 准确地获得预定的粘性 末端, 从而实现长链DNA连接, 且不引入多余的DNA序列。 0082 术语 说明书 5/21 页 8 CN 103305498 B 8 0083
34、如本文所用, 所述的 “粘性末端” 当双链DNA序列中一个特异性的碱基序列处被切 断时, 在切口处留下若干个未配对的核苷酸片段。 所述的 “预定粘性末端” 是指在切口处留 下若干个未配对的核苷酸片段是预先确立的。 0084 如本文所用, 除非另外说明, 所述的 “核酸内切酶” 是指识别位点和切割位点不相 同的一组酶, 并且, 其还具有对核酸链的修改状态进行识别的能力。 当一条核酸链存在不同 的修饰状态时, 所述的 “核酸内切酶” 能够特异性地识别特定的修饰状态的核酸位点, 而不 识别其它的修饰状态。 本文中, 也将该 “核酸内切酶” 称为 “修饰相关性核酸内切酶” 。 0085 如本文所用,
35、所述的 “常规限制性内切酶” 是指一类常用的限制性内切酶, 其不同 于上段所定义的 “核酸内切酶” , 也不是基团修饰依赖性核酸内切酶。 所述的 “常规限制性内 切酶” 的识别位点和切割位点通常位于核苷酸序列的同一位置上。 所述的 “常规限制性内切 酶” 例如但不限于: BamHI、 XbaI、 EcoRI等。 0086 如本文所用, 所述的 “基团修饰依赖性(限制性)核酸内切酶” 是指一类能够区分识 别位点的修饰状态并切割双链DNA的酶, 而且其识别位点与切割位点不相同; 其识别基团修 饰的碱基(如甲基化、 羟甲基化、 糖化羟甲基化修饰的胞嘧啶, 即mC、 hmC、glc-hmC), 且在识
36、别位 点以外的位点上切割DNA双链并形成粘性末端。 所述的基团修饰包括(但不限于)甲基化、 羟 甲基化、 糖化羟甲基化修饰、 甲酰化、 羧基化、 硫化。 所述的基团修饰依赖性核酸内切酶包括 (但不限于): MspJI, FspEI, LpnPI, AspBHI, RlaI、 SgrTI等。 0087 如本文所用, 所述的 “长链DNA” 是指链长较长的DNA, 根据其长度, 通过人工合成的 方法或基因工程方法进行合成时, 有必要分成多个DNA片段进行。 例如, 所述的 “长链DNA” 长 度大于1000bp, 2000bp, 3000bp, 4000bp, 5000bp, 6000bp。 00
37、88 如本文所用, 所述的 “预设的基团修饰状态” 是指一种核酸序列状态, 该序列还没 有进行基团修饰, 但可通过加入基团修饰(如通过PCR扩增加入基团修饰)。 0089 如本文所用, 所述的 “已设的基团修饰状态” 是指一种核酸序列状态, 该序列已经 进行基团修饰。 0090 如本文所用,“互补” 是指两条单链的核苷酸的序列可以以一种可预见的方式发生 相互作用, 形成双链结构。 相互 “互补” 的序列通常是指将5 -3 方向的序列转换为其3 -5 方向的序列(如5 ATCG3 GCTA), 然后再取其互补序列(如GCTA5 CGAT3 )。 0091 如本文所用,“发夹(Hairpin)”
38、结构也被称作 “茎环” 结构, 是指一种寡核苷酸分 子, 其可形成一种包括双链区域(茎部)的二级结构, 所述的双链区域由该寡核苷酸分子的 两个区域(位于同一分子上)形成, 两个区域分列双链部分的两侧; 其还包括至少一个 “环” 结构, 包括非互补的核苷酸分子, 即单链区域。 发夹结构是本领域技术人员所熟知的, 通常 在获得了一条具有一级结构的寡核苷酸序列后, 本领域技术人员能够确定该核酸是否能形 成发夹结构。 0092 如本文所用, 所述的 “含有” ,“具有” 或 “包括” 包括了 “包含” 、“主要由.构 成” 、“基本上由.构成” 、 和 “由.构成” ;“主要由.构成” 、“基本上由.
39、 构成” 和 “由.构成” 属于 “含有” 、“具有” 或 “包括” 的下位概念。 0093 在双链DNA片段末端产生预定粘性末端序列的方法 0094 本发明涉及一种把双链DNA末端转变为预定粘性末端的方法, 通过构造修饰状态 与双链DNA内部不同的含酶切识别位点的双链DNA末端, 利用在识别位点附近进行修饰相关 说明书 6/21 页 9 CN 103305498 B 9 性切割的修饰相关性核酸内切酶, 可以特异性地将双链DNA末端转变成为可用于连接反应 的粘性末端, 不需要考虑待组装的DNA内部的序列组成和酶切位点组成。 0095 与目前直接通过体外连接寡核酸接头来改变DNA末端的粘性末端不
40、同的是, 本发 明的方法既可以加入碱基来产生粘性末端, 包括但不限于1-8个碱基的加入; 也可以去除 DNA末端多余碱基来产生粘性末端, 包括但不限于1-14个碱基的去除。 用于连接两段双链 DNA分子的粘性末端碱基对可以预先选定, 这个方法能够无痕迹地以任意碱基在任意位置 连接双链DNA分子, 具有广泛的实用性。 0096 以往, 基团修饰依赖性核酸内切酶被开发用来进行表观遗传学研究, 检测基因组 上胞嘧啶的甲基化状态。 这种基团修饰依赖性核酸内切酶识别的位点是含修饰基团的碱 基, 例如MspJI(US20100167942)能够识别位点mCNNR(RG/A)并能在修饰的胞嘧啶3 一侧 N9
41、/N13处切割双链DNA, 而对没有发生修饰的碱基序列不会发生切割。 0097 本发明所述的基团修饰依赖性核酸内切酶, 其识别位点与切割位点不相同, 其识 别基团修饰的碱基(如甲基化、 羟甲基化, 即mC、 hmC), 且在识别位点以外的位点上切割DNA双 链并形成粘性末端。 根据该酶的特性, 可以在DNA链的近末端区预设或设置该酶的识别位 点, 并设置适当的碱基间隔, 从而使得该酶在切割位点处切割产生粘性末端。 0098 DNA链的上述设计可以通过设计引物、 PCR扩增来实现; 也可以通过设计包含识别 位点的核酸链接头(如Seq -H-Seq)并与DNA链的其它区域相连接来实现。 0099
42、上述方法, 可以特异性地在双链DNA的末端产生可用于连接反应的粘性末端, 对于 未修饰的双链DNA分子, 完全不用考虑DNA双链内部的碱基序列, 大大简化了DNA组装合成的 设计, 增加了设计的灵活性和方便性。 0100 利用基团修饰依赖性核酸内切酶进行酶切的方法是本领域技术人员已知的, 例如 可以获自提供该基团修饰依赖性核酸内切酶的厂商, 或记载于试剂盒的说明书中。 0101 本发明的方法, 由于特异性地构造了双链DNA片段末端与双链DNA片段内部修饰状 态的不同, 使得修饰依赖的限制性内切酶可以特异性地作用在DNA的末端, 这个方法利用的 是DNA修饰状态的不同, 所以不需要考虑双链DNA
43、内部的碱基序列组成。 更重要的是, 可以利 用识别位点与切割位点之间存在若干个碱基的差距来去除DNA末端的多余酶切位点。 通过 酶切制备的双链DNA分子末端通常会有这样的酶切位点。 这样不仅增加了设计的灵活性, 还 能够实现无痕迹地以任意碱基在任意位置连接双链DNA分子。 0102 本发明涉及的基团(化)修饰、 去基团(化)修饰的方法是本领域技术人员熟知的。 例如, 利用DNA甲基化转移酶催化, 可将胞嘧啶(C)转变为5-甲基胞嘧啶(5mC; 简称mC), 而一 种称为TET1的酶可以羟基化5mC形成5hmC(简称hmC); 此外也存在一些DNA去甲基化酶来实现 甲基基团的去除。 0103 序
44、列拼接 0104 利用本发明的方法, 在特定酶的识别位点附近进行切割, 可以无疤痕地在双链DNA 末端产生预定粘性末端。 更有利的是这个方法可以去除或/和转换DNA双链末端的多余酶切 位点, 使得这个技术可以将来源于体内的各种酶切片段无疤痕地按照预定次序和方向地连 接在一起。 可以设置多条分别带有不同粘性末端的DNA双链, 由于粘性末端的设置是可控 的, 可以设置为针对序列n-1获得的双链DNA片段的3 末端预定粘性末端序列与针对序列n 获得的双链DNA片段的5 末端预定粘性末端序列相互补, 从而可以以一种预定的次序和方 说明书 7/21 页 10 CN 103305498 B 10 向连接成
45、长链DNA。 0105 引物 0106 为了在DNA链上获得预定的粘性末端, 一种途径是利用引物进行PCR扩增来将预设 的带有特定酶(如基团修饰依赖性核酸内切酶)识别位点以及切割位点(即预期形成粘性末 端的位点)的序列添加到DNA链上。 因此, 本发明也包括这种经过设计的引物。 0107 作为一种优选方式, 本发明的引物的序列包括: 预设的或已设的基团修饰依赖性 核酸内切酶识别位点序列; 基团修饰依赖性核酸内切酶切割位点序列, 该切割位点序列经 所述基团修饰依赖性核酸内切酶切割后形成预定粘性末端序列; 以及与粘性末端序列相连 接的且与DNA链的内部序列相同或互补的一段(如1-60个碱基)序列。
46、 0108 所述的引物可被包含在试剂盒中, 以用于商业化的用途。 0109 下面结合具体实施例, 进一步阐述本发明。 应理解, 这些实施例仅用于说明本发明 而不用于限制本发明的范围。 下列实施例中未注明具体条件的实验方法, 通常按照常规条 件如J.萨姆布鲁克等编著, 科学出版社, 2002中所述的条件, 或按照制 造厂商所建议的条件。 除非另外说明, 否则百分比和份数按重量计算。 0110 实施例1、 用通用的甲基化修饰引物将PCR片段末端加上修饰的可切割酶切识别位 点 0111 MspJI是一种修饰依赖性的核酸内切酶, 能够识别位点mCNNR(RG/A)并能在修饰 的胞嘧啶3 一侧N9/N1
47、3处切割双链DNA。 0112 本实施例中, 使用的引物中选用mCTGG作为识别位点, 引物中用粗体表示的碱基是 预设的切割位点和连接位点。 0113 具体来看: MspJI切割修饰的A片段后, A片段上游引物端可以产生TATC的5 突出粘 性末端, A片段下游引物端可以产生AGTT的5 突出粘性末端(表1); MspJI切割修饰的B片段 后, B片段上游引物端可以产生AACT的5 突出粘性末端, B片段下游引物端可以产生TCGG的 5 突出粘性末端; MspJI切割修饰的C片段后, C片段上游引物端可以产生CCGA的5 突出粘性 末端, C片段下游引物端可以产生ACCC的5 突出粘性末端;
48、MspJI切割修饰的D片段后, D片段 上游引物端可以产生GGGT的5 突出粘性末端, D片段下游引物端可以产生CGGA的5 突出粘 性末端; MspJI切割修饰的E片段后, E片段上游引物端可以产生TCCG的5 突出粘性末端, E片 段下游引物端可以产生CGCC的5 突出粘性末端; MspJI切割修饰的F片段后, F片段上游引物 端可以产生GGCG的5 突出粘性末端, F片段下游引物端可以产生CGGT的5 突出粘性末端; MspJI切割修饰的G片段后, G片段上游引物端可以产生ACCG的5 突出粘性末端, G片段下游 引物端可以产生GCGA的5 突出粘性末端。 0114 这样, 这些DNA双
49、链片段经MspJI切割后产生的4碱基对的5 突出粘性末端确定了 连接的次序和方向。 具体来看: A片段下游引物端产生的AGTT的5 突出粘性末端可以与B片 段上游引物端产生的AACT的5 突出粘性末端互补连接; B片段下游引物端产生的TCGG的5 突出粘性末端可以与C片段上游引物端产生的CCGA的5 突出粘性末端互补连接; C片段下游 引物端产生的ACCC的5 突出粘性末端可以与D片段上游引物端产生的GGGT的5 突出粘性末 端互补连接; D片段下游引物端产生的CGGA的5 突出粘性末端可以与E片段上游引物端产生 的TCCG的5 突出粘性末端互补连接; E片段下游引物端产生的CGCC的5 突出粘性末端可以 与F片段上游引物端产生的GGCG的5 突出粘性末端互补连接; F片段下游引物端产生的CGGT 说明书 8/21 页 11 CN 103305498 B 11 的5 突出粘性末端可以与G片段上游引物端产生的ACCG的5 突出粘性末端互补连接。 0115 成对设计的可以连接的粘性末端互补碱基序列确定了连接的次序和方向。 更重要 的是这些序列可以选择为待组装的DNA片段本来的碱基序列, 不会因为组装的需要引入多 余的碱基序列。 0116 实验扩增用引物序列如表1(从5 到3 方向)。
copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1