《一种基于双向等温延伸的核酸合成方法.pdf》由会员分享,可在线阅读,更多相关《一种基于双向等温延伸的核酸合成方法.pdf(25页珍藏版)》请在专利查询网上搜索。
1、10申请公布号CN104212791A43申请公布日20141217CN104212791A21申请号201310219029422申请日20130603C12N15/1020060171申请人无锡青兰生物科技有限公司地址214200江苏省无锡市宜兴市新街街道兴业路298号72发明人林继伟戴俊彪74专利代理机构南京知识律师事务所32207代理人卢亚丽54发明名称一种基于双向等温延伸的核酸合成方法57摘要本发明涉及一种双向等温延伸的核酸拼接方法。该方法是设立一个延伸体系,延伸体系由一个起始双链,一组相互不同并能有序拼接的寡核苷酸,一个含有连接,聚合和限制性内切酶活性的混合酶,以及与混合酶配套的反。
2、应缓冲液组成;在多种酶的协作下,这些寡核苷酸以起始链为起始进行等温拼接,合成目标DNA长链。本发明具有成功率高、设计简单和操作简单、自动化高等特点,因而具有潜在的低成本优势,对于基因合成的推广,生物工程,生物医学和生物信息学等领域的发展存在潜在的应用价值。51INTCL权利要求书2页说明书13页序列表7页附图2页19中华人民共和国国家知识产权局12发明专利申请权利要求书2页说明书13页序列表7页附图2页10申请公布号CN104212791ACN104212791A1/2页21一种基于双向等温延伸的核酸合成方法,包括以下步骤设立一个延伸体系,延伸体系由一个起始双链,一组相互不同并能有序拼接的寡核。
3、苷酸,一个含有连接,聚合和限制性内切酶活性的混合酶,以及与混合酶配套的反应缓冲液组成;在多种酶的协作下,这些寡核苷酸以起始链为起始进行等温拼接,合成目标DNA长链;所述的寡核苷酸组中的每个寡核苷酸都是带有210个碱基悬挂的发夹结构,发夹结构内部含有一个内切酶识别序列,寡核苷酸的5端没有磷酸化;所述的拼接过程如下连接酶将起始双链与体系中存在的某个发夹结构进行连接,聚合酶延伸使得发夹结构打开,限制性内切酶位点成为双链;限制性内切酶对已经成为双链的位点进行切割;然后延伸按下面3个步骤循环进行,直至合成目标目标DNA长链1连接酶将切割产生的末端与体系中存在的某个发夹结构进行连接;2聚合酶延伸使得发夹结。
4、构打开,限制性内切酶位点成为双链;3限制性内切酶对已经成为双链的位点进行切割。2根据权利要求1所述的方法,其特征在于所述寡核苷酸依次由3部分组成,分别为1DNA短片段,这是目标DNA序列的一部分,会被拼接到最终产物中;2一个内切酶识别序列,以及3一个互补片段,互补片段与DNA短片端的3端互补,互补片段的5端第一个碱基与DNA短片段3端的第N1个碱基对齐,N为210的整数,这N个碱基被称为这个寡核苷酸的悬挂在这个寡核苷酸被拼接后,会产生一个新的悬挂,被称为这个寡核苷酸的新悬挂在一个延伸体系的一组寡核苷酸中,任意两个寡核苷酸的悬挂都是不同的而每个寡核苷酸的新悬挂则与体系中的其中某一个寡核苷酸的悬挂。
5、或新悬挂相互匹配从而实现一组寡核苷酸的有序拼接。3根据权利要求1所述的方法,其特征在于,所述起始双链是一个两端是粘端的线性DNA双链,在拼接反应中,充当延伸起始端;起始双链通过下述3种方法之一产生1在拼接反应体系中直接生成,是由两条相互杂交的被称为起始引物对的寡核苷酸组成,在延伸体系中的聚合酶和限制性内切酶的作用下,产生起始双链;2额外添加的DNA双链,在拼接体系中的内切酶作用下形成起始双链;3额外添加的DNA双链,两端已经是粘端,可以直接用来起始拼接反应。4如权利要求1所述的方法,其特征在于所述的聚合酶为没有35外切酶活性的聚合酶。5如权利要求1所述的方法,其特征在于所述互补片段的长度为63。
6、0个碱基。6如权利要求1所述的方法,其特征在于所述限制性内切酶是指TYPEII型的,切割后的序列是3悬挂的限制性内切酶。7如权利要求6所述的方法,其特征在于,所述限制性内切酶是BTSI,BSRDI。8如权利要求1所述的方法,其特征在于包括以下步骤1)根据目标DNA序列设计并合成起始双链和一组寡核苷酸;2)建立延伸体系,所述延伸体系由一个起始双链,一组寡核苷酸,一个含有连接,聚合和限制性内切酶活性的混合酶,以及与混合酶配套的反应缓冲液组成;在多种酶的协作下,这些寡核苷酸进行等温拼接,合成目标DNA长链;所述寡核苷酸的设计方法如下权利要求书CN104212791A2/2页3(1)将目标DNA双链的。
7、其中一条连续单链记为正链,另一条连续单链记为负链,方向皆为53;(2)设定设计的寡核苷酸发夹结构3端悬挂碱基数为N,N为210的整数,将目标DNA双链分段成多个首尾相接的短片段,所述每个短片段3端的N个碱基序列是唯一的;这些短片段由正链部分和负链部分组成;(3)在上述短片段中选取一段作为起始双链;将位于起始双链与正链5端之间的短片段记为左向延伸短片段,将位于起始双链与正链3端之间的短片段记为右向延伸短片段;(4)以左向延伸短片段正链部分和右向延伸短片段负链部分为基础构建一组寡核苷酸;寡核苷酸的5端不能磷酸化;每个寡核苷酸35依次由下述3部分组成1延伸短片段,2一个I内切酶识别序列,3一个互补片。
8、段,这个互补片段的5端第一个碱基与延伸短片段3端的第N1个碱基对齐并互补,形成发夹结构,该发夹结构3端有N个碱基悬挂。9如权利要求1所述的方法,其特征在于包括以下步骤1)根据目标DNA序列设计一组寡核苷酸;2)建立延伸体系,所述延伸体系由一个起始双链,一组寡核苷酸,一个含有连接,聚合和限制性内切酶活性的混合酶,以及与混合酶配套的反应缓冲液组成;在多种酶的协作下,这些寡核苷酸进行等温拼接,合成目标DNA长链;所述寡核苷酸的设计方法如下(1)将目标DNA双链的其中一条连续单链记为正链,另一条连续单链记为负链,方向皆为53;(2)设定设计的寡核苷酸发夹结构3端悬挂碱基数为N,N为210的整数,将目标。
9、DNA双链分段成多个首尾相接的短片段,所述每个短片段3端的N个碱基序列是唯一的;这些短片段由正链部分和负链部分组成;(3)选取两个相邻短片断之间的分段点作为中心,中心与正链5端之间的短片段记为右向延伸短片段,中心与正链3端之间的短片段记为左向延伸片段。(4)以左向延伸短片段正链部分和右向延伸短片段负链部分为基础构建一组寡核苷酸;寡核苷酸的5端不能磷酸化;每个寡核苷酸35依次由下述3部分组成1延伸短片段,2一个I内切酶识别序列,3一个互补片段,这个互补片段的5端第一个碱基与延伸短片段3端的第N1个碱基对齐并互补,形成发夹结构,该发夹结构3端有N个碱基悬挂。权利要求书CN104212791A1/1。
10、3页4一种基于双向等温延伸的核酸合成方法技术领域0001本发明涉及的是一种核酸合成领域的方法,特别是一种双向等温延伸的核酸拼接方法。背景技术0002随着生物技术和生物医药的发展,对核酸特别是DNA序列的设计和修改正越来越获得重视。传统的基因扩增,克隆,重组和突变方法只能获得自然界已有或接近自然界已有的DNA序列,而DNA的化学合成技术可以合成用户指定的寡核苷酸序列,但由于化学反应的效率和出错率问题,这些寡核苷酸序列通常长度小于120200个碱基要获得几百个甚至几百万个碱基长度的DNA序列,就需要将这些寡核苷酸拼接起来。常见的拼接方法有1基于连接酶的方法下面称为连接酶法,2基于聚合酶的方法聚合酶。
11、法以及基于DNA重组的方法重组法。0003连接酶法是最早出现的DNA拼接技术KHORANAETAL1979SCIENCE20361425SMITHETAL1982NUCLEICACIDSRES10446782EDGEETAL1983NUCLEICACIDSRES11641935。在这个方法中,目标DNA序列被分解成寡核苷酸片段,相邻的片段之间存在重叠,这些片段被化学合成并磷酸化后,就可以自组装成更长的存在缺刻的序列,在连接酶比如,T4DNA连接酶,TAQDNA连接酶,PFUDNA连接酶等的作用下,这些缺口被修复,从而获得目标DNA序列。基于模板的连接酶法USPATNO6110668和固相法US。
12、PATAPPPUBNOS2005/0106606A1,2011/0124055A1是连接酶法的衍生方法。0004在上世纪90年代,出现了聚合酶法DNA拼接技术STEMMERETAL1995GENE1644953HOOVERETAL2002NUCLEICACIDSRES30E43CHERRYETAL2008JBIOCHEMBIOPHYSMETHODS7082022。由于这个方法的简单和快速,使之迅速在DNA合成领域占据了非常重要的位置。在这个方法中,寡核苷酸的设计与连接酶法非常相似,而拼接的过程则非常类似于聚合酶链式反应PCR,在聚合酶如TAQDNA聚合酶,PFUDNA聚合酶等的作用下,相互杂交。
13、的寡核苷酸被聚合延长,在每个温度循环中,寡核苷酸或中间产物都会经历一次变性,退火和延伸的过程,而其长度也会逐渐增加,直至获得全长的序列。这些全长序列可以作为模板用于后续扩增。0005近几年,基于重组和等温的DNA拼接技术正越来越受到欢迎,因为它们操作更加简单。一种基于酵母体内重组的技术GIBSONETAL2009NUCLEICACIDSRES3720698490利用酵母细胞内强大的重组系统来在一步之内拼接寡核苷酸和载体,而另一种基于体外重组的技术被称为吉布森拼接GIBSONASSEMBLYGIBSONETAL2010NATUREMETHODS79013,它利用3种酶即T5外切酶,PHUSION。
14、聚合酶和TAQ连接酶的相互协作,在一步之内将寡核苷酸和载体拼接起来,虽然这种方法严格来说并不是重组,但其能组装DNA末端之间存在几十个碱基重叠的序列,这一点与重组非常相似。上述两种方法与连接酶法或聚合酶法比较起来,省略了温度循环,PCR扩增,割胶纯说明书CN104212791A2/13页5化,限制性内切酶酶切和连接等操作,使得DNA合成变得更加容易自动化。0006以上所有方法都需要用到相互重叠的寡核苷酸,因此都存在一个内生问题,即错误杂交,尤其是当序列中存在重复序列或反向重复序列的时候,这些序列会导致错误连接或错误延伸,甚至完全无法拼接,连接酶法和聚合酶法在拼接时都只用到一种酶连接酶或聚合酶,。
15、但在转化细胞之前,需要更多的步骤即PCR扩增,割胶纯化,限制性内切酶酶切和连接,因而很难用于高通量的合成。而重组法需要用到多种酶的协作如在体外重组中用到了3种酶,而在体内拼接中则利用了细胞内精巧的重组系统,但操作起来更加简单,并且利于自动化。0007本发明提供了一种与重组法一样简单即只要一步拼接即可转化细胞的方法,但并不使用重叠的寡核苷酸,因此可以用于合成几乎任何DNA,包括高GC,低GC和含有重复序列的DNA。发明内容0008本发明的目的在于克服现有技术中的不足,提供一种等温双向生长的基因合成方法。使其方法统一、设计和操作简单,将有利于降低成本和合成周期。0009本发明是通过以下技术方案来实。
16、现的,本发明通过特殊的寡核苷酸序列设计方法,得到一系列用于延伸的包含发夹结构和酶切位点的寡核苷酸链,这些寡核苷酸链在多种酶的协同作用下进行等温生长,合成目标DNA长链。0010本发明的方法,是设立一个延伸体系,延伸体系由一个起始双链,一组相互不同并能有序拼接的寡核苷酸,一个含有连接,聚合和限制性内切酶活性的混合酶,以及与混合酶配套的反应缓冲液组成;在多种酶的协作下,这些寡核苷酸以起始链为起始进行等温拼接,合成目标DNA长链;所述的寡核苷酸组中的每个寡核苷酸都是带有210个碱基悬挂的发夹结构,发夹结构内部含有一个内切酶识别序列,寡核苷酸的5端没有磷酸化;0011所述的拼接过程如下0012连接酶将。
17、起始双链与体系中存在的某个发夹结构进行连接,聚合酶延伸使得发夹结构打开,限制性内切酶位点成为双链;限制性内切酶对已经成为双链的位点进行切割;然后延伸按下面3个步骤循环进行,直至合成目标目标DNA长链00131连接酶将切割产生的末端与体系中存在的某个发夹结构进行连接;00142聚合酶延伸使得发夹结构打开,限制性内切酶位点成为双链;00153限制性内切酶对已经成为双链的位点进行切割。0016所述寡核苷酸依次由3部分组成,分别为1DNA短片段,这是目标DNA序列的一部分,会被拼接到最终产物中;2一个内切酶识别序列,以及3一个互补片段,互补片段与DNA短片端的3端互补,互补片段的5端第一个碱基与DNA。
18、短片段3端的第N1个碱基对齐,N为210的整数,这N个碱基被称为这个寡核苷酸的悬挂在这个寡核苷酸被拼接后,会产生一个新的悬挂,被称为这个寡核苷酸的新悬挂在一个延伸体系的一组寡核苷酸中,任意两个寡核苷酸的悬挂都是不同的而每个寡核苷酸的新悬挂则与体系中的其中某一个寡核苷酸的悬挂或新悬挂相互匹配从而实现一组寡核苷酸的有序拼接。图1显示了一个典型的等法寡核苷酸,这个寡核苷酸的开放端有一个由CT组成的3悬挂,其I内切酶是BTSIGCAGTG,互补片段是8碱基序列GTGAAGTC,与DNA短片段的近3说明书CN104212791A3/13页6部分互补,使整个寡核苷酸闭合成一个稳定的发夹,另外,这个DNA短。
19、片端还有一个内生的发夹,其茎部由5对碱基组成,使得整个发夹更加稳定。0017本发明一个具体的方案,包括以下步骤00181)根据目标DNA序列设计并合成起始双链和一组寡核苷酸;00192)建立延伸体系,所述延伸体系由一个起始双链,一组寡核苷酸,一个含有连接,聚合和限制性内切酶活性的混合酶,以及与混合酶配套的反应缓冲液组成;在多种酶的协作下,这些寡核苷酸进行等温拼接,合成目标DNA长链;0020所述寡核苷酸的设计方法如下0021(1)将目标DNA双链的其中一条连续单链记为正链,另一条连续单链记为负链,方向皆为53;0022(2)设定设计的寡核苷酸发夹结构3端悬挂碱基数为N,N为不小于2的整数,将目。
20、标DNA双链分段成多个首尾相接的短片段,所述每个短片段3端的N个碱基序列是唯一的;这些短片段由正链部分和负链部分组成;0023(3)在上述短片段中选取一段作为起始双链;将位于起始双链与正链5端之间的短片段记为左向延伸短片段,将位于起始双链与正链3端之间的短片段记为右向延伸短片段;0024(4)以左向延伸短片段正链部分和右向延伸短片段负链部分为基础构建一组寡核苷酸;寡核苷酸的5端不能磷酸化;每个寡核苷酸35依次由下述3部分组成1延伸短片段,2一个I内切酶识别序列,3一个互补片段,这个互补片段的5端第一个碱基与延伸短片段3端的第N1个碱基对齐并互补,形成发夹结构,该发夹结构3端有N个碱基悬挂。00。
21、25本发明的另一种具体的方案,具体步骤是00261)根据目标DNA序列设计一组寡核苷酸;00272)建立延伸体系,所述延伸体系由一个起始双链,一组寡核苷酸,一个含有连接,聚合和限制性内切酶活性的混合酶,以及与混合酶配套的反应缓冲液组成;在多种酶的协作下,这些寡核苷酸进行等温拼接,合成目标DNA长链;0028所述寡核苷酸的设计方法如下0029(1)将目标DNA双链的其中一条连续单链记为正链,另一条连续单链记为负链,方向皆为53;0030(2)设定设计的寡核苷酸发夹结构3端悬挂碱基数为N,N为210的整数,将目标DNA双链分段成多个首尾相接的短片段,所述每个短片段3端的N个碱基序列是唯一的;这些短。
22、片段由正链部分和负链部分组成;0031(3)选取两个相邻短片断之间的分段点作为中心,中心与正链5端之间的短片段记为右向延伸短片段,中心与正链3端之间的短片段记为左向延伸片段。0032(4)以左向延伸短片段正链部分和右向延伸短片段负链部分为基础构建一组寡核苷酸;寡核苷酸的5端不能磷酸化;每个寡核苷酸35依次由下述3部分组成1延伸短片段,2一个I内切酶识别序列,3一个互补片段,这个互补片段的5端第一个碱基与延伸短片段3端的第N1个碱基对齐并互补,形成发夹结构,该发夹结构3端有N个碱基悬挂。说明书CN104212791A4/13页70033本发明中由起始双链构建得到的序列记为核心引物,由延伸序列构建。
23、得到的序列记为延伸引物;0034核心引物可由两段部分匹配的单链互为模版延伸后经限制性内切酶切割得到;0035所述的分段所得的短序列其长度在5个碱基以上。0036所述的发夹结构是指在一条DNA线性单链中存在自身相互匹配,而在局部形成双链的一种结构,这种结构的双链部分称为发夹茎部,双链的两侧部分称为环部,闭合的环部称为闭环部分,开放的环部称为开环部分。0037所述的引物是指寡核苷酸链。0038如上所述的寡核苷酸链设计好后,可利用普通的寡核苷酸链自动合成仪合成。0039所述的纯化是指中性聚丙烯酰胺凝胶电泳中性PAGE纯化。0040所述的等温生长,包括以下步骤0041将所有寡核苷酸链混合在反应体系中,。
24、并加入具有聚合酶、连接酶和限制性内切酶三种活性的混合酶;0042所述的反应体系是指可以有效发挥上述三种酶相应活性的体系,通过调节阳离子的浓度和种类,调节体系的PH值等得到。0043所述的聚合酶可以是DNA聚合酶,也可以是RNA聚合酶可以是耐热的,也可以是不耐热的优选无35外切酶活性的聚合酶,如KLENOWEXO,反转录酶等。0044所述的限制性内切酶是指TYPEII型的,优选切割后的序列是3悬挂的限制性内切酶,比如BTSI,MVA1269I等。0045所述的连接酶是指能将两段DNA连接成为一段DNA的酶,优选T4DNA连接酶。0046所述的延伸,在3个步骤的循环间进行00471聚合酶延伸使得发。
25、夹结构打开,限制性内切酶位点成为双链;00482限制性内切酶对已经成为双链的位点进行切割;00493连接酶将切割产生的末端与体系中存在的某个发夹结构进行连接;0050这三个步骤都在同一个温度下进行,温浴时间越长,序列的平均长度越长,直到目标DNA序列产生。0051本发明中,在多种酶的协作下,对这些寡核苷酸进行等温拼接,这些酶包括一种连接酶,一种聚合酶以下记为I聚合酶和一种限制性内切酶以下记为I内切酶;每一个寡核苷酸都被设计成一个带有2个或多个碱基悬挂的发夹结构,需要注意的是,这个寡核苷酸的5端不能磷酸化,因此,当这个寡核苷酸被连接到一个与之匹配的磷酸化粘端比如一个限制性内切酶消化产生的粘端时,。
26、在结合处会形成一个缺刻,这个缺刻在I聚合酶的作用下被补平,使发夹变成双链,从而使得之前设计在寡核苷酸上的I内切酶位点由单链变成双链,成为I内切酶的识别底物,I内切酶在双链上酶切产生一个新的磷酸化粘端,以开始新的一轮拼接;经过多轮的拼接,DNA分子被串行延伸,之间并不需要人为或仪器的干预,这个特点并不见于上述提及的方法中。0052一个线性双链DNA的末端可以是粘端或平末端,在连接酶的作用下,一个平末端可以与其它平末端相互连接,只要这两个平末端中至少有一个末端是磷酸化的。而粘端之间的连接是有选择性的,只有符合以下条件,两个粘端才能被连接。1两个粘端的悬挂部分是按照碱基配对原则即A与T配对,G与C配。
27、对互补的。2两个粘端中至少有一个说明书CN104212791A5/13页8粘端是5磷酸化的3两个粘端的悬挂是同类型的,即同为3悬挂或5悬挂。0053DNA聚合酶对不同的末端会有不同的作用,5悬挂末端或平末端在聚合酶的作用下会被补平或添加一个碱基,这是由于聚合酶的53聚合活性和末端转移酶活性导致的。因此这种末端不适合用于本技术。相反,一个3悬挂的末端可以在聚合酶作用下保持不变,只要这个聚合酶没有35外切酶活性,比如KLENOWEXO聚合酶,PHI29EXO聚合酶,以及各种反转录聚合酶等在本技术中,发夹必须保持不被修改,直至体系中出现一个匹配的末端。0054在同一个拼接体系的发夹之间,其粘端是不相。
28、同的,因此拼接是有序的。对于2碱基悬挂,有16种不同的组合,而3碱基悬挂有64种,因此一个拼接体系中,发夹的数量上限是一定的,如果寡核苷酸的长度是限制的,那么一次拼接所能获得的DNA长度也是一定的。比如对于2碱基悬挂的发夹,如果限定DNA短片端的长度为40个碱基,那么可以拼接得到的最长DNA序列为640碱基。0055对寡核苷酸二级结构的预测在本发明中非常重要。在大多数情况下,一个712个碱基的互补片段可以保证一个寡核苷酸的正确折叠。有些情况下,DNA短片段中存在一个与互补片段相冲突的内生发夹,或者互补片段与DNA短片段中除指定序列外的其它部分也能很好匹配,那么寡核苷酸可能会错误折叠,从而导致延。
29、伸产物不足,甚至延伸失败。为了使寡核苷酸能够正确折叠,二级结构的正确预测是必不可少的,这需要对DNA各种二级结构如双螺旋配对,碱基错配,末端碱基悬挂,发夹环部长度,环部类型等的热动力学参数有一个系统的研究JOHNETAL2004ANNUREVBIOPHYSBIOMOLSTRUCT3341540。此外,还需要一个有效的搜寻算法,能够快速地计算出最稳定结构即含有最低自由能的结构,次稳定结构等,以确保绝大部分分子都能正确折叠由ZUKER等人开发的基于上述设想的软件MFOLDMICHAELZUKER2003NUCLEICACIDSRES31340615已能很好地预测DNA的二级结构通常情况下,在正确折。
30、叠与错误折叠之间保持至少15千焦/摩尔1M氯化钠存在的情况下的自由能差,才能保证大部分寡核苷酸分子的正确折叠。0056在室温下,一个稳定的发夹将很难与另一个单链DNA分子杂交,因为在杂交之前,需要先打开发夹,所以这种杂交反应一般需要几分钟甚至几个小时才能完成ANDREWETAL2003NUCLEICACIDSRES31131930因此,不难断定,发生在两个稳定发夹之间的杂交将更加难以发生在本技术中,一组发夹在反应体系中可以共存很长时间,而不发生显著的杂交,这意味着目标序列被隐藏在稳定的结构中,从而使本技术对DNA序列内容不敏感,可以用于各种复杂序列如含有重复结构,内生发夹的序列,GC含量极端的。
31、序列等的合成在其它技术中经常出现的错误连接或错误延伸也被极大地降低了,使得本技术成为一个高统一性和成功率的DNA合成技术。0057本发明所述的I内切酶需要满足以下几个条件,1其酶切位置位于识别序列的外边这样当酶切完成后,产生的新的延伸末端不会含有I内切酶识别序列上残余的碱基。2酶切产生的末端是3悬挂,而且悬挂碱基数不小于两个碱基。满足上述条件的部分限制性内切酶见表1。0058表1用于本申请的部分限制性内切酶说明书CN104212791A6/13页900590060说明书CN104212791A7/13页100061大部分表1中的内切酶,其酶切位置与识别序列之间的距离要大于5个碱基,它们被称为长。
32、距酶,目前只有4个酶BSRDI,BSTF5I,BTSI和BTSIMUTI的切点与识别序列非常相近,被称为短距酶。短距酶与长距酶相比,有两个优势,1需要合成的碱基数更少,这是因为酶切位置与识别序列之间的碱基不能被拼接到最后的产物中,它们起到的只是填充作用,长距酶需要的填充碱基更多。2酶切位置的精度更高,一些长距酶有时会偏移指定位置发生酶切,这会产生错误粘端。0062需要注意的是,目标序列内部不能出现当前I内切酶识别序列,否则会导致延伸出错有两种方法可以绕开这种限制,1选用合适的I内切酶,在有多种I内切酶可以选择的情况下,绝大部分DNA序列都可以被合成,比如一个非回文的6碱基序列在一般的DNA中出。
33、现的概率是1/2048,那么对于500BP的序列来说,有783的可能性不存在这个6碱基序列,如果有两种I内切酶可以选择,则超过95的随机500BP序列可以被合成2选择合适的分段方案,一般来说序列越长,一次性拼接成功的可能性越小,所以一般稍长的DNA序列都需要经过不止一轮的拼接才能得到,本技术一般用于第一次的拼接,合适地分段可以避开I内切酶在序列内部出现,而刚好断在I内切酶识别序列中间,则可以破坏这个识别序列。通过上述两种方法,几乎所用序列都可以被合成。0063拼接反应由一个起始双链开始,这个起始双链可以是额外添加的,也可以是体系内部生成的。一个起始双链一般是一个两端是粘端的线性DNA双链,在拼。
34、接反应中,充当延伸起始端。有3种方法可以产生起始双链1在拼接反应体系中直接生成,这通常是由两条相互杂交的被称为”起始引物对”的寡核苷酸组成图2A,在拼接体系中的聚合酶和限制性内切酶的作用下,产生起始双链2额外添加的DNA双链,在拼接体系中的I内切酶作用下形成起始双链图2B,3额外添加的DNA双链,两端已经是粘端,可以直接用来起始拼接反应图2C。起始双链的粘端的5端必须是磷酸化的,而且起始双链内部不说明书CN104212791A108/13页11能含有当前I内切酶识别序列,除非这些I内切酶识别序列预先被修饰保护了,如被甲基转移酶在相应位置甲基化,从而阻止I内切酶的酶切。0064延伸的过程可以分为。
35、两种模式(图3),分别为从里到外模式里外模式和从外到里模式外里模式,在里外模式中,起始双链由起始引物对延伸而得,延伸的方向是从目标序列中间向5端和3端延伸而在外里模式中,延伸方向刚好相反,是从目标序列的5端和3端向内延伸,最后在序列的中间发生连接,从而得到一个环化的DNA分子。在外里模式中,起始双链一般是一个线性载体,经过延伸之后,环化的载体可以直接转化细胞图3G,无需进行温度循环,扩增,纯化,酶切以及连接等连接酶法和聚合酶法中通常用到的步骤。0065在里外模式中,起始引物对的两端分别起始目标DNA序列的半边合成即左半边和右半边,目标DNA序列被分段成DNA短片段图3,每个相邻短片端之间重叠的。
36、碱基数取决于I内切酶酶切末端的悬挂长度,如BTSI酶切产生2个碱基的3悬挂,那么DNA短片端之间重叠两个碱基唯一的例外是起始引物对,它们需要重叠5个碱基以上,以形成足够被聚合酶延伸的稳定的杂交左半边的DNA短片段即图3中正向的箭头”,其序列来自目标序列的正链即图3中目标序列的上链,而右半边来自负链即目标序列下链,不过,在外里模式中,情况正好相反,左半边DNA短片段来自负链,而右半边来自正链0066在外里模式中,起始双链通常是一个线性载体,其两端的粘端可以是I内切酶产生的,也可以是其它限制性内切酶消化而成的,如果是后者,那么在设计发夹的时候,必须将第一条和最后一条寡核苷酸的发夹粘端设计成与酶切粘。
37、端相同,比如当I内切酶为BTSI时,除了第一条和最后一条寡核苷酸,其它寡核苷酸都会有一个2碱基的3悬挂,如果起始双链的粘端由BGLIGCCNNNNNGGC消化而成,那么第一条和最后一条寡核苷酸的粘端是3个碱基的。使用3碱基粘端的好处是可用粘端由16种增加到18种。0067在里外模式中,拼接产物不能直接转化细胞,而是必须被扩增并连接到载体后才能转化细胞这一点与连接酶法和聚合酶法类似扩增所用的引物可以是拼接所用寡核苷酸的首末两条,也可以单独设计。0068值得注意的是,这里所说的目标DNA的中间,并不是精确的序列中心点,而可以是序列内部的任意位置位于左半边和右半边的寡核苷酸数目也并不一定要相等,比如。
38、,目标序列需要用6个寡核苷酸来拼接,那么左右两边寡核苷酸的数量可以是1,5,2,4,3,3,4,2或5,1这几种组合,当然一般3,3组合是最常被用到的。0069本发明的拼接过程由以下几个步骤组成0070设立一个延伸体系,由一个起始双链,一组寡核苷酸含有或不含有起始引物对,一个含有连接,聚合和限制性内切酶活性的混合酶,以及与混合酶配套的反应缓冲液组成。0071将延伸体系置于一个温度中,在这个温度下,混合酶的各种成分应该都具有相当好的活性,比如2737,特别是33温育时间通常是05小时到20小时之间,这取决于目标序列的长度和所设计的寡核苷酸的质量。通常情况下,33过夜温育可以获得很好的结果。007。
39、2在外里模式中,如果起始双链是一个载体,那么延伸结构就可以直接转化细说明书CN104212791A119/13页12胞当然也可以被扩增后再克隆。0073混合酶中的连接活性由T4DNA连接酶提供,用量为0011个WEISS单位每微升反应体系,特别是00503WEISS单位每微升反应体系T4DNA连接酶需要ATP才能发挥连接活性,所以体系中还需要存在至少001毫摩尔每升的ATP。原理上,其它连接酶如大肠杆菌连接酶也可以代替T4DNA连接酶。0074混合酶中的聚合活性必须符合以下几点1没有35外切酶活性,否则寡核苷酸无法稳定地存在与体系中2在2040之间有很好的活性2具有链置换活性,它需要能将互补片。
40、段从发夹茎部推开符合以上条件的聚合酶有KLENOWEXO聚合酶,PHI29EXO聚合酶以及大部分反转录聚合酶如MMLV和AMV反转录聚合酶特别是KLENOWEXO聚合酶,其工作浓度为000102单位每微升反应体系,特别是0005005单位每微升反应体系反应体系中需添加每种1200微摩尔每升的DNTP。0075混合酶中的限制性内切酶活性用量取决于I内切酶的种类,对于BTSI来说,需要011单位每微升反应体系,而对于BSRDI来说,则需要00102单位每微升反应体系其它I内切酶的用量可以经过实验后测定。0076反应体系中的缓冲液包含缓冲剂和盐,一个较好的缓冲液由10毫摩尔每升的醋酸镁,45毫摩尔每。
41、升的醋酸钾以及30毫摩尔每升的TRIS醋酸PH78组成醋酸钾的浓度可以是0100毫摩尔每升范围内调节,TRIS醋酸的浓度也可以在10100毫摩尔每升之间调节,其PH可以在7490之间调节。0077在外里模式中,延伸结果在转化细胞之前可以作一个PCR鉴定,取01微升的延伸结果,作25个循环的PCR反应,一般可以获得目标条带,如果存在目标条带,那么转化106CFU/G的感受态大肠杆菌一般都可以获得足够的菌落数。0078本发明具有成功率高、设计简单和操作简单、自动化高等特点,因而具有潜在的低成本优势,对于基因合成的推广,生物工程,生物医学和生物信息学等领域的发展存在潜在的应用价值。附图说明0079图。
42、1一个典型的发夹结构0080图2双向等温延伸法基因合成流程0081图3双向等温延伸法基因合成的两种模式具体实施方式0082实施例1用里外模式合成一段412碱基的序列,这是LAMBDA外切酶基因的一部分0083序列如下SEQIDNO100845TCACAACGTGATAGCAAAACCCCGCTCCGGAAAGAAGTGGCCTGA0085CATGAAAATGTCCTACTTCCACACCCTGCTTGCTGAGGTTTGC0086ACCGGTGTGGCTCCGGAAGTTAACGCTAAAGCACTGGCC0087TGGGGAAAACAGTACGAGAACGACGCCAGAACCCTGTTTG。
43、0088AATTCACTTCCGGCGTGAATGTTACTGAATCCCCGATCATC说明书CN104212791A1210/13页130089TATCGCGACGAAAGTATGCGTACCGCCTGCT0090CTCCCGATGGTTTATGCAGCGACGGCAACGGCCTTGAACTGAA0091ATGCCCGTTTACCTCCCGGGATTTCATGAAGTTCCGGCTCGGT0092GGTTTCGAGGCCATAAAGTCAGCTTACATGGCCCAGGTGCAGTA0093CAGCATGTGGGTGACGCGAAAAAATGCCTGGTACTTTGCCAAC30094拼。
44、接过程如下0095步骤10096将目标序列分段成10个DNA短片段表2。0097表200980099步骤20100将这些DNA短片段L1L5,R1R5分别组装成发夹HL1HL1,HR1HR5(表3),在每个短片段的5端添加一个BTSI识别序列和一段互补序列;发夹的茎部(互补序列)被下划线突出显示。0101表30102说明书CN104212791A1311/13页1401030104步骤30105合成表3中的寡核苷酸。0106步骤40107用双向等温延伸法拼接以上寡核苷酸,反应体系由以下部分组成010801M的HL5ANDHR1以及001M的其它寡核苷酸0109002U/L的KLENOWEXO聚。
45、合酶NEB。011001WEISSU/UL的T4DNA连接酶TAKARA,DALIAN011105U/L的BTSINEB01121MMATP0113200MEACHDNTPS011450MMKCL01155MMMGCL2011610MMTRISHCLPH9001171MMDTT0118经过2小时的33温育,01微升的延伸结果被用作模板进行PCR扩增,PCR引物为HL1和HR5扩增结果被克隆并测序,测序结果显示拼接正确。0119实施例2用外里模式合成一段366碱基的磷脂酶基因0120其序列如下(SEQIDNO12)01215AGCCTGCTGGAATTTGGGCGTATGATCAAGGAGGAG。
46、ACGGGGAAAAACCCTCTTTCCTCCTACATCTCTTACGGATGCTACTGTGGCTGGGGGGGCCAAGGCGAGCCAAAGGACGACACCGACCGTTGCTGCTTTGTGCACGACTGCTGTTACGGAAAACTGTGGGGCTGCAGCCCAAAAACGGACATTTACTTCTACTTCCGTAAGAACGGGGCTATCGTCTGCGGACGTGGCACCTGGTGTGAGAAGCAGATTTGTGAGTGTGACAAGGCCGCCGCAATCTGCTTCCGTGAGAATCTGGCCACGTACAAAGAAGAATATCACTCTTACGGGAAG。
47、TCTGGTTGCACGGAGAAGTCACCGAAATGC3说明书CN104212791A1412/13页150122起始双链是一个经过BGLI消化的PJW载体,PJW载体是经过改造的PUC19载体,经过突变处理去除了其上面的BTSI和BGLI位点,并在多克隆位点引入了两个BGLI位点,经过BGLI酶切后,这个线性载体的两端分别为AGG和GGT的3悬挂粘端。0123设计的寡核苷酸见表4。0124表401250126寡核苷酸OL1有一个CCT的三碱基3悬挂,与载体一端的AGG可以实现连接,OR4有一个ACC3悬挂,可以与载体另一端的GGT粘端连接在延伸的最后阶段,OL5和OR1被拼接上并皆酶切。
48、产生CG粘端,可以相互连接从而环化载体0127拼接体系如下0128101M的每种寡核苷酸012925纳克的起始双链01303002U/LKLENOWEXO0131401WEISSU/LT4DNALIGASE0132505U/LBTSI013361MMATP0134710MEACHDNTPS0135845MMKAC说明书CN104212791A1513/13页160136910MMMGAC201371030MMTRISACETATEPH78111MMDTT121BSANEB0138经过过夜33温育,2微升的延伸结果被用来转化大肠杆菌,菌落PCR鉴定克隆片段的长度,含有正确长度的菌落被测序,测序结果显示拼接正确。说明书CN104212791A161/7页1700010002序列表CN104212791A172/7页180003序列表CN104212791A183/7页190004序列表CN104212791A194/7页200005序列表CN104212791A205/7页210006序列表CN104212791A216/7页220007序列表CN104212791A227/7页23序列表CN104212791A231/2页24图1图2说明书附图CN104212791A242/2页25图3说明书附图CN104212791A25。