相关申请的交叉参考
本申请要求2008年2月15日提交的美国申请序列号61/029,312;2008年2月15日提交的U.S.61/064,107;2008年5月12日提交的U.S.61/052,614;2008年9月18日提交的U.S.61/098,202;和2008年12月31日提交的U.S.61/142,101的权益。这些申请的内容通过引用全部并入本文。
技术领域
本发明涉及体外连接单链和/或双链核酸分子的方法,其允许有效地一步装配多个具有重叠末端序列的核酸分子。本发明方法在实施系统组合装配核酸序列变体片段以修饰被连接核酸序列的性质中是特别有用的,核酸序列例如提供密码子使用、控制序列、基因、途径、染色体、染色体外核酸和基因组的变体的核酸序列。
背景技术
基于循环变温仪的两步法被用来装配部分生殖道枝原体(M.genitalium)基因组,如Gibson,D.G.等,“Complete chemical synthesis,assembly,and cloning of a Mycoplasma genitalium genome.”Science(2008)319:1215-1220中所述。Li,M.Z.等.,Nature Meth.(2007)4:251-256描述了另一种方法。采用T7 5′核酸外切酶和单链DNA结合蛋白的单步装配方法公开在PCT公开WO2006/021944中。本发明公开了一步方法,其促进DNA分子在体外的装配。这些方法采用缺少3′核酸外切酶活性的非热稳定5′核酸外切酶或在dNTP存在的情况下起作用的3′核酸外切酶。
这些新方法在本发明的另外的方面中是特别有用的,其提供系统组合装配以修饰核酸分子。用于高通量筛选中的化学化合物装配的组合技术这时已经被充分建立。另外,基因改组技术——其中编码序列被随机片段化和再退火——已经实践了许多年。例如,用以创建嵌合基因片段文库的方案描述在Meyer,M.等,“Combinatorial Recombination of Gene Fragments to Construct a Library of Chimeras”Current Protocols in Protein Science(2006)26.2.1-26.2.17;McKee,A.E.等,JBEI摘要中。然而,对于组合方法的系统方法存在需求,其不依赖随机重排或改组以提供优化的核酸序列,例如,具有优化的编码序列或代谢途径的优化的核酸序列,所述优化的核酸序列可以根据期望的性质进行选择。本发明通过提供用以装配多种感兴趣核酸的系统组合方法而满足了该需求。
用于将各种组分装配到全基因组或最小基因组中的技术已经被创立。例如,2007年11月15日公布的美国专利公开2000/0264688描述了构建合成基因组的方法,其通过产生和装配包含部分基因组的序列盒进行。装配核酸的逐步分级方法描述在2007年1月4日公布的美国专利公开2007/004041中。然而,没有表明系统地使用这些技术来装配期望的核酸分子。
可以理解的是,基因组的构建不需要包括所有天然存在的组分。PCT公开WO2007/047148描述了基于生殖道枝原体的最小基因组,其中多达101个编码蛋白的基因可以被省略并且仍保持生存力。没有表明最小基因组的组分被系统装配为允许形成多种可选最小基因组的组合文库。
因此,本发明涉及系统方法和其产物,其允许核酸分子的有效和广泛修饰以便以高通量的方式提供和筛选感兴趣的核酸装配物,并且容易适应机器执行。在可选的实施方式中,与在反应管中相对,装配反应可以在固体表面上进行,例如,在使用微观流体的芯片上(如Huang,Y.等,Lab Chip(2007)7:24-26中所显示)。
用于系统组合装配核酸——其代表(表现)变体编码序列、表达系统、途径合成和最小或较大基因组——的技术至少部分采用体外装配技术。可以采用任何适合的体外装配技术;然而,本发明的方法包括对本领域中已经描述的那些方法的改进。
发明内容
在第一方面,本发明提供连接一组两个或更多个双链(ds)或单链(ss)DNA分子的体外方法。待被连接的邻近DNA分子在其末端处含有重叠序列。两个或更多个DNA分子在有效连接所述两个或更多个DNA分子以在一步反应(one-step reaction)中形成第一装配dsDNA分子的条件下在单个容器中在体外与(a)分离的非热稳定5′至3′核酸外切酶——其缺少3′核酸外切酶活性,(b)群集剂,(c)分离的热稳定非链置换DNA聚合酶(non-strand-displacing DNA polymerase)——其具有3′核酸外切酶活性,或所述DNA聚合酶与缺少3′核酸外切酶活性的第二DNA聚合酶的混合物,(d)分离的热稳定连接酶,(e)dNTP的混合物,以及(f)适合的缓冲液接触。
在一些实施方式中,(a)的核酸外切酶是T5核酸外切酶并且接触是在等温条件下进行,和/或(b)的群集剂是PEG,和/或(c)的非链置换DNA聚合酶是PhusionTMDNA聚合酶或VENTDNA聚合酶,和/或(d)的连接酶是Taq连接酶。
在一些实施方式中,所述条件也适于在连接反应后消化任意不成对的、非同源的、单链DNA。待被连接DNA分子中至少一些在一个末端包含与任意感兴趣的DNA分子不同源的序列。任选地,非同源序列包含一个或更多个PCR引物的结合区域,和/或与载体序列具有同源性的区域,和/或一种或更多种在感兴趣的DNA分子中不存在的限制酶例如罕见切割限制酶的识别位点。
所述方法可以用来将第二组两个或更多个DNA分子彼此连接以获得除第一装配分子之外的第二装配DNA分子,并且连接第一和第二装配DNA分子以获得第三装配ds DNA分子。该过程可以按需要不断被重复,以获得感兴趣的全核酸序列。
本发明还提供用于进行上述方法的试剂盒,其包含适当量的:(a)分离的非热稳定5′至3′核酸外切酶——其缺少3′核酸外切酶活性,(b)群集剂,(c)分离的热稳定非链置换DNA聚合酶——其具有3′核酸外切酶活性,或所述DNA聚合酶与缺少3′核酸外切酶活性的第二DNA聚合酶的混合物,以及(d)分离的热稳定连接酶。例如,所述试剂盒可以含有T5核酸外切酶、PEG、PhusionTM DNA聚合酶和Taq连接酶。
在第二方面,本发明涉及连接一组两个或更多个双链(ds)或单链(ss)DNA分子的可选的体外方法,其中待被连接的邻近DNA分子在其末端处含有重叠序列。所述方法包括将两个或更多个DNA分子在有效连接所述两个或更多个DNA分子以在一步循环变温反应(one-step thermocycled reaction)中形成第一装配dsDNA分子的条件下在单个容器中在体外与(a)分离的非热稳定3′至5′核酸外切酶——其在dNTPs存在的情况下有活性,(b)群集剂,(c)分离的热激活(heat-activated)DNA聚合酶,(d)分离的热稳定连接酶,(e)dNTPs的混合物,以及(f)适合的缓冲液接触。
在该方面的一个实施方式中,(a)核酸外切酶是核酸外切酶III,和/或(c)的聚合酶通过去除以热敏方式与所述聚合酶结合的失活部分而被热激活,和/或(b)的群集剂是PEG,和/或(d)的连接酶是Taq连接酶。(c)的DNA聚合酶可以是AMPLITAQ GOLD。
该方法也可以用来获得能与第一装配组结合的第二装配组的DNA分子。循环变温一步方法和上述等温方法的任意组合可以用于多个组的DNA分子的装配并且两者中任意一种均可以用于装配组中较大DNA分子的后续装配。
上述方法的组分可以作为试剂盒被提供,所述试剂盒在单个容器中包含一定量的:(a)分离的非热稳定3′至5′核酸外切酶,其在dNTPs存在的情况下有活性,(b)群集剂,(c)分离的热激活DNA聚合酶,(d)分离的热稳定连接酶,(e)dNTPs的混合物,以及(f)适合的缓冲液,所述的量使得当所述两个或更多个DNA分子在适合的缓冲溶液和dNTPs存在的情况下被添加到试剂盒和在循环变温条件下温育时,所述两个或更多个DNA分子在协同反应(concerted reaction)中被装配。在该方面的一个实施方式中,所述试剂盒包含(a)核酸外切酶III、(b)PEG、(c)AMPLITAQ GOLDDNA聚合酶和(d)Taq连接酶。
用于第一和第二方面的公开方法中的物质的任意组合可以一起被包装成用于进行任意一种公开方法的试剂盒。例如,试剂盒可以包含含有装配ssDNA分子(例如,寡核苷酸)或dsDNA分子所需的所有试剂的混合物。
在第三方面,本发明提供修饰全核酸分子的性质的方法。该方法包括:(a)将所述全核酸分子的核酸序列沿其长度代表性地分成多个部分,从而鉴定部分核酸分子的序列;(b)对于至少3个所述部分核酸分子提供每个部分核酸分子的多个变体;(c)将所述变体与没有被改变的任意部分核酸分子在体外组合装配在一起,其中所述部分核酸分子或其变体在其末端处含有重叠序列,由此所述部分核酸分子和其变体在混合物中的装配将导致全核酸分子的多个变体的装配;以及(d)表达全核酸分子的变体,以确定所述全核酸分子的所述变体的任意被修饰性质。
步骤(c)的装配可以通过上述方法中任一种进行——尽管也可以使用可选的连接方法。例如,可以使用多步体外方法,或者可以使用体内方法,诸如PCT申请PCT/US2008/079109中所描述的那些方法。尽管体外装配方法一般对于寡核苷酸更加方便,但是体内装配方法也可以是可使用的替代物。
一种可以应用的装配方法包括如下步骤:(a)将所述变体以及没有被改变的任意部分核酸分子与非加工5′核酸外切酶;以及与(b)促进核酸退火的单链DNA结合蛋白(SSB);以及与(c)非链置换DNA聚合酶;以及与(d)连接酶接触,其在有效连接变体和没有被改变的部分核酸分子以导致全核酸分子的多个变体装配的条件下进行。
在一个实施方式中,该方面包括将全核酸分子的核酸序列分成至少5个部分,所述至少5个部分可以使用本发明的体外方法被有利地装配。在其它实施方式中,部分核酸分子变体提供由部分核酸分子编码的一个或更多个氨基酸的密码子的简并形式。可选地,部分核酸分子的变体提供多个核酸控制序列,其影响全核酸分子的转录和翻译。作为另一选择,部分核酸分子的变体提供编码由全核酸分子编码的肽或蛋白的结构域或基序的多个区域。作为又一选择,由所述部分核酸分子编码的肽或蛋白在代谢途径中一起起作用。
上述各种重组方法可以用来构建任何期望的装配物,诸如质粒、载体、基因、代谢途径、最小基因组、部分基因组、基因组、染色体、染色体外核酸,例如细胞质的细胞器,诸如线粒体(动物),和叶绿体和质体(植物),等等。对于大DNA分子的装配,最终步骤可以在体内进行,其中酵母是优选的宿主。装配步骤的体外和体内操作之间的平衡由与被装配的DNA分子的性质有关的方法的实用性确定。
本发明进一步包括由上述方法获得的DNA分子文库,和使用被修饰的整个DNA分子的方法。文库——其含有2个或更多个变体,但通常是多个变体,如20、100、1000或更多个——可以被筛选,以获得具有期望特征,如期望产物的高水平产生、产物的功能提高、或功能降低(如果是有利的)的成员。这类筛选可以通过高通量方法进行,其可以是机器操作的/自动化的。
本发明还进一步包括由本发明方法制备的产物,例如所得到的装配合成基因或基因组和被修饰的优化基因和基因组,以及其应用和产品。
本发明的重组方法具有很广泛的应用,其可以例如设计有用产物的合成途径,所述有用产物包括药物、生物燃料、诊断剂(diagnostics)、兽医产品、农业化学品、生长因子等等-即,可以在细胞培养物中或在转基因动物或植物中装配的任意分子。作为简单的实例,大肠杆菌(E.coli)的乙酸途径可以被改造成产生生物燃料,如乙醇、丁醇等等。有关次级代谢物如聚酮化合物的合成途径的酶也可以使用本发明的方法进行优化。因此,由本发明的系统组合方法得到的DNA分子可以用于广泛的背景中,以产生有用的产物。
附图说明
图1A是使用T4聚合酶的两步循环变温(热循环)体外装配的示意图。
图1B显示了使用图1A中所示的方法在5%PEG-8000存在(+)或不存在(-)的情况下实施的8个核酸片段的装配结果,每个核酸片段均在5.3kb至6.5kb之间并具有240至360bp重叠序列。
图1C显示了使用图1A中所示的方法在PEG-8000存在的情况下4个核酸片段的装配结果,每个核酸片段为5kb并具有40bp重叠序列。
图1D显示了由2个四分之一基因组片段装配生殖道枝原体二分之一基因组(310kb)的结果,所述基因组片段为144kb and 166kb并具有257bp重叠序列。
图1E显示了由4个四分之一基因组片段装配全合成生殖道枝原体基因组的结果,所述基因组片段均为~150kb并具有80至257bp重叠序列。
图2A是用于分析修复装配反应成功策略的示意图。在甲酰胺(+F)存在的情况下dsDNA被变性成ssDNA,并且如果发生修复,ssDNA保持较高分子量不变。
图2B显示了用于分析使用图1A中所示方法装配的产物的图2A方法的结果。
图3显示了连接4个DNA片段的修复装配产物滚环扩增(RCA)的结果,其显示仅修复装配产物被扩增。
图4A是使用核酸外切酶III的一步循环变温体外装配示意图。
图4B显示了使用图4A中所示方法的4个不同核酸片段的2个装配物的结果,所述4个不同核酸片段每个均为~5kb并具有300bp或40bp重叠序列。
图4C显示了图2A中所示的那对装配产物修复的分析结果。
图5A是使用T5核酸外切酶的一步等温体外装配的示意图。
图5B显示了使用图5A中所示方法装配2个核酸片段的结果,所述2个核酸片段为4,024bp和2,901bp,具有~450bp重叠序列并掺入NotI限制酶序列。
图5C显示了图5B中所示产物的Not I消化结果。
图5D显示了使用图5A中所示方法将3个每个为~5kb的核酸片段与~8kb具有40bp重叠序列的载体序列装配在一起的结果。
图5E显示了DNA的代表性结果,所述DNA由转化有图5D中所示装配产物的大肠杆菌纯化得到并且用Not I进行消化以从载体释放装配片段。
图6A-6D显示了图1A(T4聚合酶)、图4A(核酸外切酶III)和图5A(T5核酸外切酶)所示方法的直接比较结果。
图6A显示了使用上述各种装配方法将5.9kb至6.2kb具有80bp重叠序列的4个核酸片段与~8kb具有80bp重叠序列的载体装配在一起的结果。
图6B显示了DNA的代表性结果,所述DNA由转化有图6A中所示装配产物的大肠杆菌纯化得到并且用NotI进行消化以从载体释放装配片段。
图6C显示了使用上述各种装配方法将生殖道枝原体的2个四分之一基因组与~8kb具有80bp重叠序列的载体装配在一起的结果。
图6D显示了DNA的代表性结果,所述DNA由转化有图6C中所示装配产物的大肠杆菌纯化得到并且用NotI进行消化以从载体释放装配片段。
图7A示意性说明了密码子优化在创建装配片段组合文库中的应用。
图7B示意性说明了多种基序和结构域变体在创建基因组合文库中的应用。
图7C示意性说明了变体基因在创建代谢途径组合文库中的应用。
图8A是乙酸利用途径的示意图。
图8B示意性说明了来自5个生物体的变体基因与4个控制序列一起在创建图8A所示乙酸利用途径组合文库中的应用。
图8C示意性说明了图8B中所示核酸片段的装配策略。
图8D显示了图8C中所示的示例性乙酸利用途径的装配结果,其显示通过限制酶消化由载体释放的装配产物。
图9A-9F显示了使用图5A中所示方法(T5核酸外切酶)连续装配全小鼠线粒体基因组。
图9A显示了在15个涵盖整个小鼠线粒体基因组的反应中装配5个300bp片段的结果。
图9B显示了图9A所示反应产物的扩增结果。
图9C显示了在3个涵盖整个小鼠线粒体基因组的反应中装配5个图9A中所示1,180bp反应产物的结果。
图9D显示了图9C中所示反应产物的扩增结果。
图9E显示了在载体构建物中由3个图9C中所示5,560bp反应产物最终装配整个小鼠线粒体基因组的结果。
图9F显示了在去除载体序列和再环化之后最终装配图9F中所示整个小鼠线粒体基因组产物的结果。
具体实施方式
定义
如本文所用,单数形式“一个(a)”、“一个(an)”和“所述(the)”包括复数指示物,除非上下文另外清楚地指明。
如本文所用,术语“约”指加或减20%。因此,“约”30分钟包括24-30分钟。当指核酸的长度、温度等时,“约”也指的是加或减20%。如本文所用,范围的端点包括在该范围内。当加或减20%导致不可分割单元如核苷酸的非整数值时,技术人员将了解,其应当将该值四舍五入成最近的整数。例如,约8个核苷酸并不是6.4至9.6个核苷酸,而应当被解释为6至10个核苷酸。
术语“活性温度”指的是这样的温度:在该温度以上,DNA聚合酶比核酸外切酶(即,核酸外切酶III)明显更加有活性,以便核酸外切酶(即,核酸外切酶III)最初产生的单链突出端的长度净减少。
在本发明的“体外”实施的那些方法中,所有蛋白组分均被分离和/或基本上纯化。体外装配反应无法在活细胞中或用粗细胞提取物实施;所述反应在无细胞的环境中实施。
通过本发明的方法进行DNA分子的“连接(joining)”在本文中有时被称为DNA分子的“重组”或“装配”。
根据本发明,基因水平上的优化通过不连续组分(discrete components)的设计以系统化方式来实现。在所有上述组合的水平上这是真实的。本发明方法从而避免了现有技术方法的随机性(random nature)。
核苷酸装配的方法
简要地,当待被连接DNA分子为双链时,优选的方法包括将所述DNA分子与如下温育:(a)核酸外切酶(例如,非加工核酸外切酶),其“嚼回(回嚼,咀嚼chews-back)”双链DNA分子的末端,以暴露包含重叠区域的单链突出端;(b)群集剂,如PEG,其促进核酸退火以及发挥其它功能,以便单链突出端被特异性地退火(杂交);(c)非链置换DNA聚合酶,其通过延伸被退火区域的3′末端而填补被退火分子中剩余的单链缺口;以及(d)热稳定连接酶,其封闭(连接)所形成的切口。对于单链分子,(a)的核酸外切酶可以但不必被省略。
当待被连接DNA分子是单链时,单链DNA分子(例如,约40-60个碱基的寡核苷酸,在本文中也被称为核苷酸或nt)经由其末端处具有同一性的序列(例如,约20个碱基)进行退火,以形成带缺口的分子。核酸外切酶活性可以对这些带缺口的分子起作用,以增加缺口的大小。带缺口的分子然后用上述聚合酶和连接酶进行修复,以形成双链分子。
本发明新型的一步方法可以用来同时连接大量DNA分子。为了实现它,待被连接DNA分子被设计以便对于每对待被连接DNA分子在其末端处含有重叠序列-即,一个DNA分子的远端区域包含与另一DNA分子的近端区域具有独特序列同源性(例如,同一性)区域。远端和近端是针对分子链一端处随意的参照点而言,例如,对于参照物X,
A表示近端区域以及B表示远端区域。为了促进DNA分子以预先确定的方向和顺序连接,每组序列同一性的远端和近端区域被选择(设计)成独特的(以不同于另一对DNA分子的序列同一性区域)。所述方法允许许多DNA分子在单个反应混合物中和在单个容器中被连接。明显的是,同源性区域在一些情况下是互补的。术语“序列同一性区域”既包括相同的序列又包括互补的序列。
在本发明的方法中,一对待被连接ds DNA分子其中一个的远端区域与另一dsDNA分子的近端区域共享序列同源性(例如,序列同一性)区域。如本文所用,术语“远端”指待被连接的一对中第一DNA分子的3′端(5′-大部分DNA分子),以及术语“近端”指这对中第二DNA分子的5′端。同源性区域在本文中有时被称为“重叠”、“重叠序列”或“重叠区域”。如本文所用,“序列同源性(同一性)区域”指双链DNA分子的两个链。因此,该区域的一个链可以与其互补的链特异性地杂交,例如,当待被连接的两个分子的远端和近端区域的单链突出端中存在互补区域时。
在一个实施方式中,被连接DNA分子是合成产生的DNA分子,其可以彼此邻近地位于感兴趣的基因或基因组中。例如,第一组约8个60-mer单链寡核苷酸(oligonucleotides)(寡核苷酸(oligos))——其在任一末端处具有20个碱基的序列同一性区域,可以以适当的顺序和方向连接,以形成300bp的dsDNA。第二组类似数量的大约相同大小的邻接DNA分子也可以被连接;然后在第二阶段装配中,这两组被连接的分子彼此连接。对于更多组DNA分子所述过程按期望被重复许多个循环。以这种方式,所有或几乎所有已经合成产生的基因或基因组的组成成员可以在连续的步骤中被连接,以形成完全的基因或基因组。
本发明方法的优势包括使用充分表征的、分离的(例如,基本上纯化的)酶在明确的条件下进行连接反应的能力。这允许控制和重复连接反应。在本发明的方法中,连接过程不遭受反应混合物中其它酶如可以存在于细胞或细胞提取物中的核酸外切酶和核酸内切酶引起的竞争反应。本发明的连接方法精确、廉价、需要非常少的样品处理并且可以在单个容器中快速地完成(例如,在约15分钟至1小时之间,诸如在约15至约30分钟之间)。如果期望,所述方法中的步骤可以通过机器操作来实施,而不需研究者介入。
本发明方法的其它优势包括如下:以限定的顺序和方向连接DNA分子的能力,这允许例如将一个或更多个感兴趣的片段以限定的方向克隆到线性化的载体中;或允许装配感兴趣的较长序列的组成性DNA部分(如装配合成基因或基因组的组成部分);或允许装配和克隆太大而无法使用PCR扩增步骤克隆的DNA的亚片段。所述方法允许技术人员连接和/或克隆感兴趣的DNA分子,而不必依赖待被连接片段末端处限制酶识别位点的存在。所述体外方法也允许技术人员装配这样的DNA:所述DNA不稳定或另外对抗体内克隆,从而难以通过要求转化到细菌中和在细菌中复制的方法进行克隆。如果期望,由本发明方法装配的DNA然后可以在体外扩增(例如,通过多重置换扩增(MDA),如滚环扩增(RCA);或通过PCR),也不需通过细菌传代所述DNA。如果期望,DNA分子可以在载体存在的情况下进行装配,以便在装配完成后克隆的序列可以直接转化到适合的宿主细胞中。
这些方法可以被不断重复,以装配越来越大的分子。例如,本发明的方法可以包括重复上述方法以将第二组两个或更多个感兴趣的DNA分子彼此连接,然后再次重复所述方法以连接第一和第二组感兴趣的DNA分子,等等。在这些多轮装配过程中的任何阶段,装配的DNA可以通过将其转化到适合的微生物中而扩增或者其可以在体外扩增(例如,采用PCR或滚环扩增(RCA))。
在本发明的一个方面,感兴趣的DNA分子是长度为约40-60个碱基的单链寡核苷酸,并且序列同一性区域由不多于20个碱基组成。在本发明的其它方面,感兴趣的DNA分子是长度至少约100、200、500、1,000、5,000、10,000、50,000、100,000、200,000、500,000或1×106bp的双链DNA分子。在这些dsDNA分子中序列同一性区域可以包括至少约20、30或40个核苷酸(nt),例如,至少约80、300、500或更多个nt。
本发明的方法可以用来在单个协同反应中连接至少约8个DNA寡核苷酸(oligonucleotides)(寡核苷酸(oligos)),例如多达约100个寡核苷酸,以产生一个毗连DNA。在单个容器中,许多此类协同反应可以同时发生。例如,在单个容器中,数百个反应可以同时进行,在每个反应中装配8个寡核苷酸以形成毗连DNA,这导致数百个毗连DNA。对于dsDNA分子在单个协同反应中的连接,可以至少约4个(例如,至少约5、10、25、50、75或100个分子),其中对于每对待被连接分子,一个DNA分子的远端区域包含与另一DNA分子的近端区域的序列同源性区域,并且每组同源性的远端和近端区域对于每对待被连接DNA分子都是独特的。
在本发明的连接反应中,待被连接的感兴趣的DNA分子的集合可以进一步包括线性化的载体DNA分子,并且被连接的感兴趣的DNA因而可以克隆到所述载体中。如果期望,这类分子可以转化到宿主细胞(例如,微生物,诸如细菌(例如,大肠杆菌)、酵母或真核细胞,诸如哺乳动物细胞)中。
在本发明的方法中,一个或更多个(例如,所有的)DNA分子可以合成产生。DNA分子可以是感兴趣的基因或基因组的邻近的序列。在一个实施方式中,DNA分子被合成,以便在其末端包含序列同一性重叠区域,并且所述DNA分子被连接以形成部分或整个的合成基因或基因组。
在本发明的一个方面,每个待被连接的感兴趣的DNA分子在两个同一性区域中每一个的游离端处包含与任意感兴趣的DNA分子不同源的序列;并且在连接反应期间,非同源序列通过聚合酶的3′核酸外切酶活性(对于等温方法)或对于循环变温方法聚合酶通过5′核酸外切酶活性而除去。非同源序列可以包含一个或更多个PCR引物的结合结构域(例如,四个不同的结合结构域)和/或一个或更多个限制酶的识别位点。
因此,本发明的方法可以容易地适应自动化和高通量(例如,通过机器操作的方法实施)。
嚼回(Chew-back)
在本发明的方法中,核酸外切酶的消化在有效嚼回足够数量的核苷酸以允许暴露的同源性单链区域的特异性退火的条件下实施。一般地,至少整个重叠区域被嚼回,留下包含重叠区域的突出端。在一些方法中,核酸外切酶消化可以在dNTP不存在的情况下通过聚合酶(例如,T5 DNA聚合酶)来实施,而在其它方法中,核酸外切酶消化可以在dNTP存在的情况下通过缺少聚合酶活性的核酸外切酶(例如,核酸外切酶III)来实施。
在其它实施方式中,例如,当重叠区域非常长时,可仅仅需要嚼回一部分区域(例如,一半以上区域),条件是由此产生的单链突出端具有足够的长度和碱基含量,以在反应条件下特异性退火。“特异性退火(annealing specifically)”在本文中含义是具体一对单链突出端将优选(或仅仅)与彼此退火,而不与反应混合物中存在的其它单链突出端退火。“优选(preferentially)”含义是至少约95%的突出端将与成对的突出端退火。技术人员可以容易地确定在给定的一组反应条件下实现感兴趣的序列特异性退火的最佳长度。一般地,同源的重叠区域(单链突出端或它们的互补链(complements))含有相同的序列。然而,可以使用部分相同的序列,条件是在反应条件下单链突出端可以特异性退火。
群集剂
反应混合物中适合量的群集剂,如PEG,允许增强或促进分子群集。不希望受任何具体机制的限制,建议允许分子群集的群集剂与溶液中的水结合并且维系在一起,以允许溶液中的组分彼此接触更紧密。例如,待被重组的DNA分子可以紧密靠近;这从而促进单链突出端的退火。还建议酶可以与它们的DNA底物更加紧密地接触并且可以通过除去水分子而被稳定。各种适合的群集剂对技术人员而言是明显的。这些包括各种公知的大分子,如聚合物,例如,聚乙二醇(PEG);Ficoll,如Ficoll 70;右旋糖酐,如右旋糖酐70或类似物。在本申请中的许多论述涉及PEG。然而,所述论述含义也指应用其它合适的群集剂。技术人员将了解如何进行方法的常规变化,以便适应其它群集剂的使用。
一般地,当使用PEG时,浓度为约5%(重量/体积)最佳。然而,PEG的量的范围可以,例如从约3至约7%。可以使用任意适合大小的PEG,例如,范围从约PEG-200(例如,PEG-4000、PEG-6000或PEG-8000)到约PEG-20,000或甚至更高。在本文的实施例中,使用PEG-8000。群集剂除增强退火反应外还可以增强连接作用。
缺口修复
在单链DNA(当待被连接DNA分子是dsDNA时通过核酸外切酶的作用产生的突出端,或当待被连接DNA是单链DNA时单链DNA分子的序列同一性区域)退火后,核酸外切酶留下的单链缺口用合适的热稳定的、非链置换的DNA聚合酶(本文中有时也称为“聚合酶”)填充并且由此形成的切口用热稳定连接酶进行封闭。如本文所用,“非链置换DNA聚合酶(non-strand-displacing DNA polymerase)”是这样的DNA聚合酶:随着其对dsDNA分子进行复制当其遇到位于其路径中的DNA链时所述DNA聚合酶终止DNA的合成,或当其同时填充所形成的缺口从而产生“移动切口”(切口翻译)时随着其的进行所述DNA聚合酶降解遇到的DNA链。
由缺口填充反应产生的切口可以用任意各种适合的热稳定DNA连接酶(有时在本文中称为“连接酶”)进行封闭。在适合的连接酶中有,例如,Taq连接酶、Ampligase热稳定DNA连接酶(Epicentre Biotechnologies)、美国专利号6,576,453中公开的热稳定连接酶、来自Bioneer,Inc.的热稳定Tfi DNA连接酶等等。
一般地,在反应过程中基本上所有的切口(或所有的切口)都被封闭。然而,在一个实施方式中,仍包含一些切口的被连接DNA可以转化到细菌如大肠杆菌中,其中所述切口通过细菌机器进行封闭。
在本发明方法中使用的酶的量可以通过经验确定。一般地,5′核酸外切酶活性的量基本上低于聚合酶活性的量,并且连接酶活性大大过量于聚合酶。在本发明方法中要使用的适量的酶在本文实施例中进行说明。
存在于本发明反应混合物中的反应组分(如盐、缓冲液、适合的能量源(如ATP或NAD)、反应混合物的pH等等)对于各个酶(核酸外切酶、聚合酶和连接酶)可以不是最佳的;然而,它们充当对整组反应有效的妥协。一些示例性的反应条件显示在实施例中。例如,由发明人确定的一种适合的缓冲液系统——有时在本文中称为ISO(ISO热)缓冲液——通常包含0.1M Tris-Cl pH 7.5;10mM MgCl2;dGTP、dATP、dTTP和dCTP各0.2mM;10mM DTT;5%PEG-8000和1mM NAD。
在本发明的方法中,具有核酸外切酶、聚合酶和连接酶活性的蛋白被分离(例如,基本上纯化);未采用细胞提取物或完整的细胞。如本文所用,术语“分离的”蛋白含义是蛋白离开其原始环境(例如,天然环境,如果其天然存在的话),并且与天然相关的大部分其它组分分离或分开。例如,在其天然活宿主中存在的天然存在蛋白(例如,在已经感染有噬菌体(phage)的细菌中存在的噬菌体(bacteriophage)蛋白)不是分离的,但与天然系统中一些或所有的共存物质分开的相同的蛋白是分离的。这类蛋白可以是组合物或反应混合物的一部分,并且仍是分离的,原因在于这种组合物或反应混合物不是其天然环境的一部分。如本文所用,术语“分离的蛋白”可以包括1、2、3、4或更多个蛋白的拷贝,即蛋白可以是单体形式,或其可以是多聚体形式,如二聚体、三聚体、四聚体或类似物,这取决于所考虑的具体蛋白。在一些实施方式中,蛋白是纯化的。在本发明方法中使用的纯化蛋白的方法是常规的。在一些实施方式中,蛋白是基本上纯化的或被纯化至同质(homogeneity)。“基本上纯化的(substantially purified)”含义是所述蛋白与其它蛋白分开并且基本上不含其它蛋白,即所述蛋白是主要的和活性的成分。纯化的蛋白然后可以与待被连接DNA接触。本发明的方法中使用的蛋白可以是“活性片段”的形式,而不是全长蛋白,条件是所述片段保持实现连接所需要的活性(酶活性或结合活性)。本领域的技术人员将了解如何制备和使用这类活性片段。
连接DNA分子
在本发明的方法中,至少两个DNA分子在有效连接DNA分子以形成基本上完整(优选没有切口)的双链DNA分子(例如,其中保持序列同一性区域的单拷贝)的条件下与酶接触。
本发明的方法可以用来连接任意感兴趣的DNA分子,包括天然存在的DNA、克隆的DNA分子、合成产生的DNA等等。如果期望,被连接DNA分子可以克隆到载体中(例如,使用本发明的方法)。
本发明的方法可以连接任意长度的DNA分子。可以例如经由约20个碱基的重叠序列连接约40-60个碱基的单链寡核苷酸。用于连接具有40bp重叠的分子的最小大小是约80bp。对于具有200bp重叠的分子,最小大小是约400bp。理论上,不应当存在可以连接的DNA分子的最大大小(尽管非常大的分子会比较小的分子更脆弱,并且因此遭受可能的破坏)。例如,可以连接具有约100bp至约750或1,000或更多的序列盒(cassette)。
可以连接两个至基本上无限多的DNA分子。一般地,可以连接至少约5-10个片段。可以连接的片段的数量部分取决于重叠的长度和片段的长度。例如,对于具有约150至约200bp的突出端的片段(例如,约3kb或更大或更小的片段),可以连接的片段的数量基本上是无限的。在一个反应中可以连接的片段的数量也部分取决于连接方法的效率。如果连接的效率是100%,那么理论上可以连接无穷数量的DNA分子(条件是在反应中存在大约相等数量的各底物分子)。对于较低的效率(例如,每对两个分子中约75-90%的连接),可以连接两个至约250个DNA分子。本发明的方法对于宽范围的底物DNA(例如,在反应混合物中约10至约1,000ng的各个底物)工作良好。
在本发明的一些实施方式中,连接的DNA分子形成环和/或连接到载体中形成环。用以成环的dsDNA的大小下限是约200个碱基对。因此,连接的片段的总长度(在一些情况下包括载体的长度)优选是至少约200bp长度。不存在实际的大小上限,并且几十万个碱基对或更大的连接的DNA可以通过本发明的方法产生。连接的DNA可以呈现环状或线性分子的形式。
更具体而言,可以在本发明所述的一个或几个装配阶段中体外连接以产生最终产物的DNA分子或序列盒的数量可以至少或不大于约2、3、4、6、8、10、15、20、25、50、100、200、500、1,000、5,000或10,000个DNA分子,例如在约4至约100个分子范围内。装配阶段的数量可以是约2、4、6、8、10个或更多个。在单一阶段中装配的分子的数量可以在约2至约10个分子范围内。本发明的方法可以用来将DNA分子或序列盒连接在一起,每一个所述DNA分子或序列盒均具有至少或不大于约40bs、60bs、80bs、100bs、500bs、1kb、3kb、5kb、6kb、10kb、18kb、20kb、25kb、32kb、50kb、65kb、75kb、150kb、300kb、500kb、600kb、1Mb或更大的起始大小,例如在约3kb至约500kb的范围内。本发明方法的DNA最终产物可以是至少约500bs、1kb、3kb、5kb、6kb、10kb、18kb、20kb、25kb、32kb、50kb、65kb、75kb、150kb、300kb、500kb、600kb、1Mb或更大,例如在30kb至1Mb的范围内。在一个实施方式中,本发明方法用于通过几轮装配将短的单链寡核苷酸在体外装配成约6kb的序列盒,然后将100个这种序列盒装配成约600kb的DNA分子。
当连接DNA分子的混合物时,优选DNA以大约等摩尔的量存在。如果DNA分子的数量不平衡,结果会终止装配的物质(species)。例如,考虑其中要装配8个DNA分子的实例(编号1-8)。如果例如存在过量的4号分子,大多数装配分子会是1-4和4-8。假定在反应中仅仅嚼回几百个碱基的话,在1-4的远端区域和4-8的近端区域之间不会存在序列同源性,从而减少了1-8的量。
序列同源性区域
序列同一性区域应当足够长,以允许特异性重组发生。也就是说,应当足够长,以便在两个待被连接DNA分子末端处的重叠区域对于那些DNA分子是独特的,并且在重组反应过程中没有其它DNA分子与那两个DNA分子退火。长度可以从约10个碱基对(bp)的最小值至约300bp或更多碱基对变化。一般地,优选重叠的长度小于或约等于要组合的片段的大小,但不小于约10bp且不大于约1000bp。对于2或3个片段的连接,约20-30bp的重叠可能是足够的。对于10个以上片段,优选的重叠是约80bp至约300bp。在一个实施方式中,序列同一性区域具有允许其通过合成方法容易产生的长度,例如,约40bp(例如,约32至约48bp)。重叠的长度可以是,例如,约10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950或1,000bp。
在优选的实施方式中,当要连接多个DNA分子时,对于每对待被连接DNA分子,一对DNA分子中一个DNA分子的远端区域被设计成与该对DNA分子中另一个DNA分子的近端区域共享序列同一性区域,并且每对DNA分子的序列同一性的远端和近端区域被设计成独特的(以不同于其它对DNA分子的序列同一性区域)。当同一性的重叠区域以这种方式设计时,可以预先确定DNA分子在连接的分子中的方向和顺序。在本发明的方法中,许多DNA分子(例如,4或6个分子)因此可以在单个反应混合物中(在单个容器(vessel)或容器(container)中)一起温育并且连接成较长的DNA分子,在所述较长的DNA分子中,各个DNA被以任何期望的顺序和方向安排。
在待被连接DNA的近端和远端区域中存在的序列同一性区域可以通过任意各种方法产生。
例如,在本发明的一个实施方式中,合成制备的、感兴趣的基因或基因组的重叠片段(例如,约5-6kb长或更长或更短)任选地被扩增(例如,通过PCR或通过MDA如滚环机制),并且通过本发明的方法以它们在基因或基因组中所处的顺序和方向被连接。在该方法中,第一DNA片段(例如,在基因或基因组的5′大部分中)被合成,以便在其3′端(远端)区域含有这样的序列(例如,约40bp),所述序列与要连接其的DNA片段的5′端(近端)处的序列是相同的。第二DNA片段进而被合成,以便其在其远端具有这样的序列,所述序列与第三DNA片段的近端处的序列相同,等等。在另一实施方式中,合成制备的感兴趣的基因或基因组的片段被插入到载体中,在大肠杆菌中繁殖以制备更多合成制备的片段,然后从载体中释放出来,任选地通过PCR、MDA或RCA进一步扩增,并且通过本发明的方法以它们在基因或基因组中所处的顺序和方向连接。这些程序允许合成基因或基因组的制备。
在本发明的另一实施方式中,待被连接的两个片段通过限制酶消化而产生,以便片段彼此重叠,例如,约20至约1,000bp。重叠区域然后可以通过本发明的方法进行连接。较大量的片段也可通过这些方法产生并且连接。可以使用前述方法和使用合成制备的DNA分子和/或通过PCR产生的分子的方法的组合。
在本发明的一个实施方式中,可以使用化学合成的寡核苷酸,其从约20bp至可以化学合成的任意大小。例如,10个约60bp的ssDNA寡核苷酸——在每个末端具有约10-20bp的同源性重叠——可以同时装配到载体中。10个这类寡核苷酸的装配导致约500bp的dsDNA分子。通过该方法装配的DNA分子进而可以与一个或更多个通过该(或另一)方法装配的其它DNA分子(例如,约500bp的装配物)连接。所述方法的重复可以产生非常大的DNA分子;对所产生的DNA分子的大小没有理论的限制。
在本发明的实施方式中,通过PCR扩增引入同一性区域。
在一个这种方法中,感兴趣的片段被插入到载体中。例如,质粒载体可以用限制酶进行线性化,产生在限制酶切割左侧的序列A(例如,具有40bp)和在限制酶切割右侧的序列B(例如,具有40bp)。待被克隆到载体中的片段被PCR扩增,其使用将序列A引入片段左端和序列B引入片段右端的PCR引物进行。序列同一性区域(在该实例中,每个具有40bp)允许片段以期望的方向与载体连接,以形成环状分子。可选地,特别是当期望避免PCR扩增期间可能引入到插入片段的错误时,载体可以被PCR扩增,以便在克隆位点的末端引入这样的序列,所述序列重叠插入片段末端的序列。上述方法允许定向克隆任意感兴趣的插入片段,而不必依赖于插入片段上限制酶位点的存在或引入。
在前述方法的变化中,两个或更多个DNA片段被彼此连接以形成线性分子。在前述方法的这种变化中,对每对待被连接片段独特的序列同一性区域通过PCR扩增使用适合的引物被引入到片段中。对于待与另一片段连接的每个DNA片段,这样的序列被引入到第一片段的3′端(远端),所述序列与第一片段要连接的片段的5′端(近端)处的序列重叠。如在前述方法中,使用PCR引物,其中序列同一性区域(例如,40nt)位于PCR引物(例如,具有20nt)的5′端。在合适轮数的PCR扩增后,DNA片段被引入,其中限定的序列同一性区域存在于片段的末端处。所得到的片段然后可以通过本发明的方法以预先确定的顺序和方向连接。
如果期望,被连接的线性DNA片段可以进行环化或它们可以插入到载体中以形成环状物(在连接片段的同时或之后)。例如,在连接反应中可以存在载体,以便将被连接片段导入到载体中。通过本发明方法将大量片段(例如,6个或8个片段)连接到载体中的效率比采用利用相容性限制酶位点的方法时高。在用限制酶和T4DNA连接酶进行的典型克隆实验中,研究者不可能使多个插入片段连接到载体中。然而,在本发明的装配方法中,研究者能以大约20-50%的效率或更高效率将约6个插入片段连接到载体中。而且,由于效率高,重组体与非重组体的比率增加。非重组体的背景值可以通过琼脂糖凝胶电泳(由于该方法产生足够高的收率以分离琼脂糖凝胶上的条带)或用尺寸排阻柱分离纯的条带而进一步降低。例如,使用本发明的方法,可以将期望大小的DNA(具有恰当数量的被连接DNA分子)分离并导入到载体中。如果最终产物是环状物,则不需要通过琼脂糖凝胶电泳分离它。相反,样品可以用酶如Plasmid-SafeTM(Epicentre)、选择性水解线性dsDNA而不水解环状dsDNA的ATP-依赖性DNAse进行处理。如果使用者的应用不需要纯的克隆,可以有足够量的DNA,而不需要转化到大肠杆菌中和进行质粒制备。
在一个实施方式中,被连接DNA分子和/或插入到载体的DNA分子被导入宿主细胞如细菌或真核细胞中(例如,通过转化或转染)。可选地,可以将包含被连接DNA分子的反应混合物导入到宿主细胞中;仅那些已经重组形成环状分子的DNAs能在宿主细胞中存活。在另一实施方式中,直接使用被连接片段和/或插入到载体中的片段,而不进一步通过细胞,如细菌细胞传代。
本发明的分子生物学方法可以使用常规的程序实施。本发明方法的各种用途对技术人员而言是明显的。本发明方法可以取代任意使用限制酶消化来产生用于连接DNA分子的相容性序列的方法。在本发明的一个实施方式中,太大而无法通过PCR扩增的DNA分子可以通过本发明方法连接亚片段然后将它们插入到适合的载体中进行克隆。一些DNA片段(piece)在大肠杆菌,尤其是在A+T%含量高的大肠杆菌中是不稳定的(并且,因此不可克隆)。本发明的方法允许体外装配DNA,而不需要转化到大肠杆菌中。而且,可以向反应添加phi29 DNA聚合酶来扩增环状DNA。本发明的体外重组系统可以用来重组感兴趣的任意同源DNA,例如,用来修复双链DNA断裂或缺口,等等。本发明的另一应用是将突变引入到DNA中。在该方法中,突变被引入到上链和下链PCR引物,因此扩增的片段是100%突变体;然后通过本发明的方法将这些片段连接。
本发明的一个实施方式是连接序列盒,如代表邻近感兴趣的基因或基因组区域的5-6kb DNA分子,以产生组合装配。例如,感兴趣的可以是,修饰细菌基因组,如推定的最小基因组或最小基因组,以便消除或突变一个或更多个基因,和/或添加一个或更多个另外的基因。这类修饰可以通过将基因组分成适合的序列盒如约5-6kb的序列盒并且通过用含有期望修饰的序列盒取代原始序列盒来装配被修饰基因组进行实施。而且,如果期望同时引入各种改变(例如,感兴趣基因的各种修饰、添加各种可选基因、消除一个或更多个基因等等),技术人员可以在组合装配中使用各种序列盒——其相应于各种修饰——同时装配大量基因组。在优选以高通量方式装配大量被修饰序列后,可以测试每个被修饰基因组的性质,以确定哪些修饰赋予基因组(或包含该基因组的生物体)期望的性质。该“混合和匹配”程序产生多种测试基因组或生物体,可以对这些测试基因组或生物体的性质进行比较。整个程序可以按期望以循环的方式重复。
所公开的方法可以用来连接任意感兴趣的核酸分子。核酸分子可以来自任意来源,包括细胞或组织核酸样品、克隆片段或其亚克隆、化学合成的核酸、基因组核酸样品、cDNAs、由核酸文库获得的核酸分子等等。DNA可以被放射标记或可以包含结合实体,如生物素化的核苷酸,其可以有助于被连接DNA的纯化。如果期望,待被连接DNA分子或用于添加序列同一性重叠区域的引物可以通过合成制备。常规的合成技术包括使用亚磷酰胺固相化学术以通过磷酸二酯键连接核苷酸。也可以使用通过硫代磷酸酯键或不同的键如甲基磷酸酯键连接核苷酸的化学术。例如,可以使用氰乙基亚磷酰胺方法,其利用Milligen或Beckman System 1 Plus DNA合成器(例如,Milligen-Biosearch,Burlington,MA的8700型自动化合成器,或ABI 380B型)。Ikuta等,Ann Rev.Biochem.(1984)53:323-356(磷酸三酯和亚磷酸三酯方法),以及Narang等,Methods Enzymol.(1980)65:610-620(磷酸三酯方法)也描述了用于制备DNA分子的合成方法。通过上述方法制备的DNA可由商业来源获得,如Integrated DNA Technologies(IDT),Coralville,IA。
本发明的方法可接受自动化和适于高通量方法,以允许通过不需要人介入的计算机介导的和/或机器操作的方法同时连接多个DNA分子。
DNA修饰和核苷酸类似物
在本发明方法中使用的DNA可以以任意各种方式进行修饰,条件是被修饰DNA能够在方法中发挥功能。技术人员可以容易地确定具体修饰是否允许被修饰DNA发挥功能(例如,被方法中使用的酶识别并通过方法中使用的酶起作用)。
在本发明方法中使用的DNA可以具有一个或多个被修饰核苷酸。例如,它们可以含有一个或更多个碱基、糖或磷酸部分的修饰。对碱基部分的修饰包括A、C、G和T以及不同的嘌呤或嘧啶碱基,如尿嘧啶-5-基、次黄嘌呤-9-基(I)和2-氨基腺嘌呤-9-基的天然和合成修饰。碱基修饰通常可以组合例如糖修饰如2′-O-甲氧基乙基,以实现独特的性质如增加的双链体稳定性。
核苷酸类似物也可以包括糖部分的修饰。对糖部分的修饰将包括核糖和脱氧核糖的天然修饰,以及合成修饰。被修饰糖也包括在桥环氧处含有修饰如CH2和S的那些糖。核苷酸糖类似物也可以具有糖模拟物,如环丁基部分代替戊呋喃糖。
核苷酸类似物也可以在磷酸部分被修饰。可以理解的是,两个核苷酸之间的这些磷酸键或被修饰磷酸键可以通过3′-5′键或2′-5′键,并且所述键可以含有倒置的极性,如3′-5′至5′-3′或2′-5′至5′-2′。各种盐、混合的盐和游离酸形式也包括在内。可以理解的是,核苷酸类似物仅需要含有单个修饰,但也可以在一个部分中或在不同部分之间含有多个修饰。
核苷酸取代物是已经具有置换的磷酸部分和/或糖部分的核苷酸或核苷酸类似物。核苷酸取代物包括具有类似于核苷酸的功能性质但不含有磷酸部分如肽核酸(PNA)的分子。核苷酸取代物包括这样的分子,所述分子识别互补的核酸并且以Watson-Crick或Hoogsteen方式与互补的核酸杂交,但通过除磷酸部分以外的部分连接在一起。核苷酸取代物当与适当的靶核酸相互作用时能够顺从双螺旋型结构。
磷酸的取代物可以是例如短链烷基或环烷基核苷酸间键合、混合的杂原子和烷基或环烷基核苷酸间键合、或一个或更多个短链杂原子或杂环核苷酸间键合。在核苷酸取代物中,还可以理解的是,核苷酸的糖部分和磷酸部分都可以被例如酰胺型键合(氨基乙基甘氨酸)(PNA)所置换。
本发明的DNA分子可以由不同种类的核苷酸或相同种类的核苷酸构成。核苷酸可以由碱基(即,核苷酸的碱基部分)组成并且可以包含不同种类的碱基。例如,一个或更多个碱基可以是通用碱基(universal base),如3-硝基吡咯或5-硝基吲哚;约10%至约50%的碱基可以是通用碱基;约50%或更多的碱基可以是通用碱基;或所有碱基都可以是通用碱基。
一步等温方法
本发明的一个方面是使用分离的(例如,基本上纯化的)蛋白连接感兴趣的两个或更多个双链(ds)或单链(ss)DNA分子的体外方法,其中每对中的第一DNA分子远端区域和第二DNA分子近端区域共享序列同一性区域,所述方法包括将至少两个DNA分子在单个容器中在约45-60℃下与
(a)非热稳定的5′(5′至3′)核酸外切酶(例如,T5或λ核酸外切酶和/或其中核酸外切酶不是T7核酸外切酶),
(b)群集剂(例如,PEG,如约5%PEG,例如,PEG-8000),
(c)热稳定的非链置换DNA聚合酶,其显示3′核酸外切酶活性(例如,固有地显示3′核酸外切酶(校正)活性的聚合酶,如PhusionTM或VENTRDNA聚合酶;或者缺少校正活性的聚合酶如Taq聚合酶和滴定量(通常是少量)的具有3′核酸外切酶活性的酶如PhusionTM或VENTR聚合酶的混合物),以及
(d)热稳定连接酶(例如,Taq连接酶),
在有效连接至少两个DNA分子以形成基本上完整的dsDNA分子(例如,其中保留序列同一性区域的单拷贝和/或其中消化和移除不成对的非同源性单链DNA)的条件下一起温育。
在优选的等温方法中,(c)的聚合酶包含3′核酸外切酶活性。该酶活性可以是聚合酶(c)的固有性质;例如,PhusionTM和VENTRDNA聚合酶是显示校正活性(3′核酸外切酶活性)的热稳定非链置换DNA聚合酶。可选地,聚合酶(c)可以是缺少校正活性的酶如Taq聚合酶与滴定量(通常是少量)的具有3′核酸外切酶活性的热稳定聚合酶如PhusionTM或VENTR聚合酶的组合。该3′核酸外切酶活性是有用的——例如当期望向待被连接DNA分子末端添加序列如引物结合位点,例如以便允许通过通用引物PCR扩增分子,但然后在装配程序期间移除引物结合位点时。使用通用引物扩增待被连接DNA分子然后能够在装配反应期间移除允许使用通用引物的分子中结合结构域的能力是本发明的优势。
本发明该方法的优势是,技术人员可以连接最初缺少5′磷酸化末端的DNA分子(例如,通过PCR扩增制备的DNA),即使对于连接酶需要5′磷酸化末端以将5′末端与3′OH基团连接。这是因为5′核酸外切酶在将核苷酸从底物DNA的5′末端移除时留下5′磷酸化末端。
不希望受任何具体理论的限制,表明了当在高温(约45-60℃,例如,在约50℃)下温育组分的混合物时,DNA聚合酶能够“赢得”与核酸外切酶活性的竞争,以便由用核酸外切酶消化所形成的缺口在它们形成后基本上立即被聚合酶填补。这被实现的原因是核酸外切酶不是热稳定的,因而在高温下活性弱并且在温育约10-15分钟后失活,而聚合酶在高温下功能良好,驱使反应填补缺口;由此形成的带切口的分子然后可以通过热稳定连接酶进行连接。“热稳定”酶含义是在至少约45℃-60℃的温度下能发挥良好功能的酶。
因为用于通过本发明方法装配DNA分子的缓冲液条件也适于PCR扩增,并且装配混合物已含有PhusionTM聚合酶,所以在装配反应后可以进行PCR,而不用改变缓冲液条件。在一个实施方式中,一旦完成装配,盛有反应组分的容器便被打开并且添加用于PCR的引物。在另一实施方式中,从反应开始引物就已经包含在装配混合物中。在该实施方式中,在装配后,容器不必被打开,并且PCR反应可以立即开始并通过标准程序继续下去。当引物包含在装配混合物中时,可以需要在PCR(通常500nM)中添加超过(例如,~5,000nM)正常引物浓度的引物,以防止在装配步骤期间一些或大部分PCR引物被核酸外切酶降解。
用于通过优选的等温方法体外连接两个或更多个双链(ds)或单链(ss)DNA的试剂盒,在单个容器中包含适合量的
(a)非热稳定5′核酸外切酶(例如,其中核酸外切酶是T5或λ核酸外切酶;其中核酸外切酶是T5;其中核酸外切酶不是T7核酸外切酶),
(b)群集剂(例如,PEG,如约5%PEG-8000),
(c)热稳定非链置换DNA聚合酶,其显示3′核酸外切酶活性(例如,固有地显示3′核酸外切酶(校正)活性的聚合酶,如PhusionTM和VENTRDNA聚合酶;或者缺少校正活性的聚合酶如Taq聚合酶和滴定量(通常是少量)的具有3′核酸外切酶活性的酶如PhusionTM或VENTR聚合酶的混合物),以及
(d)热稳定连接酶(例如,Taq连接酶),
以便当dsDNA分子或ssDNA寡核苷酸在适合的缓冲组合物和dNTP存在的情况下被添加到试剂盒并且在约45℃至约60℃下温育约15-60分钟时,DNA分子在协同反应中被装配。
在一个实施方式中,试剂盒包含实施例III A中显示的寡核苷酸装配混合物的组分。本发明的试剂盒可以例如在约-20℃下冷冻贮存。
各种5′至3′双链特异性脱氧核糖核酸外切酶的任何一种可以用来在本发明的方法中嚼回DNA分子的末端。术语“5′核酸外切酶”在本文中有时用来指5′至3′脱氧核糖核酸外切酶。如本文所用,“非加工”核酸外切酶是在每个DNA结合事件期间降解有限数量(例如,仅少数)的核苷酸的核酸外切酶。用5′核酸外切酶的消化在DNA分子中产生3′单链突出端。在对5′核酸外切酶期望的其它性质中有:其缺少3′核酸外切酶活性、其产生5′磷酸末端、以及其启动5′-磷酸化末端和非磷酸化末端的降解。也期望该酶可以启动分子5′末端的消化——不论其是平端或其具有小5′或3′凹缺末端。适合的核酸外切酶对技术人员而言是明显的。这些核酸外切酶包括,例如噬菌体T5核酸外切酶(噬菌体T5基因D15产物)、噬菌体λ核酸外切酶、Rac原噬菌体的RecE、来自大肠杆菌的核酸外切酶VIII、噬菌体T7核酸外切酶(噬菌体T7基因6产物)、或各种与同源重组反应有关的5′核酸外切酶中任何一种。在本发明的一个实施方式中,核酸外切酶是T5核酸外切酶或λ核酸外切酶。在另一实施方式中,核酸外切酶是T5核酸外切酶。在另一实施方式中,核酸外切酶不是噬菌体T7核酸外切酶。制备和使用核酸外切酶和本发明方法中采用的其它酶的方法是常规的;并且许多可从商业来源获得,如USB Corporation,26111 Miles Road,Cleveland,Ohio 44128,或New England Biolabs,Inc.(NEB),240County Road,Ipswich,MA 01938-2723。
当使用5′核酸外切酶时,单链突出端产生在不能被修复的DNA分子的5′末端,除非例如这些分子可以形成环状物或引入其它程序来封阻核酸外切酶消化这些5′端。在本发明方法中使用的非链置换DNA聚合酶必须在引物分子的5′方向上延长。因为没有引物可用于在已经用5′核酸外切酶嚼回的DNA分子的5′-位缺口中延伸,所以所述缺口不能被聚合酶填补。在本发明的一个实施方式中,待被连接DNA分子被选择(设计)以便两端的DNA分子彼此连接形成环状物。在另一实施方式中,被连接DNA分子被设计以便它们整合到载体中,所述载体也存在于反应混合物中。可选地,在本发明的一个实施方式中,待被连接的末端DNA分子的5′末端被封闭以便5′核酸外切酶不能消化它们。封闭剂优选是可逆的,以便被连接DNA分子最终可以连接到载体中。适合的封阻剂对技术人员而言是明显的。这些封阻剂包括,例如硫代磷酸酯键、5′间隔分子、锁定核酸(LNA)等等。
如本文在别处就移除非同源性序列所进行的论述,可期望待被用于本发明方法中的热稳定非链置换DNA聚合酶显示3′核酸外切酶(校正)活性。在适合的具有这种3′核酸外切酶活性的DNA聚合酶中有PhusionTM聚合酶、VENTR聚合酶或Deep Vent聚合酶(其在55℃或更低温度下使用时具有链置换活性)、Pfu聚合酶和9°Nm聚合酶。可选地,本发明方法可以使用缺少3′核酸外切酶活性的热稳定非链置换DNA聚合酶,如果本发明方法还包括少量的能提供3′核酸外切酶活性的第二酶的话。例如,本发明方法可以使用Taq聚合酶,加上少量上述提到的具有3′核酸外切酶活性的聚合酶之一。技术人员可以容易地用滴定法测定要包含多少第二酶以实现期望量的核酸外切酶活性。
在本文采用的许多实施例中,使用了PhusionTM聚合酶。该聚合酶是期望的,因为其显示高度保真性及其它性质。
用于进行该方法的试剂盒可以包含(a)分离的(例如,基本上纯化的)酶,其具有非热稳定5′核酸外切酶活性(例如,T5核酸外切酶或λ核酸外切酶,但优选不是T7核酸外切酶);(b)群集剂,如PEG(例如,约5%最终浓度的PEG-8000);(c)(i)分离的热稳定非链置换DNA聚合酶,其显示校正3′核酸外切酶活性(例如,PhusionTM或VENTR聚合酶);或(c)(ii)分离的热稳定非链置换DNA聚合酶,其不显示校正3′核酸外切酶活性(例如,Taq聚合酶),并联合适当少量的具有3′核酸外切酶活性的聚合酶(例如,PhusionTM或VENTR聚合酶);以及(d)分离的热稳定连接酶(例如,Taq DNA连接酶)。本发明试剂盒的其它组分可以包括适合的缓冲溶液,其包含pH约7.5的缓冲液(如Tris);适合量的MgCl2;四种dNTP;能量源(如ATP或NAD);以及任选地,适合的克隆(装配)载体,如pUC载体。这些组分可以以适于单一应用的量包装在添加待被连接DNA分子的单个容器中;或者所述组分可以以较大的体积存在,可以分配在适于单个连接反应的等分试样中。
示例性试剂盒含有Tris pH 7.5、MgCl2、四种dNTP、DTT、PEG-8000、NAD、T5核酸外切酶、PhusionTM聚合酶、Taq连接酶以及任选地,装配载体的优化1.33X混合物。本发明的试剂盒一般被包装在容器中,在该容器中所述组分是稳定的,例如,其可以冷冻贮存在约-20℃下。
在本发明的一个实施方式中,5μL待被装配的dsDNA或ssDNA分子(例如,寡核苷酸,如彼此重叠20个碱基的60-mer)库(pool)与15μL所述试剂盒的混合物组合,得到共计20μL。然后将该混合物在约45-60℃(例如,在约50℃下)温育约15-60分钟(例如,15、30、45或60分钟),在该时间期间,DNA分子装配到dsDNA的邻接片段。如果期望,试剂盒可以进一步含有装配载体(例如,克隆载体),如pUC19、pBR322或BAC。
任选地,本发明的试剂盒包含进行所述方法的说明,例如设计待被装配寡核苷酸的说明,和/或将寡核苷酸库稀释至适合浓度的指导。例如,发明人已经发现,在5μL中的约180fmol/μL各寡核苷酸对于装配8个有20个碱基重叠的60-mer(由60个碱基组成的寡核苷酸)是最佳的。本发明试剂盒的其它任选组分包括阳性对照;对于上述提到的实例,对照可以含有8个有20个碱基重叠的60-mer——其已经被证明通过本发明的方法装配,以及载体,如pUC19。如果期望克隆被装配DNA,试剂盒还可以含有将被装配混合物转化到适合的微生物体如大肠杆菌中以及在含有生长介质(例如,LB)和适合的选择性标记物(例如,对于pUC19,羧苄青霉素或氨苄青霉素)的琼脂板上筛选转化体的说明。试剂盒也可以包含关于用于转化的适合菌株、用于电穿孔的参数等等的说明。
一步循环变温方法
另一方面提供方法,其包括将ds DNA或ss DNA分子与下列物质一起温育:
(a)在dNTP存在的情况下可操作的非热稳定3′核酸外切酶,其“嚼回”双链DNA分子的末端以暴露包含重叠区域的单链突出端;
(b)群集剂;
(c)热稳定非链置换DNA聚合酶,其以温度敏感的方式与部分结合,以在活性温度以下封阻聚合酶活性;
(d)热稳定连接酶,其密封(连接)由此形成的切口;
(e)dNTP;以及
(f)适合的缓冲液。
(a)的核酸外切酶在高温(例如,75℃)下失活。所述核酸外切酶在低温例如37℃下有活性。
(b)的聚合酶可以显示37℃和75℃之间的活性温度并且所述聚合酶可以在该温度以上有活性。不希望受具体机制的限制,失活的部分依然在活性温度以下与聚合酶结合。在活性温度下,抗体变得游离并且聚合酶显示活性。例如,在75℃下,抗体从聚合酶中游离并且聚合酶有活性。
优选地,(c)的连接酶在75℃或更高温度下是热稳定的。连接酶不需要在75℃或更高温度下有活性,但如果在较低温下有活性,当温度从75℃或更高温度降到较低温(例如,60℃)时活性必须存在。
在本发明的方法中,当组分混合物首先在低温(约30-45℃,例如,在约37℃)下温育时,核酸外切酶有活性并在DNA上形成缺口,而DNA聚合酶由于受结合抑制部分如抗体或生物素的部分空间干扰而失活。当温度升高到高温(65℃以上,例如,在约75℃),核酸外切酶失活而DNA聚合酶由于抗体从聚合酶解离而有活性。当温度降到约60℃时,连接酶有活性以填补缺口。
整个程序作为“一步”反应(在单个试管中,所述试管在整个重组程序中不必打开,在循环变温设备中)被实施。在这样的一种程序中,待被连接DNA的混合物在37℃下与下列温育:核酸外切酶III;Taq DNA聚合酶,其通过与抗体结合而失活;Taq DNA连接酶;dNTP和与所有这些酶活性相容的缓冲液。然后将温度升高到75℃。在该温度下,核酸外切酶III失活,被嚼回的DNA开始退火,并且抗体开始从Taq DNA聚合酶解离,导致活化。然后将温度降低到60℃以完成修复反应(填补缺口并且密封切口)。
本发明方法的优势是具体的方法在dNTP存在的情况下允许核酸外切酶活性。不希望受具体机制的限制,核酸外切酶III的使用在dNTP存在的情况下允许核酸外切酶活性,而T4 DNA聚合酶的核酸外切酶活性被dNTP封阻。因此,当使用核酸外切酶III时,不需要停止反应和在单独步骤中添加dNTP。
本发明方法的另一优势是所有步骤可以作为完全重组系统在体外进行。本领域已知的其它系统需要转化到宿主细胞中以修复产生的核苷酸片段。现在的系统包括使用连接酶的体外修复步骤,因此避免转化到宿主细胞中。如果待被修复核苷酸对宿主细胞有毒并且因而不能够进行转化的话,这是特别有用的。
本发明方法的又一优势是在产生的核苷酸中5′和3′突出端被修复。其它等温一步方法不包括修复5′和3′突出端。
本发明的另一方面是用于体外连接两个或更多个感兴趣的双链(ds)DNA分子的试剂盒,其中每一对的第一DNA分子的远端区域和第二DNA分子的近端区域共享独特的序列同一性区域,所述试剂盒在单个容器中包含适合量的
(a)在dNTP存在的情况下可操作的非热稳定3’(3’至5’)核酸外切酶,
(b)群集剂,
(c)热稳定非链置换DNA聚合酶,其以温度敏感的方式与化学部分结合,以在活性温度以下封阻聚合酶活性,和
(d)热稳定连接酶,以及任选地
(e)dNTP,和
(f)适合的缓冲液,
以便当dsDNA分子或ssDNA寡核苷酸以及当需要时,dNTP、群集剂和适合的缓冲液添加到混合物的内含物并且在37℃下温育约2至10分钟,然后在75℃下10-40分钟,以及然后在60℃下30分钟至2小时时,DNA分子被装配。本发明的试剂盒可以冷冻贮存,在例如约-20℃下。
在该方面的实施方式中,在步骤(c)中温育步骤可以是在37℃下5分钟,然后在75℃下20分钟,以及然后在60℃下1小时。
各种3′→5′双链特异性脱氧核糖核酸外切酶任何一种可以在本发明方法中用来嚼回DNA分子的末端。术语“3′核酸外切酶”指3′→5′脱氧核糖核酸外切酶。适合的核酸外切酶对技术人员而言是明显的。这些包括,例如核酸外切酶III。在本发明的一个实施方式中,核酸外切酶是核酸外切酶III。制备和使用核酸外切酶以及本发明方法中采用的其它酶的方法是常规的,并且许多可从商业来源获得,如USB Corporation,26111 Miles Road,Cleveland,Ohio 44128,或New England Biolabs,Inc.(NEB),240 County Road,Ipswich,MA 01938-2723。
优选地,在一步循环变温方法中,3′核酸外切酶作为聚合酶没有活性。
优化的组合方法
在优选的实施方式中,本发明的等温方法可以用来修饰全核酸分子的性质,例如以优化由核酸分子编码的多肽的表达、功能、活性、收率等等。本文描述的组合方法提供大量可能的核酸序列,可以针对期望的结果筛选所述核酸序列。在可选的实施方式中,核酸可以提供其它DNA或RNA产物,例如反义RNA,其用来减少宿主细胞中另一产物的收率。组合方法的结果是提供期望的产物,所述产物天然不存在,或是天然产物的改进或优化。被优化产物可以是合成的组分、已经被修饰或重排的天然组分、或天然组分和合成组分的组合。本领域的技术人员可以预期本文描述的组合方法的多种另外的应用。
不论重组发生的水平如何,中间产物是编码蛋白的核酸的混合物,所述核酸通常被表达并且测试收率和——在除密码子优化的实施方式——活性。因此,核酸的混合物通常提供有允许将核酸插入到表达系统中的限制位点或重叠部分,所述表达系统含有控制序列、特别是启动子和终止信号。控制序列的选择当然取决于发生表达的宿主。任何具体预期宿主的最佳控制序列也可以通过构建适当的文库而确定,所述文库含有多种控制序列如启动子、增强子和终止序列,并且装配在可以鉴定控制序列的最有利装配的多种基因中。方便的宿主包括大肠杆菌、其它细菌系统和酵母以及其它的单细胞真菌。哺乳动物宿主细胞或昆虫宿主细胞也可以使用,也可以使用植物细胞。用于测试的宿主的选择是实验偏好的问题并且所有这些宿主的表达控制都是公知的。
一旦混合物已被处理来将编码序列插入到表达系统中,其用来转染适当的细胞,所述细胞然后被稀释和培养。取决于期望的终点,对具有最高值的培养物评价培养物的蛋白活性、收率或代谢活性。然后从该培养物回收核酸并且测序或另外鉴定为期望的一个或多个序列。取决于优化的水平——即,密码子使用、个别蛋白优化、代谢途径优化或基因合成,接下来的组合步骤可以通过装配最佳组分来实现。
上述体外装配方法可以用来进行该过程。另外,体内装配方法可以如上所述用来进行该过程。而且,体外和体内装配的组合可以用来进行该过程。
然而,对于各种重组系统,核酸构建的最初步骤在它们的组分方面不同。
对于密码子优化,如图7A中所示,通过改变用来装配编码序列的每一核酸中的密码子来构建编码序列。如图7A中所示,由单个片段——其中这些单个氨基酸的密码子被改变——装配包括亮氨酸、缬氨酸、甘氨酸和丙氨酸的蛋白。通过适合的重叠片段,如上所述将含有图7A中所示的所有核苷酸的混合物在单一反应混合物中以正确的顺序装配。所得到的是全长编码序列。如果期望,也可以向混合物添加表达载体,以在该阶段自动提供控制序列。如果需要,进一步提供有表达控制的装配编码序列然后被转染到宿主细胞中,并且单独培养以及使用标准蛋白测定技术评价蛋白的水平。通过提取表达系统并且测序来分析蛋白产生水平最高的集落,以鉴定最佳组的密码子。
一般地,尽管提到了最高水平的产生或活性,但可以理解为,在每种情况下都不需要选择精确的最高值。由于各种原因,仅仅选择令人满意水平的这些特征可能就是足够的。
更详细地,鉴定优化产生蛋白的密码子使用的核苷酸序列的方法至少包括下列步骤(a)至(e)。在步骤(a)中,提供编码部分蛋白的寡聚体,其含有在该部分中编码的氨基酸的密码子简并形式,并且寡聚体被延伸以提供具有重叠序列的侧翼编码序列。在步骤(b)中,寡聚体被处理来实施蛋白编码序列的装配。重装配的蛋白包含在表达系统中,所述表达系统与控制序列可操作地连接以实施其表达。在步骤(c)中,表达系统被转染到相容宿主细胞的培养物中。在步骤(d)中,测试由转化的宿主细胞获得的集落的蛋白产生水平。在步骤(e)中,至少一个蛋白产生最高或令人满意的集落从表达系统获得。测定编码该蛋白的那部分表达系统的序列。
对于其中控制序列待被优化的实施方式,一个或更多个编码序列被用于构建含有多种表达系统的文库。待被装配到表达系统中的组分包括各种启动子、增强子、终止序列及类似物,它们的选择将取决于预期重组宿主的特性。还有,这些组分提供有重叠序列以确保按正确的顺序装配。使用任何体外装配技术,获得各种具有不同控制序列的基因,然后将它们转染到宿主细胞并且单独培养以确定蛋白产生的水平。
更详细地,为了构建具有最佳控制序列的基因用于表达,方法至少包括下列步骤(a)至(e)。在步骤(a)中,提供了代表多种启动子、增强子和终止序列的寡聚体和包含蛋白编码序列的寡聚体。在步骤(b)中,处理用以实施蛋白基因装配的寡聚体。在步骤(c)中,将所得基因转染到相容宿主细胞的培养物。在步骤(d)中,测试由转化的宿主细胞获得的集落的蛋白产生水平。在步骤(e)中,至少从蛋白产生水平最高或令人满意的集落获得基因。测定与编码该蛋白的核苷酸序列相关的控制序列的序列。
在接下来的阶段,如图7B中所图解,评价给定活性的蛋白的几个变体编码序列的基序和结构域。然后将编码每个显示的基序和结构域的核酸序列单独合成并且提供适合的重叠序列以提供正确的装配顺序。这些合成的序列然后被提供在连接混合物中,所述连接混合物类似于上面就密码子优化所描述的连接混合物,其任选地包括用以提供控制序列的载体,并且将所得表达系统转染到宿主细胞并测试活性和/或收率。
为了鉴定核苷酸序列——其编码优化形式的具有期望活性的蛋白,方法包括下列步骤(a)至(f)。在步骤(a)中,鉴定在一系列蛋白变体中包含的结构域和基序。在步骤(b)中,提供编码变体每一结构域和基序的寡聚体。在步骤(c)中,处理混合物以实施向编码蛋白的序列中装配。进行装配,为的是提供具有可操作地连接的控制序列的编码序列用于表达,以获得表达系统的混合物。在步骤(d)中,将表达系统转化到相容宿主细胞的培养物中。在步骤(e)中,测试由所述细胞获得的集落产生的蛋白的活性。在步骤(f)中,至少从产生最高或令人满意水平活性的蛋白的集落中分离表达系统。然后鉴定编码所述蛋白的核苷酸序列。
在接下来的阶段,如图7C中所示,将负责代谢途径的蛋白变体如上所述单独合成、混合和配对,并且测试代谢产物的产生。所述途径可以装配在单个载体上或在连续转化中可以使用多个载体。变体可以包含来自不同物种的编码蛋白的基因上游启动子元件以及合成产生的上游启动子元件。
最后,在一个实施方式中,期望代谢途径和/或基因的装配物可以使用类似的方法组合装配成全基因组。如Gibson等,Science(2008)319:1215-1220中所述,整个细菌基因组可以通过体外和体内技术的组合进行装配。最小基因组也可以以该方式进行装配。
在一个实施方式中,整个途径可以使用适当的连接体进行装配以构建整个基因组。装配和测试的方法类似于上面描述的那些。因为几个DNA片段的装配发生在单一温度下操作的单个反应中,所以可能以高度平行的方式实施反应,以分阶段建立整个染色体。所述途径变体可以全部克隆到细菌人工染色体(BAC)载体或用于操纵大核酸的任何其它载体中。
为了优化代谢途径,方法包括构建核酸分子,其编码待被优化途径中的每一个酶的变体。对于每个不同的途径,所有编码序列都可以使用上面描述的重叠序列的技术装配在单个载体上,或者所述途径的每个成员的独立载体可以通过混合连续转化混合物中每个成员的载体来应用。提供了用以实施所述途径中酶的表达的控制序列。评价源自培养物的集落的有利特征,所述有利特征由待被优化的途径所赋予,并且对成功集落的表达系统进行测序。
最佳或最小基因组的构建不需要只基于代谢途径装配物的组合。单个基因也可以以类似的方式装配或单个基因和代谢途径的组合也可以这样来装配。为了测定一个或更多个基因对代谢途径的必要性,这些基因中每一个均可以从装配物中系统地消除。
在所有上述方法中,DNA分子可以在一些或所有描述的水平上使用机器操作的系统进行装配。在任何阶段都可以使用体外或体内方法。可以期望整个基因组的装配。使用Gibson等描述的技术,如上所述可以以组合的方式构建20-500kb的染色体。对于产生全优化代谢途径的核苷酸序列的装配,评价这些系统的最佳组合。
上述过程可以从头开始进行,而不用预先选择推定期望的元件,或可以包括从序列数据库中选择每个所述途径基因的适当的变体基因,所述序列数据库来自所有可用的序列文库,包括全基因组和环境文库。计算方法可以用来从许多可用选择中选择最可能的候选物。一个组合文库的结果可以帮助设计用于相同途径的第二文库,所述途径将甚至更好地产生期望的产物。
用于在选择的生产宿主细胞中表达的最佳密码子使用也可以基于计算方法进行设计和如上所述进行测试。
如上面所提到的那样,向选择的生产宿主添加适当的调节信号,包括转录启动子和终止子,和用于启动蛋白合成的适当的信号,以及对所述途径中每个基因-基因连接和被装配途径与克隆载体连接特异的适合的连接体序列。
整个装配物的各个寡核苷酸的最佳大小和重叠也可以设计。设计工具包括用以协助最初途径设计和查看最终序列设计的图形界面。在组合文库的情况下,用单个鼠标点击每个组分基因应当可能调出和查看文库中的任意单个染色体。
对于途径的装配,为了图解,假定平均基因大小为1200bp以及平均核苷酸大小为60个核苷酸,对于9个基因途径的构建大概需要1200×9×10×2/60=3,600个寡核苷酸,这不包括比基因小的控制元件。2的因子是因为寡核苷酸必须覆盖DNA的两条链。寡核苷酸可以购自十二个左右供应商中任何一个或自动合成。将寡核苷酸——其供应在96孔寡核苷酸盘中——通过机器操作分配到96孔装配反应盘中,以便装配盘的每个孔含有8个序列中邻近的寡核苷酸。然后可以在第一装配步骤将盘的数目从大约36个寡核苷酸盘减少到5个左右装配盘。将15μl解冻的装配反应混合物(其已经包括克隆载体作为第9个DNA片段)的等分试样转移到每个孔。然后将盘在50℃温育20分钟。每个孔中的装配产物由8个被装配寡核苷酸组成,所述寡核苷酸插入到载体DNA中形成环状物。将每个孔的等分试样合并在一起、克隆并且测序。将正确的克隆转移回5个盘中,用于接下来的装配步骤。通过当装配物小时在第一装配阶段提前测序,去除了寡核苷酸错误,并且所有后续的装配物一般均具有正确的序列。
为了从一个装配步骤进行到下一个,通过高保真性PCR将装配物“取出(lift out)”载体,并且将等分试样分配到下一组盘中,用于接下来的装配反应。
继续装配直至单个盘含有9个基因中每一个基因的10个变体。9个基因及其变体然后合并到最终装配反应中,所述最终装配反应导致9个基因途径的109个不同组合的文库克隆到BAC载体中。将该组合文库转化到适当的宿主细胞中,并且根据产物收率等等筛选各个克隆。
本发明因此提供通过使用上述优化组分装配整个基因组的方法。如上面提到的那样,“整个”基因组可以是最小基因组,其性质可如上面引用的PCT公开中描述的那样测定,或者可以通过仅选择期望文库的某些鉴定的组分任意地测定。文库组分可以是各个基因、根据代谢途径的各个基因的装配物、被另外组织的基因的装配物或各个基因和其被组织系统的组合。可期望地,组分如本文所述确实被优化;然而,这不是先决(必要)条件。各个基因和/或基因的装配物的文库——其中一些或全部可以就基序变体、控制序列和/或密码子使用进行优化——可以用在基因组装配中。
实施例
在下列实施例中,所有温度均以未修正的摄氏度表示;并且,除非另有指明,所有份数和百分比都是按重量计。
实施例I
循环变温核酸外切酶III一步装配系统方案
基于分离的非热稳定3′至5′核酸外切酶和分离的热激活DNA聚合酶的使用如下进行循环变温一步装配。在0.2ml PCR管中于冰上建立反应,所述PCR管中含有下列:100ng待被装配的各底物DNA、20μl 4×CBAR缓冲液、0.7μl核酸外切酶III(4U/μl,NEB)、8.0μl Taq DNA连接酶(40U/μl,NEB)、0.5μl AmpliTaqGold(5U/μl,Applied Biosystems)和水共80μl。4×CBAR(Chew-back,Anneal,and Repair)缓冲液是20%PEG-8000、600mM Tris-Cl、40mM MgCl2、40mM DTT、4mM NAD和800μM各dNTP(pH 7.5)。
这给出最终浓度为1.25ng/μl待被装配的各DNA、5%PEG-8000、150mMTris-Cl pH 7.5、10mM MgCl2、10mM DTT、200μM各dNTP、1mM NAD、0.035U/μl核酸外切酶III、4U/μl Taq DNA连接酶和0.03U/μl AmpliTaqGold。
经发现,对于长度在5kb至8kb之间的片段,100ng底物DNA是理想的。对于较大的装配,增加DNA的量(例如,对于长度为20kb至32kb的片段,使用400ng各底物)。注意避免使底物DNA占一半反应体积以上,是因为发现了这抑制反应。由100U/μl核酸外切酶III浓缩酶原液以1∶25稀释(在核酸外切酶III贮存缓冲液中)来使用核酸外切酶III。
将反应添加到循环变温器并且使用下列条件进行装配:37℃,5分钟(对于重叠40-80bp的底物,37℃下嚼回至少5分钟,以及对于重叠300-500bp的底物,15分钟);75℃,20分钟(Exo III的热失活);0.1℃/s冷却至60℃(退火);60℃,1小时(修复);以及然后保持在4℃。
这些步骤概括在了图4A中。由该方案得到的结果显示,该方法运行得正象两步方法——其采用T4 DNA聚合酶、Taq DNA聚合酶和Taq DNA连接酶——一样良好,并且与之具有完全相同的优势,并且可以用来装配线性或环状DNA。
实施例II
用于核酸的等温T5核酸外切酶一步装配方案
基于使用缺少3′核酸外切酶活性的分离的非热稳定5′至3′核酸外切酶如下进行等温一步装配。建立反应,其含有下列:100fmol待装配的各dsDNA底物或3.6pmol待装配的各ssDNA、16μl 5×ISO缓冲液、16μl T5核酸外切酶(0.2U/μl,Epicentre)、8.0μl Taq DNA连接酶(40U/μl,NEB)、1.0μl PhusionTM DNA聚合酶(2U/μl,NEB)和水共80μl。5×ISO(ISOthermal)缓冲液是25%PEG-8000、500mMTris-Cl、50mM MgCl2、50mM DTT、5mM NAD和1000μM各dNTP(pH 7.5)。
这给出最终浓度为1.25fmol/μl待被装配的各dsDNA(或45fmol/μl各ssDNA)、5%PEG-8000、100mM Tris-Cl pH 7.5、10mM MgCl2、10mM DTT、200μM各dNTP、1mM NAD、0.02U/μl T5核酸外切酶、4U/μl Taq DNA连接酶和0.03U/μlPhusionTM DNA聚合酶。
对于重叠20-80bp的底物,方法使用1.64μl 0.2U/μl T5核酸外切酶;对于具有更大重叠(例如,200bp)的底物,使用1.6μl 1U/μl T5核酸外切酶。由10U/μl T5核酸外切酶(Epicentre)浓缩酶原液以1∶50稀释(在T5核酸外切酶贮存缓冲液中)使用T5核酸外切酶。
然后将反应在50℃下温育15分钟。
这些步骤概括在了图5A中。合成大dsDNA分子的大部分成本是寡核苷酸的成本。一旦生产寡核苷酸的成本降低,使用本发明方法由寡核苷酸装配大DNA分子的成本也将降低。
实施例III
用于单链核酸的等温T5核酸外切酶一步装配方案
A.寡核苷酸装配混合物的制备
在所有试剂盒中的混合物含有相同的成分,只有一个例外是载体的存在或不存在。在载体不存在的情况下,水被替代。本发明的方法允许快速和容易地使用配置在试剂盒中长期贮存的相同的装配混合物和缓冲液。
寡核苷酸装配混合物的配制物(对于120μl总体积)含有:32μl 5×ISO缓冲液、0.064μl 10U/μl T5核酸外切酶(Epicentre)、2μl 2U/μl PhusionTM聚合酶(NEB)、16μl 40U/μl Taq连接酶(NEB)、2μl 200ng/μl pUC19装配载体和67.94μl水。然后将装配混合物贮存在-20℃下。
5×ISO缓冲液的配制物(对于6ml总体积)含有:3ml 1M Tris-CI pH 7.5(最终0.5M)、150μl 2M MgCl2(最终50mM)、60μl各100mM dGTP、dATP、dTTP、dCTP(最终各1mM)、300μl 1M DTT(最终50mM)、1.5g PEG-8000(最终25%)、300μl 0.1M NAD(最终5mM)和水,共6ml。括号中的浓度指在5×ISO缓冲液中的最终浓度。
所有成分在寡核苷酸装配混合物(混合物是1.33X,因为在20μl最终体积中添加了15μl)中的最终浓度如下:133.33mM Tris-CI(pH 7.5)、13.33mM MgCl2、266.67μM dGTP、266.67μM dATP、266.67μM dTTP、266.67μM dCTP、13.33mM DTT、6.67%PEG-8000、1.33mM NAD、5.33U/ml T5核酸外切酶(Epicentre)、33.33U/mlPhusionTM聚合酶(NEB)、5.33U/μl Taq连接酶(NEB)和3.33ng/μl pUC19装配载体。
可以将上述试剂盒在1.33X浓度下冷冻贮存至少12个月。其可以经受至少10个冷冻-解冻循环而不丧失活性。
B.装配寡核苷酸以形成插入到pCC1BAC中的16.5kb最终产物
尽管该实施例显示了ssDNA寡核苷酸的装配,但同样的条件和试剂主要混合物可以用于装配dsDNA。例如,在此处详细显示的第一装配阶段中,8个单链寡核苷酸被装配,产生约300bp的双链分子。下一阶段——其中300bp DNA被装配产生较大的分子,以及随后的阶段——其中那些分子被装配产生更大的分子,可以通过使用本实施例中显示的相同的试剂主要混合物来完成。
该实施例描述了4个阶段装配方案。然而,在本发明的另一实施方式中,25-75个片段可以同时进行装配。在那个实施方式中,阶段数明显减少到例如仅2个。
对于第一轮装配,8个60nt(60-mer)ssDNA寡核苷酸——其彼此重叠20个碱基并且其彼此邻近地位于待被装配的已知DNA中——的混合物(库)被稀释,以便在5μl的总体积中有180fmol/μl各寡核苷酸。发明人确定该浓度对于装配8个具有20nt重叠的60-mer是最佳的。15μl上述1.33X主要混合物被添加到5μl寡核苷酸中并且在50℃下温育15-60分钟,以形成300bp的dsDNA分子连续片段。在装配混合物中存在pUC19载体,因此300bp分子被插入到载体中。
在装配之后,将装配的分子转化到适合的大肠杆菌宿主中,并且使用氨苄青霉素作为选择标记对pUC19克隆进行选择。一般地,对克隆进行测序,以确证装配的分子是正确的。目前,出现了不正确序列的背景,是因为合成寡核苷酸的方法不精确。预期用于修正错误的方法,或合成寡核苷酸的更好方法,将消除对该测序检查的需要。例如,修正错误的酶或试剂可以添加到或包含在本发明的装配反应中。可选地,装配DNA分子可以直接通过PCR扩增,然后进行测序以确证精确性,而不用对它们进行克隆。
8个60-mers的74个另外的库(聚集体,pool)——其来自待被合成DNA分子的不同部分——也被装配。共600个这些60-mers被装配,形成300bp dsDNA分子的集合(collection);以及在随后轮的装配中,300-mers被PCR扩增和装配,形成1,180bp dsDNA,所述1,180bp dsDNA进而被PCR扩增和装配,形成5,560-mers,所述5,560-mers最终被装配形成16,520bp的dsDNA分子。该分子然后被扩增(通过PCR,或者通过更加有效扩增大分子的方法,滚环扩增(RCA))、克隆(例如,进入BAC载体)和测序以确证装配是精确的。
在该实施例中,克隆载体被用来装配插入物。然而,如果向宿主生物体中克隆对于产生更多DNA分子是不需要的,由于例如将要使用体外扩增方法(例如,PCR或RCA),那么可以不存在克隆载体。然而,在一些情况下,使插入物形成环状物仍可以是有利的。这将允许用核酸外切酶将不完全装配产物(其是线性的)从完全装配产物中去除(环状物抵抗核酸外切酶活性,而不完全装配产物不抵抗核酸外切酶活性)。如果DNA扩增的体外方法(例如,PCR或RCA)受到不完全装配产物抑制的话,这可能是重要的。
C.通用引物结合序列在待被装配寡核苷酸5′和3′末端处的应用。
为了协助装配寡核苷酸的PCR扩增,在每轮装配中,在待被装配(由ssDNA寡核苷酸)和扩增的片段的每一末端处包含结合结构域(位点)可以是有利的。随着它们被合成,这些结构域可以被设计和引入到一些寡核苷酸中(例如,以正被建立的片段的侧翼区域为末端的寡核苷酸)。示例性dsDNA片段——其中显示4个引物结合结构域——在DNA分子的侧翼。在随后轮的扩增和装配中,DNA可以使用相应于适合结构域的“通用引物”进行PCR扩增,从而消除了对设计单独引物的需要,所述单独引物用于扩增待被扩增的各DNA。如果期望,限制酶位点(如罕见切点酶PmlI、SbfI、AscI或NotI)也可以被工程改造成位于引物结合结构域之间。这些位点可以促进切割掉引物结合位点。
本发明方法的一个优势是,在反应期间3′核酸外切酶活性的存在(其可以例如由PhusionTM聚合酶的校正活性提供)将去除所有的结合结构域,因为它们作为单链DNA而存在,所述单链DNA与正被扩增的DNA不同源。正被装配到载体中的寡核苷酸可以是40-mers而不是60-mers。由于40-mers,将不会存在缺口。正被装配的寡核苷酸可以非常大(例如,几百个碱基)。而且,正被装配到载体中的寡核苷酸可以来自寡核苷酸库(例如,含有4,000或更多个寡核苷酸的微芯片。微芯片可以充当用以获得寡核苷酸的低廉的方式)。克隆载体没有必要必须是环状克隆载体(如具有pUC19的图中所示)。相反,其可以是带有两个臂的线性载体(例如,Lucigen′s pJAZZ-KA线性载体系统)。线性载体可以有利于装配过量的寡核苷酸,而没有连环化(concatamerization)出现(连环化将导致单个克隆含有两个或更多个组的装配片段。因此,这将不是所期望的纯克隆)。可以将克隆的寡核苷酸转化到大肠杆菌中。可以通过诸如DNA测序的技术来鉴定含有正确装配物的各个克隆。
D.自动装配大分子
在该实施例中显示的该方法可容易地适应自动化。(1)首先将寡核苷酸克隆到载体中。目前,由于合成技术不完美,预期一些寡核苷酸会含有错误,因此必须对最初的克隆进行测序以确证它们是正确的。最初的克隆可以来自大肠杆菌或单分子PCR。在本发明的一个实施方式中,利用错误修正技术来修正这些错误;这消除了对进行DNA测序的需要,并且允许不必等待测序结果而实施随后轮的装配。(2)装配DNA分子。(3)通过PCR或RCA扩增装配的DNA。(4)装配这些DNA。(5)通过PCR或RCA扩增装配的DNA。(6)继续这些循环直至全分子被装配。注意:与PCR相比,RCA允许扩增较大的分子,因此RCA优选用于较大片段装配阶段。克隆到宿主生物体中并且制备更多的装配片段,然后用可以完整地释放装配片段的限制酶进行消化,将等同于PCR或RCA。
实施例IV
使用各种体外方法装配几十万个碱基大小的DNA分子
该实施例比较了图1A(用T4 pol的两步循环变温装配)、图4A(用ExoIII的一步循环变温装配)和图5A(用T5 exo的一步等温装配)中显示的3种装配方法。发现一步等温装配是优选的体外装配方法。
方法1:两步循环变温装配(用T4 pol)
4×嚼回和退火(CBA)反应缓冲液(20%PEG-8000、800mM Tris-HCl pH 7.5、40mM MgCl2、4mM DTT)被用于循环变温DNA装配。在20μl由5μl 4×CBA缓冲液、0.2μl 10mg/ml BSA(NEB)和0.4μl 3U/μl T4 pol(NEB)组成的反应中装配DNA分子。可以用T7 pol替换T4 pol。以等摩尔的量添加大约10-100ng各~6kbDNA片段。对于较大的DNA片段,添加成比例增加量的DNA(例如,250ng各150kb DNA片段)。在0.2ml PCR管中准备装配反应并且如下进行循环:37℃,0至18分钟;75℃,20分钟;0.1℃/s冷却到60℃;保持在60℃ 30分钟;然后以0.1℃/s的速率冷却到4℃。一般地,对于小于80bp的重叠,使用5分钟的嚼回时间,而对于大于80bp的重叠,使用15分钟的嚼回时间。然后将10μl CBA反应添加到25.75μl Taq修复缓冲液(TRB)中,所述Taq修复缓冲液由5.83%PEG-8000、11.7mM MgCl2、15.1mM DTT、4种dNTP各311μM和1.55mM NAD+组成。添加4μl的40U/μl Taq lig(NEB)和0.25μl 5U/μl Taq pol(NEB)并且将反应在45℃下温育15分钟。对于T4 pol填补装配方法,将10μl CBA反应与0.2μl 10mM dNTP和0.2μl 3U/μl T4 pol混合。在37℃下将反应进行30分钟。
结果:步骤1:嚼回和退火。用于装配重叠DNA分子的现有技术2-步体外重组方法,利用T4 DNA聚合酶(T4 pol)的3′核酸外切酶活性产生ssDNA突出端,并且利用Taq DNA聚合酶(Taq pol)和Taq DNA连接酶(Taq lig)的组合修复被退火的连接。为了更好地理解该反应的动力学,将8个DNA分子,每个~6kb并且重叠~300bp,在37℃下暴露于T4 pol多达18分钟。每2分钟取走样品并且退火。在10分钟核酸外切酶反应后,大部分输入DNA被退火,并且观察到预测的~48kb全长产物。这些反应需要PEG-8000的存在,其是一种诱导大分子群集的试剂(参见图1B)。
装配重叠明显小于300bp的DNA分子具有几个优势。当连接合成的DNA片段时,较小的重叠将降低合成的总成本。另外,小重叠可以添加到PCR引物。由于这些原因,确定具有仅40bp重叠的DNA分子是否可以被装配。使用4个DNA分子——每个的长度为5kb并且重叠40bp,进行图1A中的装配反应。在暴露于T4 pol 2分钟之后,所有4个DNA分子被有效地装配成全长20kb的产物(图1C)。
接着确定明显较大的DNA分子是否可以通过该方法进行连接。将合成生殖道枝原体(M.genitalium)基因组的2个1/4分子——C25-49(144kb)和C50-77(166kb),具有257bp重叠,用T4 pol反应15分钟并且退火,然后通过倒转电场凝胶电泳(FIGE)进行分析(图1D)。它们被有效地装配成310kb的产物(Mgen25-77)。进一步,当所有4个1/4分子在相同条件下反应时,全长的合成生殖道枝原体基因组(~583kb)被装配(图1E)。
结果:步骤2:修复装配分子。Taq pol是优选的缺口填补酶,因为其不进行链置换,这将导致被连接DNA片段的解装配。它也具有固有的5′核酸外切酶活性(或切口翻译活性),这消除了使输入DNA磷酸化(DNA连接的必要条件)的需要。这是因为在切口翻译之后产生了5′-磷酸化末端。进一步,该活性去除任何非互补序列(例如,部分限制位点),这将以另外的方式在最终连接产物中终止。
为了核实装配DNA分子已经被成功修复,可以将dsDNA产物于94℃下在甲酰胺存在的情况下进行变性并且通过琼脂糖凝胶电泳进行分析(图2A)。对2对~5-6kb具有40bp或300bp重叠的DNA分子评价修复。在每种情况下都获得类似的结果(图2B)。在甲酰胺存在的情况下,被装配但未修复的DNA分子(泳道1)被变性成ssDNA输入(泳道2)。在Taq lig不存在的情况下,切口没有被封闭并且Taq pol的5′核酸外切酶活性消除了重叠DNA序列,导致DNA分子的解装配(比较泳道3和4)。在Taq lig存在的情况下(泳道5),切口被封闭并且观察到较高分子量ssDNA产物(泳道6)。因此,具有少至40bp重叠的dsDNA分子通过该装配方法共价连接。
在DNA装配期间错误的引入。在体外重组过程中,可以在装配DNA中引入突变。突变的第一来源是来自Taq pol,其每4000nt掺入大约1次不正确的核苷酸。突变的第二来源是来自用来PCR-扩增细菌人工染色体(BAC)的引物。当在生殖道枝原体基因组的合成期间30个装配分子被克隆和测序时,观察到了这两种错误类型。然而,在210个修复连接中,仅有1个错误可能由BAC PCR引起。显然,仅有3个错误可归因于Taq pol不精确的缺口填补。
利用修复步骤产生共价密封的环状DNA分子的装配方法考虑RCA的可能性(例如,通过phi29聚合酶扩增)。对于省略修复步骤的装配方法并不是这样的。为了证明这个,将4个片段——F5(1020bp)、F6(1040bp)、F7(2379bp)和F8(3246bp),每个都具有40bp重叠,连接成7525bp的环状物(图3)。如所期望的那样,仅被修复的装配产物可以通过phi29聚合酶进行扩增。
方法2:一步循环变温装配(用Exo III)
将4×嚼回、退火和修复(CBAR)反应缓冲液(20%PEG-8000、600mM Tris-HClpH 7.5、40mM MgCl2、40mM DTT、4种dNTP各800μM和4mM NAD+)用于一步循环变温DNA装配。在40μl反应中装配DNA分子(对于CBA反应以上述量添加),所述反应由10μl 4×CBAR缓冲液、0.35μl 4U/μl ExoIII(NEB)、4μl 40U/μl Taq lig和0.25μl 5U/μl Ab-Taq pol(Applied Biosystems)组成。在其贮存缓冲液(50%甘油、5mM KPO4、200mM KCl、5mM 2-巯基乙醇、0.05mM EDTA和200μg/ml BSA,pH 6.5)中将ExoIII由100U/μl稀释1∶25。在0.2ml PCR管中准备DNA装配反应并且使用下列条件进行循环:37℃,5或15分钟;75℃,20分钟;0.1℃/s冷却至60℃;然后保持在60℃,1小时。一般地,对于小于80bp的重叠使用5分钟的嚼回时间,而对于大于80bp的重叠使用15分钟的嚼回时间。ExoIII对3′突出端的活性低,这可能由某些限制酶的消化而引起。这可以通过在装配之前如上所述去除突出端以形成平端并添加T4 pol和dNTP来克服。
结果:需要缺乏dNTP以实现核酸外切酶活性的DNA装配方法,如上述基于T4 pol的系统,不能一步完成。这是因为随后需要dNTP填补缺口DNA分子。核酸外切酶III(ExoIII)——其从dsDNA的3′末端去除核苷酸——即使在dNTP不存在的情况下也是全功能的,因此它是1-步反应的候选物。然而,其与聚合酶竞争结合3’末端。为消除该竞争,并且考虑到1-步DNA装配,联合ExoIII来使用抗体结合Taq pol(Ab-Taq pol)(图4A)。在该装配方法中,将重叠DNA片段和所有共价连接DNA分子需要的组分(即,ExoIII、Ab-Taq pol、dNTPs和Taq lig)添加到单个管中,并放置在循环变温器中。在37℃下,ExoIII有活性(但Ab-Taq pol保持失活)并且使dsDNA分子的3′末端凹缺。然后将反应变成75℃,使ExoIII失活。DNA分子的退火开始并且抗体从Taq pol解离,从而使该酶激活。然后在60℃下实施进一步的退火、延伸和连接。
如图4B所示,4个具有40bp重叠或~300bp重叠的5至7kb DNA分子可以有效地被装配。序列盒78至81(240bp至300bp重叠)和片段F1至F4(40bp重叠)被装配,然后通过U-5FIGE进行分析。用箭头指出了完全装配产物和未反应的输入DNA。为证明被连接DNA分子通过该方法进行修复,将装配产物在甲酰胺存在的情况下变性并且在琼脂糖凝胶上进行分析。DNA分子被有效地装配和修复。如图4C中所示明的,片段F3和F4在ExoIII存在(+装配)或不存在(-装配)的情况下如所述的那样反应。通过在甲酰胺存在(+)或不存在(-)的情况下dsDNA分子的变性来评价修复,如图2A中所述。
方法3:一步等温装配(用T5 exo)
将5×等温(ISO)反应缓冲液(25%PEG-8000、500mM Tris-HCl pH 7.5、50mMMgCl2、50mM DTT、4种dNTP各1mM和5mM NAD+)用于50℃一步DNA等温装配。在40μl反应中装配DNA分子(对于CBA反应,以上述的量添加),所述反应由8μl 5×ISO缓冲液、0.8μl 0.2U/μl或1.0U/μl T5 exo(Epicentre)、4μl 40U/μlTaq lig和0.5μl 2U/μl Phusion pol(NEB)组成。根据重叠大小将T5 exo在其贮存缓冲液(50%甘油、50mM Tris-HCl pH 7.5、0.1mM EDTA、1mM DTT、0.1M NaCl,和0.1%Triton X-100)中由10U/μl稀释1∶50或1∶10。对于小于150bp的重叠,使用0.2U/μl T5 exo。对于大于150bp的重叠,使用1.0U/μl T5 exo。可以将所有等温装配组分在单个混合物中于1.33X浓度下-20℃贮存一年以上。在10次以上冷冻-解冻循环后酶仍有活性。为构建反应,向15μl该混合物添加5μl DNA。在50℃下实施温育15至60分钟,以60分钟是最佳的。
该DNA装配系统的方案,包括如何制备装配主要混合物:1.制备5×ISO缓冲液。6ml该缓冲液可以如下进行制备:3ml 1M Tris-HCl pH 7.5、150μl 2MMgCl2、60μl 100mM dGTP、60μl 100mM dATP、60μl 100mM dTTP、60μl 100mM dCTP、300μl 1M DTT、1.5g PEG-8000、300μl 100mM NAD+。添加水至6ml,等分成100μl并贮存在-20℃下。2.制备装配主要混合物。这可以如下进行制备:320μl 5×ISO缓冲液、0.64μl 10U/μl T5 exo(Epicentre)、20μl 2U/μl Phusion pol(NEB)和160μl 40U/μl Taq lig(NEB)。添加水至1200μl,等分成15μl并贮存在-20℃下。这对于具有20-150bp重叠的DNA分子的装配是理想的。对于重叠大于150bp的DNA分子,使用3.2μl 10U/μl T5 exo。3.解冻15μl装配混合物等分试样并且保持在冰上直至准备使用。4.向所述主要混合物添加5μl待被装配DNA。所述DNA应当是等摩尔的量。使用10-100ng各~6kb DNA片段。对于较大的DNA片段,应当添加成比例增加量的DNA(例如,250ng各150kb DNA片段)。5.在50℃下温育15-60分钟(60分钟是最佳的)。
结果:使dsDNA由5′末端凹缺并且不受dNTP存在所抑制的核酸外切酶也是一步DNA装配反应的候选物。而且,这些核酸外切酶不与聚合酶活性竞争。因此,DNA装配所需要的所有活性可以在单个等温反应中同时具有活性。使用5′-T5核酸外切酶(T5 exo)、PhusionTM DNA聚合酶(PhusionTM pol)和Taq lig的活性来优化50℃等温装配系统(图5A)。Taq pol可以用来代替PhusionTM pol;然而,PhusionTMpol是优选的,因为其具有固有的从装配分子去除非互补序列的校正活性。而且,PhusionTM pol具有明显低的错误率(New England Biolabs)。为测试该系统,从6kbpRS415载体切割2个重叠~450bp的限制片段并且重新装配成环状物(图5B)。在50℃下8分钟后,线性底物DNA完全被反应和/或降解,并且主要产物为6kb环状物,在0.8%琼脂糖凝胶上,其恰好迁移在4kb线性位置之下。在50℃温育12分钟后,T5 exo变得失活,并且不再参与DNA装配。T5 exo有活性地降解线性DNA分子;然而,闭合的环状DNA分子不被降解。该装配产物的环状性质通过用另外的T5 exo处理进行证实(图5B)。为证明该装配产物是预测的6kb环状物,将其用NotI(单割切)进行消化。然后观察6kb线性片段(图5C)。因此,使用该方法可以在单个等温步骤中装配和修复DNA分子。
接下来显示了,具有40bp重叠的分子也可以被连接。如果降低T5 exo的浓度,这便完成(图5D)。3个5kb DNA片段,F1至F3,有效地装配成BAC-F1/F3(~8kb)。而且,当来自4U/ml T5 exo反应的装配DNA分子转化到大肠杆菌时,得到450个集落并且十分之九的集落具有预测的15kb插入物(图5E)。
一般补充方法
用于体外重组的DNA分子的制备。在装配分析中使用的DNA分子源自几种来源,其包括(i)合成生殖道枝原体基因组的装配中间体,(ii)源自质粒(F6和F8)、解纤维梭菌(Clostridium cellulolyticum)基因组DNA(F1至F4)和鸡败血枝原体(Mycoplasma gallisepticum)基因组DNA(F5和F7)的PCR产物,以及(iii)pRS415限制片段。在一些情况下,从琼脂糖凝胶提取DNA片段;然而,这一般是不需要的。将DNA分子溶解或用Tris/EDTA(TE)缓冲液pH 8.0洗脱并且通过琼脂糖凝胶电泳用标准品进行定量。使用的具体方案如下:
将携带各生殖道枝原体序列盒号66至69(包含在pENTR223中)、各生殖道枝原体序列盒号78至85(包含在pBR322中)、C1-24、C25-49、C50-77、C78-101(均包含在pCC1BAC中)或pRS415的大肠杆菌菌株在含有适当抗生素的LB培养基中进行繁殖并且在30℃或37℃下温育16小时。收获培养物并使用Qiagen’s HiSpeed Plasmid Maxi Kit根据提供的说明纯化DNA分子,除C-装配物以外——其不进行柱纯化。而是,在中和裂解细胞之后,离心C-装配物然后用异丙醇进行沉淀。将DNA小球溶于Tris/EDTA(TE)缓冲液中,然后RNAse处理、酚-氯仿提取和乙醇沉淀。将DNA小球溶于TE缓冲液中。通过用FauI或BsmBI限制消化将序列盒66至69和78至85切离载体,并且通过用NotI消化切除C-装配物。为产生pRS415的4024bp和2901bp重叠片段,分别用PvuII和ScaI或PsiI消化DNA。通过酚-氯仿提取和乙醇沉淀来终止限制消化。将DNA溶于TE缓冲液pH 8.0中,然后通过凝胶电泳用标准品进行定量。使用PhusionTM Hot Start High-Fidelity DNA聚合酶用HF缓冲液(NEB)根据提供的说明通过PCR产生片段F1至F8。在电泳后从琼脂糖凝胶提取PCR产物并且使用QIAquick Gel Extraction Kit(Qiagen)根据提供的说明进行纯化,除了用TE缓冲液pH 8.0从柱上洗脱DNA之外。
分别使用下列引物由解纤维梭菌基因组DNA扩增片段F1至F4:F1-正向(GCAGCTTCAAGTCCTGCAAACAAGGTGTACCAGGATCGTT)(SEQ ID NO:1)和F1-反向(GATTTCAGTGTAGTTAGGGCCAGTTGAATTCAAACCTGCC)(SEQ ID NO:2);F2-正向(GGCAGGTTTGAATTCAACTGGCCCTAACTACACTGAAATC)(SEQ ID NO:3)和F2-反向(CTTGGTGCCATCAGCATTGTTCTCTGTACCGCCCACTGTC)(SEQ ID NO:4;F3-正向(GACAGTGGGCGGTACAGAGAACAATGCTGATGGCACCAAG)(SEQ ID NO:5)和F3-反向(CAGTTGAATAATCATGTGTTCCTGCGGCAAATGCAGTACC)(SEQ ID NO:6);以及F4-正向(GGTACTGCATTTGCCGCAGGAACACATGATTATTCAACTG)(SEQ ID NO:7)和F4-反向(TTATTTACCAAGAACCTTTGCCTTTAACATTGCAAAGTCA)(SEQ ID NO:8)。
分别使用下列引物由鸡败血枝原体基因组DNA扩增F5和F7:F5-正向(GCTTGCATGCATCCTGTTTATTCATCACAAACATTGAAC)(SEQ ID NO:9)和F5-反向(AATTCTGCAGTTTTTATTTCCTAACAGAACATTTTTTCTAGTATAGC)(SEQ ID NO:10);以及F7-正向(CGACTCTAGATAAATAGCCTTTCTTTATCTTTTTGAGGC)(SEQ ID NO:11)和F7-反向(CCGGGGATCCCTTTCTCAATTGTCTGCTCCATATATGTT)(SEQ ID NO:12)。
分别使用下列引物由pRST21扩增F6和F8:F6-正向(TAGAAAAAATGTTCTGTTAGGAAATAAAAACTGCAGAATTAAAAGTTAGTGAACAAGAAAAC)(SEQ ID NO:13)和F6-反向(AGCCTCAAAAAGATAAAGAAAGGCTATTTATCTAGAGTCGA CCTGCAGTTCAGATC)(SEQ ID NO:14);以及F8-正向(TGTTCAATGTTTGTGATGAATAAACAGGATGCATGCAAGCTTTTGTTCCCTTTAG)(SEQ ID NO:15)和F8-反向(AAACATATATGGAGCAGACAATTGAGAAAGGGATCCCCGGGTACCGAGCTC)(SEQ ID NO:16)。
装配产物的滚环扩增(RCA)。如先前所述来实施RCA。将1μl修复的或未修复的反应与1μl 100mM NaOH混合,并且在室温下温育5分钟以使双链DNA变性。然后在0.2ml PCR管中向19μl RCA组分中添加1μl该碱处理的混合物。RCA的最终反应浓度如下:37mM Tris-HCl pH 7.5、50mM KCl、10mM MgCl2、5mM(NH4)2SO4、100μg/ml BSA、1mM DTT、3.25mM随机六聚体(Fidelity System,MD)、1U/ml酵母焦磷酸酶(United States Biochemical)和250U/ml phi29 DNA聚合酶(NEB)。将反应在30℃下温育20小时,然后通过在65℃下温育10分钟进行终止。
克隆DNA装配产物。为克隆装配产物,在PCR-扩增的BAC存在的情况下实施反应,所述PCR-扩增的BAC含有与装配产物末端重叠的40bp重叠序列。也包括NotI限制位点以允许释放载体。一般使用pCC1BAC。然而,为克隆Mgen25-77,构建了一款pCC1BAC,称为KanBAC,其含有卡那霉素抗性基因而不是氯霉素抗性基因。使用Gene Pulser Xcell电穿孔系统(BioRad)在1200V、25μF和200Ω下于1mm杯(BioRad)中将装配反应的样品(多达1μl)转化到30μl TransforMaxTMEPI300TM(Epicentre)电转化感受态大肠杆菌细胞。使细胞在1ml SOC培养基中30℃或37℃恢复2小时,然后在LB培养基+12.5μg/ml氯霉素或LB培养基+25μg/ml卡那霉素上铺板。在30℃或37℃温育24至48小时后,选择单个克隆并且在3ml LB培养基+12.5μg/ml氯霉素或25μg/ml卡那霉素中30℃或37℃生长过夜。使用Qiagen供应的P1、P2和P3缓冲液通过碱裂解作用由这些细胞制备DNA,然后异丙醇沉淀。将DNA小球溶于含有RNAse的TE缓冲液pH 8.0中,然后用NotI消化以从BAC释放插入物。
装配DNA分子和克隆产物的琼脂糖凝胶分析。在0.8%E-凝胶(Invitrogen,目录#G5018-08)上进行U-5FIGE分析并且参数为正向(forward)72V、最初转换(initial switch)0.1sec、最终转换(final switch)0.6sec,为线性斜坡电压(linear ramp),以及反向(reverse)48V、最初转换0.1sec、最终转换0.6sec,为线性斜坡电压。在含有0.5μg/ml溴化乙锭的1×TAE缓冲液中在1%琼脂糖凝胶(BioRad,目录#161-3016)上进行U-2 FIGE分析不用循环并且参数为正向90V、最初转换5.0sec、最终转换30sec,为线性斜坡电压,以及反向60V、最初转换5.0sec、最终转换30sec,为线性斜坡电压。用BioRad Gel Doc或Amersham Typhoon 9410荧光成像仪使DNA条带显现。
实施例V
3种DNA装配方法的比较
该实施例比较了3种不同体外装配方法的效率,如图1A(采用T4 pol的两步循环变温装配)、图4A(采用ExoIII的一步循环变温装配)和图5A(采用T5 exo的一步等温装配)中所示。
A.装配31kb片段的效率
在步骤(a)中,如图6A中所示,将序列盒66至69(5.9kb至6.2kb,有80bp重叠)装配到BAC66-69(~8kb,有40bp重叠)中,如图1A中所示,无修复(CBA)、完全修复(CBA+TRB)或T4 pol缺口填补修复但无连接(T4 pol填补),以及如图4A(ExoIII)和图5A(T5 exo)所示。通过U-5FIGE分析相等的量,然后转化到大肠杆菌中。
然后,在步骤(b)中,如图6B中所示,0.1μl步骤(a)装配反应的样品得到所指出数量的转化体。对于各装配方法,从10个转化体中提取DNA并且用NotI消化以确定正确的插入物大小(~23kb,用*表示)。
B.装配310kb片段的效率
在步骤(c)中,如图6C中所示,使用(a)中描述的方法将两个四分之一生殖道枝原体基因组C25-49和C50-77装配到BAC25-77(~8kb,有40bp重叠)中。通过U-2 FIGE分析每个的馏分。在步骤(d)中,如图6D中所示,将相等的量转化到大肠杆菌中并且1μl(c)中装配反应样品得到所指出数量的转化体。对于CBA和T4pol填补反应,没有获得转化体,因此分析在该步骤终止。由各装配方法的7至10个转化体制备DNA,然后用NotI消化以确定正确的插入物大小(~310kb,用表示)。
装配DNA分子的克隆是这些方法的共同应用。因此,重要的是确定哪一种装配方法对于克隆是最佳的。首先,比较了将合成生殖道枝原体序列盒66至69(每个~6kb并有80bp重叠)连接到与装配物末端有40bp重叠的BAC中的效率。还包括与另外2个省略填补和连接步骤的DNA装配系统的比较。所述5种方法每种均有效地和类似地将序列盒66至69装配到BAC66-69中,如FIGE所测定(图6A)。然后将相等量的这些DNA分子转化到大肠杆菌中。在NotI消化——其将载体从~23kb插入物释放——之后,对从每种方法中随机选择的10个克隆进行分析(图6B)。对于每种方法,90至100%的克隆具有正确的插入物。省略DNA聚合酶和连接酶仅得到完全修复所达到的克隆数的2%。这强调了修复步骤的重要性。留有切口未封闭但填补缺口将克隆效率增加到完全反应的44%,这表明缺口可以明显地影响大肠杆菌中的克隆效率。
在先前构建合成生殖道枝原体基因组的工作中,无法使用用于在大肠杆菌中由1/4分子克隆1/2基因组的图1A中显示的DNA装配策略。用本发明的新型体外方法重复装配以确定这些装配方法任何一种是否都可以用来由C25-49和C50-77克隆Mgen25-77(310kb)。每种方法有效地连接310kb,一半生殖道枝原体基因组(图6C)。如所期望的那样,使用图1A中概括的策略无法在大肠杆菌中克隆该DNA分子。用T4 pol填补缺口但留有切口未密封,不产生转化体。然而,本发明的基于ExoIII和T5 exo的一步系统被成功地用来克隆这些大DNA分子(图6D)。因此,有2种本发明中所述的优选DNA装配系统,其可以用来在大肠杆菌中有效地连接和克隆长度多达几百kb的DNA分子,接近转化到该细菌中的上限。
实施例VI
大DNA分子的装配
本发明方法能够装配空前大小的DNA分子。体外装配全合成~583kb生殖道枝原体基因组。DNA分子越大则越脆是公知的。装配如此大分子的成功可以归因于在这些反应中PEG的存在。该试剂的粘性可以降低这些大分子在溶液中的剪切力。体外DNA装配的大小极限是未知的;然而,对于每种装配方法已经观察到大至900kb的产物。这些方法可以提供足够量的重组产物用于目的应用。如不够的话,可以将装配产物在宿主生物体中繁殖。然而,通过一步装配方法而不是通过两步方法,在大肠杆菌中仅克隆过~300kb的装配DNA分子。一种解释是,减少反应操作降低DNA损伤,从而获得更完整的克隆。一旦开发出较好的体外扩增工具(例如,RCA),便可以不再需要在宿主生物体中复制被装配构建物。然而,目前报道的最大的phi29产物仅为~70kb。
尽管本文提供了几种重组方法,但一步等温系统由于其简便性而是优选的。该装配系统的所有组分都可以预先混合并且冷冻保藏直至需要时。因此,DNA装配所需要的全部,是输入DNA被添加到该混合物中,以及混合物简便地在50℃温育。该方法对于将多个插入物克隆到载体中——不依赖限制位点的可利用性,以及对于快速构建大DNA分子都是非常有用的。例如,太大而无法通过单个PCR事件进行扩增的DNA区域可以分割成多个重叠PCR扩增子,然后装配成一个片段。等温系统有利于装配环状产物,所述环状产物因为不是3种酶中任何一种的底物而积聚。另一方面,一步循环变温方法可以用来产生线性装配物,因为核酸外切酶在反应过程中失活。
实施例VII
密码子优化
本发明的方法可以用来依照宿主细胞优化密码子使用以构建具有最佳蛋白收率的基因。通常,产生最高量的蛋白的基因给出最佳收率。然而,如果基因对产生该基因的宿主细胞有毒的话,最佳收率可能低于最高收率。
通过计算优化基因密码子以产生全基因的单个序列。该单个序列产生最佳收率可能不是最好的,但充当起始点。接下来,通过计算产生寡核苷酸以便在所选位点的密码子选择被改变。如图7A中所示,寡核苷酸可以包含一个以上密码子,但在每个寡核苷酸中至少一个密码子被改变。例如,在3种形式的“Oligo 1”中存在编码亮氨酸的3个不同的密码子。寡核苷酸彼此重叠以便允许根据本文描述的方法进行装配。
足够数量的寡核苷酸被用来装配整个基因。当根据装配反应,如上述装配反应中任何一种装配寡核苷酸时,产生基因文库以便每个成员含有密码子变体的特定组合。然而,每个文库成员产生相同的氨基酸序列。因而根据所选宿主的偏好,所述方法允许优化基因产物的翻译以提供相同的多肽。可以分析各个克隆的天然蛋白产率,并且选择产生最佳收率的克隆。
实施例VIII
基因优化
本发明方法可以用来提供具有最大活性的蛋白。具有最大活性的蛋白由一组同源蛋白序列的共有序列组成。图7B描述了5种同源蛋白,每种蛋白含有3个基序和1个结构域。例如,蛋白1可以来自人,蛋白2来自线虫(C.elegans),蛋白3来自酿酒酵母(S.cerevisiae),蛋白4来自小鼠,以及蛋白5来自黒腹果蝇(D.melanogaster)。共有蛋白具有来自蛋白5的基序A、来自蛋白2的基序B、来自蛋白1的结构域A和来自蛋白3的基序C。
技术人员可以通过将来自一组同源蛋白的基序和结构域蛋白区段的不同组合放在一起合成产生蛋白变体文库。在图7B的方案中,多样性或文库复杂性是5的4次方,或625个可以测试到最大活性的独特克隆。基序和结构域蛋白区段可以根据先前实施例方法中任何一种来合成。然后,可以筛选文库克隆的最大蛋白活性。
实施例IX
途径优化和组合文库装配
本发明的方法可以用来组合途径中多种形式的各基因,其被随机装配产生组合途径文库,如图7C中所示。然后将所有体外装配反应的产物克隆到适当的受体细胞中,然后分析细胞的特定产物收率或途径特征。
各基因的形式可以是来自多个物种或根据先前实施例合成产生的变体的同源染色体。基因可以包括根据物种不同而不同的上游启动子元件,以便可以从涉及转录因子的途径获得最佳收率。
这些方法允许对巨大变体途径进行筛选的可能性,所述巨大的变体途径以往不可能单独合成。例如,109变体途径的组合文库可以由90个单个基因(在途径中9个基因中每个基因10个变体)进行构建。单独合成基因,但在体外有效且快速地组合装配途径。每个基因侧翼具有连接序列,所述连接序列提供与邻近途径基因的任何变体的重叠(或在第一和最后途径基因的情况下与载体的重叠)。通过本发明的装配反应将所有90个基因与载体进行合并并且连接,以产生组合文库。
实施例X
用以优化乙酸利用途径的组合文库的装配
本发明的方法被用来创建合成制备的与大肠杆菌乙酸激酶ackA基因和磷酸转乙酰酶pta基因的直系同源物的组合文库,以便优化乙酸利用(ackA/pta)途径。大肠杆菌的ackA/pta途径能够生长在作为碳源的乙酸上。两基因均调节乙酸和乙酰基-CoA之间的相互转变,如图8A中所示。乙酸激酶(ackA)将乙酸加ATP转变成乙酰磷酸。磷酸转乙酰酶(pta)将乙酰磷酸和CoA转变成乙酰基-CoA。大肠杆菌于高密度培养中在过量葡萄糖发酵过程中产生大量的乙酸,并且在需氧条件下乙酸是主要的副产物。高乙酸浓度抑制生长,是因为其解耦了跨膜pH梯度,这进而不利地影响内部渗透压、pH和氨基酸合成。此外,生物质的酸预处理释放大量乙酸(源自半纤维素的乙酰基侧链)。在该实施例中描述的方法显示了,组合优化促进宿主细胞的乙酸利用以消除过量乙酸并提高宿主生长的应用。开发出了一种大肠杆菌菌株,其当生长在葡萄糖-盐基本培养基中时不受乙酸存在的抑制并且可以在作为唯一碳源的乙酸上旺盛生长。
ackA和pta基因的变体在独立的启动子控制下被组合放在一起。由这两个基因的合成的直系同源物构建文库,所述两个基因来自5种不同的生物体,每个基因有4种不同的启动子,如图8B中所示。所述生物体是噬乙酸甲烷八叠球菌(Methanosarcina acetivorans)、Clostridium phytofermentans、甲醇粘土杆菌(Pelobacter carbinolicus)、活泼瘤胃球菌(Ruminococcus ignavus)和大肠杆菌。四种启动子具有不同的强度,如VS(非常强;recA)、S(强;A1 T7)、M(中等;ssb)和L(低;lacI)所示明的那样。通过Integrated DNA Technologies(IDT)合成制备了所有变体片段。文库的复杂性(组合构建物的总数)是400(4×5×4×5)。
为了构建文库,需要四个不同的DNA片段以及载体,总共需要装配五个DNA片段。向每个基因添加核糖体结合位点(rbs)和终止子序列,如图8C中所示。另外,使用连接体(40bp)连接基因与启动子片段。在总插入物的两端与BAC载体重叠40bp的序列(在EcoRI位点线性化的pCC1BAC,Epicentre)被用来进行全装配。
所有合成的核酸部分(基因和启动子)侧翼有NotI位点并且作为插入物提供在pUC57质粒中。为了从质粒中释放这些片段,在等温T5装配步骤之前需要NotI限制消化步骤。在NotI消化反应中的DNA由25fmol各启动子片段(共8个)和20fmol各基因(共10个)组成。还有,PCR扩增的大肠杆菌基因被添加到反应(即使它们在质粒中不被克隆),并且其不含有NotI位点,因而不受消化影响。NotI限制消化反应在37℃下以50μL进行1小时,并且其含有下列:28μl DNA、15.5μl H2O、0.5μl BSA、5μl缓冲液和1μl NotI。
在37℃ 1小时温育后,用酚-氯仿-异戊醇提取DNA并且乙醇沉淀。将小球重悬浮在28μL相同最初体积中。然后,通过将下列试剂在50℃温育30分钟来进行等温T5核酸外切酶装配反应:28μl合并的DNA(4个合并的片段各100fmol)、1.0μl pCCIBAC(100fmol)、16μl 5×ISO缓冲液、1.6μl T5核酸外切酶(0.2U/μl,Epicentre)、8.0μl Taq DNA连接酶(40U/μl,NEB)、1.0μl PhusionDNA聚合酶(2U/μl,NEB)和24.4μl H2O,共计80μl反应。
用酚-氯仿-异戊醇提取反应中的DNA并且乙醇沉淀。在0.8%EtBr E-Gel显现潜在的装配产物。使用标准程序转化大肠杆菌,并且选择不被乙酸抑制并且在作为唯一碳源的乙酸上生长良好的菌株。用装配反应转化三重大肠杆菌突变体(ΔacsΔackA Δpta;缺乏乙酸利用,因此在乙酸底物上不生长),由此用2μl装配反应电穿孔20μl电转化感受态细胞。将这些细胞在基本培养基琼脂板上进行铺板,所述基本培养基琼脂板含有50mM乙酸作为唯一碳源和用于选择的氯霉素,并且在32℃温育4天。然后如图8D中所示分析所得集落以确证组合装配产物的存在(与8,128bp的质粒对照相比为11,830bp),然后进行序列检验。在乙酸上不能生长的三重突变体因而用pACK-PTA组合装配的构建物成功地转化。
然后可以筛选组合构建物变体的期望的性质,如高产生水平和乙酸的有效利用。
实施例XI
使用T5核酸外切酶一步等温方法装配全小鼠线粒体基因组
本发明的方法被用来装配全小鼠线粒体基因组。该实施例显示了该基因组的装配,该基因组由于其~65%的高A+T含量先前难以进行装配。使用8×60mer装配方法——即每个微量滴定板孔8个具有20bp重叠的60个碱基寡核苷酸以便每个孔装配300bp——在75个孔中进行了装配。
简要地,合成了600个60个碱基的寡核苷酸以涵盖整个线粒体基因组,所述寡核苷酸具有适当的20bp重叠区域。8个寡核苷酸的75个反应的每个在180nM的每一寡核苷酸浓度下进行合并。然后将寡核苷酸库用装配反应组分稀释1∶4,并且在pUC19载体中用本发明的T5等温装配方法50℃下装配1小时。在各插入物两侧的NotI限制位点在装配之后产生,是因为它们被以每组8个添加到末端寡核苷酸(例如,oligo 1和oligo 8),从而使插入物在下一轮装配之前从载体中释放。然后将75个装配反应经由电穿孔转化到大肠杆菌中,用于进一步的分析。检验所有装配物的序列。用Phusion聚合酶将产物扩增至饱和(30个循环,所有75个片段在35-45ng/μl之间)。合并5个反应并用NotI进行消化以去除非互补序列。
然后依次合并孔中NotI消化的反应产物,首先形成1,180bp片段(在15个反应中5个300bp片段)。将前一步5个反应的库如上装配在pBR322载体中。在每个插入物两侧的AscI限制位点在装配之后产生,是因为它们被以每组5个设计到产生末端序列盒(例如,序列盒1和序列盒5)的寡核苷酸中,从而使插入物在下一轮装配前从载体释放。(参见图9A);然后用Phusion聚合酶扩增至饱和(30个循环,所有15个片段在45-70ng/μl之间(参见图9B)。合并5个反应并用AscI消化以去除非互补序列。
然后合并AscI消化的反应产物,形成5,560bp片段(3个反应中5个1,180bp片段)。将前一步5个反应的库如上装配在pSmart-BAC载体中。在每个插入物两侧的SbfI限制位点在装配之后产生,是因为它们被以每组3个设计到产生末端序列盒的寡核苷酸中(例如,序列盒1和序列盒25),从而使插入物在下一轮装配之前从载体释放。(参见图9C);然后用Phusion聚合酶扩增20-25个循环(参见图9D)。合并3个反应并用SbfI消化以去除非互补序列。
16,520bp的完整线粒体基因组的最终装配是在pCC1BAC(图9E-在1个反应中3个5,560bp片段)中,其表现NC_005089小家鼠属(M.musculus)线粒体基因组(16,299bp)。装配基因组被设计成含有另外的221个碱基(在序列的末端复制碱基1-221,参见如下),因此装配产物是16,520bp而不是16,299bp。然后检验全长序列克隆的序列。
为了产生不含任何载体序列的线粒体基因组(即,准确地说是在自然中所发现的),在16,299bp序列的末端(即在碱基16,300bp至16,520bp)复制碱基1-221,以产生16,520bp的装配产物大小。用PmlI(其被设计到产生序列盒1和75的寡核苷酸中)消化释放载体序列。这创建了线粒体基因组末端之间的重叠,其然后可以通过T5核酸外切酶等温装配方法(或其它装配方法)进行连接,如图9F中所示。
从上面的描述来看,本领域技术人员能容易地确定本发明的本质特征,并且在不背离其精神和范围的情况下,可以对本发明作出改变和修正,以使其适应各种应用和条件以及最大限度地利用本发明。前述具体实施方式被解释为仅仅是说明性的,而不以任何方式限制本发明的范围。上面和图中所引用的所有申请、专利、公开(包括参考手册)的整个公开内容通过引用全部并入本文。