《用于合成错误最小化核酸分子的材料和方法.pdf》由会员分享,可在线阅读,更多相关《用于合成错误最小化核酸分子的材料和方法.pdf(48页珍藏版)》请在专利查询网上搜索。
1、10申请公布号CN104220602A43申请公布日20141217CN104220602A21申请号201380009031722申请日2013020161/593,81320120201USC12P19/3420060171申请人合成基因组股份有限公司地址美国加利福尼亚州72发明人D吉布森N卡亚扎T理查德松74专利代理机构北京纪凯知识产权代理有限公司11245代理人赵蓉民陆惠中54发明名称用于合成错误最小化核酸分子的材料和方法57摘要本发明提供了可用于对核酸分子进行纠错的材料和方法。通过暴露于具有单向错配内切核酸酶活性的分子来使具有核苷酸错配的第一多个双链核酸分子片段化,留下在所述分子的末。
2、端或近末端具有错配的双链核酸分子。然后将所述核酸分子暴露于具有单向外切核酸酶活性的分子以去除所述错配核苷酸。然后通过例如具有DNA聚合酶活性的分子的作用填充所述缺失的核苷酸。结果是双链核酸分子的核苷酸错配频率降低。本发明还提供了编码错配内切核酸酶的新颖核酸序列、由此编码的多肽以及核酸构建体、转基因细胞及其各种组合物。30优先权数据85PCT国际申请进入国家阶段日2014081286PCT国际申请的申请数据PCT/US2013/0244962013020187PCT国际申请的公布数据WO2013/116771EN2013080851INTCL权利要求书3页说明书37页附图7页19中华人民共和国国。
3、家知识产权局12发明专利申请权利要求书3页说明书37页附图7页10申请公布号CN104220602ACN104220602A1/3页21一种对核酸分子进行纠错的方法,所述方法包括A获得包含至少一个核苷酸错配的第一多个双链核酸分子;B通过使具有错配的所述核酸分子与具有单向错配内切核酸酶活性的至少一种分子反应来使具有错配的所述多个双链核酸分子片段化;C通过使B的具有错配的所述片段化双链核酸分子与具有与B的所述单向错配内切核酸酶活性相同的方向性的单向外切核酸酶活性的至少一种分子反应来去除所述核苷酸错配,从而提供片段化无错双链核酸分子;和D组装包含C的所述片段化无错双链核酸分子的第二多个双链核酸分子,。
4、其中与所述第一多个双链核酸分子相比,所述第二多个双链核酸分子的核苷酸错配频率降低。2根据权利要求1所述的方法,其中所述第一多个核酸分子包含一个或多个合成核苷酸序列。3根据权利要求1所述的方法,其中所述第一多个核酸分子包含一个或多个天然存在的基因序列和一个或多个合成核苷酸序列的混合物。4根据权利要求1所述的方法,其中获得第一多个核酸分子包括合成所述核酸分子。5根据权利要求1所述的方法,其中获得第一多个核酸分子包括由亚型和/或寡核苷酸组装所述核酸分子。6根据权利要求1所述的方法,其中步骤B和步骤C作为独立反应进行。7根据权利要求1所述的方法,其中步骤B和步骤C作为一步同步反应进行。8根据权利要求1。
5、所述的方法,其中所述单向错配内切核酸酶活性将5切成所述错配而所述单向外切核酸酶活性将所述核苷酸错配从所述片段化核酸分子的5末端去除。9根据权利要求1所述的方法,其中所述单向错配内切核酸酶活性将3切成所述错配而所述单向外切核酸酶活性将所述核苷酸错配从所述片段化核酸分子的3末端去除。10根据权利要求1所述的方法,其中具有单向错配内切核酸酶活性的所述至少一种分子选自RESI、CELI、CELII、SP内切核酸酶、SPI、T7内切核酸酶、T4内切核酸酶、内切核酸酶V、MUT蛋白质、其中任一种的变体和以上任两种或更多种的组合。11根据权利要求10所述的方法,其中具有单向错配内切核酸酶活性的所述至少一种分。
6、子选自CELI、CELII、其中任一种的变体和以上任两种或更多种的组合。12根据权利要求1所述的方法,其中具有单向错配内切核酸酶活性的所述至少一种分子由选自以下的核酸序列编码A在低、中或高严格条件下与选自SEQIDNO01、SEQIDNO03、SEQIDNO05、SEQIDNO07、SEQIDNO09、SEQIDNO12、SEQIDNO15、SEQIDNO18、SEQIDNO20、SEQIDNO22、SEQIDNO24、SEQIDNO26、SEQIDNO28、SEQIDNO30、SEQIDNO32、任一种的补体和任一种的片段的核酸序列杂交的核酸序列;B对选自SEQIDNO01、SEQIDNO0。
7、3、SEQIDNO05、SEQIDNO07、SEQIDNO09、SEQIDNO12、SEQIDNO15、SEQIDNO18、SEQIDNO20、SEQIDNO22、SEQIDNO24、SEQIDNO26、SEQIDNO28、SEQIDNO30、SEQIDNO32、任一种的补体和任一种的片段的核酸序列展现出70或更高同一性的核酸序列;和C编码对选自SEQIDNO02、SEQIDNO04、SEQIDNO06、SEQIDNO08、SEQIDNO10、SEQIDNO11、SEQIDNO13、SEQIDNO14、SEQIDNO16、SEQIDNO17、SEQID权利要求书CN104220602A2/3页。
8、3NO19、SEQIDNO21、SEQIDNO23、SEQIDNO25、SEQIDNO27、SEQIDNO28和SEQIDNO29的氨基酸序列展现出60或更高同一性的多肽的核酸序列。13根据权利要求1所述的方法,其中具有单向外切核酸酶活性的所述至少一种分子选自外切核酸酶III、DNA聚合酶、外切核酸酶、T7外切核酸酶、T5外切核酸酶及其中任一种的变体。14根据权利要求1所述的方法,其中具有单向外切核酸酶活性的所述至少一种分子为具有校正活性的聚合酶。15根据权利要求14所述的方法,其中具有校正活性的所述聚合酶选自T4聚合酶、T7聚合酶和PHI29聚合酶。16根据权利要求1所述的方法,其中具有单向。
9、错配内切核酸酶活性的所述至少一种分子选自CELI、CELII、其中任一种的变体和以上任两种或更多种的组合;和具有单向外切核酸酶活性的所述至少一种分子选自外切核酸酶III及其变体。17一种分离的核酸分子,其包含A在低、中或高严格条件下与选自SEQIDNO09、SEQIDNO12、SEQIDNO15、SEQIDNO18、SEQIDNO20、SEQIDNO22、SEQIDNO24、SEQIDNO26、SEQIDNO28、SEQIDNO30、SEQIDNO32、其补体或任一种的片段的核酸序列杂交的核酸序列;或B对选自SEQIDNO09、SEQIDNO12、SEQIDNO15、SEQIDNO18、SEQ。
10、IDNO20、SEQIDNO22、SEQIDNO24、SEQIDNO26、SEQIDNO28、SEQIDNO30、SEQIDNO32、其补体或任一种的片段的核酸序列展现出70或更高同一性的核酸序列;或D编码对选自SEQIDNO10、SEQIDNO11、SEQIDNO13、SEQIDNO14、SEQIDNO16、SEQIDNO17、SEQIDNO19、SEQIDNO21、SEQIDNO23、SEQIDNO25、SEQIDNO27、SEQIDNO28和SEQIDNO29的氨基酸序列展现出50或更高同一性的多肽的核酸序列。18根据权利要求17所述的核酸分子,其中所述核酸序列编码具有错配内切核酸酶活性。
11、的分子。19一种重组核酸构建体,其包含与异源核酸可操作连接的根据权利要求17所述的核酸分子。20根据权利要求19所述的重组核酸构建体,其中所述异源核酸为异源转录控制元件。21根据权利要求19所述的重组核酸构建体,其中所述异源核酸包含编码多肽序列的核酸序列。22根据权利要求21所述的重组核酸构建体,其中所述多肽序列包含分泌信号或表位标签。23一种重组宿主细胞,其包含根据权利要求19所述的核酸构建体。24根据权利要求23所述的重组宿主细胞,其中所述宿主细胞为昆虫细胞、哺乳动物细胞、微生物细胞或植物细胞。25一种分离的多肽,其中所述多肽通过引入宿主细胞中的根据权利要求17所述的包含核酸序列的核酸分子。
12、来表达。权利要求书CN104220602A3/3页426根据权利要求25所述的分离的多肽,其中所述多肽包含选自SEQIDNO11、SEQIDNO11的氨基酸残基1297、SEQIDNO11的氨基酸残基22308、SEQIDNO17、SEQIDNO17的氨基酸残基1320和SEQIDNO17的氨基酸残基22331的氨基酸序列。27一种组合物,其包含I具有单向错配内切核酸酶活性的分子;和II具有与I的所述单向错配内切核酸酶活性相同的方向性的单向外切核酸酶活性的分子。28根据权利要求27所述的组合物,其中I的所述分子选自RESI、CELI、CELII、T7内切核酸酶、T4内切核酸酶、内切核酸酶V、M。
13、UT蛋白质、其中任一种的变体和以上任两种或更多种的组合;并且II的所述分子选自外切核酸酶III、DNA聚合酶、其中任一种的变体和以上任两种或更多种的组合。29根据权利要求27所述的组合物,其中I的所述分子选自CELI、CELII、其中任一种的变体和以上任两种或更多种的组合;并且II的所述分子选自外切核酸酶III及其变体。30根据权利要求27所述的组合物,其中I的所述分子选自RESI、CELI、CELII、T7内切核酸酶、T4内切核酸酶、内切核酸酶V、MUT蛋白质、其中任一种的变体和以上任两种或更多种的组合;并且II的所述分子为外切核酸酶III或其变体。31一种试剂盒,其包含根据权利要求27所述。
14、的组合物。32根据权利要求31所述的试剂盒,其中具有单向错配内切核酸酶活性的所述分子选自RESI、CELI、CELII、T7内切核酸酶、T4内切核酸酶、内切核酸酶V、MUT蛋白质、其中任一种的变体和以上任两种或更多种的组合;并且具有与所述单向错配内切核酸酶相同的方向性的单向外切核酸酶活性的所述分子选自外切核酸酶III、DNA聚合酶、其中任一种的变体和以上任两种或更多种的组合。33根据权利要求32所述的试剂盒,其中具有与所述单向错配内切核酸酶活性相同的方向性的单向外切核酸酶活性的所述分子选自RESI、CELI、CELII、T7内切核酸酶、T4内切核酸酶、内切核酸酶V、MUT蛋白质、其中任一种的变。
15、体和以上任两种或更多种的组合;并且具有与所述单向错配内切核酸酶相同的方向性的单向外切核酸酶活性的所述分子选自外切核酸酶III或其变体。权利要求书CN104220602A1/37页5用于合成错误最小化核酸分子的材料和方法0001本申请要求2012年2月1日提交的美国临时申请序列号61/593,813的权益,其据此通过引用整体并入,包括所有表格、附图和权利要求。发明领域0002本发明总体涉及分子生物学和遗传学,并且涉及基因和其它核酸分子的合成。0003序列表的并入0004所附序列表中的材料据此通过引用并入本申请中。名称为SGIXXXXXPCT_序列表的所附序列表文本文件于当日创建并且为XXKB。可。
16、在使用WINDOWSOS的电脑上用MICROSOFTWORD评估所述文件。0005发明背景0006在现代分子生物学和基因工程中,许多涉及使用核酸分子的分子技术往往需要通过合成法生成大量核酸分子。例如,要测试代谢工程或基因组学领域的假说,合成指定蛋白质和具有定制基因组的生物,往往需要有成本效益的合成对预定核苷酸序列高度保真的核酸分子的方法。核酸合成,例如双链DNA合成的常见方法包括聚合酶链式反应法和连接链式反应法。通常,如果不是必须,则确保合成DNA分子含有正确的核苷酸序列对于要使用合成DNA的分子技术的成功很重要。例如,合成用于功能多肽的基因表达的DNA编码序列需要精确的DNA序列;因为即使一。
17、个核苷酸取代、插入或缺失也可对最终生成的多肽造成重大后果。因此,普遍认为从合成DNA群体中将具有不正确的DNA序列的DNA分子减到最少在提供通过基因从头合成法生成无错合成DNA中必不可少。0007最近,在控制成本的同时准确合成核酸分子的努力已经取得了包括基于微芯片的基因合成和基于PCR的基因组装技术在内的方法。虽然这些传统技术提供了合成多个基因的能力,但是减少引入所需基因序列中的错误仍充满挑战。为避免基因合成中固有的序列错误问题,一些人集中于纯化在合成方法早期使用的寡核苷酸。然而,这些寡核苷酸纯化方法成本高,而序列错误依然存在并且在合成方法的后续步骤中传播。0008因此,需要减少DNA分子群体。
18、中的序列错误的替代方法。所期望的是以更高的具有所需核苷酸序列的分子产量,合成基因和其它核酸分子的途径。可在合成方法的较晚步骤纠正序列错误的方法在核苷酸序列准确性上可能产生所需增加,同时使所述方法有成本效益。0009发明概述0010本发明提供了用于对核酸分子的复制和扩增进行纠错的方法和材料。在本发明的一个实施方案中,通过暴露于单向错配内切核酸酶来使具有核苷酸错配的第一多个双链核酸分子片段化。用内切核酸酶在错配位点或附近切割核酸分子,留下在所述分子的末端或近末端具有错配的双链核酸分子。在一个实施方案中,然后将所述核酸分子暴露于在5至3或3至5方向具有单向活性的外切核酸酶,从而去除错配核苷酸。由去除。
19、了错配核苷酸的核酸组装第二多个双链核酸分子。然后直接或在后续扩增步骤,通过例如DNA聚合酶的作用填充所述缺失的核苷酸,并且如果有必要可重复这些步骤多次。结果是与第一多个说明书CN104220602A2/37页6核酸分子相比,双链核酸分子的核苷酸错配频率降低。0011因此,一方面本发明提供了核酸分子纠错的方法。所述方法涉及A获得具有至少一个核苷酸错配的第一多个双链核酸分子;B通过使具有错配的所述核酸分子与具有单向错配内切核酸酶活性的至少一种分子反应来使具有错配的所述多个双链核酸分子片段化;C通过使B的具有错配的所述片段化双链核酸分子与具有与B的所述单向错配内切核酸酶活性相同的方向性的单向外切核酸。
20、酶活性的至少一种分子反应来去除所述核苷酸错配,从而提供片段化无错双链核酸分子;和D组装具有C的所述片段化无错双链核酸分子的第二多个双链核酸分子。与所述第一多个双链核酸分子相比,所述第二多个双链核酸分子的核苷酸错配频率降低。0012在一个实施方案中,所述第一多个核酸分子可含有一个或多个合成核苷酸序列。所述第一多个核酸分子可含有一个或多个天然存在的基因序列和一个或多个合成核苷酸序列的混合物。在一个实施方案中可通过合成核酸分子,或在另一实施方案中可通过由亚型和/或寡核苷酸组装所述核酸分子获得第一多个核酸分子。0013在所述方法的一个实施方案中,上述步骤B和步骤C作为独立反应进行,但是在另一实施方案中。
21、步骤B和步骤C作为同步或一步反应进行。在所述方法的一个实施方案中,所述单向错配内切核酸酶活性将5切成所述错配而所述单向外切核酸酶活性将所述核苷酸错配从所述片段化核酸分子的5末端去除。但是在另一实施方案中,所述单向错配内切核酸酶活性将3切成所述错配而所述单向外切核酸酶活性将所述核苷酸错配从所述片段化核酸分子的3末端去除。具有单向错配内切核酸酶活性的分子的实例包括但不限于RESI、CELI、CELII、SP内切核酸酶、SPI内切核酸酶、T7内切核酸酶、T4内切核酸酶、内切核酸酶V、MUT蛋白质、其中任一种的变体和以上任两种或更多种的组合。在一个优选实施方案中,利用CELI、CELII或CELI和C。
22、ELII的组合。在另一优选实施方案中,具有单向错配内切核酸酶活性的分子由包含在低、中或高严格条件下与选自以下的核酸序列杂交的核苷酸序列的核酸分子编码A在低、中或高严格条件下与选自SEQIDNO01、SEQIDNO03、SEQIDNO05、SEQIDNO07、SEQIDNO09、SEQIDNO12、SEQIDNO15、SEQIDNO18、SEQIDNO20、SEQIDNO22、SEQIDNO24、SEQIDNO26、SEQIDNO28、SEQIDNO30、SEQIDNO32、任一种的补体和任一种的片段的核酸序列杂交的核酸序列;B对选自SEQIDNO01、SEQIDNO03、SEQIDNO05、S。
23、EQIDNO07、SEQIDNO09、SEQIDNO12、SEQIDNO15、SEQIDNO18、SEQIDNO20、SEQIDNO22、SEQIDNO24、SEQIDNO26、SEQIDNO28、SEQIDNO30、SEQIDNO32、任一种的补体和任一种的片段的核酸序列展现出70或更高同一性的核酸序列;和C编码对选自SEQIDNO02、SEQIDNO04、SEQIDNO06、SEQIDNO08、SEQIDNO10、SEQIDNO11、SEQIDNO13、SEQIDNO14、SEQIDNO16、SEQIDNO17、SEQIDNO19、SEQIDNO21、SEQIDNO23、SEQIDNO25。
24、、SEQIDNO27、SEQIDNO28和SEQIDNO29的氨基酸序列展现出60或更高同一性的多肽的核酸序列。0014具有单向外切核酸酶活性的分子的实例包括但不限于外切核酸酶III、DNA聚合酶、外切核酸酶、T7外切核酸酶和T5外切核酸酶及其变体。在一个实施方案中,具有单向外切核酸酶活性的分子为具有校正活性例如,3外切核酸酶校正活性的DNA聚合酶。具有校正活性的聚合酶的实例包括但不限于T4聚合酶、T7聚合酶和PHI29聚合酶。说明书CN104220602A3/37页70015在本发明方法的一个特定实施方案中,具有单向错配内切核酸酶活性的所述至少一种分子选自CELI、CELII、其中任一种的变。
25、体及其中任两种或更多种的组合;并且具有单向外切核酸酶活性的所述至少一种分子选自外切核酸酶III、其变体及其中任两种或更多种的组合。0016在本发明的一个方面,本发明提供了分离的核酸分子,其包含在低、中或高严格条件下杂交的核酸序列A在低、中或高严格条件下与选自SEQIDNO09、SEQIDNO12、SEQIDNO15、SEQIDNO18、SEQIDNO20、SEQIDNO22、SEQIDNO24、SEQIDNO26、SEQIDNO28、SEQIDNO30、SEQIDNO32、其补体或任一种的片段的核酸序列杂交的核酸序列;或B对选自SEQIDNO09、SEQIDNO12、SEQIDNO15、SEQ。
26、IDNO18、SEQIDNO20、SEQIDNO22、SEQIDNO24、SEQIDNO26、SEQIDNO28、SEQIDNO30、SEQIDNO32、其补体或任一种的片段的核酸序列展现出70或更高同一性的核酸序列;或C编码对选自SEQIDNO10、SEQIDNO11、SEQIDNO13、SEQIDNO14、SEQIDNO16、SEQIDNO17、SEQIDNO19、SEQIDNO21、SEQIDNO23、SEQIDNO25、SEQIDNO27、SEQIDNO28和SEQIDNO29的氨基酸序列展现出50或更高同一性的多肽的核酸序列。0017在本发明的另一方面,本发明提供了重组核酸构建体,例。
27、如重组核酸载体,其包括如本文所述,与异源核酸可操作地连接的本发明核酸分子。在一些实施方案中,异源核酸为异源转录控制元件。在一些优选实施方案中,以上任何重组核酸构建体可包含编码多肽序列的异源核酸。多肽序列可包括分泌信号或表位标签。在特定实施方案中,核酸构建体可包含SEQIDNO31或SEQIDNO33或其补体或变体活包含在低、中或高严格条件下与SEQIDNO31或SEQIDNO33或其补体或变体的任一种杂交的序列。0018在本发明的又一方面,本发明提供了包括如本文公开的本发明核酸构建体的重组宿主细胞。重组宿主细胞可为昆虫细胞、哺乳动物细胞、微生物细胞或植物细胞。在一些其它实施方案中,本发明还提供。
28、了源自如上所述宿主生物的生物样品、生物质和后代。在其它实施方案中,本发明进一步提供了源自如上所述宿主生物的生物材料。0019在本发明的另一方面,本发明进一步提供了分离的多肽。在一些实施方案中,由如本文所述的本发明核酸分子表达此类分离的多肽。可将表达所述多肽的核酸分子引入宿主细胞中。在一些实施方案中,所述多肽的氨基酸序列可包含选自SEQIDNO11、SEQIDNO11的氨基酸残基1297、SEQIDNO11的氨基酸残基22308、SEQIDNO17、SEQIDNO17的氨基酸残基1320和SEQIDNO17的氨基酸残基22331的氨基酸序列。0020另一方面,本发明公开了组合物,其包含I具有单向。
29、错配内切核酸酶活性的分子;和II具有与I中所述单向错配内切核酸酶活性相同的方向性的单向外切核酸酶活性的分子。在各实施方案中,I的分子选自RESI、CELI、CELII、T7内切核酸酶、T4内切核酸酶、内切核酸酶V、MUT蛋白质、其中任一种的变体及其中任两种或更多种的组合;并且II的分子选自外切核酸酶III、DNA聚合酶、其中任一种的变体及其中任两种或更多种的组合。0021又一方面,本发明进一步提供了一种试剂盒,其包含I具有单向错配内切核酸酶活性的分子;和II具有与I中所述单向错配内切核酸酶活性相同的方向性的单向外切核酸酶活性的分子。在其它实施方案中,所述试剂盒还可具有进行如本文所述的纠错方法的。
30、说明书和/或提供了到提供关于如本文所述的纠错方法的信息的网站的链接。说明书CN104220602A4/37页80022结合附图查阅下面的发明详述和权利要求时,本领域的普通技术人员将更加充分地理解本发明的这些和其它目的、方面和特征。0023附图简述0024图1提供了本发明方法的一个实施方案的示意图。0025图2提供了本发明一个实施方案的步骤的示意图。0026图3提供了说明在本发明一个实施方案中采取的步骤的流程图。0027图4为鳞叶卷柏SELAGINELLALEPIDOPHLLACELI内切核酸酶SEQIDNO02、芹菜CELI内切核酸酶SEQIDNO04、芹属APIUMSPCELII内切核酸酶S。
31、EQIDNO06、另一芹属CELII内切核酸酶SEQIDNO08、玄参科猴面花MIMULUSGUTTATUSCELI内切核酸酶SEQIDNO10、马铃薯SOLANUMTUBEROSUMCELI内切核酸酶SEQIDNO13、葡萄VITISVINIFERACELII内切核酸酶SEQIDNO16、马铃薯CELII内切核酸酶SEQIDNO25、苜蓿属MEDICAGOSPCELII内切核酸酶SEQIDNO27的比对。使用VECTORNTIADVANCETM115包INVITROGEN,CARLSBAD,CALIF的程序ALIGNX,用默认设置生成图4的序列比对。如本文其它地方所详细讨论,已经由这种序列比。
32、较分析鉴定了具有高度保守性的几个多肽结构域和基序。在本文所示比对图中,比对序列中的破折号表示空位,即该位置缺乏氨基酸。黑色方框和灰色方框分别标识比对序列中的相同氨基酸和保守氨基酸。0028图5描绘了纯化MIMMULUSCHISCELI蛋白的SDS聚丙烯酰胺凝胶分析图5A和使用抗聚组氨酸抗体的蛋白质印迹结果图5B。泳道1FERMENTAS标记5L;泳道2透析前的MIMMULUSCHIS12L;泳道4FERMENTAS标记12L;泳道5透析后的MIMMULUSCHIS12L;泳道7FERMENTAS标记5L;泳道8透析后的MIMMULUSCHIS6L。0029发明详述0030本申请涉及可用于制备错。
33、误最小化核酸分子的组合物、方法和相关材料。0031一方面,本发明提供了可用于减少核酸分子群体中的错配错误的材料和方法。例如,公开了编码错配内切核酸酶的核酸分子以及使用此类核酸分子及其编码的多肽减少核酸群体中的核苷酸错配的方法。本发明还提供了重组核酸分子和包含此类核酸分子的重组细胞以及重组生物及其使用方。0032除非上下文中另有明确规定,单数形式“一个”、“一种”和“所述”包括复数个指示物。例如,术语“一个/种细胞”包括一个/种或多个/种细胞,包括其混合物。0033结构域“结构域”是多肽中可用于表征蛋白质家族和/或蛋白质部分的大体上连续的成组氨基酸。此类结构域通常具有可包含保守一级序列、二级结构。
34、和/或三维构象的“指纹”、“基序”或“签名”。通常,结构域与体外和/或体内特定活性相关。结构域的长度可从4个氨基酸至400个氨基酸,例如450个氨基酸,或420个氨基酸,或410个氨基酸,或48个氨基酸,或25100个氨基酸,或3565个氨基酸,或3555个氨基酸,或4560个氨基酸,或200300个氨基酸,或300400个氨基酸。0034表达如本文所使用,“表达”指通过通常受酶、RNA聚合物催化的转录将多核苷酸的遗传信息转化为RNA和通过核糖体上MRNA的翻译转化为蛋白质的过程。0035如本文所使用的术语“表位”、“标签”、“标签序列”或“蛋白质标签”指化学部分,说明书CN104220602。
35、A5/37页9核苷酸、寡核苷酸、多核苷酸或氨基酸、肽或蛋白质或其它化学品,其在添加到另一序列时,为该序列提供附加实用性或赋予尤其是在检测或分离上的有用性质。因此,例如,可向引物或探针序列添加均聚物核酸序列或与捕获寡核苷酸互补的核酸序列以利于延伸产物或杂交产物的后续分离。在蛋白质标签的情况下,可向蛋白质的氨基或羧基端添加组氨酸残基例如,48个连续组氨酸残基以利于通过金属螯合色谱法进行蛋白质分离。可选地,可向蛋白质添加代表对特异性抗体分子或其它分子例如,FLAG表位、CMYC表位、流感A病毒血球凝集素蛋白的跨膜表位、蛋白质A、纤维素结合结构域、钙调蛋白结合蛋白、麦芽糖结合蛋白、几丁质结合结构域、谷。
36、胱甘肽S转移酶等有反应性的表位或结合决定簇的氨基酸序列、肽、蛋白质或融合伴侣以利于通过例如亲和或免疫亲和色谱法等程序进行蛋白质分离。化学标签部分包括诸如生物素等分子,其可添加到核酸或蛋白质中并且利于通过与亲和素试剂等的相互作用分离或检测。许多其它标签部分为技术人员已知并且可由技术人员预想到,并且视为在本定义范围内。0036本发明的多核苷酸及其编码的多肽0037在本发明的一方面,本发明提供了新颖分离的核酸分子、与这些核酸分子杂交的核酸分子例如补体和由于DNA密码的简并性编码相同蛋白质的核酸分子。本申请的附加实施方案进一步包括由本发明的核酸分子编码的多肽。0038序列表中公开或本文另外公开的本发明。
37、多核苷酸和多肽及其片段和变体就其结构属性而论,例如核酸与另一核酸分子杂交的能力,或多肽受抗体结合或与另一分子竞争此类结合的能力,“具生物活性”。可选地,此类属性可为催化性并且因此涉及所述分子介导化学反应或应答的能力。0039在一些实施方案中,本发明的多核苷酸和多肽为重组。重组多核苷酸或多肽是使用产生在受操纵生物中不会存在或生成的核酸序列或多肽的实验室方法,由人操纵多核苷酸或多肽和生物获得的重组多核苷酸或多肽。0040本发明的核酸分子或其片段能够在某些情况下与其它核酸分子特异性杂交。“特异性杂交”指互补核酸链在适当严格条件下退火为彼此的过程。如果其中一个分子的每个核苷酸与另一分子的核苷酸互补并且。
38、核苷酸对形成WATSONCRICK碱基对,则称核酸分子展现出“完全互补性”。如果可以足够稳定性退火为彼此以在至少传统的“低严格”条件下保持退火,则称两个核酸分子具“最低互补性”。类似地,如果可以足够稳定性相互杂交以允许其在传统的“高严格”条件下保持退火为彼此,则称所述分子“互补”。SAMBROOK等在MOLECULARCLONING,ALABORATORYMANUAL,第2版,COLDSPRINGHARBORPRESS,COLDSPRINGHARBOR,NY1989中和HAYMES等在NUCLEICACIDHYBRIDIZATION,APRACTICALAPPROACH,IRLPRESS,WA。
39、SHINGTON,DC1985中描述了传统严格条件。因此可允许脱离完全互补性,只要这种脱离不完全消除分子形成双链结构的能力。因此,为了使本发明的核酸分子或其片段用作引物或探针,只需在序列上充分互补就能够在采用的特定溶剂和盐浓度下形成稳定的双链结构。0041促进DNA杂交的适当严格条件包括例如约45下60氯化钠/柠檬酸钠SSC,接着在约50下20SSC洗涤。另外,洗涤步骤的温度可从低严格条件的室温约22升高到高严格条件约65。温度和盐均可改变,或可保持温度或盐浓度恒定,而改变其它变量。这些条件为本领域的技术人员已知,或可在CURRENTPROTOCOLSINMOLECULAR说明书CN10422。
40、0602A6/37页10BIOLOGY,JOHNWILEYSONS,NY1989,631636中找到。例如,低严格条件可用于选择与靶核酸序列具有较低序列同一性的核酸序列。人们可能希望采用例如在范围从约20至约55稳定下,约015M至约09M氯化钠的条件。高严格条件可用于选择与公开的核酸序列具有更高度同一性的核酸序列SAMBROOK等,1989,同时。高严格条件通常涉及在约2SSC至约10SSC由含有3M氯化钠和03M柠檬酸钠PH70的20SSC原液稀释于蒸馏水中、约25至约5DENHARDT溶液由含有1W/V牛血清白蛋白、1W/V菲柯尔COLL和1W/V聚乙烯吡咯烷酮的50原液稀释于蒸馏水中、。
41、约10MG/ML至约100MG/ML鱼精子DNA和约002W/V至约01W/VSDS中,经约50至约70下培育几小时至过夜的核酸杂交。优选用6SSC、5DENHARDT溶液、100MG/ML鱼精子DNA和约01W/VSDS,在55C下培育几小时提供高严格条件。通常在杂交之后进行几个洗涤步骤。洗涤组合物通常包含05SSC至约10SSC和001W/V至约05W/VSDS,在约20至约70下培育15MIN。优选地,在65下于01SSC中洗涤至少一次后,核酸片段保持杂交。0042在一个实施方案中,本发明核酸分子的亚型包括由所公开多核苷酸的至少12个、至少15个、至少16个、至少17个、至少18个、至少。
42、19个和至少20个连续核苷酸组成的公开的多核苷酸片段。此类寡核苷酸为序列表中公开或本文另外描述的较大多核苷酸分子的片段并且可用作例如检测本发明多核苷酸的干扰分子、探针和引物。0043本发明的核酸分子可包括足以编码错配内切核酸酶的结构域的生物活性片段、整个错配内切核酸酶或开放阅读框内编码错配内切核酸酶的几个结构域的序列。0044在另一实施方案中,本发明明确提供了包含编码多肽的区域的核苷酸序列。编码的多肽可为蛋白质或多核苷酸所表示的基因所编码的完整多肽,或可为编码的蛋白质的片段。优选地,本文提供的多核苷酸编码构成完整蛋白质的很大一部分,并且更优选,构成完整蛋白质的足够部分以提供相关生物活性,例如错。
43、配内切核酸酶活性的多肽。0045特别关注的是编码错配内切核酸酶的本发明多核苷酸。此类多核苷酸可在重组细胞或重组生物中表达以生成具有错配内切核酸酶活性的分子。在一些实施方案中,本发明还涵盖了为这些编码错配内切核酸酶的核苷酸序列的片段的核酸分子。如本文所使用,“错配内切核酸酶片段”预期为编码错配内切核酸酶的核苷酸序列的片段。核苷酸序列的片段可编码错配内切核酸酶的生物活性部分,或可为可用作使用本文公开的方法的杂交探针或PCR引物的片段。核酸分子或多肽的片段包含至少10、25、50、100、200、300、400、500、600、700、800、900、1000、1050、1100、1150、1200。
44、、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950、2000、2050、2100、2150、2200、2250、2300、2350、2400、2450、2500、2550、2600、2650、2700、2750、2800、2850、2900、2950、3000、3050、3100、3150、3200、3250、3300、3350个相邻核苷酸或氨基酸,或多达本文公开的全长核苷酸序列或多肽序列中存在的核苷酸或氨基酸的数量。本发明核苷酸序列的片段包括编码保持错配内切核酸酶的生物活性的蛋白质片段的核苷酸。
45、序列片段。用“保持活性”指片段将具有全长错配内切核酸酶蛋白的至少30、至少50、至少70、至少80、至少90或至少95的内切核酸酶活性。测量内切核酸酶,包括错配内切核酸酶活性的方法在本领域众所周知。参见例如美国专利第6,391,557号;美国专利第7,129,075号。错配内切核酸酶活性指在进行测定的方便时间段内,在所述方法中进行片段化DSDNA分子或去除核苷酸错配的说明书CN104220602A107/37页11步骤的足够水平的活性。在不同实施方案中,所述活性足以在2H或4H或6H或10H或12H或24H内进行片段化或去除。0046在不同实施方案中,编码错配内切核酸酶的核苷酸序列的编码本发明。
46、多肽的生物活性部分的片段将编码至少15、25、30、50、75、100、125、150、175、200、225、250、275、300、325、350个相邻氨基酸,或多达序列表中公开或本文另外公开的全长错配内切核酸酶蛋白质中存在的氨基酸的总数。例如,相对于序列表中公开或本文另外公开的错配内切核酸酶氨基酸序列,根据本发明的错配内切核酸酶片段可具有至少20个氨基酸、至少50个、至少75个、至少90个、至少100个或至少150个氨基酸的N端或C端截断。0047本发明中还关注的是序列表中公开或本文另外公开的多核苷酸的变体。此类变体可天然存在,包括来自相同或不同物种的同源多核苷酸,或可为非天然变体,例如。
47、使用化学合成法合成或使用重组DNA技术生成的多核苷酸。可生成具有经修饰核酸分子的变体,其中已经插入、缺失和/或取代了核苷酸,并且此类修饰可对如本文所述的内切核酸酶生物活性提供所需影响。遗传密码的简并性提供了用不同碱基取代基因的蛋白质编码序列的至少一个碱基,而不引起由基因生成的多肽的氨基酸序列变化的可能性。因此,本发明的核酸分子也可具有已经根据遗传密码的简并性,通过取代由本文公开的任一多核苷酸序列变化而来的任何碱基序列。0048技术人员将进一步意识到可通过本发明核苷酸序列的突变引入变化,从而导致编码的内切核酸酶蛋白的氨基酸序列变化,而不改变蛋白质的生物活性。因此,可通过向本文公开的相应核苷酸序列。
48、中引入一个或多个核苷酸取代、添加或缺失产生变体分离的核酸分子,以便将一个或多个氨基酸取代、添加或缺失引入编码的蛋白质中。可通过标准技术,例如定点诱变和PCR介导的诱变引入突变。本发明也涵盖了此类变体核苷酸序列。0049例如,可在一个或多个预估的处产生保守性氨基酸取代。如本文所使用,“非必需”氨基酸残基是可由错配内切核酸酶蛋白质的野生型序列改变而来,而未改变生物活性的残基,而“必需”氨基酸残基是生物活性所必需的。“保守性氨基酸取代”是其中氨基酸残基经具有相似侧链的氨基酸残基置换的氨基酸取代。在本领域中已经良好定义了具有相似侧链的氨基酸残基家族。这些家族包括具有碱性侧链的氨基酸例如赖氨酸、精氨酸、。
49、组氨酸、具有酸性侧链的氨基酸例如天冬氨酸、谷氨酸、具有不带电的极性侧链的氨基酸例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸、具有非极性侧链的氨基酸例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸、具有分支侧链的氨基酸例如苏氨酸、缬氨酸、异亮氨酸和具有芳香族侧链的氨基酸例如酪氨酸、苯丙氨酸、色氨酸、组氨酸。0050如以上所讨论,本领域的技术人员将认识到,可在保持功能的非保守区域内进行氨基酸取代。一般而言,不会对保守性氨基酸残基或留在保守性基序内的氨基酸残基进行此类取代,其中此类残基对蛋白质活性而言必不可少。在本领域中报道了错配内切核酸酶序列的保守性残基、结构域和基序。保守并且可能对蛋白质活性必不可少的残基的实例包括例如在本发明氨基酸序列和已知错配内切核酸酶序列的比对中所含的所有蛋白质之间相同的残基。保守,但是可能允许保守性氨基酸取代并且仍保持活性的残基的实例包括例如在本发明氨基酸序列和已知错配内切核酸酶序列的比对中所含的所有蛋白质之间仅具有保守性取代的残基。然而,本领域的技术人员应理解,功能变体在保守性残基中可能说明书CN104220602A118/37页12具有较小保守或非保守性改变。0051在本发明的一些实施方案中,此类错配内。