《具有葡糖淀粉酶活性的多肽及其编码多核苷酸.pdf》由会员分享,可在线阅读,更多相关《具有葡糖淀粉酶活性的多肽及其编码多核苷酸.pdf(72页珍藏版)》请在专利查询网上搜索。
1、10申请公布号CN104169417A43申请公布日20141126CN104169417A21申请号201080054626022申请日20101130DSM232222010011361/265,52620091201US61/406,74120101026USC12N9/34200601C12P19/14200601C12P7/0620060171申请人诺维信公司地址丹麦鲍斯韦申请人诺维信北美公司72发明人S兰德维克MD莫兰特绫部圭G科沃德凯利74专利代理机构北京市柳沈律师事务所11105代理人封新琴54发明名称具有葡糖淀粉酶活性的多肽及其编码多核苷酸57摘要本发明涉及具有葡糖淀粉酶活性。
2、的分离的多肽和编码所述多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及产生和使用所述多肽的方法。30优先权数据85PCT国际申请进入国家阶段日2012060186PCT国际申请的申请数据PCT/US2010/0584242010113087PCT国际申请的公布数据WO2011/068803EN2011060983生物保藏信息51INTCL权利要求书3页说明书35页序列表32页PCT/RO/134表1页19中华人民共和国国家知识产权局12发明专利申请权利要求书3页说明书35页序列表32页PCT/RO/134表1页10申请公布号CN104169417ACN104。
3、169417A1/3页21一种具有葡糖淀粉酶活性的分离的多肽,其选自下组A多肽,其包含氨基酸序列,所述氨基酸序列与SEQIDNO2,SEQIDNO4,SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQIDNO12,SEQIDNO14,SEQIDNO16或SEQIDNO18的成熟多肽具有优选至少82,更优选至少83,更优选至少84,更优选至少85,更优选至少86,更优选至少87,更优选至少88,更优选至少89,更优选至少90,更优选至少91,更优选至少92,甚至更优选至少93,最优选至少94,并且甚至最优选至少95,如至少95,至少97,至少98,至少99或甚至100同一性;B多肽,。
4、其包含氨基酸序列,所述氨基酸序列与SEQIDNO2,SEQIDNO4,SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQIDNO12,SEQIDNO14的氨基酸19至474或者SEQIDNO16或SEQIDNO18的氨基酸19至471所示的催化域具有优选至少82,更优选至少83,更优选至少84,更优选至少85,更优选至少86,更优选至少87,更优选至少88,更优选至少89,更优选至少90,更优选至少91,更优选至少92,甚至更优选至少93,最优选至少94,并且甚至最优选至少95,如至少96,至少97,至少98,至少99或甚至100同一性;C多肽,其由多核苷酸编码,所述多核苷酸在优选。
5、至少中高严格条件下,和最优选至少高严格条件下与以下杂交ISEQIDNO1,SEQIDNO3,SEQIDNO5,SEQIDNO7,SEQIDNO9,SEQIDNO11,SEQIDNO13,SEQIDNO15或SEQIDNO17的成熟多肽编码序列,II包含SEQIDNO1,SEQIDNO3,SEQIDNO5,SEQIDNO7,SEQIDNO9,SEQIDNO11,SEQIDNO13,SEQIDNO15或SEQIDNO17的成熟多肽编码序列的基因组DNA序列,或IIII或II的全长互补链;D多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列,所述核苷酸序列与SEQIDNO1,SEQIDNO3,SEQ。
6、IDNO5,SEQIDNO7,SEQIDNO9,SEQIDNO11,SEQIDNO13,SEQIDNO15或SEQIDNO17的成熟多肽编码序列具有优选至少82,更优选至少83,更优选至少84,更优选至少85,更优选至少86,更优选至少87,更优选至少88,更优选至少89,更优选至少90,更优选至少91,更优选至少92,甚至更优选至少93,最优选至少94,并且甚至最优选至少95,如至少96,至少97,至少98,至少99或甚至100同一性;和E变体,其包含取代、缺失和/或插入一个或多个几个氨基酸的SEQIDNO2,SEQIDNO4,SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQI。
7、DNO12,SEQIDNO14,SEQIDNO16或SEQIDNO18的成熟多肽。2权利要求1的多肽,其包含或组成为SEQIDNO2或SEQIDNO4或SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQIDNO12,SEQIDNO14,SEQIDNO16或SEQIDNO18的氨基酸序列;SEQIDNO2或SEQIDNO4或SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQIDNO12,SEQIDNO14,SEQIDNO16或SEQIDNO18的成熟多肽;或它们具有葡糖淀粉酶活性的片段。3权利要求1或2的多肽,其由多核苷酸编码,所述多核苷酸包含或组成为SEQIDNO1,S。
8、EQIDNO3,SEQIDNO5,SEQIDNO7,SEQIDNO9,SEQIDNO11,SEQIDNO13,SEQIDNO15或SEQIDNO17的核苷酸序列;或它们编码具有葡糖淀粉酶活性的片段的亚序列。权利要求书CN104169417A2/3页34权利要求13任一项的多肽,其由DSM23222中包含的质粒中含有的多核苷酸编码。5权利要求14任一项的多肽,其中所述成熟多肽是SEQIDNO2,SEQIDNO4,SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQIDNO12或SEQIDNO14的氨基酸18至573或SEQIDNO16或SEQIDNO18的氨基酸18至576。6一种具有。
9、糖结合活性的分离的多肽,其包含糖结合模块,所述模块与SEQIDNO2,SEQIDNO4,SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQIDNO12或SEQIDNO14的氨基酸480至573或者SEQIDNO16或SEQIDNO18的氨基酸483至576所示的糖结合域具有优选至少80,更优选至少81,更优选至少82,更优选至少83,更优选至少84,更优选至少85,更优选至少86,更优选至少87,更优选至少88,更优选至少89,更优选至少90,更优选至少91,更优选至少92,甚至更优选至少93,最优选至少94,并且甚至最优选至少95,如至少95,至少97,至少98,至少99或甚至1。
10、00同一性。7一种杂合酶,其包含催化域和权利要求6的糖结合域。8权利要求7的杂合酶,其中所述催化域具有选自下组的酶活性淀粉酶,AMYLOPULLULANASE,淀粉酶,CGT酶,葡糖淀粉酶,异淀粉酶,产麦芽糖淀粉酶和支链淀粉酶。9一种分离的多核苷酸,其包含编码权利要求18任一项的多肽的核苷酸序列。10一种核酸构建体,其包含可操作连接的权利要求9的多核苷酸和一种或多种几种调控序列,所述调控序列指导所述多肽在表达宿主中的表达。11一种重组表达载体,其包含权利要求10的核酸构建体。12一种重组宿主细胞,其包含权利要求10的核酸构建体。13一种产生权利要求18任一项的多肽的方法,包括A在有助于所述多肽。
11、产生的条件下培养包含核酸构建体的宿主细胞,所述核酸构建体包含编码所述多肽的核苷酸序列;和B回收所述多肽。14一种产生权利要求18任一项的多肽的方法,包括A在有助于所述多肽产生的条件下培养转基因植物或植物细胞,所述植物或植物细胞包含编码所述多肽的多核苷酸序列;和B回收所述多肽。15一种转基因植物、植物部分或植物细胞,其用编码权利要求18任一项的多肽的多核苷酸转化。16权利要求18任一项的多肽在产生糖浆和/或发酵产物中的用途。17权利要求16的方法,其中所述起始材料为糊化的或未糊化的含淀粉材料。18权利要求18任一项的多肽用于酿造的用途。19一种组合物,其包含淀粉酶和权利要求18任一项的多肽。20。
12、一种从含淀粉材料产生发酵产物的工艺,包括下述步骤A液化含淀粉材料;B糖化经液化的材料;和C用发酵生物发酵;其中步骤B使用至少一种权利要求15任一项的葡糖淀粉酶进行。21一种从含淀粉材料产生发酵产物的工艺,包括下述步骤A在所述含淀粉材料的起始糊化温度以下的温度糖化含淀粉材料;和权利要求书CN104169417A3/3页4B用发酵生物发酵;其中步骤A使用至少一种权利要求15任一项的葡糖淀粉酶进行。权利要求书CN104169417A1/35页5具有葡糖淀粉酶活性的多肽及其编码多核苷酸0001涉及序列表0002本申请涉及计算机可读形式的序列表,其通过提述并入本文。0003涉及生物材料的保藏0004本申。
13、请包含对于生物材料保藏的引用,所述保藏通过提述并入本文。关于完整信息参见说明书最后一段。0005发明背景技术领域0006本发明涉及具有葡糖淀粉酶活性的多肽和编码所述多肽的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞以及用于产生和使用所述多肽的方法,并涉及本发明的葡糖淀粉酶在转化淀粉以产生发酵产物如乙醇和糖浆如葡萄糖中的用途。本发明还涉及包含本发明的葡糖淀粉酶的组合物。背景技术0007葡糖淀粉酶1,4D葡聚糖葡糖水解酶,EC3213是一种催化D葡萄糖从淀粉或相关的寡糖和多糖分子的非还原端释放的酶。葡糖淀粉酶由数种丝状真菌和酵母产生,其中来自曲霉属ASPERGILLUS的那些。
14、在商业上最为重要。0008商业上,使用葡糖淀粉酶将已经由部分淀粉酶部分水解的淀粉材料转化为葡萄糖。然后可使用发酵生物将葡萄糖直接或间接转化为发酵产物。商业性发酵产物的实例包括醇例如,乙醇、甲醇、丁醇、1,3丙二醇;有机酸例如柠檬酸、乙酸、衣康酸、乳酸、葡糖酸、葡糖酸盐、乳酸、琥珀酸、2,5二酮D葡糖酸;酮例如丙酮;氨基酸例如谷氨酸;气体例如H2和CO2和更复杂的化合物,包括例如抗生素例如青霉素和四环素;酶;维生素例如核黄素,B12,胡萝卜素;激素,和其他难以合成产生的化合物。发酵工艺亦常用于可饮用的醇类例如啤酒和葡萄酒,乳类产品例如,酸奶和奶酪的产生工业。0009终产物亦可为糖浆。举例而言,终。
15、产物可为葡萄糖,但亦可例如通过葡糖异构酶转化为果糖或基本上由等量葡萄糖和果糖构成的混合物。该混合物,或进一步富集果糖的混合物,是在全世界得到商业化的最常用的高果糖玉米糖浆HFCS。0010本发明的目的是提供具有葡糖淀粉酶活性的多肽和编码所述多肽的多核苷酸,且其在发酵产物产生工艺如醇产生工艺中提供高收率,包括从未糊化的生或未烹制淀粉的一步乙醇发酵工艺。0011UNIPROTB0CVJ1公开了来自双色蜡蘑LACCARIABICOLOR的多肽,而WO2006/069289描述了来自瓣环栓菌TRAMETESCINGULATA的葡糖淀粉酶。发明内容0012鉴定并表征了由真菌粘褶菌属GLOEOPHYLLU。
16、M产生,并具有葡糖淀粉酶活性的说明书CN104169417A2/35页6多肽。更具体而言,所述粘褶菌属菌种选自下组冷杉粘褶菌GABIETINUM、篱边粘褶菌GSEPIARIUM和密粘褶菌GTRABEUM。0013相应地,在第一个方面,本发明涉及具有葡糖淀粉酶活性的分离的多肽,其选自下组A多肽,其包含氨基酸序列,所述氨基酸序列与SEQIDNO2,SEQIDNO4,SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQIDNO12,SEQIDNO14,SEQIDNO16或SEQIDNO18的成熟多肽具有优选至少82,更优选至少83,更优选至少84,更优选至少85,更优选至少86,更优选至少。
17、87,更优选至少88,更优选至少89,更优选至少90,更优选至少91,更优选至少92,甚至更优选至少93,最优选至少94,并且甚至最优选至少95,如至少96,至少97,至少98,至少99或甚至100同一性;B多肽,其包含氨基酸序列,所述氨基酸序列与SEQIDNO2,SEQIDNO4,SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQIDNO12,SEQIDNO14的氨基酸19至474或SEQIDNO16或SEQIDNO18的氨基酸19至471所示的催化域具有优选至少82,更优选至少83,更优选至少84,更优选至少85,更优选至少86,更优选至少87,更优选至少88,更优选至少89,。
18、更优选至少90,更优选至少91,更优选至少92,甚至更优选至少93,最优选至少94,并且甚至最优选至少95,如至少96,至少97,至少98,至少99或甚至100同一性;C多肽,其由多核苷酸编码,所述多核苷酸在优选至少中高严格条件下,并且最优选至少高严格条件下与以下杂交ISEQIDNO1,SEQIDNO3,SEQIDNO5,SEQIDNO7,SEQIDNO9,SEQIDNO11,SEQIDNO13,SEQIDNO15或SEQIDNO17的成熟多肽编码序列,II包含SEQIDNO1,SEQIDNO3,SEQIDNO5,SEQIDNO7,SEQIDNO9,SEQIDNO11,SEQIDNO13,SE。
19、QIDNO15或SEQIDNO17的成熟多肽编码序列的基因组DNA序列,或IIII或II的全长互补链;D多肽,其由多核苷酸编码,所述多核苷酸包含核苷酸序列,所述核苷酸序列与SEQIDNO1,SEQIDNO3,SEQIDNO5,SEQIDNO7,SEQIDNO9,SEQIDNO11,SEQIDNO13,SEQIDNO15或SEQIDNO17的成熟多肽编码序列具有优选至少82,更优选至少83,更优选至少84,更优选至少85,更优选至少86,更优选至少87,更优选至少88,更优选至少89,更优选至少90,更优选至少91,更优选至少92,甚至更优选至少93,最优选至少94,并且甚至最优选至少95,如至。
20、少96,至少97,至少98,至少99或甚至100同一性;和E变体,其包含取代、缺失和/或插入一个或多个几个氨基酸的SEQIDNO2,SEQIDNO4,SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQIDNO12,SEQIDNO14,SEQIDNO16或SEQIDNO18的成熟多肽。0014在第二个方面,本发明涉及分离的多核苷酸,其包含编码第一个方面的多肽的核苷酸序列。0015在进一步的方面,本发明涉及包含第二个方面的多核苷酸的核酸构建体,重组表达载体,重组宿主细胞,转基因植物,植物部分或植物细胞。0016仍在进一步的方面,本发明涉及产生所述多肽的方法,所述多肽的用途,和包含淀粉酶。
21、和所述多肽的组合物。0017定义0018葡糖淀粉酶术语葡糖淀粉酶1,4D葡聚糖葡糖水解酶,EC3213定义为催化D葡萄糖从淀粉或相关的寡糖和多糖分子的非还原端释放的酶。就本发明而言,葡糖淀粉酶活性根据下文“材料和方法”部分描述的步骤来确定。说明书CN104169417A3/35页70019本发明的多肽具有SEQIDNO2或其同源序列,SEQIDNO4或其同源序列,SEQIDNO6或其同源序列,SEQIDNO8或其同源序列,SEQIDNO10或其同源序列,SEQIDNO12或其同源序列,SEQIDNO14或其同源序列,SEQIDNO16或其同源序列,或者SEQIDNO18或其同源序列的成熟多肽的。
22、葡糖淀粉酶活性的至少20,优选至少40,优选至少45,更优选至少50,更优选至少55,更优选至少60,更优选至少65,更优选至少70,更优选至少75,更优选至少80,更优选至少85,甚至更优选至少90,最优选至少95,并且甚至最优选至少100。0020分离的多肽术语“分离的多肽”用于本文中指从来源分离的多肽。在一个优选的方面,如通过SDSPAGE测定的,所述多肽为至少1纯,优选至少5纯,更优选至少10纯,更优选至少20纯,更优选至少40纯,更优选至少60纯,甚至更优选至少80纯,并且最优选至少90纯。0021基本上纯的多肽术语“基本上纯的多肽”在本文表示多肽制备物,所述多肽制备物含有按重量计至。
23、多10,优选至多8,更优选至多6,更优选至多5,更优选至多4,更优选至多3,甚至更优选至多2,最优选至多1,并且甚至最优选至多05的与其天然或重组结合的ASSOCIATED其它多肽材料。因此,优选所述基本上纯的多肽按存在于制备物中的全部多肽材料的重量计是至少92纯,优选至少94纯,更优选至少95纯,更优选至少96纯,更优选至少96纯,更优选至少97纯,更优选至少98纯,甚至更优选至少99纯,最优选至少995纯,并且甚至最优选100纯。本发明的多肽优选是基本上纯的形式,即所述多肽制备物基本上ESSENTIALLY不含与其天然或重组结合的其它多肽材料。例如,这能够通过如下实现通过公知的重组方法或通。
24、过经典纯化方法制备多肽。0022成熟多肽术语“成熟多肽”意指以其在翻译和任何翻译后修饰如N末端加工、C末端截短、糖基化、磷酸化等之后的最终形式存在的多肽。在一个方面,基于预测SEQIDNO2,SEQIDNO4,SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQIDNO12,SEQIDNO14,SEQIDNO16和SEQIDNO18的氨基酸1至17是信号肽的SIGNALP程序NIELSEN等,1997,PROTEINENGINEERING1016,所述成熟多肽是SEQIDNO2,SEQIDNO4,SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQIDNO12,SEQIDN。
25、O14的氨基酸18至573或SEQIDNO16或SEQIDNO18的氨基酸18至576。由SEQIDNO2,SEQIDNO4,SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQIDNO12或SEQIDNO14的氨基酸19至474特别是19至471或者SEQIDNO16或SEQIDNO18的氨基酸19至471限定的序列为催化域。由SEQIDNO2,SEQIDNO4,SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQIDNO12或SEQIDNO14的氨基酸480至573或者SEQIDNO16或SEQIDNO18的氨基酸483至576限定的序列为淀粉结合域。0023成熟多肽编。
26、码序列术语“成熟多肽编码序列”在本文中定义为编码具有葡糖淀粉酶活性的成熟多肽的核苷酸序列。优选地,所述成熟多肽编码序列是SEQIDNO1,SEQIDNO3,SEQIDNO5,SEQIDNO7,SEQIDNO9,SEQIDNO11,SEQIDNO13的核苷酸52至1719,或者SEQIDNO15或SEQIDNO17的核苷酸52至1728。0024同一性两个氨基酸序列之间或两个核苷酸序列之间的相关性由参数“同一性”来描述。0025就本发明而言,两个氨基酸序列之间的同一性程度是使用如EMBOSS程序包说明书CN104169417A4/35页8EMBOSSTHEEUROPEANMOLECULARBIO。
27、LOGYOPENSOFTWARESUITE,RICE等,2000,TRENDSINGENETICS16276277优选版本300或更新的版本的NEEDLE程序中执行的NEEDLEMANWUNSCH算法NEEDLEMAN和WUNSCH,1970,JMOLBIOL48443453来测定的。使用的可选参数是缺口产生罚分为10,缺口延伸罚分为05,和EBLOSUM62BLOSUM62的EMBOSS版本取代矩阵。将标记为“最长同一性”的NEEDLE输出使用NOBRIEF选项获得用作百分比同一性并且是如下计算的0026相同的残基X100/比对的长度比对中的缺口总数0027就本发明而言,两个脱氧核糖核苷酸序。
28、列之间的同一性程度使用如EMBOSS程序包EMBOSSTHEEUROPEANMOLECULARBIOLOGYOPENSOFTWARESUITE,RICE等,2000,见上优选版本300或更新的版本的NEEDLE程序中执行的NEEDLEMANWUNSCH算法NEEDLEMAN和WUNSCH,1970,见上测定。使用的可选参数是缺口产生罚分为10,缺口延伸罚分为05,和EDNAFULLNCBINUC44的EMBOSS版本取代矩阵。将标记为“最长同一性”的NEEDLE输出使用NOBRIEF选项获得用作百分比同一性并且是如下计算的0028相同的脱氧核糖核苷酸X100/比对的长度比对中的缺口总数0029。
29、同源序列术语“同源序列”在本文中定义为与SEQIDNO1,SEQIDNO3,SEQIDNO5,SEQIDNO7,SEQIDNO9,SEQIDNO11,SEQIDNO13,SEQIDNO15或SEQIDNO17的成熟多肽编码部分或SEQIDNO2,SEQIDNO4,SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQIDNO12,SEQIDNO14,SEQIDNO16,或SEQIDNO18的成熟多肽分别具有至少82,优选至少83,更优选至少84,更优选至少85,更优选至少86,更优选至少87,更优选至少88,更优选至少89,更优选至少90,更优选至少91,更优选至少92,甚至更优选至少。
30、93,最优选至少94,并且甚至最优选至少95,如至少96,至少97,至少98或甚至至少99同一性的核苷酸序列/多肽序列。0030多肽片段术语“多肽片段”在本文定义为从SEQIDNO2,SEQIDNO4,SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQIDNO12,SEQIDNO14,SEQIDNO16或SEQIDNO18的成熟多肽或其同源序列的氨基和/或羧基末端缺失了一个或多个几个氨基酸的多肽;其中所述片段具有葡糖淀粉酶活性。优选地,片段含有SEQIDNO2,SEQIDNO4,SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQIDNO12,SEQIDNO14,SEQI。
31、DNO16或SEQIDNO18的成熟多肽或其同源序列的至少500个氨基酸残基,更优选至少450个氨基酸残基,并且最优选至少400个氨基酸。具体的片段为SEQIDNO2,SEQIDNO4,SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQIDNO12或SEQIDNO14的氨基酸19至474或者SEQIDNO16或SEQIDNO18的氨基酸19至471限定的序列,其包含本发明多肽的催化域。0031亚序列术语“亚序列SUBSEQUENCE”在本文中定义为从SEQIDNO1,SEQIDNO3,SEQIDNO5,SEQIDNO7,SEQIDNO9,SEQIDNO11,SEQIDNO13,SE。
32、QIDNO15或SEQIDNO17的成熟多肽编码序列的5和/或3端缺失了一个或多个几个核苷酸的核苷酸序列;或其同源序列;其中所述亚序列编码具有葡糖淀粉酶活性的多肽片段。优选地,亚序列含有SEQIDNO1,SEQIDNO3,SEQIDNO5,SEQIDNO7,SEQIDNO9,SEQIDNO11,SEQIDNO13,SEQIDNO15或SEQIDNO17的成熟多肽编码序列或其同源序列的至少1500个核苷酸,更优选至少1400个核苷酸,并且最优选至少1200个核苷酸。说明书CN104169417A5/35页90032等位变体ALLELICVARIANT术语“等位变体”在本文中表示占据相同染色体基因。
33、座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的在编码的多肽中无变化或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。0033分离的多核苷酸术语“分离的多核苷酸”用于本文中指从来源分离的多核苷酸。优选地,如通过琼脂糖电泳测定的,所述多核苷酸为至少1纯,优选至少5纯,更优选至少10纯,更优选至少20纯,更优选至少40纯,更优选至少60纯,甚至更优选至少80纯,并且最优选至少90纯。0034基本上纯的多核苷酸术语“基本上纯的多核苷酸”用于本文指多核苷酸制备物,其不含其它外来的或不期望的核苷酸,并且处于适。
34、合于在遗传工程蛋白质生产体系中使用的形式。因此,基本上纯的多核苷酸含有按重量计至多10,优选至多8,更优选至多6,更优选至多5,更优选至多4,更优选至多3,甚至更优选至多2,最优选至多1,并且甚至最优选至多05的与其天然或重组结合的其它多核苷酸材料。然而,基本上纯的多核苷酸可以包括天然存在的5和3非翻译区,如启动子和终止子。优选基本上纯的多核苷酸是按重量计至少90纯,优选至少92纯,更优选至少94纯,更优选至少95纯,更优选至少96纯,更优选至少97纯,甚至更优选至少98纯,最优选至少99,并且甚至最优选至少995纯的。本发明的多核苷酸优选为基本上纯的形式,即所述多核苷酸制备物基本上ESSEN。
35、TIALLY不含与其天然或重组结合的其它多核苷酸材料。所述多核苷酸可以是基因组、CDNA、RNA、半合成、合成来源的,或它们的任何组合。0035编码序列术语“编码序列”在用于本文时意指直接指定其蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界通常由开读框决定,所述开读框通常以ATG起始密码子或可供选择的起始密码子如GTG和TTG开始,并且以终止密码子如TAA、TAG和TGA结束。编码序列可以是DNA、CDNA、合成的或重组的核苷酸序列。0036CDNA术语“CDNA”在本文中定义为能够通过反转录从得自真核细胞的成熟的、已剪接的MRNA分子制备的DNA分子。CDNA缺少通常存在于相应基因组DNA。
36、中的内含子序列。起始的INITIAL、初级的RNA转录物是MRNA的前体,其通过一系列的步骤加工然后作为成熟的已剪接的MRNA出现。这些步骤包括通过称为剪接的过程去除内含子序列。因而源自MRNA的CDNA没有任何内含子序列。0037核酸构建体术语“核酸构建体”用于本文指单链或双链的核酸分子,所述核酸分子分离自天然存在的基因,或将所述核酸分子以本来不存在于NOTOTHERWISEEXIST自然界中的方式修饰以含有核酸的区段或所述核酸分子是合成的。当所述核酸构建体含有表达本发明的编码序列所需的调控序列时,术语核酸构建体与术语“表达盒”同义。0038调控序列CONTROLSEQUENCE术语“调控序。
37、列”在本文定义为包括对编码本发明多肽的多核苷酸表达是必需的所有组分。各个调控序列对于编码所述多肽的核苷酸序列可以是天然的或外源的,或各个调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况,调控序列包括启动子和转录和翻译的终止信号。调控序列可以和目的为引入特异性限制位点的接头一起提供,所述特异性限制位点促进调控序列与编码多肽的核苷酸序列编码区的连接。说明书CN104169417A6/35页100039可操作地连接术语“可操作地连接”在本文表示这样的构型,其中将调控序列置于相对于多核苷酸序列的编码序列的适当位。
38、置,使得调控序列指导多肽编码序列的表达。0040表达术语“表达”包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。0041表达载体术语“表达载体”在本文定义为线性的或环状的DNA分子,其包含编码本发明多肽的多核苷酸,并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。0042宿主细胞如本文中所使用的术语“宿主细胞”包括任何细胞类型,所述细胞类型对于使用包含本发明多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的SUSCEPTIBLE。0043修饰术语“修饰”在本文中意指对由SEQIDNO2,SEQIDNO4,SEQIDNO6,SEQIDNO8,S。
39、EQIDNO10,SEQIDNO12,SEQIDNO14,SEQIDNO16或SEQIDNO18的成熟多肽组成的多肽或其同源序列的任何化学修饰,以及对编码这样的多肽的DNA的遗传操作。所述修饰可以是一个或多个几个氨基酸的取代、缺失和/或插入,以及一个或多个几个氨基酸侧链的置换。0044变体当用于本文时,术语“变体”意指具有葡糖淀粉酶活性的多肽包含改变,即在一个或多个几个位置取代、插入和/或缺失一个或多个几个氨基酸残基。取代意指用不同的氨基酸替代占据某位置的氨基酸;缺失指去除占据某位置的氨基酸;而插入意指邻接占据某位置的氨基酸添加13个氨基酸。0045发明详述0046具有葡糖淀粉酶活性的多肽00。
40、47在第一个方面,本发明涉及包含下述氨基酸序列的分离的多肽,所述氨基酸序列与SEQIDNO2,SEQIDNO4,SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQIDNO12,SEQIDNO14,SEQIDNO16或SEQIDNO18的成熟多肽具有优选至少82,更优选至少83,更优选至少84,更优选至少85,更优选至少86,更优选至少87,更优选至少88,更优选至少89,更优选至少90,更优选至少91,更优选至少92,甚至更优选至少93,最优选至少94,并且甚至最优选至少95,如至少96,至少97,至少98,至少99或甚至100同一性的同一性程度,所述多肽具有葡糖淀粉酶活性下文中的。
41、“同源多肽”。优选地,所述同源多肽具有的氨基酸序列与SEQIDNO2,SEQIDNO4,SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQIDNO12,SEQIDNO14,SEQIDNO16或SEQIDNO18的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。0048本发明的多肽优选包含SEQIDNO2,SEQIDNO4,SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQIDNO12,SEQIDNO14,SEQIDNO16或SEQIDNO18的氨基酸序列或其等位变体;或它们的。
42、具有葡糖淀粉酶活性的片段。优选地,多肽包含SEQIDNO2,SEQIDNO4,SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQIDNO12,SEQIDNO14,SEQIDNO16或SEQIDNO18的氨基酸序列。在另一优选的方面,多肽包含SEQIDNO2,SEQIDNO4,SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQIDNO12,SEQIDNO14,SEQIDNO16或SEQIDNO18的成熟多肽或其等位变体;或它们的具有葡糖淀粉酶活性的说明书CN104169417A107/35页11片段。在另一优选的方面,多肽由SEQIDNO2,SEQIDNO4,SEQIDN。
43、O6,SEQIDNO8,SEQIDNO10,SEQIDNO12,SEQIDNO14,SEQIDNO16或SEQIDNO18的氨基酸序列或其等位变体,或它们的具有葡糖淀粉酶活性的片段组成。在另一优选的方面,多肽由SEQIDNO2,SEQIDNO4,SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQIDNO12,SEQIDNO14,SEQIDNO16或SEQIDNO18的氨基酸序列组成。0049在第二个方面,本发明涉及具有葡糖淀粉酶活性的分离的多肽,其由多核苷酸编码,所述多核苷酸在优选非常低严格条件、更优选低严格条件、更优选中严格条件、更优选中高严格条件、甚至更优选高严格条件、和最优选。
44、非常高严格条件下与下列杂交ISEQIDNO1,SEQIDNO3,SEQIDNO5,SEQIDNO7,SEQIDNO9,SEQIDNO11,SEQIDNO13,SEQIDNO15或SEQIDNO17的成熟多肽编码序列,II包含SEQIDNO1,SEQIDNO3,SEQIDNO5,SEQIDNO7,SEQIDNO9,SEQIDNO11,SEQIDNO13,SEQIDNO15或SEQIDNO17的成熟多肽编码序列的基因组DNA序列,IIII或II的亚序列,或IVI、II或III的全长互补链JSAMBROOK,EFFRITSCH和TMANIATIS,1989,MOLECULARCLONING,ALAB。
45、ORATORYMANUAL,第2版,COLDSPRINGHARBOR,NEWYORK。SEQIDNO1,SEQIDNO3,SEQIDNO5,SEQIDNO7,SEQIDNO9,SEQIDNO11,SEQIDNO13,SEQIDNO15或SEQIDNO17的成熟多肽编码序列的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可以编码具有葡糖淀粉酶活性的多肽片段。优选地,所述互补链是SEQIDNO1,SEQIDNO3,SEQIDNO5,SEQIDNO7,SEQIDNO9,SEQIDNO11,SEQIDNO13,SEQIDNO15或SEQIDNO17。
46、的成熟多肽编码序列的全长互补链。0050SEQIDNO1,SEQIDNO3,SEQIDNO5,SEQIDNO7,SEQIDNO9,SEQIDNO11,SEQIDNO13,SEQIDNO15或SEQIDNO17的核苷酸序列或其亚序列;以及SEQIDNO2,SEQIDNO4,SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQIDNO12,SEQIDNO14,SEQIDNO16或SEQIDNO18的氨基酸序列或其片段,可用于设计核酸探针,以根据本领域内公知的方法从不同属或种的菌株鉴定和克隆编码具有葡糖淀粉酶活性的多肽的DNA。具体而言,可将这些探针用于根据标准的SOUTHERN印迹方法与。
47、感兴趣的属或种的基因组或CDNA杂交,以鉴定并从其中分离相应的基因。这些探针可明显短于完整序列,但长度上应为至少14个,优选至少25个,更优选至少35个,并且最优选至少70个核苷酸。然而,优选所述核酸探针长度上是至少100个核苷酸。例如,所述核酸探针长度上可以是至少200个核苷酸,优选至少300个核苷酸,更优选至少400个核苷酸,或最优选至少500个核苷酸。甚至可以使用更长的探针,例如,长度是优选至少600个核苷酸,更优选至少700个核苷酸,甚至更优选至少800个核苷酸,或最优选至少900个核苷酸的核酸探针。DNA和RNA探针二者均可使用。通常将探针标记以探测相应的基因例如,用33P、32P、。
48、3H、35S、生物素或抗生物素蛋白AVIDIN标记。将这些探针包含于本发明中。0051因而,可从由这些其它菌株制备的基因组DNA或CDNA文库中筛选DNA,所述DNA与上述探针杂交并且编码具有葡糖淀粉酶活性的多肽。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或通过其它分离技术分离来自这些其它菌株的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素NITROCELLULOSE或其它合适的载体材料并且固定于其上。为了鉴定与SEQIDNO1,SEQIDNO3,SEQIDNO5,SEQIDNO7,SEQIDNO9,说明书CN104169417A118/35页12SEQIDNO11,SEQ。
49、IDNO13,SEQIDNO15或SEQIDNO17或其亚序列同源的克隆或DNA,将所述载体材料优选用在SOUNTHERN印迹中。0052就本发明而言,杂交表示核苷酸序列在非常低至非常高的严格条件下与标记的核酸探针杂交,所述核酸探针对应于SEQIDNO1,SEQIDNO3,SEQIDNO5,SEQIDNO7,SEQIDNO9,SEQIDNO11,SEQIDNO13,SEQIDNO15或SEQIDNO17的成熟多肽编码序列;包含SEQIDNO1,SEQIDNO3,SEQIDNO5,SEQIDNO7,SEQIDNO9,SEQIDNO11,SEQIDNO13,SEQIDNO15或SEQIDNO17的成熟多肽编码序列的基因组DNA序列;其全长互补链;或其亚序列。可使用例如X射线片XRAYLM检测在这些条件下与核酸探针杂交的分子。0053优选地,核酸探针是SEQIDNO1的成熟多肽编码序列。在另一优选的方面,核酸探针是编码SEQIDNO2的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQIDNO1。在另一优选的方面,核酸探针是包含在大肠杆菌ECOLI菌株DSM23222中的质粒中含有的多核苷酸序列,其中所述其多核苷酸序列编码具有葡糖淀粉酶活性的多肽。在另一优选的方面,核酸探针是包含在大肠杆菌DSM23222中的质粒中含有的成熟多肽编码区。