《具有葡糖淀粉酶活性的多肽和编码该多肽的多核苷酸.pdf》由会员分享,可在线阅读,更多相关《具有葡糖淀粉酶活性的多肽和编码该多肽的多核苷酸.pdf(51页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 102869771 A (43)申请公布日 2013.01.09 CN 102869771 A *CN102869771A* (21)申请号 201080062699.4 (22)申请日 2010.11.30 DSM 23221 2010.01.13 61/264,977 2009.11.30 US C12N 9/34(2006.01) C12P 19/14(2006.01) C12P 7/06(2006.01) (71)申请人 诺维信公司 地址 丹麦鲍斯韦 申请人 诺维信北美公司 (72)发明人 S. 兰德维克 M.D. 莫兰特 綾部圭 G. 科沃德 - 凯利 (7。
2、4)专利代理机构 北京市柳沈律师事务所 11105 代理人 史悦 (54) 发明名称 具有葡糖淀粉酶活性的多肽和编码该多肽的 多核苷酸 (57) 摘要 本发明涉及具有葡糖淀粉酶活性的分离的多 肽和编码所述多肽的分离的多核苷酸。本发明还 涉及包含所述多核苷酸的核酸构建体、 载体和宿 主细胞, 以及产生和使用所述多肽的方法。 (30)优先权数据 (85)PCT申请进入国家阶段日 2012.07.30 (86)PCT申请的申请数据 PCT/US2010/058438 2010.11.30 (87)PCT申请的公布数据 WO2011/066576 EN 2011.06.03 (83)生物保藏信息 (5。
3、1)Int.Cl. 权利要求书 2 页 说明书 34 页 序列表 14 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 2 页 说明书 34 页 序列表 14 页 1/2 页 2 1. 一种具有葡糖淀粉酶活性的分离的多肽, 其选自下组 : (a)多肽, 其包含氨基酸序列, 所述氨基酸序列与SEQ ID NO:2、 SEQ ID NO:4或SEQ ID NO:6的成熟多肽具有优选至少90%, 更优选至少91%, 更优选至少92%, 甚至更优选至少93%, 最优选至少94%, 并且甚至最优选至少95%, 如至少96%, 至少97%, 至少98%, 至少99%或甚至 10。
4、0% 同一性 ; (b)多肽, 其包含氨基酸序列, 所述氨基酸序列与SEQ ID NO:2、 SEQ ID NO:4或SEQ ID NO:6的氨基酸22至476所示的催化域具有优选至少90%, 更优选至少91%, 更优选至少92%, 甚至更优选至少93%, 最优选至少94%, 并且甚至最优选至少95%, 如至少96%, 至少97%, 至少 98%, 至少 99% 或甚至 100% 同一性 ; (c) 多肽, 其由多核苷酸编码, 所述多核苷酸在优选至少中 - 高严格条件下, 和最优选 至少高严格条件下与以下杂交 : (i)SEQ ID NO:1、 SEQ ID NO:3 或 SEQ ID NO:。
5、5 的成熟多肽 编码序列, (ii) 包含于 SEQ ID NO:1、 SEQ ID NO:3 或 SEQ ID NO:5 的 cDNA 序列, 或 (iii) (i) 或 (ii) 的全长互补链 ; (d) 多肽, 其由多核苷酸编码, 所述多核苷酸包含核苷酸序列, 所述核苷酸序列与 SEQ ID NO:1、 SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列具有优选至少90%, 更优选至少 91%, 更优选至少92%, 甚至更优选至少93%, 最优选至少94%, 并且甚至最优选至少95%, 如甚 至至少 96%, 97%, 98%, 99% 或 100% 同一性 ; 和 (e)。
6、SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的成熟多肽的包含取代、 缺失和 / 或插 入一个或多个 ( 几个 ) 氨基酸的变体。 2. 权利要求 1 的多肽, 其包含 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的氨基酸序 列, SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的成熟多肽的氨基酸序列, 或它们具有葡糖 淀粉酶活性的片段 ; 或由SEQ ID NO:2、 SEQ ID NO:4或SEQ ID NO:6的氨基酸序列, SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID 。
7、NO:6 的成熟多肽的氨基酸序列, 或它们具有葡糖淀粉酶活性 的片段组成。 3. 权利要求 1 或 2 的多肽, 其由多核苷酸编码, 所述多核苷酸包含 SEQ ID NO:1、 SEQ ID NO:3 或 SEQ ID NO:5 的核苷酸序列, 或它们编码具有葡糖淀粉酶活性的片段的亚序列 ; 或由 SEQ ID NO:1、 SEQ ID NO:3 或 SEQ ID NO:5 的核苷酸序列, 或它们编码具有葡糖淀粉 酶活性的片段的亚序列组成。 4. 权利要求 1-3 任一项的多肽, 其由大肠杆菌 DSM 23221 中包含的质粒中包含的多核 苷酸编码。 5.权利要求1-4任一项的多肽, 其中所述。
8、成熟多肽是SEQ ID NO:2、 SEQ ID NO:4或SEQ ID NO:6 的氨基酸 19 至 573。 6. 一种具有糖结合活性的分离的多肽, 其包含糖结合模块, 所述模块与 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的氨基酸 479 至 573 所示的糖结合域具有至少 80%, 更优选 至少 81%, 更优选至少 82%, 更优选至少 83%, 更优选至少 84%, 更优选至少 85%, 更优选至少 86%, 更优选至少 87%, 更优选至少 88%, 更优选至少 89%, 更优选至少 90%, 更优选至少 91%, 更优选至少 92%, 甚至更。
9、优选至少 93%, 最优选至少 94%, 并且甚至最优选至少 95%, 如至少 95%, 至少 97%, 至少 98%, 至少 99% 或甚至 100% 同一性。 7. 一种杂合酶, 其包含催化域和权利要求 6 的糖结合域。 权 利 要 求 书 CN 102869771 A 2 2/2 页 3 8. 权利要求 7 的杂合酶, 其中所述催化域具有选自下组的酶活性 : - 淀粉酶, 淀粉支 链淀粉酶 (amylopullulanase), - 淀粉酶, CGT 酶, 葡糖淀粉酶, 异淀粉酶, 产麦芽糖淀粉 酶和支链淀粉酶。 9. 一种分离的多核苷酸, 其包含编码权利要求 1-8 任一项的多肽的核苷。
10、酸序列。 10. 一种核酸构建体, 其包含可操作连接的权利要求 9 的多核苷酸和指导所述多肽在 表达宿主中产生的一种或多种 ( 几种 ) 调控序列。 11. 一种重组表达载体, 其包含权利要求 10 的核酸构建体。 12. 一种重组宿主细胞, 其包含权利要求 10 的核酸构建体。 13. 一种产生权利要求 1-8 任一项的多肽的方法, 包括 : (a) 在有助于所述多肽产生 的条件下培养包含核酸构建体的宿主细胞, 所述核酸构建体包含编码所述多肽的核苷酸序 列 ; 和 (b) 回收所述多肽。 14. 一种产生权利要求 1-8 任一项的多肽的方法, 包括 : (a) 在有助于所述多肽产生的 条件下。
11、培养转基因植物或植物细胞, 所述植物或植物细胞包含编码所述多肽的多核苷酸 ; 和 (b) 回收所述多肽。 15. 一种转基因植物、 植物部分或植物细胞, 其用编码权利要求 1-8 任一项的多肽的多 核苷酸转化。 16. 权利要求 1-8 任一项的多肽用于产生糖浆和 / 或发酵产物的用途。 17. 权利要求 16 的用途, 其中所述起始材料为糊化的或未糊化的含淀粉材料。 18. 权利要求 1-8 任一项的多肽用于酿造的用途。 19. 一种组合物, 其包含 - 淀粉酶和权利要求 1-8 任一项的多肽。 20. 一种从含淀粉材料产生发酵产物的方法, 包括下述步骤 : (a) 液化含淀粉材料 ; (b。
12、) 糖化经液化的材料 ; 和 (c) 用发酵生物发酵 ; 其中步骤 (b) 使用至少一种权利要求 1-5 任一项的葡糖淀粉酶进行。 21. 一种从含淀粉材料产生发酵产物的方法, 包括下述步骤 : (a) 在含淀粉材料的起始糊化温度以下的温度糖化所述含淀粉材料 ; 和 (b) 用发酵生物发酵 ; 其中步骤 (a) 使用至少一种权利要求 1-5 任一项的葡糖淀粉酶进行。 权 利 要 求 书 CN 102869771 A 3 1/34 页 4 具有葡糖淀粉酶活性的多肽和编码该多肽的多核苷酸 0001 涉及序列表 0002 本申请含有计算机可读形式的序列表, 所述计算机可读形式通过提述并入本文。 00。
13、03 涉及生物材料的保藏 0004 本申请包含对于生物材料保藏的引用, 所述保藏通过提述并入本文。对于其完整 信息, 参见说明书最后一段。 0005 发明背景 发明领域 0006 本发明涉及具有葡糖淀粉酶活性的多肽和编码所述多肽的多核苷酸。 本发明还涉 及包含所述多核苷酸的核酸构建体、 载体和宿主细胞, 以及用于产生和使用所述多肽的方 法, 和本发明的葡糖淀粉酶用于淀粉转化以产生发酵产物如乙醇, 和糖浆如葡萄糖的用途。 本发明还涉及包含本发明的葡糖淀粉酶的组合物。 0007 相关领域描述 0008 葡糖淀粉酶 (1,4-D- 葡聚糖葡糖水解酶, EC 3.2.1.3) 是催化从淀粉或相关的 寡。
14、糖和多糖分子的非还原端释放 D- 葡萄糖的酶。葡糖淀粉酶由几种丝状真菌和酵母产生, 其中来自曲霉属 (Aspergillus) 的那些在商业上最为重要。 0009 商业上, 使用葡糖淀粉酶将已经由 - 淀粉酶部分水解的淀粉材料转化为葡萄 糖。然后可使用发酵生物将葡萄糖直接或间接地转化为发酵产物。商业性发酵产物的实例 包括醇 ( 例如乙醇, 甲醇, 丁醇, 1,3- 丙二醇 ), 有机酸 ( 例如柠檬酸, 乙酸, 衣康酸, 乳酸, 葡 糖酸, 葡糖酸盐, 乳酸, 琥珀酸, 2,5- 二酮 -D- 葡糖酸 ) ; 酮 ( 例如丙酮 ) ; 氨基酸 ( 例如谷氨 酸 ) ; 气体 ( 例如 H2和 。
15、CO2), 和更复杂的化合物, 包括例如抗生素 ( 例如青霉素和四环素 ) ; 酶 ; 维生素 ( 例如核黄素, B12, - 胡萝卜素 ) ; 激素, 和其他难以合成产生的化合物。发酵 工艺亦常用于可饮用醇类 ( 例如啤酒和葡萄酒 ) 工业。 0010 终产物亦可为糖浆。 例如, 终产物可为葡萄糖, 但亦可例如由葡萄糖异构酶转化为 果糖或由几乎等量的葡萄糖和果糖构成的混合物。 该混合物, 或进一步富集果糖的混合物, 是整个世界商业化的最常用的高果糖玉米糖浆 (HFCS)。 0011 本发明的一个目的是提供具有葡糖淀粉酶活性的多肽和编码所述多肽的多核苷 酸, 其在发酵产物生产工艺 ( 如乙醇生。
16、产工艺, 包括由未糊化的生 ( 或未烹制 ) 淀粉的一步 乙醇发酵工艺 ) 中提供高产率 / 得率 (yield)。 0012 Uniprot:B0CVJ1 公 开 了 来 自 双 色 蜡 蘑 (Laccaria bicolor) 的 多 肽 且 WO2006/069289 描述了来自瓣环栓菌 (Trametes cingulata) 的葡糖淀粉酶。 0013 发明概述 0014 已鉴定并表征了由真菌血红密孔菌(Pycnoporus sanguineus)产生并具有葡糖淀 粉酶活性的多肽。 0015 相应地, 本发明在第一个方面涉及具有葡糖淀粉酶活性的分离的多肽, 选自下组 : (a)多肽, 。
17、其包含氨基酸序列, 所述氨基酸序列与SEQ ID NO:2、 SEQ ID NO:4或SEQ ID NO:6 说 明 书 CN 102869771 A 4 2/34 页 5 的成熟多肽具有优选至少90%, 更优选至少91%, 更优选至少92%, 甚至更优选至少93%, 最优 选至少94%, 并且甚至最优选至少95%, 如至少96%, 至少97%, 至少98%, 至少99%或甚至100% 同一性 ; (b)多肽, 其包含氨基酸序列, 所述氨基酸序列与SEQ ID NO:2、 SEQ ID NO:4或SEQ ID NO:6 的氨基酸 22 至 476 所示的催化域具有优选至少 90%, 更优选至少。
18、 91%, 更优选至少 92%, 甚至更优选至少93%, 最优选至少94%, 并且甚至最优选至少95%, 如至少96%, 至少97%, 至少 98%, 至少 99% 或甚至 100% 同一性 ; (c) 多肽, 其由多核苷酸编码, 所述多核苷酸在优 选至少中 - 高严格条件下, 并且最优选在高严格条件下与以下杂交 : (i)SEQ ID NO:1、 SEQ ID NO:3 或 SEQ ID NO:5 的成熟多肽编码序列 ; (ii) 包含于 SEQ ID NO:1、 SEQ ID NO:3 或 SEQ ID NO:5 中的 cDNA 序列, 或 (iii)(i) 或 (ii) 的全长互补链 ;。
19、 (d) 多肽, 其由多核苷酸 编码, 所述多核苷酸包含核苷酸序列, 所述核苷酸序列与 SEQ ID NO:1、 SEQ ID NO:3 或 SEQ ID NO:5 的成熟多肽编码序列具有优选至少 90%, 更优选至少 91%, 更优选至少 92%, 甚至更 优选至少 93%, 最优选至少 94%, 并且甚至最优选至少 95%, 如至少 96%, 至少 97%, 至少 98%, 至少 99% 或甚至 100% 同一性 ; 和 (e)SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的成熟多 肽的包含一个或多个 ( 几个 ) 氨基酸的取代、 缺失和 / 或插入变体。 。
20、0016 本发明在第二个方面涉及分离的多核苷酸, 其包含编码第一个方面的多肽的核苷 酸序列。 0017 在进一步的方面, 本发明涉及包含第二个方面的多核苷酸的核酸构建体, 重组表 达载体, 重组宿主细胞, 转基因植物、 植物部分或植物细胞。 0018 在又进一步的方面, 本发明涉及产生所述多肽的方法, 所述多肽的用途, 和包含 - 淀粉酶和所述多肽的组合物。 0019 定义 0020 葡糖淀粉酶 : 术语葡糖淀粉酶 (1,4-D- 葡聚糖葡糖水解酶, 3.2.1.3) 定义为催 化从淀粉或相关的寡糖和多糖分子的非还原端释放 D- 葡萄糖的酶。就本发明而言, 葡糖淀 粉酶活性根据下文 “材料和方。
21、法” 部分描述的步骤确定。 0021 本发明的多肽具有 SEQ ID NO:2 的成熟多肽或其同源序列, 或者 SEQ ID NO:4 的 成熟多肽或其同源序列, 或者 SEQ ID NO:6 的成熟多肽或其同源序列的葡糖淀粉酶活性的 至少 20%, 优选至少 40%, 优选至少 45%, 更优选至少 50%, 优选至少 55%, 更优选至少 60%, 优 选至少65%, 更优选至少70%, 优选至少75%, 更优选至少80%, 优选至少85%, 甚至更优选至少 90%, 最优选至少 95%, 和甚至最优选至少 100%。 0022 分离的多肽 : 术语 “分离的多肽” 用于本文中指从来源分离。
22、的多肽。优选地, 所述 多肽如通过 SDS-PAGE 测定的, 为至少 1% 纯, 优选至少 5% 纯, 更优选至少 10% 纯, 更优选至 少 20% 纯, 更优选至少 40% 纯, 更优选至少 60% 纯, 甚至更优选至少 80% 纯, 并且最优选至少 90% 纯。 0023 基本上纯的多肽 : 术语 “基本上纯的多肽” 在本文表示多肽制备物, 所述多肽制备 物含有按重量计至多10%, 优选至多8%, 更优选至多6%, 更优选至多5%, 更优选至多4%, 更优 选至多 3%, 甚至更优选至多 2%, 最优选至多 1%, 并且甚至最优选至多 0.5% 的与其天然或重 组结合的 (associ。
23、ated) 的其它多肽材料。因此, 优选所述基本上纯的多肽是按存在于制备 物中的全部多肽材料的重量计至少 92% 纯, 优选至少 94% 纯, 更优选至少 95% 纯, 更优选至 少 96% 纯, 更优选至少 96% 纯, 更优选至少 97% 纯, 更优选至少 98% 纯, 甚至更优选至少 99% 说 明 书 CN 102869771 A 5 3/34 页 6 纯, 最优选至少 99.5% 纯, 并且甚至最优选 100% 纯。本发明的多肽优选是基本上纯的形式, 即, 所述多肽制备物基本上 (essentially) 不含与其天然或重组结合的其它多肽材料。例 如, 这能够通过以下实现 : 通过公。
24、知的重组方法或由经典纯化方法制备多肽。 0024 成熟多肽 : 术语 “成熟多肽” 意指为以其在翻译和任何翻译后修饰之后的最终形式 存在的多肽, 所述修饰如N-末端加工、 C-末端截短、 糖基化、 磷酸化等。 在一个方面, 基于预 测 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的氨基酸 1 至 18 是信号肽的 SignalP 程序 (Nielsen 等 ,1997,Protein Engineering10:1-6), 所述成熟多肽是 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的氨基酸 19 至 573。优选地, 所述成。
25、熟多肽是 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的氨基酸 19 至 573。由 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的氨基酸 22 至 476 定义的序列是催化域, 而由 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的氨基酸 479 至 573 定义的序列是淀粉结合域。 0025 成熟多肽编码序列 : 术语 “成熟多肽编码序列” 在本文中定义为编码具有葡糖淀粉 酶活性的成熟多肽的核苷酸序列。优选地, 所述成熟多肽编码序列是由 SEQ ID NO:1 的位 置 55 至 159, 。
26、229 至 505, 573 至 877, 932 至 1207, 1269 至 1731, 1800 至 1895, 1962 至 2104, SEQ ID NO:3 或 SEQ ID NO:5 的位置 55 至 159, 229 至 504, 571 至 876, 942 至 1217, 1276 至 1738, 1806 至 1901, 1960 至 2102 定义的核苷酸。 0026 同一性 : 参数 “同一性” 描述两个氨基酸序列之间或两个核苷酸序列之间的相关 性。 0027 就本发明而言, 两个氨基酸序列之间的同一性程度使用如 EMBOSS 软件包 (EMBOSS:The Euro。
27、pean Molecular Biology Open Software Suite,Rice等,2000,Trends in Genetics 16:276-277)( 优选 3.0.0 版或更高版本 ) 的 Needle 程序中所执行的 Needleman-Wunsch 算 法 (Needleman 和 Wunsch,1970,J.Mol.Biol.48:443-453) 来 测 定。 使用的可选参数为缺口开启罚分 (gap open penalty)10, 缺口延伸罚分 (gap extension penalty)0.5 和 EBLOSUM62(BLOSUM62 的 EMBOSS 版 。
28、) 取代矩阵。使用 Needle 标记为 “最长 同一性 (longest identity)” 的输出结果 ( 使用 -nobrief 选项获得 ) 作为百分比同一性, 并计算如下 : 0028 ( 同样的残基 100)/( 比对长度 - 比对中缺口的总数 ) 0029 就本发明而言, 两个脱氧核糖核苷酸序列之间的同一性程度使用如 EMBOSS 软件 包 (EMBOSS:The European Molecular Biology Open Software Suite,Rice 等 ,2000, 见 上文 )( 优选 3.0.0 版或更高版本 ) 的 Needle 程序中所执行的 Need。
29、leman-Wunsch 算法 (Needleman 和 Wunsch,1970, 见上文 ) 来测定。使用的可选参数为缺口开启罚分 10, 缺口 延伸罚分 0.5 和 EDNAFULL(NCBI NUC4.4 的 EMBOSS 版 ) 取代矩阵。使用 Needle 标记为 “最 长同一性” 的输出结果 ( 使用 -nobrief 选项获得 ) 作为百分比同一性, 并计算如下 : 0030 ( 同样的脱氧核糖核苷酸 100)/( 比对长度比对中缺口的总数 ) 0031 同源序列 : 术语 “同源序列” 在本文中定义为分别与 SEQ ID NO:1、 SEQ ID NO:3 或 SEQ ID N。
30、O:5 的成熟多肽编码部分, 或者与 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的 成熟多肽具有至少90%, 更优选至少91%, 更优选至少92%, 甚至更优选至少93%, 最优选至少 94%, 和甚至最优选至少 95%, 如至少 96%, 至少 97%, 至少 98%, 或甚至至少 99% 同一性程度的 核苷酸序列 / 多肽序列。 说 明 书 CN 102869771 A 6 4/34 页 7 0032 多肽片段 : 术语 “多肽片段” 在本文中定义为从 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的成熟多肽或其同源序列的。
31、氨基和 / 或羧基末端缺失一个或多个 ( 几个 ) 氨基酸 的多肽 ; 其中所述片段具有葡糖淀粉酶活性。优选地, 片段含有 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的成熟多肽或其同源序列的至少 500 个氨基酸残基, 更优选至少 450 个氨 基酸残基, 和最优选至少 400 个氨基酸残基。具体片段是由 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的的氨基酸 22 至 476 定义的序列, 其包含本发明的多肽的催化域。 0033 亚序列 : 术语 “亚序列 (subsequence)” 在本文中定义为从 SEQ ID NO。
32、:1、 SEQ ID NO:3 或 SEQ ID NO:5 的成熟多肽编码序列或其同源序列的 5 和 / 或 3 端缺失一个或多个 ( 几个 ) 核苷酸的核苷酸序列 ; 其中所述亚序列编码具有葡糖淀粉酶活性的多肽片段。优 选地, 亚序列含有 SEQ ID NO:1 的成熟多肽编码序列、 SEQ ID NO:3 的成熟多肽编码序列或 SEQ ID NO:5的成熟多肽编码序列或其同源序列的至少1500个核苷酸, 更优选至少1400个 核苷酸, 和最优选至少 1200 个核苷酸。 0034 等位变体 (allelic variant) : 术语 “等位变体” 在本文中表示占据相同染色体基 因座的基因。
33、的任何两种或两种以上可选形式。等位变异通过突变天然地发生, 并且可导致 种群内的多态性。基因突变可以是沉默的 ( 在编码的多肽中无变化 ) 或可以编码具有改变 的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。 0035 分离的多核苷酸 : 术语 “分离的多核苷酸” 用于本文中指从来源分离的多核苷酸。 优选地, 多核苷酸如通过琼脂糖电泳测定的, 为至少 1% 纯, 优选至少 5% 纯, 更优选至少 10% 纯, 更优选至少 20% 纯, 更优选至少 40% 纯, 更优选至少 60% 纯, 甚至更优选至少 80% 纯, 并 且最优选至少 90% 纯。 0036 基本上纯的多核苷酸 。
34、: 术语 “基本上纯的多核苷酸” 用于本文指不含其它外来的或 不期望的核苷酸的多核苷酸制备物, 并且所述多核苷酸制备物处于适合于在遗传工程的蛋 白质生产体系中使用的形式。因此, 基本上纯的多核苷酸含有按重量计至多 10%, 优选至多 8%, 更优选至多 6%, 更优选至多 5%, 更优选至多 4%, 更优选至多 3%, 甚至更优选至多 2%, 最 优选至多 1%, 并且甚至最优选至多 0.5% 的与其天然或重组结合的其它多核苷酸材料。然 而, 基本上纯的多核苷酸可以包括天然存在的 5 和 3 非翻译区, 例如启动子和终止子。优 选基本上纯的多核苷酸是按重量计至少 90% 纯, 优选至少 92%。
35、 纯, 更优选至少 94% 纯, 更优 选至少 95% 纯, 更优选至少 96% 纯, 更优选至少 97% 纯, 甚至更优选至少 98% 纯, 最优选至少 99%, 并且甚至最优选至少 99.5% 纯的。本发明所述多核苷酸优选为基本上纯的形式, 即, 所 述多核苷酸制备物基本上不含与其天然或重组结合的其它多核苷酸材料。 所述多核苷酸可 以是基因组、 cDNA、 RNA、 半合成、 合成来源的, 或它们的任何组合。 0037 编码序列 : 当用于本文时术语 “编码序列” 的意思是直接指定其蛋白产物的氨基酸 序列的核苷酸序列。编码序列的边界通常由开读框决定, 所述开读框通常以 ATG 起始密码 子。
36、或可供选择的起始密码子例如 GTG 和 TTG 开始, 并且以终止密码子例如 TAA、 TAG 和 TGA 结束。编码序列可以是 DNA、 cDNA、 合成的或重组的核苷酸序列。 0038 cDNA : 术语 “cDNA” 在本文中定义为可通过逆转录从自真核细胞获得的成熟的、 剪 接的 mRNA 分子制备的 DNA 分子。cDNA 缺乏通常存在于相应的基因组 DNA 中的内含子序列。 该起始的、 初级的 RNA 转录物是 mRNA 的前体, 其经历一系列步骤, 最后作为成熟的、 剪接的 mRNA出现。 这些步骤包括通过称作剪接的过程去除内含子序列。 因此, 来源于mRNA的cDNA 说 明 书。
37、 CN 102869771 A 7 5/34 页 8 不含任何内含子序列。 0039 核酸构建体 : 术语 “核酸构建体” 用于本文指单链或双链的核酸分子, 所述核酸分 子分离自天然存在的基因, 或将所述核酸分子以本来不存在于 (not otherwise exist) 自 然界中的方式修饰以含有核酸的区段, 或所述核酸分子是合成的。当所述核酸构建体含有 表达本发明的编码序列所需的调控序列时, 术语核酸构建体与术语 “表达盒” 同义。 0040 调控序列(control sequence) : 术语 “调控序列” 在本文定义为包括对编码本发明 多肽的多核苷酸表达是必需的所有成分。 各个调控序列。
38、对于编码所述多肽的核苷酸序列可 以是天然的或外源的, 或各个调控序列对于彼此可以是天然的或外源的。这些调控序列包 括但不限于前导序列、 聚腺苷酸化序列、 前肽序列、 启动子、 信号肽序列和转录终止子。 最少 的情况, 调控序列包括启动子和转录和翻译的终止信号。调控序列可以和用于引入特异性 限制位点的接头一起提供, 所述特异性限制位点促进调控序列与编码多肽的核苷酸序列编 码区的连接。 0041 可操作地连接 : 术语 “可操作地连接” 在本文表示这样的构型, 其中将调控序列置 于相对于多核苷酸序列的编码序列的适当位置, 使得调控序列指导多肽编码序列的表达。 0042 表达 : 术语 “表达” 包。
39、括涉及多肽产生的任何步骤, 其包括但不限于转录、 转录后修 饰、 翻译、 翻译后修饰和分泌。 0043 表达载体 : 术语 “表达载体” 在本文定义为线性的或环状的 DNA 分子, 其包含编 码本发明多肽的多核苷酸, 并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连 接。 0044 宿主细胞 : 如本文中所使用的术语 “宿主细胞” 包括任何细胞类型, 所述细胞类 型对于使用包含本发明多核苷酸的核酸构建体或表达载体的转化、 转染、 转导等是易感的 (susceptible)。 0045 修饰 : 术语 “修饰” 在本文的意思是, 对分别由 SEQ ID NO:2、 SEQ ID NO:4 。
40、或 SEQ ID NO:6的成熟多肽或其同源序列组成的多肽的任何化学修饰, 以及对编码所述多肽的DNA 的遗传操作。所述修饰可以是一个或多个 ( 几个 ) 氨基酸的取代、 缺失和 / 或插入, 以及一 个或多个 ( 几个 ) 氨基酸侧链的置换。 0046 变体 : 当用于本文, 术语 “变体” 意指具有葡糖淀粉酶活性的多肽, 其在一个或多个 ( 几个 ) 位置包含改变, 即一个或多个 ( 几个 ) 氨基酸残基的取代、 插入和 / 或缺失。取代 意指用不同的氨基酸取代占据某位置的氨基酸 ; 缺失意指去除占据某位置的氨基酸 ; 而插 入意指邻接占据某位置的氨基酸添加 1-3 个氨基酸。 0047 。
41、发明详述 0048 具有葡糖淀粉酶活性的多肽 0049 在第一个方面, 本发明涉及具有葡糖淀粉酶活性的分离的多肽 ( 在下文中称为 “同源多肽” ), 所述多肽包含氨基酸序列, 所述氨基酸序列与 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的成熟多肽具有优选至少 90%, 更优选至少 91%, 更优选至少 92%, 甚至更优选 至少 93%, 最优选至少 94%, 并且甚至最优选至少 95%, 如至少 96%, 至少 97%, 至少 98%, 至少 99% 或甚至 100% 的同一性程度。优选地, 所述同源多肽具有氨基酸序列, 所述氨基酸序列 与 SEQ ID。
42、 NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的成熟多肽相差十个氨基酸, 优选相差五个 氨基酸, 更优选相差四个氨基酸, 甚至更优选相差三个氨基酸, 最优选相差两个氨基酸, 并 说 明 书 CN 102869771 A 8 6/34 页 9 且甚至最优选相差一个氨基酸。 0050 本发明的多肽优选包含SEQ ID NO:2、 SEQ ID NO:4或SEQ ID NO:6的氨基酸序列 或其等位变体, 或其具有葡糖淀粉酶活性的片段。在另一个优选的方面, 所述多肽包含 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的成熟多肽或其等位变体, 或其具。
43、有葡糖淀粉酶活 性的片段。在另一个优选的方面, 所述多肽由 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的氨基酸序列或其等位变体, 或其具有葡糖淀粉酶活性的片段组成。 0051 在第二个方面, 本发明涉及具有葡糖淀粉酶活性的分离的多肽, 其由多核苷酸编 码, 所述多核苷酸在优选非常低严格条件, 更优选低严格条件, 更优选中等严格条件, 更优 选中等 - 高严格条件, 甚至更优选高严格条件, 和最优选优选非常高严格条件下与以下杂 交 : (i)SEQ ID NO:1、 SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列 ; (ii)包含于SEQ I。
44、D NO:1、 SEQ ID NO:3 或 SEQ ID NO:5 的 cDNA 序列, (iii)(i) 或 (ii) 的亚序列 ; 或 (iv)(i)、 (ii) 或 (iii) 的全长互补链 (J.Sambrook, E.F.Fritsch, 和 T.Maniatis,1989,Molecular Cloning, A Laboratory Manual, 第 2 版 ,Cold Spring Harbor, New York)。SEQ ID NO:1、 SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸, 或优选至少 200 个连续的核。
45、苷酸。而且, 所述亚序列可编码具有葡糖淀粉酶活性的多肽片 段。优选地, 所述互补链是 SEQ ID NO:1、 SEQ ID NO:3 或 SEQ ID NO:5 的成熟多肽编码序 列的全长互补链。 0052 SEQ ID NO:1、 SEQ ID NO:3 或 SEQ ID NO:5 的核苷酸序列, 或其亚序列, 以及 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的氨基酸序列, 或其片段, 可用于设计核酸探针, 以 根据本领域内公知的方法从不同属或种的菌株鉴定和克隆编码具有葡糖淀粉酶活性的多 肽的DNA。 具体而言, 根据标准的Southern印迹方法, 可。
46、将这些探针用于与感兴趣的属或种 的基因组或 cDNA 杂交, 以鉴定和分离其中相应的基因。这些探针可明显短于完整序列, 但 长度上应为至少14, 优选至少25, 更优选至少35, 并且最优选至少70个核苷酸。 然而, 优选 所述核酸探针是至少 100 个核苷酸长度。例如, 所述核酸探针的长度可为至少 200 个核苷 酸, 优选至少 300 个核苷酸, 更优选至少 400 个核苷酸, 或最优选至少 500 个核苷酸。可使 用甚至更长的探针, 例如长度为优选至少 600 个核苷酸, 更优选至少 700 个核苷酸, 甚至更 优选至少 800 个核苷酸, 或最优选至少 900 个氨基酸的核酸探针。DN。
47、A 和 RNA 探针二者均可 使用。通常将探针标记以探测相应的基因 ( 例如, 用 33P、32P、3H、35S、 生物素或抗生物素蛋白 (avidin) 标记 )。这些探针涵盖于本发明中。 0053 因而, 可从由这些其它菌株制备的基因组 DNA 或 cDNA 文库中筛选 DNA, 所述 DNA 与上述探针杂交并且编码具有葡糖淀粉酶活性的多肽。 可以通过琼脂糖或聚丙烯酰胺凝胶 电泳, 或通过其它分离技术分离来自这些其它菌株的基因组或其它 DNA。可以将来自文库 的 DNA 或分离的 DNA 转移至并且固定于硝化纤维素 (nitrocellulose) 或其它合适的载体 材料。为了鉴定与 SE。
48、Q ID NO:1、 SEQ ID NO:3 或 SEQ ID NO:5, 或其亚序列同源的克隆或 DNA, 将所述载体材料优选用于 Sounthern 印迹中。 0054 就本发明而言, 杂交表示核苷酸序列在非常低至非常高的严格条件下与标记的核 酸探针杂交, 所述核酸探针对应于 SEQ ID NO:1、 SEQ ID NO:3 或 SEQ ID NO:5 的成熟多肽 编码序列 ; 包含于SEQ ID NO:1、 SEQ ID NO:3或SEQ ID NO:5的cDNA序列 ; 其全长互补链 ; 或它们的亚序列。可使用例如 X 射线片 (X-ray film) 检测在这些条件下与核酸探针杂交 。
49、说 明 书 CN 102869771 A 9 7/34 页 10 的分子。 0055 优选地, 核酸探针是 SEQ ID NO:1、 SEQ ID NO:3 或 SEQ ID NO:5 的成熟多肽编码 序列。 0056 在另一个优选的方面, 核酸探针是编码SEQ ID NO:2的多肽的多核苷酸序列, 或其 亚序列。在另一个优选的方面, 核酸探针是 SEQ ID NO:1。在另一个优选的方面, 核酸探针 是大肠杆菌菌株 DSM 23221 中的质粒中包含的多核苷酸序列, 其中其多核苷酸序列编码具 有葡糖淀粉酶活性的多肽。在另一个优选的方面, 核酸探针是大肠杆菌菌株 DSM 23221 中 的质粒中包含的成熟多肽编码区。 0057 在另一个优选的方面, 核酸探针是 SEQ ID NO:3 的成熟多肽编码序列。在另一个 优选的方面, 核酸探针是编码 SEQ ID NO:4 的多肽的多核苷酸序列, 或其亚序列。在另一个 优选的方面, 核酸探针是 SEQ ID NO:3。 0058 在另一个优选的方面, 核酸探针是 SEQ ID 。