具有葡糖淀粉酶活性的多肽及其编码多核苷酸.pdf

摘要
申请专利号：	CN201080054626.0	申请日：	2010.11.30
公开号：	CN104169417A	公开日：	2014.11.26
当前法律状态：	实审	有效性：	审中
法律详情：	实质审查的生效IPC(主分类):C12N 9/34申请日:20101130\|\|\|公开
IPC分类号：	C12N9/34; C12P19/14; C12P7/06	主分类号：	C12N9/34
申请人：	诺维信公司; 诺维信北美公司
发明人：	S.兰德维克; M.D.莫兰特; 绫部圭; G.科沃德-凯利
地址：	丹麦鲍斯韦
优先权：	2009.12.01 US 61/265,526; 2010.10.26 US 61/406,741
专利代理机构：	北京市柳沈律师事务所 11105	代理人：	封新琴
PDF下载：	PDF下载

内容摘要

本发明涉及具有葡糖淀粉酶活性的分离的多肽和编码所述多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞，以及产生和使用所述多肽的方法。

权利要求书

1.  一种具有葡糖淀粉酶活性的分离的多肽，其选自下组：
(a)多肽，其包含氨基酸序列，所述氨基酸序列与SEQ IDNO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16或SEQ ID NO:18的成熟多肽具有优选至少82%，更优选至少83%，更优选至少84%，更优选至少85%，更优选至少86%，更优选至少87%，更优选至少88%，更优选至少89%，更优选至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，并且甚至最优选至少95%，如至少95%，至少97%，至少98%，至少99%或甚至100%同一性；
(b)多肽，其包含氨基酸序列，所述氨基酸序列与SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12，SEQ ID NO:14的氨基酸19至474或者SEQ ID NO:16或SEQ ID NO:18的氨基酸19至471所示的催化域具有优选至少82％，更优选至少83％，更优选至少84％，更优选至少85%，更优选至少86%，更优选至少87%，更优选至少88%，更优选至少89%，更优选至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，并且甚至最优选至少95%，如至少96%，至少97%，至少98%，至少99%或甚至100%同一性；
(c)多肽，其由多核苷酸编码，所述多核苷酸在优选至少中-高严格条件下，和最优选至少高严格条件下与以下杂交：(i)SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列，(ii)包含SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列的基因组DNA序列，或(iii)(i)或(ii)的全长互补链；
(d)多肽，其由多核苷酸编码，所述多核苷酸包含核苷酸序列，所述核苷酸序列与SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列具有优选至少82%，更优选至少83%，更优选至少84%，更优选至少85%，更优选至少86%，更优选至少87%，更优选至少88%，更优选至少89%，更优选至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，并且甚至最优选至少95%，如至少96%，至少97%，至少98%，至少99%或甚至100%同一性；和
(e)变体，其包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ IDNO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ IDNO:12，SEQ ID NO:14，SEQ ID NO:16或SEQ ID NO:18的成熟多肽。

2.  权利要求1的多肽，其包含或组成为SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16或SEQ ID NO:18的氨基酸序列；SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12，SEQ IDNO:14，SEQ ID NO:16或SEQ ID NO:18的成熟多肽；或它们具有葡糖淀粉酶活性的片段。

3.  权利要求1或2的多肽，其由多核苷酸编码，所述多核苷酸包含或组成为SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的核苷酸序列；或它们编码具有葡糖淀粉酶活性的片段的亚序列。

4.  权利要求1-3任一项的多肽，其由DSM 23222中包含的质粒中含有的多核苷酸编码。

5.  权利要求1-4任一项的多肽，其中所述成熟多肽是SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12或SEQ ID NO:14的氨基酸18至573或SEQ ID NO:16或SEQ ID NO:18的氨基酸18至576。

6.  一种具有糖结合活性的分离的多肽，其包含糖结合模块，所述模块与SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12或SEQ ID NO:14的氨基酸480至573或者SEQ ID NO:16或SEQ ID NO:18的氨基酸483至576所示的糖结合域具有优选至少80%，更优选至少81%，更优选至少82%，更优选至少83%，更优选至少84%，更优选至少85%，更优选至少86%，更优选至少87%，更优选至少88%,更优选至少89%，更优选至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，并且甚至最优选至少95%，如至少95%，至少97%，至少98%，至少99%或甚至100%同一性。

7.  一种杂合酶，其包含催化域和权利要求6的糖结合域。

8.  权利要求7的杂合酶，其中所述催化域具有选自下组的酶活性：α-淀粉酶，amylopullulanase，β-淀粉酶，CGT酶，葡糖淀粉酶，异淀粉酶，产麦芽糖淀粉酶和支链淀粉酶。

9.  一种分离的多核苷酸，其包含编码权利要求1-8任一项的多肽的核苷酸序列。

10.  一种核酸构建体，其包含可操作连接的权利要求9的多核苷酸和一种或多种(几种)调控序列，所述调控序列指导所述多肽在表达宿主中的表达。

11.  一种重组表达载体，其包含权利要求10的核酸构建体。

12.  一种重组宿主细胞，其包含权利要求10的核酸构建体。

13.  一种产生权利要求1-8任一项的多肽的方法，包括：(a)在有助于所述多肽产生的条件下培养包含核酸构建体的宿主细胞，所述核酸构建体包含编码所述多肽的核苷酸序列；和(b)回收所述多肽。

14.  一种产生权利要求1-8任一项的多肽的方法，包括：(a)在有助于所述多肽产生的条件下培养转基因植物或植物细胞，所述植物或植物细胞包含编码所述多肽的多核苷酸序列；和(b)回收所述多肽。

15.  一种转基因植物、植物部分或植物细胞，其用编码权利要求1-8任一项的多肽的多核苷酸转化。

16.  权利要求1-8任一项的多肽在产生糖浆和/或发酵产物中的用途。

17.  权利要求16的方法，其中所述起始材料为糊化的或未糊化的含淀粉材料。

18.  权利要求1-8任一项的多肽用于酿造的用途。

19.  一种组合物，其包含α-淀粉酶和权利要求1-8任一项的多肽。

20.  一种从含淀粉材料产生发酵产物的工艺，包括下述步骤：
(a)液化含淀粉材料；
(b)糖化经液化的材料；和
(c)用发酵生物发酵；
其中步骤(b)使用至少一种权利要求1-5任一项的葡糖淀粉酶进行。

21.  一种从含淀粉材料产生发酵产物的工艺，包括下述步骤：
(a)在所述含淀粉材料的起始糊化温度以下的温度糖化含淀粉材料；和
(b)用发酵生物发酵；
其中步骤(a)使用至少一种权利要求1-5任一项的葡糖淀粉酶进行。

说明书

具有葡糖淀粉酶活性的多肽及其编码多核苷酸
涉及序列表
本申请涉及计算机可读形式的序列表，其通过提述并入本文。
涉及生物材料的保藏
本申请包含对于生物材料保藏的引用，所述保藏通过提述并入本文。关于完整信息参见说明书最后一段。
发明背景
技术领域
本发明涉及具有葡糖淀粉酶活性的多肽和编码所述多肽的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞以及用于产生和使用所述多肽的方法，并涉及本发明的葡糖淀粉酶在转化淀粉以产生发酵产物如乙醇和糖浆如葡萄糖中的用途。本发明还涉及包含本发明的葡糖淀粉酶的组合物。
背景技术
葡糖淀粉酶(1,4-α-D-葡聚糖葡糖水解酶，EC 3.2.1.3)是一种催化D-葡萄糖从淀粉或相关的寡糖和多糖分子的非还原端释放的酶。葡糖淀粉酶由数种丝状真菌和酵母产生，其中来自曲霉属(Aspergillus)的那些在商业上最为重要。
商业上，使用葡糖淀粉酶将已经由部分α-淀粉酶部分水解的淀粉材料转化为葡萄糖。然后可使用发酵生物将葡萄糖直接或间接转化为发酵产物。商业性发酵产物的实例包括醇(例如，乙醇、甲醇、丁醇、1,3-丙二醇)；有机酸(例如柠檬酸、乙酸、衣康酸、乳酸、葡糖酸、葡糖酸盐、乳酸、琥珀酸、2,5-二酮-D-葡糖酸)；酮(例如丙酮)；氨基酸(例如谷氨酸)；气体(例如H₂和CO₂)和更复杂的化合物，包括例如抗生素(例如青霉素和四环素)；酶；维生素(例如核黄素，B₁₂，β-胡萝卜素)；激素，和其他难以合成产生的化合物。发酵工艺亦常用于可饮用的醇类(例如啤酒和葡萄酒)，乳类产品(例如，酸奶和奶酪的产生)工业。
终产物亦可为糖浆。举例而言，终产物可为葡萄糖，但亦可例如通过葡糖异构酶转化为果糖或基本上由等量葡萄糖和果糖构成的混合物。该混合物，或进一步富集果糖的混合物，是在全世界得到商业化的最常用的高果糖玉米糖浆(HFCS)。
本发明的目的是提供具有葡糖淀粉酶活性的多肽和编码所述多肽的多核苷酸，且其在发酵产物产生工艺如醇产生工艺中提供高收率，包括从未糊化的生(或未烹制)淀粉的一步乙醇发酵工艺。
Uniprot:B0CVJ1公开了来自双色蜡蘑(Laccaria bicolor)的多肽，而WO2006/069289描述了来自瓣环栓菌(Trametes cingulata)的葡糖淀粉酶。
发明内容
鉴定并表征了由真菌粘褶菌属(Gloeophyllum)产生，并具有葡糖淀粉酶活性的多肽。更具体而言，所述粘褶菌属菌种选自下组：冷杉粘褶菌(G.abietinum)、篱边粘褶菌(G. sepiarium)和密粘褶菌(G. trabeum)。
相应地，在第一个方面，本发明涉及具有葡糖淀粉酶活性的分离的多肽，其选自下组：(a)多肽，其包含氨基酸序列，所述氨基酸序列与SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16或SEQ ID NO:18的成熟多肽具有优选至少82%，更优选至少83%，更优选至少84%，更优选至少85%，更优选至少86%，更优选至少87%，更优选至少88%，更优选至少89%，更优选至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，并且甚至最优选至少95%，如至少96%，至少97%，至少98%，至少99%或甚至100%同一性；(b)多肽，其包含氨基酸序列，所述氨基酸序列与SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12，SEQ ID NO:14的氨基酸19至474或SEQ ID NO:16或SEQ ID NO:18的氨基酸19至471所示的催化域具有优选至少82%，更优选至少83%，更优选至少84%，更优选至少85%，更优选至少86%，更优选至少87%，更优选至少88%，更优选至少89%，更优选至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，并且甚至最优选至少95%，如至少96%，至少97%，至少98%，至少99%或甚至100% 同一性；(c)多肽，其由多核苷酸编码，所述多核苷酸在优选至少中-高严格条件下，并且最优选至少高严格条件下与以下杂交：(i)SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列，(ii)包含SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列的基因组DNA序列，或(iii)(i)或(ii)的全长互补链；(d)多肽，其由多核苷酸编码，所述多核苷酸包含核苷酸序列，所述核苷酸序列与SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列具有优选至少82%，更优选至少83%，更优选至少84%，更优选至少85%，更优选至少86%，更优选至少87%，更优选至少88%，更优选至少89%，更优选至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，并且甚至最优选至少95%，如至少96%，至少97%，至少98％，至少99%或甚至100%同一性；和(e)变体，其包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16或SEQ ID NO:18的成熟多肽。
在第二个方面，本发明涉及分离的多核苷酸，其包含编码第一个方面的多肽的核苷酸序列。
在进一步的方面，本发明涉及包含第二个方面的多核苷酸的核酸构建体，重组表达载体，重组宿主细胞，转基因植物，植物部分或植物细胞。
仍在进一步的方面，本发明涉及产生所述多肽的方法，所述多肽的用途，和包含α-淀粉酶和所述多肽的组合物。
定义
葡糖淀粉酶：术语葡糖淀粉酶(1,4-α-D-葡聚糖葡糖水解酶，EC 3.2.1.3)定义为催化D-葡萄糖从淀粉或相关的寡糖和多糖分子的非还原端释放的酶。就本发明而言，葡糖淀粉酶活性根据下文“材料和方法”部分描述的步骤来确定。
本发明的多肽具有SEQ ID NO:2或其同源序列，SEQ ID NO:4或其同源序列，SEQ ID NO:6或其同源序列，SEQ ID NO:8或其同源序列，SEQ ID NO:10或其同源序列，SEQ ID NO:12或其同源序列，SEQ ID NO:14或其同源序列，SEQ ID NO:16或其同源序列，或者SEQ ID NO:18或其同源序列的成熟多肽的葡糖淀粉酶活性的至少20%，优选至少40%，优选至少45%，更优选至少50%，更优选至少55%，更优选至少60%，更优选至少65%，更优选至少70%，更优选至少75%，更优选至少80%，更优选至少85%，甚至更优选至少90%，最优选至少95%，并且甚至最优选至少100%。
分离的多肽：术语“分离的多肽”用于本文中指从来源分离的多肽。在一个优选的方面，如通过SDS-PAGE测定的，所述多肽为至少1%纯，优选至少5%纯，更优选至少10%纯，更优选至少20%纯，更优选至少40%纯，更优选至少60%纯，甚至更优选至少80%纯，并且最优选至少90%纯。
基本上纯的多肽：术语“基本上纯的多肽”在本文表示多肽制备物，所述多肽制备物含有按重量计至多10%，优选至多8%，更优选至多6%，更优选至多5%，更优选至多4%，更优选至多3%，甚至更优选至多2%，最优选至多1%，并且甚至最优选至多0.5%的与其天然或重组结合的(associated)其它多肽材料。因此，优选所述基本上纯的多肽按存在于制备物中的全部多肽材料的重量计是至少92%纯，优选至少94%纯，更优选至少95%纯，更优选至少96%纯，更优选至少96%纯，更优选至少97%纯，更优选至少98%纯，甚至更优选至少99%纯，最优选至少99.5%纯，并且甚至最优选100%纯。本发明的多肽优选是基本上纯的形式，即所述多肽制备物基本上(essentially)不含与其天然或重组结合的其它多肽材料。例如，这能够通过如下实现：通过公知的重组方法或通过经典纯化方法制备多肽。
成熟多肽：术语“成熟多肽”意指以其在翻译和任何翻译后修饰(如N-末端加工、C-末端截短、糖基化、磷酸化等)之后的最终形式存在的多肽。在一个方面，基于预测SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16和SEQ ID NO:18的氨基酸1至17是信号肽的SignalP程序(Nielsen等，1997，Protein Engineering10:1-6)，所述成熟多肽是SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12，SEQ ID NO:14的氨基酸18至573或SEQ ID NO:16或SEQ ID NO:18的氨基酸18至576。由SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO: 12或SEQ ID NO:14的氨基酸19至474(特别是19至471)或者SEQ ID NO:16或SEQ ID NO:18的氨基酸19至471限定的序列为催化域。由SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12或SEQ ID NO:14的氨基酸480至573或者SEQ ID NO:16或SEQ ID NO:18的氨基酸483至576限定的序列为淀粉结合域。
成熟多肽编码序列：术语“成熟多肽编码序列”在本文中定义为编码具有葡糖淀粉酶活性的成熟多肽的核苷酸序列。优选地，所述成熟多肽编码序列是SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13的核苷酸52至1719，或者SEQ ID NO:15或SEQ ID NO:17的核苷酸52至1728。
同一性：两个氨基酸序列之间或两个核苷酸序列之间的相关性由参数“同一性”来描述。
就本发明而言，两个氨基酸序列之间的同一性程度是使用如EMBOSS程序包(EMBOSS:The European Molecular Biology Open Software Suite，Rice等，2000，Trends in Genetics 16:276-277)(优选版本3.0.0或更新的版本)的Needle程序中执行的Needleman-Wunsch算法(Needleman和Wunsch，1970，J. Mol.Biol.48:443-453)来测定的。使用的可选参数是：缺口产生罚分为10，缺口延伸罚分为0.5，和EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。将标记为“最长同一性”的Needle输出(使用nobrief选项获得)用作百分比同一性并且是如下计算的：
(相同的残基x 100)/(比对的长度-比对中的缺口总数)
就本发明而言，两个脱氧核糖核苷酸序列之间的同一性程度使用如EMBOSS程序包(EMBOSS:The European Molecular Biology Open Software Suite，Rice等，2000，见上)(优选版本3.0.0或更新的版本)的Needle程序中执行的Needleman-Wunsch算法(Needleman和Wunsch，1970，见上)测定。使用的可选参数是：缺口产生罚分为10，缺口延伸罚分为0.5，和EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。将标记为“最长同一性”的Needle输出(使用-nobrief选项获得)用作百分比同一性并且是如下计算的：
(相同的脱氧核糖核苷酸x 100)/(比对的长度-比对中的缺口总数)
同源序列：术语“同源序列”在本文中定义为与SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO: 13，SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码部分或SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16，或SEQ ID NO:18的成熟多肽分别具有至少82%，优选至少83%，更优选至少84%，更优选至少85%，更优选至少86%，更优选至少87%，更优选至少88%，更优选至少89%，更优选至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，并且甚至最优选至少95%，如至少96%，至少97%，至少98%或甚至至少99%同一性%的核苷酸序列/多肽序列。
多肽片段：术语“多肽片段”在本文定义为从SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16或SEQ ID NO:18的成熟多肽或其同源序列的氨基和/或羧基末端缺失了一个或多个(几个)氨基酸的多肽；其中所述片段具有葡糖淀粉酶活性。优选地，片段含有SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12，SEQ ID NO:14，SEQ IDNO:16或SEQ ID NO:18的成熟多肽或其同源序列的至少500个氨基酸残基，更优选至少450个氨基酸残基，并且最优选至少400个氨基酸。具体的片段为SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12或SEQ ID NO:14的氨基酸19至474或者SEQ ID NO:16或SEQ ID NO:18的氨基酸19至471限定的序列，其包含本发明多肽的催化域。
亚序列：术语“亚序列(subsequence)”在本文中定义为从SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列的5'和/或3'端缺失了一个或多个(几个)核苷酸的核苷酸序列；或其同源序列；其中所述亚序列编码具有葡糖淀粉酶活性的多肽片段。优选地，亚序列含有SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列或其同源序列的至少1500个核苷酸，更优选至少1400个核苷酸，并且最优选至少1200个核苷酸。
等位变体(allelic variant)：术语“等位变体”在本文中表示占据相同染色体基因座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生，并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。
分离的多核苷酸：术语“分离的多核苷酸”用于本文中指从来源分离的多核苷酸。优选地，如通过琼脂糖电泳测定的，所述多核苷酸为至少1%纯，优选至少5%纯，更优选至少10%纯，更优选至少20%纯，更优选至少40%纯，更优选至少60%纯，甚至更优选至少80%纯，并且最优选至少90%纯。
基本上纯的多核苷酸：术语“基本上纯的多核苷酸”用于本文指多核苷酸制备物，其不含其它外来的或不期望的核苷酸，并且处于适合于在遗传工程蛋白质生产体系中使用的形式。因此，基本上纯的多核苷酸含有按重量计至多10%，优选至多8%，更优选至多6%，更优选至多5%，更优选至多4%，更优选至多3%，甚至更优选至多2%，最优选至多1%，并且甚至最优选至多0.5%的与其天然或重组结合的其它多核苷酸材料。然而，基本上纯的多核苷酸可以包括天然存在的5’和3’非翻译区，如启动子和终止子。优选基本上纯的多核苷酸是按重量计至少90%纯，优选至少92%纯，更优选至少94%纯，更优选至少95%纯，更优选至少96%纯，更优选至少97%纯，甚至更优选至少98%纯，最优选至少99%，并且甚至最优选至少99.5%纯的。本发明的多核苷酸优选为基本上纯的形式，即所述多核苷酸制备物基本上(essentially)不含与其天然或重组结合的其它多核苷酸材料。所述多核苷酸可以是基因组、cDNA、RNA、半合成、合成来源的，或它们的任何组合。
编码序列：术语“编码序列”在用于本文时意指直接指定其蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界通常由开读框决定，所述开读框通常以ATG起始密码子或可供选择的起始密码子如GTG和TTG开始，并且以终止密码子如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA、合成的或重组的核苷酸序列。
cDNA：术语“cDNA”在本文中定义为能够通过反转录从得自真核细胞的成熟的、已剪接的mRNA分子制备的DNA分子。cDNA缺少通常存在于相应基因组DNA中的内含子序列。起始的(initial)、初级的RNA转录物是mRNA的前体，其通过一系列的步骤加工然后作为成熟的已剪接的mRNA出现。这些步骤包括通过称为剪接的过程去除内含子序列。因而源自mRNA的cDNA没有任何内含子序列。
核酸构建体：术语“核酸构建体”用于本文指单链或双链的核酸分子，所述核酸分子分离自天然存在的基因，或将所述核酸分子以本来不存在于(nototherwise exist)自然界中的方式修饰以含有核酸的区段或所述核酸分子是合成的。当所述核酸构建体含有表达本发明的编码序列所需的调控序列时，术语核酸构建体与术语“表达盒”同义。
调控序列(control sequence)：术语“调控序列”在本文定义为包括对编码本发明多肽的多核苷酸表达是必需的所有组分。各个调控序列对于编码所述多肽的核苷酸序列可以是天然的或外源的，或各个调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况，调控序列包括启动子和转录和翻译的终止信号。调控序列可以和目的为引入特异性限制位点的接头一起提供，所述特异性限制位点促进调控序列与编码多肽的核苷酸序列编码区的连接。
可操作地连接：术语“可操作地连接”在本文表示这样的构型，其中将调控序列置于相对于多核苷酸序列的编码序列的适当位置，使得调控序列指导多肽编码序列的表达。
表达：术语“表达”包括涉及多肽产生的任何步骤，其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
表达载体：术语“表达载体”在本文定义为线性的或环状的DNA分子，其包含编码本发明多肽的多核苷酸，并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。
宿主细胞：如本文中所使用的术语“宿主细胞”包括任何细胞类型，所述细胞类型对于使用包含本发明多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的(susceptible)。
修饰：术语“修饰”在本文中意指对由SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16或SEQ ID NO:18的成熟多肽组成的多肽或其同源序列的任何化学修饰，以及对编码这样的多肽的DNA的遗传操作。所述修饰可以是一个或多个(几个)氨基酸的取代、缺失和/或插入，以及一个或多个(几个)氨基酸侧链的置换。
变体：当用于本文时，术语“变体”意指具有葡糖淀粉酶活性的多肽包含改变，即在一个或多个(几个)位置取代、插入和/或缺失一个或多个(几个)氨基酸残基。取代意指用不同的氨基酸替代占据某位置的氨基酸；缺失指去除占据某位置的氨基酸；而插入意指邻接占据某位置的氨基酸添加1-3个氨基酸。
发明详述
具有葡糖淀粉酶活性的多肽
在第一个方面，本发明涉及包含下述氨基酸序列的分离的多肽，所述氨基酸序列与SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16或SEQ IDNO:18的成熟多肽具有优选至少82%，更优选至少83%，更优选至少84%，更优选至少85%，更优选至少86%，更优选至少87%，更优选至少88%，更优选至少89%，更优选至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，并且甚至最优选至少95%，如至少96%，至少97％，至少98％，至少99%或甚至100%同一性的同一性程度，所述多肽具有葡糖淀粉酶活性(下文中的“同源多肽”)。优选地，所述同源多肽具有的氨基酸序列与SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16或SEQ IDNO:18的成熟多肽相差十个氨基酸，优选相差五个氨基酸，更优选相差四个氨基酸，甚至更优选相差三个氨基酸，最优选相差两个氨基酸，并且甚至最优选相差一个氨基酸。
本发明的多肽优选包含SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16或SEQ ID NO:18的氨基酸序列或其等位变体；或它们的具有葡糖淀粉酶活性的片段。优选地，多肽包含SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16或SEQ ID NO:18的氨基酸序列。在另一优选的方面，多肽包含SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16或SEQ ID NO:18的成熟多肽或其等位变体；或它们的具有葡糖淀粉酶活性的片段。在另一优选的方面，多肽由SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16或SEQ ID NO:18的氨基酸序列或其等位变体，或它们的具有葡糖淀粉酶活性的片段组成。在另一优选的方面，多肽由SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQID NO:8，SEQ ID NO:10，SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16或SEQ ID NO:18的氨基酸序列组成。
在第二个方面，本发明涉及具有葡糖淀粉酶活性的分离的多肽，其由多核苷酸编码，所述多核苷酸在优选非常低严格条件、更优选低严格条件、更优选中严格条件、更优选中-高严格条件、甚至更优选高严格条件、和最优选非常高严格条件下与下列杂交：(i)SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ IDNO:15或SEQ ID NO:17的成熟多肽编码序列，(ii)包含SEQ ID NO:1，SEQID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列的基因组DNA序列，(iii)(i)或(ii)的亚序列，或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook，E.F.Fritsch和T.Maniatis，1989，Molecular Cloning，A Laboratory Manual，第2版，Cold Spring Harbor，New York)。SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外，所述亚序列可以编码具有葡糖淀粉酶活性的多肽片段。优选地，所述互补链是SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列的全长互补链。
SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的核苷酸序列或其亚序列；以及SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16或SEQ ID NO:18的氨基酸序列或其片段，可用于设计核酸探针，以根据本领域内公知的方法从不同属或种的菌株鉴定和克隆编码具有葡糖淀粉酶活性的多肽的DNA。具体而言，可将这些探针用于根据标准的Southern印迹方法与感兴趣的属或种的基因组或cDNA杂交，以鉴定并从其中分离相应的基因。这些探针可明显短于完整序列，但长度上应为至少14个，优选至少25个，更优选至少35个，并且最优选至少70个核苷酸。然而，优选所述核酸探针长度上是至少100个核苷酸。例如，所述核酸探针长度上可以是至少200个核苷酸，优选至少300个核苷酸，更优选至少400个核苷酸，或最优选至少500个核苷酸。甚至可以使用更长的探针，例如，长度是优选至少600个核苷酸，更优选至少700个核苷酸，甚至更优选至少800个核苷酸，或最优选至少900个核苷酸的核酸探针。DNA和RNA探针二者均可使用。通常将探针标记以探测相应的基因(例如，用³³P、³²P、³H、³⁵S、生物素或抗生物素蛋白(avidin)标记)。将这些探针包含于本发明中。
因而，可从由这些其它菌株制备的基因组DNA或cDNA文库中筛选DNA，所述DNA与上述探针杂交并且编码具有葡糖淀粉酶活性的多肽。可以通过琼脂糖或聚丙烯酰胺凝胶电泳，或通过其它分离技术分离来自这些其它菌株的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素(nitrocellulose)或其它合适的载体材料并且固定于其上。为了鉴定与SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17或其亚序列同源的克隆或DNA，将所述载体材料优选用在Sounthern印迹中。
就本发明而言，杂交表示核苷酸序列在非常低至非常高的严格条件下与标记的核酸探针杂交，所述核酸探针对应于SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列；包含SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列的基因组DNA序列；其全长互补链；或其亚序列。可使用例如X射线片(X-rayfilm)检测在这些条件下与核酸探针杂交的分子。
优选地，核酸探针是SEQ ID NO:1的成熟多肽编码序列。在另一优选的方面，核酸探针是编码SEQ ID NO:2的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO:1。在另一优选的方面，核酸探针是包含在大肠杆菌(E.coli)菌株DSM 23222中的质粒中含有的多核苷酸序列，其中所述其多核苷酸序列编码具有葡糖淀粉酶活性的多肽。在另一优选的方面，核酸探针是包含在大肠杆菌DSM 23222中的质粒中含有的成熟多肽编码区。
优选地，所述核酸探针是SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7， SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列。在另一个优选的方面，所述核酸探针是编码SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12，SEQID NO:14，SEQ ID NO:16或SEQ ID NO:18的多肽或其亚序列的多核苷酸序列。在另一个优选的方面，所述核酸探针是SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17。
对于长度至少100个核苷酸的长探针，将非常低至非常高的严格条件定义为在42℃，在5X SSPE、0.3%SDS、200μg/ml已剪切并且变性的鲑精DNA中，并且对于非常低和低严紧性为25%的甲酰胺、对于中和中-高严紧性为35%的甲酰胺、或对于高和非常高严紧性为50%的甲酰胺，根据标准的Southern印迹步骤进行预杂交和杂交最佳12至24小时。
对于长度为至少100个核苷酸的长探针，使用2X SSC、0.2%SDS优选在45℃(非常低严紧性)，更优选在50℃(低严紧性)，更优选在55℃(中严紧性)，更优选在60℃(中-高严紧性)，甚至更优选在65℃(高严紧性)，并且最优选在70℃(非常高严紧性)将载体材料最终洗涤三次，每次15分钟。
对于长度大约15个核苷酸至大约70个核苷酸的短探针，将严格条件定义为在比使用根据Bolton和McCarthy计算法(1962，Proceedings of the National Academy of Sciences USA 48:1390)计算得出的T_m低大约5℃至大约10℃，在0.9M NaCl，0.09M Tris-HCl pH 7.6，6mM EDTA，0.5%NP-40，1X Denhardt溶液，1mM焦磷酸钠(sodium pyrophosphate)，1mM磷酸二氢钠(sodium monobasic phosphate)，0.1mM ATP和0.2mg每ml的酵母RNA中，根据标准的Southern印迹步骤进行预杂交、杂交和杂交后洗涤最佳12至24小时。
对于长度大约15个核苷酸至大约70个核苷酸的短探针，将所述载体材料在6X SSC加0.1%SDS中洗涤一次15分钟，并用6X SSC在比计算得出的T_m低5℃至10℃的温度洗涤两次，每次15分钟。
在第三个方面，本发明涉及由多核苷酸编码的具有葡糖淀粉酶活性的分离的多肽，所述多核苷酸包含或组成为与SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列具有至少82%，更优选至少83%，更优选至少84%，更优选至少85%，更优选至少86%，更优选至少87%，更优选至少88%，更优选至少89%，更优选至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，并且甚至最优选至少95%，如至少96%，至少97%，至少98%，至少99%同一性程度的核苷酸序列，其编码活性多肽。参见本文多核苷酸部分。
本发明还涉及人工变体，所述人工变体包含取代、缺失和/或插入一个或多个(或几个)氨基酸的SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16或SEQ ID NO:18的成熟多肽；或其同源序列。优选地，氨基酸改变对性质是较不重要的(ofa minor nature)，即保守的氨基酸取代或插入，其不显著影响蛋白质的折叠和/或活性；通常为1至大约30个氨基酸的小缺失；小的氨基或羧基末端延伸，如氨基末端甲硫氨酸残基；多至大约20-25个残基的小接头肽；或通过改变净电荷或其它功能来促进纯化的小延伸，如多组氨酸序列(poly-histidine tract)、抗原表位(antigenic epitope)或结合域(binding domain)。
保守取代的实例是在以下组之内：碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specific activity)的氨基酸取代是本领域已知的，并且由例如H.Neurath和R.L.Hill，1979，于The Proteins，Academic Press，New York中描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。
除了20个基本氨基酸，非基本氨基酸(如4-羟脯氨酸、6-N-甲基赖氨酸、2-氨基异丁酸、异缬氨酸和α-甲基丝氨酸)可以取代野生型多肽的氨基酸残基。有限数量的非保守氨基酸、不由遗传密码编码的氨基酸和非天然氨基酸可以取代氨基酸残基。“非天然氨基酸”在蛋白质合成后已经过修饰，和/或在它们的侧链具有不同于基本氨基酸的化学结构。非天然氨基酸能够以化学方法合成，并且优选是商业上可得到的，包括六氢吡啶羧酸(pipecolic acid)、噻唑烷羧酸(thiazolidine carboxylic acid)、脱氢脯氨酸、3-和4-甲基脯氨酸，和3,3-二甲基脯氨酸。
可供选择的是，氨基酸改变具有这样的性质以使多肽的物理化学性质改变。例如，氨基酸改变可改进多肽的热稳定性，改变底物特异性，改变最适pH等。
能够根据本领域已知的方法，例如定位诱变或丙氨酸分区诱变法(Cunningham和Wells，1989，Science 244:1081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中，将单一丙氨酸突变引入到分子中的每个残基，并且测试所得突变分子的葡糖淀粉酶活性以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等，1996，J. Biol.Chem.271:4699-4708。酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而测定，如通过以下这些技术：如核磁共振、晶体学、电子衍射或光亲和标记，连同推定的接触位点氨基酸的突变来测定。参见例如de Vos等，1992，Science 255:306-312；Smith等，1992，J. Mol.Biol.224:899-904；Wlodaver等，1992，FEBS Lett.309:59-64。必需氨基酸的身份(identity)也能够从与多肽的同一性分析来推断，所述多肽与根据本发明的多肽相关。
能够使用已知的诱变、重组和/或改组(shuffling)方法，然后是有关的筛选方法，例如那些由Reidhaar-Olson和Sauer，1988，Science 241:53-57；Bowie和Sauer，1989，Proc.Natl.Acad Sci.USA 86:2152-2156；WO 95/17413；或WO 95/22625公开的那些方法来进行并测试单个或多个氨基酸取代、缺失、和/或插入。能够使用的其它方法包括易错PCR、噬菌体展示(例如，Lowman等，1991，Biochem.30:10832-10837；美国专利5,223,409号；WO 92/06204)和区域定向的诱变(Derbyshire等，1986，Gene 46:145；Ner等，1988，DNA 7:127)。
诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等，1999，Nature Biotechnology17:893-896)。能够从宿主细胞回收编码活性多肽的诱变的DNA分子，并且使用本领域内标准方法快速测序。这些方法允许快速测定感兴趣的多肽中单个氨基酸残基的重要性，并且能够应用于未知结构的多肽。
成熟多肽，如SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12或SEQ ID NO:14的氨基酸18至573或者SEQ ID NO:16或SEQ ID NO:18的氨基酸18至576，或催化域，如EQ IDNO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQID NO:12或SEQ ID NO:14的氨基酸19至474或者SEQ ID NO:16或SEQ ID NO:18的氨基酸19至471中的氨基酸取代、缺失和/或插入的总数是10，优选9，更优选8，更优选7，更优选至多6，更优选5，更优选4，甚至更优选3，最优选2，并且甚至最优选1。
具有葡糖淀粉酶活性的多肽的来源
本发明的多肽可以获得自任何属的微生物。就本发明而言，用于本文与给定的来源有关的术语“获得自”，意思是核苷酸序列编码的多肽由所述来源产生，或由其中插入了来自所述来源的核苷酸序列的菌株产生。优选地，获得自给定来源的多肽是胞外分泌的。
本发明具有葡糖淀粉酶活性的多肽亦可为细菌多肽，或酵母多肽，或更优选丝状真菌多肽，如具有葡糖淀粉酶活性的枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、Artomyces、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、Botryospaeria、拟蜡菌属(Ceriporiopsis)、Chaetomidium、金孢子菌属(Chrysosporium)、Claviceps、Cochliobolus、Coprinopsis、Coptotermes、Corynascus、Cryphonectria、隐球菌属(Cryptococcus)、Diplodia、Exidia、Filibasidium、镰孢属(Fusarium)、赤霉属(Gibberella)、粘褶菌属(Gloeophyllum)、Holomastigotoides、腐质霉属(Humicola)、耙菌属(Irpex)、Lentinula、Leptospaeria、梨孢菌属(Magnaporthe)、Melanocarpus、多孔菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、Pseudotrichonympha、根毛霉属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱顶孢属(Scytalidium)、踝节菌属(Talaromyces)、热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、Trichophaea、轮枝孢属(Verticillium)、Volvariella或Xylaria多肽。
在一个更优选的方面，所述多肽是具有葡糖淀粉酶活性的粘褶菌属菌种多肽，如篱边粘褶菌(Gloeophyllum sepiarium)、密粘褶菌(Gloeophyllum trabeum)或冷杉粘褶菌(Gloeophyllum abietinum)多肽。可理解的是对于前述的种，本发明包含完全和不完全阶段(perfect and imperfect states)，和其它分类学的等同物(equivalent)，例如无性型(anamorph)，而无论它们已知的种名。本领域的技术人员会容易地识别适合的等同物的身份(identity)。
这些种的菌株在许多培养物保藏机构对于公众能够容易地取得，所述保藏机构如美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH)(D SM)、真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)和农业研究机构专利培养物保藏中心北区研究中心(Agricultural Research Service Patent Culture Collection，Northern Regional Research Center)(NRRL)。
此外，可以使用上述的探针从其它来源，包括从自然界(例如，土壤、堆肥、水等)分离的微生物鉴定和获得这些多肽。用于从天然生境(habitat)分离微生物的技术是本领域内公知的。随后可通过相似地筛选这种微生物的基因组或cDNA文库来获得所述多核苷酸。一旦用所述探针检测到编码多肽的多核苷酸序列，就能够使用本领域普通技术人员熟知的技术将所述多核苷酸分离或克隆(参见，例如，Sambrook等，1989，见上)。
本发明的多肽还包括融合多肽或可切割的融合多肽，其中将另外的多肽融合到所述多肽或其片段的N末端或C末端。通过将编码另一个多肽的核苷酸序列(或其部分)融合于本发明的核苷酸序列(或其部分)来产生融合的多肽。产生融合多肽的技术是本领域已知的，并包括连接编码多肽的编码序列以使它们在阅读框中，并且使所述融合多肽的表达在相同启动子和终止子的控制下。
融合多肽还可以包括切割位点。一旦分泌了融合多肽，就切割所述位点，从融合蛋白释放具有葡糖淀粉酶活性的多肽。切割位点的实例包括，但不限于，编码二肽Lys-Arg的Kex2位点(Martin等，2003，J.Ind.Microbiol.Biotechnol.3:568-76；Svetina等，2000，J. Biotechnol.76:245-251；Rasmussen-Wilson等，1997，Appl.Environ.Microbiol.63:3488-3493；Ward等，1995，Biotechnology 13:498-503；和Contreras等，1991，Biotechnology 9:378-381)；Ile-(Glu或Asp)-Gly-Arg位点，其在精氨酸残基后通过因子Xa蛋白酶切割(Eaton等，1986，Biochem.25:505-512)；Asp-Asp-Asp-Asp-Lys位点，其在赖氨酸后通过肠激酶切割(Collins-Racie等，1995，Biotechnology 13:982-987)；His-Tyr-Glu位点或His-Tyr-Asp位点，其通过Genenase I切割(Carter等，1989，Proteins:Structure，Function，and Genetics 6:240-248)；Leu-Val-Pro-Arg-Gly-Ser位点，其在Arg后通过凝血酶切割(Stevens，2003， Drug Discovery World4:35-48)；Glu-Asn-Leu-Tyr-Phe-Gln-Gly位点，其在Gln后通过TEV蛋白酶切割(Stevens，2003，见上)；和Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro位点，其在Gln后通过遗传工程形式的人鼻病毒3C蛋白酶切割(Stevens，2003，见上)。
多核苷酸
本发明还涉及分离的多核苷酸，其包含编码本发明具有葡糖淀粉酶活性的多肽的核苷酸序列，或由该核苷酸序列组成。
优选地，核苷酸序列包含或组成为SEQ ID NO:1，SEQ ID NO:3，SEQ IDNO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQID NO:15或SEQ ID NO:17。在另一优选的方面，核苷酸序列包含或组成为大肠杆菌DSM 23222中所含质粒中含有的序列。在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO:1的成熟多肽编码序列。在另一更优选的方面，核苷酸序列包含或组成为大肠杆菌DSM 23222中所含质粒中含有的成熟多肽编码序列。本发明还涵盖编码如下多肽的核苷酸序列，所述多肽包含或组成为SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16或SEQ ID NO:18的氨基酸序列或其成熟多肽；由于遗传密码的简并性，所述核苷酸序列不同于SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17或其成熟多肽编码序列。本发明还涉及SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的亚序列，所述亚序列编码具有葡糖淀粉酶活性的SEQ IDNO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQID NO:12，SEQ ID NO:14，SEQ ID NO:16或SEQ ID NO:18的片段。
本发明还涉及突变的多核苷酸，其在SEQ ID NO:1，SEQ ID NO:3，SEQID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列中包含至少一个突变或由具有至少一个突变的SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ IDNO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列组成，其中突变的核苷酸序列编码SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16或SEQ ID NO:18的成熟多肽。
用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的，且包括从基因组DNA分离，从cDNA制备，或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共有结构特性的克隆DNA片段，从而实现从这种基因组DNA克隆本发明的多核苷酸。参见，例如，Innis等，1990，PCR:A Guide to Methods and Application，Academic Press，New York。可以使用其它核酸扩增方法，如连接酶链式反应(LCR)、连接活化转录(ligated activated transcription；LAT)和基于核苷酸序列的扩增(NASBA)。可以从青霉属菌株，或另外的或相关的生物体克隆所述多核苷酸，并且因此可以是例如所述核苷酸序列的多肽编码区的等位基因变体或种变体(species variant)。
本发明还涉及分离的多核苷酸，其包含或组成为下述核苷酸序列，所述核苷酸序列与SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列具有优选至少82%，更优选至少83%，更优选至少84%，更优选至少85%，更优选至少86%，更优选至少87%，更优选至少88%，更优选至少89%，更优选至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，并且甚至最优选至少95%，如至少96%，至少97％，至少98％，至少99%或甚至100%同一性的同一性程度，所述多核苷酸编码活性多肽。
修饰编码本发明多肽的核苷酸序列对于合成与所述多肽基本上相似的多肽可为必需的。术语与所述多肽“基本上相似”指多肽的非天然存在的形式。这些多肽可能以一些工程改造的方式而不同于从其天然来源分离的多肽，例如，比活性、热稳定性、最适pH等方面不同的人工变体。可以在作为SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列存在的核苷酸序列，例如其亚序列的基础上，和/或通过引入如下核苷酸取代来构建变体序列：所述取代不产生由核苷酸序列编码的多肽的另外的氨基酸序列，但是符合意欲产生酶的宿主生物体的密码子选择；或者所述取代可产生不同的氨基酸序列。关于核苷酸取代的概述，参见，例如，Ford等，1991，ProteinExpression and Purification2:95-107。
对于本领域技术人员显而易见的是，这些取代能够在对于分子功能重要的区域之外进行，并且仍然产生活性多肽。对于由本发明的分离的多核苷酸编码的多肽活性关键的并且因此优选不进行取代的氨基酸残基，可以根据本领域公知的方法，如定位诱变或丙氨酸分区诱变法(参见，例如，Cunningham和Wells，1989，见上)来鉴定。在后一技术中，将突变引入到分子中的每个荷正电的残基处，并且测试所得突变分子的葡糖淀粉酶活性，以鉴定对于所述分子的活性关键的氨基酸残基。底物-酶相互作用的位点也能够通过分析三维结构测定，通过如核磁共振分析、晶体学或光亲和标记这样的技术来测定(参见，例如，de Vos等，1992，见上；Smith等，1992，见上；Wlodaver等，1992，见上)。
本发明还涉及编码本发明多肽的分离的多核苷酸，所述分离的多核苷酸在非常低严格条件下，优选低严格条件，更优选中严格条件，更优选中-高严格条件，甚至更优选高严格条件，并且最优选非常高的严格条件下，与以下杂交：(i)SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列，(ii)包含SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列的基因组DNA序列，或(iii)(i)或(ii)的全长互补链，或它们的等位变体和亚序列(Sambrook等，1989，同上)，如本文所定义的。优选地，互补链是SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ IDNO:15或SEQ ID NO:17的成熟多肽编码序列的全长互补链。
本发明还涉及通过如下获得的分离的多核苷酸：(a)在非常低、低、中、中-高、高或非常高严格条件下，将DNA的群体与以下杂交：(i)SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列，(ii)包含SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ IDNO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列的基因组DNA序列，或(iii)(i)或(ii)的全长互补链；和(b)分离杂交的多核苷酸，其编码具有葡糖淀粉酶活性的多肽。优选地，所述互补链是SEQ ID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ IDNO:9，SEQ ID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列的全长互补链。
杂合酶
本发明还涉及杂合酶，其包含具有酶活性(例如淀粉降解酶活性，如α-淀粉酶，amylopullulanase，β-淀粉酶，CGT酶，葡糖淀粉酶，异淀粉酶，产麦芽糖淀粉酶或支链淀粉酶(pullulanase)活性)的催化域，和糖结合模块(CBM)。该杂合酶可进一步包含接头。
所述杂合体可通过将编码催化域的第一DNA序列和编码糖结合模块的第二DNA序列融合来产生，或该杂合体可基于对合适的CBM、接头和催化域的氨基酸序列的知识作为完全合成基因来产生。
术语“杂合酶”(亦称作“融合蛋白”，“杂合体”，“杂合多肽”或“杂合蛋白”)在本文中用于表征本发明的杂合多肽，其包含具有酶活性(例如淀粉降解酶活性，如α-淀粉酶，amylopullulanase，β-淀粉酶，CGT酶，葡糖淀粉酶，异淀粉酶，产麦芽糖淀粉酶或支链淀粉酶活性)的催化域和糖结合模块，其中所述催化域和所述糖结合模块来自不同来源。术语“来源”包括但不限于包含合适的催化模块和/或合适的CBM和/或合适的接头的亲本酶或其变体，例如淀粉酶或葡糖淀粉酶，或其他催化活性。然而，CBM亦可来源于不具有催化活性的多肽。催化域和糖结合模块可来源于相同的微生物菌株，来源于相同物种中的菌株，来源于紧密联系的物种或较疏联系的生物。优选地，杂合体催化域和糖结合模块来源于不同来源，例如来自相同菌株和/或菌种的不同酶，或例如来自不同菌种中的菌株。
在一个方面，杂合酶包含本发明的CBM(亦称作糖结合域或CBD)和催化域。在具体实施方案中，催化域是葡糖淀粉酶催化域。
核酸构建体
本发明还涉及包含本发明的分离的多核苷酸的核酸构建体，所述分离的多核苷酸与一个或多个(几个)调控序列可操作地连接，所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列的表达。
可以用许多方式操作编码本发明多肽的分离的多核苷酸以供多肽的表达。依赖于表达载体，在将多核苷酸的序列插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸序列的技术是本领域熟知的。
调控序列可以是适当的启动子序列，其是由用于表达编码本发明多肽的多核苷酸的宿主细胞识别的核苷酸序列。启动子序列含有介导多肽的表达的转录调控序列。启动子可以是在所选的宿主细胞中显示转录活性的任何核苷酸序列，包括突变的、截短的和杂合的启动子，并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。
用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从下列酶的基因获得的启动子：黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、米曲霉TAKA淀粉酶、泡盛曲霉或黑曲霉葡糖淀粉酶(glaA)、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、曼赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、曼赫根毛霉脂肪酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶，以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸异构酶基因的启动子的杂合体)；和它们的突变的、截短的和杂合的启动子。
在酵母宿主中，有用的启动子从如下酶的基因获得：酿酒酵母烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1，ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞有用的其它启动子由Romanos等，1992，Yeast 8:423-488描述。
调控序列也可以是合适的转录终止子序列，其是由宿主细胞识别以终止转录的序列。所述终止子序列与编码所述多肽的核苷酸序列的3’末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。
对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得：构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶和尖镰孢胰蛋白酶样蛋白酶。
对于酵母宿主细胞优选的终止子从如下酶的基因获得：酿酒酵母烯醇化酶、酿酒酵母细胞色素C (CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞有用的其它终止子由Romanos等，1992，见上描述。
调控序列还可以是合适的前导序列，其是对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的核苷酸序列的5’-末端。可以将在所选宿主细胞中有功能的任何前导序列用在本发明中。
对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得：米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。
对于酵母宿主细胞合适的前导序列从如下酶的基因获得：酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
调控序列也可以是聚腺苷酸化序列，其是与核苷酸序列的3’末端可操作地连接的序列，并且在转录时，宿主细胞将其识别为向转录的mRNA添加聚腺苷残基的信号。可以将在所选宿主细胞中有功能的任何聚腺苷酸化序列在本发明中使用。
对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得：构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶和尖镰孢胰蛋白酶样蛋白酶。
对于酵母宿主细胞有用的聚腺苷酸化序列由Guo和Sherman，1995，Molecular Cellular Biology 15:5983-5990描述。
调控序列还可以是信号肽编码序列，其编码与多肽的氨基末端相连的氨基酸序列，并且指导编码的多肽进入细胞分泌途径。核苷酸序列的编码序列5’端可固有地包含信号肽编码序列，该信号肽编码序列与编码分泌多肽的编码序列区段一起天然地连接在翻译阅读框中。或者，编码序列5’端可含有对于所述编码序列为外源的信号肽编码序列。外源信号肽编码序列在编码序列不天然地含有信号肽编码序列时可为必需的。或者，外源信号肽编码序列可以简单地取代天然信号肽编码序列以增强多肽的分泌。然而，指导表达的多肽进入所选宿主细胞的分泌途径(即，分泌至培养基中)的任何信号肽编码序列可在本发明中使用。
对于丝状真菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列：黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、疏棉状腐质霉脂肪酶和曼赫根毛霉天冬氨酸蛋白酶。
同样理想的是添加调节序列，其允许相对于宿主细胞的生长来调节多肽的表达。调节系统的实例是引起基因表达响应化学或物理刺激物，包括调节化合物的存在而开启或关闭的那些系统。原核系统中的调节系统包括lac、tac、xyl和trp操纵基因系统。在酵母中，可以使用ADH2系统或GAL1系统。在丝状真菌中，可以使用TAKA α-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调节序列。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中，这些调节序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因，和以重金属(with heavy metal)扩增的金属硫蛋白基因。在这些情况下，编码多肽的核苷酸序列与调节序列可操作地连接。
表达载体
本发明还涉及重组表达载体，所述重组表达载体包含本发明的多核苷酸、启动子和转录和翻译终止信号。本文所述的多种核酸和调控序列可以结合在一起以产生重组表达载体，所述表达载体可以包括一个或多个(几个)方便的限制位点以允许在这些位点插入或取代编码多肽的核苷酸序列。可供选择的是，可以通过在适当的用于表达的载体中插入包含所述序列的核苷酸序列或核酸构建体来表达本发明的多核苷酸序列。在制备表达载体的过程中，将编码序列置于载体中，从而将该编码序列与适当的表达用调控序列可操作地连接。
重组表达载体可以是任何载体(例如，质粒或病毒)，其能够方便地进行重组DNA步骤，并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。
载体可以是自主复制载体，即，作为染色体外实体(entity)存在的载体，其复制独立于染色体复制，例如，质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者，载体可以是一种当被引入宿主细胞中时，整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外，可以使用单独的载体或质粒或两个或更多个载体或质粒，其共同含有待引入宿主细胞基因组的完整 DNA(total DNA)，或可以使用转座子(transposon)。
本发明的载体优选地含有一个或多个(几个)选择性标记，其允许简单选择经转化、转染、转导等的细胞。选择性标记是基因，其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。
用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphate decarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilate synthase))以及它们的等价物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
本发明的载体优选含有元件，其允许载体整合入宿主细胞基因组或允许载体在细胞中独立于基因组自主复制。
为了整合入宿主细胞基因组，载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者，载体可以含有额外的核苷酸序列，用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性，整合元件应优选含有足够数量的核酸，如100至10,000碱基对，优选400至10,000碱基对，并且最优选800至10,000碱基对，其与相应的目标序列具有高度同一性以增强同源重组的概率。整合元件可以是任何序列，其与宿主细胞基因组中的目标序列同源。此外，整合元件可以是非编码或编码的核苷酸序列。另一方面，可以将载体通过非同源重组整合到宿主细胞的基因组中。
为了自主复制，载体可以还包含复制起点，其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator)，其在细胞中发挥功能。术语“复制起点”或“质粒复制子”在本文定义为能够使质粒或载体体内复制的核苷酸序列。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等，1991，Gene 98:61-67；Cullen等，1987，Nucleic Acids Research 15:9163-9175；WO 00/24883)。分离AMA1基因和构建包含该基因的质粒或载体能够根据公开于WO 00/24883中的方法完成。
可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞以增加基因产物的产生。多核苷酸拷贝数的增加可通过如下方法获得：将至少一个额外拷贝的序列整合入宿主细胞基因组，或将可扩增的选择性标记基因包括于多核苷酸，其中可通过在合适的选择剂(selectable agent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝，从而也含有多核苷酸的额外拷贝的细胞。
用于连接上述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知的(参见，例如，Sambrook等，1989，见上)。
宿主细胞
本发明还涉及重组宿主细胞，其包含本发明的分离的多核苷酸，将所述重组宿主细胞有利地用于多肽的重组产生。将包含本发明的多核苷酸的载体引入宿主细胞从而将所述载体作为染色体整合体或作为自复制的染色体外载体保持，如前文所述。术语“宿主细胞”包含亲本细胞的任何子代，其因为在复制过程中发生的突变而与该亲本细胞不同。宿主细胞的选择在很大程度上会依赖于编码多肽的基因及其来源。
宿主细胞可以是在本发明的多肽的重组产生中有用的任何细胞，例如，原核或真核细胞。
原核宿主细胞可以是任何革兰氏阳性细菌或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于，芽孢杆菌属(Bacillus)、梭菌属(Clostridium)、肠球菌属(Enterococcus)、地芽孢杆菌属(Geobacillus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、海洋芽孢杆菌属(Oceanobacillus)、葡萄球菌属(Staphylococcus)、链球菌属(Streptococcus)和链霉菌属(Streptomyces)。革兰氏阴性细菌包括但不限于，大肠杆菌、弯曲杆菌属(Campylobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、螺杆菌属(Helicobacter)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)和脲原体属(Ureaplasma)。
宿主细胞还可以是真核生物，如哺乳动物、昆虫、植物或真菌细胞。
优选地，宿主细胞是真菌细胞。“真菌”用在本文包括以下门：子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如由Hawksworth等，于Ainsworth and Bisby’s Dictionary ofThe Fungi,第八版，1995，CAB International，University Press，Cambridge， UK中所定义)以及卵菌门(Oomycota)(如Hawksworth等，1995，见上，171页中所引用)，和所有有丝分裂孢子真菌(mitosporic fungi)(Hawksworth等，1995，见上)。
在一个更优选的方面，真菌宿主细胞是酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变，就本发明而言，会将酵母定义为如Biology and Activities of Yeast(Skinner，F.A.，Passmore，S.M.,和Davenport，R.R.编，Soc.App.Bacteriol.Symposium Series No.9，1980)中所述。
在一个甚至更加优选的方面，酵母宿主细胞是假丝酵母属(Candida)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)细胞。
在一个最优选的方面，酵母宿主细胞是卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)或卵形酵母(Saccharomyces oviformis)细胞。在另一个最优选的方面，酵母宿主细胞是乳酸克鲁维酵母(Kluyveromyces lactis)细胞。在另一个最优选的方面，酵母宿主细胞是解脂西洋蓍霉(Yarrowia lipolytica)细胞。
在另一个更优选的方面，真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth等，1995，见上文，所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长，而碳分解代谢是专性需氧的。相反，酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行，而碳分解代谢可以是发酵的。
在一个甚至更优选的方面，丝状真菌宿主细胞是枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管霉属(Bjerkandera)、Ceriporiopsis、金孢子菌属(Chrysosporium)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属(Cryptococcus)、Filibasidium、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、侧耳属(Pleurotus)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属(Trametes)或木霉属(Trichoderma)细胞。
在一个最优选的方面，丝状真菌宿主细胞是泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、烟曲霉(Aspergillus fumigatus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)或米曲霉(Aspergillus oryzae)细胞。在另一个最优选方面，丝状真菌宿主细胞是杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucin um)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusarium trichothecioides)或镶片镰孢细胞(Fusarium venenatum)。在另一个最优选的方面，丝状真菌宿主细胞是黑刺烟管菌(Bjerkandera adusta)、Ceriporiopsis aneirina、Ceriporiopsis caregiea、Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、Ceriporiopsis subvermispora、Chrysosporium inops、嗜角质金孢子菌(Chrysosporium keratinophilum)、Chrysosporium lucknowense、Chrysosporium merdarium、毡金孢子菌(Chrysosporium pannicola)、Chrysosporium queenslandicum、热带金孢子菌(Chrysosporium tropicum)、Chrysosporium zonatum、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicola lanuginosa)、米黑毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌(Neurospora crassa)、产紫青霉(Penicillium purpurogenum)、黄孢平革菌(Phanerochaete chrysosporium)、辐射射脉菌(Phlebia radiata)、刺芹侧耳 (Pleurotus eryngii)、土生梭孢壳(Thielavia terrestris)、Trametes versicolor、Trametes villosa、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichoderma reesei)或绿色木霉(Trichoderma viride)细胞。
可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP 0238023和Yelton等，1984，Proceedings of the National Academy of Sciences USA 81:1470-1474中描述。用于转化镰孢属菌种的合适方法由Malardier等，1989，Gene 78:147-156和WO 96/00787描述。可以使用由如下文献描述的方法转化酵母：Becker和Guarente，于Abelson，J.N.和Simon，M.I.编，Guide to Yeast Genetics and Molecular Biology，Methods in Enzymology，194，182-187，Academic Press，Inc.，New York；Ito等，1983，Journal of Bacteriology 153:163；和Hinnen等，1978，Proceedings of the National Academy of Sciences USA 75:1920。
产生方法
本发明还涉及产生本发明多肽的方法，其包括：(a)在有助于产生多肽的条件下培养细胞，所述细胞以其野生型形式产生所述多肽；和(b)回收所述多肽。优选地，所述细胞是粘褶菌属的。在一个更优选的方面，所述细胞是篱边粘褶菌(Gloeophyllum sepiarium)、密粘褶菌(Gloeophyllum trabeum)或冷杉粘褶菌(Gloeophyllum abietinum)。
本发明还涉及产生本发明的多肽的方法，其包括：(a)在有助于产生多肽的条件下培养如本文所述的重组宿主细胞；和(b)回收所述多肽。
本发明还涉及产生本发明的多肽的方法，包括：(a)在有助于产生多肽的条件下培养重组宿主细胞，其中所述宿主细胞包含突变核苷酸序列，其在SEQID NO:1，SEQ ID NO:3，SEQ ID NO:5，SEQ ID NO:7，SEQ ID NO:9，SEQID NO:11，SEQ ID NO:13，SEQ ID NO:15或SEQ ID NO:17的成熟多肽编码序列中具有至少一个突变，其中所述突变核苷酸序列编码多肽，所述多肽包含或组成为SEQ ID NO:2，SEQ ID NO:4，SEQ ID NO:6，SEQ ID NO:8，SEQ ID NO:10，SEQ ID NO:12，SEQ ID NO:14，SEQ ID NO:16或SEQ IDNO:18的成熟多肽，和(b)回收所述多肽。
在本发明的产生方法中，使用本领域熟知的方法在适合于产生所述多肽的营养培养基中培养细胞。例如，可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养，和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养，所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如，在美国典型培养物保藏中心的目录中)。如果多肽分泌到营养培养基中，该多肽能够从所述培养基中直接回收。如果多肽不分泌到培养基中，其能够从细胞裂解物(lysate)回收。
可以使用本领域已知的对于所述多肽是特异性的方法来检测多肽。这些检测方法可包括特异性抗体的使用、酶产物的形成或酶底物的消失。例如，酶试验(enzyme assay)可用于测定如本文所述的多肽的活性。
所得多肽可以使用本领域已知的方法回收。例如，多肽可以通过常规方法从营养培养基中回收，所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。
本发明的多肽可以通过多种本领域已知的方法纯化以获得基本上纯的多肽，所述方法包括但不限于层析(例如，离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如，制备型(preparative)等电聚焦)、差示溶解度(例如，硫酸铵沉淀)、SDS-PAGE或提取(参见，例如，Protein Purification，J.-C.Janson和Lars Ryden编，VCH Publishers，New York，1989)。
植物
本发明还涉及植物，例如，转基因植物、植物部分或植物细胞，其包含分离的多核苷酸，所述多核苷酸编码本发明具有葡糖淀粉酶活性的多肽，从而以可回收的量表达和产生所述多肽。多肽可从植物或植物部分回收。或者，同样可以将含有该重组多肽的植物或植物部分用于改进食品或饲料的质量，例如，改进营养价值、适口性(palatability)和流变性质(rheological properties)，或用于破坏抗营养因子。
转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草(grasses)，如草地早熟禾(meadow grass)(蓝草(blue grass)，早熟禾属(Poa))；饲用牧草(forage grass)如羊茅属(Festuca)、黑麦草属(Lolium)；寒地型牧草(temperate grass)，如Agrostis(翦股颖属)；和谷类，例如，小麦、燕麦、黑麦、大麦、稻(rice)、高粱和玉蜀黍(maize)(玉米)。
双子叶植物的实例是烟草(tobacco)，豆类(legumes)，如羽扇豆(lupins)，马铃薯，糖甜菜(sugar beet)，豌豆，豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(family Brassicaceae))，如花椰菜(cauliflower)，油菜籽(rape seed)和紧密相关的模型生物体拟南芥(Arabidopsis thaliana)。
植物部分的实例是茎(stem)、愈伤组织(callus)、叶(leaf)、根(root)、果实(fruit)、种子(seed)和块茎(tuber)，以及包含这些部分的独立组织，例如，表皮(epidermis)、叶肉(mesophyll)、薄壁组织(parenchyme)、维管组织(vascular tissue)、分生组织(meristem)。具体的植物细胞区室(compartments)，如叶绿体(chloroplast)、质外体(apoplast)、线粒体(mitochondria)、液泡(vacuole)、过氧化物酶体(peroxisome)和细胞质(cytoplasm)也被认为是植物部分。此外，任何植物细胞，无论什么组织来源，都被认为是植物部分。同样地，植物部分，如为了促进本发明的应用而分离的具体组织和细胞也被认为是植物部分，例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和种皮(seed coat)。
同样包含于本发明范围内的还有这些植物、植物部分和植物细胞的子代。
表达本发明多肽的转基因植物或植物细胞可以依照本领域已知方法构建。简而言之，通过如下方法构建所述植物或植物细胞：将编码本发明多肽的一个或多个(几个)表达构建体并入植物宿主基因组或叶绿体基因组，并且将所得的修饰植物或植物细胞繁殖为转基因植物或植物细胞。
表达构建体便利地是包含编码本发明多肽的多核苷酸的核酸构建体，所述多核苷酸与在选择的植物或植物部分中表达该核苷酸序列所需的适当的调节序列可操作地连接。此外，表达构建体可以包含对于鉴定在其中整合了该表达构建体的宿主细胞有用的选择性标记和将该构建体引入到所述植物中所必需的DNA序列(后者依赖于使用的DNA引入方法)。
调节序列的选择，例如启动子和终止子序列和任选地信号或转运序列的选择，举例来说，基于期望何时、何处以及如何表达多肽而确定。例如，编码本发明多肽的基因的表达可以是组成型的或诱导型的，或可以是发育、阶段或组织特异性的，并且基因产物可以靶向特定的组织或植物部分例如种子或叶。调节序列由例如Tague等，1988，Plant Physiology 86:506所述。
对于组成性表达，可以使用35S-CaMV、玉米泛素1和稻肌动蛋白1启动子(Franck等，1980，Cell 21:285-294，Christensen等，1992，Plant Mo.Biol.18:675-689；Zhang等，1991，Plant Cell 3:1155-1165)。器官特异性启动子可以是例如来自贮藏库组织(storage sink tissue)例如种子、马铃薯块茎和果实的启动子(Edwards&Coruzzi，1990，Ann.Rev.Genet.24:275-303)，或来自代谢库组织(metabolic sink tissue)例如分生组织的启动子(Ito等，1994，Plant Mol.Biol.24:863-878)，种子特异性启动子诸如来自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)启动子(Wu等，1998，Plant and Cell Physiology 39:885-889)，来自豆球蛋白(legumin)B4和蚕豆(Vicia faba)的未知种子蛋白基因的蚕豆启动子(Conrad等，1998，Journal of PlantPhysiology 152:708-711)、来自种子油体蛋白(oil body protein)的启动子(Chen 等，1998，Plant and Cell Physiology 39:935-941)，来自欧洲油菜(Brassica napus)的贮藏蛋白napA启动子，或本技术领域公知的任何其它种子特异性的启动子，例如，在WO 91/14772中所描述的。此外，启动子可为叶特异性的启动子，如来自稻或番茄的rbcs启动子(Kyozuka等，1993，Plant Physiology 102:991-1000)，小球藻病毒(chlorella virus)腺嘌呤甲基转移酶(adenine methyltransferase)基因启动子(Mitra和Higgins，1994，Plant Molecular Biology26:85-93)，或来自稻的aldP基因启动子(Kagaya等，1995，Molecular and General Genetics 248:668-674)，或伤口诱导的启动子，如马铃薯pin2启动子(Xu等，1993，Plant MolecularBiology 22:573-588)。同样地，所述启动子可通过非生物的处理诱导，所述非生物的处理诸如温度、干旱或盐度变化，或通过外源施加的激活所述启动子的物质诱导，例如乙醇、雌激素(oestrogens)、植物激素(plant hormones)如乙烯、脱落酸(abscisic acid)和赤霉酸(gibberellicacid)，和重金属。
启动子增强子元件也可以用于实现本发明多肽在植物中的较高表达。例如，启动子增强子元件可以是内含子，其置于启动子和编码本发明多肽的核苷酸序列之间。例如Xu等，1993，见上，公开了使用稻肌动蛋白1基因的第一内含子以增强表达。
选择性标记基因和表达构建体的任何其它部分可以选自本领域内可用的那些。
将核酸构建体根据本领域已知的常规技术并入植物基因组，所述常规技术包括土壤杆菌属(Agrobacterium)介导的转化、病毒介导的转化、显微注射 (microinjection)、粒子轰击、生物射弹转化和电穿孔(Gasser等，1990，Science244:1293；Potrykus，1990，Bio/Technology 8:535；Shimamoto等，1989，Nature338:274)。
目前，根癌土壤杆菌(Agrobacterium tumefaciens)介导的基因转移(gene transfer)，是产生转基因双子叶植物的优选方法(为了参考，见Hooykas和Schilperoort，1992，Plant Molecular Biology 19:15-38)，而且它也可以用于转化单子叶植物，虽然对于这些植物常常使用其它的转化方法。目前，产生转基因单子叶植物的优选的方法，是用粒子(用转化DNA涂覆的微观的金或钨粒子)轰击胚愈伤组织(embryonic calli)或发育中的胚(developing embryos)(Christou，1992，Plant Journal 2:275-281；Shimamoto，1994，Current OpinionBiotechnology 5:158-162；Vasil等，1992，Bio/Technology 10:667-674)。转化单子叶植物的可供选择的方法是基于原生质体转化，如由Omirulleh等，1993，Plant Molecular Biology 21:415-428所描述的。
转化之后，根据本领域熟知的方法选择并入了表达构建体的转化体并且再生成为完整植株。通常设计转化方法用于通过如下方法在再生期间或在后续世代中选择性消除选择基因：例如，使用带有两种独立的T-DNA构建体的共转化或通过特异性重组酶位点特异性地切除选择基因。
本发明还涉及产生本发明多肽的方法，其包括：(a)在有助于产生多肽的条件下培养包含多核苷酸的转基因植物或植物细胞，所述多核苷酸编码本发明具有葡糖淀粉酶活性的多肽；和(b)回收所述多肽。
组合物
本发明还涉及包含本发明的多肽的组合物。优选地，所述组合物富含此种多肽。术语“富含”表明组合物的葡糖淀粉酶活性例如以至少1.1的富集因子增加。
所述组合物可包含本发明的多肽作为主要酶组分，例如，单组分组合物。或者，所述组合物可包含多种酶活性，如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、卤素过氧化物酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶水解酶、肽谷氨酰胺酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。其他酶可由例如属于下述属的微生物产生：曲霉属，优选棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉；镰孢属，优选杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢；腐质霉属，优选特异腐质霉或疏棉状腐质霉；或木霉属，优选哈茨木霉，康宁木霉，长枝木霉，里氏木霉或绿色木霉。
多肽组合物可依照本领域中已知的方法制备，并可为液体或干组合物形式。举例而言，所述多肽组合物可为颗粒或微颗粒的形式。待包含于组合物中的多肽可依照本领域已知方法稳定化。
下文给出了本发明多肽组合物优选用途的实例。本发明的多肽组合物的剂量和其他使用组合物的条件可根据本领域已知方法确定。
葡糖淀粉酶和酸性α-淀粉酶的组合
根据本发明的该方面，本发明的葡糖淀粉酶可以与α-淀粉酶组合，优选与酸性α-淀粉酶以0.3至5.0AFAU/AGU的比例组合。更优选地，酸性α-淀粉酶活性和葡糖淀粉酶活性之间的比例为至少0.35，至少0.40，至少0.50，至少0.60，至少0.7，至少0.8，至少0.9，至少1.0，至少1.1，至少1.2，至少1.3，至少1.4，至少1.5，至少1.6，至少1.7，至少1.8，至少1.85，或甚至至少1.9AFAU/AGU。然而，酸性α-淀粉酶活性和葡糖淀粉酶活性之间的比例应优选为少于4.5，少于4.0，少于3.5，少于3.0，少于2.5，或甚至少于2.25AFAU/AGU。以AUU/AGI计，酸性α-淀粉酶和葡糖淀粉酶的活性优选以0.4至6.5AUU/AGI之间的比例存在。更优选地，酸性α-淀粉酶活性和葡糖淀粉酶活性之间的比例为至少0.45，至少0.50，至少0.60，至少0.7，至少0.8，至少0.9，至少1.0，至少1.1，至少1.2，至少1.3，至少1.4，至少1.5，至少1.6，至少1.7，至少1.8，至少1.9，至少2.0，至少2.1，至少2.2，至少2.3，至少2.4，或甚至至少2.5AUU/AGI。然而，酸性α-淀粉酶活性和葡糖淀粉酶活性之间的比例优选少于6.0，少于5.5，少于4.5，少于4.0，少于3.5，或甚至少于3.0AUU/AGI。
上述组合物适用于下文提及的供产生糖浆和发酵产物如乙醇的淀粉转化工艺。
下文给出了本发明多肽组合物优选用途的实例。本发明的多肽组合物的剂量和其他使用组合物的条件可根据本领域已知方法确定。
用途
本发明还涉及使用本发明具有葡糖淀粉酶活性的多肽的工艺/方法。
根据本发明的用途包括将淀粉淀粉转化为例如糖浆和发酵产物，包括乙醇和饮料。其中可使用本发明的葡糖淀粉酶的工艺的实例包括描述于WO92/20777，WO 03/066816，WO 03/066826，WO 2004/080923和WO2004/081193的那些，其均通过提述并入本文。
发酵产物的产生
自经糊化的含淀粉材料中产生发酵产物的工艺
在此方面，本发明涉及自含淀粉材料产生发酵产物(特别是乙醇)的工艺，所述工艺包括液化步骤，以及顺序或同时进行的糖化和发酵步骤。
本发明涉及自含淀粉材料产生发酵产物的工艺，包括下述步骤：
(a)液化含淀粉材料，优选使用α-淀粉酶；
(b)使用本发明的葡糖淀粉酶糖化步骤(a)中获得的经液化的材料；和
(c)使用发酵生物发酵经糖化的材料。
发酵产物，如特别是乙醇，可任选地在发酵后回收，例如，通过蒸馏进行。合适的含淀粉的起始材料列于下面“含淀粉材料”部分。涵盖的酶列于下面“酶”部分。液化优选在α-淀粉酶存在的条件下进行。发酵优选在酵母，优选酵母属菌株存在下。合适的发酵生物列于下文“发酵生物”部分。在优选的实施方案中，步骤(b)和(c)顺序或同时进行(即，作为SSF工艺)。
在一个特定的实施方案中，本发明的工艺在步骤(a)之前还包括下述步骤：
x)减小含淀粉材料的粒度，优选通过磨制；和
y)形成包含含淀粉材料和水的浆料。
含水浆料可含有10-40wt%，优选25-35wt%的含淀粉材料。将浆料加热到糊化温度以上，并可添加α-淀粉酶，优选细菌和/或酸性真菌α-淀粉酶以起始液化(稀化(thinning))。在一个实施方案中，在进行本发明步骤(a)中的α-淀粉酶处理前，浆料可经喷射蒸煮(jet-cooked)以进一步使浆料糊化。
更具体而言，液化过程可作为三步热浆工艺来进行。将浆料加热至60-95℃，优选80-85℃，并添加α-淀粉酶以起始液化(稀化)。然后可将浆料在95-140℃，优选105-125℃的温度喷射蒸煮1-15分钟，优选3-10分钟，特别是约5分钟。使浆料冷却至60-95℃并添加更多的α-淀粉酶以完成水解(二次液化)。液化工艺通常在pH 4.5至6.5，特别是在pH 5至6进行。磨制和液化的全谷物称作醪液(mash)。
步骤(b)中的糖化可使用本领域众所周知的条件进行。举例而言，完全的糖化工艺可持续约24至约72小时，然而，通常仅在30-65℃，通常约60℃的温度进行通常40-90分钟的预糖化，然后是在同时发酵和糖化工艺(SSF工艺)中在发酵过程中的完全糖化。糖化通常在30-65℃，通常约60℃的温度，在约pH 4-5的pH，通常在约pH 4.5进行。
发酵产物，特别是乙醇生产中最广泛使用的工艺为同时糖化和发酵(SSF)工艺，其中对糖化没有保持阶段，意思是发酵生物(如酵母)和酶可一起添加。SSF通常在25℃至40℃，如29℃至35℃，如30℃至34℃，优选约32℃的温度进行。根据本发明，可在发酵过程中向上或向下调整温度。
根据本发明，发酵步骤(c)包括但不限于用于产生醇类(例如，乙醇、甲醇、丁醇)；有机酸(例如，柠檬酸、乙酸、衣康酸、乳酸、葡糖酸)；酮类(例如，丙酮)；氨基酸(例如，谷氨酸)；气体(例如，H₂和CO₂)；抗生素(例如，青霉素和四环素)；酶；维生素(例如，核黄素、B₁₂、β-胡萝卜素)；以及激素的发酵工艺。优选的发酵工艺包括醇发酵工艺，如本领域公知。优选的发酵工艺为厌氧发酵工艺，如本领域公知。
自未糊化的含淀粉材料产生发酵产物的方法
在此方面，本发明涉及自含淀粉材料产生发酵产物，而无含淀粉材料的糊化(即无烹制的含淀粉材料)的工艺。在一个实施方案中，在发酵和糖化过程中仅使用本发明的葡糖淀粉酶。根据本发明，可产生期望的发酵产物，如乙醇，而不液化含有含淀粉材料的含水浆料。在一个实施方案中，本发明的方法包括在糊化温度以下，在本发明的葡糖淀粉酶的存在下对(经磨制的)含淀粉材料，例如粒状淀粉进行糖化以产生糖类，所述糖类可由合适的发酵生物发酵成期望的发酵产物。
因此，在此方面，本发明涉及用于自含淀粉材料产生发酵产物的工艺，包括：
(a)在所述含淀粉材料的起始糊化温度以下的温度用本发明的、优选具有SEQ ID NO：2，SEQ ID NO：4，SEQ ID NO：6，SEQ ID NO：8，SEQ ID NO：10，SEQ ID NO：12或SEQ ID NO：14的氨基酸18至573或者SEQ ID NO：16或SEQ ID NO：18的氨基酸18至576的成熟葡糖淀粉酶或与其具有至少82％同一性的葡糖淀粉酶，来糖化含淀粉材料；
(b)使用发酵生物进行发酵。
本发明的工艺的步骤(a)或(b)可顺序或同时进行。在一个实施方案中，在步骤(a)之前制备包含水和含淀粉材料的浆料。
所述发酵工艺可进行1至250小时，优选25至190小时，更优选30至180小时，更优选40至170小时，甚至更优选50至160小时，还更优选60至150小时，甚至还更优选70至140小时，并且最优选80至130小时的期间。
术语“起始糊化温度”意指淀粉发生糊化的最低温度。在水中加热的淀粉在50℃至75℃开始糊化；糊化的准确温度取决于特定的淀粉，并可方便的由本领域技术人员确定。从而，起始糊化温度可根据植物物种，植物物种的特定品种以及生长条件而改变。在本发明的上下文中，给定含淀粉材料的起始糊化温度为使用由Gorinstein和Lii Starch/44(12)：461-466(1992)描述的方法5％的淀粉颗粒丧失双折射的温度。
在步骤(a)之前，可制备含淀粉材料，如粒状淀粉的浆料，其具有10-55wt％含淀粉材料的干固体，优选25-40wt％干固体，更优选30-35％干固体。浆料可包含水分和/或工艺水(process water)，例如釜馏物(逆流(backset))、洗涤水(scrubber water)、蒸发器冷凝液或馏出物、来自蒸馏的侧线汽提器水(side-stripper water)或其他发酵产物设备(plant)的工艺水。由于本发明的方法在糊化温度以下进行，因此不发生显著的粘度增加，如果需要，可使用高水平的釜馏物。在一个实施方案中，含水浆料包含约1至约70vol％釜馏物，优选15-60vol％釜馏物，特别为约30至50vol％釜馏物。
可通过优选以干磨或湿磨将其粒度减小到0.05至3.0mm，优选0.1至0.5mm来制备含淀粉材料。在进行本发明的工艺后，含淀粉材料的至少85％，至少86％，至少87％，至少88％，至少89％，至少90％，至少91％，至少92％，至少93％，至少94％，至少95％，至少96％，至少97％，至少98％，或者优选至少99%的干固体转化为可溶的淀粉水解物。
本发明的工艺在低于起始糊化温度的温度进行。优选地，步骤(a)进行的温度为30至75℃，优选45至60℃。
在一个优选实施方案中，步骤(a)和步骤(b)作为顺序或同时糖化和发酵工艺进行。在此种优选的实施方案中，该工艺通常在25至40℃，如29至35℃，如30℃至34℃，如约32℃的温度进行。根据本发明在发酵过程可向上或向下调整温度。
在一个实施方案中，进行同时糖化和发酵从而使得糖水平，如葡萄糖水平保持在低水平，如6wt%以下，优选约3wt%以下，优选约2wt%以下，更优选约1wt%以下，甚至更优选约0.5%以下或甚至更优选0.25wt%以下，如约0.1wt%以下。所述低水平的糖可通过简单的使用经调整量的酶和发酵生物来实现。本领域技术人员可方便地确定使用的酶和发酵生物的量。酶和发酵生物的使用量也可经选择以保持麦芽糖在发酵液中的低浓度。举例而言，麦芽糖水平可保持为约0.5wt%以下，或约0.2wt%以下。
本发明的方法可在pH 3至7，优选pH 3.5至6，或更优选pH 4至5的范围进行。
含淀粉材料
根据本发明，可使用任何合适的含淀粉的起始材料，包括粒状淀粉。所述起始材料通常基于期望的发酵产物而选择。适用于本发明工艺的含淀粉的起始材料的实例包括块茎、根、茎、全谷粒、玉米、玉米穗轴、小麦、大麦、黑麦、买罗高粱、西米、木薯、树薯、高粱、稻、豌豆(pea)、豆(bean)或甘薯，或它们的组合，或谷类，含糖原材料如糖蜜，果物材料，甘蔗或甜菜，马铃薯，以及含纤维素材料，如木质或植物残余物，或其组合。涵盖蜡质和非蜡质两者类型的玉米和大麦。
术语“粒状淀粉”意指未烹制的生淀粉，即，以其天然形式存在于谷类、块茎或谷粒中的淀粉。淀粉在植物细胞中作为微小的不溶于水的颗粒形成。当置于冷水中时，淀粉颗粒可吸收少量液体并膨胀(swell)。在高至50℃至75℃的温度，膨胀可为可逆的。然而，在更高温度开始称为“糊化”的不可逆膨胀。待加工的粒状淀粉可为高度精制的淀粉质量，优选至少90%，至少95%，至少97%或至少99.5%纯，或者其可为更加粗制的含淀粉材料，其含有包括非淀粉部分(例如胚残余物和纤维)的经磨制的全谷粒。原材料(如全谷粒)经磨制以打开其结构并允许进一步的加工。根据本发明优选两种磨制工艺，湿磨和干磨。在干磨中，将整粒磨碎并使用。湿磨给出胚和粗粉(淀粉颗粒和蛋白质)的良好分离，并通常用于使用淀粉水解物产生糖浆的场合。干磨和湿磨在淀粉加工领域都是众所周知的，并等同地涵盖于本发明的工艺中。
所述含淀粉材料优选通过干磨或湿磨减小粒度以暴露更多表面区域。在一个实施方案中，粒度为约0.05至3.0mm，优选0.1至0.5mm，或使得至少30%，优选至少50%，更优选至少70%，甚至更加优选至少90%的含淀粉材料可穿过具有0.05至3.0mm筛网，优选0.1至0.5mm筛网的筛。
发酵产物
术语“发酵产物”意指使用发酵生物通过包括发酵步骤的工艺生成的产物。根据本发明所包括的发酵产物包括醇类(例如，乙醇、甲醇、丁醇)；有机酸(例如，柠檬酸、乙酸、衣康酸、乳酸、葡糖酸)；酮类(例如，丙酮)；氨基酸(例如，谷氨酸)；气体(例如，H₂和CO₂)；抗生素(例如，青霉素和四环素)；酶；维生素(例如，核黄素、B₁₂、β-胡萝卜素)；以及激素。在一个优选实施方案中，所述发酵产物是乙醇，例如，燃料乙醇；饮用乙醇(即，可饮用的中性酒)；或工业乙醇或用于可饮用醇类工业(例如，啤酒和葡萄酒)、乳制品工业(例如，发酵的乳制品)、皮革工业和烟草工业的产物。优选的啤酒类型包括爱儿啤酒(ale)、烈性啤酒(stout)、钵尔透黑啤酒(porters)、陈贮啤酒(lagers)、苦味酒(bitters)、麦芽酒(malt liquors)、发泡酒(happoushu)、高醇啤酒(high-alcohol beer)、低醇啤酒(low-alcohol beer)、低热量啤酒(low-calorie beer)或清淡啤酒(light beer)。使用的优选发酵工艺包括醇发酵工艺，如本领域公知。优选的发酵工艺为厌氧发酵工艺，如本领域公知。
发酵生物
“发酵生物”指任何适用于发酵工艺并能够产生所需的发酵产物的生物，包括细菌和真菌生物。特别合适的发酵生物能够将糖如葡萄糖或麦芽糖直接或间接发酵(即转化)为所需的发酵产物。发酵生物的实例包括真菌生物，如酵母。优选的酵母包括酵母属菌种的菌株，特别是酿酒酵母。商业上可获得的酵母包括例如Red Star^TM/Lesaffre Ethanol Red(可从Red Star/Lesaffre,USA获得)FALI(可从Burns Philp Food Inc.,USA的分支机构Fleischmann’s Yeast获得)， SUPERSTART(可从Alltech获得)，GERT STRAND(可从Gert Strand AB,Sweden获得)和FERMIOL(可从DSM Specialties获得)。
酶
葡糖淀粉酶
葡糖淀粉酶优选为本发明的葡糖淀粉酶。然而如上所述，本发明的葡糖淀粉酶亦可与其他葡糖淀粉酶组合。术语“葡糖淀粉酶”(1,4-α-D-葡聚糖葡糖水解酶，EC 3.2.1.3)是催化D-葡萄糖从淀粉或相关的寡糖和多糖分子的非还原端释放的酶。
葡糖淀粉酶可以以0.001至10AGU/g DS，优选0.01至5AGU/g DS，如大约0.1，0.3，0.5，1或2AGU/g DS，特别是0.1至0.5AGU/g DS或0.02-20AGU/gDS，优选0.1-10AGU/g DS的量添加。
α-淀粉酶
根据本发明α-淀粉酶可为任何来源的。优选真菌或细菌来源的α-淀粉酶。
在一个优选实施方案中，所述α-淀粉酶是酸性α-淀粉酶，例如真菌酸性α-淀粉酶或细菌酸性α-淀粉酶。术语“酸性α-淀粉酶”意指以有效量添加、在pH范围3至7，优选3.5至6，或更优选4至5具有最优活性的α-淀粉酶(EC 3.2.1.1)。
细菌α-淀粉酶
根据本发明，细菌α-淀粉酶优选来源于芽孢杆菌属。
在一个优选实施方案中，所述芽孢杆菌属α-淀粉酶来源于地衣芽孢杆菌、解淀粉芽孢杆菌、枯草芽孢杆菌或嗜热脂肪芽孢杆菌的菌株，但亦可来源于其他芽孢杆菌菌种。涵盖的α-淀粉酶的具体实例包括示于WO 99/19467中SEQ IDNO:4的地衣芽孢杆菌α-淀粉酶(BLA)，示于WO 99/19467中SEQ ID NO:5的解淀粉芽孢杆菌α-淀粉酶(BAN)，和示于WO 99/19467中SEQ ID NO:3的嗜热脂肪芽孢杆菌α-淀粉酶(BSG)。在一个本发明的实施方案中，所述α-淀粉酶为分别与WO 99/19467中示为SEQ ID NO:1、2、3、4或5的任何序列具有至少60%，优选至少70%，更优选至少80%，甚至更优选至少90%，如至少95%，至少96%，至少97%，至少98%或至少99%同一性的同一性程度的酶。
所述芽孢杆菌属α-淀粉酶亦可为变体和/或杂合体，特别是任何 WO 96/23873、WO 96/23874、WO 97/41213、WO 99/19467、WO 00/60059和WO 02/10355(所有文献通过提述并入本文)中所描述的α-淀粉酶。具体而言，涵盖的α-淀粉酶变体公开于美国专利号6,093,562、6,187,576和6,297,038(通过提述并入本文)，并包括在位置179至182具有一个或两个氨基酸缺失的嗜热脂肪芽孢杆菌α-淀粉酶(BSG α-淀粉酶)变体，所述缺失优选为WO 96/23873中公开的双会从缺失(参见，例如第20页第1-10行，通过提述并入本文)，优选与WO 99/19467中公开的示于SEQ ID NO:3的野生型BSGα-淀粉酶氨基酸序列相比对应于delta(181-182)，或氨基酸179和180的缺失，其中使用WO 99/19467(通过提述并入本文)中的SEQ ID NO:3为准进行编号。甚至更优选的是与WO 99/19467中公开的示于SEQ ID NO:3的野生型BSGα-淀粉酶氨基酸序列相比具有对应于delta(181-182)的双重缺失，并进一步包含N193F取代(亦表示为I181*+G182*+N193F)的芽孢杆菌α-淀粉酶，特别是嗜热脂肪芽孢杆菌α-淀粉酶。
所述α-淀粉酶亦可为产麦芽糖α-淀粉酶。“产麦芽糖α-淀粉酶”(葡聚糖1,4-α-麦芽水解酶，EC 3.2.1.133)能够将直链淀粉和支链淀粉(amylopectin)水解为α-构型的麦芽糖。一种来自嗜热脂肪芽孢杆菌菌株NCIB 11837的产麦芽糖α-淀粉酶商业上可从Novozymes A/S,Denmark获得。产麦芽糖α-淀粉酶描述于美国专利4,598,048、4,604,355和6,162,628，其通过提述并入本文。
细菌杂合α-淀粉酶
具体涵盖的杂合α-淀粉酶包含地衣芽孢杆菌α-淀粉酶(示为WO 99/19467中的SEQ ID NO:4)的445个C端氨基酸残基和来源于解淀粉芽孢杆菌(示为WO 99/19467中的SEQ ID NO:3)的37个N端氨基酸残基，并具有一个或多个，特别是所有的下述取代：
G48A+T49I+G 107A+H 156Y+A 181T+N 190F+I201F+A209V+Q264S (使用地衣芽孢杆菌编号)。亦优选具有一个或多个下述突变(或其他芽孢杆菌属α-淀粉酶骨架中的对应突变)的变体：H154Y、A181T、N190F、A209V和Q264S，和/或位置176和179之间两个残基的缺失，特别是缺失E178和G179(使用WO 99/19467的SEQ ID NO:5的编号)。
细菌α-淀粉酶亦可以如本领域公知的量添加。当以KNU单位(描述于下文“材料和方法”部分)测量时，α-淀粉酶活性优选以0.5-5,000NU/g的DS的量， 1-500NU/g的DS的量，或更优选以5-1,000NU/g的DS如10-100NU/g DS的量存在。
真菌α-淀粉酶
真菌酸性α-淀粉酶包括来源于曲霉属菌株的酸性α-淀粉酶，如川地曲霉、黑曲霉或米曲霉α-淀粉酶。
优选的酸性真菌α-淀粉酶是Fungamyl样α-淀粉酶，其优选来源于米曲霉的菌株。在本公开中，术语“Fungamyl样α-淀粉酶”指与示于WO 96/23874的SEQ ID NO:10的氨基酸序列的成熟部分呈现高同一性，即高于70%，高于75%，高于80%，高于85%，高于90%，高于95%，高于96%，高于97%，高于98%，高于99%或甚至100%同一性的α-淀粉酶。
另一种优选的酸性α-淀粉酶来源于黑曲霉菌株。在一个优选实施方案中，所述酸性真菌α-淀粉酶是来自黑曲霉、作为“AMYA ASPNG”以初级登录号P56271公开于Swiss-prot/TeEMBL数据库并更具体描述于WO 89/01969(实施例3)的α-淀粉酶。所述酸性黑曲霉酸性α-淀粉酶在WO 2004/080923(Novozymes)(通过提述并入本文)亦显示于SEQ ID NO:1。还涵盖了所述酸性真菌淀粉酶与WO 2004/080923中的SEQ ID NO:1具有至少70%同一性，如至少80%或甚至至少90%同一性，如至少95%，至少96%，至少97%，至少98%，或至少99%同一性的变体。合适的商业上可获得的来源于黑曲霉的酸性真菌α-淀粉酶为SP288(可从Novozymes A/S,Denmark获得)。
在一个优选实施方案中，所述α-淀粉酶来源于川地曲霉，并公开于Kaneko等,1996,J. Ferment.Bioeng.81:292-298,“Molecular-cloning and determination of the nucleotide-sequence of a gene encoding an acid-stable alpha-amylase from Aspergillus kawachii"；并进一步作为EMBL:#AB008370公开。
所述真菌酸性α-淀粉酶亦可为包含糖结合模块(CBM)和α-淀粉酶催化域的野生型酶(即，非杂合体)，或其变体。在一个实施方案中，所述野生型酸性α-淀粉酶来源于川地曲霉的菌株。
真菌杂合α-淀粉酶
在一个优选实施方案中，所述真菌酸性α-淀粉酶是杂合α-淀粉酶。真菌杂合α-淀粉酶的优选实例包括WO 2005/003311或美国申请公开号2005/0054071 (Novozymes)或美国申请号60/638,614(Novozymes)中公开的那些，其通过提述并入本文。杂合α-淀粉酶可包含α-淀粉酶催化域(CD)和糖结合域/模块(CBM)和任选的接头。
涵盖的杂合的α-淀粉酶的具体实例包括美国申请号60/638,614中公开的那些，其包括具有催化域JA118和罗耳阿太菌(Athelia rolfsii)SBD的Fungamyl变体(美国申请号60/638,614中的SEQ ID NO:100)，具有罗耳阿太菌AMG接头和SBD的微小根毛霉α-淀粉酶(美国申请号60/638,614中的SEQ ID NO:101)，和具有罗耳阿太菌葡糖淀粉酶接头和SBD的巨多孔菌α-淀粉酶(美国申请号60/638,614中的SEQ ID NO:102)。
涵盖的杂合的α-淀粉酶的其他具体实例包括公开于美国申请公开号2005/0054071中的那些，包括公开于第15页表3中的那些，如具有川地曲霉接头和淀粉结合域的黑曲霉α-淀粉酶。
商业性α-淀粉酶产品
优选的包含α-淀粉酶的商业性组合物包括来自DSM(Gist Brocades)的MYCOLASE，BAN^TM，TERMAMYL^TM SC，FUNGAMYL^TM，LIQUOZYME^TMX和SAN^TM SUPER，SAN^TM EXTRA L(Novozymes A/S)和CLARASE^TML-40,000，DEX-LO^TM，SPEZYME^TM FRED，SPEZYME^TM AA，SPEZYME^TMEthyl，GC358，GC980，SPEZYME^TM RSL，以及SPEZYME^TM DELTA AA(Genencor Int.)，以及以商品名SP288出售的酸性真菌α-淀粉酶(可从NovozymesA/S,Denmark获得)。
根据本发明，酸性α-淀粉酶可以以0.1至10AFAU/g DS，优选0.10至5AFAU/g DS，特别是0.3至2AFAU/g DS的量添加。
糖浆的产生
本发明还提供了使用本发明的葡糖淀粉酶从含淀粉材料产生糖浆如葡萄糖等的工艺。合适的起始材料例示于上文的“含淀粉材料”部分。一般而言，所述工艺包括在α-淀粉酶的存在下部分水解含淀粉材料(液化)，然后进一步在本发明的葡糖淀粉酶存在下糖化从淀粉或相关的寡糖或多糖分子的非还原端释放的葡萄糖的步骤。
可如上所述进行液化和糖化以供发酵产物的产生。
本发明的葡糖淀粉酶亦可以固定化的形式使用。对于产生特种糖浆，如麦芽糖糖浆，以及进一步对于涉及果糖糖浆如高果糖糖浆(HFS)的产生的寡糖萃余液流而言，这是合适并常用的。
因此本发明的该方面涉及从含淀粉材料产生糖浆的方法，包括：
(a)在α-淀粉酶存在下液化含淀粉材料，和
(b)使用本发明的葡糖淀粉酶糖化在步骤(a)中获得的材料。
可从步骤(b)中获得的糖化的材料回收糖浆。
对于合适条件的细节可见于上文。
酿造
本发明的葡糖淀粉酶亦可用于酿造工艺。本发明的葡糖淀粉酶以本领域技术人员容易地确定的有效量添加。
本文中所述和要求保护的发明的范围并不受本文中公开的具体实施方案所限，因为这些实施方案旨在说明本发明的多个方面。旨在将任何等同的实施方案包含于本发明的范围之内。事实上，根据前述的描述，除了本文中显示和描述的之外，本发明的多种修饰对于本领域技术人员会是显而易见的。亦旨在将此类修饰包含于所附权利要求的范围之内。在出现冲突时，以包括定义在内的本公开为准。
本文中引用了多个参考文献，其公开以全文提述的方式并入本文。本发明进一步通过下述实施例描述，其不应视作对本发明的范围的限制。
材料和方法
酵母：可从Red Star/Lesaffre,USA获得的RED STAR^TM
培养基和试剂：
用作缓冲液和底物的化学品为至少试剂级的商品。
PDA：39g/L Potato Dextrose Agar，20g/L琼脂，50ml/L甘油
方法
除非另行指明，DNA操作和转化使用Sambrook等(1989)Molecular cloning:A laboratory manual,Cold Spring Harbor lab.,Cold Spring Harbor,NY；Ausubel,F. M.等(eds.)"Current protocols in Molecular Biology",John Wiley and Sons,1995;Harwood,C.R.,和Cutting,S.M.(eds.)"Molecular Biological Methods for Bacillus".John Wiley and Sons,1990中所述的分子生物学标准方法进行。
葡糖淀粉酶活性
葡糖淀粉酶活性可用AGI单位或葡糖淀粉酶单位(AGU)测定。
葡糖淀粉酶活性(AGI)
葡糖淀粉酶(等价于淀粉葡糖苷酶)将淀粉转化为葡萄糖。葡萄糖的量在本文中通过供活性确定的葡萄糖氧化酶方法来确定。该方法描述于“Approvedmethods of the American Association of Cereal Chemists”.Vol.1-2AACC,from American Association of Cereal Chemists,(2000);ISBN:1-891127-12-8的部分76-11 Starch—Glucoamylase Method with Subsequent Measurement。
一个葡糖淀粉酶单位(AGI)为在方法的标准条件下每分钟产生1微摩尔葡萄糖的酶的量。
标准条件/反应条件
底物：                    可溶性淀粉，浓度大约为16g干物质/L
缓冲液：                  乙酸，大约0.04M，pH=4.3
pH：                      4.3
温育温度                  60℃
反应时间：                15分钟
反应的终止：              添加NaOH至大约0.2g/L的浓度(pH~9)
酶浓度：                  0.15-0.55AAU/mL.
所述淀粉应为Litner淀粉，其为在实验室中用作色度指示剂的低粘度淀粉(thin-boiling)。Linter淀粉是通过对天然淀粉进行稀盐酸处理使其保留与碘反应呈蓝色的能力而获得的。
葡糖淀粉酶活性(AGU)
Novo Glucoamylase Unit(AGU)定义为在37℃，pH4.3，底物：麦芽糖 23.2mM，缓冲液：乙酸盐0.1M，反应时间5分钟的标准条件下每分钟水解1微摩尔麦芽糖的酶量。
可使用自动分析系统。将变旋酶添加到葡萄糖脱氢酶试剂中，使得任何存在的α-D-葡萄糖转化为β-D-葡萄糖。葡萄糖脱氢酶特异性地与β-D-葡萄糖在上述反应中反应，形成NADH，其使用光度计在340nm处测定作为起始葡萄糖浓度的量度。

AMG温育：底物：麦芽糖23.2mM 缓冲液：乙酸盐0.1M pH： 4.30±0.05 温育温度： 37℃±1 反应时间： 5分钟酶工作范围： 0.5-4.0AGU/mL

颜色反应 GlucDH： 430U/L 变旋酶： 9U/L NAD： 0.21mM 缓冲液：磷酸盐0.12M;0.15MNaCl pH： 7.60±0.05 温育温度 37℃±1 反应时间： 5分钟波长： 340nm

更详细描述此分析方法的文件夹(EB-SM-0131.02/01)可根据要求由Novozymes A/S,Denmark得到，其通过提述并入本文。
α-淀粉酶活性(KNU)
α-淀粉酶活性可使用马铃薯淀粉作为底物来确定。该方法基于酶对于改性马铃薯淀粉的分解，并通过将淀粉/酶溶液的样本与碘溶液混合来跟踪反应。起初，形成了蓝黑色(blackishblue)，但在淀粉分解过程中，蓝色越来越淡，并逐渐变为红棕色(reddish-brown)，将其和有色玻璃标准(colored glass standard)进行比较。
一个千Novo α-淀粉酶单位(KNU)定义为在标准条件下(即，在37℃+/-0.05；0.0003M Ca²⁺；以及pH 5.6)糊精化5260mg的淀粉干底物MerckAmylum Solubile所需的酶量。
更详细描述该分析方法的文件夹EB-SM-0009.02/01可根据要求由Novozymes A/S,Denmark得到，其通过提述并入本文。
酸性α-淀粉酶活性
当根据本发明使用时，任何酸性α-淀粉酶的活性可以用AFAU (酸性真菌α-淀粉酶单位)测量。或者，酸性α-淀粉酶的活性可用AAU(酸性α-淀粉酶单位)测量。
酸性α-淀粉酶单位(AAU)
酸性α-淀粉酶活性可用AAU(酸性α-淀粉酶单位)测量，其为绝对方法。一个酸性淀粉酶单位(AAU)为在标准化条件下每小时将1g 的淀粉(100%的干物质)转化为在与已知强度的碘溶液反应之后在620nm具有与一种色度参照相同的发射(transmission)的产物的量。
标准条件/反应条件：
底物：                可溶性淀粉，浓度约为20g DS/L
缓冲液：              柠檬酸，大约0.13M，pH=4.2
碘溶液：              40.176g碘化钾+0.088g碘/L
自来水(city water)：  15°-20°dH(German硬度)
pH：                  4.2
温育温度：            30℃
反应时间：            11分钟
波长：                620nm
酶浓度：              0.13-0.19AAU/mL
酶工作范围            0.13-0.19AAU/mL
所述淀粉应为Litner淀粉，其为在实验室中用作色度指示剂的低粘度淀粉。Linter淀粉是通过对天然淀粉进行稀盐酸处理使其保留与碘反应呈蓝色的能力而获得的。更多细节可见于EP 0140410B2，其通过提述并入本文。
酸性α-淀粉酶活性(AFAU)
酸性α-淀粉酶活性可以AFAU(酸性真菌α-淀粉酶单位)进行测量，其相对于酶标准物来确定。1AFAU定义为在下面提及的标准条件下每小时降解5.260mg淀粉干物质的酶量。
酸性α-淀粉酶，其为内切α-淀粉酶(1,4-α-D-葡聚糖-葡糖水解酶，E.C.3.2.1.1)水解淀粉分子内部区域中的α-1,4-葡糖苷键以形成具有不同链长的寡糖和糊精。与碘形成的颜色的强度与淀粉浓度成正比。使用反向比色法(reverse colorimetry)在规定的分析条件下测定淀粉浓度的降低作为淀粉酶活性。

λ=590nm
蓝色/紫色        t=23秒    脱色
标准条件/反应条件
底物：          可溶性淀粉，大约0.17g/L
缓冲液：        柠檬酸盐，大约0.03M
碘(I₂)：        0.03g/L
CaCl₂：         1.85mM
pH：            2.50±0.05
温育温度：      40℃
反应时间        23秒
波长            590nm
酶浓度          0.025AFAU/mL
酶工作范围      0.01-0.04AFAU/mL
更详细描述该分析方法的文件夹EB-SM-0259.02/01可根据要求由Novozymes A/S,Denmark得到，其通过提述并入本文。
实施例1：
用篱边粘褶菌AMG的同时糖化和发酵(SSF)
在不同酶剂量测量了粘褶菌属菌种葡糖淀粉酶的SSF性能。发酵在下述条件下运行：
底物：将磨碎的玉米用逆流制浆，并将其干物质调整至大约32%(w/w)。然后将其在85℃和pH 5.8液化。液化的醪液具有13.4的DE。
温度：32℃
起始pH：5.0
酶剂量：在黑曲霉中以30、40、55和70微克酶蛋白/g DS产生粘褶菌属菌种AMG。将酶与在相同剂量给药的商业性埃默森踝节菌AMG的纯化样品相比较。埃默森踝节菌AMG的最高剂量等价于0.56AGU/g DS的产业上有意义的量。使用过量的商业性AMG和α-淀粉酶制备针对最大可获得的糖化的对照。
发酵
向对于SSF的底物添加1000ppm尿素作为氮源和3ppm青霉素以控制细菌，用H₂SO₄将pH调整至5.0。将5g醪液的等分试样转移至在顶部钻孔以供CO₂释放的15ml离心管。添加酶和酵母，并将试管置于水浴中，在32℃无搅拌放置54小时。
在HPLC中分析样品以供确定在发酵过程中产生的乙醇。结果示于下表：

实施例2：
比较粘褶菌属菌种AMG的比活性与瓣环栓菌AMG
比活性通过将葡糖淀粉酶AGU活性(根据如上所述的方法)除以来自每种制备物的酶蛋白(AA分析)来计算。下表显示对于不同粘褶菌属菌种AMG相对于瓣环栓菌AMG的结果。

生物材料的保藏
下述的生物材料已经依据布达佩斯条约的条款保藏于德意志微生物和细胞培养保藏中心(Deutsche Sammlung von Mikroorganismen und ZellkulturenGmbH，DSM),Mascheroder Weg 1B,D-38124Braunschweig,Germany，并给予下述的登录号：
保藏物：具有包含序列D7279(SEQ ID NO:1)的质粒的大肠杆菌菌株NN059223
登录号：DSM 23222
保藏日期：2010年1月13日
所述菌株于下述条件下保藏：确保在本专利申请未决期间，依据该外国专利法律的授权的人能够获得所述培养物。所述保藏物为所保藏菌株的基本上纯的培养物。在提交了该申请的副本，或其后续文本的国家，依据该外国专利法律可以获得所述保藏物。然而，应当理解，保藏物的获得并不构成对实施本发明的许可，实施本发明是对政府行为所授予的专利权的侵犯。
序列表

资源描述

《具有葡糖淀粉酶活性的多肽及其编码多核苷酸.pdf》由会员分享，可在线阅读，更多相关《具有葡糖淀粉酶活性的多肽及其编码多核苷酸.pdf（72页珍藏版）》请在专利查询网上搜索。

1、10申请公布号CN104169417A43申请公布日20141126CN104169417A21申请号201080054626022申请日20101130DSM232222010011361/265,52620091201US61/406,74120101026USC12N9/34200601C12P19/14200601C12P7/0620060171申请人诺维信公司地址丹麦鲍斯韦申请人诺维信北美公司72发明人S兰德维克MD莫兰特绫部圭G科沃德凯利74专利代理机构北京市柳沈律师事务所11105代理人封新琴54发明名称具有葡糖淀粉酶活性的多肽及其编码多核苷酸57摘要本发明涉及具有葡糖淀粉酶活性。

2、的分离的多肽和编码所述多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞，以及产生和使用所述多肽的方法。30优先权数据85PCT国际申请进入国家阶段日2012060186PCT国际申请的申请数据PCT/US2010/0584242010113087PCT国际申请的公布数据WO2011/068803EN2011060983生物保藏信息51INTCL权利要求书3页说明书35页序列表32页PCT/RO/134表1页19中华人民共和国国家知识产权局12发明专利申请权利要求书3页说明书35页序列表32页PCT/RO/134表1页10申请公布号CN104169417ACN104。

3、169417A1/3页21一种具有葡糖淀粉酶活性的分离的多肽，其选自下组A多肽，其包含氨基酸序列，所述氨基酸序列与SEQIDNO2，SEQIDNO4，SEQIDNO6，SEQIDNO8，SEQIDNO10，SEQIDNO12，SEQIDNO14，SEQIDNO16或SEQIDNO18的成熟多肽具有优选至少82，更优选至少83，更优选至少84，更优选至少85，更优选至少86，更优选至少87，更优选至少88，更优选至少89，更优选至少90，更优选至少91，更优选至少92，甚至更优选至少93，最优选至少94，并且甚至最优选至少95，如至少95，至少97，至少98，至少99或甚至100同一性；B多肽，。

4、其包含氨基酸序列，所述氨基酸序列与SEQIDNO2，SEQIDNO4，SEQIDNO6，SEQIDNO8，SEQIDNO10，SEQIDNO12，SEQIDNO14的氨基酸19至474或者SEQIDNO16或SEQIDNO18的氨基酸19至471所示的催化域具有优选至少82，更优选至少83，更优选至少84，更优选至少85，更优选至少86，更优选至少87，更优选至少88，更优选至少89，更优选至少90，更优选至少91，更优选至少92，甚至更优选至少93，最优选至少94，并且甚至最优选至少95，如至少96，至少97，至少98，至少99或甚至100同一性；C多肽，其由多核苷酸编码，所述多核苷酸在优选。

5、至少中高严格条件下，和最优选至少高严格条件下与以下杂交ISEQIDNO1，SEQIDNO3，SEQIDNO5，SEQIDNO7，SEQIDNO9，SEQIDNO11，SEQIDNO13，SEQIDNO15或SEQIDNO17的成熟多肽编码序列，II包含SEQIDNO1，SEQIDNO3，SEQIDNO5，SEQIDNO7，SEQIDNO9，SEQIDNO11，SEQIDNO13，SEQIDNO15或SEQIDNO17的成熟多肽编码序列的基因组DNA序列，或IIII或II的全长互补链；D多肽，其由多核苷酸编码，所述多核苷酸包含核苷酸序列，所述核苷酸序列与SEQIDNO1，SEQIDNO3，SEQ。

6、IDNO5，SEQIDNO7，SEQIDNO9，SEQIDNO11，SEQIDNO13，SEQIDNO15或SEQIDNO17的成熟多肽编码序列具有优选至少82，更优选至少83，更优选至少84，更优选至少85，更优选至少86，更优选至少87，更优选至少88，更优选至少89，更优选至少90，更优选至少91，更优选至少92，甚至更优选至少93，最优选至少94，并且甚至最优选至少95，如至少96，至少97，至少98，至少99或甚至100同一性；和E变体，其包含取代、缺失和/或插入一个或多个几个氨基酸的SEQIDNO2，SEQIDNO4，SEQIDNO6，SEQIDNO8，SEQIDNO10，SEQI。

7、DNO12，SEQIDNO14，SEQIDNO16或SEQIDNO18的成熟多肽。2权利要求1的多肽，其包含或组成为SEQIDNO2或SEQIDNO4或SEQIDNO6，SEQIDNO8，SEQIDNO10，SEQIDNO12，SEQIDNO14，SEQIDNO16或SEQIDNO18的氨基酸序列；SEQIDNO2或SEQIDNO4或SEQIDNO6，SEQIDNO8，SEQIDNO10，SEQIDNO12，SEQIDNO14，SEQIDNO16或SEQIDNO18的成熟多肽；或它们具有葡糖淀粉酶活性的片段。3权利要求1或2的多肽，其由多核苷酸编码，所述多核苷酸包含或组成为SEQIDNO1，S。

8、EQIDNO3，SEQIDNO5，SEQIDNO7，SEQIDNO9，SEQIDNO11，SEQIDNO13，SEQIDNO15或SEQIDNO17的核苷酸序列；或它们编码具有葡糖淀粉酶活性的片段的亚序列。权利要求书CN104169417A2/3页34权利要求13任一项的多肽，其由DSM23222中包含的质粒中含有的多核苷酸编码。5权利要求14任一项的多肽，其中所述成熟多肽是SEQIDNO2，SEQIDNO4，SEQIDNO6，SEQIDNO8，SEQIDNO10，SEQIDNO12或SEQIDNO14的氨基酸18至573或SEQIDNO16或SEQIDNO18的氨基酸18至576。6一种具有。

9、糖结合活性的分离的多肽，其包含糖结合模块，所述模块与SEQIDNO2，SEQIDNO4，SEQIDNO6，SEQIDNO8，SEQIDNO10，SEQIDNO12或SEQIDNO14的氨基酸480至573或者SEQIDNO16或SEQIDNO18的氨基酸483至576所示的糖结合域具有优选至少80，更优选至少81，更优选至少82，更优选至少83，更优选至少84，更优选至少85，更优选至少86，更优选至少87，更优选至少88,更优选至少89，更优选至少90，更优选至少91，更优选至少92，甚至更优选至少93，最优选至少94，并且甚至最优选至少95，如至少95，至少97，至少98，至少99或甚至1。

10、00同一性。7一种杂合酶，其包含催化域和权利要求6的糖结合域。8权利要求7的杂合酶，其中所述催化域具有选自下组的酶活性淀粉酶，AMYLOPULLULANASE，淀粉酶，CGT酶，葡糖淀粉酶，异淀粉酶，产麦芽糖淀粉酶和支链淀粉酶。9一种分离的多核苷酸，其包含编码权利要求18任一项的多肽的核苷酸序列。10一种核酸构建体，其包含可操作连接的权利要求9的多核苷酸和一种或多种几种调控序列，所述调控序列指导所述多肽在表达宿主中的表达。11一种重组表达载体，其包含权利要求10的核酸构建体。12一种重组宿主细胞，其包含权利要求10的核酸构建体。13一种产生权利要求18任一项的多肽的方法，包括A在有助于所述多肽。

11、产生的条件下培养包含核酸构建体的宿主细胞，所述核酸构建体包含编码所述多肽的核苷酸序列；和B回收所述多肽。14一种产生权利要求18任一项的多肽的方法，包括A在有助于所述多肽产生的条件下培养转基因植物或植物细胞，所述植物或植物细胞包含编码所述多肽的多核苷酸序列；和B回收所述多肽。15一种转基因植物、植物部分或植物细胞，其用编码权利要求18任一项的多肽的多核苷酸转化。16权利要求18任一项的多肽在产生糖浆和/或发酵产物中的用途。17权利要求16的方法，其中所述起始材料为糊化的或未糊化的含淀粉材料。18权利要求18任一项的多肽用于酿造的用途。19一种组合物，其包含淀粉酶和权利要求18任一项的多肽。20。

12、一种从含淀粉材料产生发酵产物的工艺，包括下述步骤A液化含淀粉材料；B糖化经液化的材料；和C用发酵生物发酵；其中步骤B使用至少一种权利要求15任一项的葡糖淀粉酶进行。21一种从含淀粉材料产生发酵产物的工艺，包括下述步骤A在所述含淀粉材料的起始糊化温度以下的温度糖化含淀粉材料；和权利要求书CN104169417A3/3页4B用发酵生物发酵；其中步骤A使用至少一种权利要求15任一项的葡糖淀粉酶进行。权利要求书CN104169417A1/35页5具有葡糖淀粉酶活性的多肽及其编码多核苷酸0001涉及序列表0002本申请涉及计算机可读形式的序列表，其通过提述并入本文。0003涉及生物材料的保藏0004本申。

13、请包含对于生物材料保藏的引用，所述保藏通过提述并入本文。关于完整信息参见说明书最后一段。0005发明背景技术领域0006本发明涉及具有葡糖淀粉酶活性的多肽和编码所述多肽的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞以及用于产生和使用所述多肽的方法，并涉及本发明的葡糖淀粉酶在转化淀粉以产生发酵产物如乙醇和糖浆如葡萄糖中的用途。本发明还涉及包含本发明的葡糖淀粉酶的组合物。背景技术0007葡糖淀粉酶1,4D葡聚糖葡糖水解酶，EC3213是一种催化D葡萄糖从淀粉或相关的寡糖和多糖分子的非还原端释放的酶。葡糖淀粉酶由数种丝状真菌和酵母产生，其中来自曲霉属ASPERGILLUS的那些。

14、在商业上最为重要。0008商业上，使用葡糖淀粉酶将已经由部分淀粉酶部分水解的淀粉材料转化为葡萄糖。然后可使用发酵生物将葡萄糖直接或间接转化为发酵产物。商业性发酵产物的实例包括醇例如，乙醇、甲醇、丁醇、1,3丙二醇；有机酸例如柠檬酸、乙酸、衣康酸、乳酸、葡糖酸、葡糖酸盐、乳酸、琥珀酸、2,5二酮D葡糖酸；酮例如丙酮；氨基酸例如谷氨酸；气体例如H2和CO2和更复杂的化合物，包括例如抗生素例如青霉素和四环素；酶；维生素例如核黄素，B12，胡萝卜素；激素，和其他难以合成产生的化合物。发酵工艺亦常用于可饮用的醇类例如啤酒和葡萄酒，乳类产品例如，酸奶和奶酪的产生工业。0009终产物亦可为糖浆。举例而言，终。

15、产物可为葡萄糖，但亦可例如通过葡糖异构酶转化为果糖或基本上由等量葡萄糖和果糖构成的混合物。该混合物，或进一步富集果糖的混合物，是在全世界得到商业化的最常用的高果糖玉米糖浆HFCS。0010本发明的目的是提供具有葡糖淀粉酶活性的多肽和编码所述多肽的多核苷酸，且其在发酵产物产生工艺如醇产生工艺中提供高收率，包括从未糊化的生或未烹制淀粉的一步乙醇发酵工艺。0011UNIPROTB0CVJ1公开了来自双色蜡蘑LACCARIABICOLOR的多肽，而WO2006/069289描述了来自瓣环栓菌TRAMETESCINGULATA的葡糖淀粉酶。发明内容0012鉴定并表征了由真菌粘褶菌属GLOEOPHYLLU。

16、M产生，并具有葡糖淀粉酶活性的说明书CN104169417A2/35页6多肽。更具体而言，所述粘褶菌属菌种选自下组冷杉粘褶菌GABIETINUM、篱边粘褶菌GSEPIARIUM和密粘褶菌GTRABEUM。0013相应地，在第一个方面，本发明涉及具有葡糖淀粉酶活性的分离的多肽，其选自下组A多肽，其包含氨基酸序列，所述氨基酸序列与SEQIDNO2，SEQIDNO4，SEQIDNO6，SEQIDNO8，SEQIDNO10，SEQIDNO12，SEQIDNO14，SEQIDNO16或SEQIDNO18的成熟多肽具有优选至少82，更优选至少83，更优选至少84，更优选至少85，更优选至少86，更优选至少。

17、87，更优选至少88，更优选至少89，更优选至少90，更优选至少91，更优选至少92，甚至更优选至少93，最优选至少94，并且甚至最优选至少95，如至少96，至少97，至少98，至少99或甚至100同一性；B多肽，其包含氨基酸序列，所述氨基酸序列与SEQIDNO2，SEQIDNO4，SEQIDNO6，SEQIDNO8，SEQIDNO10，SEQIDNO12，SEQIDNO14的氨基酸19至474或SEQIDNO16或SEQIDNO18的氨基酸19至471所示的催化域具有优选至少82，更优选至少83，更优选至少84，更优选至少85，更优选至少86，更优选至少87，更优选至少88，更优选至少89，。

18、更优选至少90，更优选至少91，更优选至少92，甚至更优选至少93，最优选至少94，并且甚至最优选至少95，如至少96，至少97，至少98，至少99或甚至100同一性；C多肽，其由多核苷酸编码，所述多核苷酸在优选至少中高严格条件下，并且最优选至少高严格条件下与以下杂交ISEQIDNO1，SEQIDNO3，SEQIDNO5，SEQIDNO7，SEQIDNO9，SEQIDNO11，SEQIDNO13，SEQIDNO15或SEQIDNO17的成熟多肽编码序列，II包含SEQIDNO1，SEQIDNO3，SEQIDNO5，SEQIDNO7，SEQIDNO9，SEQIDNO11，SEQIDNO13，SE。

19、QIDNO15或SEQIDNO17的成熟多肽编码序列的基因组DNA序列，或IIII或II的全长互补链；D多肽，其由多核苷酸编码，所述多核苷酸包含核苷酸序列，所述核苷酸序列与SEQIDNO1，SEQIDNO3，SEQIDNO5，SEQIDNO7，SEQIDNO9，SEQIDNO11，SEQIDNO13，SEQIDNO15或SEQIDNO17的成熟多肽编码序列具有优选至少82，更优选至少83，更优选至少84，更优选至少85，更优选至少86，更优选至少87，更优选至少88，更优选至少89，更优选至少90，更优选至少91，更优选至少92，甚至更优选至少93，最优选至少94，并且甚至最优选至少95，如至。

20、少96，至少97，至少98，至少99或甚至100同一性；和E变体，其包含取代、缺失和/或插入一个或多个几个氨基酸的SEQIDNO2，SEQIDNO4，SEQIDNO6，SEQIDNO8，SEQIDNO10，SEQIDNO12，SEQIDNO14，SEQIDNO16或SEQIDNO18的成熟多肽。0014在第二个方面，本发明涉及分离的多核苷酸，其包含编码第一个方面的多肽的核苷酸序列。0015在进一步的方面，本发明涉及包含第二个方面的多核苷酸的核酸构建体，重组表达载体，重组宿主细胞，转基因植物，植物部分或植物细胞。0016仍在进一步的方面，本发明涉及产生所述多肽的方法，所述多肽的用途，和包含淀粉酶。

21、和所述多肽的组合物。0017定义0018葡糖淀粉酶术语葡糖淀粉酶1,4D葡聚糖葡糖水解酶，EC3213定义为催化D葡萄糖从淀粉或相关的寡糖和多糖分子的非还原端释放的酶。就本发明而言，葡糖淀粉酶活性根据下文“材料和方法”部分描述的步骤来确定。说明书CN104169417A3/35页70019本发明的多肽具有SEQIDNO2或其同源序列，SEQIDNO4或其同源序列，SEQIDNO6或其同源序列，SEQIDNO8或其同源序列，SEQIDNO10或其同源序列，SEQIDNO12或其同源序列，SEQIDNO14或其同源序列，SEQIDNO16或其同源序列，或者SEQIDNO18或其同源序列的成熟多肽的。

22、葡糖淀粉酶活性的至少20，优选至少40，优选至少45，更优选至少50，更优选至少55，更优选至少60，更优选至少65，更优选至少70，更优选至少75，更优选至少80，更优选至少85，甚至更优选至少90，最优选至少95，并且甚至最优选至少100。0020分离的多肽术语“分离的多肽”用于本文中指从来源分离的多肽。在一个优选的方面，如通过SDSPAGE测定的，所述多肽为至少1纯，优选至少5纯，更优选至少10纯，更优选至少20纯，更优选至少40纯，更优选至少60纯，甚至更优选至少80纯，并且最优选至少90纯。0021基本上纯的多肽术语“基本上纯的多肽”在本文表示多肽制备物，所述多肽制备物含有按重量计至。

23、多10，优选至多8，更优选至多6，更优选至多5，更优选至多4，更优选至多3，甚至更优选至多2，最优选至多1，并且甚至最优选至多05的与其天然或重组结合的ASSOCIATED其它多肽材料。因此，优选所述基本上纯的多肽按存在于制备物中的全部多肽材料的重量计是至少92纯，优选至少94纯，更优选至少95纯，更优选至少96纯，更优选至少96纯，更优选至少97纯，更优选至少98纯，甚至更优选至少99纯，最优选至少995纯，并且甚至最优选100纯。本发明的多肽优选是基本上纯的形式，即所述多肽制备物基本上ESSENTIALLY不含与其天然或重组结合的其它多肽材料。例如，这能够通过如下实现通过公知的重组方法或通。

24、过经典纯化方法制备多肽。0022成熟多肽术语“成熟多肽”意指以其在翻译和任何翻译后修饰如N末端加工、C末端截短、糖基化、磷酸化等之后的最终形式存在的多肽。在一个方面，基于预测SEQIDNO2，SEQIDNO4，SEQIDNO6，SEQIDNO8，SEQIDNO10，SEQIDNO12，SEQIDNO14，SEQIDNO16和SEQIDNO18的氨基酸1至17是信号肽的SIGNALP程序NIELSEN等，1997，PROTEINENGINEERING1016，所述成熟多肽是SEQIDNO2，SEQIDNO4，SEQIDNO6，SEQIDNO8，SEQIDNO10，SEQIDNO12，SEQIDN。

25、O14的氨基酸18至573或SEQIDNO16或SEQIDNO18的氨基酸18至576。由SEQIDNO2，SEQIDNO4，SEQIDNO6，SEQIDNO8，SEQIDNO10，SEQIDNO12或SEQIDNO14的氨基酸19至474特别是19至471或者SEQIDNO16或SEQIDNO18的氨基酸19至471限定的序列为催化域。由SEQIDNO2，SEQIDNO4，SEQIDNO6，SEQIDNO8，SEQIDNO10，SEQIDNO12或SEQIDNO14的氨基酸480至573或者SEQIDNO16或SEQIDNO18的氨基酸483至576限定的序列为淀粉结合域。0023成熟多肽编。

26、码序列术语“成熟多肽编码序列”在本文中定义为编码具有葡糖淀粉酶活性的成熟多肽的核苷酸序列。优选地，所述成熟多肽编码序列是SEQIDNO1，SEQIDNO3，SEQIDNO5，SEQIDNO7，SEQIDNO9，SEQIDNO11，SEQIDNO13的核苷酸52至1719，或者SEQIDNO15或SEQIDNO17的核苷酸52至1728。0024同一性两个氨基酸序列之间或两个核苷酸序列之间的相关性由参数“同一性”来描述。0025就本发明而言，两个氨基酸序列之间的同一性程度是使用如EMBOSS程序包说明书CN104169417A4/35页8EMBOSSTHEEUROPEANMOLECULARBIO。

27、LOGYOPENSOFTWARESUITE，RICE等，2000，TRENDSINGENETICS16276277优选版本300或更新的版本的NEEDLE程序中执行的NEEDLEMANWUNSCH算法NEEDLEMAN和WUNSCH，1970，JMOLBIOL48443453来测定的。使用的可选参数是缺口产生罚分为10，缺口延伸罚分为05，和EBLOSUM62BLOSUM62的EMBOSS版本取代矩阵。将标记为“最长同一性”的NEEDLE输出使用NOBRIEF选项获得用作百分比同一性并且是如下计算的0026相同的残基X100/比对的长度比对中的缺口总数0027就本发明而言，两个脱氧核糖核苷酸序。

28、列之间的同一性程度使用如EMBOSS程序包EMBOSSTHEEUROPEANMOLECULARBIOLOGYOPENSOFTWARESUITE，RICE等，2000，见上优选版本300或更新的版本的NEEDLE程序中执行的NEEDLEMANWUNSCH算法NEEDLEMAN和WUNSCH，1970，见上测定。使用的可选参数是缺口产生罚分为10，缺口延伸罚分为05，和EDNAFULLNCBINUC44的EMBOSS版本取代矩阵。将标记为“最长同一性”的NEEDLE输出使用NOBRIEF选项获得用作百分比同一性并且是如下计算的0028相同的脱氧核糖核苷酸X100/比对的长度比对中的缺口总数0029。

29、同源序列术语“同源序列”在本文中定义为与SEQIDNO1，SEQIDNO3，SEQIDNO5，SEQIDNO7，SEQIDNO9，SEQIDNO11，SEQIDNO13，SEQIDNO15或SEQIDNO17的成熟多肽编码部分或SEQIDNO2，SEQIDNO4，SEQIDNO6，SEQIDNO8，SEQIDNO10，SEQIDNO12，SEQIDNO14，SEQIDNO16，或SEQIDNO18的成熟多肽分别具有至少82，优选至少83，更优选至少84，更优选至少85，更优选至少86，更优选至少87，更优选至少88，更优选至少89，更优选至少90，更优选至少91，更优选至少92，甚至更优选至少。

30、93，最优选至少94，并且甚至最优选至少95，如至少96，至少97，至少98或甚至至少99同一性的核苷酸序列/多肽序列。0030多肽片段术语“多肽片段”在本文定义为从SEQIDNO2，SEQIDNO4，SEQIDNO6，SEQIDNO8，SEQIDNO10，SEQIDNO12，SEQIDNO14，SEQIDNO16或SEQIDNO18的成熟多肽或其同源序列的氨基和/或羧基末端缺失了一个或多个几个氨基酸的多肽；其中所述片段具有葡糖淀粉酶活性。优选地，片段含有SEQIDNO2，SEQIDNO4，SEQIDNO6，SEQIDNO8，SEQIDNO10，SEQIDNO12，SEQIDNO14，SEQI。

31、DNO16或SEQIDNO18的成熟多肽或其同源序列的至少500个氨基酸残基，更优选至少450个氨基酸残基，并且最优选至少400个氨基酸。具体的片段为SEQIDNO2，SEQIDNO4，SEQIDNO6，SEQIDNO8，SEQIDNO10，SEQIDNO12或SEQIDNO14的氨基酸19至474或者SEQIDNO16或SEQIDNO18的氨基酸19至471限定的序列，其包含本发明多肽的催化域。0031亚序列术语“亚序列SUBSEQUENCE”在本文中定义为从SEQIDNO1，SEQIDNO3，SEQIDNO5，SEQIDNO7，SEQIDNO9，SEQIDNO11，SEQIDNO13，SE。

32、QIDNO15或SEQIDNO17的成熟多肽编码序列的5和/或3端缺失了一个或多个几个核苷酸的核苷酸序列；或其同源序列；其中所述亚序列编码具有葡糖淀粉酶活性的多肽片段。优选地，亚序列含有SEQIDNO1，SEQIDNO3，SEQIDNO5，SEQIDNO7，SEQIDNO9，SEQIDNO11，SEQIDNO13，SEQIDNO15或SEQIDNO17的成熟多肽编码序列或其同源序列的至少1500个核苷酸，更优选至少1400个核苷酸，并且最优选至少1200个核苷酸。说明书CN104169417A5/35页90032等位变体ALLELICVARIANT术语“等位变体”在本文中表示占据相同染色体基因。

33、座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生，并且可导致种群内的多态性。基因突变可以是沉默的在编码的多肽中无变化或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。0033分离的多核苷酸术语“分离的多核苷酸”用于本文中指从来源分离的多核苷酸。优选地，如通过琼脂糖电泳测定的，所述多核苷酸为至少1纯，优选至少5纯，更优选至少10纯，更优选至少20纯，更优选至少40纯，更优选至少60纯，甚至更优选至少80纯，并且最优选至少90纯。0034基本上纯的多核苷酸术语“基本上纯的多核苷酸”用于本文指多核苷酸制备物，其不含其它外来的或不期望的核苷酸，并且处于适。

34、合于在遗传工程蛋白质生产体系中使用的形式。因此，基本上纯的多核苷酸含有按重量计至多10，优选至多8，更优选至多6，更优选至多5，更优选至多4，更优选至多3，甚至更优选至多2，最优选至多1，并且甚至最优选至多05的与其天然或重组结合的其它多核苷酸材料。然而，基本上纯的多核苷酸可以包括天然存在的5和3非翻译区，如启动子和终止子。优选基本上纯的多核苷酸是按重量计至少90纯，优选至少92纯，更优选至少94纯，更优选至少95纯，更优选至少96纯，更优选至少97纯，甚至更优选至少98纯，最优选至少99，并且甚至最优选至少995纯的。本发明的多核苷酸优选为基本上纯的形式，即所述多核苷酸制备物基本上ESSEN。

35、TIALLY不含与其天然或重组结合的其它多核苷酸材料。所述多核苷酸可以是基因组、CDNA、RNA、半合成、合成来源的，或它们的任何组合。0035编码序列术语“编码序列”在用于本文时意指直接指定其蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界通常由开读框决定，所述开读框通常以ATG起始密码子或可供选择的起始密码子如GTG和TTG开始，并且以终止密码子如TAA、TAG和TGA结束。编码序列可以是DNA、CDNA、合成的或重组的核苷酸序列。0036CDNA术语“CDNA”在本文中定义为能够通过反转录从得自真核细胞的成熟的、已剪接的MRNA分子制备的DNA分子。CDNA缺少通常存在于相应基因组DNA。

36、中的内含子序列。起始的INITIAL、初级的RNA转录物是MRNA的前体，其通过一系列的步骤加工然后作为成熟的已剪接的MRNA出现。这些步骤包括通过称为剪接的过程去除内含子序列。因而源自MRNA的CDNA没有任何内含子序列。0037核酸构建体术语“核酸构建体”用于本文指单链或双链的核酸分子，所述核酸分子分离自天然存在的基因，或将所述核酸分子以本来不存在于NOTOTHERWISEEXIST自然界中的方式修饰以含有核酸的区段或所述核酸分子是合成的。当所述核酸构建体含有表达本发明的编码序列所需的调控序列时，术语核酸构建体与术语“表达盒”同义。0038调控序列CONTROLSEQUENCE术语“调控序。

37、列”在本文定义为包括对编码本发明多肽的多核苷酸表达是必需的所有组分。各个调控序列对于编码所述多肽的核苷酸序列可以是天然的或外源的，或各个调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况，调控序列包括启动子和转录和翻译的终止信号。调控序列可以和目的为引入特异性限制位点的接头一起提供，所述特异性限制位点促进调控序列与编码多肽的核苷酸序列编码区的连接。说明书CN104169417A6/35页100039可操作地连接术语“可操作地连接”在本文表示这样的构型，其中将调控序列置于相对于多核苷酸序列的编码序列的适当位。

38、置，使得调控序列指导多肽编码序列的表达。0040表达术语“表达”包括涉及多肽产生的任何步骤，其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。0041表达载体术语“表达载体”在本文定义为线性的或环状的DNA分子，其包含编码本发明多肽的多核苷酸，并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。0042宿主细胞如本文中所使用的术语“宿主细胞”包括任何细胞类型，所述细胞类型对于使用包含本发明多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的SUSCEPTIBLE。0043修饰术语“修饰”在本文中意指对由SEQIDNO2，SEQIDNO4，SEQIDNO6，SEQIDNO8，S。

39、EQIDNO10，SEQIDNO12，SEQIDNO14，SEQIDNO16或SEQIDNO18的成熟多肽组成的多肽或其同源序列的任何化学修饰，以及对编码这样的多肽的DNA的遗传操作。所述修饰可以是一个或多个几个氨基酸的取代、缺失和/或插入，以及一个或多个几个氨基酸侧链的置换。0044变体当用于本文时，术语“变体”意指具有葡糖淀粉酶活性的多肽包含改变，即在一个或多个几个位置取代、插入和/或缺失一个或多个几个氨基酸残基。取代意指用不同的氨基酸替代占据某位置的氨基酸；缺失指去除占据某位置的氨基酸；而插入意指邻接占据某位置的氨基酸添加13个氨基酸。0045发明详述0046具有葡糖淀粉酶活性的多肽00。

40、47在第一个方面，本发明涉及包含下述氨基酸序列的分离的多肽，所述氨基酸序列与SEQIDNO2，SEQIDNO4，SEQIDNO6，SEQIDNO8，SEQIDNO10，SEQIDNO12，SEQIDNO14，SEQIDNO16或SEQIDNO18的成熟多肽具有优选至少82，更优选至少83，更优选至少84，更优选至少85，更优选至少86，更优选至少87，更优选至少88，更优选至少89，更优选至少90，更优选至少91，更优选至少92，甚至更优选至少93，最优选至少94，并且甚至最优选至少95，如至少96，至少97，至少98，至少99或甚至100同一性的同一性程度，所述多肽具有葡糖淀粉酶活性下文中的。

41、“同源多肽”。优选地，所述同源多肽具有的氨基酸序列与SEQIDNO2，SEQIDNO4，SEQIDNO6，SEQIDNO8，SEQIDNO10，SEQIDNO12，SEQIDNO14，SEQIDNO16或SEQIDNO18的成熟多肽相差十个氨基酸，优选相差五个氨基酸，更优选相差四个氨基酸，甚至更优选相差三个氨基酸，最优选相差两个氨基酸，并且甚至最优选相差一个氨基酸。0048本发明的多肽优选包含SEQIDNO2，SEQIDNO4，SEQIDNO6，SEQIDNO8，SEQIDNO10，SEQIDNO12，SEQIDNO14，SEQIDNO16或SEQIDNO18的氨基酸序列或其等位变体；或它们的。

42、具有葡糖淀粉酶活性的片段。优选地，多肽包含SEQIDNO2，SEQIDNO4，SEQIDNO6，SEQIDNO8，SEQIDNO10，SEQIDNO12，SEQIDNO14，SEQIDNO16或SEQIDNO18的氨基酸序列。在另一优选的方面，多肽包含SEQIDNO2，SEQIDNO4，SEQIDNO6，SEQIDNO8，SEQIDNO10，SEQIDNO12，SEQIDNO14，SEQIDNO16或SEQIDNO18的成熟多肽或其等位变体；或它们的具有葡糖淀粉酶活性的说明书CN104169417A107/35页11片段。在另一优选的方面，多肽由SEQIDNO2，SEQIDNO4，SEQIDN。

43、O6，SEQIDNO8，SEQIDNO10，SEQIDNO12，SEQIDNO14，SEQIDNO16或SEQIDNO18的氨基酸序列或其等位变体，或它们的具有葡糖淀粉酶活性的片段组成。在另一优选的方面，多肽由SEQIDNO2，SEQIDNO4，SEQIDNO6，SEQIDNO8，SEQIDNO10，SEQIDNO12，SEQIDNO14，SEQIDNO16或SEQIDNO18的氨基酸序列组成。0049在第二个方面，本发明涉及具有葡糖淀粉酶活性的分离的多肽，其由多核苷酸编码，所述多核苷酸在优选非常低严格条件、更优选低严格条件、更优选中严格条件、更优选中高严格条件、甚至更优选高严格条件、和最优选。

44、非常高严格条件下与下列杂交ISEQIDNO1，SEQIDNO3，SEQIDNO5，SEQIDNO7，SEQIDNO9，SEQIDNO11，SEQIDNO13，SEQIDNO15或SEQIDNO17的成熟多肽编码序列，II包含SEQIDNO1，SEQIDNO3，SEQIDNO5，SEQIDNO7，SEQIDNO9，SEQIDNO11，SEQIDNO13，SEQIDNO15或SEQIDNO17的成熟多肽编码序列的基因组DNA序列，IIII或II的亚序列，或IVI、II或III的全长互补链JSAMBROOK，EFFRITSCH和TMANIATIS，1989，MOLECULARCLONING，ALAB。

45、ORATORYMANUAL，第2版，COLDSPRINGHARBOR，NEWYORK。SEQIDNO1，SEQIDNO3，SEQIDNO5，SEQIDNO7，SEQIDNO9，SEQIDNO11，SEQIDNO13，SEQIDNO15或SEQIDNO17的成熟多肽编码序列的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外，所述亚序列可以编码具有葡糖淀粉酶活性的多肽片段。优选地，所述互补链是SEQIDNO1，SEQIDNO3，SEQIDNO5，SEQIDNO7，SEQIDNO9，SEQIDNO11，SEQIDNO13，SEQIDNO15或SEQIDNO17。

46、的成熟多肽编码序列的全长互补链。0050SEQIDNO1，SEQIDNO3，SEQIDNO5，SEQIDNO7，SEQIDNO9，SEQIDNO11，SEQIDNO13，SEQIDNO15或SEQIDNO17的核苷酸序列或其亚序列；以及SEQIDNO2，SEQIDNO4，SEQIDNO6，SEQIDNO8，SEQIDNO10，SEQIDNO12，SEQIDNO14，SEQIDNO16或SEQIDNO18的氨基酸序列或其片段，可用于设计核酸探针，以根据本领域内公知的方法从不同属或种的菌株鉴定和克隆编码具有葡糖淀粉酶活性的多肽的DNA。具体而言，可将这些探针用于根据标准的SOUTHERN印迹方法与。

47、感兴趣的属或种的基因组或CDNA杂交，以鉴定并从其中分离相应的基因。这些探针可明显短于完整序列，但长度上应为至少14个，优选至少25个，更优选至少35个，并且最优选至少70个核苷酸。然而，优选所述核酸探针长度上是至少100个核苷酸。例如，所述核酸探针长度上可以是至少200个核苷酸，优选至少300个核苷酸，更优选至少400个核苷酸，或最优选至少500个核苷酸。甚至可以使用更长的探针，例如，长度是优选至少600个核苷酸，更优选至少700个核苷酸，甚至更优选至少800个核苷酸，或最优选至少900个核苷酸的核酸探针。DNA和RNA探针二者均可使用。通常将探针标记以探测相应的基因例如，用33P、32P、。

48、3H、35S、生物素或抗生物素蛋白AVIDIN标记。将这些探针包含于本发明中。0051因而，可从由这些其它菌株制备的基因组DNA或CDNA文库中筛选DNA，所述DNA与上述探针杂交并且编码具有葡糖淀粉酶活性的多肽。可以通过琼脂糖或聚丙烯酰胺凝胶电泳，或通过其它分离技术分离来自这些其它菌株的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素NITROCELLULOSE或其它合适的载体材料并且固定于其上。为了鉴定与SEQIDNO1，SEQIDNO3，SEQIDNO5，SEQIDNO7，SEQIDNO9，说明书CN104169417A118/35页12SEQIDNO11，SEQ。

49、IDNO13，SEQIDNO15或SEQIDNO17或其亚序列同源的克隆或DNA，将所述载体材料优选用在SOUNTHERN印迹中。0052就本发明而言，杂交表示核苷酸序列在非常低至非常高的严格条件下与标记的核酸探针杂交，所述核酸探针对应于SEQIDNO1，SEQIDNO3，SEQIDNO5，SEQIDNO7，SEQIDNO9，SEQIDNO11，SEQIDNO13，SEQIDNO15或SEQIDNO17的成熟多肽编码序列；包含SEQIDNO1，SEQIDNO3，SEQIDNO5，SEQIDNO7，SEQIDNO9，SEQIDNO11，SEQIDNO13，SEQIDNO15或SEQIDNO17的成熟多肽编码序列的基因组DNA序列；其全长互补链；或其亚序列。可使用例如X射线片XRAYLM检测在这些条件下与核酸探针杂交的分子。0053优选地，核酸探针是SEQIDNO1的成熟多肽编码序列。在另一优选的方面，核酸探针是编码SEQIDNO2的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQIDNO1。在另一优选的方面，核酸探针是包含在大肠杆菌ECOLI菌株DSM23222中的质粒中含有的多核苷酸序列，其中所述其多核苷酸序列编码具有葡糖淀粉酶活性的多肽。在另一优选的方面，核酸探针是包含在大肠杆菌DSM23222中的质粒中含有的成熟多肽编码区。

展开阅读全文