具有葡糖淀粉酶活性的多肽和编码该多肽的多核苷酸.pdf

摘要
申请专利号：	CN201080062699.4	申请日：	2010.11.30
公开号：	CN102869771A	公开日：	2013.01.09
当前法律状态：	授权	有效性：	有权
法律详情：	授权\|\|\|实质审查的生效IPC(主分类):C12N 9/34申请日:20101130\|\|\|公开
IPC分类号：	C12N9/34; C12P19/14; C12P7/06	主分类号：	C12N9/34
申请人：	诺维信公司; 诺维信北美公司
发明人：	S.兰德维克; M.D.莫兰特; 綾部圭; G.科沃德-凯利
地址：	丹麦鲍斯韦
优先权：	2009.11.30 US 61/264,977
专利代理机构：	北京市柳沈律师事务所 11105	代理人：	史悦
PDF下载：	PDF下载

内容摘要

本发明涉及具有葡糖淀粉酶活性的分离的多肽和编码所述多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞，以及产生和使用所述多肽的方法。

权利要求书

权利要求书一种具有葡糖淀粉酶活性的分离的多肽，其选自下组：
(a)多肽，其包含氨基酸序列，所述氨基酸序列与SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽具有优选至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，并且甚至最优选至少95%，如至少96%，至少97%，至少98%，至少99%或甚至100%同一性；
(b)多肽，其包含氨基酸序列，所述氨基酸序列与SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的氨基酸22至476所示的催化域具有优选至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，并且甚至最优选至少95%，如至少96%，至少97%，至少98%，至少99%或甚至100%同一性；
(c)多肽，其由多核苷酸编码，所述多核苷酸在优选至少中‑高严格条件下，和最优选至少高严格条件下与以下杂交：(i)SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列，(ii)包含于SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的cDNA序列，或(iii)(i)或(ii)的全长互补链；
(d)多肽，其由多核苷酸编码，所述多核苷酸包含核苷酸序列，所述核苷酸序列与SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列具有优选至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，并且甚至最优选至少95%，如甚至至少96%，97%，98%，99%或100%同一性；和
(e)SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽的包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体。
权利要求1的多肽，其包含SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的氨基酸序列，SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽的氨基酸序列，或它们具有葡糖淀粉酶活性的片段；或由SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的氨基酸序列，SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽的氨基酸序列，或它们具有葡糖淀粉酶活性的片段组成。
权利要求1或2的多肽，其由多核苷酸编码，所述多核苷酸包含SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的核苷酸序列，或它们编码具有葡糖淀粉酶活性的片段的亚序列；或由SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的核苷酸序列，或它们编码具有葡糖淀粉酶活性的片段的亚序列组成。
权利要求1‑3任一项的多肽，其由大肠杆菌DSM 23221中包含的质粒中包含的多核苷酸编码。
权利要求1‑4任一项的多肽，其中所述成熟多肽是SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的氨基酸19至573。
一种具有糖结合活性的分离的多肽，其包含糖结合模块，所述模块与SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的氨基酸479至573所示的糖结合域具有至少80%，更优选至少81%，更优选至少82%，更优选至少83%，更优选至少84%，更优选至少85%，更优选至少86%，更优选至少87%，更优选至少88%,更优选至少89%，更优选至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，并且甚至最优选至少95%，如至少95%，至少97%，至少98%，至少99%或甚至100%同一性。
一种杂合酶，其包含催化域和权利要求6的糖结合域。
权利要求7的杂合酶，其中所述催化域具有选自下组的酶活性：α‑淀粉酶，淀粉支链淀粉酶(amylopullulanase)，β‑淀粉酶，CGT酶，葡糖淀粉酶，异淀粉酶，产麦芽糖淀粉酶和支链淀粉酶。
一种分离的多核苷酸，其包含编码权利要求1‑8任一项的多肽的核苷酸序列。
一种核酸构建体，其包含可操作连接的权利要求9的多核苷酸和指导所述多肽在表达宿主中产生的一种或多种(几种)调控序列。
一种重组表达载体，其包含权利要求10的核酸构建体。
一种重组宿主细胞，其包含权利要求10的核酸构建体。
一种产生权利要求1‑8任一项的多肽的方法，包括：(a)在有助于所述多肽产生的条件下培养包含核酸构建体的宿主细胞，所述核酸构建体包含编码所述多肽的核苷酸序列；和(b)回收所述多肽。
一种产生权利要求1‑8任一项的多肽的方法，包括：(a)在有助于所述多肽产生的条件下培养转基因植物或植物细胞，所述植物或植物细胞包含编码所述多肽的多核苷酸；和(b)回收所述多肽。
一种转基因植物、植物部分或植物细胞，其用编码权利要求1‑8任一项的多肽的多核苷酸转化。
权利要求1‑8任一项的多肽用于产生糖浆和/或发酵产物的用途。
权利要求16的用途，其中所述起始材料为糊化的或未糊化的含淀粉材料。
权利要求1‑8任一项的多肽用于酿造的用途。
一种组合物，其包含α‑淀粉酶和权利要求1‑8任一项的多肽。
一种从含淀粉材料产生发酵产物的方法，包括下述步骤：
(a)液化含淀粉材料；
(b)糖化经液化的材料；和
(c)用发酵生物发酵；
其中步骤(b)使用至少一种权利要求1‑5任一项的葡糖淀粉酶进行。
一种从含淀粉材料产生发酵产物的方法，包括下述步骤：
(a)在含淀粉材料的起始糊化温度以下的温度糖化所述含淀粉材料；和
(b)用发酵生物发酵；
其中步骤(a)使用至少一种权利要求1‑5任一项的葡糖淀粉酶进行。

说明书

说明书具有葡糖淀粉酶活性的多肽和编码该多肽的多核苷酸
涉及序列表
本申请含有计算机可读形式的序列表，所述计算机可读形式通过提述并入本文。
涉及生物材料的保藏
本申请包含对于生物材料保藏的引用，所述保藏通过提述并入本文。对于其完整信息，参见说明书最后一段。
发明背景
发明领域
本发明涉及具有葡糖淀粉酶活性的多肽和编码所述多肽的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞，以及用于产生和使用所述多肽的方法，和本发明的葡糖淀粉酶用于淀粉转化以产生发酵产物如乙醇，和糖浆如葡萄糖的用途。本发明还涉及包含本发明的葡糖淀粉酶的组合物。
相关领域描述
葡糖淀粉酶(1,4‑α‑D‑葡聚糖葡糖水解酶，EC 3.2.1.3)是催化从淀粉或相关的寡糖和多糖分子的非还原端释放D‑葡萄糖的酶。葡糖淀粉酶由几种丝状真菌和酵母产生，其中来自曲霉属(Aspergillus)的那些在商业上最为重要。
商业上，使用葡糖淀粉酶将已经由α‑淀粉酶部分水解的淀粉材料转化为葡萄糖。然后可使用发酵生物将葡萄糖直接或间接地转化为发酵产物。商业性发酵产物的实例包括醇(例如乙醇，甲醇，丁醇，1,3‑丙二醇)，有机酸(例如柠檬酸，乙酸，衣康酸，乳酸，葡糖酸，葡糖酸盐，乳酸，琥珀酸，2,5‑二酮‑D‑葡糖酸)；酮(例如丙酮)；氨基酸(例如谷氨酸)；气体(例如H2和CO2)，和更复杂的化合物，包括例如抗生素(例如青霉素和四环素)；酶；维生素(例如核黄素，B12，β‑胡萝卜素)；激素，和其他难以合成产生的化合物。发酵工艺亦常用于可饮用醇类(例如啤酒和葡萄酒)工业。
终产物亦可为糖浆。例如，终产物可为葡萄糖，但亦可例如由葡萄糖异构酶转化为果糖或由几乎等量的葡萄糖和果糖构成的混合物。该混合物，或进一步富集果糖的混合物，是整个世界商业化的最常用的高果糖玉米糖浆(HFCS)。
本发明的一个目的是提供具有葡糖淀粉酶活性的多肽和编码所述多肽的多核苷酸，其在发酵产物生产工艺(如乙醇生产工艺，包括由未糊化的生(或未烹制)淀粉的一步乙醇发酵工艺)中提供高产率/得率(yield)。
Uniprot:B0CVJ1公开了来自双色蜡蘑(Laccaria bicolor)的多肽且WO2006/069289描述了来自瓣环栓菌(Trametes cingulata)的葡糖淀粉酶。
发明概述
已鉴定并表征了由真菌血红密孔菌(Pycnoporus sanguineus)产生并具有葡糖淀粉酶活性的多肽。
相应地，本发明在第一个方面涉及具有葡糖淀粉酶活性的分离的多肽，选自下组：(a)多肽，其包含氨基酸序列，所述氨基酸序列与SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽具有优选至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，并且甚至最优选至少95%，如至少96%，至少97%，至少98%，至少99%或甚至100%同一性；(b)多肽，其包含氨基酸序列，所述氨基酸序列与SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的氨基酸22至476所示的催化域具有优选至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，并且甚至最优选至少95%，如至少96%，至少97%，至少98%，至少99%或甚至100%同一性；(c)多肽，其由多核苷酸编码，所述多核苷酸在优选至少中‑高严格条件下，并且最优选在高严格条件下与以下杂交：(i)SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列；(ii)包含于SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5中的cDNA序列，或(iii)(i)或(ii)的全长互补链；(d)多肽，其由多核苷酸编码，所述多核苷酸包含核苷酸序列，所述核苷酸序列与SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列具有优选至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，并且甚至最优选至少95%，如至少96%，至少97%，至少98%，至少99%或甚至100%同一性；和(e)SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽的包含一个或多个(几个)氨基酸的取代、缺失和/或插入变体。
本发明在第二个方面涉及分离的多核苷酸，其包含编码第一个方面的多肽的核苷酸序列。
在进一步的方面，本发明涉及包含第二个方面的多核苷酸的核酸构建体，重组表达载体，重组宿主细胞，转基因植物、植物部分或植物细胞。
在又进一步的方面，本发明涉及产生所述多肽的方法，所述多肽的用途，和包含α‑淀粉酶和所述多肽的组合物。
定义
葡糖淀粉酶：术语葡糖淀粉酶(1,4‑α‑D‑葡聚糖葡糖水解酶，3.2.1.3)定义为催化从淀粉或相关的寡糖和多糖分子的非还原端释放D‑葡萄糖的酶。就本发明而言，葡糖淀粉酶活性根据下文“材料和方法”部分描述的步骤确定。
本发明的多肽具有SEQ ID NO:2的成熟多肽或其同源序列，或者SEQ ID NO:4的成熟多肽或其同源序列，或者SEQ ID NO:6的成熟多肽或其同源序列的葡糖淀粉酶活性的至少20%，优选至少40%，优选至少45%，更优选至少50%，优选至少55%，更优选至少60%，优选至少65%，更优选至少70%，优选至少75%，更优选至少80%，优选至少85%，甚至更优选至少90%，最优选至少95%，和甚至最优选至少100%。
分离的多肽：术语“分离的多肽”用于本文中指从来源分离的多肽。优选地，所述多肽如通过SDS‑PAGE测定的，为至少1%纯，优选至少5%纯，更优选至少10%纯，更优选至少20%纯，更优选至少40%纯，更优选至少60%纯，甚至更优选至少80%纯，并且最优选至少90%纯。
基本上纯的多肽：术语“基本上纯的多肽”在本文表示多肽制备物，所述多肽制备物含有按重量计至多10%，优选至多8%，更优选至多6%，更优选至多5%，更优选至多4%，更优选至多3%，甚至更优选至多2%，最优选至多1%，并且甚至最优选至多0.5%的与其天然或重组结合的(associated)的其它多肽材料。因此，优选所述基本上纯的多肽是按存在于制备物中的全部多肽材料的重量计至少92%纯，优选至少94%纯，更优选至少95%纯，更优选至少96%纯，更优选至少96%纯，更优选至少97%纯，更优选至少98%纯，甚至更优选至少99%纯，最优选至少99.5%纯，并且甚至最优选100%纯。本发明的多肽优选是基本上纯的形式，即，所述多肽制备物基本上(essentially)不含与其天然或重组结合的其它多肽材料。例如，这能够通过以下实现：通过公知的重组方法或由经典纯化方法制备多肽。
成熟多肽：术语“成熟多肽”意指为以其在翻译和任何翻译后修饰之后的最终形式存在的多肽，所述修饰如N‑末端加工、C‑末端截短、糖基化、磷酸化等。在一个方面，基于预测SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的氨基酸1至18是信号肽的SignalP程序(Nielsen等,1997,Protein Engineering10:1‑6)，所述成熟多肽是SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的氨基酸19至573。优选地，所述成熟多肽是SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的氨基酸19至573。由SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的氨基酸22至476定义的序列是催化域，而由SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的氨基酸479至573定义的序列是淀粉结合域。
成熟多肽编码序列：术语“成熟多肽编码序列”在本文中定义为编码具有葡糖淀粉酶活性的成熟多肽的核苷酸序列。优选地，所述成熟多肽编码序列是由SEQ ID NO:1的位置55至159，229至505，573至877，932至1207，1269至1731，1800至1895，1962至2104，SEQ ID NO:3或SEQ ID NO:5的位置55至159，229至504，571至876，942至1217，1276至1738，1806至1901，1960至2102定义的核苷酸。
同一性：参数“同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。
就本发明而言，两个氨基酸序列之间的同一性程度使用如EMBOSS软件包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等,2000,Trends in Genetics 16:276‑277)(优选3.0.0版或更高版本)的Needle程序中所执行的Needleman‑Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443‑453)来测定。使用的可选参数为缺口开启罚分(gap open penalty)10，缺口延伸罚分(gap extension penalty)0.5和EBLOSUM62(BLOSUM62的EMBOSS版)取代矩阵。使用Needle标记为“最长同一性(longest identity)”的输出结果(使用‑nobrief选项获得)作为百分比同一性，并计算如下：
(同样的残基×100)/(比对长度‑比对中缺口的总数)
就本发明而言，两个脱氧核糖核苷酸序列之间的同一性程度使用如EMBOSS软件包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等,2000,见上文)(优选3.0.0版或更高版本)的Needle程序中所执行的Needleman‑Wunsch算法(Needleman和Wunsch,1970,见上文)来测定。使用的可选参数为缺口开启罚分10，缺口延伸罚分0.5和EDNAFULL(NCBI NUC4.4的EMBOSS版)取代矩阵。使用Needle标记为“最长同一性”的输出结果(使用‑nobrief选项获得)作为百分比同一性，并计算如下：
(同样的脱氧核糖核苷酸×100)/(比对长度－比对中缺口的总数)
同源序列：术语“同源序列”在本文中定义为分别与SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码部分，或者与SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽具有至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，和甚至最优选至少95%，如至少96%，至少97%，至少98%，或甚至至少99%同一性程度的核苷酸序列/多肽序列。
多肽片段：术语“多肽片段”在本文中定义为从SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽或其同源序列的氨基和/或羧基末端缺失一个或多个(几个)氨基酸的多肽；其中所述片段具有葡糖淀粉酶活性。优选地，片段含有SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽或其同源序列的至少500个氨基酸残基，更优选至少450个氨基酸残基，和最优选至少400个氨基酸残基。具体片段是由SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的的氨基酸22至476定义的序列，其包含本发明的多肽的催化域。
亚序列：术语“亚序列(subsequence)”在本文中定义为从SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列或其同源序列的5’和/或3’端缺失一个或多个(几个)核苷酸的核苷酸序列；其中所述亚序列编码具有葡糖淀粉酶活性的多肽片段。优选地，亚序列含有SEQ ID NO:1的成熟多肽编码序列、SEQ ID NO:3的成熟多肽编码序列或SEQ ID NO:5的成熟多肽编码序列或其同源序列的至少1500个核苷酸，更优选至少1400个核苷酸，和最优选至少1200个核苷酸。
等位变体(allelic variant)：术语“等位变体”在本文中表示占据相同染色体基因座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生，并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。
分离的多核苷酸：术语“分离的多核苷酸”用于本文中指从来源分离的多核苷酸。优选地，多核苷酸如通过琼脂糖电泳测定的，为至少1%纯，优选至少5%纯，更优选至少10%纯，更优选至少20%纯，更优选至少40%纯，更优选至少60%纯，甚至更优选至少80%纯，并且最优选至少90%纯。
基本上纯的多核苷酸：术语“基本上纯的多核苷酸”用于本文指不含其它外来的或不期望的核苷酸的多核苷酸制备物，并且所述多核苷酸制备物处于适合于在遗传工程的蛋白质生产体系中使用的形式。因此，基本上纯的多核苷酸含有按重量计至多10%，优选至多8%，更优选至多6%，更优选至多5%，更优选至多4%，更优选至多3%，甚至更优选至多2%，最优选至多1%，并且甚至最优选至多0.5%的与其天然或重组结合的其它多核苷酸材料。然而，基本上纯的多核苷酸可以包括天然存在的5’和3’非翻译区，例如启动子和终止子。优选基本上纯的多核苷酸是按重量计至少90%纯，优选至少92%纯，更优选至少94%纯，更优选至少95%纯，更优选至少96%纯，更优选至少97%纯，甚至更优选至少98%纯，最优选至少99%，并且甚至最优选至少99.5%纯的。本发明所述多核苷酸优选为基本上纯的形式，即，所述多核苷酸制备物基本上不含与其天然或重组结合的其它多核苷酸材料。所述多核苷酸可以是基因组、cDNA、RNA、半合成、合成来源的，或它们的任何组合。
编码序列：当用于本文时术语“编码序列”的意思是直接指定其蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界通常由开读框决定，所述开读框通常以ATG起始密码子或可供选择的起始密码子例如GTG和TTG开始，并且以终止密码子例如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA、合成的或重组的核苷酸序列。
cDNA：术语“cDNA”在本文中定义为可通过逆转录从自真核细胞获得的成熟的、剪接的mRNA分子制备的DNA分子。cDNA缺乏通常存在于相应的基因组DNA中的内含子序列。该起始的、初级的RNA转录物是mRNA的前体，其经历一系列步骤，最后作为成熟的、剪接的mRNA出现。这些步骤包括通过称作剪接的过程去除内含子序列。因此，来源于mRNA的cDNA不含任何内含子序列。
核酸构建体：术语“核酸构建体”用于本文指单链或双链的核酸分子，所述核酸分子分离自天然存在的基因，或将所述核酸分子以本来不存在于(not otherwise exist)自然界中的方式修饰以含有核酸的区段，或所述核酸分子是合成的。当所述核酸构建体含有表达本发明的编码序列所需的调控序列时，术语核酸构建体与术语“表达盒”同义。
调控序列(control sequence)：术语“调控序列”在本文定义为包括对编码本发明多肽的多核苷酸表达是必需的所有成分。各个调控序列对于编码所述多肽的核苷酸序列可以是天然的或外源的，或各个调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况，调控序列包括启动子和转录和翻译的终止信号。调控序列可以和用于引入特异性限制位点的接头一起提供，所述特异性限制位点促进调控序列与编码多肽的核苷酸序列编码区的连接。
可操作地连接：术语“可操作地连接”在本文表示这样的构型，其中将调控序列置于相对于多核苷酸序列的编码序列的适当位置，使得调控序列指导多肽编码序列的表达。
表达：术语“表达”包括涉及多肽产生的任何步骤，其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
表达载体：术语“表达载体”在本文定义为线性的或环状的DNA分子，其包含编码本发明多肽的多核苷酸，并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。
宿主细胞：如本文中所使用的术语“宿主细胞”包括任何细胞类型，所述细胞类型对于使用包含本发明多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的(susceptible)。
修饰：术语“修饰”在本文的意思是，对分别由SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽或其同源序列组成的多肽的任何化学修饰，以及对编码所述多肽的DNA的遗传操作。所述修饰可以是一个或多个(几个)氨基酸的取代、缺失和/或插入，以及一个或多个(几个)氨基酸侧链的置换。
变体：当用于本文，术语“变体”意指具有葡糖淀粉酶活性的多肽，其在一个或多个(几个)位置包含改变，即一个或多个(几个)氨基酸残基的取代、插入和/或缺失。取代意指用不同的氨基酸取代占据某位置的氨基酸；缺失意指去除占据某位置的氨基酸；而插入意指邻接占据某位置的氨基酸添加1‑3个氨基酸。
发明详述
具有葡糖淀粉酶活性的多肽
在第一个方面，本发明涉及具有葡糖淀粉酶活性的分离的多肽(在下文中称为“同源多肽”)，所述多肽包含氨基酸序列，所述氨基酸序列与SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽具有优选至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，并且甚至最优选至少95%，如至少96%，至少97%，至少98%，至少99%或甚至100%的同一性程度。优选地，所述同源多肽具有氨基酸序列，所述氨基酸序列与SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽相差十个氨基酸，优选相差五个氨基酸，更优选相差四个氨基酸，甚至更优选相差三个氨基酸，最优选相差两个氨基酸，并且甚至最优选相差一个氨基酸。
本发明的多肽优选包含SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的氨基酸序列或其等位变体，或其具有葡糖淀粉酶活性的片段。在另一个优选的方面，所述多肽包含SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽或其等位变体，或其具有葡糖淀粉酶活性的片段。在另一个优选的方面，所述多肽由SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的氨基酸序列或其等位变体，或其具有葡糖淀粉酶活性的片段组成。
在第二个方面，本发明涉及具有葡糖淀粉酶活性的分离的多肽，其由多核苷酸编码，所述多核苷酸在优选非常低严格条件，更优选低严格条件，更优选中等严格条件，更优选中等‑高严格条件，甚至更优选高严格条件，和最优选优选非常高严格条件下与以下杂交：(i)SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列；(ii)包含于SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的cDNA序列，(iii)(i)或(ii)的亚序列；或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook，E.F.Fritsch,和T.Maniatis,1989,Molecular Cloning，A Laboratory Manual,第2版,Cold Spring Harbor，New York)。SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸，或优选至少200个连续的核苷酸。而且，所述亚序列可编码具有葡糖淀粉酶活性的多肽片段。优选地，所述互补链是SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列的全长互补链。
SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的核苷酸序列，或其亚序列，以及SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的氨基酸序列，或其片段，可用于设计核酸探针，以根据本领域内公知的方法从不同属或种的菌株鉴定和克隆编码具有葡糖淀粉酶活性的多肽的DNA。具体而言，根据标准的Southern印迹方法，可将这些探针用于与感兴趣的属或种的基因组或cDNA杂交，以鉴定和分离其中相应的基因。这些探针可明显短于完整序列，但长度上应为至少14，优选至少25，更优选至少35，并且最优选至少70个核苷酸。然而，优选所述核酸探针是至少100个核苷酸长度。例如，所述核酸探针的长度可为至少200个核苷酸，优选至少300个核苷酸，更优选至少400个核苷酸，或最优选至少500个核苷酸。可使用甚至更长的探针，例如长度为优选至少600个核苷酸，更优选至少700个核苷酸，甚至更优选至少800个核苷酸，或最优选至少900个氨基酸的核酸探针。DNA和RNA探针二者均可使用。通常将探针标记以探测相应的基因(例如，用33P、32P、3H、35S、生物素或抗生物素蛋白(avidin)标记)。这些探针涵盖于本发明中。
因而，可从由这些其它菌株制备的基因组DNA或cDNA文库中筛选DNA，所述DNA与上述探针杂交并且编码具有葡糖淀粉酶活性的多肽。可以通过琼脂糖或聚丙烯酰胺凝胶电泳，或通过其它分离技术分离来自这些其它菌株的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至并且固定于硝化纤维素(nitrocellulose)或其它合适的载体材料。为了鉴定与SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5，或其亚序列同源的克隆或DNA，将所述载体材料优选用于Sounthern印迹中。
就本发明而言，杂交表示核苷酸序列在非常低至非常高的严格条件下与标记的核酸探针杂交，所述核酸探针对应于SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列；包含于SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的cDNA序列；其全长互补链；或它们的亚序列。可使用例如X射线片(X‑ray film)检测在这些条件下与核酸探针杂交的分子。
优选地，核酸探针是SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列。
在另一个优选的方面，核酸探针是编码SEQ ID NO:2的多肽的多核苷酸序列，或其亚序列。在另一个优选的方面，核酸探针是SEQ ID NO:1。在另一个优选的方面，核酸探针是大肠杆菌菌株DSM 23221中的质粒中包含的多核苷酸序列，其中其多核苷酸序列编码具有葡糖淀粉酶活性的多肽。在另一个优选的方面，核酸探针是大肠杆菌菌株DSM 23221中的质粒中包含的成熟多肽编码区。
在另一个优选的方面，核酸探针是SEQ ID NO:3的成熟多肽编码序列。在另一个优选的方面，核酸探针是编码SEQ ID NO:4的多肽的多核苷酸序列，或其亚序列。在另一个优选的方面，核酸探针是SEQ ID NO:3。
在另一个优选的方面，核酸探针是SEQ ID NO:5的成熟多肽编码序列。在另一个优选的方面，核酸探针是编码SEQ ID NO:6的多肽的多核苷酸序列，或其亚序列。在另一个优选的方面，核酸探针是SEQ ID NO:5。
对于长度至少100个核苷酸的长探针，非常低至非常高的严格条件定义为在42℃，在5X SSPE、0.3%SDS、200μg/ml已剪切并且变性的鲑精DNA中，以及对于非常低和低严格性为25%的甲酰胺，对于中等和中‑高严格性为35%的甲酰胺，或对于高和非常高严格性为50%的甲酰胺，根据标准的Southern印迹步骤进行预杂交和杂交最佳12至24小时。
对于长度为至少100个核苷酸的长探针，使用2X SSC、0.2%SDS优选在45℃(非常低严格性)，更优选在50℃(低严格性)，更优选在55℃(中等严格性)，更优选在60℃(中等‑高严格性)，甚至更优选在65℃(高严格性)，并且最优选在70℃(非常高严格性)将载体材料最终洗涤三次，每次15分钟。
对于长度大约15个核苷酸至大约70个核苷酸的短探针，将严格条件定义为在比使用根据Bolton和McCarthy的计算法(1962,Proceedings of the National Academy of Sciences USA 48:1390)计算的Tm低大约5℃至大约10℃，在0.9M NaCl，0.09M Tris‑HCl pH 7.6，6mM EDTA，0.5%NP‑40，1×Denhardt溶液，1mM焦磷酸钠(sodium pyrophosphate)，1mM磷酸二氢钠(sodium monobasic phosphate)，0.1mM ATP和0.2mg每ml的酵母RNA中，根据标准的Southern印迹步骤进行预杂交、杂交和杂交后洗涤最佳12至24小时。
对于长度大约15个核苷酸至大约70个核苷酸的短探针，将所述载体材料在6×SSC加0.1%SDS中洗涤一次15分钟，并用6×SSC在比计算的Tm低5℃至10℃的温度洗涤两次，每次15分钟。
在第三个方面，本发明涉及由多核苷酸编码的具有葡糖淀粉酶活性的分离的多肽，所述多核苷酸包含核苷酸序列或由核苷酸序列组成，所述核苷酸序列与SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列具有至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，最优选至少95%，和甚至最优选至少96%，97%，98%，或99%的同一性程度，并编码活性多肽。参见下文多核苷酸部分。
本发明还涉及SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽或其同源序列的包含取代、缺失和/或插入一个或多个(几个)氨基酸的人工变体。优选地，氨基酸改变对性质是较不重要的(of a minor nature)，即保守的氨基酸取代或插入，其不显著影响蛋白质的折叠和/或活性；小缺失，通常为1至大约30个氨基酸的小缺失；小的氨基或羧基末端延伸，如氨基末端甲硫氨酸残基；多至大约20‑25个残基的小接头肽；或通过改变净电荷或其它功能来促进纯化的小延伸，如多组氨酸序列(poly histidine tract)、抗原表位(antigenic epitope)或结合域(binding domain)。
保守取代的实例是在以下组之内：碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specific activity)的氨基酸取代是本领域已知的，并且例如由H.Neurath和R.L.Hill,1979,于The Proteins,Academic Press,New York中描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。
除了用20个标准氨基酸，也可用非标准氨基酸(例如4‑羟脯氨酸、6‑N‑甲基赖氨酸、2‑氨基异丁酸、异缬氨酸和α‑甲基丝氨酸)取代野生型多肽中的氨基酸残基。有限数量的非保守氨基酸、不由遗传密码编码的氨基酸和非天然氨基酸可以取代氨基酸残基。“非天然氨基酸”在蛋白质合成后已经过修饰，和/或在它们的侧链具有不同于基本氨基酸的化学结构。非天然氨基酸能够以化学方法合成，并且优选是商业上能够获得的，包括六氢吡啶羧酸(pipecolic acid)、噻唑烷羧酸(thiazolidine carboxylic acid)、脱氢脯氨酸、3‑和4‑甲基脯氨酸，和3,3‑二甲基脯氨酸。
或者，氨基酸变化可为这样的性质，其使得所述多肽的物理化学性质改变。例如，氨基酸变化可改善多肽的热稳定性，改善其底物特异性，改变最适pH等。
能够根据本领域已知的方法，例如定位诱变或丙氨酸分区诱变法(Cunningham和Wells,1989,Science 244:1081‑1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中，将单一丙氨酸突变引入到分子中的每个残基，并且测试所得突变分子的葡糖淀粉酶活性以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等,1996,J.Biol.Chem.271:4699‑4708。酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而确定，如通过以下这些技术：如核磁共振、晶体学、电子衍射或光亲和标记，连同推定的接触位点氨基酸的突变来确定。参见例如de Vos等,1992,Science 255:306‑312；Smith等,1992,J.Mol.Biol.224:899‑904；Wlodaver等,1992,FEBS Lett.309:59‑64。必需氨基酸的身份(identity)也能够从与多肽的同一性分析来推断，所述多肽与根据本发明的多肽相关。
能够使用已知的诱变、重组和/或改组(shuffling)方法，然后是有关的筛选方法，例如那些由Reidhaar‑Olson和Sauer,1988,Science 241:53‑57；Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA 86:2152‑2156；WO 95/17413；或WO95/22625公开的那些方法来进行并测试单个或多个氨基酸取代、缺失和/或插入。能够使用的其它方法包括易错PCR、噬菌体展示(例如，Lowman等,1991,Biochem.30:10832‑10837；美国专利No.5,223,409；WO 92/06204)和区域定向的诱变(Derbyshire等,1986,Gene 46:145；Ner等,1988,DNA 7:127)。
诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等,1999,Nature Biotechnology 17:893‑896)。能够从宿主细胞回收编码活性多肽的诱变的DNA分子，并且使用本领域内标准方法快速测序。这些方法允许快速确定感兴趣的多肽中单个氨基酸残基的重要性，并且能够应用于未知结构的多肽。
成熟多肽，如SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的氨基酸19至573，或者催化域，如SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的氨基酸22至476的氨基酸取代、缺失和/或插入的总数是10，优选9，更优选8，更优选7，更优选至多6，更优选5，更优选4，甚至更优选3，最优选2，并且甚至最优选1。
具有葡糖淀粉酶活性的多肽的来源
本发明的多肽可以获得自任何属的微生物。就本发明而言，用于本文与给定的来源有关的术语“获得自”意思是核苷酸序列编码的多肽由所述来源产生，或由其中插入了来自所述来源的核苷酸序列的菌株产生。优选地，获得自给定来源的多肽是胞外分泌的。
本发明的具有葡糖淀粉酶活性的多肽亦可为具有葡糖淀粉酶活性的细菌多肽，酵母多肽，或更优选丝状真菌多肽如枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、密瑚菌属(Artomyces)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、Botryospaeria、拟蜡菌属(Ceriporiopsis)、Chaetomidium、金孢子菌属(Chrysosporium)、Claviceps、Cochliobolus、鬼伞属(Coprinopsis)、Coptotermes、棒囊壳属(Corynascus)、隐丛赤壳属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、Filibasidium、镰孢属(Fusarium)、赤霉属(Gibberella)、粘褶菌属(Gloeophyllum)、全鞭毛虫属(Holomastigotoides)、腐质霉属(Humicola)、耙齿菌属(Irpex)、蘑菇属(Lentinula)、Leptospaeria、梨孢菌属(Magnaporthe)、Melanocarpus、多孔菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、Pseudotrichonympha、密孔菌属(Pycnoporus)、根毛霉属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱顶孢属(Scytalidium)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、包脚菇属(Volvariella)或炭角菌属(Xylaria)多肽。
在一个更优选的方面，所述多肽是具有葡糖淀粉酶活性的密孔菌属菌种多肽。具体而言所述密孔菌属菌种是血红密孔菌。
可理解的是对于前述的种，本发明包含完全和不完全阶段(perfect and imperfect states)，和其它分类学的等同物(equivalent)，例如无性型(anamorph)，而无论它们已知的种名。本领域熟练技术人员将容易地识别适合的等同物的身份(identity)。
这些种的菌株在许多培养物保藏中心对于公众能够容易地取得，所述保藏中心诸如美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH)(DSM)、真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)和农业研究机构专利培养物保藏中心北区研究中心(Agricultural Research Service Patent Culture Collection,Northern Regional Research Center)(NRRL)。
此外，可以使用上述的探针从其它来源，包括从自然界(例如，土壤、堆肥、水等)分离的微生物鉴定和获得这些多肽。用于从天然生境(habitat)分离微生物的技术是本领域内公知的。随后可通过相似地筛选这种微生物的基因组或cDNA文库来获得所述多核苷酸。一旦用所述探针检测到编码多肽的多核苷酸序列，就能够通过使用本领域普通技术人员熟知的技术将所述多核苷酸分离或克隆(参见，例如，Sambrook等,1989,见上文)。
本发明的多肽还包括融合多肽或可切割的融合多肽，其中将另外的多肽融合到所述多肽或其片段的N末端或C末端。通过将编码另一个多肽的核苷酸序列(或其部分)融合于本发明的核苷酸序列(或其部分)来产生融合的多肽。产生融合多肽的技术是本领域已知的，并包括连接编码多肽的编码序列以使它们符合读框(in frame)，并且使融合多肽的表达在相同启动子和终止子的控制下。
融合多肽还可以包括切割位点。一旦分泌了融合蛋白，就切割所述位点，从融合蛋白质释放具有葡糖淀粉酶活性的多肽。切割位点的实例包括，但不限于，编码二肽Lys‑Arg的Kex2位点(Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568‑76;Svetina等,2000,J.Biotechnol.76:245‑251;Rasmussen‑Wilson等,1997,Appl.Environ.Microbiol.63:3488‑3493;Ward等,1995,Biotechnology 13:498‑503;和Contreras等,1991,Biotechnology 9:378‑381)；Ile‑(Glu或Asp)‑Gly‑Arg位点，其在精氨酸残基后通过Factor Xa蛋白酶切割(Eaton等,1986,Biochem.25:505‑512)；Asp‑Asp‑Asp‑Asp‑Lys位点，其在赖氨酸后通过肠激酶切割(Collins‑Racie等,1995,Biotechnology 13:982‑987)；His‑Tyr‑Glu位点或His‑Tyr‑Asp位点，其通过Genenase I切割(Carter等,1989,Proteins:Structure,Function,and Genetics 6:240‑248)；Leu‑Val‑Pro‑Arg‑Gly‑Ser位点，其在Arg后通过凝血酶切割(Stevens,2003,Drug Discovery World 4:35‑48)；Glu‑Asn‑Leu‑Tyr‑Phe‑Gln‑Gly位点，其在Gln后通过TEV蛋白酶切割(Stevens,2003，见上文)；和Leu‑Glu‑Val‑Leu‑Phe‑Gln‑Gly‑Pro位点，其在Gln后通过基因工程形式的人鼻病毒3C蛋白酶切割(Stevens,2003,见上文)。
多核苷酸
本发明还涉及分离的多核苷酸，其包含编码本发明具有葡糖淀粉酶活性的多肽的核苷酸序列或由所述核苷酸序列组成。
优选地，所述核苷酸序列包含SEQ ID NO:1或由SEQ ID NO:1组成。在另一个更优选的方面，所述核苷酸序列包含大肠杆菌DSM 23221中包含的质粒中包含的序列或由所述序列组成。在另一个优选的方面，所述核苷酸序列包含SEQ ID NO:1的成熟多肽编码序列或由SEQ ID NO:1的成熟多肽编码序列组成。在另一个更优选的方面，所述核苷酸序列包含大肠杆菌DSM 23221中包含的质粒中包含的成熟多肽编码序列或由所述成熟多肽编码序列组成。
本发明还涵盖编码下述多肽的核苷酸序列，所述多肽包含SEQ ID NO:2的氨基酸序列或其成熟多肽或由SEQ ID NO:2的氨基酸序列或其成熟多肽组成，所述核苷酸序列由于遗传密码的简并性与SEQ ID NO:1或其成熟多肽编码序列有差异。本发明还涉及SEQ ID NO:1的亚序列，其编码SEQ ID NO:2的具有葡糖淀粉酶活性的片段。
本发明还涉及突变多核苷酸，所述突变多核苷酸在SEQ ID NO:1的成熟多肽编码序列中包含至少一个突变或由在SEQ ID NO:1的成熟多肽编码序列中具有至少一个突变的序列组成，其中所述突变核苷酸序列编码SEQ ID NO:2的成熟多肽。
优选地，所述核苷酸序列包含SEQ ID NO:3或由SEQ ID NO:3组成。在另一个优选的方面，所述核苷酸序列包含SEQ ID NO:3的成熟多肽编码序列或由SEQ ID NO:3的成熟多肽编码序列组成。本发明还涵盖编码下述多肽的核苷酸序列，所述多肽包含SEQ ID NO:4的氨基酸序列或其成熟多肽或由SEQ ID NO:4的氨基酸序列或其成熟多肽组成，所述核苷酸序列由于遗传密码的简并性与SEQ ID NO:3或其成熟多肽编码序列有差异。本发明还涉及SEQ ID NO:3的亚序列，其编码SEQ ID NO:4的具有葡糖淀粉酶活性的片段。
本发明还涉及突变多核苷酸，所述突变多核苷酸在SEQ ID NO:3的成熟多肽编码序列中包含至少一个突变或由在SEQ ID NO:3的成熟多肽编码序列中具有至少一个突变的序列组成，其中所述突变核苷酸序列编码SEQ ID NO:4的成熟多肽。
优选地，所述核苷酸序列包含SEQ ID NO:5或由SEQ ID NO:5组成。在另一个优选的方面，所述核苷酸序列包含SEQ ID NO:5的成熟多肽编码序列或由SEQ ID NO:5的成熟多肽编码序列组成。本发明还涵盖编码下述多肽的核苷酸序列，所述多肽包含SEQ ID NO:6的氨基酸序列或其成熟多肽或由SEQ ID NO:6的氨基酸序列或其成熟多肽组成，所述核苷酸序列由于遗传密码的简并性与SEQ ID NO:5或其成熟多肽编码序列有差异。本发明还涉及SEQ ID NO:5的亚序列，其编码SEQ ID NO:6的具有葡糖淀粉酶活性的片段。
本发明还涉及突变多核苷酸，所述突变多核苷酸在SEQ ID NO:5的成熟多肽编码序列中包含至少一个突变或由在SEQ ID NO:5的成熟多肽编码序列中具有至少一个突变的序列组成，其中所述突变核苷酸序列编码SEQ ID NO:6的成熟多肽。
用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的，包括从基因组DNA分离，从cDNA制备，或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共有结构特性的克隆DNA片段，从而实现从这种基因组DNA克隆本发明的多核苷酸。参见，例如，Innis等,1990,PCR:A Guide to Methods and Application,Academic Press,New York。可以使用其它核酸扩增方法，如连接酶链式反应(LCR)、连接活化转录(ligated activated transcription；LAT)和基于核苷酸序列的扩增(NASBA)。可以从青霉属菌株，或其它或相关生物体克隆多核苷酸，并且因此例如可为所述核苷酸序列的多肽编码区的等位基因变体或种变体(species variant)。
本发明还涉及包含下述核苷酸序列或由下述核苷酸序列组成的分离的多核苷酸，所述核苷酸序列分别与SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列具有优选至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，和甚至最优选至少95%，如至少96%，至少97%，至少98%，至少99%同一性的同一性程度，并编码活性多肽。
修饰编码本发明多肽的核苷酸序列对于合成与所述多肽基本上相似的多肽可为必需的。术语与所述多肽“基本上相似”指多肽的非天然存在的形式。这些多肽可能以一些工程改造的方式而不同于从其天然来源分离的多肽，例如，比活性、热稳定性、最适pH等方面不同的人工变体。可以在作为SEQ ID NO:1的成熟多肽编码序列存在的核苷酸序列，例如其亚序列的基础上，和/或通过引入如下核苷酸取代来构建变体序列：所述取代不产生由核苷酸序列编码的多肽的另外的氨基酸序列，但是符合意欲产生酶的宿主生物体的密码子选择；或者所述取代可产生不同的氨基酸序列。关于核苷酸取代的概述，参见，例如，Ford等,1991,Protein Expression and Purification 2:95‑107。
对于本领域技术人员显而易见的是，这些取代能够在对于分子功能重要的区域之外进行，并且仍然产生活性多肽。可以根据本领域公知的方法，例如定位诱变或丙氨酸分区诱变法(参见，例如，Cunningham和Wells,1989,见上文)来鉴定对于由本发明的分离的多核苷酸编码的多肽活性关键的并且因此优选不进行取代的氨基酸残基。在后一技术中，将突变引入到分子中的每个荷正电的残基处，并且测试所得突变分子的葡糖淀粉酶活性，以鉴定对于所述分子的活性关键的氨基酸残基。底物‑酶相互作用的位点也能够通过分析三维结构测定，通过如核磁共振分析、晶体学或光亲和标记这样的技术来测定(参见，例如，de Vos等,1992,见上文；Smith等,1992,见上文；Wlodaver等,1992,见上文)。
本发明还涉及分离的多核苷酸，其编码本发明的多肽，所述多肽在非常低严格条件，优选低严格条件，更优选中等严格条件，更优选中等‑高严格条件，甚至更优选高严格条件，和最优选优选非常高严格条件下与以下杂交：(i)SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列，(ii)包含于SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的cDNA序列；或(iii)(i)或(ii)的全长互补链；或其等位变体和亚序列(Sambrook等,1989,见上文)，如本文中所定义。优选地，所述互补链是SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列的全长互补链。
本发明还涉及通过下述方法获得的分离的多核苷酸：(a)将DNA群体在非常低、低、中等、中‑高、高或非常高严格条件下与以下杂交：(i)SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列，(ii)包含于SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的cDNA序列；或(iii)(i)或(ii)的全长互补链；和(b)分离杂交多核苷酸，其编码具有葡糖淀粉酶活性的多肽。优选地，所述互补链是SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列的全长互补链。
杂合酶
本发明亦涉及杂合酶，其包含具有酶活性(例如，淀粉降解酶活性，如α‑淀粉酶，淀粉支链淀粉酶(amylopullulanase)，β‑淀粉酶，CGTase，葡糖淀粉酶，异淀粉酶，产麦芽糖淀粉酶，或支链淀粉酶活性)的催化域，和糖结合模块(CBM)。所述杂合酶可进一步包含接头。
所述杂合酶可通过融合编码催化域的第一DNA序列和编码糖结合模块的第二DNA序列来产生，或所述杂合体可基于对合适的CBM、接头和催化域的氨基酸序列的知识作为完全合成的基因来产生。
术语“杂合酶”(亦称为“融合蛋白”，“杂合体”，“杂合多肽”或“杂合蛋白”)在本文中用于表征本发明的杂合多肽，其包含具有酶活性(例如，淀粉降解酶活性，如α‑淀粉酶，淀粉支链淀粉酶，β‑淀粉酶，CGTase，葡糖淀粉酶，异淀粉酶，产麦芽糖淀粉酶，或支链淀粉酶活性)的催化模块和糖结合模块，其中所述催化域和所述糖结合模块来自不同来源。术语“来源”包括但不限于亲本酶或其变体，例如淀粉酶或葡糖淀粉酶，或其他催化活性，其包含合适的催化模块和/或合适的CBM和/或合适的接头。然而，所述CBM亦可来源于不具有催化活性的多肽。所述催化域和糖结合模块可来源于同一微生物株，来源于同一物种内的株，来源于紧密相关的物种，或来源于较不相关的生物体。优选地，杂合体的催化域和糖结合模块来自不同来源，例如，来自相同株和/或种的不同酶，或例如来自不同种的株。
在一个方面，所述杂合酶包含本发明的CBM(亦称作糖结合域或CBD)，和催化域。催化域在一个具体实施方案中是葡糖淀粉酶催化域。
核酸构建体
本发明还涉及包含本发明的分离的多核苷酸的核酸构建体，所述分离的多核苷酸与一个或多个(几个)调控序列可操作地连接，所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列的表达。
可以用许多方式操作编码本发明多肽的分离的多核苷酸以提供多肽的表达。依赖于表达载体，在将多核苷酸的序列插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸序列的技术是本领域熟知的。
调控序列可以是适当的启动子序列，其是由用于表达编码本发明多肽的多核苷酸的宿主细胞识别的核苷酸序列。启动子序列含有介导多肽的表达的转录调控序列。启动子可以是在所选的宿主细胞中显示转录活性的任何核苷酸序列，包括突变的、截短的和杂合的启动子，并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。
用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从下列酶的基因获得的启动子：米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉中性α‑淀粉酶、黑曲霉酸稳定性α‑淀粉酶、黑曲霉或泡盛曲霉(Asperillus awamori)葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、里氏木霉β‑葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β‑木糖苷酶，以及NA2‑tpi启动子(来自黑曲霉中性α‑淀粉酶和米曲霉丙糖磷酸异构酶的基因的启动子的杂合体)；和它们的突变的、截短的和杂合的启动子。
在酵母宿主中，有用的启动子从如下酶的基因获得：酿酒酵母烯醇化酶(ENO‑1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛‑3‑磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)和酿酒酵母3‑磷酸甘油酸激酶。对于酵母宿主细胞其它有用的启动子由Romanos等,1992,Yeast 8:423‑488描述。
调控序列也可以是合适的转录终止子序列，是由宿主细胞识别以终止转录的序列。所述终止子序列与编码所述多肽的核苷酸序列的3’末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。
对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得：米曲霉TAKA淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α‑葡糖苷酶和尖镰孢胰蛋白酶样蛋白酶。
对于酵母宿主细胞优选的终止子从如下酶的基因获得：酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛‑3‑磷酸脱氢酶。对于酵母宿主细胞其它有用的终止子由Romanos等,1992,见上文描述。
调控序列还可以是合适的前导序列，其是对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的核苷酸序列的5’‑末端。可以将在所选宿主细胞中有功能的任何前导序列用在本发明中。
对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得：米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。
对于酵母宿主细胞合适的前导序列从如下酶的基因获得：酿酒酵母烯醇化酶(ENO‑1)、酿酒酵母3‑磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母醇脱氢酶/甘油醛‑3‑磷酸脱氢酶(ADH2/GAP)。
调控序列也可以是聚腺苷酸化序列，其是与核苷酸序列的3’末端可操作地连接的序列，并且在转录时，宿主细胞将其识别为将聚腺苷残基添加至转录的mRNA的信号。可以将在所选宿主细胞中有功能的任何聚腺苷酸化序列在本发明中使用。
对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得：米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉α‑葡糖苷酶。
对于酵母宿主细胞有用的聚腺苷酸化序列由Guo和Sherman,1995,Molecular Cellular Biology 15:5983‑5990描述。
调控序列还可以是信号肽编码区，其编码与多肽的氨基末端相连的氨基酸序列，并且指导编码的多肽进入细胞分泌途径。核苷酸序列的编码序列5’端可固有地包含信号肽编码序列，其与编码分泌多肽的编码序列片段一起天然地连接在翻译阅读框中。可供选择的是，编码序列5’端可含有对于所述编码序列外源的信号肽编码序列。外源信号肽编码序列在编码序列不天然地含有信号肽编码序列时可为必需的。或者，外源信号肽编码序列可以简单地取代天然信号肽编码序列以增强多肽的分泌。然而，指导表达的多肽进入所选宿主细胞的分泌途径(即，分泌至培养基中)的任何信号肽编码序列可在本发明中使用。
对于丝状真菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列：米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶、特异腐质霉内切葡聚糖酶V和疏棉状腐质霉(Humicola lanuginosa)脂肪酶。
同样理想的是添加调节序列，其允许相对于宿主细胞的生长来调节多肽的表达。调节系统的实例是引起基因表达响应化学或物理刺激物，包括调节化合物的存在而开启或关闭的那些系统。原核系统中的调节系统包括lac、tac、xyl和trp操纵基因系统。
在酵母中，可以使用ADH2系统或GAL1系统。在丝状真菌中，可以使用TAKAα‑淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调节序列。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中，这些调节序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因，和以重金属(with heavy metal)扩增的金属硫蛋白基因。在这些情况下，编码多肽的核苷酸序列将与调节序列可操作地连接。
表达载体
本发明还涉及重组表达载体，所述重组表达载体包含本发明的多核苷酸、启动子和转录和翻译终止信号。本文所述的多种核酸和调控序列可以结合在一起以产生重组表达载体，所述表达载体可以包括一个或多个(几个)方便的限制位点以允许在这些位点插入或取代编码多肽的核苷酸序列。可供选择的是，可以通过在适当的用于表达的载体中插入包含所述序列的核苷酸序列或核酸构建体来表达本发明的多核苷酸序列。在制备表达载体的过程中，将编码序列置于载体中，从而将该编码序列与适当的表达调控序列可操作地连接。
重组表达载体可以是任何载体(例如，质粒或病毒)，其能够方便地进行重组DNA步骤，并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。
载体可以是自主复制载体，即，作为染色体外实体(entity)存在的载体，其复制独立于染色体复制，例如，质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者，载体可以是一种当被引入宿主细胞中时，整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外，可以使用单独的载体或质粒或两个或更多个载体或质粒，其共同含有待引入宿主细胞基因组的完整DNA(total DNA)，或可以使用转座子(transposon)。
本发明的载体优选地含有一个或多个(几个)选择性标记，其允许简单选择经转化、转染、转导等的细胞。选择性标记是基因，其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。
用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷‑5’‑磷酸脱羧酶)(orotidine‑5’‑phosphate decarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilate synthase))以及它们的等同物。优选用在曲霉属细胞中的是构巢曲霉(Aspergillus nidulans)或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
本发明的载体优选含有元件，其允许载体整合入宿主细胞基因组或允许载体在细胞中独立于基因组的自主复制。
为了整合入宿主细胞基因组，载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者，载体可以含有额外的核苷酸序列，用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性，整合元件应优选含有足够数量的核酸，如100至10,000碱基对，优选400至10,000碱基对，并且最优选800至10,000碱基对，其与相应的目标序列具有高度同一性以增强同源重组的概率。整合元件可以是任何序列，其与宿主细胞基因组中的目标序列同源。此外，整合元件可以是非编码或编码的核苷酸序列。另一方面，可以将载体通过非同源重组整合到宿主细胞的基因组中。
为了自主复制，载体可以进一步包含复制起点，其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator)，其在细胞中发挥功能。术语“复制起点”或“质粒复制子”在本文定义为能够使质粒或载体体内复制的核苷酸序列。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等,1991,Gene 98:61‑67；Cullen等,1987,Nucleic Acids Research 15:9163‑9175；WO 00/24883)。分离AMA1基因和构建包含该基因的质粒或载体能够根据公开于WO 00/24883中的方法完成。
可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞以增加基因产物的产生。多核苷酸拷贝数的增加可通过如下方法获得：将至少一个额外拷贝的序列整合入宿主细胞基因组，或将可扩增的选择性标记基因包括于多核苷酸，其中可通过在合适的选择剂(selectable agent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝，且由此含有所述多核苷酸的额外拷贝的细胞。
用于连接上述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知的(参见，例如，Sambrook等,1989,见上文)。
宿主细胞
本发明还涉及重组宿主细胞，其包含本发明的分离的多核苷酸，可有利地用于多肽的重组产生中。将包含本发明多核苷酸的载体导入宿主细胞，使载体如前所述作为染色体整合体或者作为自复制的染色体外载体维持。术语“宿主细胞”包括亲本细胞的任何后代，其由于复制过程中发生的突变而不同于亲本细胞。宿主细胞的选择将在很大程度上依赖于编码多肽的基因及其来源。
宿主细胞可以是在本发明的多肽的重组产生中有用的任何细胞，例如，原核或真核细胞。
原核宿主细胞可以是任何革兰氏阳性细菌或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于，芽孢杆菌属(Bacillus)、肠球菌属(Enterococcus)、梭菌属(Clostridium)、地芽孢杆菌属(Geobacillus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、海洋芽孢杆菌属(Oceanobacillus)、葡萄球菌属(Staphylococcus)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)。革兰氏阴性细菌包括但不限于，大肠杆菌(E.coli)、弯曲杆菌属(Campylobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、螺杆菌属(Helicobacter)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)和脲原体属(Ureaplasma)。
宿主细胞还可以是真核生物，如哺乳动物、昆虫、植物或真菌细胞。
优选地，宿主细胞是真菌细胞。“真菌”用在本文包括以下门：子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如由Hawksworth等,于Ainsworth and Bisby’s Dictionary of The Fungi,第8版,1995,CAB International,University Press,Cambridge,UK中所定义)以及卵菌门(Oomycota)(如Hawksworth等,1995,见上,171页中所引用)，和所有有丝分裂孢子真菌(mitosporic fungi)(Hawksworth等,1995,见上文)。
在一个更优选的方面，真菌宿主细胞是酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变，就本发明而言，将酵母定义为如Biology and Activities of Yeast(Skinner,F.A.,Passmore,S.M.,和Davenport,R.R.编,Soc.App.Bacteriol.Symposium Series No.9,1980)中所述。
在一个甚至更加优选的方面，酵母宿主细胞是假丝酵母属(Candida)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属细胞(Yarrowia)。
在最优选的方面，酵母宿主细胞是卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)或卵形酵母细胞(Saccharomyces oviformis)。在另一个最优选的方面，酵母宿主细胞是乳酸克鲁维酵母(Kluyveromyces lactis)细胞。在另一个最优选的方面，酵母宿主细胞是解脂西洋蓍霉(Yarrowia lipolytica)细胞。
在另一个更优选的方面，真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth等,1995,见上文，所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长，而碳分解代谢是专性需氧的。相反，酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行，而碳分解代谢可以是发酵的。
在一个甚至更优选的方面，丝状真菌宿主细胞是枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管霉属(Bjerkandera)、拟蜡菌属(Ceriporiopsis)、金孢子菌属(Chrysosporium)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属(Cryptococcus)、Filibasidium、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、侧耳属(Pleurotus)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属(Trametes)或木霉属(Trichoderma)细胞。
在最优选的方面，丝状真菌宿主细胞是泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、烟曲霉(Aspergillus fumigatus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)或米曲霉(Aspergillus oryzae)细胞。在另一个最优选方面，丝状真菌宿主细胞是杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusarium trichothecioides)或镶片镰孢(Fusarium venenatum)细胞。在另一个最优选的方面，丝状真菌宿主细胞是黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、Ceriporiopsis caregiea、Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、虫拟蜡菌(Ceriporiopsis subvermispora)、Chrysosporium inops、嗜角质金孢子菌(Chrysosporium keratinophilum)、Chrysosporium lucknowense、Chrysosporium merdarium、毡金孢子菌(Chrysosporium pannicola)、Chrysosporium queenslandicum、热带金孢子菌(Chrysosporium tropicum)、Chrysosporium zonatum、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicola lanuginosa)、米黑毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌(Neurospora crassa)、产紫青霉(Penicillium purpurogenum)、黄孢平革菌(Phanerochaete chrysosporium)、辐射射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳(Thielavia terrestris)、长绒毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichoderma reesei)或绿色木霉(Trichoderma viride)细胞。
可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁再生的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP238 023和Yelton等,1984,Proceedings of the National Academy of Sciences USA81:1470‑1474中描述。用于转化镰孢属菌种的合适方法由Malardier等,1989,Gene 78:147‑156和WO 96/00787描述。可以使用由如下文献描述的方法转化酵母：Becker和Guarente,于Abelson,J.N.和Simon,M.I.编,Guide to Yeast Genetics and Molecular Biology,Methods in Enzymology,194:182‑187,Academic Press,Inc.,New York；Ito等,1983,Journal of Bacteriology 153:163；和Hinnen等,1978,Proceedings of the National Academy of Sciences USA 75:1920。
产生方法
本发明还涉及产生本发明多肽的方法，其包括：(a)在有助于产生多肽的条件下培养细胞，所述细胞以其野生型形式产生所述多肽；和(b)回收所述多肽。优选地，所述细胞是密孔菌属的细胞。在一个更优选的方面，所述细胞是菌种血红密孔菌的细胞。
本发明还涉及产生本发明的多肽的方法，其包括：(a)如本文所述，在有助于产生多肽的条件下培养重组宿主细胞；和(b)回收所述多肽。
本发明还涉及产生本发明的多肽的方法，包括：(a)在有助于产生多肽的条件下培养重组宿主细胞，其中所述宿主细胞包含突变核苷酸序列，其在SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列中具有至少一个突变，其中所述突变核苷酸序列编码多肽，该多肽包含SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽或由SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽组成，和(b)回收所述多肽。
在本发明的产生方法中，使用本领域熟知的方法在适合于产生所述多肽的营养培养基中培养细胞。例如，可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养，和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养，所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如，在美国典型培养物保藏中心的目录中)。如果多肽分泌到营养培养基中，该多肽能够从所述培养基中直接回收。如果多肽不分泌到培养基中，其能够从细胞裂解物(lysate)回收。
可以使用本领域已知的对于多肽是特异性的方法来检测所述多肽。这些检测方法可包括特异性抗体的使用、酶产物的形成或酶底物的消失。例如，酶试验(enzyme assay)可用于测定如本文所述的多肽的活性。
所得多肽可以使用本领域已知的方法回收。例如，多肽可以通过常规方法从营养培养基中回收，所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。
本发明的多肽可以通过多种本领域已知的方法纯化以获得基本上纯的多肽，所述方法包括但不限于层析(例如，离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如，制备型(preparative)等电聚焦)、差示溶解度(例如，硫酸铵沉淀)、SDS‑PAGE或提取(参见，例如，Protein Purfication,J.‑C.Janson和Lars Ryden编,VCH Publishers,New York,1989)。
植物
本发明还涉及植物，例如，转基因植物、植物部分或植物细胞，其包含分离的多核苷酸，所述多核苷酸编码本发明具有葡糖淀粉酶活性的多肽，从而以可回收的量表达和产生所述多肽。多肽可从植物或植物部分回收。或者，同样可以将含有该重组多肽的植物或植物部分用于改进食品或饲料的质量，例如，改进营养价值、适口性(palatability)和流变性质(rheological properties)，或用于破坏抗营养因子。
转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草(grasses)，如草地早熟禾(meadow grass)(蓝草(blue grass)，早熟禾属(Poa))；饲用牧草(forage grass)如羊茅属(Festuca)、黑麦草属(Lolium)；寒地型牧草(temperate grass)，如Agrostis(翦股颖属)；和谷类，例如，小麦、燕麦、黑麦、大麦、稻(rice)、高粱和玉蜀黍(maize)(玉米)。
双子叶植物的实例是烟草(tobacco)，豆类(legumes)，如羽扇豆(lupins)，马铃薯，糖甜菜(sugar beet)，豌豆，豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(family Brassicaceae))，如花椰菜(cauliflower)，油菜籽(rape seed)和紧密相关的模式生物体拟南芥(Arabidopsis thaliana)。
植物部分的实例是茎(stem)、愈伤组织(callus)、叶(leaf)、根(root)、果实(fruit)、种子(seed)和块茎(tuber)，以及包含这些部分的独立组织，例如，表皮(epidermis)、叶肉(mesophyll)、薄壁组织(parenchyme)、维管组织(vascular tissue)、分生组织(meristem)。具体的植物细胞区室(compartments)，如叶绿体(chloroplast)、质外体(apoplast)、线粒体(mitochondria)、液泡(vacuole)、过氧化物酶体(peroxisome)和细胞质(cytoplasm)也被认为是植物部分。此外，任何植物细胞，无论什么组织来源，都被认为是植物部分。同样地，植物部分，如分离以促进本发明的应用的具体组织和细胞也被认为是植物部分，例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和种皮(seed coat)。
同样包含于本发明范围内的还有这些植物、植物部分和植物细胞的后代。
表达本发明多肽的转基因植物或植物细胞可以依照本领域已知方法构建。简而言之，通过如下构建所述植物或植物细胞：将编码本发明多肽的一个或多个(几个)表达构建体并入植物宿主基因组或叶绿体基因组，并且将所得的修饰植物或植物细胞繁殖为转基因植物或植物细胞。
表达构建体便利地是包含编码本发明多肽的多核苷酸的核酸构建体，所述多核苷酸与在选择的植物或植物部分中表达该核苷酸序列所需的适当的调节序列可操作地连接。此外，表达构建体可以包含对于鉴定宿主细胞有用的选择性标记，在所述宿主细胞中整合了表达构建体和将该构建体引入到所述植物中所必需的DNA序列(后者依赖于使用的DNA引入方法)。
调节序列的选择，例如启动子和终止子序列和任选地信号或转运序列的选择，举例来说，基于期望何时、何处以及如何表达多肽而确定。例如，编码本发明多肽的基因的表达可以是组成型的或诱导型的，或可以是发育、阶段或组织特异性的，并且基因产物可以靶向特定的组织或植物部分例如种子或叶。调节序列由例如Tague等,1988,Plant Physiology 86:506所述。
对于组成型表达，可以使用35S‑CaMV、玉米泛素1和稻肌动蛋白1启动子(Franck等,1980,Cell 21:285‑294,Christensen等,1992,Plant Mo.Biol.18:675‑689；Zhang等,1991,Plant Cell 3:1155‑1165)。器官特异性启动子可以是例如来自贮藏库组织(storage sink tissue)例如种子、马铃薯块茎和果实的启动子(Edwards和Coruzzi,1990,Ann.Rev.Genet.24:275‑303)，或来自代谢库组织(metabolic sink tissue)例如分生组织的启动子(Ito等,1994,Plant Mol.Biol.24:863‑878)，种子特异性启动子诸如来自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)启动子(Wu等,1998,Plant and Cell Physiology 39:885‑889)，来自豆球蛋白(legumin)B4和蚕豆(Vicia faba)的未知的种子蛋白基因的蚕豆启动子(Conrad等,1998,Journal of Plant Physiology152:708‑711)、来自种子油体蛋白(oil body protein)的启动子(Chen等,1998,Plant and Cell Physiology 39:935‑941)，来自欧洲油菜(Brassica napus)的贮藏蛋白napA启动子，或本技术领域公知的任何其他种子特异性的启动子，例如，在WO91/14772中所描述的。此外，启动子可为叶特异性的启动子，如来自稻或番茄的rbcs启动子(Kyozuka等,1993,Plant Physiology 102:991‑1000)，小球藻病毒(chlorella virus)腺嘌呤甲基转移酶(adenine methyltransferase)基因启动子(Mitra和Higgins,1994,Plant Molecular Biology 26:85‑93)，或来自稻的aldP基因启动子(Kagaya等,1995,Molecular and general genetics 248:668‑674)，或伤口诱导的启动子，如马铃薯pin2启动子(Xu等,1993,Plant Molecular Biology 22:573‑588)。同样地，所述启动子可通过非生物的处理诱导，所述非生物的处理如温度、干旱或盐度变化，或通过外源施加的激活所述启动子的物质诱导，例如乙醇、雌激素(oestrogens)、植物激素(plant hormones)如乙烯、脱落酸(abscisic acid)和赤霉酸(gibberellic acid)，和重金属。
启动子增强子元件也可以用于实现本发明多肽在植物中的较高表达。例如，启动子增强子元件可以是内含子，其置于启动子和编码本发明多肽的核苷酸序列之间。例如Xu等,1993,见上，公开了使用稻肌动蛋白1基因的第一内含子以增强表达。
选择性标记基因和表达构建体的任何其它部分可以选自本领域内可用的那些。
将核酸构建体根据本领域已知的常规技术并入植物基因组，所述常规技术包括土壤杆菌属(Agrobacterium)介导的转化、病毒介导的转化、显微注射(microinjection)、粒子轰击、生物射弹转化和电穿孔(Gasser等,1990,Science 244:1293；Potrykus,1990,Bio/Technology 8:535；Shimamoto等,1989,Nature 338:274)。
目前，根癌土壤杆菌(Agrobacterium tumefaciens)介导的基因转移(gene transfer)，是产生转基因双子叶植物的优选方法(为了参考，见Hooykas和Schilperoort,1992,Plant Molecular Biology 19:15‑38)，而且它也可以用于转化单子叶植物，虽然对于这些植物常常使用其他的转化方法。目前，产生转基因单子叶植物的优选的方法，是用粒子(用转化DNA涂覆的微观的金或钨粒子)轰击胚愈伤组织(embryonic calli)或发育中的胚(developing embryos)(Christou,1992,Plant Journal 2:275‑281；Shimamoto,1994,Current Opinion Biotechnology 5:158‑162；Vasil等,1992,Bio/Technology 10:667‑674)。转化单子叶植物的可供选择的方法基于原生质体转化，如由Omirulleh等,1993,Plant Molecular Biology 21:415‑428所描述的。
转化之后，根据本领域熟知的方法选择具有并入的表达构建体的转化体并且再生成为完整植物。通常设计转化方法用于通过如下方法在再生期间或在后续世代中选择性消除选择基因：例如，使用带有两个独立的T‑DNA构建体的共转化或通过特异性重组酶位点特异性地切除选择基因。
本发明还涉及产生本发明多肽的方法，其包括：(a)在有助于产生多肽的条件下培养包含多核苷酸的转基因植物或植物细胞，所述多核苷酸编码本发明具有葡糖淀粉酶活性的多肽；和(b)回收所述多肽。
组合物
本发明还涉及包含本发明的多肽的组合物。优选地，所述组合物富含这种多肽。术语“富含”表示所述组合物的葡糖淀粉酶活性，例如，以至少1.1的富集因数(enrichment factor)增加。
所述组合物可以包含本发明的多肽作为主要酶成分，例如，单成分组合物。或者，所述组合物可包含多种酶活性，如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α‑半乳糖苷酶、β‑半乳糖苷酶、葡糖淀粉酶、α‑葡糖苷酶、β‑葡糖苷酶、卤素过氧化物酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶水解酶、肽谷氨酰胺酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。其他的酶可以通过例如属于以下属或种的微生物产生：曲霉属，优选棘孢曲霉、泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉；镰孢属，优选杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢；腐质霉属，优选特异腐质霉或疏棉状腐质霉；或木霉属，优选哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉。
可以依照本领域内已知的方法制备多肽组合物，并且可以是液体或干组合物的形式。例如，所述多肽组合物可以是颗粒(granulate)或微粒(microgranulate)的形式。可以依照本领域内已知方法将包括于所述组合物中的多肽稳定化。
下文给出了本发明的多肽组合物的优选用途的实例。本发明的多肽组合物的剂量和使用该组合物的其它条件可以基于本领域内已知的方法确定。
葡糖淀粉酶和酸性α‑淀粉酶的组合
根据本发明的该方面，本发明的葡糖淀粉酶可与α‑淀粉酶组合，优选与酸性α‑淀粉酶以0.3至5.0AFAU/AGU的比例组合。更优选地，酸性α‑淀粉酶活性和葡糖淀粉酶活性之间的比例为至少0.35，至少0.40，至少0.50，至少0.60，至少0.7，至少0.8，至少0.9，至少1.0，至少1.1，至少1.2，至少1.3，至少1.4，至少1.5，至少1.6，至少1.7，至少1.8，至少1.85，或甚至至少1.9AFAU/AGU。然而酸性α‑淀粉酶活性和葡糖淀粉酶活性之间的比例应优选小于4.5，小于4.0，小于3.5，小于3.0，小于2.5，或甚至小于2.25AFAU/AGU。以AUU/AGI表示，酸性α‑淀粉酶和葡糖淀粉酶的活性优选以0.4至6.5AUU/AGI的比例存在。更优选地，酸性α‑淀粉酶活性和葡糖淀粉酶活性之间的比例为至少0.45，至少0.50，至少0.60，至少0.7，至少0.8，至少0.9，至少1.0，至少1.1，至少1.2，至少1.3，至少1.4，至少1.5，至少1.6，至少1.7，至少1.8，至少1.9，至少2.0，至少2.1，至少2.2，至少2.3，至少2.4，或甚至至少2.5AUU/AGI。然而，酸性α‑淀粉酶活性和葡糖淀粉酶活性之间的比例优选小于6.0，小于5.5，小于4.5，小于4.0，小于3.5，或甚至小于3.0AUU/AGI。
上述组合物适用于下文中所述的淀粉转化工艺以供产生糖浆和发酵产物，如乙醇。
下文给出了本发明的多肽组合物的优选用途的实例。本发明的多肽组合物的剂量和使用该组合物的其它条件可以基于本领域内已知的方法确定。
用途
本发明还涉及使用本发明的具有葡糖淀粉酶活性的多肽的工艺/方法。
根据本发明的用途包括将淀粉淀粉转化为例如糖浆和发酵产物，包括乙醇和饮料。其中可使用本发明的葡糖淀粉酶的工艺的实例包括WO 92/20777、WO 03/066816、WO 03/066826、WO 2004/080923和WO 2004/081193中所述的那些，这些文献均通过提述并入本文。
发酵产物的产生
用于自经糊化的含淀粉材料产生发酵产物的工艺
在此方面，本发明涉及自含淀粉材料产生发酵产物(特别是乙醇)的工艺，所述工艺包括液化步骤，以及顺序或同时进行的糖化和发酵步骤。
本发明涉及自含淀粉材料产生发酵产物的工艺，包括下述步骤：
(a)液化含淀粉材料，优选使用α‑淀粉酶；
(b)使用本发明的葡糖淀粉酶糖化步骤(a)中获得的经液化的材料；和
(c)使用发酵生物发酵经糖化的材料。
发酵产物，如特别是乙醇，可任选地在发酵后回收，例如，通过蒸馏进行。合适的含淀粉的起始材料列于下面“含淀粉材料”部分。涵盖的酶列于下面“酶”部分。液化优选在α‑淀粉酶存在的条件下进行。发酵优选在酵母，优选酵母属菌株存在下。合适的发酵生物列于下文“发酵生物”部分。在优选的实施方案中，步骤(b)和(c)顺序或同时进行(即，作为SSF工艺)。
在一个特定的实施方案中，本发明的工艺在步骤(a)之前还包括下述步骤：
x)减小含淀粉材料的粒度，优选通过磨制；和
y)形成包含含淀粉材料和水的浆料。
含水浆料可含有10‑40wt%，优选25‑35wt%的含淀粉材料。将浆料加热到糊化温度以上，并可添加α‑淀粉酶，优选细菌和/或酸性真菌α‑淀粉酶以起始液化(稀化(thinning))。在一个实施方案中，在进行本发明步骤(a)中的α‑淀粉酶处理前，浆料可经喷射蒸煮(jet‑cooked)以进一步使浆料糊化。
更具体而言，液化过程可作为三步热浆工艺来进行。将浆料加热至60‑95℃，优选80‑85℃，并添加α‑淀粉酶以起始液化(稀化)。然后可将浆料在95‑140℃，优选105‑125℃的温度喷射蒸煮1‑15分钟，优选3‑10分钟，特别是约5分钟。使浆料冷却至60‑95℃并添加更多的α‑淀粉酶以完成水解(二次液化)。液化工艺通常在pH 4.5至6.5，特别是在pH 5至6进行。磨制和液化的全谷物称作醪(mash)。
步骤(b)中的糖化可使用本领域众所周知的条件进行。举例而言，完全的糖化工艺可持续约24至约72小时，然而，通常仅在30‑65℃，通常约60℃的温度进行通常40‑90分钟的预糖化，然后是在同时发酵和糖化工艺(SSF工艺)中在发酵过程中的完全糖化。糖化通常在30‑65℃，通常约60℃的温度，在约pH 4‑5的pH，通常在约pH 4.5进行。
发酵产物，特别是乙醇生产中最广泛使用的工艺为同时糖化和发酵(SSF)工艺，其中对于糖化没有保持阶段，意思是发酵生物(如酵母)和酶可一起添加。SSF通常在25℃至40℃，如29℃至35℃，如30℃至34℃，优选约32℃的温度进行。根据本发明，可在发酵过程中向上或向下调整温度。
根据本发明，发酵步骤(c)包括但不限于用于产生醇类(例如，乙醇、甲醇、丁醇)；有机酸(例如，柠檬酸、乙酸、衣康酸、乳酸、葡糖酸)；酮类(例如，丙酮)；氨基酸(例如，谷氨酸)；气体(例如，H2和CO2)；抗生素(例如，青霉素和四环素)；酶；维生素(例如，核黄素、B12、β‑胡萝卜素)；以及激素的发酵工艺。优选的发酵工艺包括醇发酵工艺，如本领域公知。优选的发酵工艺为厌氧发酵工艺，如本领域公知。
自未糊化的含淀粉材料产生发酵产物的方法
在此方面，本发明涉及自含淀粉材料产生发酵产物，而无含淀粉材料的糊化(即未烹制的含淀粉材料)的工艺。在一个实施方案中，在发酵和糖化过程中仅使用本发明的葡糖淀粉酶。根据本发明，可产生期望的发酵产物，如乙醇，而不液化含有含淀粉材料的含水浆料。在一个实施方案中，本发明的方法包括在糊化温度以下，在本发明的葡糖淀粉酶的存在下对(经磨制的)含淀粉材料，例如粒状淀粉进行糖化以产生糖类，所述糖类可由合适的发酵生物发酵成期望的发酵产物。
因此，在此方面，本发明涉及用于自含淀粉材料产生发酵产物的工艺，包括：
(a)在所述含淀粉材料的起始糊化温度以下的温度用包含于SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6，优选SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6中氨基酸19至573所示的序列中的成熟葡糖淀粉酶，或与其具有至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，和甚至最优选至少95%，如至少96%，至少97%，至少98%，至少99%或甚至至少100%同一性的葡糖淀粉酶来糖化含淀粉材料；
(b)使用发酵生物进行发酵。
本发明的工艺的步骤(a)或(b)可顺序或同时进行。在一个实施方案中，在步骤(a)之前制备包含水和含淀粉材料的浆料。
所述发酵工艺可进行1至250小时，优选25至190小时，更优选30至180小时，更优选40至170小时，甚至更优选50至160小时，还更优选60至150小时，甚至还更优选70至140小时，并且最优选80至130小时的期间。
术语“起始糊化温度”意指淀粉发生糊化的最低温度。在水中加热的淀粉在50℃至75℃开始糊化；糊化的准确温度取决于特定的淀粉，并可方便的由本领域技术人员确定。从而，起始糊化温度可根据植物物种，植物物种的特定品种以及生长条件而改变。在本发明的上下文中，给定含淀粉材料的起始糊化温度为使用由Gorinstein和Lii44(12)：461‑466描述的方法5%的淀粉颗粒丧失双折射的温度。
在步骤(a)之前，可制备含淀粉材料，如粒状淀粉的浆料，其具有10‑55wt%含淀粉材料的干固体，优选25‑40wt%干固体，更优选30‑35%干固体。浆料可包含水分和/或工艺水(process water)，例如釜馏物(逆流(backset))、洗涤水(scrubber water)、蒸发器冷凝液或馏出物、来自蒸馏的侧线汽提器水(side‑stripper water)或其他发酵产物设备(plant)的工艺水。由于本发明的方法在糊化温度以下进行，因此不发生显著的粘度增加，如果需要，可使用高水平的釜馏物。在一个实施方案中，含水浆料包含约1至约70vol%釜馏物，优选15‑60vol%釜馏物，特别为约30至50vol%釜馏物。
可通过优选以干磨或湿磨将其粒度减小到0.05至3.0mm，优选0.1至0.5mm来制备含淀粉材料。在进行本发明的工艺后，含淀粉材料的至少85%，至少86%，至少87%，至少88%，至少89%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，或者优选至少99%的干固体转化为可溶的淀粉水解物。
本发明的工艺在低于起始糊化温度的温度进行。优选地，步骤(a)进行的温度为30至75℃，优选45至60℃。
在一个优选实施方案中，步骤(a)和步骤(b)作为顺序或同时糖化和发酵工艺进行。在此种优选的实施方案中，该工艺通常在25至40℃，如29至35℃，如30℃至34℃，如约32℃的温度进行。根据本发明在发酵过程可向上或向下调整温度。
在一个实施方案中，进行同时糖化和发酵从而使得糖水平，如葡萄糖水平保持在低水平，如6wt%以下，优选约3wt%以下，优选约2wt%以下，更优选约1wt%以下，甚至更优选约0.5%以下或甚至更优选0.25wt%以下，如约0.1wt%以下。所述低水平的糖可通过简单的使用经调整量的酶和发酵生物来实现。本领域技术人员可方便地确定使用的发酵生物和酶的量。发酵生物和酶的使用量也可经选择以保持麦芽糖在发酵液中的低浓度。举例而言，麦芽糖水平可保持为约0.5wt%以下，或约0.2wt%以下。
本发明的方法可在pH 3至7，优选pH 3.5至6，或更优选pH 4至5的范围进行。
含淀粉材料
根据本发明，可使用任何合适的含淀粉的起始材料，包括粒状淀粉。所述起始材料通常基于期望的发酵产物而选择。适用于本发明工艺的含淀粉的起始材料的实例包括块茎、根、茎、全谷粒、玉米、玉米穗轴、小麦、大麦、黑麦、买罗高粱、西米、木薯、树薯、高粱、稻、豌豆(pea)、豆(bean)或甘薯，或它们的组合，或谷类，含糖的原材料如糖蜜，果物材料，甘蔗或糖甜菜，马铃薯，以及含纤维素材料，如木质或植物残余物，或其组合。涵盖蜡质和非蜡质两者类型的玉米和大麦。
术语“粒状淀粉”意指未烹制的生淀粉，即，以其天然形式存在于谷类、块茎或谷粒中的淀粉。淀粉在植物细胞中作为不溶于水的微小颗粒形成。当置于冷水中时，淀粉颗粒可吸收少量液体并膨胀(swell)。在高至50℃至75℃的温度，膨胀可为可逆的。然而，在更高温度开始称为“糊化”的不可逆膨胀。待加工的粒状淀粉可为高度精制的淀粉质量，优选至少90%，至少95%，至少97%或至少99.5%纯，或者其可为更加粗制的含淀粉材料，其含有包括非淀粉部分(如胚残余物和纤维)的经磨制的全谷粒。原材料(如全谷粒)经磨制以打开其结构并允许进一步的加工。根据本发明优选两种磨制工艺，湿磨和干磨。在干磨中，将整粒磨碎并使用。湿磨给出胚和粗粉(淀粉颗粒和蛋白质)的良好分离，并通常用于使用淀粉水解物产生糖浆的场合。干磨和湿磨在淀粉加工领域都是众所周知的，并等同地涵盖于本发明的工艺中。
所述含淀粉材料优选通过干磨或湿磨减小粒度以暴露更多表面积。在一个实施方案中，粒度为约0.05至3.0mm，优选0.1至0.5mm，或使得至少30%，优选至少50%，更优选至少70%，甚至更加优选至少90%的含淀粉材料可穿过具有0.05至3.0mm筛网，优选0.1至0.5mm筛网的筛。
发酵产物
术语“发酵产物”意指使用发酵生物通过包括发酵步骤的工艺生成的产物。根据本发明所包括的发酵产物包括醇类(例如，乙醇、甲醇、丁醇)；有机酸(例如，柠檬酸、乙酸、衣康酸、乳酸、葡糖酸)；酮类(例如，丙酮)；氨基酸(例如，谷氨酸)；气体(例如，H2和CO2)；抗生素(例如，青霉素和四环素)；酶；维生素(例如，核黄素、B12、β‑胡萝卜素)；以及激素。在一个优选实施方案中，所述发酵产物是乙醇，例如，燃料乙醇；饮用乙醇(即，可饮用的中性酒)；或工业乙醇或用于可饮用醇类工业(例如，啤酒和葡萄酒)、乳制品工业(例如，发酵的乳制品)、皮革工业和烟草工业的产物。优选的啤酒类型包括爱儿啤酒(ale)、烈性啤酒(stout)、钵尔透黑啤酒(porters)、陈贮啤酒(lagers)、苦味酒(bitters)、麦芽酒(malt liquors)、发泡酒(happoushu)、高醇啤酒(high‑alcohol beer)、低醇啤酒(low‑alcohol beer)、低热量啤酒(low‑calorie beer)或清淡啤酒(light beer)。使用的优选发酵工艺包括醇发酵工艺，如本领域公知。优选的发酵工艺为厌氧发酵工艺，如本领域公知。
发酵生物
“发酵生物”指任何适用于发酵工艺并能够产生所需的发酵产物的生物，包括细菌和真菌生物。特别合适的发酵生物能够将糖如葡萄糖或麦芽糖直接或间接发酵(即转化)为所需的发酵产物。发酵生物的实例包括真菌生物，如酵母。优选的酵母包括酵母属菌种，特别是酿酒酵母的菌株。商业上可获得的酵母包括例如Red StarTM/Lesaffre Ethanol Red(可从Red Star/Lesaffre,USA获得)，FALI(可从Burns Philp Food Inc.,USA的分支机构Fleischmann’s Yeast获得)，SUPERSTART(可从Alltech获得)，GERT STRAND(可从Gert Strand AB,Sweden获得)和FERMIOL(可从DSM Specialties获得)。
酶
葡糖淀粉酶
葡糖淀粉酶优选为本发明的葡糖淀粉酶。然而如上所述，本发明的葡糖淀粉酶亦可与其他葡糖淀粉酶组合。术语“葡糖淀粉酶”(1,4‑α‑D‑葡聚糖葡糖水解酶，EC3.2.1.3)是催化D‑葡萄糖从淀粉或相关的寡糖和多糖分子的非还原端释放的酶。
葡糖淀粉酶可以以0.001至10AGU/g DS，优选0.01至5AGU/g DS，如大约0.1，0.3，0.5，1或2AGU/g DS，特别是0.1至0.5AGU/g DS或0.02‑20AGU/g DS，优选0.1‑10AGU/g DS的量添加。
α‑淀粉酶
根据本发明α‑淀粉酶可为任何来源的。优选真菌或细菌来源的α‑淀粉酶。
在一个优选实施方案中，所述α‑淀粉酶是酸性α‑淀粉酶，例如真菌酸性α‑淀粉酶或细菌酸性α‑淀粉酶。术语“酸性α‑淀粉酶”意指以有效量添加、在pH范围3至7，优选3.5至6，或更优选4至5具有最优活性的α‑淀粉酶(EC 3.2.1.1)。
细菌α‑淀粉酶
根据本发明，细菌α‑淀粉酶优选来源于芽孢杆菌属。
在一个优选实施方案中，所述芽孢杆菌属α‑淀粉酶来源于地衣芽孢杆菌、解淀粉芽孢杆菌、枯草芽孢杆菌或嗜热脂肪芽孢杆菌的菌株，但亦可来源于其他芽孢杆菌菌种。涵盖的α‑淀粉酶的具体实例包括示于WO 99/19467中SEQ ID NO:4的地衣芽孢杆菌α‑淀粉酶(BLA)，示于WO 99/19467中SEQ ID NO:5的解淀粉芽孢杆菌α‑淀粉酶(BAN)，和示于WO 99/19467中SEQ ID NO:3的嗜热脂肪芽孢杆菌α‑淀粉酶(BSG)。在一个本发明的实施方案中，所述α‑淀粉酶为分别与WO 99/19467中示为SEQ ID NO:1、2、3、4或5的任何序列具有至少60%，优选至少70%，更优选至少80%，甚至更优选至少90%，如至少95%，至少96%，至少97%，至少98%或至少99%同一性的同一性程度的酶。
所述芽孢杆菌属α‑淀粉酶亦可为变体和/或杂合体，特别是任何WO 96/23873、WO 96/23874、WO 97/41213、WO 99/19467、WO 00/60059和WO 02/10355(所有文献通过提述并入本文)中所描述的。具体而言，涵盖的α‑淀粉酶变体公开于美国专利号6,093,562、6,297,038和6,187,576(通过提述并入本文)，并包括在位置179至182具有一个或两个氨基酸缺失的嗜热脂肪芽孢杆菌α‑淀粉酶(BSGα‑淀粉酶)变体，所述缺失优选为WO 96/23873中公开的双缺失(参见，例如第20页第1‑10行，通过提述并入本文)，优选与WO 99/19467中公开的SEQ ID NO:3中所列的野生型BSGα‑淀粉酶氨基酸序列相比对应于Δ(181‑182)，或使用WO 99/19467(通过提述并入本文)中的SEQ ID NO:3的编号方式的氨基酸179和180的缺失。甚至更优选的是与WO 99/19467中公开的SEQ ID NO:3中所列的野生型BSGα‑淀粉酶氨基酸序列相比具有对应于Δ(181‑182)的双缺失，并进一步包含N193F取代(亦表示为I181*+G182*+N193F)的芽孢杆菌属α‑淀粉酶，特别是嗜热脂肪芽孢杆菌α‑淀粉酶。
所述α‑淀粉酶亦可为产麦芽糖α‑淀粉酶。“产麦芽糖α‑淀粉酶”(葡聚糖1,4‑α‑麦芽水解酶，EC 3.2.1.133)能够将直链淀粉和支链淀粉(amylopectin)水解为α‑构型的麦芽糖。一种来自嗜热脂肪芽孢杆菌菌株NCIB 11837的产麦芽糖α‑淀粉酶商业上可从Novozymes A/S,Denmark获得。产麦芽糖α‑淀粉酶描述于美国专利号4,598,048、4,604,355和6,162,628，其通过提述并入本文。
细菌杂合α‑淀粉酶
具体涵盖的杂合α‑淀粉酶包含地衣芽孢杆菌α‑淀粉酶(示为WO 99/19467中的SEQ ID NO:3)的445个C端氨基酸残基和来源于解淀粉芽孢杆菌(示为WO 99/19467中的SEQ ID NO:5)的37个N端氨基酸残基，并具有一个或多个，特别是所有的下述取代：
G48A+T49I+G107A+H156Y+A181T+N190F+I201F+A209V+Q264S(使用地衣芽孢杆菌编号)。亦优选具有一个或多个下述突变(或其他芽孢杆菌属α‑淀粉酶骨架中对应的突变)的变体：H154Y、A181T、N190F、A209V和Q264S，和/或位置176和179之间两个残基的缺失，优选缺失E178和G179(使用WO 99/19467的SEQ ID NO:5的编号方式)。
细菌α‑淀粉酶亦可以如本领域公知的量添加。当以KNU单位(描述于下文“材料和方法”部分)测量时，α‑淀粉酶活性优选以0.5‑5,000NU/g的DS的量，1‑500NU/g的DS的量，或更优选以5‑1,000NU/g的DS如10‑100NU/g DS的量存在。
真菌α‑淀粉酶
真菌酸性α‑淀粉酶包括来源于曲霉属菌株的酸性α‑淀粉酶，如米曲霉、黑曲霉或川地曲霉α‑淀粉酶。
优选的酸性真菌α‑淀粉酶是Fungamyl样α‑淀粉酶，其优选来源于米曲霉的菌株。在本公开中，术语“Fungamyl样α‑淀粉酶”指与示于WO 96/23874的SEQ ID NO:10的氨基酸序列的成熟部分呈现高同一性，即高于70%，高于75%，高于80%，高于85%，高于90%，高于95%，高于96%，高于97%，高于98%，高于99%或甚至100%同一性的α‑淀粉酶。
另一种优选的酸性α‑淀粉酶来源于黑曲霉菌株。在一个优选实施方案中，所述酸性真菌α‑淀粉酶是来自黑曲霉、作为“AMYA_ASPNG”以初级登录号P56271公开于Swiss‑prot/TeEMBL数据库并更具体描述于WO 89/01969(实施例3)的α‑淀粉酶。所述酸性黑曲霉酸性α‑淀粉酶在WO 2004/080923(Novozymes)(通过提述并入本文)亦显示于SEQ ID NO:1。还涵盖了所述酸性真菌淀粉酶与WO 2004/080923中的SEQ ID NO:1具有至少70%同一性，如至少80%或甚至至少90%同一性，如至少95%，至少96%，至少97%，至少98%，或至少99%同一性的变体。合适的商业上可获得的来源于黑曲霉的酸性真菌α‑淀粉酶为SP288(可从Novozymes A/S,Denmark获得)。
在一个优选实施方案中，所述α‑淀粉酶来源于川地曲霉，并公开于Kaneko等,1996,J.Ferment.Bioeng.81:292‑298,“Molecular‑cloning and determination of the nucleotide‑sequence of a gene encoding an acid‑stable alpha‑amylase from Aspergillus kawachii"；并进一步作为EMBL:#AB008370公开。
所述真菌酸性α‑淀粉酶亦可为包含糖结合模块(CBM)和α‑淀粉酶催化域的野生型酶(即，非杂合体)，或其变体。在一个实施方案中，所述野生型酸性α‑淀粉酶来源于川地曲霉的菌株。
真菌杂合α‑淀粉酶
在一个优选实施方案中，所述真菌酸性α‑淀粉酶是杂合α‑淀粉酶。真菌杂合α‑淀粉酶的优选实例包括WO 2005/003311或美国专利公开号2005/0054071(Novozymes)或美国专利申请号60/638,614(Novozymes)中公开的那些，其通过提述并入本文。杂合α‑淀粉酶可包含α‑淀粉酶催化域(CD)和糖结合域/模块(CBM)和任选的接头。
涵盖的杂合的α‑淀粉酶的具体实例包括美国申请号60/638,614中公开的那些，其包括具有催化域JA118和罗耳阿太菌(Athelia rolfsii)SBD的Fungamyl变体(美国申请号60/638,614中的SEQ ID NO:100)，具有罗耳阿太菌AMG接头和SBD的微小根毛霉α‑淀粉酶(美国申请号60/638,614中的SEQ ID NO:101)，和具有罗耳阿太菌葡糖淀粉酶接头和SBD的巨多孔菌α‑淀粉酶(美国申请号60/638,614中的SEQ ID NO:102)。
涵盖的杂合的α‑淀粉酶的其他具体实例包括公开于美国申请公开号2005/0054071中的那些，包括公开于第15页表3中的那些，如具有川地曲霉接头和淀粉结合域的黑曲霉α‑淀粉酶。
商业性α‑淀粉酶产品
优选的包含α‑淀粉酶的商业性组合物包括来自DSM(Gist Brocades)的MYCOLASE；BANTM，TERMAMYLTM SC，FUNGAMYLTM，LIQUOZYMETM X和SANTM SUPER，SANTM EXTRA L(Novozymes A/S)和CLARSETM L‑40,000，DEX‑LOTM，SPEZYMETM FRED，SPEZYMETM AA，SPEZYMETMEthyl，GC358，GC980，SPEZYMETM RSL，以及SPEZYMETM DELTA AA(Genencor Int.)，以及以商品名SP288出售的酸性真菌α‑淀粉酶(可从Novozymes A/S,Denmark获得)。
根据本发明，酸性α‑淀粉酶可以以0.1至10AFAU/g DS，优选0.10至5AFAU/g DS，特别是0.3至2AFAU/g DS的量添加。
糖浆的产生
本发明还提供了使用本发明的葡糖淀粉酶从含淀粉材料产生糖浆如葡萄糖等的工艺。合适的起始材料例示于上文的“含淀粉材料”部分。一般而言，所述工艺包括在α‑淀粉酶的存在下部分水解含淀粉材料(液化)，然后进一步在本发明的葡糖淀粉酶存在下糖化从淀粉或相关的寡糖或多糖分子的非还原端释放的葡萄糖的步骤。
可如上所述进行液化和糖化以供发酵产物的产生。
本发明的葡糖淀粉酶亦可以固定化的形式使用。对于产生特种糖浆(specialty syrup)，如麦芽糖糖浆，以及进一步对于涉及果糖糖浆如高果糖糖浆(HFS)的产生的寡糖萃余液流而言，这是合适并常用的。
因此本发明的该方面涉及从含淀粉材料产生糖浆的方法，包括：
(a)在α‑淀粉酶存在下液化含淀粉材料，和
(b)使用本发明的葡糖淀粉酶糖化在步骤(a)中获得的材料。
可从步骤(b)中获得的糖化的材料回收糖浆。
对于合适条件的细节可见于上文。
酿造
本发明的葡糖淀粉酶亦可用于酿造工艺。本发明的葡糖淀粉酶以本领域技术人员容易确定的有效量添加。
本文中所述和要求保护的发明的范围并不受本文中公开的具体实施方案所限，因为这些实施方案旨在说明本发明的多个方面。旨在将任何等同的实施方案包含于本发明的范围之内。事实上，根据前述的描述，除了本文中显示和描述的之外，本发明的多种修饰对于本领域技术人员会是显而易见的。亦旨在将此类修饰包含于所附权利要求的范围内。在出现冲突时，以包括定义在内的本公开为准。
本文中引用了多个参考文献，其公开以全文提述的方式并入本文。本发明进一步通过下述实施例描述，其不应视作对本发明的范围的限制。
材料和方法
酵母：可从Red Star/Lesaffre,USA获得的RED STARTM
培养基和试剂：
用作缓冲液和底物的化学品为至少试剂级的商品。
PDA：39g/L Potato Dextrose Agar，20g/L琼脂，50ml/L甘油
方法
除非另行指明，DNA操作和转化使用Sambrook等(1989)Molecular cloning:A laboratory manual,Cold Spring Harbor lab.,Cold Spring Harbor,NY；Ausubel,F.M.等(编)"Current protocols in Molecular Biology",John Wiley and Sons,1995;Harwood,C.R.,和Cutting,S.M.(编)"Molecular Biological Methods for Bacillus".John Wiley and Sons,1990中所述的分子生物学标准方法进行。
葡糖淀粉酶活性
葡糖淀粉酶活性可以AGI单位或葡糖淀粉酶单位(AGU)测定。
葡糖淀粉酶活性(AGI)
葡糖淀粉酶(等价于淀粉葡糖苷酶)将淀粉转化为葡萄糖。葡萄糖的量在本文中通过供活性确定的葡萄糖氧化酶方法来确定。该方法描述于“Approved methods of the American Association of Cereal Chemists”.Vbl.1‑2 AACC,来自American Association of Cereal Chemists,(2000);ISBN:1‑891127‑12‑8的部分76‑11 Starch—Glucoamylase Method with Subsequent Measurement。
一个葡糖淀粉酶单位(AGI)为在所述方法的标准条件下每分钟形成1微摩尔葡萄糖的酶的量。
标准条件/反应条件
底物：        可溶性淀粉，浓度大约为16g干物质/L
缓冲液：      乙酸(盐)，大约0.04M，pH=4.3
pH：          4.3
温育温度      60℃
反应时间：    15分钟
反应的终止：  添加NaOH至大约0.2g/L的浓度(pH~9)
酶浓度：      0.15‑0.55AAU/mL.
所述淀粉应为Litner淀粉，其为在实验室中用作比色指示剂的轻沸淀粉(thin‑boiling starch)。Linter淀粉是通过对天然淀粉进行稀盐酸处理使其保留与碘反应呈蓝色的能力而获得的。
葡糖淀粉酶活性(AGU)
Novo Glucoamylase Unit(AGU)定义为在37℃，pH4.3，底物：麦芽糖23.2mM，缓冲液：乙酸盐0.1M，反应时间5分钟的标准条件下每分钟水解1微摩尔麦芽糖的酶量。
可使用自动分析系统。将变旋酶添加到葡萄糖脱氢酶试剂中，使得任何存在的α‑D‑葡萄糖转化为β‑D‑葡萄糖。葡萄糖脱氢酶特异性地与β‑D‑葡萄糖在上述反应中反应，形成NADH，其使用光度计在340nm处测定作为起始葡萄糖浓度的量度。
  AMG温育：  底物：  麦芽糖23.2mM  缓冲液：  乙酸(盐)0.1M  pH：  4.30±0.05  温育温度：  37℃±1  反应时间：  5分钟  酶工作范围：  0.5‑4.0AGU/mL
  颜色反应：  GlucDH：  430U/L  变旋酶：  9U/L  NAD：  0.21mM  缓冲液：  磷酸盐0.12M;0.15M NaCl  pH：  7.60±0.05  温育温度  37℃±1  反应时间：  5分钟  波长：  340nm
更详细描述此分析方法的文件夹(EB‑SM‑0131.02/01)可根据要求由Novozymes A/S,Denmark得到，其通过提述并入本文。
α‑淀粉酶活性(KNU)
α‑淀粉酶活性可使用马铃薯淀粉作为底物来确定。该方法基于酶对于改性马铃薯淀粉的分解，并通过将淀粉/酶溶液的样本与碘溶液混合来跟踪反应。起初，形成了蓝黑色(blackish blue)，但在淀粉分解过程中，蓝色越来越淡，并逐渐变为红棕色(reddish‑brown)，将其与有色玻璃标准(colored glass standard)进行比较。
一个千Novo α‑淀粉酶单位(KNU)定义为在标准条件下(即，在37℃+/‑0.05；0.0003M Ca2+；以及pH 5.6)糊精化5260mg的淀粉干底物Merck Amylum Solubile的酶量。
更详细描述该分析方法的文件夹EB‑SM‑0009.02/01可根据要求由Novozymes A/S,Denmark得到，其通过提述并入本文。
酸性α‑淀粉酶活性
当根据本发明使用时，任何酸性α‑淀粉酶的活性可以AFAU(酸性真菌α‑淀粉酶单位)测量。或者，酸性α‑淀粉酶的活性可以AAU(酸性α‑淀粉酶单位)测量。
酸性α‑淀粉酶单位(AAU)
酸性α‑淀粉酶活性可以AAU(酸性α‑淀粉酶单位)测量，其为绝对方法。一个酸性淀粉酶单位(AAU)为在标准化条件下每小时将1g的淀粉(100%的干物质)转化为在与已知强度的碘溶液反应之后在620nm具有与一种色度参照相同的发射(transmission)的产物的酶的量。
标准条件/反应条件：
底物：              可溶性淀粉，浓度约为20g DS/L
缓冲液：            柠檬酸(盐)，大约0.13M，pH=4.2
碘溶液：            40.176g碘化钾+0.088g碘/L
自来水(city water)：15°‑20°dH(German硬度)
pH：                4.2
温育温度：          30℃
反应时间：          11分钟
波长：              620nm
酶浓度：            0.13‑0.19AAU/mL
酶工作范围          0.13‑0.19AAU/mL
所述淀粉应为Litner淀粉，其为在实验室中用作比色指示剂的轻沸淀粉。Linter淀粉是通过对天然淀粉进行稀盐酸处理使其保留与碘反应呈蓝色的能力而获得的。更多细节可见于EP0140410B2，其通过提述并入本文。
酸性α‑淀粉酶活性(AFAU)
酸性α‑淀粉酶活性可以AFAU(酸性真菌α‑淀粉酶单位)进行测量，其相对于酶标准物来确定。1AFAU定义为在下面提及的标准条件下每小时降解5.260mg淀粉干物质的酶量。
酸性α‑淀粉酶，其为内切α‑淀粉酶(1,4‑α‑D‑葡聚糖‑葡聚糖水解酶，E.C.3.2.1.1)水解淀粉分子内部区域中的α‑1,4‑葡糖苷键以形成具有不同链长的寡糖和糊精。与碘形成的颜色的强度与淀粉浓度成正比。使用反向比色法(reverse colorimetry)在规定的分析条件下测定淀粉浓度的降低作为淀粉酶活性。

λ=590nm
蓝色/紫色    t=23秒    脱色
标准条件/反应条件
底物：          可溶性淀粉，大约0.17gL
缓冲液：        柠檬酸(盐)，大约0.03M
碘(I2)：        0.03g/L
CaCl2：         1.85mM
pH：            2.50±0.05
温育温度：      40℃
反应时间        23秒
波长            590nm
酶浓度          0.025AFAU/mL
酶工作范围      0.01‑0.04AFAU/mL
更详细描述该分析方法的文件夹EB‑SM‑0259.02/01可根据要求由Novozymes A/S,Denmark得到，其通过提述并入本文。
实施例1：
用血红密孔菌AMG的同时糖化和发酵(SSF)
在不同酶剂量测量了血红密孔菌葡糖淀粉酶的SSF性能。发酵在下述条件下运行：
底物：将磨碎的玉米用逆流制浆，并将其干物质调整至大约32%(w/w)。然后将其在85℃和pH 5.8液化。液化的醪具有13.4的DE。
温度：32℃
起始pH：5.0
酶剂量：在黑曲霉中以30、40、55和70微克酶蛋白/g DS产生血红密孔菌AMG。
将酶与以相同剂量添加的商业性埃默森踝节菌(Talaromyces emersonii)AMG的纯化样品相比较。埃默森踝节菌AMG的最高剂量等价于0.56AGU/g DS的产业上有意义的量。使用过量的商业性AMG和α‑淀粉酶制备针对最大可获得的糖化的对照。
发酵
向SSF的底物添加1000ppm尿素作为氮源和3ppm青霉素以控制细菌，用H2SO4将pH调整至5.0。将5g醪的等分试样转移至在顶部钻孔以供CO2释放的15ml离心管。添加酶和酵母，并将试管置于水浴中，在32℃无搅拌放置54小时。
在HPLC中分析样品以供确定在发酵过程中产生的乙醇。结果示于下表：

实施例2：
用密孔菌属菌种AMG的生淀粉水解
材料
3%生淀粉悬液：制备至100mM乙酸钠，1mM CaCl2，0.025%NaN3和3%玉米淀粉。将每个组分按照160ml制备物制备，并在pH调整之后，用milliQ水将体积调整至仅为152ml，因为接着当与下述酶混合时每种组分将具有正确浓度。
Glucose CII测试试剂盒(Wako)
纯化的密孔菌属或踝节菌属AMG：纯化的样品不应含有α‑淀粉酶。
纯化的瓣环栓菌AMG(对照)：纯化的样品不应含有α‑淀粉酶。应已知AGU活性。
纯化的JA126ANα‑淀粉酶A：由微小根毛霉(Rhizomucor pusillus)α‑淀粉酶与黑曲霉葡糖淀粉酶接头和如WO 2006/069290(Novozymes A/S)中的表5中作为V039公开的SBD组成的杂合α‑淀粉酶。
方法
1)将纯化的AMG和JA126AN用milliQ稀释至下述目标浓度。
AMG:A280=0.12
瓣环栓菌AMG：0.34AGU/ml(对应于A280=0.12)
JA126AN:A280=0.0024
测定1(无JA126)
样品：(20微升AMG+20微升milliQ)x4个孔
对照：(20微升瓣环栓菌AMG+20微升milliQ)x4个孔
测定2(有JA126)
样品：(20微升AMG+20微升JA126)x4个孔
对照：(20微升瓣环栓菌AMG+20微升JA126)x4个孔
2)将760微升的3%生淀粉悬液添加至孔。
3)将平板在32℃振荡温育18小时。在温育之前和温育18小时之后，在适当稀释之后使用Glucose CII测试试剂盒(Wako)测量葡萄糖浓度。
4)计算在18小时中产生的葡萄糖的量。RSH活性表示为对于瓣环栓菌AMG活性的相对值。
测定1：RSH活性(%，无JA126)=(由AMG产生的葡萄糖)/(由瓣环栓菌AMG产生的葡萄糖)
测定2：RSH活性(%，有JA126)=(由AMG+JA126产生的葡萄糖)/(由瓣环栓菌AMG+JA126产生的葡萄糖)

血红密孔菌葡糖淀粉酶的生淀粉水解(RSH)活性在下述条件下测试：
底物：3%生淀粉(玉米，Sigma目录#S9679)，悬于100mM乙酸钠，1mM氯化钙和0.025%叠氮化钠，pH 4.0
酶剂量：将纯化的血红密孔菌AMG调整至具有0.003的最终A280吸光度。水解测试作为对比测试进行，其中将纯化的密孔菌属或埃默森踝节菌AMG与瓣环栓菌AMG(A280=0.003)的纯化样品在纯化的α‑淀粉酶JA126AN(A280=0.00006)的存在(有JA126)或不存在(无JA126)下进行比较。确定在反应过程中产生的葡萄糖。
葡萄糖测量：Glucose CII测试(Wako Chemical,目录#301‑67002)
温度：32℃
温育时间：18小时
测试结果示于下表3。

生物材料的保藏
下述的生物材料已经依据布达佩斯条约的条款保藏于德意志微生物和细胞培养物保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH，DSM),Mascheroder Weg 1B,D‑38124 Braunschweig,Germany，并给予下述的登录号：
保藏物：具有包含序列D4TU(SEQ ID NO:1)的质粒的大肠杆菌菌株NN059222
登录号：DSM 23221    保藏日期：2010年1月13日
所述菌株于下述条件下保藏：确保在本专利申请未决期间，依据该外国专利法律的授权的人能够获得所述培养物。所述保藏物为所保藏菌株的基本上纯的培养物。在提交了该申请的副本，或其后续文本的国家，依据该外国专利法律可以获得所述保藏物。然而，应当理解，保藏物的获得并不构成对实施本发明的许可，实施本发明是对政府行为所授予的专利权的侵犯。

资源描述

《具有葡糖淀粉酶活性的多肽和编码该多肽的多核苷酸.pdf》由会员分享，可在线阅读，更多相关《具有葡糖淀粉酶活性的多肽和编码该多肽的多核苷酸.pdf（51页珍藏版）》请在专利查询网上搜索。

1、(10)申请公布号 CN 102869771 A (43)申请公布日 2013.01.09 CN 102869771 A *CN102869771A* (21)申请号 201080062699.4 (22)申请日 2010.11.30 DSM 23221 2010.01.13 61/264,977 2009.11.30 US C12N 9/34(2006.01) C12P 19/14(2006.01) C12P 7/06(2006.01) (71)申请人诺维信公司地址丹麦鲍斯韦申请人诺维信北美公司 (72)发明人 S. 兰德维克 M.D. 莫兰特綾部圭 G. 科沃德 - 凯利 (7。

2、4)专利代理机构北京市柳沈律师事务所 11105 代理人史悦 (54) 发明名称具有葡糖淀粉酶活性的多肽和编码该多肽的多核苷酸 (57) 摘要本发明涉及具有葡糖淀粉酶活性的分离的多肽和编码所述多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞，以及产生和使用所述多肽的方法。 (30)优先权数据 (85)PCT申请进入国家阶段日 2012.07.30 (86)PCT申请的申请数据 PCT/US2010/058438 2010.11.30 (87)PCT申请的公布数据 WO2011/066576 EN 2011.06.03 (83)生物保藏信息 (5。

3、1)Int.Cl. 权利要求书 2 页说明书 34 页序列表 14 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请权利要求书 2 页说明书 34 页序列表 14 页 1/2 页 2 1. 一种具有葡糖淀粉酶活性的分离的多肽，其选自下组： (a)多肽，其包含氨基酸序列，所述氨基酸序列与SEQ ID NO:2、 SEQ ID NO:4或SEQ ID NO:6的成熟多肽具有优选至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，并且甚至最优选至少95%，如至少96%，至少97%，至少98%，至少99%或甚至 10。

4、0% 同一性； (b)多肽，其包含氨基酸序列，所述氨基酸序列与SEQ ID NO:2、 SEQ ID NO:4或SEQ ID NO:6的氨基酸22至476所示的催化域具有优选至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，并且甚至最优选至少95%，如至少96%，至少97%，至少 98%，至少 99% 或甚至 100% 同一性； (c) 多肽，其由多核苷酸编码，所述多核苷酸在优选至少中 - 高严格条件下，和最优选至少高严格条件下与以下杂交： (i)SEQ ID NO:1、 SEQ ID NO:3 或 SEQ ID NO:。

5、5 的成熟多肽编码序列， (ii) 包含于 SEQ ID NO:1、 SEQ ID NO:3 或 SEQ ID NO:5 的 cDNA 序列，或 (iii) (i) 或 (ii) 的全长互补链； (d) 多肽，其由多核苷酸编码，所述多核苷酸包含核苷酸序列，所述核苷酸序列与 SEQ ID NO:1、 SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列具有优选至少90%，更优选至少 91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，并且甚至最优选至少95%，如甚至至少 96%， 97%， 98%， 99% 或 100% 同一性；和 (e)。

6、SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的成熟多肽的包含取代、缺失和 / 或插入一个或多个 ( 几个 ) 氨基酸的变体。 2. 权利要求 1 的多肽，其包含 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的氨基酸序列， SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的成熟多肽的氨基酸序列，或它们具有葡糖淀粉酶活性的片段；或由SEQ ID NO:2、 SEQ ID NO:4或SEQ ID NO:6的氨基酸序列， SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID 。

7、NO:6 的成熟多肽的氨基酸序列，或它们具有葡糖淀粉酶活性的片段组成。 3. 权利要求 1 或 2 的多肽，其由多核苷酸编码，所述多核苷酸包含 SEQ ID NO:1、 SEQ ID NO:3 或 SEQ ID NO:5 的核苷酸序列，或它们编码具有葡糖淀粉酶活性的片段的亚序列；或由 SEQ ID NO:1、 SEQ ID NO:3 或 SEQ ID NO:5 的核苷酸序列，或它们编码具有葡糖淀粉酶活性的片段的亚序列组成。 4. 权利要求 1-3 任一项的多肽，其由大肠杆菌 DSM 23221 中包含的质粒中包含的多核苷酸编码。 5.权利要求1-4任一项的多肽，其中所述。

8、成熟多肽是SEQ ID NO:2、 SEQ ID NO:4或SEQ ID NO:6 的氨基酸 19 至 573。 6. 一种具有糖结合活性的分离的多肽，其包含糖结合模块，所述模块与 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的氨基酸 479 至 573 所示的糖结合域具有至少 80%，更优选至少 81%，更优选至少 82%，更优选至少 83%，更优选至少 84%，更优选至少 85%，更优选至少 86%，更优选至少 87%，更优选至少 88%, 更优选至少 89%，更优选至少 90%，更优选至少 91%，更优选至少 92%，甚至更。

9、优选至少 93%，最优选至少 94%，并且甚至最优选至少 95%，如至少 95%，至少 97%，至少 98%，至少 99% 或甚至 100% 同一性。 7. 一种杂合酶，其包含催化域和权利要求 6 的糖结合域。权利要求书 CN 102869771 A 2 2/2 页 3 8. 权利要求 7 的杂合酶，其中所述催化域具有选自下组的酶活性： - 淀粉酶，淀粉支链淀粉酶 (amylopullulanase)， - 淀粉酶， CGT 酶，葡糖淀粉酶，异淀粉酶，产麦芽糖淀粉酶和支链淀粉酶。 9. 一种分离的多核苷酸，其包含编码权利要求 1-8 任一项的多肽的核苷。

10、酸序列。 10. 一种核酸构建体，其包含可操作连接的权利要求 9 的多核苷酸和指导所述多肽在表达宿主中产生的一种或多种 ( 几种 ) 调控序列。 11. 一种重组表达载体，其包含权利要求 10 的核酸构建体。 12. 一种重组宿主细胞，其包含权利要求 10 的核酸构建体。 13. 一种产生权利要求 1-8 任一项的多肽的方法，包括： (a) 在有助于所述多肽产生的条件下培养包含核酸构建体的宿主细胞，所述核酸构建体包含编码所述多肽的核苷酸序列；和 (b) 回收所述多肽。 14. 一种产生权利要求 1-8 任一项的多肽的方法，包括： (a) 在有助于所述多肽产生的条件下。

11、培养转基因植物或植物细胞，所述植物或植物细胞包含编码所述多肽的多核苷酸；和 (b) 回收所述多肽。 15. 一种转基因植物、植物部分或植物细胞，其用编码权利要求 1-8 任一项的多肽的多核苷酸转化。 16. 权利要求 1-8 任一项的多肽用于产生糖浆和 / 或发酵产物的用途。 17. 权利要求 16 的用途，其中所述起始材料为糊化的或未糊化的含淀粉材料。 18. 权利要求 1-8 任一项的多肽用于酿造的用途。 19. 一种组合物，其包含 - 淀粉酶和权利要求 1-8 任一项的多肽。 20. 一种从含淀粉材料产生发酵产物的方法，包括下述步骤： (a) 液化含淀粉材料； (b。

12、) 糖化经液化的材料；和 (c) 用发酵生物发酵；其中步骤 (b) 使用至少一种权利要求 1-5 任一项的葡糖淀粉酶进行。 21. 一种从含淀粉材料产生发酵产物的方法，包括下述步骤： (a) 在含淀粉材料的起始糊化温度以下的温度糖化所述含淀粉材料；和 (b) 用发酵生物发酵；其中步骤 (a) 使用至少一种权利要求 1-5 任一项的葡糖淀粉酶进行。权利要求书 CN 102869771 A 3 1/34 页 4 具有葡糖淀粉酶活性的多肽和编码该多肽的多核苷酸 0001 涉及序列表 0002 本申请含有计算机可读形式的序列表，所述计算机可读形式通过提述并入本文。 00。

13、03 涉及生物材料的保藏 0004 本申请包含对于生物材料保藏的引用，所述保藏通过提述并入本文。对于其完整信息，参见说明书最后一段。 0005 发明背景发明领域 0006 本发明涉及具有葡糖淀粉酶活性的多肽和编码所述多肽的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞，以及用于产生和使用所述多肽的方法，和本发明的葡糖淀粉酶用于淀粉转化以产生发酵产物如乙醇，和糖浆如葡萄糖的用途。本发明还涉及包含本发明的葡糖淀粉酶的组合物。 0007 相关领域描述 0008 葡糖淀粉酶 (1,4-D- 葡聚糖葡糖水解酶， EC 3.2.1.3) 是催化从淀粉或相关的寡。

14、糖和多糖分子的非还原端释放 D- 葡萄糖的酶。葡糖淀粉酶由几种丝状真菌和酵母产生，其中来自曲霉属 (Aspergillus) 的那些在商业上最为重要。 0009 商业上，使用葡糖淀粉酶将已经由 - 淀粉酶部分水解的淀粉材料转化为葡萄糖。然后可使用发酵生物将葡萄糖直接或间接地转化为发酵产物。商业性发酵产物的实例包括醇 ( 例如乙醇，甲醇，丁醇， 1,3- 丙二醇 )，有机酸 ( 例如柠檬酸，乙酸，衣康酸，乳酸，葡糖酸，葡糖酸盐，乳酸，琥珀酸， 2,5- 二酮 -D- 葡糖酸 ) ；酮 ( 例如丙酮 ) ；氨基酸 ( 例如谷氨酸 ) ；气体 ( 例如 H2和。

15、CO2)，和更复杂的化合物，包括例如抗生素 ( 例如青霉素和四环素 ) ；酶；维生素 ( 例如核黄素， B12， - 胡萝卜素 ) ；激素，和其他难以合成产生的化合物。发酵工艺亦常用于可饮用醇类 ( 例如啤酒和葡萄酒 ) 工业。 0010 终产物亦可为糖浆。例如，终产物可为葡萄糖，但亦可例如由葡萄糖异构酶转化为果糖或由几乎等量的葡萄糖和果糖构成的混合物。该混合物，或进一步富集果糖的混合物，是整个世界商业化的最常用的高果糖玉米糖浆 (HFCS)。 0011 本发明的一个目的是提供具有葡糖淀粉酶活性的多肽和编码所述多肽的多核苷酸，其在发酵产物生产工艺 ( 如乙醇生。

16、产工艺，包括由未糊化的生 ( 或未烹制 ) 淀粉的一步乙醇发酵工艺 ) 中提供高产率 / 得率 (yield)。 0012 Uniprot:B0CVJ1 公开了来自双色蜡蘑 (Laccaria bicolor) 的多肽且 WO2006/069289 描述了来自瓣环栓菌 (Trametes cingulata) 的葡糖淀粉酶。 0013 发明概述 0014 已鉴定并表征了由真菌血红密孔菌(Pycnoporus sanguineus)产生并具有葡糖淀粉酶活性的多肽。 0015 相应地，本发明在第一个方面涉及具有葡糖淀粉酶活性的分离的多肽，选自下组： (a)多肽，。

17、其包含氨基酸序列，所述氨基酸序列与SEQ ID NO:2、 SEQ ID NO:4或SEQ ID NO:6 说明书 CN 102869771 A 4 2/34 页 5 的成熟多肽具有优选至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少94%，并且甚至最优选至少95%，如至少96%，至少97%，至少98%，至少99%或甚至100% 同一性； (b)多肽，其包含氨基酸序列，所述氨基酸序列与SEQ ID NO:2、 SEQ ID NO:4或SEQ ID NO:6 的氨基酸 22 至 476 所示的催化域具有优选至少 90%，更优选至少。

18、 91%，更优选至少 92%，甚至更优选至少93%，最优选至少94%，并且甚至最优选至少95%，如至少96%，至少97%，至少 98%，至少 99% 或甚至 100% 同一性； (c) 多肽，其由多核苷酸编码，所述多核苷酸在优选至少中 - 高严格条件下，并且最优选在高严格条件下与以下杂交： (i)SEQ ID NO:1、 SEQ ID NO:3 或 SEQ ID NO:5 的成熟多肽编码序列； (ii) 包含于 SEQ ID NO:1、 SEQ ID NO:3 或 SEQ ID NO:5 中的 cDNA 序列，或 (iii)(i) 或 (ii) 的全长互补链；。

19、 (d) 多肽，其由多核苷酸编码，所述多核苷酸包含核苷酸序列，所述核苷酸序列与 SEQ ID NO:1、 SEQ ID NO:3 或 SEQ ID NO:5 的成熟多肽编码序列具有优选至少 90%，更优选至少 91%，更优选至少 92%，甚至更优选至少 93%，最优选至少 94%，并且甚至最优选至少 95%，如至少 96%，至少 97%，至少 98%，至少 99% 或甚至 100% 同一性；和 (e)SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的成熟多肽的包含一个或多个 ( 几个 ) 氨基酸的取代、缺失和 / 或插入变体。。

20、0016 本发明在第二个方面涉及分离的多核苷酸，其包含编码第一个方面的多肽的核苷酸序列。 0017 在进一步的方面，本发明涉及包含第二个方面的多核苷酸的核酸构建体，重组表达载体，重组宿主细胞，转基因植物、植物部分或植物细胞。 0018 在又进一步的方面，本发明涉及产生所述多肽的方法，所述多肽的用途，和包含 - 淀粉酶和所述多肽的组合物。 0019 定义 0020 葡糖淀粉酶：术语葡糖淀粉酶 (1,4-D- 葡聚糖葡糖水解酶， 3.2.1.3) 定义为催化从淀粉或相关的寡糖和多糖分子的非还原端释放 D- 葡萄糖的酶。就本发明而言，葡糖淀粉酶活性根据下文 “材料和方。

21、法” 部分描述的步骤确定。 0021 本发明的多肽具有 SEQ ID NO:2 的成熟多肽或其同源序列，或者 SEQ ID NO:4 的成熟多肽或其同源序列，或者 SEQ ID NO:6 的成熟多肽或其同源序列的葡糖淀粉酶活性的至少 20%，优选至少 40%，优选至少 45%，更优选至少 50%，优选至少 55%，更优选至少 60%，优选至少65%，更优选至少70%，优选至少75%，更优选至少80%，优选至少85%，甚至更优选至少 90%，最优选至少 95%，和甚至最优选至少 100%。 0022 分离的多肽：术语 “分离的多肽” 用于本文中指从来源分离。

22、的多肽。优选地，所述多肽如通过 SDS-PAGE 测定的，为至少 1% 纯，优选至少 5% 纯，更优选至少 10% 纯，更优选至少 20% 纯，更优选至少 40% 纯，更优选至少 60% 纯，甚至更优选至少 80% 纯，并且最优选至少 90% 纯。 0023 基本上纯的多肽：术语 “基本上纯的多肽” 在本文表示多肽制备物，所述多肽制备物含有按重量计至多10%，优选至多8%，更优选至多6%，更优选至多5%，更优选至多4%，更优选至多 3%，甚至更优选至多 2%，最优选至多 1%，并且甚至最优选至多 0.5% 的与其天然或重组结合的 (associ。

23、ated) 的其它多肽材料。因此，优选所述基本上纯的多肽是按存在于制备物中的全部多肽材料的重量计至少 92% 纯，优选至少 94% 纯，更优选至少 95% 纯，更优选至少 96% 纯，更优选至少 96% 纯，更优选至少 97% 纯，更优选至少 98% 纯，甚至更优选至少 99% 说明书 CN 102869771 A 5 3/34 页 6 纯，最优选至少 99.5% 纯，并且甚至最优选 100% 纯。本发明的多肽优选是基本上纯的形式，即，所述多肽制备物基本上 (essentially) 不含与其天然或重组结合的其它多肽材料。例如，这能够通过以下实现：通过公。

24、知的重组方法或由经典纯化方法制备多肽。 0024 成熟多肽：术语 “成熟多肽” 意指为以其在翻译和任何翻译后修饰之后的最终形式存在的多肽，所述修饰如N-末端加工、 C-末端截短、糖基化、磷酸化等。在一个方面，基于预测 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的氨基酸 1 至 18 是信号肽的 SignalP 程序 (Nielsen 等 ,1997,Protein Engineering10:1-6)，所述成熟多肽是 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的氨基酸 19 至 573。优选地，所述成。

25、熟多肽是 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的氨基酸 19 至 573。由 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的氨基酸 22 至 476 定义的序列是催化域，而由 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的氨基酸 479 至 573 定义的序列是淀粉结合域。 0025 成熟多肽编码序列：术语 “成熟多肽编码序列” 在本文中定义为编码具有葡糖淀粉酶活性的成熟多肽的核苷酸序列。优选地，所述成熟多肽编码序列是由 SEQ ID NO:1 的位置 55 至 159，。

26、229 至 505， 573 至 877， 932 至 1207， 1269 至 1731， 1800 至 1895， 1962 至 2104， SEQ ID NO:3 或 SEQ ID NO:5 的位置 55 至 159， 229 至 504， 571 至 876， 942 至 1217， 1276 至 1738， 1806 至 1901， 1960 至 2102 定义的核苷酸。 0026 同一性：参数 “同一性” 描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。 0027 就本发明而言，两个氨基酸序列之间的同一性程度使用如 EMBOSS 软件包 (EMBOSS:The Euro。

27、pean Molecular Biology Open Software Suite,Rice等,2000,Trends in Genetics 16:276-277)( 优选 3.0.0 版或更高版本 ) 的 Needle 程序中所执行的 Needleman-Wunsch 算法 (Needleman 和 Wunsch,1970,J.Mol.Biol.48:443-453) 来测定。使用的可选参数为缺口开启罚分 (gap open penalty)10，缺口延伸罚分 (gap extension penalty)0.5 和 EBLOSUM62(BLOSUM62 的 EMBOSS 版。

28、) 取代矩阵。使用 Needle 标记为 “最长同一性 (longest identity)” 的输出结果 ( 使用 -nobrief 选项获得 ) 作为百分比同一性，并计算如下： 0028 ( 同样的残基 100)/( 比对长度 - 比对中缺口的总数 ) 0029 就本发明而言，两个脱氧核糖核苷酸序列之间的同一性程度使用如 EMBOSS 软件包 (EMBOSS:The European Molecular Biology Open Software Suite,Rice 等 ,2000, 见上文 )( 优选 3.0.0 版或更高版本 ) 的 Needle 程序中所执行的 Need。

29、leman-Wunsch 算法 (Needleman 和 Wunsch,1970, 见上文 ) 来测定。使用的可选参数为缺口开启罚分 10，缺口延伸罚分 0.5 和 EDNAFULL(NCBI NUC4.4 的 EMBOSS 版 ) 取代矩阵。使用 Needle 标记为 “最长同一性” 的输出结果 ( 使用 -nobrief 选项获得 ) 作为百分比同一性，并计算如下： 0030 ( 同样的脱氧核糖核苷酸 100)/( 比对长度比对中缺口的总数 ) 0031 同源序列：术语 “同源序列” 在本文中定义为分别与 SEQ ID NO:1、 SEQ ID NO:3 或 SEQ ID N。

30、O:5 的成熟多肽编码部分，或者与 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的成熟多肽具有至少90%，更优选至少91%，更优选至少92%，甚至更优选至少93%，最优选至少 94%，和甚至最优选至少 95%，如至少 96%，至少 97%，至少 98%，或甚至至少 99% 同一性程度的核苷酸序列 / 多肽序列。说明书 CN 102869771 A 6 4/34 页 7 0032 多肽片段：术语 “多肽片段” 在本文中定义为从 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的成熟多肽或其同源序列的。

31、氨基和 / 或羧基末端缺失一个或多个 ( 几个 ) 氨基酸的多肽；其中所述片段具有葡糖淀粉酶活性。优选地，片段含有 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的成熟多肽或其同源序列的至少 500 个氨基酸残基，更优选至少 450 个氨基酸残基，和最优选至少 400 个氨基酸残基。具体片段是由 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的的氨基酸 22 至 476 定义的序列，其包含本发明的多肽的催化域。 0033 亚序列：术语 “亚序列 (subsequence)” 在本文中定义为从 SEQ ID NO。

32、:1、 SEQ ID NO:3 或 SEQ ID NO:5 的成熟多肽编码序列或其同源序列的 5 和 / 或 3 端缺失一个或多个 ( 几个 ) 核苷酸的核苷酸序列；其中所述亚序列编码具有葡糖淀粉酶活性的多肽片段。优选地，亚序列含有 SEQ ID NO:1 的成熟多肽编码序列、 SEQ ID NO:3 的成熟多肽编码序列或 SEQ ID NO:5的成熟多肽编码序列或其同源序列的至少1500个核苷酸，更优选至少1400个核苷酸，和最优选至少 1200 个核苷酸。 0034 等位变体 (allelic variant) ：术语 “等位变体” 在本文中表示占据相同染色体基因座的基因。

33、的任何两种或两种以上可选形式。等位变异通过突变天然地发生，并且可导致种群内的多态性。基因突变可以是沉默的 ( 在编码的多肽中无变化 ) 或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。 0035 分离的多核苷酸：术语 “分离的多核苷酸” 用于本文中指从来源分离的多核苷酸。优选地，多核苷酸如通过琼脂糖电泳测定的，为至少 1% 纯，优选至少 5% 纯，更优选至少 10% 纯，更优选至少 20% 纯，更优选至少 40% 纯，更优选至少 60% 纯，甚至更优选至少 80% 纯，并且最优选至少 90% 纯。 0036 基本上纯的多核苷酸。

34、：术语 “基本上纯的多核苷酸” 用于本文指不含其它外来的或不期望的核苷酸的多核苷酸制备物，并且所述多核苷酸制备物处于适合于在遗传工程的蛋白质生产体系中使用的形式。因此，基本上纯的多核苷酸含有按重量计至多 10%，优选至多 8%，更优选至多 6%，更优选至多 5%，更优选至多 4%，更优选至多 3%，甚至更优选至多 2%，最优选至多 1%，并且甚至最优选至多 0.5% 的与其天然或重组结合的其它多核苷酸材料。然而，基本上纯的多核苷酸可以包括天然存在的 5 和 3 非翻译区，例如启动子和终止子。优选基本上纯的多核苷酸是按重量计至少 90% 纯，优选至少 92%。

35、纯，更优选至少 94% 纯，更优选至少 95% 纯，更优选至少 96% 纯，更优选至少 97% 纯，甚至更优选至少 98% 纯，最优选至少 99%，并且甚至最优选至少 99.5% 纯的。本发明所述多核苷酸优选为基本上纯的形式，即，所述多核苷酸制备物基本上不含与其天然或重组结合的其它多核苷酸材料。所述多核苷酸可以是基因组、 cDNA、 RNA、半合成、合成来源的，或它们的任何组合。 0037 编码序列：当用于本文时术语 “编码序列” 的意思是直接指定其蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界通常由开读框决定，所述开读框通常以 ATG 起始密码子。

36、或可供选择的起始密码子例如 GTG 和 TTG 开始，并且以终止密码子例如 TAA、 TAG 和 TGA 结束。编码序列可以是 DNA、 cDNA、合成的或重组的核苷酸序列。 0038 cDNA ：术语 “cDNA” 在本文中定义为可通过逆转录从自真核细胞获得的成熟的、剪接的 mRNA 分子制备的 DNA 分子。cDNA 缺乏通常存在于相应的基因组 DNA 中的内含子序列。该起始的、初级的 RNA 转录物是 mRNA 的前体，其经历一系列步骤，最后作为成熟的、剪接的 mRNA出现。这些步骤包括通过称作剪接的过程去除内含子序列。因此，来源于mRNA的cDNA 说明书。

37、 CN 102869771 A 7 5/34 页 8 不含任何内含子序列。 0039 核酸构建体：术语 “核酸构建体” 用于本文指单链或双链的核酸分子，所述核酸分子分离自天然存在的基因，或将所述核酸分子以本来不存在于 (not otherwise exist) 自然界中的方式修饰以含有核酸的区段，或所述核酸分子是合成的。当所述核酸构建体含有表达本发明的编码序列所需的调控序列时，术语核酸构建体与术语 “表达盒” 同义。 0040 调控序列(control sequence) ：术语 “调控序列” 在本文定义为包括对编码本发明多肽的多核苷酸表达是必需的所有成分。各个调控序列。

38、对于编码所述多肽的核苷酸序列可以是天然的或外源的，或各个调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况，调控序列包括启动子和转录和翻译的终止信号。调控序列可以和用于引入特异性限制位点的接头一起提供，所述特异性限制位点促进调控序列与编码多肽的核苷酸序列编码区的连接。 0041 可操作地连接：术语 “可操作地连接” 在本文表示这样的构型，其中将调控序列置于相对于多核苷酸序列的编码序列的适当位置，使得调控序列指导多肽编码序列的表达。 0042 表达：术语 “表达” 包。

39、括涉及多肽产生的任何步骤，其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。 0043 表达载体：术语 “表达载体” 在本文定义为线性的或环状的 DNA 分子，其包含编码本发明多肽的多核苷酸，并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。 0044 宿主细胞：如本文中所使用的术语 “宿主细胞” 包括任何细胞类型，所述细胞类型对于使用包含本发明多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的 (susceptible)。 0045 修饰：术语 “修饰” 在本文的意思是，对分别由 SEQ ID NO:2、 SEQ ID NO:4 。

40、或 SEQ ID NO:6的成熟多肽或其同源序列组成的多肽的任何化学修饰，以及对编码所述多肽的DNA 的遗传操作。所述修饰可以是一个或多个 ( 几个 ) 氨基酸的取代、缺失和 / 或插入，以及一个或多个 ( 几个 ) 氨基酸侧链的置换。 0046 变体：当用于本文，术语 “变体” 意指具有葡糖淀粉酶活性的多肽，其在一个或多个 ( 几个 ) 位置包含改变，即一个或多个 ( 几个 ) 氨基酸残基的取代、插入和 / 或缺失。取代意指用不同的氨基酸取代占据某位置的氨基酸；缺失意指去除占据某位置的氨基酸；而插入意指邻接占据某位置的氨基酸添加 1-3 个氨基酸。 0047 。

41、发明详述 0048 具有葡糖淀粉酶活性的多肽 0049 在第一个方面，本发明涉及具有葡糖淀粉酶活性的分离的多肽 ( 在下文中称为 “同源多肽” )，所述多肽包含氨基酸序列，所述氨基酸序列与 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的成熟多肽具有优选至少 90%，更优选至少 91%，更优选至少 92%，甚至更优选至少 93%，最优选至少 94%，并且甚至最优选至少 95%，如至少 96%，至少 97%，至少 98%，至少 99% 或甚至 100% 的同一性程度。优选地，所述同源多肽具有氨基酸序列，所述氨基酸序列与 SEQ ID。

42、 NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的成熟多肽相差十个氨基酸，优选相差五个氨基酸，更优选相差四个氨基酸，甚至更优选相差三个氨基酸，最优选相差两个氨基酸，并说明书 CN 102869771 A 8 6/34 页 9 且甚至最优选相差一个氨基酸。 0050 本发明的多肽优选包含SEQ ID NO:2、 SEQ ID NO:4或SEQ ID NO:6的氨基酸序列或其等位变体，或其具有葡糖淀粉酶活性的片段。在另一个优选的方面，所述多肽包含 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的成熟多肽或其等位变体，或其具。

43、有葡糖淀粉酶活性的片段。在另一个优选的方面，所述多肽由 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的氨基酸序列或其等位变体，或其具有葡糖淀粉酶活性的片段组成。 0051 在第二个方面，本发明涉及具有葡糖淀粉酶活性的分离的多肽，其由多核苷酸编码，所述多核苷酸在优选非常低严格条件，更优选低严格条件，更优选中等严格条件，更优选中等 - 高严格条件，甚至更优选高严格条件，和最优选优选非常高严格条件下与以下杂交： (i)SEQ ID NO:1、 SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列； (ii)包含于SEQ I。

44、D NO:1、 SEQ ID NO:3 或 SEQ ID NO:5 的 cDNA 序列， (iii)(i) 或 (ii) 的亚序列；或 (iv)(i)、 (ii) 或 (iii) 的全长互补链 (J.Sambrook， E.F.Fritsch, 和 T.Maniatis,1989,Molecular Cloning， A Laboratory Manual, 第 2 版 ,Cold Spring Harbor， New York)。SEQ ID NO:1、 SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸，或优选至少 200 个连续的核。

45、苷酸。而且，所述亚序列可编码具有葡糖淀粉酶活性的多肽片段。优选地，所述互补链是 SEQ ID NO:1、 SEQ ID NO:3 或 SEQ ID NO:5 的成熟多肽编码序列的全长互补链。 0052 SEQ ID NO:1、 SEQ ID NO:3 或 SEQ ID NO:5 的核苷酸序列，或其亚序列，以及 SEQ ID NO:2、 SEQ ID NO:4 或 SEQ ID NO:6 的氨基酸序列，或其片段，可用于设计核酸探针，以根据本领域内公知的方法从不同属或种的菌株鉴定和克隆编码具有葡糖淀粉酶活性的多肽的DNA。具体而言，根据标准的Southern印迹方法，可。

46、将这些探针用于与感兴趣的属或种的基因组或 cDNA 杂交，以鉴定和分离其中相应的基因。这些探针可明显短于完整序列，但长度上应为至少14，优选至少25，更优选至少35，并且最优选至少70个核苷酸。然而，优选所述核酸探针是至少 100 个核苷酸长度。例如，所述核酸探针的长度可为至少 200 个核苷酸，优选至少 300 个核苷酸，更优选至少 400 个核苷酸，或最优选至少 500 个核苷酸。可使用甚至更长的探针，例如长度为优选至少 600 个核苷酸，更优选至少 700 个核苷酸，甚至更优选至少 800 个核苷酸，或最优选至少 900 个氨基酸的核酸探针。DN。

47、A 和 RNA 探针二者均可使用。通常将探针标记以探测相应的基因 ( 例如，用 33P、32P、3H、35S、生物素或抗生物素蛋白 (avidin) 标记 )。这些探针涵盖于本发明中。 0053 因而，可从由这些其它菌株制备的基因组 DNA 或 cDNA 文库中筛选 DNA，所述 DNA 与上述探针杂交并且编码具有葡糖淀粉酶活性的多肽。可以通过琼脂糖或聚丙烯酰胺凝胶电泳，或通过其它分离技术分离来自这些其它菌株的基因组或其它 DNA。可以将来自文库的 DNA 或分离的 DNA 转移至并且固定于硝化纤维素 (nitrocellulose) 或其它合适的载体材料。为了鉴定与 SE。

48、Q ID NO:1、 SEQ ID NO:3 或 SEQ ID NO:5，或其亚序列同源的克隆或 DNA，将所述载体材料优选用于 Sounthern 印迹中。 0054 就本发明而言，杂交表示核苷酸序列在非常低至非常高的严格条件下与标记的核酸探针杂交，所述核酸探针对应于 SEQ ID NO:1、 SEQ ID NO:3 或 SEQ ID NO:5 的成熟多肽编码序列；包含于SEQ ID NO:1、 SEQ ID NO:3或SEQ ID NO:5的cDNA序列；其全长互补链；或它们的亚序列。可使用例如 X 射线片 (X-ray film) 检测在这些条件下与核酸探针杂交。

49、说明书 CN 102869771 A 9 7/34 页 10 的分子。 0055 优选地，核酸探针是 SEQ ID NO:1、 SEQ ID NO:3 或 SEQ ID NO:5 的成熟多肽编码序列。 0056 在另一个优选的方面，核酸探针是编码SEQ ID NO:2的多肽的多核苷酸序列，或其亚序列。在另一个优选的方面，核酸探针是 SEQ ID NO:1。在另一个优选的方面，核酸探针是大肠杆菌菌株 DSM 23221 中的质粒中包含的多核苷酸序列，其中其多核苷酸序列编码具有葡糖淀粉酶活性的多肽。在另一个优选的方面，核酸探针是大肠杆菌菌株 DSM 23221 中的质粒中包含的成熟多肽编码区。 0057 在另一个优选的方面，核酸探针是 SEQ ID NO:3 的成熟多肽编码序列。在另一个优选的方面，核酸探针是编码 SEQ ID NO:4 的多肽的多核苷酸序列，或其亚序列。在另一个优选的方面，核酸探针是 SEQ ID NO:3。 0058 在另一个优选的方面，核酸探针是 SEQ ID 。

展开阅读全文