自加工的植物及植物部分.pdf

上传人:七月 文档编号:8599518 上传时间:2020-09-14 格式:PDF 页数:233 大小:12.84MB
返回 下载 相关 举报
摘要
申请专利号:

CN200610009033.8

申请日:

20020827

公开号:

CN1821412A

公开日:

20060823

当前法律状态:

有效性:

失效

法律详情:

IPC分类号:

C12N15/56,C12N15/61,C12N9/24,C12N9/26,C12N9/44,C12N9/34,C12N9/92,C12N15/82,C12N1/21,C12N5/04,A01H5/00,C12P19/00,C12P7/06

主分类号:

C12N15/56,C12N15/61,C12N9/24,C12N9/26,C12N9/44,C12N9/34,C12N9/92,C12N15/82,C12N1/21,C12N5/04,A01H5/00,C12P19/00,C12P7/06

申请人:

辛根塔参与股份公司

发明人:

M·B·拉纳汉,S·S·巴苏,C·J·巴泰,陈文,J·克莱格,M·肯克玛

地址:

瑞士巴塞尔

优先权:

60/315,281

专利代理机构:

中国国际贸易促进委员会专利商标事务所

代理人:

罗菊华

PDF下载: PDF下载
内容摘要

本发明提供多核苷酸序列,优选合成的多核苷酸,其编码为在植物中表达而优化的加工酶。该多核苷酸编码耐中温、耐高温或耐超高温的加工酶,该酶在适当的活化条件下能够被活化从而对目的底物发挥作用,本发明还提供“自加工”的转基因植物以及植物部分,如谷粒,这些植物能够表达一种或多种这样的酶,并且具有改变了的组分,所述组分利于植物和谷粒生长。还提供了制备及使用这些植物的方法,例如生产风味改善的食物产品的方法,生产可发酵底物用于制备乙醇以及发酵饮料的方法。

权利要求书

1.分离的多核苷酸,其a)含有SEQ ID NO:2,4,6,9,19,21,25,37,39,41,43,46,48,50,52,或59或其互补序列,或在低严谨性杂交条件下与SEQ ID NO:2,4,6,9,19,21,25,37,39,41,43,46,48,50,52,或59任一序列的互补序列杂交并且编码具有α-淀粉酶,支链淀粉酶,α-葡糖苷酶,葡萄糖异构酶或葡糖淀粉酶活性的多肽的多核苷酸,或b)编码含有SEQ ID NO:10,13,14,15,16,18,20,24,26,27,28,29,30,33,34,35,36,38,40,42,44,45,47,49或51或其酶活性片段的多肽。 2.权利要求1的分离多核苷酸,其中所述多核苷酸编码含有第一多肽和第二肽的融合多肽,其中所述第一多肽具有α-淀粉酶,支链淀粉酶,α-葡糖苷酶,葡萄糖异构酶或葡糖淀粉酶活性。 3.权利要求2的分离多核苷酸,其中所述第二肽含有信号序列肽。 4.权利要求3的分离多核苷酸,其中所述信号序列肽将所述第一多肽靶向植物的液泡,内质网,叶绿体,淀粉颗粒,种子或细胞壁。 5.权利要求3的分离多核苷酸,其中所述信号序列是waxy的N末端信号序列,γ-玉米醇溶蛋白的N末端信号序列,淀粉结合域或C末端淀粉结合域。 6.权利要求1的分离多核苷酸,其中所述多核苷酸在低严谨性杂交条件下与SEQ ID NO:2,9,或52任一序列的互补序列杂交,并且编码具有α-淀粉酶活性的多肽。 7.权利要求1的分离多核苷酸,其中所述多核苷酸在低严谨性杂交条件下与SEQ ID NO:4或25任一序列的互补序列杂交,并且编码具有支链淀粉酶活性的多肽。 8.权利要求1的分离多核苷酸,其中所述多核苷酸与SEQ IDNO:6的互补序列杂交,并且编码具有α-葡糖苷酶活性的多肽。 9.权利要求1的分离多核苷酸,其中所述多核苷酸在低严谨性杂交条件下与SEQ ID NO:19,21,37,39,41或43任一序列的互补序列杂交,并且编码具有葡萄糖异构酶活性的多肽。 10.权利要求1的分离多核苷酸,其中所述多核苷酸在低严谨性杂交条件下与SEQ ID NO:46,48,50或59任一序列的互补序列杂交,并且编码具有葡糖淀粉酶活性的多肽。 11.含有SEQ ID NO:2或9任何一个或其互补序列的分离多核苷酸。 12.含有SEQ ID NO:4或25任何一个或其互补序列的分离多核苷酸。 13.含有SEQ ID NO:6或其互补序列的分离多核苷酸。 14.含有SEQ ID NO:19,21,37,39,41或43任一序列或其互补序列的分离多核苷酸。 15.含有SEQ ID NO:46,48,50,或59任一序列或其互补序列的分离多核苷酸。 16.含有多核苷酸的表达盒,所述多核苷酸a)具有SEQ ID NO:2,4,6,9,19,21,25,37,39,41,43,46,48,50,52,或59或其互补序列,或在低严谨性杂交条件下与SEQ ID NO:2,4,6,9,19,21,25,37,39,41,43,46,48,50,52,或59任一序列的互补序列杂交并且编码具有α-淀粉酶,支链淀粉酶,α-葡糖苷酶,葡萄糖异构酶或葡糖淀粉酶活性的多肽的多核苷酸,或b)编码含有SEQ IDNO:10,13,14,15,16,18,20,24,26,27,28,29,30,33,34,35,36,38,40,42,44,45,47,49或51或其酶活性片段的多肽。 17.权利要求16的表达盒,其与启动子可操作地相连。 18.权利要求17的表达盒,其中所述启动子为诱导型启动子。 19.权利要求17的表达盒,其中所述启动子为组织特异性启动子。 20.权利要求19的表达盒,其中所述启动子为胚乳特异性启动子。 21.权利要求20的表达盒,其中所述胚乳特异性启动子为玉米γ-玉米醇溶蛋白启动子或玉米ADP-gpp启动子。 22.权利要求21的表达盒,其中所述启动子含有SEQ ID NO:11或SEQ ID NO:12。 23.权利要求16的表达盒,其中所述多核苷酸以相对于所述启动子的有义方向定向。 24.权利要求16的表达盒,其中所述a)多核苷酸还编码与该多核苷酸编码的多肽可操作地相连的信号序列。 25.权利要求24的表达盒,其中所述信号序列将所述可操作地相连的多肽导向植物的液泡,内质网,叶绿体,淀粉颗粒,种子或细胞壁。 26.权利要求25的表达盒,其中所述信号序列为waxy的N末端信号序列或γ-玉米醇溶蛋白的N末端信号序列。 27.权利要求25的表达盒,其中所述信号序列为淀粉结合域。 28.权利要求16的表达盒,其中所述b)多核苷酸与组织特异性启动子可操作地相连。 29.权利要求28的表达盒,其中所述组织特异性启动子为玉蜀黍(Zea mays)γ-玉米醇溶蛋白启动子或玉蜀黍ADP-gpp启动子。 30.含有多核苷酸的表达盒,其中所述多核苷酸含有SEQ ID NO:2或9的任一序列或其互补序列。 31.含有多核苷酸的表达盒,其中所述多核苷酸含有SEQ ID NO:6或其互补序列。 32.含有多核苷酸的表达盒,其中所述多核苷酸含有SEQ ID NO:19,21,37,39,41,或43的任一序列或其互补序列。 33.含有多核苷酸的表达盒,其中所述多核苷酸含有SEQ ID NO:46,48,50或59的任一序列或其互补序列。 34.含有多核苷酸的表达盒,其中所述多核苷酸含有SEQ ID NO:4或25的任一序列或其互补序列。 35.含有多核苷酸的表达盒,其中所述多核苷酸编码具有SEQ IDNO:10,13,14,15,16,24,26,27,28,29,30,33,34,35,36,38,40,42,44,45,47,49或51任一氨基酸序列或其酶活性片段的多肽。 36.含有多核苷酸的表达盒,其中所述多核苷酸编码具有SEQ IDNO:10,13,14,15,16,33,35,或51任一氨基酸序列或其具有α-淀粉酶活性的活性片段的多肽。 37.含有多核苷酸的表达盒,其中所述多核苷酸编码具有SEQ IDNO:3,24,或34任一氨基酸序列或其具有支链淀粉酶活性的活性片段的多肽。 38.含有多核苷酸的表达盒,其中所述多核苷酸编码具有SEQ IDNO:5,26,或27任一氨基酸序列或其具有α-葡糖苷酶活性的活性片段的多肽。 39.含有多核苷酸的表达盒,其中所述多核苷酸编码具有SEQ IDNO:18,20,28,29,30,38,40,42或44任一氨基酸序列或其具有葡萄糖异构酶活性的活性片段的多肽。 40.含有多核苷酸的表达盒,其中所述多核苷酸编码具有SEQ IDNO:45,47或49任一氨基酸序列或其具有葡糖淀粉酶活性的活性片段的多肽。 41.含有权利要求16的表达盒的载体。 42.含有权利要求30-40任一项的表达盒的载体。 43.含有权利要求16的表达盒的细胞。 44.含有权利要求30-40任一项的表达盒的细胞。 45.权利要求44的细胞,其中所述细胞选自:土壤杆菌属,单子叶植物细胞,双子叶植物细胞,Liliopsida细胞,Panicoideae细胞,玉米细胞,或谷类细胞。 46.权利要求45的细胞,其中所述细胞为玉米细胞。 47.权利要求45的细胞,其中所述细胞选自:土壤杆菌属,单子叶植物细胞,双子叶植物细胞,Liliopsida细胞,Panicoideae细胞,玉米细胞,或谷类细胞。 48.权利要求47的细胞,其中所述细胞为玉米细胞。 49.用权利要求41的载体稳定转化的植物。 50.用权利要求42的载体稳定转化的植物。 51.用含有α-淀粉酶的载体稳定转化的植物,所述α-淀粉酶具有SEQ ID NO:1,10,13,14,15,16,33或35的任一氨基酸序列,或由含有SEQ ID NO:2或9的多核苷酸编码。 52.权利要求51的植物,其中所述α-淀粉酶是耐超高温的。 53.用含有支链淀粉酶的载体稳定转化的植物,所述支链淀粉酶具有SEQ ID NO:24或34的任一氨基酸序列,或由含有SEQ ID NO:4或25的多核苷酸编码。 54.用含有α-葡糖苷酶的载体稳定转化的植物,所述α-葡糖苷酶具有SEQ ID NO:26或27的任一氨基酸序列,或由含有SEQ ID NO:6的多核苷酸编码。 55.权利要求54的植物,其中所述α-葡糖苷酶是耐超高温的。 56.用含有葡萄糖异构酶的载体稳定转化的植物,所述葡萄糖异构酶具有SEQ ID NO:18,20,28,29,30,38,40,42或44的任一氨基酸序列,或由含有SEQ ID NO:19,21,37,39,41或43任一序列的多核苷酸编码。 57.权利要求56的植物,其中所述α-葡糖苷酶是耐超高温的。 58.用含有葡糖淀粉酶的载体稳定转化的植物,所述葡糖淀粉酶具有SEQ ID NO:45,47或49的任一氨基酸序列,或由含有SEQ IDNO:46,48,50或59任一序列的多核苷酸编码。 59.权利要求58的植物,其中所述葡糖淀粉酶是耐超高温的。 60.来自权利要求49的植物的种子,果实,或谷粒。 61.来自权利要求50的植物的种子,果实,或谷粒。 62.来自权利要求51的植物的种子,果实,或谷粒。 63.来自权利要求53的植物的种子,果实,或谷粒。 64.来自权利要求54的植物的种子,果实,或谷粒。 65.来自权利要求56的植物的种子,果实,或谷粒。 66.来自权利要求58的植物的种子,果实,或谷粒。 67.转化的植物,其基因组中增加了编码至少一种与启动子序列可操作地相连的加工酶的重组多核苷酸,所述多核苷酸的序列已被优化用于在植物内表达。 68.权利要求67的植物,其中所述植物为单子叶植物。 69.权利要求68的植物,其中所述单子叶植物为玉米。 70.权利要求67的植物,其中所述植物为双子叶植物。 71.权利要求67的植物,其中所述植物为谷类植物或商业种植植物。 72.权利要求67的植物,其中所述加工酶选自:α-淀粉酶,葡糖淀粉酶,葡萄糖异构酶,葡聚糖酶,β-淀粉酶,α-葡糖苷酶,异淀粉酶,支链淀粉酶,新支链淀粉酶,异支链淀粉酶,淀粉支链淀粉酶(amylopullulanase),纤维素酶,外切-1,4-β-纤维二糖水解酶,外切-1,3-β-D-葡聚糖酶,β-葡糖苷酶,内切葡聚糖酶,L-阿拉伯糖酶,α-阿拉伯糖苷酶,半乳聚糖酶,半乳糖苷酶,甘露聚糖酶,甘露糖苷酶,木聚糖酶,木糖苷酶,蛋白酶,葡聚糖酶,木聚糖酶,酯酶,植酸酶和脂酶。 73.权利要求72的植物,其中所述加工酶是选自下述酶的淀粉加工酶:α-淀粉酶,葡糖淀粉酶,葡萄糖异构酶,β-淀粉酶,α-葡糖苷酶,异淀粉酶,支链淀粉酶,新支链淀粉酶,异支链淀粉酶和淀粉支链淀粉酶。 74.权利要求73的植物,其中所述酶选自:α-淀粉酶,葡糖淀粉酶,葡萄糖异构酶,葡萄糖异构酶,α-葡糖苷酶,和支链淀粉酶。 75.权利要求74的植物,其中所述酶是耐超高温的。 76.权利要求72的植物,其中所述酶是选自下述酶的非淀粉降解酶:蛋白酶,葡聚糖酶,木聚糖酶,酯酶,植酸酶和脂酶。 77.权利要求76的植物,其中所述酶是耐超高温的。 78.权利要求67的植物,其中所述酶在植物的液泡,内质网,叶绿体,淀粉颗粒,种子或细胞壁中积累。 79.权利要求78的植物,其中所述酶在内质网中积累。 80.权利要求78的植物,其中所述酶在淀粉颗粒中积累。 81.权利要求67的植物,其基因组还增加了含有非耐超高温酶的第二重组多核苷酸。 82.转化的植物,其基因组中增加了编码至少一种选自下述组的加工酶的重组多核苷酸:α-淀粉酶,葡糖淀粉酶,葡萄糖异构酶,α-葡糖苷酶,和支链淀粉酶,所述多核苷酸与启动子序列可操作地相连,所述多核苷酸的序列已被优化用于在该植物内表达。 83.权利要求82的转化植物,其中所述加工酶是耐超高温的。 84.权利要求82的转化植物,其中所述植物为玉米。 85.转化的玉米植物,其基因组中增加了编码至少一种选自下述组的加工酶的重组多核苷酸:α-淀粉酶,葡糖淀粉酶,葡萄糖异构酶,α-葡糖苷酶,和支链淀粉酶,所述多核苷酸与启动子序列可操作地相连,所述多核苷酸的序列已被优化用于在该玉米植物内表达。 86.权利要求85的转化玉米植物,其中所述加工酶是耐超高温的。 87.转化的植物,其基因组中增加了具有SEQ ID NO:2,9或52的重组多核苷酸,该多核苷酸与启动子和信号序列可操作地相连。 88.转化的植物,其基因组中增加了具有SEQ ID NO:4或25的重组多核苷酸,该多核苷酸与启动子和信号序列可操作地相连。 89.转化的植物,其基因组中增加了具有SEQ ID NO:6的重组多核苷酸,该多核苷酸与启动子和信号序列可操作地相连。 90.转化的植物,其基因组中增加了具有SEQ ID NO:19,21,37,39,41或43的重组多核苷酸。 91.转化的植物,其基因组中增加了具有SEQ ID NO:46,48,50或59的重组多核苷酸。 92.权利要求82的转化植物的产物。 93.权利要求85的转化植物的产物。 94.权利要求87-91任一项的转化植物的产物。 95.权利要求92的产物,其中该产物为种子,果实或谷粒。 96.权利要求92的产物,其中该产物为加工酶,淀粉或糖。 97.从权利要求82的植物获得的植物。 98.从权利要求85的植物获得的植物。 99.从权利要求87-91任一项的植物获得的植物。 100.权利要求97的植物,其为杂交植物。 101.权利要求98的植物,其为杂交植物。 102.权利要求99的植物,其为杂交植物。 103.权利要求97的植物,其为近交植物。 104.权利要求98的植物,其为近交植物。 105.权利要求99的植物,其为近交植物。 106.含有至少一种加工酶的淀粉组合物,所述酶为蛋白酶,葡聚糖酶或酯酶。 107.权利要求106的淀粉组合物,其中所述酶是耐超高温的。 108.含有至少一种加工酶的谷物,所述酶为α-淀粉酶,支链淀粉酶,α-葡糖苷酶,葡糖淀粉酶或葡萄糖异构酶。 109.权利要求108的谷物,其中所述酶是耐超高温的。 110.制备淀粉颗粒的方法,包括:a)将含有至少一种非淀粉加工酶的谷物在能够活化所述至少一种酶的条件下处理,产生含有淀粉颗粒和非淀粉降解产物的混合物,其中所述谷物获自转化的植物,其基因组中增加了编码所述至少一种酶的表达盒;和b)从混合物中分离出淀粉颗粒。 111.权利要求110的方法,其中所述酶为蛋白酶,葡聚糖酶,木聚糖酶,植酸酶,或酯酶。 112.权利要求111的方法,其中所述酶是耐超高温的。 113.权利要求110的方法,其中所述谷物为破裂的谷物。 114.权利要求110的方法,其中所述谷物在低含水量条件下处理。 115.权利要求110的方法,其中所述谷物在高含水量条件下处理。 116.权利要求110的方法,其中所述谷物用二氧化硫处理。 117.权利要求110的方法,进一步包括从混合物中分离非淀粉产物。 118.根据权利要求110的方法获得的淀粉。 119.根据权利要求112的方法获得的淀粉。 120.根据权利要求110的方法获得的非淀粉产物。 121.根据权利要求112的方法获得的非淀粉产物。 122.生产超甜玉米的方法,包括在活化所述至少一种酶的条件下,处理转化的玉米或其部分,所述玉米或其部分的基因组中增加了编码至少一种淀粉降解酶或淀粉异构化酶的表达盒,并在胚乳中表达该表达盒,以致将玉米中的多糖转化为糖,产生超甜玉米。 123.权利要求122的方法,其中所述表达盒还含有与编码所述酶的多核苷酸可操作地相连的启动子。 124.权利要求123的方法,其中所述启动子为组成型启动子。 125.权利要求123的方法,其中所述启动子为种子特异性启动子。 126.权利要求123的方法,其中所述启动子为胚乳特异性启动子。 127.权利要求123的方法,其中所述酶是耐超高温的。 128.权利要求127的方法,其中所述酶为α-淀粉酶。 129.权利要求122的方法,其中所述表达盒还含有编码与所述至少一种酶可操作地相连的信号序列的多核苷酸。 130.权利要求129的方法,其中所述信号序列将所述耐超高温酶导向质外体。 131.权利要求129的方法,其中所述信号序列将所述耐超高温酶导向内质网。 132.权利要求122的方法,其中所述酶含有SEQ ID NO:13,14,15,16,33或35的任一序列。 133.生产超甜玉米的方法,包括在活化所述至少一种酶的条件下,处理转化的玉米或其部分,所述玉米或其部分的基因组中增加了编码α-淀粉酶的表达盒,并在胚乳中表达该表达盒,以致将玉米中的多糖转化为糖,产生超甜玉米。 134.权利要求133的方法,其中所述酶是耐超高温的。 135.权利要求134的方法,其中所述耐超高温α-淀粉酶含有SEQ ID NO:10,13,14,15,16,33或35的任一氨基酸序列,或其具有α-淀粉酶活性的酶活性片段。 136.权利要求134的方法,其中所述表达盒含有选自SEQ IDNO:2,9或52任一序列或其互补序列的多核苷酸,或者在低严谨性杂交条件下与SEQ ID NO:2,9或52任一序列杂交,并且编码具有α-淀粉酶活性的多肽的多核苷酸。 137.制备水解的淀粉产物溶液的方法,包括a)将含有淀粉颗粒和至少一种加工酶的植物部分在活化所述至少一种酶的条件下处理,由此加工淀粉颗粒以形成含有水解的淀粉产物的水性溶液,其中所述植物部分获自转化的植物,所述植物的基因组中增加了编码所述至少一种淀粉加工酶的表达盒;以及b)收集含有水解的淀粉产物的水性溶液。 138.权利要求137的方法,其中所述水解的淀粉产物含有糊精,麦芽寡糖,糖和/或其混合物。 139.权利要求137的方法,其中所述酶为α-淀粉酶,α-葡糖苷酶,葡糖淀粉酶,支链淀粉酶,淀粉支链淀粉酶,葡萄糖异构酶,β-淀粉酶,异淀粉酶,新支链淀粉酶,异支链淀粉酶或其组合。 140.权利要求137的方法,其中所述至少一种加工酶是耐超高温的。 141.权利要求139的方法,其中所述至少一种加工酶是耐超高温的。 142.权利要求137的方法,其中所述植物部分的基因组中进一步增加了编码非耐超高温淀粉加工酶的表达盒。 143.权利要求142的方法,其中所述非耐超高温淀粉加工酶选自:淀粉酶,葡糖淀粉酶,α-葡糖苷酶,支链淀粉酶,葡萄糖异构酶或其组合。 144.权利要求137的方法,其中所述至少一种加工酶在胚乳内表达。 145.权利要求137的方法,其中所述植物部分为谷粒。 146.权利要求137的方法,其中所述植物部分来自玉米,小麦,大麦,黑麦,燕麦,甘蔗或稻。 147.权利要求137的方法,其中所述至少一种加工酶与启动子和信号序列可操作地相连,所述信号序列可将酶导向淀粉颗粒或内质网或细胞壁。 148.权利要求137的方法,进一步包括分离水解的淀粉产物。 149.权利要求137的方法,进一步包括发酵水解的淀粉产物。 150.制备水解的淀粉产物的方法,包括a)将含有淀粉颗粒和至少一种淀粉加工酶的植物部分在活化所述至少一种酶的条件下处理,从而加工淀粉颗粒以形成含有水解的淀粉产物的水性溶液,其中所述植物部分获自转化的植物,所述植物的基因组中增加了编码至少一种α-淀粉酶的表达盒;以及b)收集含有水解的淀粉产物的水性溶液。 151.权利要求150的方法,其中所述α-淀粉酶是耐超高温的。 152.权利要求151的方法,其中所述耐超高温α-淀粉酶含有SEQ ID NO:1,10,13,14,15,16,33或35任一氨基酸序列或其具有α-淀粉酶活性的活性片段。 153.权利要求151的方法,其中所述表达盒含有选自SEQ IDNO:2,9,46或52任何序列或其互补序列的多核苷酸,或者在低严谨性杂交条件下与SEQ ID NO:2,9,46或52的任一序列杂交并且编码具有α-淀粉酶活性的多肽的多核苷酸。 154.权利要求150的方法,其中所述转化植物的基因组进一步含有编码非耐热性淀粉加工酶的多核苷酸。 155.权利要求150的方法,进一步包括用非耐超高温淀粉加工酶处理植物部分。 156.转化的植物部分,其包含在植物细胞内存在的至少一种淀粉加工酶,其中所述植物部分获自转化的植物,所述转化的植物的基因组中增加了编码所述至少一种淀粉加工酶的表达盒。 157.权利要求156的植物部分,其中所述酶为选自下组的淀粉加工酶:α-淀粉酶,葡糖淀粉酶,葡萄糖异构酶,β-淀粉酶,α-葡糖苷酶,异淀粉酶,支链淀粉酶,新支链淀粉酶,异支链淀粉酶和淀粉支链淀粉酶。 158.权利要求156的植物部分,其中所述酶是耐超高温的。 159.权利要求156的植物部分,其中所述植物为玉米。 160.转化的植物部分,其含有在植物细胞壁或细胞内存在的至少一种非淀粉加工酶,其中所述植物部分获自转化的植物,所述转化的植物的基因组中增加了编码所述至少一种非淀粉加工酶或至少一种非淀粉多糖加工酶的表达盒。 161.权利要求160的植物部分,其中所述酶是耐超高温的。 162.权利要求160的植物部分,其中所述非淀粉加工酶选自:蛋白酶,葡聚糖酶,木聚糖酶,酯酶,植酸酶和脂酶。 163.权利要求156或160的植物部分,其为穗,种子,果实,谷粒,秸杆,谷壳或渣屑。 164.含有α-淀粉酶的转化的植物部分,所述α-淀粉酶具有SEQID NO:1,10,13,14,15,16,33或35的任一氨基酸序列,或由含有SEQ ID NO:2,9,46或52任一序列的多核苷酸编码。 165.含有α-葡糖苷酶的转化的植物部分,所述α-葡糖苷酶具有SEQ ID NO:5,26,或27的任一氨基酸序列,或由含有SEQ ID NO:6的多核苷酸编码。 166.含有葡萄糖异构酶的转化的植物部分,所述葡萄糖异构酶具有SEQ ID NO:28,29,30,38,40,42,或44的任一氨基酸序列,或由含有SEQ ID NO:19,21,37,39,41或43任一序列的多核苷酸编码。 167.含有葡糖淀粉酶的转化的植物部分,所述葡糖淀粉酶具有SEQ ID NO:45,或SEQ ID NO:47或SEQ ID NO:49的氨基酸序列,或由含有SEQ ID NO:46,48,50,或59任何序列的多核苷酸编码. 168.含有支链淀粉酶的转化的植物部分,所述支链淀粉酶由含有SEQ ID NO:4或25任一序列的多核苷酸编码。 169.转化权利要求156的转化的植物部分中的淀粉的方法,包括活化其中所含的淀粉加工酶。 170.将权利要求164-168任一项的转化的植物部分中的淀粉转化为淀粉衍生产物的方法,包括活化其中所含的酶。 171.根据权利要求169的方法产生的淀粉,糊精,麦芽寡糖或糖。 172.根据权利要求170的方法产生的淀粉,糊精,麦芽寡糖或糖。 173.在其细胞壁或细胞内含有至少一种非淀粉加工酶的转化的植物部分的使用方法,包括a)将含有至少一种非淀粉多糖加工酶的转化的植物部分在能够活化所述至少一种酶的条件下处理,由此消化非淀粉多糖以形成含有寡糖和/或糖的水性溶液,其中所述植物部分获自转化的植物,所述植物的基因组中增加了编码所述至少一种非淀粉多糖加工酶的表达盒;以及b)收集含有寡糖和/或糖的水性溶液。 174.权利要求173的方法,其中所述非淀粉多糖加工酶是耐超高温的。 175.含有至少一种加工酶的转化的种子的使用方法,包括a)将含有至少一种蛋白酶或脂酶的转化的种子在能够活化所述至少一种酶的条件下处理,产生含有氨基酸和脂肪酸的水性混合物,其中所述种子获自转化的植物,所述植物的基因组中增加了编码所述至少一种酶的表达盒;以及b)收集水性混合物。 176.权利要求175的方法,其中分离所述氨基酸,脂肪酸,或两者。 177.权利要求175的方法,其中所述至少一种蛋白酶或脂酶是耐超高温的。 178.制备乙醇的方法,包括a)将含有至少一种多糖加工酶的植物部分在能够活化所述至少一种酶的条件下处理,从而消化多糖以形成寡糖或可发酵糖,其中所述植物部分获自转化的植物,所述植物的基因组中增加了编码所述至少一种多糖加工酶的表达盒;以及b)在促进可发酵糖或寡糖转化为乙醇的条件下,孵育可发酵糖。 179.权利要求178的方法,其中所述植物部分为谷粒,果实,种子,茎,木材,蔬菜或根。 180.权利要求178的方法,其中所述植物部分从选自下组的植物获得:燕麦,大麦,小麦,浆果,葡萄,黑麦,玉米,稻,马铃薯,甜菜,甘蔗菠萝,草和树。 181.权利要求178的方法,其中所述多糖加工酶为:α-淀粉酶,葡糖淀粉酶,α-葡糖苷酶,葡萄糖异构酶,支链淀粉酶或其组合。 182.权利要求178的方法,其中所述多糖加工酶是耐超高温的。 183.权利要求178的方法,其中所述多糖加工酶是耐中温的。 184.权利要求181的方法,其中所述多糖加工酶是耐超高温的。 185.一种制备乙醇的方法,包括a)将含有至少一种酶的植物部分在能够活化所述至少一种酶的时间长度和条件下加热处理,由此消化多糖以形成可发酵糖,所述酶选自:α-淀粉酶,葡糖淀粉酶,α-葡糖苷酶,葡萄糖异构酶,或支链淀粉酶或其组合,其中所述植物部分获自转化的植物,所述植物的基因组中增加了编码所述至少一种酶的表达盒;以及b)在促进可发酵糖转化为乙醇的条件下孵育可发酵糖。 186.权利要求185的方法,其中所述的至少一种酶是耐超高温的。 187.权利要求185的方法,其中所述的至少一种酶是耐中温的。 188.权利要求185的方法,其中所述α-淀粉酶具有SEQ ID NO:1,10,13,14,15,16,33或35的任一氨基酸序列,或由含有SEQID NO:2或9任一序列的多核苷酸编码。 189.权利要求185的方法,其中所述α-葡糖苷酶具有SEQ IDNO:5,26,或27的任一氨基酸序列,或由含有SEQ ID NO:6的多核苷酸编码。 190.权利要求185的方法,其中所述葡萄糖异构酶具有SEQID NO:28,29,30,38,40,42,或44的任一氨基酸序列,或由含有SEQ ID NO:19,21,37,39,41或43任一序列的多核苷酸编码。 191.权利要求185的方法,其中所述葡糖淀粉酶具有SEQ IDNO:45的氨基酸序列,或由含有SEQ ID NO:46,48或50任一序列的多核苷酸编码. 192.权利要求185的方法,其中所述支链淀粉酶具有SEQ IDNO:24或34的氨基酸序列,或由含有SEQ ID NO:4或25任一序列的多核苷酸编码。 193.制备乙醇的方法,包括a)将含有至少一种非淀粉加工酶的植物部分在能够活化所述至少一种酶的条件下处理,由此消化非淀粉多糖为寡糖和可发酵糖,其中所述植物部分获自转化的植物,所述植物的基因组中增加了编码所述至少一种酶的表达盒;以及b)在促进可发酵糖转化为乙醇的条件下孵育可发酵糖。 194.权利要求193的方法,其中所述非淀粉加工酶为葡聚糖酶,木聚糖酶或纤维素酶。 195.一种制备乙醇的方法,包括a)将含有至少一种酶的植物部分在能够活化所述至少一种酶的条件下处理,由此消化多糖以形成可发酵糖,所述酶选自:α-淀粉酶,葡糖淀粉酶,α-葡糖苷酶,葡萄糖异构酶,支链淀粉酶或其组合,其中所述植物部分获自转化的植物,所述植物的基因组中增加了编码所述至少一种酶的表达盒;以及b)在促进可发酵糖转化为乙醇的条件下孵育可发酵糖。 196.权利要求195的方法,其中所述的至少一种酶是耐超高温的。 197.一种不加入额外甜味剂而生产增甜谷粉制食品的方法,包括a)将含有至少一种淀粉加工酶的植物部分在活化所述至少一种酶的条件下处理,由此加工植物部分中的淀粉颗粒为糖,从而形成增甜产品,其中所述植物部分获自转化的植物,所述植物的基因组中增加了编码所述至少一种酶的表达盒;以及b)将所述增甜产品加工成谷粉制食品。 198.权利要求197的方法,其中所述谷粉制食品由增甜产品和水制成。 199.权利要求197的方法,其中所述谷粉制食品含有麦芽,调味剂,维生素,矿物质,着色剂或其任意组合。 200.权利要求197的方法,其中所述至少一种酶是耐超高温的。 201.权利要求197的方法,其中所述酶为:α-淀粉酶,α-葡糖苷酶,葡糖淀粉酶,支链淀粉酶,葡萄糖异构酶或其任意组合。 202.权利要求197的方法,其中所述植物选自:大豆,黑麦,燕麦,大麦,小麦,玉米,稻和甘蔗。 203.权利要求197的方法,其中所述谷粉制食品是谷类食品。 204.权利要求197的方法,其中所述谷粉制食品为早餐食品。 205.权利要求197的方法,其中所述谷粉制食品为即食食品。 206.权利要求197的方法,其中所述谷粉制食品为焙烤食品。 207.权利要求197的方法,其中所述加工为焙烤,煮沸,加热,汽蒸,放电或其任意组合。 208.一种不加入甜味剂而增甜含淀粉产品的方法,包括a)将含有至少一种淀粉加工酶的淀粉在能够活化所述至少一种酶的条件下处理,由此消化淀粉以形成糖从而形成增甜淀粉,其中所述淀粉获自转化的植物,所述植物的基因组中增加了编码所述至少一种酶的表达盒;以及b)将所述增甜淀粉加入产品中以制成增甜的含淀粉产品。 209.权利要求208的方法,其中所述转化植物选自:玉米,大豆,黑麦,燕麦,大麦,小麦,稻和甘蔗。 210.权利要求208的方法,其中所述的至少一种酶是耐超高温的。 211.权利要求208的方法,其中所述至少一种酶为α-淀粉酶,α-葡糖苷酶,葡糖淀粉酶,支链淀粉酶,葡萄糖异构酶或其任意组合。 212.通过权利要求197的方法获得的谷粉制食品。 213.通过权利要求208的方法获得的增甜含淀粉产品。 214.增甜含多糖水果或蔬菜的方法,包括将含有至少一种多糖加工酶的水果或蔬菜在活化所述至少一种酶的条件下处理,从而加工水果或蔬菜中的多糖以形成糖,产生增甜水果或蔬菜,其中所述水果或蔬菜获自转化的植物,所述植物的基因组中增加了编码所述至少一种多糖加工酶的表达盒。 215.权利要求214的方法,其中所述水果或蔬菜选自马铃薯,番茄,香蕉,南瓜,豌豆类和菜豆类。 216.权利要求214的方法,其中所述的至少一种酶是耐超高温的。 217.权利要求214的方法,其中所述酶为α-淀粉酶,α-葡糖苷酶,葡糖淀粉酶,支链淀粉酶,葡萄糖异构酶或其任意组合。 218.制备含糖的水性溶液的方法,包括在活化所述至少一种酶的条件下,处理获自权利要求156的植物部分的淀粉颗粒,从而产生含糖的水性溶液。 219.不涉及在淀粉衍生产物回收之前湿磨或干磨谷粒而从谷粒中制备淀粉衍生产物的方法,包括a)将含有淀粉颗粒和至少一种淀粉加工酶的植物部分在活化所述至少一种酶的条件下处理,由此加工淀粉颗粒形成含有糊精或糖的水性溶液,其中所述植物部分获自转化的植物,所述植物的基因组中增加了编码所述至少一种淀粉加工酶的表达盒;以及b)收集所述含有淀粉衍生产物的水性溶液。 220.权利要求219的方法,其中所述的至少一种淀粉加工酶是耐超高温的。 221.分离α-淀粉酶,葡糖淀粉酶,葡萄糖异构酶,α-葡糖苷酶和支链淀粉酶的方法,包括培养权利要求82的转化植物并分离α-淀粉酶,葡糖淀粉酶,葡萄糖异构酶,α-葡糖苷酶和支链淀粉酶。 222.权利要求221的方法,其中所述α-淀粉酶,葡糖淀粉酶,葡萄糖异构酶,α-葡糖苷酶和支链淀粉酶是耐超高温的。 223.制备麦芽糖糊精的方法,包括a)将转基因谷粒与水混合;b)加热所述混合物;c)从(b)产生的糊精糖浆分离固体,以及d)收集麦芽糖糊精。 224.权利要求223的方法,其中所述转基因谷粒含有至少一种淀粉加工酶。 225.权利要求224的方法,其中所述淀粉加工酶为α-淀粉酶,葡糖淀粉酶,α-葡糖苷酶,和葡萄糖异构酶。 226.权利要求225的方法,其中所述的至少一种淀粉加工酶是耐超高温的。 227.通过权利要求223-226任一项的方法产生的麦芽糖糊精。 228.通过权利要求223-226任一项的方法产生的麦芽糖糊精组合物。 229.不涉及在回收淀粉衍生产物之前机械破坏谷物而从谷物制备糊精或糖的方法,包括a)将含有淀粉颗粒和至少一种淀粉加工酶的植物部分在活化所述至少一种酶的条件下处理,从而加工淀粉颗粒以形成含糊精或糖的水性溶液,其中所述植物部分获自转化的植物,该植物的基因组中增加了编码所述至少一种加工酶的表达盒;以及b)收集含有糖和/或糊精的水性溶液。 230.权利要求229的方法,其中所述淀粉加工酶为α-淀粉酶,葡糖淀粉酶,α-葡糖苷酶,和葡萄糖异构酶。 231.制备可发酵糖的方法,包括a)将含有淀粉颗粒和至少一种淀粉加工酶的植物部分在活化所述至少一种酶的条件下处理,由此加工淀粉颗粒以形成含有糊精或糖的水性溶液,其中所述植物部分获自转化的植物,所述植物的基因组中增加了编码所述至少一种加工酶的表达盒;以及b)收集所述含有可发酵糖的水性溶液。 232.权利要求249的方法,其中所述淀粉加工酶为α-淀粉酶,葡糖淀粉酶,α-葡糖苷酶,和葡萄糖异构酶。 233.用含有耐超高温α-淀粉酶的载体稳定转化的玉米植物。 234.用含有编码α-淀粉酶的多核苷酸序列的载体稳定转化的玉米植物,所述酶与SEQ ID NO:1或SEQ ID NO:51的一致性高于60%。

说明书



                    相关申请

本申请要求于2001年8月27日申请的申请No.60/315,281的优 先权,该申请并入本文作为参考。

                      技术领域

本发明基本涉及植物分子生物学领域,更具体而言,涉及生产能 够表达加工酶(processing enzyme)的植物,所述酶能够给该植物或其 产品带来期望的特性。

                      背景技术

酶通常被用来加工各种各样的农产品,如木材,水果和蔬菜,淀 粉,果汁等等。一般而言,加工所用的酶是从不同来源以工业规模生 产并回收的,例如来自微生物微生物发酵(芽孢杆菌α-淀粉酶)或从 植物分离(咖啡β-半乳糖苷酶或木瓜蛋白酶来自植物部分)。通过在 适当含水量,温度,时间和机械混合条件下混合酶和底物,使酶反应 以商业上可行的方式实现,酶制品在不同处理应用中得到使用。这些 方法涉及酶的生产,酶制剂的制备,酶与底物的混合,以及将混合物 置于适当条件下以促进酶促反应等分离的步骤。能够减少或省下时间, 能量,混合,资本投入,和/或酶生产成本,或者生产出改良或新型产 品的方法都是有用和有益的。对这些方面有所需求的一个实例就是玉 米粉碎领域。

目前,玉米是经过粉碎以获得玉米淀粉和其它玉米粉碎副产品, 如玉米面筋饲料,玉米面筋粉和玉米油。经过这个过程得到的淀粉通 常还需要进一步被处理成其它产品,如衍生淀粉和糖,或通过发酵来 制备包括醇类或乳酸在内的一系列产品。处理玉米淀粉经常涉及各种 酶的应用,特别是能够水解并转化淀粉为可发酵糖或果糖的酶(α-和 葡萄糖-淀粉酶,α-葡糖糖苷酶,葡萄糖异构酶等)。目前商业应用的 处理过程均为资本密集型,因为必须建造非常巨大的碾碎机才能以合 理成本效率所需的大规模处理玉米。另外,这个过程需要单独制备水 解或修饰淀粉的酶然后需要机械来混合酶和底物以生产水解的淀粉产 物。

从玉米粒回收淀粉的过程已众所周知,并涉及湿磨加工。玉米湿 磨法包括以下步骤:浸泡玉米粒,磨碎玉米粒和分离玉米粒的各组分。 玉米粒被浸泡在浸泡容器内,该容器内有约120°F的对流水流,将玉 米粒在浸泡容器内浸泡24-48小时。该浸泡水通常含有约0.2%重量百 分比的二氧化硫。处理中使用二氧化硫来减少微生物的生长,同时也 减少胚乳蛋白中的二硫键,以促进淀粉-蛋白的有效分离。通常,每蒲 式耳玉米使用约0.59加仑浸泡水。浸泡水被认为是废液,通常含有不 希望水平的残余二氧化硫。

然后将浸泡的玉米粒脱水,并进行一系列摩擦型粉碎机处理。第 一套摩擦型粉碎机能够破裂玉米粒,从玉米粒的剩余部分释放出胚芽。 以Bauer品牌出售一种适于湿磨的商业摩擦型粉碎机。通过离心从玉 米粒的剩余部分分离出胚芽。一种常用的商业离心分离器是Merco离 心分离器。摩擦粉碎机和离心分离器都是需要能量才能操作的大型昂 贵机械。

该过程的下一个步骤是将剩余的玉米粒组分,包括淀粉,外皮, 纤维和面筋继续进行另一套摩擦粉碎处理并传送通过清洗筛,从淀粉 和面筋(胚乳蛋白)中分离出纤维组分。淀粉和面筋会通过这个筛网 而纤维则不会。通过离心或在离心后进行第三次粉碎来从胚乳蛋白中 分离出淀粉。离心形成了淀粉浆,将其脱水,并用新鲜水洗涤,干燥 到约12%含水量。这种基本上纯的淀粉通常进一步用酶处理。

由于去除种子外皮、胚和胚乳蛋白可以将淀粉有效地与酶接触, 这样获得的水解产物中其它玉米粒组分的污染也相对较少,因此要从 玉米粒的其它组分中分离淀粉。分离还可以保证玉米粒的其它组分被 有效回收,继而作为副产品出售,以提高工厂的收益。

湿磨处理得到淀粉后,通常还要经过凝胶化(gelatinization),液化 和糊精化作用以获得麦芽糖糊精产品,而其后的糖化,异构化和精炼 步骤是用于制备葡萄糖,麦芽糖和果糖。

由于目前可获得的酶不能快速地水解结晶淀粉,所以在淀粉水解 过程中进行凝胶化作用。为了使淀粉可被水解酶作用,通常用水 (20-40%干物质)将淀粉制成浆状,然后在适当的胶凝作用温度下加 热。对于玉米淀粉而言,该温度为105°-110℃。凝胶化的淀粉通常非 常粘稠,因此在下一个被称为液化的步骤中被稀薄化。液化破坏了淀 粉葡萄糖分子间的一些键,可以通过酶或使用酸进行。该步骤以及其 后的糊精化步骤中均使用热稳定的内切α-淀粉酶。在糊精化步骤中控 制水解的程度以使得到的水解产物中葡萄糖可以达到期望的百分比。

根据所需要的产物,可以通过大量不同的外切淀粉酶和脱支酶对 由液化步骤所得到的糊精产物进行进一步水解。如果最终的目的是果 糖,那么通常使用固定化的葡萄糖异构酶将葡萄糖转化为果糖。

通过干磨法从玉米淀粉制备可发酵糖(然后制备例如乙醇)能够 促进外源性淀粉酶有效地接触淀粉的步骤。这些方法比湿磨法的资本 投入低,但是由于这些方法得到的副产品通常不如湿磨法得到的有价 值,因此,仍然希望获得显著的成本利益。例如,在湿磨的玉米中, 玉米粒被磨成粉末以促进玉米与降解酶的有效接触。玉米粉经酶水解 后,由于残留的固体含有蛋白质和一些其它组分,所以还可用作饲料。 Eckhoff最近在一篇名为“Fermentation and costs of fuel ethanol from corn with quick-germ process”的论文中阐述了湿磨法的改良潜力以 及相关问题(Appl.Biochem.Biotechnol.,94:41(2001))。这种“快速胚 芽(quick-germ)”方法能够使用缩短的浸泡时间从淀粉中分离出富含 油的胚芽。

内生性加工酶在植物中的调控和/或水平可以形成目的产物的这 样的一个例子是甜玉米。典型的甜玉米品种与饲料玉米(field corn)品 种的区别在于甜玉米不能生物合成正常水平的淀粉。在淀粉生物合成 相关酶编码基因中的遗传突变通常被用于甜玉米品种以限制淀粉的生 物合成。这种突变(例如甜和超甜突变)都位于淀粉合酶和ADP-葡 萄糖焦磷酸化酶编码基因中。产生可口甜味所需要的三种单糖——果 糖,葡萄糖和蔗糖在这些突变株内的发育胚乳中累积,而这种甜味正 是可食用鲜玉米消费者所青睐的。但是,如果淀粉累积的水平过高而 使得玉米成熟过长时间(晚熟收获)或者玉米在被消费前保存了过长 时间,那么就会丧失甜味而变为淀粉味和口感(mouthfeel)。因此甜 玉米的收获期(harvest window)非常窄,并且储藏期限有限。

种植甜玉米的农民的另一困难是这些品种的应用仅仅限制在可食 用食品上。如果农民在种子发育期希望放弃收获甜玉米用作可使用食 品,那么收成将损失相当大。甜玉米的谷物产量和质量会因为两个基 本原因而较低。第一个原因是淀粉生物合成途径中的突变破坏了淀粉 生物合成的机制,玉米还没有完全灌浆,导致产量和质量损失。第二, 由于在玉米中存在高水平的糖,不能将这些糖贮存为淀粉,这些种子 的整体吸收强度(sink strength)有所减少,而这加剧了玉米粒中储存营 养的缩减。这些甜玉米品种种子的胚乳会收缩并破裂,而不会经历适 当的干燥过程,并且易于染病。甜玉米谷物的这种低质量还会有进一 步的农艺学影响;如种子存活率低,发芽率低,秧苗易染病,以及早 期秧苗不易存活等,这都是由于淀粉累积量过低而导致的各种因素所 致。这样,甜玉米质量低的问题会影响消费者,农民/种植者,经销商 和种子生产商。

于是,对于干磨法,渴望有一种能改进这种工艺和/或提高副产品 价值的方法。对于湿磨法,需要有一种淀粉加工方法能够不需要配备 长时间浸泡,研磨,粉碎和/或分离玉米粒组分所需的设备。例如,需 要能够在湿磨法中修改或省掉浸泡步骤,因为这可以减少需要处理的 废液的量,从而节省能源和时间,并提高研磨容量(会缩短玉米粒在 浸泡容器内的时间)。还需要消除或改进将含淀粉的胚乳与胚分离的方 法。

                       发明概述

本发明涉及自加工(self-processing)植物和植物部分以及其使用方 法。本发明的自加工植物和植物部分能够表达并活化(耐中温,耐高 温(thermophilic)和耐超高温(hyperthermophilic))酶。活化了(耐中 温,耐高温和耐超高温)酶后,植物和植物部分能够对底物进行自加 工,以此获得目的产物。

本发明提供分离的多核苷酸,该多核苷酸a)含有SEQ ID NO:2,4, 6,9,19,21,25,37,39,41,43,46,48,50,52或59或者其互补序列,或 在低严谨性杂交条件下能够与SEQ ID NO:2,4,6,9,19,21,25,37,39, 41,43,46,48,50,52或59任一序列的互补序列杂交、并且编码具有α- 淀粉酶,支链淀粉酶,α-葡糖苷酶,葡萄糖异构酶或葡糖淀粉酶活性 的多肽的多核苷酸,或者b)编码含有SEQ ID NO:10,13,14,15,16,18, 20,24,26,27,28,29,30,33,34,35,36,38,40,42,44,45,47,49或51 的多肽或其酶活性片段。优选地,该分离的多核苷酸编码含有第一多 肽和第二肽的融合多肽,其中所述第一多肽具有α-淀粉酶,支链淀粉 酶,α-葡糖苷酶,葡萄糖异构酶或葡糖淀粉酶活性。最优选地,第二 肽含有信号序列肽,其能够将第一多肽靶向植物的液泡,内质网,叶 绿体,淀粉颗粒,种子或细胞壁。例如,该信号序列可以是waxy的N 末端信号序列,γ-玉米醇溶蛋白的N末端信号序列,淀粉结合域,或 者C末端淀粉结合域。还进一步包括下述多核苷酸:在低严谨性杂交 条件下能够与SEQ ID NO:2,9,或52任一序列的互补序列杂交并且编 码具有α-淀粉酶活性的多肽的多核苷酸,在低严谨性杂交条件下能够 与SEQ ID NO:4或25的互补序列杂交并且编码具有支链淀粉酶活性 的多肽的多核苷酸,在低严谨性杂交条件下能够与SEQ ID NO:6的 互补序列杂交并且编码具有α-葡糖苷酶活性的多肽的多核苷酸;在低 严谨性杂交条件下能够与SEQ ID NO:19,21,37,39,41或43任 一序列的互补序列杂交并且编码具有葡糖异构酶活性的多肽的多核苷 酸;在低严谨性杂交条件下能够与SEQ ID NO:46,48,50或59的 互补序列杂交并且编码具有葡糖淀粉酶活性的多肽的多核苷酸。

另外,还提供含有多核苷酸的表达盒,所述多核苷酸a)具有SEQ ID NO:2,4,6,9,19,21,25,37,39,41,43,46,48,50,52, 或59或其互补序列,或在低严谨性杂交条件下能够与SEQ ID NO:2, 4,6,9,19,21,25,37,39,41,43,46,48,50,52,或59任 一序列的互补序列杂交并且编码具有α-淀粉酶,支链淀粉酶,α-葡糖 苷酶,葡萄糖异构酶或葡糖淀粉酶活性的多肽的多核苷酸,或者b)编 码含有SEQ ID NO:10,13,14,15,16,18,20,24,26,27,28, 29,30,33,34,35,36,38,40,42,44,45,47,49或51的多 肽或其酶活性片段。优选地,该表达盒进一步含有与所述多核苷酸可 操作地相连的启动子,例如诱导型启动子,组织特异性启动子或优选 胚乳特异性启动子。优选地,该胚乳特异性启动子为玉米γ-玉米醇溶 蛋白启动子或玉米ADP-gpp启动子。在一个优选实施方式中,该启动 子含有SEQ ID NO:11或SEQ ID NO:12。而且,在另一优选实施方 式中该多核苷酸是以相对于启动子而言为有义的方向定位。本发明的 表达盒还可以进一步编码与所述多核苷酸编码多肽可操作地相连的信 号序列。该信号序列优选将与其可操作地相连的多肽靶向植物的液泡, 内质网,叶绿体,淀粉颗粒(starch granule),种子或细胞壁。优选的 信号序列包括waxy的N末端信号序列,γ-玉米醇溶蛋白的N末端信 号序列,或者淀粉结合域。

本发明还涉及含有本发明表达盒的载体或细胞。细胞可选自:土 壤杆菌,单子叶植物细胞,双子叶植物细胞,Liliopsida细胞, Panicoideae细胞,玉米细胞,和谷类细胞。优选细胞是玉米细胞。

本发明还包括用本发明载体稳定转化的植物。本发明提供用含有 α-淀粉酶的载体稳定转化的植物,所述α-淀粉酶具有SEQ ID NO:1, 10,13,14,15,16,33,或35的任一氨基酸序列,或由含有SEQ ID NO:2或9的多核苷酸所编码。优选α-淀粉酶是耐超高温的。

在另一实施方式中,还提供用含有支链淀粉酶的载体稳定转化的 植物,所述支链淀粉酶具有SEQ ID NO:24或34的任一氨基酸序列, 或由含有SEQ ID NO:4或25的多核苷酸所编码。还提供用含有α- 葡糖苷酶的载体稳定转化的植物,所述α-葡糖苷酶具有SEQ ID NO: 26或27的任一氨基酸序列,或由含有SEQ ID NO:6的多核苷酸所编 码。优选该α-葡糖苷酶是耐超高温的。还描述了用含有葡萄糖异构酶 的载体稳定转化的植物,所述葡萄糖异构酶具有SEQ ID NO:18,20, 28,29,30,38,40,42,或44的任一氨基酸序列,或由含有SEQ ID NO:19,21,37,39,41或43的多核苷酸所编码。优选该葡萄糖异 构酶是耐超高温的。在另一实施方案中还描述了用含有葡糖淀粉酶的 载体稳定转化的植物,所述葡糖淀粉酶具有SEQ ID NO:45,47或49 的任一氨基酸序列,或由含有SEQ ID NO:46,48,50,或59的多核 苷酸所编码。优选该葡萄糖淀粉酶是耐超高温的。

还提供从本发明被稳定转化的植物获得的植物产品,如种子,果 实或谷粒。

在另一实施方案中,本发明还涉及转化的植物,其基因组中增加 有重组多核苷酸,所述多核苷酸与启动子序列可操作地相连且编码至 少一种加工酶,该多核苷酸的序列已被优化用于在所述植物内表达。 该植物可以是单子叶植物,如玉米,或双子叶植物。优选该植物为谷 类植物或经济植物。加工酶选自:α-淀粉酶,葡糖淀粉酶,葡萄糖异 构酶,葡聚糖酶,β-淀粉酶,α-葡糖苷酶,异淀粉酶,支链淀粉酶, 新支链淀粉酶(neo-pullulanase),异支链淀粉酶(iso-pullulanase),淀粉 支链淀粉酶(amylopullulanase),纤维素酶,外切-1,4-β-纤维二糖水 解酶,外切-1,3-β-D-葡聚糖酶,β-葡糖苷酶,内切葡聚糖酶,L-阿拉 伯糖酶,α-阿拉伯糖苷酶,半乳聚糖酶(galactanase),半乳糖苷酶, 甘露聚糖酶,甘露糖苷酶,木聚糖酶,木糖苷酶,蛋白酶,葡聚糖酶, 木聚糖酶,酯酶,植酸酶和脂肪酶。优选该加工酶为选自下述的淀粉 加工酶:α-淀粉酶,葡糖淀粉酶,葡萄糖异构酶,β-淀粉酶,α-葡糖 苷酶,异淀粉酶,支链淀粉酶,新支链淀粉酶,异支链淀粉酶和淀粉 支链淀粉酶(amylopullulanase)。更优选该酶选自:α-淀粉酶,葡糖淀 粉酶,葡萄糖异构酶,葡萄糖异构酶,α-葡糖苷酶,和支链淀粉酶。 还进一步优选耐超高温的加工酶。根据本发明,酶可以是选自下述的 非淀粉降解酶:蛋白酶,葡聚糖酶,木聚糖酶,酯酶,植酸酶和脂肪 酶。这些酶还可以是耐超高温的。在一个优选实施方案中,该酶能够 在植物的液泡,内质网,叶绿体,淀粉颗粒,种子或细胞壁中累积。 而且,在另一实施方案中,植物的基因组中还可以增加含有非耐超高 温酶的第二重组多核苷酸。

本发明另一方面提供转化的植物,其基因组中增加了编码至少一 种选自下述的加工酶的重组多核苷酸:α-淀粉酶,葡糖淀粉酶,葡萄 糖异构酶,α-葡糖苷酶和支链淀粉酶,所述多核苷酸与启动子序列可 操作地相连,该多核苷酸的序列已被优化用于在该植物中表达。优选 该加工酶为耐超高温酶和玉米。

另一实施方案提供转化的玉米植物,其基因组中增加了编码至少 一种选自下述的加工酶的重组多核苷酸:α-淀粉酶,葡糖淀粉酶,葡 萄糖异构酶,α-葡糖苷酶和支链淀粉酶,所述多核苷酸与启动子序列 可操作地相连,该多核苷酸的序列已被优化用于在玉米植物中表达。 优选该加工酶为耐超高温酶。

还提供了转化的植物,其基因组增加了具有SEQ ID NO:2,9或 52的重组多核苷酸,所述多核苷酸与启动子和信号序列可操作地相 连。另外,还描述了转化的植物,其基因组增加了具有SEQ ID NO:4 或25的重组多核苷酸,所述多核苷酸与启动子和信号序列可操作地相 连。在另一实施方案中还描述了转化的植物,其基因组增加了具有 SEQ ID NO:6的重组多核苷酸,所述多核苷酸与启动子和信号序列可 操作地相连。另外,还提供了转化的植物,其基因组增加了具有SEQ ID NO:19,21,37,39,41或43的重组多核苷酸。转化的植物,其 基因组增加了具有SEQ ID NO:46,48,50或59的重组多核苷酸。

本文还进一步设想了从转化的植物获得的产品。产品包括例如: 种子,果实,或谷粒。该产品还可以是加工酶,淀粉或糖。

还进一步描述了从本发明被稳定转化的植物所获得的植物。在这 个方面而言,该植物可以是杂交植物或近交(inbred)植物。

本发明的另一实施方案还提供了淀粉组合物,其含有至少一种加 工酶,该酶是蛋白酶、葡聚糖酶或酯酶。优选该酶耐超高温。

本发明的另一实施方案提供含有至少一种加工酶的谷粒(grain), 所述酶是α-淀粉酶,支链淀粉酶,α-葡糖苷酶,葡糖淀粉酶或葡萄糖 异构酶。优选该酶耐超高温。

另一实施方案提供了制备淀粉颗粒的方法,包括:将含有至少一 种非淀粉加工酶的谷物在能够激活所述至少一种酶的条件下处理,产 生含有淀粉颗粒和非淀粉降解产物的混合物,其中所述谷物获自转化 的植物,其基因组增加了编码至少一种酶的表达盒;并从混合物中分 离出淀粉颗粒。其中,所述优选为蛋白酶,葡聚糖酶,木聚糖酶,植 酸酶或酯酶。而且优选该酶耐超高温。所述谷物可以是经碎裂化的谷 物和/或可以在低或高含水量条件下处理。或者,该谷物可以用二氧化 硫处理。优选本发明进一步包括从混合物中分离非淀粉产品。还进一 步描述了由该方法获得的淀粉产品和非淀粉产品。

在另一实施方案中,还提供了生产超甜玉米(hypersweet corn)的 方法,包括在能够活化所述至少一种酶的条件下处理转化的玉米或其 部分,以使玉米中的多糖转化为糖(sugar)从而获得超甜玉米,所述玉 米或其部分的基因组已增加了编码至少一种淀粉降解酶或淀粉异构酶 的表达盒,并在胚乳中表达该表达盒。该表达盒优选进一步含有与酶 编码多核苷酸可操作连接的启动子。该启动子可以是例如组成型启动 子,种子特异性启动子或胚乳特异性启动子。优选该酶耐超高温。更 优选该酶为α-淀粉酶。这里所用的表达盒还可进一步含有编码信号序 列的多核苷酸,该信号序列与所述至少一种酶可操作连接。信号序列 可以将耐超高温酶导向例如质外体或内质网。优选该酶含有SEQ ID NO:13,14,15,16,33或35任一序列。

在最优选的实施方案中,描述了产生超甜玉米的方法,包括在下 述条件下处理转化的玉米或其部分,该玉米或其部分的基因组已增加 了编码α-淀粉酶的表达盒,并在胚乳冲中表达该表达盒,所述条件能 够活化所述至少一种酶,以将玉米中的多糖转化为糖,产生超甜玉米。 优选地该酶是耐超高温的,该耐超高温α-淀粉酶含有SEQ ID NO:10、 13、14、15、16、33或35任何氨基酸序列,或其具有α-淀粉酶活性 的酶活性片段。

本文还描述了制备水解的淀粉产物的溶液的方法,包括在能够活 化所述至少一种酶的条件下处理含有淀粉颗粒和至少一种加工酶的植 物部分,从而使酶加工淀粉颗粒以形成含有水解的淀粉产物的水溶液, 其中所述植物部分是获自转化的植物,所述植物的基因组增加了编码 所述至少一种淀粉加工酶的表达盒;并收集含有水解的淀粉产物的水 性溶液。水解的淀粉产物可以含有糊精,麦芽寡糖,葡萄糖和/或其混 合物。优选该酶为α-淀粉酶,α-葡糖苷酶,葡糖淀粉酶,支链淀粉酶, 淀粉支链淀粉酶,葡萄糖异构酶或其组合。另外,优选该酶耐超高温。 另一方面,该植物部分的基因组还可进一步增加编码非耐超高温淀粉 加工酶的表达盒。该非耐超高温淀粉加工酶可选自:淀粉酶,葡糖淀 粉酶,α-葡糖苷酶,支链淀粉酶,葡萄糖异构酶或其组合。另一方面, 该加工酶优选在胚乳中表达。优选该植物部分为颗粒,来自玉米,小 麦,大麦,黑麦,燕麦,甘蔗或稻。优选所述的至少一种加工酶与启 动子和信号序列可操作地相连,所述信号肽能够将酶导向淀粉颗粒或 内质网或细胞壁。该方法还可进一步包括分离水解的淀粉产物和/或发 酵水解的淀粉产物的步骤。

本发明的另一方面描述了制备水解的淀粉产物的方法,包括在能 够活化所述至少一种酶的条件下处理含有淀粉颗粒和至少一种淀粉加 工酶的植物部分,从而使酶加工淀粉颗粒以形成成含有水解的淀粉产 物的水性溶液,其中所述植物部分是获自转化的植物,所述植物的基 因组已增加了编码至少一种α-淀粉酶的表达盒;并收集含有水解的淀 粉产物的水性溶液。优选该α-淀粉酶可以耐超高温,更优选该耐超高 温的α-淀粉酶含有SEQ ID NO:1,10,13,14,15,16,33或35任 一序列的氨基酸序列,或其具有α-淀粉酶活性的片段。优选地,该表 达盒含有选自如下序列的多核苷酸:SEQ ID NO:2,9,46或52或其 互补序列,或者在低严谨性杂交条件下能够与SEQ ID NO:2,9,46 或52杂交并且编码具有α-淀粉酶活性的多肽的多核苷酸。同时,本 发明还包括进一步含有编码非耐超高温淀粉加工酶的多核苷酸的转化 植物的基因组。或者,可以用非耐超高温淀粉加工酶处理植物的部分。

本发明还提供含有在植物细胞中存在的至少一种淀粉加工酶的转 化植物部分,其中该植物部分是获自转化的植物,该植物的基因组已 增加了编码至少一种淀粉加工酶的表达盒。优选地,该酶为选自下述 的淀粉加工酶:α-淀粉酶,葡糖淀粉酶,葡萄糖异构酶,β淀粉酶,α- 葡糖苷酶,异淀粉酶,支链淀粉酶,新支链淀粉酶,异支链淀粉酶和 淀粉支链淀粉酶。同时,优选该酶耐超高温。所述植物可以是任何植 物,但优选玉米。

本发明另一实施方案是含有在植物的细胞或细胞壁内存在的至少 一种非淀粉加工酶的转化植物部分,其中所述植物部分获自转化植物, 该植物的基因组已增加了编码至少一种非淀粉加工酶或至少一种非淀 粉多糖加工酶的表达盒。优选地,该酶耐超高温。同时,所述非淀粉 加工酶优选选自:蛋白酶,葡聚糖酶,木聚糖酶,酯酶,植酸酶和脂 酶。所述植物部分可以是任何植物部分,但优选穗,种子,果实,谷 粒,秸杆(stover),谷壳或渣屑(bagasse)。

本发明还提供转化的植物部分。例如,描述了含有α-淀粉酶的转 化植物部分,所述淀粉酶具有SEQ ID NO:1,10,13,14,15,16, 33或35任一序列的氨基酸序列,或者由含有SEQ ID NO:2,9,46 或52任一序列的多核苷酸所编码;含有α-葡糖苷酶的转化植物部分, 所述α-葡糖苷酶具有SEQ ID NO:5,26或27任一序列的氨基酸序列, 或者由含有SEQ ID NO:6的多核苷酸所编码;含有葡萄糖异构酶的 转化植物部分,所述葡萄糖异构酶具有SEQ ID NO:28,29,30,38, 40,42或44任一序列的氨基酸序列,或者由含有SEQ ID NO:19, 21,37,39,41或43任一序列的多核苷酸所编码;含有葡糖淀粉酶 的转化植物部分,所述葡糖淀粉酶具有SEQ ID NO:45或SEQ ID NO: 47或SEQ ID NO:49的氨基酸序列,或者由含有SEQ ID NO:46,48, 50或59任一序列的多核苷酸所编码;以及含有支链淀粉酶的转化植 物部分,所述支链淀粉酶由含有SEQ ID NO:4或25任一序列的多核 苷酸序列所编码。

另一实施方案提供了转化植物部分中淀粉的转化方法,包括活化 其中所含淀粉加工酶。还提供了根据该方法获得的淀粉,糊精,麦芽 寡糖或糖。

本发明还描述了在植物部分的细胞壁或细胞内含有至少一种非淀 粉加工酶的转化植物部分的使用方法,包括在一定条件下处理含有至 少一种非淀粉多糖加工酶的转化植物部分,以活化所述的至少一种酶 酶来消化非淀粉多糖从而形成含有寡糖和/或糖(sugars)的水性溶液, 其中所述植物部分是获自转化的植物,所述植物的基因组已增加了编 码所述至少一种非淀粉多糖加工酶的表达盒;并收集含有寡糖和/或糖 的水性溶液。优选该非淀粉多糖加工酶可以耐超高温。

还提供了使用含有至少一种加工酶的转化种子的方法,包括在能 够活化所述至少一种酶的条件下,处理含有至少一种蛋白酶或脂酶的 转化种子,从而获得含有氨基酸和脂肪酸的水性混合物,其中所述种 子获自转化的植物,所述植物的基因组已增加了编码所述至少一种酶 的表达盒;并收集水性混合物。优选氨基酸或脂肪酸或二者均为分离 的。优选所述至少一种蛋白酶或脂酶可以耐超高温。

制备乙醇的方法,包括在能够激活所述至少一种酶的条件下处理 含有至少一种多糖加工酶的植物部分,从而降解多糖以形成寡糖或可 发酵糖,其中所述植物部分获自转化的植物,所述植物的基因组增加 了编码所述至少一种多糖加工酶的表达盒;并在能够促进可发酵糖或 寡糖转化为乙醇的条件下保温可发酵糖。优选植物部分为谷粒,果实, 种子,茎,木材,蔬菜或根。优选该植物部分获自选自下述的植物: 燕麦,大麦,小麦,浆果,葡萄,黑麦,玉米,稻,马铃薯,甜菜, 甘蔗,菠萝,草和树。在另一优选实施方案中,该多糖加工酶为:α- 淀粉酶,葡糖淀粉酶,α-葡糖苷酶,葡萄糖异构酶,支链淀粉酶或其 组合。

还提供了一种制备乙醇的方法,包括在能够活化所述至少一种酶 的时间和条件下,将含有至少一种选自下组的酶的植物部分加热处理 以使多糖消化从而形成可发酵糖:α-淀粉酶,葡糖淀粉酶,α-葡糖苷 酶,葡萄糖异构酶,支链淀粉酶或其组合,其中所述植物部分获自转化 的植物,所述植物的基因组已增加了编码该至少一种酶的表达盒;并 在能够促进可发酵糖转化为乙醇的条件下保温可发酵糖。优选所述的 至少一种酶可以耐超高温或耐中温。

在另一实施方案中描述了制备乙醇的方法,包括在能够活化所述 至少一种酶的条件下,处理含有至少一种非淀粉加工酶的植物部分以 使非淀粉多糖消化成寡糖和可发酵糖,其中所述植物部分获自转化的 植物,所述植物的基因组增加了编码该至少一种酶的表达盒;并在能 够促进可发酵糖转化为乙醇的条件下保温可发酵糖。优选所述非淀粉 加工酶为葡聚糖酶,木聚糖酶或纤维素酶。

还提供了一种制备乙醇的方法,包括在能够活化所述的至少一种 酶条件下,处理含有至少一种选自下组的酶的植物部分以使多糖消化 成可发酵糖:α-淀粉酶,葡糖淀粉酶,α-葡糖苷酶,葡萄糖异构酶, 支链淀粉酶或其组合,其中所述植物部分获自转化的植物,所述植物的 基因组增加了编码所述至少一种酶的表达盒;并在能够促进可发酵糖 转化为乙醇的条件下保温可发酵糖。优选该酶耐超高温。

同时还提供了无需额外加入甜味剂而生产增甜谷粉制食品 (farinaceous food product)的方法,包括在能够活化所述至少一种酶的 条件下,处理含有至少一种淀粉加工酶的植物部分以将植物部分中的 淀粉颗粒加工成糖类从而形成甜味产品,其中所述植物部分获自转化 的植物,所述植物的基因组已增加了编码所述至少一种酶的表达盒; 并将所述甜味产品加工成谷粉制食品。所述谷粉制食品可以由甜味产 品和水制成。另外,所述谷粉制食品可以含有麦芽,调味剂,维生素, 矿物质,着色剂或其组合。优选所述的至少一种酶可以耐超高温。该 酶可选自:α-淀粉酶,α-葡糖苷酶,葡糖淀粉酶,支链淀粉酶,葡萄 糖异构酶或其任何组合。所述植物还可以选自:大豆,黑麦,燕麦, 大麦,小麦,玉米,稻和甘蔗。优选所述谷粉制食品是谷类食品,早 餐食品,即食食品或焙烤食品。该方法中还可以包括焙烤,煮沸,加 热,蒸汽加工,放电(electrical discharge)或其组合。

本发明还提供了无需加入甜味剂使含淀粉的产品增甜的方法,包 括在能够活化所述至少一种酶的条件下,处理含有至少一种淀粉加工 酶的淀粉以使淀粉消化形成糖从而形成甜味淀粉,其中所述淀粉获自 转化的植物,所述植物的基因组已增加了编码所述至少一种酶的表达 盒;并将所述甜味淀粉加入产品以制成甜味的含淀粉产品。所述转化 植物优选选自:玉米,大豆,黑麦,燕麦,大麦,小麦,稻和甘蔗。 优选所述的至少一种酶可以耐超高温。更优选该至少一种酶为α-淀粉 酶,α-葡糖苷酶,葡糖淀粉酶,支链淀粉酶,葡萄糖异构酶或其组合。

本发明还提供谷粉制食品和甜味含淀粉产品。

本发明还提供了使含多糖水果或蔬菜增甜的方法,包括在能够活 化所述至少一种酶的条件下,处理含有至少一种多糖加工酶的水果或 蔬菜,由此加工水果或蔬菜中的多糖形成糖(sugar),获得甜味水果或 蔬菜,其中所述水果或蔬菜获自转化的植物,所述植物的基因组已增 加了编码所述至少一种多糖加工酶的表达盒。所述水果或蔬菜选自马 铃薯,番茄,香蕉,南瓜,豌豆和菜豆。优选所述的至少一种酶可以 耐超高温。

本发明还进一步提供制备含糖的水性溶液的方法,包括在能够活 化所述至少一种酶的条件下,处理获自植物部分的淀粉颗粒,从而得 到含糖的水性溶液。

另一实施方案提供了在淀粉衍生产物回收之前不涉及湿磨(wet milling)或干磨(dry milling)谷粒而从谷粒中制备淀粉衍生产物的方 法,包括在能够活化所述至少一种酶的条件下,处理含有淀粉颗粒和 至少一种淀粉加工酶的植物部分,以加工淀粉颗粒形成含有糊精或糖 的水性溶液,其中所述植物部分获自转化的植物,所述植物的基因组 已增加了编码所述至少一种淀粉加工酶的表达盒;并收集所述含有淀 粉衍生产物的水性溶液。优选所述的至少一种淀粉加工酶可以耐超高 温。

还提供了分离α-淀粉酶,葡糖淀粉酶,葡萄糖异构酶,α-葡糖苷 酶和支链淀粉酶的方法,包括栽培所述转化植物和从中分离α-淀粉酶、 葡糖淀粉酶、葡糖异构酶、α-葡糖苷酶和支链淀粉酶。优选所述酶可 以耐超高温。

还提供了制备麦芽糖糊精的方法,包括将转基因谷物与水混合, 加热该混合物,从形成的糊精糖浆中分离出固体,并收集麦芽糖糊精。 优选该转基因谷物含有至少一种淀粉加工酶。优选该淀粉加工酶是α- 淀粉酶,葡糖淀粉酶,α-葡糖苷酶,和葡萄糖异构酶。同时还提供了 由该方法所形成的麦芽糖糊精和组合物。

本发明提供在回收淀粉衍生产物之前不涉及机械破裂谷粒而从谷 粒制备糊精或糖的方法,包括在能够活化所述至少一种酶的条件下, 处理含有淀粉颗粒和至少一种淀粉加工酶的植物部分,以加工淀粉颗 粒形成含有糊精或糖的水性溶液,其中所述植物部分获自转化的植物, 所述植物的基因组增加了编码所述至少一种加工酶的表达盒;并收集 所述含有糖和/或糊精的水性溶液。

本发明还提供了制备可发酵糖的方法,包括在能够活化所述至少 一种酶的条件下,处理含有淀粉颗粒和至少一种淀粉加工酶的植物部 分,以加工淀粉颗粒形成含有糊精或糖的水性溶液,其中所述植物部 分获自转化的植物,所述植物的基因组已增加了编码所述至少一种加 工酶的表达盒;并收集所述含有可发酵糖的水性溶液。

同时本发明还包括由含有耐超高温α-淀粉酶的载体稳定转化的玉 米植物。优选例如由含有α-淀粉酶编码多核苷酸序列的载体所稳定转 化的玉米植物,所述α-淀粉酶与SEQ ID NO:1或SEQ ID NO:51具 有大于60%的一致性。

                     附图说明

图1A和图1B表明在来自pNOV6201植物的分离的T1谷粒和来 自六个pNOV6200系的玉米粒中以及胚乳中表达的α-淀粉酶活性。

图2表明来自pNOV6201系的分离T1谷粒中α-淀粉酶活性。

图3表明将含有热稳定性797GL3α-淀粉酶的转基因玉米糊状物 发酵后所形成的乙醇的量,所述糊状物已在85℃和95℃经历了不超过 60分钟的液化。该图说明发酵72小时所得到的乙醇产量在液化15分 钟到60分钟之间几乎没有变化。而且还显示在95℃液化产生的糊状 物在各个时间点形成的乙醇产量比85℃液化产生的糊状物的高。

图4表明含有热稳定性α-淀粉酶的转基因玉米糊状物在经过了85 ℃和95℃的不超过60分钟的液化然后再发酵后残留的淀粉量(%)。 该图表明发酵72小时的乙醇产量在液化15分钟到60分钟之间几乎没 有变化。而且还显示在95℃液化产生的糊状物在各个时间点形成的乙 醇产量比85℃液化产生的糊状物的更高。

图5表明转基因玉米与对照玉米及其各种混合物在85℃和95℃制 备的糊状物所形成的乙醇产量。该图表明:由于发酵后淀粉剩余量减 少,因此含有α-淀粉酶的转基因玉米在使淀粉可被发酵利用方面有显 著改进。

图6表明转基因谷物,对照玉米及其各种混合物在85℃和95℃制 备的糊状物发酵后,在干燥釜留物(stillage)中测得的残留淀粉量。

图7显示含有3%转基因玉米的样品在5.2-6.4的不同pH范围, 在20-80小时的时间作为发酵时间函数的乙醇产量。该图说明在较低 pH条件下进行的发酵的速度比pH6.0或更高pH条件下快。

图8表明含有0-12wt%不同重量百分比转基因玉米的糊状物在 5.2-6.4的不同pH范围的发酵过程中的乙醇产量。该图表明乙醇的产 量与样品中转基因谷物的含量无关。

图9显示来自由pNOV7005转化的不同事件的T2种子分析结果。 相较于非转基因的对照,可以在许多事件中检测到支链淀粉酶活性的 高表达。

图10A和图10B显示转基因玉米粉中由表达的支链淀粉酶所产生 的淀粉水解产物的HPLC分析结果。将表达支链淀粉酶的玉米的面粉 在反应缓冲液中75℃保温30分钟,从玉米淀粉中形成中等链寡糖(聚 合程度(DP)约为10-30)和短的直链淀粉(DP约为100-200)。图 10A和图10B显示加入的钙离子对于支链淀粉酶酶活的影响效果。

图11A和图11B显示两种反应混合物的淀粉水解产物经HPLC分 析后形成的数据。被标示为“淀粉酶”的第一种反应含有表达α-淀粉酶 的转基因玉米和非转基因玉米A188的玉米粉样品混合物[1∶1(w/w)]; 而“淀粉酶+支链淀粉酶”的第二种反应混合物则含有表达α-淀粉酶的 转基因玉米和表达支链淀粉酶的转基因玉米的玉米粉样品混合物[1∶1 (w/w)]。

图12表明两种混合物的每25μl反应混合物中糖产物的μg量。被 标示为“淀粉酶”的第一种反应含有表达α-淀粉酶的转基因玉米和非转 基因玉米A188的玉米粉样品混合物[1∶1(w/w)];而“淀粉酶+支链 淀粉酶”的第二种反应混合物则含有能表达α-淀粉酶的转基因玉米和 能表达支链淀粉酶的转基因玉米的玉米粉样品混合物[1∶1(w/w)]。

图13A和图13B显示在85℃和95℃保温30分钟结束时两组反应 混合物的淀粉水解产物。每组中都有两种反应混合物;第一种反应被 称为“淀粉酶X支链淀粉酶”,含有既能表达α-淀粉酶又能表达支链淀 粉酶的转基因玉米(通过异花授粉而产生)的玉米粉,第二种反应为“淀 粉酶”,是表达α-淀粉酶的转基因玉米和非转基因玉米A188的玉米粉 样品混合物,二者以能够获得与杂交玉米(淀粉酶X支链淀粉酶)观 察到的相同量的α-淀粉酶活性的比例混合。

图14表明淀粉转化为葡萄糖的降解作用,其中使用了非转基因玉 米种子(对照),含有797GL3α-淀粉酶的转基因玉米种子以及797GL3 转基因玉米种子和Mal Aα-葡糖苷酶的组合。

图15说明在室温或30℃下粗淀粉的转化。该图中,反应混合物1 和2分别是水和淀粉在室温或30℃下的混合物。反应混合物3和4分 别是大麦α-淀粉酶和淀粉在室温或30℃下的混合物。反应混合物5和 6是热厌氧杆菌属(Thermoanaerobacterium)葡糖淀粉酶和淀粉在室温 或30℃下的混合物。反应混合物7和8分别是大麦α-淀粉酶(sigma) 和热厌氧杆菌属葡糖淀粉酶及淀粉在室温或30℃下的混合物。反应混 合物9和10分别是大麦α-淀粉酶(sigma)对照和淀粉在室温或30 ℃下的混合物。热厌氧杆菌属葡糖淀粉酶产物的聚合程度(DP)已被 标出。

图16显示如实施例19所述,使用α-淀粉酶,α-葡糖苷酶和葡萄 糖异构酶组合从淀粉酶转基因玉米面粉中生产果糖。将淀粉酶玉米面 粉和酶溶液加水或缓冲液一起混合。所有的反应都含有60mg淀粉酶 玉米面粉,液体总体积均为600μl,90℃保温2小时。

图17表明100%来自自加工谷粒的淀粉酶玉米面粉在90℃保温 0-1200分钟下反应产物峰面积对保湿时间的函数。

图18表明10%来自自加工谷粒的淀粉酶玉米面粉和90%对照玉 米面粉在90℃保温0-1200分钟下反应产物峰面积对保温时间的函数。

图19提供在70°,80°,90°或100℃下保温不超过90分钟的转基 因淀粉酶玉米面粉的HPLC分析结果,来评价温度对淀粉水解的影响。

图20表明在各种反应条件下,含有60mg转基因淀粉酶玉米面粉 与酶溶液和水或缓冲液的混合物样品的ELSD峰面积。一组反应使用 50mM MOPS缓冲,pH7.0,室温下,外加10mM MgSO4和1mM CoCl2;另一组反应中用水替代含金属的缓冲液。所有反应均在90℃ 保温2小时。

                         发明详述

本发明中,“自加工”植物或植物部分内已导入了分离的多核苷酸, 该多核苷酸编码能够在植物体内加工,例如修饰,淀粉,多糖,脂类, 蛋白等的加工酶,其中所述加工酶可以耐中温,高温或超高温,并可 通过粉碎,加入水,加热或以其它方式提供酶发挥作用所需条件而被 活化。所述编码加工酶的分离多核苷酸被整合到植物或植物部分中以 在其中表达。表达和活化该酶后,本发明的植物或植物部分会加工所 述加工酶作用的底物。因此,本发明的植物或植物部分在没有或只有 减少的通常对这些底物进行加工所必需的外部因素存在下,当其中的 加工酶被活化之后能够对该酶的底物进行自加工。因此,本发明的转 化植物,转化植物细胞和转化植物部分具有“内在”的加工能力,能够 通过掺入其中的酶来加工期望的底物。优选该加工酶的编码多核苷酸 为“遗传稳定的”,即,该多核苷酸能够在本发明的转化植物或植物部 分中稳定地维持,并可通过连续世代而被后代稳定地继承。

根据本发明,使用这些植物和植物部分的方法能够在回收淀粉衍 生产物之前不必经过粉碎或以其它方式物理破裂植物部分。例如,本 发明提供了改进的处理玉米和其他谷物以回收淀粉衍生产物的方法。 本发明还提供了允许回收淀粉颗粒的方法,所述淀粉颗粒在其内部或 在其上含有一定水平的淀粉降解酶,所述水平的酶足以水解淀粉内部 的特异键而无需加入外源淀粉水解酶。本发明还提供改进的来自通过 本发明方法获得的自加工植物或植物部分的产品。

另外,“自加工”的转化植物部分,如谷粒,以及转化的植物避免 了现有技术存在的主要问题,即,加工酶通常都由微生物发酵生产, 这需要从培养上清液中分离酶,而这会耗费资金;分离的酶需要被处 理以用于特殊应用,并且必须发展添加,混合和将酶与其底物反应的 工艺及机械。本发明的转化植物或其部分还可以成为加工酶自身以及 该酶的底物和产物,如糖,氨基酸,脂肪酸和淀粉及非淀粉多糖的来 源。本发明的植物还可以用于制备后代植物,如杂种和近交种。

加工酶及其编码多核苷酸

加工酶(耐中温,高温或超高温)的编码多核苷酸被导入植物或 其部分。根据在植物或转基因植物和/或期望终产物中所发现的该加工 酶作用的期望底物来选择该加工酶。例如,该酶可以是淀粉加工酶, 如淀粉降解或淀粉异构化酶,或者是非淀粉加工酶。适合的加工酶包 括但不限于淀粉降解或淀粉异构化酶,例如包括α-淀粉酶,内切或外 切-1,4或1,6-α-D,葡糖淀粉酶,葡萄糖异构酶,β-淀粉酶,α-葡糖苷酶 和其它外切淀粉酶;以及淀粉脱支酶,如异淀粉酶,支链淀粉酶,新 支链淀粉酶,异支链淀粉酶,淀粉支链淀粉酶等,糖基转移酶,如环 糊精糖基转移酶等,纤维素酶如外切1,4-β-纤维二糖水解酶,外切 -1,3-β-D-葡聚糖酶,半纤维素酶,β-葡糖苷酶等,内切葡聚糖酶如, 内切-1,3-β-葡聚糖酶和内切-1,4-β-葡聚糖酶等;L-阿拉伯糖酶 (L-arabinases),如内切-1,5-α-L-阿拉伯糖酶,β-阿拉糖苷酶等,半乳 聚糖酶(galactanases)如内切1,4-β-D-半乳聚糖酶,内切1,3-β-D-半乳聚 糖酶,β-半乳糖苷酶,α-半乳糖苷酶等;甘露聚糖酶(mannanases), 如内切1,4-β-D-甘露聚糖酶,β-甘露糖苷酶,α-甘露糖苷酶等;木聚糖 酶,如内切1,4-β-木聚糖酶,β-D-木糖苷酶,1,3-β-D-木聚糖酶等;以 及果胶酶;和非淀粉加工酶,包括蛋白酶,葡聚糖酶,木聚糖酶,硫 氧还蛋白/硫氧还蛋白还原酶,酯酶,植酸酶和脂酶。

在一个实施方案中,该加工酶为选自下述的淀粉降解酶:α-淀粉 酶,支链淀粉酶,α-葡糖苷酶,葡糖淀粉酶,淀粉支链淀粉酶,葡萄 糖异构酶或其组合。正如本发明将要进一步描述的:根据该实施方案, 在将包含在植物或植物部分内的酶活化后,该淀粉降解酶能够使自加 工植物或植物部分降解淀粉。可以根据期望的终产物来选择所述淀粉 降解酶。例如,可以选择葡萄糖异构酶来将葡萄糖(己糖)转化为果 糖。或者可以根据基于例如加工程度的函数而具有不同链长或具有各 种期望的支链模式的期望淀粉衍生终产物来选择酶。比如,在较短保 温时间条件下α-淀粉酶,葡糖淀粉酶或淀粉支链淀粉酶可以用来生产 糊精产物,而在较长保温时间条件下来生产短链产物或糖。可使用支 链淀粉酶特异性地水解淀粉的分支点来形成高直链淀粉的淀粉,或使 用新支链淀粉酶来生产散布有1,6键的α-1,4键链的淀粉。可以使用葡 糖苷酶来生产极限糊精,或者使用不同的各种组合来制备其它淀粉衍 生物。

在另一实施方案中,该加工酶为选自下述的非淀粉加工酶:蛋白 酶,葡聚糖酶,木聚糖酶和酯酶。这些非淀粉降解酶可以使本发明的 自加工植物或植物部分并入其到植物的靶区域,并且当被激活后破坏 植物却能使淀粉颗粒保持完整。例如,在一个优选的实施方案中,该 非淀粉降解酶靶向植物细胞的胚乳基质并在活化后,破坏胚乳基质却 能够保持胚乳基质内的淀粉颗粒不被破坏,而更易于从所得的材料中 回收。

本发明还进一步提供了加工酶的各种组合。例如,可以结合使用 淀粉加工酶和非淀粉加工酶。可利用编码各种酶的多基因构建体来获 得加工酶的组合。或者,可通过已知的方法使已稳定转化各酶的单个 转基因植物杂交来获得含有多种酶的植物。另一方法包括对转基因植 物使用外源酶。

加工酶可以从任何来源分离或制备,而其相应多核苷酸可以由本 领域技术人员确定。例如,该加工酶,优选α-淀粉酶,可来源于火球 菌属(Pyrococcus)(如激烈火球菌(Pyrococcus furiosus)),栖热菌属 (Thermus),热球菌属(Thermococcus)(如Thermococcus hydrothermalis),硫化叶菌属(Sulfolobus)(如硫磺矿硫化叶菌 (Sulfolobus solfataricus)),栖热袍菌属(Thermotoga)(如海栖热 袍菌(T.maritima)和那不勒斯栖热袍菌(T.neapolitana)),热厌氧 杆菌属(Thermoanaerobacterium)(如Thermoanaerobacter tengcongensis),曲霉属(Aspergillus)(如Aspergillus shirousami和 黑色曲霉(Aspergillus niger)),根霉属(Rhizopus)(如米根霉(Rhizopus oryzae)),热变形菌目(Thermoproteales),硫还原球菌属 (Desulfurococcus)(如Desulfurococcus amylolyticus),嗜热碱甲烷 杆菌(Methanobacterium thermoautotrophicum),詹氏甲烷球菌 (Methanococcus jannaschii),坎氏甲烷嗜热菌(Methanopyrus kandleri),Thermosynechococcus elongatus,耐酸热原体 (Thermoplasma acidophilum),火山热原体(Thermoplasma volcanium),敏捷气热菌(Aeropyrum perinx)和植物如玉米,大麦 和稻。

本发明的加工酶能够在被导入植物基因组并被表达后活化。测定 每个单个酶被活化的条件,可以包括各种条件,如温度,pH,水合作 用,金属、活化性化合物、失活性化合物的存在等。例如,温度依赖 性酶可包括耐中温,高温和超高温酶。耐中温酶通常在20-65℃具有 最大活性,而在高于70℃的温度下会失活。耐中温酶在30-37℃具有 显著的活性,优选在30℃的活性为最大活性的至少10%,更优选为 最大活性的至少20%。

耐高温酶在50-80℃具有最大活性,而在高于80℃的温度下会失 活。优选耐高温酶在30℃的活性低于最大活性的20%,更优选低于 最大活性的10%。

耐超高温酶在更高温度下具有活性。耐超高温酶在高于80℃的温 度下具有最大活性,而在至少80℃的温度下保持活性,更优选在至少 90℃的温度下保持活性,最优选在至少95℃的温度下保持活性。耐 超高温酶在低温条件下仍具有降低的活性。耐超高温酶在30℃的活性 可以低于最大活性的10%,更优选低于最大活性的5%。

编码该加工酶的多核苷酸优选被修饰包含这样的密码子,所述密 码子被优化用于在被选择生物体如植物体内表达(例如参见,Wada 等,Nucl.Acids Res.,18:2367(1990),Murray等,Nucl.Acids Res.,17: 477(1989),U.S.Patent Nos.5,096,825,5,625,136,5,670,356和 5,874,304)。密码子优化的序列是合成的序列,即,它们并非是天然存 在的,并优选编码相同的多肽(或全长多肽的酶活性片段,并且该片 段与全长多肽具有的活性基本上相同),所述多肽由编码加工酶的非密 码子优化亲代多核苷酸所编码。优选该多肽为生化性质独特的或有所 改进的,例如,通过对来自亲代多肽的特定加工酶编码DNA的递推 突变(recursive mutagenesis),从而改进其在加工应用中的性能。优 选多核苷酸被优化在靶宿主植物内表达,并且其编码加工酶。制备这 种酶的方法包括突变,如递推突变和筛选。用于突变和核苷酸序列改 变的方法是本领域公知的。例如参见,Kunkel,Proc.Natl.Acad.Sci. USA,82:488,(1985);Kunkel等,Methods in Enzymol.,154:367 (1987);US Patent No.4,873,192;Walker和Gaastra,eds.(1983) Techniques in Molecular Biology(MacMillan Publishing Company, New York)以及这里所引的参考文献和Arnold等,Chem.Eng.Sci., 51:5091(1996))。优化核酸片段在靶植物或生物内表达的方法是本领域 公知的。简言之,获得指示着靶生物所用最佳密码子的密码子使用表, 选择最佳密码子用于替换靶多核苷酸中的密码子,然后化学合成优化 序列。玉米偏爱密码子如US Patent No.5,625,136所述。

还进一步展望了本发明多核苷酸的互补核酸。在滤膜(filter)上进 行的Southern或Northern印迹中,具有多于100个互补残基的互补 核酸杂交的低严谨性条件的例子是50%甲酰胺,例如在50%甲酰胺, 1M NaCl,1%SDS中,37℃下杂交,并在60-65℃下用0.1X SSC洗 涤。示范性的低严谨性条件包括用30-35%甲酰胺,1M NaCl,1%SDS (十二烷基硫酸钠)的缓冲液37℃杂交,并在50-55℃下用1X-2X SSC (20X SSC=3.0M NaCl/0.3M柠檬酸三钠)清洗。示范性的中等严谨 性条件包括在40-45%甲酰胺,1.0M NaCl,1%SDS中37℃杂交,并 在55-60℃下用0.5X-1X SSC清洗。

另外,还包括编码所述加工酶“酶活性”片段的多核苷酸。本文中, “酶活性”指所述加工酶的多肽片段,并且其与所述加工酶具有基本上 相同的在适当条件下修饰所述加工酶通常作用的底物的生物学活性。

在一个优选实施方案中,本发明的多核苷酸为玉米优化的多核苷 酸,其编码α-淀粉酶,例如SEQ ID NO:2,9,46和52所示。在另一 优选实施方案中,该多肽为编码支链淀粉酶的玉米优化多核苷酸,例 如SEQ ID NO:4或25所示。在另一优选实施方案中,所述多核苷 酸是编码α-葡糖苷酶的玉米优化多核苷酸,如SEQ ID NO:6所示。 另一优选实施方案中,该多肽为编码葡萄糖异构酶的玉米优化多核苷 酸,如SEQ ID NO:19,21,37,39,41或43所示。在另一优选实 施方案中,优选编码葡糖淀粉酶的玉米优化多核苷酸,如SEQ ID NO: 46,48或50所示。另外,SEQ ID NO:57还提供了编码葡聚糖酶/甘 露聚糖酶融合多肽的玉米优化多核苷酸。本发明进一步提供了这种多 核苷酸的互补序列,其在中度或优选在低严谨性杂交条件下可以杂交, 并且视情况而定,编码具有α-淀粉酶,支链淀粉酶,α-葡糖苷酶,葡 萄糖异构酶,葡糖淀粉酶,葡聚糖酶或甘露聚糖酶活性的多肽。

多核苷酸可以与“核酸”或“多核酸”互换使用,指脱氧核糖核苷酸 或核糖核苷酸,及其单链或双链形式的多聚体,由含有糖,磷酸和碱 基的单体(核苷酸)构成,所述碱基为嘌呤或嘧啶。除非另有说明, 该术语包括含有天然核苷酸已知类似物的核酸,其与对照核苷酸具有 类似的结合特性,并以天然核苷酸类似的方式被代谢。除非另有说明, 特定的核酸序列除包括明确列出的序列外,还隐含包括其保守修饰的 各种变体(例如简并密码子取代)以及互补序列。具体地,简并密码 子的取代可以通过生成这样的序列而获得,所述序列中一个或多个被 选择(或全部)密码子的第三个位置被混合碱基和/或脱氧次黄苷残基 取代。

还包括“变体”或实质上类似的序列。对于核苷酸序列,变体包括 那些由于遗传密码的简并性的缘故而编码天然蛋白相同氨基酸序列的 那些序列。天然存在的等位基因变体例如这些变体可以使用已知的分 子生物学技术鉴定,如聚合酶链式反应(PCR),杂交技术,和连接重 组装(Ligation reassembly)技术。变体核苷酸序列还包括合成来源 的核苷酸序列,如那些例如使用定点突变而形成编码天然蛋白的核苷 酸序列,以及编码具有氨基酸取代的多肽的核苷酸序列。通常,本发 明的核苷酸序列变体与天然核苷酸序列具有至少40%,50%,60%, 优选70%,更优选80%,尤其优选90%,最优选99%和基于这些等 级的单个单位的百分比一致性。例如,71%,72%,73%等,直到至 少90%等级。变体还可以包括相应于被鉴定基因片段的全长基因。

调控序列:启动子/信号序列/可选择标记

编码本发明加工酶的多核苷酸可以与编码定位信号或信号序列 (在多肽的N-或C-末端)的多核苷酸序列可操作地相连,从而例如 将耐超高温酶靶向植物内的特定区室。这种靶的实例包括但不限于, 液泡,内质网,叶绿体,造粉体,淀粉颗粒或细胞壁,或靶向特定组 织,如种子。编码具有信号序列的加工酶的多核苷酸——特别是与组 织特异性或诱导型启动子联合使用的多核苷酸——在植物内表达可以 在植物体内产生高水平的定位加工酶。已知许多信号序列能够影响多 核苷酸的表达或者影响多核苷酸靶向特定区室或特定区室以外部位。 本领域已知的适当信号序列和靶向启动子包括但不限于本文所述的那 些。

例如,当期望在特定组织或器官内表达时可以使用组织特异性启 动子。反之,当期望响应刺激的基因表达时,诱导型启动子可为所选 的调控元件。当期望在整个植物的细胞内持续地表达时,可使用组成 型启动子。转化载体的表达构建体中还可以包含中心启动子上游和/ 或下游的额外调控序列,以使异源核苷酸序列在转基因植物内以各种 水平表达。

已描述了许多表达特征各异的植物启动子。已被公开的一些组成 型启动子包括稻肌动蛋白1(Wang等,Mol.Cell.Biol.,12:3399(1992); U.S.Patent No.5,641,876),CaMV 35S(Odell等,Nature,313: 810(1985)),CaMV 19S(Lawton等,1987),nos(Ebert等,1987),Adh (Walker等,1987),蔗糖合酶(Yang & Russell,1990)和泛素启动 子。

在转基因植物中用于组织特异性靶向基因的载体通常包括组织特 异性启动子,还可以包含其它组织特异性调控元件,如增强子序列。 根据本公开的教导,那些能够引导在某些植物组织内特异性表达或提 高表达的启动子对于本领域技术人员是明了的。例如包括,rbcS启动 子,为绿色组织特异性;ocs,nos和mas启动子,其在根部或创伤叶 组织中有更高活性;截短的(-90到+8)35S启动子,其能够指导在根 部的增强表达,α-微管蛋白基因,其指导在根中表达,以及来自玉米 醇溶蛋白储备蛋白质基因的启动子,其能够指导在胚乳内表达。

组织特异性表达可以这样功能性地完成:将组成型表达基因(所 有组织)与仅在特定组织内表达的反义基因一起导入,所述特定组织 是指不期望该基因产物的组织。例如,可使用来自花椰菜花叶病毒的 35S启动子来导入编码脂酶的基因,这样就能够在所有组织内表达。 使用例如玉米醇溶蛋白启动子在玉米谷粒内表达脂酶基因的反义转录 产物能够防止脂酶蛋白在种子内积累。这样由导入基因编码的蛋白质 就可以在除谷粒之外的所有组织内存在。

另外,已经报道了植物内的几种组织特异性调控基因和/或启动 子。一些报道的组织特异性基因包括编码种子储备蛋白(如napin, cruciferin,β-conglycinin和云扁豆蛋白)玉米醇溶蛋白或油体蛋白(如 oleosin)的基因,或与脂肪酸生物合成相关的基因(包括酰基载体蛋 白,硬酯酰-ACP去饱和酶,和脂肪酸去饱和酶(fad 2-1)),以及其 它在胚发育阶段表达的基因(如Bce 4,参见EP 255378和Kridl等, Seed Science Research,1:209(1991))。已公开的组织特异性启动子包 括凝集素(Vodkin,Prog.Clin.Biol.Res.,138;87(1983);Lindstrom 等,Der.Genet.,11:160(1990)),玉米醇脱氢酶1(Vogel等,1989; Dennis等,Nucleic Acids Res.,12:3983(1984)),玉米集光复合体 (Simpson,1986;Bansal等,Proc.Natl.Acad.Sci.USA,89: 3654(1992)),玉米热休克蛋白(Odell等,1985,Rochester等,1986), 豌豆小亚基RuBP羧化酶(Poulsen等,1986;Cashmore等,1983), Ti质粒甘露碱(mannopine)合酶(Langridge等,1989),Ti质粒胭 脂碱合酶(Langridge等,1989),矮牵牛苯基苯乙烯酮异构酶 (vanTunen等,EMBO J.,7;1257(1988)),菜豆甘氨酸富集蛋白1 (Keller等,Genes Dev.,3:1639(1989)),截短的CaMV 35s(Odell 等,Nature,313:810(1985)),马铃薯patatin(Wenzler等,Plant Mol. Biol.,13:347(1989)),根细胞(Yamamoto等,Nucleic Acids Res., 18:7449(1990)),玉米的玉米醇溶蛋白(Reina等,Nucleic Acids Res., 18:6425(1990);Kriz等,Mol.Gen.Genet.,207:90(1987);Wandelt等, Nucleic Acids Res.,17:2354(1989);Langridge等,Cell,34:1015(1983); Reina等,Nucleic Acids Res.,18:7449(1990)),球蛋白-1(Belanger 等,Genetics,129:863(1991)),α-微管蛋白,cab(Sullivan等, Mol.Gen.Genet.,215:431(1989)),PEPCase(Hudspeth & Grula,1989), R基因复合体相关启动子(Chandler等,Plant Cell,1:1175(1989)), 以及苯基苯乙烯酮合酶启动子(Franken等,EMBO J.,10:2605 (1991))。特别适用于种子特异性表达的是豌豆豌豆球蛋白启动子 (Czako等,Mol.Gen.Genet.,235:33(1992)。(还可参见US5,625,136, 并入本文作为参考)。其它可用于在成熟叶片内表达的启动子是那些在 衰老启动时打开的启动子,如来自阿布属的SAG启动子(Gan等, Science,270:1986(1995))。

从开花到果实发育时或过程(至少直到开始成熟)中表达的一类 果实特异性启动子在US 4,943,674中公开,将其全文并入本文作为参 考。在棉纤维中优先表达的cDNA克隆已被分离(John等,Proc.Natl. Acad.Sci.USA,89:5769(1992))。在果实发育过程中显示出差异表达的 番茄cDNA克隆已被分离并表征(Mansson等,Gen.Genet., 200:356(1985),Slater等,Plant Mol.Biol.,5:137(1985))。多聚半乳 糖醛酸酶基因的启动子在果实开始成熟的阶段处于活跃状态。US 4,535,060,US 4,769,061,US 4,801,590和US 5,107,065描述了多聚半乳 糖醛酸酶基因,将这些文献并入本文作为参考文献。

其它组织特异性启动子例子包括在叶受损(如被昆虫啃食)后能 够引导在叶细胞、在块茎(例如patatin启动子)以及在纤维细胞(发 育相关纤维细胞蛋白的例子是E6(John等,Proc.Natl.Acad.Sci.USA 89:5769(1992)))内表达的那些启动子。尽管所述E6基因在叶,胚珠 和花中以低水平转录,但在纤维内最为活跃。

一些“组织特异性”启动子的组织特异性可能并不是绝对的,本领 域技术人员可以利用白喉毒素序列对其进行测试。还可以用不同组织 特异性启动子的各种组合,通过“渗漏”表达来获得组织特异性表达 (Beals等,Plant Cell,9:1527(1997))。本领域技术人员还可以分离出 其他的组织特异性启动子(参见US 5,589,379)。

在一个实施方案中,多糖水解基因产物(如α-淀粉酶)的方向可 以靶向特定的细胞器(如质外体)而不是细胞质。这可使用玉米γ玉 米醇溶蛋白N末端信号序列(SEQ ID NO:17)来示范,该序列可使 蛋白特异性靶向质外体。将蛋白或酶靶向特定区室可以使酶以不会与 底物接触的方式定位。通过这种方式,酶直到接触到了其底物才会开 始酶促反应。可通过研磨(物理破坏细胞完整性)或加热细胞或植物 组织来破坏含有该酶的植物细胞或器官的完整性,以使该酶接触其底 物。例如,可将耐中温淀粉水解酶靶向质外体或内质网,从而使其无 法与造粉体中的淀粉颗粒接触。研磨该谷粒会使谷粒完整性破坏,这 样淀粉水解酶就会与淀粉颗粒接触。以这种方式就可以避免酶和其底 物共同定位的潜在负面影响。

在另一实施方案中,组织特异性启动子包括胚乳特异性启动子, 如玉米γ玉米醇溶蛋白启动子(如SEQ ID NO:12所示)或玉米 ADP-gpp启动子(如SEQ ID NO:11所示,其包括5’非翻译区和内含 子序列)。这样,本发明包括含有启动子的分离多核苷酸,所述启动子 含有SEQ ID NO:11或12,能够在低严谨度杂交条件下与其互补序列 杂交的多核苷酸,或其片段,它具有启动子活性,如SEQ ID NO:11 或12所示启动子活性的至少10%,优选50%的活性。

本领域另一实施方案中,编码耐超高温加工酶的多核苷酸与叶绿 体(造粉体)转运肽(CTP)以及来自例如waxy基因的淀粉结合域 可操作地相连。该实施方案中的示范多核苷酸编码SEQ ID NO:10(与 waxy的淀粉结合域相连的α-淀粉酶)。其他多核苷酸编码与信号序列 相连的耐超高温加工酶,所述信号序列能够将酶靶向内质网并分泌到 质外体内(如编码SEQ ID NO:13,27或30的多核苷酸所示范的,其 分别含有与α-淀粉酶,α-葡糖苷酶,葡萄糖异构酶可操作地相连的玉 米γ-玉米醇溶蛋白N末端序列),与信号序列相连的耐超高温加工酶, 所述信号序列能够将酶滞留在内质网内(如编码SEQ ID NO:14,26, 28,29,33,34,35或36的多核苷酸所示范的,其含有与耐超高温 酶可操作地相连的玉米γ玉米醇溶蛋白N末端序列,其与SEKDEL 可操作地相连,其中所述耐超高温酶为α-淀粉酶,malAα-葡糖苷酶, T.maritima葡萄糖异构酶,T.neapolitana葡萄糖异构酶),与能够将 酶靶向造粉体的N末端序列可操作地相连的耐超高温加工酶(如编码 SEQ ID NO:15的多核苷酸,其含有与α-淀粉酶可操作地相连的waxy 的N-末端造粉体导向序列),将酶靶向淀粉颗粒的耐超高温融合多肽 (如编码SEQ ID NO:16的多核苷酸所示范的,其含有能够导向造粉 体的waxy N末端序列,该N末端与含有waxy淀粉结合域的α-淀粉 酶/waxy融合多肽可操作地相连),与ER滞留信号相连的耐超高温加 工酶(如编码SEQ ID NO:38和39的多核苷酸)。另外,耐超高温加 工酶还可与具有氨基酸序列(SEQ ID NO:53)的粗淀粉(raw starch) 结合部位相连,其中编码所述加工酶的多核苷酸与编码该结合部位的 玉米优化核酸序列(SEQ ID NO:54)相连。

已报道了几种诱导型启动子。Gatz在Current Opinion in Biotechnology,7:168(1996)中以及Gatz C在Annu.Rev.Plant Physiol. Plant Mol.Biol.48:89(1997)中已描述了许多。示例包括四环素阻抑系 统,Lac阻抑系统,铜诱导型系统,水杨酸诱导型系统(如PR1a系 统),糖皮质激素诱导型(Aoyama T等,N-H Plant Journal, 11:605(1997))和蜕皮激素诱导型系统。其它诱导型启动子包括ABA- 和膨胀(turgor)-诱导型启动子,生长素结合蛋白基因启动子(Schwob 等,Plant J.4:423(1993)),UDP葡萄糖类黄酮糖基转移酶基因启动子 (Ralston等,Genetics,119:185(1988)),MPI蛋白酶抑制剂启动子 (Cordero等,Plant J.,6:141(1994)),和甘油醛-3-磷酸脱氢酶基因 启动子(Kohler等,Plant Mol.Biol.,29:1293(1995);Quigley等,J. Mol.Evol.,29:412(1989);Martinez等,J.Mol.Biol.,208:511 (1989))。还包括苯磺酰胺诱导型(US 5,364,780)和乙醇诱导型(WO 97/06269和WO97/06268)系统以及谷胱甘肽S转移酶启动子。

其它研究聚焦于根据环境压力或外界刺激而响应的诱导型调节的 基因,如盐度提高,干旱,病原体和损伤(Graham等,J.Biol.Chem., 260:6555(1985);Graham等,J.Biol.Chem.,260:6561(1985),Smith 等,Planta,168:94(1986))。已经报道在损伤马铃薯植物的叶片内会累 积金属羧肽酶抑制剂蛋白(Graham等,Biochem.Biophys.Res.Comm., 101:1164(1981))。还报道过其它能够被茉莉酮酸甲酯,诱导剂,热休 克,无氧压力或杀虫剂安全剂诱导的其它植物基因。

嵌合反式作用(transacting)病毒复制蛋白的受控表达可以被其 它遗传学方法进一步调控,例如Cre介导的基因活化(Odell等,Mol. Gen.Genet.,113:369(1990))。这样,在启动子和复制蛋白编码序列之 间含有被lox位点结合的3’调控序列的DNA片段(所述调控序列能够 阻断嵌合复制基因从启动子处表达)可通过Cre介导的切除作用去除, 使得反式作用复制基因表达。在这种情况下,嵌合的Cre基因,嵌合 的反式作用复制基因,或者上述两种基因都能够由组织和发育特异性 或诱导型启动子调控。另一种遗传学方法是使用tRNA抑制基因。例 如,tRNA抑制基因的受控表达可以条件性地调控含有适当终止密码 子的反式作用复制蛋白编码序列的表达(Ulmasov等,Plant Mol.Biol., 35:417(1997))。同样,嵌合tRNA抑制基因,嵌合反式作用复制基因, 或者上述二者都能够由组织和发育特异性或诱导型启动子调控。

优选地,对于多细胞生物,启动子还可以是特殊组织,器官或发 育阶段特异性的。这种启动子的例子包括但不限于:玉蜀黍(Zea mays)ADP-gpp和玉蜀黍γ-玉米醇溶蛋白启动子和玉蜀黍球蛋白启动 子。

可能期望仅仅在植物发育的某个时间段内在转基因植物内表达基 因。发育的时机选择通常与组织特异性基因的表达相关联。例如,玉 米醇溶蛋白储备蛋白的表达就通常在授粉作用后约15天在胚乳内开 始。

另外,还可以构建并使用载体在转基因植物细胞内将特定基因产 物靶向细胞内组分,或将蛋白导向细胞外环境。这通常可通过将编码 转运或信号肽序列的DNA序列与特定基因编码序列相连而完成。所 获的转运或信号肽分别将蛋白运送到特定的细胞内或细胞外目的地。 然后可以在翻译后被去除。转运或信号肽是通过促进蛋白通过细胞内 各种膜(如液泡,泡囊,质体和线粒体膜)来发挥作用的,而所述信 号肽能够指导蛋白通过细胞外膜。

这种诸如玉米γ玉米醇溶蛋白N末端信号序列等能够导向内质网 并分泌到质外体中的信号肽序列可以与本发明编码耐超高温加工酶的 多核苷酸可操作地相连(Torrent等,1997)。例如,SEQ ID NO:13,27 和30提供了编码与玉米γ玉米醇溶蛋白N末端序列可操作地相连的 耐超高温酶的多核苷酸。另一信号序列是用于将多肽滞留在内质网内 的SEKDEL氨基酸序列(Munro和Pelham,1987)。例如,编码SEQ ID NO:14,26,28,29,33,34,35或36的多核苷酸,其含有与加 工酶可操作地相连的玉米γ玉米醇溶蛋白N末端序列,所述酶与 SEKDEL可操作地相连。多肽还可以通过与waxy造粉体导向肽融合 从而靶向造粉体(Klosgen等,1986)或淀粉颗粒。例如,编码耐超 高温加工酶的多核苷酸可以与叶绿体(造粉体)转运肽(CTP)以及 来自例如waxy的淀粉结合域可操作地相连。SEQ ID NO:10示范了 与waxy的淀粉结合域相连的α-淀粉酶。SEQ ID NO:15示范了与 waxy的造粉体导向序列的N末端序列可操作地相连的α-淀粉酶。另 外,编码加工酶的多核苷酸还可以用waxy淀粉结合域来与淀粉颗粒 融合。例如,SEQ ID NO:16示范了含有waxy N末端造粉体导向序 列的融合多肽,所述序列与含有waxy淀粉结合域的α-淀粉酶/waxy 融合多肽可操作地相连。

如本领域所公知的,本发明的多核苷酸除了加工信号外,还可以 进一步含有其它调控序列。“调控序列”和“适当的调控序列”都是指定 位于编码序列上游(5’非编码序列)、之中或下游(3’非编码序列)的 核苷酸序列,该序列可以影响相连编码序列的转录,RNA加工或稳定 性,或者翻译。调控序列包括增强子,启动子,翻译前导序列,内含 子和多聚腺苷化信号序列。它们包括天然和合成的序列以及合成和天 然序列的组合序列。

如本领域所公知的,本发明还可使用可选择标记以允许将转化植 物或植物组织筛选出来。技术人员可能会期望将可选择或可筛选标记 基因用作目的可表达基因,或者除目的可表达基因之外,还使用可选 择或可筛选标记基因。“标记基因”是能够使表达该基因的细胞具备独 特表型的基因,从而能够将转化细胞与不具备该标记的细胞相互区分 开来。这样的基因可以编码可选择或可筛选标记,这取决于该标记是 否赋予可用化学方法,即利用选择剂(如除草剂,抗生素等)进行选 择的特性,或其是否只不过是可以通过观察或检测,即通过筛选而鉴 定的特性(例如R座位特性)。适当标记基因的许多实例为本领域所 知,可以用于实践本发明。

该术语可选择或可筛选标记的范围内,还包括编码“可分泌标记” 的基因,其分泌可以作为对转化细胞进行鉴定或选择的手段而被检测。 实例包括编码可分泌抗原的标记,该抗原可以通过抗体相互作用被鉴 定出来,或者甚至是编码可分泌酶的标记,所述酶可以通过其催化活 性而被检测出来。可分泌蛋白的种类很多,包括可通过例如ELISA检 测的小型可扩散蛋白;可在细胞外液中检测到的小型活性酶(如α-淀 粉酶,β内酰胺酶,膦丝菌素转乙酰酶);以及插入或包埋在细胞壁内 的蛋白(如含有前导序列的蛋白,例如在伸展蛋白或烟草PR-S的表 达单元中观察到的)。

就可选择的分泌型标记而言,使用编码含有独特的表位并被隐居 在细胞壁内的蛋白的基因被认为是特别有益的。这样的分泌抗原标记 理想地使用在植物组织中有低背景的表位序列,能够使其有效表达并 靶向通过质膜的启动子-前导序列,会形成与细胞壁结合的蛋白,这样 就可以使抗体接近。被修饰而含有独特表位的正常分泌型细胞壁蛋白 就可以满足这样的需求。

适于以这种方式修饰的一种蛋白就是伸展蛋白,或富含羟基脯氨 酸的糖蛋白(HPRG)。例如,玉米HPRG(Steifel等,The Plant Cell, 2:785(1990))分子在分子生物学,表达和蛋白结构上已被详细地表征。 但是,可以通过加入抗原位点而对任何一种伸展蛋白和/或富含甘氨酸 细胞壁蛋白(Keller等,EMBO Journal,8:1309(1989)进行修饰从而形 成可筛选标记。

a.可选择标记

可用于本发明的选择标记包括但不限于:neo或nptII基因 (Potrykus等,Mol.Gen.Genet.,199:183(1985)),其编码卡那霉素抗 性,可利用卡那霉素进行筛选,及G418等;bar基因,其能够赋予除 草剂膦丝菌素抗性;编码改变的EPSP合酶蛋白的基因(Hinchee等, Biotech,6:915(1988))从而能够赋予草甘膦抗性;腈水解酶,如来自 Klebsiella ozaenae的bxn,其赋予溴苯腈抗性(Stalker等,Science, 242:419(1988));突变的乙酰乳酸合酶(ALS),其能够赋予咪唑啉 酮,磺酰脲类或其它ALS抑制化合物抗性(欧洲专利申请154,204, 1985);氨甲喋呤抗性DHFR基因(Thillet等,J.Biol.Chem.,263: 12500(1988));能够赋予除草剂茅草枯抗性的茅草枯脱卤素酶基因;磷 酸甘露糖异构酶(PMI)基因;能够赋予5-甲基色氨酸抗性的突变邻 氨基苯甲酸合酶基因;能够赋予抗生素潮霉素抗性的hph基因;或者 甘露糖-6-磷酸异构酶基因(这里还称作磷酸甘露糖异构酶基因),其 提供代谢甘露糖的能力(US 5,767,378和5,994,629)。本领域技术人员 能够选择适当的可选择标记基因实践本发明。当使用突变的EPSP合 酶时,并入适当的叶绿体转运肽CTP还可以获得额外的益处 (EP0,218,571,1987)。

可用于选择转化株的可选择标记基因的一个说明性实例是编码膦 丝菌素转乙酰酶的基因,如吸水链霉菌(Streptomyces hygroscopicus) 的bar基因或绿产色链霉菌(Streptomyces viridochromogenes)的pat 基因。膦丝菌素转乙酰酶(PAT)能够将除草剂bialaphos中的活性成 分膦丝菌素(PPT)失活。PPT能够抑制谷氨酰胺合酶(Mrakami等, Mol.Gen.Genet.,205:42(1986);Twell等,Plant Physiol.91: 1270(1989)),导致氨迅速积累,使细胞死亡。将该选择系统与单子叶 植物一起使用获得的成功令人感到意外,因为已经报道了在谷类转化 中的巨大困难(Potrykus,Trends Biotehch.,7:269(1989))。

当期望使用bialaphos抗性基因实践本发明时,一个非常有用的 基因是可获自链霉菌属物种(如ATCC No.21,705)的bar或pat基 因。已经公开了bar基因的克隆(Murakami等,Mol.Gen.Genet.,205: 42(1986);Thompson等,EMBO Journal,6:2519(1987))以及bar基因 在单子叶植物以外植物内的应用(De Block等,EMBO Journal,6: 2513(1987);De Block等,Plant Physiol.91:694(1989))。

b.可筛选标记

可使用的可筛选标记包括但不限于,β-葡糖醛酸酶或uidA基因 (GUS),已知其编码的酶的各种产色底物;R-座位基因,其编码的 产物能够调节花青甙色素(红色)在植物组织内的产生(Dellaporta 等,Chromosome Sructure and Function,263-282(1988));β-内酰胺酶 基因(Sutcliffe,PNAS USA 75:3737(1978)),已知其编码的酶的各 种产色底物(如PADAC,一种产色头孢菌素);xylE基因(Zukowsky 等,PNAS USA,80:1101(1983)),其编码儿茶酚双加氧酶,该酶可转 化产色儿茶酚;α-淀粉酶基因(Ikuta等,Biotech.,8:241(1990));酪 氨酸酶基因(Katz等,J.Gen.Microbiol.,129:2703(1983)),其编码 能够氧化酪氨酸为DOPA和多巴醌的酶,DOPA和多巴醌反过来能够 缩合形成可容易检测的化合物黑色素;β-半乳糖苷酶基因,其编码有 多种产色底物的酶;萤光素酶(lux)基因(Ow等,Science,234: 856(1986)),其可以允许生物发光检测;或水母发光蛋白基因(Prasher 等,Biochem.Biophys.Res.Comm.,126:1259(1985)),其可用于钙敏 感性生物发光检测,或绿色荧光蛋白基因(Niedz等,Plant Cell Reports, 14:403(1995))。

来自玉米R基因复合物的基因被认为是特别有效的可筛选标记。 玉米中的R基因复合物编码能够在多数种子和植物组织内调节花青甙 色素生产的蛋白。来自R基因复合物的基因适于转化玉米,因为该基 因在转化细胞内的表达不会伤害细胞。这样,被导入这种细胞内的R 基因会导致红色色素表达,如果稳定导入就能够以红色部分来目测打 分。如果玉米品系携带着编码花青甙生物合成途径中酶中间体的基因 的显性等位基因(C2,A1,A2,Bz1和Bz2),但是在R座位携带有隐性 的等位基因,则用R转化来自该品系的任何细胞都会导致红色色素的 生成。示范的品系包括Wisconsin22,其含有rg-Stadler等位基因和 TR112,其为一种K55的衍生物,为r-g,b,P1。或者如果C1和R等 位基因被共同导入时可使用玉米的任何基因型。另一个期待可用于本 发明的筛选标记是萤火虫萤光素酶,由lux基因编码。可使用例如X 光片,闪烁计数,荧光分光光度法,低照度摄像机,光子计数照相机 或多室发光光度法(multiwell luminometry)检测转化细胞中lux基 因的存在。还设想该系统可被发展用于生物发光的群体筛选,如在组 织培养皿上,或者甚至用于整个植物筛选。

用于转化植物的多核苷酸可以包括但不限于,植物基因和非植物 基因DNA,如来自细菌,酵母,动物或病毒的DNA。被导入的DNA 可以包括修饰的基因,基因的部分,嵌合基因,包括来自相同或不同 玉米基因型的基因。术语“嵌合基因”或“嵌合DNA”是指含有来自物种 的至少两种DNA序列或区段的基因或DNA序列或区段,所述物种在 天然环境下不会合并该DNA,或者其中DNA序列或片段以在未转化 植物的天然基因组内通常不会发生的方式放置或相连。

还提供了含有编码耐超高温加工酶的多核苷酸的表达盒,所述多 核苷酸优选密码子被优化的多核苷酸。优选表达盒中的多核苷酸(第 一多核苷酸)与调控序列,如启动子,增强子,终止序列或其组合可 操作地相连,并且还可任选地与编码信号序列(N-或C-末端)的第二 多核苷酸可操作地相连,该多核苷酸可将第一多核苷酸所编码的酶导 向特定细胞或亚细胞部位。这样,启动子和一个或多个信号序列能够 使酶在植物、植物组织或植物细胞内的特定位置高水平表达。启动子 可以是组成型的启动子,诱导型(条件型)启动子或组织特异性启动 子,如胚乳特异性启动子,例如玉米γ玉米醇溶蛋白启动子(如SEQ ID NO:12)或玉米ADP-gpp启动子(如SEQ ID NO:11,其含有5’ 非翻译和内含子序列)。本发明还提供了含有启动子的分离多核苷酸, 所述启动子含有SEQ ID NO:11或12,在低严谨性杂交条件下与其互 补序列杂交的多核苷酸,或其具有启动子活性的片段,例如所述启动 子活性是具有SEQ ID NO:11或12的启动子的活性的至少10%,优 选至少50%。还提供含有本发明表达盒或多核苷酸的载体以及含有本 发明多核苷酸,表达盒或载体的转化细胞。本发明的载体可以含有编 码不止一种本发明耐超高温加工酶的多核苷酸序列,该序列可以是正 义或反义方向,且转化细胞可以含有一个或多个本发明载体。优选能 够将核酸导入植物细胞的载体。

转化

表达盒或者含有该表达盒的载体构建体可以被插入细胞中。该表 达盒或载体构建体能够以附加型被携带或整合到细胞基因组中。然后 转化细胞可以培养为转基因植物。相应地,本发明提供该转基因植物 的产物。这种产物可以包括但不限于,种子,果实,后代和转基因植 物后代的产物。

本领域技术人员可利用多种将构建体导入宿主细胞的技术,许多 这样的技术都是已知的。细菌和许多真核细胞的转化可利用聚乙二醇, 氯化钙,病毒感染,噬菌体感染,电穿孔和其它本领域公知方法进行。 转化植物细胞或组织的方法包括使用根癌农杆菌(A.tumefaciens)或 毛根农杆菌(A.rhizogenes)作为转化工具的DNA转化,电穿孔,DNA 注射,微粒轰击,颗粒加速等(如参见EP295959和EP138341)。

在一个实施方案中,来自土壤杆菌属Ti衍生载体的Ti和Ri质粒 二元型载体被用于转化各种高等植物,包括单子叶和双子叶植物,如 大豆,棉花,油菜,烟草和稻(Pacciotti等,Bio/Technology,3: 241(1985):Byrne等,Plant Cell Tissue and Organ Culture,8:3(1987); Sukhapinda等,Plant Mol.Biol.8:209(1987);Lorz等,Mol. Gen.Genet.,199:178(1985);Potrykus,Mol.Gen.Genet., 199:183(1985);Park等,J.Plant Biol.38:365(1985):Hiei等,Plant J., 6:271(1994))。利用T-DNA转化植物细胞已经进行了大量的研究,已 被详细公开(EP120516;Hoekema,The Binary Plant Vector System. Offset-drukkerij Kanters B.V.;Alblasserdam(1985),Chapter V; Knauf等,Genetic Analysis of Host Range Expression by Agrogacterium,见:Molecular Genetics of the Bacteria-Plant Interaction,Puhler,A.编,Springer-Verlag,New York,1983,p.245; 以及An.等,EMBO J.,4:277(1985))。

其它转化方法是本领域技术人员可获得的,如外源DNA构建体 的直接摄取(见EP295959),电穿孔技术(Fromm等,Nature(London), 319:791(1986)),或者用覆盖有核酸构建体的金属粒子进行的高速粒 子轰击(Kline等,Nature(London)327:70(1987)和US 4,945,050)。 转化后,细胞可以由本领域技术人员进行再生。特别相关的是最近发 表的转化外源基因到重要经济作物如菜籽油菜(De Block等,Plant Physiol.91:694-701(1989)),向日葵(Everett等,Bio/Technology, 5:1201(1987)),大豆(McCabe等,Bio/Technolgy,6:923(1988);Hinchee 等,Bio/Technology,6:915(1988);Chee等,Plant Physiol.,91: 1212(1989);Christou等,Proc.Natl.Acad.Sci USA,86:7500(1989) EP301749),稻(Hiei等,Plant J.6:271(1994))和玉米(Gordon Kamm 等,Plant Cell,2:603(1990);Fromm等,Biotechnology,8:833,(1990)) 内的方法。

含有基因组片段或合成片段的表达载体可以被导入原生质体或导 入完整组织或分离细胞内。优选表达载体是被导入完整的组织。常用 的培养植物组织的方法是已知的,例如,参见Maki等,“Procedures for Introducing Foreign DNA into Plants”in Methods in Plant Molecular Biology & Biotechnology,Glich等,(编)pp.67-68,CRC Press(1993); 以及Phillips等,“Cell-Tissue Culture and In-Vitro Manipulation”in Corn & Corn Improvement,3rd Edition10,Sprague等,(编)pp. 345-387,American Society of Agronomy Inc.(1988)。

在一个实施方案中,表达载体可以使用直接基因转移方法被导入 玉米或其它植物组织,如微粒介导的运送,DNA注射,电穿孔等。用 生物轰击设备(biolistic device)进行微粒介导运送可将表达载体导入 植物组织。例如参见,Tomes等,“Direct DNA transfer into intact cells via microprojectile bombardment”in Gamborg和Phillips(编)Plant Cell,Tissue and Organ Culture:Fundamental Methods Springer Verlag,Berlin(1995)。但是,本发明设想了根据已知的转化方法用耐 超高温酶转化植物。还可参见,Weissinger等,Annual Rev.Genet.,22: 421(1988);Sanford等,Particulate Science and Techmology,5: 27(1987)(洋葱);Christou等,Plant Physiol.,87:671(1988)(大豆); McCabe等,Bio/Technology,6:923(1988)(大豆);Datta等, Bio/Technology,8:736(1990)(稻);Klein等,Proc.Natl.Acad,Aci. USA,85:4305(1988)(玉米);Klein等,Bio/Technology,6:559(1988) (玉米);Klein等,Plant Physiol.,91:440(1988)(玉米);Fromm等, Bio/Technology,8:833(1990)(玉米);以及Gordon-Kamm等,Plant Cell,2,603(1990)(玉米);Svab等,Proc.Natl.Acad.Sci.USA, 87:8526(1990)(烟草叶绿体);Koziel等,Biotechnology,11: 194(1993)(玉米);Shimamoto等,Nature,338:274(1989)(稻);Christou 等,Biotechnology,9:957(1991)(稻);欧洲专利申请EP0332581(鸭 茅和其它Pooideae);Vasil等,Biotechnology,11:1553(1993)(小 麦);Weeks等,Plant Physiol.,102:1077(1993)(小麦)。Methods in Molecular Biology,83.Arabidopsis Protocols,Martinez-Zapater和 Salinas编,1998Humana Press(阿布属)。

可以用单一DNA分子或多个DNA分子(即共转化)来实现植物 的转化,这些技术都适用于本发明的表达盒和构建体。许多转化载体 都可以用于植物转化,本发明的表达盒可与任何这种载体一起使用。 载体的选择依赖于优选的转化技术和转化的目的物种。

最后,最期望用于导入单子叶植物基因组的DNA片段可以是同 源基因或基因家族,所述基因编码期望的性状(如蛋白,脂类或多糖 的水解)并被导入处在新启动子或增强子等,或者甚至可能是同源或 组织特异性(如根-,珠托/叶鞘-,轮-,茎-,穗柄(earshank)-,谷 粒-或叶-特异性)启动子或调控元件的调控下。实际上还预计本发明 的特定应用是以组成型或诱导型的方式进行的基因导向。

合适转化载体的实例

植物转化领域已知有许多用于植物转化的转化载体,本发明的基 因可以与本领域公知的任何这种载体一起使用。载体的选择依据优选 的转化技术以及转化的靶物种。

a.适于土壤杆菌转化的载体

使用根癌农杆菌(Agrobacterium tumefaciens)进行转化可以使 用许多载体。这些通常携带至少一种T-DNA边界(border)序列,包 括例如pBIN19(Bevan,Nucl.Acids.Res.(1984))。下文将介绍两种 适于土壤杆菌转化的典型载体的构建过程。

pCIB200和pCIB2001

二元载体pCIB200和pCIB2001可用于构建重组载体以使用土壤 杆菌进行转化,其构建过程如下。用NarI消化pTJS75(Schmidhauser & Helinski,J.Bacteriol.,164:446(1985)),切除四环素抗性基因,再 插入来自pUC4K的AccI片段,所述片段带有NPTII(Messing & Vierra,Gene,19:259(1982):Bevan等,Nature,304:184(1983): McBride等,Plant Molecular Biology,14:266(1990))得到 pTJS75kan。将XhoI接头与PCIB7的EvoRV片段相连,所述片段含 有左侧和右侧的T-DNA边界,植物可选择nos/nptII嵌合基因,和pUC 多接头(Rothstein等,Gene,53:153(1987))。将XhoI消化的片段克 隆到SalI消化的pTJS75kan中,得到pCIB200(参见EP0332104, 实施例19)。pCIB200含有以下独特的多接头限制位点:EcoRI,SstI, KpnI,BglII,XbaI和SalI。pCIB2001是pCIB200的衍生物,通过向 多接头中插入额外的限制性位点而得到。pCIB2001中多接头中的独 特限制性位点为:EcoRI,SstI,KpnI,BglII,XbaI,SalI,MluI,BclI, AvrII,ApaI,HpaI和StuI。除含有这些独特的限制性位点外,pCIB2001 还含有植物和细菌卡那霉素选择标记,土壤杆菌介导的转化所用的左 侧和右侧T-DNA边界,用于在大肠杆菌和其它宿主之间转移的RK2- 衍生trfA功能,和同样来自RK2的OriT和OriV功能。pCIB2001 多接头适于克隆含有自身调控信号的植物表达盒。

DCIB10及其潮霉素选择衍生物;

二元载体pCIB10含有编码用于在植物中进行选择的卡那霉素抗 性基因以及T-DNA右侧和左侧边界序列,插入了来自宽宿主范围的质 粒pRK252的序列,使其在大肠杆菌(E.coli)和土壤杆菌中能够复 制。Rothstein等描述了其构建过程(Gene,53:153(1987))。构建 了pCIB10的各种衍生物,这些衍生物并入了Gritz等所描述的(Gene, 25:179(1983))潮霉素B磷酸转移酶的基因。这些衍生物使转基因植 物能够只在潮霉素(pCIB743)上或在潮霉素和卡那霉素(pCIB715, pCIB717)上进行选择。

b.适于非土壤杆菌转化的载体

不使用根癌农种菌进行的转化避免了在选择的转化载体中必需使 用T-DNA序列,这样,除了例如上述含有T-DNA序列的载体外,还 可以使用缺乏这些序列的载体。不依赖土壤杆菌的转化技术包括通过 粒子轰击,原生质体吸收(如PEG和电穿孔)以及显微注射进行的转 化。载体的选择很大程度上依赖于待转化物种的优选选择。将进一步 描述适于非土壤杆菌转化的典型载体构建过程的非限制性实例。

pCIB3064

pCIB3064是pUC的衍生载体,适于与利用除草剂basta(或膦丝 菌素)进行的选择共同使用来直接基因转移。质粒pCIB246含有CaMV 35S启动子,该启动子与大肠杆菌GUS基因和CaMV 35S转录终止子 可操作融合。该质粒描述在PCT公开申请WO93/07278。该载体的35S 启动子含有两个起始位点5’的ATG序列。这些序列已使用标准PCR 技术进行了突变,突变去除了ATG,并形成了SspI和PvuII限制性 位点。新的限制性位点距唯一的SalI为96和37bp,距实际的起始位 点为101和42bp。所获的pCIB246衍生物命名为pCIB3025。然后通 过SalI和SacI消化从pCIB3025切除GUS基因,末端处理成平头并 重新连接形成pCIB3060质粒。该质粒pJIT82可以获自John Innes Centre,Norwich,将含有Streptomyces viridochromogenes的bar基 因的400bp SmaI片段切除,并插入到pCIB3060的HpaI位点 (Thompson等,EMBO J.,6:2519(1987))。这样就形成了pCIB3064, 其含有bar基因,处于CaMV 35S启动子和终止子的调控下,用于除 草剂筛选,并含有氨苄青霉素抗性基因(用于在大肠杆菌中筛选)以及 带有唯一SphI,PstI,HindIII和BamHI位点的多接头。该载体适于克 隆含有自身调控信号的植物表达盒。

pSOG19和pSOG35

质粒pSOG35是利用能够赋予氨甲喋呤抗性的大肠杆菌基因二氢 叶酸还原酶(DHFR)作为选择标记的转化载体。使用PCR从pSOG10 扩增35S启动子(-800bp),玉米Adh1基因的内含子(-550bp)和 GUS非翻译前导序列18bp。同样用PCR扩增编码大肠杆菌II型二氢 叶酸还原酶基因的250bp片段,将这两种PCR片段与 pB1221(Clontech)的SacI-PstI片段组装,所述pB1221片段含有pUC19 载体的骨架以及胭脂碱合酶终止子。这些片段组装后形成了pSOG19, 其含有35S启动子,该启动子与内含子6序列,GUS前导序列,DHFR 基因和胭脂碱合酶终止子融合。用玉米褪绿斑点病毒(Maize Chlorotic Mottle Virus)(MCMV)的前导序列替换pSOG19中的GUS前导序 列就形成了载体pSOG35。pSOG19和pSOG35携带有氨苄青霉素抗 性的pUC基因并具有HindIII,SphI,PstI和EcoRI位点,可用于克隆 外源物质。

c.适于叶绿体转化的载体

为了在植物质体中表达本发明的核苷酸序列,可使用质体转化载 体pPH143(WO 97/32011,实施例36)。该核苷酸序列被插入pPH143 从而取代了PROTOX编码序列。然后将该序列用于质体转化并根据 壮观霉素抗性筛选转化株。或者,将该核苷酸序列插入pPH143从而 使其替代aadH基因。在这种情况下,依据PROTOX抑制剂的抗性筛 选转化株。

接受转化方法处理的植物宿主

任何能够随后无性繁殖(克隆繁殖)的植物组织,无论是通过器 官发生或是胚胎发生,都可以用本发明的构建体进行转化。术语器官 发生指从分生组织中心顺序地发育芽或根的过程,而胚胎发生指芽和 根以一致的方式(而非顺序地)共同发育的过程,不论从体细胞或配 子开始。特定组织的选择依据可使用的和最适于待转化的特定物种的 无性繁殖系统而定。示范性的靶组织包括分化和未分化的组织或植物, 包括但不限于叶片圆盘,根,茎,枝条,叶,花粉,种子,胚,子叶, 下胚轴,大配子体,愈伤组织,现存的分生组织(如顶端分生组织, 腋芽和根分生组织),以及诱导的分生组织(如子叶分生组织和下胚轴 分生组织),肿瘤组织和各种形式的细胞和培养物,如单细胞,原生质 体,胚和愈伤组织。植物组织可以在植物或器官,组织或细胞培养物 内。

本发明的植物可以是各种形式。该植物可以是转化细胞和非转化 细胞的嵌合体;该植物可以是无性系转化株(如所有的细胞均转化含 有表达盒);该植物可以含有转化及非转化组织的嫁接体(如在柑橘物 种中转化的根状茎嫁接到未转化的接穗上)。该转化植物可以各种方式 繁殖,如通过无性繁殖或经典育种技术。例如,第一代(或T1)转化 的植物可以自花授粉形成纯合的第二代(或T2)转化植物,而T2植 物可进一步通过经典育种技术繁殖。显性选择标记(如nptII)可与表 达盒相连以辅助育种。

本发明还可以用于转化任何植物物种,包括单子叶或双子叶植物, 包括但不限于,玉米(玉蜀黍),芸苔属物种(Brassica sp.)(如欧洲油 菜(B.napus),芜青(B.rapa),芥菜(B.jucea)),特别是那些作为 种子油来源的芸苔属物种,紫苜蓿(Medicago sativa),稻(Oryza sativa),黑麦(Secale cereale),高粱(两色蜀黍(Sorghum bicolor), 蜀黍(Sorghum vulgare)),黍(如御谷(Pennisetum glaucum),野 生稷(Panicum miliaceum),谷子(Setaria italica), 子(Eleusine coracana)),向日葵(Helianthus annuus),红花(Carthamus tinctorius),小麦(Triticum aestivum),大豆(Giycine max),烟草 (Nicotiana tabacum),马铃薯(Solanum tuberosum),落花生(Arachis hypogaea),棉花(海岛棉(Gossypium barbadense),陆地棉 (Gossypium hirsutum)),甘薯(Ipomoea batatus),木薯(Manihot esculenta),咖啡属(Cofea spp.),椰子(Cocos nucifera),菠萝(Ananas comosus),柑橘属(Citrus spp.),可可树(Theobroma cacao),茶 (Camellia sinensis),香蕉属(Musa spp.),鳄梨(Persea americana), 无花果(Ficus casica),番石榴(Psidium guajava),芒果(Mangifera indica),油橄榄(Olea europaea),番木瓜(Carica papaya),腰果 (Anacardium occidentale),全缘澳洲坚果(Macadamia integrifolia), 扁桃(Prunus amygdalus),甜菜(Beta vulgaris),甘蔗属(Saccharum spp.),燕麦,大麦,蔬菜,观赏植物,木本植物如针叶树和落叶树, 南瓜,西葫芦,大麻,夏南瓜,苹果,梨,温柏,甜瓜,李,樱桃, 桃,油桃,杏,草莓,葡萄,覆盆子,黑莓,大豆,高粱,甘蔗,菜 籽油菜(rapeseed),三叶草,胡萝卜和鼠耳芥(Arabidopsis thaliana)。

蔬菜包括番茄(Lycopersicon esculentum),莴苣(如Lactuca sativa),菜豆(Phaseolus vulgaris),利马豆(Phaseolus limensis), 山黧豆属(Lathyrus spp.),花椰菜,嫩茎花椰菜,芜菁,萝卜,菠菜, 石刁柏,洋葱,蒜,胡椒,芹菜和香瓜属(Cucumis)的成员,如黄 瓜(C.sativus),棱瓜(C.cantalupensis)和香瓜(C.melo)。观赏植 物包括杜鹃花属(Rhododendron spp.),八仙花(Macrophylla hydrangea),芙蓉(Hibiscus rosasanensis),蔷薇属(Rosa spp.),郁 金香属(Tulipa spp.),水仙属(Narcissus spp.),碧冬茄(Petunia hybrida),麝香石竹(Dianthus caryophyllus),一品红(Euphorbia pulcherrima)和菊花。可用于实施本发明的针叶树包括,例如松树, 如火炬松(Pinus taeda),湿地松(Pinus elliotii),西黄松(Pinus ponderosa),小干松(Pinus contorta)和辐射松(Pinus radiata),花 旗松(Pseudotsuga menziesii);加州铁杉(Tsuga canadensis);白云 杉(Picea glauca);北美红杉(Sequoia sempervirens);冷松,如太 平洋冷松(Abies amabilis)和胶枞(Abies balsamea);以及杉木 (cedars),如北美乔柏(Thuja plicata)和黄扁柏(Chamaecyparis nootkatensis)。豆科植物包括菜豆类(beans)和豌豆类。菜豆类包括瓜 尔豆、槐豆、苦豆(fenugreek)、大豆、菜豆、豇豆、绿豆、利马豆、 蚕豆、小扁豆、鹰嘴豆等。豆科植物包括但不限于,落花生属,如花 生,野豌豆属,如广布野豌豆,毛苕子,赤豆,绿豆和鹰嘴豆,羽扇 豆属,如羽扇豆,三叶草,菜豆属,如菜豆,和利马豆,豌豆属(Pisum), 如车轴草,草木犀属(Medicago),如苜蓿,苜蓿属,如紫目蒮,百 脉根属,如车轴草,兵豆属,如兵豆,和假木兰。用于本发明方法的 优选饲料和草皮草包括苜蓿,鸭茅,牛尾覃,黑麦草,红顶草和小糠 草。

优选地,本发明植物包括作物,如玉米,苜蓿,向日葵,芸苔属, 大豆,棉花,红花,花生,高粱,小麦,黍,烟草,大麦,稻,番茄, 马铃薯,南瓜,香瓜类,豆类作物等。其它优选的植物包括Liliopsida 和Panicoideae。

当目的DNA序列被转化到特定植物物种中后,就可以使用传统 育种技术,使该DNA在该物种中传播,或者转移到相同物种的其它 品体中,特别包括商业品体。

以下描述了一些转化双子叶和单子叶植物的代表性方法,以及代 表性的质体转化技术。

a.双子叶植物的转化

用于转化双子叶植物的技术是本领域公知的,保括以土壤杆菌为 基础的技术以及那些不需要土壤杆菌的技术。非土壤杆菌技术包括原 生质体或细胞对于外源遗传物质的直接摄取。这可通过PEG或电穿孔 介导的摄取,粒子轰击介导的运送或显微注射来完成。Paszkowski等, EMBO J.,3:2717(1984),Potrykus等,Mol.Gen.Genet.,1999:169 (1985),Reich等,Biotechnology,4:1001(1986)和Klein等,Nature,327: 70(1987)都描述了这些技术。无论何种情况,都可使用本领域公知的 标准技术将转化细胞再生为完整的植物。

土壤杆菌介导的转化是转化双子叶植物的优选技术,因为其转化 效率高,且可广泛应用于许多不同的物种。土壤杆菌转化通常涉及将 携带有外源目的DNA的二元载体(如pCIB200或pCIB2001)转移到 适当的土壤杆菌菌株内,这可能依赖于由宿主土壤杆菌株携带的位于 共居(co-resident)Ti质粒或染色体上的vir基因的互补(如菌株 CIB542用于pCIB200和pCIB2001(Uknes等,Plant Cell,5:159 (1993)))。重组二元载体到土壤杆菌的转移由三亲交配过程来完成, 该过程使用携带有重组二元载体的大肠杆菌,携带有诸如pRK2013 等的质粒的辅助大肠杆菌菌株,该辅助菌株能够将重组二元载体转移 到靶土壤杆菌菌株内。或者,可通过DNA转化将重组二元载体转移 到土壤杆菌中(H_fgen & Willmitzer,Nucl.Acids Res.,16:9877 (1988))。

利用重组土壤杆菌进行的靶植物物种转化通常涉及将土壤杆菌与 该植物的外植体共培养,并使用本领域公知的技术。在携带有抗生素 或除草剂抗性标记的选择培养基上再生转化的组织,所述标记位于二 元质粒T-DNA边界之间。

载体的导入可以采用已知方式。优选用于转化的细胞包括土壤杆 菌,单子叶植物细胞和双子叶植物细胞,包括Liliopsida细胞和 Panicoideae细胞。优选的单子叶细胞为谷类细胞,如玉米(玉蜀黍), 大麦和小麦以及积累淀粉的双子叶细胞,如马铃薯。

用基因转化植物细胞的另一方法涉及向植物组织和细胞中推进惰 性或生物活性颗粒。该技术在美国专利US 4,945,050,5,036,006和 5,100,792中有描述。通常,该过程涉及在能够有效穿透细胞外表面并 掺入其内部的条件下向植物组织和细胞中推进惰性或生物活性颗粒。 当使用惰性颗粒时,载体可以通过用含目的基因的该载体包被该颗粒 而被导入细胞。或者,可用载体包围靶细胞这样可通过跟随粒子将载 体带入细胞。生物活性颗粒(如干酵母细胞,干细菌或噬菌体,其均 含有待导入的DNA)也可以被推进植物细胞组织。

b.单子叶植物的转化

目前大多数单子叶植物物种的转化均已成为常规性的操作。优选 的技术包括使用乙二醇(PEG)或电穿孔技术以及粒子轰击进入愈伤 组织的方式直接将基因转移到原生质体。转化可以用单一DNA种类 或多个DNA种类(即共转化)进行,这些技术都适用于本发明。共 转化可以具有如下优点:避免完整载体构建以及制备带有不连锁的目 的基因和选择标记座位的转基因植物,如果认为需要的话,能够在随 后的过程中去除该可选择标记。但是,共转化的一个缺陷是分开的 DNA种类被整合到基因组中的频率小于100%(Schocher等, Biotechnolgy,4:1093(1986))。

专利申请EP0292435,EP0392225和WO93/07278描述了从玉米 原种(elite)近交品系制备愈伤组织和原生质体,使用PEG或电穿孔转 化原生质体,以及从转化的原生质体再生玉米植物的方法。 Gordon-kamm等(Plant Cell,2:603(1990))和Fromm等 (Biotechnolgy,8:833(1990))均公开了使用粒子轰击转化A188衍生 玉米品系的方法。另外,WO03/07278和Koziel等(Biotechnology,11: 194(1993))均描述了使用粒子轰击转化原种近交玉米品系。该技术使 用了授粉后14-15天从玉米穗剪下的1.5-2.5mm长的未成熟玉米胚和 PDS-1000He Biolistics设备。

还可应用原生质体或粒子轰击直接转移基因来实现稻的转化。已 公开了Japonica型和Indica型的原生质体介导转化(Zhang等,Plant Cell Rep.,7:379(1988);Shimamoto等,Nature,338:274(1989);Datta 等,Biotechnology,8:736(1990))。这两种类型还可使用粒子轰击进行 常规转化(Christou等,Biotechnology,9:957(1991)。另外, WO93/21335公开了电穿孔转化稻的方法。专利申请EP0332581公开 了制备,转化及再生Pooideae原生质体的方法。这些技术可以转化鸭 茅属(Dactylis)和小麦。另外,Vasil等(Biotechnology,10:667(1992)) 开公开了使用粒子轰击进入C型长期可再生愈伤组织细胞转化小麦的 方法,Vasil等(Biotechnology,11:1553(1993))和Weeks等(Plant Physiol.,102:1077(1993))还公开了使用未成熟胚和未成熟胚衍生的愈 伤组织进行粒子轰击转化小麦的方法。但是转化小麦的优选方法涉及 利用未成熟胚粒子轰击的转化,并且包括在基因运送前进行高蔗糖或 高麦芽糖步骤。轰击前,将任意数量的胚(0.75-1mm长)植到3%蔗 糖和3mg/l 2,4-D的MS培养基上(Murashiga & Skoog,Physiologia Plantarum,15:473(1962))用于诱导体细胞胚,该过程在黑暗条件下 进行。在轰击当天,将胚从诱导培养基中取出并置于渗压剂上(即以 期望的浓度,通常为15%,加入蔗糖或麦芽糖的诱导培养基)。使胚 质壁分离2-3小时,然后轰击。通常每个靶板上有20个胚胎,但不是 关键性的。使用标准方法,将适当的基因携带质粒(如pCIB3064或 pSG35)沉淀到微米大小的金颗粒上。用DuPont Biolistics_氦设备, 标准80目筛网,约1000psi的爆破压力轰击各板胚。轰击后,将胚放 回暗处使其恢复约24小时(仍置于渗压剂上)。24小时后将胚从渗压 剂取出再置于诱导培养基上约1个月使其再生。约1一个月后,将带 有发育的胚胎发生愈伤组织的胚外植体转移到再生培养基中(MS+1 mg/升NAA,5mg/升GA),该培养基还进一步含有适当的选择剂 (pCIB3064为10mg/l basta,pSOG35则使用2mg/l氨甲喋呤)。大约 1个月后,将长出的芽转移到更大的名为“GA7s”的无菌容器内,该容 器含有半强度MS,2%蔗糖和相同浓度的选择剂。

已经公开了使用土壤杆菌转化单子叶植物的方法,参见 WO94/00977和US5,591,616,均引入本文作为参考。

c.质体转化

大致如文献(Svab和Maliga,PNAS,90:913(1993))所述,在T 琼脂培养基上的1”圆形矩阵上使Nicotiana tabacum c.v.‘Xanthi nc’ 的种子发芽,每板7个,用覆有pPH143和pPH145质粒DNA的1μm 钨颗粒(M10,Biorad,Hercules,CA)在播种后12-14进行轰击。轰击 后的幼苗在T培养基上培育2天,然后切下叶子并在RMOP培养基 平板上将远轴一侧向上置于亮光处(350-500μmol光子/m2/s)(Svab, Hajdukiewicz和Maliga,PNAS,87:8526(1990)),所述培养基含有 500μg/ml二盐酸壮观霉素(Sigma St.Louis,MO)。轰击后3-8周将出 现在黄化叶子下面的耐性芽亚克隆到相同的选择培养基中,使其形成 愈伤组织,并分离第二批芽进行亚克隆。通过Southern印迹标准技 术(Sambrook等,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor(1989)),评价独立亚克隆中转化质体基因组拷贝的完 全分离(homoplasmicity)。在1%Tris-硼酸盐(TBE)琼脂凝胶上分离 BamHI/EcoRI消化的总细胞DNA(Mettler,I.J.Plant Mol.Biol Reporter,5:346(1987)),转移到尼龙膜上(Amersham)并与32P标 记的随机引发DNA序列杂交,该DNA序列相应于pC8的0.7kb BamHI/HindIII DNA片段,其含有rps7/12质体靶向序列的一部分。 无菌条件下在含有壮观霉素的MS/IBA培养基上使同质芽生根 (McBride等,PNAS,91:7301(1994))并转移到温室。

稳定转化植物的制备及表征

然后在适于筛选转基因细胞的选择培养基中培养转化植物细胞使 其形成愈伤组织。从愈伤组织形成芽(shoots),再通过在生根培养基中 生长从芽形成幼苗。通常各种构建体会与标记相连以便于选择植物细 胞。为方便起见,该标记可以是对杀生物剂(特别是抗生素,如卡那 霉素,G418,博莱霉素,潮霉素,氯霉素,除草剂等)的抗性。所用 的特定标记将允许与缺乏被导入DNA的细胞相比较而筛选出转化细 胞。DNA构建体的组分,包括本发明的转录/表达盒,均可以从宿主 天然(内源性)或外来(外源性)的序列制备。“外来”指该序列在构 建体被导入的野生型宿主中不存在。异源构建体将含有至少一个区域, 该区域不是转录起始区域所来源的基因天然的。

为确认转基因在转基因细胞和植物中存在,可使用本领域公知的 方法进行Southern印迹分析。由于利用适当的限制性酶,多核苷酸区 段能够容易地与含有区段的构建体区分,所以可通过Southern印迹检 测并定量多核苷酸区段到基因组的整合。转基因的表达产物可以各种 方式检测,视该产物的属性而定,包括Western印迹和酶试验。一种 十分有效的定量蛋白表达及检测不同植物组织中复制情况的方法是使 用报道基因,如GUS。一旦获得了转基因植物,就可以使其生长产生 具有期望表型的植物组织或部分。可以收集该植物组织或植物部分和/ 或收获种子。种子可以作为来源用于生长另外的含有具有期望特征的 植物组织或部分的植物。

这样本发明提供含有至少一种本发明多核苷酸,表达盒或载体的 转化植物或植物部分,如穗,种子,果实,谷粒,秸杆(stover),谷壳 (chaff)或渣屑(bagasse),使用这种植物或其部分的方法以及制备这种 植物的方法。转化的植物或其部分会表达加工酶,该酶任选地位于某 一组织或发育谷粒的特定细胞或亚细胞部位。例如,本发明提供含有 在植物细胞内存在的至少一种淀粉加工酶的转化植物部分,其中所述 植物部分获自转化植物,其基因组中增加了编码至少一种淀粉加工酶 的表达盒。该加工酶除非被诸如加热,研磨或其它方法活化否则不会 对靶底物起作用,其中所述方法使得酶能够在酶有活性的条件下接触 底物。

本发明优选方法

本发明的自加工植物和植物部分可在各种利用其中表达和活化的 加工酶(耐中温,高温或超高温)的方法中应用。根据本发明,获自 转基因植物的转基因植物部分被置于能够表达并活化该加工酶的条件 下,其中所述转基因植物的基因组中增加了至少一种淀粉加工酶。活 化后,该加工酶被激活并能够对其通常作用的底物发挥作用从而获得 期望产物。例如,活化后该淀粉加工酶作用淀粉使其降解,水解,异 构化或以其它方式修饰以获得期望的结果。可使用非淀粉加工酶来破 坏植物细胞膜以促进植物淀粉,脂类,氨基酸或其它产品的提取。另 外,非耐超高温酶和耐超高温酶可以与本发明的自加工植物或植物部 分相结合使用。例如,耐中温非淀粉降解酶可以被活化以破坏植物细 胞膜从而利于淀粉提取,然后,活化自加工植物体内的耐超高温淀粉 降解酶以降解淀粉。

在谷物中表达的酶可以将含有该酶的植物或其部分置于能够提高 酶活性的条件下而将其活化。例如,可以使用下述的一项或多项技术: 可将植物部分与水接触,这样为水解酶提供了底物从而将该酶活化。 可以使植物部分与水接触,这样使酶从其在植物部分发育过程中沉积 的区域迁移出从而与底物接触。由于在成熟,谷物干燥和再水化过程 中区域化被破坏,因此酶的迁移是可能的。完整或破裂的谷粒可以与 水接触,这样使酶从其在植物部分发育过程中沉积的位置迁移出从而 与底物接触。还可加入活化性化合物使酶活化。例如,钙依赖性酶可 以通过加入钙使其活化。其它的活化性化合物可由本领域技术人员确 定。可以通过去除失活剂而使酶活化。例如,已知一些肽抑制剂会抑 制淀粉酶,淀粉酶可以与淀粉酶抑制剂共表达然后再通过加入蛋白酶 将其活化。可将pH调整到酶活性最大的状态而活化酶。还可以提高 温度来活化酶。在不超过酶最高温度时升高温度通常会提高酶活性。 从环境温度活性水平升高温度到耐中温酶会丧失活性的温度,该酶的 活性会提高,通常该丧失活性的温度为低于或等于70℃。同样,可以 升高温度来活化耐高温酶和耐超高温酶。耐高温酶可通过将温度加热 至活性或稳定性的最高温度而将其活化。对于耐高温酶该稳定性或活 性最高温度通常为70-85℃。耐超高温酶比耐中温或耐高温酶具有更 高的相对活化,因为其潜在温度变动更大,从25℃直到85℃或95℃ 甚至100℃。可通过任何方法提高温度,例如通过加热如通过烘烤, 煮沸,加热或汽蒸,放电或其组合。另外还可通过研磨来活化表达耐 中温或耐高温酶植物内的酶从而使酶与底物接触。

最适条件,如温度,水化,pH等,均可由本领域技术人员确定, 并可依据所用的具体酶和该酶期望的应用而定。

本发明还提供可能辅助特定作用的外源性酶的应用。例如,本发 明自加工植物或植物部分可以与外源性酶结合使用以促进反应。例如, 转基因α-淀粉酶玉米可以与其它淀粉加工酶如支链淀粉酶,α-葡糖苷 酶,葡萄糖异构酶,甘露聚糖酶,半纤维素酶等结合使用,以水解淀 粉或形成乙醇。实际上,已经发现,与仅仅使用转基因α-淀粉酶玉米 相比,将转基因α-淀粉酶玉米与这种酶共同使用能够出乎意料地提供 优异的淀粉转化程度。

这里提供了构思的适当方法的实例。

a.从植物中提取淀粉

本发明提供促进从植物中提取淀粉的方法。特别是,将至少一种 多核苷酸导入植物从而使该酶与植物内的淀粉颗粒的物理位置十分靠 近,所述多核苷酸编码能够破坏胚乳物理限制性基质(细胞壁,非淀 粉多糖和蛋白基质)的加工酶。优选地,在本发明的该实施方案中转 化植物表达一种或多种蛋白酶,葡聚糖酶,木聚糖酶,硫氧还蛋白/ 硫氧还蛋白还原酶,酯酶等,但不表达具备任何淀粉降解活性的酶, 这样就可以维持淀粉颗粒的完整性。这些酶在植物部分如谷粒内的表 达会提高谷粒的加工特性。所述加工酶可以是耐中温,高温或超高温 的。在一个实例中,来自本发明转化植物的谷粒被加热干燥,很可能 灭活非耐超高温加工酶并改进种子的完整性。谷粒(或破裂的谷粒) 在高或低的水份含量或条件下(参见Primary Cereal Processing, Gordon和Willim,eds,pp.319-337(1994),将其引入本文作为参考) 使用或不使用二氧化硫,在低温或高温(时间是非常重要的)下浸泡。 达到升高的温度后,任选在一定水分含量条件下,通过活化酶如蛋白 酶,木聚糖酶,植酸酶或葡聚糖酶,破坏胚乳基质的完整性,这些酶 能够降解胚乳中的蛋白和非淀粉多糖而使其中的淀粉颗粒保持完整并 更易从所获产物材料中回收。另外,流出物(elluent)中的蛋白和非淀 粉多糖至少被部分降解且高度浓缩,因此可用于改良的动物饲料,食 品或作为微生物发酵的中间成分。流出物被认为是组成改善的玉米浆。

这样,本发明提供制备淀粉颗粒的方法。该方法包括在能够活化 所述至少一种酶的条件下处理谷粒,如破裂的谷粒,形成含有淀粉颗 粒和非淀粉降解产物,如消化的胚乳基质产物的混合物,其中所述谷 粒含有至少一种非淀粉加工酶。非淀粉加工酶可以是耐中温,高温或 超高温的。活化酶后,从混合物中分离出淀粉颗粒。所述谷粒获自转 化植物,其基因组含有(或增加了)编码所述至少一种酶的表达盒。 例如,该加工酶可以是蛋白酶,葡聚糖酶,木聚糖酶,植酸酶,硫氧 还蛋白酶/硫氧还蛋白还原酶或酯酶。优选该加工酶耐超高温。可以在 低或高含水量条件下,在二氧化硫存在或不存在下处理谷粒。根据转 基因植物谷粒中加工酶的活性和表达水平,可以在加工前或过程中将 转基因谷粒与商品谷粒混合。还提供了该方法获得的产品,如淀粉, 非淀粉产品和含有至少一种额外组分的改进型浸泡水(玉米浆)。

b.淀粉加工方法

本发明转化植物或植物部分可以含有本文公开的淀粉加工酶,其 能够将淀粉颗粒降解为糊精,其它修饰的淀粉或己糖(如α-淀粉酶, 支链淀粉酶,α-葡糖苷酶,葡糖淀粉酶,淀粉支链淀粉酶)或将葡萄 糖转化为果糖(如葡萄糖异构酶)。优选地,该淀粉降解酶选自α-淀 粉酶,α-葡糖苷酶,葡糖淀粉酶,支链淀粉酶,新支链淀粉酶,淀粉 支链淀粉酶,葡萄糖异构酶,和其组合,被应用于转化谷粒。另外, 该酶优选地与启动子和信号序列可操作地相连,所述信号序列将酶靶 向淀粉颗粒,造粉体,质外体或内质网。最优选该酶在胚乳表达,特 别是玉米胚乳,并定位在一个或多个细胞区室内,或位于淀粉颗粒本 身中。优选的植物部分是谷粒。优选的植物部分来自玉米,小麦,大 麦,黑麦,燕麦,甘蔗或稻。

根据一种本发明的淀粉降解方法,转化的谷粒在淀粉颗粒中积累 淀粉降解酶,在50℃-60℃常规温度下浸泡谷粒,并以本领域公知方 法湿磨。优选该淀粉降解酶耐超高温。由于酶被亚细胞靶向淀粉颗粒, 或通过在常规温度下将酶与淀粉颗粒在湿磨加工过程中相接触,将酶 与淀粉颗粒相连,该加工酶与淀粉颗粒被共纯化以获得淀粉颗粒/酶混 合物。回收淀粉颗粒/酶混合物后,通过有利于酶活性的条件使酶活化。 例如,可将酶置于各种含水量和/或温度条件下加工以促进淀粉部分 (为制备衍生淀粉或糊精)或完全水解为己糖。通过这种方式获得含 有高浓度葡萄糖或果糖当量的糖浆。该方法能够有效地节省时间,能 量和酶消耗,并提高淀粉转化为相应己糖的效率以及产品如高糖浸泡 水(玉米浆)和更高葡萄糖当量的糖浆的生产效率。

另一实施方案中,处理表达该酶的植物或该植物的产品如果实或 谷粒或从该谷粒制备的面粉,以活化酶,并将植物内表达和包含的多 糖转化为糖(sugars)。优选地,将该酶与信号序列融合,如本文所述, 所述信号序列将酶靶向淀粉颗粒,造粉体,质外体或内质网。然后可 以从植物或植物产品中分离形成的糖。另一实施方案中,根据本领域 公知并在本文公开的方法,将能够转化多糖为糖(sugars)的加工酶置于 诱导型启动子的调控下。该加工酶可以是耐中温,高温或超高温的。 将植物培养到期望阶段,然后诱导启动子使该酶表达并将植物或植物 产品中的多糖转化为糖。优选该酶与能够将其靶向淀粉颗粒,造粉体, 质外体或内质网的信号序列可操作地相连。另一实施方案中,制备了 表达能够将淀粉转化为糖的加工酶的转化植物。将该酶与可将酶导向 植物中淀粉颗粒的信号序列相融合。之后从含有由转化植物表达的该 酶的转化植物中分离淀粉。然后活化分离的淀粉中所含的该酶使其将 淀粉转化为糖。该酶可以是耐中温,高温或超高温的。本文提供了能 够转化淀粉为糖的耐超高温酶的实例。该方法可与任何这样的植物使 用,所述植物能够产生多糖并能够表达能将多糖转化为糖或水解的淀 粉产物,如糊精,麦芽寡糖,葡糖糖和/或其混合物的酶。

本发明提供从植物或植物产物制备糊精和改性淀粉的方法,所述 植物或植物产物已被能够水解多糖某些共价键以形成多糖衍生物的加 工酶转化。在一个实施方案中,表达该酶的植物或其产物,如果实或 谷粒,或由该谷粒制成的面粉,被置于足以活化该酶并将植物中所含 多糖转化为分子量减小的多糖的条件下。优选地,如本文所述,将该 酶与信号序列融合,所述信号序列将酶靶向淀粉颗粒,造粉体,质外 体或内质网。然后可从植物或植物产品中分离或回收产生的糊精或衍 生淀粉。另一实施方案中,根据本领域公知和在本文公开的方法,将 能够转化多糖为糊精或改性淀粉的加工酶置于诱导型启动子的调控 下。将植物培养到期望阶段,然后诱导启动子使该酶表达并将植物或 植物产品中的多糖转化为糊精或改性淀粉。优选该酶为α-淀粉酶,支 链淀粉酶,异或新支链淀粉酶,并优选该酶与能够将其靶向淀粉颗粒, 造粉体,质外体或内质网的信号序列可操作地相连。一个实施方案中, 该酶被靶向质外体或内质网。另一实施方案中,制备了表达能够将淀 粉转化为糊精或改性淀粉的酶的转化植物。该酶与能够将其靶向植物 内淀粉颗粒的信号序列融合。然后从含有转化植物所表达酶的转化植 物中分离淀粉。然后在足以活化酶的条件下,活化淀粉中所含的酶, 使其转化淀粉为糊精或改性淀粉。本文提供了能够转化淀粉为水解淀 粉产物的耐超高温酶实例。该方法可与任何这样的植物使用,所述植 物能够产生多糖并能够表达能将多糖转化为糖的酶。

另一实施方案中,在利于淀粉降解酶活性的条件下,浸泡来自本 发明转化植物的谷粒各种不同时间,所述植物能够积累淀粉降解酶, 该酶可以降解淀粉颗粒中的键形成糊精,改性淀粉或己糖(如α-淀粉 酶,支链淀粉酶,α-葡糖苷酶,葡糖淀粉酶,淀粉支链淀粉酶)。所获 的混合物可能含有高水平的淀粉衍生产物。这种谷粒的应用:1)避免 了研磨谷粒或为首先获得淀粉颗粒而以其它方式加工谷粒的需求,2) 通过将酶直接放在谷粒胚乳组织内而使得淀粉更加容易被酶接近,以 及3)无需微生物产生的淀粉水解酶。这样,通过在水的存在下加热 谷粒——优选玉米谷粒——以使酶作用底物,可避免己糖回收前的整 个湿磨过程。

该方法还可以用于制备乙醇,高果糖糖浆,含己糖(葡萄糖)发 酵培养基或任何其它不需要精制谷粒组分的淀粉应用。

本发明还提供制备糊精,麦芽寡糖和/或糖(sugar)的方法,涉及在 活化所述至少一种酶的条件下,处理含有淀粉颗粒和至少一种淀粉加 工酶的植物部分,从而使酶消化淀粉颗粒以形成含糖水性溶液。该植 物部分获自转化植物,其基因组中增加了编码所述至少一种加工酶的 表达盒。然后收集含有糊精,麦芽寡糖和/或糖的水性溶液。一个实施 方案中,该加工酶为α-淀粉酶,α-葡糖苷酶,支链淀粉酶,葡糖淀粉 酶,淀粉支链淀粉酶,葡萄糖异构酶或其任意组合。优选该酶耐超高 温。另一实施方案中,该方法还进一步包括分离糊精,麦芽寡糖和/ 或糖的步骤。

c.改良的玉米品种

本发明还提供改良玉米品种(以及其它作物品种)的制备方法, 所述品种具有正常水平的淀粉累积量并在其胚乳或淀粉累积器官内积 累足量水平的淀粉分解酶,使得一旦活化其中所含的酶,例如,对于 耐超高温酶,通过煮沸或加热该植物或其部分,该酶被激活,并促进 淀粉到单糖的快速转化。这些单糖(主要为葡萄糖)可以给被处理玉 米带来甜味。所获的玉米植物为改良品种,具有作为谷物生产杂交种 和甜玉米的双重用途。这样,本发明提供生产超甜玉米的方法,包括 在能够活化所述至少一种酶的条件下,处理转化玉米或其部分,所述 玉米或其部分的基因组中增加了表达盒,并在胚乳中表达该表达盒, 所述表达盒含有与编码至少一种淀粉分解酶的第一多核苷酸可操作地 相连的启动子,这样可将玉米中的多糖转化为糖,产生超甜玉米。所 述启动子可以是组成型启动子,种子特异性启动子或胚乳特异性启动 子,其与编码加工酶如α-淀粉酶(如含有SEQ ID NO:13,14或16的 酶)的多核苷酸序列相连。优选地,该酶耐超高温。在一个实施方案 中,该表达盒进一步含有编码信号序列的第二多核苷酸,该信号序列 与第一多核苷酸所编码的酶可操作地相连。本发明该实施方案中的示 范性信号序列能够将酶导向质外体,内质网,淀粉颗粒或造粉体。培 养该玉米植物,使得形成带有谷粒的玉米穗,然后诱导启动子使酶表 达并将植物所含的多糖转化为糖(sugar)。

d.自发酵植物

在本发明的另一实施方案中,植物,如玉米,稻,小麦或甘蔗被 工程改造成在其细胞壁中积累大量加工酶,如木聚糖酶,纤维素酶, 半纤维素酶,葡聚糖酶,果胶酶等(非淀粉多糖降解酶)。收获谷粒组 分(或者如果是甘蔗则是收获糖)后,将秸杆,谷壳或渣屑用作酶的 来源,该酶被引导表达和积累在细胞壁内,并用作生物质的来源。秸 杆(或其它剩余组织)被用作回收可发酵糖的工艺的原料。这个获得 可发酵糖的工艺由活化非淀粉多糖降解酶组成。例如,活化可以包括 在水的存在下,以足够将非淀粉多糖水解为最终糖的时间,加热植物 组织。这样,该自加工秸杆产生转化多糖为单糖所需要的酶,而基本 上无需额外的成本,因为它们是原料的一种组分。另外,温度依赖性 酶对植物生长和发育没有有害影响,而通过与该蛋白融合的纤维素/ 木糖结合域而实现的细胞壁导向,甚至于向多糖微纤维内导向,可改 善底物与酶的可接近性。

这样,本发明还提供一种使用转化的植物部分的方法,该植物部 分细胞的细胞壁内包含至少一种非淀粉多糖加工酶。该方法包括在活 化所述至少一种加工酶的条件下,处理含有至少一种非淀粉多糖加工 酶的转化植物部分,从而消化淀粉颗粒以形成含有糖的水性溶液,其 中所述植物部分获自转化植物,其基因组中增加了编码所述至少一种 非淀粉多糖加工酶的表达盒;并收集含糖的水性溶液。本发明还包括 转化的植物或植物部分,在该植物或其部分的细胞中或细胞的细胞壁 中含有至少一种非淀粉多糖加工酶。该植物部分获自转化植物,其基 因组中增加了编码所述至少一种非淀粉加工酶的表达盒,所述加工酶 如木聚糖酶,纤维素酶,葡聚糖酶,果胶酶或其任意组合。

e.高蛋白和糖含量的水相

在另一实施方案中,蛋白酶和酯酶被工程改造在种子如大豆种子 内积累。通过例如加热等方法活化蛋白酶或酯酶后,种子内的这些酶 会在加工过程中水解大豆中的脂类和储备蛋白。这样就获得了含有氨 基酸的可溶性产物和脂肪酸,所述产物可用作饲料,食品或发酵培养 基。多糖通常在加工后谷粒的不溶性组分内发现。但是,通过结合种 子内多糖降解酶的表达和积累,蛋白和多糖就可以被水解,然后可在 水相内发现。例如,来自玉米的玉米醇溶蛋白和来自大豆的储备蛋白 和非淀粉多糖可以这种方式溶解。这种水相和疏水相的组分可通过用 有机溶剂或超临界二氧化碳抽提而容易地分离。这样就提供了制备谷 粒水相抽提物的方法,所述抽提物含有更高水平蛋白,氨基酸,糖类 (sugars)或糖质(saccharides)。

f.自加工发酵

本发明提供了一种制备乙醇,发酵饮料或其它发酵衍生产物的方 法。该方法涉及获得植物或植物的产物或部分,或植物衍生物如谷物 面粉,其中表达了能够将多糖转化为糖(sugar)的加工酶。该植物或其 产物被处理以使得如上所述通过多糖转化产生糖。然后根据本领域公 知技术发酵该糖和植物的其它组分以形成乙醇或发酵饮料,或其它发 酵衍生产物。例如参见美国专利US 4,929,452。简言之,在能够促进 糖转化为乙醇的条件下与酵母一起孵育由多糖转化形成的糖。适当的 酵母包括耐高醇和耐高糖的酵母菌株,例如酵母酿酒酵母(S. cerevisiae)ATCC No.20867。该菌株于1987年9月17日保藏在美国 典型培养物保藏中心(American Type Culture Colletion,Rockville, MD),保藏号为ATCC No.20867。然后发酵产物或发酵饮料可经过 蒸馏分离出乙醇或蒸馏饮料,或者以其它方式回收发酵产物。该方法 所用的植物可以是任何含有多糖并能够表达本发明酶的植物。这里公 开了许多这样的植物。优选该植物是经济作物。更优选该植物是通常 用于制备乙醇或发酵饮料,或发酵产物的那些植物,如小麦,大麦, 玉米,黑麦,马铃薯,葡萄或稻。最优选该植物为玉米。

该方法包括在活化所述至少一种酶的条件下处理含有至少一种多 糖加工酶的植物部分,从而消化植物部分中的多糖以形成可发酵糖。 该多糖加工酶可以是耐中温,高温或超高温的。优选该酶耐超高温。 该植物部分获自转化植物,其基因组中增加了编码所述至少一种多糖 加工酶的表达盒。本发明该实施方案的植物部分包括但不限于,谷粒, 果实,种子,茎,木质,蔬菜或根。优选植物包括但不限于,燕麦, 大麦,小麦,浆果,葡萄,黑麦,玉米,稻,马铃薯,甜菜,甘蔗, 菠萝,草和树。植物部分可与商品谷粒或其它市售底物组合使用;该 加工底物的来源可以是自加工植物以外的来源。然后在促进可发酵糖 转化为乙醇的条件下,例如与酵母和/或其它微生物共同孵育可发酵 糖。在一个优选实施方案中,该植物部分来自用α-淀粉酶转化的玉米, 该淀粉酶已被发现可以降低发酵时间和成本。

已经发现,当使用根据本发明方法制备的表达热稳定性α-淀粉酶 的转基因玉米进行发酵时,残余淀粉的量降低。这说明在发酵过程中 更多淀粉被溶解。残余淀粉量的这种减少导致蒸馏器的谷粒具有更高 重量的蛋白含量和更高价值。另外,本发明转基因玉米的发酵可以在 较低pH和在较高温度,例如,高于85℃,优选高于90℃,更优选 95℃或更高,进行液化加工,使用较低pH导致降低用于调整pH的 化学物品的成本,使用较高温度导致缩短液化时间,且使淀粉更彻底 溶解化,减少液化时间,所有这些都使得发酵反应的乙醇产量更高, 效率更高。

另外,已发现用甚至小比例的根据本发明制备的转基因植物与常 规植物部分接触,可以减少发酵时间,降低相关成本。因此,相对于 使用不含多糖加工酶的植物部分,本发明涉及减少植物发酵时间,包 括使用来自含有多糖加工酶的植物的转基因植物部分,所述酶可以将 多糖转化为糖。

g.粗淀粉加工酶及其编码多核苷酸

编码耐中温加工酶的多核苷酸被导入植物或植物部分。在一个优 选实施方案中,本发明多核苷酸是玉米优化的多核苷酸,例如SEQ ID NO:48,50和59所示的,其编码葡糖淀粉酶,例如SEQ ID NO:47 和49所示的。另一优选实施方案中,本发明多核苷酸为玉米优化多核 苷酸,例如SEQ ID NO:52所示,其编码α-淀粉酶,例如SEQ ID NO: 51所示。另外,本发明进一步包括加工酶融合产物。一个优选实施方 案中,本发明多核苷酸是玉米优化多核苷酸,例如SEQ ID NO:46所 示,其编码α-淀粉酶和葡糖淀粉酶融合物,例如SEQ ID NO:45所示。 本发明进一步提供加工酶的组合。例如,提供了淀粉加工酶和非淀粉 加工酶的组合。加工酶的这种组合可通过利用编码各种酶的多基因构 建体而获得。或者,被该酶稳定转化的各转基因植物可用公知方法杂 交以获得含有两种酶的植物。另一方法包括和该转基因植物一起使用 外源酶。

淀粉加工酶和非淀粉加工酶的来源可分离或衍生自任何来源,其 相应多核苷酸可由本领域技术人员确定。优选,α-淀粉酶来自曲霉属 (如Aspergillus shirousami和黑色曲霉(Aspergillus niger)),根霉 属(如米根霉(Rhizopus oryzae))和植物如玉米,大麦和稻。优选 葡糖淀粉酶来自曲霉属(如Aspergillus shirousami和Aspergillus niger),根霉属(如米根霉(Rhizopus oryzae))和热厌氧杆菌属 (Thermoanaerobacter)(如热解糖热厌氧杆菌(Thermoanaerobacter thermosaccharolyticum))。

本发明另一实施方案中,多核苷酸编码耐中温淀粉加工酶,其与 玉米优化多核苷酸可操作地相连,例如SEQ ID NO:54所示,所述玉 米优化多核苷酸编码粗淀粉结合域,例如SEQ ID NO:53所示。

另一实施方案中,组织特异性启动子包括胚乳特异性启动子如玉 米γ-玉米醇溶蛋白启动子(例如SEQ ID NO:12所示)或玉米ADP-gpp 启动子(例如SEQ ID NO:11所示,其包括5’非翻译序列和内含子序 列)。这样,本发明包括含有启动子的分离多核苷酸,所述启动子含有 SEQ ID NO:11或12,在低严谨度杂交条件下能够与其互补序列杂交 的多核苷酸,或其具有启动子活性的片段,例如所述活性为具有SEQ ID NO:11或12序列的启动子的活性的至少10%,优选至少50%。

一个实施方案中,淀粉水解基因的产物,如α-淀粉酶,葡糖淀粉 酶或α-淀粉酶/葡糖淀粉酶融合物可被靶向特定细胞器或部位,如内质 网或质外体,而不是细胞质。示例是玉米γ-玉米醇溶蛋白N末端信号 序列(SEQ ID NO:17)的应用,该序列赋予蛋白特异性导向质外体, 以及γ-玉米醇溶蛋白N末端信号序列(SEQ ID NO:17)的应用,所 述信号序列与加工酶可操作地相连,该酶与用于滞留于内质网内的序 列SEKDEL可操作地相连。将蛋白或酶导向特定区域可以使酶以某种 方式定位,这种方式使得酶不会与底物相接触。通过这种方式,直到 该酶接触到底物才会发生酶的酶作用。该酶可以通过研磨(物理破坏 细胞完整性)和水化过程与其底物接触。例如,耐中温淀粉水解酶可 以被导向质外体或内质网,从而不会与造粉体中的淀粉颗粒接触。研 磨谷粒会破坏谷粒的完整性,然后淀粉水解酶会与淀粉颗粒接触。以 这种方式,酶和其底物共定位的潜在副作用可以被避免。

h.无需加入甜味剂的食物产品

还提供了不加入甜味剂而生产增甜谷粉制食品(farinaceous food product)的方法。谷粉制食品实例包括但不限于,早餐食品,即食食 品,烘烤食品,意大利面食和谷物产品如早餐谷类食品。该方法包括 在活化所述淀粉加工酶的条件下,处理含有至少一种淀粉加工酶的植 物部分以使植物部分中的淀粉颗粒加工为糖以形成甜味产品,所述甜 味产品是相对于例如由来自不含该耐超高温酶的植物部分的淀粉颗粒 所制成的产品而言。优选该淀粉加工酶耐超高温并通过加热,如烘烤, 煮沸,加热,汽蒸,放电或其组合而被活化。该植物获自转化植物, 例如转化大豆,黑麦,燕麦,大麦,小麦,玉米,稻或甘蔗,所述转 化植物的基因组中增加了编码所述至少一种耐超高温淀粉加工酶的表 达盒,所述加工酶如α-淀粉酶,α-葡糖苷酶,葡糖淀粉酶,支链淀粉 酶,葡萄糖异构酶或其任意组合。然后将甜味产品加工成谷粉制食品。 本发明还提供由该方法制备的谷粉制食品产品,如谷类食品,早餐食 品,即食食品,烘烤食品。该谷粉制食品产品可以由甜味产品和水制 成,并可含有麦芽,调味剂,维生素,矿物质,着色剂或其任意组合。

该酶可在将植物材料导入谷类产品之前或在加工谷类产品的过程 中被活化,以将植物材料中的多糖转化为糖(sugar)。相应地,植物材 料内所含的多糖可通过在加入到谷粉制产品之前活化该材料而转化为 糖,例如对于耐超高温酶,通过加热活化。然后将含有由多糖转化而 成的糖的植物材料加入产品中以生产甜味产品。或者,可在加工谷粉 制产品过程中由酶将多糖转化为糖。用于制备谷类产品的方法实例是 本领域公知的,包括加热,烘烤,煮沸等,如美国专利US 6,183,788; 6,159,530;6,149,965;4,988,521和5,368,870所述的。

简言之,可通过与水一起混合各种干配料而制备生面团,并煮制 使淀粉组分凝胶化并形成煮熟味(cooked flavor)。然后可机械加工该煮 制过的材料以形成煮制的面团如谷类面团。所述干配料可以包括各种 添加剂如糖,淀粉,盐,维生素,矿物质,色素,调味剂,盐等。除 水外,还可加入各种液体配料如玉米(玉蜀黍)或麦芽糖浆。谷粉材 料可包括谷类谷粒,切割谷粒(cut grains),粗磨谷粉(grits)或来自小 麦,稻,玉米,燕麦,大麦,黑麦或其它谷粒的面粉及其混合物,它 们来自本发明转基因植物。然后可通过诸如挤压或冲压的方法将面团 加工成期望的形状,再使用诸如James炊具,烤箱或放电设备等进一 步烹饪。

还提供不加入甜味剂而使含淀粉产品增甜的方法。该方法包括在 能够活化所述至少一种酶的条件下,处理含有至少一种淀粉加工酶的 淀粉,从而消化淀粉形成糖从而形成处理过的(变甜)淀粉,例如, 该甜味是相对于通过处理不含所述耐超高温酶的淀粉所制成的产品而 言。本发明淀粉获自转化植物,所述转化植物的基因组中增加了编码 所述至少一种加工酶的表达盒,优选的酶包括α-淀粉酶,α-葡糖苷酶, 葡糖淀粉酶,支链淀粉酶,葡萄糖异构酶或其组合。优选该酶耐超高 温并可用加热活化。优选的转化植物包括玉米,大豆,黑麦,燕麦, 小麦,大麦,稻和甘蔗。然后将该处理过的淀粉加入产品中以形成增 甜的含淀粉产品,如谷粉制食品产品。还提供由该方法制备的增甜的 含淀粉产品。

本发明还提供使含多糖果实或蔬菜增甜的方法,包括:在能够活 化所述至少一种酶的条件下,处理含有至少一种多糖加工酶的果实或 蔬菜,从而加工果实或蔬菜中的多糖以形成糖,产生增甜的果实或蔬 菜,例如,该甜味是相对于来自不含多糖加工酶的植物的蔬菜或水果 而言。本发明的水果或蔬菜获自转化植物,所述转化植物的基因组中 增加了编码所述至少一种多糖加工酶的表达盒。

优选的水果和蔬菜包括马铃薯,番茄,香蕉,南瓜,豌豆和菜豆。 优选的酶包括α-淀粉酶,α-葡糖苷酶,葡糖淀粉酶,支链淀粉酶,葡 萄糖异构酶或其组合。优选该酶耐超高温。

i.增甜含多糖植物或植物部分

该方法涉及获得如上所述表达多糖加工酶的植物,该酶可将多糖 转化为糖(sugar)。相应地,该酶在植物和植物产物,如果实或蔬菜内 表达。在一个实施方案中,该酶置于诱导型启动子调控之下,使得该 酶的表达可以被外界刺激诱导。这样的诱导型启动子和构建体是本领 域公知的并在本文描述。在植物或其产物内表达该酶可使植物或其产 物内所含的多糖转化为糖并使该植物或其产物增甜。在另一实施方案 中,该多糖加工酶组成型表达。这样,该植物或其产物可在足以活化 该酶的条件下被活化,通过活化酶而将多糖转化为糖,使植物或植物 产物增甜。这样,该果实或蔬菜中多糖到糖的自加工会产生增甜的果 实或蔬菜,例如,该甜味是相对于来自不含多糖加工酶的植物的蔬菜 或水果而言。本发明的水果或蔬菜获自转化植物,所述转化植物的基 因组中增加了编码所述至少一种多糖加工酶的表达盒。优选的水果和 蔬菜包括马铃薯,番茄,香蕉,南瓜,豌豆和菜豆。优选的酶包括α- 淀粉酶,α-葡糖苷酶,葡糖淀粉酶,支链淀粉酶,葡萄糖异构酶或其 组合。优选该多糖加工酶耐超高温。

j.从含有可破坏胚乳基质的酶的转化谷粒中分离淀粉

本发明提供从转化谷粒中分离淀粉的方法,其中表达能够破坏胚 乳基质的酶。该方法涉及获得表达酶的植物,所述酶会通过修饰例如 细胞壁,非淀粉多糖和/或蛋白破坏胚乳基质。这种酶的实例包括但不 限于:蛋白酶,葡聚糖酶,硫氧还蛋白,硫氧还蛋白还原酶和酯酶。 这样的酶不包括任何显示淀粉降解活性的酶,这样使得淀粉颗粒的完 整性得以维持。优选该酶与能够将酶靶向淀粉颗粒的信号序列融合。 在一个实施方案中,谷粒被加热干燥以活化所述加工酶并使谷粒内所 含的内源性酶失活。热处理导致所述酶的活化,酶会作用破坏胚乳基 质,然后就可将淀粉颗粒容易地与胚乳基质分离。在另一实施方案中, 将谷粒在高或低的水分含量下,在低温或高温下浸泡,可以使用或不 使用二氧化硫。然后加热处理该谷粒以破坏胚乳基质并允许容易地分 离淀粉颗粒。另一实施方案中,创造适当的温度和含水量条件以使蛋 白酶进入淀粉颗粒内并降解颗粒内所含的蛋白。这样的处理会形成高 产量的淀粉颗粒,而污染蛋白很少。

k.具有高糖当量的糖浆及该糖浆制备乙醇或发酵饮料的应用

该方法涉及获得如上所述表达多糖加工酶的植物,所述酶可将多 糖转化为糖。在能够使表达的酶将植物或其产物内所含多糖转化为糊 精,麦芽寡糖和/或糖的条件下,在水流(aqueous stream)中浸泡该植 物或其产物。然后分离所述含有由多糖转化所形成的糊精,麦芽寡糖 和/或糖的水流,以制备具有高糖当量的糖浆。该方法可以包括或不包 括额外的湿磨植物或其产物以获得淀粉颗粒的步骤。可用于本方法的 酶的实例包括但不限于,α-淀粉酶,葡糖淀粉酶,支链淀粉酶和α-葡 糖苷酶。优选该酶耐超高温。根据该方法所形成的糖可包括但不限于, 己糖,葡萄糖和果糖。可用于本方法的植物实例包括但不限于玉米, 小麦或大麦。可使用的植物产物的实例包括但不限于,果实,谷粒和 蔬菜。另一实施方案中,该多糖加工酶受诱导型启动子的调控。相应 地,在浸泡过程前或之中,该启动子被诱导使酶表达,然后酶会将多 糖转化为糖。诱导型启动子及含有该启动子的构建体的实例是本领域 公知的,并在这里公开。这样,如果该多糖加工酶耐超高温,浸泡就 可在高温下进行以活化该耐超高温酶并且使该植物或其产物内的内源 性酶失活。另一实施方案中,能够将多糖转化为糖的耐超高温酶是组 成型表达的。该酶可以不或可以通过信号序列靶向植物组分。该植物 或其产物被浸泡在高温条件下以使植物内所含多糖转化为糖。

还提供了从具有高糖当量的糖浆制备乙醇或发酵饮料的方法。该 方法涉及在允许糖浆内所含糖被转化为乙醇或发酵饮料的条件下,将 糖浆与酵母一起培养。这种发酵饮料的实例包括但不限于,啤酒和葡 萄酒。发酵条件是本领域公知的,并在美国专利US 4,929,452和本文 中有描述。优选酵母为耐高醇和耐高糖菌株,如酿酒酵母(S.cerevisiae) ATCC No.20867。发酵产物或发酵饮料可被蒸馏以分离乙醇或蒸馏饮 料。

l.耐超高温酶在植物细胞壁内的积累

本发明提供在植物细胞壁内积累耐超高温酶的方法。该方法涉及 在植物内表达耐超高温酶,所述酶与细胞壁导向信号相融合,这样被 导向的酶就会在细胞壁积累。优选该酶能够将多糖转化为单糖。导向 序列的实例包括但不限于,纤维素或木糖结合域。耐超高温酶的实例 包括SEQ ID NO:1,3,5,10,13,14,15或16所示的酶。可在从进料中 回收糖的工艺中加入含有细胞壁的植物材料作为目的酶的来源,或所 述植物材料可作为将来自其它来源的多糖转化为单糖的酶的来源而添 加。另外,该细胞壁还可作为纯化酶的来源。纯化酶的方法是本领域 公知的,包括但不限于,凝胶过滤,离子交换层析,色谱聚焦,等电 点聚焦,亲合层析,FPLC,HPLC,盐沉淀,透析等。相应地,本发 明还提供从植物细胞壁分离的纯化酶。

m.制备和分离加工酶的方法

根据本发明,本发明重组产生的加工酶可通过如下方式制备:转 化含有本发明加工酶的植物组织或植物细胞,所述酶可在植物内被活 化,选择被转化的植物组织或细胞,将转化植物组织或细胞培养为转 化植物,并从转化植物或其部分中分离加工酶。优选该重组产生的酶 是α-淀粉酶,葡糖淀粉酶,葡萄糖异构酶,α-葡糖苷酶和支链淀粉酶。 最优选该酶由选自下述任何序列的多核苷酸编码:SEQ ID NO:2,4,6, 9,19,21,25,37,39,41,43,46,48,50,52或59。

下述实施例进一步描述本发明,但不是以任何方式限制本发明的 范围。

                        实施例

实施例1

玉米优化的耐超高温淀粉加工酶/异构化酶的基因的构建 根据期望的活性谱来选择参与淀粉降解或葡萄糖异构化的各种 酶,即,α-淀粉酶,支链淀粉酶,α-葡糖苷酶和葡萄糖异构酶。这些 活性谱包括例如环境温度下最小活性,高温活性/稳定性,和低pH下 的活性。然后使用如US专利5,625,136所述的玉米偏爱密码子设计相 应基因,并由Integrated DNA Technologies,Inc.(Coralville,IA)合 成。

根据耐超高温活性选择了具有SEQ ID NO:1氨基酸序列的 797GL3α-淀粉酶。推导了该酶的核酸序列并进行玉米优化,如SEQ ID NO:2所示。类似地,选择具有SEQ ID NO:3氨基酸序列的6gp3支 链淀粉酶。推导了该酶的核酸序列并进行玉米优化,如SEQ ID NO:4 所示。

根据文献J.Bact.177:482-485(1995);J.Bact.180:1287-1295 (1998)获得了硫磺矿硫化叶菌(Sulfolobus solfataricus)的malAα-葡 糖苷酶氨基酸序列。根据公开的该蛋白氨基酸序列(SEQ ID NO:5), 设计了编码malAα-葡糖苷酶的玉米优化合成基因(SEQ ID NO:6)。

选择了几种葡萄糖异构酶。根据登录号为NC_000853的已公开 DNA序列预测海栖热袍菌(Thermotoga maritima))的葡萄糖异构酶 氨基酸序列(SEQ ID NO:18),并设计其玉米优化合成基因(SEQ ID NO:19)。类似地,根据Appl.Envir.Microbiol.61(5):1867-1875 (1995)公开的,登录号为L38994的DNA序列预测那不勒斯栖热袍 菌(T.neapolitana)的葡萄糖异构酶氨基酸序列(SEQ ID NO:20), 并设计编码那不勒斯栖热袍菌葡萄糖异构酶的玉米优化合成基因 (SEQ ID NO:21)。

实施例2

797GL3α-淀粉酶和淀粉包封区域(starch encapsulating region)的 融合物在大肠杆菌中的表达

编码耐超高温797GL3α-淀粉酶和来自玉米颗粒结合淀粉合成酶 (waxy)的淀粉包封区域(SER)的融合物的构建体被导入大肠杆菌 中并表达。编码氨基酸序列(SEQ ID NO:8)的玉米颗粒结合淀粉合 成酶cDNA(SEQ ID NO:7)(Klosgen RB等,1986)被克隆并作为 淀粉结合域或淀粉包封区域(SER)的来源。使用根据GenBank登 录号X03935设计的引物SV 57(5’AGCGAATTCATGGCGGCT CTGGCCACGT3’)(SEQ ID NO:22)和SV 58(5’AGCTAAGCTTC AGGGCGCGGCCACGTTCT3’)(SEQ ID NO:23),从玉米种子制备的 RNA进行RT-PCR扩增全长cDNA。以EcoRI/HindIII片段将全长 cDNA克隆到pBluescript中,质粒命名为pNOV4022。

从pNOV4022中扩增waxy cDNA的C末端部分(由919-1818bp 编码),包括淀粉结合域,并按阅读框架融合到全长玉米优化797GL3 基因(SEQ ID NO:2)的3’末端。该融合基因产物,797GL3/Waxy, 具有SEQ ID NO:9的核酸序列并且编码SEQ ID NO:10的氨基酸序 列,将其以NcoI/XbaI片段克隆入用NcoI/NheI酶切过的pET28b (NOVAGEN,Madison,WI)。此外,将797GL3基因以NcoI/XbaI片 段单独克隆入pET28b载体。

pET28/797GL3和pET28/797GL3/Waxy载体被转化到BL21/DE3 大肠杆菌细胞(NOVAGEN)中并根据厂商说明书培养和诱导。PAGE/ 考马斯染色分析显示了两种提取物中的诱导蛋白,分别相应于预测大 小的融合和非融合淀粉酶。

按下述分析总细胞提取物中的耐超高温淀粉酶活性:将5mg淀粉 悬浮在20μl水中,然后用25μl乙醇稀释。将待测淀粉酶活性的样品 或标准淀粉酶阳性对照加入混合物中,并加水到终反应体积500μl。 该反应在80℃进行15-45分钟。然后冷却反应液到室温,加入500μl 邻联二茴香胺和葡萄糖氧化酶/过氧化物酶混合物(Sigma)。在37℃ 孵育混合物30分钟。加入500μl 12N硫酸以终止反应。测量540nm 下的吸光值以定量由淀粉酶/样品释放的葡萄糖数量。融合及非融合淀 粉酶提取物的实验结果显示:耐超高温淀粉酶活性水平类似,而对照 提取物则呈阴性。这说明797GL3淀粉酶与waxy蛋白的C末端部分 融合时(高温下)仍然具有活性。

实施例3

分离用于在玉米中胚乳特异性表达的启动子片段

使用根据GenBank登录号M81603设计的引物,从玉米基因组 DNA扩增1515碱基对片段(SEQ ID NO:11)的玉米(Zea mays) ADP-gpp(ADP-葡萄糖焦磷酸化酶)大亚基的启动子和5’非编码区I(包 括第一个内含子)。ADP-gpp启动子已被证实具有胚乳特异性(Shaw 和Hannah,1992)。

从质粒pGZ27.3(获自Dr.Brian Larkins)扩增673bp片段的玉米 (Zea mays)γ-玉米醇溶蛋白基因启动子。该γ-玉米醇溶蛋白基因启 动子已被证实具有胚乳特异性(Torrent等,1997)。

实施例4

797GL3耐超高温α-淀粉酶转化载体的构建

按下述构建具有各种导向信号的表达盒以在玉米胚乳内表达 797GL3耐超高温α-淀粉酶:

pNOV6200(SEQ ID NO:13)含有玉米γ-玉米醇溶蛋白N末端信 号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17)与如实 施例1所述合成的797GL3淀粉酶的融合物,所述信号序列用于靶向 内质网并分泌到质外体内(Torrent等,1997)。该融合产物被克隆到 玉米ADP-gpp启动子后,用于在胚乳内特异性表达。

pNOV6201(SEQ ID NO:14)含有γ-玉米醇溶蛋白N末端信号序 列与带有C末端额外序列SEKDEL的合成797GL3淀粉酶的融合物, 所述C末端额外序列用于靶向并滞留在内质网(ER)内(Munro和 Pelham,1987)。该融合产物被克隆到玉米ADP-gpp启动子后,用于 在胚乳内特异性表达。

pNOV7013含有γ-玉米醇溶蛋白N末端信号序列与带有C末端额 外序列SEKDEL的合成797GL3淀粉酶的融合物,SEKDEL序列用 于靶向并滞留到内质网(ER)内。除pNOV 7103中玉米γ-玉米醇溶 蛋白启动子(SEQ ID NO:12)被用于取代玉米ADP-gpp启动子以在 胚乳内表达融合产物之外,pNOV7013与pNOV6021相同。

pNOV4029(SEQ ID NO:15)含有waxy造粉体导向肽(Klosgen 等,1986)与合成的797GL3淀粉酶的融合物,用于靶向造粉体。该 融合产物被克隆到玉米ADP-gpp启动子后,用于在胚乳内特异性表 达。

pNOV4031(SEQ ID NO:16)含有waxy造粉体导向肽与合成的 797GL3/waxy融合蛋白的融合物,用于靶向淀粉颗粒。该融合产物被 克隆到玉米ADP-gpp启动子后,用于在胚乳内特异性表达。

通过将这些融合物克隆到玉米γ-玉米醇溶蛋白启动子之后制备其 它的构建体以使得酶更高水平表达。所有表达盒都转移到二元载体内 用于通过农杆菌(Agrobacterium)感染转化玉米。含有磷酸甘露糖异构 酶(PMI)基因的二元载体可以允许用甘露糖筛选转基因细胞。转化 的玉米植物进行自体受粉或者异型杂交,收集种子用于分析。

以与用于上述α-淀粉酶完全相同的方式,通过上述导向信号序列 与6gp3支链淀粉酶或340g12α-葡糖苷酶的融合,制备其它构建体。 这些融合产物被克隆到玉米ADP-gpp启动子和/或γ-玉米醇溶蛋白启 动子之后,并如上所述转化到玉米中。转化的玉米植物进行自体受粉 或者异型杂交,收集种子用于分析。

可通过杂交表达单个酶的植物,或通过将几种表达盒克隆到相同 的二元载体内进行共转化而获得酶的组合。

实施例5

6GP3耐高温支链淀粉酶的植物转化载体的构建

按下述构建表达盒以在玉米胚乳的内质网中表达6GP3耐高温支 链淀粉酶。

pNOV7005(SEQ ID NO:24和25)含有玉米γ-玉米醇溶蛋白N末 端信号序列与带有C末端额外序列SEKDEL的合成6GP3支链淀粉 酶的融合物,靶向并滞留到ER内。使用引物进行PCR将氨基酸肽 SEKDEL与该酶的C末端融合,引物的设计使得合成基因可以扩增并 同时在该蛋白的C末端加入6个氨基酸。该融合产物被克隆到玉米γ- 玉米醇溶蛋白启动子之后,用于在胚乳内特异性表达。

实施例6

malA耐超高温α-葡糖苷酶的植物转化载体的构建

按下述构建带有各种导向信号的表达盒以在玉米胚乳内表达硫磺 矿硫化叶菌malA耐超高温α-葡糖苷酶。

pNOV4831(SEQ ID NO:26)含有玉米γ-玉米醇溶蛋白N末端信 号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17)与带有 C末端额外序列SEKDEL的合成malAα-葡糖苷酶的融合物,用于靶 向并滞留到内质网内(Munro和Pelham,1987)。该融合产物被克隆 到玉米γ-玉米醇溶蛋白启动子之后,用于在胚乳内特异性表达。

pNOV4839(SEQ ID NO:27)中含有玉米γ-玉米醇溶蛋白N末端 信号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17)与合 成的malAα-葡糖苷酶的融合物,使得靶向内质网并分泌到质外体内 (Torrent等,1997)。该融合产物被克隆到玉米γ-玉米醇溶蛋白启动 子之后,用于在胚乳内特异性表达。

pNOV4837中含有玉米γ-玉米醇溶蛋白N末端信号序列 (MRVLLVALALLALAASATS)(SEQ ID NO:17)与带有C末端额 外序列SEKDEL的合成malAα-葡糖苷酶的融合物,使得靶向并滞留 到ER内。该融合产物被克隆到玉米ADP-gpp启动子之后,用于在胚 乳内特异性表达。该克隆的氨基酸序列与pNOV4831(SEQ ID NO:26) 的相同。

实施例7

耐超高温的海栖热袍菌和那不勒斯栖热袍菌葡萄糖异构酶的植物 转化载体的构建

按下述构建带有各种导向信号的表达盒以在玉米胚乳内表达海栖 热袍菌和那不勒斯栖热袍菌耐超高温葡萄糖异构酶。

pNOV4832(SEQ ID NO:28)中含有玉米γ-玉米醇溶蛋白N末端 信号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17),此信 号序列与带有C末端额外序列SEKDEL的合成海栖热袍菌葡萄糖异 构酶融合,使得靶向并滞留到ER内。该融合产物被克隆到玉米γ-玉 米醇溶蛋白启动子之后,用于在胚乳内特异性表达。

pNOV4833(SEQ ID NO:29)中将含有玉米γ-玉米醇溶蛋白N末 端信号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17),此 信号序列与带有C末端额外序列SEKDEL的合成那不勒斯栖热袍菌 葡萄糖异构酶融合,使得靶向并滞留到ER内。该融合产物被克隆到 玉米γ-玉米醇溶蛋白启动子之后,用于在胚乳内特异性表达。

pNOV4840(SEQ ID NO:30)中含有玉米γ-玉米醇溶蛋白N末端 信号序列(MRVLLVALALLALAASATS)(SEQ ID NO:17),此信 号序列与合成的那不勒斯栖热袍菌葡萄糖异构酶融合,使得靶向ER 并分泌到质外体内(Torrent等,1997)。该融合产物被克隆到玉米γ- 玉米醇溶蛋白启动子之后,用于在胚乳内特异性表达。

pNOV4838含有γ-玉米醇溶蛋白N末端信号序列 (MRVLLVALALLALAASATS)(SEQ ID NO:17),此信号序列与 带有C末端额外序列SEKDEL的合成那不勒斯栖热袍菌葡萄糖异构 酶融合,使得靶向并滞留到ER内。该融合产物被克隆到玉米ADP-gpp 启动子之后,用于在胚乳内特异性表达。该克隆的氨基酸序列与 pNOV4833(SEQ ID NO:29)的相同。

实施例8

用于表达耐超高温葡聚糖酶EglA的植物转化载体的构建

pNOV4800(SEQ ID NO:58)含有大麦α-淀粉酶AMY32b信号 序列(MGKNGNLCCFSLLLLLLAGLASGHQ)(SEQ ID NO:31) 与EglA成熟蛋白序列的融合物,用于定位到质外体。该融合产物被 克隆到玉米γ-玉米醇溶蛋白启动子之后,用于在胚乳内特异性表达。

实施例9

用于表达多种耐超高温酶的植物转化载体的构建

pNOV4841含有双基因构建体,797GL3α-淀粉酶融合物和6GP3 支链淀粉酶融合物。797GL3融合物(SEQ ID NO:33)和6GP3融合 物(SEQ ID NO:34)都具备玉米γ-玉米醇溶蛋白N末端信号序列和 SEKDEL序列用于靶向并滞留在ER内。每个融合物分别克隆到分开 的γ-玉米醇溶蛋白启动子之后,用于在胚乳内特异性表达。

pNOV4842含有双基因构建体,797GL3α-淀粉酶融合物和malA α-葡糖苷酶融合物。797GL3融合多肽(SEQ ID NO:35)和malAα- 葡糖苷酶融合多肽(SEQ ID NO:36)都具备玉米γ-玉米醇溶蛋白N 末端信号序列和SEKDEL序列用于靶向并滞留在ER内。每个融合多 肽分别克隆到分开的γ-玉米醇溶蛋白启动子之后,用于在胚乳内特异 性表达。

pNOV4843含有双基因构建体,797GL3α-淀粉酶融合物和malA α-葡糖苷酶融合物。797GL3融合多肽和malAα-葡糖苷酶融合多肽都 具备玉米γ-玉米醇溶蛋白N末端信号序列和SEKDEL序列用于靶向 并滞留在ER内。797GL3融合多肽被克隆到γ-玉米醇溶蛋白启动子 之后,而malA融合多肽被克隆到玉米ADP-gpp启动子之后,用于在 胚乳内特异性表达。797GL3融合物和malA融合物的氨基酸序列与 pNOV4842的(分别为SEQ ID NO:35和36)相同。

pNOV4844含有三基因构建体,797GL3α-淀粉酶融合物,6GP3 支链淀粉酶融合物和malAα-葡糖苷酶融合物。797GL3,malA和6GP3 都具备玉米γ-玉米醇溶蛋白N末端信号序列和SEKDEL序列用于靶 向并滞留在ER内。797GL3和malA融合物被克隆到两个分开的玉米 γ-玉米醇溶蛋白启动子之后,而6GP3融合物被克隆到玉米ADP-gpp 启动子之后,用于在胚乳内特异性表达。797GL3和malA融合物的氨 基酸序列与pNOV4842的(分别为SEQ ID NO:35和36)相同。6GP3 融合物的氨基酸序列与pNOV4841中的6GP3融合物的(SEQ ID NO: 34)相同。

所有的表达盒都被转移到二元载体pNOV2117中用于通过农杆菌 感染转化玉米。pNOV2117含有磷酸甘露糖异构酶(PMI)基因,允 许使用甘露糖筛选转基因细胞。pNOV2117是带有pVS1和ColE1复 制起点的二元载体。该载体含有来自pAD1289的组成型VirG基因 (Hansen,G.等,PNAS USA 91:7603-7607(1994))和来自Tn7的放 线壮观素抗性基因。克隆到左和右边界之间多接头内的是玉米泛素启 动子,PMI编码序列和pNOV117的胭脂碱合酶终止子(Negrotto,D 等,Plant Cell Reports 19:798-803(2000))。转化的玉米植物可以自体 受粉或异型杂交并收集种子用于分析。可通过杂交表达单个酶的植物, 或通过用一种多元基因表达盒转化植物,而获得不同酶的组合。

实施例10

细菌和毕赤氏酵母(Pichia)表达载体的构建

按下述构建表达盒用于在毕赤氏酵母或细菌内表达耐超高温α-葡 糖苷酶和葡萄糖异构酶:

pNOV4829(SEQ ID NO:37和38)含有在细菌表达载体pET29a 内的合成海栖热袍菌葡萄糖异构酶与ER滞留信号的融合物。该葡萄 糖异构酶融合基因被克隆到pET29a的NcoI和SacI位点中,这样就 加入了蛋白纯化所需的N末端S标签。

pNOV4830(SEQ ID NO:39和40)含有在细菌表达载体pET29a 内的合成那不勒斯栖热袍菌葡萄糖异构酶与ER滞留信号的融合物。 该葡萄糖异构酶融合基因被克隆到pET29a的NcoI和SacI位点中, 这样就加入了蛋白纯化所需的N末端S标签。

pNOV4835(SEQ ID NO:41和42)含有合成的海栖热袍菌葡萄 糖异构酶基因,该基因被克隆到细菌表达载体pET28C的BamHI和 EcoRI位点中。这样就使His标签(纯化蛋白所需)与葡萄糖异构酶 的N末端融合。

pNOV4836(SEQ ID NO:43和44)含有合成的那不勒斯栖热袍 菌葡萄糖异构酶基因,该基因被克隆到细菌表达载体pET28C的 BamHI和EcoRI位点中。这样就使His标签(纯化蛋白所需)与葡萄 糖异构酶的N末端融合。

实施例11

基本上如Negrotto等,Plant Cell Reports 19:798-803所述,进 行未成熟玉米胚的转化。对于本实施例,所有的培养基组分如上述引 文中Negrotto等人所述,但是,此文献中描述的各培养基组分是可以 被代替的。

A.转化质粒和可选择标记

将转化所用的基因克隆到适于转化玉米的载体内。该实施例中所 用的载体含有磷酸甘露糖异构酶(PMI)基因,以筛选转基因系 (Negrotto等,(2000)Plant Cell Reports 19:798-803)。

B.制备根癌农杆菌

在YEP(酵母提取物(5g/L),蛋白胨(10g/L),NaCl(5g/L), 15g/l琼脂,pH6.8)固体培养基上28℃下培养含有植物转化质粒的农 杆菌菌株LBA4404(pSB1)2-4天。然后将大约0.8×109农杆菌悬浮到 补充有100μM As(Negrotto等,(2000)Plant Cell Rep 19:798-803)的 LS-inf培养基内。在该培养基内预诱导细菌30-60分钟。

C.接种

从8-12天龄的玉米穗上剪切下来自A188或其它适当基因型的未 成熟胚放入液体LS-inf+100μM As中。用新鲜感染培养基漂洗一次 胚。然后加入土壤杆菌溶液,漩涡器上震荡胚30秒,并与细菌静置5 分钟。然后将该胚保持盾片面向上的方向转移到LSAs培养基内,黑 暗培养2-3天。然后,从每个培养皿中将20-25个胚转移到补充有氨 噻肟头孢霉素(250mg/l)和硝酸银(1.6mg/l)的LSDc培养基中并在 28℃暗处培养10天。

D.选择转化细胞并再生转化植物

将形成胚胎发生愈伤组织的未成熟胚转移到LSD1M0.5S培养基 中。用6周时间在该培养基上筛选培养物,在第3周时进行传代培养 步骤。将存活的愈伤组织转移到补充有甘露糖的Reg1培养基内。在 光亮下培养(16小时光/8小时暗)后,再将绿色组织转移到不含生长 调节剂的Reg2培养基内并孵育1-2周。将小植物(plantlet)转移到含有 Reg3培养基的Magenta GA-7盒子(Magenta Corp,Chicago Ill)内 并在光亮下生长。2-3周后,PCR检测植物是否存在PMI基因和其它 目的基因。PCR测试的阳性植物被转移到温室中。

实施例12

分析表达导向质外体或ER的α-淀粉酶的玉米植物的T1种子

获得了用实施例4所述pNOV6200或pNOV6201转化的自体授粉 玉米植物的T1种子。在暴露到高温下之前,根据目视检查和碘溶液 对淀粉进行的正常染色,这些玉米粒内淀粉的积累呈现正常状态。解 剖未成熟的玉米粒,将纯化的胚乳单独置于微量离心管内并浸泡在 200μl 50mM NaPO4缓冲液内。将该管置于85℃水浴20分钟,然后冰 上冷却。向各管中加入20微升1%碘溶液并混合。大约25%的分离的 玉米粒显示出正常的淀粉染色。剩余的75%未能染色,说明淀粉已被 降解为不能被碘染色的低分子量糖。发现pNOV6200或pNOV6201 的T1玉米粒能够自身水解玉米淀粉。在37℃孵育后检测不到淀粉减 少。

通过从胚乳中分离耐超高温蛋白组分再经过PAGE/考马斯染色 来进一步分析淀粉酶的表达。观察到了适当分子量(50kD)的分离蛋 白带。使用市售着色直链淀粉(AMYLAZYME,来自Megazyme, Ireland)对这些样品进行α-淀粉酶测试试验。高水平的耐超高温淀粉 酶活性与此50kD蛋白的存在相关。

进一步发现来自多数表达耐超高温α-淀粉酶(所述酶被导向造粉 体)的转基因玉米的玉米粒淀粉在环境温度下足够活跃,如果该酶被 允许直接与淀粉颗粒相接触,那么可以水解多数淀粉。具有耐超高温 α-淀粉酶(所述酶被导向造粉体)的80个品系中,4个被鉴定能够在 玉米粒内积累淀粉。使用比色amylazyme试验分析这些品系中的3个 品系的热稳定性α-淀粉酶活性。淀粉酶试验说明这3个品系中热稳定 性淀粉酶活性水平很低。当在适当的含水量(moisture)和加热条件下处 理从这3个品系中纯化的淀粉时,淀粉被水解,这说明存在足够水平 的α-淀粉酶以促进从这些品系制备的淀粉的自身水解。

获得了来自pNOV6200或pNOV6201转化体的多个独立品系的 T1种子。解剖各品系的单个玉米粒,分别在300μl 50mM NaPO4缓冲 液中单独匀浆各纯化的胚乳。分析胚乳悬浮液试样在85℃下的α-淀粉 酶活性。大约80%的品系发生耐超高温活性的分离(参见图1A,1B 和2)。

在100℃加热来自野生型植物或pNOV6201转化植物的玉米粒1, 2,3或6小时然后用碘溶液进行淀粉染色。3或6小时后,分别在成 熟玉米粒内检测到极少量淀粉或检测不到淀粉。这样,当在高温孵育 时,如下转基因玉米成熟玉米粒内的淀粉被水解,所述转基因玉米表 达耐超高温淀粉酶,该酶被导向内质网。

另一实验中,pNOV6201植物的成熟T1玉米粒被浸泡在50℃下 16小时,来自所述玉米粒的部分纯化的淀粉在85℃加热5分钟后被水 解。这说明玉米粒研磨后,靶向内质网的α-淀粉酶与淀粉结合并能够 在加热后水解淀粉。碘染色说明在50℃浸泡16小时后在成熟种子内 淀粉仍维持完整。

另一实验中,从pNOV6201转化植物分离的成熟玉米粒在95℃加 热16小时,然后干燥。在表达耐超高温α-淀粉酶的种子内,淀粉水 解为糖导致干燥后产生皱褶外观。

实施例13

分析表达导向造粉体的α-淀粉酶的玉米植物的T1种子

获得了用实施例4所述pNOV4029或pNOV4031转化的自体受粉 玉米植物的T1种子。在这些品系的玉米粒内淀粉积累明显地不正常。 虽然严重程度不同,但所有的品系都分离出极低的淀粉表型,或不存 在淀粉表型。在暴露到高温之前,碘对纯化自未成熟玉米粒的胚乳仅 有微弱的染色。85℃下20分钟后,不出现染色作用。当玉米穗被干燥, 玉米粒皱缩。如果允许与淀粉颗粒直接接触,这种淀粉酶明显地在温 室温度下具有足够的活性来水解淀粉。

实施例14

发酵表达α-淀粉酶的玉米植物的谷粒

100%转基因谷粒,85℃对95℃,不同的液化时间

含有热稳定性α-淀粉酶的转基因玉米(pNOV6201)在不添加外 源α-淀粉酶的发酵中表现良好,液化所需的时间大为缩短,并使淀粉 的溶解更彻底。用下述步骤进行实验室发酵(下文详述):1)研磨,2) 含水量(moisture)分析,3)制备含研磨后的玉米,水,backset和α- 淀粉酶的浆液,4)液化和5)同时糖化和发酵(SSF)。该实施例中, 液化步骤的温度和时间如下所述变化。另外,转基因玉米用或不用外 源α-淀粉酶液化,并将乙醇产生性能与用市售α-淀粉酶处理过的对照 玉米相对比。

使用含有α-淀粉酶基因和PMI可选择标记的载体,即pNOV6201, 根据实施例4所述方法制备本实施例所用的转基因玉米。将表达高水 平热稳定性α-淀粉酶的转基因品系的花粉授粉给市售杂种 (N3030BT),获得转基因玉米。将玉米干燥到11%含水量并室温下 保藏。该转基因玉米粉的α-淀粉酶含量为95单位/g,而1单位酶可在 85℃,pH6.0MES缓冲液中每分钟从玉米面粉产生1微摩尔还原性末 端。所用的对照玉米是已知乙醇产生性能良好的黄色马齿形玉米。

1)研磨:在配备有2.0mm筛的Perten 3100锤式粉碎机内研磨 转基因玉米(1180g),这样产生转基因玉米粉。彻底清洗后,在相同 的粉碎机内研磨对照玉米,以免被转基因玉米污染。

2)含水量分析:将转基因和对照玉米样品(20g)在铝秤盘(weigh boat)内称重,100℃加热4小时。再次称重,从重量损失计算含水量。 转基因面粉的含水量为9.26%,对照面粉为12.54%。

3)制备浆液:设计浆液的组成以便在SSF开始时形成带有36% 固体的浆状物。对照样品在100ml塑料瓶中制备并含有21.50g对照玉 米面粉,23ml去离子水,6.0ml backset(8%重量的固体),和0.30ml 用水稀释50倍的市售α-淀粉酶。选择该α-淀粉酶剂量以代表工业应 用。当在上述转基因α-淀粉酶试验的条件下进行实验时,对照α-淀粉 酶的剂量为2U/g玉米粉。加入氢氧化铵调整pH为6.0。以同样的方 式制备转基因样品,但是含有20g玉米面粉,因为转基因玉米面粉的 含水量较低。用与对照样品同样剂量的α-淀粉酶或者不用外源α-淀粉 酶制备转基因面粉浆液。

4)液化:含有转基因玉米面粉浆液的瓶子浸泡到85℃或95℃水 浴内5,15,30,45或60分钟。在85℃孵育对照浆液60分钟。高温 孵育过程中,每5分钟就用手剧烈混合浆液一次。高温步骤后冰上冷 却浆液。

5)同时糖化和发酵:液化形成的浆状物与葡糖淀粉酶(0.65ml 1/50稀释的市售L-400葡糖淀粉酶),蛋白酶(0.60ml 1000倍稀释的 市售蛋白酶),0.2mg Lactocide & urea(0.85ml 10倍稀释的50%Urea Liquor)混合。在含有浆状物的100ml瓶子的瓶盖上挖一个洞作为CO2排出通道。然后用酵母(1.44ml)接种该浆状物并在90F水浴孵育。 发酵24小时后,温度降到86F;48小时时设为82F。

通过制备含有酵母(0.12g)和70克麦芽糖糊精,230ml水,100ml backset,葡糖淀粉酶(0.88ml 10倍稀释的市售葡糖淀粉酶),蛋白酶 (1.76ml 100倍稀释的市售酶),尿素(1.07克),青霉素(0.67mg) 和硫酸锌(0.13g)的混合物,使用于接种的酵母增殖。在需要该繁殖 培养物之前的那天开始制备并在90°F混合下孵育繁殖培养物。

24,48和72小时时,从各发酵罐中取出样品,0.2μm滤器过滤 并HPLC分析乙醇和糖。分析72小时的样品中总共溶解的固体和残 留淀粉。

HPCL分析在配有折光率检测器,柱加热器和Bio-Rad Aminex HPX-87H柱的二元梯度系统内进行。用0.005M H2SO4的水溶液以 1ml/min的速度平衡该系统。柱温度为50℃。样品加样体积为5μl; 洗脱使用相同的溶剂。通过注射已知的标准物来校准RI反应。测量 各注射样品内的乙醇和葡萄糖。

残留淀粉按下述测定。在50℃烤箱内干燥样品和标准物,然后在 样品粉碎机内研磨成粉末。将粉末(0.2g)称量到15ml有刻度的离心 管内。用10ml含水乙醇(80%v/v)通过在涡旋之后离心并去除上清 来洗粉末3次。将DMSO(2.0ml)加入到沉淀内,再加入3.0ml在 MOPS缓冲液内的热稳定性α-淀粉酶(300单位)。剧烈混合后,85 ℃水浴中孵育该管60分钟。孵育过程中,对管进行4次混合。冷却样 品并加入4.0ml醋酸钠缓冲液(200mM,pH4.5),再加入0.1ml葡糖 淀粉酶(20U)。50℃孵育样品2小时,混合,然后3500rpm离心5 分钟。0.2μM滤器过滤上清并按如上所述HPLC方法分析上清中的葡 萄糖。使用50μl注射量作为具有低剩余淀粉的(<20%固体)样品的 加样量。

结果转基因玉米在不加入α-淀粉酶的发酵中表现良好。72小时 的乙醇产量在加入或不加入外源α-淀粉酶时基本相同,如表1所示。 这些数据也表明当液化温度更高时,会获得更大的乙醇产量;相对于 其它商业所用的酶如液化芽孢杆菌(Bacillus liquefaciens)α-淀粉酶 而言,在转基因玉米内表达的本发明酶在更高温度时具有活性。

表1   液化温度℃   液化时间   min   外源性α-   淀粉酶  #重复次数   平均乙醇%   v/v   标准差%   v/v   85   60   有  4   17.53   0.18   85   60   无  4   17.78   0.27   95   60   有  2   18.22   ND   95   60   无  2   18.25   ND

当液化时间改变时,发现有效生产乙醇所需的液化时间比常规方 法所需的缩短很多。图3显示从15分钟到60分钟的液化几乎不改变 72小时发酵的乙醇产量。另外95℃液化比85℃液化在每一个时间点 上都导致乙醇量更多。这些结果说明使用耐超高温酶改善了该过程。

对照玉米比转基因玉米的乙醇终产量高,但是之所以选择对照是 由于其发酵表现非常优秀。相反,转基因玉米具有经选择以利于转化 的遗传背景。通过公知的育种技术将此α-淀粉酶性状导入原种(elite) 玉米种质应当可以消除此差异。

检测72小时产生的啤酒的残留淀粉水平(图4)显示,转基因α- 淀粉酶使发酵可利用的淀粉的量显著提高;发酵后残留的淀粉量减少 许多。

使用乙醇水平和残留淀粉水平,最适液化时间为95℃15分钟和 85℃30分钟。该实验中这些时间是发酵罐水浴的总共时间,这样就 包括了样品温度从室温升至85℃或95℃所用的时间。更短的液化时间 可能对大规模工业过程最佳,工业过程中可通过使用蒸汽加压锅等设 备快速加热浆状物。常规工业液化过程需要收集槽从而使浆状物在高 温下孵育1或多个小时。本发明避免了对这种收集槽的需要,并提高 液化设备的生产力。

发酵过程中α-淀粉酶的一个重要功能是减少浆状物的粘性。在各 个时间点,含有转基因玉米粉的样品的粘性明显小于对照样品。另外 转基因样品似乎不经过在所有对照样品中均会出现的凝胶状期;凝胶 化通常在玉米浆被加热加工时出现。因此,使胚乳碎块内遍布α-淀粉 酶会在加热加工过程中通过防止形成大的凝胶(所述凝胶会使扩散变 缓并加大混合和泵出浆状物所需的能量投入)给浆状物带来有益的物 理特性。

转基因玉米内的高剂量α-淀粉酶还可以增加转基因浆状物的有利 特性。在85℃,转基因玉米的α-淀粉酶活性比对照所用外源α-淀粉酶 剂量的活性高出许多倍。后者被选作为商用等级的代表。

实施例15

当与对照玉米混合时转基因玉米的有效作用

以5%-100%转基因玉米面粉的不同水平将转基因玉米面粉与对 照玉米面粉混合。如实施例14所述处理。含有转基因表达的α-淀粉 酶的浆状物在85℃液化30分钟或95℃液化15分钟;对照浆状物如实 施例14所述制备,并在85℃液化30分钟或60分钟(每样一个)或 95℃液化15或60分钟(每样一个)。

48和72小时的乙醇产量和剩余淀粉的数据如表2所示。48小时 的乙醇水平如图5所示;剩余淀粉的测量值如图6所示。这些数据显 示当转基因谷物仅占浆状物中总谷物的一小部分时(低至5%),转基 因表达的热稳定性α-淀粉酶在乙醇生产方面仍表现非常良好。数据还 显示当总谷物内含有至少40%转基因谷粒时,剩余淀粉明显低于对照 浆合物。

表2   85℃液化   95℃液化   转基因谷物wt%   剩余淀粉   乙醇48h 乙醇%v/v72h   剩余淀粉   乙醇48h 乙醇%v/v72h   100   3.58   16.71 18.32   4.19   17.72 21.14   80   4.06   17.04 19.2   3.15   17.42 19.45   60   3.86   17.16 19.67   4.81   17.58 19.57   40   5.14   17.28 19.83   8.69   17.56 19.51   20   8.77   17.11 19.5   11.05   17.71 19.36   10   10.03   18.05 19.76   10.8   17.83 19.28   50   10.67   18.08 19.41   12.44   17.61 19.38   0*   7.79   17.64 20.11   11.23   17.88 19.87

*对照样品。均为2次测定的平均值。

实施例16

在总玉米中使用1.5-12%的转基因玉米时乙醇产量随液化pH的 改变

由于转基因玉米以总玉米5-10%的比例在发酵中表现良好,接下 来进行另外一系列发酵,该发酵中总玉米含有1.5-12%的转基因玉米。 pH在6.4-5.2范围内变化,转基因玉米内表达的α-淀粉酶的活性的最 适pH低于工业上常规所用的pH。

该实验按实施例15所述进行,除下述例外:

1)转基因玉米面粉按总干重1.5%-12.0%的水平与对照玉米面 粉混合。

2)对照玉米为N3030BT,其比实施例14和15所用对照更加接 近转基因玉米。

3)含有转基因粉的样品内不加入外源性α-淀粉酶。

4)液化前将样品pH调整到5.2,5.6,6.0或6.4。每种pH均制 备了至少5种样品,涵盖了0%转基因玉米粉-12%转基因玉米粉的范 围。

5)所有样品均在85℃液化60分钟。

作为发酵时间的函数,乙醇含量的改变如图7所示。该图显示从 含有3%转基因玉米的样品所获的数据。在较低pH下的发酵比pH6.0 或更高pH时进行得快。在具有其它剂量转基因玉米的样品内也观察 到了类似的行为。与高水平的表达相结合的转基因酶活性pH曲线可 以允许在较低pH下液化,导致发酵更快速,这样比常规pH6.0下的 发酵过程导致生产能力更高。

72小时乙醇产量如图8所示。可以看出,根据乙醇产量,这些结 果显示对样品内所含的转基因谷物数量几乎没有依赖性。因此,该谷 物含有丰富的淀粉酶来促进发酵生产乙醇。还说明较低pH的液化能 够获得更高乙醇产量。

监测液化后样品的粘性,发现pH6.0时,6%的转基因谷物足以充 分降低粘性。pH5.2和5.6时,粘性等于12%转基因谷物的对照的粘 性,但是对于转基因谷物百分比更低的情况却不是如此。

实施例17

使用耐高温酶从玉米粉生产果糖

已证实,表达耐超高温α-淀粉酶797GL3的玉米,当与α-葡糖苷 酶(MalA)和木糖异构酶(XylA)混合时,可促进果糖生产。

将表达797GL3的pNOV6201转基因植物的种子在Kleco槽内磨 成面粉,这样形成了淀粉酶面粉。以同样的方式研磨非转基因玉米谷 粒获得对照面粉。

在大肠杆菌中表达α-葡糖苷酶,MalA(来自硫磺矿硫化叶菌)。 将收获的细菌悬浮在50mM pH7.0的含有1mM 4-(2-氨乙基)苯磺酰 氟的磷酸钾缓冲液内,然后在French细胞压碎器内裂解。4℃下23000x g离心裂解液15分钟。取出上清,加热到70℃维持10分钟,冰上冷 却10分钟,然后4℃下34000xg离心30分钟。取出上清,在centricon 10装置中将MalA浓缩2倍。保留centricon 10步骤的滤液以作为 MalA的阴性对照。

在大肠杆菌中表达那不勒斯栖热袍菌的xylA基因,制备木糖(葡 萄糖)异构酶。将细菌悬浮在pH7.0的100mM磷酸钠中并通过French 细胞压碎器使其裂解。沉淀细胞碎片后,将提取物加热到80℃10分 钟然后离心。上清液中含有XylA酶活性。与XylA提取物平行制备空 载体的对照提取物。

将玉米粉(60mg每份样品)与缓冲液及来自大肠杆菌的提取物 混合。如表3所示,样品含有淀粉酶玉米面粉(淀粉酶)或对照玉米 面粉(对照),50μl MalA提取物(+)或滤液(-),以及20μl XylA提 取物(+)或空载体对照(-)。所有的样品都含有230μl 50mM MOPS, 10mM MgSO4,和1mM CoCl2;室温下缓冲液pH为7.0。

在85℃孵育样品18小时。孵育期末,用0.9ml 85℃水稀释样品, 并离心去除未溶材料。然后通过Centricon3超滤装置过滤上清级分, 并HPLC分析和ELSD检测。

用Astec Polymer Amin柱,5微米粒度,250×4.6mm,和Alltech ELSD 2000检测器装配梯度HPLC系统。用15∶85的水∶乙腈混合 物预先平衡该系统。流速为1ml/min。注射上样后维持起始条件5分 钟,然后20分钟梯度达到50∶50的水∶乙腈,再用相同溶剂运行10 分钟。用80∶20的水∶乙腈洗该系统20分钟,然后用起始溶剂再平 衡。在5.8min洗脱果糖,8.7分钟洗脱葡萄糖。

表3   样品   玉米粉   MalA   XylA   果糖峰面积×10-6   葡萄糖峰面积×10-6   1   淀粉酶   +   +   25.9   110.3   2   淀粉酶   -   +   7.0   12.4   3   淀粉酶   +   -   0.1   147.5   4   淀粉酶   -   -   0   25.9   5   对照   +   +   0.8   0.5   6   对照   -   +   0.3   0.2   7   对照   +   -   1.3   1.7   8   对照   -   -   0.2   0.3

HPLC结果还说明在含有α-淀粉酶的所有样品中都存在更多的麦 芽寡糖。这些结果说明三种耐高温酶能够在高温下共同作用以从玉米 面粉生产果糖。

实施例18

带有异构酶的淀粉酶面粉

另一实施例中,将淀粉酶面粉与纯化的MalA和两种细菌木糖异 构酶——海栖热袍菌的XylA和获自Diversa的被称为BD8037的酶之 一混合。淀粉酶面粉如实施例18所述制备。

带有6His纯化标签的硫磺矿硫化叶菌MalA在大肠杆菌内表达。 如实施例18所述制备细胞裂解液,然后使用镍亲合树脂(Probond, Invitrogen)根据厂商说明书对天然蛋白的纯化说明,纯化至均匀外观。

带有S标签和ER滞留信号的海栖热袍菌XylA在大肠杆菌内表 达并以与实施例18所述的那不勒斯栖热袍菌XylA同样的方式制备。

获得的木糖异构酶BD8037为冻干粉末,将其重悬浮在0.4x初始 体积的水中。

将淀粉酶玉米粉与酶溶液和水或缓冲液混合。所有的反应都含有 60mg淀粉酶面粉和总共600μl的液体。一组反应用加入了10mM MgSO4,1mM CoCl2的50mM室温下pH7.0的MOPS作为缓冲液; 第二组反应用水代替含金属的缓冲液。异构酶的量如表4所示有所变 化。所有反应均在90℃孵育2小时。离心制备反应上清液。用额外600μl 水洗涤沉淀并再离心。将各反应的上清液级分合并,Centrico 10过滤, 如实施例17所述,用具有ELSD检测的HPLC分析。观察到的葡萄 糖和果糖量如图15所示。

表4   样品   淀粉酶面粉   MalA   异构酶   1   60mg   +   无   2   60mg   +   海栖热袍菌,100μl   3   60mg   +   海栖热袍菌,10μl   4   60mg   +   海栖热袍菌,2μl   5   60mg   +   BD8037,100μl   7   60mg   +   BD8037,2μl   C   60mg   无   无

对于各异构酶而言,当反应中存在α-淀粉酶和α-葡糖苷酶时,从 玉米面粉以剂量依赖性的方式生成果糖。这些结果说明,加入或不加 入金属离子时,表达淀粉酶797GL3的谷物都能够与MalA和各种不 同耐高温异构酶一起作用,以在高温下从玉米粉生成果糖。当加入二 价金属离子时,异构酶可以在90℃实现预期的大约55%果糖的果糖: 葡萄糖平衡。这对于使用耐中温异构酶的现有方法而言是个改进,因 为现有技术需要层析分离以提高果糖浓度。

实施例19

在玉米内表达支链淀粉酶

对于pNOV7013或pNOV7005纯合的转基因植物进行杂交以产生 共同表达797GL3α-淀粉酶和6GP3支链淀粉酶的转基因玉米种子。

获得了pNOV7005或pNOV4093转化的自体受粉玉米植物的T1 或T2种子。pNOV4093是玉米优化合成6GP3基因(SEQ ID NO:3, 4)与用于将融合蛋白定位于造粉体的造粉体导向序列(SEQ ID NO: 7,8)的融合蛋白。该融合蛋白处于ADPgpp启动子(SEQ ID NO:11) 的调控下用于在胚乳内特异性表达。pNOV7005构建体将支链淀粉酶 的表达靶向胚乳内质网。该酶在ER的定位使得淀粉可在玉米粒内正 常积累。还观察到高温处理前碘溶液对淀粉的正常染色。

如同α-淀粉酶的情况,靶向造粉体的支链淀粉酶(pNOV4093) 的表达引起玉米粒内淀粉的异常积累。当玉米穗被干燥时,玉米粒发 生了皱缩。显然,该耐高温支链淀粉酶在低温下具有足够的活性,并 且如果与种子胚乳内的淀粉颗粒直接接触,能够水解淀粉。

从玉米面粉制备酶或酶提取物:在Kleco粉碎机上研磨转基因种 子,再将粉末置于50mM NaOAc pH5.5的缓冲液内室温孵育1小时, 其间不断震荡,从中提取支链淀粉酶。然后14000rpm离心孵育的混 合物15分钟。上清作为酶的来源。

支链淀粉酶实验:该实验反应在96孔板上进行。从玉米粉中提取 的支链淀粉酶(100μl)用900μl含有40mM CaCl2的50mM pH5.5 NaOAc缓冲液稀释10倍。涡旋该混合物,将一片Limit-Dextrizyme(天 青蛋白交联支链淀粉,来自Megazyme)加入各反应混合物并75℃孵育 30分钟(或者如提及的)。孵育期末,3500rpm离心反应混合物15分 钟。上清稀释5倍并转移到96孔平底板上测定590nm吸光值。支链 淀粉酶对天青蛋白交联支链淀粉的水解形成了水溶性染色片段,其释 放速率(测定为590nm吸光值的提高)与酶活性直接相关。

图9显示来自pNOV7005转化的不同事件的T2种子的分析。可 在许多事件中检测到支链淀粉酶活性的表达高于非转基因对照。

向测定量(~100μg)的来自转基因(表达支链淀粉酶,淀粉酶 或这两种酶)和/或对照(非转基因)的干玉米粉中加入1000μl含有 40mM CaCl2的50mM pH5.5NaOAc缓冲液。反应混合物涡旋震荡并 摇床孵育1小时。如图所示,将孵育混合物转移到高温(75℃,支链 淀粉酶的最适反应温度或如图所示)下开始酶反应一段时间。冰上冷 却以终止反应。然后14000rpm离心反应混合物10分钟。将上清的等 分试样(100μl)稀释3倍,0.2微米滤器过滤用于HPLC分析。

使用下述条件进行样品的HPLC分析:

柱:Alltech Prevail Carbohydrate ES 5微米250×4.6mm

检测器:Alltech ELSD 2000

泵:Gilson 322

注射器:Gilson 215注射器/稀释器

溶剂:HPLC级乙腈(Fisher Scientific)和水(由Waters Millipore System纯化)

低聚合度(DP1-15)的寡糖所用梯度   时间   %水   %乙腈   0   5   25   35   36   55   56   76   15   15   50   50   80   80   15   15   85   85   50   50   20   20   85   85

高聚合度(DP20-100及以上)的糖所用梯度   时间   %水   %乙腈   0   60   70   85   100   35   85   85   35   35   65   15   15   65   65

数据分析所用系统:Gilson Unipoint软件系统版本3.2

图10A和10B显示由表达的支链淀粉酶作用转基因玉米粉淀粉所 形成的水解产物的HPLC分析。将表达支链淀粉酶的玉米粉在反应缓 冲液内75℃孵育30分钟,导致从玉米淀粉形成中等链长寡糖(DP~ 10-30)和短直链淀粉链(DP~100-200)。该图还显示支链淀粉酶的活 性对钙离子有依赖性。

表达支链淀粉酶的转基因玉米可以用于生产脱支(α1-6键的断 裂)的修饰淀粉/或糊精,从而使得直链淀粉/直链糊精具有高水平。 此外,根据所用淀粉种类(如蜡样,高直链淀粉等)不同,由支链淀粉 酶形成的直链淀粉/糊精的链长分布也会不同,这样修饰淀粉/糊精的 特性也不相同。

还使用支链淀粉作为底物说明α1-6键的水解。该分离自玉米粉 的支链淀粉酶有效地水解支链淀粉。孵育后形成的产物的HPLC分析 (如述)表明,正如所期望的,由于酶水解了支链淀粉分子内的α1-6 连接从玉米形成了麦芽三糖。

实施例20

在玉米内表达支链淀粉酶

从玉米粉中提取然后通过PAGE和考马斯染色,进一步分析6gp3 支链淀粉酶的表达。在Kleco粉碎机内研磨种子30秒获得玉米面粉。 用50mM pH5.5 NaOAc缓冲液从大约150mg面粉提取酶。混合物涡 旋震荡并室温下摇床孵育1小时,然后在70℃再孵育15分钟。离心 反应混合物(室温14000rpm 15分钟)并将上清用于SDS-PAGE分析。 观察到了适当分子量(95kDal)的蛋白带。使用市售染料缀合的极限 糊精(LIMIT-DEXTRIZYME,来自Megazyme,Ireland)对样品进 行支链淀粉酶实验。耐高温支链淀粉酶活性的高水平与95kD蛋白的 存在相关。

转基因玉米种子的Western印迹和ELISA分析也表明了~95kD 蛋白的表达,该蛋白与制备的抗支链淀粉酶的抗体(大肠杆菌内表达) 反应。

实施例21

加入支链淀粉酶表达玉米提高淀粉水解速度并改善短链(可发酵) 寡糖的产量

图11A和11B所示数据来自来自如上所述两种反应混合物的淀粉 水解产物的HPLC分析。第一种反应标为“淀粉酶”,其含有按实施例 4所述方法制备的α-淀粉酶表达转基因玉米与例如非转基因玉米A188 的玉米面粉样品混合物[1∶1(w/w)];第二种反应混合物为“淀粉酶+ 支链淀粉酶”,其含有α-淀粉酶表达转基因玉米和按实施例19所述方 法制备的支链淀粉酶表达转基因玉米的玉米面粉样品混合物[1∶1 (w/w)]。所获的结果支持了支链淀粉酶与α-淀粉酶联合使用于淀粉 水解过程的有益效果。这些有益效果来自淀粉水解速度的提高(图 11A)和可发酵低DP寡糖产量的提高(图11B)。

发现在玉米内表达的α-淀粉酶单独或与支链淀粉酶一起(或任何 其它淀粉水解酶的组合)可用于制备麦芽糖糊精(直链或支链寡糖) (图11A,11B,12和13A)。根据不同的反应条件、水解酶的类型及 其组合和所用淀粉的类型,所形成的麦芽糖糊精的组成及由此其特性 也有所变化。

图12描述了以和图11描述类似的方式进行的实验的结果。图内 标出了孵育反应中采取的不同的温度和时间方案。支链淀粉酶的最适 反应温度为75℃,而α-淀粉酶为>95℃。这样,按照所示方案可以提 供支链淀粉酶和/或α-淀粉酶分别在其最适反应温度下进行催化的范 围。从这些结果很明显地推导出α-淀粉酶与支链淀粉酶的组合在60 分钟孵育期末对玉米淀粉水解得更好。

如上所述(除了在这些反应中使用~150mg玉米粉),在孵育30 分钟末对两组反应混合物的淀粉水解产物进行HPLC分析,结果如图 13A和13B。第一组反应在85℃下孵育而第二组在95℃下孵育。每组 都有两种反应混合物;第一种被称为“淀粉酶X支链淀粉酶”,其含有 表达α-淀粉酶和支链淀粉酶的转基因玉米(异花授粉形成)的玉米粉, 而第二种反应被称为“淀粉酶”混合物,由表达α-淀粉酶的转基因玉米 和非转基因玉米A188的玉米面粉样品以一定比例混合形成,所述比 例使其可获得与杂种(淀粉酶X支链淀粉酶)中观察到的α-淀粉酶活 性相同量的活性。当在85℃下孵育玉米面粉样品时,α-淀粉酶和支链 淀粉酶杂交情况下低DP寡糖的总产量高于仅表达α-淀粉酶的玉米。 95℃下孵育会(至少部分地)失活支链淀粉酶,从而在“淀粉酶X支 链淀粉酶”和“淀粉酶”之间几乎观察不到差异。但是,当使用淀粉酶和 支链淀粉酶杂交玉米粉时,在孵育期末,这两种孵育温度下的数据都 显示出:葡萄糖产量比使用仅表达α-淀粉酶的玉米的产量有显著提高 (图13B)。这样,在将淀粉完全水解为葡萄糖具重要性的情况下,使 用同时表达α-淀粉酶和支链淀粉酶的玉米会尤其有益。

上述实施例提供了足够的证据支持当联合使用α-淀粉酶时在玉米 种子中表达的支链淀粉酶会改进淀粉水解过程。α1-6键特异性的支链 淀粉酶活性比α-淀粉酶(α1-4键特异性)能远为有效地使淀粉脱支, 从而减少支链寡糖(如极限糊精,潘糖,这些通常是不可发酵的)的 数量并提高直链短寡糖(容易发酵为乙醇等)的量。第二,由支链淀 粉酶催化脱支而造成的淀粉分子片断化会提高α-淀粉酶与底物的可接 近性从而提高α-淀粉酶催化反应的效率。

实施例22

为确定797GL3α-淀粉酶和mal Aα-葡糖苷酶是否能够在相似pH 和温度条件下起作用以形成高于由单个酶所产生的葡萄糖产量,将大 约0.35ug malAα-葡糖苷酶(细菌中产生)加入含有1%淀粉和如下纯 化的淀粉的溶液,所述纯化的淀粉由非转基因玉米种子(对照)或 797GL3转基因玉米种子(797GL3玉米种子中,α-淀粉酶与淀粉共纯 化)纯化获得。另外,将从非转基因和797GL3转基因玉米种子纯化 的淀粉在不存在任何malA酶的情况下加入到1%的玉米淀粉中。在 90℃pH6.0下孵育混合物1小时,离心去除不溶物,HPLC分析可溶 组分中葡萄糖水平。如图14所示,797GL3α-淀粉酶和malAα-葡糖 苷酶在类似的pH和温度条件下作用以水解淀粉为葡萄糖。生成的葡 萄糖产量明显高于由单个酶形成的产量。

实施例23

测定热厌氧杆菌(Thermoanaerobacteriam)葡糖淀粉酶在粗淀粉 (raw-starch)水解中的应用。如图15所示,在室温和30℃,用水,大 麦α-淀粉酶(来自Sigma的商业制品),热厌氧杆菌葡糖淀粉酶及其 组合,测定粗淀粉的水解转化。如图,大麦α-淀粉酶和热厌氧杆菌葡 糖淀粉酶的组合能够水解粗淀粉为葡萄糖。另外,由大麦淀粉酶和热 厌氧杆菌GA形成的葡萄糖产量显著高于由单个酶形成的产量。

实施例24

用于粗淀粉水解的玉米优化基因和序列以及植物转化载体

根据酶在大约20℃-50℃的温度下水解粗淀粉的能力选择酶。然 后如实施例1所述,使用玉米偏爱密码子设计相应基因或基因片段用 于构建合成基因。

选择Aspergillus shirousamiα-淀粉酶/葡糖淀粉酶融合多肽(不含 信号序列),其氨基酸序列如SEQ ID NO:45所示,由Biosci.Biotech. Biochem.,56:884-889(1992);Agric.Biol.Chem.545:1905-14(1990); Biosci.Biotechnol.Biochem.56:174-79(1992)鉴定。设计玉米优化核 酸序列,如SEQ ID NO:46所示。

类似地,选择热解糖热厌氧杆菌(Thermoanaerobacterium thermosaccharolyticum)葡糖淀粉酶,其氨基酸序列如SEQ ID NO:47 所示,由Biosci.Biotech.Biochem.,62:302-308(1998)公开。设计玉米 优化核酸序列(SEQ ID NO:48)。

选择米根霉(Rhizopus oryzea)葡糖淀粉酶,其氨基酸序列(不 含信号序列)(SEQ ID NO:50)如文献所述(Agric.Biol.Chem., (1986)50,pg 957-964)公开。设计玉米优化核酸序列,如SEQ ID NO: 51所示。

另外,选择玉米α-淀粉酶,其氨基酸序列(SEQ ID NO:51)和 核酸序列(SEQ ID NO:52)来自文献。例如参见Plant Physiol.105: 759-760(1994)。

构建表达盒以从设计的SEQ ID NO:46玉米优化核酸表达 Aspergillus shirousamiα-淀粉酶/葡糖淀粉酶融合多肽,从设计的如 SEQ ID NO:48所示玉米优化核酸表达热解糖热厌氧杆菌葡糖淀粉 酶,从设计的如SEQ ID NO:50所示玉米优化核酸表达具有氨基酸 (不含信号序列)(SEQ ID NO:49)的米根霉葡糖淀粉酶,以及表达 玉米α-淀粉酶。

将质粒中含有的玉米γ-玉米醇溶蛋白N末端信号序列 (MRVLLVALALLALAASATS)(SEQ ID NO:17)与编码酶的合成基 因融合。任选地,可将SEKDEL序列与合成基因的C末端融合以靶 向并滞留到ER。将融合产物在植物转化质粒中克隆到玉米γ-玉米醇 溶蛋白启动子之后以在胚乳内特异性表达。该融合产物通过土壤杆菌 感染被运送到玉米组织。

实施例25

构建含有所选酶的表达盒以表达酶。将含有粗淀粉结合位点序列 的质粒与编码酶的合成基因融合。粗淀粉结合位点使融合的酶能与非 凝胶化的淀粉相结合。根据文献确定粗淀粉结合位点的氨基酸序列 (SEQ ID NO:53),核酸序列经过对玉米优化,如SEQ ID NO:54所 示。将玉米优化核酸序列在质粒中与编码酶的合成基因融合以在植物 内表达。

实施例26

构建玉米优化基因和载体用于植物转化

如实施例1所述,使用玉米偏爱密码子设计基因或基因片段以构 建合成基因。

选择激烈火球菌(Pyrococcus furiosus)EGLA耐超高温内切葡聚 糖酶,其氨基酸序列(不含信号序列)如SEQ ID NO:55所示,由 Journal of Bacteriology(1991)181,pg 284-290鉴定。设计玉米优化核 酸序列,如SEQ ID NO:56所示。

选择黄栖热菌(Thermus flavus)木糖异构酶,其氨基酸序列如 SEQ ID NO:57所示,由Applied Biochemistry and Biotechnology 62: 15-27(1997)公开。

构建表达盒以从玉米优化的核酸(SEQ ID NO:56)表达激烈火 球菌EGLA(内切葡聚糖酶),以及从SEQ ID NO:57氨基酸序列的 玉米优化编码核酸表达黄栖热菌木糖异构酶。

将含有玉米γ-玉米醇溶蛋白N末端信号序列 (MRVLLVALALLALAASATS)(SEQ ID NO:17)的质粒与编码酶的 合成玉米优化基因融合。任选地,可将SEKDEL序列与合成基因的C 末端融合以靶向并滞留到ER。将融合产物克隆到植物转化质粒中玉 米γ-玉米醇溶蛋白启动子之后以在胚乳内特异性表达。该融合产物通 过土壤杆菌感染被运送到玉米组织。

实施例27

使用玉米内表达的耐高温酶从玉米面粉生产葡萄糖

当与水溶液混合并在90℃孵育时,已证实耐超高温α-淀粉酶 797GL3和α-葡糖苷酶(MalA)的表达可以导致葡萄糖产生。

通过测定α-葡糖苷酶活性来鉴定表达MalA酶的转基因玉米系 (168A10B系,pNOV4831),酶活性由对硝基苯基-α-葡糖苷的水解 指示。

将表达797GL3的转基因植物玉米粒在Kleco槽内研磨成面粉, 由此形成淀粉酶面粉。将表达MalA的转基因植物玉米粒在Kleco槽 内研磨成粉,形成MalA面粉。以同样方式将非转基因植物玉米粒研 磨形成对照面粉。

缓冲液为50mM MES缓冲液pH6.0

玉米面粉水解反应:如下表5所示制备样品。将玉米粉(约60mg/ 每份样品)与pH6.0的40ml 50mM MES缓冲液混合。在90℃水浴 中孵育样品2.5小时和14小时。在指定的孵育时间点上取出样品并分 析葡萄糖含量。

通过葡萄糖氧化酶/辣根过氧化物酶实验分析样品内的葡萄糖。 GOPOD试剂含有:0.2mg/ml邻联茴香胺,100mM Tris pH7.5,100U/ml 葡萄糖氧化酶和10U/ml辣根过氧化物酶。将20μl样品或稀释样品和 葡萄糖标准(从0-0.22mg/ml变化)排列在96孔板上。向各孔中加入 100μl GOPOD试剂并混合,然后37℃孵育该板30分钟。加入100μl 硫酸(9M),540nm下读吸光值。参照标准曲线确定样品的葡萄糖浓 度。在各样品内观察到的的葡萄糖量如表5所示。

表5   样品   WT面粉mg 淀粉酶面粉mg   MalA面粉mg   缓冲液ml   葡萄糖2.5hmg  葡萄糖14hmg   1   66 0   0   40   0  0   2   31 30   0   40   0.26  0.50   3   30 0   31.5   40   0  0.09   4   0 32.2   30.0   40   2.29  12.30   5   0 6.1   562   40   1.16  8.52

这些数据说明当玉米内表达耐超高温α-淀粉酶和α-葡糖苷酶形成 玉米产物时,当该产物在适当条件下被水解和加热时可以形成葡萄糖。

实施例28

生产麦芽糖糊精

使用表达耐高温α-淀粉酶的谷物制备麦芽糖糊精。该示范性过程 不需要淀粉的预分离,也不需要加入外源性酶。

将表达797GL3的转基因植物玉米粒在Kleco槽内研磨成粉,形 成“淀粉酶面粉”。将10%转基因/90%非转基因玉米粒的混合物在 Kleco槽内以同样方式研磨形成“10%淀粉酶面粉”。

以5μl水每mg面粉的比例用水混合淀粉酶面粉和10%淀粉酶面 粉(约60mg/样品)。如表6所示,在90℃孵育获得的浆液不超过20 小时。在85℃加入0.9ml 50mM EDTA终止反应并用吸管吹吸混合。 取出0.2ml浆液样品,离心去除不溶物并用水稀释3倍。

用具有ELSD检测的HPLC分析样品中的糖和麦芽糖糊精。用 Astec Polymer Amino柱,5微米粒度,250×4.6mm和Alltech ELSD 2000检测器装配梯度HPLC系统。用15∶85的水∶乙腈混合物预先 平衡该系统。流速为1ml/min。注射上样后维持起始条件5分钟,然 后为20分钟梯度至50∶50的水∶乙腈,再以相同溶剂运行10分钟。 用80∶20的水∶乙腈洗该系统20分钟,然后用起始溶剂再平衡。

将所获的峰面积相对于面粉的体积和重量标化。每μg碳水化合 物的ELSD响应因子随着DP的增高而降低,这样较高DP的麦芽糖 糊精在总体中所占的百分比高于由峰面积所指示的。

100%淀粉酶面粉的反应产物的相对峰面积如图17所示。10%淀 粉酶面粉的反应产物的相对峰面积如图18所示。

这些数据说明可通过改变加热时间来生产不同的麦芽糖糊精混合 物。可通过混合转基因α-淀粉酶表达玉米和野生型玉米来改变α-淀粉 酶活性水平,从而改变麦芽糖糊精性质谱。

本实施例所述的水解反应产物可通过多种成熟技术被浓缩并纯化 用于食品和其它应用,所述技术包括:离心,过滤,离子交换,凝胶 渗透,超滤,纳米过滤(nanofiltration),反向渗透,用碳颗粒脱色, 喷雾干燥和其它本领域公知技术。

实施例29

时间和温度对麦芽糖糊精产量的影响

可通过改变反应时间和温度来改变含有耐高温α-淀粉酶的谷物自 水解所获的麦芽糖糊精产物组成。

另一实验中,如上实施例28所述制备淀粉酶面粉并以300μl水每 60mg面粉的比例与水混合。在70℃,80℃,90℃或100℃孵育样品不 超过90分钟。在90℃加入900ml 50mM EDTA终止反应。离心去除 不溶物并通过0.45μm尼龙滤器过滤。如实施例28所述HPLC分析滤 液。

分析结果如图19所示。DP数命名是指聚合程度。DP2是麦芽糖; DP3是麦芽三糖等。临近洗脱末尾的一个单峰中洗脱下较大的DP麦 芽糖糊精,标记为“>DP12”。该聚集体包括可以通过0.45μm滤器和通 过保护柱的糊精,并不含有不能通过滤器或保护柱的非常大淀粉片段。

该实验说明可通过改变温度和孵育时间来改变产物的麦芽糖糊精 组成,以获得期望的麦芽寡糖或麦芽糖糊精产物。

实施例30

生产麦芽糖糊精

还可在加热处理前向水和面粉混合物中加入其它酶如α-葡糖苷酶 和木糖异构酶,或者通过包括盐来改变由含有耐高温α-淀粉酶的转基 因玉米所形成的麦芽糖糊精产物的组成。

另一实验中,如上制备的淀粉酶面粉与纯化的MalA和/或命名为 BD8037的细菌木糖异构酶混合。在大肠杆菌内表达带有6His纯化标 签的硫磺矿硫化叶菌MalA。如实施例28所述制备细胞裂解液,然后 使用镍亲合树脂(Probond,Invitrogen)根据厂商说明书对天然蛋白 的纯化说明,纯化至均匀外观。从Diversa获得的木糖异构酶BD8037 为冻干粉末,将其重悬浮在0.4x初始体积的水中。

将淀粉酶玉米粉与酶溶液和水或缓冲液混合。所有的反应都含有 60mg淀粉酶面粉和总共600μl的液体。一组反应用加入了10mM MgSO4,1mM CoCl2的50mM室温下pH7.0的MOPS作为缓冲液; 第二组反应用水代替含金属的缓冲液。所有反应均在90℃孵育2小时。 离心制备反应上清液。用额外600μl水洗涤沉淀并再离心。将来自各 反应的上清液合并,Centrico 10过滤,如上所述,用带有ELSD检测 的HPLC分析。

结果如图20所示。该图说明,加入或不加入金属离子,表达淀粉 酶797GL3的谷物都能够与其它耐高温酶作用,在高温下从玉米粉生 成各种麦芽糖糊精混合物。特别地,将葡糖淀粉酶或α-葡糖苷酶包括 在内可以产生更多葡萄糖产物和其它低DP产物。包括葡萄糖异构酶 可以使产物内存在果糖,这样可以比由淀粉酶单独或淀粉酶与α-葡糖 苷酶形成的产物更甜。另外,该数据还表明DP5,DP6和DP7麦芽寡 糖的比例可以通过加入二价阳离子盐,如CoCl2和MgSO4来提高。

改变由此处所述反应所形成的麦芽糖糊精的组成的其它方法包 括:改变反应pH,改变转基因或非转基因谷物内的淀粉类型,改变 固体比率或加入有机溶剂。

实施例31

在回收淀粉衍生产物之前无需机械破坏从谷物制备糊精或糖

将表达α-淀粉酶797GL3的转基因谷物与水接触并在90℃加热过 夜(>14小时),制备了糖和麦芽糖糊精。然后从谷物中过滤分离液体。 通过实施例15所述方法HPLC分析液体产物。表6给出所检测产物 的情况。

表6   分子种类   产物浓度μg/25μl注射量   果糖   0.4   葡萄糖   18.0   麦芽糖   56.0   DP3*   26.0   DP4*   15.9   DP5*   11.3   DP6*   5.3   DP7*   1.5

*DP3的定量包括麦芽三糖还可包括以α(1→6)键替代了α(1→4) 键的麦芽三糖异构体。类似地,DP4-DP7的定量包括指定链长的直链 麦芽寡糖以及以一个或多个α(1→6)键替代了一个或多个α(1→4) 键的异构体。

这些数据表明将表达α-淀粉酶的完整谷物与水接触并加热可以制 备糖和麦芽糖糊精。然后可以通过过滤或离心或重力沉降从完整谷物 分离产物。

实施例32

发酵表达米根霉葡糖淀粉酶的玉米中粗淀粉

从按实施例29所述制备的转基因植物收获转基因玉米粒。将此玉 米粒研磨成面粉。该玉米粒表达含有米根霉葡糖淀粉酶(SEQ ID NO: 49)的活性片段的蛋白,该蛋白靶向内质网。

如实施例15所述将玉米粒研磨成粉。然后制备含有20g玉米粉, 23ml去离子水和6.0ml backset(8%重量固体)的浆状物。加入氢氧化 铵调整pH为6.0。向浆状物中加入下述成分:蛋白酶(0.60ml 1000 倍稀释的市售蛋白酶),0.2mg Lactocide & urea(0.85ml 10倍稀释的 50%Urea Liquor)。在含有浆状物的100ml瓶子的瓶盖上挖一个洞作 为CO2排出通道。然后用酵母(1.44ml)接种该浆状物并在90F水浴中 孵育。发酵24小时后,温度降到86F;48h时设为82F。

接种的酵母如实施例14所述进行繁殖。

如实施例14所述取出样品然后用实施例14所述方法分析。

实施例33

发酵表达米根霉葡糖淀粉酶的玉米中的粗淀粉的实施例

从按实施例28所述制备的转基因植物收获转基因玉米粒。将玉米 粒磨成粉。该玉米粒表达含有米根霉葡糖淀粉酶(SEQ ID NO:49)的活 性片段的蛋白,该蛋白靶向内质网。

如实施例15所述将玉米粒研磨成粉。然后制备含有20g玉米粉, 23ml去离子水和6.0ml backset(8%重量固体)的浆状物。加入氢氧化 铵调整pH为6.0。向浆状物中加入下述成分:蛋白酶(0.60ml 1000 倍稀释的市售蛋白酶),0.2mg Lactocide & urea(0.85ml 10倍稀释的 50%Urea Liquor)。在含有浆状物的100ml瓶子的瓶盖上挖一个洞作 为CO2排出通道。然后用酵母(1.44ml)接种该浆状物并在90F水浴中 孵育。发酵24小时后,温度降到86F;48h时设为82F。

接种的酵母如实施例14所述进行繁殖。

如实施例14所述取出样品然后用实施例14所述方法分析。

实施例34

加入外源性α-淀粉酶发酵表达米根霉葡糖淀粉酶的玉米的完整玉 米粒中的粗淀粉的实施例

从按实施例28所述制备的转基因植物收获转基因玉米粒。该玉米 粒表达含有米根霉葡糖淀粉酶(SEQ ID NO:49)的活性片段的蛋白,该 蛋白靶向内质网。

将玉米粒与20g玉米粉,23ml去离子水和6.0ml backset(8%重量 固体)相接触。加入氢氧化铵调整pH为6.0。加入下述成分:购自sigma 的大麦α-淀粉酶(2mg),蛋白酶(0.60ml 1000倍稀释的市售蛋白酶), 0.2mg Lactocide & urea(0.85ml 10倍稀释的50%Urea Liquor)。在 含有混合物的100ml瓶子的瓶盖上挖一个洞作为CO2通道。然后用酵 母(1.44ml)接种该混合物并在90F水浴中孵育。发酵24小时后,温度 降到86F;48h时设为82F。

接种的酵母如实施例14所述进行繁殖。

如实施例14所述取出样品然后用实施例14所述方法分析。

实施例35

发酵表达米根霉葡糖淀粉酶和玉米(Zea mays)淀粉酶的玉米中 的粗淀粉的实施例

从按实施例28所述制备的转基因植物收获转基因玉米粒。该玉米 粒表达含有米根霉葡糖淀粉酶(SEQ ID NO:49)的活性片段的蛋白,该 蛋白靶向内质网。该玉米粒还表达带有粗淀粉结合域的玉米淀粉酶, 如实施例28所述。

如实施例14所述将玉米粒研磨成粉。然后制备含有20g玉米粉, 23ml去离子水和6.0ml backset(8%重量固体)的浆状物。加入氢氧化 铵调整pH为6.0。向浆状物中加入下述成分:蛋白酶(0.60ml 1000 倍稀释的市售蛋白酶),0.2mg Lactocide & urea(0.85ml 10倍稀释的 50%Urea Liquor)。在含有浆状物的100ml瓶子的瓶盖上挖一个洞作 为CO2通道。然后用酵母(1.44ml)接种该浆状物并在90F水浴中孵育。 发酵24小时后,温度降到86F;48h时设为82F。

接种的酵母如实施例14所述进行繁殖。

如实施例14所述取出样品然后用实施例14所述方法分析。

实施例36

发酵表达热解糖热厌氧杆菌葡糖淀粉酶的玉米中的粗淀粉的实施 例

从按实施例28所述制备的转基因植物收获转基因玉米粒。该玉米 粒表达含有热解糖热厌氧杆菌葡糖淀粉酶(SEQ ID NO:47)的活性片 段的蛋白,该蛋白靶向内质网。

如实施例15所述将玉米粒研磨成粉。然后制备含有20g玉米粉, 23ml去离子水和6.0ml backset(8%重量固体)的浆状物。加入氢氧化 铵调整pH为6.0。向浆状物中加入下述成分:蛋白酶(0.60ml 1000 倍稀释的市售蛋白酶),0.2mg Lactocide & urea(0.85ml 10倍稀释的 50%Urea Liquor)。在含有浆状物的100ml瓶子的瓶盖上挖一个洞作 为CO2通道。然后用酵母(1.44ml)接种该浆状物并在90F水浴中孵育。 发酵24小时后,温度降到86F;48h时设为82F。

接种的酵母如实施例14所述进行繁殖。

如实施例14所述取出样品然后用实施例14所述方法分析。

实施例37

发酵表达黑曲霉(Aspergillus niger)葡糖淀粉酶的玉米中的粗淀 粉的实施例

从按实施例28所述制备的转基因植物收获转基因玉米粒。该玉米 粒表达含有黑曲霉葡糖淀粉酶的活性片段(Fiil,N.P.“从两个不同但 紧密相关的mRNA合成黑曲霉的葡糖淀粉酶G1和G2”EMBO J.3(5), 1097-1102(1984)登录号P04064)的蛋白。编码该葡糖淀粉酶的玉米优 化核酸具有SEQ ID NO:59的序列,该蛋白靶向内质网。

如实施例14所述将玉米粒研磨成粉。然后制备含有20g玉米粉, 23ml去离子水和6.0ml backset(8%重量固体)的混合物。加入氢氧化 铵调整pH为6.O。向混合物中加入下述:蛋白酶(0.60ml 1000倍稀 释的市售蛋白酶),0.2mg Lactocide & urea(0.85ml 10倍稀释的50% Urea Liquor)。在含有混合物的100ml瓶子的瓶盖上挖一个洞作为 CO2通道。然后用酵母(1.44ml)接种该浆状物并在90F水浴中孵育。 发酵24小时后,温度降到86F;48h时设为82F。

接种的酵母如实施例14所述进行繁殖。

如实施例14所述取出样品然后用实施例14所述方法分析。

实施例39

发酵表达黑曲霉葡糖淀粉酶和玉米(Zea mays)淀粉酶的玉米中 的粗淀粉的实施例

从按实施例28所述制备的转基因植物收获转基因玉米粒。该玉米 粒表达含有黑曲霉葡糖淀粉酶的活性片段(Fiil,N.P.“Glucoamylases 从两个不同但紧密相关的mRNA合成黑曲霉的葡糖淀粉酶G1和G2” EMBO J.3(5),1097-1102(1984)登录号P04064)的蛋白(SEQ ID NO: 59,玉米优化核酸),该蛋白靶向内质网。该玉米粒还表达带有粗淀粉 结合域的玉米淀粉酶,如实施例28所述。

如实施例14所述将玉米粒研磨成粉。然后制备含有20g玉米粉, 23ml去离子水和6.0ml backset(8%重量固体)的浆状物。加入氢氧化 铵调整pH为6.0。向浆状物中加入下述成分:蛋白酶(0.60ml 1000 倍稀释的市售蛋白酶),0.2mg Lactocide & urea(0.85ml 10倍稀释的 50%Urea Liquor)。在含有浆状物的100ml瓶子的瓶盖上挖一个洞作 为CO2通道。然后用酵母(1.44ml)接种该浆状物并在90F水浴中孵育。 发酵24小时后,温度降到86F;48h时设为82F。

接种的酵母如实施例14所述进行繁殖。

如实施例14所述取出样品然后用实施例14所述方法分析。

实施例39

发酵表达热解糖热厌氧杆菌葡糖淀粉酶和大麦淀粉酶的玉米中的 粗淀粉的实施例

从按实施例28所述制备的转基因植物收获转基因玉米粒。该玉米 粒表达含有热解糖热厌氧杆菌葡糖淀粉酶(SEQ ID NO:47)活性片 段的蛋白,该蛋白靶向内质网。该玉米粒还表达低pI大麦淀粉酶amy1 基因(Rogers,J.C.和Milliman,C.“分离并序列分析大麦α-淀粉酶 cDNA克隆”J.Biol.Chem.258(13),8169-8174(1983)),该基因被修 饰以使蛋白表达靶向内质网。

如实施例14所述将玉米粒研磨成粉。然后制备含有20g玉米粉, 23ml去离子水和6.0ml backset(8%重量固体)的浆状物。加入氢氧化 铵调整pH为6.0。向浆状物中加入下述在成分:蛋白酶(0.60ml 1000 倍稀释的市售蛋白酶),0.2mg Lactocide & urea(0.85ml 10倍稀释的 50%Urea Liquor)。在含有浆状物的100ml瓶子的瓶盖上挖一个洞作 为CO2通道。然后用酵母(1.44ml)接种该浆状物并在90F水浴中孵育。 发酵24小时后,温度降到86F;48h时设为82F。

接种的酵母如实施例14所述进行繁殖。

如实施例14所述取出样品然后用实施例14所述方法分析。

实施例40

发酵表达热解糖热厌氧杆菌葡糖淀粉酶和大麦淀粉酶的玉米的完 整玉米粒内粗淀粉的实施例

从按实施例28所述制备的转基因植物收获转基因玉米粒。该玉米 粒表达含有热解糖热厌氧杆菌葡糖淀粉酶(SEQ ID NO:47)活性片 段的蛋白,该蛋白靶向内质网。该玉米粒还表达低pI大麦淀粉酶amy1 基因(Rogers,J.C.和Milliman,C.“分离并序列分析大麦α-淀粉酶 cDNA克隆”J.Biol.Chem.258(13),8169-8174(1983)),该基因被修 饰以使蛋白表达靶向内质网。

将玉米粒与20g玉米粉,23ml去离子水和6.0ml backset(8%重量 固体)相接触。加入氢氧化铵调整pH为6.0。向混合物中加入下述成 分:蛋白酶(0.60ml 1000倍稀释的市售蛋白酶),0.2mg Lactocide & urea(0.85ml 10倍稀释的50%Urea Liquor)。在含有混合物的100ml 瓶子的瓶盖上挖一个洞作为CO2通道。然后用酵母(1.44ml)接种该混 合物并在90F水浴中孵育。发酵24小时后,温度降到86F;48h时设 为82F。

接种的酵母如实施例14所述进行繁殖。

如实施例14所述取出样品然后用实施例14所述方法分析。

实施例41

发酵表达α-淀粉酶和葡糖淀粉酶融合物的玉米中的粗淀粉的实施例

从按实施例28所述制备的转基因植物收获转基因玉米粒。该玉米 粒表达例如SEQ ID NO:46提供的玉米优化多核苷酸,该多核苷酸 编码α-淀粉酶和葡糖淀粉酶融合物如SEQ ID NO:45,其靶向内质网。

如实施例14所述将玉米粒研磨成粉。然后制备含有20g玉米粉, 23ml去离子水和6.0ml backset(8%重量固体)的浆状物。加入氢氧化 铵调整pH为6.0。向浆状物中加入下述成分:蛋白酶(0.60ml 1000 倍稀释的市售蛋白酶),0.2mg Lactocide & urea(0.85ml 10倍稀释的 50%Urea Liquor)。在含有浆状物的100ml瓶子的瓶盖上挖一个洞作 为CO2通道。然后用酵母(1.44ml)接种该浆状物并在90F水浴中孵育。 发酵24小时后,温度降到86F;48h时设为82F。

接种的酵母如实施例14所述进行繁殖。

如实施例14所述取出样品然后用实施例14所述方法分析。

所有出版物,专利和专利申请均并入此处作为参考。根据上面的 说明书,本发明已经通过一些优选实施方案描述了本发明,许多详细 描述只是为了举例说明本发明,本领域技术人员均可理解:本发明是 容许其它实施方案的,并且这里所述的一些细节可以在不背离本发明 基本原则的情况下被相当大地改变。

797GL3α-淀粉酶氨基酸序列(SEQ ID NO:1)

MAKYLELEEGGVIMQAFYWDVPSGGIWWDTIRQKIPEWYDAGISAIWIPPASKGMSGGYSM

GYDPYDYFDLGEYYQKGTVETRFGSKQELINMINTAHAYGIKVIADIVINHRAGGDLEWNPF

VGDYTWTDFSKVASGKYTANYLDFHPNELHAGDSGTFGGYPDICHDKSWDQYWLWASQES

YAAYLRSIGIDAWRFDYVKGYGAWVVKDWLNWWGGWAVGEYWDTNVDALLNWAYSSG

AKVFDFPLYYKMDAAFDNKNIPALVEALKNGGTVVSRDPFKVTFVANHDTDIIWNKYPAY

AFILTYEGQPTIFYRDYEEWLNKDKLKNLIWIHDNLAGGSTSIVYYDSDEMIFVRNGYGSKPG

LITYINLGSSKVGRWVYVPKFAGACIHEYTGNLGGWVDKYVYSSGWVYLEAPAYDPANGQ

YGYSVWSYCGVG

797GL3α-淀粉酶玉米优化核酸序列(SEQ ID NO:2)

ATGGCCAAGTACCTGGAGCTGGAGGAGGGCGGCGTGATCATGCAGGCGTTCTACTGGGA

CGTCCCGAGCGGAGGCATCTGGTGGGACACCATCCGCCAGAAGATCCCCGAGTGGTACG

ACGCCGGCATCTCCGCGATCTGGATACCGCCAGCTTCCAAGGGCATGTCCGGGGGCTACT

CGATGGGCTACGACCCGTACGACTACTTCGACCTCGGCGAGTACTACCAGAAGGGCACG

GTGGAGACGCGCTTCGGGTCCAAGCAGGAGCTCATCAACATGATCAACACGGCGCACGC

CTACGGCATCAAGGTCATCGCGGACATCGTGATCAACCACAGGGCCGGCGGCGACCTGG

AGTGGAACCCGTTCGTCGGCGACTACACCTGGACGGACTTCTCCAAGGTCGCCTCCGGCA

AGTACACCGCCAACTACCTCGACTTCCACCCCAACGAGCTGCACGCGGGCGACTCCGGC

ACGTTCGGCGGCTACCCGGACATCTGCCACGACAAGTCCTGGGACCAGTACTGGCTCTGG

GCCTCGCAGGAGTCCTACGCGGCCTACCTGCGCTCCATCGGCATCGACGCGTGGCGCTTC

GACTACGTCAAGGGCTACGGGGCCTGGGTGGTCAAGGACTGGCTCAACTGGTGGGGCGG

CTGGGCGGTGGGCGAGTACTGGGACACCAACGTCGACGCGCTGCTCAACTGGGCCTACT

CCTCCGGCGCCAAGGTGTTCGACTTCCCCCTGTACTACAAGATGGACGCGGCCTTCGACA

ACAAGAACATCCCGGCGCTCGTCGAGGCCCTGAAGAACGGCGGCACGGTGGTCTCCCGC

GACCCGTTCAAGGCCGTGACCTTCGTCGCCAACCACGACACGGACATCATCTGGAACAA

GTACCCGGCGTACGCCTTCATCCTCACCTACGAGGGCCAGCCCACGATCTTCTACCGCGA

CTACGAGGAGTGGCTGAACAAGGACAAGCTCAAGAACCTGATCTGGATTCACGACAACC

TCGCGGGCGGCTCCACTAGTATCGTGTACTACGACTCCGACGAGATGATCTTCGTCCGCA

ACGGCTACGGCTCCAAGCCCGGCCTGATCACGTACATCAACCTGGGCTCCTCCAAGGTGG

GCCGCTGGGTGTACGTCCCGAAGTTCGCCGGCGCGTGCATCCACGAGTACACCGGCAAC

CTCGGCGGCTGGGTGGACAAGTACGTGTACTCCTCCGGCTGGGTCTACCTGGAGGCCCCG

GCCTACGACCCCGCCAACGGCCAGTACGGCTACTCCGTGTGGTCCTACTGCGGCGTCGGC

6gp3支链淀粉酶氨基酸序列(SEQ ID NO:3)

MGHWYKHQRAYQFTGEDDFGKVAVVKLPMDLTKVGIIVRLNEWQAKDVAKDRFIEIKDGK

AEVWILQGVEEIFYEKPDTSPRIFFAQARSNKVIEAFLTNPVDTKKKELFKVTVDGKEIPVSRV

EKADPTDIDVTNYVRIVLSESLKEEDLRKDVELIIEGYKPARVIMMEILDDYYYDGELGAVYS

PEKTIFRVWSPVSKWVKVLLFKNGEDTEPYQVVNMEYKGNGVWEAVVEGDLDGVFYLYQL

ENYGKIRTTVDPYSKAVYANNQESAVVNLARTNPEGWENDRGPKIEGYEDAIIYEIHIADITG

LENSGVKNKGLYLGLTEENTKGPGGVTTGLSHLVELGVTHVHILPFFDFYTGDELDKDFEKY

YNWGYDPYLFMVPEGRYSTDPKNPHTRIREVKEMVKALHKHGIGVIMDMVFPHTYGIGELS

AFDQTVPYYFYRIDKTGAYLNESGCGNVIASERPMMRKFIVDTVTYWVKEYHIDGFRFDQM

GLIDKKTMLEVERALHKIDPTIILYGEPWGGWGAPIRFGKSDVAGTHVAAFNDEFRDAIRGSV

FNPSVKGFVMGGYGKETKIKRGVVGSINYDGKLIKSFALDPEETINYAACHDNHTLWDKNY

LAAKADKKKWTEEELKNAQKLAGAILLTSQGVPFLHGGQDFCRTTNFNDNSYNAPISINGF

DYERKLQFIDVFNYHKGLIKLRKEHPAFRLKNAEEIKKHLEFLPGGRRIVAFMLKDHAGGDP

WKDIVVIYNGNLEKTTYKLPEGKWNVVVNSQKAGTEVIETVEGTIELDPLSAYVLYRE

6gp3支链淀粉酶玉米优化核酸序列(SEQ ID NO:4)

ATGGGCCACTGGTACAAGCACCAGCGCGCCTACCAGTTCACCGGCGAGGACGACTTCGG

GAAGGTGGCCGTGGTGAAGCTCCCGATGGACCTCACCAAGGTGGGCATCATCGTGCGCC

TCAACGAGTGGCAGGCGAAGGACGTGGCCAAGGACCGCTTCATCGAGATCAAGGACGGC

AAGGCCGAGGTGTGGATACTCCAGGGCGTGGAGGAGATCTTCTACGAGAAGCCGGACAC

CTCCCCGCGCATCTTCTTCGCCCAGGCCCGCTCCAACAAGGTGATCGAGGCCTTCCTCAC

CAACCCGGTGGACACCAAGAAGAAGGAGCTGTTCAAGGTGACCGTCGACGGCAAGGAG

ATCCCGGTGTCCCGCGTGGAGAAGGCCGACCCGACCGACATCGACGTGACCAACTACGT

GCGCATCGTGCTCTCCGAGTCCCTCAAGGAGGAGGACCTCCGCAAGGACGTGGAGCTGA

TCATCGAGGGCTACAAGCCGGCCCGCGTGATCATGATGGAGATCCTCGACGACTACTACT

ACGACGGCGAGCTGGGGGCGGTGTACTCCCCGGAGAAGACCATCTTCCGCGTGTGGTCC

CCGGTGTCCAAGTGGGTGAAGGTGCTCCTCTTCAAGAACGGCGAGGACACCGAGCCGTA

CCAGGTGGTGAACATGGAGTACAAGGGCAACGGCGTGTGGGAGGCCGTGGTGGAGGGC

GACCTCGACGGCGTGTTCTACCTCTACCAGCTGGAGAACTACGGCAAGATCCGCACCACC

GTGGACCCGTACTCCAAGGCCGTGTACGCCAACAACCAGGAGTCTGCAGTGGTGAACCT

CGCCCGCACCAACCCGGAGGGCTGGGAGAACGACCGCGGCCCGAAGATCGAGGGCTAC

GAGGACGCCATCATCTACGAGATCCACATCGCCGACATCACCGGCCTGGAGAACTCCGG

CGTGAAGAACAAGGGCCTCTACCTCGGCCTCACCGAGGAGAACACCAAGGCCCCGGGCG

GCGTGACCACCGGCCTCTCCCACCTCGTGGAGCTGGGCGTGACCCACGTGCACATCCTCC

CGTTCTTCGACTTCTACACCGGCGACGAGCTGGACAAGGACTTCGAGAAGTACTACAACT

GGGGCTACGACCCGTACCTCTTCATGGTGCCGGAGGGCCGCTACTCCACCGACCCGAAG

AACCCGCACACCCGAATTCGCGAGGTGAAGGAGATGGTGAAGGCCCTCCACAAGCACGG

CATCGGCGTGATCATGGACATGGTGTTCCCGCACACCTACGGCATCGGCGAGCTGTCCGC

CTTCGACCAGACCGTGCCGTACTACTTCTACCGCATCGACAAGACCGGCGCCTACCTCAA

CGAGTCCGGCTGCGGCAACGTGATCGCCTCCGAGCGCCCGATGATGCGCAAGTTCATCGT

GGACACCGTGACCTACTGGGTGAAGGAGTACCACATCGACGGCTTCCGCTTCGACCAGA

TGGGCCTCATCGACAAGAAGACCATGCTGGAGGTGGAGCGCGCCCTCCACAAGATCGAC

CCGACCATCATCCTCTACGGCGAGCCGTGGGGCGGCTGGGGGGCCCCGATCCGCTTCGG

CAAGTCCGACGTGGCCGGCACCCACGTGGCCGCCTTCAACGACGAGTTCCGCGACGCCA

TCCGCGGCTCCGTGTTCAACCCGTCCGTGAAGGGCTTCGTGATGGGCGGCTACGGCAAGG

AGACCAAGATCAAGCGCGGCGTGGTGGGCTCCATCAACTACGACGGCAAGCTCATCAAG

TCCTTCGCCCTCGACCCGGAGGAGACCATCAACTACGCCGCCTGCCACGACAACCACACC

CTCTGGGACAAGAACTACCTCGCCGCCAAGGCCGACAAGAAGAAGGAGTGGACCGAGG

AGGAGCTGAAGAACGCCCAGAAGCTCGCCGGCGCCATCCTCCTCACTAGTCAGGGCGTG

CCGTTCCTCCACGGCGGCCAGGACTTCTGCCGCACCACCAACTTCAACGACAACTCCTAC

AACGCCCCGATCTCCATCAACGGCTTCGACTACGAGCGCAAGCTCCAGTTCATCGACGTG

TTCAACTACCACAAGGGCCTCATCAAGCTCCGCAAGGAGCACCCGGCCTTCCGCCTCAAG

AACGCCGAGGAGATCAAGAAGCACCTGGAGTTCCTCCCGGGCGGGCGCCGCATCGTGGC

CTTCATGCTCAAGGACCACGCCGGCGGCGACCCGTGGAAGGACATCGTGGTGATCTACA

ACGGCAACCTGGAGAAGACCACCTACAAGCTCCCGGAGGGCAAGTGGAACGTGGTGGTG

AACTCCCAGAAGGCCGGCACCGAGGTGATCGAGACCGTGGAGGGCACCATCGAGCTGGA

CCCGCTCTCCGCCTACGTGCTCTACCGCGAG

硫磺矿硫化叶菌malAα-葡糖苷酶氨基酸序列(SEQ ID NO:5)

METIKIYENKGVYKVVIGEPFPPIEFPLEQKISSNKSLSELGLTIVQQGNKVIVEKSLDLKEHIIG

LGEKAFELDRKRKRYVMYNVDAGAYKKYQDPLYVSIPLFISVKDGVATGYFFNSASKVIFDV

GLEEYDKVIVTIPEDSVEFYVIEGPRIEDVLEKYTELTGKPFLPPMWAFGYMISRYSYYPQDK

VVELVDIMQKEGFRVAGVFLDIHYMDSYKLFTWHPYRFPEPKKLIDELHKRNVKLITIVDHGI

RVDQNYSPFLSGMGKFCEIESGELFVGKMWPGTTVYPDFFREDTREWWAGLISEWLSQGVD

GIWLDMNEPTDFSRAIEIRDVLSSLPVQFRDDRLVTTFPDNVVHYLRGKRVKHEKVRNAYPL

YEAMATFKGFRTSHRNEIFILSRAGYAGIQRYAFIWTGDNTPSWDDLKLQLQLVLGLSISGVP

FVGCDIGGFQGRNFAEIDNSMDLLVKYYALALFFPFYRSHKATDGIDTEPVFLPDYYKEKVK

EIVELRYKFLPYIYSLALEASEKGHPVIRPLFYEFQDDDDMYRIEDEYMVGKYLLYAPIVSKEE

SRLVTLPRGKWYNYWNGEIINGKSVVKSTHELPIYLREGSIIPLEGDELIVYGETSFKRYDNAE

ITSSSNEIKFSREIYVSKLTITSEKPVSKIIVDDSKEIQVEKTMQNTYVAKINQKIRGKINLE

硫磺矿硫化叶菌malAα-葡糖苷酶玉米优化核酸序列(SEQ ID NO:6)

ATGGAGACCATCAAGATCTACGAGAACAAGGGCGTGTACAAGGTGGTGATCGGCGAGCC

GTTCCCGCCGATCGAGTTCCCGCTCGAGCAGAAGATCTCCTCCAACAAGTCCCTCTCCGA

GCTGGGCCTCACCATCGTGCAGCAGGGCAACAAGGTGATCGTGGAGAAGTCCCTCGACC

TCAAGGAGCACATCATCGGCCTCGGCGAGAAGGCCTTCGAGCTGGACCGCAAGCGCAAG

CGCTACGTGATGTACAACGTGGACGCCGGCGCCTACAAGAAGTACCAGGACCCGCTCTA

CGTGTCCATCCCGCTCTTCATCTCCGTGAAGGACGGCGTGGCCACCGGCTACTTCTTCAA

CTCCGCCTCCAAGGTGATCTTCGACGTGGGCCTCGAGGAGTACGACAAGGTGATCGTGA

CCATCCCGGAGGACTCCGTGGAGTTCTACGTGATCGAGGGCCCGCGCATCGAGGACGTG

CTCGAGAAGTACACCGAGCTGACCGGCAAGCCGTTCCTCCCGCCGATGTGGGCCTTCGGC

TACATGATCTCCCGCTACTCCTACTACCCGCAGGACAAGGTGGTGGAGCTGGTGGACATC

ATGCAGAAGGAGGGCTTCCGCGTGGCCGGCGTGTTCCTCGACATCCACTACATGGACTCC

TACAAGCTCTTCACCTGGCACCCGTACCGCTTCCCGGAGCCGAAGAAGCTCATCGACGAG

CTGCACAAGCGCAACGTGAAGCTCATCACCATCGTGGACCACGGCATCCGCGTGGACCA

GAACTACTCCCCGTTCCTCTCCGGCATGGGCAAGTTCTGCGAGATCGAGTCCGGCGAGCT

GTTCGTGGGCAAGATGTGGCCGGGCACCACCGTGTACCCGGACTTCTTCCGCGAGGACA

CCCGCGAGTGGTGGGCCGGCCTCATCTCCGAGTGGCTCTCCCAGGGCGTGGACGGCATCT

GGCTCGACATGAACGAGCCGACCGACTTCTCCCGCGCCATCGAGATCCGCGACGTGCTCT

CCTCCCTCCCGGTGCAGTTCCGCGACGACCGCCTCGTGACCACCTTCCCGGACAACGTGG

TGCACTACCTCCGCGGCAAGCGCGTGAAGCACGAGAAGGTGCGCAACGCCTACCCGCTC

TACGAGGCGATGGCCACCTTCAAGGGCTTCCGCACCTCCCACCGCAACGAGATCTTCATC

CTCTCCCGCGCCGGCTACGCCGGCATCCAGCGCTACGCCTTCATCTGGACCGGCGACAAC

ACCCCGTCCTGGGACGACCTCAAGCTCCAGCTCCAGCTCGTGCTCGGCCTCTCCATCTCC

GGCGTGCCGTTCGTGGGCTGCGACATCGGCGGCTTCCAGGGCCGCAACTTCGCCGAGATC

GACAACTCGATGGACCTCCTCGTGAAGTACTACGCCCTCGCCCTCTTCTTCCCGTTCTACC

GCTCCCACAAGGCCACCGACGGCATCGACACCGAGCCGGTGTTCCTCCCGGACTACTAC

AAGGAGAAGGTGAAGGAGATCGTGGAGCTGCGCTACAAGTTCCTCCCGTACATCTACTC

CCTCGCCCTCGAGGCCTCCGAGAAGGGCCACCCGGTGATCCGCCCGCTCTTCTACGAGTT

CCAGGACGACGACGACATGTACCGCATCGAGGACGAGTACATGGTGGGCAAGTACCTCC

TCTACGCCCCGATCGTGTCCAAGGAGGAGTCCCGCCTCGTGACCCTCCCGCGCGGCAAGT

GGTACAACTACTGGAACGGCGAGATCATCAACGGCAAGTCCGTGGTGAAGTCCACCCAC

GAGCTGCCGATCTACCTCCGCGAGGGCTCCATCATCCCGCTCGAGGGCGACGAGCTGATC

GTGTACGGCGAGACCTCCTTCAAGCGCTACGACAACGCCGAGATCACCTCCTCCTCCAAC

GAGATCAAGTTCTCCCGCGAGATCTACGTGTCCAAGCTCACCATCACCTCCGAGAAGCCG

GTGTCCAAGATCATCGTGGACGACTCCAAGGAGATCCAGGTGGAGAAGACCATGCAGAA

CACCTACGTGGCCAAGATCAACCAGAAGATCCGCGGCAAGATCAACCTCGAGTGA

Waxy cDNA序列(SEQ ID NO:7)

ATGGCGGCTCTGGCCACGTCGCAGCTCGTCGCAACGCGCGCCGGCCTGGGCGTCCCGGA

CGCGTCCACGTTCCGCCGCGGCGCCGCGCAGGGCCTGAGGGGGGCCCGGGCGTCGGCGG

CGGCGGACACGCTCAGCATGCGGACCAGCGCGCGCGCGGCGCCCAGGCACCAGCACCAG

CAGGCGCGCCGCGGGGCCAGGTTCCCGTCGCTCGTCGTGTGCGCCAGCGCCGGCATGAA

CGTCGTCTTCGTCGGCGCCGAGATGGCGCCGTGGAGCAAGACCGGAGGCCTCGGCGACG

TCCTCGGCGGCCTGCCGCCGGCCATGGCCGCGAACGGGCACCGTGTCATGGTCGTCTCTC

CCCGCTACGACCAGTACAAGGACGCCTGGGACACCAGCGTCGTGTCCGAGATCAAGATG

GGAGACGGGTACGAGACGGTCAGGTTCTTCCACTGCTACAAGCGCGGAGTGGACCGCGT

GTTCGTTGACCACCCACTGTTCCTGGAGAGGGTTTGGGGAAAGACCGAGGAGAAGATCT

ACGGGCCTGTCGCTGGAACGGACTACAGGGACAACCAGCTGCGGTTCAGCCTGCTATGC

CAGGCAGCACTTGAAGCTCCAAGGATCCTGAGCCTCAACAACAACCCATACTTCTCCGG

ACCATACGGGGAGGACGTCGTGTTCGTCTGCAACGACTGGCACACCGGCCCTCTCTCGTG

CTACCTCAAGAGCAACTACCAGTCCCACGGCATCTACAGGGACGCAAAGACCGCTTTCT

GCATCCACAACATCTCCTACCAGGGCCGGTTCGCCTTCTCCGACTACCCGGAGCTGAACC

TCCCCGAGAGATTCAAGTCGTCCTTCGATTTCATCGACGGCTACGAGAAGCCCGTGGAAG

GCCGGAAGATCAACTGGATGAAGGCCGGGATCCTCGAGGCCGACAGGGTCCTCACCGTC

AGCCCCTACTACGCCGAGGAGCTCATCTCCGGCATCGCCAGGGGCTGCGAGCTCGACAA

CATCATGCGCCTCACCGGCATCACCGGCATCGTCAACGGCATGGACGTCAGCGAGTGGG

ACCCCAGCAGGGACAAGTACATCGCCGTGAAGTACGACGTGTCGACGGCCGTGGAGGCC

AAGGCGCTGAACAAGGAGGCGCTGCAGGCGGAGGTCGGGCTCCCGGTGGACCGGAACA

TCCCGCTGGTGGCGTTCATCGGCAGGCTGGAAGAGCAGAAGGGCCCCGACGTCATGGCG

GCCGCCATCCCGCAGCTCATGGAGATGGTGGAGGACGTGCAGATCGTTCTGCTGGGCAC

GGGCAAGAAGAAGTTCGAGCGCATGCTCATGAGCGCCGAGGAGAAGTTCCCAGGCAAG

GTGCGCGCCGTGGTCAAGTTCAACGCGGCGCTGGCGCACCACATCATGGCCGGCGCCGA

CGTGCTCGCCGTCACCAGCCGCTTCGAGCCCTGCGGCCTCATCCAGCGCAGGGGATGCG

ATACGGAACGCCCTGCGCCTGCGCGTCCACCGGTGGACTCGTCGACACCATCATCGAAG

GCAAGACCGGGTTCCACATGGGCCGCCTCAGCGTCGACTGCAACGTCGTGGAGCCGGCG

GACGTCAAGAAGGTGGCCACCACCTTGCAGCGCGCCATCAAGGTGGTCGGCACGCCGGC

GTACGAGGAGATGGTGAGGAACTGCATGATCCAGGATCTCTCCTGGAAGGGCCCTGCCA

AGAACTGGGAGAACGTGCTGCTCAGCCTCGGGGTCGCCGGCGGCGAGCCAGGGGTTGAA

GGCGAGGAGATCGCGCCGCTCGCCAAGGAGAACGTGGCCGCGCCC

Waxy氨基酸序列(SEQ ID NO:8)

MAALATSQLVATRAGLGVPDASTFRRGAAQGLRGARASAAADTLSMRTSARAAPRHQHQQ

ARRGARFPSLVVCASAGMNVVFVGAEMAPWSKTGGLGDVLGGLPPAMAANGHRVMVVSP

RYDQYKDAWDTSVVSEIKMGDGYETVRFFHCYKRGVDRVFVDHPLFLERVWGKTEEKIYG

PVAGTDYRDNQLRFSLLCQAALEAPRILSLNNNPYFSGPYGEDVVFVCNDWHTGPLSCYLKS

NYQSHGIYRDAKTAFCIHNISYQGRFAFSDYPELNLPERFKSSFDFIDGYEKPVEGRKINWMK

AGILEADRVLTVSPYYAEELISGIARGCELDNIMRLTGITGIVNGMDVSEWDPSRDKYIAVKY

DVSTAVEAKALNKEALQAEVGLPVDRNIPLVAFIGRLEEQKGPDVMAAAIPQLMEMVEDVQ

IVLLGTGKKKFERMLMSAEEKFPGKVRAVVKFNAALAHHIMAGADVLAVTSRFEPCGLIQL

QGMRYGTPCACASTGGLVDTIIEGKTGFHMGRLSVDCNVVEPADVKKVATTLQRAIKVVGT

PAYEEMVRNCMIQDLSWKGPAKNWENVLLSLGVAGGEPGVEGEEIAPLAKENVAAP

797GL3/Waxy核酸序列(SEQ ID NO:9)

ATGGCCAAGTACCTGGAGCTGGAGGAGGGCGGCGTGATCATGCAGGCGTTCTACTGGGA

CGTCCCGAGCGGAGGCATCTGGTGGGACACCATCCGCCAGAAGATCCCCGAGTGGTACG

ACGCCGGCATCTCCGCGATCTGGATACCGCCAGCTTCCAAGGGCATGTCCGGGGGCTACT

CGATGGGCTACGACCCGTACGACTACTTCGACCTCGGCGAGTACTACCAGAAGGGCACG

GTGGAGACGCGCTTCGGGTCCAAGCAGGAGCTCATCAACATGATCAACACGGCGCACGC

CTACGGCATCAAGGTCATCGCGGACATCGTGATCAACCACAGGGCCGGCGGCGACCTGG

AGTGGAACCCGTTCGTCGGCGACTACACCTGGACGGACTTCTCCAAGGTCGCCTCCGGCA

AGTACACCGCCAACTACCTCGACTTCCACCCCAACGAGCTGCACGCGGGCGACTCCGGC

ACGTTCGGCGGCTACCCGGACATCTGCCACGACAAGTCCTGGGACCAGTACTGGCTCTGG

GCCTCGCAGGAGTCCTACGCGGCCTACCTGCGCTCCATCGGCATCGACGCGTGGCGCTTC

GACTACGTCAAGGGCTACGGGGCCTGGGTGGTCAAGGACTGGCTCAACTGGTGGGGCGG

CTGGGCGGTGGGCGAGTACTGGGACACCAACGTCGACGCGCTGCTCAACTGGGCCTACT

CCTCCGGCGCCAAGGTGTTCGACTTCCCCCTGTACTACAAGATGGACGCGGCCTTCGACA

ACAAGAACATCCCGGCGCTCGTCGAGGCCCTGAAGAACGGCGGCACGGTGGTCTCCCGC

GACCCGTTCAAGGCCGTGACCTTCGTCGCCAACCACGACACGGACATCATCTGGAACAA

GTACCCGGCGTACGCCTTCATCCTCACCTACGAGGGCCAGCCCACGATCTTCTACCGCGA

CTACGAGGAGTGGCTGAACAAGGACAAGCTCAAGAACCTGATCTGGATTCACGACAACC

TCGCGGGCGGCTCCACTAGTATCGTGTACTACGACTCCGACGAGATGATCTTCGTCCGCA

ACGGCTACGGCTCCAAGCCCGGCCTGATCACGTACATCAACCTGGGCTCCTCCAAGGTGG

GCCGCTGGGTGTACGTCCCGAAGTTCGCCGGCGCGTGCATCCACGAGTACACCGGCAAC

CTCGGCGGCTGGGTGGACAAGTACGTGTACTCCTCCGGCTGGGTCTACCTGGAGGCCCCG

GCCTACGACCCCGCCAACGGCCAGTACGGCTACTCCGTGTGGTCCTACTGCGGCGTCGGC

ACATCGATTGCTGGCATCCTCGAGGCCGACAGGGTCCTCACCGTCAGCCCCTACTACGCC

GAGGAGCTCATCTCCGGCATCGCCAGGGGCTGCGAGCTCGACAACATCATGCGCCTCAC

CGGCATCACCGGCATCGTCAACGGCATGGACGTCAGCGAGTGGGACCCCAGCAGGGACA

AGTACATCGCCGTGAAGTACGACGTGTCGACGGCCGTGGAGGCCAAGGCGCTGAACAAG

GAGGCGCTGCAGGCGGAGGTCGGGCTCCCGGTGGACCGGAACATCCCGCTGGTGGCGTT

CATCGGCAGGCTGGAAGAGCAGAAGGGCCCCGACGTCATGGCGGCCGCCATCCCGCAGC

TCATGGAGATGGTGGAGGACGTGCAGATCGTTCTGCTGGGCACGGGCAAGAAGAAGTTC

GAGCGCATGCTCATGAGCGCCGAGGAGAAGTTCCCAGGCAAGGTGCGCGCCGTGGTCAA

GTTCAACGCGGCGCTGGCGCACCACATCATGGCCGGCGCCGACGTGCTCGCCGTCACCA

GCCGCTTCGAGCCCTGCGGCCTCATCCAGCTGCAGGGGATGCGATACGGAACGCCCTGC

GCCTGCGCGTCCACCGGTGGACTCGTCGACACCATCATCGAAGGCAAGACCGGGTTCCA

CATGGGCCGCCTCAGCGTCGACTGCAACGTCGTGGAGCCGGCGGACGTCAAGAAGGTGG

CCACCACCTTGCAGCGCGCCATCAAGGTGGTCGGCACGCCGGCGTACGAGGAGATGGTG

AGGAACTGCATGATCCAGGATCTCTCCTGGAAGGGCCCTGCCAAGAACTGGGAGAACGT

GCTGCTCAGCCTCGGGGTCGCCGGCGGCGAGCCAGGGGTTGAAGGCGAGGAGATCGCGC

CGCTCGCCAAGGAGAACGTGGCCGCGCCC

797GL3/Waxy氨基酸序列(SEQ ID NO:10)

MAKYLELEEGGVIMQAFYWDVPSGGIWWDTIRQKIPEWYDAGISAIWIPPASKGMSGGYSM

GYDPYDYFDLGEYYQKGTVETRFGSKQELINMINTAHAYGIKVIADIVINHRAGGDLEWNPF

VGDYTWTDFSKVASGKYTANYLDFHPNELHAGDSGTFGGYPDICHDKSWDQYWLWASQES

YAAYLRSIGIDAWRFDYVKGYGAWVVKDWLNWWGGWAVGEYWDTNVDALLNWAYSSG

AKVFDFPLYYKMDAAFDNKNIPALVEALKNGGTVVSRDPFKAVTFVANHDTDIIWNKYPAY

AFILTYEGQPTIFYRDYEEWLNKDKLKNLIWIHDNLAGGSTSIVYYDSDEMIFVRNGYGSKPG

LITYINLGSSKVGRWVYVPKFAGACIHEYTGNLGGWVDKYVYSSGWVYLEAPAYDPANGQ

YGYSVWSYCGVGTSIAGILEADRVLTVSPYYAEELISGIARGCELDNIMRLTGITGIVNGMDV

SEWDPSRDKYIAVKYDVSTAVEAKALNKEALQAEVGLPVDRNIPLVAFIGRLEEQKGPDVM

AAAIPQLMEMVEDVQIVLLGTGKKKFERMLMSAEEKFPGKVRAVVKFNAALAHHIMAGAD

VLAVTSRFEPCGLIQLQGMRYGTPCACASTGGLVDTIIEGKTGFHMGRLSVDCNVVEPADVK

KVATTLQRAIKVVGTPAYEEMVRNCMIQDLSWKGPAKNWENVLLSLGVAGGEPGVEGEEIA

PLAKENVAAP

玉蜀黍ADP-gpp启动子核酸序列(SEQ ID NO:11)

GGAGAGCTATGAGACGTATGTCCTCAAAGCCACTTTGCATTGTGTGAAACCAATATCGAT

CTTTGTTACTTCATCATGCATGAACATTTGTGGAAACTACTAGCTTACAAGCATTAGTGA

CAGCTCAGAAAAAAGTTATCTATGAAAGGTTTCATGTGTACCGTGGGAAATGAGAAATG

TTGCCAACTCAAACACCTTCAATATGTTGTTTGCAGGCAAACTCTTCTGGAAGAAAGGTG

TCTAAAACTATGAACGGGTTACAGAAAGGTATAAACCACGGCTGTGCATTTTGGAAGTA

TCATCTATAGATGTCTGTTGAGGGGAAAGCCGTACGCCAACGTTATTTACTCAGAAACAG

CTTCAACACACAGTTGTCTGCTTTATGATGGCATCTCCACCCAGGCACCCACCATCACCT

ATCTCTCGTGCCTGTTTATTTTCTTGCCCTTTCTGATCATAAAAAAACATTAAGAGTTTGC

AAACATGCATAGGCATATCAATATGCTCATTTATTAATTTGCTAGCAGATCATCTTCCTAC

TCTTTACTTTATTTATTGTTTGAAAAATATGTCCTGCACCTAGGGAGCTCGTATACAGTAC

CAATGCATCTTCATTAAATGTGAATTTCAGAAAGGAAGTAGGAACCTATGAGAGTATTTT

TCAAAATTAATTAGCGGCTTCTATTATGTTTATAGCAAAGGCCAAGGGCAAAATTGGAAC

ACTAATGATGGTTGGTTGCATGAGTCTGTCGATTACTTGCAAGAAATGTGAACCTTTGTT

TCTGTGCGTGGGCATAAAACAAACAGCTTCTAGCCTCTTTTACGGTACTTGCACTTGCAA

GAAATGTGAACTCCTTTTCATTTCTGTATGTGGACATAATGCCAAAGCATCCAGGCTTTTT

CATGGTTGTTGATGTCTTTACACAGTTCATCTCCACCAGTATGCCCTCCTCATACTCTATA

TAAACACATCAACAGCATCGCAATTAGCCACAAGATCACTTCGGGAGGCAAGTGCGATT

TCGATCTCGCAGCCACCTTTTTTTGTTCTGTTGTAAGTATACCTTCCCTTACCATCTTTATC

TGTTAGTTTAATTTGTAATTGGGAAGTATTAGTGGAAAGAGGATGAGATGCTATCATCTA

TGTACTCTGCAAATGCATCTGACGTTATATGGGCTGCTTCATATAATTTGAATTGCTCCAT

TCTTGCCGACAATATATTGCAAGGTATATGCCTAGTTCCATCAAAAGTTCTGTTTTTTCAT

TCTAAAAGCATTTTAGTGGCACACAATTTTTGTCCATGAGGGAAAGGAAATCTGTTTTGG

TTACTTTGCTTGAGGTGCATTCTTCATATGTCCAGTTTTATGGAAGTAATAAACTTCAGTT

TGGTCATAAGATGTCATATTAAAGGGCAAACATATATTCAATGTTCAATTCATCGTAAAT

GTTCCCTTTTTGTAAAAGATTGCATACTCATTTATTTGAGTTGCAGGTGTATCTAGTAGTT

GGAGGAG

玉蜀黍γ-玉米醇溶蛋白核酸序列(SEQ ID NO:12)

GATCATCCAGGTGCAACCGTATAAGTCCTAAAGTGGTGAGGAACACGAAACAACCATGC

ATTGGCATGTAAAGCTCCAAGAATTTGTTGTATCCTTAACAACTCACAGAACATCAACCA

AAATTGCACGTCAAGGGTATTGGGTAAGAAACAATCAAACAAATCCTCTCTGTGTGCAA

AGAAACACGGTGAGTCATGCCGAGATCATACTCATCTGATATACATGCTTACAGCTCACA

AGACATTACAAACAACTCATATTGCATTACAAAGATCGTTTCATGAAAAATAAAATAGG

CCGGACAGGACAAAAATCCTTGACGTGTAAAGTAAATTTACAACAAAAAAAAAGCCATA

TGTCAAGCTAAATCTAATTCGTTTTACGTAGATCAACAACCTGTAGAAGGCAACAAAACT

GAGCCACGCAGAAGTACAGAATGATTCCAGATGAACCATCGACGTGCTACGTAAAGAGA

GTGACGAGTCATATACATTTGGCAAGAAACCATGAAGCTGCCTACAGCCGTCTCGGTGG

CATAAGAACACAAGAAATTGTGTTAATTAATCAAAGCTATAAATAACGCTCGCATGCCT

GTGCACTTCTCCATCACCACCACTGGGTCTTCAGACCATTAGCTTTATCTACTCCAGAGCG

CAGAAGAACCCGATCGACA

pNOV6200淀粉酶融合氨基酸序列(SEQ ID NO:13)

MRVLLVALALLALAASATSAKYLELEEGGVIMQAFYWDVPSGGIWWDTIRQKIPEWYDAGI

SAIWIPPASKGMSGGYSMGYDPYDYFDLGEYYQKGTVETRFGSKQELINMINTAHAYGIKVI

ADIVINHRAGGDLEWNPFVGDYTWTDFSKVASGKYTANYLDFHPNELHAGDSGTFGGYPDI

CHDKSWDQYWLWASQESYAAYLRSIGIDAWRFDYVKGYGAWVVKDWLNWWGGWAVGE

YWDTNVDALLNWAYSSGAKVFDFPLYYKMDAAFDNKNIPALVEALKNGGTVVSRDPFKAV

TFVANHDTDIIWNKYPAYAFILTYEGQPTIFYRDYEEWLNKDKLKNLIWIHDNLAGGSTSIVY

YDSDEMIFVRNGYGSKPGLITYINLGSSKVGRWVYVPKFAGACIHEYTGNLGGWVDKYVYS

SGWVYLEAPAYDPANGQYGYSVWSYCGVG

pNOV6201淀粉酶融合氨基酸序列(SEQ IE NO:14)

MRVLLVALALLALAASATSAKYLELEEGGVIMQAFYWDVPSGGIWWDTIRQKIPEWYDAGI

SAIWIPPASKGMSGGYSMGYDPYDYFDLGEYYQKGTVETRFGSKQELINMINTAHAYGIKVI

ADIVINHRAGGDLEWNPFVGDYTWTDFSKVASGKYTANYLDFHPNELHAGDSGTFGGYPDI

CHDKSWDQYWLWASQESYAAYLRSIGIDAWRFDYVKGYGAWVVKDWLNWWGGWAVGE

YWDTNVDALLNWAYSSGAKVFDFPLYYKMDAAFDNKNIPALVEALKNGGTVVSRDPFKAV

TFVANHDTDIIWNKYPAYAFILTYEGQPTIFYRDYEEWLNKDKLKNLIWIHDNLAGGSTSIVY

YDSDEMIFVRNGYGSKPGLITYINLGSSKVGRWVYVPKFAGACIHEYTGNLGGWVDKYVYS

SGWVYLEAPAYDPANGQYGYSVWSYCGVGSEKDEL

pNOV4029淀粉酶融合氨基酸序列(SEQ ID NO:15)

MLAALATSQLVATRAGLGVPDASTFRRGAAQGLRGARASAAADTLSMRTSARAAPRHQHQ

QARRGARFPSLVVCASAGAMAKYLELEEGGVIMQAFYWDVPSGGIWWDTIRQKIPEWYDA

GISAIWIPPASKGMSGGYSMGYDPYDYFDLGEYYQKGTVEIRFGSKQELINMINTAHAYGIK

VIADIVINHRAGGDLEWNPFVGDYTWTDFSKVASGKYTANYLDFHPNELHAGDSGTFGGYP

DICHDKSWDQYWLWASQESYAAYLRSIGIDAWRFDYVKGYGAWVVKDWLNWWGGWAV

GEYWDTNVDALLNWAYSSGAKVFDFPLYYKMDAAFDNKNIPALVEALKNGGTVVSRDPFK

AVTFVANHDTDIIWNKYPAYAFILTYEGQPTIFYRDYEEWLNKDKLKNLIWIHDNLAGGSTSI

VYYDSDEMIFVRNGYGSKPGLITYINLGSSKVGRWVYVPKFAGACIHEYTGNLGGWVDKYV

YSSGWVYLEAPAYDPANGQYGYSVWSYCGVGTSI

pNOV4031淀粉酶融合氨基酸序列(SEQ ID NO:16)

MLAALATSQLVATRAGLGVPDASTFRRGAAQGLRGARASAAADTLSMRTSARAAPRHQHQ

QARRGARFPSLVVCASAGAMAKYLELEEGGVIMQAFYWDVPSGGIWWDTIRQKIPEWYDA

GISAIWIPPASKGMSGGYSMGYDPYDYFDLGEYYQKGTVETRFGSKQELINMINTAHAYGIK

VIADIVINHRAGGDLEWNPFVGDYTWTDFSKVASGKYTANYLDFHPNELHAGDSGTFGGYP

DICHDKSWDQYWLWASQESYAAYLRSIGIDAWRFDYVKGYGAWVVKDWLNWWGGWAV

GEYWDTNVDALLNWAYSSGAKVFDFPLYYKMDAAFDNKNIPALVEALKNGGTVVSRDPFK

AVTFVANHDTDITWNKYPAYAFILTYEGQPTIFYRDYEEWLNKDKLKNLIWIHDNLAGGSTSI

VYYDSDEMIFVRNGYGSKPGLITYINLGSSKVGRWVYVPKFAGACIHEYTGNLGGWVDKYV

YSSGWVYLEAPAYDPANGQYGYSVWSYCGVGTSIAGILEADRVLTVSPYYAEELISGIARGC

ELDNIMRLTGITGIVNGMDVSEWDPSRDKYIAVKYDVSTAVEAKALNKEALQAEVGLPVDR

NIPLVAFIGRLEEQKGPDVMAAAIPQLMEMVEDVQIVLLGTGKKKFERMLMSAEEKFPGKVR

AVVKFNAALAHHIMAGADVLAVTSRFEPCGLIQLQGMRYGTPCACASTGGLVDTIIEGKTGF

HMGRLSVDCNVVEPADVKKVATTLQRAIKVVGTPAYEEMVRNCMIQDLSWKGPAKNWEN

VLLSLGVAGGEPGVEGEEI

APLAKENVAAP

玉米γ-玉米酶溶蛋白N-末端信号序列(SEQ ID NO:17)

(MRVLLVALALLALAASATS)

海栖热袍菌(Thermotoga maritima)葡萄糖异构酶氨基酸序列(SEQ ID NO:18)

MAEFFPEIPKIQFEGKESTNPLAFRFYDPNEVIDGKPLKDHLKFSVAFWHIFVNEGRDPFGDPT

AERPWNRFSDPMDKAFARVDALFEFCEKLNIEYFCFHDRDIAPEGKTLRETNKILDKVVERIK

ERMKDSNVKLLWGTANLFSHPRYMHGAATTCSADVFAYAAAQVKKALEITKELGGEGYVF

WGGREGYETLLNTDLGLELENLARFLRMAVEYAKKIGFTGQFLIEPKPKEPTKHQYDFDVAT

AYAFLKNHGLDEYFKFNIEANHATLAGHTFQHELRMARILGKLGSIDANQGDLLLGWDTDQ

FPTNIYDTTLAMYEVIKAGGFTKGGLNFDAKVRRASYKVEDLFIGHIAGMDTFALGFKIAYK

LAKDGVFDKFIEEKYRSFKEGIGKEIVEGKTDFEKLEEYIIDKEDIELPSGKQEYLESLLNSYIV

KTIAELR

海栖热袍菌葡萄糖异构酶玉米优化核酸序列(SEQ ID NO:19)

ATGGCCGAGTTCTTCCCGGAGATCCCGAAGATCCAGTTCGAGGGCAAGGAGTCCACCAA

CCCGCTCGCCTTCCGCTTCTACGACCCGAACGAGGTGATCGACGGCAAGCCGCTCAAGG

ACCACCTCAAGTTCTCCGTGGCCTTCTGGCACACCTTCGTGAACGAGGGCCGCGACCCGT

TCGGCGACCCGACCGCCGAGCGCCCGTGGAACCGCTTCTCCGACCCGATGGACAAGGCC

TTCGCCCGCGTGGACGCCCTCTTCGAGTTCTGCGAGAAGCTCAACATCGAGTACTTCTGC

TTCCACGACCGCGACATCGCCCCGGAGGGCAAGACCCTCCGCGAGACCAACAAGATCCT

CGACAAGGTGGTGGAGCGCATCAAGGAGCGCATGAAGGACTCCAACGTGAAGCTCCTCT

GGGGCACCGCCAACCTCTTCTCCCACCCGCGCTACATGCACGGCGCCGCCACCACCTGCT

CCGCCGACGTGTTCGCCTACGCCGCCGCCCAGGTGAAGAAGGCCCTGGAGATCACCAAG

GAGCTGGGCGGCGAGGGCTACGTGTTCTGGGGCGGCCGCGAGGGCTACGAGACCCTCCT

CAACACCGACCTCGGCCTGGAGCTGGAGAACCTCGCCCGCTTCCTCCGCATGGCCGTGGA

GTACGCCAAGAAGATCGGCTTCACCGGCCAGTTCCTCATCGAGCCGAAGCCGAAGGAGC

CGACCAAGCACCAGTACGACTTCGACGTGGCCACCGCCTACGCCTTCCTCAAGAACCAC

GGCCTCGAC

GAGTACTTCAAGTTCAACATCGAGGCCAACCACGCCACCCTCGCCGGCCACACCTTCCAG

CACGAGCTGCGCATGGCCCGCATCCTCGGCAAGCTCGGCTCCATCGACGCCAACCAGGG

CGACCTCCTCCTCGGCTGGGACACCGACCAGTTCCCGACCAACATCTACGACACCACCCT

CGCCATGTACGAGGTGATCAAGGCCGGCGGCTTCACCAAGGGCGGCCTCAACTTCGACG

CCAAGGTGCGCCGCGCCTCCTACAAGGTGGAGGACCTCTTCATCGGCCACATCGCCGGC

ATGGACACCTTCGCCCTCGGCTTCAAGATCGCCTACAAGCTCGCCAAGGACGGCGTGTTC

GACAAGTTCATCGAGGAGAAGTACCGCTCCTTCAAGGAGGGCATCGGCAAGGAGATCGT

GGAGGGCAAGACCGACTTCGAGAAGCTGGAGGAGTACATCATCGACAAGGAGGACATC

GAGCTGCCGTCCGGCAAGCAGGAGTACCTGGAGTCCCTCCTCAACTCCTACATCGTGAAG

ACCATCGCCGAGCTGCGCTGA

那不勒斯栖热袍菌(Thermotoga neapolitana)葡萄糖异构酶氨基酸序列(SEQ ID NO:20)

MAEFFPEIPKVQFEGKESTNPLAFKFYDPEEIIDGKPLKDHLKFSVAFWHTFVNEGRDPFGDPT

ADRPWNRYTDPMDKAFARVDALFEFCEKLNIEYFCFHDRDIAPEGKTLRETNKILDKVVERI

KERMKDSNVKLLWGTANLFSHPRYMHGAATTCSADVFAYAAAQVKKALEITKELGGEGYV

FWGGREGYETLLNTDLGFELENLARFLRMAVDYAKRIGFTGQFLIEPKPKEPTKHQYDFDVA

TAYAFLKSHGLDEYFKFNIEANHATLAGHTFQHELRMARILGKLGSIDANQGDLLLGWDTD

QFPTNVYDTTLAMYEVIKAGGFTKGGLNFDAKVRRASYKVEDLFIGHIAGMDTFALGFKVA 

YKLVKDGVLDKFIEEKYRSFREGIGRDIVEGKVDFEKLEEYIIDKETIELPSGKQEYLESLINSY

IVKTTLELR

那不勒斯栖热袍菌葡萄糖异构酶玉米优化核酸序列(SEQ ID NO:21)

ATGGCCGAGTTCTTCCCGGAGATCCCGAAGGTGCAGTTCGAGGGCAAGGAGTCCACCAA

CCCGCTCGCCTTCAAGTTCTACGACCCGGAGGAGATCATCGACGGCAAGCCGCTCAAGG

ACCACCTCAAGTTCTCCGTGGCCTTCTGGCACACCTTCGTGAACGAGGGCCGCGACCCGT

TCGGCGACCCGACCGCCGACCGCCCGTGGAACCGCTACACCGACCCGATGGACAAGGCC

TTCGCCCGCGTGGACGCCCTCTTCGAGTTCTGCGAGAAGCTCAACATCGAGTACTTCTGC

TTCCACGACCGCGACATCGCCCCGGAGGGCAAGACCCTCCGCGAGACCAACAAGATCCT

CGACAAGGTGGTGGAGCGCATCAAGGAGCGCATGAAGGACTCCAACGTGAAGCTCCTCT

GGGGCACCGCCAACCTCTTCTCCCACCCGCGCTACATGCACGGCGCCGCCACCACCTGCT

CCGCCGACGTGTTCGCCTACGCCGCCGCCCAGGTGAAGAAGGCCCTGGAGATCACCAAG

GAGCTGGGCGGCGAGGGCTACGTGTTCTGGGGCGGCCGCGAGGGCTACGAGACCCTCCT

CAACACCGACCTCGGCTTCGAGCTGGAGAACCTCGCCCGCTTCCTCCGCATGGCCGTGGA

CTACGCCAAGCGCATCGGCTTCACCGGCCAGTTCCTCATCGAGCCGAAGCCGAAGGAGC

CGACCAAGCACCAGTACGACTTCGACGTGGCCACCGCCTACGCCTTCCTCAAGTCCCACG

GCCTCGACGAGTACTTCAAGTTCAACATCGAGGCCAACCACGCCACCCTCGCCGGCCAC

ACCTTCCAGCACGAGCTGCGCATGGCCCGCATCCTCGGCAAGCTCGGCTCCATCGACGCC

AACCAGGGCGACCTCCTCCTCGGCTGGGACACCGACCAGTTCCCGACCAACGTGTACGA

CACCACCCTCGCCATGTACGAGGTGATCAAGGCCGGCGGCTTCACCAAGGGCGGCCTCA

ACTTCGACGCCAAGGTGCGCCGCGCCTCCTACAAGGTGGAGGACCTCTTCATCGGCCACA

TCGCCGGCATGGACACCTTCGCCCTCGGCTTCAAGGTGGCCTACAAGCTCGTGAAGGACG

GCGTGCTCGACAAGTTCATCGAGGAGAAGTACCGCTCCTTCCGCGAGGGCATCGGCCGC

GACATCGTGGAGGGCAAGGTGGACTTCGAGAAGCTGGAGGAGTACATCATCGACAAGG

AGACCATCGAGCTGCCGTCCGGCAAGCAGGAGTACCTGGAGTCCCTCATCAACTCCTAC

ATCGTGAAGACCATCCTGGAGCTGCGCTGA

SV57(SEQ ID NO:22)(5’AGCGAATTCATGGCGGCTCTGGCCACGT 3’)

SV58(SEQ ID NO:23)(5’AGCTAAGCTTCAGGGCGCGGCCACGTTCT 3’)

pNOV7005 6GP3融合氨基酸序列(SEQ ID NO:24)

MRVLLVALALLALAASATSAGHWYKHQRAYQFTGEDDFGKVAVVKLPMDLTKVGIIVRLN

EWQAKDVAKDRFIEIKDGKAEVWILQGVEEIFYEKPDTSPRIFFAQARSNKVIEAFLTNPVDT

KKKELFKVTVDGKEIPVSRVEKADPTDIDVTNYVRIVLSESLKEEDLRKDVELIIEGYKPARVI

MMEILDDYYYDGELGAVYSPEKTIFRVWSPVSKWVKVLLFKNGEDTEPYQVVNMEYKGNG

VWEAVVEGDLDGVFYLYQLENYGKIRTTVDPYSKAVYANNQESAVVNLARTNPEGWENDR

GPKIEGYEDAIIYEIHIADITGLENSGVKNKGLYLGLTEENTKAPGGVTTGLSHLVELGVTHVH

ILPFFDFYTGDELDKDFEKYYNWGYDPYLFMVPEGRYSTDPKNPHTRIREVKEMVKALHKH

GIGVIMDMVFPHTYGIGELSAFDQTVPYYFYRIDKTGAYLNESGCGNVIASERPMMRKFIVDT

VTYWVKEYHIDGFRFDQMGLIDKKTMLEVERALHKIDPTIILYGEPWGGWGAPIRFGKSDVA

GTHVAAFNDEFRDAIRGSVFNPSVKGFVMGGYGKETKIKRGVVGSINYDGKLIKSFALDPEE 

TINYAACHDNHTLWDKNYLAAKADKKKEWTEEELKNAQKLAGAILLTSQGVPFLHGGQDF

CRTTNFNDNSYNAPISINGFDYERKLQFIDVFNYHKGLIKLRKEHPAFRLKNAEEIKKHLEFLP

GGRRIVAFMLKDHAGGDPWKDIVVIYNGNLEKTTYKLPEGKWNVVVNSQKAGTEVIETVEG

TIELDPLSAYVLYRESEKDEL

pNOV7005 6GP3融合玉米优化核酸序列(SEQ ID NO:25)

ATGAGGGTGTTGCTCGTTGCCCTCGCTCTCCTGGCTCTCGCTGCGAGCGCCACCAGCGCT

GGCCACTGGTACAAGCACCAGCGCGCCTACCAGTTCACCGGCGAGGACGACTTCGGGAA

GGTGGCCGTGGTGAAGCTCCCGATGGACCTCACCAAGGTGGGCATCATCGTGCGCCTCA

ACGAGTGGCAGGCGAAGGACGTGGCCAAGGACCGCTTCATCGAGATCAAGGACGGCAA

GGCCGAGGTGTGGATACTCCAGGGCGTGGAGGAGATCTTCTACGAGAAGCCGGACACCT

CCCCGCGCATCTTCTTCGCCCAGGCCCGCTCCAACAAGGTGATCGAGGCCTTCCTCACCA

ACCCGGTGGACACCAAGAAGAAGGAGCTGTTCAAGGTGACCGTCGACGGCAAGGAGAT

CCCGGTGTCCCGCGTGGAGAAGGCCGACCCGACCGACATCGACGTGACCAACTACGTGC

GCATCGTGCTCTCCGAGTCCCTCAAGGAGGAGGACCTCCGCAAGGACGTGGAGCTGATC

ATCGAGGGCTACAAGCCGGCCCGCGTGATCATGATGGAGATCCTCGACGACTACTACTA

CGACGGCGAGCTGGGGGCGGTGTACTCCCCGGAGAAGACCATCTTCCGCGTGTGGTCCC

CGGTGTCCAAGTGGGTGAAGGTGCTCCTCTTCAAGAACGGCGAGGACACCGAGCCGTAC

CAGGTGGTGAACATGGAGTACAAGGGCAACGGCGTGTGGGAGGCCGTGGTGGAGGGCG

ACCTCGACGGCGTGTTCTACCTCTACCAGCTGGAGAACTACGGCAAGATCCGCACCACCG

TGGACCCGTACTCCAAGGCCGTGTACGCCAACAACCAGGAGTCTGCAGTGGTGAACCTC

GCCCGCACCAACCCGGAGGGCTGGGAGAACGACCGCGGCCCGAAGATCGAGGGCTACG

AGGACGCCATCATCTACGAGATCCACATCGCCGACATCACCGGCCTGGAGAACTCCGGC

GTGAAGAACAAGGGCCTCTACCTCGGCCTCACCGAGGAGAACACCAAGGCCCCGGGCGG

CGTGACCACCGGCCTCTCCCACCTCGTGGAGCTGGGCGTGACCCACGTGCACATCCTCCC

GTTCTTCGACTTCTACACCGGCGACGAGCTGGACAAGGACTTCGAGAAGTACTACAACTG

GGGCTACGACCCGTACCTCTTCATGGTGCCGGAGGGCCGCTACTCCACCGACCCGAAGA

ACCCGCACACCCGAATTCGCGAGGTGAAGGAGATGGTGAAGGCCCTCCACAAGCACGGC

ATCGGCGTGATCATGGACATGGTGTTCCCGCACACCTACGGCATCGGCGAGCTGTCCGCC

TTCGACCAGACCGTGCCGTACTACTTCTACCGCATCGACAAGACCGGCGCCTACCTCAAC

GAGTCCGGCTGCGGCAACGTGATCGCCTCCGAGCGCCCGATGATGCGCAAGTTCATCGT

GGACACCGTGACCTACTGGGTGAAGGAGTACCACATCGACGGCTTCCGCTTCGACCAGA

TGGGCCTCATCGACAAGAAGACCATGCTGGAGGTGGAGCGCGCCCTCCACAAGATCGAC

CCGACCATCATCCTCTACGGCGAGCCGTGGGGCGGCTGGGGGGCCCCGATCCGCTTCGG

CAAGTCCGACGTGGCCGGCACCCACGTGGCCGCCTTCAACGACGAGTTCCGCGACGCCA

TCCGCGGCTCCGTGTTCAACCCGTCCGTGAAGGGCTTCGTGATGGGCGGCTACGGCAAGG

AGACCAAGATCAAGCGCGGCGTGGTGGGCTCCATCAACTACGACGGCAAGCTCATCAAG

TCCTTCGCCCTCGACCCGGAGGAGACCATCAACTACGCCGCCTGCCACGACAACCACACC

CTCTGGGACAAGAACTACCTCGCCGCC

AAGGCCGACAAGAAGAAGGAGTGGACCGAGGAGGAGCTGAAGAACGCCCAGAAGCTCG

CCGGCGCCATCCTCCTCACTAGTCAGGGCGTGCCGTTCCTCCACGGCGGCCAGGACTTCT

GCCGCACCACCAACTTCAACGACAACTCCTACAACGCCCCGATCTCCATCAACGGCTTCG

ACTACGAGCGCAAGCTCCAGTTCATCGACGTGTTCAACTACCACAAGGGCCTCATCAAGC

TCCGCAAGGAGCACCCGGCCTTCCGCCTCAAGAACGCCGAGGAGATCAAGAAGCACCTG

GAGTTCCTCCCGGGCGGGCGCCGCATCGTGGCCTTCATGCTCAAGGACCACGCCGGCGG

CGACCCGTGGAAGGACATCGTGGTGATCTACAACGGCAACCTGGAGAAGACCACCTACA

AGCTCCCGGAGGGCAAGTGGAACGTGGTGGTGAACTCCCAGAAGGCCGGCACCGAGGTG

ATCGAGACCGTGGAGGGCACCATCGAGCTGGACCCGCTCTCCGCCTACGTGCTCTACCGC

GAGTCCGAGAAGGACGAGCTGTGA

pNOV4831malA融合氨基酸序列(SEQ ID NO:26)

MRVLLVALALLALAASATSMETIKIYENKGVYKVVIGEPFPPIEFPLEQKISSNKSLSELGLTIV

QQGNKVIVEKSLDLKEHIIGLGEKAFELDRKRKRYVMYNVDAGAYKKYQDPLYVSIPLFISV

KDGVATGYFFNSASKVIFDVGLEEYDKVIVTIPEDSVEFYVIEGPRIEDVLEKUTELTGKPFLPP

MWAFGYMISRYSYYPQDKVVELVDIMQKEGFRVAGVFLDIHYMDSYKLFTWHPYRFPEPK

KLIDELHKRNVKLITIVDHGIRVDQNYSPFLSGMGKFCEIESGELFVGKMWPGTTVYPDFFRE

DTREWWAGLISEWLSQGVDGIWLDMNEPTDFSRAIEIRDVLSSLPVQFRDDRLVTTFPDNVV

HYLRGKRVKHEKVRNAYPLYEAMATFKGFRTSHRNEIFILSRAGYAGIQRYAFIWTGDNTPS

WDDLKLQLQLVLGLSISGVPFVGCDIGGFQGRNFAEIDNSMDLLVKYYALALFFPFYRSHKA

TDGIDTEPVFLPDYYKEKVKEIVELRYKFLPYIYSLALEASEKGHPVIRPLFYEFQDDDDMYRI

EDEYMVGKYLLYAPIVSKEESRLVTLPRGKWYNYWNGEIINGKSVVKSTHELPIYLREGSIIP

LEGDELIVYGETSFKRYDNAEITSSSNEIKFSREYVSKLTTTSEKPVSKIIVDDSKEIQVEKTMQ

NTYVAKINQKIRGKINLESEKDEL

pNOV4839malA融合氨基酸序列(SEQ ID NO:27)

MRVLLVALALLALAASATSMETIKIYENKGVYKVVIGEPFPPIEFPLEQKISSNKSLSELGLTIV

QQGNKVIVEKSLDLKEHIIGLGEKAFELDRKRKRYVMYNVDAGAYKKYQDPLYVSIPLFISV

KDGVATGYFFNSASKVIFDVGLEEYDKVIVTIPEDSVEFYVIEGPRIEDVLEKYTELTGKPFLPP

MWAFGYMISRYSYYPQDKVVELVDIMQKEGFRVAGVFLDIHYMDSYKLFTWHPYRFPEPK

KLIDELHKRNVKLITIVDHGIRVDQNYSPFLSGMGKFCEIESGELFVGKMWPGTTVYPDFFRE

DTREWWAGLISEWLSQGVDGIWLDMNEPTDFSRAIEIRDVLSSLPVQFRDDRLVTTFPDNVV

HYLRGKRVKHEKVRNAYPLYEAMATFKGFRTSHRNEIFILSRAGYAGIQRYAFIWTGDNTPS

WDDLKLQLQLVLGLSISGVPFVGCDIGGFQGRNFAEIDNSMDLLVKYYALALFFPFYRSHKA

TDGIDTEPVFLPDYYKEKVKEIVELRYKFLPYIYSLALEASEKGHPVIRPLFYEFQDDDDMYRI

EDEYMVGKYLLYAPIVSKEESRLVTLPRGKWYNYWNGEIINGKSVVKSTHELPIYLREGSIIP

LEGDELIVYGETSFKRYDNAEITSSSNEIKFSREIYVSKLTITSEKPVSKIIVDDSKEIQVEKTMQ

NTYVAKINQKIRGKINLE

pNOV4832葡萄糖异构酶融合氨基酸序列(SEQ ID NO:28)

MRVLLVALALLALAASATSMAEFFPEIPKIQFEGKESTNPLAFRFYDPNEVIDGKPLKDHLKFS

VAFWHTFVNEGRDPFGDPTAERPWNRFSDPMDKAFARVDALFEFCEKLNIEYFCFHDRDIAP

EGKTLRETNKILDKVVERIKERMKDSNVKLLWGTANLFSHPRYMHGAATTCSADVFAYAAA

QVKKALEITKELGGEGYVFWGGREGYETLLNTDLGLELENLARFLRMAVEYAKKIGFTGQF

LIEPKPKEPTKHQYDFDVATAYAFLKNHGLDEYFKFNIEANHATLAGHTFQHELRMARILGK

LGSIDANQGDLLLGWDTDQFPTNIYDTTLAMYEVIKAGGFTKGGLNFDAKVRRASYKVEDL

FIGHIAGMDTFALGFKIAYKLAKDGVFDKFIEEKYRSFKEGIGKEIVEGKTDFEKLEEYIIDKE

DIELPSGKQEYLESLLNSYIVKTIAELRSEKDEL

pNOV4833葡萄糖异构酶融合氨基酸序列(SEQ ID NO:29)

MRVLLVALALLALAASATSMAEFFPEIPKVQFEGKESTNPLAFKFYDPEEIIDGKPLKDHLKFS

VAFWHTFVNEGRDPFGDPTADRPWNRYTDPMDKAFARVDALFEFCEKLNIEYFCFHDRDIA

PEGKTLRETNKILDKVVERIKERMKDSNVKLLWGTANLFSHPRYMHGAATTCSADVFAYAA

AQVKKALEITKELGGEGYVFWGGREGYETLLNTDLGFELENLARFLRMAVDYAKRIGFTGQ

FLIEPKPKEPTKHQYDFDVATAYAFLKSHGLDEYFKFNIEANHATLAGHTFQHELRMARILG

KLGSIDANQGDLLLGWDTDQFPTNVYDTTLAMYEVIKAGGFTKGGLNFDAKVRRASYKVE

DLFIGHIAGMDTFALGFKVAYKLVKDGVLDKFIEEKYRSFREGIGRDIVEGKVDFEKLEEYIID

KETIELPSGKQEYLESLINSYIVKTILELRSEKDEL

pNOV4840葡萄糖异构酶融合氨基酸序列(SEQ ID NO:30)

MRVLLVALALLALAASATSMAEFFPEIPKVQFEGKESTNPLAFKFYDPEEIIDGKPLKDHLKFS

VAFWHTFVNEGRDPFGDPTADRPWNRYTDPMDKAFARVDALFEFCEKLNIEYFCFHDRDIA

PEGKTLRETNKILDKVVERIKERMKDSNVKLLWGTANLFSHPRYMHGAATTCSADVFAYAA

AQVKKALEITKELGGEGYVFWGGREGYETLLNTDLGFELENLARFLRMAVDYAKRIGFTGQ

FLIEPKPKEPTKHQYDFDVATAYAFLKSHGLDEYFKFNIEANHATLAGHTFQHELRMARILG

KLGSIDANQGDLLLGWDTDQFPTNVYDTTLAMYEVIKAGGFTKGGLNFDAKVRRASYKVE

DLFIGHIAGMDTFALGFKVAYKLVKDGVLDKFIEEKYRSFREGIGRDIVEGKVDFEKLEEYIID

KETIELPSGKQEYLESLINSYIVKTILELR

大麦α淀粉酶AMY32b信号序列(SEQ ID NO:31)

(MGKNGNLCCFSLLLLLAGLASGHQ)

PR1a信号序列(SEQ ID NO:32)

(MGFVLFSQLPSFLLVSTLLLFLVISHSCRA)

797GL3融合物(SEQ ID NO:33)

MRVLLVALALLALAASATSAKYLELEEGGVIMQAFYWDVPSGGIWWDTIRQKIPEWYDAGI

SAIWIPPASKGMSGGYSMGYDPYDYFDLGEYYQKGTVETRFGSKQELINMINTAHAYGIKVI

ADIVINHRAGGDLEWNPFVGDYTWTDFSKVASGKYTANYLDFHPNELHAGDSGTFGGYPDI

CHDKSWDQYWLWASQESYAAYLRSIGIDAWRFDYVKGYGAWVVKDWLNWWGGWAVGE

YWDTNVDALLNWAYSSGAKVFDFPLYYKMDAAFDNKNIPALVEALKNGGTVVSRDPFKAV

TFVANHDTDIIWNKYPAYAFILTYEGQPTIFYRDYEEWLNKDKLKNLIWIHDNLAGGSTSIVY

YDSDEMIFVRNGYGSKPGLITYINLGSSKVGRWVYVPKFAGACIHEYTGNLGGWVDKYVYS

SGWVYLEAPAYDPANGQYGYSVWSYCGVGSEKDEL

6GP3融合物(SEQ ID NO:34)

MRVLLVALALLALAASATSAGHWYKHQRAYQFTGEDDFGKVAVVKLPMDLTKVGIIVRLN

EWQAKDVAKDRFIEIKDGKAEVWILQGVEEIFYEKPDTSPRIFFAQARSNKVIEAFLTNPVDT

KKKELFKVTVDGKEIPVSRVEKADPTDIDVTNYVRIVLSESLKEEDLRKDVELIIEGYKPARVI

MMEILDDYYYDGELGAVYSPEKTIFRVWSPVSKWVKVLLFKNGEDTEPYQVVNMEYKGNG

VWEAVVEGDLDGVFYLYQLENYGKIRTTVDPYSKAVYANNQESAVVNLARTNPEGWENDR

GPKIEGYEDAIIYEIHIADITGLENSGVKNKGLYLGLTEENTKAPGGVTTGLSHLVELGVTHVH

ILPFFDFYTGDELDKDFEKYYNWGYDPYLFMVPEGRYSTDPKNPHTRIREVKEMVKALHKH

GIGVIMDMVFPHTYGIGELSAFDQTVPYYFYRIDKTGAYLNESGCGNVIASERPMMRKFIVDT

VTYWVKEYHIDGFRFDQMGLIDKKTMLEVERALHKIDPTIILYGEPWGGWGAPIRFGKSDVA

GTHVAAFNDEFRDAIRGSVFNPSVKGFVMGGYGKETKIKRGVVGSINYDGKLIKSFALDPEE

TINYAACHDNHTLWDKNYLAAKADKKKEWTEEELKNAQKLAGAILLTSQGVPFLHGGQDF

CRTTNFNDNSYNAPISINGFDYERKLQFIDVFNYHKGLIKLRKEHPAFRLKNAEEIKKHLEFLP

GGRRIVAFMLKDHAGGDPWKDIVVIYNGNLEKTTYKLPEGKWNVVVNSQKAGTEVIETVEG

TIELDPLSAYVLYRESEKDEL

797GL3融合物(SEQ ID NO:35)

MRVLLVALALLALAASATSAKYLELEEGGVIMQAFYWDVPSGGIWWDTIRQKIPEWYDAGI

SAIWIPPASKGMSGGYSMGYDPYDYFDLGEYYQKGTVETRFGSKQELINMINTAHAYGIKVI

ADIVINHRAGGDLEWNPFVGDYTWTDFSKVASGKYTANYLDFHPNELHAGDSGTFGGYPDI

CHDKSWDQYWLWASQESYAAYLRSIGIDAWRFDYVKGYGAWVVKDWLNWWGGWAVGE

YWDTNVDALLNWAYSSGAKVFDFPLYYKMDAAFDNKNIPALVEALKNGGTVVSRDPFKAV

TFVANHDTDIIWNKYPAYAFILTYEGQPTIFYRDYEEWLNKDKLKNLIWIHDNLAGGSTSIVY

YDS DEMIFVRNGYGSKPGLITYINLGSSKVGRWVYVPKFAGACIHEYTGNLGGWVDKYVYS

SGWVYLEAPAYDPANGQYGYSVWSYCGVGSEKDEL

malA融合物(SEQ ID NO:36)

MRVLLVALALLALAASATSMETIKIYENKGVYKVVIGEPFPPIEFPLEQKISSNKSLSELGLTIV

QQGNKVIVEKSLDLKEHIIGLGEKAFELDRKRKRYVMYNVDAGAYKKYQDPLYVSIPLFISV

KDGVATGYFFNSASKVIFDVGLEEYDKVIVTIPEDSVEFYVIEGPRIEDVLEKYTELTGKPFLPP

MWAFGYMISRYSYYPQDKVVELVDIMQKEGFRVAGVFLDIHYMDSYKLFTWHPYRFPEPK

KLIDELHKRNVKLITIVDHGIRVDQNYSPFLSGMGKFCEIESGELFVGKMWPGTTVYPDFFRE

DTREWWAGLISEWLSQGVDGIWLDMNEPTDFSRAIEIRDVLSSLPVQFRDDRLVTTFPDNVV

HYLRGKRVKHEKVRNAYPLYEAMATFKGFRTSHRNEIFILSRAGYAGIQRYAFIWTGDNTPS

WDDLKLQLQLVLGLSISGVPFVGCDIGGFQGRNFAEIDNSMDLLVKYYALALFFPFYRSHKA

TDGIDTEPVFLPDYYKEKVKEIVELRYKFLPYIYSLALEASEKGHPVIRPLFYEFQDDDDMYRI

EDEYMVGKYLLYAPIVSKEESRLVTLPRGKWYNYWNGEIINGKSVVKSTHELPIYLREGSIIP

LEGDELIVYGETSFKRYDNAEITSSSNEIKFSREIYVSKLTTTSEKPVSKIIVDDSKEIQVEKTMQ

NTYVAKINQKIRGKINLESEKDEL

pNOV4829葡萄糖异构酶融合核苷酸序列(SEQ ID NO:37)

ATGAAAGAAACCGCTGCTGCTAAATTCGAACGCCAGCACATGGACAGCCCAGATCTGGG

TACCCTGGTGCCACGCGGTTCCATGGCCGAGTTCTTCCCGGAGATCCCGAAGATCCAGTT

CGAGGGCAAGGAGTCCACCAACCCGCTCGCCTTCCGCTTCTACGACCCGAACGAGGTGA

TCGACGGCAAGCCGCTCAAGGACCACCTCAAGTTCTCCGTGGCCTTCTGGCACACCTTCG

TGAACGAGGGCCGCGACCCGTTCGGCGACCCGACCGCCGAGCGCCCGTGGAACCGCTTC

TCCGACCCGATGGACAAGGCCTTCGCCCGCGTGGACGCCCTCTTCGAGTTCTGCGAGAAG

CTCAACATCGAGTACTTCTGCTTCCACGACCGCGACATCGCCCCGGAGGGCAAGACCCTC

CGCGAGACCAACAAGATCCTCGACAAGGTGGTGGAGCGCATCAAGGAGCGCATGAAGG

ACTCCAACGTGAAGCTCCTCTGGGGCACCGCCAACCTCTTCTCCCACCCGCGCTACATGC

ACGGCGCCGCCACCACCTGCTCCGCCGACGTGTTCGCCTACGCCGCCGCCCAGGTGAAG

AAGGCCCTGGAGATCACCAAGGAGCTGGGCGGCGAGGGCTACGTGTTCTGGGGCGGCCG

CGAGGGCTACGAGACCCTCCTCAACACCGACCTCGGCCTGGAGCTGGAGAACCTCGCCC

GCTTCCTCCGCATGGCCGTGGAGTACGCCAAGAAGATCGGCTTCACCGGCCAGTTCCTCA

TCGAGCCGAAGCCGAAGGAGCCGACCAAGCACCAGTACGACTTCGACGTGGCCACCGCC

TACGCCTTCCTCAAGAACCACGGCCTCGACGAGTACTTCAAGTTCAACATCGAGGCCAAC

CACGCCACCCTCGCCGGCCACACCTTCCAGCACGAGCTGCGCATGGCCCGCATCCTCGGC

AAGCTCGGCTCCATCGACGCCAACCAGGGCGACCTCCTCCTCGGCTGGGACACCGACCA

GTTCCCGACCAACATCTACGACACCACCCTCGCCATGTACGAGGTGATCAAGGCCGGCG

GCTTCACCAAGGGCGGCCTCAACTTCGACGCCAAGGTGCGCCGCGCCTCCTACAAGGTG

GAGGACCTCTTCATCGGCCACATCGCCGGCATGGACACCTTCGCCCTCGGCTTCAAGATC

GCCTACAAGCTCGCCAAGGACGGCGTGTTCGACAAGTTCATCGAGGAGAAGTACCGCTC

CTTCAAGGAGGGCATCGGCAAGGAGATCGTGGAGGGCAAGACCGACTTCGAGAAGCTG

GAGGAGTACATCATCGACAAGGAGGACATCGAGCTGCCGTCCGGCAAGCAGGAGTACCT

GGAGTCCCTCCTCAACTCCTACATCGTGAAGACCATCGCCGAGCTGCGCTCCGAGAAGG

ACGAGCTGTGA

pNOV4829葡萄糖异构酶融合氨基酸序列(SEQ ID NO:38)

MKETAAAKFERQHMDSPDLGTLVPRGSMAEFFPEIPKIQFEGKESTNPLAFRFYDPNEVIDGK

PLKDHLKFSVAFWHTFVNEGRDPFGDPTAERPWNRFSDPMDKAFARVDALFEFCEKLNIEYF

CFHDRDIAPEGKTLRETNKILDKVVERIKERMKDSNVKLLWGTANLFSHPRYMHGAATTCS

ADVFAYAAAQVKKALEITKELGGEGYVFWGGREGYETLLNTDLGLELENLARFLRMAVEY

AKKIGFTGQFLIEPKPKEPTKHQYDFDVATAYAFLKNHGLDEYFKFNIEANHATLAGHTFQH

ELRMARILGKLGSIDANQGDLLLGWDTDQFPTNIYDTTLAMYEVIKAGGFTKGGLNFDAKV

RRASYKVEDLFIGHIAGMDTFALGFKIAYKLAKDGVFDKFIEEKYRSFKEGIGKEIVEGKTDF

EKLEEYIIDKEDIELPSGKQEYLESLLNSYIVKTIAELRSEKDEL

pNOV4830葡萄糖异构酶融合核苷酸序列(SEQ ID NO:39)

ATGAAAGAAACCGCTGCTGCTAAATTCGAACGCCAGCACATGGACAGCCCAGATCTGGG

TACCCTGGTGCCACGCGGTTCCATGGCCGAGTTCTTCCCGGAGATCCCGAAGGTGCAGTT

CGAGGGCAAGGAGTCCACCAACCCGCTCGCCTTCAAGTTCTACGACCCGGAGGAGATCA

TCGACGGCAAGCCGCTCAAGGACCACCTCAAGTTCTCCGTGGCCTTCTGGCACACCTTCG

TGAACGAGGGCCGCGACCCGTTCGGCGACCCGACCGCCGACCGCCCGTGGAACCGCTAC

ACCGACCCGATGGACAAGGCCTTCGCCCGCGTGGACGCCCTCTTCGAGTTCTGCGAGAA

GCTCAACATCGAGTACTTCTGCTTCCACGACCGCGACATCGCCCCGGAGGGCAAGACCCT

CCGCGAGACCAACAAGATCCTCGACAAGGTGGTGGAGCGCATCAAGGAGCGCATGAAG

GACTCCAACGTGAAGCTCCTCTGGGGCACCGCCAACCTCTTCTCCCACCCGCGCTACATG

CACGGCGCCGCCACCACCTGCTCCGCCGACGTGTTCGCCTACGCCGCCGCCCAGGTGAAG

AAGGCCCTGGAGATCACCAAGGAGCTGGGCGGCGAGGGCTACGTGTTCTGGGGCGGCCG

CGAGGGCTACGAGACCCTCCTCAACACCGACCTCGGCTTCGAGCTGGAGAACCTCGCCC

GCTTCCTCCGCATGGCCGTGGACTACGCCAAGCGCATCGGCTTCACCGGCCAGTTCCTCA

TCGAGCCGAAGCCGAAGGAGCCGACCAAGCACCAGTACGACTTCGACGTGGCCACCGCC

TACGCCTTCCTCAAGTCCCACGGCCTCGACGAGTACTTCAAGTTCAACATCGAGGCCAAC

CACGCCACCCTCGCCGGCCACACCTTCCAGCACGAGCTGCGCATGGCCCGCATCCTCGGC

AAGCTCGGCTCCATCGACGCCAACCAGGGCGACCTCCTCCTCGGCTGGGACACCGACCA

GTTCCCGACCAACGTGTACGACACCACCCTCGCCATGTACGAGGTGATCAAGGCCGGCG

GCTTCACCAAGGGCGGCCTCAACTTCGACGCCAAGGTGCGCCGCGCCTCCTACAAGGTG

GAGGACCTCTTCATCGGCCACATCGCCGGCATGGACACCTTCGCCCTCGGCTTCAAGGTG

GCCTACAAGCTCGTGAAGGACGGCGTGCTCGACAAGTTCATCGAGGAGAAGTACCGCTC

CTTCCGCGAGGGCATCGGCCGCGACATCGTGGAGGGCAAGGTGGACTTCGAGAAGCTGG

AGGAGTACATCATCGACAAGGAGACCATCGAGCTGCCGTCCGGCAAGCAGGAGTACCTG

GAGTCCCTCATCAACTCCTACATCGTGAAGACCATCCTGGAGCTGCGCTCCGAGAAGGAC

GAGCTGTGA

pNOV4830葡萄糖异构酶融合氨基酸序列(SEQ ID NO:40)

MKETAAAKFERQHMDSPDLGTLVPRGSMAEFFPEIPKVQFEGKESTNPLAFKFYDPEEIIDGK

PLKDHLKFSVAFWHTFVNEGRDPFGDPTADRPWNRYTDPMDKAFARVDALFEFCEKLNIEY

FCFHDRDIAPEGKTLRETNKILDKVVERIKERMKDSNVKLLWGTANLFSHPRYMHGAATTCS

ADVFAYAAAQVKKALEITKELGGEGYVFWGGREGYETLLNTDLGFELENLARFLRMAVDY

AKRIGFTGQFLIEPKPKEPTKHQYDFDVATAYAFLKSHGLDEYFKFNIEANHATLAGHTFQHE

LRMARILGKLGSIDANQGDLLLGWDTDQFPTNVYDTTLAMYEVIKAGGFTKGGLNFDAKVR

RASYKVEDLFIGHIAGMDTFALGFKVAYKLVKDGVLDKFIEEKYRSFREGIGRDIVEGKVDFE

KLEEYIIDKETIELPSGKQEYLESLINSYIVKTILELRSEKDEL

pNOV4835海栖热袍菌葡萄糖异构酶融合核苷酸序列(SEQ ID NO:41)

ATGGGCAGCAGCCATCATCATCATCATCACAGCAGCGGCCTGGTGCCGCGCGGCAGCCA

TATGGCTAGCATGACTGGTGGACAGCAAATGGGTCGGATCCCCATGGCCGAGTTCTTCCC

GGAGATCCCGAAGATCCAGTTCGAGGGCAAGGAGTCCACCAACCCGCTCGCCTTCCGCT

TCTACGACCCGAACGAGGTGATCGACGGCAAGCCGCTCAAGGACCACCTCAAGTTCTCC

GTGGCCTTCTGGCACACCTTCGTGAACGAGGGCCGCGACCCGTTCGGCGACCCGACCGCC

GAGCGCCCGTGGAACCGCTTCTCCGACCCGATGGACAAGGCCTTCGCCCGCGTGGACGC

CCTCTTCGAGTTCTGCGAGAAGCTCAACATCGAGTACTTCTGCTTCCACGACCGCGACAT

CCCCCGGAGGGCAAGACCCTCCGCGAGACCAACAAGATCCTCGACAAGGTGGTGGAGCG

CATCAAGGAGCGCATGAAGGACTCCAACGTGAAGCTCCTCTGGGGCACCGCCAACCTCT

TCTCCCACCCGCGCTACATGCACGGCGCCGCCACCACCTGCTCCGCCGACGTGTTCGCCT

ACGCCGCCGCCCAGGTGAAGAAGGCCCTGGAGATCACCAAGGAGCTGGGCGGCGAGGG

CTACGTGTTCTGGGGCGGCCGCGAGGGCTACGAGACCCTCCTCAACACCGACCTCGGCCT

GGAGCTGGAGAACCTCGCCCGCTTCCTCCGCATGGCCGTGGAGTACGCCAAGAAGATCG

GCTTCACCGGCCAGTTCCTCATCGAGCCGAAGCCGAAGGAGCCGACCAAGCACCAGTAC

GCTTCGACGTGGCCACCGCCTACGCCTTCCTCAAGAACCACGGCCTCGACGAGTACTTCA

AGTTCAACATCGAGGCCAACCACGCCACCCTCGCCGGCCACACCTTCCAGCACGAGCTG

CGCATGGCCCGCATCCTCGGCAAGCTCGGCTCCATCGACGCCAACCAGGGCGACCTCCTC

CTCGGCTGGGACACCGACCAGTTCCCGACCAACATCTACGACACCACCCTCGCCATGTAC

GAGGTGATCAAGGCCGGCGGCTTCACCAAGGGCGGCCTCAACTTCGACGCCAAGGTGCG

CCGCGCCTCCTACAAGGTGGAGGACCTCTTCATCGGCCACATCGCCGGCATGGACACCTT

CGCCCTCGGCTTCAAGATCGCCTACAAGCTCGCCAAGGACGGCGTGTTCGACAAGTTCAT

CGAGGAGAAGTACCGCTCCTTCAAGGAGGGCATCGGCAAGGAGATCGTGGAGGGCAAG

ACCGACTTCGAGAAGCTGGAGGAGTACATCATCGACAAGGAGGACATCGAGCTGCCGTC

CGGCAAGCAGGAGTACCTGGAGTCCCTCCTCAACTCCTACATCGTGAAGACCATCGCCG

AGCTGCGCTGA

pNOV4835海栖热袍菌葡萄糖异构酶融合氨基酸序列(SEQ ID NO:42)

MGSSHHHHHHSSGLVPRGSHMASMTGGQQMGRIPMAEFFPEIPKIQFEGKESTNPLAFRFYD

PNEVIDGKPLKDHLKFSVAFWHTFVNEGRDPFGDPTAERPWNRFSDPMDKAFARVDALFEF

CEKLNIEYFCFHDRDIAPEGKTLRETNKILDKVVERIKERMKDSNVKLLWGTANLFSHPRYM

HGAATTCSADVFAYAAAQVKKALEITKELGGEGYVFWGGREGYETLLNTDLGLELENLARF

LRMAVEYAKKIGFTGQFLIEPKPKEPTKHQYDFDVATAYAFLKNHGLDEYFKFNIEANHATL

AGHTFQHELRMARILGKLGSIDANQGDLLLGWDTDQFPTNIYDTTLAMYEVIKAGGFTKGG

LNFDAKVRRASYKVEDLFIGHIAGMDTFALGFKIAYKLAKDGVFDKFIEEKYRSFKEGIGKEI

VEGKTDFEKLEEYIIDKEDIELPSGKQEYLESLLNSYIVKTIAELR

pNOV4836那不勒斯栖热袍菌葡萄糖异构酶融合核苷酸序列(SEQ ID NO:43)

ATGGGCAGCAGCCATCATCATCATCATCACAGCAGCGGCCTGGTGCCGCGCGGCAGCCA

TATGGCTAGCATGACTGGTGGACAGCAAATGGGTCGGATCCCCATGGCCGAGTTCTTCCC

GGAGATCCCGAAGGTGCAGTTCGAGGGCAAGGAGTCCACCAACCCGCTCGCCTTCAAGT

TCTACGACCCGGAGGAGATCATCGACGGCAAGCCGCTCAAGGACCACCTCAAGTTCTCC

GTGGCCTTCTGGCACACCTTCGTGAACGAGGGCCGCGACCCGTTCGGCGACCCGACCGCC

GACCGCCCGTGGAACCGCTACACCGACCCGATGGACAAGGCCTTCGCCCGCGTGGACGC

CCTCTTCGAGTTCTGCGAGAAGCTCAACATCGAGTACTTCTGCTTCCACGACCGCGACAT

CCCCCGGAGGGCAAGACCCTCCGCGAGACCAACAAGATCCTCGACAAGGTGGTGGAGCG

CATCAAGGAGCGCATGAAGGACTCCAACGTGAAGCTCCTCTGGGGCACCGCCAACCTCT

TCTCCCACCCGCGCTACATGCACGGCGCCGCCACCACCTGCTCCGCCGACGTGTTCGCCT

ACGCCGCCGCCCAGGTGAAGAAGGCCCTGGAGATCACCAAGGAGCTGGGCGGCGAGGG

CTACGTGTTCTGGGGCGGCCGCGAGGGCTACGAGACCCTCCTCAACACCGACCTCGGCTT

CGAGCTGGAGAACCTCGCCCGCTTCCTCCGCATGGCCGTGGACTACGCCAAGCGCATCG

GCTTCACCGGCCAGTTCCTCATCGAGCCGAAGCCGAAGGAGCCGACCAAGCACCAGTAC

GACTTCGACGTGGCCACCGCCTACGCCTTCCTCAAGTCCCACGGCCTCGACGAGTACTTC

AAGTTCAACATCGAGGCCAACCACGCCACCCTCGCCGGCCACACCTTCCAGCACGAGCT

GCGCATGGCCCGCATCCTCGGCAAGCTCGGCTCCATCGACGCCAACCAGGGCGACCTCCT

CCTCGGCTGGGACACCGACCAGTTCCCGACCAACGTGTACGACACCACCCTCGCCATGTA

CGAGGTGATCAAGGCCGGCGGCTTCACCAAGGGCGGCCTCAACTTCGACGCCAAGGTGC

GCCGCGCCTCCTACAAGGTGGAGGACCTCTTCATCGGCCACATCGCCGGCATGGACACCT

TCGCCCTCGGCTTCAAGGTGGCCTACAAGCTCGTGAAGGACGGCGTGCTCGACAAGTTCA

TCGAGGAGAAGTACCGCTCCTTCCGCGAGGGCATCGGCCGCGACATCGTGGAGGGCAAG

GTGGACTTCGAGAAGCTGGAGGAGTACATCATCGACAAGGAGACCATCGAGCTGCCGTC

CGGCAAGCAGGAGTACCTGGAGTCCCTCATCAACTCCTACATCGTGAAGACCATCCTGG

AGCTGCGCTGA

pNOV4836那不勒斯栖热袍菌葡萄糖异构酶融合氨基酸序列(SEQ ID NO:44)

MGSSHHHHHHSSGLVPRGSHMASMTGGQQMGRIPMAEFFPEIPKVQFEGKESTNPLAFKFYD

PEEIIDGKPLKDHLKFSVAFWHTFVNEGRDPFGDPTADRPWNRYTDPMDKAFARVDALFEFC

EKLNIEYFCFHDRDIAPEGKTLRETNKILDKVVERIKERMKDSNVKLLWGTANLFSHPRYMH

GAATTCSADVFAYAAAQVKKALEITKELGGEGYVFWGGREGYETLLNTDLGFELENLARFL

RMAVDYAKRIGFTGQFLIEPKPKEPTKHQYDFDVATAYAFLKSHGLDEYFKFNIEANHATLA

GHTFQHELRMARILGKLGSIDANQGDLLLGWDTDQFPTNVYDTTLAMYEVIKAGGFTKGGL

NFDAKVRRASYKVEDLFIGHIAGMDTFALGFKVAYKLVKDGVLDKFIEEKYRSFREGIGRDI

VEGKVDFEKLEEYIIDKETIELPSGKQEYLESLINSYIVKTILELR

Aspergillus shirousami α-淀粉酶/葡糖淀粉酶融合氨基酸序列(不含信号序列) (SEQ ID NO:45)

ATPADWRSQSIYFLLTDRFARTDGSTTATCNTADQKYCGGTWQGIIDKLDYIQGMGFTAIWI

TPVTAQLPQTTAYGDAYHGYWQQDIYSLNENYGTADDLKALSSALHERGMYLMVDVVAN

HMGYDGAGSSVDYSVFKPFSSQDYFHPFCFIQNYEDQTQVEDCWLGDNTVSLPDLDTTKDV

VKNEWYDWVGSLVSNYSIDGLRIDTVKHVQKDFWPGYNKAAGVYCIGEVLDVDPAYTCPY

QNVMDGVLNYPIYYPLLNAFKSTSGSMDDLYNMINTVKSDCPDSTLLGTFVENHDNPRFASY

TNDIALAKNVAAFIILNDGIPITYAGQEQHYAGGNDPANRATWLSGYPTDSELYKLIASANAI

RNYAISKDTGFVTYKNWPIYKDDTTIAMRKGTDGSQIVTILSNKGASGDSYTLSLSGAGYTA

GQQLTEVIGCTTVTVGSDGNVPVPMAGGLPRVLYPTEKLAGSKICSSSKPATLDSWLSNEAT

VARTAILNNIGADGAWVSGADSGIVVASPSTDNPDYFYTWTRDSGIVLKTLVDLFRNGDTDL

LSTIEHYISSQAIIQGVSNPSGDLSSGGLGEPKFNVDETAYAGSWGRPQRDGPALRATAMIGF

GQWLLDNGYTSAATEIVWPLVRNDLSYVAQYWNQTGYDLWEEVNGSSFFTIAVQHRALVE

GSAFATAVGSSCSWCDSQAPQILCYLQSFWTGSYILANFDSSRSGKDTNTLLGSIHTFDPEAG

CDDSTFQPCSPRALANHKEVVDSFRSIYTLNDGLSDSEAVAVGRYPEDSYYNGNPWFLCTLA

AAEQLYDALYQWDKQGSLEITDVSLDFFKALYSGAATGTYSSSSSTYSSIVSAVKTFADGFVS

IVETHAASNGSLSEQFDKSDGDELSARDLTWSYAALLTANNRRNSVVPPSWGETSASSVPGT

CAATSASGTYSSVTVTSWPSIVATGGTTTTATTTGSGGVTSTSKTTTTASKTSTTTSSTSCTTP

TAVAVTFDLTATTTYGENIYLVGSISQLGDWETSDGIALSADKYTSSNPPWYVTVTLPAGESF

EYKFIRVESDDSVEWESDPNREYTVPQACGESTATVTDTWR

Aspergillus shirousamiα-淀粉酶/葡糖淀粉酶融合玉米优化核酸序列(不含信号序列)(SEQ ID NO:46)

GCCACCCCGGCCGACTGGCGCTCCCAGTCCATCTACTTCCTCCTCACCGACCGCTTCGCC

CGCACCGACGGCTCCACCACCGCCACCTGCAACACCGCCGACCAGAAGTACTGCGGCGG

CACCTGGCAGGGCATCATCGACAAGCTCGACTACATCCAGGGCATGGGCTTCACCGCCA

TCTGGATCACCCCGGTGACCGCCCAGCTCCCGCAGACCACCGCCTACGGCGACGCCTACC

ACGGCTACTGGCAGCAGGACATCTACTCCCTCAACGAGAACTACGGCACCGCCGACGAC

CTCAAGGCCCTCTCCTCCGCCCTCCACGAGCGCGGCATGTACCTCATGGTGGACGTGGTG

GCCAACCACATGGGCTACGACGGCGCCGGCTCCTCCGTGGACTACTCCGTGTTCAAGCCG

TTCTCCTCCCAGGACTACTTCCACCCGTTCTGCTTCATCCAGAACTACGAGGACCAGACC

CAGGTGGAGGACTGCTGGCTCGGCGACAACACCGTGTCCCTCCCGGACCTCGACACCAC

CAAGGACGTGGTGAAGAACGAGTGGTACGACTGGGTGGGCTCCCTCGTGTCCAACTACT

CCATCGACGGCCTCCGCATCGACACCGTGAAGCACGTGCAGAAGGACTTCTGGCCGGGC

TACAACAAGGCCGCCGGCGTGTACTGCATCGGCGAGGTGCTCGACGTGGACCCGGCCTA

CACCTGCCCGTACCAGAACGTGATGGACGGCGTGCTCAACTACCCGATCTACTACCCGCT

CCTCAACGCCTTCAAGTCCACCTCCGGCTCGATGGACGACCTCTACAACATGATCAACAC

CGTGAAGTCCGACTGCCCGGACTCCACCCTCCTCGGCACCTTCGTGGAGAACCACGACAA

CCCGCGCTTCGCCTCCTACACCAACGACATCGCCCTCGCCAAGAACGTGGCCGCCTTCAT

CATCCTCAACGACGGCATCCCGATCATCTACGCCGGCCAGGAGCAGCACTACGCCGGCG

GCAACGACCCGGCCAACCGCGAGGCCACCTGGCTCTCCGGCTACCCGACCGACTCCGAG

CTGTACAAGCTCATCGCCTCCGCCAACGCCATCCGCAACTACGCCATCTCCAAGGACACC

GGCTTCGTGACCTACAAGAACTGGCCGATCTACAAGGACGACACCACCATCGCCATGCG

CAAGGGCACCGACGGCTCCCAGATCGTGACCATCCTCTCCAACAAGGGCGCCTCCGGCG

ACTCCTACACCCTCTCCCTCTCCGGCGCCGGCTACACCGCCGGCCAGCAGCTCACCGAGG

TGATCGGCTGCACCACCGTGACCGTGGGCTCCGACGGCAACGTGCCGGTGCCGATGGCC

GGCGGCCTCCCGCGCGTGCTCTACCCGACCGAGAAGCTCGCCGGCTCCAAGATATGCTCC

TCCTCCAAGCCGGCCACCCTCGACTCCTGGCTCTCCAACGAGGCCACCGTGGCCCGCACC

GCCATCCTCAACAACATCGGCGCCGACGGCGCCTGGGTGTCCGGCGCCGACTCCGGCAT

CGTGGTGGCCTCCCCGTCCACCGACAACCCGGACTACTTCTACACCTGGACCCGCGACTC

CGGCATCGTGCTCAAGACCCTCGTGGACCTCTTCCGCAACGGCGACACCGACCTCCTCTC

CACCATCGAGCACTACATCTCCTCCCAGGCCATCATCCAGGGCGTGTCCAACCCGTCCGG

CGACCTCTCCTCCGGCGGCCTCGGCGAGCCGAAGTTCAACGTGGACGAGACCGCCTACG

CCGGCTCCTGGGGCCGCCCGCAGCGCGACGGCCCGGCCCTCCGCGCCACCGCCATGATC

GGCTTCGGCCAGTGGCTCCTCGACAACGGCTACACCTCCGCCGCCACCGAGATCGTGTGG

CCGCTCGTGCGCAACGACCTCTCCTACGTGGCCCAGTACTGGAACCAGACCGGCTACGAC

CTCTGGGAGGAGGTGAACGGCTCCTCCTTCTTCACCATCGCCGTGCAGCACCGCGCCCTC

GTGGAGGGCTCCGCCTTCGCCACCGCCGTGGGCTCCTCCTGCTCCTGGTGCGACTCCCAG

GCCCCGCAGATCCTCTGCTACCTCCAGTCCTTCTGGACCGGCTCCTACATCCTCGCCAACT

TCGACTCCTCCCGCTCCGGCAAGGACACCAACACCCTCCTCGGCTCCATCCACACCTTCG

ACCCGGAGGCCGGCTGCGACGACTCCACCTTCCAGCCGTGCTCCCCGCGCGCCCTCGCCA

ACCACAAGGAGGTGGTGGACTCCTTCCGCTCCATCTACACCCTCAACGACGGCCTCTCCG

ACTCCGAGGCCGTGGCCGTGGGCCGCTACCCGGAGGACTCCTACTACAACGGCAACCCG

TGGTTCCTCTGCACCCTCGCCGCCGCCGAGCAGCTCTACGACGCCCTCTACCAGTGGGAC

AAGCAGGGCTCCCTGGAGATCACCGACGTGTCCCTCGACTTCTTCAAGGCCCTCTACTCC

GGCGCCGCCACCGGCACCTACTCCTCCTCCTCCTCCACCTACTCCTCCATCGTGTCCGCCG

TGAAGACCTTCGCCGACGGCTTCGTGTCCATCGTGGAGACCCACGCCGCCTCCAACGGCT

CCCTCTCCGAGCAGTTCGACAAGTCCGACGGCGACGAGCTGTCCGCCCGCGACCTCACCT

GGTCCTACGCCGCCCTCCTCACCGCCAACAACCGCCGCAACTCCGTGGTGCCGCCGTCCT

GGGGCGAGACCTCCGCCTCCTCCGTGCCGGGCACCTGCGCCGCCACCTCCGCCTCCGGCA

CCTACTCCTCCGTGACCGTGACCTCCTGGCCGTCCATCGTGGCCACCGGCGGCACCACCA

CCACCGCCACCACCACCGGCTCCGGCGGCGTGACCTCCACCTCCAAGACCACCACCACC

GCCTCCAAGACCTCCACCACCACCTCCTCCACCTCCTGCACCACCCCGACCGCCGTGGCC

GTGACCTTCGACCTCACCGCCACCACCACCTACGGCGAGAACATCTACCTCGTGGGCTCC

ATCTCCCAGCTCGGCGACTGGGAGACCTCCGACGGCATCGCCCTCTCCGCCGACAAGTAC

ACCTCCTCCAACCCGCCGTGGTACGTGACCGTGACCCTCCCGGCCGGCGAGTCCTTCGAG

TACAA GTTCATCCGCGTGGAGTCCGACGACTCCGTGGAGTGGGAGTCCGACCCGAACCG

CGAGTAC

ACCGTGCCGCAGGCCTGCGGCGAGTCCACCGCCACCGTGACCGACACCTGGCGC

热解糖热厌氧杆菌(Thermoanaerobaterium thermosaccharolgticum)葡糖淀粉酶氨基酸序列 (不含信号序列)(SEQ ID NO:47)

VLSGCSNNVSSIKIDRFNNISAVNGPGEEDTWASAQKQGVGTANNYVSRVWFTLANGAISEV

YYPTIDTADVKEIKFIVTDGKSFVSDETKDAISKVEKFTDKSLGYKLVNTDKKGRYRITKEIFT

DVKRNSLIMKAKFEALEGSIHDYKLYLAYDPHIKNQGSYNEGYVIKANNNEMLMAKRDNV

YTALSSNIGWKGYSIGYYKVNDIMTDLDENKQMTKHYDSARGNIIEGAEIDLTKNSEFEIVLS

FGGSDSEAAKTALETLGEDYNNLKNNYIDEWTKYCNTLNNFNGKANSLYYNSMMILKASED

KTNKGAYIASLSIPWGDGQRDDNTGGYHLVWSRDLYHVANAFIAAGDVDSANRSLDYLAK

VVKDNGMIPQNTWISGKPYWTSIQLDEQADPIILSYRLKRYDLYDSLVKPLADFIIKIGPKTGQ

ERWEEIGGYSPATMAAEVAGLTCAAYIAEQNKDYESAQKYQEKADNWQKLIDNLTYTENG

PLGNGQYYIRIAGLSDPNADFMINIANGGGVYDQKEIVDPSFLELVRLGVKSADDPKILNTLK

VVDSTIKVDTPKGPSWYRYNHDGYGEPSKTELYHGAGKGRLWPLLTGERGMYEIAAGKDA

TPYVKAMEKFANEGGIISEQVWEDTGLPTDSASPLNWAHAEYVILFASNIEHKVLDMPDIVY

热解糖热厌氧杆菌(Thermoanaerobaterium thermosaccharolgticum)葡糖淀粉酶玉米优化核 酸序列(不含信号序列)(SEQ ID NO:48)

GTGCTCTCCGGCTGCTCCAACAACGTGTCCTCCATCAAGATCGACCGCTTCAACAACATC

TCCGCCGTGAACGGCCCGGGCGAGGAGGACACCTGGGCCTCCGCCCAGAAGCAGGGCGT

GGGCACCGCCAACAACTACGTGTCCCGCGTGTGGTTCACCCTCGCCAACGGCGCCATCTC

CGAGGTGTACTACCCGACCATCGACACCGCCGACGTGAAGGAGATCAAGTTCATCGTGA

CCGACGGCAAGTCCTTCGTGTCCGACGAGACCAAGGACGCCATCTCCAAGGTGGAGAAG

TTCACCGACAAGTCCCTCGGCTACAAGCTCGTGAACACCGACAAGAAGGGCCGCTACCG

CATCACCAAGGAAATCTTCACCGACGTGAAGCGCAACTCCCTCATCATGAAGGCCAAGT

TCGAGGCCCTCGAGGGCTCCATCCACGACTACAAGCTCTACCTCGCCTACGACCCGCACA

TCAAGAACCAGGGCTCCTACAACGAGGGCTACGTGATCAAGGCCAACAACAACGAGATG

CTCATGGCCAAGCGCGACAACGTGTACACCGCCCTCTCCTCCAACATCGGCTGGAAGGG

CTACTCCATCGGCTACTACAAGGTGAACGACATCATGACCGACCTCGACGAGAACAAGC

AGATGACCAAGCACTACGACTCCGCCCGCGGCAACATCATCGAGGGCGCCGAGATCGAC

CTCACCAAGAACTCCGAGTTCGAGATCGTGCTCTCCTTCGGCGGCTCCGACTCCGAGGCC

GCCAAGACCGCCCTCGAGACCCTCGGCGAGGACTACAACAACCTCAAGAACAACTACAT

CGACGAGTGGACCAAGTACTGCAACACCCTCAACAACTTCAACGGCAAGGCCAACTCCC

TCTACTACAACTCCATGATGATCCTCAAGGCCTCCGAGGACAAGACCAACAAGGGCGCC

TACATCGCCTCCCTCTCCATCCCGTGGGGCGACGGCCAGCGCGACGACAACACCGGCGG

CTACCACCTCGTGTGGTCCCGCGACCTCTACCACGTGGCCAACGCCTTCATCGCCGCCGG

CGACGTGGACTCCGCCAACCGCTCCCTCGACTACCTCGCCAAGGTGGTGAAGGACAACG

GCATGATCCCGCAGAACACCTGGATCTCCGGCAAGCCGTACTGGACCTCCATCCAGCTCG

ACGAGCAGGCCGACCCGATCATCCTCTCCTACCGCCTCAAGCGCTACGACCTCTACGACT

CCCTCGTGAAGCCGCTCGCCGACTTCATCATCAAGATCGGCCCGAAGACCGGCCAGGAG

CGCTGGGAGGAGATCGGCGGCTACTCCCCGGCCACGATGGCCGCCGAGGTGGCCGGCCT

CACCTGCGCCGCCTACATCGCCGAGCAGAACAAGGACTACGAGTCCGCCCAGAAGTACC

AGGAGAAGGCCGACAACTGGCAGAAGCTCATCGACAACCTCACCTACACCGAGAACGGC

CCGCTCGGCAACGGCCAGTACTACATCCGCATCGCCGGCCTCTCCGACCCGAACGCCGAC

TTCATGATCAACATCGCCAACGGCGGCGGCGTGTACGACCAGAAGGAGATCGTGGACCC

GTCCTTCCTCGAGCTGGTGCGCCTCGGCGTGAAGTCCGCCGACGACCCGAAGATCCTCAA

CACCCTCAAGGTGGTGGACTCCACCATCAAGGTGGACACCCCGAAGGGCCCGTCCTGGT

ATCGCTACAACCACGACGGCTACGGCGAGCCGTCCAAGACCGAGCTGTACCACGGCGCC

GGCAAGGGCCGCCTCTGGCCGCTCCTCACCGGCGAGCGCGGCATGTACGAGATCGCCGC

CGGCAAGGACGCCACCCCGTACGTGAAGGCGATGGAGAAGTTCGCCAACGAGGGCGGC

ATCATCTCCGAGCAGGTGTGGGAGGACACCGGCCTCCCGACCGACTCCGCCTCCCCGCTC

AACTGGGCCCACGCCGAGTACGTGATCCTCTTCGCCTCCAACATCGAGCACAAGGTGCTC

GACATGCCGGACATCGTGTAC

米根霉(Rhizopus oryzae)葡糖淀粉酶氨基酸序列(不含信号序列)(SEQ ID NO:49)

ASIPSSASVQLDSYNYDGSTFSGKIYVKNIAYSKKVTVIYADGSDNWNNNGNTIAASYSAPIS

GSNYEYWTFSASINGIKEFYIKYEVSGKTYYDNNNSANYQVSTSKPTTTTATATTTTAPSTST

TTPPSRSEPATFPTGNSTISSWIKKQEGISRFAMLRNINPPGSATGFIAASLSTAGPDYYYAWTR

DAALTSNVIVYEYNTTLSGNKTILNVLKDYVTFSVKTQSTSTVCNCLGEPKFNPDASGYTGA

WGRPQNDGPAERATTFILFADSYLTQTKDASYVTGTLKPAIFKDLDYVVNVWSNGCFDLWE

EVNGVHFYTLMVMRKGLLLGADFAKRNGDSTRASTYSSTASTIANKISSFWVSSNNWIQVSQ

SVTGGVSKKGLDVSTLLAANLGSVDDGFFTPGSEKILATAVAVEDSFASLYPINKNLPSYLGN

SIGRYPEDTYNGNGNSQGNSWFLAVTGYAELYYRAIKEWIGNGGVTVSSISLPFFKKFDSSAT

SGKKYTVGTSDFNNLAQNIALAADRFLSTVQLHAHNNGSLAEEFDRTTGLSTGARDLTWSH

ASLITASYAKAGAPAA

米根霉葡糖淀粉酶玉米优化核酸序列(不含信号序列)(SEQ ID NO:50)

GCCTCCATCCCGTCCTCCGCCTCCGTGCAGCTCGACTCCTACAACTACGACGGCTCCACC

TTCTCCGGCAAAATCTACGTGAAGAACATCGCCTACTCCAAGAAGGTGACCGTGATCTAC

GCCGACGGCTCCGACAACTGGAACAACAACGGCAACACCATCGCCGCCTCCTACTCCGC

CCCGATCTCCGGCTCCAACTACGAGTACTGGACCTTCTCCGCCTCCATCAACGGCATCAA

GGAGTTCTACATCAAGTACGAGGTGTCCGGCAAGACCTACTACGACAACAACAACTCCG

CCAACTACCAGGTGTCCACCTCCAAGCCGACCACCACCACCGCCACCGCCACCACCACC

ACCGCCCCGTCCACCTCCACCACCACCCCGCCGTCCCGCTCCGAGCCGGCCACCTTCCCG

ACCGGCAACTCCACCATCTCCTCCTGGATCAAGAAGCAGGAGGGCATCTCCCGCTTCGCC

ATGCTCCGCAACATCAACCCGCCGGGCTCCGCCACCGGCTTCATCGCCGCCTCCCTCTCC

ACCGCCGGCCCGGACTACTACTACGCCTGGACCCGCGACGCCGCCCTCACCTCCAACGTG

ATCGTGTACGAGTACAACACCACCCTCTCCGGCAACAAGACCATCCTCAACGTGCTCAAG

GACTACGTGACCTTCTCCGTGAAGACCCAGTCCACCTCCACCGTGTGCAACTGCCTCGGC

GAGCCGAAGTTCAACCCGGACGCCTCCGGCTACACCGGCGCCTGGGGCCGCCCGCAGAA

CGACGGCCCGGCCGAGCGCGCCACCACCTTCATCCTCTTCGCCGACTCCTACCTCACCCA

GACCAAGGACGCCTCCTACGTGACCGGCACCCTCAAGCCGGCCATCTTCAAGGACCTCG

ACTACGTGGTGAACGTGTGGTCCAACGGCTGCTTCGACCTCTGGGAGGAGGTGAACGGC

GTGCACTTCTACACCCTCATGGTGATGCGCAAGGGCCTCCTCCTCGGCGCCGACTTCGCC

AAGCGCAACGGCGACTCCACCCGCGCCTCCACCTACTCCTCCACCGCCTCCACCATCGCC

AACAAAATCTCCTCCTTCTGGGTGTCCTCCAACAACTGGATACAGGTGTCCCAGTCCGTG

ACCGGCGGCGTGTCCAAGAAGGGCCTCGACGTGTCCACCCTCCTCGCCGCCAACCTCGGC

TCCGTGGACGACGGCTTCTTCACCCCGGGCTCCGAGAAGATCCTCGCCACCGCCGTGGCC

GTGGAGGACTCCTTCGCCTCCCTCTACCCGATCAACAAGAACCTCCCGTCCTACCTCGGC

AACTCCATCGGCCGCTACCCGGAGGACACCTACAACGGCAACGGCAACTCCCAGGGCAA

CTCCTGGTTCCTCGCCGTGACCGGCTACGCCGAGCTGTACTACCGCGCCATCAAGGAGTG

GATCGGCAACGGCGGCGTGACCGTGTCCTCCATCTCCCTCCCGTTCTTCAAGAAGTTCGA

CTCCTCCGCCACCTCCGGCAAGAAGTACACCGTGGGCACCTCCGACTTCAACAACCTCGC

CCAGAACATCGCCCTCGCCGCCGACCGCTTCCTCTCCACCGTGCAGCTCCACGCCCACAA

CAACGGCTCCCTCGCCGAGGAGTTCGACCGCACCACCGGCCTCTCCACCGGCGCCCGCG

ACCTCACCTGGTCCCACGCCTCCCTCATCACCGCCTCCTACGCCAAGGCCGGCGCCCCGG

CCGCC

玉米α-淀粉酶氨基酸序列(SEQ ID NO:51)

MAKHLAAMCWCSLLVLVLLCLGSQLAQSQVLFQGFNWESWKKQGGWYNYLLGRVDDIAA

TGATHVWLPQPSHSVAPQGYMPGRLYDLDASKYGTHAELKSLTAAFHAKGVQCVADVVIN

HRCADYKDGRGIYCVFEGGTPDSRLDWGPDMICSDDTQYSNGRGHRDTGADFAAAPDIDHL

NPRVQQELSDWLNWLKSDLGFDGWRLDFAKGYSAAVAKVYVDSTAPTFVVAEIWSSLHYD

GNGEPSSNQDADRQELVNWAQAVGGPAAAFDFTTKGVLQAAVQGELWRMKDGNGKAPG

MIGWLPEKAVTFVDNHDTGSTQNSWPFPSDKVMQGYAYILTHPGTPCIFYDHVFDWNLKQE

ISALSAVRSRNGIHPGSELNILAADGDLYVAKIDDKVIVKIGSRYDVGNLIPSDFHAVAHGNN

YCVWEKHGLRVPAGRHH

玉米α-淀粉酶核酸序列(SEQ ID NO:52)

ATGGCGAAGCACTTGGCTGCCATGTGCTGGTGCAGCCTCCTAGTGCTTGTACTGCTCTGC

TTGGGCTCCCAGCTGGCCCAATCCCAGGTCCTCTTCCAGGGGTTCAACTGGGAGTCGTGG

AAGAAGCAAGGTGGGTGGTACAACTACCTCCTGGGGCGGGTGGACGACATCGCCGCGAC

GGGGGCCACGCACGTCTGGCTCCCGCAGCCGTCGCACTCGGTGGCGCCGCAGGGGTACA

TGCCCGGCCGGCTCTACGACCTGGACGCGTCCAAGTACGGCACCCACGCGGAGCTCAAG

TCGCTCACCGCGGCGTTCCACGCCAAGGGCGTCCAGTGCGTCGCCGACGTCGTGATCAAC

CACCGCTGCGCCGACTACAAGGACGGCCGCGGCATCTACTGCGTCTTCGAGGGCGGCAC

GCCCGACAGCCGCCTCGACTGGGGCCCCGACATGATCTGCAGCGACGACACGCAGTACT

CCAACGGGCGCGGGCACCGCGACACGGGGGCCGACTTCGCCGCCGCGCCCGACATCGAC

CACCTCAACCCGCGCGTGCAGCAGGAGCTCTCGGACTGGCTCAACTGGCTCAAGTCCGA

CCTCGGCTTCGACGGCTGGCGCCTCGACTTCGCCAAGGGCTACTCCGCCGCCGTCGCCAA

GGTGTACGTCGACAGCACCGCCCCCACCTTCGTCGTCGCCGAGATATGGAGCTCCCTCCA

CTACGACGGCAACGGCGAGCCGTCCAGCAACCAGGACGCCGACAGGCAGGAGCTGGTC

AACTGGGCGCAGGCGGTGGGCGGCCCCGCCGCGGCGTTCGACTTCACCACCAAGGGCGT

GCTGCAGGCGGCCGTCCAGGGCGAGCTGTGGCGCATGAAGGACGGCAACGGCAAGGCG

CCCGGGATGATCGGCTGGCTGCCGGAGAAGGCCGTCACGTTCGTCGACAACCACGACAC

CGGCTCCACGCAGAACTCGTGGCCATTCCCCTCCGACAAGGTCATGCAGGGCTACGCCTA

TATCCTCACGCACCCAGGAACTCCATGCATCTTCTACGACCACGTTTTCGACTGGAACCT

GAAGCAGGAGATCAGCGCGCTGTCTGCGGTGAGGTCAAGAAACGGGATCCACCCGGGG

AGCGAGCTGAACATCCTCGCCGCCGACGGGGATCTCTACGTCGCCAAGATTGACGACAA

GGTCATCGTGAAGATCGGGTCACGGTACGACGTCGGGAACCTGATCCCCTCAGACTTCCA

CGCCGTTGCCCCTGGCAACAACTACTGCGTTTGGGAGAAGCACGGTCTGAGAGTTCCAGC

GGGGCGGCACCACTAG

粗淀粉结合位点氨基酸序列(SEQ ID NO:53)

ATGGTTTTATTTGSGGVTSTSKTTTASKTSTTTSSTSCTTPTAV

粗淀粉结合位点玉米优化核酸序列(SEQ ID NO:54)

GCCACCGGCGGCACCACCACCACCGCCACCACCACCGGCTCCGGCGGCGTGACCTCCAC

CTCCAAGACCACCACCACCGCCTCCAAGACCTCCACCACCACCTCCTCCACCTCCTGCAC

CACCCCGACCGCCGTGTC

激烈火球菌(Pyrococcus furiosus)EGLA氨基酸序列(不含信号序列)(SEQ ID NO:55)

IYFVEKYHTSEDKSTSNTSSTPPQTTLSTTKVLKIRYPDDGEWPGAPIDKDGDGNPEFYIEINL

WNILNATGFAEMTYNLTSGVLHYVQQLDNIVLRDRSNWVHGYPEIFYGNKPWNANYATDG

PIPLPSKVSNLTDFYLTISYKLEPKNGLPINFAIESWLTREAWRTTGINSDEQEVMIWIYYDGL

QPAGSKVKEIVVPIIVNGTPVNATFEVWKANIGWEYVAFRIKTPIKEGTVTIPYGAFISVAANIS

SLPNYTELYLEDVEIGTEFGTPSTTSAHLEWWTTNITLTPLDRPLIS

激烈火球菌EGLA玉米优化核酸序列(不含信号序列)(SEQ ID NO:56)

ATCTACTTCGTGGAGAAGTACCACACCTCCGAGGACAAGTCCACCTCCAACACCTCCTCC

ACCCCGCCGCAGACCACCCTCTCCACCACCAAGGTGCTCAAGATCCGCTACCCGGACGA

CGGCGAGTGGCCCGGCGCCCCGATCGACAAGGACGGCGACGGCAACCCGGAGTTCTACA

TCGAGATCAACCTCTGGAACATCCTCAACGCCACCGGCTTCGCCGAGATGACCTACAACC

TCACTAGTGGCGTGCTCCACTACGTGCAGCAGCTCGACAACATCGTGCTCCGCGACCGCT

CCAACTGGGTGCACGGCTACCCGGAAATCTTCTACGGCAACAAGCCGTGGAACGCCAAC

TACGCCACCGACGGCCCGATCCCGCTCCCGTCCAAGGTGTCCAACCTCACCGACTTCTAC

CTCACCATCTCCTACAAGCTCGAGCCGAAGAACGGTCTCCCGATCAACTTCGCCATCGAG

TCCTGGCTCACCCGCGAGGCCTGGCGCACCACCGGCATCAACTCCGACGAGCAGGAGGT

GATGATCTGGATCTACTACGACGGCCTCCAGCCCGCGGGCTCCAAGGTGAAGGAGATCG

TGGTGCCGATCATCGTGAACGGCACCCCGGTGAACGCCACCTTCGAGGTGTGGAAGGCC

AACATCGGCTGGGAGTACGTGGCCTTCCGCATCAAGACCCCGATCAAGGAGGGCACCGT

GACCATCCCGTACGGCGCCTTCATCTCCGTGGCCGCCAACATCTCCTCCCTCCCGAACTA

CACCGAGAAGTACCTCGAGGACGTGGAGATCGGCACCGAGTTCGGCACCCCGTCCACCA

CCTCCGCCCACCTCGAGTGGTGGATCACCAACATCACCCTCACCCCGCTCGACCGCCCGC

TCATCTCCTAG

黄栖热菌(Thermus flavus)木糖异构酶氨基酸序列(SEQ ID NO:57)

MYEPKPEHRFTFGLWTVDNVDRDPFGDTVRERLDPVYVVHKLAELGAYGVNLHDEDLIPRG

TPPQERDQIVRRFKKALDETVLKVPMVTANLFSEPAFRDGASTTRDPWVWAYALRKSLETM

DLGAELGAEIYMFWMVRERSEVESTDKTRKVWDWVRETLNFMTAYTEDQGYGYRFSVEPK

PNEPRGDIYFTTVGSMLALIHTLDRPER

FGLNPEFAHETMAGLNFDHAVAQAVDAGKLFHIDLNDQRMSRFDQDLRFGSENLKAGFFLV

DLLESSGYQGPRHFEAHALRTEDEEGVWTFVRVCMRTYLIIKVRAETFREDPEVKELLAAYY

QEDPATLALLDPYSREKAEALKRAELPLETKRRRGYALERLDQLAVEYLLGVRG

pNOV4800核苷酸序列(Amy32B信号序列和EGLA)(SEQ ID NO:58)

ATGGGGAAGAACGGCAACCTGTGCTGCTTCTCTCTGCTGCTGCTTCTTCTCGCCGGGTTG

GCGTCCGGCCATCAAATCTACTTCGTGGAGAAGTACCACACCTCCGAGGACAAGTCCAC

CTCCAACACCTCCTCCACCCCGCCGCAGACCACCCTCTCCACCACCAAGGTGCTCAAGAT

CCGCTACCCGGACGACGGTGAGTGGCCCGGCGCCCCGATCGACAAGGACGGCGACGGCA

ACCCGGAGTTCTACATCGAGATCAACCTCTGGAACATCCTCAACGCCACCGGCTTCGCCG

AGATGACCTACAACCTCACTAGTGGCGTGCTCCACTACGTGCAGCAGCTCGACAACATCG

TGCTCCGCGACCGCTCCAACTGGGTGCACGGCTACCCGGAAATCTTCTACGGCAACAAGC

CGTGGAACGCCAACTACGCCACCGACGGCCCGATCCCGCTCCCGTCCAAGGTGTCCAAC

CTCACCGACTTCTACCTCACCATCTCCTACAAGCTCGAGCCGAAGAACGGTCTCCCGATC

AACTTCGCCATCGAGTCCTGGCTCACCCGCGAGGCCTGGCGCACCACCGGCATCAACTCC

GACGAGCAGGAGGTGATGATCTGGATCTACTACGACGGCCTCCAGCCCGCGGGCTCCAA

GGTGAAGGAGATCGTGGTGCCGATCATCGTGAACGGCACCCCGGTGAACGCCACCTTCG

AGGTGTGGAAGGCCAACATCGGCTGGGAGTACGTGGCCTTCCGCATCAAGACCCCGATC

AAGGAGGGCACCGTGACCATCCCGTACGGCGCCTTCATCTCCGTGGCCGCCAACATCTCC

TCCCTCCCGAACTACACCGAGAAGTACCTCGAGGACGTGGAGATCGGCACCGAGTTCGG

CACCCCGTCCACCACCTCCGCCCACCTCGAGTGGTGGATCACCAACATCACCCTCACCCC

GCTCGACCGCCCGCTCATCTCCTAG

黑色曲霉(Aspergillus niger)玉米优化核酸(SEQ ID NO:59)

ATGTCCTTCCGCTCCCTCCTCGCCCTCTCCGGCCTCGTGTGCACCGGCCTCGCCAACGTGA

TCTCCAAGCGCGCCACCCTCGACTCCTGGCTCTCCAACGAGGCCACCGTGGCCCGCACCG

CCATCCTCAACAACATCGGCGCCGACGGCGCCTGGGTGTCCGGCGCCGACTCCGGCATC

GTGGTGGCCTCCCCGTCCACCGACAACCCGGACTACTTCTACACCTGGACCCGCGACTCC

GGCCTCGTGCTCAAGACCCTCGTGGACCTCTTCCGCAACGGCGACACCTCCCTCCTCTCC

ACCATCGAGAACTACATCTCCGCCCAGGCCATCGTGCAGGGCATCTCCAACCCGTCCGGC

GACCTCTCCTCCGGCGCCGGCCTCGGCGAGCCGAAGTTCAACGTGGACGAGACCGCCTA

CACCGGCTCCTGGGGCCGCCCGCAGCGCGACGGCCCGGCCCTCCGCGCCACCGCCATGA

TCGGCTTCGGCCAGTGGCTCCTCGACAACGGCTACACCTCCACCGCCACCGACATCGTGT

GGCCGCTCGTGCGCAACGACCTCTCCTACGTGGCCCAGTACTGGAACCAGACCGGCTAC

GACCTCTGGGAGGAGGTGAACGGCTCCTCCTTCTTCACCATCGCCGTGCAGCACCGCGCC

CTCGTGGAGGGCTCCGCCTTCGCCACCGCCGTGGGCTCCTCCTGCTCCTGGTGCGACTCC

CAGGCCCCGGAGATCCTCTGCTACCTCCAGTCCTTCTGGACCGGCTCCTTCATCCTCGCCA

ACTTCGACTCCTCCCGCTCCGGCAAGGACGCCAACACCCTCCTCGGCTCCATCCACACCT

TCGACCCGGAGGCCGCCTGCGACGACTCCACCTTCCAGCCGTGCTCCCCGCGCGCCCTCG

CCAACCACAAGGAGGTGGTGGACTCCTTCCGCTCCATCTACACCCTCAACGACGGCCTCT

CCGACTCCGAGGCCGTGGCCGTGGGCCGCTACCCGGAGGACACCTACTACAACGGCAAC

CCGTGGTTCCTCTGCACCCTCGCCGCCGCCGAGCAGCTCTACGACGCCCTCTACCAGTGG

GACAAGCAGGGCTCCCTCGAGGTGACCGACGTGTCCCTCGACTTCTTCAAGGCCCTCTAC

TCCGACGCCGCCACCGGCACCTACTCCTCCTCCTCCTCCACCTACTCCTCCATCGTGGACG

CCGTGAAGACCTTCGCCGACGGCTTCGTGTCCATCGTGGAGACCCACGCCGCCTCCAACG

GCTCCATGTCCGAGCAGTACGACAAGTCCGACGGCGAGCAGCTCTCCGCCCGCGACCTC

ACCTGGTCCTACGCCGCCCTCCTCACCGCCAACAACCGCCGCAACTCCGTGGTGCCGGCC

TCCTGGGGCGAGACCTCCGCCTCCTCCGTGCCGGGCACCTGCGCCGCCACCTCCGCCATC

GGCACCTACTCCTCCGTGACCGTGACCTCCTGGCCGTCCATCGTGGCCACCGGCGGCACC

ACCACCACCGCCACCCCGACCGGCTCCGGCTCCGTGACCTCCACCTCCAAGACCACCGCC

ACCGCCTCCAAGACCTCCACCTCCACCTCCTCCACCTCCTGCACCACCCCGACCGCCGTG

GCCGTGACCTTCGACCTCACCGCCACCACCACCTACGGCGAGAACATCTACCTCGTGGGC

TCCATCTCCCAGCTCGGCGACTGGGAGACCTCCGACGGCATCGCCCTCTCCGCCGACAAG

TACACCTCCTCCGACCCGCTCTGGTACGTGACCGTGACCCTCCCGGCCGGCGAGTCCTTC

GAGTACAAGTTCATCCGCATCGAGTCCGACGACTCCGTGGAGTGGGAGTCCGACCCGAA

CCGCGAGTACACCGTGCCGCAGGCCTGCGGCACCTCCACCGCCACCGTGACCGACACCT

GGCGC

                            序列表

<110>Lanahan,Mike

<120>自加工的植物及植物部分

<130>109846.317

<140>US 60/315,281

<141>2001-08-27

<160>60

<170>FastSEQ for Windows Version 4.0

<210>1

<211>436

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>1

Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met Gln Ala

 1               5                  10                  15

Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg

            20                  25                  30

Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile

        35                  40                  45

Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp

    50                  55                  60

Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Thr Val

65                  70                  75                  80

Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile Asn Thr

                85                  90                  95

Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile Asn His

            100                 105                 110

Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp Tyr Thr

        115                 120                 125

Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr

    130                 135                 140

Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe

145                 150                 155                 160

Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln Tyr Trp

                165                 170                 175

Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly

            180                 185                 190

Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala Trp Val

        195                 200                 205

Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly Glu Tyr

    210                 215                 220

Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly

225                 230                 235                 240

Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe

                245                 250                 255

Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn Gly Gly

            260                 265                 270

Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala Asn

        275                 280                 285

His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile

    290                 295                 300

Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu

305                 310                 315                 320

Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn

                325                 330                 335

Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp Glu Met

            340                 345                 350

Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr

        355                 360                 365

Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val Pro Lys

    370                 375                 380

Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp

385                 390                 395                 400

Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu Ala Pro

                405                 410                 415

Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr

            420                 425                 430

Cys Gly Val Gly

        435

<210>2

<211>1308

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>2

atggccaagt acctggagct ggaggagggc ggcgtgatca tgcaggcgtt ctactgggac   60

gtcccgagcg gaggcatctg gtgggacacc atccgccaga agatccccga gtggtacgac   120

gccggcatct ccgcgatctg gataccgcca gcttccaagg gcatgtccgg gggctactcg   180

atgggctacg acccgtacga ctacttcgac ctcggcgagt actaccagaa gggcacggtg   240

gagacgcgct tcgggtccaa gcaggagctc atcaacatga tcaacacggc gcacgcctac   300

ggcatcaagg tcatcgcgga catcgtgatc aaccacaggg ccggcggcga cctggagtgg   360

aacccgttcg tcggcgacta cacctggacg gacttctcca aggtcgcctc cggcaagtac   420

accgccaact acctcgactt ccaccccaac gagctgcacg cgggcgactc cggcacgttc   480

ggcggctacc cggacatctg ccacgacaag tcctgggacc agtactggct ctgggcctcg   540

caggagtcct acgcggccta cctgcgctcc atcggcatcg acgcgtggcg cttcgactac   600

gtcaagggct acggggcctg ggtggtcaag gactggctca actggtgggg cggctgggcg   660

gtgggcgagt actgggacac caacgtcgac gcgctgctca actgggccta ctcctccggc   720

gccaaggtgt tcgacttccc cctgtactac aagatggacg cggccttcga caacaagaac   780

atcccggcgc tcgtcgaggc cctgaagaac ggcggcacgg tggtctcccg cgacccgttc   840

aaggccgtga ccttcgtcgc caaccacgac acggacatca tctggaacaa gtacccggcg   900

tacgccttca tcctcaccta cgagggccag cccacgatct tctaccgcga ctacgaggag   960

tggctgaaca aggacaagct caagaacctg atctggattc acgacaacct cgcgggcggc   1020

tccactagta tcgtgtacta cgactccgac gagatgatct tcgtccgcaa cggctacggc   1080

tccaagcccg gcctgatcac gtacatcaac ctgggctcct ccaaggtggg ccgctgggtg   1140

tacgtcccga agttcgccgg cgcgtgcatc cacgagtaca ccggcaacct cggcggctgg   1200

gtggacaagt acgtgtactc ctccggctgg gtctacctgg aggccccggc ctacgacccc   1260

gccaacggcc agtacggcta ctccgtgtgg tcctactgcg gcgtcggc                1308

<210>3

<211>800

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>3

Met Gly His Trp Tyr Lys His Gln Arg Ala Tyr Gln Phe Thr Gly Glu

 1               5                  10                  15

Asp Asp Phe Gly Lys Val Ala Val Val Lys Leu Pro Met Asp Leu Thr

            20                  25                  30

Lys Val Gly Ile Ile Val Arg Leu Asn Glu Trp Gln Ala Lys Asp Val

        35                  40                  45

Ala Lys Asp Arg Phe Ile Glu Ile Lys Asp Gly Lys Ala Glu Val Trp

    50                  55                  60

Ile Leu Gln Gly Val Glu Glu Ile Phe Tyr Glu Lys Pro Asp Thr Ser

65                  70                  75                  80

Pro Arg Ile Phe Phe Ala Gln Ala Arg Ser Asn Lys Val Ile Glu Ala

                85                  90                  95

Phe Leu Thr Asn Pro Val Asp Thr Lys Lys Lys Glu Leu Phe Lys Val

            100                 105                 110

Thr Val Asp Gly Lys Glu Ile Pro Val Ser Arg Val Glu Lys Ala Asp

        115                 120                 125

Pro Thr Asp Ile Asp Val Thr Asn Tyr Val Arg Ile Val Leu Ser Glu

    130                 135                 140

Ser Leu Lys Glu Glu Asp Leu Arg Lys Asp Val Glu Leu Ile Ile Glu

145                 150                 155                 160

Gly Tyr Lys Pro Ala Arg Val Ile Met Met Glu Ile Leu Asp Asp Tyr

                165                 170                 175

Tyr Tyr Asp Gly Glu Leu Gly Ala Val Tyr Ser Pro Glu Lys Thr Ile

            180                 185                 190

Phe Arg Val Trp Ser Pro Val Ser Lys Trp Val Lys Val Leu Leu Phe

        195                 200                 205

Lys Asn Gly Glu Asp Thr Glu Pro Tyr Gln Val Val Asn Met Glu Tyr

    210                 215                 220

Lys Gly Asn Gly Val Trp Glu Ala Val Val Glu Gly Asp Leu Asp Gly

225                 230                 235                 240

Val Phe Tyr Leu Tyr Gln Leu Glu Asn Tyr Gly Lys Ile Arg Thr Thr

                245                 250                 255

Val Asp Pro Tyr Ser Lys Ala Val Tyr Ala Asn Asn Gln Glu Ser Ala

            260                 265                 270

Val Val Asn Leu Ala Arg Thr Asn Pro Glu Gly Trp Glu Asn Asp Arg

        275                 280                 285

Gly Pro Lys Ile Glu Gly Tyr Glu Asp Ala Ile Ile Tyr Glu Ile His

    290                 295                 300

Ile Ala Asp Ile Thr Gly Leu Glu Asn Ser Gly Val Lys Asn Lys Gly

305                 310                 315                 320

Leu Tyr Leu Gly Leu Thr Glu Glu Asn Thr Lys Gly Pro Gly Gly Val

                325                 330                 335

Thr Thr Gly Leu Ser His Leu Val Glu Leu Gly Val Thr His Val His

            340                 345                 350

Ile Leu Pro Phe Phe Asp Phe Tyr Thr Gly Asp Glu Leu Asp Lys Asp

        355                 360                 365

Phe Glu Lys Tyr Tyr Asn Trp Gly Tyr Asp Pro Tyr Leu Phe Met Val

    370                 375                 380

Pro Glu Gly Arg Tyr Ser Thr Asp Pro Lys Asn Pro His Thr Arg Ile

385                 390                 395                 400

Arg Glu Val Lys Glu Met Val Lys Ala Leu His Lys His Gly Ile Gly

                405                 410                 415

Val Ile Met Asp Met Val Phe Pro His Thr Tyr Gly Ile Gly Glu Leu

            420                 425                 430

Ser Ala Phe Asp Gln Thr Val Pro Tyr Tyr Phe Tyr Arg Ile Asp Lys

        435                 440                 445

Thr Gly Ala Tyr Leu Asn Glu Ser Gly Cys Gly Asn Val Ile Ala Ser

    450                 455                 460

Glu Arg Pro Met Met Arg Lys Phe Ile Val Asp Thr Val Thr Tyr Trp

465                 470                 475                 480

Val Lys Glu Tyr His Ile Asp Gly Phe Arg Phe Asp Gln Met Gly Leu

                485                 490                 495

Ile Asp Lys Lys Thr Met Leu Glu Val Glu Arg Ala Leu His Lys Ile

            500                 505                 510

Asp Pro Thr Ile Ile Leu Tyr Gly Glu Pro Trp Gly Gly Trp Gly Ala

        515                 520                 525

Pro Ile Arg Phe Gly Lys Ser Asp Val Ala Gly Thr His Val Ala Ala

    530                 535                 540

Phe Asn Asp Glu Phe Arg Asp Ala Ile Arg Gly Ser Val Phe Asn Pro

545                 550                 555                 560

Ser Val Lys Gly Phe Val Met Gly Gly Tyr Gly Lys Glu Thr Lys Ile

                565                 570                 575

Lys Arg Gly Val Val Gly Ser Ile Asn Tyr Asp Gly Lys Leu Ile Lys

            580                 585                 590

Ser Phe Ala Leu Asp Pro Glu Glu Thr Ile Asn Tyr Ala Ala Cys His

        595                 600                 605

Asp Asn His Thr Leu Trp Asp Lys Asn Tyr Leu Ala Ala Lys Ala Asp

    610                 615                 620

Lys Lys Lys Glu Trp Thr Glu Glu Glu Leu Lys Asn Ala Gln Lys Leu

625                 630                 635                 640

Ala Gly Ala Ile Leu Leu Thr Ser Gln Gly Val Pro Phe Leu His Gly

                645                 650                 655

Gly Gln Asp Phe Cys Arg Thr Thr Asn Phe Asn Asp Asn Ser Tyr Asn

            660                 665                 670

Ala Pro Ile Ser Ile Asn Gly Phe Asp Tyr Glu Arg Lys Leu Gln Phe

        675                 680                 685

Ile Asp Val Phe Asn Tyr His Lys Gly Leu Ile Lys Leu Arg Lys Glu

    690                 695                 700

His Pro Ala Phe Arg Leu Lys Asn Ala Glu Glu Ile Lys Lys His Leu

705                 710                 715                 720

Glu Phe Leu Pro Gly Gly Arg Arg Ile Val Ala Phe Met Leu Lys Asp

                725                 730                 735

His Ala Gly Gly Asp Pro Trp Lys Asp Ile Val Val Ile Tyr Asn Gly

            740                 745                 750

Asn Leu Glu Lys Thr Thr Tyr Lys Leu Pro Glu Gly Lys Trp Asn Val

        755                 760                 765

Val Val Asn Ser Gln Lys Ala Gly Thr Glu Val Ile Glu Thr Val Glu

    770                 775                 780

Gly Thr Ile Glu Leu Asp Pro Leu Ser Ala Tyr Val Leu Tyr Arg Glu

785                 790                 795                 800

<210>4

<211>2400

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>4

atgggccact ggtacaagca ccagcgcgcc taccagttca ccggcgagga cgacttcggg    60

aaggtggccg tggtgaagct cccgatggac ctcaccaagg tgggcatcat cgtgcgcctc    120

aacgagtggc aggcgaagga cgtggccaag gaccgcttca tcgagatcaa ggacggcaag    180

gccgaggtgt ggatactcca gggcgtggag gagatcttct acgagaagcc ggacacctcc    240

ccgcgcatct tcttcgccca ggcccgctcc aacaaggtga tcgaggcctt cctcaccaac    300

ccggtggaca ccaagaagaa ggagctgttc aaggtgaccg tcgacggcaa ggagatcccg    360

gtgtcccgcg tggagaaggc cgacccgacc gacatcgacg tgaccaacta cgtgcgcatc    420

gtgctctccg agtccctcaa ggaggaggac ctccgcaagg acgtggagct gatcatcgag    480

ggctacaagc cggcccgcgt gatcatgatg gagatcctcg acgactacta ctacgacggc    540

gagctggggg cggtgtactc cccggagaag accatcttcc gcgtgtggtc cccggtgtcc    600

aagtgggtga aggtgctcct cttcaagaac ggcgaggaca ccgagccgta ccaggtggtg    660

aacatggagt acaagggcaa cggcgtgtgg gaggccgtgg tggagggcga cctcgacggc    720

gtgttctacc tctaccagct ggagaactac ggcaagatcc gcaccaccgt ggacccgtac    780

tccaaggccg tgtacgccaa caaccaggag tctgcagtgg tgaacctcgc ccgcaccaac    840

ccggagggct gggagaacga ccgcggcccg aagatcgagg gctacgagga cgccatcatc    900

tacgagatcc acatcgccga catcaccggc ctggagaact ccggcgtgaa gaacaagggc    960

ctctacctcg gcctcaccga ggagaacacc aaggccccgg gcggcgtgac caccggcctc    1020

tcccacctcg tggagctggg cgtgacccac gtgcacatcc tcccgttctt cgacttctac    1080

accggcgacg agctggacaa ggacttcgag aagtactaca actggggcta cgacccgtac    1140

ctcttcatgg tgccggaggg ccgctactcc accgacccga agaacccgca cacccgaatt    1200

cgcgaggtga aggagatggt gaaggccctc cacaagcacg gcatcggcgt gatcatggac    1260

atggtgttcc cgcacaccta cggcatcggc gagctgtccg ccttcgacca gaccgtgccg    1320

tactacttct accgcatcga caagaccggc gcctacctca acgagtccgg ctgcggcaac    1380

gtgatcgcct ccgagcgccc gatgatgcgc aagttcatcg tggacaccgt gacctactgg    1440

gtgaaggagt accacatcga cggcttccgc ttcgaccaga tgggcctcat cgacaagaag    1500

accatgctgg aggtggagcg cgccctccac aagatcgacc cgaccatcat cctctacggc    1560

gagccgtggg gcggctgggg ggccccgatc cgcttcggca agtccgacgt ggccggcacc    1620

cacgtggccg ccttcaacga cgagttccgc gacgccatcc gcggctccgt gttcaacccg    1680

tccgtgaagg gcttcgtgat gggcggctac ggcaaggaga ccaagatcaa gcgcggcgtg    1740

gtgggctcca tcaactacga cggcaagctc atcaagtcct tcgccctcga cccggaggag    1800

accatcaact acgccgcctg ccacgacaac cacaccctct gggacaagaa ctacctcgcc    1860

gccaaggccg acaagaagaa ggagtggacc gaggaggagc tgaagaacgc ccagaagctc    1920

gccggcgcca tcctcctcac tagtcagggc gtgccgttcc tccacggcgg ccaggacttc    1980

tgccgcacca ccaacttcaa cgacaactcc tacaacgccc cgatctccat caacggcttc    2040

gactacgagc gcaagctcca gttcatcgac gtgttcaact accacaaggg cctcatcaag    2100

ctccgcaagg agcacccggc cttccgcctc aagaacgccg aggagatcaa gaagcacctg    2160

gagttcctcc cgggcgggcg ccgcatcgtg gccttcatgc tcaaggacca cgccggcggc    2220

gacccgtgga aggacatcgt ggtgatctac aacggcaacc tggagaagac cacctacaag    2280

ctcccggagg gcaagtggaa cgtggtggtg aactcccaga aggccggcac cgaggtgatc    2340

gagaccgtgg agggcaccat cgagctggac ccgctctccg cctacgtgct ctaccgcgag    2400

<210>5

<211>693

<212>PRT

<213>硫磺矿硫化叶菌

<400>5

Met Glu Thr Ile Lys Ile Tyr Glu Asn Lys Gly Val Tyr Lys Val Val

 1               5                  10                  15

Ile Gly Glu Pro Phe Pro Pro Ile Glu Phe Pro Leu Glu Gln Lys Ile

            20                  25                  30

Ser Ser Asn Lys Ser Leu Ser Glu Leu Gly Leu Thr Ile Val Gln Gln

        35                  40                  45

Gly Asn Lys Val Ile Val Glu Lys Ser Leu Asp Leu Lys Glu His Ile

    50                  55                  60

Ile Gly Leu Gly Glu Lys Ala Phe Glu Leu Asp Arg Lys Arg Lys Arg

65                  70                  75                  80

Tyr Val Met Tyr Asn Val Asp Ala Gly Ala Tyr Lys Lys Tyr Gln Asp

                85                  90                  95

Pro Leu Tyr Val Ser Ile Pro Leu Phe Ile Ser Val Lys Asp Gly Val

            100                 105                 110

Ala Thr Gly Tyr Phe Phe Asn Ser Ala Ser Lys Val Ile Phe Asp Val

        115                 120                 125

Gly Leu Glu Glu Tyr Asp Lys Val Ile Val Thr Ile Pro Glu Asp Ser

    130                 135                 140

Val Glu Phe Tyr Val Ile Glu Gly Pro Arg Ile Glu Asp Val Leu Glu

145                 150                 155                 160

Lys Tyr Thr Glu Leu Thr Gly Lys Pro Phe Leu Pro Pro Met Trp Ala

                165                 170                 175

Phe Gly Tyr Met Ile Ser Arg Tyr Ser Tyr Tyr Pro Gln Asp Lys Val

            180                 185                 190

Val Glu Leu Val Asp Ile Met Gln Lys Glu Gly Phe Arg Val Ala Gly

        195                 200                 205

Val Phe Leu Asp Ile His Tyr Met Asp Ser Tyr Lys Leu Phe Thr Trp

    210                 215                 220

His Pro Tyr Arg Phe Pro Glu Pro Lys Lys Leu Ile Asp Glu Leu His

225                 230                 235                 240

Lys Arg Asn Val Lys Leu Ile Thr Ile Val Asp His Gly Ile Arg Val

                245                 250                 255

Asp Gln Asn Tyr Ser Pro Phe Leu Ser Gly Met Gly Lys Phe Cys Glu

            260                 265                 270

Ile Glu Ser Gly Glu Leu Phe Val Gly Lys Met Trp Pro Gly Thr Thr

        275                 280                 285

Val Tyr Pro Asp Phe Phe Arg Glu Asp Thr Arg Glu Trp Trp Ala Gly

    290                 295                 300

Leu Ile Ser Glu Trp Leu Ser Gln Gly Val Asp Gly Ile Trp Leu Asp

305                 310                 315                 320

Met Asn Glu Pro Thr Asp Phe Ser Arg Ala Ile Glu Ile Arg Asp Val

                325                 330                 335

Leu Ser Ser Leu Pro Val Gln Phe Arg Asp Asp Arg Leu Val Thr Thr

            340                 345                 350

Phe Pro Asp Asn Val Val His Tyr Leu Arg Gly Lys Arg Val Lys His

        355                 360                 365

Glu Lys Val Arg Asn Ala Tyr Pro Leu Tyr Glu Ala Met Ala Thr Phe

    370                 375                 380

Lys Gly Phe Arg Thr Ser His Arg Asn Glu Ile Phe Ile Leu Ser Arg

385                 390                 395                 400

Ala Gly Tyr Ala Gly Ile Gln Arg Tyr Ala Phe Ile Trp Thr Gly Asp

                405                 410                 415

Asn Thr Pro Ser Trp Asp Asp Leu Lys Leu Gln Leu Gln Leu Val Leu

            420                 425                 430

Gly Leu Ser Ile Ser Gly Val Pro Phe Val Gly Cys Asp Ile Gly Gly

        435                 440                 445

Phe Gln Gly Arg Asn Phe Ala Glu Ile Asp Asn Ser Met Asp Leu Leu

    450                 455                 460

Val Lys Tyr Tyr Ala Leu Ala Leu Phe Phe Pro Phe Tyr Arg Ser His

465                 470                 475                 480

Lys Ala Thr Asp Gly Ile Asp Thr Glu Pro Val Phe Leu Pro Asp Tyr

                485                 490                 495

Tyr Lys Glu Lys Val Lys Glu Ile Val Glu Leu Arg Tyr Lys Phe Leu

            500                 505                 510

Pro Tyr Ile Tyr Ser Leu Ala Leu Glu Ala Ser Glu Lys Gly His Pro

        515                 520                 525

Val Ile Arg Pro Leu Phe Tyr Glu Phe Gln Asp Asp Asp Asp Met Tyr

    530                 535                 540

Arg Ile Glu Asp Glu Tyr Met Val Gly Lys Tyr Leu Leu Tyr Ala Pro

545                 550                 555                 560

Ile Val Ser Lys Glu Glu Ser Arg Leu Val Thr Leu Pro Arg Gly Lys

                565                 570                 575

Trp Tyr Asn Tyr Trp Asn Gly Glu Ile Ile Asn Gly Lys Ser Val Val

            580                 585                 590

Lys Ser Thr His Glu Leu Pro Ile Tyr Leu Arg Glu Gly Ser Ile Ile

        595                 600                 605

Pro Leu Glu Gly Asp Glu Leu Ile Val Tyr Gly Glu Thr Ser Phe Lys

    610                 615                 620

Arg Tyr Asp Asn Ala Glu Ile Thr Ser Ser Ser Asn Glu Ile Lys Phe

625                 630                 635                 640

Ser Arg Glu Ile Tyr Val Ser Lys Leu Thr Ile Thr Ser Glu Lys Pro

                645                 650                 655

Val Ser Lys Ile Ile Val Asp Asp Ser Lys Glu Ile Gln Val Glu Lys

            660                 665                 670

Thr Met Gln Asn Thr Tyr Val Ala Lys Ile Asn Gln Lys Ile Arg Gly

        675                 680                 685

Lys Ile Asn Leu Glu

    690

<210>6

<211>2082

<212>DNA

<213>硫磺矿硫化叶菌

<400>6

atggagacca tcaagatcta cgagaacaag ggcgtgtaca aggtggtgat cggcgagccg   60

ttcccgccga tcgagttccc gctcgagcag aagatctcct ccaacaagtc cctctccgag   120

ctgggcctca ccatcgtgca gcagggcaac aaggtgatcg tggagaagtc cctcgacctc   180

aaggagcaca tcatcggcct cggcgagaag gccttcgagc tggaccgcaa gcgcaagcgc   240

tacgtgatgt acaacgtgga cgccggcgcc tacaagaagt accaggaccc gctctacgtg   300

tccatcccgc tcttcatctc cgtgaaggac ggcgtggcca ccggctactt cttcaactcc   360

gcctccaagg tgatcttcga cgtgggcctc gaggagtacg acaaggtgat cgtgaccatc   420

ccggaggact ccgtggagtt ctacgtgatc gagggcccgc gcatcgagga cgtgctcgag   480

aagtacaccg agctgaccgg caagccgttc ctcccgccga tgtgggcctt cggctacatg   540

atctcccgct actcctacta cccgcaggac aaggtggtgg agctggtgga catcatgcag   600

aaggagggct tccgcgtggc cggcgtgttc ctcgacatcc actacatgga ctcctacaag   660

ctcttcacct ggcacccgta ccgcttcccg gagccgaaga agctcatcga cgagctgcac   720

aagcgcaacg tgaagctcat caccatcgtg gaccacggca tccgcgtgga ccagaactac   780

tccccgttcc tctccggcat gggcaagttc tgcgagatcg agtccggcga gctgttcgtg   840

ggcaagatgt ggccgggcac caccgtgtac ccggacttct tccgcgagga cacccgcgag   900

tggtgggccg gcctcatctc cgagtggctc tcccagggcg tggacggcat ctggctcgac   960

atgaacgagc cgaccgactt ctcccgcgcc atcgagatcc gcgacgtgct ctcctccctc   1020

ccggtgcagt tccgcgacga ccgcctcgtg accaccttcc cggacaacgt ggtgcactac   1080

ctccgcggca agcgcgtgaa gcacgagaag gtgcgcaacg cctacccgct ctacgaggcg   1140

atggccacct tcaagggctt ccgcacctcc caccgcaacg agatcttcat cctctcccgc   1200

gccggctacg ccggcatcca gcgctacgcc ttcatctgga ccggcgacaa caccccgtcc   1260

tgggacgacc tcaagctcca gctccagctc gtgctcggcc tctccatctc cggcgtgccg   1320

ttcgtgggct gcgacatcgg cggcttccag ggccgcaact tcgccgagat cgacaactcg   1380

atggacctcc tcgtgaagta ctacgccctc gccctcttct tcccgttcta ccgctcccac   1440

aaggccaccg acggcatcga caccgagccg gtgttcctcc cggactacta caaggagaag   1500

gtgaaggaga tcgtggagct gcgctacaag ttcctcccgt acatctactc cctcgccctc   1560

gaggcctccg agaagggcca cccggtgatc cgcccgctct tctacgagtt ccaggacgac   1620

gacgacatgt accgcatcga ggacgagtac atggtgggca agtacctcct ctacgccccg    1680

atcgtgtcca aggaggagtc ccgcctcgtg accctcccgc gcggcaagtg gtacaactac    1740

tggaacggcg agatcatcaa cggcaagtcc gtggtgaagt ccacccacga gctgccgatc    1800

tacctccgcg agggctccat catcccgctc gagggcgacg agctgatcgt gtacggcgag    1860

acctccttca agcgctacga caacgccgag atcacctcct cctccaacga gatcaagttc    1920

tcccgcgaga tctacgtgtc caagctcacc atcacctccg agaagccggt gtccaagatc    1980

atcgtggacg actccaagga gatccaggtg gagaagacca tgcagaacac ctacgtggcc    2040

aagatcaacc agaagatccg cggcaagatc aacctcgagt ga                       2082

<210>7

<211>1818

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>7

atggcggctc tggccacgtc gcagctcgtc gcaacgcgcg ccggcctggg cgtcccggac    60

gcgtccacgt tccgccgcgg cgccgcgcag ggcctgaggg gggcccgggc gtcggcggcg    120

gcggacacgc tcagcatgcg gaccagcgcg cgcgcggcgc ccaggcacca gcaccagcag    180

gcgcgccgcg gggccaggtt cccgtcgctc gtcgtgtgcg ccagcgccgg catgaacgtc    240

gtcttcgtcg gcgccgagat ggcgccgtgg agcaagaccg gaggcctcgg cgacgtcctc    300

ggcggcctgc cgccggccat ggccgcgaac gggcaccgtg tcatggtcgt ctctccccgc    360

tacgaccagt acaaggacgc ctgggacacc agcgtcgtgt ccgagatcaa gatgggagac    420

gggtacgaga cggtcaggtt cttccactgc tacaagcgcg gagtggaccg cgtgttcgtt    480

gaccacccac tgttcctgga gagggtttgg ggaaagaccg aggagaagat ctacgggcct    540

gtcgctggaa cggactacag ggacaaccag ctgcggttca gcctgctatg ccaggcagca    600

cttgaagctc caaggatcct gagcctcaac aacaacccat acttctccgg accatacggg    660

gaggacgtcg tgttcgtctg caacgactgg cacaccggcc ctctctcgtg ctacctcaag    720

agcaactacc agtcccacgg catctacagg gacgcaaaga ccgctttctg catccacaac    780

atctcctacc agggccggtt cgccttctcc gactacccgg agctgaacct ccccgagaga    840

ttcaagtcgt ccttcgattt catcgacggc tacgagaagc ccgtggaagg ccggaagatc    900

aactggatga aggccgggat cctcgaggcc gacagggtcc tcaccgtcag cccctactac    960

gccgaggagc tcatctccgg catcgccagg ggctgcgagc tcgacaacat catgcgcctc    1020

accggcatca ccggcatcgt caacggcatg gacgtcagcg agtgggaccc cagcagggac    1080

aagtacatcg ccgtgaagta cgacgtgtcg acggccgtgg aggccaaggc gctgaacaag    1140

gaggcgctgc aggcggaggt cgggctcccg gtggaccgga acatcccgct ggtggcgttc    1200

atcggcaggc tggaagagca gaagggcccc gacgtcatgg cggccgccat cccgcagctc    1260

atggagatgg tggaggacgt gcagatcgtt ctgctgggca cgggcaagaa gaagttcgag    1320

cgcatgctca tgagcgccga ggagaagttc ccaggcaagg tgcgcgccgt ggtcaagttc    1380

aacgcggcgc tggcgcacca catcatggcc ggcgccgacg tgctcgccgt caccagccgc    1440

ttcgagccct gcggcctcat ccagctgcag gggatgcgat acggaacgcc ctgcgcctgc    1500

gcgtccaccg gtggactcgt cgacaccatc atcgaaggca agaccgggtt ccacatgggc    1560

cgcctcagcg tcgactgcaa cgtcgtggag ccggcggacg tcaagaaggt ggccaccacc    1620

ttgcagcgcg ccatcaaggt ggtcggcacg ccggcgtacg aggagatggt gaggaactgc    1680

atgatccagg atctctcctg gaagggccct gccaagaact gggagaacgt gctgctcagc    1740

ctcggggtcg ccggcggcga gccaggggtt gaaggcgagg agatcgcgcc gctcgccaag    1800

gagaacgtgg ccgcgccc                                                  1818

<210>8

<211>606

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>8

Met Ala Ala Leu Ala Thr Ser Gln Leu Val Ala Thr Arg Ala Gly Leu

 1               5                  10                  15

Gly Val Pro Asp Ala Ser Thr Phe Arg Arg Gly Ala Ala Gln Gly Leu

            20                  25                  30

Arg Gly Ala Arg Ala Ser Ala Ala Ala Asp Thr Leu Ser Met Arg Thr

        35                  40                  45

Ser Ala Arg Ala Ala Pro Arg His Gln His Gln Gln Ala Arg Arg Gly

    50                  55                  60

Ala Arg Phe Pro Ser Leu Val Val Cys Ala Ser Ala Gly Met Asn Val

65                  70                  75                  80

Val Phe Val Gly Ala Glu Met Ala Pro Trp Ser Lys Thr Gly Gly Leu

                85                  90                  95

Gly Asp Val Leu Gly Gly Leu Pro Pro Ala Met Ala Ala Asn Gly His

            100                 105                 110

Arg Val Met Val Val Ser Pro Arg Tyr Asp Gln Tyr Lys Asp Ala Trp

        115                 120                 125

Asp Thr Ser Val Val Ser Glu Ile Lys Met Gly Asp Gly Tyr Glu Thr

    130                 135                 140

Val Arg Phe Phe His Cys Tyr Lys Arg Gly Val Asp Arg Val Phe Val

145                 150                 155                 160

Asp His Pro Leu Phe Leu Glu Arg Val Trp Gly Lys Thr Glu Glu Lys

                165                 170                 175

Ile Tyr Gly Pro Val Ala Gly Thr Asp Tyr Arg Asp Asn Gln Leu Arg

            180                 185                 190

Phe Ser Leu Leu Cys Gln Ala Ala Leu Glu Ala Pro Arg Ile Leu Ser

        195                 200                 205

Leu Asn Asn Asn Pro Tyr Phe Ser Gly Pro Tyr Gly Glu Asp Val Val

    210                 215                 220

Phe Val Cys Asn Asp Trp His Thr Gly Pro Leu Ser Cys Tyr Leu Lys

225                 230                 235                 240

Ser Asn Tyr Gln Ser His Gly Ile Tyr Arg Asp Ala Lys Thr Ala Phe

                245                 250                 255

Cys Ile His Asn Ile Ser Tyr Gln Gly Arg Phe Ala Phe Ser Asp Tyr

            260                 265                 270

Pro Glu Leu Asn Leu Pro Glu Arg Phe Lys Ser Ser Phe Asp Phe Ile

        275                 280                 285

Asp Gly Tyr Glu Lys Pro Val Glu Gly Arg Lys Ile Asn Trp Met Lys

    290                 295                 300

Ala Gly Ile Leu Glu Ala Asp Arg Val Leu Thr Val Ser Pro Tyr Tyr

305                 310                 315                 320

Ala Glu Glu Leu Ile Ser Gly Ile Ala Arg Gly Cys Glu Leu Asp Asn

                325                 330                 335

Ile Met Arg Leu Thr Gly Ile Thr Gly Ile Val Asn Gly Met Asp Val

            340                 345                 350

Ser Glu Trp Asp Pro Ser Arg Asp Lys Tyr Ile Ala Val Lys Tyr Asp

        355                 360                 365

Val Ser Thr Ala Val Glu Ala Lys Ala Leu Asn Lys Glu Ala Leu Gln

    370                 375                 380

Ala Glu Val Gly Leu Pro Val Asp Arg Asn Ile Pro Leu Val Ala Phe

385                 390                 395                 400

Ile Gly Arg Leu Glu Glu Gln Lys Gly Pro Asp Val Met Ala Ala Ala

                405                 410                 415

Ile Pro Gln Leu Met Glu Met Val Glu Asp Val Gln Ile Val Leu Leu

            420                 425                 430

Gly Thr Gly Lys Lys Lys Phe Glu Arg Met Leu Met Ser Ala Glu Glu

        435                 440                 445

Lys Phe Pro Gly Lys Val Arg Ala Val Val Lys Phe Asn Ala Ala Leu

    450                 455                 460

Ala His His Ile Met Ala Gly Ala Asp Val Leu Ala Val Thr Ser Arg

465                 470                 475                 480

Phe Glu Pro Cys Gly Leu Ile Gln Leu Gln Gly Met Arg Tyr Gly Thr

                485                 490                 495

Pro Cys Ala Cys Ala Ser Thr Gly Gly Leu Val Asp Thr Ile Ile Glu

            500                 505                 510

Gly Lys Thr Gly Phe His Met Gly Arg Leu Ser Val Asp Cys Asn Val

        515                 520                 525

Val Glu Pro Ala Asp Val Lys Lys Val Ala Thr Thr Leu Gln Arg Ala

    530                 535                 540

Ile Lys Val Val Gly Thr Pro Ala Tyr Glu Glu Met Val Arg Asn Cys

545                 550                 555                 560

Met Ile Gln Asp Leu Ser Trp Lys Gly Pro Ala Lys Asn Trp Glu Asn

                565                 570                 575

Val Leu Leu Ser Leu Gly Val Ala Gly Gly Glu Pro Gly Val Glu Gly

            580                 585                 590

Glu Glu Ile Ala Pro Leu Ala Lys Glu Asn Val Ala Ala Pro

        595                 600                 605

<210>9

<211>2223

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>9

atggccaagt acctggagct ggaggagggc ggcgtgatca tgcaggcgtt ctactgggac    60

gtcccgagcg gaggcatctg gtgggacacc atccgccaga agatccccga gtggtacgac    120

gccggcatct ccgcgatctg gataccgcca gcttccaagg gcatgtccgg gggctactcg    180

atgggctacg acccgtacga ctacttcgac ctcggcgagt actaccagaa gggcacggtg    240

gagacgcgct tcgggtccaa gcaggagctc atcaacatga tcaacacggc gcacgcctac    300

ggcatcaagg tcatcgcgga catcgtgatc aaccacaggg ccggcggcga cctggagtgg    360

aacccgttcg tcggcgacta cacctggacg gacttctcca aggtcgcctc cggcaagtac    420

accgccaact acctcgactt ccaccccaac gagctgcacg cgggcgactc cggcacgttc    480

ggcggctacc cggacatctg ccacgacaag tcctgggacc agtactggct ctgggcctcg    540

caggagtcct acgcggccta cctgcgctcc atcggcatcg acgcgtggcg cttcgactac    600

gtcaagggct acggggcctg ggtggtcaag gactggctca actggtgggg cggctgggcg    660

gtgggcgagt actgggacac caacgtcgac gcgctgctca actgggccta ctcctccggc    720

gccaaggtgt tcgacttccc cctgtactac aagatggacg cggccttcga caacaagaac    780

atcccggcgc tcgtcgaggc cctgaagaac ggcggcacgg tggtctcccg cgacccgttc    840

aaggccgtga ccttcgtcgc caaccacgac acggacatca tctggaacaa gtacccggcg    900

tacgccttca tcctcaccta cgagggccag cccacgatct tctaccgcga ctacgaggag    960

tggctgaaca aggacaagct caagaacctg atctggattc acgacaacct cgcgggcggc    1020

tccactagta tcgtgtacta cgactccgac gagatgatct tcgtccgcaa cggctacggc    1080

tccaagcccg gcctgatcac gtacatcaac ctgggctcct ccaaggtggg ccgctgggtg    1140

tacgtcccga agttcgccgg cgcgtgcatc cacgagtaca ccggcaacct cggcggctgg    1200

gtggacaagt acgtgtactc ctccggctgg gtctacctgg aggccccggc ctacgacccc    1260

gccaacggcc agtacggcta ctccgtgtgg tcctactgcg gcgtcggcac atcgattgct    1320

ggcatcctcg aggccgacag ggtcctcacc gtcagcccct actacgccga ggagctcatc    1380

tccggcatcg ccaggggctg cgagctcgac aacatcatgc gcctcaccgg catcaccggc    1440

atcgtcaacg gcatggacgt cagcgagtgg gaccccagca gggacaagta catcgccgtg    1500

aagtacgacg tgtcgacggc cgtggaggcc aaggcgctga acaaggaggc gctgcaggcg    1560

gaggtcgggc tcccggtgga ccggaacatc ccgctggtgg cgttcatcgg caggctggaa    1620

gagcagaagg gccccgacgt catggcggcc gccatcccgc agctcatgga gatggtggag    1680

gacgtgcaga tcgttctgct gggcacgggc aagaagaagt tcgagcgcat gctcatgagc    1740

gccgaggaga agttcccagg caaggtgcgc gccgtggtca agttcaacgc ggcgctggcg    1800

caccacatca tggccggcgc cgacgtgctc gccgtcacca gccgcttcga gccctgcggc    1860

ctcatccagc tgcaggggat gcgatacgga acgccctgcg cctgcgcgtc caccggtgga    1920

ctcgtcgaca ccatcatcga aggcaagacc gggttccaca tgggccgcct cagcgtcgac    1980

tgcaacgtcg tggagccggc ggacgtcaag aaggtggcca ccaccttgca gcgcgccatc    2040

aaggtggtcg gcacgccggc gtacgaggag atggtgagga actgcatgat ccaggatctc    2100

tcctggaagg gccctgccaa gaactgggag aacgtgctgc tcagcctcgg ggtcgccggc    2160

ggcgagccag gggttgaagg cgaggagatc gcgccgctcg ccaaggagaa cgtggccgcg    2220

ccc                                                                  2223

<210>10

<211>741

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>10

Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met Gln Ala

 1               5                  10                  15

Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg

            20                  25                  30

Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile

        35                  40                  45

Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp

    50                  55                  60

Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Thr Val

65                  70                  75                  80

Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile Asn Thr

                85                  90                  95

Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile Asn His

            100                 105                 110

Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp Tyr Thr

        115                 120                 125

Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr

    130                 135                 140

Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe

145                 150                 155                 160

Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln Tyr Trp

                165                 170                 175

Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly

            180                 185                 190

Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala Trp Val

        195                 200                 205

Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly Glu Tyr

    210                 215                 220

Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly

225                 230                 235                 240

Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe

                245                 250                 255

Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn Gly Gly

            260                 265                 270

Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala Asn

        275                 280                 285

His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile

    290                 295                 300

Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu

305                 310                 315                 320

Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn

                325                 330                 335

Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp Glu Met

            340                 345                 350

Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr

        355                 360                 365

Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val Pro Lys

    370                 375                 380

Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp

385                 390                 395                 400

Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu Ala Pro

                405                 410                 415

Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr

            420                 425                 430

Cys Gly Val Gly Thr Ser Ile Ala Gly Ile Leu Glu Ala Asp Arg Val

        435                 440                 445

Leu Thr Val Ser Pro Tyr Tyr Ala Glu Glu Leu Ile Ser Gly Ile Ala

    450                 455                 460

Arg Gly Cys Glu Leu Asp Asn Ile Met Arg Leu Thr Gly Ile Thr Gly

465                 470                 475                 480

Ile Val Asn Gly Met Asp Val Ser Glu Trp Asp Pro Ser Arg Asp Lys

                485                 490                 495

Tyr Ile Ala Val Lys Tyr Asp Val Ser Thr Ala Val Glu Ala Lys Ala

            500                 505                 510

Leu Asn Lys Glu Ala Leu Gln Ala Glu Val Gly Leu Pro Val Asp Arg

        515                 520                 525

Asn Ile Pro Leu Val Ala Phe Ile Gly Arg Leu Glu Glu Gln Lys Gly

    530                 535                 540

Pro Asp Val Met Ala Ala Ala Ile Pro Gln Leu Met Glu Met Val Glu

545                 550                 555                 560

Asp Val Gln Ile Val Leu Leu Gly Thr Gly Lys Lys Lys Phe Glu Arg

                565                 570                 575

Met Leu Met Ser Ala Glu Glu Lys Phe Pro Gly Lys Val Arg Ala Val

            580                 585                 590

Val Lys Phe Asn Ala Ala Leu Ala His His Ile Met Ala Gly Ala Asp

        595                 600                 605

Val Leu Ala Val Thr Ser Arg Phe Glu Pro Cys Gly Leu Ile Gln Leu

    610                 615                 620

Gln Gly Met Arg Tyr Gly Thr Pro Cys Ala Cys Ala Ser Thr Gly Gly

625                 630                 635                 640

Leu Val Asp Thr Ile Ile Glu Gly Lys Thr Gly Phe His Met Gly Arg

                645                 650                 655

Leu Ser Val Asp Cys Asn Val Val Glu Pro Ala Asp Val Lys Lys Val

            660                 665                 670

Ala Thr Thr Leu Gln Arg Ala Ile Lys Val Val Gly Thr Pro Ala Tyr

        675                 680                 685

Glu Glu Met Val Arg Asn Cys Met Ile Gln Asp Leu Ser Trp Lys Gly

    690                 695                 700

Pro Ala Lys Asn Trp Glu Asn Val Leu Leu Ser Leu Gly Val Ala Gly

705                 710                 715                 720

Gly Glu Pro Gly Val Glu Gly Glu Glu Ile Ala Pro Leu Ala Lys Glu

                725                 730                 735

Asn Val Ala Ala Pro

            740

<210>11

<211>1515

<212>DNA

<213>玉蜀黍

<400>11

ggagagctat gagacgtatg tcctcaaagc cactttgcat tgtgtgaaac caatatcgat    60

ctttgttact tcatcatgca tgaacatttg tggaaactac tagcttacaa gcattagtga    120

cagctcagaa aaaagttatc tatgaaaggt ttcatgtgta ccgtgggaaa tgagaaatgt    180

tgccaactca aacaccttca atatgttgtt tgcaggcaaa ctcttctgga agaaaggtgt    240

ctaaaactat gaacgggtta cagaaaggta taaaccacgg ctgtgcattt tggaagtatc    300

atctatagat gtctgttgag gggaaagccg tacgccaacg ttatttactc agaaacagct    360

tcaacacaca gttgtctgct ttatgatggc atctccaccc aggcacccac catcacctat    420

ctctcgtgcc tgtttatttt cttgcccttt ctgatcataa aaaaacatta agagtttgca    480

aacatgcata ggcatatcaa tatgctcatt tattaatttg ctagcagatc atcttcctac    540

tctttacttt atttattgtt tgaaaaatat gtcctgcacc tagggagctc gtatacagta    600

ccaatgcatc ttcattaaat gtgaatttca gaaaggaagt aggaacctat gagagtattt    660

ttcaaaatta attagcggct tctattatgt ttatagcaaa ggccaagggc aaaattggaa    720

cactaatgat ggttggttgc atgagtctgt cgattacttg caagaaatgt gaacctttgt    780

ttctgtgcgt gggcataaaa caaacagctt ctagcctctt ttacggtact tgcacttgca    840

agaaatgtga actccttttc atttctgtat gtggacataa tgccaaagca tccaggcttt    900

ttcatggttg ttgatgtctt tacacagttc atctccacca gtatgccctc ctcatactct    960

atataaacac atcaacagca tcgcaattag ccacaagatc acttcgggag gcaagtgcga    1020

tttcgatctc gcagccacct ttttttgttc tgttgtaagt ataccttccc ttaccatctt    1080

tatctgttag tttaatttgt aattgggaag tattagtgga aagaggatga gatgctatca    1140

tctatgtact ctgcaaatgc atctgacgtt atatgggctg cttcatataa tttgaattgc    1200

tccattcttg ccgacaatat attgcaaggt atatgcctag ttccatcaaa agttctgttt    1260

tttcattcta aaagcatttt agtggcacac aatttttgtc catgagggaa aggaaatctg    1320

ttttggttac tttgcttgag gtgcattctt catatgtcca gttttatgga agtaataaac    1380

ttcagtttgg tcataagatg tcatattaaa gggcaaacat atattcaatg ttcaattcat    1440

cgtaaatgtt ccctttttgt aaaagattgc atactcattt atttgagttg caggtgtatc    1500

tagtagttgg aggag                                                     1515

<210>12

<211>673

<212>DNA

<213>玉蜀黍

<400>12

gatcatccag gtgcaaccgt ataagtccta aagtggtgag gaacacgaaa caaccatgca    60

ttggcatgta aagctccaag aatttgttgt atccttaaca actcacagaa catcaaccaa    120

aattgcacgt caagggtatt gggtaagaaa caatcaaaca aatcctctct gtgtgcaaag    180

aaacacggtg agtcatgccg agatcatact catctgatat acatgcttac agctcacaag    240

acattacaaa caactcatat tgcattacaa agatcgtttc atgaaaaata aaataggccg    300

gacaggacaa aaatccttga cgtgtaaagt aaatttacaa caaaaaaaaa gccatatgtc    360

aagctaaatc taattcgttt tacgtagatc aacaacctgt agaaggcaac aaaactgagc    420

cacgcagaag tacagaatga ttccagatga accatcgacg tgctacgtaa agagagtgac    480

gagtcatata catttggcaa gaaaccatga agctgcctac agccgtctcg gtggcataag    540

aacacaagaa attgtgttaa ttaatcaaag ctataaataa cgctcgcatg cctgtgcact    600

tctccatcac caccactggg tcttcagacc attagcttta tctactccag agcgcagaag    660

aacccgatcg aca                                                       673

<210>13

<211>454

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>13

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

 1               5                  10                  15

Ala Thr Ser Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met

            20                  25                  30

Gln Ala Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr

        35                  40                  45

Ile Arg Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile

    50                  55                  60

Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly

65                  70                  75                  80

Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly

                85                  90                  95

Thr Val Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile

            100                 105                 110

Asn Thr Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile

        115                 120                 125

Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp

    130                 135                 140

Tyr Thr Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala

145                 150                 155                 160

Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly

                165                 170                 175

Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln

            180                 185                 190

Tyr Trp Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser

        195                 200                 205

Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala

    210                 215                 220

Trp Val Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly

225                 230                 235                 240

Glu Tyr Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser

                245                 250                 255

Ser Gly Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala

            260                 265                 270

Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn

        275                 280                 285

Gly Gly Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val

    290                 295                 300

Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala

305                 310                 315                 320

Phe Ile Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr

                325                 330                 335

Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His

            340                 345                 350

Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp

        355                 360                 365

Glu Met Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile

    370                 375                 380

Thr Tyr Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val

385                 390                 395                 400

Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly

                405                 410                 415

Gly Trp Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu

            420                 425                 430

Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp

        435                 440                 445

Ser Tyr Cys Gly Val Gly

    450

<210>14

<211>460

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>14

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

 1               5                  10                  15

Ala Thr Ser Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met

            20                  25                  30

Gln Ala Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr

        35                  40                  45

Ile Arg Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile

    50                  55                  60

Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly

65                  70                  75                  80

Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly

                85                  90                  95

Thr Val Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile

            100                 105                 110

Asn Thr Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile

        115                 120                 125

Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp

    130                 135                 140

Tyr Thr Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala

145                 150                 155                 160

Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly

                165                 170                 175

Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln

            180                 185                 190

Tyr Trp Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser

        195                 200                 205

Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala

    210                 215                 220

Trp Val Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly

225                 230                 235                 240

Glu Tyr Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser

                245                 250                 255

Ser Gly Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala

            260                 265                 270

Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn

        275                 280                 285

Gly Gly Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val

    290                 295                 300

Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala

305                 310                 315                 320

Phe Ile Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr

                325                 330                 335

Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His

            340                 345                 350

Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp

        355                 360                 365

Glu Met Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile

    370                 375                 380

Thr Tyr Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val

385                 390                 395                 400

Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly

                405                 410                 415

Gly Trp Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu

            420                 425                 430

Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp

        435                 440                 445

Ser Tyr Cys Gly Val Gly Ser Glu Lys Asp Glu Leu

    450                 455                 460

<210>15

<211>518

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>15

Met Leu Ala Ala Leu Ala Thr Ser Gln Leu Val Ala Thr Arg Ala Gly

 1               5                  10                  15

Leu Gly Val Pro Asp Ala Ser Thr Phe Arg Arg Gly Ala Ala Gln Gly

            20                  25                  30

Leu Arg Gly Ala Arg Ala Ser Ala Ala Ala Asp Thr Leu Ser Met Arg

        35                  40                  45

Thr Ser Ala Arg Ala Ala Pro Arg His Gln His Gln Gln Ala Arg Arg

    50                  55                  60

Gly Ala Arg Phe Pro Ser Leu Val Val Cys Ala Ser Ala Gly Ala Met

65                  70                  75                  80

Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met Gln Ala Phe

                85                  90                  95

Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg Gln

            100                 105                 110

Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro

        115                 120                 125

Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro

    130                 135                 140

Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Thr Val Glu

145                 150                 155                 160

Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile Asn Thr Ala

                165                 170                 175

His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile Asn His Arg

            180                 185                 190

Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp Tyr Thr Trp

        195                 200                 205

Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu

    210                 215                 220

Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly

225                 230                 235                 240

Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln Tyr Trp Leu

                245                 250                 255

Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile

            260                 265                 270

Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala Trp Val Val

        275                 280                 285

Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly Glu Tyr Trp

    290                 295                 300

Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala

305                 310                 315                 320

Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe Asp

                325                 330                 335

Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn Gly Gly Thr

            340                 345                 350

Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala Asn His

        355                 360                 365

Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu

    370                 375                 380

Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp

385                 390                 395                 400

Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu

                405                 410                 415

Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp Glu Met Ile

            420                 425                 430

Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile

        435                 440                 445

Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val Pro Lys Phe

    450                 455                 460

Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Val

465                 470                 475                 480

Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu Ala Pro Ala

                485                 490                 495

Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr Cys

            500                 505                 510

Gly Val Gly Thr Ser Ile

        515

<210>16

<211>820

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>16

Met Leu Ala Ala Leu Ala Thr Ser Gln Leu Val Ala Thr Arg Ala Gly

 1               5                  10                  15

Leu Gly Val Pro Asp Ala Ser Thr Phe Arg Arg Gly Ala Ala Gln Gly

            20                  25                  30

Leu Arg Gly Ala Arg Ala Ser Ala Ala Ala Asp Thr Leu Ser Met Arg

        35                  40                  45

Thr Ser Ala Arg Ala Ala Pro Arg His Gln His Gln Gln Ala Arg Arg

    50                  55                  60

Gly Ala Arg Phe Pro Ser Leu Val Val Cys Ala Ser Ala Gly Ala Met

65                  70                  75                  80

Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met Gln Ala Phe

                85                  90                  95

Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg Gln

            100                 105                 110

Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro

        115                 120                 125

Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro

    130                 135                 140

Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly Thr Val Glu

145                 150                 155                 160

Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile Asn Thr Ala

                165                 170                 175

His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile Asn His Arg

            180                 185                 190

Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp Tyr Thr Trp

        195                 200                 205

Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu

    210                 215                 220

Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly

225                 230                 235                 240

Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln Tyr Trp Leu

                245                 250                 255

Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile

            260                 265                 270

Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala Trp Val Val

        275                 280                 285

Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly Glu Tyr Trp

    290                 295                 300

Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala

305                 310                 315                 320

Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe Asp

                325                 330                 335

Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn Gly Gly Thr

            340                 345                 350

Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val Ala Asn His

        355                 360                 365

Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu

    370                 375                 380

Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp

385                 390                 395                 400

Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu

                405                 410                 415

Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp Glu Met Ile

            420                 425                 430

Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile

        435                 440                 445

Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val Pro Lys Phe

    450                 455                 460

Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Val

465                 470                 475                 480

Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu Ala Pro Ala

                485                 490                 495

Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp Ser Tyr Cys

            500                 505                 510

Gly Val Gly Thr Ser Ile Ala Gly Ile Leu Glu Ala Asp Arg Val Leu

        515                 520                 525

Thr Val Ser Pro Tyr Tyr Ala Glu Glu Leu Ile Ser Gly Ile Ala Arg

    530                 535                 540

Gly Cys Glu Leu Asp Asn Ile Met Arg Leu Thr Gly Ile Thr Gly Ile

545                 550                 555                 560

Val Asn Gly Met Asp Val Ser Glu Trp Asp Pro Ser Arg Asp Lys Tyr

                565                 570                 575

Ile Ala Val Lys Tyr Asp Val Ser Thr Ala Val Glu Ala Lys Ala Leu

            580                 585                 590

Asn Lys Glu Ala Leu Gln Ala Glu Val Gly Leu Pro Val Asp Arg Asn

        595                 600                 605

Ile Pro Leu Val Ala Phe Ile Gly Arg Leu Glu Glu Gln Lys Gly Pro

    610                 615                 620

Asp Val Met Ala Ala Ala Ile Pro Gln Leu Met Glu Met Val Glu Asp

625                 630                 635                 640

Val Gln Ile Val Leu Leu Gly Thr Gly Lys Lys Lys Phe Glu Arg Met

                645                 650                 655

Leu Met Ser Ala Glu Glu Lys Phe Pro Gly Lys Val Arg Ala Val Val

            660                 665                 670

Lys Phe Asn Ala Ala Leu Ala His His Ile Met Ala Gly Ala Asp Val

        675                 680                 685

Leu Ala Val Thr Ser Arg Phe Glu Pro Cys Gly Leu Ile Gln Leu Gln

    690                 695                 700

Gly Met Arg Tyr Gly Thr Pro Cys Ala Cys Ala Ser Thr Gly Gly Leu

705                 710                 715                 720

Val Asp Thr Ile Ile Glu Gly Lys Thr Gly Phe His Met Gly Arg Leu

                725                 730                 735

Ser Val Asp Cys Asn Val Val Glu Pro Ala Asp Val Lys Lys Val Ala

            740                 745                 750

Thr Thr Leu Gln Arg Ala Ile Lys Val Val Gly Thr Pro Ala Tyr Glu

        755                 760                 765

Glu Met Val Arg Asn Cys Met Ile Gln Asp Leu Ser Trp Lys Gly Pro

    770                 775                 780

Ala Lys Asn Trp Glu Asn Val Leu Leu Ser Leu Gly Val Ala Gly Gly

785                 790                 795                 800

Glu Pro Gly Val Glu Gly Glu Glu Ile Ala Pro Leu Ala Lys Glu Asn

                805                 810                 815

Val Ala Ala Pro

            820

<210>17

<211>19

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>17

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

 1               5                  10                  15

Ala Thr Ser

<210>18

<211>444

<212>PRT

<213>海栖热袍菌

<400>18

Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Ile Gln Phe Glu Gly Lys

 1               5                  10                  15

Glu Ser Thr Asn Pro Leu Ala Phe Arg Phe Tyr Asp Pro Asn Glu Val

            20                  25                  30

Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser Val Ala Phe

        35                  40                  45

Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly Asp Pro Thr

    50                  55                  60

Ala Glu Arg Pro Trp Asn Arg Phe Ser Asp Pro Met Asp Lys Ala Phe

65                  70                  75                  80

Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu Asn Ile Glu

                85                  90                  95

Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly Lys Thr Leu

            100                 105                 110

Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg Ile Lys Glu

        115                 120                 125

Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr Ala Asn Leu

    130                 135                 140

Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr Cys Ser Ala

145                 150                 155                 160

Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala Leu Glu Ile

                165                 170                 175

Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly Gly Arg Glu

            180                 185                 190

Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Leu Glu Leu Glu Asn

        195                 200                 205

Leu Ala Arg Phe Leu Arg Met Ala Val Glu Tyr Ala Lys Lys Ile Gly

    210                 215                 220

Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu Pro Thr Lys

225                 230                 235                 240

His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe Leu Lys Asn

                245                 250                 255

His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala Asn His Ala

            260                 265                 270

Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met Ala Arg Ile

        275                 280                 285

Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp Leu Leu Leu

    290                 295                 300

Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Ile Tyr Asp Thr Thr Leu

305                 310                 315                 320

Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys Gly Gly Leu

                325                 330                 335

Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val Glu Asp Leu

            340                 345                 350

Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu Gly Phe Lys

        355                 360                 365

Ile Ala Tyr Lys Leu Ala Lys Asp Gly Val Phe Asp Lys Phe Ile Glu

    370                 375                 380

Glu Lys Tyr Arg Ser Phe Lys Glu Gly Ile Gly Lys Glu Ile Val Glu

385                 390                 395                 400

Gly Lys Thr Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile Asp Lys Glu

                405                 410                 415

Asp Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu Ser Leu Leu

            420                 425                 430

Asn Ser Tyr Ile Val Lys Thr Ile Ala Glu Leu Arg

        435                 440

<210>19

<211>1335

<212>DNA

<213>海栖热袍菌

<400>19

atggccgagt tcttcccgga gatcccgaag atccagttcg agggcaagga gtccaccaac   60

ccgctcgcct tccgcttcta cgacccgaac gaggtgatcg acggcaagcc gctcaaggac   120

cacctcaagt tctccgtggc cttctggcac accttcgtga acgagggccg cgacccgttc   180

ggcgacccga ccgccgagcg cccgtggaac cgcttctccg acccgatgga caaggccttc   240

gcccgcgtgg acgccctctt cgagttctgc gagaagctca acatcgagta cttctgcttc   300

cacgaccgcg acatcgcccc ggagggcaag accctccgcg agaccaacaa gatcctcgac   360

aaggtggtgg agcgcatcaa ggagcgcatg aaggactcca acgtgaagct cctctggggc   420

accgccaacc tcttctccca cccgcgctac atgcacggcg ccgccaccac ctgctccgcc   480

gacgtgttcg cctacgccgc cgcccaggtg aagaaggccc tggagatcac caaggagctg   540

ggcggcgagg gctacgtgtt ctggggcggc cgcgagggct acgagaccct cctcaacacc   600

gacctcggcc tggagctgga gaacctcgcc cgcttcctcc gcatggccgt ggagtacgcc   660

aagaagatcg gcttcaccgg ccagttcctc atcgagccga agccgaagga gccgaccaag   720

caccagtacg acttcgacgt ggccaccgcc tacgccttcc tcaagaacca cggcctcgac   780

gagtacttca agttcaacat cgaggccaac cacgccaccc tcgccggcca caccttccag   840

cacgagctgc gcatggcccg catcctcggc aagctcggct ccatcgacgc caaccagggc   900

gacctcctcc tcggctggga caccgaccag ttcccgacca acatctacga caccaccctc   960

gccatgtacg aggtgatcaa ggccggcggc ttcaccaagg gcggcctcaa cttcgacgcc   1020

aaggtgcgcc gcgcctccta caaggtggag gacctcttca tcggccacat cgccggcatg   1080

gacaccttcg ccctcggctt caagatcgcc tacaagctcg ccaaggacgg cgtgttcgac   1140

aagttcatcg aggagaagta ccgctccttc aaggagggca tcggcaagga gatcgtggag   1200

ggcaagaccg acttcgagaa gctggaggag tacatcatcg acaaggagga catcgagctg   1260

ccgtccggca agcaggagta cctggagtcc ctcctcaact cctacatcgt gaagaccatc   1320

gccgagctgc gctga                                                    1335

<210>20

<211>444

<212>PRT

<213>那不勒斯栖热袍菌

<400>20

Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Val Gln Phe Glu Gly Lys

 1               5                  10                  15

Glu Ser Thr Asn Pro Leu Ala Phe Lys Phe Tyr Asp Pro Glu Glu Ile

            20                  25                  30

Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser Val Ala Phe

        35                  40                  45

Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly Asp Pro Thr

    50                  55                  60

Ala Asp Arg Pro Trp Asn Arg Tyr Thr Asp Pro Met Asp Lys Ala Phe

65                  70                  75                  80

Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu Asn Ile Glu

                85                  90                  95

Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly Lys Thr Leu

            100                 105                 110

Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg Ile Lys Glu

        115                 120                 125

Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr Ala Asn Leu

   130                 135                 140

Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr Cys Ser Ala

145                 150                 155                 160

Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala Leu Glu Ile

                165                 170                 175

Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly Gly Arg Glu

            180                 185                 190

Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Phe Glu Leu Glu Asn

        195                 200                 205

Leu Ala Arg Phe Leu Arg Met Ala Val Asp Tyr Ala Lys Arg Ile Gly

    210                 215                 220

Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu Pro Thr Lys

225                 230                 235                 240

His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe Leu Lys Ser

                245                 250                 255

His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala Asn His Ala

            260                 265                 270

Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met Ala Arg Ile

        275                 280                 285

Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp Leu Leu Leu

    290                 295                 300

Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Val Tyr Asp Thr Thr Leu

305                 310                 315                 320

Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys Gly Gly Leu

                325                 330                 335

Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val Glu Asp Leu

            340                 345                 350

Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu Gly Phe Lys

        355                 360                 365

Val Ala Tyr Lys Leu Val Lys Asp Gly Val Leu Asp Lys Phe Ile Glu

    370                 375                 380

Glu Lys Tyr Arg Ser Phe Arg Glu Gly Ile Gly Arg Asp Ile Val Glu

385                 390                 395                 400

Gly Lys Val Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile Asp Lys Glu

                405                 410                 415

Thr Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu Ser Leu Ile

            420                 425                 430

Asn Ser Tyr Ile Val Lys Thr Ile Leu Glu Leu Arg

        435                 440

<210>21

<211>1335

<212>DNA

<213>那不勒斯栖热袍菌

<400>21

atggccgagt tcttcccgga gatcccgaag gtgcagttcg agggcaagga gtccaccaac   60

ccgctcgcct tcaagttcta cgacccggag gagatcatcg acggcaagcc gctcaaggac   120

cacctcaagt tctccgtggc cttctggcac accttcgtga acgagggccg cgacccgttc   180

ggcgacccga ccgccgaccg cccgtggaac cgctacaccg acccgatgga caaggccttc   240

gcccgcgtgg acgccctctt cgagttctgc gagaagctca acatcgagta cttctgcttc   300

cacgaccgcg acatcgcccc ggagggcaag accctccgcg agaccaacaa gatcctcgac   360

aaggtggtgg agcgcatcaa ggagcgcatg aaggactcca acgtgaagct cctctggggc   420

accgccaacc tcttctccca cccgcgctac atgcacggcg ccgccaccac ctgctccgcc   480

gacgtgttcg cctacgccgc cgcccaggtg aagaaggccc tggagatcac caaggagctg   540

ggcggcgagg gctacgtgtt ctggggcggc cgcgagggct acgagaccct cctcaacacc   600

gacctcggct tcgagctgga gaacctcgcc cgcttcctcc gcatggccgt ggactacgcc   660

aagcgcatcg gcttcaccgg ccagttcctc atcgagccga agccgaagga gccgaccaag   720

caccagtacg acttcgacgt ggccaccgcc tacgccttcc tcaagtccca cggcctcgac   780

gagtacttca agttcaacat cgaggccaac cacgccaccc tcgccggcca caccttccag   840

cacgagctgc gcatggcccg catcctcggc aagctcggct ccatcgacgc caaccagggc   900

gacctcctcc tcggctggga caccgaccag ttcccgacca acgtgtacga caccaccctc   960

gccatgtacg aggtgatcaa ggccggcggc ttcaccaagg gcggcctcaa cttcgacgcc   1020

aaggtgcgcc gcgcctccta caaggtggag gacctcttca tcggccacat cgccggcatg   1080

gacaccttcg ccctcggctt caaggtggcc tacaagctcg tgaaggacgg cgtgctcgac   1140

aagttcatcg aggagaagta ccgctccttc cgcgagggca tcggccgcga catcgtggag   1200

ggcaaggtgg acttcgagaa gctggaggag tacatcatcg acaaggagac catcgagctg   1260

ccgtccggca agcaggagta cctggagtcc ctcatcaact cctacatcgt gaagaccatc   1320

ctggagctgc gctga                                                    1335

<210>22

<211>28

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>22

agcgaattca tggcggctct ggccacgt                                      28

<210>23

<211>29

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>23

agctaagctt cagggcgcgg ccacgttct                                     29

<210>24

<211>825

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>24

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

 1               5                  10                  15

Ala Thr Ser Ala Gly His Trp Tyr Lys His Gln Arg Ala Tyr Gln Phe

            20                  25                  30

Thr Gly Glu Asp Asp Phe Gly Lys Val Ala Val Val Lys Leu Pro Met

        35                  40                  45

Asp Leu Thr Lys Val Gly Ile Ile Val Arg Leu Asn Glu Trp Gln Ala

    50                  55                  60

Lys Asp Val Ala Lys Asp Arg Phe Ile Glu Ile Lys Asp Gly Lys Ala

65                  70                  75                  80

Glu Val Trp Ile Leu Gln Gly Val Glu Glu Ile Phe Tyr Glu Lys Pro

                85                  90                  95

Asp Thr Ser Pro Arg Ile Phe Phe Ala Gln Ala Arg Ser Asn Lys Val

            100                 105                 110

Ile Glu Ala Phe Leu Thr Asn Pro Val Asp Thr Lys Lys Lys Glu Leu

        115                 120                 125

Phe Lys Val Thr Val Asp Gly Lys Glu Ile Pro Val Ser Arg Val Glu

    130                 135                 140

Lys Ala Asp Pro Thr Asp Ile Asp Val Thr Asn Tyr Val Arg Ile Val

145                 150                 155                 160

Leu Ser Glu Ser Leu Lys Glu Glu Asp Leu Arg Lys Asp Val Glu Leu

                165                 170                 175

Ile Ile Glu Gly Tyr Lys Pro Ala Arg Val Ile Met Met Glu Ile Leu

            180                 185                 190

Asp Asp Tyr Tyr Tyr Asp Gly Glu Leu Gly Ala Val Tyr Ser Pro Glu

        195                 200                 205

Lys Thr Ile Phe Arg Val Trp Ser Pro Val Ser Lys Trp Val Lys Val

    210                 215                 220

Leu Leu Phe Lys Asn Gly Glu Asp Thr Glu Pro Tyr Gln Val Val Asn

225                 230                 235                 240

Met Glu Tyr Lys Gly Asn Gly Val Trp Glu Ala Val Val Glu Gly Asp

                245                 250                 255

Leu Asp Gly Val Phe Tyr Leu Tyr Gln Leu Glu Asn Tyr Gly Lys Ile

            260                 265                 270

Arg Thr Thr Val Asp Pro Tyr Ser Lys Ala Val Tyr Ala Asn Asn Gln

        275                 280                 285

Glu Ser Ala Val Val Asn Leu Ala Arg Thr Asn Pro Glu Gly Trp Glu

    290                 295                 300

Asn Asp Arg Gly Pro Lys Ile Glu Gly Tyr Glu Asp Ala Ile Ile Tyr

305                 310                 315                 320

Glu Ile His Ile Ala Asp Ile Thr Gly Leu Glu Asn Ser Gly Val Lys

                325                 330                 335

Asn Lys Gly Leu Tyr Leu Gly Leu Thr Glu Glu Asn Thr Lys Ala Pro

            340                 345                 350

Gly Gly Val Thr Thr Gly Leu Ser His Leu Val Glu Leu Gly Val Thr

        355                 360                 365

His Val His Ile Leu Pro Phe Phe Asp Phe Tyr Thr Gly Asp Glu Leu

    370                 375                 380

Asp Lys Asp Phe Glu Lys Tyr Tyr Asn Trp Gly Tyr Asp Pro Tyr Leu

385                 390                 395                 400

Phe Met Val Pro Glu Gly Arg Tyr Ser Thr Asp Pro Lys Asn Pro His

                405                 410                 415

Thr Arg Ile Arg Glu Val Lys Glu Met Val Lys Ala Leu His Lys His

            420                 425                 430

Gly Ile Gly Val Ile Met Asp Met Val Phe Pro His Thr Tyr Gly Ile

        435                 440                 445

Gly Glu Leu Ser Ala Phe Asp Gln Thr Val Pro Tyr Tyr Phe Tyr Arg

    450                 455                 460

Ile Asp Lys Thr Gly Ala Tyr Leu Asn Glu Ser Gly Cys Gly Asn Val

465                 470                 475                 480

Ile Ala Ser Glu Arg Pro Met Met Arg Lys Phe Ile Val Asp Thr Val

                485                 490                 495

Thr Tyr Trp Val Lys Glu Tyr His Ile Asp Gly Phe Arg Phe Asp Gln

            500                 505                 510

Met Gly Leu Ile Asp Lys Lys Thr Met Leu Glu Val Glu Arg Ala Leu

        515                 520                 525

His Lys Ile Asp Pro Thr Ile Ile Leu Tyr Gly Glu Pro Trp Gly Gly

    530                 535                 540

Trp Gly Ala Pro Ile Arg Phe Gly Lys Ser Asp Val Ala Gly Thr His

545                 550                 555                 560

Val Ala Ala Phe Asn Asp Glu Phe Arg Asp Ala Ile Arg Gly Ser Val

                565                 570                 575

Phe Asn Pro Ser Val Lys Gly Phe Val Met Gly Gly Tyr Gly Lys Glu

            580                 585                 590

Thr Lys Ile Lys Arg Gly Val Val Gly Ser Ile Asn Tyr Asp Gly Lys

        595                 600                 605

Leu Ile Lys Ser Phe Ala Leu Asp Pro Glu Glu Thr Ile Asn Tyr Ala

    610                 615                 620

Ala Cys His Asp Asn His Thr Leu Trp Asp Lys Asn Tyr Leu Ala Ala

625                 630                 635                 640

Lys Ala Asp Lys Lys Lys Glu Trp Thr Glu Glu Glu Leu Lys Asn Ala

                645                 650                 655

Gln Lys Leu Ala Gly Ala Ile Leu Leu Thr Ser Gln Gly Val Pro Phe

            660                 665                 670

Leu His Gly Gly Gln Asp Phe Cys Arg Thr Thr Asn Phe Asn Asp Asn

        675                 680                 685

Ser Tyr Asn Ala Pro Ile Ser Ile Asn Gly Phe Asp Tyr Glu Arg Lys

    690                 695                 700

Leu Gln Phe Ile Asp Val Phe Asn Tyr His Lys Gly Leu Ile Lys Leu

705                 710                 715                 720

Arg Lys Glu His Pro Ala Phe Arg Leu Lys Asn Ala Glu Glu Ile Lys

                725                 730                 735

Lys His Leu Glu Phe Leu Pro Gly Gly Arg Arg Ile Val Ala Phe Met

            740                 745                 750

Leu Lys Asp His Ala Gly Gly Asp Pro Trp Lys Asp Ile Val Val Ile

        755                 760                 765

Tyr Asn Gly Asn Leu Glu Lys Thr Thr Tyr Lys Leu Pro Glu Gly Lys

    770                 775                 780

Trp Asn Val Val Val Asn Ser Gln Lys Ala Gly Thr Glu Val Ile Glu

785                 790                 795                 800

Thr Val Glu Gly Thr Ile Glu Leu Asp Pro Leu Ser Ala Tyr Val Leu

                805                 810                 815

Tyr Arg Glu Ser Glu Lys Asp Glu Leu

            820                 825

<210>25

<211>2478

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>25

atgagggtgt tgctcgttgc cctcgctctc ctggctctcg ctgcgagcgc caccagcgct    60

ggccactggt acaagcacca gcgcgcctac cagttcaccg gcgaggacga cttcgggaag    120

gtggccgtgg tgaagctccc gatggacctc accaaggtgg gcatcatcgt gcgcctcaac    180

gagtggcagg cgaaggacgt ggccaaggac cgcttcatcg agatcaagga cggcaaggcc    240

gaggtgtgga tactccaggg cgtggaggag atcttctacg agaagccgga cacctccccg    300

cgcatcttct tcgcccaggc ccgctccaac aaggtgatcg aggccttcct caccaacccg    360

gtggacacca agaagaagga gctgttcaag gtgaccgtcg acggcaagga gatcccggtg    420

tcccgcgtgg agaaggccga cccgaccgac atcgacgtga ccaactacgt gcgcatcgtg    480

ctctccgagt ccctcaagga ggaggacctc cgcaaggacg tggagctgat catcgagggc    540

tacaagccgg cccgcgtgat catgatggag atcctcgacg actactacta cgacggcgag    600

ctgggggcgg tgtactcccc ggagaagacc atcttccgcg tgtggtcccc ggtgtccaag    660

tgggtgaagg tgctcctctt caagaacggc gaggacaccg agccgtacca ggtggtgaac    720

atggagtaca agggcaacgg cgtgtgggag gccgtggtgg agggcgacct cgacggcgtg    780

ttctacctct accagctgga gaactacggc aagatccgca ccaccgtgga cccgtactcc    840

aaggccgtgt acgccaacaa ccaggagtct gcagtggtga acctcgcccg caccaacccg    900

gagggctggg agaacgaccg cggcccgaag atcgagggct acgaggacgc catcatctac    960

gagatccaca tcgccgacat caccggcctg gagaactccg gcgtgaagaa caagggcctc    1020

tacctcggcc tcaccgagga gaacaccaag gccccgggcg gcgtgaccac cggcctctcc    1080

cacctcgtgg agctgggcgt gacccacgtg cacatcctcc cgttcttcga cttctacacc    1140

ggcgacgagc tggacaagga cttcgagaag tactacaact ggggctacga cccgtacctc    1200

ttcatggtgc cggagggccg ctactccacc gacccgaaga acccgcacac ccgaattcgc    1260

gaggtgaagg agatggtgaa ggccctccac aagcacggca tcggcgtgat catggacatg    1320

gtgttcccgc acacctacgg catcggcgag ctgtccgcct tcgaccagac cgtgccgtac    1380

tacttctacc gcatcgacaa gaccggcgcc tacctcaacg agtccggctg cggcaacgtg    1440

atcgcctccg agcgcccgat gatgcgcaag ttcatcgtgg acaccgtgac ctactgggtg    1500

aaggagtacc acatcgacgg cttccgcttc gaccagatgg gcctcatcga caagaagacc    1560

atgctggagg tggagcgcgc cctccacaag atcgacccga ccatcatcct ctacggcgag    1620

ccgtggggcg gctggggggc cccgatccgc ttcggcaagt ccgacgtggc cggcacccac    1680

gtggccgcct tcaacgacga gttccgcgac gccatccgcg gctccgtgtt caacccgtcc    1740

gtgaagggct tcgtgatggg cggctacggc aaggagacca agatcaagcg cggcgtggtg    1800

ggctccatca actacgacgg caagctcatc aagtccttcg ccctcgaccc ggaggagacc    1860

atcaactacg ccgcctgcca cgacaaccac accctctggg acaagaacta cctcgccgcc    1920

aaggccgaca agaagaagga gtggaccgag gaggagctga agaacgccca gaagctcgcc    1980

ggcgccatcc tcctcactag tcagggcgtg ccgttcctcc acggcggcca ggacttctgc    2040

cgcaccacca acttcaacga caactcctac aacgccccga tctccatcaa cggcttcgac    2100

tacgagcgca agctccagtt catcgacgtg ttcaactacc acaagggcct catcaagctc    2160

cgcaaggagc acccggcctt ccgcctcaag aacgccgagg agatcaagaa gcacctggag    2220

ttcctcccgg gcgggcgccg catcgtggcc ttcatgctca aggaccacgc cggcggcgac    2280

ccgtggaagg acatcgtggt gatctacaac ggcaacctgg agaagaccac ctacaagctc    2340

ccggagggca agtggaacgt ggtggtgaac tcccagaagg ccggcaccga ggtgatcgag    2400

accgtggagg gcaccatcga gctggacccg ctctccgcct acgtgctcta ccgcgagtcc    2460

gagaaggacg agctgtga                                                  2478

<210>26

<211>718

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>26

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

 1               5                  10                  15

Ala Thr Ser Met Glu Thr Ile Lys Ile Tyr Glu Asn Lys Gly Val Tyr

            20                  25                  30

Lys Val Val Ile Gly Glu Pro Phe Pro Pro Ile Glu Phe Pro Leu Glu

        35                  40                  45

Gln Lys Ile Ser Ser Asn Lys Ser Leu Ser Glu Leu Gly Leu Thr Ile

    50                  55                  60

Val Gln Gln Gly Asn Lys Val Ile Val Glu Lys Ser Leu Asp Leu Lys

65                  70                  75                  80

Glu His Ile Ile Gly Leu Gly Glu Lys Ala Phe Glu Leu Asp Arg Lys

                85                  90                  95

Arg Lys Arg Tyr Val Met Tyr Asn Val Asp Ala Gly Ala Tyr Lys Lys

            100                 105                 110

Tyr Gln Asp Pro Leu Tyr Val Ser Ile Pro Leu Phe Ile Ser Val Lys

        115                 120                 125

Asp Gly Val Ala Thr Gly Tyr Phe Phe Asn Ser Ala Ser Lys Val Ile

    130                 135                 140

Phe Asp Val Gly Leu Glu Glu Tyr Asp Lys Val Ile Val Thr Ile Pro

145                 150                 155                 160

Glu Asp Ser Val Glu Phe Tyr Val Ile Glu Gly Pro Arg Ile Glu Asp

                165                 170                 175

Val Leu Glu Lys Tyr Thr Glu Leu Thr Gly Lys Pro Phe Leu Pro Pro

            180                 185                 190

Met Trp Ala Phe Gly Tyr Met Ile Ser Arg Tyr Ser Tyr Tyr Pro Gln

        195                 200                 205

Asp Lys Val Val Glu Leu Val Asp Ile Met Gln Lys Glu Gly Phe Arg

    210                 215                 220

Val Ala Gly Val Phe Leu Asp Ile His Tyr Met Asp Ser Tyr Lys Leu

225                 230                 235                 240

Phe Thr Trp His Pro Tyr Arg Phe Pro Glu Pro Lys Lys Leu Ile Asp

                245                 250                 255

Glu Leu His Lys Arg Asn Val Lys Leu Ile Thr Ile Val Asp His Gly

            260                 265                 270

Ile Arg Val Asp Gln Asn Tyr Ser Pro Phe Leu Ser Gly Met Gly Lys

        275                 280                 285

Phe Cys Glu Ile Glu Ser Gly Glu Leu Phe Val Gly Lys Met Trp Pro

    290                 295                 300

Gly Thr Thr Val Tyr Pro Asp Phe Phe Arg Glu Asp Thr Arg Glu Trp

305                 310                 315                 320

Trp Ala Gly Leu Ile Ser Glu Trp Leu Ser Gln Gly Val Asp Gly Ile

                325                 330                 335

Trp Leu Asp Met Asn Glu Pro Thr Asp Phe Ser Arg Ala Ile Glu Ile

            340                 345                 350

Arg Asp Val Leu Ser Ser Leu Pro Val Gln Phe Arg Asp Asp Arg Leu

        355                 360                 365

Val Thr Thr Phe Pro Asp Asn Val Val His Tyr Leu Arg Gly Lys Arg

    370                 375                 380

Val Lys His Glu Lys Val Arg Asn Ala Tyr Pro Leu Tyr Glu Ala Met

385                 390                 395                 400

Ala Thr Phe Lys Gly Phe Arg Thr Ser His Arg Asn Glu Ile Phe Ile

                405                 410                 415

Leu Ser Arg Ala Gly Tyr Ala Gly Ile Gln Arg Tyr Ala Phe Ile Trp

            420                 425                 430

Thr Gly Asp Asn Thr Pro Ser Trp Asp Asp Leu Lys Leu Gln Leu Gln

        435                 440                 445

Leu Val Leu Gly Leu Ser Ile Ser Gly Val Pro Phe Val Gly Cys Asp

    450                 455                 460

Ile Gly Gly Phe Gln Gly Arg Asn Phe Ala Glu Ile Asp Asn Ser Met

465                 470                 475                 480

Asp Leu Leu Val Lys Tyr Tyr Ala Leu Ala Leu Phe Phe Pro Phe Tyr

                485                 490                 495

Arg Ser His Lys Ala Thr Asp Gly Ile Asp Thr Glu Pro Val Phe Leu

            500                 505                 510

Pro Asp Tyr Tyr Lys Glu Lys Val Lys Glu Ile Val Glu Leu Arg Tyr

        515                 520                 525

Lys Phe Leu Pro Tyr Ile Tyr Ser Leu Ala Leu Glu Ala Ser Glu Lys

    530                 535                 540

Gly His Pro Val Ile Arg Pro Leu Phe Tyr Glu Phe Gln Asp Asp Asp

545                 550                 555                 560

Asp Met Tyr Arg Ile Glu Asp Glu Tyr Met Val Gly Lys Tyr Leu Leu

                565                 570                 575

Tyr Ala Pro Ile Val Ser Lys Glu Glu Ser Arg Leu Val Thr Leu Pro

            580                 585                 590

Arg Gly Lys Trp Tyr Asn Tyr Trp Asn Gly Glu Ile Ile Asn Gly Lys

        595                 600                 605

Ser Val Val Lys Ser Thr His Glu Leu Pro Ile Tyr Leu Arg Glu Gly

    610                 615                 620

Ser Ile Ile Pro Leu Glu Gly Asp Glu Leu Ile Val Tyr Gly Glu Thr

625                 630                 635                 640

Ser Phe Lys Arg Tyr Asp Asn Ala Glu Ile Thr Ser Ser Ser Asn Glu

                645                 650                 655

Ile Lys Phe Ser Arg Glu Ile Tyr Val Ser Lys Leu Thr Ile Thr Ser

            660                 665                 670

Glu Lys Pro Val Ser Lys Ile Ile Val Asp Asp Ser Lys Glu Ile Gln

        675                 680                 685

Val Glu Lys Thr Met Gln Asn Thr Tyr Val Ala Lys Ile Asn Gln Lys

    690                 695                 700

Ile Arg Gly Lys Ile Asn Leu Glu Ser Glu Lys Asp Glu Leu

705                 710                 715

<210>27

<211>712

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>27

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

 1               5                  10                  15

Ala Thr Ser Met Glu Thr Ile Lys Ile Tyr Glu Asn Lys Gly Val Tyr

            20                  25                  30

Lys Val Val Ile Gly Glu Pro Phe Pro Pro Ile Glu Phe Pro Leu Glu

            35                  40                  45

Gln Lys Ile Ser Ser Asn Lys Ser Leu Ser Glu Leu Gly Leu Thr Ile

    50                  55                  60

Val Gln Gln Gly Asn Lys Val Ile Val Glu Lys Ser Leu Asp Leu Lys

65                  70                  75                  80

Glu His Ile Ile Gly Leu Gly Glu Lys Ala Phe Glu Leu Asp Arg Lys

                85                  90                  95

Arg Lys Arg Tyr Val Met Tyr Asn Val Asp Ala Gly Ala Tyr Lys Lys

            100                 105                 110

Tyr Gln Asp Pro Leu Tyr Val Ser Ile Pro Leu Phe Ile Ser Val Lys

        115                 120                 125

Asp Gly Val Ala Thr Gly Tyr Phe Phe Asn Ser Ala Ser Lys Val Ile

    130                 135                 140

Phe Asp Val Gly Leu Glu Glu Tyr Asp Lys Val Ile Val Thr Ile Pro

145                 150                 155                 160

Glu Asp Ser Val Glu Phe Tyr Val Ile Glu Gly Pro Arg Ile Glu Asp

                165                 170                 175

Val Leu Glu Lys Tyr Thr Glu Leu Thr Gly Lys Pro Phe Leu Pro Pro

            180                 185                 190

Met Trp Ala Phe Gly Tyr Met Ile Ser Arg Tyr Ser Tyr Tyr Pro Gln

        195                 200                 205

Asp Lys Val Val Glu Leu Val Asp Ile Met Gln Lys Glu Gly Phe Arg

    210                 215                 220

Val Ala Gly Val Phe Leu Asp Ile His Tyr Met Asp Ser Tyr Lys Leu

225                 230                 235                 240

Phe Thr Trp His Pro Tyr Arg Phe Pro Glu Pro Lys Lys Leu Ile Asp

                245                 250                 255

Glu Leu His Lys Arg Asn Val Lys Leu Ile Thr Ile Val Asp His Gly

            260                 265                 270

Ile Arg Val Asp Gln Asn Tyr Ser Pro Phe Leu Ser Gly Met Gly Lys

        275                 280                 285

Phe Cys Glu Ile Glu Ser Gly Glu Leu Phe Val Gly Lys Met Trp Pro

    290                 295                 300

Gly Thr Thr Val Tyr Pro Asp Phe Phe Arg Glu Asp Thr Arg Glu Trp

305                 310                 315                 320

Trp Ala Gly Leu Ile Ser Glu Trp Leu Ser Gln Gly Val Asp Gly Ile

                325                 330                 335

Trp Leu Asp Met Asn Glu Pro Thr Asp Phe Ser Arg Ala Ile Glu Ile

            340                 345                 350

Arg Asp Val Leu Ser Ser Leu Pro Val Gln Phe Arg Asp Asp Arg Leu

        355                 360                 365

Val Thr Thr Phe Pro Asp Asn Val Val His Tyr Leu Arg Gly Lys Arg

    370                 375                 380

Val Lys His Glu Lys Val Arg Asn Ala Tyr Pro Leu Tyr Glu Ala Met

385                 390                 395                 400

Ala Thr Phe Lys Gly Phe Arg Thr Ser His Arg Asn Glu Ile Phe Ile

                405                 410                 415

Leu Ser Arg Ala Gly Tyr Ala Gly Ile Gln Arg Tyr Ala Phe Ile Trp

            420                 425                 430

Thr Gly Asp Asn Thr Pro Ser Trp Asp Asp Leu Lys Leu Gln Leu Gln

        435                 440                 445

Leu Val Leu Gly Leu Ser Ile Ser Gly Val Pro Phe Val Gly Cys Asp

    450                 455                 460

Ile Gly Gly Phe Gln Gly Arg Asn Phe Ala Glu Ile Asp Asn Ser Met

465                 470                 475                 480

Asp Leu Leu Val Lys Tyr Tyr Ala Leu Ala Leu Phe Phe Pro Phe Tyr

                485                 490                 495

Arg Ser His Lys Ala Thr Asp Gly Ile Asp Thr Glu Pro Val Phe Leu

            500                 505                 510

Pro Asp Tyr Tyr Lys Glu Lys Val Lys Glu Ile Val Glu Leu Arg Tyr

        515                 520                 525

Lys Phe Leu Pro Tyr Ile Tyr Ser Leu Ala Leu Glu Ala Ser Glu Lys

    530                 535                 540

Gly His Pro Val Ile Arg Pro Leu Phe Tyr Glu Phe Gln Asp Asp Asp

545                 550                 555                 560

Asp Met Tyr Arg Ile Glu Asp Glu Tyr Met Val Gly Lys Tyr Leu Leu

                565                 570                 575

Tyr Ala Pro Ile Val Ser Lys Glu Glu Ser Arg Leu Val Thr Leu Pro

            580                 585                 590

Arg Gly Lys Trp Tyr Asn Tyr Trp Asn Gly Glu Ile Ile Asn Gly Lys

        595                 600                 605

Ser Val Val Lys Ser Thr His Glu Leu Pro Ile Tyr Leu Arg Glu Gly

    610                 615                 620

Ser Ile Ile Pro Leu Glu Gly Asp Glu Leu Ile Val Tyr Gly Glu Thr

625                 630                 635                 640

Ser Phe Lys Arg Tyr Asp Asn Ala Glu Ile Thr Ser Ser Ser Asn Glu

                645                 650                 655

Ile Lys Phe Ser Arg Glu Ile Tyr Val Ser Lys Leu Thr Ile Thr Ser

            660                 665                 670

Glu Lys Pro Val Ser Lys Ile Ile Val Asp Asp Ser Lys Glu Ile Gln

        675                 680                 685

Val Glu Lys Thr Met Gln Asn Thr Tyr Val Ala Lys Ile Asn Gln Lys

    690                 695                 700

Ile Arg Gly Lys Ile Asn Leu Glu

705                 710

<210>28

<211>469

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>28

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

 1               5                  10                  15

Ala Thr Ser Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Ile Gln Phe

            20                  25                  30

Glu Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Arg Phe Tyr Asp Pro

        35                  40                  45

Asn Glu Val Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser

    50                  55                  60

Val Ala Phe Tro His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly

65                  70                  75                  80

Asp Pro Thr Ala Glu Arg Pro Trp Asn Arg Phe Ser Asp Pro Met Asp

                85                  90                  95

Lys Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu

            100                 105                 110

Asn Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly

        115                 120                 125

Lys Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg

    130                 135                 140

Ile Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr

145                 150                 155                 160

Ala Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr

                165                 170                 175

Cys Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala

            180                 185                 190

Leu Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly

        195                 200                 205

Gly Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Leu Glu

    210                 215                 220

Leu Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Glu Tyr Ala Lys

225                 230                 235                 240

Lys Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu

                245                 250                 255

Pro Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe

            260                 265                 270

Leu Lys Asn His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala

        275                 280                 285

Asn His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met

    290                 295                 300

Ala Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp

305                 310                 315                 320

Leu Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Ile Tyr Asp

                325                 330                 335

Thr Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys

            340                 345                 350

Gly Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val

        355                 360                 365

Glu Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu

    370                 375                 380

Gly Phe Lys Ile Ala Tyr Lys Leu Ala Lys Asp Gly Val Phe Asp Lys

385                 390                 395                 400

Phe Ile Glu Glu Lys Tyr Arg Ser Phe Lys Glu Gly Ile Gly Lys Glu

                405                 410                 415

Ile Val Glu Gly Lys Thr Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile

            420                 425                 430

Asp Lys Glu Asp Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu

        435                 440                 445

Ser Leu Leu Asn Ser Tyr Ile Val Lys Thr Ile Ala Glu Leu Arg Ser

    450                 455                 460

Glu Lys Asp Glu Leu

465

<210>29

<211>469

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>29

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

 1               5                  10                  15

Ala Thr Ser Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Val Gln Phe

            20                  25                  30

Glu Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Lys Phe Tyr Asp Pro

        35                  40                  45

Glu Glu Ile Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser

    50                  55                  60

Val Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly

65                  70                  75                  80

Asp Pro Thr Ala Asp Arg Pro Trp Asn Arg Tyr Thr Asp Pro Met Asp

                85                  90                  95

Lys Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu

            100                 105                 110

Asn Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly

        115                 120                 125

Lys Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg

    130                 135                 140

Ile Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr

145                 150                 155                 160

Ala Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr

                165                 170                 175

Cys Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala

            180                 185                 190

Leu Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly

    195                 200                 205

Gly Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Phe Glu

    210                 215                 220

Leu Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Asp Tyr Ala Lys

225                 230                 235                 240

Arg Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu

                245                 250                 255

Pro Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe

            260                 265                 270

Leu Lys Ser His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala

        275                 280                 285

Asn His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met

    290                 295                 300

Ala Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp

305                 310                 315                 320

Leu Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Val Tyr Asp

                325                 330                 335

Thr Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys

            340                 345                 350

Gly Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val

        355                 360                 365

Glu Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu

    370                 375                 380

Gly Phe Lys Val Ala Tyr Lys Leu Val Lys Asp Gly Val Leu Asp Lys

385                 390                 395                 400

Phe Ile Glu Glu Lys Tyr Arg Ser Phe Arg Glu Gly Ile Gly Arg Asp

                405                 410                 415

Ile Val Glu Gly Lys Val Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile

            420                 425                 430

Asp Lys Glu Thr Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu

        435                 440                 445

Ser Leu Ile Asn Ser Tyr Ile Val Lys Thr Ile Leu Glu Leu Arg Ser

    450                 455                 460

Glu Lys Asp Glu Leu

465

<210>30

<211>463

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>30

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

 1               5                  10                  15

Ala Thr Ser Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Val Gln Phe

            20                  25                  30

Glu Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Lys Phe Tyr Asp Pro

        35                  40                  45

Glu Glu Ile Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser

    50                  55                  60

Val Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly

65                  70                  75                  80

Asp Pro Thr Ala Asp Arg Pro Trp Asn Arg Tyr Thr Asp Pro Met Asp

                85                  90                  95

Lys Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu

            100                 105                 110

Asn Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly

        115                 120                 125

Lys Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg

    130                 135                 140

Ile Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr

145                 150                 155                 160

Ala Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr

                165                 170                 175

Cys Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala

            180                 185                 190

Leu Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly

        195                 200                 205

Gly Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Phe Glu

    210                 215                 220

Leu Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val A5p Tyr Ala Lys

225                 230                 235                 240

Arg Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu

                245                 250                 255

Pro Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe

            260                 265                 270

Leu Lys Ser His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala

        275                 280                 285

Asn His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met

    290                 295                 300

Ala Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp

305                 310                 315                 320

Leu Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Val Tyr Asp

                325                 330                 335

Thr Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys

            340                 345                 350

Gly Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val

        355                 360                 365

Glu Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu

    370                 375                 380

Gly Phe Lys Val Ala Tyr Lys Leu Val Lys Asp Gly Val Leu Asp Lys

385                 390                 395                 400

Phe Ile Glu Glu Lys Tyr Arg Ser Phe Arg Glu Gly Ile Gly Arg Asp

                405                 410                 415

Ile Val Glu Gly Lys Val Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile

            420                 425                 430

Asp Lys Glu Thr Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu

        435                 440                 445

Ser Leu Ile Asn Ser Tyr Ile Val Lys Thr Ile Leu Glu Leu Arg

    450                 455                 460

<210>31

<211>25

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>31

Met Gly Lys Asn Gly Asn Leu Cys Cys Phe Ser Leu Leu Leu Leu Leu

 1               5                  10                  15

Leu Ala Gly Leu Ala Ser Gly His Gln

            20                  25

<210>32

<211>30

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>32

Met Gly Phe Val Leu Phe Ser Gln Leu Pro Ser Phe Leu Leu Val Ser

 1               5                  10                  15

Thr Leu Leu Leu Phe Leu Val Ile Ser His Ser Cys Arg Ala

            20                  25                  30

<210>33

<211>460

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>33

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

 1               5                  10                  15

Ala Thr Ser Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met

            20                  25                  30

Gln Ala Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr

        35                  40                  45

Ile Arg Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile

    50                  55                  60

Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly

65                  70                  75                  80

Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly

                85                  90                  95

Thr Val Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile

            100                 105                 110

Asn Thr Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile

        115                 120                 125

Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp

    130                 135                 140

Tyr Thr Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala

145                 150                 155                 160

Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly

                165                 170                 175

Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln

            180                 185                 190

Tyr Trp Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser

        195                 200                 205

Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala

    210                 215                 220

Trp Val Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly

225                 230                 235                 240

Glu Tyr Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser

                245                 250                 255

Ser Gly Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala

            260                 265                 270

Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn

        275                 280                 285

Gly Gly Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val

    290                 295                 300

Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala

305                 310                 315                 320

Phe Ile Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr

                325                 330                 335

Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His

            340                 345                 350

Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp

        355                 360                 365

Glu Met Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile

    370                 375                 380

Thr Tyr Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val

385                 390                 395                 400

Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly

                405                 410                 415

Gly Trp Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu

            420                 425                 430

Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp

        435                 440                 445

Ser Tyr Cys Gly Val Gly Ser Glu Lys Asp Glu Leu

    450                 455                 460

<210>34

<211>825

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>34

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

 1               5                  10                  15

Ala Thr Ser Ala Gly His Trp Tyr Lys His Gln Arg Ala Tyr Gln Phe

            20                  25                  30

Thr Gly Glu Asp Asp Phe Gly Lys Val Ala Val Val Lys Leu Pro Met

        35                  40                  45

Asp Leu Thr Lys Val Gly Ile Ile Val Arg Leu Asn Glu Trp Gln Ala

    50                  55                  60

Lys Asp Val Ala Lys Asp Arg Phe Ile Glu Ile Lys Asp Gly Lys Ala

65                  70                  75                  80

Glu Val Trp Ile Leu Gln Gly Val Glu Glu Ile Phe Tyr Glu Lys Pro

                85                  90                  95

Asp Thr Ser Pro Arg Ile Phe Phe Ala Gln Ala Arg Ser Asn Lys Val

            100                 105                 110

Ile Glu Ala Phe Leu Thr Asn Pro Val Asp Thr Lys Lys Lys Glu Leu

        115                 120                 125

Phe Lys Val Thr Val Asp Gly Lys Glu Ile Pro Val Ser Arg Val Glu

    130                 135                 140

Lys Ala Asp Pro Thr Asp Ile Asp Val Thr Asn Tyr Val Arg Ile Val

145                 150                 155                 160

Leu Ser Glu Ser Leu Lys Glu Glu Asp Leu Arg Lys Asp Val Glu Leu

                165                 170                 175

Ile Ile Glu Gly Tyr Lys Pro Ala Arg Val Ile Met Met Glu Ile Leu

            180                 185                 190

Asp Asp Tyr Tyr Tyr Asp Gly Glu Leu Gly Ala Val Tyr Ser Pro Glu

        195                 200                 205

Lys Thr Ile Phe Arg Val Trp Ser Pro Val Ser Lys Trp Val Lys Val

    210                 215                 220

Leu Leu Phe Lys Asn Gly Glu Asp Thr Glu Pro Tyr Gln Val Val Asn

225                 230                 235                 240

Met Glu Tyr Lys Gly Asn Gly Val Trp Glu Ala Val Val Glu Gly Asp

                245                 250                 255

Leu Asp Gly Val Phe Tyr Leu Tyr Gln Leu Glu Asn Tyr Gly Lys Ile

            260                 265                 270

Arg Thr Thr Val Asp Pro Tyr Ser Lys Ala Val Tyr Ala Asn Asn Gln

        275                 280                 285

Glu Ser Ala Val Val Asn Leu Ala Arg Thr Asn Pro Glu Gly Trp Glu

    290                 295                 300

Asn Asp Arg Gly Pro Lys Ile Glu Gly Tyr Glu Asp Ala Ile Ile Tyr

305                 310                 315                 320

Glu Ile His Ile Ala Asp Ile Thr Gly Leu Glu Asn Ser Gly Val Lys

                325                 330                 335

Asn Lys Gly Leu Tyr Leu Gly Leu Thr Glu Glu Asn Thr Lys Ala Pro

            340                 345                 350

Gly Gly Val Thr Thr Gly Leu Ser His Leu Val Glu Leu Gly Val Thr

        355                 360                 365

His Val His Ile Leu Pro Phe Phe Asp Phe Tyr Thr Gly Asp Glu Leu

    370                 375                 380

Asp Lys Asp Phe Glu Lys Tyr Tyr Asn Trp Gly Tyr Asp Pro Tyr Leu

385                 390                 395                 400

Phe Met Val Pro Glu Gly Arg Tyr Ser Thr Asp Pro Lys Asn Pro His

                405                 410                 415

Thr Arg Ile Arg Glu Val Lys Glu Met Val Lys Ala Leu His Lys His

            420                 425                 430

Gly Ile Gly Val Ile Met Asp Met Val Phe Pro His Thr Tyr Gly Ile

        435                 440                 445

Gly Glu Leu Ser Ala Phe Asp Gln Thr Val Pro Tyr Tyr Phe Tyr Arg

    450                 455                 460

Ile Asp Lys Thr Gly Ala Tyr Leu Asn Glu Ser Gly Cys Gly Asn Val

465                 470                 475                 480

Ile Ala Ser Glu Arg Pro Met Met Arg Lys Phe Ile Val Asp Thr Val

                485                 490                 495

Thr Tyr Trp Val Lys Glu Tyr His Ile Asp Gly Phe Arg Phe Asp Gln

            500                 505                 510

Met Gly Leu Ile Asp Lys Lys Thr Met Leu Glu Val Glu Arg Ala Leu

        515                 520                 525

His Lys Ile Asp Pro Thr Ile Ile Leu Tyr Gly Glu Pro Trp Gly Gly

    530                 535                 540

Trp Gly Ala Pro Ile Arg Phe Gly Lys Ser Asp Val Ala Gly Thr His

545                 550                 555                 560

Val Ala Ala Phe Asn Asp Glu Phe Arg Asp Ala Ile Arg Gly Ser Val

                565                 570                 575

Phe Asn Pro Ser Val Lys Gly Phe Val Met Gly Gly Tyr Gly Lys Glu

            580                 585                 590

Thr Lys Ile Lys Arg Gly Val Val Gly Ser Ile Asn Tyr Asp Gly Lys

        595                 600                 605

Leu Ile Lys Ser Phe Ala Leu Asp Pro Glu Glu Thr Ile Asn Tyr Ala

    610                 615                 620

Ala Cys His Asp Asn His Thr Leu Trp Asp Lys Asn Tyr Leu Ala Ala

625                 630                 635                 640

Lys Ala Asp Lys Lys Lys Glu Trp Thr Glu Glu Glu Leu Lys Asn Ala

                645                 650                 655

Gln Lys Leu Ala Gly Ala Ile Leu Leu Thr Ser Gln Gly Val Pro Phe

            660                 665                 670

Leu His Gly Gly Gln Asp Phe Cys Arg Thr Thr Asn Phe Asn Asp Asn

        675                 680                 685

Ser Tyr Asn Ala Pro Ile Ser Ile Asn Gly Phe Asp Tyr Glu Arg Lys

    690                 695                 700

Leu Gln Phe Ile Asp Val Phe Asn Tyr His Lys Gly Leu Ile Lys Leu

705                 710                 715                 720

Arg Lys Glu His Pro Ala Phe Arg Leu Lys Asn Ala Glu Glu Ile Lys

                725                 730                 735

Lys His Leu Glu Phe Leu Pro Gly Gly Arg Arg Ile Val Ala Phe Met

            740                 745                 750

Leu Lys Asp His Ala Gly Gly Asp Pro Trp Lys Asp Ile Val Val Ile

        755                 760                 765

Tyr Asn Gly Asn Leu Glu Lys Thr Thr Tyr Lys Leu Pro Glu Gly Lys

    770                 775                 780

Trp Asn Val Val Val Asn Ser Gln Lys Ala Gly Thr Glu Val Ile Glu

785                 790                 795                 800

Thr Val Glu Gly Thr Ile Glu Leu Asp Pro Leu Ser Ala Tyr Val Leu

                805                 810                 815

Tyr Arg Glu Ser Glu Lys Asp Glu Leu

            820                 825

<210>35

<211>460

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>35

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

 1               5                  10                  15

Ala Thr Ser Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Val Ile Met

            20                  25                  30

Gln Ala Phe Tyr Trp Asp Val Pro Ser Gly Gly Ile Trp Trp Asp Thr

        35                  40                  45

Ile Arg Gln Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile

    50                  55                  60

Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly

65                  70                  75                  80

Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gln Lys Gly

                85                  90                  95

Thr Val Glu Thr Arg Phe Gly Ser Lys Gln Glu Leu Ile Asn Met Ile

            100                 105                 110

Asn Thr Ala His Ala Tyr Gly Ile Lys Val Ile Ala Asp Ile Val Ile

        115                 120                 125

Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Val Gly Asp

    130                 135                 140

Tyr Thr Trp Thr Asp Phe Ser Lys Val Ala Ser Gly Lys Tyr Thr Ala

145                 150                 155                 160

Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly

                165                 170                 175

Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gln

            180                 185                 190

Tyr Trp Leu Trp Ala Ser Gln Glu Ser Tyr Ala Ala Tyr Leu Arg Ser

        195                 200                 205

Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Val Lys Gly Tyr Gly Ala

    210                 215                 220

Trp Val Val Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Val Gly

225                 230                 235                 240

Glu Tyr Trp Asp Thr Asn Val Asp Ala Leu Leu Asn Trp Ala Tyr Ser

                245                 250                 255

Ser Gly Ala Lys Val Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala

            260                 265                 270

Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Val Glu Ala Leu Lys Asn

        275                 280                 285

Gly Gly Thr Val Val Ser Arg Asp Pro Phe Lys Ala Val Thr Phe Val

    290                 295                 300

Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala

305                 310                 315                 320

Phe Ile Leu Thr Tyr Glu Gly Gln Pro Thr Ile Phe Tyr Arg Asp Tyr

                325                 330                 335

Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His

            340                 345                 350

Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Val Tyr Tyr Asp Ser Asp

        355                 360                 365

Glu Met Ile Phe Val Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile

    370                 375                 380

Thr Tyr Ile Asn Leu Gly Ser Ser Lys Val Gly Arg Trp Val Tyr Val

385                 390                 395                 400

Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly

                405                 410                 415

Gly Trp Val Asp Lys Tyr Val Tyr Ser Ser Gly Trp Val Tyr Leu Glu

            420                 425                 430

Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gln Tyr Gly Tyr Ser Val Trp

        435                 440                 445

Ser Tyr Cys Gly Val Gly Ser Glu Lys Asp Glu Leu

    450                 455                 460

<210>36

<211>718

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>36

Met Arg Val Leu Leu Val Ala Leu Ala Leu Leu Ala Leu Ala Ala Ser

 1               5                  10                  15

Ala Thr Ser Met Glu Thr Ile Lys Ile Tyr Glu Asn Lys Gly Val Tyr

            20                  25                  30

Lys Val Val Ile Gly Glu Pro Phe Pro Pro Ile Glu Phe Pro Leu Glu

        35                  40                  45

Gln Lys Ile Ser Ser Asn Lys Ser Leu Ser Glu Leu Gly Leu Thr Ile

    50                  55                  60

Val Gln Gln Gly Asn Lys Val Ile Val Glu Lys Ser Leu Asp Leu Lys

65                  70                  75                  80

Glu His Ile Ile Gly Leu Gly Glu Lys Ala Phe Glu Leu Asp Arg Lys

                85                  90                  95

Arg Lys Arg Tyr Val Met Tyr Asn Val Asp Ala Gly Ala Tyr Lys Lys

            100                 105                 110

Tyr Gln Asp Pro Leu Tyr Val Ser Ile Pro Leu Phe Ile Ser Val Lys

        115                 120                 125

Asp Gly Val Ala Thr Gly Tyr Phe Phe Asn Ser Ala Ser Lys Val Ile

    130                 135                 140

Phe Asp Val Gly Leu Glu Glu Tyr Asp Lys Val Ile Val Thr Ile Pro

145                 150                 155                 160

Glu Asp Ser Val Glu Phe Tyr Val Ile Glu Gly Pro Arg Ile Glu Asp

                165                 170                 175

Val Leu Glu Lys Tyr Thr Glu Leu Thr Gly Lys Pro Phe Leu Pro Pro

            180                 185                 190

Met Trp Ala Phe Gly Tyr Met Ile Ser Arg Tyr Ser Tyr Tyr Pro Gln

        195                 200                 205

Asp Lys Val Val Glu Leu Val Asp Ile Met Gln Lys Glu Gly Phe Arg

    210                 215                 220

Val Ala Gly Val Phe Leu Asp Ile His Tyr Met Asp Ser Tyr Lys Leu

225                 230                 235                 240

Phe Thr Trp His Pro Tyr Arg Phe Pro Glu Pro Lys Lys Leu Ile Asp

                245                 250                 255

Glu Leu His Lys Arg Asn Val Lys Leu Ile Thr Ile Val Asp His Gly

            260                 265                 270

Ile Arg Val Asp Gln Asn Tyr Ser Pro Phe Leu Ser Gly Met Gly Lys

        275                 280                 285

Phe Cys Glu Ile Glu Ser Gly Glu Leu Phe Val Gly Lys Met Trp Pro

    290                 295                 300

Gly Thr Thr Val Tyr Pro Asp Phe Phe Arg Glu Asp Thr Arg Glu Trp

305                 310                 315                 320

Trp Ala Gly Leu Ile Ser Glu Trp Leu Ser Gln Gly Val Asp Gly Ile

                325                 330                 335

Trp Leu Asp Met Asn Glu Pro Thr Asp Phe Ser Arg Ala Ile Glu Ile

            340                 345                 350

Arg Asp Val Leu Ser Ser Leu Pro Val Gln Phe Arg Asp Asp Arg Leu

        355                 360                 365

Val Thr Thr Phe Pro Asp Asn Val Val His Tyr Leu Arg Gly Lys Arg

    370                 375                 380

Val Lys His Glu Lys Val Arg Asn Ala Tyr Pro Leu Tyr Glu Ala Met

385                 390                 395                 400

Ala Thr Phe Lys Gly Phe Arg Thr Ser His Arg Asn Glu Ile Phe Ile

                405                 410                 415

Leu Ser Arg Ala Gly Tyr Ala Gly Ile Gln Arg Tyr Ala Phe Ile Trp

            420                 425                 430

Thr Gly Asp Asn Thr Pro Ser Trp Asp Asp Leu Lys Leu Gln Leu Gln

        435                 440                 445

Leu Val Leu Gly Leu Ser Ile Ser Gly Val Pro Phe Val Gly Cys Asp

    450                 455                 460

Ile Gly Gly Phe Gln Gly Arg Asn Phe Ala Glu Ile Asp Asn Ser Met

465                 470                 475                 480

Asp Leu Leu Val Lys Tyr Tyr Ala Leu Ala Leu Phe Phe Pro Phe Tyr

                485                 490                 495

Arg Ser His Lys Ala Thr Asp Gly Ile Asp Thr Glu Pro Val Phe Leu

            500                 505                 510

Pro Asp Tyr Tyr Lys Glu Lys Val Lys Glu Ile Val Glu Leu Arg Tyr

        515                 520                 525

Lys Phe Leu Pro Tyr Ile Tyr Ser Leu Ala Leu Glu Ala Ser Glu Lys

    530                 535                 540

Gly His Pro Val Ile Arg Pro Leu Phe Tyr Glu Phe Gln Asp Asp Asp

545                 550                 555                 560

Asp Met Tyr Arg Ile Glu Asp Glu Tyr Met Val Gly Lys Tyr Leu Leu

                565                 570                 575

Tyr Ala Pro Ile Val Ser Lys Glu Glu Ser Arg Leu Val Thr Leu Pro

            580                 585                 590

Arg Gly Lys Trp Tyr Asn Tyr Trp Asn Gly Glu Ile Ile Asn Gly Lys

        595                 600                 605

Ser Val Val Lys Ser Thr His Glu Leu Pro Ile Tyr Leu Arg Glu Gly

    610                 615                 620

Ser Ile Ile Pro Leu Glu Gly Asp Glu Leu Ile Val Tyr Gly Glu Thr

625                 630                 635                 640

Ser Phe Lys Arg Tyr Asp Asn Ala Glu Ile Thr Ser Ser Ser Asn Glu

                645                 650                 655

Ile Lys Phe Ser Arg Glu Ile Tyr Val Ser Lys Leu Thr Ile Thr Ser

            660                 665                 670

Glu Lys Pro Val Ser Lys Ile Ile Val Asp Asp Ser Lys Glu Ile Gln

        675                 680                 685

Val Glu Lys Thr Met Gln Asn Thr Tyr Val Ala Lys Ile Asn Gln Lys

    690                 695                 700

Ile Arg Gly Lys Ile Asn Leu Glu Ser Glu Lys Asp Glu Leu

705                 710                 715

<210>37

<211>1434

<212>DNA

<213>海栖热袍菌

<400>37

atgaaagaaa ccgctgctgc taaattcgaa cgccagcaca tggacagccc agatctgggt    60

accctggtgc cacgcggttc catggccgag ttcttcccgg agatcccgaa gatccagttc    120

gagggcaagg agtccaccaa cccgctcgcc ttccgcttct acgacccgaa cgaggtgatc    180

gacggcaagc cgctcaagga ccacctcaag ttctccgtgg ccttctggca caccttcgtg    240

aacgagggcc gcgacccgtt cggcgacccg accgccgagc gcccgtggaa ccgcttctcc    300

gacccgatgg acaaggcctt cgcccgcgtg gacgccctct tcgagttctg cgagaagctc    360

aacatcgagt acttctgctt ccacgaccgc gacatcgccc cggagggcaa gaccctccgc    420

gagaccaaca agatcctcga caaggtggtg gagcgcatca aggagcgcat gaaggactcc    480

aacgtgaagc tcctctgggg caccgccaac ctcttctccc acccgcgcta catgcacggc    540

gccgccacca cctgctccgc cgacgtgttc gcctacgccg ccgcccaggt gaagaaggcc    600

ctggagatca ccaaggagct gggcggcgag ggctacgtgt tctggggcgg ccgcgagggc    660

tacgagaccc tcctcaacac cgacctcggc ctggagctgg agaacctcgc ccgcttcctc    720

cgcatggccg tggagtacgc caagaagatc ggcttcaccg gccagttcct catcgagccg    780

aagccgaagg agccgaccaa gcaccagtac gacttcgacg tggccaccgc ctacgccttc    840

ctcaagaacc acggcctcga cgagtacttc aagttcaaca tcgaggccaa ccacgccacc    900

ctcgccggcc acaccttcca gcacgagctg cgcatggccc gcatcctcgg caagctcggc    960

tccatcgacg ccaaccaggg cgacctcctc ctcggctggg acaccgacca gttcccgacc    1020

aacatctacg acaccaccct cgccatgtac gaggtgatca aggccggcgg cttcaccaag    1080

ggcggcctca acttcgacgc caaggtgcgc cgcgcctcct acaaggtgga ggacctcttc    1140

atcggccaca tcgccggcat ggacaccttc gccctcggct tcaagatcgc ctacaagctc    1200

gccaaggacg gcgtgttcga caagttcatc gaggagaagt accgctcctt caaggagggc    1260

atcggcaagg agatcgtgga gggcaagacc gacttcgaga agctggagga gtacatcatc    1320

gacaaggagg acatcgagct gccgtccggc aagcaggagt acctggagtc cctcctcaac    1380

tcctacatcg tgaagaccat cgccgagctg cgctccgaga aggacgagct gtga          1434

<210>38

<211>477

<212>PRT

<213>海栖热袍菌

<400>38

Met Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser

 1               5                  10                  15

Pro Asp Leu Gly Thr Leu Val Pro Arg Gly Ser Met Ala Glu Phe Phe

            20                  25                  30

Pro Glu Ile Pro Lys Ile Gln Phe Glu Gly Lys Glu Ser Thr Asn Pro

        35                  40                  45

Leu Ala Phe Arg Phe Tyr Asp Pro Asn Glu Val Ile Asp Gly Lys Pro

    50                  55                  60

Leu Lys Asp His Leu Lys Phe Ser Val Ala Phe Trp His Thr Phe Val

65                  70                  75                  80

Asn Glu Gly Arg Asp Pro Phe Gly Asp Pro Thr Ala Glu Arg Pro Trp

                85                  90                  95

Asn Arg Phe Ser Asp Pro Met Asp Lys Ala Phe Ala Arg Val Asp Ala

            100                 105                 110

Leu Phe Glu Phe Cys Glu Lys Leu Asn Ile Glu Tyr Phe Cys Phe His

        115                 120                 125

Asp Arg Asp Ile Ala Pro Glu Gly Lys Thr Leu Arg Glu Thr Asn Lys

    130                 135                 140

Ile Leu Asp Lys Val Val Glu Arg Ile Lys Glu Arg Met Lys Asp Ser

145                 150                 155                 160

Asn Val Lys Leu Leu Trp Gly Thr Ala Asn Leu Phe Ser His Pro Arg

                165                 170                 175

Tyr Met His Gly Ala Ala Thr Thr Cys Ser Ala Asp Val Phe Ala Tyr

            180                 185                 190

Ala Ala Ala Gln Val Lys Lys Ala Leu Glu Ile Thr Lys Glu Leu Gly

        195                 200                 205

Gly Glu Gly Tyr Val Phe Trp Gly Gly Arg Glu Gly Tyr Glu Thr Leu

    210                 215                 220

Leu Asn Thr Asp Leu Gly Leu Glu Leu Glu Asn Leu Ala Arg Phe Leu

225                 230                 235                 240

Arg Met Ala Val Glu Tyr Ala Lys Lys Ile Gly Phe Thr Gly Gln Phe

                245                 250                 255

Leu Ile Glu Pro Lys Pro Lys Glu Pro Thr Lys His Gln Tyr Asp Phe

            260                 265                 270

Asp Val Ala Thr Ala Tyr Ala Phe Leu Lys Asn His Gly Leu Asp Glu

        275                 280                 285

Tyr Phe Lys Phe Asn Ile Glu Ala Asn His Ala Thr Leu Ala Gly His

    290                 295                 300

Thr Phe Gln His Glu Leu Arg Met Ala Arg Ile Leu Gly Lys Leu Gly

305                 310                 315                 320

Ser Ile Asp Ala Asn Gln Gly Asp Leu Leu Leu Gly Trp Asp Thr Asp

                325                 330                 335

Gln Phe Pro Thr Asn Ile Tyr Asp Thr Thr Leu Ala Met Tyr Glu Val

            340                 345                 350

Ile Lys Ala Gly Gly Phe Thr Lys Gly Gly Leu Asn Phe Asp Ala Lys

        355                 360                 365

Val Arg Arg Ala Ser Tyr Lys Val Glu Asp Leu Phe Ile Gly His Ile

    370                 375                 380

Ala Gly Met Asp Thr Phe Ala Leu Gly Phe Lys Ile Ala Tyr Lys Leu

385                 390                 395                 400

Ala Lys Asp Gly Val Phe Asp Lys Phe Ile Glu Glu Lys Tyr Arg Ser

                405                 410                 415

Phe Lys Glu Gly Ile Gly Lys Glu Ile Val Glu Gly Lys Thr Asp Phe

            420                 425                 430

Glu Lys Leu Glu Glu Tyr Ile Ile Asp Lys Glu Asp Ile Glu Leu Pro

        435                 440                 445

Ser Gly Lys Gln Glu Tyr Leu Glu Ser Leu Leu Asn Ser Tyr Ile Val

    450                 455                 460

Lys Thr Ile Ala Glu Leu Arg Ser Glu Lys Asp Glu Leu

465                 470                 475

<210>39

<211>1434

<212>DNA

<213>那不勒斯栖热袍菌

<400>39

atgaaagaaa ccgctgctgc taaattcgaa cgccagcaca tggacagccc agatctgggt   60

accctggtgc cacgcggttc catggccgag ttcttcccgg agatcccgaa ggtgcagttc   120

gagggcaagg agtccaccaa cccgctcgcc ttcaagttct acgacccgga ggagatcatc   180

gacggcaagc cgctcaagga ccacctcaag ttctccgtgg ccttctggca caccttcgtg   240

aacgagggcc gcgacccgtt cggcgacccg accgccgacc gcccgtggaa ccgctacacc   300

gacccgatgg acaaggcctt cgcccgcgtg gacgccctct tcgagttctg cgagaagctc   360

aacatcgagt acttctgctt ccacgaccgc gacatcgccc cggagggcaa gaccctccgc    420

gagaccaaca agatcctcga caaggtggtg gagcgcatca aggagcgcat gaaggactcc    480

aacgtgaagc tcctctgggg caccgccaac ctcttctccc acccgcgcta catgcacggc    540

gccgccacca cctgctccgc cgacgtgttc gcctacgccg ccgcccaggt gaagaaggcc    600

ctggagatca ccaaggagct gggcggcgag ggctacgtgt tctggggcgg ccgcgagggc    660

tacgagaccc tcctcaacac cgacctcggc ttcgagctgg agaacctcgc ccgcttcctc    720

cgcatggccg tggactacgc caagcgcatc ggcttcaccg gccagttcct catcgagccg    780

aagccgaagg agccgaccaa gcaccagtac gacttcgacg tggccaccgc ctacgccttc    840

ctcaagtccc acggcctcga cgagtacttc aagttcaaca tcgaggccaa ccacgccacc    900

ctcgccggcc acaccttcca gcacgagctg cgcatggccc gcatcctcgg caagctcggc    960

tccatcgacg ccaaccaggg cgacctcctc ctcggctggg acaccgacca gttcccgacc    1020

aacgtgtacg acaccaccct cgccatgtac gaggtgatca aggccggcgg cttcaccaag    1080

ggcggcctca acttcgacgc caaggtgcgc cgcgcctcct acaaggtgga ggacctcttc    1140

atcggccaca tcgccggcat ggacaccttc gccctcggct tcaaggtggc ctacaagctc    1200

gtgaaggacg gcgtgctcga caagttcatc gaggagaagt accgctcctt ccgcgagggc    1260

atcggccgcg acatcgtgga gggcaaggtg gacttcgaga agctggagga gtacatcatc    1320

gacaaggaga ccatcgagct gccgtccggc aagcaggagt acctggagtc cctcatcaac    1380

tcctacatcg tgaagaccat cctggagctg cgctccgaga aggacgagct gtga          1434

<210>40

<211>477

<212>PRT

<213>那不勒斯栖热袍菌

<400>40

Met Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser

 1               5                  10                  15

Pro Asp Leu Gly Thr Leu Val Pro Arg Gly Ser Met Ala Glu Phe Phe

            20                  25                  30

Pro Glu Ile Pro Lys Val Gln Phe Glu Gly Lys Glu Ser Thr Asn Pro

        35                  40                  45

Leu Ala Phe Lys Phe Tyr Asp Pro Glu Glu Ile Ile Asp Gly Lys Pro

    50                  55                  60

Leu Lys Asp His Leu Lys Phe Ser Val Ala Phe Trp His Thr Phe Val

65                  70                  75                  80

Asn Glu Gly Arg Asp Pro Phe Gly Asp Pro Thr Ala Asp Arg Pro Trp

                85                  90                  95

Asn Arg Tyr Thr Asp Pro Met Asp Lys Ala Phe Ala Arg Val Asp Ala

            100                 105                 110

Leu Phe Glu Phe Cys Glu Lys Leu Asn Ile Glu Tyr Phe Cys Phe His

        115                 120                 125

Asp Arg Asp Ile Ala Pro Glu Gly Lys Thr Leu Arg Glu Thr Asn Lys

    130                 135                 140

Ile Leu Asp Lys Val Val Glu Arg Ile Lys Glu Arg Met Lys Asp Ser

145                 150                 155                 160

Asn Val Lys Leu Leu Trp Gly Thr Ala Asn Leu Phe Ser His Pro Arg

                165                 170                 175

Tyr Met His Gly Ala Ala Thr Thr Cys Ser Ala Asp Val Phe Ala Tyr

            180                 185                 190

Ala Ala Ala Gln Val Lys Lys Ala Leu Glu Ile Thr Lys Glu Leu Gly

        195                 200                 205

Gly Glu Gly Tyr Val Phe Trp Gly Gly Arg Glu Gly Tyr Glu Thr Leu

    210                 215                 220

Leu Asn Thr Asp Leu Gly Phe Glu Leu Glu Asn Leu Ala Arg Phe Leu

225                 230                 235                 240

Arg Met Ala Val Asp Tyr Ala Lys Arg Ile Gly Phe Thr Gly Gln Phe

                245                 250                 255

Leu Ile Glu Pro Lys Pro Lys Glu Pro Thr Lys His Gln Tyr Asp Phe

            260                 265                 270

Asp Val Ala Thr Ala Tyr Ala Phe Leu Lys Ser His Gly Leu Asp Glu

        275                 280                 285

Tyr Phe Lys Phe Asn Ile Glu Ala Asn His Ala Thr Leu Ala Gly His

    290                 295                 300

Thr Phe Gln His Glu Leu Arg Met Ala Arg Ile Leu Gly Lys Leu Gly

305                 310                 315                 320

Ser Ile Asp Ala Asn Gln Gly Asp Leu Leu Leu Gly Trp Asp Thr Asp

                325                 330                 335

Gln Phe Pro Thr Asn Val Tyr Asp Thr Thr Leu Ala Met Tyr Glu Val

            340                 345                 350

Ile Lys Ala Gly Gly Phe Thr Lys Gly Gly Leu Asn Phe Asp Ala Lys

        355                 360                 365

Val Arg Arg Ala Ser Tyr Lys Val Glu Asp Leu Phe Ile Gly His Ile

    370                 375                 380

Ala Gly Met Asp Thr Phe Ala Leu Gly Phe Lys Val Ala Tyr Lys Leu

385                 390                 395                 400

Val Lys Asp Gly Val Leu Asp Lys Phe Ile Glu Glu Lys Tyr Arg Ser

                405                 410                 415

Phe Arg Glu Gly Ile Gly Arg Asp Ile Val Glu Gly Lys Val Asp Phe

            420                 425                 430

Glu Lys Leu Glu Glu Tyr Ile Ile Asp Lys Glu Thr Ile Glu Leu Pro

        435                 440                 445

Ser Gly Lys Gln Glu Tyr Leu Glu Ser Leu Ile Asn Ser Tyr Ile Val

    450                 455                 460

Lys Thr Ile Leu Glu Leu Arg Ser Glu Lys Asp Glu Leu

465                 470                 475

<210>41

<211>1435

<212>DNA

<213>海栖热袍菌

<400>41

atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat    60

atggctagca tgactggtgg acagcaaatg ggtcggatcc ccatggccga gttcttcccg    120

gagatcccga agatccagtt cgagggcaag gagtccacca acccgctcgc cttccgcttc    180

tacgacccga acgaggtgat cgacggcaag ccgctcaagg accacctcaa gttctccgtg    240

gccttctggc acaccttcgt gaacgagggc cgcgacccgt tcggcgaccc gaccgccgag    300

cgcccgtgga accgcttctc cgacccgatg gacaaggcct tcgcccgcgt ggacgccctc    360

ttcgagttct gcgagaagct caacatcgag tacttctgct tccacgaccg cgacatcccc    420

cggagggcaa gaccctccgc gagaccaaca agatcctcga caaggtggtg gagcgcatca    480

aggagcgcat gaaggactcc aacgtgaagc tcctctgggg caccgccaac ctcttctccc    540

acccgcgcta catgcacggc gccgccacca cctgctccgc cgacgtgttc gcctacgccg    600

ccgcccaggt gaagaaggcc ctggagatca ccaaggagct gggcggcgag ggctacgtgt    660

tctggggcgg ccgcgagggc tacgagaccc tcctcaacac cgacctcggc ctggagctgg    720

agaacctcgc ccgcttcctc cgcatggccg tggagtacgc caagaagatc ggcttcaccg    780

gccagttcct catcgagccg aagccgaagg agccgaccaa gcaccagtac gcttcgacgt    840

ggccaccgcc tacgccttcc tcaagaacca cggcctcgac gagtacttca agttcaacat    900

cgaggccaac cacgccaccc tcgccggcca caccttccag cacgagctgc gcatggcccg    960

catcctcggc aagctcggct ccatcgacgc caaccagggc gacctcctcc tcggctggga    1020

caccgaccag ttcccgacca acatctacga caccaccctc gccatgtacg aggtgatcaa    1080

ggccggcggc ttcaccaagg gcggcctcaa cttcgacgcc aaggtgcgcc gcgcctccta    1140

caaggtggag gacctcttca tcggccacat cgccggcatg gacaccttcg ccctcggctt    1200

caagatcgcc tacaagctcg ccaaggacgg cgtgttcgac aagttcatcg aggagaagta    1260

ccgctccttc aaggagggca tcggcaagga gatcgtggag ggcaagaccg acttcgagaa    1320

gctggaggag tacatcatcg acaaggagga catcgagctg ccgtccggca agcaggagta    1380

cctggagtcc ctcctcaact cctacatcgt gaagaccatc gccgagctgc gctga    1435

<210>42

<211>478

<212>PRT

<213>海栖热袍菌

<400>42

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

 1               5                  10                  15

Arg Gly Ser His Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg

            20                  25                  30

Ile Pro Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Ile Gln Phe Glu

        35                  40                  45

Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Arg Phe Tyr Asp Pro Asn

    50                  55                  60

Glu Val Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser Val

65                  70                  75                  80

Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly Asp

                85                  90                  95

Pro Thr Ala Glu Arg Pro Trp Asn Arg Phe Ser Asp Pro Met Asp Lys

            100                 105                 110

Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu Asn

        115                 120                 125

Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly Lys

    130                 135                 140

Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg Ile

145                 150                 155                 160

Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr Ala

                165                 170                 175

Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr Cys

            180                 185                 190

Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala Leu

        195                 200                 205

Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly Gly

    210                 215                 220

Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Leu Glu Leu

225                 230                 235                 240

Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Glu Tyr Ala Lys Lys

                245                 250                 255

Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu Pro

            260                 265                 270

Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe Leu

        275                 280                 285

Lys Asn His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala Asn

    290                 295                 300

His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met Ala

305                 310                 315                 320

Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp Leu

                325                 330                 335

Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Ile Tyr Asp Thr

            340                 345                 350

Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys Gly

        355                 360                 365

Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val Glu

    370                 375                 380

Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu Gly

385                 390                 395                 400

Phe Lys Ile Ala Tyr Lys Leu Ala Lys Asp Gly Val Phe Asp Lys Phe

                405                 410                 415

Ile Glu Glu Lys Tyr Arg Ser Phe Lys Glu Gly Ile Gly Lys Glu Ile

            420                 425                 430

Val Glu Gly Lys Thr Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile Asp

        435                 440                 445

Lys Glu Asp Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu Ser

    450                 455                 460

Leu Leu Asn Ser Tyr Ile Val Lys Thr Ile Ala Glu Leu Arg

465                 470                 475

<210>43

<211>1436

<212>DNA

<213>那不勒斯栖热袍菌

<400>43

atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat    60

atggctagca tgactggtgg acagcaaatg ggtcggatcc ccatggccga gttcttcccg    120

gagatcccga aggtgcagtt cgagggcaag gagtccacca acccgctcgc cttcaagttc    180

tacgacccgg aggagatcat cgacggcaag ccgctcaagg accacctcaa gttctccgtg    240

gccttctggc acaccttcgt gaacgagggc cgcgacccgt tcggcgaccc gaccgccgac    300

cgcccgtgga accgctacac cgacccgatg gacaaggcct tcgcccgcgt ggacgccctc    360

ttcgagttct gcgagaagct caacatcgag tacttctgct tccacgaccg cgacatcccc    420

cggagggcaa gaccctccgc gagaccaaca agatcctcga caaggtggtg gagcgcatca    480

aggagcgcat gaaggactcc aacgtgaagc tcctctgggg caccgccaac ctcttctccc    540

acccgcgcta catgcacggc gccgccacca cctgctccgc cgacgtgttc gcctacgccg    600

ccgcccaggt gaagaaggcc ctggagatca ccaaggagct gggcggcgag ggctacgtgt    660

tctggggcgg ccgcgagggc tacgagaccc tcctcaacac cgacctcggc ttcgagctgg    720

agaacctcgc ccgcttcctc cgcatggccg tggactacgc caagcgcatc ggcttcaccg    780

gccagttcct catcgagccg aagccgaagg agccgaccaa gcaccagtac gacttcgacg    840

tggccaccgc ctacgccttc ctcaagtccc acggcctcga cgagtacttc aagttcaaca    900

tcgaggccaa ccacgccacc ctcgccggcc acaccttcca gcacgagctg cgcatggccc    960

gcatcctcgg caagctcggc tccatcgacg ccaaccaggg cgacctcctc ctcggctggg    1020

acaccgacca gttcccgacc aacgtgtacg acaccaccct cgccatgtac gaggtgatca    1080

aggccggcgg cttcaccaag ggcggcctca acttcgacgc caaggtgcgc cgcgcctcct    1140

acaaggtgga ggacctcttc atcggccaca tcgccggcat ggacaccttc gccctcggct    1200

tcaaggtggc ctacaagctc gtgaaggacg gcgtgctcga caagttcatc gaggagaagt    1260

accgctcctt ccgcgagggc atcggccgcg acatcgtgga gggcaaggtg gacttcgaga    1320

agctggagga gtacatcatc gacaaggaga ccatcgagct gccgtccggc aagcaggagt    1380

acctggagtc cctcatcaac tcctacatcg tgaagaccat cctggagctg cgctga        1436

<210>44

<211>478

<212>PRT

<213>那不勒斯栖热袍菌

<400>44

Met Gly Ser Ser His His His His His His Ser Ser Gly Leu Val Pro

  1              5                  10                  15

Arg Gly Ser His Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg

            20                  25                  30

Ile Pro Met Ala Glu Phe Phe Pro Glu Ile Pro Lys Val Gln Phe Glu

        35                  40                  45

Gly Lys Glu Ser Thr Asn Pro Leu Ala Phe Lys Phe Tyr Asp Pro Glu

    50                  55                  60

Glu Ile Ile Asp Gly Lys Pro Leu Lys Asp His Leu Lys Phe Ser Val

65                  70                  75                  80

Ala Phe Trp His Thr Phe Val Asn Glu Gly Arg Asp Pro Phe Gly Asp

                 85                  90                  95

Pro Thr Ala Asp Arg Pro Trp Asn Arg Tyr Thr Asp Pro Met Asp Lys

            100                 105                 110

Ala Phe Ala Arg Val Asp Ala Leu Phe Glu Phe Cys Glu Lys Leu Asn

        115                 120                 125

Ile Glu Tyr Phe Cys Phe His Asp Arg Asp Ile Ala Pro Glu Gly Lys

    130                 135                 140

Thr Leu Arg Glu Thr Asn Lys Ile Leu Asp Lys Val Val Glu Arg Ile

145                 150                 155                 160

Lys Glu Arg Met Lys Asp Ser Asn Val Lys Leu Leu Trp Gly Thr Ala

                165                 170                 175

Asn Leu Phe Ser His Pro Arg Tyr Met His Gly Ala Ala Thr Thr Cys

            180                 185                 190

Ser Ala Asp Val Phe Ala Tyr Ala Ala Ala Gln Val Lys Lys Ala Leu

        195                 200                 205

Glu Ile Thr Lys Glu Leu Gly Gly Glu Gly Tyr Val Phe Trp Gly Gly

    210                 215                 220

Arg Glu Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Gly Phe Glu Leu

225                 230                 235                 240

Glu Asn Leu Ala Arg Phe Leu Arg Met Ala Val Asp Tyr Ala Lys Arg

                245                 250                 255

Ile Gly Phe Thr Gly Gln Phe Leu Ile Glu Pro Lys Pro Lys Glu Pro

            260                 265                 270

Thr Lys His Gln Tyr Asp Phe Asp Val Ala Thr Ala Tyr Ala Phe Leu

        275                 280                 285

Lys Ser His Gly Leu Asp Glu Tyr Phe Lys Phe Asn Ile Glu Ala Asn

    290                 295                 300

His Ala Thr Leu Ala Gly His Thr Phe Gln His Glu Leu Arg Met Ala

305                 310                 315                 320

Arg Ile Leu Gly Lys Leu Gly Ser Ile Asp Ala Asn Gln Gly Asp Leu

                325                 330                 335

Leu Leu Gly Trp Asp Thr Asp Gln Phe Pro Thr Asn Val Tyr Asp Thr

            340                 345                 350

Thr Leu Ala Met Tyr Glu Val Ile Lys Ala Gly Gly Phe Thr Lys Gly

        355                 360                 365

Gly Leu Asn Phe Asp Ala Lys Val Arg Arg Ala Ser Tyr Lys Val Glu

    370                 375                 380

Asp Leu Phe Ile Gly His Ile Ala Gly Met Asp Thr Phe Ala Leu Gly

385                 390                 395                 400

Phe Lys Val Ala Tyr Lys Leu Val Lys Asp Gly Val Leu Asp Lys Phe

                405                 410                 415

Ile Glu Glu Lys Tyr Arg Ser Phe Arg Glu Gly Ile Gly Arg Asp Ile

            420                 425                 430

Val Glu Gly Lys Val Asp Phe Glu Lys Leu Glu Glu Tyr Ile Ile Asp

        435                 440                 445

Lys Glu Thr Ile Glu Leu Pro Ser Gly Lys Gln Glu Tyr Leu Glu Ser

    450                 455                 460

Leu Ile Asn Ser Tyr Ile Val Lys Thr Ile Leu Glu Leu Arg

465                 470                 475

<210>45

<211>1095

<212>PRT

<213>Aspergillus shirousami

<400>45

Ala Thr Pro Ala Asp Trp Arg Ser Gln Ser Ile Tyr Phe Leu Leu Thr

  1               5                  10                  15

Asp Arg Phe Ala Arg Thr Asp Gly Ser Thr Thr Ala Thr Cys Asn Thr

             20                  25                  30

Ala Asp Gln Lys Tyr Cys Gly Gly Thr Trp Gln Gly Ile Ile Asp Lys

         35                  40                  45

Leu Asp Tyr Ile Gln Gly Met Gly Phe Thr Ala Ile Trp Ile Thr Pro

     50                  55                  60

Val Thr Ala Gln Leu Pro Gln Thr Thr Ala Tyr Gly Asp Ala Tyr His

 65                  70                  75                  80

Gly Tyr Trp Gln Gln Asp Ile Tyr Ser Leu Asn Glu Asn Tyr Gly Thr

                 85                  90                  95

Ala Asp Asp Leu Lys Ala Leu Ser Ser Ala Leu His Glu Arg Gly Met

            100                 105                 110

Tyr Leu Met Val Asp Val Val Ala Asn His Met Gly Tyr Asp Gly Ala

        115                 120                 125

Gly Ser Ser Val Asp Tyr Ser Val Phe Lys Pro Phe Ser Ser Gln Asp

    130                 135                 140

Tyr Phe His Pro Phe Cys Phe Ile Gln Asn Tyr Glu Asp Gln Thr Gln

145                 150                 155                 160

Val Glu Asp Cys Trp Leu Gly Asp Asn Thr Val Ser Leu Pro Asp Leu

                165                 170                 175

Asp Thr Thr Lys Asp Val Val Lys Asn Glu Trp Tyr Asp Trp Val Gly

            180                 185                 190

Ser Leu Val Ser Asn Tyr Ser Ile Asp Gly Leu Arg Ile Asp Thr Val

        195                 200                 205

Lys His Val Gln Lys Asp Phe Trp Pro Gly Tyr Asn Lys Ala Ala Gly

    210                 215                 220

Val Tyr Cys Ile Gly Glu Val Leu Asp Val Asp Pro Ala Tyr Thr Cys

225                 230                 235                 240

Pro Tyr Gln Asn Val Met Asp Gly Val Leu Asn Tyr Pro Ile Tyr Tyr

                245                 250                 255

Pro Leu Leu Asn Ala Phe Lys Ser Thr Ser Gly Ser Met Asp Asp Leu

            260                 265                 270

Tyr Asn Met Ile Asn Thr Val Lys Ser Asp Cys Pro Asp Ser Thr Leu

        275                 280                 285

Leu Gly Thr Phe Val Glu Asn His Asp Asn Pro Arg Phe Ala Ser Tyr

    290                 295                 300

Thr Asn Asp Ile Ala Leu Ala Lys Asn Val Ala Ala Phe Ile Ile Leu

305                 310                 315                 320

Asn Asp Gly Ile Pro Ile Ile Tyr Ala Gly Gln Glu Gln His Tyr Ala

                325                 330                 335

Gly Gly Asn Asp Pro Ala Asn Arg Glu Ala Thr Trp Leu Ser Gly Tyr

            340                 345                 350

Pro Thr Asp Ser Glu Leu Tyr Lys Leu Ile Ala Ser Ala Asn Ala Ile

        355                 360                 365

Arg Asn Tyr Ala Ile Ser Lys Asp Thr Gly Phe Val Thr Tyr Lys Asn

    370                 375                 380

Trp Pro Ile Tyr Lys Asp Asp Thr Thr Ile Ala Met Arg Lys Gly Thr

385                 390                 395                 400

Asp Gly Ser Gln Ile Val Thr Ile Leu Ser Asn Lys Gly Ala Ser Gly

                405                 410                 415

Asp Ser Tyr Thr Leu Ser Leu Ser Gly Ala Gly Tyr Thr Ala Gly Gln

            420                 425                 430

Gln Leu Thr Glu Val Ile Gly Cys Thr Thr Val Thr Val Gly Ser Asp

        435                 440                 445

Gly Asn Val Pro Val Pro Met Ala Gly Gly Leu Pro Arg Val Leu Tyr

    450                 455                 460

Pro Thr Glu Lys Leu Ala Gly Ser Lys Ile Cys Ser Ser Ser Lys Pro

465                 470                 475                 480

Ala Thr Leu Asp Ser Trp Leu Ser Asn Glu Ala Thr Val Ala Arg Thr

                485                 490                 495

Ala Ile Leu Asn Asn Ile Gly Ala Asp Gly Ala Trp Val Ser Gly Ala

            500                 505                 510

Asp Ser Gly Ile Val Val Ala Ser Pro Ser Thr Asp Asn Pro Asp Tyr

        515                 520                 525

Phe Tyr Thr Trp Thr Arg Asp Ser Gly Ile Val Leu Lys Thr Leu Val

    530                 535                 540

Asp Leu Phe Arg Asn Gly Asp Thr Asp Leu Leu Ser Thr Ile Glu His

545                 550                 555                 560

Tyr Ile Ser Ser Gln Ala Ile Ile Gln Gly Val Ser Asn Pro Ser Gly

                565                 570                 575

Asp Leu Ser Ser Gly Gly Leu Gly Glu Pro Lys Phe Asn Val Asp Glu

            580                 585                 590

Thr Ala Tyr Ala Gly Ser Trp Gly Arg Pro Gln Arg Asp Gly Pro Ala

        595                 600                 605

Leu Arg Ala Thr Ala Met Ile Gly Phe Gly Gln Trp Leu Leu Asp Asn

    610                 615                 620

Gly Tyr Thr Ser Ala Ala Thr Glu Ile Val Trp Pro Leu Val Arg Asn

625                 630                 635                 640

Asp Leu Ser Tyr Val Ala Gln Tyr Trp Asn Gln Thr Gly Tyr Asp Leu

                645                 650                 655

Trp Glu Glu Val Asn Gly Ser Ser Phe Phe Thr Ile Ala Val Gln His

            660                 665                 670

Arg Ala Leu Val Glu Gly Ser Ala Phe Ala Thr Ala Val Gly Ser Ser

        675                 680                 685

Cys Ser Trp Cys Asp Ser Gln Ala Pro Gln Ile Leu Cys Tyr Leu Gln

    690                 695                 700

Ser Phe Trp Thr Gly Ser Tyr Ile Leu Ala Asn Phe Asp Ser Ser Arg

705                 710                 715                 720

Ser Gly Lys Asp Thr Asn Thr Leu Leu Gly Ser Ile His Thr Phe Asp

                725                 730                 735

Pro Glu Ala Gly Cys Asp Asp Ser Thr Phe Gln Pro Cys Ser Pro Arg

            740                 745                 750

Ala Leu Ala Asn His Lys Glu Val Val Asp Ser Phe Arg Ser Ile Tyr

        755                 760                 765

Thr Leu Asn Asp Gly Leu Ser Asp Ser Glu Ala Val Ala Val Gly Arg

    770                 775                 780

Tyr Pro Glu Asp Ser Tyr Tyr Asn Gly Asn Pro Trp Phe Leu Cys Thr

785                 790                 795                 800

Leu Ala Ala Ala Glu Gln Leu Tyr Asp Ala Leu Tyr Gln Trp Asp Lys

                805                 810                 815

Gln Gly Ser Leu Glu Ile Thr Asp Val Ser Leu Asp Phe Phe Lys Ala

            820                 825                 830

Leu Tyr Ser Gly Ala Ala Thr Gly Thr Tyr Ser Ser Ser Ser Ser Thr

        835                 840                 845

Tyr Ser Ser Ile Val Ser Ala Val Lys Thr Phe Ala Asp Gly Phe Val

    850                 855                 860

Ser Ile Val Glu Thr His Ala Ala Ser Asn Gly Ser Leu Ser Glu Gln

865                 870                 875                 880

Phe Asp Lys Ser Asp Gly Asp Glu Leu Ser Ala Arg Asp Leu Thr Trp

                885                 890                 895

Ser Tyr Ala Ala Leu Leu Thr Ala Asn Asn Arg Arg Asn Ser Val Val

            900                 905                 910

Pro Pro Ser Trp Gly Glu Thr Ser Ala Ser Ser Val Pro Gly Thr Cys

        915                 920                 925

Ala Ala Thr Ser Ala Ser Gly Thr Tyr Ser Ser Val Thr Val Thr Ser

    930                 935                 940

Trp Pro Ser Ile Val Ala Thr Gly Gly Thr Thr Thr Thr Ala Thr Thr

945                 950                 955                 960

Thr Gly Ser Gly Gly Val Thr Ser Thr Ser Lys Thr Thr Thr Thr Ala

                965                 970                 975

Ser Lys Thr Ser Thr Thr Thr Ser Ser Thr Ser Cys Thr Thr Pro Thr

            980                 985                 990

Ala Val Ala Val Thr Phe Asp Leu Thr Ala Thr Thr Thr Tyr Gly Glu

        995                 1000                1005

Asn Ile Tyr Leu Val Gly Ser Ile Ser Gln Leu Gly Asp Trp Glu Thr

    1010                1015                1020

Ser Asp Gly Ile Ala Leu Ser Ala Asp Lys Tyr Thr Ser Ser Asn Pro

1025                1030                1035                1040

Pro Trp Tyr Val Thr Val Thr Leu Pro Ala Gly Glu Ser Phe Glu Tyr

                1045                1050                1055

Lys Phe Ile Arg Val Glu Ser Asp Asp Ser Val Glu Trp Glu Ser Asp

            1060                1065                1070

Pro Asn Arg Glu Tyr Thr Val Pro Gln Ala Cys Gly Glu Ser Thr Ala

        1075                1080                1085

Thr Val Thr Asp Thr Trp Arg

    1090                1095

<210>46

<211>3285

<212>DNA

<213>Aspergillus shirousami

<400>46

gccaccccgg ccgactggcg ctcccagtcc atctacttcc tcctcaccga ccgcttcgcc    60

cgcaccgacg gctccaccac cgccacctgc aacaccgccg accagaagta ctgcggcggc    120

acctggcagg gcatcatcga caagctcgac tacatccagg gcatgggctt caccgccatc    180

tggatcaccc cggtgaccgc ccagctcccg cagaccaccg cctacggcga cgcctaccac    240

ggctactggc agcaggacat ctactccctc aacgagaact acggcaccgc cgacgacctc    300

aaggccctct cctccgccct ccacgagcgc ggcatgtacc tcatggtgga cgtggtggcc    360

aaccacatgg gctacgacgg cgccggctcc tccgtggact actccgtgtt caagccgttc    420

tcctcccagg actacttcca cccgttctgc ttcatccaga actacgagga ccagacccag    480

gtggaggact gctggctcgg cgacaacacc gtgtccctcc cggacctcga caccaccaag    540

gacgtggtga agaacgagtg gtacgactgg gtgggctccc tcgtgtccaa ctactccatc    600

gacggcctcc gcatcgacac cgtgaagcac gtgcagaagg acttctggcc gggctacaac    660

aaggccgccg gcgtgtactg catcggcgag gtgctcgacg tggacccggc ctacacctgc    720

ccgtaccaga acgtgatgga cggcgtgctc aactacccga tctactaccc gctcctcaac    780

gccttcaagt ccacctccgg ctcgatggac gacctctaca acatgatcaa caccgtgaag    840

tccgactgcc cggactccac cctcctcggc accttcgtgg agaaccacga caacccgcgc    900

ttcgcctcct acaccaacga catcgccctc gccaagaacg tggccgcctt catcatcctc    960

aacgacggca tcccgatcat ctacgccggc caggagcagc actacgccgg cggcaacgac    1020

ccggccaacc gcgaggccac ctggctctcc ggctacccga ccgactccga gctgtacaag    1080

ctcatcgcct ccgccaacgc catccgcaac tacgccatct ccaaggacac cggcttcgtg    1140

acctacaaga actggccgat ctacaaggac gacaccacca tcgccatgcg caagggcacc    1200

gacggctccc agatcgtgac catcctctcc aacaagggcg cctccggcga ctcctacacc    1260

ctctccctct ccggcgccgg ctacaccgcc ggccagcagc tcaccgaggt gatcggctgc    1320

accaccgtga ccgtgggctc cgacggcaac gtgccggtgc cgatggccgg cggcctcccg    1380

cgcgtgctct acccgaccga gaagctcgcc ggctccaaga tatgctcctc ctccaagccg    1440

gccaccctcg actcctggct ctccaacgag gccaccgtgg cccgcaccgc catcctcaac    1500

aacatcggcg ccgacggcgc ctgggtgtcc ggcgccgact ccggcatcgt ggtggcctcc    1560

ccgtccaccg acaacccgga ctacttctac acctggaccc gcgactccgg catcgtgctc    1620

aagaccctcg tggacctctt ccgcaacggc gacaccgacc tcctctccac catcgagcac    1680

tacatctcct cccaggccat catccagggc gtgtccaacc cgtccggcga cctctcctcc    1740

ggcggcctcg gcgagccgaa gttcaacgtg gacgagaccg cctacgccgg ctcctggggc    1800

cgcccgcagc gcgacggccc ggccctccgc gccaccgcca tgatcggctt cggccagtgg    1860

ctcctcgaca acggctacac ctccgccgcc accgagatcg tgtggccgct cgtgcgcaac    1920

gacctctcct acgtggccca gtactggaac cagaccggct acgacctctg ggaggaggtg    1980

aacggctcct ccttcttcac catcgccgtg cagcaccgcg ccctcgtgga gggctccgcc    2040

ttcgccaccg ccgtgggctc ctcctgctcc tggtgcgact cccaggcccc gcagatcctc    2100

tgctacctcc agtccttctg gaccggctcc tacatcctcg ccaacttcga ctcctcccgc    2160

tccggcaagg acaccaacac cctcctcggc tccatccaca ccttcgaccc ggaggccggc    2220

tgcgacgact ccaccttcca gccgtgctcc ccgcgcgccc tcgccaacca caaggaggtg    2280

gtggactcct tccgctccat ctacaccctc aacgacggcc tctccgactc cgaggccgtg    2340

gccgtgggcc gctacccgga ggactcctac tacaacggca acccgtggtt cctctgcacc    2400

ctcgccgccg ccgagcagct ctacgacgcc ctctaccagt gggacaagca gggctccctg    2460

gagatcaccg acgtgtccct cgacttcttc aaggccctct actccggcgc cgccaccggc    2520

acctactcct cctcctcctc cacctactcc tccatcgtgt ccgccgtgaa gaccttcgcc    2580

gacggcttcg tgtccatcgt ggagacccac gccgcctcca acggctccct ctccgagcag    2640

ttcgacaagt ccgacggcga cgagctgtcc gcccgcgacc tcacctggtc ctacgccgcc    2700

ctcctcaccg ccaacaaccg ccgcaactcc gtggtgccgc cgtcctgggg cgagacctcc    2760

gcctcctccg tgccgggcac ctgcgccgcc acctccgcct ccggcaccta ctcctccgtg    2820

accgtgacct cctggccgtc catcgtggcc accggcggca ccaccaccac cgccaccacc    2880

accggctccg gcggcgtgac ctccacctcc aagaccacca ccaccgcctc caagacctcc    2940

accaccacct cctccacctc ctgcaccacc ccgaccgccg tggccgtgac cttcgacctc    3000

accgccacca ccacctacgg cgagaacatc tacctcgtgg gctccatctc ccagctcggc    3060

gactgggaga cctccgacgg catcgccctc tccgccgaca agtacacctc ctccaacccg    3120

ccgtggtacg tgaccgtgac cctcccggcc ggcgagtcct tcgagtacaa gttcatccgc    3180

gtggagtccg acgactccgt ggagtgggag tccgacccga accgcgagta caccgtgccg    3240

caggcctgcg gcgagtccac cgccaccgtg accgacacct ggcgc                    3285

<210>47

<211>679

<212>PRT

<213>热解糖热厌氧杆菌

<400>47

Val Leu Ser Gly Cys Ser Asn Asn Val Ser Ser Ile Lys Ile Asp Arg

 1               5                  10                  15

Phe Asn Asn Ile Ser Ala Val Asn Gly Pro Gly Glu Glu Asp Thr Trp

            20                  25                  30

Ala Ser Ala Gln Lys Gln Gly Val Gly Thr Ala Asn Asn Tyr Val Ser

        35                  40                  45

Arg Val Trp Phe Thr Leu Ala Asn Gly Ala Ile Ser Glu Val Tyr Tyr

    50                  55                  60

Pro Thr Ile Asp Thr Ala Asp Val Lys Glu Ile Lys Phe Ile Val Thr

65                  70                  75                  80

Asp Gly Lys Ser Phe Val Ser Asp Glu Thr Lys Asp Ala Ile Ser Lys

                85                  90                  95

Val Glu Lys Phe Thr Asp Lys Ser Leu Gly Tyr Lys Leu Val Asn Thr

            100                 105                 110

Asp Lys Lys Gly Arg Tyr Arg Ile Thr Lys Glu Ile Phe Thr Asp Val

        115                 120                 125

Lys Arg Asn Ser Leu Ile Met Lys Ala Lys Phe Glu Ala Leu Glu Gly

    130                 135                 140

Ser Ile His Asp Tyr Lys Leu Tyr Leu Ala Tyr Asp Pro His Ile Lys

145                 150                 155                 160

Asn Gln Gly Ser Tyr Asn Glu Gly Tyr Val Ile Lys Ala Asn Asn Asn

                165                 170                 175

Glu Met Leu Met Ala Lys Arg Asp Asn Val Tyr Thr Ala Leu Ser Ser

            180                 185                 190

Asn Ile Gly Trp Lys Gly Tyr Ser Ile Gly Tyr Tyr Lys Val Asn Asp

        195                 200                 205

Ile Met Thr Asp Leu Asp Glu Asn Lys Gln Met Thr Lys His Tyr Asp

    210                 215                 220

Ser Ala Arg Gly Asn Ile Ile Glu Gly Ala Glu Ile Asp Leu Thr Lys

225                 230                 235                 240

Asn Ser Glu Phe Glu Ile Val Leu Ser Phe Gly Gly Ser Asp Ser Glu

                245                 250                 255

Ala Ala Lys Thr Ala Leu Glu Thr Leu Gly Glu Asp Tyr Asn Asn Leu

            260                 265                 270

Lys Asn Asn Tyr Ile Asp Glu Trp Thr Lys Tyr Cys Asn Thr Leu Asn

        275                 280                 285

Asn Phe Asn Gly Lys Ala Asn Ser Leu Tyr Tyr Asn Ser Met Met Ile

    290                 295                 300

Leu Lys Ala Ser Glu Asp Lys Thr Asn Lys Gly Ala Tyr Ile Ala Ser

305                 310                 315                 320

Leu Ser Ile Pro Trp Gly Asp Gly Gln Arg Asp Asp Asn Thr Gly Gly

                325                 330                 335

Tyr His Leu Val Trp Ser Arg Asp Leu Tyr His Val Ala Asn Ala Phe

            340                 345                 350

Ile Ala Ala Gly Asp Val Asp Ser Ala Asn Arg Ser Leu Asp Tyr Leu

        355                 360                 365

Ala Lys Val Val Lys Asp Asn Gly Met Ile Pro Gln Asn Thr Trp Ile

    370                 375                 380

Ser Gly Lys Pro Tyr Trp Thr Ser Ile Gln Leu Asp Glu Gln Ala Asp

385                 390                 395                 400

Pro Ile Ile Leu Ser Tyr Arg Leu Lys Arg Tyr Asp Leu Tyr Asp Ser

                405                 410                 415

Leu Val Lys Pro Leu Ala Asp Phe Ile Ile Lys Ile Gly Pro Lys Thr

            420                 425                 430

Gly Gln Glu Arg Trp Glu Glu Ile Gly Gly Tyr Ser Pro Ala Thr Met

        435                 440                 445

Ala Ala Glu Val Ala Gly Leu Thr Cys Ala Ala Tyr Ile Ala Glu Gln

    450                 455                 460

Asn Lys Asp Tyr Glu Ser Ala Gln Lys Tyr Gln Glu Lys Ala Asp Asn

465                 470                 475                 480

Trp Gln Lys Leu Ile Asp Asn Leu Thr Tyr Thr Glu Asn Gly Pro Leu

                485                 490                 495

Gly Asn Gly Gln Tyr Tyr Ile Arg Ile Ala Gly Leu Ser Asp Pro Asn

            500                 505                 510

Ala Asp Phe Met Ile Asn Ile Ala Asn Gly Gly Gly Val Tyr Asp Gln

        515                 520                 525

Lys Glu Ile Val Asp Pro Ser Phe Leu Glu Leu Val Arg Leu Gly Val

    530                 535                 540

Lys Ser Ala Asp Asp Pro Lys Ile Leu Asn Thr Leu Lys Val Val Asp

545                 550                 555                 560

Ser Thr Ile Lys Val Asp Thr Pro Lys Gly Pro Ser Trp Tyr Arg Tyr

                565                 570                 575

Asn His Asp Gly Tyr Gly Glu Pro Ser Lys Thr Glu Leu Tyr His Gly

            580                 585                 590

Ala Gly Lys Gly Arg Leu Trp Pro Leu Leu Thr Gly Glu Arg Gly Met

        595                 600                 605

Tyr Glu Ile Ala Ala Gly Lys Asp Ala Thr Pro Tyr Val Lys Ala Met

    610                 615                 620

Glu Lys Phe Ala Asn Glu Gly Gly Ile Ile Ser Glu Gln Val Trp Glu

625                 630                 635                 640

Asp Thr Gly Leu Pro Thr Asp Ser Ala Ser Pro Leu Asn Trp Ala His

                645                 650                 655

Ala Glu Tyr Val Ile Leu Phe Ala Ser Asn Ile Glu His Lys Val Leu

            660                 665                 670

Asp Met Pro Asp Ile Val Tyr

        675

<210>48

<211>2037

<212>DNA

<213>热解糖热厌氧杆菌

<220>

<223>合成的

<400>48

gtgctctccg gctgctccaa caacgtgtcc tccatcaaga tcgaccgctt caacaacatc    60

tccgccgtga acggcccggg cgaggaggac acctgggcct ccgcccagaa gcagggcgtg    120

ggcaccgcca acaactacgt gtcccgcgtg tggttcaccc tcgccaacgg cgccatctcc    180

gaggtgtact acccgaccat cgacaccgcc gacgtgaagg agatcaagtt catcgtgacc    240

gacggcaagt ccttcgtgtc cgacgagacc aaggacgcca tctccaaggt ggagaagttc    300

accgacaagt ccctcggcta caagctcgtg aacaccgaca agaagggccg ctaccgcatc    360

accaaggaaa tcttcaccga cgtgaagcgc aactccctca tcatgaaggc caagttcgag    420

gccctcgagg gctccatcca cgactacaag ctctacctcg cctacgaccc gcacatcaag    480

aaccagggct cctacaacga gggctacgtg atcaaggcca acaacaacga gatgctcatg    540

gccaagcgcg acaacgtgta caccgccctc tcctccaaca tcggctggaa gggctactcc    600

atcggctact acaaggtgaa cgacatcatg accgacctcg acgagaacaa gcagatgacc    660

aagcactacg actccgcccg cggcaacatc atcgagggcg ccgagatcga cctcaccaag    720

aactccgagt tcgagatcgt gctctccttc ggcggctccg actccgaggc cgccaagacc    780

gccctcgaga ccctcggcga ggactacaac aacctcaaga acaactacat cgacgagtgg    840

accaagtact gcaacaccct caacaacttc aacggcaagg ccaactccct ctactacaac    900

tccatgatga tcctcaaggc ctccgaggac aagaccaaca agggcgccta catcgcctcc    960

ctctccatcc cgtggggcga cggccagcgc gacgacaaca ccggcggcta ccacctcgtg    1020

tggtcccgcg acctctacca cgtggccaac gccttcatcg ccgccggcga cgtggactcc    1080

gccaaccgct ccctcgacta cctcgccaag gtggtgaagg acaacggcat gatcccgcag    1140

aacacctgga tctccggcaa gccgtactgg acctccatcc agctcgacga gcaggccgac    1200

ccgatcatcc tctcctaccg cctcaagcgc tacgacctct acgactccct cgtgaagccg    1260

ctcgccgact tcatcatcaa gatcggcccg aagaccggcc aggagcgctg ggaggagatc    1320

ggcggctact ccccggccac gatggccgcc gaggtggccg gcctcacctg cgccgcctac    1380

atcgccgagc agaacaagga ctacgagtcc gcccagaagt accaggagaa ggccgacaac    1440

tggcagaagc tcatcgacaa cctcacctac accgagaacg gcccgctcgg caacggccag    1500

tactacatcc gcatcgccgg cctctccgac ccgaacgccg acttcatgat caacatcgcc    1560

aacggcggcg gcgtgtacga ccagaaggag atcgtggacc cgtccttcct cgagctggtg    1620

cgcctcggcg tgaagtccgc cgacgacccg aagatcctca acaccctcaa ggtggtggac    1680

tccaccatca aggtggacac cccgaagggc ccgtcctggt atcgctacaa ccacgacggc    1740

tacggcgagc cgtccaagac cgagctgtac cacggcgccg gcaagggccg cctctggccg    1800

ctcctcaccg gcgagcgcgg catgtacgag atcgccgccg gcaaggacgc caccccgtac    1860

gtgaaggcga tggagaagtt cgccaacgag ggcggcatca tctccgagca ggtgtgggag    1920

gacaccggcc tcccgaccga ctccgcctcc ccgctcaact gggcccacgc cgagtacgtg    1980

atcctcttcg cctccaacat cgagcacaag gtgctcgaca tgccggacat cgtgtac       2037

<210>49

<211>579

<212>PRT

<213>米根霉

<400>49

Ala Ser Ile Pro Ser Ser Ala Ser Val Gln Leu Asp Ser Tyr Asn Tyr

 1               5                  10                  15

Asp Gly Ser Thr Phe Ser Gly Lys Ile Tyr Val Lys Asn Ile Ala Tyr

            20                  25                  30

Ser Lys Lys Val Thr Val Ile Tyr Ala Asp Gly Ser Asp Asn Trp Asn

        35                  40                  45

Asn Asn Gly Asn Thr Ile Ala Ala Ser Tyr Ser Ala Pro Ile Ser Gly

    50                  55                  60

Ser Asn Tyr Glu Tyr Trp Thr Phe Ser Ala Ser Ile Asn Gly Ile Lys

65                  70                  75                  80

Glu Phe Tyr Ile Lys Tyr Glu Val Ser Gly Lys Thr Tyr Tyr Asp Asn

                85                  90                  95

Asn Asn Ser Ala Asn Tyr Gln Val Ser Thr Ser Lys Pro Thr Thr Thr

            100                 105                 110

Thr Ala Thr Ala Thr Thr Thr Thr Ala Pro Ser Thr Ser Thr Thr Thr

        115                 120                 125

Pro Pro Ser Arg Ser Glu Pro Ala Thr Phe Pro Thr Gly Asn Ser Thr

    130                 135                 140

Ile Ser Ser Trp Ile Lys Lys Gln Glu Gly Ile Ser Arg Phe Ala Met

145                 150                 155                 160

Leu Arg Asn Ile Asn Pro Pro Gly Ser Ala Thr Gly Phe Ile Ala Ala

                165                 170                 175

Ser Leu Ser Thr Ala Gly Pro Asp Tyr Tyr Tyr Ala Trp Thr Arg Asp

            180                 185                 190

Ala Ala Leu Thr Ser Asn Val Ile Val Tyr Glu Tyr Asn Thr Thr Leu

        195                 200                 205

Ser Gly Asn Lys Thr Ile Leu Asn Val Leu Lys Asp Tyr Val Thr Phe

    210                 215                 220

Ser Val Lys Thr Gln Ser Thr Ser Thr Val Cys Asn Cys Leu Gly Glu

225                 230                 235                 240

Pro Lys Phe Asn Pro Asp Ala Ser Gly Tyr Thr Gly Ala Trp Gly Arg

                245                 250                 255

Pro Gln Asn Asp Gly Pro Ala Glu Arg Ala Thr Thr Phe Ile Leu Phe

            260                 265                 270

Ala Asp Ser Tyr Leu Thr Gln Thr Lys Asp Ala Ser Tyr Val Thr Gly

        275                 280                 285

Thr Leu Lys Pro Ala Ile Phe Lys Asp Leu Asp Tyr Val Val Asn Val

    290                 295                 300

Trp Ser Asn Gly Cys Phe Asp Leu Trp Glu Glu Val Asn Gly Val His

305                 310                 315                 320

Phe Tyr Thr Leu Met Val Met Arg Lys Gly Leu Leu Leu Gly Ala Asp

                325                 330                 335

Phe Ala Lys Arg Asn Gly Asp Ser Thr Arg Ala Ser Thr Tyr Ser Ser

            340                 345                 350

Thr Ala Ser Thr Ile Ala Asn Lys Ile Ser Ser Phe Trp Val Ser Ser

        355                 360                 365

Asn Asn Trp Ile Gln Val Ser Gln Ser Val Thr Gly Gly Val Ser Lys

    370                 375                 380

Lys Gly Leu Asp Val Ser Thr Leu Leu Ala Ala Asn Leu Gly Ser Val

385                 390                 395                 400

Asp Asp Gly Phe Phe Thr Pro Gly Ser Glu Lys Ile Leu Ala Thr Ala

                405                 410                 415

Val Ala Val Glu Asp Ser Phe Ala Ser Leu Tyr Pro Ile Asn Lys Asn

            420                 425                 430

Leu Pro Ser Tyr Leu Gly Asn Ser Ile Gly Arg Tyr Pro Glu Asp Thr

        435                 440                 445

Tyr Asn Gly Asn Gly Asn Ser Gln Gly Asn Ser Trp Phe Leu Ala Val

    450                 455                 460

Thr Gly Tyr Ala Glu Leu Tyr Tyr Arg Ala Ile Lys Glu Trp Ile Gly

465                 470                 475                 480

Asn Gly Gly Val Thr Val Ser Ser Ile Ser Leu Pro Phe Phe Lys Lys

                485                 490                 495

Phe Asp Ser Ser Ala Thr Ser Gly Lys Lys Tyr Thr Val Gly Thr Ser

            500                 505                 510

Asp Phe Asn Asn Leu Ala Gln Asn Ile Ala Leu Ala Ala Asp Arg Phe

        515                 520                 525

Leu Ser Thr Val Gln Leu His Ala His Asn Asn Gly Ser Leu Ala Glu

    530                 535                 540

Glu Phe Asp Arg Thr Thr Gly Leu Ser Thr Gly Ala Arg Asp Leu Thr

545                 550                 555                 560

Trp Ser His Ala Ser Leu Ile Thr Ala Ser Tyr Ala Lys Ala Gly Ala

                565                 570                 575

Pro Ala Ala

<210>50

<211>1737

<212>DNA

<213>米根霉

<400>50

gcctccatcc cgtcctccgc ctccgtgcag ctcgactcct acaactacga cggctccacc    60

ttctccggca aaatctacgt gaagaacatc gcctactcca agaaggtgac cgtgatctac    120

gccgacggct ccgacaactg gaacaacaac ggcaacacca tcgccgcctc ctactccgcc    180

ccgatctccg gctccaacta cgagtactgg accttctccg cctccatcaa cggcatcaag    240

gagttctaca tcaagtacga ggtgtccggc aagacctact acgacaacaa caactccgcc    300

aactaccagg tgtccacctc caagccgacc accaccaccg ccaccgccac caccaccacc    360

gccccgtcca cctccaccac caccccgccg tcccgctccg agccggccac cttcccgacc    420

ggcaactcca ccatctcctc ctggatcaag aagcaggagg gcatctcccg cttcgccatg    480

ctccgcaaca tcaacccgcc gggctccgcc accggcttca tcgccgcctc cctctccacc    540

gccggcccgg actactacta cgcctggacc cgcgacgccg ccctcacctc caacgtgatc    600

gtgtacgagt acaacaccac cctctccggc aacaagacca tcctcaacgt gctcaaggac    660

tacgtgacct tctccgtgaa gacccagtcc acctccaccg tgtgcaactg cctcggcgag    720

ccgaagttca acccggacgc ctccggctac accggcgcct ggggccgccc gcagaacgac    780

ggcccggccg agcgcgccac caccttcatc ctcttcgccg actcctacct cacccagacc    840

aaggacgcct cctacgtgac cggcaccctc aagccggcca tcttcaagga cctcgactac    900

gtggtgaacg tgtggtccaa cggctgcttc gacctctggg aggaggtgaa cggcgtgcac    960

ttctacaccc tcatggtgat gcgcaagggc ctcctcctcg gcgccgactt cgccaagcgc    1020

aacggcgact ccacccgcgc ctccacctac tcctccaccg cctccaccat cgccaacaaa    1080

atctcctcct tctgggtgtc ctccaacaac tggatacagg tgtcccagtc cgtgaccggc    1140

ggcgtgtcca agaagggcct cgacgtgtcc accctcctcg ccgccaacct cggctccgtg    1200

gacgacggct tcttcacccc gggctccgag aagatcctcg ccaccgccgt ggccgtggag    1260

gactccttcg cctccctcta cccgatcaac aagaacctcc cgtcctacct cggcaactcc    1320

atcggccgct acccggagga cacctacaac ggcaacggca actcccaggg caactcctgg    1380

ttcctcgccg tgaccggcta cgccgagctg tactaccgcg ccatcaagga gtggatcggc    1440

aacggcggcg tgaccgtgtc ctccatctcc ctcccgttct tcaagaagtt cgactcctcc    1500

gccacctccg gcaagaagta caccgtgggc acctccgact tcaacaacct cgcccagaac    1560

atcgccctcg ccgccgaccg cttcctctcc accgtgcagc tccacgccca caacaacggc    1620

tccctcgccg aggagttcga ccgcaccacc ggcctctcca ccggcgcccg cgacctcacc    1680

tggtcccacg cctccctcat caccgcctcc tacgccaagg ccggcgcccc ggccgcc       1737

<210>51

<211>439

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>51

Met Ala Lys His Leu Ala Ala Met Cys Trp Cys Ser Leu Leu Val Leu

 1               5                  10                  15

Val Leu Leu Cys Leu Gly Ser Gln Leu Ala Gln Ser Gln Val Leu Phe

            20                  25                  30

Gln Gly Phe Asn Trp Glu Ser Trp Lys Lys Gln Gly Gly Trp Tyr Asn

        35                  40                  45

Tyr Leu Leu Gly Arg Val Asp Asp Ile Ala Ala Thr Gly Ala Thr His

    50                  55                  60

Val Trp Leu Pro Gln Pro Ser His Ser Val Ala Pro Gln Gly Tyr Met

65                  70                  75                  80

Pro Gly Arg Leu Tyr Asp Leu Asp Ala Ser Lys Tyr Gly Thr His Ala

                85                  90                  95

Glu Leu Lys Ser Leu Thr Ala Ala Phe His Ala Lys Gly Val Gln Cys

            100                 105                 110

Val Ala Asp Val Val Ile Asn His Arg Cys Ala Asp Tyr Lys Asp Gly

        115                 120                 125

Arg Gly Ile Tyr Cys Val Phe Glu Gly Gly Thr Pro Asp Ser Arg Leu

    130                 135                 140

Asp Trp Gly Pro Asp Met Ile Cys Ser Asp Asp Thr Gln Tyr Ser Asn

145                 150                 155                 160

Gly Arg Gly His Arg Asp Thr Gly Ala Asp Phe Ala Ala Ala Pro Asp

                165                 170                 175

Ile Asp His Leu Asn Pro Arg Val Gln Gln Glu Leu Ser Asp Trp Leu

            180                 185                 190

Asn Trp Leu Lys Ser Asp Leu Gly Phe Asp Gly Trp Arg Leu Asp Phe

        195                 200                 205

Ala Lys Gly Tyr Ser Ala Ala Val Ala Lys Val Tyr Val Asp Ser Thr

    210                 215                 220

Ala Pro Thr Phe Val Val Ala Glu Ile Trp Ser Ser Leu His Tyr Asp

225                 230                 235                 240

Gly Asn Gly Glu Pro Ser Ser Asn Gln Asp Ala Asp Arg Gln Glu Leu

                245                 250                 255

Val Asn Trp Ala Gln Ala Val Gly Gly Pro Ala Ala Ala Phe Asp Phe

            260                 265                 270

Thr Thr Lys Gly Val Leu Gln Ala Ala Val Gln Gly Glu Leu Trp Arg

        275                 280                 285

Met Lys Asp Gly Asn Gly Lys Ala Pro Gly Met Ile Gly Trp Leu Pro

    290                 295                 300

Glu Lys Ala Val Thr Phe Val Asp Asn His Asp Thr Gly Ser Thr Gln

305                 310                 315                 320

Asn Ser Trp Pro Phe Pro Ser Asp Lys Val Met Gln Gly Tyr Ala Tyr

                325                 330                 335

Ile Leu Thr His Pro Gly Thr Pro Cys Ile Phe Tyr Asp His Val Phe

            340                 345                 350

Asp Trp Asn Leu Lys Gln Glu Ile Ser Ala Leu Ser Ala Val Arg Ser

        355                 360                 365

Arg Asn Gly Ile His Pro Gly Ser Glu Leu Asn Ile Leu Ala Ala Asp

    370                 375                 380

Gly Asp Leu Tyr Val Ala Lys Ile Asp Asp Lys Val Ile Val Lys Ile

385                 390                 395                 400

Gly Ser Arg Tyr Asp Val Gly Asn Leu Ile Pro Ser Asp Phe His Ala

                405                 410                 415

Val Ala His Gly Asn Asn Tyr Cys Val Trp Glu Lys His Gly Leu Arg

            420                 425                 430

Val Pro Ala Gly Arg His His

        435

<210>52

<211>1320

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>52

atggcgaagc acttggctgc catgtgctgg tgcagcctcc tagtgcttgt actgctctgc    60

ttgggctccc agctggccca atcccaggtc ctcttccagg ggttcaactg ggagtcgtgg    120

aagaagcaag gtgggtggta caactacctc ctggggcggg tggacgacat cgccgcgacg    180

ggggccacgc acgtctggct cccgcagccg tcgcactcgg tggcgccgca ggggtacatg    240

cccggccggc tctacgacct ggacgcgtcc aagtacggca cccacgcgga gctcaagtcg    300

ctcaccgcgg cgttccacgc caagggcgtc cagtgcgtcg ccgacgtcgt gatcaaccac    360

cgctgcgccg actacaagga cggccgcggc atctactgcg tcttcgaggg cggcacgccc    420

gacagccgcc tcgactgggg ccccgacatg atctgcagcg acgacacgca gtactccaac    480

gggcgcgggc accgcgacac gggggccgac ttcgccgccg cgcccgacat cgaccacctc    540

aacccgcgcg tgcagcagga gctctcggac tggctcaact ggctcaagtc cgacctcggc    600

ttcgacggct ggcgcctcga cttcgccaag ggctactccg ccgccgtcgc caaggtgtac    660

gtcgacagca ccgcccccac cttcgtcgtc gccgagatat ggagctccct ccactacgac    720

ggcaacggcg agccgtccag caaccaggac gccgacaggc aggagctggt caactgggcg    780

caggcggtgg gcggccccgc cgcggcgttc gacttcacca ccaagggcgt gctgcaggcg    840

gccgtccagg gcgagctgtg gcgcatgaag gacggcaacg gcaaggcgcc cgggatgatc    900

ggctggctgc cggagaaggc cgtcacgttc gtcgacaacc acgacaccgg ctccacgcag    960

aactcgtggc cattcccctc cgacaaggtc atgcagggct acgcctatat cctcacgcac    1020

ccaggaactc catgcatctt ctacgaccac gttttcgact ggaacctgaa gcaggagatc    1080

agcgcgctgt ctgcggtgag gtcaagaaac gggatccacc cggggagcga gctgaacatc    1140

ctcgccgccg acggggatct ctacgtcgcc aagattgacg acaaggtcat cgtgaagatc    1200

gggtcacggt acgacgtcgg gaacctgatc ccctcagact tccacgccgt tgcccctggc    1260

aacaactact gcgtttggga gaagcacggt ctgagagttc cagcggggcg gcaccactag    1320

<210>53

<211>45

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>53

Ala Thr Gly Gly Thr Thr Thr Thr Ala Thr Thr Thr Gly Ser Gly Gly

 1               5                  10                  15

Val Thr Ser Thr Ser Lys Thr Thr Thr Thr Ala Ser Lys Thr Ser Thr

            20                  25                  30

Thr Thr Ser Ser Thr Ser Cys Thr Thr Pro Thr Ala Val

        35                  40                  45

<210>54

<211>137

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>54

gccaccggcg gcaccaccac caccgccacc accaccggct ccggcggcgt gacctccacc    60

tccaagacca ccaccaccgc ctccaagacc tccaccacca cctcctccac ctcctgcacc    120

accccgaccg ccgtgtc                                                   137

<210>55

<211>300

<212>PRT

<213>激烈火球菌

<400>55

Ile Tyr Phe Val Glu Lys Tyr His Thr Ser Glu Asp Lys Ser Thr Ser

 1               5                  10                  15

Asn Thr Ser Ser Thr Pro Pro Gln Thr Thr Leu Ser Thr Thr Lys Val

            20                  25                  30

Leu Lys Ile Arg Tyr Pro Asp Asp Gly Glu Trp Pro Gly Ala Pro Ile

        35                  40                  45

Asp Lys Asp Gly Asp Gly Asn Pro Glu Phe Tyr Ile Glu Ile Asn Leu

    50                  55                  60

Trp Asn Ile Leu Asn Ala Thr Gly Phe Ala Glu Met Thr Tyr Asn Leu

65                  70                  75                  80

Thr Ser Gly Val Leu His Tyr Val Gln Gln Leu Asp Asn Ile Val Leu

                85                  90                  95

Arg Asp Arg Ser Asn Trp Val His Gly Tyr Pro Glu Ile Phe Tyr Gly

            100                 105                 110

Asn Lys Pro Trp Asn Ala Asn Tyr Ala Thr Asp Gly Pro Ile Pro Leu

        115                 120                 125

Pro Ser Lys Val Ser Asn Leu Thr Asp Phe Tyr Leu Thr Ile Ser Tyr

    130                 135                 140

Lys Leu Glu Pro Lys Asn Gly Leu Pro Ile Asn Phe Ala Ile Glu Ser

145                 150                 155                 160

Trp Leu Thr Arg Glu Ala Trp Arg Thr Thr Gly Ile Asn Ser Asp Glu

                165                 170                 175

Gln Glu Val Met Ile Trp Ile Tyr Tyr Asp Gly Leu Gln Pro Ala Gly

            180                 185                 190

Ser Lys Val Lys Glu Ile Val Val Pro Ile Ile Val Asn Gly Thr Pro

        195                 200                 205

Val Asn Ala Thr Phe Glu Val Trp Lys Ala Asn Ile Gly Trp Glu Tyr

    210                 215                 220

Val Ala Phe Arg Ile Lys Thr Pro Ile Lys Glu Gly Thr Val Thr Ile

225                 230                 235                 240

Pro Tyr Gly Ala Phe Ile Ser Val Ala Ala Asn Ile Ser Ser Leu Pro

                245                 250                 255

Asn Tyr Thr Glu Leu Tyr Leu Glu Asp Val Glu Ile Gly Thr Glu Phe

            260                 265                 270

Gly Thr Pro Ser Thr Thr Ser Ala His Leu Glu Trp Trp Ile Thr Asn

        275                 280                 285

Ile Thr Leu Thr Pro Leu Asp Arg Pro Leu Ile Ser

    290                 295                 300

<210>56

<211>903

<212>DNA

<213>激烈火球菌

<400>56

atctacttcg tggagaagta ccacacctcc gaggacaagt ccacctccaa cacctcctcc    60

accccgccgc agaccaccct ctccaccacc aaggtgctca agatccgcta cccggacgac    120

ggcgagtggc ccggcgcccc gatcgacaag gacggcgacg gcaacccgga gttctacatc    180

gagatcaacc tctggaacat cctcaacgcc accggcttcg ccgagatgac ctacaacctc    240

actagtggcg tgctccacta cgtgcagcag ctcgacaaca tcgtgctccg cgaccgctcc    300

aactgggtgc acggctaccc ggaaatcttc tacggcaaca agccgtggaa cgccaactac    360

gccaccgacg gcccgatccc gctcccgtcc aaggtgtcca acctcaccga cttctacctc    420

accatctcct acaagctcga gccgaagaac ggtctcccga tcaacttcgc catcgagtcc    480

tggctcaccc gcgaggcctg gcgcaccacc ggcatcaact ccgacgagca ggaggtgatg    540

atctggatct actacgacgg cctccagccc gcgggctcca aggtgaagga gatcgtggtg    600

ccgatcatcg tgaacggcac cccggtgaac gccaccttcg aggtgtggaa ggccaacatc    660

ggctgggagt acgtggcctt ccgcatcaag accccgatca aggagggcac cgtgaccatc    720

ccgtacggcg ccttcatctc cgtggccgcc aacatctcct ccctcccgaa ctacaccgag    780

aagtacctcg aggacgtgga gatcggcacc gagttcggca ccccgtccac cacctccgcc    840

cacctcgagt ggtggatcac caacatcacc ctcaccccgc tcgaccgccc gctcatctcc    900

tag                                                                  903

<210>57

<211>387

<212>PRT

<213>黄栖热菌

<400>57

Met Tyr Glu Pro Lys Pro Glu His Arg Phe Thr Phe Gly Leu Trp Thr

 1               5                  10                  15

Val Asp Asn Val Asp Arg Asp Pro Phe Gly Asp Thr Val Arg Glu Arg

            20                  25                  30

Leu Asp Pro Val Tyr Val Val His Lys Leu Ala Glu Leu Gly Ala Tyr

        35                  40                  45

Gly Val Asn Leu His Asp Glu Asp Leu Ile Pro Arg Gly Thr Pro Pro

    50                  55                  60

Gln Glu Arg Asp Gln Ile Val Arg Arg Phe Lys Lys Ala Leu Asp Glu

65                  70                  75                  80

Thr Val Leu Lys Val Pro Met Val Thr Ala Asn Leu Phe Ser Glu Pro

                85                  90                  95

Ala Phe Arg Asp Gly Ala Ser Thr Thr Arg Asp Pro Trp Val Trp Ala

            100                 105                 110

Tyr Ala Leu Arg Lys Ser Leu Glu Thr Met Asp Leu Gly Ala Glu Leu

        115                 120                 125

Gly Ala Glu Ile Tyr Met Phe Trp Met Val Arg Glu Arg Ser Glu Val

    130                 135                 140

Glu Ser Thr Asp Lys Thr Arg Lys Val Trp Asp Trp Val Arg Glu Thr

145                 150                 155                 160

Leu Asn Phe Met Thr Ala Tyr Thr Glu Asp Gln Gly Tyr Gly Tyr Arg

                165                 170                 175

Phe Ser Val Glu Pro Lys Pro Asn Glu Pro Arg Gly Asp Ile Tyr Phe

            180                 185                 190

Thr Thr Val Gly Ser Met Leu Ala Leu Ile His Thr Leu Asp Arg Pro

        195                 200                 205

Glu Arg Phe Gly Leu Asn Pro Glu Phe Ala His Glu Thr Met Ala Gly

    210                 215                 220

Leu Asn Phe Asp His Ala Val Ala Gln Ala Val Asp Ala Gly Lys Leu

225                 230                 235                 240

Phe His Ile Asp Leu Asn Asp Gln Arg Met Ser Arg Phe Asp Gln Asp

                245                 250                 255

Leu Arg Phe Gly Ser Glu Asn Leu Lys Ala Gly Phe Phe Leu Val Asp

            260                 265                 270

Leu Leu Glu Ser Ser Gly Tyr Gln Gly Pro Arg His Phe Glu Ala His

        275                 280                 285

Ala Leu Arg Thr Glu Asp Glu Glu Gly Val Trp Thr Phe Val Arg Val

    290                 295                 300

Cys Met Arg Thr Tyr Leu Ile Ile Lys Val Arg Ala Glu Thr Phe Arg

305                 310                 315                 320

Glu Asp Pro Glu Val Lys Glu Leu Leu Ala Ala Tyr Tyr Gln Glu Asp

                325                 330                 335

Pro Ala Thr Leu Ala Leu Leu Asp Pro Tyr Ser Arg Glu Lys Ala Glu

            340                 345                 350

Ala Leu Lys Arg Ala Glu Leu Pro Leu Glu Thr Lys Arg Arg Arg Gly

        355                 360                 365

Tyr Ala Leu Glu Arg Leu Asp Gln Leu Ala Val Glu Tyr Leu Leu Gly

    370                 375                 380

Val Arg Gly

385

<210>58

<211>978

<212>DNA

<213>人工序列

<220>

<223>合成的

<400>58

atggggaaga acggcaacct gtgctgcttc tctctgctgc tgcttcttct cgccgggttg    60

gcgtccggcc atcaaatcta cttcgtggag aagtaccaca cctccgagga caagtccacc    120

tccaacacct cctccacccc gccgcagacc accctctcca ccaccaaggt gctcaagatc    180

cgctacccgg acgacggtga gtggcccggc gccccgatcg acaaggacgg cgacggcaac    240

ccggagttct acatcgagat caacctctgg aacatcctca acgccaccgg cttcgccgag    300

atgacctaca acctcactag tggcgtgctc cactacgtgc agcagctcga caacatcgtg    360

ctccgcgacc gctccaactg ggtgcacggc tacccggaaa tcttctacgg caacaagccg    420

tggaacgcca actacgccac cgacggcccg atcccgctcc cgtccaaggt gtccaacctc    480

accgacttct acctcaccat ctcctacaag ctcgagccga agaacggtct cccgatcaac    540

ttcgccatcg agtcctggct cacccgcgag gcctggcgca ccaccggcat caactccgac    600

gagcaggagg tgatgatctg gatctactac gacggcctcc agcccgcggg ctccaaggtg    660

aaggagatcg tggtgccgat catcgtgaac ggcaccccgg tgaacgccac cttcgaggtg    720

tggaaggcca acatcggctg ggagtacgtg gccttccgca tcaagacccc gatcaaggag    780

ggcaccgtga ccatcccgta cggcgccttc atctccgtgg ccgccaacat ctcctccctc    840

ccgaactaca ccgagaagta cctcgaggac gtggagatcg gcaccgagtt cggcaccccg    900

tccaccacct ccgcccacct cgagtggtgg atcaccaaca tcaccctcac cccgctcgac    960

cgcccgctca tctcctag                                                  978

<210>59

<211>1920

<212>DNA

<213>黑色曲霉

<400>59

atgtccttcc gctccctcct cgccctctcc ggcctcgtgt gcaccggcct cgccaacgtg    60

atctccaagc gcgccaccct cgactcctgg ctctccaacg aggccaccgt ggcccgcacc    120

gccatcctca acaacatcgg cgccgacggc gcctgggtgt ccggcgccga ctccggcatc    180

gtggtggcct ccccgtccac cgacaacccg gactacttct acacctggac ccgcgactcc    240

ggcctcgtgc tcaagaccct cgtggacctc ttccgcaacg gcgacacctc cctcctctcc    300

accatcgaga actacatctc cgcccaggcc atcgtgcagg gcatctccaa cccgtccggc    360

gacctctcct ccggcgccgg cctcggcgag ccgaagttca acgtggacga gaccgcctac    420

accggctcct ggggccgccc gcagcgcgac ggcccggccc tccgcgccac cgccatgatc    480

ggcttcggcc agtggctcct cgacaacggc tacacctcca ccgccaccga catcgtgtgg    540

ccgctcgtgc gcaacgacct ctcctacgtg gcccagtact ggaaccagac cggctacgac    600

ctctgggagg aggtgaacgg ctcctccttc ttcaccatcg ccgtgcagca ccgcgccctc    660

gtggagggct ccgccttcgc caccgccgtg ggctcctcct gctcctggtg cgactcccag    720

gccccggaga tcctctgcta cctccagtcc ttctggaccg gctccttcat cctcgccaac    780

ttcgactcct cccgctccgg caaggacgcc aacaccctcc tcggctccat ccacaccttc    840

gacccggagg ccgcctgcga cgactccacc ttccagccgt gctccccgcg cgccctcgcc    900

aaccacaagg aggtggtgga ctccttccgc tccatctaca ccctcaacga cggcctctcc    960

gactccgagg ccgtggccgt gggccgctac ccggaggaca cctactacaa cggcaacccg    1020

tggttcctct gcaccctcgc cgccgccgag cagctctacg acgccctcta ccagtgggac    1080

aagcagggct ccctcgaggt gaccgacgtg tccctcgact tcttcaaggc cctctactcc    1140

gacgccgcca ccggcaccta ctcctcctcc tcctccacct actcctccat cgtggacgcc    1200

gtgaagacct tcgccgacgg cttcgtgtcc atcgtggaga cccacgccgc ctccaacggc    1260

tccatgtccg agcagtacga caagtccgac ggcgagcagc tctccgcccg cgacctcacc    1320

tggtcctacg ccgccctcct caccgccaac aaccgccgca actccgtggt gccggcctcc    1380

tggggcgaga cctccgcctc ctccgtgccg ggcacctgcg ccgccacctc cgccatcggc    1440

acctactcct ccgtgaccgt gacctcctgg ccgtccatcg tggccaccgg cggcaccacc    1500

accaccgcca ccccgaccgg ctccggctcc gtgacctcca cctccaagac caccgccacc    1560

gcctccaaga cctccacctc cacctcctcc acctcctgca ccaccccgac cgccgtggcc    1620

gtgaccttcg acctcaccgc caccaccacc tacggcgaga acatctacct cgtgggctcc    1680

atctcccagc tcggcgactg ggagacctcc gacggcatcg ccctctccgc cgacaagtac    1740

acctcctccg acccgctctg gtacgtgacc gtgaccctcc cggccggcga gtccttcgag    1800

tacaagttca tccgcatcga gtccgacgac tccgtggagt gggagtccga cccgaaccgc    1860

gagtacaccg tgccgcaggc ctgcggcacc tccaccgcca ccgtgaccga cacctggcgc    1920

<210>60

<211>6

<212>PRT

<213>人工序列

<220>

<223>合成的

<400>60

Ser Glu Lys Asp Glu Leu

 1               5

自加工的植物及植物部分.pdf_第1页
第1页 / 共233页
自加工的植物及植物部分.pdf_第2页
第2页 / 共233页
自加工的植物及植物部分.pdf_第3页
第3页 / 共233页
点击查看更多>>
资源描述

《自加工的植物及植物部分.pdf》由会员分享,可在线阅读,更多相关《自加工的植物及植物部分.pdf(233页珍藏版)》请在专利查询网上搜索。

本发明提供多核苷酸序列,优选合成的多核苷酸,其编码为在植物中表达而优化的加工酶。该多核苷酸编码耐中温、耐高温或耐超高温的加工酶,该酶在适当的活化条件下能够被活化从而对目的底物发挥作用,本发明还提供“自加工”的转基因植物以及植物部分,如谷粒,这些植物能够表达一种或多种这样的酶,并且具有改变了的组分,所述组分利于植物和谷粒生长。还提供了制备及使用这些植物的方法,例如生产风味改善的食物产品的方法,生产可。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 >


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1