其中AREA、PEPC和/或PEPE基因已被灭活的真菌.pdf

摘要
申请专利号：	CN96199006.6	申请日：	1996.12.16
公开号：	CN1204370A	公开日：	1999.01.06
当前法律状态：	终止	有效性：	无权
法律详情：	专利权的终止(未缴年费专利权终止)授权公告日：2004.8.4\|\|\|授权\|\|\|著录事项变更变更项目:申请人地址变更前:诺沃挪第克公司丹麦巴格斯瓦尔德变更后:诺沃奇梅兹有限公司丹麦鲍斯韦\|\|\|\|\|\|公开
IPC分类号：	C12N15/80; C12N1/15	主分类号：	C12N15/80; C12N1/15
申请人：	诺沃挪第克公司;
发明人：	T·克里斯藤森; J·勒穆比克
地址：	丹麦巴格斯瓦尔德
优先权：	1995.12.15 DK 1428/95
专利代理机构：	中国国际贸易促进委员会专利商标事务所	代理人：	陈文平
PDF下载：	PDF下载

内容摘要

本发明涉及不产生蛋白酶的真菌。本发明的真菌作为产生蛋白质的宿主是有用的,所说的蛋白质易于被通常产生的蛋白酶所酶解。因此,本发明包括利用本发明的真菌以高产率产生兴趣蛋白质的方法。本发明也包括产生这种真菌的方法以及用于这些方法中的DNA构建体。

权利要求书

1：一种真菌，其中的areA基因已由重组DNA技术修饰，使它不能以提供功能性AreA激活物的方式表达，并且其中的编码胞外蛋白酶PepC和／或PepE的基因已被灭活，使它们不能表达产生功能性蛋白酶。
2：权利要求1的真菌，其中所说的灭活已通过缺失所有或部分areA、 pepC和／或pepE基因获得。
3：权利要求1的真菌，其中所说的灭活已通过缺失所有或部分areA和 pepE基因获得。
4：权利要求1的真菌，其中所说的灭活已通过干扰表达信号的调节作用获得，这里所说的表达信号调节areA、pepC和／或pepE基因自身的表达。
5：权利要求1的真菌，其中所说的灭活已通过干扰表达信号的调节作用获得，这里所说的表达信号调节areA和pepE基因自身的表达。
6：权利要求1的真菌，其中所说的灭活已通过利用反义技术获得。
7：权利要求1的真菌，其中所说的灭活已通过将额外的DNA插入到 areA、pepC和／或pepE基因内部获得。
8：权利要求1-7之任一的真菌，其是丝状真菌，优选地属于选自下组的属：曲霉属(Aspergillus)、木霉属(Trichoderma)、腐质霉属(Humicola)、假丝酵母属(Candida)、顶孢霉属(Acremonium)、镰刀菌属(Fusarium)以及青霉属(Penicillium)。
9：权利要求8的真菌，其属于选自下组的种：米曲霉(A．oryzae)、黑曲霉(A．niger)、泡盛曲霉(A．awamori)、A．phoenicis、日本曲霉(A． japonicus)、臭曲霉(A．foetidus)、构巢曲霉(A．nidulans)、T．reesei、 T．harzianum、H．insolens、H．lanuginosa、禾谷镰孢(F． graminearum)、腐皮镰孢(F．solani)、产黄青霉(P．chrysogenum)等。
10：一种产生按照权利要求1的真菌的方法，其中所说的灭活已通过缺失所有或部分areA、pepC和／或pepE基因获得，该方法包括： i)克隆兴趣真菌的areA、pepC和／或pepE基因， ii)产生各包含areA基因、pepC基因和／或pepE基因中之一的DNA构建体，其中一个内部部分已被取代、缺失，或者额外的DNA已被插入， iii)用所说的构建体转化所说的真菌，和 iv)分离areA - 、pepC - 和／或pepE - 的转化体。
11：一种产生按照权利要求1的真菌的方法，其中所说的灭活已通过缺失所有或部分areA和pepE基因获得，该方法包括： i)克隆兴趣真菌的areA和pepE基因， ii)产生各包含areA基因和pepE基因中之一的DNA构建体，其中一个内部部分已被取代、缺失，或者额外的DNA已被插入， iii)用所说的构建体转化所说的真菌，和 iv)分离areA - 和pepE - 的转化体。
12：一种产生按照权利要求1的真菌的方法，其中所说的灭活已通过缺失所有或部分areA和pepC基因获得，该方法包括： i)克隆兴趣真菌的areA和pepC基因， ii)产生各包含areA基因和pepC基因中之一的DNA构建体，其中一个内部部分已被取代、缺失，或者额外的DNA已被插入， iii)用所说的构建体转化所说的真菌，和 iv)分离areA - 和pepC - 的转化体。
13：一种产生按照权利要求1的真菌的方法，其中所说的灭活已通过缺失所有或部分pepC和pepE基因获得，该方法包括： i)克隆兴趣真菌的pepC和pepE基因， ii)产生各包含pepC基因和pepE基因中之一的DNA构建体，其中一个内部部分已被取代、缺失，或者额外的DNA已被插入， iii)用所说的构建体转化所说的真菌，和 iv)分离pepC - 和pepE - 的转化体。
14：一种产生按照权利要求1的真菌的方法，其中所说的灭活已通过采用反义技术获得，该方法包括： i)构建表达质粒，各个这样的质粒导致一种RNA分子的合成，所说的RNA 分子互补于从areA基因、pepC基因和／或pepE基因转录的mRNA， ii)用所说的表达质粒和适当的标记转化所说的宿主真菌，该表达质粒和标记两者在不同的质粒上或者在相同的质粒上， iii)用所说的标记选择转化体，和 iv)筛选所选择的转化体，以获得显示AreA、PepC和／或PepE产物的合成降低的菌株。
15：一种产生按照权利要求1的真菌的方法，其中所说的灭活已通过采用反义技术获得，该方法包括： i)构建表达质粒，各个这样的质粒导致一种RNA分子的合成，所说的RNA 分子互补于从areA基因和pepE基因转录的mRNA， ii)用所说的表达质粒和适当的标记转化所说的宿主真菌，该表达质粒和标记两者在不同的质粒上或者在相同的质粒上， iii)用所说的标记选择转化体，和 iv)筛选所选择的转化体，以获得显示AreA、PepC和PepE产物的合成降低的菌株。
16：一种产生所需基因产物的方法，其通过在适当的条件下在合适的生长培养基中培养按照权利要求1-9之任一的真菌，并回收和纯化所说的所需基因产物。
17：一种产生所需基因产物的方法，其通过在适当的条件下在合适的生长培养基中培养按照权利要求1-9之任一的真菌，并回收和纯化所说的所需基因产物，所说的真菌已被转化，使编码所说的所需基因产物的DNA序列以功能性方式整合进该真菌的基因组中。
18：一种产生所需多肽的方法，该方法包括在适当的生长培养基中培养真菌，并从所说的培养物中回收所说的多肽，所说的真菌携带有一种重组 DNA构建体，该构建体能够引起所说的多肽或其前体在所说在真菌中表达，所说的真菌还以比其野生型产生较低量的功能性AreA、PepC和／或 PepE为特征。
19：按照权利要求18的方法，其中所说的真菌已通过一种方法修饰，以比野生型产生较低量的AreA、PepC和／或PepE，所说的修饰方法包括用DNA构建体转化所说的真菌，该DNA构建体在整合进所说真菌基因组中时，能够引起功能性AreA、PepC和／或PepE产量的降低。
20：按照权利要求18的方法，其中所说的多肽由所说的真菌分泌到胞外基质中。
21：按照权利要求18的方法，其中所说的真菌比类似真菌产生较高量的所说多肽，这里所说的类似真菌以与所说真菌的野生型类似的产量产生 AreA，PepC和／或PepE，所说的类似真菌在所有其它方面与所说的真菌相同。
22：权利要求14或15-21的方法，其中所说的基因产物是一种分泌蛋白质。
23：权利要求14-20之任一的方法，其中所说的所需基因产物是一种工业肽或蛋白质，优选地是一种酶。
24：权利要求23的方法，其中所说的酶选自包括下列酶的组：蛋白酶、脂肪酶、角质酶、纤维素酶、凝乳酶。
25：权利要求15-22之任一的方法，其中所说的所需基因产物是一种有治疗活性的肽或蛋白质。
26：权利要求25的方法，其中所说的有治疗活性的肽或蛋白质选自包括下列物质的组：胰岛素、生长激素、胰高血糖素、促生长素抑制素、干扰素、PDGF、因子VII、因子VIII、尿激酶、tPA、EPO或TPO。
27：一种基因产物，其是用权利要求15-26之任一的方法产生的。
28：一种DNA序列，该序列编码米曲霉的pepC基因(SEQ ID No．1)或其功能性等位基因。
29：一种米曲霉的PepC蛋白酶(SEQ ID No．2)。
30：一种产生权利要求29的PepC蛋白酶的方法，该方法包括用包含权利要求28的DNA序列的DNA构建体转化合适的宿主，选择能够产生所说的PepC蛋白酶的转化体，在适当的生长培养基中培养所说的转化体，并且从所说的培养物中回收所说的PepC蛋白酶。
31：一种DNA序列，该序列编码米曲霉的pepE基因(SEQ ID No．3)或其功能性等位基因。
32：一种米曲霉的PepE蛋白酶(SEQ ID No．4)。
33：一种产生权利要求32的PepE蛋白酶的方法，该方法包括用包含权利要求31的DNA序列的DNA构建体转化合适的宿主，选择能够产生所说的PepE蛋白酶的转化体，在适当的生长培养基中培养所说的转化体，并且从所说的培养物中回收所说的PepE蛋白酶。
34：权利要求30或33的方法，其中所说的宿主是按照权利要求1-9之任一的真菌。
35：权利要求30、33或34的方法，其中所说的宿主是米曲霉，并且其中所说的DNA构建体包含权利要求28或31的DNA序列，其提供编码 PepC或PepE蛋白酶之基因的额外拷贝。

说明书

其中areA、pepC和／或pepE基因已被灭活的真菌
    发明所属技术领域

    本发明涉及不产生蛋白酶的真菌。本发明的真菌作为产生蛋白质的宿主是有用的，所说的蛋白质易于被通常产生的蛋白酶所酶解。因此，本发明包括利用本发明的真菌以高产率产生兴趣蛋白质的方法。本发明也包括产生这种真菌的方法以及用于这些方法中的DNA构建体。

    【发明背景】

    真菌(尤其是丝状真菌)在商业上广泛地被使用，这是因为它们具有分泌很高水平的蛋白质的能力。

    在丝状真菌中，属于曲霉属的物种用于产生内源性蛋白质(后来也用于产生异源蛋白质)的商业用途已具有很长的历史。

    大多数微生物用于产生蛋白质的一个缺点是固有地蛋白酶产生，该蛋白酶使目的产物降解(由于蛋白酶解)。

    已研究了避免这一现象发生的各种方法。在这些解决方案中，已经有人提出缺失或破坏编码各种蛋白酶的基因。遗憾地是，真菌产生大量种类的蛋白酶，使得这种解决方案或多或少地有些不现实。

    因此需要寻求显示出没有蛋白酶产生或十分低水平的蛋白酶产生的丝状真菌菌株。

    一些年来，已知调节基因araA(在构巢曲霉中其介导氮代谢物阻抑)影响胞外蛋白酶的产生(Arst & Cove，molec．gen．Genet．126，(1973)111-141)。

    已克隆了构巢曲霉的araA基因(Caddick等，EMBO杂志5，(1986)1087-1090)，并且已对它进行了各种修饰，以评价在由这一基因编码的激活物蛋白质中不同区的功能(Stankovitch等，分子微生物学7，(1993)81-87)。此外，最近似乎已克隆了在烟曲霉中编码相应功能的基因(Hensel等，真菌遗传学的第二次欧洲会议，1994年4月28日至5月1日，摘要册，E11)。

    从文献中，基因型argB areAl的构巢曲霉菌株作为产生t-PA的宿主的单一用途是已知的(Upshall等，生物技术5，(1987)1301-1304)。在这一例子中，仅argB基因型通过其精氨酸原养型用作选择标记，而araA基因型只是巧合。

    国际专利出版物号WO 95／35385公开了作为在丝状真菌中减少蛋白酶水平的一种手段的araA基因的缺失方法。

    除胞外蛋白酶之外，真菌也产生一些胞内蛋白酶(也称为内质蛋白酶)。

    在这些中间，枯草菌素型丝氨酸蛋白酶(由黑曲霉产生，指定为PepC)已有描述，并克隆表达它的基因，在EP574 347和Frederick等，基因，125 57-64(1993)中描述了一种缺失突变体。

    在Jarai等，基因，145 171-178(1994)中公开了另一种这样的天冬氨酸型蛋白酶(指定为PepE)。该文献公开了pepE基因的克隆与鉴定，并推测了pepE与pepC基因的调节作用。

    本发明的目的是缓解对无蛋白酶的丝状真菌的需要。

    发明概要

    本发明因而涉及这样的真菌，其中的areA、pepC和／或pepE基因已由重组DNA技术修饰，由此它们不能以提供功能性AreA激活物和功能性PepC和／或PepE蛋白酶的方式表达。

    此外本发明涉及产生这样的真菌的方法，所说真菌是通过缺失areA、pepC和／或pepE基因获得的。

    这可以通过包括以下步骤的方法获得：

    i)克隆兴趣真菌的areA、pepC和／或pepE基因，

    ii)产生各包含areA基因、pepC基因和／或pepE基因中之一的DNA构建体，其中一个内部部分已被取代、缺失，或者额外的DNA已被插入，

    iii)用所说的构建体转化所说的真菌，和

    iv)分离areA-、pepC-和／或pepE-的转化体。

    从以上提到的克隆areA、pepC和／或pepE基因获得的信息也可以用于与熟知的反义技术相连系，以构建表达质粒并用它转化兴趣真菌，所说的质粒导致一种RNA分子的合成，该RNA分子互补于从areA基因、pepC基因和／或pepE基因转录的mRNA。

    此外，本发明涉及意欲用于以上提到的方法中的DNA构建体。

    另外，本发明涉及产生所需蛋白质或基因产物(尤其是分泌蛋白质)的方法，该方法为在合适的条件下在适当的生长培养基中培养真菌，并回收和纯化所说的所需基因产物，其中所说的真菌是用DNA构建体修饰过的和任选转化过的，所说的DNA构建体包含至少一种编码兴趣蛋白质或基因产物的DNA序列。

    当完成本发明时，惊人地发现本发明的真菌以得到很大改进的产率产生这样的分泌蛋白质。

    也惊人地发现，能够使米曲霉areA-菌株生长良好的仅有的氮源是谷氨酰胺。

    本发明还涉及用上述方法产生的蛋白质产物。

    本发明也涉及编码米曲霉pepC基因或其功能性等位基因的DNA序列(SEQ ID No．1)。

    本发明也包括米曲霉PepC蛋白酶(SEQ ID No．2)，以及产生PepC蛋白酶的方法，该方法包括用编码PepC蛋白酶的DNA序列的DNA构建体转化合适的宿主，选择能够产生所说的PepC蛋白酶的转化体，在适当的生长培养基中培养所说的转化体，并且从所说的培养物中回收所说的PepC蛋白酶。

    此外，本发明涉及编码米曲霉pepE基因或其功能性等位基因的DNA序列(SEQ ID No．3)。

    同时，本发明涉及米曲霉PepE蛋白酶(SEQ ID No．4)，以及产生PepE蛋白酶的方法，该方法包括用编码该蛋白酶的DNA序列的DNA构建体转化合适的宿主，选择能够产生所说的PepE蛋白酶的转化体，在适当的生长培养基中培养所说的转化体，并且从所说的培养物中回收所说的PepE蛋白酶。

    按照这些方面，所说的宿主优选地是按照本发明的真菌，尤其是米曲霉，并且其中所说的DNA构建体提供编码所说PepC或PepE蛋白酶的基因的一个额外拷贝。

    附图简要描述

    参照实施例和附图，在说明书的以下部分中详细描述本发明，其中

    图1显示了HowB101的构建中所涉及的步骤，

    图2显示了pToC345的构建，

    图3显示了pToC315的构建中所涉及的步骤。

    图4图示了pyrG基因的两步基因缺失。

    图5显示了pJaL235的构建，

    图6显示了pJaL335的构建中所涉及的步骤，

    图7显示了pJaL363的构建中所涉及的步骤，

    图8显示了pJaLz的构建中所涉及的步骤，

    图9显示了pSKS和pSK9的构建，

    图10a和10b显示了pToC243和pToC266的构建中所涉及的步骤，

    图11显示了pMT1606的构建中所涉及的步骤，

    图12显示了pToC56的构建，

    图13a和13b显示了pJaL368的构建中所涉及的步骤，和

    图14a和14b显示了pToC338的构建。

    定义

    在本说明书中使用了下列定义：

    符号areAD意指其中araA基因被缺失的菌株，类似的符号用于其中pepC和／或pepE基因被缺失的菌株。

    符号areA-意指不产生功能性AreA激活物的菌株。术语“功能丧失”也常用于该目的。类似的符号用于不产生功能性PepC和／或PepE蛋白酶的菌株。

    术语“反义技术“描述了在例如US 5，190，931中公开的方法。发明详述

    如上所述，本发明的第一方面涉及真菌，其中的areA基因已由重组DNA技术修饰，使它不能以提供功能性AreA激活物的方式表达，并且其中的编码胞外蛋白酶PepC和／或PepE的基因已被灭活，使它们不能表达产生功能性蛋白酶。

    这一目的具体来说可以通过缺失或破裂areA、pepC和／或pepE基因达到。

    在实施例中描述了areA、pepC和／或pepE基因的克隆。

    其它真菌的AreA类似物可以通过与一种已知的基因杂交或者通过areA突变体(例如在本说明书中描述的构巢曲霉areA-18或米曲霉areA菌株)的互补作用来克隆。

    用于缺失或破坏基因的方法具体地说是在WO 90／00192(Genencor)中有描述。

    用于在基因中置换DNA的方法一般来说是已知的，并且该置换可以通置换个基因的一个或多个连续的部分来完成，但是它也可以由定点诱变(产生编码非功能性AreA激活物变体的DNA序列)来达到。

    可以达到这样的目的另一种方法是通过利用反义技术。

    反义技术以及如何使用它在以上提及的US 5，190，931(纽约大学)中有详细描述。

    获得灭活的另一种方法是通过在araA基因内插入额外的DNA，从而导致无功能的激活物蛋白质的表达。

    与这一方法相结合，由克隆所提供的信息可以用于制备可被整合进araA基因的DNA构建体，并且甚至用另一种基因(例如pyrG基因)取代araA基因。

    避免存在araA激活物的方法是通过干扰表达信号的调节作用，该表达信号调节araA基因自身的表达。

    以上所描述的原则可等同地用于pepC和／或pepE基因。

    按照本发明，优选的真菌属于选自下组的属，该组包括曲霉属(Aspergillus)、木霉属(Trichoderma)、腐质霉属(Humicola)、假丝酵母属(Candida)、顶孢霉属(Acremonium)、镰刀菌属(Fusarium)以及青霉属(Penicillium)。

    在这些属中，选自下组的种是优选的，该组包括米曲霉(A．oryzae)、黑曲霉(A．niger)、泡盛曲霉(A．awamori)、A．phoenicis、日本曲霉(A．japonicus)、臭曲霉(A．foetidus)、构巢曲霉(A．nidulans)、T．reesei、T．harzianum、H．insolens、H．lanuginosa、禾谷镰孢(F．graminearum)、腐皮镰孢(F．solani)、产黄青霉(P．chrysogenum)等。

    如上所述，本发明也包括产生本发明的第一方面的真菌的方法，其中所说的灭活已由缺失araA、pepC和／或pepE基因获得，该方法包括

    i)克隆兴趣真菌的areA、pepC和／或pepE基因，

    ii)产生各包含areA基因、pepC基因和／或pepE基因中之一的DNA构建体，其中一个内部部分已被取代、缺失，或者额外的DNA已被插入，

    iii)用所说的构建体转化所说的真菌，和

    iv)分离areA-、pepC-和／或pepE-的转化体。

    因为人们相信，PepC蛋白酶的成熟是由PepE蛋白酶控制的，所以本发明也包括产生本发明的真菌的方法，其中所说的灭活已由缺失araA和／或pepE基因获得，该方法包括

    i)克隆兴趣真菌的areA和pepE基因，

    ii)产生各包含areA基因和pepE基因中之一的DNA构建体，其中一个内部部分已被取代、缺失，或者额外的DNA已被插入，

    iii)用所说的构建体转化所说的真菌，和

    iv)分离areA-和pepE-的转化体。

    本发明也包括产生真菌的方法，其中所说的灭活已利用反义技术获得，该方法包括

    i)构建表达质粒，各个这样的质粒导致一种RNA分子的合成，所说的RNA分子互补于从areA基因、pepC基因和／或pepE基因转录的mRNA，

    ii)用所说的表达质粒和适当的标记转化所说的宿主真菌，该表达质粒和标记两者在不同的质粒上或者在相同的质粒上，

    iii)用所说的标记选择转化体，和

    iv)筛选所选择的转化体，以获得显示AreA、PepC和／或PepE产物的合成降低的菌株。

    本发明的另一方面包括用于以上提到的方法中的DNA构建体。

    就前述方法而言，所说的DNA构建体可以包含araA、pepC和／或pepE基因，其中一个内部部分已被取代、缺失，或者额外的DNA已被插入。

    这些DNA构建体的至少一个也可以进一步包含编码兴趣蛋白质产物的DNA序列，例如以下提到的那些。

    就后面的反义方法而言，所说的DNA构建体可以包含连接到功能性启动子上的araA、pepC和／或pepE基因的反向DNA序列，从而使其mRNA至少部分互补于从araA、pepC和／或pepE基因产生的mRNA。

    本发明的另一方面涉及一种产生所需基因产物(优选地是分泌产物)的方法，该方法通过在适当的条件下在合适的生长培养基中培养按照本发明的真菌，并回收和纯化所需的基因产物。

    在基因产物由异源基因表达的情况下，编码所需基因产物的DNA序列可以是用于产生所说的真菌的DNA构建体的一部分。

    然而，通常进行本发明真菌的单独的转化，以便制备能够产生所需产物的真菌。

    用于转化真菌的方法是本领域已知的，参见例如EP 0 184 438A2(Gist-Brocades N．V．)和EP专利公开号0 98 993(Novo Nordisk A／S)。

    对于本来的产物，这当然是不必要的，但是，为了增加产生量，提供掺入到宿主中的编码兴趣蛋白质的基因的多拷贝可能是有利的。

    所需基因产物一般是肽或蛋白质，优选地是酶。

    优选的酶选自包括蛋白酶(如胰蛋白酶和凝乳酶)、脂肪酶、角质酶、纤维素酶、木聚糖酶、漆酶、果胶酶等的组。

    另一种类型的所需基因产物一般是有治疗活性的肽或蛋白质。

    在有治疗活性的肽或蛋白质中，优选的蛋白质选自包括胰岛素，生长激素、胰高血糖素、促生长素抑制素、干扰素、PDGF、因子VII、因子VIII、尿激酶、t-PA、CSF、乳铁蛋白、TPO等。

    本发明的另一方面涉及编码米曲霉pepC基因(SEQ ID No．1)、米曲霉pepE基因(SEQ ID No．3)或其功能性等位基因的DNA序列。本发明也包括对应的PepC和PepE蛋白酶和它们的产生方法(优选重组方法)。

    在这一方面，本发明涉及用于产生米曲霉PepC蛋白酶或PepE蛋白酶的方法，该方法包括用包含编码兴趣蛋白酶的DNA序列的DNA构建体转化合适的宿主，选择能够产生所说的蛋白酶的转化体，在适当的生长培养基中培养转化体，并且从培养物中回收PepC或PepE蛋白酶。

    用于这样一种方法的宿主是按照本发明的上述方面的宿主。

    在产生PepC或PepE蛋白酶的方法的某些实施方案中，所说的宿主是米曲霉。在这种情况下，更为理想的是DNA构建体(包含编码蛋白酶的DNA序列)提供已经存在于宿主中的基因的额外的拷贝。

    DNA构建体(包含编码蛋白酶的DNA序列)通常也包含调节元件，以便在宿主中适当地表达和加工蛋白酶。

    在以下给出的实施例中进一步详细地解释本发明。然而，这些实施例不以任何方式限制由所附权利要求限定的本发明的范围。实施例

    材料和方法

    菌株

    米曲霉，IFO 4177：可从大阪发酵研究所(17-25 Juso Hammachi 2-Chome Yodogawa-Ku，大阪，日本)获得。

    ToC913：这一菌株的构建在实施例中描述。

    基因

    araA：这一基因编码一种控制氮分解代谢的调节蛋白质。

    pepC：这一基因编码枯草菌素型丝氨酸蛋白酶。

    pepE：这一基因编码天冬氨酸蛋白酶。

    pyrG：这一基因编码乳清酸核苷-S′-磷酸脱羧酶，一种在尿苷的生物合成中所涉及的酶。

    bar：这一基因最初从吸水链霉菌中分离得到，其编码膦丝菌素乙酰转移酶。该酶修饰膦丝菌素(=glufosinate)，从而灭活这一化合物(该化合物对细菌、真菌和植物是毒性的)。

    质粒

    pUC118：Viera和Mesing，酶学方法杂志，1987 153 3-11。

    pSO2：这一质粒的构建在实施例中描述。

    pJers4：pSO2在pUC118中的2．0kb亚克隆。pjers4含有功能性米曲霉pyrG基因。

    pSO5：在实施例中描述从pSO2构建这一质粒。

    pToC56：这一质粒的构建在EP出版物0 98 993中描述。

    pToC68：这一质粒的构建在WO 91／17243中描述。

    pToC90：p3 SR2的亚克隆，携带作为2．7 kb Xba I片段的构巢曲霉amdS基因[Corrick等，基因1987 53 63-71]，其在pUC19载体[Yannisch-Perron等，基因1985 33 103-119]上，是按照WO 91／17243中描述的方法制备的。

    pToC266：这一质粒的构建在实施例中描述。

    pToC299：这一质粒的构建在实施例中描述。

    pToC338：这一质粒的构建在实施例中描述。

    pMT1606：在实施例中描述从pBP1T(B．Straubinger等，真菌遗传学新闻39(1992)：82-83)和p775(EP专利公开号0 98 993)构建这一质粒。

    p775：这一质粒的构建在EP专利公开号0 98 993中描述。

    p777：这一质粒的构建在EP专利公开号0 98 993中描述。

    pHW470：这一质粒的构建在实施例中描述。实施例1克隆和缺失米曲霉pepE基因

    通过与黑曲霉基因的交叉杂交克隆米曲霉pepE基因。从PCR反应以700 bp PCR片段获得部分黑曲霉基因，所说的PCR反应使用黑曲霉染色体DNA和pepE特异性引物，该引物是按照由G．Jarai等，基因145(1994)171-178发表的pepE序列制造的。通过DNA测序，显示所说的片段含有pepE序列。在严格条件下其杂交到米曲霉染色体DNA上，Southern分析显示，米曲霉含有单一的类pepE基因。

    用基因置换法和两步基因置换法(G．May，在“丝状真菌的应用分子遗传学”(1992) pp．1-25．编者J．R．Kinghorn和G．Turner；BlackieAcademic and Professional)两种方法缺失pepE基因。当米曲霉pyrG基因用作标记时，该米曲霉菌株是pyrG-菌株(由缺失pyrG基因制备的)。克隆米曲霉pepE基因

    基本上按照“SuperCosl 粘粒载体试剂盒”的供给者(Stratagene)的说明构建米曲霉粘粒文库。

    由标准的方法(Christensen，T．等，生物技术6(1988)1419-1422)从原生质体制备米曲霉IFO 4177基因组DNA。在分离原生质体后，将它们在Labofuge T(Heto)中以2500 rpm离心5分钟进行离心沉淀。如Supercos1粘粒载体试剂盒手册中所述，将沉淀悬浮在10mM NaCl，20mM Tris-HCl(pH8．0)，1mM EDTA，100μg／ml蛋白酶K，0．5％SDS中，DNA制备的其它过程按照试剂盒的说明进行。采用Biorad的CHEF-凝胶装置经电泳分析基因组DNA的大小。在200伏特下用10-50秒脉冲进行1％琼脂糖凝胶电泳20小时。凝胶经溴化乙锭染色并摄影。DNA大小是50-＞100kb。将DNA用Sau3A部分限制性消化。当用以上相同类型的CHEF-凝胶分析测定时，限制性消化的DNA的大小是20-50kb。按照所说的手册制备CsCl梯度分离的SuperCosl载体。同样地按照所描述的方法进行连接和包装。在滴度文库后，将来源于一次连接和包装的所有的包装混合物转染进宿主细胞XL1-Blue MR中，并平板接种到50μg／ml氨苄青霉素LB平板上。获得大约3800个菌落。10个菌落的粘粒制品显示出它们都具有预期大小的插入片段。单个挑取菌落，接种到具有100μL LB(100μg／ml氨苄青霉素)的微量滴定板孔中，并在37℃下培养一夜。将100μl 50％的甘油添加至每一孔中，在-80℃下冻结整个文库。贮存总共3822个菌落。它代表约4．4倍米曲霉基因组。

    通过利用适配于微量滴定板一半的具有6乘8针的多针装置，将单个冻结的文库菌落接种到LB-平板(100μg／ml氨苄青霉素)上。制备包含文库中所有克隆的菌落的平板。将平板在37℃培养过夜。将剪切至培养皿大小的灭菌的Whatman 540滤膜置于菌落上，菌落在37℃下再培养2个小时。将滤膜转移到含有200μg／ml氯霉素的LB平板上，平板在37℃下培养一夜。第二天，用0．5M NaOH洗涤滤膜两次(5分钟)，然后用2×SCC洗涤两次(5分钟)。将滤膜用乙醇润湿并通风干燥。

    使滤膜与0．7kb32P标记的PCR片段杂交，所述片段含有黑曲霉pepE基因的一部分。通过用两种引物(在DNA序列中相隔700bp)在黑曲霉染色体DNA上进行PCR获得PCR片段。在10×Denhart，5×SSC，0．02MEDTA，1％SDS，0．15 mg／ml polyA以及0．05mg／ml酵母tRNA中于65℃下进行杂交16小时。杂交后，在45℃下用2×SSC，0．1％SDS洗涤滤膜两次，并放置在X-光胶片上。5个菌落与探针杂交，它们中的4个随后经分离的粘粒DNA的Southern分析(利用相同的探针)显示含有米曲霉pepE基因。三种粘粒是相同的，由此分离到两种含有pepE的不同的粘粒克隆，将它们称为7C7和33 C1，以它们在贮存文库中的位置命名。将两个重叠片段，4．3 kb EcoRI片段(pToC299)和2．4 kbHindIII(pToC301)片段亚克隆并部分测序。SEQ ID No．1显示了DNA序列和推定的蛋白酶的氨基酸序列，该基因显示出与黑曲霉基因的强同源性。克隆米曲霉pyrG基因

    通过与黑曲霉pyrG基因(W．van Hartingsveldt等，Mol．Gen．Genet206：71-75(1987))交叉杂交克隆米曲霉pyrG基因。在低严格性条件下用1kb黑曲霉pyrG基因的DNA片段探查SauIIIA部分消化的米曲霉IFO4177 DNAλ文库。将阳性克隆的3．8kb HindIII片段亚克隆进pUC118载体。所形成的质粒pSO2显示含有pyrG基因(经黑曲霉pyrG-突变体的互补作用)。构建米曲霉pyrG阴性菌株

    从质粒pSO2构建pyrG缺失质粒pSO5，该质粒在各末端含有约1kb的pyrG侧翼序列。用这一构建体转化米曲霉IFO4177，由对5-氟-乳清酸(FOA)的抗性(pyrG突变体的表型特征)选择转化体。经Southern分析，一种转化体(HowB101)显示出在pyrG基因座上具有预期的缺失。由于是pyrG突变体，HowB101的生长需要尿苷。通过就无尿苷下的生长能力进行筛选，可以用wtpyrG基因转化HowB101。

    在HowB101的构建中所涉及的步骤在图1中说明。经基因置换法在米曲霉中缺失pepE基因

    构建质粒pToC345，其被设计来用pyrG基因替代pepE基因。

    以pToC299为模板进行两个PCR反应；第一套引物是：19819 GAAGATCTGCGCGGATGTACATTGTAG19821 TTAGTCAGAAATTCGTCCCG第二套引物是：19820 CCCAAGCTTCATGCTCGACCAGGGCCTCCT19818 GGTCTGTGTTAACCAAAGAAC

    用Bgl II／HindIII切割约800 bp的片段(其是用19819／19821获得的)，并与用19820／19818获得的1．1kb片段一起克隆，用HindIII／PstI切割并连入BglII／PstI切割的pIC19R中(J．L．Marsh等，基因32(1984)481-484)。在唯一的HindIII位点切割所形成的质粒，脱磷酸化插入来源于pJaL335的3．5 kb含pyrG的片段(在实施例2中描述)。pToC345的构建在图2中说明。

    利用标准方法以EcoRI切割的pToC345转化HowB101，通过在不添加尿苷的条件下它们的生长能力选择转化体。通过分生孢子再分离一次100个转化体。从再分离平板上的单一菌落收集孢子，重悬于含0．01％曲通X-100的100ml水中。将各转化体和IFO 4177(包括其作为对照)的1ml孢子悬浮液涂布到Whatmann 540滤膜上，该滤膜位于它们各自的YPD平板的顶端。将平板在30℃下温育18小时。从平板上移走滤膜，并且在室温下放置在20％SDS中两小时。然后将它们在600瓦微波炉中烘烤3分钟。接着在10％SDS中洗涤滤膜5分钟，在0．5M NaOH，1．5M NaCl中洗涤两次(每次5分钟)，用0．5M Tris-HCl(pH=7．5)，1．5M NaCl洗涤一次(5分钟)，用20xSSC洗涤一次(5分钟)，并通风干燥。通过标准方法将两套滤膜用他们的32P-标记的探针杂交，将一套与600bp BbuI／HindIII片段杂交，该片段来源于pToC299，含有欲被缺失的pepE基因的一部分。将其它的滤膜与米曲霉tpi基因的DNA片段杂交。可以使用以一个拷贝存在的任何基因(但不是pepE)，因为这是结合到滤膜上的DNA量的对照。

    在杂交之后，在65℃用0．1xSS，0．1％SDS洗涤滤膜，经PhospoImager显现结合到滤膜上的放射活性。收集13个转化体用于进一步的分析，因为与对照探针的杂交相比，它们显示很少与pepE探针杂交。由标准方法制备染色体DNA，将EcoRI限制消化的DNA的Southern印迹与32P-标记的1．1 kb BbuI片段杂交，所说片段来源于pToC299，含有没有被缺失的pepE基因的3’部分。在wt菌株中，4．3kb片段应该与探针杂交，在正确置换的菌株展中，4．3kb片段应该由7．2kb片段所置换。在两个看上去正确的转化体，一个根本没有杂交带，另一个具有wt带以及可能的一个其它带，说明转化的DNA整合在非同源基因座上。

    为了分离pepE缺失菌株的pyrG-衍生物，把107个分生孢子涂布在包含FOA在平板上，选择抗性菌落。再分离FOA抗性菌落，制备DNA，并进行Sonthern分析，以鉴别其中pyrG基因丧失(经侧翼于pToC345中的基因的重复序列之间的重组)的菌株。通过两步基因置换法缺失米曲霉中的pepE基因

    构建质粒pToC315，其设计来用于pepE基因的两步基因缺失。将含有pepE基因上游序列的pToC299的1．6kb EcoRI／HindIII(通过用DNA聚合酶的克列诺片段处理使HindIII位点成为平端)与含有pepE基因3’末端的1．4 kb SalI／BbuI(BbuI片段是平端化的)一起克隆进EcoRI／SalI切割的载体pUC19中。在pUC19接头中的唯一的HindIII位点切割所形成的质粒，脱磷酸化，插入来源于pJers4的含1．8kb pyrG的片段。pToC315的构建在图3中说明。

    利用标准方法以pToC315转化HowB101，通过在不添加尿苷的条件下它们的生长能力选择转化体。在再分离后，从12个转化体制备染色体DNA，用Asp718切割DNA，并以含有部分pepE基因的pToC3的BbuI片段作为放射性标记探针，用Southern分析进行分析。一个转化体具有整合到内源性pepE基因中质粒，如由pepE特异性Asp 718片段消失(其已经被两个新的带所替代，如所预料的，在pToC315已由同源重组在pepE基因座上以单一拷贝整合时)揭示的。该转化体被命名为ToC1089。将ToC1089的5×107个分生孢子涂布在选择pyrG基因丧失的包含5-氟-乳清酸的平板上。这是两步基因缺失中的第二个步骤，pyrG基因可以通过与两对相同序列(其中之一也导致pepE基因的缺失)之一的重组丧失掉。图4中描述这一方法。5-氟-乳清酸的抗性的频率是大约10-5。再分离5-氟-乳清酸抗性菌落，经Southern分析鉴别缺失pepE基因的菌株。实施例2克隆和断裂米曲霉丝氨酸蛋白酶pepC

    通过与黑曲霉基因的交叉杂交克隆米曲霉pepC基因。从PCR反应以1．1kb PCR片段获得黑曲霉基因，所说的PCR反应使用黑曲霉染色体DNA和pepC特异性引物，该引物是按照由Frederick G．D等，基因125(1993)57-64发表的pepC序列制备的。通过DNA测序，所说的片段显示含有pepC序列。在严格条件下其杂交到米曲霉染色体DNA上，Southern分析显示，米曲霉含有单一的类pepC基因。

    用两步基因置换法(G．May，在“丝状真菌的应用分子遗传学”(1992)pp．1-25．编者J．R．Kinghorn和G．Turner；Blackie Academic andProfessional)缺失pepC基因。在米曲霉pyrG基因用作标记时，该米曲霉菌株是pyrG-菌株(通过缺失pyrG基因制备)。克隆黑曲霉丝氨酸蛋白酶pepC

    从已出版的编码黑曲霉pepC的cDNA核苷酸序列(Frederick G．D等，基因125(1993)57-64)设计两种寡核苷酸，以便在PCR反应中扩增pepC基因的编码部分。这里制备引物#5258(5’-CTAGGATCCAAGGCATTTATGAAGGGCATCCTCGGCCTTTCC)，核苷酸序列的3’末端相应于pepC基因的N-端部分(下划线)，5’末端是为了易于克隆(含有BamHI限制性内切核酸酶位点)。这里制备引物#5259(5’-CTACTCGAGTCAAAAAAAAACCAAGTCTTCCGATCTACG)，核苷酸序列的3’末端相应于pepC基因的C-端部分(下划线)和5’末端是为了易于克隆(含有XhoI限制性内切核酸酶位点)。

    在PCR反应中将黑曲霉基因组DNA用作模板。扩增反应在包含2．5单位Taq-聚合酶，100ng黑曲霉基因组DNA，50mM KCl，10mMTris-HCl(pH 8．0)，1．5mM MgCl2，250nM各种dNTP以及以上描述的两种引物各100pM的100微升总体积中进行。

    扩增反应在Perkin-Elmer Cetus DNA Termal 480中进行，并且由在94℃下3分钟的1个循环，接着在94℃下1分钟，55℃下30秒钟和72℃下1分钟的25个循环组成。PCR反应产生一个长度约1．1 kb的DNA片段。采用分子生物学领域已知的标准方法经凝胶电泳分离这一片段，纯化，克隆进载体pCR°II(Invitrogen公司)并测序。所形成的质粒称为pJaL197。克隆米曲霉丝氨酸蛋白酶pepC

    将米曲霉IFO 4177基因组DNA的Southern印迹与pJaL197克隆的32P标记的EcoRI DNA片段(含有黑曲霉pepC基因)杂交。用下列限制酶切割基因组DNA：EcoRI，BamHI，XhoI以及HindIII。杂交在65℃下在包含下列物质的溶液中进行16小时：10xDenhart，5xSSC，0．02MEDTA，1％SDS，0．15mg／ml polyA以及0．05mg／ml酵母tRNA。在杂交之后，在65℃下用2xSSC，0．1％SDS洗涤滤膜两次，并置于X-光胶片上。在4个消化物的每一个中，该探针杂交到单一大小的片段上，表明pepC基因以单拷贝存在于米曲霉IFO 4177中。

    构建米曲霉基因组DNA的部分文库(包含具有4．5-5．5kb大小的BamHI片段)，并连接到载体pIC19H上。放射性标记上述黑曲霉pepC基因克隆，并用于探查部分米曲霉BamHI基因组文库。如上所述进行杂交。筛选约4000个大肠杆菌菌落，获得4个阳性克隆。经限制酶消化分析，显示这4个克隆是相同的。这些克隆中的一个被成为pJaL235(图5)，具有4．6kb插入片段，用限制性作图和Southern印迹进一步分析该克隆。该克隆显示pepC基因位于2．9kb BamHI／SalI片段中。这一2．9kbBamHI／SalI片段的测序揭示存在一个495个氨基酸长的开放读框，其由具有指示内含子剪接的共有序列的2个内含子所间断。米曲霉pepC基因的序列在SEQ ID No．3中显示。构建侧翼有重复序列的米曲霉基因

    采用以下两种引物经PCR在质粒pSO2上扩增一个432bp的片段，所说的引物是引物#7659(5’-GGAGGAAGATCTCTCTGGTACTCTTCGATCTC)和引物#7656(5’-GGAGGAGAATTCAAGCTTCTTCTACATCACAGTTTGAAAGC)，在前者中，核苷酸序列的3’末端相应于pSO2中的7-26位(下划线)，5’末端用来帮助克隆(含有BglII限制性内切核酸酶位点)，在后者中，核苷酸序列的3’末端相应于pSO2中的385-407位(下划线)，5’末端用来帮助克隆(含有EcoRI和HindIII限制性内切核酸酶位点)。以BglII和EcoRI消化该片段，经凝胶电泳分离，纯化并克隆到pSO2中的相应位点，形成质粒pJaL335(其构建在图6中概述)。构建米曲霉pepC断裂质粒

    以PvuI消化质粒pJaL235，并且用Klenow聚合酶处理，以制造平端，然后以HindIII消化。经凝胶电泳分离2．6kb片段，并纯化。将2．6kb片段克隆进以SmaI和HindIII消化的pUC12中，产生质粒pJaL308。

    以SmaI消化质粒pJaL308，并且按照制造商的说明用细菌碱性磷酸酶处理(以除去5’磷酸基)，用苯酚提取并沉淀。

    以HindIII消化质粒pSO2，并且用Klenow聚合酶处理，以制造平端。经凝胶电泳分离编码米曲霉pyrG基因的3．8kb片段，并纯化。

    将两种片段混合在一起并连接。在转化大肠杆菌后，经小质粒制品的限制性酶切分析鉴别携带有正确质粒的菌落。pJaL363的构建在图7中说明。

    质粒pJaL3包含pUC12载体，该载体含有携带侧翼有EcoRI位点和HindIII的pepC基因的片段，其中的pepC由编码米曲霉pyrG基因的3．8kbDNA间断。

    以HindIII消化质粒pJaL335，并且用Klenow聚合酶处理，以制造平端。经凝胶电泳分离编码米曲霉pyrG基因的3．5kb片段，并纯化。将该片段克隆进pJaL308的SmaI限制酶切位点。pJaLz的构建在图8中概述。该质粒包含pUC12载体，该载体含有携带侧翼有EcoRI位点和HindIII的pepC基因的片段，其中的pepC由编码米曲霉pyrG基因的3．8kb DNA间断。转化米曲霉菌株HowB101

    用HindIII和EcoRI将15μg断裂质粒之一完全消化，通过在凝胶上展开小份试样检查消化的完全程度，剩下的DNA用苯酚提取，沉淀并重悬于10μl无菌水中。

    经原生质体方法(Christensen等，生物技术(1988)6：1419-1422)进行米曲霉HowB101宿主菌株的转化。典型地，将米曲霉菌丝体在富含营养物的培养液中生长。通过过滤从培养液分离菌丝体。将酶制剂Novozyme(Novo Nordisk)添加到菌丝体中，所说的菌丝体在渗透稳定缓冲液中，例如用磷酸钠缓冲至pH5．0的1．2M MgSO4中。在搅拌下于37℃温育悬液60分钟。经mira布过滤原生质体，以除去菌丝体碎片。收获原生质体，并用STC(1．2M山梨醇，10mM CaCl2，10mM Tris-HClpH7．5)洗涤两次。最终将原生质体重悬于200-1000μl STC中。

    为了转化，将5μgDNA加至100μl原生质体悬液中，然后加入200μlPEG溶液(60％PEG 4000，10mM CaCl2，10mM Tris-HCl pH7．5)，在室温下温育混合物20分钟。收获原生质体，以1．2M山梨醇洗涤两次。最后将原生质体重悬于200ml 1．2M山梨醇中，平板接种到选择性平板(基本培养基+10g／l Bacto-琼脂(Difco))，并于37℃培养。在37℃培养3-4天后，稳定的转化体显示出旺盛的生长和孢子形成性菌落。鉴别pepC缺失菌株

    将稳定的菌落个体孢子划线培养在新鲜的基本平板上。选择单一菌落，并再划线培养，产生纯的培养物。将其用于接种10ml液体YPM培养基(1％酵母提取物，1％蛋白胨，2％麦芽糖)。于30℃下在180rpm下振荡18小时之后，将菌丝体收集到滤纸上。然后将菌丝体转移到2ml微量管中，并且冻结干燥。在冷冻干燥之后，从单个菌丝体制备DNA。在试管中用研杵将菌丝体研磨成细小粉末。经涡旋将这种粉末重悬于0．5ml50mM EDTA(pH8．0)，0．2％SDS，1μl DEP中。将其在65℃温育20分钟。然后加入0．1ml5M KAc pH6．5，混合并在冰上温育5分钟。通过在20，000rpm下离心5分钟从DNA溶液分离出细胞碎片。用0．3ml异丙醇沉淀0．4ml上清液，并在20，000rpm下离心10分钟。将DNA沉淀再溶解于100μl包含0．1mg／ml RNA酶A的无菌TE缓冲液中。

    以EcoRI消化每一种DNA3μg，经琼脂糖凝胶电泳分级分离，将其转移到Immobilan-N滤膜上，用包含部分pepC蛋白酶基因的pJaL335的1．5kb32P标记的NcoIDNA片段探查。携带有断裂pepC的菌株易于识别，因为3．6kb上的野生型带在转化体中变换成7．4kb带。

    将断裂的米曲霉pepC菌株制成pyrG-菌株，通过选择5-氟-乳清酸抗性(pyrG突变体的表型特征)自发突变体进行选择。由于是PyrG突变体，菌株的生长需要尿苷。用wt pyrG基因转化该菌株，通过选择在没有尿苷下的生长能力进行选择。实施例3构建米曲霉areAΔ菌株

    areAΔ菌株的构建如下：克隆米曲霉araA基因。用携带pyrG基因(在araA基因上游和下游的DNA片段之间插入)的质粒转化也缺损pepC或pepE或pepC加pepE的pyrG菌株。araA的编码区不存在于质粒上。就它们在缺少尿苷和存在氯酸盐的情况下的生长能力选择转化体。这一双选择法选择功能性pyrG基因和araA-两者。最终经Southern分析筛选由这种选择方法获得的菌株，以鉴别其中染色体araA基因由pyrG基因取代的那些。克隆araA基因

    通过与构巢曲霉araA基因(B．Kudla等，EMBO J．9：1355-1364(1990))交叉杂交克隆米曲霉araA基因。通过用SauIIIA部分消化染色体DNA制备米曲霉IFO 4177基因组文库，并将所获得的DNA片段克隆进载体1GEM-II(从Promega获得)。于37℃在40％甲酰胺中完成文库与构巢曲霉araA基因的交叉杂交。分离杂交1的克隆，并从中将片段亚克隆进载体pBluescript SK+(从Stratagene获得)，给出图9中所示的质粒pSK5与pSK9。克隆的基因能够补充构巢曲霉araA突变体，证明它确实是米曲霉araA的同系物。对此克隆的5643 bp测序，米曲霉与构巢曲霉araA基因序列的比较显示它们是高度同源的。米曲霉araA基因序列在SEQID No．5中显示。构建araA缺失质粒

    为了从米曲霉染色体缺失araA基因，构建了质粒pToC266。pToC266含有源于araA基因上游的2．1kb DNA片段(从pSK5分离)和源于araA基因下游的1．4kb DNA片段(从pSK9分离)。在基因组中这两个片段被约3．2kb分离，编码区位于基因的这一部分中。将pJers4的米曲霉PyrG基因插入araA上游和下游DNA片段之间。pToC266的构建在图10a和10b中说明。pToC266有一个唯一的EcoRI位点，在用于转化之前，经采用这一限制酶切割线性化。选择米曲霉araA菌株

    用线性化的pToC266转化也缺损pepC或pepE或pepC加pepE的pyrG-菌株。在基本平板(Cove，生物化学生物物理学报(1966)113：51-56)上选择转化体，该平板上含有作为氮源的谷氨酰胺，作为碳源的葡萄糖。在相同类型的平板上再分离转化体两次，然后在不同的氮源上进行生长试验。在谷氨酰胺上生长良好(但在硝酸盐，铵或尿素上则不然)的转化体预期是缺失araA的。这一缺失由Southern分析确认。实施例4构建pMT1606

    构建了一种质粒，该质粒包含在米曲霉TAKA-淀粉酶启动子之后插入的Streptomyces hygroscopius的bar基因(C．J．Thompson等，EMBO J．6：2519-2523(1987))和其后的包含黑曲霉gla基因的转录终止子和聚腺苷酸化信号的片段。

    质粒pMT1606可以用于选择米曲霉的glufosinate抗性转化体。通过从质粒pBP1T(B．Straubinger等，真菌遗传学新闻(1992) 39：82-83)分离bar基因，并将它克隆进真菌表达质粒p775(在EP公开号0 098 993 A1中描述)构建pMT1606。图11说明了pMT1606的构建。实施例5在米曲霉(areAΔ，pepEΔ，pepC-)中产生凝乳酶

    通过与pMT1606的共转化，用质粒pToC56(图12)转化米曲霉areAΔ，pepEΔ，pepC-菌株，所述质粒是哺乳动物凝乳酶的真菌表达质粒。质粒pToC56的构建在EP公开号0 98 993中描述。

    在包含10mM铵和1mg／ml glufosinate的基本培养基上选择转化体，并且通过产生凝乳酶的能力筛选pToC56的存在。在摇瓶中于30℃下培养转化体4天，摇瓶中具有含麦芽糖糊精和谷氨酰胺的基本培养基。经SDS-Page和Western印迹分析上清液中的凝乳酶含量。实施例6在米曲霉中产生PepC

    构建pepC表达质粒。用AatII和NsiI消化质粒pJaL235，并且用Klenow聚合酶处理以制造平端。经凝胶电泳分离1．7kb片段，并纯化。将1．7kb片段克隆进用SmaI消化的pIC19H，给出pJaL365。

    用BamHI和XhoI消化质粒pJaL365，经凝胶电泳分离1．7kb片段，并纯化。将1．7kb片段克隆进用BamHI和XhoI消化的pToC68，给出pJaL368(图13a和13b)。

    通过与pToC90的共转化，用质粒pJaL368转化米曲霉菌株，该质粒是蛋白酶PepC的真菌表达质粒。

    在包含10mM乙酰胺的基本培养基上选择转化体，并且通过产生蛋白酶PepC的能力筛选pJaL368的存在。实施例7超量表达pepE

    构建了称为pToC338的质粒，其携带有融合进米曲霉TAKA-淀粉酶启动子的pepE基因。图14a和14b描述这一构建过程。

    将pToC299的EcoRI／SalI片段(含有pepE的大多数的编码区和约430bp的3’非翻译区)与具有下列序列的合成DNA片段一起克隆进EcoRI／BamHI切割的pUC19中：8681 GATCCACCATGAAG8747 GTGGTACTTCAGCT

    用BamHI／EcoRI切割所形成的称为pToC334的质粒，分离含有pepE的整个结构基因的片段，其具有融合在紧靠起始密码子的上游的BamHI位点。约430 bp非翻译3’序列也存在于该片段中。将该片段与质粒p775的大约1．1kb SalI／BamHI片段(含有米曲霉TAKA-淀粉酶启动子)一道克隆进EcoRI／SalI切割的pUC19中。所形成的质粒命名为pToC338。

    利用标准方法(例如在EP 0 098 993 A1中描述的)，将pToC338与pToC90(含有构巢曲霉乙酰胺酶(amdS)基因)共转化进米曲霉JaL125(米曲霉alp阴性菌株，在丹麦专利申请0354／96中描述)中。通过它们利用作为唯一氮源的乙酰胺的能力选择转化体。通过分生孢子再分离11个转化体。在10ml YPM(具有2％麦芽糖的YP)中于30℃下发酵培养转化体3天，通过SDS-page分离发酵液。一种转化体产生与由pepE基因编码的蛋白质大小相同的蛋白质，蛋白酶活性测量证实来源于这一转化体的培养液与宿主菌株JaL125相比，在pH5．5下具有对酪蛋白的较高活性。纯化所说的蛋白质，N端测序显示它确实是pepE基因编码的蛋白质。该分泌蛋白质的N端是：gly*-arg-his-asp-val-leu-val-asp-asn-phe-leu-asn-ala-gln-tyr-phe-ser-glu-ile-glu-ile-gly-thr-pro-pro-gln-lys-phe-lys*这一残基也可以是赖氨酸。这证实了PepE蛋白酶的表达。

                  序列表(1)一般信息：  (i)申请人：

    (A)名称：Novo NordiskA／S

    (B)街道：Novo Aile

    (C)城市：Bagsvaerd

    (E)国家：丹麦

    (F)邮区代码(ZIP)：DK-2880

    (G)电话：+45 4444 8888

    (H)传真：+45 4449 3256  (ii)发明名称：新的微生物  (iii)序列数：12  (iv)计算机可读形式：

    (A)介质类型：软盘

    (B)计算机：IBM PC兼容机

    (C)操作系统：PC-DOS／MS-DOS

    (D)软件：PatentIn Release#1．0，版本#1．30(EPO)(2)SEQ ID NO：1的信息：  (i)序列特征：

    (A)长度：2454个碱基对

    (B)类型：核酸

    (C)链型：单链

    (D)拓扑结构：线性  (ii)分子类型：DNA(基因组)  (iii)假设：否  (iv)反义：否  (vi)原始来源：

    (A)生物体：米曲霉(ix)特征：

    (A)名称／关键词：外显子

    (B)位置：603．．701(ix)特征：

    (A)名称／关键词：内含子

    (B)位置：702．．791(ix)特征：

    (A)名称／关键词：外显子

    (B)位置：792．．942(ix)特征：

    (A)名称／关键词：内含子

    (B)位置：943．．1001(ix)特征：

    (A)名称／关键词：外显子

    (B)位置：1002．．1656(ix)特征：

    (A)名称／关键词：内含子

    (B)位置：1657．．1713(ix)特征：

    (A)名称／关键词：外显子

    (B)位置：1714．．2001(ix)特征：

    (A)名称／关键词：CDS

    (B)位置：连接处(603-701，792-942，1002-1656，1714-2001)(ix)特征：

    (A)名称／关键词：mat_肽

    (B)位置：603．．2001(xi)序列描述：SEQ ID NO：1：GCGCGGATGT ACATTGTAGG TACATGGATA GTATGTACTG TATATACCGT CATTTAGTAA        60GGCAACTAAC TAACTTATCA GCCTAGCTCC CGAGACGGCC TTACATCATC CGCAGCGGCA       120ATCAGCTCCA CACCCTTGGA TAGTGATAAG AGACACAAGG AGTTCTGAGT ATGGTATTAT       180AAGTGCAGTG AGTTGGGATG AAACAGAGAG ATAGAGGGAA TACTCCTATT TATCAATGAA       240CGTATACAGA CATACCCCAG CAGCGTTCCT GGCGGTATTG TAAAAGGGCC GTACCTTGGA       300GATCAAGTGA TGAGACACCC GTGATGCAGG AACTCCACTT CAATCCAATG ACGCATCGAG       360TTGCTCCCTG ATTGGTTGAT ACGCAGGTCG CTCCGCAACC GGTCCGCATC ACCTCACTTC       420CCTCCCCCAG ACCTGGAGGT ACCTCTCCCG TCCTTCTCTC CCTCTCCATC CCATCATCTA       480TCCCTCTCCA GACCCTGATT GTATTTCATC ATTCCTATCG TCCCATATTA ATAGAGTATT       540GCTAGTTTTC TTTTGATTTC GTCTGTTGAG GTGCTGCTTT TTTGTCGCCG TTGTCGCCCA       600CC ATG AAG TCG ACC TTG GTT ACG GCC TCT GTG CTG TTG GGC TGT GCT          647   Met Lys Ser Thr Leu Val Thr Ala Ser Val Leu Leu Gly Cys Ala

    1               5                  10                  15TCC GCC GAG GTT CAC AAG CTG AAG CTC AAC AAG GTG CCC GTG TCC GAG         695Ser Ala Glu Val His Lys Leu Lys Leu Asn Lys Val Pro Val Ser Glu                20                  25                  30CAA TTT GTGAGTAGAC CTTACTATTC CGGCCATGAA AATATTCATC TACCCATCTG          751Gln PheAAAGCTTGTC GGGACGAATT TCTGACTAAA TCGTATCCAG AAC TTG CAC AAC ATC         806                                            Asn Leu His Asn IleGAC ACC CAT GTG CAG GCT CTC GGC CAG AAG TAC ATG GGA ATC CGT CCC         854Asp Thr His Val Gln Ala Leu Gly Gln Lys Tyr Met Gly Ile Arg Pro    40                  45                  50AAC ATC AAG CAA GAT CTT CTC AAT GAG AAC CCG ATT AAC GAT ATG GGA         902Asn Ile Lys Gln Asp Leu Leu Asn Glu Asn Pro Ile Asn Asp Met Gly55                  60                  65                  70CGT CAT GAT GTC CTT GTT GAC AAC TTC CTG AAT GCA CAA T                    942Arg His Asp Val Leu Val Asp Asn Phe Leu Asn Ala Gln                75                  80GTACGAAACC CTAGTAATAC TTGAAGGGGG GCTCCAACTT ACGCGTAGAT TCTCTAAAG   AC    1003                                                                  TyrTTC TCC GAA ATC GAG ATC GGT ACT CCT CCA CAG AAG TTC AAG GTG GTC          1051Phe Ser Glu Ile Glu Ile Gly Thr Pro Pro Gln Lys Phe Lys Val Val85                  90                  95                  100CTT GAC ACT GGC AGC TCA AAC CTA TGG GTG CCC TCT TCG GAG TGT GGT          1099Leu Asp Thr Gly Ser Ser Asn Leu Trp Val Pro Ser Ser Glu Cys Gly                105                 110                 115TCT ATC GCC TGC TAT TTG CAT AAC AAG TAC GAC TCA TCC TCG TCC TCC          1147Ser Ile Ala Cys Tyr Leu His Asn Lys Tyr Asp Ser Ser Ser Ser Ser            120                 125                 130ACG TAC CAG AAG AAT GGC AGC GAA TTT GCC ATC AAG TAC GGC TCT GGT          1195Thr Tyr Gln Lys Asn Gly Ser Glu Phe Ala Ile Lys Tyr Gly Ser Gly        135                 140                 145AGC CTG AGT GGT TTT GTT TCT CAG GAT ACT CTC AAG ATC GGT GAC CTG          1243Ser Leu Ser Gly Phe Val Ser Gln Asp Thr Leu Lys Ile GIy Asp Leu

        150                 155                 160AAG GTG AAG GAT CAG CTG TTC GCC GAG GCT ACT AGT GAG CCC GGC CTT        1291Lys Val Lys Asp Gln Leu Phe Ala Glu Ala Thr Ser Glu Pro Gly Leu165                 170                 175                 180GCT TTT GCC TTT GGC CGC TTT GAT GGT ATC CTT GGG TTG GGA TTT GAC        1339Ala Phe Ala Phe Gly Arg Phe Asp Gly Ile Leu Gly Leu Gly Phe Asp                185                 190                 195ACA ATT TCC GTC AAC AAG ATT CCT CCA CCC TTC TAT AGC ATG CTC GAC        1387Thr Ile Ser Val Asn Lys Ile Pro Pro Pro Phe Tyr Ser Met Leu Asp            200                 205                 210CAG GGC CTC CTC GAC GAG CCA GTC TTT GCT TTC TAC CTT GGA GAC ACT        1435Gln Gly Leu Leu Asp Glu Pro Val Phe Ala Phe Tyr Leu Gly Asp Thr        215                 220                 225AAC AAG GAA GGT GAT GAC TCC GTA GCG ACA TTC GGC GGT GTT GAC AAG        1483Asn Lys Glu Gly Asp Asp Ser Val Ala Thr Phe Gly Gly Val Asp Lys    230                 235                 240GAT CAC TAC ACC GGC GAG TTG GTC AAG ATT CCC CTT CGC CGC AAG GCC        1531Asp His Tyr Thr Gly Glu Leu Val Lys Ile Pro Leu Arg Arg Lys Ala245                 250                 255                 260TAC TGG GAG GTT GAC CTT GAT GCT ATC GCC CTT GGC GAT AGC GTT GCT        1579Tyr Trp Glu Val Asp Leu Asp Ala Ile Ala Leu Gly Asp Ser Val Ala                265                 270                 275GAA CTC GAT AAC ACC GGT GTC ATT CTG GAT ACC GGC ACT TCC CTT ATC        1627Glu Leu Asp Asn Thr Gly Val Ile Leu Asp Thr Gly Thr Ser Leu Ile            280                 285                 290GCC TTG GCC ACC ACC CTT GCC GAG CTT AT  GTAAGTCAAG CCAGTGTACT         1676Ala Leu Ala Thr Thr Leu Ala Glu Leu Ile        295                 300GTGCATGTCT GTCATACTCT TACTAACTAT TCTGAAG T AAC AAG GAA ATC GGT        1729

                                           Asn Lys Glu Ile Gly

                                                   305GCC AAG AAG GGC TTC ACC GGC CAA TAC TCG GTT GAC TGT GAC AAG CGC       1777Ala Lys Lys Gly Phe Thr Gly Gln Tyr Ser Val Asp Cys Asp Lys Arg        310                 315                 320GAT TCC TTG CCT GAC CTC ACC TTC ACC CTG AGC GGA TAC AAC TTC ACC        1825Asp Ser Leu Pro Asp Leu Thr Phe Thr Leu Ser Gly Tyr Asn Phe Thr    325                 330                 335ATT GGT CCC TAC GAC TAC ACT CTT GAA GTC CAG GGA TCT TGC ATC AGC        1873Ile Gly Pro Tyr Asp Tyr Thr Leu Glu Val Gln Gly Ser Cys Ile Ser340                 345                 350                 355GCC TTC ATG GGC ATG GAC TTC CCT GAA CCC GTT GGC CCC TTG GCC ATC        1921Ala Phe Met Gly Met Asp Phe Pro Glu Pro Val Gly Pro Leu Ala Ile                360                 365                 370CTG GGT GAC GCG TTC CTC AGG AAG TGG TAC AGT GTG TAC GAC CTC GCC        1969Leu Gly Asp Ala Phe Leu Arg Lys Trp Tyr Ser Val Tyr Asp Leu Ala            375                 380                 385AAC GGT GCT GTT GGC CTG GCC AAG GCT AAG TAACCAAGTA ATCTACCATG          2019Asn Gly Ala Val Gly Leu Ala Lys Ala Lys

        390                 395CTATGTTCTT ATTGGTTGCT TGTGTATGTG AGACAATGGT ACATGATAGC CTGCCTCGGT            2079AGTTGGTTGG CCTTTTTCTG TTACGGGAAA TCGGCAAAGC CTTGTTTTCG CTTATGACCT            2139CTATCCTGTT TGTTATTGAT ATTTTGTGTG ACTCAGTGAG CCACTGGCTA TGCTCTAATG            2199ACATTCATTG GATGCCGATA GTTCTATATA CATTGCGATT TTAACGCGTA TCTTTGATCT            2259ATCGGTACAA TGATTCCCTA CTAAAGGTAG CCCAACTAGA CAACTATGCC TACGACCTCT            2319CTACATTCTT CATAGCTCCG TGTGGAGTCC GTCTCATACA ACCTCGAGCA ACCTGCAGTT            2379CTTTGGTTAA CACAGACCAC ACCTTAAAAC GGCACGATCC ATTCGAATAG ACAAGCCCTC            2439TTAATATTTG AATTC                                                             2454(2)SEQ ID NO：2的信息：

    (i)序列特征：

      (A)长度：397个氨基酸

      (B)类型：氨基酸

      (D)拓扑结构：线性

    (ii)分子类型：蛋白质

    (xi)序列描述：SEQ ID NO：2：Met Lys Ser Thr Leu Val Thr Ala Ser Val Leu Leu-Gly Cys Ala Ser 1               5                  10                  15Ala Glu Val His Lys Leu Lys Leu Asn Lys Val Pro Val Ser Glu Gln            20                   25                 30Phe Asn Leu His Asn Ile Asp Thr His Val Gln Ala Leu Gly Gln Lys         35                  40                  45Tyr Met Gly Ile Arg Pro Asn Ile Lys Gln Asp Leu Leu Asn Glu Asn    50                  55                   60Pro Ile Asn Asp Met Gly Arg His Asp Val Leu Val Asp Asn Phe Leu 65                 70                   75                  80Asn Ala Gln Tyr Phe Ser Glu Ile Glu Ile Gly Thr Pro Pro Gln Lys                85                  90                  95Phe Lys Val Val Leu Asp Thr Gly Ser Ser Asn Leu Trp Val Pro Ser            100                 105                 110Ser Glu Cys Gly Ser Ile Ala Cys Tyr Leu His Asn Lys Tyr Asp Ser        115                 120                 125Ser Ser Ser Ser Thr Tyr Gln Lys Asn Gly Ser Glu Phe Ala Ile Lys    130                 135                 140Tyr Gly Ser Gly Ser Leu Ser Gly Phe Val Ser Gln Asp Thr Leu Lys145                 150                 155                 160Ile Gly Asp Leu Lys Val Lys Asp Gln Leu Phe Ala Glu Ala Thr Ser                165                 170                 175Glu Pro Gly Leu Ala Phe Ala Phe Gly Arg Phe Asp Gly Ile Leu Gly

            180                 185                 190Leu Gly Phe Asp Thr Ile Ser Val Asn Lys Ile Pro Pro Pro Phe Tyr        195                 200                 205Ser Met Leu Asp Gln Gly Leu Leu Asp Glu Pro Val Phe Ala Phe Tyr    210                 215                 220Leu Gly Asp Thr Asn Lys Glu Gly Asp Asp Ser Val Ala Thr Phe Gly225                 230                 235                 240Gly Val Asp Lys Asp His Tyr Thr Gly Glu Leu Val Lys Ile Pro Leu                245                 250                 255Arg Arg Lys Ala Tyr Trp Glu Val Asp Leu Asp Ala Ile Ala Leu Gly            260                 265                 270Asp Ser Val Ala Glu Leu Asp Asn Thr Gly Val Ile Leu Asp Thr Gly        275                 280                 285Thr Ser Leu Ile Ala Leu Ala Thr Thr Leu Ala Glu Leu Ile Asn Lys    290                 295                 300Glu Ile Gly Ala Lys Lys Gly Phe Thr Gly Gln Tyr Ser Val Asp Cys305                 310                 315                 320Asp Lys Arg Asp Ser Leu Pro Asp Leu Thr Phe Thr Leu Ser Gly Tyr                325                 330                 335Asn Phe Thr Ile Gly Pro Tyr Asp Tyr Thr Leu Glu Val Gln Gly Ser            340                 345                 350Cys Ile Ser Ala Phe Met Gly Met Asp Phe Pro Glu Pro Val Gly Pro        355                 360                 365Leu Ala Ile Leu Gly Asp Ala Phe Leu Arg Lys Trp Tyr Ser Val Tyr    370                 375                 380Asp Leu Ala Asn Gly Ala Val Gly Leu Ala Lys Ala Lys385                 390                 395(2)SEQ ID NO：3的信息：

    (i)序列特征：

      (A)长度：3224个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线性

    (ii)分子类型：DNA(基因组)

    (iii)假设：否

    (iv)反义：否

    (vi)原始来源：

      (A)生物体：米曲霉

    (ix)特征：

      (A)名称／关键词：外显子

    (B)位置：388．．756(ix)特征：

    (A)名称／关键词：内含子

    (B)位置：757．．817(ix)特征：

    (A)名称／关键词：外显子

    (B)位置：818．．1753(ix)特征：

    (A)名称／关键词：内含子

    (B)位置：1754．．1814(ix)特征：

    (A)名称／关键词：外显子

    (B)位置：1815．．1997(ix)特征：

    (A)名称／关键词：mat肽

    (B)位置：388．．1997(ix)特征：

    (A)名称／关键词：CDS

    (B)位置：连接处(388．．756，818．．1753，1815．．1997) (xi)序列描述：SEQ ID NO：3：GGATCCATTA CCCTCTTACC GCCATACCCC AGGTCTTGCG ACCGCGCTAA TCGGGAGCGA        60TCGACGCGCG GCACCTCCTC AGTAAAGCTG TGTCATCATT GTAAATTACC GTATCCCGGT       120TGCATCATCC TCCGCTGCCC TTGCCTGCTT GGGGGATCGA CCTATTAAGC CCAGCTATCT       180TACACCTGCT CCCATCCTCC TCTTCTCCAA CTCCTCATCC ATCCTTCCTC CTCCTTCTTC       240CTTTTAACCC CCCCAACTCA GCATCGTTCC ATCCTCCCAT CTTTCCTTTC TTTTTACCTC       300AAATCTCCAT CTGTATTCTT TCCTCTTAGA ACTCTTCCTT TCCCCCCTTC TGTACCTTGT       360GTTTAGACGT CACTCTTGTT GCCCATC ATG AGA GGC ATC CTC GGC CTT TCC           411                              Met Arg Gly Ile Leu Gly Leu Ser                               1               5CTG CTG CCA CTA CTA GCA GCG GCC TCC CCC GTT GCT GTT GAC TCC ATC         459Leu Leu Pro Leu Leu Ala Ala Ala Ser Pro Val Ala Val Asp Ser Ile    10                  15                  20CAC AAC GGA GCG GCT CCC ATT CTT TCG GCC TCA AAT GCC AAA GAG GTT         507His Asn Gly Ala Ala Pro Ile Leu Ser Ala Ser Asn Ala Lys Glu Val25                  30                  35                  40CCA GAC TCT TAC ATT GTC GTC TTC AAG AAG CAT GTT TCC GCT GAA ACG        555Pro Asp Ser Tyr Ile Val Val Phe Lys Lys His Val Ser Ala Glu Thr

                45                  50                  55GCT GCT GCT CAT CAC ACC TGG GTG CAG GAC ATC CAC GAT TCG ATG ACT        603Ala Ala Ala His His Thr Trp Val Gln Asp Ile His Asp Ser Met Thr             60                  65                  70GGA CGC ATC GAC CTG AAG AAG CGC TCT CTT TTT GGT TTC AGT GAT GAC        651Gly Arg Ile Asp Leu Lys Lys Arg Ser Leu Phe Gly Phe Ser Asp Asp        75                  80                   85CTT TAC CTC GGT CTC AAG AAC ACC TTC GAT ATC GCC GGG TCC CTA GCG       699Leu Tyr Leu Gly Leu Lys Asn Thr Phe Asp Ile Ala Gly Ser Leu Ala    90                  95                  100GGC TAC TCC GGA CAT TTC CAT GAG GAT GTG ATC GAG CAG GTC CGG AGA        747Gly Tyr Ser Gly His Phe His Glu Asp Val Ile Glu Gln Val Arg Arg105                 110                 115                 120CAT CCT GAT GTAGGTTCCC CCCTCGGCCC ACCCGTTTTT GTAGAGCCCT                796His Pro AspTGGTCTAACT TGATTTTCAA G GTT GAA TAC ATC GAG AAA GAC ACC GAA GTC        847                        Val Glu Tyr Ile Glu Lys Asp Thr Glu Val                            125                 130CAC ACC ATG GAG GAG ACA ACC GAG AAG AAT GCT CCC TGG GGC TTG GCT        895His Thr Met Glu Glu Thr Thr Glu Lys Asn Ala Pro Trp Gly Leu Ala    135                 140                 145CGT ATC TCT CAC CGT GAC AGC CTC TCG TTC GGT ACC TTT AAC AAG TAC        943Arg Ile Ser His Arg Asp Ser Leu Ser Phe Gly Thr Phe Asn Lys Tyr150                 155                 160                 165CTG TAT GCT TCG GAA GGC GGT GAG GGT GTC GAT GCT TAT ACT ATT GAC        991Leu Tyr Ala Ser Glu Gly Gly Glu Gly Val Asp Ala Tyr Thr Ile Asp                170                 175                 180ACT GGT ATC AAC ATT GAG CAT GTC GAT TTC GAG GAT CGA GCA CAC TGG        1039Thr Gly Ile Asn Ile Glu His Val Asp Phe Glu Asp Arg Ala His Trp            185                 190                 195GGA AAG ACC ATC CCT AGC AAT GAT GAG GAT GCG GAT GGC AAC GGA CAC        1087Gly Lys Thr Ile Pro Ser Asn Asp Glu Asp Ala Asp Gly Asn Gly His

        200                 205                  210GGA ACT CAC TGC TCC GGA ACC ATT GCT GGT AAG AAG TAC GGT GTT GCC        1135Gly Thr His Cys Ser Gly Thr Ile Ala Gly Lys Lys Tyr Gly Val Ala    215                 220                 225AAG AAG GCC AAC ATC TAT GCC GTC AAG GTC TTG AGG TCC AGC GGT TCT        1183Lys Lys Ala Asn Ile Tyr Ala Val Lys Val Leu Arg Ser Ser Gly Ser230                 235                 240                 245GGC ACT ATG TCC GAT GTC GTT CTG GGT GTC GAG TGG GCC GTC CAG TCC        1231Gly Thr Met Ser Asp Val Val Leu Gly Val Glu Trp Ala Val Gln Ser                250                 255                 260CAC CTC AAG AAG GCT AAG GAC GCC AAA GAT GCC AAG GTC AAG GGT TTC        1279His Leu Lys Lys Ala Lys Asp Ala Lys Asp Ala Lys Val Lys Gly Phe            265                 270                 275AAG GGC AGC GTT GCC AAC ATG AGT CTT GGT GGT GCC AAG TCC AGG ACC        1327Lys Gly Ser Val Ala Asn Met Ser Leu Gly Gly Ala Lys Ser Arg Thr        280                 285                 290CTT GAG GCT GCT GTC AAT GCT GGT GTT GAG GCT GGT CTT CAC TTC GCC        1375Leu Glu Ala Ala Val Asn Ala Gly Val Glu Ala Gly Leu His Phe Ala    295                 300                 305GTT GCT GCT GGT AAC GAC AAT GCC GAT GCC TGC AAC TAC TCC CCT GCT        1423Val Ala Ala Gly Asn Asp Asn Ala Asp Ala Cys Asn Tyr Ser Pro Ala310                 315                 320                 325GCC GCT GAG AAT GCC ATC ACT GTC GGT GCC TCG ACC CTT CAG GAT GAG        1471Ala Ala Glu Asn Ala Ile Thr Val Gly Ala Ser Thr Leu Gln Asp Glu                330                 335                 340CGT GCT TAC TTC TCC AAC TAC GGA AAG TGC ACT GAC ATC TTT GCC CCG        1519Arg Ala Tyr Phe Ser Asn Tyr Gly Lys Cys Thr Asp Ile Phe Ala Pro            345                 350                 355GGT CCC AAC ATT CTT TCC ACC TGG ACT GGC AGC AAG CAC GCT GTC AAC        1567Gly Pro Asn Ile Leu Ser Thr Trp Thr Gly Ser Lys His Ala Val Asn        360                 365                 370ACC ATC TCT GGA ACC TCT ATG GCT TCT CCT CAC ATT GCT GGT CTG CTG        1615Thr Ile Ser Gly Thr Ser Met Ala Ser Pro His Ile Ala Gly Leu Leu    375                 380                 385GCC TAC TTC GTT TCT CTG CAG CCT GCT CAG GAC TCT GCT TTC GCT GTC        1663Ala Tyr Phe Val Ser Leu Gln Pro Ala Gln Asp Ser Ala Phe Ala Val390                 395                 400                 405GAT GAG CTT ACT CCT GCC AAG CTC AAG AAG GAT ATC ATC TCC ATC GCC        1711Asp Glu Leu Thr Pro Ala Lys Leu Lys Lys Asp Ile Ile Ser Ile Ala                410                 415                 420ACC CAG GGT GCC CTT ACT GAT ATC CCA TCT GAC ACC CCC AAC                1753Thr Gln Gly Ala Leu Thr Asp Ile Pro Ser Asp Thr Pro Asn            425                 430                 435GTAAGTTATA TTATCCATTT TGGTATAATG AAACAGAAAG TGGCTAACTG TTTTATTCTA      1813G CTT CTC GCC TGG AAC GGC GGT GGT GCC GAC AAC TAC ACC CAG ATT          1859  Leu Leu Ala Trp Asn Gly Gly Gly Ala Asp Asn Tyr Thr Gln Ile                  440                 445                 450GTC GCC AAG GGT GGA TAC AAG GCC GGC AGT GAC AAC CTT AAG GAC CGC        1907Val Ala Lys Gly Gly Tyr Lys Ala Gly Ser Asp Asn Leu Lys Asp Arg

                455                 460                 465TTT GAC GGA CTA GTC AAC AAG GCC GAG AAG TTG CTC GCT GAG GAG CTT        1955Phe Asp Gly Leu Val Asn Lys Ala Glu Lys Leu Leu Ala Glu Glu Leu            470                 475                 480GGA GCT ATT TAC AGT GAG ATC CAG GGT GCT GTT GTT GCA TAG                1997Gly Ala Ile Tyr Ser Glu Ile Gln Gly Ala Val Val Ala   *        485                 490                 495ATGCAAGACA AGACTTGATT TAGAGTGACG TAACTAGTTT CGTTTATGGC AGGGTATGGG      2057AATTGGCTAA CCGAACACTG GCGCTGGTAT TTGTTTTTGC TGCTGCTTTT TGGTAACACG      2117GAGAAGCCGA TGCATTGACT GCATTGGGTA CATTATCCTG ACATGGTTTA CCTGGTCTTT      2177CATTATTATT ATAGCATACA TGTCCACAAC AATCTTTGAC ATCCTATCTA GAGATACATG      2237TGCTTGCTTT TAACAGACTG CCAAATCAAT TATGCGACTG TTCTGCACAG ATAATCGTGG      2297CTTGGTTTGA AGGCTGCCAT AAAGTCTAAC GCTGGCTACC AATTAGGTAG GAGTGTCCCC      2357TTCCTGCCAG GTTGCTCCAG TCGTAGAAGT AGACTGATAT ATTGAAGATT GCCCATATAC      2417CATGGACGCT CGTCTTATTC TACATCATAT ATGTCACTCC TAGTGACCAT ATAGACATGC      2477TAACCATTGC ACAACCCCCC ACAGGTTCAA TCCAACCCAT GACCCCCTCT CATCTTCTGT      2537TGTATTTTCA GGTTCTAGAT TTGCATACAT ACTACCCATC ATCGGAAGAC GGGTGAGGAG      2597GCAGATGACC CGACATTATA TTTATTAATT GCTTAGGATG TTTCAACAAC ATTAAAAGTA      2657TATCAATAAG CTTTTCCAGT TTATATTTAC TACCTAAGAT TACGGCATAT AGTGTATTCT      2717GTGTGCGTAA GAGGTCGCCC TTAAATGGAA ACAGTTCGCG GTTGGAGATA TATATTTGTA      2777GTGTTCAGGC GGAACGAGTA AAAAAAAAAA AAAATGAGAA GCTGGTGATA TTAACTCCGA      2837TGTTTATCTT ACATATACCA ATGGATGTAG TCTCATTATA ACGCTTTCTC TGTAGTTTGG      2897TTGTCATAGA ACTGAATGAC AGGTAAGTGT GTATGTATGT ACAGTACGCA CGGGGGGCCA      2957TGTGGTCAAC CACACCCAAT GGGCGGTCTT GTCACTTTCC GGACTGGAAA TGAAACGTTC      3017CATGGAAGAA ATCTGGATGA TTACCTTGAG TACGAGAGAA CTATGGTTGC CGGTAATGGG      3077TGATTGCCAC AATCATCAGT TCGGTTGAGG CGTTCAACAT CTACGGTACG TTCAGTCACA      3137TGAATCTGGG AATTCGGGCC TGGTATGCTG GTTTTCGCAA GAGATCCACC CGGCGTGTGC      3197CAGGTATGCT ACATTTTCTC AGTCGAC                                          3224(2)SEQ ID NO：4的信息：

    (i)序列特征：

      (A)长度：496个氨基酸

      (B)类型：氨基酸

      (D)拓扑结构：线性

    (ii)分子类型：蛋白质

    (xi)序列描述：SEQ ID NO：4：Met Arg Gly Ile Leu Gly Leu Ser Leu Leu Pro Leu Leu Ala Ala Ala 1               5                  10                  15Ser Pro Val Ala Val Asp Ser Ile His Asn Gly Ala Ala Pro Ile Leu            20                  25                  30Ser Ala Ser Asn Ala Lys Glu Val Pro Asp Ser Tyr Ile Val Val Phe         35                  40                  45Lys Lys His Val Ser Ala Glu Thr Ala Ala Ala His His Thr Trp Val    50                  55                  60Gln Asp Ile His Asp Ser Met Thr Gly Arg Ile Asp Leu Lys Lys Arg65                  70                  75                   80Ser Leu Phe Gly Phe Ser Asp Asp Leu Tyr Leu Gly Leu Lys Asn Thr                85                  90                  95Phe Asp Ile Ala Gly Ser Leu Ala Gly Tyr Ser Gly His Phe His Glu            100                 105                 110Asp Val Ile Glu Gln Val Arg Arg His Pro Asp Val Glu Tyr Ile Glu        115                 120                 125Lys Asp Thr Glu Val His Thr Met Glu Glu Thr Thr Glu Lys Asn Ala    130                 135                 140Pro Trp Gly Leu Ala Arg Ile Ser His Arg Asp Ser Leu Ser Phe Gly145                 150                 155                 160Thr Phe Asn Lys Tyr Leu Tyr Ala Ser Glu Gly Gly Glu Gly Val Asp                165                 170                 175Ala Tyr Thr Ile Asp Thr Gly Ile Asn Ile Glu His Val Asp Phe Glu            180                 185                 190Asp Arg Ala His Trp Gly Lys Thr Ile Pro Ser Asn Asp Glu Asp Ala        195                 200                 205Asp Gly Asn Gly His Gly Thr His Cys Ser Gly Thr Ile Ala Gly Lys    210                 215                 220Lys Tyr Gly Val Ala Lys Lys Ala Asn Ile Tyr Ala Val Lys Val Leu225                 230                 235                 240Arg Ser Ser Gly Ser Gly Thr Met Ser Asp Val Val Leu Gly Val Glu                245                 250                 255Trp Ala Val Gln Ser His Leu Lys Lys Ala Lys Asp Ala Lys Asp Ala            260                 265                 270Lys Val Lys Gly Phe Lys Gly Ser Val Ala Asn Met Ser Leu Gly Gly

        275                 280                 285Ala Lys Ser Arg Thr Leu Glu Ala Ala Val Asn Ala Gly Val Glu Ala    290                 295                 300Gly Leu His Phe Ala Val Ala Ala Gly Asn Asp Asn Ala Asp Ala Cys305                 310                 315                 320Asn Tyr Ser Pro Ala Ala Ala Glu Asn Ala Ile Thr Val Gly Ala Ser                325                 330                 335Thr Leu Gln Asp Glu Arg Ala Tyr Phe Ser Asn Tyr Gly Lys Cys Thr            340                 345                 350Asp Ile Phe Ala Pro Gly Pro Asn Ile Leu Ser Thr Trp Thr Gly Ser        355                 360                 365Lys His Ala Val Asn Thr Ile Ser Gly Thr Ser Met Ala Ser Pro His    370                 375                 380Ile Ala Gly Leu Leu Ala Tyr phe Val Ser Leu Gln Pro Ala Gln Asp385                 390                 395                 400Ser Ala Phe Ala Val Asp Glu Leu Thr Pro Ala Lys Leu Lys Lys Asp                405                 410                 415Ile Ile Ser Ile Ala Thr Gln Gly Ala Leu Thr Asp Ile Pro Ser Asp            420                 425                 430Thr Pro Asn Leu Leu Ala Trp Asn Gly Gly Gly Ala Asp Asn Tyr Thr        435                 440                 445Gln Ile Val Ala Lys Gly Gly Tyr Lys Ala Gly Ser Asp Asn Leu Lys    450                 455                 460Asp Arg Phe Asp Gly Leu Val Asn Lys Ala Glu Lys Leu Leu Ala Glu465                 470                 475                 480Glu Leu Gly Ala Ile Tyr Ser Glu Ile Gln Gly Ala Val Val Ala  *

                485                 490                 495(2)SEQ ID NO：5的信息：

    (i)序列特征：

      (A)长度：5643个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线性

    (ii)分子类型：DNA(基因组)

    (iii)假设：否

    (iii)反义：否

    (vi)原始来源：

      (A)生物体：米曲霉

      (B)菌株：IFO4177

    (ix)特征：

      (A)名称／关键词：内含子

      (B)位置：2701．．2769

    (ix)特征：

      (A)名称／关键词：CDS

      (B)位置：连接处(2282．．2700，2770．．4949)

    (xi)序列描述：SEQ ID NO：5：AAGCTTCGTC CTCGCATCTC GGCCGGGTGA GTAAGGTATG GTATTATTCA TGAAGGGATC         60TCGTTGGTTA CCGTTGTCTA TCCCTAAACA AAGGATTCAA GAGAACAACT CGGAATGCTC        120CCTCCGCTTA AACCCCTTGA CTCACTGATG GTGTATGTAC TATGGGTACG ACGTTCGGGA       180TGTGGACTAC CAACCAGAGA GTGATTAGAG AGTCCGGGTT CTCAGTCCAT GATTTTTGCA       240TCTTTGAAAC AGACGATGCG GAGCGGTCAT TGGCGGAGTT TACTCCCAAA TACGGCCGAA       300CGGGGTACTT TAAGTGGAAT CTCCGATTTT GGATCTAAGC TCATGAAGGA AAAGTACTAC       360TAATGCGTAC CTGTGCCTAA TGTTAGTGCT AGTTCGTCTG TTGCATTTTA CCCGTCGGTT       420AAGACGAATG GATCCGTTCA GGTTTTAAAA TAACTATCTA TGAAATATTT TAGATTTCCC       480GACATAGTGG TTGGGATGTC TCGATTAACA CTAGGTACAT CAGGCTCAAT TGATTTTGGT       540TTTAACGAAA CATGATATAG GTCAGGGTCG TGGACCACCC TCCGCCAGGG ATCAGGGGAC       600GGTTACATGC GAAGGATTCT GATTATATTC ATGATTATGT CAAGCCTTTT CTCTCGTGTG       660AAGAGGAGCA GAGAATCCGT ACGGGTTTAA TTTAATTTAG CGCCCTGCAG CTTCGAGAAC       720ATCCCCAGCA ACGTTAAAAA CCACGAGCTA AAATGGGTCG CCACCGGAAG CACTCGAGTC       780GAGAGATCGG TCGGCTCAGT ATTCGTAATA CCTGCGTTCC AGACGGTTTT GGTCGTTGGT       840TTCACTCAGG GAACTTAATT CCAGCGGGAC CCAATATAAT TTGAATGATT CATGATACAT       900CCATTCGTTT GAACCGATCC TGCAAGAGTT CTGTCTGATT TGGTCAACAT AGTTTTCCTC       960TGGGGGAGAC TGGGGAAGAG TCAACACAAT GGTCAGGGAG AGAAGAATGA AAGCTCTCGC      1020AAGTGGATGA TCATGCTACG TACTGTAGGA ATAAAATTAA TTAATGCGAG GCTGCAAGTA      1080TCCCTGCGCC GATTTTCTCT TCTTACGGCG GGAACCAAAA AATGTGACGC TGTGATTTTC      1140TGGAAAAGGT AAGGATGTTT AGTTTCCCAG GATTATTACT GGTTCCGTAT GTGTATGTGT      1200ATGGATATCA TTCCGTATGG ATACGCCCGT TTCCTCCGCC CAGAACCAGT CCGTCATCCA      1260TCCTCCACTC TTTCTTCTCT TAGAGCCTTT CCACCTCTCT TCACTTTCTT TTTCTTTCCC      1320CCCTCCCTCT TTGCTTTCCC TCTCCCAGTA TTATTCTTAT ATTATCGGTT TGACCGTCGC      1380CTCAGTATCG GCCCCCCGTG AATCACTTTT CGTTTCTCTT GTATTTTACT TTCCTATCTG      1440GGATTGCTCC TCGATTAGCA GCTCTACTTC ATTCGGCCAT GTGCGTCTAG AGGGTCTAGC      1500CCCTCTCTCT CTTTGCACTG ACTGTCAGCC ATACCATAGT ATCATCCCGG AATTAAGAAA      1560AAAAAAGAAA TTATTCTACC TCCGATCTGG ACAAATTATA ACCAGGAGAA AATCAAGCGA      1620AAGAGGGGCA AAGGAGGAGA CACCATTAAA ACTGGGTCTG GTTTGATTCA TGACATACAT      1680TCGTCGTCTT GAATTTCAAT AGGTACGGAC TGATGCATTC CACTCGAGCC TTTTTAGCTG      1740CGTGTCCGTC TCCAATCGCA CTTCTTTTCT TATTTCCTTG TGGGATAAAT TGATTATTTA      1800CCGTTTCGTT TTCTCTATAT TGCGGTGGTG GTGCGACCCA TCCAACTATT ATTATTATAA      1860TTGGAATTTG ATTTGGATTT TGATTCCTGT GACGGATCTC AGACCAAGTG CCTAAACTAT      1920AACTGACTTG GACCCCCTTC AGATCCTAGC TTCCCGATTC TTTTCCACCA CTGCTGCATC      1980CTCTTCCTGC ACGCAGCGTT CGTTTAGGGC GGGTAGACTG GAATTTATTC CTTGCGCCAC      2040GGACCAATCG CTCCCTCGAC GCTCTCATTC CTGCGTCGAG CTCTTTTTCC CTCGACTCTC      2100ATTGCTTGCT GGGCTGGTTC TTGAACCTCT TCAATCGTCC TTATCTCTTT CCCCCCATCC      2160GGCCTGTGAT TCCTATCTTT CCTTTTTTTC TTCCCTTTCT TGTTTGATCC CCCCTCCTCC      2220CCGTCTTATC GCCTACTATC GTGATCCCCG CCCTTCCCAA TAAAGAGTAG GGCGTGTGAA      2280C ATG TCC GGG TTA ACC CTC GGG CGA GGC CCT GGG GGC GTG CGA CCG          2326  Met Ser Gly Leu Thr Leu Gly Arg Gly Pro Gly Gly Val Arg Pro  1                5                  10                  15ACT CAA ACC GCA ACT TTT ACC ACC CAC CAC CCG TCC GCC GAT GCT GAC        2374Thr Gln Thr Ala Thr Phe Thr Thr His His Pro Ser Ala Asp Ala Asp

                20                  25                  30CGC TCC TCC AAC AAC CTC CCC CCT ACC TCC TCG CAG CTG TCC GAT GAC        2422Arg Ser Ser Asn Asn Leu Pro Pro Thr Ser Ser Gln Leu Ser Asp Asp            35                  40                   45TTT TCT TTC GGT TCC CCT CTG AGC CCC GCC GAC TCA CAG GCC CAT GAC        2470Phe Ser Phe Gly Ser Pro Leu Ser Pro Ala Asp Ser Gln Ala His Asp        50                   55                 60GGC CTA CTT CAG GAC TCC CTC TTC CCT GAA TGG GGG TCT GGT GCG CCT        2518Gly Leu Leu Gln Asp Ser Leu Phe Pro Glu Trp Gly Ser Gly Ala Pro    65                  70                  75CGA CCC GGC ATT GAC AGT CCG GAT GAG ATG CAG AGG CAA GAT CCG CTA        2566Arg Pro Gly Ile Asp Ser Pro Asp Glu Met Gln Arg Gln Asp Pro Leu80                   85                  90                 95GCG ACT CAA ATA TGG AAG CTC TAT TCT AGG ACC AAG GCC CAG TTG CCC        2614Ala Thr Gln Ile Trp Lys Leu Tyr Ser Arg Thr Lys Ala Gln Leu Pro                100                 105                 110AAC CAG GAG CGT ATG GAA AAC CTG ACC TGG CGG ATG ATG GCG ATG AGT        2662Asn Gln Glu Arg Met Glu Asn Leu Thr Trp Arg Met Met Ala Met Ser            115                 120                 125TTG AAA CGT AAG GAG CGG GAA CGT GCT CAA CAG TCC AT GTAGGTGTTC          2710Leu Lys Arg Lys Glu Arg Glu Arg Ala Gln Gln Ser  Met        130                 135                  140TCCCTCTGTA GAGGAACGGC TGGACCCGCT CATCATTAAT TTTTTTTTTG TCTGTGAAG G     2770TTT CCT GCG AGA CGC GGT AGC GCT GGC CCC AGT GGT ATC GCT CAA CTG        2818Phe Pro Ala Arg Arg Gly Ser Ala Gly Pro Ser Gly Ile Ala Gln Leu                145                 150                 155CGC ATT TCC GAC CCG CCC GTT GCC ACC GGT AAC CCT CAG TCA ACC GAC        2866Arg Ile Ser Asp Pro Pro Val Ala Thr Gly Asn Pro Gln Ser Thr Asp            160                 165                 170CTG ACC GCC GAC CCT ATG AAC CTC GAC GAT TTC ATC GTG CCC TTC GAA        2914Leu Thr Ala Asp Pro Met Asn Leu Asp Asp Phe Ile Val Pro Phe Glu        175                 180                 185TCT CCT TCG GAC CAC CCC TCG CCC AGT GCC GTC AAG ATT TCC GAC TCC        2962Ser Pro Ser Asp His Pro Ser Pro Ser Ala Val Lys Ile Ser Asp Ser    190                 195                 200ACG GCG TCC GCG GCC ATT CCC ATC AAG TCC CGG AAA GAC CAG CTG AGA        3010Thr Ala Ser Ala Ala Ile Pro Ile Lys Ser Arg Lys Asp Gln Leu Arg205                 210                 215                 220GAT TCT ACC CCG GTG CCG GCC TCG TTC CAC CAT CCG GCT CAG GAT CAA        3058Asp Ser Thr Pro Val Pro Ala Ser Phe His His Pro Ala Gln Asp Gln

                225                 230                  235CGG AAG AAC AGT GAA TTT GGC TAC GTC CCC CGT CGC GTG CGC AAG ACG        3106Arg Lys Asn Ser Glu Phe Gly Tyr Val Pro Arg Arg Val Arg Lys Thr            240                 245                 250AGT ATC GAC GAG CGT CAA TTT TTC TCA CTG CAG GTG CCG ACC CGA AAG        3154Ser Ile Asp Glu Arg Gln Phe Phe Ser Leu Gln Val Pro Thr Arg Lys        255                 260                 265CGA CCG GCC GAA TCC TCG CCC CAG GTA CCC CCC GTT TCC AAC TCG ATG        3202Arg Pro Ala Glu Ser Ser Pro Gln Val Pro Pro Val Ser Asn Ser Met    270                 275                 280TTG GCC CAC GAT CCG GAC CTC GCT TCC GGC GTG CCC GAT TAT GCC TTG        3250Leu Ala His Asp Pro Asp Leu Ala Ser Gly Val Pro Asp Tyr Ala Leu285                 290                 295                 300GAC GCC CCG TCC TCG GCC TTT GGC TTC CAT CAG GGT AAC CAC CAT CCG        3298Asp Ala Pro Ser Ser Ala Phe Gly Phe His Gln Gly Asn His His Pro                305                 310                 315GTC AAT CAT CAC AAC CAC ACC TCC CCC GGG GCA CCG TTT GGC TTG GAT        3346Val Asn His His Asn His Thr Ser Pro Gly Ala Pro Phe Gly Leu Asp            320                 325                 330ACG TTC GGC CTG GGA GAT GAT CCA ATC TTG CCC TCC GCG GGC CCC TAC        3394Thr Phe Gly Leu Gly Asp Asp Pro Ile Leu Pro Ser Ala Gly Pro Tyr        335                 340                 345CAG TCG CAA TTC ACC TTC TCA CCC AGC GAG TCT CCG ATG GCC TCC GGT        3442Gln Ser Gln Phe Thr Phe Ser Pro Ser Glu Ser Pro Met Ala Ser Gly    350                 355                 360CAT CCG TTT GCG AAC CTC TAT TCG CAT ACC CCG GTG GCT TCG TCC CTC        3490His Pro Phe Ala Asn Leu Tyr Ser His Thr Pro Val Ala Ser Ser Leu365                 370                 375                 380AAC TCG ACG GAT TTC TTC TCT CCA CCG CCA TCA GGC TAC CAG TCC ACG        3538Asn Ser Thr Asp Phe Phe Ser Pro Pro Pro Ser Gly Tyr Gln Ser Thr                385                 390                 395GCA TCC ACG CCG CAG CCC ACC TAC GAC GGG GAC CAT TCC GTT TAT TTC        3586Ala Ser Thr Pro Gln Pro Thr Tyr Asp Gly Asp His Ser Val Tyr Phe            400                 405                 410GAT ATG CCG TCG GGC GAC GCG CGC ACC CAG CGC CGC ATT CCG AAC TAT        3634Asp Met Pro Ser Gly Asp Ala Arg Thr Gln Arg Arg Ile Pro Asn Tyr        415                 420                 425ATT TCG CAT CGG TCC AAC TTG TCT GCT TCG CTG CAG CCT CGG TAT ATG        3682Ile Ser His Arg Ser Asn Leu Ser Ala Ser Leu Gln Pro Arg Tyr Met    430                 435                 440TTC AAC CAG AAC AAC CAT GAA CAG GCC AGT TCG TCG ACG GTG CAT TCG        3730Phe Asn Gln Asn Asn His Glu Gln Ala Ser Ser Ser Thr Val His Ser445                 450                 455                 460CCG AGC TAC CCC ATT CCC CAG CCG CAA CAT GTG GAC CCC ACT CAG GTG        3778Pro Ser Tyr Pro Ile Pro Gln Pro Gln His Val Asp Pro Thr Gln Val                465                 470                 475TTG AAC GCC ACC AAT TAC TCG ACC GGC AAC TCC CAC CAT ACC GGC GCC        3826Leu Asn Ala Thr Asn Tyr Ser Thr Gly Asn Ser His His Thr Gly Ala

            480                 485                 490ATG TTT TCA TTT GGA GCC GAT TCA GAT AAC GAG GAT GAC GAT GGT CAT        3874Met Phe Ser Phe Gly Ala Asp Ser Asp Asn Glu Asp Asp Asp Gly His        495                 500                 505CAG CTG TCC GAG CGG GCT GGT CTG GCG ATG CCG ACT GAA TAT GGG GAC        3922Gln Leu Ser Glu Arg Ala Gly Leu Ala Met Pro Thr Glu Tyr Gly Asp    510                 515                 520GAG GAC GGG TTC TCG TCG GGC ATG CAG TGG GAT GGG CAG TTC CCG GGC        3970Glu Asp Gly Phe Ser Ser Gly Met Gln Trp Asp Gly Gln Phe Pro Gly525                 530                 535                 540TCC TTC CAT TCG CTG CCG GGC TTT GGC CCT CAA CAT CGC AAG CAT GTT        4018Ser Phe His Ser Leu Pro Gly Phe Gly Pro Gln His Arg Lys His Val                545                 550                 555ACC ATC GGG TCC ACG GAC ATG ATG GAC ACC CCC GAG GAG TGG AAT CAC        4066Thr Ile Gly Ser Thr Asp Met Met Asp Thr Pro Glu Glu Trp Asn His            560                 565                 570GGT GGC AGT TTG GGT CGG ACT CAT GGG TCG GTG GCT TCG GTC AGT GAG        4114Gly Gly Ser Leu Gly Arg Thr His Gly Ser Val Ala Ser Val Ser Glu        575                 580                 585GTG CGC AAC CGA GAG CAG GAC CCT CGC CGG CAG AAG ATT GCC CGC ACC        4162Val Arg Asn Arg Glu Gln Asp Pro Arg Arg Gln Lys Ile Ala Arg Thr    590                 595                 600ACG TCC ACC CCC AAT ACG GCC CAG CTG TTG CGC CAA AGC ATG CAC TCT        4210Thr Ser Thr Pro Asn Thr Ala Gln Leu Leu Arg Gln Ser Met His Ser605                 610                 615                 620AAT AAC AAT ACG TCT CAT ACC TCC CCT AAT ACG CCG CCC GAG TCC GCC        4258Asn Asn Asn Thr Ser His Thr Ser Pro Asn Thr Pro Pro Glu Ser Ala                625                 630                 635CTG AGC AGC GCA GTT CCG TCC CGC CCG GCC AGT CCC GGG GGC AGC AAG        4306Leu Ser Ser Ala Val Pro Ser Arg Pro Ala Ser Pro Gly Gly Ser Lys            640                 645                 650AAC GGC GAC CAA GGC AGC AAC GGA CCG ACC ACC TGC ACG AAC TGC TTC        4354Asn Gly Asp Gln Gly Ser Asn Gly Pro Thr Thr Cys Thr Asn Cys Phe        655                 660                 665ACT CAA ACC ACT CCG CTG TGG CGT CGG AAC CCA GAG GGC CAG CCA CTG        4402Thr Gln Thr Thr Pro Leu Trp Arg Arg Asn Pro Glu Gly Gln Pro Leu    670                 675                 680TGC AAT GCC TGC GGG TTG TTT TTG AAA TTG CAC GGT GTC GTG CGC CCT        4450Cys Asn Ala Cys Gly Leu Phe Leu Lys Leu His Gly Val Val Arg Pro685                 690                 695                 700CTG TCC CTG AAA ACG GAC GTT ATC AAA AAG CGC AAC CGT AGC AGT GCC        4498Leu Ser Leu Lys Thr Asp Val Ile Lys Lys Arg Asn Arg Ser Ser Ala                705                 710                 715AAC AGC TTG GCG GTT GGG ACC TCC CGT GCG TCG AAG AAG ACA GCC CGC        4546Asn Ser Leu Ala Val Gly Thr Ser Arg Ala Ser Lys Lys Thr Ala Arg            720                 725                 730AAG AAC TCG GTG CAG CAA GCA TCC GTC ACG ACT CCG ACA TCA AGC CGC        4594Lys Asn Ser Val Gln Gln Ala Ser Val Thr Thr Pro Thr Ser Ser Arg

        735                 740                 745GCT CAG AAT GGG ACT TCC TTC GAA TCC CCG CCC GCC GGC TTT AGT GCT       4642Ala Gln Asn Gly Thr Ser Phe Glu Ser Pro Pro Ala Gly Phe Ser Ala    750                 755                 760GCC GCG GGA CGG TCG AAT GGG GTG GTA CCC ATT GCC GCC GCT CCT CCG       4690Ala Ala Gly Arg Ser Asn Gly Val Val Pro Ile Ala Ala Ala Pro Pro765                 770                 775                 780AAG GCA GCT CCC TCC GCA GCC GCC TCC CCT AGC ACG GGC CAG ACC CGC       4738Lys Ala Ala Pro Ser Ala Ala Ala Ser Pro Ser Thr Gly Gln Thr Arg                785                 790                 795AAC CCG ATC CAG GCT GCC CCG AAA CGT CAA CGA CGG CTG GAA AAG GCC       4786Asn Pro Ile Gln Ala Ala Pro Lys Arg Gln Arg Arg Leu Glu Lys Ala            800                 805                 810ACG GAG ATG GAA ACG GAC GAG GCT AAC AAG TCC GCG GGA GGC CGA TCC       4834Thr Glu Met Glu Thr Asp Glu Ala Asn Lys Ser Ala Gly Gly Arg Ser        815                 820                 825AAG GTG GTG CCT CTG GCA CCC GCC ATG CCA CCG GCA GCA GCC AAT CCG       4882Lys Val Val Pro Leu Ala Pro Ala Met Pro Pro Ala Ala Ala Asn Pro    830                 835                 840GCG AAC CAT AGT ATT GCC GGA GGC CAA GGG GCT AGT CAG GAA TGG GAG       4930Ala Asn His Ser Ile Ala Gly Gly Gln Gly Ala Ser Gln Glu Trp Glu845                 850                 855                 860TGG TTG ACG ATG AGT CTGTAATGGC CGCGCTTACC TCTCTACTTC TCTACACTCG       4985Trp Leu Thr Met Ser Leu                865TTTCTTAATA TCTTTCTTGA ACCCCCCCTT ATATTTTCCC ACCGTTGATG CTACGCCATG     5045ACCGATAGAG ATGATGAATA CTGCAACCAA TGGAATCTCG CTAGACGAGA GGTGTTAGAT     5105GACGTGGCCC GCGATGCACT TAATGAGATA CGAGGAGGTG CAATGCGTTG GTTACGCTAG     5165TTTAATGGTA ACATGACGAG GGATATTCGC TCTGTTATTT CGGGCTTTGA TCTGTTTCAG     5225TCTGCGATTT AACAGCGACT GATCCTCTGC TGTGACAATA CACAGCTTGT CTTGTGGTTC     5285TGTTGTGGCT TTCTGTTTGT TTGGCTGATT TGATTTATGC TTGATACAAT CGCGTCTGTC     5345CGGACCCCGG CCTTTGTTTT GTTTTCAGTT CTGATTCTTC ACTGTTTCTG ATTCTCTTGT     5405TCATGTTTTT GATTTGTTCA AGGCTTGGGG CCGGGCAGAA GTGCGCATCT CTGCTTTGTG     5465TTTTCCGTCA CCGTGCATAG ACGCTGTATG TATATGCTAC AGCAAGATTC TACTTATCCA     5525GTCTGAGCCT GTATTCATTG AAGTGTAGCC AGCTGTCGAA TGAGCTTTTT AACGATATTG     5585TTTTGTTGAG TAGTCAACAA GTAGTATCTG TATATTCCGG AGTCTAAGTA AGACACTT       5643(2)SEQ ID NO：6的信息：

    (i)序列特征：

      (A)长度：866个氨基酸

      (B)类型：氨基酸

      (D)拓扑结构：线性

    (ii)分子类型：蛋白质

    (xi)序列描述：SEQ ID NO：6：Met Ser Gly Leu Thr Leu Gly Arg Gly Pro Gly Gly Val Arg Pro Thr 1               5                  10                  15Gln Thr Ala Thr Phe Thr Thr His His Pro Ser Ala Asp Ala Asp Arg             20                  25                  30Ser Ser Asn Asn Leu Pro Pro Thr Ser Ser Gln Leu Ser Asp Asp Phe        35                  40                  45Ser Phe Gly Ser Pro Leu Ser Pro Ala Asp Ser Gln Ala His Asp Gly    50                  55                  60Leu Leu Gln Asp Ser Leu Phe Pro Glu Trp Gly Ser Gly Ala Pro Arg65                   70                  75                  80Pro Gly Ile Asp Ser Pro Asp Glu Met Gln Arg Gln Asp Pro Leu Ala                85                  90                  95Thr Gln Ile Trp Lys Leu Tyr Ser Arg Thr Lys Ala Gln Leu Pro Asn            100                 105                 110Gln Glu Arg Met Glu Asn Leu Thr Trp Arg Met Met Ala Met Ser Leu        115                 120                 125Lys Arg Lys Glu Arg Glu Arg Ala Gln Gln Ser Met Phe Pro Ala Arg    130                 135                 140Arg Gly Ser Ala Gly Pro Ser Gly Ile Ala Gln Leu Arg Ile Ser Asp145                 150                 155                 160Pro Pro Val Ala Thr Gly Asn Pro Gln Ser Thr Asp Leu Thr Ala Asp                165                 170                 175Pro Met Asn Leu Asp Asp Phe Ile Val Pro Phe Glu Ser Pro Ser Asp            180                 185                 190His Pro Ser Pro Ser Ala Val Lys Ile Ser Asp Ser Thr Ala Ser Ala        195                 200                 205Ala Ile Pro Ile Lys Ser Arg Lys Asp Gln Leu Arg Asp Ser Thr Pro    210                 215                 220Val Pro Ala Ser Phe His His Pro Ala Gln Asp Gln Arg Lys Asn Ser225                 230                 235                 240Glu Phe Gly Tyr Val Pro Arg Arg Val Arg Lys Thr Ser Ile Asp Glu                245                 250                 255Arg Gln Phe Phe Ser Leu Gln Val Pro Thr Arg Lys Arg Pro Ala Glu

            260                 265                 270Ser Ser Pro Gln Val Pro Pro Val Ser Asn Ser Met Leu Ala His Asp        275                 280                 285Pro Asp Leu Ala Ser Gly Val Pro Asp Tyr Ala Leu Asp Ala Pro Ser    290                 295                 300Ser Ala Phe Gly Phe His Gln Gly Asn His His Pro Val Asn His His305                 310                 315                 320Asn His Thr Ser Pro Gly Ala Pro Phe Gly Leu Asp Thr Phe Gly Leu                325                 330                 335Gly Asp Asp Pro Ile Leu Pro Ser Ala Gly Pro Tyr Gln Ser Gln Phe            340                 345                 350Thr Phe Ser Pro Ser Glu Ser Pro Met Ala Ser Gly His Pro Phe Ala        355                 360                 365Asn Leu Tyr Ser His Thr Pro Val Ala Ser Ser Leu Asn Ser Thr Asp    370                 375                 380Phe Phe Ser Pro Pro Pro Ser Gly Tyr Gln Ser Thr Ala Ser Thr Pro385                 390                 395                 400Gln Pro Thr Tyr Asp Gly Asp His Ser Val Tyr Phe Asp Met Pro Ser                405                 410                 415Gly Asp Ala Arg Thr Gln Arg Arg Ile Pro Asn Tyr Ile Ser His Arg            420                 425                 430Ser Asn Leu Ser Ala Ser Leu Gln Pro Arg Tyr Met Phe Asn Gln Asn        435                 440                 445Asn His Glu Gln Ala Ser Ser Ser Thr Val His Ser Pro Ser Tyr Pro    450                 455                 460Ile Pro Gln Pro Gln His Val Asp Pro Thr Gln Val Leu Asn Ala Thr465                 470                 475                 480Asn Tyr Ser Thr Gly Asn Ser His His Thr Gly Ala Met Phe Ser Phe                485                 490                 495Gly Ala Asp Ser Asp Asn Glu Asp Asp Asp Gly His Gln Leu Ser Glu            500                 505                 510Arg Ala Gly Leu Ala Met Pro Thr Glu Tyr Gly Asp Glu Asp Gly Phe        515                 520                 525Ser Ser Gly Met Gln Trp Asp Gly Gln Phe Pro Gly Ser Phe His Ser    530                 535                 540Leu Pro Gly Phe Gly Pro Gln His Arg Lys His Val Thr Ile Gly Ser545                 550                 555                 560Thr Asp Met Met Asp Thr Pro Glu Glu Trp Asn His Gly Gly Ser Leu                565                 570                 575Gly Arg Thr His Gly Ser Val Ala Ser Val Ser Glu Val Arg Asn Arg            580                 585                 590Glu Gln Asp Pro Arg Arg Gln Lys Ile Ala Arg Thr Thr Ser Thr Pro        595                 600                 605Asn Thr Ala Gln Leu Leu Arg Gln Ser Met His Ser Asn Asn Asn Thr    610                 615                 620Ser His Thr Ser Pro Asn Thr Pro Pro Glu Ser Ala Leu Ser Ser Ala625                 630                 635                 640Val Pro Ser Arg Pro Ala Ser Pro Gly Gly Ser Lys Asn Gly Asp Gln

                645                 650                 655Gly Ser Asn Gly Pro Thr Thr Cys Thr Asn Cys Phe Thr Gln Thr Thr            660                 665                 670Pro Leu Trp Arg Arg Asn Pro Glu Gly Gln Pro Leu Cys Asn Ala Cys        675                 680                 685Gly Leu Phe Leu Lys Leu His Gly Val Val Arg Pro Leu Ser Leu Lys    690                 695                 700Thr Asp Val Ile Lys Lys Arg Asn Arg Ser Ser Ala Asn Ser Leu Ala705                 710                 715                 720Val Gly Thr Ser Arg Ala Ser Lys Lys Thr Ala Arg Lys Asn Ser Val                725                 730                 735Gln Gln Ala Ser Val Thr Thr Pro Thr Ser Ser Arg Ala Gln Asn Gly            740                 745                 750Thr Ser Phe Glu Ser Pro Pro Ala Gly Phe Ser Ala Ala Ala Gly Arg        755                 760                 765Ser Asn Gly Val Val Pro Ile Ala Ala Ala Pro Pro Lys Ala Ala Pro    770                 775                 780Ser Ala Ala Ala Ser Pro Ser Thr Gly Gln Thr Arg Asn Pro Ile Gln785                 790                 795                 800Ala Ala Pro Lys Arg Gln Arg Arg Leu Glu Lys Ala Thr Glu Met Glu                805                 810                 815Thr Asp Glu Ala Asn Lys Ser Ala Gly Gly Arg Ser Lys Val Val Pro            820                 825                 830Leu Ala Pro Ala Met Pro Pro Ala Ala Ala Asn Pro Ala Asn His Ser        835                 840                 845Ile Ala Gly Gly Gln Gly Ala Ser Gln Glu Trp Glu Trp Leu Thr Met    850                 855                 860Ser Leu865(2)SEQ ID NO：7的信息：

    (i)序列特征：

      (A)长度：27个核苷酸

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线性

    (ii)分子类型：DNA引物19819

    (iii)假设：是

    (iii)反义：否

    (xi)序列描述：SEQ ID NO：7GAAGATCTGC GCGGATGTAC ATTGTAG    27(2)SEQ ID NO：8的信息：

    (i)序列特征：

      (A)长度：20个核苷酸

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线性

    (ii)分子类型：DNA引物19821

    (iii)假设：是

    (iii)反义：否

    (xi)序列描述：SEQ ID NO：8TTAGTCAGAA ATTCGTCCCG            20(2)SEQ ID NO：9的信息：

    (i)序列特征：

      (A)长度：30个核苷酸

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线性

    (ii)分子类型：DNA引物19820

    (iii)假设：是

    (iii)反义：否

    (xi)序列描述：SEQ ID NO：9CCCAAGCTTC ATGCTCGACC AGGGCCTCCT    30(2)SEQ ID NO：10的信息：

    (i)序列特征：

      (A)长度：21个核苷酸

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线性

    (ii)分子类型：DNA引物19818

    (iii)假设：是

    (iii)反义：否

    (xi)序列描述：SEQ ID NO：10GGTCTGTGTT AACCAAAGAA C             21(2)SEQ ID NO：11的信息：

    (i)序列特征：

      (A)长度：14个核苷酸

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线性

    (ii)分子类型：DNA引物8681

    (iii)假设：是

    (iii)反义：否

    (xi)序列描述：SEQ ID NO：11GATCCACCAT GAAG                     14(2)SEQ ID NO：12的信息：

    (i)序列特征：

      (A)长度：14个核苷酸

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线性

    (ii)分子类型：DNA引物8747

    (iii)假设：是

    (iii)反义：否

    (xi)序列描述：SEQ ID NO：12GTGGTACTTC AGCT            14