BOTRYOSPHAERIARHODINA的多肽.pdf

上传人:32 文档编号:341930 上传时间:2018-02-10 格式:PDF 页数:116 大小:5.20MB
返回 下载 相关 举报
摘要
申请专利号:

CN201010261316.8

申请日:

2005.08.06

公开号:

CN101942428A

公开日:

2011.01.12

当前法律状态:

撤回

有效性:

无权

法律详情:

发明专利申请公布后的视为撤回IPC(主分类):C12N 9/42申请公布日:20110112|||实质审查的生效IPC(主分类):C12N 9/42申请日:20050806|||公开

IPC分类号:

C12N9/42; C12N15/56; C12N15/63; C12N1/15; C12N1/19; C12N1/21; C12N5/10; C11D3/386; A23K1/165; A23L1/305; A01N63/04; A01P15/00; D21C9/00

主分类号:

C12N9/42

申请人:

诺维信公司

发明人:

柯克·M·施诺尔; 莱纳·兰格; 珀尼尔·U·博尔韦格

地址:

丹麦鲍斯韦

优先权:

2004.08.06 DK PA200401197; 2004.08.11 DK PA200401215

专利代理机构:

北京市柳沈律师事务所 11105

代理人:

封新琴;史悦

PDF下载: PDF下载
内容摘要

本发明涉及Botryosphaeria Rhodina的多肽,更具体地,本发明涉及自Botryosphaeria rhodina CBS 274.96分泌的功能性多肽。

权利要求书

1: 分离的木聚糖酶, 其包括氨基酸序列, 所述氨基酸序列与 SEQ ID NO : 4 中所包括的 成熟多肽序列具有至少 90%的同一性。
2: 分离的木聚糖酶, 其包括氨基酸序列, 所述氨基酸序列与以 CBS 保藏登录号 274.96 保藏的 Botryosphaeria rhodina 菌株所分泌的 GH11 木聚糖酶成熟酶的氨基酸序列具有至 少 90%的同一性。
3: 权利要求 1 或 2 的木聚糖酶, 其包含氨基酸序列, 所述氨基酸序列与 SEQ ID NO : 4的 氨基酸 1-202 具有至少 90%的同一性。 4. 权利要求 3 的木聚糖酶, 其具有氨基酸序列, 所述氨基酸序列与 SEQID NO : 4 的氨基 酸 1-202 具有至少 95%的同一性。 5. 权利要求 3 的木聚糖酶, 其由 SEQ ID NO : 4 的氨基酸 1-202 组成。 6. 多核苷酸, 其包含编码权利要求 3 中所定义的木聚糖酶的核苷酸序列。 7. 核酸构建体, 其包含权利要求 6 中定义的核苷酸序列, 该核苷酸序列与一种或多种 指导所述木聚糖酶在宿主细胞中生产的调控序列可操作地连接。 8. 重组表达载体, 其包含权利要求 7 的核酸构建体。 9. 重组宿主细胞, 其包含权利要求 7 的核酸构建体。 10. 生产权利要求 3 的木聚糖酶的方法, 其包含 : a. 培养菌株以产生所述木聚糖酶, 其中所述菌株的野生型形式能够产生该木聚糖酶 ; 及 b. 回收该木聚糖酶。 11. 生产权利要求 3 的木聚糖酶的方法, 其包含 : c. 在有助于产生所述木聚糖酶的条件下, 培养权利要求 9 中定义的重组宿主细胞 ; 及 d. 回收该木聚糖酶。 12. 组合物, 其包含权利要求 3 的木聚糖酶和赋形剂。 13. 制备权利要求 12 的组合物的方法, 其包含将权利要求 1 的木聚糖酶与赋形剂混合。
4: 96 保藏的 Botryosphaeria rhodina 菌株所分泌的 GH11 木聚糖酶成熟酶的氨基酸序列具有至 少 90%的同一性。 3. 权利要求 1 或 2 的木聚糖酶, 其包含氨基酸序列, 所述氨基酸序列与 SEQ ID NO : 4的 氨基酸 1-202 具有至少 90%的同一性。 4. 权利要求 3 的木聚糖酶, 其具有氨基酸序列, 所述氨基酸序列与 SEQID NO : 4 的氨基 酸 1-202 具有至少 95%的同一性。
5: 权利要求 3 的木聚糖酶, 其由 SEQ ID NO : 4 的氨基酸 1-202 组成。
6: 多核苷酸, 其包含编码权利要求 3 中所定义的木聚糖酶的核苷酸序列。
7: 核酸构建体, 其包含权利要求 6 中定义的核苷酸序列, 该核苷酸序列与一种或多种 指导所述木聚糖酶在宿主细胞中生产的调控序列可操作地连接。
8: 重组表达载体, 其包含权利要求 7 的核酸构建体。
9: 重组宿主细胞, 其包含权利要求 7 的核酸构建体。
10: 生产权利要求 3 的木聚糖酶的方法, 其包含 : a. 培养菌株以产生所述木聚糖酶, 其中所述菌株的野生型形式能够产生该木聚糖酶 ; 及 b. 回收该木聚糖酶。
11: 生产权利要求 3 的木聚糖酶的方法, 其包含 : c. 在有助于产生所述木聚糖酶的条件下, 培养权利要求 9 中定义的重组宿主细胞 ; 及 d. 回收该木聚糖酶。
12: 组合物, 其包含权利要求 3 的木聚糖酶和赋形剂。
13: 制备权利要求 12 的组合物的方法, 其包含将权利要求 1 的木聚糖酶与赋形剂混合。

说明书


Botryosphaeria Rhodina 的多肽

     本申请是申请日为 2005 年 08 月 06 日、 申请号为 200580034120.2( 国际申请号为 PCT/DK2005/000519)、 发明名称为 “Botryosphaeria Rhodina 的多肽” 的发明申请的分案申 请。发明领域
     本发明涉及由以保藏号 CBS 274.96 保藏的棉色二孢 (Diplodia gossypina), 异 名为 Botryospaeria rhodina 的 mRNA 中包含的多核苷酸所编码的功能性多肽。本发明还 涉及编码这些多肽或有助于它们表达的多核苷酸或这些多核苷酸的构建体, 以及制备该多 肽的方法。本发明还涉及包含该多肽的组合物和该多肽的用途。 背景技术 Botryosphaeria rhodina(Berk.&M.A.Curtis)Arx, ( 异 名 Diplodia gossypina Cooke)。目前已发表的关于这种生物的特征描述的报道非常少 ; Selbmann 等在 2003 年 报道了 Botryosphaeria rhodina 的外泌多糖 (exopolysaccharide) 生产 (Selbmann L, Stingele F 和 Petruccioli M(2003).Exopolysaccharide production by filamentous fungi : the example of Botryosphaeria rhodina.Antonie van Leeuwenhoek, 84 : 2, pp.135-145)。有单独的一篇专利涉及使用 Botryosphaeria rhodina 羟化 β- 二氢大马 酮作为烟草的增香剂 (CH654567-A)。通过发酵该生物还可以生产茉莉酸 (EP1118672-A)。 先前已报道了纤维二糖水解酶 (cellobiohydrolases)(WO 03/000941-A2) 和乳糖酶 (WO 01/49878-A) 的存在。
     在新酶的探寻中, 还知道通过对可能的候选物进行特定的酶测定来筛选这样的新 酶。该方法受酶测定的可用性的限制, 而且不能鉴定活性尚未知的功能性酶或多肽。
     另外, 全基因测序 (whole genome sequencing) 是一种获得来自特定的微生物 的所有基因上的信息的已知方法, 例如 Fleischmann 等 ; Whole genome sequences and assembly of Haemophilus influenzae Rd ; Nature 269 : 496-512 ; (1995) 描述的那样。
     工业上应用的大多数酶都是被微生物分泌到介质中的酶。但是, 微生物的基因组 只有百分之几是编码分泌蛋白质的。例如, 枯草芽孢杆菌 (Bacillus subtilis) 基因组或 其最接近的亲缘物种只有 4 %是编码分泌蛋白质的。(Van Dijl 等 : Protein transport pathways in Bacillus subtilis : a ge-nome-based road map ; 于″ Basillus subtilis and it′ s closest relatives″ -From genes to cells ; p.337-355 ; A.L.Sonenshein 编 ; ASM Press 2002)。
     基因组测序的缺点之一是所得序列的绝大部分是编码非分泌蛋白质的。
     特别地, 对于真核生物例如真菌而言, 基因组测序的另一个缺点是基因组的大小 比细菌基因组大很多倍, 从而通过这种方法来发现基因要耗费更多的成本和时间。
     cDNA 随机测序 ( 表达序列标签, 或称 EST) 是另一种可以发现分泌蛋白质的手段。 一般地, 就分泌蛋白的鉴定而言 EST 方法有两个缺点 : 1) 取决于被测序的 cDNA 文库所用的
     诱导条件, 只有很少的 cDNA, 通常为 0.5% -15%或甚至 1-5%的 cDNA 编码分泌蛋白质 ; 2) 所有的克隆都来自 cDNA 池 (pool), 该 cDNA 池是从这些在生物中与各个特定的基因成比例 地存在的 mRNA 得来的。
     另一种已知的方法是信号捕捉 (signal trapping), 该方法通过与自身缺少信号 的胞外报道基因翻译融合, 来鉴定编码信号肽的基因包括核苷酸。
     发明概述
     微生物的基因组包含成千上万种不同的基因, 其中一些编码多肽, 一些编码 RNA。 微生物基因组中只有有限数量的基因编码这样的功能性多肽, 它们被该微生物分泌到介质 中以实现其外部功能。
     这些多肽能够以显著的量在连续的过程中生产, 而不破坏产生这些多肽的细胞, 从这一点看它们在工业上是令人感兴趣的。
     本发明的目的是鉴定和提供由以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 分泌的、 对 Botryosphaeria rhodina 起功能性作用的多肽, 因为这些多肽不仅可 用于工业用途, 而且可以以工业相关的过程 / 方法和产量生产。
     本发明在第一个方面中提供分离的多肽, 其选自 : (a) 包含氨基酸序列的多肽, 所述氨基酸序列与由 SEQ ID NO : 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30 32, 34, 36, 38, 40 和 42 构成的组的中所包含的成熟多肽具有至 少 90%的同一性 ;
     (b) 由核苷酸序列所编码的多肽, 该核苷酸序列在高度严紧条件下与多核苷酸探 针杂交, 所述多核苷酸探针选自 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列选自 SEQ ID NO : 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 39, 31, 33, 35, 37, 39 和 41 的编码成熟多肽的区域,
     (ii) 核苷酸序列中所包含的 cDNA 序列的互补链, 所述核苷酸序列选自 SEQ ID NO : 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 39, 31, 33, 35, 37, 39 和 41 的编码成熟多肽 的区域,
     其中所述多肽具有由 SEQ ID NO : 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40 和 42 构成的组中所包含的相应成熟多肽的功能。
     本发明的另一个方面涉及分离的酶, 其选自 :
     (a) 包含氨基酸序列的酶, 所述氨基酸序列与选自以 CBS 保藏号 274.96 保藏的 Botryosphaeria rhodina 菌株所分泌的木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶 (endo-arabinase) 和胃蛋白酶肽酶的成熟酶的氨基酸序列具有至少 90%的同一性。
     (b) 由核苷酸序列编码的多肽, 该核苷酸序列在高度严紧条件下与选自下列的多 核苷酸探针杂交 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列包含于以 CBS 保藏号 274.96 保藏的 Botryosphaeria rhodina 菌株中, 并编码成熟酶, 该成熟酶选自该菌株所分泌的木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖 苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶,
     (ii) 核苷酸序列所包含的 cDNA 序列的互补链, 所述核苷酸序列包含于以 CBS 保藏
     号 274.96 保藏的 Botryosphaeria rhodina 菌株中, 并编码成熟酶, 该成熟酶选自该菌株所 分泌的木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶 ;
     其中所述酶具有选自木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多 肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶的功能。
     本发明的另外的方面提供编码本发明多肽的多核苷酸 ; 包含编码该多肽的多核苷 酸的核苷酸构建体, 其中所述多核苷酸与一种或多种指导该多肽在宿主细胞中生产的调控 序列可操作地连接 ; 包含本发明的核苷酸构建体的重组表达载体, 和包含本发明的核苷酸 构建体的重组宿主细胞。
     本发明的另一个方面提供制备本发明的多肽的方法, 包括 :
     (a) 培养包含编码本发明多肽的核苷酸序列的株系以产生所述多肽, 其中所述株 系能够表达并分泌该多肽 ; 及
     (b) 回收该多肽。
     本发明的另外的方面提供包含本发明的多肽的组合物, 以及制备这样的组合物的 方法, 包括将本发明的多肽与赋形剂混合。
     本发明的另外的方面提供本发明的多肽或包含所述多肽的组合物在多种应用中 的用途。
     具体地, 本发明还涉及如下方面 :
     1. 选自下组的分离多肽 :
     (a) 包含氨基酸序列的多肽, 所述氨基酸序列与由 SEQ ID NO : 2, SEQ ID NO : 4, SEQ ID NO : 6, SEQ ID NO : 8, SEQ ID NO : 10, SEQ ID NO : 12, SEQ ID NO : 14, SEQ ID NO : 16, SEQ ID NO : 18, SEQ ID NO : 20, SEQ ID NO : 22, SEQ ID NO : 24, SEQ ID NO : 26, SEQ ID NO : 28, SEQ ID NO : 30, SEQ ID NO : 32, SEQ ID NO : 34, SEQ ID NO : 36, SEQ ID NO : 38, SEQ ID NO : 40 和 SEQ ID NO : 42 构成的组中所包含的成熟多肽的序列具有至少 90%的同一性,
     (b) 由核苷酸序列所编码的多肽, 该核苷酸序列在高度严紧条件下与选自下组多 核苷酸探针杂交 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列选自 SEQ ID NO : 1, SEQ ID NO : 3, SEQ ID NO : 5, SEQ ID NO : 7, SEQ ID NO : 9, SEQ ID NO : 11, SEQ ID NO : 13, SEQ ID NO : 15, SEQ ID NO : 17, SEQ ID NO : 19, SEQ ID NO : 21, SEQ ID NO : 23, SEQ ID NO : 25, SEQ ID NO : 27, SEQ ID NO : 29, SEQ ID NO : 31, SEQ ID NO : 33, SEQ ID NO : 35, SEQ ID NO : 37, SEQ ID NO : 39 和 SEQ ID NO : 41 的编码成熟多肽的区域,
     (ii) 核苷酸序列中所包含的 cDNA 序列的互补链, 所述核苷酸序列选自 SEQ ID NO : 1, SEQ ID NO : 3, SEQ ID NO : 5, SEQ ID NO : 7, SEQ ID NO : 9, SEQ ID NO : 11, SEQ ID NO : 13, SEQ ID NO : 15, SEQ ID NO : 17, SEQ ID NO : 19, SEQ ID NO : 21, SEQ ID NO : 23, SEQ ID NO : 25, SEQ ID NO : 27, SEQ ID NO : 29, SEQ ID NO : 31, SEQ ID NO : 33, SEQ ID NO : 35, SEQ ID NO : 37, SEQ ID NO : 39 和 SEQ ID NO : 41 的编码成熟多肽的区域,
     其中所述多肽具有由 SEQ ID NO : 2, SEQ ID NO : 4, SEQ ID NO : 6, SEQ ID NO : 8, SEQ ID NO : 10, SEQ ID NO : 12, SEQ ID NO : 14, SEQ ID NO : 16, SEQ ID NO : 18, SEQ ID NO : 20, SEQ ID NO : 22, SEQ ID NO : 24, SEQ ID NO : 26, SEQ ID NO : 28, SEQ ID NO : 30, SEQ IDNO : 32, SEQ ID NO : 34, SEQ ID NO : 36, SEQ ID NO : 38, SEQ ID NO : 40 和 SEQ ID NO : 42 构 成的组中所包含的相应成熟多肽的功能。
     2. 选自下组的分离的酶 :
     (a) 包含氨基酸序列的酶, 所述氨基酸序列与选自以 CBS 保藏登录号 274.96 保藏 的 Botryosphaeria rhodina 菌株所分泌的木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多 肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽 酶的成熟酶的氨基酸序列具有至少 90%的同一性。
     (b) 由核苷酸序列编码的多肽, 该核苷酸序列在高度严紧条件下与选自下列的多 核苷酸探针杂交 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列包含于以 CBS 保藏登录号 274.96 保藏 的 Botryosphaeria rhodina 菌株中, 并编码成熟酶, 该成熟酶选自该菌株所分泌的木聚糖 酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡 糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶,
     (ii) 核苷酸序列所含 cDNA 序列的互补链, 所述核苷酸序列包含于以 CBS 保藏登录 号 274.96 保藏的 Botryosphaeria rhodina 菌株中, 并编码成熟酶, 该成熟酶选自该菌株所 分泌的木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶 ; 其中所述酶具有选自木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多 肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶的功能。
     3. 项 1 或 2 的多肽, 其选自 :
     (a) 包含氨基酸序列的多肽, 所述氨基酸序列与选自下列的序列具有至少 90%的 同一性 :
     SEQ ID NO : 2 的氨基酸 1-291 ; SEQ ID NO : 4 的 1-202 ; SEQ ID NO : 6 的氨基酸 1-352 ; SEQ ID NO : 8 的氨基酸 1-431 ; SEQ ID NO : 10 的氨基酸 1-185 ; SEQ ID NO : 12 的氨 基酸 1-218 ; SEQ ID NO : 14 的氨基酸 1-249 ; SEQ ID NO : 16 的 1-255 ; SEQ ID NO : 18 的氨基 酸 1-205 ; SEQ ID NO : 20 的氨基酸 1-243 ; SEQ ID NO : 22 的氨基酸 1-415 ; SEQ ID NO : 24 的 氨基酸 1-377 ; SEQ ID NO : 26 的氨基酸 1-259 ; SEQ ID NO : 28 的氨基酸 1-248 ; SEQ ID NO : 30 的氨基酸 1-149 ; SEQ ID NO : 32 的氨基酸 1-202 ; SEQ ID NO : 34 的氨基酸 1-603 ; SEQ ID NO : 36 的氨基酸 1-301 ; SEQ ID NO : 38 的氨基酸 1-438 ; SEQ ID NO : 40 的氨基酸 1-396 ; 和 SEQ ID NO : 42 的氨基酸 1-262 ;
     (b) 由核苷酸序列编码的多肽, 所述核苷酸序列在高度严紧条件下与选自下列的 多核苷酸杂交 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列选自 SEQ ID NO : 1 的核苷酸 55-927、 SEQ ID NO : 3 的核苷酸 58-663、 SEQ ID NO : 5 的核苷酸 55-1110、 SEQ ID NO : 7 的核苷酸 55-1347、 SEQ ID NO : 9 的核苷酸 1-555、 SEQ ID NO : 11 的核苷酸 49-702、 SEQ ID NO : 13 的 核苷酸 40-786、 SEQ ID NO : 15 的核苷酸 55-819、 SEQ ID NO : 17 的核苷酸 61-675、 SEQ ID NO : 19 的核苷酸 1-729、 SEQ ID NO : 21 的核苷酸 55-1299、 SEQ ID NO : 23 的核苷酸 49-1179、 SEQ ID NO : 25 的核苷酸 70-846、 SEQ ID NO : 27 的核苷酸 58-810、 SEQ ID NO : 31 的核苷酸 55-660、 SEQ ID NO : 33 的核苷酸 46-1854、 SEQ ID NO : 35 的核苷酸 64-966、 SEQ ID NO : 37
     的核苷酸 55-1368、 SEQ ID NO : 39 的核苷酸 61-1248, 和 SEQ ID NO : 41 的核苷酸 64-849 ;
     (ii) 核苷酸序列中所包含的 cDNA 序列的互补链, 所述核苷酸序列选自 : SEQ ID NO : 1 的核苷酸 55-927、 SEQ ID NO : 3 的核苷酸 58-663、 SEQ ID NO : 5 的核苷酸 55-1110、 SEQ ID NO : 7 的核苷酸 55-1347、 SEQ ID NO : 9 的核苷酸 1-555、 SEQ ID NO : 11 的核苷酸 49-702、 SEQ ID NO : 13 的核苷酸 40-786、 SEQ ID NO : 15 的核苷酸 55-819、 SEQ ID NO : 17 的核苷酸 61-675、 SEQ ID NO : 19 的核苷酸 1-729、 SEQ ID NO : 21 的核苷酸 55-1299、 SEQ ID NO : 23 的 核苷酸 49-1179、 SEQ ID NO : 25 的核苷酸 70-846、 SEQ ID NO : 27 的核苷酸 58-810、 SEQ ID NO : 31 的核苷酸 55-660、 SEQ ID NO : 33 的核苷酸 46-1854、 SEQ ID NO : 35 的核苷酸 64-966、 SEQ ID NO : 37 的核苷酸 55-1368、 SEQ ID NO : 39 的核苷酸 61-1248, 和 SEQ ID NO : 41 的核 苷酸 64-849。
     4. 项 3 的多肽, 其中所述多肽是酶, 所述酶选自具有这样的氨基酸序列的多肽 : 所述氨基酸序列与选自下列的氨基酸序列具有至少 95%的同一性 : SEQ ID NO : 2 的氨基 酸 1-291 ; SEQ ID NO : 4 的 1-202 ; SEQ ID NO : 6 的氨基酸 1-352 ; SEQ ID NO : 8 的氨基酸 1-431 ; SEQ ID NO : 10 的氨基酸 1-185 ; SEQ ID NO : 12 的氨基酸 1-218 ; SEQ ID NO : 14 的氨 基酸 1-249 ; SEQ ID NO : 16 的 1-255 ; SEQ ID NO : 18 的氨基酸 1-205 ; SEQ ID NO : 20 的氨基 酸 1-243 ; SEQ ID NO : 22 的氨基酸 1-415 ; SEQ ID NO : 24 的氨基酸 1-377 ; SEQ ID NO : 26 的 氨基酸 1-259 ; SEQ ID NO : 28 的氨基酸 1-248 ; SEQ ID NO : 30 的氨基酸 1-149 ; SEQ ID NO : 32 的氨基酸 1-202 ; SEQ ID NO : 34 的氨基酸 1-603 ; SEQ ID NO : 36 的氨基酸 1-301 ; SEQ ID NO : 38 的氨基酸 1-438 ; SEQ ID NO : 40 的氨基酸 1-396 ; 和 SEQ ID NO : 42 的氨基酸 1-262。 5. 项 4 的多肽, 其中该多肽是酶, 所述酶选自由这样的核苷酸序列所编码的多肽, 所述核苷酸序列在极高严紧条件下与选自下列的多核苷酸杂交 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列选自 : SEQ ID NO : 1 的核苷酸 55-927、 SEQ ID NO : 3 的核苷酸 58-663、 SEQ ID NO : 5 的核苷酸 55-1110、 SEQ ID NO : 7 的核苷酸 55-1347、 SEQ ID NO : 9 的核苷酸 1-555、 SEQ ID NO : 11 的核苷酸 49-702、 SEQ ID NO : 13 的 核苷酸 40-786、 SEQ ID NO : 15 的核苷酸 55-819、 SEQ ID NO : 17 的核苷酸 61-675、 SEQ ID NO : 19 的核苷酸 1-729、 SEQ ID NO : 21 的核苷酸 55-1299、 SEQ ID NO : 23 的核苷酸 49-1179、 SEQ ID NO : 25 的核苷酸 70-846、 SEQ ID NO : 27 的核苷酸 58-810、 SEQ ID NO : 31 的核苷酸 55-660、 SEQ ID NO : 33 的核苷酸 46-1854、 SEQ ID NO : 35 的核苷酸 64-966、 SEQ ID NO : 37 的核苷酸 55-1368、 SEQ ID NO : 39 的核苷酸 61-1248, 和 SEQ ID NO : 41 的核苷酸 64-849 ; 和
     (ii) 核苷酸序列中所包含的 cDNA 序列的互补链, 所述核苷酸序列选自 : SEQ ID NO : 1 的核苷酸 55-927、 SEQ ID NO : 3 的核苷酸 58-663、 SEQ ID NO : 5 的核苷酸 55-1110、 SEQ ID NO : 7 的核苷酸 55-1347、 SEQ ID NO : 9 的核苷酸 1-555、 SEQ ID NO : 11 的核苷酸 49-702、 SEQ ID NO : 13 的核苷酸 40-786、 SEQ ID NO : 15 的核苷酸 55-819、 SEQ ID NO : 17 的核苷酸 61-675、 SEQ ID NO : 19 的核苷酸 1-729、 SEQ ID NO : 21 的核苷酸 55-1299、 SEQ ID NO : 23 的 核苷酸 49-1179、 SEQ ID NO : 25 的核苷酸 70-846、 SEQ ID NO : 27 的核苷酸 58-810、 SEQ ID NO : 31 的核苷酸 55-660、 SEQ ID NO : 33 的核苷酸 46-1854、 SEQ ID NO : 35 的核苷酸 64-966、 SEQ ID NO : 37 的核苷酸 55-1368、 SEQ ID NO : 39 的核苷酸 61-1248, 和 SEQ ID NO : 41 的核 苷酸 64-849。
     6. 项 3 的多肽, 其中所述多核苷酸编码由选自下列的多肽所组成的多肽 : SEQ ID NO : 2 的氨基酸 1-291 ; SEQ ID NO : 4 的 1-202 ; SEQ ID NO : 6 的氨基酸 1-352 ; SEQ ID NO : 8 的氨基酸 1-431 ; SEQ ID NO : 10 的氨基酸 1-185 ; SEQ ID NO : 12 的氨基酸 1-218 ; SEQ ID NO : 14 的氨基酸 1-249 ; SEQ ID NO : 16 的 1-255 ; SEQ ID NO : 18 的氨基酸 1-205 ; SEQ ID NO : 20 的氨基酸 1-243 ; SEQ ID NO : 22 的氨基酸 1-415 ; SEQ ID NO : 24 的氨基酸 1-377 ; SEQID NO : 26 的氨基酸 1-259 ; SEQ ID NO : 28 的氨基酸 1-248 ; SEQ ID NO : 30 的氨基酸 1-149 ; SEQ ID NO : 32 的氨基酸 1-202 ; SEQ ID NO : 34 的氨基酸 1-603 ; SEQ ID NO : 36 的氨基酸 1-301 ; SEQ ID NO : 38 的氨基酸 1-438 ; SEQ ID NO : 40 的氨基酸 1-396 ; 和 SEQ ID NO : 42 的氨基酸 1-262。
     7. 项 3 的多肽, 其中所述多肽是 GH10 木聚糖酶, 所述 GH10 木聚糖酶包含氨基酸序 列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获 得的 GH10 木聚糖酶具有至少 90%的同一性。
     8. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 2 的氨基酸 1-291 的 GH10 木聚糖 酶。
     9. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 2 的氨基酸 1-291 组成的 GH10 木聚 糖酶。 10. 项 3 的多肽, 其中所述多肽是 GH11 木聚糖酶, 所述 GH11 木聚糖酶包含氨基酸 序列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的 GH11 木聚糖酶具有至少 90%的同一性。
     11. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 4 的氨基酸 1-202 的 GH11 木聚糖 酶。
     12. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 4 的氨基酸 1-202 组成的 GH11 木聚 糖酶。
     13. 项 3 的多肽, 其中该多肽是丝氨酸酯酶, 所述丝氨酸酯酶包含氨基酸序列, 所 述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的丝 氨酸酯酶具有至少 90%的同一性。
     14. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 6 的氨基酸 1-352 的丝氨酸酯酶。
     15. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 6 的氨基酸 1-352 组成的丝氨酸酯 酶。
     16. 项 3 的多肽, 其中该多肽是脂肪酶, 所述脂肪酶包含氨基酸序列, 所述氨基酸 序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的丝氨酸酯酶 具有至少 90%的同一性。
     17. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 8 的氨基酸 1-431 的脂肪酶。
     18. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 8 的氨基酸 1-431 组成的脂肪酶。
     19. 项 3 的多肽, 其中该多肽是过氧化物酶, 所述过氧化物酶包含与可从以保藏登 录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的过氧化物酶具有至少 90%的同一 性的氨基酸序列。
     20. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 10 的氨基酸 1-185 的过氧化物酶。
     21. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 10 的氨基酸 1-185 组成的过氧化物
     酶。 22. 项 3 的多肽, 其中该多肽是 GH 61A 多肽, 所述 GH 61A 多肽包含氨基酸序列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的 GH 61A 多肽具有至少 90%的同一性。
     23. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 12 的氨基酸 1-218 的 GH 61A 多 肽。
     24. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 12 的氨基酸 1-218 组成的 GH 61A 多 肽。
     25. 项 3 的多肽, 其中该多肽是 GH 61B 多肽, 所述 GH 61B 多肽包含氨基酸序列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的 GH 61B 多肽具有至少 90%的同一性。
     26. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 14 的氨基酸 1-249 的 GH 61B 多 肽。
     27. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 14 的氨基酸 1-249 组成的 GH 61B 多 肽。
     28. 项 3 的多肽, 其中该多肽是 GH 61C 多肽, 所述 GH 61C 多肽包含氨基酸序列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的 GH 61C 多肽具有至少 90%的同一性。
     29. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 16 的氨基酸 1-255 的 GH 61C 多 肽。
     30. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 16 的氨基酸 1-255 组成的 GH 61C 多 肽。
     31. 项 3 的多肽, 其中该多肽是 GH 61D 多肽, 所述 GH 61D 多肽包含氨基酸序列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的 GH 61D 多肽具有至少 90%的同一性。
     32. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 18 的氨基酸 1-205 的 GH 61D 多 肽。
     33. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 18 的氨基酸 1-205 组成的 GH 61D 多 肽。
     34. 项 3 的多肽, 其中该多肽是 β- 葡糖苷酶, 所述 β- 葡糖苷酶包含氨基酸序列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的 β- 葡糖苷酶具有至少 90%的同一性。
     35. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 34 的氨基酸 1-603 的 β- 葡糖苷 酶。
     36. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 34 的氨基酸 1-603 组成的 β- 葡糖 苷酶。
     37. 项 3 的多肽, 其中该多肽是内切阿拉伯糖酶, 所述内切阿拉伯糖酶包含氨基酸 序列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的内切阿拉伯糖酶具有至少 90%的同一性。
     38. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 36 的氨基酸 1-301 的内切阿拉伯糖酶。 39. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 36 的氨基酸 1-301 组成的内切阿拉 伯糖酶。
     40. 项 3 的多肽, 其中该多肽是内切阿拉伯糖酶, 所述内切阿拉伯糖酶包含氨基酸 序列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的内切阿拉伯糖酶具有至少 90%的同一性。
     41. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 38 的氨基酸 1-438 的内切阿拉伯 糖酶。
     42. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 38 的氨基酸 1-438 组成的内切阿拉 伯糖酶。
     43. 项 3 的多肽, 其中该多肽是胃蛋白酶肽酶, 所述胃蛋白酶肽酶包含与可从以保 藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的胃蛋白酶肽酶具有至少 90% 的同一性的氨基酸序列。
     44. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 40 的氨基酸 1-396 的胃蛋白酶肽 酶。
     45. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 40 的氨基酸 1-396 组成的胃蛋白酶肽酶。 46. 项 3 的多肽, 其中该多肽是胃蛋白酶肽酶, 所述胃蛋白酶肽酶包含氨基酸序 列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获 得的胃蛋白酶肽酶具有至少 90%的同一性。
     47. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 42 的氨基酸 1-262 的胃蛋白酶肽 酶。
     48. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 42 的氨基酸 1-262 组成的胃蛋白酶 肽酶。
     49. 多核苷酸, 其包含编码项 3 中所定义的多肽的核苷酸序列。
     50. 核酸构建体, 其包含项 49 中定义的核苷酸序列, 该核苷酸序列与一种或多种 指导所述多肽在宿主细胞中生产的调控序列可操作地连接。
     51. 重组表达载体, 其包含项 50 的核酸构建体。
     52. 重组宿主细胞, 其包含项 50 的核酸构建体。
     53. 生产项 3 的多肽的方法, 其包括 :
     a. 培养菌株以产生所述多肽, 其中所述菌株的野生型形式能够产生该多肽 ; 及
     b. 回收该多肽。
     54. 生产项 3 的多肽的方法, 其包括 :
     a. 在有助于产生所述多肽的条件下, 培养项 52 中定义的重组宿主细胞 ; 及
     b. 回收该多肽。
     55. 组合物, 其包含项 3 的多肽和赋形剂。
     56. 制备项 55 的组合物的方法, 其包含将项 1 的多肽与赋形剂混合。
     57. 适于在电子设备中使用的存储介质, 所述电子设备包含项 3 的多肽的氨基酸
     序列的信息。
     58. 适于在电子设备中使用的存储介质, 所述电子设备包含项 49 的多核苷酸的核 酸序列的信息。
     序列表
     本发明包含序列表形式的信息, 其附于本申请中并在连同本申请的数据载体上提 交。数据载体的内容全部通过引用并入本文。选自 SEQ ID NO : 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39 和 41 的序列的编码成熟多肽的区域, 分别编码选自 SEQ ID NO : 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42 的序列的 成熟多肽。 因此 SEQ ID NO : 1 的编码成熟多肽的区域编码 SEQ ID NO : 2 中包含的成熟多肽 序列, SEQ ID NO : 3 的编码成熟多肽的区域编码 SEQ ID NO : 4 中包含的成熟多肽序列, 依此 类推。 附图说明
     图 1 显示 pSigA4 的质粒图。
     发明详述 定义
     如以下所用的, 术语 “ADNA 组” 指由 SEQ ID NO : 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39 和 41 组成的核苷酸序列的组。因此, 当提到包含于或选自 由 “ADNA 组” 组成的序列组 ( 或包含于或选自 “ADNA 组” ) 的核苷酸序列时, 是指该序列包含 于或选自由 SEQ ID NO : 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39 和 41 组成的核苷酸序列的组。
     如以下所用的, 术语 “EDNA 组” 指由 SEQ ID NO : 1, 3, 5, 7, 9, 11, 13, 15, 17, 33, 35, 37, 39 和 41 组成的核苷酸序列的组。因此, 当提到包含于或选自由 “EDNA 组” 组成的序列组 ( 或 包含于或选自 “EDNA 组” ) 的核苷酸序列时, 是指该序列包含于或选自由 SEQ ID NO : 1, 3, 5, 7, 9, 11, 13, 15, 17, 33, 35, 37, 39 和 41 组成的核苷酸序列的组。
     类似地, 如以下所用的, 术语 “B 多肽组” 指由 SEQ ID NO : 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40 和 42 组成的多肽序列的组。因此, 当提到包含于或 选自由 “B 多肽组” 组成的序列组 ( 或包含于或选自 “B 多肽组” ) 的多肽序列时, 是指该序列包 含于或选自由 SEQ ID NO : 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40 和 42 组成的多肽序列的组。
     类似地, 如以下所用的, 术语 “D 多肽组” 指由 SEQ ID NO : 2, 4, 6, 8, 10, 12, 14, 16, 18, 34, 36, 38, 40 和 42 组成的多肽序列的组。因此, 当提到包含于或选自由 “D 多肽组” 组成的序 列组 ( 或包含于或选自 “D 多肽组” ) 的多肽序列时, 是指该序列包含于或选自由 SEQ ID NO : 2, 4, 6, 8, 10, 12, 14, 16, 18, 34, 36, 38, 40 和 42 组成的多肽序列的组。
     本文中使用的术语 “同一性” 理解为两条氨基酸序列或两条核苷酸序列之间的同 源性。对于本发明而言, 同一性程度是使用 Vector NTI 程序 7.1 版 (Informax inc., 7600 Wisconsin Avenue, Suite #1100, Bethesda, MD 20814, USA) 的 AlignX 确定的。氨基酸比 对使用 Clustal W 算法 (Thompson, J.D., Higgins, D.G. 和 Gibson, T.J.(1994)CLUSTAL W : improving the sensitivity of progressive multiple sequence alignment through
     sequence weighting, positions-specific gap penalties and weight matrix choice. Nucleic Acids Research, 22 : 4673-4680) 来生成。 还使用下面的参数 : 缺口生成罚分 (gap opening penalty) 为 10, 缺口延伸罚分 (gap extension penalty) 为 0.05, 缺口分离罚 分范围 (gap separation penalty range) 为 8。配对比对 (pairwise alignment) 参数 为 Ktuple = 1, 缺口罚分 (gap penalty) = 3, 缺口长度生成罚分 (gap length opening penalty) = 10, 缺口延伸罚分= 0.1, 窗口大小 (window size) = 5, 对角线 (diagonals) = 5。 两条核苷酸序列之间同一性程度的确定也是使用如上所述的相同算法和软件包, 例如 用下列的设定 : 缺口罚分为 10, 缺口长度罚分为 10。配对比对参数为 Ktuple = 3, 缺口罚 分= 3, 窗口= 20。
     在本发明的范围内, 术语 “功能性多肽” (functional polypeptide) 是指这样的 多肽, 其可被细胞表达和分泌, 并且构成能够根据其按照细胞设计应实现的功能来运作的 操作单元。可选地, 该多肽要具备预定的功能可能需要辅因子 (co-factors)。功能性多肽 的一个例子是具有催化活性的多肽或酶, 其帮助细胞催化细胞周围环境中的反应。另外的 例子有充当信号物质的多肽。另外的例子还有行使针对环境参数 ( 细胞周围环境中的化学 物质 ) 的传感物 ( 受体 ) 功能的多肽, 或具有抗别的生物的活性的多肽 ( 抗微生物 ( 多 ) 肽 ), 或对细胞的结构完整性作贡献的多肽。 在 本 文 中, 关于氨基酸序列或多肽的部分使用的术语 “成 熟 区 域” (mature region) 是 指 氨 基 酸 序 列 或 多 肽 中 作 为 成 熟 的 功 能 性 多 肽 的 部 分 (portion)、 区域 (region)、 域 (domain) 或区段 (section)。
     本文中使用的术语 “编码成熟多肽的核苷酸序列” 是指从编码成熟多肽的第一个 氨基酸的三联体算起, 直到编码成熟多肽的最后一个氨基酸的三联体的区域。
     在本文中, 关于本发明的特定酶使用的术语 “GH” , 例如 “GH10” , 是由 B.Henrissat 建立的糖基水解酶 (glycosyl hydrolase enzymes) 的家族分类系统。 GH 后面的数字指不同 的家族。 该分类系统对本领域技术人员而言是熟知的。 见 Henrissat B., A classification of glycosyl hydrolases based on amino-acid sequence similarities, Biochem. J.280 : 309-316(1991) ; Henrissat B., Bairoch A, New families in the classification of glycosyl hydrolases based on amino acid sequence similarities, Biochem. J.293 : 781-788(1993) ; Henrissat B., Bairoch A., Updating the sequence-based classification of glycosyl hydrolases, Biochem.J.316 : 695-696(1996) ; Davies G., Henrissat B., Structures and mechanisms of glycosyl hydrolases, Structure 3 : 853-859(1995)。
     本发明的多肽
     本发明的多肽都是被 Botryosphaeria rhodina CBS 274.96 分泌, 以为该特定细 胞执行功能的多肽。
     在 Botryosphaeria rhodina CBS 274.96 基因组中有数千个可能的基因, 其中, 该 基因组的多核苷酸编码 21 种 B 多肽组中所包括的分泌的功能性成熟多肽, 这些多肽已被鉴定 为功能性的, 并被所选的宿主细胞翻译成功能性多肽并分泌。
     因此, Botryosphaeria rhodina CBS 274.96 表达并分泌 B 多肽组中所包括的功能 性成熟多肽, 而且在该特定菌株的基因组中, ADNA 组的序列的编码成熟多肽的区域, 是编码 B
     12101942428 A CN 101942433多肽说明书11/50 页组序列中所包括的成熟多肽的基因。另外在特定的实施方案中, 当培养用包含 ADNA 组的 序列的编码成熟多肽的区域的多核苷酸转化的大肠杆菌 (E.coli) 宿主时, 所有编码 B 多肽组 中所包括的成熟多肽的基因都可以表达, 而且它们相应的成熟多肽可以被分泌。通过比较 这 21 个多肽序列的序列与已知序列的同源性或同一性, 标定了这些多肽的具体功能。 这 21 种分泌的功能性多肽中的至少 14 种被确定是酶和 / 或类似酶。
     因此, 本发明提供选自下列的分离多肽 :
     (a) 具有氨基酸序列的多肽 : 所述氨基酸序列与选自 B 多肽组中所包括的成熟多肽 的氨基酸序列具有至少 90%的同一性 ;
     (b) 由核苷酸序列编码的多肽 : 所述核苷酸序列在高度严紧条件下与选自下列的 多核苷酸探针杂交 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列选自 ADNA 组序列的编码成熟多肽的区 域;
     (ii) 核苷酸序列所包含的 cDNA 序列的互补链, 所述核苷酸序列选自 ADNA 组序列的 编码成熟多肽的区域 ;
     其中该多肽显示相应的 B 多肽组的成熟多肽序列的功能。
     在一个具体的实施方案中, 本发明的多肽选自由本发明人分离并以 CBS 保藏登录 号 (accession No.)274.96 保藏的 Botryosphaeria rhodina 所分泌的酶, 即由木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖 苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶组成的酶组。
     本发明还提供选自下列的分离的酶 :
     (a) 包含这样的氨基酸序列的酶, 所述氨基酸序列与选自以 CBS 保藏号 274.96 保 藏的 Botryosphaeria rhodina 菌株所分泌的木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶 肽酶组成的组中的成熟酶的氨基酸序列具有至少 90%的同一性。
     (b) 由核苷酸序列编码的多肽, 该核苷酸序列在高度严紧条件下与选自下列的多 核苷酸探针杂交 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列包含于以 CBS 保藏号 274.96 保藏的 Botryosphaeria rhodina 菌株中, 并编码成熟酶, 该成熟酶选自该菌株所分泌的木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖 苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶,
     (ii) 核苷酸序列所含 cDNA 序列的互补链, 所述核苷酸序列包含于以 CBS 保藏号 274.96 保藏的 Botryosphaeria rhodina 菌株中, 并编码成熟酶, 该成熟酶选自该菌株所分 泌的木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶 ;
     其中所述酶具有选自木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多 肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶的功能。
     在一个具体的实施方案中, 所述酶是选自下列的分离的酶 :
     (a) 具有与下述氨基酸序列具有至少 90%的同一性的氨基酸序列的酶, 所述氨基 酸序列选自 D 多肽组的序列中所包含的成熟酶 ;(b) 由核苷酸序列编码的酶, 该核苷酸序列在高度严紧条件下与多核苷酸探针杂 交, 所述多核苷酸探针选自 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列选自 EDNA 组序列的编码成熟酶的区域 ;
     (ii) 核苷酸序列所包含的 cDNA 序列的互补链, 所述核苷酸序列选自 EDNA 组序列的 编码成熟酶的区域 ;
     其中该酶显示相应的 D 多肽组的成熟酶的功能。
     本发明的多肽是分离多肽, 优选地, 本发明的多肽的制剂包含最多 90 重量%的可 能与之天然地相伴随的其他多肽物质 ( 更低百分比的其他多肽物质是优选的, 例如最多 80 重量%, 最多 60 重量%, 最多 50 重量%, 最多 40 重量%, 最多 30 重量%, 最多 20 重量%, 最 多 10 重量%, 最多 9 重量%, 最多 8 重量%, 最多 7 重量%, 最多 6 重量%, 最多 5 重量%, 最 多 4 重量%, 最多 3 重量%, 最多 2 重量%, 最多 1 重量%, 及最多 1/2 重量% )。因此, 优选 本发明的分离多肽为 92%纯, 即本发明的多肽构成制剂中存在的所有多肽物质的至少 92 重量%, 且优选更高的重量百分比, 例如至少 94%纯, 至少 95%纯, 至少 96%纯, 至少 96% 纯, 至少 97%纯, 至少 98%纯, 至少 99%纯, 及至多 99.5%纯。特别地本发明的多肽优选是 基本上纯的形式。具体而言, 优选地, 所述多肽是 “基本上 (essentially) 纯的形式” , 即多 肽制备物基本上不含与该多肽天然相伴随的其它多肽物质。 这可通过例如采用熟知的重组 方法制备多肽来实现。
     本发明的多肽可以是合成制造的, 天然存在的, 或其组合。 在一个具体的实施方案 中, 本发明的多肽可以从微生物, 例如原核细胞, 古细菌细胞或真核细胞得到。这些细胞还 可以是已通过基因工程改变的。
     在一个具体的实施方案中, 本发明的多肽是这样的酶, 其在约 10℃到约 80℃, 具 体是在约 20℃到约 60℃的温度下显示最佳酶活性。
     在一个具体的实施方案中, 本发明的多肽是这样的酶, 其在高至 100℃, 具体是高 至 80℃, 更具体是高至 60℃的温度下是功能上稳定的。
     在一个具体的实施方案中, 本发明的多肽是这样的酶, 其显示选自 B 多肽组所包括 的成熟酶的酶的至少 20%, 具体是至少 40%, 例如至少 50%, 具体是至少 60%, 例如至少 70%, 更具体是至少 80%, 例如至少 90%, 更具体是至少 95%, 例如至少 100%的酶活性。
     在一个具体的实施方案中, 本发明的多肽包括, 含有, 或由这样的氨基酸序列组 成: 该氨基酸序列与选自 B 多肽 组所包括的成熟酶的多肽序列具有至少 90 %的同一性, 特 别是至少 95%, 例如至少 96%, 例如至少 97%, 更具体为至少 98%, 例如至少 99%或甚至 100%的同一性。
     在一个具体的实施方案中, 本发明的多肽包括, 含有, 或由这样的氨基酸序列组 成: 该氨基酸序列与选自 B 多肽组所包括的成熟酶的多肽序列具有至少 50%的同一性, 具体 是至少 60%, 具体是至少 65%, 具体是至少 70%, 具体是至少 75%, 具体是至少 80%或更具 体是至少 85%的同一性。
     在一个具体的实施方案中, 本发明的多肽的氨基酸序列与 B 多肽组所包括的成熟酶 具有最多 10 个氨基酸 ( 例如 10 个氨基酸 ), 具体是最多 5 个氨基酸 ( 例如 5 个氨基酸 ), 例如最多 4 个氨基酸 ( 例如 4 个氨基酸 ), 例如最多 3 个氨基酸 ( 例如 3 个氨基酸 ), 具体 是最多 2 个氨基酸 ( 例如 2 个氨基酸 ), 例如 1 个氨基酸的不同。本发明的多肽可以是从天然来源, 例如 Botryosphaeria rhodina CBS 274.96 株 或其他野生型株分离的野生型多肽, 但本发明也涵盖这样的人工变体, 其中本发明的多肽 被突变, 例如通过在保持该多肽的功能和 / 或其他性质的同时, 对所述多肽添加, 置换和 / 或缺失一个或多个氨基酸。
     因此, 本发明的多肽可以是人工变体, 其中, 包含由 B 多肽组所包括的成熟酶, 或由 其所组成的氨基酸序列至少发生了一个氨基酸的置换, 缺失和 / 或插入。
     本发明的多肽还包括本文所述的氨基酸序列的功能性片段和编码本文所述 的氨基酸序列的功能性片段的核酸, 包括如本文所述的以 CBS 保藏号 274.96 保藏的 Botryosphaeria rhodina 株分泌的成熟酶的片段, 包括从所述以 CBS 保藏号 274.96 保藏 的 Botryosphaeria rhodina 株分泌的木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶中选 择的酶的片段。
     人工变体可以使用本领域已知的标准技术构建, 通常随后进行筛选和 / 或性质鉴 定。 标准技术包括经典的诱变, 例如通过对细胞进行紫外照射或用化学诱变剂处理细胞, 如 Gerhardt 等 (1994) 所述的 ; 体内基因改组 (shuffling), 如 WO 97/07205 所述的, 体外改 组, 如 Stemmer, (1994) 或 WO95/17413 所述的, 随机诱变, 如 Eisenstadt E. 等 .(1994) 所述 的; PCR 技术, 例如 Poulsen 等 (1991) 所述的 ; 家族改组 (family shuffling), 如 J.E.Ness 等, Nature Biotechnology, vol.17, pp.893-896(1999) 所述的 ; 定点诱变, 如 Sambrook 等 (1989), Molecular Cloning, A Laboratory Manual, Cold Spring Harbor, NY 所述的。关 于核苷酸置换的一般性描述可见 Ford 等, 1991, Protein Expression and Purification 2, p.95-107。
     这样的标准基因工程方法还可以用来从编码一种或多种本发明的亲本酶 (parent enzyme) 的基因制备多样性的变体核苷酸序列文库, 在合适的宿主细胞中表达这些酶变 体, 并选择合适的变体。多样性的文库可以用多种本领域已知的方法建立 (Reetz MT ; Jaeger KE, 于 Biocatalysis-from Discovery to Application, Fessner WD 编, Vol.200, pp.31-57(1999) ; Stemmer, Nature, vol.370, p.389-391, 1994 ; Zhao 和 Arnold, Proc. Natl.Acad.ScL, USA, vol.94, pp.7997-8000, 1997 ; 或 Yano 等, Proc.Natl.Acad.ScL, USA, vol.95, pp 5511-5515, 1998)。
     在本发明的一个优选的实施方案中, ( 人工变体和野生型酶中的 ) 氨基酸的改变 从性质上说是轻微的, 即其是 : 不显著影响蛋白质的折叠和 / 或活性的保守性的氨基酸置 换; 小的缺失, 通常为 1 到大约 30 个氨基酸 ; 小的氨基或羧基末端延伸, 例如氨基末端的甲 硫氨酸残基 ; 长达大约 20-25 个残基的小接头肽 ; 或通过改变净电荷或其他功能而有助于 纯化的小段延伸 (small extension), 诸如多组氨酸序列段 (poly-histidine tract)、 抗原 性表位 (antigenic epitope)、 或结合域 (binding domain)。
     下面各组中是保守性置换的例子 : 碱性氨基酸 ( 精氨酸、 赖氨酸和组氨酸 )、 酸性 氨基酸 ( 谷氨酸和天冬氨酸 )、 极性氨基酸 ( 谷氨酰胺和天冬酰胺 )、 疏水性氨基酸 ( 亮氨 酸、 异亮氨酸、 缬氨酸和甲硫氨酸 )、 芳香族氨基酸 ( 苯丙氨酸、 色氨酸和酪氨酸 )、 和小氨基 酸 ( 甘氨酸、 丙氨酸、 丝氨酸和苏氨酸 )。一般情况下不改变或损害蛋白质功能的氨基酸置 换是本领域已知的, 例如 H.Neurath 和 R.L.Hill 在 The Proteins 中所述 (1979, AcademicPress, New York)。最常发生的取代是 Ala/Ser、 Val/Ile、 Asp/Glu、 Thr/Ser、 Ala/Gly、 Ala/ Thr、 Ser/Asn、 Ala/Val、 Ser/Gly、 Tyr/Phe、 Ala/Pro、 Lys/Arg、 Asp/Asn、 Leu/Ile、 Leu/Val、 Ala/Glu、 和 Asp/Gly, 以及上述反向的置换。
     在一个具体的实施方案中, 所述氨基酸改变具有这样的性质, 使得多肽的物理化 学特性被改变。例如, 所进行的氨基酸改变可提高酶的热稳定性、 改变底物特异性、 改变最 佳 pH 等等。
     具体地, 在本发明的多肽, 特别是选自 B 多肽组中所包含的成熟多肽的那些多肽中, 产生人工变体的所述置换、 缺失和 / 或插入的数目最多为 10, 如最多 9, 例如最多 8, 更优选 最多 7, 例如最多 6, 例如最多 5, 最优选最多 4, 例如最多 3, 如最多 2, 特别是最多 1。
     在一个具体的实施方案中所述人工变体是这样的变体, 其在包括人的动物中, 与 亲本酶相比, 具有改变的、 优选减少的免疫原性, 特别是变应原性。术语 “免疫原性” 在本文 中应理解为人工变体当被施用于动物, 包括通过静脉内、 皮肤、 皮下、 口服和气管内施用于 动物时, 引起改变的、 特别是减少的免疫反应的能力。术语 “免疫反应” 在本文中指该人工 变体的施用造成该动物体内免疫球蛋白例如 IgE、 IgG 和 IgM 的水平的改变, 或该动物体内 细胞因子水平的改变。定位 (mapping) 蛋白质的免疫原性 / 抗原性表位的方法、 制备具有 改变的免疫原性的抗体及测量免疫反应的方法在本领域是公知的, 且在例如 WO 92/10755、 WO 00/26230、 WO 00/26354 和 WO 01/31989 中有描述。本文中术语 “变应原性” 理解为该 人工变体造成动物中 IgE 生产的改变特别是减少的能力, 以及结合来自该动物的 IgE 的能 力。特别地, 由于对动物气管内使用所述多肽变体而产生的变应原性 ( 又称呼吸性变应原 性 (respiratory allergenicity)) 是本文特别感兴趣的。
     在另一个实施方案中, 本发明的多肽是由这样的核苷酸序列编码的多肽, 该核苷 酸序列在至少高度严紧的条件, 特别是极高度严紧条件下, 与选自下列的多核苷酸探针杂 交:
     (i) 核苷酸序列的互补链, 所述核苷酸序列选自 ADNA 组序列的编码成熟多肽的区 域;
     (ii) 核苷酸序列中所含的 cDNA 序列的互补链, 所述核苷酸序列选自 ADNA 组序列的 编码成熟多肽的区域 ;
     (iii)(i) 或 (ii) 的编码分泌多肽的片段, 所述分泌多肽具有 B 多肽组中所包含的 相应成熟多肽的功能。
     (J.Sambrook , E.F.Fritsch , 和 T.Maniatus , 1989 , Molecular Cloning , A Laboratory Manual, 第二版, Cold Spring Harbor, New York)。
     特别地, 本发明的多肽被包含这样的核苷酸序列的多核苷酸所编码, 所述核苷酸 序列选自 : ADNA 组序列的编码成熟多肽的区域, 或者与其由于遗传密码的简并性而相异的序 列。更具体地, 本发明的多肽被由这样的核苷酸序列组成的多核苷酸所编码, 所述核苷酸 序列选自 : ADNA 组序列的编码成熟多肽的区域, 或者与其由于遗传密码的简并性而相异的序 列。
     ADNA 组的序列的编码成熟多肽的区域的核苷酸序列或其子序列, 以及 B 多肽组中包 含的成熟多肽的氨基酸序列或其片段, 可以用来设计多核苷酸探针, 以根据本领域熟知的 方法, 从不同属或种的株系中鉴定和克隆编码本发明的酶的 DNA。特别地, 这样的探针可以用来根据标准的 Southern 印迹程序与目标属或种的基因组或 cDNA 杂交, 以鉴定和分离其 中的相应基因。这样的探针可以显著地短于整个序列, 但长度应该为至少 15, 优选至少 25, 更优选至少 35 个核苷酸, 例如长度为至少 70 个核苷酸。但是优选该多核苷酸探针为至少 100 个核苷酸长。例如, 该多核苷酸探针可为至少 200 个核苷酸长, 至少 300 个核苷酸长, 至少 400 个核苷酸长, 或至少 500 个核苷酸长。还可以用更长的探针, 例如至少 600 个核苷 酸长, 至少 700 个核苷酸长, 至少 800 个核苷酸长, 或至少 900 个核苷酸长的多核苷酸探针。 3 35 DNA 和 RNA 探针都可以使用。探针通常进行标记来检测相应的基因 ( 例如用 32P、 H、 S、 生 物素、 或抗生物素蛋白 )。
     因此, 可从这样的其它生物体制备的基因组 DNA 或 cDNA 文库中筛选与上述探针发 生杂交、 且编码本发明的酶的 DNA。来自这样的其它生物体的基因组或其它 DNA 可通过琼 脂糖或聚丙烯酰胺凝胶电泳或其它分离技术来分离。可将来自文库的 DNA 或分离的 DNA 转 移到并固定在硝酸纤维素或其它适宜的载体材料上。为了鉴定与选自 ADNA 组序列中编码成 熟多肽的区域的核苷酸具有所需的同源性和 / 或同一性, 或与之同源和 / 或同一的克隆或 DNA, 在 Southern 印迹中使用带有固定的 DNA 的载体材料。
     对本发明而言, “杂交” 意味着所述核苷酸序列与标记的多核苷酸探针杂交, 所述 探针在高度到极高度严紧条件下与选自 ADNA 组的序列编码成熟多肽的区域的核苷酸序列杂 交。在这些条件下与多核苷酸探针杂交的分子可以用 X 射线胶片或本领域已知的任何方法 来检测。本文中无论何时使用术语 “多核苷酸探针” 时, 应理解这样的探针含有至少 15 个 核苷酸。
     在一个感兴趣的实施方案中, 所述多核苷酸探针是选自 ADNA 组的序列的编码成熟 多肽的区域的核苷酸序列的互补链。
     在另一个感兴趣的实施方案中, 所述多核苷酸探针是编码选自 B 多肽组的酶的核苷 酸序列的互补链。在另一个感兴趣的实施方案中, 所述多核苷酸探针是核苷酸序列的成熟 多肽编码区域的互补链, 所述核苷酸序列选自 ADNA 组的序列的编码成熟多肽的区域。
     对于长度为至少 100 个核苷酸的长探针来说, 高度至极高度的严紧条件定义为遵 循标准 Southern 印迹程序, 于 42℃, 在 5X SSPE、 5X Darhardt’ s 溶液、 1.0% SDS、 100μg/ ml 经剪切且经变性的鲑精 DNA 中进行预杂交和杂交。优选地, 所述至少 100 个核苷酸的长 探针不含有多于 1000 个核苷酸。 对于长度为至少 100 个核苷酸的长探针来说, 最后在 60℃ 下用 0.1x SSC、 0.1 % SDS( 高严紧度 ) 洗涤 3 次, 每次 15 分钟 ; 特别是在 68 ℃下用 0.1x SSC、 0.1% SDS( 极高严紧度 ) 洗涤 3 次, 每次 15 分钟。
     虽然不是特别优选的, 还考虑可以使用更短的探针, 例如长为大约 15 到 99 个核苷 酸的探针, 例如长为约 15 到约 70 个核苷酸。对于这样的短探针, 严紧条件定义为遵循标准 Southern 印迹程序, 在比根据 Bolton 和 McCarthy(1962, Proceedings of the National Academy of Sciences USA 48 : 1390) 的计算方法算得的 Tm 值低大约 5℃至大约 10℃的温 度下, 在 0.9M NaCl、 0.09M Tris-HCl pH7.6、 6mM EDTA、 0.5% NP-40、 1X Denhardt’ s 溶液、 1mM 焦磷酸钠、 1mM 磷酸二氢钠 (sodium monobasic phosphate)、 0.1mM ATP、 和 0.2mg/ml 酵 母 RNA 中进行预杂交、 杂交和杂交后清洗。
     对于长度为大约 15 个核苷酸至大约 99 个核苷酸的短探针来说, 在比 Tm 计算值低 大约 5℃至 10℃的温度下, 将载体材料用 6X SCC 加 0.1% SDS 洗涤 1 次 15 分钟, 然后用 6XSSC 洗涤两次, 每次 15 分钟。
     SEQ ID NO : 2 木聚糖酶 GH10
     在一个特定的实施方案中, 本发明的多肽是包含或由这样的氨基酸序列组成的 GH10 木聚糖酶, 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的 GH10 木聚糖酶, 更具体是 SEQ ID NO : 2 中包含的成熟 GH10 木聚糖酶具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体 是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。更具体 地, 所述成熟 GH10 木聚糖酶包含或由 SEQ ID NO : 2 第 1 到 291 位的序列组成。在本文中, GH10 木聚糖酶定义为属于 EC 3.2.1.8 酶活类群的酶。该类群内切水解 (endohydrolyse) 木聚糖中的 1, 4-β-D- 木糖苷键。糖苷水解酶家族 10(GH10) 还包括具有另外两种已知活 性的酶 ; 内切 -1, 3-β- 木聚糖酶 (EC : 3.2.1.32) ; 纤维二糖水解酶 (EC : 3.2.1.91)。
     SEQ ID NO : 4 木聚糖酶 GH11
     在一个特定的实施方案中, 本发明的多肽是包含或由这样的氨基酸序列组成的 GH11 木聚糖酶, 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的 GH11 木聚糖酶, 更具体是 SEQ ID NO : 4 中包含的成熟 GH11 木聚糖酶具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具 体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。更 具体地, 所述成熟 GH11 木聚糖酶包含或由 SEQ ID NO : 4 第 1 到 202 位的序列组成。在本 文中, GH11 木聚糖酶定义为属于 EC 3.2.1.8 酶活类群的酶。该类群内切水解木聚糖中的 1, 4-β-D- 木糖苷键。糖苷水解酶家族 11(GH11) 包括只具有一种已知活性的酶 ; 木聚糖酶 (EC : 3.2.1.8)。
     SEQ ID NO : 6 丝氨酸酯酶
     在一个特定的实施方案中, 本发明的多肽是丝氨酸酯酶, 具体是包含或由这样的 氨基酸序列组成的角质酶或脂肪酶或羧基酯酶 (carboxyesterase) : 所述氨基酸序列与 可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的丝氨酸酯酶, 更具体是 SEQ ID NO : 6 中包含的成熟丝氨酸酯酶具有至 少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更 具体是至少 99%, 或最具体是 100%的同一性。更具体地, 所述成熟丝氨酸酯酶包含或由 SEQ ID NO : 6 第 1 到 352 位的序列组成。在本文中, 丝氨酸酯酶定义为能够水解溶液中的 可溶性酯类 ( 非胶束 (micelle) 形式的酯类 ) 的酶。更具体地, 丝氨酸酯酶是充当角质酶 (EC 3.1.1.50) 或脂肪酶 (EC.3.1.1.3) 或羧基酯酶, 能够水解蜡 - 脂类 (wax-esters)、 角 质、 三酰基脂肪 (tracyl fats), 油和 / 或脂肪酸链。 具体地, 所述丝氨酸酯酶含有经典的丝 氨酸水解酶 Ser、 His、 Asp 三联体, 例如三酰基脂肪酶 / 角质酶。
     SEQ ID NO : 8 假丝酵母 B 型脂肪酶
     在一个特定的实施方案中, 本发明的多肽是假丝酵母 (candida)B 型脂肪酶 (EC 3.1.1.3), 其包含或由这样的氨基酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的假丝 酵母 B 型脂肪酶, 更具体是 SEQ ID NO : 8 中包含的假丝酵母 B 型脂肪酶具有至少 90 %, 具体是至少 95%, 更具体是至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。更具体地, 所述成熟假丝酵母 B 型脂肪酶包含或 由 SEQ ID NO : 8 第 1 到 431 位的序列组成。在本文中, 假丝酵母 B 型脂肪酶 (Candida B type lipase) 定义为能够将甘油三酸酯 (triglycerides) 水解为二酰基甘油酯 (diacyl glycerides) 和脂肪酸阴离子, 特别是将三酰基甘油水解为二酰基甘油和脂肪酸阴离子的 酶。
     SEQ ID NO : 10 过氧化物酶
     在一个特定的实施方案中, 本发明的多肽是过氧化物酶, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的过氧化物酶, 更具体是 SEQ ID NO : 10 中包含的过氧化物酶具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。 更具体地, 所述 成熟过氧化物酶包含或由 SEQ ID NO : 10 第 1 到 185 位的序列组成。在本文中, 过氧化物酶 定义为属于能够催化氧化 - 还原反应的酶类的酶。因此, 它们被归类为氧化还原酶。它们 的正式 EC 号为 1.11.1。过氧化物酶将 H2O2 还原为水, 而氧化多种底物。因此, 过氧化物酶 是利用 H2O2 作为电子受体来催化不同氧化反应的氧化还原酶。
     SEQ ID NO : 12 GH61A 多肽
     在一个特定的实施方案中, 本发明的多肽是 GH61A 多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的 GH61A 多肽, 更具体是 SEQ ID NO : 8 中包含的 GH61A 多肽具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。 更具体地, 所述 成熟 GH61A 多肽包含或由 SEQ ID NO : 12 第 1 到 218 位的序列组成。在本文中, GH61A 多肽 定义为提供选自下列的一组或多组效应的分泌多肽或蛋白质 :
     1) 当与纤维素酶或纤维素酶混合物联合使用时, 促进纤维质 (cellulosic) 材料 的降解。
     2) 增加酶的溶解性。
     3) 增加酶的稳定性。
     4) 减少酶抑制。
     SEQ ID NO : 14 GH61B 多肽
     在一个特定的实施方案中, 本发明的多肽是 GH61B 多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的 GH61B 多肽, 更具体是 SEQ ID NO : 14 中包含的 GH61B 多肽具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。 更具体地, 所述 成熟 GH61B 多肽包含或由 SEQ ID NO : 14 第 1 到 249 位的序列组成。在本文中, GH61B 多肽 定义为提供选自下列的一组或多组效应的分泌多肽或蛋白质 :
     1) 当与纤维素酶或纤维素酶混合物联合使用时, 促进纤维质材料的降解。
     2) 增加酶的溶解性。
     3) 增加酶的稳定性。SEQ ID NO : 16 GH61C 多肽
     在一个特定的实施方案中, 本发明的多肽是 GH61C 多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的 GH61C 多肽, 更具体是 SEQ ID NO : 16 中包含的 GH61C 多肽具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。 更具体地, 所述 成熟 GH61C 多肽包含或由 SEQ ID NO : 16 第 1 到 255 位的序列组成。在本文中, GH61C 多肽 定义为提供选自下列的一组或多组效应的分泌多肽或蛋白质 :
     1) 当与纤维素酶或纤维素酶混合物联合使用时, 促进纤维质材料的降解。
     2) 增加酶的溶解性。
     3) 增加酶的稳定性。
     SEQ ID NO : 18 GH61D 多肽
     在一个特定的实施方案中, 本发明的多肽是 GH61D 多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的 GH61D 多肽, 更具体是 SEQ ID NO : 18 中包含的 GH61D 多肽具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。 更具体地, 所述 成熟 GH61D 多肽包含或由 SEQ ID NO : 18 第 1 到 205 位的序列组成。在本文中, GH61D 多肽 定义为提供选自下列的一组或多组效应的分泌多肽或蛋白质 :
     1) 当与纤维素酶或纤维素酶混合物联合使用时, 促进纤维质材料的降解。
     2) 增加酶的溶解性。
     3) 增加酶的稳定性。
     SEQ ID NO : 20 功能性多肽
     在一个特定的实施方案中, 本发明的多肽是功能性多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与 SEQ ID NO : 20 具有至少 90%, 具体是至少 95%, 更具体是 至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100% 的同一性。特别是与 SEQ IDNO : 20 中包含的成熟功能性多肽。更具体地, 所述成熟功能性 多肽包含或由 SEQ ID NO : 20 第 1 到 243 位的序列组成。
     SEQ ID NO : 22 功能性多肽
     在一个特定的实施方案中, 本发明的多肽是功能性多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与 SEQ ID NO : 22 具有至少 90%, 具体是至少 95%, 更具体是 至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100% 的同一性。特别是与 SEQ IDNO : 22 中包含的成熟功能性多肽。更具体地, 所述成熟功能性 多肽包含或由 SEQ ID NO : 22 第 1 到 415 位的序列组成。
     SEQ ID NO : 24 功能性多肽
     在一个特定的实施方案中, 本发明的多肽是功能性多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与 SEQ ID NO : 24 具有至少 90%, 具体是至少 95%, 更具体是 至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100% 的同一性。特别是与 SEQ IDNO : 24 中包含的成熟功能性多肽。更具体地, 所述成熟功能性多肽包含或由 SEQ ID NO : 24 第 1 到 377 位的序列组成。
     SEQ ID NO : 26 功能性多肽
     在一个特定的实施方案中, 本发明的多肽是功能性多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与 SEQ ID NO : 26 具有至少 90%, 具体是至少 95%, 更具体是 至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100% 的同一性。特别是与 SEQ IDNO : 26 中包含的成熟功能性多肽。更具体地, 所述成熟功能性 多肽包含或由 SEQ ID NO : 26 第 1 到 259 位的序列组成。
     SEQ ID NO : 28 功能性多肽
     在一个特定的实施方案中, 本发明的多肽是功能性多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与 SEQ ID NO : 28 具有至少 90%, 具体是至少 95%, 更具体是 至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100% 的同一性。特别是与 SEQ IDNO : 28 中包含的成熟功能性多肽。更具体地, 所述成熟功能性 多肽包含或由 SEQ ID NO : 28 第 1 到 248 位的序列组成。
     SEQ ID NO : 30 功能性多肽
     在一个特定的实施方案中, 本发明的多肽是功能性多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与 SEQ ID NO : 30 具有至少 90%, 具体是至少 95%, 更具体是 至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100% 的同一性。特别是与 SEQ IDNO : 30 中包含的成熟功能性多肽。更具体地, 所述成熟功能性 多肽包含或由 SEQ ID NO : 30 第 1 到 149 位的序列组成。
     SEQ ID NO : 32 功能性多肽
     在一个特定的实施方案中, 本发明的多肽是功能性多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与 SEQ ID NO : 32 具有至少 90%, 具体是至少 95%, 更具体是 至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100% 的同一性。特别是与 SEQ IDNO : 32 中包含的成熟功能性多肽。更具体地, 所述成熟功能性 多肽包含或由 SEQ ID NO : 32 第 1 到 202 位的序列组成。
     SEQ ID NO : 34β- 葡糖苷酶
     在一个特定的实施方案中, 本发明的多肽是 β- 葡糖苷酶, 其包含或由这样的氨 基酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的 β- 葡糖苷酶, 更具体是 SEQ ID NO : 34 中包含的 β- 葡糖苷酶具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是 至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。 更具体地, 所述 β- 葡糖苷酶包含或由 SEQ ID NO : 34 第 1 到 603 位的序列组成。在本文中, β- 葡 糖苷酶定义为这样的 β-D- 葡萄糖苷 - 葡萄糖水解酶 (β-D-glucoside-glucohydrolase) (E.C.3.2.1.21), 其催化末端非还原的 β-D- 葡萄糖残基的水解, 并释放 β-D- 葡萄糖。对 本发明而言, β- 葡糖苷酶活性是根据 Venturi 等, 2002, J.Basic Microbiol.42 : 55-66 中 描述的基本步骤来测定的, 只是采用了本文所述的不同条件。1 个 β- 葡糖苷酶活性单位 定义为 : 在 50℃, pH 5 下, 从 100mM 柠檬酸钠、 0.01% Tween-20 中的底物 : 4mM 对 - 硝基苯 基 -β-D- 吡喃葡萄糖苷中, 每分钟产生 1.0 微摩尔的对 - 硝基酚。
     SEQ ID NO : 36 内切阿拉伯糖酶在一个特定的实施方案中, 本发明的多肽是内切阿拉伯糖酶, 其包含或由这样的 氨基酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的内切阿拉伯糖酶, 更具体是 SEQ ID NO : 36 中包含的内切阿拉伯糖酶具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具 体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。更具 体地, 所述内切阿拉伯糖酶包含或由 SEQ ID NO : 36 第 1 到 301 位的序列组成。在本文中, 内切阿拉伯糖酶 (endo-arabinase) 定义为能够水解阿拉伯聚糖 (arabinan) 的酶。
     SEQ ID NO : 38 内切阿拉伯糖酶
     在一个特定的实施方案中, 本发明的多肽是内切阿拉伯糖酶, 其包含或由这样的 氨基酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的内切阿拉伯糖酶, 更具体是 SEQ ID NO : 36 中包含的内切阿拉伯糖酶具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具 体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。更具 体地, 所述内切阿拉伯糖酶包含或由 SEQ ID NO : 38 第 1 到 438 位的序列组成。在本文中, 内切阿拉伯糖酶定义为能够水解阿拉伯聚糖的酶。 SEQ ID NO : 40 A1 胃蛋白酶肽酶
     在一个特定的实施方案中, 本发明的多肽是胃蛋白酶肽酶, 其包含或由这样的氨 基酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的胃蛋白酶肽酶, 更具体是 SEQ ID NO : 40 中包含的胃蛋白酶肽酶具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是 至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。 更具体地, 所述胃蛋白酶肽酶包含或由 SEQ ID NO : 40 第 1 到 396 位的序列组成。在本文中, 胃蛋白酶 肽酶 (pepsin peptidase) 定义为能够水解蛋白质或肽的酶。
     SEQ ID NO : 42 M43 胃蛋白酶肽酶
     在一个特定的实施方案中, 本发明的多肽是胃蛋白酶肽酶, 其包含或由这样的氨 基酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的胃蛋白酶肽酶, 更具体是 SEQ ID NO : 42 中包含的胃蛋白酶肽酶具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是 至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。 更具体地, 所述胃蛋白酶肽酶包含或由 SEQ ID NO : 42 第 1 到 262 位的序列组成。在本文中, 胃蛋白酶 肽酶定义为能够水解蛋白质或肽的酶。
     多核苷酸
     本发明还涉及包含或由编码本发明的多肽的核苷酸序列组成的多核苷酸。 在一个 具体的实施方案中, 所述核苷酸序列显示在 ADNA 组的序列中, 包括与其由于遗传密码的简并 性而相异的序列。 在另一个实施方案中, 本发明的多核苷酸是修饰的核苷酸序列, 其包含或 由 ADNA 组的序列的编码成熟多肽的区域组成, 而且其与 ADNA 组中所包含的亲本核苷酸序列 相比, 包含至少一个修饰 / 突变。
     用于分离或克隆编码多肽的多核苷酸的技术在本领域是已知的, 包括从基因组 DNA 分离, 从 cDNA 制备, 或者两者的组合。 从这些基因组 DNA 克隆本发明的多核苷酸序列可
     以通过, 例如, 利用公知的聚合酶链式反应 (PCR), 或用抗体筛选表达文库以检测出具有共 同结构特征的克隆 DNA 片段来实现。例如参见 Innis 等, 1990, PCR : A Guide to Methods and Application, Academic Press, New York。 还可以使用其它核酸扩增程序, 诸如连接酶 链式反应 (LCR)、 连接激活转录 (LAT)、 和基于核苷酸序列的扩增 (NASBA)。
     获得所述核苷酸序列可通过基因工程中使用的标准克隆方法, 将该核苷酸序列从 其天然位置再定位 (relocate) 到该序列将被复制的其它位置。克隆方法可包括包含编码 该多肽的核苷酸序列的期望片段的切割和分离、 该片段向载体分子中的插入, 以及重组载 体向宿主细胞中的掺入, 在宿主细胞中该核酸序列的多拷贝或克隆将被复制。该核酸序列 可以是基因组、 cDNA、 RNA、 半合成、 合成的来源或其任意组合。
     具体地, 所述多核苷酸包含且优选由这样的核苷酸序列组成 : 该核苷酸序列与选 自 ADNA 组的序列的编码成熟多肽的区域的核苷酸序列具有至少 50%的同一性。具体地, 所 述核苷酸序列与选自 ADNA 组的序列的编码成熟多肽的区域的核苷酸序列具有至少 65%的 同一性, 更具体为 70%的同一性, 更具体为 80%的同一性, 更具体为 90%的同一性, 更具体 为 95%的同一性, 更具体为 96%的同一性, 更具体为 97%的同一性, 更具体为 98%的同一 性, 更具体为 99%的同一性, 或最具体为 100%的同一性。具体地, 所述核苷酸序列包含选 自 ADNA 组的序列的编码成熟多肽的区域的核苷酸序列。在更优选的实施方案中, 所述核苷 酸序列由选自 ADNA 组的序列的编码成熟多肽的区域的核苷酸序列组成。
     具体地, 所述多核苷酸包含并优选由这样的核苷酸序列组成 : 该核苷酸序列编码 选自木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多 肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶的成熟酶, 并且该核苷酸序列与编码本 发明人分离并以 CBS 保藏号 274.96 保藏的 Botryosphaeria rhodina 菌株所分泌的木聚糖 酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖 苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶的成熟酶的核苷酸序列, 具有至少 50%的同一性, 具 体为至少 65%的同一性, 更具体为 70%的同一性, 更具体为 80%的同一性, 更具体为 90% 的同一性, 更具体为 95%的同一性, 更具体为 96%的同一性, 更具体为 97%的同一性, 更具 体为 98%的同一性, 更具体为 99%的同一性, 或最具体为 100%的同一性。
     在一个具体的实施方案中, 所述多核苷酸包含并优选由这样的核苷酸序列组成 : 该核苷酸序列编码选自木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶的成熟酶, 并且该 核苷酸序列与编码选自 D 多肽组的成熟酶核苷酸序列具有至少 50%的同一性, 具体为至少 65%的同一性, 更具体为 70%的同一性, 更具体为 80%的同一性, 更具体为 90%的同一性, 更具体为 95%的同一性, 更具体为 96%的同一性, 更具体为 97%的同一性, 更具体为 98% 的同一性, 更具体为 99%的同一性, 或最具体为 100%的同一性。
     在一个具体的实施方案中, 所述多核苷酸包含并优选由这样的核苷酸序列组成 : 该核苷酸序列编码选自木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶的成熟酶, 并且该 核苷酸序列与选自 EDNA 组序列的核苷酸序列具有至少 50%的同一性, 具体为至少 65%的同 一性, 更具体为 70%的同一性, 更具体为 80%的同一性, 更具体为 90%的同一性, 更具体为 95%的同一性, 更具体为 96%的同一性, 更具体为 97%的同一性, 更具体为 98%的同一性,更具体为 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 1
     在一个特定的实施方案中本发明的多核苷酸编码 GH10 木聚糖酶, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 1 的 55 到 927 位的核苷酸序列具有至 少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至 少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至 少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 3
     在一个特定的实施方案中本发明的多核苷酸编码 GH11 木聚糖酶, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 3 的 58 到 663 位的核苷酸序列具有至 少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至 少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至 少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 5
     在一个特定的实施方案中本发明的多核苷酸编码丝氨酸酯酶, 并包含或由这样的 核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 5 的 55 到 1110 位的核苷酸序列具有至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 7
     在一个特定的实施方案中本发明的多核苷酸编码脂肪酶, 并包含或由这样的核苷 酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 7 的 55 到 1347 位的核苷酸序列具有至少 70% 的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至少 95% 的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至少 98% 的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 9
     在一个特定的实施方案中本发明的多核苷酸编码过氧化物酶, 并包含或由这样的 核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 9 的 1 到 555 位的核苷酸序列具有至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 11
     在一个特定的实施方案中本发明的多核苷酸编码 GH61A 多肽, 并包含或由这样的 核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 11 的 49 到 702 位的核苷酸序列具有至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 13
     在一个特定的实施方案中本发明的多核苷酸编码 GH61B 多肽, 并包含或由这样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 13 的 40 到 786 位的核苷酸序列具有至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 15
     在一个特定的实施方案中本发明的多核苷酸编码 GH61C 多肽, 并包含或由这样的 核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 15 的 55 到 819 位的核苷酸序列具有至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 17
     在一个特定的实施方案中本发明的多核苷酸编码 GH61D 多肽, 并包含或由这样的 核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 17 的 61 到 675 位的核苷酸序列具有至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 19
     在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 19 的 1 到 729 位的核苷酸序列具有至 少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至 少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至 少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 21
     在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 21 的 55 到 1299 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为 至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 23
     在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 23 的 49 到 1179 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为 至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 25
     在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 25 的 70 到 846 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 27
     在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 27 的 58 到 801 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为 至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 29
     在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 29 的 157 到 603 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为 至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 31
     在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 31 的 55 到 660 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为 至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 33
     在一个特定的实施方案中本发明的多核苷酸编码 β- 葡糖苷酶, 并包含或由这样 的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 33 的 46 到 1854 位的核苷酸序列具有至 少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至 少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至 少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 35
     在一个特定的实施方案中本发明的多核苷酸编码内切阿拉伯糖酶, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 35 的 64 到 966 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为 至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 37
     在一个特定的实施方案中本发明的多核苷酸编码内切阿拉伯糖酶, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 37 的 55 到 1368 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为 至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 39
     在 一 个 特 定 的 实 施 方 案 中 本 发 明 的 多 核 苷 酸 编 码 胃 蛋 白 酶 蛋 白 酶 (pepsinprotease), 并包含或由这样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 39 的 61 到 1248 位的核苷酸序列具有至少 70 %的同一性, 更具体为至少 80 %的同一性, 更具体为至 少 90%的同一性, 更具体为至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至 少 97%的同一性, 更具体为至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 41
     在一个特定的实施方案中本发明的多核苷酸编码胃蛋白酶蛋白酶, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 41 的 64 到 849 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为 至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     为了合成包含相比于选自 B 多肽组所包含的成熟多肽的氨基酸序列具有至少一个 置换、 缺失和 / 或插入的氨基酸序列的多肽, 编码本发明的多肽的核苷酸序列的修饰可能 是必需的。
     对本领域技术人员而言显而易见的是, 可以使这些修饰保持酶的功能, 即, 可以在 酶功能的关键区域之外进行这些修饰。 对功能来说至关重要的氨基酸残基因此优选不被修 饰, 例如被替代。 对功能来说至关重要的氨基酸残基可以通过本领域已知的程序来鉴定, 诸 如定点诱变或丙氨酸扫描诱变 (alanine scanning mutagenesis)( 例如参见 Cunningham 和 Wells, 1989, Science 244 : 1081-1085)。底物 - 酶相互作用位点可通过三维结构分析来 确定, 其中三维结构可由诸如核磁共振分析、 晶体学、 或光亲和标记等技术来测定 ( 例如参 见 de Vos 等, 1992, Science 255 : 306-312 ; Smith 等, 1992, Journal of Molecular Biology 224 : 899-904 ; Wlodaver 等, 1992, FEBS Letters 309 : 59-64)。
     另外, 可以通过引入核苷酸置换来改变编码本发明的酶的核苷酸序列, 这样的置 换不会使该核苷酸序列编码产生另外的氨基酸序列, 而是对应于意图用来表达酶的宿主生 物的密码子使用习惯。
     将一个核苷酸置换为另一个核苷酸的突变导入核苷酸序列, 可以通过利用本领域 已知的任何方法进行定点诱变来实现。 特别有用的是利用具有目标插入片段的超螺旋双链 DNA 载体和两个含有所需突变的合成引物的方法。每条分别与载体的相对链互补的寡核苷 酸引物借助 Pfu DNA 聚合酶在温度循环过程中延伸。整合入引物后, 生成包含错列缺口的 突变质粒。在温度循环后, 用对甲基化和半甲基化 DNA 特异性的 DpnI 处理产物以消化亲代 并选择包含突变的合成的 DNA。本领域已知的其它方法也可以使用。关于核苷酸 DNA 模板, 置换的一般性描述参见, 例如, Ford 等, 1991, Protein Expression and Purification 2 : 95-107。
     本发明还涉及包含, 优选由这样的核苷酸序列组成的多核苷酸 : 所述核苷酸序列 编码本发明的多肽并在高度严紧条件, 优选极高度严紧条件下, 与选自下列的多核苷酸探 针杂交 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列选自 ADNA 组序列的编码成熟多肽的区 域;
     (ii) 核苷酸序列所包含的 cDNA 的互补链, 所述核苷酸序列选自 ADNA 组序列的编码成熟多肽的区域 ;
     (iii)(i) 或 (ii) 的片段, 其编码具有 B 多肽组中所包含的相应成熟多肽的功能的 分泌的成熟多肽。
     (J.Sambrook , E.F.Fritsch 和 T.Maniatus , 1989 , Molecular Cloning , A Laboratory Manual, 第二版, Cold Spring Harbor, New York)。
     可以理解的是, 关于核苷酸序列杂交的细节和详情与本文中题为 “本发明的多肽” 部分中讨论的杂交方面的内容相同或相近。
     本发明还涉及适用于电子设备的、 包含本发明的多肽的氨基酸序列或本发明的多 核苷酸的核苷酸序列的信息的存储介质。所述存储介质可合适地为磁盘或光盘, 所述电子 设备可以是计算设备, 所述信息具体可以数字形式存储在存储介质上。
     核酸构建体
     本发明还涉及包含与一种或多种调控序列可操作地连接的本发明的多核苷酸的 核酸构建体, 所述调控序列在适当宿主细胞中与调控序列相容的条件下指导编码序列的表 达。
     可利用多种方法操作编码本发明多肽的分离多核苷酸以提供多肽的表达的条件。 根据表达载体的不同, 可能希望或必需在将多核苷酸序列插入载体之前对其进行操作。利 用重组 DNA 方法修饰多核苷酸序列的技术是本领域众所周知的。
     调控序列可以是适当的启动子序列, 即被宿主细胞识别来表达所述核苷酸的核苷 酸序列。启动子序列包含调节多肽表达的转录调控序列。启动子可以是在所选宿主细胞中 表现出转录活性的任何核苷酸序列, 包括突变的、 截短的和杂合的启动子, 而且可从编码与 宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。
     用于指导本发明的核酸构建体转录, 尤其是在细菌宿主细胞中转录的适当启动 子的实例, 是从大肠杆菌 lac 操纵子、 天蓝色链霉菌 (Streptomyces coelicolor) 琼脂 酶基因 (dagA)、 枯草芽孢杆菌果聚糖蔗糖酶基因 (sacB)、 地衣芽孢杆菌 α- 淀粉酶基因 (amyL)、 嗜热脂肪芽孢杆菌 (Bacillus stearothermophilus) 产麦芽糖淀粉酶 (maltogenic amylase) 基因 (amyM)、 解淀粉芽孢杆菌 α- 淀粉酶基因 (amyQ)、 地衣芽孢杆菌 (Bacillus licheniformis) 青霉素酶基因 (penP)、 枯草芽孢杆菌 xylA 和 xylB 基因、 和原核生物的 β- 内 酰 胺 酶 基 因 (Villa-Kamaroff 等, 1978, Proceedings of the National Academy of Sciences USA 75 : 3727-3731) 中获得的启动子, 以及 tac 启动子 (DeBoer 等, 1983, Proceedings of the National Academy of Sciences USA 80 : 21-25)。还有 “Useful proteins from recombinant bacteria” , Scientific American, 1980, 242 : 74-94 及 Sambrook 等, 1989, 同上中描述的其它启动子。
     用于在丝状真菌宿主细胞中指导本发明的核酸构建体转录的适当启动子的实例 有从米曲霉 (Aspergillus oryzae)TAKA 淀粉酶、 Rhizomucor miehei 天冬氨酸蛋白酶、 黑曲霉 (Aspergillus niger) 中性 α- 淀粉酶、 黑曲霉酸稳定 α- 淀粉酶、 黑曲霉或泡盛 曲霉 (Aspergillus awamori) 葡糖淀粉酶 (glaA)、 Rhizomucor miehei 脂肪酶、 米曲霉碱 性蛋白酶、 米曲霉磷酸丙糖异构酶、 构巢曲霉 (Aspergillus nidulans) 乙酰胺酶和尖镰孢 (Fusarium oxysporum) 胰蛋白酶样蛋白酶 (WO 96/00787)、 以及 NA2-tpi 启动子 ( 来自黑 曲霉中性 α- 淀粉酶和米曲霉磷酸丙糖异构酶基因的杂合启动子 ) ; 及其突变的、 截短的、和杂合的启动子。
     在酵母宿主中, 有用的启动子有从酿酒酵母 (Saccharomyces cerevisiae) 烯醇 化酶 (ENO-1)、 酿酒酵母半乳糖激酶 (GAL1)、 酿酒酵母醇脱氢酶 / 甘油醛 -3- 磷酸脱氢酶 (ADH1、 ADH2/GAP) 和酿酒酵母 3- 磷酸甘油酸 (phosphoglycerate) 激酶基因中所获得的。 还有 Romanos 等, 1992, Yeast 8 : 423-488 中描述了用于酵母宿主细胞的其它有用启动子。
     调控序列也可以是适当的转录终止子序列, 即由宿主细胞识别来终止转录的序 列。终止子序列可操作地连接于编码多肽的核苷酸序列的 3′端。在所选择的宿主细胞中 起作用的任何终止子都可用于本发明。
     对于丝状真菌宿主细胞优选的终止子是从米曲霉 TAKA 淀粉酶、 黑曲霉葡糖淀粉 酶、 构巢曲霉邻氨基苯甲酸 (anthranilate) 合酶、 黑曲霉 α- 葡糖苷酶、 和尖镰孢胰蛋白酶 样蛋白酶的基因中获得的。
     对于酵母宿主细胞优选的终止子是从酿酒酵母烯醇化酶、 酿酒酵母细胞色素 C(CYC1) 和酿酒酵母甘油醛 -3- 磷酸脱氢酶基因中获得的。还有 Romanos 等, 1992, 同上中 描述的用于酵母宿主细胞的其它有用终止子。
     调控序列还可以是适当的前导序列, 即 mRNA 中对宿主细胞翻译重要的非翻译区。 前导序列可操作地连接于编码多肽的核苷酸序列的 5′端。在所选择的宿主细胞中起作用 的任何前导序列都可用于本发明。
     对于丝状真菌宿主细胞优选的前导序列是从米曲霉 TAKA 淀粉酶和构巢曲霉磷酸 丙糖异构酶基因中获得的。
     对于酵母宿主细胞优选的前导序列是从酿酒酵母烯醇化酶 (ENO-1)、 酿酒酵母 3- 磷酸甘油酸激酶、 酿酒酵母 α- 因子和酿酒酵母醇脱氢酶 / 甘油醛 -3- 磷酸脱氢酶 (ADH2/GAP) 基因中获得的。
     调控序列还可以是聚腺苷酸化序列, 即可操作地连接于核苷酸序列 3′端的序列, 且当被转录时, 作为将聚腺苷残基添加到转录出的 mRNA 上的信号被宿主细胞所识别。在所 选择的宿主细胞中起作用的任何聚腺苷酸化序列都可用于本发明。
     对于丝状真菌宿主细胞优选的聚腺苷酸化序列是从米曲霉 TAKA 淀粉酶、 黑曲霉 葡糖淀粉酶、 构巢曲霉邻氨基苯甲酸合酶、 尖镰孢胰蛋白酶样蛋白酶、 和黑曲霉 α- 葡糖苷 酶的基因获得的。
     Guo 和 Sherman 等, 1995, Molecular Cellular Biology 15 : 5983-5990 中描述了 对酵母宿主细胞有用的聚腺苷酸化序列。
     调控序列还可以是信号肽编码区, 它编码连接于多肽的氨基末端, 并指导编码的 多肽进入细胞分泌途径的氨基酸序列。核苷酸序列的编码序列的 5′端可固有地含有信号 肽编码区, 它在翻译读码框中与编码分泌多肽的编码区段天然连接。或者, 编码序列的 5′ 端可以含有对编码序列而言是外来的信号肽编码区。 如果编码序列天然地不含信号肽编码 区, 则可能需要外来的信号肽编码区。 或者, 外来的信号肽编码区可简单地替换天然信号肽 编码区以便增强多肽的分泌。然而, 指导表达的多肽进入所选择宿主细胞分泌途径的任何 信号肽编码区均可用于本发明。
     对于细菌宿主细胞有效的信号肽编码区有从芽孢杆菌 NCIB 11837 的产麦芽糖淀 粉酶、 嗜热脂肪芽孢杆菌的 α- 淀粉酶、 地衣芽孢杆菌的枯草杆菌蛋白酶、 地衣芽孢杆菌的β- 内酰胺酶、 嗜热脂肪芽孢杆菌的中性蛋白酶类 (nprT、 nprS、 nprM)、 和枯草芽孢杆菌的 prsA 基因获得的信号肽编码区。还有 Simonen 和 Palva, 1993, Microbiological Reviews 57 : 109-137 中描述的其它信号肽。
     对于丝状真菌宿主细胞有效的信号肽编码区有从米曲霉 TAKA 淀粉酶、 黑曲霉中 性淀粉酶、 黑曲霉葡糖淀粉酶、 Rhizomucor miehei 天冬氨酸蛋白酶、 Humicola insolens 纤 维素酶和 Humicola lanuginosa 脂肪酶的基因获得的信号肽编码区。
     对于酵母宿主细胞有用的信号肽是从酿酒酵母 α- 因子和酿酒酵母转化酶的基 因获得的。Romanos 等, 1992, 同上中描述了的其它有用的信号肽编码区。
     调控序列还可以是前肽 (propeptide) 编码区, 它编码位于多肽氨基末端的氨基 酸序列。所得的多肽可称为酶原 (proenzyme) 或多肽原 (propolypeptide)。多肽原一般是 没有活性的, 通过催化或自催化切割将前肽从多肽原切除后, 可转变为成熟有活性的多肽。 前肽编码区可从枯草芽孢杆菌碱性蛋白酶 (aprE)、 枯草芽孢杆菌中性蛋白酶 (nprT)、 酿酒 酵母 α- 因子、 Rhizomucor miehei 天冬氨酸蛋白酶、 和 Myceliophthora thermophila 漆 酶 (WO 95/33836) 的基因获得。
     当信号肽和前肽区都存在于多肽的氨基末端时, 前肽区位于靠近多肽氨基末端的 位置, 而信号肽区位于靠近前肽区的氨基末端位置。在酵母中, 可使用 ADH2 系统或 GAL1 系 统。在丝状真菌中, 可使用 TAKA α- 淀粉酶启动子、 黑曲霉葡糖淀粉酶启动子、 和米曲霉葡 糖淀粉酶启动子作为调节序列。
     调节序列的其它实例有使基因得以扩增的那些调节序列。在真核系统中, 这些包 括在氨甲喋呤存在时扩增的二氢叶酸还原酶基因, 以及在重金属存在下扩增的金属硫蛋白 基因。在这些情况中, 编码多肽的核苷酸序列将与调节序列可操作地连接。
     重组表达载体
     本发明还涉及包含本发明的核酸构建体的重组表达载体。可以将上述述的各种 核酸和调控序列连接到一起以产生重组表达载体, 此载体可包括一个或多个便利的限制性 位点使得在这些位点可插入或替换编码多肽的核苷酸序列。或者, 本发明的核苷酸序列可 通过将核苷酸序列或含有序列的核酸构建体插入适当的表达载体进行表达。 构建表达载体 时, 将编码序列置于载体中以使编码序列与适当的表达调控可操作地连接。
     重组表达载体可以是可方便的接受重组 DNA 操作并能引起核苷酸序列表达的任 何载体 ( 例如质粒或病毒 )。载体的选择通常取决于载体与引入此载体的宿主细胞之间的 相容性。载体可以是线性的或闭合环状的质粒。
     载体可以是自主复制载体, 即以染色体外实体的形式存在, 且其复制独立于染色 体的复制的载体, 例如质粒、 染色体外元件、 微型染色体、 或人工染色体。
     载体可包含任何用于确保自我复制的手段。 或者, 载体可以是这样的载体 : 它在导 入宿主细胞后, 整合到基因组中并与其整合进入的染色体一起复制。 此外, 可使用单一载体 或质粒, 或是一起含有待引入宿主细胞基因组的全部 DNA 的两种或多种载体或质粒, 或者 转座子。
     本发明载体优选包含一种或多种允许容易地选择转化细胞的选择标记。 选择标记 是这样的一类基因, 其产物有助于产生抗微生物剂或病毒抗性、 重金属抗性、 营养缺陷型变 成原养型 (prototrophy to auxotrophs) 等等。细菌选择标记的实例有来自枯草芽孢杆菌或地衣芽孢杆菌的 dal 基因, 或者赋予 抗生素抗性诸如氨苄青霉素、 卡那霉素、 氯霉素或四环素抗性的标记。 适于酵母宿主细胞的 标记有 ADE2、 HIS3、 LEU2、 LYS2、 MET3、 TRP1 和 URA3。在丝状宿主细胞中使用的选择标记包 括但不限于 : amdS( 乙酰胺酶 )、 argB( 鸟氨酸氨甲酰基转移酶 )、 bar( 膦丝菌素乙酰基转移 酶 )、 hygB( 潮霉素磷酸转移酶 )、 niaD( 硝酸还原酶 )、 pyrG( 乳清苷 -5′ - 磷酸脱羧酶 )、 sC( 硫酸腺苷酰转移酶 (sulfate adenyltransferase)) 和 trpC( 邻氨基苯甲酸合酶 ) 及其 等价物。
     优选用于曲霉属 (Asperigillus) 细胞的是构巢曲霉或米曲霉的 amdS 和 pyrG 基 因以及吸水链霉菌 (Streptomyces hygroscopicus) 的 bar 基因。
     本发明的载体优选包含允许载体整合到宿主细胞基因组中或者允许载体在细胞 中不依赖于基因组自主复制的元件。
     对整合到宿主细胞基因组而言, 载体可依赖编码多肽的多核苷酸序列或任何其它 载体元件通过同源或非同源重组整合到基因组中。 或者, 载体可包含附加的核苷酸序列, 来 指导通过同源重组在染色体精确位置整合进入宿主细胞基因组中。 这些附加的核苷酸序列 使载体可以在染色体上的精确位置整合到宿主细胞基因组中。为了提高在精确位置整合 的可能性, 整合元件应优选包含足够数目的与对应靶序列高度同源的核酸, 诸如 100-1,500 个碱基对、 优选 400-1,500 个碱基对、 且最优选 800-1,500 个碱基对, 从而提高同源重组的 概率。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。此外, 整合元件可 以是非编码或编码核苷酸序列。另一方面, 载体可通过非同源重组整合到宿主细胞的基因 组中。
     对自主复制而言, 载体还可包含能使载体在所述的宿主细胞中自主复制的复制 起点。细菌复制起点的实例有允许在大肠杆菌中复制的质粒 pBR322、 pUC19、 pACYC177 和 pACYC184 的复制起点, 以及允许使得在芽孢杆菌中复制的 pUB110、 pE194、 pTA1060 和 pAMβ1 的复制起点。用于酵母宿主细胞的复制起点的实例有 2μm 复制起点、 ARS1、 ARS4、 ARS1 和 CEN3 的组合、 及 ARS4 和 CEN6 的组合。
     复制起点可以具有使其在宿主细胞内的作用成为温度敏感型的突变 ( 见, 例如, Ehrlich, 1978, Proceedings of the National.Academy of Sciences USA 75 : 1433)。
     可以将多于一个拷贝的编码本发明的多肽的核酸序列插入宿主细胞中以增强该 基因产物的表达。核苷酸序列拷贝数的增加可以通过下述实现 : 将至少核酸序列的另一个 拷贝整合到宿主细胞基因组中, 或者将核酸序列包含有可扩增的选择性标记基因, 通过在 合适的选择剂的存在下培养细胞, 能筛选出含有扩增拷贝的选择性标记基因、 从而也就含 有所述核酸序列的更多拷贝的细胞。
     用于连接上述元件以构建本发明重组表达载体的方法是本领域技术人员所熟知 的 ( 例如参见 Sambrook 等, 1989, 同上 )。
     重组宿主细胞
     本发明还涉及包含本发明的核酸构建体的重组宿主细胞, 它们可有利的用于所述 多肽的重组生产。 如前所述, 将包含本发明核苷酸序列的载体引入宿主细胞, 以使载体作为 染色体的整合体或作为自主复制的染色体外载体被保持。
     宿主细胞可以是单细胞微生物, 例如原核生物, 或非单细胞微生物, 例如真核生物。 有用的单细胞微生物有细菌细胞, 诸如革兰氏阳性细菌, 包括但不限于芽孢 杆 菌 属 细 胞, 例 如 嗜 碱 芽 孢 杆 菌 (Bacillus alkaphilus)、 解 淀 粉 芽 孢 杆 菌 (Bacillus amyloliquefaciens)、短 芽 孢 杆 菌 (Bacillus brevis)、环 状 芽 孢 杆 菌 (Bacillus circulans)、 Bacillus clausii、 凝 结 芽 孢 杆 菌 (Bacillus coagulans)、 灿烂芽孢杆菌 (Bacillus lautus)、 迟缓芽孢杆菌 (Bacillus lentus)、 地衣芽孢杆菌、 巨大芽孢杆菌 (Bacillus megaterium)、 嗜热脂肪芽孢杆菌、 枯草芽孢杆菌、 和苏云金芽孢杆菌 (Bacillus thuringiensis) ; 或链霉菌属 (Streptomyces) 细胞, 例如浅青紫链霉菌 (Streptomyces lividans) 和鼠灰链霉菌 (Streptomyces murinus), 或者革兰氏阴性细菌, 诸如大肠杆菌和 假单胞菌种 (Pseudomonas sp.)。在一个特定的实施方案中, 细菌宿主细胞是迟缓芽孢杆 菌、 地衣芽孢杆菌、 嗜热脂肪芽孢杆菌、 或枯草杆菌细胞。 在另一个优选的方面, 芽孢杆菌属 细胞是嗜碱的 (alkalophilic) 芽孢杆菌。
     将载体导入细菌宿主细胞可通过例如原生质体转化 ( 参见例如 Chang 和 Cohen, 1979, Molecular General Genetics 168 : 111-115)、 使用感受态细胞 ( 参见例如 Young 和 Spizizen, 1961, Journal of Bacteriology 81 : 823-829 ; 或 Dubnau 和 Davidoff-Abelson, 1971, Journal of Molecular Biology 56 : 209-221)、 电 穿 孔 ( 参 见 例 如 Shigekawa 和
     Dower, 1988, Biotechniques 6 : 742-751)、 或 接 合 ( 参 见 例 如 Koehler 和 Thorne, 1987, Journal of Bacteriology 169 : 5771-5278) 来实现。
     宿主细胞可以是真核细胞, 诸如哺乳动物、 昆虫、 植物、 或真菌细胞。
     在一个优选的方面, 宿主细胞是真菌细胞。 “真菌”在用于本文时包括子囊菌 门 (Ascomycota)、 担 子 菌 门 (Basidiomycota)、 壶 菌 门 (Chytridiomycota)、 和接合菌门 (Zygomycota)( 如 Hawksworth 等, 在 Ainsworth and Bisby’ s Dictionary of The Fungi, 第八版, 1995, CAB International, University Press, Cambridge, UK 中所定义的 ), 以及 卵菌门 (Oomycota)( 如 Hawksworth 等, 1995, 同上第 171 页中所引用的 ) 和所有有丝分裂 孢子真菌 (Hawksworth 等, 1995, 同上 )。在一个更优选的方面, 真菌宿主细胞是酵母细胞。 “酵母” 在用于本文时包括产子囊酵母 ( 内孢霉目 Endomycetales)、 产担孢子酵母、 和属于 半知菌类 (Fungi Imperfecti) 的酵母 ( 芽孢纲 Blastomycetes)。由于酵母的分类今后还 会变化, 对于本发明来说, 酵母应该是如在 Biology and Activities of Yeast(Skinner, F.A.、 Passmore, S.M. 和 Davenport, R.R. 编, Soc.App.Bacteriol.Symposium Series No.9, 1980) 中所定义的。
     在一个更优选的方面, 酵母宿主细胞是假丝酵母属、 汉逊酵母属 (Hansenula)、 克 鲁维酵母属 (Kluyveromyces)、 毕赤酵母属 (Pichia)、 糖酵母属 (Saccharomyces)、 裂殖酵 母属 (Schizosaccharomyces)、 或 Yarrowia 属细胞。
     在 一 个 最 优 选 的 方 面, 酵 母 宿 主 细 胞 是 卡 尔 斯 伯 糖 酵 母 (Saccharomyces carlsbergensis)、 酿酒酵母 (Saccharomyces cerevisiae)、 糖化糖酵母 (Saccharomyces diastaticus)、 Saccharomyces douglasii、 Saccharomyces kluyveri、 Saccharomyces norbensis 或卵形糖酵母 (Saccharomyces oviformis) 细胞。 在另一个最优选的方案中, 酵 母宿主细胞是乳酸克鲁维酵母 (Kluyveromyces lactis) 细胞。在另一个最优选的方案中, 酵母宿主细胞是 Yarrowia lipolytica 细胞。在另一个更优选的方面, 真菌宿主细胞是丝状真菌细胞。 “丝状真菌” 包括真菌门 (Eumycota) 和卵菌门 (Oomycota)( 如 Hawksworth 等, 1995, 文献同上所定义的 ) 所有丝状 形式的亚类。丝状真菌特征在于通常由几丁质、 纤维素、 葡聚糖、 脱乙酰壳多糖、 甘露聚糖、 以及其它复合多糖组成的菌丝体壁。 营养生长依靠菌丝延长, 且碳分解代谢是专性需氧的。 相反, 诸如酿酒酵母的酵母的营养生长通过单细胞原植体的芽殖进行, 且碳分解代谢可以 是发酵的。
     在一个甚至更优选的方面, 丝状真菌宿主细胞是 Acremonium 属、 曲霉属、 镰孢属 (Fusarium)、 腐质霉属 (Humicola)、 毛霉属 (Mucor)、 毁丝霉属 (Myceliophthora)、 脉孢霉 属 (Neurospora)、 青霉属 (Penicillium)、 梭孢壳属 (Thielavia)、 Tolypocladium 属、 或木 霉属 (Trichoderma) 的细胞。
     在 一 个 最 优 选 的 方 面, 丝 状 真 菌 宿 主 细 胞 是 泡 盛 曲 霉、 臭 曲 霉 (Aspergillus foetidus)、 日本曲霉 (Aspergillus japonicus)、 构巢曲霉、 黑曲霉、 或米曲霉细胞。在 另一个最优选的方案中, 丝状真菌宿主细胞是杆孢状镰孢 (Fusarium bactridioides)、 Fusarium cerealis、 Fusarium crookwellense, 大 刀 镰 孢 (Fusarium culmorum)、 禾谷 镰 孢 (Fusarium graminearum)、 禾 赤 镰 孢 (Fusarium graminum)、 异 孢 镰 孢 (Fusarium heterosporum)、 合 欢 木 镰 孢 (Fusarium negundi)、 尖 孢 镰 孢 (Fusarium oxysporum)、 多 枝 镰 孢 (Fusarium reticulatum)、 玫 瑰 色 镰 孢 (Fusarium roseum)、 接骨木镰孢 (Fusarium sambucinum)、 肤色镰孢 (Fusarium sarcochroum)、 拟分枝孢镰孢 (Fusarium sporotrichioides)、 硫色镰孢 (Fusarium sulphureum)、 Fusarium torulosum、 Fusarium trichothecioides、 Fusarium venenatum 细胞。在一种最优选的实施方案中, 丝状真菌 亲代细胞是 Fusarium venenatum(Nirenberg sp.nov.) 细胞。在另一种最优选的实施方 案中, 丝状真菌宿主细胞是 Humicola insolens、 Humicola lanuginosa、 Mucor miehei、 Myceliophthora thermophila、 粗糙脉孢霉 (Neurospora crassa)、 产紫青霉、 Thielavia terrestris、 Trichoderma harzianum、 康宁木霉 (Trichoderma koningii)、 Trichoderma longibrachiatum、 Trichoderma reesei 或绿色木霉细胞。
     真菌细胞可以本身已知的方式通过涉及原生质体形成、 原生质体转化、 和细胞壁 再生的过程进行转化。EP 238 023 和 Yelton 等, 1984, Proceedings of the National Academy of Sciences USA 81 : 1470-1474 中描述了适合曲霉属和木霉属宿主细胞转化的 过程。Malardier 等, 1989, Gene 78 : 147-159 和 WO 96/00787 中描述了适合转化镰孢属物 种的方法。酵母可利用 Becker 和 Guarente 在 Abelson, J.N. 和 Simon, M.I. 编的 Guide to Yeast Genetics and Molecular Biology, Methods in Enzymology, Volume.194, pp 182-187, Academic Press 公司, New York ; Ito 等, 1983, Journal of Bacteriology 153 : 163 ; 及 Hinnen 等, 1978, Proceedings of the National Academy of Sciences USA 75 : 1920 中所描述的程序转化。
     生产方法
     本发明还涉及生产本发明的酶的方法, 包括 : (a) 培养包含编码本发明的酶的核 苷酸序列的生物株系, 其中所述株系能表达和分泌该酶 ; 并 (b) 回收所述酶。 在一个具体的 实施方案中, 所述株系是野生型株系, 例如 Botryospaeria rhodina CBS 274.96, 而在另一 个实施方案中所述株系是如上所述的重组宿主细胞。在本发明的生产方法中, 利用本领域众所周知的方法在适于产生所述酶的培养基 中培养细胞。例如, 可在实验室或工业发酵罐中, 在适当的培养基和可使所述多肽表达和 / 或分离的条件下, 通过摇瓶培养、 小规模或大规模发酵 ( 包括连续、 分批、 补料 - 分批、 或固 态发酵 ) 来进行细胞培养。培养使用本领域已知的程序在含有碳和氮源以及无机盐的合适 营养培养基中进行。适宜的培养基可从商业供应商获得, 或者可根据已公布的配方来制备 ( 例如参见美国典型培养物保藏中心的目录 )。如果酶被分泌到培养基中, 那么可直接从培 养基中回收酶。如果酶不分泌, 那么可从细胞裂解物中进行回收。
     所得的酶多肽可通过本领域已知的方法回收。 例如, 可通过常规程序, 包括但不限 于离心、 过滤、 萃取、 喷雾干燥、 蒸发、 或沉淀, 从培养基中回收所述酶。
     本发明的多肽可通过本领域已知的多种程序纯化, 包括但不限于层析 ( 例如离子 交换、 亲和、 疏水、 层析聚焦、 和大小排阻 )、 电泳 ( 例如制备性等电聚焦 )、 差异溶解 ( 例如 硫酸铵沉淀 )、 SDS-PAGE、 或萃取 ( 例如参见 Protein Purification, J.-C.Janson 和 Lars Ryden 编, VCH Publishers, New York, 1989。
     转基因植物
     本发明还涉及转基因植物、 植物部分或者植物细胞, 它们已被编码本发明的酶的 核苷酸序列所转化, 从而表达所述酶。在一个实施方案中所述植物可以用作以可回收的量 生产所述酶的宿主。可以从所述植物或植物部分回收酶。或者, 含有该重组酶的植物或植 物部分本身可以用来提高食品或饲料的质量, 例如, 改善营养价值、 适口性和流变学性质, 或破坏抗营养因子 (antinutritional factor)。具体地, 表达所述酶的植物或植物部分可 以作为改良的起始材料用于生产燃料酒精或生物乙醇 (bio-ethanol)。
     所述转基因植物可以是双子叶的 ( 双子叶植物 ) 或单子叶的 ( 单子叶植物 )。单 子叶植物的实例是草类 / 禾本科 (grasses), 例如草地早熟禾 (meadow grass)( 蓝草 (blue grass), 早熟禾属 (Poa)), 饲用牧草 (forage grass), 例如羊茅属 (festuca), 黑麦草属 (lolium) ; 寒地型牧草 (temperate grass), 例如剪股颖属 (Agrostis) ; 和谷类 (cereals), 如小麦、 燕麦、 黑麦、 大麦、 稻、 高粱和玉米 (maize)( 玉米 (corn))。
     双子叶植物的例子有 : 烟草 ; 豆类 (legumes), 例如羽扇豆 (lupins) ; 马铃薯 ; 甜 菜; 豌豆 ; 菜豆 (bean) 和大豆, 和十字花科植物 (Brassicaceae), 例如花椰菜、 油菜籽 (rape seed) 和与之亲缘关系紧密的模式生物拟南芥 (Arabidopsis thaliana)。
     植物部分的例子有茎、 愈伤组织、 叶、 根、 果实、 种子和块茎。 特定的植物组织, 例如 叶绿体、 质外体、 线粒体、 液泡、 过氧化物酶体和细胞质, 都被认为是植物部分。 另外, 任何植 物细胞, 不管其来自什么组织, 都被认为是植物部分。
     这些植物、 植物部分和植物细胞的后代也被包括在本发明的范围之内。
     所述表达本发明的酶的转基因植物或植物细胞可以根据本领域已知的方法构建。 简单地说, 所述植物或植物细胞这样构建的 : 将一个或多个编码本发明的酶的表达构建体 整合入植物宿主的基因组, 并使所得的修饰植物或植物细胞繁殖成为转基因植物或植物细 胞。
     方便地, 所述表达构建体是包含核苷酸序列的核酸构建体, 所述核苷酸序列编码 本发明的酶, 且可操作地连接于在所选植物或植物部分中表达该核苷酸序列所需的合适的 调控序列。另外, 该表达构建体还可以包括可用于鉴定已经整合了表达构建体的宿主细胞的可选择标记 ; 以及将该构建体导入所述的植物所需要的 DNA 序列 ( 后者取决于使用的 DNA 导入方法 )。
     选择调节序列, 例如启动子和终止子序列, 以及可选的信号或转运序列, 是根据例 如想要在何时、 何处、 怎样表达该酶而决定的。例如, 编码本发明的酶的基因的表达可以是 组成型或诱导型的, 或者可为发育性、 阶段或组织特异性的, 而且基因产物可以被靶向于具 体的组织或者植物部分例如种子或叶。对调节序列的描述有例如 Tague 等, 1988, Plant Physiology 86 : 506。
     对 于 组 成 性 表 达, 可 以 使 用 35S-CaMV 启 动 子 (Franck 等 ., 1980.Cell 21 : 285-294)。 器 官 特 异 性 的 启 动 子 可 以 是, 例 如, 来 自 存 储 性 贮 藏 组 织 (storage sink tissues) 例如种子、 马铃薯的块茎及果实的启动子 (Edwards 和 Coruzzi, 1990, Ann.Rev. Genet.24 : 275-303), 或者来自代谢性贮藏组织 (metabolic sink tissues) 例如分生组 织的启动子 (Ito 等, 1994, Plant Mol.Biol.24 : 863-878) ; 或者是种子特异性的启动子, 例如来自稻的谷蛋白、 谷醇溶蛋白、 球蛋白或白蛋白启动子 (Wu 等, 1998, Plant and Cell Physiology 39 : 885-889), 来自蚕豆 (Vicia faba) 的豆球蛋白 B4 和未知的种子蛋白基因 的蚕豆启动子 (Conrad 等, 1998, Journal of Plant Physiology 152 : 708-711), 来自种 子油体 (seed oil body) 蛋白的启动子 (Chen 等, 1998, Plant and Cell Physiology 39 : 935-941), 来自欧洲油菜 (Brassica napus) 的贮存蛋白 napA 启动子, 或任何其他本领域已 知的种子特异性的启动子, 例如 WO 91/14772 所描述的。另外, 该启动子还可以是叶特异 性的启动子, 例如稻或西红柿的 rbcs 启动子 (Kyozuka 等, 1993, Plant Physiology 102 : 991-1000) ; 小球藻病毒腺嘌呤甲基转移酶基因启动子 (Mitra 和 Higgins, 1994, Plant Molecular Biology 26 : 85-93), 或来自稻的 aldP 基因启动子 (Kagaya 等, 1995, Molecular and General Genetics 248 : 668-674) ; 或为创伤诱导的启动子例如马铃薯 pin2 启动子 (Xu 等, 1993, Plant Molecular Biology 22 : 573-588)。
     也可以使用启动子增强元件来获得在植物中酶的更高表达。例如, 启动子增强元 件可以是位于启动子和编码本发明的酶的核苷酸序列之间的内含子。例如 Xu 等, 1993( 同 上 ) 公开了稻肌动蛋白 1 基因的第一个内含子增强表达的用途。
     可选择标记基因和表达构建体的任何其他部分都可以从本领域可用的那些中选 择。
     根据本领域已知的常规技术将该核酸构建体整合入植物基因组, 所述技术包括农 杆菌 (Agrobacterium) 介导的转化、 病毒介导的转化、 显微注射、 粒子轰击、 生物射弹转化 (biolistic tranformation) 和电穿孔 (Gasser 等, 1990, Science 244 : 1293 ; Potrykus, 1990, Bio/Technology 8 : 535 ; Shimamoto 等, 1989, Nature 338 : 274)。
     目前, 根瘤农杆菌 (Agrobacterim tumefaciens) 介导的基因转移是产生转基因双 子叶植物的优选方法 ( 见 Hooykas 和 Schilperoort, 1992, Plant Molecular Biology 19 : 15-38 的综述 )。不过该方法也可以用于转化单子叶植物, 尽管单子叶植物一般优选别的转 化方法。目前, 产生转基因单子叶植物的优选方法是粒子 ( 被用于转化的 DNA 所包被的极 小金或钨粒子 ) 轰击胚愈伤组织 (embroynic calli) 或发育中的胚 (Christou, 1992, Plant Journal 2 : 275-281 ; Shimamoto, 1994, Current Opinion Biotechnology 5 : 158-162 ; Vasil 等, 1992, Bio/Technology 10 : 667-674)。 另外一种可选的转化单子叶植物的方法是基于原生质体转化, 如 Omirulleh 等, 1993, Plant Molecular Biology 21 : 415-428 所述。
     转化以后, 选择整合了表达构建体的转化子, 并根据本领域熟知的方使其再生为 完整植株。
     本发明还涉及产生本发明的酶的方法, 其包括 (a) 在有利于生产所述酶的条件 下, 培养含有编码本发明的酶的核苷酸序列的转基因植物或植物细胞 ; 和 (b) 回收该酶。
     包含酶多肽的组合物和它们的制备方法
     本发明提供包含本发明的多肽和赋形剂的组合物和制备这样的组合物的方法, 该 方法包括混合本发明的多肽和赋形剂。在一个具体的实施方案中, 本发明的多肽是该组合 物, 例如单组分组合物中的主要 ( 多肽 ) 成分。在这里, 赋形剂应理解为用于配制所述组合 物的任何辅助性的试剂或化合物, 包括溶剂、 载体、 稳定剂等。
     该组合物还可以包含一种或多种其它的酶, 例如氨肽酶、 淀粉酶、 糖酶、 羧肽酶、 过 氧化氢酶、 纤维素酶、 几丁质酶、 角质酶、 环糊精糖基转移酶、 脱氧核糖核酸酶、 酯酶、 α- 半 乳糖苷酶、 β- 半乳糖苷酶、 葡糖淀粉酶、 α- 葡糖苷酶、 β- 葡糖苷酶、 卤素过氧化物酶 (haloperoxidase)、 转化酶、 漆酶、 脂肪酶、 甘露糖苷酶、 氧化酶、 果胶分解酶、 肽谷氨酰胺 酶、 过氧化物酶、 肌醇六磷酸酶、 多酚氧化酶、 蛋白水解酶、 核糖核酸酶、 转谷氨酰胺酶、 或木 聚糖酶。
     所述组合物可以根据本领域已知的方法制备并可以为液体或固体组合物的形式。 例如, 酶组合物可以用多肽和 / 或药品制剂技术领域已知的方法配制, 例如配制为包衣或 未包衣的颗粒或微颗粒。因此本发明的多肽可以以颗粒, 优选非粉化性 (non-dusting) 颗 粒, 液体, 特别是稳定化的液体, 浆液或被保护的多肽的形式提供。 对于一定的用途, 可优选 将多肽固定到固态基质上。
     组合物中要包含的多肽可以根据本领域已知的方法稳定化, 例如通过加入抗氧化 剂或还原剂以限制多肽的氧化从而稳定组合物中的多肽, 或可通过加入例如 PVP、 PVA、 PEG 或其它已知对多肽在固体或液体组合物中的稳定性有益的合适的聚合物来稳定它。
     在另外的实施方案中, 本发明的组合物是去污剂组合物, 该组合物除了本发明 的 多 肽 以 外还 包含表 面活性 剂, 以及, 任选地, 选自增 效剂 (builder) 例如沸 石、 漂白 剂 例 如 过 碳 酸 盐、 漂 白 促 进 剂 (bleach enhancers) 例 如 TAED 或 NOBS、 抑 泡 剂 (suds suppressors)、 芳香剂等等的化合物。
     在另一个实施方案中本发明的组合物是饲料组合物, 其除了本发明的多肽以外还 包含谷类 (cereal) 或谷物 (grain) 产品。
     在另一个实施方案中本发明的组合物是包含本发明的多肽的食品组合物例如面 包粉 (baker’ s flour) 组合物、 酿造产品、 果汁、 油或猪油产品。
     在另一个实施方案中本发明的组合物是纸浆组合物, 其除了本发明的多肽外还含 有纸浆。
     在另一个实施方案中本发明的组合物是杀生物 (biocidal) 组合物, 其除了本发 明的多肽外还含有氧化还原酶促进剂。
     酶多肽和包含它们的组合物的用途
     在另外的方面中, 本发明提供本发明的多肽或多核苷酸, 或包含所述多肽或多核 苷酸的组合物在多种应用特别是 ( 技术 ) 过程例如工业或家庭中进行的过程中, 及下面的用于商业研究的目的的用途。因此本文涵盖这样的过程, 其包括在 ( 技术的 ) 工业、 研究或 家用过程中使用本发明的多肽或本发明的多核苷酸。
     在一个实施方案中本发明的多肽或组合物被用来清洗纤维质织物。
     在另一个实施方案中使用本发明的多肽或组合物制备食品或饲料添加剂。
     在另一个实施方案中使用本发明的多肽或组合物处理木质 (lignolosic) 材料和 纸浆。
     去污剂的公开
     本发明的多肽可以添加到去污剂 (detergent) 组合物中并因此成为其组分。
     本发明的去污剂组合物可以, 例如, 配制为手洗或机洗衣物用去污剂组合物, 其 包括适用于预处理染污织物的洗衣添加剂组合物, 和漂洗加入的织物软化组合物 (rinse added fabric softener composition) ; 或者可以配制为用于一般家用硬表面清洗操作的 去污剂组合物, 或配制为用于手洗或机洗碗碟操作。
     在一个特定的方面中, 本发明提供包含本发明的多肽的去污剂添加剂。该去污剂 添加剂及去污剂组合物可包含一种或多种其他的酶例如蛋白酶、 脂肪酶、 角质酶、 淀粉酶、 糖酶、 纤维素酶、 果胶酶、 甘露聚糖酶、 阿拉伯糖酶 (arabinase)、 半乳聚糖酶、 木聚糖酶、 氧 化酶例如漆酶和 / 或过氧化物酶。
     一般而言, 所选的酶的性质应该与所选的去污剂相容 ( 例如最适 pH、 与其他酶或 非酶成分的相容性等等 ), 而且该酶应当以有效量存在。
     蛋白酶 : 合适的蛋白酶包括动物、 植物或微生物来源的那些蛋白酶。微生物来源 是优选的。还包括化学修饰的或蛋白质工程改造的突变体。该蛋白质可以是丝氨酸蛋白酶 或金属蛋白酶, 优选地为碱性微生物蛋白酶或胰蛋白酶样 (trypsin-like) 蛋白酶。碱性 蛋白酶的例子有枯草杆菌蛋白酶, 特别是来自芽孢杆菌的那些, 例如枯草杆菌蛋白酶 Novo、 枯草杆菌蛋白酶 Carlsberg、 枯草杆菌蛋白酶 309、 枯草杆菌蛋白酶 147 和枯草杆菌蛋白酶 168( 如 WO89/06279 所述 )。胰蛋白酶样蛋白酶的例子有胰蛋白酶 ( 例如猪或牛来源的 ) 和镰孢属 (Fusarium) 蛋白酶, 其在 WO 89/06270 和 WO 94/25583 中有描述。
     有用的蛋白酶的例子有 WO 92/19729、 WO 98/20115、 WO 98/20116 和 WO 98/34946 中所描述的变体, 特别是那些文献中所述的特定位置上有置换的变体。
     优 选 的 商 业 上 可 获 得 的 蛋 白 酶 包 括 Alcalase , Savinase , Primase , Duralase , Esperase , 和 Kannase (Novozymes A/S), Maxatase , Maxacal , Maxapem , Properase , Purafect , Purafect OxP , FN2 ,和 FN3 (Genencor International Inc.)。
     脂肪酶 : 合适的脂肪酶包括细菌或真菌来源的那些脂肪酶。还包括化学修饰 的或蛋白质工程改造的突变体。有用的脂肪酶的例子包括来自腐质霉属 (Humicola, 与 Thermomyces 同 义 ) 的 脂 肪 酶, 例 如 EP 258 068 和 EP 305 216 所 描 述 的 来 自 H.lanuginosa(T.lanuginosus) 的脂肪酶, 或 WO 96/13580 所描述的来自 H.insolens 的 脂肪酶, 假单胞菌 (Pseudomonas) 脂肪酶, 例如来自产碱假单胞菌 (P.alcaligenes) 或类 产碱假单胞菌 (P.pseudoalcaligenes)(EP 218 272)、 洋葱假单胞菌 (P.cepacia)(EP 331 376)、 司徒茨假单胞菌 (P.stutzeri)(GB 1,372,034)、 荧光假单胞菌 (P.fluorescens)、 假 单胞菌菌种 SD705 株 (WO 95/06720 和 WO 96/27002) 和 P.wisconsinensis(WO 96/12012)的脂肪酶 ; 芽孢杆菌脂肪酶, 例如来自枯草芽孢杆菌 (Dartois 等, (1993), Biochemica et Biophysica Acta, 1131, 253-360)、 嗜热脂肪芽孢杆菌 (JP 64/744992)、 或短小芽孢杆菌 (B.pumilus)(WO 91/16422) 的脂肪酶。
     其 他 的 例 子 有 WO 92/05249, WO 94/01541, EP 407 225, EP 260 105, WO 95/35381, WO 96/00292, WO 95/30744, WO 94/25578, WO 95/14783, WO 95/22615, WO 97/04079 和 WO 97/07202 中所描述的脂肪酶变体。
     优 选 的 商 业 上 可 获 得 的 脂 肪 酶 包 括 LipolaseTM, Lipolase UltraTM 和 LipexTM(Novozymes AJS)。
     淀粉酶 : 合适的淀粉酶 (α 和 / 或 β) 包括细菌或真菌来源的那些淀粉酶。还包 括化学修饰的或蛋白质工程改造的突变体。淀粉酶包括, 例如, 得自芽孢杆菌, 例如一种特 别的地衣芽孢杆菌菌株 ( 在 GB 1,296,839 中有详述 ) 的 α- 淀粉酶。
     有用的淀粉酶的例子有 WO 94/02597, WO 94/18314, WO 96/23873 和 WO97/43424 中描述的变体, 特别是那些文献中所述的特定位置上有置换的变体。
     优 选 的 商 业 上 可 获 得 的 淀 粉 酶 包 括 DuramylTM, TermamylTM, FungamylTM 和 BANTM(Novozymes A/S), RapidaseTM 和 PurastarTM( 来自 Genencor International Inc.)。 纤维素酶 : 合适的纤维素酶包括细菌或真菌来源的那些纤维素酶。还包括化 学修饰的或蛋白质工程改造的突变体。合适的纤维素酶包括来自芽孢杆菌属、 假单胞 菌属、 腐质霉属、 镰孢属、 梭孢壳属和 Acremonium 属的纤维素酶, 例如在 US 4,435,307, US 5,648,263, US 5,691,178, US 5,776,757 和 WO 89/09259 中 描 述 的、由 Humicola insolens、 Myceliophthora thermophila 和尖镰孢产生的真菌纤维素酶。
     特别合适的纤维素酶是具有护色 (color care) 的益处的碱性或中性纤维素酶。 这样的纤维素酶的例子有 EP 0 495 257, EP 0 531 372, WO 96/11262, WO 96/29397 和 WO 98/08940 中描述的纤维素酶。其他例子有纤维素酶变体, 例如 WO 94/07998, EP 0 531 315, US 5,457,046, US 5,686,593, US 5,763,254, WO 95/24471, WO 98/12307 和 PCT/ DK98/00299 中描述的那些。商业上可获得的纤维素酶包括 Celluzyme , 和 Carezyme (Novozymes), Clazinase , 和 Puradax HA (Genencor International Inc.), 和 KAC-500(B) (Kao Corporation)。
     过氧化物酶 / 氧化酶 : 合适的过氧化物酶 / 氧化酶包括植物、 细菌或真菌来源的那 些过氧化物酶 / 氧化酶。还包括化学修饰的或蛋白质工程改造的突变体。有用的过氧化物 酶的例子包括来自鬼伞属 (Coprinus) 的过氧化物酶, 例如来自灰盖鬼伞 (C.cinereus), 及 其变体, 如 WO 93/24618, WO 95/10602, 和 WO 98/15257 所述的那些的过氧化物酶。
     商业上可获得的过氧化物酶包括 Guardzyme (Novozymes A/S)。
     可以通过加入含有一种或多种酶的单独的添加剂, 或加入包含所有酶的复合添加 剂, 使去污酶 (detergent enzyme(s)) 包含在去污剂组合物中。本发明的去污剂添加剂, 即 单独的添加剂或复合添加剂, 可以配置为例如颗粒、 液体、 浆液等等。优选的去污剂添加剂 的剂型为颗粒, 特别是非粉化性颗粒、 液体, 特别是稳定化的液体, 或浆液。
     非粉化性颗粒可以, 例如, 如 US 4,106,991 和 4,661,452 所公开的那样制备, 任选 地, 还可以用本领域已知的方法来包被。蜡状 (waxy) 包被材料的例子有平均克分子量为 1000-20000 的聚 ( 环氧乙烷 ) 产品 ( 聚乙二醇, PEG) ; 具有 16-50 个环氧乙烷单位的乙氧
     基化壬基苯酚 ; 乙氧基化脂肪醇, 其中醇含 12-20 个碳原子, 且其中有 15-80 个环氧乙烷单 位; 脂肪醇 ; 脂肪酸 ; 以及脂肪酸的甘油单酯、 甘油二酯和甘油三酯。GB 1483591 提供了适 于通过流化床施用的成膜包被材料的例子。液体酶制备物可以, 例如, 按照已确立的方法, 通过加入多元醇, 如丙二醇、 糖或糖醇、 乳酸或硼酸来稳定化。可以根据 EP 238,216 所公开 的方法制备被保护的酶。
     本发明的去污剂组合物可以是任何方便的形式, 例如条、 片、 粉、 颗粒、 糊或液体。 液体去污剂可以是水性的, 通常含有高达 70%的水和 0-30%的有机溶剂, 或者可以是非水 性的。
     所述去污剂组合物包含一种或多种表面活性剂, 表面活性剂可以是非离子型包括 半极性的, 和 / 或阴离子型的, 和 / 或阳离子型的, 和 / 或两性离子型的。表面活性剂典型 地以 0.1-60 重量%的水平存在。
     当被包括在其中时, 所述去污剂通常含有大约 1%到大约 40%的阴离子表面活性 剂例如线性苯磺酸烷基酯、 α- 烯属磺酸酯、 硫酸烷基酯 ( 脂肪醇硫酸酯 )、 脂肪醇乙氧基硫 酸盐 (ethoxysulfate)、 二级链烷磺酸盐 (alkanesulfonate)、 α- 磺基脂肪酸甲酯、 烷基或 烯基琥珀酸或肥皂。
     当被包括在其中时, 所述去污剂通常含有约 0.2%到约 40%的非离子表面活性剂 如脂肪醇乙氧基化物、 壬基苯酚乙氧基化物、 烷基多苷、 烷基二甲基胺氧化物、 乙氧基化脂 肪酸单乙醇胺、 脂肪酸单乙醇胺、 多羟基烷基脂肪酰胺 (polyhydroxy alkyl fatty acid amide)、 或葡糖胺 (“葡萄糖胺” (“glucamides” )) 的 N- 酰基 N- 烷基衍生物。
     所 述 去 污 剂 可 包 括 0-65 % 的 洗 涤 增 效 剂 (detergent builder) 或 络 合 剂 (complexing agent) 如沸石、 二磷酸盐、 三磷酸盐、 膦酸盐 (phosphonate)、 碳酸盐、 柠檬酸 盐、 次氮基三乙酸、 乙二胺四乙酸、 二亚乙基三胺五乙酸、 烷基或烯基琥珀酸、 可溶的硅酸盐 或分层的 (layered) 硅酸盐 ( 例如来自 Hoechst 的 SKS-6)
     所述去污剂可包含一种或多种聚合物。例如羧甲基纤维素、 聚 ( 乙烯吡咯烷酮 )、 聚 ( 乙二醇 )、 聚 ( 乙烯醇 )、 聚 ( 乙烯吡啶 -N- 氧化物 )、 聚 ( 乙烯咪唑 )、 聚羧酸酯如聚丙 烯酸酯、 马来酸 / 丙烯酸共聚物和甲基丙烯酸月桂酯 / 丙烯酸共聚物。
     所述去污剂可包含漂白系统, 所述系统包括 H2O2 源例如过硼酸盐或过碳酸盐, 其 可与产过酸漂白激活剂 (peracid-forming bleach activator) 如四乙酰基乙二胺或壬酰 氧苯磺酸酯 (nonanoyloxybenzenesulfonate) 组合。或者, 漂白系统可包括例如酰胺、 二酰 亚胺或砜类型的过氧酸。
     本发明的去污剂组合物的酶可以用常规的稳定剂来稳定化, 例如多元醇如丙二 醇或丙三醇、 糖或糖醇、 乳酸、 硼酸或硼酸衍生物, 例如, 芳香族硼酸酯, 或苯硼酸衍生物如 4- 甲酰苯硼酸, 并且该组合物可以如 WO 92/19709 和 WO 92/19708 中描述的那样配制。
     洗涤剂溶液也可包括其他常规的洗涤剂组分, 例如织物调理剂 (conditioner) 包 括粘土, 促泡剂, 抑泡剂, 防蚀剂, 污物悬浮剂, 防污物再沉淀剂, 染料, 杀菌剂, 荧光增白剂, 水溶助长剂, 晦暗抑制剂, 或香料。
     在此考虑, 在所述去污剂组合物中, 任何酶, 特别是本发明的酶, 可以以相当于 0.01-100mg 酶蛋白每升洗涤液, 优选 0.05-5mg 酶蛋白每升洗涤液, 最优选 0.1-1mg 酶蛋白 每升洗涤液的量加入。本发明的酶还可以掺入到 WO 97/07202 所公开的去污剂组合物中, 在此将 WO 97/07202 并入本文作为参考。
     保藏的微生物
     根据 《国际承认的用于专利程序的微生物保存布达佩斯条约》 , 下列微生物被保 藏在真菌菌种保藏中心 (Centraalbureau voor Schimmelcultures), Fungal and Yeast Collection, Uppsala-laan 8, 3584 CT Utrecht, P.O.Box 85167, 3508 AD Utrecht, 荷兰 :
     名称 : Botryosphaeria rhodina
     同义名 : 棉色二孢 (Diplodia gossypina)(SBL 274)(Berkeley &M.A.Curtis)von Arx, von 1970,″ The genera of fungi sporulating in pure culture″ : 143
     分类 : Dothideaceae, Dothideales, Dothidemycetes, 子囊菌门 (Ascomycota)
     保藏号 : CBS 274.96
     保藏日期 : 1996 年 3 月 12 日 实施例 实施例 1 鉴定 Botryosphaeria rhodina CBS 274.96 分泌的功能性多肽
     培养液的酶指纹分析
     通过用多种酶测定方法对培养基肉汤进行测定, 获得了酶活性分布图。制备带底 物的 96 孔微量滴定 (MT) 板并保存在 10℃直到使用。制备了两种不同的 pH 变化形式 : pH3 和 pH7。使用下面的底物 : 0.05% AZCL(Mazurine 染色和交联的底物, Megazyme)- 直链淀 粉, 阿拉伯聚糖, β- 葡聚糖 ( 大麦 ), 酪蛋白, 胶原, 凝胶多糖, 葡聚糖, 半乳聚糖 ( 马铃薯 ), 半乳甘露聚糖 ( 角豆 )(carob), He- 纤维素、 支链淀粉 (pullulan)、 木聚糖 ( 燕麦 ) 和木葡 聚糖 (AZCL- 酪蛋白不能用在 pH3, 因此这些板中不加入 AZCL- 酪蛋白 )。
     pH3 底物的制备 :
     将 0.1g 的 每 种 AZCL 底 物 溶 解 在 100ml 的 0.2M 琥 珀 酸 pH3+10 微 升 Triton X-100(0.01% ) 中, 得到 0.1% AZCL 的终浓度。
     pH7 底物的制备 :
     将 0.1g 的每种 AZCL 溶解在 50ml 的无菌 H2O 加 10 微升 Triton X-100(0.01% ) 中。向每个 50ml AZCL 底物中加入 50ml 0.4M MOPS pH7, 得到终体积 100ml, 以及终浓度 0.2M 缓冲液, 0.1% AZCL。
     还包括了漆酶和脂肪酶活性的测定, 底物如下制备 :
     漆酶底物的制备 :
     制备溶于 0.2M 磷酸盐 / 硼酸盐缓冲液, pH9 的 0.08mg/ml Chicago Sky Blue 35ml。
     脂肪酶底物的制备 :
     通过以 3 ∶ 1 混合 2% PVA 溶液与大豆油制备聚乙烯醇 (PVA)/ 大豆油乳液。使用 ULTRA-TURRAX 混合器将油乳化, 并将 12ml 的乳液与 500ml 包含 10mM CaCl2, pH5.5 的 0.2M 乙酸钠缓冲液, 及 5ml 0.2%的结晶紫溶液混合。
     使 用 US Sterilin 96 孔 MT 板 和 Multidrop S20 装 板 器 (stacker), Titertek Instruments, Inc., Alabama。将 200 微升的每种 AZCL- 底物和脂肪酶底物和 150 微升的漆
     酶底物分装到 MT 孔中, 并将 30-50μl 培养基肉汤加入每份底物中, 26℃温育过夜。如下对 测定结果评分 : 0: 无活性 ; 1: 弱活性 ; 2: 强活性。
     结果表格 : 棉色二孢培养基肉汤的指纹分析
     底物 ACZL- 直链淀粉 ACZL- 阿拉伯聚糖 ( 去分枝 ) ACZL-β- 葡聚糖 ( 大麦 ) ACZL- 酪蛋白 ACZL- 胶原 ACZL- 凝胶多糖 ACZL- 葡聚糖 ACZL- 半乳聚糖 ( 马铃薯 ) ACZL- 半乳甘露聚糖 ( 角豆 ) ACZL-HE- 纤维素 ACZL- 支链淀粉 ACZL- 木聚糖 (Oat Spelts) ACZL- 木葡聚糖 Chicago Sky Blue PVA/ 大豆油
     a b酶活性 α- 淀粉酶 内切 -1, 5-α-L-arabinanase β- 葡聚糖酶、 地衣酶和纤维素酶 蛋白酶 蛋白酶 内切 -1, 3-β-D- 葡聚糖酶pH3 0a 0 2 Ntb 0 1pH7 1 2 1 2 1 0 0 2 2 2 0 2 2 0 0内切 -1, 6-α-D- 葡聚糖酶 ( 葡聚糖酶 ) 0 内切 -1, 4-β-D- 半乳聚糖酶 内切 -1, 4-β-D- 甘露聚糖酶 内切 - 纤维素酶 极限糊精酶 ( 支链淀粉酶 ) 内切 -1, 4-β-D- 木聚糖酶 内切纤维素酶 漆酶 脂肪酶 0 2 2 0 2 0 0 0活性测定的结果评分 : 0 =无活性 ; 1 =弱反应 ; 2 =强反应
     nt =未测试
     A.cDNA 文库构建
     用标准的分子生物学技术 (Ausuble 等 1995″ Current protocols in molecular biology″ Publ. : John Wiley and sons) 制备来自 Botryosphaeria rhodina CBS 274.96 的 cDNA。
     cDNA 文库生产中使用的生物质的发酵是从在 28℃下温育了 7 天的接种的 PDA 板 开始的。在有 Mex1 培养基的摇瓶中接种数个菌丝体 -PDA 琼脂塞 (plugs), 其中 Mex1 培养基含有 ( 每升 ) : 20g 大豆, 15g 麦麸, 10g 微结晶纤维素 (cellulose Avicel), 5g 麦芽糖糊 精 01, 3g 细菌用蛋白胨 (bacto peptone), 0.2g 聚氧丙烯 (pluronic)PE6100, 和 1g 橄榄油。 在 26℃下 150rpm 振荡这些摇瓶。7 日后通过 Miracloth 过滤收集菌丝体, 并将菌丝体冷冻 在液氮中, 在 -80℃下保存直到使用。
     RNA 分离 : 从冰冻、 粉状的 Botryospaeria rhodina 菌丝体制备总 RNA, 方法是通过 硫氰酸胍提取, 然后通过 5.7M CsCl 的下层 (cushion) 超速离心 (Chirgwin, J.M., Przbyla, A.E., Macdonlad, RJ. 和 Ruttwer W.J., Isolation of biologically active ribonucleic acid from sources enriched in ribonuclease, Biochemistry 18, 5294-5299, 1979)。 用 寡聚 (dT)- 纤维素亲和色谱 (Aviv, H. 和 Leder, P., Purification of biologically active globin messenger RNA by chromatography on oligothymidylic acid-cellulose, Proc. Natl.Acad.Sci.USA 69(6), 1408-1412, 1972) 分离富含多聚 A 的 RNA。
     cDNA 文库的构建 : 根据 Gubler U 和 Hoffman, B.J., A simple and very efficient method for generating cDNA libraries, Gene 25(2-3), 263-269, (1983) ; Sambrook, J., Fritsch, E.F. 和 Maniantis, T.Molecular cloning : A laboratory Manual, 第二版, 1989, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York 和 Kofod 等 (1994) 的一般方法使用多聚 A-Not1 引物 (Promega, 美国 ) 合成双链 cDNA。合成以后, 用绿豆核 糖核酸酶处理 cDNA, 用 T4 DNA 聚合酶平末端化, 然后与摩尔数过量 50 倍的 EcoRI 接头 (Invitrogen, 美国 ) 连接。根据制造商的指导, 用限制酶 NotI(New England Biolabs, 美 国 ) 切割 cDNA, 然后用琼脂糖凝胶电泳将 cDNA 按大小分级。 将对应于 700bp 及更大的 cDNA 从凝胶上切下并用 GFX DNA 分离试剂盒 (AP Biotech) 纯化。然后通过连接反应将制备好 的 cDNA 定向克隆到 EcoRI-NotI 切割的 pMHas5 中。通过电穿孔将连接混合物导入 DH10B 细胞 (Invitrogen) 后, 铺到含 50mg/ 升卡那霉素的 LB 琼脂上。从原先的 cDNA-pMHas5 载 体连接产物的总共 30,000 个转化体制备 cDNA 质粒池 (pool)。根据 Qiagen 的质粒 DNA 分 离操作规程 (Qiagen Inc.GMBH), 从固体 LB 卡那霉素选择培养基上回收的菌落的池中直接 制备质粒 DNA。
     用于克隆的载体是 pMhas5, 其在专利 WO 03/044049 中有记载, 具有下面的特征 :
     特征 部位 描述
     CDS 365-1156 卡那霉素抗性
     CDS 2232-2387 β- 半乳糖苷酶 α 肽
     -10 信号 2189-2192 SD 序列
     启动子 2101-2189 Lac 启动子
     多样性特征 626-650 BACE 系统的 KanP1 引物
     该质粒值得注意的特征是 Lac 启动子的 SD 区域附近的 EcoRI-NotI 限制位点。它 使得带 EcoRI-NotI 接头的 cDNA 能够被克隆到载体中, 且使所得的构建体在大肠杆菌宿主 中能够被活跃地转录和翻译。
     B. 转座子的构建和制备
     如 WO 01/77315 A1 所述的, 转座子协助信号捕捉 (Transposon Assisted Signal Trapping, TAST) 的基本原理是, 将所选的基因组中所有的基因通过转座子标签与编码无信 号的 β- 内酰胺酶的基因相融合。这样, 当在含有氨苄青霉素的培养基中培养包含通过转座子标签与编码无信号的 β- 内酰胺酶的基因融合的基因组的基因的宿主细胞克隆时, 只 有表达和分泌 β- 内酰胺酶的那些克隆能够生存。但是, 只有在与 β- 内酰胺酶基因融合 的基因具有能够被宿主株系识别的完整启动子和核糖体结合位点 ( 即, 在真实的生命过程 中被细胞表达产生多肽的基因 ), 而且 β- 内酰胺酶被这样翻译, 使得合成的多肽被转运穿 过细胞质膜并正确地折叠的条件下, β- 内酰胺酶才会被分泌。因此, 当将融合的基因插入 到选择的宿主细胞时, 那些氨苄青霉素抗性的克隆就含有编码功能性分泌多肽的基因。
     通常, 使用 TAST 方法时甚至不需要表达整个基因。当给基因加上转座子标签时, 这些基因的 N 末端部分作为融合蛋白表达, 就显示这些基因含有完整的转录、 翻译和分泌 序列。因此, 通常认为这些基因的 N 末端部分作为融合蛋白的表达足以保证整个基因的表 达和分泌。
     因此可以下结论 : 通过 TAST 方法得到的基因确实编码分泌的功能性多肽。
     含 β- 内酰胺酶报道基因的 SigA4 转座子的构建 :
     按照 WO 01/77315 A1 的指导, 使用标准分子生物学技术构建含有无信号 β- 内 酰胺酶基因的转座子。首先, 使用具有校正活性的 (proofreading) 聚合酶 (Pfu Turbo, Stratagene, 美国 ) 从 pUC19 载体 PCR 扩增无信号 β- 内酰胺酶基因。 所得的 PCR 片段含有 NotI 和 EcoRI 限制性位点以便于克隆。含有 Entranceposon 和抗生素抗性标记 CAT( 在转 座子中编码氯霉素抗性 ) 的质粒 pEntranceposon(Camr) 是从 Finnzymes, OY 获得的 (Espoo 芬兰 )。 用限制酶 NotI 和 EcoRI 消化该质粒, 凝胶纯化后与含有无信号的 β- 内酰胺酶的片 段连接。 将连接产物转化到电转化感受态 (electro-competent) 的 DH10B 细胞中, 通过限制 性分析鉴定含有带有所述无信号的 β- 内酰胺酶的质粒的大肠杆菌克隆, 并命名为 SigA2。
     为制备转座子, 构建了较小的 SigA2 衍生物, 其缺乏编码 β- 内酰胺酶的 bla 基因 : 使用结合到 SigA2 的 bla 基因的起始和终止处, 且方向向外的两个寡核苷酸引物 SigA2NotU-P 5′ -TCG CGA TCC GTT TTC GCA TTT ATC GTG AAA CGC T-3′ (SEQ ID NO : 43) 和 SigA2NotD-P 5′ -CCG CAA ACG CTG GTG AAA GTA AAA GAT GCT GAA-3′ (SEQ ID NO : 44) 来 PCR 扩增没有 bla 基因的 SigA2。该 PCR 反应产生的大约 3.6kb 的扩增产物经过 重新连接 (relegate) 后转化到合适的大肠杆菌菌株中。从能在 LB 氯霉素但不能在 LB 氨 苄青霉素上生长的转化体中分离了 3.6kb 的质粒。该质粒保留了所有两个 BglII 位点并缺 少活性的 blg 基因, 被称为 pSig4( 图 1)。
     60 微升浓度为 0.3μg/μl 的 pSigA4 质粒 DNA 制备物用 BglII 消化并在琼脂糖凝 胶上分离。将 2kb 的 SigA2 转座子 DNA 条带洗脱下来, 并根据供货商的指导, 用 “GFXTMPCR、 DNA 和 凝 胶 条 带 纯 化 试 剂 盒” (PCR, DNA and Gel Band Purification Kit)(Amersham Pharmacia Biotech Inc. 美国 ) 纯化, 用 200 微升 EB 缓冲液洗脱。这样制备的 SigA2 可以 用于转座子协助信号捕捉 (TAST, 见下文 )。
     C. 转座子标签
     从 pSigA4 制备的转座子带有 5’ 截短的 bla 基因, 该基因编码除去了分泌信号的 β- 内酰胺酶。β- 内酰胺酶只有在被分泌到周质时才能赋予大肠杆菌氨苄青霉素抗性, 而 β- 内酰胺酶的细胞质表达不能赋予氨苄青霉素抗性。如果没有信号序列, β- 内酰胺酶 将不会被转运到周质中, 从而克隆也就不会在含有氨苄青霉素的培养基上生长。无信号的 β- 内酰胺酶基因以这样的方式包含在转座子中, 使得转座子的边界和 β- 内酰胺酶编码区域之间存在连续的开放阅读框。这样, 被改变的转座子当转座到编码分泌的蛋白质的基 因中时, 可以导致与目标基因的共阅读框 (in-frame) 的融合。这样就导致分泌到大肠杆菌 周质并赋予氨苄青霉素抗性的融和基因产物的产生。 而如果转座子整合到编码非分泌蛋白 的基因中, 即使是共阅读框的, 相应的宿主也不会成为氨苄青霉素抗性。
     D.Botryosphaeria rhodina 的转座子协助信号捕捉
     关于转座子协助信号捕捉的完整描述可以在 WO 01/77315 中找到。从最初的 cDNA-pMHas5 载体连接产物的总共 30,000 个转化体构建了 cDNA 质粒池。根据 Qiagen 的 质粒 DNA 分离操作规程 (Qiagen Inc.), 从固体 LB 卡那霉素选择培养基上回收的菌落的池 中直接制备质粒 DNA。根据转座酶制造商的指导 (Finnizyme, Finland), 用转座子 SigA2 和 MuA 转座酶处理质粒池。
     为了给 Botryosphaeria rhodina CBS 274.96 cDNA 文库加转座子标签, 将含有约 2.6 微克的 DNA 的 SigA2 转座子 4 或 8 微升, 与质粒池 DNA 的 DNA 浓度的 Botryosphaeria rhodina CBS 274.96 cDNA 文库 1 微升, Finnzymes MuA 转座酶 2 微升 (0.22 微克 / 微升 ), 和 5x 缓冲液 ( 来自 Finnzymes OY, Espoo, 芬兰 )5 微升在 50 微升的总体积中混合, 并在 30℃温育 3.5 小时, 然后在 75℃热失活 10min。加入 5 微升 3M 乙酸钠 pH5 和 110 微升 96% 乙醇, 并在 20000rpm 离心 30min 使 DNA 沉淀。洗涤沉淀并干燥, 然后在 10 微升 TE 缓冲液 中重悬。
     在 Biorad 基因脉冲设备 (50μF, 20mAmp, 1.8kV) 中, 1.5 微升的加有转座子标签 的质粒池通过电穿孔导入 20 微升的 DH10B 超感受态 (ultra-competent) 细胞, 根据随该细 胞提供的标准操作规程 (Gibco-BRL) 进行。将电穿孔的细胞在振荡下温育在 SOC 培养基中 (28℃, 2 小时, 250rpm), 然后铺在选择培养基上。使用了 3 种琼脂培养基 :
     LB+50mg/ml 卡那霉素,
     LB+ 卡那霉素 +15mg/ml 氯霉素和 / 或
     LB+ 卡那霉素 + 氯霉素 +12.5mg/ml 氨苄青霉素。
     通过将电穿孔产物稀释并铺在 LB+ 卡那霉素 + 氯霉素培养基上, 确定了每份电穿 孔物大约存在 72,000 个含有带 SigA2 转座子的 cDNA 文库质粒的菌落, 且在三重选择 (LB、 卡那霉素、 氯霉素、 氨苄青霉素 ) 下, 大约回收了 69 个菌落。进一步进行电穿孔和铺板实 验, 直到在三重选择下从实验中总共回收 445 个菌落。根据 Qiagen Qiaturbo96 操作规程 (Qiagen Inc. 美国 ) 对这些菌落进行质粒小量提取 (miniprep)。根据国际专利申请 WO 01/77315 的实施例中公开的方法 ( 第 28 页 ), 用转座子正向和反向引物 ( 引物 A 和 B) 对 质粒测序。
     引物 A : AGCGT TTGCG GCCGC GATCC(SEQ ID NO : 45)
     引物 B : TTATT CGGTC GAAAA GGATC C(SEQ ID NO : 46)
     E. 序列组装和注释
     用 AB3700 毛细管测序仪获得反应物的 DNA 序列。 修整这些序列以去除每个质粒的 载体和转座子序列及 A 和 B 引物读取结果。由此得到 225 个组装的序列, 使用 PhredPhrap 程序 (Brent Ewing, LaDeana Hillier, Michael C.Wendl 和 Phil Green ; Base-calling of automated sequencer traces using phred I.Accuracy assessment ; Genome Research ; 8: 175-185 ; 1998 ; Brent Ewing 和 Phil Green ; Base-calling of automated se-quencertraces using phred II.Error probabilities ; Genome Research 8 : 186-194 ; 1998) 将它 们分为 148 个毗连群 (contigs)。 然后使用 BLASTX 程序 2.0a19MP-WashU[1998-7-14][ 构建 Linux-x86 18 : 51 : 44 30-Jul-1998](Gish, Warren 1994-1997- 未公开 ; Gish, Warren 和 David J.States ; Identification of protein coding regions by database similarity search ; Nat.Genet.3 : 266-72 ; 1993), 将所有 148 个毗连群与可从标准公共 DNA 和蛋白质 序列数据库 (TrEMBL, SWALL, PDB, EnsemblPep, GeneSeqP) 获得的序列比较。
     所得的序列大部分是编码完整的功能性多肽的功能性基因, 如上所述其从氨苄青 霉素抗性克隆获得, 用作人工分析的基础。
     为了确认所述菌落的氨苄青霉素抗性是 β- 内酰胺酶活性增加的结果, 在 10 个 cDNA 上转座子的到达位点 (landing site) 不同的信号捕捉克隆中测试了 β- 内酰胺酶活 性。根据 Invitrogen Life Technologies 的操作规程将质粒 DNA 重新转化到 One Shot Top10 化学感受态大肠杆菌中, 并将转化混合物涂布在带卡那霉素 (50μg/ml) 和氯霉 素 (10μg/ml) 的 LB 琼脂上。28 ℃下 2 天后, 将菌落影印铺板到 LB 卡那霉素、 氯霉素和 15(10μg/ml) 氨苄青霉素的 LB 上。 28℃下 3 天后, 将真正生长的菌落 (true growers) 接种 到含卡那霉素 (50μg/ml) 和氯霉素 (10μg/ml) 的 10ml LB 培养基中, 37℃, 275rpm 温育过 夜。将过夜培养物按 1 ∶ 100 稀释在新鲜的 LB Kan/CAM 培养基中并培养到 OD600 = 0.5。 离心收集细胞并用 0.9% NaCl 洗涤一次。 将沉淀悬浮在超声处理缓冲液 (100mM Tris-HCl, 2mM EDTA, pH 8.0) 中, 调节细胞数到光密度 OD600 = 0.5, 用 Soniprep 150(MSE) 以 1.5μm 的振幅超声处理。 将样品在 15,000rpm 离心 10min, 将上清用于 β- 内酰胺酶测定。 在塑料比 色皿中, 将上清与 50μl nitrocefin 生色 β- 内酰胺酶底物 (1mg/ml, 于 50% DMSO ; 0.05M PO4 缓冲液中 ) 和 0.1M PO4 缓冲液混合到 1ml, 然后用 3300pro 分光光度计测量 Abs482。结 果如下所示 :
     表 IX : 具有不同的 Shine Dalgarno(SD) 序列和 ATG 翻译起始密码子和之间的距 离和转座子到达位点的克隆 β- 内酰胺酶活性
     上表说明了 3 个要点 :
     1) 所有 10 个克隆中都可检测到 β- 内酰胺酶活性。 应当强调的是, 相应的含有质 粒的大肠杆菌转化体对 50mg/ 升氨苄青霉素选择有抗性。这些事实共同显示, 所有 10 个克 隆都产生由融合到 β- 内酰胺酶基因的带转座子标签的 cDNA 的一部分组成的杂合蛋白, 其 中以提供具有 β- 内酰胺酶活性的肽的方式融合。
     2) 由于这 10 个克隆的 cDNA 被完全测序, SigA2 转座子在每个克隆中的到达位置 得到了证实。这 10 个克隆都含有 SigA2 转座子, 其处于正确的方向和阅读框中, 以促使天 然的被编码蛋白的 N 末端与转座子所编码的 β- 内酰胺酶发生杂合融合。
     3) 在真核 cDNA 中, 非翻译的上游 (5’ UTR) 前导序列的长度可在 1bp 到数百个碱 基对之间变化。为了从大肠杆菌翻译元件例如 Shine-Dalgarno 区域最优地翻译 cDNA, ATG 起始密码子之前 4 到 11 个碱基对的最优距离是最优的。由上表可见, 比最优值长得多的 5’ UTR 还是容许表达一些 cDNA 杂合体 -β 内酰胺酶融合蛋白, 因为从样品中的转化大肠杆 菌中观察到了 β- 内酰胺酶活性。
     所得的本发明的核苷酸序列是功能性基因编码完整的功能性多肽, 不但由于上述 原因, 而且因为它们是从氨苄青霉素抗性克隆获得的。这里获得的克隆是氨苄青霉素抗性 的, 因为加上转座子标签后, 这些基因与无信号的 β- 内酰胺酶基因融合, 无信号的 β- 内 酰胺酶基因只有当与具有在宿主株中可被识别的完整启动子和核糖体结合位点的基因融 合时, 才能被表达、 翻译、 转运穿过细胞质膜并正确地折叠。
     因此, 可以作结论, 本发明的基因确实编码活性的分泌的多肽。因为 16 个基因的 序列分析显示得到了与无信号的 β- 内酰胺酶基因的共阅读框融合。另外, 通过测定整个 核苷酸序列, 确证了这些基因的开放阅读框的完整。
     实施例 2 通过同源性确定酶活性
     通过与已知功能的基因或多肽比较, 可以预测基因或被编码的多肽的功能。分析
     了 ADNA 组和 B 多肽组序列与来自公共和内部数据库的序列之间的相似性, 以确定 ADNA 组和 B 多 肽组序列的功能性。序列比较是用程序 BLASTX 2.0a19MP-WashU[1998-7-14] 进行的。通过 将 ADNA 组和 B 多肽组序列与其最接近的功能已知的序列进行仔细的人工序列比对, 为预测这 些基因和被编码的多肽的功能提供了可能。即使在全体氨基酸的同一性低于 40%, 从而可 能难以作出可靠的预测的情况下, 通过仔细地分析并判读催化位点和 / 或多肽序列的重要 区域中的氨基酸残基, 预测 ADNA 组和 B 多肽组序列的功能也是可能的。如果已知序列的催化 位点的氨基酸也存在于本发明的多肽中, 同时具有足够的全体氨基酸的同一性, 就可以断 定该来自 Botryosphaeria rhodina CBS 274.96 的多肽与所述已知序列具有同样的功能。
     实施例 3 制备 B 多肽组多肽
     为了从丝状真菌例如 Botryosphaeria rhodina CBS 274.96 的 cDNA 制备多肽, 在 酵母或另外的丝状真菌中表达该 cDNA 是可行的。作为非穷举性的例子, 一种好的选择是在 米曲霉中表达。下面给出了怎样在米曲霉中表达编码木聚糖酶的 cDNA(SEQ ID No : 3)。
     使用表达质粒 pDaU71。 该质粒含有 (1) 构巢曲霉 amdS 基因, 作为曲霉中的选择标 记; (2) 酵母 URA3 基因, 其被氨苄青霉素抗性基因隔断, 用于在大肠杆菌中选择 ; (3) 带 3 个 额外的 amyR- 位点的黑曲霉 NA2 启动子 ( 中性淀粉酶 )+ 构巢曲霉 TPI 启动子 5′非翻译部 分的重叠, 用于异源表达 ; 和 (4) 黑曲霉 AMG 终止子。作为扩增 Botryosphaeria rhodina cDNA 文库池的相关部分的模板, 在 PCR 反应中使用下面的引物 :
     引物 #166 : CGCGGATCCACCATGGTCTCCTTCAAGTCGATTC(SEQ ID NO : 47)
     引物 #167 : CCGCTCGAGTTACTGCACGGTAATCGTAGC(SEQ ID NO : 47)
     使用下面的条件 :
     按照制造商的指示, 使用 Extensor Hi Fidelity Reddy Load DNA 聚合酶 PCR 混 合液 (ABGene, 英国 )。
     cDNA 质粒池 (1 纳克 / 微升 ) : 5 微升
     引物 #166 1 微升
     引物 #167 1 微升
     PCR 主混合液 (master mix) 12.5 微升
     去离子水 7.5 微升
     总体积 25 微升
     将反应物转入预热到 94℃的 MJ Research DNA 扩增仪中, 然后进行下面的循环 :
     94℃ 2 分钟
     然后 25 个循环的 :
     94℃ 30 秒
     53℃ 30 秒
     72℃ 1 分钟
     然后
     72℃ 10 分钟
     用 1%琼脂糖凝胶分析 5 微升的产物以确认正确的大小并确定所得的 PCR 产物的 量。 根据制造商的指示 (AP Pharma) 用 GFX 纯化所剩的 20 微升混合物。 用 40 微升纯化产物
     中的 20 微升在 30 微升标准的过夜消化反应体系中进行标准的 BamHI-XhoI 限制消化。 然后 再用 GFX 纯化限制消化的产物, 再将其与经过 BamHI-XhoI 限制消化并纯化的 pDau71 进行 标准的连接反应。 将连接产物转化到 DH10B 大肠杆菌细胞中 ( 大肠杆菌 DH10B 或 TOP10( 可 从 Invitrogen 获得 ) 在该表达载体的构建中可用作克隆宿主 ), 并在 LB 氨苄青霉素培养基 上铺板。选择 10 个转化体进行质粒 DNA 纯化, 并对其测序以确定插入片段的序列完整性。 选择一个无 PCR 错误的克隆 pPFJO47 用于进一步研究。
     如 WO 00/39322 所述构建米曲霉 BECh2 株 (BECh2 得自米曲霉 JaL228, 该菌株是 如 WO 98/12300 所述以保藏的菌株米曲霉 IFP4177 为基础构建的 )。转化和培养条件根据 Christiansen 等, 1988, Biotechnology 6, 1419-1422 及如 WO 01/12794-A 第 63 页所述进 行。进行一轮再分离后, 用来自转化体的孢子接种 Nunc 管中的 10ml YP 葡萄糖或 YP 麦芽 糖, 并将培养物在 30℃下培育 3 天。
     将来自上述 10ml 培养物的 10 微升上清样品进行 SDS 凝胶电泳。用 SYPRO Orange Protein Gel Stain(Molecular Probes) 对凝胶染色。 数种曲霉转化体在 SDS 凝胶上具有显 著的条带。 通过在 pH 6.0 下进行 AZCL- 小麦阿拉伯木聚糖进一步分析这些阳性结果的木聚 糖酶活性。 在 0.2M 磷酸钠盐 (Na-phosphate) 缓冲液, pH 6.0+0.01% Triton-X 100 中将底 物即来自小麦的 AZCL- 阿拉伯木聚糖 (Megazyme) 制备为 0.2% w/v 的悬液。在 Eppendorf 热混合仪 (thermomixer) 中将 900 微升的底物预热到 37℃。向底物中加入 100 微升来自重 组宿主菌株 Bech2 的粗培养液上清或不同样品并在最大速度下在 37℃温育 15min。然后将 反应混合物在冰上放置 2 分钟, 在用 20,000xG 离心 1min。将 2x 200 微升的上清转移到微 量滴定板并在 OD590 测量。测定吸光度的增加作为活性。
     实施例 4 测定木聚糖酶活性
     活性的测定使用合适的缓冲液中的合成并分泌木聚糖酶的宿主株的培养液或细 胞裂解物。将合适体积的这样的样品点到琼脂平板上, 琼脂平板上含有不溶性的生色底物 TM AZCL-Birch 木聚糖 (Megazyme ) 和合适的缓冲液, 其 pH 为例如 4.5-7.5。在合适的温度, 例如 37℃下, 将平板温育合适的时间, 例如一天。活性可见为点周围的蓝色的晕圈 (halo)。
     实施例 5 测定过氧化物酶活性
     过氧化物酶可以使用如 Ishida 等 : 1987 所述的 2, 4- 二氯苯酚方法 (Ishida, A., N.Futamura 和 T.Matsusaka.1987.Detection of peroxidase acitvity and its localisation in the forespore envelopes of Bacillus cereus.J.Gen.Appl. Microbiol.33 : 27-32.) 用分光光度法来测定。作为指示剂, 可以使用 100mM 磷酸钾缓冲液 (pH 7.0) 中的 1.0mM 2, 4- 二氯苯酚和 82mM 的 4- 氨基安替比林 (aminoantipyrine) 的混 合物, 合适的底物是 100mM 磷酸钾缓冲液 (pH 7.0) 中的 50mM 过氧化氢 (Sigma)。
     将 200 微升合适地稀释的培养液上清加入 1ml 塑料比色皿。加入 200 微升指示剂 混合物。加入 200 微升过氧化氢底物启动反应。用标准的分光光度计在 510nm 处测量吸光 度的变化。
     实施例 6 测量对纤维素降解酶或酶混合物的纤维素降解促进作用
     某些分泌的蛋白质在纤维素降解酶或其混合物存在下显示纤维素降解的协同作 用 (synergistic action)。 这些分泌的蛋白质本身可具有或不具有水解酶活性。 在专利申 请号 US11/046,124 和相应的 2005 年 7 月 30 日公布的 PCT 申请 PCT/US2005/003525 中可以找到这样的分泌蛋白的例子和如何检测它们的纤维素降解促进作用, 特别是使用实施例 24 和 25-28 的任一项, 在此将其引入供参考。
     一种测定该促进作用的方法如下 : 将合成并分泌纤维素酶促进性多肽的宿主株 的培养液或细胞裂解物用装有截留为 10kDa 的 PM10 膜的 Amicon 搅拌小室 (Millipore, Billerica, MA) 浓缩后, 用 Econo-Pac 10DG 柱 (BioRad Laboratories, Hercules, CA) 脱 盐。用 BCA(bicinchoninic acid, P.K.Smith 等 1985, Anal.Biochem.150 : 76) 蛋白质测定 试剂盒 (Pierce, Rockford, IL) 使用 BSA 作为标准测定蛋白浓度后, 将这些多肽储液保存 在 -20℃。对这些多肽不作进一步纯化, 并根据测得的总蛋白将储液添加到反应混合物中。
     在美国能源部国立可再生能源实验室 (U.S.Department of Energy National Renewable Energy Laboratory(NREL)) 用稀硫酸预处理玉米秸秆。预处理使用下面的条 件: 1.4wt%的硫酸, 165℃和 107psi 下 8 分钟。根据 NREL, 预处理过的玉米秸秆 (PCS) 中 的水不溶性固体含有 56.5%纤维素, 4.6%半纤维素和 28.4%木质素。纤维素和半纤维素 是使用 NREL 标准分析程序 (NREL Standard Analytical Procedure)#002, 进行二阶段硫 酸水解后, 利用高效液相色谱测定进行糖分析而测定的。木质素是使用 NREL 标准分析程序 #003, 用硫酸水解纤维素和半纤维素级分后通过测量重量而测定的。在酶促水解前, 在玻 璃滤器上用大体积的去离子水” ish” 所述 PCS ; 得到水 “ish” 过的 PCS 的干重。通过在咖 啡磨 (coffee-grinder) 中粉碎, 然后在 22μm 的 Millipore 滤器 (6P Express Membrane, Stericup, Millipore, Bedford, MA) 上用去离子水 “ish” , 从水 “ish” 过的 PCS 制备粉碎的 PCS。
     PCS 的水解是用 1.1ml Immunoware 小管 (Pierce, Rockford, IL) 进行的, 所用的总 反应体积为 1.0ml。在该操作规程中, PCS(10mg/ml 于 50mM 乙酸钠 pH5.0 缓冲液中 ) 的水 解, 是在纤维素蛋白加样量的 3%的米曲霉 β- 葡糖苷酶 ( 根据 WO 02/095014 在米曲霉中 重组表达 ) 的存在下, 使用不同的蛋白质加样量 ( 表示为 mg 的酶每克 PCS) 的待测的本发 明的多肽或 Celluclast 1.5L 样品 (Novozymes A/S, Bagsvaerd, 丹麦 ) 来进行。本发明 的多肽的 PCS 水解能力的筛选在 50℃ (Isotemp 10S 水浴或 TS Autoflow CO2 夹层培养箱 ) 下进行。通常, 反应按一式四份进行并在水解过程中取等份样品。通过混合 20μl 等份的 每份水解物和 180μl 0.11M NaOH( 终止试剂 ) 来终止 PCS 水解反应。对每份试样作适当 的连续稀释, 并利用下述的适用于 96 孔微量培养板规格的对羟基苯甲酰肼 (PHBAH, Sigma, St.Louis, MO) 测定法测定还原糖含量。简单地说, 将 90μl 等份的适当稀释的样品置于 96 孔圆锥底微量培养板中。向各个孔中加入 2% NaOH 中的 1.5% (w/v)PHBAH 60μl。将板在 95℃不加盖加热 10 分钟。让板冷却到室温 (RT), 然后向各个孔加入 50μl 蒸馏水。从每 个孔转移 100μl 等份到平底 96 孔板中, 并用 SpectraMax Microplate Reader(Molecular Devices, Sunnyvale, CA) 测量 A410nm 的吸光度。用葡萄糖标准品 ( 用 0.4%氢氧化钠稀释 的, 0.1-0.0125mg/ml) 制作标准曲线以将所得的 A410nm 值转换为葡萄糖当量。 用所得的当量 计算每个反应的 PCS 纤维素转化百分率。
     纤维素转化为还原糖的程度 ( 转化率,% ) 用下面的等式计算 :
     转化率 (% ) = RS(mg/ml)*100*162/( 纤维素 (mg/ml)*180) =
     RS(mg/ml)*100/( 纤维素 (mg/ml)*1.111)
     在该式中, RS 是以葡萄糖当量 (mg/ml) 量度的溶液中的还原糖浓度, 因子 1.111 反映了纤维素转化为葡萄糖的重量增加。
     为了筛选能够促进 Celluclast 1.5L 性能的本发明的多肽, 进行 PCS 水解反应 (1.0ml 的操作规程, 10g PCS 每升, 50℃, 加入总加样量的 3%的米曲霉 β- 葡糖苷酶 ), 其 中将 2.5mg 酶加样量的 Celluclast 1.5L 与 2.5mg 多肽加样量的每个样品 ( 每个反应 5mg 酶加样量的总蛋白 )。测量了由 10mg 酶加样量, 5mg 酶加样量和 2.5mg 酶加样量组成的 Celluclast 1.5L 对照反应, 并记录它们的 PCS 纤维素转化率用于比较。
     实施例 7 测定脂肪酶活性
     活性测量使用合适的缓冲液中的合成并分泌脂肪酶的宿主株的培养液或细胞裂 解物。
     脂肪酶测定 (PNV 测定 ) : 用移液器将 20 微升的稀释缓冲液加到 96 孔微量培养板 的各个孔中。向该稀释缓冲液中加入 5 微升的样品 ( 上清 )。测试开始时, 向各个孔中加入 200 微升的底物, 并将板装到 ELISA 读板器 ( 能读取 96 孔板的可编程的分光光度计 ) 上。 每 30 秒测量一次 405nm 的吸光度, 测量 10 分钟。用时间对 abs405 曲线的斜率作为任意活 性单位。
     稀释缓冲液 : 25ml 2M Tris/HCl pH 7.5, 0.50ml 2M CaCl2, 2.5ml 15% Brij 35, 用水调节到 500ml。
     底物储备溶液 : 将 0.1295g(117 微 升 ) 的 戊 酸 对 硝 基 苯 酯 (p-Nitrophenyl valerate)SIGMA N 4377( 密度 1.11g/ml) 溶于 10ml 甲醇中。在冷冻装置中保存。
     底物 : 将 100 微升底物储备溶液与 10ml 稀释缓冲液混合。
     实施例 8 测定蛋白酶和肽酶活性
     在具有选定的肽酶活性最佳的 pH 缓冲液中的合成并分泌肽酶和 / 或蛋白酶的宿 主株的培养液或细胞裂解物, 其所述活性可以这样测定 : 将合适的样品体积 ( 例如 20 微 升 ) 点样在琼脂平板上, 其中该琼脂平板含有不溶性生色底物 AZCL- 酪蛋白 (MegazymeTM) 或 AZCL- 胶原 (MegazymeTM) 或 Azocoll(Sigma-Aldrich), 例如 0.1% w/w 的水平。在适合 于肽酶起作用的温度下, 例如 37℃下, 将平板温育合适的时间, 例如 1 天。活性可见为点周 围的蓝色晕圈。可以用非标记的胶原或非标记的酪蛋白来代替 AZCL- 酪蛋白和 AZCL- 胶原 (MegazymeTM)。 在被点样到琼脂平板的非标记的胶原或非标记的酪蛋白上, 有肽酶和 / 或蛋 白酶存在时形成清楚的区域。
     实施例 9 测定内切阿拉伯糖酶活性
     在具有选定的肽酶活性最佳的 pH 缓冲液中的合成并分泌阿拉伯糖酶的宿主株的 培养液或细胞裂解物, 其所述活性可以这样测定 : 将合适的样品体积 ( 例如 20 微升 ) 点样 在琼脂平板上, 其中该琼脂平板含有不溶性生色底物 AZCL- 阿拉伯聚糖, 例如 0.1% w/w 水 平。 在适合于阿拉伯糖酶起作用的温度下, 例如 37℃下, 将平板温育合适的时间, 例如 1 天。 活性可见为点周围的蓝色晕圈。
     该测定可以在不同的 pH 下进行。在酸性 pH 下, 可以通过将 0.1g AZCL- 阿拉伯聚 糖 (Mazurine 染色的交联底物, Megazyme, 爱尔兰 ) 溶于 100ml 0.2M 琥珀酸 pH3+10 微升 Triton X-100(0.01% ) 得到 0.1% AZCL- 阿拉伯聚糖终浓度, 来制备 AZCL- 阿拉伯聚糖。 在中性 pH 下, 可以通过将 0.1g AZCL- 阿拉伯聚糖 (Mazurine 染色的交联底物, Megazyme, 爱尔兰 ) 溶于 50ml 无菌水加 10 微升 Triton X-100(0.01% ) 中来制备 AZCL- 阿拉伯聚糖。然后在该 50ml AZCL 底物中加入 50ml 0.4M MOPS pH 7 得到 100ml 的终体积, 及 0.2M 缓冲 液, 0.1% AZCL 的终浓度。
     实施例 10 测定 β- 葡糖苷酶活性
     许 多 β- 葡 糖 苷 酶 可 能 对 4- 硝 基 苯 基 -β-D- 吡 喃 葡 萄 糖 苷 或 纤 维 二 糖 至 少 有 一 些 活 性, 尽 管 这 些 可 能 不 是 它 们 的 天 然 底 物。 用 非 常 敏 感 的 甲 基 伞 形 基 (methyl-umbiliferyl)β-D- 葡 萄 糖 苷 也 可 以 发 现 活 性。 一 般 而 言 可 以 使 用 任 何 (1, 4)-β- 及 (1, 3)-β- 寡葡萄糖苷 (oligoglucosides) 作为底物, 通过 Trinder 测定系统 (The Sigma Diagnostic Glucose(Trinder)Assay, Sigma, St.Louis, MO) 测量释放的葡萄 糖, 来评估 β- 葡糖苷酶活性。
     一种测定 β- 葡糖苷酶活性的方法是制备合成并分泌阿拉伯糖酶的宿主株的培 养液或细胞裂解物的制剂, 使所述制剂含有大约 6.9X 10-6 mg/ml 的总蛋白, 100mM 柠檬酸 钠 pH 5.0, 0.01 % Tween-20 和 4mM 的对硝基苯基 -β-D- 吡喃葡萄糖苷。在 50 ℃温育该 制剂, 并在 0.5、 1、 2、 3、 3.75 和 24 小时取等份试样。向各个等份试样中加入 1M 碳酸钠 pH 10.0, 然后由 405nm 的吸光度确定对硝基苯基阴离子的浓度。
     另一种 β- 葡糖苷酶活性的方法是 : 通过首先脱盐 (BioRad Econo-Pac 10DG 柱 ), 然后浓缩 (Centricon Plus-20, Biomax-5, 5kD 截留 ) 到 0.92mg/ml 的浓度 (BCA 测定系 统 ), 来制备合成并分泌阿拉伯糖酶的宿主株的培养液或细胞裂解物的制剂。 然后将该制剂 以 0.037 和 0.0092μg/ml 总蛋白与 100mM 柠檬酸钠 pH 5.0 加 0.01% Tween-20 中的 10mM 纤维二糖在 65℃下温育。在 0.5, 1, 2, 3, 4, 6 和 19 小时取等份试样。将等份试样煮沸 6 分 钟以终止反应, 然后使用 Trinder 测定系统 (Sigma Chemical Co., St.Louis, MO) 和葡萄糖 外标测定葡萄糖浓度。
     实施例 11 测定酯酶活性
     活性测定使用合适的缓冲液中的合成并分泌酯酶的宿主株的培养液或细胞裂解 物。当选择用于测定丝氨酸酯酶活性的底物时, 应当优先选择在酯酶被底物饱和时的浓度 下不形成胶束的底物, 以获得底物的最佳转化率。
     一种测试酯酶活性的方法是测量标准条件下, 例如 30℃、 pH7.0 下, 该酶水解三醋 精的碱消耗, 其中三醋精的浓度低于三醋精的 CMC, 碱消耗表示为时间的函数。酯酶水解三 醋精会释放乙酸, 这就需要加入碱来维持 pH 恒定为 7.0( 恒定 pH 法 ), 因此维持 pH 在 7.0 所需要的碱 ( 通常以氢氧化钠的形式 ) 的量就是被水解的三醋精酯键的量度。
     另一种测试酯酶活性的方式是测量酯酶水解 PNP 乙酸酯 ( 乙酸对硝基苯酯 ) 释放 有色的 PNP。用移液器将 20 微升的稀释缓冲液加到 96 孔微量滴定板的各个孔中。将 5 微 升样品 ( 培养液上清或过滤的细胞裂解物 ) 加入稀释缓冲液中。在测定开始时向每个孔中 加入 200 微升的底物并将板装到 ELISA 读板器 ( 能读取 96 孔板的可编程的分光光度计 ) 上。每 30 秒测量一次 405nm 的吸光度, 测量 10 分钟。用时间对 abs405 曲线的斜率作为任 意活性单位。
     稀释缓冲液 : 25ml 2M Tris/HCl pH 7.5, 0.50ml 2M CaCl2, 2.5ml 15% Brij 35, 用水调节到 500ml。
     本申请是申请日为 2005 年 08 月 06 日、 申请号为 200580034120.2( 国际申请号为 PCT/DK2005/000519)、 发明名称为 “Botryosphaeria Rhodina 的多肽” 的发明申请的分案申 请。发明领域
     本发明涉及由以保藏号 CBS 274.96 保藏的棉色二孢 (Diplodia gossypina), 异 名为 Botryospaeria rhodina 的 mRNA 中包含的多核苷酸所编码的功能性多肽。本发明还 涉及编码这些多肽或有助于它们表达的多核苷酸或这些多核苷酸的构建体, 以及制备该多 肽的方法。本发明还涉及包含该多肽的组合物和该多肽的用途。 背景技术 Botryosphaeria rhodina(Berk.&M.A.Curtis)Arx, ( 异 名 Diplodia gossypina Cooke)。目前已发表的关于这种生物的特征描述的报道非常少 ; Selbmann 等在 2003 年 报道了 Botryosphaeria rhodina 的外泌多糖 (exopolysaccharide) 生产 (Selbmann L, Stingele F 和 Petruccioli M(2003).Exopolysaccharide production by filamentous fungi : the example of Botryosphaeria rhodina.Antonie van Leeuwenhoek, 84 : 2, pp.135-145)。有单独的一篇专利涉及使用 Botryosphaeria rhodina 羟化 β- 二氢大马 酮作为烟草的增香剂 (CH654567-A)。通过发酵该生物还可以生产茉莉酸 (EP1118672-A)。 先前已报道了纤维二糖水解酶 (cellobiohydrolases)(WO 03/000941-A2) 和乳糖酶 (WO 01/49878-A) 的存在。
     在新酶的探寻中, 还知道通过对可能的候选物进行特定的酶测定来筛选这样的新 酶。该方法受酶测定的可用性的限制, 而且不能鉴定活性尚未知的功能性酶或多肽。
     另外, 全基因测序 (whole genome sequencing) 是一种获得来自特定的微生物 的所有基因上的信息的已知方法, 例如 Fleischmann 等 ; Whole genome sequences and assembly of Haemophilus influenzae Rd ; Nature 269 : 496-512 ; (1995) 描述的那样。
     工业上应用的大多数酶都是被微生物分泌到介质中的酶。但是, 微生物的基因组 只有百分之几是编码分泌蛋白质的。例如, 枯草芽孢杆菌 (Bacillus subtilis) 基因组或 其最接近的亲缘物种只有 4 %是编码分泌蛋白质的。(Van Dijl 等 : Protein transport pathways in Bacillus subtilis : a ge-nome-based road map ; 于″ Basillus subtilis and it′ s closest relatives″ -From genes to cells ; p.337-355 ; A.L.Sonenshein 编 ; ASM Press 2002)。
     基因组测序的缺点之一是所得序列的绝大部分是编码非分泌蛋白质的。
     特别地, 对于真核生物例如真菌而言, 基因组测序的另一个缺点是基因组的大小 比细菌基因组大很多倍, 从而通过这种方法来发现基因要耗费更多的成本和时间。
     cDNA 随机测序 ( 表达序列标签, 或称 EST) 是另一种可以发现分泌蛋白质的手段。 一般地, 就分泌蛋白的鉴定而言 EST 方法有两个缺点 : 1) 取决于被测序的 cDNA 文库所用的
     在新酶的探寻中, 还知道通过对可能的候选物进行特定的酶测定来筛选这样的新 酶。该方法受酶测定的可用性的限制, 而且不能鉴定活性尚未知的功能性酶或多肽。
     另外, 全基因测序 (whole genome sequencing) 是一种获得来自特定的微生物 的所有基因上的信息的已知方法, 例如 Fleischmann 等 ; Whole genome sequences and assembly of Haemophilus influenzae Rd ; Nature 269 : 496-512 ; (1995) 描述的那样。
     工业上应用的大多数酶都是被微生物分泌到介质中的酶。但是, 微生物的基因组 只有百分之几是编码分泌蛋白质的。例如, 枯草芽孢杆菌 (Bacillus subtilis) 基因组或 其最接近的亲缘物种只有 4 %是编码分泌蛋白质的。(Van Dijl 等 : Protein transport pathways in Bacillus subtilis : a ge-nome-based road map ; 于″ Basillus subtilis and it′ s closest relatives″ -From genes to cells ; p.337-355 ; A.L.Sonenshein 编 ; ASM Press 2002)。
     基因组测序的缺点之一是所得序列的绝大部分是编码非分泌蛋白质的。
     特别地, 对于真核生物例如真菌而言, 基因组测序的另一个缺点是基因组的大小 比细菌基因组大很多倍, 从而通过这种方法来发现基因要耗费更多的成本和时间。
     cDNA 随机测序 ( 表达序列标签, 或称 EST) 是另一种可以发现分泌蛋白质的手段。 一般地, 就分泌蛋白的鉴定而言 EST 方法有两个缺点 : 1) 取决于被测序的 cDNA 文库所用的
     诱导条件, 只有很少的 cDNA, 通常为 0.5% -15%或甚至 1-5%的 cDNA 编码分泌蛋白质 ; 2) 所有的克隆都来自 cDNA 池 (pool), 该 cDNA 池是从这些在生物中与各个特定的基因成比例 地存在的 mRNA 得来的。
     另一种已知的方法是信号捕捉 (signal trapping), 该方法通过与自身缺少信号 的胞外报道基因翻译融合, 来鉴定编码信号肽的基因包括核苷酸。
     发明概述
     微生物的基因组包含成千上万种不同的基因, 其中一些编码多肽, 一些编码 RNA。 微生物基因组中只有有限数量的基因编码这样的功能性多肽, 它们被该微生物分泌到介质 中以实现其外部功能。
     这些多肽能够以显著的量在连续的过程中生产, 而不破坏产生这些多肽的细胞, 从这一点看它们在工业上是令人感兴趣的。
     本发明的目的是鉴定和提供由以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 分泌的、 对 Botryosphaeria rhodina 起功能性作用的多肽, 因为这些多肽不仅可 用于工业用途, 而且可以以工业相关的过程 / 方法和产量生产。
     本发明在第一个方面中提供分离的多肽, 其选自 : (a) 包含氨基酸序列的多肽, 所述氨基酸序列与由 SEQ ID NO : 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30 32, 34, 36, 38, 40 和 42 构成的组的中所包含的成熟多肽具有至 少 90%的同一性 ;
     (b) 由核苷酸序列所编码的多肽, 该核苷酸序列在高度严紧条件下与多核苷酸探 针杂交, 所述多核苷酸探针选自 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列选自 SEQ ID NO : 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 39, 31, 33, 35, 37, 39 和 41 的编码成熟多肽的区域,
     (ii) 核苷酸序列中所包含的 cDNA 序列的互补链, 所述核苷酸序列选自 SEQ ID NO : 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 39, 31, 33, 35, 37, 39 和 41 的编码成熟多肽 的区域,
     其中所述多肽具有由 SEQ ID NO : 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40 和 42 构成的组中所包含的相应成熟多肽的功能。
     本发明的另一个方面涉及分离的酶, 其选自 :
     (a) 包含氨基酸序列的酶, 所述氨基酸序列与选自以 CBS 保藏号 274.96 保藏的 Botryosphaeria rhodina 菌株所分泌的木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶 (endo-arabinase) 和胃蛋白酶肽酶的成熟酶的氨基酸序列具有至少 90%的同一性。
     (b) 由核苷酸序列编码的多肽, 该核苷酸序列在高度严紧条件下与选自下列的多 核苷酸探针杂交 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列包含于以 CBS 保藏号 274.96 保藏的 Botryosphaeria rhodina 菌株中, 并编码成熟酶, 该成熟酶选自该菌株所分泌的木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖 苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶,
     (ii) 核苷酸序列所包含的 cDNA 序列的互补链, 所述核苷酸序列包含于以 CBS 保藏
     (b) 由核苷酸序列所编码的多肽, 该核苷酸序列在高度严紧条件下与多核苷酸探 针杂交, 所述多核苷酸探针选自 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列选自 SEQ ID NO : 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 39, 31, 33, 35, 37, 39 和 41 的编码成熟多肽的区域,
     (ii) 核苷酸序列中所包含的 cDNA 序列的互补链, 所述核苷酸序列选自 SEQ ID NO : 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 39, 31, 33, 35, 37, 39 和 41 的编码成熟多肽 的区域,
     其中所述多肽具有由 SEQ ID NO : 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40 和 42 构成的组中所包含的相应成熟多肽的功能。
     本发明的另一个方面涉及分离的酶, 其选自 :
     (a) 包含氨基酸序列的酶, 所述氨基酸序列与选自以 CBS 保藏号 274.96 保藏的 Botryosphaeria rhodina 菌株所分泌的木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶 (endo-arabinase) 和胃蛋白酶肽酶的成熟酶的氨基酸序列具有至少 90%的同一性。
     (b) 由核苷酸序列编码的多肽, 该核苷酸序列在高度严紧条件下与选自下列的多 核苷酸探针杂交 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列包含于以 CBS 保藏号 274.96 保藏的 Botryosphaeria rhodina 菌株中, 并编码成熟酶, 该成熟酶选自该菌株所分泌的木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖 苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶,
     (ii) 核苷酸序列所包含的 cDNA 序列的互补链, 所述核苷酸序列包含于以 CBS 保藏
     号 274.96 保藏的 Botryosphaeria rhodina 菌株中, 并编码成熟酶, 该成熟酶选自该菌株所 分泌的木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶 ;
     其中所述酶具有选自木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多 肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶的功能。
     本发明的另外的方面提供编码本发明多肽的多核苷酸 ; 包含编码该多肽的多核苷 酸的核苷酸构建体, 其中所述多核苷酸与一种或多种指导该多肽在宿主细胞中生产的调控 序列可操作地连接 ; 包含本发明的核苷酸构建体的重组表达载体, 和包含本发明的核苷酸 构建体的重组宿主细胞。
     本发明的另一个方面提供制备本发明的多肽的方法, 包括 :
     (a) 培养包含编码本发明多肽的核苷酸序列的株系以产生所述多肽, 其中所述株 系能够表达并分泌该多肽 ; 及
     (b) 回收该多肽。
     本发明的另外的方面提供包含本发明的多肽的组合物, 以及制备这样的组合物的 方法, 包括将本发明的多肽与赋形剂混合。
     本发明的另外的方面提供本发明的多肽或包含所述多肽的组合物在多种应用中 的用途。
     具体地, 本发明还涉及如下方面 :
     1. 选自下组的分离多肽 :
     (a) 包含氨基酸序列的多肽, 所述氨基酸序列与由 SEQ ID NO : 2, SEQ ID NO : 4, SEQ ID NO : 6, SEQ ID NO : 8, SEQ ID NO : 10, SEQ ID NO : 12, SEQ ID NO : 14, SEQ ID NO : 16, SEQ ID NO : 18, SEQ ID NO : 20, SEQ ID NO : 22, SEQ ID NO : 24, SEQ ID NO : 26, SEQ ID NO : 28, SEQ ID NO : 30, SEQ ID NO : 32, SEQ ID NO : 34, SEQ ID NO : 36, SEQ ID NO : 38, SEQ ID NO : 40 和 SEQ ID NO : 42 构成的组中所包含的成熟多肽的序列具有至少 90%的同一性,
     (b) 由核苷酸序列所编码的多肽, 该核苷酸序列在高度严紧条件下与选自下组多 核苷酸探针杂交 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列选自 SEQ ID NO : 1, SEQ ID NO : 3, SEQ ID NO : 5, SEQ ID NO : 7, SEQ ID NO : 9, SEQ ID NO : 11, SEQ ID NO : 13, SEQ ID NO : 15, SEQ ID NO : 17, SEQ ID NO : 19, SEQ ID NO : 21, SEQ ID NO : 23, SEQ ID NO : 25, SEQ ID NO : 27, SEQ ID NO : 29, SEQ ID NO : 31, SEQ ID NO : 33, SEQ ID NO : 35, SEQ ID NO : 37, SEQ ID NO : 39 和 SEQ ID NO : 41 的编码成熟多肽的区域,
     (ii) 核苷酸序列中所包含的 cDNA 序列的互补链, 所述核苷酸序列选自 SEQ ID NO : 1, SEQ ID NO : 3, SEQ ID NO : 5, SEQ ID NO : 7, SEQ ID NO : 9, SEQ ID NO : 11, SEQ ID NO : 13, SEQ ID NO : 15, SEQ ID NO : 17, SEQ ID NO : 19, SEQ ID NO : 21, SEQ ID NO : 23, SEQ ID NO : 25, SEQ ID NO : 27, SEQ ID NO : 29, SEQ ID NO : 31, SEQ ID NO : 33, SEQ ID NO : 35, SEQ ID NO : 37, SEQ ID NO : 39 和 SEQ ID NO : 41 的编码成熟多肽的区域,
     其中所述多肽具有由 SEQ ID NO : 2, SEQ ID NO : 4, SEQ ID NO : 6, SEQ ID NO : 8, SEQ ID NO : 10, SEQ ID NO : 12, SEQ ID NO : 14, SEQ ID NO : 16, SEQ ID NO : 18, SEQ ID NO : 20, SEQ ID NO : 22, SEQ ID NO : 24, SEQ ID NO : 26, SEQ ID NO : 28, SEQ ID NO : 30, SEQ IDNO : 32, SEQ ID NO : 34, SEQ ID NO : 36, SEQ ID NO : 38, SEQ ID NO : 40 和 SEQ ID NO : 42 构 成的组中所包含的相应成熟多肽的功能。
     2. 选自下组的分离的酶 :
     (a) 包含氨基酸序列的酶, 所述氨基酸序列与选自以 CBS 保藏登录号 274.96 保藏 的 Botryosphaeria rhodina 菌株所分泌的木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多 肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽 酶的成熟酶的氨基酸序列具有至少 90%的同一性。
     (b) 由核苷酸序列编码的多肽, 该核苷酸序列在高度严紧条件下与选自下列的多 核苷酸探针杂交 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列包含于以 CBS 保藏登录号 274.96 保藏 的 Botryosphaeria rhodina 菌株中, 并编码成熟酶, 该成熟酶选自该菌株所分泌的木聚糖 酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡 糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶,
     (ii) 核苷酸序列所含 cDNA 序列的互补链, 所述核苷酸序列包含于以 CBS 保藏登录 号 274.96 保藏的 Botryosphaeria rhodina 菌株中, 并编码成熟酶, 该成熟酶选自该菌株所 分泌的木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶 ; 其中所述酶具有选自木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多 肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶的功能。
     3. 项 1 或 2 的多肽, 其选自 :
     (a) 包含氨基酸序列的多肽, 所述氨基酸序列与选自下列的序列具有至少 90%的 同一性 :
     SEQ ID NO : 2 的氨基酸 1-291 ; SEQ ID NO : 4 的 1-202 ; SEQ ID NO : 6 的氨基酸 1-352 ; SEQ ID NO : 8 的氨基酸 1-431 ; SEQ ID NO : 10 的氨基酸 1-185 ; SEQ ID NO : 12 的氨 基酸 1-218 ; SEQ ID NO : 14 的氨基酸 1-249 ; SEQ ID NO : 16 的 1-255 ; SEQ ID NO : 18 的氨基 酸 1-205 ; SEQ ID NO : 20 的氨基酸 1-243 ; SEQ ID NO : 22 的氨基酸 1-415 ; SEQ ID NO : 24 的 氨基酸 1-377 ; SEQ ID NO : 26 的氨基酸 1-259 ; SEQ ID NO : 28 的氨基酸 1-248 ; SEQ ID NO : 30 的氨基酸 1-149 ; SEQ ID NO : 32 的氨基酸 1-202 ; SEQ ID NO : 34 的氨基酸 1-603 ; SEQ ID NO : 36 的氨基酸 1-301 ; SEQ ID NO : 38 的氨基酸 1-438 ; SEQ ID NO : 40 的氨基酸 1-396 ; 和 SEQ ID NO : 42 的氨基酸 1-262 ;
     (b) 由核苷酸序列编码的多肽, 所述核苷酸序列在高度严紧条件下与选自下列的 多核苷酸杂交 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列选自 SEQ ID NO : 1 的核苷酸 55-927、 SEQ ID NO : 3 的核苷酸 58-663、 SEQ ID NO : 5 的核苷酸 55-1110、 SEQ ID NO : 7 的核苷酸 55-1347、 SEQ ID NO : 9 的核苷酸 1-555、 SEQ ID NO : 11 的核苷酸 49-702、 SEQ ID NO : 13 的 核苷酸 40-786、 SEQ ID NO : 15 的核苷酸 55-819、 SEQ ID NO : 17 的核苷酸 61-675、 SEQ ID NO : 19 的核苷酸 1-729、 SEQ ID NO : 21 的核苷酸 55-1299、 SEQ ID NO : 23 的核苷酸 49-1179、 SEQ ID NO : 25 的核苷酸 70-846、 SEQ ID NO : 27 的核苷酸 58-810、 SEQ ID NO : 31 的核苷酸 55-660、 SEQ ID NO : 33 的核苷酸 46-1854、 SEQ ID NO : 35 的核苷酸 64-966、 SEQ ID NO : 37
     3. 项 1 或 2 的多肽, 其选自 :
     (a) 包含氨基酸序列的多肽, 所述氨基酸序列与选自下列的序列具有至少 90%的 同一性 :
     SEQ ID NO : 2 的氨基酸 1-291 ; SEQ ID NO : 4 的 1-202 ; SEQ ID NO : 6 的氨基酸 1-352 ; SEQ ID NO : 8 的氨基酸 1-431 ; SEQ ID NO : 10 的氨基酸 1-185 ; SEQ ID NO : 12 的氨 基酸 1-218 ; SEQ ID NO : 14 的氨基酸 1-249 ; SEQ ID NO : 16 的 1-255 ; SEQ ID NO : 18 的氨基 酸 1-205 ; SEQ ID NO : 20 的氨基酸 1-243 ; SEQ ID NO : 22 的氨基酸 1-415 ; SEQ ID NO : 24 的 氨基酸 1-377 ; SEQ ID NO : 26 的氨基酸 1-259 ; SEQ ID NO : 28 的氨基酸 1-248 ; SEQ ID NO : 30 的氨基酸 1-149 ; SEQ ID NO : 32 的氨基酸 1-202 ; SEQ ID NO : 34 的氨基酸 1-603 ; SEQ ID NO : 36 的氨基酸 1-301 ; SEQ ID NO : 38 的氨基酸 1-438 ; SEQ ID NO : 40 的氨基酸 1-396 ; 和 SEQ ID NO : 42 的氨基酸 1-262 ;
     (b) 由核苷酸序列编码的多肽, 所述核苷酸序列在高度严紧条件下与选自下列的 多核苷酸杂交 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列选自 SEQ ID NO : 1 的核苷酸 55-927、 SEQ ID NO : 3 的核苷酸 58-663、 SEQ ID NO : 5 的核苷酸 55-1110、 SEQ ID NO : 7 的核苷酸 55-1347、 SEQ ID NO : 9 的核苷酸 1-555、 SEQ ID NO : 11 的核苷酸 49-702、 SEQ ID NO : 13 的 核苷酸 40-786、 SEQ ID NO : 15 的核苷酸 55-819、 SEQ ID NO : 17 的核苷酸 61-675、 SEQ ID NO : 19 的核苷酸 1-729、 SEQ ID NO : 21 的核苷酸 55-1299、 SEQ ID NO : 23 的核苷酸 49-1179、 SEQ ID NO : 25 的核苷酸 70-846、 SEQ ID NO : 27 的核苷酸 58-810、 SEQ ID NO : 31 的核苷酸 55-660、 SEQ ID NO : 33 的核苷酸 46-1854、 SEQ ID NO : 35 的核苷酸 64-966、 SEQ ID NO : 37
     的核苷酸 55-1368、 SEQ ID NO : 39 的核苷酸 61-1248, 和 SEQ ID NO : 41 的核苷酸 64-849 ;
     (ii) 核苷酸序列中所包含的 cDNA 序列的互补链, 所述核苷酸序列选自 : SEQ ID NO : 1 的核苷酸 55-927、 SEQ ID NO : 3 的核苷酸 58-663、 SEQ ID NO : 5 的核苷酸 55-1110、 SEQ ID NO : 7 的核苷酸 55-1347、 SEQ ID NO : 9 的核苷酸 1-555、 SEQ ID NO : 11 的核苷酸 49-702、 SEQ ID NO : 13 的核苷酸 40-786、 SEQ ID NO : 15 的核苷酸 55-819、 SEQ ID NO : 17 的核苷酸 61-675、 SEQ ID NO : 19 的核苷酸 1-729、 SEQ ID NO : 21 的核苷酸 55-1299、 SEQ ID NO : 23 的 核苷酸 49-1179、 SEQ ID NO : 25 的核苷酸 70-846、 SEQ ID NO : 27 的核苷酸 58-810、 SEQ ID NO : 31 的核苷酸 55-660、 SEQ ID NO : 33 的核苷酸 46-1854、 SEQ ID NO : 35 的核苷酸 64-966、 SEQ ID NO : 37 的核苷酸 55-1368、 SEQ ID NO : 39 的核苷酸 61-1248, 和 SEQ ID NO : 41 的核 苷酸 64-849。
     4. 项 3 的多肽, 其中所述多肽是酶, 所述酶选自具有这样的氨基酸序列的多肽 : 所述氨基酸序列与选自下列的氨基酸序列具有至少 95%的同一性 : SEQ ID NO : 2 的氨基 酸 1-291 ; SEQ ID NO : 4 的 1-202 ; SEQ ID NO : 6 的氨基酸 1-352 ; SEQ ID NO : 8 的氨基酸 1-431 ; SEQ ID NO : 10 的氨基酸 1-185 ; SEQ ID NO : 12 的氨基酸 1-218 ; SEQ ID NO : 14 的氨 基酸 1-249 ; SEQ ID NO : 16 的 1-255 ; SEQ ID NO : 18 的氨基酸 1-205 ; SEQ ID NO : 20 的氨基 酸 1-243 ; SEQ ID NO : 22 的氨基酸 1-415 ; SEQ ID NO : 24 的氨基酸 1-377 ; SEQ ID NO : 26 的 氨基酸 1-259 ; SEQ ID NO : 28 的氨基酸 1-248 ; SEQ ID NO : 30 的氨基酸 1-149 ; SEQ ID NO : 32 的氨基酸 1-202 ; SEQ ID NO : 34 的氨基酸 1-603 ; SEQ ID NO : 36 的氨基酸 1-301 ; SEQ ID NO : 38 的氨基酸 1-438 ; SEQ ID NO : 40 的氨基酸 1-396 ; 和 SEQ ID NO : 42 的氨基酸 1-262。 5. 项 4 的多肽, 其中该多肽是酶, 所述酶选自由这样的核苷酸序列所编码的多肽, 所述核苷酸序列在极高严紧条件下与选自下列的多核苷酸杂交 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列选自 : SEQ ID NO : 1 的核苷酸 55-927、 SEQ ID NO : 3 的核苷酸 58-663、 SEQ ID NO : 5 的核苷酸 55-1110、 SEQ ID NO : 7 的核苷酸 55-1347、 SEQ ID NO : 9 的核苷酸 1-555、 SEQ ID NO : 11 的核苷酸 49-702、 SEQ ID NO : 13 的 核苷酸 40-786、 SEQ ID NO : 15 的核苷酸 55-819、 SEQ ID NO : 17 的核苷酸 61-675、 SEQ ID NO : 19 的核苷酸 1-729、 SEQ ID NO : 21 的核苷酸 55-1299、 SEQ ID NO : 23 的核苷酸 49-1179、 SEQ ID NO : 25 的核苷酸 70-846、 SEQ ID NO : 27 的核苷酸 58-810、 SEQ ID NO : 31 的核苷酸 55-660、 SEQ ID NO : 33 的核苷酸 46-1854、 SEQ ID NO : 35 的核苷酸 64-966、 SEQ ID NO : 37 的核苷酸 55-1368、 SEQ ID NO : 39 的核苷酸 61-1248, 和 SEQ ID NO : 41 的核苷酸 64-849 ; 和
     (ii) 核苷酸序列中所包含的 cDNA 序列的互补链, 所述核苷酸序列选自 : SEQ ID NO : 1 的核苷酸 55-927、 SEQ ID NO : 3 的核苷酸 58-663、 SEQ ID NO : 5 的核苷酸 55-1110、 SEQ ID NO : 7 的核苷酸 55-1347、 SEQ ID NO : 9 的核苷酸 1-555、 SEQ ID NO : 11 的核苷酸 49-702、 SEQ ID NO : 13 的核苷酸 40-786、 SEQ ID NO : 15 的核苷酸 55-819、 SEQ ID NO : 17 的核苷酸 61-675、 SEQ ID NO : 19 的核苷酸 1-729、 SEQ ID NO : 21 的核苷酸 55-1299、 SEQ ID NO : 23 的 核苷酸 49-1179、 SEQ ID NO : 25 的核苷酸 70-846、 SEQ ID NO : 27 的核苷酸 58-810、 SEQ ID NO : 31 的核苷酸 55-660、 SEQ ID NO : 33 的核苷酸 46-1854、 SEQ ID NO : 35 的核苷酸 64-966、 SEQ ID NO : 37 的核苷酸 55-1368、 SEQ ID NO : 39 的核苷酸 61-1248, 和 SEQ ID NO : 41 的核 苷酸 64-849。
     (i) 核苷酸序列的互补链, 所述核苷酸序列选自 : SEQ ID NO : 1 的核苷酸 55-927、 SEQ ID NO : 3 的核苷酸 58-663、 SEQ ID NO : 5 的核苷酸 55-1110、 SEQ ID NO : 7 的核苷酸 55-1347、 SEQ ID NO : 9 的核苷酸 1-555、 SEQ ID NO : 11 的核苷酸 49-702、 SEQ ID NO : 13 的 核苷酸 40-786、 SEQ ID NO : 15 的核苷酸 55-819、 SEQ ID NO : 17 的核苷酸 61-675、 SEQ ID NO : 19 的核苷酸 1-729、 SEQ ID NO : 21 的核苷酸 55-1299、 SEQ ID NO : 23 的核苷酸 49-1179、 SEQ ID NO : 25 的核苷酸 70-846、 SEQ ID NO : 27 的核苷酸 58-810、 SEQ ID NO : 31 的核苷酸 55-660、 SEQ ID NO : 33 的核苷酸 46-1854、 SEQ ID NO : 35 的核苷酸 64-966、 SEQ ID NO : 37 的核苷酸 55-1368、 SEQ ID NO : 39 的核苷酸 61-1248, 和 SEQ ID NO : 41 的核苷酸 64-849 ; 和
     (ii) 核苷酸序列中所包含的 cDNA 序列的互补链, 所述核苷酸序列选自 : SEQ ID NO : 1 的核苷酸 55-927、 SEQ ID NO : 3 的核苷酸 58-663、 SEQ ID NO : 5 的核苷酸 55-1110、 SEQ ID NO : 7 的核苷酸 55-1347、 SEQ ID NO : 9 的核苷酸 1-555、 SEQ ID NO : 11 的核苷酸 49-702、 SEQ ID NO : 13 的核苷酸 40-786、 SEQ ID NO : 15 的核苷酸 55-819、 SEQ ID NO : 17 的核苷酸 61-675、 SEQ ID NO : 19 的核苷酸 1-729、 SEQ ID NO : 21 的核苷酸 55-1299、 SEQ ID NO : 23 的 核苷酸 49-1179、 SEQ ID NO : 25 的核苷酸 70-846、 SEQ ID NO : 27 的核苷酸 58-810、 SEQ ID NO : 31 的核苷酸 55-660、 SEQ ID NO : 33 的核苷酸 46-1854、 SEQ ID NO : 35 的核苷酸 64-966、 SEQ ID NO : 37 的核苷酸 55-1368、 SEQ ID NO : 39 的核苷酸 61-1248, 和 SEQ ID NO : 41 的核 苷酸 64-849。
     6. 项 3 的多肽, 其中所述多核苷酸编码由选自下列的多肽所组成的多肽 : SEQ ID NO : 2 的氨基酸 1-291 ; SEQ ID NO : 4 的 1-202 ; SEQ ID NO : 6 的氨基酸 1-352 ; SEQ ID NO : 8 的氨基酸 1-431 ; SEQ ID NO : 10 的氨基酸 1-185 ; SEQ ID NO : 12 的氨基酸 1-218 ; SEQ ID NO : 14 的氨基酸 1-249 ; SEQ ID NO : 16 的 1-255 ; SEQ ID NO : 18 的氨基酸 1-205 ; SEQ ID NO : 20 的氨基酸 1-243 ; SEQ ID NO : 22 的氨基酸 1-415 ; SEQ ID NO : 24 的氨基酸 1-377 ; SEQID NO : 26 的氨基酸 1-259 ; SEQ ID NO : 28 的氨基酸 1-248 ; SEQ ID NO : 30 的氨基酸 1-149 ; SEQ ID NO : 32 的氨基酸 1-202 ; SEQ ID NO : 34 的氨基酸 1-603 ; SEQ ID NO : 36 的氨基酸 1-301 ; SEQ ID NO : 38 的氨基酸 1-438 ; SEQ ID NO : 40 的氨基酸 1-396 ; 和 SEQ ID NO : 42 的氨基酸 1-262。
     7. 项 3 的多肽, 其中所述多肽是 GH10 木聚糖酶, 所述 GH10 木聚糖酶包含氨基酸序 列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获 得的 GH10 木聚糖酶具有至少 90%的同一性。
     8. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 2 的氨基酸 1-291 的 GH10 木聚糖 酶。
     9. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 2 的氨基酸 1-291 组成的 GH10 木聚 糖酶。 10. 项 3 的多肽, 其中所述多肽是 GH11 木聚糖酶, 所述 GH11 木聚糖酶包含氨基酸 序列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的 GH11 木聚糖酶具有至少 90%的同一性。
     11. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 4 的氨基酸 1-202 的 GH11 木聚糖 酶。
     12. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 4 的氨基酸 1-202 组成的 GH11 木聚 糖酶。
     13. 项 3 的多肽, 其中该多肽是丝氨酸酯酶, 所述丝氨酸酯酶包含氨基酸序列, 所 述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的丝 氨酸酯酶具有至少 90%的同一性。
     14. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 6 的氨基酸 1-352 的丝氨酸酯酶。
     15. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 6 的氨基酸 1-352 组成的丝氨酸酯 酶。
     16. 项 3 的多肽, 其中该多肽是脂肪酶, 所述脂肪酶包含氨基酸序列, 所述氨基酸 序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的丝氨酸酯酶 具有至少 90%的同一性。
     17. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 8 的氨基酸 1-431 的脂肪酶。
     18. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 8 的氨基酸 1-431 组成的脂肪酶。
     19. 项 3 的多肽, 其中该多肽是过氧化物酶, 所述过氧化物酶包含与可从以保藏登 录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的过氧化物酶具有至少 90%的同一 性的氨基酸序列。
     20. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 10 的氨基酸 1-185 的过氧化物酶。
     21. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 10 的氨基酸 1-185 组成的过氧化物
     酶。 22. 项 3 的多肽, 其中该多肽是 GH 61A 多肽, 所述 GH 61A 多肽包含氨基酸序列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的 GH 61A 多肽具有至少 90%的同一性。
     23. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 12 的氨基酸 1-218 的 GH 61A 多 肽。
     24. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 12 的氨基酸 1-218 组成的 GH 61A 多 肽。
     25. 项 3 的多肽, 其中该多肽是 GH 61B 多肽, 所述 GH 61B 多肽包含氨基酸序列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的 GH 61B 多肽具有至少 90%的同一性。
     26. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 14 的氨基酸 1-249 的 GH 61B 多 肽。
     27. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 14 的氨基酸 1-249 组成的 GH 61B 多 肽。
     28. 项 3 的多肽, 其中该多肽是 GH 61C 多肽, 所述 GH 61C 多肽包含氨基酸序列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的 GH 61C 多肽具有至少 90%的同一性。
     29. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 16 的氨基酸 1-255 的 GH 61C 多 肽。
     30. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 16 的氨基酸 1-255 组成的 GH 61C 多 肽。
     31. 项 3 的多肽, 其中该多肽是 GH 61D 多肽, 所述 GH 61D 多肽包含氨基酸序列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的 GH 61D 多肽具有至少 90%的同一性。
     32. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 18 的氨基酸 1-205 的 GH 61D 多 肽。
     33. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 18 的氨基酸 1-205 组成的 GH 61D 多 肽。
     34. 项 3 的多肽, 其中该多肽是 β- 葡糖苷酶, 所述 β- 葡糖苷酶包含氨基酸序列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的 β- 葡糖苷酶具有至少 90%的同一性。
     35. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 34 的氨基酸 1-603 的 β- 葡糖苷 酶。
     36. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 34 的氨基酸 1-603 组成的 β- 葡糖 苷酶。
     37. 项 3 的多肽, 其中该多肽是内切阿拉伯糖酶, 所述内切阿拉伯糖酶包含氨基酸 序列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的内切阿拉伯糖酶具有至少 90%的同一性。
     38. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 36 的氨基酸 1-301 的内切阿拉伯糖酶。 39. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 36 的氨基酸 1-301 组成的内切阿拉 伯糖酶。
     40. 项 3 的多肽, 其中该多肽是内切阿拉伯糖酶, 所述内切阿拉伯糖酶包含氨基酸 序列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的内切阿拉伯糖酶具有至少 90%的同一性。
     41. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 38 的氨基酸 1-438 的内切阿拉伯 糖酶。
     42. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 38 的氨基酸 1-438 组成的内切阿拉 伯糖酶。
     43. 项 3 的多肽, 其中该多肽是胃蛋白酶肽酶, 所述胃蛋白酶肽酶包含与可从以保 藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的胃蛋白酶肽酶具有至少 90% 的同一性的氨基酸序列。
     44. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 40 的氨基酸 1-396 的胃蛋白酶肽 酶。
    
    45. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 40 的氨基酸 1-396 组成的胃蛋白酶肽酶。 46. 项 3 的多肽, 其中该多肽是胃蛋白酶肽酶, 所述胃蛋白酶肽酶包含氨基酸序 列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获 得的胃蛋白酶肽酶具有至少 90%的同一性。
     47. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 42 的氨基酸 1-262 的胃蛋白酶肽 酶。
     48. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 42 的氨基酸 1-262 组成的胃蛋白酶 肽酶。
     49. 多核苷酸, 其包含编码项 3 中所定义的多肽的核苷酸序列。
     50. 核酸构建体, 其包含项 49 中定义的核苷酸序列, 该核苷酸序列与一种或多种 指导所述多肽在宿主细胞中生产的调控序列可操作地连接。
     51. 重组表达载体, 其包含项 50 的核酸构建体。
     52. 重组宿主细胞, 其包含项 50 的核酸构建体。
     53. 生产项 3 的多肽的方法, 其包括 :
     a. 培养菌株以产生所述多肽, 其中所述菌株的野生型形式能够产生该多肽 ; 及
     b. 回收该多肽。
     54. 生产项 3 的多肽的方法, 其包括 :
     a. 在有助于产生所述多肽的条件下, 培养项 52 中定义的重组宿主细胞 ; 及
     b. 回收该多肽。
     55. 组合物, 其包含项 3 的多肽和赋形剂。
     56. 制备项 55 的组合物的方法, 其包含将项 1 的多肽与赋形剂混合。
     57. 适于在电子设备中使用的存储介质, 所述电子设备包含项 3 的多肽的氨基酸
     序列的信息。
     58. 适于在电子设备中使用的存储介质, 所述电子设备包含项 49 的多核苷酸的核 酸序列的信息。
     序列表
     本发明包含序列表形式的信息, 其附于本申请中并在连同本申请的数据载体上提 交。数据载体的内容全部通过引用并入本文。选自 SEQ ID NO : 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39 和 41 的序列的编码成熟多肽的区域, 分别编码选自 SEQ ID NO : 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42 的序列的 成熟多肽。 因此 SEQ ID NO : 1 的编码成熟多肽的区域编码 SEQ ID NO : 2 中包含的成熟多肽 序列, SEQ ID NO : 3 的编码成熟多肽的区域编码 SEQ ID NO : 4 中包含的成熟多肽序列, 依此 类推。 附图说明
     图 1 显示 pSigA4 的质粒图。
     发明详述 定义
     如以下所用的, 术语 “ADNA 组” 指由 SEQ ID NO : 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39 和 41 组成的核苷酸序列的组。因此, 当提到包含于或选自 由 “ADNA 组” 组成的序列组 ( 或包含于或选自 “ADNA 组” ) 的核苷酸序列时, 是指该序列包含 于或选自由 SEQ ID NO : 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39 和 41 组成的核苷酸序列的组。
     如以下所用的, 术语 “EDNA 组” 指由 SEQ ID NO : 1, 3, 5, 7, 9, 11, 13, 15, 17, 33, 35, 37, 39 和 41 组成的核苷酸序列的组。因此, 当提到包含于或选自由 “EDNA 组” 组成的序列组 ( 或 包含于或选自 “EDNA 组” ) 的核苷酸序列时, 是指该序列包含于或选自由 SEQ ID NO : 1, 3, 5, 7, 9, 11, 13, 15, 17, 33, 35, 37, 39 和 41 组成的核苷酸序列的组。
     类似地, 如以下所用的, 术语 “B 多肽组” 指由 SEQ ID NO : 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40 和 42 组成的多肽序列的组。因此, 当提到包含于或 选自由 “B 多肽组” 组成的序列组 ( 或包含于或选自 “B 多肽组” ) 的多肽序列时, 是指该序列包 含于或选自由 SEQ ID NO : 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40 和 42 组成的多肽序列的组。
     类似地, 如以下所用的, 术语 “D 多肽组” 指由 SEQ ID NO : 2, 4, 6, 8, 10, 12, 14, 16, 18, 34, 36, 38, 40 和 42 组成的多肽序列的组。因此, 当提到包含于或选自由 “D 多肽组” 组成的序 列组 ( 或包含于或选自 “D 多肽组” ) 的多肽序列时, 是指该序列包含于或选自由 SEQ ID NO : 2, 4, 6, 8, 10, 12, 14, 16, 18, 34, 36, 38, 40 和 42 组成的多肽序列的组。
     本文中使用的术语 “同一性” 理解为两条氨基酸序列或两条核苷酸序列之间的同 源性。对于本发明而言, 同一性程度是使用 Vector NTI 程序 7.1 版 (Informax inc., 7600 Wisconsin Avenue, Suite #1100, Bethesda, MD 20814, USA) 的 AlignX 确定的。氨基酸比 对使用 Clustal W 算法 (Thompson, J.D., Higgins, D.G. 和 Gibson, T.J.(1994)CLUSTAL W : improving the sensitivity of progressive multiple sequence alignment through
     sequence weighting, positions-specific gap penalties and weight matrix choice. Nucleic Acids Research, 22 : 4673-4680) 来生成。 还使用下面的参数 : 缺口生成罚分 (gap opening penalty) 为 10, 缺口延伸罚分 (gap extension penalty) 为 0.05, 缺口分离罚 分范围 (gap separation penalty range) 为 8。配对比对 (pairwise alignment) 参数 为 Ktuple = 1, 缺口罚分 (gap penalty) = 3, 缺口长度生成罚分 (gap length opening penalty) = 10, 缺口延伸罚分= 0.1, 窗口大小 (window size) = 5, 对角线 (diagonals) = 5。 两条核苷酸序列之间同一性程度的确定也是使用如上所述的相同算法和软件包, 例如 用下列的设定 : 缺口罚分为 10, 缺口长度罚分为 10。配对比对参数为 Ktuple = 3, 缺口罚 分= 3, 窗口= 20。
     在本发明的范围内, 术语 “功能性多肽” (functional polypeptide) 是指这样的 多肽, 其可被细胞表达和分泌, 并且构成能够根据其按照细胞设计应实现的功能来运作的 操作单元。可选地, 该多肽要具备预定的功能可能需要辅因子 (co-factors)。功能性多肽 的一个例子是具有催化活性的多肽或酶, 其帮助细胞催化细胞周围环境中的反应。另外的 例子有充当信号物质的多肽。另外的例子还有行使针对环境参数 ( 细胞周围环境中的化学 物质 ) 的传感物 ( 受体 ) 功能的多肽, 或具有抗别的生物的活性的多肽 ( 抗微生物 ( 多 ) 肽 ), 或对细胞的结构完整性作贡献的多肽。 在 本 文 中, 关于氨基酸序列或多肽的部分使用的术语 “成 熟 区 域” (mature region) 是 指 氨 基 酸 序 列 或 多 肽 中 作 为 成 熟 的 功 能 性 多 肽 的 部 分 (portion)、 区域 (region)、 域 (domain) 或区段 (section)。
     本文中使用的术语 “编码成熟多肽的核苷酸序列” 是指从编码成熟多肽的第一个 氨基酸的三联体算起, 直到编码成熟多肽的最后一个氨基酸的三联体的区域。
     在本文中, 关于本发明的特定酶使用的术语 “GH” , 例如 “GH10” , 是由 B.Henrissat 建立的糖基水解酶 (glycosyl hydrolase enzymes) 的家族分类系统。 GH 后面的数字指不同 的家族。 该分类系统对本领域技术人员而言是熟知的。 见 Henrissat B., A classification of glycosyl hydrolases based on amino-acid sequence similarities, Biochem. J.280 : 309-316(1991) ; Henrissat B., Bairoch A, New families in the classification of glycosyl hydrolases based on amino acid sequence similarities, Biochem. J.293 : 781-788(1993) ; Henrissat B., Bairoch A., Updating the sequence-based classification of glycosyl hydrolases, Biochem.J.316 : 695-696(1996) ; Davies G., Henrissat B., Structures and mechanisms of glycosyl hydrolases, Structure 3 : 853-859(1995)。
     本发明的多肽
     本发明的多肽都是被 Botryosphaeria rhodina CBS 274.96 分泌, 以为该特定细 胞执行功能的多肽。
     在 Botryosphaeria rhodina CBS 274.96 基因组中有数千个可能的基因, 其中, 该 基因组的多核苷酸编码 21 种 B 多肽组中所包括的分泌的功能性成熟多肽, 这些多肽已被鉴定 为功能性的, 并被所选的宿主细胞翻译成功能性多肽并分泌。
     因此, Botryosphaeria rhodina CBS 274.96 表达并分泌 B 多肽组中所包括的功能 性成熟多肽, 而且在该特定菌株的基因组中, ADNA 组的序列的编码成熟多肽的区域, 是编码 B
     12101942428 A CN 101942433多肽说明书11/50 页组序列中所包括的成熟多肽的基因。另外在特定的实施方案中, 当培养用包含 ADNA 组的 序列的编码成熟多肽的区域的多核苷酸转化的大肠杆菌 (E.coli) 宿主时, 所有编码 B 多肽组 中所包括的成熟多肽的基因都可以表达, 而且它们相应的成熟多肽可以被分泌。通过比较 这 21 个多肽序列的序列与已知序列的同源性或同一性, 标定了这些多肽的具体功能。 这 21 种分泌的功能性多肽中的至少 14 种被确定是酶和 / 或类似酶。
     因此, 本发明提供选自下列的分离多肽 :
     (a) 具有氨基酸序列的多肽 : 所述氨基酸序列与选自 B 多肽组中所包括的成熟多肽 的氨基酸序列具有至少 90%的同一性 ;
     (b) 由核苷酸序列编码的多肽 : 所述核苷酸序列在高度严紧条件下与选自下列的 多核苷酸探针杂交 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列选自 ADNA 组序列的编码成熟多肽的区 域;
     (ii) 核苷酸序列所包含的 cDNA 序列的互补链, 所述核苷酸序列选自 ADNA 组序列的 编码成熟多肽的区域 ;
     其中该多肽显示相应的 B 多肽组的成熟多肽序列的功能。
     在一个具体的实施方案中, 本发明的多肽选自由本发明人分离并以 CBS 保藏登录 号 (accession No.)274.96 保藏的 Botryosphaeria rhodina 所分泌的酶, 即由木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖 苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶组成的酶组。
     本发明还提供选自下列的分离的酶 :
     (a) 包含这样的氨基酸序列的酶, 所述氨基酸序列与选自以 CBS 保藏号 274.96 保 藏的 Botryosphaeria rhodina 菌株所分泌的木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶 肽酶组成的组中的成熟酶的氨基酸序列具有至少 90%的同一性。
     (b) 由核苷酸序列编码的多肽, 该核苷酸序列在高度严紧条件下与选自下列的多 核苷酸探针杂交 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列包含于以 CBS 保藏号 274.96 保藏的 Botryosphaeria rhodina 菌株中, 并编码成熟酶, 该成熟酶选自该菌株所分泌的木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖 苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶,
     (ii) 核苷酸序列所含 cDNA 序列的互补链, 所述核苷酸序列包含于以 CBS 保藏号 274.96 保藏的 Botryosphaeria rhodina 菌株中, 并编码成熟酶, 该成熟酶选自该菌株所分 泌的木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶 ;
     其中所述酶具有选自木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多 肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶的功能。
     在一个具体的实施方案中, 所述酶是选自下列的分离的酶 :
     (a) 具有与下述氨基酸序列具有至少 90%的同一性的氨基酸序列的酶, 所述氨基 酸序列选自 D 多肽组的序列中所包含的成熟酶 ;(b) 由核苷酸序列编码的酶, 该核苷酸序列在高度严紧条件下与多核苷酸探针杂 交, 所述多核苷酸探针选自 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列选自 EDNA 组序列的编码成熟酶的区域 ;
     (ii) 核苷酸序列所包含的 cDNA 序列的互补链, 所述核苷酸序列选自 EDNA 组序列的 编码成熟酶的区域 ;
     其中该酶显示相应的 D 多肽组的成熟酶的功能。
     本发明的多肽是分离多肽, 优选地, 本发明的多肽的制剂包含最多 90 重量%的可 能与之天然地相伴随的其他多肽物质 ( 更低百分比的其他多肽物质是优选的, 例如最多 80 重量%, 最多 60 重量%, 最多 50 重量%, 最多 40 重量%, 最多 30 重量%, 最多 20 重量%, 最 多 10 重量%, 最多 9 重量%, 最多 8 重量%, 最多 7 重量%, 最多 6 重量%, 最多 5 重量%, 最 多 4 重量%, 最多 3 重量%, 最多 2 重量%, 最多 1 重量%, 及最多 1/2 重量% )。因此, 优选 本发明的分离多肽为 92%纯, 即本发明的多肽构成制剂中存在的所有多肽物质的至少 92 重量%, 且优选更高的重量百分比, 例如至少 94%纯, 至少 95%纯, 至少 96%纯, 至少 96% 纯, 至少 97%纯, 至少 98%纯, 至少 99%纯, 及至多 99.5%纯。特别地本发明的多肽优选是 基本上纯的形式。具体而言, 优选地, 所述多肽是 “基本上 (essentially) 纯的形式” , 即多 肽制备物基本上不含与该多肽天然相伴随的其它多肽物质。 这可通过例如采用熟知的重组 方法制备多肽来实现。
     本发明的多肽可以是合成制造的, 天然存在的, 或其组合。 在一个具体的实施方案 中, 本发明的多肽可以从微生物, 例如原核细胞, 古细菌细胞或真核细胞得到。这些细胞还 可以是已通过基因工程改变的。
     在一个具体的实施方案中, 本发明的多肽是这样的酶, 其在约 10℃到约 80℃, 具 体是在约 20℃到约 60℃的温度下显示最佳酶活性。
     在一个具体的实施方案中, 本发明的多肽是这样的酶, 其在高至 100℃, 具体是高 至 80℃, 更具体是高至 60℃的温度下是功能上稳定的。
     在一个具体的实施方案中, 本发明的多肽是这样的酶, 其显示选自 B 多肽组所包括 的成熟酶的酶的至少 20%, 具体是至少 40%, 例如至少 50%, 具体是至少 60%, 例如至少 70%, 更具体是至少 80%, 例如至少 90%, 更具体是至少 95%, 例如至少 100%的酶活性。
     在一个具体的实施方案中, 本发明的多肽包括, 含有, 或由这样的氨基酸序列组 成: 该氨基酸序列与选自 B 多肽 组所包括的成熟酶的多肽序列具有至少 90 %的同一性, 特 别是至少 95%, 例如至少 96%, 例如至少 97%, 更具体为至少 98%, 例如至少 99%或甚至 100%的同一性。
     在一个具体的实施方案中, 本发明的多肽包括, 含有, 或由这样的氨基酸序列组 成: 该氨基酸序列与选自 B 多肽组所包括的成熟酶的多肽序列具有至少 50%的同一性, 具体 是至少 60%, 具体是至少 65%, 具体是至少 70%, 具体是至少 75%, 具体是至少 80%或更具 体是至少 85%的同一性。
     在一个具体的实施方案中, 本发明的多肽的氨基酸序列与 B 多肽组所包括的成熟酶 具有最多 10 个氨基酸 ( 例如 10 个氨基酸 ), 具体是最多 5 个氨基酸 ( 例如 5 个氨基酸 ), 例如最多 4 个氨基酸 ( 例如 4 个氨基酸 ), 例如最多 3 个氨基酸 ( 例如 3 个氨基酸 ), 具体 是最多 2 个氨基酸 ( 例如 2 个氨基酸 ), 例如 1 个氨基酸的不同。本发明的多肽可以是从天然来源, 例如 Botryosphaeria rhodina CBS 274.96 株 或其他野生型株分离的野生型多肽, 但本发明也涵盖这样的人工变体, 其中本发明的多肽 被突变, 例如通过在保持该多肽的功能和 / 或其他性质的同时, 对所述多肽添加, 置换和 / 或缺失一个或多个氨基酸。
     因此, 本发明的多肽可以是人工变体, 其中, 包含由 B 多肽组所包括的成熟酶, 或由 其所组成的氨基酸序列至少发生了一个氨基酸的置换, 缺失和 / 或插入。
     本发明的多肽还包括本文所述的氨基酸序列的功能性片段和编码本文所述 的氨基酸序列的功能性片段的核酸, 包括如本文所述的以 CBS 保藏号 274.96 保藏的 Botryosphaeria rhodina 株分泌的成熟酶的片段, 包括从所述以 CBS 保藏号 274.96 保藏 的 Botryosphaeria rhodina 株分泌的木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶中选 择的酶的片段。
     人工变体可以使用本领域已知的标准技术构建, 通常随后进行筛选和 / 或性质鉴 定。 标准技术包括经典的诱变, 例如通过对细胞进行紫外照射或用化学诱变剂处理细胞, 如 Gerhardt 等 (1994) 所述的 ; 体内基因改组 (shuffling), 如 WO 97/07205 所述的, 体外改 组, 如 Stemmer, (1994) 或 WO95/17413 所述的, 随机诱变, 如 Eisenstadt E. 等 .(1994) 所述 的; PCR 技术, 例如 Poulsen 等 (1991) 所述的 ; 家族改组 (family shuffling), 如 J.E.Ness 等, Nature Biotechnology, vol.17, pp.893-896(1999) 所述的 ; 定点诱变, 如 Sambrook 等 (1989), Molecular Cloning, A Laboratory Manual, Cold Spring Harbor, NY 所述的。关 于核苷酸置换的一般性描述可见 Ford 等, 1991, Protein Expression and Purification 2, p.95-107。
     这样的标准基因工程方法还可以用来从编码一种或多种本发明的亲本酶 (parent enzyme) 的基因制备多样性的变体核苷酸序列文库, 在合适的宿主细胞中表达这些酶变 体, 并选择合适的变体。多样性的文库可以用多种本领域已知的方法建立 (Reetz MT ; Jaeger KE, 于 Biocatalysis-from Discovery to Application, Fessner WD 编, Vol.200, pp.31-57(1999) ; Stemmer, Nature, vol.370, p.389-391, 1994 ; Zhao 和 Arnold, Proc. Natl.Acad.ScL, USA, vol.94, pp.7997-8000, 1997 ; 或 Yano 等, Proc.Natl.Acad.ScL, USA, vol.95, pp 5511-5515, 1998)。
     在本发明的一个优选的实施方案中, ( 人工变体和野生型酶中的 ) 氨基酸的改变 从性质上说是轻微的, 即其是 : 不显著影响蛋白质的折叠和 / 或活性的保守性的氨基酸置 换; 小的缺失, 通常为 1 到大约 30 个氨基酸 ; 小的氨基或羧基末端延伸, 例如氨基末端的甲 硫氨酸残基 ; 长达大约 20-25 个残基的小接头肽 ; 或通过改变净电荷或其他功能而有助于 纯化的小段延伸 (small extension), 诸如多组氨酸序列段 (poly-histidine tract)、 抗原 性表位 (antigenic epitope)、 或结合域 (binding domain)。
     下面各组中是保守性置换的例子 : 碱性氨基酸 ( 精氨酸、 赖氨酸和组氨酸 )、 酸性 氨基酸 ( 谷氨酸和天冬氨酸 )、 极性氨基酸 ( 谷氨酰胺和天冬酰胺 )、 疏水性氨基酸 ( 亮氨 酸、 异亮氨酸、 缬氨酸和甲硫氨酸 )、 芳香族氨基酸 ( 苯丙氨酸、 色氨酸和酪氨酸 )、 和小氨基 酸 ( 甘氨酸、 丙氨酸、 丝氨酸和苏氨酸 )。一般情况下不改变或损害蛋白质功能的氨基酸置 换是本领域已知的, 例如 H.Neurath 和 R.L.Hill 在 The Proteins 中所述 (1979, AcademicPress, New York)。最常发生的取代是 Ala/Ser、 Val/Ile、 Asp/Glu、 Thr/Ser、 Ala/Gly、 Ala/ Thr、 Ser/Asn、 Ala/Val、 Ser/Gly、 Tyr/Phe、 Ala/Pro、 Lys/Arg、 Asp/Asn、 Leu/Ile、 Leu/Val、 Ala/Glu、 和 Asp/Gly, 以及上述反向的置换。
     在一个具体的实施方案中, 所述氨基酸改变具有这样的性质, 使得多肽的物理化 学特性被改变。例如, 所进行的氨基酸改变可提高酶的热稳定性、 改变底物特异性、 改变最 佳 pH 等等。
     具体地, 在本发明的多肽, 特别是选自 B 多肽组中所包含的成熟多肽的那些多肽中, 产生人工变体的所述置换、 缺失和 / 或插入的数目最多为 10, 如最多 9, 例如最多 8, 更优选 最多 7, 例如最多 6, 例如最多 5, 最优选最多 4, 例如最多 3, 如最多 2, 特别是最多 1。
     在一个具体的实施方案中所述人工变体是这样的变体, 其在包括人的动物中, 与 亲本酶相比, 具有改变的、 优选减少的免疫原性, 特别是变应原性。术语 “免疫原性” 在本文 中应理解为人工变体当被施用于动物, 包括通过静脉内、 皮肤、 皮下、 口服和气管内施用于 动物时, 引起改变的、 特别是减少的免疫反应的能力。术语 “免疫反应” 在本文中指该人工 变体的施用造成该动物体内免疫球蛋白例如 IgE、 IgG 和 IgM 的水平的改变, 或该动物体内 细胞因子水平的改变。定位 (mapping) 蛋白质的免疫原性 / 抗原性表位的方法、 制备具有 改变的免疫原性的抗体及测量免疫反应的方法在本领域是公知的, 且在例如 WO 92/10755、 WO 00/26230、 WO 00/26354 和 WO 01/31989 中有描述。本文中术语 “变应原性” 理解为该 人工变体造成动物中 IgE 生产的改变特别是减少的能力, 以及结合来自该动物的 IgE 的能 力。特别地, 由于对动物气管内使用所述多肽变体而产生的变应原性 ( 又称呼吸性变应原 性 (respiratory allergenicity)) 是本文特别感兴趣的。
     在另一个实施方案中, 本发明的多肽是由这样的核苷酸序列编码的多肽, 该核苷 酸序列在至少高度严紧的条件, 特别是极高度严紧条件下, 与选自下列的多核苷酸探针杂 交:
     (i) 核苷酸序列的互补链, 所述核苷酸序列选自 ADNA 组序列的编码成熟多肽的区 域;
     (ii) 核苷酸序列中所含的 cDNA 序列的互补链, 所述核苷酸序列选自 ADNA 组序列的 编码成熟多肽的区域 ;
     (iii)(i) 或 (ii) 的编码分泌多肽的片段, 所述分泌多肽具有 B 多肽组中所包含的 相应成熟多肽的功能。
     (J.Sambrook , E.F.Fritsch , 和 T.Maniatus , 1989 , Molecular Cloning , A Laboratory Manual, 第二版, Cold Spring Harbor, New York)。
     特别地, 本发明的多肽被包含这样的核苷酸序列的多核苷酸所编码, 所述核苷酸 序列选自 : ADNA 组序列的编码成熟多肽的区域, 或者与其由于遗传密码的简并性而相异的序 列。更具体地, 本发明的多肽被由这样的核苷酸序列组成的多核苷酸所编码, 所述核苷酸 序列选自 : ADNA 组序列的编码成熟多肽的区域, 或者与其由于遗传密码的简并性而相异的序 列。
     ADNA 组的序列的编码成熟多肽的区域的核苷酸序列或其子序列, 以及 B 多肽组中包 含的成熟多肽的氨基酸序列或其片段, 可以用来设计多核苷酸探针, 以根据本领域熟知的 方法, 从不同属或种的株系中鉴定和克隆编码本发明的酶的 DNA。特别地, 这样的探针可以用来根据标准的 Southern 印迹程序与目标属或种的基因组或 cDNA 杂交, 以鉴定和分离其 中的相应基因。这样的探针可以显著地短于整个序列, 但长度应该为至少 15, 优选至少 25, 更优选至少 35 个核苷酸, 例如长度为至少 70 个核苷酸。但是优选该多核苷酸探针为至少 100 个核苷酸长。例如, 该多核苷酸探针可为至少 200 个核苷酸长, 至少 300 个核苷酸长, 至少 400 个核苷酸长, 或至少 500 个核苷酸长。还可以用更长的探针, 例如至少 600 个核苷 酸长, 至少 700 个核苷酸长, 至少 800 个核苷酸长, 或至少 900 个核苷酸长的多核苷酸探针。 3 35 DNA 和 RNA 探针都可以使用。探针通常进行标记来检测相应的基因 ( 例如用 32P、 H、 S、 生 物素、 或抗生物素蛋白 )。
     因此, 可从这样的其它生物体制备的基因组 DNA 或 cDNA 文库中筛选与上述探针发 生杂交、 且编码本发明的酶的 DNA。来自这样的其它生物体的基因组或其它 DNA 可通过琼 脂糖或聚丙烯酰胺凝胶电泳或其它分离技术来分离。可将来自文库的 DNA 或分离的 DNA 转 移到并固定在硝酸纤维素或其它适宜的载体材料上。为了鉴定与选自 ADNA 组序列中编码成 熟多肽的区域的核苷酸具有所需的同源性和 / 或同一性, 或与之同源和 / 或同一的克隆或 DNA, 在 Southern 印迹中使用带有固定的 DNA 的载体材料。
     对本发明而言, “杂交” 意味着所述核苷酸序列与标记的多核苷酸探针杂交, 所述 探针在高度到极高度严紧条件下与选自 ADNA 组的序列编码成熟多肽的区域的核苷酸序列杂 交。在这些条件下与多核苷酸探针杂交的分子可以用 X 射线胶片或本领域已知的任何方法 来检测。本文中无论何时使用术语 “多核苷酸探针” 时, 应理解这样的探针含有至少 15 个 核苷酸。
     在一个感兴趣的实施方案中, 所述多核苷酸探针是选自 ADNA 组的序列的编码成熟 多肽的区域的核苷酸序列的互补链。
     在另一个感兴趣的实施方案中, 所述多核苷酸探针是编码选自 B 多肽组的酶的核苷 酸序列的互补链。在另一个感兴趣的实施方案中, 所述多核苷酸探针是核苷酸序列的成熟 多肽编码区域的互补链, 所述核苷酸序列选自 ADNA 组的序列的编码成熟多肽的区域。
     对于长度为至少 100 个核苷酸的长探针来说, 高度至极高度的严紧条件定义为遵 循标准 Southern 印迹程序, 于 42℃, 在 5X SSPE、 5X Darhardt’ s 溶液、 1.0% SDS、 100μg/ ml 经剪切且经变性的鲑精 DNA 中进行预杂交和杂交。优选地, 所述至少 100 个核苷酸的长 探针不含有多于 1000 个核苷酸。 对于长度为至少 100 个核苷酸的长探针来说, 最后在 60℃ 下用 0.1x SSC、 0.1 % SDS( 高严紧度 ) 洗涤 3 次, 每次 15 分钟 ; 特别是在 68 ℃下用 0.1x SSC、 0.1% SDS( 极高严紧度 ) 洗涤 3 次, 每次 15 分钟。
     虽然不是特别优选的, 还考虑可以使用更短的探针, 例如长为大约 15 到 99 个核苷 酸的探针, 例如长为约 15 到约 70 个核苷酸。对于这样的短探针, 严紧条件定义为遵循标准 Southern 印迹程序, 在比根据 Bolton 和 McCarthy(1962, Proceedings of the National Academy of Sciences USA 48 : 1390) 的计算方法算得的 Tm 值低大约 5℃至大约 10℃的温 度下, 在 0.9M NaCl、 0.09M Tris-HCl pH7.6、 6mM EDTA、 0.5% NP-40、 1X Denhardt’ s 溶液、 1mM 焦磷酸钠、 1mM 磷酸二氢钠 (sodium monobasic phosphate)、 0.1mM ATP、 和 0.2mg/ml 酵 母 RNA 中进行预杂交、 杂交和杂交后清洗。
     对于长度为大约 15 个核苷酸至大约 99 个核苷酸的短探针来说, 在比 Tm 计算值低 大约 5℃至 10℃的温度下, 将载体材料用 6X SCC 加 0.1% SDS 洗涤 1 次 15 分钟, 然后用 6XSSC 洗涤两次, 每次 15 分钟。
     SEQ ID NO : 2 木聚糖酶 GH10
     在一个特定的实施方案中, 本发明的多肽是包含或由这样的氨基酸序列组成的 GH10 木聚糖酶, 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的 GH10 木聚糖酶, 更具体是 SEQ ID NO : 2 中包含的成熟 GH10 木聚糖酶具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体 是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。更具体 地, 所述成熟 GH10 木聚糖酶包含或由 SEQ ID NO : 2 第 1 到 291 位的序列组成。在本文中, GH10 木聚糖酶定义为属于 EC 3.2.1.8 酶活类群的酶。该类群内切水解 (endohydrolyse) 木聚糖中的 1, 4-β-D- 木糖苷键。糖苷水解酶家族 10(GH10) 还包括具有另外两种已知活 性的酶 ; 内切 -1, 3-β- 木聚糖酶 (EC : 3.2.1.32) ; 纤维二糖水解酶 (EC : 3.2.1.91)。
     SEQ ID NO : 4 木聚糖酶 GH11
     在一个特定的实施方案中, 本发明的多肽是包含或由这样的氨基酸序列组成的 GH11 木聚糖酶, 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的 GH11 木聚糖酶, 更具体是 SEQ ID NO : 4 中包含的成熟 GH11 木聚糖酶具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具 体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。更 具体地, 所述成熟 GH11 木聚糖酶包含或由 SEQ ID NO : 4 第 1 到 202 位的序列组成。在本 文中, GH11 木聚糖酶定义为属于 EC 3.2.1.8 酶活类群的酶。该类群内切水解木聚糖中的 1, 4-β-D- 木糖苷键。糖苷水解酶家族 11(GH11) 包括只具有一种已知活性的酶 ; 木聚糖酶 (EC : 3.2.1.8)。
     SEQ ID NO : 6 丝氨酸酯酶
     在一个特定的实施方案中, 本发明的多肽是丝氨酸酯酶, 具体是包含或由这样的 氨基酸序列组成的角质酶或脂肪酶或羧基酯酶 (carboxyesterase) : 所述氨基酸序列与 可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的丝氨酸酯酶, 更具体是 SEQ ID NO : 6 中包含的成熟丝氨酸酯酶具有至 少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更 具体是至少 99%, 或最具体是 100%的同一性。更具体地, 所述成熟丝氨酸酯酶包含或由 SEQ ID NO : 6 第 1 到 352 位的序列组成。在本文中, 丝氨酸酯酶定义为能够水解溶液中的 可溶性酯类 ( 非胶束 (micelle) 形式的酯类 ) 的酶。更具体地, 丝氨酸酯酶是充当角质酶 (EC 3.1.1.50) 或脂肪酶 (EC.3.1.1.3) 或羧基酯酶, 能够水解蜡 - 脂类 (wax-esters)、 角 质、 三酰基脂肪 (tracyl fats), 油和 / 或脂肪酸链。 具体地, 所述丝氨酸酯酶含有经典的丝 氨酸水解酶 Ser、 His、 Asp 三联体, 例如三酰基脂肪酶 / 角质酶。
     SEQ ID NO : 8 假丝酵母 B 型脂肪酶
     在一个特定的实施方案中, 本发明的多肽是假丝酵母 (candida)B 型脂肪酶 (EC 3.1.1.3), 其包含或由这样的氨基酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的假丝 酵母 B 型脂肪酶, 更具体是 SEQ ID NO : 8 中包含的假丝酵母 B 型脂肪酶具有至少 90 %, 具体是至少 95%, 更具体是至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。更具体地, 所述成熟假丝酵母 B 型脂肪酶包含或 由 SEQ ID NO : 8 第 1 到 431 位的序列组成。在本文中, 假丝酵母 B 型脂肪酶 (Candida B type lipase) 定义为能够将甘油三酸酯 (triglycerides) 水解为二酰基甘油酯 (diacyl glycerides) 和脂肪酸阴离子, 特别是将三酰基甘油水解为二酰基甘油和脂肪酸阴离子的 酶。
     SEQ ID NO : 10 过氧化物酶
     在一个特定的实施方案中, 本发明的多肽是过氧化物酶, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的过氧化物酶, 更具体是 SEQ ID NO : 10 中包含的过氧化物酶具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。 更具体地, 所述 成熟过氧化物酶包含或由 SEQ ID NO : 10 第 1 到 185 位的序列组成。在本文中, 过氧化物酶 定义为属于能够催化氧化 - 还原反应的酶类的酶。因此, 它们被归类为氧化还原酶。它们 的正式 EC 号为 1.11.1。过氧化物酶将 H2O2 还原为水, 而氧化多种底物。因此, 过氧化物酶 是利用 H2O2 作为电子受体来催化不同氧化反应的氧化还原酶。
     SEQ ID NO : 12 GH61A 多肽
     在一个特定的实施方案中, 本发明的多肽是 GH61A 多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的 GH61A 多肽, 更具体是 SEQ ID NO : 8 中包含的 GH61A 多肽具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。 更具体地, 所述 成熟 GH61A 多肽包含或由 SEQ ID NO : 12 第 1 到 218 位的序列组成。在本文中, GH61A 多肽 定义为提供选自下列的一组或多组效应的分泌多肽或蛋白质 :
     1) 当与纤维素酶或纤维素酶混合物联合使用时, 促进纤维质 (cellulosic) 材料 的降解。
     2) 增加酶的溶解性。
     3) 增加酶的稳定性。
     4) 减少酶抑制。
     SEQ ID NO : 14 GH61B 多肽
     在一个特定的实施方案中, 本发明的多肽是 GH61B 多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的 GH61B 多肽, 更具体是 SEQ ID NO : 14 中包含的 GH61B 多肽具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。 更具体地, 所述 成熟 GH61B 多肽包含或由 SEQ ID NO : 14 第 1 到 249 位的序列组成。在本文中, GH61B 多肽 定义为提供选自下列的一组或多组效应的分泌多肽或蛋白质 :
     1) 当与纤维素酶或纤维素酶混合物联合使用时, 促进纤维质材料的降解。
     2) 增加酶的溶解性。
     3) 增加酶的稳定性。SEQ ID NO : 16 GH61C 多肽
     在一个特定的实施方案中, 本发明的多肽是 GH61C 多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的 GH61C 多肽, 更具体是 SEQ ID NO : 16 中包含的 GH61C 多肽具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。 更具体地, 所述 成熟 GH61C 多肽包含或由 SEQ ID NO : 16 第 1 到 255 位的序列组成。在本文中, GH61C 多肽 定义为提供选自下列的一组或多组效应的分泌多肽或蛋白质 :
     1) 当与纤维素酶或纤维素酶混合物联合使用时, 促进纤维质材料的降解。
     2) 增加酶的溶解性。
     3) 增加酶的稳定性。
     SEQ ID NO : 18 GH61D 多肽
     在一个特定的实施方案中, 本发明的多肽是 GH61D 多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的 GH61D 多肽, 更具体是 SEQ ID NO : 18 中包含的 GH61D 多肽具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。 更具体地, 所述 成熟 GH61D 多肽包含或由 SEQ ID NO : 18 第 1 到 205 位的序列组成。在本文中, GH61D 多肽 定义为提供选自下列的一组或多组效应的分泌多肽或蛋白质 :
     1) 当与纤维素酶或纤维素酶混合物联合使用时, 促进纤维质材料的降解。
     2) 增加酶的溶解性。
     3) 增加酶的稳定性。
     SEQ ID NO : 20 功能性多肽
     在一个特定的实施方案中, 本发明的多肽是功能性多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与 SEQ ID NO : 20 具有至少 90%, 具体是至少 95%, 更具体是 至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100% 的同一性。特别是与 SEQ IDNO : 20 中包含的成熟功能性多肽。更具体地, 所述成熟功能性 多肽包含或由 SEQ ID NO : 20 第 1 到 243 位的序列组成。
     SEQ ID NO : 22 功能性多肽
     在一个特定的实施方案中, 本发明的多肽是功能性多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与 SEQ ID NO : 22 具有至少 90%, 具体是至少 95%, 更具体是 至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100% 的同一性。特别是与 SEQ IDNO : 22 中包含的成熟功能性多肽。更具体地, 所述成熟功能性 多肽包含或由 SEQ ID NO : 22 第 1 到 415 位的序列组成。
     SEQ ID NO : 24 功能性多肽
     在一个特定的实施方案中, 本发明的多肽是功能性多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与 SEQ ID NO : 24 具有至少 90%, 具体是至少 95%, 更具体是 至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100% 的同一性。特别是与 SEQ IDNO : 24 中包含的成熟功能性多肽。更具体地, 所述成熟功能性多肽包含或由 SEQ ID NO : 24 第 1 到 377 位的序列组成。
     SEQ ID NO : 26 功能性多肽
     在一个特定的实施方案中, 本发明的多肽是功能性多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与 SEQ ID NO : 26 具有至少 90%, 具体是至少 95%, 更具体是 至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100% 的同一性。特别是与 SEQ IDNO : 26 中包含的成熟功能性多肽。更具体地, 所述成熟功能性 多肽包含或由 SEQ ID NO : 26 第 1 到 259 位的序列组成。
     SEQ ID NO : 28 功能性多肽
     在一个特定的实施方案中, 本发明的多肽是功能性多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与 SEQ ID NO : 28 具有至少 90%, 具体是至少 95%, 更具体是 至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100% 的同一性。特别是与 SEQ IDNO : 28 中包含的成熟功能性多肽。更具体地, 所述成熟功能性 多肽包含或由 SEQ ID NO : 28 第 1 到 248 位的序列组成。
     SEQ ID NO : 30 功能性多肽
     在一个特定的实施方案中, 本发明的多肽是功能性多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与 SEQ ID NO : 30 具有至少 90%, 具体是至少 95%, 更具体是 至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100% 的同一性。特别是与 SEQ IDNO : 30 中包含的成熟功能性多肽。更具体地, 所述成熟功能性 多肽包含或由 SEQ ID NO : 30 第 1 到 149 位的序列组成。
     SEQ ID NO : 32 功能性多肽
     在一个特定的实施方案中, 本发明的多肽是功能性多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与 SEQ ID NO : 32 具有至少 90%, 具体是至少 95%, 更具体是 至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100% 的同一性。特别是与 SEQ IDNO : 32 中包含的成熟功能性多肽。更具体地, 所述成熟功能性 多肽包含或由 SEQ ID NO : 32 第 1 到 202 位的序列组成。
     SEQ ID NO : 34β- 葡糖苷酶
     在一个特定的实施方案中, 本发明的多肽是 β- 葡糖苷酶, 其包含或由这样的氨 基酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的 β- 葡糖苷酶, 更具体是 SEQ ID NO : 34 中包含的 β- 葡糖苷酶具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是 至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。 更具体地, 所述 β- 葡糖苷酶包含或由 SEQ ID NO : 34 第 1 到 603 位的序列组成。在本文中, β- 葡 糖苷酶定义为这样的 β-D- 葡萄糖苷 - 葡萄糖水解酶 (β-D-glucoside-glucohydrolase) (E.C.3.2.1.21), 其催化末端非还原的 β-D- 葡萄糖残基的水解, 并释放 β-D- 葡萄糖。对 本发明而言, β- 葡糖苷酶活性是根据 Venturi 等, 2002, J.Basic Microbiol.42 : 55-66 中 描述的基本步骤来测定的, 只是采用了本文所述的不同条件。1 个 β- 葡糖苷酶活性单位 定义为 : 在 50℃, pH 5 下, 从 100mM 柠檬酸钠、 0.01% Tween-20 中的底物 : 4mM 对 - 硝基苯 基 -β-D- 吡喃葡萄糖苷中, 每分钟产生 1.0 微摩尔的对 - 硝基酚。
     SEQ ID NO : 36 内切阿拉伯糖酶在一个特定的实施方案中, 本发明的多肽是内切阿拉伯糖酶, 其包含或由这样的 氨基酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的内切阿拉伯糖酶, 更具体是 SEQ ID NO : 36 中包含的内切阿拉伯糖酶具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具 体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。更具 体地, 所述内切阿拉伯糖酶包含或由 SEQ ID NO : 36 第 1 到 301 位的序列组成。在本文中, 内切阿拉伯糖酶 (endo-arabinase) 定义为能够水解阿拉伯聚糖 (arabinan) 的酶。
     SEQ ID NO : 38 内切阿拉伯糖酶
     在一个特定的实施方案中, 本发明的多肽是内切阿拉伯糖酶, 其包含或由这样的 氨基酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的内切阿拉伯糖酶, 更具体是 SEQ ID NO : 36 中包含的内切阿拉伯糖酶具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具 体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。更具 体地, 所述内切阿拉伯糖酶包含或由 SEQ ID NO : 38 第 1 到 438 位的序列组成。在本文中, 内切阿拉伯糖酶定义为能够水解阿拉伯聚糖的酶。 SEQ ID NO : 40 A1 胃蛋白酶肽酶
     在一个特定的实施方案中, 本发明的多肽是胃蛋白酶肽酶, 其包含或由这样的氨 基酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的胃蛋白酶肽酶, 更具体是 SEQ ID NO : 40 中包含的胃蛋白酶肽酶具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是 至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。 更具体地, 所述胃蛋白酶肽酶包含或由 SEQ ID NO : 40 第 1 到 396 位的序列组成。在本文中, 胃蛋白酶 肽酶 (pepsin peptidase) 定义为能够水解蛋白质或肽的酶。
     SEQ ID NO : 42 M43 胃蛋白酶肽酶
     在一个特定的实施方案中, 本发明的多肽是胃蛋白酶肽酶, 其包含或由这样的氨 基酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的胃蛋白酶肽酶, 更具体是 SEQ ID NO : 42 中包含的胃蛋白酶肽酶具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是 至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。 更具体地, 所述胃蛋白酶肽酶包含或由 SEQ ID NO : 42 第 1 到 262 位的序列组成。在本文中, 胃蛋白酶 肽酶定义为能够水解蛋白质或肽的酶。
     多核苷酸
     本发明还涉及包含或由编码本发明的多肽的核苷酸序列组成的多核苷酸。 在一个 具体的实施方案中, 所述核苷酸序列显示在 ADNA 组的序列中, 包括与其由于遗传密码的简并 性而相异的序列。 在另一个实施方案中, 本发明的多核苷酸是修饰的核苷酸序列, 其包含或 由 ADNA 组的序列的编码成熟多肽的区域组成, 而且其与 ADNA 组中所包含的亲本核苷酸序列 相比, 包含至少一个修饰 / 突变。
     用于分离或克隆编码多肽的多核苷酸的技术在本领域是已知的, 包括从基因组 DNA 分离, 从 cDNA 制备, 或者两者的组合。 从这些基因组 DNA 克隆本发明的多核苷酸序列可
     以通过, 例如, 利用公知的聚合酶链式反应 (PCR), 或用抗体筛选表达文库以检测出具有共 同结构特征的克隆 DNA 片段来实现。例如参见 Innis 等, 1990, PCR : A Guide to Methods and Application, Academic Press, New York。 还可以使用其它核酸扩增程序, 诸如连接酶 链式反应 (LCR)、 连接激活转录 (LAT)、 和基于核苷酸序列的扩增 (NASBA)。
     获得所述核苷酸序列可通过基因工程中使用的标准克隆方法, 将该核苷酸序列从 其天然位置再定位 (relocate) 到该序列将被复制的其它位置。克隆方法可包括包含编码 该多肽的核苷酸序列的期望片段的切割和分离、 该片段向载体分子中的插入, 以及重组载 体向宿主细胞中的掺入, 在宿主细胞中该核酸序列的多拷贝或克隆将被复制。该核酸序列 可以是基因组、 cDNA、 RNA、 半合成、 合成的来源或其任意组合。
     具体地, 所述多核苷酸包含且优选由这样的核苷酸序列组成 : 该核苷酸序列与选 自 ADNA 组的序列的编码成熟多肽的区域的核苷酸序列具有至少 50%的同一性。具体地, 所 述核苷酸序列与选自 ADNA 组的序列的编码成熟多肽的区域的核苷酸序列具有至少 65%的 同一性, 更具体为 70%的同一性, 更具体为 80%的同一性, 更具体为 90%的同一性, 更具体 为 95%的同一性, 更具体为 96%的同一性, 更具体为 97%的同一性, 更具体为 98%的同一 性, 更具体为 99%的同一性, 或最具体为 100%的同一性。具体地, 所述核苷酸序列包含选 自 ADNA 组的序列的编码成熟多肽的区域的核苷酸序列。在更优选的实施方案中, 所述核苷 酸序列由选自 ADNA 组的序列的编码成熟多肽的区域的核苷酸序列组成。
     具体地, 所述多核苷酸包含并优选由这样的核苷酸序列组成 : 该核苷酸序列编码 选自木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多 肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶的成熟酶, 并且该核苷酸序列与编码本 发明人分离并以 CBS 保藏号 274.96 保藏的 Botryosphaeria rhodina 菌株所分泌的木聚糖 酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖 苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶的成熟酶的核苷酸序列, 具有至少 50%的同一性, 具 体为至少 65%的同一性, 更具体为 70%的同一性, 更具体为 80%的同一性, 更具体为 90% 的同一性, 更具体为 95%的同一性, 更具体为 96%的同一性, 更具体为 97%的同一性, 更具 体为 98%的同一性, 更具体为 99%的同一性, 或最具体为 100%的同一性。
     在一个具体的实施方案中, 所述多核苷酸包含并优选由这样的核苷酸序列组成 : 该核苷酸序列编码选自木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶的成熟酶, 并且该 核苷酸序列与编码选自 D 多肽组的成熟酶核苷酸序列具有至少 50%的同一性, 具体为至少 65%的同一性, 更具体为 70%的同一性, 更具体为 80%的同一性, 更具体为 90%的同一性, 更具体为 95%的同一性, 更具体为 96%的同一性, 更具体为 97%的同一性, 更具体为 98% 的同一性, 更具体为 99%的同一性, 或最具体为 100%的同一性。
     在一个具体的实施方案中, 所述多核苷酸包含并优选由这样的核苷酸序列组成 : 该核苷酸序列编码选自木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶的成熟酶, 并且该 核苷酸序列与选自 EDNA 组序列的核苷酸序列具有至少 50%的同一性, 具体为至少 65%的同 一性, 更具体为 70%的同一性, 更具体为 80%的同一性, 更具体为 90%的同一性, 更具体为 95%的同一性, 更具体为 96%的同一性, 更具体为 97%的同一性, 更具体为 98%的同一性,更具体为 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 1
     在一个特定的实施方案中本发明的多核苷酸编码 GH10 木聚糖酶, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 1 的 55 到 927 位的核苷酸序列具有至 少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至 少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至 少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 3
     在一个特定的实施方案中本发明的多核苷酸编码 GH11 木聚糖酶, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 3 的 58 到 663 位的核苷酸序列具有至 少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至 少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至 少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 5
     在一个特定的实施方案中本发明的多核苷酸编码丝氨酸酯酶, 并包含或由这样的 核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 5 的 55 到 1110 位的核苷酸序列具有至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 7
     在一个特定的实施方案中本发明的多核苷酸编码脂肪酶, 并包含或由这样的核苷 酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 7 的 55 到 1347 位的核苷酸序列具有至少 70% 的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至少 95% 的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至少 98% 的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 9
     在一个特定的实施方案中本发明的多核苷酸编码过氧化物酶, 并包含或由这样的 核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 9 的 1 到 555 位的核苷酸序列具有至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 11
     在一个特定的实施方案中本发明的多核苷酸编码 GH61A 多肽, 并包含或由这样的 核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 11 的 49 到 702 位的核苷酸序列具有至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 13
     在一个特定的实施方案中本发明的多核苷酸编码 GH61B 多肽, 并包含或由这样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 13 的 40 到 786 位的核苷酸序列具有至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 15
     在一个特定的实施方案中本发明的多核苷酸编码 GH61C 多肽, 并包含或由这样的 核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 15 的 55 到 819 位的核苷酸序列具有至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 17
     在一个特定的实施方案中本发明的多核苷酸编码 GH61D 多肽, 并包含或由这样的 核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 17 的 61 到 675 位的核苷酸序列具有至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 19
     在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 19 的 1 到 729 位的核苷酸序列具有至 少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至 少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至 少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 21
     在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 21 的 55 到 1299 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为 至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 23
     在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 23 的 49 到 1179 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为 至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 25
     在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 25 的 70 到 846 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 27
     在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 27 的 58 到 801 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为 至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 29
     在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 29 的 157 到 603 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为 至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 31
     在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 31 的 55 到 660 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为 至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 33
     在一个特定的实施方案中本发明的多核苷酸编码 β- 葡糖苷酶, 并包含或由这样 的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 33 的 46 到 1854 位的核苷酸序列具有至 少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至 少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至 少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 35
     在一个特定的实施方案中本发明的多核苷酸编码内切阿拉伯糖酶, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 35 的 64 到 966 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为 至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 37
     在一个特定的实施方案中本发明的多核苷酸编码内切阿拉伯糖酶, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 37 的 55 到 1368 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为 至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 39
     在 一 个 特 定 的 实 施 方 案 中 本 发 明 的 多 核 苷 酸 编 码 胃 蛋 白 酶 蛋 白 酶 (pepsinprotease), 并包含或由这样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 39 的 61 到 1248 位的核苷酸序列具有至少 70 %的同一性, 更具体为至少 80 %的同一性, 更具体为至 少 90%的同一性, 更具体为至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至 少 97%的同一性, 更具体为至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 41
     在一个特定的实施方案中本发明的多核苷酸编码胃蛋白酶蛋白酶, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 41 的 64 到 849 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为 至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     为了合成包含相比于选自 B 多肽组所包含的成熟多肽的氨基酸序列具有至少一个 置换、 缺失和 / 或插入的氨基酸序列的多肽, 编码本发明的多肽的核苷酸序列的修饰可能 是必需的。
     对本领域技术人员而言显而易见的是, 可以使这些修饰保持酶的功能, 即, 可以在 酶功能的关键区域之外进行这些修饰。 对功能来说至关重要的氨基酸残基因此优选不被修 饰, 例如被替代。 对功能来说至关重要的氨基酸残基可以通过本领域已知的程序来鉴定, 诸 如定点诱变或丙氨酸扫描诱变 (alanine scanning mutagenesis)( 例如参见 Cunningham 和 Wells, 1989, Science 244 : 1081-1085)。底物 - 酶相互作用位点可通过三维结构分析来 确定, 其中三维结构可由诸如核磁共振分析、 晶体学、 或光亲和标记等技术来测定 ( 例如参 见 de Vos 等, 1992, Science 255 : 306-312 ; Smith 等, 1992, Journal of Molecular Biology 224 : 899-904 ; Wlodaver 等, 1992, FEBS Letters 309 : 59-64)。
     另外, 可以通过引入核苷酸置换来改变编码本发明的酶的核苷酸序列, 这样的置 换不会使该核苷酸序列编码产生另外的氨基酸序列, 而是对应于意图用来表达酶的宿主生 物的密码子使用习惯。
     将一个核苷酸置换为另一个核苷酸的突变导入核苷酸序列, 可以通过利用本领域 已知的任何方法进行定点诱变来实现。 特别有用的是利用具有目标插入片段的超螺旋双链 DNA 载体和两个含有所需突变的合成引物的方法。每条分别与载体的相对链互补的寡核苷 酸引物借助 Pfu DNA 聚合酶在温度循环过程中延伸。整合入引物后, 生成包含错列缺口的 突变质粒。在温度循环后, 用对甲基化和半甲基化 DNA 特异性的 DpnI 处理产物以消化亲代 并选择包含突变的合成的 DNA。本领域已知的其它方法也可以使用。关于核苷酸 DNA 模板, 置换的一般性描述参见, 例如, Ford 等, 1991, Protein Expression and Purification 2 : 95-107。
     本发明还涉及包含, 优选由这样的核苷酸序列组成的多核苷酸 : 所述核苷酸序列 编码本发明的多肽并在高度严紧条件, 优选极高度严紧条件下, 与选自下列的多核苷酸探 针杂交 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列选自 ADNA 组序列的编码成熟多肽的区 域;
     (ii) 核苷酸序列所包含的 cDNA 的互补链, 所述核苷酸序列选自 ADNA 组序列的编码成熟多肽的区域 ;
     (iii)(i) 或 (ii) 的片段, 其编码具有 B 多肽组中所包含的相应成熟多肽的功能的 分泌的成熟多肽。
     (J.Sambrook , E.F.Fritsch 和 T.Maniatus , 1989 , Molecular Cloning , A Laboratory Manual, 第二版, Cold Spring Harbor, New York)。
     可以理解的是, 关于核苷酸序列杂交的细节和详情与本文中题为 “本发明的多肽” 部分中讨论的杂交方面的内容相同或相近。
     本发明还涉及适用于电子设备的、 包含本发明的多肽的氨基酸序列或本发明的多 核苷酸的核苷酸序列的信息的存储介质。所述存储介质可合适地为磁盘或光盘, 所述电子 设备可以是计算设备, 所述信息具体可以数字形式存储在存储介质上。
     核酸构建体
     本发明还涉及包含与一种或多种调控序列可操作地连接的本发明的多核苷酸的 核酸构建体, 所述调控序列在适当宿主细胞中与调控序列相容的条件下指导编码序列的表 达。
     可利用多种方法操作编码本发明多肽的分离多核苷酸以提供多肽的表达的条件。 根据表达载体的不同, 可能希望或必需在将多核苷酸序列插入载体之前对其进行操作。利 用重组 DNA 方法修饰多核苷酸序列的技术是本领域众所周知的。
     调控序列可以是适当的启动子序列, 即被宿主细胞识别来表达所述核苷酸的核苷 酸序列。启动子序列包含调节多肽表达的转录调控序列。启动子可以是在所选宿主细胞中 表现出转录活性的任何核苷酸序列, 包括突变的、 截短的和杂合的启动子, 而且可从编码与 宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。
     用于指导本发明的核酸构建体转录, 尤其是在细菌宿主细胞中转录的适当启动 子的实例, 是从大肠杆菌 lac 操纵子、 天蓝色链霉菌 (Streptomyces coelicolor) 琼脂 酶基因 (dagA)、 枯草芽孢杆菌果聚糖蔗糖酶基因 (sacB)、 地衣芽孢杆菌 α- 淀粉酶基因 (amyL)、 嗜热脂肪芽孢杆菌 (Bacillus stearothermophilus) 产麦芽糖淀粉酶 (maltogenic amylase) 基因 (amyM)、 解淀粉芽孢杆菌 α- 淀粉酶基因 (amyQ)、 地衣芽孢杆菌 (Bacillus licheniformis) 青霉素酶基因 (penP)、 枯草芽孢杆菌 xylA 和 xylB 基因、 和原核生物的 β- 内 酰 胺 酶 基 因 (Villa-Kamaroff 等, 1978, Proceedings of the National Academy of Sciences USA 75 : 3727-3731) 中获得的启动子, 以及 tac 启动子 (DeBoer 等, 1983, Proceedings of the National Academy of Sciences USA 80 : 21-25)。还有 “Useful proteins from recombinant bacteria” , Scientific American, 1980, 242 : 74-94 及 Sambrook 等, 1989, 同上中描述的其它启动子。
     用于在丝状真菌宿主细胞中指导本发明的核酸构建体转录的适当启动子的实例 有从米曲霉 (Aspergillus oryzae)TAKA 淀粉酶、 Rhizomucor miehei 天冬氨酸蛋白酶、 黑曲霉 (Aspergillus niger) 中性 α- 淀粉酶、 黑曲霉酸稳定 α- 淀粉酶、 黑曲霉或泡盛 曲霉 (Aspergillus awamori) 葡糖淀粉酶 (glaA)、 Rhizomucor miehei 脂肪酶、 米曲霉碱 性蛋白酶、 米曲霉磷酸丙糖异构酶、 构巢曲霉 (Aspergillus nidulans) 乙酰胺酶和尖镰孢 (Fusarium oxysporum) 胰蛋白酶样蛋白酶 (WO 96/00787)、 以及 NA2-tpi 启动子 ( 来自黑 曲霉中性 α- 淀粉酶和米曲霉磷酸丙糖异构酶基因的杂合启动子 ) ; 及其突变的、 截短的、和杂合的启动子。
     在酵母宿主中, 有用的启动子有从酿酒酵母 (Saccharomyces cerevisiae) 烯醇 化酶 (ENO-1)、 酿酒酵母半乳糖激酶 (GAL1)、 酿酒酵母醇脱氢酶 / 甘油醛 -3- 磷酸脱氢酶 (ADH1、 ADH2/GAP) 和酿酒酵母 3- 磷酸甘油酸 (phosphoglycerate) 激酶基因中所获得的。 还有 Romanos 等, 1992, Yeast 8 : 423-488 中描述了用于酵母宿主细胞的其它有用启动子。
     调控序列也可以是适当的转录终止子序列, 即由宿主细胞识别来终止转录的序 列。终止子序列可操作地连接于编码多肽的核苷酸序列的 3′端。在所选择的宿主细胞中 起作用的任何终止子都可用于本发明。
     对于丝状真菌宿主细胞优选的终止子是从米曲霉 TAKA 淀粉酶、 黑曲霉葡糖淀粉 酶、 构巢曲霉邻氨基苯甲酸 (anthranilate) 合酶、 黑曲霉 α- 葡糖苷酶、 和尖镰孢胰蛋白酶 样蛋白酶的基因中获得的。
     对于酵母宿主细胞优选的终止子是从酿酒酵母烯醇化酶、 酿酒酵母细胞色素 C(CYC1) 和酿酒酵母甘油醛 -3- 磷酸脱氢酶基因中获得的。还有 Romanos 等, 1992, 同上中 描述的用于酵母宿主细胞的其它有用终止子。
     调控序列还可以是适当的前导序列, 即 mRNA 中对宿主细胞翻译重要的非翻译区。 前导序列可操作地连接于编码多肽的核苷酸序列的 5′端。在所选择的宿主细胞中起作用 的任何前导序列都可用于本发明。
     对于丝状真菌宿主细胞优选的前导序列是从米曲霉 TAKA 淀粉酶和构巢曲霉磷酸 丙糖异构酶基因中获得的。
     对于酵母宿主细胞优选的前导序列是从酿酒酵母烯醇化酶 (ENO-1)、 酿酒酵母 3- 磷酸甘油酸激酶、 酿酒酵母 α- 因子和酿酒酵母醇脱氢酶 / 甘油醛 -3- 磷酸脱氢酶 (ADH2/GAP) 基因中获得的。
     调控序列还可以是聚腺苷酸化序列, 即可操作地连接于核苷酸序列 3′端的序列, 且当被转录时, 作为将聚腺苷残基添加到转录出的 mRNA 上的信号被宿主细胞所识别。在所 选择的宿主细胞中起作用的任何聚腺苷酸化序列都可用于本发明。
     对于丝状真菌宿主细胞优选的聚腺苷酸化序列是从米曲霉 TAKA 淀粉酶、 黑曲霉 葡糖淀粉酶、 构巢曲霉邻氨基苯甲酸合酶、 尖镰孢胰蛋白酶样蛋白酶、 和黑曲霉 α- 葡糖苷 酶的基因获得的。
     Guo 和 Sherman 等, 1995, Molecular Cellular Biology 15 : 5983-5990 中描述了 对酵母宿主细胞有用的聚腺苷酸化序列。
     调控序列还可以是信号肽编码区, 它编码连接于多肽的氨基末端, 并指导编码的 多肽进入细胞分泌途径的氨基酸序列。核苷酸序列的编码序列的 5′端可固有地含有信号 肽编码区, 它在翻译读码框中与编码分泌多肽的编码区段天然连接。或者, 编码序列的 5′ 端可以含有对编码序列而言是外来的信号肽编码区。 如果编码序列天然地不含信号肽编码 区, 则可能需要外来的信号肽编码区。 或者, 外来的信号肽编码区可简单地替换天然信号肽 编码区以便增强多肽的分泌。然而, 指导表达的多肽进入所选择宿主细胞分泌途径的任何 信号肽编码区均可用于本发明。
     对于细菌宿主细胞有效的信号肽编码区有从芽孢杆菌 NCIB 11837 的产麦芽糖淀 粉酶、 嗜热脂肪芽孢杆菌的 α- 淀粉酶、 地衣芽孢杆菌的枯草杆菌蛋白酶、 地衣芽孢杆菌的β- 内酰胺酶、 嗜热脂肪芽孢杆菌的中性蛋白酶类 (nprT、 nprS、 nprM)、 和枯草芽孢杆菌的 prsA 基因获得的信号肽编码区。还有 Simonen 和 Palva, 1993, Microbiological Reviews 57 : 109-137 中描述的其它信号肽。
     对于丝状真菌宿主细胞有效的信号肽编码区有从米曲霉 TAKA 淀粉酶、 黑曲霉中 性淀粉酶、 黑曲霉葡糖淀粉酶、 Rhizomucor miehei 天冬氨酸蛋白酶、 Humicola insolens 纤 维素酶和 Humicola lanuginosa 脂肪酶的基因获得的信号肽编码区。
     对于酵母宿主细胞有用的信号肽是从酿酒酵母 α- 因子和酿酒酵母转化酶的基 因获得的。Romanos 等, 1992, 同上中描述了的其它有用的信号肽编码区。
     调控序列还可以是前肽 (propeptide) 编码区, 它编码位于多肽氨基末端的氨基 酸序列。所得的多肽可称为酶原 (proenzyme) 或多肽原 (propolypeptide)。多肽原一般是 没有活性的, 通过催化或自催化切割将前肽从多肽原切除后, 可转变为成熟有活性的多肽。 前肽编码区可从枯草芽孢杆菌碱性蛋白酶 (aprE)、 枯草芽孢杆菌中性蛋白酶 (nprT)、 酿酒 酵母 α- 因子、 Rhizomucor miehei 天冬氨酸蛋白酶、 和 Myceliophthora thermophila 漆 酶 (WO 95/33836) 的基因获得。
     当信号肽和前肽区都存在于多肽的氨基末端时, 前肽区位于靠近多肽氨基末端的 位置, 而信号肽区位于靠近前肽区的氨基末端位置。在酵母中, 可使用 ADH2 系统或 GAL1 系 统。在丝状真菌中, 可使用 TAKA α- 淀粉酶启动子、 黑曲霉葡糖淀粉酶启动子、 和米曲霉葡 糖淀粉酶启动子作为调节序列。
     调节序列的其它实例有使基因得以扩增的那些调节序列。在真核系统中, 这些包 括在氨甲喋呤存在时扩增的二氢叶酸还原酶基因, 以及在重金属存在下扩增的金属硫蛋白 基因。在这些情况中, 编码多肽的核苷酸序列将与调节序列可操作地连接。
     重组表达载体
     本发明还涉及包含本发明的核酸构建体的重组表达载体。可以将上述述的各种 核酸和调控序列连接到一起以产生重组表达载体, 此载体可包括一个或多个便利的限制性 位点使得在这些位点可插入或替换编码多肽的核苷酸序列。或者, 本发明的核苷酸序列可 通过将核苷酸序列或含有序列的核酸构建体插入适当的表达载体进行表达。 构建表达载体 时, 将编码序列置于载体中以使编码序列与适当的表达调控可操作地连接。
     重组表达载体可以是可方便的接受重组 DNA 操作并能引起核苷酸序列表达的任 何载体 ( 例如质粒或病毒 )。载体的选择通常取决于载体与引入此载体的宿主细胞之间的 相容性。载体可以是线性的或闭合环状的质粒。
     载体可以是自主复制载体, 即以染色体外实体的形式存在, 且其复制独立于染色 体的复制的载体, 例如质粒、 染色体外元件、 微型染色体、 或人工染色体。
     载体可包含任何用于确保自我复制的手段。 或者, 载体可以是这样的载体 : 它在导 入宿主细胞后, 整合到基因组中并与其整合进入的染色体一起复制。 此外, 可使用单一载体 或质粒, 或是一起含有待引入宿主细胞基因组的全部 DNA 的两种或多种载体或质粒, 或者 转座子。
     本发明载体优选包含一种或多种允许容易地选择转化细胞的选择标记。 选择标记 是这样的一类基因, 其产物有助于产生抗微生物剂或病毒抗性、 重金属抗性、 营养缺陷型变 成原养型 (prototrophy to auxotrophs) 等等。细菌选择标记的实例有来自枯草芽孢杆菌或地衣芽孢杆菌的 dal 基因, 或者赋予 抗生素抗性诸如氨苄青霉素、 卡那霉素、 氯霉素或四环素抗性的标记。 适于酵母宿主细胞的 标记有 ADE2、 HIS3、 LEU2、 LYS2、 MET3、 TRP1 和 URA3。在丝状宿主细胞中使用的选择标记包 括但不限于 : amdS( 乙酰胺酶 )、 argB( 鸟氨酸氨甲酰基转移酶 )、 bar( 膦丝菌素乙酰基转移 酶 )、 hygB( 潮霉素磷酸转移酶 )、 niaD( 硝酸还原酶 )、 pyrG( 乳清苷 -5′ - 磷酸脱羧酶 )、 sC( 硫酸腺苷酰转移酶 (sulfate adenyltransferase)) 和 trpC( 邻氨基苯甲酸合酶 ) 及其 等价物。
     优选用于曲霉属 (Asperigillus) 细胞的是构巢曲霉或米曲霉的 amdS 和 pyrG 基 因以及吸水链霉菌 (Streptomyces hygroscopicus) 的 bar 基因。
     本发明的载体优选包含允许载体整合到宿主细胞基因组中或者允许载体在细胞 中不依赖于基因组自主复制的元件。
     对整合到宿主细胞基因组而言, 载体可依赖编码多肽的多核苷酸序列或任何其它 载体元件通过同源或非同源重组整合到基因组中。 或者, 载体可包含附加的核苷酸序列, 来 指导通过同源重组在染色体精确位置整合进入宿主细胞基因组中。 这些附加的核苷酸序列 使载体可以在染色体上的精确位置整合到宿主细胞基因组中。为了提高在精确位置整合 的可能性, 整合元件应优选包含足够数目的与对应靶序列高度同源的核酸, 诸如 100-1,500 个碱基对、 优选 400-1,500 个碱基对、 且最优选 800-1,500 个碱基对, 从而提高同源重组的 概率。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。此外, 整合元件可 以是非编码或编码核苷酸序列。另一方面, 载体可通过非同源重组整合到宿主细胞的基因 组中。
     对自主复制而言, 载体还可包含能使载体在所述的宿主细胞中自主复制的复制 起点。细菌复制起点的实例有允许在大肠杆菌中复制的质粒 pBR322、 pUC19、 pACYC177 和 pACYC184 的复制起点, 以及允许使得在芽孢杆菌中复制的 pUB110、 pE194、 pTA1060 和 pAMβ1 的复制起点。用于酵母宿主细胞的复制起点的实例有 2μm 复制起点、 ARS1、 ARS4、 ARS1 和 CEN3 的组合、 及 ARS4 和 CEN6 的组合。
     复制起点可以具有使其在宿主细胞内的作用成为温度敏感型的突变 ( 见, 例如, Ehrlich, 1978, Proceedings of the National.Academy of Sciences USA 75 : 1433)。
     可以将多于一个拷贝的编码本发明的多肽的核酸序列插入宿主细胞中以增强该 基因产物的表达。核苷酸序列拷贝数的增加可以通过下述实现 : 将至少核酸序列的另一个 拷贝整合到宿主细胞基因组中, 或者将核酸序列包含有可扩增的选择性标记基因, 通过在 合适的选择剂的存在下培养细胞, 能筛选出含有扩增拷贝的选择性标记基因、 从而也就含 有所述核酸序列的更多拷贝的细胞。
     用于连接上述元件以构建本发明重组表达载体的方法是本领域技术人员所熟知 的 ( 例如参见 Sambrook 等, 1989, 同上 )。
     重组宿主细胞
     本发明还涉及包含本发明的核酸构建体的重组宿主细胞, 它们可有利的用于所述 多肽的重组生产。 如前所述, 将包含本发明核苷酸序列的载体引入宿主细胞, 以使载体作为 染色体的整合体或作为自主复制的染色体外载体被保持。
     宿主细胞可以是单细胞微生物, 例如原核生物, 或非单细胞微生物, 例如真核生物。 有用的单细胞微生物有细菌细胞, 诸如革兰氏阳性细菌, 包括但不限于芽孢 杆 菌 属 细 胞, 例 如 嗜 碱 芽 孢 杆 菌 (Bacillus alkaphilus)、 解 淀 粉 芽 孢 杆 菌 (Bacillus amyloliquefaciens)、短 芽 孢 杆 菌 (Bacillus brevis)、环 状 芽 孢 杆 菌 (Bacillus circulans)、 Bacillus clausii、 凝 结 芽 孢 杆 菌 (Bacillus coagulans)、 灿烂芽孢杆菌 (Bacillus lautus)、 迟缓芽孢杆菌 (Bacillus lentus)、 地衣芽孢杆菌、 巨大芽孢杆菌 (Bacillus megaterium)、 嗜热脂肪芽孢杆菌、 枯草芽孢杆菌、 和苏云金芽孢杆菌 (Bacillus thuringiensis) ; 或链霉菌属 (Streptomyces) 细胞, 例如浅青紫链霉菌 (Streptomyces lividans) 和鼠灰链霉菌 (Streptomyces murinus), 或者革兰氏阴性细菌, 诸如大肠杆菌和 假单胞菌种 (Pseudomonas sp.)。在一个特定的实施方案中, 细菌宿主细胞是迟缓芽孢杆 菌、 地衣芽孢杆菌、 嗜热脂肪芽孢杆菌、 或枯草杆菌细胞。 在另一个优选的方面, 芽孢杆菌属 细胞是嗜碱的 (alkalophilic) 芽孢杆菌。
     将载体导入细菌宿主细胞可通过例如原生质体转化 ( 参见例如 Chang 和 Cohen, 1979, Molecular General Genetics 168 : 111-115)、 使用感受态细胞 ( 参见例如 Young 和 Spizizen, 1961, Journal of Bacteriology 81 : 823-829 ; 或 Dubnau 和 Davidoff-Abelson, 1971, Journal of Molecular Biology 56 : 209-221)、 电 穿 孔 ( 参 见 例 如 Shigekawa 和
    Dower, 1988, Biotechniques 6 : 742-751)、 或 接 合 ( 参 见 例 如 Koehler 和 Thorne, 1987, Journal of Bacteriology 169 : 5771-5278) 来实现。
     宿主细胞可以是真核细胞, 诸如哺乳动物、 昆虫、 植物、 或真菌细胞。
     在一个优选的方面, 宿主细胞是真菌细胞。 “真菌”在用于本文时包括子囊菌 门 (Ascomycota)、 担 子 菌 门 (Basidiomycota)、 壶 菌 门 (Chytridiomycota)、 和接合菌门 (Zygomycota)( 如 Hawksworth 等, 在 Ainsworth and Bisby’ s Dictionary of The Fungi, 第八版, 1995, CAB International, University Press, Cambridge, UK 中所定义的 ), 以及 卵菌门 (Oomycota)( 如 Hawksworth 等, 1995, 同上第 171 页中所引用的 ) 和所有有丝分裂 孢子真菌 (Hawksworth 等, 1995, 同上 )。在一个更优选的方面, 真菌宿主细胞是酵母细胞。 “酵母” 在用于本文时包括产子囊酵母 ( 内孢霉目 Endomycetales)、 产担孢子酵母、 和属于 半知菌类 (Fungi Imperfecti) 的酵母 ( 芽孢纲 Blastomycetes)。由于酵母的分类今后还 会变化, 对于本发明来说, 酵母应该是如在 Biology and Activities of Yeast(Skinner, F.A.、 Passmore, S.M. 和 Davenport, R.R. 编, Soc.App.Bacteriol.Symposium Series No.9, 1980) 中所定义的。
     在一个更优选的方面, 酵母宿主细胞是假丝酵母属、 汉逊酵母属 (Hansenula)、 克 鲁维酵母属 (Kluyveromyces)、 毕赤酵母属 (Pichia)、 糖酵母属 (Saccharomyces)、 裂殖酵 母属 (Schizosaccharomyces)、 或 Yarrowia 属细胞。
     在 一 个 最 优 选 的 方 面, 酵 母 宿 主 细 胞 是 卡 尔 斯 伯 糖 酵 母 (Saccharomyces carlsbergensis)、 酿酒酵母 (Saccharomyces cerevisiae)、 糖化糖酵母 (Saccharomyces diastaticus)、 Saccharomyces douglasii、 Saccharomyces kluyveri、 Saccharomyces norbensis 或卵形糖酵母 (Saccharomyces oviformis) 细胞。 在另一个最优选的方案中, 酵 母宿主细胞是乳酸克鲁维酵母 (Kluyveromyces lactis) 细胞。在另一个最优选的方案中, 酵母宿主细胞是 Yarrowia lipolytica 细胞。在另一个更优选的方面, 真菌宿主细胞是丝状真菌细胞。 “丝状真菌” 包括真菌门 (Eumycota) 和卵菌门 (Oomycota)( 如 Hawksworth 等, 1995, 文献同上所定义的 ) 所有丝状 形式的亚类。丝状真菌特征在于通常由几丁质、 纤维素、 葡聚糖、 脱乙酰壳多糖、 甘露聚糖、 以及其它复合多糖组成的菌丝体壁。 营养生长依靠菌丝延长, 且碳分解代谢是专性需氧的。 相反, 诸如酿酒酵母的酵母的营养生长通过单细胞原植体的芽殖进行, 且碳分解代谢可以 是发酵的。
     在一个甚至更优选的方面, 丝状真菌宿主细胞是 Acremonium 属、 曲霉属、 镰孢属 (Fusarium)、 腐质霉属 (Humicola)、 毛霉属 (Mucor)、 毁丝霉属 (Myceliophthora)、 脉孢霉 属 (Neurospora)、 青霉属 (Penicillium)、 梭孢壳属 (Thielavia)、 Tolypocladium 属、 或木 霉属 (Trichoderma) 的细胞。
     在 一 个 最 优 选 的 方 面, 丝 状 真 菌 宿 主 细 胞 是 泡 盛 曲 霉、 臭 曲 霉 (Aspergillus foetidus)、 日本曲霉 (Aspergillus japonicus)、 构巢曲霉、 黑曲霉、 或米曲霉细胞。在 另一个最优选的方案中, 丝状真菌宿主细胞是杆孢状镰孢 (Fusarium bactridioides)、 Fusarium cerealis、 Fusarium crookwellense, 大 刀 镰 孢 (Fusarium culmorum)、 禾谷 镰 孢 (Fusarium graminearum)、 禾 赤 镰 孢 (Fusarium graminum)、 异 孢 镰 孢 (Fusarium heterosporum)、 合 欢 木 镰 孢 (Fusarium negundi)、 尖 孢 镰 孢 (Fusarium oxysporum)、 多 枝 镰 孢 (Fusarium reticulatum)、 玫 瑰 色 镰 孢 (Fusarium roseum)、 接骨木镰孢 (Fusarium sambucinum)、 肤色镰孢 (Fusarium sarcochroum)、 拟分枝孢镰孢 (Fusarium sporotrichioides)、 硫色镰孢 (Fusarium sulphureum)、 Fusarium torulosum、 Fusarium trichothecioides、 Fusarium venenatum 细胞。在一种最优选的实施方案中, 丝状真菌 亲代细胞是 Fusarium venenatum(Nirenberg sp.nov.) 细胞。在另一种最优选的实施方 案中, 丝状真菌宿主细胞是 Humicola insolens、 Humicola lanuginosa、 Mucor miehei、 Myceliophthora thermophila、 粗糙脉孢霉 (Neurospora crassa)、 产紫青霉、 Thielavia terrestris、 Trichoderma harzianum、 康宁木霉 (Trichoderma koningii)、 Trichoderma longibrachiatum、 Trichoderma reesei 或绿色木霉细胞。
     真菌细胞可以本身已知的方式通过涉及原生质体形成、 原生质体转化、 和细胞壁 再生的过程进行转化。EP 238 023 和 Yelton 等, 1984, Proceedings of the National Academy of Sciences USA 81 : 1470-1474 中描述了适合曲霉属和木霉属宿主细胞转化的 过程。Malardier 等, 1989, Gene 78 : 147-159 和 WO 96/00787 中描述了适合转化镰孢属物 种的方法。酵母可利用 Becker 和 Guarente 在 Abelson, J.N. 和 Simon, M.I. 编的 Guide to Yeast Genetics and Molecular Biology, Methods in Enzymology, Volume.194, pp 182-187, Academic Press 公司, New York ; Ito 等, 1983, Journal of Bacteriology 153 : 163 ; 及 Hinnen 等, 1978, Proceedings of the National Academy of Sciences USA 75 : 1920 中所描述的程序转化。
     生产方法
     本发明还涉及生产本发明的酶的方法, 包括 : (a) 培养包含编码本发明的酶的核 苷酸序列的生物株系, 其中所述株系能表达和分泌该酶 ; 并 (b) 回收所述酶。 在一个具体的 实施方案中, 所述株系是野生型株系, 例如 Botryospaeria rhodina CBS 274.96, 而在另一 个实施方案中所述株系是如上所述的重组宿主细胞。在本发明的生产方法中, 利用本领域众所周知的方法在适于产生所述酶的培养基 中培养细胞。例如, 可在实验室或工业发酵罐中, 在适当的培养基和可使所述多肽表达和 / 或分离的条件下, 通过摇瓶培养、 小规模或大规模发酵 ( 包括连续、 分批、 补料 - 分批、 或固 态发酵 ) 来进行细胞培养。培养使用本领域已知的程序在含有碳和氮源以及无机盐的合适 营养培养基中进行。适宜的培养基可从商业供应商获得, 或者可根据已公布的配方来制备 ( 例如参见美国典型培养物保藏中心的目录 )。如果酶被分泌到培养基中, 那么可直接从培 养基中回收酶。如果酶不分泌, 那么可从细胞裂解物中进行回收。
     所得的酶多肽可通过本领域已知的方法回收。 例如, 可通过常规程序, 包括但不限 于离心、 过滤、 萃取、 喷雾干燥、 蒸发、 或沉淀, 从培养基中回收所述酶。
     本发明的多肽可通过本领域已知的多种程序纯化, 包括但不限于层析 ( 例如离子 交换、 亲和、 疏水、 层析聚焦、 和大小排阻 )、 电泳 ( 例如制备性等电聚焦 )、 差异溶解 ( 例如 硫酸铵沉淀 )、 SDS-PAGE、 或萃取 ( 例如参见 Protein Purification, J.-C.Janson 和 Lars Ryden 编, VCH Publishers, New York, 1989。
     转基因植物
     本发明还涉及转基因植物、 植物部分或者植物细胞, 它们已被编码本发明的酶的 核苷酸序列所转化, 从而表达所述酶。在一个实施方案中所述植物可以用作以可回收的量 生产所述酶的宿主。可以从所述植物或植物部分回收酶。或者, 含有该重组酶的植物或植 物部分本身可以用来提高食品或饲料的质量, 例如, 改善营养价值、 适口性和流变学性质, 或破坏抗营养因子 (antinutritional factor)。具体地, 表达所述酶的植物或植物部分可 以作为改良的起始材料用于生产燃料酒精或生物乙醇 (bio-ethanol)。
     所述转基因植物可以是双子叶的 ( 双子叶植物 ) 或单子叶的 ( 单子叶植物 )。单 子叶植物的实例是草类 / 禾本科 (grasses), 例如草地早熟禾 (meadow grass)( 蓝草 (blue grass), 早熟禾属 (Poa)), 饲用牧草 (forage grass), 例如羊茅属 (festuca), 黑麦草属 (lolium) ; 寒地型牧草 (temperate grass), 例如剪股颖属 (Agrostis) ; 和谷类 (cereals), 如小麦、 燕麦、 黑麦、 大麦、 稻、 高粱和玉米 (maize)( 玉米 (corn))。
     双子叶植物的例子有 : 烟草 ; 豆类 (legumes), 例如羽扇豆 (lupins) ; 马铃薯 ; 甜 菜; 豌豆 ; 菜豆 (bean) 和大豆, 和十字花科植物 (Brassicaceae), 例如花椰菜、 油菜籽 (rape seed) 和与之亲缘关系紧密的模式生物拟南芥 (Arabidopsis thaliana)。
     植物部分的例子有茎、 愈伤组织、 叶、 根、 果实、 种子和块茎。 特定的植物组织, 例如 叶绿体、 质外体、 线粒体、 液泡、 过氧化物酶体和细胞质, 都被认为是植物部分。 另外, 任何植 物细胞, 不管其来自什么组织, 都被认为是植物部分。
     这些植物、 植物部分和植物细胞的后代也被包括在本发明的范围之内。
     所述表达本发明的酶的转基因植物或植物细胞可以根据本领域已知的方法构建。 简单地说, 所述植物或植物细胞这样构建的 : 将一个或多个编码本发明的酶的表达构建体 整合入植物宿主的基因组, 并使所得的修饰植物或植物细胞繁殖成为转基因植物或植物细 胞。
     方便地, 所述表达构建体是包含核苷酸序列的核酸构建体, 所述核苷酸序列编码 本发明的酶, 且可操作地连接于在所选植物或植物部分中表达该核苷酸序列所需的合适的 调控序列。另外, 该表达构建体还可以包括可用于鉴定已经整合了表达构建体的宿主细胞的可选择标记 ; 以及将该构建体导入所述的植物所需要的 DNA 序列 ( 后者取决于使用的 DNA 导入方法 )。
     选择调节序列, 例如启动子和终止子序列, 以及可选的信号或转运序列, 是根据例 如想要在何时、 何处、 怎样表达该酶而决定的。例如, 编码本发明的酶的基因的表达可以是 组成型或诱导型的, 或者可为发育性、 阶段或组织特异性的, 而且基因产物可以被靶向于具 体的组织或者植物部分例如种子或叶。对调节序列的描述有例如 Tague 等, 1988, Plant Physiology 86 : 506。
     对 于 组 成 性 表 达, 可 以 使 用 35S-CaMV 启 动 子 (Franck 等 ., 1980.Cell 21 : 285-294)。 器 官 特 异 性 的 启 动 子 可 以 是, 例 如, 来 自 存 储 性 贮 藏 组 织 (storage sink tissues) 例如种子、 马铃薯的块茎及果实的启动子 (Edwards 和 Coruzzi, 1990, Ann.Rev. Genet.24 : 275-303), 或者来自代谢性贮藏组织 (metabolic sink tissues) 例如分生组 织的启动子 (Ito 等, 1994, Plant Mol.Biol.24 : 863-878) ; 或者是种子特异性的启动子, 例如来自稻的谷蛋白、 谷醇溶蛋白、 球蛋白或白蛋白启动子 (Wu 等, 1998, Plant and Cell Physiology 39 : 885-889), 来自蚕豆 (Vicia faba) 的豆球蛋白 B4 和未知的种子蛋白基因 的蚕豆启动子 (Conrad 等, 1998, Journal of Plant Physiology 152 : 708-711), 来自种 子油体 (seed oil body) 蛋白的启动子 (Chen 等, 1998, Plant and Cell Physiology 39 : 935-941), 来自欧洲油菜 (Brassica napus) 的贮存蛋白 napA 启动子, 或任何其他本领域已 知的种子特异性的启动子, 例如 WO 91/14772 所描述的。另外, 该启动子还可以是叶特异 性的启动子, 例如稻或西红柿的 rbcs 启动子 (Kyozuka 等, 1993, Plant Physiology 102 : 991-1000) ; 小球藻病毒腺嘌呤甲基转移酶基因启动子 (Mitra 和 Higgins, 1994, Plant Molecular Biology 26 : 85-93), 或来自稻的 aldP 基因启动子 (Kagaya 等, 1995, Molecular and General Genetics 248 : 668-674) ; 或为创伤诱导的启动子例如马铃薯 pin2 启动子 (Xu 等, 1993, Plant Molecular Biology 22 : 573-588)。
     也可以使用启动子增强元件来获得在植物中酶的更高表达。例如, 启动子增强元 件可以是位于启动子和编码本发明的酶的核苷酸序列之间的内含子。例如 Xu 等, 1993( 同 上 ) 公开了稻肌动蛋白 1 基因的第一个内含子增强表达的用途。
     可选择标记基因和表达构建体的任何其他部分都可以从本领域可用的那些中选 择。
     根据本领域已知的常规技术将该核酸构建体整合入植物基因组, 所述技术包括农 杆菌 (Agrobacterium) 介导的转化、 病毒介导的转化、 显微注射、 粒子轰击、 生物射弹转化 (biolistic tranformation) 和电穿孔 (Gasser 等, 1990, Science 244 : 1293 ; Potrykus, 1990, Bio/Technology 8 : 535 ; Shimamoto 等, 1989, Nature 338 : 274)。
     目前, 根瘤农杆菌 (Agrobacterim tumefaciens) 介导的基因转移是产生转基因双 子叶植物的优选方法 ( 见 Hooykas 和 Schilperoort, 1992, Plant Molecular Biology 19 : 15-38 的综述 )。不过该方法也可以用于转化单子叶植物, 尽管单子叶植物一般优选别的转 化方法。目前, 产生转基因单子叶植物的优选方法是粒子 ( 被用于转化的 DNA 所包被的极 小金或钨粒子 ) 轰击胚愈伤组织 (embroynic calli) 或发育中的胚 (Christou, 1992, Plant Journal 2 : 275-281 ; Shimamoto, 1994, Current Opinion Biotechnology 5 : 158-162 ; Vasil 等, 1992, Bio/Technology 10 : 667-674)。 另外一种可选的转化单子叶植物的方法是基于原生质体转化, 如 Omirulleh 等, 1993, Plant Molecular Biology 21 : 415-428 所述。
     转化以后, 选择整合了表达构建体的转化子, 并根据本领域熟知的方使其再生为 完整植株。
     本发明还涉及产生本发明的酶的方法, 其包括 (a) 在有利于生产所述酶的条件 下, 培养含有编码本发明的酶的核苷酸序列的转基因植物或植物细胞 ; 和 (b) 回收该酶。
     包含酶多肽的组合物和它们的制备方法
     本发明提供包含本发明的多肽和赋形剂的组合物和制备这样的组合物的方法, 该 方法包括混合本发明的多肽和赋形剂。在一个具体的实施方案中, 本发明的多肽是该组合 物, 例如单组分组合物中的主要 ( 多肽 ) 成分。在这里, 赋形剂应理解为用于配制所述组合 物的任何辅助性的试剂或化合物, 包括溶剂、 载体、 稳定剂等。
     该组合物还可以包含一种或多种其它的酶, 例如氨肽酶、 淀粉酶、 糖酶、 羧肽酶、 过 氧化氢酶、 纤维素酶、 几丁质酶、 角质酶、 环糊精糖基转移酶、 脱氧核糖核酸酶、 酯酶、 α- 半 乳糖苷酶、 β- 半乳糖苷酶、 葡糖淀粉酶、 α- 葡糖苷酶、 β- 葡糖苷酶、 卤素过氧化物酶 (haloperoxidase)、 转化酶、 漆酶、 脂肪酶、 甘露糖苷酶、 氧化酶、 果胶分解酶、 肽谷氨酰胺 酶、 过氧化物酶、 肌醇六磷酸酶、 多酚氧化酶、 蛋白水解酶、 核糖核酸酶、 转谷氨酰胺酶、 或木 聚糖酶。
     所述组合物可以根据本领域已知的方法制备并可以为液体或固体组合物的形式。 例如, 酶组合物可以用多肽和 / 或药品制剂技术领域已知的方法配制, 例如配制为包衣或 未包衣的颗粒或微颗粒。因此本发明的多肽可以以颗粒, 优选非粉化性 (non-dusting) 颗 粒, 液体, 特别是稳定化的液体, 浆液或被保护的多肽的形式提供。 对于一定的用途, 可优选 将多肽固定到固态基质上。
     组合物中要包含的多肽可以根据本领域已知的方法稳定化, 例如通过加入抗氧化 剂或还原剂以限制多肽的氧化从而稳定组合物中的多肽, 或可通过加入例如 PVP、 PVA、 PEG 或其它已知对多肽在固体或液体组合物中的稳定性有益的合适的聚合物来稳定它。
     在另外的实施方案中, 本发明的组合物是去污剂组合物, 该组合物除了本发明 的 多 肽 以 外还 包含表 面活性 剂, 以及, 任选地, 选自增 效剂 (builder) 例如沸 石、 漂白 剂 例 如 过 碳 酸 盐、 漂 白 促 进 剂 (bleach enhancers) 例 如 TAED 或 NOBS、 抑 泡 剂 (suds suppressors)、 芳香剂等等的化合物。
     在另一个实施方案中本发明的组合物是饲料组合物, 其除了本发明的多肽以外还 包含谷类 (cereal) 或谷物 (grain) 产品。
     在另一个实施方案中本发明的组合物是包含本发明的多肽的食品组合物例如面 包粉 (baker’ s flour) 组合物、 酿造产品、 果汁、 油或猪油产品。
     在另一个实施方案中本发明的组合物是纸浆组合物, 其除了本发明的多肽外还含 有纸浆。
     在另一个实施方案中本发明的组合物是杀生物 (biocidal) 组合物, 其除了本发 明的多肽外还含有氧化还原酶促进剂。
     酶多肽和包含它们的组合物的用途
     在另外的方面中, 本发明提供本发明的多肽或多核苷酸, 或包含所述多肽或多核 苷酸的组合物在多种应用特别是 ( 技术 ) 过程例如工业或家庭中进行的过程中, 及下面的用于商业研究的目的的用途。因此本文涵盖这样的过程, 其包括在 ( 技术的 ) 工业、 研究或 家用过程中使用本发明的多肽或本发明的多核苷酸。
     在一个实施方案中本发明的多肽或组合物被用来清洗纤维质织物。
     在另一个实施方案中使用本发明的多肽或组合物制备食品或饲料添加剂。
     在另一个实施方案中使用本发明的多肽或组合物处理木质 (lignolosic) 材料和 纸浆。
     去污剂的公开
     本发明的多肽可以添加到去污剂 (detergent) 组合物中并因此成为其组分。
     本发明的去污剂组合物可以, 例如, 配制为手洗或机洗衣物用去污剂组合物, 其 包括适用于预处理染污织物的洗衣添加剂组合物, 和漂洗加入的织物软化组合物 (rinse added fabric softener composition) ; 或者可以配制为用于一般家用硬表面清洗操作的 去污剂组合物, 或配制为用于手洗或机洗碗碟操作。
     在一个特定的方面中, 本发明提供包含本发明的多肽的去污剂添加剂。该去污剂 添加剂及去污剂组合物可包含一种或多种其他的酶例如蛋白酶、 脂肪酶、 角质酶、 淀粉酶、 糖酶、 纤维素酶、 果胶酶、 甘露聚糖酶、 阿拉伯糖酶 (arabinase)、 半乳聚糖酶、 木聚糖酶、 氧 化酶例如漆酶和 / 或过氧化物酶。
     一般而言, 所选的酶的性质应该与所选的去污剂相容 ( 例如最适 pH、 与其他酶或 非酶成分的相容性等等 ), 而且该酶应当以有效量存在。
     蛋白酶 : 合适的蛋白酶包括动物、 植物或微生物来源的那些蛋白酶。微生物来源 是优选的。还包括化学修饰的或蛋白质工程改造的突变体。该蛋白质可以是丝氨酸蛋白酶 或金属蛋白酶, 优选地为碱性微生物蛋白酶或胰蛋白酶样 (trypsin-like) 蛋白酶。碱性 蛋白酶的例子有枯草杆菌蛋白酶, 特别是来自芽孢杆菌的那些, 例如枯草杆菌蛋白酶 Novo、 枯草杆菌蛋白酶 Carlsberg、 枯草杆菌蛋白酶 309、 枯草杆菌蛋白酶 147 和枯草杆菌蛋白酶 168( 如 WO89/06279 所述 )。胰蛋白酶样蛋白酶的例子有胰蛋白酶 ( 例如猪或牛来源的 ) 和镰孢属 (Fusarium) 蛋白酶, 其在 WO 89/06270 和 WO 94/25583 中有描述。
     有用的蛋白酶的例子有 WO 92/19729、 WO 98/20115、 WO 98/20116 和 WO 98/34946 中所描述的变体, 特别是那些文献中所述的特定位置上有置换的变体。
     优 选 的 商 业 上 可 获 得 的 蛋 白 酶 包 括 Alcalase , Savinase , Primase , Duralase , Esperase , 和 Kannase (Novozymes A/S), Maxatase , Maxacal , Maxapem , Properase , Purafect , Purafect OxP , FN2 ,和 FN3 (Genencor International Inc.)。
     脂肪酶 : 合适的脂肪酶包括细菌或真菌来源的那些脂肪酶。还包括化学修饰 的或蛋白质工程改造的突变体。有用的脂肪酶的例子包括来自腐质霉属 (Humicola, 与 Thermomyces 同 义 ) 的 脂 肪 酶, 例 如 EP 258 068 和 EP 305 216 所 描 述 的 来 自 H.lanuginosa(T.lanuginosus) 的脂肪酶, 或 WO 96/13580 所描述的来自 H.insolens 的 脂肪酶, 假单胞菌 (Pseudomonas) 脂肪酶, 例如来自产碱假单胞菌 (P.alcaligenes) 或类 产碱假单胞菌 (P.pseudoalcaligenes)(EP 218 272)、 洋葱假单胞菌 (P.cepacia)(EP 331 376)、 司徒茨假单胞菌 (P.stutzeri)(GB 1,372,034)、 荧光假单胞菌 (P.fluorescens)、 假 单胞菌菌种 SD705 株 (WO 95/06720 和 WO 96/27002) 和 P.wisconsinensis(WO 96/12012)的脂肪酶 ; 芽孢杆菌脂肪酶, 例如来自枯草芽孢杆菌 (Dartois 等, (1993), Biochemica et Biophysica Acta, 1131, 253-360)、 嗜热脂肪芽孢杆菌 (JP 64/744992)、 或短小芽孢杆菌 (B.pumilus)(WO 91/16422) 的脂肪酶。
     其 他 的 例 子 有 WO 92/05249, WO 94/01541, EP 407 225, EP 260 105, WO 95/35381, WO 96/00292, WO 95/30744, WO 94/25578, WO 95/14783, WO 95/22615, WO 97/04079 和 WO 97/07202 中所描述的脂肪酶变体。
     优 选 的 商 业 上 可 获 得 的 脂 肪 酶 包 括 LipolaseTM, Lipolase UltraTM 和 LipexTM(Novozymes AJS)。
     淀粉酶 : 合适的淀粉酶 (α 和 / 或 β) 包括细菌或真菌来源的那些淀粉酶。还包 括化学修饰的或蛋白质工程改造的突变体。淀粉酶包括, 例如, 得自芽孢杆菌, 例如一种特 别的地衣芽孢杆菌菌株 ( 在 GB 1,296,839 中有详述 ) 的 α- 淀粉酶。
     有用的淀粉酶的例子有 WO 94/02597, WO 94/18314, WO 96/23873 和 WO97/43424 中描述的变体, 特别是那些文献中所述的特定位置上有置换的变体。
     优 选 的 商 业 上 可 获 得 的 淀 粉 酶 包 括 DuramylTM, TermamylTM, FungamylTM 和 BANTM(Novozymes A/S), RapidaseTM 和 PurastarTM( 来自 Genencor International Inc.)。 纤维素酶 : 合适的纤维素酶包括细菌或真菌来源的那些纤维素酶。还包括化 学修饰的或蛋白质工程改造的突变体。合适的纤维素酶包括来自芽孢杆菌属、 假单胞 菌属、 腐质霉属、 镰孢属、 梭孢壳属和 Acremonium 属的纤维素酶, 例如在 US 4,435,307, US 5,648,263, US 5,691,178, US 5,776,757 和 WO 89/09259 中 描 述 的、由 Humicola insolens、 Myceliophthora thermophila 和尖镰孢产生的真菌纤维素酶。
     特别合适的纤维素酶是具有护色 (color care) 的益处的碱性或中性纤维素酶。 这样的纤维素酶的例子有 EP 0 495 257, EP 0 531 372, WO 96/11262, WO 96/29397 和 WO 98/08940 中描述的纤维素酶。其他例子有纤维素酶变体, 例如 WO 94/07998, EP 0 531 315, US 5,457,046, US 5,686,593, US 5,763,254, WO 95/24471, WO 98/12307 和 PCT/ DK98/00299 中描述的那些。商业上可获得的纤维素酶包括 Celluzyme , 和 Carezyme (Novozymes), Clazinase , 和 Puradax HA (Genencor International Inc.), 和 KAC-500(B) (Kao Corporation)。
     过氧化物酶 / 氧化酶 : 合适的过氧化物酶 / 氧化酶包括植物、 细菌或真菌来源的那 些过氧化物酶 / 氧化酶。还包括化学修饰的或蛋白质工程改造的突变体。有用的过氧化物 酶的例子包括来自鬼伞属 (Coprinus) 的过氧化物酶, 例如来自灰盖鬼伞 (C.cinereus), 及 其变体, 如 WO 93/24618, WO 95/10602, 和 WO 98/15257 所述的那些的过氧化物酶。
     商业上可获得的过氧化物酶包括 Guardzyme (Novozymes A/S)。
     可以通过加入含有一种或多种酶的单独的添加剂, 或加入包含所有酶的复合添加 剂, 使去污酶 (detergent enzyme(s)) 包含在去污剂组合物中。本发明的去污剂添加剂, 即 单独的添加剂或复合添加剂, 可以配置为例如颗粒、 液体、 浆液等等。优选的去污剂添加剂 的剂型为颗粒, 特别是非粉化性颗粒、 液体, 特别是稳定化的液体, 或浆液。
    非粉化性颗粒可以, 例如, 如 US 4,106,991 和 4,661,452 所公开的那样制备, 任选 地, 还可以用本领域已知的方法来包被。蜡状 (waxy) 包被材料的例子有平均克分子量为 1000-20000 的聚 ( 环氧乙烷 ) 产品 ( 聚乙二醇, PEG) ; 具有 16-50 个环氧乙烷单位的乙氧
     基化壬基苯酚 ; 乙氧基化脂肪醇, 其中醇含 12-20 个碳原子, 且其中有 15-80 个环氧乙烷单 位; 脂肪醇 ; 脂肪酸 ; 以及脂肪酸的甘油单酯、 甘油二酯和甘油三酯。GB 1483591 提供了适 于通过流化床施用的成膜包被材料的例子。液体酶制备物可以, 例如, 按照已确立的方法, 通过加入多元醇, 如丙二醇、 糖或糖醇、 乳酸或硼酸来稳定化。可以根据 EP 238,216 所公开 的方法制备被保护的酶。
     本发明的去污剂组合物可以是任何方便的形式, 例如条、 片、 粉、 颗粒、 糊或液体。 液体去污剂可以是水性的, 通常含有高达 70%的水和 0-30%的有机溶剂, 或者可以是非水 性的。
     所述去污剂组合物包含一种或多种表面活性剂, 表面活性剂可以是非离子型包括 半极性的, 和 / 或阴离子型的, 和 / 或阳离子型的, 和 / 或两性离子型的。表面活性剂典型 地以 0.1-60 重量%的水平存在。
     当被包括在其中时, 所述去污剂通常含有大约 1%到大约 40%的阴离子表面活性 剂例如线性苯磺酸烷基酯、 α- 烯属磺酸酯、 硫酸烷基酯 ( 脂肪醇硫酸酯 )、 脂肪醇乙氧基硫 酸盐 (ethoxysulfate)、 二级链烷磺酸盐 (alkanesulfonate)、 α- 磺基脂肪酸甲酯、 烷基或 烯基琥珀酸或肥皂。
     当被包括在其中时, 所述去污剂通常含有约 0.2%到约 40%的非离子表面活性剂 如脂肪醇乙氧基化物、 壬基苯酚乙氧基化物、 烷基多苷、 烷基二甲基胺氧化物、 乙氧基化脂 肪酸单乙醇胺、 脂肪酸单乙醇胺、 多羟基烷基脂肪酰胺 (polyhydroxy alkyl fatty acid amide)、 或葡糖胺 (“葡萄糖胺” (“glucamides” )) 的 N- 酰基 N- 烷基衍生物。
     所 述 去 污 剂 可 包 括 0-65 % 的 洗 涤 增 效 剂 (detergent builder) 或 络 合 剂 (complexing agent) 如沸石、 二磷酸盐、 三磷酸盐、 膦酸盐 (phosphonate)、 碳酸盐、 柠檬酸 盐、 次氮基三乙酸、 乙二胺四乙酸、 二亚乙基三胺五乙酸、 烷基或烯基琥珀酸、 可溶的硅酸盐 或分层的 (layered) 硅酸盐 ( 例如来自 Hoechst 的 SKS-6)
     所述去污剂可包含一种或多种聚合物。例如羧甲基纤维素、 聚 ( 乙烯吡咯烷酮 )、 聚 ( 乙二醇 )、 聚 ( 乙烯醇 )、 聚 ( 乙烯吡啶 -N- 氧化物 )、 聚 ( 乙烯咪唑 )、 聚羧酸酯如聚丙 烯酸酯、 马来酸 / 丙烯酸共聚物和甲基丙烯酸月桂酯 / 丙烯酸共聚物。
     所述去污剂可包含漂白系统, 所述系统包括 H2O2 源例如过硼酸盐或过碳酸盐, 其 可与产过酸漂白激活剂 (peracid-forming bleach activator) 如四乙酰基乙二胺或壬酰 氧苯磺酸酯 (nonanoyloxybenzenesulfonate) 组合。或者, 漂白系统可包括例如酰胺、 二酰 亚胺或砜类型的过氧酸。
     本发明的去污剂组合物的酶可以用常规的稳定剂来稳定化, 例如多元醇如丙二 醇或丙三醇、 糖或糖醇、 乳酸、 硼酸或硼酸衍生物, 例如, 芳香族硼酸酯, 或苯硼酸衍生物如 4- 甲酰苯硼酸, 并且该组合物可以如 WO 92/19709 和 WO 92/19708 中描述的那样配制。
     洗涤剂溶液也可包括其他常规的洗涤剂组分, 例如织物调理剂 (conditioner) 包 括粘土, 促泡剂, 抑泡剂, 防蚀剂, 污物悬浮剂, 防污物再沉淀剂, 染料, 杀菌剂, 荧光增白剂, 水溶助长剂, 晦暗抑制剂, 或香料。
     在此考虑, 在所述去污剂组合物中, 任何酶, 特别是本发明的酶, 可以以相当于 0.01-100mg 酶蛋白每升洗涤液, 优选 0.05-5mg 酶蛋白每升洗涤液, 最优选 0.1-1mg 酶蛋白 每升洗涤液的量加入。本发明的酶还可以掺入到 WO 97/07202 所公开的去污剂组合物中, 在此将 WO 97/07202 并入本文作为参考。
     保藏的微生物
     根据 《国际承认的用于专利程序的微生物保存布达佩斯条约》 , 下列微生物被保 藏在真菌菌种保藏中心 (Centraalbureau voor Schimmelcultures), Fungal and Yeast Collection, Uppsala-laan 8, 3584 CT Utrecht, P.O.Box 85167, 3508 AD Utrecht, 荷兰 :
     名称 : Botryosphaeria rhodina
     同义名 : 棉色二孢 (Diplodia gossypina)(SBL 274)(Berkeley &M.A.Curtis)von Arx, von 1970,″ The genera of fungi sporulating in pure culture″ : 143
     分类 : Dothideaceae, Dothideales, Dothidemycetes, 子囊菌门 (Ascomycota)
     保藏号 : CBS 274.96
     保藏日期 : 1996 年 3 月 12 日 实施例 实施例 1 鉴定 Botryosphaeria rhodina CBS 274.96 分泌的功能性多肽
     培养液的酶指纹分析
     通过用多种酶测定方法对培养基肉汤进行测定, 获得了酶活性分布图。制备带底 物的 96 孔微量滴定 (MT) 板并保存在 10℃直到使用。制备了两种不同的 pH 变化形式 : pH3 和 pH7。使用下面的底物 : 0.05% AZCL(Mazurine 染色和交联的底物, Megazyme)- 直链淀 粉, 阿拉伯聚糖, β- 葡聚糖 ( 大麦 ), 酪蛋白, 胶原, 凝胶多糖, 葡聚糖, 半乳聚糖 ( 马铃薯 ), 半乳甘露聚糖 ( 角豆 )(carob), He- 纤维素、 支链淀粉 (pullulan)、 木聚糖 ( 燕麦 ) 和木葡 聚糖 (AZCL- 酪蛋白不能用在 pH3, 因此这些板中不加入 AZCL- 酪蛋白 )。
     pH3 底物的制备 :
     将 0.1g 的 每 种 AZCL 底 物 溶 解 在 100ml 的 0.2M 琥 珀 酸 pH3+10 微 升 Triton X-100(0.01% ) 中, 得到 0.1% AZCL 的终浓度。
     pH7 底物的制备 :
     将 0.1g 的每种 AZCL 溶解在 50ml 的无菌 H2O 加 10 微升 Triton X-100(0.01% ) 中。向每个 50ml AZCL 底物中加入 50ml 0.4M MOPS pH7, 得到终体积 100ml, 以及终浓度 0.2M 缓冲液, 0.1% AZCL。
     还包括了漆酶和脂肪酶活性的测定, 底物如下制备 :
     漆酶底物的制备 :
     制备溶于 0.2M 磷酸盐 / 硼酸盐缓冲液, pH9 的 0.08mg/ml Chicago Sky Blue 35ml。
     脂肪酶底物的制备 :
     通过以 3 ∶ 1 混合 2% PVA 溶液与大豆油制备聚乙烯醇 (PVA)/ 大豆油乳液。使用 ULTRA-TURRAX 混合器将油乳化, 并将 12ml 的乳液与 500ml 包含 10mM CaCl2, pH5.5 的 0.2M 乙酸钠缓冲液, 及 5ml 0.2%的结晶紫溶液混合。
     使 用 US Sterilin 96 孔 MT 板 和 Multidrop S20 装 板 器 (stacker), Titertek Instruments, Inc., Alabama。将 200 微升的每种 AZCL- 底物和脂肪酶底物和 150 微升的漆
     酶底物分装到 MT 孔中, 并将 30-50μl 培养基肉汤加入每份底物中, 26℃温育过夜。如下对 测定结果评分 : 0: 无活性 ; 1: 弱活性 ; 2: 强活性。
     结果表格 : 棉色二孢培养基肉汤的指纹分析
    底物 ACZL- 直链淀粉 ACZL- 阿拉伯聚糖 ( 去分枝 ) ACZL-β- 葡聚糖 ( 大麦 ) ACZL- 酪蛋白 ACZL- 胶原 ACZL- 凝胶多糖 ACZL- 葡聚糖 ACZL- 半乳聚糖 ( 马铃薯 ) ACZL- 半乳甘露聚糖 ( 角豆 ) ACZL-HE- 纤维素 ACZL- 支链淀粉 ACZL- 木聚糖 (Oat Spelts) ACZL- 木葡聚糖 Chicago Sky Blue PVA/ 大豆油
    a b酶活性 α- 淀粉酶 内切 -1, 5-α-L-arabinanase β- 葡聚糖酶、 地衣酶和纤维素酶 蛋白酶 蛋白酶 内切 -1, 3-β-D- 葡聚糖酶pH3 0a 0 2 Ntb 0 1pH7 1 2 1 2 1 0 0 2 2 2 0 2 2 0 0内切 -1, 6-α-D- 葡聚糖酶 ( 葡聚糖酶 ) 0 内切 -1, 4-β-D- 半乳聚糖酶 内切 -1, 4-β-D- 甘露聚糖酶 内切 - 纤维素酶 极限糊精酶 ( 支链淀粉酶 ) 内切 -1, 4-β-D- 木聚糖酶 内切纤维素酶 漆酶 脂肪酶 0 2 2 0 2 0 0 0活性测定的结果评分 : 0 =无活性 ; 1 =弱反应 ; 2 =强反应
     nt =未测试
     A.cDNA 文库构建
     用标准的分子生物学技术 (Ausuble 等 1995″ Current protocols in molecular biology″ Publ. : John Wiley and sons) 制备来自 Botryosphaeria rhodina CBS 274.96 的 cDNA。
     cDNA 文库生产中使用的生物质的发酵是从在 28℃下温育了 7 天的接种的 PDA 板 开始的。在有 Mex1 培养基的摇瓶中接种数个菌丝体 -PDA 琼脂塞 (plugs), 其中 Mex1 培养基含有 ( 每升 ) : 20g 大豆, 15g 麦麸, 10g 微结晶纤维素 (cellulose Avicel), 5g 麦芽糖糊 精 01, 3g 细菌用蛋白胨 (bacto peptone), 0.2g 聚氧丙烯 (pluronic)PE6100, 和 1g 橄榄油。 在 26℃下 150rpm 振荡这些摇瓶。7 日后通过 Miracloth 过滤收集菌丝体, 并将菌丝体冷冻 在液氮中, 在 -80℃下保存直到使用。
     RNA 分离 : 从冰冻、 粉状的 Botryospaeria rhodina 菌丝体制备总 RNA, 方法是通过 硫氰酸胍提取, 然后通过 5.7M CsCl 的下层 (cushion) 超速离心 (Chirgwin, J.M., Przbyla, A.E., Macdonlad, RJ. 和 Ruttwer W.J., Isolation of biologically active ribonucleic acid from sources enriched in ribonuclease, Biochemistry 18, 5294-5299, 1979)。 用 寡聚 (dT)- 纤维素亲和色谱 (Aviv, H. 和 Leder, P., Purification of biologically active globin messenger RNA by chromatography on oligothymidylic acid-cellulose, Proc. Natl.Acad.Sci.USA 69(6), 1408-1412, 1972) 分离富含多聚 A 的 RNA。
     cDNA 文库的构建 : 根据 Gubler U 和 Hoffman, B.J., A simple and very efficient method for generating cDNA libraries, Gene 25(2-3), 263-269, (1983) ; Sambrook, J., Fritsch, E.F. 和 Maniantis, T.Molecular cloning : A laboratory Manual, 第二版, 1989, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York 和 Kofod 等 (1994) 的一般方法使用多聚 A-Not1 引物 (Promega, 美国 ) 合成双链 cDNA。合成以后, 用绿豆核 糖核酸酶处理 cDNA, 用 T4 DNA 聚合酶平末端化, 然后与摩尔数过量 50 倍的 EcoRI 接头 (Invitrogen, 美国 ) 连接。根据制造商的指导, 用限制酶 NotI(New England Biolabs, 美 国 ) 切割 cDNA, 然后用琼脂糖凝胶电泳将 cDNA 按大小分级。 将对应于 700bp 及更大的 cDNA 从凝胶上切下并用 GFX DNA 分离试剂盒 (AP Biotech) 纯化。然后通过连接反应将制备好 的 cDNA 定向克隆到 EcoRI-NotI 切割的 pMHas5 中。通过电穿孔将连接混合物导入 DH10B 细胞 (Invitrogen) 后, 铺到含 50mg/ 升卡那霉素的 LB 琼脂上。从原先的 cDNA-pMHas5 载 体连接产物的总共 30,000 个转化体制备 cDNA 质粒池 (pool)。根据 Qiagen 的质粒 DNA 分 离操作规程 (Qiagen Inc.GMBH), 从固体 LB 卡那霉素选择培养基上回收的菌落的池中直接 制备质粒 DNA。
     用于克隆的载体是 pMhas5, 其在专利 WO 03/044049 中有记载, 具有下面的特征 :
     特征 部位 描述
     CDS 365-1156 卡那霉素抗性
     CDS 2232-2387 β- 半乳糖苷酶 α 肽
     -10 信号 2189-2192 SD 序列
     启动子 2101-2189 Lac 启动子
     多样性特征 626-650 BACE 系统的 KanP1 引物
     该质粒值得注意的特征是 Lac 启动子的 SD 区域附近的 EcoRI-NotI 限制位点。它 使得带 EcoRI-NotI 接头的 cDNA 能够被克隆到载体中, 且使所得的构建体在大肠杆菌宿主 中能够被活跃地转录和翻译。
     B. 转座子的构建和制备
     如 WO 01/77315 A1 所述的, 转座子协助信号捕捉 (Transposon Assisted Signal Trapping, TAST) 的基本原理是, 将所选的基因组中所有的基因通过转座子标签与编码无信 号的 β- 内酰胺酶的基因相融合。这样, 当在含有氨苄青霉素的培养基中培养包含通过转座子标签与编码无信号的 β- 内酰胺酶的基因融合的基因组的基因的宿主细胞克隆时, 只 有表达和分泌 β- 内酰胺酶的那些克隆能够生存。但是, 只有在与 β- 内酰胺酶基因融合 的基因具有能够被宿主株系识别的完整启动子和核糖体结合位点 ( 即, 在真实的生命过程 中被细胞表达产生多肽的基因 ), 而且 β- 内酰胺酶被这样翻译, 使得合成的多肽被转运穿 过细胞质膜并正确地折叠的条件下, β- 内酰胺酶才会被分泌。因此, 当将融合的基因插入 到选择的宿主细胞时, 那些氨苄青霉素抗性的克隆就含有编码功能性分泌多肽的基因。
     通常, 使用 TAST 方法时甚至不需要表达整个基因。当给基因加上转座子标签时, 这些基因的 N 末端部分作为融合蛋白表达, 就显示这些基因含有完整的转录、 翻译和分泌 序列。因此, 通常认为这些基因的 N 末端部分作为融合蛋白的表达足以保证整个基因的表 达和分泌。
     因此可以下结论 : 通过 TAST 方法得到的基因确实编码分泌的功能性多肽。
     含 β- 内酰胺酶报道基因的 SigA4 转座子的构建 :
     按照 WO 01/77315 A1 的指导, 使用标准分子生物学技术构建含有无信号 β- 内 酰胺酶基因的转座子。首先, 使用具有校正活性的 (proofreading) 聚合酶 (Pfu Turbo, Stratagene, 美国 ) 从 pUC19 载体 PCR 扩增无信号 β- 内酰胺酶基因。 所得的 PCR 片段含有 NotI 和 EcoRI 限制性位点以便于克隆。含有 Entranceposon 和抗生素抗性标记 CAT( 在转 座子中编码氯霉素抗性 ) 的质粒 pEntranceposon(Camr) 是从 Finnzymes, OY 获得的 (Espoo 芬兰 )。 用限制酶 NotI 和 EcoRI 消化该质粒, 凝胶纯化后与含有无信号的 β- 内酰胺酶的片 段连接。 将连接产物转化到电转化感受态 (electro-competent) 的 DH10B 细胞中, 通过限制 性分析鉴定含有带有所述无信号的 β- 内酰胺酶的质粒的大肠杆菌克隆, 并命名为 SigA2。
     为制备转座子, 构建了较小的 SigA2 衍生物, 其缺乏编码 β- 内酰胺酶的 bla 基因 : 使用结合到 SigA2 的 bla 基因的起始和终止处, 且方向向外的两个寡核苷酸引物 SigA2NotU-P 5′ -TCG CGA TCC GTT TTC GCA TTT ATC GTG AAA CGC T-3′ (SEQ ID NO : 43) 和 SigA2NotD-P 5′ -CCG CAA ACG CTG GTG AAA GTA AAA GAT GCT GAA-3′ (SEQ ID NO : 44) 来 PCR 扩增没有 bla 基因的 SigA2。该 PCR 反应产生的大约 3.6kb 的扩增产物经过 重新连接 (relegate) 后转化到合适的大肠杆菌菌株中。从能在 LB 氯霉素但不能在 LB 氨 苄青霉素上生长的转化体中分离了 3.6kb 的质粒。该质粒保留了所有两个 BglII 位点并缺 少活性的 blg 基因, 被称为 pSig4( 图 1)。
     60 微升浓度为 0.3μg/μl 的 pSigA4 质粒 DNA 制备物用 BglII 消化并在琼脂糖凝 胶上分离。将 2kb 的 SigA2 转座子 DNA 条带洗脱下来, 并根据供货商的指导, 用 “GFXTMPCR、 DNA 和 凝 胶 条 带 纯 化 试 剂 盒” (PCR, DNA and Gel Band Purification Kit)(Amersham Pharmacia Biotech Inc. 美国 ) 纯化, 用 200 微升 EB 缓冲液洗脱。这样制备的 SigA2 可以 用于转座子协助信号捕捉 (TAST, 见下文 )。
     C. 转座子标签
     从 pSigA4 制备的转座子带有 5’ 截短的 bla 基因, 该基因编码除去了分泌信号的 β- 内酰胺酶。β- 内酰胺酶只有在被分泌到周质时才能赋予大肠杆菌氨苄青霉素抗性, 而 β- 内酰胺酶的细胞质表达不能赋予氨苄青霉素抗性。如果没有信号序列, β- 内酰胺酶 将不会被转运到周质中, 从而克隆也就不会在含有氨苄青霉素的培养基上生长。无信号的 β- 内酰胺酶基因以这样的方式包含在转座子中, 使得转座子的边界和 β- 内酰胺酶编码区域之间存在连续的开放阅读框。这样, 被改变的转座子当转座到编码分泌的蛋白质的基 因中时, 可以导致与目标基因的共阅读框 (in-frame) 的融合。这样就导致分泌到大肠杆菌 周质并赋予氨苄青霉素抗性的融和基因产物的产生。 而如果转座子整合到编码非分泌蛋白 的基因中, 即使是共阅读框的, 相应的宿主也不会成为氨苄青霉素抗性。
     D.Botryosphaeria rhodina 的转座子协助信号捕捉
     关于转座子协助信号捕捉的完整描述可以在 WO 01/77315 中找到。从最初的 cDNA-pMHas5 载体连接产物的总共 30,000 个转化体构建了 cDNA 质粒池。根据 Qiagen 的 质粒 DNA 分离操作规程 (Qiagen Inc.), 从固体 LB 卡那霉素选择培养基上回收的菌落的池 中直接制备质粒 DNA。根据转座酶制造商的指导 (Finnizyme, Finland), 用转座子 SigA2 和 MuA 转座酶处理质粒池。
     为了给 Botryosphaeria rhodina CBS 274.96 cDNA 文库加转座子标签, 将含有约 2.6 微克的 DNA 的 SigA2 转座子 4 或 8 微升, 与质粒池 DNA 的 DNA 浓度的 Botryosphaeria rhodina CBS 274.96 cDNA 文库 1 微升, Finnzymes MuA 转座酶 2 微升 (0.22 微克 / 微升 ), 和 5x 缓冲液 ( 来自 Finnzymes OY, Espoo, 芬兰 )5 微升在 50 微升的总体积中混合, 并在 30℃温育 3.5 小时, 然后在 75℃热失活 10min。加入 5 微升 3M 乙酸钠 pH5 和 110 微升 96% 乙醇, 并在 20000rpm 离心 30min 使 DNA 沉淀。洗涤沉淀并干燥, 然后在 10 微升 TE 缓冲液 中重悬。
     在 Biorad 基因脉冲设备 (50μF, 20mAmp, 1.8kV) 中, 1.5 微升的加有转座子标签 的质粒池通过电穿孔导入 20 微升的 DH10B 超感受态 (ultra-competent) 细胞, 根据随该细 胞提供的标准操作规程 (Gibco-BRL) 进行。将电穿孔的细胞在振荡下温育在 SOC 培养基中 (28℃, 2 小时, 250rpm), 然后铺在选择培养基上。使用了 3 种琼脂培养基 :
     LB+50mg/ml 卡那霉素,
     LB+ 卡那霉素 +15mg/ml 氯霉素和 / 或
     LB+ 卡那霉素 + 氯霉素 +12.5mg/ml 氨苄青霉素。
     通过将电穿孔产物稀释并铺在 LB+ 卡那霉素 + 氯霉素培养基上, 确定了每份电穿 孔物大约存在 72,000 个含有带 SigA2 转座子的 cDNA 文库质粒的菌落, 且在三重选择 (LB、 卡那霉素、 氯霉素、 氨苄青霉素 ) 下, 大约回收了 69 个菌落。进一步进行电穿孔和铺板实 验, 直到在三重选择下从实验中总共回收 445 个菌落。根据 Qiagen Qiaturbo96 操作规程 (Qiagen Inc. 美国 ) 对这些菌落进行质粒小量提取 (miniprep)。根据国际专利申请 WO 01/77315 的实施例中公开的方法 ( 第 28 页 ), 用转座子正向和反向引物 ( 引物 A 和 B) 对 质粒测序。
     引物 A : AGCGT TTGCG GCCGC GATCC(SEQ ID NO : 45)
     引物 B : TTATT CGGTC GAAAA GGATC C(SEQ ID NO : 46)
     E. 序列组装和注释
     用 AB3700 毛细管测序仪获得反应物的 DNA 序列。 修整这些序列以去除每个质粒的 载体和转座子序列及 A 和 B 引物读取结果。由此得到 225 个组装的序列, 使用 PhredPhrap 程序 (Brent Ewing, LaDeana Hillier, Michael C.Wendl 和 Phil Green ; Base-calling of automated sequencer traces using phred I.Accuracy assessment ; Genome Research ; 8: 175-185 ; 1998 ; Brent Ewing 和 Phil Green ; Base-calling of automated se-quencertraces using phred II.Error probabilities ; Genome Research 8 : 186-194 ; 1998) 将它 们分为 148 个毗连群 (contigs)。 然后使用 BLASTX 程序 2.0a19MP-WashU[1998-7-14][ 构建 Linux-x86 18 : 51 : 44 30-Jul-1998](Gish, Warren 1994-1997- 未公开 ; Gish, Warren 和 David J.States ; Identification of protein coding regions by database similarity search ; Nat.Genet.3 : 266-72 ; 1993), 将所有 148 个毗连群与可从标准公共 DNA 和蛋白质 序列数据库 (TrEMBL, SWALL, PDB, EnsemblPep, GeneSeqP) 获得的序列比较。
     所得的序列大部分是编码完整的功能性多肽的功能性基因, 如上所述其从氨苄青 霉素抗性克隆获得, 用作人工分析的基础。
     为了确认所述菌落的氨苄青霉素抗性是 β- 内酰胺酶活性增加的结果, 在 10 个 cDNA 上转座子的到达位点 (landing site) 不同的信号捕捉克隆中测试了 β- 内酰胺酶活 性。根据 Invitrogen Life Technologies 的操作规程将质粒 DNA 重新转化到 One Shot Top10 化学感受态大肠杆菌中, 并将转化混合物涂布在带卡那霉素 (50μg/ml) 和氯霉 素 (10μg/ml) 的 LB 琼脂上。28 ℃下 2 天后, 将菌落影印铺板到 LB 卡那霉素、 氯霉素和 15(10μg/ml) 氨苄青霉素的 LB 上。 28℃下 3 天后, 将真正生长的菌落 (true growers) 接种 到含卡那霉素 (50μg/ml) 和氯霉素 (10μg/ml) 的 10ml LB 培养基中, 37℃, 275rpm 温育过 夜。将过夜培养物按 1 ∶ 100 稀释在新鲜的 LB Kan/CAM 培养基中并培养到 OD600 = 0.5。 离心收集细胞并用 0.9% NaCl 洗涤一次。 将沉淀悬浮在超声处理缓冲液 (100mM Tris-HCl, 2mM EDTA, pH 8.0) 中, 调节细胞数到光密度 OD600 = 0.5, 用 Soniprep 150(MSE) 以 1.5μm 的振幅超声处理。 将样品在 15,000rpm 离心 10min, 将上清用于 β- 内酰胺酶测定。 在塑料比 色皿中, 将上清与 50μl nitrocefin 生色 β- 内酰胺酶底物 (1mg/ml, 于 50% DMSO ; 0.05M PO4 缓冲液中 ) 和 0.1M PO4 缓冲液混合到 1ml, 然后用 3300pro 分光光度计测量 Abs482。结 果如下所示 :
     表 IX : 具有不同的 Shine Dalgarno(SD) 序列和 ATG 翻译起始密码子和之间的距 离和转座子到达位点的克隆 β- 内酰胺酶活性
    上表说明了 3 个要点 :
     1) 所有 10 个克隆中都可检测到 β- 内酰胺酶活性。 应当强调的是, 相应的含有质 粒的大肠杆菌转化体对 50mg/ 升氨苄青霉素选择有抗性。这些事实共同显示, 所有 10 个克 隆都产生由融合到 β- 内酰胺酶基因的带转座子标签的 cDNA 的一部分组成的杂合蛋白, 其 中以提供具有 β- 内酰胺酶活性的肽的方式融合。
     2) 由于这 10 个克隆的 cDNA 被完全测序, SigA2 转座子在每个克隆中的到达位置 得到了证实。这 10 个克隆都含有 SigA2 转座子, 其处于正确的方向和阅读框中, 以促使天 然的被编码蛋白的 N 末端与转座子所编码的 β- 内酰胺酶发生杂合融合。
     3) 在真核 cDNA 中, 非翻译的上游 (5’ UTR) 前导序列的长度可在 1bp 到数百个碱 基对之间变化。为了从大肠杆菌翻译元件例如 Shine-Dalgarno 区域最优地翻译 cDNA, ATG 起始密码子之前 4 到 11 个碱基对的最优距离是最优的。由上表可见, 比最优值长得多的 5’ UTR 还是容许表达一些 cDNA 杂合体 -β 内酰胺酶融合蛋白, 因为从样品中的转化大肠杆 菌中观察到了 β- 内酰胺酶活性。
     所得的本发明的核苷酸序列是功能性基因编码完整的功能性多肽, 不但由于上述 原因, 而且因为它们是从氨苄青霉素抗性克隆获得的。这里获得的克隆是氨苄青霉素抗性 的, 因为加上转座子标签后, 这些基因与无信号的 β- 内酰胺酶基因融合, 无信号的 β- 内 酰胺酶基因只有当与具有在宿主株中可被识别的完整启动子和核糖体结合位点的基因融 合时, 才能被表达、 翻译、 转运穿过细胞质膜并正确地折叠。
     因此, 可以作结论, 本发明的基因确实编码活性的分泌的多肽。因为 16 个基因的 序列分析显示得到了与无信号的 β- 内酰胺酶基因的共阅读框融合。另外, 通过测定整个 核苷酸序列, 确证了这些基因的开放阅读框的完整。
     实施例 2 通过同源性确定酶活性
     通过与已知功能的基因或多肽比较, 可以预测基因或被编码的多肽的功能。分析
     了 ADNA 组和 B 多肽组序列与来自公共和内部数据库的序列之间的相似性, 以确定 ADNA 组和 B 多 肽组序列的功能性。序列比较是用程序 BLASTX 2.0a19MP-WashU[1998-7-14] 进行的。通过 将 ADNA 组和 B 多肽组序列与其最接近的功能已知的序列进行仔细的人工序列比对, 为预测这 些基因和被编码的多肽的功能提供了可能。即使在全体氨基酸的同一性低于 40%, 从而可 能难以作出可靠的预测的情况下, 通过仔细地分析并判读催化位点和 / 或多肽序列的重要 区域中的氨基酸残基, 预测 ADNA 组和 B 多肽组序列的功能也是可能的。如果已知序列的催化 位点的氨基酸也存在于本发明的多肽中, 同时具有足够的全体氨基酸的同一性, 就可以断 定该来自 Botryosphaeria rhodina CBS 274.96 的多肽与所述已知序列具有同样的功能。
     实施例 3 制备 B 多肽组多肽
     为了从丝状真菌例如 Botryosphaeria rhodina CBS 274.96 的 cDNA 制备多肽, 在 酵母或另外的丝状真菌中表达该 cDNA 是可行的。作为非穷举性的例子, 一种好的选择是在 米曲霉中表达。下面给出了怎样在米曲霉中表达编码木聚糖酶的 cDNA(SEQ ID No : 3)。
     使用表达质粒 pDaU71。 该质粒含有 (1) 构巢曲霉 amdS 基因, 作为曲霉中的选择标 记; (2) 酵母 URA3 基因, 其被氨苄青霉素抗性基因隔断, 用于在大肠杆菌中选择 ; (3) 带 3 个 额外的 amyR- 位点的黑曲霉 NA2 启动子 ( 中性淀粉酶 )+ 构巢曲霉 TPI 启动子 5′非翻译部 分的重叠, 用于异源表达 ; 和 (4) 黑曲霉 AMG 终止子。作为扩增 Botryosphaeria rhodina cDNA 文库池的相关部分的模板, 在 PCR 反应中使用下面的引物 :
     引物 #166 : CGCGGATCCACCATGGTCTCCTTCAAGTCGATTC(SEQ ID NO : 47)
     引物 #167 : CCGCTCGAGTTACTGCACGGTAATCGTAGC(SEQ ID NO : 47)
     使用下面的条件 :
     按照制造商的指示, 使用 Extensor Hi Fidelity Reddy Load DNA 聚合酶 PCR 混 合液 (ABGene, 英国 )。
     cDNA 质粒池 (1 纳克 / 微升 ) : 5 微升
     引物 #166 1 微升
     引物 #167 1 微升
     PCR 主混合液 (master mix) 12.5 微升
     去离子水 7.5 微升
    总体积 25 微升
     将反应物转入预热到 94℃的 MJ Research DNA 扩增仪中, 然后进行下面的循环 :
     94℃ 2 分钟
     然后 25 个循环的 :
     94℃ 30 秒
     53℃ 30 秒
     72℃ 1 分钟
     然后
     72℃ 10 分钟
     用 1%琼脂糖凝胶分析 5 微升的产物以确认正确的大小并确定所得的 PCR 产物的 量。 根据制造商的指示 (AP Pharma) 用 GFX 纯化所剩的 20 微升混合物。 用 40 微升纯化产物
     中的 20 微升在 30 微升标准的过夜消化反应体系中进行标准的 BamHI-XhoI 限制消化。 然后 再用 GFX 纯化限制消化的产物, 再将其与经过 BamHI-XhoI 限制消化并纯化的 pDau71 进行 标准的连接反应。 将连接产物转化到 DH10B 大肠杆菌细胞中 ( 大肠杆菌 DH10B 或 TOP10( 可 从 Invitrogen 获得 ) 在该表达载体的构建中可用作克隆宿主 ), 并在 LB 氨苄青霉素培养基 上铺板。选择 10 个转化体进行质粒 DNA 纯化, 并对其测序以确定插入片段的序列完整性。 选择一个无 PCR 错误的克隆 pPFJO47 用于进一步研究。
     如 WO 00/39322 所述构建米曲霉 BECh2 株 (BECh2 得自米曲霉 JaL228, 该菌株是 如 WO 98/12300 所述以保藏的菌株米曲霉 IFP4177 为基础构建的 )。转化和培养条件根据 Christiansen 等, 1988, Biotechnology 6, 1419-1422 及如 WO 01/12794-A 第 63 页所述进 行。进行一轮再分离后, 用来自转化体的孢子接种 Nunc 管中的 10ml YP 葡萄糖或 YP 麦芽 糖, 并将培养物在 30℃下培育 3 天。
     将来自上述 10ml 培养物的 10 微升上清样品进行 SDS 凝胶电泳。用 SYPRO Orange Protein Gel Stain(Molecular Probes) 对凝胶染色。 数种曲霉转化体在 SDS 凝胶上具有显 著的条带。 通过在 pH 6.0 下进行 AZCL- 小麦阿拉伯木聚糖进一步分析这些阳性结果的木聚 糖酶活性。 在 0.2M 磷酸钠盐 (Na-phosphate) 缓冲液, pH 6.0+0.01% Triton-X 100 中将底 物即来自小麦的 AZCL- 阿拉伯木聚糖 (Megazyme) 制备为 0.2% w/v 的悬液。在 Eppendorf 热混合仪 (thermomixer) 中将 900 微升的底物预热到 37℃。向底物中加入 100 微升来自重 组宿主菌株 Bech2 的粗培养液上清或不同样品并在最大速度下在 37℃温育 15min。然后将 反应混合物在冰上放置 2 分钟, 在用 20,000xG 离心 1min。将 2x 200 微升的上清转移到微 量滴定板并在 OD590 测量。测定吸光度的增加作为活性。
     实施例 4 测定木聚糖酶活性
     活性的测定使用合适的缓冲液中的合成并分泌木聚糖酶的宿主株的培养液或细 胞裂解物。将合适体积的这样的样品点到琼脂平板上, 琼脂平板上含有不溶性的生色底物 TM AZCL-Birch 木聚糖 (Megazyme ) 和合适的缓冲液, 其 pH 为例如 4.5-7.5。在合适的温度, 例如 37℃下, 将平板温育合适的时间, 例如一天。活性可见为点周围的蓝色的晕圈 (halo)。
     实施例 5 测定过氧化物酶活性
     过氧化物酶可以使用如 Ishida 等 : 1987 所述的 2, 4- 二氯苯酚方法 (Ishida, A., N.Futamura 和 T.Matsusaka.1987.Detection of peroxidase acitvity and its localisation in the forespore envelopes of Bacillus cereus.J.Gen.Appl. Microbiol.33 : 27-32.) 用分光光度法来测定。作为指示剂, 可以使用 100mM 磷酸钾缓冲液 (pH 7.0) 中的 1.0mM 2, 4- 二氯苯酚和 82mM 的 4- 氨基安替比林 (aminoantipyrine) 的混 合物, 合适的底物是 100mM 磷酸钾缓冲液 (pH 7.0) 中的 50mM 过氧化氢 (Sigma)。
     将 200 微升合适地稀释的培养液上清加入 1ml 塑料比色皿。加入 200 微升指示剂 混合物。加入 200 微升过氧化氢底物启动反应。用标准的分光光度计在 510nm 处测量吸光 度的变化。
     实施例 6 测量对纤维素降解酶或酶混合物的纤维素降解促进作用
     某些分泌的蛋白质在纤维素降解酶或其混合物存在下显示纤维素降解的协同作 用 (synergistic action)。 这些分泌的蛋白质本身可具有或不具有水解酶活性。 在专利申 请号 US11/046,124 和相应的 2005 年 7 月 30 日公布的 PCT 申请 PCT/US2005/003525 中可以找到这样的分泌蛋白的例子和如何检测它们的纤维素降解促进作用, 特别是使用实施例 24 和 25-28 的任一项, 在此将其引入供参考。
     一种测定该促进作用的方法如下 : 将合成并分泌纤维素酶促进性多肽的宿主株 的培养液或细胞裂解物用装有截留为 10kDa 的 PM10 膜的 Amicon 搅拌小室 (Millipore, Billerica, MA) 浓缩后, 用 Econo-Pac 10DG 柱 (BioRad Laboratories, Hercules, CA) 脱 盐。用 BCA(bicinchoninic acid, P.K.Smith 等 1985, Anal.Biochem.150 : 76) 蛋白质测定 试剂盒 (Pierce, Rockford, IL) 使用 BSA 作为标准测定蛋白浓度后, 将这些多肽储液保存 在 -20℃。对这些多肽不作进一步纯化, 并根据测得的总蛋白将储液添加到反应混合物中。
     在美国能源部国立可再生能源实验室 (U.S.Department of Energy National Renewable Energy Laboratory(NREL)) 用稀硫酸预处理玉米秸秆。预处理使用下面的条 件: 1.4wt%的硫酸, 165℃和 107psi 下 8 分钟。根据 NREL, 预处理过的玉米秸秆 (PCS) 中 的水不溶性固体含有 56.5%纤维素, 4.6%半纤维素和 28.4%木质素。纤维素和半纤维素 是使用 NREL 标准分析程序 (NREL Standard Analytical Procedure)#002, 进行二阶段硫 酸水解后, 利用高效液相色谱测定进行糖分析而测定的。木质素是使用 NREL 标准分析程序 #003, 用硫酸水解纤维素和半纤维素级分后通过测量重量而测定的。在酶促水解前, 在玻 璃滤器上用大体积的去离子水” ish” 所述 PCS ; 得到水 “ish” 过的 PCS 的干重。通过在咖 啡磨 (coffee-grinder) 中粉碎, 然后在 22μm 的 Millipore 滤器 (6P Express Membrane, Stericup, Millipore, Bedford, MA) 上用去离子水 “ish” , 从水 “ish” 过的 PCS 制备粉碎的 PCS。
     PCS 的水解是用 1.1ml Immunoware 小管 (Pierce, Rockford, IL) 进行的, 所用的总 反应体积为 1.0ml。在该操作规程中, PCS(10mg/ml 于 50mM 乙酸钠 pH5.0 缓冲液中 ) 的水 解, 是在纤维素蛋白加样量的 3%的米曲霉 β- 葡糖苷酶 ( 根据 WO 02/095014 在米曲霉中 重组表达 ) 的存在下, 使用不同的蛋白质加样量 ( 表示为 mg 的酶每克 PCS) 的待测的本发 明的多肽或 Celluclast 1.5L 样品 (Novozymes A/S, Bagsvaerd, 丹麦 ) 来进行。本发明 的多肽的 PCS 水解能力的筛选在 50℃ (Isotemp 10S 水浴或 TS Autoflow CO2 夹层培养箱 ) 下进行。通常, 反应按一式四份进行并在水解过程中取等份样品。通过混合 20μl 等份的 每份水解物和 180μl 0.11M NaOH( 终止试剂 ) 来终止 PCS 水解反应。对每份试样作适当 的连续稀释, 并利用下述的适用于 96 孔微量培养板规格的对羟基苯甲酰肼 (PHBAH, Sigma, St.Louis, MO) 测定法测定还原糖含量。简单地说, 将 90μl 等份的适当稀释的样品置于 96 孔圆锥底微量培养板中。向各个孔中加入 2% NaOH 中的 1.5% (w/v)PHBAH 60μl。将板在 95℃不加盖加热 10 分钟。让板冷却到室温 (RT), 然后向各个孔加入 50μl 蒸馏水。从每 个孔转移 100μl 等份到平底 96 孔板中, 并用 SpectraMax Microplate Reader(Molecular Devices, Sunnyvale, CA) 测量 A410nm 的吸光度。用葡萄糖标准品 ( 用 0.4%氢氧化钠稀释 的, 0.1-0.0125mg/ml) 制作标准曲线以将所得的 A410nm 值转换为葡萄糖当量。 用所得的当量 计算每个反应的 PCS 纤维素转化百分率。
     纤维素转化为还原糖的程度 ( 转化率,% ) 用下面的等式计算 :
     转化率 (% ) = RS(mg/ml)*100*162/( 纤维素 (mg/ml)*180) =
     RS(mg/ml)*100/( 纤维素 (mg/ml)*1.111)
     在该式中, RS 是以葡萄糖当量 (mg/ml) 量度的溶液中的还原糖浓度, 因子 1.111 反映了纤维素转化为葡萄糖的重量增加。
     为了筛选能够促进 Celluclast 1.5L 性能的本发明的多肽, 进行 PCS 水解反应 (1.0ml 的操作规程, 10g PCS 每升, 50℃, 加入总加样量的 3%的米曲霉 β- 葡糖苷酶 ), 其 中将 2.5mg 酶加样量的 Celluclast 1.5L 与 2.5mg 多肽加样量的每个样品 ( 每个反应 5mg 酶加样量的总蛋白 )。测量了由 10mg 酶加样量, 5mg 酶加样量和 2.5mg 酶加样量组成的 Celluclast 1.5L 对照反应, 并记录它们的 PCS 纤维素转化率用于比较。
     实施例 7 测定脂肪酶活性
     活性测量使用合适的缓冲液中的合成并分泌脂肪酶的宿主株的培养液或细胞裂 解物。
     脂肪酶测定 (PNV 测定 ) : 用移液器将 20 微升的稀释缓冲液加到 96 孔微量培养板 的各个孔中。向该稀释缓冲液中加入 5 微升的样品 ( 上清 )。测试开始时, 向各个孔中加入 200 微升的底物, 并将板装到 ELISA 读板器 ( 能读取 96 孔板的可编程的分光光度计 ) 上。 每 30 秒测量一次 405nm 的吸光度, 测量 10 分钟。用时间对 abs405 曲线的斜率作为任意活 性单位。
     稀释缓冲液 : 25ml 2M Tris/HCl pH 7.5, 0.50ml 2M CaCl2, 2.5ml 15% Brij 35, 用水调节到 500ml。
     底物储备溶液 : 将 0.1295g(117 微 升 ) 的 戊 酸 对 硝 基 苯 酯 (p-Nitrophenyl valerate)SIGMA N 4377( 密度 1.11g/ml) 溶于 10ml 甲醇中。在冷冻装置中保存。
     底物 : 将 100 微升底物储备溶液与 10ml 稀释缓冲液混合。
     实施例 8 测定蛋白酶和肽酶活性
     在具有选定的肽酶活性最佳的 pH 缓冲液中的合成并分泌肽酶和 / 或蛋白酶的宿 主株的培养液或细胞裂解物, 其所述活性可以这样测定 : 将合适的样品体积 ( 例如 20 微 升 ) 点样在琼脂平板上, 其中该琼脂平板含有不溶性生色底物 AZCL- 酪蛋白 (MegazymeTM) 或 AZCL- 胶原 (MegazymeTM) 或 Azocoll(Sigma-Aldrich), 例如 0.1% w/w 的水平。在适合 于肽酶起作用的温度下, 例如 37℃下, 将平板温育合适的时间, 例如 1 天。活性可见为点周 围的蓝色晕圈。可以用非标记的胶原或非标记的酪蛋白来代替 AZCL- 酪蛋白和 AZCL- 胶原 (MegazymeTM)。 在被点样到琼脂平板的非标记的胶原或非标记的酪蛋白上, 有肽酶和 / 或蛋 白酶存在时形成清楚的区域。
     实施例 9 测定内切阿拉伯糖酶活性
     在具有选定的肽酶活性最佳的 pH 缓冲液中的合成并分泌阿拉伯糖酶的宿主株的 培养液或细胞裂解物, 其所述活性可以这样测定 : 将合适的样品体积 ( 例如 20 微升 ) 点样 在琼脂平板上, 其中该琼脂平板含有不溶性生色底物 AZCL- 阿拉伯聚糖, 例如 0.1% w/w 水 平。 在适合于阿拉伯糖酶起作用的温度下, 例如 37℃下, 将平板温育合适的时间, 例如 1 天。 活性可见为点周围的蓝色晕圈。
     该测定可以在不同的 pH 下进行。在酸性 pH 下, 可以通过将 0.1g AZCL- 阿拉伯聚 糖 (Mazurine 染色的交联底物, Megazyme, 爱尔兰 ) 溶于 100ml 0.2M 琥珀酸 pH3+10 微升 Triton X-100(0.01% ) 得到 0.1% AZCL- 阿拉伯聚糖终浓度, 来制备 AZCL- 阿拉伯聚糖。 在中性 pH 下, 可以通过将 0.1g AZCL- 阿拉伯聚糖 (Mazurine 染色的交联底物, Megazyme, 爱尔兰 ) 溶于 50ml 无菌水加 10 微升 Triton X-100(0.01% ) 中来制备 AZCL- 阿拉伯聚糖。然后在该 50ml AZCL 底物中加入 50ml 0.4M MOPS pH 7 得到 100ml 的终体积, 及 0.2M 缓冲 液, 0.1% AZCL 的终浓度。
     实施例 10 测定 β- 葡糖苷酶活性
     许 多 β- 葡 糖 苷 酶 可 能 对 4- 硝 基 苯 基 -β-D- 吡 喃 葡 萄 糖 苷 或 纤 维 二 糖 至 少 有 一 些 活 性, 尽 管 这 些 可 能 不 是 它 们 的 天 然 底 物。 用 非 常 敏 感 的 甲 基 伞 形 基 (methyl-umbiliferyl)β-D- 葡 萄 糖 苷 也 可 以 发 现 活 性。 一 般 而 言 可 以 使 用 任 何 (1, 4)-β- 及 (1, 3)-β- 寡葡萄糖苷 (oligoglucosides) 作为底物, 通过 Trinder 测定系统 (The Sigma Diagnostic Glucose(Trinder)Assay, Sigma, St.Louis, MO) 测量释放的葡萄 糖, 来评估 β- 葡糖苷酶活性。
     一种测定 β- 葡糖苷酶活性的方法是制备合成并分泌阿拉伯糖酶的宿主株的培 养液或细胞裂解物的制剂, 使所述制剂含有大约 6.9X 10-6 mg/ml 的总蛋白, 100mM 柠檬酸 钠 pH 5.0, 0.01 % Tween-20 和 4mM 的对硝基苯基 -β-D- 吡喃葡萄糖苷。在 50 ℃温育该 制剂, 并在 0.5、 1、 2、 3、 3.75 和 24 小时取等份试样。向各个等份试样中加入 1M 碳酸钠 pH 10.0, 然后由 405nm 的吸光度确定对硝基苯基阴离子的浓度。
     另一种 β- 葡糖苷酶活性的方法是 : 通过首先脱盐 (BioRad Econo-Pac 10DG 柱 ), 然后浓缩 (Centricon Plus-20, Biomax-5, 5kD 截留 ) 到 0.92mg/ml 的浓度 (BCA 测定系 统 ), 来制备合成并分泌阿拉伯糖酶的宿主株的培养液或细胞裂解物的制剂。 然后将该制剂 以 0.037 和 0.0092μg/ml 总蛋白与 100mM 柠檬酸钠 pH 5.0 加 0.01% Tween-20 中的 10mM 纤维二糖在 65℃下温育。在 0.5, 1, 2, 3, 4, 6 和 19 小时取等份试样。将等份试样煮沸 6 分 钟以终止反应, 然后使用 Trinder 测定系统 (Sigma Chemical Co., St.Louis, MO) 和葡萄糖 外标测定葡萄糖浓度。
     实施例 11 测定酯酶活性
     活性测定使用合适的缓冲液中的合成并分泌酯酶的宿主株的培养液或细胞裂解 物。当选择用于测定丝氨酸酯酶活性的底物时, 应当优先选择在酯酶被底物饱和时的浓度 下不形成胶束的底物, 以获得底物的最佳转化率。
     一种测试酯酶活性的方法是测量标准条件下, 例如 30℃、 pH7.0 下, 该酶水解三醋 精的碱消耗, 其中三醋精的浓度低于三醋精的 CMC, 碱消耗表示为时间的函数。酯酶水解三 醋精会释放乙酸, 这就需要加入碱来维持 pH 恒定为 7.0( 恒定 pH 法 ), 因此维持 pH 在 7.0 所需要的碱 ( 通常以氢氧化钠的形式 ) 的量就是被水解的三醋精酯键的量度。
     另一种测试酯酶活性的方式是测量酯酶水解 PNP 乙酸酯 ( 乙酸对硝基苯酯 ) 释放 有色的 PNP。用移液器将 20 微升的稀释缓冲液加到 96 孔微量滴定板的各个孔中。将 5 微 升样品 ( 培养液上清或过滤的细胞裂解物 ) 加入稀释缓冲液中。在测定开始时向每个孔中 加入 200 微升的底物并将板装到 ELISA 读板器 ( 能读取 96 孔板的可编程的分光光度计 ) 上。每 30 秒测量一次 405nm 的吸光度, 测量 10 分钟。用时间对 abs405 曲线的斜率作为任 意活性单位。
     稀释缓冲液 : 25ml 2M Tris/HCl pH 7.5, 0.50ml 2M CaCl2, 2.5ml 15% Brij 35, 用水调节到 500ml。
     底物储备溶液 : 将合适量的乙酸对硝基苯酯溶于 10ml 甲醇中。在冷冻装置中保 存。底物 : 将 100 微升底物储备溶液与 10ml 稀释缓冲液混合。52101942428 A CN 101942433
    序列表1/63 页
     53101942428 A CN 101942433序列表2/63 页
    54101942428 A CN 101942433序列表3/63 页
    55101942428 A CN 101942433序列表4/63 页
    56101942428 A CN 101942433序列表5/63 页
    57101942428 A CN 101942433序列表6/63 页
    58101942428 A CN 101942433序列表7/63 页
    59101942428 A CN 101942433序列表8/63 页
    60101942428 A CN 101942433序列表9/63 页
    61101942428 A CN 101942433序列表10/63 页
    62101942428 A CN 101942433序列表11/63 页
    63101942428 A CN 101942433序列表12/63 页
    64101942428 A CN 101942433序列表13/63 页
    65101942428 A CN 101942433序列表14/63 页
    66101942428 A CN 101942433序列表15/63 页
    67101942428 A CN 101942433序列表16/63 页
    68101942428 A CN 101942433序列表17/63 页
    69101942428 A CN 101942433序列表18/63 页
    70101942428 A CN 101942433序列表19/63 页
    71101942428 A CN 101942433序列表20/63 页
    72101942428 A CN 101942433序列表21/63 页
    73101942428 A CN 101942433序列表22/63 页
    74101942428 A CN 101942433序列表23/63 页
    75101942428 A CN 101942433序列表24/63 页
    76101942428 A CN 101942433序列表25/63 页
    77101942428 A CN 101942433序列表26/63 页
    78101942428 A CN 101942433序列表27/63 页
    79101942428 A CN 101942433序列表28/63 页
    80101942428 A CN 101942433序列表29/63 页
    81101942428 A CN 101942433序列表30/63 页
    82101942428 A CN 101942433序列表31/63 页
    83101942428 A CN 101942433序列表32/63 页
    84101942428 A CN 101942433序列表33/63 页
    85101942428 A CN 101942433序列表34/63 页
    86101942428 A CN 101942433序列表35/63 页
    87101942428 A CN 101942433序列表36/63 页
    88101942428 A CN 101942433序列表37/63 页
    89101942428 A CN 101942433序列表38/63 页
    90101942428 A CN 101942433序列表39/63 页
    91101942428 A CN 101942433序列表40/63 页
    92101942428 A CN 101942433序列表41/63 页
    93101942428 A CN 101942433序列表42/63 页
    94101942428 A CN 101942433序列表43/63 页
    95101942428 A CN 101942433序列表44/63 页
    96101942428 A CN 101942433序列表45/63 页
    97101942428 A CN 101942433序列表46/63 页
    98101942428 A CN 101942433序列表47/63 页
    99101942428 A CN 101942433序列表48/63 页
    100101942428 A CN 101942433序列表49/63 页
    101101942428 A CN 101942433序列表50/63 页
    102101942428 A CN 101942433序列表51/63 页
    103101942428 A CN 101942433序列表52/63 页
    104101942428 A CN 101942433序列表53/63 页
    105101942428 A CN 101942433序列表54/63 页
    106101942428 A CN 101942433序列表55/63 页
     7. 项 3 的多肽, 其中所述多肽是 GH10 木聚糖酶, 所述 GH10 木聚糖酶包含氨基酸序 列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获 得的 GH10 木聚糖酶具有至少 90%的同一性。
     8. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 2 的氨基酸 1-291 的 GH10 木聚糖 酶。
     9. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 2 的氨基酸 1-291 组成的 GH10 木聚 糖酶。 10. 项 3 的多肽, 其中所述多肽是 GH11 木聚糖酶, 所述 GH11 木聚糖酶包含氨基酸 序列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的 GH11 木聚糖酶具有至少 90%的同一性。
     11. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 4 的氨基酸 1-202 的 GH11 木聚糖 酶。
     12. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 4 的氨基酸 1-202 组成的 GH11 木聚 糖酶。
     13. 项 3 的多肽, 其中该多肽是丝氨酸酯酶, 所述丝氨酸酯酶包含氨基酸序列, 所 述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的丝 氨酸酯酶具有至少 90%的同一性。
     14. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 6 的氨基酸 1-352 的丝氨酸酯酶。
     15. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 6 的氨基酸 1-352 组成的丝氨酸酯 酶。
     16. 项 3 的多肽, 其中该多肽是脂肪酶, 所述脂肪酶包含氨基酸序列, 所述氨基酸 序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的丝氨酸酯酶 具有至少 90%的同一性。
     17. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 8 的氨基酸 1-431 的脂肪酶。
     18. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 8 的氨基酸 1-431 组成的脂肪酶。
     19. 项 3 的多肽, 其中该多肽是过氧化物酶, 所述过氧化物酶包含与可从以保藏登 录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的过氧化物酶具有至少 90%的同一 性的氨基酸序列。
     20. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 10 的氨基酸 1-185 的过氧化物酶。
     21. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 10 的氨基酸 1-185 组成的过氧化物
     11. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 4 的氨基酸 1-202 的 GH11 木聚糖 酶。
     12. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 4 的氨基酸 1-202 组成的 GH11 木聚 糖酶。
     13. 项 3 的多肽, 其中该多肽是丝氨酸酯酶, 所述丝氨酸酯酶包含氨基酸序列, 所 述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的丝 氨酸酯酶具有至少 90%的同一性。
     14. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 6 的氨基酸 1-352 的丝氨酸酯酶。
     15. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 6 的氨基酸 1-352 组成的丝氨酸酯 酶。
     16. 项 3 的多肽, 其中该多肽是脂肪酶, 所述脂肪酶包含氨基酸序列, 所述氨基酸 序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的丝氨酸酯酶 具有至少 90%的同一性。
     17. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 8 的氨基酸 1-431 的脂肪酶。
     18. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 8 的氨基酸 1-431 组成的脂肪酶。
     19. 项 3 的多肽, 其中该多肽是过氧化物酶, 所述过氧化物酶包含与可从以保藏登 录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的过氧化物酶具有至少 90%的同一 性的氨基酸序列。
     20. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 10 的氨基酸 1-185 的过氧化物酶。
     21. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 10 的氨基酸 1-185 组成的过氧化物
     酶。 22. 项 3 的多肽, 其中该多肽是 GH 61A 多肽, 所述 GH 61A 多肽包含氨基酸序列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的 GH 61A 多肽具有至少 90%的同一性。
     23. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 12 的氨基酸 1-218 的 GH 61A 多 肽。
     24. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 12 的氨基酸 1-218 组成的 GH 61A 多 肽。
     25. 项 3 的多肽, 其中该多肽是 GH 61B 多肽, 所述 GH 61B 多肽包含氨基酸序列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的 GH 61B 多肽具有至少 90%的同一性。
     26. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 14 的氨基酸 1-249 的 GH 61B 多 肽。
     27. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 14 的氨基酸 1-249 组成的 GH 61B 多 肽。
     28. 项 3 的多肽, 其中该多肽是 GH 61C 多肽, 所述 GH 61C 多肽包含氨基酸序列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的 GH 61C 多肽具有至少 90%的同一性。
     29. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 16 的氨基酸 1-255 的 GH 61C 多 肽。
     30. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 16 的氨基酸 1-255 组成的 GH 61C 多 肽。
     31. 项 3 的多肽, 其中该多肽是 GH 61D 多肽, 所述 GH 61D 多肽包含氨基酸序列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的 GH 61D 多肽具有至少 90%的同一性。
     32. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 18 的氨基酸 1-205 的 GH 61D 多 肽。
     33. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 18 的氨基酸 1-205 组成的 GH 61D 多 肽。
     34. 项 3 的多肽, 其中该多肽是 β- 葡糖苷酶, 所述 β- 葡糖苷酶包含氨基酸序列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的 β- 葡糖苷酶具有至少 90%的同一性。
     35. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 34 的氨基酸 1-603 的 β- 葡糖苷 酶。
     36. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 34 的氨基酸 1-603 组成的 β- 葡糖 苷酶。
     37. 项 3 的多肽, 其中该多肽是内切阿拉伯糖酶, 所述内切阿拉伯糖酶包含氨基酸 序列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的内切阿拉伯糖酶具有至少 90%的同一性。
     38. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 36 的氨基酸 1-301 的内切阿拉伯糖酶。 39. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 36 的氨基酸 1-301 组成的内切阿拉 伯糖酶。
     40. 项 3 的多肽, 其中该多肽是内切阿拉伯糖酶, 所述内切阿拉伯糖酶包含氨基酸 序列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的内切阿拉伯糖酶具有至少 90%的同一性。
     41. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 38 的氨基酸 1-438 的内切阿拉伯 糖酶。
     42. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 38 的氨基酸 1-438 组成的内切阿拉 伯糖酶。
     43. 项 3 的多肽, 其中该多肽是胃蛋白酶肽酶, 所述胃蛋白酶肽酶包含与可从以保 藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获得的胃蛋白酶肽酶具有至少 90% 的同一性的氨基酸序列。
     44. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 40 的氨基酸 1-396 的胃蛋白酶肽 酶。
    
    45. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 40 的氨基酸 1-396 组成的胃蛋白酶肽酶。 46. 项 3 的多肽, 其中该多肽是胃蛋白酶肽酶, 所述胃蛋白酶肽酶包含氨基酸序 列, 所述氨基酸序列与可从以保藏登录号 CBS 274.96 保藏的 Botryosphaeria rhodina 获 得的胃蛋白酶肽酶具有至少 90%的同一性。
     47. 项 3 的多肽, 其中该多肽是包含 SEQ ID NO : 42 的氨基酸 1-262 的胃蛋白酶肽 酶。
     48. 项 3 的多肽, 其中该多肽是由 SEQ ID NO : 42 的氨基酸 1-262 组成的胃蛋白酶 肽酶。
     49. 多核苷酸, 其包含编码项 3 中所定义的多肽的核苷酸序列。
     50. 核酸构建体, 其包含项 49 中定义的核苷酸序列, 该核苷酸序列与一种或多种 指导所述多肽在宿主细胞中生产的调控序列可操作地连接。
     51. 重组表达载体, 其包含项 50 的核酸构建体。
     52. 重组宿主细胞, 其包含项 50 的核酸构建体。
     53. 生产项 3 的多肽的方法, 其包括 :
     a. 培养菌株以产生所述多肽, 其中所述菌株的野生型形式能够产生该多肽 ; 及
     b. 回收该多肽。
     54. 生产项 3 的多肽的方法, 其包括 :
     a. 在有助于产生所述多肽的条件下, 培养项 52 中定义的重组宿主细胞 ; 及
     b. 回收该多肽。
     55. 组合物, 其包含项 3 的多肽和赋形剂。
     56. 制备项 55 的组合物的方法, 其包含将项 1 的多肽与赋形剂混合。
     57. 适于在电子设备中使用的存储介质, 所述电子设备包含项 3 的多肽的氨基酸
     序列的信息。
     58. 适于在电子设备中使用的存储介质, 所述电子设备包含项 49 的多核苷酸的核 酸序列的信息。
     序列表
     本发明包含序列表形式的信息, 其附于本申请中并在连同本申请的数据载体上提 交。数据载体的内容全部通过引用并入本文。选自 SEQ ID NO : 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39 和 41 的序列的编码成熟多肽的区域, 分别编码选自 SEQ ID NO : 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42 的序列的 成熟多肽。 因此 SEQ ID NO : 1 的编码成熟多肽的区域编码 SEQ ID NO : 2 中包含的成熟多肽 序列, SEQ ID NO : 3 的编码成熟多肽的区域编码 SEQ ID NO : 4 中包含的成熟多肽序列, 依此 类推。 附图说明
     图 1 显示 pSigA4 的质粒图。
     发明详述 定义
     如以下所用的, 术语 “ADNA 组” 指由 SEQ ID NO : 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39 和 41 组成的核苷酸序列的组。因此, 当提到包含于或选自 由 “ADNA 组” 组成的序列组 ( 或包含于或选自 “ADNA 组” ) 的核苷酸序列时, 是指该序列包含 于或选自由 SEQ ID NO : 1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39 和 41 组成的核苷酸序列的组。
     如以下所用的, 术语 “EDNA 组” 指由 SEQ ID NO : 1, 3, 5, 7, 9, 11, 13, 15, 17, 33, 35, 37, 39 和 41 组成的核苷酸序列的组。因此, 当提到包含于或选自由 “EDNA 组” 组成的序列组 ( 或 包含于或选自 “EDNA 组” ) 的核苷酸序列时, 是指该序列包含于或选自由 SEQ ID NO : 1, 3, 5, 7, 9, 11, 13, 15, 17, 33, 35, 37, 39 和 41 组成的核苷酸序列的组。
     类似地, 如以下所用的, 术语 “B 多肽组” 指由 SEQ ID NO : 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40 和 42 组成的多肽序列的组。因此, 当提到包含于或 选自由 “B 多肽组” 组成的序列组 ( 或包含于或选自 “B 多肽组” ) 的多肽序列时, 是指该序列包 含于或选自由 SEQ ID NO : 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40 和 42 组成的多肽序列的组。
     类似地, 如以下所用的, 术语 “D 多肽组” 指由 SEQ ID NO : 2, 4, 6, 8, 10, 12, 14, 16, 18, 34, 36, 38, 40 和 42 组成的多肽序列的组。因此, 当提到包含于或选自由 “D 多肽组” 组成的序 列组 ( 或包含于或选自 “D 多肽组” ) 的多肽序列时, 是指该序列包含于或选自由 SEQ ID NO : 2, 4, 6, 8, 10, 12, 14, 16, 18, 34, 36, 38, 40 和 42 组成的多肽序列的组。
     本文中使用的术语 “同一性” 理解为两条氨基酸序列或两条核苷酸序列之间的同 源性。对于本发明而言, 同一性程度是使用 Vector NTI 程序 7.1 版 (Informax inc., 7600 Wisconsin Avenue, Suite #1100, Bethesda, MD 20814, USA) 的 AlignX 确定的。氨基酸比 对使用 Clustal W 算法 (Thompson, J.D., Higgins, D.G. 和 Gibson, T.J.(1994)CLUSTAL W : improving the sensitivity of progressive multiple sequence alignment through
     sequence weighting, positions-specific gap penalties and weight matrix choice. Nucleic Acids Research, 22 : 4673-4680) 来生成。 还使用下面的参数 : 缺口生成罚分 (gap opening penalty) 为 10, 缺口延伸罚分 (gap extension penalty) 为 0.05, 缺口分离罚 分范围 (gap separation penalty range) 为 8。配对比对 (pairwise alignment) 参数 为 Ktuple = 1, 缺口罚分 (gap penalty) = 3, 缺口长度生成罚分 (gap length opening penalty) = 10, 缺口延伸罚分= 0.1, 窗口大小 (window size) = 5, 对角线 (diagonals) = 5。 两条核苷酸序列之间同一性程度的确定也是使用如上所述的相同算法和软件包, 例如 用下列的设定 : 缺口罚分为 10, 缺口长度罚分为 10。配对比对参数为 Ktuple = 3, 缺口罚 分= 3, 窗口= 20。
     在本发明的范围内, 术语 “功能性多肽” (functional polypeptide) 是指这样的 多肽, 其可被细胞表达和分泌, 并且构成能够根据其按照细胞设计应实现的功能来运作的 操作单元。可选地, 该多肽要具备预定的功能可能需要辅因子 (co-factors)。功能性多肽 的一个例子是具有催化活性的多肽或酶, 其帮助细胞催化细胞周围环境中的反应。另外的 例子有充当信号物质的多肽。另外的例子还有行使针对环境参数 ( 细胞周围环境中的化学 物质 ) 的传感物 ( 受体 ) 功能的多肽, 或具有抗别的生物的活性的多肽 ( 抗微生物 ( 多 ) 肽 ), 或对细胞的结构完整性作贡献的多肽。 在 本 文 中, 关于氨基酸序列或多肽的部分使用的术语 “成 熟 区 域” (mature region) 是 指 氨 基 酸 序 列 或 多 肽 中 作 为 成 熟 的 功 能 性 多 肽 的 部 分 (portion)、 区域 (region)、 域 (domain) 或区段 (section)。
     本文中使用的术语 “编码成熟多肽的核苷酸序列” 是指从编码成熟多肽的第一个 氨基酸的三联体算起, 直到编码成熟多肽的最后一个氨基酸的三联体的区域。
     在本文中, 关于本发明的特定酶使用的术语 “GH” , 例如 “GH10” , 是由 B.Henrissat 建立的糖基水解酶 (glycosyl hydrolase enzymes) 的家族分类系统。 GH 后面的数字指不同 的家族。 该分类系统对本领域技术人员而言是熟知的。 见 Henrissat B., A classification of glycosyl hydrolases based on amino-acid sequence similarities, Biochem. J.280 : 309-316(1991) ; Henrissat B., Bairoch A, New families in the classification of glycosyl hydrolases based on amino acid sequence similarities, Biochem. J.293 : 781-788(1993) ; Henrissat B., Bairoch A., Updating the sequence-based classification of glycosyl hydrolases, Biochem.J.316 : 695-696(1996) ; Davies G., Henrissat B., Structures and mechanisms of glycosyl hydrolases, Structure 3 : 853-859(1995)。
     本发明的多肽
     本发明的多肽都是被 Botryosphaeria rhodina CBS 274.96 分泌, 以为该特定细 胞执行功能的多肽。
     在 Botryosphaeria rhodina CBS 274.96 基因组中有数千个可能的基因, 其中, 该 基因组的多核苷酸编码 21 种 B 多肽组中所包括的分泌的功能性成熟多肽, 这些多肽已被鉴定 为功能性的, 并被所选的宿主细胞翻译成功能性多肽并分泌。
     因此, Botryosphaeria rhodina CBS 274.96 表达并分泌 B 多肽组中所包括的功能 性成熟多肽, 而且在该特定菌株的基因组中, ADNA 组的序列的编码成熟多肽的区域, 是编码 B
     12101942428 A CN 101942433多肽说明书11/50 页组序列中所包括的成熟多肽的基因。另外在特定的实施方案中, 当培养用包含 ADNA 组的 序列的编码成熟多肽的区域的多核苷酸转化的大肠杆菌 (E.coli) 宿主时, 所有编码 B 多肽组 中所包括的成熟多肽的基因都可以表达, 而且它们相应的成熟多肽可以被分泌。通过比较 这 21 个多肽序列的序列与已知序列的同源性或同一性, 标定了这些多肽的具体功能。 这 21 种分泌的功能性多肽中的至少 14 种被确定是酶和 / 或类似酶。
     因此, 本发明提供选自下列的分离多肽 :
     (a) 具有氨基酸序列的多肽 : 所述氨基酸序列与选自 B 多肽组中所包括的成熟多肽 的氨基酸序列具有至少 90%的同一性 ;
     (b) 由核苷酸序列编码的多肽 : 所述核苷酸序列在高度严紧条件下与选自下列的 多核苷酸探针杂交 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列选自 ADNA 组序列的编码成熟多肽的区 域;
     (ii) 核苷酸序列所包含的 cDNA 序列的互补链, 所述核苷酸序列选自 ADNA 组序列的 编码成熟多肽的区域 ;
     其中该多肽显示相应的 B 多肽组的成熟多肽序列的功能。
     在一个具体的实施方案中, 本发明的多肽选自由本发明人分离并以 CBS 保藏登录 号 (accession No.)274.96 保藏的 Botryosphaeria rhodina 所分泌的酶, 即由木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖 苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶组成的酶组。
     本发明还提供选自下列的分离的酶 :
     (a) 包含这样的氨基酸序列的酶, 所述氨基酸序列与选自以 CBS 保藏号 274.96 保 藏的 Botryosphaeria rhodina 菌株所分泌的木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶 肽酶组成的组中的成熟酶的氨基酸序列具有至少 90%的同一性。
     (b) 由核苷酸序列编码的多肽, 该核苷酸序列在高度严紧条件下与选自下列的多 核苷酸探针杂交 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列包含于以 CBS 保藏号 274.96 保藏的 Botryosphaeria rhodina 菌株中, 并编码成熟酶, 该成熟酶选自该菌株所分泌的木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖 苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶,
     (ii) 核苷酸序列所含 cDNA 序列的互补链, 所述核苷酸序列包含于以 CBS 保藏号 274.96 保藏的 Botryosphaeria rhodina 菌株中, 并编码成熟酶, 该成熟酶选自该菌株所分 泌的木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶 ;
     其中所述酶具有选自木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多 肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶的功能。
     在一个具体的实施方案中, 所述酶是选自下列的分离的酶 :
     (a) 具有与下述氨基酸序列具有至少 90%的同一性的氨基酸序列的酶, 所述氨基 酸序列选自 D 多肽组的序列中所包含的成熟酶 ;(b) 由核苷酸序列编码的酶, 该核苷酸序列在高度严紧条件下与多核苷酸探针杂 交, 所述多核苷酸探针选自 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列选自 EDNA 组序列的编码成熟酶的区域 ;
     (ii) 核苷酸序列所包含的 cDNA 序列的互补链, 所述核苷酸序列选自 EDNA 组序列的 编码成熟酶的区域 ;
     其中该酶显示相应的 D 多肽组的成熟酶的功能。
     本发明的多肽是分离多肽, 优选地, 本发明的多肽的制剂包含最多 90 重量%的可 能与之天然地相伴随的其他多肽物质 ( 更低百分比的其他多肽物质是优选的, 例如最多 80 重量%, 最多 60 重量%, 最多 50 重量%, 最多 40 重量%, 最多 30 重量%, 最多 20 重量%, 最 多 10 重量%, 最多 9 重量%, 最多 8 重量%, 最多 7 重量%, 最多 6 重量%, 最多 5 重量%, 最 多 4 重量%, 最多 3 重量%, 最多 2 重量%, 最多 1 重量%, 及最多 1/2 重量% )。因此, 优选 本发明的分离多肽为 92%纯, 即本发明的多肽构成制剂中存在的所有多肽物质的至少 92 重量%, 且优选更高的重量百分比, 例如至少 94%纯, 至少 95%纯, 至少 96%纯, 至少 96% 纯, 至少 97%纯, 至少 98%纯, 至少 99%纯, 及至多 99.5%纯。特别地本发明的多肽优选是 基本上纯的形式。具体而言, 优选地, 所述多肽是 “基本上 (essentially) 纯的形式” , 即多 肽制备物基本上不含与该多肽天然相伴随的其它多肽物质。 这可通过例如采用熟知的重组 方法制备多肽来实现。
     本发明的多肽可以是合成制造的, 天然存在的, 或其组合。 在一个具体的实施方案 中, 本发明的多肽可以从微生物, 例如原核细胞, 古细菌细胞或真核细胞得到。这些细胞还 可以是已通过基因工程改变的。
     在一个具体的实施方案中, 本发明的多肽是这样的酶, 其在约 10℃到约 80℃, 具 体是在约 20℃到约 60℃的温度下显示最佳酶活性。
     在一个具体的实施方案中, 本发明的多肽是这样的酶, 其在高至 100℃, 具体是高 至 80℃, 更具体是高至 60℃的温度下是功能上稳定的。
     在一个具体的实施方案中, 本发明的多肽是这样的酶, 其显示选自 B 多肽组所包括 的成熟酶的酶的至少 20%, 具体是至少 40%, 例如至少 50%, 具体是至少 60%, 例如至少 70%, 更具体是至少 80%, 例如至少 90%, 更具体是至少 95%, 例如至少 100%的酶活性。
     在一个具体的实施方案中, 本发明的多肽包括, 含有, 或由这样的氨基酸序列组 成: 该氨基酸序列与选自 B 多肽 组所包括的成熟酶的多肽序列具有至少 90 %的同一性, 特 别是至少 95%, 例如至少 96%, 例如至少 97%, 更具体为至少 98%, 例如至少 99%或甚至 100%的同一性。
     在一个具体的实施方案中, 本发明的多肽包括, 含有, 或由这样的氨基酸序列组 成: 该氨基酸序列与选自 B 多肽组所包括的成熟酶的多肽序列具有至少 50%的同一性, 具体 是至少 60%, 具体是至少 65%, 具体是至少 70%, 具体是至少 75%, 具体是至少 80%或更具 体是至少 85%的同一性。
     在一个具体的实施方案中, 本发明的多肽的氨基酸序列与 B 多肽组所包括的成熟酶 具有最多 10 个氨基酸 ( 例如 10 个氨基酸 ), 具体是最多 5 个氨基酸 ( 例如 5 个氨基酸 ), 例如最多 4 个氨基酸 ( 例如 4 个氨基酸 ), 例如最多 3 个氨基酸 ( 例如 3 个氨基酸 ), 具体 是最多 2 个氨基酸 ( 例如 2 个氨基酸 ), 例如 1 个氨基酸的不同。本发明的多肽可以是从天然来源, 例如 Botryosphaeria rhodina CBS 274.96 株 或其他野生型株分离的野生型多肽, 但本发明也涵盖这样的人工变体, 其中本发明的多肽 被突变, 例如通过在保持该多肽的功能和 / 或其他性质的同时, 对所述多肽添加, 置换和 / 或缺失一个或多个氨基酸。
     因此, 本发明的多肽可以是人工变体, 其中, 包含由 B 多肽组所包括的成熟酶, 或由 其所组成的氨基酸序列至少发生了一个氨基酸的置换, 缺失和 / 或插入。
     本发明的多肽还包括本文所述的氨基酸序列的功能性片段和编码本文所述 的氨基酸序列的功能性片段的核酸, 包括如本文所述的以 CBS 保藏号 274.96 保藏的 Botryosphaeria rhodina 株分泌的成熟酶的片段, 包括从所述以 CBS 保藏号 274.96 保藏 的 Botryosphaeria rhodina 株分泌的木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶中选 择的酶的片段。
     人工变体可以使用本领域已知的标准技术构建, 通常随后进行筛选和 / 或性质鉴 定。 标准技术包括经典的诱变, 例如通过对细胞进行紫外照射或用化学诱变剂处理细胞, 如 Gerhardt 等 (1994) 所述的 ; 体内基因改组 (shuffling), 如 WO 97/07205 所述的, 体外改 组, 如 Stemmer, (1994) 或 WO95/17413 所述的, 随机诱变, 如 Eisenstadt E. 等 .(1994) 所述 的; PCR 技术, 例如 Poulsen 等 (1991) 所述的 ; 家族改组 (family shuffling), 如 J.E.Ness 等, Nature Biotechnology, vol.17, pp.893-896(1999) 所述的 ; 定点诱变, 如 Sambrook 等 (1989), Molecular Cloning, A Laboratory Manual, Cold Spring Harbor, NY 所述的。关 于核苷酸置换的一般性描述可见 Ford 等, 1991, Protein Expression and Purification 2, p.95-107。
     这样的标准基因工程方法还可以用来从编码一种或多种本发明的亲本酶 (parent enzyme) 的基因制备多样性的变体核苷酸序列文库, 在合适的宿主细胞中表达这些酶变 体, 并选择合适的变体。多样性的文库可以用多种本领域已知的方法建立 (Reetz MT ; Jaeger KE, 于 Biocatalysis-from Discovery to Application, Fessner WD 编, Vol.200, pp.31-57(1999) ; Stemmer, Nature, vol.370, p.389-391, 1994 ; Zhao 和 Arnold, Proc. Natl.Acad.ScL, USA, vol.94, pp.7997-8000, 1997 ; 或 Yano 等, Proc.Natl.Acad.ScL, USA, vol.95, pp 5511-5515, 1998)。
     在本发明的一个优选的实施方案中, ( 人工变体和野生型酶中的 ) 氨基酸的改变 从性质上说是轻微的, 即其是 : 不显著影响蛋白质的折叠和 / 或活性的保守性的氨基酸置 换; 小的缺失, 通常为 1 到大约 30 个氨基酸 ; 小的氨基或羧基末端延伸, 例如氨基末端的甲 硫氨酸残基 ; 长达大约 20-25 个残基的小接头肽 ; 或通过改变净电荷或其他功能而有助于 纯化的小段延伸 (small extension), 诸如多组氨酸序列段 (poly-histidine tract)、 抗原 性表位 (antigenic epitope)、 或结合域 (binding domain)。
     下面各组中是保守性置换的例子 : 碱性氨基酸 ( 精氨酸、 赖氨酸和组氨酸 )、 酸性 氨基酸 ( 谷氨酸和天冬氨酸 )、 极性氨基酸 ( 谷氨酰胺和天冬酰胺 )、 疏水性氨基酸 ( 亮氨 酸、 异亮氨酸、 缬氨酸和甲硫氨酸 )、 芳香族氨基酸 ( 苯丙氨酸、 色氨酸和酪氨酸 )、 和小氨基 酸 ( 甘氨酸、 丙氨酸、 丝氨酸和苏氨酸 )。一般情况下不改变或损害蛋白质功能的氨基酸置 换是本领域已知的, 例如 H.Neurath 和 R.L.Hill 在 The Proteins 中所述 (1979, AcademicPress, New York)。最常发生的取代是 Ala/Ser、 Val/Ile、 Asp/Glu、 Thr/Ser、 Ala/Gly、 Ala/ Thr、 Ser/Asn、 Ala/Val、 Ser/Gly、 Tyr/Phe、 Ala/Pro、 Lys/Arg、 Asp/Asn、 Leu/Ile、 Leu/Val、 Ala/Glu、 和 Asp/Gly, 以及上述反向的置换。
     在一个具体的实施方案中, 所述氨基酸改变具有这样的性质, 使得多肽的物理化 学特性被改变。例如, 所进行的氨基酸改变可提高酶的热稳定性、 改变底物特异性、 改变最 佳 pH 等等。
     具体地, 在本发明的多肽, 特别是选自 B 多肽组中所包含的成熟多肽的那些多肽中, 产生人工变体的所述置换、 缺失和 / 或插入的数目最多为 10, 如最多 9, 例如最多 8, 更优选 最多 7, 例如最多 6, 例如最多 5, 最优选最多 4, 例如最多 3, 如最多 2, 特别是最多 1。
     在一个具体的实施方案中所述人工变体是这样的变体, 其在包括人的动物中, 与 亲本酶相比, 具有改变的、 优选减少的免疫原性, 特别是变应原性。术语 “免疫原性” 在本文 中应理解为人工变体当被施用于动物, 包括通过静脉内、 皮肤、 皮下、 口服和气管内施用于 动物时, 引起改变的、 特别是减少的免疫反应的能力。术语 “免疫反应” 在本文中指该人工 变体的施用造成该动物体内免疫球蛋白例如 IgE、 IgG 和 IgM 的水平的改变, 或该动物体内 细胞因子水平的改变。定位 (mapping) 蛋白质的免疫原性 / 抗原性表位的方法、 制备具有 改变的免疫原性的抗体及测量免疫反应的方法在本领域是公知的, 且在例如 WO 92/10755、 WO 00/26230、 WO 00/26354 和 WO 01/31989 中有描述。本文中术语 “变应原性” 理解为该 人工变体造成动物中 IgE 生产的改变特别是减少的能力, 以及结合来自该动物的 IgE 的能 力。特别地, 由于对动物气管内使用所述多肽变体而产生的变应原性 ( 又称呼吸性变应原 性 (respiratory allergenicity)) 是本文特别感兴趣的。
     在另一个实施方案中, 本发明的多肽是由这样的核苷酸序列编码的多肽, 该核苷 酸序列在至少高度严紧的条件, 特别是极高度严紧条件下, 与选自下列的多核苷酸探针杂 交:
     (i) 核苷酸序列的互补链, 所述核苷酸序列选自 ADNA 组序列的编码成熟多肽的区 域;
     (ii) 核苷酸序列中所含的 cDNA 序列的互补链, 所述核苷酸序列选自 ADNA 组序列的 编码成熟多肽的区域 ;
     (iii)(i) 或 (ii) 的编码分泌多肽的片段, 所述分泌多肽具有 B 多肽组中所包含的 相应成熟多肽的功能。
     (J.Sambrook , E.F.Fritsch , 和 T.Maniatus , 1989 , Molecular Cloning , A Laboratory Manual, 第二版, Cold Spring Harbor, New York)。
     特别地, 本发明的多肽被包含这样的核苷酸序列的多核苷酸所编码, 所述核苷酸 序列选自 : ADNA 组序列的编码成熟多肽的区域, 或者与其由于遗传密码的简并性而相异的序 列。更具体地, 本发明的多肽被由这样的核苷酸序列组成的多核苷酸所编码, 所述核苷酸 序列选自 : ADNA 组序列的编码成熟多肽的区域, 或者与其由于遗传密码的简并性而相异的序 列。
     ADNA 组的序列的编码成熟多肽的区域的核苷酸序列或其子序列, 以及 B 多肽组中包 含的成熟多肽的氨基酸序列或其片段, 可以用来设计多核苷酸探针, 以根据本领域熟知的 方法, 从不同属或种的株系中鉴定和克隆编码本发明的酶的 DNA。特别地, 这样的探针可以用来根据标准的 Southern 印迹程序与目标属或种的基因组或 cDNA 杂交, 以鉴定和分离其 中的相应基因。这样的探针可以显著地短于整个序列, 但长度应该为至少 15, 优选至少 25, 更优选至少 35 个核苷酸, 例如长度为至少 70 个核苷酸。但是优选该多核苷酸探针为至少 100 个核苷酸长。例如, 该多核苷酸探针可为至少 200 个核苷酸长, 至少 300 个核苷酸长, 至少 400 个核苷酸长, 或至少 500 个核苷酸长。还可以用更长的探针, 例如至少 600 个核苷 酸长, 至少 700 个核苷酸长, 至少 800 个核苷酸长, 或至少 900 个核苷酸长的多核苷酸探针。 3 35 DNA 和 RNA 探针都可以使用。探针通常进行标记来检测相应的基因 ( 例如用 32P、 H、 S、 生 物素、 或抗生物素蛋白 )。
     因此, 可从这样的其它生物体制备的基因组 DNA 或 cDNA 文库中筛选与上述探针发 生杂交、 且编码本发明的酶的 DNA。来自这样的其它生物体的基因组或其它 DNA 可通过琼 脂糖或聚丙烯酰胺凝胶电泳或其它分离技术来分离。可将来自文库的 DNA 或分离的 DNA 转 移到并固定在硝酸纤维素或其它适宜的载体材料上。为了鉴定与选自 ADNA 组序列中编码成 熟多肽的区域的核苷酸具有所需的同源性和 / 或同一性, 或与之同源和 / 或同一的克隆或 DNA, 在 Southern 印迹中使用带有固定的 DNA 的载体材料。
     对本发明而言, “杂交” 意味着所述核苷酸序列与标记的多核苷酸探针杂交, 所述 探针在高度到极高度严紧条件下与选自 ADNA 组的序列编码成熟多肽的区域的核苷酸序列杂 交。在这些条件下与多核苷酸探针杂交的分子可以用 X 射线胶片或本领域已知的任何方法 来检测。本文中无论何时使用术语 “多核苷酸探针” 时, 应理解这样的探针含有至少 15 个 核苷酸。
     在一个感兴趣的实施方案中, 所述多核苷酸探针是选自 ADNA 组的序列的编码成熟 多肽的区域的核苷酸序列的互补链。
     在另一个感兴趣的实施方案中, 所述多核苷酸探针是编码选自 B 多肽组的酶的核苷 酸序列的互补链。在另一个感兴趣的实施方案中, 所述多核苷酸探针是核苷酸序列的成熟 多肽编码区域的互补链, 所述核苷酸序列选自 ADNA 组的序列的编码成熟多肽的区域。
     对于长度为至少 100 个核苷酸的长探针来说, 高度至极高度的严紧条件定义为遵 循标准 Southern 印迹程序, 于 42℃, 在 5X SSPE、 5X Darhardt’ s 溶液、 1.0% SDS、 100μg/ ml 经剪切且经变性的鲑精 DNA 中进行预杂交和杂交。优选地, 所述至少 100 个核苷酸的长 探针不含有多于 1000 个核苷酸。 对于长度为至少 100 个核苷酸的长探针来说, 最后在 60℃ 下用 0.1x SSC、 0.1 % SDS( 高严紧度 ) 洗涤 3 次, 每次 15 分钟 ; 特别是在 68 ℃下用 0.1x SSC、 0.1% SDS( 极高严紧度 ) 洗涤 3 次, 每次 15 分钟。
     虽然不是特别优选的, 还考虑可以使用更短的探针, 例如长为大约 15 到 99 个核苷 酸的探针, 例如长为约 15 到约 70 个核苷酸。对于这样的短探针, 严紧条件定义为遵循标准 Southern 印迹程序, 在比根据 Bolton 和 McCarthy(1962, Proceedings of the National Academy of Sciences USA 48 : 1390) 的计算方法算得的 Tm 值低大约 5℃至大约 10℃的温 度下, 在 0.9M NaCl、 0.09M Tris-HCl pH7.6、 6mM EDTA、 0.5% NP-40、 1X Denhardt’ s 溶液、 1mM 焦磷酸钠、 1mM 磷酸二氢钠 (sodium monobasic phosphate)、 0.1mM ATP、 和 0.2mg/ml 酵 母 RNA 中进行预杂交、 杂交和杂交后清洗。
     对于长度为大约 15 个核苷酸至大约 99 个核苷酸的短探针来说, 在比 Tm 计算值低 大约 5℃至 10℃的温度下, 将载体材料用 6X SCC 加 0.1% SDS 洗涤 1 次 15 分钟, 然后用 6XSSC 洗涤两次, 每次 15 分钟。
     SEQ ID NO : 2 木聚糖酶 GH10
     在一个特定的实施方案中, 本发明的多肽是包含或由这样的氨基酸序列组成的 GH10 木聚糖酶, 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的 GH10 木聚糖酶, 更具体是 SEQ ID NO : 2 中包含的成熟 GH10 木聚糖酶具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体 是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。更具体 地, 所述成熟 GH10 木聚糖酶包含或由 SEQ ID NO : 2 第 1 到 291 位的序列组成。在本文中, GH10 木聚糖酶定义为属于 EC 3.2.1.8 酶活类群的酶。该类群内切水解 (endohydrolyse) 木聚糖中的 1, 4-β-D- 木糖苷键。糖苷水解酶家族 10(GH10) 还包括具有另外两种已知活 性的酶 ; 内切 -1, 3-β- 木聚糖酶 (EC : 3.2.1.32) ; 纤维二糖水解酶 (EC : 3.2.1.91)。
     SEQ ID NO : 4 木聚糖酶 GH11
     在一个特定的实施方案中, 本发明的多肽是包含或由这样的氨基酸序列组成的 GH11 木聚糖酶, 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的 GH11 木聚糖酶, 更具体是 SEQ ID NO : 4 中包含的成熟 GH11 木聚糖酶具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具 体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。更 具体地, 所述成熟 GH11 木聚糖酶包含或由 SEQ ID NO : 4 第 1 到 202 位的序列组成。在本 文中, GH11 木聚糖酶定义为属于 EC 3.2.1.8 酶活类群的酶。该类群内切水解木聚糖中的 1, 4-β-D- 木糖苷键。糖苷水解酶家族 11(GH11) 包括只具有一种已知活性的酶 ; 木聚糖酶 (EC : 3.2.1.8)。
     SEQ ID NO : 6 丝氨酸酯酶
     在一个特定的实施方案中, 本发明的多肽是丝氨酸酯酶, 具体是包含或由这样的 氨基酸序列组成的角质酶或脂肪酶或羧基酯酶 (carboxyesterase) : 所述氨基酸序列与 可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的丝氨酸酯酶, 更具体是 SEQ ID NO : 6 中包含的成熟丝氨酸酯酶具有至 少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更 具体是至少 99%, 或最具体是 100%的同一性。更具体地, 所述成熟丝氨酸酯酶包含或由 SEQ ID NO : 6 第 1 到 352 位的序列组成。在本文中, 丝氨酸酯酶定义为能够水解溶液中的 可溶性酯类 ( 非胶束 (micelle) 形式的酯类 ) 的酶。更具体地, 丝氨酸酯酶是充当角质酶 (EC 3.1.1.50) 或脂肪酶 (EC.3.1.1.3) 或羧基酯酶, 能够水解蜡 - 脂类 (wax-esters)、 角 质、 三酰基脂肪 (tracyl fats), 油和 / 或脂肪酸链。 具体地, 所述丝氨酸酯酶含有经典的丝 氨酸水解酶 Ser、 His、 Asp 三联体, 例如三酰基脂肪酶 / 角质酶。
     SEQ ID NO : 8 假丝酵母 B 型脂肪酶
     在一个特定的实施方案中, 本发明的多肽是假丝酵母 (candida)B 型脂肪酶 (EC 3.1.1.3), 其包含或由这样的氨基酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的假丝 酵母 B 型脂肪酶, 更具体是 SEQ ID NO : 8 中包含的假丝酵母 B 型脂肪酶具有至少 90 %, 具体是至少 95%, 更具体是至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。更具体地, 所述成熟假丝酵母 B 型脂肪酶包含或 由 SEQ ID NO : 8 第 1 到 431 位的序列组成。在本文中, 假丝酵母 B 型脂肪酶 (Candida B type lipase) 定义为能够将甘油三酸酯 (triglycerides) 水解为二酰基甘油酯 (diacyl glycerides) 和脂肪酸阴离子, 特别是将三酰基甘油水解为二酰基甘油和脂肪酸阴离子的 酶。
     SEQ ID NO : 10 过氧化物酶
     在一个特定的实施方案中, 本发明的多肽是过氧化物酶, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的过氧化物酶, 更具体是 SEQ ID NO : 10 中包含的过氧化物酶具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。 更具体地, 所述 成熟过氧化物酶包含或由 SEQ ID NO : 10 第 1 到 185 位的序列组成。在本文中, 过氧化物酶 定义为属于能够催化氧化 - 还原反应的酶类的酶。因此, 它们被归类为氧化还原酶。它们 的正式 EC 号为 1.11.1。过氧化物酶将 H2O2 还原为水, 而氧化多种底物。因此, 过氧化物酶 是利用 H2O2 作为电子受体来催化不同氧化反应的氧化还原酶。
     SEQ ID NO : 12 GH61A 多肽
     在一个特定的实施方案中, 本发明的多肽是 GH61A 多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的 GH61A 多肽, 更具体是 SEQ ID NO : 8 中包含的 GH61A 多肽具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。 更具体地, 所述 成熟 GH61A 多肽包含或由 SEQ ID NO : 12 第 1 到 218 位的序列组成。在本文中, GH61A 多肽 定义为提供选自下列的一组或多组效应的分泌多肽或蛋白质 :
     1) 当与纤维素酶或纤维素酶混合物联合使用时, 促进纤维质 (cellulosic) 材料 的降解。
     2) 增加酶的溶解性。
     3) 增加酶的稳定性。
     4) 减少酶抑制。
     SEQ ID NO : 14 GH61B 多肽
     在一个特定的实施方案中, 本发明的多肽是 GH61B 多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的 GH61B 多肽, 更具体是 SEQ ID NO : 14 中包含的 GH61B 多肽具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。 更具体地, 所述 成熟 GH61B 多肽包含或由 SEQ ID NO : 14 第 1 到 249 位的序列组成。在本文中, GH61B 多肽 定义为提供选自下列的一组或多组效应的分泌多肽或蛋白质 :
     1) 当与纤维素酶或纤维素酶混合物联合使用时, 促进纤维质材料的降解。
     2) 增加酶的溶解性。
     3) 增加酶的稳定性。SEQ ID NO : 16 GH61C 多肽
     在一个特定的实施方案中, 本发明的多肽是 GH61C 多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的 GH61C 多肽, 更具体是 SEQ ID NO : 16 中包含的 GH61C 多肽具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。 更具体地, 所述 成熟 GH61C 多肽包含或由 SEQ ID NO : 16 第 1 到 255 位的序列组成。在本文中, GH61C 多肽 定义为提供选自下列的一组或多组效应的分泌多肽或蛋白质 :
     1) 当与纤维素酶或纤维素酶混合物联合使用时, 促进纤维质材料的降解。
     2) 增加酶的溶解性。
     3) 增加酶的稳定性。
     SEQ ID NO : 18 GH61D 多肽
     在一个特定的实施方案中, 本发明的多肽是 GH61D 多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的 GH61D 多肽, 更具体是 SEQ ID NO : 18 中包含的 GH61D 多肽具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。 更具体地, 所述 成熟 GH61D 多肽包含或由 SEQ ID NO : 18 第 1 到 205 位的序列组成。在本文中, GH61D 多肽 定义为提供选自下列的一组或多组效应的分泌多肽或蛋白质 :
     1) 当与纤维素酶或纤维素酶混合物联合使用时, 促进纤维质材料的降解。
     2) 增加酶的溶解性。
     3) 增加酶的稳定性。
     SEQ ID NO : 20 功能性多肽
     在一个特定的实施方案中, 本发明的多肽是功能性多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与 SEQ ID NO : 20 具有至少 90%, 具体是至少 95%, 更具体是 至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100% 的同一性。特别是与 SEQ IDNO : 20 中包含的成熟功能性多肽。更具体地, 所述成熟功能性 多肽包含或由 SEQ ID NO : 20 第 1 到 243 位的序列组成。
     SEQ ID NO : 22 功能性多肽
     在一个特定的实施方案中, 本发明的多肽是功能性多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与 SEQ ID NO : 22 具有至少 90%, 具体是至少 95%, 更具体是 至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100% 的同一性。特别是与 SEQ IDNO : 22 中包含的成熟功能性多肽。更具体地, 所述成熟功能性 多肽包含或由 SEQ ID NO : 22 第 1 到 415 位的序列组成。
     SEQ ID NO : 24 功能性多肽
     在一个特定的实施方案中, 本发明的多肽是功能性多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与 SEQ ID NO : 24 具有至少 90%, 具体是至少 95%, 更具体是 至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100% 的同一性。特别是与 SEQ IDNO : 24 中包含的成熟功能性多肽。更具体地, 所述成熟功能性多肽包含或由 SEQ ID NO : 24 第 1 到 377 位的序列组成。
     SEQ ID NO : 26 功能性多肽
     在一个特定的实施方案中, 本发明的多肽是功能性多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与 SEQ ID NO : 26 具有至少 90%, 具体是至少 95%, 更具体是 至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100% 的同一性。特别是与 SEQ IDNO : 26 中包含的成熟功能性多肽。更具体地, 所述成熟功能性 多肽包含或由 SEQ ID NO : 26 第 1 到 259 位的序列组成。
     SEQ ID NO : 28 功能性多肽
     在一个特定的实施方案中, 本发明的多肽是功能性多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与 SEQ ID NO : 28 具有至少 90%, 具体是至少 95%, 更具体是 至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100% 的同一性。特别是与 SEQ IDNO : 28 中包含的成熟功能性多肽。更具体地, 所述成熟功能性 多肽包含或由 SEQ ID NO : 28 第 1 到 248 位的序列组成。
     SEQ ID NO : 30 功能性多肽
     在一个特定的实施方案中, 本发明的多肽是功能性多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与 SEQ ID NO : 30 具有至少 90%, 具体是至少 95%, 更具体是 至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100% 的同一性。特别是与 SEQ IDNO : 30 中包含的成熟功能性多肽。更具体地, 所述成熟功能性 多肽包含或由 SEQ ID NO : 30 第 1 到 149 位的序列组成。
     SEQ ID NO : 32 功能性多肽
     在一个特定的实施方案中, 本发明的多肽是功能性多肽, 其包含或由这样的氨基 酸序列组成 : 所述氨基酸序列与 SEQ ID NO : 32 具有至少 90%, 具体是至少 95%, 更具体是 至少 96%, 更具体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100% 的同一性。特别是与 SEQ IDNO : 32 中包含的成熟功能性多肽。更具体地, 所述成熟功能性 多肽包含或由 SEQ ID NO : 32 第 1 到 202 位的序列组成。
     SEQ ID NO : 34β- 葡糖苷酶
     在一个特定的实施方案中, 本发明的多肽是 β- 葡糖苷酶, 其包含或由这样的氨 基酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的 β- 葡糖苷酶, 更具体是 SEQ ID NO : 34 中包含的 β- 葡糖苷酶具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是 至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。 更具体地, 所述 β- 葡糖苷酶包含或由 SEQ ID NO : 34 第 1 到 603 位的序列组成。在本文中, β- 葡 糖苷酶定义为这样的 β-D- 葡萄糖苷 - 葡萄糖水解酶 (β-D-glucoside-glucohydrolase) (E.C.3.2.1.21), 其催化末端非还原的 β-D- 葡萄糖残基的水解, 并释放 β-D- 葡萄糖。对 本发明而言, β- 葡糖苷酶活性是根据 Venturi 等, 2002, J.Basic Microbiol.42 : 55-66 中 描述的基本步骤来测定的, 只是采用了本文所述的不同条件。1 个 β- 葡糖苷酶活性单位 定义为 : 在 50℃, pH 5 下, 从 100mM 柠檬酸钠、 0.01% Tween-20 中的底物 : 4mM 对 - 硝基苯 基 -β-D- 吡喃葡萄糖苷中, 每分钟产生 1.0 微摩尔的对 - 硝基酚。
     SEQ ID NO : 36 内切阿拉伯糖酶在一个特定的实施方案中, 本发明的多肽是内切阿拉伯糖酶, 其包含或由这样的 氨基酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的内切阿拉伯糖酶, 更具体是 SEQ ID NO : 36 中包含的内切阿拉伯糖酶具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具 体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。更具 体地, 所述内切阿拉伯糖酶包含或由 SEQ ID NO : 36 第 1 到 301 位的序列组成。在本文中, 内切阿拉伯糖酶 (endo-arabinase) 定义为能够水解阿拉伯聚糖 (arabinan) 的酶。
     SEQ ID NO : 38 内切阿拉伯糖酶
     在一个特定的实施方案中, 本发明的多肽是内切阿拉伯糖酶, 其包含或由这样的 氨基酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的内切阿拉伯糖酶, 更具体是 SEQ ID NO : 36 中包含的内切阿拉伯糖酶具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具 体是至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。更具 体地, 所述内切阿拉伯糖酶包含或由 SEQ ID NO : 38 第 1 到 438 位的序列组成。在本文中, 内切阿拉伯糖酶定义为能够水解阿拉伯聚糖的酶。 SEQ ID NO : 40 A1 胃蛋白酶肽酶
     在一个特定的实施方案中, 本发明的多肽是胃蛋白酶肽酶, 其包含或由这样的氨 基酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的胃蛋白酶肽酶, 更具体是 SEQ ID NO : 40 中包含的胃蛋白酶肽酶具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是 至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。 更具体地, 所述胃蛋白酶肽酶包含或由 SEQ ID NO : 40 第 1 到 396 位的序列组成。在本文中, 胃蛋白酶 肽酶 (pepsin peptidase) 定义为能够水解蛋白质或肽的酶。
     SEQ ID NO : 42 M43 胃蛋白酶肽酶
     在一个特定的实施方案中, 本发明的多肽是胃蛋白酶肽酶, 其包含或由这样的氨 基酸序列组成 : 所述氨基酸序列与可以从 Botryosphaeria rhodina, 具体是以保藏号 CBS 274.96 保藏的 Botryosphaeria rhodina 菌株得到的胃蛋白酶肽酶, 更具体是 SEQ ID NO : 42 中包含的胃蛋白酶肽酶具有至少 90%, 具体是至少 95%, 更具体是至少 96%, 更具体是 至少 97%, 更具体是至少 98%, 更具体是至少 99%, 或最具体是 100%的同一性。 更具体地, 所述胃蛋白酶肽酶包含或由 SEQ ID NO : 42 第 1 到 262 位的序列组成。在本文中, 胃蛋白酶 肽酶定义为能够水解蛋白质或肽的酶。
     多核苷酸
     本发明还涉及包含或由编码本发明的多肽的核苷酸序列组成的多核苷酸。 在一个 具体的实施方案中, 所述核苷酸序列显示在 ADNA 组的序列中, 包括与其由于遗传密码的简并 性而相异的序列。 在另一个实施方案中, 本发明的多核苷酸是修饰的核苷酸序列, 其包含或 由 ADNA 组的序列的编码成熟多肽的区域组成, 而且其与 ADNA 组中所包含的亲本核苷酸序列 相比, 包含至少一个修饰 / 突变。
     用于分离或克隆编码多肽的多核苷酸的技术在本领域是已知的, 包括从基因组 DNA 分离, 从 cDNA 制备, 或者两者的组合。 从这些基因组 DNA 克隆本发明的多核苷酸序列可
     以通过, 例如, 利用公知的聚合酶链式反应 (PCR), 或用抗体筛选表达文库以检测出具有共 同结构特征的克隆 DNA 片段来实现。例如参见 Innis 等, 1990, PCR : A Guide to Methods and Application, Academic Press, New York。 还可以使用其它核酸扩增程序, 诸如连接酶 链式反应 (LCR)、 连接激活转录 (LAT)、 和基于核苷酸序列的扩增 (NASBA)。
     获得所述核苷酸序列可通过基因工程中使用的标准克隆方法, 将该核苷酸序列从 其天然位置再定位 (relocate) 到该序列将被复制的其它位置。克隆方法可包括包含编码 该多肽的核苷酸序列的期望片段的切割和分离、 该片段向载体分子中的插入, 以及重组载 体向宿主细胞中的掺入, 在宿主细胞中该核酸序列的多拷贝或克隆将被复制。该核酸序列 可以是基因组、 cDNA、 RNA、 半合成、 合成的来源或其任意组合。
     具体地, 所述多核苷酸包含且优选由这样的核苷酸序列组成 : 该核苷酸序列与选 自 ADNA 组的序列的编码成熟多肽的区域的核苷酸序列具有至少 50%的同一性。具体地, 所 述核苷酸序列与选自 ADNA 组的序列的编码成熟多肽的区域的核苷酸序列具有至少 65%的 同一性, 更具体为 70%的同一性, 更具体为 80%的同一性, 更具体为 90%的同一性, 更具体 为 95%的同一性, 更具体为 96%的同一性, 更具体为 97%的同一性, 更具体为 98%的同一 性, 更具体为 99%的同一性, 或最具体为 100%的同一性。具体地, 所述核苷酸序列包含选 自 ADNA 组的序列的编码成熟多肽的区域的核苷酸序列。在更优选的实施方案中, 所述核苷 酸序列由选自 ADNA 组的序列的编码成熟多肽的区域的核苷酸序列组成。
     具体地, 所述多核苷酸包含并优选由这样的核苷酸序列组成 : 该核苷酸序列编码 选自木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多 肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶的成熟酶, 并且该核苷酸序列与编码本 发明人分离并以 CBS 保藏号 274.96 保藏的 Botryosphaeria rhodina 菌株所分泌的木聚糖 酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖 苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶的成熟酶的核苷酸序列, 具有至少 50%的同一性, 具 体为至少 65%的同一性, 更具体为 70%的同一性, 更具体为 80%的同一性, 更具体为 90% 的同一性, 更具体为 95%的同一性, 更具体为 96%的同一性, 更具体为 97%的同一性, 更具 体为 98%的同一性, 更具体为 99%的同一性, 或最具体为 100%的同一性。
     在一个具体的实施方案中, 所述多核苷酸包含并优选由这样的核苷酸序列组成 : 该核苷酸序列编码选自木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶的成熟酶, 并且该 核苷酸序列与编码选自 D 多肽组的成熟酶核苷酸序列具有至少 50%的同一性, 具体为至少 65%的同一性, 更具体为 70%的同一性, 更具体为 80%的同一性, 更具体为 90%的同一性, 更具体为 95%的同一性, 更具体为 96%的同一性, 更具体为 97%的同一性, 更具体为 98% 的同一性, 更具体为 99%的同一性, 或最具体为 100%的同一性。
     在一个具体的实施方案中, 所述多核苷酸包含并优选由这样的核苷酸序列组成 : 该核苷酸序列编码选自木聚糖酶、 丝氨酸酯酶、 过氧化物酶、 GH 61A 多肽、 GH 61B 多肽、 GH 61C 多肽、 GH 61D 多肽、 β- 葡糖苷酶、 内切阿拉伯糖酶和胃蛋白酶肽酶的成熟酶, 并且该 核苷酸序列与选自 EDNA 组序列的核苷酸序列具有至少 50%的同一性, 具体为至少 65%的同 一性, 更具体为 70%的同一性, 更具体为 80%的同一性, 更具体为 90%的同一性, 更具体为 95%的同一性, 更具体为 96%的同一性, 更具体为 97%的同一性, 更具体为 98%的同一性,更具体为 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 1
     在一个特定的实施方案中本发明的多核苷酸编码 GH10 木聚糖酶, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 1 的 55 到 927 位的核苷酸序列具有至 少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至 少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至 少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 3
     在一个特定的实施方案中本发明的多核苷酸编码 GH11 木聚糖酶, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 3 的 58 到 663 位的核苷酸序列具有至 少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至 少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至 少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 5
     在一个特定的实施方案中本发明的多核苷酸编码丝氨酸酯酶, 并包含或由这样的 核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 5 的 55 到 1110 位的核苷酸序列具有至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 7
     在一个特定的实施方案中本发明的多核苷酸编码脂肪酶, 并包含或由这样的核苷 酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 7 的 55 到 1347 位的核苷酸序列具有至少 70% 的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至少 95% 的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至少 98% 的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 9
     在一个特定的实施方案中本发明的多核苷酸编码过氧化物酶, 并包含或由这样的 核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 9 的 1 到 555 位的核苷酸序列具有至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 11
     在一个特定的实施方案中本发明的多核苷酸编码 GH61A 多肽, 并包含或由这样的 核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 11 的 49 到 702 位的核苷酸序列具有至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 13
     在一个特定的实施方案中本发明的多核苷酸编码 GH61B 多肽, 并包含或由这样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 13 的 40 到 786 位的核苷酸序列具有至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 15
     在一个特定的实施方案中本发明的多核苷酸编码 GH61C 多肽, 并包含或由这样的 核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 15 的 55 到 819 位的核苷酸序列具有至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 17
     在一个特定的实施方案中本发明的多核苷酸编码 GH61D 多肽, 并包含或由这样的 核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 17 的 61 到 675 位的核苷酸序列具有至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 19
     在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 19 的 1 到 729 位的核苷酸序列具有至 少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至 少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至 少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 21
     在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 21 的 55 到 1299 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为 至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 23
     在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 23 的 49 到 1179 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为 至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 25
     在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 25 的 70 到 846 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 27
     在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 27 的 58 到 801 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为 至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 29
     在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 29 的 157 到 603 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为 至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 31
     在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 31 的 55 到 660 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为 至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 33
     在一个特定的实施方案中本发明的多核苷酸编码 β- 葡糖苷酶, 并包含或由这样 的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 33 的 46 到 1854 位的核苷酸序列具有至 少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为至 少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为至 少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 35
     在一个特定的实施方案中本发明的多核苷酸编码内切阿拉伯糖酶, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 35 的 64 到 966 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为 至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 37
     在一个特定的实施方案中本发明的多核苷酸编码内切阿拉伯糖酶, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 37 的 55 到 1368 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为 至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 39
     在 一 个 特 定 的 实 施 方 案 中 本 发 明 的 多 核 苷 酸 编 码 胃 蛋 白 酶 蛋 白 酶 (pepsinprotease), 并包含或由这样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 39 的 61 到 1248 位的核苷酸序列具有至少 70 %的同一性, 更具体为至少 80 %的同一性, 更具体为至 少 90%的同一性, 更具体为至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至 少 97%的同一性, 更具体为至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     SEQ ID NO : 41
     在一个特定的实施方案中本发明的多核苷酸编码胃蛋白酶蛋白酶, 并包含或由这 样的核苷酸序列组成 : 所述核苷酸序列与 SEQ ID NO : 41 的 64 到 849 位的核苷酸序列具有 至少 70%的同一性, 更具体为至少 80%的同一性, 更具体为至少 90%的同一性, 更具体为 至少 95%的同一性, 更具体为至少 96%的同一性, 更具体为至少 97%的同一性, 更具体为 至少 98%的同一性, 更具体为至少 99%的同一性, 或最具体为 100%的同一性。
     为了合成包含相比于选自 B 多肽组所包含的成熟多肽的氨基酸序列具有至少一个 置换、 缺失和 / 或插入的氨基酸序列的多肽, 编码本发明的多肽的核苷酸序列的修饰可能 是必需的。
     对本领域技术人员而言显而易见的是, 可以使这些修饰保持酶的功能, 即, 可以在 酶功能的关键区域之外进行这些修饰。 对功能来说至关重要的氨基酸残基因此优选不被修 饰, 例如被替代。 对功能来说至关重要的氨基酸残基可以通过本领域已知的程序来鉴定, 诸 如定点诱变或丙氨酸扫描诱变 (alanine scanning mutagenesis)( 例如参见 Cunningham 和 Wells, 1989, Science 244 : 1081-1085)。底物 - 酶相互作用位点可通过三维结构分析来 确定, 其中三维结构可由诸如核磁共振分析、 晶体学、 或光亲和标记等技术来测定 ( 例如参 见 de Vos 等, 1992, Science 255 : 306-312 ; Smith 等, 1992, Journal of Molecular Biology 224 : 899-904 ; Wlodaver 等, 1992, FEBS Letters 309 : 59-64)。
     另外, 可以通过引入核苷酸置换来改变编码本发明的酶的核苷酸序列, 这样的置 换不会使该核苷酸序列编码产生另外的氨基酸序列, 而是对应于意图用来表达酶的宿主生 物的密码子使用习惯。
     将一个核苷酸置换为另一个核苷酸的突变导入核苷酸序列, 可以通过利用本领域 已知的任何方法进行定点诱变来实现。 特别有用的是利用具有目标插入片段的超螺旋双链 DNA 载体和两个含有所需突变的合成引物的方法。每条分别与载体的相对链互补的寡核苷 酸引物借助 Pfu DNA 聚合酶在温度循环过程中延伸。整合入引物后, 生成包含错列缺口的 突变质粒。在温度循环后, 用对甲基化和半甲基化 DNA 特异性的 DpnI 处理产物以消化亲代 并选择包含突变的合成的 DNA。本领域已知的其它方法也可以使用。关于核苷酸 DNA 模板, 置换的一般性描述参见, 例如, Ford 等, 1991, Protein Expression and Purification 2 : 95-107。
     本发明还涉及包含, 优选由这样的核苷酸序列组成的多核苷酸 : 所述核苷酸序列 编码本发明的多肽并在高度严紧条件, 优选极高度严紧条件下, 与选自下列的多核苷酸探 针杂交 :
     (i) 核苷酸序列的互补链, 所述核苷酸序列选自 ADNA 组序列的编码成熟多肽的区 域;
     (ii) 核苷酸序列所包含的 cDNA 的互补链, 所述核苷酸序列选自 ADNA 组序列的编码成熟多肽的区域 ;
     (iii)(i) 或 (ii) 的片段, 其编码具有 B 多肽组中所包含的相应成熟多肽的功能的 分泌的成熟多肽。
     (J.Sambrook , E.F.Fritsch 和 T.Maniatus , 1989 , Molecular Cloning , A Laboratory Manual, 第二版, Cold Spring Harbor, New York)。
     可以理解的是, 关于核苷酸序列杂交的细节和详情与本文中题为 “本发明的多肽” 部分中讨论的杂交方面的内容相同或相近。
     本发明还涉及适用于电子设备的、 包含本发明的多肽的氨基酸序列或本发明的多 核苷酸的核苷酸序列的信息的存储介质。所述存储介质可合适地为磁盘或光盘, 所述电子 设备可以是计算设备, 所述信息具体可以数字形式存储在存储介质上。
     核酸构建体
     本发明还涉及包含与一种或多种调控序列可操作地连接的本发明的多核苷酸的 核酸构建体, 所述调控序列在适当宿主细胞中与调控序列相容的条件下指导编码序列的表 达。
     可利用多种方法操作编码本发明多肽的分离多核苷酸以提供多肽的表达的条件。 根据表达载体的不同, 可能希望或必需在将多核苷酸序列插入载体之前对其进行操作。利 用重组 DNA 方法修饰多核苷酸序列的技术是本领域众所周知的。
     调控序列可以是适当的启动子序列, 即被宿主细胞识别来表达所述核苷酸的核苷 酸序列。启动子序列包含调节多肽表达的转录调控序列。启动子可以是在所选宿主细胞中 表现出转录活性的任何核苷酸序列, 包括突变的、 截短的和杂合的启动子, 而且可从编码与 宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。
     用于指导本发明的核酸构建体转录, 尤其是在细菌宿主细胞中转录的适当启动 子的实例, 是从大肠杆菌 lac 操纵子、 天蓝色链霉菌 (Streptomyces coelicolor) 琼脂 酶基因 (dagA)、 枯草芽孢杆菌果聚糖蔗糖酶基因 (sacB)、 地衣芽孢杆菌 α- 淀粉酶基因 (amyL)、 嗜热脂肪芽孢杆菌 (Bacillus stearothermophilus) 产麦芽糖淀粉酶 (maltogenic amylase) 基因 (amyM)、 解淀粉芽孢杆菌 α- 淀粉酶基因 (amyQ)、 地衣芽孢杆菌 (Bacillus licheniformis) 青霉素酶基因 (penP)、 枯草芽孢杆菌 xylA 和 xylB 基因、 和原核生物的 β- 内 酰 胺 酶 基 因 (Villa-Kamaroff 等, 1978, Proceedings of the National Academy of Sciences USA 75 : 3727-3731) 中获得的启动子, 以及 tac 启动子 (DeBoer 等, 1983, Proceedings of the National Academy of Sciences USA 80 : 21-25)。还有 “Useful proteins from recombinant bacteria” , Scientific American, 1980, 242 : 74-94 及 Sambrook 等, 1989, 同上中描述的其它启动子。
     用于在丝状真菌宿主细胞中指导本发明的核酸构建体转录的适当启动子的实例 有从米曲霉 (Aspergillus oryzae)TAKA 淀粉酶、 Rhizomucor miehei 天冬氨酸蛋白酶、 黑曲霉 (Aspergillus niger) 中性 α- 淀粉酶、 黑曲霉酸稳定 α- 淀粉酶、 黑曲霉或泡盛 曲霉 (Aspergillus awamori) 葡糖淀粉酶 (glaA)、 Rhizomucor miehei 脂肪酶、 米曲霉碱 性蛋白酶、 米曲霉磷酸丙糖异构酶、 构巢曲霉 (Aspergillus nidulans) 乙酰胺酶和尖镰孢 (Fusarium oxysporum) 胰蛋白酶样蛋白酶 (WO 96/00787)、 以及 NA2-tpi 启动子 ( 来自黑 曲霉中性 α- 淀粉酶和米曲霉磷酸丙糖异构酶基因的杂合启动子 ) ; 及其突变的、 截短的、和杂合的启动子。
     在酵母宿主中, 有用的启动子有从酿酒酵母 (Saccharomyces cerevisiae) 烯醇 化酶 (ENO-1)、 酿酒酵母半乳糖激酶 (GAL1)、 酿酒酵母醇脱氢酶 / 甘油醛 -3- 磷酸脱氢酶 (ADH1、 ADH2/GAP) 和酿酒酵母 3- 磷酸甘油酸 (phosphoglycerate) 激酶基因中所获得的。 还有 Romanos 等, 1992, Yeast 8 : 423-488 中描述了用于酵母宿主细胞的其它有用启动子。
     调控序列也可以是适当的转录终止子序列, 即由宿主细胞识别来终止转录的序 列。终止子序列可操作地连接于编码多肽的核苷酸序列的 3′端。在所选择的宿主细胞中 起作用的任何终止子都可用于本发明。
     对于丝状真菌宿主细胞优选的终止子是从米曲霉 TAKA 淀粉酶、 黑曲霉葡糖淀粉 酶、 构巢曲霉邻氨基苯甲酸 (anthranilate) 合酶、 黑曲霉 α- 葡糖苷酶、 和尖镰孢胰蛋白酶 样蛋白酶的基因中获得的。
     对于酵母宿主细胞优选的终止子是从酿酒酵母烯醇化酶、 酿酒酵母细胞色素 C(CYC1) 和酿酒酵母甘油醛 -3- 磷酸脱氢酶基因中获得的。还有 Romanos 等, 1992, 同上中 描述的用于酵母宿主细胞的其它有用终止子。
     调控序列还可以是适当的前导序列, 即 mRNA 中对宿主细胞翻译重要的非翻译区。 前导序列可操作地连接于编码多肽的核苷酸序列的 5′端。在所选择的宿主细胞中起作用 的任何前导序列都可用于本发明。
     对于丝状真菌宿主细胞优选的前导序列是从米曲霉 TAKA 淀粉酶和构巢曲霉磷酸 丙糖异构酶基因中获得的。
     对于酵母宿主细胞优选的前导序列是从酿酒酵母烯醇化酶 (ENO-1)、 酿酒酵母 3- 磷酸甘油酸激酶、 酿酒酵母 α- 因子和酿酒酵母醇脱氢酶 / 甘油醛 -3- 磷酸脱氢酶 (ADH2/GAP) 基因中获得的。
     调控序列还可以是聚腺苷酸化序列, 即可操作地连接于核苷酸序列 3′端的序列, 且当被转录时, 作为将聚腺苷残基添加到转录出的 mRNA 上的信号被宿主细胞所识别。在所 选择的宿主细胞中起作用的任何聚腺苷酸化序列都可用于本发明。
     对于丝状真菌宿主细胞优选的聚腺苷酸化序列是从米曲霉 TAKA 淀粉酶、 黑曲霉 葡糖淀粉酶、 构巢曲霉邻氨基苯甲酸合酶、 尖镰孢胰蛋白酶样蛋白酶、 和黑曲霉 α- 葡糖苷 酶的基因获得的。
     Guo 和 Sherman 等, 1995, Molecular Cellular Biology 15 : 5983-5990 中描述了 对酵母宿主细胞有用的聚腺苷酸化序列。
     调控序列还可以是信号肽编码区, 它编码连接于多肽的氨基末端, 并指导编码的 多肽进入细胞分泌途径的氨基酸序列。核苷酸序列的编码序列的 5′端可固有地含有信号 肽编码区, 它在翻译读码框中与编码分泌多肽的编码区段天然连接。或者, 编码序列的 5′ 端可以含有对编码序列而言是外来的信号肽编码区。 如果编码序列天然地不含信号肽编码 区, 则可能需要外来的信号肽编码区。 或者, 外来的信号肽编码区可简单地替换天然信号肽 编码区以便增强多肽的分泌。然而, 指导表达的多肽进入所选择宿主细胞分泌途径的任何 信号肽编码区均可用于本发明。
     对于细菌宿主细胞有效的信号肽编码区有从芽孢杆菌 NCIB 11837 的产麦芽糖淀 粉酶、 嗜热脂肪芽孢杆菌的 α- 淀粉酶、 地衣芽孢杆菌的枯草杆菌蛋白酶、 地衣芽孢杆菌的β- 内酰胺酶、 嗜热脂肪芽孢杆菌的中性蛋白酶类 (nprT、 nprS、 nprM)、 和枯草芽孢杆菌的 prsA 基因获得的信号肽编码区。还有 Simonen 和 Palva, 1993, Microbiological Reviews 57 : 109-137 中描述的其它信号肽。
     对于丝状真菌宿主细胞有效的信号肽编码区有从米曲霉 TAKA 淀粉酶、 黑曲霉中 性淀粉酶、 黑曲霉葡糖淀粉酶、 Rhizomucor miehei 天冬氨酸蛋白酶、 Humicola insolens 纤 维素酶和 Humicola lanuginosa 脂肪酶的基因获得的信号肽编码区。
     对于酵母宿主细胞有用的信号肽是从酿酒酵母 α- 因子和酿酒酵母转化酶的基 因获得的。Romanos 等, 1992, 同上中描述了的其它有用的信号肽编码区。
     调控序列还可以是前肽 (propeptide) 编码区, 它编码位于多肽氨基末端的氨基 酸序列。所得的多肽可称为酶原 (proenzyme) 或多肽原 (propolypeptide)。多肽原一般是 没有活性的, 通过催化或自催化切割将前肽从多肽原切除后, 可转变为成熟有活性的多肽。 前肽编码区可从枯草芽孢杆菌碱性蛋白酶 (aprE)、 枯草芽孢杆菌中性蛋白酶 (nprT)、 酿酒 酵母 α- 因子、 Rhizomucor miehei 天冬氨酸蛋白酶、 和 Myceliophthora thermophila 漆 酶 (WO 95/33836) 的基因获得。
     当信号肽和前肽区都存在于多肽的氨基末端时, 前肽区位于靠近多肽氨基末端的 位置, 而信号肽区位于靠近前肽区的氨基末端位置。在酵母中, 可使用 ADH2 系统或 GAL1 系 统。在丝状真菌中, 可使用 TAKA α- 淀粉酶启动子、 黑曲霉葡糖淀粉酶启动子、 和米曲霉葡 糖淀粉酶启动子作为调节序列。
     调节序列的其它实例有使基因得以扩增的那些调节序列。在真核系统中, 这些包 括在氨甲喋呤存在时扩增的二氢叶酸还原酶基因, 以及在重金属存在下扩增的金属硫蛋白 基因。在这些情况中, 编码多肽的核苷酸序列将与调节序列可操作地连接。
     重组表达载体
     本发明还涉及包含本发明的核酸构建体的重组表达载体。可以将上述述的各种 核酸和调控序列连接到一起以产生重组表达载体, 此载体可包括一个或多个便利的限制性 位点使得在这些位点可插入或替换编码多肽的核苷酸序列。或者, 本发明的核苷酸序列可 通过将核苷酸序列或含有序列的核酸构建体插入适当的表达载体进行表达。 构建表达载体 时, 将编码序列置于载体中以使编码序列与适当的表达调控可操作地连接。
     重组表达载体可以是可方便的接受重组 DNA 操作并能引起核苷酸序列表达的任 何载体 ( 例如质粒或病毒 )。载体的选择通常取决于载体与引入此载体的宿主细胞之间的 相容性。载体可以是线性的或闭合环状的质粒。
     载体可以是自主复制载体, 即以染色体外实体的形式存在, 且其复制独立于染色 体的复制的载体, 例如质粒、 染色体外元件、 微型染色体、 或人工染色体。
     载体可包含任何用于确保自我复制的手段。 或者, 载体可以是这样的载体 : 它在导 入宿主细胞后, 整合到基因组中并与其整合进入的染色体一起复制。 此外, 可使用单一载体 或质粒, 或是一起含有待引入宿主细胞基因组的全部 DNA 的两种或多种载体或质粒, 或者 转座子。
     本发明载体优选包含一种或多种允许容易地选择转化细胞的选择标记。 选择标记 是这样的一类基因, 其产物有助于产生抗微生物剂或病毒抗性、 重金属抗性、 营养缺陷型变 成原养型 (prototrophy to auxotrophs) 等等。细菌选择标记的实例有来自枯草芽孢杆菌或地衣芽孢杆菌的 dal 基因, 或者赋予 抗生素抗性诸如氨苄青霉素、 卡那霉素、 氯霉素或四环素抗性的标记。 适于酵母宿主细胞的 标记有 ADE2、 HIS3、 LEU2、 LYS2、 MET3、 TRP1 和 URA3。在丝状宿主细胞中使用的选择标记包 括但不限于 : amdS( 乙酰胺酶 )、 argB( 鸟氨酸氨甲酰基转移酶 )、 bar( 膦丝菌素乙酰基转移 酶 )、 hygB( 潮霉素磷酸转移酶 )、 niaD( 硝酸还原酶 )、 pyrG( 乳清苷 -5′ - 磷酸脱羧酶 )、 sC( 硫酸腺苷酰转移酶 (sulfate adenyltransferase)) 和 trpC( 邻氨基苯甲酸合酶 ) 及其 等价物。
     优选用于曲霉属 (Asperigillus) 细胞的是构巢曲霉或米曲霉的 amdS 和 pyrG 基 因以及吸水链霉菌 (Streptomyces hygroscopicus) 的 bar 基因。
     本发明的载体优选包含允许载体整合到宿主细胞基因组中或者允许载体在细胞 中不依赖于基因组自主复制的元件。
     对整合到宿主细胞基因组而言, 载体可依赖编码多肽的多核苷酸序列或任何其它 载体元件通过同源或非同源重组整合到基因组中。 或者, 载体可包含附加的核苷酸序列, 来 指导通过同源重组在染色体精确位置整合进入宿主细胞基因组中。 这些附加的核苷酸序列 使载体可以在染色体上的精确位置整合到宿主细胞基因组中。为了提高在精确位置整合 的可能性, 整合元件应优选包含足够数目的与对应靶序列高度同源的核酸, 诸如 100-1,500 个碱基对、 优选 400-1,500 个碱基对、 且最优选 800-1,500 个碱基对, 从而提高同源重组的 概率。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。此外, 整合元件可 以是非编码或编码核苷酸序列。另一方面, 载体可通过非同源重组整合到宿主细胞的基因 组中。
     对自主复制而言, 载体还可包含能使载体在所述的宿主细胞中自主复制的复制 起点。细菌复制起点的实例有允许在大肠杆菌中复制的质粒 pBR322、 pUC19、 pACYC177 和 pACYC184 的复制起点, 以及允许使得在芽孢杆菌中复制的 pUB110、 pE194、 pTA1060 和 pAMβ1 的复制起点。用于酵母宿主细胞的复制起点的实例有 2μm 复制起点、 ARS1、 ARS4、 ARS1 和 CEN3 的组合、 及 ARS4 和 CEN6 的组合。
     复制起点可以具有使其在宿主细胞内的作用成为温度敏感型的突变 ( 见, 例如, Ehrlich, 1978, Proceedings of the National.Academy of Sciences USA 75 : 1433)。
     可以将多于一个拷贝的编码本发明的多肽的核酸序列插入宿主细胞中以增强该 基因产物的表达。核苷酸序列拷贝数的增加可以通过下述实现 : 将至少核酸序列的另一个 拷贝整合到宿主细胞基因组中, 或者将核酸序列包含有可扩增的选择性标记基因, 通过在 合适的选择剂的存在下培养细胞, 能筛选出含有扩增拷贝的选择性标记基因、 从而也就含 有所述核酸序列的更多拷贝的细胞。
     用于连接上述元件以构建本发明重组表达载体的方法是本领域技术人员所熟知 的 ( 例如参见 Sambrook 等, 1989, 同上 )。
     重组宿主细胞
     本发明还涉及包含本发明的核酸构建体的重组宿主细胞, 它们可有利的用于所述 多肽的重组生产。 如前所述, 将包含本发明核苷酸序列的载体引入宿主细胞, 以使载体作为 染色体的整合体或作为自主复制的染色体外载体被保持。
     宿主细胞可以是单细胞微生物, 例如原核生物, 或非单细胞微生物, 例如真核生物。 有用的单细胞微生物有细菌细胞, 诸如革兰氏阳性细菌, 包括但不限于芽孢 杆 菌 属 细 胞, 例 如 嗜 碱 芽 孢 杆 菌 (Bacillus alkaphilus)、 解 淀 粉 芽 孢 杆 菌 (Bacillus amyloliquefaciens)、短 芽 孢 杆 菌 (Bacillus brevis)、环 状 芽 孢 杆 菌 (Bacillus circulans)、 Bacillus clausii、 凝 结 芽 孢 杆 菌 (Bacillus coagulans)、 灿烂芽孢杆菌 (Bacillus lautus)、 迟缓芽孢杆菌 (Bacillus lentus)、 地衣芽孢杆菌、 巨大芽孢杆菌 (Bacillus megaterium)、 嗜热脂肪芽孢杆菌、 枯草芽孢杆菌、 和苏云金芽孢杆菌 (Bacillus thuringiensis) ; 或链霉菌属 (Streptomyces) 细胞, 例如浅青紫链霉菌 (Streptomyces lividans) 和鼠灰链霉菌 (Streptomyces murinus), 或者革兰氏阴性细菌, 诸如大肠杆菌和 假单胞菌种 (Pseudomonas sp.)。在一个特定的实施方案中, 细菌宿主细胞是迟缓芽孢杆 菌、 地衣芽孢杆菌、 嗜热脂肪芽孢杆菌、 或枯草杆菌细胞。 在另一个优选的方面, 芽孢杆菌属 细胞是嗜碱的 (alkalophilic) 芽孢杆菌。
     将载体导入细菌宿主细胞可通过例如原生质体转化 ( 参见例如 Chang 和 Cohen, 1979, Molecular General Genetics 168 : 111-115)、 使用感受态细胞 ( 参见例如 Young 和 Spizizen, 1961, Journal of Bacteriology 81 : 823-829 ; 或 Dubnau 和 Davidoff-Abelson, 1971, Journal of Molecular Biology 56 : 209-221)、 电 穿 孔 ( 参 见 例 如 Shigekawa 和
    Dower, 1988, Biotechniques 6 : 742-751)、 或 接 合 ( 参 见 例 如 Koehler 和 Thorne, 1987, Journal of Bacteriology 169 : 5771-5278) 来实现。
     宿主细胞可以是真核细胞, 诸如哺乳动物、 昆虫、 植物、 或真菌细胞。
     在一个优选的方面, 宿主细胞是真菌细胞。 “真菌”在用于本文时包括子囊菌 门 (Ascomycota)、 担 子 菌 门 (Basidiomycota)、 壶 菌 门 (Chytridiomycota)、 和接合菌门 (Zygomycota)( 如 Hawksworth 等, 在 Ainsworth and Bisby’ s Dictionary of The Fungi, 第八版, 1995, CAB International, University Press, Cambridge, UK 中所定义的 ), 以及 卵菌门 (Oomycota)( 如 Hawksworth 等, 1995, 同上第 171 页中所引用的 ) 和所有有丝分裂 孢子真菌 (Hawksworth 等, 1995, 同上 )。在一个更优选的方面, 真菌宿主细胞是酵母细胞。 “酵母” 在用于本文时包括产子囊酵母 ( 内孢霉目 Endomycetales)、 产担孢子酵母、 和属于 半知菌类 (Fungi Imperfecti) 的酵母 ( 芽孢纲 Blastomycetes)。由于酵母的分类今后还 会变化, 对于本发明来说, 酵母应该是如在 Biology and Activities of Yeast(Skinner, F.A.、 Passmore, S.M. 和 Davenport, R.R. 编, Soc.App.Bacteriol.Symposium Series No.9, 1980) 中所定义的。
     在一个更优选的方面, 酵母宿主细胞是假丝酵母属、 汉逊酵母属 (Hansenula)、 克 鲁维酵母属 (Kluyveromyces)、 毕赤酵母属 (Pichia)、 糖酵母属 (Saccharomyces)、 裂殖酵 母属 (Schizosaccharomyces)、 或 Yarrowia 属细胞。
     在 一 个 最 优 选 的 方 面, 酵 母 宿 主 细 胞 是 卡 尔 斯 伯 糖 酵 母 (Saccharomyces carlsbergensis)、 酿酒酵母 (Saccharomyces cerevisiae)、 糖化糖酵母 (Saccharomyces diastaticus)、 Saccharomyces douglasii、 Saccharomyces kluyveri、 Saccharomyces norbensis 或卵形糖酵母 (Saccharomyces oviformis) 细胞。 在另一个最优选的方案中, 酵 母宿主细胞是乳酸克鲁维酵母 (Kluyveromyces lactis) 细胞。在另一个最优选的方案中, 酵母宿主细胞是 Yarrowia lipolytica 细胞。在另一个更优选的方面, 真菌宿主细胞是丝状真菌细胞。 “丝状真菌” 包括真菌门 (Eumycota) 和卵菌门 (Oomycota)( 如 Hawksworth 等, 1995, 文献同上所定义的 ) 所有丝状 形式的亚类。丝状真菌特征在于通常由几丁质、 纤维素、 葡聚糖、 脱乙酰壳多糖、 甘露聚糖、 以及其它复合多糖组成的菌丝体壁。 营养生长依靠菌丝延长, 且碳分解代谢是专性需氧的。 相反, 诸如酿酒酵母的酵母的营养生长通过单细胞原植体的芽殖进行, 且碳分解代谢可以 是发酵的。
     在一个甚至更优选的方面, 丝状真菌宿主细胞是 Acremonium 属、 曲霉属、 镰孢属 (Fusarium)、 腐质霉属 (Humicola)、 毛霉属 (Mucor)、 毁丝霉属 (Myceliophthora)、 脉孢霉 属 (Neurospora)、 青霉属 (Penicillium)、 梭孢壳属 (Thielavia)、 Tolypocladium 属、 或木 霉属 (Trichoderma) 的细胞。
     在 一 个 最 优 选 的 方 面, 丝 状 真 菌 宿 主 细 胞 是 泡 盛 曲 霉、 臭 曲 霉 (Aspergillus foetidus)、 日本曲霉 (Aspergillus japonicus)、 构巢曲霉、 黑曲霉、 或米曲霉细胞。在 另一个最优选的方案中, 丝状真菌宿主细胞是杆孢状镰孢 (Fusarium bactridioides)、 Fusarium cerealis、 Fusarium crookwellense, 大 刀 镰 孢 (Fusarium culmorum)、 禾谷 镰 孢 (Fusarium graminearum)、 禾 赤 镰 孢 (Fusarium graminum)、 异 孢 镰 孢 (Fusarium heterosporum)、 合 欢 木 镰 孢 (Fusarium negundi)、 尖 孢 镰 孢 (Fusarium oxysporum)、 多 枝 镰 孢 (Fusarium reticulatum)、 玫 瑰 色 镰 孢 (Fusarium roseum)、 接骨木镰孢 (Fusarium sambucinum)、 肤色镰孢 (Fusarium sarcochroum)、 拟分枝孢镰孢 (Fusarium sporotrichioides)、 硫色镰孢 (Fusarium sulphureum)、 Fusarium torulosum、 Fusarium trichothecioides、 Fusarium venenatum 细胞。在一种最优选的实施方案中, 丝状真菌 亲代细胞是 Fusarium venenatum(Nirenberg sp.nov.) 细胞。在另一种最优选的实施方 案中, 丝状真菌宿主细胞是 Humicola insolens、 Humicola lanuginosa、 Mucor miehei、 Myceliophthora thermophila、 粗糙脉孢霉 (Neurospora crassa)、 产紫青霉、 Thielavia terrestris、 Trichoderma harzianum、 康宁木霉 (Trichoderma koningii)、 Trichoderma longibrachiatum、 Trichoderma reesei 或绿色木霉细胞。
     真菌细胞可以本身已知的方式通过涉及原生质体形成、 原生质体转化、 和细胞壁 再生的过程进行转化。EP 238 023 和 Yelton 等, 1984, Proceedings of the National Academy of Sciences USA 81 : 1470-1474 中描述了适合曲霉属和木霉属宿主细胞转化的 过程。Malardier 等, 1989, Gene 78 : 147-159 和 WO 96/00787 中描述了适合转化镰孢属物 种的方法。酵母可利用 Becker 和 Guarente 在 Abelson, J.N. 和 Simon, M.I. 编的 Guide to Yeast Genetics and Molecular Biology, Methods in Enzymology, Volume.194, pp 182-187, Academic Press 公司, New York ; Ito 等, 1983, Journal of Bacteriology 153 : 163 ; 及 Hinnen 等, 1978, Proceedings of the National Academy of Sciences USA 75 : 1920 中所描述的程序转化。
     生产方法
     本发明还涉及生产本发明的酶的方法, 包括 : (a) 培养包含编码本发明的酶的核 苷酸序列的生物株系, 其中所述株系能表达和分泌该酶 ; 并 (b) 回收所述酶。 在一个具体的 实施方案中, 所述株系是野生型株系, 例如 Botryospaeria rhodina CBS 274.96, 而在另一 个实施方案中所述株系是如上所述的重组宿主细胞。在本发明的生产方法中, 利用本领域众所周知的方法在适于产生所述酶的培养基 中培养细胞。例如, 可在实验室或工业发酵罐中, 在适当的培养基和可使所述多肽表达和 / 或分离的条件下, 通过摇瓶培养、 小规模或大规模发酵 ( 包括连续、 分批、 补料 - 分批、 或固 态发酵 ) 来进行细胞培养。培养使用本领域已知的程序在含有碳和氮源以及无机盐的合适 营养培养基中进行。适宜的培养基可从商业供应商获得, 或者可根据已公布的配方来制备 ( 例如参见美国典型培养物保藏中心的目录 )。如果酶被分泌到培养基中, 那么可直接从培 养基中回收酶。如果酶不分泌, 那么可从细胞裂解物中进行回收。
     所得的酶多肽可通过本领域已知的方法回收。 例如, 可通过常规程序, 包括但不限 于离心、 过滤、 萃取、 喷雾干燥、 蒸发、 或沉淀, 从培养基中回收所述酶。
     本发明的多肽可通过本领域已知的多种程序纯化, 包括但不限于层析 ( 例如离子 交换、 亲和、 疏水、 层析聚焦、 和大小排阻 )、 电泳 ( 例如制备性等电聚焦 )、 差异溶解 ( 例如 硫酸铵沉淀 )、 SDS-PAGE、 或萃取 ( 例如参见 Protein Purification, J.-C.Janson 和 Lars Ryden 编, VCH Publishers, New York, 1989。
     转基因植物
     本发明还涉及转基因植物、 植物部分或者植物细胞, 它们已被编码本发明的酶的 核苷酸序列所转化, 从而表达所述酶。在一个实施方案中所述植物可以用作以可回收的量 生产所述酶的宿主。可以从所述植物或植物部分回收酶。或者, 含有该重组酶的植物或植 物部分本身可以用来提高食品或饲料的质量, 例如, 改善营养价值、 适口性和流变学性质, 或破坏抗营养因子 (antinutritional factor)。具体地, 表达所述酶的植物或植物部分可 以作为改良的起始材料用于生产燃料酒精或生物乙醇 (bio-ethanol)。
     所述转基因植物可以是双子叶的 ( 双子叶植物 ) 或单子叶的 ( 单子叶植物 )。单 子叶植物的实例是草类 / 禾本科 (grasses), 例如草地早熟禾 (meadow grass)( 蓝草 (blue grass), 早熟禾属 (Poa)), 饲用牧草 (forage grass), 例如羊茅属 (festuca), 黑麦草属 (lolium) ; 寒地型牧草 (temperate grass), 例如剪股颖属 (Agrostis) ; 和谷类 (cereals), 如小麦、 燕麦、 黑麦、 大麦、 稻、 高粱和玉米 (maize)( 玉米 (corn))。
     双子叶植物的例子有 : 烟草 ; 豆类 (legumes), 例如羽扇豆 (lupins) ; 马铃薯 ; 甜 菜; 豌豆 ; 菜豆 (bean) 和大豆, 和十字花科植物 (Brassicaceae), 例如花椰菜、 油菜籽 (rape seed) 和与之亲缘关系紧密的模式生物拟南芥 (Arabidopsis thaliana)。
     植物部分的例子有茎、 愈伤组织、 叶、 根、 果实、 种子和块茎。 特定的植物组织, 例如 叶绿体、 质外体、 线粒体、 液泡、 过氧化物酶体和细胞质, 都被认为是植物部分。 另外, 任何植 物细胞, 不管其来自什么组织, 都被认为是植物部分。
     这些植物、 植物部分和植物细胞的后代也被包括在本发明的范围之内。
     所述表达本发明的酶的转基因植物或植物细胞可以根据本领域已知的方法构建。 简单地说, 所述植物或植物细胞这样构建的 : 将一个或多个编码本发明的酶的表达构建体 整合入植物宿主的基因组, 并使所得的修饰植物或植物细胞繁殖成为转基因植物或植物细 胞。
     方便地, 所述表达构建体是包含核苷酸序列的核酸构建体, 所述核苷酸序列编码 本发明的酶, 且可操作地连接于在所选植物或植物部分中表达该核苷酸序列所需的合适的 调控序列。另外, 该表达构建体还可以包括可用于鉴定已经整合了表达构建体的宿主细胞的可选择标记 ; 以及将该构建体导入所述的植物所需要的 DNA 序列 ( 后者取决于使用的 DNA 导入方法 )。
     选择调节序列, 例如启动子和终止子序列, 以及可选的信号或转运序列, 是根据例 如想要在何时、 何处、 怎样表达该酶而决定的。例如, 编码本发明的酶的基因的表达可以是 组成型或诱导型的, 或者可为发育性、 阶段或组织特异性的, 而且基因产物可以被靶向于具 体的组织或者植物部分例如种子或叶。对调节序列的描述有例如 Tague 等, 1988, Plant Physiology 86 : 506。
     对 于 组 成 性 表 达, 可 以 使 用 35S-CaMV 启 动 子 (Franck 等 ., 1980.Cell 21 : 285-294)。 器 官 特 异 性 的 启 动 子 可 以 是, 例 如, 来 自 存 储 性 贮 藏 组 织 (storage sink tissues) 例如种子、 马铃薯的块茎及果实的启动子 (Edwards 和 Coruzzi, 1990, Ann.Rev. Genet.24 : 275-303), 或者来自代谢性贮藏组织 (metabolic sink tissues) 例如分生组 织的启动子 (Ito 等, 1994, Plant Mol.Biol.24 : 863-878) ; 或者是种子特异性的启动子, 例如来自稻的谷蛋白、 谷醇溶蛋白、 球蛋白或白蛋白启动子 (Wu 等, 1998, Plant and Cell Physiology 39 : 885-889), 来自蚕豆 (Vicia faba) 的豆球蛋白 B4 和未知的种子蛋白基因 的蚕豆启动子 (Conrad 等, 1998, Journal of Plant Physiology 152 : 708-711), 来自种 子油体 (seed oil body) 蛋白的启动子 (Chen 等, 1998, Plant and Cell Physiology 39 : 935-941), 来自欧洲油菜 (Brassica napus) 的贮存蛋白 napA 启动子, 或任何其他本领域已 知的种子特异性的启动子, 例如 WO 91/14772 所描述的。另外, 该启动子还可以是叶特异 性的启动子, 例如稻或西红柿的 rbcs 启动子 (Kyozuka 等, 1993, Plant Physiology 102 : 991-1000) ; 小球藻病毒腺嘌呤甲基转移酶基因启动子 (Mitra 和 Higgins, 1994, Plant Molecular Biology 26 : 85-93), 或来自稻的 aldP 基因启动子 (Kagaya 等, 1995, Molecular and General Genetics 248 : 668-674) ; 或为创伤诱导的启动子例如马铃薯 pin2 启动子 (Xu 等, 1993, Plant Molecular Biology 22 : 573-588)。
     也可以使用启动子增强元件来获得在植物中酶的更高表达。例如, 启动子增强元 件可以是位于启动子和编码本发明的酶的核苷酸序列之间的内含子。例如 Xu 等, 1993( 同 上 ) 公开了稻肌动蛋白 1 基因的第一个内含子增强表达的用途。
     可选择标记基因和表达构建体的任何其他部分都可以从本领域可用的那些中选 择。
     根据本领域已知的常规技术将该核酸构建体整合入植物基因组, 所述技术包括农 杆菌 (Agrobacterium) 介导的转化、 病毒介导的转化、 显微注射、 粒子轰击、 生物射弹转化 (biolistic tranformation) 和电穿孔 (Gasser 等, 1990, Science 244 : 1293 ; Potrykus, 1990, Bio/Technology 8 : 535 ; Shimamoto 等, 1989, Nature 338 : 274)。
     目前, 根瘤农杆菌 (Agrobacterim tumefaciens) 介导的基因转移是产生转基因双 子叶植物的优选方法 ( 见 Hooykas 和 Schilperoort, 1992, Plant Molecular Biology 19 : 15-38 的综述 )。不过该方法也可以用于转化单子叶植物, 尽管单子叶植物一般优选别的转 化方法。目前, 产生转基因单子叶植物的优选方法是粒子 ( 被用于转化的 DNA 所包被的极 小金或钨粒子 ) 轰击胚愈伤组织 (embroynic calli) 或发育中的胚 (Christou, 1992, Plant Journal 2 : 275-281 ; Shimamoto, 1994, Current Opinion Biotechnology 5 : 158-162 ; Vasil 等, 1992, Bio/Technology 10 : 667-674)。 另外一种可选的转化单子叶植物的方法是基于原生质体转化, 如 Omirulleh 等, 1993, Plant Molecular Biology 21 : 415-428 所述。
     转化以后, 选择整合了表达构建体的转化子, 并根据本领域熟知的方使其再生为 完整植株。
     本发明还涉及产生本发明的酶的方法, 其包括 (a) 在有利于生产所述酶的条件 下, 培养含有编码本发明的酶的核苷酸序列的转基因植物或植物细胞 ; 和 (b) 回收该酶。
     包含酶多肽的组合物和它们的制备方法
     本发明提供包含本发明的多肽和赋形剂的组合物和制备这样的组合物的方法, 该 方法包括混合本发明的多肽和赋形剂。在一个具体的实施方案中, 本发明的多肽是该组合 物, 例如单组分组合物中的主要 ( 多肽 ) 成分。在这里, 赋形剂应理解为用于配制所述组合 物的任何辅助性的试剂或化合物, 包括溶剂、 载体、 稳定剂等。
     该组合物还可以包含一种或多种其它的酶, 例如氨肽酶、 淀粉酶、 糖酶、 羧肽酶、 过 氧化氢酶、 纤维素酶、 几丁质酶、 角质酶、 环糊精糖基转移酶、 脱氧核糖核酸酶、 酯酶、 α- 半 乳糖苷酶、 β- 半乳糖苷酶、 葡糖淀粉酶、 α- 葡糖苷酶、 β- 葡糖苷酶、 卤素过氧化物酶 (haloperoxidase)、 转化酶、 漆酶、 脂肪酶、 甘露糖苷酶、 氧化酶、 果胶分解酶、 肽谷氨酰胺 酶、 过氧化物酶、 肌醇六磷酸酶、 多酚氧化酶、 蛋白水解酶、 核糖核酸酶、 转谷氨酰胺酶、 或木 聚糖酶。
     所述组合物可以根据本领域已知的方法制备并可以为液体或固体组合物的形式。 例如, 酶组合物可以用多肽和 / 或药品制剂技术领域已知的方法配制, 例如配制为包衣或 未包衣的颗粒或微颗粒。因此本发明的多肽可以以颗粒, 优选非粉化性 (non-dusting) 颗 粒, 液体, 特别是稳定化的液体, 浆液或被保护的多肽的形式提供。 对于一定的用途, 可优选 将多肽固定到固态基质上。
     组合物中要包含的多肽可以根据本领域已知的方法稳定化, 例如通过加入抗氧化 剂或还原剂以限制多肽的氧化从而稳定组合物中的多肽, 或可通过加入例如 PVP、 PVA、 PEG 或其它已知对多肽在固体或液体组合物中的稳定性有益的合适的聚合物来稳定它。
     在另外的实施方案中, 本发明的组合物是去污剂组合物, 该组合物除了本发明 的 多 肽 以 外还 包含表 面活性 剂, 以及, 任选地, 选自增 效剂 (builder) 例如沸 石、 漂白 剂 例 如 过 碳 酸 盐、 漂 白 促 进 剂 (bleach enhancers) 例 如 TAED 或 NOBS、 抑 泡 剂 (suds suppressors)、 芳香剂等等的化合物。
     在另一个实施方案中本发明的组合物是饲料组合物, 其除了本发明的多肽以外还 包含谷类 (cereal) 或谷物 (grain) 产品。
     在另一个实施方案中本发明的组合物是包含本发明的多肽的食品组合物例如面 包粉 (baker’ s flour) 组合物、 酿造产品、 果汁、 油或猪油产品。
     在另一个实施方案中本发明的组合物是纸浆组合物, 其除了本发明的多肽外还含 有纸浆。
     在另一个实施方案中本发明的组合物是杀生物 (biocidal) 组合物, 其除了本发 明的多肽外还含有氧化还原酶促进剂。
     酶多肽和包含它们的组合物的用途
     在另外的方面中, 本发明提供本发明的多肽或多核苷酸, 或包含所述多肽或多核 苷酸的组合物在多种应用特别是 ( 技术 ) 过程例如工业或家庭中进行的过程中, 及下面的用于商业研究的目的的用途。因此本文涵盖这样的过程, 其包括在 ( 技术的 ) 工业、 研究或 家用过程中使用本发明的多肽或本发明的多核苷酸。
     在一个实施方案中本发明的多肽或组合物被用来清洗纤维质织物。
     在另一个实施方案中使用本发明的多肽或组合物制备食品或饲料添加剂。
     在另一个实施方案中使用本发明的多肽或组合物处理木质 (lignolosic) 材料和 纸浆。
     去污剂的公开
     本发明的多肽可以添加到去污剂 (detergent) 组合物中并因此成为其组分。
     本发明的去污剂组合物可以, 例如, 配制为手洗或机洗衣物用去污剂组合物, 其 包括适用于预处理染污织物的洗衣添加剂组合物, 和漂洗加入的织物软化组合物 (rinse added fabric softener composition) ; 或者可以配制为用于一般家用硬表面清洗操作的 去污剂组合物, 或配制为用于手洗或机洗碗碟操作。
     在一个特定的方面中, 本发明提供包含本发明的多肽的去污剂添加剂。该去污剂 添加剂及去污剂组合物可包含一种或多种其他的酶例如蛋白酶、 脂肪酶、 角质酶、 淀粉酶、 糖酶、 纤维素酶、 果胶酶、 甘露聚糖酶、 阿拉伯糖酶 (arabinase)、 半乳聚糖酶、 木聚糖酶、 氧 化酶例如漆酶和 / 或过氧化物酶。
     一般而言, 所选的酶的性质应该与所选的去污剂相容 ( 例如最适 pH、 与其他酶或 非酶成分的相容性等等 ), 而且该酶应当以有效量存在。
     蛋白酶 : 合适的蛋白酶包括动物、 植物或微生物来源的那些蛋白酶。微生物来源 是优选的。还包括化学修饰的或蛋白质工程改造的突变体。该蛋白质可以是丝氨酸蛋白酶 或金属蛋白酶, 优选地为碱性微生物蛋白酶或胰蛋白酶样 (trypsin-like) 蛋白酶。碱性 蛋白酶的例子有枯草杆菌蛋白酶, 特别是来自芽孢杆菌的那些, 例如枯草杆菌蛋白酶 Novo、 枯草杆菌蛋白酶 Carlsberg、 枯草杆菌蛋白酶 309、 枯草杆菌蛋白酶 147 和枯草杆菌蛋白酶 168( 如 WO89/06279 所述 )。胰蛋白酶样蛋白酶的例子有胰蛋白酶 ( 例如猪或牛来源的 ) 和镰孢属 (Fusarium) 蛋白酶, 其在 WO 89/06270 和 WO 94/25583 中有描述。
     有用的蛋白酶的例子有 WO 92/19729、 WO 98/20115、 WO 98/20116 和 WO 98/34946 中所描述的变体, 特别是那些文献中所述的特定位置上有置换的变体。
     优 选 的 商 业 上 可 获 得 的 蛋 白 酶 包 括 Alcalase , Savinase , Primase , Duralase , Esperase , 和 Kannase (Novozymes A/S), Maxatase , Maxacal , Maxapem , Properase , Purafect , Purafect OxP , FN2 ,和 FN3 (Genencor International Inc.)。
     脂肪酶 : 合适的脂肪酶包括细菌或真菌来源的那些脂肪酶。还包括化学修饰 的或蛋白质工程改造的突变体。有用的脂肪酶的例子包括来自腐质霉属 (Humicola, 与 Thermomyces 同 义 ) 的 脂 肪 酶, 例 如 EP 258 068 和 EP 305 216 所 描 述 的 来 自 H.lanuginosa(T.lanuginosus) 的脂肪酶, 或 WO 96/13580 所描述的来自 H.insolens 的 脂肪酶, 假单胞菌 (Pseudomonas) 脂肪酶, 例如来自产碱假单胞菌 (P.alcaligenes) 或类 产碱假单胞菌 (P.pseudoalcaligenes)(EP 218 272)、 洋葱假单胞菌 (P.cepacia)(EP 331 376)、 司徒茨假单胞菌 (P.stutzeri)(GB 1,372,034)、 荧光假单胞菌 (P.fluorescens)、 假 单胞菌菌种 SD705 株 (WO 95/06720 和 WO 96/27002) 和 P.wisconsinensis(WO 96/12012)的脂肪酶 ; 芽孢杆菌脂肪酶, 例如来自枯草芽孢杆菌 (Dartois 等, (1993), Biochemica et Biophysica Acta, 1131, 253-360)、 嗜热脂肪芽孢杆菌 (JP 64/744992)、 或短小芽孢杆菌 (B.pumilus)(WO 91/16422) 的脂肪酶。
     其 他 的 例 子 有 WO 92/05249, WO 94/01541, EP 407 225, EP 260 105, WO 95/35381, WO 96/00292, WO 95/30744, WO 94/25578, WO 95/14783, WO 95/22615, WO 97/04079 和 WO 97/07202 中所描述的脂肪酶变体。
     优 选 的 商 业 上 可 获 得 的 脂 肪 酶 包 括 LipolaseTM, Lipolase UltraTM 和 LipexTM(Novozymes AJS)。
     淀粉酶 : 合适的淀粉酶 (α 和 / 或 β) 包括细菌或真菌来源的那些淀粉酶。还包 括化学修饰的或蛋白质工程改造的突变体。淀粉酶包括, 例如, 得自芽孢杆菌, 例如一种特 别的地衣芽孢杆菌菌株 ( 在 GB 1,296,839 中有详述 ) 的 α- 淀粉酶。
     有用的淀粉酶的例子有 WO 94/02597, WO 94/18314, WO 96/23873 和 WO97/43424 中描述的变体, 特别是那些文献中所述的特定位置上有置换的变体。
     优 选 的 商 业 上 可 获 得 的 淀 粉 酶 包 括 DuramylTM, TermamylTM, FungamylTM 和 BANTM(Novozymes A/S), RapidaseTM 和 PurastarTM( 来自 Genencor International Inc.)。 纤维素酶 : 合适的纤维素酶包括细菌或真菌来源的那些纤维素酶。还包括化 学修饰的或蛋白质工程改造的突变体。合适的纤维素酶包括来自芽孢杆菌属、 假单胞 菌属、 腐质霉属、 镰孢属、 梭孢壳属和 Acremonium 属的纤维素酶, 例如在 US 4,435,307, US 5,648,263, US 5,691,178, US 5,776,757 和 WO 89/09259 中 描 述 的、由 Humicola insolens、 Myceliophthora thermophila 和尖镰孢产生的真菌纤维素酶。
     特别合适的纤维素酶是具有护色 (color care) 的益处的碱性或中性纤维素酶。 这样的纤维素酶的例子有 EP 0 495 257, EP 0 531 372, WO 96/11262, WO 96/29397 和 WO 98/08940 中描述的纤维素酶。其他例子有纤维素酶变体, 例如 WO 94/07998, EP 0 531 315, US 5,457,046, US 5,686,593, US 5,763,254, WO 95/24471, WO 98/12307 和 PCT/ DK98/00299 中描述的那些。商业上可获得的纤维素酶包括 Celluzyme , 和 Carezyme (Novozymes), Clazinase , 和 Puradax HA (Genencor International Inc.), 和 KAC-500(B) (Kao Corporation)。
     过氧化物酶 / 氧化酶 : 合适的过氧化物酶 / 氧化酶包括植物、 细菌或真菌来源的那 些过氧化物酶 / 氧化酶。还包括化学修饰的或蛋白质工程改造的突变体。有用的过氧化物 酶的例子包括来自鬼伞属 (Coprinus) 的过氧化物酶, 例如来自灰盖鬼伞 (C.cinereus), 及 其变体, 如 WO 93/24618, WO 95/10602, 和 WO 98/15257 所述的那些的过氧化物酶。
     商业上可获得的过氧化物酶包括 Guardzyme (Novozymes A/S)。
     可以通过加入含有一种或多种酶的单独的添加剂, 或加入包含所有酶的复合添加 剂, 使去污酶 (detergent enzyme(s)) 包含在去污剂组合物中。本发明的去污剂添加剂, 即 单独的添加剂或复合添加剂, 可以配置为例如颗粒、 液体、 浆液等等。优选的去污剂添加剂 的剂型为颗粒, 特别是非粉化性颗粒、 液体, 特别是稳定化的液体, 或浆液。
    非粉化性颗粒可以, 例如, 如 US 4,106,991 和 4,661,452 所公开的那样制备, 任选 地, 还可以用本领域已知的方法来包被。蜡状 (waxy) 包被材料的例子有平均克分子量为 1000-20000 的聚 ( 环氧乙烷 ) 产品 ( 聚乙二醇, PEG) ; 具有 16-50 个环氧乙烷单位的乙氧
     基化壬基苯酚 ; 乙氧基化脂肪醇, 其中醇含 12-20 个碳原子, 且其中有 15-80 个环氧乙烷单 位; 脂肪醇 ; 脂肪酸 ; 以及脂肪酸的甘油单酯、 甘油二酯和甘油三酯。GB 1483591 提供了适 于通过流化床施用的成膜包被材料的例子。液体酶制备物可以, 例如, 按照已确立的方法, 通过加入多元醇, 如丙二醇、 糖或糖醇、 乳酸或硼酸来稳定化。可以根据 EP 238,216 所公开 的方法制备被保护的酶。
     本发明的去污剂组合物可以是任何方便的形式, 例如条、 片、 粉、 颗粒、 糊或液体。 液体去污剂可以是水性的, 通常含有高达 70%的水和 0-30%的有机溶剂, 或者可以是非水 性的。
     所述去污剂组合物包含一种或多种表面活性剂, 表面活性剂可以是非离子型包括 半极性的, 和 / 或阴离子型的, 和 / 或阳离子型的, 和 / 或两性离子型的。表面活性剂典型 地以 0.1-60 重量%的水平存在。
     当被包括在其中时, 所述去污剂通常含有大约 1%到大约 40%的阴离子表面活性 剂例如线性苯磺酸烷基酯、 α- 烯属磺酸酯、 硫酸烷基酯 ( 脂肪醇硫酸酯 )、 脂肪醇乙氧基硫 酸盐 (ethoxysulfate)、 二级链烷磺酸盐 (alkanesulfonate)、 α- 磺基脂肪酸甲酯、 烷基或 烯基琥珀酸或肥皂。
     当被包括在其中时, 所述去污剂通常含有约 0.2%到约 40%的非离子表面活性剂 如脂肪醇乙氧基化物、 壬基苯酚乙氧基化物、 烷基多苷、 烷基二甲基胺氧化物、 乙氧基化脂 肪酸单乙醇胺、 脂肪酸单乙醇胺、 多羟基烷基脂肪酰胺 (polyhydroxy alkyl fatty acid amide)、 或葡糖胺 (“葡萄糖胺” (“glucamides” )) 的 N- 酰基 N- 烷基衍生物。
     所 述 去 污 剂 可 包 括 0-65 % 的 洗 涤 增 效 剂 (detergent builder) 或 络 合 剂 (complexing agent) 如沸石、 二磷酸盐、 三磷酸盐、 膦酸盐 (phosphonate)、 碳酸盐、 柠檬酸 盐、 次氮基三乙酸、 乙二胺四乙酸、 二亚乙基三胺五乙酸、 烷基或烯基琥珀酸、 可溶的硅酸盐 或分层的 (layered) 硅酸盐 ( 例如来自 Hoechst 的 SKS-6)
     所述去污剂可包含一种或多种聚合物。例如羧甲基纤维素、 聚 ( 乙烯吡咯烷酮 )、 聚 ( 乙二醇 )、 聚 ( 乙烯醇 )、 聚 ( 乙烯吡啶 -N- 氧化物 )、 聚 ( 乙烯咪唑 )、 聚羧酸酯如聚丙 烯酸酯、 马来酸 / 丙烯酸共聚物和甲基丙烯酸月桂酯 / 丙烯酸共聚物。
     所述去污剂可包含漂白系统, 所述系统包括 H2O2 源例如过硼酸盐或过碳酸盐, 其 可与产过酸漂白激活剂 (peracid-forming bleach activator) 如四乙酰基乙二胺或壬酰 氧苯磺酸酯 (nonanoyloxybenzenesulfonate) 组合。或者, 漂白系统可包括例如酰胺、 二酰 亚胺或砜类型的过氧酸。
     本发明的去污剂组合物的酶可以用常规的稳定剂来稳定化, 例如多元醇如丙二 醇或丙三醇、 糖或糖醇、 乳酸、 硼酸或硼酸衍生物, 例如, 芳香族硼酸酯, 或苯硼酸衍生物如 4- 甲酰苯硼酸, 并且该组合物可以如 WO 92/19709 和 WO 92/19708 中描述的那样配制。
     洗涤剂溶液也可包括其他常规的洗涤剂组分, 例如织物调理剂 (conditioner) 包 括粘土, 促泡剂, 抑泡剂, 防蚀剂, 污物悬浮剂, 防污物再沉淀剂, 染料, 杀菌剂, 荧光增白剂, 水溶助长剂, 晦暗抑制剂, 或香料。
     在此考虑, 在所述去污剂组合物中, 任何酶, 特别是本发明的酶, 可以以相当于 0.01-100mg 酶蛋白每升洗涤液, 优选 0.05-5mg 酶蛋白每升洗涤液, 最优选 0.1-1mg 酶蛋白 每升洗涤液的量加入。本发明的酶还可以掺入到 WO 97/07202 所公开的去污剂组合物中, 在此将 WO 97/07202 并入本文作为参考。
     保藏的微生物
     根据 《国际承认的用于专利程序的微生物保存布达佩斯条约》 , 下列微生物被保 藏在真菌菌种保藏中心 (Centraalbureau voor Schimmelcultures), Fungal and Yeast Collection, Uppsala-laan 8, 3584 CT Utrecht, P.O.Box 85167, 3508 AD Utrecht, 荷兰 :
     名称 : Botryosphaeria rhodina
     同义名 : 棉色二孢 (Diplodia gossypina)(SBL 274)(Berkeley &M.A.Curtis)von Arx, von 1970,″ The genera of fungi sporulating in pure culture″ : 143
     分类 : Dothideaceae, Dothideales, Dothidemycetes, 子囊菌门 (Ascomycota)
     保藏号 : CBS 274.96
     保藏日期 : 1996 年 3 月 12 日 实施例 实施例 1 鉴定 Botryosphaeria rhodina CBS 274.96 分泌的功能性多肽
     培养液的酶指纹分析
     通过用多种酶测定方法对培养基肉汤进行测定, 获得了酶活性分布图。制备带底 物的 96 孔微量滴定 (MT) 板并保存在 10℃直到使用。制备了两种不同的 pH 变化形式 : pH3 和 pH7。使用下面的底物 : 0.05% AZCL(Mazurine 染色和交联的底物, Megazyme)- 直链淀 粉, 阿拉伯聚糖, β- 葡聚糖 ( 大麦 ), 酪蛋白, 胶原, 凝胶多糖, 葡聚糖, 半乳聚糖 ( 马铃薯 ), 半乳甘露聚糖 ( 角豆 )(carob), He- 纤维素、 支链淀粉 (pullulan)、 木聚糖 ( 燕麦 ) 和木葡 聚糖 (AZCL- 酪蛋白不能用在 pH3, 因此这些板中不加入 AZCL- 酪蛋白 )。
     pH3 底物的制备 :
     将 0.1g 的 每 种 AZCL 底 物 溶 解 在 100ml 的 0.2M 琥 珀 酸 pH3+10 微 升 Triton X-100(0.01% ) 中, 得到 0.1% AZCL 的终浓度。
     pH7 底物的制备 :
     将 0.1g 的每种 AZCL 溶解在 50ml 的无菌 H2O 加 10 微升 Triton X-100(0.01% ) 中。向每个 50ml AZCL 底物中加入 50ml 0.4M MOPS pH7, 得到终体积 100ml, 以及终浓度 0.2M 缓冲液, 0.1% AZCL。
     还包括了漆酶和脂肪酶活性的测定, 底物如下制备 :
     漆酶底物的制备 :
     制备溶于 0.2M 磷酸盐 / 硼酸盐缓冲液, pH9 的 0.08mg/ml Chicago Sky Blue 35ml。
     脂肪酶底物的制备 :
     通过以 3 ∶ 1 混合 2% PVA 溶液与大豆油制备聚乙烯醇 (PVA)/ 大豆油乳液。使用 ULTRA-TURRAX 混合器将油乳化, 并将 12ml 的乳液与 500ml 包含 10mM CaCl2, pH5.5 的 0.2M 乙酸钠缓冲液, 及 5ml 0.2%的结晶紫溶液混合。
     使 用 US Sterilin 96 孔 MT 板 和 Multidrop S20 装 板 器 (stacker), Titertek Instruments, Inc., Alabama。将 200 微升的每种 AZCL- 底物和脂肪酶底物和 150 微升的漆
     酶底物分装到 MT 孔中, 并将 30-50μl 培养基肉汤加入每份底物中, 26℃温育过夜。如下对 测定结果评分 : 0: 无活性 ; 1: 弱活性 ; 2: 强活性。
     结果表格 : 棉色二孢培养基肉汤的指纹分析
    底物 ACZL- 直链淀粉 ACZL- 阿拉伯聚糖 ( 去分枝 ) ACZL-β- 葡聚糖 ( 大麦 ) ACZL- 酪蛋白 ACZL- 胶原 ACZL- 凝胶多糖 ACZL- 葡聚糖 ACZL- 半乳聚糖 ( 马铃薯 ) ACZL- 半乳甘露聚糖 ( 角豆 ) ACZL-HE- 纤维素 ACZL- 支链淀粉 ACZL- 木聚糖 (Oat Spelts) ACZL- 木葡聚糖 Chicago Sky Blue PVA/ 大豆油
    a b酶活性 α- 淀粉酶 内切 -1, 5-α-L-arabinanase β- 葡聚糖酶、 地衣酶和纤维素酶 蛋白酶 蛋白酶 内切 -1, 3-β-D- 葡聚糖酶pH3 0a 0 2 Ntb 0 1pH7 1 2 1 2 1 0 0 2 2 2 0 2 2 0 0内切 -1, 6-α-D- 葡聚糖酶 ( 葡聚糖酶 ) 0 内切 -1, 4-β-D- 半乳聚糖酶 内切 -1, 4-β-D- 甘露聚糖酶 内切 - 纤维素酶 极限糊精酶 ( 支链淀粉酶 ) 内切 -1, 4-β-D- 木聚糖酶 内切纤维素酶 漆酶 脂肪酶 0 2 2 0 2 0 0 0活性测定的结果评分 : 0 =无活性 ; 1 =弱反应 ; 2 =强反应
     nt =未测试
     A.cDNA 文库构建
     用标准的分子生物学技术 (Ausuble 等 1995″ Current protocols in molecular biology″ Publ. : John Wiley and sons) 制备来自 Botryosphaeria rhodina CBS 274.96 的 cDNA。
     cDNA 文库生产中使用的生物质的发酵是从在 28℃下温育了 7 天的接种的 PDA 板 开始的。在有 Mex1 培养基的摇瓶中接种数个菌丝体 -PDA 琼脂塞 (plugs), 其中 Mex1 培养基含有 ( 每升 ) : 20g 大豆, 15g 麦麸, 10g 微结晶纤维素 (cellulose Avicel), 5g 麦芽糖糊 精 01, 3g 细菌用蛋白胨 (bacto peptone), 0.2g 聚氧丙烯 (pluronic)PE6100, 和 1g 橄榄油。 在 26℃下 150rpm 振荡这些摇瓶。7 日后通过 Miracloth 过滤收集菌丝体, 并将菌丝体冷冻 在液氮中, 在 -80℃下保存直到使用。
     RNA 分离 : 从冰冻、 粉状的 Botryospaeria rhodina 菌丝体制备总 RNA, 方法是通过 硫氰酸胍提取, 然后通过 5.7M CsCl 的下层 (cushion) 超速离心 (Chirgwin, J.M., Przbyla, A.E., Macdonlad, RJ. 和 Ruttwer W.J., Isolation of biologically active ribonucleic acid from sources enriched in ribonuclease, Biochemistry 18, 5294-5299, 1979)。 用 寡聚 (dT)- 纤维素亲和色谱 (Aviv, H. 和 Leder, P., Purification of biologically active globin messenger RNA by chromatography on oligothymidylic acid-cellulose, Proc. Natl.Acad.Sci.USA 69(6), 1408-1412, 1972) 分离富含多聚 A 的 RNA。
     cDNA 文库的构建 : 根据 Gubler U 和 Hoffman, B.J., A simple and very efficient method for generating cDNA libraries, Gene 25(2-3), 263-269, (1983) ; Sambrook, J., Fritsch, E.F. 和 Maniantis, T.Molecular cloning : A laboratory Manual, 第二版, 1989, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York 和 Kofod 等 (1994) 的一般方法使用多聚 A-Not1 引物 (Promega, 美国 ) 合成双链 cDNA。合成以后, 用绿豆核 糖核酸酶处理 cDNA, 用 T4 DNA 聚合酶平末端化, 然后与摩尔数过量 50 倍的 EcoRI 接头 (Invitrogen, 美国 ) 连接。根据制造商的指导, 用限制酶 NotI(New England Biolabs, 美 国 ) 切割 cDNA, 然后用琼脂糖凝胶电泳将 cDNA 按大小分级。 将对应于 700bp 及更大的 cDNA 从凝胶上切下并用 GFX DNA 分离试剂盒 (AP Biotech) 纯化。然后通过连接反应将制备好 的 cDNA 定向克隆到 EcoRI-NotI 切割的 pMHas5 中。通过电穿孔将连接混合物导入 DH10B 细胞 (Invitrogen) 后, 铺到含 50mg/ 升卡那霉素的 LB 琼脂上。从原先的 cDNA-pMHas5 载 体连接产物的总共 30,000 个转化体制备 cDNA 质粒池 (pool)。根据 Qiagen 的质粒 DNA 分 离操作规程 (Qiagen Inc.GMBH), 从固体 LB 卡那霉素选择培养基上回收的菌落的池中直接 制备质粒 DNA。
     用于克隆的载体是 pMhas5, 其在专利 WO 03/044049 中有记载, 具有下面的特征 :
     特征 部位 描述
     CDS 365-1156 卡那霉素抗性
     CDS 2232-2387 β- 半乳糖苷酶 α 肽
     -10 信号 2189-2192 SD 序列
     启动子 2101-2189 Lac 启动子
     多样性特征 626-650 BACE 系统的 KanP1 引物
     该质粒值得注意的特征是 Lac 启动子的 SD 区域附近的 EcoRI-NotI 限制位点。它 使得带 EcoRI-NotI 接头的 cDNA 能够被克隆到载体中, 且使所得的构建体在大肠杆菌宿主 中能够被活跃地转录和翻译。
     B. 转座子的构建和制备
     如 WO 01/77315 A1 所述的, 转座子协助信号捕捉 (Transposon Assisted Signal Trapping, TAST) 的基本原理是, 将所选的基因组中所有的基因通过转座子标签与编码无信 号的 β- 内酰胺酶的基因相融合。这样, 当在含有氨苄青霉素的培养基中培养包含通过转座子标签与编码无信号的 β- 内酰胺酶的基因融合的基因组的基因的宿主细胞克隆时, 只 有表达和分泌 β- 内酰胺酶的那些克隆能够生存。但是, 只有在与 β- 内酰胺酶基因融合 的基因具有能够被宿主株系识别的完整启动子和核糖体结合位点 ( 即, 在真实的生命过程 中被细胞表达产生多肽的基因 ), 而且 β- 内酰胺酶被这样翻译, 使得合成的多肽被转运穿 过细胞质膜并正确地折叠的条件下, β- 内酰胺酶才会被分泌。因此, 当将融合的基因插入 到选择的宿主细胞时, 那些氨苄青霉素抗性的克隆就含有编码功能性分泌多肽的基因。
     通常, 使用 TAST 方法时甚至不需要表达整个基因。当给基因加上转座子标签时, 这些基因的 N 末端部分作为融合蛋白表达, 就显示这些基因含有完整的转录、 翻译和分泌 序列。因此, 通常认为这些基因的 N 末端部分作为融合蛋白的表达足以保证整个基因的表 达和分泌。
     因此可以下结论 : 通过 TAST 方法得到的基因确实编码分泌的功能性多肽。
     含 β- 内酰胺酶报道基因的 SigA4 转座子的构建 :
     按照 WO 01/77315 A1 的指导, 使用标准分子生物学技术构建含有无信号 β- 内 酰胺酶基因的转座子。首先, 使用具有校正活性的 (proofreading) 聚合酶 (Pfu Turbo, Stratagene, 美国 ) 从 pUC19 载体 PCR 扩增无信号 β- 内酰胺酶基因。 所得的 PCR 片段含有 NotI 和 EcoRI 限制性位点以便于克隆。含有 Entranceposon 和抗生素抗性标记 CAT( 在转 座子中编码氯霉素抗性 ) 的质粒 pEntranceposon(Camr) 是从 Finnzymes, OY 获得的 (Espoo 芬兰 )。 用限制酶 NotI 和 EcoRI 消化该质粒, 凝胶纯化后与含有无信号的 β- 内酰胺酶的片 段连接。 将连接产物转化到电转化感受态 (electro-competent) 的 DH10B 细胞中, 通过限制 性分析鉴定含有带有所述无信号的 β- 内酰胺酶的质粒的大肠杆菌克隆, 并命名为 SigA2。
     为制备转座子, 构建了较小的 SigA2 衍生物, 其缺乏编码 β- 内酰胺酶的 bla 基因 : 使用结合到 SigA2 的 bla 基因的起始和终止处, 且方向向外的两个寡核苷酸引物 SigA2NotU-P 5′ -TCG CGA TCC GTT TTC GCA TTT ATC GTG AAA CGC T-3′ (SEQ ID NO : 43) 和 SigA2NotD-P 5′ -CCG CAA ACG CTG GTG AAA GTA AAA GAT GCT GAA-3′ (SEQ ID NO : 44) 来 PCR 扩增没有 bla 基因的 SigA2。该 PCR 反应产生的大约 3.6kb 的扩增产物经过 重新连接 (relegate) 后转化到合适的大肠杆菌菌株中。从能在 LB 氯霉素但不能在 LB 氨 苄青霉素上生长的转化体中分离了 3.6kb 的质粒。该质粒保留了所有两个 BglII 位点并缺 少活性的 blg 基因, 被称为 pSig4( 图 1)。
     60 微升浓度为 0.3μg/μl 的 pSigA4 质粒 DNA 制备物用 BglII 消化并在琼脂糖凝 胶上分离。将 2kb 的 SigA2 转座子 DNA 条带洗脱下来, 并根据供货商的指导, 用 “GFXTMPCR、 DNA 和 凝 胶 条 带 纯 化 试 剂 盒” (PCR, DNA and Gel Band Purification Kit)(Amersham Pharmacia Biotech Inc. 美国 ) 纯化, 用 200 微升 EB 缓冲液洗脱。这样制备的 SigA2 可以 用于转座子协助信号捕捉 (TAST, 见下文 )。
     C. 转座子标签
     从 pSigA4 制备的转座子带有 5’ 截短的 bla 基因, 该基因编码除去了分泌信号的 β- 内酰胺酶。β- 内酰胺酶只有在被分泌到周质时才能赋予大肠杆菌氨苄青霉素抗性, 而 β- 内酰胺酶的细胞质表达不能赋予氨苄青霉素抗性。如果没有信号序列, β- 内酰胺酶 将不会被转运到周质中, 从而克隆也就不会在含有氨苄青霉素的培养基上生长。无信号的 β- 内酰胺酶基因以这样的方式包含在转座子中, 使得转座子的边界和 β- 内酰胺酶编码区域之间存在连续的开放阅读框。这样, 被改变的转座子当转座到编码分泌的蛋白质的基 因中时, 可以导致与目标基因的共阅读框 (in-frame) 的融合。这样就导致分泌到大肠杆菌 周质并赋予氨苄青霉素抗性的融和基因产物的产生。 而如果转座子整合到编码非分泌蛋白 的基因中, 即使是共阅读框的, 相应的宿主也不会成为氨苄青霉素抗性。
     D.Botryosphaeria rhodina 的转座子协助信号捕捉
     关于转座子协助信号捕捉的完整描述可以在 WO 01/77315 中找到。从最初的 cDNA-pMHas5 载体连接产物的总共 30,000 个转化体构建了 cDNA 质粒池。根据 Qiagen 的 质粒 DNA 分离操作规程 (Qiagen Inc.), 从固体 LB 卡那霉素选择培养基上回收的菌落的池 中直接制备质粒 DNA。根据转座酶制造商的指导 (Finnizyme, Finland), 用转座子 SigA2 和 MuA 转座酶处理质粒池。
     为了给 Botryosphaeria rhodina CBS 274.96 cDNA 文库加转座子标签, 将含有约 2.6 微克的 DNA 的 SigA2 转座子 4 或 8 微升, 与质粒池 DNA 的 DNA 浓度的 Botryosphaeria rhodina CBS 274.96 cDNA 文库 1 微升, Finnzymes MuA 转座酶 2 微升 (0.22 微克 / 微升 ), 和 5x 缓冲液 ( 来自 Finnzymes OY, Espoo, 芬兰 )5 微升在 50 微升的总体积中混合, 并在 30℃温育 3.5 小时, 然后在 75℃热失活 10min。加入 5 微升 3M 乙酸钠 pH5 和 110 微升 96% 乙醇, 并在 20000rpm 离心 30min 使 DNA 沉淀。洗涤沉淀并干燥, 然后在 10 微升 TE 缓冲液 中重悬。
     在 Biorad 基因脉冲设备 (50μF, 20mAmp, 1.8kV) 中, 1.5 微升的加有转座子标签 的质粒池通过电穿孔导入 20 微升的 DH10B 超感受态 (ultra-competent) 细胞, 根据随该细 胞提供的标准操作规程 (Gibco-BRL) 进行。将电穿孔的细胞在振荡下温育在 SOC 培养基中 (28℃, 2 小时, 250rpm), 然后铺在选择培养基上。使用了 3 种琼脂培养基 :
     LB+50mg/ml 卡那霉素,
     LB+ 卡那霉素 +15mg/ml 氯霉素和 / 或
     LB+ 卡那霉素 + 氯霉素 +12.5mg/ml 氨苄青霉素。
     通过将电穿孔产物稀释并铺在 LB+ 卡那霉素 + 氯霉素培养基上, 确定了每份电穿 孔物大约存在 72,000 个含有带 SigA2 转座子的 cDNA 文库质粒的菌落, 且在三重选择 (LB、 卡那霉素、 氯霉素、 氨苄青霉素 ) 下, 大约回收了 69 个菌落。进一步进行电穿孔和铺板实 验, 直到在三重选择下从实验中总共回收 445 个菌落。根据 Qiagen Qiaturbo96 操作规程 (Qiagen Inc. 美国 ) 对这些菌落进行质粒小量提取 (miniprep)。根据国际专利申请 WO 01/77315 的实施例中公开的方法 ( 第 28 页 ), 用转座子正向和反向引物 ( 引物 A 和 B) 对 质粒测序。
     引物 A : AGCGT TTGCG GCCGC GATCC(SEQ ID NO : 45)
     引物 B : TTATT CGGTC GAAAA GGATC C(SEQ ID NO : 46)
     E. 序列组装和注释
     用 AB3700 毛细管测序仪获得反应物的 DNA 序列。 修整这些序列以去除每个质粒的 载体和转座子序列及 A 和 B 引物读取结果。由此得到 225 个组装的序列, 使用 PhredPhrap 程序 (Brent Ewing, LaDeana Hillier, Michael C.Wendl 和 Phil Green ; Base-calling of automated sequencer traces using phred I.Accuracy assessment ; Genome Research ; 8: 175-185 ; 1998 ; Brent Ewing 和 Phil Green ; Base-calling of automated se-quencertraces using phred II.Error probabilities ; Genome Research 8 : 186-194 ; 1998) 将它 们分为 148 个毗连群 (contigs)。 然后使用 BLASTX 程序 2.0a19MP-WashU[1998-7-14][ 构建 Linux-x86 18 : 51 : 44 30-Jul-1998](Gish, Warren 1994-1997- 未公开 ; Gish, Warren 和 David J.States ; Identification of protein coding regions by database similarity search ; Nat.Genet.3 : 266-72 ; 1993), 将所有 148 个毗连群与可从标准公共 DNA 和蛋白质 序列数据库 (TrEMBL, SWALL, PDB, EnsemblPep, GeneSeqP) 获得的序列比较。
     所得的序列大部分是编码完整的功能性多肽的功能性基因, 如上所述其从氨苄青 霉素抗性克隆获得, 用作人工分析的基础。
     为了确认所述菌落的氨苄青霉素抗性是 β- 内酰胺酶活性增加的结果, 在 10 个 cDNA 上转座子的到达位点 (landing site) 不同的信号捕捉克隆中测试了 β- 内酰胺酶活 性。根据 Invitrogen Life Technologies 的操作规程将质粒 DNA 重新转化到 One Shot Top10 化学感受态大肠杆菌中, 并将转化混合物涂布在带卡那霉素 (50μg/ml) 和氯霉 素 (10μg/ml) 的 LB 琼脂上。28 ℃下 2 天后, 将菌落影印铺板到 LB 卡那霉素、 氯霉素和 15(10μg/ml) 氨苄青霉素的 LB 上。 28℃下 3 天后, 将真正生长的菌落 (true growers) 接种 到含卡那霉素 (50μg/ml) 和氯霉素 (10μg/ml) 的 10ml LB 培养基中, 37℃, 275rpm 温育过 夜。将过夜培养物按 1 ∶ 100 稀释在新鲜的 LB Kan/CAM 培养基中并培养到 OD600 = 0.5。 离心收集细胞并用 0.9% NaCl 洗涤一次。 将沉淀悬浮在超声处理缓冲液 (100mM Tris-HCl, 2mM EDTA, pH 8.0) 中, 调节细胞数到光密度 OD600 = 0.5, 用 Soniprep 150(MSE) 以 1.5μm 的振幅超声处理。 将样品在 15,000rpm 离心 10min, 将上清用于 β- 内酰胺酶测定。 在塑料比 色皿中, 将上清与 50μl nitrocefin 生色 β- 内酰胺酶底物 (1mg/ml, 于 50% DMSO ; 0.05M PO4 缓冲液中 ) 和 0.1M PO4 缓冲液混合到 1ml, 然后用 3300pro 分光光度计测量 Abs482。结 果如下所示 :
     表 IX : 具有不同的 Shine Dalgarno(SD) 序列和 ATG 翻译起始密码子和之间的距 离和转座子到达位点的克隆 β- 内酰胺酶活性
    上表说明了 3 个要点 :
     1) 所有 10 个克隆中都可检测到 β- 内酰胺酶活性。 应当强调的是, 相应的含有质 粒的大肠杆菌转化体对 50mg/ 升氨苄青霉素选择有抗性。这些事实共同显示, 所有 10 个克 隆都产生由融合到 β- 内酰胺酶基因的带转座子标签的 cDNA 的一部分组成的杂合蛋白, 其 中以提供具有 β- 内酰胺酶活性的肽的方式融合。
     2) 由于这 10 个克隆的 cDNA 被完全测序, SigA2 转座子在每个克隆中的到达位置 得到了证实。这 10 个克隆都含有 SigA2 转座子, 其处于正确的方向和阅读框中, 以促使天 然的被编码蛋白的 N 末端与转座子所编码的 β- 内酰胺酶发生杂合融合。
     3) 在真核 cDNA 中, 非翻译的上游 (5’ UTR) 前导序列的长度可在 1bp 到数百个碱 基对之间变化。为了从大肠杆菌翻译元件例如 Shine-Dalgarno 区域最优地翻译 cDNA, ATG 起始密码子之前 4 到 11 个碱基对的最优距离是最优的。由上表可见, 比最优值长得多的 5’ UTR 还是容许表达一些 cDNA 杂合体 -β 内酰胺酶融合蛋白, 因为从样品中的转化大肠杆 菌中观察到了 β- 内酰胺酶活性。
     所得的本发明的核苷酸序列是功能性基因编码完整的功能性多肽, 不但由于上述 原因, 而且因为它们是从氨苄青霉素抗性克隆获得的。这里获得的克隆是氨苄青霉素抗性 的, 因为加上转座子标签后, 这些基因与无信号的 β- 内酰胺酶基因融合, 无信号的 β- 内 酰胺酶基因只有当与具有在宿主株中可被识别的完整启动子和核糖体结合位点的基因融 合时, 才能被表达、 翻译、 转运穿过细胞质膜并正确地折叠。
     因此, 可以作结论, 本发明的基因确实编码活性的分泌的多肽。因为 16 个基因的 序列分析显示得到了与无信号的 β- 内酰胺酶基因的共阅读框融合。另外, 通过测定整个 核苷酸序列, 确证了这些基因的开放阅读框的完整。
     实施例 2 通过同源性确定酶活性
     通过与已知功能的基因或多肽比较, 可以预测基因或被编码的多肽的功能。分析
     了 ADNA 组和 B 多肽组序列与来自公共和内部数据库的序列之间的相似性, 以确定 ADNA 组和 B 多 肽组序列的功能性。序列比较是用程序 BLASTX 2.0a19MP-WashU[1998-7-14] 进行的。通过 将 ADNA 组和 B 多肽组序列与其最接近的功能已知的序列进行仔细的人工序列比对, 为预测这 些基因和被编码的多肽的功能提供了可能。即使在全体氨基酸的同一性低于 40%, 从而可 能难以作出可靠的预测的情况下, 通过仔细地分析并判读催化位点和 / 或多肽序列的重要 区域中的氨基酸残基, 预测 ADNA 组和 B 多肽组序列的功能也是可能的。如果已知序列的催化 位点的氨基酸也存在于本发明的多肽中, 同时具有足够的全体氨基酸的同一性, 就可以断 定该来自 Botryosphaeria rhodina CBS 274.96 的多肽与所述已知序列具有同样的功能。
     实施例 3 制备 B 多肽组多肽
     为了从丝状真菌例如 Botryosphaeria rhodina CBS 274.96 的 cDNA 制备多肽, 在 酵母或另外的丝状真菌中表达该 cDNA 是可行的。作为非穷举性的例子, 一种好的选择是在 米曲霉中表达。下面给出了怎样在米曲霉中表达编码木聚糖酶的 cDNA(SEQ ID No : 3)。
     使用表达质粒 pDaU71。 该质粒含有 (1) 构巢曲霉 amdS 基因, 作为曲霉中的选择标 记; (2) 酵母 URA3 基因, 其被氨苄青霉素抗性基因隔断, 用于在大肠杆菌中选择 ; (3) 带 3 个 额外的 amyR- 位点的黑曲霉 NA2 启动子 ( 中性淀粉酶 )+ 构巢曲霉 TPI 启动子 5′非翻译部 分的重叠, 用于异源表达 ; 和 (4) 黑曲霉 AMG 终止子。作为扩增 Botryosphaeria rhodina cDNA 文库池的相关部分的模板, 在 PCR 反应中使用下面的引物 :
     引物 #166 : CGCGGATCCACCATGGTCTCCTTCAAGTCGATTC(SEQ ID NO : 47)
     引物 #167 : CCGCTCGAGTTACTGCACGGTAATCGTAGC(SEQ ID NO : 47)
     使用下面的条件 :
     按照制造商的指示, 使用 Extensor Hi Fidelity Reddy Load DNA 聚合酶 PCR 混 合液 (ABGene, 英国 )。
     cDNA 质粒池 (1 纳克 / 微升 ) : 5 微升
     引物 #166 1 微升
     引物 #167 1 微升
     PCR 主混合液 (master mix) 12.5 微升
     去离子水 7.5 微升
    总体积 25 微升
     将反应物转入预热到 94℃的 MJ Research DNA 扩增仪中, 然后进行下面的循环 :
     94℃ 2 分钟
     然后 25 个循环的 :
     94℃ 30 秒
     53℃ 30 秒
     72℃ 1 分钟
     然后
     72℃ 10 分钟
     用 1%琼脂糖凝胶分析 5 微升的产物以确认正确的大小并确定所得的 PCR 产物的 量。 根据制造商的指示 (AP Pharma) 用 GFX 纯化所剩的 20 微升混合物。 用 40 微升纯化产物
     中的 20 微升在 30 微升标准的过夜消化反应体系中进行标准的 BamHI-XhoI 限制消化。 然后 再用 GFX 纯化限制消化的产物, 再将其与经过 BamHI-XhoI 限制消化并纯化的 pDau71 进行 标准的连接反应。 将连接产物转化到 DH10B 大肠杆菌细胞中 ( 大肠杆菌 DH10B 或 TOP10( 可 从 Invitrogen 获得 ) 在该表达载体的构建中可用作克隆宿主 ), 并在 LB 氨苄青霉素培养基 上铺板。选择 10 个转化体进行质粒 DNA 纯化, 并对其测序以确定插入片段的序列完整性。 选择一个无 PCR 错误的克隆 pPFJO47 用于进一步研究。
     如 WO 00/39322 所述构建米曲霉 BECh2 株 (BECh2 得自米曲霉 JaL228, 该菌株是 如 WO 98/12300 所述以保藏的菌株米曲霉 IFP4177 为基础构建的 )。转化和培养条件根据 Christiansen 等, 1988, Biotechnology 6, 1419-1422 及如 WO 01/12794-A 第 63 页所述进 行。进行一轮再分离后, 用来自转化体的孢子接种 Nunc 管中的 10ml YP 葡萄糖或 YP 麦芽 糖, 并将培养物在 30℃下培育 3 天。
     将来自上述 10ml 培养物的 10 微升上清样品进行 SDS 凝胶电泳。用 SYPRO Orange Protein Gel Stain(Molecular Probes) 对凝胶染色。 数种曲霉转化体在 SDS 凝胶上具有显 著的条带。 通过在 pH 6.0 下进行 AZCL- 小麦阿拉伯木聚糖进一步分析这些阳性结果的木聚 糖酶活性。 在 0.2M 磷酸钠盐 (Na-phosphate) 缓冲液, pH 6.0+0.01% Triton-X 100 中将底 物即来自小麦的 AZCL- 阿拉伯木聚糖 (Megazyme) 制备为 0.2% w/v 的悬液。在 Eppendorf 热混合仪 (thermomixer) 中将 900 微升的底物预热到 37℃。向底物中加入 100 微升来自重 组宿主菌株 Bech2 的粗培养液上清或不同样品并在最大速度下在 37℃温育 15min。然后将 反应混合物在冰上放置 2 分钟, 在用 20,000xG 离心 1min。将 2x 200 微升的上清转移到微 量滴定板并在 OD590 测量。测定吸光度的增加作为活性。
     实施例 4 测定木聚糖酶活性
     活性的测定使用合适的缓冲液中的合成并分泌木聚糖酶的宿主株的培养液或细 胞裂解物。将合适体积的这样的样品点到琼脂平板上, 琼脂平板上含有不溶性的生色底物 TM AZCL-Birch 木聚糖 (Megazyme ) 和合适的缓冲液, 其 pH 为例如 4.5-7.5。在合适的温度, 例如 37℃下, 将平板温育合适的时间, 例如一天。活性可见为点周围的蓝色的晕圈 (halo)。
     实施例 5 测定过氧化物酶活性
     过氧化物酶可以使用如 Ishida 等 : 1987 所述的 2, 4- 二氯苯酚方法 (Ishida, A., N.Futamura 和 T.Matsusaka.1987.Detection of peroxidase acitvity and its localisation in the forespore envelopes of Bacillus cereus.J.Gen.Appl. Microbiol.33 : 27-32.) 用分光光度法来测定。作为指示剂, 可以使用 100mM 磷酸钾缓冲液 (pH 7.0) 中的 1.0mM 2, 4- 二氯苯酚和 82mM 的 4- 氨基安替比林 (aminoantipyrine) 的混 合物, 合适的底物是 100mM 磷酸钾缓冲液 (pH 7.0) 中的 50mM 过氧化氢 (Sigma)。
     将 200 微升合适地稀释的培养液上清加入 1ml 塑料比色皿。加入 200 微升指示剂 混合物。加入 200 微升过氧化氢底物启动反应。用标准的分光光度计在 510nm 处测量吸光 度的变化。
     实施例 6 测量对纤维素降解酶或酶混合物的纤维素降解促进作用
     某些分泌的蛋白质在纤维素降解酶或其混合物存在下显示纤维素降解的协同作 用 (synergistic action)。 这些分泌的蛋白质本身可具有或不具有水解酶活性。 在专利申 请号 US11/046,124 和相应的 2005 年 7 月 30 日公布的 PCT 申请 PCT/US2005/003525 中可以找到这样的分泌蛋白的例子和如何检测它们的纤维素降解促进作用, 特别是使用实施例 24 和 25-28 的任一项, 在此将其引入供参考。
     一种测定该促进作用的方法如下 : 将合成并分泌纤维素酶促进性多肽的宿主株 的培养液或细胞裂解物用装有截留为 10kDa 的 PM10 膜的 Amicon 搅拌小室 (Millipore, Billerica, MA) 浓缩后, 用 Econo-Pac 10DG 柱 (BioRad Laboratories, Hercules, CA) 脱 盐。用 BCA(bicinchoninic acid, P.K.Smith 等 1985, Anal.Biochem.150 : 76) 蛋白质测定 试剂盒 (Pierce, Rockford, IL) 使用 BSA 作为标准测定蛋白浓度后, 将这些多肽储液保存 在 -20℃。对这些多肽不作进一步纯化, 并根据测得的总蛋白将储液添加到反应混合物中。
     在美国能源部国立可再生能源实验室 (U.S.Department of Energy National Renewable Energy Laboratory(NREL)) 用稀硫酸预处理玉米秸秆。预处理使用下面的条 件: 1.4wt%的硫酸, 165℃和 107psi 下 8 分钟。根据 NREL, 预处理过的玉米秸秆 (PCS) 中 的水不溶性固体含有 56.5%纤维素, 4.6%半纤维素和 28.4%木质素。纤维素和半纤维素 是使用 NREL 标准分析程序 (NREL Standard Analytical Procedure)#002, 进行二阶段硫 酸水解后, 利用高效液相色谱测定进行糖分析而测定的。木质素是使用 NREL 标准分析程序 #003, 用硫酸水解纤维素和半纤维素级分后通过测量重量而测定的。在酶促水解前, 在玻 璃滤器上用大体积的去离子水” ish” 所述 PCS ; 得到水 “ish” 过的 PCS 的干重。通过在咖 啡磨 (coffee-grinder) 中粉碎, 然后在 22μm 的 Millipore 滤器 (6P Express Membrane, Stericup, Millipore, Bedford, MA) 上用去离子水 “ish” , 从水 “ish” 过的 PCS 制备粉碎的 PCS。
     PCS 的水解是用 1.1ml Immunoware 小管 (Pierce, Rockford, IL) 进行的, 所用的总 反应体积为 1.0ml。在该操作规程中, PCS(10mg/ml 于 50mM 乙酸钠 pH5.0 缓冲液中 ) 的水 解, 是在纤维素蛋白加样量的 3%的米曲霉 β- 葡糖苷酶 ( 根据 WO 02/095014 在米曲霉中 重组表达 ) 的存在下, 使用不同的蛋白质加样量 ( 表示为 mg 的酶每克 PCS) 的待测的本发 明的多肽或 Celluclast 1.5L 样品 (Novozymes A/S, Bagsvaerd, 丹麦 ) 来进行。本发明 的多肽的 PCS 水解能力的筛选在 50℃ (Isotemp 10S 水浴或 TS Autoflow CO2 夹层培养箱 ) 下进行。通常, 反应按一式四份进行并在水解过程中取等份样品。通过混合 20μl 等份的 每份水解物和 180μl 0.11M NaOH( 终止试剂 ) 来终止 PCS 水解反应。对每份试样作适当 的连续稀释, 并利用下述的适用于 96 孔微量培养板规格的对羟基苯甲酰肼 (PHBAH, Sigma, St.Louis, MO) 测定法测定还原糖含量。简单地说, 将 90μl 等份的适当稀释的样品置于 96 孔圆锥底微量培养板中。向各个孔中加入 2% NaOH 中的 1.5% (w/v)PHBAH 60μl。将板在 95℃不加盖加热 10 分钟。让板冷却到室温 (RT), 然后向各个孔加入 50μl 蒸馏水。从每 个孔转移 100μl 等份到平底 96 孔板中, 并用 SpectraMax Microplate Reader(Molecular Devices, Sunnyvale, CA) 测量 A410nm 的吸光度。用葡萄糖标准品 ( 用 0.4%氢氧化钠稀释 的, 0.1-0.0125mg/ml) 制作标准曲线以将所得的 A410nm 值转换为葡萄糖当量。 用所得的当量 计算每个反应的 PCS 纤维素转化百分率。
     纤维素转化为还原糖的程度 ( 转化率,% ) 用下面的等式计算 :
     转化率 (% ) = RS(mg/ml)*100*162/( 纤维素 (mg/ml)*180) =
     RS(mg/ml)*100/( 纤维素 (mg/ml)*1.111)
     在该式中, RS 是以葡萄糖当量 (mg/ml) 量度的溶液中的还原糖浓度, 因子 1.111 反映了纤维素转化为葡萄糖的重量增加。
     为了筛选能够促进 Celluclast 1.5L 性能的本发明的多肽, 进行 PCS 水解反应 (1.0ml 的操作规程, 10g PCS 每升, 50℃, 加入总加样量的 3%的米曲霉 β- 葡糖苷酶 ), 其 中将 2.5mg 酶加样量的 Celluclast 1.5L 与 2.5mg 多肽加样量的每个样品 ( 每个反应 5mg 酶加样量的总蛋白 )。测量了由 10mg 酶加样量, 5mg 酶加样量和 2.5mg 酶加样量组成的 Celluclast 1.5L 对照反应, 并记录它们的 PCS 纤维素转化率用于比较。
     实施例 7 测定脂肪酶活性
     活性测量使用合适的缓冲液中的合成并分泌脂肪酶的宿主株的培养液或细胞裂 解物。
     脂肪酶测定 (PNV 测定 ) : 用移液器将 20 微升的稀释缓冲液加到 96 孔微量培养板 的各个孔中。向该稀释缓冲液中加入 5 微升的样品 ( 上清 )。测试开始时, 向各个孔中加入 200 微升的底物, 并将板装到 ELISA 读板器 ( 能读取 96 孔板的可编程的分光光度计 ) 上。 每 30 秒测量一次 405nm 的吸光度, 测量 10 分钟。用时间对 abs405 曲线的斜率作为任意活 性单位。
     稀释缓冲液 : 25ml 2M Tris/HCl pH 7.5, 0.50ml 2M CaCl2, 2.5ml 15% Brij 35, 用水调节到 500ml。
     底物储备溶液 : 将 0.1295g(117 微 升 ) 的 戊 酸 对 硝 基 苯 酯 (p-Nitrophenyl valerate)SIGMA N 4377( 密度 1.11g/ml) 溶于 10ml 甲醇中。在冷冻装置中保存。
     底物 : 将 100 微升底物储备溶液与 10ml 稀释缓冲液混合。
     实施例 8 测定蛋白酶和肽酶活性
     在具有选定的肽酶活性最佳的 pH 缓冲液中的合成并分泌肽酶和 / 或蛋白酶的宿 主株的培养液或细胞裂解物, 其所述活性可以这样测定 : 将合适的样品体积 ( 例如 20 微 升 ) 点样在琼脂平板上, 其中该琼脂平板含有不溶性生色底物 AZCL- 酪蛋白 (MegazymeTM) 或 AZCL- 胶原 (MegazymeTM) 或 Azocoll(Sigma-Aldrich), 例如 0.1% w/w 的水平。在适合 于肽酶起作用的温度下, 例如 37℃下, 将平板温育合适的时间, 例如 1 天。活性可见为点周 围的蓝色晕圈。可以用非标记的胶原或非标记的酪蛋白来代替 AZCL- 酪蛋白和 AZCL- 胶原 (MegazymeTM)。 在被点样到琼脂平板的非标记的胶原或非标记的酪蛋白上, 有肽酶和 / 或蛋 白酶存在时形成清楚的区域。
     实施例 9 测定内切阿拉伯糖酶活性
     在具有选定的肽酶活性最佳的 pH 缓冲液中的合成并分泌阿拉伯糖酶的宿主株的 培养液或细胞裂解物, 其所述活性可以这样测定 : 将合适的样品体积 ( 例如 20 微升 ) 点样 在琼脂平板上, 其中该琼脂平板含有不溶性生色底物 AZCL- 阿拉伯聚糖, 例如 0.1% w/w 水 平。 在适合于阿拉伯糖酶起作用的温度下, 例如 37℃下, 将平板温育合适的时间, 例如 1 天。 活性可见为点周围的蓝色晕圈。
     该测定可以在不同的 pH 下进行。在酸性 pH 下, 可以通过将 0.1g AZCL- 阿拉伯聚 糖 (Mazurine 染色的交联底物, Megazyme, 爱尔兰 ) 溶于 100ml 0.2M 琥珀酸 pH3+10 微升 Triton X-100(0.01% ) 得到 0.1% AZCL- 阿拉伯聚糖终浓度, 来制备 AZCL- 阿拉伯聚糖。 在中性 pH 下, 可以通过将 0.1g AZCL- 阿拉伯聚糖 (Mazurine 染色的交联底物, Megazyme, 爱尔兰 ) 溶于 50ml 无菌水加 10 微升 Triton X-100(0.01% ) 中来制备 AZCL- 阿拉伯聚糖。然后在该 50ml AZCL 底物中加入 50ml 0.4M MOPS pH 7 得到 100ml 的终体积, 及 0.2M 缓冲 液, 0.1% AZCL 的终浓度。
     实施例 10 测定 β- 葡糖苷酶活性
     许 多 β- 葡 糖 苷 酶 可 能 对 4- 硝 基 苯 基 -β-D- 吡 喃 葡 萄 糖 苷 或 纤 维 二 糖 至 少 有 一 些 活 性, 尽 管 这 些 可 能 不 是 它 们 的 天 然 底 物。 用 非 常 敏 感 的 甲 基 伞 形 基 (methyl-umbiliferyl)β-D- 葡 萄 糖 苷 也 可 以 发 现 活 性。 一 般 而 言 可 以 使 用 任 何 (1, 4)-β- 及 (1, 3)-β- 寡葡萄糖苷 (oligoglucosides) 作为底物, 通过 Trinder 测定系统 (The Sigma Diagnostic Glucose(Trinder)Assay, Sigma, St.Louis, MO) 测量释放的葡萄 糖, 来评估 β- 葡糖苷酶活性。
     一种测定 β- 葡糖苷酶活性的方法是制备合成并分泌阿拉伯糖酶的宿主株的培 养液或细胞裂解物的制剂, 使所述制剂含有大约 6.9X 10-6 mg/ml 的总蛋白, 100mM 柠檬酸 钠 pH 5.0, 0.01 % Tween-20 和 4mM 的对硝基苯基 -β-D- 吡喃葡萄糖苷。在 50 ℃温育该 制剂, 并在 0.5、 1、 2、 3、 3.75 和 24 小时取等份试样。向各个等份试样中加入 1M 碳酸钠 pH 10.0, 然后由 405nm 的吸光度确定对硝基苯基阴离子的浓度。
     另一种 β- 葡糖苷酶活性的方法是 : 通过首先脱盐 (BioRad Econo-Pac 10DG 柱 ), 然后浓缩 (Centricon Plus-20, Biomax-5, 5kD 截留 ) 到 0.92mg/ml 的浓度 (BCA 测定系 统 ), 来制备合成并分泌阿拉伯糖酶的宿主株的培养液或细胞裂解物的制剂。 然后将该制剂 以 0.037 和 0.0092μg/ml 总蛋白与 100mM 柠檬酸钠 pH 5.0 加 0.01% Tween-20 中的 10mM 纤维二糖在 65℃下温育。在 0.5, 1, 2, 3, 4, 6 和 19 小时取等份试样。将等份试样煮沸 6 分 钟以终止反应, 然后使用 Trinder 测定系统 (Sigma Chemical Co., St.Louis, MO) 和葡萄糖 外标测定葡萄糖浓度。
     实施例 11 测定酯酶活性
     活性测定使用合适的缓冲液中的合成并分泌酯酶的宿主株的培养液或细胞裂解 物。当选择用于测定丝氨酸酯酶活性的底物时, 应当优先选择在酯酶被底物饱和时的浓度 下不形成胶束的底物, 以获得底物的最佳转化率。
     一种测试酯酶活性的方法是测量标准条件下, 例如 30℃、 pH7.0 下, 该酶水解三醋 精的碱消耗, 其中三醋精的浓度低于三醋精的 CMC, 碱消耗表示为时间的函数。酯酶水解三 醋精会释放乙酸, 这就需要加入碱来维持 pH 恒定为 7.0( 恒定 pH 法 ), 因此维持 pH 在 7.0 所需要的碱 ( 通常以氢氧化钠的形式 ) 的量就是被水解的三醋精酯键的量度。
     另一种测试酯酶活性的方式是测量酯酶水解 PNP 乙酸酯 ( 乙酸对硝基苯酯 ) 释放 有色的 PNP。用移液器将 20 微升的稀释缓冲液加到 96 孔微量滴定板的各个孔中。将 5 微 升样品 ( 培养液上清或过滤的细胞裂解物 ) 加入稀释缓冲液中。在测定开始时向每个孔中 加入 200 微升的底物并将板装到 ELISA 读板器 ( 能读取 96 孔板的可编程的分光光度计 ) 上。每 30 秒测量一次 405nm 的吸光度, 测量 10 分钟。用时间对 abs405 曲线的斜率作为任 意活性单位。
     稀释缓冲液 : 25ml 2M Tris/HCl pH 7.5, 0.50ml 2M CaCl2, 2.5ml 15% Brij 35, 用水调节到 500ml。
     底物储备溶液 : 将合适量的乙酸对硝基苯酯溶于 10ml 甲醇中。在冷冻装置中保 存。底物 : 将 100 微升底物储备溶液与 10ml 稀释缓冲液混合。52101942428 A CN 101942433
    序列表1/63 页
     53101942428 A CN 101942433序列表2/63 页
    54101942428 A CN 101942433序列表3/63 页
    55101942428 A CN 101942433序列表4/63 页
    56101942428 A CN 101942433序列表5/63 页
    57101942428 A CN 101942433序列表6/63 页
    58101942428 A CN 101942433序列表7/63 页
    59101942428 A CN 101942433序列表8/63 页
    60101942428 A CN 101942433序列表9/63 页
    61101942428 A CN 101942433序列表10/63 页
    62101942428 A CN 101942433序列表11/63 页
    63101942428 A CN 101942433序列表12/63 页
    64101942428 A CN 101942433序列表13/63 页
    65101942428 A CN 101942433序列表14/63 页
    66101942428 A CN 101942433序列表15/63 页
    67101942428 A CN 101942433序列表16/63 页
    68101942428 A CN 101942433序列表17/63 页
    69101942428 A CN 101942433序列表18/63 页
    70101942428 A CN 101942433序列表19/63 页
    71101942428 A CN 101942433序列表20/63 页
    72101942428 A CN 101942433序列表21/63 页
    73101942428 A CN 101942433序列表22/63 页
    74101942428 A CN 101942433序列表23/63 页
    75101942428 A CN 101942433序列表24/63 页
    76101942428 A CN 101942433序列表25/63 页
    77101942428 A CN 101942433序列表26/63 页
    78101942428 A CN 101942433序列表27/63 页
    79101942428 A CN 101942433序列表28/63 页
    80101942428 A CN 101942433序列表29/63 页
    81101942428 A CN 101942433序列表30/63 页
    82101942428 A CN 101942433序列表31/63 页
    83101942428 A CN 101942433序列表32/63 页
    84101942428 A CN 101942433序列表33/63 页
    85101942428 A CN 101942433序列表34/63 页
    86101942428 A CN 101942433序列表35/63 页
    87101942428 A CN 101942433序列表36/63 页
    88101942428 A CN 101942433序列表37/63 页
    89101942428 A CN 101942433序列表38/63 页
    90101942428 A CN 101942433序列表39/63 页
    91101942428 A CN 101942433序列表40/63 页
    92101942428 A CN 101942433序列表41/63 页
    93101942428 A CN 101942433序列表42/63 页
    94101942428 A CN 101942433序列表43/63 页
    95101942428 A CN 101942433序列表44/63 页
    96101942428 A CN 101942433序列表45/63 页
    97101942428 A CN 101942433序列表46/63 页
    98101942428 A CN 101942433序列表47/63 页
    99101942428 A CN 101942433序列表48/63 页
    100101942428 A CN 101942433序列表49/63 页
    101101942428 A CN 101942433序列表50/63 页
    102101942428 A CN 101942433序列表51/63 页
    103101942428 A CN 101942433序列表52/63 页
    104101942428 A CN 101942433序列表53/63 页
    105101942428 A CN 101942433序列表54/63 页
    106101942428 A CN 101942433序列表55/63 页
    107101942428 A CN 101942433序列表56/63 页
    108101942428 A CN 101942433序列表57/63 页
    109101942428 A CN 101942433序列表58/63 页
    110101942428 A CN 101942433序列表59/63 页
    111101942428 A CN 101942433序列表60/63 页
    112101942428 A CN 101942433序列表61/63 页
    113101942428 A CN 101942433序列表62/63 页
    114101942428 A CN 101942433序列表63/63 页

BOTRYOSPHAERIARHODINA的多肽.pdf_第1页
第1页 / 共116页
BOTRYOSPHAERIARHODINA的多肽.pdf_第2页
第2页 / 共116页
BOTRYOSPHAERIARHODINA的多肽.pdf_第3页
第3页 / 共116页
点击查看更多>>
资源描述

《BOTRYOSPHAERIARHODINA的多肽.pdf》由会员分享,可在线阅读,更多相关《BOTRYOSPHAERIARHODINA的多肽.pdf(116页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN101942428A43申请公布日20110112CN101942428ACN101942428A21申请号201010261316822申请日20050806CBS2749619960312PA20040119720040806DKPA20040121520040811DK200580034120220050806C12N9/42200601C12N15/56200601C12N15/63200601C12N1/15200601C12N1/19200601C12N1/21200601C12N5/10200601C11D3/386200601A23K1/165200601A2。

2、3L1/305200601A01N63/04200601A01P15/00200601D21C9/0020060171申请人诺维信公司地址丹麦鲍斯韦72发明人柯克M施诺尔莱纳兰格珀尼尔U博尔韦格74专利代理机构北京市柳沈律师事务所11105代理人封新琴史悦54发明名称BOTRYOSPHAERIARHODINA的多肽57摘要本发明涉及BOTRYOSPHAERIARHODINA的多肽,更具体地,本发明涉及自BOTRYOSPHAERIARHODINACBS27496分泌的功能性多肽。30优先权数据62分案原申请数据83生物保藏信息51INTCL19中华人民共和国国家知识产权局12发明专利申请权利要求。

3、书1页说明书50页序列表63页附图1页CN101942433A1/1页21分离的木聚糖酶,其包括氨基酸序列,所述氨基酸序列与SEQIDNO4中所包括的成熟多肽序列具有至少90的同一性。2分离的木聚糖酶,其包括氨基酸序列,所述氨基酸序列与以CBS保藏登录号27496保藏的BOTRYOSPHAERIARHODINA菌株所分泌的GH11木聚糖酶成熟酶的氨基酸序列具有至少90的同一性。3权利要求1或2的木聚糖酶,其包含氨基酸序列,所述氨基酸序列与SEQIDNO4的氨基酸1202具有至少90的同一性。4权利要求3的木聚糖酶,其具有氨基酸序列,所述氨基酸序列与SEQIDNO4的氨基酸1202具有至少95的。

4、同一性。5权利要求3的木聚糖酶,其由SEQIDNO4的氨基酸1202组成。6多核苷酸,其包含编码权利要求3中所定义的木聚糖酶的核苷酸序列。7核酸构建体,其包含权利要求6中定义的核苷酸序列,该核苷酸序列与一种或多种指导所述木聚糖酶在宿主细胞中生产的调控序列可操作地连接。8重组表达载体,其包含权利要求7的核酸构建体。9重组宿主细胞,其包含权利要求7的核酸构建体。10生产权利要求3的木聚糖酶的方法,其包含A培养菌株以产生所述木聚糖酶,其中所述菌株的野生型形式能够产生该木聚糖酶;及B回收该木聚糖酶。11生产权利要求3的木聚糖酶的方法,其包含C在有助于产生所述木聚糖酶的条件下,培养权利要求9中定义的重组。

5、宿主细胞;及D回收该木聚糖酶。12组合物,其包含权利要求3的木聚糖酶和赋形剂。13制备权利要求12的组合物的方法,其包含将权利要求1的木聚糖酶与赋形剂混合。权利要求书CN101942428ACN101942433A1/50页3BOTRYOSPHAERIARHODINA的多肽0001本申请是申请日为2005年08月06日、申请号为2005800341202国际申请号为PCT/DK2005/000519、发明名称为“BOTRYOSPHAERIARHODINA的多肽”的发明申请的分案申请。发明领域0002本发明涉及由以保藏号CBS27496保藏的棉色二孢DIPLODIAGOSSYPINA,异名为BO。

6、TRYOSPAERIARHODINA的MRNA中包含的多核苷酸所编码的功能性多肽。本发明还涉及编码这些多肽或有助于它们表达的多核苷酸或这些多核苷酸的构建体,以及制备该多肽的方法。本发明还涉及包含该多肽的组合物和该多肽的用途。背景技术0003BOTRYOSPHAERIARHODINABERKMACURTISARX,异名DIPLODIAGOSSYPINACOOKE。目前已发表的关于这种生物的特征描述的报道非常少;SELBMANN等在2003年报道了BOTRYOSPHAERIARHODINA的外泌多糖EXOPOLYSACCHARIDE生产SELBMANNL,STINGELEF和PETRUCCIOLI。

7、M2003EXOPOLYSACCHARIDEPRODUCTIONBYFILAMENTOUSFUNGITHEEXAMPLEOFBOTRYOSPHAERIARHODINAANTONIEVANLEEUWENHOEK,842,PP135145。有单独的一篇专利涉及使用BOTRYOSPHAERIARHODINA羟化二氢大马酮作为烟草的增香剂CH654567A。通过发酵该生物还可以生产茉莉酸EP1118672A。先前已报道了纤维二糖水解酶CELLOBIOHYDROLASESWO03/000941A2和乳糖酶WO01/49878A的存在。0004在新酶的探寻中,还知道通过对可能的候选物进行特定的酶测定来筛选。

8、这样的新酶。该方法受酶测定的可用性的限制,而且不能鉴定活性尚未知的功能性酶或多肽。0005另外,全基因测序WHOLEGENOMESEQUENCING是一种获得来自特定的微生物的所有基因上的信息的已知方法,例如FLEISCHMANN等;WHOLEGENOMESEQUENCESANDASSEMBLYOFHAEMOPHILUSINFLUENZAERD;NATURE269496512;1995描述的那样。0006工业上应用的大多数酶都是被微生物分泌到介质中的酶。但是,微生物的基因组只有百分之几是编码分泌蛋白质的。例如,枯草芽孢杆菌BACILLUSSUBTILIS基因组或其最接近的亲缘物种只有4是编码分。

9、泌蛋白质的。VANDIJL等PROTEINTRANSPORTPATHWAYSINBACILLUSSUBTILISAGENOMEBASEDROADMAP;于BASILLUSSUBTILISANDITSCLOSESTRELATIVESFROMGENESTOCELLS;P337355;ALSONENSHEIN编;ASMPRESS2002。0007基因组测序的缺点之一是所得序列的绝大部分是编码非分泌蛋白质的。0008特别地,对于真核生物例如真菌而言,基因组测序的另一个缺点是基因组的大小比细菌基因组大很多倍,从而通过这种方法来发现基因要耗费更多的成本和时间。0009CDNA随机测序表达序列标签,或称ES。

10、T是另一种可以发现分泌蛋白质的手段。一般地,就分泌蛋白的鉴定而言EST方法有两个缺点1取决于被测序的CDNA文库所用的说明书CN101942428ACN101942433A2/50页4诱导条件,只有很少的CDNA,通常为0515或甚至15的CDNA编码分泌蛋白质;2所有的克隆都来自CDNA池POOL,该CDNA池是从这些在生物中与各个特定的基因成比例地存在的MRNA得来的。0010另一种已知的方法是信号捕捉SIGNALTRAPPING,该方法通过与自身缺少信号的胞外报道基因翻译融合,来鉴定编码信号肽的基因包括核苷酸。0011发明概述0012微生物的基因组包含成千上万种不同的基因,其中一些编码多。

11、肽,一些编码RNA。微生物基因组中只有有限数量的基因编码这样的功能性多肽,它们被该微生物分泌到介质中以实现其外部功能。0013这些多肽能够以显著的量在连续的过程中生产,而不破坏产生这些多肽的细胞,从这一点看它们在工业上是令人感兴趣的。0014本发明的目的是鉴定和提供由以保藏号CBS27496保藏的BOTRYOSPHAERIARHODINA分泌的、对BOTRYOSPHAERIARHODINA起功能性作用的多肽,因为这些多肽不仅可用于工业用途,而且可以以工业相关的过程/方法和产量生产。0015本发明在第一个方面中提供分离的多肽,其选自0016A包含氨基酸序列的多肽,所述氨基酸序列与由SEQIDNO。

12、2,4,6,8,10,12,14,16,18,20,22,24,26,28,3032,34,36,38,40和42构成的组的中所包含的成熟多肽具有至少90的同一性;0017B由核苷酸序列所编码的多肽,该核苷酸序列在高度严紧条件下与多核苷酸探针杂交,所述多核苷酸探针选自0018I核苷酸序列的互补链,所述核苷酸序列选自SEQIDNO1,3,5,7,9,11,13,15,17,19,21,23,25,27,39,31,33,35,37,39和41的编码成熟多肽的区域,0019II核苷酸序列中所包含的CDNA序列的互补链,所述核苷酸序列选自SEQIDNO1,3,5,7,9,11,13,15,17,19。

13、,21,23,25,27,39,31,33,35,37,39和41的编码成熟多肽的区域,0020其中所述多肽具有由SEQIDNO2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40和42构成的组中所包含的相应成熟多肽的功能。0021本发明的另一个方面涉及分离的酶,其选自0022A包含氨基酸序列的酶,所述氨基酸序列与选自以CBS保藏号27496保藏的BOTRYOSPHAERIARHODINA菌株所分泌的木聚糖酶、丝氨酸酯酶、过氧化物酶、GH61A多肽、GH61B多肽、GH61C多肽、GH61D多肽、葡糖苷酶、内切阿拉伯糖酶ENDOARAB。

14、INASE和胃蛋白酶肽酶的成熟酶的氨基酸序列具有至少90的同一性。0023B由核苷酸序列编码的多肽,该核苷酸序列在高度严紧条件下与选自下列的多核苷酸探针杂交0024I核苷酸序列的互补链,所述核苷酸序列包含于以CBS保藏号27496保藏的BOTRYOSPHAERIARHODINA菌株中,并编码成熟酶,该成熟酶选自该菌株所分泌的木聚糖酶、丝氨酸酯酶、过氧化物酶、GH61A多肽、GH61B多肽、GH61C多肽、GH61D多肽、葡糖苷酶、内切阿拉伯糖酶和胃蛋白酶肽酶,0025II核苷酸序列所包含的CDNA序列的互补链,所述核苷酸序列包含于以CBS保藏说明书CN101942428ACN101942433。

15、A3/50页5号27496保藏的BOTRYOSPHAERIARHODINA菌株中,并编码成熟酶,该成熟酶选自该菌株所分泌的木聚糖酶、丝氨酸酯酶、过氧化物酶、GH61A多肽、GH61B多肽、GH61C多肽、GH61D多肽、葡糖苷酶、内切阿拉伯糖酶和胃蛋白酶肽酶;0026其中所述酶具有选自木聚糖酶、丝氨酸酯酶、过氧化物酶、GH61A多肽、GH61B多肽、GH61C多肽、GH61D多肽、葡糖苷酶、内切阿拉伯糖酶和胃蛋白酶肽酶的功能。0027本发明的另外的方面提供编码本发明多肽的多核苷酸;包含编码该多肽的多核苷酸的核苷酸构建体,其中所述多核苷酸与一种或多种指导该多肽在宿主细胞中生产的调控序列可操作地连。

16、接;包含本发明的核苷酸构建体的重组表达载体,和包含本发明的核苷酸构建体的重组宿主细胞。0028本发明的另一个方面提供制备本发明的多肽的方法,包括0029A培养包含编码本发明多肽的核苷酸序列的株系以产生所述多肽,其中所述株系能够表达并分泌该多肽;及0030B回收该多肽。0031本发明的另外的方面提供包含本发明的多肽的组合物,以及制备这样的组合物的方法,包括将本发明的多肽与赋形剂混合。0032本发明的另外的方面提供本发明的多肽或包含所述多肽的组合物在多种应用中的用途。0033具体地,本发明还涉及如下方面00341选自下组的分离多肽0035A包含氨基酸序列的多肽,所述氨基酸序列与由SEQIDNO2,。

17、SEQIDNO4,SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQIDNO12,SEQIDNO14,SEQIDNO16,SEQIDNO18,SEQIDNO20,SEQIDNO22,SEQIDNO24,SEQIDNO26,SEQIDNO28,SEQIDNO30,SEQIDNO32,SEQIDNO34,SEQIDNO36,SEQIDNO38,SEQIDNO40和SEQIDNO42构成的组中所包含的成熟多肽的序列具有至少90的同一性,0036B由核苷酸序列所编码的多肽,该核苷酸序列在高度严紧条件下与选自下组多核苷酸探针杂交0037I核苷酸序列的互补链,所述核苷酸序列选自SEQIDNO1。

18、,SEQIDNO3,SEQIDNO5,SEQIDNO7,SEQIDNO9,SEQIDNO11,SEQIDNO13,SEQIDNO15,SEQIDNO17,SEQIDNO19,SEQIDNO21,SEQIDNO23,SEQIDNO25,SEQIDNO27,SEQIDNO29,SEQIDNO31,SEQIDNO33,SEQIDNO35,SEQIDNO37,SEQIDNO39和SEQIDNO41的编码成熟多肽的区域,0038II核苷酸序列中所包含的CDNA序列的互补链,所述核苷酸序列选自SEQIDNO1,SEQIDNO3,SEQIDNO5,SEQIDNO7,SEQIDNO9,SEQIDNO11,SE。

19、QIDNO13,SEQIDNO15,SEQIDNO17,SEQIDNO19,SEQIDNO21,SEQIDNO23,SEQIDNO25,SEQIDNO27,SEQIDNO29,SEQIDNO31,SEQIDNO33,SEQIDNO35,SEQIDNO37,SEQIDNO39和SEQIDNO41的编码成熟多肽的区域,0039其中所述多肽具有由SEQIDNO2,SEQIDNO4,SEQIDNO6,SEQIDNO8,SEQIDNO10,SEQIDNO12,SEQIDNO14,SEQIDNO16,SEQIDNO18,SEQIDNO20,SEQIDNO22,SEQIDNO24,SEQIDNO26,SEQ。

20、IDNO28,SEQIDNO30,SEQID说明书CN101942428ACN101942433A4/50页6NO32,SEQIDNO34,SEQIDNO36,SEQIDNO38,SEQIDNO40和SEQIDNO42构成的组中所包含的相应成熟多肽的功能。00402选自下组的分离的酶0041A包含氨基酸序列的酶,所述氨基酸序列与选自以CBS保藏登录号27496保藏的BOTRYOSPHAERIARHODINA菌株所分泌的木聚糖酶、丝氨酸酯酶、过氧化物酶、GH61A多肽、GH61B多肽、GH61C多肽、GH61D多肽、葡糖苷酶、内切阿拉伯糖酶和胃蛋白酶肽酶的成熟酶的氨基酸序列具有至少90的同一性。。

21、0042B由核苷酸序列编码的多肽,该核苷酸序列在高度严紧条件下与选自下列的多核苷酸探针杂交0043I核苷酸序列的互补链,所述核苷酸序列包含于以CBS保藏登录号27496保藏的BOTRYOSPHAERIARHODINA菌株中,并编码成熟酶,该成熟酶选自该菌株所分泌的木聚糖酶、丝氨酸酯酶、过氧化物酶、GH61A多肽、GH61B多肽、GH61C多肽、GH61D多肽、葡糖苷酶、内切阿拉伯糖酶和胃蛋白酶肽酶,0044II核苷酸序列所含CDNA序列的互补链,所述核苷酸序列包含于以CBS保藏登录号27496保藏的BOTRYOSPHAERIARHODINA菌株中,并编码成熟酶,该成熟酶选自该菌株所分泌的木聚糖。

22、酶、丝氨酸酯酶、过氧化物酶、GH61A多肽、GH61B多肽、GH61C多肽、GH61D多肽、葡糖苷酶、内切阿拉伯糖酶和胃蛋白酶肽酶;0045其中所述酶具有选自木聚糖酶、丝氨酸酯酶、过氧化物酶、GH61A多肽、GH61B多肽、GH61C多肽、GH61D多肽、葡糖苷酶、内切阿拉伯糖酶和胃蛋白酶肽酶的功能。00463项1或2的多肽,其选自0047A包含氨基酸序列的多肽,所述氨基酸序列与选自下列的序列具有至少90的同一性0048SEQIDNO2的氨基酸1291;SEQIDNO4的1202;SEQIDNO6的氨基酸1352;SEQIDNO8的氨基酸1431;SEQIDNO10的氨基酸1185;SEQID。

23、NO12的氨基酸1218;SEQIDNO14的氨基酸1249;SEQIDNO16的1255;SEQIDNO18的氨基酸1205;SEQIDNO20的氨基酸1243;SEQIDNO22的氨基酸1415;SEQIDNO24的氨基酸1377;SEQIDNO26的氨基酸1259;SEQIDNO28的氨基酸1248;SEQIDNO30的氨基酸1149;SEQIDNO32的氨基酸1202;SEQIDNO34的氨基酸1603;SEQIDNO36的氨基酸1301;SEQIDNO38的氨基酸1438;SEQIDNO40的氨基酸1396;和SEQIDNO42的氨基酸1262;0049B由核苷酸序列编码的多肽,所述。

24、核苷酸序列在高度严紧条件下与选自下列的多核苷酸杂交0050I核苷酸序列的互补链,所述核苷酸序列选自SEQIDNO1的核苷酸55927、SEQIDNO3的核苷酸58663、SEQIDNO5的核苷酸551110、SEQIDNO7的核苷酸551347、SEQIDNO9的核苷酸1555、SEQIDNO11的核苷酸49702、SEQIDNO13的核苷酸40786、SEQIDNO15的核苷酸55819、SEQIDNO17的核苷酸61675、SEQIDNO19的核苷酸1729、SEQIDNO21的核苷酸551299、SEQIDNO23的核苷酸491179、SEQIDNO25的核苷酸70846、SEQIDNO。

25、27的核苷酸58810、SEQIDNO31的核苷酸55660、SEQIDNO33的核苷酸461854、SEQIDNO35的核苷酸64966、SEQIDNO37说明书CN101942428ACN101942433A5/50页7的核苷酸551368、SEQIDNO39的核苷酸611248,和SEQIDNO41的核苷酸64849;0051II核苷酸序列中所包含的CDNA序列的互补链,所述核苷酸序列选自SEQIDNO1的核苷酸55927、SEQIDNO3的核苷酸58663、SEQIDNO5的核苷酸551110、SEQIDNO7的核苷酸551347、SEQIDNO9的核苷酸1555、SEQIDNO11的。

26、核苷酸49702、SEQIDNO13的核苷酸40786、SEQIDNO15的核苷酸55819、SEQIDNO17的核苷酸61675、SEQIDNO19的核苷酸1729、SEQIDNO21的核苷酸551299、SEQIDNO23的核苷酸491179、SEQIDNO25的核苷酸70846、SEQIDNO27的核苷酸58810、SEQIDNO31的核苷酸55660、SEQIDNO33的核苷酸461854、SEQIDNO35的核苷酸64966、SEQIDNO37的核苷酸551368、SEQIDNO39的核苷酸611248,和SEQIDNO41的核苷酸64849。00524项3的多肽,其中所述多肽是酶,。

27、所述酶选自具有这样的氨基酸序列的多肽所述氨基酸序列与选自下列的氨基酸序列具有至少95的同一性SEQIDNO2的氨基酸1291;SEQIDNO4的1202;SEQIDNO6的氨基酸1352;SEQIDNO8的氨基酸1431;SEQIDNO10的氨基酸1185;SEQIDNO12的氨基酸1218;SEQIDNO14的氨基酸1249;SEQIDNO16的1255;SEQIDNO18的氨基酸1205;SEQIDNO20的氨基酸1243;SEQIDNO22的氨基酸1415;SEQIDNO24的氨基酸1377;SEQIDNO26的氨基酸1259;SEQIDNO28的氨基酸1248;SEQIDNO30的氨基。

28、酸1149;SEQIDNO32的氨基酸1202;SEQIDNO34的氨基酸1603;SEQIDNO36的氨基酸1301;SEQIDNO38的氨基酸1438;SEQIDNO40的氨基酸1396;和SEQIDNO42的氨基酸1262。00535项4的多肽,其中该多肽是酶,所述酶选自由这样的核苷酸序列所编码的多肽,所述核苷酸序列在极高严紧条件下与选自下列的多核苷酸杂交0054I核苷酸序列的互补链,所述核苷酸序列选自SEQIDNO1的核苷酸55927、SEQIDNO3的核苷酸58663、SEQIDNO5的核苷酸551110、SEQIDNO7的核苷酸551347、SEQIDNO9的核苷酸1555、SEQ。

29、IDNO11的核苷酸49702、SEQIDNO13的核苷酸40786、SEQIDNO15的核苷酸55819、SEQIDNO17的核苷酸61675、SEQIDNO19的核苷酸1729、SEQIDNO21的核苷酸551299、SEQIDNO23的核苷酸491179、SEQIDNO25的核苷酸70846、SEQIDNO27的核苷酸58810、SEQIDNO31的核苷酸55660、SEQIDNO33的核苷酸461854、SEQIDNO35的核苷酸64966、SEQIDNO37的核苷酸551368、SEQIDNO39的核苷酸611248,和SEQIDNO41的核苷酸64849;和0055II核苷酸序列中。

30、所包含的CDNA序列的互补链,所述核苷酸序列选自SEQIDNO1的核苷酸55927、SEQIDNO3的核苷酸58663、SEQIDNO5的核苷酸551110、SEQIDNO7的核苷酸551347、SEQIDNO9的核苷酸1555、SEQIDNO11的核苷酸49702、SEQIDNO13的核苷酸40786、SEQIDNO15的核苷酸55819、SEQIDNO17的核苷酸61675、SEQIDNO19的核苷酸1729、SEQIDNO21的核苷酸551299、SEQIDNO23的核苷酸491179、SEQIDNO25的核苷酸70846、SEQIDNO27的核苷酸58810、SEQIDNO31的核苷酸。

31、55660、SEQIDNO33的核苷酸461854、SEQIDNO35的核苷酸64966、SEQIDNO37的核苷酸551368、SEQIDNO39的核苷酸611248,和SEQIDNO41的核苷酸64849。说明书CN101942428ACN101942433A6/50页800566项3的多肽,其中所述多核苷酸编码由选自下列的多肽所组成的多肽SEQIDNO2的氨基酸1291;SEQIDNO4的1202;SEQIDNO6的氨基酸1352;SEQIDNO8的氨基酸1431;SEQIDNO10的氨基酸1185;SEQIDNO12的氨基酸1218;SEQIDNO14的氨基酸1249;SEQIDNO1。

32、6的1255;SEQIDNO18的氨基酸1205;SEQIDNO20的氨基酸1243;SEQIDNO22的氨基酸1415;SEQIDNO24的氨基酸1377;SEQIDNO26的氨基酸1259;SEQIDNO28的氨基酸1248;SEQIDNO30的氨基酸1149;SEQIDNO32的氨基酸1202;SEQIDNO34的氨基酸1603;SEQIDNO36的氨基酸1301;SEQIDNO38的氨基酸1438;SEQIDNO40的氨基酸1396;和SEQIDNO42的氨基酸1262。00577项3的多肽,其中所述多肽是GH10木聚糖酶,所述GH10木聚糖酶包含氨基酸序列,所述氨基酸序列与可从以保藏。

33、登录号CBS27496保藏的BOTRYOSPHAERIARHODINA获得的GH10木聚糖酶具有至少90的同一性。00588项3的多肽,其中该多肽是包含SEQIDNO2的氨基酸1291的GH10木聚糖酶。00599项3的多肽,其中该多肽是由SEQIDNO2的氨基酸1291组成的GH10木聚糖酶。006010项3的多肽,其中所述多肽是GH11木聚糖酶,所述GH11木聚糖酶包含氨基酸序列,所述氨基酸序列与可从以保藏登录号CBS27496保藏的BOTRYOSPHAERIARHODINA获得的GH11木聚糖酶具有至少90的同一性。006111项3的多肽,其中该多肽是包含SEQIDNO4的氨基酸1202。

34、的GH11木聚糖酶。006212项3的多肽,其中该多肽是由SEQIDNO4的氨基酸1202组成的GH11木聚糖酶。006313项3的多肽,其中该多肽是丝氨酸酯酶,所述丝氨酸酯酶包含氨基酸序列,所述氨基酸序列与可从以保藏登录号CBS27496保藏的BOTRYOSPHAERIARHODINA获得的丝氨酸酯酶具有至少90的同一性。006414项3的多肽,其中该多肽是包含SEQIDNO6的氨基酸1352的丝氨酸酯酶。006515项3的多肽,其中该多肽是由SEQIDNO6的氨基酸1352组成的丝氨酸酯酶。006616项3的多肽,其中该多肽是脂肪酶,所述脂肪酶包含氨基酸序列,所述氨基酸序列与可从以保藏登录。

35、号CBS27496保藏的BOTRYOSPHAERIARHODINA获得的丝氨酸酯酶具有至少90的同一性。006717项3的多肽,其中该多肽是包含SEQIDNO8的氨基酸1431的脂肪酶。006818项3的多肽,其中该多肽是由SEQIDNO8的氨基酸1431组成的脂肪酶。006919项3的多肽,其中该多肽是过氧化物酶,所述过氧化物酶包含与可从以保藏登录号CBS27496保藏的BOTRYOSPHAERIARHODINA获得的过氧化物酶具有至少90的同一性的氨基酸序列。007020项3的多肽,其中该多肽是包含SEQIDNO10的氨基酸1185的过氧化物酶。007121项3的多肽,其中该多肽是由SEQ。

36、IDNO10的氨基酸1185组成的过氧化物说明书CN101942428ACN101942433A7/50页9酶。007222项3的多肽,其中该多肽是GH61A多肽,所述GH61A多肽包含氨基酸序列,所述氨基酸序列与可从以保藏登录号CBS27496保藏的BOTRYOSPHAERIARHODINA获得的GH61A多肽具有至少90的同一性。007323项3的多肽,其中该多肽是包含SEQIDNO12的氨基酸1218的GH61A多肽。007424项3的多肽,其中该多肽是由SEQIDNO12的氨基酸1218组成的GH61A多肽。007525项3的多肽,其中该多肽是GH61B多肽,所述GH61B多肽包含氨基。

37、酸序列,所述氨基酸序列与可从以保藏登录号CBS27496保藏的BOTRYOSPHAERIARHODINA获得的GH61B多肽具有至少90的同一性。007626项3的多肽,其中该多肽是包含SEQIDNO14的氨基酸1249的GH61B多肽。007727项3的多肽,其中该多肽是由SEQIDNO14的氨基酸1249组成的GH61B多肽。007828项3的多肽,其中该多肽是GH61C多肽,所述GH61C多肽包含氨基酸序列,所述氨基酸序列与可从以保藏登录号CBS27496保藏的BOTRYOSPHAERIARHODINA获得的GH61C多肽具有至少90的同一性。007929项3的多肽,其中该多肽是包含SE。

38、QIDNO16的氨基酸1255的GH61C多肽。008030项3的多肽,其中该多肽是由SEQIDNO16的氨基酸1255组成的GH61C多肽。008131项3的多肽,其中该多肽是GH61D多肽,所述GH61D多肽包含氨基酸序列,所述氨基酸序列与可从以保藏登录号CBS27496保藏的BOTRYOSPHAERIARHODINA获得的GH61D多肽具有至少90的同一性。008232项3的多肽,其中该多肽是包含SEQIDNO18的氨基酸1205的GH61D多肽。008333项3的多肽,其中该多肽是由SEQIDNO18的氨基酸1205组成的GH61D多肽。008434项3的多肽,其中该多肽是葡糖苷酶,所。

39、述葡糖苷酶包含氨基酸序列,所述氨基酸序列与可从以保藏登录号CBS27496保藏的BOTRYOSPHAERIARHODINA获得的葡糖苷酶具有至少90的同一性。008535项3的多肽,其中该多肽是包含SEQIDNO34的氨基酸1603的葡糖苷酶。008636项3的多肽,其中该多肽是由SEQIDNO34的氨基酸1603组成的葡糖苷酶。008737项3的多肽,其中该多肽是内切阿拉伯糖酶,所述内切阿拉伯糖酶包含氨基酸序列,所述氨基酸序列与可从以保藏登录号CBS27496保藏的BOTRYOSPHAERIARHODINA获得的内切阿拉伯糖酶具有至少90的同一性。说明书CN101942428ACN10194。

40、2433A8/50页10008838项3的多肽,其中该多肽是包含SEQIDNO36的氨基酸1301的内切阿拉伯糖酶。008939项3的多肽,其中该多肽是由SEQIDNO36的氨基酸1301组成的内切阿拉伯糖酶。009040项3的多肽,其中该多肽是内切阿拉伯糖酶,所述内切阿拉伯糖酶包含氨基酸序列,所述氨基酸序列与可从以保藏登录号CBS27496保藏的BOTRYOSPHAERIARHODINA获得的内切阿拉伯糖酶具有至少90的同一性。009141项3的多肽,其中该多肽是包含SEQIDNO38的氨基酸1438的内切阿拉伯糖酶。009242项3的多肽,其中该多肽是由SEQIDNO38的氨基酸1438组。

41、成的内切阿拉伯糖酶。009343项3的多肽,其中该多肽是胃蛋白酶肽酶,所述胃蛋白酶肽酶包含与可从以保藏登录号CBS27496保藏的BOTRYOSPHAERIARHODINA获得的胃蛋白酶肽酶具有至少90的同一性的氨基酸序列。009444项3的多肽,其中该多肽是包含SEQIDNO40的氨基酸1396的胃蛋白酶肽酶。009545项3的多肽,其中该多肽是由SEQIDNO40的氨基酸1396组成的胃蛋白酶肽酶。009646项3的多肽,其中该多肽是胃蛋白酶肽酶,所述胃蛋白酶肽酶包含氨基酸序列,所述氨基酸序列与可从以保藏登录号CBS27496保藏的BOTRYOSPHAERIARHODINA获得的胃蛋白酶肽。

42、酶具有至少90的同一性。009747项3的多肽,其中该多肽是包含SEQIDNO42的氨基酸1262的胃蛋白酶肽酶。009848项3的多肽,其中该多肽是由SEQIDNO42的氨基酸1262组成的胃蛋白酶肽酶。009949多核苷酸,其包含编码项3中所定义的多肽的核苷酸序列。010050核酸构建体,其包含项49中定义的核苷酸序列,该核苷酸序列与一种或多种指导所述多肽在宿主细胞中生产的调控序列可操作地连接。010151重组表达载体,其包含项50的核酸构建体。010252重组宿主细胞,其包含项50的核酸构建体。010353生产项3的多肽的方法,其包括0104A培养菌株以产生所述多肽,其中所述菌株的野生型。

43、形式能够产生该多肽;及0105B回收该多肽。010654生产项3的多肽的方法,其包括0107A在有助于产生所述多肽的条件下,培养项52中定义的重组宿主细胞;及0108B回收该多肽。010955组合物,其包含项3的多肽和赋形剂。011056制备项55的组合物的方法,其包含将项1的多肽与赋形剂混合。011157适于在电子设备中使用的存储介质,所述电子设备包含项3的多肽的氨基酸说明书CN101942428ACN101942433A9/50页11序列的信息。011258适于在电子设备中使用的存储介质,所述电子设备包含项49的多核苷酸的核酸序列的信息。0113序列表0114本发明包含序列表形式的信息,其。

44、附于本申请中并在连同本申请的数据载体上提交。数据载体的内容全部通过引用并入本文。选自SEQIDNO1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,31,33,35,37,39和41的序列的编码成熟多肽的区域,分别编码选自SEQIDNO2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40,42的序列的成熟多肽。因此SEQIDNO1的编码成熟多肽的区域编码SEQIDNO2中包含的成熟多肽序列,SEQIDNO3的编码成熟多肽的区域编码SEQIDNO4中包含的成熟多肽序列,依此类推。附图说明0115图1显示PSI。

45、GA4的质粒图。0116发明详述0117定义0118如以下所用的,术语“ADNA组”指由SEQIDNO1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,31,33,35,37,39和41组成的核苷酸序列的组。因此,当提到包含于或选自由“ADNA组”组成的序列组或包含于或选自“ADNA组”的核苷酸序列时,是指该序列包含于或选自由SEQIDNO1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,31,33,35,37,39和41组成的核苷酸序列的组。0119如以下所用的,术语“EDNA组”指由SEQIDNO1,3,5,7,9,11,13,1。

46、5,17,33,35,37,39和41组成的核苷酸序列的组。因此,当提到包含于或选自由“EDNA组”组成的序列组或包含于或选自“EDNA组”的核苷酸序列时,是指该序列包含于或选自由SEQIDNO1,3,5,7,9,11,13,15,17,33,35,37,39和41组成的核苷酸序列的组。0120类似地,如以下所用的,术语“B多肽组”指由SEQIDNO2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40和42组成的多肽序列的组。因此,当提到包含于或选自由“B多肽组”组成的序列组或包含于或选自“B多肽组”的多肽序列时,是指该序列包含于或选自。

47、由SEQIDNO2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40和42组成的多肽序列的组。0121类似地,如以下所用的,术语“D多肽组”指由SEQIDNO2,4,6,8,10,12,14,16,18,34,36,38,40和42组成的多肽序列的组。因此,当提到包含于或选自由“D多肽组”组成的序列组或包含于或选自“D多肽组”的多肽序列时,是指该序列包含于或选自由SEQIDNO2,4,6,8,10,12,14,16,18,34,36,38,40和42组成的多肽序列的组。0122本文中使用的术语“同一性”理解为两条氨基酸序列或两条核苷酸序。

48、列之间的同源性。对于本发明而言,同一性程度是使用VECTORNTI程序71版INFORMAXINC,7600WISCONSINAVENUE,SUITE1100,BETHESDA,MD20814,USA的ALIGNX确定的。氨基酸比对使用CLUSTALW算法THOMPSON,JD,HIGGINS,DG和GIBSON,TJ1994CLUSTALWIMPROVINGTHESENSITIVITYOFPROGRESSIVEMULTIPLESEQUENCEALIGNMENTTHROUGH说明书CN101942428ACN101942433A10/50页12SEQUENCEWEIGHTING,POSITIO。

49、NSSPECIFICGAPPENALTIESANDWEIGHTMATRIXCHOICENUCLEICACIDSRESEARCH,2246734680来生成。还使用下面的参数缺口生成罚分GAPOPENINGPENALTY为10,缺口延伸罚分GAPEXTENSIONPENALTY为005,缺口分离罚分范围GAPSEPARATIONPENALTYRANGE为8。配对比对PAIRWISEALIGNMENT参数为KTUPLE1,缺口罚分GAPPENALTY3,缺口长度生成罚分GAPLENGTHOPENINGPENALTY10,缺口延伸罚分01,窗口大小WINDOWSIZE5,对角线DIAGONALS5。两条核苷酸序列之间同一性程度的确定也是使用如上所述的相同算法和软件包,例如用下列的设定缺口罚分为10,缺口长度罚分为10。配对比对参数为KTUPLE3,缺口罚分3,窗口20。0123在本发明的范围内,术语“功能性多肽”FUNCTIONALPOLYPEPTIDE是指这样的多肽,其可被细胞表达和分泌,并且构成能够根据其按照细胞设计应实现的功能来运作的操作单元。可选地,该多肽要具备预定的功能可能需要辅因子COFACTORS。功能性多肽的一个例子是具有催化活性的多肽或酶,其帮助细胞催化细胞周围环。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 化学;冶金 > 生物化学;啤酒;烈性酒;果汁酒;醋;微生物学;酶学;突变或遗传工程


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1