具有阿魏酸酯酶活性的多肽和编码该多肽的多核苷酸 涉及序列表 本申请含有计算机可读形式的序列表, 所述计算机可读形式通过提述并入本文。 发明背景发明领域 本发明涉及具有阿魏酸酯酶活性的分离的多肽和编码该多肽的分离的多核苷酸。 本发明还涉及包含所述多核苷酸的核酸构建体、 载体和宿主细胞, 以及产生和使用所述多 肽的方法。
相关技术描述
植物细胞壁多糖构成了植物细胞壁的 90%, 且可分为三组 : 纤维素、 半纤维素和 果胶。纤维素代表了细胞壁多糖的主要组分。半纤维素是植物细胞壁第二丰富的组分。主 要的半纤维素聚合物是木聚糖。 在植物细胞壁中发现的木聚糖结构可根据其起源有显著差 异, 但他们总是包含 β-1, 4- 连接的 D- 木糖骨架。所述 β-1, 4- 连接的 D- 木糖骨架可由 不同的侧基所取代, 如 L- 阿拉伯糖、 D- 半乳糖、 乙酰基、 阿魏酰基 (feruloyl)、 对 - 香豆酰
基 (p-coumaroyl) 以及葡糖醛酸残基。
木糖骨架的生物降解依赖于两类酶 : 内切木聚糖酶和 β- 木糖苷酶。内切木聚糖 酶 (EC 3.2.1.8) 将木聚糖骨架切割为较小的寡糖, 其可进一步由 β- 木糖苷酶降解为木 糖。 其他参与木糖降解的酶包括乙酰木聚糖酯酶、 阿拉伯糖酶、 α- 葡糖醛酸糖苷酶、 对-香 豆酸酯酶 (p-coumaric acid esterase) 和阿魏酸酯酶 (ferulic acid esterase)( 阿魏酰 基酯酶 (ferouloyl esterase))。
植物细胞壁多糖的特征是其能够交联且这样的交联可包含由阿魏酸 ( 阿魏酰 基 ) 和对 - 香豆酸代表的酚基。对 - 香豆酸主要在草和谷物的秸秆中鉴定出来, 而酯连 接于木聚糖、 果胶和木葡聚糖的阿魏酸在下述物种的细胞壁中分离出来 : 如谷物、 糖甜菜、 菠菜、 竹和荸荠 (Chinese water chestnut), 并构成木栓素 (suberin) 的聚芳香化合物域 (polyaromatic domain)。 阿魏酸单元可由细胞壁过氧化物酶氧化交联于其他多糖、 蛋白质 和木素。此交联增加了植物对微生物降解的抗性。
负责切割木聚糖的多糖主链与单体或二聚阿魏酰基之间的酯连接的酶为阿魏酸 酯酶 (EC 3.1.1.73)。植物细胞壁聚合物之间由脱水二聚物 (dehydrodimer) 交联中断裂 (breakage) 一个或两个酯键对于糖酶对底物 ( 如纤维素生物质 (cellulosic biomass)) 的 最佳作用是必需的。本发明的目的是提供适用于下述方法的新的阿魏酸酯酶, 所述方法包 括将纤维素生物质转化为有用的产物 ( 包括乙醇 )。
来自绳状青霉 (Penicillium funiculosum)(GENPEPT : AJ312296) 的阿魏酸酯酶 与 SEQ ID NO : 2 所示的阿魏酸酯酶具有 44%的同一性。 发明内容
本发明涉及具有阿魏酸酯酶活性的多肽和编码该多肽的多核苷酸。 所述多核苷酸可来源于桔灰青霉 (Penicillium aurantiogriseum)。
具体而言, 本发明涉及选自下组的具有阿魏酸酯酶活性的分离的多肽 :
(a) 多肽, 其包含与 SEQ ID NO : 2 的成熟多肽具有至少 60%同一性的氨基酸序列 ;
(b) 由如下多核苷酸编码的多肽, 所述多核苷酸在至少中等严紧条件下与以下杂 交: (i)SEQ ID NO : 1 的成熟多肽编码序列, (ii) 包含 SEQ ID NO : 1 的成熟多肽编码序列的 基因组 DNA 序列, 或 (iii)(i) 或 (ii) 的全长互补链 ;
(c) 由如下多核苷酸编码的多肽, 所述多核苷酸包含与 SEQ ID NO : 1 的成熟多肽 编码序列具有至少 60%同一性的核苷酸序列 ; 和
(d) 包含取代、 缺失和 / 或插入一个或多个 ( 几个 ) 氨基酸的 SEQ ID NO : 2 的成 熟多肽的变体。
本发明还涉及选自下组的分离的多核苷酸, 其编码具有阿魏酸酯酶活性的多肽 :
(a) 多核苷酸, 其编码包含与 SEQ ID NO : 2 的成熟多肽具有至少 60%同一性的氨 基酸序列的多肽 ;
(b) 多核苷酸, 其在至少中等严紧条件下与以下杂交 : (i)SEQ ID NO : 1 的成熟多 肽编码序列, (ii) 包含 SEQ ID NO : 1 的成熟多肽编码序列的基因组 DNA 序列, 或 (iii)(i) 或 (ii) 的全长互补链 ;
(c) 多核苷酸, 其包含与 SEQ ID NO : 1 的成熟多肽编码序列具有至少 60%同一性 的核苷酸序列 ; 和
(d) 多核苷酸, 其编码包含取代、 缺失和 / 或插入一个或多个 ( 几个 ) 氨基酸的 SEQ ID NO : 2 的成熟多肽的变体。
本发明还涉及包含所述多核苷酸的核酸构建体、 重组表达载体、 重组宿主细胞, 和 产生具有阿魏酸酯酶活性的多肽的方法。
本发明还涉及降解包含阿魏酸的材料的方法。
本发明还涉及如下的植物, 其包含编码所述具有阿魏酸酯酶活性的多肽的分离的 多核苷酸。
本发明还涉及产生上述具有阿魏酸酯酶的多肽的方法, 包括 : (a) 在有益于下述 多肽产生的条件下培养转基因植物或植物细胞, 所述转基因植物或植物细胞包含编码所述 具有阿魏酸酯酶活性的多肽的多核苷酸 ; 和 (b) 回收所述多肽。
定义
阿魏酸酯酶活性 : 在本文中术语 “阿魏酸酯酶活性” 定义为 EC 3.1.1.73(IUBMB Enzyme Nomenclature) 中的酶活性。
阿魏酸酯酶催化 4- 羟基 -3- 甲氧基肉桂酰 ( 阿魏酰 ) 基团从酯化的糖 ( 其在 “天 然” 底物中通常为阿拉伯糖 ) 的水解。乙酸对硝基苯酯 (p-Nitrophenol acetate) 和阿魏 酸甲酯是较不良的底物。
本发明的多肽具有 SEQ ID NO : 2 的成熟多肽的阿魏酸酯酶活性的至少 20%, 优选 至少 40%, 更优选至少 50%, 更优选至少 60%, 更优选至少 70%, 更优选至少 80%, 甚至更 优选至少 90%, 最优选至少 95%, 并且甚至最优选至少 100%。所述活性使用在标题为 “确 定阿魏酸酯酶活性” 的部分描述的方法确定。
分离的多肽 : 术语 “分离的多肽” 用于本文中指从来源分离的多肽。在一个优选的方面, 如通过 SDS-PAGE 测定的, 所述多肽为至少 1%纯, 优选至少 5%纯, 更优选至少 10% 纯, 更优选至少 20%纯, 更优选至少 40%纯, 更优选至少 60%纯, 甚至更优选至少 80%纯, 并且最优选至少 90%纯。
基本上纯的多肽 : 术语 “基本上纯的多肽” 在本文表示多肽制备物, 所述多肽制 备物含有按重量计至多 10%, 优选至多 8%, 更优选至多 6%, 更优选至多 5%, 更优选至多 4%, 更优选至多 3%, 甚至更优选至多 2%, 最优选至多 1%, 并且甚至最优选至多 0.5%的 与其天然或重组结合的 (associated) 其它多肽材料。因此, 优选所述基本上纯的多肽按存 在于制备物中的全部多肽材料的重量计是至少 92%纯, 优选至少 94%纯, 更优选至少 95% 纯, 更优选至少 96%纯, 更优选至少 96%纯, 更优选至少 97%纯, 更优选至少 98%纯, 甚至 更优选至少 99%纯, 最优选至少 99.5%纯, 并且甚至最优选 100%纯。 本发明的多肽优选是 基本上纯的形式, 即所述多肽制备物基本上 (essentially) 不含与其天然或重组结合的其 它多肽材料。 例如, 这能够通过如下实现 : 通过公知的重组方法或通过经典纯化方法制备多 肽。
成熟多肽 : 术语 “成熟多肽” 在本文中定义为以其在翻译和任何翻译后修饰 ( 如 N- 末端加工、 C- 末端截短、 糖基化、 磷酸化等 ) 之后的最终形式存在的具有阿魏酸酯酶活性 的多肽。在一个优选的方面, 所述成熟多肽是 SEQ ID NO : 2 的氨基酸 1-249。 成熟多肽编码序列 : 术语 “成熟多肽编码序列” 在本文中定义为编码具有阿魏酸酯 酶活性的成熟多肽的核苷酸序列。在一个优选的方面, 成熟多肽编码序列为 SEQ ID NO : 1 的核苷酸 152-901。
同一性 : 两个氨基酸序列之间或两个核苷酸序列之间的相关性由参数 “同一性” 来 描述。
就 本 发 明 而 言, 两 个 氨 基 酸 序 列 之 间 的 同 一 性 程 度 是 使 用 如 EMBOSS 程 序 包 (EMBOSS : The European Molecular Biology Open Software Suite, Rice 等, 2000, Trends in Genetics 16 : 276-277)( 优 选 版 本 3.0.0 或 更 新 的 版 本 ) 的 Needle 程 序 中 执 行 的 Needleman-Wunsch 算法 (Needleman 和 Wunsch, 1970, J.Mol.Biol.48 : 443-453) 来测定的。 使用的可选参数是 : 缺口产生罚分为 10, 缺口延伸罚分为 0.5, 和 EBLOSUM62(BLOSUM62 的 EMBOSS 版本 ) 取代矩阵。将标记为 “最长同一性” 的 Needle 输出 ( 使用 -nobrief 选项获 得 ) 用作百分比同一性并且是如下计算的 :
( 相同的残基 x100)/( 比对的长度 - 比对中的缺口总数 )
就本发明而言, 两个脱氧核糖核苷酸序列之间的同一性程度使用如 EMBOSS 程序 包 (EMBOSS : The European Molecular Biology Open Software Suite, Rice 等, 2000, 见 上 )( 优选版本 3.0.0 或更新的版本 ) 的 Needle 程序中执行的 Needleman-Wunsch 算法 (Needleman 和 Wunsch, 1970, 见上 ) 测定。使用的可选参数是 : 缺口产生罚分为 10, 缺口延 伸罚分为 0.5, 和 EDNAFULL(NCBI NUC4.4 的 EMBOSS 版本 ) 取代矩阵。将标记为 “最长同一 性” 的 Needle 输出 ( 使用 -nobrief 选项获得 ) 用作百分比同一性并且是如下计算的 :
( 相同的脱氧核糖核苷酸 x100)/( 比对的长度 - 比对中的缺口总数 )
同源序列 : 术语 “同源序列”在本文中定义为用 SEQ ID NO : 2 的桔灰青霉阿魏 酸酯酶或其片段, 在 tfasty 检索 (Pearson, W.R., 1999, 于 Bioinformatics Methods and Protocols, S.Misener 和 S.A.Krawetz 编, 185-219 页 ) 中给出小于 0.001 的 E 值 ( 或预期
分数 ) 的预测蛋白质。或者, 术语 “同源序列” 定义为与 SEQ ID NO : 2 的成熟多肽具有优选 至少 60%、 更优选至少 65%、 更优选至少 70%、 更优选至少 75%、 更优选至少 80%、 更优选 至少 85%、 甚至更优选至少 90%、 最优选至少 95%、 至少 96%、 至少 97%、 至少 98%或至少 99%的同一性程度, 且具有阿魏酸酯酶活性的氨基酸序列。
多肽片段 : 术语 “多肽片段” 在本文定义为从 SEQ ID NO : 2 的成熟多肽或其同源序 列的氨基和 / 或羧基末端缺失了一个或多个 ( 几个 ) 氨基酸的多肽 ; 其中所述片段具有阿 魏酸酯酶活性。在一个优选的方面, 片段含有 SEQ ID NO : 2 的成熟多肽或其同源序列的至 少 220 个氨基酸残基, 更优选至少 240 个氨基酸残基, 甚至更优选至少 250 个氨基酸残基, 并且最优选至少 255 个氨基酸残基。
亚序列 : 术语 “亚序列 (subsequence)” 在本文中定义为从 SEQ ID NO : 1 的成熟多 肽编码序列或其同源序列的 5′和 / 或 3′端缺失了一个或多个 ( 几个 ) 核苷酸的核苷酸 序列 ; 其中所述亚序列编码具有阿魏酸酯酶活性的多肽片段。 在一个优选的方面, 亚序列含 有 SEQ ID NO : 1 的成熟多肽编码序列或其同源序列的至少 660 个核苷酸, 更优选至少 730 个核苷酸, 甚至更优选至少 750 个核苷酸, 并且最优选至少 780 个核苷酸。
等位变体 (allelic variant) : 术语 “等位变体” 在本文中表示占据相同染色体基 因座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生, 并且可导致 种群内的多态性。基因突变可以是沉默的 ( 在编码的多肽中无变化 ) 或可以编码具有改变 的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。 分离的多核苷酸 : 术语 “分离的多核苷酸” 用于本文中指从来源分离的多核苷酸。 在一个优选的方面, 如通过琼脂糖电泳测定的, 所述多核苷酸为至少 1%纯, 优选至少 5% 纯, 更优选至少 10%纯, 更优选至少 20%纯, 更优选至少 40%纯, 更优选至少 60%纯, 甚至 更优选至少 80%纯, 并且最优选至少 90%纯。
基本上纯的多核苷酸 : 术语 “基本上纯的多核苷酸” 用于本文指多核苷酸制备物, 其不含其它外来的或不期望的核苷酸, 并且处于适合于在遗传工程蛋白质生产体系中使 用的形式。因此, 基本上纯的多核苷酸含有按重量计至多 10%, 优选至多 8%, 更优选至多 6%, 更优选至多 5%, 更优选至多 4%, 更优选至多 3%, 甚至更优选至多 2%, 最优选至多 1%, 并且甚至最优选至多 0.5%的与其天然或重组结合的其它多核苷酸材料。 然而, 基本上 纯的多核苷酸可以包括天然存在的 5’ 和 3’ 非翻译区, 如启动子和终止子。优选基本上纯的 多核苷酸是按重量计至少 90%纯, 优选至少 92%纯, 更优选至少 94%纯, 更优选至少 95% 纯, 更优选至少 96%纯, 更优选至少 97%纯, 甚至更优选至少 98%纯, 最优选至少 99%, 并 且甚至最优选至少 99.5%纯的。本发明的多核苷酸优选为基本上纯的形式, 即所述多核苷 酸制备物基本上 (essentially) 不含与其天然或重组结合的其它多核苷酸材料。所述多核 苷酸可以是基因组、 cDNA、 RNA、 半合成、 合成来源的, 或它们的任何组合。
编码序列 : 当用于本文中, 术语 “编码序列” 的意思是直接指定其蛋白产物的氨基 酸序列的核苷酸序列。编码序列的边界通常由开读框决定, 所述开读框通常以 ATG 起始密 码子或可供选择的起始密码子如 GTG 和 TTG 开始, 并且以终止密码子如 TAA、 TAG 和 TGA 结 束。编码序列可以是 DNA、 cDNA、 合成的或重组的核苷酸序列。
cDNA : 术语 “cDNA” 在本文中定义为能够通过反转录从得自真核细胞的成熟的、 已 剪接的 mRNA 分子制备的 DNA 分子。cDNA 缺少通常存在于相应基因组 DNA 中的内含子序列。
起始的 (initial)、 初级的 RNA 转录物是 mRNA 的前体, 其通过一系列的步骤加工然后作为成 熟的已剪接的 mRNA 出现。这些步骤包括通过称为剪接的过程去除内含子序列。因而源自 mRNA 的 cDNA 缺乏任何内含子序列。
核酸构建体 : 术语 “核酸构建体” 用于本文指单链或双链的核酸分子, 所述核酸分 子分离自天然存在的基因, 或将所述核酸分子以本来不存在于 (not otherwise exist) 自 然界中的方式修饰以含有核酸的区段或所述核酸分子是合成的。 当所述核酸构建体含有表 达本发明的编码序列所需的调控序列时, 术语核酸构建体与术语 “表达盒” 同义。
调控序列 (control sequence) : 术语 “调控序列” 在本文定义为包括对编码本发明 多肽的多核苷酸表达是必需或有利的所有组分。 各个调控序列对于编码所述多肽的核苷酸 序列可以是天然的或外源的, 或各个调控序列对于彼此可以是天然的或外源的。这些调控 序列包括但不限于前导序列、 聚腺苷酸化序列、 前肽序列、 启动子、 信号肽序列和转录终止 子。最少的情况, 调控序列包括启动子和转录和翻译的终止信号。调控序列可以和目的为 引入特异性限制位点的接头一起提供, 所述特异性限制位点促进调控序列与编码多肽的核 苷酸序列编码区的连接。
可操作地连接 : 术语 “可操作地连接” 在本文表示这样的构型, 其中将调控序列置 于相对于多核苷酸序列的编码序列的适当位置, 使得调控序列指导多肽编码序列的表达。 表达 : 术语 “表达” 包括涉及多肽产生的任何步骤, 其包括但不限于转录、 转录后修 饰、 翻译、 翻译后修饰和分泌。
表达载体 : 术语 “表达载体” 在本文定义为线性的或环状的 DNA 分子, 其包含编 码本发明多肽的多核苷酸, 并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连 接。
宿主细胞 : 如本文中所使用的术语 “宿主细胞” 包括任何细胞类型, 所述细胞类 型对于使用包含本发明多核苷酸的核酸构建体或表达载体的转化、 转染、 转导等是易感的 (susceptible)。
修饰 : 术语 “修饰” 在本文的意思是, 对由 SEQ ID NO : 2 的成熟多肽组成的多肽或 其同源序列的任何化学修饰, 以及对编码这样的多肽的 DNA 的遗传操作。所述修饰可以是 一个或多个 ( 几个 ) 氨基酸的取代、 缺失和 / 或插入, 以及一个或多个 ( 几个 ) 氨基酸侧链 的置换。
人工变体 : 当用于本文中, 术语 “人工变体” 的意思是具有阿魏酸酯酶活性的多肽, 所述多肽由表达 SEQ ID NO : 1 的成熟多肽编码序列的修饰的多核苷酸序列或其同源序列的 生物体产生。所述修饰的核苷酸序列通过人为干预 (human intervention), 通过修饰公开 于 SEQ ID NO : 1 的多核苷酸序列或其同源序列来获得。
发明详述
具有阿魏酸酯酶活性的多肽
在一个优选的方面, 本发明涉及包含下述氨基酸序列的分离的多肽, 所述氨基酸 序列与 SEQ ID NO : 2 的成熟多肽具有优选至少 60%, 更优选至少 65%, 更优选至少 70%, 更 优选至少 75%, 更优选至少 80%, 更优选至少 85%, 甚至更优选至少 90%, 甚至更优选至少 95%, 且甚至更优选至少 96%、 至少 97%、 至少 98%或至少 99%的同一性程度, 所述多肽具 有阿魏酸酯酶活性 ( 下文中的 “同源多肽” )。在一个优选的方面, 所述同源多肽具有氨基酸
序列, 所述氨基酸序列与 SEQ ID NO : 2 的成熟多肽相差十个氨基酸, 优选相差五个氨基酸, 更优选相差四个氨基酸, 甚至更优选相差三个氨基酸, 最优选相差两个氨基酸, 并且甚至最 优选相差一个氨基酸。
本发明的多肽优选包含 SEQ ID NO : 2 的氨基酸序列或其等位变体 ; 或它们的具有 阿魏酸酯酶活性的片段。在一个优选的方面, 多肽包含 SEQ ID NO : 2 的氨基酸序列。在另 一优选的方面, 多肽包含 SEQ ID NO : 2 的成熟多肽。在另一优选的方面, 多肽包含 SEQ ID NO : 2 的氨基酸 1 至 249, 或其等位变体 ; 或它们的具有阿魏酸酯酶活性的片段。 在另一优选 的方面, 多肽包含 SEQ ID NO : 2 的氨基酸 1 至 249。在另一优选的方面, 多肽由 SEQ ID NO : 2 的氨基酸序列或其等位变体, 或它们的具有纤维素分解增强活性的片段组成。 在另一优选 的方面, 多肽由 SEQ ID NO : 2 的氨基酸序列组成。在另一优选的方面, 多肽由 SEQ ID NO : 2 的成熟多肽组成。在另一优选的方面, 多肽由 SEQ ID NO : 2 的氨基酸 1 至 249 或其等位变 体, 或它们的具有阿魏酸酯酶活性的片段组成。 在另一优选的方面, 多肽由 SEQ ID NO : 2的 氨基酸 1 至 249 组成。
在另一优选的方面, 本发明涉及具有阿魏酸酯酶活性的分离的多肽, 其由多核 苷酸编码, 所述多核苷酸在优选极低严紧条件、 更优选低严紧条件、 更优选中严紧条件、 更优选中 - 高严紧条件、 甚至更优选高严紧条件、 和最优选非常高严紧条件下与下列杂 交: (i)SEQ ID NO : 1 的成熟多肽编码序列, (ii) 包含 SEQ ID NO : 1 的成熟多肽编码序列 的基因组 DNA 序列, (iii)(i) 或 (ii) 的亚序列, 或 (iv)(i)、 (ii) 或 (iii) 的全长互补 链 (J.Sambrook, E.F.Fritsch 和 T.Maniatis, 1989, Molecular Cloning, A Laboratory Manual, 第 2 版, Cold Spring Harbor, New York)。SEQ ID NO : 1 的成熟多肽编码序列的亚 序列含有至少 100 个连续的核苷酸或优选至少 200 个连续的核苷酸。此外, 所述亚序列可 以编码具有阿魏酸酯酶活性的多肽片段。在一个优选的方面, 所述互补链是 SEQ ID NO : 1 的成熟多肽编码序列的全长互补链。
SEQ ID NO : 1 的核苷酸序列或其亚序列 ; 以及 SEQ ID NO : 2 的氨基酸序列或其片 段, 可用于设计核酸探针, 以根据本领域内公知的方法从不同属或种的菌株鉴定和克隆编 码具有阿魏酸酯酶活性的多肽的 DNA。具体而言, 可将这些探针用于根据标准的 Southern 印迹方法与感兴趣的属或种的基因组或 cDNA 杂交, 以鉴定并从其中分离相应的基因。这些 探针可明显短于完整序列, 但长度上应为至少 14 个, 优选至少 25 个, 更优选至少 35 个, 并 且最优选至少 70 个核苷酸。然而, 优选所述核酸探针长度上是至少 100 个核苷酸。例如, 所述核酸探针长度上可以是至少 200 个核苷酸, 优选至少 300 个核苷酸, 更优选至少 400 个 核苷酸, 或最优选至少 500 个核苷酸。DNA 和 RNA 探针二者均可使用。通常将探针标记以检 3 35 测相应的基因 ( 例如, 用 32P、 H、 S、 生物素或抗生物素蛋白 (avidin) 标记 )。将这些探针 涵盖于本发明中。
因而, 可从由这些其它菌株制备的基因组 DNA 或 cDNA 文库中筛选 DNA, 所述 DNA 与 上述探针杂交并且编码具有阿魏酸酯酶活性的多肽。 可以通过琼脂糖或聚丙烯酰胺凝胶电 泳, 或通过其它分离技术分离来自这些其它菌株的基因组或其它 DNA。可以将来自文库的 DNA 或分离的 DNA 转移至硝化纤维素 (nitrocellulose) 或其它合适的载体材料并且固定于 其上。为了鉴定与 SEQ ID NO : 1 或其亚序列同源的克隆或 DNA, 将所述载体材料优选用在 Southern 印迹中。就本发明而言, 杂交表示核苷酸序列在非常低至非常高的严紧条件下与标记的核 酸探针杂交, 所述核酸探针对应于 SEQ ID NO : 1 的成熟多肽编码序列 ; 包含 SEQ ID NO : 1的 成熟多肽编码序列的基因组 DNA 序列 ; 其全长互补链 ; 或其亚序列。可使用例如 X 射线片 (X-ray film) 检测在这些条件下与核酸探针杂交的分子。
在一个优选的方面, 核酸探针是 SEQ ID NO : 1 的成熟多肽编码序列。在另一优选 的方面, 核酸探针是 SEQ ID NO : 1 的核苷酸 152-901。在另一优选的方面, 核酸探针是编码 SEQ ID NO : 2 的多肽的多核苷酸序列, 或其亚序列。 在另一优选的方面, 核酸探针是 SEQ ID NO : 1。
对于长度至少 100 个核苷酸的长探针, 将非常低至非常高的严紧条件定义为在 42℃, 在 5X SSPE、 0.3% SDS、 200μg/ml 已剪切并且变性的鲑精 DNA 中, 并且对于非常低和 低严紧性为 25%的甲酰胺、 对于中和中 - 高严紧性为 35%的甲酰胺、 或对于高和非常高严 紧性为 50%的甲酰胺, 根据标准的 Southern 印迹步骤进行预杂交和杂交最佳 12 至 24 小 时。
对于长度为至少 100 个核苷酸的长探针, 使用 2X SSC、 0.2% SDS 优选在 45℃ ( 非 常 低 严 紧 性 ), 更 优 选 在 50 ℃ ( 低 严 紧 性 ), 更 优 选 在 55 ℃ ( 中 严 紧 性 ), 更优选在 60℃ ( 中 - 高严紧性 ), 甚至更优选在 65℃ ( 高严紧性 ), 并且最优选在 70℃ ( 非常高严紧 性 ) 将载体材料最终洗涤三次, 每次 15 分钟。 对于长度大约 15 个核苷酸至大约 70 个核苷酸的短探针, 将严紧条件定义为在 比使用根据 Bolton 和 McCarthy 计算法 (1962, Proceedings of the National Academy of Sciences USA 48 : 1390) 计算得出的 Tm 低大约 5℃至大约 10℃, 在 0.9M NaCl, 0.09M Tris-HCl pH 7.6, 6mM EDTA, 0.5% NP-40, 1X Denhardt 溶液, 1mM 焦磷酸钠, 1mM 磷酸二氢 钠 (sodium monobasic phosphate), 0.1mM ATP 和 0.2mg 每 ml 的酵母 RNA 中, 根据标准的 Southern 印迹步骤进行预杂交、 杂交和杂交后洗涤最佳 12 至 24 小时。
对于长度大约 15 个核苷酸至大约 70 个核苷酸的短探针, 将所述载体材料在 6X SSC 加 0.1% SDS 中洗涤一次 15 分钟, 并用 6X SSC 在比计算得出的 Tm 低 5℃至 10℃的温 度洗涤两次, 每次 15 分钟。
本发明还涉及由如下多核苷酸编码的具有阿魏酸酯酶活性的分离的多肽, 所述多 核苷酸包含与 SEQ ID NO : 1 的成熟多肽编码序列具有优选至少 60%、 更优选至少 65%、 更 优选至少 70%、 更优选至少 75%、 更优选至少 80%、 更优选至少 85%、 更优选至少 90%、 最 优选至少 95%, 且甚至最优选至少 96%、 至少 97%、 至少 98%或至少 99%同一性程度的核 苷酸序列或由所述核苷酸序列组成, 其编码活性多肽。参见本文多核苷酸部分。
本发明还涉及人工变体, 所述人工变体包含取代、 缺失和 / 或插入一个或多个 ( 或 几个 ) 氨基酸的 SEQ ID NO : 2 的成熟多肽 ; 或其同源序列。 优选地, 氨基酸改变对性质是较 不重要的 (of a minor nature), 即保守的氨基酸取代或插入, 其不显著影响蛋白质的折叠 和 / 或活性 ; 通常为 1 至大约 30 个氨基酸的小缺失 ; 小的氨基或羧基末端延伸, 如氨基末端 甲硫氨酸残基 ; 多至大约 20-25 个残基的小接头肽 ; 或通过改变净电荷或其它功能来促进 纯化的小延伸, 如多组氨酸序列 (poly-histidine tract)、 抗原表位 (antigenic epitope) 或结合域 (binding domain)。
保守取代的实例是在以下组之内 : 碱性氨基酸组 ( 精氨酸、 赖氨酸和组氨酸 )、
酸性氨基酸组 ( 谷氨酸和天冬氨酸 )、 极性氨基酸组 ( 谷氨酰胺和天冬酰胺 )、 疏水性氨 基酸组 ( 亮氨酸、 异亮氨酸和缬氨酸 )、 芳族氨基酸组 ( 苯丙氨酸、 色氨酸和酪氨酸 ) 和小 氨基酸组 ( 甘氨酸、 丙氨酸、 丝氨酸、 苏氨酸和甲硫氨酸 )。通常不改变比活性 (specific activity) 的氨基酸取代是本领域已知的, 并且由例如 H.Neurath 和 R.L.Hill, 1979, 于 The Proteins, Academic Press, New York 中描述。最普遍发生的交换是 Ala/Ser、 Val/Ile、 Asp/Glu、 Thr/Ser、 Ala/Gly、 Ala/Thr、 Ser/Asn、 Ala/Val、 Ser/Gly、 Tyr/Phe、 Ala/Pro、 Lys/ Arg、 Asp/Asn、 Leu/Ile、 Leu/Val、 Ala/Glu 和 Asp/Gly。
除了 20 个基本氨基酸, 非基本氨基酸 ( 如 4- 羟脯氨酸、 6-N- 甲基赖氨酸、 2- 氨 基异丁酸、 异缬氨酸和 α- 甲基丝氨酸 ) 可以取代野生型多肽的氨基酸残基。有限数量的 非保守氨基酸、 不由遗传密码编码的氨基酸和非天然氨基酸可以取代氨基酸残基。 “非天然 氨基酸” 在蛋白质合成后已经过修饰, 和 / 或在它们的侧链具有不同于基本氨基酸的化学 结构。 非天然氨基酸能够以化学方法合成, 并且优选是商业上可得到的, 包括六氢吡啶羧酸 (pipecolic acid)、 噻唑烷羧酸 (thiazolidine carboxylic acid)、 脱氢脯氨酸、 3- 和 4- 甲 基脯氨酸, 和 3, 3- 二甲基脯氨酸。
可供选择的是, 氨基酸改变具有这样的性质以使多肽的物理化学性质改变。 例如, 氨基酸改变可改进多肽的热稳定性, 改变底物特异性, 改变最适 pH 等。 能够根据本领域已知的方法, 例如定位诱变或丙氨酸分区诱变 (Cunningham 和 Wells, 1989, Science 244 : 1081-1085) 来鉴定亲本多肽中的必需氨基酸。在后一技术中, 将单一丙氨酸突变引入到分子中的每个残基, 并且测试所得突变分子的生物活性 ( 即, 阿 魏酸酯酶活性 ) 以鉴定对于所述分子的活性关键的氨基酸残基。 同样参见 Hilton 等, 1996, J.Biol.Chem.271 : 4699-4708。酶的活性部位或其它的生物相互作用也能够通过结构的物 理分析而测定, 如通过以下这些技术 : 如核磁共振、 晶体学、 电子衍射或光亲和标记, 连同推 定的接触位点氨基酸的突变来测定。参见例如 de Vos 等, 1992, Science 255 : 306-312 ; Smith 等, 1992, J.Mol.Biol.224 : 899-904 ; Wlodaver 等, 1992, FEBS Lett.309 : 59-64。必 需氨基酸的身份 (identity) 也能够从与多肽的同一性分析来推断, 所述多肽与根据本发 明的多肽相关。
能够使用已知的诱变、 重组和 / 或改组 (shuffling) 方法, 然后是有关的筛选方 法, 例 如 那 些 由 Reidhaar-Olson 和 Sauer, 1988, Science 241 : 53-57 ; Bowie 和 Sauer, 1989, Proc.Natl.Acad.Sci.USA 86 : 2152-2156 ; WO 95/17413 ; 或 WO95/22625 公 开 的 那 些方法来进行并测试单个或多个氨基酸取代、 缺失、 和 / 或插入。能够使用的其它方法包 括 易 错 PCR、 噬 菌 体 展 示 ( 例 如, Lowman 等, 1991, Biochem.30 : 10832-10837 ; 美国专利 5,223,409 号 ; WO 92/06204) 和区域定向的诱变 (Derbyshire 等, 1986, Gene 46 : 145 ; Ner 等, 1988, DNA 7 : 127)。
诱变 / 改组方法能够与高通量、 自动化的筛选方法组合以检测由宿主细胞表达的 克隆的、 诱变的多肽的活性 (Ness 等, 1999, Nature Biotechnology 17 : 893-896)。能够从 宿主细胞回收编码活性多肽的诱变的 DNA 分子, 并且使用本领域内标准方法快速测序。这 些方法允许快速测定感兴趣的多肽中单个氨基酸残基的重要性, 并且能够应用于未知结构 的多肽。
SEQ ID NO : 2 的成熟多肽 ( 如 SEQ ID NO : 2 的氨基酸 1 到 249) 的氨基酸取代、 缺
失和 / 或插入的总数是 10, 优选 9, 更优选 8, 更优选 7, 更优选至多 6, 更优选 5, 更优选 4, 甚 至更优选 3, 最优选 2, 并且甚至最优选 1。
具有阿魏酸酯酶活性的多肽的来源
本发明的多肽可以获得自任何属的微生物。就本发明而言, 用于本文与给定的来 源有关的术语 “获得自” , 意思是核苷酸序列编码的多肽由所述来源产生, 或由其中插入了 来自所述来源的核苷酸序列的菌株产生。在优选的方面, 获得自给定来源的多肽是胞外分 泌的。
本发明具有阿魏酸酯酶活性的多肽可以是细菌多肽。例如, 所述多肽可以是 革 兰 氏 阳 性 细 菌 多 肽 如 芽 孢 杆 菌 属 (Bacillus)、 链 球 菌 属 (Streptococcus)、 链霉菌 属 (Streptomyces)、 葡 萄 球 菌 属 (Staphylococcus)、 肠 球 菌 属 (Enterococcus)、 乳杆 菌 属 (Lactobacillus)、 乳 球 菌 属 (Lactococcus)、 梭 菌 属 (Clostridium)、 地芽孢杆菌 属 (Geobacillus) 或 海 洋 芽 孢 杆 菌 属 (Oceanobacillus) 多 肽, 所述多肽具有阿魏酸 酯酶活性 ; 或革兰氏阴性细菌多肽, 如大肠杆菌、 假单胞菌属 (pseudomonas)、 沙门氏菌 属 (Salmonella)、 弯 曲 杆 菌 属 (Campylobacter)、 螺 杆 菌 属 (Helicobacter)、 黄杆菌属 (Flavobacterium)、 梭 杆 菌 属 (Fusobacterium)、 泥 杆 菌 属 (Ilyobacter)、 奈瑟氏菌属 (Neisseria) 或脲原体属 (Ureaplasma) 多肽, 所述多肽具有阿魏酸酯酶活性。 在一个优选的方面, 所述多肽是具有阿魏酸酯酶活性的嗜碱芽孢杆菌 (Bacillus alkalophilus)、 解淀粉芽孢杆菌 (Bacillus amyloliquefaciens)、 短芽孢杆菌 (Bacillus brevis)、 环状芽孢杆菌 (Bacillus circulans)、 克劳氏芽孢杆菌 (Bacillus clausii)、 凝结芽孢杆菌 (Bacillus coagulans)、 坚强芽孢杆菌 (Bacillus firmus)、 灿烂芽孢杆 菌 (Bacillus lautus)、 迟 缓 芽 孢 杆 菌 (Bacillus lentus)、 地 衣 芽 孢 杆 菌 (Bacillus licheniformis)、 巨 大 芽 孢 杆 菌 (Bacillus megaterium)、 短 小 芽 孢 杆 菌 (Bacillus pumilus)、 嗜热脂肪芽孢杆菌 (Bacillus stearothermophilus)、 枯草芽孢杆菌 (Bacillus subtilis) 或苏云金芽孢杆菌 (Bacillus thuringiensis) 多肽。
在 另 一 个 优 选 的 方 面, 所述多肽是具有阿魏酸酯酶活性的似马链球菌 (Streptococcus equisimilis)、 酿 脓 链 球 菌 (Streptococcus pyogenes)、 乳房链球 菌 (Streptococcus uberis) 或 马 链 球 菌 兽 瘟 亚 种 (Streptococcus equi subsp. Zooepidemicus) 多肽。
在 另 一 个 优 选 的 方 面, 所述多肽是具有阿魏酸酯酶活性的不产色链霉菌 (Streptomyces achromogenes)、 除 虫 链 霉 菌 (Streptomyces avermitilis)、 天蓝链霉 菌 (Streptomyces coelicolor)、 灰色链霉菌 (Streptomyces griseus) 或浅青紫链霉菌 (Streptomyces lividans) 多肽。
本发明具有阿魏酸酯酶活性的多肽也可以是真菌多肽, 并且更优选酵母多肽 如假丝酵母属 (Candida)、 克鲁维酵母属 (Kluyveromyces)、 毕赤酵母属 (Pichia)、 酵母 属 (Saccharomyces)、 裂殖酵母属 (Schizosaccharomyces) 或西洋蓍霉属 (Yarrowia) 多 肽, 其具有阿魏酸酯酶活性 ; 或更优选丝状真菌多肽如枝顶孢霉属 (Acremonium)、 伞菌属 (Agaricus)、 链格孢属 (Alternaria)、 曲霉属 (Aspergillus)、 短梗霉属 (Aureobasidium)、 Botryospaeria、 拟 蜡 菌 属 (Ceriporiopsis)、 毛 喙 壳 属 (Chaetomidium)、 金孢子菌属 (Chrysosporium)、 Claviceps、 Cochliobolus、 鬼 伞 属 (Coprinopsis)、 Coptotermes、
棒 囊 壳 属 (Corynascus)、 隐 丛 赤 壳 菌 属 (Cryphonectria)、 隐 球 菌 属 (Cryptococcus)、 色 二 孢 属 (Diplodia)、 黑 耳 属 (Exidia)、 Filibasidium、 镰 孢 属 (Fusarium)、 赤霉属 (Gibberella)、 全 鞭 毛 虫 属 (Holomastigotoides)、 腐 质 霉 属 (Humicola)、 耙齿菌属 (Irpex)、 蘑菇属 (Lentinula)、 Leptospaeria、 梨孢菌属 (Magnaporthe)、 Melanocarpus、 多 孔 菌 属 (Meripilus)、 毛 霉 属 (Mucor)、 毁 丝 霉 属 (Myceliophthora)、 新考玛脂霉 属 (Neocallimastix)、 脉 孢 菌 属 (Neurospora)、 拟 青 霉 属 (Paecilomyces)、 青霉属 (Penicillium)、平 革 菌 属 (Phanerochaete)、瘤 胃 壶 菌 属 (Piromyces)、 Poitrasis、 假 黑 盘 菌 属 (Pseudoplectania)、 Pseudotrichonympha、根 毛 霉 属 (Rhizomucor)、裂 褶 菌 属 (Schizophyllum)、 柱 顶 孢 属 (Scytalidium)、 踝 节 菌 属 (Talaromyces)、 嗜热 子 囊 菌 属 (Thermoascus)、 梭 孢 壳 属 (Thielavia)、 弯 颈 霉 属 (Tolypocladium)、 木霉 属 (Trichoderma)、 长 毛 盘 菌 属 (Trichophaea)、 轮 枝 孢 属 (Verticillium)、 包脚菇属 (Volvariella) 或炭角菌属 (Xylaria) 多肽, 所述多肽具有阿魏酸酯酶活性。
在一个优选的方面, 所述多肽是具有阿魏酸酯酶活性的卡尔酵母 (Saccharomyces carlsbergensis)、 酿 酒 酵 母 (Saccharomyces cerevisiae)、 糖 化 酵 母 (Saccharomyces diastaticus)、 道格拉氏酵母 (Saccharomyces douglasii)、 克鲁弗酵母 (Saccharomyces kluyveri)、诺 地 酵 母 (Saccharomyces norbensis) 或 卵 形 酵 母 (Saccharomyces oviformis) 多肽。
在 另 一 优 选 的 方 面, 所述多肽是具有阿魏酸酯酶活性的解纤维枝顶孢 霉 (Acremonium cellulolyticus)、棘 孢 曲 霉 (Aspergillus aculeatus)、泡 盛 曲 霉 (Aspergillus awamori)、烟 曲 霉 (Aspergillus fumigatus)、臭 曲 霉 (Aspergillus foetidus)、 日 本 曲 霉 (Aspergillus japonicus)、 构 巢 曲 霉 (Aspergillus nidulans)、 黑 曲 霉 (Aspergillus niger)、米 曲 霉 (Aspergillus oryzae)、嗜 角 质 金 孢 子 菌 (Chrysosporium keratinophilum)、 Chrysosporium lucknowense、 热 带 金 孢 子 菌 (Chrysosporium tropicum)、 Chrysosporium merdarium、 Chrysosporium inops、 毡 金 孢 子 菌 (Chrysosporium pannicola)、 Chrysosporium queenslandicum、 Chrysosporium zonatum、 杆孢状镰孢 (Fusarium bactridioides)、 禾谷镰孢 (Fusarium cerealis)、 库威 镰孢 (Fusarium crookwellense)、 大刀镰孢 (Fusarium culmorum)、 禾本科镰孢 (Fusarium graminearum)、 禾 赤 镰 孢 (Fusarium graminum)、 异 孢 镰 孢 (Fusarium heterosporum)、 合欢木镰孢 (Fusarium negundi)、 尖镰孢 (Fusarium oxysporum)、 多枝镰孢 (Fusarium reticulatum)、 粉 红 镰 孢 (Fusarium roseum)、 接 骨 木 镰 孢 (Fusarium sambucinum)、 肤 色 镰 孢 (Fusarium sarcochroum)、 拟 分 枝 孢 镰 孢 (Fusarium sporotrichioides)、 硫色 镰 孢 (Fusarium sulphureum)、 圆 镰 孢 (Fusarium torulosum)、 拟 丝 孢 镰 孢 (Fusarium trichothecioides)、 镶片镰孢 (Fusarium venenatum)、 灰腐质霉 (Humicola grisea)、 特 异腐质霉 (Humicola insolens)、 疏棉状腐质霉 (Humicola lanuginosa)、 白耙齿菌 (Irpex lacteus)、 米 黑 毛 霉 (Mucor miehei)、 嗜 热 毁 丝 霉 (Myceliophthora thermophila)、 粗 糙 脉 孢 菌 (Neurospora crassa)、 绳 状 青 霉 (Penicillium funiculosum)、 产紫青霉 (Penicillium purpurogenum)、 黄孢平革菌 (Phanerochaete chrysosporium)、 哈茨木霉 (Trichoderma harzianum)、 康 宁 木 霉 (Trichodermakoningii)、 长 枝 木 霉 (Trichoderma longibrachiatum)、 里氏木霉 (Trichoderma reesei) 或绿色木霉 (Trichoderma viride)多肽。 在另一优选的方面, 所述多肽是青霉属菌种的多肽。
在一个更优选的方面, 所述多肽是具有阿魏酸酯酶活性的桔灰青霉多肽。在一个 最优选的方面, 所述多肽是包含 SEQ ID NO : 2 的成熟多肽的多肽。可理解的是对于前述的 种, 本发明包含完全和不完全阶段 (perfect and imperfect states), 和其它分类学的等 同物 (equivalent), 例如无性型 (anamorph), 而无论它们已知的种名。本领域的技术人员 会容易地识别适合的等同物的身份 (identity)。
此外, 可以使用上述的探针从其它来源, 包括从自然界 ( 例如, 土壤、 堆肥、 水等 ) 分离的微生物鉴定和获得这些多肽。用于从天然生境 (habitat) 分离微生物的技术是本领 域内公知的。随后可通过相似地筛选这种微生物的基因组或 cDNA 文库来获得所述多核苷 酸。一旦用所述探针检测到编码多肽的多核苷酸序列, 就能够使用本领域普通技术人员熟 知的技术将所述多核苷酸分离或克隆 ( 参见, 例如, Sambrook 等, 1989, 见上 )。
本发明的多肽还包括融合多肽或可切割的融合多肽, 其中将另外的多肽融合到所 述多肽或其片段的 N 末端或 C 末端。通过将编码另一个多肽的核苷酸序列 ( 或其部分 ) 融 合于本发明的核苷酸序列 ( 或其部分 ) 来产生融合的多肽。产生融合多肽的技术是本领域 已知的, 并包括连接编码多肽的编码序列以使它们在阅读框中, 并且使所述融合多肽的表 达在相同启动子和终止子的控制下。
融合多肽还可以包括切割位点。 一旦分泌了融合多肽, 就切割所述位点, 从融合蛋 白释放具有阿魏酸酯酶活性的多肽。切割位点的实例包括, 但不限于, Kex2 位点, 其编码二 肽 Lys-Arg(Martin 等, 2003, J.Ind.Microbiol.Biotechnol.3 : 568-76 ; Svetina 等, 2000, J.Biotechnol.76 : 245-251 ; Rasmussen-Wilson 等, 1997, Appl.Environ.Microbiol.63 : 3488-3493 ; Ward 等, 1995 , Biotechnology 13 : 498-503 ; 和 Contreras 等, 1991 , Biotechnology 9 : 378-381) ; Ile-(Glu 或 Asp)-Gly-Arg 位点, 其在精氨酸残基后通过因 子 Xa 蛋 白 酶 切 割 (Eaton 等, 1986, Biochem.25 : 505-512) ; Asp-Asp-Asp-Asp-Lys 位 点, 其在赖氨酸后通过肠激酶切割 (Collins-Racie 等, 1995, Biotechnology 13 : 982-987) ; His-Tyr-Glu 位 点 或 His-Tyr-Asp 位 点,其 通 过 Genenase I 切 割 (Carter 等, 1989, Proteins : Structure, Function, and Genetics 6 : 240-248) ; Leu-Val-Pro-Arg-Gly-Ser 位 点, 其 在 Arg 后 通 过 凝 血 酶 切 割 (Stevens, 2003, Drug Discovery World 4 : 35-48) ; Glu-Asn-Leu-Tyr-Phe-Gln-Gly 位点, 其在 Gln 后通过 TEV 蛋白酶切割 (Stevens, 2003, 见 上); 和 Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro 位点, 其在 Gln 后通过遗传工程形式的人鼻病 毒 3C 蛋白酶切割 (Stevens, 2003, 见上 )。
多核苷酸
本发明还涉及分离的多核苷酸, 其包含编码本发明具有阿魏酸酯酶活性的多肽的 核苷酸序列, 或由该核苷酸序列组成。
在一个优选的方面, 核苷酸序列包含 SEQ ID NO : 1 或由 SEQ ID NO : 1 组成。在另 一优选的方面, 核苷酸序列包含 SEQ ID NO : 1 的成熟多肽编码序列或由 SEQ ID NO : 1 的成 熟多肽编码序列组成。 在另一优选的方面, 核苷酸序列包含 SEQ ID NO : 1 的核苷酸 152-901 或由 SEQ ID NO : 1 的核苷酸 152-901 组成。本发明还包含编码如下多肽的核苷酸序列, 所 述多肽包含 SEQID NO : 2 的氨基酸序列或其成熟多肽, 或由 SEQ ID NO : 2 的氨基酸序列或其
成熟多肽组成 ; 由于遗传密码的简并性, 所述核苷酸序列不同于 SEQ ID NO : 1 或其成熟多 肽编码序列。本发明还涉及 SEQ ID NO : 1 的亚序列, 所述亚序列编码具有阿魏酸酯酶活性 的 SEQ ID NO : 2 的片段。
本发明还涉及突变的多核苷酸, 其在 SEQ ID NO : 1 的成熟多肽编码序列中包含至 少一个突变或由具有至少一个突变的 SEQ ID NO : 1 的成熟多肽编码序列组成, 其中突变的 核苷酸序列编码 SEQ ID NO : 2 的成熟多肽。
用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的, 且包括从基因 组 DNA 分离, 从 cDNA 制备, 或其组合。可通过例如使用熟知的聚合酶链式反应 (PCR) 或 表达文库的抗体筛选来检测具有共有结构特性的克隆 DNA 片段, 从而实现从这种基因组 DNA 克隆本发明的多核苷酸。参见, 例如, Innis 等, 1990, PCR : A Guide to Methods and Application, Academic Press, New York。 可以使用其它核酸扩增方法, 如连接酶链式反应 (LCR)、 连接活化转录 (LAT) 和基于核苷酸序列的扩增 (NASBA)。 可以从青霉属菌种的菌株, 或另外的或相关的生物体克隆所述多核苷酸, 并且因此可以是例如所述核苷酸序列的多肽 编码区的等位基因变体或种变体 (species variant)。
本发明还涉及分离的多核苷酸, 其包含下述核苷酸序列或由其组成, 所述核苷酸 序列与 SEQ ID NO : 1 的成熟多肽编码序列具有优选至少 60%、 更优选至少 65%、 更优选至 少 70%、 更优选至少 75%、 更优选至少 80%、 更优选至少 85%、 甚至更优选至少 90%、 最优 选至少 95%、 并甚至最优选至少 96%、 至少 97%、 至少 98%或至少 99%的同一性程度, 所述 多核苷酸编码活性多肽。 修饰编码本发明多肽的核苷酸序列对于合成与所述多肽基本上相似的多肽可为 必需的。术语与所述多肽 “基本上相似” 指多肽的非天然存在的形式。这些多肽可能以一些 工程改造的方式而不同于从其天然来源分离的多肽, 例如, 比活性、 热稳定性、 最适 pH 等方 面不同的人工变体。可以在作为 SEQ ID NO : 1 的成熟多肽编码序列存在的核苷酸序列, 例 如其亚序列的基础上, 和 / 或通过引入如下核苷酸取代来构建变体序列 : 所述取代不产生 由核苷酸序列编码的多肽的另外的氨基酸序列, 但是符合意欲产生酶的宿主生物体的密码 子选择 ; 或者所述取代可产生不同的氨基酸序列。 关于核苷酸取代的概述, 参见, 例如, Ford 等, 1991, Protein Expression and Purification 2 : 95-107。
对于本领域技术人员显而易见的是, 这些取代能够在对于分子功能重要的区域之 外进行, 并且仍然产生活性多肽。对于由本发明的分离的多核苷酸编码的多肽活性关键的 并且因此优选不进行取代的氨基酸残基, 可以根据本领域公知的方法, 如定位诱变或丙氨 酸分区诱变 ( 参见, 例如, Cunningham 和 Wells, 1989, 见上 ) 来鉴定。在后一技术中, 将突 变引入到分子中的每个荷正电的残基处, 并且测试所得突变分子的阿魏酸酯酶活性, 以鉴 定对于所述分子的活性关键的氨基酸残基。底物 - 酶相互作用的位点也能够通过分析三维 结构测定, 通过如核磁共振分析、 晶体学或光亲和标记这样的技术来测定 ( 参见, 例如, de Vos 等, 1992, 见上 ; Smith 等, 1992, 见上 ; Wlodaver 等, 1992, 见上 )。
本发明还涉及编码本发明多肽的分离的多核苷酸, 所述分离的多核苷酸在非常低 严紧条件下, 优选低严紧条件, 更优选中严紧条件, 更优选中 - 高严紧条件, 甚至更优选高 严紧条件, 并且最优选非常高的严紧条件下, 与以下杂交 : (i)SEQ ID NO : 1 的成熟多肽编码 序列, (ii) 包含 SEQ ID NO : 1 的成熟多肽编码序列的基因组 DNA 序列, 或 (iii)(i) 或 (ii)
的全长互补链, 或它们的等位变体和亚序列 (Sambrook 等, 1989, 同上 ), 如本文所定义的。 在一个优选的方面, 互补链是 SEQ ID NO : 1 的成熟多肽编码序列的全长互补链。
本发明还涉及通过如下获得的分离的多核苷酸 : (a) 在非常低、 低、 中、 中 - 高、 高 或非常高严紧条件下, 将 DNA 的群体与以下杂交 : (i)SEQ ID NO : 1 的成熟多肽编码序列, (ii) 包含 SEQ ID NO : 1 的成熟多肽编码序列的基因组 DNA 序列, 或 (iii)(i) 或 (ii) 的全 长互补链 ; 和 (b) 分离杂交的多核苷酸, 其编码具有阿魏酸酯酶活性的多肽。 在一个优选的 方面, 所述互补链是 SEQ IDNO : 1 的成熟多肽编码序列的全长互补链。
核酸构建体
本发明还涉及包含本发明的分离的多核苷酸的核酸构建体, 所述分离的多核苷酸 与一个或多个 ( 几个 ) 调控序列可操作地连接, 所述调控序列在合适的宿主细胞中在与该 调控序列相容的条件下指导编码序列的表达。
可以用许多方式操作编码本发明多肽的分离的多核苷酸以供多肽的表达。 依赖于 表达载体, 在将多核苷酸的序列插入载体之前对其进行操作可能是理想的或必需的。使用 重组 DNA 方法修饰多核苷酸序列的技术是本领域熟知的。
调控序列可以是适当的启动子序列, 其是由用于表达编码本发明多肽的多核苷酸 的宿主细胞识别的核苷酸序列。启动子序列含有介导多肽的表达的转录调控序列。启动子 可以是在所选的宿主细胞中显示转录活性的任何核苷酸序列, 包括突变的、 截短的和杂合 的启动子, 并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。 用于指导本发明的核酸构建体转录, 特别是在细菌宿主细胞中转录的合适启动子 的实例是从下述获得的启动子 : 大肠杆菌 lac 操纵子、 天蓝链霉菌琼脂糖酶基因 (dagA)、 枯草芽孢杆菌果聚糖蔗糖酶基因 (sacB)、 地衣芽孢杆菌 α- 淀粉酶基因 (amyL)、 嗜热脂 肪芽孢杆菌产麦芽淀粉酶基因 (amyM)、 解淀粉芽孢杆菌 α- 淀粉酶基因 (amyQ)、 地衣芽 孢杆菌青霉素酶基因 (penP)、 枯草芽孢杆菌 xylA 和 xylB 基因和原核 β- 内酰胺酶基因 (Villa-Kamaroff 等, 1978, Proceedings of the National Academy of Sciences USA 75 : 3727-3731), 以及 tac 启动子 (DeBoer 等, 1983, Proceedings of the National Academy of Sciences USA 80 : 21-25)。另外的启动子在″ Useful proteins from recombinant bacteria″于 Scientific American, 1980, 242 : 74-94 中 ; 和在 Sambrook 等, 1989, 见上中 描述。
用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例 是从下列酶的基因获得的启动子 : 米曲霉 TAKA 淀粉酶、 曼赫根毛霉 (Rhizomucor miehei) 天冬氨酸蛋白酶、 黑曲霉中性 α- 淀粉酶、 黑曲霉酸稳定性 α- 淀粉酶、 黑曲霉或泡盛曲霉 葡糖淀粉酶 (glaA)、 曼赫根毛霉脂肪酶、 米曲霉碱性蛋白酶、 米曲霉丙糖磷酸异构酶、 构巢 曲霉乙酰胺酶、 镶片镰孢淀粉葡糖苷酶 (WO 00/56900)、 镶片镰孢 Daria(WO 00/56900)、 镶 片镰孢 Quinn(WO 00/56900)、 尖镰孢胰蛋白酶样蛋白酶 (WO 96/00787)、 里氏木霉 β- 葡糖 苷酶、 里氏木霉纤维二糖水解酶 I、 里氏木霉纤维二糖水解酶 II、 里氏木霉内切葡聚糖酶 I、 里氏木霉内切葡聚糖酶 II、 里氏木霉内切葡聚糖酶 III、 里氏木霉内切葡聚糖酶 IV、 里氏木 霉内切葡聚糖酶 V、 里氏木霉木聚糖酶 I、 里氏木霉木聚糖酶 II、 里氏木霉 β- 木糖苷酶, 以 及 NA2-tpi 启动子 ( 来自黑曲霉中性 α- 淀粉酶基因和米曲霉丙糖磷酸异构酶基因的启动 子的杂合体 ) ; 和它们的突变的、 截短的和杂合的启动子。
在酵母宿主中, 有用的启动子从如下酶的基因获得 : 酿酒酵母烯醇化酶 (ENO-1)、 酿酒酵母半乳糖激酶 (GAL1)、 酿酒酵母醇脱氢酶 / 甘油醛 -3- 磷酸脱氢酶 (ADH1, ADH2/ GAP)、 酿酒酵母丙糖磷酸异构酶 (TPI)、 酿酒酵母金属硫蛋白 (CUP1) 和酿酒酵母 3- 磷酸甘 油酸激酶。对于酵母宿主细胞其它有用的启动子由 Romanos 等, 1992, Yeast 8 : 423-488 描 述。
调控序列也可以是合适的转录终止子序列, 其是由宿主细胞识别以终止转录的序 列。所述终止子序列与编码所述多肽的核苷酸序列的 3’ 末端可操作地连接。可以将在所 选宿主细胞中有功能的任何终止子用在本发明中。
对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得 : 米曲霉 TAKA 淀粉酶、 黑曲霉葡糖淀粉酶、 构巢曲霉邻氨基苯甲酸合酶、 黑曲霉 α- 葡糖苷酶和尖镰孢胰蛋白酶 样蛋白酶。
对于酵母宿主细胞优选的终止子从如下酶的基因获得 : 酿酒酵母烯醇化酶、 酿酒 酵母细胞色素 C(CYC1) 和酿酒酵母甘油醛 -3- 磷酸脱氢酶。对于酵母宿主细胞其它有用的 终止子由 Romanos 等, 1992, 见上描述。
调控序列还可以是合适的前导序列, 其是对于宿主细胞的翻译重要的 mRNA 非翻 译区。前导序列可操作地连接于编码多肽的核苷酸序列的 5’ - 末端。可以将在所选宿主细 胞中有功能的任何前导序列用在本发明中。
对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得 : 米曲霉 TAKA 淀粉 酶和构巢曲霉丙糖磷酸异构酶。
对于酵母宿主细胞合适的前导序列从如下酶的基因获得 : 酿酒酵母烯醇化酶 (ENO-1)、 酿酒酵母 3- 磷酸甘油酸激酶、 酿酒酵母 α 因子和酿酒酵母醇脱氢酶 / 甘油 醛 -3- 磷酸脱氢酶 (ADH2/GAP)。
调控序列也可以是聚腺苷酸化序列, 其是与核苷酸序列的 3’ 末端可操作地连接的 序列, 并且在转录时, 宿主细胞将其识别为向转录的 mRNA 添加聚腺苷残基的信号。可以将 在所选宿主细胞中有功能的任何聚腺苷酸化序列在本发明中使用。
对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得 : 米曲霉 TAKA 淀粉酶、 黑曲霉葡糖淀粉酶、 构巢曲霉邻氨基苯甲酸合酶、 尖镰孢胰蛋白酶样蛋白酶和 黑曲霉 α- 葡糖苷酶。
对于酵母宿主细胞有用的聚腺苷酸化序列由 Guo 和 Sherman, 1995, Molecular Cellular Biology 15 : 5983-5990 描述。
调控序列还可以是信号肽编码序列, 其编码与多肽的氨基末端相连的氨基酸序 列, 并且指导编码的多肽进入细胞分泌途径。核苷酸序列的编码序列 5’ 端可固有地包含信 号肽编码序列, 该信号肽编码序列与编码分泌多肽的编码序列区段一起天然地连接在翻译 阅读框中。或者, 编码序列 5’ 端可含有对于所述编码序列为外源的信号肽编码序列。外源 信号肽编码序列在编码序列不天然地含有信号肽编码序列时可为必需的。或者, 外源信号 肽编码序列可以简单地取代天然信号肽编码序列以增强多肽的分泌。然而, 指导表达的多 肽进入所选宿主细胞的分泌途径 ( 即, 分泌至培养基中 ) 的任何信号肽编码序列可在本发 明中使用。
对于细菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列 : 芽孢杆菌属 NCIB 11837 产麦芽糖淀粉酶、 嗜热脂肪芽孢杆菌 α- 淀粉酶、 地衣芽孢杆 菌枯草杆菌蛋白酶 (subtilisin)、 地衣芽孢杆菌 β- 内酰胺酶、 嗜热脂肪芽孢杆菌中性蛋 白酶 (nprT, nprS, nprM) 和枯草芽孢杆菌 prsA。另外的信号肽由 Simonen 和 Palva, 1993, Microbiological Reviews 57 : 109-137 描述。
对于丝状真菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽 编码序列 : 米曲霉 TAKA 淀粉酶、 黑曲霉中性淀粉酶、 黑曲霉葡糖淀粉酶、 曼赫根毛霉天冬氨 酸蛋白酶、 特异腐质霉纤维素酶、 特异腐质霉内切葡聚糖酶 V 和疏棉状腐质霉脂肪酶。
对于酵母宿主细胞有用的信号肽从酿酒酵母 α 因子和酿酒酵母转化酶的基因获 得。其它有用的信号肽编码序列由 Romanos 等, 1992, 见上描述。
调控序列还可以是前肽编码序列, 其编码位于多肽氨基末端的氨基酸序列。所 得多肽称为酶原 (proenzyme) 或前多肽 (propolypeptide)( 或在某些情况下称为酶原 (zymogen))。前 ( 多 ) 肽通常是无活性的并且能够通过从前多肽催化或自催化切割所述 前肽而转化为成熟活性多肽。可以从枯草芽孢杆菌碱性蛋白酶 (aprE)、 枯草芽孢杆菌中 性蛋白酶 (nprT)、 酿酒酵母 α 因子、 曼赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶 (WO 95/33836) 的基因获得前肽编码序列。
当信号肽和前肽序列二者均出现在多肽的氨基末端时, 使前肽序列的位于紧接着 (next to) 多肽氨基末端, 并且使信号肽序列的位于紧接着前肽序列的氨基末端。
同样理想的是添加调节序列, 其允许相对于宿主细胞的生长来调节多肽的表达。 调节系统的实例是引起基因表达响应化学或物理刺激物, 包括调节化合物的存在而开启或 关闭的那些系统。原核系统中的调节系统包括 lac、 tac 和 trp 操纵基因系统。在酵母中, 可以使用 ADH2 系统或 GAL1 系统。在丝状真菌中, 可以使用 TAKAα- 淀粉酶启动子、 黑曲霉 葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调节序列。 调节序列的其它实例是那些 允许基因扩增的序列。在真核系统中, 这些调节序列包括在氨甲蝶呤 (methotrexate) 存在 下扩增的二氢叶酸还原酶基因, 和以重金属 (with heavy metal) 扩增的金属硫蛋白基因。 在这些情况下, 编码多肽的核苷酸序列与调节序列可操作地连接。
表达载体
本发明还涉及重组表达载体, 所述重组表达载体包含本发明的多核苷酸、 启动子 和转录和翻译终止信号。 本文所述的多种核酸和调控序列可以结合在一起以产生重组表达 载体, 所述表达载体可以包括一个或多个 ( 几个 ) 方便的限制位点以允许在这些位点插入 或取代编码多肽的核苷酸序列。可供选择的是, 可以通过在适当的用于表达的载体中插入 包含所述序列的核苷酸序列或核酸构建体来表达本发明的多核苷酸序列。 在制备表达载体 的过程中, 将编码序列置于载体中, 从而将该编码序列与适当的表达用调控序列可操作地 连接。
重组表达载体可以是任何载体 ( 例如, 质粒或病毒 ), 其能够方便地进行重组 DNA 步骤, 并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将引入该载体的 宿主细胞的相容性。载体可以是线状或闭合环状质粒。
载体可以是自主复制载体, 即, 作为染色体外实体 (entity) 存在的载体, 其复制 独立于染色体复制, 例如, 质粒、 染色体外元件、 微型染色体 (minichromosome) 或人工染色 体。 载体可以含有任何用于确保自复制的手段 (means)。 或者, 载体可以是一种当被引入宿主细胞中时, 整合到基因组中并且与整合了该载体的染色体一起复制的载体。 此外, 可以使 用单独的载体或质粒或两个或更多个载体或质粒, 其共同含有待引入宿主细胞基因组的完 整 DNA(total DNA), 或可以使用转座子 (transposon)。
本发明的载体优选含有一个或多个 ( 或几个 ) 选择性标记, 其允许简单选择经转 化、 转染、 转导等的细胞。 选择性标记是基因, 其产物提供杀生物剂或病毒抗性、 对重金属的 抗性、 对营养缺陷型的原养性 (prototrophy to auxotrophs) 等。
细菌选择性标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的 dal 基因, 或赋予 抗生素抗性的标记, 所述抗生素抗性如氨苄青霉素、 卡那霉素、 氯霉素或四环素抗性。对于 酵母宿主细胞合适的标记是 ADE2、 HIS3、 LEU2、 LYS2、 MET3、 TRP1 和 URA3。用于丝状真菌 宿主细胞的选择性标记包括但不限于 amdS( 乙酰胺酶 )、 argB( 鸟氨酸氨甲酰基转移酶 )、 bar( 草铵膦 (phosphinothricin) 乙酰转移酶 )、 hph( 潮霉素磷酸转移酶 )、 niaD( 硝酸还原 酶 )(nitrate reductase)、 pyrG( 乳清酸核苷 -5’ - 磷酸脱羧酶 )(orotidine-5’ -phosphate decarboxylase)、 sC( 硫酸腺苷酰转移酶 ) 和 trpC( 邻氨基苯甲酸合酶 (anthranilate synthase)) 以及它们的等同物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的 amdS 和 pyrG 基因和吸水链霉菌 (Streptomyces hygroscopicus) 的 bar 基因。
本发明的载体优选含有元件, 其允许载体整合入宿主细胞基因组或允许载体在细 胞中独立于基因组自主复制。
为了整合入宿主细胞基因组, 载体可依赖编码多肽的多核苷酸的序列或用于通过 同源或非同源重组整合入基因组的任何其它载体元件。或者, 载体可以含有额外的核苷酸 序列, 用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精 确位置整合的可能性, 整合元件应优选含有足够数量的核酸, 如 100 至 10,000 碱基对, 优选 400 至 10,000 碱基对, 并且最优选 800 至 10,000 碱基对, 其与相应的目标序列具有高度同 一性以增强同源重组的概率。整合元件可以是任何序列, 其与宿主细胞基因组中的目标序 列同源。此外, 整合元件可以是非编码或编码的核苷酸序列。另一方面, 可以将载体通过非 同源重组整合到宿主细胞的基因组中。
为了自主复制, 载体可以还包含复制起点, 其使载体能够在所述的宿主细胞中自 主地复制。复制起点可以是介导自主复制的任何质粒复制子 (replicator), 其在细胞中发 挥功能。术语 “复制起点” 或 “质粒复制子” 在本文定义为能够使质粒或载体体内复制的核 苷酸序列。
细菌复制起点的实例是允许在大肠杆菌中复制的质粒 pBR322、 pUC19、 pACYC177 和 pACYC184 的复制起点, 和允许在芽孢杆菌属中复制的质粒 pUB110、 pE194、 pTA1060 和 pAMβ1 的复制起点。
用于酵母宿主细胞中的复制起点的实例是 2 微米复制起点, ARS1, ARS4, ARS1 和 CEN3 的组合, 和 ARS4 和 CEN6 的组合。
在丝状真菌细胞中有用的复制起点的实例是 AMA1 和 ANS1(Gems 等, 1991, Gene 98 : 61-67 ; Cullen 等, 1987, Nucleic Acids Research 15 : 9163-9175 ; WO 00/24883)。分 离 AMA1 基因和构建包含该基因的质粒或载体能够根据公开于 WO 00/24883 中的方法完成。
可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞以增加基因产物的产 生。多核苷酸拷贝数的增加可通过如下方法获得 : 将至少一个额外拷贝的序列整合入宿主细胞基因组, 或将可扩增的选择性标记基因包括于多核苷酸, 其中可通过在合适的选择剂 (selectable agent) 存在下培养细胞来选择含有选择性标记基因的扩增拷贝, 从而也含有 多核苷酸的额外拷贝的细胞。
用于连接上述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知 的 ( 参见, 例如, Sambrook 等, 1989, 见上 )。
宿主细胞
本发明还涉及重组宿主细胞, 其包含本发明的分离的多核苷酸, 将所述重组宿主 细胞有利地用于多肽的重组产生。 将包含本发明的多核苷酸的载体引入宿主细胞从而将所 述载体作为染色体整合体或作为自复制的染色体外载体保持, 如前文所述。术语 “宿主细 胞” 包含亲本细胞的任何子代, 其因为在复制过程中发生的突变而与该亲本细胞不同。 宿主 细胞的选择在很大程度上会依赖于编码多肽的基因及其来源。
宿主细胞可以是在本发明的多肽的重组产生中有用的任何细胞, 例如, 原核或真 核细胞。
原核宿主细胞可以是任何革兰氏阳性细菌或革兰氏阴性细菌。革兰氏阳性细菌 包括但不限于, 芽孢杆菌属、 链球菌属、 链霉菌属、 葡萄球菌属、 肠球菌属、 乳杆菌属、 乳球菌 属、 梭菌属、 地芽孢杆菌属和海洋芽孢杆菌属。 革兰氏阴性细菌包括但不限于, 大肠杆菌、 假 单胞菌属、 沙门氏菌属、 弯曲杆菌属、 螺杆菌属、 黄杆菌属、 梭杆菌属、 泥杆菌属、 奈瑟氏菌属 和脲原体属。
细菌宿主细胞可以是任何芽孢杆菌细胞。 在本发明的实施中有用的芽孢杆菌属细 胞包括但不限于, 嗜碱芽孢杆菌、 解淀粉芽孢杆菌、 短芽孢杆菌、 环状芽孢杆菌、 克劳氏芽孢 杆菌、 凝结芽孢杆菌、 坚强芽孢杆菌、 灿烂芽孢杆菌、 迟缓芽孢杆菌、 地衣芽孢杆菌、 巨大芽 孢杆菌、 短小芽孢杆菌、 嗜热脂肪芽孢杆菌、 枯草芽孢杆菌和苏云金芽孢杆菌细胞。
在一个优选的方面, 细菌宿主细胞是解淀粉芽孢杆菌、 迟缓芽孢杆菌、 地衣芽孢杆 菌、 嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。 在更优选的方面, 细菌宿主细胞是解淀粉芽孢 杆菌细胞。在另一个更优选的方面, 细菌宿主细胞是克劳氏芽孢杆菌细胞。在另一个更优 选的方面, 细菌宿主细胞是地衣芽孢杆菌细胞。 在另一个更优选的方面, 细菌宿主细胞是枯 草芽孢杆菌细胞。
细菌宿主细胞还可以是任何链球菌属细胞。 在本发明的实施中有用的链球菌属细 胞包括但不限于, 似马链球菌、 酿脓链球菌、 乳房链球菌和马链球菌兽瘟亚种细胞。
在一个优选的方面, 细菌宿主细胞是似马链球菌细胞。 在另一个优选方面, 细菌宿 主细胞是酿脓链球菌细胞。在另一个优选方面, 细菌宿主细胞是乳房链球菌细胞。在另一 个优选方面, 细菌宿主细胞是马链球菌兽瘟亚种细胞。
细菌宿主细胞还可以是任何链霉菌属细胞。 在本发明的实施中有用的链霉菌属细 胞包括但不限于, 不产色链霉菌、 除虫链霉菌、 天蓝链霉菌、 灰色链霉菌和浅青紫链霉菌细 胞。
在一个优选的方面, 细菌宿主细胞是不产色链霉菌细胞。 在另一个优选的方面, 细 菌宿主细胞是除虫链霉菌细胞。 在另一个优选的方面, 细菌宿主细胞是天蓝链霉菌细胞。 在 另一个优选的方面, 细菌宿主细胞是灰色链霉菌细胞。 在另一个优选的方面, 细菌宿主细胞 是浅青紫链霉菌细胞。可通过如下方法实现将 DNA 引入到芽孢杆菌属细胞 : 例如原生质体转化 ( 参见, 例如, Chang 和 Cohen, 1979, Molecular General Genetics 168 : 111-115), 使用感受态 细胞 ( 参见, 例如, Young 和 Spizizen, 1961, Journal of Bacteriology 81 : 823-829 或 Dubnau 和 Davidoff-Abelson, 1971, Journal of Molecular Biology 56 : 209-221), 电穿 孔 ( 参见, 例如, Shigekawa 和 Dower, 1988, Biotechniques 6 : 742-751) 或接合 ( 参见, 例如, Koehler 和 Thorne, 1987, Journal of Bacteriology 169 : 5271-5278)。可通过如 下方法实现将 DNA 引入到大肠杆菌细胞 : 例如原生质体转化 ( 参见, 例如, Hanahan, 1983, J.Mol.Biol.166 : 557-580) 或电穿孔 ( 参见, 例如, Dower 等, 1988, Nucleic Acids Res.16 : 6127-6145)。可通过如下方法实现将 DNA 引入到链霉菌属细胞 : 例如原生质体转化和电穿 孔 ( 参见, 例如, Gong 等, 2004, Folia Microbiol.(Praha)49 : 399-405), 接合 ( 参见, 例如, Mazodier 等, 1989, J.Bacteriol.171 : 3583-3585), 或转导 ( 参见, 例如, Burke 等, 2001, Proc.Natl.Acad Sci.USA 98 : 6289-6294)。可通过如下方法实现将 DNA 引入到假单胞菌 属细胞 : 例如电穿孔 ( 参见, 例如, Choi 等, 2006, J.Microbiol.Methods 64 : 391-397) 或接 合 ( 参见, 例如, Pinedo 和 Smets, 2005, Appl.Environ.Microbiol.71 : 51-57)。可通过如 下方法实现将 DNA 引入到链球菌属细胞 : 例如天然感受态 (natural competence)( 参见, 例 如, Perry 和 Kuramjtsu, 1981, Infect.Immun.32 : 1295-1297), 原生质体转化 ( 参见, 例如, Catt 和 Jollick, 1991, Microbios.68 : 189-207), 电穿孔 ( 参见, 例如, Buckley 等, 1999, Appl.Environ.Microbiol.65 : 3800-3804) 或接合 ( 参见, 例如, Clewell, 1981, Microbiol. Rev.45 : 409-436)。然而, 可以使用任何本领域已知的将 DNA 引入宿主细胞的方法。
宿主细胞还可以是真核生物, 如哺乳动物、 昆虫、 植物或真菌细胞。
在一个优选的方面, 宿主细胞是真菌细胞。 “真菌” 用在本文包括以下门 : 子囊 菌门 (Ascomycota)、 担子菌门 (Basidiomycota)、 壶菌门 (Chytridiomycota) 和接合菌门 (Zygomycota)( 如由 Hawksworth 等, 于 Ainsworth and Bisby’ sDictionary of The Fungi, 第八版, 1995, CAB International, University Press, Cambridge, UK 中所定义 ) 以及卵菌 门 (Oomycota)( 如 Hawksworth 等, 1995, 见上, 171 页中所引用 ), 和所有有丝分裂孢子真菌 (mitosporic fungi)(Hawksworth 等, 1995, 见上 )。
在 一 个 更 优 选 的 方 面, 真 菌 宿 主 细 胞 是 酵 母 细 胞。 “酵 母”用 在 本 文 包 括 产 子 囊 酵 母 (ascosporogenous yeast)( 内 孢 霉 目 (Endomycetales))、产 担 子 酵 母 (basidiosporogenous yeast) 和 属 于 半 知 菌 类 (Fungi Imperfecti)( 芽 孢 纲 (Blastomycetes)) 的酵母。 由于酵母的分类在未来可能改变, 就本发明而言, 会将酵母定义 为如 Biology and Activities of Yeast(Skinner, F.A., Passmore, S.M., 和 Davenport, R.R. 编, Soc.App.Bacteriol.Symposium Series No.9, 1980) 中所述。
在 一 个 甚 至 更 加 优 选 的 方 面, 酵 母 宿 主 细 胞 是 假 丝 酵 母 属、 汉逊酵母属 (Hansenula)、 克鲁维酵母属、 毕赤酵母属、 酵母属、 裂殖酵母属或西洋蓍霉属细胞。
在一个最优选的方面, 酵母宿主细胞是卡尔酵母、 酿酒酵母、 糖化酵母、 道格拉氏 酵母、 克鲁弗酵母、 诺地酵母或卵形酵母细胞。在另一个最优选的方面, 酵母宿主细胞是乳 酸克鲁维酵母 (Kluyveromyces lactis) 细胞。在另一个最优选的方面, 酵母宿主细胞是解 脂西洋蓍霉 (Yarrowia lipolytica) 细胞。
在另一个更优选的方面, 真菌宿主细胞是丝状真菌细胞。 “丝状真菌” 包括真菌门(Eumycota) 和卵菌门的亚门 ( 如由 Hawksworth 等, 1995, 见上文, 所定义 ) 的所有丝状形 式。丝状真菌通常的特征在于由壳多糖 (chitin)、 纤维素、 葡聚糖、 壳聚糖 (chitosan)、 甘 露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长, 而碳分解代谢是专 性需氧的。相反, 酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖 (budding) 进 行, 而碳分解代谢可以是发酵的。
在一个甚至更优选的方面, 丝状真菌宿主细胞是枝顶孢霉属、 曲霉属、 短梗霉 属、 烟 管 霉 属 (Bjerkandera)、 拟 蜡 菌 属、 金 孢 子 菌 属、 鬼 伞 属 (Coprinus)、 革盖菌属 (Coriolus)、 隐球菌属、 Filibasidium、 镰孢属、 腐质霉属、 梨孢菌属、 Malbrancea、 毛霉属、 毁丝霉属、 新考玛脂霉属、 脉孢菌属、 拟青霉属、 青霉属、 平革菌属、 射脉菌属 (Phlebia)、 瘤 胃壶菌属、 侧耳属 (Pleurotus)、 裂褶菌属、 踝节菌属、 嗜热子囊菌属、 梭孢壳属、 弯颈霉属、 栓菌属 (Trametes) 或木霉属细胞。
在一个最优选的方面, 丝状真菌宿主细胞是泡盛曲霉、 烟曲霉、 臭曲霉、 日本曲霉、 构巢曲霉、 黑曲霉或米曲霉细胞。在另一个最优选方面, 丝状真菌宿主细胞是杆孢状镰孢、 禾谷镰孢、 库威镰孢、 大刀镰孢、 禾本科镰孢、 禾赤镰孢、 异孢镰孢、 合欢木镰孢、 尖镰孢、 多 枝镰孢、 粉红镰孢、 接骨木镰孢、 肤色镰孢、 拟分枝孢镰孢、 硫色镰孢、 圆镰孢、 拟丝孢镰孢或 镶片镰孢细胞。在另一个最优选的方面, 丝状真菌宿主细胞是黑刺烟管菌 (Bjerkandera adusta)、 干 拟 蜡 菌 (Ceriporiopsis aneirina)、 干 拟 蜡 菌、 Ceriporiopsis caregiea、 Ceriporiopsis gilvescens、 Ceriporiopsis pannocinta、 Ceriporiopsis rivulosa、 Ceriporiopsis subrufa、 虫拟蜡菌 (Ceriporiopsis subvermispora)、 嗜角质金孢子菌、 Chrysosporium lucknowense、 热带金孢子菌、 Chrysosporium merdarium、 Chrysosporium inops、 毡 金 孢 子 菌、 Chrysosporium queenslandicum、 Chrysosporium zonatum、 灰盖鬼 伞 (Coprinus cinereus)、 毛革盖菌 (Coriolus hirsutus)、 特异腐质霉、 疏棉状腐质霉、 Malbranchea cinnamonea、 米黑毛霉、 嗜热毁丝霉、 粗糙脉孢菌、 桔灰青霉、 产紫青霉、 黄 孢 平 革 菌 (Phanerochaetechrysosporium)、 辐 射 射 脉 菌 (Phlebia radiata)、 刺芹侧耳 (Pleurotus eryngii)、 土生梭孢霉、 长绒毛栓菌 (Trametes villosa)、 变色栓菌 (Trametes versicolor)、 哈茨木霉、 康宁木霉、 长枝木霉、 里氏木霉或绿色木霉细胞。
可以将真菌细胞通过涉及原生质体形成、 原生质体转化和细胞壁重建的方法以 本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在 EP 238 023 和 Yelton 等, 1984, Proceedings of the National Academy of Sciences USA 81 : 1470-1474 中描述。用于转化镰孢属菌种的合适方法由 Malardier 等, 1989, Gene 78 : 147-156 和 WO 96/00787 描述。可以使用由如下文献描述的方法转化酵母 : Becker 和 Guarente, 于 Abelson, J.N. 和 Simon, M.I. 编, Guide to Yeast Genetics and Molecular Biology, Methods in Enzymology, Volume 194, 182-187 页, Academic Press, Inc., New York ; Ito 等, 1983, Journal of Bacteriology 153 : 163 ; 和 Hinnen 等, 1978, Proceedings of the National Academy of Sciences USA 75 : 1920。
产生方法
本发明还涉及产生本发明多肽的方法, 其包括 : (a) 在有益于产生多肽的条件下 培养细胞, 所述细胞以其野生型形式产生所述多肽 ; 和 (b) 回收所述多肽。 在一个优选的方 面, 所述细胞是青霉属的, 优选为属于桔灰青霉菌种的菌株, 其细胞能够在允许所述酶产生的条件下产生所述多肽, 并从培养物回收所述酶。
这些种的菌株在许多培养物保藏机构对于公众能够容易地取得, 所述保藏机构如 美国典型培养物保藏中心 (the American Type Culture Collection)(ATCC)、 德意志微生 物和细胞培养物保藏中心 (Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH)(DSM)、 真菌菌种保藏中心 (Centraalbureau Voor Schimmelcultures)(CBS) 和农业 研究机构专利培养物保藏中心北区研究中心 (Agricultural Research Service Patent Culture Collection, Northern Regional Research Center)(NRRL)。本发明还涉及产生 本发明的多肽的方法, 其包括 : (a) 在有益于产生多肽的条件下培养如本文所述的重组宿 主细胞 ; 和 (b) 回收所述多肽。
本发明还涉及产生本发明的多肽的方法, 包括 : (a) 在有益于产生多肽的条件下 培养重组宿主细胞, 其中所述宿主细胞包含 SEQ ID NO : 1 的成熟多肽编码序列或同源序列, 和 (b) 回收所述多肽。
本发明还涉及产生本发明的多肽的方法, 包括 : (a) 在有益于产生多肽的条件下 培养重组宿主细胞, 其中所述宿主细胞包含突变核苷酸序列, 其在 SEQ ID NO : 1 的成熟多肽 编码序列中具有至少一个突变, 其中所述突变核苷酸序列编码多肽, 所述多肽包含 SEQ ID NO : 2 的成熟多肽或由 SEQ ID NO : 2 的成熟多肽组成, 和 (b) 回收所述多肽。
在本发明的产生方法中, 使用本领域熟知的方法在适合于产生所述多肽的营养培 养基中培养细胞。例如, 可以通过在合适培养基中和允许表达和 / 或分离所述多肽的条件 下进行的摇瓶培养, 和实验室或工业发酵罐中的小规模或大规模发酵 ( 包括连续、 分批、 补 料分批或固态发酵 ) 来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培 养, 所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可 以根据公开的组成制备 ( 例如, 在美国典型培养物保藏中心的目录中 )。 如果多肽分泌到营 养培养基中, 该多肽能够从所述培养基中直接回收。 如果多肽不分泌到培养基中, 其能够从 细胞裂解物 (lysate) 回收。
可以使用本领域已知的对于所述多肽是特异性的方法来检测多肽。 这些检测方法 可包括特异性抗体的使用、 酶产物的形成或酶底物的消失。 例如, 酶测定法 (enzyme assay) 可用于测定如本文所述的多肽的活性。
所得多肽可以使用本领域已知的方法回收。例如, 多肽可以通过常规方法从营养 培养基中回收, 所述常规方法包括但不限于离心、 过滤、 提取、 喷雾干燥、 蒸发或沉淀。
本发明的多肽可以通过多种本领域已知的方法纯化以获得基本上纯的多肽, 所述 方法包括但不限于层析 ( 例如, 离子交换、 亲和、 疏水、 层析聚焦和大小排阻 )、 电泳方法 ( 例 如, 制备型 (preparative) 等电聚焦 )、 差示溶解度 ( 例如, 硫酸铵沉淀 )、 SDS-PAGE 或提取 ( 参见, 例如, Protein Purification, J.-C.Janson 和 Lars Ryden 编, VCH Publishers, New York, 1989)。
植物
本发明还涉及植物, 例如, 转基因植物、 植物部分或植物细胞, 其包含分离的多核 苷酸, 所述多核苷酸编码本发明的具有阿魏酸酯酶活性的多肽, 从而以可回收的量表达和 产生所述多肽。多肽可从植物或植物部分回收。或者, 同样可以将含有该重组多肽的植物 或植物部分用于改进食品或饲料的质量, 例如, 改进营养价值、 适口性 (palatability) 和流变性质 (rheological properties), 或用于破坏抗营养因子。
转基因植物可以是双子叶的 ( 双子叶植物 ) 或单子叶的 ( 单子叶植物 )。单子叶 植物的实例是草 (grasses), 如草地早熟禾 (meadow grass)( 蓝草 (blue grass), 早熟禾 属 (Poa)) ; 饲用牧草 (forage grass) 如羊茅属 (Festuca)、 黑麦草属 (Lolium) ; 寒地型牧 草 (temperate grass), 如 Agrostis( 翦股颖属 ) ; 和谷类, 例如, 小麦、 燕麦、 黑麦、 大麦、 稻 (rice)、 高粱和玉蜀黍 (maize)( 玉米 )。
双子叶植物的实例是烟草 (tobacco), 豆类 (legumes), 如羽扇豆 (lupins), 马铃 薯, 糖甜菜 (sugar beet), 豌豆, 豆 (bean) 和大豆 (soybean) 和十字花科的 (cruciferous) 植物 ( 十字花科 (family Brassicaceae)), 如花椰菜 (cauliflower), 油菜籽 (rape seed) 和紧密相关的模型生物体拟南芥 (Arabidopsis thaliana)。
植 物 部 分 的 实 例 是 茎 (stem)、 愈 伤 组 织 (callus)、 叶 (leaf)、 根 (root)、 果 实 (fruit)、 种 子 (seed) 和 块 茎 (tuber), 以 及 包 含 这 些 部 分 的 独 立 组 织, 例 如, 表皮 (epidermis)、 叶肉 (mesophyll)、 薄壁组织 (parenchyme)、 维管组织 (vascular tissue)、 分生组织 (meristem)。具体的植物细胞区室 (compartments), 如叶绿体 (chloroplast)、 质外体 (apoplast)、 线粒体 (mitochondria)、 液泡 (vacuole)、 过氧化物酶体 (peroxisome) 和细胞质 (cytoplasm) 也被认为是植物部分。此外, 任何植物细胞, 无论什么组织来源, 都 被认为是植物部分。 同样地, 植物部分, 如为了促进本发明的应用而分离的具体组织和细胞 也被认为是植物部分, 例如胚 (embryo)、 胚乳 (endosperm)、 糊粉 (aleurone) 和种皮 (seed coat)。
同样包括于本发明范围内的还有植物部分、 植物细胞和植物的子代。
表达本发明多肽的转基因植物或植物细胞可以依照本领域已知方法构建。 简而言 之, 通过如下构建所述植物或植物细胞 : 将编码本发明多肽的一个或多个 ( 几个 ) 表达构建 体并入植物宿主基因组或叶绿体基因组, 并且将所得的修饰植物或植物细胞繁殖为转基因 植物或植物细胞。
表达构建体便利地是包含编码本发明多肽的多核苷酸的核酸构建体, 所述多核苷 酸与在选择的植物或植物部分中表达该核苷酸序列所需的适当的调节序列可操作地连接。 此外, 表达构建体可以包含对于鉴定在其中整合了该表达构建体的宿主细胞有用的选择性 标记和将该构建体引入到所述植物中所必需的 DNA 序列 ( 后者依赖于使用的 DNA 引入方 法 )。
调节序列的选择, 例如启动子和终止子序列和任选地信号或转运序列的选择, 举例来说, 基于期望何时、 何处以及如何表达多肽而确定。例如, 编码本发明多肽的基因 的表达可以是组成型的或诱导型的, 或可以是发育、 阶段或组织特异性的, 并且基因产物 可以靶向特定的组织或植物部分例如种子或叶。调节序列由例如 Tague 等, 1988, Plant Physiology 86 : 506 所述。
对于组成性表达, 可以使用 35S-CaMV、 玉米泛素 1 和稻肌动蛋白 1 启动子 (Franck 等, 1980, Cell 21 : 285-294, Christensen 等, 1992, Plant Mo.Biol.18 : 675-689 ; Zhang 等, 1991, Plant Cell 3 : 1155-1165)。 器官特异性启动子可以是例如来自贮藏库组织 (storage sink tissue) 例如种子、 马铃薯块茎和果实的启动子 (Edwards & Coruzzi, 1990, Ann. Rev.Genet.24 : 275-303), 或来自代谢库组织 (metabolic sink tissue) 例如分生组织的启动子 (Ito 等, 1994, Plant Mol.Biol.24 : 863-878), 种子特异性启动子诸如来自稻的谷 蛋白 (glutelin)、 醇溶谷蛋白 (prolamin)、 球蛋白 (globulin) 或白蛋白 (albumin) 启动 子 (Wu 等, 1998, Plant and Cell Physiology 39 : 885-889), 来自豆球蛋白 (legumin)B4 和蚕豆 (Vicia faba) 的未知种子蛋白基因的蚕豆启动子 (Conrad 等, 1998, Journal of Plant Physiology 152 : 708-711)、 来自种子油体蛋白 (oil body protein) 的启动子 (Chen 等, 1998, Plant and Cell Physiology 39 : 935-941), 来自欧洲油菜 (Brassica napus) 的贮藏蛋白 napA 启动子, 或本技术领域公知的任何其它种子特异性的启动子, 例如, 在 WO 91/14772 中所描述的。此外, 启动子可为叶特异性的启动子, 如来自稻或番茄的 rbcs 启动 子 (Kyozuka 等, 1993, Plant Physiology 102 : 991-1000), 小球藻病毒 (chlorella virus) 腺嘌呤甲基转移酶 (adenine methyltransferase) 基因启动子 (Mitra 和 Higgins, 1994, Plant Molecular Biology 26 : 85-93), 或来自稻的 aldP 基因启动子 (Kagaya 等, 1995, Molecular and General Genetics 248 : 668-674), 或伤口诱导的启动子, 如马铃薯 pin2 启 动子 (Xu 等, 1993, Plant Molecular Biology 22 : 573-588)。 同样地, 所述启动子可通过非 生物的处理诱导, 所述非生物的处理诸如温度、 干旱或盐度变化, 或通过外源施加的激活所 述启动子的物质诱导, 例如乙醇、 雌激素 (oestrogens)、 植物激素 (plant hormones) 如乙 烯、 脱落酸 (abscisic acid) 和赤霉酸 (gibberellic acid), 和重金属。
启动子增强子元件也可以用于实现本发明多肽在植物中的较高表达。例如, 启动 子增强子元件可以是内含子, 其置于启动子和编码本发明多肽的核苷酸序列之间。例如 Xu 等, 1993, 见上, 公开了使用稻肌动蛋白 1 基因的第一内含子以增强表达。
选择性标记基因和表达构建体的任何其它部分可以选自本领域内可用的那些。
将核酸构建体根据本领域已知的常规技术并入植物基因组, 所述常规技术包括土 壤杆菌属 (Agrobacterium) 介导的转化、 病毒介导的转化、 显微注射 (microinjection)、 粒子轰击、 生物射弹转化和电穿孔 (Gasser 等, 1990, Science 244 : 1293 ; Potrykus, 1990, Bio/Technology 8 : 535 ; Shimamoto 等, 1989, Nature 338 : 274)。
目 前, 根 癌 土 壤 杆 菌 (Agrobacterium tumefaciens) 介 导 的 基 因 转 移 (gene transfer), 是产生转基因双子叶植物的优选方法 ( 为了参考, 见 Hooykas 和 Schilperoort, 1992, Plant Molecular Biology 19 : 15-38), 而且它也可以用于转化单子叶植物, 虽然对 于这些植物常常使用其它的转化方法。 目前, 产生转基因单子叶植物的优选的方法, 是用粒 子 ( 用转化 DNA 涂覆的微观的金或钨粒子 ) 轰击胚愈伤组织 (embryonic calli) 或发育 中的胚 (developing embryos)(Christou, 1992, Plant Journal 2 : 275-281 ; Shimamoto, 1994, Current Opinion Biotechnology 5 : 158-162 ; Vasil 等, 1992, Bio/Technology 10 : 667-674)。转化单子叶植物的可供选择的方法是基于原生质体转化, 如由 Omirulleh 等, 1993, Plant Molecular Biology 21 : 415-428 所描述的。
转化之后, 根据本领域熟知的方法选择并入了表达构建体的转化体并且再生成为 完整植株。 通常设计转化方法用于通过如下方法在再生期间或在后续世代中选择性消除选 择基因 : 例如, 使用带有两种独立的 T-DNA 构建体的共转化或通过特异性重组酶位点特异 性地切除选择基因。
本发明还涉及产生本发明多肽的方法, 其包括 : (a) 在有益于产生多肽的条件下 培养包含多核苷酸的转基因植物或植物细胞, 所述多核苷酸编码本发明具有阿魏酸酯酶活性的多肽 ; 和 (b) 回收所述多肽。
组合物
本发明还涉及包含本发明的多肽的组合物。
所述组合物可以包含本发明的多肽作为主要酶成分, 例如, 单成分组合物。或者, 所述组合物可以包含多种酶活性, 例如乙酰木聚糖酯酶、 氨肽酶、 淀粉酶、 阿拉伯呋喃糖苷 酶、 糖酶、 羧肽酶、 过氧化氢酶、 纤维素酶、 几丁质酶、 角质酶、 环糊精糖基转移酶、 脱氧核糖 核酸酶、 酯酶、 葡糖醛酸糖苷酶、 α- 半乳糖苷酶、 β- 半乳糖苷酶、 葡糖淀粉酶、 α- 葡糖苷 酶、 β- 葡糖苷酶、 β- 葡聚糖酶、 卤素过氧化物酶、 转化酶、 漆酶、 脂肪酶、 甘露糖苷酶、 氧化 酶、 果胶分解酶、 肽谷氨酰胺酶 (peptidoglutaminase)、 过氧化物酶、 肌醇六磷酸酶、 多酚氧 化酶、 蛋白水解酶、 鼠李半乳糖醛酸酶 (rhamnogalacturonase)、 转谷氨酰胺酶或木聚糖酶。
合适地选择在本发明的组合物中使用的酶, 使得其对底物具有协同活性。 优选地, 所述底物是或来源于植物, 例如小麦 ( 如麦麸 )、 甜菜 ( 如糖甜菜 ) 或玉米 ( 如玉米穗轴 )。
可以依照本领域内已知的方法制备多肽组合物, 并且可以是液体或干组合物的形 式。例如, 所述多肽组合物可以是颗粒 (granulate) 或微粒 (microgranulate) 的形式。可 以依照本领域内已知方法将包括于所述组合物中的多肽稳定化。
下面给出的是本发明多肽组合物的优选的用途的实例。 本发明的多肽组合物的剂 量和使用该组合物的其他条件可以基于本领域内已知的方法确定。
用途
本发明还涉及使用具有阿魏酸酯酶活性的多肽, 或其组合物的方法
本发明具有阿魏酸酯酶活性的多肽可用于数种应用以降解或转化来源于植物的 底物, 例如, 生物质底物, 如包含阿魏酰基取代的木聚糖的生物质底物, 即, 包含具有阿魏酰 侧基的木聚糖的底物, 如包含半纤维素的底物。
在一个优选的方面, 本发明还涉及使用具有阿魏酸酯酶活性的多肽处理包含经阿 魏酰基取代的木聚糖的材料。 所述材料可为任何包含纤维素生物质或木素纤维素生物质的 材料。在另一优选的方面, 用木聚糖降解酶进一步处理包含经阿魏酰基取代的木聚糖的材 料。 所述木聚糖降解酶可选自下组 : 木聚糖酶、 阿拉伯呋喃糖苷酶、 木糖苷酶、 葡糖醛酸糖苷 酶及其组合。
具有阿魏酸酯酶的多肽在多种应用中是有用的 : 修饰含阿魏酰基的动物饲料以改 进可消化性 (digestability) ; 在生物质降解或转化为可发酵的糖在产生例如下述物质中 的一般应用 : 燃料和 / 或饮用乙醇 ; 用于纸浆或纸脱木质化 (delignification) 的操作助 剂 (processing aid) ; 用于纺织品的酶法煮炼系统 (enzymatic scouring system) 的组分 ; 饲料应用 ( 例如, 供单胃动物 (monogastric animal) 的饲料 ) ; 食物应用 ( 例如, 烘烤, 与其 他酶功能组合促进焙烤食物的物理性质 ) ; 以及与其他酶功能组合用于洗衣洗涤剂应用。
确定阿魏酸酯酶活性
阿魏酸酯酶 (FAE) 活性以 IU( 国际单位 ) 测定, 其定义为每分钟从阿魏酸对硝 基苯酯 (pNP- 阿魏酸酯 ) 释放的 pNP 的微摩尔量。使用 96- 孔微孔板分光光度读数器 (spectrophotometric 96-well microplate reader), pNP 的量相对于在相同条件下 pNP 标 样运行来定量。
材料pNP- 阿魏酸酯
二甲亚砜 (DMSO)(Sigma 154938)
50mM 乙酸钠缓冲液, pH 5.0
1.0M Tris-HCl 缓冲液, pH 8.0
对硝基苯酚
稀释酶试剂以得到< 15 %的 pNP- 阿魏酸酯到 pNP 的转化率。起始的稀释物在 1.5mL 微离心管中制备, 使用 50mM 乙酸钠缓冲液, pH 5.0。 然后将试样稀释物转移至 96- 孔 板上, 并使用 50mM 乙酸钠缓冲液, pH 5.0 作为稀释剂制备两倍系列稀释物。
从原始的 10mM 储液 ( 在 50mM 乙酸钠缓冲液, pH5.0 中 ) 稀释于乙酸钠缓冲液, pH5.0 中制备下述浓度的 pNP 标样 : 0.25、 0.2、 0.1、 0.05、 0.02mM。使用的稀释剂是乙酸钠 缓冲液, pH5.0。
底物储液由 0.1M 完全溶解于 DMSO 中的 pNP- 阿魏酸酯组成。储液可冷却储藏两 周。在使用前, 将储液在 50mM 乙酸钠缓冲液, pH5.0 中稀释 100x 以制备 1mM pNP- 阿魏酸 酯。所述 1mM pNP- 阿魏酸酯 ( 在乙酸钠缓冲液中 ) 是浑浊 (cloudy) 且为淡黄色的。
pNP 标样 : 100μL pNP 标样 +100μL 乙酸钠缓冲液 (50mM, pH5.0)。
试剂对照 : 200μL 乙酸钠缓冲液 (50mM, pH5.0)。 底物对照 : 100μL 底 物 (1mM pNP- 阿 魏 酸 酯 )+100μL 乙 酸 钠 缓 冲 液 (50mM,pH5.0)。 试样对照 : 100μL 酶试样 +100μL 乙酸钠缓冲液 (50mM, pH5.0)
试样 : 100μL 底物 (1mM pNP- 阿魏酸酯 )+100μL 酶试样。
所述测定法在室温下 (25℃ ) 进行。在时间 0 点向酶试样添加 1mM pNP- 阿魏酸 酯。在 30 分钟的时点向每个孔添加 50μL Tris-HCl 缓冲液 (1M, pH8.0), 混合并立即在 405nm(A405) 和 540nm(A540) 读取吸光度。释放的产生的 pNP 在 A405 测定, 而背景浑浊度 (cloudiness) 在 A540 测定。
对每个对照或试样将 A540( 浑浊度 ) 从 A450 中减去。将由试剂对照 (RC) 获得的 平均吸光度值从每个由底物对照 (SC) 和样品对照 (EC) 获得的吸光度值中减去, 以获得校 正的底物对照 (SC 校正 ) 和校正的试样对照 (EC 校正 )。然后, 将 SC 校正、 EC 校正和 RC 从试样吸光 度中减去以获得校正的试样值 (S 校正 )。
SC 校正= SC 原始 -RC
EC 校正= EC 原始 -RC
S 校正= S 原始 -RC-SC 校正 -EC 校正
基于校正的试样吸光度值 S 校正, 使用由 pNP 标准曲线获得的线性方程确定释放的 pNP。
使用的单位为 IU( 国际单位 ), 定义为每分钟释放的 pNP 微摩尔数, 除以反应混合 物中酶的浓度 ( 以 mg/mL 表示 ), 得到 IU/mg 酶 :
mmolpNP/L 反应混合物= micromolpNP/mL 反应混合物
IU/mg = (micromolpNP/mL 反应混合物 /10min)/(mg 酶 /mL 反应混合物 )
实施例 实施例 1
通过使用 4- 硝基苯基 2-O-(E)- 阿魏酰 -α-L- 阿拉伯呋喃糖苷或 4- 硝基苯基 5-(O)-(E)- 阿魏酰 -α-L- 阿拉伯呋喃糖苷研究示于 SEQ ID NO : 2 的桔灰青霉阿魏酸酯酶 的特异性 ; 两个合成底物, 其分别具有连接于甲基 α- 阿拉伯呋喃糖苷 2- 位和 5- 位的阿魏 酸残基。所述底物根据 Mastihubova 等, Tetrahedron Lett.44(2003), 1671-1673 制备。
通 过 使用 检测游离 阿魏酸 的释放的 TLC 来 测 定阿 魏酸酯 酶 的活性。 条 件 为 pH5.5(50mM 乙酸盐缓冲液 ), 底物浓度 10mg/mL。温度为 30℃, 而酶剂量为 0.1mg EP/mL。 在 1、 4 和 48 小时后取样, 并施于 TLC 板上。 TLC 洗脱液 : EtOAc+1 滴 AcOH, 显色剂 : 1M H2SO4, 然后加热。
在 pH5.5, 所述阿魏酸酯酶对 5- 位和 2 位均显示良好的活性, 但对 5- 取代底物的 反应更快。
实施例 2
示于 SEQ ID NO : 2 的桔灰青霉阿魏酸酯酶的比活性通过使用 pNP- 乙酸酯和 pNP 丁酸酯来研究。
为了测定底物特异性, 单位为在 pH6.0, 温度 37℃, 底物为 1mM 的条件下, 每分钟释 放的 pNP 微摩尔数。
将 20μL 适 当 稀 释 于 0.01 % Triton X-100 中 的 酶 分 配 到 微 滴 定 板 ( 例 如, NUNC269620) 的孔中。对每个底物制备 100mM 底物的储液。将 100mM pNP- 乙酸酯 (Sigma N8130) 溶解于 DMSO, 并将 100mM pNP 丁酸酯 (Sigma N9876) 用异丙醇稀释。就在分析之 前, 将储液在测定缓冲液 (50mM 磷酸、 50mM 乙酸和 50mM 硼酸, 50mM KCl, 1mM CaCl2、 0.01% Triton X-100, 用 NaOH 调整为 pH 6.0) 中稀释至 1mM。将 120μL 1mM 底物添加至微滴定板 中的酶。将板密封, 并在 37℃以 750rpm 振荡温育 15 分钟。在温育时间后, 添加 100μL 终 止试剂 (stop reagent)( 终止试剂是 2.0M Tris pH8.0 于水中 ) 并立即在微滴定板分光光 度计中 (microtiter plate spectrophotometer) 测定 405nm 的吸光度。
发现所述酶和其他乙酰木聚糖酯酶类似地从 pNP- 乙酸酯释放 pNP。还发现所述 酶与从 pNP- 乙酸酯释放 pNp 相比以大约两倍的速率从 pNP- 丁酸酯释放 pNP。这些结果显 示, 该酶可适应 (accommodate) 底物识别位点中的乙酰基以及丁酸 (butyrate) 和阿魏酸 (ferulate)。
涉及序列表 本申请含有计算机可读形式的序列表, 所述计算机可读形式通过提述并入本文。 发明背景发明领域 本发明涉及具有阿魏酸酯酶活性的分离的多肽和编码该多肽的分离的多核苷酸。 本发明还涉及包含所述多核苷酸的核酸构建体、 载体和宿主细胞, 以及产生和使用所述多 肽的方法。
相关技术描述
植物细胞壁多糖构成了植物细胞壁的 90%, 且可分为三组 : 纤维素、 半纤维素和 果胶。纤维素代表了细胞壁多糖的主要组分。半纤维素是植物细胞壁第二丰富的组分。主 要的半纤维素聚合物是木聚糖。 在植物细胞壁中发现的木聚糖结构可根据其起源有显著差 异, 但他们总是包含 β-1, 4- 连接的 D- 木糖骨架。所述 β-1, 4- 连接的 D- 木糖骨架可由 不同的侧基所取代, 如 L- 阿拉伯糖、 D- 半乳糖、 乙酰基、 阿魏酰基 (feruloyl)、 对 - 香豆酰
基 (p-coumaroyl) 以及葡糖醛酸残基。
木糖骨架的生物降解依赖于两类酶 : 内切木聚糖酶和 β- 木糖苷酶。内切木聚糖 酶 (EC 3.2.1.8) 将木聚糖骨架切割为较小的寡糖, 其可进一步由 β- 木糖苷酶降解为木 糖。 其他参与木糖降解的酶包括乙酰木聚糖酯酶、 阿拉伯糖酶、 α- 葡糖醛酸糖苷酶、 对-香 豆酸酯酶 (p-coumaric acid esterase) 和阿魏酸酯酶 (ferulic acid esterase)( 阿魏酰 基酯酶 (ferouloyl esterase))。
植物细胞壁多糖的特征是其能够交联且这样的交联可包含由阿魏酸 ( 阿魏酰 基 ) 和对 - 香豆酸代表的酚基。对 - 香豆酸主要在草和谷物的秸秆中鉴定出来, 而酯连 接于木聚糖、 果胶和木葡聚糖的阿魏酸在下述物种的细胞壁中分离出来 : 如谷物、 糖甜菜、 菠菜、 竹和荸荠 (Chinese water chestnut), 并构成木栓素 (suberin) 的聚芳香化合物域 (polyaromatic domain)。 阿魏酸单元可由细胞壁过氧化物酶氧化交联于其他多糖、 蛋白质 和木素。此交联增加了植物对微生物降解的抗性。
负责切割木聚糖的多糖主链与单体或二聚阿魏酰基之间的酯连接的酶为阿魏酸 酯酶 (EC 3.1.1.73)。植物细胞壁聚合物之间由脱水二聚物 (dehydrodimer) 交联中断裂 (breakage) 一个或两个酯键对于糖酶对底物 ( 如纤维素生物质 (cellulosic biomass)) 的 最佳作用是必需的。本发明的目的是提供适用于下述方法的新的阿魏酸酯酶, 所述方法包 括将纤维素生物质转化为有用的产物 ( 包括乙醇 )。
来自绳状青霉 (Penicillium funiculosum)(GENPEPT : AJ312296) 的阿魏酸酯酶 与 SEQ ID NO : 2 所示的阿魏酸酯酶具有 44%的同一性。 发明内容
本发明涉及具有阿魏酸酯酶活性的多肽和编码该多肽的多核苷酸。 所述多核苷酸可来源于桔灰青霉 (Penicillium aurantiogriseum)。
具体而言, 本发明涉及选自下组的具有阿魏酸酯酶活性的分离的多肽 :
(a) 多肽, 其包含与 SEQ ID NO : 2 的成熟多肽具有至少 60%同一性的氨基酸序列 ;
(b) 由如下多核苷酸编码的多肽, 所述多核苷酸在至少中等严紧条件下与以下杂 交: (i)SEQ ID NO : 1 的成熟多肽编码序列, (ii) 包含 SEQ ID NO : 1 的成熟多肽编码序列的 基因组 DNA 序列, 或 (iii)(i) 或 (ii) 的全长互补链 ;
(c) 由如下多核苷酸编码的多肽, 所述多核苷酸包含与 SEQ ID NO : 1 的成熟多肽 编码序列具有至少 60%同一性的核苷酸序列 ; 和
(d) 包含取代、 缺失和 / 或插入一个或多个 ( 几个 ) 氨基酸的 SEQ ID NO : 2 的成 熟多肽的变体。
本发明还涉及选自下组的分离的多核苷酸, 其编码具有阿魏酸酯酶活性的多肽 :
(a) 多核苷酸, 其编码包含与 SEQ ID NO : 2 的成熟多肽具有至少 60%同一性的氨 基酸序列的多肽 ;
(b) 多核苷酸, 其在至少中等严紧条件下与以下杂交 : (i)SEQ ID NO : 1 的成熟多 肽编码序列, (ii) 包含 SEQ ID NO : 1 的成熟多肽编码序列的基因组 DNA 序列, 或 (iii)(i) 或 (ii) 的全长互补链 ;
(c) 多核苷酸, 其包含与 SEQ ID NO : 1 的成熟多肽编码序列具有至少 60%同一性 的核苷酸序列 ; 和
(d) 多核苷酸, 其编码包含取代、 缺失和 / 或插入一个或多个 ( 几个 ) 氨基酸的 SEQ ID NO : 2 的成熟多肽的变体。
本发明还涉及包含所述多核苷酸的核酸构建体、 重组表达载体、 重组宿主细胞, 和 产生具有阿魏酸酯酶活性的多肽的方法。
本发明还涉及降解包含阿魏酸的材料的方法。
本发明还涉及如下的植物, 其包含编码所述具有阿魏酸酯酶活性的多肽的分离的 多核苷酸。
本发明还涉及产生上述具有阿魏酸酯酶的多肽的方法, 包括 : (a) 在有益于下述 多肽产生的条件下培养转基因植物或植物细胞, 所述转基因植物或植物细胞包含编码所述 具有阿魏酸酯酶活性的多肽的多核苷酸 ; 和 (b) 回收所述多肽。
定义
阿魏酸酯酶活性 : 在本文中术语 “阿魏酸酯酶活性” 定义为 EC 3.1.1.73(IUBMB Enzyme Nomenclature) 中的酶活性。
阿魏酸酯酶催化 4- 羟基 -3- 甲氧基肉桂酰 ( 阿魏酰 ) 基团从酯化的糖 ( 其在 “天 然” 底物中通常为阿拉伯糖 ) 的水解。乙酸对硝基苯酯 (p-Nitrophenol acetate) 和阿魏 酸甲酯是较不良的底物。
本发明的多肽具有 SEQ ID NO : 2 的成熟多肽的阿魏酸酯酶活性的至少 20%, 优选 至少 40%, 更优选至少 50%, 更优选至少 60%, 更优选至少 70%, 更优选至少 80%, 甚至更 优选至少 90%, 最优选至少 95%, 并且甚至最优选至少 100%。所述活性使用在标题为 “确 定阿魏酸酯酶活性” 的部分描述的方法确定。
分离的多肽 : 术语 “分离的多肽” 用于本文中指从来源分离的多肽。在一个优选的方面, 如通过 SDS-PAGE 测定的, 所述多肽为至少 1%纯, 优选至少 5%纯, 更优选至少 10% 纯, 更优选至少 20%纯, 更优选至少 40%纯, 更优选至少 60%纯, 甚至更优选至少 80%纯, 并且最优选至少 90%纯。
基本上纯的多肽 : 术语 “基本上纯的多肽” 在本文表示多肽制备物, 所述多肽制 备物含有按重量计至多 10%, 优选至多 8%, 更优选至多 6%, 更优选至多 5%, 更优选至多 4%, 更优选至多 3%, 甚至更优选至多 2%, 最优选至多 1%, 并且甚至最优选至多 0.5%的 与其天然或重组结合的 (associated) 其它多肽材料。因此, 优选所述基本上纯的多肽按存 在于制备物中的全部多肽材料的重量计是至少 92%纯, 优选至少 94%纯, 更优选至少 95% 纯, 更优选至少 96%纯, 更优选至少 96%纯, 更优选至少 97%纯, 更优选至少 98%纯, 甚至 更优选至少 99%纯, 最优选至少 99.5%纯, 并且甚至最优选 100%纯。 本发明的多肽优选是 基本上纯的形式, 即所述多肽制备物基本上 (essentially) 不含与其天然或重组结合的其 它多肽材料。 例如, 这能够通过如下实现 : 通过公知的重组方法或通过经典纯化方法制备多 肽。
成熟多肽 : 术语 “成熟多肽” 在本文中定义为以其在翻译和任何翻译后修饰 ( 如 N- 末端加工、 C- 末端截短、 糖基化、 磷酸化等 ) 之后的最终形式存在的具有阿魏酸酯酶活性 的多肽。在一个优选的方面, 所述成熟多肽是 SEQ ID NO : 2 的氨基酸 1-249。 成熟多肽编码序列 : 术语 “成熟多肽编码序列” 在本文中定义为编码具有阿魏酸酯 酶活性的成熟多肽的核苷酸序列。在一个优选的方面, 成熟多肽编码序列为 SEQ ID NO : 1 的核苷酸 152-901。
同一性 : 两个氨基酸序列之间或两个核苷酸序列之间的相关性由参数 “同一性” 来 描述。
就 本 发 明 而 言, 两 个 氨 基 酸 序 列 之 间 的 同 一 性 程 度 是 使 用 如 EMBOSS 程 序 包 (EMBOSS : The European Molecular Biology Open Software Suite, Rice 等, 2000, Trends in Genetics 16 : 276-277)( 优 选 版 本 3.0.0 或 更 新 的 版 本 ) 的 Needle 程 序 中 执 行 的 Needleman-Wunsch 算法 (Needleman 和 Wunsch, 1970, J.Mol.Biol.48 : 443-453) 来测定的。 使用的可选参数是 : 缺口产生罚分为 10, 缺口延伸罚分为 0.5, 和 EBLOSUM62(BLOSUM62 的 EMBOSS 版本 ) 取代矩阵。将标记为 “最长同一性” 的 Needle 输出 ( 使用 -nobrief 选项获 得 ) 用作百分比同一性并且是如下计算的 :
( 相同的残基 x100)/( 比对的长度 - 比对中的缺口总数 )
就本发明而言, 两个脱氧核糖核苷酸序列之间的同一性程度使用如 EMBOSS 程序 包 (EMBOSS : The European Molecular Biology Open Software Suite, Rice 等, 2000, 见 上 )( 优选版本 3.0.0 或更新的版本 ) 的 Needle 程序中执行的 Needleman-Wunsch 算法 (Needleman 和 Wunsch, 1970, 见上 ) 测定。使用的可选参数是 : 缺口产生罚分为 10, 缺口延 伸罚分为 0.5, 和 EDNAFULL(NCBI NUC4.4 的 EMBOSS 版本 ) 取代矩阵。将标记为 “最长同一 性” 的 Needle 输出 ( 使用 -nobrief 选项获得 ) 用作百分比同一性并且是如下计算的 :
( 相同的脱氧核糖核苷酸 x100)/( 比对的长度 - 比对中的缺口总数 )
同源序列 : 术语 “同源序列”在本文中定义为用 SEQ ID NO : 2 的桔灰青霉阿魏 酸酯酶或其片段, 在 tfasty 检索 (Pearson, W.R., 1999, 于 Bioinformatics Methods and Protocols, S.Misener 和 S.A.Krawetz 编, 185-219 页 ) 中给出小于 0.001 的 E 值 ( 或预期
分数 ) 的预测蛋白质。或者, 术语 “同源序列” 定义为与 SEQ ID NO : 2 的成熟多肽具有优选 至少 60%、 更优选至少 65%、 更优选至少 70%、 更优选至少 75%、 更优选至少 80%、 更优选 至少 85%、 甚至更优选至少 90%、 最优选至少 95%、 至少 96%、 至少 97%、 至少 98%或至少 99%的同一性程度, 且具有阿魏酸酯酶活性的氨基酸序列。
多肽片段 : 术语 “多肽片段” 在本文定义为从 SEQ ID NO : 2 的成熟多肽或其同源序 列的氨基和 / 或羧基末端缺失了一个或多个 ( 几个 ) 氨基酸的多肽 ; 其中所述片段具有阿 魏酸酯酶活性。在一个优选的方面, 片段含有 SEQ ID NO : 2 的成熟多肽或其同源序列的至 少 220 个氨基酸残基, 更优选至少 240 个氨基酸残基, 甚至更优选至少 250 个氨基酸残基, 并且最优选至少 255 个氨基酸残基。
亚序列 : 术语 “亚序列 (subsequence)” 在本文中定义为从 SEQ ID NO : 1 的成熟多 肽编码序列或其同源序列的 5′和 / 或 3′端缺失了一个或多个 ( 几个 ) 核苷酸的核苷酸 序列 ; 其中所述亚序列编码具有阿魏酸酯酶活性的多肽片段。 在一个优选的方面, 亚序列含 有 SEQ ID NO : 1 的成熟多肽编码序列或其同源序列的至少 660 个核苷酸, 更优选至少 730 个核苷酸, 甚至更优选至少 750 个核苷酸, 并且最优选至少 780 个核苷酸。
等位变体 (allelic variant) : 术语 “等位变体” 在本文中表示占据相同染色体基 因座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生, 并且可导致 种群内的多态性。基因突变可以是沉默的 ( 在编码的多肽中无变化 ) 或可以编码具有改变 的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。 分离的多核苷酸 : 术语 “分离的多核苷酸” 用于本文中指从来源分离的多核苷酸。 在一个优选的方面, 如通过琼脂糖电泳测定的, 所述多核苷酸为至少 1%纯, 优选至少 5% 纯, 更优选至少 10%纯, 更优选至少 20%纯, 更优选至少 40%纯, 更优选至少 60%纯, 甚至 更优选至少 80%纯, 并且最优选至少 90%纯。
基本上纯的多核苷酸 : 术语 “基本上纯的多核苷酸” 用于本文指多核苷酸制备物, 其不含其它外来的或不期望的核苷酸, 并且处于适合于在遗传工程蛋白质生产体系中使 用的形式。因此, 基本上纯的多核苷酸含有按重量计至多 10%, 优选至多 8%, 更优选至多 6%, 更优选至多 5%, 更优选至多 4%, 更优选至多 3%, 甚至更优选至多 2%, 最优选至多 1%, 并且甚至最优选至多 0.5%的与其天然或重组结合的其它多核苷酸材料。 然而, 基本上 纯的多核苷酸可以包括天然存在的 5’ 和 3’ 非翻译区, 如启动子和终止子。优选基本上纯的 多核苷酸是按重量计至少 90%纯, 优选至少 92%纯, 更优选至少 94%纯, 更优选至少 95% 纯, 更优选至少 96%纯, 更优选至少 97%纯, 甚至更优选至少 98%纯, 最优选至少 99%, 并 且甚至最优选至少 99.5%纯的。本发明的多核苷酸优选为基本上纯的形式, 即所述多核苷 酸制备物基本上 (essentially) 不含与其天然或重组结合的其它多核苷酸材料。所述多核 苷酸可以是基因组、 cDNA、 RNA、 半合成、 合成来源的, 或它们的任何组合。
编码序列 : 当用于本文中, 术语 “编码序列” 的意思是直接指定其蛋白产物的氨基 酸序列的核苷酸序列。编码序列的边界通常由开读框决定, 所述开读框通常以 ATG 起始密 码子或可供选择的起始密码子如 GTG 和 TTG 开始, 并且以终止密码子如 TAA、 TAG 和 TGA 结 束。编码序列可以是 DNA、 cDNA、 合成的或重组的核苷酸序列。
cDNA : 术语 “cDNA” 在本文中定义为能够通过反转录从得自真核细胞的成熟的、 已 剪接的 mRNA 分子制备的 DNA 分子。cDNA 缺少通常存在于相应基因组 DNA 中的内含子序列。
起始的 (initial)、 初级的 RNA 转录物是 mRNA 的前体, 其通过一系列的步骤加工然后作为成 熟的已剪接的 mRNA 出现。这些步骤包括通过称为剪接的过程去除内含子序列。因而源自 mRNA 的 cDNA 缺乏任何内含子序列。
核酸构建体 : 术语 “核酸构建体” 用于本文指单链或双链的核酸分子, 所述核酸分 子分离自天然存在的基因, 或将所述核酸分子以本来不存在于 (not otherwise exist) 自 然界中的方式修饰以含有核酸的区段或所述核酸分子是合成的。 当所述核酸构建体含有表 达本发明的编码序列所需的调控序列时, 术语核酸构建体与术语 “表达盒” 同义。
调控序列 (control sequence) : 术语 “调控序列” 在本文定义为包括对编码本发明 多肽的多核苷酸表达是必需或有利的所有组分。 各个调控序列对于编码所述多肽的核苷酸 序列可以是天然的或外源的, 或各个调控序列对于彼此可以是天然的或外源的。这些调控 序列包括但不限于前导序列、 聚腺苷酸化序列、 前肽序列、 启动子、 信号肽序列和转录终止 子。最少的情况, 调控序列包括启动子和转录和翻译的终止信号。调控序列可以和目的为 引入特异性限制位点的接头一起提供, 所述特异性限制位点促进调控序列与编码多肽的核 苷酸序列编码区的连接。
可操作地连接 : 术语 “可操作地连接” 在本文表示这样的构型, 其中将调控序列置 于相对于多核苷酸序列的编码序列的适当位置, 使得调控序列指导多肽编码序列的表达。 表达 : 术语 “表达” 包括涉及多肽产生的任何步骤, 其包括但不限于转录、 转录后修 饰、 翻译、 翻译后修饰和分泌。
表达载体 : 术语 “表达载体” 在本文定义为线性的或环状的 DNA 分子, 其包含编 码本发明多肽的多核苷酸, 并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连 接。
宿主细胞 : 如本文中所使用的术语 “宿主细胞” 包括任何细胞类型, 所述细胞类 型对于使用包含本发明多核苷酸的核酸构建体或表达载体的转化、 转染、 转导等是易感的 (susceptible)。
修饰 : 术语 “修饰” 在本文的意思是, 对由 SEQ ID NO : 2 的成熟多肽组成的多肽或 其同源序列的任何化学修饰, 以及对编码这样的多肽的 DNA 的遗传操作。所述修饰可以是 一个或多个 ( 几个 ) 氨基酸的取代、 缺失和 / 或插入, 以及一个或多个 ( 几个 ) 氨基酸侧链 的置换。
人工变体 : 当用于本文中, 术语 “人工变体” 的意思是具有阿魏酸酯酶活性的多肽, 所述多肽由表达 SEQ ID NO : 1 的成熟多肽编码序列的修饰的多核苷酸序列或其同源序列的 生物体产生。所述修饰的核苷酸序列通过人为干预 (human intervention), 通过修饰公开 于 SEQ ID NO : 1 的多核苷酸序列或其同源序列来获得。
发明详述
具有阿魏酸酯酶活性的多肽
在一个优选的方面, 本发明涉及包含下述氨基酸序列的分离的多肽, 所述氨基酸 序列与 SEQ ID NO : 2 的成熟多肽具有优选至少 60%, 更优选至少 65%, 更优选至少 70%, 更 优选至少 75%, 更优选至少 80%, 更优选至少 85%, 甚至更优选至少 90%, 甚至更优选至少 95%, 且甚至更优选至少 96%、 至少 97%、 至少 98%或至少 99%的同一性程度, 所述多肽具 有阿魏酸酯酶活性 ( 下文中的 “同源多肽” )。在一个优选的方面, 所述同源多肽具有氨基酸
序列, 所述氨基酸序列与 SEQ ID NO : 2 的成熟多肽相差十个氨基酸, 优选相差五个氨基酸, 更优选相差四个氨基酸, 甚至更优选相差三个氨基酸, 最优选相差两个氨基酸, 并且甚至最 优选相差一个氨基酸。
本发明的多肽优选包含 SEQ ID NO : 2 的氨基酸序列或其等位变体 ; 或它们的具有 阿魏酸酯酶活性的片段。在一个优选的方面, 多肽包含 SEQ ID NO : 2 的氨基酸序列。在另 一优选的方面, 多肽包含 SEQ ID NO : 2 的成熟多肽。在另一优选的方面, 多肽包含 SEQ ID NO : 2 的氨基酸 1 至 249, 或其等位变体 ; 或它们的具有阿魏酸酯酶活性的片段。 在另一优选 的方面, 多肽包含 SEQ ID NO : 2 的氨基酸 1 至 249。在另一优选的方面, 多肽由 SEQ ID NO : 2 的氨基酸序列或其等位变体, 或它们的具有纤维素分解增强活性的片段组成。 在另一优选 的方面, 多肽由 SEQ ID NO : 2 的氨基酸序列组成。在另一优选的方面, 多肽由 SEQ ID NO : 2 的成熟多肽组成。在另一优选的方面, 多肽由 SEQ ID NO : 2 的氨基酸 1 至 249 或其等位变 体, 或它们的具有阿魏酸酯酶活性的片段组成。 在另一优选的方面, 多肽由 SEQ ID NO : 2的 氨基酸 1 至 249 组成。
在另一优选的方面, 本发明涉及具有阿魏酸酯酶活性的分离的多肽, 其由多核 苷酸编码, 所述多核苷酸在优选极低严紧条件、 更优选低严紧条件、 更优选中严紧条件、 更优选中 - 高严紧条件、 甚至更优选高严紧条件、 和最优选非常高严紧条件下与下列杂 交: (i)SEQ ID NO : 1 的成熟多肽编码序列, (ii) 包含 SEQ ID NO : 1 的成熟多肽编码序列 的基因组 DNA 序列, (iii)(i) 或 (ii) 的亚序列, 或 (iv)(i)、 (ii) 或 (iii) 的全长互补 链 (J.Sambrook, E.F.Fritsch 和 T.Maniatis, 1989, Molecular Cloning, A Laboratory Manual, 第 2 版, Cold Spring Harbor, New York)。SEQ ID NO : 1 的成熟多肽编码序列的亚 序列含有至少 100 个连续的核苷酸或优选至少 200 个连续的核苷酸。此外, 所述亚序列可 以编码具有阿魏酸酯酶活性的多肽片段。在一个优选的方面, 所述互补链是 SEQ ID NO : 1 的成熟多肽编码序列的全长互补链。
SEQ ID NO : 1 的核苷酸序列或其亚序列 ; 以及 SEQ ID NO : 2 的氨基酸序列或其片 段, 可用于设计核酸探针, 以根据本领域内公知的方法从不同属或种的菌株鉴定和克隆编 码具有阿魏酸酯酶活性的多肽的 DNA。具体而言, 可将这些探针用于根据标准的 Southern 印迹方法与感兴趣的属或种的基因组或 cDNA 杂交, 以鉴定并从其中分离相应的基因。这些 探针可明显短于完整序列, 但长度上应为至少 14 个, 优选至少 25 个, 更优选至少 35 个, 并 且最优选至少 70 个核苷酸。然而, 优选所述核酸探针长度上是至少 100 个核苷酸。例如, 所述核酸探针长度上可以是至少 200 个核苷酸, 优选至少 300 个核苷酸, 更优选至少 400 个 核苷酸, 或最优选至少 500 个核苷酸。DNA 和 RNA 探针二者均可使用。通常将探针标记以检 3 35 测相应的基因 ( 例如, 用 32P、 H、 S、 生物素或抗生物素蛋白 (avidin) 标记 )。将这些探针 涵盖于本发明中。
因而, 可从由这些其它菌株制备的基因组 DNA 或 cDNA 文库中筛选 DNA, 所述 DNA 与 上述探针杂交并且编码具有阿魏酸酯酶活性的多肽。 可以通过琼脂糖或聚丙烯酰胺凝胶电 泳, 或通过其它分离技术分离来自这些其它菌株的基因组或其它 DNA。可以将来自文库的 DNA 或分离的 DNA 转移至硝化纤维素 (nitrocellulose) 或其它合适的载体材料并且固定于 其上。为了鉴定与 SEQ ID NO : 1 或其亚序列同源的克隆或 DNA, 将所述载体材料优选用在 Southern 印迹中。就本发明而言, 杂交表示核苷酸序列在非常低至非常高的严紧条件下与标记的核 酸探针杂交, 所述核酸探针对应于 SEQ ID NO : 1 的成熟多肽编码序列 ; 包含 SEQ ID NO : 1的 成熟多肽编码序列的基因组 DNA 序列 ; 其全长互补链 ; 或其亚序列。可使用例如 X 射线片 (X-ray film) 检测在这些条件下与核酸探针杂交的分子。
在一个优选的方面, 核酸探针是 SEQ ID NO : 1 的成熟多肽编码序列。在另一优选 的方面, 核酸探针是 SEQ ID NO : 1 的核苷酸 152-901。在另一优选的方面, 核酸探针是编码 SEQ ID NO : 2 的多肽的多核苷酸序列, 或其亚序列。 在另一优选的方面, 核酸探针是 SEQ ID NO : 1。
对于长度至少 100 个核苷酸的长探针, 将非常低至非常高的严紧条件定义为在 42℃, 在 5X SSPE、 0.3% SDS、 200μg/ml 已剪切并且变性的鲑精 DNA 中, 并且对于非常低和 低严紧性为 25%的甲酰胺、 对于中和中 - 高严紧性为 35%的甲酰胺、 或对于高和非常高严 紧性为 50%的甲酰胺, 根据标准的 Southern 印迹步骤进行预杂交和杂交最佳 12 至 24 小 时。
对于长度为至少 100 个核苷酸的长探针, 使用 2X SSC、 0.2% SDS 优选在 45℃ ( 非 常 低 严 紧 性 ), 更 优 选 在 50 ℃ ( 低 严 紧 性 ), 更 优 选 在 55 ℃ ( 中 严 紧 性 ), 更优选在 60℃ ( 中 - 高严紧性 ), 甚至更优选在 65℃ ( 高严紧性 ), 并且最优选在 70℃ ( 非常高严紧 性 ) 将载体材料最终洗涤三次, 每次 15 分钟。 对于长度大约 15 个核苷酸至大约 70 个核苷酸的短探针, 将严紧条件定义为在 比使用根据 Bolton 和 McCarthy 计算法 (1962, Proceedings of the National Academy of Sciences USA 48 : 1390) 计算得出的 Tm 低大约 5℃至大约 10℃, 在 0.9M NaCl, 0.09M Tris-HCl pH 7.6, 6mM EDTA, 0.5% NP-40, 1X Denhardt 溶液, 1mM 焦磷酸钠, 1mM 磷酸二氢 钠 (sodium monobasic phosphate), 0.1mM ATP 和 0.2mg 每 ml 的酵母 RNA 中, 根据标准的 Southern 印迹步骤进行预杂交、 杂交和杂交后洗涤最佳 12 至 24 小时。
对于长度大约 15 个核苷酸至大约 70 个核苷酸的短探针, 将所述载体材料在 6X SSC 加 0.1% SDS 中洗涤一次 15 分钟, 并用 6X SSC 在比计算得出的 Tm 低 5℃至 10℃的温 度洗涤两次, 每次 15 分钟。
本发明还涉及由如下多核苷酸编码的具有阿魏酸酯酶活性的分离的多肽, 所述多 核苷酸包含与 SEQ ID NO : 1 的成熟多肽编码序列具有优选至少 60%、 更优选至少 65%、 更 优选至少 70%、 更优选至少 75%、 更优选至少 80%、 更优选至少 85%、 更优选至少 90%、 最 优选至少 95%, 且甚至最优选至少 96%、 至少 97%、 至少 98%或至少 99%同一性程度的核 苷酸序列或由所述核苷酸序列组成, 其编码活性多肽。参见本文多核苷酸部分。
本发明还涉及人工变体, 所述人工变体包含取代、 缺失和 / 或插入一个或多个 ( 或 几个 ) 氨基酸的 SEQ ID NO : 2 的成熟多肽 ; 或其同源序列。 优选地, 氨基酸改变对性质是较 不重要的 (of a minor nature), 即保守的氨基酸取代或插入, 其不显著影响蛋白质的折叠 和 / 或活性 ; 通常为 1 至大约 30 个氨基酸的小缺失 ; 小的氨基或羧基末端延伸, 如氨基末端 甲硫氨酸残基 ; 多至大约 20-25 个残基的小接头肽 ; 或通过改变净电荷或其它功能来促进 纯化的小延伸, 如多组氨酸序列 (poly-histidine tract)、 抗原表位 (antigenic epitope) 或结合域 (binding domain)。
保守取代的实例是在以下组之内 : 碱性氨基酸组 ( 精氨酸、 赖氨酸和组氨酸 )、
酸性氨基酸组 ( 谷氨酸和天冬氨酸 )、 极性氨基酸组 ( 谷氨酰胺和天冬酰胺 )、 疏水性氨 基酸组 ( 亮氨酸、 异亮氨酸和缬氨酸 )、 芳族氨基酸组 ( 苯丙氨酸、 色氨酸和酪氨酸 ) 和小 氨基酸组 ( 甘氨酸、 丙氨酸、 丝氨酸、 苏氨酸和甲硫氨酸 )。通常不改变比活性 (specific activity) 的氨基酸取代是本领域已知的, 并且由例如 H.Neurath 和 R.L.Hill, 1979, 于 The Proteins, Academic Press, New York 中描述。最普遍发生的交换是 Ala/Ser、 Val/Ile、 Asp/Glu、 Thr/Ser、 Ala/Gly、 Ala/Thr、 Ser/Asn、 Ala/Val、 Ser/Gly、 Tyr/Phe、 Ala/Pro、 Lys/ Arg、 Asp/Asn、 Leu/Ile、 Leu/Val、 Ala/Glu 和 Asp/Gly。
除了 20 个基本氨基酸, 非基本氨基酸 ( 如 4- 羟脯氨酸、 6-N- 甲基赖氨酸、 2- 氨 基异丁酸、 异缬氨酸和 α- 甲基丝氨酸 ) 可以取代野生型多肽的氨基酸残基。有限数量的 非保守氨基酸、 不由遗传密码编码的氨基酸和非天然氨基酸可以取代氨基酸残基。 “非天然 氨基酸” 在蛋白质合成后已经过修饰, 和 / 或在它们的侧链具有不同于基本氨基酸的化学 结构。 非天然氨基酸能够以化学方法合成, 并且优选是商业上可得到的, 包括六氢吡啶羧酸 (pipecolic acid)、 噻唑烷羧酸 (thiazolidine carboxylic acid)、 脱氢脯氨酸、 3- 和 4- 甲 基脯氨酸, 和 3, 3- 二甲基脯氨酸。
可供选择的是, 氨基酸改变具有这样的性质以使多肽的物理化学性质改变。 例如, 氨基酸改变可改进多肽的热稳定性, 改变底物特异性, 改变最适 pH 等。 能够根据本领域已知的方法, 例如定位诱变或丙氨酸分区诱变 (Cunningham 和 Wells, 1989, Science 244 : 1081-1085) 来鉴定亲本多肽中的必需氨基酸。在后一技术中, 将单一丙氨酸突变引入到分子中的每个残基, 并且测试所得突变分子的生物活性 ( 即, 阿 魏酸酯酶活性 ) 以鉴定对于所述分子的活性关键的氨基酸残基。 同样参见 Hilton 等, 1996, J.Biol.Chem.271 : 4699-4708。酶的活性部位或其它的生物相互作用也能够通过结构的物 理分析而测定, 如通过以下这些技术 : 如核磁共振、 晶体学、 电子衍射或光亲和标记, 连同推 定的接触位点氨基酸的突变来测定。参见例如 de Vos 等, 1992, Science 255 : 306-312 ; Smith 等, 1992, J.Mol.Biol.224 : 899-904 ; Wlodaver 等, 1992, FEBS Lett.309 : 59-64。必 需氨基酸的身份 (identity) 也能够从与多肽的同一性分析来推断, 所述多肽与根据本发 明的多肽相关。
能够使用已知的诱变、 重组和 / 或改组 (shuffling) 方法, 然后是有关的筛选方 法, 例 如 那 些 由 Reidhaar-Olson 和 Sauer, 1988, Science 241 : 53-57 ; Bowie 和 Sauer, 1989, Proc.Natl.Acad.Sci.USA 86 : 2152-2156 ; WO 95/17413 ; 或 WO95/22625 公 开 的 那 些方法来进行并测试单个或多个氨基酸取代、 缺失、 和 / 或插入。能够使用的其它方法包 括 易 错 PCR、 噬 菌 体 展 示 ( 例 如, Lowman 等, 1991, Biochem.30 : 10832-10837 ; 美国专利 5,223,409 号 ; WO 92/06204) 和区域定向的诱变 (Derbyshire 等, 1986, Gene 46 : 145 ; Ner 等, 1988, DNA 7 : 127)。
诱变 / 改组方法能够与高通量、 自动化的筛选方法组合以检测由宿主细胞表达的 克隆的、 诱变的多肽的活性 (Ness 等, 1999, Nature Biotechnology 17 : 893-896)。能够从 宿主细胞回收编码活性多肽的诱变的 DNA 分子, 并且使用本领域内标准方法快速测序。这 些方法允许快速测定感兴趣的多肽中单个氨基酸残基的重要性, 并且能够应用于未知结构 的多肽。
SEQ ID NO : 2 的成熟多肽 ( 如 SEQ ID NO : 2 的氨基酸 1 到 249) 的氨基酸取代、 缺
失和 / 或插入的总数是 10, 优选 9, 更优选 8, 更优选 7, 更优选至多 6, 更优选 5, 更优选 4, 甚 至更优选 3, 最优选 2, 并且甚至最优选 1。
具有阿魏酸酯酶活性的多肽的来源
本发明的多肽可以获得自任何属的微生物。就本发明而言, 用于本文与给定的来 源有关的术语 “获得自” , 意思是核苷酸序列编码的多肽由所述来源产生, 或由其中插入了 来自所述来源的核苷酸序列的菌株产生。在优选的方面, 获得自给定来源的多肽是胞外分 泌的。
本发明具有阿魏酸酯酶活性的多肽可以是细菌多肽。例如, 所述多肽可以是 革 兰 氏 阳 性 细 菌 多 肽 如 芽 孢 杆 菌 属 (Bacillus)、 链 球 菌 属 (Streptococcus)、 链霉菌 属 (Streptomyces)、 葡 萄 球 菌 属 (Staphylococcus)、 肠 球 菌 属 (Enterococcus)、 乳杆 菌 属 (Lactobacillus)、 乳 球 菌 属 (Lactococcus)、 梭 菌 属 (Clostridium)、 地芽孢杆菌 属 (Geobacillus) 或 海 洋 芽 孢 杆 菌 属 (Oceanobacillus) 多 肽, 所述多肽具有阿魏酸 酯酶活性 ; 或革兰氏阴性细菌多肽, 如大肠杆菌、 假单胞菌属 (pseudomonas)、 沙门氏菌 属 (Salmonella)、 弯 曲 杆 菌 属 (Campylobacter)、 螺 杆 菌 属 (Helicobacter)、 黄杆菌属 (Flavobacterium)、 梭 杆 菌 属 (Fusobacterium)、 泥 杆 菌 属 (Ilyobacter)、 奈瑟氏菌属 (Neisseria) 或脲原体属 (Ureaplasma) 多肽, 所述多肽具有阿魏酸酯酶活性。 在一个优选的方面, 所述多肽是具有阿魏酸酯酶活性的嗜碱芽孢杆菌 (Bacillus alkalophilus)、 解淀粉芽孢杆菌 (Bacillus amyloliquefaciens)、 短芽孢杆菌 (Bacillus brevis)、 环状芽孢杆菌 (Bacillus circulans)、 克劳氏芽孢杆菌 (Bacillus clausii)、 凝结芽孢杆菌 (Bacillus coagulans)、 坚强芽孢杆菌 (Bacillus firmus)、 灿烂芽孢杆 菌 (Bacillus lautus)、 迟 缓 芽 孢 杆 菌 (Bacillus lentus)、 地 衣 芽 孢 杆 菌 (Bacillus licheniformis)、 巨 大 芽 孢 杆 菌 (Bacillus megaterium)、 短 小 芽 孢 杆 菌 (Bacillus pumilus)、 嗜热脂肪芽孢杆菌 (Bacillus stearothermophilus)、 枯草芽孢杆菌 (Bacillus subtilis) 或苏云金芽孢杆菌 (Bacillus thuringiensis) 多肽。
在 另 一 个 优 选 的 方 面, 所述多肽是具有阿魏酸酯酶活性的似马链球菌 (Streptococcus equisimilis)、 酿 脓 链 球 菌 (Streptococcus pyogenes)、 乳房链球 菌 (Streptococcus uberis) 或 马 链 球 菌 兽 瘟 亚 种 (Streptococcus equi subsp. Zooepidemicus) 多肽。
在 另 一 个 优 选 的 方 面, 所述多肽是具有阿魏酸酯酶活性的不产色链霉菌 (Streptomyces achromogenes)、 除 虫 链 霉 菌 (Streptomyces avermitilis)、 天蓝链霉 菌 (Streptomyces coelicolor)、 灰色链霉菌 (Streptomyces griseus) 或浅青紫链霉菌 (Streptomyces lividans) 多肽。
本发明具有阿魏酸酯酶活性的多肽也可以是真菌多肽, 并且更优选酵母多肽 如假丝酵母属 (Candida)、 克鲁维酵母属 (Kluyveromyces)、 毕赤酵母属 (Pichia)、 酵母 属 (Saccharomyces)、 裂殖酵母属 (Schizosaccharomyces) 或西洋蓍霉属 (Yarrowia) 多 肽, 其具有阿魏酸酯酶活性 ; 或更优选丝状真菌多肽如枝顶孢霉属 (Acremonium)、 伞菌属 (Agaricus)、 链格孢属 (Alternaria)、 曲霉属 (Aspergillus)、 短梗霉属 (Aureobasidium)、 Botryospaeria、 拟 蜡 菌 属 (Ceriporiopsis)、 毛 喙 壳 属 (Chaetomidium)、 金孢子菌属 (Chrysosporium)、 Claviceps、 Cochliobolus、 鬼 伞 属 (Coprinopsis)、 Coptotermes、
棒 囊 壳 属 (Corynascus)、 隐 丛 赤 壳 菌 属 (Cryphonectria)、 隐 球 菌 属 (Cryptococcus)、 色 二 孢 属 (Diplodia)、 黑 耳 属 (Exidia)、 Filibasidium、 镰 孢 属 (Fusarium)、 赤霉属 (Gibberella)、 全 鞭 毛 虫 属 (Holomastigotoides)、 腐 质 霉 属 (Humicola)、 耙齿菌属 (Irpex)、 蘑菇属 (Lentinula)、 Leptospaeria、 梨孢菌属 (Magnaporthe)、 Melanocarpus、 多 孔 菌 属 (Meripilus)、 毛 霉 属 (Mucor)、 毁 丝 霉 属 (Myceliophthora)、 新考玛脂霉 属 (Neocallimastix)、 脉 孢 菌 属 (Neurospora)、 拟 青 霉 属 (Paecilomyces)、 青霉属 (Penicillium)、平 革 菌 属 (Phanerochaete)、瘤 胃 壶 菌 属 (Piromyces)、 Poitrasis、 假 黑 盘 菌 属 (Pseudoplectania)、 Pseudotrichonympha、根 毛 霉 属 (Rhizomucor)、裂 褶 菌 属 (Schizophyllum)、 柱 顶 孢 属 (Scytalidium)、 踝 节 菌 属 (Talaromyces)、 嗜热 子 囊 菌 属 (Thermoascus)、 梭 孢 壳 属 (Thielavia)、 弯 颈 霉 属 (Tolypocladium)、 木霉 属 (Trichoderma)、 长 毛 盘 菌 属 (Trichophaea)、 轮 枝 孢 属 (Verticillium)、 包脚菇属 (Volvariella) 或炭角菌属 (Xylaria) 多肽, 所述多肽具有阿魏酸酯酶活性。
在一个优选的方面, 所述多肽是具有阿魏酸酯酶活性的卡尔酵母 (Saccharomyces carlsbergensis)、 酿 酒 酵 母 (Saccharomyces cerevisiae)、 糖 化 酵 母 (Saccharomyces diastaticus)、 道格拉氏酵母 (Saccharomyces douglasii)、 克鲁弗酵母 (Saccharomyces kluyveri)、诺 地 酵 母 (Saccharomyces norbensis) 或 卵 形 酵 母 (Saccharomyces oviformis) 多肽。
在 另 一 优 选 的 方 面, 所述多肽是具有阿魏酸酯酶活性的解纤维枝顶孢 霉 (Acremonium cellulolyticus)、棘 孢 曲 霉 (Aspergillus aculeatus)、泡 盛 曲 霉 (Aspergillus awamori)、烟 曲 霉 (Aspergillus fumigatus)、臭 曲 霉 (Aspergillus foetidus)、 日 本 曲 霉 (Aspergillus japonicus)、 构 巢 曲 霉 (Aspergillus nidulans)、 黑 曲 霉 (Aspergillus niger)、米 曲 霉 (Aspergillus oryzae)、嗜 角 质 金 孢 子 菌 (Chrysosporium keratinophilum)、 Chrysosporium lucknowense、 热 带 金 孢 子 菌 (Chrysosporium tropicum)、 Chrysosporium merdarium、 Chrysosporium inops、 毡 金 孢 子 菌 (Chrysosporium pannicola)、 Chrysosporium queenslandicum、 Chrysosporium zonatum、 杆孢状镰孢 (Fusarium bactridioides)、 禾谷镰孢 (Fusarium cerealis)、 库威 镰孢 (Fusarium crookwellense)、 大刀镰孢 (Fusarium culmorum)、 禾本科镰孢 (Fusarium graminearum)、 禾 赤 镰 孢 (Fusarium graminum)、 异 孢 镰 孢 (Fusarium heterosporum)、 合欢木镰孢 (Fusarium negundi)、 尖镰孢 (Fusarium oxysporum)、 多枝镰孢 (Fusarium reticulatum)、 粉 红 镰 孢 (Fusarium roseum)、 接 骨 木 镰 孢 (Fusarium sambucinum)、 肤 色 镰 孢 (Fusarium sarcochroum)、 拟 分 枝 孢 镰 孢 (Fusarium sporotrichioides)、 硫色 镰 孢 (Fusarium sulphureum)、 圆 镰 孢 (Fusarium torulosum)、 拟 丝 孢 镰 孢 (Fusarium trichothecioides)、 镶片镰孢 (Fusarium venenatum)、 灰腐质霉 (Humicola grisea)、 特 异腐质霉 (Humicola insolens)、 疏棉状腐质霉 (Humicola lanuginosa)、 白耙齿菌 (Irpex lacteus)、 米 黑 毛 霉 (Mucor miehei)、 嗜 热 毁 丝 霉 (Myceliophthora thermophila)、 粗 糙 脉 孢 菌 (Neurospora crassa)、 绳 状 青 霉 (Penicillium funiculosum)、 产紫青霉 (Penicillium purpurogenum)、 黄孢平革菌 (Phanerochaete chrysosporium)、 哈茨木霉 (Trichoderma harzianum)、 康 宁 木 霉 (Trichodermakoningii)、 长 枝 木 霉 (Trichoderma longibrachiatum)、 里氏木霉 (Trichoderma reesei) 或绿色木霉 (Trichoderma viride)多肽。 在另一优选的方面, 所述多肽是青霉属菌种的多肽。
在一个更优选的方面, 所述多肽是具有阿魏酸酯酶活性的桔灰青霉多肽。在一个 最优选的方面, 所述多肽是包含 SEQ ID NO : 2 的成熟多肽的多肽。可理解的是对于前述的 种, 本发明包含完全和不完全阶段 (perfect and imperfect states), 和其它分类学的等 同物 (equivalent), 例如无性型 (anamorph), 而无论它们已知的种名。本领域的技术人员 会容易地识别适合的等同物的身份 (identity)。
此外, 可以使用上述的探针从其它来源, 包括从自然界 ( 例如, 土壤、 堆肥、 水等 ) 分离的微生物鉴定和获得这些多肽。用于从天然生境 (habitat) 分离微生物的技术是本领 域内公知的。随后可通过相似地筛选这种微生物的基因组或 cDNA 文库来获得所述多核苷 酸。一旦用所述探针检测到编码多肽的多核苷酸序列, 就能够使用本领域普通技术人员熟 知的技术将所述多核苷酸分离或克隆 ( 参见, 例如, Sambrook 等, 1989, 见上 )。
本发明的多肽还包括融合多肽或可切割的融合多肽, 其中将另外的多肽融合到所 述多肽或其片段的 N 末端或 C 末端。通过将编码另一个多肽的核苷酸序列 ( 或其部分 ) 融 合于本发明的核苷酸序列 ( 或其部分 ) 来产生融合的多肽。产生融合多肽的技术是本领域 已知的, 并包括连接编码多肽的编码序列以使它们在阅读框中, 并且使所述融合多肽的表 达在相同启动子和终止子的控制下。
融合多肽还可以包括切割位点。 一旦分泌了融合多肽, 就切割所述位点, 从融合蛋 白释放具有阿魏酸酯酶活性的多肽。切割位点的实例包括, 但不限于, Kex2 位点, 其编码二 肽 Lys-Arg(Martin 等, 2003, J.Ind.Microbiol.Biotechnol.3 : 568-76 ; Svetina 等, 2000, J.Biotechnol.76 : 245-251 ; Rasmussen-Wilson 等, 1997, Appl.Environ.Microbiol.63 : 3488-3493 ; Ward 等, 1995 , Biotechnology 13 : 498-503 ; 和 Contreras 等, 1991 , Biotechnology 9 : 378-381) ; Ile-(Glu 或 Asp)-Gly-Arg 位点, 其在精氨酸残基后通过因 子 Xa 蛋 白 酶 切 割 (Eaton 等, 1986, Biochem.25 : 505-512) ; Asp-Asp-Asp-Asp-Lys 位 点, 其在赖氨酸后通过肠激酶切割 (Collins-Racie 等, 1995, Biotechnology 13 : 982-987) ; His-Tyr-Glu 位 点 或 His-Tyr-Asp 位 点,其 通 过 Genenase I 切 割 (Carter 等, 1989, Proteins : Structure, Function, and Genetics 6 : 240-248) ; Leu-Val-Pro-Arg-Gly-Ser 位 点, 其 在 Arg 后 通 过 凝 血 酶 切 割 (Stevens, 2003, Drug Discovery World 4 : 35-48) ; Glu-Asn-Leu-Tyr-Phe-Gln-Gly 位点, 其在 Gln 后通过 TEV 蛋白酶切割 (Stevens, 2003, 见 上); 和 Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro 位点, 其在 Gln 后通过遗传工程形式的人鼻病 毒 3C 蛋白酶切割 (Stevens, 2003, 见上 )。
多核苷酸
本发明还涉及分离的多核苷酸, 其包含编码本发明具有阿魏酸酯酶活性的多肽的 核苷酸序列, 或由该核苷酸序列组成。
在一个优选的方面, 核苷酸序列包含 SEQ ID NO : 1 或由 SEQ ID NO : 1 组成。在另 一优选的方面, 核苷酸序列包含 SEQ ID NO : 1 的成熟多肽编码序列或由 SEQ ID NO : 1 的成 熟多肽编码序列组成。 在另一优选的方面, 核苷酸序列包含 SEQ ID NO : 1 的核苷酸 152-901 或由 SEQ ID NO : 1 的核苷酸 152-901 组成。本发明还包含编码如下多肽的核苷酸序列, 所 述多肽包含 SEQID NO : 2 的氨基酸序列或其成熟多肽, 或由 SEQ ID NO : 2 的氨基酸序列或其
成熟多肽组成 ; 由于遗传密码的简并性, 所述核苷酸序列不同于 SEQ ID NO : 1 或其成熟多 肽编码序列。本发明还涉及 SEQ ID NO : 1 的亚序列, 所述亚序列编码具有阿魏酸酯酶活性 的 SEQ ID NO : 2 的片段。
本发明还涉及突变的多核苷酸, 其在 SEQ ID NO : 1 的成熟多肽编码序列中包含至 少一个突变或由具有至少一个突变的 SEQ ID NO : 1 的成熟多肽编码序列组成, 其中突变的 核苷酸序列编码 SEQ ID NO : 2 的成熟多肽。
用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的, 且包括从基因 组 DNA 分离, 从 cDNA 制备, 或其组合。可通过例如使用熟知的聚合酶链式反应 (PCR) 或 表达文库的抗体筛选来检测具有共有结构特性的克隆 DNA 片段, 从而实现从这种基因组 DNA 克隆本发明的多核苷酸。参见, 例如, Innis 等, 1990, PCR : A Guide to Methods and Application, Academic Press, New York。 可以使用其它核酸扩增方法, 如连接酶链式反应 (LCR)、 连接活化转录 (LAT) 和基于核苷酸序列的扩增 (NASBA)。 可以从青霉属菌种的菌株, 或另外的或相关的生物体克隆所述多核苷酸, 并且因此可以是例如所述核苷酸序列的多肽 编码区的等位基因变体或种变体 (species variant)。
本发明还涉及分离的多核苷酸, 其包含下述核苷酸序列或由其组成, 所述核苷酸 序列与 SEQ ID NO : 1 的成熟多肽编码序列具有优选至少 60%、 更优选至少 65%、 更优选至 少 70%、 更优选至少 75%、 更优选至少 80%、 更优选至少 85%、 甚至更优选至少 90%、 最优 选至少 95%、 并甚至最优选至少 96%、 至少 97%、 至少 98%或至少 99%的同一性程度, 所述 多核苷酸编码活性多肽。 修饰编码本发明多肽的核苷酸序列对于合成与所述多肽基本上相似的多肽可为 必需的。术语与所述多肽 “基本上相似” 指多肽的非天然存在的形式。这些多肽可能以一些 工程改造的方式而不同于从其天然来源分离的多肽, 例如, 比活性、 热稳定性、 最适 pH 等方 面不同的人工变体。可以在作为 SEQ ID NO : 1 的成熟多肽编码序列存在的核苷酸序列, 例 如其亚序列的基础上, 和 / 或通过引入如下核苷酸取代来构建变体序列 : 所述取代不产生 由核苷酸序列编码的多肽的另外的氨基酸序列, 但是符合意欲产生酶的宿主生物体的密码 子选择 ; 或者所述取代可产生不同的氨基酸序列。 关于核苷酸取代的概述, 参见, 例如, Ford 等, 1991, Protein Expression and Purification 2 : 95-107。
对于本领域技术人员显而易见的是, 这些取代能够在对于分子功能重要的区域之 外进行, 并且仍然产生活性多肽。对于由本发明的分离的多核苷酸编码的多肽活性关键的 并且因此优选不进行取代的氨基酸残基, 可以根据本领域公知的方法, 如定位诱变或丙氨 酸分区诱变 ( 参见, 例如, Cunningham 和 Wells, 1989, 见上 ) 来鉴定。在后一技术中, 将突 变引入到分子中的每个荷正电的残基处, 并且测试所得突变分子的阿魏酸酯酶活性, 以鉴 定对于所述分子的活性关键的氨基酸残基。底物 - 酶相互作用的位点也能够通过分析三维 结构测定, 通过如核磁共振分析、 晶体学或光亲和标记这样的技术来测定 ( 参见, 例如, de Vos 等, 1992, 见上 ; Smith 等, 1992, 见上 ; Wlodaver 等, 1992, 见上 )。
本发明还涉及编码本发明多肽的分离的多核苷酸, 所述分离的多核苷酸在非常低 严紧条件下, 优选低严紧条件, 更优选中严紧条件, 更优选中 - 高严紧条件, 甚至更优选高 严紧条件, 并且最优选非常高的严紧条件下, 与以下杂交 : (i)SEQ ID NO : 1 的成熟多肽编码 序列, (ii) 包含 SEQ ID NO : 1 的成熟多肽编码序列的基因组 DNA 序列, 或 (iii)(i) 或 (ii)
的全长互补链, 或它们的等位变体和亚序列 (Sambrook 等, 1989, 同上 ), 如本文所定义的。 在一个优选的方面, 互补链是 SEQ ID NO : 1 的成熟多肽编码序列的全长互补链。
本发明还涉及通过如下获得的分离的多核苷酸 : (a) 在非常低、 低、 中、 中 - 高、 高 或非常高严紧条件下, 将 DNA 的群体与以下杂交 : (i)SEQ ID NO : 1 的成熟多肽编码序列, (ii) 包含 SEQ ID NO : 1 的成熟多肽编码序列的基因组 DNA 序列, 或 (iii)(i) 或 (ii) 的全 长互补链 ; 和 (b) 分离杂交的多核苷酸, 其编码具有阿魏酸酯酶活性的多肽。 在一个优选的 方面, 所述互补链是 SEQ IDNO : 1 的成熟多肽编码序列的全长互补链。
核酸构建体
本发明还涉及包含本发明的分离的多核苷酸的核酸构建体, 所述分离的多核苷酸 与一个或多个 ( 几个 ) 调控序列可操作地连接, 所述调控序列在合适的宿主细胞中在与该 调控序列相容的条件下指导编码序列的表达。
可以用许多方式操作编码本发明多肽的分离的多核苷酸以供多肽的表达。 依赖于 表达载体, 在将多核苷酸的序列插入载体之前对其进行操作可能是理想的或必需的。使用 重组 DNA 方法修饰多核苷酸序列的技术是本领域熟知的。
调控序列可以是适当的启动子序列, 其是由用于表达编码本发明多肽的多核苷酸 的宿主细胞识别的核苷酸序列。启动子序列含有介导多肽的表达的转录调控序列。启动子 可以是在所选的宿主细胞中显示转录活性的任何核苷酸序列, 包括突变的、 截短的和杂合 的启动子, 并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。 用于指导本发明的核酸构建体转录, 特别是在细菌宿主细胞中转录的合适启动子 的实例是从下述获得的启动子 : 大肠杆菌 lac 操纵子、 天蓝链霉菌琼脂糖酶基因 (dagA)、 枯草芽孢杆菌果聚糖蔗糖酶基因 (sacB)、 地衣芽孢杆菌 α- 淀粉酶基因 (amyL)、 嗜热脂 肪芽孢杆菌产麦芽淀粉酶基因 (amyM)、 解淀粉芽孢杆菌 α- 淀粉酶基因 (amyQ)、 地衣芽 孢杆菌青霉素酶基因 (penP)、 枯草芽孢杆菌 xylA 和 xylB 基因和原核 β- 内酰胺酶基因 (Villa-Kamaroff 等, 1978, Proceedings of the National Academy of Sciences USA 75 : 3727-3731), 以及 tac 启动子 (DeBoer 等, 1983, Proceedings of the National Academy of Sciences USA 80 : 21-25)。另外的启动子在″ Useful proteins from recombinant bacteria″于 Scientific American, 1980, 242 : 74-94 中 ; 和在 Sambrook 等, 1989, 见上中 描述。
用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例 是从下列酶的基因获得的启动子 : 米曲霉 TAKA 淀粉酶、 曼赫根毛霉 (Rhizomucor miehei) 天冬氨酸蛋白酶、 黑曲霉中性 α- 淀粉酶、 黑曲霉酸稳定性 α- 淀粉酶、 黑曲霉或泡盛曲霉 葡糖淀粉酶 (glaA)、 曼赫根毛霉脂肪酶、 米曲霉碱性蛋白酶、 米曲霉丙糖磷酸异构酶、 构巢 曲霉乙酰胺酶、 镶片镰孢淀粉葡糖苷酶 (WO 00/56900)、 镶片镰孢 Daria(WO 00/56900)、 镶 片镰孢 Quinn(WO 00/56900)、 尖镰孢胰蛋白酶样蛋白酶 (WO 96/00787)、 里氏木霉 β- 葡糖 苷酶、 里氏木霉纤维二糖水解酶 I、 里氏木霉纤维二糖水解酶 II、 里氏木霉内切葡聚糖酶 I、 里氏木霉内切葡聚糖酶 II、 里氏木霉内切葡聚糖酶 III、 里氏木霉内切葡聚糖酶 IV、 里氏木 霉内切葡聚糖酶 V、 里氏木霉木聚糖酶 I、 里氏木霉木聚糖酶 II、 里氏木霉 β- 木糖苷酶, 以 及 NA2-tpi 启动子 ( 来自黑曲霉中性 α- 淀粉酶基因和米曲霉丙糖磷酸异构酶基因的启动 子的杂合体 ) ; 和它们的突变的、 截短的和杂合的启动子。
在酵母宿主中, 有用的启动子从如下酶的基因获得 : 酿酒酵母烯醇化酶 (ENO-1)、 酿酒酵母半乳糖激酶 (GAL1)、 酿酒酵母醇脱氢酶 / 甘油醛 -3- 磷酸脱氢酶 (ADH1, ADH2/ GAP)、 酿酒酵母丙糖磷酸异构酶 (TPI)、 酿酒酵母金属硫蛋白 (CUP1) 和酿酒酵母 3- 磷酸甘 油酸激酶。对于酵母宿主细胞其它有用的启动子由 Romanos 等, 1992, Yeast 8 : 423-488 描 述。
调控序列也可以是合适的转录终止子序列, 其是由宿主细胞识别以终止转录的序 列。所述终止子序列与编码所述多肽的核苷酸序列的 3’ 末端可操作地连接。可以将在所 选宿主细胞中有功能的任何终止子用在本发明中。
对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得 : 米曲霉 TAKA 淀粉酶、 黑曲霉葡糖淀粉酶、 构巢曲霉邻氨基苯甲酸合酶、 黑曲霉 α- 葡糖苷酶和尖镰孢胰蛋白酶 样蛋白酶。
对于酵母宿主细胞优选的终止子从如下酶的基因获得 : 酿酒酵母烯醇化酶、 酿酒 酵母细胞色素 C(CYC1) 和酿酒酵母甘油醛 -3- 磷酸脱氢酶。对于酵母宿主细胞其它有用的 终止子由 Romanos 等, 1992, 见上描述。
调控序列还可以是合适的前导序列, 其是对于宿主细胞的翻译重要的 mRNA 非翻 译区。前导序列可操作地连接于编码多肽的核苷酸序列的 5’ - 末端。可以将在所选宿主细 胞中有功能的任何前导序列用在本发明中。
对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得 : 米曲霉 TAKA 淀粉 酶和构巢曲霉丙糖磷酸异构酶。
对于酵母宿主细胞合适的前导序列从如下酶的基因获得 : 酿酒酵母烯醇化酶 (ENO-1)、 酿酒酵母 3- 磷酸甘油酸激酶、 酿酒酵母 α 因子和酿酒酵母醇脱氢酶 / 甘油 醛 -3- 磷酸脱氢酶 (ADH2/GAP)。
调控序列也可以是聚腺苷酸化序列, 其是与核苷酸序列的 3’ 末端可操作地连接的 序列, 并且在转录时, 宿主细胞将其识别为向转录的 mRNA 添加聚腺苷残基的信号。可以将 在所选宿主细胞中有功能的任何聚腺苷酸化序列在本发明中使用。
对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得 : 米曲霉 TAKA 淀粉酶、 黑曲霉葡糖淀粉酶、 构巢曲霉邻氨基苯甲酸合酶、 尖镰孢胰蛋白酶样蛋白酶和 黑曲霉 α- 葡糖苷酶。
对于酵母宿主细胞有用的聚腺苷酸化序列由 Guo 和 Sherman, 1995, Molecular Cellular Biology 15 : 5983-5990 描述。
调控序列还可以是信号肽编码序列, 其编码与多肽的氨基末端相连的氨基酸序 列, 并且指导编码的多肽进入细胞分泌途径。核苷酸序列的编码序列 5’ 端可固有地包含信 号肽编码序列, 该信号肽编码序列与编码分泌多肽的编码序列区段一起天然地连接在翻译 阅读框中。或者, 编码序列 5’ 端可含有对于所述编码序列为外源的信号肽编码序列。外源 信号肽编码序列在编码序列不天然地含有信号肽编码序列时可为必需的。或者, 外源信号 肽编码序列可以简单地取代天然信号肽编码序列以增强多肽的分泌。然而, 指导表达的多 肽进入所选宿主细胞的分泌途径 ( 即, 分泌至培养基中 ) 的任何信号肽编码序列可在本发 明中使用。
对于细菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列 : 芽孢杆菌属 NCIB 11837 产麦芽糖淀粉酶、 嗜热脂肪芽孢杆菌 α- 淀粉酶、 地衣芽孢杆 菌枯草杆菌蛋白酶 (subtilisin)、 地衣芽孢杆菌 β- 内酰胺酶、 嗜热脂肪芽孢杆菌中性蛋 白酶 (nprT, nprS, nprM) 和枯草芽孢杆菌 prsA。另外的信号肽由 Simonen 和 Palva, 1993, Microbiological Reviews 57 : 109-137 描述。
对于丝状真菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽 编码序列 : 米曲霉 TAKA 淀粉酶、 黑曲霉中性淀粉酶、 黑曲霉葡糖淀粉酶、 曼赫根毛霉天冬氨 酸蛋白酶、 特异腐质霉纤维素酶、 特异腐质霉内切葡聚糖酶 V 和疏棉状腐质霉脂肪酶。
对于酵母宿主细胞有用的信号肽从酿酒酵母 α 因子和酿酒酵母转化酶的基因获 得。其它有用的信号肽编码序列由 Romanos 等, 1992, 见上描述。
调控序列还可以是前肽编码序列, 其编码位于多肽氨基末端的氨基酸序列。所 得多肽称为酶原 (proenzyme) 或前多肽 (propolypeptide)( 或在某些情况下称为酶原 (zymogen))。前 ( 多 ) 肽通常是无活性的并且能够通过从前多肽催化或自催化切割所述 前肽而转化为成熟活性多肽。可以从枯草芽孢杆菌碱性蛋白酶 (aprE)、 枯草芽孢杆菌中 性蛋白酶 (nprT)、 酿酒酵母 α 因子、 曼赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶 (WO 95/33836) 的基因获得前肽编码序列。
当信号肽和前肽序列二者均出现在多肽的氨基末端时, 使前肽序列的位于紧接着 (next to) 多肽氨基末端, 并且使信号肽序列的位于紧接着前肽序列的氨基末端。
同样理想的是添加调节序列, 其允许相对于宿主细胞的生长来调节多肽的表达。 调节系统的实例是引起基因表达响应化学或物理刺激物, 包括调节化合物的存在而开启或 关闭的那些系统。原核系统中的调节系统包括 lac、 tac 和 trp 操纵基因系统。在酵母中, 可以使用 ADH2 系统或 GAL1 系统。在丝状真菌中, 可以使用 TAKAα- 淀粉酶启动子、 黑曲霉 葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调节序列。 调节序列的其它实例是那些 允许基因扩增的序列。在真核系统中, 这些调节序列包括在氨甲蝶呤 (methotrexate) 存在 下扩增的二氢叶酸还原酶基因, 和以重金属 (with heavy metal) 扩增的金属硫蛋白基因。 在这些情况下, 编码多肽的核苷酸序列与调节序列可操作地连接。
表达载体
本发明还涉及重组表达载体, 所述重组表达载体包含本发明的多核苷酸、 启动子 和转录和翻译终止信号。 本文所述的多种核酸和调控序列可以结合在一起以产生重组表达 载体, 所述表达载体可以包括一个或多个 ( 几个 ) 方便的限制位点以允许在这些位点插入 或取代编码多肽的核苷酸序列。可供选择的是, 可以通过在适当的用于表达的载体中插入 包含所述序列的核苷酸序列或核酸构建体来表达本发明的多核苷酸序列。 在制备表达载体 的过程中, 将编码序列置于载体中, 从而将该编码序列与适当的表达用调控序列可操作地 连接。
重组表达载体可以是任何载体 ( 例如, 质粒或病毒 ), 其能够方便地进行重组 DNA 步骤, 并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将引入该载体的 宿主细胞的相容性。载体可以是线状或闭合环状质粒。
载体可以是自主复制载体, 即, 作为染色体外实体 (entity) 存在的载体, 其复制 独立于染色体复制, 例如, 质粒、 染色体外元件、 微型染色体 (minichromosome) 或人工染色 体。 载体可以含有任何用于确保自复制的手段 (means)。 或者, 载体可以是一种当被引入宿主细胞中时, 整合到基因组中并且与整合了该载体的染色体一起复制的载体。 此外, 可以使 用单独的载体或质粒或两个或更多个载体或质粒, 其共同含有待引入宿主细胞基因组的完 整 DNA(total DNA), 或可以使用转座子 (transposon)。
本发明的载体优选含有一个或多个 ( 或几个 ) 选择性标记, 其允许简单选择经转 化、 转染、 转导等的细胞。 选择性标记是基因, 其产物提供杀生物剂或病毒抗性、 对重金属的 抗性、 对营养缺陷型的原养性 (prototrophy to auxotrophs) 等。
细菌选择性标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的 dal 基因, 或赋予 抗生素抗性的标记, 所述抗生素抗性如氨苄青霉素、 卡那霉素、 氯霉素或四环素抗性。对于 酵母宿主细胞合适的标记是 ADE2、 HIS3、 LEU2、 LYS2、 MET3、 TRP1 和 URA3。用于丝状真菌 宿主细胞的选择性标记包括但不限于 amdS( 乙酰胺酶 )、 argB( 鸟氨酸氨甲酰基转移酶 )、 bar( 草铵膦 (phosphinothricin) 乙酰转移酶 )、 hph( 潮霉素磷酸转移酶 )、 niaD( 硝酸还原 酶 )(nitrate reductase)、 pyrG( 乳清酸核苷 -5’ - 磷酸脱羧酶 )(orotidine-5’ -phosphate decarboxylase)、 sC( 硫酸腺苷酰转移酶 ) 和 trpC( 邻氨基苯甲酸合酶 (anthranilate synthase)) 以及它们的等同物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的 amdS 和 pyrG 基因和吸水链霉菌 (Streptomyces hygroscopicus) 的 bar 基因。
本发明的载体优选含有元件, 其允许载体整合入宿主细胞基因组或允许载体在细 胞中独立于基因组自主复制。
为了整合入宿主细胞基因组, 载体可依赖编码多肽的多核苷酸的序列或用于通过 同源或非同源重组整合入基因组的任何其它载体元件。或者, 载体可以含有额外的核苷酸 序列, 用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精 确位置整合的可能性, 整合元件应优选含有足够数量的核酸, 如 100 至 10,000 碱基对, 优选 400 至 10,000 碱基对, 并且最优选 800 至 10,000 碱基对, 其与相应的目标序列具有高度同 一性以增强同源重组的概率。整合元件可以是任何序列, 其与宿主细胞基因组中的目标序 列同源。此外, 整合元件可以是非编码或编码的核苷酸序列。另一方面, 可以将载体通过非 同源重组整合到宿主细胞的基因组中。
为了自主复制, 载体可以还包含复制起点, 其使载体能够在所述的宿主细胞中自 主地复制。复制起点可以是介导自主复制的任何质粒复制子 (replicator), 其在细胞中发 挥功能。术语 “复制起点” 或 “质粒复制子” 在本文定义为能够使质粒或载体体内复制的核 苷酸序列。
细菌复制起点的实例是允许在大肠杆菌中复制的质粒 pBR322、 pUC19、 pACYC177 和 pACYC184 的复制起点, 和允许在芽孢杆菌属中复制的质粒 pUB110、 pE194、 pTA1060 和 pAMβ1 的复制起点。
用于酵母宿主细胞中的复制起点的实例是 2 微米复制起点, ARS1, ARS4, ARS1 和 CEN3 的组合, 和 ARS4 和 CEN6 的组合。
在丝状真菌细胞中有用的复制起点的实例是 AMA1 和 ANS1(Gems 等, 1991, Gene 98 : 61-67 ; Cullen 等, 1987, Nucleic Acids Research 15 : 9163-9175 ; WO 00/24883)。分 离 AMA1 基因和构建包含该基因的质粒或载体能够根据公开于 WO 00/24883 中的方法完成。
可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞以增加基因产物的产 生。多核苷酸拷贝数的增加可通过如下方法获得 : 将至少一个额外拷贝的序列整合入宿主细胞基因组, 或将可扩增的选择性标记基因包括于多核苷酸, 其中可通过在合适的选择剂 (selectable agent) 存在下培养细胞来选择含有选择性标记基因的扩增拷贝, 从而也含有 多核苷酸的额外拷贝的细胞。
用于连接上述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知 的 ( 参见, 例如, Sambrook 等, 1989, 见上 )。
宿主细胞
本发明还涉及重组宿主细胞, 其包含本发明的分离的多核苷酸, 将所述重组宿主 细胞有利地用于多肽的重组产生。 将包含本发明的多核苷酸的载体引入宿主细胞从而将所 述载体作为染色体整合体或作为自复制的染色体外载体保持, 如前文所述。术语 “宿主细 胞” 包含亲本细胞的任何子代, 其因为在复制过程中发生的突变而与该亲本细胞不同。 宿主 细胞的选择在很大程度上会依赖于编码多肽的基因及其来源。
宿主细胞可以是在本发明的多肽的重组产生中有用的任何细胞, 例如, 原核或真 核细胞。
原核宿主细胞可以是任何革兰氏阳性细菌或革兰氏阴性细菌。革兰氏阳性细菌 包括但不限于, 芽孢杆菌属、 链球菌属、 链霉菌属、 葡萄球菌属、 肠球菌属、 乳杆菌属、 乳球菌 属、 梭菌属、 地芽孢杆菌属和海洋芽孢杆菌属。 革兰氏阴性细菌包括但不限于, 大肠杆菌、 假 单胞菌属、 沙门氏菌属、 弯曲杆菌属、 螺杆菌属、 黄杆菌属、 梭杆菌属、 泥杆菌属、 奈瑟氏菌属 和脲原体属。
细菌宿主细胞可以是任何芽孢杆菌细胞。 在本发明的实施中有用的芽孢杆菌属细 胞包括但不限于, 嗜碱芽孢杆菌、 解淀粉芽孢杆菌、 短芽孢杆菌、 环状芽孢杆菌、 克劳氏芽孢 杆菌、 凝结芽孢杆菌、 坚强芽孢杆菌、 灿烂芽孢杆菌、 迟缓芽孢杆菌、 地衣芽孢杆菌、 巨大芽 孢杆菌、 短小芽孢杆菌、 嗜热脂肪芽孢杆菌、 枯草芽孢杆菌和苏云金芽孢杆菌细胞。
在一个优选的方面, 细菌宿主细胞是解淀粉芽孢杆菌、 迟缓芽孢杆菌、 地衣芽孢杆 菌、 嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。 在更优选的方面, 细菌宿主细胞是解淀粉芽孢 杆菌细胞。在另一个更优选的方面, 细菌宿主细胞是克劳氏芽孢杆菌细胞。在另一个更优 选的方面, 细菌宿主细胞是地衣芽孢杆菌细胞。 在另一个更优选的方面, 细菌宿主细胞是枯 草芽孢杆菌细胞。
细菌宿主细胞还可以是任何链球菌属细胞。 在本发明的实施中有用的链球菌属细 胞包括但不限于, 似马链球菌、 酿脓链球菌、 乳房链球菌和马链球菌兽瘟亚种细胞。
在一个优选的方面, 细菌宿主细胞是似马链球菌细胞。 在另一个优选方面, 细菌宿 主细胞是酿脓链球菌细胞。在另一个优选方面, 细菌宿主细胞是乳房链球菌细胞。在另一 个优选方面, 细菌宿主细胞是马链球菌兽瘟亚种细胞。
细菌宿主细胞还可以是任何链霉菌属细胞。 在本发明的实施中有用的链霉菌属细 胞包括但不限于, 不产色链霉菌、 除虫链霉菌、 天蓝链霉菌、 灰色链霉菌和浅青紫链霉菌细 胞。
在一个优选的方面, 细菌宿主细胞是不产色链霉菌细胞。 在另一个优选的方面, 细 菌宿主细胞是除虫链霉菌细胞。 在另一个优选的方面, 细菌宿主细胞是天蓝链霉菌细胞。 在 另一个优选的方面, 细菌宿主细胞是灰色链霉菌细胞。 在另一个优选的方面, 细菌宿主细胞 是浅青紫链霉菌细胞。可通过如下方法实现将 DNA 引入到芽孢杆菌属细胞 : 例如原生质体转化 ( 参见, 例如, Chang 和 Cohen, 1979, Molecular General Genetics 168 : 111-115), 使用感受态 细胞 ( 参见, 例如, Young 和 Spizizen, 1961, Journal of Bacteriology 81 : 823-829 或 Dubnau 和 Davidoff-Abelson, 1971, Journal of Molecular Biology 56 : 209-221), 电穿 孔 ( 参见, 例如, Shigekawa 和 Dower, 1988, Biotechniques 6 : 742-751) 或接合 ( 参见, 例如, Koehler 和 Thorne, 1987, Journal of Bacteriology 169 : 5271-5278)。可通过如 下方法实现将 DNA 引入到大肠杆菌细胞 : 例如原生质体转化 ( 参见, 例如, Hanahan, 1983, J.Mol.Biol.166 : 557-580) 或电穿孔 ( 参见, 例如, Dower 等, 1988, Nucleic Acids Res.16 : 6127-6145)。可通过如下方法实现将 DNA 引入到链霉菌属细胞 : 例如原生质体转化和电穿 孔 ( 参见, 例如, Gong 等, 2004, Folia Microbiol.(Praha)49 : 399-405), 接合 ( 参见, 例如, Mazodier 等, 1989, J.Bacteriol.171 : 3583-3585), 或转导 ( 参见, 例如, Burke 等, 2001, Proc.Natl.Acad Sci.USA 98 : 6289-6294)。可通过如下方法实现将 DNA 引入到假单胞菌 属细胞 : 例如电穿孔 ( 参见, 例如, Choi 等, 2006, J.Microbiol.Methods 64 : 391-397) 或接 合 ( 参见, 例如, Pinedo 和 Smets, 2005, Appl.Environ.Microbiol.71 : 51-57)。可通过如 下方法实现将 DNA 引入到链球菌属细胞 : 例如天然感受态 (natural competence)( 参见, 例 如, Perry 和 Kuramjtsu, 1981, Infect.Immun.32 : 1295-1297), 原生质体转化 ( 参见, 例如, Catt 和 Jollick, 1991, Microbios.68 : 189-207), 电穿孔 ( 参见, 例如, Buckley 等, 1999, Appl.Environ.Microbiol.65 : 3800-3804) 或接合 ( 参见, 例如, Clewell, 1981, Microbiol. Rev.45 : 409-436)。然而, 可以使用任何本领域已知的将 DNA 引入宿主细胞的方法。
宿主细胞还可以是真核生物, 如哺乳动物、 昆虫、 植物或真菌细胞。
在一个优选的方面, 宿主细胞是真菌细胞。 “真菌” 用在本文包括以下门 : 子囊 菌门 (Ascomycota)、 担子菌门 (Basidiomycota)、 壶菌门 (Chytridiomycota) 和接合菌门 (Zygomycota)( 如由 Hawksworth 等, 于 Ainsworth and Bisby’ sDictionary of The Fungi, 第八版, 1995, CAB International, University Press, Cambridge, UK 中所定义 ) 以及卵菌 门 (Oomycota)( 如 Hawksworth 等, 1995, 见上, 171 页中所引用 ), 和所有有丝分裂孢子真菌 (mitosporic fungi)(Hawksworth 等, 1995, 见上 )。
在 一 个 更 优 选 的 方 面, 真 菌 宿 主 细 胞 是 酵 母 细 胞。 “酵 母”用 在 本 文 包 括 产 子 囊 酵 母 (ascosporogenous yeast)( 内 孢 霉 目 (Endomycetales))、产 担 子 酵 母 (basidiosporogenous yeast) 和 属 于 半 知 菌 类 (Fungi Imperfecti)( 芽 孢 纲 (Blastomycetes)) 的酵母。 由于酵母的分类在未来可能改变, 就本发明而言, 会将酵母定义 为如 Biology and Activities of Yeast(Skinner, F.A., Passmore, S.M., 和 Davenport, R.R. 编, Soc.App.Bacteriol.Symposium Series No.9, 1980) 中所述。
在 一 个 甚 至 更 加 优 选 的 方 面, 酵 母 宿 主 细 胞 是 假 丝 酵 母 属、 汉逊酵母属 (Hansenula)、 克鲁维酵母属、 毕赤酵母属、 酵母属、 裂殖酵母属或西洋蓍霉属细胞。
在一个最优选的方面, 酵母宿主细胞是卡尔酵母、 酿酒酵母、 糖化酵母、 道格拉氏 酵母、 克鲁弗酵母、 诺地酵母或卵形酵母细胞。在另一个最优选的方面, 酵母宿主细胞是乳 酸克鲁维酵母 (Kluyveromyces lactis) 细胞。在另一个最优选的方面, 酵母宿主细胞是解 脂西洋蓍霉 (Yarrowia lipolytica) 细胞。
在另一个更优选的方面, 真菌宿主细胞是丝状真菌细胞。 “丝状真菌” 包括真菌门(Eumycota) 和卵菌门的亚门 ( 如由 Hawksworth 等, 1995, 见上文, 所定义 ) 的所有丝状形 式。丝状真菌通常的特征在于由壳多糖 (chitin)、 纤维素、 葡聚糖、 壳聚糖 (chitosan)、 甘 露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长, 而碳分解代谢是专 性需氧的。相反, 酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖 (budding) 进 行, 而碳分解代谢可以是发酵的。
在一个甚至更优选的方面, 丝状真菌宿主细胞是枝顶孢霉属、 曲霉属、 短梗霉 属、 烟 管 霉 属 (Bjerkandera)、 拟 蜡 菌 属、 金 孢 子 菌 属、 鬼 伞 属 (Coprinus)、 革盖菌属 (Coriolus)、 隐球菌属、 Filibasidium、 镰孢属、 腐质霉属、 梨孢菌属、 Malbrancea、 毛霉属、 毁丝霉属、 新考玛脂霉属、 脉孢菌属、 拟青霉属、 青霉属、 平革菌属、 射脉菌属 (Phlebia)、 瘤 胃壶菌属、 侧耳属 (Pleurotus)、 裂褶菌属、 踝节菌属、 嗜热子囊菌属、 梭孢壳属、 弯颈霉属、 栓菌属 (Trametes) 或木霉属细胞。
在一个最优选的方面, 丝状真菌宿主细胞是泡盛曲霉、 烟曲霉、 臭曲霉、 日本曲霉、 构巢曲霉、 黑曲霉或米曲霉细胞。在另一个最优选方面, 丝状真菌宿主细胞是杆孢状镰孢、 禾谷镰孢、 库威镰孢、 大刀镰孢、 禾本科镰孢、 禾赤镰孢、 异孢镰孢、 合欢木镰孢、 尖镰孢、 多 枝镰孢、 粉红镰孢、 接骨木镰孢、 肤色镰孢、 拟分枝孢镰孢、 硫色镰孢、 圆镰孢、 拟丝孢镰孢或 镶片镰孢细胞。在另一个最优选的方面, 丝状真菌宿主细胞是黑刺烟管菌 (Bjerkandera adusta)、 干 拟 蜡 菌 (Ceriporiopsis aneirina)、 干 拟 蜡 菌、 Ceriporiopsis caregiea、 Ceriporiopsis gilvescens、 Ceriporiopsis pannocinta、 Ceriporiopsis rivulosa、 Ceriporiopsis subrufa、 虫拟蜡菌 (Ceriporiopsis subvermispora)、 嗜角质金孢子菌、 Chrysosporium lucknowense、 热带金孢子菌、 Chrysosporium merdarium、 Chrysosporium inops、 毡 金 孢 子 菌、 Chrysosporium queenslandicum、 Chrysosporium zonatum、 灰盖鬼 伞 (Coprinus cinereus)、 毛革盖菌 (Coriolus hirsutus)、 特异腐质霉、 疏棉状腐质霉、 Malbranchea cinnamonea、 米黑毛霉、 嗜热毁丝霉、 粗糙脉孢菌、 桔灰青霉、 产紫青霉、 黄 孢 平 革 菌 (Phanerochaetechrysosporium)、 辐 射 射 脉 菌 (Phlebia radiata)、 刺芹侧耳 (Pleurotus eryngii)、 土生梭孢霉、 长绒毛栓菌 (Trametes villosa)、 变色栓菌 (Trametes versicolor)、 哈茨木霉、 康宁木霉、 长枝木霉、 里氏木霉或绿色木霉细胞。
可以将真菌细胞通过涉及原生质体形成、 原生质体转化和细胞壁重建的方法以 本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在 EP 238 023 和 Yelton 等, 1984, Proceedings of the National Academy of Sciences USA 81 : 1470-1474 中描述。用于转化镰孢属菌种的合适方法由 Malardier 等, 1989, Gene 78 : 147-156 和 WO 96/00787 描述。可以使用由如下文献描述的方法转化酵母 : Becker 和 Guarente, 于 Abelson, J.N. 和 Simon, M.I. 编, Guide to Yeast Genetics and Molecular Biology, Methods in Enzymology, Volume 194, 182-187 页, Academic Press, Inc., New York ; Ito 等, 1983, Journal of Bacteriology 153 : 163 ; 和 Hinnen 等, 1978, Proceedings of the National Academy of Sciences USA 75 : 1920。
产生方法
本发明还涉及产生本发明多肽的方法, 其包括 : (a) 在有益于产生多肽的条件下 培养细胞, 所述细胞以其野生型形式产生所述多肽 ; 和 (b) 回收所述多肽。 在一个优选的方 面, 所述细胞是青霉属的, 优选为属于桔灰青霉菌种的菌株, 其细胞能够在允许所述酶产生的条件下产生所述多肽, 并从培养物回收所述酶。
这些种的菌株在许多培养物保藏机构对于公众能够容易地取得, 所述保藏机构如 美国典型培养物保藏中心 (the American Type Culture Collection)(ATCC)、 德意志微生 物和细胞培养物保藏中心 (Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH)(DSM)、 真菌菌种保藏中心 (Centraalbureau Voor Schimmelcultures)(CBS) 和农业 研究机构专利培养物保藏中心北区研究中心 (Agricultural Research Service Patent Culture Collection, Northern Regional Research Center)(NRRL)。本发明还涉及产生 本发明的多肽的方法, 其包括 : (a) 在有益于产生多肽的条件下培养如本文所述的重组宿 主细胞 ; 和 (b) 回收所述多肽。
本发明还涉及产生本发明的多肽的方法, 包括 : (a) 在有益于产生多肽的条件下 培养重组宿主细胞, 其中所述宿主细胞包含 SEQ ID NO : 1 的成熟多肽编码序列或同源序列, 和 (b) 回收所述多肽。
本发明还涉及产生本发明的多肽的方法, 包括 : (a) 在有益于产生多肽的条件下 培养重组宿主细胞, 其中所述宿主细胞包含突变核苷酸序列, 其在 SEQ ID NO : 1 的成熟多肽 编码序列中具有至少一个突变, 其中所述突变核苷酸序列编码多肽, 所述多肽包含 SEQ ID NO : 2 的成熟多肽或由 SEQ ID NO : 2 的成熟多肽组成, 和 (b) 回收所述多肽。
在本发明的产生方法中, 使用本领域熟知的方法在适合于产生所述多肽的营养培 养基中培养细胞。例如, 可以通过在合适培养基中和允许表达和 / 或分离所述多肽的条件 下进行的摇瓶培养, 和实验室或工业发酵罐中的小规模或大规模发酵 ( 包括连续、 分批、 补 料分批或固态发酵 ) 来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培 养, 所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可 以根据公开的组成制备 ( 例如, 在美国典型培养物保藏中心的目录中 )。 如果多肽分泌到营 养培养基中, 该多肽能够从所述培养基中直接回收。 如果多肽不分泌到培养基中, 其能够从 细胞裂解物 (lysate) 回收。
可以使用本领域已知的对于所述多肽是特异性的方法来检测多肽。 这些检测方法 可包括特异性抗体的使用、 酶产物的形成或酶底物的消失。 例如, 酶测定法 (enzyme assay) 可用于测定如本文所述的多肽的活性。
所得多肽可以使用本领域已知的方法回收。例如, 多肽可以通过常规方法从营养 培养基中回收, 所述常规方法包括但不限于离心、 过滤、 提取、 喷雾干燥、 蒸发或沉淀。
本发明的多肽可以通过多种本领域已知的方法纯化以获得基本上纯的多肽, 所述 方法包括但不限于层析 ( 例如, 离子交换、 亲和、 疏水、 层析聚焦和大小排阻 )、 电泳方法 ( 例 如, 制备型 (preparative) 等电聚焦 )、 差示溶解度 ( 例如, 硫酸铵沉淀 )、 SDS-PAGE 或提取 ( 参见, 例如, Protein Purification, J.-C.Janson 和 Lars Ryden 编, VCH Publishers, New York, 1989)。
植物
本发明还涉及植物, 例如, 转基因植物、 植物部分或植物细胞, 其包含分离的多核 苷酸, 所述多核苷酸编码本发明的具有阿魏酸酯酶活性的多肽, 从而以可回收的量表达和 产生所述多肽。多肽可从植物或植物部分回收。或者, 同样可以将含有该重组多肽的植物 或植物部分用于改进食品或饲料的质量, 例如, 改进营养价值、 适口性 (palatability) 和流变性质 (rheological properties), 或用于破坏抗营养因子。
转基因植物可以是双子叶的 ( 双子叶植物 ) 或单子叶的 ( 单子叶植物 )。单子叶 植物的实例是草 (grasses), 如草地早熟禾 (meadow grass)( 蓝草 (blue grass), 早熟禾 属 (Poa)) ; 饲用牧草 (forage grass) 如羊茅属 (Festuca)、 黑麦草属 (Lolium) ; 寒地型牧 草 (temperate grass), 如 Agrostis( 翦股颖属 ) ; 和谷类, 例如, 小麦、 燕麦、 黑麦、 大麦、 稻 (rice)、 高粱和玉蜀黍 (maize)( 玉米 )。
双子叶植物的实例是烟草 (tobacco), 豆类 (legumes), 如羽扇豆 (lupins), 马铃 薯, 糖甜菜 (sugar beet), 豌豆, 豆 (bean) 和大豆 (soybean) 和十字花科的 (cruciferous) 植物 ( 十字花科 (family Brassicaceae)), 如花椰菜 (cauliflower), 油菜籽 (rape seed) 和紧密相关的模型生物体拟南芥 (Arabidopsis thaliana)。
植 物 部 分 的 实 例 是 茎 (stem)、 愈 伤 组 织 (callus)、 叶 (leaf)、 根 (root)、 果 实 (fruit)、 种 子 (seed) 和 块 茎 (tuber), 以 及 包 含 这 些 部 分 的 独 立 组 织, 例 如, 表皮 (epidermis)、 叶肉 (mesophyll)、 薄壁组织 (parenchyme)、 维管组织 (vascular tissue)、 分生组织 (meristem)。具体的植物细胞区室 (compartments), 如叶绿体 (chloroplast)、 质外体 (apoplast)、 线粒体 (mitochondria)、 液泡 (vacuole)、 过氧化物酶体 (peroxisome) 和细胞质 (cytoplasm) 也被认为是植物部分。此外, 任何植物细胞, 无论什么组织来源, 都 被认为是植物部分。 同样地, 植物部分, 如为了促进本发明的应用而分离的具体组织和细胞 也被认为是植物部分, 例如胚 (embryo)、 胚乳 (endosperm)、 糊粉 (aleurone) 和种皮 (seed coat)。
同样包括于本发明范围内的还有植物部分、 植物细胞和植物的子代。
表达本发明多肽的转基因植物或植物细胞可以依照本领域已知方法构建。 简而言 之, 通过如下构建所述植物或植物细胞 : 将编码本发明多肽的一个或多个 ( 几个 ) 表达构建 体并入植物宿主基因组或叶绿体基因组, 并且将所得的修饰植物或植物细胞繁殖为转基因 植物或植物细胞。
表达构建体便利地是包含编码本发明多肽的多核苷酸的核酸构建体, 所述多核苷 酸与在选择的植物或植物部分中表达该核苷酸序列所需的适当的调节序列可操作地连接。 此外, 表达构建体可以包含对于鉴定在其中整合了该表达构建体的宿主细胞有用的选择性 标记和将该构建体引入到所述植物中所必需的 DNA 序列 ( 后者依赖于使用的 DNA 引入方 法 )。
调节序列的选择, 例如启动子和终止子序列和任选地信号或转运序列的选择, 举例来说, 基于期望何时、 何处以及如何表达多肽而确定。例如, 编码本发明多肽的基因 的表达可以是组成型的或诱导型的, 或可以是发育、 阶段或组织特异性的, 并且基因产物 可以靶向特定的组织或植物部分例如种子或叶。调节序列由例如 Tague 等, 1988, Plant Physiology 86 : 506 所述。
对于组成性表达, 可以使用 35S-CaMV、 玉米泛素 1 和稻肌动蛋白 1 启动子 (Franck 等, 1980, Cell 21 : 285-294, Christensen 等, 1992, Plant Mo.Biol.18 : 675-689 ; Zhang 等, 1991, Plant Cell 3 : 1155-1165)。 器官特异性启动子可以是例如来自贮藏库组织 (storage sink tissue) 例如种子、 马铃薯块茎和果实的启动子 (Edwards & Coruzzi, 1990, Ann. Rev.Genet.24 : 275-303), 或来自代谢库组织 (metabolic sink tissue) 例如分生组织的启动子 (Ito 等, 1994, Plant Mol.Biol.24 : 863-878), 种子特异性启动子诸如来自稻的谷 蛋白 (glutelin)、 醇溶谷蛋白 (prolamin)、 球蛋白 (globulin) 或白蛋白 (albumin) 启动 子 (Wu 等, 1998, Plant and Cell Physiology 39 : 885-889), 来自豆球蛋白 (legumin)B4 和蚕豆 (Vicia faba) 的未知种子蛋白基因的蚕豆启动子 (Conrad 等, 1998, Journal of Plant Physiology 152 : 708-711)、 来自种子油体蛋白 (oil body protein) 的启动子 (Chen 等, 1998, Plant and Cell Physiology 39 : 935-941), 来自欧洲油菜 (Brassica napus) 的贮藏蛋白 napA 启动子, 或本技术领域公知的任何其它种子特异性的启动子, 例如, 在 WO 91/14772 中所描述的。此外, 启动子可为叶特异性的启动子, 如来自稻或番茄的 rbcs 启动 子 (Kyozuka 等, 1993, Plant Physiology 102 : 991-1000), 小球藻病毒 (chlorella virus) 腺嘌呤甲基转移酶 (adenine methyltransferase) 基因启动子 (Mitra 和 Higgins, 1994, Plant Molecular Biology 26 : 85-93), 或来自稻的 aldP 基因启动子 (Kagaya 等, 1995, Molecular and General Genetics 248 : 668-674), 或伤口诱导的启动子, 如马铃薯 pin2 启 动子 (Xu 等, 1993, Plant Molecular Biology 22 : 573-588)。 同样地, 所述启动子可通过非 生物的处理诱导, 所述非生物的处理诸如温度、 干旱或盐度变化, 或通过外源施加的激活所 述启动子的物质诱导, 例如乙醇、 雌激素 (oestrogens)、 植物激素 (plant hormones) 如乙 烯、 脱落酸 (abscisic acid) 和赤霉酸 (gibberellic acid), 和重金属。
启动子增强子元件也可以用于实现本发明多肽在植物中的较高表达。例如, 启动 子增强子元件可以是内含子, 其置于启动子和编码本发明多肽的核苷酸序列之间。例如 Xu 等, 1993, 见上, 公开了使用稻肌动蛋白 1 基因的第一内含子以增强表达。
选择性标记基因和表达构建体的任何其它部分可以选自本领域内可用的那些。
将核酸构建体根据本领域已知的常规技术并入植物基因组, 所述常规技术包括土 壤杆菌属 (Agrobacterium) 介导的转化、 病毒介导的转化、 显微注射 (microinjection)、 粒子轰击、 生物射弹转化和电穿孔 (Gasser 等, 1990, Science 244 : 1293 ; Potrykus, 1990, Bio/Technology 8 : 535 ; Shimamoto 等, 1989, Nature 338 : 274)。
目 前, 根 癌 土 壤 杆 菌 (Agrobacterium tumefaciens) 介 导 的 基 因 转 移 (gene transfer), 是产生转基因双子叶植物的优选方法 ( 为了参考, 见 Hooykas 和 Schilperoort, 1992, Plant Molecular Biology 19 : 15-38), 而且它也可以用于转化单子叶植物, 虽然对 于这些植物常常使用其它的转化方法。 目前, 产生转基因单子叶植物的优选的方法, 是用粒 子 ( 用转化 DNA 涂覆的微观的金或钨粒子 ) 轰击胚愈伤组织 (embryonic calli) 或发育 中的胚 (developing embryos)(Christou, 1992, Plant Journal 2 : 275-281 ; Shimamoto, 1994, Current Opinion Biotechnology 5 : 158-162 ; Vasil 等, 1992, Bio/Technology 10 : 667-674)。转化单子叶植物的可供选择的方法是基于原生质体转化, 如由 Omirulleh 等, 1993, Plant Molecular Biology 21 : 415-428 所描述的。
转化之后, 根据本领域熟知的方法选择并入了表达构建体的转化体并且再生成为 完整植株。 通常设计转化方法用于通过如下方法在再生期间或在后续世代中选择性消除选 择基因 : 例如, 使用带有两种独立的 T-DNA 构建体的共转化或通过特异性重组酶位点特异 性地切除选择基因。
本发明还涉及产生本发明多肽的方法, 其包括 : (a) 在有益于产生多肽的条件下 培养包含多核苷酸的转基因植物或植物细胞, 所述多核苷酸编码本发明具有阿魏酸酯酶活性的多肽 ; 和 (b) 回收所述多肽。
组合物
本发明还涉及包含本发明的多肽的组合物。
所述组合物可以包含本发明的多肽作为主要酶成分, 例如, 单成分组合物。或者, 所述组合物可以包含多种酶活性, 例如乙酰木聚糖酯酶、 氨肽酶、 淀粉酶、 阿拉伯呋喃糖苷 酶、 糖酶、 羧肽酶、 过氧化氢酶、 纤维素酶、 几丁质酶、 角质酶、 环糊精糖基转移酶、 脱氧核糖 核酸酶、 酯酶、 葡糖醛酸糖苷酶、 α- 半乳糖苷酶、 β- 半乳糖苷酶、 葡糖淀粉酶、 α- 葡糖苷 酶、 β- 葡糖苷酶、 β- 葡聚糖酶、 卤素过氧化物酶、 转化酶、 漆酶、 脂肪酶、 甘露糖苷酶、 氧化 酶、 果胶分解酶、 肽谷氨酰胺酶 (peptidoglutaminase)、 过氧化物酶、 肌醇六磷酸酶、 多酚氧 化酶、 蛋白水解酶、 鼠李半乳糖醛酸酶 (rhamnogalacturonase)、 转谷氨酰胺酶或木聚糖酶。
合适地选择在本发明的组合物中使用的酶, 使得其对底物具有协同活性。 优选地, 所述底物是或来源于植物, 例如小麦 ( 如麦麸 )、 甜菜 ( 如糖甜菜 ) 或玉米 ( 如玉米穗轴 )。
可以依照本领域内已知的方法制备多肽组合物, 并且可以是液体或干组合物的形 式。例如, 所述多肽组合物可以是颗粒 (granulate) 或微粒 (microgranulate) 的形式。可 以依照本领域内已知方法将包括于所述组合物中的多肽稳定化。
下面给出的是本发明多肽组合物的优选的用途的实例。 本发明的多肽组合物的剂 量和使用该组合物的其他条件可以基于本领域内已知的方法确定。
用途
本发明还涉及使用具有阿魏酸酯酶活性的多肽, 或其组合物的方法
本发明具有阿魏酸酯酶活性的多肽可用于数种应用以降解或转化来源于植物的 底物, 例如, 生物质底物, 如包含阿魏酰基取代的木聚糖的生物质底物, 即, 包含具有阿魏酰 侧基的木聚糖的底物, 如包含半纤维素的底物。
在一个优选的方面, 本发明还涉及使用具有阿魏酸酯酶活性的多肽处理包含经阿 魏酰基取代的木聚糖的材料。 所述材料可为任何包含纤维素生物质或木素纤维素生物质的 材料。在另一优选的方面, 用木聚糖降解酶进一步处理包含经阿魏酰基取代的木聚糖的材 料。 所述木聚糖降解酶可选自下组 : 木聚糖酶、 阿拉伯呋喃糖苷酶、 木糖苷酶、 葡糖醛酸糖苷 酶及其组合。
具有阿魏酸酯酶的多肽在多种应用中是有用的 : 修饰含阿魏酰基的动物饲料以改 进可消化性 (digestability) ; 在生物质降解或转化为可发酵的糖在产生例如下述物质中 的一般应用 : 燃料和 / 或饮用乙醇 ; 用于纸浆或纸脱木质化 (delignification) 的操作助 剂 (processing aid) ; 用于纺织品的酶法煮炼系统 (enzymatic scouring system) 的组分 ; 饲料应用 ( 例如, 供单胃动物 (monogastric animal) 的饲料 ) ; 食物应用 ( 例如, 烘烤, 与其 他酶功能组合促进焙烤食物的物理性质 ) ; 以及与其他酶功能组合用于洗衣洗涤剂应用。
确定阿魏酸酯酶活性
阿魏酸酯酶 (FAE) 活性以 IU( 国际单位 ) 测定, 其定义为每分钟从阿魏酸对硝 基苯酯 (pNP- 阿魏酸酯 ) 释放的 pNP 的微摩尔量。使用 96- 孔微孔板分光光度读数器 (spectrophotometric 96-well microplate reader), pNP 的量相对于在相同条件下 pNP 标 样运行来定量。
材料pNP- 阿魏酸酯
二甲亚砜 (DMSO)(Sigma 154938)
50mM 乙酸钠缓冲液, pH 5.0
1.0M Tris-HCl 缓冲液, pH 8.0
对硝基苯酚
稀释酶试剂以得到< 15 %的 pNP- 阿魏酸酯到 pNP 的转化率。起始的稀释物在 1.5mL 微离心管中制备, 使用 50mM 乙酸钠缓冲液, pH 5.0。 然后将试样稀释物转移至 96- 孔 板上, 并使用 50mM 乙酸钠缓冲液, pH 5.0 作为稀释剂制备两倍系列稀释物。
从原始的 10mM 储液 ( 在 50mM 乙酸钠缓冲液, pH5.0 中 ) 稀释于乙酸钠缓冲液, pH5.0 中制备下述浓度的 pNP 标样 : 0.25、 0.2、 0.1、 0.05、 0.02mM。使用的稀释剂是乙酸钠 缓冲液, pH5.0。
底物储液由 0.1M 完全溶解于 DMSO 中的 pNP- 阿魏酸酯组成。储液可冷却储藏两 周。在使用前, 将储液在 50mM 乙酸钠缓冲液, pH5.0 中稀释 100x 以制备 1mM pNP- 阿魏酸 酯。所述 1mM pNP- 阿魏酸酯 ( 在乙酸钠缓冲液中 ) 是浑浊 (cloudy) 且为淡黄色的。
pNP 标样 : 100μL pNP 标样 +100μL 乙酸钠缓冲液 (50mM, pH5.0)。
试剂对照 : 200μL 乙酸钠缓冲液 (50mM, pH5.0)。 底物对照 : 100μL 底 物 (1mM pNP- 阿 魏 酸 酯 )+100μL 乙 酸 钠 缓 冲 液 (50mM,pH5.0)。 试样对照 : 100μL 酶试样 +100μL 乙酸钠缓冲液 (50mM, pH5.0)
试样 : 100μL 底物 (1mM pNP- 阿魏酸酯 )+100μL 酶试样。
所述测定法在室温下 (25℃ ) 进行。在时间 0 点向酶试样添加 1mM pNP- 阿魏酸 酯。在 30 分钟的时点向每个孔添加 50μL Tris-HCl 缓冲液 (1M, pH8.0), 混合并立即在 405nm(A405) 和 540nm(A540) 读取吸光度。释放的产生的 pNP 在 A405 测定, 而背景浑浊度 (cloudiness) 在 A540 测定。
对每个对照或试样将 A540( 浑浊度 ) 从 A450 中减去。将由试剂对照 (RC) 获得的 平均吸光度值从每个由底物对照 (SC) 和样品对照 (EC) 获得的吸光度值中减去, 以获得校 正的底物对照 (SC 校正 ) 和校正的试样对照 (EC 校正 )。然后, 将 SC 校正、 EC 校正和 RC 从试样吸光 度中减去以获得校正的试样值 (S 校正 )。
SC 校正= SC 原始 -RC
EC 校正= EC 原始 -RC
S 校正= S 原始 -RC-SC 校正 -EC 校正
基于校正的试样吸光度值 S 校正, 使用由 pNP 标准曲线获得的线性方程确定释放的 pNP。
使用的单位为 IU( 国际单位 ), 定义为每分钟释放的 pNP 微摩尔数, 除以反应混合 物中酶的浓度 ( 以 mg/mL 表示 ), 得到 IU/mg 酶 :
mmolpNP/L 反应混合物= micromolpNP/mL 反应混合物
IU/mg = (micromolpNP/mL 反应混合物 /10min)/(mg 酶 /mL 反应混合物 )
实施例 实施例 1
通过使用 4- 硝基苯基 2-O-(E)- 阿魏酰 -α-L- 阿拉伯呋喃糖苷或 4- 硝基苯基 5-(O)-(E)- 阿魏酰 -α-L- 阿拉伯呋喃糖苷研究示于 SEQ ID NO : 2 的桔灰青霉阿魏酸酯酶 的特异性 ; 两个合成底物, 其分别具有连接于甲基 α- 阿拉伯呋喃糖苷 2- 位和 5- 位的阿魏 酸残基。所述底物根据 Mastihubova 等, Tetrahedron Lett.44(2003), 1671-1673 制备。
通 过 使用 检测游离 阿魏酸 的释放的 TLC 来 测 定阿 魏酸酯 酶 的活性。 条 件 为 pH5.5(50mM 乙酸盐缓冲液 ), 底物浓度 10mg/mL。温度为 30℃, 而酶剂量为 0.1mg EP/mL。 在 1、 4 和 48 小时后取样, 并施于 TLC 板上。 TLC 洗脱液 : EtOAc+1 滴 AcOH, 显色剂 : 1M H2SO4, 然后加热。
在 pH5.5, 所述阿魏酸酯酶对 5- 位和 2 位均显示良好的活性, 但对 5- 取代底物的 反应更快。
实施例 2
示于 SEQ ID NO : 2 的桔灰青霉阿魏酸酯酶的比活性通过使用 pNP- 乙酸酯和 pNP 丁酸酯来研究。
为了测定底物特异性, 单位为在 pH6.0, 温度 37℃, 底物为 1mM 的条件下, 每分钟释 放的 pNP 微摩尔数。
将 20μL 适 当 稀 释 于 0.01 % Triton X-100 中 的 酶 分 配 到 微 滴 定 板 ( 例 如, NUNC269620) 的孔中。对每个底物制备 100mM 底物的储液。将 100mM pNP- 乙酸酯 (Sigma N8130) 溶解于 DMSO, 并将 100mM pNP 丁酸酯 (Sigma N9876) 用异丙醇稀释。就在分析之 前, 将储液在测定缓冲液 (50mM 磷酸、 50mM 乙酸和 50mM 硼酸, 50mM KCl, 1mM CaCl2、 0.01% Triton X-100, 用 NaOH 调整为 pH 6.0) 中稀释至 1mM。将 120μL 1mM 底物添加至微滴定板 中的酶。将板密封, 并在 37℃以 750rpm 振荡温育 15 分钟。在温育时间后, 添加 100μL 终 止试剂 (stop reagent)( 终止试剂是 2.0M Tris pH8.0 于水中 ) 并立即在微滴定板分光光 度计中 (microtiter plate spectrophotometer) 测定 405nm 的吸光度。
发现所述酶和其他乙酰木聚糖酯酶类似地从 pNP- 乙酸酯释放 pNP。还发现所述 酶与从 pNP- 乙酸酯释放 pNp 相比以大约两倍的速率从 pNP- 丁酸酯释放 pNP。这些结果显 示, 该酶可适应 (accommodate) 底物识别位点中的乙酰基以及丁酸 (butyrate) 和阿魏酸 (ferulate)。
28102066409 A CN 102066419
序列表1/3 页
29102066409 A CN 102066419序列表2/3 页
30102066409 A CN 102066419序列表3/3 页31