《阿拉伯糖呋喃糖苷酶.pdf》由会员分享,可在线阅读,更多相关《阿拉伯糖呋喃糖苷酶.pdf(37页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103789284 A (43)申请公布日 2014.05.14 CN 103789284 A (21)申请号 201410083212.0 (22)申请日 2006.04.25 PA200500609 2005.04.26 DK PA200501562 2005.11.10 DK 200680014246.8 2006.04.25 C12N 9/24(2006.01) C12N 15/56(2006.01) A21D 8/04(2006.01) C12P 7/10(2006.01) A23K 1/165(2006.01) A23L 1/03(2006.01) (71。
2、)申请人 诺维信公司 地址 丹麦鲍斯韦 (72)发明人 汉尼 .R. 索伦森 克里斯特尔 .T. 乔尔根森 拉斯 .H. 克里斯坦森 克里斯琴 .I. 乔尔根森 卡斯滕 .H. 汉森 莱尼 .V. 科福德 (74)专利代理机构 北京市柳沈律师事务所 11105 代理人 史悦 (54) 发明名称 阿拉伯糖呋喃糖苷酶 (57) 摘要 本发明涉及阿拉伯糖呋喃糖苷酶, 具体地涉 及具有 -L- 阿拉伯糖呋喃糖苷酶活性的分离多 肽和编码该多肽的分离核酸序列。本发明也涉及 含所述核酸序列的核酸构建体、 载体和宿主细胞, 以及产生和使用该多肽的方法。 (30)优先权数据 (62)分案原申请数据 (51)In。
3、t.Cl. 权利要求书 2 页 说明书 23 页 序列表 9 页 附图 2 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书23页 序列表9页 附图2页 (10)申请公布号 CN 103789284 A CN 103789284 A 1/2 页 2 1. 一种阿拉伯糖呋喃糖苷酶, 其为 : a)具有SEQ ID NO:4所示成熟肽氨基酸序列的多肽, 或者能够从其通过取代、 缺失和/ 或插入一个或多个氨基酸而获得的多肽 ; b)(i) 或 (ii) 中定义的多肽类似物, 其 i) 与所述多肽有至少 80% 同源性, ii) 为所述多肽的等位基因变体, 或 c。
4、) 由核酸序列编码的多肽, 所述核酸序列与编码成熟多肽的 SEQ ID NO:3 的核酸序列 的互补链或其至少 100 个核苷酸的亚序列在高严紧条件下杂交。 2. 权利要求 1 的阿拉伯糖呋喃糖苷酶, 其为 : a)具有SEQ ID NO:4所示成熟肽氨基酸序列的多肽, 或者能够从其通过取代、 缺失和/ 或插入一个、 两个、 三个、 四个或五个氨基酸而获得的多肽 ; b) 与 SEQ ID NO:4 的氨基酸 1-643 所示氨基酸序列有至少 85%, 至少 90%, 至少 95%, 至 少 96%, 至少 97%, 至少 98%, 或至少 99% 同一性的多肽, 或 c) 由核酸序列编码的多。
5、肽, 所述核酸序列与编码成熟多肽的 SEQ ID NO:3 的核酸序列 的互补链在高严紧条件下杂交。 3.权利要求1或2所述的阿拉伯糖呋喃糖苷酶, 其对于多孔菌属菌株, 优选巨多孔菌是 天然的。 4. 核酸序列, 其包含编码权利要求 1-3 任一项所述的阿拉伯糖呋喃糖苷酶的核酸序 列。 5. 核酸序列, 其与 SEQ ID NO:3 所示 DNA 序列具有至少 80% 同源性, 或者 a) 与所述 DNA 序列的互补链或其具有至少 100 个核苷酸的亚序列在高严紧条件下杂 交, b) 为其等位基因变体, 或 c)a) 或 b) 的互补链。 6. 权利要求 5 的核酸序列, 其与 SEQ ID 。
6、NO:3 的核苷酸 46-1974 所示核酸序列有至少 85%, 至少 90%, 至少 95%, 至少 96%, 至少 97%, 至少 98%, 或至少 99% 同一性。 7. 权利要求 4-6 任一项所述的核酸序列, 其中多肽为含下列氨基酸序列的人工变体, 所述氨基酸序列相对 SEQ ID NO:4 的氨基酸 1-643, 有一处或多处截短, 和 / 或氨基酸的至 少一个取代、 缺失和 / 或插入。 8. 一种核酸构建体, 其包含权利要求 4-7 任一的核酸序列, 所述核酸序列与在合适表 达宿主中能指导阿拉伯糖呋喃糖苷酶表达的一种或多种调控序列可操作地连接。 9. 包含权利要求 8 的核酸构。
7、建体的重组表达载体。 10. 包含权利要求 9 的表达载体的重组宿主细胞。 11. 产生阿拉伯糖呋喃糖苷酶的方法, 其包括在利于产生阿拉伯糖呋喃糖苷酶的条件 下培养权利要求 10 的宿主细胞, 和回收阿拉伯糖呋喃糖苷酶。 12. 包含根据权利要求 1-3 中任一项的阿拉伯糖呋喃糖苷酶的组合物。 13. 根据权利要求 1-3 中任一项的阿拉伯糖呋喃糖苷酶在生面团中的用途。 14. 根据权利要求 1-3 中任一项的阿拉伯糖呋喃糖苷酶在乙醇工艺中的用途。 15. 根据权利要求 1-3 中任一项的阿拉伯糖呋喃糖苷酶在糖化工艺中的用途。 权 利 要 求 书 CN 103789284 A 2 2/2 页 。
8、3 16. 根据权利要求 1-3 中任一项的阿拉伯糖呋喃糖苷酶在生产饲料产品的工艺中的用 途。 权 利 要 求 书 CN 103789284 A 3 1/23 页 4 阿拉伯糖呋喃糖苷酶 0001 本申请是申请日为 2006 年 04 月 25 日, 申请号为 “200680014246.8” ( 国际申请号 为 PCT/DK2006/000213), 名称为 “阿拉伯糖呋喃糖苷酶” 的发明专利申请的分案申请。 技术领域 0002 本发明涉及具有 -L- 阿拉伯糖呋喃糖苷酶活性的分离多肽和编码该多肽的分 离核酸序列。本发明也涉及含该核酸序列的核酸构建体、 载体、 宿主细胞, 以及产生和使用 该。
9、多肽的方法。 背景技术 0003 阿拉伯糖呋喃糖苷酶能水解 -L- 阿拉伯糖苷中的末端非还原性 -L- 阿拉 伯糖呋喃糖苷残基, 并分类为 EC3.2.1.55。已从多种生物体, 包括丝状真菌中分离了阿 拉伯糖呋喃糖苷酶。然而, 已知几乎没有 - 阿拉伯糖呋喃糖苷酶能从双取代木糖中 释放阿拉伯糖。已经描述了一种来自青春双歧杆菌 (Bifidobacterium adolescentis) 的胞内酶能从双取代木糖的 C3( 也就是内部 ) 释放阿拉伯糖 (Van Laere,1997,Appl. Microbiol.Biotechnol,47,231-235 和 Van den Broek,20。
10、05,Applied Microbiology and Biotechnology)。已从大麦分离了对单取代和末端双取代木糖有活性的酶, 但其对内部双 取代木糖几乎没有活性 (Ferre,2000,Eur.J.Biochem.,267,6633-6641)。来自里氏木霉 (Trichoderma reesei)的酶可能对末端双取代残基有活性(观察到对3,5-二-O-L-阿 拉伯糖呋喃糖基 -L- 阿拉伯糖呋喃糖苷 (3,5-di-O-alpha-Larabinofuranosyl-alpha -L-arabinofuranoside) 的活性 ), 但其对具有内部 C3 取代阿拉伯糖的寡底物却。
11、没有活性 (Nogawa,1999,Appl.Environ.Microbiol.,65,3964-3968)。 0004 与全长现有技术序列比较显示, SEQ ID NO:2 所示成熟氨基酸序列与球毛壳菌 (Chaetomium globosum) 氨基酸序列有 72% 同源性, 其相应 SEQ ID NO:1DNA 序列与相应球 毛壳菌 DNA 序列有 73% 同源性。SEQ ID NO:2 所示序列与双歧杆菌属 (Bifidobacterium sp.) 的细菌 GH43-L- 阿拉伯糖呋喃糖苷酶之间的同源性是 25%。SEQ ID NO:4 所示成熟 氨基酸序列与黑曲霉 (Asperg。
12、illus niger) 阿拉伯糖呋喃糖苷酶有 38% 同源性。 发明内容 0005 本发明的发明人分离了来自丝状真菌特异腐质霉 (Humicola insolens)(SEQ ID NO:2)和巨多孔菌(Meripilus giganteus)(SEQ ID NO:4)菌株的-L-阿拉伯糖呋喃糖苷 酶。 本发明的发明人也分离了编码新-L-阿拉伯糖呋喃糖苷酶的基因。 该酶是细胞外的。 来自特异腐质霉的 -L- 阿拉伯糖呋喃糖苷酶属于 GH43 家族, 来自巨多孔菌的 -L- 阿拉 伯糖呋喃糖苷酶属于 GH51 家族。 0006 来自特异腐质霉的 -L- 阿拉伯糖呋喃糖苷酶能从双取代木糖释放阿拉。
13、伯糖, 即 该 -L- 阿拉伯糖呋喃糖苷酶对具有连接至 C2 和 C3 的阿拉伯糖的小麦阿拉伯糖木聚糖 (arabinoxylan)的木糖单元有活性。 对双取代木糖的活性在将阿拉伯糖木聚糖完全水解为 说 明 书 CN 103789284 A 4 2/23 页 5 单糖时, 例如从生物质 (biomass) 产生乙醇中是必要的。 0007 因此, 在第一方面, 本发明提供了源自真菌的阿拉伯糖呋喃糖苷酶, 优选腐质霉属 (Humicola) 内的菌种, 所述阿拉伯糖呋喃糖苷酶能从双取代木糖释放阿拉伯糖。 0008 因此, 在第二方面, 本发明提供了阿拉伯糖呋喃糖苷酶, 其为 : a)具有SEQ I。
14、D NO:2 所示成熟肽氨基酸序列的多肽, 或者可从其通过一个或多个氨基酸的取代、 缺失和 / 或插 入而获得的多肽 ; b) 下述 i) 或 ii) 所定义的多肽的类似物, 其 : i) 与所述多肽有至少 80% 同源性, ii) 为所述多肽的等位基因变体 (allelic variant), c) 由核酸序列编码的多肽, 所述核酸序列在高严紧条件下与编码成熟多肽的SEQ ID NO:1核酸序列互补链或其具有至 少 100 个核苷酸的亚序列杂交。 0009 因此, 在第三方面, 本发明提供了阿拉伯糖呋喃糖苷酶, 其为 : a)具有SEQ ID NO:4 所示成熟肽氨基酸序列的多肽, 或可从其。
15、通过一个或多个氨基酸的取代、 缺失和 / 或插入 而获得的多肽 ; b) 下述 i) 或 ii) 所定义的多肽的类似物, 其 : i) 与所述多肽有至少 60% 同 源性, ii) 为所述多肽的等位基因变体, c) 由核酸序列编码的多肽, 所述核酸序列在高严紧 条件下与编码成熟多肽的SEQ ID NO:3核酸序列互补链或其具有至少100个核苷酸的亚序 列杂交。 0010 在第四方面, 本发明提供了核酸序列, 其包含编码第一或第二方面的阿拉伯糖呋 喃糖苷酶的核酸序列。 0011 在第五方面, 本发明提供了核酸序列, 其包括 : a)DNA 序列, 其编码 SEQ ID NO:2 和 SEQ ID。
16、 NO:4 所示任一阿拉伯糖呋喃糖苷酶, b)DNA 序列类似物, 其 : i) 与所述任一 DNA 序 列有至少 80% 同源性, 或 ii) 与所述任一 DNA 序列互补链或其具有至少 100 个核苷酸的亚 序列在高严紧条件下杂交, 或 iii) 为其等位基因变体, 或者 c)a) 或 b) 的互补链。 0012 在第六方面, 本发明提供了核酸序列, 其与SEQ ID NO:1和SEQ ID NO:3所示任一 DNA 序列有至少 80% 同源性, 或者 a) 与所述任一 DNA 序列互补链或其具有至少 100 个核苷 酸的亚序列在高严紧条件下杂交的核酸序列, b) 为其等位基因变体的核酸序。
17、列, 或 c)a) 或 b) 互补链。 0013 在第七方面, 本发明提供了核酸构建体, 其包含与一个或多个调控序列可操作连 接的第二、 第三、 第四方面的核酸序列, 所述调控序列能指导阿拉伯糖呋喃糖苷酶在合适表 达宿主中表达。 0014 在第八方面, 本发明提供了重组表达载体, 其包含第七方面所述核酸构建体。 0015 在第九方面, 本发明提供了重组宿主细胞, 其包含第七方面所述核酸构建体。 0016 在第十方面, 本发明提供了产生阿拉伯糖呋喃糖苷酶的方法, 其包括在有利于产 生阿拉伯糖呋喃糖苷酶的条件下培养第九方面的宿主细胞, 和回收阿拉伯糖呋喃糖苷酶。 0017 在第十一方面, 本发明提。
18、供了包含第一、 第二方面的阿拉伯糖呋喃糖苷酶的组合 物。 0018 在其它方面, 本发明提供了第一、 第二方面的阿拉伯糖呋喃糖苷酶的用途。 0019 本发明具体涉及如下各项 : 0020 1. 一种能从双取代木聚糖释放阿拉伯糖的阿拉伯糖呋喃糖苷酶, 所述阿拉伯糖呋 喃糖苷酶源自真菌。 0021 2. 一种阿拉伯糖呋喃糖苷酶, 其为 : 说 明 书 CN 103789284 A 5 3/23 页 6 0022 a)具有SEQ ID NO:2所示成熟肽氨基酸序列的多肽, 或者能够从其通过取代、 缺失 和 / 或插入一个或多个氨基酸而获得的多肽 ; 0023 b)(i) 或 (ii) 中定义的多肽类。
19、似物, 其 0024 i) 与所述多肽有至少 80% 同源性, 0025 ii) 为所述多肽的等位基因变体, 0026 c) 由核酸序列编码的多肽, 所述核酸序列与编码成熟多肽的 SEQ ID NO:2 的核酸 序列互补链或其至少 100 个核苷酸的亚序列在高严紧条件下杂交。 0027 3. 一种阿拉伯糖呋喃糖苷酶, 其为 : 0028 a)具有SEQ ID NO:4所示成熟肽氨基酸序列的多肽, 或者能够从其通过取代、 缺失 和 / 或插入一个或多个氨基酸而获得的多肽 ; 0029 b)(i) 或 (ii) 中定义的多肽类似物, 其 0030 i) 与所述多肽有至少 60% 同源性, 0031。
20、 ii) 为所述多肽的等位基因变体, 0032 c) 由核酸序列编码的多肽, 所述核酸序列与编码成熟多肽的 SEQ ID NO:2 的核酸 序列的互补链或其至少 100 个核苷酸的亚序列在高严紧条件下杂交。 0033 4. 项 1-3 中任一项所述的阿拉伯糖呋喃糖苷酶, 其对于腐质霉属菌株, 优选特异 腐质霉, 或者多孔菌属菌株, 优选巨多孔菌是天然的。 0034 5. 核酸序列, 其包含编码项 1-4 任一项所述的阿拉伯糖呋喃糖苷酶的核酸序列。 0035 6. 核酸序列, 其包括 : 0036 a)DNA 序列, 其编码 SEQ ID NO:2 和 SEQ ID NO:4 所示任一阿拉伯糖呋。
21、喃糖苷酶, 0037 b)DNA 序列类似物, 其 0038 i) 与任一所述 DNA 序列具有至少 80% 同源性, 或 0039 ii) 与所述 DNA 序列互补链或其具有至少 100 个核苷酸的亚序列在高严紧条件下 杂交 ; 0040 iii) 为其等位基因变体, 或 0041 c)a) 或 b) 的互补链。 0042 7. 项 6 所述的核酸序列, 其中多肽为含下列氨基酸序列的人工变体, 所述氨基酸 序列相对SEQ ID NO:2的氨基酸1-558, 有一处或多处截短, 和/或氨基酸的至少一个取代、 缺失和 / 或插入。 0043 8. 核酸序列, 其与 SEQ ID NO:1 和 S。
22、EQ ID NO:3 任一所示 DNA 序列具有至少 80% 同源性, 或者 0044 a)与任一所述DNA序列的互补链或其具有至少100个核苷酸的亚序列在高严紧条 件下杂交, 0045 b) 为其等位基因变体, 或 0046 c)a) 或 b) 的互补链。 0047 9. 项 8 所述的核酸序列, 其中多肽为含下列氨基酸序列的人工变体, 所述氨基酸 序列相对SEQ ID NO:4的氨基酸1-643, 有一处或多处截短, 和/或氨基酸的至少一个取代、 缺失和 / 或插入。 0048 10. 一种核酸构建体, 其包含项 5-9 任一的核酸序列, 所述核酸序列与在合适表达 说 明 书 CN 103。
23、789284 A 6 4/23 页 7 宿主中能指导阿拉伯糖呋喃糖苷酶表达的一种或多种调控序列可操作地连接。 0049 11. 包含项 10 的核酸构建体的重组表达载体。 0050 12. 包含项 11 的表达载体的重组宿主细胞。 0051 13. 产生阿拉伯糖呋喃糖苷酶的方法, 其包括在利于产生阿拉伯糖呋喃糖苷酶的 条件下培养项 12 的宿主细胞, 和回收阿拉伯糖呋喃糖苷酶。 0052 14. 包含根据项 1-4 中任一项的阿拉伯糖呋喃糖苷酶的组合物。 0053 15. 根据项 1-4 中任一项的阿拉伯糖呋喃糖苷酶在生面团中的用途。 0054 16. 根据项 1-4 中任一项的阿拉伯糖呋喃糖。
24、苷酶在乙醇工艺中的用途。 0055 17. 根据项 1-4 中任一项的阿拉伯糖呋喃糖苷酶在糖化工艺中的用途。 0056 18. 根据项 1-4 中任一项的阿拉伯糖呋喃糖苷酶在生产饲料产品的工艺中的用 途。 0057 附图简述 0058 图 1A-C 显示了阿拉伯糖木聚糖聚合物。 0059 图 1A 显示了完整的阿拉伯糖木聚糖。 0060 图 1B 显示了双取代的阿拉伯糖木聚糖。 0061 图 1C 显示了单取代的阿拉伯糖木聚糖。 0062 图 2A-C 显示了阿拉伯糖木糖寡糖 (arabinoxylo-oligosaccharides)。 0063 图 2A 显示了连接于内部 C-3 上的阿拉。
25、伯糖基。 0064 图 2B 显示了连接于末端 C-3 上的阿拉伯糖基。 0065 图 2C 显示了连接于内部 C-2 上的阿拉伯糖基。 0066 发明详述 0067 在本发明第二方面的具体实施方式中, 分离多肽具有的氨基酸序列与 SEQ ID NO:2的氨基酸1-558所示氨基酸序列有至少80%同一性。 在本发明感兴趣的具体实施方式 中, 多肽与SEQ ID NO:2的氨基酸1-558所示氨基酸序列有至少75%, 至少85%, 至少90%, 至 少 95%, 至少 96%, 至少 97%, 至少 98%, 或至少 99% 同一性。 0068 在本发明第三方面具体实施方式中, 分离多肽具有的氨。
26、基酸序列与 SEQ ID NO:4 的氨基酸 1-643 所示氨基酸序列有至少 50% 同一性。在本发明感兴趣的具体实施方式中, 多肽与 SEQ ID NO:4 的氨基酸 1-643 所示氨基酸序列有至少 60%, 至少 70%, 至少 80%, 至少 85%, 至少 90%, 至少 95%, 至少 96%, 至少 97%, 至少 98%, 或至少 99% 同一性。 0069 在优选具体实施方式中, 分离多肽具有的氨基酸序列与 SEQ ID NO:2 的氨基酸 1-558 和 SEQ ID NO:4 的氨基酸 1-643 所示任一氨基酸序列, 相差五个氨基酸, 例如相差四 个氨基酸, 如相差三。
27、个氨基酸, 相差两个氨基酸, 或相差一个氨基酸。 0070 在本发明第二方面具体实施方式中, 分离多肽是能从双取代的木糖释放阿拉伯糖 的 -L- 阿拉伯糖呋喃糖苷酶, 例如, 所述 -L- 阿拉伯糖呋喃糖苷酶对具有连接于 C2 和 C3 的阿拉伯糖的小麦阿拉伯糖木聚糖的木糖单元有活性。 0071 序列比对和同源性计算可通过本领域已知的计算机程序, 例如 GCG 程序包中所 提供的 GAP 来适当确定 (Program Manual for the Wisconsin Package,Version8,Augu st1994,Genetics Computer Group,575Science 。
28、Drive,Madison,Wisconsin,USA53711) (Needleman,S.B.和Wunsch,C.D.,(1970),Journal of Molecular Biology,48,443-453)。 说 明 书 CN 103789284 A 7 5/23 页 8 氨基酸序列比较采用下列设定 : GAP 产生罚分 (GAP creation penalty)3.0, GAP 延伸罚分 0.1。用于同源性测定的氨基酸序列相关部分为成熟多肽, 即不含信号肽。 0072 优选地, 本发明多肽包含 SEQ ID NO:2 的氨基酸 1-558 和 SEQ ID NO:4 的氨基酸 。
29、1-643 所示的任一氨基酸序列, 其等位基因变体, 或其有阿拉伯糖呋喃糖苷酶活性的片段。 很显然, 本发明多肽也可以由SEQ ID NO:2的氨基酸1-558和SEQ ID NO:4的氨基酸1-643 所示任一氨基酸序列组成。 0073 等位基因变体意味着占据相同染色体基因座的基因的任意两种或多种可选形式。 等位基因变体通过突变天然产生, 并且可导致群体内的多态性。基因突变可以是沉默突变 ( 编码多肽没有改变 ), 也可以编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是 由基因的等位变体所编码的多肽。 0074 在本发明具体实施方式中, 分离多肽由下列核酸序列编码, 所述核酸序列在低 严。
30、紧条件下, 优选在中严紧条件下, 更优选在高严紧条件下与 (i)SEQID NO:1 的核苷酸 1-1677 和 SEQ ID NO:3 的核苷酸 46-1974 所示任一核酸序列的互补链, 或 (ii) 至少 100 个核苷酸的 (i) 的亚序列杂交 (J.Sambrook,E.F.Fritsch 和 T.Maniatus,1989,Molecular Cloning,A Laboratory Manual,2d edition,Cold Spring Harbor,New York)。 0075 SEQ ID NO:1的核苷酸1-1677和SEQ ID NO:3的核苷酸46-1974所示任。
31、一核酸序 列互补链的亚序列, 可为至少 100 个核苷酸或优选至少 200 个核苷酸。此外, 亚序列应该编 码具有阿拉伯糖呋喃糖苷酶活性的多肽片段。 多肽也可以是具有阿拉伯糖呋喃糖苷酶活性 的多肽的等位基因变体或片段。 0076 多肽变体具体包含一个或多个氨基酸的取代、 缺失和 / 或插入。在特定具体实施 方式中, 多肽是具体多肽的热稳定变体。 0077 变体多肽的氨基酸序列可与 SEQ ID NO:2 的氨基酸 1-558 或 SEQ ID NO:4 的氨基 酸 1-643 的具体氨基酸序列, 因插入或缺失一个或多个氨基酸残基和 / 或用不同氨基酸残 基取代一个或多个氨基酸残基而不同。 优选。
32、地, 氨基酸改变是次要特性的改变, 即不显著影 响蛋白折叠和/或活性的保守氨基酸取代 ; 小的缺失, 通常是1至约30个氨基酸 ; 小的氨基 或羧基末端延伸, 例如氨基末端甲硫氨酸残基 ; 多至约 20-25 残基的小接头肽 ; 或者通过改 变净电荷或其它功能有利于纯化的小延伸, 例如聚组氨酸簇 (poly-histidine tract)、 抗 原表位或结合域。 0078 保守取代的实例是下列组内的取代 : 碱性氨基酸组 ( 精氨酸, 赖氨酸和组氨 酸 ), 酸性氨基酸组 ( 谷氨酸和天冬氨酸 ), 极性氨基酸组 ( 谷氨酰氨和天冬酰氨 ), 疏 水性氨基酸组 ( 亮氨酸, 异亮氨酸和缬氨酸。
33、 ), 芳香氨基酸组 ( 苯丙氨酸, 色氨酸和酪氨 酸 ) 以及小氨基酸组 ( 甘氨酸, 丙氨酸, 丝氨酸, 苏氨酸和甲硫氨酸 )。通常不改变特异 活性 (specific activity) 的氨基酸取代是本领域已知的, 并例如由 H.Neurath and R.L.Hill,1979,In,The Proteins,Academic Press,New York 描述。最通常发生的交换是 Ala/Ser,Val/Ile,Asp/Glu,Thr/Ser,Ala/Gly,Ala/Thr,Ser/Asn,Ala/Val,Ser/Gly,Tyr/ Phe,Ala/Pro,Lys/Arg,Asp/A。
34、sn,Leu/Ile,Leu/Val,Ala/Glu 和 Asp/Gly 及它们反过来交 换。 0079 本文所指多肽可以包含指定的氨基酸序列, 或者它们也可以是其等位基因变体 ; 或其具有相关酶活性的片段。在一个具体实施方式中, 多肽包含指定的氨基酸序列或其等 说 明 书 CN 103789284 A 8 6/23 页 9 位基因变体 ; 或其具有相关酶活性的片段。 在另一具体实施方式中, 多肽由指定的氨基酸序 列或其等位基因变体或其具有相关酶活性的片段所组成。 0080 指定的氨基酸序列片段是从该氨基酸序列的氨基和 / 或羧基末端缺失一个或多 个氨基酸的多肽。 在一个具体实施方式中, 所述。
35、片段包含至少60个氨基酸残基,或至少68 个 , 或至少 70 个 , 或至少 75 个 , 或至少 100 个 , 或至少 150 个 , 或至少 160 个 , 或至少 170 个 , 或至少 180 个 , 或至少 190 个 , 或至少 200 个 , 或至少 210 个 , 或至少 220 个 , 或至少 240 个 , 或至少 260 个 , 或至少 280 个 , 或至少 300 个 , 或至少 310 个 , 或至少 320 个 , 或至少 330 个 , 或至少 334 个 , 或至少 350 个 , 或至少 375 个 , 或至少 400 个 , 或至少 425 个 , 或。
36、至少 430 个氨基酸残基。 0081 等位基因变体意味着占据相同染色体基因座的基因的任意两种或多种可选形式。 等位基因变体通过突变自然产生, 并且可导致群体内的多态性。基因突变可以是沉默突变 ( 编码多肽没有改变 ), 也可以编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是 由基因的等位变体所编码的多肽。 0082 成熟多肽或成熟氨基酸序列是指将潜在信号肽部分切去后剩下的那部分氨基酸 序列。类似地, 基因的成熟多肽编码部分是指相应于成熟多肽的那部分基因。 0083 SEQ ID NO:1 和 SEQ ID NO:3 任一的核酸序列或其亚序列, 以及 SEQ ID NO:2 和 SEQ I。
37、D NO:4 任一的氨基酸序列或其片段, 可用于按照本领域已知方法设计核酸探针, 以从 不同属或种的菌株鉴定和克隆DNA, 所述DNA编码具有阿拉伯糖呋喃糖苷酶活性的多肽。 特 别地, 这些探针能够用于根据标准 Southern 印迹方法与感兴趣的属或种的基因组或 cDNA 杂交, 以鉴定和分离其中的相应基因。 这些探针可比全长序列短许多, 但其长度应当是至少 15, 优选至少 25, 更优选至少 35 个核苷酸。也可以使用较长探针。DNA 和 RNA 探针均可使 用。通常将探针标记以检测相应基因 ( 例如 32P,3H,35S, 生物素 , 或抗生物素蛋白 )。这 些探针包括在本发明中。 0。
38、084 因此, 从其它类似生物体制备的基因组 DNA 或 cDNA 文库, 可用于筛选与上述探针 杂交并且编码具有阿拉伯糖呋喃糖苷酶活性的多肽的 DNA。这些其它生物体的基因组或其 它 DNA, 可以通过琼脂糖或聚丙烯酰氨凝胶电泳分离, 或通过本领域技术人员已知的其它分 离技术分离。可将来自文库的 DNA 或分离 DNA 转移到并固定至硝化纤维素或其它合适载体 材料上。 为了鉴定与SEQ ID NO:1或SEQ ID NO:3或其亚序列同源的克隆或DNA, 将载体材 料用于Southern印迹。 就本发明而言, 杂交显示核酸序列与SEQ ID NO:1和SEQ ID NO:3、 其互补链或其亚。
39、序列任一所示核酸序列相应的标记核酸探针在低至高严紧条件下杂交。 在 这些条件下与核酸探针杂交的分子用 X- 射线片来检测。 0085 在另一感兴趣具体实施方式中, 核酸探针是编码 SEQ ID NO:2 和 SEQ ID NO:4 任 一的 ( 成熟 ) 多肽, 或其亚序列的核酸序列。在第三感兴趣的具体实施方式中, 核酸探针是 SEQ ID NO:1和SEQ ID NO:3中的任意一个。 在第四感兴趣的具体实施方式中, 核酸探针是 SEQ ID NO:1 和 SEQ ID NO:3 成熟多肽编码区中的任意一个。 0086 对于长度至少 100 个核苷酸的长探针, 将低严紧性条件至高严紧性条件定。
40、义为, 在 42, 在 5SSPE、 0.3%SDS、 200g/ml 已剪切和变性的鲑精 DNA, 对于低严紧性 25% 甲酰 胺, 对于中严紧性 35% 甲酰胺, 或对于高严紧性 50% 甲酰胺中, 根据标准的 Southern 印迹方 法进行预杂交和杂交。 说 明 书 CN 103789284 A 9 7/23 页 10 0087 对于长度至少 100 个核苷酸的长探针, 将载体材料最终用 2SSC, 0.2%SDS, 优选 至少在 50 ( 低严紧性 ), 更优选至少在 55 ( 中严紧性 ), 甚至更优选至少在 65 ( 高严 紧性 ) 洗涤三次, 每次 15 分钟。 0088 对于。
41、长度大约 15 个核苷酸至大约 70 个核苷酸的短探针, 将严紧性条件定义为 在比用 Bolton 和 McCarthy 的计算法 (1962, Proceedings of the National Academy of Sciences USA48:1390)计算得出的Tm低5至10, 在0.9MNaCl, 0.09M Tris-HCl pH7.6, 6mM EDTA, 0.5%NP-40, 1 登哈特溶液 (Denhardts solution), 1mM 焦磷酸钠 (sodium pyrophosphate), 1mM磷酸二氢钠(sodium monobasic phosphate),。
42、 0.1mM ATP和每ml0.2mg 的酵母 RNA 中, 根据标准的 Southern 印迹方法进行预杂交、 杂交和杂交后洗涤 (washing post-hybridization)。 0089 对于长度大约 15 个核苷酸至大约 70 个核苷酸的短探针, 将载体材料在 6SSC 加 0.1%SDS 中洗涤一次 15 分钟, 并用 6SSC 在低于计算的 Tm5至 10洗涤两次, 每次 15 分 钟。 0090 如上所述, 本发明多肽可以是具有 SEQ ID NO:2 和 SEQ ID NO:4 任一氨基酸序列 的多肽, 或其成熟多肽, 其中一个或多个氨基酸被另一 ( 其它 ) 氨基酸所。
43、取代, 其中一个或 多个氨基酸缺失, 和 / 或其中一个或多个氨基酸插入。 0091 优选地, 氨基酸改变是次要特性的改变, 即不显著影响蛋白折叠和 / 或活性的保 守氨基酸取代 ; 小的缺失, 通常为 1 至约 30 个氨基酸 ; 小的氨基或羧基末端延伸, 例如氨基 末端甲硫氨酸残基 ; 多至约 20-25 残基的小接头肽 ; 或者通过改变净电荷或其它功能而有 利于纯化的小延伸, 例如聚组氨酸簇、 抗原表位或结合域。 0092 保守取代的实例是下列组内的取代 : 碱性氨基酸组 ( 精氨酸, 赖氨酸和组氨酸 ), 酸性氨基酸组 ( 谷氨酸和天冬氨酸 ), 极性氨基酸组 ( 谷氨酰氨和天冬酰氨 。
44、), 疏水性氨基 酸组(亮氨酸, 异亮氨酸和缬氨酸), 芳香氨基酸组(苯丙氨酸, 色氨酸和酪氨酸)以及小氨 基酸组 ( 甘氨酸, 丙氨酸, 丝氨酸, 苏氨酸和甲硫氨酸 )。通常不改变特异活性的氨基酸取 代是本领域已知的, 并例如由 H.Neurath and R.L.Hill,1979,In,The Proteins,Academic Press,New York 描述。最通常发生的交换是 Ala/Ser,Val/Ile,Asp/Glu,Thr/Ser,Ala/ Gly,Ala/Thr,Ser/Asn,Ala/Val,Ser/Gly,Tyr/Phe,Ala/Pro,Lys/Arg,Asp/As。
45、n,Leu/ Ile,Leu/Val,Ala/Glu 和 Asp/Gly 及它们反过来交换。 0093 通常而言, 优选本发明多肽具有的阿拉伯糖呋喃糖苷酶活性是具有 SEQ ID NO:2 的氨基酸1-558和SEQ ID NO:4的氨基酸1-643任一所示氨基酸序列的多肽的至少20%。 特 别优选的多肽具有的阿拉伯糖呋喃糖苷酶活性是具有 SEQ ID NO:2 的氨基酸 1-558 和 SEQ ID NO:4 的氨基酸 1-643 所示任一氨基酸序列的多肽的至少 30%, 例如至少 40%, 例如至少 50%, 优选至少 60%, 如至少 70%, 例如至少 80%, 更优选至少 90%, 。
46、或至少 95%。 0094 本发明多肽可从任何属的微生物得到。就本发明而言, 本文所用术语 “从中得 到” 连同给出的来源, 可指由核酸序列编码的多肽通过所述来源或通过细胞产生, 其中所述 细胞已经插入来自所述来源的核酸序列。在优选的实施方案中, 多肽是分泌到细胞外的。 0095 本发明多肽可为真菌多肽, 更优选丝状真菌多肽, 例如枝顶孢霉属 (Acremonium)、 曲 霉 属 (Aspergillus)、短 梗 霉 属 (Aureobasidium)、隐 球 菌 属 (Cryptococcus)、 丝 梗 霉 属 (Filibasidium)、镰 孢 属 (Fusarium)、腐 质 霉。
47、 属 (Humicola)、梨 孢 菌 属 说 明 书 CN 103789284 A 10 8/23 页 11 (Magnaporthe)、 多孔菌属 (Meripilus)、 毛霉属 (Mucor)、 毁丝霉属 (Myceliophthora)、 新考玛脂霉属 (Neocallimastix)、 脉孢菌属 (Neurospora)、 拟青霉属 (Paecilomyces)、 青霉属 (Penicillium)、 瘤胃壶菌属 (Piromyces)、 裂殖菌属 (Schizophyllum)、 踝节菌 属 (Talaromyces)、 嗜 热 子 囊 菌 属 (Thermoascus)、 梭 。
48、孢 壳 属 (Thielavia)、 弯 颈 霉 属 (Tolypocladium) 或木霉属 (Trichoderma) 多肽。 0096 在另一优选实施方案中, 多肽是棘孢曲霉 (Aspergillus aculeatus)、 泡盛曲 霉 (Aspergillus awamori)、 臭曲霉 (Aspergillus foetidus)、 日本曲霉 (Aspergillus japonicus)、 构巢曲霉 (Aspergillus nidulans)、 黑曲霉 (Aspergillus niger)、 米曲霉 (Aspergillus oryzae)、 杆孢状镰孢 (Fusarium b。
49、actridioides)、 禾谷镰孢 (Fusarium cerealis)、 库威镰孢 (Fusarium crookwellense)、 大刀镰孢 (Fusarium culmorum)、 禾本 科镰孢 (Fusarium graminearum)、 禾赤镰孢 (Fusarium graminum)、 异孢镰孢 (Fusarium heterosporum)、 合 欢 木 镰 孢 (Fusarium negundi)、 尖 孢 镰 孢 (Fusarium oxysporum)、 多 枝 镰 孢 (Fusarium reticulatum)、粉 红 镰 孢 (Fusarium roseum)、接 骨 木 镰 孢 (Fusarium sambucinum)、 肤色镰孢 (Fusarium sarcochroum)、 拟分枝孢镰孢 (Fu。