来自稻瘟病菌的β-葡糖苷酶
优先权
本申请要求于2012年10月31日提交的美国临时申请序列号 61/720,697的优先权,该临时申请据此全文以引用方式并入。
技术领域
本发明组合物和方法涉及可从稻瘟病菌(Magnaporthe grisea)获得的β- 葡糖苷酶多肽、编码β-葡糖苷酶多肽的多核苷酸、以及其制备和使用方 法。包含β-葡糖苷酶多肽的制剂和组合物可用于降解或水解木素纤维素生 物质。
背景技术
纤维素和半纤维素是通过光合作用产生的最丰富的植物材料。它们可 被多种产生能够将聚合物底物水解成单体糖类的胞外酶的微生物(例如, 细菌、酵母和真菌)降解和用作能源(Aro et al.,(2001)J.Biol.Chem.,276: 24309-24314(Aro等人,2001年,《生物化学杂志》,第276卷,第 24309-24314页))。因为非可再生资源方法的局限性,纤维素成为主要可 再生能源的潜能是巨大的(Krishna et al.,(2001)Bioresource Tech.,77:193- 196(Krishna等人,2001年,《生物资源技术》,第77卷,第193-196 页))。通过生物过程对纤维素的有效利用是克服食品、饲料和燃料短缺 的一种途径(Ohmiya et al.,(1997)Biotechnol.Gen.Engineer Rev.,14:365- 414(Ohmiya等人,1997年,《生物技术与遗传工程评论》,第14卷,第 365-414页))。
纤维素酶是水解纤维素(包含β-1,4-葡聚糖或βD-糖苷键)导致形成 葡萄糖、纤维二糖、纤维低聚糖等的酶。传统上将纤维素酶分为三大类: 内切葡聚糖酶(EC 3.2.1.4)(“EG”)、外切葡聚糖酶或纤维二糖水解酶(EC 3.2.1.91)(“CBH”)和β-葡糖苷酶([β]-D-葡糖苷葡萄糖水解酶;EC 3.2.1.21)(“BG”)(Knowles et al.,(1987)TIBTECH 5:255-261(Knowles 等人,1987年,《生物技术趋势》,第5卷,第255-261页);以及 Schulein,(1998)Methods Enzymol.,160:234-243(Schulein,1998年,《酶 学方法》,第160卷,第234-243页))。内切葡聚糖酶主要作用在纤维素 纤维的非晶部分,而纤维二糖水解酶还能够降解结晶纤维素(Nevalainen and Penttila,(1995)Mycota,303-319(Nevalainen和Penttila,1995年,《菌 界》,第303-319页))。因此,纤维二糖水解酶在纤维素酶体系中的存在 是结晶纤维素有效溶解所必需的(Suurnakki et al.,(2000)Cellulose,7:189- 209(Suurnakki等人,2000年,《纤维素》,第7卷,第189-209页))。 β-葡糖苷酶起到从纤维二糖、纤维低聚糖和其他葡糖苷释放D-葡萄糖单位 的作用(Freer,(1993)J.Biol.Chem.,268:9337-9342(Freer,1993年,《生 物化学杂志》,第268卷,第9337-9342页))。
已知纤维素酶由大量细菌、酵母和真菌产生。某些真菌产生能够降解 结晶形式的纤维素的完全纤维素酶体系。这些真菌可经发酵而产生多组纤 维素酶或纤维素酶混合物。相同真菌和其他真菌也可被工程改造而产生或 过量产生某些纤维素酶,从而得到包含不同类型或比例的纤维素酶的纤维 素酶混合物。真菌也可被工程改造使得它们经由发酵而大量产生各种纤维 素酶。丝状真菌发挥特别的作用,因为许多酵母例如酿酒酵母 (Saccharomyces cerevisiae)在其天然状态下没有水解纤维素的能力(参见例 如,Wood et al.,(1998)Methods in Enzymology,160:87-116(Wood等人, 1998年,《酶学方法》,第160卷,第87-116页))。
CBH、EG和BG的真菌纤维素酶分类可进一步扩展以包括每个分类内 的多个组分。例如,已从包括里氏木霉(Trichoderma reesei)(也称为红褐肉 座菌(Hypocrea jecorina))的多个真菌来源分离了多种CBH、EG和BG,里 氏木霉含有两种CBH的已知基因,即,CBH I(“CBH1”)和CBH II (“CBH2”),至少八种EG的已知基因,即,EG I、EG II、EG III、 EGIV、EGV、EGVI、EGVII和EGVIII,以及至少五种BG的已知基因, 即,BG1、BG2、BG3、BG4、BG5和BG7(Foreman et al.(2003),J.Biol. Chem.278(34):31988-31997(Foreman等人,2003年,《生物化学杂志》, 第278卷,第34期,第31988-31997页))。EGIV、EGVI和EGVIII也具 有木葡聚糖酶活性。
为了将结晶纤维素有效地转化成葡萄糖,需要包含来自CBH、EG和 BG分类中每一个的组分的完全纤维素酶体系,而分离的组分在水解结晶纤 维素方面不太有效(Filho et al.,(1996)Can.J.Microbiol.,42:1-5(Filho等 人,1996年,《加拿大微生物学杂志》,第42卷,第1-5页))。内切- 1,4-β-葡聚糖酶(EG)和外切纤维二糖水解酶(CBH)催化纤维素水解为纤维低 聚糖(纤维二糖作为主要产物),而β-葡糖苷酶(BGL)将低聚糖转化为葡萄 糖。已观察到来自不同分类的纤维素酶组分之间的协同关系。具体地讲, EG型纤维素酶和CBH型纤维素酶协同地相互作用以有效地降解纤维素。 β-葡糖苷酶起到从纤维低聚糖诸如纤维二糖释放葡萄糖的重要作用,纤维 二糖对用于将糖发酵为乙醇的微生物诸如酵母具有毒性;并且纤维二糖还 抑制内切葡聚糖酶和纤维二糖水解酶的活性,使得它们在进一步水解结晶 纤维素时是低效的。
鉴于β-葡糖苷酶在降解或转化纤维素材料方面所起到的重要作用,具 有水解纤维素给料的改善功效或能力的β-葡糖苷酶同源物的发现、表征、 制备和应用是所需且有利的。
发明内容
可从稻瘟病菌获得的β-葡糖苷酶及其用途
纤维素的酶法水解仍然是通过木素纤维素生物质给料来生物生产可为 纤维素糖和/或下游产物的材料的主要限制步骤之一。β-葡糖苷酶起到催化 该过程最后一步,从抑制性纤维二糖释放葡萄糖的重要作用,因此其活性 和功效直接影响酶法木素纤维素生物质转化的总体功效,并最终影响酶溶 液的使用成本。因此,新型且更有效的β-葡糖苷酶的发现、制备和使用受 到广泛关注。
虽然多种β-葡糖苷酶是已知的,包括来自里氏木霉或红褐肉座菌的β- 葡糖苷酶Bgl1、Bgl3、Bgl5、Bgl7等(Korotkova O.G.et al.,(2009) Biochemistry 74:569-577(Korotkova O.G.等人,2009年,《生物化学》, 第74卷,第569-577页);Chauve,M.et al.,(2010)Biotechnol.Biofuels 3:3- 3(Chauve,M.等人,2010年,《生物燃料技术》,第3卷,第3-3 页))、来自灰腐质霉高温变种(Humicola grisea var.thermoidea)的β-葡糖 苷酶(Nascimento,C.V.et al.,(2010)J.Microbiol.48,53-62(Nascimento, C.V.等人,2010年,《微生物学杂志》,第48卷,第53-62页));来自 多粉侧孢霉(Sporotrichum pulverulentum)的β-葡糖苷酶(Deshpande V.et al., (1988)Methods Enzymol.,160:415-424(Deshpande V.等人,1988年,《酶 学方法》,第160卷,第415-424页));米曲霉(Aspergillus oryzae)的β- 葡糖苷酶(Fukuda T.et al,(2007)Appl.Microbiol.Biotechnol.76:1027-1033 (Fukuda T.等人,2007年,《应用微生物学和生物技术》,第76卷,第 1027-1033页));来自嗜热篮状菌(Talaromyces thermophilus)CBS 236.58 的β-葡糖苷酶(Nakkharat P.et al.,(2006)J.Biotechnol.,123:304-313 (Nakkharat P.等人,2006年,《生物技术杂志》,第123卷,第304-313 页))、来自埃默森篮状菌(Talaromyces emersonii)的β-葡糖苷酶(Murray P.,et al,(2004)Protein Expr.Purif.38:248-257(Murray P.等人,2004年, 《蛋白质表达和纯化》,第38卷,第248-257页),但迄今为止里氏木霉 β-葡糖苷酶Bgl1和黑曲霉(Aspergillus niger)β-葡糖苷酶SP188被认为是针 对其来评价其他β-葡糖苷酶的活性和性能的基准β-葡糖苷酶。据报道,里 氏木霉Bgl1具有比黑曲霉β-葡糖苷酶SP188更高的比活性,但前者可能分 泌极少,而后者对葡萄糖抑制更敏感(Chauve,M.et al.,(2010)Biotechnol. Biofuels,3(1):3(Chauve,M.等人,2010年,《生物燃料技术》,第3卷, 第1期,第3页))。
本发明组合物和方法的一个方面是应用或使用分离自真菌物种稻瘟病 菌的高度活性的β-葡糖苷酶来水解木素纤维素生物质底物。稻瘟病菌(一 种稻瘟病真菌)的基因组已在2005年由Dean等人在Nature,434(7036):980- 986(2005)(《自然》,第434卷,第7036期,第980-986页,2005年)中 注释。本文所述的SEQ ID NO:2的序列由美国国家医学图书馆国家生物技 术信息中心(National Center for Biotechnology Information,U.S.National Library of Medicine(NCBI))以登录号XP_003709907公布,并且认定为是β- 葡糖苷酶I。该酶此前未以重组形式制备,或包含在可用于水解木素纤维素 生物质底物的酶组合物中。在酶法水解木素纤维素生物质底物的合适方法 中,也未将该酶或包含这种酶的组合物施加于这种底物。此外,稻瘟病菌 的β-葡糖苷酶此前未由工程化微生物表达。其也未与一种或多种纤维素酶 基因和/或一种或多种半纤维素酶基因共表达。在合适微生物中的表达使得 其可以比β-葡糖苷酶在未工程化微生物中内源表达时或在植物中表达时实 质上更大的量表达这些可用的β-葡糖苷酶,所述合适微生物经过多年开 发,在大量遗传工具帮助下,已成为异源蛋白和酶的高度有效且高效的生 产者。归类为β-葡糖苷酶的酶不仅在其来源上而且在其对木素纤维素底物 的活性上各不相同,但大多数(如果不是全部的话)β-葡糖苷酶可在合适 的条件下催化纤维二糖水解。例如,一些不仅对纤维二糖有活性,而且对 较长链的低聚糖有活性,而其他则更专一地仅对纤维二糖有活性。即便对 于那些具有类似底物偏好性的β-葡糖苷酶而言,一些也具有使其催化活性 更大且更高效的酶动力学曲线,并且相应地更加适用于酶催化的水解不能 做到持续长于至多数天的工业应用。此外,尚未对能够转化从木素纤维素 生物质的酶法水解获得的纤维素糖的发酵或产乙醇微生物进行工程改造, 以表达来自稻瘟病菌的β-葡糖苷酶,诸如本文的Mg3A多肽。β-葡糖苷酶 在产乙醇微生物中的表达提供了重要的机会以进一步从未被酶糖化完全转 化的剩余纤维二糖释放D-葡萄糖,其中由此产生的D-葡萄糖可被产乙醇生 物立即消耗或及时发酵。
本发明组合物和方法的一方面涉及来源于稻瘟病菌的糖基水解酶家族 3的β-葡糖苷酶多肽(本文称为“Mg3A”或“Mg3A多肽”)、编码其的 核酸、包含其的组合物、以及产生β-葡糖苷酶多肽和包含其的组合物及将 β-葡糖苷酶多肽和包含其的组合物应用于将木素纤维素生物质水解或转化 成水溶性的可发酵糖的方法。然后可将此类可发酵糖转化成纤维素乙醇、 燃料以及其他生物化学物质和可用产物。在某些实施例中,与基准里氏木 霉Bgl1(其是已知的高保真性β-葡糖苷酶)相比,Mg3Aβ-葡糖苷酶多肽 具有更高的β-葡糖苷酶活性和/或表现出增强的水解给定木素纤维素生物质 底物的能力。(Chauve,M.et al.,(2010)Biotechnol.Biofuels,3(1):3(Chauve, M.等人,2010年,《生物燃料技术》,第3卷,第1期,第3页))。
在一些实施例中,将Mg3A多肽与酶组合物中的一种或多种其他纤维 素酶一起或在存在酶组合物中的一种或多种其他纤维素酶的情况下施加以 水解或分解合适的生物质底物。所述一种或多种其他纤维素酶可为例如其 他β-葡糖苷酶、纤维二糖水解酶和/或内切葡聚糖酶。例如,酶组合物可包 含Mg3A多肽、纤维二糖水解酶和内切葡聚糖酶。在一些实施例中,将 Mg3A多肽与酶组合物中的一种或多种半纤维素酶一起或在存在酶组合物 中的一种或多种半纤维素酶的情况下施加。所述一种或多种半纤维素酶可 为例如木聚糖酶、β-木糖苷酶和/或L-阿拉伯呋喃糖苷酶。在另外的实施例 中,将Mg3A多肽与酶组合物中的一种或多种纤维素酶和一种或多种半纤 维素酶一起或在存在酶组合物中的一种或多种纤维素酶和一种或多种半纤 维素酶的情况下施加。例如,酶组合物包含Mg3A多肽、无或一种或两种 其他β-葡糖苷酶、一种或多种纤维二糖水解酶、一种或多种内切葡聚糖 酶;任选地无或一种或多种木聚糖酶、无或一种或多种β-木糖苷酶、以及 无或一种或多种L-阿拉伯呋喃糖苷酶。
在某些实施例中,在存在产乙醇微生物的情况下,将Mg3A多肽或包 含Mg3A多肽的组合物施加到木素纤维素生物质底物或部分水解的木素纤 维素生物质底物,所述产乙醇微生物能够代谢通过木素纤维素生物质底物 的酶法水解所产生的可溶性可发酵糖,并将此类糖转化成乙醇、生物化学 物质或其他可用的材料。这种过程可为严格的顺序过程,其中水解步骤在 发酵步骤之前进行。这种过程可另选地为混合过程,其中水解步骤首先开 始,但在一段时间内与稍后开始的发酵步骤重叠。这种过程可在另外一种 替代形式中为同步水解和发酵过程,其中生物质底物的酶法水解在产乙醇 生物发酵由酶法水解产生的糖的同时进行。
Mg3A多肽例如可为酶组合物的一部分,从而促进酶法水解过程和从 低聚糖诸如纤维二糖释放D-葡萄糖。在某些实施例中,Mg3A多肽可被遗 传工程改造而在产乙醇生物中表达,使得产乙醇微生物表达和/或分泌此种 β-葡糖苷酶活性。此外,Mg3A多肽可为水解酶组合物的一部分,与此同时 也可由产乙醇生物表达和/或分泌,其中使用水解酶组合物水解木素纤维素 生物质底物所产生的可溶性可发酵糖被也表达和/或分泌Mg3A多肽的产乙 醇微生物代谢和/或转化成乙醇。除一种或多种其他纤维素酶和/或一种或多 种半纤维素酶之外,水解酶组合物还可包含Mg3A多肽。产乙醇生物可被 工程改造,使得其表达Mg3A多肽、一种或多种其他纤维素酶、一种或多 种其他半纤维素酶、或这些酶的组合。β-葡糖苷酶中的一种或多种可在水 解酶组合物中并由产乙醇生物表达和/或分泌。例如,可使用包含Mg3A多 肽的酶组合物实现木素纤维素生物质底物的水解,并且然后可用经工程改 造而表达和/或分泌Mg3A多肽的微生物来发酵由水解产生的糖。作为另一 种选择,包含第一β-葡糖苷酶的酶组合物参与水解步骤,并且产乙醇生物 表达和/或分泌与第一β-葡糖苷酶不同的第二β-葡糖苷酶。例如,可使用包 含里氏木霉Bgl1的水解酶组合物实现木素纤维素生物质底物的水解,并且 通过表达和/或分泌Mg3A多肽的产乙醇微生物来发酵由水解产生的可发酵 糖,或反之亦然。
如本文所展示,Mg3A多肽和包含Mg3A多肽的组合物在发生木素纤 维素生物质的糖化和降解的条件下具有改善的功效。当将包含Mg3A多肽 的酶组合物水解给定生物质底物的性能与包含里氏木霉Bgl1的另外相当的 酶组合物相比时,包含Mg3A多肽的酶组合物显示出改善功效。
在某些实施例中,改善或增强的β-葡糖苷酶活性反映于Mg3A多肽的 改善或增强的纤维二糖酶活性中,所述纤维二糖酶活性使用纤维二糖作为 底物例如在约30℃至约65℃(例如,约35℃至约60℃、约40℃至约 55℃、约45℃至约55℃、约48℃至约52℃、约40℃、约45℃、约50℃、 约55℃等)的温度下测得。在一些实施例中,当使用β-葡糖苷酶多肽水解 磷酸溶胀纤维素(PASC)时,观察到与里氏木霉Bgl1相比,Mg3A多肽具有 改善的β-葡糖苷酶活性,所述磷酸溶胀纤维素例如为使用如下文献的修改 方案预处理的Avicel:Walseth,TAPPI 1971,35:228(Walseth,《纸浆与造 纸工业技术协会志》,1971年,第35卷,第228页)和Wood,Biochem.J. 1971,121:353-362(Wood,《生物化学杂志》,1971年,第121卷,第 353-362页)。在一些实施例中,当使用β-葡糖苷酶多肽水解稀氨水预处理 的玉米秸秆时,观察到与里氏木霉Bgl1相比,Mg3A多肽具有改善的β-葡 糖苷酶活性,所述稀氨水预处理的玉米秸秆例如为国际公布的专利申请: WO2006110891、WO2006110899、WO2006110900、WO2006110901和 WO2006110902;美国专利No.7,998,713、No.7,932,063中所述的玉米秸 秆。
在一些实施例中,改善的β-葡糖苷酶活性反映于与里氏木霉Bgl1相 比,Mg3A多肽在较高温度下进行的糖化反应中催化生物质底物转化或水 解的能力方面的增强稳健性。例如,与里氏木霉Bgl1所观察到的相比, Mg3A所观察到的增强水解的差值或水平在较高温度时要大于较低温度 时,从而指示本公开的Mg3A多肽由于其较高的热稳定性而特别适用于较 高温度下的生物质水解。在一些实施例中,在约55℃的水解温度下,在存 在等量其他纤维素酶和半纤维素酶的情况下,与剂量为相同水平的里氏木 霉Bgl1相比,Mg3A多肽可实现高至少2%例如至少5%、至少7%、至少 10%、或甚至至少15%水平的相同底物的水解。在某些实施例中,Mg3A的 水解水平与Bgl1的水解水平之间的该差值在55℃时要高于50℃时。应当 指出的是,Mg3A的该改善的热稳定性或高温性能相当出人意料,因为通 常用于测量多肽在较高温度下的解折叠或分解的解链温度(Tm)实际上指示 里氏木霉Bgl1的Tm比Mg3A高得多(例如,高约10℃)。不希望受理论 的束缚,该令人惊讶的观察结果可表明Tm不是在存在生物质底物的情况 下热稳定性的良好指标或预测因子。
在一些方面,Mg3A多肽和/或在施加在酶组合物中或方法中以水解木 素纤维素生物质底物时为(a)源自、可得自或产生自稻瘟病菌;(b)包含与 SEQ ID NO:2的氨基酸序列具有至少75%(例如,至少75%、80%、85%、 90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%) 同一性的氨基酸序列的重组多肽;(c)包含与SEQ ID NO:2的催化结构域即 第19-873位氨基酸残基具有至少75%(例如,至少75%、80%、85%、 90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%) 同一性的氨基酸序列的重组多肽;(d)包含与SEQ ID NO:3的氨基酸序列的 成熟形式即SEQ ID NO:2的第19-873位氨基酸残基具有至少75%(例如, 至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、 97%、98%、99%或100%)同一性的氨基酸序列的重组多肽;或(e)具有β- 葡糖苷酶活性的(a)、(b)、(c)或(d)的片段。在某些实施例中,提供了具有β- 葡糖苷酶活性的变体多肽,其包含SEQ ID NO:2的一个或多个氨基酸残基 的置换、缺失和/或插入。
在一些方面,Mg3A多肽和/或在施加在酶组合物中或方法中以水解木 素纤维素生物质底物时为(a)由与SEQ ID NO:1具有至少75%(例如,至少 75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、 98%、99%或100%)序列同一性的核酸序列所编码的多肽、或(b)在中等严 格条件、高度严格条件或极高严格条件下杂交于SEQ ID NO:1或杂交于至 少100个连续核苷酸的SEQ ID NO:1的子序列或杂交于其互补序列的多 肽,其中多肽具有β-葡糖苷酶活性。在一些实施例中,Mg3A多肽和/或在 施加在组合物或方法中以水解木素纤维素生物质底物时为这样的多肽,其 由于遗传密码的简并性,不会在中等严格条件、高度严格条件或极高严格 条件下杂交于SEQ ID NO:1或杂交于至少100个连续核苷酸的SEQ ID NO:1的子序列,但不过会编码具有β-葡糖苷酶活性并包含与SEQ ID NO:2 的氨基酸序列或与SEQ ID NO:3的成熟β-葡糖苷酶序列具有至少75%(例 如,至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、 97%、98%、99%或100%)同一性的氨基酸序列的多肽。核酸序列可为合 成的,并且不一定来源于稻瘟病菌,但核酸序列编码具有β-葡糖苷酶活性 的多肽并且包含与SEQ ID NO:2或与SEQ ID NO:3具有至少75%同一性的 氨基酸序列。
在一些优选的实施例中,与野生型里氏木霉Bgl1(序列为SEQ ID NO: 4)或包含里氏木霉Bgl1的酶组合物相比,Mg3A多肽或包含Mg3A多肽的 组合物具有改善的β-葡糖苷酶活性。在某些实施例中,如使用氯-硝基-苯基 -葡糖苷(CNPG)水解测定法测量的,本文的组合物和方法的Mg3A多肽的纤 维素酶活性比里氏木霉Bgl1高至少约5%、或高约10%、或高约15%、或 高约20%。CNPG测定法在本文的实例2B中有所描述。在一些实施例中, 如使用CNPG水解测定法测量的,本文的组合物和方法的Mg3A多肽的纤 维素酶活性比黑曲霉B-glu高至少约2倍、高至少约5倍、高至少约6倍、 高至少约7倍、高至少约8倍、高至少约9倍、或甚至高至少约10倍。
例如,如使用纤维二糖水解测定法测量的,本文的组合物和方法的 Mg3A多肽的β-葡糖苷酶活性比里氏木霉Bgl1高至少约20%(例如,高至 少约20%、高至少约30%、高至少约40%、高至少约50%、高至少约 60%、高至少约70%、高至少约80%、高至少约85%,例如高至少约 87%)。纤维二糖水解测定法在本文的实例2C中有所描述。在一些实施例 中,如使用纤维二糖水解测定法测量的,本文的组合物和方法的Mg3A多 肽的β-葡糖苷酶活性比黑曲霉B-glu少约2%、少约5%、少约7%、少约 10%,例如少约13%。
在一些实施例中,与里氏木霉Bgl1相比,本文的组合物和方法的 Mg3A多肽具有实质上增强(例如,高至少约20%、高至少约30%、高至 少约40%、高至少约50%、高至少约60%、高至少约70%、高至少约 80%、高至少约85%,例如高至少约87%)的纤维二糖水解活性,但一定 程度上不那么明显增强(例如,高约5%、或高约10%、或高约15%、或高 约20%)的水解氯-硝基-苯基-葡糖苷(CNPG)的能力。例如,本文的组合物 和方法的Mg3A多肽具有与黑曲霉B-glu相比实质上增强的CNPG水解活 性,但与黑曲霉B-glu相比时具有一定程度上类似或略小的纤维二糖酶或纤 维二糖水解活性。
在一些实施例中,与里氏木霉Bgl1相比,重组Mg3A多肽具有降低约 10%、降低约20%、降低约30%、或甚至降低约40%的对于CNPG/纤维二 糖的水解活性比率。在一些实施例中,与黑曲霉B-glu相比,Mg3A多肽具 有高约2倍、约5倍、约7倍、约10倍、约15倍或甚至约20倍的对于 CNPG/纤维二糖的相对水解活性比率。
在某些方面,与野生型里氏木霉Bgl1(序列为SEQ ID NO:4)相比, 本发明的Mg3A多肽和包含Mg3A多肽的组合物具有改善的水解木素纤维 素生物质底物的性能。在一些实施例中,与里氏木霉Bgl1或包含里氏木霉 Bgl1的相同酶组合物从以相同方式预处理的相同生物质在相同糖化条件下 产生的葡萄糖的水平相比,能从以特定方式预处理的给定木素纤维素生物 质底物产生更大量的葡萄糖,由此可观察到Mg3A多肽或包含Mg3A多肽 的组合物的改善的水解性能。例如,当使用0-10mg(例如,约1mg、约 2mg、约3mg、约4mg、约5mg、约6mg、约7mg、约8mg、约9mg、约 10mg)的β-葡糖苷酶(Mg3A多肽或里氏木霉Bgl1)来水解生物质底物中 的1g葡聚糖时,由Mg3A多肽或由包含Mg3A多肽的酶组合物所产生的葡 萄糖的量比由里氏木霉Bgl1或包含里氏木霉Bgl1(而非Mg3A多肽)的其 他相同酶组合物所产生的葡萄糖的量大至少约5%(例如,至少约5%、至 少约10%、至少约15%、至少约20%或至少约25%)。
在一些方面,与里氏木霉Bgl1或包含里氏木霉Bgl1的其他相同酶组 合物从以相同方式预处理的相同生物质在相同糖化条件下得到的葡聚糖转 化率%的水平相比,能从以特定方式预处理的给定木素纤维素生物质底物 产生增加的葡聚糖转化率%,由此可观察到Mg3A多肽或包含Mg3A多肽 的组合物的改善的水解性能。例如,当使用0-10mg(例如,约1mg、约 2mg、约3mg、约4mg、约5mg、约6mg、约7mg、约8mg、约9mg、约 10mg)的β-葡糖苷酶(Mg3A多肽或里氏木霉Bgl1)来水解生物质底物中 的1g葡聚糖时,由Mg3A多肽或由包含Mg3A多肽的酶组合物所得到的葡 聚糖转化率%比由里氏木霉Bgl1或包含里氏木霉Bgl1(而非Mg3A多肽) 的其他相同酶组合物所得到的葡聚糖转化率%高至少约5%(例如,至少约 5%、至少约10%或至少约15%)。
在另外方面,与里氏木霉Bgl1或包含里氏木霉Bgl1的其他相同组合 物在相同糖化条件下水解相同生物质底物时纤维二糖的残余量相比,能通 过水解以特定方式预处理的给定木素纤维素生物质底物而在产物混合物中 获得更高的纤维二糖酶活性和/或减少量的残余纤维二糖,由此可观察到 Mg3A多肽或包含Mg3A多肽的组合物的改善的水解性能。例如,与由里 氏木霉Bgl1或由包含里氏木霉Bgl1的其他相同酶组合物在相同糖化条件下 水解以相同方式预处理的相同生物质底物所产生的产物混合物中产生的残 余纤维二糖的量相比,由Mg3A多肽或包含Mg3A多肽的组合物水解以特 定方式预处理的给定生物质底物所产生的产物混合物中的残余纤维二糖的 量要少至少约5%(例如,至少约5%、至少约10%、至少约15%、或甚至 至少约20%)。当使用0-10mgβ-葡糖苷酶(例如,约1mg、约2mg、约 3mg、约4mg、约5mg、约6mg、约7mg、约8mg、约9mg、约10mg)的 β-葡糖苷酶(例如,Mg3A多肽或里氏木霉Bgl1)来水解生物质底物中的 1g葡聚糖时,情况亦是如此。
本发明组合物和方法的各方面包括包含如上文详述的重组Mg3A多肽 和木素纤维素生物质的组合物。合适的木素纤维素生物质可例如来源于农 作物、食物或饲料生产的副产物、木素纤维素废品、植物残体(包括例如 草渣)或废纸或纸制废品。在某些实施例中,已对木素纤维素生物质进行 一个或多个预处理步骤以使木聚糖、半纤维素、纤维素和/或木质素材料更 易被酶触及或对酶更敏感,从而更适合酶法水解。合适的预处理方法可为 例如在反应器中对生物质材料使用包含强酸和金属盐的稀溶液的催化剂。 参见例如美国专利No.6,660,506、No.6,423,145。作为另一种选择,合适的 预处理可为例如如美国专利No.5,536,325中所述的多步骤方法。在某些实 施例中,根据美国专利No.6,409,841的公开内容,可使用约0.4%至约2% 的强酸对生物质材料进行一个或多个阶段的稀酸水解。预处理方法的另外 实施例可包括如下文献中所述的那些:例如,美国专利No.5,705,369; Gould,(1984)Biotech.&Bioengr.,26:46-52(Gould,1984年,《生物技术 与生物工程》,第26卷,第46-52页);Teixeira et al.,(1999)Appl. Biochem&Biotech.,77-79:19-34(Teixeira等人,1999年,《应用生物化学 与生物技术》,第77-79卷,第19-34页);国际公布的专利申请 WO2004/081185;或美国专利公布No.20070031918或国际公布的专利申请 WO06110901。
本发明还涉及编码具有β-葡糖苷酶活性的多肽的分离的多核苷酸,其 中所述分离的多核苷酸选自:
(1)编码包含与SEQ ID NO:2或与SEQ ID NO:3具有至少75%(例 如,至少75%、80%、85%、90%、91%、92%、93%、94%、 95%、96%、97%、98%、99%或100%)同一性的氨基酸序列的 多肽的多核苷酸;
(2)与SEQ ID NO:1具有至少75%(例如,至少75%、80%、85%、 90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或 100%)同一性的多核苷酸,或者在中等严格条件、高度严格条件 或极高严格条件下杂交于SEQ ID NO:1或杂交于其互补序列。
本发明组合物和方法的各方面包括采用编码包含与SEQ ID NO:2的氨 基酸序列或成熟序列SEQ ID NO:3的氨基酸序列具有至少75%同一性(例 如,至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、 97%、98%、99%或100%)的氨基酸序列的重组多肽的分离的核酸序列, 来制备或产生具有β-葡糖苷酶活性的Mg3A多肽的方法。在一些实施例 中,所述多肽还包含天然或非天然的信号肽,使得所产生的Mg3A多肽被 宿主生物体分泌,例如,信号肽包含与SEQ ID NO:13(里氏木霉Bgl1的 信号序列)具有至少90%同一性的序列。在某些实施例中,分离的核酸包 含与SEQ ID NO:1具有至少75%(例如,至少75%、80%、85%、90%、 91%、92%、93%、94%、95%、96%、97%、98%、99%或100%)同一性 的序列。在某些实施例中,分离的核酸还包含编码信号肽序列的核酸序 列。在某些实施例中,信号肽序列可为选自SEQ ID NO:13-42的一者。在 某些具体实施例中,编码SEQ ID NO:13的信号肽序列的核酸序列用于在里 氏木霉中表达Mg3A多肽。
本发明组合物和方法的各方面包括包含与调控序列有效组合的上述分 离的核酸的表达载体。
本发明组合物和方法的各方面包括包含表达载体的宿主细胞。在某些 实施例中,宿主细胞为细菌细胞或真菌细胞。在某些实施例中,包含表达 载体的宿主细胞为能够代谢由木素纤维素生物质的水解所产生的可溶性糖 的产乙醇微生物,其中所述水解是化学和/或酶促过程的结果。
本发明组合物和方法的各方面包括包含上述宿主细胞和培养基的组合 物。本发明组合物和方法的各方面包括产生Mg3A多肽的方法,该方法包 括:将上述宿主细胞在合适的条件下培养于培养基中以产生β-葡糖苷酶。
本发明组合物和方法的各方面包括包含根据上述用于产生β-葡糖苷酶 的方法所产生的培养基上清液中的Mg3A多肽的组合物。
在一些方面,本发明涉及包含编码如上文和本文所述的具有β-葡糖苷 酶活性的多肽的多核苷酸的核酸构建体、重组表达载体、工程化宿主细 胞。在另外方面,本发明涉及使用核酸构建体、重组表达载体和/或工程化 宿主细胞来制备或产生本发明的β-葡糖苷酶多肽或包含此类β-葡糖苷酶多 肽的组合物的方法。具体地讲,本发明涉及例如包含有效连接至β-葡糖苷 酶的成熟序列的合适信号肽的核酸构建体、分离的多核苷酸、核酸构建 体、重组表达载体或包含此类核酸构建体的工程化宿主细胞,所述β-葡糖 苷酶的成熟序列与SEQ ID NO:2或与SEQ ID NO:3的成熟序列具有至少 75%同一性,或者由与SEQ ID NO:1具有至少75%同一性的多核苷酸编 码。在一些实施例中,信号肽和β-葡糖苷酶序列来源于不同微生物。
还提供了包含与调控序列有效组合的分离的核酸的表达载体。另外, 提供了包含该表达载体的宿主细胞。在另外的实施例中,提供了组合物, 该组合物包含宿主细胞和培养基。
在一些实施例中,宿主细胞为细菌细胞或真菌细胞。在某些实施例 中,宿主细胞为产乙醇微生物,该产乙醇微生物能够代谢通过水解木素纤 维素生物质底物而产生的可溶性糖,其中所述水解可通过化学水解或酶法 水解或这些方法的组合来进行,但所述产乙醇微生物也能够表达异源酶。 在一些实施例中,宿主细胞为酿酒酵母或运动发酵单胞菌(Zymomonas mobilis)细胞,它们不仅能够表达异源多肽诸如本发明的Mg3A多肽,而且 能够将糖发酵成乙醇和/或下游产物。在某些具体实施例中,表达β-葡糖苷 酶的酿酒酵母细胞或运动发酵单胞菌细胞能够对由包含一种或多种β-葡糖 苷酶的酶组合物从木素纤维素生物质产生的糖进行发酵。所述包含一种或 多种β-葡糖苷酶的酶组合物可包含相同的β-葡糖苷酶或可包含一种或多种 不同的β-葡糖苷酶。在某些实施例中,所述包含一种或多种β-葡糖苷酶的 酶组合物可为由工程化宿主细胞产生的酶混合物,该工程化宿主细胞可为 细菌或真菌细胞。当酿酒酵母或运动发酵单胞菌细胞表达本公开的Mg3A 多肽时,Mg3A多肽可被表达但不被分泌。因此,必须将纤维二糖引入或 “转运”到此类宿主细胞中,以便β-葡糖苷酶Mg3A多肽催化D-葡萄糖的 释放。因此,在某些实施例中,除编码Mg3A多肽的基因外,还用纤维二 糖转运体基因转化酿酒酵母或运动发酵单胞菌细胞。已将纤维二糖转运体 和β-葡糖苷酶在酿酒酵母中表达,使得所得微生物能够发酵纤维二糖,例 如Ha et al.,(2011)PNAS,108(2):504-509(Ha等人,2011年,《美国国家 科学院院刊》,第108卷,第2期,第504-509页)中所述。已将另一种纤 维二糖转运体在毕赤酵母(Pichia)中表达,例如公布的美国专利申请No. 20110262983中所述。已将纤维二糖转运体引入大肠杆菌(E.coli)中,例如 Sekar et al.,(2012)Applied Environmental Microbiology,78(5):1611-1614 (Sekar等人,2012年,《应用与环境微生物学》,第78卷,第5期,第 1611-1614页)中所述。
在另外的实施例中,Mg3A多肽由宿主细胞异源表达。例如,Mg3A多 肽由并非稻瘟病菌的工程化微生物表达。在一些实施例中,Mg3A多肽与 一种或多种不同的纤维素酶基因共表达。在一些实施例中,Mg3A多肽与 一种或多种半纤维素酶基因共表达。
在一些方面,提供了包含前面段落所述的重组Mg3A多肽的组合物以 及制备此类组合物的方法。在一些实施例中,该组合物还包含一种或多种 其他纤维素酶,其中所述一种或多种其他纤维素酶由宿主细胞连同Mg3A 多肽一起共表达。例如,所述一种或多种其他纤维素酶可选自无或一种或 多种其他β-葡糖苷酶、一种或多种纤维二糖水解酶和/或一种或多种内切葡 聚糖酶。此类其他β-葡糖苷酶、纤维二糖水解酶和/或内切葡聚糖酶(如果 存在的话)可由单个宿主细胞连同Mg3A多肽一起共表达。所述两种或更 多种纤维素酶中的至少两种可彼此异源或者来源于不同生物体。例如,该 组合物可包含两种β-葡糖苷酶,其中第一种为Mg3A多肽,并且第二β-葡 糖苷酶并非来源于稻瘟病菌菌株。例如,该组合物可包含并非来源于稻瘟 病菌的至少一种纤维二糖水解酶、一种内切葡聚糖酶或一种β-葡糖苷酶。 在一些实施例中,纤维素酶中的一种或多种是宿主细胞内源性的,但被过 表达或以与天然存在于宿主细胞中的水平不同的水平表达。例如,纤维素 酶中的一种或多种可为里氏木霉宿主细胞天然存在的里氏木霉CBH1和/或 CBH2,但当它们在里氏木霉宿主细胞中连同Mg3A多肽一起共表达时, CBH1和CBH2中任一者或两者被过表达或低表达。
在某些实施例中,包含重组Mg3A多肽的组合物还可包含一种或多种 半纤维素酶,其中所述一种或多种半纤维素酶由宿主细胞连同Mg3A多肽 一起共表达。例如,所述一种或多种半纤维素酶可选自一种或多种木聚糖 酶、一种或多种β-木糖苷酶和/或一种或多种L-阿拉伯呋喃糖苷酶。此类其 他木聚糖酶、β-木糖苷酶和L-阿拉伯呋喃糖苷酶(如果存在的话)可由单 个宿主细胞连同Mg3A多肽一起共表达。在一些实施例中,该组合物可包 含并非来源于稻瘟病菌的至少一种β-木糖苷酶、木聚糖酶或阿拉伯呋喃糖 苷酶。
在另外方面,包含重组Mg3A多肽的组合物还可包含一种或多种其他 纤维素酶和一种或多种半纤维素酶,其中所述一种或多种纤维素酶和/或一 种或多种半纤维素酶由宿主细胞连同Mg3A多肽一起共表达。例如,除与 其他非纤维素酶、非半纤维素酶的酶或蛋白一起之外,Mg3A多肽还可连 同一种或多种其他β-葡糖苷酶、一种或多种纤维二糖水解酶、一种或多种 内切葡聚糖酶、一种或多种内切木聚糖酶、一种或多种β-木糖苷酶和一种 或多种L-阿拉伯呋喃糖苷酶一起在相同宿主细胞中共表达。本发明组合物 和方法的各方面因此包括包含上述除Mg3A多肽之外还共表达多种酶的宿 主细胞以及培养基的组合物。本发明组合物和方法的各方面因此包括产生 含Mg3A的酶组合物的方法,该方法包括:将共表达上述多种酶与Mg3A 多肽的宿主细胞在合适的条件下培养于培养基中,以产生Mg3A和其他 酶。还提供了组合物,该组合物包含根据本文方法产生于培养基上清液中 的Mg3A多肽和其他酶。此类培养基上清液可按原样使用,进行很少或不 进行产生后的加工,所述产生后的加工可通常包括用以移除细胞碎片的过 滤、细胞杀死程序和/或用以富集或浓缩其中的酶的超滤或其他步骤。此类 上清液在本文中称为“全发酵液”或“全纤维素酶发酵液”。
在另外方面,本发明涉及在适于降解或转化纤维素材料并适于从纤维 素材料产生物质的条件下施加或使用上述组合物的方法。
在另一个方面,提供了用于将纤维素材料降解或转化成可发酵糖的方 法,该方法包括:使优选地已进行一个或多个预处理步骤的纤维素材料与 前面段落之一中所述的Mg3A多肽或包含此类多肽的组合物接触,以得到 可发酵糖。
因此,本说明书涉及下列具体方面:
在第一方面,一种重组多肽,该重组多肽包含与SEQ ID NO:2或与成 熟序列SEQ ID NO:3具有至少75%同一性的氨基酸序列,其中该多肽具有 β-葡糖苷酶活性。
在第二方面,根据第一方面所述的重组多肽,其中当重组多肽和里氏 木霉Bgl1用于水解木素纤维素生物质底物时,与里氏木霉Bgl1相比,该多 肽具有改善的β-葡糖苷酶活性或水解木素纤维素生物质底物的能力。
在第三方面,根据如上第一方面或第二方面所述的重组多肽,其中所 述改善的β-葡糖苷酶活性为增强的纤维二糖酶活性或改善的水解纤维二糖 的能力,从而释放D-葡萄糖。
在第四方面,根据如上第一方面、第二方面或第三方面所述的重组多 肽,其中所述改善的β-葡糖苷酶活性为在给定组的糖化条件下从给定木素 纤维素生物质获得增加的葡萄糖收率。
在第五方面,根据上文中第一方面至第四方面中任一方面所述的重组 多肽,其中木素纤维素生物质为已在糖化之前进行预处理的木素纤维素生 物质。所述预处理可适当地为本领域中已知的使木素纤维素生物质底物更 易于被酶触及和水解的那些,其可包括例如本文所述的那些预处理方法。
在第六方面,根据上文中第一方面至第五方面中任一方面所述的重组 多肽,其中该多肽包含与SEQ ID NO:2或与SEQ ID NO:3的成熟序列具有 至少80%同一性的氨基酸序列。
在第七方面,根据上文中第一方面至第六方面中任一方面所述的重组 多肽,其中该多肽包含与SEQ ID NO:2或与SEQ ID NO:3的成熟序列具有 至少90%同一性的氨基酸序列。
在第八方面,一种组合物,该组合物包含根据上文中第一方面至第七 方面中任一方面所述的重组多肽,还包含一种或多种其他纤维素酶。
在第九方面,根据第八方面所述的组合物,其中所述一种或多种其他 纤维素酶选自无或一种或多种其他β-葡糖苷酶、一种或多种纤维二糖水解 酶和一种或多种内切葡聚糖酶。
在第十方面,一种组合物,该组合物包含根据上文中第一方面至第七 方面中任一方面所述的重组多肽,还包含一种或多种半纤维素酶。
在第十一方面,根据如上第八方面或第九方面所述的组合物,还包含 一种或多种半纤维素酶。
在第十二方面,根据如上第十方面或第十一方面所述的组合物,其中 所述一种或多种半纤维素酶选自一种或多种木聚糖酶、一种或多种β-木糖 苷酶和一种或多种L-阿拉伯呋喃糖苷酶。
在第十三方面,一种核酸,该核酸编码根据第一方面至第七方面中任 一方面所述的重组多肽。
在第十四方面,根据第十三方面所述的核酸,还包含信号序列。
在第十五方面,根据第十四方面所述的核酸,其中信号序列选自SEQ ID NO:13-42。
在第十六方面,一种表达载体,该表达载体包含与调控序列有效组合 的根据第十三方面至第十五方面中任一方面所述的核酸。
在第十七方面,一种宿主细胞,该宿主细胞包含根据第十六方面所述 的表达载体。
在第十八方面,根据第十七方面所述的宿主细胞,其中该宿主细胞为 细菌细胞或真菌细胞。多种细菌细胞已知是如本文所述的合适的宿主细 胞。多种真菌细胞也是合适的。在一些实施例中,细菌或真菌宿主细胞可 为这样的宿主细胞,其为能够将某些单体糖发酵或代谢成乙醇的产乙醇生 物。例如,细菌产乙醇运动发酵单胞菌可为表达本公开的β-葡糖苷酶多肽 的宿主细胞。例如,真菌产乙醇酿酒酵母也可用作宿主细胞以产生本公开 的β-葡糖苷酶多肽。
在第十九方面,一种组合物,该组合物包含根据第十六方面或第十七 方面所述的宿主细胞和培养基。
在第二十方面,一种产生β-葡糖苷酶的方法,该方法包括将根据第十 七方面或第十八方面所述的宿主细胞在合适条件下培养于培养基中,以产 生β-葡糖苷酶。
在第21方面,一种组合物,该组合物包含根据上文中第20方面所述 的方法产生于培养基上清液中的β-葡糖苷酶。
在第22方面,一种用于水解木素纤维素生物质底物的方法,该方法包 括使木素纤维素生物质底物与根据第一方面至第七方面中任一方面所述的 多肽或与根据第21方面所述的组合物接触,以得到葡萄糖和/或其他糖。
根据如下描述,Mg3A组合物和方法的这些及其他方面将显而易见。
附图说明
图1描绘了pENTR/D-TOPO-Bgl1(943/942)载体的图谱。
图2描绘了pTrex3g 943/942构建体的图谱。
图3A-图3F提供了使用一定程度上不同的Mg3A酶制剂的2组实验, 以便使用磷酸溶胀纤维素酶(PASC)作为底物在50℃下持续1.5h时比较 Mg3A与基准里氏木霉Bgl1的水解性能,其中将Mg3A和Bgl1加入由根据 公布的专利申请WO 2011/038019中所述的工程化里氏木霉菌株产生的背景 全纤维素酶中,并且将β-葡糖苷酶+全纤维素酶混合物以各种β-葡糖苷酶剂 量与PASC底物混合。图3A描绘了根据本文的实例4-A中所述的条件,各 种β-葡糖苷酶剂量下的葡聚糖转化率%的测量和比较。图3B描绘了根据本 文的实例4-A中所述的条件,各种β-葡糖苷酶剂量下的总葡萄糖产量的测 量和比较。图3C描绘了根据本文的实例4-A中所述的条件,以各种β-葡糖 苷酶剂量水解PASC所产生的纤维二糖的测量和比较。图3D描绘了根据本 文的实例4-B中所述的条件,各种β-葡糖苷酶剂量下的葡聚糖转化率%的 测量和比较。图3E描绘了根据本文的实例4-B中所述的条件,各种β-葡糖 苷酶剂量下的总葡萄糖产量的测量和比较。图3F描绘了根据本文的实例4- B中所述的条件,以各种β-葡糖苷酶剂量水解PASC所产生的纤维二糖的 测量和比较。
图4A-图4B提供了使用稀氨水预处理的玉米秸秆(DACS)作为底物, 在50℃下持续2天时Mg3A与基准里氏木霉Bgl1的水解性能的比较,其中 将Mg3A和Bgl1加入由根据公布的专利申请WO 2011/038019中所述的工 程化里氏木霉菌株产生的背景全纤维素酶中,并且将β-葡糖苷酶+纤维素酶 混合物以各种总蛋白比纤维素剂量与DACS底物混合。图4A描绘了各种总 蛋白比纤维素剂量下的总葡聚糖转化率的测量和比较。图4B描绘了各种总 蛋白比纤维素剂量下的总葡萄糖产量的测量和比较。
图5A-图5B提供了使用稀氨水预处理的玉米秸秆(DACS)作为底物, 在50℃下持续2天时Mg3A与基准里氏木霉Bgl1的水解性能的比较,其中 将各种剂量的Mg3A和Bgl1加入全纤维素酶中,该全纤维素酶以恒定的 13.4mg蛋白/g纤维素使用,由根据公布的专利申请WO 2011/038019中所 述的工程化里氏木霉菌株产生。图5A描绘了在各种β-葡糖苷酶加载量(其 中全纤维素酶背景保持为恒定的13.4mg蛋白/g纤维素)下的总葡聚糖转化 率的测量和比较。图5B描绘了在各种β-葡糖苷酶加载量(其中全纤维素酶 背景保持为恒定的13.4mg蛋白/g纤维素)下的总葡萄糖产量的测量和比 较。
图6A-图6C提供了使用稀氨水预处理的玉米秸秆(DACS)作为底物, 在55℃下持续2天时Mg3A与基准里氏木霉Bgl1的水解性能的比较,其中 将各种剂量的Mg3A和Bgl1加入全纤维素酶背景中,该全纤维素酶背景包 含10mg蛋白/g纤维素,由根据公布的专利申请WO 2011/038019中所述的 工程化里氏木霉菌株产生。图6A描绘了在各种β-葡萄糖加载量(其中全纤 维素酶背景保持为恒定的10mg蛋白/g纤维素)下的总葡聚糖转化率的测量 和比较。图6B描绘了在各种β-葡糖苷酶加载量(其中全纤维素酶背景保持 为恒定的10mg/g蛋白/g纤维素)下的总葡萄糖产量的测量和比较。图6C 描绘了在55℃下进行的糖化反应中存在各种剂量的Mg3A和Bgl1的情况下 纤维二糖消耗的剂量曲线。
图7描绘了酵母穿梭载体pSC11构建体,其包含经优化和合成以在酿 酒酵母产乙醇生物中表达Mg3A多肽的Mg3A基因。
图8描绘了运动发酵单胞菌整合载体pZC11,其包含经优化和合成以 在运动发酵单胞菌产乙醇生物中表达Mg3A多肽的Mg3A基因。
图9A-图9E描绘了本公开的序列和序列标识符。
具体实施方式
I.综述
本文描述了涉及重组β-葡糖苷酶Mg3A的组合物和方法,该重组β-葡 糖苷酶Mg3A属于来自稻瘟病菌的糖基水解酶家族3。本发明组合物和方 法部分地基于这样的观察:当组合物用于水解木素纤维素生物质材料或给 料时,与例如已知的里氏木霉的基准高保真性β-葡糖苷酶Bgl1相比,重组 Mg3A多肽具有更高纤维素酶活性并且作为酶组合物的组分更加稳健。 Mg3A多肽的这些特征使它们或其变体适用于许多过程,包括例如适用于 木素纤维素生物质给料的转化或水解。
在更详细地描述本发明组合物和方法之前,应当理解,本发明组合物 和方法不限于所述的具体实施例,因为这些当然可改变。还应当理解,本 文所用的术语仅出于描述具体实施例的目的,并非旨在进行限制,因为本 发明组合物和方法的范围将仅受所附权利要求的限定。
当提供值的范围时,应当理解,介于该范围的上限与下限之间的每一 个中间值(除非上下文另有明确指明,否则精确到下限单位的十分之一) 和所述范围内的任何其他所述值或中间值均涵盖于本发明的组合物和方法 内。这些较小范围的上限和下限可以独立地被包括在较小的范围内,并且 也涵盖于本发明组合物和方法内,除非是在所述范围内的任何明确排除的 界限。当所述范围包括界限中的一者或两者时,排除这些被包括的界限中 的任一者或两者的范围,也被包括在本发明组合物和方法中。
某些范围在本文中通过前面带有术语“约”的数值表述。术语“约” 在本文中用于为它之后的确切数字以及接近或近似该术语之后的数字的数 字提供字面支持。在确定数字是否接近或近似明确列举的数字时,接近或 近似的未列举的数字可以是在其中表述它的上下文中提供明确列举的数字 的基本上等值的数字。例如,与数值相关的术语“约”是指该数值的-10% 至+10%的范围,除非该术语在上下文中另有明确定义。又如,短语“约6 的pH值”是指5.4至6.6的pH值,除非pH值另有明确定义。
本文提供的标题并不是对本发明组合物和方法的各个方面或实施例的 限制,这些方面或实施例都可以通过整体参考本说明书而获得。因此,通 过整体参考本说明书可更完全地限定下文定义的术语。
本文档被组织成多个章节,以便于阅读;然而,读者将会认识到,在 一个章节中进行的陈述可以应用到其他章节。因此,本公开不同章节使用 的标题不应理解为限制性的。
除非另有定义,否则本文所用的所有技术和科学术语均具有与本发明 组合物和方法所属领域普通技术人员通常所理解的相同的含义。尽管与本 文所述的那些相似或等同的任何方法和材料也可用于实践或测试本发明组 合物和方法,但是现在描述的是代表性的示例性方法和材料。
在本说明书中引用的所有出版物和专利以引用的方式并入本文,如同 每个单独的出版物或专利明确地并单独地指示为以引用的方式并入,并且 以引用方式并入本文来公开和描述与引用出版物有关的方法和/或材料。任 何出版物的引用是关于提交日前的其公开内容,并不应视为承认本发明组 合物和方法由于在先发明而无权早于此类出版物。另外,所提供的公布日 期可能与实际的公布日期不同,这可能需要独立地核实。
根据此详细描述,应用下面的缩写和定义。注意,除非上下文另有明 确指明,否则单数形式“一个”、“一种”和“所述(该)”包括多个指 代物。因此,例如,提及“酶”包括多个此种酶,而提及“剂量”则包括 提及一个或多个剂量以及本领域技术人员已知的其等同物,等等。
还应当注意,权利要求书可能撰写成排除了任何任选元素。由此,该 陈述旨在充当使用与权利要求书要素的引用相关的诸如“仅有”、“只 有”等等的排他性术语或使用“负性”限制的先行基础。
当关于对象细胞、核酸、多肽/酶或载体而使用时,术语“重组”指该 对象已从其天然状态经过修饰。因此,例如,重组细胞表达未在天然(非 重组)形式的细胞中存在的基因,或者以不同于自然界中存在的水平或条 件表达天然基因。重组核酸可与天然序列相差一个或多个核苷酸和/或在表 达载体中有效连接至异源序列,例如异源启动子、允许分泌的信号序列 等。重组多肽/酶可与天然序列相差一个或多个氨基酸和/或与异源序列融 合。包含编码β-葡糖苷酶的核酸的载体为例如重组载体。
还应当注意,如本文所用,术语“基本上由…组成”是指这样的组 成,其中该术语之后的组分与其他已知的组分共存,所述其他已知的组分 总量少于总组成的30重量%,并且不会促进或干扰组分的作用或活性。
还应当注意,如本文所用,术语“包含”意指包括但不限于术语“包 含”之后的组分。术语“包含”之后的组分是必要或强制性的,但包含该 组分的组合物还可包含其他非强制性或任选的组分。
还应当注意,如本文所用,术语“由…组成”意指包括并限于术语 “由…组成”之后的组分。因此术语“由…组成”之后的组分是必要或强 制性的,并且组合物中不存在其他组分。
对于本领域技术人员而言,阅读本公开后将显而易见的是,本文所描 述和图示的各个实施例中的每一个都具有分立的组分和特征,在不脱离本 文所述的本发明组合物和方法的范围或实质的前提下,这些组分和特征可 容易地与其他若干实施例中任一者的特征分离或合并。任何所列举的方法 可以按列举的事件顺序或按逻辑上可行的任何其他顺序实施。
II.定义
“β-葡糖苷酶”是指E.C.3.2.1.21的β-D-葡糖苷葡萄糖水解酶。因 此,术语“β-葡糖苷酶活性”是指催化β-D-葡萄糖或纤维二糖的水解以释 放D-葡萄糖的能力。β-葡糖苷酶活性可使用例如纤维二糖酶测定法确定, 该纤维二糖酶测定法测量酶催化纤维二糖底物的水解以得到D-葡萄糖的能 力,如本公开的实例2C中所述。
如本文所用,“Mg3A”或“Mg3A多肽”是指属于来源于稻瘟病菌的 糖基水解酶家族3的β-葡糖苷酶(例如,重组β-葡糖苷酶)(和其变 体),与基准β-葡糖苷酶,即具有SEQ ID NO:4的氨基酸序列的野生型里 氏木霉Bgl1多肽相比时,其具有改善的水解木素纤维素生物质底物的性 能。根据本发明组合物和方法的各方面,Mg3A多肽包括具有SEQ ID NO:2 所示的氨基酸序列的那些多肽,以及与SEQ ID NO:2的氨基酸序列、或与 成熟序列SEQ ID NO:2、或与SEQ ID NO:2的至少100个残基长的片段具 有至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至 少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少 99%序列同一性的衍生物或变体多肽,其中Mg3A多肽不仅具有β-葡糖苷 酶活性并能够催化纤维二糖转化成D-葡萄糖,而且与里氏木霉Bgl1相比, 具有更高的β-葡糖苷酶活性并具有更高的催化纤维二糖转化成D-葡萄糖的 能力。
要用于本公开的组合物和方法中的Mg3A多肽将具有SEQ ID NO:2的 氨基酸序列的多肽、或由SEQ ID NO:2的第19至873位残基组成的多肽、 或成熟序列SEQ ID NO:3的至少5%、至少10%、优选至少20%、更优选 至少30%、并且甚至更优选至少40%、更优选至少50%、甚至更优选至少 60%、并且优选至少70%、更优选至少90%、甚至更优选至少100%或更多 的β-葡糖苷酶活性。
“家族3糖基水解酶”或“GH3”是指符合根据如下文献的分类的糖 基水解酶家族3的定义的多肽:Henrissat,Biochem.J.280:309-316(1991) (Henrissat,《生物化学杂志》,第280卷,第309-316页,1991年)和 Henrissat&Cairoch,Biochem.J.,316:695-696(1996)(Henrissat和Cairoch, 《生物化学杂志》,第316卷,第695-696页,1996年)。
可分离或纯化根据本文所述的本发明组合物和方法的Mg3A多肽。所 谓纯化或分离意指通过将Mg3A从与其天然相关的天然存在的成分中的一 些或所有分离而使Mg3A多肽从其天然状态改变。此类分离或纯化可通过 本领域公认的分离技术诸如离子交换色谱法、亲和色谱法、疏水分离、渗 析、蛋白酶处理、硫酸铵沉淀法或其他蛋白质盐沉淀法、离心、尺寸排阻 色谱法、过滤、微量过滤、凝胶电泳或梯度分离来实现,以移除最终组合 物中不期望的全细胞、细胞碎片、杂质、外来蛋白质或酶。进一步可能的 是,然后将能提供另外益处的多种成分加入含Mg3A的组合物中,例如, 活化剂、抗抑制剂、所需离子、控制pH的化合物、或者其他酶或化学品。
如本文所用,“微生物”是指细菌、真菌、病毒、原生动物、以及其 他微生物或微观生物体。
如本文所用,多肽的“衍生物”或“变体”意指通过如下方式衍生自 前体多肽(例如,天然多肽)的多肽:将一个或多个氨基酸添加到C端和 N端中任一者或两者上,在氨基酸序列中的一个或多个不同位点置换一个 或多个氨基酸,在多肽的任一个或两个末端或在氨基酸序列的一个或多个 位点缺失一个或多个氨基酸,或者在氨基酸序列的一个或多个位点插入一 个或多个氨基酸。Mg3A衍生物或变体的制备可以任何方便的方式实现, 例如通过修饰编码天然多肽的DNA序列、将该DNA序列转化到合适的宿 主中、以及表达经修饰的DNA序列以形成衍生物/变体Mg3A。衍生物或变 体还包括经化学修饰例如糖基化或以其他方式改变Mg3A多肽的特性的 Mg3A多肽。虽然Mg3A的各种衍生物和变体被本发明组合物和方法所涵 盖,但与在相同木素纤维素生物质底物水解条件下的SEQ ID NO:4的野生 型里氏木霉Bgl1相比时,此类衍生物和变体将表现出改善的β-葡糖苷酶活 性。
在某些方面,本文组合物和方法的Mg3A多肽还可涵盖多肽的功能片 段或具有β-葡糖苷酶活性的多肽片段,其衍生自亲本多肽,所述亲本多肽 可为包含SEQ ID NO:2或由SEQ ID NO:2组成的全长多肽、或包含SEQ ID NO:3或由SEQ ID NO:3组成的成熟序列。功能多肽可在N端区域或C端 区域的任一者中或在这两个区域中被截短而生成亲本多肽的片段。出于本 公开的目的,功能片段必须具有亲本多肽的至少20%、更优选地至少 30%、40%、50%或优选地至少60%、70%、80%、或甚至更优选地至少 90%的β-葡糖苷酶活性。
在某些方面,Mg3A衍生物/变体将与SEQ ID NO:2的氨基酸序列或与 成熟序列SEQ ID NO:3具有75%至99%(或更大)氨基酸序列同一性的任 何值,例如,与SEQ ID NO:2的氨基酸序列或与成熟序列SEQ ID NO:3具 有75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、 86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、 97%、98%或99%氨基酸序列同一性。在一些实施例中,氨基酸置换为使用 L-氨基酸的“保守氨基酸置换”,其中一个氨基酸被另一个生物学上类似 的氨基酸替换。保守氨基酸置换是保留被置换的氨基酸的总体电荷、疏水 性/亲水性和/或空间位阻的那些置换。保守置换的例子是下列各组之间的那 些置换:Gly/Ala、Val/Ile/Leu、Lys/Arg、Asn/Gln、Glu/Asp、Ser/Cys/Thr 和Phe/Trp/Tyr。衍生物可例如相差少至1至10个氨基酸残基,诸如6-10 个、少至5个、少至4个、3个、2个、或甚至1个氨基酸残基。在一些实 施例中,Mg3A衍生物可具有N端和/或C端缺失,其中不包含缺失末端部 分的Mg3A衍生物与SEQ ID NO:2或SEQ ID NO:3中的连续子区域相同。
如本文所用,相对于本文鉴定的氨基酸或核苷酸序列的“序列同一性 百分比(%)”被定义为在对序列进行比对并根据需要引入空位以实现最大序 列同一性百分比并且不将任何保守置换视为序列同一性的一部分之后,与 Mg3A序列中的氨基酸残基或核苷酸相同的候选序列中的氨基酸残基或核 苷酸的百分比。
所谓“同源物”,应当意指与所讨论的氨基酸序列和所讨论的核苷酸 序列具有指定程度的同一性的实体。同源序列被认为包括与所讨论的序列 具有至少75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%或甚至99%同一性的氨基酸序列,该 同一性使用常规的序列比对工具(例如,Clustal、BLAST等等)测量。通 常,除非另外指明,否则同源物将包括与所讨论的氨基酸序列相同的活性 位点残基。
用于执行序列比对和确定序列同一性的方法是技术人员已知的,可在 不进行过多实验的情况下执行,并且可确切获得同一性值的计算。参见例 如Ausubel et al.,eds.(1995)Current Protocols in Molecular Biology,Chapter 19(Greene Publishing and Wiley-Interscience,New York)(Ausubel等人编 辑,1995年,《分子生物学现行规范》,第19章,格林出版与威立国际科 学,纽约);以及ALIGN程序(Dayhoff(1978)in Atlas of Protein Sequence and Structure 5:Suppl.3(National Biomedical Research Foundation,Washington, D.C.)(Dayhoff,1978年,《蛋白质序列和结构图册》,第5卷,增刊3, 国家生物医学研究基金会,华盛顿特区))。多种算法可用于对序列进行 比对并确定序列同一性,并且包括例如,Needleman et al.(1970)J.Mol.Biol. 48:443(Needleman等人,1970年,《分子生物学杂志》,第48卷,第 443页)的同源性比对算法;Smith et al.(1981)Adv.Appl.Math.2:482 (Smith等人,1981年,《应用数学进展》,第2卷,第482页)的局部同 源性算法;Pearson et al.(1988)Proc.Natl.Acad.Sci.85:2444(Pearson等 人,1988年,《美国国家科学院院刊》,第85卷,第2444页)的相似性 搜索方法;Smith-Waterman算法(Meth.Mol.Biol.70:173-187(1997)(《分 子生物学方法》,第70卷,第173-187页,1997年));以及BLASTP、 BLASTN和BLASTX算法(参见Altschul et al.(1990)J.Mol.Biol.215:403- 410(Altschul等人,1990年,《分子生物学杂志》,第215卷,第403- 410页))。
使用这些算法的计算机化程序也可供使用,并且包括但不限于: ALIGN或Megalign(DNASTAR)软件、或WU-BLAST-2(Altschul et al., (1996)Meth.Enzym.,266:460-480(Altschul等人,1996年,《酶学方 法》,第266卷,第460-480页));或美国威斯康星州麦迪逊(Madison, Wisconsin,USA)的遗传学计算组(Genetics Computing Group(GCG))软件包版 本8中可获得的GAP、BESTFIT、BLAST、FASTA和TFASTA;以及加利 福尼亚州山景城的Intelligenetics公司(Intelligenetics,Mountain View, California)所开发的PC/Gene程序中的CLUSTAL。本领域的技术人员可确 定用于测量比对的适当参数,包括在正进行比较的序列的长度上实现最大 比对所需的算法。优选地,使用由程序确定的默认参数来确定序列同一 性。具体地讲,可使用Clustal W(Thompson J.D.et al.(1994)Nucleic Acids Res.22:4673-4680(Thompson J.D.等人,1994年,《核酸研究》,第22 卷,第4673-4680页))以以下默认参数确定序列同一性,即:
空位开放罚分(Gap opening penalty): 10.0
空位延伸罚分(Gap extension penalty): 0.05
蛋白质权重矩阵(Protein weight matrix): BLOSUM系列
DNA权重矩阵(DNA weight matrix): IUB
延迟趋异序列%(Delay divergent sequences%): 40
空位间隔距离(Gap separation distance): 8
DNA转换权重(DNA transitions weight): 0.50
亲水性残基列表(List hydrophilic residues): GPSNDQEKR
负矩阵使用: 关闭
残基特异性罚分触发(Toggle Residue specific penalties): 打开
亲水性罚分触发(Toggle hydrophilic penalties): 打开
末端空位间隔罚分触发(Toggle end gap separation penalty) 关闭
如本文所用,“表达载体”意指包含有效连接至合适控制序列的DNA 序列的DNA构建体,所述控制序列能够影响DNA在合适宿主中的表达。 这种控制序列可包括影响转录的启动子、控制转录的任选的操纵子序列、 编码合适的mRNA上核糖体结合位点的序列、以及控制转录和翻译的终止 的序列。不同细胞类型可与不同表达载体一起使用。枯草芽孢杆菌(Bacillus subtilis)中使用的载体的示例性启动子为AprE启动子;变铅青链霉菌 (Streptomyces lividans)中使用的示例性启动子为A4启动子(来自黑曲 霉);大肠杆菌中使用的示例性启动子为Lac启动子,酿酒酵母中使用的 示例性启动子为PGK1,黑曲霉中使用的示例性启动子为glaA,并且里氏 木霉的示例性启动子为cbhI。载体可以是质粒、噬菌体颗粒或仅仅是潜在 基因组插入物。一旦转化到合适的宿主中,载体就可独立于宿主基因组复 制和发挥作用,或者在合适的条件下可整合到基因组本身中。在本说明书 中,质粒和载体有时可互换使用。然而,本发明组合物和方法旨在包括其 他形式的表达载体,所述表达载体起到等同功能并且是本领域已知的或成 为本领域已知的。因此,广泛的宿主/表达载体组合可用于表达本文所述的 DNA序列。可用的表达载体例如可由如下组成:染色体、非染色体和合成 DNA序列的片段,诸如SV40和已知细菌质粒的各种已知衍生物,例如来 自大肠杆菌的质粒,包括col E1、pCR1、pBR322、pMb9、pUC 19及其衍 生物;广泛宿主范围质粒,例如RP4;噬菌体DNA,例如噬菌体λ的各种 衍生物例如NM989,以及其他DNA噬菌体例如M13和丝状单链DNA噬 菌体;酵母质粒,诸如2μ质粒或其衍生物;可用于真核细胞的载体,诸如 可用于动物细胞的载体;以及衍生自质粒和噬菌体DNA的组合的载体,诸 如经修饰以采用噬菌体DNA或其他表达控制序列的质粒。使用本发明组合 物和方法的表达载体的表达技术是本领域已知的,并且在例如Sambrook et al.,Molecular Cloning:A Laboratory Manual,Second Edition,Cold Spring Harbor Press(1989)(Sambrook等人,《分子克隆:实验室指南》,第二 版,冷泉港出版社,1989年)中大体进行了描述。通常,通过经整合事件 直接插入具体物种的基因组中,将包含本文所述的DNA序列的此类表达载 体转化到单细胞宿主中(参见例如Bennett&Lasure,More Gene Manipulations in Fungi,Academic Press,San Diego,pp.70-76(1991)(Bennett 和Lasure,《真菌中更多的基因操作》,学术出版社,圣地亚哥,第70-76 页,1991年)以及其中引用的描述真菌宿主中靶向基因组插入的文章)。
如本文所用,“宿主菌株”或“宿主细胞”意指包含根据本发明组合 物和方法的DNA的表达载体的合适宿主。可用于本发明组合物和方法的宿 主细胞一般为原核或真核宿主,包括可实现表达的任何可转化微生物。具 体地讲,宿主菌株可为枯草芽孢杆菌、变铅青链霉菌、大肠杆菌、里氏木 霉、酿酒酵母或黑曲霉。在某些实施例中,宿主细胞可为产乙醇微生物, 其可为例如酵母诸如酿酒酵母,或细菌产乙醇生物诸如运动发酵单胞菌。 当酿酒酵母或运动发酵单胞菌用作宿主细胞时,并且如果不使β-葡糖苷酶 基因从宿主细胞分泌而是在细胞内表达,则可将纤维二糖转运体基因引入 宿主细胞中,以允许细胞内表达的β-葡糖苷酶作用于纤维二糖底物并释放 葡萄糖,进而葡萄糖随后或立即被微生物代谢并转化成乙醇。
使用通过重组DNA技术构建的载体来转化或转染宿主细胞。此类转化 的宿主细胞可具有如下一者或两者的能力:使编码Mg3A(及其衍生物或 变体(突变体))的载体复制以及表达所需的肽产物。在根据本发明组合 物和方法的某些实施例中,“宿主细胞”意指木霉属物种的细胞和由木霉 属物种的细胞产生的原生质体两者。
关于细胞而使用的术语“转化”、“稳定转化”和“转基因”意指细 胞包含整合到其基因组中或作为经多代保留下来的附加体而携带的非天然 (例如,异源)核酸序列。
在将核酸序列插入细胞的上下文中,术语“引入”意指本领域已知的 “转染”、“转化”或“转导”。
“宿主菌株”或“宿主细胞”为在其中引入表达载体、噬菌体、病毒 或其他DNA构建体,包括编码所关注的多肽(例如,β-葡糖苷酶)的多核 苷酸的生物体。示例性宿主菌株是能够表达所关注的多肽的微生物细胞 (例如,细菌、丝状真菌和酵母)。术语“宿主细胞”包括由细胞产生的 原生质体。
关于多核苷酸或多肽的术语“异源”是指并非天然存在于宿主细胞中 的多核苷酸或多肽。
关于多核苷酸或多肽的术语“内源”是指天然存在于宿主细胞中的多 核苷酸或多肽。
术语“表达”是指基于核酸序列产生多肽的过程。所述过程包括转录 和翻译二者。
因此,将木素纤维素生物质底物转化成乙醇的过程在一些实施例中可 包括两种β-葡糖苷酶活性。例如,可在糖化或水解步骤期间将第一β-葡糖 苷酶活性施加到木素纤维素生物质底物,并且可在发酵步骤中将第二β-葡 糖苷酶活性作为产乙醇微生物的一部分施加,在发酵步骤期间,由糖化或 水解步骤产生的单体糖或可发酵糖发生代谢。第一β-葡糖苷酶活性和第二 β-葡糖苷酶活性可在一些实施例中由相同β-葡糖苷酶多肽的存在所产生。 例如,糖化中的第一β-葡糖苷酶活性可由本发明的Mg3A多肽的存在所产 生,而发酵阶段的第二β-葡糖苷酶活性可由产乙醇微生物表达不同β-葡糖 苷酶所产生。又如,第一β-葡糖苷酶活性和第二β-葡糖苷酶活性可由糖化 或水解步骤和发酵步骤中的相同多肽的存在所产生。例如,本发明的相同 Mg3A多肽可在一些实施例中提供用于水解或糖化步骤和发酵步骤两者的 β-葡糖苷酶活性。
在某些其他实施例中,将木素纤维素生物质底物转化成乙醇的过程可 包括两种β-葡糖苷酶活性,而糖化或水解步骤和发酵步骤例如在相同罐中 同步发生。两种或更多种β-葡糖苷酶多肽可有助于β-葡糖苷酶活性,其中 一种可为本发明的Mg3A多肽。
在某些另外的实施例中,将木素纤维素生物质转化成乙醇的过程可包 括单种β-葡糖苷酶活性,而糖化或水解步骤或发酵步骤中任一者而非这两 个步骤涉及β-葡糖苷酶的参与。例如,本发明的Mg3A多肽或包含Mg3A 多肽的组合物可用于糖化步骤。又如,用于水解木素纤维素生物质底物的 酶组合物不包含β-葡糖苷酶活性,而产乙醇微生物表达β-葡糖苷酶多肽, 例如,本发明的Mg3A多肽。
如本文所用,“信号序列”意指结合于多肽的N-端部分并且促进成熟 形式的多肽分泌到细胞之外的氨基酸序列。信号序列的该定义为功能定 义。细胞外多肽的成熟形式不含信号序列,其在分泌过程期间被切除。虽 然Mg3A的天然信号序列可用于本发明组合物和方法的各方面,但可使用 其他非天然的信号序列(例如,SEQ ID NO:13)。当提及本文的多肽时, 术语“成熟”意指在翻译和任何翻译后修饰之后的其最终形式的多肽。例 如,本发明的Mg3A多肽具有一种或多种成熟形式,其中所述成熟形式的 至少一种具有SEQ ID NO:3的氨基酸序列。
本发明的β-葡糖苷酶多肽可称为“前体”、“未成熟的”或“全长 的”(在这种情况下它们包含信号序列),或者可称为“成熟的”(在这 种情况下它们不含信号序列)。多肽的成熟形式通常是最有用的。除非另 有说明,否则本文所用的氨基酸残基编号方式是指各淀粉酶多肽的成熟形 式。本发明的β-葡糖苷酶多肽也可被截短以移除N端或C端,只要所得多 肽保持β-葡糖苷酶活性即可。
本发明的β-葡糖苷酶多肽也可为“嵌合”或“杂合”多肽,因为其包 含第一β-葡糖苷酶多肽的至少一部分和第二β-葡糖苷酶多肽的至少一部分 (此类嵌合β-葡糖苷酶多肽可例如使用涉及对β-葡糖苷酶每者上的结构域 进行交换的已知技术而衍生自第一β-葡糖苷酶和第二β-葡糖苷酶)。本发 明β-葡糖苷酶多肽还可包含异源信号序列、允许跟踪或纯化的表位等等。 当术语“异源”用来指用于表达所关注的多肽的信号序列时,其意指该信 号序列例如与所关注的多肽来源于不同的微生物。用于表达本文Mg3A多 肽的合适异源信号序列的例子可为例如来自里氏木霉的那些。
如本文所用,“功能附接”或“有效连接”意指具有已知或所需活性 的调控区或功能结构域诸如启动子、终止子、信号序列或增强子区以一定 方式附接或连接到靶标(例如,基因或多肽),使得调控区或功能结构域 根据其已知或所需活性来控制该靶标的表达、分泌或功能。
如本文所用,术语“多肽”和“酶”可互换使用,是指包含通过肽键 连接的氨基酸残基的任何长度的聚合物。本文中使用氨基酸残基的常规单 字母或三字母编码。聚合物可为直链或支链的,其可包含经修饰的氨基 酸,并且其可被非氨基酸隔断。所述术语还涵盖天然修饰或通过干预修饰 的氨基酸聚合物;例如二硫键形成、糖基化、脂质化、乙酰化、磷酸化或 任何其他操作或修饰,诸如与标记组分缀合。还包括在该定义中的是例如 含有一个或多个氨基酸类似物(包括例如非天然氨基酸等)以及本领域已 知的其他修饰的多肽。
如本文所用,“野生型”与“天然”基因、酶或菌株是指天然存在的 那些基因、酶或菌株。
关于多肽的术语“野生型”、“亲本”或“参考”是指不在一个或多 个氨基酸位置处包括人为制造的置换、插入或缺失的天然存在的多肽。类 似地,关于多核苷酸的术语“野生型”、“亲本”或“参考”是指不包括 人为制造的核苷改变的天然存在的多核苷酸。然而,编码野生型多肽、亲 本多肽或参考多肽的多核苷酸不局限于天然存在的多核苷酸,而是涵盖编 码野生型多肽、亲本多肽或参考多肽的任何多核苷酸。
如本文所用,“变体多肽”是指通常利用重组DNA技术,通过一个或 多个氨基酸的置换、添加或缺失而源于亲本(或参考)多肽的多肽。变体 多肽可与亲本多肽相差少量氨基酸残基。它们可由其与亲本多肽的一级氨 基酸序列同源性/同一性的水平限定。合适地,变体多肽与亲本多肽具有至 少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少 92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98% 或甚至至少99%的氨基酸序列同一性。
如本文所用,“变体多核苷酸”编码变体多肽;与亲本多核苷酸具有 指定程度的同源性/同一性;或在严格条件下与亲本多核苷酸或其互补序列 杂交。合适地,变体多核苷酸与亲本多核苷酸或与亲本多核苷酸的互补序 列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少 93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少 99%的核苷酸序列同一性。测定同一性百分比的方法是本领域已知的并且 在上文中进行了描述。
术语“源自”涵盖术语“来源于”、“从…获得”、“可由…获 得”、“分离自”和“由…产生”,并且通常是指一种指定材料在另一指 定材料中找到其起源或者具有可参照另一指定材料而描述的特征。
如本文所用,术语“杂交条件”是指进行杂交反应的条件。这些条件 通常根据测量杂交的条件的“严格性”程度来分类。严格性程度可例如基 于核酸结合复合物或探针的解链温度(Tm)。例如,“最高严格性”通常在 约Tm-5℃(比探针的Tm低5℃)下发生;“高严格性”在比Tm低约5℃ -10℃下发生;“中等严格性”在比探针Tm低约10℃-20℃下发生;并且 “低严格性”在比Tm低约20℃-25℃下发生。作为另一种选择或除此之 外,杂交条件可基于杂交的盐或离子强度条件,和/或基于一种或多种严格 性洗涤,例如:6X SSC=极低严格性;3X SSC=低至中等严格性;1X SSC =中等严格性;并且0.5X SSC=高严格性。在功能上,可以使用最高严格性 条件来鉴别与杂交探针具有严格的同一性或接近严格的同一性的核酸序 列;而高严格性条件用于鉴别与探针具有约80%或更高序列同一性的核酸 序列。对于需要高选择性的应用,通常需要使用相对严格的条件来形成杂 交物(例如,使用相对较低的盐和/或高温条件)。
如本文所用,术语“杂交”是指用于使一条核酸链通过本领域已知的 碱基配对与互补链接合的方法。更具体地讲,“杂交”是指在印迹杂交技 术和PCR技术期间一条核酸链与互补链形成双链即与之碱基配对的过程。 如果某核酸序列与参考核酸序列在中等至高度严格杂交和洗涤条件下彼此 特异性杂交,则认为这两个序列“选择性杂交”。杂交条件基于核酸结合 复合物或探针的解链温度(Tm)。例如,“最高严格性”通常在约Tm-5℃ (比探针的Tm低5℃)下发生;“高严格性”在比Tm低约5℃-10℃下发 生;“中等严格性”在比探针Tm低约10℃-20℃下发生;并且“低严格 性”在比Tm低约20℃-25℃下发生。在功能上,可以使用最高严格性条件 来鉴定与杂交探针具有严格的同一性或接近严格的同一性的序列;而可使 用中等或低严格性杂交来鉴定或检测多核苷酸序列同源物。
中等严格性和高严格性杂交条件是本领域熟知的。例如,可通过如下 步骤进行中等严格性杂交:在包含20%甲酰胺、5×SSC(150mM NaCl、 15mM柠檬酸三钠)、50mM磷酸钠(pH 7.6)、5×邓哈特溶液、10%硫酸葡 聚糖和20mg/mL变性剪切的鲑精DNA的溶液中于37℃下过夜孵育,然后 在1×SSC中于约37℃至50℃下洗涤滤膜。高严格性杂交条件可为以65℃ 和0.1×SSC(其中1×SSC=0.15M NaCl、0.015M柠檬酸三钠,pH 7.0)进 行的杂交。作为另一种选择,高严格性杂交条件可于约42℃下在50%甲酰 胺、5×SSC、5×邓哈特溶液、0.5%SDS和100μg/mL变性载体DNA中进 行,然后在2×SSC和0.5%SDS中于室温下洗涤两次,并且在0.1×SSC和 0.5%SDS中于42℃下再洗涤两次。并且极高严格性杂交条件可为以68℃ 和0.1×SSC进行的杂交。本领域的技术人员知道如何根据适应诸如探针长 度等等的因素的需要来调整温度、离子强度等。
编码变体β-葡糖苷酶的核酸相比于SEQ ID NO:1与其相同互补链的核 苷酸之间形成的双链可具有降低1℃-3℃或更多的Tm。
在关于至少两条核酸或多肽的上下文中,短语“实质上相似”或“实 质上相同”意指,多核苷酸或多肽包含与亲本或参考序列具有至少约 90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约 95%、至少约96%、至少约97%、至少约98%或甚至至少约99%的同一 性,或者不包括在不增加功能性的情况下仅为避开本描述所作的氨基酸置 换、插入、缺失或修饰的序列。
如本文所用,“表达载体”是指DNA构建体,其含有编码指定多肽且 有效连接至能够实现该多肽在合适的宿主中表达的合适控制序列的DNA序 列。这种控制序列可包括实现转录的启动子、控制这种转录的任选的操纵 子序列、编码合适的mRNA核糖体结合位点的序列和/或控制转录和翻译终 止的序列。载体可以是质粒、噬菌体颗粒或是潜在基因组插入物。一旦转 化到适合宿主中,载体就可独立于宿主基因组复制和发挥作用,或者在一 些情况下可整合到宿主基因组中。
术语“重组”是指诸如通过使编码序列突变以产生改变的多肽、将编 码序列与另一基因的编码序列融合、使基因处于不同启动子控制下、在异 源生物体中表达基因、以降低或升高的水平表达基因、以不同于基因的天 然表达谱的方式有条件地或组成地表达基因等,对遗传物质(即,核酸、 核酸编码的多肽以及包含这些多核苷酸的载体和细胞)进行修饰以改变其 序列或表达特征。一般说来,重组核酸、多肽和基于它们的细胞已通过人 进行操纵使得其与自然界中存在的相关核酸、多肽和细胞不相同。
“信号序列”是指结合至多肽的N端部分,并且促进成熟形式的多肽 从细胞分泌的氨基酸序列。细胞外多肽的成熟形式不含信号序列,其在分 泌过程期间被切除。
术语“选择标记”或“可选标记”是指能够在宿主细胞中表达使得易 于选择含有所引入的核酸或载体的宿主的基因。可选标记的例子包括但不 限于抗微生物物质(例如潮霉素、博来霉素或氯霉素)和/或赋予宿主细胞 代谢益处(如营养益处)的基因。
术语“调控元件”是指控制核酸序列表达的某一方面的遗传元件。例 如,启动子是促进有效连接的编码区的转录起始的调控元件。另外的调控 元件包括剪接信号、聚腺苷酸化信号和终止信号。
如本文所用,“宿主细胞”一般为以使用本领域已知的重组DNA技术 构建的载体转化或转染的原核或真核宿主的细胞。转化的宿主细胞能够复 制编码多肽变体的载体或者表达所需的多肽变体。在载体编码多肽变体的 前多肽或原多肽形式的情况下,这些变体在表达时通常由宿主细胞分泌到 宿主细胞培养基中。
在将核酸序列插入细胞的上下文中,术语“引入”意指转化、转导或 转染。转化的手段包括本领域已知的原生质体转化法、氯化钙沉淀法、电 穿孔法、裸DNA法等。(参见,Chang and Cohen Mol.Gen.Genet. 168:111-115,1979(Chang和Cohen,《分子遗传学和基因组学》,第168 卷,第111-115页,1979年);Smith et al.(1986)Appl.Env.Microbiol. 51:634(Smith等人,1986年,《应用与环境微生物学》,第51卷,第634 页);以及Ferrari等人载于Harwood,Bacillus,Plenum Publishing Corporation,pp.57-72,1989(Harwood,《芽孢杆菌属》,普莱南出版公 司,第57-72页,1989年)中的综述文章)。
“融合”多肽序列经由两个所讨论的多肽序列之间的肽键连接,即有 效连接。
术语“丝状真菌”是指真菌亚门(Eumycotina),特别是盘菌亚门 (Pezizomycotina)物种的所有丝状形式。
“产乙醇微生物”是指能够将糖或低聚糖转化为乙醇的微生物。
其他科技术语的含义与本公开所属领域的普通技术人员通常所理解的 相同(参见例如Singleton and Sainsbury,Dictionary of Microbiology and Molecular Biology,2d Ed.,John Wiley and Sons,NY 1994(Singleton和 Sainsbury,《微生物学与分子生物学词典》,第2版,约翰威立出版公 司,纽约,1994年);以及Hale and Marham,The Harper Collins Dictionary of Biology,Harper Perennial,NY 1991(Hale和Marham,《哈珀柯林斯生物 学词典》,哈珀永久出版社,纽约,1991年))。
III.β-葡糖苷酶多肽、多核苷酸、载体和宿主细胞
A.Mg3A多肽
在一个方面,本发明组合物和方法提供了重组Mg3Aβ-葡糖苷酶多 肽、其片段或其具有β-葡糖苷酶活性的变体。重组β-葡糖苷酶多肽的一个 例子是从稻瘟病菌中分离出来。成熟的Mg3A多肽具有如SEQ ID NO:3所 示的氨基酸序列。类似地,实质上相似的Mg3A多肽可存在于自然界中, 例如存在于稻瘟病菌的其他菌株或分离株中。本发明组合物和方法涵盖这 些和其他重组Mg3A多肽。
在一些实施例中,重组Mg3A多肽是与示例性Mg3A多肽具有指定程 度的氨基酸序列同一性的变体Mg3A多肽,例如与SEQ ID NO:2的氨基酸 序列或与成熟序列SEQ ID NO:3具有至少75%、80%、85%、90%、91%、 92%、93%、94%、95%、96%、97%、98%、或甚至至少99%的序列同一 性。序列同一性可例如使用诸如BLAST、ALIGN或CLUSTAL之类的程序 (如本文所述)通过氨基酸序列比对来测定。
在某些实施例中,重组Mg3A多肽以重组方式产生于微生物中,例如 产生于细菌或真菌宿主生物体中,而在其他实施例中,Mg3A多肽以合成 方式产生,或者从天然来源(例如,稻瘟病菌)中纯化获得。
在某些实施例中,重组Mg3A多肽包含不会实质上影响多肽的结构和/ 或功能的置换。这些置换的例子是保守突变,如表I中所概述。
表I.氨基酸置换
涉及天然存在的氨基酸的置换一般是通过使编码重组Mg3A多肽的核 酸突变,然后在生物体中表达变体多肽来进行。涉及非天然存在的氨基酸 的置换或氨基酸的化学修饰一般是在由生物体合成Mg3A多肽后通过以化 学方式对所述多肽进行修饰来实现。
在一些实施例中,变体重组Mg3A多肽与SEQ ID NO:2或SEQ ID NO: 3实质上相同,表明其不包含不会显著影响多肽的结构、功能或表达的氨基 酸置换、插入或缺失。此类变体重组Mg3A多肽将包括设计用于避开本描 述的多肽。在一些实施例中,变体重组Mg3A多肽、包含这些变体的组合 物和方法与SEQ ID NO:2或SEQ ID NO:3实质上并不相同,但在某些情况 下包括实质上影响本文所述的多肽的结构、功能或表达的氨基酸置换、插 入或缺失,使得与SEQ ID NO:2或SEQ ID NO:3的多肽相比,可实现改善 的特性,包括例如,水解木素纤维素底物的改善的比活性、在所需的宿主 生物体中的改善的表达、改善的热稳定性、pH稳定性等。
在一些实施例中,重组Mg3A多肽(包括其变体)具有β-葡糖苷酶活 性。β-葡糖苷酶活性可使用本文所述的测定法(例如,实例2中所述的那 些)或通过本领域已知的其他测定法来测定和测量。
重组Mg3A多肽包括“全长”Mg3A多肽中保留β-葡糖苷酶活性的片 段。优选地,那些功能性片段(即,保留β-葡糖苷酶活性的片段)为至少 100个氨基酸残基长(例如,至少100个氨基酸残基长、至少120个氨基酸 残基长、至少140个氨基酸残基长、至少160个氨基酸残基长、至少180 个氨基酸残基长、至少200个氨基酸残基长、至少220个氨基酸残基长、 至少240个氨基酸残基长、至少260个氨基酸残基长、至少280个氨基酸 残基长、至少300个氨基酸残基长、至少320个氨基酸残基长,或至少350 个氨基酸残基长或更长)。这些片段适当地保留全长前体多肽或全长成熟 多肽的活性位点,但可具有非关键性氨基酸残基的缺失。这些片段的活性 可使用本文所述的测定法(例如,在实例2中描述的那些)或通过本领域 已知的其他测定法容易地测定。
在一些实施例中,Mg3A氨基酸序列和衍生物作为N和/或C端融合蛋 白而产生,例如以有助于提取、检测和/或纯化和/或向Mg3A多肽增加功能 性质。融合蛋白伴侣的例子包括但不限于谷胱甘肽S-转移酶(GST)、 6XHis、GAL4(DNA结合和/或转录激活结构域)、FLAG、MYC标签或 本领域技术人员已知的其他标签。在一些实施例中,在融合蛋白伴侣与所 关注的多肽序列之间提供蛋白水解裂解位点,以允许移除融合序列。合适 地,融合蛋白不妨碍重组Mg3A多肽的活性。在一些实施例中,将重组 Mg3A多肽融合至功能结构域,其包括前导肽、前肽、结合结构域和/或催 化结构域。融合蛋白任选地通过接头序列连接至重组Mg3A多肽,所述接 头序列接合Mg3A多肽和融合结构域而不明显影响任一组分的性质。所述 接头任选地在功能上促进预期应用。
本公开提供经工程改造以表达本公开的一种或多种Mg3A多肽的宿主 细胞。合适的宿主细胞包括任何微生物的细胞(例如,细菌、原生生物、 藻类、真菌(例如,酵母或丝状真菌)或其他微生物的细胞),并且优选 地是细菌、酵母或丝状真菌的细胞。
合适的细菌菌属的宿主细胞包括但不限于埃希杆菌属(Escherichia)、芽 孢杆菌属(Bacillus)、乳酸杆菌属(Lactobacillus)、假单胞菌属(Pseudomonas) 和链霉菌属(Streptomyces)的细胞。合适的细菌菌种的细胞包括但不限于大 肠杆菌、枯草芽孢杆菌、地衣芽孢杆菌(Bacillus licheniformis)、短乳杆菌 (Lactobacillus brevis)、铜绿假单胞菌(Pseudomonas aeruginosa)和变铅青链霉 菌的细胞。
合适的酵母菌属的宿主细胞包括但不限于酵母属(Saccharomyces)、裂 殖酵母属(Schizosaccharomyces)、假丝酵母属(Candida)、汉逊酵母属 (Hansenula)、毕赤酵母属、克鲁维酵母菌属(Kluyveromyces)和法夫酵母属 (Phaffia)的细胞。合适的酵母菌种的细胞包括但不限于酿酒酵母、粟酒裂殖 酵母(Schizosaccharomyces pombe)、白假丝酵母(Candida albicans)、多形汉 逊酵母(Hansenula polymorpha)、巴斯德毕赤酵母(Pichia pastoris)、加拿大 毕赤酵母(P.canadensis)、马克斯克鲁维酵母(Kluyveromyces marxianus)和红 法夫酵母(Phaffia rhodozyma)的细胞。
丝状真菌的合适宿主细胞包括真菌亚门的全部丝状形式。合适的丝状 真菌属的细胞包括但不限于支顶孢属(Acremonium)、曲霉属(Aspergillus)、 短梗霉属(Aureobasidium)、黑管菌属(Bjerkandera)、拟蜡菌属 (Ceriporiopsis)、金孢属(Chrysoporium)、鬼伞属(Coprinus)、革盖菌属 (Coriolus)、棒囊壳属(Corynascus)、毛壳菌属(Chaertomium)、隐球酵母属 (Cryptococcus)、线黑粉酵母属(Filobasidium)、镰孢属(Fusarium)、赤霉菌属 (Gibberella)、腐质霉属(Humicola)、稻瘟菌属(Magnaporthe)、毛霉菌属 (Mucor)、毁丝菌属(Myceliophthora)、毛霉菌属、新美鞭菌属 (Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属 (Penicillium)、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属 (Piromyces)、侧耳属(Pleurotus)、柱顶孢属(Scytaldium)、裂褶菌属 (Schizophyllum)、孢子丝菌属(Sporotrichum)、篮状菌属(Talaromyces)、嗜热 子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、 栓菌属(Trametes)和木霉属的细胞。
合适的丝状真菌菌种的细胞包括但不限于泡盛曲霉(Aspergillus awamori)、烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillus foetidus)、日 本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉、米 曲霉、鲁克文金孢子菌(Chrysosporium lucknowense)、杆孢状镰孢(Fusarium bactridioides)、谷类镰孢(Fusarium cerealis)、克地镰刀菌(Fusarium crookwellense)、黄色镰孢菌(Fusarium culmorum)、禾谷镰孢菌(Fusarium graminearum)、禾赤镰孢菌(Fusarium graminum)、异孢镰刀菌(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖孢镰孢菌(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢菌(Fusarium roseum)、接骨木镰刀菌(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰刀菌(Fusarium sporotrichioides)、硫色镰刀菌 (Fusarium sulphureum)、念珠镰孢菌(Fusarium torulosum)、拟丝孢镰刀菌 (Fusarium trichothecioides)、镶片镰孢霉(Fusarium venenatum)、烟管菌 (Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、干拟蜡菌、 Ceriporiopsis caregiea、浅黄拟蜡菌(Ceriporiopsis gilvescens)、Ceriporiopsis pannocinta、环带拟蜡菌(Ceriporiopsis rivulosa)、浅红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsis subvermispora)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、特异腐质霉(Humicola insolens)、柔 毛腐质霉(Humicola lanuginosa)、米黑毛霉(Mucor miehei)、嗜热毁丝霉 (Myceliophthora thermophila)、粗糙脉孢菌(Neurospora crassa)、间型脉孢菌 (Neurospora intermedia)、产紫青霉菌(Penicillium purpurogenum)、变灰青霉 (Penicillium canescens)、离生青霉(Penicillium solitum)、绳状青霉 (Penicillium funiculosum)、黄孢原毛平革菌(Phanerochaete chrysosporium)、 射脉齿菌(Phlebia radiate)、杏鲍菇(Pleurotus eryngii)、黄色蠕形霉 (Talaromyces flavus)、太瑞斯梭孢壳霉(Thielavia terrestris)、长绒毛栓菌 (Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉以及绿色木霉(Trichoderma viride)的细胞。
将核酸转化到这些生物体中的方法是本领域已知的。例如,转化曲霉 属宿主细胞的合适工序描述于EP 238 023中。
在一些实施例中,重组Mg3A多肽融合至信号肽,以例如促进重组 Mg3A多肽的细胞外分泌。例如,在某些实施例中,信号肽由选自SEQ ID NO:13-42的序列编码。在具体实施例中,重组Mg3A多肽作为分泌的多肽 在异源生物体中表达。本文中的组合物和方法因此涵盖在异源生物体中表 达作为分泌的多肽的Mg3A多肽的方法。在一些实施例中,重组Mg3A多 肽在异源生物体细胞内表达,例如当异源生物体是诸如酿酒酵母或运动发 酵单胞菌的产乙醇微生物时。在这些情况下,可使用基因工程工具将纤维 二糖(cellibiose)转运体基因引入生物体中,从而使Mg3A多肽作用于该生物 体内的纤维二糖底物以将纤维二糖转化为D-葡萄糖,随后D-葡萄糖由生物 体代谢或转化为乙醇。
本公开还提供了包含上述核酸的表达盒和/或载体。合适地,编码本公 开的Mg3A多肽的核酸有效连接到启动子。启动子是本领域所熟知的。在 宿主细胞内发挥功能的任何启动子均可以用于表达本公开的β-葡糖苷酶和/ 或任何其他核酸。可用于在多种宿主细胞中驱动本公开的β-葡糖苷酶核酸 和/或任何其他核酸表达的起始控制区域或启动子数量繁多并且是本领域技 术人员熟悉的(参见,例如WO 2004/033646和其中引用的参考文献)。事 实上可以使用能够驱动这些核酸的任何启动子。
具体地,在期望在丝状真菌宿主中进行重组表达的情况下,该启动子 可以是丝状真菌启动子。核酸可以处于例如异源启动子的控制下。核酸还 可以在组成型或诱导型启动子控制下表达。可使用的启动子的例子包括但 不限于纤维素酶启动子、木聚糖酶启动子、1818启动子(此前通过对木霉 属进行EST作图鉴定为高表达的蛋白质)。例如,该启动子可以合适地为 纤维二糖水解酶、内切葡聚糖酶或β-葡糖苷酶启动子。尤其合适的启动子 可以为例如里氏木霉纤维二糖水解酶、内切葡聚糖酶或β-葡糖苷酶启动 子。例如,该启动子是纤维二糖水解酶I(cbh1)启动子。启动子的非限制性 例子包括cbh1、cbh2、egl1、egl2、egl3、egl4、egl5、pki1、gpd1、xyn1或 xyn2启动子。启动子的额外非限制性例子包括里氏木霉的cbh1、cbh2、 egl1、egl2、egl3、egl4、egl5、pki1、gpd1、xyn1或xyn2启动子。
编码本文的Mg3A多肽的核酸序列可包含于载体中。在一些方面,载 体含有在表达控制序列的控制下编码Mg3A多肽的核酸序列。在一些方 面,表达控制序列是天然表达控制序列。在一些方面,表达控制序列是非 天然表达控制序列。在一些方面,载体包含选择标记或可选标记。在一些 方面,将编码Mg3A多肽的核酸序列整合到宿主细胞的染色体中而不具有 可选标记。
合适的载体是与所采用的宿主细胞相容的那些。合适的载体可源自例 如细菌、病毒(诸如细菌噬菌体T7或源自M-13的噬菌体)、粘粒、酵母 或植物。合适的载体可以在宿主细胞中以低、中或高拷贝数维持。获得和 使用这些载体的方案是本领域的技术人员已知的(参见例如,Sambrook et al.,Molecular Cloning:A Laboratory Manual,2nd ed.,Cold Spring Harbor,1989 (Sambrook等人,《分子克隆:实验室指南》,第2版,冷泉港出版社, 1989年))。
在一些方面,表达载体还包括终止序列。终止控制区域还可源自宿主 细胞中天然存在的多种基因。在一些方面,终止序列和启动子序列源自相 同来源。
可使用标准技术将编码Mg3A多肽的核酸序列引入诸如表达载体的载 体中(Sambrook et al.,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor,1982(Sambrook等人,《分子克隆:实验室指南》,冷泉港出版 社,1982年))。
在一些方面,可能想要以远高于天然存在细胞中当前存在的水平来过 表达本公开中所述的Mg3A多肽和/或一种或多种任何其他核酸。在一些实 施例中,可能想要以远低于天然存在细胞中当前存在的水平来低表达(例 如,突变、失活或缺失)本公开中所述的内源性β-葡糖苷酶和/或一种或多 种任何其他核酸。
B.Mg3a多核苷酸
本文所述组合物和方法的另一方面是编码具有β-葡糖苷酶活性的重组 Mg3A多肽(包括其变体和片段)的多核苷酸或核酸序列。在一些实施例 中,在用于引导Mg3A多肽在异源生物体(诸如,本文指出的异源生物 体)中表达的表达载体的上下文中提供多核苷酸。编码重组Mg3A多肽的 多核苷酸可以有效连接至调控元件(例如启动子、终止子、增强子等)以 帮助表达编码的多肽。
编码重组Mg3A多肽的多核苷酸序列的一个例子具有SEQ ID NO:1的 核苷酸序列。相似的(包括实质上相同的)编码重组Mg3A多肽和变体的 多核苷酸可存在于自然界,例如,存在于稻瘟病菌或稻瘟菌属物种的其他 菌株或分离株中。鉴于遗传密码的简并性,应当理解具有不同核苷酸序列 的多核苷酸可编码相同的Mg3A多肽、变体或片段。
在一些实施例中,编码重组Mg3A多肽的多核苷酸与编码Mg3A多肽 的示例性多核苷酸具有指定程度的氨基酸序列同一性,例如与SEQ ID NO: 2的氨基酸序列具有至少85%、至少86%、至少87%、至少88%、至少 89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少 95%、至少96%、至少97%、至少98%或甚至至少99%的序列同一性。同 源性可例如使用诸如BLAST、ALIGN或CLUSTAL之类的程序(如本文所 述)通过氨基酸序列比对来测定。
在一些实施例中,编码重组Mg3A多肽的多核苷酸框内融合于用于引 导重组Mg3A多肽的细胞外分泌的信号肽的编码序列之后(即下游)。如 本文所述,术语“异源”当用来指代用于表达所关注的多肽的信号序列 时,其意指该信号序列和所关注的多肽来源于不同的生物体。异源信号序 列包括例如那些来自其他真菌纤维素酶基因的信号序列,例如里氏木霉 Bgl1的SEQ ID NO:13的信号序列。可在适于表达重组Mg3A多肽或适于 在将表达载体引入合适宿主细胞之前使表达载体增殖的异源宿主细胞中提 供表达载体。
在一些实施例中,编码重组Mg3A多肽的多核苷酸与SEQ ID NO:1的 多核苷酸(或其互补序列)在指定杂交条件下杂交。条件的例子是本文所 述的中等严格性、高严格性和极高严格性条件。
Mg3A多核苷酸可为天然存在或合成的(即人造的),并且可经过密 码子优化以在不同宿主中表达、经过突变以引入克隆位点或以其他方式改 变以增加功能性。
C.Mg3A载体和宿主细胞
为了产生所公开的重组Mg3A多肽,编码该多肽的DNA可由已公布 的序列通过化学方式合成或可直接得自具有相应基因的宿主细胞(例如, 通过cDNA文库筛选或PCR扩增)。在一些实施例中,将Mg3A多核苷酸 包含在表达盒中和/或通过标准分子克隆技术克隆到合适的表达载体中。此 类表达盒或载体包含有助于转录起始和终止的序列(例如,启动子和终止 子),并通常还可包含一种或多种可选标记。
将表达盒或载体引入合适的表达宿主细胞,该宿主细胞然后表达相应 的Mg3A多核苷酸。合适的表达宿主可为细菌或真菌微生物。细菌表达宿 主可为例如埃希氏菌属(例如大肠杆菌)、假单胞菌属(例如荧光假单胞 菌(P.fluorescens)或斯氏假单胞菌(P.stutzere))、变形杆菌属(Proteus)(例 如奇异变形杆菌(Proteus mirabilis))、罗尔斯通菌属(Ralstonia)(例如富养 罗尔斯通氏菌(Ralstonia eutropha))、链霉菌属、葡萄球菌属 (Staphylococcus)(例如肉葡萄球菌(S.carnosus))、乳球菌属(Lactococcus) (例如乳酸乳球菌(L.lactis))或芽孢杆菌属(例如,枯草芽孢杆菌、巨大 芽孢杆菌(Bacillus megaterium)、地衣芽孢杆菌等)。真菌表达宿主可为例 如酵母,酵母还可用作产乙醇生物。酵母表达宿主可为例如酿酒酵母、粟 酒裂殖酵母、解脂耶氏酵母(Yarrowia lipolytica)、多形汉逊酵母、乳酸克鲁 维酵母(Kluyveromyces lactis)或巴斯德毕赤酵母。真菌表达宿主还可为例如 丝状真菌宿主,包括黑曲霉、鲁克文金孢子菌、嗜热毁丝霉、曲霉属(例 如,米曲霉、黑曲霉、构巢曲霉等)或里氏木霉。同样合适的是哺乳动物 表达宿主,例如小鼠(例如NS0)、中国仓鼠卵巢(CHO)或幼仓鼠肾(BHK) 细胞系。其他真核宿主诸如昆虫细胞或病毒表达系统(例如,细菌噬菌 体,诸如M13、T7噬菌体或λ噬菌体,或病毒,诸如杆状病毒)也适用于 产生Mg3A多肽。
在所关注的特定宿主中与分泌蛋白相关的启动子和/或信号序列是用于 在该宿主或其他宿主中进行Mg3A多肽的异源产生和分泌的候选物。例 如,在丝状真菌系统中,驱动纤维二糖水解酶I(cbh1)、葡糖淀粉酶A (glaA)、TAKA-淀粉酶(amyA)、木聚糖酶(exlA)、gpd-启动子cbh1、cbhll、 内切葡聚糖酶基因eg1-eg5、Cel61B、Cel74A、gpd启动子、Pgk1、pki1、 EF-1α、tef1、cDNA1和hex1的基因的启动子是合适的并可来源于许多不同 的生物体(例如黑曲霉、里氏木霉、米曲霉、泡盛曲霉和构巢曲霉)。
在一些实施例中,Mg3A多核苷酸与编码合适的同源或异源信号序列 (导致重组Mg3A多肽分泌到细胞外(或周质)空间)的多核苷酸重组相 关,从而允许直接在细胞上清液(或周质空间或裂解物)中检测酶活性。 对于本领域已知的大肠杆菌、其他革兰氏阴性菌和其他生物体,合适的信 号序列包括驱动HlyA、DsbA、Pbp、PhoA、PelB、OmpA、OmpT或M13 噬菌体Gill基因表达的那些序列。对于本领域已知的枯草芽孢杆菌、革兰 氏阳性生物体和其他生物体,合适的信号序列还包括驱动AprE、NprB、 Mpr、AmyA、AmyE、Blac、SacB表达的那些序列,并且对于酿酒酵母或 其他酵母,包括杀伤毒素、Bar1、Suc2、交配因子α、Inu1A或Ggplp信号 序列。信号序列可通过多种信号肽酶裂解,从而将它们从所表达的蛋白质 的其余部分移除。真菌表达信号序列可为选自例如本文的SEQ ID NO:13- 37的序列。酵母表达信号序列可为选自例如SEQ ID NO:38-40的序列。可 适用于在运动发酵单胞菌中表达本发明的Mg3A多肽的信号序列可包括例 如选自SEQ ID NO:41-42的序列。(Linger J.G.et al.,(2010)Appl.Environ. Microbiol.76(19):6360-6369(Linger J.G.等人,2010年,《应用与环境微生 物学》,第76卷,第19期,第6360-6369页))。
在一些实施例中,重组Mg3A多肽单独地或作为与位于N或C端的其 他肽、标签或蛋白(例如6XHis、HA或FLAG标签)的融合体而表达。合 适的融合体包括有利于亲和纯化或检测的标签、肽或蛋白(例如,6XHis、 HA、甲壳质结合蛋白、硫氧还蛋白或FLAG标签),以及有利于靶标β-葡 糖苷酶的表达、分泌或加工的那些。合适的加工位点包括肠激酶、STE13、 Kex2或用于体内或体外裂解的其他蛋白酶裂解位点。
将Mg3A多核苷酸通过多种转化方法引入表达宿主细胞,这些方法包 括但不限于电穿孔、脂质辅助转化或转染(“脂质转染”)、化学介导转 染(例如CaCl和/或CaP)、醋酸锂介导的转化(例如,宿主细胞原生质体 的转化)、生物弹射“基因枪”转化、PEG介导的转化(例如,宿主细胞 原生质体的转化)、原生质体融合(例如使用细菌或真核细胞原生质 体)、脂质体介导的转化、根癌农杆菌(Agrobacterium tumefaciens)、腺病毒 或其他病毒或噬菌体转化或转导。
D.细胞培养基
一般来讲,将微生物在适用于产生本文所述的Mg3A多肽的细胞培养 基中培养。培养使用本领域已知的步骤和变化在合适的营养培养基中进 行,所述培养基包含碳源和氮源及无机盐。适于生长和纤维素酶产生的培 养基、温度范围和其他条件是本领域已知的。作为非限制性例子,通过里 氏木霉制备纤维素酶的典型温度范围为24℃至37℃,例如,介于25℃与 30℃之间。
1.细胞培养条件
适于真菌培养物的维持和生长的材料和方法是本领域所熟知的。在一 些方面,将细胞在容许由插入宿主细胞内的核酸所编码的一种或多种β-葡 糖苷酶多肽表达的条件下在培养基中培养。可以使用标准细胞培养条件来 培养细胞。在一些方面,将细胞在合适的温度、气体混合物和pH培育和维 持。在一些方面,在合适的细胞培养基中培育细胞。
IV.Mg3A的活性
本文所公开的重组Mg3A多肽具有β-葡糖苷酶活性或者能够水解纤维 二糖并且从中释放D-葡萄糖。在相同的糖化条件下,与里氏木霉的基准高 保真性β-葡糖苷酶Bgl1相比,本文的Mg3A多肽具有更高的β-葡糖苷酶活 性以及改善或增强的从纤维二糖释放D-葡萄糖的能力。在一些实施例中, 与黑曲霉的另一基准β-葡糖苷酶B-glu相比,本文的Mg3A多肽具有更高 的β-葡糖苷酶活性和/或改善或增强的从纤维二糖释放D-葡萄糖的能力。
如实例3所示,与里氏木霉Bgl1相比,重组Mg3A多肽具有高至少约 5%、至少约10%、优选地至少约15%、更优选地至少约20%的水解氯-硝 基-苯基-葡糖苷(CNPG)底物的活性。在一些实施例中,与黑曲霉B-glu相 比,重组Mg3A多肽具有高至少约2倍、至少约5倍、至少约7倍、优选 地至少约9倍、更优选地至少约10倍的水解CNPG底物的活性。
与里氏木霉Bgl1相比,重组Mg3A多肽具有显著改善或增强的纤维二 糖酶活性,例如高至少约30%、更优选地高至少约40%、优选地高至少约 50%、更优选地高至少55%、优选地高至少60%、甚至更优选地高至少约 65%、优选地高至少约70%、更优选地高至少约75%、以及最优选地高至 少80%的纤维二糖酶活性,纤维二糖酶活性可量度酶催化纤维二糖水解并 释放D-葡萄糖的能力。在一些实施例中,与黑曲霉B-glu相比,重组 Mg3A多肽具有约1/2、约1/3、约1/4、约1/5或甚至约1/6的催化纤维二 糖水解并释放D-葡萄糖的能力。
在一些实施例中,与里氏木霉Bgl1相比,重组Mg3A多肽具有降低约 10%、降低约20%、降低约30%、或甚至降低约40%的对于CNPG/纤维二 糖的水解活性比率。在一些实施例中,与黑曲霉B-glu相比,Mg3A多肽具 有高约2倍、约5倍、约7倍、约10倍、约15倍或甚至约20倍的对于 CNPG/纤维二糖的相对水解活性比率。
如实例4所示,与里氏木霉Bgl1相比,重组Mg3A多肽从磷酸溶胀纤 维素底物产生更多的葡萄糖但是等量或更少量的总糖。
如实例5所示,与里氏木霉Bgl1相比,重组Mg3A多肽还从稀氨水预 处理的玉米秸秆底物产生更多的葡萄糖但是等量或更少量的总糖。
如实例6所示,与里氏木霉Bgl1相比,重组Mg3A多肽在葡聚糖转化 方面更有效,并且在较高水解反应温度55℃下从稀氨水预处理的玉米秸秆 底物产生更多的葡萄糖。在高于50℃的温度下,观察到里氏木霉Bgl1赋予 较差β-葡糖苷酶性能,这归因于因较差热稳定性所致的酶活性丧失。相比 之下,虽然里氏木霉Bgl1的所测量的解链温度(Tm)比Mg3A高约10℃,但 令人惊讶地观察到在高达55℃的糖化温度下Mg3A活性和性能仍然完好无 损。Mg3A的该热稳定性和高温性能有益效果使其成为特别适于生物质转 化的β-葡糖苷酶。
V.包含重组β-葡糖苷酶Mg3A多肽的组合物
本公开提供了工程化酶组合物(例如,纤维素酶组合物)或富含重组 Mg3A多肽的发酵液。在一些方面,该组合物是纤维素酶组合物。该纤维 素酶组合物可以是,例如,丝状真菌纤维素酶组合物,诸如木霉纤维素酶 组合物。在一些方面,该组合物是包含编码一种或多种纤维素酶多肽的一 种或多种核酸的细胞。在一些方面,该组合物是包含纤维素酶活性的发酵 液,其中所述发酵液能够将生物质样品中存在的超过约50重量%的纤维素 转化成糖。如本文所用,术语“发酵液”和“全发酵液”是指通过工程化 微生物的发酵制备的酶制剂,该酶制剂在发酵之后不经历或经历最小限度 的回收和/或纯化。发酵液可为丝状真菌的发酵液,例如,木霉属、腐质霉 属、镰孢属、曲霉属、脉孢菌属、青霉属、头孢霉属(Cephalosporium)、绵 霉属(Achlya)、柄孢壳菌属(Podospora)、内座壳属(Endothia)、毛霉菌属、 旋孢腔菌属(Cochliobolus)、梨孢属(Pyricularia)、毁丝菌属或金孢子菌属 (Chrysosporium)发酵液。具体地讲,发酵液可为例如木霉属物种诸如里氏 木霉,或青霉属物种诸如绳状青霉。发酵液还可以适当地为无细胞发酵 液。在一个方面,本发明的任何纤维素酶、细胞、或发酵液组合物还可以 包含一种或多种半纤维素酶。
在一些方面,该全发酵液组合物在里氏木霉或其工程化菌株中表达。 在一些方面,该全发酵液在里氏木霉的整合型菌株中表达,其中包含 Mg3A多肽的多种纤维素酶已经被整合到里氏木霉宿主细胞的基因组中。 在一些方面,在整合型里氏木霉菌株中表达的多肽的一种或多种组分已被 缺失。
在一些方面,该全发酵液组合物在黑曲霉或其工程化菌株中表达。
作为另一种选择,重组Mg3A多肽可在细胞内表达。任选地,在酶变 体在细胞内表达或利用诸如上述那些的信号序列分泌到周质空间后,可采 用透化或裂解步骤使重组Mg3A多肽释放到上清液中。膜屏障的破坏通过 使用机械手段诸如超声波、加压处理(弗氏压碎器)、空化或通过使用膜 消化酶诸如溶菌酶或酶混合物而实现。该实施例的变型形式包括重组 Mg3A多肽在产乙醇微生物细胞内的表达。例如,纤维二糖转运体可通过 基因工程引入同一产乙醇微生物中,使得从木素纤维素生物质的水解产生 的纤维二糖可被转运到产乙醇生物体中,并且可在所述生物体中水解并转 化为D-葡萄糖,D-葡萄糖可继而被产乙醇生物代谢。
在一些方面,使用合适的无细胞表达系统表达编码重组Mg3A多肽的 多核苷酸。在无细胞系统中,通常将所关注的多核苷酸在启动子帮助下转 录,但任选进行连接以形成环状表达载体。在一些实施例中,以外源方式 添加或生成RNA而不进行转录,然后在无细胞系统中翻译。
VI.使用Mg3A多肽来水解木素纤维素生物质底物
在一些方面,本文提供了用于将木素纤维素生物质转化为糖的方法, 该方法包括使生物质底物与本文公开的组合物接触,所述组合物包含能有 效地将生物质底物转化成可发酵糖的量的Mg3A多肽。在一些方面,该方 法还包括用酸和/或碱和/或机械手段或其他物理手段预处理生物质。在一些 方面,酸包括磷酸。在某些方面,碱包括氢氧化钠或氨。在一些方面,机 械手段可包括例如牵拉、挤压、压碎、研磨,以及将木素纤维素生物质物 理地分解成更小的物理形式的其他手段。其他物理手段还可包括例如使用 蒸汽或其他加压烟气或蒸气“解开”木素纤维素生物质以便增加酶对纤维 素和半纤维素的可及性。在某些实施例中,预处理方法还可涉及能够分解 木素纤维素生物质底物中的木质素的酶,从而使得生物质水解酶组合物中 的酶对生物质的纤维素和半纤维素的可及性增加。
生物质:本公开提供了使用包含Mg3A多肽的本公开酶组合物进行生 物质糖化的方法和过程。如本文所用,术语“生物质”是指包含纤维素和/ 或半纤维素的任何组合物(任选地还有木素纤维素生物质材料中的木质 素)。如本文所用,生物质包括但不限于种子、谷粒、块茎、植物废料 (诸如,棕榈树空果串或棕榈纤维废料)或食品加工或工业加工的副产物 (例如,茎秆)、玉米(包括例如,玉米芯、秸秆等等)、草料(包括例 如,印度草,诸如黄假高粱(Sorghastrum nutans);或者柳枝稷(例如,黍属 (Panicum)物种,诸如柳枝稷(Panicum virgatum))、多年生木质茎(例如, 芦竹)、木材(包括例如,木屑、加工废料)、纸材、纸浆和回收纸(包括 例如,报纸、打印纸等等)。其他生物质材料包括但不限于马铃薯、大豆 (例如油菜籽)、大麦、黑麦、燕麦、小麦、甜菜和甘蔗渣。
本公开因而提供糖化方法,所述方法包括使包含生物质材料(例如, 包含木聚糖、半纤维素、纤维素和/或可发酵糖的材料)的组合物与本公开 的Mg3A多肽,或本公开核酸或多核苷酸编码的Mg3A多肽,或本公开的 任何一种包含Mg3A多肽的纤维素酶或非天然存在的半纤维素酶组合物或 制造产物接触。
糖化的生物质(例如由本公开的酶加工的木素纤维素材料)可以通过 诸如微生物发酵和/或化学合成的过程制成众多基于生物的产品。如本文所 用,“微生物发酵”是指在合适的条件下培养和收获发酵微生物的过程。 发酵微生物可以是适用于生产基于生物的产品所需的发酵过程的任何微生 物。合适的发酵微生物包括但不限于丝状真菌、酵母和细菌。通过发酵和/ 或化学合成,可例如将经糖化的生物质制成燃料(例如,生物燃料,诸如 生物乙醇、生物丁醇、生物甲醇、生物丙醇、生物柴油、喷气燃料等)。 通过发酵和/或化学合成,还可例如将经糖化的生物质制成日用化学品(例 如,抗坏血酸、异戊二烯、1,3-丙二醇)、脂质、氨基酸、多肽和酶。
预处理:在进行糖化或酶水解和/或对从糖化获得的可发酵糖进行发酵 之前,生物质(例如,木素纤维素材料)优选地进行一个或多个预处理步 骤以使得木聚糖、半纤维素、纤维素和/或木质素材料对于酶组合物(例 如,包含Mg3A多肽的本发明酶组合物)中的酶更可触及或更敏感,并且 因此更易于被酶和/或酶组合物水解。
在一些方面,合适的预处理方法可涉及在反应器中对生物质材料使用 包含强酸和金属盐的稀溶液的催化剂。该生物质材料可以是,例如,原材 料或干燥材料。这种预处理可以降低纤维素水解的活化能或温度,最终允 许可发酵糖的更高产量。参见例如,美国专利No.6,660,506;No. 6,423,145。
在一些方面,合适的预处理方法可涉及使生物质材料在含水介质中在 所选择的温度和压力下经历第一水解步骤,以便主要实现半纤维素的解 聚,而不实现纤维素显著解聚为葡萄糖。这个步骤产生浆液,在所述浆液 中液态水相包含因半纤维素解聚产生的溶解单糖,以及包含纤维素和木质 素的固相。随后该浆液在允许主要部分的纤维素解聚的条件下经历第二水 解步骤,产生包含纤维素的溶解/可溶解解聚产物的液态水相。参见例如, 美国专利No.5,536,325。
在其他方面,合适的预处理方法可涉及使用约0.4%至约2%的强酸, 通过一个或多个阶段的稀酸水解来处理生物质材料;随后使用碱性脱木质 法处理酸水解材料的未反应固态木素纤维素组分。参见例如,美国专利No. 6,409,841。
在其他方面,合适的预处理方法可涉及在预水解反应器中预水解生物 质(例如,木素纤维素材料);将酸性液体添加至固态木素纤维素材料以 制得混合物;将该混合物加热至反应温度;保持反应温度一段时间,所述 时间足够使木素纤维素材料分解成溶解部分和固体级分,所述溶解部分包 含至少约20%来自木素纤维素材料的木质素,所述固体级分包含纤维素; 将溶解的部分与固体级分分离,并且在反应温度或接近反应温度移出溶解 部分;以及回收溶解部分。固体级分中的纤维素变得更易于进行酶消化。 参见例如,美国专利No.5,705,369。在这个方面的变型形式中,预水解可 另选地或者进一步涉及使用例如能够分解木素纤维素生物质材料中的木质 素的酶来进行预水解。
在其他方面,合适的预处理可涉及过氧化氢H2O2的使用。参见Gould, 1984,Biotech,and Bioengr.26:46-52(Gould,1984年,《生物技术和生物 工程》,第26卷,第46-52页)。
在其他方面,预处理还可以包括使生物质材料与化学计量的量的极低 浓度氢氧化钠和氢氧化铵接触。参见Teixeira et al.,(1999)Appl. Biochem.and Biotech.77-79:19-34(Teixeira等人,1999年,《应用生物化 学与生物技术》,第77-79卷,第19-34页)。
在一些实施例中,预处理可包括使木素纤维素在约9至约14的pH、 适当温度、压力和pH下接触化学品(例如碱,诸如碳酸钠或氢氧化钾)。 参见已公布的国际申请WO2004/081185。氨用于例如优选的预处理方法。 这种预处理方法包括在高固形物含量的条件下使生物质材料
与低浓度的氨接触。参见例如美国专利公布No.20070031918和已公 布的国际申请WO 06110901。
A.糖化过程
在一些方面,本文提供了一种糖化过程,所述过程包括用包含多肽的 酶组合物处理生物质,其中所述多肽具有β-葡糖苷酶活性并且其中所述过 程导致至少约50重量%(例如,至少约55重量%、60重量%、65重量%、 70重量%、75重量%或80重量%)的生物质转化成可发酵糖。在一些方 面,该生物质包含木质素。在一些方面,该生物质包含纤维素。在一些方 面,该生物质包含半纤维素。在一些方面,包含纤维素的生物质还包含木 聚糖、半乳聚糖或阿拉伯聚糖中的一者或多者。在一些方面,生物质可以 为但不限于种子、谷粒、块茎、植物废料(例如,棕榈树空果串或棕榈纤 维废料)或食品加工或工业加工的副产物(例如,茎秆)、玉米(包括例 如,玉米芯、秸秆等等)、草料(包括例如,印度草,诸如黄假高粱;或 柳枝稷(例如,黍属物种,诸如柳枝稷)、多年生木质茎(例如芦竹)、 木材(包括例如,木屑、加工废料)、纸材、纸浆和回收纸(包括例如, 报纸、打印纸等等)、马铃薯、大豆(例如油菜籽)、大麦、黑麦、燕 麦、小麦、甜菜和甘蔗渣。在一些方面,在用多肽处理之前,使包含生物 质的材料经受一种或多种预处理方法/一个或多个预处理步骤。在一些方 面,糖化或酶法水解还包括用包含本发明的Mg3A多肽的酶组合物处理生 物质。除了Mg3A多肽外,酶组合物还可例如包含一种或多种其他纤维素 酶。作为另一种选择,酶组合物可包含一种或多种其他半纤维素酶。在某 些实施例中,酶组合物包含本发明的Mg3A多肽、一种或多种其他纤维素 酶、一种或多种半纤维素酶。在一些实施例中,所述酶组合物是全发酵液 组合物。
在一些方面,提供了包括用包含多肽的组合物处理木素纤维素生物质 材料的糖化过程,其中所述多肽与SEQ ID NO:2具有至少约75%(例如, 至少约75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、 97%、98%、99%)的序列同一性,并且其中所述过程导致至少约50重量% (例如,至少约55重量%、60重量%、65重量%、70重量%、75重量%、 80重量%、85重量%或90重量%)的生物质转化成可发酵糖。在一些方 面,木素纤维素生物质材料已经受如本文所述的一种或多种预处理方法/一 个或多个预处理步骤。
根据前面的描述和以下的实例,本发明组合物和方法的其他方面和实 施例将显而易见。
实例
提供以下实例以论证和说明本公开的某些优选实施例和方面,而不应 该理解为限制。
实例1
1-A.Mg3A和基准里氏木霉Bgl1的基因表达的克隆和表达
1-A-a.里氏木霉bgl1表达载体的构建
将天然里氏木霉β-葡糖苷酶基因bgl1的N端部分进行密码子优化 (DNA 2.0,加利福尼亚州门洛帕克市(Menlo Park,CA))。这种合成的部 分包含该酶编码区的最初447个碱基。随后通过PCR使用引物SK943和 SK941(见下文)扩增这种片段。使用引物SK940和SK942(见下文), 将天然bgl1基因的剩余区域从提取自里氏木霉菌株RL-P37的基因组DNA 样品进行PCR扩增(Sheir-Neiss,G et al.(1984)Appl.Microbiol.Biotechnol. 20:46-53(Sheir-Neiss,G等人,1984年,《应用微生物学和生物技术》, 第20卷,第46-53页))。使用如下引物SK943和SK942,在融合PCR 反应中将bgl1基因的这两个PCR片段融合在一起:
正向引物SK943:(5’–CACCATGAGATATAGAACAGCTGCCGCT-3’) (SEQ ID NO:5)
反向引物SK941:(5’- CGACCGCCCTGCGGAGTCTTGCCCAGTGGTCCCGCGACAG-3’)(SEQ ID NO:6)
正向引物(SK940):(5’- CTGTCGCGGGACCACTGGGCAAGACTCCGCAGGGCGGTCG-3’)(SEQ ID NO:7)
反向引物(SK942):(5’–CCTACGCTACCGACAGAGTG-3’)(SEQ ID NO:8)
将所得的融合PCR片段克隆至
入门载体
(
Entry vector
)(图1),并且转化至大肠杆菌 One
TOP10(E.coli One
TOP10)化学感受态细胞(英杰公司 (Invitrogen)),从而产生中间载体pENTR TOPO-Bgl1(943/942)(图1)。 测定插入DNA的核苷酸序列。将具有正确的bgl1序列的pENTR-943/942 载体与pTrex3g使用LR
反应加以重组(参见英杰公司概述的方 案)。将LR clonase反应混合物转化进大肠杆菌One
TOP10化学感受 态细胞(英杰公司),从而产生表达载体pTrex3g 943/942(图2)。该载 体还包含编码乙酰胺酶的构巢曲霉amdS基因,作为里氏木霉转化的可选标 记。使用引物SK745和SK771(见下文)对表达盒进行PCR扩增以生成用 于转化的产物。
正向引物SK771:(5’–GTCTAGACTGGAAACGCAAC-3’)(SEQ ID NO:9)
反向引物SK745:(5’–GAGTTGTGAAGTCGGTAATCC-3’)(SEQ ID NO:10)
1-A-b.mg3a表达载体的构建
β-葡糖苷酶基因的开放阅读框通过使用从稻瘟病菌提取的基因组DNA 作为模板来进行PCR扩增。使开放阅读框与天然信号序列一起扩增。所用 的PCR热循环仪是DNA Engine Tetrad 2Peltier热循环仪(伯乐实验室 (BioRad Laboratories))。所用的DNA聚合酶是PfuUltra II融合HS DNA聚 合酶(PfuUltra II Fusion HS DNA Polymerase)(Stratagene)或者类似的质量校 正DNA聚合酶。用于扩增开放阅读框的引物如下:
Mg3A-F:5'-CAC CAT GCG TTT CTC CGG GAT CGT-3'(SEQ ID NO:11)
Mg3A-R:5'-TCA GTT CAG GTC AGC ACT CAG ATG GAG C-3'(SEQ ID NO:12)
Mg3A-F正向引物在5’端处包括四个额外的核苷酸(序列–CACC), 以促进定向克隆到pENTR/D-TOPO。使用Qiaquick PCR纯化试剂盒(加利 福尼亚州瓦伦西亚的凯杰公司(Qiagen,Valencia,CA))纯化开放阅读框的 PCR产物。将经纯化的PCR产物克隆到pENTR/D-TOPO载体(英杰公 司),转化进TOP10化学感受态大肠杆菌细胞(加利福尼亚州卡尔斯巴德 的英杰公司(Invitrogen,Carlsbad,CA))并接种在具有50ppm卡那霉素的LA 平板上。使用QIAspin质粒制备试剂盒(凯杰公司(Qiagen))从大肠杆菌转 化体中获得质粒DNA。
使用M13正向引物和反向引物来获得插入pENTR/D-TOPO载体的 DNA的序列数据。根据生产商的说明书,使用LR clonase反应混合物(加 利福尼亚州卡尔斯巴德的英杰公司)将具有正确的开放阅读框DNA序列的 pENTR/D-TOPO载体与pTrex3gM目的载体(图2)重组。
随后将LR clonase反应的产物转化进TOP10化学感受态大肠杆菌细 胞,然后将这些细胞接种在含有50ppm羧苄青霉素的LA上。所得的 pExpression构建体是含有Mg3A开放阅读框和塔宾曲霉(Aspergillus tubingensis)乙酰胺酶选择标记(amdS)的pTrex3gM。使用Qiagen小量提取试 剂盒分离pExpression构建体的DNA并且将该DNA用于里氏木霉的转化。
使用如下所述的细微修改的PEG介导的原生质体方法将pExpression 质粒或表达盒的PCR产物转化到里氏木霉六重缺失菌株(参见例如,已公 布的国际专利申请公布No.WO 2010/141779中的描述)。对于原生质体制 备,将孢子于24℃在木霉属基本培养基MM中以150rpm振荡培育16-24 小时,该培养基包含20g/L葡萄糖、15g/L KH2PO4(pH 4.5)、5g/L (NH4)2SO4、0.6g/L MgSO4×7H2O、0.6g/L CaCl2×2H2O、1mL的1000X里氏 木霉微量元素溶液(其包含5g/L FeSO4×7H2O、1.4g/L ZnSO4×7H2O、 1.6g/L MnSO4×H2O、3.7g/L CoCl2×6H2O)。通过离心收集正在萌发的孢子 并且使用50mg/mL的Glucanex G200(诺维信公司(Novozymes AG))溶液 进行处理以裂解真菌细胞壁。对原生质体的进一步制备根据
et al. (1987)Gene 61:155-164(
等人,1987年,《基因》,第61卷,第 155-164页)所述的方法进行。在200μL总体积中包含约1μg DNA和1- 5×107原生质体的转化混合物各自用2mL的25%PEG溶液处理,用2体积 的1.2M山梨醇/10mM Tris(pH7.5),10mM CaCl2稀释,与包含5mM尿苷 和20mM乙酰胺的3%选择性顶层琼脂糖MM混合。将所得的混合物倾倒 于包含尿苷和乙酰胺的2%选择性琼脂糖平板上。在选取单一转化体到包含 尿苷和乙酰胺的新鲜MM平板上之前,将平板在28℃进一步孵育7-10天。 使用来自独立克隆的孢子在摇瓶中接种发酵培养基。
发酵培养基为36mL包含葡萄糖/槐糖和2g/L尿苷的限定液体培养基, 例如甘氨酸基本培养基(6.0g/L甘氨酸;4.7g/L(NH4)2SO4;5.0g/L KH2PO4;1.0g/L MgSO4·7H2O;33.0g/L PIPPS;pH 5.5)并且灭菌后在 250ml Thomson超高产培养瓶(Thomson Ultra Yield Flask)(加利福尼亚州奥 欣赛德的汤姆森仪器有限公司(Thomson Instrument Co.,Oceanside,CA))中 添加作为碳源的约2%葡萄糖/槐糖混合物、10ml/L的100g/L CaCl2、 2.5ml/L里氏木霉微量元素(400X):175g/L无水柠檬酸;200g/L FeSO4·7H2O;16g/L ZnSO4·7H2O;3.2g/L CuSO4·5H2O;1.4g/L MnSO4·H2O;0.8g/L H3BO3。
1-A-c.酵母穿梭载体pSC11的构建
酵母穿梭载体可根据图7的载体图谱构建。该载体可用于在酿酒酵母 细胞内表达Mg3A多肽。可使用已知方法以相同的穿梭载体或单独的载体 将纤维二糖转运体引入酿酒酵母中,所述已知方法为诸如Ha et al.,(2011), PNAS,108(2):504-509(Ha等人,2011年,《美国国家科学院院刊》,第 108卷,第2期,第504-509页)所述的那些方法。
可使用酵母EZ-转化试剂盒进行表达盒的转化。可使用包含20g/L纤维 二糖的YSC培养基选择转化体。可使用特异性引物通过菌落PCR来确定表 达盒被成功引入酵母中。
可根据已知的方法和方案来培养酵母菌株。例如,所述酵母菌株可在 30℃下在含有20g/L葡萄糖的YP培养基(10g/L酵母提取物、20g/L细菌蛋 白胨)中培养。为了使用氨基酸营养缺陷型标记选择转化体,可使用酵母 合成性完全(YSC)培养基,该培养基包含6.7g/L酵母基础氮源,加上20g/L 葡萄糖、20g/L琼脂和CSM-Leu-Trp-Ura,以提供核苷酸和氨基酸。
1-A-d.运动发酵单胞菌整合载体pZC11的构建。
运动发酵单胞菌整合载体pZC11可根据图8的载体图谱进行构建。该 载体可用于在运动发酵单胞菌细胞内表达Mg3A多肽。可以使用将那些转 运体引入细菌细胞中的已知方法,以相同的整合载体或单独的载体将纤维 二糖转运体引入运动发酵单胞菌,所述已知方法为诸如Sekar et al.,(2012) Applied Environmental Microbiology,78(5):1611-1614(Sekar等人,2012 年,《应用环境微生物学》,第78卷,第5期,第1611-1614页)所述的 那些。
可使用各种已知的方法来确定整合载体以及纤维二糖转运体基因的成 功引入,例如通过使用为此目的特别设计的确认引物的PCR来进行确定。
可根据已知方法来培养和发酵运动发酵单胞菌菌株,所述方法为诸如 在美国专利No.7,741,119中所述的那些。
1-B.里氏木霉Bgl1和Mg3A的纯化
里氏木霉Bgl1在六重缺失的里氏木霉宿主菌株的发酵液中过表达并且 从该发酵液纯化(参见,例如在已公布的国际专利申请公布No.WO 2010/141779中的描述)。将浓缩发酵液上样至G25SEC色谱柱(通用电气 医疗生物科学有限公司(GE Healthcare Bio-Sciences))并且与50mM乙酸钠 (pH 5.0)进行缓冲交换。然后将经过缓冲交换的Bgl1上样至填充有氨苄基- S-吡喃葡糖基琼脂糖亲和基质的25mL色谱柱上。在用50mM乙酸钠中的 250mM氯化钠(pH 5.0)充分淋洗后,用50mM乙酸钠和250mM氯化钠中的 100mM葡萄糖(pH 5.0)洗脱结合级分。汇集并浓缩经检测对于氯-硝基-苯基- 葡糖苷(CNPG)活性呈阳性的洗脱级分。对应于SDS-PAGE上里氏木霉Bgl1 的MW并且通过质谱确定的单一条带验证了经洗脱的Bgl1的纯度。最终的 原液浓度通过280nm处的吸光度被确定为2.2mg/mL。
如上所述由里氏木霉表达的Mg3A可以从浓缩的发酵液通过首先稀释 100mg到50mM MES缓冲液(pH 6.0)中来纯化。Mg3A可通过以每毫升树脂 2mg蛋白上样到在pH 6处带电荷的SP Sepharose离子交换树脂(通用电气 医疗集团(GE Healthcare))来富集。然后Mg3A可洗脱在流穿液中。所富集 的Mg3A随后可使用10,000MW截留膜(Vivaspin,通用电气医疗集团)从 原始体积浓缩成小5倍的体积。其他背景组分可以通过以成批模式添加 40%硫酸铵(w/v)来从Mg3A移除。然后在离心之后从上清液中回收纯 Mg3A。随后使用10,000MW截留膜(Vivaspin,通用电气医疗集团),在 50mM MES缓冲液(pH 6.0)中同时透析和浓缩Mg3A。可分别通过氯-硝基- 苯基-葡糖苷测定法和SDS-PAGE来评估Mg3A的活性和纯度。随后可使用 7,000MW截留膜透析盒(皮尔斯公司(PIERCE)),用50mM MES、100mM NaCl缓冲液(pH 6.0)对上清液充分透析。最后一批Mg3A的活性可用氯-硝 基-苯基-葡糖苷测定法来确定。可通过二辛可宁酸测定法(皮尔斯公司)以 及通过在280nm波长处使用由GPMAW v 7.0计算出的摩尔消光系数进行吸 光度测定来确定浓度。
实例2:各种测定法
2-A通过UPLC进行蛋白质浓度测量
使用Agilent HPLC 1290Infinity系统和Waters ACQUITY UPLC BEH C4色谱柱(1.7μm,1×50mm)进行蛋白质定量。使用六分钟程序,该六 分钟程序使用在0.5分钟内从5%至33%乙腈(西格玛奥德里奇(Sigma- Aldrich))的初始梯度,然后在4.5分钟内从33%至48%的梯度,接着为最 终到90%乙腈的阶变梯度。基于纯化的里氏木霉Bgl1的蛋白质标准曲线用 于定量Mg3A多肽。
2-B.氯-硝基-苯基-葡糖苷(CNPG)水解测定法
将二百(200)μL的50mM乙酸钠缓冲液(pH 5)添加至微量滴定平板的各 个孔。还将稀释于50mM乙酸钠缓冲液(pH 5)中的五(5)μL酶添加至各个 孔。覆盖该平板,并使其在Eppendorf热混合仪中于37℃平衡15分钟。将 Millipore水中制备的二十(20)μL的2mM 2-氯-4-硝基苯基-β-D-吡喃葡萄糖 苷(CNPG,加利福尼亚州埃德蒙顿的罗斯科技有限公司(Rose Scientific Ltd.,Edmonton,CA))添加至各个孔并且将该平板迅速转移至分光光度计 (SpectraMax 250,分子仪器公司(Molecular Devices))。在OD 405nm进行 15分钟的动力学读数并且将数据记录为Vmax。使用CNP的消光系数,将 Vmax的单位从OD/秒换算成μM CNP/秒。比活性(μM CNP/秒/mg蛋白) 通过μM CNP/秒除以该测定法中所用的酶的毫克数来测定。CNPG测定法 的标准误差被确定为3%。
2-C.纤维二糖水解测定法
在50℃使用Ghose,T.K.Pure&Applied Chemistry,1987,59(2),257-268 (Ghose,T.K.,《纯化学与应用化学》,1987年,第59卷,第2期,第 257-268页)所述的方法来测定纤维二糖酶活性。将纤维二糖单位(如 Ghose所述而产生)定义为0.0926除以在测定条件下释放0.1mg葡萄糖所 需的酶的量。纤维二糖酶测定法的标准误差被确定为10%。
2-D.磷酸溶胀纤维素(PASC)的制备
磷酸溶胀纤维素(PASC)使用如下文献的修改方案从Avicel制备: Walseth,TAPPI 1971,35:228(Walseth,《纸浆与造纸工业技术协会志》, 1971年,第35卷,第228页)和Wood,Biochem.J.1971,121:353-362 (Wood,《生物化学杂志》,1971年,第121卷,第353-362页)。简而 言之,将Avicel PH-101溶解于浓磷酸中,然后使用冷去离子水沉淀。收集 纤维素并且用较多的水洗涤以中和所述pH。将所述纤维素在50mM乙酸钠 (pH5)中稀释成1%的固体。
实例3:Mg3A相对于基准里氏木霉Bgl1或者相对于基准黑曲霉B-glu 的改善的水解性能,如在CNPG和纤维二糖酶测定法中所见。
3-A.在摇瓶中制备的β-葡糖苷酶的CNPG和纤维二糖酶活性
通过UPLC(本文所述)测量摇瓶粗发酵液中的Mg3A浓度并且所述 浓度被确定为0.041g/L。以下实验中包括两种纤维素二糖水解酶作为表达 菌株背景中β-葡糖苷酶活性的对照并且低于测定法的检测极限。从 2.2mg/mL(A280测量值)的原液中使用经纯化的里氏木霉Bgl1。经纯化 的黑曲霉β-葡糖苷酶B-glu得自美格兹密国际公司(Megazyme International),不含BSA(爱尔兰威克洛的美格兹密国际爱尔兰公司 (Megazyme International Ireland Ltd.,Wicklow,Ireland),批号031809)。
测量每一种酶对模型底物氯-硝基-苯基-葡糖苷(CNPG)和纤维二糖的活 性。所述测定法各自在标准方案中的温度下进行;CNPG在37℃下以及纤 维二糖在50℃下测定。
表3-1
Mg3A具有比里氏木霉Bgl1高20%的CNPG活性,以及高80%以上的 纤维二糖水解活性(或纤维二糖酶活性)。与黑曲霉B-glu相比,Mg3A具 有高约9倍的对CNPG的活性,但与黑曲霉B-glu相比,具有少约6倍的对 纤维二糖的活性。纤维二糖水解酶对纤维二糖没有活性(在任何孔中均未 观察到葡萄糖)。
表3-2
酶 是否纯化 CNPG/纤维二糖
里氏木霉Bgl1 是 62
黑曲霉B-glu 是 1.6
Mg3A 否 39
为了独立于蛋白质测定来比较每种分子的活性,计算CNPG与纤维二 糖酶活性的比率。Mg3A对CNPG/纤维二糖的水解活性的比率一定程度地 小于里氏木霉Bgl1对CNPG/纤维二糖的水解活性的比率的一半。Mg3A对 CNPG/纤维二糖的水解活性的比率是黑曲霉B-glu对CNPG/纤维二糖的水 解活性的比率的20倍以上。
实例4:Mg3A多肽对PASC底物的改善的水解性能。
4-A.示出在由已公布的国际专利申请No.WO 2011/038019中所述菌 株产生的背景全纤维素酶组合物中,Mg3A与基准里氏木霉Bgl1水解 PASC的测量和比较的剂量曲线。
将β-葡糖苷酶以0-10mg蛋白质/g纤维素添加到10mg蛋白质/g葡聚糖 恒定加载量的由已公布的国际专利申请No.WO 2011/038019中所述菌株 (其表达Fv43D、Fv3A、Fv51A、AfuXyn2、EG4等)产生的全纤维素酶 背景中,总蛋白质浓度为88.8g/L。所述混合物用于水解磷酸溶胀纤维素 (PASC)。各样品剂量一式四份进行测定。
将全部酶稀释物在50mM乙酸钠缓冲液(pH 5.0)中制备。将一百五十 (150)μL冷的0.6%PASC添加到微量滴定平板(NUNC平底聚苯乙烯材 质,目录号269787)中的30μL酶溶液中。该酶混合物因此含有10mg蛋白 质/g葡聚糖的全纤维素酶,并且添加有0-10mg的Mg3A或Bgl1/g葡聚糖。 将平板用铝板密封件覆盖并且在50℃、200rpm的Innova培养箱/摇床中孵 育1.5h。用100μL 100mM甘氨酸(pH 10)淬灭该反应,过滤(Millipore真空 过滤板(Millipore vacuum filter plate),目录号MAHVN45),并且在Agilent 5042-1385HPLC上用Aminex HPX-87P色谱柱测量可溶性糖。
葡聚糖转化百分比被确定为(mg葡萄糖+mg纤维二糖+mg纤维三 糖)/mg反应中的纤维素。
结果示于图3A-图3C中。在约46%和62.5%转化率处的水平线表示仅 全纤维素酶背景活性的10mg/g和20mg/g加载量。
Mg3A比相同剂量的里氏木霉Bgl1产生更多的葡萄糖。这与Mg3A具 有比里氏木霉Bgl1更高的纤维二糖酶活性相符。当测量总糖(即,将葡萄 糖、纤维二糖和纤维三糖浓度加在一起)以确定总葡聚糖转化率%时, Mg3A的性能超过里氏木霉Bgl1。
4-B示出在由国际公布的专利申请No.WO 2011/038019中所述菌株产 生的背景全纤维素酶组合物中,在与4-A不同的条件下,Mg3A与基准里 氏木霉Bgl1水解PASC的测量和比较的第二组剂量曲线。
使用10,000截留分子量PES旋转浓缩器将摇瓶产生的Mg3A培养物发 酵液浓缩>20倍。与里氏木霉Bgl1标准曲线相比较,通过UPLC测定蛋白 质浓度。以比以上4-A中更高的蛋白加载量来重复PASC水解实验。浓缩 样品的纤维二糖酶比活性等于初始的摇瓶上清液。PASC测定法按照上文所 述的方式(在50℃下持续1.5h)进行。然后用100μL的100mM甘氨酸缓 冲液(pH 10)淬灭反应。每种剂量一式四份地进行测定。
如使用UPLC测得,Mg3A的浓度为1.55g/L。基准里氏木霉Bgl1的浓 度为2.2mg/L。
结果示于图3D-图3F中。
结果证实,在水解相同PASC时,Mg3A产生比相同剂量的里氏木霉 Bgl1更多的葡萄糖。Mg3A具有比Bgl1更高的纤维二糖酶活性,Bgl1在相 同水解条件下从相同PASC底物得到更低的纤维二糖浓度。当测量总糖 (即,将葡萄糖和纤维二糖的总浓度相加)以测量总葡聚糖转化率%时, Mg3A的性能实质上超过里氏木霉Bgl1。
实例5:Mg3A多肽对稀氨水预处理的玉米秸秆底物的改善的水解性 能。
5-A.示出在由已公布的国际专利申请No.WO 2011/038019中所述菌 株产生的背景全纤维素酶组合物中,Mg3A与基准里氏木霉Bgl1水解 DACS的测量和比较的剂量曲线。
使用10,000截留分子量PES旋转浓缩器将摇瓶产生的Mg3A培养物发 酵液浓缩>20倍。与里氏木霉Bgl1标准曲线相比较,通过UPLC测定蛋白 质浓度。浓缩的摇瓶上清液用于使用稀氨水预处理的玉米秸秆(DACS)作为 底物的糖化测定法。将每种酶混合物样品与10%Mg3A或Bgl1共混,其中 全纤维素酶由如国际公布的专利申请No.WO 2011/038019中所述的工程化 里氏木霉菌株产生。水解DACS底物的剂量反应曲线是通过添加3-53mg总 蛋白质/g葡聚糖的酶混合物到底物中生成的。
将里氏木霉Bgl1从2.2g/L总蛋白的经纯化的原液中添加到水解测定法 中。从1.55mg/mL浓缩样品添加Mg3A。
使稀氨水预处理的玉米秸秆(DACS)在20mM乙酸钠(pH 5)中成浆以获 得最终7%葡聚糖(21.5%固体)含量。如果需要的话,将所述浆液调节到 pH 5并且将所述浆液转移到96孔微量滴定平板中。
将所有酶基于mg蛋白质/g葡聚糖计加载到底物中。将全部酶稀释物 在50mM乙酸钠缓冲液(pH 5.0)中制备。将三十(30)μL酶溶液和45μg DACS底物添加到96孔微量滴定平板的每个孔中。各样品剂量一式四份进 行测试。将平板用铝密封件覆盖并且在50℃、200rpm的Innova培养箱/摇 床中孵育2天。用100μL 100mM甘氨酸(pH 10)淬灭该反应,过滤,并且通 过HPLC测量可溶性糖。
将葡聚糖转化百分比定义为(mg葡萄糖+mg纤维二糖+mg纤维三 糖)/mg DACS底物中的纤维素。
剂量反应曲线示于图4A-图4B中。
与将基准里氏木霉Bgl1与相同全纤维素酶背景组合物混合时相比,或 与葡聚糖转化率是用单独的纤维素酶背景组合物测量的水平时相比,Mg3A 与全纤维素酶背景组合物的混合提供了更高水平的葡聚糖转化率。当β-葡 糖苷酶的剂量低于13mg/g时,该改善特别突出。
5-B.示出Mg3A与基准里氏木霉Bgl1水解DACS的测量和比较的剂 量曲线,其中将Mg3A和Bgl1以递增剂量添加到由在国际公布的专利申请 No.WO2011/038019中所述菌株产生的13.4mg/g全纤维素酶组合物中。
在该实验中,将β-葡糖苷酶以递增剂量添加到13.4mg蛋白质/g葡聚糖 恒定加载量的由根据国际公布的专利申请No.WO 2011/038019的工程化里 氏木霉菌株产生的全纤维素酶中。所述混合物用于在50℃下水解DACS (4%葡聚糖)2天。.为了制备该混合物,将里氏木霉Bgl1从2.2g/L总蛋白 的经纯化的原液添加到混合物中,并且将全纤维素酶从88.8g/L总蛋白的原 液添加到混合物中。从1.55mg/mL浓缩液添加Mg3A。
如上所述在微量滴定平板中制备稀氨水预处理的玉米秸秆。将所有酶 基于mg蛋白质/g葡聚糖计加载到底物中。将全部酶稀释物在50mM乙酸 钠缓冲液(pH 5.0)中制备。将三十(30)μL的酶溶液添加到微量滴定平板每个 孔内的45μg底物中。将平板用箔密封件覆盖并且在50℃、200rpm的 Innova培养箱/摇床中孵育2天。用100μL 100mM甘氨酸(pH 10)淬灭该反 应,过滤,并且通过HPLC(Agilent 100系列,配备有脱灰柱(Biorad 125- 0118)和碳水化合物柱(Aminex HPX-87P))测量可溶性糖。流动相是水,流 速为0.6毫升/分钟以及运行时间为20分钟。生成葡萄糖标准曲线并用于定 量。
将葡聚糖转化百分比定义为(mg葡萄糖+mg纤维二糖+mg纤维三 糖)/mg底物中的纤维素。
结果示于图5A-图5B中。
Mg3A在所有剂量下的性能都超过里氏木霉Bgl1。
实例6:Mg3A多肽对稀氨水预处理的玉米秸秆底物的改善的热稳定性 和高温水解性能。
在该实验中,将β-葡糖苷酶以递增剂量添加到10mg蛋白质/g葡聚糖 恒定加载量的由根据国际公布的专利申请No.WO 2011/038019的工程化里 氏木霉菌株产生的全纤维素酶中。所述混合物用于在55℃下水解DACS (4%葡聚糖)2天。为了制备该混合物,将里氏木霉Bgl1从2.2g/L总蛋白 的经纯化的原液添加到混合物中,并且将全纤维素酶从88.8g/L总蛋白的原 液添加到混合物中。从根据以上描述所制备的1.55mg/mL浓缩液添加 Mg3A。
如上所述在微量滴定平板中制备稀氨水预处理的玉米秸秆。将所有酶 基于mg蛋白质/g葡聚糖计加载到底物中。将全部酶稀释物在50mM乙酸 钠缓冲液(pH 5.3)中制备。将三十(30)μL的酶溶液添加到微量滴定平板每个 孔内的75μg底物中。将平板用箔密封件覆盖并且在55℃、200rpm的 Innova培养箱/摇床中孵育2天。用100μL 100mM甘氨酸(pH 10)淬灭该反 应,过滤,并且通过HPLC(Agilent 100系列,配备有脱灰柱(Biorad 125- 0118)和碳水化合物柱(Aminex HPX-87P))测量可溶性糖。流动相是水,流 速为0.6毫升/分钟以及运行时间为20分钟。生成葡萄糖标准曲线并用于定 量。
将葡聚糖转化百分比定义为(mg葡萄糖+mg纤维二糖+mg纤维三 糖)/mg底物中的纤维素。
结果示于图6A-图5C中。
对于葡聚糖转化率、葡萄糖产量而言,Mg3A在所有剂量下的性能都 超过里氏木霉Bgl1。Mg3A和Bgl1均能有效地耗减糖化混合物中的纤维二 糖。