发明领域
本发明涉及利用重组微生物在细胞外生产二萜和/或糖基化的二萜的方法。本发 明还涉及一种发酵液,其中所述发酵液包括通过这种方法可获得的二萜和/或糖基化的二 萜。
发明背景
世界各地对高效甜味剂的需求不断增长,而且混合不同的人工甜味剂正在逐渐变 成一种常规做法。然而,对甜味剂替代品的需求预计将会增加。多年生草本植物-甜叶菊 (SteviarebaudianaBert.)-的叶子中积聚了大量极甜的化合物,它们被称为甜菊糖苷。 虽然这些化合物的生物学功能还不明确,但由于甜叶菊甜味剂是天然植物产品这一附加优 势,它们作为备选的高效甜味剂具有商业意义。
这些甜的甜菊糖苷显示出优于许多高效甜味剂的功能特性和感官性状。此外,研 究表明甜菊苷(stevioside)能降低II型糖尿病人的血糖水平和中度高血压患者的血压。
甜菊糖苷积聚于甜菊叶中,它们可以占甜菊叶干重的10-20%。甜菊苷和莱鲍迪甙 (rebaudioside)A都具有热稳定性和pH稳定性,因此适合用于碳酸饮料和许多其它食物中。 甜菊苷比蔗糖甜110-270倍,莱鲍迪甙A比蔗糖甜150-320倍。此外,莱鲍迪甙D也是积聚于甜 菊叶的高效二萜糖苷甜味剂,它可能比蔗糖甜约200倍。
目前,甜菊糖苷是从甜菊植物中提取的。在甜菊中,(-)-贝壳杉烯酸(kaurenoic acid,赤霉素(GA)生物合成的中间物)被转换为四环的二萜-甜菊醇,然后甜菊醇继续通过 多步骤的葡糖基化途径形成各种甜菊糖苷。然而,产率是可变的并受农业和环境条件的影 响。而且,种植甜菊需要大量陆地面积、收获前的长久时间、密集的劳动力以及提取和纯化 糖苷的额外费用。
为了满足对高效、天然甜味剂日益增长的商业需求,需要新的、更标准的、完全单 一成分的、没有后味的糖苷来源。
发明概述
在甜菊中,通过脱氧木酮糖磷酸酯途径(deoxyxylulose5-phosphatepathway) 形成香叶基香叶基焦磷酸(GGPP),甜菊醇就是从GGPP合成的。(-)-柯巴基二磷酸合酶 (copalyldiphosphatesynthase,CPS)和(-)-贝壳杉烯合酶(kaurenesynthase,KS)这两 个二萜环化酶的活性导致(-)-贝壳杉烯的形成,然后在一个三步骤的反应中,(-)-贝壳杉 烯被(-)-贝壳杉烯氧化酶(kaureneoxidase,KO)氧化形成(-)-贝壳杉烯酸。
在甜菊叶中,(-)-贝壳杉烯酸接着被内根-贝壳杉烯酸13-羟化酶(KAH)羟基化以 形成甜菊醇。然后,甜菊醇被一系列UDP-葡糖基转移酶(UGTs)葡糖基化。
本发明涉及能够产生二萜(例如甜菊醇)或糖基化的二萜(即二萜糖苷,例如甜菊 单糖苷、甜菊双糖苷、甜菊苷、莱鲍迪甙A、莱鲍迪甙B、莱鲍迪甙C、莱鲍迪甙D、莱鲍迪甙E、莱 鲍迪甙F、甜茶苷或杜克甙A)的微生物。
在共同待决专利申请WO2013/110673中,描述了能够产生二萜或二萜糖苷的重组 微生物。本文描述了这样的重组微生物,其包含额外的修饰,特别是一个或多个基因的下 调,这导致二萜或二萜糖苷的生产水平提高。
因此,本发明提供包括一种或多种核苷酸序列的重组微生物,其中所述核苷酸序 列编码:
具有内根-柯巴基焦磷酸合酶的多肽;
具有内根-贝壳杉烯合酶活性的多肽;
具有内根-贝壳杉烯氧化酶活性的多肽;和
具有贝壳杉烯酸13-羟化酶活性活性的多肽,
通过所述核苷酸序列的表达使微生物具有至少生产甜菊醇的能力,且
其中所述重组微生物的基因组已经被修饰,使得其导致以下中的一种或多种的产 生缺陷(deficiency):
(i)能够作用于香叶基香叶基焦磷酸(GGPP)从而导致香叶基香叶醇(GOH)的形成 的磷酸酶;
(ii)能够作用于法尼基焦磷酸(FPP)从而导致法尼醇(farnesol)和橙花叔醇 (nerolidol)的形成的磷酸酶;
(iii)外-1,3-β葡聚糖酶;
(iv)糖原合酶(或者影响糖原积累的多肽);
(v)缺氧基因(hypoxicgenes)的转录抑制子(transcriptionalrepressor)
(vi)NADPH氧化酶;或者
(vii)单羧酸转运体(monocarboxylatetransporter)
(viii)由开放阅读框YJL064w编码的多肽;或者
(ix)由开放阅读框YPL062w编码的多肽。
这些修饰中的一种或多种最终导致代谢工程菌株中的二萜和或二萜糖苷生产得 到改进。
本发明还涉及这样的重组微生物,其中所述重组微生物的基因组已经被修饰,使 得其导致以下中的一种或多种的产生缺陷:
(i)能够作用于香叶基香叶基焦磷酸(GGPP)从而导致香叶基香叶醇(GOH)的形成 的磷酸酶,其包含与SEQIDNO:225的序列同一性为至少约30%的氨基酸序列;
(ii)能够作用于法尼基焦磷酸(FPP)从而导致法尼醇和橙花叔醇的形成的磷酸 酶,其包含与SEQIDNO:227的序列同一性为至少约30%的氨基酸序列;
(iii)外-1,3-β葡聚糖酶,其包含与SEQIDNO:229或231的序列同一性为至少约 30%的氨基酸序列;
(iv)糖原合酶(或者影响糖原积累的多肽),其包含与SEQIDNO:233、235或250的 序列同一性为至少约30%的氨基酸序列;
(v)缺氧基因的转录抑制子,其包含与SEQIDNO:237的序列同一性为至少约30% 的氨基酸序列;
(vi)NADPH氧化酶,其包含与SEQIDNO:239的序列同一性为至少约30%的氨基酸 序列;
(vii)单羧酸转运体,其包含与SEQIDNO:241的序列同一性为至少约30%的氨基 酸序列;
(viii)具有由开放阅读框YJL064w编码的活性的多肽,其包含与SEQIDNO:243的 序列同一性为至少约30%的氨基酸序列;或者
(ix)具有由开放阅读框YJL062w编码的活性的多肽,其包含与SEQIDNO:245的序 列同一性为至少约30%的氨基酸序列。
本发明还涉及这样的本发明的重组微生物,其中所述重组微生物的基因组已经在 以下一个或多个的至少一个位置处被修饰:
(i)核酸,其编码能够作用于香叶基香叶基焦磷酸(GGPP)从而导致香叶基香叶醇 (GOH)形成的磷酸酶,其包含与SEQIDNO:224的序列同一性为至少约60%的核酸序列;
(ii)核酸,其编码能够作用于法尼基焦磷酸(FPP)从而导致法尼醇和橙花叔醇形 成的磷酸酶,其包含与SEQIDNO:226的序列同一性为至少约60%的核酸序列;
(iii)核酸,其编码外-1,3-β葡聚糖酶,其包含与SEQIDNO:228或230的序列同一 性为至少约60%的核酸序列;
(iv)核酸,其编码糖原合酶(或者影响糖原积累的多肽),其包含与SEQIDNO: 232、234或249的序列同一性为至少约60%的核酸序列;
(v)核酸,其编码缺氧基因的转录抑制子,其包含与SEQIDNO:236的序列同一性 为至少约60%的核酸序列;
(vi)核酸,其编码NADPH氧化酶,其包含与SEQIDNO:238的序列同一性为至少约 60%的核酸序列;
(vii)核酸,其编码单羧酸转运体,其包含与SEQIDNO:240的序列同一性为至少 约60%的核酸序列;
(viii)核酸,其编码具有由开放阅读框YJL064w编码的活性的多肽,其包含与SEQ IDNO:242的序列同一性为至少约60%的氨基酸序列;或者
(ix)核酸,其编码具有由开放阅读框YJL062w编码的活性的多肽,其包含与SEQID NO:244的序列同一性为至少约60%的氨基酸序列。
微生物可具有所述修饰中的一种或两种或更多种。
本发明还提供包括一种或多种核苷酸序列的重组微生物,其中所述核苷酸编码一 种或多种具有UDP-葡糖基转移酶(UGT)活性的多肽,
通过所述核苷酸的表达使重组微生物具有能生产甜菊单糖苷、甜菊双糖苷、甜菊 苷、莱鲍迪甙A、莱鲍迪甙B、莱鲍迪甙C、莱鲍迪甙D、莱鲍迪甙E、莱鲍迪甙F、甜茶苷或杜克甙 A中的至少一种的能力。
本发明还提供:
-制备二萜或糖基化的二萜的方法,其中所述方法包括在合适的发酵培养基中发 酵本发明所述的重组微生物;以及任选地,回收二萜或糖基化的二萜;
-制备二萜或糖基化的二萜的方法,其中所述方法包括在约29℃或更低的温度下, 在合适的发酵培养基中发酵能够产生二萜或糖基化的二萜的重组微生物;以及任选地,回 收二萜或糖基化的二萜;
-一种发酵液,其中所述发酵液包括通过本发明所述的方法可以得到的二萜或糖 基化的二萜;
-通过本发明所述的方法得到的或从根据本发明所述的发酵液中可以得到的得到 的二萜或糖基化的二萜;
-根据本发明所述的二萜或糖基化的二萜,其是莱鲍迪甙A或莱鲍迪甙D;和
-含有根据本发明所述的二萜或糖基化的二萜的食品、饲料或饮料。
本发明还提供将初次糖基化的二萜转换为二次糖基化的二萜的方法,所述方法包 括:
将所述初次糖基化的二萜与根据本发明所述的微生物、来源于这种微生物的无细 胞提取物或者来源于上述微生物或无细胞提取物之一的酶制剂接触,
从而将初次糖基化的二萜转换为二次糖基化的二萜。
附图说明
图1展示了质粒pUG7-EcoRV的示意图。
图2展示了设计ERG20、tHMG1和BTS1过表达盒(A),并将其整合至酵母基因组(B)的 方法的示意图。(C)显示了利用Cre重组酶移除KANMX标记后的最终状态。
图3展示了ERG9敲低构建体的示意图。所述构建体由500bpERG9的3’部分、98bp TRP1的启动子、TRP1的开放阅读框和终止子以及之后的400bpERG9的下游序列组成。由于 在ERG9的开放阅读框的终点引入了Xbal位点,因此最后的氨基酸变成了丝氨酸,终止密码 子变成了精氨酸。新的终止密码子位于TRP1的启动子中,这导致延长了18个氨基酸。
图4展示了将UGT2整合至基因组的示意图。A.转化中使用的不同片段;B.整合后的 状态;C.Cre重组酶表达后的状态。
图5展示了将GGPP到RebA的途径整合至基因组的示意图。A.转化中使用的不同片 段;B.整合后的状态。
图6展示了如何构建特定基因缺失的示意图。A.亲本菌株中的基因组;B.整合后的 状态;C.向外重组后的状态。
图7展示了生物合成甜菊糖苷的潜在途径的示意图。
图8展示了质粒pMB6969的示意图。
图9展示了质粒pMB6856的示意图。
图10展示了质粒pMB6857的示意图。
图11展示了质粒pMB6948的示意图。
图12展示了质粒pMB6958的示意图。
图13展示了质粒pMB7015的示意图。
图14展示了质粒pMB6986的示意图。
图15展示了质粒pMB7059的示意图。
图16展示了质粒pMB4691的示意图。
图17展示了破坏GSY1基因的示意图。
序列表说明
表1展示了序列说明。本文描述的序列可以引用序列表或数据库访问号(同样展示 于表1)来定义。
发明详述
在本说明书和附属的权利要求书的各个部分,词语“包括”、“包含”和“具有”及其 变形应被理解为“包含在内”。也就是说,在语境允许的情况下,这些词语意图传达的意思 是:可以包括其它没有明确列举的元素或整体。
本文中不使用数量词修饰时指的是一个或多于一个(即一个或至少一个)对象。例 如,“元素”可能意味着一个元素或多于一个元素。
本发明涉及能够产生二萜或糖基化的二萜(通常分别是甜菊醇或甜菊糖苷)的重 组微生物。为了本发明的目的,二萜通常意味着由4个异戊二烯单元组成的有机物。这种化 合物可来源于香叶基香叶基焦磷酸。糖基化的二萜或二萜糖苷是一种结合有糖的二萜,其 中糖通常与非碳水化合物部分相结合。通常,在二萜糖苷中,糖基通过其异头碳(anomric carbon)经由糖苷键与另外一个基团结合。优选的二萜和二萜糖苷分别是甜菊醇和甜菊糖 苷。因此,特别地,本发明涉及能够产生甜菊醇和甜菊糖苷的重组微生物。
根据本发明,提供了重组微生物。所述重组微生物包括一种或多种核苷酸序列,所 述核苷酸序列编码:
具有内根-柯巴基焦磷酸合酶活性的多肽;
具有内根-贝壳杉烯合酶活性的多肽;
具有内根-贝壳杉烯氧化酶活性的多肽;和
具有贝壳杉烯酸13-羟化酶活性的多肽,
通过所述核苷酸的表达使重组微生物具有至少能够生产甜菊醇的能力。
关键性地,所述重组微生物的基因组被修饰,使得其导致以下中的一种或多种的 产生缺陷:
(i)能够作用于香叶基香叶基焦磷酸(GGPP)从而导致香叶基香叶醇(GOH)的形成 的磷酸酶;
(ii)能够作用于法尼基焦磷酸(FPP)从而导致法尼醇和橙花叔醇的形成的磷酸 酶;
(iii)外-1,3-β葡聚糖酶;
(iv)糖原合酶(或者影响糖原积累的多肽);
(v)缺氧基因的转录抑制子(ROX1)
(vi)NADPH氧化酶;或者
(vii)单羧酸转运体(JEN1)
(viii)具有由开放阅读框YJL064w编码的活性的多肽;或者
(ix)具有由开放阅读框YPL062w编码的活性的多肽。
一种或多种以上的产生缺陷导致比不具有所述产生缺陷的重组微生物更高的二 萜或二萜糖苷生产。
能够作用于香叶基香叶基焦磷酸(GGPP)从而导致香叶基香叶醇(GOH)形成的磷酸 酶可以是具有所述活性的任何多肽,例如二酰基甘油焦磷酸磷酸酶,例如由DPP1(YDR284C) 编码的那种。
能够作用于法尼基焦磷酸(FPP)从而导致法尼醇和橙花叔醇形成的磷酸酶可以是 具有所述活性的任何多肽,例如脂质磷酸磷酸酶,例如由LPP1基因(YDR503C)编码的那种。
外-1,3-β葡聚糖酶可以是具有所述活性的任何多肽,例如由EXG1(YLR300W)或 EXG2(YDR261C)基因编码的那种。
糖原合酶(或者影响糖原积累的多肽)可以是具有所述活性的任何多肽,例如由 GSY1(YFR015C或YALI0F18502)或GSY2(YLR258W)基因编码的那种。
缺氧基因的转录抑制子可以是具有所述活性的任何多肽,例如由ROX1基因 (YPR065W)编码的那种。
NADPH氧化酶可以是具有所述活性的任何多肽,例如由YN01(YGL160W)基因编码的 那种。
单羧酸转运体可以是具有所述活性的任何多肽,例如由JEN1基因编码的那种。
具有由开放阅读框YJL064w编码的活性的多肽可以是具有所述活性的任何多肽。
具有由开放阅读框YPL062w编码的活性的多肽可以是具有所述活性的任何多肽。
本文中提及的开放阅读框和基因可在酵母属基因组数据库(Saccharomyces GenomeDatabase)(http://www.yeastgenome.com)中被确定。
本发明还涉及这样的重组微生物,其中所述重组微生物的基因组已经被修饰,使 得其导致以下中的一种或多种的产生缺陷:
(i)能够作用于香叶基香叶基焦磷酸(GGPP)从而导致香叶基香叶醇(GOH)的形成 的磷酸酶,其包含与SEQIDNO:225的序列同一性为至少约30%的氨基酸序列;
(ii)能够作用于法尼基焦磷酸(FPP)从而导致法尼醇和橙花叔醇的形成的磷酸 酶,其包含与SEQIDNO:227的序列同一性为至少约30%的氨基酸序列;
(iii)外-1,3-β葡聚糖酶,其包含与SEQIDNO:229或231的序列同一性为至少约 30%的氨基酸序列;
(iv)糖原合酶(或者影响糖原积累的多肽),其包含与SEQIDNO:233、235或250的 序列同一性为至少约30%的氨基酸序列;
(v)缺氧基因的转录抑制子,其包含与SEQIDNO:237的序列同一性为至少约30% 的氨基酸序列;
(vi)NADPH氧化酶,其包含与SEQIDNO:239的序列同一性为至少约30%的氨基酸 序列;
(vii)单羧酸转运体,其包含与SEQIDNO:241的序列同一性为至少约30%的氨基 酸序列;
(viii)具有由开放阅读框YJL064w编码的活性的多肽,其包含与SEQIDNO:243的 序列同一性为至少约30%的氨基酸序列;或者
(ix)具有由开放阅读框YJL062w编码的活性的多肽,其包含与SEQIDNO:245的序 列同一性为至少约30%的氨基酸序列。
本发明还涉及这样的重组微生物,其中所述重组微生物的基因组已经被修饰,使 得其导致以下中的一种或多种的产生缺陷:
(i)核酸,其编码能够作用于香叶基香叶基焦磷酸(GGPP)从而导致香叶基香叶醇 (GOH)形成的磷酸酶,其包含与SEQIDNO:224的序列同一性为至少约60%的核酸序列;
(ii)核酸,其编码能够作用于法尼基焦磷酸(FPP)从而导致法尼醇和橙花叔醇形 成的磷酸酶,其包含与SEQIDNO:226的序列同一性为至少约60%的核酸序列;
(iii)核酸,其编码外-1,3-β葡聚糖酶,其包含与SEQIDNO:228或230的序列同一 性为至少约60%的核酸序列;
(iv)核酸,其编码糖原合酶(或者影响糖原积累的多肽),其包含与SEQIDNO: 232、234或249的序列同一性为至少约60%的核酸序列;
(v)核酸,其编码缺氧基因的转录抑制子,其包含与SEQIDNO:236的序列同一性 为至少约60%的核酸序列;
(vi)核酸,其编码NADPH氧化酶,其包含与SEQIDNO:238的序列同一性为至少约 60%的核酸序列;
(vii)核酸,其编码单羧酸转运体,其包含与SEQIDNO:240的序列同一性为至少 约60%的核酸序列;
(viii)核酸,其编码具有由开放阅读框YJL064w编码的活性的多肽,其包含与SEQ IDNO:242的序列同一性为至少约60%的氨基酸序列;或者
(ix)核酸,其编码具有由开放阅读框YJL062w编码的活性的多肽,其包含与SEQID NO:244的序列同一性为至少约60%的氨基酸序列。
重组微生物可包含上述修饰中的一种、两种、三种、四种、五种、六种、七种、八种或 全部。重组微生物可包含上述修饰中的两种或更多种的任意组合。
重组微生物在至少一种本文所提及多肽的产生中缺陷被定义为表型特征,其中当 在基本相同的条件下分析时,较之其基因组未被根据本发明修饰的重组微生物,细胞由于 基因组的修饰:a)产生较少所述多肽,和/或b)具有降低的由编码所述多肽的基因转录的 mRNA的表达水平,和/或c)产生具有降低的蛋白活性或降低的蛋白比活性的多肽,和/或d) 产生较少由所述多肽产生的产物,以及这些可能性中的一种或多种的组合。
在该语境中,基因就此被定义为包含开放阅读框(ORF)和其转录控制元件(启动子 和终止子)的多核苷酸,所述ORF是基因上的将被转录并且翻译成蛋白序列的区域。
因此,如果与基因组未被修饰的亲本宿主细胞相比,微生物宿主细胞的缺陷可通 过测定由基因组被修饰的重组微生物产生的相关多肽的量和/或(比)活性来测量,和/或它 可以通过测定由编码所述多肽的基因转录的mRNA的量来测量,和/或它可以通过测定如上 文定义的基因组被修饰的重组微生物中的所述多肽产生的产物的量来测量,和/或它可以 通过基因或基因组测序来测量。可使用对技术人员而言可得到的任何检验,例如转录谱、 Northern印迹法、RT-PCR、Q-PCR和Western印迹法来测量多肽的产生缺陷。
重组微生物的基因组修饰在本文中被定义为导致细胞基因组中的多核苷酸序列改变的任何事件。修饰被解释为一种/个或多种/个修饰。可通过典型的菌株改进,随机诱变随后选择来引入修饰。可通过引入(插入)、替换或去除(缺失)核苷酸序列中的一个或多个核苷酸来完成修饰。该修饰可例如在编码序列或对多核苷酸的转录或翻译而言必需的调节元件中。例如,可插入或去除核苷酸,以引入终止密码子、去除起始密码子或使编码序列的开放阅读框改变或移码。编码序列或其调节元件的修饰可根据本领域中已知的方法通过定点或随机诱变、DNA改组方法、DNA再组装方法、基因合成(参见例如Young和Dong,(2004),NucleicAcidsResearch32,(7)electronicaccesshttp://nar.oupjournals.org/cgi/reprint/32/7/e59或者Gupta等人(1968),Proc.Natl.Acad.SciUSA,60:1338-1344;Scarpulla等人(1982),Anal.Biochem.121:356-365;Stemmer等人(1995),Gene164:49-53)或PCR产生的诱变完成。随机诱变程序的例子是本领域中熟知的,例如化学(例如NTG)诱变或物理(例如UV)诱变。定向诱变程序的例子是QuickChangeTM定点诱变试剂盒(StratageneCloningSystems,LaJolla,CA)、‘TheAlteredII体外诱变系统’(PromegaCorporation)或在Gene.1989年4月15日;77(1):51-9.(HoSN,HuntHD,HortonRM,PullenJK,PeaseLR“Site-directedmutagenesisbyoverlapextensionusingthepolymerasechainreaction”)中描述的使用PCR或使用如在MolecularBiology:CurrentInnovationsandFutureTrends.(A.M.Griffin和H.G.Griffin.编,ISBN1-898486-01-8;1995HorizonScientificPress,POBox1,Wymondham,Norfolk,英国)中描述的使用PCR通过重叠延伸来进行。
可通过将经修饰细胞的DNA序列与未经修饰细胞的序列进行比较来确定基因组中 的修饰。可使用对本领域技术人员而言已知的标准方法,例如使用Sanger测序技术和/或下 一代测序技术比如如在ElaineR.Mardis(2008),Next-GenerationDNASequencing Methods,AnnualReviewofGenomicsandHumanGenetics,9:387-402.(doi:10.1146/ annurev.genom.9.081307.164359)中综述的IlluminaGA2,Roche454等等,进行DNA测序 和基因组测序。
一些优选的修饰方法基于基因置换、基因缺失或基因破坏技术。
例如,在多核苷酸、核酸构建体或表达盒置换的情况下,可在将被置换的靶位置处 引入适当的DNA序列。所述适当的DNA序列优选地存在于克隆载体上。优选的整合型克隆载 体包含下述DNA片段,所述DNA片段与多核苷酸同源和/或与将被置换的位置侧翼的多核苷 酸具有同源性,以用于将克隆载体的整合靶向该预测定的位置。为了促进靶向整合,优选地 在转化细胞之前对克隆载体线性化。优选地,进行线性化以使得克隆载体的至少一端,但优 选地任意一端的侧翼为与将被置换的DNA序列(或侧翼序列)同源的序列。该方法被称为同 源重组并且还可使用该技术以实现(部分)基因缺失或基因破坏。
例如,对于基因破坏,可通过缺陷型多核苷酸置换对应于内源多核苷酸的多核苷 酸,所述缺陷型多核苷酸是不能产生(全功能)蛋白的多核苷酸。通过同源重组,缺陷型多核 苷酸置换内源多核苷酸。可期望的是,缺陷型多核苷酸还编码标记,所述标记可用于选择其 中核酸序列已被修饰的转化体。
或者,可通过使用与多核苷酸的核酸序列互补的核苷酸序列进行已建立的反义技 术来进行修饰,其中所述宿主细胞产生较少的本文所述多肽中的一种或所述宿主细胞在本 文所述多肽中的一种的产生方面缺陷。更特别地,可通过引入与多核苷酸的核酸序列互补 的核苷酸序列(其可在细胞中转录,并且能与细胞中产生的mRNA杂交)来降低或消除宿主细 胞对多核苷酸的表达。在允许互补反义核苷酸序列与mRNA杂交的条件下,翻译出的蛋白的 量由此减少或消除。表达反义RNA的例子展示于Appl.Environ.Microbiol.2000年2月;66 (2):775-82.(Characterizationofafoldase,proteindisulfideisomeraseA,inthe proteinsecretorypathwayofAspergillusniger.NgiamC,JeenesDJ,PuntPJ,Van DenHondelCA,ArcherDB)或者(ZrennerR,WillmitzerL,SonnewaldU.Analysisof theexpressionofpotatouridinediphosphate-glucosepyrophosphorylaseandits inhibitionbyantisenseRNA.Planta.(1993);190(2):247-52.)中。
此外,可通过RNA干扰(RNAi)技术(FEMSMicrob.Lett.237(2004):317-324)来获 得对多核苷酸的修饰、下调或失活。在该方法中,核苷酸序列(其表达待被影响)的同样的正 义和反义部分克隆为处于前后位置,中间是核苷酸间隔,并且插入到表达载体中。此种分子 转录后,小的核苷酸片段的形成将导致待被影响的mRNA的靶向降解。对特定mRNA的去除可 进行至不同的程度。W02008/053019、W02005/05672A1、W02005/026356A1、Oliveira等人, “Efficientcloningsystemforconstructionofgenesilencingvectorsin Aspergillusniger”(2008)Appl.Microbiol.andBiotechnol.80(5)L917-924和/或 Barnes等人,“siRNAasamoleculartoolforuseinAspergillusniger”(2008) BiotechnologyLetters30(5):885-890中描述的RNA干扰技术可用于对多核苷酸的下调、 修饰或失活。
优选地,在根据本发明的重组微生物中,一种或多种本文所定义的多肽的产生缺 陷是产生减少至少20%,更优选地至少30%,更优选地至少40%,甚至更优选地至少50%, 甚至更优选地至少60%,特别地至少70%,更特别地至少80%,例如至少85%,例如至少 90%,例如至少95%,例如至少100%(当在基本相同的条件下分析时,较之其基因组未被根 据本发明修饰的重组微生物)。
优选地,根据本发明的微生物宿主细胞的基因组修饰是基因组中的编码下述多肽 的至少一个核酸序列的至少一个位置的修饰,所述多肽与选自根据SEQIDNO:224、SEQID NO:226、SEQIDNO:228、SEQIDNO:230、SEQIDNO:232、SEQIDNO:234、SEQIDNO:236、 SEQIDNO:238、SEQIDNO:240、SEQIDNO:242、SEQIDNO:244或249的多肽的多肽具有 至少35%同一性、更优选地至少40%同一性、更优选地至少45%同一性、更优选地至少50% 同一性、甚至更优选地至少55%同一性、甚至更优选地至少60%同一性、甚至更优选地至少 65%同一性、甚至更优选地至少70%同一性、甚至更优选地至少75%同一性、甚至更优选地 至少80%同一性、甚至更优选地至少85%同一性、甚至更优选地至少90%同一性、例如至少 91%同一性、例如至少92%同一性,例如至少93%同一性、例如至少94%同一性、例如至少 95%同一性、例如至少96%同一性、例如至少97%同一性、例如至少98%同一性、例如至少 99%同一性、例如100%同一性;和/或在根据本发明的方法中的微生物宿主细胞的基因组 修饰是导致至少一种下述mRNA的量减少的修饰,所述mRNA与选自根据SEQIDNO:225、SEQ IDNO:227、SEQIDNO:229、SEQIDNO:231、SEQIDNO:233、SEQIDNO:235、SEQIDNO: 237、SEQIDNO:239、SEQIDNO:241、SEQIDNO:243、SEQIDNO:245或250的mRNA的mRNA 具有至少60%同一性、甚至更优选地至少65%同一性、甚至更优选地至少70%同一性、甚至 更优选地至少75%同一性、甚至更优选地至少80%同一性、甚至更优选地至少85%同一性、 甚至更优选地至少90%同一性,例如至少91%同一性,例如至少92%同一性,例如至少93% 同一性,例如至少94%同一性,例如至少95%同一性,例如至少96%同一性,例如至少97% 同一性,例如至少98%同一性,例如至少99%同一性,例如100%同一性。
在每种情况下,修饰通常发生在编码如下多肽的mRNA序列或核酸序列中,所述多 肽编码或者具有与给出的SEQIDNO相同的活性。
为了本发明的目的,具有内根-柯巴基焦磷酸合酶(EC5.5.1.13)活性的多肽能够 催化如下化学反应:
该酶有一种底物(香叶基香叶基焦磷酸)和一种产物(内根-柯巴基焦磷酸)。该酶 参与赤霉素的生物合成。该酶属于异构酶家族,具体是分子内的裂解酶类。这种酶类的系统 名称是内根-柯巴基-二磷酸裂解酶(去环化)。其它的常用名包括内根-柯巴基焦磷酸合酶、 内根-贝壳杉烯合酶A和内根-贝壳杉烯合成酶A。
为了本发明的目的,具有内根-贝壳杉烯合酶(EC4.2.3.19)活性的多肽能够催化 下述化学反应:
因此,该酶有一种底物(内根-柯巴基二磷酸)和两种产物(内根-贝壳杉烯和二磷 酸盐)。
该酶属于裂解酶家族,具体是作用于磷酸酯的碳-氧裂解酶。这种酶类的系统名称 是内根-柯巴基-二磷酸二磷酸酯-裂解酶(环化,形成内根-贝壳杉烯)。其它的常用名包括 内根-贝壳杉烯合酶B、内根-贝壳杉烯合成酶B、内根-柯巴基-二磷酸二磷酸酯-裂解酶和 (环化)。该酶参与二萜类化合物的生物合成。
具有内根-柯巴基二磷酸合酶活性的蛋白质还可以有截然不同的内根-贝壳杉烯 合酶的活性。内根-贝壳杉烯合酶催化的反应是赤霉素生物合成途径中的下一个步骤。这两 种类型的酶活性是截然不同的,抑制蛋白质的内根-贝壳杉烯合酶活性的定点突变导致内 根-柯巴基焦磷酸的积累。
因此,本发明使用的单个核苷酸序列可编码具有内根-柯巴基焦磷酸合酶活性和 内根-贝壳杉烯合酶活性的多肽。或者,可以用两段截然不同的、分开的核苷酸序列编码这 两种活性。
为了本发明的目的,具有内根-贝壳杉烯氧化酶(EC1.14.13.78)活性的多肽能够 催化内根-贝壳杉烯的4-甲基的连续三次氧化以产生贝壳杉烯酸。这种活性通常需要细胞 色素P450的存在。
为了本发明的目的,具有贝壳杉烯酸13-羟化酶活性(EC1.14.13)活性的多肽能够 催化利用NADPH和O2形成甜菊醇(对映-贝壳杉-16-烯-13-醇-19-羧酸)的反应。这种活性也 可被称为内根-贝壳杉烯13-羟化酶活性。
本发明所述的重组微生物可包括一种或多种核苷酸序列,其中所述核苷酸序列编 码具有UDP-葡糖基转移酶(UGT)活性的多肽,通过所述核苷酸序列的表达使重组微生物能 够生产甜菊单糖苷、甜菊双糖苷、甜菊苷或莱鲍迪甙A、莱鲍迪甙B、莱鲍迪甙C、莱鲍迪甙D、 莱鲍迪甙E、莱鲍迪甙F、甜茶苷、杜克甙A中的至少一种。
为了本发明的目的,具有UGT活性的多肽具有糖基转移酶(EC2.4)活性,即作为催 化剂能够催化单糖基团从有活性的的核苷酸糖(又称“糖基供体”)转移至糖基受体分子(通 常是醇)。UGT的糖基供体通常是核苷酸糖尿苷二磷酸葡萄糖(尿嘧啶-二磷酸葡萄糖,UDP- 葡萄糖)。
可以选择所使用的UGTs以产生期望的二萜糖苷,例如甜菊糖苷。Humphrey等人, PlantMolecularBiology(2006)61:47-62和Mohamed等人,J.PlantPhysiology168 (2011)1136-1141中展示了甜菊糖苷形成的示意图。此外,图7展示了甜菊糖苷形成的示意 图。
莱鲍迪甙A的生物合成涉及糖苷配基甜菊醇的葡糖基化。具体而言,莱鲍迪甙A可 通过以下步骤形成:首先葡糖基化甜菊醇的13-OH形成13-O-甜菊单糖苷,然后葡糖基化甜 菊单糖苷的13-O-葡萄糖的C-2′形成甜菊醇-1,2二糖苷,接着葡糖基化甜菊醇-1,2二糖苷 的C-19羟基形成甜菊糖苷,以及葡糖基化甜菊糖苷的C-13-O-葡萄糖的C-3′形成莱鲍迪甙 A。各个葡糖基化反应发生的顺序可以变化-参见图7。如该示意图中所示,一种UGT可以催化 不止一种转换。
我们已经证明:通过在重组宿主中表达编码功能UGTs(UGT74G1、UGT85C2、UGT76G1 和UGT2)的基因,可以实现从甜菊醇到莱鲍迪甙A或莱鲍迪甙D的转换。因此,当表达这四种 UGTs的重组微生物产生甜菊醇或向培养基中补加甜菊醇时,该微生物能够制造莱鲍迪甙A。 通常,这些基因中的一个或多个是重组基因,它们被转化到天生不具有这些基因的微生物 中。所有这些酶的实例都展示在表1中。本发明的微生物可能包括UGT74G1、UGT85C2、 UGT76G1和UGT2的任意组合。在表1中,序列UGT64G1被表示为序列UGT1,序列UGT74G1被表示 为序列UGT3,序列UGT76G1被表示为序列UGT4,序列UGT2被表示为序列UGT2。
本发明所述的包括编码具有UGT活性的多肽的核苷酸序列的重组微生物可以包括 一种核苷酸序列,其中所述核苷酸序列编码能够催化向甜菊醇添加C-13-葡萄糖的多肽。也 就是说,本发明的微生物可包括能够催化将甜菊醇转换为甜菊单糖苷的UGT。因此,这种核 苷酸序列的表达可以使重组微生物至少能产生甜菊单糖苷。
本发明的这种微生物可包括编码具有UDP-糖基转移酶(UGT)UGT85C2所显示的活 性的多肽的核苷酸序列,通过将所述核苷酸序列转化至微生物中,使细胞能够将甜菊醇转 换为甜菊单糖苷。
UGT85C2的活性是向甜菊醇的13-OH转移一个葡萄糖单元。因此,合适的UGT85C2可 以起尿嘧啶5′-二磷酸葡糖基:甜菊醇13-OH转移酶和尿嘧啶5′-二磷酸葡糖基:甜菊醇-19- O-葡糖苷13-OH转移酶的作用。功能UGT85C2多肽还可以催化葡糖基转移酶反应,该反应利 用甜菊糖苷,而非甜菊醇和甜菊醇-19-O-葡糖苷作为底物。这种序列在表1中被表示为序列 UGT1。
本发明所述的包括编码具有UGT活性的多肽的核苷酸序列的重组微生物还可以包 括一种核苷酸序列,其中所述核苷酸序列编码能够催化向甜菊醇或甜菊单糖苷添加C-13- 葡萄糖的多肽。也就是说,本发明的微生物可包括能够催化将甜菊单糖苷转换为甜菊双糖 苷的UGT。因此,这种微生物可以将甜菊单糖苷转换为甜菊双糖苷。这种核苷酸序列的表达 可以使重组微生物至少能产生甜菊双糖苷。
本发明所述的微生物还可以包括编码具有UDP-糖基转移酶(UGT)UGT74G1所显示 的活性的多肽的核苷酸序列,通过将所述核苷酸序列转化至微生物中,使细胞能够将甜菊 单糖苷转换为甜菊双糖苷。
本发明所述的微生物还可以包括编码具有UDP-糖基转移酶(UGT)UGT2所显示的活 性的多肽的核苷酸序列,通过将所述核苷酸序列转化至微生物中,使细胞能够将甜菊单糖 苷转换为甜菊双糖苷。
合适的UGT2多肽起着尿嘧啶5′-二磷酸葡糖基:甜菊醇-13-O-葡糖苷转移酶(也被 称为甜菊醇-13-单葡糖苷1,2-转葡糖基酶)的作用,它将葡萄糖部分转移至受体分子(甜菊 醇-13-O-葡糖苷)的13-O-葡萄糖的C-2′。通常,合适的UGT2多肽还起着尿嘧啶5′-二磷酸葡 糖基:甜茶苷转移酶的作用,它将葡萄糖部分转移至受体分子(甜茶苷)的13-O-葡萄糖的C- 2′。
功能UGT2多肽还可以催化利用甜菊糖苷,而非甜菊醇-13-O-葡糖苷和甜茶苷作为 底物的反应,例如功能UGT2多肽可以利用甜菊苷作为底物,将葡萄糖部分转移至19-O-葡萄 糖残基的C-2′以产生莱鲍迪甙E。功能UGT2多肽还可以利用莱鲍迪甙A作为底物,将葡萄糖 部分转移至19-O-葡萄糖残基的C-2′以产生莱鲍迪甙D。但是功能UGT2多肽通常不能将葡萄 糖部分转移至C-13位有1,3-键葡萄糖的甜菊醇化合物,即不能将葡萄糖部分转移至甜菊醇 1,3-二苷和1,3-甜菊苷。功能UGT2多肽还可以从不同于尿嘧啶二磷酸葡萄糖的其他供体转 移糖部分。例如,功能UGT2多肽可以起尿嘧啶5′-二磷酸D-木糖基:甜菊醇-13-O-葡糖苷转 移酶的作用,将木糖部分转移至受体分子(甜菊醇-13-O-葡糖苷)的13-O-葡萄糖的C-2′。又 例如,功能UGT2多肽能够起尿嘧啶5′-二磷酸L-鼠李糖基:甜菊醇-13-O-葡糖苷转移酶的作 用,将鼠李糖部分转移至受体分子(甜菊醇-13-O-葡糖苷)的13-O-葡萄糖的C-2′。这种序列 在表1中被表示为序列UGT2。
本发明所述的包括编码具有UGT活性的多肽的核苷酸序列的重组微生物还可以包 括一种核苷酸序列,其中所述核苷酸序列编码能够催化向甜菊双糖苷添加C-19-葡萄糖的 多肽。也就是说,本发明的微生物可包括能够催化将甜菊双糖苷转换为甜菊苷的UGT。因此, 这种微生物可以将甜菊双糖苷转换为甜菊苷。这种核苷酸序列的表达可以使重组微生物至 少能产生甜菊苷。
本发明所述的微生物还可以包括编码具有UDP-糖基转移酶(UGT)UGT74G1所显示 的活性的多肽的核苷酸序列,通过将所述核苷酸序列转化至微生物中,使细胞能够将甜菊 双糖苷转换为甜菊苷。
合适的UGT74G1多肽可以将葡萄糖单元分别转移至甜菊醇的13-OH或19-COOH。合 适的UGT74G1多肽可以起尿嘧啶5′-二磷酸葡糖基:甜菊醇19-COOH转移酶和尿嘧啶5′-二磷 酸葡糖基:甜菊醇13-O-葡糖苷19-COOH转移酶的作用。功能UGT74G1多肽还可以催化糖基转 移酶反应,该反应利用甜菊糖苷,而非甜菊醇和甜菊醇-13-O-葡糖苷作为底物,或者该反应 从不同于尿嘧啶二磷酸葡萄糖的供体转移糖部分。这种序列在表3中被表示为序列UGT1。
本发明所述的包括编码具有UGT活性的多肽的核苷酸序列的重组微生物可包括一 种核苷酸序列,其中所述核苷酸序列编码能够催化甜菊苷的C-13位葡萄糖的C-3’的糖基化 的多肽。也就是说,本发明的微生物可包括能够催化将甜菊苷转换为莱鲍迪甙A的UGT。因 此,这种微生物可以将甜菊苷转换为莱鲍迪甙A。这种核苷酸序列的表达可以使重组微生物 至少能产生莱鲍迪甙A。
本发明所述的微生物还可以包括编码具有UDP-糖基转移酶(UGT)UGT76G1所显示 的活性的多肽的核苷酸序列,通过将所述核苷酸序列转化至微生物中,使细胞能够将甜菊 苷转换为莱鲍迪甙A。
合适的UGT76G1将葡萄糖部分添加到受体分子(甜菊醇1,2-糖苷)的C-13-O-葡萄 糖的C-3’。因此,UGT76G1起着例如,尿嘧啶5′-二磷酸葡糖基:甜菊醇13-O-1,2葡糖苷C-3’ 葡糖基转移酶和尿嘧啶5′-二磷酸葡糖基:甜菊醇19-O-葡萄糖,13-O-1,2二苷C-3’葡糖基 转移酶的作用。功能UGT76G1多肽还可以催化葡糖基转移酶反应,该反应利用含糖(除葡萄 糖外)的甜菊糖苷(例如甜菊鼠李糖苷和甜菊木糖苷)作为底物。这种序列在表1中被表示为 序列UGT4。
本发明所述的微生物可以包括编码具有上述四种UGT活性中的一种或多种的多肽 的核苷酸序列。优选地,本发明所述的微生物可以包括编码具有全部上述四种UGT活性的多 肽的核苷酸序列。给出的核酸可以编码具有一种或多种上述活性的多肽。例如,编码具有2 种、3种或4种上述活性的多肽的核酸。优选地,本发明所述的重组微生物包括UGT1活性、 UGT2活性和UGT3活性。更优选地,这种重组微生物还包括UGT4活性。
本发明所述的包括编码具有UGT活性的多肽的核苷酸序列的重组微生物可包括一 种核苷酸序列,其中所述核苷酸序列编码能够催化甜菊苷或莱鲍迪甙A的葡糖基化。也就是 说,本发明的微生物可包括能够催化将甜菊苷或莱鲍迪甙A转换为莱鲍迪甙D的UGT。因此, 这种微生物可以将甜菊苷或莱鲍迪甙A转换为莱鲍迪甙D。这种核苷酸序列的表达可以使重 组微生物至少能产生莱鲍迪甙D。我们已经证明:表达UGT85C2、UGT2、UGT74G1和UGT76G1多 肽组合物的微生物可以产生莱鲍迪甙D。
本发明所述的包括编码具有UGT活性的多肽的核苷酸序列的重组微生物可包括一 种核苷酸序列,其中所述核苷酸序列编码能够催化甜菊苷的糖基化的多肽。也就是说,本发 明的微生物可包括能够催化将甜菊苷转换为莱鲍迪甙E的UGT。因此,这种微生物可以将甜 菊苷转换为莱鲍迪甙E。这种核苷酸序列的表达可以使重组微生物至少能产生莱鲍迪甙E。
本发明所述的包括编码具有UGT活性的多肽的核苷酸序列的重组微生物可包括一 种核苷酸序列,其中所述核苷酸序列编码能够催化莱鲍迪甙E的糖基化的多肽。也就是说, 本发明的微生物可包括能够催化将莱鲍迪甙E转换为莱鲍迪甙D的UGT。因此,这种微生物可 以将甜菊苷或莱鲍迪甙A转换为莱鲍迪甙D。这种核苷酸序列的表达可以使重组微生物至少 能产生莱鲍迪甙D。
本发明所述的重组微生物可表达编码具有NADPH-细胞色素p450还原酶活性的多 肽的核苷酸序列。也就是说,本发明所述的重组微生物可包括编码具有NADPH-细胞色素 p450还原酶活性的多肽的序列。
为了本发明的目的,具有NADPH-细胞色素p450还原酶活性(EC1.6.2.4;又名 NADPH:高铁血红素蛋白氧化还原酶、NADPH:血红素蛋白氧化还原酶、NADPH:P450氧化还原 酶、P450氧化还原酶、POR、CPR、CYPOR)的多肽通常是膜结合型的酶,它使电子从含有FAD和 FMN的酶-NADPH:细胞色素P450还原酶(POR;EC1.6.2.4)转移至真核细胞微粒体中的细胞 色素P450。
优选地,根据在前的权利要求中的任意一项所述的重组微生物能够表达下述序列 中的一种或多种:
a.编码具有NADPH-细胞色素p450还原酶活性的多肽的核苷酸序列,其中所述核苷 酸序列包括:
i.编码具有NADPH-细胞色素p450还原酶活性的多肽的核苷酸序列,其中所述多肽 包括与SEQIDNO(SEQIDNO):54、56、58或78的氨基酸序列的序列同一性至少约20%,优 选地至少25%、30%、40%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、 96%、97%、98%或99%的氨基酸序列;
ii.与SEQIDNO:53、55、57或77的核苷酸序列的序列同一性至少约15%,优选地 至少20%、25%、30%、40%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、 96%、97%、98%或99%的核苷酸序列;
iii.其互补链与序列(i)或(ii)的核酸分子杂交的核苷酸序列;或者
iv.由于遗传密码的简并性而不同于(i)、(ii)或(iii)的核酸分子序列的核苷酸 序列,
优选地,本发明所述的重组微生物能够表达以下核苷酸序列中的一种或多种:
a.编码具有内根-柯巴基焦磷酸合酶活性的多肽的核苷酸序列,其中所述核苷酸 序列包括:
i.编码具有内根-柯巴基焦磷酸合酶活性的多肽的核苷酸序列,其中所述多肽包 括与SEQIDNO:2、4、6、8、18、20、60或62的氨基酸序列的序列同一性至少约20%,优选地至 少25%、30%、40%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、 98%或99%的氨基酸序列;
ii.与SEQIDNO:1、3、5、7、17、19、59或61、141、142、151、152、153、154、159、160、 182或184的核苷酸序列的序列同一性至少约15%,优选地至少20%、25%、30%、40%、 50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的核苷 酸序列;
iii.其互补链与序列(i)或(ii)的核酸分子杂交的核苷酸序列;或者
iv.由于遗传密码的简并性而不同于(i)、(ii)或(iii)的核酸分子序列的核苷酸 序列,
b.编码具有内根-贝壳杉烯合酶活性的多肽的核苷酸序列,其中所述核苷酸序列 包括:
i.编码具有内根-贝壳杉烯合酶活性的多肽的核苷酸序列,其中所述多肽包括与 SEQIDNO:10、12、14、16、18、20、64或66的氨基酸序列的序列同一性至少约20%,优选地至 少25%、30%、40%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、 98%或99%的氨基酸序列;
ii.与SEQIDNO:9、11、13、15、17、19、63、65、143、144、155、156、157、158、159、 160、183或184的核苷酸序列的序列同一性至少约15%,优选地至少20%、25%、30%、40%、 50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的核苷 酸序列;
iii.其互补链与序列(i)或(ii)的核酸分子杂交的核苷酸序列;或者
iv.由于遗传密码的简并性而不同于(i)、(ii)或(iii)的核酸分子序列的核苷酸 序列,
c.编码具有内根-贝壳杉烯氧化酶活性的多肽的核苷酸序列,其中所述核苷酸序 列包括:
i.编码具有内根-贝壳杉烯氧化酶活性的多肽的核苷酸序列,其中所述多肽包括 与SEQIDNO:22、24、26、68或86的氨基酸序列的序列同一性至少约20%,优选地至少25%、 30%、40%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或 99%的氨基酸序列;
ii.与SEQIDNO:21、23、25、67、85、145、161、162、163、180或186的核苷酸序列的 序列同一性至少约15%,优选地至少20%、25%、30%、40%、50%、55%、60%、65%、70%、 75%、80%、85%、90%、95%、96%、97%、98%或99%的核苷酸序列;
iii.其互补链与序列(i)或(ii)的核酸分子杂交的核苷酸序列;或者
iv.由于遗传密码的简并性而不同于(i)、(ii)或(iii)的核酸分子序列的核苷酸 序列;或者
d.编码具有贝壳杉烯酸13-羟化酶活性的多肽的核苷酸序列,其中所述核苷酸序 列包括:
i.编码具有贝壳杉烯酸13-羟化酶活性的多肽的核苷酸序列,其中所述多肽包括 与SEQIDNO:28、30、32、34、70、90、92、94、96或98的氨基酸序列的序列同一性至少约20%, 优选地至少25%、30%、40%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、 96%、97%、98%或99%的氨基酸序列;
ii.与SEQIDNO:27、29、31、33、69、89、91、93、95、97、146、164、165、166、167或185 的核苷酸序列的序列同一性至少约15%,优选地至少20%、25%、30%、40%、50%、55%、 60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的核苷酸序列;
iii.其互补链与序列(i)或(ii)的核酸分子杂交的核苷酸序列;或者
iv.由于遗传密码的简并性而不同于(i)、(ii)或(iii)的核酸分子序列的核苷酸 序列。
在能够表达编码能催化向甜菊醇添加C-13-葡萄糖的多肽的核苷酸序列的一个本 发明重组微生物中,所述核苷酸可包括:
i.编码能够催化向甜菊醇添加C-13-葡萄糖的多肽的核苷酸序列,所述多肽包括 与SEQIDNO:36、38或72的氨基酸序列的序列同一性至少约20%,优选地至少25%、30%、 40%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的 氨基酸序列;
ii.与SEQIDNO:35、37、71、147、168、169或189的核苷酸序列的序列同一性至少 约15%,优选地至少20%、25%、30%、40%、50%、55%、60%、65%、70%、75%、80%、85%、 90%、95%、96%、97%、98%或99%的核苷酸序列;
iii.其互补链与序列(i)或(ii)的核酸分子杂交的核苷酸序列;或者
iv.由于遗传密码的简并性而不同于(i)、(ii)或(iii)的核酸分子序列的核苷酸 序列。
在本发明所述的能够表达编码可催化在甜菊单糖苷C-13位添加葡萄糖(这通常表 示甜菊单糖苷的C-13-葡萄糖/13-O-葡萄糖的C-2’的糖基化)的多肽的核苷酸序列的重组 微生物中,其中所述核苷酸序列可包括:
i.编码能够催化向甜菊醇或甜菊单糖苷添加C-13-葡萄糖的多肽的核苷酸序列, 其中所述多肽包括与SEQIDNO:88、100、102、104、106、108、110或112的氨基酸序列的序列 同一性至少约20%,优选地至少25%、30%、40%、50%、55%、60%、65%、70%、75%、80%、 85%、90%、95%、96%、97%、98%或99%的氨基酸序列;
ii.与SEQIDNO:87、99、101、103、105、107、109、111、181或192的核苷酸序列的序 列同一性至少约15%,优选地至少20%、25%、30%、40%、50%、55%、60%、65%、70%、 75%、80%、85%、90%、95%、96%、97%、98%或99%的核苷酸序列;
iii.其互补链与序列(i)或(ii)的核酸分子杂交的核苷酸序列;或者
iv.由于遗传密码的简并性而不同于(i)、(ii)或(iii)的核酸分子序列的核苷酸 序列。
在能够表达编码能催化在甜菊双糖苷C-19位添加葡萄糖的多肽的核苷酸序列的 一种本发明重组微生物中,所述核苷酸序列可包括:
i.编码能催化在甜菊双糖苷C-19位添加葡萄糖的多肽的核苷酸序列,所述多肽包 括与SEQIDNO:40、42、44、46、48或74的氨基酸序列的序列同一性至少约20%的氨基酸序 列;
ii.与SEQIDNO:39、41、43、45、47、73、148、170、171、172、173、174或190的核苷酸 序列的序列同一性至少约15%的核苷酸序列;
iii.其互补链与序列(i)或(ii)的核酸分子杂交的核苷酸序列;或者
iv.由于遗传密码的简并性而不同于(i)、(ii)或(iii)的核酸分子序列的核苷酸 序列。
在表达编码能催化在甜菊苷C-13位的葡萄糖的C-3’的葡糖基化的多肽的核苷酸 序列的一种本发明重组微生物中,所述核苷酸序列可包括:
i.编码能够催化在甜菊苷C-13位的葡萄糖的C-3’的葡糖基化的多肽的核苷酸序 列,所述多肽包括与SEQIDNO:50、52或76的氨基酸序列的序列同一性至少约20%,优选地 至少25%、30%、40%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、 97%、98%或99%的氨基酸序列;
ii.与SEQIDNO:49、51、75、149、175、176或191的核苷酸序列的序列同一性至少 约15%,优选地至少20%、25%、30%、40%、50%、55%、60%、65%、70%、75%、80%、85%、 90%、95%、96%、97%、98%或99%的核苷酸序列;
iii.其互补链与序列(i)或(ii)的核酸分子杂交的核苷酸序列;或者
iv.由于遗传密码的简并性而不同于(i)、(ii)或(iii)的核酸分子序列的核苷酸 序列。
在本发明所述的表达编码能够催化下述反应中的一个或多个的多肽的核苷酸序 列的重组微生物中,其中所述反应为:将甜菊苷或莱鲍迪甙A葡糖基化为莱鲍迪甙D、将甜菊 苷葡糖基化为莱鲍迪甙E或者将莱鲍迪甙E葡糖基化为莱鲍迪甙D,其中所述核苷酸序列可 包括:
i.编码能够催化下述反应中的一个或多个的多肽的核苷酸序列,其中所述反应 为:将甜菊苷或莱鲍迪甙A糖基化为莱鲍迪甙D、将甜菊苷糖基化为莱鲍迪甙E或者将莱鲍迪 甙E糖基化为莱鲍迪甙D,其中所述多肽包括与SEQIDNO:88、100、102、104、106、108、110、 112的氨基酸序列的序列同一性至少约20%的氨基酸序列;
ii.与SEQIDNO:87、99、101、103、105、107、109、111、181或192的核苷酸序列的序 列同一性至少约15%的核苷酸序列;
iii.其互补链与序列(i)或(ii)的核酸分子杂交的核苷酸序列;或者
iv.由于遗传密码的简并性而不同于(i)、(ii)或(iii)的核酸分子序列的核苷酸 序列。
根据本发明所述的微生物产生香叶基香叶基焦磷酸(GGPP)的能力可能会被上调。 在本发明的语境中,上调意味着:较同等但未被转化的菌株,本发明的微生物产生更多 GGPP。
因此,本发明所述的微生物可包括编码羟甲基戊二酰-辅酶A还原酶、法尼基-焦磷 酸合酶和香叶基香叶基二磷酸合酶的核苷酸序列中的一种或多种,通过将所述核苷酸序列 转化至微生物使其生产GGPP的水平提高。
优选地,本发明所述的重组微生物能够表达以下序列中的一种或多种:
a.编码具有羟甲基戊二酰-辅酶A还原酶活性的多肽的核苷酸序列,其中所述核苷 酸序列包括:
i.编码具有羟甲基戊二酰-辅酶A还原酶活性的多肽的核苷酸序列,其中所述多肽 包括与SEQIDNO:80的氨基酸序列的序列同一性至少约20%的氨基酸序列;
ii.与SEQIDNO:79的核苷酸序列的序列同一性至少约15%的核苷酸序列;
iii.其互补链与序列(i)或(ii)的核酸分子杂交的核苷酸序列;或者
iv.由于遗传密码的简并性而不同于(i)、(ii)或(iii)的核酸分子序列的核苷酸 序列,
b.编码具有法尼基-焦磷酸合酶活性的多肽的核苷酸序列,其中所述核苷酸序列 包括:
i.编码具有法尼基-焦磷酸合酶活性的多肽的核苷酸序列,其中所述多肽包括与 SEQIDNO:82的氨基酸序列的序列同一性至少约20%的氨基酸序列;
ii.与SEQIDNO:81的核苷酸序列的序列同一性至少约15%的核苷酸序列;
iii.其互补链与序列(i)或(ii)的核酸分子杂交的核苷酸序列;或者
iv.由于遗传密码的简并性而不同于(i)、(ii)或(iii)的核酸分子序列的核苷酸 序列;或者
c.编码具有香叶基香叶基二磷酸合酶活性的多肽的核苷酸序列,其中所述核苷酸 序列包括:
i.编码具有香叶基香叶基二磷酸合酶活性的多肽的核苷酸序列,其中所述多肽包 括与SEQIDNO:84的氨基酸序列的序列同一性至少约20%的氨基酸序列;
ii.与SEQIDNO:83的核苷酸序列的序列同一性至少约15%的核苷酸序列;
iii.其互补链与序列(i)或(ii)的核酸分子杂交的核苷酸序列;或者
iv.由于遗传密码的简并性而不同于(i)、(ii)或(iii)的核酸分子序列的核苷酸 序列。
本发明涉及一种重组微生物。为了本发明的目的,微生物通常指人类肉眼不可见 的(即显微镜可见的)生物体。所述微生物可以来自细菌、真菌、古生菌或原生生物。所述微 生物通常是单细胞生物。
本文中使用的重组微生物被定义为:被遗传修饰或者被一种或多种核苷酸序列 (如在本文中所定义的)转化/转染的微生物。一种或多种这类核苷酸序列的存在改变了微 生物产生二萜或二萜糖苷(特别是甜菊醇或甜菊糖苷)的能力。未被转化/转染或遗传修饰 的微生物不是重组微生物,其通常不包括能使细胞产生二萜或二萜糖苷的一种或多种核苷 酸序列。因此,未被转化/转染的微生物在自然条件下通常不能产生二萜,然而天生能够产 生二萜或二萜糖苷并且根据本发明所述经修饰的微生物(以及产生二萜/二萜糖苷的能力 改变的微生物)被认为是根据本发明所述的重组微生物。
序列同一性在本文中被定义为:两种或多种氨基酸(多肽或蛋白质)序列或者两种 或多种核酸(多聚核苷酸)序列之间的关系。通常,序列同一性或相似性是对被比较序列的 全长进行比较。在本领域,“同一性”还意味着氨基酸或核酸序列之间的序列相关程度,其由 这些序列串之间的匹配程度所决定(视情况而定)。利用本领域的技术人员已知的各种方法 易于计算出“同一性”和“相似性”。判断同一性的优选方法被设计成可以给出被检验的序列 之间最大程度的匹配。然后,通常在被比较序列的全长范围计算同一性和相似性。判断同一 性和相似性的方法被编码成了一些可通过公开途径获得的计算机程序。优选的判断两段序 列之间的同一性和相似性的计算机程序方法包括,例如BestFit、BLASTP、BLASTN和FASTA (Altschul,S.F.等人,J.Mol.Biol.215:403-410(1990),在NCBI和其它来源(BLAST Manual,Altschul,S.等人,NCBINLMNIHBethesda,MD20894)中公开可用)。使用BLASTP 对比氨基酸序列时,优选的参数是:空位开放10.0、空位扩展0.5、Blosum62矩阵。使用 BLASTP对比核酸序列时,优选的参数是:空位开放10.0、空位扩展0.5、DNA全矩阵(DNA同一 性矩阵)。
还可以用下述方法定义编码表达于本发明所述细胞中的酶的核苷酸序列:在温和 杂交条件下,或者优选地在严格杂交条件下,将所述核苷酸序列与SEQIDNO:1、3、5、7、9、 11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、 61、63、65、67、69、71、73、75、77、79、81或84的核苷酸序列或者本文中提到的任何其它序列 分别杂交,然后根据它们的杂交性能定义。“严格杂交条件”在本文中被定义为下述条件:在 约65℃下,在含有约1M盐(优选的是6×SSC或具有类似离子强度的任何其它溶液)的溶液 中,允许包括至少约25个核苷酸,优选的约50、75或100个核苷酸,最优选的约200或更多核 苷酸的核酸序列杂交,然后在65℃下,在含有约0.1M盐(优选的是0.2×SSC或具有类似离子 强度的任何其它溶液)的溶液中洗涤。优选地,杂交持续过夜,即至少10小时;优选地,洗涤 持续至少1小时并至少更换2次洗涤液。这些条件通常允许具有约90%或更高序列同一性的 序列特异性杂交。
温和杂交条件在本文中被定义为:在约45℃下,在含有约1M盐(优选的是6×SSC或 具有类似离子强度的任何其它溶液)的溶液中,允许包括至少约50个核苷酸,优选的约200 或更多核苷酸的核酸序列杂交,然后在室温下,在含有约1M盐(优选的是6×SSC或具有类似 离子强度的任何其它溶液)的溶液中洗涤。优选地,杂交持续过夜,即至少10小时;优选地, 洗涤持续至少1小时并至少更换2次洗涤液。这些条件通常允许序列同一性最高为50%的序 列特异性杂交。本领域的技术人员可以调整这些杂交条件以确切鉴定同一性在50%-90% 之间变化的序列。
编码内根-柯巴基焦磷酸合酶、内根-贝壳杉烯合酶、内根-贝壳杉烯氧化酶、贝壳 杉烯酸13-羟化酶、UGT、羟甲基戊二酰-辅酶A还原酶、法尼基-焦磷酸合酶、香叶基香叶基二 磷酸合酶、NADPH-细胞色素p450还原酶的核苷酸序列可以是原核来源或真核来源。
编码内根-柯巴基焦磷酸合酶的核苷酸序列可以包括,例如在SEQIDNO:1、3、5、 7、17、19、59、61、141、142、151、152、153、154、159、160、182或184中展示的序列。
编码内根-贝壳杉烯合酶的核苷酸序列可以包括,例如在SEQIDNO:9、11、13、15、 17、19、63、65、143、144、155、156、157、158、159、160、183或184中展示的序列。
编码内根-贝壳杉烯氧化酶的核苷酸序列可以包括,例如在SEQIDNO:21、23、25、 67、85、145、161、162、163、180或186中展示的序列。优选的KO是由在SEQIDNO:85中展示的 核酸编码的多肽。
编码贝壳杉烯酸13-羟化酶的核苷酸序列可以包括,例如在SEQIDNO:27、29、31、 33、69、89、91、93、95、97、146、164、165、166、167或185中展示的序列。优选的KAH是由在SEQ IDNO:33中展示的核酸编码的多肽。
本发明更优选的重组微生物可以表达由SEQIDNO:85和SEQIDNO:33或上述二 者之一的变体(如本文所述)编码的多肽的组合物。本发明优选的重组微生物可以表达表8 中展示的序列组合(与任意UGT2组合,但尤其是与由SEQIDNO:87编码的UGT2组合)。
编码UGT的核苷酸序列可以包括,例如在SEQIDNO:35、37、39、41、43、45、47、49、 51、71、73、75、168、169、170、171、172、173、174、175、176、147、148、149、87、181、99、100、 101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、 120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、 139、140、189、190、191或192中展示的序列。
编码羟甲基戊二酰-辅酶A还原酶的核苷酸序列可以包括,例如在SEQIDNO:79中 展示的序列。
编码法尼基-焦磷酸合酶的核苷酸序列可以包括,例如在SEQIDNO:81中展示的 序列。
编码香叶基香叶基二磷酸合酶的核苷酸序列可以包括,例如在SEQIDNO:83中展 示的序列。
编码NADPH-细胞色素p450还原酶的核苷酸序列可以包括,例如在SEQIDNO:53、 55、57或77中展示的序列。
对于UGT序列,选自以下每组中至少一种序列的组合可能是优选的,其中所述组 是:(i)SEQIDNO:35、37、168、169、71、147或189;(ii)SEQIDNO:87、99、101、103、105、 107、109、111、181或192;(iii)SEQIDNO:39、41、43、45、47、170、171、172、173、174、73、148 或190;和(iv)SEQIDNO:49、51、175、176、75、149或191。通常可以使用至少一种组(i)的 UGT。如果使用了至少一种组(iii)的UGT,那么通常也使用至少一种组(i)的UGT。如果使用 了至少一种组(iv)的UGT,那么通常使用至少一种组(i)的UGT和至少一种组(iii)的UGT。通 常使用至少一种组(ii)的UGT。
本发明可使用与上述序列的序列同一性至少约10%、约15%、约20%,优选地至少 约25%、约30%、约40%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、 约90%、约95%、约96%、约97%、约98%或约99%的序列。
为了增加被引入的酶在本发明所述的真核细胞中以活性形式表达的可能性,可修 改相应的编码核苷酸序列以将其密码子使用(codonusage)优化为所选真核宿主细胞的密 码子使用。编码酶的核苷酸序列相对于所选宿主细胞的密码子使用的适应性可被表示为密 码子适应指数(CAI)。“密码子适应指数”在本文中被定义为:一个基因的密码子使用相对高 表达基因的密码子使用的相对适应性的度量值。每种密码子的相对适应度(w)指的是对于 同一个氨基酸,该密码子相对于最高丰度密码子的使用率。CAI被定义为这些相对适应性数 值的几何平均数。非同义密码子和终止密码子(取决于遗传密码)被排除在外。CAI值在0-1 之间,较高的值表示最高丰度的密码子的比例较高(参见Sharp和Li,1987,NucleicAcids Research15:1281-1295;亦可参见:Jansen等人,2003,NucleicAcidsRes.31(8):2242- 51)。优选地,经修改的核苷酸序列的CAI值至少为0.2、0.3、0.4、0.5、0.6或0.7。
在一个优选的实施方式中,用核苷酸序列遗传修饰根据本发明所述的真核细胞, 其中使用密码对优化技术(如在PCT/EP2007/05594中所公开的)修改所述核苷酸序列的密 码子使用为真核细胞的密码子使用。密码对优化技术是用于在宿主细胞中产生多肽的方 法,其中就编码多肽的核苷酸序列的密码子使用(尤其是被使用的密码对)对核苷酸序列进 行修饰,以改善编码多肽的核苷酸序列的表达和/或提高多肽的产量。密码对被定义为:编 码序列中的一组2个连续的三联体(密码子)。
可利用公知的方法(例如易错PCR或定向进化)进一步提高本发明所述的真核宿主 细胞体内酶的活性。WO03010183和WO03010311中描述了定向进化的优选方法。
根据本发明的微生物可以是微生物来源的任何合适的宿主细胞。优选地,所述宿 主细胞是酵母或丝状真菌。更优选地,所述宿主细胞属于下述属之一:Saccharomyces、 Aspergillus、Penicillium、Pichia、Kluyveromyces、Yarrowia、Candida、Hansenula、 Humicola、Torulaspora、Trichosporon、Brettanomyces、Pachysolen或Yamadazyma或 Zygosaccharomyces。
更优选的微生物属于下述物种:Aspergillusniger、Penicilliumchrysogenum、 Pichiastipidis、Kluyveromycesmarxianus、K.lactis、K.thermotolerans、Yarrowia lipolytica、Candidasonorensis、C.glabrata、Hansenulapolymorpha、Torulaspora delbrueckii、Brettanomycesbruxellensis、Zygosaccharomycesbailii、Saccharomyces uvarum、Saccharomycesbayanus或Saccharomycescerevisiae。优选的真核细胞是 Saccharomycescerevisiae。
可修饰根据本发明所述的重组酵母细胞以使ERG9基因被下调和/或ERG5/ERG6基 因被删除。在其它微生物中,可用相同的方法修饰相应的基因。
可以用本文所述的方法转化这种微生物,通过将核苷酸序列转化至所述微生物使 细胞能够产生二萜或二萜糖苷。
根据本发明的优选微生物是酵母,例如Saccharomycescerevisiae或Yarrowia lipolytica细胞。本发明所述的重组微生物(例如重组的Saccharomycescerevisiae细胞 或Yarrowialipolytica细胞)可包括以下每组中的一种或多种核苷酸序列:
(i)SEQIDNO:1、3、5、7、17、19、59、61、141、142、152、153、154、159、160、182或 184。
(ii)SEQIDNO:9、11、13、15、17、19、63、65、143、144、155、156、157、158、159、160、 183或184。
(iii)SEQIDNO:21、23、25、6785、145、161、162、163、180或186。
(iv)SEQIDNO:27、29、31、33、69、89、91、93、95、97、146、164、165、166、167或185。
这种微生物通常还包括一种或多种如SEQIDNO:53、55、57或77中所示的核苷酸 序列。
这种微生物还可以包括一种或多种如SEQIDNO:35、37、39、41、43、45、47、49、51、 71、73、75、168、169、170、171、172、173、174、175、176、147、148、149、87、181、99、100、101、 102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、 121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、 140、189、190、191或192中所示的核苷酸序列。对于这些序列,来自以下每组中至少一种序 列的组合可能是优选的,其中所述组是:(i)SEQIDNO:35、37、168、169、71、147或189;(ii) SEQIDNO:87、99、101、103、105、107、109、111、181或192;(iii)SEQIDNO:39、41、43、45、 47、170、171、172、173、174、73、148或190;和(iv)SEQIDNO:49、51、175、176、75、149或191。 通常可以使用至少一种组(i)的UGT。如果使用了至少一种组(iii)的UGT,那么通常也使用 至少一种组(i)的UGT。如果使用了至少一种组(iv)的UGT,那么通常使用至少一种组(i)的 UGT和至少一种组(iii)的UGT。通常使用至少一种组(ii)的UGT。
这种微生物还可以包括下述核苷酸序列:SEQIDNO:79、81和83。
对于上述每种序列(或本文提及的任何序列),可以使用与所述序列的序列同一性 至少约15%,优选地至少约20%、25%、约30%、约40%、约50%、约55%、约60%、约65%、约 70%、约75%、约80%、约85%、约90%、约95%、约96%、约97%、约98%或约99%的变体。
可将编码内根-柯巴基焦磷酸合酶、内根-贝壳杉烯合酶、内根-贝壳杉烯氧化酶、 贝壳杉烯酸13-羟化酶、UGTs、羟甲基戊二酰-辅酶A还原酶、法尼基-焦磷酸合酶、香叶基香 叶基二磷酸合酶、NADPH-细胞色素p450还原酶的核苷酸序列连接至一个或多个核酸构建体 以促进根据本发明所述的微生物的转化。
核酸构建体可以是质粒,所述质粒带有编码上述二萜(例如甜菊醇/甜菊糖苷)途 径中的酶的基因;或者核酸构建体可包括两个或三个质粒,其中每个质粒分别带有3个或2 个基因,这些基因以任意恰当的方式分布并编码二萜途径中的酶。
可以使用任何合适的质粒,例如低拷贝质粒或高拷贝质粒。
选自内根-柯巴基焦磷酸合酶、内根-贝壳杉烯合酶、内根-贝壳杉烯氧化酶和贝壳 杉烯酸13-羟化酶、UGTs、羟甲基戊二酰-辅酶A还原酶、法尼基-焦磷酸合酶、香叶基香叶基 二磷酸合酶和NADPH-细胞色素p450还原酶的酶可以源于宿主微生物,这样就可以不需要用 一种或多种编码这些酶的核苷酸序列转化而使宿主细胞产生二萜或二萜糖苷酶。可以通过 经典的菌株改良方法,进一步提高利用宿主微生物生产二萜/二萜糖苷酶的产量。
核酸构建体可以维持游离状态,因此其包括自主复制的序列,例如常染色体复制 序列。如果宿主细胞是真菌来源,那么合适的游离核酸构建体可以,例如基于酵母2μ或pKD1 质粒(Gleer等人,1991,Biotechnology9:968-975)或者AMA质粒(Fierro等人,1995,Curr Genet.29:482-489)。
或者,可以将每种核酸构建体以单拷贝或多拷贝整合至宿主细胞的基因组。可以 通过非同源重组将核酸构建体随机整合至宿主细胞的基因组,但优选地通过本领域公知的 同源重组(参见例如WO90/14423、EP-A-0481008、EP-A-0635574和US6,265,186)实现。
任选地,核酸构建体中可存在选择标记。本文中使用的术语“标记”涉及编码允许 选择或筛选含有此标记的微生物的性状或表型的基因。标记基因可以是抗生素抗性基因, 能够通过使用恰当的抗生素从未被转化的细胞中选出被转化的细胞。或者还可以使用非抗 生素抗性标记,例如营养缺陷型标记(URA3、TRP1、LEU2),被这种核酸构建体转化过的宿主 细胞可以不含有标记基因。EP-A-0635574中公开了构建不含重组标记基因的微生物宿主细 胞的方法,该方法基于双向标记的使用。或者,可以使可筛选的标记(例如绿色荧光蛋白、半 乳糖苷酶、氯霉素乙酰转移酶、β-葡糖醛酸酶)成为本发明所述的核酸构建体的一部分以筛 选被转化的细胞。WO0540186中描述了引入异源多聚核苷酸的优选的无标记方法。
在一个优选的实施方式中,编码内根-柯巴基焦磷酸合酶、内根-贝壳杉烯合酶、内 根-贝壳杉烯氧化酶和贝壳杉烯酸13-羟化酶、UGTs、羟甲基戊二酰-辅酶A还原酶、法尼基- 焦磷酸合酶、香叶基香叶基二磷酸合酶和NADPH-细胞色素p450还原酶的核苷酸序列各自与 启动子操作性连接,所述启动子能够使根据本发明所述的真核细胞中相应核苷酸序列充分 表达,从而使细胞能够产生二萜或二萜糖苷。
本文中使用的术语“操作性连接”指的是多聚核苷酸元件(或编码序列,或核酸序 列)以功能关系连接。当一种核酸序列与另一种核酸序列存在功能关系时,则该核酸序列被 与另一种核酸序列“操作性连接”。例如,如果一个启动子或增强子影响编码序列的转录,那 么它与编码序列操作性连接。
本文中使用的术语“启动子”涉及控制一个或多个基因转录的核酸片段,其位于基 因转录起始位点的上游(相对于转录方向),在结构上可以根据依赖DNA的RNA聚合酶结合位 点、转录起始位点和任何其它的DNA序列(包括但不局限于转录因子结合位点、阻遏蛋白和 激活蛋白结合位点以及本领域技术人员已知的直接或间接地从启动子调控转录量的任何 其它核苷酸序列)的存在来鉴定。“组成型”启动子指的是在大部分环境和发育条件下活跃 的启动子。“诱导型”启动子指的是在环境或发育调控下活跃的启动子。
能够被用来表达编码上文所定义的酶的核苷酸序列的启动子可以不源于编码要 表达的酶的核苷酸序列,即启动子和与其操作性连接的核苷酸序列(编码序列)是异源的。 优选地,启动子是同源的,即相对于宿主细胞是內源的。
在本发明所述的微生物中,合适的启动子可以是GAL7、GAL10或GAL1、CYC1、HIS3、 ADH1、PGL、PH05、GAPDH、ADC1、TRP1、URA3、LEU2、ENO、TPI和AOX1。其它合适的启动子包括 PDC、GPD1、PGK1、TEF1和TDH。实施例中陈述了其它合适的启动子。
本发明可以使用任何在细胞中有功能的终止子。优选的终止子是从宿主细胞的天 然基因中获得的。合适的终止子序列是本领域公知的。优选地,在本发明的宿主细胞中,这 种终止子与阻止无义介导的mRNA降解的突变体结合(参见实施例:Shirley等人,2002, Genetics161:1465-1482)。
本发明中使用的核苷酸序列可以包括将其锚定至微生物的期望隔室的序列。例 如,在本发明所述的一种优选的微生物中,除内根-贝壳杉烯氧化酶、贝壳杉烯酸13-羟化酶 和NADPH-细胞色素p450还原酶的编码序列外的所有核苷酸序列都可被锚定至细胞溶质。可 以在酵母细胞中使用这种方法。
当使用术语“同源的”表示给出的(重组)核酸或多肽分子与给出的宿主生物体或 宿主细胞之间的关系时,可以理解为:本质上,核酸或多肽分子由一种宿主细胞或相同物种 (优选的是相同变体或菌株)的生物体产生。
当使用术语“异源的”表示核酸(DNA或RNA)或蛋白质时,其中所涉及的核酸或蛋白 质在自然条件下并不作为其存在的生物体、细胞、基因组或者DNA或RNA序列的一部分出现, 或者是与在自然界发现的不同的细胞、位置、基因组或者DNA或RNA序列中发现的核酸或蛋 白质。异源的核酸或蛋白质相对于其被引入的细胞不是內源的,但它是从另外一种细胞或 者合成或重组生产获得的。
本发明的重组微生物通常包括异源的核苷酸序列。或者本发明的重组微生物可包 括被修饰(如本文所述)的完全同源的序列,以便所述微生物比同种但未被修饰的微生物产 生更大量的二萜和/或二萜糖苷。
可过表达一种或多种本文所述的二萜途径中的酶以利用细胞产生充足的二萜。
本领域存在多种用以在本发明的宿主细胞中过表达酶的有效方法。特别地,可以 通过增加宿主细胞中编码酶的基因的拷贝数以过表达该酶,例如通过将基因的额外拷贝整 合至宿主细胞的基因组中。
根据本发明所述的优选的宿主细胞可以是天然能够产生GGPP的重组细胞。
根据本发明所述的重组微生物可以在本领域已知的任意合适的碳源上生长并将 其转换为二萜或二萜糖苷。所述重组微生物可直接转换植物生物质、纤维素、半纤维素、果 胶、鼠李糖、半乳糖、海藻糖、麦芽糖、麦芽糖糊精、核糖、核酮糖或淀粉、淀粉衍生物、蔗糖、 乳糖和甘油。因此,一种优选的宿主生物体表达酶,例如将纤维素转换为葡萄糖单体所需的 纤维素酶(内纤维素酶和外纤维素酶)、将半纤维素转换为木糖和阿拉伯糖单体所需的半纤 维素酶(例如内木聚糖酶、外木聚糖酶、阿拉伯糖酶)、能够将果胶转换为葡萄糖醛酸和半乳 糖醛酸的果胶酶或者能够将淀粉转换为葡萄糖单体的淀粉酶。优选地,所述宿主细胞能够 转换的碳源选自葡萄糖、木糖、阿拉伯糖、蔗糖、乳糖和甘油。所述宿主细胞可以是,例如如 在WO03/062430、WO06/009434、EP1499708B1、WO2006096130或WO04/099381中描述的真核宿 主细胞。
另一方面,本发明涉及一种生产二萜或二萜糖苷的方法,其中所述方法包括在合 适的发酵培养基中发酵根据本发明的已被转化的真核细胞;以及任选地,回收二萜和/或二 萜糖苷。
在生产二萜和/或二萜糖苷的方法中使用的发酵培养基可以是任何能使特定真核 宿主细胞生长的适合的培养基。发酵培养基的基本元素是本领域的技术人员已知的,并可 针对所选宿主细胞进行修改。
优选地,发酵培养基包括选自植物生物质、纤维素、半纤维素、果胶、鼠李糖、半乳 糖、海藻糖、果糖、麦芽糖、麦芽糖糊精、核糖、核酮糖或淀粉、淀粉衍生物、蔗糖、乳糖、脂肪 酸、甘油三酯和甘油的碳源。优选地,发酵培养基还包括氮源,例如尿素或者铵盐(例如硫酸 铵、氯化铵、硝酸铵或磷酸铵)。
可以以分批、补料分批或连续的模式实施根据本发明的发酵方法。也可采用分步 水解发酵(SHF)法或同时糖化发酵(SSF)法。为了达到最佳生产力,还可以将这些发酵方法 的模式结合。在发酵方法中,如果使用淀粉、纤维素、半纤维素或果胶作为碳源,那么SSF方 法可能特别有吸引力,该方法中可能需要加入水解酶,例如纤维素酶、半纤维素酶或果胶酶 以水解底物。
在制备二萜和/或二萜糖苷的方法中使用的重组微生物可以是任何如上文所定义 的适合的微生物。在生产二萜和/或二萜糖苷的方法中,使用根据本发明的重组真核微生物 可能是有利的,因为大部分真核细胞不需要无菌条件来增殖而且对噬菌体感染不敏感。此 外,真核宿主细胞可以在低pH条件下生长以避免细菌污染。
根据本发明的重组微生物可以是兼性厌氧微生物。在有氧条件下,兼性厌氧微生 物能够增殖至高细胞浓度。然后可以在高细胞密度时进行厌氧阶段,高细胞密度不仅大幅 度减少了需要的发酵体积,而且可以最小化好氧微生物污染的风险。
根据本发明所述的生产二萜的发酵方法可以是有氧的或厌氧的发酵方法。
厌氧发酵方法在本文中可被定义为:在没有氧气或实质上没有氧气可用(优选的 少于5、2.5或1mmol/L/h)的条件下运行的发酵方法,其中有机分子起着电子供体和电子受 体的作用。根据本发明的发酵方法还可以首先在有氧条件下运行,然后在无氧条件下运行。
还可以在氧限制(oxygen-limited)或微有氧(micro-aerobical)条件下运行所述 发酵方法。或者,可以先在有氧条件下、然后在氧限制条件下运行所述发酵方法。氧限制发 酵方法指的是耗氧量受到从气体输送至液体的氧气的限制。氧限制的程度取决于进入气流 的量和组分以及所使用的发酵设备的实际混合/传质性能。
根据本发明所述的方法中,可以在宿主细胞的生长期或静止(稳态)期生产二萜, 或者在这两个阶段均生产二萜。可以在不同的温度下运行所述发酵方法。
可以在最适合真核细胞的温度下生产二萜或二萜糖苷。最适宜的生长温度可因各 种被转化的真核细胞而异,这是本领域的技术人员已知的。所述最适宜的温度可能比最适 合野生型生物体的温度高,以便生物体在非无菌条件下,在感染敏感性最小和冷却成本最 低时高效生长。或者,可以在并非最适合重组微生物生长的温度下实施该方法。事实上,我 们已经证明在低于最适合重组微生物生长的温度下实施制备二萜或二萜糖苷的方法可能 是有益的。
在生产二萜或二萜糖苷的方法中,重组微生物的生长温度可以高于20℃、22℃、25 ℃、28℃或高于30℃、35℃或高于37℃、40℃、42℃,优选地低于45℃。然而在二萜或二萜糖 苷的产生阶段,最适宜的温度可能低于平均温度以优化生物质的稳定性。这个阶段的温度 可以低于45℃,例如低于42℃、40℃、37℃,例如低于35℃、30℃或者低于28℃、25℃、22℃或 者低于20℃,优选地高于15℃。
因此,本发明提供一种制备二萜或糖基化的二萜的方法,所述方法包括在约29℃ 或更低的温度下,在适合的发酵培养基中发酵能够产生二萜或糖基化的二萜的重组微生 物;以及任选地,回收二萜或糖基化的二萜。所述微生物可以是根据本发明的微生物。
这种方法中的发酵温度可以是约29℃或更低、约28℃或更低、约27℃或更低、约26 ℃或更低,或者更低的温度。
可以在任意合适的pH值下实施根据本发明的生产二萜或二萜糖苷的方法。如果重 组微生物是酵母,那么发酵培养基优选的pH值低于6,优选地低于5.5,优选地低于5,优选地 低于4.5,优选地低于4,优选地低于3.5或低于3.0或低于2.5,优选地高于2。在这些低pH值 下实施发酵过程的一个优势在于,可以防止发酵培养基中污染细菌的生长。
可以以工业规模实施这种方法。
这种方法的产物可以是甜菊单糖苷、甜菊双糖苷、甜菊苷或莱鲍迪甙A、莱鲍迪甙 B、莱鲍迪甙C、莱鲍迪甙D、莱鲍迪甙E、莱鲍迪甙F、甜茶苷、杜克甙A中的一种或多种。优选 地,产生莱鲍迪甙A或莱鲍迪甙D。
可以使用本领域已知的方法,例如通过蒸馏、真空抽提、溶剂抽提或蒸发从发酵培 养基中回收二萜或二萜糖苷。
根据本发明所述的生产二萜或二萜糖苷的方法中,获得的发酵液的浓度可超过 5mg/l,优选地超过10mg/l,优选地超过20mg/l,优选地超过30mg/l,优选地超过40mg/l,更 优选地超过50mg/l,优选地超过60mg/l,优选地超过70mg/l的发酵,优选地超过80mg/l,优 选地超过100mg/l,优选地超过1g/l,优选地超过5g/l,优选地超过10g/l的,但通常低于 70g/l。
本发明还涉及一种发酵液,所述发酵液包括利用根据本发明的方法可得到的二萜 和/或二萜糖苷。其中所述二萜或二萜糖苷可以是甜菊糖苷,尤其是莱鲍迪甙A或莱鲍迪甙 D。
如果二萜或二萜糖苷表达于微生物中,那么可能需要处理这种细胞以释放二萜/ 二萜糖苷。
本发明还涉及将初次糖基化的二萜转换为二次糖基化的二萜的方法,其中所述方 法包括:
将所述初次糖基化的二萜与本文所述的微生物、来源于这种微生物的无细胞提取 物或者来源于上述微生物或无细胞提取物之一的酶制剂接触,
从而将初次糖基化的二萜转换为二次糖基化的二萜。
二次糖基化的二萜可能是莱鲍迪甙A或莱鲍迪甙D。特别地,可以以某种方式实施 所述方法以使初次糖基化的二萜是莱鲍迪甙A以及二次糖基化的二萜是莱鲍迪甙D。
利用根据本发明的发酵方法产生的二萜或二萜糖苷(例如莱鲍迪甙A或莱鲍迪甙 D)可用于这些化合物已知的任何应用中。特别地,例如它们可以在,例如食品或饮料中被用 作甜味剂。例如,甜菊糖苷可以被调配在软饮料中,可以用于桌面甜味剂(tabletop sweetener)、口香糖、乳制品(例如酸奶(例如原味酸奶))、蛋糕、谷物或基于谷物的食品、营 养食品、药物、食用胶、糖果食品、化妆品、牙膏或者其它口腔组合物等。此外,二萜或二萜糖 苷作为甜味剂不仅能够用于饮料、食品和其它专供人类消费的产品,而且还能够用于具有 改良特性的动物饲料。
因此,本发明此外还提供包括根据本发明的方法制备的二萜或二萜糖苷的食品、 饲料或饮料。
在生产食品、饮料、药品、化妆品、桌面产品、口香糖时,可使用常规方法,例如混 合、揉捏、溶解、酸洗、渗透、过滤、喷洒、雾化、浸泡和其它方法。
对于在本发明中得到的二萜或二萜糖苷,可以以干燥形式或液体形式使用。可以 在食品热处理之前或之后加入。甜味剂的量取决于使用目的。可以单独加入或者与其它化 合物组合加入。
根据本发明的方法生产的化合物可以与一种或多种其它无热量或有热量的甜味 剂混合。这种混合物可被用于改善风味或时间变化形廓或稳定性。大范围无热量和有热量 的甜味剂可适合与甜菊糖苷混合。例如,无热量的甜味剂,例如罗汉果苷、莫那甜、阿斯巴 甜、乙酰舒泛盐、环磺酸盐、三氯蔗糖、邻磺苯甲酰亚胺盐或赤藓糖醇。适合与甜菊糖苷混合 的有热量的甜味剂包括糖醇和碳水化合物(例如蔗糖、葡萄糖、果糖和果葡糖浆)。也可以使 用有甜味的氨基酸,例如甘氨酸、丙氨酸或丝氨酸。
二萜或二萜糖苷能够与甜味抑制剂(例如天然甜味抑制剂)组合使用。它可以与鲜 味增强剂(例如氨基酸或其盐)组合。
二萜或二萜糖苷能够与多元醇或糖醇、碳水化合物、生理活性物质或功能成分(例 如类胡萝卜素、膳食纤维、脂肪酸、皂素、抗氧化剂、营养食品、类黄酮、异硫氰酸酯、苯酚、植 物甾醇或植物固醇、多元醇类、益生质、益生素、植物雌激素、大豆蛋白、硫化物/硫醇、氨基 酸、蛋白质、维生素、矿物质和/或被归为有益健康类的例如有益心血管的、降低胆固醇的或 抗炎的物质)组合。
含有二萜或二萜糖苷的组合物可包括增味剂、芳香剂、核苷酸、有机酸、有机酸盐、 无机酸、苦味剂、蛋白质或蛋白质水解物、表面活性剂、类黄酮、收敛剂、维生素、膳食纤维、 抗氧化剂、脂肪酸和/或脂肪酸盐。
本发明的二萜或二萜糖苷可作为高强度甜味剂被使用以产生具有改良味道特征 的零卡路里、低卡路里或糖尿病人的饮料和食品。它也能用于不能使用糖的食品、药品和其 它产品中。
此外,本发明的二萜或二萜糖苷作为甜味剂,不仅可以用于饮料、食品和其它专供 人类消费的产品,而且可以用于具有改良特征的动物饲料。
使用本发明的二萜或二萜糖苷组合物作为甜味剂的产品实例有:含酒精的饮料 (例如伏特加酒、红酒、啤酒、烈酒、日本清酒等)、天然果汁、清凉饮料、碳酸软饮料、低糖饮 料、零卡路里饮料、低卡路里饮料和食物、酸奶饮料、速溶果汁、速溶咖啡、粉末型速溶饮料、 罐装食品、糖浆剂、发酵豆酱、酱油、醋、调味品、蛋黄酱、番茄酱、咖喱粉、汤、速食汤、酱油 粉、醋粉、饼干类、米饼、咸饼干、面包、巧克力、焦糖、糖果、口香糖、果冻、布丁、果脯、榨菜、 鲜奶油、果酱、橘子酱、花酱、奶粉、冰激凌、果汁冰糕、瓶装蔬菜、瓶装水果、罐装煮豆、糖酱 煮肉和食物、农业蔬菜食品、海鲜、火腿、香肠、鱼肉火腿、鱼肉香肠、鱼酱、油炸鱼制品、干海 鲜制品、冷冻食品、腌海藻、腊肉、烟草、药品和许多其它产品。原则上,其应用可以不受限 制。
甜味组合物包括饮料,其中非限制性的实例包括:非碳酸和碳酸饮料(例如可乐、 姜汁汽水、沙士、苹果酒、果味软饮料(例如柑橘类(例如柠檬-酸橙或橘子)风味软饮料)、软 饮料粉等);源于水果或蔬菜的果汁、含有压榨汁或其类似物的果汁、含有水果颗粒的果汁、 水果饮料、水果汁饮料、含有水果汁的饮料、果味饮料、蔬菜汁、含有蔬菜的果汁以及含有水 果和蔬菜的混合果汁;运动饮料、能量饮料、近似水及其类似物的饮料(例如含有天然或合 成调味剂的水);茶类或最受欢迎类饮料(例如咖啡、可可饮料、红茶、绿茶、乌龙茶等);含有 牛奶成分的饮料(例如牛奶饮料、含有牛奶成分的咖啡、牛奶咖啡、奶茶、水果乳饮料、饮用 酸奶、乳酸菌饮料等)和乳制品。
通常,甜味组合物中的甜味剂的量变化很大,这取决于甜味组合物的具体类型和 期望甜味。本领域的普通技术人员能够易于分辨出待放入甜味组合物中的甜味剂的合适 量。
在本发明中得到的本发明所述的二萜或二萜糖苷可以干燥形式或液体形式被使 用。它可以在热处理食品之前或之后被加入。甜味剂的量取决于使用目的。它能够被单独加 入或者与其它化合物组合加入。
在制造食品、饮料、药品、化妆品、桌面产品、口香糖的过程中可以使用常规方法, 例如混合、捏合、溶解、酸洗、渗透、过滤、喷洒、雾化、浸泡和其它方法。
因此,可以利用本领域的技术人员已知的任何方法制造本发明的组合物,其中所 述方法能够提供组成成分的同质均一的或同质的混合物。这些方法包括干混合、喷雾干燥、 凝聚、湿制颗粒、压缩、共结晶等。
可以以任何适合配送至待加糖食品的形式向消费者提供固体的本发明的二萜或 二萜糖苷,其中所述形式包括小袋、小包、散装袋或盒、立方块、片、喷雾或者可溶性的条。可 以以单位剂量或大批量配送所述组合物。
对于液体甜味剂系列和方便的液体、半液体、膏状和乳状形式的组合物,应该发明 一种便于携带或分配或贮存或运输含有任何上述甜味剂产品或上述产品的组合物的合适 的包装,其中所述包装使用合适的任意形状或形式的包装材料。
所述组合物可包括各种填充剂、功能成分、色素和香料。
不能认为本文参考的专利文件或者作为现有技术给出的其它材料承认:截止任意 权利要求的优先权日,所述文件或材料是已知的或者其所包含的信息是公众常识的一部 分。
本文提及的每个参考文献的公开内容均通过引用的方式被全部并入本文。
通过以下实施例进一步阐释本发明。
实施例
概述
标准的遗传技术(例如在宿主细胞中过表达酶以及宿主细胞的额外遗传修饰)是 本领域已知的方法,例如在Sambrook和Russel(2001)″MolecularCloning:ALaboratory Manual(第三版),ColdSpringHarborLaboratory,ColdSpringHarborLaboratory Press或者F.Ausubel等人,eds.,″Currentprotocolsinmolecularbiology″,Green PublishingandWileyInterscience,NewYork(1987)中所描述的。真菌宿主细胞的转化 和遗传修饰的方法可以从,例如EP-A-0635574、WO98/46772、WO99/60102和WO00/ 37671中了解。
表1展示了序列说明。本文描述的序列可以引用序列表或数据库访问号(同样展示 于表1)来定义。
实施例1.在S.cerevisiae中过表达ERG20、BTS1和tHMG
使用如共同待决专利申请PCT/EP2013/056623中描述的技术将表达盒整合至一个 位点以过表达ERG20、BTS1和tHMG1。使用合适的引物和源于CEN.PK酵母菌株(vanDijken等 人EnzymeandMicrobialTechnology26(2000)706-714)的基因组DNA扩增整合位点的5’ 和3’整合侧翼。在DNA2.0,不同的基因被整理为盒子(包含同源序列、启动子、基因、终止子、 同源序列)。这些盒子中的基因的侧翼是组成型启动子和终止子。参见表2。溶解来源于 DNA2.0的含有ERG20、tHMG1和BTS1盒子的质粒DNA至浓度为100ng/μl。在50μlPCR混合物 中,使用20ng模板和20pmol引物。材料被溶解至浓度为0.5μg/μl。
表2:过表达构建体的组分
启动子 开放阅读框 终止子 Eno2(SEQ ID NO:201) Erg20(SEQ ID NO:81) Adh1(SEQ ID NO:212) Fba1(SEQID NO:202) tHMG1(SEQ ID NO:79) Adh2(SEQ ID NO:213) Tef1(SEQ ID NO:203) Bts1(SEQ ID NO:83) Gmp1(SEQ ID NO:214)
使用pUG7-EcoRV构建体(图1)和合适的引物来扩增选择标记。使用ZymocleanGel DNARecovery试剂盒(ZymoResearch)从凝胶中纯化KanMX片段。使用在表3中列出的片段转 化酵母菌株Cen.PK113-3C。
表3:用于ERG20、tHMG1和BTS1的转化的DNA片段
转化后,在30℃下于YEPhD(酵母膏植物蛋白胨葡萄糖;BBL植物蛋白胨来源于BD) 中复苏2.5小时,然后将细胞涂布在含200μg/mlG418(Sigma)的YEPhD琼脂上。在30℃下培 养平板4天。利用诊断PCR和测序技术确定正确的整合。通过对蛋白质进行LC/MS证实过表 达。图2阐释了组装ERG20、tHMG1和BTS1的原理图。该菌株被命名为STV002。
该菌株中CRE重组酶的表达导致KanMX标记的向外重组。利用诊断PCR确定正确的 向外重组以及ERG20、tHMG1和BTS1的存在。
实施例2.敲低Erg9
为了降低Erg9的表达,设计并使用含有修饰的3’末端的Erg9敲低构建体,其中所 述3’末端延续至驱动TRP1表达的TRP1启动子。
转化含有Erg9-KD片段的构建体至E.coliTOP10细胞。转化株生长于2PY(2倍的植 物蛋白胨和酵母膏)-sAMP培养基中。使用QIAprepSpinMiniprepkit(Qiagen)分离质粒 DNA,然后用SalI-HF(NewEnglandBiolabs)消化。用乙醇沉淀DNA以浓缩。转化所述片段至 S.cerevisiae,然后将菌落涂布到不含色氨酸的矿质培养基(Verduyn等人,1992.Yeast8: 501-517)琼脂板上。利用诊断PCR和测序技术确定正确整合的Erg9-KD构建体。图2阐释了执 行Erg9-KD构建体的转化的原理图。该菌株被命名为STV003。
实施例3.过表达UGT21a
使用如共同待决专利申请PCT/EP2013/056623和PCT/EP2013/055047中描述的技 术过表达UGT2_1a。在DNA2.0,UGT2_1a被整理为一个盒子(包含同源序列、启动子、基因、终 止子、同源序列)。细节请参见表4。使用如共同待决专利申请PCT/EP2013/055047中描述的 技术以获得含有标记和Cre重组酶的片段。用具有诺尔丝菌素抗性的NAT标记进行筛选。
表4:过表达构建体的组分
使用合适的引物进行扩增。使用合适的引物和源于CEN.PK酵母菌株的基因组DNA 以扩增整合位点的5’和3’整合侧翼。
使用表5中列出的片段转化S.cerevisiae酵母菌株STV003,然后将转化混合物涂 布在含有50μg/ml诺尔丝菌素(LexyNTC来源于JenaBioscience)的YEPhD琼脂板上。
表5:用于UGT2_1a的转化的DNA片段
片段 5′Chr09.01 UGT2_1a合 NAT-CR RE 3′Chr09.01
半乳糖能够激活CRE重组酶的表达。为了诱导CRE重组酶的表达,将转化株再次划 线至YEPh半乳糖培养基上。这导致了位于lox位置之间的标记的向外重组。利用诊断PCR证 实UGT2a的正确整合和NAT标记的向外重组。由此产生的菌株被命名为STV004。图4阐释了执 行UGT2_1a构建体的转化的原理图。
实施例4.过表达RebA产生通路:CPS、KS、KO、KAH、CPR、UGT1、UGT3和UGT4
使用如共同待决专利申请PCT/EP2013/056623中描述的技术将所有导致RebA产生 的通路基因设计整合至一个位点。使用合适的引物和源于CEN.PK酵母菌株的基因组DNA以 扩增整合位点的5’和3’整合侧翼。在DNA2.0,不同的基因被整理为盒(包含同源序列、启动 子、基因、终止子、同源序列)(概述请参见表5)。溶解来源于DNA2.0的DNA至100ng/μl。将该 原液进一步稀释至5ng/μl,然后取1μl用于50μl-PCR混合物中。反应包含25pmol每种引物。 扩增后,使用NucleoSpin96PCRClean-up试剂盒(Macherey-Nagel)纯化DNA或者利用乙 醇沉淀以浓缩DNA。
表6.用于RebA产生通路的序列
将所有RebA通路、标记和侧翼(概述请参见表7)转化至S.cerevisiae酵母菌株 STV004。在20℃下于YEPhD中过夜恢复后,将转化混合物涂布至含有200μg/mlG418的YEPhD 琼脂上。在25℃下培养3天并在室温下培养一夜。
表7.用于CPS、KS、KO、KanMX、KAH、CPR、UGT1、UGT3和UGT4的转化的DNA片段
利用诊断PCR和序列分析(3500基因分析仪,AppliedBiosystems)证实正确的整 合。使用BigDyeTerminatorv3.1循环测序试剂盒(LifeTechnologies)完成测序反应。每 个反应(10μl)包含50ng模板和3.2pmol引物。通过用乙醇/EDTA沉淀来纯化产物,然后将其 溶解在10μlHiDi甲酰胺中并应用于仪器。该菌株被命名为STV016。图5阐释了将GGPP到 RebA的通路整合至基因组的示意图。
实施例5:构建菌株STV027
为了从菌株STV016的染色体中除去KanMX标记,用表达Cre重组酶(Güldender, 2002)的质粒pSH65转化该菌株。随后,通过在非选择性培养基(2%葡萄糖的YEP)上生长来 去除(cured)菌株中的质粒pSH65。所产生的不含KanMX且不含pSH65的菌株(通过涂布在含 200μgG418/ml或20μg腐草霉素/ml的平板上来确定,此时不应发生生长)被命名为STV027。 利用诊断PCR进一步证实KanMX标记不存在。
实施例6:构建缺失菌株
使用共同待决专利申请PCT/EP2013/055047中描述的技术来获得基因敲除菌株。 为了缺失靶基因,将由4个PCR片段组成的敲除盒转化至S.cerevisiae并通过同源重组在体 内组装。该盒由约500bp与靶基因同源的5’-和3’-侧翼、Cre1KanMX片段和Cre2片段组成,其 在组装后包含选择性KanMX标记。KanMX和Cre合在一起的侧翼是lox位点,这使得在Cre重组 酶被诱导后向外重组。PCR片段被设计为具有与其邻近片段同源的区域,从而使转化之后能 够在体内组装。这种同源区域通过引物延伸被添加。5’-侧翼片段与Cre1KanMX片段有50bp 重叠,Cre1KanMX片段与Cre2片段有100bp重叠且Cre2片段与3’-侧翼片段有50bp重叠。
使用S.cerevisiaeCEN-PK基因组DNA分离物作为模板,对5’-和3’-侧翼片段进行 PCR扩增。为了获得含标记和Cre重组酶的片段,使用共同待决专利申请PCT/EP2013/055047 中描述的技术。赋予G418抗性的KanMX标记被用于选择。
用表8中列出的片段转化S.cerevisiae酵母菌株STV027,并将转化混合物涂布在 含200μg/mlG418的YEPhD琼脂平板上。将平板在30℃下孵育72小时。图6中阐释了如何缺失 靶基因的示意图。
表8:用于缺失特定基因的DNA片段。对于每种缺失靶标,5’-GOI(感兴趣的基因)和 3’-GOI(感兴趣的基因)片段是独特的。
片段 5′-GOI KAN-CR RE 3′-GOI
选择每种基因KO靶标的菌落并通过将它们划线在含200μg/mlG418的选择性 YEPh-D琼脂上来进行纯化。为了诱导CRE重组酶的表达,将经纯化的转化体接种在YEPh半乳 糖培养基中。这导致位于lox位点之间的KanMX和Cre的向外重组。通过将培养物划线在非选 择性YEPh-D琼脂培养基上来进行纯化。利用诊断PCR来证实靶基因的正确缺失以及KanMX标 记和Cre重组酶的向外重组。产生的菌株被命名为STV041-STV052。图6中阐释了执行缺失构 建体的转化的示意图。表8总结了构建的S.cerevisiae菌株。
表8.S.cerevisiae菌株
实施例7:利用缺失菌株的发酵实验
用来自YEPh-D琼脂的菌落材料接种预培养物。使预培养物在含有葡萄糖作为碳源 的200μl矿质培养基中生长。在Infors培养箱中,在27℃、750rpm和80%湿度下孵育预培养 物72小时。
使用40μl预培养物来接种含有葡萄糖作为碳源的2.5ml矿质培养基。在Infors培 养箱中,在27℃、550rpm和80%湿度下孵育主培养物120小时。通过用移液管上下吸取来充 分均化培养物并将1ml培养物转移至96孔板中。在水浴中在95℃下孵育96孔板15分钟并冷 却至室温。向每个孔中加入0.5ml乙腈并通过用移液管上下吸取来均化。通过在3000xg下离 心10分钟来使细胞碎片沉淀。在33%乙腈中将上清液稀释200倍。使用LC/MS来分析样品中 的RebA。RebA(RV0141-94,DAEPyungCo.Ltd)被用作标准品。
我们发现:相较于亲本菌株,所述具有特定基因缺失的菌株产生较高的RebA滴度。 结果概述请参见表9。
表9.莱鲍迪甙A生产
菌株 RebA(mg/L) STV027 63 STV041 104 STV042 94 STV043 98 STV044 115 STV045 103 STV046 99 STV047 100 STV048 103 STV049 104 STV050 97 STV052 100
实施例8:在Yarrowialipolytica中过表达UGT2、tHMGopt和GGSopt
通过乙酸锂/PEG真菌转化流程方法来进行所有转化并根据情况,在基本培养基、 YPD+100ug/ml诺尔丝菌素或YPD+100ug/ml潮霉素上选择转化体。
用5种确定的DNA片段来转化菌株ML10371。
1)7.0kb的DNA片段,其是在质粒MB6969(图8)的HindIII/NotI消化之后,通过凝胶 纯化分离得到的。该构建体编码用于UGT2(SEQIDNO:192)的过表达的合成构建体,所述 UGT2与天然的Y.lipolyticapPGM启动子和xprT终止子以及HPH潮霉素抗性基因(合在一起 的侧翼是lox位点)相连接;和用于密码子优化的缺乏5’膜锚定序列的Y.lipolytica羟甲基 戊二酰辅酶A还原酶开放阅读框(tHMGopt-SEQIDNO:79)的过表达的合成构建体,所述开 放阅读框与天然的Y.lipolyticapHSP启动子和cwpT终止子相连接。
2)2.7kb的DNA片段,其是在MB6856(图9)的HindIII/SspI消化之后,通过凝胶纯化 分离得到的。该构建体编码tHMGopt,其与天然的Y.lipolyticapHYPO启动子和gpdT终止子 相连接。
3)2.5kb的DNA片段,其是在MB6867(图10)的SspI消化之后,通过凝胶纯化分离得 到的。该构建体编码tHMGopt,其与天然的Y.lipolyticapHSP启动子和cwpT终止子相连接。
4)2.0kb的DNA片段,其是在MB6948(图11)的SspI消化之后,通过凝胶纯化分离得 到的。该构建体编码用于密码子优化的Y.lipolytica香叶基香叶基焦磷酸合酶(GGSopt- SEQIDNO:83)的过表达的合成构建体,所述密码子优化的Y.lipolytica香叶基香叶基焦 磷酸合酶与天然的Y.lipolyticapHSP启动子和cwpT终止子相连接。
5)2.2kb的DNA片段,其是在MB6958(图12)的HindIII/SspI消化之后,通过凝胶纯 化分离得到的。该构建体编码GGSopt,其与天然的Y.lipolyticapHYPO启动子和gpdT终止 子相连接。
包含UGT2、以及至少一个拷贝的tHMGopt和GGSopt的转化体之一被表示为 ML13462。
实施例9:过表达UGT3、UGT3和UGT4
质粒MB7015(图13)的SfiI消化之后,通过凝胶纯化来分离9.7kb的片段,用该片段 转化菌株ML13462。该构建体编码用于UGT1(SEQIDNO:189)(与天然的Y.lipolyticapENO 启动子和gpdT终止子相连接)、UGT3(SEQIDNO:190)(与天然的Y.lipolyticapHSP启动子 和pgmT终止子相连接)、UGT4(SEQIDNO:191)(与天然的Y.lipolyticapCWP启动子和pgkT 终止子相连接)的过表达且侧翼是lox的诺尔丝菌素抗性标记(NAT)的合成构建体。诺尔丝 菌素抗性分离物被表示为ML13500。
实施例10:过表达tHMGopt和GGSopt的额外拷贝
质粒MB6986(图14)的PvuI/SapI消化之后,通过凝胶纯化来分离9.1kb的片段,用 该片段转化菌株ML13500。该构建体编码tHMG(与天然的Y.lipolyticapHSP启动子和cwpT 终止子相连接)、URA3blaster原养型标记(侧翼是lox)和GGSopt(与天然的Y.lipolytica pHYPO启动子和gpdT终止子相连接)。在缺乏尿嘧啶的基本培养基上选择转化体。一种所选 择的尿嘧啶原养型被表示为ML13723。
实施例11:过表达tCPSSR、tKSSR、KAH4、KOGib和CPR3
质粒MB7059(图15)的SfiI消化之后,通过凝胶纯化来分离18.1kb的片段,用该片 段转化菌株ML13723。MB7059编码tCPS_SR(SEQIdNO:182)(与天然的Y.lipolyticapCWP 启动子和cwpT终止子相连接)、tKS_SR(SEQIDNO:183)(与天然的Y.lipolyticapHYPO启 动子和gpdT终止子相连接)、KAH_4(SEQIDNO:185)(与天然的Y.lipolyticapHSP启动子 和pgmT终止子相连接)、KO_Gib(SEQIDNO:186)(与天然的Y.lipolyticapTPI启动子和 pgkT终止子相连接)、CPR_3(SEQIDNO:188)(与天然的Y.lipolyticapENO启动子和xprT 终止子相连接)和天然的Y.lipolyticaLEU2位点。一种所选择的产生莱鲍迪甙A的转化体 被表示为ML14032。
实施例12:破坏菌株ML14032中的GSY1(YALI0F18502)
将菌株ML14032划线在YPD上并使其过夜生长,然后将其划线在5-FOA平板上以允 许在步骤3中引入的URA3标记的丢失。一种所选择的5-FOA抗性转化体被表示为ML14093。
使用正向引物ATTATTAAGCTTcgacattgaggtggaggaga(SEQIDNO:247)和反向引物 TAATAAACGCGTtgctgctggatttcgttgac(SEQIDNO:248),由Y.lipolytica基因组通过PCR扩 增GSY1基因(SEQIDNO:246的第1001-3073)的1008bp内部片段。将该内部GSY1片段克隆在 恰当的载体中。利用BstEII来使产生的载体MB4691_YALI0F18502g(图16)线性化,对于 BstEII而言,克隆的PCR片段中存在唯一的限制位点。在矿质培养基上转化和选择之后,利 用诊断PCR来检验转化体中的正确的整合。图17中阐释了GSY1基因的破坏。
实施例13:利用Y.lipolyticagsy1破坏菌株的发酵实验
用来自YEPD琼脂的菌落材料接种预培养物。使预培养物在含有葡萄糖作为碳源的 800μlYEP中生长。在Infors培养箱中,在30℃、800rpm和80%湿度下孵育预培养物72小时。
使用40μl预培养物来接种含有葡萄糖作为碳源的2.5mlYEP。在Infors培养箱中, 在30℃、800rpm和80%湿度下孵育主培养物120小时。离心培养物并使用LC/MS来分析上清 液中的RebA。RebA(RV0141-94,DAEPyungCo.Ltd)被用作标准品。
将gsy1破坏菌株与原养型前体菌株ML14032相比。我们发现:相较于亲本菌株,所 述具有gsy1破坏的菌株产生较高的RebA滴度,大概高50%。结果概述请参见表10。
表10.莱鲍迪甙A生产
菌株 RebA(mg/L) ML14032 83 ML14093 gsy1破坏 122
表1:序列表说明
灰色的id是截短的,因此它们是所提及的UniProtid的片段。