发明背景
发明领域
本公开涉及甜菊醇糖苷和甜菊醇糖苷前体在重组宿主中的重组生产。具体地,本公开涉及在重组宿主中生产甜菊醇糖苷,包括甜菊醇-13-O-葡糖苷(13-SMG)、甜菊醇-19-O-葡糖苷(19-SMG)、甜菊醇-1,2-二糖苷、甜菊醇-1,3-二糖苷、1,2-甜菊醇糖苷、1,3-甜菊醇糖苷、甜茶苷、莱鲍迪苷A(RebA)、莱鲍迪苷B(RebB)、莱鲍迪苷C(RebC)、莱鲍迪苷D(RebD)、莱鲍迪苷E(RebE)、莱鲍迪苷F(RebF)、莱鲍迪苷M(RebM)、莱鲍迪苷Q(RebQ)、莱鲍迪苷I(RebI)、杜尔可苷A、三糖基化甜菊醇糖苷、四糖基化甜菊醇糖苷、五糖基化甜菊醇糖苷、六糖基化甜菊醇糖苷、七糖基化甜菊醇糖苷或它们的异构体。
相关技术描述
抗损伤蛋白1(DAP1)是细胞色素b5相关蛋白,其结合血红素并在细胞色素P450(P450)催化周期中执行尚未表征的功能。DAP1与来自几个不同家族的P450的相互作用表明在P450的调控中的一般作用,而人、植物、蝇类和蠕虫中同源物的存在表明该功能在真核生物中的广泛保守性。参见Mallory等人,“Dap1p,a heme-binding protein that regulates the cytochrome P450 protein Erg11p/Cyp51p in Saccharomyces cerevisiae,”Mol Cell Biol 25(5):1669-79(2005);和Hughes等人,“Dap1/PGRMC1 binds and regulates cytochrome P450 enzymes,”Cell Metab 5(2):143-9(2007)。
甜味剂作为食品、饮料或糖果行业中最常用的成分是众所周知的。甜味剂既可以在生产过程中掺入最终食品中,也可以在适当稀释时作为佐餐甜味剂或在烘焙中作为糖的家庭替代品独立使用。甜味剂包括天然甜味剂诸如蔗糖、高果糖玉米糖浆、糖蜜、枫糖浆和蜂蜜以及人造甜味剂诸如阿斯巴甜、糖精和三氯蔗糖。甜叶菊提取物是天然甜味剂,其可从多年生灌木甜叶菊(Stevia rebaudiana)中分离和提取。甜叶菊通常在南美和亚洲种植,以用于甜叶菊提取物的商业生产。纯化至各种程度的甜叶菊提取物在商业上用作食品和共混物中的高强度甜味剂,或单独用作佐餐甜味剂。
几种甜菊醇糖苷的化学结构在图1中示出,包括二萜甜菊醇和各种甜菊醇糖苷。甜叶菊植物的提取物大致包含有助于甜味的甜菊醇糖苷,尽管每种甜菊醇糖苷的量通常变化,尤其是在不同的生产批次之间。
由于已经证明从甜叶菊植物中回收和纯化甜菊醇糖苷是劳动密集型且低效的,因此仍需要可积累高产率的所需甜菊醇糖苷(诸如RebD和RebM)的重组生产系统。还需要改进在重组宿主中生产甜菊醇糖苷,以用于商业用途。同样,仍然需要鉴定可以包括在重组宿主中以便产生更高的甜菊醇糖苷产率的酶(例如,DAP1)。
发明内容
与上述背景相反,本发明提供了优于现有技术的某些优点和进步。
尽管如本文公开的本发明不限于特定的优点或功能性,但本发明提供了一种能够在细胞培养物中生产一种或多种甜菊醇糖苷或甜菊醇糖苷组合物的重组宿主细胞,其包含编码与SEQ ID NO:2中列出的氨基酸序列具有至少60%序列同一性的抗损伤蛋白1(DAP1)多肽的重组基因;
其中编码DAP1多肽的重组基因的表达导致细胞培养物中一种或多种甜菊醇糖苷或甜菊醇糖苷组合物的产量增加。
在一个方面,本文公开的重组宿主细胞还包含:
(a)编码能够由法尼基二磷酸(FPP)和异戊烯二磷酸(IPP)合成香叶基香叶基焦磷酸(GGPP)的多肽的基因;
(b)编码能够由GGPP合成对映柯巴基二磷酸的多肽的基因;
(c)编码能够由对映柯巴基焦磷酸合成对映贝壳杉烯的多肽的基因;
(d)编码能够将甜菊醇或甜菊醇糖苷在其C-13羟基上糖基化的多肽的基因;
(e)编码能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C3’的β1,3糖基化的多肽的基因;
(f)编码能够将甜菊醇或甜菊醇糖苷在其C-19羧基上糖基化的多肽的基因;和/或
(g)编码能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C2’的β1,2糖基化的多肽的基因;
以及
(h)编码能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯醇和/或对映贝壳杉烯醛的多肽的基因;
其中所述多肽包含与SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:117、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74或SEQ ID NO:76中列出的氨基酸序列中的一个具有至少70%序列同一性的多肽;以及
(i)编码能够由对映贝壳杉烯酸合成甜菊醇的多肽的基因;
其中所述多肽包含与SEQ ID NO:94、SEQ ID NO:97、SEQ ID NO:100、SEQ ID NO:101、SEQ ID NO:102、SEQ ID NO:103、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112或SEQ ID NO:114中列出的氨基酸序列中的一个具有至少70%序列同一性的多肽;以及
(j)编码能够还原细胞色素P450复合物的多肽的基因;
其中所述多肽包含与SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92中列出的氨基酸序列中的一个具有至少70%序列同一性的多肽;并且
任选地,其中编码DAP1多肽的重组基因相对于缺乏所述重组基因的相应宿主细胞过表达。
在一个方面,本文公开的重组宿主细胞还包含:
(a)编码能够由法尼基二磷酸(FPP)和异戊烯二磷酸(IPP)合成香叶基香叶基焦磷酸(GGPP)的多肽的基因;
其中所述多肽包含与SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32或SEQ ID NO:116中列出的氨基酸序列具有至少70%序列同一性的多肽;
(b)编码能够由GGPP合成对映柯巴基二磷酸的多肽的基因;
其中所述多肽包含与SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40或SEQ ID NO:42中列出的氨基酸序列中的一个具有至少70%序列同一性的多肽;
(c)编码能够由对映柯巴基焦磷酸合成对映贝壳杉烯的多肽的基因;
其中所述多肽包含与SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50或SEQ ID NO:52中列出的氨基酸序列中的一个具有至少70%序列同一性的多肽;
(d)编码能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯醇和/或对映贝壳杉烯醛的多肽的基因;
其中所述多肽包含与SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:117、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74或SEQ ID NO:76中列出的氨基酸序列中的一个具有至少70%序列同一性的多肽;
(e)编码能够由对映贝壳杉烯酸合成甜菊醇的多肽的基因;
其中所述多肽包含与SEQ ID NO:94、SEQ ID NO:97、SEQ ID NO:100、SEQ ID NO:101、SEQ ID NO:102、SEQ ID NO:103、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112或SEQ ID NO:114中列出的氨基酸序列中的一个具有至少70%序列同一性的多肽;
(f)编码能够还原细胞色素P450复合物的多肽的基因;
其中所述多肽包含与SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92中列出的氨基酸序列中的一个具有至少70%序列同一性的多肽;
(g)编码能够将甜菊醇或甜菊醇糖苷在其C-13羟基上糖基化的多肽的基因;
其中所述多肽包含与SEQ ID NO:7中列出的氨基酸序列具有至少55%序列同一性的多肽;
(h)编码能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C3’的β1,3糖基化的多肽的基因;
其中所述多肽包含与SEQ ID NO:9中列出的氨基酸序列具有至少50%同一性的多肽;
(i)编码能够将甜菊醇或甜菊醇糖苷在其C-19羧基上糖基化的多肽的基因;
其中所述多肽包含与SEQ ID NO:4中列出的氨基酸序列具有至少55%序列同一性的多肽;和/或
(j)编码能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C2’的β1,2糖基化的多肽的基因;
其中所述多肽包含与SEQ ID NO:11或13中列出的氨基酸序列具有至少90%序列同一性或与SEQ ID NO:16中列出的氨基酸序列具有至少65%序列同一性的多肽;
其中基因中的至少一个是重组基因。
在本文公开的重组宿主细胞的一个方面,一种或多种甜菊醇糖苷是以下各项,或甜菊醇糖苷组合物包含以下各项:甜菊醇-13-O-葡糖苷(13-SMG)、甜菊醇-1,2-二糖苷、甜菊醇-1,3-二糖苷、甜菊醇-19-O-葡糖苷(19-SMG)、1,2-甜菊醇糖苷、1,3-甜菊醇糖苷、甜茶苷、莱鲍迪苷A(RebA)、莱鲍迪苷B(RebB)、莱鲍迪苷C(RebC)、莱鲍迪苷D(RebD)、莱鲍迪苷E(RebE)、莱鲍迪苷F(RebF)、莱鲍迪苷M(RebM)、莱鲍迪苷Q(RebQ)、莱鲍迪苷I(RebI)、杜尔可苷A、和/或它们的异构体。
在本文公开的重组宿主细胞的一个方面,重组宿主细胞是植物细胞、哺乳动物细胞、昆虫细胞、真菌细胞、藻类细胞或细菌细胞。
本发明还提供了一种在细胞培养物中生产一种或多种甜菊醇糖苷的方法,包括在基因表达的条件下使本文公开的重组宿主细胞在细胞培养物中生长,并且其中一种或多种甜菊醇糖苷或甜菊醇糖苷组合物由重组宿主细胞生产。
在本文公开的方法的一个方面,基因组成型表达和/或诱导基因的表达。
在本文公开的方法的一个方面,使重组宿主细胞在发酵罐中在一定的温度下生长一定的时间段,其中温度和时间段有利于一种或多种甜菊醇糖苷或甜菊醇糖苷组合物的生产。
在一个方面,本文公开的方法还包括从细胞培养物中分离所生产的一种或多种甜菊醇糖苷或甜菊醇糖苷组合物。
在本文公开的方法的一个方面,分离步骤包括:
(a)提供包含所生产的一种或多种甜菊醇糖苷或甜菊醇糖苷组合物的细胞培养物;
(b)将细胞培养物的液相与细胞培养物的固相分开,以获得包含所生产的一种或多种甜菊醇糖苷或甜菊醇糖苷组合物的上清液;
(c)提供一种或多种吸附树脂,包括在填充柱中提供吸附树脂;以及
(d)使步骤(b)的上清液与一种或多种吸附树脂接触,以便获得所生产的一种或多种甜菊醇糖苷或甜菊醇糖苷组合物的至少一部分,从而分离所生产的一种或多种甜菊醇糖苷或甜菊醇糖苷组合物;
或
(a)提供包含所生产的一种或多种甜菊醇糖苷或甜菊醇糖苷组合物的细胞培养物;
(b)将细胞培养物的液相与细胞培养物的固相分开,以获得包含所生产的一种或多种甜菊醇糖苷或甜菊醇糖苷组合物的上清液;
(c)提供一个或多个离子交换或离子交换或反相色谱柱;以及
(d)使步骤(b)的上清液与一个或多个离子交换或离子交换或反相色谱柱接触,以便获得所生产的一种或多种甜菊醇糖苷或甜菊醇糖苷组合物的至少一部分,从而分离所生产的一种或多种甜菊醇糖苷或甜菊醇糖苷组合物;
或
(a)提供包含所生产的一种或多种甜菊醇糖苷或甜菊醇糖苷组合物的细胞培养物;
(b)将细胞培养物的液相与细胞培养物的固相分开,以获得包含所生产的一种或多种甜菊醇糖苷或甜菊醇糖苷组合物的上清液;
(c)结晶或提取所生产的一种或多种甜菊醇糖苷或甜菊醇糖苷组合物,从而分离所生产的一种或多种甜菊醇糖苷或甜菊醇糖苷组合物。
在一个方面,本文公开的方法还包括从细胞培养物中回收所生产的一种或多种甜菊醇糖苷或甜菊醇糖苷组合物。
在本文公开的方法的一个方面,所述回收的一种或多种甜菊醇糖苷或甜菊醇糖苷组合物相对于植物来源的甜叶菊提取物具有降低水平的甜叶菊植物来源的组分。
本发明还提供了一种用于生产一种或多种甜菊醇糖苷或甜菊醇糖苷组合物的方法,包括使用以下各项在重组宿主细胞的细胞培养基中对植物来源的或合成的甜菊醇和/或甜菊醇糖苷进行全细胞生物转化:
(a)与SEQ ID NO:2中列出的氨基酸序列具有至少60%序列同一性的DAP1多肽;
(b)能够由法尼基二磷酸(FPP)和异戊烯二磷酸(IPP)合成香叶基香叶基焦磷酸(GGPP)的多肽;
(c)能够由GGPP合成对映柯巴基二磷酸的多肽;
(d)能够由对映柯巴基焦磷酸合成对映贝壳杉烯的多肽;
(e)能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯酸醇和/或对映贝壳杉烯醛且与SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:117、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74或SEQ ID NO:76中列出的氨基酸序列中的一个具有至少70%序列同一性的多肽;
(f)能够由对映贝壳杉烯酸合成甜菊醇且与SEQ ID NO:94、SEQ ID NO:97、SEQ ID NO:100、SEQ ID NO:101、SEQ ID NO:102、SEQ ID NO:103、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112或SEQ ID NO:114中列出的氨基酸序列中的一个具有至少70%序列同一性的多肽;
(g)能够还原细胞色素P450复合物且与SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92中列出的氨基酸序列中的一个具有至少70%序列同一性的多肽;
(h)能够将甜菊醇或甜菊醇糖苷在其C-13羟基上糖基化的多肽;
(i)能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C3’的β1,3糖基化的多肽;
(j)能够将甜菊醇或甜菊醇糖苷在其C-19羧基上糖基化的多肽;和/或
(k)能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C2’的β1,2糖基化的多肽;
其中所述多肽中的至少一种是在本文公开的重组宿主细胞中表达的重组多肽;以及从而产生一种或多种甜菊醇糖苷或甜菊醇糖苷组合物。
在本文公开的方法的一个方面:
(a)能够由法尼基二磷酸(FPP)和异戊烯二磷酸(IPP)合成香叶基香叶基焦磷酸(GGPP)的多肽包括与SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32或SEQ ID NO:116中列出的氨基酸序列具有至少70%序列同一性的多肽;
(b)能够由GGPP合成对映柯巴基二磷酸的多肽包括与SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40或SEQ ID NO:42中列出的氨基酸序列中的一个具有至少70%序列同一性的多肽;
(c)能够由对映柯巴基焦磷酸合成对映贝壳杉烯的多肽包括与SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50或SEQ ID NO:52中列出的氨基酸序列中的一个具有至少70%序列同一性的多肽;
(d)能够将甜菊醇或甜菊醇糖苷在其C-13羟基上糖基化的多肽包括与SEQ ID NO:7中列出的氨基酸序列具有至少55%序列同一性的多肽;
(e)能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C3’的β1,3糖基化的多肽包括与SEQ ID NO:9中列出的氨基酸序列具有至少50%同一性的多肽;
(f)能够将甜菊醇或甜菊醇糖苷在其C-19羧基上糖基化的多肽包括与SEQ ID NO:4中列出的氨基酸序列具有至少55%序列同一性的多肽;和/或
(g)能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C2’的β1,2糖基化的多肽包括与SEQ ID NO:11或13中列出的氨基酸序列具有至少90%序列同一性或与SEQ ID NO:16中列出的氨基酸序列具有至少65%序列同一性的多肽。
在本文公开的方法的一个方面,重组宿主细胞是植物细胞、哺乳动物细胞、昆虫细胞、真菌细胞、藻类细胞或细菌细胞。
本发明还提供了一种用于生产一种或多种甜菊醇糖苷或甜菊醇糖苷组合物的体外方法,包括将以下各项以及植物来源的或合成的甜菊醇糖苷前体添加到反应混合物中:
(a)与SEQ ID NO:2中列出的氨基酸序列具有至少60%序列同一性的DAP1多肽;
(b)能够由法尼基二磷酸(FPP)和异戊烯二磷酸(IPP)合成香叶基香叶基焦磷酸(GGPP)的多肽;
(c)能够由GGPP合成对映柯巴基二磷酸的多肽;
(d)能够由对映柯巴基焦磷酸合成对映贝壳杉烯的多肽;
(e)能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯酸醇和/或对映贝壳杉烯醛且与SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:117、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74或SEQ ID NO:76中列出的氨基酸序列中的一个具有至少70%序列同一性的多肽;
(f)能够由对映贝壳杉烯酸合成甜菊醇且与SEQ ID NO:94、SEQ ID NO:97、SEQ ID NO:100、SEQ ID NO:101、SEQ ID NO:102、SEQ ID NO:103、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112或SEQ ID NO:114中列出的氨基酸序列中的一个具有至少70%序列同一性的多肽;
(g)能够还原细胞色素P450复合物且与SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92中列出的氨基酸序列中的一个具有至少70%序列同一性的多肽;
(h)能够将甜菊醇或甜菊醇糖苷在其C-13羟基上糖基化的多肽;
(i)能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C3’的β1,3糖基化的多肽;
(j)能够将甜菊醇或甜菊醇糖苷在其C-19羧基上糖基化的多肽;和/或
(k)能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C2’的β1,2糖基化的多肽;
其中所述多肽中的至少一种是重组多肽;以及从而产生一种或多种甜菊醇糖苷或甜菊醇糖苷组合物。
在本文公开的方法的一个方面:
(a)能够由法尼基二磷酸(FPP)和异戊烯二磷酸(IPP)合成香叶基香叶基焦磷酸(GGPP)的多肽包括与SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32或SEQ ID NO:116中列出的氨基酸序列具有至少70%序列同一性的多肽;
(b)能够由GGPP合成对映柯巴基二磷酸的多肽包括与SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40或SEQ ID NO:42中列出的氨基酸序列中的一个具有至少70%序列同一性的多肽;
(c)能够由对映柯巴基焦磷酸合成对映贝壳杉烯的多肽包括与SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50或SEQ ID NO:52中列出的氨基酸序列中的一个具有至少70%序列同一性的多肽;
(d)能够将甜菊醇或甜菊醇糖苷在其C-13羟基上糖基化的多肽包括与SEQ ID NO:7中列出的氨基酸序列具有至少55%序列同一性的多肽;
(e)能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C3’的β1,3糖基化的多肽包括与SEQ ID NO:9中列出的氨基酸序列具有至少50%同一性的多肽;
(f)能够将甜菊醇或甜菊醇糖苷在其C-19羧基上糖基化的所述多肽包括与SEQ ID NO:4中列出的氨基酸序列具有至少55%序列同一性的多肽;和/或
(g)能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C2’的β1,2糖基化的多肽包括与SEQ ID NO:11或13中列出的氨基酸序列具有至少90%序列同一性或与SEQ ID NO:16中列出的氨基酸序列具有至少65%序列同一性的多肽。
在本文公开的方法的一个方面,反应混合物包括:
(a)与SEQ ID NO:2中列出的氨基酸序列具有至少60%序列同一性的重组DAP1多肽;能够由法尼基二磷酸(FPP)和异戊烯二磷酸(IPP)合成香叶基香叶基焦磷酸(GGPP)的重组多肽;能够由GGPP合成对映柯巴基二磷酸的重组多肽;能够由对映柯巴基焦磷酸合成对映贝壳杉烯的重组多肽;能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯酸醇和/或对映贝壳杉烯醛且与SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:117、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74或SEQ ID NO:76中列出的氨基酸序列中的一个具有至少70%序列同一性的重组多肽;能够由对映贝壳杉烯酸合成甜菊醇且与SEQ ID NO:94、SEQ ID NO:97、SEQ ID NO:100、SEQ ID NO:101、SEQ ID NO:102、SEQ ID NO:103、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112或SEQ ID NO:114中列出的氨基酸序列中的一个具有至少70%序列同一性的重组多肽;能够还原细胞色素P450复合物且与SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92中列出的氨基酸序列中的一个具有至少70%序列同一性的重组多肽;能够将甜菊醇或甜菊醇糖苷在其C-13羟基上糖基化的重组多肽;能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C3’的β1,3糖基化的重组多肽;能够将甜菊醇或甜菊醇糖苷在其C-19羧基上糖基化的重组多肽;和/或能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C2’的β1,2糖基化的重组多肽;
(b)葡萄糖、果糖、蔗糖、木糖、鼠李糖、尿苷二磷酸(UDP)-葡萄糖、UDP-鼠李糖、UDP-木糖和/或N-乙酰基-葡糖胺;和/或
(c)反应缓冲液和/或盐。
在本文公开的方法的一个方面,一种或多种甜菊醇糖苷是以下各项,或甜菊醇糖苷组合物包含以下各项:甜菊醇-13-O-葡糖苷(13-SMG)、甜菊醇-1,2-二糖苷、甜菊醇-1,3-二糖苷、甜菊醇-19-O-葡糖苷(19-SMG)、1,2-甜菊醇糖苷、1,3-甜菊醇糖苷、甜茶苷、莱鲍迪苷A(RebA)、莱鲍迪苷B(RebB)、莱鲍迪苷C(RebC)、莱鲍迪苷D(RebD)、莱鲍迪苷E(RebE)、莱鲍迪苷F(RebF)、莱鲍迪苷M(RebM)、莱鲍迪苷Q(RebQ)、莱鲍迪苷I(RebI)、杜尔可苷A、和/或它们的异构体。
本发明还提供了一种细胞培养物,其包含本文公开的重组宿主细胞,所述细胞培养物还包含:
(a)由重组宿主细胞生产的一种或多种甜菊醇糖苷或甜菊醇糖苷组合物;
(b)葡萄糖、果糖、蔗糖、木糖、鼠李糖、尿苷二磷酸(UDP)-葡萄糖、UDP-鼠李糖、UDP-木糖和/或N-乙酰基-葡糖胺;以及
(c)补充营养素,包括痕量金属、维生素、盐、YNB和/或氨基酸;
其中一种或多种甜菊醇糖苷或甜菊醇糖苷组合物以至少1mg/升细胞培养物的浓度存在;
其中细胞培养物相对于来自甜叶菊植物的甜菊醇糖苷组合物富含一种或多种甜菊醇糖苷或甜菊醇糖苷组合物,并且相对于植物来源的甜叶菊提取物具有降低水平的甜叶菊植物来源的组分。
本发明还提供了一种来自在细胞培养物中生长的本文公开的重组宿主细胞的细胞裂解物,其包含:
(a)由所述重组宿主细胞生产的所述一种或多种甜菊醇糖苷或所述甜菊醇糖苷组合物;
(b)葡萄糖、果糖、蔗糖、木糖、鼠李糖、尿苷二磷酸(UDP)-葡萄糖、UDP-鼠李糖、UDP-木糖和/或N-乙酰基-葡糖胺;和/或
(c)补充营养素,包括痕量金属、维生素、盐、酵母氮源基础、YNB和/或氨基酸;
其中由重组宿主细胞生产的一种或多种甜菊醇糖苷或甜菊醇糖苷组合物以至少1mg/升细胞培养物的浓度存在。
本发明还提供了一种反应混合物,其包括:
(a)与SEQ ID NO:2中列出的氨基酸序列具有至少60%序列同一性的重组DAP1多肽;
(b)一种或多种甜菊醇糖苷或甜菊醇糖苷组合物;
(c)能够由法尼基二磷酸(FPP)和异戊烯二磷酸(IPP)合成香叶基香叶基焦磷酸(GGPP)的重组多肽;能够由GGPP合成对映柯巴基二磷酸的重组多肽;能够由对映柯巴基焦磷酸合成对映贝壳杉烯的重组多肽;能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯酸醇和/或对映贝壳杉烯醛且与SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:117、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74或SEQ ID NO:76中列出的氨基酸序列中的一个具有至少70%序列同一性的重组多肽;能够由对映贝壳杉烯酸合成甜菊醇且与SEQ ID NO:94、SEQ ID NO:97、SEQ ID NO:100、SEQ ID NO:101、SEQ ID NO:102、SEQ ID NO:103、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112或SEQ ID NO:114中列出的氨基酸序列中的一个具有至少70%序列同一性的重组多肽;能够还原细胞色素P450复合物且与SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92中列出的氨基酸序列中的一个具有至少70%序列同一性的重组多肽;能够将甜菊醇或甜菊醇糖苷在其C-13羟基上糖基化的重组多肽;能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C3’的β1,3糖基化的重组多肽;能够将甜菊醇或甜菊醇糖苷在其C-19羧基上糖基化的重组多肽;和/或能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C2’的β1,2糖基化的重组多肽;
(d)葡萄糖、果糖和/或蔗糖、尿苷二磷酸(UDP)-葡萄糖、UDP-鼠李糖、UDP-木糖和/或N-乙酰基-葡糖胺;和/或
(e)反应缓冲液和/或盐。
本发明还提供了一种重组宿主细胞,其包含编码抗损伤蛋白1(DAP1)多肽的重组基因,所述多肽与SEQ ID NO:2中列出的氨基酸序列具有至少60%的序列同一性,其中重组宿主细胞能够在细胞培养物中生产一种或多种甜菊醇糖苷或甜菊醇糖苷组合物,并且还包含以下各项中的一种或多种:
(a)编码能够由法尼基二磷酸(FPP)和异戊烯二磷酸(IPP)合成香叶基香叶基焦磷酸(GGPP)的多肽的基因;
其中所述多肽包含与SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32或SEQ ID NO:116中列出的氨基酸序列具有至少70%序列同一性的多肽;
(b)编码能够由GGPP合成对映柯巴基二磷酸的多肽的基因;
其中所述多肽包含与SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40或SEQ ID NO:42中列出的氨基酸序列中的一个具有至少70%序列同一性的多肽;
(c)编码能够由对映柯巴基焦磷酸合成对映贝壳杉烯的多肽的基因;
其中所述多肽包含与SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50或SEQ ID NO:52中列出的氨基酸序列中的一个具有至少70%序列同一性的多肽;
(d)编码能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯醇和/或对映贝壳杉烯醛的多肽的基因;
其中所述多肽包含与SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:117、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74或SEQ ID NO:76中列出的氨基酸序列中的一个具有至少70%序列同一性的多肽;
(e)编码能够由对映贝壳杉烯酸合成甜菊醇的多肽的基因;
其中所述多肽包含与SEQ ID NO:94、SEQ ID NO:97、SEQ ID NO:100、SEQ ID NO:101、SEQ ID NO:102、SEQ ID NO:103、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112或SEQ ID NO:114中列出的氨基酸序列中的一个具有至少70%序列同一性的多肽;以及
(f)编码能够还原细胞色素P450复合物的多肽的基因;
其中所述多肽包含与SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92中列出的氨基酸序列中的一个具有至少70%序列同一性的多肽;
其中编码DAP1多肽的重组基因的表达导致细胞培养物中一种或多种甜菊醇糖苷或甜菊醇糖苷组合物的产量增加。
在一个方面,本文公开的重组宿主细胞还包含:
(g)编码能够将甜菊醇或甜菊醇糖苷在其C-13羟基上糖基化的多肽的基因;
其中所述多肽包含与SEQ ID NO:7中列出的氨基酸序列具有至少55%序列同一性的多肽;
(h)编码能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C3’的β1,3糖基化的多肽的基因;
其中所述多肽包含与SEQ ID NO:9中列出的氨基酸序列具有至少50%同一性的多肽;
(i)编码能够将甜菊醇或甜菊醇糖苷在其C-19羧基上糖基化的多肽的基因;
其中所述多肽包含与SEQ ID NO:4中列出的氨基酸序列具有至少55%序列同一性的多肽;和/或
(j)编码能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C2’的β1,2糖基化的多肽的基因;
其中所述多肽包含与SEQ ID NO:11或13中列出的氨基酸序列具有至少90%序列同一性或与SEQ ID NO:16中列出的氨基酸序列具有至少65%序列同一性的多肽。
本发明还提供了由本文公开的重组宿主细胞生产的一种或多种甜菊醇糖苷;
其中由重组宿主细胞生产的一种或多种甜菊醇糖苷以不同于来自甜叶菊植物的甜菊醇糖苷组合物的相对量存在,并且相对于植物来源的甜叶菊提取物具有降低水平的甜叶菊植物来源的组分。
本发明还提供了由本文公开的方法生产的一种或多种甜菊醇糖苷;
其中由重组宿主细胞生产的一种或多种甜菊醇糖苷以不同于来自甜叶菊植物的甜菊醇糖苷组合物的相对量存在,并且相对于植物来源的甜叶菊提取物具有降低水平的甜叶菊植物来源的组分。
本发明还提供了一种甜味剂组合物,其包含本文公开的一种或多种甜菊醇糖苷。
本发明还提供了一种食品,其包含本文公开的甜味剂组合物。
本发明还提供一种饮料或饮料浓缩物,其包含本文公开的甜味剂组合物。
结合随附权利要求,由以下详细描述,将更全面地理解本发明的这些和其他特征和优点。应注意,权利要求的范围由其中的叙述限定,而不是由本说明书中阐述的特征和优点的具体讨论限定。
附图说明
当结合以下附图阅读时,可以最好地理解本发明的实施方案的以下详细描述,其中用类似的附图标号表示类似的结构,并且其中:
图1示出由合适的UGT酶催化的代表性的初级甜菊醇糖苷糖基化反应和在甜叶菊提取物中发现的几种化合物的化学结构。
图2示出用于使用香叶基香叶基二磷酸合酶(GGPPS)、对映柯巴基二磷酸合酶(CDPS)、对映贝壳杉烯合酶(KS)、对映贝壳杉烯氧化酶(KO)、以及对映贝壳杉烯酸羟化酶(KAH)多肽由香叶基香叶基二磷酸产生甜菊醇的生物化学途径。
图3示出SEQ ID NO:1(GenBank登录号AY558521)中列出的DAP1核苷酸序列,其编码SEQ ID NO:2(GenBank登录号AAS56847)中列出的DAP1多肽序列。
图4示出甜菊醇+5Glc(#22)、甜菊醇+6Glc(异构体1)和甜菊醇+7Glc(异构体2)的结构。
图5示出对映贝壳杉烯酸+3Glc(异构体1)、甜菊醇+7Glc(异构体5)和甜菊醇+4Glc(#26)的结构。
图6示出对映贝壳杉烯酸+3Glc(异构体2)和对映贝壳杉烯醇+3Glc(异构体1)的结构。
技术人员将会知道,附图中的元件是为了简单和清楚的目的而示出的,并且不一定按比例绘制。例如,附图中的一些元件的尺寸可以相对于其他元件放大,以帮助改善对本发明的一个或多个实施方案的理解。
具体实施方式
本文引用的所有出版物、专利和专利申请均出于所有目的特此通过引用明确并入。
在详细描述本发明之前,将定义多个术语。除非上下文另外明确规定,如本文所用,单数形式“一个”、“一种”和“该”包括多个指代物。例如,提及“核酸”意指一种或多种核酸。
应注意,如“优选地”、“通常地”和“典型地”的术语在本文中不用于限制所要求保护的发明的范围或暗示某些特征对于所要求保护的发明的结构或功能是关键、必要或甚至重要的。相反,这些术语仅旨在突出可以或可以不在本发明的特定实施方案中使用的替代或附加特征。
出于描述和定义本发明的目的,应注意,术语“基本上”在本文中用于表示可归因于任何定量比较、值、测量或其他表示的固有的不确定性程度。术语“基本上”在本文还用于表示定量表示可不同于所述参考值而不造成在讨论中主题的基本功能有变化的程度。
可以使用本领域技术人员熟知的方法构建根据本发明的基因表达构建体和重组细胞。这些方法包括体外重组DNA技术、合成技术、体内重组技术以及聚合酶链式反应(PCR)技术。参见例如如以下各项中所述的技术:Green & Sambrook,2012,MOLECULAR CLONING:A LABORATORY MANUAL,第4版,Cold Spring Harbor Laboratory,New York;Ausubel等人,1989,CURRENT PROTOCOLS IN MOLECULAR BIOLOGY,Greene Publishing Associates and Wiley Interscience,New York;以及PCR Protocols:A Guide to Methods and Applications(Innis等人,1990,Academic Press,San Diego,CA)。
如本文所用,术语“多核苷酸”、“核苷酸”、“寡核苷酸”以及“核酸”可互换使用,在根据技术人员所理解的背景的单链或双链实施方案中是指包含DNA、RNA、其衍生物或其组合的核酸。
如本文所用,术语“微生物”、“微生物宿主”、“微生物宿主细胞”、“重组宿主”以及“重组宿主细胞”可互换使用。如本文所用,术语“重组宿主”旨在指代其基因组已经通过至少一个DNA序列增强的宿主。此类DNA序列包括但不限于非天然存在的基因、通常不转录成RNA或不翻译成蛋白质(“表达”)的DNA序列,以及希望引入宿主中的其他基因或DNA序列。应当理解,通常通过稳定引入一个或多个重组基因来增强本文所述的重组宿主的基因组。一般来讲,所引入的DNA最初不驻留在作为DNA受体的宿主中,而是在本公开的范围内,从给定宿主中分离DNA片段并随后将该DNA的一个或多个另外的拷贝引入相同宿主中,例如,以增强基因产物的产生或改变基因的表达模式。在一些情况下,所引入的DNA将通过,例如,同源重组或定点诱变来修饰或甚至替代内源基因或DNA序列。合适的重组宿主包括微生物。
如本文所用,术语“重组基因”是指引入受体宿主的基因或DNA序列,无论在这样的宿主中是否可能已经存在相同或相似的基因或DNA序列。在这种背景下,“引入”或“增强”在本领域中被已知为意指通过人的手引入或增强。因此,重组基因可以是来自另一物种的DNA序列,或者可以是来源于或存在于相同物种中但通过重组方法结合到宿主中以形成重组宿主的DNA序列。应当认识到,引入宿主的重组基因与正常存在于被转化的宿主中的DNA序列可以是相同的,并且被引入以提供DNA的一个或多个另外的拷贝,从而允许该DNA的基因产物的过表达或改进表达。在一些方面,所述重组基因由cDNA编码。在其他实施方案中,重组基因是合成的和/或经密码子优化以在酿酒酵母(S.cerevisiae)中表达。
如本文所用,术语“工程化的生物合成途径”是指在重组宿主中发生的生物合成途径,如本文所述。在一些方面,生物合成途径的一个或多个步骤不在未修饰的宿主中天然发生。在一些实施方案中,将基因的异源型式引入包含该基因的内源型式的宿主中。
如本文所用,术语“内源”基因是指来源于特定的生物体、组织或细胞并在其内产生或合成的基因。在一些实施方案中,内源基因是酵母基因。在一些实施方案中,该基因对于酿酒酵母是内源的,所述酿酒酵母包括但不限于酿酒酵母菌株S288C。在一些实施方案中,内源酵母基因过表达。如本文所用,术语“过表达”用于指生物体中基因的表达水平高于野生型生物体中的基因表达水平。参见例如Prelich,2012,Genetics 190:841-54。参见例如Giaever & Nislow,2014,Genetics 197(2):451-65。如本文所用,术语“缺失”、“缺失的”、“敲除”以及“敲除的”可互换使用,是指已经被操纵以便不再在包括但不限于酿酒酵母的生物体中表达的内源基因(参见例如实施例4)。
如本文所用,术语“异源性序列”和“异源性编码序列”用于描述来源于除重组宿主之外的物种的序列。在一些实施方案中,重组宿主是酿酒酵母细胞,并且异源性序列来源于除酿酒酵母之外的生物体。异源性编码序列,例如,可以来自不同于表达该异源性序列的重组宿主的原核微生物、真核微生物、植物、动物、昆虫、或真菌。在一些实施方案中,编码序列是宿主天然的序列。
“选择性标记”可以是弥补宿主细胞营养缺陷型、提供抗生素抗性、或导致颜色变化的任何数量的基因中的一个。然后使用本领域熟知的方法将基因置换载体的线性化DNA片段引入细胞中(参见下文)。线性片段在基因组中的整合和基因的破坏可以基于选择标记确定并且可以通过例如PCR或Southern印迹分析来验证。在其用于选择之后,可通过例如Cre-LoxP系统将选择性标记从宿主细胞的基因组中移除(参见例如Gossen等人,2002,Ann.Rev.Genetics 36:153-173和U.S.2006/0014264)。另选地,基因置换载体可以构建成使得包括将破坏的基因的一部分,其中该部分缺乏任何内源基因启动子序列并且不编码该基因的编码序列或编码其无活性片段。
如本文所用,术语“变体”和“突变体”用于描述与特定蛋白质的野生型序列相比在一个或多个氨基酸处经过修饰的蛋白质序列。
如本文所用,术语“无活性片段”是编码具有例如小于约10%(例如,小于约9%、小于约8%、小于约7%、小于约6%、小于约5%、小于约4%、小于约3%、小于约2%、小于约1%、或0%)的由该基因的全长编码序列产生的蛋白质的活性的蛋白质的基因的片段。将基因的这样一部分插入载体中,其方式使得没有已知的启动子序列与基因序列可操作地连接,但终止密码子和转录终止序列与基因序列的该部分可操作地连接。随后可将该载体在基因序列的部分中线性化并转化到细胞中。通过单同源重组,然后在其失活的情况下将该线性化载体整合到基因的内源对应物中。
如本文所用,术语“甜菊醇糖苷”是指莱鲍迪苷A(RebA)(CAS#58543-16-1)、莱鲍迪苷B(Rebb)(CAS#58543-17-2)、莱鲍迪苷C(RebC)(CAS#63550-99-2)、莱鲍迪苷D(RebD)(CAS#63279-13-0)、莱鲍迪苷E(RebE)(CAS#63279-14-1)、莱鲍迪苷F(RebF)(CAS#438045-89-7)、莱鲍迪苷M(RebM)(CAS#1220616-44-3)、甜茶苷(CAS#63849-39-4)、杜尔可苷A(CAS#64432-06-0)、莱鲍迪苷I(RebI)(MassBank记录:FU000332)、莱鲍迪苷Q(RebQ)、1,2-甜菊醇糖苷(CAS#57817-89-7)、1,3-甜菊醇糖苷(RebG)、甜菊醇-1,2-二糖苷(MassBank记录:FU000299)、甜菊醇-1,3-二糖苷、甜菊醇-13-O-葡糖苷(13-SMG)、甜菊醇-19-O-葡萄苷(19-SMG)、三糖基化甜菊醇糖苷、四糖基化甜菊醇糖苷、五糖基化甜菊醇糖苷、六糖基化甜菊醇糖苷、七糖基化甜菊醇糖苷、以及它们的异构体。参见图1;还参见由Harriet Wallin,Food Agric.Org.筹备的Steviol Glycosides Chemical and Technical Assessment 69th JECFA,2007。
如本文所用,术语“甜菊醇糖苷前体”和“甜菊醇糖苷前体化合物”用于指甜菊醇糖苷生物合成途径中的中间体化合物。甜菊醇糖苷前体包括但不限于香叶基香叶基二磷酸(GGPP)、对映柯巴基二磷酸、对映贝壳杉烯、对映贝壳杉烯醇、对映贝壳杉烯醛、对映贝壳杉烯酸、以及甜菊醇。参见图2。在一些实施方案中,甜菊醇糖苷前体本身是甜菊醇糖苷化合物。例如,19-SMG、甜茶苷、1,2-甜菊苷和RebE是RebM的甜菊醇糖苷前体。参见图1。可以在体内(即,在重组宿主中)、体外(即,酶促地)或通过全细胞生物转化来生产甜菊醇糖苷和/或甜菊醇糖苷前体。如本文所用,术语“生产”和“积累”可以互换使用以描述体内、体外或通过全细胞生物转化实现的甜菊醇糖苷和甜菊醇糖苷前体的合成。
重组的生产甜菊醇糖苷的酿酒酵母(Saccharomyces cerevisiae(S.cerevisiae))菌株描述于WO 2011/153378,WO 2013/022989,WO 2014/122227以及WO 2014/122328,这些专利的每一个全文以引用方式并入。在重组宿主中,通过全细胞生物转化并且体外生产甜菊醇糖苷的方法也描述于WO 2011/153378、WO 2013/022989、WO 2014/122227和WO 2014/122328中。所有这些出版物均特此以引用方式全文并入本文。
在一些实施方案中,通过在重组宿主中参与甜菊醇糖苷生物合成途径的一种或多种酶的表达,在体内生产甜菊醇糖苷和/或甜菊醇糖苷前体。例如,表达编码与SEQ ID NO:2中列出的氨基酸序列具有60%或更大的序列同一性的抗损伤蛋白1(DAP1)多肽的重组基因的生产甜菊醇的重组宿主能够在体内生产一种或多种甜菊醇糖苷。
在一些实施方案中,编码DAP1多肽的重组基因的表达导致一种或多种甜菊醇糖苷在体内的产量增加。
在一些实施方案中,包括以下各项的重组宿主可以在体内生产甜菊醇:编码能够由法尼基二磷酸(FPP)和异戊烯二磷酸(IPP)合成香叶基香叶基焦磷酸(GGPP)的多肽(例如,香叶基香叶基二磷酸合酶(GGPPS))的基因;编码能够由GGPP合成对映柯巴基二磷酸的多肽(例如,对映柯巴基二磷酸合酶(CDPS))的基因;编码能够由对映柯巴基焦磷酸合成对映贝壳杉烯的多肽(例如,贝壳杉烯合酶(KS))的基因;编码能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯醇和/或对映贝壳杉烯醛的多肽(例如,贝壳杉烯氧化酶(KO))的基因;编码能够还原细胞色素P450复合物的多肽(例如,细胞色素P450还原酶(CPR);例如,但不限于在NADPH转化为NADP+期间能够从NADPH向细胞色素P450复合物进行电子转移的多肽,其被用作萜类化合物生物合成的辅因子)的基因;以及编码能够由对映贝壳杉烯酸合成甜菊醇的多肽(例如,甜菊醇合酶(KAH))的基因;和/或编码能够由GGPP合成对映柯巴基二磷酸并且由对映柯巴基焦磷酸合成对映贝壳杉烯的双功能多肽(例如,对映柯巴基二磷酸合酶(CDPS)-对映贝壳杉烯合酶(KS)多肽)的基因。参见例如图1。技术人员将理解,这些基因中的一个或多个对于宿主可以是内源的,条件是这些基因中的至少一个(在一些实施方案中,全部)是引入重组宿主中的重组基因。
在一些实施方案中,通过编码抗损伤蛋白1(DAP1)多肽的重组基因和在重组宿主中参与甜菊醇糖苷生物合成途径的一种或多种酶的表达,在体内生产甜菊醇糖苷和/或甜菊醇糖苷前体。例如,包含以下各项的生产甜菊醇的重组宿主可以在体内生产甜菊醇糖苷和/或甜菊醇糖苷前体:编码与SEQ ID NO:2中列出的氨基酸序列具有60%或更大的序列同一性的抗损伤蛋白1(DAP1)多肽的基因;编码能够由法尼基二磷酸(FPP)和异戊烯二磷酸(IPP)合成香叶基香叶基焦磷酸(GGPP)的多肽的基因;编码能够由GGPP合成对映柯巴基二磷酸的多肽的基因;编码能够由对映柯巴基焦磷酸合成对映贝壳杉烯的多肽的基因;编码能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯醇和/或对映贝壳杉烯醛的多肽的基因;编码能够还原细胞色素P450复合物的多肽的基因;和/或编码能够由GGPP合成对映柯巴基二磷酸并且由对映柯巴基焦磷酸合成对映贝壳杉烯的双功能多肽的基因;编码能够将甜菊醇或甜菊醇糖苷在其C-13羟基上糖基化的多肽(例如,UGT85C2多肽)的基因;编码能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C3’的β1,3糖基化的多肽(例如,UGT76G1多肽)的基因;编码能够将甜菊醇或甜菊醇糖苷在其C-19羧基上糖基化的多肽(例如,UGT74G1多肽)的基因;和/或编码能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C2’的β1,2糖基化的多肽(例如,UGT91D2和EUGT11多肽)的基因。参见例如图1和2。技术人员将理解,这些基因中的一个或多个对于宿主可以是内源的,条件是这些基因中的至少一个(在一些实施方案中,全部)是引入重组宿主中的重组基因。
在一些方面,能够由法尼基二磷酸(FPP)和异戊烯二磷酸(IPP)合成香叶基香叶基焦磷酸(GGPP)的多肽包括具有SEQ ID NO:20(可由SEQ ID NO:19中列出的核苷酸序列编码)、SEQ ID NO:22(由SEQ ID NO:21中列出的核苷酸序列编码)、SEQ ID NO:24(由SEQ ID NO:23中列出的核苷酸序列编码)、SEQ ID NO:26(由SEQ ID NO:25中列出的核苷酸序列编码)、SEQ ID NO:28(由SEQ ID NO:27中列出的核苷酸序列编码)、SEQ ID NO:30(由SEQ ID NO:29中列出的核苷酸序列编码)、SEQ ID NO:32(由SEQ ID NO:31中列出的核苷酸序列编码)或SEQ ID NO:116(可由SEQ ID NO:115中列出的核苷酸序列编码)中列出的氨基酸序列的多肽。
在一些方面,能够由GGPP合成对映柯巴基二磷酸的多肽包括具有SEQ ID NO:34(可由SEQ ID NO:33中列出的核苷酸序列编码)、SEQ ID NO:36(由SEQ ID NO:35中列出的核苷酸序列编码)、SEQ ID NO:38(由SEQ ID NO:37中列出的核苷酸序列编码)、SEQ ID NO:40(由SEQ ID NO:39中列出的核苷酸序列编码)或SEQ ID NO:42(由SEQ ID NO:41中列出的核苷酸序列编码)中列出的氨基酸序列的多肽。在一些实施方案中,CDPS多肽缺乏叶绿体转运肽。
在一些方面,能够由对映柯巴基焦磷酸合成对映贝壳杉烯的多肽包括具有SEQ ID NO:44(可由SEQ ID NO:43中列出的核苷酸序列编码)、SEQ ID NO:46(由SEQ ID NO:45中列出的核苷酸序列编码)、SEQ ID NO:48(由SEQ ID NO:47中列出的核苷酸序列编码)、SEQ ID NO:50(由SEQ ID NO:49中列出的核苷酸序列编码)或SEQ ID NO:52(由SEQ ID NO:51中列出的核苷酸序列编码)中列出的氨基酸序列的多肽。
在一些实施方案中,重组宿主包含编码能够由GGPP合成对映柯巴基二磷酸并且由对映柯巴基焦磷酸合成对映贝壳杉烯的双功能多肽的基因。在一些方面,双功能多肽包括具有SEQ ID NO:54(可由SEQ ID NO:53中列出的核苷酸序列编码)、SEQ ID NO:56(由SEQ ID NO:55中列出的核苷酸序列编码)或SEQ ID NO:58(由SEQ ID NO:57中列出的核苷酸序列编码)中列出的氨基酸序列的多肽。
在一些方面,能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯醇和/或对映贝壳杉烯醛的多肽包括具有SEQ ID NO:60(可由SEQ ID NO:59中列出的核苷酸序列编码)、SEQ ID NO:62(由SEQ ID NO:61中列出的核苷酸序列编码)、SEQ ID NO:117(由SEQ ID NO:63或SEQ ID NO:64中列出的核苷酸序列编码)、SEQ ID NO:66(由SEQ ID NO:65中列出的核苷酸序列编码)、SEQ ID NO:68(由SEQ ID NO:67中列出的核苷酸序列编码)、SEQ ID NO:70(由SEQ ID NO:69中列出的核苷酸序列编码)、SEQ ID NO:72(由SEQ ID NO:71中列出的核苷酸序列编码)、SEQ ID NO:74(由SEQ ID NO:73中列出的核苷酸序列编码)或SEQ ID NO:76(由SEQ ID NO:75中列出的核苷酸序列编码)中列出的氨基酸序列的多肽。
在一些方面,能够还原细胞色素P450复合物的多肽包括具有SEQ ID NO:78(可由SEQ ID NO:77中列出的核苷酸序列编码)、SEQ ID NO:80(由SEQ ID NO:79中列出的核苷酸序列编码)、SEQ ID NO:82(由SEQ ID NO:81中列出的核苷酸序列编码)、SEQ ID NO:84(由SEQ ID NO:83中列出的核苷酸序列编码)、SEQ ID NO:86(由SEQ ID NO:85中列出的核苷酸序列编码)、SEQ ID NO:88(由SEQ ID NO:87中列出的核苷酸序列编码)、SEQ ID NO:90(由SEQ ID NO:89中列出的核苷酸序列编码)或SEQ ID NO:92(由SEQ ID NO:91中列出的核苷酸序列编码)中列出的氨基酸序列的多肽。
在一些方面,能够由对映贝壳杉烯酸合成甜菊醇的多肽包括具有SEQ ID NO:94(可由SEQ ID NO:93中列出的核苷酸序列编码)、SEQ ID NO:97(由SEQ ID NO:95或SEQ ID NO:96中列出的核苷酸序列编码)、SEQ ID NO:100(由SEQ ID NO:98或SEQ ID NO:99中列出的核苷酸序列编码)、SEQ ID NO:101、SEQ ID NO:102、SEQ ID NO:103、SEQ ID NO:104、SEQ ID NO:106(由SEQ ID NO:105中列出的核苷酸序列编码)、SEQ ID NO:108(由SEQ ID NO:107中列出的核苷酸序列编码)、SEQ ID NO:110(由SEQ ID NO:109中列出的核苷酸序列编码)、SEQ ID NO:112(由SEQ ID NO:111中列出的核苷酸序列编码)或SEQ ID NO:114(由SEQ ID NO:113中列出的核苷酸序列编码)中列出的氨基酸序列的多肽。
在一些实施方案中,重组宿主包含编码能够将甜菊醇或甜菊醇糖苷在其C-13羟基上糖基化的多肽(例如,UGT85C2多肽)(SEQ ID NO:7)的核酸、编码能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖或13-O-葡萄糖和19-O-葡萄糖两者的C3’的β1,3糖基化的多肽(例如,UGT76G1多肽)(SEQ ID NO:9)的核酸、编码能够将甜菊醇或甜菊醇糖苷在其C-19羧基上糖基化的多肽(例如,UGT74G1多肽)(SEQ ID NO:4)的核酸、编码能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖或13-O-葡萄糖和19-O-葡萄糖两者的C2’的β1,2糖基化的多肽(例如,EUGT11多肽)(SEQ ID NO:16)的核酸。在一些方面,能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖或13-O-葡萄糖和19-O-葡萄糖两者的C2’的β1,2糖基化的多肽(例如,UGT91D2多肽)可以是UGT91D2e多肽(SEQ ID NO:11)或UGT91D2e-b多肽(SEQ ID NO:13)。
在一些方面,能够将甜菊醇或甜菊醇糖苷在其C-13羟基上糖基化的多肽由SEQ ID NO:5或SEQ ID NO:6中列出的核苷酸序列编码,能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖或13-O-葡萄糖和19-O-葡萄糖两者的C3’的β1,3糖基化的多肽由SEQ ID NO:8中列出的核苷酸序列编码,能够将甜菊醇或甜菊醇糖苷在其C-19羧基上糖基化的多肽由SEQ ID NO:3中列出的核苷酸序列编码,能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖或13-O-葡萄糖和19-O-葡萄糖两者的C2’的β1,2糖基化的多肽由SEQ ID NO:10、12、14或15中列出的核苷酸序列编码。技术人员将理解,这些基因的表达可以是生产特定的甜菊醇糖苷所必需的,但是这些基因中的一个或多个对于宿主可以是内源的,条件是这些基因中的至少一个(在一些实施方案中,全部)是引入重组宿主中的重组基因。
在一个特定实施方案中,生产甜菊醇的重组微生物包含外源核酸,其编码能够将甜菊醇或甜菊醇糖苷在其C-13羟基上糖基化的多肽、能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C3’的β1,3糖基化的多肽、以及能够实现甜菊醇糖苷多肽的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C2’的β1,2糖基化的多肽。
在另一个特定实施方案中,生产甜菊醇的重组微生物包含外源核酸,其编码能够将甜菊醇或甜菊醇糖苷在其C-13羟基上糖基化的多肽;能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C3’的β1,3糖基化的多肽;能够将甜菊醇或甜菊醇糖苷在其C-19羧基上糖基化的多肽;以及能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C2’的β1,2糖基化的多肽。
在一个特定实施方案中,生产甜菊醇的重组微生物包含外源核酸,其编码能够将甜菊醇或甜菊醇糖苷在其C-13羟基上糖基化的多肽、能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C3’的β1,3糖基化的多肽、以及能够实现甜菊醇糖苷多肽的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C2’的β1,2糖基化的多肽、和/或抗损伤蛋白1(DAP1)多肽。
在另一个特定实施方案中,生产甜菊醇的重组微生物包含外源核酸,其编码能够将甜菊醇或甜菊醇糖苷在其C-13羟基上糖基化的多肽;能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C3’的β1,3糖基化的多肽;能够将甜菊醇或甜菊醇糖苷在其C-19羧基上糖基化的多肽;以及能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C2’的β1,2糖基化的多肽、和/或抗损伤蛋白1(DAP1)多肽。
在一些实施方案中,重组宿主包含编码抗损伤蛋白1(DAP1)多肽的基因。在一些方面,DAP1多肽包括具有SEQ ID NO:2中列出的氨基酸序列的多肽(可由SEQ ID NO:1中列出的核苷酸序列编码)。
在一些方面,编码DAP1多肽的基因是重组基因。在一些方面,重组基因与启动子可操作地连接。在一些方面,重组基因与终止子可操作地连接。在一些方面,启动子和终止子驱动重组基因的高表达。在一些方面,重组基因与强启动子可操作地连接,所述强启动子例如但不限于TEF1启动子。在一些方面,重组基因与终止子(例如,CYC1终止子)可操作地连接。在一些方面,重组基因包含来源于或存在于与重组宿主相同物种的核苷酸序列。在一些方面,编码DAP1多肽的重组基因的表达导致编码DAP1多肽的基因的总表达水平高于编码DAP1多肽的内源基因的表达水平,即DAP1多肽的过表达。
在一些方面,编码DAP1多肽的基因是存在于与重组宿主相同的物种中的基因,即天然基因。在一些实施方案中,编码DAP1多肽的天然基因的野生型启动子可以换成强启动子,例如TEF1启动子。在一些方面,强启动子驱动天然基因的高表达(即,基因的过表达)。在其他实施方案中,编码DAP1多肽的天然基因的野生型增强子可以换成强增强子。在一些实施方案中,强增强子驱动天然基因的高表达(即,基因的过表达)。在一些实施方案中,天然基因的野生型增强子(即,与启动子可操作地连接)和野生型启动子(即,与天然基因可操作地连接)两者可以分别换成强增强子和强启动子,从而导致DAP1多肽的过表达。
在一些实施方案中,重组宿主包含编码DAP1多肽的重组基因和编码DAP1多肽的天然基因。在一些实施方案中,重组宿主包含编码DAP1多肽的重组基因(其与强启动子(例如,TEF1启动子)可操作地连接)和天然基因,其中编码DAP1多肽的天然基因的野生型启动子和/或增强子分别换成强启动子(例如,TEF1启动子)和/或强增强子,从而导致DAP1多肽的过表达。
本领域普通技术人员将理解,例如,编码DAP1多肽的重组基因的表达;编码DAP1多肽的重组基因和天然基因的表达;以及编码DAP1多肽的天然基因的表达,其中天然基因的野生型启动子和/或增强子换成强启动子和/或增强子,相对于不表达编码DAP1多肽的重组基因的相应宿主和/或仅表达与野生型启动子和增强子可操作地连接的编码DAP1的天然基因的相应宿主,各自导致DAP1多肽的过表达-即,如本文所用,术语“表达”可包括过表达。
在一些实施方案中,使DAP1多肽过表达,以使编码DAP1多肽的基因的总表达水平比编码DAP1多肽的内源基因的表达水平高至少5%。在一些实施方案中,编码DAP1多肽的基因的总表达水平比编码DAP1的内源基因的表达水平高至少10%、或至少15%、或至少20%、或至少30%、或至少40%、或至少50%、或至少60%、或至少70%、或至少80%、或至少90%、或至少100%、或至少125%、或至少150%、或至少175%、或至少200%。
在一些方面,DAP1多肽的过表达导致P450的功能增强。在一些方面,DAP1多肽的过表达导致能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯醇和/或对映贝壳杉烯醛的多肽的功能增强(参见例如实施例3)。在一些方面,DAP1多肽的过表达导致能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯醇和/或对映贝壳杉烯醛的多肽的功能增强,所述多肽具有SEQ ID NO:60中列出的氨基酸序列。在一些方面,DAP1多肽的过表达导致能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯醇和/或对映贝壳杉烯醛的多肽的功能增强,所述多肽具有SEQ ID NO:62中列出的氨基酸序列。在一些方面,DAP1多肽的过表达导致能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯醇和/或对映贝壳杉烯醛的多肽的功能增强,所述多肽具有SEQ ID NO:117中列出的氨基酸序列。在一些方面,DAP1多肽的过表达导致能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯醇和/或对映贝壳杉烯醛的多肽的功能增强,所述多肽具有SEQ ID NO:66中列出的氨基酸序列。在一些方面,DAP1多肽的过表达导致能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯醇和/或对映贝壳杉烯醛的多肽的功能增强,所述多肽具有SEQ ID NO:68中列出的氨基酸序列。在一些方面,DAP1多肽的过表达导致能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯醇和/或对映贝壳杉烯醛的多肽的功能增强,所述多肽具有SEQ ID NO:70中列出的氨基酸序列。在一些方面,DAP1多肽的过表达导致能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯醇和/或对映贝壳杉烯醛的多肽的功能增强,所述多肽具有SEQ ID NO:70中列出的氨基酸序列。在一些方面,DAP1多肽的过表达导致能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯醇和/或对映贝壳杉烯醛的多肽的功能增强,所述多肽具有SEQ ID NO:72中列出的氨基酸序列。在一些方面,DAP1多肽的过表达导致能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯醇和/或对映贝壳杉烯醛的多肽的功能增强,所述多肽具有SEQ ID NO:74中列出的氨基酸序列。在一些方面,DAP1多肽的过表达导致能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯醇和/或对映贝壳杉烯醛的多肽的功能增强,所述多肽具有SEQ ID NO:76中列出的氨基酸序列。
在一些方面,DAP1多肽的过表达导致能够由对映贝壳杉烯酸合成甜菊醇的多肽的功能增强(参见例如实施例3)。在一些方面,DAP1多肽的过表达导致能够由对映贝壳杉烯酸合成甜菊醇的多肽的功能增强,所述多肽具有SEQ ID NO:94中列出的氨基酸序列。在一些方面,DAP1多肽的过表达导致能够由对映贝壳杉烯酸合成甜菊醇的多肽的功能增强,所述多肽具有SEQ ID NO:97中列出的氨基酸序列。在一些方面,DAP1多肽的过表达导致能够由对映贝壳杉烯酸合成甜菊醇的多肽的功能增强,所述多肽具有SEQ ID NO:100中列出的氨基酸序列。在一些方面,DAP1多肽的过表达导致能够由对映贝壳杉烯酸合成甜菊醇的多肽的功能增强,所述多肽具有SEQ ID NO:101中列出的氨基酸序列。在一些方面,DAP1多肽的过表达导致能够由对映贝壳杉烯酸合成甜菊醇的多肽的功能增强,所述多肽具有SEQ ID NO:102中列出的氨基酸序列。在一些方面,DAP1多肽的过表达导致能够由对映贝壳杉烯酸合成甜菊醇的多肽的功能增强,所述多肽具有SEQ ID NO:103中列出的氨基酸序列。在一些方面,DAP1多肽的过表达导致能够由对映贝壳杉烯酸合成甜菊醇的多肽的功能增强,所述多肽具有SEQ ID NO:104中列出的氨基酸序列。在一些方面,DAP1多肽的过表达导致能够由对映贝壳杉烯酸合成甜菊醇的多肽的功能增强,所述多肽具有SEQ ID NO:106中列出的氨基酸序列。在一些方面,DAP1多肽的过表达导致能够由对映贝壳杉烯酸合成甜菊醇的多肽的功能增强,所述多肽具有SEQ ID NO:108中列出的氨基酸序列。在一些方面,DAP1多肽的过表达导致能够由对映贝壳杉烯酸合成甜菊醇的多肽的功能增强,所述多肽具有SEQ ID NO:110中列出的氨基酸序列。在一些方面,DAP1多肽的过表达导致能够由对映贝壳杉烯酸合成甜菊醇的多肽的功能增强,所述多肽具有SEQ ID NO:112中列出的氨基酸序列。在一些方面,DAP1多肽的过表达导致能够由对映贝壳杉烯酸合成甜菊醇的多肽的功能增强,所述多肽具有SEQ ID NO:114中列出的氨基酸序列。
在一些方面,DAP1多肽在生产甜菊醇的重组宿主中的过表达导致通过甜菊醇糖苷的生物合成途径的通量增加。在一些方面,DAP1多肽的过表达导致13-SMG的产量增加。在一些方面,DAP1多肽的过表达导致RebB的产量增加(参见实施例3,表2)。在一些方面,DAP1多肽的过表达导致RebD和/或RebM的产量增加(参见实施例3,表3)。在一些方面,DAP1多肽的过表达导致总甜菊醇糖苷(即,计算为RebA、RebB、RebD、RebE、RebM、13-SMG、甜茶苷、甜菊醇-1,2-二糖苷、二糖基化甜菊醇、三糖基化甜菊醇、四糖基化甜菊醇、五糖基化甜菊醇、六糖基化甜菊醇、以及七糖基化甜菊醇的总和)的产量增加。
在一些实施方案中,DAP1多肽的过表达导致甜菊醇糖苷的产量增加至少5%。在一些实施方案中,DAP1多肽的过表达导致甜菊醇糖苷的产量的至少10%增加、或至少15%增加、或至少20%增加、或至少25%增加、或至少30%增加、或至少35%增加、或至少40%增加、或至少45%增加、或至少50%增加。在一些方面,DAP1多肽的过表达导致13-SMG的产量增加至少50%。在一些方面,DAP1多肽的过表达导致RebB的产量增加至少15%(参见实施例3,表2)。
在一些实施方案中,通过在过表达DAP1多肽的重组宿主中参与甜菊醇糖苷生物合成途径的一种或多种酶的表达,在体内生产甜菊醇糖苷和/或甜菊醇糖苷前体。在一些方面,过表达DAP1多肽并且表达以下各项中的一个或多个的生产甜菊醇的重组宿主可以在体内生产甜菊醇糖苷和/或甜菊醇糖苷前体:编码能够由法尼基二磷酸(FPP)和异戊烯二磷酸(IPP)合成香叶基香叶基焦磷酸(GGPP)的多肽的基因;编码能够由GGPP合成对映柯巴基二磷酸的多肽的基因;编码能够由对映柯巴基焦磷酸合成对映贝壳杉烯的多肽的基因;编码能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯醇和/或对映贝壳杉烯醛的多肽的基因;编码能够由对映贝壳杉烯酸合成甜菊醇的多肽的基因;编码能够还原细胞色素P450复合物的多肽的基因;和/或编码能够由GGPP合成对映柯巴基二磷酸并且由对映柯巴基焦磷酸合成对映贝壳杉烯的双功能多肽的基因;以及编码以下各项的一个或多个基因:能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C3’的β1,3糖基化的多肽、能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C2’的β1,2糖基化的多肽、以及能够将甜菊醇或甜菊醇糖苷在其C-13羟基上糖基化的多肽或能够将甜菊醇或甜菊醇糖苷在其C-19羧基上糖基化的多肽。参见例如图1和2。技术人员将理解,这些基因中的一个或多个对于宿主可以是内源的,条件是这些基因中的至少一个(在一些实施方案中,全部)是引入重组宿主中的重组基因。
在一些实施方案中,过表达DAP1多肽并且表达以下各项的重组宿主可以在体内生产甜菊醇:编码能够由法尼基二磷酸(FPP)和异戊烯二磷酸(IPP)合成香叶基香叶基焦磷酸(GGPP)的多肽的基因;编码能够由GGPP合成对映柯巴基二磷酸的多肽的基因;编码能够由对映柯巴基焦磷酸合成对映贝壳杉烯的多肽的基因;编码能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯醇和/或对映贝壳杉烯醛的多肽的基因;编码能够由对映贝壳杉烯酸合成甜菊醇的多肽的基因;编码能够还原细胞色素P450复合物的多肽的基因;和/或编码能够由GGPP合成对映柯巴基二磷酸并且由对映柯巴基焦磷酸合成对映贝壳杉烯的双功能多肽的基因。参见例如图2。技术人员将理解,这些基因中的一个或多个对于宿主可以是内源的,条件是这些基因中的至少一个(在一些实施方案中,全部)是引入重组宿主中的重组基因。
在一些实施方案中,过表达DAP1多肽并且表达以下各项的重组宿主可以在体内生产甜菊醇糖苷:编码能够由法尼基二磷酸(FPP)和异戊烯二磷酸(IPP)合成香叶基香叶基焦磷酸(GGPP)的多肽的基因;编码能够由GGPP合成对映柯巴基二磷酸的多肽的基因;编码能够由对映柯巴基焦磷酸合成对映贝壳杉烯的多肽的基因;编码能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯醇和/或对映贝壳杉烯醛的多肽的基因;编码能够由对映贝壳杉烯酸合成甜菊醇的多肽的基因;编码能够还原细胞色素P450复合物的多肽的基因;和/或编码能够由GGPP合成对映柯巴基二磷酸并且由对映柯巴基焦磷酸合成对映贝壳杉烯的双功能多肽的基因;以及编码以下各项的一个或多个基因:能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C3’的β1,3糖基化的多肽、能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C2’的β1,2糖基化的多肽、以及能够将甜菊醇或甜菊醇糖苷在其C-13羟基上糖基化的多肽或能够将甜菊醇或甜菊醇糖苷在其C-19羧基上糖基化的多肽。参见例如图1和2。技术人员将理解,这些基因中的一个或多个对于宿主可以是内源的,条件是这些基因中的至少一个(在一些实施方案中,全部)是引入重组宿主中的重组基因。
在一些实施方案中,过表达DAP1多肽的生产甜菊醇的重组宿主包含以下各项:编码能够由法尼基二磷酸(FPP)和异戊烯二磷酸(IPP)合成香叶基香叶基焦磷酸(GGPP)的多肽(SEQ ID NO:20)的核苷酸;编码能够由GGPP合成对映柯巴基二磷酸的截短多肽(SEQ ID NO:40)的核苷酸;编码能够由对映柯巴基焦磷酸合成对映贝壳杉烯的多肽(SEQ ID NO:52)的核苷酸;编码能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯醇和/或对映贝壳杉烯醛的多肽(SEQ ID NO:60)的核苷酸;编码ATR2多肽(SEQ ID NO:92)的核苷酸;编码能够由对映贝壳杉烯酸合成甜菊醇的多肽(SEQ ID NO:94)的核苷酸;编码能够还原细胞色素P450复合物的多肽(SEQ ID NO:78、86)的核苷酸;编码能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C3’的β1,3糖基化的多肽(SEQ ID NO:9)的核苷酸;编码能够将甜菊醇或甜菊醇糖苷在其C-13羟基上糖基化的多肽(SEQ ID NO:7)的核苷酸;编码能够将甜菊醇或甜菊醇糖苷在其C-19羧基上糖基化的多肽(SEQ ID NO:4)的核苷酸;和/或编码能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C2’的β1,2糖基化的多肽(SEQ ID NO:16)的核苷酸(参见实施例3)。技术人员将理解,这些基因的表达可以是生产特定的甜菊醇糖苷所必需的,但是这些基因中的一个或多个对于宿主可以是内源的,条件是这些基因中的至少一个(在一些实施方案中,全部)是引入重组宿主中的重组基因。
在一些实施方案中,过表达DAP1多肽的生产甜菊醇的重组宿主包含以下各项:编码能够由法尼基二磷酸(FPP)和异戊烯二磷酸(IPP)合成香叶基香叶基焦磷酸(GGPP)的多肽的核苷酸;编码能够由GGPP合成对映柯巴基二磷酸的截短多肽的核苷酸;编码能够由对映柯巴基焦磷酸合成对映贝壳杉烯的多肽的核苷酸;编码能够将甜菊醇或甜菊醇糖苷在其C-13羟基上糖基化的多肽的核苷酸;编码能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C3’的β1,3糖基化的多肽的核苷酸;编码能够将甜菊醇或甜菊醇糖苷在其C-19羧基上糖基化的多肽的核苷酸;和/或编码能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C2’的β1,2糖基化的多肽的核苷酸;以及编码能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯醇和/或对映贝壳杉烯醛的多肽(即,SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:117、SEQ ID NO:66、SEQ ID NO:68、SEQ ID NO:70、SEQ ID NO:72、SEQ ID NO:74或SEQ ID NO:76)的核苷酸;编码能够由对映贝壳杉烯酸合成甜菊醇的多肽(即,SEQ ID NO:94、SEQ ID NO:97、SEQ ID NO:100、SEQ ID NO:101、SEQ ID NO:102、SEQ ID NO:103、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、SEQ ID NO:110、SEQ ID NO:112或SEQ ID NO:114)的基因;以及编码能够还原细胞色素P450复合物的多肽(即,SEQ ID NO:78、SEQ ID NO:80、SEQ ID NO:82、SEQ ID NO:84、SEQ ID NO:86、SEQ ID NO:88、SEQ ID NO:90、SEQ ID NO:92)的基因。在某些此类实施方案中,编码DAP1多肽的重组基因相对于缺乏所述重组基因的相应宿主细胞过表达。
在一些实施方案中,甜菊醇糖苷和/或甜菊醇糖苷前体通过甜菊醇糖苷前体在体外与参与甜菊醇糖苷途径的一种或多种酶接触而产生。例如,使甜菊醇与一个或多个基因体外接触可导致产生甜菊醇糖苷,所述基因编码以下各项:能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C3’的β1,3糖基化的多肽;能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C2’的β1,2糖基化的多肽;以及能够将甜菊醇或甜菊醇糖苷在其C-13羟基上糖基化的多肽或能够将甜菊醇或甜菊醇糖苷在其C-19羧基上糖基化的多肽。在一些实施方案中,甜菊醇糖苷前体通过上游甜菊醇糖苷前体与参与甜菊醇糖苷途径的一种或多种酶体外接触而产生。例如,使对映贝壳杉烯酸与能够由对映贝壳杉烯酸合成甜菊醇的多肽或能够在DAP1多肽的存在下由对映贝壳杉烯酸合成甜菊醇的多肽体外接触可导致产生甜菊醇。
在一些实施方案中,通过全细胞生物转化产生甜菊醇糖苷或甜菊醇糖苷前体。为了发生全细胞生物转化,使表达参与甜菊醇糖苷途径的一种或多种酶的宿主细胞摄取并修饰细胞中的甜菊醇糖苷或甜菊醇糖苷前体;在体内修饰后,甜菊醇糖苷或甜菊醇糖苷前体保留在细胞中和/或分泌到培养基中。例如,表达编码UGT多肽的基因的重组宿主细胞可以摄取甜菊醇并在细胞中糖基化甜菊醇;在体内糖基化后,甜菊醇糖苷可以分泌到培养基中。在一些实施方案中,细胞过表达DAP1多肽。在一些实施方案中,使细胞透化以摄取待修饰的底物或分泌经修饰的产物。在另一个实例中,表达编码UGT多肽的基因的重组宿主细胞可以摄取甜菊醇并在细胞中糖基化甜菊醇;在体内糖基化后,甜菊醇糖苷可以分泌到培养基中。然后可以将透化的重组宿主细胞添加到细胞培养基中以摄取有待进一步修饰的所分泌的甜菊醇糖苷并分泌经进一步修饰的产物。
在一些实施方案中,UGT多肽可以是能够将甜菊醇或甜菊醇糖苷在其C-13羟基上糖基化的多肽;能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C3’的β1,3糖基化的多肽;能够将甜菊醇或甜菊醇糖苷在其C-19羧基上糖基化的多肽;以及能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C2’的β1,2糖基化的多肽、和/或能够将甜菊醇或甜菊醇糖苷在其C-19羧基上糖基化的多肽。
在另一个实例中,过表达DAP1多肽并表达以下各项中的一个或多个的生产甜菊醇的重组宿主可以在细胞中生产甜菊醇:编码能够由法尼基二磷酸(FPP)和异戊烯二磷酸(IPP)合成香叶基香叶基焦磷酸(GGPP)的多肽(例如,香叶基香叶基二磷酸合酶(GGPPS))的基因;编码能够由GGPP合成对映柯巴基二磷酸的多肽(例如,对映柯巴基二磷酸合酶(CDPS))的基因;编码能够由对映柯巴基焦磷酸合成对映贝壳杉烯的多肽(例如,贝壳杉烯合酶(KS))的基因;编码能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯醇和/或对映贝壳杉烯醛的多肽(例如,贝壳杉烯氧化酶(KO))的基因;编码能够还原细胞色素P450复合物的多肽(例如,细胞色素P450还原酶(CPR))的基因;以及编码能够由对映贝壳杉烯酸合成甜菊醇的多肽(例如,甜菊醇合酶(KAH))的基因;和/或编码能够由GGPP合成对映柯巴基二磷酸并且由对映柯巴基焦磷酸合成对映贝壳杉烯的双功能多肽(例如,对映柯巴基二磷酸合酶(CDPS)-对映贝壳杉烯合酶(KS)多肽)的基因;在体内生产后,甜菊醇可以分泌到细胞培养基中。然后可以将表达编码能够在体内糖基化甜菊醇或甜菊醇糖苷的UGT多肽的基因的透化重组宿主细胞添加到细胞培养基中,以摄取有待修饰的所分泌的甜菊醇并分泌经修饰的产物。
在一些实施方案中,UGT多肽可以是能够将甜菊醇或甜菊醇糖苷在其C-13羟基上糖基化的多肽;能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C3’的β1,3糖基化的多肽;能够将甜菊醇或甜菊醇糖苷在其C-19羧基上糖基化的多肽;以及能够实现甜菊醇糖苷的13-O-葡萄糖、19-O-葡萄糖、或13-O-葡萄糖和19-O-葡萄糖两者的C2’的β1,2糖基化的多肽、和/或能够将甜菊醇或甜菊醇糖苷在其C-19羧基上糖基化的多肽。
在一些实施方案中,甜菊醇糖苷或甜菊醇糖苷前体在宿主细胞中通过全细胞生物转化产生,所述宿主细胞表达在重组宿主中参与甜菊醇糖苷生物合成途径的一种或多种酶。例如,表达编码DAP1多肽的重组基因的宿主细胞可以在体内修饰甜菊醇糖苷和/或甜菊醇糖苷前体。
在一些实施方案中,DAP1多肽可通过将其与锚定基序融合而展示在本文公开的重组宿主细胞的表面上。有待展示的DAP1多肽-过客蛋白-可以通过N-末端融合、C-末端融合或夹心融合而与锚定基序-载体蛋白融合。这种细胞表面展示可用于通过全细胞生物转化生产甜菊醇糖苷和甜菊醇糖苷前体。
在一些实施方案中,甜菊醇糖苷或甜菊醇糖苷前体在宿主细胞中通过全细胞生物转化生产,所述宿主细胞过表达DAP1多肽并且表达在重组宿主中参与甜菊醇糖苷生物合成途径的一种或多种酶。例如,表达以下各项中的一个或多个的生产甜菊醇的重组宿主可以在体内修饰甜菊醇糖苷或甜菊醇糖苷前体:编码能够由法尼基二磷酸(FPP)和异戊烯二磷酸(IPP)合成香叶基香叶基焦磷酸(GGPP)的多肽(例如,香叶基香叶基二磷酸合酶(GGPPS))的基因;编码能够由GGPP合成对映柯巴基二磷酸的多肽(例如,对映柯巴基二磷酸合酶(CDPS))的基因;编码能够由对映柯巴基焦磷酸合成对映贝壳杉烯的多肽(例如,贝壳杉烯合酶(KS))的基因;编码能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯醇和/或对映贝壳杉烯醛的多肽(例如,贝壳杉烯氧化酶(KO))的基因;编码能够还原细胞色素P450复合物的多肽(例如,细胞色素P450还原酶(CPR))的基因;以及编码能够由对映贝壳杉烯酸合成甜菊醇的多肽(例如,甜菊醇合酶(KAH))的基因;和/或编码能够由GGPP合成对映柯巴基二磷酸并且由对映柯巴基焦磷酸合成对映贝壳杉烯的双功能多肽(例如,对映柯巴基二磷酸合酶(CDPS)-对映贝壳杉烯合酶(KS)多肽)的基因、以及编码UGT的基因。参见例如图1和2。技术人员将理解,这些基因中的一个或多个对于宿主可以是内源的,条件是这些基因中的至少一个(在一些实施方案中,全部)是引入重组宿主中的重组基因。
在一些实施方案中,通过共培养两种或更多种宿主生产甜菊醇、一种或多种甜菊醇糖苷前体和/或一种或多种甜菊醇糖苷。在一些实施方案中,一种或多种宿主(其各自表达参与甜菊醇糖苷途径的一种或多种酶)生产甜菊醇、一种或多种甜菊醇糖苷前体和/或一种或多种甜菊醇糖苷。例如,包含能够由法尼基二磷酸(FPP)和异戊烯二磷酸(IPP)合成香叶基香叶基焦磷酸(GGPP)的多肽、能够由GGPP合成对映柯巴基二磷酸的多肽、能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯醇和/或对映贝壳杉烯醛的多肽、能够由对映柯巴基焦磷酸合成对映贝壳杉烯的多肽、能够由对映贝壳杉烯酸合成甜菊醇的多肽、和/或能够还原细胞色素P450复合物的多肽的宿主以及包含一种或多种UGT的宿主生产一种或多种甜菊醇糖苷。在另一个实例中,过表达DAP1多肽并且包含能够由法尼基二磷酸(FPP)和异戊烯二磷酸(IPP)合成香叶基香叶基焦磷酸(GGPP)的多肽、能够由GGPP合成对映柯巴基二磷酸的多肽、能够由对映贝壳杉烯合成对映贝壳杉烯酸、对映贝壳杉烯醇和/或对映贝壳杉烯醛的多肽、能够由对映柯巴基焦磷酸合成对映贝壳杉烯的多肽、能够由对映贝壳杉烯酸合成甜菊醇的多肽、和/或能够还原细胞色素P450复合物的多肽的宿主以及包含一种或多种UGT的宿主生产一种或多种甜菊醇糖苷。
在一些实施方案中,甜菊醇糖苷包括,例如但不限于甜菊醇-13-O-葡糖苷(13-SMG)、甜菊醇-1,2-二糖苷、甜菊醇-1,3-二糖苷、甜菊醇-19-O-葡糖苷(19-SMG)、甜菊醇糖苷、1,3-甜菊醇糖苷、甜茶苷、莱鲍迪苷A(RebA)、莱鲍迪苷B(RebB)、莱鲍迪苷C(RebC)、莱鲍迪苷D(RebD)、莱鲍迪苷E(RebE)、莱鲍迪苷F(RebF)、莱鲍迪苷M(RebM)、莱鲍迪苷Q(RebQ)、莱鲍迪苷I(RebI)、杜尔可苷A、二糖基化甜菊醇、三糖基化甜菊醇、四糖基化甜菊醇、五糖基化甜菊醇、六糖基化甜菊、七糖基化甜菊醇或它们的异构体。
在一些实施方案中,在体内、体外或通过全细胞生物转化生产的甜菊醇糖苷或甜菊醇糖苷前体组合物不包含或包含比特别是来自甜叶菊植物的甜叶菊提取物减小量或减小水平的植物来源的组分。植物来源的组分可有助于异味并且包括颜料、脂质、蛋白质、酚类、糖类、斯巴醇和其他倍半萜烯、半日花烷二萜、单萜、癸酸、8,11,14-二十碳三烯酸、2-甲基十八烷、二十五烷、二十八烷、二十四烷、十八烷醇、豆甾醇、β-谷甾醇、α-香树素和β-香树素、羽扇豆醇、β-香树素乙酸酯、五环三萜类、矢车菊黄素(centauredin)、槲皮素、表-α-杜松醇(epi-alpha-cadinol)、丁香烯和衍生物、β-蒎烯、β-谷甾醇以及赤霉素。在一些实施方案中,本文提及的植物来源的组分是非糖苷化合物。
如本文所用,术语“可检测的量”、“可检测的浓度”、“可测量的量”和“可测量的浓度”是指以AUC、μM/OD600、mg/L、μM、或mM测量的甜菊醇糖苷的水平。可以通过本领域技术人员通常可获得的技术检测和/或分析甜菊醇糖苷产量(即,总的、上清液和/或细胞内甜菊醇糖苷水平),所述技术例如但不限于:液相色谱-质谱法(LC-MS)、薄层色谱法(TLC)、高效液相色谱法(HPLC)、紫外-可见光谱/分光光度法(UV-Vis)、质谱法(MS)以及核磁共振光谱法(NMR)。
如本文所用,术语“不可检测的浓度”是指太低而无法通过诸如TLC、HPLC、UV-Vis、MS或NMR的技术测量和/或分析的化合物水平。在一些实施方案中,“不可检测的浓度”的化合物不存在于甜菊醇糖苷或甜菊醇糖苷前体组合物中。
如本文所用,术语“或”和“和/或”用于描述组合或彼此排除的多种组分。例如,“x、y和/或z”可以单独指“x”、单独指“y”、单独指“z”、“x、y和z”、“(x和y)或z”、“x或(y和z)”或“x或y或z”。在一些实施方案中,“和/或”用于指重组细胞包含的外源核酸,其中重组细胞包含选自一组的一种或多种外源核酸。在一些实施方案中,“和/或”用于指甜菊醇糖苷和/或甜菊醇糖苷前体的生产。在一些实施方案中,“和/或”用于指甜菊醇糖苷的生产,其中生产一种或多种甜菊醇糖苷。在一些实施方案中,“和/或”用于指甜菊醇糖苷的生产,其中通过以下步骤中的一个或多个生产一种或多种甜菊醇糖苷:培养重组微生物,在重组微生物中合成一种或多种甜菊醇糖苷,并且/或者分离一种或多种甜菊醇糖苷。
功能同源物
上述多肽的功能同源物也适用于在重组宿主中生产甜菊醇糖苷。功能同源物是与参考多肽具有序列相似性并且执行参考多肽的一种或多种生化或生理功能的多肽。功能同源物和参考多肽可以是天然存在的多肽,并且序列相似性可以归因于收敛或发散的演化事件。因此,功能同源物有时在文献中指定为同源物、或直系同源物或旁系同源物。天然存在的功能同源物的变体(诸如由野生型编码序列的突变体编码的多肽)本身可以是功能同源物。还可以通过对多肽编码序列的定点诱变,或通过组合来自不同天然存在多肽的编码序列的结构域(“结构域交换”)来产生功能同源物。用于修饰编码本文所述的功能多肽的基因的技术是已知的,并且尤其包括定向演化技术、定点诱变技术和随机诱变技术,并且可用于以期望的方式增加多肽的比活性、改变底物特异性、改变表达水平、改变亚细胞定位、或修饰多肽-多肽相互作用。这种经修饰的多肽被认为是功能同源物。术语“功能同源物”有时应用于编码功能同源多肽的核酸。
功能同源物可以通过分析核苷酸和多肽序列比对来鉴定。例如,对核苷酸或多肽序列的数据库进行查询可以鉴定甜菊醇糖苷生物合成多肽的同源物。序列分析可以涉及使用UGT氨基酸序列作为参考序列的非冗余数据库的BLAST、交互BLAST或PSI-BLAST分析。在一些情况下,氨基酸序列是从核苷酸序列推导的。数据库中那些具有大于40%序列同一性的多肽是进一步评估其作为甜菊醇糖苷生物合成多肽的适用性的候选物。氨基酸序列相似性允许进行保守氨基酸取代,诸如以一个疏水性残基取代另一个疏水性残基,或以一个极性残基取代另一个极性残基。如果需要,可以对此类候选物进行手动检查,以缩小有待进一步评估的候选物的数目。可以通过选择那些似乎具有存在于甜菊醇糖苷生物合成多肽中的结构域(例如,保守功能结构域)的候选物来进行手动检查。在一些实施方案中,从转录组数据中基于表达水平而不是通过使用BLAST分析来鉴定核酸和多肽。
可以通过在甜菊醇糖苷生物合成多肽的一级氨基酸序列内定位这样的区域来鉴定保守区,所述区域为重复序列、形成一些二级结构(例如,螺旋和β片层)、建立带正电或带负电的结构域、或代表蛋白质基序或结构域。参见例如在万维网上描述多种蛋白质基序和结构域的共有序列的Pfam网站,sanger.ac.uk/Software/Pfam/and pfam.janelia.org/。包括在Pfam数据库中的信息描述于Sonnhammer等人,Nucl.Acids Res.,26:320-322(1998);Sonnhammer等人,Proteins,28:405-420(1997);以及Bateman等人,Nucl.Acids Res.,27:260-262(1999)中。保守区也可以通过对来自密切相关物种的相同或相关多肽的序列进行比对来确定。密切相关的物种优选来自同一科。在一些实施方案中,对来自两种不同物种的序列比对足以鉴定此类同源物。
通常,表现出至少约40%氨基酸序列同一性的多肽可用于鉴定保守区。相关多肽的保守区表现出至少45%的氨基酸序列同一性(例如,至少50%、至少60%、至少70%、至少80%、或至少90%的氨基酸序列同一性)。在一些实施方案中,保守区表现出至少92%、94%、96%、98%或99%的氨基酸序列同一性。
例如,适用于在重组宿主中产生甜菊醇的多肽包括UGT的功能同源物。
对例如UGT的底物特异性进行修饰的方法是本领域技术人员已知的,并且包括但不限于定点/合理诱变方法、随机定向演化方法以及其中在酶的活性位点附近进行随机诱变/饱和技术的组合。例如参见Osmani等人,2009,Phytochemistry 70:325-347。
候选序列通常具有参考序列长度的80%至200%的长度,例如,82、85、87、89、90、93、95、97、99、100、105、110、115、120、130、140、150、160、170、180、190或200%的参考序列长度。功能同源物多肽通常具有参考序列长度的95%至105%的长度,例如90、93、95、97、99、100、105、110、115或120%的参考序列长度,或其间的任何范围。任何候选核酸或多肽相对于参考核酸或多肽的%同一性可以如下确定。使用计算机程序ClustalW(版本1.83,默认参数)将参考序列(例如,本文所述的核酸序列或氨基酸序列)与一个或多个候选序列比对,所述程序允许对核酸或多肽序列的全长进行比对(全局比对)。Chenna等人,2003,Nucleic Acids Res.31(13):3497-500。
ClustalW计算参考序列与一个或多个候选序列之间的最佳匹配,并对它们进行比对,以使得可以确定同一性、相似性和差异度。可以将一个或多个残基的空位插入参考序列、候选序列或两者中,以使序列比对最大化。对于核酸序列的快速逐对比对,使用以下默认参数:字体大小:2;窗口大小:4;评分方法:%年龄;顶对角线数:4;以及空位罚分:5。对于核酸序列的多重比对,使用以下参数:空位开放罚分:10.0;空位延伸罚分:5.0;以及权重转换:是。对于蛋白质序列的快速逐对比对,使用以下参数:字体大小:1;窗口大小:5;评分方法:%年龄;顶对角线数:5;空位罚分:3。对于蛋白质序列的多重比对,使用以下参数:权重矩阵:blosum;空位开放罚分:10.0;空位延伸罚分:0.05;亲水性空位:开;亲水性残基:Gly、Pro、Ser、Asn、Asp、Gln、Glu、Arg和Lys;残基特异性空位罚分:开。ClustalW输出是反映序列之间关系的序列比对。可以例如在万维网上的Baylor College of Medicine Search Launcher网站(searchlaun cher.bcm.tmc.edu/multi-align/multi-align.html)和在万维网上的欧洲生物信息学研究所(European Bioinformatics Institute)网站(ebi.ac.uk/clus talw)上运行ClustalW。
为了确定候选核酸或氨基酸序列与参考序列的%同一性,使用Clustal Omega比对序列,将比对中的相同匹配数除以参考序列的长度,并将结果乘以100。应注意,%同一性值可以四舍五入到最接近的十分位。例如,78.11、78.12、78.13和78.14被四舍五入到78.1,而78.15、78.16、78.17、78.18和78.19被四舍五入到78.2。
应当理解,功能性UGT蛋白(例如,能够将甜菊醇或甜菊醇糖苷在其C-19羧基上糖基化的多肽)可以包括不参与由酶执行的酶促活性的另外的氨基酸。在一些实施方案中,UGT蛋白是融合蛋白。术语“嵌合体”、“融合多肽”、“融合蛋白”、“融合酶”、“融合构建体”、“嵌合蛋白”、“嵌合多肽”、“嵌合构建体”以及“嵌合酶”在本文中可互换使用,指通过连接编码不同蛋白质的两个或更多个基因而工程化的蛋白质。在一些实施方案中,编码UGT多肽(例如,能够将甜菊醇或甜菊醇糖苷在其C-19羧基上糖基化的多肽)的核酸序列可以包括标签序列,其编码设计成用于辅助所编码的多肽的后续操纵(例如,辅助纯化或检测)、分泌或定位的“标签”。标签序列可插入编码多肽的核酸序列中,以使得所编码的标签位于多肽的羧基或氨基末端。所编码标签的非限制性实例包括绿色荧光蛋白(GFP)、人流感血凝素(HA)、谷胱甘肽S转移酶(GST)、多组氨酸标签(HIS标签)以及FlagTM标签(Kodak,New Haven,CT)。标签的其他实例包括叶绿体转运肽、线粒体转运肽、淀粉体肽、信号肽或分泌标签。
在一些实施方案中,融合蛋白是通过结构域交换改变的蛋白质。如本文所用,术语“结构域交换”用于描述用第二蛋白质的结构域替换第一蛋白质的结构域的过程。在一些实施方案中,第一蛋白质的结构域和第二蛋白质的结构域是功能上相同的或功能上相似的。在一些实施方案中,第二蛋白质的结构域的结构和/或序列与第一蛋白质的结构域的结构和/或序列不同。在一些实施方案中,通过结构域交换来改变UGT多肽(例如,能够将甜菊醇或甜菊醇糖苷在其C-19羧基上糖基化的多肽)。
在一些实施方案中,融合蛋白是通过环状排列改变的蛋白质,其在于蛋白质末端的共价连接,之后将在其他地方开放。因此,在不引起蛋白质的氨基酸的改变的情况下改变序列的顺序。在一些实施方案中,可以产生靶向环状排列,例如但不限于,通过设计连接初始蛋白质的末端的间隔子。一旦限定了间隔子,就存在几种通过普遍接受的分子生物学技术生成排列的可能性,例如但不限于通过借助于PCR产生多联体并随后扩增多联体内部的特定排列或通过扩增有待交换的蛋白质的离散片段,以便以不同的顺序连接它们。生成排列的步骤之后可以是通过结合片段末端并随机反向切割从而形成来自独特构建体的排列集合来产生环状基因。在一些实施方案中,通过环状排列改变DAP1多肽。
甜菊醇和甜菊醇糖苷生物合成核酸
编码本文所述的多肽的重组基因包含所述多肽的编码序列,该序列与适合表达该多肽的一个或多个调控区按照有义取向可操作地连接。因为许多微生物能够由多顺反子mRNA表达多种基因产物,因此如果期望的话,可以在那些微生物的单一调控区的控制下表达多个多肽。当调控区和编码序列被定位成使得调控区有效地调控该序列的转录或翻译时,认为编码序列和调控区可操作地连接。通常,对于单顺反子基因,编码序列的翻译阅读框的翻译起始位点位于调控区下游1与约50个核苷酸之间。
在许多情况下,本文所述的多肽的编码序列是在重组宿主以外的物种中鉴定到的,即是异源核酸。因此,如果重组宿主是微生物,那么编码序列可以来自其他原核或真核微生物、植物或动物。然而,在一些情况下,编码序列是宿主天然具有的且被重新引入所述生物体的序列。天然序列与天然存在的序列的区别通常可在于存在与外源核酸连接的非天然序列,例如位于重组核酸构建体中天然序列侧翼的非天然调控序列。此外,稳定转化的外源核酸通常整合到发现天然序列的位置之外的位置。“调控区”是指具有影响转录或翻译的起始和速率、以及转录或翻译产物的稳定性和/或移动性的核苷酸序列的核酸。调控区包括但不限于,启动子序列、增强子序列、反应元件、蛋白质识别位点、诱导型元件、蛋白质结合序列、5’和3’非翻译区(UTR)、转录起始位点、终止序列、多腺苷酸化序列、内含子、以及它们的组合。调控区通常包含至少核心(基本)启动子。调控区还可以包括至少一个控制元件,诸如增强子序列、上游元件或上游激活区(UAR)。通过将调控区与编码序列定位成使得调控区有效地调控序列的转录或翻译来使得调控区与编码序列可操作地连接。例如,为了可操作地连接编码序列和启动子序列,编码序列的翻译阅读框的翻译起始位点通常定位于启动子下游的1与约50个核苷酸之间。然而,调控区也可被定位在翻译起始位点上游多达约5,000个核苷酸或转录起始位点上游约2,000个核苷酸的位置。
要包括的调控区的选择取决于几个因素,包括但不限于效率、可选择性、可诱导性、期望的表达水平,以及在某些培养阶段期间的优先表达。对于本领域技术人员而言,通过相对编码序列适当选择和定位调控区来调节编码序列的表达是常规技术。应理解,可存在多于一个调控区,例如,内含子、增强子、上游激活区、转录终止子和诱导型元件。
可以将一个或多个基因以可用于甜菊醇和/或甜菊醇糖苷生产的一个独立方面的“模块”的形式组合在重组核酸构建体中。以模块组合多个基因,特别是多顺反子模块,便于在多种物种中使用所述模块。例如,可以以多顺反子模块组合甜菊醇生物合成基因簇或UGT基因簇,以使得在插入合适的调控区后,可以将模块引入众多的物种中。作为另一个实例,可以将UGT基因簇组合,以使每个UGT编码序列可操作地连接独立的调控区从而形成UGT模块。这样的模块可以用在那些必须或期望单顺反子表达的物种中。除了对甜菊醇或甜菊醇糖苷生产有用的基因以外,重组构建体通常还含有复制起点和使构建体保持在适当的物种中的一个或多个选择性标记。
应理解,由于遗传密码的简并性,许多核酸可以编码特定多肽;即,对于许多氨基酸,存在多于一个核苷酸三联体充当该氨基酸的密码子。因此,使用针对宿主(例如,微生物)的适当密码子偏好性表格,可以对给定多肽的编码序列中的密码子进行修饰,以使获得在所述特定宿主中的最佳表达。作为经分离的核酸,这些经修饰的序列可以作为经纯化分子存在,并且可以结合到载体或病毒中以用于构建重组核酸构建体的模块。
在一些情况下,希望抑制内源多肽的一种或多种功能,以便将代谢中间体转向甜菊醇或甜菊醇糖苷生物合成。例如,可能希望下调酵母菌株中甾醇的合成,以便例如通过下调角鲨烯环氧酶来进一步增加甜菊醇或甜菊醇糖苷的产量。作为另一个实例,可能希望抑制某些内源基因产物(例如,从次级代谢物中除去葡萄糖部分的糖基水解酶或如本文所讨论的磷酸酶)的降解功能。在这种情况下,可以在转化到菌株中的重组构建体中包括过表达该多肽或基因产物的核酸。另选地,可使用诱变来生成希望增加或增强其功能的基因的突变体。
宿主微生物
重组宿主可用于表达用于生产甜菊醇糖苷的多肽,包括哺乳动物细胞、昆虫细胞、植物细胞和藻类细胞。许多原核生物和真核生物也适用于构建本文所述的重组微生物,例如革兰氏阴性细菌、酵母和真菌。首先分析选择用作甜菊醇糖苷生产菌株的物种和菌株,以确定哪些生产基因对于菌株是内源的以及哪些基因不存在。其内源对应物不存在于菌株中的基因有利地装配在一个或多个重组构建体中,然后将其转化到菌株中以便提供一种或多种丧失的功能。
通常,使重组微生物在发酵罐中在一个或多个温度下生长一定的时间段,其中温度和时间段有利于甜菊醇糖苷的生产。本发明提供的经构建和经遗传工程化的微生物可以使用常规发酵方法培养,尤其包括恒化器、分批、补料分批培养、半连续发酵诸如吸取和填充、连续灌注发酵以及连续灌注细胞培养。根据该方法中使用的特定微生物,也可以存在和表达其他重组基因,诸如异戊烯基生物合成基因和萜合酶和环化酶基因。可以通过从培养基中提取样品以根据公开的方法进行分析来确定底物和中间体(例如,异戊烯二磷酸、二甲基烯丙基二磷酸、GGPP、对映贝壳杉烯以及对映贝壳杉烯酸)的水平。
本方法中使用的碳源包括可以被重组宿主细胞代谢以促进生长和/或甜菊醇糖苷生产的任何分子。合适的碳源的实例包括但不限于蔗糖(例如,如在糖蜜中发现的)、果糖、木糖、乙醇、甘油、葡萄糖、纤维素、淀粉、纤维二糖或其他含葡萄糖的聚合物。例如在使用酵母作为宿主的实施方案中,诸如蔗糖、果糖、木糖、乙醇、甘油和葡萄糖的碳源是合适的。碳源可以在整个培养期间提供给宿主生物体,或另选地,生物体可以在另一种能量源(例如蛋白质)的存在下生长一段时间,然后仅在补料分批阶段期间提供碳源。
在重组微生物在培养物中已经生长一定的时间段后,其中温度和时间段有利于甜菊醇糖苷的生产,然后可以使用本领域已知的各种技术从培养物中回收甜菊醇和/或一种或多种甜菊醇糖苷。在一些实施方案中,可以添加透化剂以帮助原料进入宿主和产物离开。例如,可以将培养的微生物的粗裂解物离心以获得上清液。然后可将所得上清液施加到色谱柱例如C-18柱上,并用水洗涤以除去亲水性化合物,随后用溶剂诸如甲醇洗脱一种或多种目标化合物。然后可以通过制备型HPLC进一步纯化一种或多种化合物。也参见WO 2009/140394。
应当理解,本文所讨论的各种基因和模块可以存在于两种或更多种重组宿主中,而不是单一宿主中。当使用多种重组宿主时,它们可以在混合培养物中生长以积累甜菊醇和/或甜菊醇糖苷。
另选地,两种或更多种宿主各自可在单独的培养基中生长,并且可以将第一培养基的产物例如甜菊醇引入第二培养基中以转化为随后的中间体或最终产物诸如例如RebA。然后回收由第二或最终宿主生产的产物。还应理解,在一些实施方案中,使用除培养基之外的营养源并利用除发酵罐之外的系统来培养重组宿主。
示例性的原核和真核物种在下文更详细地描述。但是,应该理解,其他物种可以是合适的。例如,合适的物种可以是这样的属,诸如伞菌属(Agaricus)、曲霉属(Aspergillus)、芽孢杆菌属(Bacillus)、念珠菌属(Candida)、棒状杆菌属(Corynebacterium)、假囊酵母属(Eremothecium)、埃希菌属(Escherichia)、镰孢属(Fusarium)/赤霉属(Gibberella)、克鲁维酵母属(Kluyveromyces)、硫磺菌属(Laetiporus)、香菇属(Lentinus)、红法夫酵母属(Phaffia)、平革菌属(Phanerochaete)、毕赤酵母属(Pichia)、藓属(Physcomitrella)、红酵母属(Rhodoturula)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、痂圆孢属(Sphaceloma)、红发夫酵母属(Xanthophyllomyces)或耶氏酵母属(Yarrowia)。来自所述属的示例性物种包括虎皮香菇(Lentinus tigrinus)、硫磺菌(Laetiporus sulphureus)、黄孢原毛平革菌(Phanerochaete chrysosporium)、巴斯德毕赤酵母(Pichia pastoris)、产朊假丝酵母(Cyberlindnerajadinii)、小立碗藓(Physcomitrella patens)、胶粘红酵母(Rhodoturula glutinis)、胶红酵母(Rhodoturula mucilaginosa)、红法夫酵母(Phaffia rhodozyma)、红法夫酵母(Xanthophyllomyces dendrorhous)、藤仓镰孢菌(Fusarium fujikuroi)/藤仓赤霉(Gibberella fujikuroi)、产朊假丝酵母(Candida utilis)、光滑念珠菌(Candida glabrata)、白色念珠菌(Candida albicans)以及解脂耶氏酵母(Yarrowia lipolytica)。
在一些实施方案中,微生物可以是原核生物,诸如埃希氏菌属(Escherichia)细菌细胞,例如大肠杆菌(Escherichia coli)细胞;乳杆菌属(Lactobacillus)细菌细胞;乳球菌属(Lactococcus)细菌细胞;棒状杆菌属(Cornebacterium)细菌细胞;醋杆菌属(Acetobacter)细菌细胞;不动杆菌属(Acinetobacter)细菌细胞;或假单胞菌属(Pseudomonas)细菌细胞。
在一些实施方案中,微生物可以是子囊菌(Ascomycete),诸如藤仓赤霉、乳酸克鲁维酵母(Kluyveromyces lactis)、粟酒裂殖酵母(Schizosaccharomyces pombe)、黑曲霉(Aspergillus niger)、解脂耶氏酵母、棉阿舒囊霉(Ashbya gossypii)或酿酒酵母。
在一些实施方案中,微生物可以是藻类细胞,诸如三孢布拉霉(Blakeslea trispora)、杜氏盐藻(Dunaliella salina)、雨生红球藻(Haematococcus pluvialis)、小球藻属物种(Chlorella sp.)、裙带菜(Undaria pinnatifida)、马尾藻(Sargassum)、海带(Laminaria japonica)、Scenedesmus almeriensis物种。
在一些实施方案中,微生物可以是蓝细菌细胞,诸如三孢布拉霉、杜氏盐藻、雨生红球藻、小球藻属物种、裙带菜、马尾藻、海带、Scenedesmus almeriensis。
酵母属物种
酵母是合成生物学中广泛使用的经典生物体,并且可以用作重组微生物平台。例如,存在可用于酿酒酵母的突变体文库、质粒、代谢的详细计算机模型和其他信息,从而允许各种模块的合理设计以提高产物产率。用于制备重组微生物的方法是已知的。
曲霉属物种
曲霉属物种(诸如米曲霉(A.oryzae)、黑曲霉(A.niger)和酱油曲霉(A.sojae))是食品生产中广泛使用的微生物,并且还可用作重组微生物平台。构巢曲霉(A.nidulans)、烟曲霉(A.fumigatus)、米曲霉、棒曲霉(A.clavatus)、黄曲霉(A.flavus)、黑曲霉和土曲霉(A.terreus)的基因组的核苷酸序列是可获得的,从而允许合理设计和修饰内源途径以提高通量和提高产物产率。已经开发了用于曲霉属的代谢模型,以及转录组学研究和蛋白组学研究。黑曲霉被培养用于工业化生产多种食品成分,诸如柠檬酸和葡糖酸,并且因此诸如黑曲霉的物种通常适用于生产甜菊醇糖苷。
大肠杆菌
大肠杆菌,合成生物学中另一种广泛使用的平台生物体,也可以用作重组微生物平台。与酵母属相似,存在可用于大肠杆菌的突变体文库、质粒、代谢的详细计算机模型以及其他信息,从而允许合理设计各种模块以提高产物的产率。可使用与上文针对酵母属所述的那些类似的方法来制备重组大肠杆菌微生物。
伞菌属、赤霉属和平革菌属物种
伞菌属、赤霉属和平革菌属物种可以是可用的,因为已知它们在培养物中生产大量类异戊二烯。因此,用于大量生产甜菊醇糖苷的萜前体已由内源基因产生。因此,可将包含甜菊醇糖苷生物合成多肽的重组基因的模块引入来自所述属的物种中,而无需引入甲羟戊酸或MEP途径基因。
Arxula adeninivorans(Blastobotrys adeninivorans)
Arxula adeninivorans是具有独特生化特征的二态酵母(其在高至42℃的温度下生长为类似于面包酵母的出芽酵母,高于该阈值时,其以丝状形式生长)。它可在宽泛范围的底物上生长,并且可同化硝酸盐。它已成功地应用于产生可以生产天然塑料的菌株或者应用于开发用于环境样品中的雌激素的生物传感器。
解脂耶氏酵母
解脂耶氏酵母是二态酵母(参见Arxula adeninivorans)并且属于半子囊菌科。解脂耶氏酵母的整个基因组是已知的。耶氏酵母属物种是需氧的并且被认为是非致病性的。耶氏酵母在使用疏水性底物(例如烷烃、脂肪酸、油)时是有效的,并且可以在糖上生长。它具有很高的工业应用潜力,是一种产油微生物。解脂耶氏酵母可以将脂质含量积累到其干细胞重量的约40%,并且是用于脂质积累和再活化的模式生物体。参见例如Nicaud,2012,Yeast 29(10):409-18;Beopoulos等人,2009,Biochimie 91(6):692-6;Bankar等人,2009,Appl Microbiol Biotechnol.84(5):847-65。
红酵母属物种
红酵母是单细胞的、含色素的酵母。产油的红酵母,粘红酵母已经显示由粗甘油生产脂质和类胡萝卜素(Saenge等人,2011,Process Biochemistry 46(1):210-8)。圆红冬孢酵母(Rhodotorula toruloides)菌株已经显示为用于改善生物质和脂质生产力的有效补料分批发酵系统(Li等人,2007,Enzyme and Microbial Technology 41:312-7)。
圆红冬孢酵母
圆红冬孢酵母是产油酵母,并且可用于工程化脂质生产途径(参见例如Zhu等人,2013,NatureCommun.3:1112;Ageitos等人,2011,Applied Microbiology and Biotechnology 90(4):1219-27)。
博伊丁假丝酵母(Candida boidinii)
博伊丁假丝酵母是甲基营养型酵母(其可在甲醇上生长)。与其他的甲基营养型物种(诸如多形汉逊酵母(Hansenula polymorpha)和巴斯德毕赤酵母)类似,博伊丁假丝酵母为生产异源蛋白质提供优异的平台。已报道了分泌型外来蛋白的多克级范围的产率。最近,计算方法IPRO预测了在实验上将博伊丁假丝酵母木糖还原酶的辅因子特异性从NADPH转换为NADH的突变。参见例如Mattanovich等人,2012,Methods Mol Biol.824:329-58;Khoury等人,2009,Protein Sci.18(10):2125-38。
多形汉逊酵母(Hansenula polymorpha)(安格斯毕赤酵母(Pichia angusta))
多形汉逊酵母是甲基营养型酵母(参见博伊丁假丝酵母)。它还可在宽泛范围的其他底物上生长;其耐热并且可以同化硝酸盐(另外参见乳酸克鲁维酵母)。多形汉逊酵母已被应用于生产乙型肝炎疫苗、胰岛素和用于治疗丙型肝炎的干扰素α-2a,还用于一系列技术酶。参见例如Xu等人,2014,Virol Sin.29(6):403-9。
乳酸克鲁维酵母
乳酸克鲁维酵母是常规地应用于生产克非尔(kefir)的酵母。它可在数种糖上生长,最重要的是可在存在于乳和乳清中的乳糖上生长。乳酸克鲁维酵母已被成功地应用于生产凝乳酶(通常存在于牛的胃中的一种酶)等以生产奶酪。生产以40,000L的规模在发酵罐中进行。参见例如van Ooyen等人,2006,FEMS Yeast Res.6(3):381-92。
巴斯德毕赤酵母
巴斯德毕赤酵母是甲基营养型酵母(参见博伊丁假丝酵母和多形汉逊酵母)。巴斯德毕赤酵母为外来蛋白质的生产提供有效的平台。平台元件可作为试剂盒获得并且在世界范围内在学术界中被用于生产蛋白质。已将菌株工程化成可生产复杂的人N-聚糖(酵母聚糖与在人中发现的那些类似但不相同)。参见例如Piirainen等人,2014,N Biotechnol.31(6):532-7。
小立碗藓属物种
小立碗藓苔藓(Physcomitrella mosses)在悬浮培养物中生长时具有与酵母或其他真菌培养物相似的特征。该属可用于生产可能难以在其他类型的细胞中生产的植物次级代谢物。
可以认识到,本文公开的重组宿主细胞可包括植物细胞(包括在植物中生长的植物细胞)、哺乳动物细胞、昆虫细胞、真菌细胞(包括酵母细胞),其中酵母细胞是来自酿酒酵母、粟酒裂殖酵母、解脂耶氏酵母、光滑假丝酵母、棉阿舒囊霉、Cyberlindnera jadinii、巴斯德毕赤酵母、乳酸克鲁维酵母、多形汉逊酵母、博伊丁假丝酵母、Arxula adeninivorans、Xanthophyllomyces dendrorhous、或白色假丝酵母物种的细胞,或是酵母菌或是酿酒酵母细胞、藻类细胞或细菌细胞,包括埃希氏菌细胞、乳杆菌细胞、乳球菌细胞、棒状杆菌细胞、醋杆菌细胞、不动杆菌细胞、或假单胞菌细胞。
甜菊醇糖苷组合物
甜菊醇糖苷在不同的食品系统中不一定具有等同的性能。因此,希望其具有将合成引导至所选择的甜菊醇糖苷组合物的能力。本文所述的重组宿主可以生产选择性富集特定甜菊醇糖苷(例如,RebD或RebM)并具有一致的味道特性的组合物。如本文所用,术语“富集”用于描述与来自甜叶菊植物的甜菊醇糖苷组合物(提取物)相比,具有增加的特定甜菊醇糖苷比例的甜菊醇糖苷组合物。因此,本文所述的重组宿主可以促进这样的组合物的生产,所述组合物被调整以满足给定食品所需的甜味特性,并且每批次之间具有一致比例的各甜菊醇糖苷。在一些实施方案中,本文所述的宿主不生产或生产减少量的在甜叶菊提取物中发现的不期望的植物副产物。因此,由本文所述的重组宿主生产的甜菊醇糖苷组合物与来源于甜叶菊植物的组合物是可区分的。
积累的单独甜菊醇糖苷(例如,RebA、RebB、RebD或RebM)的量可以为约1至约7,000mg/L,例如,约1至约10mg/L、约3至约10mg/L、约5至约20mg/L、约10至约50mg/L、约10至约100mg/L、约25至约500mg/L、约100至约1,500mg/L、或约200至约1,000mg/L、至少约1,000mg/L、至少约1,200mg/L、至少约至少1,400mg/L、至少约1,600mg/L、至少约1,800mg/L、至少约2,800mg/L、或至少约7,000mg/L。在一些方面中,单独甜菊醇糖苷的量可以超过7,000mg/L。所积累的甜菊醇糖苷(例如,RebA、RebB、RebD或RebM)的组合的量可以为约1mg/L至约7,000mg/L,例如约200至约1,500、至少约2,000mg/L、至少约3,000mg/L、至少约4,000mg/L、至少约5,000mg/L、至少约6,000mg/L、或至少约7,000mg/L。在一些方面中,甜菊醇糖苷的组合的量可以超过7,000mg/L。一般来说,更长的培养时间将导致更大量的产物。因此,重组微生物可以培养1天至7天、1天至5天、3天至5天、约3天、约4天、或约5天。
应当理解,本文所讨论的各种基因和模块可以存在于两种或更多种重组微生物中,而不是单一微生物中。当使用多种重组微生物时,它们可以在混合培养物中生长以生产甜菊醇和/或甜菊醇糖苷。例如,第一微生物可以包含用于生产甜菊醇糖苷前体的一种或多种生物合成基因,而第二微生物包含甜菊醇糖苷生物合成基因。然后回收由第二或最终微生物生产的产物。还应理解,在一些实施方案中,使用除培养基之外的营养源并利用除发酵罐之外的系统来培养重组微生物。
另选地,两种或更多种微生物各自可在单独的培养基中生长,并且可以将第一培养基的产物例如甜菊醇引入第二培养基中以转化为随后的中间体或最终产物诸如RebA。然后回收由第二或最终微生物生产的产物。还应理解,在一些实施方案中,使用除培养基之外的营养源并利用除发酵罐之外的系统来培养重组微生物。
通过本文公开的方法获得的甜菊醇糖苷和组合物可用于制备食品、膳食补充剂和甜味剂组合物。参见例如WO 2011/153378、WO 2013/022989、WO 2014/122227以及WO 2014/122328。这些出版物均特此以引用方式全文并入本文。
例如,基本上纯的甜菊醇或甜菊醇糖苷诸如RebM或RebD可以包括在食品中,所述食品诸如冰淇淋、碳酸饮料2s、果汁、酸奶、烘焙食品、口香糖、硬糖和软糖以及调味汁(sauce)。基本上纯的甜菊醇或甜菊醇糖苷也可以包括在非食品产品诸如药品、医药产品、膳食补充剂和营养补充剂中。基本上纯的甜菊醇或甜菊醇糖苷也可以包括在用于农业工业和伴侣动物工业的动物饲料产品中。另选地,可以通过分别培养重组微生物来制备甜菊醇和/或甜菊醇糖苷的混合物,每种重组微生物生产特定的甜菊醇或甜菊醇糖苷,从每种微生物中回收基本上纯的形式的甜菊醇或甜菊醇糖苷,然后合并这些化合物以获得包含期望比例的每种化合物的混合物。与目前的甜叶菊产品相比,本文所述的重组微生物允许获得更精确且一致的混合物。
在另一个替代方案中,可将基本上纯的甜菊醇或甜菊醇糖苷与其他甜味剂一起掺入食品中,所述其他甜味剂例如糖精、右旋糖、蔗糖、果糖、赤藓糖醇、阿斯巴甜、三氯蔗糖、莫纳甜(monatin)或乙酰舒泛钾。甜菊醇或甜菊醇糖苷相对于其他甜味剂的重量比可以根据需要改变以在最终食品中达到令人满意的味道。参见例如U.S.2007/0128311。在一些实施方案中,甜菊醇或甜菊醇糖苷可以与风味剂(例如柑橘)一起提供,以作为风味调节剂。
由本文所述的重组微生物所生产的组合物可以掺入食品中。例如,取决于甜菊醇糖苷和食品的类型,由重组微生物生产的甜菊醇糖苷组合物可以基于干重以在约20mg甜菊醇糖苷/kg食品至约1800mg甜菊醇糖苷/kg食品范围内的量掺入食品中。例如,由重组微生物生产的甜菊醇糖苷组合物可以掺入甜点、冷的糖食(例如,冰淇淋)、乳制品(例如酸奶)或饮料(例如碳酸饮料)中,以使得食品基于干重具有最多500mg甜菊醇糖苷/kg食品。由重组微生物生产的甜菊醇糖苷组合物可以掺入烘焙食品(例如,饼干)中,以使得食品基于干重具有最多300mg甜菊醇糖苷/kg食品。由重组微生物生产的甜菊醇糖苷组合物可以掺入调味汁(例如,巧克力糖浆)或蔬菜产品(例如,腌菜)中,以使得食品基于干重具有最多1000mg甜菊醇糖苷/kg食品。由重组微生物生产的甜菊醇糖苷组合物可以掺入面包中以使得食品基于干重具有最多160mg甜菊醇糖苷/kg食品。由重组微生物、植物或植物细胞生产的甜菊醇糖苷组合物可以掺入硬糖或软糖中,以使得食品基于干重具有最多1600mg甜菊醇糖苷/kg食品。由重组微生物、植物或植物细胞生产的甜菊醇糖苷组合物可以掺入加工的水果产品(例如,果汁、水果馅、果酱和果冻)中,以使得食品基于干重具有最多1000mg甜菊醇糖苷/kg食品。在一些实施方案中,本文生产的甜菊醇糖苷组合物是药物组合物的组分。参见例如由Harriet Wallin,Food Agric.Org.筹备的Steviol Glycosides Chemical and Technical Assessment 69th JECFA,2007;EFSA Panel on Food Additives and Nutrient Sources added to Food(ANS),“Scientific Opinion on the safety of steviol glycosides for the proposed uses as a food additive,”2010,EFSA Journal 8(4):1537;美国食品和药物管理局GRAS通知323;美国食品和药物管理局GRAS通知329;WO 2011/037959;WO 2010/146463;WO 2011/046423;以及WO 2011/056834。
例如,这样的甜菊醇糖苷组合物可具有90-99重量%的RebA和不可检测量的甜叶菊植物来源的污染物,并基于干重以25-1600mg/kg,例如100-500mg/kg、25-100mg/kg、250-1000mg/kg、50-500mg/kg或500-1000mg/kg掺入食品中。
这样的甜菊醇糖苷组合物可以是富含RebB的组合物,其具有大于3重量%的RebB并被掺入食品中,以使得产品中RebB的量基于干重为25-1600mg/kg,例如100-500mg/kg、25-100mg/kg、250-1000mg/kg、50-500mg/kg或500-1000mg/kg。通常,富含RebB的组合物具有不可检测量的甜叶菊植物来源的污染物。
这样的甜菊醇糖苷组合物可以是富含RebD的组合物,其具有大于3重量%的RebD并被掺入食品中,以使得产品中RebD的量基于干重为25-1600mg/kg,例如100-500mg/kg、25-100mg/kg、250-1000mg/kg、50-500mg/kg或500-1000mg/kg。通常,富含RebD的组合物具有不可检测量的甜叶菊植物来源的污染物。
这样的甜菊醇糖苷组合物可以是富含RebE的组合物,其具有大于3重量%的RebE并被掺入食品中,以使得产品中RebE的量基于干重为25-1600mg/kg,例如100-500mg/kg、25-100mg/kg、250-1000mg/kg、50-500mg/kg或500-1000mg/kg。通常,富含RebE的组合物具有不可检测量的甜叶菊植物来源的污染物。
这样的甜菊醇糖苷组合物可以是富含RebM的组合物,其具有大于3重量%的RebM并被掺入食品中,以使得产品中RebM的量基于干重为25-1600mg/kg,例如100-500mg/kg、25-100mg/kg、250-1000mg/kg、50-500mg/kg或500-1000mg/kg。通常,富含RebM的组合物具有不可检测量的甜叶菊植物来源的污染物。
在一些实施方案中,将基本上纯的甜菊醇或甜菊醇糖苷掺入到佐餐甜味剂或“杯对杯(cup-for-cup)”产品中。这样的产品通常用本领域技术人员已知的一种或更多种填充剂例如麦芽糖糊精稀释至适当的甜味水平。富含RebA、RebB、RebD、RebE或RebM的甜菊醇糖苷组合物可例如,以基于干重的10,000至30,000mg甜菊醇糖苷/kg产品包装在小袋中,用于佐餐使用。在一些实施方案中,在体外、体内或通过全细胞生物转化生产甜菊醇糖苷。
将在以下实施例中进一步描述本发明,这些实施例不限制权利要求中描述的本发明的范围。
实施例
以下实施例说明本发明的具体实施方案及其多种用途。它们仅出于说明的目的而列出,并且不被认为限制本发明。
实施例1:LC-MS分析过程
LC-MS分析在具有Waters ACQUITY UPLC(超高效液相色谱系统;Waters公司)BEH C18柱(2.1x50mm,1.7μm颗粒,孔径)的Waters ACQUITY UPLC(超高效液相色谱系统;Waters公司)上进行,该柱配备有预柱(2.1x5mm,1.7μm颗粒,孔径),该预柱连接到具有以负离子化模式操作的电喷雾离子化(ESI)的Waters ACQUITY TQD三重四极质谱仪。使用两个流动相的梯度:A(具有0.1%甲酸的水)和B(具有0.1%甲酸的MeCN),在0.3至2.0min之间从20%增加至50%B,在2.01min时增加至100%B并且保持100%B,持续0.6min,并重新平衡0.6min,以实现化合物分离。流速为0.6mL/min,柱温设定为55℃。使用SIM(单离子监测)监测甜菊醇糖苷,并通过与确定标准进行比较对其进行定量。所检测的甜菊醇糖苷的m/z迹线和保留时间值参见表1。
表1:甜菊醇和甜菊醇糖苷的LC-MS分析数据。
可以使用本文描述的方法分离甜菊醇糖苷。例如,在发酵后,可以将培养液在4℃下以7000rpm离心30min以除去细胞,或者可以通过过滤除去细胞。无细胞裂解物可以例如通过宿主细胞的机械破坏或酶促破坏以及另外的离心以除去细胞碎片来获得。还可以执行所干燥的发酵液材料的机械破坏,诸如通过超声处理。在进一步纯化之前,诸如通过制备型色谱法,可以使用微米或亚微米过滤溶解或悬浮的发酵液材料。可任选地处理发酵培养基或无细胞裂解物以除去低分子量化合物,诸如盐;并且可以任选地在纯化之前将其干燥并重新溶解在水和溶剂的混合物中。上清液或无细胞裂解物可以如下纯化:可以用例如HP20 Diaion树脂(芳香型合成吸附剂;Supelco)或其他合适的非极性吸附剂或反相色谱树脂填充柱子,并且可以将上清液或无细胞裂解物的等分试样上样到柱子上并用水洗涤以除去亲水性组分。甜菊醇糖苷产物可以通过逐步递增增加水中溶剂浓度或梯度(例如,0%→100%甲醇)来洗脱。然后可以通过LC-MS分析每个级分(包括流过液)中甜菊醇糖苷、糖基化的对映贝壳杉烯醇和/或糖基化的对映贝壳杉烯酸的水平。然后可以将级分合并并且使用真空蒸发器减小体积。如果需要,可以使用另外的纯化步骤,诸如另外的色谱步骤和结晶。
实施例2:菌株工程化
生产甜菊醇糖苷的酿酒酵母菌株如WO 2011/153378、WO 2013/022989、WO 2014/122227和WO 2014/122328中所述的那样构建,所述专利中的每一个全文以引用方式并入。例如,将包含并表达编码DAP1多肽的天然基因(SEQ ID NO:1、SEQ ID NO:2)、编码聚球藻属(Synechococcus)物种GGPPS多肽的重组基因(SEQ ID NO:19、SEQ ID NO:20)、编码截短的玉蜀黍(Z.mays)CDPS多肽的重组基因(SEQ ID NO:39、SEQ ID NO:40)、编码拟南芥(A.thaliana)KS多肽的重组基因(SEQ ID NO:51、SEQ ID NO:52)、编码重组的甜叶菊(S.rebaudiana)KO多肽的重组基因(SEQ ID NO:59、SEQ ID NO:60)、编码KO多肽的重组基因(SEQ ID NO:63/SEQ ID NO:64、SEQ ID NO:117)、编码拟南芥ATR2多肽的重组基因(SEQ ID NO:91、SEQ ID NO:92)、编码甜叶菊KAHe1多肽的重组基因(SEQ ID NO:93、SEQ ID NO:94)、编码甜叶菊CPR8多肽的重组基因(SEQ ID NO:85、SEQ ID NO:86)、编码甜叶菊CPR1多肽的重组基因(SEQ ID NO:77、SEQ ID NO:78)、编码甜叶菊UGT76G1多肽的重组基因(SEQ ID NO:8、SEQ ID NO:9)、编码甜叶菊UGT85C2多肽的重组基因(SEQ ID NO:5/SEQ ID NO:6、SEQ ID NO:7)、编码甜叶菊UGT74G1多肽的重组基因(SEQ ID NO:3、SEQ ID NO:4)、以及编码水稻(O.sativa)EUGT11多肽的重组基因(SEQ ID NO:14/SEQ ID NO:15、SEQ ID NO:16)的酵母菌株工程化以积累甜菊醇糖苷。
实施例3:DAP1多肽的过表达
将包含并表达如实施例2中所述的编码DAP1多肽的天然基因(SEQ ID NO:1、SEQ ID NO:2)的生产甜菊醇糖苷的酿酒酵母菌株用携带和表达编码DAP1多肽且具有URA3作为选择标记的基因(SEQ ID NO:1、SEQ ID NO:2)的另外拷贝的整合质粒转化。在缺乏尿嘧啶的平板上选择表达与TEF1启动子(SEQ ID NO:118)和CYC1终止子(SEQ ID NO:119)可操作地连接的另一DAP1多肽的新工程化的菌株。通过PCR验证DAP1整合到基因组中。然后使经过验证的进一步表达DAP1多肽的工程化菌株在FEED平板(PS-Biotech GmbH,Aachen,Germany)中的750μL限定培养基中于30℃生长5天,以400rpm振荡。接种来自生长在缺乏尿嘧啶的合成完全(SC)平板上的单克隆。
通过用100μL DMSO提取100μL细胞溶液,涡旋直到混合,并在80℃温育10分钟来制备用于LC-MS分析的样品。通过以15,000g离心10min使所得提取物澄清。用140μL的50%(v/v)DMSO稀释20μL上清液以用于LC-MS进样。将LC-MS数据针对在Multilabel Reader(PerkinElmer,Waltham,MA)上测量的100μL细胞溶液和100μL水的混合物的OD600归一化。
根据实施例1进行LC-MS分析。积累(以μM/OD600计)通过LC-MS针对10个克隆的过表达DAP1多肽的酿酒酵母菌株和4个克隆的包含修复的URA标记的对照酿酒酵母菌株的已知标准进行定量。结果在表2中示出。相对于对照菌株,对于过表达DAP1多肽的酿酒酵母菌株,观察到13-SMG积累的强烈增加和RebB积累的增加。此外,还可以观察到RebA、RebM和RebD积累的略微增加。这些结果表明DAP1多肽过表达对甜菊醇糖苷途径的有益作用。
表2:过表达DAP1多肽的酿酒酵母菌株和酿酒酵母对照菌株的活性。
具有过表达DAP1多肽的酿酒酵母菌株或对照酿酒酵母菌株的培养物的补料分批发酵在有氧条件下在2L发酵罐中于30℃进行,其中在包含葡萄糖、硫酸铵、痕量金属、维生素、盐和缓冲剂的基本培养基中进行大约16h的生长期,随后用含葡萄糖的限定补料培养基进行大约100h的进料期。保持接近6.0的pH和葡萄糖限制条件。通过LC-UV分析完整培养物样品(未进行细胞去除)以确定甜菊醇糖苷和甜菊醇途径中间体的水平。
使用包括可变波长检测器(VWD)、恒温柱室(TCC)、自动取样机、自动取样机冷却单元以及二元泵的Agilent 1290仪器,并使用SB-C18快速分辨高清晰度(rapid resolution high definition,RRHD)2.1mm x300mm,1.8μm分析柱(两个串联的150mm柱;柱温为65℃)进行LC-UV。通过反相C18柱分离甜菊醇糖苷和甜菊醇糖苷前体,然后在210mm处通过UV吸光度进行检测。通过比较每种分析物的峰面积与RebA的标准并对具有不同摩尔吸光系数的物种应用校正因子来进行甜菊醇糖苷的定量。
基于甜菊醇糖苷的测量水平计算补料分批发酵的总甜菊醇糖苷值,所述甜菊醇糖苷的测量水平计算为所测量的RebA、RebB、RebD、RebE、RebM、13-SMG、甜茶苷、甜菊醇-1,2-二糖苷、二糖基化甜菊醇、三糖基化甜菊醇、四糖基化甜菊醇、五糖基化甜菊醇、六糖基化甜菊醇、七糖基化甜菊醇的总和(以g/L RebD当量计)。结果在表3中示出。相对于对照菌株,对于过表达DAP1多肽的酿酒酵母菌株观察到表示为RebD当量浓度的RebD、RebM和总甜菊醇糖苷的增加,进一步证明DAP1多肽过表达对甜菊醇糖苷途径的有益作用。
表3:使用过表达DAP1多肽的酿酒酵母菌株和酿酒酵母对照菌株进行的甜菊醇糖苷发酵。
实施例4:内源DAP1敲除
将如实施例2中所述的生产甜菊醇糖苷的酿酒酵母菌株工程化为破坏功能性DAP1多肽的表达。使转化菌株在深孔板中的1mL SC培养基中于30℃生长5天,以400rpm振荡。接种来自在酵母提取物蛋白胨右旋糖(YPD)平板(对于DAP1破坏的克隆)和SC-URA平板(对于对照克隆)上生长的单克隆。
根据实施例1在根据实施例3制备的样品上进行LC-MS分析。积累(以μM/OD600计)通过LC-MS针对5个克隆的DAP1破坏的酿酒酵母菌株和4个克隆的在附着型构建体上包含URA标记的对照酿酒酵母菌株的已知标准进行定量。结果在表4中示出。相对于对照菌株,对于DAP1破坏的酿酒酵母菌株,观察到13-SMG、RebB和RebA积累的降低以及RebD和RebM的强烈降低,表明内源DAP1多肽的表达的破坏减小甜菊醇糖苷的积累。由于早期较低分子量甜菊醇糖苷的积累已经减少(例如,13-SMG),较少的前体可用于随后的糖基化,因此观察到减少量的晚期甜菊醇糖苷RebA、RebD和RebM。
表4:DAP1破坏的酿酒酵母菌株和酿酒酵母对照菌株的活性。
不受特定理论的束缚,在实施例3和4中观察到的结果表明DAP1多肽参与甜菊醇糖苷生物合成途径中上游的P450复合物的正调控,例如,甜叶菊KAHe1(SEQ ID NO:94)、甜叶菊KO(SEQ ID NO:60)和甜叶菊CPR1(SEQ ID NO:XX)。
鉴于已经详细且参考其具体实施方案描述了本发明,显而易见的是,在不背离所附权利要求中定义的本发明的范围的情况下的变型和改变是可能的。更具体地,尽管本发明的一些方面在本文中被确认为特别有利,但是预期本发明不必限于本发明的这些特定方面。
表5.本文公开的序列。