技术领域
本发明涉及在酵母中例如Saccharomyces cerevisiae中生产甾醇,所述 甾醇包括7-脱氢胆固醇、25-羟基-7-脱氢胆固醇和25-羟基麦角甾醇。本发 明还涉及在酵母中催化酵母甾醇、胆甾-7,24-二烯醇和胆甾-5,7,24-三烯醇 的24位置上的双键还原;催化麦角甾醇、7-脱氢胆固醇、胆甾-8-烯醇和 胆甾-7-烯醇的25位置上的羟基化的多种酶。本发明还涉及编码胆固醇 C25-羟化酶和甾醇Δ24-还原酶的多种核酸以及它们用来生产并羟基化7-脱 氢胆固醇或麦角甾醇的用途。本发明还涉及这样产生的酵母菌株和制造这 些甾醇的方法,所述方法包括培养经转化的酵母细胞和收获产生的甾醇 (多种)的步骤。
技术背景
酵母中的甾醇途径包括许多步骤。酵母甾醇途径的图表在图14中列 出且下面参考它讨论现有技术。
US 5,460,949(Amoco)教导了用于增加角鲨烯和三烯醇在酵母中中 累积的方法和组合物。该方法包括在其中基因ERG5和ERG6被失活的菌 株中HMG1(调节该途径的单一的最重要的酶)的截短和过表达。ERG5 和ERG6编码两种酶活性,所述两种酶活性区别麦角甾醇(酵母和真菌的 主要甾醇)生物合成与胆固醇生物合成。这些菌株优选地累积胆甾-5,7,24- 三烯醇,其通常是胆固醇生物合成的中间产物。
WO03/064650(Lang等人)(US2006/0240508)公开了在酵母中生产 7-脱氢胆固醇和/或生物合成中间产物或随后的产物的方法。这里,来自小 鼠和人的C-8甾醇异构酶、C-5甾醇去饱和酶和甾醇Δ24-还原酶的基因在 其中ERG5和ERG6被失活并且HMG1基因被截短并过表达的酵母菌株中 表达。这些酵母能合成7-脱氢胆固醇。
WO03/064652(Lang等人)(US2006/0088903)公开了通过增加羊毛 甾醇-C14-脱甲基酶活性(ERG11),在转基因的酵母中生产酵母甾醇和/ 或生物合成中间产物和/或其随后的产物的方法。
WO 2005/121315(Aventis)教导了胆固醇-生产酵母菌株及其用途。 来自Arabidopsis thaliana的甾醇Δ7还原酶基因和人甾醇Δ24-还原酶基因 被引进其中ERG6被失活和在一些情况下ERG5被失活的酵母宿主菌株 中。新菌株能生产与其他中间产物混合的胆固醇。
US 6,562,609(Russel等人)教导了经分离人和小鼠胆固醇C25-羟化 酶和基因。
现有技术关于使用转基因的酵母生产25-羟基维生素原D3或25-羟基 维生素原D2没有记载。
发明详述
根据本发明已发现,胆固醇C25-羟化酶(其底物通常是胆固醇)可对 7-脱氢胆固醇和麦角甾醇起作用,以分别生产25-羟基-7-脱氢胆固醇和25- 羟基麦角甾醇。
因而,本发明的一个方面是使用脊椎动物胆固醇C25-羟化酶来羟基化 7-脱氢胆固醇或麦角甾醇以分别生产25-羟基-7-脱氢胆固醇(也被称为25- 羟基维生素原D3)或25-羟基麦角甾醇(也被称为25-羟基维生素原 D2)。
胆固醇C25-羟化酶不是天然存在于酵母中的酶;事实上酵母通常不具 有使可能在酵母中存在的7-脱氢胆固醇的侧链羟基化的能力。但是,根据 本发明,可制得遗传改良的酵母,通过下述方法将胆甾-5,7,24-三烯醇转化 为25-羟基-7-脱氢胆固醇(25-羟基维生素原D3):
提供具有编码胆固醇C25-羟化酶的核酸的酵母并在使得酵母羟基化7- 脱氢胆固醇的条件下培养酵母,
借以生产25-羟基-7-脱氢胆固醇(25-羟基维生素原D3)。
在上述方法中,下述是优选的,酵母已使基因ERG5和ERG6失活且 所述酵母还已被提供有编码编码脊椎动物甾醇Δ24-还原酶的核酸,所述脊 椎动物甾醇Δ24-还原酶酶已针对酵母中的表达被优化。
还已发现,根据本发明,可制得遗传改良的酵母,通过下述方法将麦 角甾醇转化为25-羟基麦角甾醇(也称为25-羟基维生素原D2):
提供具有编码胆固醇C25-羟化酶的核酸的酵母并在使得酵母羟基化麦 角甾醇的条件下培养酵母,
借以生产25-羟基麦角甾醇(25-羟基维生素原D2)。
附图简述
在下述图中,使用了这些缩写词:
TDH3p是TDH3启动子区(来自S.cerevisiae的甘油醛-3-磷酸脱氢酶 同工酶3);
Ori-pBR是来自E.coli的pBR322的ColE1复制起点;
bla是在E.coli中赋予氨苄西林抗性的β-内酰胺酶基因;
2μ是携带S.cerevisiae的复制起点的2μ多拷贝载体的大的片段;
PGK1t是PGK1(来自S.cerevisiae的3-磷酸甘油酯激酶)的终止子 区;
URA3是针对尿嘧啶的S.cerevisiae URA3营养缺陷型标记;
Bam HI、Eco RI、Hin dIII、Bgl II、Age I是指对应的限制性酶的限制 性位点;
在载体上的位点的定位从唯一的Bam HI位点的位置1开始以括号表 示。
图1:质粒V51TDH-S24R1的限制性图谱。S24R-1是编码来自Rattus norvegicus的推定甾醇Δ24-还原酶的合成基因S24R1;
图2:质粒V51TDH-S24R2的限制性图谱。S24R-2是编码来自Danio rerio的推定甾醇Δ24-还原酶的合成基因S24R2。
图3:质粒pFLAde-S24R1的限制性图谱。S24R1是编码来自R. norvegicus的推定甾醇Δ24-还原酶的合成基因S24R1;ARS-CEN是S. cerevisiae的着丝粒自主复制起点;ADE2是S.cerevisiaeADE2基因。
图4:质粒V51-C25H1的限制性图谱。GALp代表GAL10-CYC1 (Guarente et al.,1982)半乳糖可诱导的启动子区;C25H-1是编码来自 Sus scrofa的推定胆固醇C25-羟化酶的合成基因C25H1。
图5:质粒V51-C25H3的限制性图谱。GALp代表GAL10-CYC1 (Guarente et al.,1982)半乳糖可诱导的启动子区;C25H-3是编码来自 Canis familiaris的推定胆固醇C25-羟化酶的合成基因C25H3;
用如在实施例8中描述的制得的甾醇提取物,如实施例9中描述的, 记录在UV 282nm下的所有HPLC图谱。
缩写词:
C5,7,22,24=胆甾5,7,22,24-四烯醇;
C5,7,24=胆甾5,7,24-三烯醇;
C5,7,22=胆甾5,7,22-三烯醇;
C5,7=胆甾5,7-二烯醇或7-脱氢胆固醇;
25OH-C5,7-Ac=25-羟基7-脱氢胆固醇乙酸酯;
25OH-E5,7,22-Ac:25-羟基麦角甾醇乙酸酯;
E5,7,22,24:麦角甾5,7,22,24-四烯醇;
E5,7,22:麦角甾5,7,22-三烯醇(麦角甾醇)。
图6:来自表达推定甾醇C-24甾醇还原酶的菌株的甾醇提取物的 HPLC洗脱图。使用了下述菌株:
A:ERT/V51TDH对照;
B:ERT/V51TDH-S24R1;
C:ERT/V51TDH-S24R2;
D:ERT/pFLAde-S24R1。
图7:来自表达推定胆固醇C25-羟化酶的erg6突变体的甾醇提取物的 HPLC洗脱图。使用了下述菌株:
C:ERT/pFLAde-S24R1/V51;
D:ERT/pFLAde-S24R1/V51-C25H1;
E:ERT/pFLAde-S24R1/V51-C25H3.
标准物为:A,胆甾5,7-二烯醇(7-脱氢胆固醇,购自Sigma-Aldrich, St.Louis,MO 63103,USA);B,25-羟基7-脱氢胆固醇乙酸酯(如实施例 9中描述的制备)。
图8:来自表达推定胆固醇C25-羟化酶的erg6突变体菌株的单峰的 UV光谱。针对下述峰,如实施例9中描述的在HPLC期间使用PDA检测 器在线测定在205和300nm之间UV光谱:
A:在11.8min下的7-脱氢胆固醇标准物峰(图7,谱图A);
B:在8.5min下的25-羟基7-脱氢胆固醇乙酸酯标准物峰(图7谱图 B);
C:在8.5min下的ERT/pFLAde-S24R1/V51-C25H1峰(图7,谱图 D)。
图9:来自表达推定胆固醇C25-羟化酶的erg6突变体菌株的单峰的质 谱图。对下述峰,如实施例9中描述的,在HPLC期间,用MicroMass ZQ 检测器,在线测定来自m/z=350至450的质量碎裂谱图:
A:在11.8min下的7-脱氢胆固醇标准物峰(图7,谱图A);
B:在8.5min下的25-羟基7-脱氢胆固醇乙酸酯标准物峰(图7,谱 图B);
C:在8.5min下的ERT/pFLAde-S24R1/V51-C25H1峰(图7,谱图 D)。
图10:来自表达推定胆固醇C25-羟化酶的ERG6野生型菌株的甾醇 提取物的HPLC洗脱图。使用了下述菌株:
B:W303/V51;
C:W303/V51-C25H1;
D:W303/V51-C25H3。
标准物为:A,麦角甾醇(麦角甾5,7,22-三烯醇),购自Sigma- Aldrich,St.Louis,MO 63103,USA。
图11:来自表达推定胆固醇C25-羟化酶的ERG6野生型菌株的单峰 的UV光谱。针对下述峰,如实施例9中描述的,在HPLC期间,用PDA 检测器,在线测定在205和300nm之间的UV光谱:
A:在11.9min下的麦角甾醇标准物峰(图10,谱图A);
B:在10.0min下的W303/V51-C25H1峰(图10,谱图C);
C:在8.7min下的W303/V51-C25H1峰(图10,谱图C).
图12:来自表达推定胆固醇C25-羟化酶的ERG6野生型菌株的单峰 的质谱图。针对下述峰,如实施例9中描述的,在HPLC期间,用 MicroMass ZQ检测器从m/z=350至450测定质量碎裂谱图:
A:在11.9min下的麦角甾醇标准物峰(图10,谱图A);
B:在10.0min下的W303/V51-C25H1峰(图10,谱图C);
C:在8.7min下的W303/V51-C25H1峰(图10,谱图C).
图13:较之其中ERG6被失活的酵母(胆甾-型甾醇),野生型酵母 (麦角型甾醇)的甾醇生物合成途径的晚期部分。酶以斜体字突出显示。 实箭头代表在野生型酵母中发现的酶反应。虚箭头对应通过异源活性(推 定的甾醇Δ24-还原酶,推定的胆固醇C25-羟化酶)催化的步骤,对应的 酶加下划线。
图14:是酵母甾醇途径图。
图15:是通过10种不同的25-羟化酶基因将7-脱氢胆固醇转化为25- 羟基-7-脱氢胆固醇(HyDHC)的比较。含有如在实施例2中描述的经优 化的来自猪的25-羟化酶的S.cerevisiae菌株Ecab HY(具有 SEQ.ID.NO:26的基因的的整合构建体)、Ecab opt 2.0(具有 SEQ.ID.NO:25的基因的整合构建体)、Ptro opt 2.0(具有SEQ.ID.NO:19 的基因的整合构建体)、Ptro HY(具有SEQ.ID.NO:20的基因的整合构建 体)、ConHyD HY(具有的SEQ.ID.NO:31的基因的整合构建体)、 ConHyD opt 2.0(具有SEQ.ID.NO:30的基因的整合构建体)、Rnor HY (具有SEQ.ID.NO:23的基因的整合构建体)、Rnor opt 2.0(具有 SEQ.ID.NO:22的基因的整合构建体)、Sscr HY(具有SEQ.ID.NO:28的 基因的整合构建体)、Sscr opt 2.0(具有SEQ.ID.NO:27的基因的整合构建 体)和Scr Pompon,如实施例20中描述的进行培养。甾醇从细胞球团中 分离出并且总甾醇的HyDHC含量、HyDHC比例以及7-DHC向HyDHC 的转化与通过整合25-羟化酶C25H1获得的值比较。所有的新羟化酶基因 被表达并且所述基因的基因产物能将7-DHC羟基化为HyDHC。
定义:
说明书和权利要求通篇中,应用了下述定义:
“酵母”指Saccharomyces cerevisiae,以及适于商业规模生产的其他 酵母,例如Schizosaccharomyces spp.、Pichia spp、Klyuveromyces spp.、 Hansenula spp.和Yarrowia lipolytica。
杂交的“标准条件”在本发明的上下文中表示下述条件,所述条件通 常由本领域技术人员用于检测特异性杂交信号并且描述于例如Sambrook et al.,″Molecular Cloning″,second edition,Cold Spring Harbor Laboratory Press 1989,New York(其通过引用被并入本文)中。“严格杂交条件”的例子 是在下述溶液中于42℃下过夜孵育(例如15个小时)后在0.1x SSC中于 约65℃下洗涤杂交支持物,所述溶液含有:50%甲酰胺、5x SSC(150 mM NaCl、15mM柠檬酸三钠)、50mM磷酸钠(pH 7.6)、5x Denhardt′s 溶液、10%硫酸葡聚糖和20μg/ml经变性、剪切的鲑精DNA。
如本领域中已知的,术语“%同一性”表示多肽或多核苷酸序列之间 的相关程度,视情况而定,如通过此类序列的字符串(strings)之间的匹 配测定的。“同一性”可以通过已知方法容易地确定,例如,使用下述参 数:缺口产生罚分8,缺口延伸罚分2(缺省参数)用程序BESTFIT (GCG Wisconsin Package,version 10.2,Accelrys Inc.,9685 Scranton Road, San Diego,CA 92121-3752,USA)来确定。
“功能性”酶表示在典型的酵母培养条件下,酶在酵母内实现期望的 活性。例如,″功能性胆固醇C25-羟化酶″表示酵母细胞体内,胆固醇C25- 羟化酶将7-脱氢胆固醇转化为25-羟基-7-脱氢胆固醇。
“功能性”核酸序列表示核酸序列包括必要的序列(除了编码多肽的 那些外),以便酵母以一定的浓度表达多肽至它发挥作用的地方。此类序 列可包括启动子、终止序列,增强子等等。
胆固醇25-羟化酶
本发明的一个方面因而是在酵母细胞中生产25-羟基-7-脱氢胆固醇或 25-羟基麦角甾醇的方法,所述方法包括:使7-脱氢胆固醇或麦角甾醇与 胆固醇C25-羟化酶接触并获得25-羟基-7-脱氢胆固醇或25-羟基麦角甾 醇。优选地胆固醇C25-羟化酶是来自脊椎动物来源,更优选地来自大鼠、 猪、狗、马、人、黑猩猩、Macaca mulata、小鼠、Gallus gallus、Xenopus laevis、Danio rerio或Ornithorynchus anatinus的酶。另外,可以使用这些 天然酶的衍生物,即其中氨基酸序列不再与天然酶相同的那些酶,只要它 们保留它们起作用的能力即可。例如,本发明包括下述酶的用途,所述酶 与天然脊椎动物C25-羟化酶共有至少90%同一性和优选地具有至少95% 同一性和更有优选地具有至少99%同一性的那些酶,条件是衍生酶保留其 功能。
类似地,可被用在本发明中的核酸是编码上述肽序列的那些和在严格 条件下与编码上述肽序列的那些核酸杂交的核酸。优选地它们是经分离 的。另外,在一些实施方式中,编码C25-羟化酶酶的核酸是已经密码子优 化的,以更好地适于酵母环境。在优选的实施方式中,核酸来自猪、大 鼠、狗、黑猩猩或马并且已针对酵母经密码子优化。特别优选的核酸是这 样的核酸:已经密码子优化使得它们至少在酵母宿主中表达的那些以及参 考核酸序列“Sscr Pompon SEQ ID NO:5”,更优选地核酸序列比“Sscr Pompon”更好地被表达。
核酸优选地是DNAs。
特别优选的核酸是被命名为下述的那些:
C25H1(基于猪羟化酶;SEQ.ID NO:5),
C25H3(基于狗羟化酶:SEQ.ID.NO:8),
Ecab_HY或Ecab 25OH_opt2.0(基于马羟化酶:SEQ ID NOS:25和 26),
ConHYD opt 20(SEQ ID NO:30)
Rnor HY(基于大鼠羟化酶EQ ID NO:23)
Sscr HY(SEQ ID NO:28)
Sscr opt 20(SEQ ID NO:27)
Sscr Pompon(SEQ ID NO:5)
本发明的另一方面是包含功能性胆固醇C25-羟化酶的酵母细胞。本发 明的另外方面是能将-脱氢胆固醇或麦角甾醇分别转化为25-羟基7-脱氢胆 固醇或25-羟基麦角甾醇的酵母。
本发明的另外方面是在酵母中生产25-羟基7-脱氢胆固醇的方法,所 述方法包括在容许羟基化反应发生的条件下,存在7-脱氢胆固醇时,允许 脊椎动物胆固醇C25-羟化酶的表达,导致25-羟基7-脱氢胆固醇的生产。 本发明的其他方面是在酵母中生产25-羟基麦角甾醇的方法,所述方法包 括在容许羟基化反应发生的条件下,存在麦角甾醇时,允许脊椎动物胆固 醇C25-羟化酶的表达,导致25-羟基麦角甾醇的生产。
表达载体中存在基因的多拷贝在是优选的。在优选的实施方式中,使 用了2-5个拷贝。
用于将任何上面提到的基因克隆进酵母宿主的载体可以是已知用于克 隆的任何类型的载体,特别是携带C25-羟化酶基因和相关的表达和/或整 合序列(包括本领域中常用的启动子和增强子)的质粒和着丝粒质粒,并 且这些载体构成了本发明的另一方面。
在能生产7-脱氢胆固醇的酵母中,例如在US 2006/0242508中描述的 酵母中,下述是优选的:基因ERG5和ERG6被失活且源自脊椎动物的甾 醇Δ24-还原酶被表达,例如在下文进一步描述的那些。而且,在一些情 况下,在此类酵母中过表达HMG1的截短版本是有优势的。具有失活的 ERG5和ERG6且截短的HMG1基因的此类菌株已在本领域中描述过。
使用已知的UV光照程序,25-羟基维生素原D3或25-羟基维生素原 D2可分接着分别被转化为25-羟基维生素D3或D2、第一代谢产物和维生 素D3或D2的循环形式。25-羟基维生素D3在骨形成中发挥重要作用并在 商业上在家禽和其他动物饲料中用作维生素补充剂,其可以商标 ROVIMIX HY-D商购自DSM Nutritional Products。25-羟基维生素D2在 体内显示了与25-羟基维生素D3相当的作用并且可以类似于25-羟基维生 素D3的使用的方式使用。
甾醇Δ24-还原酶
本发明的另一方面是新颖核酸,所述核酸编码甾醇Δ24-还原酶,所述 酶可被酵母表达并可使选自羊毛甾醇、二甲基酵母甾醇、甲基酵母甾醇、 酵母甾醇、胆甾-7,24-二烯醇或胆甾-5,7,24-三烯醇的底物转化为选自3β- 羟基-8-羊毛甾-8-烯,4,4-二甲基-胆甾-8-烯醇、4α-甲基-胆甾-8-烯醇、胆 甾-8-烯醇、胆甾-7-烯醇(lathosterol)和7-脱氢胆固醇的产物,条件是核 酸序列不是人或小鼠核酸序列。
优选地,酵母细胞是其中ERG6和ERG5被失活的酵母细胞。优选地 那些核酸是针对宿主细胞经密码子优化的来自脊椎动物来源的经修饰的 DNAs,条件是所述核酸不是小鼠(mouse)的也不是人的。优选地甾醇 Δ24-还原酶来自猪、狗、黑猩猩、Macaca mulata、小鼠,大鼠、马、 Gallus gallus、Xenopus laevis、Danio rerio或Ornithorynchus anatinus。
在特别优选的实施方式中,核酸是大鼠(Rattus norvegicus)或斑马鱼 (Danio rerio)DNAs,且在更优选的实施方式中,它们已经密码子优化用 于在Saccharomyces cerevisiae中表达。特别优选的核酸被命名为S24R1 (经修饰的大鼠基因,SEQ ID NO 1的核苷酸10至1563)和S24R2(经 修饰的斑马鱼基因,SEQ ID NO:3的核苷酸10至1563)。
本发明另一方面是脊椎动物核酸序列,优选地DNA,其已经密码子 优化用于在酵母宿主中表达并且其编码功能性甾醇Δ24-还原酶酶,使得在 酵母宿主细胞内,所述酶可使:
羊毛甾醇转化为3β-羟基-8-羊毛甾-8-烯,或将二甲基酵母甾醇转化 为4,4-二甲基-胆甾-8-烯醇;
甲基酵母甾醇转化为4α-甲基-胆甾-8-烯醇;
酵母甾醇转化为胆甾-8-烯醇;
胆甾-7,24-二烯醇转化为胆甾-7-烯醇;或
胆甾-5,7,24-三烯醇转化为7-脱氢胆固醇; 且编码酶的核酸可在严格条件下与S24R1或S24R2杂交,条件是该脊椎 动物核酸序列不是分离自人或小鼠的核酸序列。
本发明的另一方面是由上述提到的核酸序列编码的酶。本发明的优选 的酶是如SEQ ID NO.2和4给出的那些和展示与SEQ ID NO.2和4至少 90%和优选地至少95%同一性的那些,其在酵母细胞环境内还可将:
羊毛甾醇转化为3β-羟基-8-羊毛甾-8-烯,
二甲基酵母甾醇转化为4,4-二甲基-胆甾-8-烯醇,
甲基酵母甾醇转化为4α-甲基-胆甾-8-烯醇,
酵母甾醇转化为胆甾-8-烯醇,
胆甾-7,24-二烯醇转化为胆甾-7-烯醇,或
胆甾-5,7,24-三烯醇转化为7-脱氢胆固醇。
本发明的另一方面是含有如上文所述的功能性核酸序列的酵母宿主, 特别是包含S24R1、S24R2或在严格条件下与S24R1、S24R2杂交的核酸 序列的酵母宿主例如S.cerevisiae,条件是核酸不是人序列也不是小鼠序 列。在优选的实施方式中,酵母宿主已使ERG5和ERG6失活;在特别优 选的实施方式中,酵母宿主还过表达HMG1基因的截短版本。
还本发明的另一方面是在酵母细胞内生产3β-羟基-8-羊毛甾-8-烯、 4,4-二甲基-胆甾-8-烯醇、4α-甲基-胆甾-8-烯醇、胆甾-8-烯醇、胆甾-7- 烯醇或7-脱氢胆固醇的方法,其包括使羊毛甾醇、二甲基酵母甾醇、甲基 酵母甾醇、酵母甾醇、胆甾-7,24-二烯醇或胆甾-5,7,24-三烯醇与下述酵母 接触,所述酵母包含已经密码子优化用于在酵母宿主中表达并且编码功能 性甾醇Δ24-还原酶酶的核酸序列,条件是该核酸序列不是人序列也不是小 鼠核酸序列,且
所述酵母使:
羊毛甾醇转化为3β-羟基-8-羊毛甾-8-烯,
二甲基酵母甾醇转化为4,4-二甲基-胆甾-8-烯醇,
甲基酵母甾醇转化为4α-甲基-胆甾-8-烯醇,
酵母甾醇转化为胆甾-8-烯醇,
胆甾-7,24-二烯醇转化为胆甾-7-烯醇,或
胆甾-5,7,24-三烯醇转化为7-脱氢胆固醇。在该方法中,核酸优选地是 S24R1、S24R2或在严格条件下与S24R1或S24R2杂交的核酸,条件是该 脊椎动物核酸序列不是人或小鼠核酸序列。
本发明的另一方面包括载体,所述载体包括质粒,所述载体包含已经 密码子优化用于在酵母宿主中表达且编码功能性甾醇Δ24-还原酶酶的功能 性核酸序列,条件是该核酸序列不是人序列也不是小鼠核酸序列。优选 地,载体包含核酸S24R1、S24R2或在严格条件下与S24R1或S24R2杂交 的核酸,条件是该脊椎动物核酸序列不是人或小鼠核酸序列。载体可包含 通常在质粒或其他载体中发现的调节转录、翻译或整合进酵母染色体的通 常的序列。
基因构建体
编码C25-羟化酶或甾醇Δ24还原酶的本发明的所有基因构建体,典型 地是表达盒的一部分,所述表达盒典型地具有已知的启动子控制下的外源 基因,所述启动子可用标准方法调节,启动子例如控制感兴趣的基因的 ADH1启动子、TEF1启动子、酵母GPD(TDH3)启动子、酵母HXT7启 动子、酵母GAL1/10启动子或酵母PGK1启动子。额外地,表达盒可包含 与上文所述的基因的至少一个的编码序列可操地连接的上游和下游序列, 例如终止子序列和/或其他调节元件。使用常规方法,携带本发明的基因构 建体的载体可被引进酵母中。
下述实施例仅是示例性的,并不意图以任何方式限制本发明的范围。 本申请通篇引用的所有参考文献、专利申请、专利和公布的专利申请的内 容通过引用并入本文。
实施例
文献:全部的引用文献在实施例的结尾处刊出。所有的文献通过引用 并入本文。
培养基:
表1:最低培养基的组成
培养基在使用前通过高压蒸汽在120℃下灭菌20分钟。必要时,无 菌色氨酸、尿嘧啶或腺嘌呤(b)被添加至20mg/l的终浓度。
表2:Kapelli合成培养基的组成
组合物 H3PO4(85%v/v) 0.33ml/l KH2PO4 2.85g/l MgSO4×7H2O 0.6g/l MnSO4×H2O 16mg/l CuSO4×5H2O 0.4mg/l ZnSO4×7H2O 15mg/l CoCl2×6H2O 2.8mg/l Na2MoO4×2H2O 2.5mg/l H3BO3 77.5mg/l 柠檬酸×H2O 0.5mg/l KI 1mg/l NiSO4×7H2O 2.5mg/l 柠檬酸三钠×2H2O 25mg/l 硫胺HCl 2mg/l 吡哆醇HCl 5mg/l
烟酸 8mg/l 生物素 0.05mg/l 泛酸钙 10mg/l 肌醇 80mg/l CaCl2×2H2O 50mg/l FeCl3×6H2O 50mg/l 酪蛋白氨基酸 1%(w/v) 葡萄糖或半乳糖 2%(w/v)
在使用前,将培养基过滤通过0.2μm的过滤装置灭菌。需要时,无菌 色氨酸、尿嘧啶或腺嘌呤被添加至0.2mg/ml的终浓度。
实施例1
选择来自不同的生物体的Δ24(25)-甾醇还原酶并设计合成基因
甾醇Δ24-还原酶催化胆固醇生物合成的最后步骤中的一个步骤。其是 接受至少酵母甾醇和链甾醇作为底物的相当非特异性的酶。2004年,对应 的基因在人中被鉴定出(Waterman HR et al.,2001)。仅正式证明了来自 人和小鼠的基因产物的甾醇Δ24-还原酶活性(Crameri A et al.,2006; WO03/064650)。还针对来自大鼠的同源基因,描述了相当的功能(Wu C. et al.2004:Nature 432(7017):640-5.),但是,没有证实基因产物的酶促活 性。
在W003/064650中,其显示了来自小鼠的Δ24-还原酶基因在S. cerevisiae突变体(erg5 erg6)中的表达,导致两种新甾醇(胆甾-7-烯醇和 7-脱氢胆固醇)形成,这不会在宿主菌株中发生。使用公众可得到的程序 BLASTp在标准条件下搜索公用数据库(比如GENBANK或EMBL)寻找 与人Δ24(25)-甾醇还原酶同源的酶。在找到的序列之中,选择与Homo sapiens(智人)的氨基酸序列具有97%氨基酸同一性的Rattus norvegicus 的序列(表1)和与人序列具有79%氨基酸同一性的Danio rerio序列(表 1)用于进一步研究。
表3:与人Δ24(25)-甾醇还原酶同源的推定蛋白。以百分比氨基酸同一 性给出数值。
针对每一cDNA,设计了用于在S.cerevisiae中表达的合成基因。一般 地,就该目的而言使用原始cDNA序列是可能的。在一些情况下,根据 Kazusa DNA Research Institute(http://www.kazusa/or.jp/codon),使用不 同种的密码子使用表,尽力使原始cDNA的密码子使用情况适合于新宿主 的密码子使用是有优势的。这可通过人工或计算机程序的帮助来完成。在 我们的案例中,使用了计算机程序,其计算算法包括序列生成器,允许产 生具有使用者定义的密码子偏性调整的DNA序列。一些限定还可被引进 算法中,以随意愿避免或支持特异性限制位点的存在。序列产生的部分受 通常每次尝试导致不同DNA序列的随机数目生成器驱动。对于程序的使 用者而言,重新利用用过的种子并因而重现结果是不可能的。因此,重新 编码的序列可被预测并认为携带独特的和原始的签名。
在备选产生的DNA序列版本之中的选择最终依赖于使用者(目视检 查)。选择的DNA序列版本被服务提供商(例如GeneCust Europe,30b rue Dominique Lang,3505 Dudelange,Luxembourg)使用来进行基因合 成。三个额外的腺嘌呤残基被添加至ATG起始密码子的上游且第二终止 密码子被添加至开放阅读框的下游,以优化翻译起始和终止。为将合成基 因方便地克隆进酵母表达载体,Bam HI和Eco RI限制性位点被分别添加 至序列的上游和下游。如上文解释的,通过上文描述的方法重新编码大鼠 甾醇Δ24-还原酶基因(GenBank登录号AY92220(cDNA序列)和 AAX29968(氨基酸序列))。新合成的基因被命名为S24R1。其序列在 下文给出。
SEQ.ID.NO:1:
对应的氨基酸序列为:
SEQ.ID.NO:2
D.rerio甾醇Δ24-还原酶基因(在GenBank号NM_001008645下可得 到的DNA序列和在GenBank号NP_001008645下的氨基酸序列)用上文 描述的方法重新编码。新合成的基因被命名为S24R2。其序列在下文给 出:
SEQ ID NO:3
对应的氨基酸序列为:
SEQ.ID.No:4
实施例2
选择与来自Homo sapiens的胆固醇C25-羟化酶氨基酸序列同源的氨基酸
序列并计算经优化的用于在S.cerevisiae中表达的备选DNA序列
已显示基因产物H.sapiens和M.musculus的胆固醇C25-羟化酶活性 (Lund et al.,1998;US6562609)。使用公众可得到的程序BLASTp在标准 条件下搜索公用数据库(比如GENBANK或EMBL)寻找与人胆固醇 C25-羟化酶同源的酶。在找到的序列之中,选择与H.sapiens的氨基酸序 列具有82%氨基酸同一性(表2)且与M.musculus的序列具有79%氨基 酸同一性的的S.serofa的序列;和与人和小鼠序列具有70%氨基酸同一 性的C.familiaris的序列(表4),用于进一步研究。
表4:在不同的推定胆固醇C25-羟化酶之间的氨基酸同一性
通过在酵母Saccharomyces cerevisiae中常用的密码子来替换对应于酵 母Saccharomyces cerevisiae很少使用的密码子的二十五个密码子,重新编 码猪胆固醇C25-羟化酶基因(在GenBank号AY974088下可得到的DNA 序列和在GenBank号Q4G1G8下的氨基酸序列)(Zhang et al.,1991)。 新合成的基因被命名为C25H1。其序列在下文给出:
SEQ.ID.NO:5
对应的氨基酸序列为:
SEQ.ID.No:6
与使用的序列具有四个不同之处的来自数据库GENBANK的推定猪甾 醇C25-羟化酶的备选氨基酸序列也可得到,但没在实验中进一步使用:
SEQ ID NO:7
用在实施例1中描述的适当方法,重新编码来自Canis familiaris的基 因(在GenBank号XM_546596.2下可得到的核苷酸序列和在GenBank号 XP_543596.1下的氨基酸序列)。新合成的基因被命名为C25H3和其 DNA序列在下文给出:
SEQ ID.NO.8:
对应的氨基酸序列为:
SEQ.ID NO:9:
实施例3
构建表达质粒V51TDH-S24R1
如Sambrook等人(1989)所述的使用典型分子生物学技术构建表达 载体且使用如供应商推荐的DNA限制性酶和修饰酶(New England Biolabs, Ipswich,MA 01938-2723,USA)。
通过用来自组成型表达的TDH3基因(来自在Saccharomyces基因组 数据库中的系统基因注释的YGR192C基因,编码甘油醛-3-磷酸脱氢酶同 工酶3)的启动子替代半乳糖可诱导GAL10-CYC1启动子,从V51载体得 到基础(basic)多拷贝组成型表达载体V51TDH。V51携带在Escherichia coli中用于维持的ColE1复制起点和bla基因(氨苄西林抗性)、在酵母 中用于维持的2μ起点和URA3基因、通过多克隆位点(MCS)分开的 GAL10-CYC1杂合启动子和PGK1终止区(pYeDP1/8-2,Cullin and Pompon, 1988)。在来自W303-1B酵母菌株的基因组DNA上通过PCR扩增TDH3 启动子区(Thomas和Rothstein,1989)并使用下述引物根据Hoffman and Winston(1987)来制备:
PTDHAge 5′-CACCGGTGCCATTTCAAAGAATACGTA-3′(SEQ.ID.NO:10)
PTDHBam 5′-TGGATCCTTATGTGTGTTTATTCGAAAC-3′(SEQ.ID.NO:11)
PCR扩增产物被Age I和Bam HI消化并且被用来从携带GAL10-CYC1 启动子的V51中替代617bp长的Age I-Bam HI片段。产生的V51TDH载 体是多拷贝E.coli/S.cerevisiae穿梭载体,其通过插入进位于TDH3启动子 (TDH3p)和PGK1终止子(PGK1t)区之间的MCS,用于感兴趣的基因 在酵母中组成型表达。
通过将来自S24R1合成基因的1564bp Bam HI-Eco RI限制性产物插 入被Bam HI和Eco RI限制的V51TDH载体中,构建用于S24R1合成基因 组成型表达的V51TDH-S24R1载体。V51TDH-S24RI组成型表达载体的限 制性图谱在图1中给出。
实施例4
构建表达质粒V51TDH-S24R2
基本上如已在实施例3中描述的构建用于S24R2组成型表达的 V51TDH-S24R2载体(见实施例1)。合成基因S24R2的1564bp大的 Bam HI-Eco RI限制性产物被连接进由Bam HI和Eco RI限制的V51TDH 载体中。V51TDH-S24R2的限制性图谱在图2中给出。
实施例5
构建着丝粒表达质粒pFLAde-S24R1
通过将来自V51TDH-S24R1(如在实施例3中描述的)的TDH3p- S24R1-PGK1t表达盒插进携带酵母着丝粒和自主复制序列(ARS CEN)以 及ADE2选择标记的空pFLAdeE.coli/S.cerevisiae穿梭载体中,来构建用 于基因S24R1(见实施例1)组成型表达的着丝粒pFLAde-S24R1载体。 通过编码ADE2基因的2.7kb Bam HI片段替代编码URA3基因的pFL38 (Bonneaud et al.,1991)的1.1kb Bgl II片段,来构建pFLAde载体,所 述ADE2基因使用下述引物在酵母基因组DNA上通过PCR扩增获得:
ADE2-1 5′-CGGATCCACTAGTAACGCCGTATCGTGATTAACG-3′,(SEQ ID NO:12)
ADE2-2 5′-AGGATCCTCCTGACGTAGCTATCCTCGGTTCTG-3′.(SEQ.ID NO:13)
使用在标准条件下的PrimeSTAR HS DNA聚合酶(Takara,Otsu,Shiga, Japan)和下述引物,通过PCR来扩增TDH3p-S24R1-PGK1t表达盒:
TDH 5′-AGGCGCGCCACCGGTGCCATTTCAAAGAA-3′(SEQ.ID NO:14)
PGK 5′-AGGCGCGCCCAAGCTTTAACGAACGCAGA-3′.(SEQ.ID.NO:15)
扩增产物被克隆进pCR2.1-TOPO(Invitrogen,Carlsbad,CA 92008, USA)。通过Sac I-Pst I限制性酶,TDH3p-S24R1-PGK1t盒从后者的载 体中被分离出,并连接进通过相同的限制性酶切割的pFLAde载体中。产 生的pFLAde-S24R1着丝粒表达载体的限制性图谱在图3中给出。
实施例6构建表达载体V51-C25H1
通过将来自C25H1的826bp Bam HI-Eco RI片段插入进用Bam HI和 Eco RI消化的V51中,来构建用于C25H1(见实施例2)的半乳糖可诱导 表达的V51-C25H1质粒。产生的V51-C25H1表达质粒在半乳糖可诱导的 GAL10-CYC1杂合启动子(Guarente et al.,1982)和PGK1终止子的控制 下编码合成基因C25H1。V51-C25H1的限制性图谱在图4中给出.
实施例7构建表达载体V51-C25H3
如已在实施例6中描述的,通过将合成基因C25H3的826bp Bam HI- Eco RI片段插入用Bam HI和Eco RI消化的V51中,构建用于合成基因 C25H3(见实施例2)的半乳糖可诱导的表达的V51-C25H3载体。产生的 表达质粒V51-C25H3在半乳糖可诱导的GAL10-CYC1杂合启动子和PGK1 终止子的控制下编码C25H3。V51-C25H3的限制性图谱在图5中给出。
实施例8
酵母菌株的转化和甾醇提取
用上文描述的不同的表达质粒转化菌株W303-1B(MATalpha;ura3-52; trp1-1;leu2-3,112;his3-11;ade2-1;can1-100;Thomas和Rothstein,1989)和 其erg6突变体ERT(MATalpha;erg6::TRP1;ura3-52;trp1-1;leu2-3,112; his3-11;ade2-1;can1-100)。通过将有功能性的TRP1基因插入ERG6实现 菌株ERT的ERG6失活。使用ERG6序列界定的(bordered)TRP1引物, 通过PCR扩增来自pFL45(Bonneaud et al.,1991)的TRP1基因。引物的 序列如下:
ERGTRP-1:
5′-CATAAGATGAGTGAAACAGAATTGAGAAAAAGACAGGCCCAATCAAATTCG GGTCGAAAAAAGAAAAG-3′,(SEQ.ID.NO:16)
ERGTRP-2:
5′-CTAGCGACGAAAAGCATCATTGGAGTGAATAACTTGGACTTACCATTCTTAG CATTTTGAC-3′.(SEQ.ID.NO:17)
如Gietz等人(1995)描述的,使用锂-PEG技术,将产生的PCR产 物用来转化菌株。在没有色氨酸的限定培养基上选择转化体并通过HPLC 检验它们的甾醇组合物(Lecain et al.,1996),所述HPLC证实了没有麦 角甾醇和存在不常见的甾醇,这与ERG6失活的已知作用一致。 erg6::TRP1转化体被保留用于进一步研究并被命名为ERT。
除了ERT之外,S.cerevisiae野生型菌株BY4742(genotype MATalpha;his3Δ1;leu2Δ0;lys2Δ0;ura3Δ0;Brachmann et al.,1998)也被用 作经构建的质粒的宿主。
如Gietz等人(1995)描述的通过锂-PEG方法进行BY4742,W303- 1B和ERT的转化。在取决于在载体上存在的选择标记而没有尿嘧啶或腺 嘌呤的最低限定培养基(表1)上选择转化体。分析每次转化的至少两个 独立的转化体。为甾醇分析,转化体在合成的培养基(如表2中描述的) 中生长至稳定期。
通过离心从培养基回收酵母细胞并用等体积的去离子水洗涤。将细胞 再悬浮于在2ml Eppendorf管的100μl水中并在存在0.1g玻璃珠粒(0.5 mm)时通过强振荡(5min)破碎细胞。2ml 1,2-二氯乙烷添加至再悬浮 细胞并将混合物强烈振荡5分钟,在10,000rpm下5分钟离心后将溶剂相 转移至玻璃管。提取两次。合并的有机相在氮气下蒸发。最后步骤,将干 燥的提取物在100μl乙腈中再悬浮用于HPLC分析。
实施例9
通过具有UV和质谱检测的高效液相色谱(HPLC)分析甾醇
通过由UV和质谱检测监测的反相HPLC来分析如实施例8描述的制 备的甾醇提取物的等分部分(通常30μl)。将″Waters Alliance HT 2790″ HPLC与来自″Waters PDA 996″型的光电二极阵列UV检测和质量检测器 ″Waters MicroMass ZQ″(Waters,Milford,MA01757,USA)连接。用线 性的含有0.03%(v/v)甲酸的水/乙腈梯度液在60℃在XTerra RP18 3.5μm 4.6×100mm柱(Waters,Milford,MA01757,USA)上进行分离。 在柱稳定之后,用含有80%缓冲液A(有0.03%甲酸的水)和20%缓冲 液B(0.03%甲酸的乙腈)的缓冲液注射样品。最初5分钟,缓冲液组合 物从80%的缓冲液A和20%的缓冲液B逐渐改变至25%的缓冲液A和 75%的缓冲液B。在接下去的15分钟中,缓冲液组合物从25%的缓冲液 A和75%的缓冲液B逐渐改变至12.5%的缓冲液A和87.5%。在分离方 案的最后时刻,达到100%的缓冲液B。该值保持2分钟以允许柱再生。
用光电二极阵列检测器监测在205至300nm之间的色谱。质量检测 器通过正离子电喷雾允许检测从350至450的m/z,具有1单位的m/z灵 敏度。
通过与标准物比较的它们的色谱行为、它们的UV吸收光谱和它们的 质量碎片谱图为基础的来鉴定甾醇(表5)。根据和Kalpar (1999),存在吡啶时用乙酸酐将25-羟基7-脱氢胆固醇标准物(由DSM 提供)乙酰化为25-羟基-7-脱氢胆固醇乙酸酯(25OH-7DHC-Ac.)。0.5 mg的干燥25-羟基7-脱氢胆固醇被再悬浮在1ml的乙酸酐/吡啶溶液 (50/50v/v)中并在55℃下加热3小时。将反应混合物用4ml的水稀 释。在HPLC分析之前,如实施例8中所述的,将0.5ml的稀释的反应混 合物用1,2-二氯乙烷提取。
在上文描述的条件下分析,由于乙酰化的化合物的较高的疏水性,较 之未乙酰化的25-羟基-7-脱氢胆固醇标准物(RT 6.9min),25OH-7DHC- Ac标准物显示了保留时间的移动(RT 8.5min)。25OH-7DHC-Ac标准物 的质量碎片谱图与未乙酰化的25-羟基7-脱氢胆固醇标准物的谱图相似。 对应于乙酰化形式的m/z信号从未被检测到,可能因为在质量检测器的检 测期间发生去乙酰化作用。
表5:不同的甾醇的色谱、光谱和质量碎片性质
实施例10
来自质粒V51TDH-S24R1的S24R1基因
在ERG6-缺陷的S.cerevisiae菌株ERT中的表达
通过锂-PEG技术(Gietz et al.,1995),质粒V51TDH-S24R1(见实 施例3)和作为对照的空载体V51TDH被转化进菌株ERT。转化体在没有 尿嘧啶的最低限定培养基上选择。针对质粒的存在,分析来自每一转化的 四个独立的转化体。随机选择被证实的转化体中的一个,分别命名为 ERT/V51TDH和ERT/V51TDH-S24R1并用于进一步的分析。
将菌株在2%(w/v)葡萄糖Kapelli培养基(表2)中生长至稳定 期,如实施例8所述的提取所有的甾醇并如实施例9中所述的通过具有 UV和质谱检测的HPLC分析。使用各自的标准物(表5)通过它们的保 留时间、质量和光谱性质鉴定主要的甾醇。
HPLC洗脱谱图(在282nm下的UV检测)在图6中示出。胆甾- 5,7,22,24-四烯醇(RT 9.2min,m/z=363,UV最大233nm)是在 ERT/V51TDH erg6对照菌株中发现的主要甾醇,对应于在282nm下的70 %的UV信号。在282nm下鉴定的总甾醇的7%被鉴定为胆甾5,7,24-三烯 醇(RT 10.3min,m/z=365,UV max 282nm;图6-A)。
表达S24R1基因的菌株ERT/V51TDH-S24R1的甾醇谱图(图6-B)揭 示了在对照菌株ERT/V51TDH中未检测出的两种甾醇的存在,即胆甾 5,7,22-三烯醇(RT 10.8min,m/z=365,UV max 282nm)——该菌株的主 要甾醇(在282nm下60%的UV信号)和胆甾5,7-二烯醇——也称为7- 脱氢胆固醇(RT 11.8,m/z=367,UV max 282nm)。通过胆甾5,7,24-三 烯醇和胆甾5,7,22,24-四烯醇的Δ24-25键的还原产生的胆甾5,7,-二烯醇和胆 甾5,7,22-三烯醇的存在证实了基因S24R1的甾醇Δ24-还原酶活性(见图 13)。
实施例11
来自质粒V51TDH-S24R2的基因S24R2
在S.cerevisiae菌株ERT中的表达
使用锂-PEG方案(Gietz et al.,1995),将组成型表达S24R2的质粒 V51TDH-S24R2(实施例3)转化进菌株ERT。转化体在没有尿嘧啶的最 低培养基上选择。分析了四个独立的转化体并显示了相同的性质。它们中 的一个被命名为ERT/V51TDH-S24R2并用于进一步的分析。
在2%葡萄糖Kapelli培养基(表2)中培养菌株直到达到稳定期, 提取甾醇并如实施例8,9和10中描述的进行分析。再一次,胆甾 5,7,22,24-四烯醇(RT 9.2min,m/z=363,UV max 233nm)和胆甾5,7,24- 三烯醇(RT 10.3min,m/z=365,UV max 282nm)在对照菌株 ERT/V51TDH(图6-A)中被发现为主要的甾醇,而在表达S24R2的菌株 ERT/V51TDH-S24R2中检测到的主要甾醇为胆甾5,7,22-三烯醇(RT 10.8 min,m/z=365,UV max 282nm),具有在282nm下的70%的UV信号 (图6-C)。胆甾5,7-二烯醇(7-脱氢胆固醇;RT 11.8,m/z=367,UV max 282nm)以较低的浓度被发现(13%的UV信号)。这些结果证实了 S24R2基因的甾醇Δ24-还原酶活性。
实施例12
来自着丝粒质粒pFLAde-S24R1的基因S24R1
在S.cerevisiae菌株ERT中的表达
使用锂-PEG程序(Gietz et al.,1995),将用于基因S24R1组成型表 达的着丝粒质粒pFLAde-S24R1(实施例5)转化进ERT菌株。在没有腺 嘌呤的限定培养基上选择转化体。针对质粒pFLAde-S24R1的存在和它们 的甾醇模式,分析四个独立的转化体。随机选择它们中的一个,命名为 ERT/pFLAde-S24R1并被用于进一步阐明结果。
ERT/pFLAde-S24R1在2%葡萄糖Kapelli培养基(表2)中生长直到 其达到稳定期。提取甾醇并如实施例8和9中描述的进行分析。在 ERT/pFLAde-S24R1中而不在对照中存在的主要的新甾醇是胆甾5,7,22-三 烯醇(RT 10.8min,m/z=365,UV max 282nm),具有在282nm下的60 %的UV信号(图6-D)。还检测出来较少量(7%的UV信号)的7-脱氢 胆固醇(RT 11.8,m/z=367,UV max 282nm)。除了那些新甾醇外,也 在ERT对照菌株(图6-A)中存在的胆甾5,7,22,24-四烯醇(RT 9.2min, m/z=363,UV max 233nm)和胆甾5,7,24(RT 10.3min,m/z=365,UV max 282nm)还在ERT/pFLAde-S24R1中发现。这些结果证实了从着丝粒 质粒pFLAde-S24R1表达的S24R1基因的甾醇Δ24-还原酶活性。
实施例13
通过在S.cerevisiae菌株ERT中基因S24R1和C25H1的共表达
生产25-羟基-7-脱氢胆固醇乙酸酯
用锂-PEG方法(Gietz et al.,1995),质粒V51作为对照,用于基因 C25H1的半乳糖可诱导的表达的质粒V51-C25H1(实施例6)被转化进菌 株ERT/pFLAde-S24R1(实施例12中描述的)。V51-C25H1和pFLAde- S24R1是可相容的质粒。它们的不同的起点——2μ和ARS-CEN,允许它 们同时存在于酵母中。转化体在没有尿嘧啶和腺嘌呤的最低培养基上进行 选择。分析来自每一转化的四个独立的转化体并显示相同的性质。随机选 择来自每一转化的一个转化体,分别命名为ERT/pFLAde-S24R1/V51- C25H1和ERT/pFLAde-S24R1/V51并用于进一步的分析。
在2%半乳糖Kapelli培养基(表2)中生长菌株,直到它们达到稳定 期。提取甾醇并在如实施例10描述的条件下如实施例8和9中描述的通过 具有UV和质谱检测的HPLC进行分析。如针对对照菌株ERT/pFLAde- S24R1/V51(图7-C)发现的,在ERT/pFLAde-S24R1/V51-C25H1(图7- D)中的主要甾醇是胆甾5,7,22-三烯醇(RT 10.8min,m/z=365,UV max 282nm),其通过甾醇Δ24-还原酶将最终的甾醇——胆甾5,7,22,24-四烯 醇还原而产生。在菌株ERT/pFLAde-S24R1/V51-C25H1(图7-D)中观察 到不在对照菌株中存在的新的化合物,所述新化合物和被注入作为标准物 (RT 8.5min,图7-B)的制备的25-羟基7-脱氢胆固醇乙酸酯(25OH- 7DHC-Ac)同时洗脱出。该化合物还显示了如制备的25-羟基7-脱氢胆固 醇乙酸酯(图8-B)的相同的UV吸收谱图(图8-C),具有如也对7-脱 氢胆固醇标准物(图8-A)观察到的Δ5-Δ7共轭双键特有的在282nm附 近的双重峰。如通过在线质谱分析测定的(如在实施例9中描述的进 行),新化合物还显示了与25-羟基7-脱氢胆固醇乙酸酯(图9-B)相同 的质量碎裂谱图(图9-C)。
在3β-羟基甾醇的情况下,电喷雾分析产生了在分子量减17(质子化 (+1))和C3位置上脱水(-18)的主要信号。7-脱氢胆固醇(图9-A) 的主要信号在367(384(7-脱氢胆固醇MW)+1(质子化)-18(3β-羟 基甾醇脱水))的m/z质量下。在383的m/z质量下的对25-羟基7-脱氢 胆固醇乙酸酯观察到的信号对应于在C-25位置上的其他羟基化(367+16 =383)。365的m/z质量的主要信号对应于在C25位置上的脱水(383- 18=365),这在质量检测器内部检测期间针对一部分分子发生。这些不 同的结果(与用作标准物的25-羟基7-脱氢胆固醇乙酸酯相同的保留时 间,相同的UV谱图和相同的质量碎裂)表明,在ERT/pFLAde- S24R1/V51-C25H1菌株中产生的新化合物是25-羟基7-脱氢胆固醇乙酸 酯。
实施例14
通过S24R1和C25H3在S.cerevisiae菌株ERT中共表达生产25-羟基-7- 脱氢胆固醇乙酸酯
通过锂-PEG方法(Gietz et al.,1995),将构建的用于基因C25H3的 半乳糖可诱导表达的V51-C25H3(实施例7)转化进菌株ERT/pFLAde- S24R1(见实施例13)中。转化体在没有尿嘧啶和腺嘌呤的最低培养基上 选择。分析四个独立的转化体用于确认存在两种质粒。随机选择它们中的 一个,命名为ERT/pFLAde-S24R1/V51-C25H3并用于进一步的研究。
ERT/pFLAde-S24R1/V51-C25H3在2%半乳糖Kapelli培养基(表2) 中生长直至稳定期。从收获的细胞中提取甾醇并在如实施例10中描述的 条件下,通过如实施例8和9中描述的具有UV和质谱检测的HPLC进行 分析。如在对照菌株ERT/pFLAde-S24R1/V51(图7-C)中发现的,在 ERT/pFLAde-S24R1/V51-C25H3(图7-E)中的主要甾醇是胆甾5,7,22-三 烯醇(RT 10.8min,m/z=365,UV max 282nm)——如已在实施例13中 描述的通过甾醇Δ24-还原酶的最终甾醇胆甾5,7,22,24-四烯醇的还原产 物。
在ERT/pFLAde-S24R1/V51-C25H3中发现了与25-羟基7-脱氢胆固醇 乙酸酯(RT 8.5min,图7-B)同时洗脱的、不在亲本菌株中存在的化合物 (图7-E)。在ERT/pFLAde-S24R1/V51-C25H1(在实施例13中描述的) 的情况下,该化合物显示了与25-羟基7-脱氢胆固醇乙酸酯同一的UV吸 收谱图(图8)和同一的质量碎裂谱图(图9)。这些结果(与25-羟基7- 脱氢胆固醇乙酸酯相当的保留时间,UV谱图和质量碎裂)表明在 ERT/pFLAde-S24R1/V51-C25H3中产生的新化合物是如实施例13中的25- 羟基7-脱氢胆固醇乙酸酯。
实施例15
通过在S.cerevisiae菌株W303-1B和BY4742中表达C25H1生产25-羟基- 麦角甾醇乙酸酯
通过锂-PEG方法(Gietz et al.,1995),空载体V51作为对照,将构 建的用于基因C25H1的半乳糖可诱导的表达的质粒V51-C25H1(实施例 6)转化进菌株W303-1B(在实施例8中描述的)。在没有尿嘧啶的最低 培养基上选择转化体。针对每一转化的独立的转化体分析质粒的存在。随 机选择每一转化的阳性转化体,分别命名为W303/V51-C25H1和 W303/V51并用于进一步的研究。
菌株在2%半乳糖Kapelli培养基(表2)中生长直到它们达到稳定 期。从收获的细胞中提取甾醇并在实施例10描述的条件下,通过如实施 例8和9中描述的具有UV和质谱检测的HPLC进行分析。HPLC洗脱谱 图(在282nm下的UV检测)在图10中显示。如通过与麦角甾醇(RT 11.9min,m/z=379,UV max 282nm)的保留时间(图10-A)、UV光谱 (图11-A)和质量碎裂谱图(图12-A)比较表明的,针对两种菌株 W303/V51-C25H1(图10-C)和W303/V51(图10-B)都观察到的主要信 号对应于麦角甾醇(麦角甾5,7,22-三烯醇)——S.cerevisiae野生型菌株的 主要甾醇。
菌株W303/V51-C25H1(图10-C)的10min下的次要信号仅被观察 为W303/V51对照菌株(图10-B)的微量信号。通过在线PDA检测测定 的该峰的UV谱图(图11-B)显示了除了以在282nm左右的双峰为特征 的共轭双键Δ5和Δ7之外的共轭双键Δ22和Δ24特有的在233nm下的最 大吸收。也许,该信号对应于麦角甾5,7,22,24-四烯醇——没有通过Erg4p 对Δ24还原的麦角甾醇生物合成途径的最后中间产物之一(见图13)。通 过在线质谱检测的377的m/z质量(图12-B)与麦角-四烯醇结构一致。
通过HPLC在菌株W303/V51-C25H1的甾醇提取物中观察到的在8.7 下的第三个信号(图10-C)在W303/V51(图10-B)中完全没有。测定 该峰的UV谱图(图11-C)显示了具有共轭双键Δ5和Δ7特有的在282 nm下最大值的典型的双峰。质量碎裂(图12-C)显示了在m/z=377下的 主要信号和在m/z=395下的次要信号与麦角甾醇的羟基化形式(379+16 =395)和其脱水形式(395-18=377)一致。除了所有的质量增加了12 个质量单位——对应于7-脱氢胆固醇(m/z=367)和麦角甾醇(m/z= 379)之间的质量差异外,碎裂谱图(图12-C)与25-羟基7-脱氢胆固醇 乙酸酯(图9-B)碎裂谱图之一是同一的。在该新化合物(RT 8.7min)和 麦角甾醇(RT 11.9min)之间的3.2min保留时间差异与25-羟基7-脱氢胆 固醇乙酸酯(RT 8.5min)和7-脱氢胆固醇(RT 11.8)之间的保留时间差 异是同一的。
所有这些性质(UV谱图、质量碎裂、保留时间)与在W303/V51- C25H1中通过C25H1表达产生的该新化合物是25-羟基-麦角甾醇乙酸酯的 结论一致。
空载体V51作为对照,V51-C25H1转化进S.cerevisiae菌株BY4742 导致与菌株W303/V51-C25H1和W303/V51所获得结果相似的结果(图 10)。针对V51-C25H1转化体,通过HPLC(UV检测)再次观察到在8.7 min下的其他信号。化合物显示了与在W303/C25H1中检测到的化合物的 相同的UV谱图(图11)和质量碎裂谱图(图12),这强烈表示该化合 物也是25-羟基-麦角甾醇乙酸酯。
实施例16
通过在S.cerevisiae菌株W303-1B中表达基因C25H3生产25-羟基-麦角 甾醇乙酸酯
使用锂-PEG方法(Gietz et al.,1995),将构建的用于合成基因 C25H3的半乳糖可诱导表达的质粒V51-C25H3(实施例7)转化进菌株 W303-1B(如实施例8中描述的)。转化体在没有尿嘧啶的最低培养基上 选择。针对V51-C25H3的存在,分析四个独立的转化体。一个阳性转化体 被命名为W303/V51-C25H3并用于对产生的甾醇进一步研究。
菌株在2%半乳糖Kapelli培养基(表2)中生长直到它们达到稳定 期。从收获的细胞中提取甾醇并在实施例10描述的条件下,如实施例8 和9中描述的通过具有UV和质谱检测的HPLC进行分析。
如图10-D中给出的通过HPLC(在282nm下的UV检测)对甾醇提 取物的分析显示了W303/V51-C25H3的甾醇模式与菌株W303/V51-C25H1 (实施例15)的甾醇模式非常相似,具有除了麦角甾醇(RT 11.9min)和 麦角甾5,7,22,24-四烯醇(RT 10.0min)之外的产生的新化合物(RT 8.7 min)。在线UV PDA检测(图11)和质谱(图12)显示了该新化合物具 有如通过W303/V51-C25H1产生的化合物的相同的性质,例如特有的Δ5- Δ7的共轭双键UV谱图、具有在m/z=377下的主要信号和在m/z=395 下的次要信号的质量碎裂和HPLC保留时间延迟与25-羟基化的甾醇一 致。所有这些特征(UV谱图,质量碎裂,保留时间)强烈表示新化合物 是得自C25H3的表达的25-羟基-麦角甾醇乙酸酯。
实施例17
将C25H1和C25H3引进主要产生胆甾-5,7,24-三烯醇的酵母菌株
用锂-PEG方法(Gietz et al.,1995),质粒V51作为对照质粒,将用 于基因C25H1和C25H3的半乳糖可诱导表达的V51-C25H1(实施例6) 和质粒V51-CH25H3(实施例7)转化进菌株ERT erg5 erg6(实施例12中 描述的;通过基因URA3的整合使ERG5失活)中。转化体在没有尿嘧啶 和腺嘌呤的最低培养基上选择。分析来自每一转化的四个独立转化体并且 其显示了相同的性质。随机选择来自每一转化的一个转化体,分别命名为 ERT erg5 erg6/V51-C25H1、ERT erg5 erg6/V51-C25H3和ERT erg5 erg6/V51并用于进一步的分析。
菌株在2%半乳糖Kapelli培养基(表2)中生长直到它们达到稳定 期。提取甾醇并在实施例10描述的条件下,如实施例8和9中描述的通过 具有UV和质谱检测的HPLC进行分析。在三个菌株之间没有检测到甾醇 模式的差异,这证明两种羟化酶对胆甾-5,7,24-三烯醇没有活性。
实施例18
选择额外的胆固醇25-羟化酶基因
除了被选择的来自S.scrofa和C.familiaris(Canis lupus)的推定胆固 醇25-羟化酶基因之外,来自R.norvegicus(SEQ.ID.NO:21,基因库登录 号NP_001020586,XP_220063)、P.troglodytes(SEQ.ID.NO:18,基因 库登录号XP_507901)和E.caballus(SEQ.ID.NO:24,基因库登录号 XP_001503057)的同源基因也被详细地研究。
针对每一经选择的25-羟化酶,计算在S.cerevisiae中的用于表达的两 种不同的经密码子优化的基因(SEQ.ID.NOS:19,20,22,23,25, 26)。以后缀“_opt”结尾的所有基因是由公司DNA 2.0(Menlo Park, CA,USA)使用它们专有的算法进行密码子优化的。通过总是将对于每个 氨基酸最常用的密码子放在序列中该氨基酸出现的每个位置上产生具有后 缀“_HY”的所有基因。用于酵母的典型的密码子使用表是公众可得到的 并且也是程序套件Lasergene的一部分。
来自S.scrofa(见实施例2)的25-羟化酶的两种新的经优化的基因 (SEQ.ID.NO:27,28)也通过使用上文描述的相同的方法计算。
使用用已知的算法ClustalW计算的氨基酸序列比对作为输入,通过简 单选择每一位置的最大丰度的氨基酸,测定共有氨基酸序列。如果“最大 丰度的氨基酸”没有被测定出,各自位置的氨基酸被任意选择。如上文所 述的,该ConHyD氨基酸序列(SEQ.ID.NO:29)也被反翻译成两个不同 的DNA序列(SEQ.ID.NO:30,31)。
来自P.troglodytes的推定胆固醇25-羟化酶的SEQ.ID.NO:18氨基酸 序列:
MSCHNCSDPQVLCSSGQLFLQPLWDHLRSWEALLQSPFFPVIFSITTYVGFCLPFVVLDILCSWVPALRRYKIHP
DFSPSARQLLPCLGQTLYQHVMFVFPVTLLHWARSPALLPHEAPELLLLLHHILFCLLLFDMEFFVWHLLHHKVP
WLYRTFHKVHHQNSSSFALATQYMSVWELFSLGFFDMMNVTLLGCHPLTTLTFHVVNIWLSVEDHSGYNFPWSTH
RLVPFGWYGGVVHHDLHHSHFNCNFAPYFTHWDKIIGTIRTASVPAR
P.troglodytes CH25OH_opt 2.0的SEQ.ID.NO:19 DNA序列
ATGTCATGTCATAACTGTTCTGATCCTCAAGTTTTGTGTTCAAGTGGTCAACTGTTCCTGCAACCTCTTTGGGAT
CACTTGAGAAGTTGGGAGGCACTATTGCAGTCTCCATTCTTCCCTGTGATCTTCTCTATTACTACCTATGTTGGA
TTCTGTTTGCCATTTGTGGTGCTGGACATTCTATGCTCATGGGTTCCTGCCTTGAGAAGGTATAAGATACATCCT
GACTTTTCCCCTTCTGCTAGACAACTTTTACCATGCTTAGGGCAAACATTGTACCAACACGTGATGTTCGTTTTC
CCAGTGACATTGTTGCATTGGGCTAGATCCCCAGCTTTACTTCCACACGAAGCCCCAGAACTGTTACTTCTACTA
CACCACATTCTGTTCTGCTTGCTGCTATTTGATATGGAGTTTTTCGTATGGCACTTGCTTCATCACAAAGTCCCA
TGGTTATACAGAACCTTTCATAAAGTACATCACCAAAACTCCTCTTCCTTTGCACTGGCCACTCAGTACATGTCT
GTTTGGGAATTGTTTAGTTTAGGGTTTTTCGATATGATGAATGTCACGTTGCTAGGCTGTCACCCATTAACGACA
TTAACATTTCATGTTGTCAATATCTGGTTGTCAGTTGAGGATCATAGTGGCTACAACTTCCCATGGTCTACGCAC
AGATTAGTACCATTCGGTTGGTATGGTGGTGTTGTACATCATGACTTGCATCACTCTCATTTCAATTGTAACTTT
GCTCCTTACTTCACACATTGGGATAAGATCCTAGGAACTCTGAGAACAGCCTCAGTACCTGCAAGGTAATGA
P.troglodytes CH25OH_HY的SEQ.ID.NO:20 DNA序列
ATGTCTTGTCACAACTGTTCTGATCCACAAGTTTTGTGTTCTTCTGGTCAATTGTTCTTGCAACCATTGTGGGAT
CACTTGAGATCaTGGGAAGCcTTGTTGCAATCTCCATTCTTCCCAGTTATTTTCTCTATTACTACTTACGTTGGT
TTCTGTTTGCCATTCGTTGTTTTGGATATTTTGTGTTCTTGGGTTCCAGCTTTGAGAAGATACAAGATTCACCCA
GATTTCTCTCCATCTGCTAGACAATTGTTGCCATGTTTGGGTCAAACTTTGTACCAACACGTTATGTTCGTTTTC
CCAGTTACTTTGTTGCACTGGGCTAGATCcCCAGCTTTGTTGCCACACGAAGCTCCAGAATTGTTGTTGTTGTTG
CACCACATTTTGTTCTGTTTGTTGTTGTTCGATATGGAgTTCTTCGTTTGGCACTTGTTGCACCACAAGGTTCCA
TGGTTGTACAGAACTTTCCACAAGGTTCACCACCAAAACTCTTCTTCTTTCGCTTTGGCTACTCAATACATGTCT
GTTTGGGAATTGTTCTCTTTGGGTTTCTTCGATATGATGAACGTTACTTTGTTGGGTTGTCACCCATTGACTACT
TTGACTTTCCACGTTGTTAACATTTGGTTGTCTGTTGAAGATCACTCTGGTTACAACTTCCCATGGTCTACTCAC
AGATTGGTTCCATTCGGTTGGTACGGTGGTGTTGTTCACCACGATTTGCACCACTCTCACTTCAACTGTAACTTC
GCTCCATACTTCACTCACTGGGATAAGATTTTGGGTACTTTGAGAACTGCTTCTGTTCCAGCTAGATAATGA
来自R.norvegicus的推定胆固醇25-羟化酶的SEQ.ID.NO:21氨基酸 序列
MACHNVSELQDLGCSNQLLLQPLWDSIRTGEASARSPFFPVIFSIFTYLGFCLPFVVLDVLCPWVPILRRYKIHP
DFSPSVRQLLPCLGLTLYQHLVFVFPVTLMHWARSPALLPREAPELSQLLSHVLICLLLFDTEIFAWHLLHHKVP
WLYRTFHKVHHQNSSSFALATQYMSVWELLSLTFFDVLNVAMLQCHPLTILVFHVVNIWLSVEDHSGYDFPWSTH
RLVPFGWYGGVAHHDLHHSQFNCNFAPYFTHWDKMLGTLRCAPHSKRLCAGSESCLDSGEQCTVHLNQKKKQT
R.norvegicus CH25OH_opt 2.0的SEQ.ID.NO:22 DNA序列
ATGGCTTGTCATAATGTTTCAGAATTGCAGGATTTGGGTTGTAGTAACCAATTACTACTACAACCACTTTGGGAC
TCTATCAGAACTGGCGAAGCATCTGCTCGTTCTCCATTCTTCCCTGTCATTTTCTCCATTTTCACTTACTTAGGC
TTTTGTCTGCCATTTGTAGTCTTGGATGTACTTTGTCCATGGGTTCCTATACTTAGAAGATACAAGATCCATCCT
GACTTCTCACCATCCGTCAGGCAGTTGCTACCTTGCTTGGGTCTAACATTGTATCAGCACCTAGTGTTCGTTTTT
CCAGTCACATTGATGCACTGGGCTAGATCACCAGCCCTGCTACCTAGAGAAGCACCAGAGTTATCTCAATTACTG
TCCCATGTACTGATATGCTTGTTGTTGTTTGACACTGAAATCTTTGCTTGGCATCTTTTACACCACAAAGTTCCT
TGGTTATACAGAACCTTCCATAAGGTGCATCACCAAAACTCATCTTCATTTGCTTTAGCCACTCAATACATGAGT
GTGTGGGAGCTGTTATCATTAACCTTTTTCGATGTCCTTAATGTTGCCATGCTTCAATGTCACCCTTTGACAATT
CTGGTTTTTCATGTTGTCAACATCTGGTTGTCTGTAGAAGATCACTCTGGATATGATTTCCCATGGTCTACTCAT
AGGTTAGTTCCTTTCGGTTGGTACGGGGGTGTAGCACATCATGATCTGCATCATAGTCAATTCAACTGCAATTTC
GCACCATACTTCACACATTGGGATAAGATGCTAGGGACTCTAAGATGTGCCCCACACTCCAAGAGACTTTGTGCT
GGATCAGAATCTTGCCTAGATAGTGGTGAACAATGTACAGTGCACTTGAACCAGAAAAAGAAACAAACATGATAA
TGA
R.norvegicus CH25OH_HY的SEQ.ID.NO:23 DNA序列
ATGGCTTGTCACAACGTTTCTGAATTGCAAGATTTGGGTTGTTCTAACCAATTGTTGTTGCAACCATTGTGGGAT
TCTATTAGAACTGGTGAAGCaTCTGCTAGATCaCCATTCTTCCCAGTTATTTTCTCTATTTTCACTTACTTGGGT
TTCTGTTTGCCATTCGTTGTTTTGGATGTTTTGTGTCCATGGGTTCCAATTTTGAGAAGATACAAGATTCACCCA
GATTTCTCTCCATCTGTTAGACAATTGTTGCCATGTTTGGGTTTGACTTTGTACCAACACTTGGTTTTCGTTTTC
CCAGTTACTTTGATGCACTGGGCTAGATCaCCAGCTTTGTTGCCAAGAGAAGCTCCAGAATTGTCTCAATTGTTG
TCTCACGTTTTGATTTGTTTGTTGTTGTTCGATACTGAAATTTTCGCTTGGCACTTGTTGCACCACAAGGTTCCA
TGGTTGTACAGAACTTTCCACAAGGTTCACCACCAAAACTCTTCTTCTTTCGCTTTGGCTACTCAATACATGTCT
GTTTGGGAATTGTTGTCTTTGACTTTCTTCGATGTTTTGAACGTTGCTATGTTGCAATGTCACCCATTGACTATT
TTGGTTTTCCACGTTGTTAACATTTGGTTGTCTGTTGAAGATCACTCTGGTTACGATTTCCCATGGTCTACTCAC
AGATTGGTTCCATTCGGTTGGTACGGTGGTGTTGCTCACCACGATTTGCACCACTCTCAATTCAACTGTAACTTC
GCTCCATACTTCACTCACTGGGATAAGATGTTGGGTACTTTGAGATGTGCTCCACACTCTAAGAGATTGTGTGCT
GGTTCTGAATCTTGTTTGGATTCTGGTGAACAATGTACTGTTCACTTGAACCAAAAGAAGAAGCAAACTTAATGA
来自E.caballus的推定胆固醇25-羟化酶的SEQ.ID.NO:24氨基酸序 列:
MSGHNSSELHVLCSSGQLFLQPLWDSLRTREALTHSPFFPVIFSIATYVGFCLPFVVLDLLC
PWVPALRRYKIHPDFLPSARQVLPCLGQTLYQHLVFVFPATLLLWARGPVFLPLEAPELLQL
AFHVVFCLLLFDTEFFLWHVLHHKVPWLYRTFHKMHHQNSSSFALATQYMSIWELFSLVFFD
IMNVTLLECHPLTILVFHVVNIWLSVEDHSGYDFPWSTHRLVPFGWYGGVAHHDLHHSQFNC
NFAPYFTHWDKILGTLRSAHAK
E.caballus CH25OH_opt 2.0的SEQ.ID.NO:25 DNA序列
ATGTCCGGCCATAACTCATCAGAACTTCATGTTTTGTGTTCCTCTGGCCAATTGTTCCTACAACCTTTGTGGGAT
TCACTGAGAACTAGAGAGGCTCTTACACACTCCCCATTCTTCCCAGTAATCTTCTCAATCGCAACTTACGTTGGA
TTTTGTTTGCCATTTGTTGTCCTTGACTTGTTATGCCCTTGGGTGCCAGCCCTTAGAAGATACAAGATACATCCT
GATTTTCTGCCAAGTGCCAGACAGGTCTTGCCATGCTTAGGTCAAACCCTTTACCAACATCTAGTGTTCGTATTC
CCTGCAACACTATTGCTATGGGCTAGAGGGCCAGTATTTCTGCCTTTAGAAGCCCCTGAACTATTACAATTAGCA
TTCCATGTCGTCTTTTGTCTGTTGTTATTCGATACCGAGTTTTTCCTGTGGCATGTTTTACATCATAAAGTACCA
TGGTTATACCGTACATTTCACAAAATGCACCATCAAAACAGTTCCTCTTTCGCCCTTGCTACTCAGTATATGTCT
ATCTGGGAACTGTTTAGTCTAGTCTTTTTCGACATTATGAACGTTACATTGTTGGAATGTCACCCATTGACAATA
CTTGTTTTTCATGTTGTGAATATCTGGCTTTCTGTTGAAGATCACTCTGGTTACGATTTCCCTTGGTCAACACAT
AGGTTAGTTCCATTCGGATGGTATGGTGGAGTGGCTCACCATGATTTGCATCACTCACAATTCAATTGCAATTTC
GCACCATACTTCACTCACTGGGATAAGATTTTGGGTACACTAAGGTCTGCACACGCTAAGTAATGA
E.caballus CH25OH_HY的SEQ.ID.NO:26 DNA序列
ATGTCTGGTCACAACTCTTCTGAATTGCACGTTTTGTGTTCTTCTGGTCAATTGTTCTTGCAACCATTGTGGGAT
TCTTTGAGAACTAGAGAGGCTTTGACTCACTCTCCATTCTTCCCAGTTATTTTCTCTATTGCTACTTACGTTGGT
TTCTGTTTGCCATTCGTTGTTTTGGATTTGTTGTGTCCATGGGTTCCAGCTTTGAGAAGATACAAGATTCACCCA
GATTTCTTGCCATCTGCTAGACAAGTTTTGCCATGTTTGGGTCAAACTTTGTACCAACACTTGGTTTTCGTTTTC
CCAGCTACTTTGTTGTTGTGGGCTAGAGGTCCAGTTTTCTTGCCATTGGAAGCTCCAGAATTGTTGCAATTGGCT
TTCCACGTTGTTTTCTGTTTGTTGTTGTTCGATACTGAATTTTTCTTGTGGCACGTTTTGCACCACAAGGTTCCA
TGGTTGTACAGAACTTTCCACAAGATGCACCACCAAAACTCTTCTTCTTTCGCTTTGGCTACTCAATACATGTCT
ATTTGGGAATTGTTCTCTTTGGTTTTCTTCGATATTATGAACGTTACTTTGTTGGAATGTCACCCATTGACTATT
TTGGTTTTCCACGTTGTTAACATTTGGTTGTCTGTTGAAGATCACTCTGGTTACGATTTCCCATGGTCTACTCAC
AGATTGGTTCCATTCGGTTGGTACGGTGGTGTTGCTCACCACGATTTGCACCACTCTCAATTCAACTGTAACTTC
GCTCCATACTTCACTCACTGGGATAAGATTTTGGGTACTTTGAGATCAGCTCACGCTAAGTAATGA
S.scrofa CH25OH_opt 2.0的SEQ.ID.NO:27 DNA序列
ATGTCTGGTCATAACAATTCTGAGCTATTAGTTCTATGTTCTAGTGGACAGTTGTTCCTTCAGCCATTATGGGAT
CATTTGAAAACCTGGGAAACTTTGATTCAATCACCATTCTTCCCAGTCTTTTTCTCAATAACAACTTATCTGGGT
TTCTGTTTACCTTTCGTAGTGCTAGATGTTCTATGTCCTTGGGTGCCAGCACTTAGAAGATACAAGATCCACCCT
GACTTCTCACCATCCGTTTGGCAACTACTTCCATGTTTAGGATTAACCCTTTACCAACATGTTGTTTTTGTTTTT
CCAATGACACTATTACACTGGGCTGCTTCACCTGTCTTACTACCTCCTGAAGCTCCTGAGTTACTGCAATTAGTG
AGACATATAGTTTTGTGCTTGCTTCTGTTCGATACTGAGTTTTTCATTTGGCATGTCTTGCATCACAAAGTACCA
TGGTTGTATAGGACATTTCATAAGATGCACCATCAGAACAGTTCCTCTTTCGCCCTGGCCACTCAATACATGTCA
GTCGGCGAACTGTTGTCTTTGGGTGTATTTGATATGGTTAACATCATGCTACTACGTTGTCATCCACTTACAGTG
TTGATCTTTCATGTCATTAACATCTGGCTTTCAGTAGAAGATCATAGTGGATACGACTTTCCATGGTCTACTCAC
AGACTGGTTCCATTCGGTTGGTACGGAGGTGTAACACACCACGATTTGCATCACTCTCAATTCAATTGCAATTTC
GCTCCATACTTCACACATTGGGATAAGATATTGGGCACATTAAGATCCGCACACGCAAAGTAATGA
S.scrofa CH25OH_HY的SEQ.ID.NO:28 DNA序列
ATGTCTGGTCACAACAACTCTGAATTGTTCGTTTTGTGTTCTTCTTCTCAATTGTTCTTGCAACCATTGTGGGAT
CACTTGAAGACTTGGGAAACTTTGATTTTGTCTCCATTCTTCCCAGTTTTCTTCTCTATTACTACTTACTTGGGT
TTCTGTTTGCCATTCGTTGTTTTGGATGTTTTGTGTCCATGGGTTCCAGCTTTGAGAAGATACAAGATTCACCCA
GATTTCTCTCCATCTGTTTGGCAATTGTTGCCATGTTTGGGTTTGACTTTGTACCAACACGTTGTTTTCGTTTTC
CCAATGACTTTGTTGCACTGGGCTGCTTCTCCAGTTTTGTTGCCACCAGAAGCTCCAGAATTGTTGCAATTGGTT
AGACACATTGTTTTGTGTTTGTTGTTGTTCGATACTGAgTTCTTCATTTGGCACGTTTTGCACCACAAGGTTCCA
TGGTTGTACAGAACTTTCCACAAGATGCACCACCAAAACTCTTCTTCTTTCGCTTTGGCTACTCAATACATGTCT
GTTGGTGAATTGTTGTCTTTGGGTGTTTTCGATATGGTTAACATTATGTTGTTGAGATGTCACCCATTGACTGTT
TTGATTTTCCACGTTATTAACATTTGGTTGTCTGTTGAAGATCACTCTGGTTACGATTTCCCATGGTCTGCTCAC
AGATTGGTTCCATTCGGTTGGTACGGTGGTGTTACTCACCACGATTTGCACCACTCTCAATTCAACTGTAACTTC
GCTCCATACTTCACTCACTGGGATAAGATTTTGGGTACTTTGAGATCaGCTCACGCTAAGTAATGA
ConHyD的SEQ.ID.NO:29氨基酸序列
MSCHNSSELQVLCSSGQLFLQPLWDHLRTWEALIQSPFFPVIFSITTYVGFCLPFVVLDVLCPWVPALRRYKIHP
DFSPSARQLLPCLGQTLYQHVVFVFPVTLLHWARSPALLPREAPELLQLLSHVLFCLLLFDTEFFVWHLLHHKVP
WLYRTFHKVHHQNSSSFALATQYMSVWELlSLGFFDMLNVTLLQCHPLTVLTFHVVNIWLSVEDHSGYDFPWSTH
RLVPFGWYGGVAHHDLHHSQFNCNFAPYFTHWDKILGTLRSAhAK
ConHyD_opt 2.0的SEQ.ID.NO:30 DNA序列
ATGTCTTGCCACAATTCCTCTGAGCTTCAAGTATTGTGTTCATCAGGTCAGTTGTTTTTGCAACCATTATGGGAT
CACTTAAGGACGTGGGAAGCCCTGATTCAAAGTCCTTTCTTCCCTGTGATATTCTCCATAACTACTTACGTGGGC
TTTTGTTTACCATTTGTTGTTTTGGATGTTCTATGCCCATGGGTTCCAGCTCTGAGAAGATACAAGATTCATCCA
GATTTCTCCCCTTCAGCCAGACAATTGTTACCATGTTTGGGGCAAACACTATATCAGCATGTGGTCTTTGTTTTC
CCTGTGACTCTATTACATTGGGCCAGAAGTCCTGCTTTGCTGCCTAGAGAAGCCCCTGAACTGTTGCAGTTATTG
TCTCACGTCTTATTCTGTTTGCTGCTTTTCGATACAGAGTTTTTCGTTTGGCATCTACTTCATCATAAAGTTCCA
TGGCTGTATAGAACGTTCCACAAAGTCCACCACCAGAACTCTAGTTCATTCGCATTGGCCACCCAATACATGTCC
GTATGGGAACTGCTATCTTTAGGCTTTTTCGATATGCTTAATGTCACTCTTTTGCAATGTCATCCTTTGACAGTG
CTAACATTCCATGTAGTGAACATCTGGTTATCTGTAGAAGATCACAGTGGATATGATTTTCCTTGGTCTACTCAC
AGGTTGGTTCCATTTGGATGGTATGGTGGTGTAGCTCATCACGACCTGCATCATTCACAATTCAATTGCAACTTT
GCTCCATACTTTACACATTGGGACAAAATCTTGGGAACATTAAGGTCTGCTCATGCAAAGTGA
ConHyD_HY的SEQ.ID.NO:31 DNA序列
ATGTCTTGTCACAACTCTTCTGAATTGCAAGTTTTGTGTTCTTCTGGTCAATTGTTCTTGCAACCATTGTGGGAT
CACTTGAGAACTTGGGAAGCaTTGATTCAATCTCCATTCTTCCCAGTTATTTTCTCTATTACTACTTACGTTGGT
TTCTGTTTGCCATTCGTTGTTTTGGATGTTTTGTGTCCATGGGTTCCAGCTTTGAGAAGATACAAGATTCACCCA
GATTTCTCTCCATCTGCTAGACAATTGTTGCCATGTTTGGGTCAAACTTTGTACCAACACGTTGTTTTCGTTTTC
CCAGTTACTTTGTTGCACTGGGCTAGATCaCCAGCTTTGTTGCCAAGAGAAGCTCCAGAATTGTTGCAATTGTTG
TCTCACGTTTTGTTCTGTTTGTTGTTGTTCGATACTGAATTtTTCGTTTGGCACTTGTTGCACCACAAGGTTCCA
TGGTTGTACAGAACTTTCCACAAGGTTCACCACCAAAACTCTTCTTCTTTCGCTTTGGCTACTCAATACATGTCT
GTTTGGGAATTGTTGTCTTTGGGTTTCTTCGATATGTTGAACGTTACTTTGTTGCAATGTCACCCATTGACTGTT
TTGACTTTCCACGTTGTTAACATTTGGTTGTCTGTTGAAGATCACTCTGGTTACGATTTCCCATGGTCTACTCAC
AGATTGGTTCCATTCGGTTGGTACGGTGGTGTTGCTCACCACGATTTGCACCACTCTCAATTCAACTGTAACTTC
GCTCCATACTTCACTCACTGGGATAAGATTTTGGGTACTTTGAGATCaGCTCACGCTAAGTAATGA
实施例19
从整合进ERG6的表达构建体表达新25-羟化酶基因
在实施例18中显示的新基因被整合进S.cerevisiae SC0554(erg5, erg6,TRP1-pARC300D,URA3-pARC304S,ARE1::TDH3p-S24R2-PGKt- URA3;关于两个质粒的描述见专利US 5,460,949)的ERG6基因座。
整合构建体的序列在下文示出。感兴趣的羟化酶被克隆在整合构建体 的Bam HI和Eco RI位点之间。如在质粒V51TDH中发现的,ERG6整合 构建体具有针对表达的S.cerevisiae的TDH3启动子和PGK终止子以及针 对选择的S.cerevisiae的URA3。如上文描述的进行培养、转化和选择。
最终的菌株被称为:
S.cerevisiae Ecab HY(具有SEQ.ID.NO:26基因的整合构建体),
Ecab opt 2.0(具有SEQ.ID.NO:25的基因的整合构建体),
Ptro opt 2.0(具有SEQ.ID.NO:19的基因的整合构建体),
Ptro HY(具有SEQ.ID.NO:20的基因的整合构建体),
ConHyD HY(具有SEQ.ID.NO:31的基因的整合构建体),
ConHyD opt 2.0(具有SEQ.ID.NO:30的基因的整合构建体),
Rnor HY(具有SEQ.ID.NO:23的基因的整合构建体),
Rnor opt 2.0(具有SEQ.ID.NO:22的基因的整合构建体),
Sscr HY(具有SEQ.ID.NO:28的基因的整合构建体),
Sscr opt 2.0(具有SEQ.ID.NO:27的基因的整合构建体),和
Scr Pompon,所述菌株具有具有如在实施例2中所述的经优化的25- 羟化酶。
ERG6整合构建体的SEQ.ID.NO:32 DNA序列
gtcgacGTTTTACTTTCGATTTAAGTTTTACATAATTTAAAAAAACAAGAATAAAATAATAATATAGTAGGCAGC
ATAAGATGAGTGAAACAGAATTGAGAAAAAGACAGGCCCAATTCACTAGGGAGTTACATGGTGATGATATTGGTA
AAAAGACAGGTTTGAGTGCATTGATGTCGAAGAACAACTCTGCCCAAAAGGAAGCCGTTCAGAAGTACTTGAGAA
ATTGGGATGGTAGAACCGATAAAGATGCCGAAGAACGTCGTCTTGAGGATTATAATGAAGCCACACATTCCTACT
ATAACGTCGTTACAGATTTCTATGAATATGGTTGaGGTTCCTCTTTCCATTTCAGCAGATTTTATAAAGGTGAGA
GTTTCGCTGCCTCGATAGCAAGACATGAACATTATTTAGCTTACAAGGCTGGTATTCAAAGAGGCGATTTAGTTC
TCGACGTTGGTTGTGGTGTTGGGGGCCCAGCAAGAGAGATTGCAAGATTTACCGGTGCCATTTCAAAGAATACGT
AAATAATTAATAGTAGTGATTTTCCTAACTTTATTTAGTCAAAAAATTAGCCTTTTAATTCTGCTGTAACCCGTA
CATGCCCAAAATAGGGGGCGGGTTACACAGAATATATAACATCGTAGGTGTCTGGGTGAACAGTTTATTCCTGGC
ATCCACTAAATATAATGGAGCCCGCTTTTTAAGCTGGCATCCAGAAAAAAAAAGAATCCCAGCACCAAAATATTG
TTTTCTTCACCAACCATCAGTTCATAGGTCCATTCTCTTAGCGCAACTACAGAGAACAGGGGCACAAACAGGCAA
AAAACGGGCACAACCTCAATGGAGTGATGCAACCTGCCTGGAGTAAATGATGACACAAGGCAATTGACCCACGCA
TGTATCTATCTCATTTTCTTACACCTTCTATTACCTTCTGCTCTCTCTGATTTGGAAAAAGCTGAAAAAAAAGGT
TGAAACCAGTTCCCTGAAATTATTCCCCTACTTGACTAATAAGTATATAAAGACGGTAGGTATTGATTGTAATTC
TGTAAATCTATTTCTTAAACTTCTTAAATTCTACTTTTATAGTTAGTCTTTTTTTTAGTTTTAAAACACCAAGAA
CTTAGTTTCGAATAAACACACATAAggatccattattatttgaattcGCGGGGGATCTCCCATGTCTCTACTGGT
GGTGGTGCTTCTTTGGAATTATTGGAAGGTAAGGAATTGCCAGGTGTTGCTTTCTTATCCGAAAAGAAATAAATT
GAATTGAATTGAAATCGTAGATCAATTTTTTTCTTTTCTCTTTCCCCATCCTTTACGCTAAAATAATAGTTTATT
TTATTTTTTGAATATTTTTTATTTATATACGTATATATAGACTATTATTTATCTTTTAATGATTATTAAGATTTT
TATTAAAAAAAAATTCGCTCCTCTTTTAATGCCTTTATGCAGTTTTTTTTTCCCATTCGATATTTCTATGTTCGG
GTTCAGCGTATTTTAAGTTTAATAACTCGAAAATTCTGCGTTCGAAAGCTTTTCAATTCATCTTTTTTTTTTTTG
TTCTTTTTTTTGATTCCGGTTTCTTTGAAATTTTTTTGATTCGGTAATCTCCGAGCAGAAGGAAGAACGAAGGAA
GGAGCACAGACTTAGATTGGTATATATACGCATATGTGGTGTTGAAGAAACATGAAATTGCCCAGTATTCTTAAC
CCAACTGCACAGAACAAAAACCTGCAGGAAACGAAGATAAATCATGTCGAAAGCTACATATAAGGAACGTGCTGC
TACTCATCCTAGTCCTGTTGCTGCCAAGCTATTTAATATCATGCACGAAAAGCAAACAAACTTGTGTGCTTCATT
GGATGTTCGTACCACCAAGGAATTACTGGAGTTAGTTGAAGCATTAGGTCCCAAAATTTGTTTACTAAAAACACA
TGTGGAcATCTTGACTGATTTTTCCATGGAGGGCACAGTTAAGCCGCTAAAGGCATTATCCGCCAAGTACAATTT
TTTACTCTTCGAAGACAGAAAATTTGCTGACATTGGTAATACAGTCAAATTGCAGTACTCTGCGGGTGTATACAG
AATAGCAGAATGGGCAGACATTACGAATGCACACGGTGTGGTGGGCCCAGGTATTGTTAGCGGTTTGAAGCAGGC
GGCGGAAGAAGTAACAAAGGAACCTAGAGGCCTTTTGATGTTAGCAGAATTGTCATGCAAGGGCTCCCTAGCTAC
TGGAGAATATACTAAGGGTACTGTTGACATTGCGAAGAGCGACAAAGATTTTGTTATCGGCTTTATTGCTCAAAG
AGACATGGGTGGAAGAGATGAAGGTTACGATTGGTTGATTATGACACCCGGTGTGGGTTTAGATGACAAGGGAGA
CGCATTGGGTCAACAGTATAGAACCGTGGATGATGTGGTCTCTACAGGATCTGACATTATTATTGTTGGAAGAGG
ACTATTTGCAAAGGGAAGGGATGCTAAGGTAGAGGGTGAACGTTACAGAAAAGCAGGCTGGGAAGCATATTTGAG
AAGATGCGGCCAGCAAAACTAAAAAACTGTATTATAAGTAAATGCATGTATACTAAACTCACAAATTAGAGCTTC
AATTTAATTATATCAGTTATTACCCGGGAATCTCGGTCGTAATGATTTCTATAATGACGAAAAAAAAAAAATTGG
AAAGAAAAAGCTTATTCACTAGATCAATAAGATTCAAATAAAGCGCACGATATATACCTATTTTCCTATATATGC
AGATAAAAAGATAGCACGTTCATTGCTAGCAGGCCTTACAAACAGACTGTCCGATGCCTTTACTACCCCACAATT
TATCCCACTTGTGATTTTCAAGTTCGGCTTTTTTTTTTTTCATCATGTCGTGGCAAACGACCAGTATTTTCTATC
AGAATAAGAAAAAACTATAATTCACTGCATACAAACGTATTGACTGCTCCCCTACAGCGGAAGATAGTAAGAATA
CAACATCGTAACTGTTTCCATATTTATGTGCCGATATGGTAAAAGTGAAATCTAAGAATAGTGTTATAAAGCTAT
TGTCTACAGCGGCAAGTGGATACTCTCGTTACATCTCGATTAAGAAAGGTGCACCTTTGGTTACTCAGGTCAGAT
ACGATCCTGTGGTGAAACGGCATGTGCTTTTCAAAGAAGCAAAGAAAAGGAAAGTGGCAGAAAgtcgac
实施例20
新HyDHC菌株的摇瓶检验
如实施例19中描述的产生的菌株在摇瓶中培养以评估新设计的推定 25-羟化酶基因的过表达作用。在YPD培养基中的4ml过夜培养物被用于 接种20ml的Kapelli培养基(实施例1)。培养24和48h后,进料10g/l 的葡萄糖,培养32和56h后,进料20g/l的葡萄糖。72h培养时间后,细 胞被旋转(spun down)、皂化,且如实施例9中所述的测定甾醇含量。如 图15中显示的,尽管具有不同的有效度,所有的新羟化酶基因在S. cerevisiae中表达并且基因产物都能将7-DHC羟基化为HyDHC。
文献,以下其每篇通过引用并入本文:
Brachmann C.B.,Davies A.,Cost G.J.,Caputo E.,Li J.,Hieter P.,Boeke J.D.(1998).Yeast 14(2):115-132.
Crameri A.,Biondi E.,Kuehnle K.,Lütjohann D.,Thelen K.M.,Perga S., Dotti C.G.,Nitsch R.M.,Ledesma M.D.,Mohajeri M.H.(2006).EMBO J. 25(2):432-43.
Cullin C.,Pompon D.(1988).Gene 65:203-217.
Bonneaud N.,Ozier-Kalogeropoulos O.,Li G.Y.,Labouesse M., Minvielle-Sebastia L.,Lacroute F.(1991).Yeast 7:609-615.
Gaber R.F.,Copple D.M.,Kennedy B.K.,Vidal M,Bard M.(1989).Mol Cell Biol 9(8):3447-3456.
Guarente L.,Yocum R.R.,Gifford P.(1982).Proc Natl Acad Sci USA 79:7410-7414.
Hoffman C.S.and Winston F.(1987).Gene 57:267-272
Gietz R.D.,Schiestl R.H.,Willems A.R.,Woods R.A.(1995).Yeast 11:355-360.
Lecain E.,Chenivesse X.,Spagnoli R.,Pompon D.(1996).J Biol Chem 271(18):10866-10873.
Lund E.G.,Kerr T.A.,Sakai J.,Li W.P.,Russell D.W.(1998).J Biol Chem 273(51):34316-34327.
Sambrook J.,Fritsch E.F.,Maniatis T.(1998).Molecular cloning:a laboratory manual.2nd ed.Cold Spring Harbor,N.Y:Cold Spring Harbor Laboratory.
H.,Kalpar H.(1999).Turk J Chem 23:27-30.
Thomas B.J.and Rothstein R.(1989).Cell 56(4):619-630.
Waterham H.R.,Koster J.,Romeijn G.J.,Hennekam R.C.M.,Vreken P., Andersson H.C.,FitzPatrick D.R.,Kelley R.I.,Wanders R.J.A.(2001).Am J Hum Genet 69:685-694.
Wu C.,Miloslavskaya I.,Demontis S.,Maestro R.,Galaktionov K.(2004). Nature 432(7017):640-5.
Zhang S.P.,Zubay G.,Goldman E.(1991).Gene 1005:61-72.