由代谢工程化酵母进行的丁醇生产 致有关人员:
声明如下,我们(下文列出了姓名、住址、和国籍)发明了以下说明书中描述的、题为“由代谢工程化酵母进行的丁醇生产”的发明。
Uvini Gunawardena
住址:帕萨迪纳,加利福尼亚
国籍:斯里兰卡
Peter Meinhold
住址:帕萨迪纳,加利福尼亚
国籍:德国
Matthew W.Peters
住址:帕萨迪纳,加利福尼亚
国籍:美国
Jun Urano
住址:卡尔弗城,加利福尼亚
国籍:美国
Reid M.Renny Feldman
住址:洛杉矶,加利福尼亚
国籍:美国
本申请要求(1)Jun Urano等人于2006年12月21日提交的美国临时专利申请流水号60/871,427,“由代谢工程化酵母进行的丁醇生产”(BUTANOLPRODUCTION BY METABOLICALLY ENGINEERED YEAST);(2)JunUrano等人于2007年2月2日提交的美国临时专利申请流水号60/888,016,“由代谢工程化酵母进行的正丁醇生产”(N-BUTANOL PRODUCTION BYMETABOLICALLY ENGINEERED YEAST);和(3)Uvini P.Gunawardena等人于2007年5月8日提交的美国临时专利申请流水号60/928,283,“由代谢工程化酵母进行的丁醇生产”(BUTANOL PRODUCTION BY METABOLICALLYENGINEERED YEAST)的权益。在此通过述及将上述每一篇申请收入本文。
【发明领域】
本发明涉及代谢工程改造的酵母细胞,用于以高产率生产正丁醇,作为替代的且可再生的运输燃料,及用于其它应用。本发明的酵母被工程化改造成包含将诸如葡萄糖和/或其它可代谢碳水化合物的碳源以及生物质等等转化成正丁醇的代谢途径。
【发明背景】
当前,美国每年消费大约1400亿加仑汽油,而全世界每年消费大约3400亿加仑汽油。这些消费数量还在增加中。2005年能源政策法案(Energy PolicyAct of 2005)规定了到2012年要在汽油中使用75亿加仑可再生燃料。在他的2007年国情咨文(2007 State of the Union address)中,总统要求提高可再生燃料标准(renewable fuel standard)(RFS)的大小和扩大可再生燃料标准的范围,要求在2017年使用350亿加仑可再生的替代燃料。能源部已经设定了到2030年用生物燃料替换美国当前汽油消耗的30%的目标(即“30X30”提案)。在2007年5月,巴西和美国签署了“乙醇协议”(the Ethanol Agreement),以促进美洲生物燃料的开发,联合世界最大生物燃料生产商-当前占世界乙醇生产的70%。
生物燃料不仅具有降低美国对外国石油输入的依赖性(这对于国土安全是至关重要的)的潜力,而且具有显著降低与全球变暖有关的温室气体排放的潜力。自基于碳的原料的转化能获得生物燃料。农业原料被认为是可再生的,原因在于,虽然它们在燃烧时释放二氧化碳,但是它们通过光合作用捕获几乎相等量的二氧化碳。
在美国,乙醇日益用作标准汽油的氧化添加剂,作为甲基叔丁基醚(MTBE)的替代品,后一种化学品难以自地下水和土壤污染中收回。在10%混合物,通过提高辛烷值,乙醇降低发动机爆震(engine knock)的可能性。10%乙醇汽油的使用在有些城市是强制性的,在这些城市中有害水平的汽车排气的可能性是有可能的,尤其是在冬季的几个月里。北美车辆自大约1980年起无需改装就能以10%乙醇/90%汽油(即E10)运行。
然而,为了以更高浓度使用乙醇,必须专门地工程化改造或改装车辆的发动机和燃料系统。设计了可变燃料车辆(flexible fuel vehicle)(FFV),以汽油或者以高至85%乙醇(E85)的混合物运行。然而,因为一加仑乙醇含有的能量比一加仑汽油少,所以FFV在以E85作为燃料时通常每加仑获得的里程少大于20-30%。可获得转化包,用于将常规车辆转化成FFV,其通常包括电子装置以提高每个循环所注入的燃料体积(因为乙醇的能含量较低)和有些情况中的化学处理以保护发动机免于腐蚀。当前美国有超过400万辆可变燃料车辆在路上行驶,虽然2002年的研究发现这些车辆所消费的燃料中E85少于1%。
丁醇作为燃料具有数项胜过乙醇的优点。虽然它能自与乙醇相同的原料来制备,但是与乙醇不同,它与汽油和柴油在任意比例相容。丁醇还能在现有汽车中无需改装用作纯燃料,而且Virgin航空公司的Richard Branson爵士小组已经提出将丁醇用作喷气发动机燃料。与乙醇不同,丁醇不吸收水,而且如此能在现有的石化基础设施中储存和配给。由于其较高的能含量,燃料经济(每加仑里程)好于乙醇。还有,丁醇-汽油混合物具有比乙醇-汽油混合物低的蒸气压,这在降低蒸气碳氢化合物排放中是重要的。这些特性为丁醇提供了以与汽油完全相同的方式使用的潜力,而无需改装车辆且消费者没有不得不更频繁补充燃料的负担。
使用经由自丁酰-CoA通向正丁醇的途径而天然生成正丁醇的梭菌属(Clostridum)菌株,能生成正丁醇。梭菌属菌株的一项缺点在于正丁醇生成以两个步骤的过程发生,其牵涉酸生成生长期和之后地溶剂生成期。还有,在这种过程中生成大量的副产物,诸如氢、乙醇、和丙酮,如此将正丁醇的化学计量产率限制为大约0.6mol正丁醇每mol消耗的葡萄糖。另外,梭菌属菌株丧失了它们在连续培养条件下生成溶剂的能力(Cornillot等,J.Bacteriol.179:5442-5447,1997)。图1中显示了梭菌途径,显示了丙酮丁醇梭菌(Clostridum acetobutylicum)中葡萄糖转化成酸和溶剂,包括自乙酰-CoA生成正丁醇的途径。
发明概述
在一个实施方案中,提供了如下代谢工程化酵母,其能够代谢碳源以生成正丁醇,至少一种途径配置成生成相对于野生型酵母所生成的另一胞质乙酰-CoA量增加的胞质乙酰-CoA量,且至少一种异源基因编码并表达能够利用NADH来将乙酰-CoA转化成正丁醇的代谢途径的至少一种酶。
在另一个实施方案中,提供了生产正丁醇的方法,该方法包括(a)提供如下代谢工程化酵母,其能够代谢碳源以生成正丁醇,至少一种途径配置成生成相对于野生型酵母所生成的另一胞质乙酰-CoA量增加的胞质乙酰-CoA量,且至少一种异源基因编码并表达能够利用NADH来将乙酰-CoA转化成正丁醇的代谢途径的至少一种酶;并(b)培养该代谢工程化酵母,培养的时间和条件用以生成正丁醇。
在又一个实施方案中,提供了使用酵母生产正丁醇的方法,该方法包括(a)代谢工程改造酵母以提高胞质乙酰-CoA生成;(b)代谢工程改造酵母以表达将碳源转化成正丁醇的代谢途径,其中该途径需要至少一种对于该酵母而言非天然的酶,其中步骤(a)和(b)可以以任一次序实施;并(c)培养该酵母,培养的时间和条件用以生成可回收量的正丁醇。
在还有一个实施方案中,提供了使用酵母生产正丁醇的方法,该方法包括(a)培养代谢工程化酵母,培养的时间和条件用以生成酵母细胞生物质但不激活正丁醇生成;并(b)在另一段时间改变培养条件,培养的时间和条件用以生成可回收量的正丁醇。
在另一个实施方案中,提供了如下代谢工程化酵母,其能够代谢碳源并生成相对于野生型酵母所生成的乙酰-CoA量增加的乙酰-CoA量。
在又一个实施方案中,提供了提高酵母的代谢活性的方法,该方法包括酵母生成相对于野生型酵母所生成的另一胞质乙酰-CoA量增加的胞质乙酰-CoA量。
在还有一个实施方案中,提供了如下代谢工程化酵母,其具有至少一种途径配置成生成相对于野生型酵母所生成的另一胞质乙酰-CoA量增加的胞质乙酰-CoA量。
还公开了其它实施方案。
附图简述
附图中图示了本发明的例示性实施方案,其中:
图1图示了丙酮丁醇梭菌中葡萄糖、戊糖、和淀粉粒(granulose)转化成酸和溶剂中所牵涉的代谢途径。己糖(例如葡萄糖)和戊糖被转化成丙酮酸、ATP和NADH。随后,丙酮酸被丙酮酸-铁氧还蛋白氧化还原酶氧化性脱羧成乙酰-CoA。在此步骤中所生成的还原当量被只含铁的氢化酶(iron-onlyhydrogenase)转化成氢。乙酰-CoA是分支点中间产物,通向有机酸(乙酸和丁酸)和溶剂(丙酮、丁醇和乙醇)的生成。
图2图示了在酵母中生成丁醇的化学途径。
图3图示了酿酒酵母(Sacchromyces cerevisiae)生成乙酰-CoA所使用的途径。
图4和5图示了可用于依照本公开内容表达各种酶的各种例示性质粒。
图4图示了可用于如表1中所描述的依照本公开内容表达各种酶的示例性质粒。
图5图示了可用于如表2中所描述的依照本公开内容表达各种酶的示例性质粒。
图6图示了Gevo 1099和Gevo 1103随时间的正丁醇生成,与只含载体的对照隔离群、Gevo 1110和Gevo 1111相比较,如下:
Gevo 1099;
Gevo 1103;
Gevo 1110;和
Gevo 1111。
图7图示了含有来自丙酮丁醇梭菌的bcd、etfb、和etfa基因的pGV1090质粒,所述基因插入在EcoR1和BamHI位点处和改良的噬菌体λLacO-1启动子(PL-lac)的下游。该质粒还携带pBR322的复制起点基因和氯霉素抗性基因。
图8图示了用于表达来自丙酮丁醇梭菌的丁醛脱氢酶(bdhB)的pGV1095质粒,该丁醛脱氢酶插入在EcoRI和BamHI位点处和改良噬菌粒λLacO-1启动子(PL-lac)的下游。该质粒还携带CoIEI复制起点基因和氯霉素抗性基因。
图9图示了用于表达来自丙酮丁醇梭菌的巴豆酸酶(crt)的pGV1094质粒,该巴豆酸酶插入在EcoRI和BamHI位点处和改良噬菌体λLacO-1启动子(PL-lac)的下游。该质粒还携带ori基因和氯霉素抗性基因。
图10图示了用于表达来自丙酮丁醇梭菌的羟丁酰-CoA脱氢酶(hbd)的pGV1037质粒,该羟丁酰-CoA脱氢酶插入在EcoRI和BamHI位点处和改良噬菌体λLacO-1启动子(PL-lac)的下游。该质粒还携带ori基因和氯霉素抗性基因。
图11图示了用于表达来自丙酮丁醇梭菌的硫解酶(thl)的pGV1031质粒,该硫解酶插入在EcoRI和BamHI位点处和LacZ基因的下游。该质粒还携带pBR322的复制起点基因和氨苄青霉素抗性基因。
图12图示了用于表达来自拜氏梭菌(Clostridium beijerinckii)的巴豆酸酶(crt)的pGV1049质粒,该巴豆酸酶插入在EcoRI和BamHI位点处和改良噬菌体λLacO-1启动子(PL-lac)的下游。该质粒还携带ori基因和氯霉素抗性基因。
图13图示了用于表达来自拜氏梭菌的羟丁酰-CoA脱氢酶(hbd)的pGV1050质粒,该羟丁酰-CoA脱氢酶插入在EcoRI和BamHI位点处和改良噬菌体λLacO-1启动子(PL-lac)的下游。该质粒还携带ori基因和氯霉素抗性基因。
图14图示了用于表达来自拜氏梭菌的醇脱氢酶(adhA)的pGV1091质粒,该醇脱氢酶插入在HindIII和BamHI位点处和改良噬菌体λLacO-1启动子(PL-lac)的下游。该质粒还携带氯霉素抗性基因。
图15图示了用于表达来自拜氏梭菌的醇脱氢酶(aldh)的pGV1096质粒,该醇脱氢酶插入在EcoRI和BamHI位点处和改良噬菌体λLacO-1启动子(PL-lac)的下游。该质粒还携带ori基因和氯霉素抗性基因。
发明详述
描述了被工程化改造成以高产率将碳源转化成正丁醇的重组酵母微生物。具体而言,描述了能够代谢碳源以理论值的至少5%的产率和有些情况中超过理论值的50%的产率生成正丁醇的重组酵母微生物。如本文中所使用的,术语“产率”指摩尔产率。例如,当1摩尔葡萄糖被转化成1摩尔正丁醇时,产率等于100%。具体而言,术语“产率”定义为每摩尔碳源单体获得的产物摩尔数,而且可表述为百分比。除非另有说明,产率表述为理论产率的百分比。“理论产率”定义为根据用于生成产物的代谢途径的化学计量的规定,每摩尔指定底物能生成的产物最大摩尔数。例如,葡萄糖变成正丁醇的一种典型转化的理论产率为100%。因此,葡萄糖变成正丁醇的产率为95%会表述为理论产率的95%或95%理论产率。
本文中所公开的微生物是使用遗传工程技术被工程化改造的,以提供利用异源表达的酶来以高产率生成正丁醇的微生物。丁醇产率取决于碳源变成乙酰-CoA的高产率转化和后续的乙酰-CoA变成丁醇的高产率转化。本发明涉及这两个方面的组合,导致以高产率生成正丁醇的微生物。
如本文中所使用的,术语“微生物”包括原核的和真核的微生物物种,其来自细菌和真核生物范畴(Domains Bacteria and Eukaryote),后者包括酵母和丝状真菌、原生动物、藻类、或高等原生生物。术语“细胞”和“微生物细胞”可以与术语“微生物”互换使用。在一个优选的实施方案中,微生物是酵母(例如啤酒糖酵母/酿酒酵母(Saccharomyces cerevisiae)或乳酸克鲁维酵母(Kluyveromyce lactis))或大肠埃希氏菌/大肠杆菌(E.coli)。
“酵母”指真核生物体的一个范畴,在系统发生学上位于真菌界中,在子囊菌和担子菌门(phyla Ascomycota and Basidiomycota)下。迄今描述了大约1500种酵母物种。酵母主要是单细胞微生物,主要通过无性芽殖来繁殖,尽管描述了一些多细胞酵母和通过二元裂殖来繁殖的酵母。大多数物种被归类为需氧菌,但是兼性的和厌氧的酵母也是众所周知的。与酵母发酵性生理学有关,酵母被归类为两组:Crabtree阳性的和Crabtree阴性的。
简言之,Crabtree效应定义为在需氧条件下培养时由于高葡萄糖浓度(例如50克葡萄糖/L)的存在微生物的氧消耗受到抑制。如此,由于葡萄糖的存在,具有Crabtree阳性表型的酵母细胞继续发酵,不管氧的可得性,而具有Crabtree阴性表型的酵母细胞不展现葡萄糖介导的对氧消耗的抑制。通常具有Crabtree阳性表型的酵母细胞的例子包括但不限于酵母属(Saccharomyces)、接合酵母属(Zygosaccharomyces)、有孢圆酵母属(Torulaspora)和德克酵母属(Dekkera)的酵母细胞。通常具有Crabtree阴性表型的酵母细胞的例子包括但不限于克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichis)、汉逊酵母属(Hansenula)和假丝酵母属(Candida)的酵母细胞。
在本申请中所使用的某些术语的定义之后,下文例示了本发明的某些详细方面和实施方案。术语“碳源”一般指适合用作酵母细胞生长的碳来源的底物或化合物。碳源可以是各种形式,包括,但不限于聚合物诸如木聚糖和果胶、碳水化合物、酸、醇、醛、酮、氨基酸、肽等。此类碳源更具体地包括,例如,各种单糖诸如葡萄糖和果糖、寡糖诸如乳糖或蔗糖、多糖、纤维素材料、饱和的或不饱和的脂肪酸、琥珀酸、乳酸、乙酸、乙醇,或其混合物和来自可再生原料的未纯化混合物,诸如干酪乳清渗透物(cheese whey permeate)、玉米浆(corn steep liquor)、甜菜糖蜜(sugar beet molasses)、和大麦芽。
充当用于生成正丁醇产物的合适起始材料的碳源包括,但不限于,生物质水解产物、葡萄糖、淀粉、纤维素、半纤维素、木糖、木质素、右旋糖、果糖、半乳糖、玉米、液化玉米粉、玉米浆(玉米湿磨工艺的副产品,其含有浸泡期间自玉米浸出的营养物)、糖蜜、木质纤维素、和麦芽糖。光合生物体能另外生成碳源,作为光合作用的产物。在一个优选的实施方案中,碳源可选自生物质水解产物和葡萄糖。葡萄糖、右旋糖和淀粉可以来自内源的或外源的来源。
应当注意,可以用其它更加易得的和/或便宜的碳源替代葡萄糖,这对宿主微生物的改动是较为微小的。例如,在某些实施方案中,使用其它可再生的和经济上可行的底物可能是优选的。这些包括:农业废物、基于淀粉的包装材料、玉米纤维水解产物、大豆糖蜜、水果加工业废物、和乳清渗透物等。
五碳糖只被能够加工这些糖的微生物菌株用作碳源,例如大肠杆菌B。在一些实施方案中,可以使用甘油(glycerol)(一种三碳碳水化合物)作为生物转化的碳源。在其它实施方案中,可以使用甘油(glycerin)或通过水解来自植物和动物脂肪和油的甘油三酸酯得到的不纯的甘油作为碳源,只要任何杂质不会对宿主微生物产生不利影响。
术语“酶”,如本文中所使用的,指任何催化或促进一种或多种化学或生物化学反应的物质,其通常包括完全或部分由多肽构成的酶,但是可以包括由不同分子(包括多核苷酸)构成的酶。
术语“多核苷酸”在本文中可以与术语“核酸”互换使用,指由两个或更多个单体(包括核苷酸、核苷或其类似物)构成的有机聚合物,包括但不限于单链的或双链的、有义的或反义的任何长度脱氧核糖核酸(DNA)及适当时单链的或双链的、有义的或反义的任何长度核糖核酸(RNA),包括siRNA。术语“核苷酸”指数种由核糖或脱氧核糖与嘌呤或嘧啶碱基及与磷酸基团相连接而组成的化合物之任一,其是核酸的基本结构单元。术语“核苷”指由嘌呤或嘧啶碱基与脱氧核糖或核糖相组合而组成的化合物(像鸟苷或腺苷),其尤其见于核酸。术语“核苷酸类似物”或“核苷类似物”分别指其中一个或多个单独的原子被不同的原子或被不同的官能团替换的核苷酸或核苷。因而,术语多核苷酸包括任何长度的核酸、DNA、RNA、其类似物和片段。三个或更多个核苷酸的多核苷酸也称作核苷酸寡聚物或寡核苷酸。
术语“蛋白质”或“多肽”,如本文中所使用的,指由两个或更多个氨基酸单体和/或其类似物构成的有机聚合物。如本文中所使用的,术语“氨基酸”或“氨基酸单体”指任何天然的和/或合成的氨基酸,包括甘氨酸和D或L两种光学异构体。术语“氨基酸类似物”指其中一个或多个单独的原子被不同的原子或不同的官能团替换的氨基酸。因而,术语多肽包括任何长度的氨基酸聚合物,包括全长蛋白质,和肽以及其类似物和片段。三个或更多个氨基酸的多肽也称作蛋白质寡聚物或寡肽。
术语“异源”或“外源”,如本文中关于分子(特别是酶和多核苷酸)所使用的,指在它们起源的或在自然界中发现它们的生物体以外的生物体中表达的分子,无关乎表达水平,其可以低于、等于或高于该分子在天然微生物中的表达水平。
另一方面,术语“天然”或“内源”,如本文中关于分子(特别是酶和多核苷酸)所使用的,指在它们起源的或在自然界中发现它们的生物体中表达的分子,无关乎表达水平,其可以低于、等于或高于该分子在天然微生物中的表达水平。
在某些实施方案中,天然的、未工程化改造的微生物不能将碳源转化成正丁醇或一种或多种其代谢中间产物,因为,例如,此类野生型宿主缺乏正丁醇生成途径中所需要的一种或多种酶。
在某些实施方案中,天然的、未工程化改造的微生物只能够以小于理论产率的0.1%的产率将微量的碳源转化成正丁醇。
例如,微生物诸如大肠杆菌或酵母属菌种(Saccharomyces sp.)一般不具有将糖诸如葡萄糖转化成正丁醇的代谢途径,但是有可能将来自生成正丁醇的菌株(例如梭菌)的正丁醇生成途径转移入细菌的或真核的异源宿主中,诸如大肠杆菌或酵母属菌种,并使用所得重组微生物来生产正丁醇。
微生物,一般而言,作为宿主是合适的,如果它们拥有内在特性,诸如溶剂抗性,这会容许它们在含有溶剂的环境中代谢碳源。
术语“宿主”、“宿主细胞”和“重组宿主细胞”在本文中可以互换使用,不仅指特定的受试细胞而且指这样的细胞的后代或潜在后代。因为在后续世代中由于突变或环境影响可能发生某些修饰,所以这样的后代事实上与亲本细胞可能不是同样的,但是仍然包括在如本文中所使用的该术语的范围内。
对于生产正丁醇有用的宿主可以是真核的或原核的微生物。酵母细胞是优选的宿主,诸如,但不限于酿酒酵母或乳酸克鲁维酵母。在某些实施方案中,其它合适的酵母宿主微生物包括,但不限于毕赤酵母属(Pichia)、西洋蓍霉属(Yarrowia)、曲霉属(Aspergillus)、克鲁维酵母属(Kluyveromyces)、管囊酵母属(Pachysolen)、红酵母属(Rhodotorula)、接合酵母属(Zygosaccharomyces)、半乳糖霉属(Galactomyces)、裂殖酵母属(Schizosaccharomyces)、青霉属(Penicillium)、有孢圆酵母属(Torulaspora)、德巴利酵母属(Debaryomyces)、拟威尔酵母属(Williopsis)、德克酵母属(Dekkera)、克勒克酵母属(Kloeckera)、梅奇酵母属(Metschnikowia)和假丝酵母属(Candida)物种。
具体而言,本文中所公开的重组微生物被工程化改造以活化(特别是表达)能在正丁醇生产中使用的异源酶。具体而言,在某些实施方案中,该重组微生物被工程化改造以活化催化乙酰-CoA转化成正丁醇的异源酶。
术语“活化”,如本文中关于生物学活性分子(诸如酶)所使用的,指微生物的基因组和/或蛋白质组中提高该微生物中的生物学活性分子的生物学活性的任何修饰。例示性的活化包括但不限于导致分子从生物学无活性形式变成生物学有活性形式及从生物学有活性形式变成生物学更有活性形式的转化的修饰,及导致生物学活性分子在微生物中表达的修饰,其中该生物学活性分子先前不表达。例如,生物学活性分子的活化可以如下来实施,即在微生物中表达编码生物学活性分子的天然的或异源的多核苷酸,在微生物中表达编码生物学活性分子的合成途径中所牵涉的酶的天然的或异源的多核苷酸,在微生物中表达增强生物学活性分子的表达的天然的或异源的分子。
若基因或DNA序列作为其正常存在形式不是微生物的基因组的一部分,即它在天然情况中不是野生型微生物的基因组的一部分,则该基因或DNA序列对于该微生物而言是“异源的”。举例而言且不加限制,对于酿酒酵母,认为编码以下任一项的DNA是异源的。大肠杆菌蛋白质或酶、来自酿酒酵母以外的任何其它微生物的蛋白质或酶、非转录和翻译的控制序列、及突变的或其它方式修饰的酿酒酵母蛋白质或RNA,无论突变体是通过选择而产生的,或者是被工程化改造入酿酒酵母中的。另外,认为具有在异源调节元件(诱导型启动子、增强子等)的转录和/或翻译控制下的野生型酿酒酵母蛋白质的构建体也是异源DNA。
当碳源的氧化反应期间所生成的NADH等于被利用来将乙酰-CoA转化成代谢终产物的NADH时,说碳源的代谢是“平衡的”。只有在这些条件下,所有NADH才是循环的。在没有循环的情况中,NADH/NAD+比变得失衡(即升高),这能将生物体引向最终死亡,除非有替代的代谢途径来维持平衡的NADH/NAD+比。
在某些实施方案中,如果微生物不使用需氧或厌氧呼吸,那么正丁醇产率最高,因为在这些情况中碳以二氧化碳的形式流失(lost)。
在某些实施方案中,微生物在厌氧条件下发酵性地生成正丁醇,使得碳不以二氧化碳的形式流失。
术语“需氧呼吸”指其中氧是最终电子受体且能量通常以ATP分子的形式生成的呼吸途径。术语“需氧呼吸途径”在本文中与措词“需氧代谢”、“氧化性代谢”或“细胞呼吸”可互换使用。
另一方面,术语“厌氧呼吸”指其中氧不是最终电子受体且能量通常以ATP分子的形式生成的呼吸途径。这包括其中氧以外的有机或无机分子(例如硝酸、延胡索酸、二甲亚砜、含硫化合物诸如硫酸和金属氧化物)是最终电子受体的呼吸途径。措词“厌氧呼吸途径”在本文中与措词“厌氧代谢”和“厌氧呼吸”可互换使用。
“厌氧呼吸”必须与“发酵”区分开。在“发酵”中,NADH将其电子贡献给由生成NADH中携带的电子的同一代谢途径所生成的分子。例如,在大肠杆菌的发酵性途径之一中,通过糖酵解生成的NADH将其电子转移给丙酮酸,产生乳酸。
在发酵性条件下运行的微生物只能在发酵是“平衡”的情况中代谢碳源。在碳源的氧化反应期间所生成的NADH等于乙酰-CoA转化成发酵终产物所利用的NADH时,说发酵是“平衡”的。只有在这些条件下,所有NADH才是再循环的。如果没有再循环,NADH/NAD+比会变得不平衡,这导致生物体最终死亡,除非有可用的备选代谢途径来维持平衡NADH/NAD+比。在氧化期间所生成的氢等于转移给发酵终产物的氢时,则说书面发酵(written fermentation)是“平衡”的。只有在这些条件下,所有NADH和还原型铁氧还蛋白才再循环成氧化形式。重要的是要知道,发酵是否是平衡的,因为如果不是这样,那么整体书面反应是不正确的。
厌氧条件是高产率地生成正丁醇的微生物所优选的。
图2图示了酵母中依照本发明的实施方案将碳源转化成正丁醇的途径。此途径可视为具有两个独特部分,其包括(1)碳源转化成乙酰-CoA,和(2)乙酰-CoA转化成正丁醇。由于酵母(和其它真核生物)中代谢反应的区室化和为了确保自葡萄糖生成足量的乙酰-CoA以驱动该途径的第二部分,胞质溶胶中乙酰-CoA的生成是必要的,而且因此在本文中所公开的某些工程化变体中是升高的。
关于部分(1)即碳源转化成丁醇,可以工程化改造酵母微生物以提高胞质溶胶中丙酮酸变成乙酰-CoA的通量。
如图3中所示,酿酒酵母在线粒体中和在胞质溶胶中生成乙酰-CoA。因为乙酰-CoA变成正丁醇的转化发生在胞质溶胶中,所以在工程化细胞中胞质溶胶中的乙酰-CoA生成升高了。任选的是,可降低或遏制线粒体中的乙酰-CoA生成。
在一个实施方案中,通过提高穿过胞质“丙酮酸脱氢酶旁路”(Prank等,(1996).Yeast 12(16):1607)的通量,可以自丙酮酸生成乙酰-CoA,如图3步骤1-3所图示的。为了提高穿过此路径的通量,可以过表达丙酮酸脱羧酶(PDC)、醛脱氢酶(ALD)、和乙酰-CoA合酶(ACS)中的一种或多种酶。
此提高“PDH旁路”路径的活性或通量的操作能导致超过理论最大值的5%的丁醇产率的实现。
因为此乙酰-CoA生成路径生成乙醛作为中间产物,所以优选将乙醛进入远离乙酰-CoA合成的途径的分流降至最低,主要是通过醇脱氢酶(ADH)的活性将乙醛进一步还原成乙醇。因此,降低或消除ADH活性可进一步提高丙酮酸脱氢酶旁路途径的乙酰-CoA生成。
例如,Crabtree阳性酵母酿酒酵母的基因组含有7种已知的ADH基因。其中,ADH1是胞质ADH活性的主要来源,而且删除了ADH1的细胞不能够厌氧生长(Drewke等,(1990).J.Bacteriology 172(7):3909)。如此,可能优选删除ADH1以将乙醛变成乙醇的转化降至最低。然而,其它ADH同等型可催化乙醛变成乙醇的还原,而且本发明也涵盖它们的降低或删除。
此降低乙醛变成乙醇的转化的操作单独地或与上文所述“PDH旁路”通量升高组合地能导致超过理论最大值的10%的丁醇产率的实现。
另外,丙酮酸脱氢酶催化丙酮酸变成乙酰-CoA和CO2的直接转化,同时将NAD+还原成NADH。如此在某些实施方案中,在酵母胞质溶胶中过表达丙酮酸脱氢酶。或者,将丙酮酸转化成甲酸和乙酰-CoA,并且通过甲酸脱氢酶(其也将NAD+还原成NADH)的活性将所得甲酸进一步代谢成CO2。
因为上述乙酰-CoA生成路径利用丙酮酸作为底物,所以优选将丙酮酸进入其它代谢途径的分流降至最低。丙酮酸脱羧酶(PDC)活性代表了丙酮酸代谢的主要细胞质路径。因此,降低或消除PDC活性可进一步提高上述路径的乙酰-CoA生成。
与消除PDC活性(如此消除“PDH旁路”路径)组合地,对将丙酮酸转化成乙酰-CoA的代谢途径的操作可实现超过理论最大值的50%的丁醇产率。此改善是对酵母细胞天然代谢途径的三项重要操作的结果:(1)消除经由乙醇生成的碳流失;(2)消除细胞中在消耗大量能量的乙酰-CoA合成酶活性;和(3)平衡葡萄糖变成丁醇的转化中所牵涉的整个途径的辅因子(例如NAD+/NADH)的生成和消耗(葡萄糖变成乙酰-CoA生成4个NADH,而乙酰-CoA变成丁醇的转化消耗4个NADH)。通过提高宿主酵母细胞的整体代谢适合度,由此通过使得有ATP可被生物合成过程利用和降低细胞中的NAD+/NADH比失衡来促进丁醇途径功能,后两种操作会对产率升高贡献最大。
关于部分(2),即碳源变成丁醇的转化,可工程化改造酵母以将乙酰-CoA转化成丁醇。
在一个所例示的实施方案中,乙酰-CoA-乙酰转移酶将乙酰-CoA转化成乙酰乙酰-CoA,羟丁酰-CoA脱氢酶将乙酰乙酰-CoA转化成羟丁酰-CoA,巴豆酸酶将羟丁酰-CoA转化成巴豆酰-CoA,丁酰-CoA脱氢酶(bcd)将巴豆酰-CoA转化成丁酰-CoA。为了偶联巴豆酰-CoA的还原与NADH的氧化,Bcd需要电子转移蛋白(etfA和etfB)的存在和活性。然后丁醛脱氢酶/丁醇脱氢酶将丁酰-CoA转化成丁醛并将丁醛转化成丁醇。该酶可来自丙酮丁醇梭菌。
2007年12月3日提交的美国专利申请流水号11/949,724(在此通过述及收入本文)中记载了使用异源表达的途径及来自产溶剂细菌(例如梭菌属物种)的基因将乙酰-CoA转化成正丁醇的途径的第二部分的例子。
在一些实施方案中,重组微生物可表达一种或多种异源基因,其编码赋予生成正丁醇的能力的酶。例如,重组微生物可表达编码厌氧活性丙酮酸脱氢酶(Pdh)、丙酮酸甲酸裂合酶(Pfl)、NADH依赖性甲酸脱氢酶(Fdh)、乙酰-CoA-乙酰转移酶(硫解酶)、羟丁酰-CoA脱氢酶、巴豆酸酶、丁酰-CoA脱氢酶、丁醛脱氢酶、正丁醇脱氢酶、双功能丁醛/正丁醇脱氢酶中的一种或多种的异源基因。此类异源DNA序列优选是自异源微生物(诸如丙酮丁醇梭菌或拜氏梭菌)获得的,而且可以使用常规分子生物学技术将这些异源基因中的一种或多种导入适宜宿主。这些异源DNA序列使得重组微生物能够生成正丁醇,至少以比野生型对应微生物所生成的量大的量生成正丁醇或其代谢中间产物。
在某些实施方案中,本文中所公开的重组微生物表达异源硫解酶或乙酰-CoA-乙酰转移酶,诸如由来自梭菌属的thl基因所编码的。
硫解酶(E.C.2.3.1.19)或乙酰-CoA乙酰转移酶是催化乙酰基缩合到乙酰-CoA分子上的酶。该酶在丙酮丁醇梭菌中由基因thl编码(GenBank登录号U08465,蛋白质ID AAA82724.1),在其它酶中,该酶在大肠杆菌中在其用于丙酮生成的天然启动子下过表达(Bermejo等,Appl.Environ.Mirobiol.64:1079-1085,1998)。同源酶也已经鉴定,而且通过实施针对上文蛋白质序列的BLAST搜索能容易地鉴定。这些同系物(homolog)也能充当异源表达的正丁醇途径中的合适硫解酶。仅举几例,这些同源酶包括,但不限于那些来自以下各项的:丙酮丁醇梭菌(例如,蛋白质ID AAC26026.1),巴氏梭菌(C.pasteurianum)(例如,蛋白质ID ABA18857.1),拜氏梭菌(例如,蛋白质IDEAP59904.1或EAP59331.1),产气荚膜梭菌(Clostridium perfringens)(例如,蛋白质ID ABG86544.1,ABG83108.1),艰难梭菌(Clostridium difficile)(例如,蛋白质ID CAJ67900.1或ZP_01231975.1),热解糖热厌氧杆菌(Thermoanaerobacterium thermosaccharolyticum)(例如,蛋白质IDCAB07500.1),腾冲热厌氧杆菌(Thermoanaerobacter tengcongensis)(例如,AAM23825.1),生氢氧化碳嗜热菌(Carboxydothermus hydrogenoformans)(例如,蛋白质ID ABB 13995.1),Desulfotomaculum reducens MI-1(例如,蛋白质ID EAR45123.1),热带假丝酵母(Candida tropicalis)(例如,蛋白质IDBAA02716.1或BAA02715.1),酿酒酵母(例如,蛋白质ID AAA62378.1或CAA30788.1),芽孢杆菌属菌种,埃氏巨球形菌(Megasphaera elsdenii),和溶纤维丁酸弧菌(Butyrivibrio fibrisolvens)。另外,内源酿酒酵母硫解酶在异源表达的正丁醇途径(ScERGIO)中也可以是有活性的。
根据NCBI的BLAST的计算,共享至少约55%、60%、65%、70%、75%或80%序列同一性,或至少约65%、70%、80%或90%序列同源性的同系物是能在本发明的重组微生物中使用的合适硫解酶同系物。此类同系物包括(但不限于):拜氏梭菌NCIMB 8052(ZP_00909576.1或ZP_00909989.1),丙酮丁醇梭菌ATCC 824(NP_149242.1),破伤风梭菌(Clostridium tetani)E88(NP_781017.1),产气荚膜梭菌菌株13(NP_563111.1),产气荚膜梭菌SM101(YP_699470.1),巴氏梭菌(ABA18857.1),热解糖热厌氧杆菌(CAB04793.1),艰难梭菌QCD-32g58(ZP_01231975.1),和艰难梭菌630(CAJ67900.1)。
在某些实施方案中,本发明的重组微生物表达异源3-羟基丁酰-CoA脱氢酶,诸如由来自梭菌属的hbd基因所编码的。
3-羟丁酰-CoA脱氢酶(BHBD)是催化乙酰乙酰-CoA转化成3-羟基丁酰-CoA的酶。此酶存在生成3-羟基丁酰-CoA的(S)或(R)异构体的不同变体。本领域技术人员通过例如实施针对上文丙酮丁醇梭菌BHBD的BLAST搜索能容易地鉴定同源酶。所有这些同源酶能充当异源表达的正丁醇途径中的BHBD。这些同源酶包括,但不限于以下各项:克氏梭菌(Clostridium kluyveri),其表达此酶的两种不同形式(Miller等,J.Bacteriol.138:99-104,1979);和解纤维丁酸弧菌(Butyrivibrio fibrisolvens),其含有bhbd基因,其组织在其丁酸途径剩余部分的相同基因座内(Asanuma等,Current Microbiology 51:91-94,2005;Asanuma等,Current Microbiology 47:203-207,2003)。编码短链酰基-CoA脱氢酶(SCAD)的基因克隆自埃氏巨球形菌并在大肠杆菌中表达。能测定体外活性(Becker等,Biochemistry 32:10736-10742,1993)。在其它梭菌属菌株中鉴定了其它同系物,诸如克氏梭菌(Hillmer等,FEBS Lett.21:351-354,1972;Madan等,Eur.J.Biochem.32:51-56,1973)、拜氏梭菌、热解糖梭菌(C.thermosaccharolyticum)、破伤风梭菌。
在某些实施方案中,其中表达BHBD,选择与上游硫解酶或下游巴豆酸酶起源相同的生物体的酶可能是有益的。这可避免在表达来自不同生物体的酶时对该途径中邻近蛋白质之间的潜在蛋白质-蛋白质相互作用的破坏。
在某些实施方案中,本文中所公开的重组微生物表达异源巴豆酸酶,诸如由来自梭菌属的crt基因所编码的。
巴豆酸酶或烯酰-CoA水合酶是催化顺式和反式烯酰-CoA底物可逆水合成相应的β-羟酰CoA衍生物的酶。在丙酮丁醇梭菌中,丁酸代谢的这个步骤由crt基因所编码的EC 4.2.1.55来催化(GenBank蛋白质编号AAA95967,Kanehisa,Kanehisa,Novartis Found Symp.247:91-101,2002;讨论01-3,19-28,244-52)。来自丙酮丁醇梭菌的巴豆酸酶(Crt)已经纯化至均质并得到了表征(Waterson等,J.Biol.Chem.247:5266-5271,1972)。它在天然的和变性的状态都表现为均质的蛋白质。该酶表现出作为四聚体发挥功能,亚基分子量为28.2kDa和261个残基(Waterson等报道了分子量为40kDa和长度为370个残基)。纯化的酶在缓冲溶液中在4℃保存时或在冷冻时丧失活性(Waterson等,J.Biol.Chem.247:5266-5271,1972)。该酶的最适pH为pH 8.4(Schomburg等,NucleicAcids Res.32:D431-433,2004)。与具有广泛底物特异性的哺乳动物巴豆酸酶不同,细菌的酶只水合巴豆酰-CoA和己烯酰-CoA。为巴豆酰-CoA得到了Vmax和Km值为6.5x106摩尔每分每摩尔和3x 10-5M。该酶在巴豆酰-CoA浓度高于7x105M时受到抑制(Waterson等,J.Biol.Chem.247:5252-5257,1972;Waterson等,J.Biol.Chem.247:5258-5265,1972)。
已经解析出了巴豆酸酶家族的许多酶的结构(Engel等,J.Mol.Biol.275:847-859,1998)。crt基因在大肠杆菌中高表达,而且展现出比在丙酮丁醇梭菌中所看到的更高的比活(187.5U/mg胜过128.6U/mg)(Boynton等,J.Bacteriol.178:3015-3024,1996)。真核生物和原核生物中编码了巴豆酸酶的许多不同同系物,它们作为丁酸代谢、脂肪酸合成、β-氧化和其它相关途径的一部分发挥作用(Kanehisa,Novartis Found Symp.247:91-101,2002;讨论01-3,19-28,244-52;Schomburg等,Nucleic Acids Res.32:D431-433,2003)。这些酶中许多已经被深入研究。来自牛肝的烯酰-CoA水合酶得到了极度深入的研究和彻底的表征(Waterson等,J.Biol.Chem.247:5252-5257,1972)。生成了来自细菌的巴豆酸酶的20种最亲近直向同系物的ClustalW比对。同系物的序列同一性的从40%到85%不等。
根据NCBI的BLAST的计算,共享至少约45%、50%、55%、60%、65%或70%序列同一性,或至少约55%、65%、75%或85%序列同源性的同系物是能在本发明的重组微生物中使用的合适Crt同系物。此类同系物包括,但不限于:破伤风梭菌E88(NP_782956.1),产气荚膜梭菌SM101(YP_699562.1),产气荚膜梭菌菌株13(NP_563217.1),拜氏梭菌NCIMB 8052(ZP_00909698.1或ZP_00910124.1),沃氏共养单胞菌沃氏亚种哥廷根菌株(Syntrophomonas wolfeisubsp.wolfei str.Goettingen)(YP_754604.1),Desulfotomaculum reducens MI-1(ZP_01147473.1或ZP_01149651.1),热解糖热厌氧杆菌(CAB07495.1),和生氢氧化碳嗜热菌Z-2901(YP_360429.1)。
在梭菌中进行的研究证明了编码巴豆酸酶的crt基因是作为更大的BCS操纵子的一部分编码的。然而,对溶纤维丁酸弧菌(B.fibriosolvens)(一种来自瘤胃的生成丁酸的细菌)的研究显示了略有不同的排列。虽然I型溶纤维丁酸弧菌具有作为操纵子的部分而簇集和排列的thl、crt、hbd、bcd、etfA和etfB基因,但是II型菌株具有类似的簇但缺少crt基因(Asanuma等,Curr.Microbiol.51:91-94,2005;Asanuma等,Curr.Microbiol.47:203-207,2003)。既然该蛋白质在大肠杆菌中充分表达且彻底表征,那么丙酮丁醇梭菌酶是异源表达的正丁醇途径所优选的酶。其它可能的靶物是来自聚核梭杆菌文氏亚种(Fusobacterium nucleatum subsp.Vincentii)(Q7P3U9-Q7P3U9_FUSNV)、艰难梭菌(P45361-CRT CLODI)、巴氏梭菌(P81357-CRT_CLOPA)、和马尔他布鲁氏菌(Brucella melitensis)(Q8YDG2-Q8YDG2_BRUME)的同源基因。
在某些实施方案中,本文中所公开的重组微生物表达异源丁酰-CoA脱氢酶和必要时相应的电子传递蛋白,诸如由来自梭菌属的bcd、etfA、和etfB基因所编码的。
丙酮丁醇梭菌丁酰-CoA脱氢酶(Bcd)是催化巴豆酰-CoA中的碳-碳双键还原以产生丁酰-CoA的酶。此还原偶联NADH的氧化。然而,该酶需要两种电子传递蛋白,即etf和etfB(Bennett等,Ferns Microbiology Reviews 17:241-249,1995)。
丙酮丁醇梭菌ATCC 824的编码酶β-羟基丁酰-辅酶A(CoA)脱氢酶、巴豆酸酶和丁酰-CoA脱氢酶的基因在BCS操纵子上簇集,其GenBank登录号为U17110。
丁酰-CoA脱氢酶(Bcd)蛋白质序列(GenBank登录号AAA95968.1)显示于SEQ ID NO:3。
根据NCBI的BLAST的计算,共享至少约55%、60%、65%、70%、75%或80%序列同一性,或至少约70%、80%、85%或90%序列同源性的同系物是能在本发明的重组微生物中使用的合适Bcd同系物。此类同系物包括,但不限于:破伤风梭菌E88(NP_782955.1或NP_781376.1),产气荚膜梭菌菌株13(NP_563216.1),拜氏梭菌(AF494018_2),拜氏梭菌NCIMB 8052(ZP_00910125.1或ZP_00909697.1),和热解糖热厌氧杆菌(CAB07496.1),腾冲热厌氧杆菌MB4(NP_622217.1)。
根据NCBI的BLAST的计算,共享至少约45%、50%、55%、60%、65%或70%序列同一性,或至少约60%、70%、80%或90%序列同源性的同系物是能在本文中所描述的重组微生物中使用的合适Hbd同系物。此类同系物包括,但不限于:丙酮丁醇梭菌ATCC 824(NP_349314.1),破伤风梭菌E88(NP_782952.1),产气荚膜梭菌SM101(YP_699558.1),产气荚膜梭菌菌株13(NP_563213.1),糖丁酸梭菌(Clostridium saccharobutylicum)(AAA23208.1),拜氏梭菌NCIMB 8052(ZP_00910128.1),拜氏梭菌(AF494018_5),腾冲热厌氧杆菌MB4(NP_622220.1),热解糖热厌氧杆菌(CAB04792.1),和Alkaliphilusmetalliredigenes QYMF(ZP_00802337.1)。
Bcd对丁酰-CoA的Km为5。丙酮丁醇梭菌bcd和编码相应ETF的基因已经克隆入大肠杆菌-丙酮丁醇梭菌穿梭载体中。在用此质粒转化的丙酮丁醇梭菌ATCC 824中检测到升高的Bcd活性(Boynton等,Journal of Bacteriology178:3015-3024,1996)。丙酮丁醇梭菌P26 2Bcd对丁酰-CoA的Km为大约6μM(DiezGonzalez等,Current Microbiology 34:162-166,1997)。Bcd的同系物(homologues)和相关ETF已经在生成丁酸的厌氧生物埃氏巨球形菌(Williamson等,Biochemical Journal 218:521-529,1984)、埃氏消化链球菌(Peptostreptococcus elsdenii)(Engel等,Biochemical Journal 125:879,1971)、布氏共养生孢菌(Syntrophospora bryanti)(Dong等,Antonie Van LeeuwenhoekInternational Journal of General and Molecular Microbiology 67:345-350,1995)、和溃蚀密螺旋体(Treponema phagedemes)(George等,Journal ofBacteriology 152:1049-1059,1982)中鉴定。埃氏巨球形菌Bcd的结构已经解析(Djordjevic等,Biochemistry 34:2163-2171,1995)。丙酮丁醇梭菌ATCC 824 Bcd的BLAST搜索在极其多个物种中鉴定了大量同源序列,本文中上文列举了同系物中的一些。任何编码这些同系物的基因都可用于本发明。注意到,在一种微生物(诸如大肠杆菌)中异源表达这些基因时可产生表达问题和/或电子传递问题,但是在另一种微生物中则不然。另外,一种同源酶可在给定微生物中具有表达和/或电子传递问题,但是其它同源酶则可不然。不同的、大体等同的基因的可得性在工程化改造重组微生物时提供了更多设计选择。
一种早已在大肠杆菌中克隆和表达的有前途的bcd来自埃氏巨球形菌,而且所表达的酶的体外活性能测定(Becker等,Biochemistry 32:10736-10742,1993)。O′Neill等报道了etfA和eftB基因在大肠杆菌中的克隆和异源表达及对所编码的来自埃氏巨球形菌的蛋白质的功能表征(O′Neill等,J.Biol.Chem.273:21015-21024,1998)。用ETF测定法测量了活性,该测定法将NADH氧化与巴豆酰-CoA的还原经Bcd偶联起来。含Bcd的重组ETF在ETF测定法中的活性与如Whitfield和Mayhew所报道的天然酶活性类似。因此,利用埃氏巨球形菌Bcd及其ETF蛋白提供了合成丁酰-CoA的解决方案。埃氏巨球形菌Bcd在重组表达时的Km测量为5μM,而在天然宿主中表达时为14μM(DuPlessis等,Biochemistry 37:10469-77,1998)。埃氏巨球形菌Bcd表现出在极低浓度受到乙酰乙酸抑制(Ki为0.1uM)(Vanberkel等,Eur.J.Biochem.178:197-207,1988)。在两个生成丁酸的解纤维丁酸弧菌的菌株中鉴定了含有thl、crt、hbd、bcd、etfA、和etfB的基因簇。与丙酮丁醇梭菌相比,这些蛋白质的氨基酸序列相似性是高的(Asanuma等,Current Microbiology 51:91-94,2005;Asanuma等,CurrentMicrobiology 47:203-207,2003)。在哺乳动物系统中,在线粒体中找到了牵涉短链脂肪酸氧化的类似的酶。
在某些实施方案中,本文中所公开的重组微生物表达异源“反式-2-烯酰-CoA还原酶”或“TER”。
反式-2-烯酰-CoA还原酶或TER是能够催化巴豆酰-CoA转化成丁酰-CoA的蛋白质。在某些实施方案中,重组微生物表达与来自梭菌属和其它细菌物种的Bcd/EtfA/EtfB催化相同反应的TER。来自纤细眼虫(E.gracilis)的线粒体TER已有描述,而且衍生自许多物种的许多TER蛋白和具有TER活性的蛋白质已经鉴定,形成TER蛋白质家族(美国专利申请2007/0022497,Cirpus等;Hoffmeister等,J.Biol.Chem.,280:4329-4338,2005,在此通过提述将它们完整并入本文)。纤细眼虫基因的截短cDNA已经在大肠杆菌中功能性表达。此cDNA或来自其它微生物的同系物的基因能与正丁醇途径基因thl、crt、adhE2、和hbd一起表达,用以在大肠杆菌、酿酒酵母或其它宿主中生成正丁醇。
TER蛋白还可通过普遍公知的生物信息学方法来鉴定,诸如BLAST。TER蛋白的例子包括,但不限于,来自诸如以下物种的TER:眼虫属(Euglena spp.),包括但不限于纤细眼虫;气单胞菌属(Aeromonas spp.),包括但不限于嗜水气单胞菌(A.hydrophila);冷单胞菌属(Psychromonas spp.),包括但不限于深海冷单胞菌(P.ingrahamii);发光杆菌属(Photobacterium spp.),包括但不限于深海发光杆菌(P.profundum);弧菌属(Vibrio spp.),包括但不限于Vangustum、霍乱弧菌(V.cholerae)、解藻朊酸弧菌(V.alginolyticus)、副溶血弧菌(V.parahaemolyticus)、创伤弧菌(V.vulnificus)、费氏弧菌(V.fischeri)、灿烂弧菌(V.splendidus);希瓦氏菌属(Shewanella spp.),包括但不限于S.amazonensis,S.woodyi,S.frigidimarina,S.paeleana,S.baltica,反硝化希瓦氏菌(S.denitrificans);海洋螺菌属(Oceanospirillum spp.);黄单胞菌属(Xanthomonasspp.),包括但不限于稻黄单胞菌(X.oryzae)、田野黄单胞菌(X.campestris);色盐杆菌属(Chromohalobacter spp.),包括但不限于需盐色盐杆菌(C.salexigens);Idiomarina spp.,包括但不限于I.baltica;交替假单胞菌属(Pseudoalteromonasspp.),包括但不限于大西洋交替假单胞菌(Patlantica);交替单胞菌属(Alteromonas spp.);Saccharophagus spp.,包括但不限于S.degradans,S.marinegamma proteobacterium,S.alpha proteobacterium,假单胞菌属(Pseudomonasspp.),包括但不限于铜绿假单胞菌(P.aeruginosa)、恶臭假单胞菌(P.putida)、荧光假单胞菌(P.fluorescens);伯克霍尔德菌属(Burkholderia spp.),包括但不限于B.phytofirmans,新洋葱伯克霍尔德氏菌(B.cenocepacia),洋葱伯克霍尔德氏菌(B.cepacia),B.ambifaria,越南伯克霍尔德氏菌(B.vietnamensis),B.multivorans,B.dolosa;甲基杆菌属(Methylbacillus spp.),包括但不限于M.flageliatus;寡养单胞菌属(Stenotrophomonas spp.),包括但不限于嗜麦芽糖寡养单胞菌(S.maltophilia);聚集杆菌属(Congregibacter spp.),包括但不限于C.litoralis;沙雷氏菌属(Serratia spp.),包括但不限于变形斑沙雷氏菌(S.proteamaadans);海洋单胞菌(Marinomonas spp.);Xytella spp.,包括但不限于X.fastidiosa;Reinekea spp.;科尔韦尔氏菌属(Colwellia spp.),包括但不限于C.psychrerythraea;耶尔森氏菌属(Yersinia spp.),包括但不限于鼠疫耶尔森氏菌(Y.pestis)、假结核耶尔森氏菌(Y.pseudotuberculosis);甲基菌属(Methylobacillus spp.),包括但不限于M.flageliatus;噬纤维菌菌属(Cytophagaspp.),包括但不限于哈氏噬纤维菌(C.hutchinsonii);黄杆菌属(Flavobacteriumspp.),包括但不限于F.johnsoniae;微颤菌属(Microscilla spp.),包括但不限于M.marina;极地杆菌属(Polaribacter spp.),包括但不限于P.irgensii;梭菌属,包括但不限于丙酮丁醇梭菌、拜氏梭菌、解纤维梭菌;柯克斯体属(Coxiellaspp.),包括但不限于贝氏柯克斯体(C.burnetii)。
在前述之外,术语“反式-2-烯酰-CoA还原酶”或“TER”指能够催化巴豆酰-CoA转化成丁酰-CoA且根据使用缺省参数的NCBI BLAST的计算,与截短的纤细眼虫TER或全长的嗜水气单胞菌TER之任一或二者共享至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更大序列同一性,或至少约50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或更大序列相似性的蛋白质。
如本文中所使用的,“序列同一性”指所比对的序列中同一位置中完全相同核苷酸或氨基酸的存在。“序列相似性”考虑到了大致匹配,而且只在依照“差异”或“相同性”的一些量度对此类替代打分时有意义,在所述度量中保守的或高度可能的替代被赋以比非保守的或不大可能的替代更有利的得分。
使用TER代替Bcd/EtfA/EtfB的另一个优点是TER在单体形式是有活性的,而且蛋白质表达和酶自身都对氧不敏感。
如本文中所使用的,“反式-2-烯酰-CoA还原酶(TER)同系物”指来自其它生物体(例如,属于眼虫或气单胞菌类(phylum))的酶同源多肽,其具有与上文所定义的相同的TER本质特征,但是共享小于40%的序列同一性和50%的序列相似性标准,如上文所讨论的。突变涵盖一个或多个氨基酸残基的替代、添加、删除、倒位或插入。这容许需氧生长和正丁醇过程的表达阶段期间的酶表达,能潜在容许更加高效的生物燃料生成过程。
在某些实施方案中,本文中所公开的重组微生物表达异源丁醛脱氢酶/正丁醇脱氢酶,诸如由来自梭菌属的bdhA/bdhB、aad、或adhE2基因所编码的。
丁醛脱氢酶(BYDH)是催化丁酰-CoA NADH依赖性还原成丁醛的酶。丁醛进一步被正丁醇脱氢酶(BDH)还原成正丁醇。此还原也伴有NADH氧化。丙酮丁醇梭菌含有已经显示出将丁酰-CoA转化成正丁醇的数种酶的基因。
这些酶之一由aad编码(Nair等,J.Bacteriol.176:871-885,1994)。此基因在丙酮丁醇梭菌菌株DSM 792中称作adhE。该酶是sol操纵子的一部分,而且它编码双功能BYDH/BDH(Fischer等,Journal of Bacteriology 175:6959-6969,1993;Nair等,J.Bacteriol.176:871-885,1994)。
aad的基因产物在大肠杆菌中功能性表达。然而,在需氧条件下,所得活性保持很低,指示氧敏感性。根据对丁醛的活性相对于对乙醛的活性为超过100倍高,Aad的主要作用在正丁醇的形成中而非乙醇(Hair等,Journal ofBacteriology 176:5843-5846,1994)。
根据NCBI的BLAST的计算,共享至少约50%、55%、60%或65%序列同一性,或至少约70%、75%或80%序列同源性的同系物是能在本文中所公开的重组微生物中使用的合适同系物。此类同系物包括(但不限于):破伤风梭菌E88(NP_781989.1),产气荚膜梭菌菌株13(NP_563447.1),产气荚膜梭菌ATCC13124(YP_697219.1),产气荚膜梭菌SM101(YP_699787.1),拜氏梭菌NCIMB8052(ZP_00910108.1),丙酮丁醇梭菌ATCC 824(NP_149199.1),艰难梭菌630(CAJ69859.1),艰难梭菌QCD-32g58(ZP_01229976.1),和热纤维梭菌(Clostridium thermocellum)ATCC 27405(ZP_00504828.1)。
另外两种NADH依赖性正丁醇脱氢酶(BDH I,BDH II)已经纯化,而且它们的基因(bdhA,bdhB)已经克隆。BDH I的GenBank登录号是AAA23206.1,而蛋白质序列显示于SEQ ID NO:10。
BDH II的GenBank登录号是AAA23207.1,而蛋白质序列显示于SEQ IDNO:11。
这些基因在染色体上是相邻的,但是由它们自己的启动子转录(Walter等,Gene 134:107-111,1993)。BDH I利用NADPH作为辅因子,而BDH II利用NADH。然而,注意到相对辅因子偏爱是pH依赖性的。在自质粒表达bdhA后在大肠杆菌裂解物中观察到BDH I活性(Petersen等,Journal of Bacteriology173:1831-1834,1991)。BDH II据报道具有的对丁醛的活性是对乙醛的活性的46倍高,而且在逆方向的活性低50倍。BDH I对丁醛的活性只为对乙醛的活性约2倍高(Welch等,Archives of Biochemistry and Biophysics 273:309-318,1989)。如此,在一个实施方案中,在异源表达的正丁醇途径中使用BDH II或BDH II同系物。另外,这些酶在5.5的相对较低pH最有活性,在选择合适的宿主和/或工艺条件时可考虑此性状。
虽然上文所述基因在产溶剂的条件下转录,一种不同的基因,adhE2在产醇的条件下转录(Fontaine等,J.Bacteriol.184:821-830,2002,GenBank登录号AF321779)。这些条件在相对中性的pH存在。该酶已经在大肠杆菌的厌氧培养中过表达,且具有高NADH依赖性BYDH和BDH活性。在某些实施方案中,此酶是优选的酶。此酶的蛋白质序列(GenBank登录号AAK09379.1)显示于SEQID NO:1。
根据NCBI的BLAST的计算,共享至少约50%、55%、60%或65%序列同一性,或至少约70%、75%或80%序列同源性的同系物是能在本文中所公开的重组微生物中使用的合适同系物。此类同系物包括,但不限于:产气荚膜梭菌SM101(YP_699787.1),产气荚膜梭菌菌株13(NP_563447.1),产气荚膜梭菌ATCC 13124(YP_697219.1),破伤风梭菌E88(NP_781989.1),拜氏梭菌NCIMB8052(ZP_00910108.1),艰难梭菌QCD-32g58(ZP_01229976.1),艰难梭菌630(CAJ69859.1),丙酮丁醇梭菌ATCC 824(NP_149325.1),和热纤维梭菌ATCC27405(ZP_00504828.1)。
在某些实施方案中,可以使用与任何上述多肽至少约70%、80%、90%、95%、99%同一的,或共享至少约60%、70%、80%、90%、95%序列同源性(相似的)的任何同源酶代替这些野生型多肽。这些共享必需序列同一性或相似性的酶可以是来自不同生物体的野生型酶,或者可以是人工的重组的酶。
在某些实施方案中,可以使用编码具有与任何上述酶相同活性的酶的任何基因代替编码上述酶的基因。这些酶可以是来自不同生物体的野生型酶,或者可以是人工的、重组的、或工程化改造的酶。
另外,由于遗传密码的内在简并性,也可以使用编码基本上相同的或功能上等同的氨基酸序列的其它核酸序列来克隆和表达编码此类酶的多核苷酸。本领域技术人员会理解,修饰编码序列以增强其在特定宿主中的表达会是有利的。在一种物种中最常被利用的密码子称作最佳密码子(optimalcodon),而不太经常利用的密码子归为罕见或低使用率密码子。可以替代密码子以反映宿主优选的密码子选择,即有时称作“密码子优化”或“控制物种密码子偏好”的过程。提供了为植物中的表达而优化核苷酸序列的方法学,例如,在美国专利No.6,015,891及其中引用的参考文献中。
在某些实施方案中,本文中所公开的重组微生物具有一种或多种来自产溶剂的梭菌属,诸如丙酮丁醇梭菌或拜氏梭菌的异源DNA序列。例示性的丙酮丁醇梭菌是菌株ATCC824,而例示性的拜氏梭菌是菌株NCIMB 8052。
基因的表达可以通过常规分子生物学手段来实现。例如,异源基因可以在诱导型启动子或组成性启动子的控制下。异源基因可以整合入宿主微生物的染色体中,或者作为能稳定传递(“遗传”)给子细胞的染色体外遗传元件存在。此类染色体外遗传元件(诸如质粒、BAC、YAC等)可以另外含有确保此类遗传元件在子细胞中的存在的选择标志。
在某些实施方案中,本文中所公开的重组微生物还可生成正丁醇生成途径的一种或多种代谢中间产物,诸如乙酰乙酰-CoA、羟基丁酰-CoA、巴豆酰-CoA、丁酰-CoA、或丁醛,和/或其衍生物,诸如丁酸。
在一些实施方案中,本文中所描述的为生成正丁醇而被工程化改造以活化一种或多种上文所述异源酶的重组微生物经异源途径生成正丁醇。
如本文中所使用的,术语“途径”指包括一种或多种受酶控制的、将底物转化成产物的化学反应的生物学过程。因而,用于将碳源转化成正丁醇的途径是包括一种或多种受酶控制的、将碳源转化成正丁醇的反应的生物学过程。“异源途径”指其中至少一种或多种化学反应之至少一种由至少一种异源酶催化的途径。另一方面,“天然途径”指其中的一种或多种化学反应由天然酶催化的途径。
在某些实施方案中,本文中所公开的重组微生物被工程化改造以活化生成正丁醇的异源途径(在本文中也称作正丁醇途径),其包含:(1)2个乙酰-CoA转化成乙酰乙酰-CoA,(2)乙酰乙酰-CoA转化成羟基丁酰-CoA,(3)羟基丁酰-CoA转化成巴豆酰-CoA,(4)巴豆酰-CoA转化成丁酰-CoA,(5)丁醛转化成正丁醇(见图2例示性图解)。
2个乙酰-CoA转化成乙酰乙酰-CoA可通过在重组微生物中表达编码乙酰-CoA-乙酰转移酶(硫解酶)或Thl的天然或异源基因来实施。在本文中所公开的重组微生物中合适的例示性硫解酶由如下基因编码:来自丙酮丁醇梭菌(具体而言来自菌株ATCC 824)的thl,或来自巴氏梭菌、拜氏梭菌(具体而言来自菌株NCIMB 8052或菌株BA101)、热带假丝酵母、芽孢杆菌属、埃氏巨球形菌、或解纤维丁酸弧菌的编码同源酶的基因,或选自fadA或atoB的大肠杆菌硫解酶基因。
乙酰乙酰-CoA转化成羟基丁酰-CoA可通过在重组微生物中表达编码羟基丁酰-CoA脱氢酶Hbd的天然或异源基因来实施。在本文中所公开的重组微生物中合适的例示性Hbd由如下基因编码:来自丙酮丁醇梭菌(具体而言来自菌株ATCC 824)的hbd,或来自克氏梭菌、拜氏梭菌(具体而言来自菌株NCIMB8052或菌株BA101)、热解糖梭菌、破伤风梭菌、解纤维丁酸弧菌、埃氏巨球形菌、或大肠杆菌(fadB)的编码同源酶的基因。
羟基丁酰-CoA转化成巴豆酰-CoA可通过在重组微生物中表达编码巴豆酸酶或Crt的天然或异源基因来实施。在本文中所公开的重组微生物中合适的例示性crt由来自丙酮丁醇梭菌(具体而言来自菌株ATCC 824)的crt,或来自溶纤维丁酸弧菌、聚核梭杆菌文氏亚种、艰难梭菌、巴氏梭菌、或马尔他布鲁氏菌的编码同源酶的基因编码。
巴豆酰-CoA转化成丁酰-CoA可通过在重组微生物中表达编码丁酰-CoA脱氢酶的天然或异源基因来实施。在本文中所公开的重组微生物中合适的例示性丁酰-CoA脱氢酶由来自丙酮丁醇梭菌(具体而言来自菌株ATCC 824)的bcd/etfA/etfB,或来自埃氏巨球形菌、埃氏消化链球菌、布氏共养生孢菌、溃蚀密螺旋体、解纤维丁酸弧菌的编码同源酶的基因,或哺乳动物线粒体Bcd同系物编码。
丁醛转化成正丁醇可通过在重组微生物中表达编码丁醛脱氢酶或正丁醇脱氢酶的天然或异源基因来实施。在本文中所公开的重组微生物中合适的例示性丁醛脱氢酶/正丁醇脱氢酶由来自丙酮丁醇梭菌(具体而言来自菌株ATCC824)的bdhA、bdhB、aad、或adhE2,或来自拜氏梭菌(具体而言来自菌株NCIMB8052或菌株BA101)的编码ADH-1、ADH-2、或ADH-3的基因编码。
在某些实施方案中,自乙酰-CoA至正丁醇的代谢途径的酶是(i)硫解酶(Thl),(ii)羟基丁酰-CoA脱氢酶(Hbd),(iii)巴豆酸酶(Crt),(iv)醇脱氢酶(AdhE2),或正丁醇脱氢酶(Aad)或丁醛脱氢酶(Ald)加之单功能正丁醇脱氢酶(BdhA/BdhB)中的至少一种,和(v)反式-2-烯酰-CoA还原酶(TER)(图2)。在某些实施方案中,Thl、Hbd、Crt、AdhE2、Ald、BdhA/BdhB和Aad来自梭菌属。在某些实施方案中,梭菌属是丙酮丁醇梭菌。在某些实施方案中,TER来自纤细眼虫或来自嗜水气单胞菌。
在某些实施方案中,一种或多种异源基因编码乙酰-CoA-乙酰转移酶(硫解酶)、羟丁酰-CoA脱氢酶(hbd)、巴豆酸酶(crt)、和醇脱氢酶(adhE2)、丁酰-CoA脱氢酶(bcd)、丁醛脱氢酶(bdhA/bdhB)/丁醇脱氢酶(aad)、和反式-2-烯酰-CoA还原酶(TER)中的一种或多种。
例如,乙酰-CoA-乙酰转移酶(硫解酶)可以是来自丙酮丁醇梭菌的thl,或来自巴氏梭菌、拜氏梭菌、热带假丝酵母、芽孢杆菌属菌种、埃氏巨球形菌、或溶纤维丁酸弧菌的同源酶,或选自fadA或atoB的大肠杆菌硫解酶。
羟丁酰-CoA脱氢酶可以是来自丙酮丁醇梭菌的hbd,或来自克氏梭菌、拜氏梭菌、热解糖梭菌、破伤风梭菌、解纤维丁酸弧菌、埃氏巨球形菌、或大肠杆菌(fadB)的同源酶。
巴豆酸酶可以是来自丙酮丁醇梭菌的crt,或来自溶纤维丁酸弧菌、聚核梭杆菌文氏亚种、艰难梭菌、巴氏梭菌、或马尔他布鲁氏菌的同源酶。
丁酰-CoA脱氢酶可以是来自丙酮丁醇梭菌的bcd/etfA/etfB,或来自埃氏巨球形菌、埃氏消化链球菌、布氏共养生孢菌、溃蚀密螺旋体、解纤维丁酸弧菌的同源酶,或真核线粒体bcd同系物。
丁醛脱氢酶/丁醇脱氢酶可以是来自丙酮丁醇梭菌的bdhA、bdhB、aad、或adhE2,或来自拜氏梭菌的ADH-1、ADH-2、或ADH-3。
反式-2-烯酰-CoA还原酶(TER)可以来自纤细眼虫或嗜水气单胞菌。
一种或多种异源DNA序列可以来自选自丙酮丁醇梭菌或拜氏梭菌的产溶剂梭菌,或来自艰难梭菌、巴氏梭菌、克氏梭菌、热解糖梭菌、破伤风梭菌、热带假丝酵母、芽孢杆菌属菌种、马尔他布鲁氏菌、埃氏巨球形菌、溶纤维丁酸弧菌、聚核梭杆菌文氏亚种、埃氏消化链球菌、布氏共养生孢菌、溃蚀密螺旋体、或大肠杆菌。
在某些实施方案中,丙酮丁醇梭菌是菌株ATCC824,而拜氏梭菌是菌株NCIMB 8052或菌株BA101。在某些实施方案中,共享至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%序列同一性,或至少约50%、60%、70%、80%、90%序列同一性(根据NCBI BLAST的计算,使用缺省参数)的同系物对于本发明是合适的。
部分(1):工程化改造丙酮酸变成乙酰-CoA的转化
如上所述,丙酮酸变成乙酰-CoA的转化可通过两种一般路径发生在工程化细胞中:(A)如上所述的“PDH旁路”路径或(B)胞质溶胶中通过PDH或通过PFL进行的丙酮酸变成乙酰-CoA的直接转化。
(A)经“PDH旁路”路径生成乙酰-CoA
关于自丙酮酸生成乙酰-CoA的路径(A),胞质乙酰-CoA生成途径是由三种酶催化的,如图3中步骤1、2和3所示。通过提高那些限速的酶的活性实现了生成乙酰-CoA的更有效途径。例如,在酿酒酵母中,如果ALD活性在途径中是限制性的,那么ALD6的过表达会由此提高通过该途径的整体通量。经以下机制之一或其组合实现了胞质溶胶中升高的乙酰-CoA形成:
在一个实施方案中,通过丙酮酸脱羧酶基因(例如,酿酒酵母PDC1、PDC5和/或PDC6;步骤1)的过表达可生成升高的乙酰-CoA。
在另一个实施方案中,通过乙醛脱氢酶基因(例如,酿酒酵母ALD6;步骤2)的过表达可生成升高的乙酰-CoA。
在又一个实施方案中,通过乙酰-CoA合酶基因(例如,酿酒酵母ACS1或ACS2或二者;步骤3)的过表达可生成升高的乙酰-CoA。
在一个不同的实施方案中,ALD和ACS(酿酒酵母ALD6;步骤2)二者的同时过表达可生成升高的乙酰-CoA(步骤2和3)。
在另一个实施方案中,PDC、ALD、和ACS基因的同时过表达可生成升高的乙酰-CoA生成(步骤1-3)。
为了进一步提高乙酰-CoA生成,可以降低或消除酵母中的主要胞质乙醇生成途径。在Crabtree阳性酿酒酵母中,这是通过删除ADH1来实现的,ADH1是胞质ADH活性的主要来源。删除了ADH1的细胞不能够厌氧生长(Drewke等,(1990).J.Bacteriology 172(7):3909),而且如此可能优选删除ADH1以将乙醛变成乙醇的转化降至最低。消除此途径选择性驱动乙醛通向乙酸且随后通向乙酰-CoA生成(图3,步骤5)。因此,可以在具有降低的或消除的ADH活性的细胞中实施上文所述基因的过表达。
类似的,可以在Crabtree阴性酵母诸如乳酸克鲁维酵母中通过删除ADHI或ADHII降低或消除胞质ADH活性,用以提高经“PDH旁路”路径自丙酮酸至乙酰-CoA的通量。因此,在此生物体中,与上文对酿酒酵母所提议的类似,可以经由单独的或组合的KIALD6、KIACS1或KIACS2的过表达来提高经过“PDH旁路”路径的通量。
(B)自丙酮酸直接生成乙酰-CoA
关于自丙酮酸生成乙酰-CoA的路径(B),可以通过形成完整PDH复合物的基因的过表达来提高乙酰-CoA生成。例如,过表达的基因可以来自大肠杆菌(aceE、aceF、和lpdA)、运动发酵单胞菌(Zymomonas mobilis)(pdhAa、pdhAβ、pdhB、和Ipd)、金黄色葡萄球菌(Staphylococcus aureus)(pdhA、pdhB、pdhC、和Ipd)、枯草芽孢杆菌(Bacillus subtilis)、谷氨酸棒杆菌(Corynebacteriumglutamicum)、或铜绿假单胞菌(Pseudomonas aeruginosa)(步骤4)。
丙酮酸脱氢酶复合物催化丙酮酸变成乙酰-CoA的转化。在酿酒酵母中,此复合物定位在线粒体内膜空间中。因此,在酿酒酵母的细胞质中获得更高水平乙酰-CoA的另一种方法是工程化改造细胞以过表达能在细胞质中发挥功能的真核的或原核的丙酮酸脱氢酶复合物(步骤4)。在某些实施方案中,本文中所公开的重组微生物包括在厌氧或微需氧条件下有活性的丙酮酸脱氢酶(Pdh)。丙酮酸脱氢酶或NADH依赖性甲酸脱氢酶对于重组微生物而言可以是异源的,即编码这些酶的编码序列是异源的,或转录调节区是异源的(包括人工的),或所编码的多肽包含包含序列变化,其使得该酶对某些代谢中间产物或底物带来的反馈抑制有抗性。
直到最近,才广泛接受了Pdh在厌氧条件下不发挥功能,但是数份最近的报告证明了情况并非如此(de Graef,M.等,1999,Journal of Bacteriology,181,2351-57;Vernuri,G.N.等,2002,Applied and Environmental Microbiology,68,1715-27)。此外,其它微生物诸如粪肠球菌(Enterococcus faecalis)即使在厌氧条件下也展现出Pdh复合物的高体内活性,前提是生长条件使得稳态NADH/NAD+比足够低(Snoep,J.L.等,1991,Ferns Microbiology Letters,81,63-66)。代替调节Pdh表达和功能的氧,已经显示了Pdh受到NADH/NAD+比的调节(de Graef,M.等,1999,Journal of Bacteriology,181,2351-57)。如果在宿主细胞中表达的正丁醇途径消耗NADH快得足以在细胞内部维持低NADH/NAD+水平,那么内源或异源表达的Pdh可维持活性和提供NADH,其足以平衡该途径。
这些Pdh酶能在本文中所公开的重组微生物中平衡正丁醇途径。
在厌氧条件下功能性的Pdh的表达预期提高每摩尔葡萄糖获得的NADH摩尔数。Kim等记载了Pdh使得在大肠杆菌中消耗每摩尔葡萄糖可得到多达4摩尔NADH(Kim,Y.等(2007).Appl.Environm.Microbiol.,73,1766-1771)。也可以工程化改造酵母,以表达来自各式各样细菌来源的PDH复合物。例如,来自粪肠球菌的Pdh与来自大肠杆菌的Pdh类似,但是在低得多的NADH/NAD+水平被灭活。另外,有些生物体诸如枯草芽孢杆菌和几乎所有乳酸细菌菌株在厌氧代谢中使用Pdh。如果正丁醇生成途径能与内源发酵性途径竞争的话,那么在表达厌氧活性Pdh的微生物中表达正丁醇生成途径预期导致大于1.4%的正丁醇产率。
或者,可以通过过表达两种细菌酶,即丙酮酸甲酸裂合酶(例如大肠杆菌pflB)和甲酸脱氢酶(例如博伊丁氏假丝酵母(Candida boidnii)fdh1),在胞质溶胶中生成乙酰-CoA。使用此途径,丙酮酸被转化成乙酰-CoA和甲酸。然后甲酸脱氢酶催化甲酸变成二氧化碳的NADH依赖性转化。这些反应的净结果与丙酮酸脱氢酶复合物将丙酮酸转化成乙酰-CoA的情况相同:
丙酮酸+NAD+→乙酰-CoA+NADH+CO2。
NADH依赖性甲酸脱氢酶(Fdh;EC 1.2.1.2)催化甲酸变成CO2的氧化和同时的NAD+变成NADH的还原。Fdh可依照本发明用于提高宿主微生物内的NADH胞内可得性,而且可用于在NADH方面平衡正丁醇生成途径。具体而言,可以在宿主微生物中活化(具体而言是过表达)生物学活性NADH依赖性的Fdh。在存在这种新引入的甲酸脱氢酶途径时,1摩尔甲酸转化成二氧化碳时会形成1摩尔NADH。在某些实施方案中,在天然微生物中,甲酸脱氢酶将甲酸转化成CO2和H2,不牵涉辅因子。
另外,可以使用本领域技术人员已知的方法对任何编码外来酶的基因(或本文中所提及的任何其它的)(或任何控制或调控其表达的调节元件)进行定向进化。此类动作容许本领域技术人员为酵母中的表达和活性优化酶。
另外,为了调控此途径,可以表达来自其它真菌和细菌物种的丙酮酸脱羧酶、乙酰-CoA合成酶、和乙醛脱氢酶基因。多种生物体能充当这些酶的来源,包括,但不限于:酵母属菌种,包括酿酒酵母突变株和葡萄汁酵母(S.uvarum);克鲁维酵母属,包括耐热克鲁维酵母(K.thermotolerans)、乳酸克鲁维酵母、和马克思克鲁维酵母(K.marxianus);毕赤酵母属;汉逊酵母属,包括多形汉逊酵母(H.polymorpha);假丝酵母属;丝孢酵母属(Trichosporon)、Yamadazyma,包括Y.stipitis;Torulaspora pretoriensis;粟酒裂殖酵母(Schizosaccharomyce pombe);隐球菌属菌种(Cryptococcus sp.);曲霉属菌种;脉孢菌属菌种(Neurospora sp.)或黑粉菌属菌种(Ustilago sp.)。有用丙酮酸脱羧酶的例子是那些来自贝酵母(Saccharomyces bayanus)(1PYD)、Candidaglabrata、乳酸克鲁维酵母(KIPDC1)、或构巢曲霉(Aspergillus nidulans)(PdcA)、和来自白色假丝酵母(Candida albicans)、粗糙脉孢菌(Neurosporacrassa)、构巢曲霉、或乳酸克鲁维酵母(ACS1)的乙酰-CoA合酶,和来自黑曲霉(Aspergillus niger)(ALDDH)、白色假丝酵母、新生隐球菌(Cryptococcusneoformans)(alddh)的乙醛脱氢酶。有用原核酶的来源包括,但不限于大肠杆菌、运动发酵单胞菌、芽孢杆菌属菌种、梭菌属菌种、假单胞菌属菌种、乳球菌属菌种(Lactococcus sp.)、肠杆菌属菌种(Enterobacter sp.)和沙门氏菌属菌种(Salmonella sp.)。通过工程化改造这些酶以实现增强的活性,可获得此途径的进一步增强,其通过定点诱变和其它进化方法(这包括本领域技术人员已知的技术)来实现。
原核生物,诸如,但不限于,大肠杆菌、运动发酵单胞菌、金黄色葡萄球菌、芽孢杆菌属菌种、梭菌属菌种、棒杆菌属菌种、假单胞菌属菌种、乳球菌属菌种、肠杆菌属菌种、和沙门氏菌属菌种,能充当这种酶复合物的来源。例如,来自大肠杆菌(aceE、aceF、和lpdA)、运动发酵单胞菌(pdhAα、pdhAβ、pdhB、和Ipd)、金黄色葡萄球菌(pdhA、pdhB、pdhC、和pdhC)、枯草芽孢杆菌、谷氨酸棒杆菌、和铜绿假单胞菌的丙酮酸脱氢酶复合物可用于此目的。
培养和操作酵母的方法是本领域公知的。在酵母细胞中过表达基因、以各种较低的水平表达基因、遏制基因表达、或删除基因的方法是本领域公知的,而且本发明涵盖任何此类方法用于构建本发明的酵母菌株。
可使用任何方法来将外源核酸分子导入酵母中,而且许多此类方法是本领域技术人员公知的。例如,转化、电穿孔、接合、和原生质体融合是用于将核酸导入酵母细胞的常用方法。参见例如Ito等,J.Bacterol.153:163-168(1983);Durrens等,Curr.Genet.18:7-12(1990);及Becker和Guarente,Methodsin Enzymology 194:182-187(1991)。
在一个实施方案中,感兴趣基因进入DNA片段或靶基因的整合依照同源重组的原理发生。依照这个实施方案,含有包含至少一种酵母标志基因的模块、有或无待整合基因(内部模块)的整合盒任一侧翼均为与靶定整合位点的末端同源的DNA片段(致重组序列)。通过适宜方法用该盒转化酵母后,致重组序列之间的同源重组可导致内部模块替换基因组中与整合盒的致重组序列对应的两个位点之间的染色体区域。
在一个实施方案中,为了删除基因,整合盒可包括适宜的酵母选择标志,其侧翼为致重组序列。在一个实施方案中,为了异源基因整合入酵母染色体中,整合盒包括在适宜启动子和终止子控制下的异源基因,与选择标志一起,侧翼为致重组序列。在一个实施方案中,异源基因包含适宜的天然基因,期望提高天然基因的拷贝数。选择标志基因可以是任何在酵母中使用的标志基因,包括,但不限于,来自酿酒酵母的URA3基因或同源基因;或潮霉素抗性基因,它们分别用于对转化细胞进行基于营养缺陷型互补或抗生素抗性的选择。可以随意选择致重组序列,这取决于适合于期望应用的期望整合位点。
另外,在一个实施方案中,使用本领域技术人员公知的技术自基因组中清除某些被导入的标志基因。例如,通过将含有URA3的细胞在含有FOA(5-氟-乳清酸)的培养基中涂板,并选择FOA抗性菌落,能获得URA3标志丢失(Boeke,J.等,1984,Mol.Gen.Genet.197,345-47)。
可以将包含在本公开内容酵母细胞内的外源核酸分子以任何形式维持在该细胞内。例如,可以将外源核酸分子整合入细胞的基因组中,或维持在附加体状态,其能稳定地传递(“遗传”)给子细胞。此类染色体外遗传元件(诸如质粒等)可以另外含有确保此类遗传元件在子细胞中的存在的选择标志。此外,可以稳定地或瞬时地转化酵母细胞。另外,本文中所描述的酵母细胞可含有单拷贝或多拷贝的如上所述特定外源核酸分子。
用于自外源核酸分子表达多肽的方法是本领域技术人员公知的。此类方法包括但不限于构建核酸,使得调节元件促进编码期望多肽的核酸序列的表达。典型的是,调节元件是在转录水平调节其它DNA序列表达的DNA序列。如此,调节元件包括但不限于启动子、增强子等等。例如,外源基因可以在诱导型或组成性启动子的控制下。此外,用于在酵母中自外源核酸分子表达多肽的方法是本领域技术人员公知的。例如,能够在克鲁维酵母属(参见例如美国专利No.4,859,596和4,943,529,通过述及将每一篇完整收入本文)和酵母属(参见例如Gelissen等,Gene 190(1):87-97(1997))中表达外源多肽的核酸构建体是公知的。在另一个实施方案中,异源控制元件可用于活化或遏制内源基因的表达。另外,在要遏制或消除表达时,可以通过已知的删除技术来消除有关酶、蛋白质或RNA的基因。
如本文中所描述的,本公开内容范围内的酵母可通过对所表达的、过表达的或遏制的特定酶特异性的选择技术来鉴定。鉴定具有期望表型的菌株的方法是本领域技术人员公知的。此类方法包括但不限于PCR和核酸杂交技术诸如Northern和Southern分析,在特定基底(substrate)上或在存在特定底物(substrate)、化学品、选择剂等时改变的生长能力。在有些情况中,可使用免疫组织化学和生物化学技术通过检测所编码多肽的表达来测定细胞是否含有特定核酸。例如,可使用对所编码的酶具有特异性的抗体来测定特定酵母细胞是否含有该所编码的酶。另外,可使用生物化学技术通过检测作为酶多肽表达的结果而生成的产物来测定细胞是否含有编码酶多肽的特定核酸分子。例如,用编码乙酰-CoA合成酶的载体转化细胞并检测到升高的胞质乙酰-CoA浓度指示载体存在且基因产物有活性。用于检测特定酶活性或特定产物的存在的方法是本领域技术人员公知的。例如,可以如Dalluge等,Anal.Bioanal.Chem.374(5):835-840(2002)所记载的来测定乙酰-CoA的存在。
本发明的酵母细胞具有降低的酶活性,诸如降低的醇脱氢酶活性。术语“降低的”,如本文中关于细胞和特定酶活性所使用的,指比在相同物种的可比较酵母细胞中所测量到的水平要低的酶活性。如此,缺乏醇脱氢酶活性的酵母细胞视为具有降低的醇脱氢酶活性,因为大多数(如果不是所有的话)可比较的酵母菌株具有至少一些醇脱氢酶活性。此类降低的酶活性的原因可以是较低的酶浓度、较低的酶比活、或其组合。许多不同方法可用于使得酵母具有降低的酶活性。例如,可以工程化改造酵母细胞,以具有遭到破坏的编码酶的基因座,其使用常用诱变或敲除技术来实现。参见例如Methods inYeast Genetics(1997年版),Adams,Gottschling,Kaiser,和Stems,Cold SpringHarbor Press(1998)。
或者,可使用反义技术来降低酶活性。例如,可以工程化改造酵母,以含有编码反义分子的cDNA,该反义分子阻止酶生成。术语“反义分子”,如本文中所使用的,涵盖任何含有与内源多肽编码链对应的序列的核酸分子。反义分子还可具有侧翼序列(例如调节序列)。如此,反义分子可以是核酶或反义寡核苷酸。核酶可具有任何通用结构,包括,但不限于,发夹、锤头、或斧头(axhead)结构,前提是该分子切割RNA。
具有降低的酶活性的酵母可使用任何方法来鉴定。例如,可使用常用方法来容易地鉴定具有降低的醇脱氢酶活性的酵母,例如通过经气相层析测量乙醇形成。
在一个实施方案中,可以使用两步过程自本公开内容的代谢工程化菌株之一生成正丁醇。因为高水平的丁醇(例如在培养基中为1.5%,这一般随酵母和菌种而变化)对于细胞可以是有毒性的,一种获得大量正丁醇的策略是培养能够在其中不生成丁醇或只生成不显著的、无毒性的量的丁醇的条件下生成正丁醇的菌株。此步骤容许大量活细胞的积累,即显著量的生物质,然后可以将其转换成其中生成正丁醇的生长条件。这样的策略容许在毒性问题变得重要和减缓细胞生长之前生成大量正丁醇。例如,可以在需氧条件下培养细胞(其中正丁醇生成受到遏制或缺失),然后转换成厌氧或微需氧条件以生成正丁醇(例如通过活化已经依照本发明被工程化改造入菌种中的适宜的代谢途径)。或者,有关酶的表达可以在诱导型控制下,例如热敏感性启动子或其它热敏感性步骤(诸如酶自身的热稳定性),使得第一个步骤发生时伴有有关途径或酶关闭(即无活性),诱导发生(例如温度转变)和正丁醇生成。用于对基因进行诱导型控制的方法是公知的。热稳定的酶是已知的,或者可以通过本领域已知方法来选择。正如在本公开内容的其它过程中那样,一旦生成正丁醇,就可以依照一个实施方案回收它。
用于自微生物(包括酵母)回收正丁醇的过程披露于2007年12月3日提交的美国临时申请流水号11/949,724,通过述及收入本文。
本领域技术人员会领会,可以对上文所描述的发明进行各种省略、添加和修改,而不偏离本发明的范围,而且所有此类修改和变化意图落在所附权利要求书限定的发明范围内。在此通过述及将所引用的所有参考文献、专利、专利申请、和其它文件收入本文。
实施例
表1列举了实施例1-38中所描述的一组基因。给出了可用于扩增每一种基因的有关引物(正向的和反向的)、以及每一种引物的序列。基因是依照对每一种物种适宜的命名规则列举的;在某些所列举的基因前面有两个字母,它们代表了给定基因起源的属和种的第一个字母。对于某些基因名称,附有后缀“-co”,指示使用细菌大肠杆菌或酵母酿酒酵母优选的密码子使用率构建了经过密码子优化的合成基因,正如正文中所指明的。
表1
基因 基因 SEQ ID NO: 引物名称 SEQ ID NO: 引物序列 Cb-hbd 155 Gevo-311 42 GAGGTTGTCGACATGAAAAAGATTTTTGTACTTGGAG Gevo-175 43 AATTGGATCCTTATTTAGAATAATCATAGAATCCT Cb-crt 156 Gevo-312 44 GTTCTTGTCGACATGGAATTAAAAAATGTTATTCTTG Gevo-171 45 AATTGGATCCTTATTTATTTTGAAAATTCTTTTCTGC Cb-bcd 157 Gevo-313 46 CAAGAGGTCGACATGAATTTCCAATTAACTAGAGAAC Gevo-314 47 GCGTCCGGATCCCTATCTTAAAATGCTTCCTGCG Cb-etfA 158 Gevo-315 48 CGGAAAGTCGACATGAATATAGCAGATTACAAAGGC Gevo-173 49 AATTGGATCCTTATTCAGCGCTCTTTATTTCTTTA Cb-etfB 159 Gevo-316 50 CAAAATGTCGACATGAATATAGTAGTTTGTGTAAAAC Gevo-317 51 TAATTTGGATCCTTAGATGTAGTGTTTTTCTTTTAAT Cb- adhA 160 Gevo-319 52 GAACCAGTCGACATGGCACGTTTTACTTTACCAAG Gevo-177 53 AATTGGATCCTTACAAATTAACTTTAGTTCCATAG Cb-aldh 161 Gevo-318 54 TCCATAGTCGACATGAATAAAGACACACTAATACCT Gevo-249 55 AATTGGATCCTTAGCCGGCAAGTACACATCTTCTTTGTC T Ca-thl 162 Gevo-308 56 GATCGAGTCGACATGAAAGAAGTTGTAATAGCTAG Gevo-309 57 GTTATAGGATCCCTAGCACTTTTCTAGCAATATTG Ca-hbd 163 Gevo-281 58 GTGGATGTCGACATGAAAAAGGTATGTGTTATAGGTG Gevo-161 59 AATTGGATCCTTATTTTGAATAATCGTAGAAACCT Ca-crt 164 Gevo-282 60 TCCTACGTCGACATGGAACTAAACAATGTCATCCT Gevo-283 61 TAACTTGGATCCCTATCTATTTTTGAAGCCTTCAAT Ca-bcd 165 Gevo-284 62 CAAGAGGTCGACATGGATTTTAATTTAACAAGAGAAC Gevo-285 63 CAATAAGGATCCTTATCTAAAAATTTTTCCTGAAATAAC Ca-etfA 166 Gevo-286 64 CGGGAAGTCGACATGAATAAAGCAGATTACAAGGGC Gevo-287 65 GTTCAAGGATCCTTAATTATTAGCAGCTTTAACTTG Ca-etfB 167 Gevo-288 66 CAAAATTGTCGACATGAATATAGTTGTTTGTTTAAAAC Gevo-289 67 GTTTTAGGATCCTTAAATATAGTGTTCTTCTTTTAATTTT
基因 基因 SEQ ID NO: 引物名称 SEQ ID NO: 引物序列 G Ca- adhE2 168 Gevo-292 68 CAAGAAGTCGACATGAAAGTTACAAATCAAAAAGAAC Gevo-293 69 TCCTATGCGGCCGCTTAAAATGATTTTATATAGATATCC T Ca-aad 169 Gevo-290 70 AGGAAAGTCGACATGAAAGTCACAACAGTAAAGGA Gevo-291 71 ATTTAAGCGGCCGCTTAAGTTGTTTTTTAAAACAATTT A Ca- bdhA 170 Gevo-294 72 CATAACGTCGACATGCTAAGTTTTGATTATTCAATAC Gevo-247 73 AAT TGGATCCTTAATAAGATTTTTTAAATATCTCAA Ca- bdhB 171 Gevo-295 74 CATAACGTCGACATGGTTGATTTCGAATATTCAATAC Gevo-159 75 AATTGGATCCTTACACAGATTTTTTGAATATTTGTA Ca-thl- co 1 Gevo-310 76 GATCGAGAATTCATGAAAGAAGTTGTAATAGCTAG Gevo-309 77 GTTATAGGATCCCTAGCACTTTTCTAGCAATATTG Ca-hbd- co 2 Gevo-296 78 CGGATAGTCGACATGAAAAAGGTATGTGTTATAGGC Gevo-297 79 TCCCAAGGATCCTTATTTTGAATAATCGTAGAAACCCT Ca-crt- co 3 Gevo-282 80 TCCTACGTCGACATGGAACTAAACAATGTCATCCT Gevo-283 81 TAACTTGGATCCCTATCTATTTTTGAAGCCTTCAAT Ca-bcd- co 4 Gevo-284 82 CAAGAGGTCGACATGGATTTTAATTTAACAAGAGAAC Gevo-298 83 GTAAAGGGATCCTTAACTAAAAATTTTTCCTGAAATG Ca-eftA- co 5 Gevo-286 84 CGGGAAGTCGACATGAATAAAGCAGATTACAAGGGC Gevo-299 85 GTTCAAGGATCCTTAATTATTAGCAGCTTTAACCTG Ca-eftB- co 6 Gevo-288 86 CAAAATTGTCGACATGAATATAGTTGTTTGTTTAAAAC Gevo-300 87 GACTTTGGATCCTTAAATATAGTGTTCTTCTTTCAG Ca- adhE2- co 7 Gevo-292 88 CAAGAAGTCGACATGAAAGTTACAAATCAAAAAGAAC Gevo-301 89 ATTTTCGGATCCTTAAAATGATTTTATATAGATATCTTTT A Me-bcd- co 8 Gevo-302 90 CTTATAGTCGACATGGATTTTAACTTAACAGATATTC Gevo-303 91 CCGCCAGGATCCTTAACGTAACAGAGCACCGCCGGT Me-effA- co 9 Gevo-304 92 CGGAAAGTCGACATGGATTTAGCAGAATACAAAGGC Gevo-305 93 CTTTGTGGATCCTTATGCAATGCCTTTCTGTTTC Me-eftB- co 10 Gevo-306 94 CAAACTGAATTCATGGAAATATTGGTATGTGTCAAAC Gevo-307 95 ACCAACGGATCCTTAAATGATTTTCTGGGCAACCA ERG10 154 Gevo-273 96 GTTACAGTCGACATGTCTCAGAACGTTTACATTG Gevo-274 97 GATAACGGATCCTCATATCTTTTCAATGACAATAG IpdA 20 Gevo-610 119 ttttGTCGACACTAGTatgagtactgaaatcaaaactcagggtcgtg Gevo-611 120 ttttCTCGAGttacttcttcttcgctttcgggttcgg
基因 基因 SEQ ID NO: 引物名称 SEQ ID NO: 引物序列 aceE 21 Gevo-606 116 ttttGTCGACACTAGTatgtcagaacgtttcccaaatgacgtgg Gevo-607 117 ttttCTCGAGttacgccagacgcgggttaactttatctg aceF 22 Gevo-653 136 ttttGTCGACACTAGTatggctatcgaaatcaaagtaccggacatcggg Gevo-609 118 ttttCTCGAGttacatcaccagacggcgaatgtcagacag PDA1 23 Gevo-660 143 ttttCTCGAGactagtATGgcaactttaaaaacaactgataagaagg Gevo-661 144 ttttagatctTTAATCCCTAGAGGCAAAACCTTGC PDB1 24 Gevo-662 145 ttttCTCGAGactagtATGgcggaagaattggaccgtgatgatg Gevo-663 146 tttGGATCCTTATTCAATTGACAAGACTTCTTTGACAG PDX1 25 Gevo-664 147 TtttCTCGAGactagtATGttacttgctgtaaagacattttcaatgcc Gevo-665 148 ttttggatccTCAAAATGATTCTAACTCCCTTACGTAATC LAT1 26 Gevo-656 139 ttttCTCGAGgctagcATGGCATCGTACCCAGAGCACACCAT TATTGG Gevo-657 140 ttttGGATCCTCACAATAGCATTTCCAAAGGATTTTCAAT LPD1 27 Gevo-658 141 ttttCTCGAGactagtATGGTCATCATCGGTGGTGGCCCTGC TGG Gevo-659 142 ttttGGATCCTCAACAATGAATAGCTTTATCATAGG PDC1 28 Gevo-639 129 ttttctcgagactagtATGTCTGAAATTACTTTGGG Gevo-640 130 ttttggatccTTATTGCTTAGCGTTGGTAGCAGCAG CUP1 prom 178 Gevo-637 127 ttttGAGCTCgccgatcccattaccgacatttggg Gevo-638 128 aaaGTCGACaccgatatacctgtatgtgtcaccaccaatgtatctataagtatc catGCTAGCCCTAGGtttatgtgatgattgattgattgattg pflA 36 PflA_forw 98 cattgaattcatgtcagttattggtcgcattcac PflA_Rev 99 cattgtcgacttagaacattaccttatgaccgtactg pflB 37 PflB_forw 100 cattgaattcatgtccgagcttaatgaaaagttagcc PflB_Rev 101 cattgtcgacttacatagattgagtgaaggtacgag Cb- FDH1 38 fdh1_forw 102 cattgaattcatgaagatcgttttagtcttatatggtgc fdh1_rev 103 cattgtcgacttatttcttatcgtgtttaccgtaagc KIALD6 39 KIALD6_rig ht3 104 gttaggatccttaatccaacttgatcctgacggccttg KIALD6_Lef t5 105 ccaagtcgacatgtcctctacaattgctgagaaattgaacctc KIACS1 40 KIACS1_Ri ght3 106 gttagcggccgcttataatttcacggaatcgatcaagtgc KIACS1_Lef t5 107 ccaagctagcatgtctcctgctgttgataccgcttcc KIACS2 41 KIACS2_rig ht3 108 ggttggatccttatttcttctgctgactgaaaaattgattttctactgc KIACS2_Lef t5 109 ccaagaattcatgtcgtcggataaattgcataagg ACS1 30 Gevo-479 112 catgccgtcgacatgtcgccctctgccgtac Gevo-480 113 gattaagcggccgcttacaacttgaccgaatcaattag ACS2 31 Gevo-483 114 gatgaagtcgacatgacaatcaaggaacataaagtag Gevo-484 115 gttaaaggatccttatttctttttttgagagaaaaattg ALD6 29 Gevo-643 133 ccaagtcgacatgactaagctacactttgacac Gevo-644 134 gtcggtaagagtgttgctgtggactcg Ca-ter 179 Gevo-345 183 atgtttgtcgacatgatagtaaaagcaaagtttgta Gevo-346 184 cttaatgcggccgcttaaggttctaattttcttaataattc Ah-ter 180 Gevo-343 185 Gcttgagtcgacatgatcattaaaccgaaagttcg
基因 基因 SEQ ID NO: 引物名称 SEQ ID NO: 引物序列 Gevo-344 186 atttaaggatcctcacagttcgacaacatcaaattta Eg-ter 181 Gevo-347 187 catcacgtcgacatggccatgttcaccactac Gevo-348 188 ctcgcgggatccttactgctgagctgcgctc Sc-ccr 182 Gevo-341 189 gtcttagtcgacatgaccgtgaaagacattctg Gevo-342 190 attggcggatcctcacacattacggaaacggtta
表2列举了一组质粒构建体及其有关特征,正如实施例中所描述的。表中包括有关质粒名称(pGV);存在的原养型标志,其对于质粒在适宜的营养缺陷型菌种中的选择和维持是有用的;启动子序列(来自给定酿酒酵母基因区域);前述启动子控制下的基因;另外的启动子+基因组合,如果存在的话。
表2:实施例中的质粒的有关特征的汇总表
名称 原养型标志 启动子 1 基因 1 启动子 2 基因 2 pGV1099 HIS3 TEF1 (AU1 tag) pGV1100 TRP1 TEF1 (HA tag) pGV1101 LEU2 TEF1 (AU1 tag) pGV1102 URA3 TEF1 (HA tag) pGV1103 HIS3 TDH3 (myc tag) pGV1104 TRP1 TDH3 (myc tag) pGV1105 LEU2 TDH3 (myc tag) pGV1106 URA3 TDH3 (myc tag) pGV1208 TRP1 TEF1 Ca-hbd-co pGV1209 LEU2 TEF1 Ca-crt-co pGV1213 URA3 TEF1 Ca-adhE2-co pGV1214 HIS3 TDH3 Me-bcd-co pGV1217 TRP1 TEF1 Ca-hbd-co TDH3 Ca-eftA-co pGV1218 LEU2 TEF1 Ca-crt-co TDH3 Ca-eftB-co pGV1219 HIS3 TEF1 ScERG10 TDH3 Me-bcd-co pGV1220 HIS3 TEF1 Ca-thl-co TDH3 Ca-bcd-co pGV1221 TRP1 TEF1 Ca-hbd-co TDH3 Me-eftA-co pGV1222 LEU2 TEF1 Ca-crt-co TDH3 Me-eftB-co pGV1223 HIS3 TEF1 ScERG10 TDH3 Ca-bcd-co pGV1224 HIS3 TEF1 Ca-thl-co TDH3 Me-bcd-co pGV1225 HIS3 TEF1 Ca-thl-co TDH3 Ca-ter pGV1226 HIS3 TEF1 Ca-thl-co TDH3 Ah-ter
名称 原养型标志 启动子 1 基因 1 启动子 2 基因 2 pGV1227 HIS3 TEF1 Ca-thl-co TDH3 Eg-ter pGV1228 HIS3 TEF1 Ca-thl-co TDH3 Sc-ccr pGV1262 LEU2 TEF1 ScACS1 pGV1263 URA3 TEF1 ScACS2 pGV1319 URA3 TDH3 Ca-AdhE2_co TEF1 ACS1 pGV1320 URA3 TDH3 Ca-AdhE2_co TEF1 ACS2 pGV1321 LEU2 TDH3 ALD6 pGV1326 LEU2 TEF1 ALD6 pGV1334 HIS3 TDH3 /pdA pGV1339 LEU2 TEF1 Ca_Crt_co TDH3 ALD6 pGV1379 HIS3 TDH3 aceE pGV1380 HIS3 TDH3 aceF pGV1381 HIS3 TDH3 LAT1 pGV1383 HIS3 TDH3 PDA1 pGV1384 HIS3 TDH3 PDB1 pGV1385 HIS3 TDH3 PDX1 pGV1388 URA3 CUP1 n/a pGV1389 URA3 TDH3 PDC1 pGV1399 LEU2 TEF1 Ca-hbd-co TDH3 ALD6 pGV1414 URA3 MET3 n/a pGV1428 HIS3 TDH3 n/a pGV1429 TRP1 TDH3 n/a pGV1430 LEU2 TDH3 n/a pGV1483 URA3 MEt3 n/a pGV1603 TRP1 TDH3 aceE pGV1604 LEU2 TDH3 aceF pGV1605 URA3 TEF1 adhE2 TDH3 PDC1 1102Fdh1 URA3 TEF1 Cb-FDH1 1103PflA HIS3 TDH3 pflA 1104PflB TRP1 TDH3 pflB 1208_PflA TRP1 TEF1 Ca_hbd_co TDH3 pflA 1208KI HIS3 TEF1 Ca_hbd_co 1208KIALD6 HIS3 TEF1 Ca_hbd_co TDH3 KIALD6 1208KIPflA HIS3 TEF1 Ca_hbd_co TDH3 pflA 1208KIPflA TRP1 TEF1 Ca_Crt_co TDH3 pflB 1208-IpdA TRP1 TEF1 thl TDH3 -IpdA 1209_PflB LEU2 TEF1 Ca_Crt_co TDH3 pflB 1209-aceE LEU2 TEF1 crt TDH3 aceE 1209KI TRP1 TEF1 Ca_Crt_co
名称 原养型标志 启动子 1 基因 1 启动子 2 基因 2 1209kIACS1 LEU2 TEF1 Ca_Crt_co TDH3 KIACS1 1209kIACS2 LEU2 TEF1 Ca_Crt_co TDH3 KIACS2 1213_Fdh1 URA3 TDH3 Ca_AdhE2_co TEF1 Cb-FDH1 1213-aceF URA3 TEF1 adhE2 TDH3 aceF 1213KI URA3 TDH3 Ca_AdhE2_co 1213KIPflA LEU2 TEF1 Ca_thl_co TDH3 Cb-FDH1 1227KI LEU2 TEF1 Ca_thl_co TDH3 Eg-TER-co 1388-PDC1 URA3 CUP1 PDC1 1428_PflA HIS3 TDH3 pflA 1428ALD6 HIS3 TDH3 KIALD6 1428-IpdA HIS3 TDH3 IpdA 1429_PflB TRP1 TDH3 pflB 1429-aceE TRP1 TDH3 aceE 1429ACS1 TRP1 TDH3 KIACS1 1430_Fdh1 LEU2 TDH3 Cb-FDH1 1430-aceF LEU2 TDH3 aceF 1431ACS2 URA3 TDH3 KIACS2 pGV1103- Ipd1 HIS3 TDH3 LPD1
表3描述了携带各种质粒并由此表达一组所导入的基因(如列举的)的酵母酿酒(菌株W303a)酵母中所生成的丁醇
表3:酿酒酵母转化体的丁醇生成
隔离群名称 质粒组合 所导入的基因 丁醇量 72h p.i(μM) Gevo 1094; Gevo 1095 pGV1208; pGV1209; pGV1225; pGV1213 Ca-hbd-co;Ca-Crt-co; Ca-thl-co+Ca-ter;Ca- adhE2-co 129;145 Gevo 1096; Gevo 1097 pGV1208; pGV1209; pGV1226; pGV1213 Ca-hbd;Ca-Crt;Ca-thl- co+Ah-ter;Ca-adhE2- co 207;216 Gevo 1098; Gevo 1099 pGV1208; pGV1209; pGV1227; pGV1213 Ca-hbd;Ca-Crt;Ca-thl- co+Eg-ter;Ca-adhE2- co 251;313 Gevo 1100, Gevo 1101 pGV1208; pGV1209; Ca-hbd;Ca-Crt;Ca-thl- co+Sc-ter;Ca-adhE2- 109;109
所有基因克隆和组合规程最初是使用已建立的方法(Miller,J.H.,1992;Sambrook,J.等,2001)在大肠杆菌中实施的。
对于在酵母酿酒酵母中的表达有用的一组载体先前已有记载(Mumberg,D.等(1995)Gene 156:119-122;Sikorski和Heiter(1989)Genetics 122:19-27)。具体而言,这些出版物记载了一组选择标志(HIS3、LEU2、TRP1、URA3)和酿酒酵母复制起点,它们在表2中所列举的许多载体中也有使用。
实施例1:用于在酵母酿酒酵母中表达丁醇途径基因的质粒构建
使用刚好在起始密码子上游引入SalI位点和刚好在终止密码子之后引入BamHI位点的引物,通过PCR自来自酿酒酵母菌株W303a的基因组DNA克隆了酿酒酵母硫解酶基因ERG10。将此PCR产物用SalI和BamHI消化并克隆入pUC19(Yanisch-Perron,C,Vieira,J.,1985,Gene,33,103-19)的相同位点以生成pGV1120。
分别使用质粒pGV1031、pGV1037、pGV1094、和pGV1095作为PCR扩增丙酮丁醇梭菌基因(Ca-)Ca-thl、Ca-hbd、Ca-crt、和Ca-bdhB的模板。使用pGV1090作为PCR扩增Ca-bcd、Ca-etfA、和Ca-etfB的模板。使用梭菌ATCC824的基因组DNA来扩增Ca-bdhA。将扩增片段用SalI和BamHI消化并克隆入pUC19的相同位点。此方案生成质粒pGV1121、pGV1122、pGV1123、pGV1124、pGV1125、pGV1126、pGV1127、pGV1128,它们分别含有基因Ca-thl、Ca-hbd、Ca-crt、Ca-bcd、Ca-etfA、Ca-etfB、Ca-bdhA、和Ca-bdhB。
使用设计成刚好在起始密码子上游引入SalI位点和刚好在终止密码子下游引入BamHI位点的引物,通过PCR扩增拜氏梭菌(Cb-)基因Cb-hbd、Cb-crt、Cb-bcd、Cb-etfA、Cb-etfB、Cb-aldh、和Cb-adhA。分别使用质粒pGV1050、pGV1049、pGV1096和pGV1091作为PCR扩增Cb-hbd、Cb-crt、Cb-aldh、和Cb-adhA的模板。使用拜氏梭菌ATCC 51743的基因组DNA作为Cb-bcd、Cb-etfA、和Cb-etfB的模板。将PCR扩增片段用SalI和BamHI消化并克隆入pUC19的相同位点。此规程生成质粒pGV1129、pGV1130、pGV1131、pGV1132、pGV1133、pGV1134、和pGV1135,它们分别含有基因Cb-hbd、Cb-crt、Cb-bcd、Cb-etfA、Cb-etfB、Cb-aldh、和Cb-adhA。
还克隆了为在大肠杆菌中表达进行过密码子优化的(-co)丙酮丁醇梭菌和埃氏巨球形菌(Me-)基因。这些基因包括Ca-thl-co、Ca-hbd-co、Ca-crt-co、Ca-bcd-co、Ca-etfA-co、Ca-etfB-co、Ca-adhE2-co、Me-bcd-co、Me-etfA-co、和Me-etfB-co。使用设计成刚好在起始密码子的上游引入SalI位点和刚好在终止密码子下游引入BamHI位点的引物,扩增除了Ca-thl-co和Me-etfB-co以外的这些基因。在Ca-thl-co和Me-etfB-co的情况中,引物设计成刚好在起始密码子的上游引入EcoRI位点和刚好在终止密码子的下游引入BamHI位点。将所得PCR产物用适宜的限制酶消化(SalI和BamHI或EcoRI和BamHI)并克隆入pUC19的相同位点以生成质粒pGV1197、pGV1198、pGV1199、pGV1200、pGV1201、pGV1202、pGV1203、pGV1205、pGV1206,它们分别含有基因Ca-thl-co、Ca-hbd-co、Ca-crt-co、Ca-bcd-co、Ca-etfA-co、Ca-etfB-co、Ca-adhE2-co、Me-etfA-co、和Me-etfB-co。将Me-bcd-co基因作为SalI-BamHI片段直接克隆入pGV1103中以生成pGV1214。
将上述基因克隆入高拷贝酵母表达载体pGV1099、pGV1100、pGV1101、pGV1102、pGV1103、pGV1104、pGV1105和pGV1106。表2中描述了用于基因克隆的载体和所得质粒构建体的特性。
使用SalI和BamHI分别自pGV1120和pGV1121释放硫解酶基因ERG10和Ca-thl并克隆入pGV1099(携带HIS3标志)以生成pGV1138和pGV1139。使用EcoRI和BamHI自pGV1197取出经过密码子优化的硫解酶基因Ca-thl-co并克隆入pGV1099以生成pGV1207。如此,这些基因克隆成符合两个拷贝的AU1标签(SEQ ID NO:172)的读码框并使用酿酒酵母TEF1启动子区(SEQ IDNO:175)表达。使用SalI和BamHI分别将羟丁酰-CoA-脱氢酶基因Ca-hbd(来自pGV1122)、Cb-hbd(来自pGV1129)、和Ca-hbd-co(来自pGV1198)克隆入pGV1100(携带LEU2标志)以生成pGV1140、pGV1141、和pGV1208。这导致这些基因克隆成符合HA标签(SEQ ID NO:173)的读码框并使用TEF1启动子表达。使用SalI和BamHI分别将巴豆酸酶基因Ca-crt(来自pGV1123)、Cb-crt(来自pGV1130)、Ca-crt-co(来自pGV1199)克隆入pGV1101(携带TRP1标志物)以生成pGV1142、pGV1143、和pGV1209。如此,这些基因克隆成符合两个拷贝的AU1标签的读码框并使用TEF1启动子表达。
将丁酰-CoA脱氢酶和相应的电子传递基因etfA和etfB克隆到myc标签(SEQ ID NO:174)后面,使用来自酿酒酵母的TDH3启动子区(SEQ ID NO:176)表达。将Ca-bcd(来自pGV1124)、Cb-bcd(来自pGV1131)、Ca-bcd-co(来自pGV1200)和Me-bcd-co基因克隆入pGV1103(携带HIS3标志)以生成pGV1144、pGV1145、pGV1210、和pGV1214。分别将Ca-etfA(来自pGV1125)、Ca-etfB(来自pGV1126)、Cb-etfA(来自pGV1132)、Cb-etfB(来自pGV1133)、Ca-etfB-co(来自pGV1202)、和Me-etfA-co(来自pGV1205)基因克隆入pGV1104(携带LEU2标志)以生成pGV1146、pGV1147、pGV1148、pGV1149、pGV1212、和pGV1215。分别将Ca-etfA-co(来自pGV1201)和Me-etfB-co(来自pGV1206)克隆入pGV1104(携带TRP1标志)以生成pGV1211和pGV1216。
将醛脱氢酶基因Cb-aldh(来自pGV1134)克隆入pGV1102(携带URA3标志)以生成pGV1150。将Cb-aldh基因放置成符合HA标签(SEQ ID NO:173)的读码框,使用TEF1启动子表达。将双功能醛/醇脱氢酶Ca-aad、Ca-adhE2、和Ca-adhE2-co及特定醇脱氢酶Ca-bdhA、Ca-bdhB、和Cb-adhA克隆到myc标签后面,在TDH3启动子控制下表达。使用设计成刚好在起始密码子上游引入SalI位点和刚好在终止密码子下游引入NotI位点的引物,通过PCR扩增Ca-aad和Ca-adhE2。使用质粒pGV1089作为Ca-aad的模板,而使用丙酮丁醇梭菌基因组DNA作为Ca-adhE2的模板。使用SalI和NotI将这些PCR产物克隆入pGV1106(携带URA3标志)以生成pGV1136(Ca-aad)和pGV1137(Ca-adhE2)。使用SalI和BamHI将经过密码子优化的Ca-adhE2-co(来自pGV1203)克隆入pGV1106以生成pGV1213。使用SalI和BamHI分别将醇脱氢酶Ca-bdhA(来自pGV1127)、Ca-bdhB(来自pGV1128)、和Cb-adhA(来自pGV1135)克隆入pGV1106以生成pGV1151、pGV1152、和pGV1153。
因此,将丁酰-coA脱氢酶、电子传递蛋白A、电子传递蛋白B、和特定醇脱氢酶的上文所述酵母表达基因与TEF1启动子驱动的硫解酶、羟丁酰-CoA脱氢酶、巴豆酸酶、或醛脱氢酶以成对方式组合,如表2中所汇总的。
为此目的,分别将来自pGV1144(TDH3启动子和Ca-bcd)和来自pGV1145(TDH3启动子和Cb-bcd)的EcoICRI至XhoI片段克隆入pGV1138的NotI(用Klenow填平)至XhoI位点以生成pGV1167(ERG10+Ca-bcd)和pGV1168(ERG10+Cb-bcd)。还分别将这些相同的EcoICRI至XhoI片段类似地克隆入pGV1139以生成pGV1169(Ca-thl+Ca-bcd)和pGV1170(Ca-thl+Cb-bcd)。使用相同的策略,分别将来自pGV1146(TDH3启动子和Ca-etfA)、pGV1148(TDH3启动子和Ca-etfB)、pGV1147(TDH3启动子和Cb-etfA)、和pGV1149(TDH3启动子和Cb-etfB)的EcoICRI至XhoI片段克隆入pGV1140、pGV1141、pGV1142、pGV1143的NotI(用Klenow填平)至XhoI位点以生成pGV1171(Ca-hbd+Ca-etfA)、pGV1172(Ca-crt+Ca-etfB)、pGV1173(Cb-hbd+Cb-etfA)、和pGV1174(Cb-crt+Cb-etfB)。类似地通过分别将来自pGV1151(TDH3启动子和Ca-bdhA)、pGV1152(TDH3启动子和Ca-bdhB)和pGV1153(TDH3启动子和Cb-adhA)的EcoICRI至XhoI片段克隆入pGV1150的(用Klenow填平)至XhoI位点以生成pGV1175(Cb-aldh+Ca-bdhA)、pGV1176(Cb-aldh+Ca-bdhB)、和pGV1177(Cb-aldh+Cb-adhA),将醛脱氢酶和醇脱氢酶组合。
在经过密码子优化的基因的情况中,分别将来自pGV1210(TDH3启动子和Ca-bcd-co)、pGV1211(TDH3启动子和Ca-etfA-co)、pGV1212(TDH3启动子和Ca-etfB-co)的EcoICRI至XhoI片段克隆入pGV1207、pGV1208、和pGV1209的BamHI(用Klenow补平)至XhoI位点以生成pGV 1220(Ca-thl-co+Ca-bcd-co)、pGV1217(Ca-hbd-co+Ca-etfA-co)、和pGV1218(Ca-crt-co+Ca-etfB-co)。分别将来自pGV1214(TDH3启动子和Me-bcd-co)、pGV1215(TDH3启动子和Me-etfA-co)、pGV1216(TDH3启动子和Me-etfB-co)的EcoICRI至XhoI片段克隆入同一组载体以生成pGV1224(Ca-thl-co+Me-bcd-co)、pGV 1221(Ca-hbd-co+Me-etfA-co)、和pGV1222(Ca-crt-co+Me-etfB-co)。另外,将来自pGV1210(TDH3启动子和Ca-bcd-co)和来自pGV1214(TDH3启动子和Me-bcd-co)的EcoICRI至XhoI片段克隆入pGV1138的BamHI(用Klenow补平)至XhoI位点以生成pGV1223(ERG10+Ca-bcd-co)和pGV1219(ERG10+Me-bcd-co)。
在上述途径之外,生成了利用bcd/etfA/etfB复合物的替代物,即反式-烯酰还原酶和巴豆酰-CoA还原酶的构建体。自丙酮丁醇梭菌(Ca-ter)、嗜水气单胞菌(Ah-ter)、和纤细眼虫(Eg-ter)克隆了反式-烯酰还原酶基因,而且自山丘链霉菌(Streptomyces collinus)(Sc-ccr)克隆了巴豆酰-coA还原酶。使用设计成刚好在起始密码子上游引入SalI位点和刚好在终止密码子下游引入NotI位点的引物,自丙酮丁醇梭菌基因组DNA PCR扩增了Ca-fer。使用设计成刚好在起始密码子的上游引入SalI位点和刚好在终止密码子的下游引入BamHI位点的引物,分别自pGV1114、pGV1115、和pGV1166PCR扩增了Ah-ter、Eg-ter、和Sc-ccr。这三种基因的序列已经为大肠杆菌中的表达进行了密码子优化。还有,Eg-ter序列编码缺失可能牵涉线粒体定位的N-末端区域的蛋白质。使用适宜的限制酶将相应的PCR产物克隆入pGV1103以生成pGV1155(Ca-ter)、pGV1156(Ah-ter)、pGV1157(Eg-ter)和pGV1158(Sc-ccr)。
为了用于在酵母中表达丁醇途径,将bcd/etfA/etfB复合物的这些替代物中每一种与硫解酶基因在一个质粒上组合。将Ca-ter、Ah-ter、Eg-ter和Sc-ccr基因与Ca-thl-co基因组合,通过分别将来自pGV1155、pGV1156、pGV1157和pGV1158的EcoICRI至XhoI片段克隆入pGV1207的BamHI(用Klenow补平)至XhoI位点以生成pGV1225(Ca-thl-co+Ca-ter)、pGV 1226(Ca-thl-co+Ah-ter)、pGV1227(Ca-thl-co+Eg-ter)和pGV1228(Ca-thl-co+Sc-ccr)。
实施例2:酵母提取物/Western印迹分析
为了分析蛋白质表达,通过快速TCA沉淀方案制备粗制酵母蛋白质提取物。收集1个OD600当量的细胞并在冰上用200μL 1.85N NaOH/7.4%2-巯基乙醇处理10分钟。添加200μL 50%TCA并将样品在冰上再温育10分钟。通过以25,000rcf离心2分钟来收集所沉淀的蛋白质并用1ml冰冷的丙酮清洗。再次通过以25,000rcf离心2分钟来收集蛋白质。然后将沉淀物重悬于SDS样品缓冲液并煮沸(99℃)10分钟。将样品在离心机中以最大速离心30秒以清除不溶物。
将样品通过SDS-PAGE分开并转移至硝酸纤维素。使用TMB Western印迹试剂盒(KPL)进行Western分析。HA.11、myc(9E10)、和AU1抗体得自Covance。如制造商所述的那样实施Westerns,只是在使用myc抗体时,使用补充有1%检测块粉(detector block powder)的0.3x至0.5x检测块溶液(detectorblock solution)。利用这种方法检验了实施例1中所描述的所有基因的表达。
实施例3:酵母转化
使用乙酸锂法(Gietz,R.D.a.R.A.W.,2002,Methods in Enzymology,350,87-96)进行了酿酒酵母(W303a)转化。简言之,将1ml过夜酵母培养物稀释入50mL新鲜YPD培养基并在30℃摇床中温育5-6小时。收集细胞,用50mL无菌水清洗,再用25mL无菌水清洗。用1mL 100mM乙酸锂重悬细胞并转移至微量离心管。通过离心10秒来沉淀细胞。丢弃上清液并将细胞重悬于4倍体积的100mM乙酸锂。将15μL细胞添加至DNA混合物(72μL 50%PEG、10μL 1M乙酸锂、3uL 10mg/ml变性鲑鱼精DNA、2μL每种期望的质粒DNA和无菌水至总体积100μL)。将样品于30℃温育30分钟并于42℃热激22分钟。然后通过离心10秒来收集细胞,重悬于100μL SOS培养基(Sambrook,J.,Fritsch,E.F.,Maniatis,T.,1989),并在不含尿嘧啶、色氨酸、亮氨酸或组氨酸的适宜SC选择板(Kaiser C,M.,S.和Mitchel,A,1994)上涂布。
实施例4:正丁醇的生成
对表达与所建议的丁醇生成途径有关的酶的不同组合的转化体(上文表1)评估正丁醇生成。如下制备隔离群的预培养物,即将来自SC琼脂板的少数菌落接种入3ml SC培养基(Kaiser C,M.,S.和Mitchel,A,1994),在需氧条件下于30℃以250rpm摇动16小时。将所得细胞以4000xg沉淀5分钟并重悬于500μlSC培养基。通过合适稀释度的600nm吸光度来评估细胞生长。对于所测试的每一种隔离群,将产生15个OD的细胞注射(200μl)入装有5ml先前已经用N2气饱和以消除溶解氧的SC厌氧培养基的厌氧balch管。将管于30℃温育,以250rpm摇动来防止细胞沉降。
在接种后10、26、44和70小时对管取样,即用无菌注射器取出500μl培养物。之后,将250μl 40%葡萄糖溶液注射入每一个管以维持培养基中适量的碳。在每一个时间点,将所回收的样品离心以沉淀细胞,并立即冷冻上清液直至收集了所有样品。
通过气相层析(GC)分析测定转化体的正丁醇生成。将所有冷冻样品于室温融化并将400μl每一种样品及作为内部对照添加的80μl 10mM戊醇通过0.2μm滤器过滤。将200μl所得滤出液置于GC管形瓶中并进行GC分析。在配备有HP-7673自动取样系统的带火焰离子化检测仪(FID)的系列II Plus气相层析仪上运行样品。基于可信标准品的保留时间来鉴定分析物,并使用5点校准曲线来定量。以1μl体积注射所有样品。在连接FID检测仪的DB-FFAP毛细管柱(30m长度,0.32mm ID,0.25μm薄膜厚度)上实施正丁醇产物的直接分析。用于将醇产物分开的温度程序为225℃注射器,225℃检测仪,50℃烤箱0分钟、然后8℃/分钟梯度至80℃、13℃/分钟梯度至170℃、50℃/分钟梯度至220℃、然后220℃3分钟。
为了评估丁醇生成,测试了每一种质粒组合的两个独立转化体。上文表3总结了结果。“隔离群名称”下的两个Gevo名称指为每一种质粒组合所评估的两个独立转化体。
下文(图6)显示了相对于仅用空载体即Gevo1110和Gevo1111转化的隔离群,最好的两种生产者即转化体Gevo1099和Gevo1102随时间变化所生成的丁醇量。Gevo1099和Gevo1102展现出丁醇生成随时间的升高,在接种后24-72小时丁醇浓度分别自123μM升高至313μM和自57μM升高至317μM。
实施例5:大肠杆菌丙酮酸脱氢酶亚基在酿酒酵母中的克隆和表达
此实施例的目的是描述如何自一起包含在大肠杆菌中找到的丙酮酸脱氢酶(PDH)的三种亚基的大肠杆菌克隆aceE、aceF、和lpdA基因。使用PCR自基因组DNA扩增这三种基因。此实施例还例示了这三种基因的蛋白质产物如何在宿主生物体即酿酒酵母中表达。
使用大肠杆菌基因组DNA作为模板,通过PCR扩增来自大肠杆菌的lpdA基因。为了特异性扩增lpdA,使用引物Gevo-610和Gevo-611;制造商的试剂盒中供应了其它PCR扩增试剂,例如,KOD热启动聚合酶(Novagen,Inc.,产品目录#71086-5),并依照制造商的方案来使用。正向和反向引物分别掺入编码SalI和XhoI限制性内切核酸酶位点的核苷酸。将所得PCR产物用SalI和XhoI消化并克隆入pGV1103,产生pGV1334。对所插入的lpdA DNA完整测序。
使用与上文所述类似的办法,将来自大肠杆菌的aceE和aceF基因插入pGV1334。使用引物Gevo-606和Gevo-607自大肠杆菌基因组DNA扩增aceE基因,用SalI+XhoI消化,并克隆入经SalI+XhoI切割的载体pGV1334,产生pGV1379。对aceE插入物完整测序。为了获得具有适合于酿酒酵母表达的不同原养型选择标志的质粒,作为SalI+XhoI片段自pGV1379克隆出aceE插入物并克隆入经SalI+XhoI切割的pGV1104,产生pGV1603。
使用引物Gevo-653和Gevo-609自大肠杆菌基因组DNA扩增aceF基因。将所得1.9kb产物用SalI+XhoI消化并克隆入经相同酶切割的载体pGV1334,产生pGV1380。对aceF插入物完整测序。为了获得具有适合于酿酒酵母表达的不同选择标志的质粒,自pGV1380克隆出aceF插入物并克隆入pGV1105,产生pGV1604。
为了在酿酒酵母中表达这些蛋白质,用pGV1334、pGV1603、和pGV1604的任意组合转化酿酒酵母菌株Gevo1187(CEN.PK),并在适宜淘汰培养基(dropout media)上选择转化体,正如实施例3中所描述的。作为对照,用相应的空载体即pGV1103、pGV1104、和pGV1105分别转化细胞。如下对自转化体培养得到的培养物测定LpdA、AceE、或AceF表达,即制备粗制酵母蛋白质提取物并通过Western印迹分析它们(基于检测每一种蛋白质中所存在的Myc表位),正如实施例2中所描述的。
实施例6:自基因组DNA克隆酿酒酵母PDH亚基,消除内源线粒体靶向序列的修饰,和它们在酿酒酵母细胞中的表达
在大多数真核生物中,丙酮酸脱氢酶(PDH)复合物定位在线粒体内部。凭借它们在它们的N-末端区域中含有通常称作线粒体靶向序列的20-40个左右的氨基酸,包含PDH的各种蛋白质被引向进入线粒体。这样的序列的存在可通过实验或计算(例如通过程序MitoProt:http://mips.qsf.de/cqi-bin/proi/medqen/mitofilter)来测定。蛋白质成功输入线粒体后发生特异性蛋白水解切割,靶向序列被消除,导致“经过切割的”输入形式。众所周知,通过遗传改变蛋白质的编码序列自该蛋白质消除这样的序列引起该蛋白质变得不能够移行入线粒体。如此,一种用于将正常情况中在线粒体中的蛋白质改向进入胞质溶胶的诱人策略牵涉只表达编码蛋白质在线粒体输入和后续蛋白酶切割之后剩余的“经过切割的”部分的那部分基因。
此实施例的目的是描述构成酿酒酵母丙酮酸脱氢酶复合物的数种基因的克隆,及这些基因在酿酒酵母细胞培养物中的表达和检测。
通过PCR克隆编码PDH各亚基的数种基因,其基本上使用实施例5中所描述的规程,只是模板是酿酒酵母基因组DNA。表1中显示了要扩增的酿酒酵母基因和所使用的相应引物。
为了生成编码预测定位在胞质溶胶中的蛋白质的基因,每一对引物(表1中所列举的)中所列举的第一种引物设计成扩增每一种基因中预测编码线粒体靶向序列的那部分下游的区域。使用用于扩增每一种基因的引物中所编码的独特限制酶位点,将所得PCR产物克隆入载体pGV1103,产生表2中所列举的质粒。对每一种插入物完整测序。为了测试每一种基因的表达,仅用pGV1381、pGV1383、pGV1384、或pGV1385中每一种转化酿酒酵母菌株Gevo1187(CEN.PK),其基本上遵循实施例3中所描述的规程,并在SC-his限定的淘汰培养基上选择HIS+菌落。通过溶胞物制备和和Western印迹(用以检测每一种蛋白质中所存在的Myc标签)来测定蛋白质表达,正如实施例2中所描述的。
实施例7:酿酒酵母亚基LPD1的克隆和表达及其在酿酒酵母细胞中的表达
此实施例描述了如何通过PCR自酿酒酵母基因组DNA克隆基因LPD1,及如何检测LPD1在宿主酿酒酵母细胞中的表达。
在PCR反应中使用引物Gevo-658加Gevo-659扩增缺乏那些预测编码线粒体靶向序列的核苷酸的Lpd1可读框,基本上如实施例5中所描述的。将1.5kb产物用XhoI+BamHI消化并克隆入经相同限制酶切割的pGV1103。将所得克隆pGV1103-1pd1转化入Gevo1187并通过HIS+原养型来选择所得菌落,基本上如实施例3中所描述的。培养含有pGV1103-1pd1的细胞的培养物并如下检测LPD1表达,即收获细胞,接着是Western印迹(针对蛋白质上所存在的Myc标签),基本上如实施例2中所描述的。
实施例8:大肠杆菌PDH亚基的克隆及其在乳酸克鲁维酵母中的表达
某些酵母,尤其是那些已知是“Crabtree阴性”,提供了作为生产宿主的独特优点。与在需氧条件下将过量葡萄糖发酵成乙醇的Crabtree阳性菌株(例如酿酒酵母)不同,Crabtree阴性菌株(诸如克鲁维酵母属的那些)取而代之地会经TCA循环来代谢葡萄糖以生成生物质。因此,Crabtree阴性酵母耐受所谓的葡萄糖异化PDH旁路路径的灭活(例如通过删除KIPDC1基因)(在需氧生长期间)。
以下实施例描述了如何将编码大肠杆菌PDH的三种亚基的基因克隆入适合于在酵母乳酸克鲁维酵母中表达的载体,以及还有如何检测那些基因的表达。
如实施例5中所述PCR扩增大肠杆菌基因lpdA、aceE、和aceF。将所得PCR产物用SalI+XhoI消化并分别克隆入均经SalI+XhoI切割的载体pGV1428、pGV1429、和pGV1430。这些步骤产生了质粒pGV1428-lpdA、pGV1429-aceE、和pGV1430-aceF。对每一种插入物完整测序。依照已知方法(例如Kooistra R,Hooykaas PJ,Steensma HY.(2004)Yeast.15;21(9):781-92)用这些质粒之一或任意组合转化乳酸克鲁维酵母菌种(例如Gevo1287),并通过适宜的原养型来选择所得菌落。如实施例2中所述使用粗制酵母蛋白质提取物和Western印迹分析(基于检测每一种蛋白质中所存在的Myc表位)对自转化体培养得到的培养物测定LpdA、AceE、或AceF表达。
实施例9:过表达PDH亚基的细胞中PDH活性的测量
此实施例的目的是描述如何通过体外测定法的手段来测量PDH活性。
文献中记载了对细胞溶胞物中PDH活性定量的方法(Wenzel TJ等(1992).Eur J Biochem 209(2):697-705)。此方法利用自富含线粒体的细胞级分衍生的溶胞物。此方法的一个不同实施方案利用自全细胞获得的细胞溶胞物作为PDH来源。此类溶胞物是如先前(实施例2)所述制备的。此测定方法的另一个实施方案使用自高度富含胞质(非线粒体)蛋白质的细胞级分衍生的细胞溶胞物。此生物化学分级会降低内源线粒体PDH在测定法中的贡献。制备此类富集溶胞物的方法是商品化的且本领域技术人员公知的(例如线粒体/胞质溶胶分级试剂盒,Bio Vision,Inc.,Mountain View,CA)。
在另一个实施方案中,借助一种或多种表达质粒中所编码的Myc表位标签的存在自细胞免疫纯化PDH活性。免疫纯化带表位标签的蛋白质的方法是本领域技术人员公知的(例如Harlow和Lane,Antibodies:A Laboratory Manual,(1988)CSHL Press)。经过免疫纯化的PDH复合物如此有别于内源复合物并充当前述PDH体外测定法中的活性来源。
实施例10:过表达PDH的细胞中增加的胞内乙酰-CoA的测量
此实施例的目的是描述如何能在一群培养的酵母细胞中测量乙酰-CoA(即PDH的产物)的胞内水平。
为了测量胞内乙酰-CoA,对那些携带表达整套PHD基因所必需的适宜质粒组合(例如pGV1334、pGV1603、和pGV1604)的酵母转化体评估细胞乙酰-CoA水平,与只含载体的对照转化体(例如pGV1103、pGV1104、和pGV1105)进行比较。在摇瓶中在适当限定的淘汰培养基(例如SC-His、-Leu、-Trp)中将酵母细胞培养至饱和。测定培养物的光密度(OD600)并通过以2800xg离心5分钟来沉淀细胞。使用珠式破碎仪(bead beater)裂解细胞并将溶胞物用于使用已建立方法(Zhang等,Connection of Propionyl-CoA Metabolism to PolyketideBiosynthesis in Aspergillus nidulans.Genetics,168:785-794)进行的蛋白质测定和乙酰-CoA测定分析。
实施例11:大肠杆菌PDH亚基基因和丁醇生成途径在酿酒酵母中的共表达
此实施例的目的是描述如何在宿主酿酒酵母中与那些构成丁醇生成途径的基因一起共表达编码大肠杆菌PDH亚基的基因。与丁醇生成途径一起共表达PDH会相对于只表达丁醇途径而胞质溶胶中没有异源表达的功能性PDH提高所生成的丁醇的产率。
将所克隆的基因lpdA、aceE和aceF(见实施例5)亚克隆入丁醇途径基因质粒,具体是pGV1208、pGV1209和pGV1213(表2)。为此,将pGV1334、pGV1603和pGV1604均用限制酶EcoICRI+XhoI消化,并将所得释放的插入物连接入pGV1208、pGV1209和pGV1213,这些质粒经BamHI消化,用Klenow DNA聚合酶补平悬垂,然后经XhoI消化,所有这些操作均使用标准分子生物学方法(Sambrook,J.Fritsch,E.F.,Maniatis,T.,1989)。这些步骤分别产生了pGV1208-lpdA、pGV1209-aceE和pGV1213-aceF。将所得质粒与pGV1227一起转化入Gevo1187并选择HIS、LEU、TRP和URA原养型,所有操作基本上如实施例3中所描述的。使用经亲本质粒pGV1208加pGV1209加pVG1213加pGV1227转化的菌株作为对照,用以评估PDH共表达对丁醇生成的影响。丁醇生成是如实施例4中所述实施的。正丁醇产率大于10%。
实施例12:在厌氧条件下或在过量NADH条件下功能性的一种PDH形式的生成
此实施例的目的是描述在厌氧下有活性的,或在存在相对于正常需氧生长期间所存在的比要高的[NADH]/[NAD+]比时有活性的突变型PDH的分离。这样的突变型PDH是想要的,因为它可容许甚至在微需氧或厌氧条件下都有持续的PDH酶活性。
先前(Kim,Y.等(2007).Appl.Environm.Microbiol.,73,1766-1771;美国专利申请No.11/949,724,完整收入本文)记载了获取和鉴定允许微需氧或厌氧活性的改变型式PDH的方法。
实施例13:具有降低的丙酮酸脱羧酶活性或没有丙酮酸脱羧酶活性的酿酒酵母菌株中大肠杆菌PDH亚基基因和丁醇生成途径的共表达
此实施例的目的是描述如何在具有降低的丙酮酸脱羧酶(PDC)活性或没有丙酮酸脱羧酶(PDC)的宿主酿酒酵母菌株中与构成丁醇生成途径的基因共表达编码大肠杆菌PDH亚基的基因。PDC和PDH二者利用并因此竞争可利用的丙酮酸池。尽管PDH的产物乙酰-CoA能直接被丁醇途径所利用,但是PDC的产物乙醛能被进一步还原成乙醇(经醇脱氢酶),丁醇发酵的一种不想要的副产物,或者能经乙醛脱氢酶加乙酰-CoA合酶的协同作用被转化成乙酰-CoA。如此,降低或消除PDC活性会提高在胞质溶胶中还过表达功能性PDH的细胞中丙酮酸变成丁醇的产率。
pdc-酿酒酵母菌株的生成
文献(例如Flikweert,M.T.等,(1996).Yeast 15;12(3):247-57;Flikweert MT等,(1999).FEMS Microbiol Lett.1;174(1):73-9;van Maris AJ等,(2004)ApplEnviron Microbiol.70(1):159-66)中记载了具有降低的PDC活性或没有PDC活性的酿酒酵母菌株,而且它们是本领域技术人员公知的。在一个实施方案中,缺乏所有PDC活性的酿酒酵母菌株具有基因型pdc1Δpdc5Δpdc6Δ。此类菌株缺乏可检测到的PDC活性,而且不能够在作为唯一碳源的葡萄糖上生长,但是能在生长培养基补充有作为替代碳源的乙醇或乙酸时存活。在另一个实施方案中,此菌株的衍生物已经进化成在葡萄糖上生长,葡萄糖是方便且常用的碳源。具有大大降低的PDC活性的菌株的第三个实施方案是有关基因型pdc2Δ的菌株,在文献(Flikweert MT等,(1999).Biotechnol Bioeng.66(1):42-50)中也有记载。任何这些菌株均能充当PDH加丁醇途径表达的有用宿主。在必要时,可以通过标准分子生物学手段和酵母遗传技术来工程化改造任何pdc-突变株,使得那些营养缺陷型标志可利用,使得能选择质粒pGV1208-lpdA、pGV1209-aceE、和pGV1213-aceF并在宿主细胞中稳定维持。此类遗传工程会通过破坏有关内源基因来发生,其通过基于URA3的破坏盒,及后续通过FOA反选择来消除URA3标志来实施。
过表达PDH的pdc-菌株中的丁醇生成
将所克隆的基因lpdA、aceE和aceF(见实施例5)亚克隆入丁醇途径基因质粒,具体是pGV1208、pGV1209和pGV1213(表2),基本上如实施例11中所描述的。
将质粒组pGV1208-lpdA加pGV1209-aceE加pGV1213-aceF加pGV1227、或作为对照的组pGV1208加pGV1209加pGV1213加pGV1227转化入适宜的pdc-酵母突变株并在液体培养物中培养所得菌落。如实施例4中所述实施丁醇生成。正丁醇产率大于50%。
有可能的是,具有降低的PDC活性或没有PDC活性的菌株会展现出显著的生长缺陷,并因此可能不得不补充另外的碳源(例如乙酸或乙醇)。因为pdc-酿酒酵母中的生长缺陷源自它们胞质乙酰-CoA池的缺失,所以预期PDH在胞质溶胶中的成功表达会生成足够的乙酰-CoA来挽救此生长缺陷。此类生长恢复可充当胞质溶胶中PDH活性的有用体内读出。
实施例14:酿酒酵母中的pfl(丙酮酸甲酸裂合酶)和FDH1(甲酸脱氢酶)表达
大肠杆菌pflB(无活性的丙酮酸甲酸裂合酶)和pflA(丙酮酸甲酸裂合酶活化酶)的克隆
为了克隆大肠杆菌pflB和pflA,分别使用大肠杆菌基因组DNA和pflB_forw、PflB_rev和PflA_forw、PflA_rev引物扩增基因。为了克隆博伊丁氏假丝酵母FDH1(Cb-FDH1)基因,与fdh_forw和fdh_rev引物一起使用博伊丁氏假丝酵母的基因组DNA。利用分别掺入正向和反向基因扩增引物的限制性位点SalI和EcoRI,将所扩增的DNA连接到经SalI和EcoRI消化的pGV1103、pGV1104和pGV1102上,产生pGV1103pflA、pGV1104pflB和pGV1002fdh1。自所得质粒表达的蛋白质分别带myc、myc和HA标签。
利用所得质粒(pGV1103pflA、pGV1104pflB和pGV1002fdh1)和载体(pGV1103、pGV1104和pGV1102)来转化酵母菌株Gevo1187,如实施例3所指出的,以生成表达PflA、PflB、Fdh1(PFL+)的转化体和对照(PFL-)转化体。通过HIS、TRP和URA原养型选择来选择这两组转化体。
如实施例2中所述使用粗制酵母蛋白质提取物和Western印迹分析对所得转化体评估PflA、PflB和Cb-Fdh1表达。
对那些被证实表达所有三种蛋白质的酵母转化体评估细胞乙酰-CoA水平,与只含载体的对照转化体进行比较。为此,以摇瓶形式在Sc-ura,his,trp培养基中培养PFL+和PFL-细胞。测定培养物的光密度(OD600)并通过以2800xrcf离心5分钟来沉淀细胞。使用珠式破碎仪裂解细胞并将溶胞物用于使用已建立方法(Zhang等,Connection of Propionyl-CoA Metabolism toPolyketide Biosynthesis in Aspergillus nidulans.Genetics,168:785-794)进行的蛋白质测定和乙酰-CoA测定分析。评估每mg细胞总蛋白质的乙酰-CoA量。
为了评估PflA、PflB和Fdh1表达对正丁醇生成的影响,将pflA、pflB和Cb-FDH1亚克隆入含有pGV1208、pGV1209和pGV1213的丁醇途径基因(表1)。为此,使用标准分子生物学方法(Sambrook,J.Fritsch,E.F.,Maniatis,T.,1989),将pGV1103pflA、pGV1104pflB和pGV1002fdh1用EcoICRI+XhoI限制酶消化并连接入经BamHI(随后用Klenow补平末端)+XhoI消化的pGV1208、pGV1209和pGV1213以生成pGV1208PflA、pGV1209PflB和pGV1213Fdh1。将所得质粒与pGV1227一起转化入Gevo1187并选择His、Leu、Trp和Ura原养型。使用Gevo1110和Gevo1111作为对照隔离群(表1)。如实施例4中所述实施丁醇生成。正丁醇产率大于10%。
实施例15:具有降低的丙酮酸脱羧酶活性或没有丙酮酸脱羧酶活性的酿酒酵母中的PflA、PflB和Fdh1表达
如实施例14中所述进行大肠杆菌pflB(无活性的丙酮酸甲酸裂合酶)和pflA(丙酮酸甲酸裂合酶活化酶)和Cb-FDH1的克隆。
利用所得质粒(pGV1103pflA、pGV1104pflB和pGV1002fdh1)和载体(pGV1103、pGV1104和pGV1102)来转化酿酒酵母(有关基因型:ura3、trp1、his3、leu2、pdc1、pdc5、pdc6)酵母菌株,如实施例3所指出的,以生成表达PflA、PflB、Cb-Fdh1的(PFL+)转化体和对照(PFL-)转化体。通过HIS、TRP和URA原养型选择来选择这两组转化体。
如实施例2中所述使用粗制酵母蛋白质提取物和Western印迹分析对所得转化体评估PflA、PflB和Fdh1表达。
如实施例14中所述,对那些被证实表达所有三种蛋白质的酵母转化体评估细胞乙酰-CoA水平,与只含载体的对照转化体进行比较。
为了评估表达PflA、PflB和Fdh1对正丁醇生成的影响,将pGV1208PflA1、pGV1209PflB和pGV1213Fdh1与pGV1227一起转化入酿酒酵母(MAT A、ura3、trp1、his3、leu2、pdc1、pdc5、pdc6)并选择His、Leu、Trp和Ura原养型。使用Gevo1110和1111作为对照隔离群(表1)。如实施例4中所述实施丁醇生成。正丁醇产率大于50%。
实施例16:具有降低的ADH1活性或没有ADH1活性的酿酒酵母中的Pfl和Fdh1表达
大肠杆菌pflB(无活性的丙酮酸甲酸裂合酶)和pflA(丙酮酸甲酸裂合酶活化酶)的克隆
如实施例14中所述进行大肠杆菌pflB(无活性的丙酮酸甲酸裂合酶)和pflA(丙酮酸甲酸裂合酶活化酶)和Cb-FDHI的克隆。
如实施例3中所述,利用所得质粒(pGV1103pflA、pGV1104pflB和pGV1002fdh1)和载体(pGV1103、pGV1104和pGV1102)来转化酵母菌株Gevo1253(adh1Δ)以生成表达PflA、PflB、Fdh1的(PFL+)转化体和对照(PFL-)转化体。通过HIS、TRP和URA原养型选择来选择这两组转化体。
如实施例2中所述使用粗制酵母蛋白质提取物和Western印迹分析对所得转化体评估PflA、PflB和Fdh1表达。
如实施例14中所述对那些被证实表达所有三种蛋白质的酵母转化体评估细胞乙酰-CoA水平,与只含载体的对照转化体进行比较。
为了评估过表达PflA、PflB和Fdh1对正丁醇生成的影响,将pGV1208PflA、pGV1209PflB和pGV1213Fdh1与pGV1227一起转化入Gevo1253并选择His、Leu、Trp和Ura原养型。使用Gevo1110和1111作为对照隔离群(表1)。如实施例4中所述实施丁醇生成。正丁醇产率大于10%。
实施例17:自酿酒酵母克隆PDC1基因及其在酿酒酵母中的过表达
此实施例的目的是描述在组成性有活性的启动子控制下克隆编码丙酮酸脱羧酶的基因,及描述这样的基因在酿酒酵母宿主细胞中的表达。
在基本上如实施例5中所述实施的PCR反应中使用引物Gevo-639加Gevo-640自酿酒酵母基因组DNA扩增完整PDC1 ORF。将所得1.7kb产物用XhoI+BamHI消化并连接入经SalI+BamHI切割的载体pGV1106,产生pGV1389(见表2)。将插入物完整测序。
为了在酿酒酵母中过表达Pdc1,用pGV1389转化酿酒酵母菌株Gevo1187(CEN.PK)并在SC-ura淘汰培养基上选择转化体,如实施例3中所描述的。使用粗制酵母蛋白质提取物和Western印迹分析(基于对重组表达蛋白质中所存在的Myc表位的检测)对自转化体培养得到的培养物测定Pdc1表达,如实施例2中所描述的。
实施例18:克隆以容许丙酮酸脱羧酶基因的诱导型表达
基因(例如丙酮酸脱羧酶)的组成性表达在培养物生长期间的某些点可能是不想要的,或可能对那些过表达细胞施加意外代谢或选择压力。如此,需要采用基因表达受调节的系统,由此感兴趣基因可主要在最佳时间表达以使培养物生长以及在后续发酵中的性能最大化。
此实施例的目的是描述在可诱导调节的启动子控制下克隆编码丙酮酸脱羧酶的基因,及描述这样的基因在酿酒酵母宿主细胞中的表达。
作为XbaI+BamHI片段释放pGV1389(见实施例19)中所存在的PDC1 ORF并克隆入经AvrII+BamHI消化的载体pGV1414,产生载体pGV1483。如此,载体pGV1483(表2)的特征在于酿酒酵母MET3基因启动子(SEQ ID NO:177)驱动PDC1基因的表达。MET3启动子在存在甲硫氨酸时在转录方面是沉默的,但是在甲硫氨酸水平落到某阈值以下时变得有活性。将质粒pGV1483转化入Gevo1187并通过SC-ura培养基上的选择来鉴定转化体,如实施例3中所描述的。培养携带pGV1483的Gevo1187的培养物并测定PDC1表达,基本上如实施例2中所描述的。
在此实施例的另一个实施方案中,PDC1基因在酿酒酵母铜诱导的CUP1基因启动子(SEQ ID NO:178)控制下表达。首先,在基本上如实施例5中所述的反应中使用引物通过PCR自酿酒酵母基因组DNA扩增CUP1基因启动子。将PCR产物用SacI+SalI消化并插入经SacI+SalI切割的pGV1106,产生pGV1388。对所插入的CUP1启动子序列完整测序。接着,将来自pGV1389、含有PDC1基因的XbaI+BamHI片段插入经AvrII+BamHI消化的pGV1388,产生pGV1388-PDC1。将质粒pGV1388-PDC1转化入Gevo1187,如实施例3中所描述的,并在缺少铜的SC-ura限定培养基上鉴定转化体。在没有补充铜的SC-ura培养基中培养转化细胞的培养物,直至它们达到OD600>0.5,那时添加硫酸铜至终浓度0.5mM。将培养物根据需要再培养24小时至48小时,然后通过Western印迹测定Pdc1表达,基本上如实施例2中所描述的。
实施例19:测量过表达丙酮酸脱羧酶的酵母细胞的培养物中所生成的PDC活性的体外测定法
此实施例的目的是描述对于测定细胞(特别是来自过表达PDC酶的一群细胞)中所存在的总丙酮酸脱羧酶活性有用的体外测定法。
用于测量来自总细胞溶胞物的PDC活性的测定法已有记载而且是本领域技术人员公知的(Maitra PK和Lobo Z.1971.J Biol Chem.25;246(2):475-88;Schmitt HD和Zimmermann FK.1982.J Bacterid.151(3):1146-52;Eberhardt等,(1999)Eur.J.Biochem.262(1),191-201)。
在此实施例的另一个实施方案中,如下测量通过如实施例17和18中所述表达PDC所生成的PDC活性,即首先使用针对PDC的特异性抗体或使用针对如实施例RF20和RF21中所表达的过表达的(但不是内源的)PDC中所存在的Myc表位标签的抗体免疫沉淀PDC。用于特异性免疫沉淀复合物混合物中所存在的蛋白质的方法是本领域技术人员公知的(例如Harlow和Lane,1988,Antibodies:A Laboratory Manual,CSHL Press)。然后免疫沉淀的PDC复合物充当要使用前述测定法测定的材料的来源。此方法如此容许异源的、过表达的PDC的特异性测定。
实施例20:还含有功能性丁醇生成途径的酿酒酵母中PDC过表达引起的升高的丁醇生产率
此实施例的目的是例示PDC过表达如何提高还表达丁醇生成途径的酿酒酵母培养物中的丁醇生产率。
过表达PDC基因的酿酒酵母菌株先前已有记载(van Hoek等,(1998).ApplEnviron Microbiol.64(6):2133-40)。这些实验揭示了(1)酿酒酵母中的内源PDC水平虽然占总细胞蛋白质的高达3.4%,仍能通过过表达构建体的存在而进一步提高;和(2)处于高生长速率的过表达PDC的培养物的发酵能力(乙醇生成的最大比速率)相对于对照菌株升高。这些结果提示PDC在某些生长条件下的过表达会提高经由异源提供的丁醇生成途径的通量。
为了在存在丁醇途径的情况中过表达PDC基因,通过SpeI消化自pGV1389切出PDC1基因,用Klenow DNA聚合酶片段将切出的DNA悬垂补平,然后用XhoI消化载体。将片段插入pGV1213(此载体经BamHI消化,用Klenow酶补平切过的末端,然后用XhoI消化),产生质粒pGV1605。将质粒pGV1605或pGV1057(Mumberg,D.,等(1995)Gene 156:119-122)与质粒pGV1208、pGV1209、和pGV1213一起转化入Gevo1187,基本上如实施例3中所述,并选择His、Leu、Trp、和Ura原养型。实施发酵以生成丁醇,如实施例4中所述测量。包含pGV1605导致比前述发酵中包含pGV1057及质粒pGV1208、pGV1209、和pGV1213更高的丁醇生产率(每单位时间所生成的丁醇量)。正丁醇产率大于5%。
实施例21:具有降低的醇脱氢酶活性且还含有功能性丁醇生成途径的酿酒酵母细胞中PDC过表达引起的升高的丁醇生产率
此实施例的目的是演示如何通过在醇脱氢酶(ADH)活性缺陷的酵母菌株中在存在丁醇生成途径的情况中过表达PDC基因来获得增强的丁醇生产率。
由PDC自丙酮酸生成的乙醛有两种主要命运:它能通过乙醛脱氢酶和乙酰-CoA合酶的作用被进一步代谢成乙酰-CoA,它然后可以作为丁醇合成途径的有用底物;或者,它能通过醇脱氢酶(ADH)的作用通过还原过程被进一步代谢成乙醇。因此,降低或消除ADH(尤其是那些偏爱乙醛的ADH酶)会降低或消除这种不想要的乙醛异化路径并提高丁醇途径可利用的乙酰-CoA池。
同时将质粒pGV1208、pGV1209、pGV1213、和pGV1605共转化入菌株Gevo1187(其具有有关基因型ADH1+)或菌株Gevo1266(其具有有关基因型adh1Δ)。对转化菌落选择His、Leu、Trp、和Ura原养型,基本上如实施例3中所描述的。实施发酵以生成丁醇,如实施例4中所述测量。正丁醇产率大于10%。菌株Gevo1266(adh1Δ)展现出比在菌株Gevo1187(ADH1+)中实施的平行发酵改善的丁醇产率。
实施例22:具有降低的醇脱氢酶活性且表达功能性丁醇生成途径的乳酸克鲁维酵母细胞中PDC过表达引起的升高的丁醇产率
此实施例的目的是描述具有大大降低的ADH活性或没有ADH活性的乳酸克鲁维酵母菌株中的丁醇生成。预测这样的菌株中表达丁醇途径会产生比在具有ADH活性的菌株中表达丁醇途径显著更大的丁醇产率每输入葡萄糖。
具有降低的醇脱氢酶活性的乳酸克鲁维酵母菌株的生成。
转化乳酸克鲁维酵母的细胞和破坏乳酸克鲁维酵母中的基因的方法(即用选择标志替换功能性可读框,接着后续消除标志)先前已有记载(Kooistra R,Hooykaas PJ,Steensma HY.(2004)Yeast.15;21(9):781-92)。乳酸克鲁维酵母具有四种编码ADH酶的基因,其中两种(即KIADH1和KIADH2)定位于胞质。文献(Saliola,M.,等,(1994)Yeast 10(9):1133-40)中已经记载了删除了这所有四种基因的乳酸克鲁维酵母突变衍生物(称作乳酸克鲁维酵母adh0),以及理想地培养这种菌株所要求的培养条件。这种办法的一种备选型式采用赋予对药物G418/遗传霉素(geneticin)的抗性的标志,例如如kan基因所提供的。这样的办法是有用的,因为它留下URA3标志可供用作后续转化中的选择标志。
乳酸克鲁维酵母adh0菌株中丁醇表达途径的表达
同时将质粒pGV1208、pGV1209、pGV1213、和pGV1605共转化入菌株Gevo1287(其是ADH+)或adh0菌株。对转化菌落选择His、Leu、Trp、和Ura原养型。实施发酵以生成丁醇,如实施例4中所述测量。正丁醇产率大于10%。菌株Gevo1287生成比在其它方面同基因的adh0菌株中实施的平行发酵显著更多的丁醇。
实施例23:酿酒酵母中的ALD6过表达
为了克隆酿酒酵母的ALD6基因,采用两步融合PCR法,其消除内部SalI限制酶位点以便于后续分子生物学操作。使用引物对Gevo-643+Gevo-644和Gevo-645+Gevo-646及作为模板的酿酒酵母基因组DNA生成跨越酿酒酵母ALD6基因序列的两种交叠PCR产物。用SalI+BamHI消化所得PCR片段并连接入经类似限制性消化的pGV1105和pGV1101以生成pGV1321和pGV1326。随后,亚克隆ALD6,即用EcoICRI+XhoI消化pGV1321和pGV1326并分别连接入BamHI(并随后用Klenow补平末端)+XhoI消化的pGV1209和pGV1208以生成pGV1339和pGV1399。
分别利用所得质粒(pGV1339和pGV1399)和载体(pGV1105和pGV1101)来转化酵母菌株Gevo1187,如实施例3中所描述的,以生成过表达ALD6的(“Ald6+”)转化体或对照转化体。通过在适宜淘汰培养基中选择TRP和LEU原养型来选择这两组转化体。
使用粗制酵母蛋白质提取物和Western印迹分析对所得转化体评估Ald6表达,如实施例2中所描述的。
对那些被证实表达Ald6蛋白的酵母转化体评估增强的乙醛脱氢酶活性,与只含载体的对照转化体进行比较。为此,在摇瓶中在适宜的淘汰培养基中培养Ald6+和对照细胞。测定培养物的光密度(OD600)并通过以2800xg离心5分钟来沉淀细胞。使用珠式破碎仪裂解细胞并将溶胞物用于使用已建立方法(例如Van Urk等,Biochim.Biophys.Acta.191:769)进行的蛋白质测定和醛脱氢酶活性分析。
为了评估过表达Ald6对正丁醇生成的影响,将pGV1339与pGV1208、pGV1227和pGV1213一起转化入Gevo1187并选择His、Leu、Trp和Ura原养型。使用Gevo1110和1111作为对照隔离群(表1)。如实施例4中所述实施丁醇生成。正丁醇产率大于5%。
实施例24:没有醇脱氢酶I活性(adh1Δ)的酿酒酵母中的Ald6过表达
如实施例23中所述实施ALD6基因的克隆。
如实施例3中所述分别利用所得质粒(pGV1339和pGV1399)和载体(pGV1100和pGV1101)来转化酵母菌株Gevo1253以生成过表达Ald6+的转化体和对照转化体。在适宜的淘汰培养基上选择这两组转化体。
如实施例2中所述使用粗制酵母蛋白质提取物和Western印迹分析对所得转化体评估Ald6表达。
如实施例23中所述对那些被证实表达Ald6蛋白的酵母转化体评估增强的乙醛脱氢酶活性。
为了评估过表达对正丁醇生成的后果,将pGV1339与pGV1209、pGV1227和pGV1213一起转化入Gevo1253并选择His、Leu、Trp和Ura原养型。使用Gevo1110和1111作为对照隔离群(表1)。如实施例4中所述实施丁醇生成。正丁醇产率大于10%。
实施例25:乙酰-CoA合酶基因在酿酒酵母中的过表达
此实施例的目的是描述编码乙酰-CoA合酶活性的基因的克隆,及这样的基因在宿主酿酒酵母细胞中的表达。具体而言,酿酒酵母基因ACS1或ACS2任一或二者编码乙酰-CoA合酶活性。
为了克隆ACS1和ACS2基因,利用作为模板的酿酒酵母基因组DNA,及引物Gevo-479+Gevo-480(ACS1)和Gevo-483+Gevo-484(ACS2),每一组分别在正向和反向引物中含有SalI和BamHI限制性位点。将所得PCR片段用SalI+BamHI消化并连接入经类似限制性消化的pGV1101和pGV1102以生成pGV1262和pGV1263。随后,亚克隆ACS1和ACS2,即用EcoICRI+XhoI消化pGV1262和pGV1263并连接入经BamHI(且随后用Klenwo补平末端)+XhoI消化的pGV1213以生成pGV1319和pGV1320。
如实施例3中所述分别利用所得质粒pGV1262和pGV1263及载体pGV1101和pGV1102来转化酵母菌株Gevo1187以生成过表达ACS1+、ACS2+的转化体和对照转化体。通过LEU、URA原养型选择来选择这两组转化体。如实施例2中所述使用粗制酵母蛋白质提取物和Western印迹分析对转化体评估Acs1或Acs2表达。
对那些被证实表达Acs1或Acs2蛋白的酵母转化体评估增强的乙酰-CoA合酶活性,与只含载体的对照转化体进行比较。为此,以摇瓶型式在SC-LEU、URA培养基中培养ACS1+或ACS2+和对照细胞。测定培养物的光密度(OD600)并通过以2800xrcf离心5分钟来沉淀细胞。使用珠式破碎仪裂解细胞并将溶胞物用于使用已建立方法(Van Urk等,Biochim.Biophys.Acta.191:769)进行的蛋白质测定和乙酰-CoA合酶活性分析。
为了评估Acs1或Acs2过表达对正丁醇生成的影响,将pGV1319和1320与pGV1208、pGV1209和pGV1227一起转化入Gevo1187并选择His、Leu、Trp和Ura原养型。使用Gevo1110和1111作为对照隔离群(表1)。如实施例4中所述实施丁醇生成。正丁醇产率大于5%。
实施例26:没有醇脱氢酶I活性(adh1Δ)的酿酒酵母细胞中乙酰-CoA合酶的过表达
如实施例25中所述克隆酿酒酵母的ACS1和ACS2基因。
如实施例3中所述分别利用所得质粒pGV1262和pGV1263及载体pGV1101和pGV1102来转化酵母菌株Gevo1253以生成过表达ACS1+、ACS2+的转化体和对照转化体。通过LEU、URA原养型选择来选择这两组转化体。如实施例25中所述使用粗制酵母蛋白质提取物和Western印迹分析对转化体评估Acs1或Acs2表达。
如实施例26中所述对那些被证实表达Acs1或Acs2蛋白的酵母转化体评估增强的乙酰-CoA合酶活性。
为了评估过表达Acs1或Acs2对丁醇生成的影响,将pGV1319和1320与pGV1208、pGV1209和pGV1227一起转化入Gevo1253并选择His、Leu、Trp和Ura原养型。使用Gevo1110和1111作为对照隔离群(表1)。如实施例4中所述实施丁醇生成。正丁醇产率大于5%。
实施例27:ALD6、ACS1和ACS2在酿酒酵母中的过表达
如实施例23和25中所述克隆ALD6、ACS1和ACS2基因。
如实施例3中所述分别利用所得质粒pGV1321和pGV1262或pGV1263和载体pGV1105和pGV1102来转化酵母菌株Gevo1187以生成过表达ALD6+ACS1+、ALD6+ACS2+的转化体和对照转化体。通过LEU和URA原养型选择来选择这两组转化体。
对转化体ALD6+ACS1+和ALD6+ACS2+评估增强的乙酰-CoA合酶活性,与只含载体的对照转化体进行比较。为此,如实施例25中所述以摇瓶型式在SC-LEU、URA培养基中培养ALD6+ACS1+、ALD6+ACS2+和对照细胞。
为了评估Ald6加Acs1或Acs2的过表达如何导致更高的丁醇生成,将Gevo1187用pGV1208、pGV1339、pGV1227和pGV1319或1320转化并选择His、Leu、Trp和Ura原养型。使用Gevo1110和1111作为对照隔离群(表1)。如实施例4中所述评估丁醇生成。正丁醇产率大于5%。
实施例28:没有醇脱氢酶I活性(adhlΔ)的酿酒酵母中的ALD6加ACS1或ACS2过表达
如实施例23和25中所述克隆ALD6、ACS1和ACS2基因。
如实施例3中所述分别利用所得质粒pGV1321和pGV1262或pGV1263及载体pGV1105和pGV1102来转化酵母菌株Gevo1253(ΔADH1)以生成过表达ALD6+ACS1+或ALD6+ACS2+的菌株或对照转化体。通过LEU和URA原养型选择来选择这两组转化体。
对转化体ALD6+ACS1+或ALD6+ACS2+评估增强的乙酰-CoA合酶活性,与只含载体的对照转化体进行比较。为此,如实施例25中所述以摇瓶型式在SC-LEU、URA培养基中培养ALD6+ACS 1+或ALD6+ACS2+和对照细胞。
为了评估过表达SALD6和ACS1或ACS2对丁醇生成的影响,将Gevo1253用pGV1208、pGV1339、pGV1227和pGV1319或1320转化并选择HIS、LEU、TRP和URA原养型。使用Gevo1110和1111作为对照隔离群(表1)。如实施例4中所述实施丁醇生成。正丁醇产率大于10%。
实施例29:将丁醇途径克隆入用于在克鲁维酵母属的酵母中进行表达的载体
为了将丁醇途径基因克隆入适合于在菌株乳酸克鲁维酵母中进行表达的载体,通过SacI和NotI限制性消化自pGV1208、pGV1209和pGV1227释放hbd、Crt、Thl+TER并克隆入经类似消化的pGV1428、1429和1430以生成pGV1208KI、pGV1209KI和pGV1227KI。为了将ADHE2克隆入乳酸克鲁维酵母,将pGV1213用MluI和SacI消化并连接入经类似消化的pGV1431以生成pGV1213KI。将所得质粒pGV1208KI、pGV1209KI、pGV1227KI和pGV1213KI转化入乳酸克鲁维酵母(菌株Gevo1287;有关基因型:MATa、trp1、his3、leu2、ura3)并对转化体选择TRP、HIS、LEU和URA原养型(Kooistra R,Hooykaas PJ,Steensma HY.(2004)Yeast.15;21(9):781-92)。如实施例4中所述实施丁醇生成。
实施例30:丙酮酸甲酸裂合酶和甲酸脱氢酶I在乳酸克鲁维酵母中的表达
大肠杆菌pflB(无活性的丙酮酸甲酸裂合酶)和pflA(丙酮酸甲酸裂合酶活化酶)的克隆
为了克隆大肠杆菌pflB和pflA,分别使用大肠杆菌基因组DNA和pflB_forw、PflB_rev和PflA_forw、PflA_rev引物扩增基因。为了克隆博伊丁氏假丝酵母FDH1基因,在PCR反应中使用作为模板的博伊丁氏假丝酵母的基因组DNA及fdh_forw和fdh_rev引物。利用分别掺入正向和反向基因扩增引物的限制性位点SalI和EcoRI,将所扩增的DNA连接到经SalI和EcoRI消化的pGV1428、pGV1429和pGV1430上,生成pGV1428pflA、pGV1429pflB和pGV1430fdh1。自所得质粒表达的蛋白质带myc标签,用以进行蛋白质表达研究。
通过已知方法(Kooistra R,Hooykaas PJ,Steensma HY.(2004)Yeast.15;21(9):781-92)利用所得质粒(pGV1428pflA、pGV1429pflB和pGV1430fdh1)和载体(pGV1428、pGV1429和pGV1430)来转化酵母菌株乳酸克鲁维酵母(Gevo1287;有关基因型:MatA、trp1、his3、leu2和ura3)以生成表达PflA、PflB、Cb-Fdh1的(PFL+)转化体和对照(PFL-)转化体。通过HIS、TRP和LEU原养型选择来选择这两组转化体。
如实施例2中所述使用粗制酵母蛋白质提取物和Western印迹分析对所得转化体评估PflA、PflB和Fdh1表达。
对那些被证实表达所有三种蛋白质的酵母转化体评估细胞乙酰-CoA水平,与只含载体的对照转化体进行比较。为此,以摇瓶型式在SC-LEU、HIS、TRP培养基中培养PFL+和PFL-细胞。测定培养物的光密度(OD600)并以2800xrcf离心5分钟以沉淀细胞。使用珠式破碎仪裂解细胞并将溶胞物用于使用已建立方法(Zhang等,Connection of Propionyl-CoA Metabolism toPolyketide Biosynthesis in Aspergillus nidulans.Genetics,168:785-794)进行的蛋白质测定和乙酰-CoA测定分析。评估每mg细胞总蛋白质的乙酰-CoA量。
为了评估PflA、PflB和Fdh1表达对丁醇生成的影响,将pflA、pflB和Cb-FDHI亚克隆入含有pGV1208KI、pGV1209KI、pGV1227KI和pGV1213KI的丁醇途径基因(表1)。为此,使用标准分子生物学方法(Sambrook,J.Fritsch,E.F.,Maniatis,T.,1989),将pGV1428pflA、pGV1429pflB和pGV1002fdh1用EcoICRI+XhoI限制酶消化并连接入经BamHI(随后用Klenow补平末端)+XhoI消化的pGV1208KI、pGV1209KI和pGV1213KI以生成pGV1208KIPflA、pGV1209KIPflB和pGV1213KIFdh1。将所得质粒与pGV1227KI一起转化入乳酸克鲁维酵母菌株(MATa、pdc1、trp1、his3、leu2 ura3)并选择His、Leu、Trp和Ura原养型。使用包含pGV1428、pGV1429、pGV1430和pGV1431的乳酸克鲁维酵母转化体作为对照隔离群。如实施例4中所述实施丁醇生成。正丁醇产率大于10%。
实施例31:丙酮酸甲酸裂合酶和甲酸脱氢酶I在缺乏丙酮酸脱羧酶活性的乳酸克鲁维酵母中的表达
如实施例30中所述克隆大肠杆菌pflB(无活性的丙酮酸甲酸裂合酶)和pflA(丙酮酸甲酸裂合酶活化酶)Cb-FDHI。
通过已知方法(Kooistra R,Hooykaas PJ,Steensma HY.(2004)Yeast.15;21(9):781-92)利用所得质粒(pGV1428pflA、pGV1429pflB和pGV1430fdh1)和载体(pGV1428、pGV1429和pGV1430)来转化酵母菌株乳酸克鲁维酵母(MatA、pdc1、trp1、his3、leu2和ura3)以生成PflA、PflB、Cb-Fdh1的(PFL+)转化体和对照(PFL-)转化体。通过HIS、TRP和LEU原养型选择来选择这两组转化体。
如实施例2中所述使用粗制酵母蛋白质提取物和Western印迹分析对所得转化体评估PflA、PflB和Cb-Fdh1表达。
对那些被证实表达所有三种蛋白质的酵母转化体评估细胞乙酰-CoA水平,与只含载体的对照转化体进行比较。为此,如实施例30中所述以摇瓶型式在SC-LEU、HIS、TRP培养基中培养PFL+和PFL-细胞并评估。
为了评估PflA、PflB和Fdh1的表达如何导致更高的丁醇生成,将pGV1208KIPflA、pGV1209KIPflB和pGV1213KIFdh 1与pGV1227KI一起转化入乳酸克鲁维酵母(MATa、pddΔ、trp1、his3、leu2、ura3)并选择His、Leu、Trp和Ura原养型。使用包含pGV1428、pGV1429、pGV1430和pGV1431的乳酸克鲁维酵母转化体作为对照隔离群。如实施例4中所述实施丁醇生成。正丁醇产率大于50%。
实施例32:Pf1(丙酮酸甲酸裂合酶)和Fdh1(甲酸脱氢酶I)在缺乏Adh1活性的乳酸克鲁维酵母中的表达
如实施例30中所述克隆大肠杆菌pflB(无活性的丙酮酸甲酸裂合酶)、pflA(丙酮酸甲酸裂合酶活化酶)和Cb-FDH1。
通过已知方法(Kooistra R,Hooykaas PJ,Steensma HY.(2004)Yeast.15;21(9):781-92)利用所得质粒(pGV1428pflA、pGV1429pflB和pGV1430fdh1)和载体(pGV1428、pGV1429和pGV1430)来转化酵母菌株乳酸克鲁维酵母(MATa、trp1、his3、Leu2、ura3)以生成表达PflA、PflB1、Fdh1的(EcPFL+)转化体和对照(EcPFL-)转化体。通过HIS、TRP和LEU原养型选择来选择这两组转化体。
如实施例2中所述使用粗制酵母蛋白质提取物和Western印迹分析对所得转化体评估PflA、PflB和Fdh1表达。
对那些被证实表达所有三种蛋白质的酵母转化体评估细胞乙酰-CoA水平,与只含载体的对照转化体进行比较。为此,如实施例30中所述以摇瓶型式在SC-LEU、HIS、TRP培养基中培养EcPFL+和EcPFL-细胞并评估。
为了评估PflA、PflB和Fdh1的表达如何导致更高的丁醇生成,将pGV1208KIPflA、pGV1209KIPflB和pGV1213KIFdh1与pGV1227KI一起转化入乳酸克鲁维酵母(MATa、adh1Δ、trp1、his3、leu2、ura3)并选择His、Leu、Trp和Ura原养型。使用包含pGV1428、pGV1429、pGV1430和pGV1431的乳酸克鲁维酵母转化体作为对照隔离群。如实施例4中所述实施丁醇生成。正丁醇产率大于20%。
实施例33:KIALD6在乳酸克鲁维酵母中的过表达
为了克隆KIALD6,在PCR反应中使用作为模板的乳酸克鲁维酵母基因组DNA及引物KIALD6_left5和KIALD6_right3(见表1),其它方面与实施例5中所述类似。前述引物分别包含SalI和BamHI限制性位点,将所得PCR片段用SalI+BamHI消化并连接入经类似限制性消化的pGV1428以生成pGV1428KLALD6。随后,亚克隆KIALD6,即将pGV1428ALD6用EcoICRI+XhoI消化并连接入经BamHI(随后用Klenow补平末端)+XhoI消化的pGV1208KI以生成pGV1208KIALD6。
通过已知方法(Kooistra R,Hooykaas PJ,Steensma HY.(2004)Yeast.15;21(9):781-92)分别利用所得质粒pGV1428ALD6KI和载体pGV1428来转化酵母菌株乳酸克鲁维酵母(MATa、trp1、his3、leu2、ura3)以生成过表达KIALD6+和KIALD6-的转化体和对照转化体。通过HIS原养型选择来选择这两组转化体。
如实施例2中所述使用粗制酵母蛋白质提取物和Western印迹分析对所得转化体KIALD6+和KIALD6-评估KIAld6表达。
对那些被证实过表达KIAld6蛋白的乳酸克鲁维酵母转化体评估增强的乙醛脱氢酶活性,与只含载体的对照转化体进行比较。为此,如实施例23中所述以摇瓶型式在SC-HIS培养基中培养KIALD6+和KIALD6-细胞并评估。
为了评估KIALD6的过表达如何导致更高的丁醇生成,将pGV1208KIALD6与pGV1209KI、pGV1227KI和pGV1213KI一起转化入乳酸克鲁维酵母(MATa、trp1、his3、leu2、ura3)并选择HIS、LEU、TRP和URA原养型。使用用pGV1428、pGV1429、pGV1430和pGV1431转化乳酸克鲁维酵母产生的转化体作为对照隔离群。如实施例4中所述实施丁醇生成。正丁醇产率大于5%。
实施例34:醛脱氢酶在缺乏Adh1活性的乳酸克鲁维酵母中的过表达
实施例33中记载了克鲁维酵母KIALD6基因的克隆。
通过已知方法(Kooistra R,Hooykaas PJ,Steensma HY.(2004)Yeast.15;21(9):781-92)分别利用所得质粒pGV1428ALD6和载体pGV1428来转化酵母菌株乳酸克鲁维酵母(MATa、adh1Δ、trp1、his3、leu2、ura3)以生成过表达KIALD6+和KIALD6-的转化体和对照转化体。通过HIS原养型选择来选择这两组转化体。
如实施例2中所述使用粗制酵母蛋白质提取物和Western印迹分析对所得转化体评估KIAld6表达。
如实施例30中所述对那些被证实表达KIAld6蛋白质的乳酸克鲁维酵母转化体评估增强的乙醛脱氢酶活性。
为了评估KIAld6的过表达如何导致更高的丁醇生成,将pGV1208KIALD6与pGV1209KI、pGV1227KI和pGV1213KI一起转化入乳酸克鲁维酵母(MATa、adh1Δ、trp1、his3、leu2、ura3)并选择HIS、LEU、TRP和URA原养型。使用用pGV1428、pGV1429、pGV1430和pGV1431转化乳酸克鲁维酵母产生的转化体作为对照隔离群。如实施例4中所述实施丁醇生成。正丁醇产率大于10%。
实施例35:乙酰-CoA合酶基因在酵母乳酸克鲁维酵母中的过表达
酵母乳酸克鲁维酵母基因组中的两种侧向同源基因(即KIACS1和KIACS2)编码乙酰-CoA活性。为了克隆KIACS1和KIACS2,利用作为模板的乳酸克鲁维酵母基因组DNA及引物KIACS1_left5+KIACS2_Right3(ACS1)和KIACS2_Left5+KIACS2_Right3(ACS2)(见表1),其分别在正向和反向引物中含有NotI+SalI和SalI+BamHI限制性位点。将所得PCR片段用适宜酶消化并连接入经类似限制性消化的pGV1429和pGV1431以生成pGV1429ACS1和pGV1431ACS2。随后,亚克隆KIACS1和KIACS2,即将pGV1429ACS1和pGV1431ACS2用SacId和NotI消化并连接入经类似消化的pGV1209KI和pGV1213KI以生成pGV1209KIACS1和pGVKIACS2。
通过已知方法分别利用所得质粒pGV1429ACS1和pGV1431ACS2及空载体pGV1429和pGV1431来转化乳酸克鲁维酵母(MATa、trp1、his3、leu2、ura3)以生成过表达KIACS1+、KIACS2+和KIACS-蛋白的转化体和对照转化体。通过TRP、URA原养型选择来选择这两组转化体。如实施例2中所述使用粗制酵母蛋白质提取物和Western印迹分析对转化体评估KIAcs1和KIAcs2表达。
对那些被证实表达KIAcs1和KIAcs2蛋白的酵母转化体评估增强的乙酰-CoA合酶活性,与只含载体的对照转化体进行比较。为此,如实施例25中所述以摇瓶型式在SC-TRP、URA培养基中培养KIACS1+、KIACS2+和KIACS-细胞并评估。
为了评估KIACS1和KIACS2的过表达如何导致更高的丁醇生成,将pGV1209KIACS1和pGV1209KIACS2与pGV1208KI和pGV1227KI一起转化入菌株Gevo1287并对转化细胞选择His、Leu、Trp和Ura原养型。使用用pGV1428、pGV1429、pGV1430和pGV1431转化乳酸克鲁维酵母(MATa、trp1、his3、leu2、ura3)产生的转化体作为对照隔离群。如实施例4中所述实施丁醇生成。正丁醇产率大于5%。
实施例36:乙酰-CoA合酶基因在缺乏Adh1活性的酵母乳酸克鲁维酵母中的过表达
实施例35中记载了乳酸克鲁维酵母KIACSI和KIACS2基因的克隆。
通过已知方法利用所得质粒pGV1429ACS1和pGV1431ACS2及空载体pGV1429和pGV1431来转化乳酸克鲁维酵母(MATa、adh1Δ、trp1、his3、leu2、ura3)以生成过表达KIACS1+和KIACS2+的转化体和对照转化体。通过TRP和URA原养型选择来选择这两组转化体。如实施例2中所述使用粗制酵母蛋白质提取物和Western印迹分析对转化体评估KIAcs1和KIAcs2表达。
如实施例25中所述对那些被证实表达KlAcs1和KIAcs2蛋白的酵母转化体评估增强的乙酰-CoA合酶活性。
为了评估KIACS1和KIACS2的过表达如何导致更高的丁醇生成,将pGV1209KIACS1和pGV1209KIACS2与pGV1208KI和pGV1227KI一起转化入乳酸克鲁维酵母(MatA、adh1、trp1、his3、leu2和ura3)。如实施例4中所述实施丁醇生成。正丁醇产率大于10%。
实施例37:KIALD6和KIACS1或KIACS2在乳克鲁维氏酵母中的过表达
如上文实施例33和35中所述克隆KIALD6、KIACS1和KIACS2基因。
通过已知方法分别利用所得质粒pGV1428ALD6和pGV1429ACS1或pGV1430及载体pGV1428和pGV1429或pGV1430来转化乳酸克鲁维酵母(MATa、trp1、his3、leu2、ura3)以生成过表达KIALD6+KIACS1+、KIALD6+KIACS2+和KIALD-KIACS-的转化体和对照转化体。分别通过HIS、TRP和HIS、LEU原养型选择来选择这两组转化体。
对转化体KIALD6+KIACS 1+和KIALD6+KIACS2+评估增强的乙酰-CoA合酶活性,与只含载体的对照转化体(ALD-ACS-)进行比较。为此,如实施例25中所述以摇瓶型式分别在SC-HIS、TRP和HIS、LEU培养基中培养KIALD6+KIACS1+、KIALD6+KIACS2+和KIALD-KIACS-细胞并评估。
为了评估KIAld6和KIAcs1或KIAcs2的过表达如何导致更高的丁醇生成,将乳酸克鲁维酵母(MATa、trp1、his3、leu2ura3)用pGV1208KIALD6、pGV1209KIACS1或pGV1209KIACS2、pGV1227KI、pGV1213KI转化并选择HIS、LEU、TRP和URA原养型。使用用pGV1428、pGV1429、pGV1430和pGV1431转化乳酸克鲁维酵母(MATa、trp1、his3、leu2ura3)产生的转化体作为对照隔离群。如实施例4中所述实施丁醇生成。正丁醇产率大于5%。
实施例38:KIALD6、KIACS1和KIACS2在缺乏KIAdh1活性(Kladh1Δ)的乳酸克鲁维酵母中的过表达
如实施例33和35中所述克隆KIALD6、KIACS1和KIACS2基因。
通过已知方法分别利用所得质粒pGV1428ALD6和pGV1429ACS1或pGV1430ACS2及载体pGV1428和pGV1429或pGV1430来转化乳酸克鲁维酵母(MATa、Kladh1Δtrp1、his3、leu2 ura3)以生成过表达KIALD6+KIACS1+、KIALD6+KIACS2+和KIALD-KIACS-的转化体和对照转化体。分别通过HIS、TRP和HIS、LEU原养型选择来选择这两组转化体。
如实施例14中所述对转化体KIALD6+KIACS1+和KIALD6+KIACS2+评估细胞乙酰-CoA水平。
为了评估KIAld6和KIAcs1或KIAcs2的过表达是否导致更高的丁醇生成,将乳酸克鲁维酵母(MATa、Kladh1Δtrp1、his3、leu2 ura3)用pGV1208KIALD6、pGV1209KIACS1或pGV1209KIACS2、pGV1227KI、pGV1213KI转化。如实施例4中所述实施丁醇生成。正丁醇产率大于10%。
【序列表】
<110>格沃股份有限公司(GEVO,INC.)
<120>由代谢工程化酵母进行的丁醇生产
<130>56836.830003.US1
<150>60/871,427
<151>2006-12-21
<150>60/888,016
<151>2007-02-02
<150>60/928,283
<151>2007-05-08
<160>190
<170>PatentIn version 3.4
<210>1
<211>1179
<212>DNA
<213>Ca-thl-co
<400>1
atgaaagaag ttgtaatagc tagcgcggtg cgtaccgcca ttggctctta tggtaaaagt 60
ctgaaggatg ttccggcagt cgacttaggg gctacggcga tcaaagaagc cgtaaaaaag 120
gcaggaatta aaccagagga tgtgaatgaa gttatcctgg gcaacgtcct gcaggctggt 180
ttagggcaaa atcctgcgcg ccaggcctca tttaaagcag gactgccggt agagattcca 240
gctatgacta tcaacaaggt gtgcggctcc ggtctgcgga cagtttcgtt agcggcccaa 300
attatcaaag caggcgacgc tgatgtcatt atcgcgggtg ggatggaaaa tatgagccgt 360
gccccttacc tggcaaacaa tgcgcgctgg ggatatcgta tgggcaacgc taaattcgtg 420
gacgaaatga ttaccgatgg tctgtgggat gcctttaatg actaccatat gggcatcacg 480
gcagagaaca ttgcggaacg ctggaatatc tctcgggagg aacaggatga gttcgcttta 540
gccagtcaga agaaagcaga ggaagcgatt aaatcaggtc aatttaagga cgagatcgta 600
ccggttgtga ttaaagggcg taaaggagaa actgtcgttg atacagacga acacccgcgc 660
ttcggctcca ccattgaggg tctggctaag ctgaaaccag cctttaaaaa ggatgggacg 720
gtaaccgcag gcaacgcgtc gggtttaaat gattgtgccg cagtgctggt catcatgagc 780
gcggaaaaag ctaaagagct gggagttaag cctctggcca aaattgtgtc ttatggcagt 840
gcgggtgtag acccggctat catggggtac ggcccgttct atgcaactaa agccgcgatt 900
gaaaaggctg gttggacagt cgatgaatta gacctgatcg agtcaaacga agcatttgcc 960
gcgcagtccc tggctgttgc aaaagattta aaattcgata tgaataaggt gaacgtaaat 1020
ggaggcgcca ttgcgctggg tcatccaatc ggggcttcgg gagcacgtat tctggttacg 1080
ttagtgcacg ccatgcaaaa acgcgacgcg aaaaagggcc tggctaccct gtgcatcggt 1140
gggggccagg gtactgcaat attgctagaa aagtgctag 1179
<210>2
<211>849
<212>DNA
<213>Ca-hbd-co
<400>2
atgaaaaagg tatgtgttat aggcgcggga accatgggta gcggtattgc ccaggcattt 60
gctgcaaaag gtttcgaagt ggttctgcgt gatatcaagg acgagtttgt cgatcgcggc 120
ttagacttca ttaataaaaa cctgtctaaa ctggtaaaga aagggaaaat cgaagaggcg 180
acgaaggtgg aaattttaac tcggatcagt ggaacagttg atctgaatat ggccgctgac 240
tgcgatctgg tcattgaagc ggccgtagag cgtatggata tcaaaaaaca aatttttgca 300
gacttagata acatctgtaa gccggaaacc attctggctt caaatacgtc ctcgctgagc 360
atcactgagg tggcgtctgc cacaaaacgc ccagacaaag ttattggcat gcatttcttt 420
aaccctgcac cggtcatgaa gttagtggaa gtaatccgtg ggattgctac cagtcaggaa 480
acgttcgatg cggttaaaga gacctcaatc gccattggaa aagacccagt ggaagtcgca 540
gaggcgcctg gctttgttgt aaatcgcatt ctgatcccga tgattaacga agctgtggga 600
atcctggccg aaggaattgc atccgtcgag gatatcgaca aggcgatgaa attaggcgct 660
aatcacccga tgggtccact ggaactgggc gacttcattg gtctggatat ctgcttagcc 720
attatggacg ttctgtattc ggagactggg gatagcaaat accggcctca tacactgtta 780
aagaaatatg tgcgtgcagg atggctgggc cgcaaatctg gtaagggttt ctacgattat 840
tcaaaataa 849
<210>3
<211>786
<212>DNA
<213>Ca-crt-co
<400>3
atggaactaa acaatgtcat cctggaaaaa gagggcaagg tggcggttgt caccattaat 60
cgtccgaaag ccttaaacgc actgaatagc gatacgctga aagaaatgga ctatgtaatc 120
ggtgagattg aaaacgattc tgaagtgtta gctgttatcc tgactggggc gggagagaag 180
agttttgtcg ccggcgcaga catttcagaa atgaaagaga tgaatacaat cgaaggtcgc 240
aaattcggga ttctgggaaa caaggtattt cggcgtttag aactgctgga gaaaccagtg 300
atcgctgcgg ttaatggctt cgccttaggt ggcggttgcg aaattgcaat gtcctgtgat 360
atccgcattg cttcgagcaa cgcgcgtttt gggcagcctg aggtcggact gggcatcaca 420
ccgggtttcg gcggtacgca acgcctgtct cggttagtgg ggatgggaat ggccaaacag 480
ctgattttta ctgcacaaaa tatcaaggct gacgaagcgc tgcgtattgg cctggtaaac 540
aaagttgtgg aaccaagtga gttaatgaat acagccaaag aaatcgcaaa caagattgtc 600
tcaaatgcgc ctgttgctgt aaaactgtcc aaacaggcca ttaaccgcgg tatgcagtgc 660
gatatcgaca ccgcactggc gttcgagtcg gaagcttttg gggaatgttt cagcacggag 720
gaccaaaagg atgccatgac cgcatttatt gaaaaacgta aaattgaagg cttcaaaaat 780
agatag 786
<210>4
<211>1140
<212>DNA
<213>Ca-bcd-co
<400>4
atggatttta atttaacaag agaacaggaa ctggtccgtc agatggtacg tgaatttgca 60
gaaaacgagg ttaaaccgat tgctgcagag attgatgaga ctgaacgctt cccgatggaa 120
aacgtcaaaa agatgggtca gtatggcatg atgggcattc cgttctctaa agagtacggc 180
ggtgcgggtg gcgacgttct gtcttatatc atcgctgtag aggaactgtc caaagtatgt 240
ggcaccacgg gcgtgatcct gtccgcgcac acctctctgt gcgcaagcct gatcaacgaa 300
cacggcaccg aggaacagaa gcaaaaatac ctggtcccgc tggccaaagg tgaaaagatc 360
ggtgcatacg gtctgacgga accgaacgca ggtacggaca gcggcgcaca acagacggtt 420
gcggtactgg aaggcgacca ctacgttatt aacggtagca aaatcttcat cacgaacggt 480
ggcgtggctg acacctttgt tatcttcgcg atgaccgacc gcactaaagg cactaaaggt 540
atctctgcgt tcatcatcga gaagggtttc aagggttttt ctatcggcaa agtggaacag 600
aagctgggta tccgtgcctc ctctactacc gagctggttt tcgaagacat gattgtgccg 660
gttgaaaata tgatcggcaa agaaggcaaa ggcttcccga tcgctatgaa aaccctggat 720
ggcggccgta tcggcattgc agcacaggca ctgggtatcg cagaaggcgc tttcaacgaa 780
gcacgtgcgt acatgaaaga acgtaaacag tttggccgtt ctctggataa atttcaaggc 840
ctggcgtgga tgatggcaga catggacgta gcgattgaat ctgcgcgcta cctggtctat 900
aaagcagctt acctgaaaca ggcaggtctg ccttacaccg ttgacgcagc acgtgcgaaa 960
ctgcacgcgg ccaacgttgc catggatgtt accaccaaag ccgtgcaact gtttggcggt 1020
tacggctata ctaaggatta tccggttgaa cgtatgatgc gtgacgcgaa aatcaccgaa 1080
atctatgaag gtacttccga agtgcagaaa ctggtcattt caggaaaaat ttttagttaa 1140
<210>5
<211>1011
<212>DNA
<213>Ca-eftA-co
<400>5
atgaataaag cagattacaa gggcgtttgg gtctttgcgg aacagcgtga tggtgaactg 60
cagaaagtgt ccctggaact gctgggcaaa ggcaaggaga tggcagaaaa actgggtgtt 120
gaactgaccg cagttctgct gggtcacaac actgaaaaga tgtccaaaga cctgctgtcc 180
catggcgcag acaaggtgct ggctgcggac aacgaactgc tggctcactt tagcaccgac 240
ggttatgcaa aagtaatctg cgacctggtt aacgagcgca agccggaaat cctgttcatc 300
ggcgccactt ttattggtcg cgacctgggc cctcgtattg ctgcgcgtct gtccactggc 360
ctgactgcgg attgcacctc cctggacatt gatgttgaaa accgtgatct gctggcaact 420
cgcccggcat tcggcggcaa cctgatcgcc accatcgtat gttccgacca ccgtccgcaa 480
atggctactg tacgtccggg cgtatttgaa aagctgccgg tgaacgacgc aaacgtttcc 540
gacgacaaaa tcgaaaaagt tgctatcaag ctgaccgcta gcgatatccg taccaaagtt 600
tctaaagtag tgaaactggc gaaggacatc gcagatattg gtgaagcaaa agttctggtg 660
gcaggcggtc gtggcgtcgg ttccaaagag aacttcgaaa aactggagga actggcgtct 720
ctgctgggcg gtactattgc agcgtcccgt gcagcaatcg aaaaagaatg ggtggacaag 780
gatctgcagg tgggccagac tggtaaaacc gttcgtccga ccctgtacat cgcctgcggc 840
atctccggtg ctattcagca cctggccggc atgcaggaca gcgactacat catcgccatc 900
aacaaagacg ttgaagctcc gatcatgaaa gtggcggacc tggcaatcgt tggtgacgtg 960
aacaaagttg ttccggaact gatcgcgcag gttaaagctg ctaataatta a 1011
<210>6
<211>780
<212>DNA
<213>Ca-eftB-co
<400>6
atgaatatag ttgtttgttt aaaacaggtc ccggacaccg cagaagttcg tattgatcca 60
gtaaagggta cgctgattcg cgagggcgtg ccgtctatca tcaacccaga tgacaagaac 120
gccctggaag aagcactggt cctgaaagat aattacggcg ctcacgtaac tgttatctct 180
atgggtccgc cgcaagcgaa aaatgcgctg gttgaagctc tggcgatggg cgctgacgag 240
gctgttctgc tgactgatcg tgctttcggt ggtgcggaca ccctggccac ttcccacact 300
atcgcggcag gtatcaagaa actgaaatat gacattgtgt ttgctggtcg tcaggctatt 360
gacggtgaca cggcacaggt aggcccggaa atcgccgaac acctgggtat tccgcaggtg 420
acctacgtag aaaaagtaga agtagacggt gataccctga aaatccgcaa agcatgggaa 480
gatggctacg aggtggttga agtaaaaacc ccggtactgc tgaccgctat caaagagctg 540
aatgtaccgc gttacatgtc tgttgagaaa atcttcggcg cgttcgacaa ggaagtaaag 600
atgtggaccg ctgatgatat tgacgttgac aaagcgaatc tgggcctgaa gggctcccca 660
actaaagtta agaagtcctc tactaaagaa gtgaagggtc agggtgaggt gattgataaa 720
cctgttaaag aagctgctgc gtacgtggtt tctaagctga aagaagaaca ctatatttaa 780
<210>7
<211>2577
<212>DNA
<213>Ca-adhE2-co
<400>7
atgaaagtta caaatcaaaa agaactgaaa cagaagttaa atgagctgcg tgaggcgcaa 60
aaaaaatttg ccacctatac gcaggaacaa gtggataaga ttttcaaaca gtgcgcaatc 120
gctgcggcca aagaacgcat taacctggca aagttagctg ttgaagagac tggcatcggt 180
ctggtcgagg acaaaattat caaaaatcat tttgcggccg agtacattta taacaagtac 240
aaaaacgaga aaacctgtgg gatcattgac cacgatgata gcctgggaat cacaaaggta 300
gcagaaccga ttggcatcgt ggctgcgatt gttccaacga ctaatcctac atctaccgcc 360
atcttcaaaa gtttaatttc actgaaaacg cggaatgcaa tctttttctc cccgcatcca 420
cgtgctaaga aatcgaccat tgcggccgca aaactgattt tagacgcggc tgtcaaggcc 480
ggtgcaccta aaaacatcat tgggtggatc gacgaaccga gcattgaact gtctcaggat 540
ctgatgagtg aggcggacat cattttagct actggaggcc cgtcaatggt aaaagccgca 600
tattcctcgg gtaagccagc gatcggcgtg ggtgctggga atactcctgc cattatcgac 660
gaaagcgcag acattgatat ggcggtttct agtatcattc tgtcaaaaac gtacgacaac 720
ggagtcatct gcgcctccga acagtcgatt ctggtgatga atagcatcta tgagaaagta 780
aaggaagagt ttgttaaacg cggctcttac attctgaacc agaatgaaat tgcaaaaatc 840
aaggaaacca tgttcaaaaa cggtgcgatt aatgctgata tcgtgggcaa aagtgcctat 900
attatcgcga agatggctgg tattgaggtc ccgcaaacta caaaaatctt aattggggaa 960
gttcagtcag tagaaaaatc cgagctgttt agccacgaaa agctgtcgcc ggtgttagca 1020
atgtataaag tcaaagattt cgacgaggcc ctgaagaaag cgcagcgtct gatcgaatta 1080
ggaggctctg gtcataccag ttcactgtac attgatagcc aaaacaataa agacaaggtt 1140
aaagaatttg ggctggctat gaaaacgtcc cgcaccttta tcaacatgcc atcgtctcag 1200
ggcgcaagtg gtgatttata taatttcgcc attgcgccta gctttactct gggatgtggc 1260
acatggggtg ggaactcagt gtcccaaaat gtagagccga agcatctgct gaacatcaaa 1320
tcggtcgctg aacggcgtga gaatatgtta tggttcaaag ttccacagaa gatttacttt 1380
aaatatggct gcctgcgctt cgcactgaaa gaattaaagg atatgaacaa aaaacgtgcc 1440
tttatcgtga cggacaagga tctgttcaaa ctgggttacg taaataaaat taccaaggtt 1500
ttagacgaaa ttgatatcaa atattctatt tttactgaca tcaaaagcga tccgacaatt 1560
gatagtgtga agaaaggagc gaaagagatg ctgaacttcg aacctgacac gatcatttca 1620
atcggcggtg ggtccccgat ggatgctgca aaggtcatgc atctgttata cgagtatcca 1680
gaagccgaaa ttgagaatct ggcgatcaac tttatggaca ttcgcaaacg gatctgtaat 1740
tttccgaaac tgggaaccaa ggctattagc gttgcaatcc ctactacggc cggcaccggt 1800
tcggaagcga caccgttcgc tgtgattacc aacgatgaga ctgggatgaa atatccactg 1860
acatcttacg aattaacgcc gaatatggca atcattgata ccgaactgat gctgaacatg 1920
cctcgtaaat taactgccgc gacgggcatt gacgcactgg tacacgccat cgaggcgtat 1980
gtcagtgtta tggcaaccga ttacacagac gaactggcgt tacgcgctat taagatgatc 2040
tttaaatatc tgccacgtgc ctacaaaaat ggtactaacg atattgaagc gcgcgagaag 2100
atggctcatg catcaaatat cgccggaatg gcgttcgcta acgcatttct gggcgtgtgc 2160
cacagcatgg cccataaatt aggtgcgatg caccatgtac cgcatgggat tgcttgtgca 2220
gtcctgatcg aagaggttat taaatataat gccacggact gccctaccaa gcagacagcg 2280
ttcccgcaat acaaatcccc aaacgctaaa cggaagtatg cagaaatcgc cgaatatctg 2340
aatctgaaag gcacttcgga tacggagaaa gtgaccgcgt taattgaagc tatctctaag 2400
ctgaaaattg atctgagtat cccgcagaac atttcagcag ccggtattaa taaaaaggac 2460
ttttacaaca ccttagataa aatgagcgag ctggcgttcg acgatcaatg tacaactgct 2520
aatcctcgtt atccgctgat ctccgaatta aaagatatct atataaaatc attttaa 2577
<210>8
<211>1152
<212>DNA
<213>Me-bcd-co
<400>8
atggatttta acttaacaga tattcagcaa gacttcctga agctggcaca cgactttggt 60
gaaaagaaac tggcccctac tgttaccgaa cgcgaccaca aaggtatcta cgataaagaa 120
ctgattgacg aactgctgtc tctgggtatc accggcgcat acttcgaaga aaaatacggc 180
ggtagcggtg acgacggtgg cgatgtactg tcttatatcc tggccgtaga agaactggcg 240
aaatacgacg ctggtgttgc tatcactctg tctgccaccg taagcctgtg tgcgaatccg 300
atttggcagt ttggtactga ggctcagaaa gaaaagtttc tggttccact ggtcgaaggt 360
actaaactgg gtgcgtttgg tctgaccgaa ccgaacgcgg gcactgatgc gagcggccag 420
caaactattg ctactaaaaa cgatgacggc acgtacaccc tgaacggtag caaaatcttc 480
atcaccaacg gtggcgctgc cgatatctac atcgtatttg cgatgaccga caaaagcaag 540
ggtaaccatg gcatcaccgc gttcatcctg gaagatggca ctccgggttt cacctacggc 600
aaaaaggaag ataaaatggg tatccacacc tctcagacta tggaactggt tttccaggac 660
gttaaggtcc cggccgagaa catgctgggc gaagaaggca aaggcttcaa gattgcaatg 720
atgaccctgg acggcggtcg cattggcgtt gcggcccagg cactgggcat cgcagaggca 780
gcgctggccg acgctgttga atacagcaaa cagcgtgttc agtttggcaa acctctgtgc 840
aaattccaat ccattagctt taagctggcc gatatgaaaa tgcagatcga agccgcacgc 900
aacctggtat ataaagctgc atgcaagaaa caagaaggta aaccgttcac cgtagacgct 960
gcgatcgcga aacgtgtagc cagcgatgtg gcaatgcgcg tgactaccga agcagttcag 1020
attttcggtg gctatggtta ctctgaagaa tacccggtgg ctcgccacat gcgcgacgca 1080
aaaatcactc agatctacga gggtacgaac gaagtgcagc tgatggtcac cggcggtgct 1140
ctgttaagtt aa 1152
<210>9
<211>1017
<212>DNA
<213>Me-eftA-co
<400>9
atggatttag cagaatacaa aggcatctac gtgatcgcag agcagttcga aggtaaactg 60
cgtgacgttt ctttcgaact gctgggtcaa gcgcgcatcc tggcggacac gatcggcgac 120
gaagtaggcg caatcctgat tggcaaagat gtaaaaccac tggcgcagga actgatcgcg 180
catggtgctc ataaagtgta cgtctatgac gacccgcagc tggaacatta caacacgact 240
gcctatgcca aagtgatttg cgacttcttt catgaagaga aaccaaacgt tttcctggtt 300
ggtgcaacta acatcggtcg tgacctgggt ccacgtgtag cgaacagcct gaaaaccggt 360
ctgactgcgg attgtaccca gctgggtgtt gatgatgata agaaaaccat cgtttggacc 420
cgtccggcac tgggcggcaa catcatggcg gaaattatct gtccagataa ccgcccgcag 480
atgggcactg tgcgtcctca tgtcttcaaa aagccggaag ccgacccgag cgcaactggt 540
gaagtcattg aaaagaaagc gaacctgtct gacgctgatt tcatgactaa gttcgtagaa 600
ctgatcaaac tgggtggtga aggcgttaaa atcgaggatg ccgatgttat tgttgctggt 660
ggccgtggca tgaatagcga agagcctttt aaaaccggta tcctgaaaga gtgcgcggac 720
gtactgggcg gtgctgtcgg tgccagccgt gccgccgtgg acgcgggctg gatcgacgct 780
ctgcaccagg tcggccagac tggcaaaacc gttggtccga aaatctacat tgcttgtgcg 840
attagcggtg ctatccagcc gctggcaggc atgacgggct ctgattgtat tatcgcaatt 900
aacaaagatg aagacgcgcc tattttcaag gtgtgcgact atggcattgt gggcgatgtg 960
ttcaaagtgc tgccactgct gactgaggcg atcaagaaac agaaaggcat tgcataa 1017
<210>10
<211>813
<212>DNA
<213>Me-eftB-co
<400>10
atggaaatat tggtatgtgt caaacaagtg ccggatactg cagaagtcaa aattgatccg 60
gttaaacaca ccgtgattcg tgcgggtgtg ccgaatatct tcaacccgtt cgaccaaaac 120
gcgctggaag cggcgctggc gctgaaggac gcggataaag acgttaagat tactctgctg 180
tctatgggcc cggaccaggc aaaagatgtt ctgcgtgaag gcctggccat gggcgctgat 240
gacgcgtacc tgctgtccga tcgtaaactg ggtggctccg acactctggc caccggttat 300
gctctggccc aggctattaa gaaactggct gcggacaagg gtattgagca attcgacatc 360
atcctgtgtg gtaagcaagc gattgacggt gataccgctc aggtaggtcc acagatcgct 420
tgtgagctgg gcatcccgca gatcacttat gctcgtgaca tcaaggttga gggcgataag 480
gttactgtgc agcaggaaaa cgaagagggt tacatcgtga ccgaagcgca gttcccggtt 540
ctgatcaccg cggttaaaga cctgaacgaa cctcgtttcc cgaccatccg tggcaccatg 600
aaggcgaagc gtcgtgaaat cccgaacctg gacgcagctg cagttgccgc ggacgacgcg 660
cagatcggcc tgtccggttc tccgaccaaa gtacgcaaaa ttttcacccc accgcagcgt 720
tccggcggtc tggtactgaa agtggaagac gacaacgaac aggccattgt cgaccaggtt 780
atggaaaaac tggttgccca gaaaatcatt taa 813
<210>11
<211>5024
<212>DNA
<213>pGV1090
<400>11
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttcaaaattg 1080
aaggcttcaa aaatagatag gaggtaagtt tatatggatt ttaatttaac aagagaacag 1140
gaactggtcc gtcagatggt acgtgaattt gcagaaaacg aggttaaacc gattgctgca 1200
gagattgatg agactgaacg cttcccgatg gaaaacgtca aaaagatggg tcagtatggc 1260
atgatgggca ttccgttctc taaagagtac ggcggtgcgg gtggcgacgt tctgtcttat 1320
atcatcgctg tagaggaact gtccaaagta tgtggcacca cgggcgtgat cctgtccgcg 1380
cacacctctc tgtgcgcaag cctgatcaac gaacacggca ccgaggaaca gaagcaaaaa 1440
tacctggtcc cgctggccaa aggtgaaaag atcggtgcat acggtctgac ggaaccgaac 1500
gcaggtacgg acagcggcgc acaacagacg gttgcggtac tggaaggcga ccactacgtt 1560
attaacggta gcaaaatctt catcacgaac ggtggcgtgg ctgacacctt tgttatcttc 1620
gcgatgaccg accgcactaa aggcactaaa ggtatctctg cgttcatcat cgagaagggt 1680
ttcaagggtt tttctatcgg caaagtggaa cagaagctgg gtatccgtgc ctcctctact 1740
accgagctgg ttttcgaaga catgattgtg ccggttgaaa atatgatcgg caaagaaggc 1800
aaaggcttcc cgatcgctat gaaaaccctg gatggcggcc gtatcggcat tgcagcacag 1860
gcactgggta tcgcagaagg cgctttcaac gaagcacgtg cgtacatgaa agaacgtaaa 1920
cagtttggcc gttctctgga taaatttcaa ggcctggcgt ggatgatggc agacatggac 1980
gtagcgattg aatctgcgcg ctacctggtc tataaagcag cttacctgaa acaggcaggt 2040
ctgccttaca ccgttgacgc agcacgtgcg aaactgcacg cggccaacgt tgccatggat 2100
gttaccacca aagccgtgca actgtttggc ggttacggct atactaagga ttatccggtt 2160
gaacgtatga tgcgtgacgc gaaaatcacc gaaatctatg aaggtacttc cgaagtgcag 2220
aaactggtca tttcaggaaa aatttttagt taattaaagg aggttaagag gatgaatata 2280
gttgtttgtt taaaacaggt cccggacacc gcagaagttc gtattgatcc agtaaagggt 2340
acgctgattc gcgagggcgt gccgtctatc atcaacccag atgacaagaa cgccctggaa 2400
gaagcactgg tcctgaaaga taattacggc gctcacgtaa ctgttatctc tatgggtccg 2460
ccgcaagcga aaaatgcgct ggttgaagct ctggcgatgg gcgctgacga ggctgttctg 2520
ctgactgatc gtgctttcgg tggtgcggac accctggcca cttcccacac tatcgcggca 2580
ggtatcaaga aactgaaata tgacattgtg tttgctggtc gtcaggctat tgacggtgac 2640
acggcacagg taggcccgga aatcgccgaa cacctgggta ttccgcaggt gacctacgta 2700
gaaaaagtag aagtagacgg tgataccctg aaaatccgca aagcatggga agatggctac 2760
gaggtggttg aagtaaaaac cccggtactg ctgaccgcta tcaaagagct gaatgtaccg 2820
cgttacatgt ctgttgagaa aatcttcggc gcgttcgaca aggaagtaaa gatgtggacc 2880
gctgatgata ttgacgttga caaagcgaat ctgggcctga agggctcccc aactaaagtt 2940
aagaagtcct ctactaaaga agtgaagggt cagggtgagg tgattgataa acctgttaaa 3000
gaagctgctg cgtacgtggt ttctaagctg aaagaagaac actatattta agttaggagg 3060
gatttttcaa tgaataaagc agattacaag ggcgtttggg tctttgcgga acagcgtgat 3120
ggtgaactgc agaaagtgtc cctggaactg ctgggcaaag gcaaggagat ggcagaaaaa 3180
ctgggtgttg aactgaccgc agttctgctg ggtcacaaca ctgaaaagat gtccaaagac 3240
ctgctgtccc atggcgcaga caaggtgctg gctgcggaca acgaactgct ggctcacttt 3300
agcaccgacg gttatgcaaa agtaatctgc gacctggtta acgagcgcaa gccggaaatc 3360
ctgttcatcg gcgccacttt tattggtcgc gacctgggcc ctcgtattgc tgcgcgtctg 3420
tccactggcc tgactgcgga ttgcacctcc ctggacattg atgttgaaaa ccgtgatctg 3480
ctggcaactc gcccggcatt cggcggcaac ctgatcgcca ccatcgtatg ttccgaccac 3540
cgtccgcaaa tggctactgt acgtccgggc gtatttgaaa agctgccggt gaacgacgca 3600
aacgtttccg acgacaaaat cgaaaaagtt gctatcaagc tgaccgctag cgatatccgt 3660
accaaagttt ctaaagtagt gaaactggcg aaggacatcg cagatattgg tgaagcaaaa 3720
gttctggtgg caggcggtcg tggcgtcggt tccaaagaga acttcgaaaa actggaggaa 3780
ctggcgtctc tgctgggcgg tactattgca gcgtcccgtg cagcaatcga aaaagaatgg 3840
gtggacaagg atctgcaggt gggccagact ggtaaaaccg ttcgtccgac cctgtacatc 3900
gcctgcggca tctccggtgc tattcagcac ctggccggca tgcaggacag cgactacatc 3960
atcgccatca acaaagacgt tgaagctccg atcatgaaag tggcggacct ggcaatcgtt 4020
ggtgacgtga acaaagttgt tccggaactg atcgcgcagg ttaaagctgc taataattaa 4080
ggatcccatg gtacgcgtgc tagaggcatc aaataaaacg aaaggctcag tcgaaagact 4140
gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg acaaatccgc 4200
cgccctagac ctaggcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 4260
acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 4320
aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 4380
tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 4440
aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 4500
gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcaatgctc 4560
acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 4620
accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 4680
ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 4740
gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag 4800
gacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 4860
ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 4920
gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 4980
cgctcagtgg aacgaaaact cacgttaagg gattttggtc atga 5024
<210>12
<211>3206
<212>DNA
<213>pGV1095
<400>12
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttcaacagga 1080
ggggttaaag tggttgattt cgaatattca ataccaacta gaattttttt cggtaaagat 1140
aagataaatg tacttggaag agagcttaaa aaatatggtt ctaaagtgct tatagtttat 1200
ggtggaggaa gtataaagag aaatggaata tatgataaag ctgtaagtat acttgaaaaa 1260
aacagtatta aattttatga acttgcagga gtagagccaa atccaagagt aactacagtt 1320
gaaaaaggag ttaaaatatg tagagaaaat ggagttgaag tagtactagc tataggtgga 1380
ggaagtgcaa tagattgcgc aaaggttata gcagcagcat gtgaatatga tggaaatcca 1440
tgggatattg tgttagatgg ctcaaaaata aaaagggtgc ttcctatagc tagtatatta 1500
accattgctg caacaggatc agaaatggat acgtgggcag taataaataa tatggataca 1560
aacgaaaaac taattgcggc acatccagat atggctccta agttttctat attagatcca 1620
acgtatacgt ataccgtacc taccaatcaa acagcagcag gaacagctga tattatgagt 1680
catatatttg aggtgtattt tagtaataca aaaacagcat atttgcagga tagaatggca 1740
gaagcgttat taagaacttg tattaaatat ggaggaatag ctcttgagaa gccggatgat 1800
tatgaggcaa gagccaatct aatgtgggct tcaagtcttg cgataaatgg acttttaaca 1860
tatggtaaag acactaattg gagtgtacac ttaatggaac atgaattaag tgcttattac 1920
gacataacac acggcgtagg gcttgcaatt ttaacaccta attggatgga gtatatttta 1980
aataatgata cagtgtacaa gtttgttgaa tatggtgtaa atgtttgggg aatagacaaa 2040
gaaaaaaatc actatgacat agcacatcaa gcaatacaaa aaacaagaga ttactttgta 2100
aatgtactag gtttaccatc tagactgaga gatgttggaa ttgaagaaga aaaattggac 2160
ataatggcaa aggaatcagt aaagcttaca ggaggaacca taggaaacct aagaccagta 2220
aacgcctccg aagtcctaca aatattcaaa aaatctgtgt aaggatccca tggtacgcgt 2280
gctagaggca tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt cgttttatct 2340
gttgtttgtc ggtgaacgct ctcctgagta ggacaaatcc gccgccctag acctaggcgt 2400
tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc 2460
aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 2520
aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 2580
tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 2640
ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 2700
cgcctttctc ccttcgggaa gcgtggcgct ttctcaatgc tcacgctgta ggtatctcag 2760
ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 2820
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 2880
gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 2940
agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg 3000
cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 3060
aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 3120
aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 3180
ctcacgttaa gggattttgg tcatga 3206
<210>13
<211>2836
<212>DNA
<213>pGV1094
<400>13
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccggg aattcctatc 1080
tatttttgaa gccttcaatt tttcttttct ctatgaaagc tgtcattgca tccttttgat 1140
cctctgttga aaagcattct ccaaatgctt ctgattcaaa tgctaaagca gtatcaatat 1200
cacactgcat tcctctatta atagcctgtt tgcttaactt aacagctact ggagcattgc 1260
tcacaatttt gtttgcaatt tcttttgctg tattcattaa ttcactaggt tctactacct 1320
tatttacaag tccgattctt aatgcttcat ctgcctttat attttgtgca gtaaatataa 1380
gctgctttgc catgcccatt ccaactaatc ttgaaagtct ttgtgtacca ccaaaaccag 1440
gtgttattcc gagacctact tctggttgac caaatcttgc gttgcttgaa gctattctta 1500
tatcacaaga catagctatt tcgcatccgc ctcctaaagc aaaaccatta acagctgcta 1560
ttacaggctt ttcaagaagt tctaatcttc taaacacttt atttccaagt atcccgaatt 1620
ttctaccttc aatggtattc atttccttca tctcagaaat atctgctcct gctacaaatg 1680
atttttctcc tgctccagtt aaaattactg caagtacttc gctatcattt tcaatttcac 1740
ctataacata atccatttct tttagtgtat cactatttaa cgcatttaat gctttaggtc 1800
tgttaatggt aactacagca actttacctt ccttttcaag gatgacattg tttagttcca 1860
tgactaatcc tcctaaaata ttggatccga tccgatccca tggtacgcgt gctagaggca 1920
tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt cgttttatct gttgtttgtc 1980
ggtgaacgct ctcctgagta ggacaaatcc gccgccctag acctaggcgt tcggctgcgg 2040
cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac 2100
gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 2160
ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 2220
agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 2280
tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 2340
ccttcgggaa gcgtggcgct ttctcaatgc tcacgctgta ggtatctcag ttcggtgtag 2400
gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 2460
ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 2520
gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 2580
aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg 2640
aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 2700
ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 2760
gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 2820
gggattttgg tcatga 2836
<210>14
<211>2908
<212>DNA
<213>pGV1037
<400>14
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgga attcattgat 1080
agtttcttta aatttaggga ggtctgttta atgaaaaagg tatgtgttat aggtgcaggt 1140
actatgggtt caggaattgc tcaggcattt gcagctaaag gatttgaagt agtattaaga 1200
gatattaaag atgaatttgt tgatagagga ttagatttta tcaataaaaa tctttctaaa 1260
ttagttaaaa aaggaaagat agaagaagct actaaagttg aaatcttaac tagaatttcc 1320
ggaacagttg accttaatat ggcagctgat tgcgatttag ttatagaagc agctgttgaa 1380
agaatggata ttaaaaagca gatttttgct gacttagaca atatatgcaa gccagaaaca 1440
attcttgcat caaatacatc atcactttca ataacagaag tggcatcagc aactaaaaga 1500
cctgataagg ttataggtat gcatttcttt aatccagctc ctgttatgaa gcttgtagag 1560
gtaataagag gaatagctac atcacaagaa acttttgatg cagttaaaga gacatctata 1620
gcaataggaa aagatcctgt agaagtagca gaagcaccag gatttgttgt aaatagaata 1680
ttaataccaa tgattaatga agcagttggt atattagcag aaggaatagc ttcagtagaa 1740
gacatagata aagctatgaa acttggagct aatcacccaa tgggaccatt agaattaggt 1800
gattttatag gtcttgatat atgtcttgct ataatggatg ttttatactc agaaactgga 1860
gattctaagt atagaccaca tacattactt aagaagtatg taagagcagg atggcttgga 1920
agaaaatcag gaaaaggttt ctacgattat tcaaaataag gatccgatcc catggtacgc 1980
gtgctagagg catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat 2040
ctgttgtttg tcggtgaacg ctctcctgag taggacaaat ccgccgccct agacctaggc 2100
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 2160
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 2220
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 2280
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 2340
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 2400
tccgcctttc tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc 2460
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 2520
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 2580
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 2640
acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 2700
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 2760
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 2820
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 2880
aactcacgtt aagggatttt ggtcatga 2908
<210>15
<211>6219
<212>DNA
<213>pGV1031
<400>15
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt accatatgca 420
taagtttaat ttttttgtta aaaaatatta aactttgtgt tttttttaac aaaatatatt 480
gataaaaata ataatagtgg gtataattaa gttgttagag aaaacgtata aattagggat 540
aaactatgga acttatgaaa tagattgaaa tggtttatct gttaccccgt atcaaaattt 600
aggaggttag ttagaatgaa agaagttgta atagctagtg cagtaagaac agcgattgga 660
tcttatggaa agtctcttaa ggatgtacca gcagtagatt taggagctac agctataaag 720
gaagcagtta aaaaagcagg aataaaacca gaggatgtta atgaagtcat tttaggaaat 780
gttcttcaag caggtttagg acagaatcca gcaagacagg catcttttaa agcaggatta 840
ccagttgaaa ttccagctat gactattaat aaggtttgtg gttcaggact tagaacagtt 900
agcttagcag cacaaattat aaaagcagga gatgctgacg taataatagc aggtggtatg 960
gaaaatatgt ctagagctcc ttacttagcg aataacgcta gatggggata tagaatggga 1020
aacgctaaat ttgttgatga aatgatcact gacggattgt gggatgcatt taatgattac 1080
cacatgggaa taacagcaga aaacatagct gagagatgga acatttcaag agaagaacaa 1140
gatgagtttg ctcttgcatc acaaaaaaaa gctgaagaag ctataaaatc aggtcaattt 1200
aaagatgaaa tagttcctgt agtaattaaa ggcagaaagg gagaaactgt agttgataca 1260
gatgagcacc ctagatttgg atcaactata gaaggacttg caaaattaaa acctgccttc 1320
aaaaaagatg gaacagttac agctggtaat gcatcaggat taaatgactg tgcagcagta 1380
cttgtaatca tgagtgcaga aaaagctaaa gagcttggag taaaaccact tgctaagata 1440
gtttcttatg gttcagcagg agttgaccca gcaataatgg gatatggacc tttctatgca 1500
acaaaagcag ctattgaaaa agcaggttgg acagttgatg aattagattt aatagaatca 1560
aatgaagctt ttgcagctca aagtttagca gtagcaaaag atttaaaatt tgatatgaat 1620
aaagtaaatg taaatggagg agctattgcc cttggtcatc caattggagc atcaggtgca 1680
agaatactcg ttactcttgt acacgcaatg caaaaaagag atgcaaaaaa aggcttagca 1740
actttatgta taggtggcgg acaaggaaca gcaatattgc tagaaaagtg ctagaaagga 1800
tccagaattt aaaaggaggg attaaaatga actctaaaat aattagattt gaaaatttaa 1860
ggtcattctt taaagatggg atgacaatta tgattggagg ttttttaaac tgtggcactc 1920
caaccaaatt aattgatttt ttagttaatt taaatataaa gaatttaacg attataagta 1980
atgatacatg ttatcctaat acaggtattg gtaagttaat atcaaataat caagtaaaaa 2040
agcttattgc ttcatatata ggcagcaacc cagatactgg caaaaaactt tttaataatg 2100
aacttgaagt agagctctct ccccaaggaa ctctagtgga aagaatacgt gcaggcggat 2160
ctggcttagg tggtgtacta actaaaacag gtttaggaac tttgattgaa aaaggaaaga 2220
aaaaaatatc tataaatgga acggaatatt tgttagagct acctcttaca gccgatgtag 2280
cattaattaa aggtagtatt gtagatgagg ccggaaacac cttctataaa ggtactacta 2340
aaaactttaa tccctatatg gcaatggcag ctaaaaccgt aatagttgaa gctgaaaatt 2400
tagttagctg tgaaaaacta gaaaaggaaa aagcaatgac ccccggagtt cttataaatt 2460
atatagtaaa ggagcctgca taaaatgatt aatgataaaa acctagcgaa agaaataata 2520
gccaaaagag ttgcaagaga attaaaaaat ggtcaacttg taaacttagg tgtaggtctt 2580
cctaccatgg ttgcagatta tataccaaaa aatttcaaaa ttactttcca atcagaaaac 2640
ggaatagttg gaatgggcgc tagtcctaaa ataaatgagg cagataaaga tgtagtaaat 2700
gcaggaggag actatacaac agtacttcct gacggcacat ttttcgatag ctcagtttcg 2760
ttttcactaa tccgtggtgg tcacgtagat gttactgttt taggggctct ccaggtagat 2820
gaaaagggta atatagccaa ttggattgtt cctggaaaaa tgctctctgg tatgggtgga 2880
gctatggatt tagtaaatgg agctaagaaa gtaataattg caatgagaca tacaaataaa 2940
ggtcaaccta aaattttaaa aaaatgtaca cttcccctca cggcaaagtc tcaagcaaat 3000
ctaattgtaa cagaacttgg agtaattgag gttattaatg atggtttact tctcactgaa 3060
attaataaaa acacaaccat tgatgaaata aggtctttaa ctgctgcaga tttactcata 3120
tccaatgaac ttagacccat ggctgtttag aaagaattct tgatatcagg aaggtgactt 3180
ttatgttaaa ggatgaagta attaaacaaa ttagcacgcc attaacttcg cctgcatttc 3240
ctagaggacc ctataaattt cataatcgtg agtattttaa cattgtatat cgtacagata 3300
tggatgctct tcgtaaagtt gtgccagagc ctttagaaat tgatgagccc ttagtcaggt 3360
ttgaaattat ggcaatgcat gatacgagtg gacttggttg ttatacagaa agcggacagg 3420
ctattcccgt aagctgtaat ggagttaagg gagattatct tcatatgatg tatttagata 3480
atgagcctgc aattgcagta ggaagggaat taagtgcata tcctaaaaag ctcgggtatc 3540
caaagctttt tgtggattca gatactttag taggaacttt agactatgga aaacttagag 3600
ttgcgacagc tacaatgggg tacaaacata aagccttaga tgctaatgaa gcaaaggatc 3660
aaatttgtcg ccctaattat atgttgaaaa taatacccaa ttatgatgga agccctagga 3720
tatgtgagct tataaatgcg aaaatcacag atgttaccgt acatgaagct tggacaggac 3780
caactcgact gcagttattt gatcacgcta tggcgccact taatgatttg ccagtaaaag 3840
agattgtttc tagctctcac attcttgcag atataatatt gcctagagct gaagttatat 3900
atgattatct taagtaataa aaataagagt taccttaaat ggtaactctt atttttttaa 3960
tgtcgacctg caggcatgca agcttggcgt aatcatggtc atagctgttt cctgtgtgaa 4020
attgttatcc gctcacaatt ccacacaaca tacgagccgg aagcataaag tgtaaagcct 4080
ggggtgccta atgagtgagc taactcacat taattgcgtt gcgctcactg cccgctttcc 4140
agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg 4200
gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 4260
ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag 4320
gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa 4380
aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc 4440
gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc 4500
ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg 4560
cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt 4620
cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc 4680
gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc 4740
cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag 4800
agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg 4860
ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa 4920
ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag 4980
gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact 5040
cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa 5100
attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt 5160
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 5220
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 5280
gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc 5340
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 5400
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 5460
ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 5520
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 5580
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 5640
tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 5700
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 5760
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 5820
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 5880
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 5940
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 6000
ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt 6060
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc 6120
cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat 6180
taacctataa aaataggcgt atcacgaggc cctttcgtc 6219
<210>16
<211>2855
<212>DNA
<213>pGV1049
<400>16
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttcattaaag 1080
aggagaaagg taccaaaata agcaagtttg aaggaggtcc ttagaatgga attaaaaaat 1140
gttattcttg aaaaagaagg gcatttagct attgttacaa tcaatagacc aaaggcatta 1200
aatgcattga attcagaaac actaaaagat ttaaatgttg ttttagatga tttagaagca 1260
gacaacaatg tgtatgcagt tatagttaca ggtgctggtg agaaatcttt tgttgctgga 1320
gcagatattt cagaaatgaa agatcttaat gaagaacaag gtaaagaatt tggtatttta 1380
ggaaacaatg tcttcagaag attagaaaaa ttggataagc cagttatcgc agctatatca 1440
ggatttgctc ttggtggtgg atgtgaactt gctatgtcat gtgacataag aatagcttca 1500
gttaaagcta aatttggtca accagaagca ggacttggaa taactccagg atttggtgga 1560
actcaaagat tagctagaat tgtagggcca ggaaaagcta aagaattaat ttatacttgt 1620
gaccttataa atgcagaaga agcttataga ataggtttag ttaataaagt agttgaatta 1680
gaaaaattga tggaagaagc aaaagcaatg gctaacaaga ttgcagctaa tgctccaaaa 1740
gcagttgcat attgtaaaga tgctatagac agaggaatgc aagttgatat agatgcagct 1800
atattaatag aagcagaaga ctttggaaag tgctttgcaa cagaagatca aacagaagga 1860
atgactgcgt tcttagaaag aagagcagaa aagaattttc aaaataaata aggatcccat 1920
ggtacgcgtg ctagaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 1980
gttttatctg ttgtttgtcg gtgaacgctc tcctgagtag gacaaatccg ccgccctaga 2040
cctaggcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc 2100
cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag 2160
gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 2220
tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 2280
ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 2340
atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcaatgct cacgctgtag 2400
gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 2460
tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 2520
cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 2580
cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt 2640
tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 2700
cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 2760
cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 2820
gaacgaaaac tcacgttaag ggattttggt catga 2855
<210>17
<211>2891
<212>DNA
<213>pGV1050
<400>17
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttcaaaagat 1080
ttagaggagg aataattcat gaaaaagatt tttgtacttg gagcaggaac aatgggtgct 1140
ggtatcgttc aagcattcgc tcaaaaaggt tgtgaagtaa ttgtaagaga cataaaggaa 1200
gaatttgttg acagaggaat agctggaatc actaaaggat tagaaaagca agttgctaaa 1260
ggaaaaatgt ctgaagaaga taaagaagct atactttcaa gaatttcagg aacaactgat 1320
atgaaattag ctgctgactg tgatttagta gttgaagctg caatcgaaaa catgaaaatt 1380
aagaaggaaa tcttcgctga attagatgga atttgtaagc cagaagcgat tttagcttca 1440
aacacttcat ctttatcaat tactgaagtt gcttcagcta caaagagacc tgataaagtt 1500
atcggaatgc atttctttaa tccagctcca gtaatgaagc ttgttgaaat tattaaagga 1560
atagctactt ctcaagaaac ttttgatgct gttaaggaat tatcagttgc tattggaaaa 1620
gaaccagtag aagttgcaga agctccagga ttcgttgtaa acagaatatt aatcccaatg 1680
attaacgaag cttcatttat cctacaagaa ggaatagctt cagttgaaga tattgataca 1740
gctatgaaat atggtgctaa ccatccaatg ggacctttag ctttaggaga tcttattgga 1800
ttagacgttt gcttagctat catggatgtt ttattcactg aaacaggtga taacaagtac 1860
agagctagca gcatattaag aaaatatgtt agagctggat ggcttggaag aaaatcagga 1920
aaaggattct atgattattc taaataagga tcccatggta cgcgtgctag aggcatcaaa 1980
taaaacgaaa ggctcagtcg aaagactggg cctttcgttt tatctgttgt ttgtcggtga 2040
acgctctcct gagtaggaca aatccgccgc cctagaccta ggcgttcggc tgcggcgagc 2100
ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg 2160
aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct 2220
ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca 2280
gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct 2340
cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc 2400
gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat ctcagttcgg tgtaggtcgt 2460
tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc 2520
cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc 2580
cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg 2640
gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc 2700
agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag 2760
cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga 2820
tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat 2880
tttggtcatg a 2891
<210>18
<211>3205
<212>DNA
<213>pGV1091
<400>18
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttcattaaag 1080
aggagaaagg taccatggca cgttttactt taccaagaga catttatcat ggagaaggag 1140
cacttgaggc acttaaaact ttaaaaggta agaaagcttt cttagtagtt ggtggcggat 1200
caatgaaaag atttggattt cttaaacaag ttgaagatta tttaaaagaa gcaggaatgg 1260
aagtagaatt atttgaaggt gttgaaccag atccatcagt ggaaacagta atgaaaggcg 1320
cagaagctat gagaaacttt gagcctgatt ggatagttgc aatgggtgga ggatcaccaa 1380
ttgatgctgc aaaggctatg tggatattct acgaataccc agattttact tttgaacaag 1440
cagttgttcc atttggatta ccagacctta gacaaaaagc taagtttgta gctattccat 1500
caacaagcgg tacagctaca gaagttacag cattctcagt tatcacaaat tattcagaaa 1560
aaattaaata tcctttagct gattttaaca taactccaga tatagcaata gttgatccag 1620
cacttgctca aactatgcca aaaactttaa cagctcatac tggaatggat gcattaactc 1680
acgctataga agcatacact gcatcacttc aatcaaattt ctcagatcca ttagcaatta 1740
aagctgtaga aatggttcaa gaaaatttaa tcaaatcatt tgaaggagat aaagaagcta 1800
gaaatctaat gcatgaagct caatgtttag ctggaatggc attttctaat gcattacttg 1860
gaatagttca ctcaatggct cataaggttg gtgctgtatt ccatattcct catggatgtg 1920
caaatgctat atttttacca tatgtaattg agtataacag aacaaaatgc gaaaatagat 1980
atggagatat tgcgagagcc ttaaaattaa aaggaaacaa tgatgccgag ttaactgatt 2040
cattaattga attaattaat ggattaaatg ataagttaga gattcctcac tcaatgaaag 2100
agtatggagt tactgaagaa gattttaaag ctaatctttc atttatcgct cataacgcag 2160
tattagatgc atgcacagga tcaaatccta gagaaataga tgatgctaca atggaaaaat 2220
tatttgaatg cacatactat ggaactaaag ttaatttgta aggatcccat ggtacgcgtg 2280
ctagaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc gttttatctg 2340
ttgtttgtcg gtgaacgctc tcctgagtag gacaaatccg ccgccctaga cctaggcgtt 2400
cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca 2460
ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 2520
aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 2580
cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 2640
cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 2700
gcctttctcc cttcgggaag cgtggcgctt tctcaatgct cacgctgtag gtatctcagt 2760
tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 2820
cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 2880
ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 2940
gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc 3000
gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 3060
accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 3120
ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 3180
tcacgttaag ggattttggt catga 3205
<210>19
<211>3449
<212>DNA
<213>pGV1096
<400>19
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccggg aattcggagg 1080
aatagttcat gaataaagac acactaatac ctacaactaa agatttaaaa gtaaaaacaa 1140
atggtgaaaa cattaattta aagaactaca aggataattc ttcatgtttc ggagtattcg 1200
aaaatgttga aaatgctata agcagcgctg tacacgcaca aaagatatta tcccttcatt 1260
atacaaaaga gcaaagagaa aaaatcataa ctgagataag aaaggccgca ttacaaaata 1320
aagaggtctt ggctacaatg attctagaag aaacacatat gggaagatat gaggataaaa 1380
tattaaaaca tgaattggta gctaaatata ctcctggtac agaagattta actactactg 1440
cttggtcagg tgataatggt cttacagttg tagaaatgtc tccatatggt gttataggtg 1500
caataactcc ttctacgaat ccaactgaaa ctgtaatatg taatagcata ggcatgatag 1560
ctgctggaaa tgctgtagta tttaacggac acccatgcgc taaaaaatgt gttgcctttg 1620
ctgttgaaat gataaataag gcaattattt catgtggcgg tcctgaaaat ctagtaacaa 1680
ctataaaaaa tccaactatg gagtctctag atgcaattat taagcatcct tcaataaaac 1740
ttctttgcgg aactgggggt ccaggaatgg taaaaaccct cttaaattct ggtaagaaag 1800
ctataggtgc tggtgctgga aatccaccag ttattgtaga tgatactgct gatatagaaa 1860
aggctggtag gagcatcatt gaaggctgtt cttttgataa taatttacct tgtattgcag 1920
aaaaagaagt atttgttttt gagaatgttg cagatgattt aatatctaac atgctaaaaa 1980
ataatgctgt aattataaat gaagatcaag tatcaaaatt aatagattta gtattacaaa 2040
aaaataatga aactcaagaa tactttataa acaaaaaatg ggtaggaaaa gatgcaaaat 2100
tattcttaga tgaaatagat gttgagtctc cttcaaatgt taaatgcata atctgcgaag 2160
taaatgcaaa tcatccattt gttatgacag aactcatgat gccaatattg ccaattgtaa 2220
gagttaaaga tatagatgaa gctattaaat atgcaaagat agcagaacaa aatagaaaac 2280
atagtgccta tatttattct aaaaatatag acaacctaaa tagatttgaa agagaaatag 2340
atactactat ttttgtaaag aatgctaaat cttttgctgg tgttggttat gaagcagaag 2400
gatttacaac tttcactatt gctggatcta ctggtgaggg aataacctct gcaaggaatt 2460
ttacaagaca aagaagatgt gtacttgccg gctaaggatc cgatccgatc ccatggtacg 2520
cgtgctagag gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta 2580
tctgttgttt gtcggtgaac gctctcctga gtaggacaaa tccgccgccc tagacctagg 2640
cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 2700
atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 2760
taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 2820
aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 2880
tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 2940
gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct gtaggtatct 3000
cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 3060
cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 3120
atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 3180
tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat 3240
ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 3300
acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 3360
aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 3420
aaactcacgt taagggattt tggtcatga 3449
<210>20
<211>1425
<212>DNA
<213>1pdA
<400>20
atgagtactg aaatcaaaac tcaggtcgtg gtacttgggg caggccccgc aggttactcc 60
gctgccttcc gttgcgctga tttaggtctg gaaaccgtaa tcgtagaacg ttacaacacc 120
cttggcggtg tttgcctgaa cgtcggctgt atcccttcta aagcactgct gcacgtagca 180
aaagttatcg aagaagccaa agcgctggct gaacacggta tcgtcttcgg cgaaccgaaa 240
accgatatcg acaagattcg tacctggaaa gagaaagtga tcaatcagct gaccggtggt 300
ctggctggta tggcgaaagg ccgcaaagtc aaagtggtca acggtctggg taaattcacc 360
ggggctaaca ccctggaagt tgaaggtgag aacggcaaaa ccgtgatcaa cttcgacaac 420
gcgatcattg cagcgggttc tcgcccgatc caactgccgt ttattccgca tgaagatccg 480
cgtatctggg actccactga cgcgctggaa ctgaaagaag taccagaacg cctgctggta 540
atgggtggcg gtatcatcgg tctggaaatg ggcaccgttt accacgcgct gggttcacag 600
attgacgtgg ttgaaatgtt cgaccaggtt atcccggcag ctgacaaaga catcgttaaa 660
gtcttcacca agcgtatcag caagaaattc aacctgatgc tggaaaccaa agttaccgcc 720
gttgaagcga aagaagacgg catttatgtg acgatggaag gcaaaaaagc acccgctgaa 780
ccgcagcgtt acgacgccgt gctggtagcg attggtcgtg tgccgaacgg taaaaacctc 840
gacgcaggca aagcaggcgt ggaagttgac gaccgtggtt tcatccgcgt tgacaaacag 900
ctgcgtacca acgtaccgca catctttgct atcggcgata tcgtcggtca accgatgctg 960
gcacacaaag gtgttcacga aggtcacgtt gccgctgaag ttatcgccgg taagaaacac 1020
tacttcgatc cgaaagttat cccgtccatc gcctataccg aaccagaagt tgcatgggtg 1080
ggtctgactg agaaagaagc gaaagagaaa ggcatcagct atgaaaccgc caccttcccg 1140
tgggctgctt ctggtcgtgc tatcgcttcc gactgcgcag acggtatgac caagctgatt 1200
ttcgacaaag aatctcaccg tgtgatcggt ggtgcgattg tcggtactaa cggcggcgag 1260
ctgctgggtg aaatcggcct ggcaatcgaa atgggttgtg atgctgaaga catcgcactg 1320
accatccacg cgcacccgac tctgcacgag tctgtgggcc tggcggcaga agtgttcgaa 1380
ggtagcatta ccgacctgcc gaacccgaaa gcgaagaaga agtaa 1425
<210>21
<211>2664
<212>DNA
<213>aceE
<400>21
atgtcagaac gtttcccaaa tgacgtggat ccgatcgaaa ctcgcgactg gctccaggcg 60
atcgaatcgg tcatccgtga agaaggtgtt gagcgtgctc agtatctgat cgaccaactg 120
cttgctgaag cccgcaaagg cggtgtaaac gtagccgcag gcacaggtat cagcaactac 180
atcaacacca tccccgttga agaacaaccg gagtatccgg gtaatctgga actggaacgc 240
cgtattcgtt cagctatccg ctggaacgcc atcatgacgg tgctgcgtgc gtcgaaaaaa 300
gacctcgaac tgggcggcca tatggcgtcc ttccagtctt ccgcaaccat ttatgatgtg 360
tgctttaacc acttcttccg tgcacgcaac gagcaggatg gcggcgacct ggtttacttc 420
cagggccaca tctccccggg cgtgtacgct cgtgctttcc tggaaggtcg tctgactcag 480
gagcagctgg ataacttccg tcaggaagtt cacggcaatg gcctctcttc ctatccgcac 540
ccgaaactga tgccggaatt ctggcagttc ccgaccgtat ctatgggtct gggtccgatt 600
ggtgctattt accaggctaa attcctgaaa tatctggaac accgtggcct gaaagatacc 660
tctaaacaaa ccgtttacgc gttcctcggt gacggtgaaa tggacgaacc ggaatccaaa 720
ggtgcgatca ccatcgctac ccgtgaaaaa ctggataacc tggtcttcgt tatcaactgt 780
aacctgcagc gtcttgacgg cccggtcacc ggtaacggca agatcatcaa cgaactggaa 840
ggcatcttcg aaggtgctgg ctggaacgtg atcaaagtga tgtggggtag ccgttgggat 900
gaactgctgc gtaaggatac cagcggtaaa ctgatccagc tgatgaacga aaccgttgac 960
ggcgactacc agaccttcaa atcgaaagat ggtgcgtacg ttcgtgaaca cttcttcggt 1020
aaatatcctg aaaccgcagc actggttgca gactggactg acgagcagat ctgggcactg 1080
aaccgtggtg gtcacgatcc gaagaaaatc tacgctgcat tcaagaaagc gcaggaaacc 1140
aaaggcaaag cgacagtaat ccttgctcat accattaaag gttacggcat gggcgacgcg 1200
gctgaaggta aaaacatcgc gcaccaggtt aagaaaatga acatggacgg tgtgcgtcat 1260
atccgcgacc gtttcaatgt gccggtgtct gatgcagata tcgaaaaact gccgtacatc 1320
accttcccgg aaggttctga agagcatacc tatctgcacg ctcagcgtca gaaactgcac 1380
ggttatctgc caagccgtca gccgaacttc accgagaagc ttgagctgcc gagcctgcaa 1440
gacttcggcg cgctgttgga agagcagagc aaagagatct ctaccactat cgctttcgtt 1500
cgtgctctga acgtgatgct gaagaacaag tcgatcaaag atcgtctggt accgatcatc 1560
gccgacgaag cgcgtacttt cggtatggaa ggtctgttcc gtcagattgg tatttacagc 1620
ccgaacggtc agcagtacac cccgcaggac cgcgagcagg ttgcttacta taaagaagac 1680
gagaaaggtc agattctgca ggaagggatc aacgagctgg gcgcaggttg ttcctggctg 1740
gcagcggcga cctcttacag caccaacaat ctgccgatga tcccgttcta catctattac 1800
tcgatgttcg gcttccagcg tattggcgat ctgtgctggg cggctggcga ccagcaagcg 1860
cgtggcttcc tgatcggcgg tacttccggt cgtaccaccc tgaacggcga aggtctgcag 1920
cacgaagatg gtcacagcca cattcagtcg ctgactatcc cgaactgtat ctcttacgac 1980
ccggcttacg cttacgaagt tgctgtcatc atgcatgacg gtctggagcg tatgtacggt 2040
gaaaaacaag agaacgttta ctactacatc actacgctga acgaaaacta ccacatgccg 2100
gcaatgccgg aaggtgctga ggaaggtatc cgtaaaggta tctacaaact cgaaactatt 2160
gaaggtagca aaggtaaagt tcagctgctc ggctccggtt ctatcctgcg tcacgtccgt 2220
gaagcagctg agatcctggc gaaagattac ggcgtaggtt ctgacgttta tagcgtgacc 2280
tccttcaccg agctggcgcg tgatggtcag gattgtgaac gctggaacat gctgcacccg 2340
ctggaaactc cgcgcgttcc gtatatcgct caggtgatga acgacgctcc ggcagtggca 2400
tctaccgact atatgaaact gttcgctgag caggtccgta cttacgtacc ggctgacgac 2460
taccgcgtac tgggtactga tggcttcggt cgttccgaca gccgtgagaa cctgcgtcac 2520
cacttcgaag ttgatgcttc ttatgtcgtg gttgcggcgc tgggcgaact ggctaaacgt 2580
ggcgaaatcg ataagaaagt ggttgctgac gcaatcgcca aattcaacat cgatgcagat 2640
aaagttaacc cgcgtctggc gtaa 2664
<210>22
<211>1893
<212>DNA
<213>aceF
<400>22
atggctatcg aaatcaaagt accggacatc ggggctgatg aagttgaaat caccgagatc 60
ctggtcaaag tgggcgacaa agttgaagcc gaacagtcgc tgatcaccgt agaaggcgac 120
aaagcctcta tggaagttcc gtctccgcag gcgggtatcg ttaaagagat caaagtctct 180
gttggcgata aaacccagac cggcgcactg attatgattt tcgattccgc cgacggtgca 240
gcagacgctg cacctgctca ggcagaagag aagaaagaag cagctccggc agcagcacca 300
gcggctgcgg cggcaaaaga cgttaacgtt ccggatatcg gcagcgacga agttgaagtg 360
accgaaatcc tggtgaaagt tggcgataaa gttgaagctg aacagtcgct gatcaccgta 420
gaaggcgaca aggcttctat ggaagttccg gctccgtttg ctggcaccgt gaaagagatc 480
aaagtgaacg tgggtgacaa agtgtctacc ggctcgctga ttatggtctt cgaagtcgcg 540
ggtgaagcag gcgcggcagc tccggccgct aaacaggaag cagctccggc agcggcccct 600
gcaccagcgg ctggcgtgaa agaagttaac gttccggata tcggcggtga cgaagttgaa 660
gtgactgaag tgatggtgaa agtgggcgac aaagttgccg ctgaacagtc actgatcacc 720
gtagaaggcg acaaagcttc tatggaagtt ccggcgccgt ttgcaggcgt cgtgaaggaa 780
ctgaaagtca acgttggcga taaagtgaaa actggctcgc tgattatgat cttcgaagtt 840
gaaggcgcag cgcctgcggc agctcctgcg aaacaggaag cggcagcgcc ggcaccggca 900
gcaaaagctg aagccccggc agcagcacca gctgcgaaag cggaaggcaa atctgaattt 960
gctgaaaacg acgcttatgt tcacgcgact ccgctgatcc gccgtctggc acgcgagttt 1020
ggtgttaacc ttgcgaaagt gaagggcact ggccgtaaag gtcgtatcct gcgcgaagac 1080
gttcaggctt acgtgaaaga agctatcaaa cgtgcagaag cagctccggc agcgactggc 1140
ggtggtatcc ctggcatgct gccgtggccg aaggtggact tcagcaagtt tggtgaaatc 1200
gaagaagtgg aactgggccg catccagaaa atctctggtg cgaacctgag ccgtaactgg 1260
gtaatgatcc cgcatgttac tcacttcgac aaaaccgata tcaccgagtt ggaagcgttc 1320
cgtaaacagc agaacgaaga agcggcgaaa cgtaagctgg atgtgaagat caccccggtt 1380
gtcttcatca tgaaagccgt tgctgcagct cttgagcaga tgcctcgctt caatagttcg 1440
ctgtcggaag acggtcagcg tctgaccctg aagaaataca tcaacatcgg tgtggcggtg 1500
gataccccga acggtctggt tgttccggta ttcaaagacg tcaacaagaa aggcatcatc 1560
gagctgtctc gcgagctgat gactatttct aagaaagcgc gtgacggtaa gctgactgcg 1620
ggcgaaatgc agggcggttg cttcaccatc tccagcatcg gcggcctggg tactacccac 1680
ttcgcgccga ttgtgaacgc gccggaagtg gctatcctcg gcgtttccaa gtccgcgatg 1740
gagccggtgt ggaatggtaa agagttcgtg ccgcgtctga tgctgccgat ttctctctcc 1800
ttcgaccacc gcgtgatcga cggtgctgat ggtgcccgtt tcattaccat cattaacaac 1860
acgctgtctg acattcgccg tctggtgatg taa 1893
<210>23
<211>1263
<212>DNA
<213>PDA1
<400>23
atgcttgctg cttcattcaa acgccaacca tcacaattgg tccgcgggtt aggagctgtt 60
cttcgcactc ccaccaggat aggtcatgtt cgtaccatgg caactttaaa aacaactgat 120
aagaaggccc ctgaggacat cgagggctcg gacacagtgc aaattgagtt gcctgaatct 180
tccttcgagt cgtatatgct agagcctcca gacttgtctt atgagacttc gaaagccacc 240
ttgttacaga tgtataaaga tatggtcatc atcagaagaa tggagatggc ttgtgacgcc 300
ttgtacaagg ccaagaaaat cagaggtttt tgccatctat ctgttggtca ggaggccatt 360
gctgtcggta tcgagaatgc catcacaaaa ttggattcca tcatcacatc ttacagatgt 420
cacggtttca cttttatgag aggtgcctca gtgaaagccg ttctggctga attgatgggt 480
agaagagccg gtgtctctta tggtaagggt ggttccatgc acctttacgc tccaggcttc 540
tatggtggta atggtatcgt gggtgcccag gttcctttag gtgcaggttt agcttttgct 600
caccaataca agaacgagga cgcctgctct ttcactttgt atggtgatgg tgcctctaat 660
caaggtcaag tttttgaatc tttcaacatg gccaaattat ggaatttgcc cgtcgtgttt 720
tgctgtgaga acaacaagta cggtatgggt accgccgctt caagatcctc cgcgatgact 780
gaatatttca agcgtggtca atatattcca ggtttaaaag ttaacggtat ggatattcta 840
gctgtctacc aagcatccaa gtttgctaag gactggtgtc tatccggcaa aggtcctctc 900
gttctagaat atgaaaccta taggtacggt ggccattcta tgtctgatcc cggtactacc 960
tacagaacta gagacgagat tcagcatatg agatccaaga acgatccaat tgctggtctt 1020
aagatgcatt tgattgatct aggtattgcc actgaagctg aagtcaaagc ttacgacaag 1080
tccgctagaa aatacgttga cgaacaagtt gaattagctg atgctgctcc tcctccagaa 1140
gccaaattat ccatcttgtt tgaagacgtc tacgtgaaag gtacagaaac tccaacccta 1200
agaggtagga tccctgaaga tacttgggac ttcaaaaagc aaggttttgc ctctagggat 1260
taa 1163
<210>24
<211>1101
<212>DNA
<213>PDB1
<400>24
atgttttcca gactgccaac atcattggcc agaaatgttg cacgtcgtgc cccaacttct 60
tttgtaagac cctctgcagc agcagcagca ttgagattct catcaacaaa gacgatgacc 120
gtcagagagg ccttgaatag tgccatggcg gaagaattgg accgtgatga tgatgtcttc 180
cttattggtg aagaagttgc acaatataac ggggcttata aggtgtcaaa gggtttattg 240
gacaggttcg gtgaacgtcg tgtggttgac acacctatta ccgaatacgg gttcacaggt 300
ttggccgttg gtgccgcttt gaagggtttg aagccaattg tagagtttat gtcgttcaat 360
ttctctatgc aagctatcga tcatgttgtc aattccgctg caaagactca ctacatgtct 420
ggtggtactc aaaaatgtca aatggtcttc agaggtccta atggtgctgc agtgggtgtt 480
ggtgctcaac attcacagga cttttctcct tggtacggtt ccattccagg gttaaaggtc 540
cttgtccctt attctgctga agatgctagg ggtttgttaa aggccgccat cagagatcca 600
aaccctgttg tatttttaga gaacgaattg ttgtacggtg aatcttttga aatctcagaa 660
gaagctttat cccctgagtt caccttgcca tacaaggcta agatcgaaag agaaggtacc 720
gatatttcca ttgttacgta cacaagaaac gttcagtttt ctttggaagc cgctgaaatt 780
ctacaaaaga aatatggtgt ctctgcagaa gttatcaact tgcgttctat tagaccttta 840
gatactgaag ctatcatcaa aactgtcaag aagacaaacc acttgattac tgttgaatcc 900
actttcccat catttggtgt tggtgctgaa attgtcgccc aagttatgga gtctgaagcc 960
tttgattact tggatgctcc aatccaaaga gttactggtg ccgatgttcc aacaccttac 1020
gctaaagaat tagaagattt cgctttccct gatactccaa ccatcgttaa agctgtcaaa 1080
gaagtcttgt caattgaata a 1101
<210>25
<211>1233
<212>DNA
<213>PDX1
<400>25
atgctaagtg caatttccaa agtctccact ttaaaatcat gtacaagata tttaaccaaa 60
tgcaactatc atgcatcagc taaattactt gctgtaaaga cattttcaat gcctgcaatg 120
tctcctacta tggagaaagg ggggattgtg tcttggaaat ataaagttgg cgaaccattc 180
agcgcgggcg atgtgatatt agaagtggaa acagataaat ctcaaattga tgtggaagca 240
ctggacgatg gtaaactagc taagatcctg aaagatgaag gctctaaaga tgttgatgtt 300
ggtgaaccta ttgcttatat tgctgatgtt gatgatgatt tagctactat aaagttaccc 360
caagaggcca acaccgcaaa tgcgaaatct attgaaatta agaagccatc cgcagatagt 420
actgaagcaa cacaacaaca tttaaaaaaa gccacagtta caccaataaa aaccgttgac 480
ggcagccaag ccaatcttga acagacgcta ttaccatccg tgtcattact actggctgag 540
aacaatatat ccaaacaaaa ggctttgaag gaaattgcgc catctggttc caacggtaga 600
ctattaaagg gtgatgtgct agcataccta gggaaaatac cacaagattc ggttaacaag 660
gtaacagaat ttatcaagaa gaacgaacgt ctcgatttat cgaacattaa acctatacag 720
ctcaaaccaa aaatagccga gcaagctcaa acaaaagctg ccgacaagcc aaagattact 780
cctgtagaat ttgaagagca attagtgttc catgctcccg cctctattcc gtttgacaaa 840
ctgagtgaat cattgaactc tttcatgaaa gaagcttacc agttctcaca cggaacacca 900
ctaatggaca caaattcgaa atactttgac cctattttcg aggaccttgt caccttgagc 960
ccaagagagc caagatttaa attttcctat gacttgatgc aaattcccaa agctaataac 1020
atgcaagaca cgtacggtca agaagacata tttgacctct taacaggttc agacgcgact 1080
gcctcatcag taagacccgt tgaaaagaac ttacctgaaa aaaacgaata tatactagcg 1140
ttgaatgtta gcgtcaacaa caagaagttt aatgacgcgg aggccaaggc aaaaagattc 1200
cttgattacg taagggagtt agaatcattt tga 1233
<210>26
<211>1449
<212>DNA
<213>LAT1
<400>26
atgtctgcct ttgtcagggt ggttccaaga atatccagaa gttcagtact caccagatca 60
ttgagactgc aattgagatg ctacgcatcg tacccagagc acaccattat tggtatgccg 120
gcactgtctc ctacgatgac gcaaggtaat cttgctgctt ggactaagaa ggaaggtgac 180
caattgtctc ccggtgaagt tattgccgaa atagaaacag acaaggctca aatggacttt 240
gagttccaag aagatggtta cttagccaag attctagttc ctgaaggtac aaaggacatt 300
cctgtcaaca agcctattgc cgtctatgtg gaggacaaag ctgatgtgcc agcttttaag 360
gactttaagc tggaggattc aggttctgat tcaaagacca gtacgaaggc tcagcctgcc 420
gaaccacagg cagaaaagaa acaagaagcg ccagctgaag agaccaagac ttctgcacct 480
gaagctaaga aatctgacgt tgctgctcct caaggtagga tttttgcctc tccacttgcc 540
aagactatcg ccttggaaaa gggtatttct ttgaaggatg ttcacggcac tggaccccgc 600
ggtagaatta ccaaggctga cattgagtca tatctagaaa agtcgtctaa gcagtcttct 660
caaaccagtg gtgctgccgc cgccactcct gccgccgcta cctcaagcac tactgctggc 720
tctgctccat cgccttcttc tacagcatca tatgaggatg ttccaatttc aaccatgaga 780
agcatcattg gagaacgttt attgcaatct actcaaggca ttccatcata catcgtttcc 840
tccaagatat ccatctccaa acttttgaaa ttgagacagt ccttgaacgc tacagcaaac 900
gacaagtaca aactgtccat taatgaccta ttagtaaaag ccatcactgt tgcggctaag 960
agggtgccag atgccaatgc ctactggtta cctaatgaga acgttatccg taaattcaag 1020
aatgtcgatg tctcagtcgc tgttgccaca ccaacaggat tattgacacc aattgtcaag 1080
aattgtgagg ccaagggctt gtcgcaaatc tctaacgaaa tcaaggaact agtcaagcgt 1140
gccagaataa acaaattggc accagaggaa ttccaaggtg ggaccatttg catatccaat 1200
atgggcatga ataatgctgt taacatgttt acttcgatta tcaacccacc acagtctaca 1260
atcttggcca tcgctactgt tgaaagggtc gctgtggaag acgccgctgc tgagaacgga 1320
ttctcctttg ataaccaggt taccataaca gggacctttg atcatagaac cattgatggc 1380
gccaaaggtg cagaattcat gaaggaattg aaaactgtta ttgaaaatcc tttggaaatg 1440
ctattgtga 1449
<210>27
<211>1500
<212>DNA
<213>LPD1
<400>27
atgttaagaa tcagatcact cctaaataat aagcgtgcct tttcgtccac agtcaggaca 60
ttgaccatta acaagtcaca tgatgtagtc atcatcggtg gtggccctgc tggttacgtg 120
gctgctatca aagctgctca attgggattt aacactgcat gtgtagaaaa aagaggcaaa 180
ttaggcggta cctgtcttaa cgttggatgt atcccctcca aagcacttct aaataattct 240
catttattcc accaaatgca tacggaagcg caaaagagag gtattgacgt caacggtgat 300
atcaaaatta acgtagcaaa cttccaaaag gctaaggatg acgctgttaa gcaattaact 360
ggaggtattg agcttctgtt caagaaaaat aaggtcacct attataaagg taatggttca 420
ttcgaagacg aaacgaagat cagagtaact cccgttgatg ggttggaagg cactgtcaag 480
gaagaccaca tactagatgt taagaacatc atagtcgcca cgggctctga agttacaccc 540
ttccccggta ttgaaataga tgaggaaaaa attgtctctt caacaggtgc tctttcgtta 600
aaggaaattc ccaaaagatt aaccatcatt ggtggaggaa tcatcggatt ggaaatgggt 660
tcagtttact ctagattagg ctccaaggtt actgtagtag aatttcaacc tcaaattggt 720
gcatctatgg acggcgaggt tgccaaagcc acccaaaagt tcttgaaaaa gcaaggtttg 780
gacttcaaat taagcaccaa agttatttct gcaaagagaa acgacgacaa gaacgtcgtc 840
gaaattgttg tagaagatac taaaacgaat aagcaagaaa atttggaagc tgaagttttg 900
ctggttgctg ttggtagaag accttacatt gctggcttag gggctgaaaa gattggatta 960
gaagtagaca aaaggggacg cctagtcatt gatgaccaat ttaattccaa gttcccacac 1020
attaaagtgg taggagatgt tacatttggt ccaatgctgg ctcacaaagc cgaagaggaa 1080
ggtattgcag ctgtcgaaat gttgaaaact ggtcacggtc atgtcaacta taacaacatt 1140
ccttcggtca tgtattctca cccagaagta gcatgggttg gtaaaaccga agagcaattg 1200
aaagaagccg gcattgacta taaaattggt aagttcccct ttgcggccaa ttcaagagcc 1260
aagaccaacc aagacactga aggtttcgtg aagattttga tcgattccaa gaccgagcgt 1320
attttggggg ctcacattat cggtccaaat gccggtgaaa tgattgctga agctggctta 1380
gccttagaat atggcgcttc cgcagaagat gttgctaggg tctgccatgc tcatcctact 1440
ttgtccgaag catttaagga agctaacatg gctgcctatg ataaagctat tcattgttga 1500
<210>28
<211>1692
<212>DNA
<213>PDC1
<400>28
atgtctgaaa ttactttggg taaatatttg ttcgaaagat taaagcaagt caacgttaac 60
accgttttcg gtttgccagg tgacttcaac ttgtccttgt tggacaagat ctacgaagtt 120
gaaggtatga gatgggctgg taacgccaac gaattgaacg ctgcttacgc cgctgatggt 180
tacgctcgta tcaagggtat gtcttgtatc atcaccacct tcggtgtcgg tgaattgtct 240
gctttgaacg gtattgccgg ttcttacgct gaacacgtcg gtgttttgca cgttgttggt 300
gtcccatcca tctctgctca agctaagcaa ttgttgttgc accacacctt gggtaacggt 360
gacttcactg ttttccacag aatgtctgcc aacatttctg aaaccactgc tatgatcact 420
gacattgcta ccgccccagc tgaaattgac agatgtatca gaaccactta cgtcacccaa 480
agaccagtct acttaggttt gccagctaac ttggtcgact tgaacgtccc agctaagttg 540
ttgcaaactc caattgacat gtctttgaag ccaaacgatg ctgaatccga aaaggaagtc 600
attgacacca tcttggcttt ggtcaaggat gctaagaacc cagttatctt ggctgatgct 660
tgttgttcca gacacgacgt caaggctgaa actaagaagt tgattgactt gactcaattc 720
ccagctttcg tcaccccaat gggtaagggt tccattgacg aacaacaccc aagatacggt 780
ggtgtttacg tcggtacctt gtccaagcca gaagttaagg aagccgttga atctgctgac 840
ttgattttgt ctgtcggtgc tttgttgtct gatttcaaca ccggttcttt ctcttactct 900
tacaagacca agaacattgt cgaattccac tccgaccaca tgaagatcag aaacgccact 960
ttcccaggtg tccaaatgaa attcgttttg caaaagttgt tgaccactat tgctgacgcc 1020
gctaagggtt acaagccagt tgctgtccca gctagaactc cagctaacgc tgctgtccca 1080
gcttctaccc cattgaagca agaatggatg tggaaccaat tgggtaactt cttgcaagaa 1140
ggtgatgttg tcattgctga aaccggtacc tccgctttcg gtatcaacca aaccactttc 1200
ccaaacaaca cctacggtat ctctcaagtc ttatggggtt ccattggttt caccactggt 1260
gctaccttgg gtgctgcttt cgctgctgaa gaaattgatc caaagaagag agttatctta 1320
ttcattggtg acggttcttt gcaattgact gttcaagaaa tctccaccat gatcagatgg 1380
ggcttgaagc catacttgtt cgtcttgaac aacgatggtt acaccattga aaagttgatt 1440
cacggtccaa aggctcaata caacgaaatt caaggttggg accacctatc cttgttgcca 1500
actttcggtg ctaaggacta tgaaacccac agagtcgcta ccaccggtga atgggacaag 1560
ttgacccaag acaagtcttt caacgacaac tctaagatca gaatgattga aatcatgttg 1620
ccagtcttcg atgctccaca aaacttggtt gaacaagcta agttgactgc tgctaccaac 1680
gctaagcaat aa 1692
<210>29
<211>1503
<212>DNA
<213>ALD6
<400>29
atgactaagc tacactttga cactgctgaa ccagtcaaga tcacacttcc aaatggtttg 60
acatacgagc aaccaaccgg tctattcatt aacaacaagt ttatgaaagc tcaagacggt 120
aagacctatc ccgtcgaaga tccttccact gaaaacaccg tttgtgaggt ctcttctgcc 180
accactgaag atgttgaata tgctatcgaa tgtgccgacc gtgctttcca cgacactgaa 240
tgggctaccc aagacccaag agaaagaggc cgtctactaa gtaagttggc tgacgaattg 300
gaaagccaaa ttgacttggt ttcttccatt gaagctttgg acaatggtaa aactttggcc 360
ttagcccgtg gggatgttac cattgcaatc aactgtctaa gagatgctgc tgcctatgcc 420
gacaaagtca acggtagaac aatcaacacc ggtgacggct acatgaactt caccacctta 480
gagccaatcg gtgtctgtgg tcaaattatt ccatggaact ttccaataat gatgttggct 540
tggaagatcg ccccagcatt ggccatgggt aacgtctgta tcttgaaacc cgctgctgtc 600
acacctttaa atgccctata ctttgcttct ttatgtaaga aggttggtat tccagctggt 660
gtcgtcaaca tcgttccagg tcctggtaga actgttggtg ctgctttgac caacgaccca 720
agaatcagaa agctggcttt taccggttct acagaagtcg gtaagagtgt tgctgtcgac 780
tcttctgaat ctaacttgaa gaaaatcact ttggaactag gtggtaagtc cgcccatttg 840
gtctttgacg atgctaacat taagaagact ttaccaaatc tagtaaacgg tattttcaag 900
aacgctggtc aaatttgttc ctctggttct agaatttacg ttcaagaagg tatttacgac 960
gaactattgg ctgctttcaa ggcttacttg gaaaccgaaa tcaaagttgg taatccattt 1020
gacaaggcta acttccaagg tgctatcact aaccgtcaac aattcgacac aattatgaac 1080
tacatcgata tcggtaagaa agaaggcgcc aagatcttaa ctggtggcga aaaagttggt 1140
gacaagggtt acttcatcag accaaccgtt ttctacgatg ttaatgaaga catgagaatt 1200
gttaaggaag aaatttttgg accagttgtc actgtcgcaa agttcaagac tttagaagaa 1260
ggtgtcgaaa tggctaacag ctctgaattc ggtctaggtt ctggtatcga aacagaatct 1320
ttgagcacag gtttgaaggt ggccaagatg ttgaaggccg gtaccgtctg gatcaacaca 1380
tacaacgatt ttgactccag agttccattc ggtggtgtta agcaatctgg ttacggtaga 1440
gaaatgggtg aagaagtcta ccatgcatac actgaagtaa aagctgtcag aattaagttg 1500
taa 1503
<210>30
<211>2142
<212>DNA
<213>ACS1
atgtcgccct ctgccgtaca atcatcaaaa ctagaagaac agtcaagtga aattgacaag 60
ttgaaagcaa aaatgtccca gtctgccgcc actgcgcagc agaagaagga acatgagtat 120
gaacatttga cttcggtcaa gatcgtgcca caacggccca tctcagatag actgcagccc 180
gcaattgcta cccactattc tccacacttg gacgggttgc aggactatca gcgcttgcac 240
aaggagtcta ttgaagaccc tgctaagttc ttcggttcta aagctaccca atttttaaac 300
tggtctaagc cattcgataa ggtgttcatc ccagacccta aaacgggcag gccctccttc 360
cagaacaatg catggttcct caacggccaa ttaaacgcct gttacaactg tgttgacaga 420
catgccttga agactcctaa caagaaagcc attattttcg aaggtgacga gcctggccaa 480
ggctattcca ttacctacaa ggaactactt gaagaagttt gtcaagtggc acaagtgctg 540
acttactcta tgggcgttcg caagggcgat actgttgccg tgtacatgcc tatggtccca 600
gaagcaatca taaccttgtt ggccatttcc cgtatcggtg ccattcactc cgtagtcttt 660
gccgggtttt cttccaactc cttgagagat cgtatcaacg atggggactc taaagttgtc 720
atcactacag atgaatccaa cagaggtggt aaagtcattg agactaaaag aattgttgat 780
gacgcgctaa gagagacccc aggcgtgaga cacgtcttgg tttatagaaa gaccaacaat 840
ccatctgttg ctttccatgc ccccagagat ttggattggg caacagaaaa gaagaaatac 900
aagacctact atccatgcac acccgttgat tctgaggatc cattattctt gttgtatacg 960
tctggttcta ctggtgcccc caagggtgtt caacattcta ccgcaggtta cttgctggga 1020
gctttgttga ccatgcgcta cacttttgac actcaccaag aagacgtttt cttcacagct 1080
ggagacattg gctggattac aggccacact tatgtggttt atggtccctt actatatggt 1140
tgtgccactt tggtctttga agggactcct gcgtacccaa attactcccg ttattgggat 1200
attattgatg aacacaaagt cacccaattt tatgttgcgc caactgcttt gcgtttgttg 1260
aaaagagctg gtgattccta catcgaaaat cattccttaa aatctttgcg ttgcttgggt 1320
tcggtcggtg agccaattgc tgctgaagtt tgggagtggt actctgaaaa aataggtaaa 1380
aatgaaatcc ccattgtaga cacctactgg caaacagaat ctggttcgca tctggtcacc 1440
ccgctggctg gtggtgttac accaatgaaa ccgggttctg cctcattccc cttcttcggt 1500
attgatgcag ttgttcttga ccctaacact ggtgaagaac ttaacaccag ccacgcagag 1560
ggtgtccttg ccgtcaaagc tgcatggcca tcatttgcaa gaactatttg gaaaaatcat 1620
gataggtatc tagacactta tttgaaccct taccctggct actatttcac tggtgatggt 1680
gctgcaaagg ataaggatgg ttatatctgg attttgggtc gtgtagacga tgtggtgaac 1740
gtctctggtc accgtctgtc taccgctgaa attgaggctg ctattatcga agatccaatt 1800
gtggccgagt gtgctgttgt cggattcaac gatgacttga ctggtcaagc agttgctgca 1860
tttgtggtgt tgaaaaacaa atctagttgg tccaccgcaa cagatgatga attacaagat 1920
atcaagaagc atttggtctt tactgttaga aaagacatcg ggccatttgc cgcaccaaaa 1980
ttgatcattt tagtggatga cttgcccaag acaagatccg gcaaaattat gagacgtatt 2040
ttaagaaaaa tcctagcagg agaaagtgac caactaggcg acgtttctac attgtcaaac 2100
cctggcattg ttagacatct aattgattcg gtcaagttgt aa 2142
<210>31
<211>2052
<212>DNA
<213>ACS2
<400>31
atgacaatca aggaacataa agtagtttat gaagctcaca acgtaaaggc tcttaaggct 60
cctcaacatt tttacaacag ccaacccggc aagggttacg ttactgatat gcaacattat 120
caagaaatgt atcaacaatc tatcaatgag ccagaaaaat tctttgataa gatggctaag 180
gaatacttgc attgggatgc tccatacacc aaagttcaat ctggttcatt gaacaatggt 240
gatgttgcat ggtttttgaa cggtaaattg aatgcatcat acaattgtgt tgacagacat 300
gcctttgcta atcccgacaa gccagctttg atctatgaag ctgatgacga atccgacaac 360
aaaatcatca catttggtga attactcaga aaagtttccc aaatcgctgg tgtcttaaaa 420
agctggggcg ttaagaaagg tgacacagtg gctatctatt tgccaatgat tccagaagcg 480
gtcattgcta tgttggctgt ggctcgtatt ggtgctattc actctgttgt ctttgctggg 540
ttctccgctg gttcgttgaa agatcgtgtc gttgacgcta attctaaagt ggtcatcact 600
tgtgatgaag gtaaaagagg tggtaagacc atcaacacta aaaaaattgt tgacgaaggt 660
ttgaacggag tcgatttggt ttcccgtatc ttggttttcc aaagaactgg tactgaaggt 720
attccaatga aggccggtag agattactgg tggcatgagg aggccgctaa gcagagaact 780
tacctacctc ctgtttcatg tgacgctgaa gatcctctat ttttattata cacttccggt 840
tccactggtt ctccaaaggg tgtcgttcac actacaggtg gttatttatt aggtgccgct 900
ttaacaacta gatacgtttt tgatattcac ccagaagatg ttctcttcac tgccggtgac 960
gtcggctgga tcacgggtca cacctatgct ctatatggtc cattaacctt gggtaccgcc 1020
tcaataattt tcgaatccac tcctgcctac ccagattatg gtagatattg gagaattatc 1080
caacgtcaca aggctaccca tttctatgtg gctccaactg ctttaagatt aatcaaacgt 1140
gtaggtgaag ccgaaattgc caaatatgac acttcctcat tacgtgtctt gggttccgtc 1200
ggtgaaccaa tctctccaga cttatgggaa tggtatcatg aaaaagtggg taacaaaaac 1260
tgtgtcattt gtgacactat gtggcaaaca gagtctggtt ctcatttaat tgctcctttg 1320
gcaggtgctg tcccaacaaa acctggttct gctaccgtgc cattctttgg tattaacgct 1380
tgtatcattg accctgttac aggtgtggaa ttagaaggta atgatgtcga aggtgtcctt 1440
gccgttaaat caccatggcc atcaatggct agatctgttt ggaaccacca cgaccgttac 1500
atggatactt acttgaaacc ttatcctggt cactatttca caggtgatgg tgctggtaga 1560
gatcatgatg gttactactg gatcaggggt agagttgacg acgttgtaaa tgtttccggt 1620
catagattat ccacatcaga aattgaagca tctatctcaa atcacgaaaa cgtctcggaa 1680
gctgctgttg tcggtattcc agatgaattg accggtcaaa ccgtcgttgc atatgtttcc 1740
ctaaaagatg gttatctaca aaacaacgct actgaaggtg atgcagaaca catcacacca 1800
gataatttac gtagagaatt gatcttacaa gttaggggtg agattggtcc tttcgcctca 1860
ccaaaaacca ttattctagt tagagatcta ccaagaacaa ggtcaggaaa gattatgaga 1920
agagttctaa gaaaggttgc ttctaacgaa gccgaacagc taggtgacct aactactttg 1980
gccaacccag aagttgtacc tgccatcatt tctgctgtag agaaccaatt tttctctcaa 2040
aaaaagaaat aa 2052
<210>32
<211>5206
<212>DNA
<213>pGV1428
<400>32
ccataacaca gtcctttccc gcaattttct ttttctatta ctcttggcct cctctagtac 60
actctatatt tttttatgcc tcggtaatga ttttcatttt tttttttccc ctagcggatg 120
actctttttt tttcttagcg attggcatta tcacataatg aattatacat tatataaagt 180
aatgtgattt cttcgaagaa tatactaaaa aatgagcagg caagataaac gaaggcaaag 240
atgacagagc agaaagccct agtaaagcgt attacaaatg aaaccaagat tcagattgcg 300
atctctttaa agggtggtcc cctagcgata gagcactcga tcttcccaga aaaagaggca 360
gaagcagtag cagaacaggc cacacaatcg caagtgatta acgtccacac aggtataggg 420
tttctggacc atatgataca tgctctggcc aagcattccg gctggtcgct aatcgttgag 480
tgcattggtg acttacacat agacgaccat cacaccactg aagactgcgg gattgctctc 540
ggtcaagctt ttaaagaggc cctaggggcc gtgcgtggag taaaaaggtt tggatcagga 600
tttgcgcctt tggatgaggc actttccaga gcggtggtag atctttcgaa caggccgtac 660
gcagttgtcg aacttggttt gcaaagggag aaagtaggag atctctcttg cgagatgatc 720
ccgcattttc ttgaaagctt tgcagaggct agcagaatta ccctccacgt tgattgtctg 780
cgaggcaaga atgatcatca ccgtagtgag agtgcgttca aggctcttgc ggttgccata 840
agagaagcca cctcgcccaa tggtaccaac gatgttccct ccaccaaagg tgttcttatg 900
tagtgacacc gattatttaa agctgcagca tacgatatat atacatgtgt atatatgtat 960
acctatgaat gtcagtaagt atgtatacga acagtatgat actgaagatg acaaggtaat 1020
gcatcattct atacgtgtca ttctgaacga ggcgacgtcg ccggcgatca cagcggacgg 1080
tggtggcatg atggggcttg cgatgctatg tttgtttgtt ttgtgatgat gtatattatt 1140
attgaaaaac gatatcagac atttgtctga taatgcttca ttatcagaca aatgtctgat 1200
atcgtttgga gaaaaagaaa aggaaaacaa actaaatatc tactatatac cactgtattt 1260
tatactaatg actttctacg cctagtgtca ccctctcgtg tacccattga ccctgtatcg 1320
gcgcgttgcc tcgcgttcct gtaccatata tttttgttta tttaggtatt aaaatttact 1380
ttcctcatac aaatattaaa ttcaccaaac ttctcaaaaa ctaattattc gtagttacaa 1440
actctatttt acaatcacgt ttattcaacc attctacatc caataaccaa aatgcccatg 1500
tacctctcag cgaagtccaa cggtactgtc caatattctc attaaatagt ctttcatcta 1560
tatatcagaa ggtaattata attagagatt tcgaatcatt accgtgccga ttcgcacgct 1620
gcaacggcat gcatcactaa tgaaaagcat acgacgcctg cgtctgacat gcactcattc 1680
tgaagaagat tctgggcgcg tttcgttctc gttttcctct gtatattgta ctctggtgga 1740
caatttgaac ataacgtctt tcacctcgcc attctcaata atgggttcca attctatcca 1800
ggtagcggtt aattgacggt gcttaagccg tatgctcact ctaacgctac cgttgtccaa 1860
acaacggacc cctttgtgac gggtgtaaga cccatcatga agtaaaacat ctctaacggt 1920
atggaaaaga gtggtacggt caagtttcct ggcacgagtc aattttccct cttcgtgtag 1980
atcggtaccg gccgcaaatt aaagccttcg agcgtcccaa aaccttctca agcaaggttt 2040
tcagtataat gttacatgcg tacacgcgtc tgtacagaaa aaaaagaaaa atttgaaata 2100
taaataacgt tcttaatact aacataacta taaaaaaata aatagggacc tagacttcag 2160
gttgtctaac tccttccttt tcggttagag cggatgtggg gggagggcgt gaatgtaagc 2220
gtgacataac taattacatg actcgagcgg ccgcggatcc cgggaattcg tcgacaccat 2280
cttcttctga gatgagtttt tgttccatgc tagttctaga atccgtcgaa actaagttct 2340
ggtgttttaa aactaaaaaa aagactaact ataaaagtag aatttaagaa gtttaagaaa 2400
tagatttaca gaattacaat caatacctac cgtctttata tacttattag tcaagtaggg 2460
gaataatttc agggaactgg tttcaacctt ttttttcagc tttttccaaa tcagagagag 2520
cagaaggtaa tagaaggtgt aagaaaatga gatagataca tgcgtgggtc aattgccttg 2580
tgtcatcatt tactccaggc aggttgcatc actccattga ggttgtgccc gttttttgcc 2640
tgtttgtgcc cctgttctct gtagttgcgc taagagaatg gacctatgaa ctgatggttg 2700
gtgaagaaaa caatattttg gtgctgggat tctttttttt tctggatgcc agcttaaaaa 2760
gcgggctcca ttatatttag tggatgccag gaataaactg ttcacccaga cacctacgat 2820
gttatatatt ctgtgtaacc cgccccctat tttgggcatg tacgggttac agcagaatta 2880
aaaggctaat tttttgacta aataaagtta ggaaaatcac tactattaat tatttacgta 2940
ttctttgaaa tggcgagtat tgataatgat aaactgagct agatctgggc ccgagctcca 3000
gcttttgttc cctttagtga gggttaattg cgcgcttggc gtaatcatgg tcatagctgt 3060
ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa cataggagcc ggaagcataa 3120
agtgtaaagc ctggggtgcc taatgagtga ggtaactcac attaattgcg ttgcgctcac 3180
tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg 3240
cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact gactcgctgc 3300
gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat 3360
ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca 3420
ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc 3480
atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc 3540
aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg 3600
gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta 3660
ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg 3720
ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac 3780
acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag 3840
gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat 3900
ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat 3960
ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc 4020
gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt 4080
ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct 4140
agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt 4200
ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc 4260
gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac 4320
catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat 4380
cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg 4440
cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata 4500
gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta 4560
tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt 4620
gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag 4680
tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa 4740
gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc 4800
gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt 4860
taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc 4920
tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta 4980
ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa 5040
taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca 5100
tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac 5160
aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgt 5206
<210>33
<211>5157
<212>DNA
<213>pGV1429
<400>33
caggcaagtg cacaaacaat acttaaataa atactactca gtaataacct atttcttagc 60
atttttgacg aaatttgcta ttttgttaga gtcttttaca ccatttgtct ccacacctcc 120
gcttacatca acaccaataa cgccatttaa tctaagcgca tcaccaacat tttctggcgt 180
cagtccacca gctaacataa aatgtaagct ttcggggctc tcttgccttc caacccagtc 240
agaaatcgag ttccaatcca aaagttcacc tgtcccacct gcttctgaat caaacaaggg 300
aataaacgaa tgaggtttct gtgaagctgc actgagtagt atgttgcagt cttttggaaa 360
tacgagtctt ttaataactg gcaaaccgag gaactcttgg tattcttgcc acgactcatc 420
tccatgcagt tggacgatat caatgccgta atcattgacc agagccaaaa catcctcctt 480
aggttgatta cgaaacacgc caaccaagta tttcggagtg cctgaactat ttttatatgc 540
ttttacaaga cttgaaattt tccttgcaat aaccgggtca attgttctct ttctattggg 600
cacacatata atacccagca agtcagcatc ggaatctaga gcacattctg cggcctctgt 660
gctctgcaag ccgcaaactt tcaccaatgg accagaacta cctgtgaaat taataacaga 720
catactccaa gctgcctttg tgtgcttaat cacgtatact cacgtgctca atagtcacca 780
atgccctccc tcttggccct ctccttttct tttttcgacc gaattaattc ttaatcggca 840
aaaaaagaaa agctccggat caagattgta cgtaaggtga caagctattt ttcaataaag 900
aatatcttcc actactgcca tctggcgtca taactgcaaa gtacacatat attacgatgc 960
tgtctattaa atgcttccta tattatatat atagtaatgt cgttgacgtc gccggcgatc 1020
acagcggacg gtggtggcat gatggggctt gcgatgctat gtttgtttgt tttgtgatga 1080
tgtatattat tattgaaaaa cgatatcaga catttgtctg ataatgcttc attatcagac 1140
aaatgtctga tatcgtttgg agaaaaagaa aaggaaaaca aactaaatat ctactatata 1200
ccactgtatt ttatactaat gactttctac gcctagtgtc accctctcgt gtacccattg 1260
accctgtatc ggcgcgttgc ctcgcgttcc tgtaccatat atttttgttt atttaggtat 1320
taaaatttac tttcctcata caaatattaa attcaccaaa cttctcaaaa actaattatt 1380
cgtagttaca aactctattt tacaatcacg tttattcaac cattctacat ccaataacca 1440
aaatgcccat gtacctctca gcgaagtcca acggtactgt ccaatattct cattaaatag 1500
tctttcatct atatatcaga aggtaattat aattagagat ttcgaatcat taccgtgccg 1560
attcgcacgc tgcaacggca tgcatcacta atgaaaagca tacgacgcct gcgtctgaca 1620
tgcactcatt ctgaagaaga ttctgggcgc gtttcgttct cgttttcctc tgtatattgt 1680
actctggtgg acaatttgaa cataacgtct ttcacctcgc cattctcaat aatgggttcc 1740
aattctatcc aggtagcggt taattgacgg tgcttaagcc gtatgctcac tctaacgcta 1800
ccgttgtcca aacaacggac ccctttgtga cgggtgtaag acccatcatg aagtaaaaca 1860
tctctaacgg tatggaaaag agtggtacgg tcaagtttcc tggcacgagt caattttccc 1920
tcttcgtgta gatcggtacc ggccgcaaat taaagccttc gagcgtccca aaaccttctc 1980
aagcaaggtt ttcagtataa tgttacatgc gtacacgcgt ctgtacagaa aaaaaagaaa 2040
aatttgaaat ataaataacg ttcttaatac taacataact ataaaaaaat aaatagggac 2100
ctagacttca ggttgtctaa ctccttcctt ttcggttaga gcggatgtgg ggggagggcg 2160
tgaatgtaag cgtgacataa ctaattacat gactcgagcg gccgcggatc ccgggaattc 2220
gtcgacacca tcttcttctg agatgagttt ttgttccatg ctagttctag aatccgtcga 2280
aactaagttc tggtgtttta aaactaaaaa aaagactaac tataaaagta gaatttaaga 2340
agtttaagaa atagatttac agaattacaa tcaataccta ccgtctttat atacttatta 2400
gtcaagtagg ggaataattt cagggaactg gtttcaacct tttttttcag ctttttccaa 2460
atcagagaga gcagaaggta atagaaggtg taagaaaatg agatagatac atgcgtgggt 2520
caattgcctt gtgtcatcat ttactccagg caggttgcat cactccattg aggttgtgcc 2580
cgttttttgc ctgtttgtgc ccctgttctc tgtagttgcg ctaagagaat ggacctatga 2640
actgatggtt ggtgaagaaa acaatatttt ggtgctggga ttcttttttt ttctggatgc 2700
cagcttaaaa agcgggctcc attatattta gtggatgcca ggaataaact gttcacccag 2760
acacctacga tgttatatat tctgtgtaac ccgcccccta ttttgggcat gtacgggtta 2820
cagcagaatt aaaaggctaa ttttttgact aaataaagtt aggaaaatca ctactattaa 2880
ttatttacgt attctttgaa atggcgagta ttgataatga taaactgagc tagatctggg 2940
cccgagctcc agcttttgtt ccctttagtg agggttaatt gcgcgcttgg cgtaatcatg 3000
gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca acataggagc 3060
cggaagcata aagtgtaaag cctggggtgc ctaatgagtg aggtaactca cattaattgc 3120
gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat 3180
cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac 3240
tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 3300
aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca 3360
gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 3420
ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 3480
ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 3540
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 3600
ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 3660
cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 3720
cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 3780
gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 3840
aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 3900
tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 3960
gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 4020
tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 4080
gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 4140
tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 4200
ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 4260
ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 4320
tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 4380
aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 4440
gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 4500
gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 4560
ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 4620
gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 4680
gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 4740
gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 4800
tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 4860
gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 4920
agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 4980
aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 5040
ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 5100
gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgt 5157
<210>34
<211>6041
<212>DNA
<213>pGV1430
<400>34
ccagttaact gtgggaatac tcaggtatcg taagatgcaa gagttcgaat ctcttagcaa 60
ccattatttt tttcctcaac ataacgagaa cacacagggg cgctatcgca cagaatcaaa 120
ttcgatgact ggaaattttt tgttaatttc agaggtcgcc tgacgcatat acctttttca 180
actgaaaaat tgggagaaaa aggaaaggtg agagcgccgg aaccggcttt tcatatagaa 240
tagagaagcg ttcatgacta aatgcttgca tcacaatact tgaagttgac aatattattt 300
aaggacctat tgttttttcc aataggtggt tagcaatcgt cttactttct aacttttctt 360
accttttaca tttcagcaat atatatatat atatttcaag gatataccat tctaatgtct 420
gcccctaaga agatcgtcgt tttgccaggt gaccacgttg gtcaagaaat cacagccgaa 480
gccattaagg ttcttaaagc tatttctgat gttcgttcca atgtcaagtt cgatttcgaa 540
aatcatttaa ttggtggtgc tgctatcgat gctacaggtg ttccacttcc agatgaggcg 600
ctggaagcct ccaagaaggc tgatgccgtt ttgttaggtg ctgtgggtgg tcctaaatgg 660
ggtaccggta gtgttagacc tgaacaaggt ttactaaaaa tccgtaaaga acttcaattg 720
tacgccaact taagaccatg taactttgca tccgactctc ttttagactt atctccaatc 780
aagccacaat ttgctaaagg tactgacttc gttgttgtca gagaattagt gggaggtatt 840
tactttggta agagaaagga agacgatggt gatggtgtcg cttgggatag tgaacaatac 900
accgttccag aagtgcaaag aatcacaaga atggccgctt tcatggccct acaacatgag 960
ccaccattgc ctatttggtc cttggataaa gctaatgttt tggcctcttc aagattatgg 1020
agaaaaactg tggaggaaac catcaagaac gaattcccta cattgaaggt tcaacatcaa 1080
ttgattgatt ctgccgccat gatcctagtt aagaacccaa cccacctaaa tggtattata 1140
atcaccagca acatgtttgg tgatatcatc tccgatgaag cctccgttat cccaggttcc 1200
ttgggtttgt tgccatctgc gtccttggcc tctttgccag acaagaacac cgcatttggt 1260
ttgtacgaac catgccacgg ttctgctcca gatttgccaa agaataaggt caaccctatc 1320
gccactatct tgtctgctgc aatgatgttg aaattgtcat tgaacttgcc tgaagaaggt 1380
aaggccattg aagatgcagt taaaaaggtt ttggatgcag gtatcagaac tggtgattta 1440
ggtggttcca acagtaccac cgaagtcggt gatgctgtcg ccgaagaagt taagaaaatc 1500
cttgcttaaa aagattctct ttttttatga tatttgtaca taaactttat aaatgaaatt 1560
cataatagaa acgacacgaa attacaaaat ggaatatgtt catagggtag acgaaactat 1620
atacgcaatc tacatacatt tatcaagaag gagaaaaagg aggatgtaaa ggaatacagg 1680
taagcaaatt gatactaatg gctcaacgtg ataaggaaaa agaattgcac tttaacatta 1740
atattgacaa ggaggagggc accacacaaa aagttaggtg taacagaaaa tcatgaaact 1800
atgattccta atttatatat tggaggattt tctctaaaaa aaaaaaaata caacaaataa 1860
aaaacactca atgacctgac catttgatgg agttgccggc gatcacagcg gacggtggtg 1920
gcatgatggg gcttgcgatg ctatgtttgt ttgttttgtg atgatgtata ttattattga 1980
aaaacgatat cagacatttg tctgataatg cttcattatc agacaaatgt ctgatatcgt 2040
ttggagaaaa agaaaaggaa aacaaactaa atatctacta tataccactg tattttatac 2100
taatgacttt ctacgcctag tgtcaccctc tcgtgtaccc attgaccctg tatcggcgcg 2160
ttgcctcgcg ttcctgtacc atatattttt gtttatttag gtattaaaat ttactttcct 2220
catacaaata ttaaattcac caaacttctc aaaaactaat tattcgtagt tacaaactct 2280
attttacaat cacgtttatt caaccattct acatccaata accaaaatgc ccatgtacct 2340
ctcagcgaag tccaacggta ctgtccaata ttctcattaa atagtctttc atctatatat 2400
cagaaggtaa ttataattag agatttcgaa tcattaccgt gccgattcgc acgctgcaac 2460
ggcatgcatc actaatgaaa agcatacgac gcctgcgtct gacatgcact cattctgaag 2520
aagattctgg gcgcgtttcg ttctcgtttt cctctgtata ttgtactctg gtggacaatt 2580
tgaacataac gtctttcacc tcgccattct caataatggg ttccaattct atccaggtag 2640
cggttaattg acggtgctta agccgtatgc tcactctaac gctaccgttg tccaaacaac 2700
ggaccccttt gtgacgggtg taagacccat catgaagtaa aacatctcta acggtatgga 2760
aaagagtggt acggtcaagt ttcctggcac gagtcaattt tccctcttcg tgtagatcgg 2820
taccggccgc aaattaaagc cttcgagcgt cccaaaacct tctcaagcaa ggttttcagt 2880
ataatgttac atgcgtacac gcgtctgtac agaaaaaaaa gaaaaatttg aaatataaat 2940
aacgttctta atactaacat aactataaaa aaataaatag ggacctagac ttcaggttgt 3000
ctaactcctt ccttttcggt tagagcggat gtggggggag ggcgtgaatg taagcgtgac 3060
ataactaatt acatgactcg agcggccgcg gatcccggga attcgtcgac accatcttct 3120
tctgagatga gtttttgttc catgctagtt ctagaatccg tcgaaactaa gttctggtgt 3180
tttaaaacta aaaaaaagac taactataaa agtagaattt aagaagttta agaaatagat 3240
ttacagaatt acaatcaata cctaccgtct ttatatactt attagtcaag taggggaata 3300
atttcaggga actggtttca accttttttt tcagcttttt ccaaatcaga gagagcagaa 3360
ggtaatagaa ggtgtaagaa aatgagatag atacatgcgt gggtcaattg ccttgtgtca 3420
tcatttactc caggcaggtt gcatcactcc attgaggttg tgcccgtttt ttgcctgttt 3480
gtgcccctgt tctctgtagt tgcgctaaga gaatggacct atgaactgat ggttggtgaa 3540
gaaaacaata ttttggtgct gggattcttt ttttttctgg atgccagctt aaaaagcggg 3600
ctccattata tttagtggat gccaggaata aactgttcac ccagacacct acgatgttat 3660
atattctgtg taacccgccc cctattttgg gcatgtacgg gttacagcag aattaaaagg 3720
ctaatttttt gactaaataa agttaggaaa atcactacta ttaattattt acgtattctt 3780
tgaaatggcg agtattgata atgataaact gagctagatc tgggcccgag ctccagcttt 3840
tgttcccttt agtgagggtt aattgcgcgc ttggcgtaat catggtcata gctgtttcct 3900
gtgtgaaatt gttatccgct cacaattcca cacaacatag gagccggaag cataaagtgt 3960
aaagcctggg gtgcctaatg agtgaggtaa ctcacattaa ttgcgttgcg ctcactgccc 4020
gctttccagt cgggaaacct gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg 4080
agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg 4140
gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca 4200
gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac 4260
cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac 4320
aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 4380
tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 4440
ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat 4500
ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 4560
cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 4620
ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 4680
gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt 4740
atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 4800
aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 4860
aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 4920
gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc 4980
cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct 5040
gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca 5100
tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct 5160
ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca 5220
ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc 5280
atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg 5340
cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct 5400
tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa 5460
aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta 5520
tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc 5580
ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg 5640
agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa 5700
gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg 5760
agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc 5820
accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg 5880
gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat 5940
cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata 6000
ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg t 6041
<210>35
<211>5639
<212>DNA
<213>pGV1431
<400>35
ctgattggaa agaccattct gctttacttt tagagcatct tggtcttctg agctcattat 60
acctcaatca aaactgaaat taggtgcctg tcacggctct ttttttactg tacctgtgac 120
ttcctttctt atttccaagg atgctcatca caatacgctt ctagatctat tatgcattat 180
aattaatagt tgtagctaca aaaggtaaaa gaaagtccgg ggcaggcaac aatagaaatc 240
ggcaaaaaaa actacagaaa tactaagagc ttcttcccca ttcagtcatc gcatttcgaa 300
acaagagggg aatggctctg gctagggaac taaccaccat cgcctgactc tatgcactaa 360
ccacgtgact acatatatgt gatcgttttt aacatttttc aaaggctgtg tgtctggctg 420
tttccattaa ttttcactga ttaagcagtc atattgaatc tgagctcatc accaacaaga 480
aatactaccg taaaagtgta aaagttcgtt taaatcattt gtaaactgga acagcaagag 540
gaagtatcat cagctagccc cataaactaa tcaaaggagg atgtctacta agagttactc 600
ggaaagagca gctgctcata gaagtccagt tgctgccaag cttttaaact tgatggaaga 660
gaagaagtca aacttatgtg cttctcttga tgttcgtaaa acagcagagt tgttaagatt 720
agttgaggtt ttgggtccat atatctgtct attgaagaca catgtagata tcttggagga 780
tttcagcttt gagaatacca ttgtgccgtt gaagcaatta gcagagaaac acaagttttt 840
gatatttgaa gacaggaagt ttgccgacat tgggaacact gttaaattac aatacacgtc 900
tggtgtatac cgtatcgccg aatggtctga tatcaccaat gcacacggtg tgactggtgc 960
gggcattgtt gctggtttga agcaaggtgc cgaggaagtt acgaaagaac ctagagggtt 1020
gttaatgctt gccgagttat cgtccaaggg gtctctagcg cacggtgaat acactcgtgg 1080
gaccgtggaa attgccaaga gtgataagga ctttgttatt ggatttattg ctcaaaacga 1140
tatgggtgga agagaagagg gctacgattg gttgatcatg acgccaggtg ttggtcttga 1200
tgacaaaggt gatgctttgg gacaacaata cagaactgtg gatgaagttg ttgccggtgg 1260
atcagacatc attattgttg gtagaggtct tttcgcaaag ggaagagatc ctgtagtgga 1320
aggtgagaga tacagaaagg cgggatggga cgcttacttg aagagagtag gcagatccgc 1380
ttaagagttc tccgagaaca agcagaggtt cgagtgtact cggatcagaa gttacaagtt 1440
gatcgtttat atataaacta tacagagatg ttagagtgta atggcattgc gtgccggcga 1500
tcacagcgga cggtggtggc atgatggggc ttgcgatgct atgtttgttt gttttgtgat 1560
gatgtatatt attattgaaa aacgatatca gacatttgtc tgataatgct tcattatcag 1620
acaaatgtct gatatcgttt ggagaaaaag aaaaggaaaa caaactaaat atctactata 1680
taccactgta ttttatacta atgactttct acgcctagtg tcaccctctc gtgtacccat 1740
tgaccctgta tcggcgcgtt gcctcgcgtt cctgtaccat atatttttgt ttatttaggt 1800
attaaaattt actttcctca tacaaatatt aaattcacca aacttctcaa aaactaatta 1860
ttcgtagtta caaactctat tttacaatca cgtttattca accattctac atccaataac 1920
caaaatgccc atgtacctct cagcgaagtc caacggtact gtccaatatt ctcattaaat 1980
agtctttcat ctatatatca gaaggtaatt ataattagag atttcgaatc attaccgtgc 2040
cgattcgcac gctgcaacgg catgcatcac taatgaaaag catacgacgc ctgcgtctga 2100
catgcactca ttctgaagaa gattctgggc gcgtttcgtt ctcgttttcc tctgtatatt 2160
gtactctggt ggacaatttg aacataacgt ctttcacctc gccattctca ataatgggtt 2220
ccaattctat ccaggtagcg gttaattgac ggtgcttaag ccgtatgctc actctaacgc 2280
taccgttgtc caaacaacgg acccctttgt gacgggtgta agacccatca tgaagtaaaa 2340
catctctaac ggtatggaaa agagtggtac ggtcaagttt cctggcacga gtcaattttc 2400
cctcttcgtg tagatcggta ccggccgcaa attaaagcct tcgagcgtcc caaaaccttc 2460
tcaagcaagg ttttcagtat aatgttacat gcgtacacgc gtctgtacag aaaaaaaaga 2520
aaaatttgaa atataaataa cgttcttaat actaacataa ctataaaaaa ataaataggg 2580
acctagactt caggttgtct aactccttcc ttttcggtta gagcggatgt ggggggaggg 2640
cgtgaatgta agcgtgacat aactaattac atgactcgag cggccgcgga tcccgggaat 2700
tcgtcgacac catcttcttc tgagatgagt ttttgttcca tgctagttct agaatccgtc 2760
gaaactaagt tctggtgttt taaaactaaa aaaaagacta actataaaag tagaatttaa 2820
gaagtttaag aaatagattt acagaattac aatcaatacc taccgtcttt atatacttat 2880
tagtcaagta ggggaataat ttcagggaac tggtttcaac cttttttttc agctttttcc 2940
aaatcagaga gagcagaagg taatagaagg tgtaagaaaa tgagatagat acatgcgtgg 3000
gtcaattgcc ttgtgtcatc atttactcca ggcaggttgc atcactccat tgaggttgtg 3060
cccgtttttt gcctgtttgt gcccctgttc tctgtagttg cgctaagaga atggacctat 3120
gaactgatgg ttggtgaaga aaacaatatt ttggtgctgg gattcttttt ttttctggat 3180
gccagcttaa aaagcgggct ccattatatt tagtggatgc caggaataaa ctgttcaccc 3240
agacacctac gatgttatat attctgtgta acccgccccc tattttgggc atgtacgggt 3300
tacagcagaa ttaaaaggct aattttttga ctaaataaag ttaggaaaat cactactatt 3360
aattatttac gtattctttg aaatggcgag tattgataat gataaactga gctagatctg 3420
ggcccgagct ccagcttttg ttccctttag tgagggttaa ttgcgcgctt ggcgtaatca 3480
tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatagga 3540
gccggaagca taaagtgtaa agcctggggt gcctaatgag tgaggtaact cacattaatt 3600
gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga 3660
atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc 3720
actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 3780
gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 3840
cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 3900
ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 3960
ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 4020
ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 4080
agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 4140
cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 4200
aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 4260
gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 4320
agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 4380
ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 4440
cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 4500
tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 4560
aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 4620
tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 4680
atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata 4740
cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg 4800
gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct 4860
gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt 4920
tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc 4980
tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga 5040
tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt 5100
aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc 5160
atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa 5220
tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca 5280
catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca 5340
aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct 5400
tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc 5460
gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa 5520
tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt 5580
tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgt 5639
<210>36
<211>741
<212>DNA
<213>pf1A
<400>36
atgtcagtta ttggtcgcat tcactccttt gaatcctgtg gaaccgtaga cggcccaggt 60
attcgcttta tcaccttttt ccagggctgc ctgatgcgct gcctgtattg tcataaccgc 120
gacacctggg acacgcatgg cggtaaagaa gttaccgttg aagatttgat gaaggaagtg 180
gtgacctatc gccactttat gaacgcttcc ggcggcggcg ttaccgcatc cggcggtgaa 240
gcaatcctgc aagctgagtt tgttcgtgac tggttccgcg cctgcaaaaa agaaggcatt 300
catacctgtc tggacaccaa cggttttgtt cgtcgttacg atccggtgat tgatgaactg 360
ctggaagtaa ccgacctggt aatgctcgat ctcaaacaga tgaacgacga gatccaccaa 420
aatctggttg gagtttccaa ccaccgcacg ctggagttcg ctaaatatct ggcgaacaaa 480
aatgtgaagg tgtggatccg ctacgttgtt gtcccaggct ggtctgacga tgacgattca 540
gcgcatcgcc tcggtgaatt tacccgtgat atgggcaacg ttgagaaaat cgagcttctc 600
ccctaccacg agctgggcaa acacaaatgg gtggcaatgg gtgaagagta caaactcgac 660
ggtgttaaac caccgaagaa agagaccatg gaacgcgtga aaggcattct tgagcagtac 720
ggtcataagg taatgttcta a 741
<210>37
<211>2283
<212>DNA
<213>pflB
<400>37
atgtccgagc ttaatgaaaa gttagccaca gcctgggaag gttttaccaa aggtgactgg 60
cagaatgaag taaacgtccg tgacttcatt cagaaaaact acactccgta cgagggtgac 120
gagtccttcc tggctggcgc tactgaagcg accaccaccc tgtgggacaa agtaatggaa 180
ggcgttaaac tggaaaaccg cactcacgcg ccagttgact ttgacaccgc tgttgcttcc 240
accatcacct ctcacgacgc tggctacatc aacaagcagc ttgagaaaat cgttggtctg 300
cagactgaag ctccgctgaa acgtgctctt atcccgttcg gtggtatcaa aatgatcgaa 360
ggttcctgca aagcgtacaa ccgcgaactg gatccgatga tcaaaaaaat cttcactgaa 420
taccgtaaaa ctcacaacca gggcgtgttc gacgtttaca ctccggacat cctgcgttgc 480
cgtaaatctg gtgttctgac cggtctgcca gatgcatatg gccgtggccg tatcatcggt 540
gactaccgtc gcgttgcgct gtacggtatc gactacctga tgaaagacaa actggcacag 600
ttcacttctc tgcaggctga tctggaaaac ggcgtaaacc tggaacagac tatccgtctg 660
cgcgaagaaa tcgctgaaca gcaccgcgct ctgggtcaga tgaaagaaat ggctgcgaaa 720
tacggctacg acatctctgg tccggctacc aacgctcagg aagctatcca gtggacttac 780
ttcggctacc tggctgctgt taagtctcag aacggtgctg caatgtcctt cggtcgtacc 840
tccaccttcc tggatgtgta catcgaacgt gacctgaaag ctggcaagat caccgaacaa 900
gaagcgcagg aaatggttga ccacctggtc atgaaactgc gtatggttcg cttcctgcgt 960
actccggaat acgatgaact gttctctggc gacccgatct gggcaaccga atctatcggt 1020
ggtatgggcc tcgacggtcg taccctggtt accaaaaaca gcttccgttt cctgaacacc 1080
ctgtacacca tgggtccgtc tccggaaccg aacatgacca ttctgtggtc tgaaaaactg 1140
ccgctgaact tcaagaaatt cgccgctaaa gtgtccatcg acacctcttc tctgcagtat 1200
gagaacgatg acctgatgcg tccggacttc aacaacgatg actacgctat tgcttgctgc 1260
gtaagcccga tgatcgttgg taaacaaatg cagttcttcg gtgcgcgtgc aaacctggcg 1320
aaaaccatgc tgtacgcaat caacggcggc gttgacgaaa aactgaaaat gcaggttggt 1380
ccgaagtctg aaccgatcaa aggcgatgtc ctgaactatg atgaagtgat ggagcgcatg 1440
gatcacttca tggactggct ggctaaacag tacatcactg cactgaacat catccactac 1500
atgcacgaca agtacagcta cgaagcctct ctgatggcgc tgcacgaccg tgacgttatc 1560
cgcaccatgg cgtgtggtat cgctggtctg tccgttgctg ctgactccct gtctgcaatc 1620
aaatatgcga aagttaaacc gattcgtgac gaagacggtc tggctatcga cttcgaaatc 1680
gaaggcgaat acccgcagtt tggtaacaat gatccgcgtg tagatgacct ggctgttgac 1740
ctggtagaac gtttcatgaa gaaaattcag aaactgcaca cctaccgtga cgctatcccg 1800
actcagtctg ttctgaccat cacttctaac gttgtgtatg gtaagaaaac gggtaacacc 1860
ccagacggtc gtcgtgctgg cgcgccgttc ggaccgggtg ctaacccgat gcacggtcgt 1920
gaccagaaag gtgcagtagc ctctctgact tccgttgcta aactgccgtt tgcttacgct 1980
aaagatggta tctcctacac cttctctatc gttccgaacg cactgggtaa agacgacgaa 2040
gttcgtaaga ccaacctggc tggtctgatg gatggttact tccaccacga agcatccatc 2100
gaaggtggtc agcacctgaa cgttaacgtg atgaaccgtg aaatgctgct cgacgcgatg 2160
gaaaacccgg aaaaatatcc gcagctgacc atccgtgtat ctggctacgc agtacgtttc 2220
aactcgctga ctaaagaaca gcagcaggac gttattactc gtaccttcac tcaatctatg 2280
taa 2283
<210>38
<211>1095
<212>DNA
<213>Cb-FDH1
<400>38
atgaagatcg ttttagtctt atatggtgct ggtaaacacg ctgccgatga agaaaaatta 60
tacggttgta ctgaaaacaa attaggtatt gccaattggt tgaaagatca aggacatgaa 120
ctaatcacca cgtctgataa agaaggcgga aacagtgtgt tggatcaaca tataccagat 180
gccgatatta tcattacaac tcctttccat cctgcttata tcactaagga aagaatcgac 240
aaggctaaaa aattgaaatt agttgttgtc gctggtgtcg gttctgatca tattgatttg 300
gattatatca accaaacagg taggaaaatc tccgtcttgg aagttaccgg ttctaatgtt 360
gtctctgttg cagaacacgt tgtcatgacc atgcttgtct tggttagaaa ttttgttcca 420
gctcacgaac aaaacattaa ccacgattgg gaggttgctg ctatcgctaa ggatgcttac 480
gatatcgaag gtaaaactat cgccaccatt ggtgccggta gaattggtta cagagtcttg 540
gaaagattag tcccattcaa tcctaaagaa ttattatact acgattatca agctttacca 600
aaagatgctg aagaaaaagt tggtgctaga agggttgaaa atattgaaga attggttgcc 660
caagctgata tagttacagt taatgctcca ttacacgctg gtacaaaagg tttaattaac 720
aaggaattat tgtctaaatt caagaaaggt gcttggttag tcaatactgc aagaggtgcc 780
atttgtgttg ccgaagatgt tgctgcagct ttagaatctg gtcaattaag aggttatggt 840
ggtgatgttt ggttcccaca accagctcca aaagatcacc catggagaga tatgagaaac 900
aaatatggtg ctggtaacgc cacgactcct cattactctg gtactacttt agatgctcaa 960
actagatacg ctcaaggtac taaaaatatc ttggagtcat tctttactgg taagtttgat 1020
tacagaccac aagatatcat cttattaaac ggtgaatacg ttaccaaagc ttacggtaaa 1080
cacgataaga aataa 1095
<210>39
<211>1524
<212>DNA
<213>K1ALD6
<400>39
atgtcctcta caattgctga gaaattgaac ctcaagatcg tcgaacaaga cgctgttagc 60
atcactttgc caaacggttt gacttaccaa caaccaactg gtttgttcat caacaatcag 120
ttcatcaagt ctcaagacgg taagactttg aaggttgaaa acccatctac tgaggaaatc 180
attgtcgaag tccaatctgc tacttctcaa gacgtcgagt acgccgttga agctgccgat 240
gctgctttca actccgaatg gtctactatg gacccaaaaa agcgtggttc tttgttgttt 300
aagttggctg acttgattga agctcaaaag gaattgattg cttctatcga atctgctgac 360
aacggtaaga ctttggccct agccagaggt gatgttggtt tggtcattga ctacatcaga 420
tctgctgctg gttatgctga caagttgggt ggtagaacta tcaacactgg tgatggttac 480
gctaacttca cttacaagga acctctaggt gtctgtggtc aaatcatccc atggaacttc 540
ccattgatga tgctttcttg gaagatcgcc cctgctttgg ttgctggtaa caccgttatc 600
ttgaagccag cttccccaac cccattgaac gctttgttct ttgcttcttt gtgtaaggaa 660
gcaggtatcc cagctggtgt cgttaacatc gttccaggtc caggtagatc cgttggtgac 720
accatcacca accatccaaa aattagaaag attgccttca ctggttccac tgacattggt 780
agagacgttg ctatcaaggc tgcccaatct aacttgaaga aggtcacctt ggaattgggt 840
ggtaaatccg ctcatttggt ctttgaagat gccaacatta agaagactat tccaaacttg 900
gtcaacggta ttttcaagaa tgctggtcaa atttgttcct ctggttccag aatctatgtc 960
caagacacca tctacgatca actattgtct gaattcaaga cttacctgga aactgaaatt 1020
aaggtcggtt ccccattcga tgaatctaac ttccaagctg ctatcaacaa caaggctcaa 1080
ttcgaaacta tcttgaacta catcgacatc ggtaagaagg aaggtgcttc tatcttgact 1140
ggtggtgaaa gagtaggcaa caagggttac ttcattaaac caactgtatt ctacaacgtt 1200
aaggaagata tgagaatcgt caaggaagaa atctttggtc ctgtcgtcac catctccaag 1260
ttctctactg tcgacgaagc tgtcgctttg gctaacgact ccgaattcgg tttgggtgct 1320
ggtatcgaaa ctgaaaacat ctccgttgcc ttgaaggtcg caaagagact aaaagctggt 1380
accgtctgga tcaacactta caacgatttc gacgctgccg ttccattcgg tggttacaag 1440
caatctggtt acggtagaga aatgggtgaa gaagctttcg aatcttacac tcaaatcaag 1500
gccgtcagga tcaagttgga ttaa 1524
<210>40
<211>2124
<212>DNA
<213>K1ACS1
<400>40
atgtctcctg ctgttgatac cgcttccacc gccaaagatc caatctcagt catgaaatct 60
aacgcttcag ctgccgctgc agaccaaatt aagacccatg aatacgaaca tttaacttct 120
gtgcctatag tgcagcctct accaattact gataggttga gcagcgaagc agctcaaaaa 180
tataaaccta atttgccagg tgggttcgaa gagtacaagt ctttgcacaa ggaatcactt 240
gaaaatccag ccaagtttta ccatgaacgt gctcagctgt tgaattggtt caaaccatac 300
gatcaagttt tcatcccaga taccgaaggt aaaccaactt ttgagaacaa cgcttggttt 360
accaacggtc aattgaacgc ttgttacaat ttggtagaca gacatgcctt cactcaacca 420
aacaaggttg ccattcttta tgaagctgat gaaccaggtc aaggttatag tctcacttat 480
gcggaattgt tagaacaagt ctgtaaagtt gctcaaatct tgcaatactc gatgaacgtc 540
aagaaaggtg acacggtcgc agtttatatg ccaatgatcc cacaggcttt gattaccttg 600
ttggcaatta ctcgtatcgg tgccattcat tccgttgttt ttgctgggtt ctcttcgaat 660
tcattgcgtg atcgtattaa cgatgcttac tcaaagacag tcatcaccac cgatgaatct 720
aagagaggtg gtaagaccat cgaaaccaag cgtatcgtcg atgaagcctt gaaggatacc 780
cctcaagtaa caaacgtttt ggtcttcaaa cgtactcata acgaaaatat caagtacatt 840
ccaggtaggg atttggactg ggatgaggaa gtcaagaagt acaaatctta caccccatgc 900
gaacctgttg actctgaaca tcctttgttc ttattgtata cttcgggttc caccggtgct 960
ccaaagggtg ttcaacattc tacagcaggt tacttgctcc aagcattatt aagtatgaaa 1020
tacacctttg acatccaaaa cgatgacatc ttcttcaccg caggtgacat tggttggatc 1080
actggtcaca catactgtgt ttacggtcca ttgttacaag gttgtactac tttggtgttc 1140
gaaggtacac ctgcctatcc aaacttttct cgttattggg aaattgttga caagtaccaa 1200
gtgactcaat tctatgtagc cccaactgca ctacgtctat tgaagagagc tggtgattcc 1260
tttactgaag gattctctct caagtcattg cgctccttgg gttccgttgg tgaacctatc 1320
gctgctgaag tttgggaatg gtactctgaa aagattggta agaatgagct accaatcgta 1380
gacacatact ggcaaactga atctggctcc cacttggtca ctccattggc tggtggtgct 1440
actccaatga aaccaggtgc agcggcattc ccattctttg gtattgattt ggcagtgttg 1500
gatccaacca caggtatcga gcaaactggt gaacatgcag aaggtgttct tgccattaaa 1560
agaccttggc catctttcgc aagaaccatt tggaagaata acgataggtt cttagacacg 1620
tacttgaaac catacccggg ctattacttc actggtgatg gtgttgcccg tgataaagat 1680
ggattcttct ggatcttggg tcgtgttgat gatgttgtta acgtctcagg tcacaggttg 1740
tctactgctg aaattgaagc tgctatcatt gaagatgata tggttgccga atgtgcagtt 1800
gttgggttta acgacgaatt gactggtcaa gccgttgctg cctttgtagt attgaagaac 1860
aagtctagtt taactgctgc aagcgagtcc gagttacaag acatcaaaaa gcatttgatc 1920
atcaccgtta gaaaggatat tggtccattc gctgctccta agttgatcgt cctagttgat 1980
gatctaccaa agactagatc tggcaagatt atgagacgta ttttgagaaa gatcctagcc 2040
ggtgaatctg atcaattggg cgacgtctcc acattatcca accctggtat cgttaagcac 2100
ttgatcgatt ccgtgaaatt ataa 2124
<210>41
<211>2055
<212>DNA
<213>K1ACS2
<400>41
atgtcgtcgg ataaattgca taaggttgtg catgaagctc acgatgttga agctcgtcat 60
gctccagaac atttctacaa ttctcaaccg ggtaaatcgt actgtactga tgaagaacat 120
taccgtgaga tgtacactca gtccattgag gacccagcag ggtttttcgg tccattggcc 180
aaggaatatc tagattggga tcgtccattc acccaagtcc aaagcggttc tttggaacac 240
ggtgacattg cctggttctt aaatggtgaa ctgaatgctt cttataactg tgttgacaga 300
cacgcttttg ccaacccaga caagccagct ttaatctacg aagccgacga tgaatctgaa 360
aacaaggtga tcacttttgg cgaattgttg agacaggtct ctgaagtggc tggtgtcttg 420
caatcttggg gtgtcaagaa aggagacacc gtcgccgttt acttgccaat gattcctgct 480
gcagttgttg ctatgttggc cgttgcaaga ttaggtgcca ttcattcggt tatctttgcc 540
ggtttctctg ccggttcctt gaaggaaaga gttgtcgatg caggctgtaa agtggtcatc 600
acttgcgatg aaggtaagag aggtggtaag accgttcata ccaagaagat tgtcgacgaa 660
ggtttggccg gtgtcgattc cgtttccaag atcttggttt tccaaagaac tggtactcaa 720
ggtatcccaa tgaagccagc tagagatttc tggtggcacg aagagtgtgt caagcaaaga 780
ggttacttgc cacctgtccc agtcaactcc gaagatccat tgttcttgtt gtacacctct 840
ggttccaccg gttctccaaa aggtgtcgtg cactctactg ctggttactt gttaggttct 900
gctttgacca ccagattcgt tttcgatatt catccagaag atgttttgtt cactgctggt 960
gacgtcggtt ggattaccgg ccacacttac gccttgtacg gtccattgac cttaggtacc 1020
gctaccatta ttttcgaatc tactccagct tacccagatt atggtagata ctggagaatc 1080
attgaacgtc atagagctac ccacttctac gtcgccccaa ctgccctaag attgatcaaa 1140
cgtgtcggtg aagaagaaat tgccaagtat gatacctcct ccttaagagt cttgggttct 1200
gtcggtgaac caatctctcc agatctatgg gaatggtacc acgaaaaggt tggtaagaat 1260
aactgtgtta tctgtgacac catgtggcaa accgaatccg gttcacactt gattgcccca 1320
ttggctggtg ctgtcccaac caaaccaggt tccgctaccg tcccattctt cggtattaac 1380
gcctgtatca tcgacccagt ttctggtgaa gaattgaagg gtaacgatgt tgaaggtgtc 1440
ttggcagtga agtccccatg gccttctatg gccagatctg tctggaacaa ccatgctcgt 1500
tacttcgaaa cttatttgaa gccataccca ggatactact tcacaggtga tggtgctggt 1560
agagatcacg acggttacta ctggatcaga ggtagagttg acgatgtcgt taacgtttcc 1620
ggtcacagac tttctactgc tgaaatcgaa gctgctctag ctgaacacga aggtgtttct 1680
gaagctgccg ttgttggtat cactgatgaa ctaacaggtc aagctgtcat tgcattcgtt 1740
tccttgaagg acggctatct gtctgaaaat gcggtagagg gtgacagtac ccacatctct 1800
ccagacaact tacgtcgtga gttgattcta caagtcagag gtgaaattgg tccattcgct 1860
gcaccaaaga ccgttgttgt tgtcaacgat ttgccaaaaa ctagatccgg taaaattatg 1920
agaagagtct tgagaaaggt tgcatccaag gaagctgatc aattgggtga tctaagtacc 1980
ttagccaatg cagacgttgt accatctatc atttctgcag tagaaaatca atttttcagt 2040
cagcagaaga aataa 2055
<210>42
<211>37
<212>DNA
<213>Gevo-311
<400>42
gaggt tgtcg acatgaaaaa gatttttgta cttggag 37
<210>43
<211>35
<212>DNA
<213>Gevo-175
<400>43
aattggatcc ttatttagaa taatcataga atcct 35
<210>44
<211>37
<212>DNA
<213>Gevo-312
<400>44
gttcttgtcg acatggaatt aaaaaatgtt attcttg 37
<210>45
<211>37
<212>DNA
<213>Gevo-171
<400>45
aattggatcc ttatttattt tgaaaattct tttctgc 37
<210>46
<211>37
<212>DNA
<213>Gevo-313
<400>46
caagaggtcg acatgaattt ccaattaact agagaac 37
<210>47
<211>34
<212>DNA
<213>Gevo-314
<400>47
gcgtccggat ccctatctta aaatgcttcc tgcg 34
<210>48
<211>36
<212>DNA
<213>Gevo-315
<400>48
cggaaagtcg acatgaatat agcagattac aaaggc 36
<210>49
<211>35
<212>DNA
<213>Gevo-173
<400>49
aattggatcc ttattcagcg ctctttattt cttta 35
<210>50
<211>37
<212>DNA
<213>Gevo-316
<400>50
caaaatgtcg acatgaatat agtagtttgt gtaaaac 37
<210>51
<211>37
<212>DNA
<213>Gevo-317
<400>51
taatttggat ccttagatgt agtgtttttc ttttaat 37
<210>52
<211>35
<212>DNA
<213>Gevo-319
<400>52
gaaccagtcg acatggcacg ttttacttta ccaag 35
<210>53
<211>35
<212>DNA
<213>Gevo-177
<400>53
aattggatcc ttacaaatta actttagttc catag 35
<210>54
<211>36
<212>DNA
<213>Gevo-318
<400>54
tccatagtcg acatgaataa agacacacta atacct 36
<210>55
<211>40
<212>DNA
<213>Gevo-249
<400>55
aattggatcc ttagccggca agtacacatc ttctttgtct 40
<210>56
<211>35
<212>DNA
<213>Gevo-308
<400>56
gatcgagtcg acatgaaaga agttgtaata gctag 35
<210>57
<211>35
<212>DNA
<213>Gevo-309
<400>57
gttataggat ccctagcact tttctagcaa tattg 35
<210>58
<211>37
<212>DNA
<213>Gevo-281
<400>58
gtggatgtcg acatgaaaaa ggtatgtgtt ataggtg 37
<210>59
<211>35
<212>DNA
<213>Gevo-161
<400>59
aattggatcc ttattttgaa taatcgtaga aacct 35
<210>60
<211>35
<212>DNA
<213>Gevo-282
<400>60
tcctacgtcg acatggaact aaacaatgtc atcct 35
<210>61
<211>36
<212>DNA
<213>Gevo-283
<400>61
taacttggat ccctatctat ttttgaagcc ttcaat 36
<210>62
<211>37
<212>DNA
<213>Gevo-284
<400>62
caagaggtcg acatggattt taatttaaca agagaac 37
<210>63
<211>39
<212>DNA
<213>Gevo-285
<400>63
caataaggat ccttatctaa aaatttttcc tgaaataac 39
<210>64
<211>36
<212>DNA
<213>Gevo-286
<400>64
cgggaagtcg acatgaataa agcagattac aagggc 36
<210>65
<211>36
<212>DNA
<213>Gevo-287
<400>65
gttcaaggat ccttaattat tagcagcttt aacttg 36
<210>66
<211>38
<212>DNA
<213>Gevo-288
<400>66
caaaattgtc gacatgaata tagttgtttg tttaaaac 38
<210>67
<211>41
<212>DNA
<213>Gevo-289
<400>67
gttttaggat ccttaaatat agtgttcttc ttttaatttt g 41
<210>68
<211>37
<212>DNA
<213>Gevo-292
<400>68
caagaagtcg acatgaaagt tacaaatcaa aaagaac 37
<210>69
<211>40
<212>DNA
<213>Gevo-293
<400>69
tcctatgcgg ccgcttaaaa tgattttata tagatatcct 40
<210>70
<211>35
<212>DNA
<213>Gevo-290
<400>70
aggaaagtcg acatgaaagt cacaacagta aagga 35
<210>71
<211>40
<212>DNA
<213>Gevo-291
<400>71
atttaagcgg ccgcttaagg ttgtttttta aaacaattta 40
<210>72
<211>37
<212>DNA
<213>Gevo-294
<400>72
cataacgtcg acatgctaag ttttgattat tcaatac 37
<210>73
<211>36
<212>DNA
<213>Gevo-247
<400>73
aattggatcc ttaataagat tttttaaata tctcaa 36
<210>74
<211>37
<212>DNA
<213>Gevo-295
<400>74
cataacgtcg acatggttga tttcgaatat tcaatac 37
<210>75
<211>36
<212>DNA
<213>Gevo-159
<400>75
aattggatcc ttacacagat tttttgaata tttgta 36
<210>76
<211>35
<212>DNA
<213>Gevo-310
<400>76
gatcgagaat tcatgaaaga agttgtaata gctag 35
<210>77
<211>35
<212>DNA
<213>Gevo-309
<400>77
gttataggat ccctagcact tttctagcaa tattg 35
<210>78
<211>36
<212>DNA
<213>Gevo-296
<400>78
cggatagtcg acatgaaaaa ggtatgtgtt ataggc 36
<210>79
<211>38
<212>DNA
<213>Gevo-297
<400>79
tcccaaggat ccttattttg aataatcgta gaaaccct 38
<210>80
<211>35
<212>DNA
<213>Gevo-282
<400>80
tcctacgtcg acatggaact aaacaatgtc atcct 35
<210>81
<211>36
<212>DNA
<213>Gevo-283
<400>81
taacttggat ccctatctat ttttgaagcc ttcaat 36
<210>82
<211>37
<212>DNA
<213>Gevo-284
<400>82
caagaggtcg acatggattt taatttaaca agagaac 37
<210>83
<211>37
<212>DNA
<213>Gevo-298
<400>83
gtaaagggat ccttaactaa aaatttttcc tgaaatg 37
<210>84
<211>36
<212>DNA
<213>Gevo-286
<400>84
cgggaagtcg acatgaataa agcagattac aagggc 36
<210>85
<211>36
<212>DNA
<213>Gevo-299
<400>85
gttcaaggat ccttaattat tagcagcttt aacctg 36
<210>86
<211>38
<212>DNA
<213>Gevo-288
<400>86
caaaattgtc gacatgaata tagttgtttg tttaaaac 38
<210>87
<211>36
<212>DNA
<213>Gevo-300
<400>87
gactttggat ccttaaatat agtgttcttc tttcag 36
<210>88
<211>37
<212>DNA
<213>Gevo-292
<400>88
caagaagtcg acatgaaagt tacaaatcaa aaagaac 37
<210>89
<211>41
<212>DNA
<213>Gevo-301
<400>89
attttcggat ccttaaaatg attttatata gatatctttt a 41
<210>90
<211>37
<212>DNA
<213>Gevo-302
<400>90
cttatagtcg acatggattt taacttaaca gatattc 37
<210>91
<211>36
<212>DNA
<213>Gevo-303
<400>91
ccgccaggat ccttaacgta acagagcacc gccggt 36
<210>92
<211>36
<212>DNA
<213>Gevo-304
<400>92
cggaaagtcg acatggattt agcagaatac aaaggc 36
<210>93
<211>34
<212>DNA
<213>Gevo-305
<400>93
ctttgtggat ccttatgcaa tgcctttctg tttc 34
<210>94
<211>37
<212>DNA
<213>Gevo-306
<400>94
caaactgaat tcatggaaat attggtatgt gtcaaac 37
<210>95
<211>35
<212>DNA
<213>Gevo-307
<400>95
accaacggat ccttaaatga ttttctgggc aacca 35
<210>96
<211>34
<212>DNA
<213>Gevo-273
<400>96
gttacagtcg acatgtctca gaacgtttac attg 34
<210>97
<211>35
<212>DNA
<213>Gevo-274
<400>97
gataacggat cctcatatct tttcaatgac aatag 35
<210>98
<211>34
<212>DNA
<213>PflA_forw
<400>98
cattgaattc atgtcagtta ttggtcgcat tcac 34
<210>99
<211>37
<212>DNA
<213>PflA_Rev
<400>99
cattgtcgac ttagaacatt accttatgac cgtactg 37
<210>100
<211>37
<212>DNA
<213>PflB_forw
<400>100
cattgaattc atgtccgagc ttaatgaaaa gttagcc 37
<210>101
<211>36
<212>DNA
<213>PflB_Rev
<400>101
cattgtcgac ttacatagat tgagtgaagg tacgag 36
<210>102
<211>39
<212>DNA
<213>fdh1_forw
<400>102
cattgaattc atgaagatcg ttttagtctt atatggtgc 39
<210>103
<211>37
<212>DNA
<213>fdh1_rev
<400>103
cattgtcgac ttatttctta tcgtgtttac cgtaagc 37
<210>104
<211>38
<212>DNA
<213>K1ALD6_右3
<400>104
gttaggatcc ttaatccaac ttgatcctga cggccttg 38
<210>105
<211>43
<212>DNA
<213>K1ALD6_左5
<400>105
ccaagtcgac atgtcctcta caattgctga gaaattgaac ctc 43
<210>106
<211>40
<212>DNA
<213>K1ACS1_右3
<400>106
gttagcggcc gcttataatt tcacggaatc gatcaagtgc 40
<210>107
<211>37
<212>DNA
<213>K1ACS1_左5
<400>107
ccaagctagc atgtctcctg ctgttgatac cgcttcc 37
<210>108
<211>49
<212>DNA
<213>K1ACS2_右3
<400>108
ggttggatcc ttatttcttc tgctgactga aaaattgatt ttctactgc 49
<210>109
<211>35
<212>DNA
<213>K1ACS2_左5
<400>109
ccaagaattc atgtcgtcgg ataaattgca taagg 35
<210>110
<211>26
<212>DNA
<213>Gevo-350
<400>110
cttaaattct acttttatag ttagtc 26
<210>111
<211>20
<212>DNA
<213>Gevo-352
<400>111
ccttcctttt cggttagagc 20
<210>112
<211>31
<212>DNA
<213>Gevo-479
<400>112
catgccgtcg acatgtcgcc ctctgccgta c 31
<210>113
<211>38
<212>DNA
<213>Gevo-480
<400>113
gattaagcgg ccgcttacaa cttgaccgaa tcaattag 38
<210>114
<211>37
<212>DNA
<213>Gevo-483
<400>114
gatgaagtcg acatgacaat caaggaacat aaagtag 37
<210>115
<211>39
<212>DNA
<213>Gevo-484
<400>115
gttaaaggat ccttatttct ttttttgaga gaaaaattg 39
<210>116
<211>44
<212>DNA
<213>Gevo-606
<400>116
ttttgtcgac actagtatgt cagaacgttt cccaaatgac gtgg 44
<210>117
<211>39
<212>DNA
<213>Gevo-607
<400>117
ttttctcgag ttacgccaga cgcgggttaa ctttatctg 39
<210>118
<211>40
<212>DNA
<213>Gevo-609
<400>118
ttttctcgag ttacatcacc agacggcgaa tgtcagacag 40
<210>119
<211>46
<212>DNA
<213>Gevo-610
<400>119
ttttgtcgac actagtatga gtactgaaat caaaactcag gtcgtg 46
<210>120
<211>37
<212>DNA
<213>Gevo-611
<400>120
ttttctcgag ttacttcttc ttcgctttcg ggttcgg 37
<210>121
<211>21
<212>DNA
<213>Gevo-616
<400>121
ctatttacca ggctaaattc c 21
<210>122
<211>22
<212>DNA
<213>Gevo-617
<400>122
tgaaggtaaa aacatcgcgc ac 22
<210>123
<211>23
<212>DNA
<213>Gevo-618
<400>123
cgtggcttcc tgatcggcgg tac 23
<210>124
<211>24
<212>DNA
<213>Gevo-619
<400>124
caccagcggc tggcgtgaaa gaag 24
<210>125
<211>24
<212>DNA
<213>Gevo-620
<400>125
gaagtggaac tgggccgcat ccag 24
<210>126
<211>22
<212>DNA
<213>Gevo-621
<400>126
gacgtggttg aaatgttcga cc 22
<210>127
<211>35
<212>DNA
<213>Gevo-637
<400>127
ttttgagctc gccgatccca ttaccgacat ttggg 35
<210>128
<211>96
<212>DNA
<213>Gevo-638
<400>128
aaagtcgaca ccgatatacc tgtatgtgtc accaccaatg tatctataag tatccatgct 60
agccctaggt ttatgtgatg attgattgat tgattg 96
<210>129
<211>36
<212>DNA
<213>Gevo-639
<400>129
ttttctcgag actagtatgt ctgaaattac tttggg 36
<210>130
<211>36
<212>DNA
<213>Gevo-640
<400>130
ttttggatcc ttattgctta gcgttggtag cagcag 36
<210>131
<211>27
<212>DNA
<213>Gevo-641
<400>131
gttatcttgg ctgatgcttg ttgttcc 27
<210>132
<211>41
<212>DNA
<213>Gevo-642
<400>132
ttttgtcgac actagtatga gtactgaaat caaaactcag g 41
<210>133
<211>33
<212>DNA
<213>Gevo-643
<400>133
ccaagtcgac atgactaagc tacactttga cac 33
<210>134
<211>27
<212>DNA
<213>Gevo-644
<400>134
gtcggtaaga gtgttgctgt ggactcg 27
<210>135
<211>42
<212>DNA
<213>Gevo-646
<400>135
ccaaggatcc ttacaactta attctgacag cttttacttc ag 42
<210>136
<211>49
<212>DNA
<213>Gevo-653
<400>136
ttttgtcgac actagtatgg ctatcgaaat caaagtaccg gacatcggg 49
<210>137
<211>25
<212>DNA
<213>Gevo-654
<400>137
cttccataga agctttgtcg ccttc 25
<210>138
<211>25
<212>DNA
<213>Gevo-655
<400>138
gtgcaatatc atatagaagt catcg 25
<210>139
<211>48
<212>DNA
<213>Gevo-656
<400>139
ttttctcgag gctagcatgg catcgtaccc agagcacacc attattgg 48
<210>140
<211>40
<212>DNA
<213>Gevo-657
<400>140
ttttggatcc tcacaatagc atttccaaag gattttcaat 40
<210>141
<211>45
<212>DNA
<213>Gevo-658
<400>141
ttttctcgag actagtatgg tcatcatcgg tggtggccct gctgg 45
<210>142
<211>36
<212>DNA
<213>Gevo-659
<400>142
ttttggatcc tcaacaatga atagctttat catagg 36
<210>143
<211>47
<212>DNA
<213>Gevo-660
<400>143
ttttctcgag actagtatgg caactttaaa aacaactgat aagaagg 47
<210>144
<211>35
<212>DNA
<213>Gevo-661
<400>144
ttttagatct ttaatcccta gaggcaaaac cttgc 35
<210>145
<211>44
<212>DNA
<213>Gevo-662
<400>145
ttttctcgag actagtatgg cggaagaatt ggaccgtgat gatg 44
<210>146
<211>38
<212>DNA
<213>Gevo-663
<400>146
tttggatcct tattcaattg acaagacttc tttgacag 38
<210>147
<211>48
<212>DNA
<213>Gevo-664
<400>147
ttttctcgag actagtatgt tacttgctgt aaagacattt tcaatgcc 48
<210>148
<211>40
<212>DNA
<213>Gevo-665
<400>148
ttttggatcc tcaaaatgat tctaactccc ttacgtaatc 40
<210>149
<211>27
<212>DNA
<213>Gevo-666
<400>149
ggtagaatta ccaaggctga cattgag 27
<210>150
<211>21
<212>DNA
<213>Gevo-667
<400>150
cattggtgga ggaatcatcg g 21
<210>151
<211>24
<212>DNA
<213>Gevo-668
<400>151
caccaataca agaacgagga cgcc 24
<210>152
<211>28
<212>DNA
<213>Gevo-669
<400>152
tggtacggtt ccattccagg gttaaagg 28
<210>153
<211>25
<212>DNA
<213>Gevo-670
<400>153
gggtgatgtg ctagcatacc taggg 25
<210>154
<211>1197
<212>DNA
<213>ERG10
<400>154
atgtctcaga acgtttacat tgtatcgact gccagaaccc caattggttc attccagggt 60
tctctatcct ccaagacagc agtggaattg ggtgctgttg ctttaaaagg cgccttggct 120
aaggttccag aattggatgc atccaaggat tttgacgaaa ttatttttgg taacgttctt 180
tctgccaatt tgggccaagc tccggccaga caagttgctt tggctgccgg tttgagtaat 240
catatcgttg caagcacagt taacaaggtc tgtgcatccg ctatgaaggc aatcattttg 300
ggtgctcaat ccatcaaatg tggtaatgct gatgttgtcg tagctggtgg ttgtgaatct 360
atgactaacg caccatacta catgccagca gcccgtgcgg gtgccaaatt tggccaaact 420
gttcttgttg atggtgtcga aagagatggg ttgaacgatg cgtacgatgg tctagccatg 480
ggtgtacacg cagaaaagtg tgcccgtgat tgggatatta ctagagaaca acaagacaat 540
tttgccatcg aatcctacca aaaatctcaa aaatctcaaa aggaaggtaa attcgacaat 600
gaaattgtac ctgttaccat taagggattt agaggtaagc ctgatactca agtcacgaag 660
gacgaggaac ctgctagatt acacgttgaa aaattgagat ctgcaaggac tgttttccaa 720
aaagaaaacg gtactgttac tgccgctaac gcttctccaa tcaacgatgg tgctgcagcc 780
gtcatcttgg tttccgaaaa agttttgaag gaaaagaatt tgaagccttt ggctattatc 840
aaaggttggg gtgaggccgc tcatcaacca gctgatttta catgggctcc atctcttgca 900
gttccaaagg ctttgaaaca tgctggcatc gaagacatca attctgttga ttactttgaa 960
ttcaatgaag ccttttcggt tgtcggtttg gtgaacacta agattttgaa gctagaccca 1020
tctaaggtta atgtatatgg tggtgctgtt gctctaggtc acccattggg ttgttctggt 1080
gctagagtgg ttgttacact gctatccatc ttacagcaag aaggaggtaa gatcggtgtt 1140
gccgccattt gtaatggtgg tggtggtgct tcctctattg tcattgaaaa gatatga 1197
<210>155
<211>849
<212>DNA
<213>Cb-hbd
<400>155
atgaaaaaga tttttgtact tggagcagga acaatgggtg ctggtatcgt tcaagcattc 60
gctcaaaaag gttgtgaagt aattgtaaga gacataaagg aagaatttgt tgacagagga 120
atagctggaa tcactaaagg attagaaaag caagttgcta aaggaaaaat gtctgaagaa 180
gataaagaag ctatactttc aagaatttca ggaacaactg atatgaaatt agctgctgac 240
tgtgatttag tagttgaagc tgcaatcgaa aacatgaaaa ttaagaagga aatcttcgct 300
gaattagatg gaatttgtaa gccagaagcg attttagctt caaacacttc atctttatca 360
attactgaag ttgcttcagc tacaaagaga cctgataaag ttatcggaat gcatttcttt 420
aatccagctc cagtaatgaa gcttgttgaa attattaaag gaatagctac ttctcaagaa 480
acttttgatg ctgttaagga attatcagtt gctattggaa aagaaccagt agaagttgca 540
gaagctccag gattcgttgt aaacagaata ttaatcccaa tgattaacga agcttcattt 600
atcctacaag aaggaatagc ttcagttgaa gatattgata cagctatgaa atatggtgct 660
aaccatccaa tgggaccttt agctttagga gatcttattg gattagacgt ttgcttagct 720
atcatggatg ttttattcac tgaaacaggt gataacaagt acagagctag cagcatatta 780
agaaaatatg ttagagctgg atggcttgga agaaaatcag gaaaaggatt ctatgattat 840
tctaaataa 849
<210>156
<211>786
<212>DNA
<213>Cb-crt
<400>156
atggaattaa aaaatgttat tcttgaaaaa gaagggcatt tagctattgt tacaatcaat 60
agaccaaagg cattaaatgc attgaattca gaaacactaa aagatttaaa tgttgtttta 120
gatgatttag aagcagacaa caatgtgtat gcagttatag ttacaggtgc tggtgagaaa 180
tcttttgttg ctggagcaga tatttcagaa atgaaagatc ttaatgaaga acaaggtaaa 240
gaatttggta ttttaggaaa caatgtcttc agaagattag aaaaattgga taagccagtt 300
atcgcagcta tatcaggatt tgctcttggt ggtggatgtg aacttgctat gtcatgtgac 360
ataagaatag cttcagttaa agctaaattt ggtcaaccag aagcaggact tggaataact 420
ccaggatttg gtggaactca aagattagct agaattgtag ggccaggaaa agctaaagaa 480
ttaatttata cttgtgacct tataaatgca gaagaagctt atagaatagg tttagttaat 540
aaagtagttg aattagaaaa attgatggaa gaagcaaaag caatggctaa caagattgca 600
gctaatgctc caaaagcagt tgcatattgt aaagatgcta tagacagagg aatgcaagtt 660
gatatagatg cagctatatt aatagaagca gaagactttg gaaagtgctt tgcaacagaa 720
gatcaaacag aaggaatgac tgcgttctta gaaagaagag cagaaaagaa ttttcaaaat 780
aaataa 786
<210>157
<211>1140
<212>DNA
<213>Cb-bcd
<400>157
atgaatttcc aattaactag agaacaacaa ttagtacaac aaatggttag agaattcgca 60
gtaaatgaag ttaagccaat agctgctgaa atcgacgaat cagaaagatt ccctatggaa 120
aacgttgaaa aaatggctaa gcttaaaatg atgggtatcc cattttctaa agaatttggt 180
ggagcaggcg gagatgttct ttcatatata atatctgtgg aagaattatc aaaagtttgt 240
ggtactacag gagttattct ttcagcgcat acatcattat gtgcatcagt aattaatgaa 300
aatggaacta acgaacaaag agcaaaatat ttgccagatc tttgtagtgg taagaaaatc 360
ggtgctttcg gattaacaga accaggcgct ggtacagatg ctgcaggaca acaaacaact 420
gctgtattag aaggagacca ttatgtatta aatggttcaa aaatcttcat aacaaatggt 480
ggagttgctg aaactttcat aatatttgct atgacagata agagtcaagg aacaaaagga 540
atttctgcat tcatagtaga aaagtcattc ccaggattct caataggaaa attagaaaac 600
aagatgggga tcagagcatc ttcaactact gagttagtta tggaaaactg tatagtacca 660
aaagaaaacc tacttagcaa agaaggtaag ggatttggta tagcaatgaa aactcttgat 720
ggaggaagaa ttggtatagc tgctcaagct ttaggtattg cagaaggagc ttttgaagaa 780
gctgttaact atatgaaaga aagaaaacaa tttggtaaac cattatcagc attccaagga 840
ttacaatggt atatagctga aatggatgtt aaaatccaag ctgctaaata cttagtatac 900
ctagctgcaa caaagaagca agctggtgag ccttactcag tggatgctgc aagagctaaa 960
ttatttgcgg cagatgttgc aatggaagtt acaactaaag cagttcaaat ctttggtgga 1020
tatggttaca ctaaggaata cccagtagaa agaatgatga gagatgctaa aatatgcgaa 1080
atctacgaag gaacttcaga agttcaaaag atggttatcg caggaagcat tttaagatag 1140
<210>158
<211>1140
<212>DNA
<213>Cb-etfA
<400>158
atgaatttcc aattaactag agaacaacaa ttagtacaac aaatggttag agaattcgca 60
gtaaatgaag ttaagccaat agctgctgaa atcgacgaat cagaaagatt ccctatggaa 120
aacgttgaaa aaatggctaa gcttaaaatg atgggtatcc cattttctaa agaatttggt 180
ggagcaggcg gagatgttct ttcatatata atatctgtgg aagaattatc aaaagtttgt 240
ggtactacag gagttattct ttcagcgcat acatcattat gtgcatcagt aattaatgaa 300
aatggaacta acgaacaaag agcaaaatat ttgccagatc tttgtagtgg taagaaaatc 360
ggtgctttcg gattaacaga accaggcgct ggtacagatg ctgcaggaca acaaacaact 420
gctgtattag aaggagacca ttatgtatta aatggttcaa aaatcttcat aacaaatggt 480
ggagttgctg aaactttcat aatatttgct atgacagata agagtcaagg aacaaaagga 540
atttctgcat tcatagtaga aaagtcattc ccaggattct caataggaaa attagaaaac 600
aagatgggga tcagagcatc ttcaactact gagttagtta tggaaaactg tatagtacca 660
aaagaaaacc tacttagcaa agaaggtaag ggatttggta tagcaatgaa aactcttgat 720
ggaggaagaa ttggtatagc tgctcaagct ttaggtattg cagaaggagc ttttgaagaa 780
gctgttaact atatgaaaga aagaaaacaa tttggtaaac cattatcagc attccaagga 840
ttacaatggt atatagctga aatggatgtt aaaatccaag ctgctaaata cttagtatac 900
ctagctgcaa caaagaagca agctggtgag ccttactcag tggatgctgc aagagctaaa 960
ttatttgcgg cagatgttgc aatggaagtt acaactaaag cagttcaaat ctttggtgga 1020
tatggttaca ctaaggaata cccagtagaa agaatgatga gagatgctaa aatatgcgaa 1080
atctacgaag gaacttcaga agttcaaaag atggttatcg caggaagcat tttaagatag 1140
<210>159
<211>780
<212>DNA
<213>Cb-etfB
<400>159
atgaatatag tagtttgtgt aaaacaagtt ccagatacta cagcagtaaa aattgatcct 60
aaaactggta cattaataag agatggtgtt ccatcaataa tgaatccaga ggataaacac 120
gctttagaag gtgcattaca attaaaagaa aaagttggag gaaaagttac tgtaataagt 180
atgggacttc caatggctaa agcagtatta agagaagcat tatgtatggg agctgatgaa 240
gctgtcctat taacagatag agcacttgga ggagcagata ctttagcaac ttcaaaggca 300
cttgcaggag taatagctaa gttagattat gatttggtat ttgctggaag acaagcaatt 360
gatggagata ctgcacaagt aggaccagaa atagcagaac atttaaacat tccgcaagta 420
acttacgttc aagacgttaa agttgaagga aatacattaa tagtaaatag agcactagaa 480
gatggacatc aagtagtaga agttaaaact ccatgtctat taactgcaat cgaagaatta 540
aatgaaacta gatatatgaa tgttgtagat atattcgaaa cttcagatga tgaaatcaaa 600
gttatgagcg cagctgatat agatgtagat gtagctgaat tagggcttaa aggctcacct 660
acaaaggtta agaagtcaat gactaaggaa gttaaaggtg caggagaaat cgtaagagaa 720
gcacctaaaa atgcagcata ctatgttgta ggaaaattaa aagaaaaaca ctacatctaa 780
<210>160
<211>1167
<212>DNA
<213>Cb-adhA
<400>160
atggcacgtt ttactttacc aagagacatt tatcatggag aaggagcact tgaggcactt 60
aaaactttaa aaggtaagaa agctttctta gtagttggtg gcggatcaat gaaaagattt 120
ggatttctta aacaagttga agattattta aaagaagcag gaatggaagt agaattattt 180
gaaggtgttg aaccagatcc atcagtggaa acagtaatga aaggcgcaga agctatgaga 240
aactttgagc ctgattggat agttgcaatg ggtggaggat caccaattga tgctgcaaag 300
gctatgtgga tattctacga atacccagat tttacttttg aacaagcagt tgttccattt 360
ggattaccag accttagaca aaaagctaag tttgtagcta ttccatcaac aagcggtaca 420
gctacagaag ttacagcatt ctcagttatc acaaattatt cagaaaaaat taaatatcct 480
ttagctgatt ttaacataac tccagatata gcaatagttg atccagcact tgctcaaact 540
atgccaaaaa ctttaacagc tcatactgga atggatgcat taactcacgc tatagaagca 600
tacactgcat cacttcaatc aaatttctca gatccattag caattaaagc tgtagaaatg 660
gttcaagaaa atttaatcaa atcatttgaa ggagataaag aagctagaaa tctaatgcat 720
gaagctcaat gtttagctgg aatggcattt tctaatgcat tacttggaat agttcactca 780
atggctcata aggttggtgc tgtattccat attcctcatg gatgtgcaaa tgctatattt 840
ttaccatatg taattgagta taacagaaca aaatgcgaaa atagatatgg agatattgcg 900
agagccttaa aattaaaagg aaacaatgat gccgagttaa ctgattcatt aattgaatta 960
attaatggat taaatgataa gttagagatt cctcactcaa tgaaagagta tggagttact 1020
gaagaagatt ttaaagctaa tctttcattt atcgctcata acgcagtatt agatgcatgc 1080
acaggatcaa atcctagaga aatagatgat gctacaatgg aaaaattatt tgaatgcaca 1140
tactatggaa ctaaagttaa tttgtaa 1167
<210>161
<211>1407
<212>DNA
<213>Cb-aldh
<400>161
atgaataaag acacactaat acctacaact aaagatttaa aagtaaaaac aaatggtgaa 60
aacattaatt taaagaacta caaggataat tcttcatgtt tcggagtatt cgaaaatgtt 120
gaaaatgcta taagcagcgc tgtacacgca caaaagatat tatcccttca ttatacaaaa 180
gagcaaagag aaaaaatcat aactgagata agaaaggccg cattacaaaa taaagaggtc 240
ttggctacaa tgattctaga agaaacacat atgggaagat atgaggataa aatattaaaa 300
catgaattgg tagctaaata tactcctggt acagaagatt taactactac tgcttggtca 360
ggtgataatg gtcttacagt tgtagaaatg tctccatatg gtgttatagg tgcaataact 420
ccttctacga atccaactga aactgtaata tgtaatagca taggcatgat agctgctgga 480
aatgctgtag tatttaacgg acacccatgc gctaaaaaat gtgttgcctt tgctgttgaa 540
atgataaata aggcaattat ttcatgtggc ggtcctgaaa atctagtaac aactataaaa 600
aatccaacta tggagtctct agatgcaatt attaagcatc cttcaataaa acttctttgc 660
ggaactgggg gtccaggaat ggtaaaaacc ctcttaaatt ctggtaagaa agctataggt 720
gctggtgctg gaaatccacc agttattgta gatgatactg ctgatataga aaaggctggt 780
aggagcatca ttgaaggctg ttcttttgat aataatttac cttgtattgc agaaaaagaa 840
gtatttgttt ttgagaatgt tgcagatgat ttaatatcta acatgctaaa aaataatgct 900
gtaattataa atgaagatca agtatcaaaa ttaatagatt tagtattaca aaaaaataat 960
gaaactcaag aatactttat aaacaaaaaa tgggtaggaa aagatgcaaa attattctta 1020
gatgaaatag atgttgagtc tccttcaaat gttaaatgca taatctgcga agtaaatgca 1080
aatcatccat ttgttatgac agaactcatg atgccaatat tgccaattgt aagagttaaa 1140
gatatagatg aagctattaa atatgcaaag atagcagaac aaaatagaaa acatagtgcc 1200
tatatttatt ctaaaaatat agacaaccta aatagatttg aaagagaaat agatactact 1260
atttttgtaa agaatgctaa atcttttgct ggtgttggtt atgaagcaga aggatttaca 1320
actttcacta ttgctggatc tactggtgag ggaataacct ctgcaaggaa ttttacaaga 1380
caaagaagat gtgtacttgc cggctaa 1407
<210>162
<211>1179
<212>DNA
<213>Ca-thl
atgaaagaag ttgtaatagc tagtgcagta agaacagcga ttggatctta tggaaagtct 60
cttaaggatg taccagcagt agatttagga gctacagcta taaaggaagc agttaaaaaa 120
gcaggaataa aaccagagga tgttaatgaa gtcattttag gaaatgttct tcaagcaggt 180
ttaggacaga atccagcaag acaggcatct tttaaagcag gattaccagt tgaaattcca 240
gctatgacta ttaataaggt ttgtggttca ggacttagaa cagttagctt agcagcacaa 300
attataaaag caggagatgc tgacgtaata atagcaggtg gtatggaaaa tatgtctaga 360
gctccttact tagcgaataa cgctagatgg ggatatagaa tgggaaacgc taaatttgtt 420
gatgaaatga tcactgacgg attgtgggat gcatttaatg attaccacat gggaataaca 480
gcagaaaaca tagctgagag atggaacatt tcaagagaag aacaagatga gtttgctctt 540
gcatcacaaa aaaaagctga agaagctata aaatcaggtc aatttaaaga tgaaatagtt 600
cctgtagtaa ttaaaggcag aaagggagaa actgtagttg atacagatga gcaccctaga 660
tttggatcaa ctatagaagg acttgcaaaa ttaaaacctg ccttcaaaaa agatggaaca 720
gttacagctg gtaatgcatc aggattaaat gactgtgcag cagtacttgt aatcatgagt 780
gcagaaaaag ctaaagagct tggagtaaaa ccacttgcta agatagtttc ttatggttca 840
gcaggagttg acccagcaat aatgggatat ggacctttct atgcaacaaa agcagctatt 900
gaaaaagcag gttggacagt tgatgaatta gatttaatag aatcaaatga agcttttgca 960
gctcaaagtt tagcagtagc aaaagattta aaatttgata tgaataaagt aaatgtaaat 1020
ggaggagcta ttgcccttgg tcatccaatt ggagcatcag gtgcaagaat actcgttact 1080
cttgtacacg caatgcaaaa aagagatgca aaaaaaggct tagcaacttt atgtataggt 1140
ggcggacaag gaacagcaat attgctagaa aagtgctag 1179
<210>163
<211>849
<212>DNA
<213>Ca-hbd
<400>163
atgaaaaagg tatgtgttat aggtgcaggt actatgggtt caggaattgc tcaggcattt 60
gcagctaaag gatttgaagt agtattaaga gatattaaag atgaatttgt tgatagagga 120
ttagatttta tcaataaaaa tctttctaaa ttagttaaaa aaggaaagat agaagaagct 180
actaaagttg aaatcttaac tagaatttcc ggaacagttg accttaatat ggcagctgat 240
tgcgatttag ttatagaagc agctgttgaa agaatggata ttaaaaagca gatttttgct 300
gacttagaca atatatgcaa gccagaaaca attcttgcat caaatacatc atcactttca 360
ataacagaag tggcatcagc aactaaaaga cctgataagg ttataggtat gcatttcttt 420
aatccagctc ctgttatgaa gcttgtagag gtaataagag gaatagctac atcacaagaa 480
acttttgatg cagttaaaga gacatctata gcaataggaa aagatcctgt agaagtagca 540
gaagcaccag gatttgttgt aaatagaata ttaataccaa tgattaatga agcagttggt 600
atattagcag aaggaatagc ttcagtagaa gacatagata aagctatgaa acttggagct 660
aatcacccaa tgggaccatt agaattaggt gattttatag gtcttgatat atgtcttgct 720
ataatggatg ttttatactc agaaactgga gattctaagt atagaccaca tacattactt 780
aagaagtatg taagagcagg atggcttgga agaaaatcag gaaaaggttt ctacgattat 840
tcaaaataa 849
<210>164
<211>786
<212>DNA
<213>Ca-crt
<400>164
atggaactaa acaatgtcat ccttgaaaag gaaggtaaag ttgctgtagt taccattaac 60
agacctaaag cattaaatgc gttaaatagt gatacactaa aagaaatgga ttatgttata 120
ggtgaaattg aaaatgatag cgaagtactt gcagtaattt taactggagc aggagaaaaa 180
tcatttgtag caggagcaga tatttctgag atgaaggaaa tgaataccat tgaaggtaga 240
aaattcggga tacttggaaa taaagtgttt agaagattag aacttcttga aaagcctgta 300
atagcagctg ttaatggttt tgctttagga ggcggatgcg aaatagctat gtcttgtgat 360
ataagaatag cttcaagcaa cgcaagattt ggtcaaccag aagtaggtct cggaataaca 420
cctggttttg gtggtacaca aagactttca agattagttg gaatgggcat ggcaaagcag 480
cttatattta ctgcacaaaa tataaaggca gatgaagcat taagaatcgg acttgtaaat 540
aaggtagtag aacctagtga attaatgaat acagcaaaag aaattgcaaa caaaattgtg 600
agcaatgctc cagtagctgt taagttaagc aaacaggcta ttaatagagg aatgcagtgt 660
gatattgata ctgctttagc atttgaatca gaagcatttg gagaatgctt ttcaacagag 720
gatcaaaagg atgcaatgac agctttcata gagaaaagaa aaattgaagg cttcaaaaat 780
agatag 786
<210>165
<211>1140
<212>DNA
<213>Ca-bcd
<400>165
atggatttta atttaacaag agaacaagaa ttagtaagac agatggttag agaatttgct 60
gaaaatgaag ttaaacctat agcagcagaa attgatgaaa cagaaagatt tccaatggaa 120
aatgtaaaga aaatgggtca gtatggtatg atgggaattc cattttcaaa agagtatggt 180
ggcgcaggtg gagatgtatt atcttatata atcgccgttg aggaattatc aaaggtttgc 240
ggtactacag gagttattct ttcagcacat acatcacttt gtgcttcatt aataaatgaa 300
catggtacag aagaacaaaa acaaaaatat ttagtacctt tagctaaagg tgaaaaaata 360
ggtgcttatg gattgactga gccaaatgca ggaacagatt ctggagcaca acaaacagta 420
gctgtacttg aaggagatca ttatgtaatt aatggttcaa aaatattcat aactaatgga 480
ggagttgcag atacttttgt tatatttgca atgactgaca gaactaaagg aacaaaaggt 540
atatcagcat ttataataga aaaaggcttc aaaggtttct ctattggtaa agttgaacaa 600
aagcttggaa taagagcttc atcaacaact gaacttgtat ttgaagatat gatagtacca 660
gtagaaaaca tgattggtaa agaaggaaaa ggcttcccta tagcaatgaa aactcttgat 720
ggaggaagaa ttggtatagc agctcaagct ttaggtatag ctgaaggtgc tttcaacgaa 780
gcaagagctt acatgaagga gagaaaacaa tttggaagaa gccttgacaa attccaaggt 840
cttgcatgga tgatggcaga tatggatgta gctatagaat cagctagata tttagtatat 900
aaagcagcat atcttaaaca agcaggactt ccatacacag ttgatgctgc aagagctaag 960
cttcatgctg caaatgtagc aatggatgta acaactaagg cagtacaatt atttggtgga 1020
tacggatata caaaagatta tccagttgaa agaatgatga gagatgctaa gataactgaa 1080
atatatgaag gaacttcaga agttcagaaa ttagttattt caggaaaaat ttttagataa 1140
<210>166
<211>1011
<212>DNA
<213>Ca-etfA
<400>166
atgaataaag cagattacaa gggcgtatgg gtgtttgctg aacaaagaga cggagaatta 60
caaaaggtat cattggaatt attaggtaaa ggtaaggaaa tggctgagaa attaggcgtt 120
gaattaacag ctgttttact tggacataat actgaaaaaa tgtcaaagga tttattatct 180
catggagcag ataaggtttt agcagcagat aatgaacttt tagcacattt ttcaacagat 240
ggatatgcta aagttatatg tgatttagtt aatgaaagaa agccagaaat attattcata 300
ggagctactt tcataggaag agatttagga ccaagaatag cagcaagact ttctactggt 360
ttaactgctg attgtacatc acttgacata gatgtagaaa atagagattt attggctaca 420
agaccagcgt ttggtggaaa tttgatagct acaatagttt gttcagacca cagaccacaa 480
atggctacag taagacctgg tgtgtttgaa aaattacctg ttaatgatgc aaatgtttct 540
gatgataaaa tagaaaaagt tgcaattaaa ttaacagcat cagacataag aacaaaagtt 600
tcaaaagttg ttaagcttgc taaagatatt gcagatatcg gagaagctaa ggtattagtt 660
gctggtggta gaggagttgg aagcaaagaa aactttgaaa aacttgaaga gttagcaagt 720
ttacttggtg gaacaatagc cgcttcaaga gcagcaatag aaaaagaatg ggttgataag 780
gaccttcaag taggtcaaac tggtaaaact gtaagaccaa ctctttatat tgcatgtggt 840
atatcaggag ctatccagca tttagcaggt atgcaagatt cagattacat aattgctata 900
aataaagatg tagaagcccc aataatgaag gtagcagatt tggctatagt tggtgatgta 960
aataaagttg taccagaatt aatagctcaa gttaaagctg ctaataatta a 1011
<210>167
<211>780
<212>DNA
<213>Ca-etfB
<400>167
atgaatatag ttgtttgttt aaaacaagtt ccagatacag cggaagttag aatagatcca 60
gttaagggaa cacttataag agaaggagtt ccatcaataa taaatccaga tgataaaaac 120
gcacttgagg aagctttagt attaaaagat aattatggtg cacatgtaac agttataagt 180
atgggacctc cacaagctaa aaatgcttta gtagaagctt tggctatggg tgctgatgaa 240
gctgtacttt taacagatag agcatttgga ggagcagata cacttgcgac ttcacataca 300
attgcagcag gaattaagaa gctaaaatat gatatagttt ttgctggaag gcaggctata 360
gatggagata cagctcaggt tggaccagaa atagctgagc atcttggaat acctcaagta 420
acttatgttg agaaagttga agttgatgga gatactttaa agattagaaa agcttgggaa 480
gatggatatg aagttgttga agttaagaca ccagttcttt taacagcaat taaagaatta 540
aatgttccaa gatatatgag tgtagaaaaa atattcggag catttgataa agaagtaaaa 600
atgtggactg ccgatgatat agatgtagat aaggctaatt taggtcttaa aggttcacca 660
actaaagtta agaagtcatc aactaaagaa gttaaaggac agggagaagt tattgataag 720
cctgttaagg aagcagctgc atatgttgtc tcaaaattaa aagaagaaca ctatatttaa 780
<210>168
<211>2577
<212>DNA
<213>Ca-adhE2
<400>168
atgaaagtta caaatcaaaa agaactaaaa caaaagctaa atgaattgag agaagcgcaa 60
aagaagtttg caacctatac tcaagagcaa gttgataaaa tttttaaaca atgtgccata 120
gccgcagcta aagaaagaat aaacttagct aaattagcag tagaagaaac aggaataggt 180
cttgtagaag ataaaattat aaaaaatcat tttgcagcag aatatatata caataaatat 240
aaaaatgaaa aaacttgtgg cataatagac catgacgatt ctttaggcat aacaaaggtt 300
gctgaaccaa ttggaattgt tgcagccata gttcctacta ctaatccaac ttccacagca 360
attttcaaat cattaatttc tttaaaaaca agaaacgcaa tattcttttc accacatcca 420
cgtgcaaaaa aatctacaat tgctgcagca aaattaattt tagatgcagc tgttaaagca 480
ggagcaccta aaaatataat aggctggata gatgagccat caatagaact ttctcaagat 540
ttgatgagtg aagctgatat aatattagca acaggaggtc cttcaatggt taaagcggcc 600
tattcatctg gaaaacctgc aattggtgtt ggagcaggaa atacaccagc aataatagat 660
gagagtgcag atatagatat ggcagtaagc tccataattt tatcaaagac ttatgacaat 720
ggagtaatat gcgcttctga acaatcaata ttagttatga attcaatata cgaaaaagtt 780
aaagaggaat ttgtaaaacg aggatcatat atactcaatc aaaatgaaat agctaaaata 840
aaagaaacta tgtttaaaaa tggagctatt aatgctgaca tagttggaaa atctgcttat 900
ataattgcta aaatggcagg aattgaagtt cctcaaacta caaagatact tataggcgaa 960
gtacaatctg ttgaaaaaag cgagctgttc tcacatgaaa aactatcacc agtacttgca 1020
atgtataaag ttaaggattt tgatgaagct ctaaaaaagg cacaaaggct aatagaatta 1080
ggtggaagtg gacacacgtc atctttatat atagattcac aaaacaataa ggataaagtt 1140
aaagaatttg gattagcaat gaaaacttca aggacattta ttaacatgcc ttcttcacag 1200
ggagcaagcg gagatttata caattttgcg atagcaccat catttactct tggatgcggc 1260
acttggggag gaaactctgt atcgcaaaat gtagagccta aacatttatt aaatattaaa 1320
agtgttgctg aaagaaggga aaatatgctt tggtttaaag tgccacaaaa aatatatttt 1380
aaatatggat gtcttagatt tgcattaaaa gaattaaaag atatgaataa gaaaagagcc 1440
tttatagtaa cagataaaga tctttttaaa cttggatatg ttaataaaat aacaaaggta 1500
ctagatgaga tagatattaa atacagtata tttacagata ttaaatctga tccaactatt 1560
gattcagtaa aaaaaggtgc taaagaaatg cttaactttg aacctgatac tataatctct 1620
attggtggtg gatcgccaat ggatgcagca aaggttatgc acttgttata tgaatatcca 1680
gaagcagaaa ttgaaaatct agctataaac tttatggata taagaaagag aatatgcaat 1740
ttccctaaat taggtacaaa ggcgatttca gtagctattc ctacaactgc tggtaccggt 1800
tcagaggcaa caccttttgc agttataact aatgatgaaa caggaatgaa atacccttta 1860
acttcttatg aattgacccc aaacatggca ataatagata ctgaattaat gttaaatatg 1920
cctagaaaat taacagcagc aactggaata gatgcattag ttcatgctat agaagcatat 1980
gtttcggtta tggctacgga ttatactgat gaattagcct taagagcaat aaaaatgata 2040
tttaaatatt tgcctagagc ctataaaaat gggactaacg acattgaagc aagagaaaaa 2100
atggcacatg cctctaatat tgcggggatg gcatttgcaa atgctttctt aggtgtatgc 2160
cattcaatgg ctcataaact tggggcaatg catcacgttc cacatggaat tgcttgtgct 2220
gtattaatag aagaagttat taaatataac gctacagact gtccaacaaa gcaaacagca 2280
ttccctcaat ataaatctcc taatgctaag agaaaatatg ctgaaattgc agagtatttg 2340
aatttaaagg gtactagcga taccgaaaag gtaacagcct taatagaagc tatttcaaag 2400
ttaaagatag atttgagtat tccacaaaat ataagtgccg ctggaataaa taaaaaagat 2460
ttttataata cgctagataa aatgtcagag cttgcttttg atgaccaatg tacaacagct 2520
aatcctaggt atccacttat aagtgaactt aaggatatct atataaaatc attttaa 2577
<210>169
<211>2589
<212>DNA
<213>Ca-aad
<400>169
atgaaagtca caacagtaaa ggaattagat gaaaaactca aggtaattaa agaagctcaa 60
aaaaaattct cttgttactc gcaagaaatg gttgatgaaa tctttagaaa tgcagcaatg 120
gcagcaatcg acgcaaggat agagctagca aaagcagctg ttttggaaac cggtatgggc 180
ttagttgaag acaaggttat aaaaaatcat tttgcaggcg aatacatcta taacaaatat 240
aaggatgaaa aaacctgcgg tataattgaa cgaaatgaac cctacggaat tacaaaaata 300
gcagaaccta taggagttgt agctgctata atccctgtaa caaaccccac atcaacaaca 360
atatttaaat ccttaatatc ccttaaaact agaaatggaa ttttcttttc gcctcaccca 420
agggcaaaaa aatccacaat actagcagct aaaacaatac ttgatgcagc cgttaagagt 480
ggtgccccgg aaaatataat aggttggata gatgaacctt caattgaact aactcaatat 540
ttaatgcaaa aagcagatat aacccttgca actggtggtc cctcactagt taaatctgct 600
tattcttccg gaaaaccagc aataggtgtt ggtccgggta acaccccagt aataattgat 660
gaatctgctc atataaaaat ggcagtaagt tcaattatat tatccaaaac ctatgataat 720
ggtgttatat gtgcttctga acaatctgta atagtcttaa aatccatata taacaaggta 780
aaagatgagt tccaagaaag aggagcttat ataataaaga aaaacgaatt ggataaagtc 840
cgtgaagtga tttttaaaga tggatccgta aaccctaaaa tagtcggaca gtcagcttat 900
actatagcag ctatggctgg cataaaagta cctaaaacca caagaatatt aataggagaa 960
gttacctcct taggtgaaga agaacctttt gcccacgaaa aactatctcc tgttttggct 1020
atgtatgagg ctgacaattt tgatgatgct ttaaaaaaag cagtaactct aataaactta 1080
ggaggcctcg gccatacctc aggaatatat gcagatgaaa taaaagcacg agataaaata 1140
gatagattta gtagtgccat gaaaaccgta agaacctttg taaatatccc aacctcacaa 1200
ggtgcaagtg gagatctata taattttaga ataccacctt ctttcacgct tggctgcgga 1260
ttttggggag gaaattctgt ttccgagaat gttggtccaa aacatctttt gaatattaaa 1320
accgtagctg aaaggagaga aaacatgctt tggtttagag ttccacataa agtatatttt 1380
aagttcggtt gtcttcaatt tgctttaaaa gatttaaaag atctaaagaa aaaaagagcc 1440
tttatagtta ctgatagtga cccctataat ttaaactatg ttgattcaat aataaaaata 1500
cttgagcacc tagatattga ttttaaagta tttaataagg ttggaagaga agctgatctt 1560
aaaaccataa aaaaagcaac tgaagaaatg tcctccttta tgccagacac tataatagct 1620
ttaggtggta cccctgaaat gagctctgca aagctaatgt gggtactata tgaacatcca 1680
gaagtaaaat ttgaagatct tgcaataaaa tttatggaca taagaaagag aatatatact 1740
ttcccaaaac tcggtaaaaa ggctatgtta gttgcaatta caacttctgc tggttccggt 1800
tctgaggtta ctccttttgc tttagtaact gacaataaca ctggaaataa gtacatgtta 1860
gcagattatg aaatgacacc aaatatggca attgtagatg cagaacttat gatgaaaatg 1920
ccaaagggat taaccgctta ttcaggtata gatgcactag taaatagtat agaagcatac 1980
acatccgtat atgcttcaga atacacaaac ggactagcac tagaggcaat acgattaata 2040
tttaaatatt tgcctgaggc ttacaaaaac ggaagaacca atgaaaaagc aagagagaaa 2100
atggctcacg cttcaactat ggcaggtatg gcatccgcta atgcatttct aggtctatgt 2160
cattccatgg caataaaatt aagttcagaa cacaatattc ctagtggcat tgccaatgca 2220
ttactaatag aagaagtaat aaaatttaac gcagttgata atcctgtaaa acaagcccct 2280
tgcccacaat ataagtatcc aaacaccata tttagatatg ctcgaattgc agattatata 2340
aagcttggag gaaatactga tgaggaaaag gtagatctct taattaacaa aatacatgaa 2400
ctaaaaaaag ctttaaatat accaacttca ataaaggatg caggtgtttt ggaggaaaac 2460
ttctattcct cccttgatag aatatctgaa cttgcactag atgatcaatg cacaggcgct 2520
aatcctagat ttcctcttac aagtgagata aaagaaatgt atataaattg ttttaaaaaa 2580
caaccttaa 2589
<210>170
<211>1167
<212>DNA
<213>Ca-bdhA
<400>170
atgctaagtt ttgattattc aataccaact aaagtttttt ttggaaaagg aaaaatagac 60
gtaattggag aagaaattaa gaaatatggc tcaagagtgc ttatagttta tggcggagga 120
agtataaaaa ggaacggtat atatgataga gcaacagcta tattaaaaga aaacaatata 180
gctttctatg aactttcagg agtagagcca aatcctagga taacaacagt aaaaaaaggc 240
atagaaatat gtagagaaaa taatgtggat ttagtattag caataggggg aggaagtgca 300
atagactgtt ctaaggtaat tgcagctgga gtttattatg atggcgatac atgggacatg 360
gttaaagatc catctaaaat aactaaagtt cttccaattg caagtatact tactctttca 420
gcaacagggt ctgaaatgga tcaaattgca gtaatttcaa atatggagac taatgaaaag 480
cttggagtag gacatgatga tatgagacct aaattttcag tgttagatcc tacatatact 540
tttacagtac ctaaaaatca aacagcagcg ggaacagctg acattatgag tcacaccttt 600
gaatcttact ttagtggtgt tgaaggtgct tatgtgcagg acggtatagc agaagcaatc 660
ttaagaacat gtataaagta tggaaaaata gcaatggaga agactgatga ttacgaggct 720
agagctaatt tgatgtgggc ttcaagttta gctataaatg gtctattatc acttggtaag 780
gatagaaaat ggagttgtca tcctatggaa cacgagttaa gtgcatatta tgatataaca 840
catggtgtag gacttgcaat tttaacacct aattggatgg aatatattct aaatgacgat 900
acacttcata aatttgtttc ttatggaata aatgtttggg gaatagacaa gaacaaagat 960
aactatgaaa tagcacgaga ggctattaaa aatacgagag aatactttaa ttcattgggt 1020
attccttcaa agcttagaga agttggaata ggaaaagata aactagaact aatggcaaag 1080
caagctgtta gaaattctgg aggaacaata ggaagtttaa gaccaataaa tgcagaggat 1140
gttcttgaga tatttaaaaa atcttat 1167
<210>171
<211>1173
<212>DNA
<213>Ca-bdhB
<400>171
atggttgatt tcgaatattc aataccaact agaatttttt tcggtaaaga taagataaat 60
gtacttggaa gagagcttaa aaaatatggt tctaaagtgc ttatagttta tggtggagga 120
agtataaaga gaaatggaat atatgataaa gctgtaagta tacttgaaaa aaacagtatt 180
aaattttatg aacttgcagg agtagagcca aatccaagag taactacagt tgaaaaagga 240
gttaaaatat gtagagaaaa tggagttgaa gtagtactag ctataggtgg aggaagtgca 300
atagattgcg caaaggttat agcagcagca tgtgaatatg atggaaatcc atgggatatt 360
gtgttagatg gctcaaaaat aaaaagggtg cttcctatag ctagtatatt aaccattgct 420
gcaacaggat cagaaatgga tacgtgggca gtaataaata atatggatac aaacgaaaaa 480
ctaattgcgg cacatccaga tatggctcct aagttttcta tattagatcc aacgtatacg 540
tataccgtac ctaccaatca aacagcagca ggaacagctg atattatgag tcatatattt 600
gaggtgtatt ttagtaatac aaaaacagca tatttgcagg atagaatggc agaagcgtta 660
ttaagaactt gtattaaata tggaggaata gctcttgaga agccggatga ttatgaggca 720
agagccaatc taatgtgggc ttcaagtctt gcgataaatg gacttttaac atatggtaaa 780
gacactaatt ggagtgtaca cttaatggaa catgaattaa gtgcttatta cgacataaca 840
cacggcgtag ggcttgcaat tttaacacct aattggatgg agtatatttt aaataatgat 900
acagtgtaca agtttgttga atatggtgta aatgtttggg gaatagacaa agaaaaaaat 960
cactatgaca tagcacatca agcaatacaa aaaacaagag attactttgt aaatgtacta 1020
ggtttaccat ctagactgag agatgttgga attgaagaag aaaaattgga cataatggca 1080
aaggaatcag taaagcttac aggaggaacc ataggaaacc taagaccagt aaacgcctcc 1140
gaagtcctac aaatattcaa aaaatctgtg taa 1173
<210>172
<211>48
<212>DNA
<213>AU1标签
<400>172
atggatactt atagatacat tggtggtgac acatacaggt atatcggt 48
<210>173
<211>33
<212>DNA
<213>HA标签
<400>173
atgtacccat acgatgttcc tgactatgcg ggt 33
<210>174
<211>33
<212>DNA
<213>myc标签
<400>174
atggaacaaa aactcatctc agaagaagat ggt 33
<210>175
<211>403
<212>DNA
<213>TEF1启动子
<400>175
catagcttca aaatgtttct actccttttt tactcttcca gattttctcg gactccgcgc 60
atcgccgtac cacttcaaaa cacccaagca cagcatacta aatttcccct ctttcttcct 120
ctagggtgtc gttaattacc cgtactaaag gtttggaaaa gaaaaaagag accgcctcgt 180
ttctttttct tcgtcgaaaa aggcaataaa aatttttatc acgtttcttt ttcttgaaaa 240
tttttttttt gatttttttc tctttcgatg acctcccatt gatatttaag ttaataaacg 300
gtcttcaatt tctcaagttt cagtttcatt tttcttgttc tattacaact ttttttactt 360
cttgctcatt agaaagaaag catagcaatc taatctaagt ttt 403
<210>176
<211>650
<212>DNA
<213>TDH3启动子
<400>176
agtttatcat tatcaatact cgccatttca aagaatacgt aaataattaa tagtagtgat 60
tttcctaact ttatttagtc aaaaaattag ccttttaatt ctgctgtaac ccgtacatgc 120
ccaaaatagg gggcgggtta cacagaatat ataacatcgt aggtgtctgg gtgaacagtt 180
tattcctggc atccactaaa tataatggag cccgcttttt aagctggcat ccagaaaaaa 240
aaagaatccc agcaccaaaa tattgttttc ttcaccaacc atcagttcat aggtccattc 300
tcttagcgca actacagaga acaggggcac aaacaggcaa aaaacgggca caacctcaat 360
ggagtgatgc aacctgcctg gagtaaatga tgacacaagg caattgaccc acgcatgtat 420
ctatctcatt ttcttacacc ttctattacc ttctgctctc tctgatttgg aaaaagctga 480
aaaaaaaggt tgaaaccagt tccctgaaat tattccccta cttgactaat aagtatataa 540
agacggtagg tattgattgt aattctgtaa atctatttct taaacttctt aaattctact 600
tttatagtta gtcttttttt tagttttaaa acaccagaac ttagtttcga 650
<210>177
<211>493
<212>DNA
<213>MET3启动子
<400>177
tttagtacta acagagactt ttgtcacaac tacatataag tgtacaaata tagtacagat 60
atgacacact tgtagcgcca acgcgcatcc tacggattgc tgacagaaaa aaaggtcacg 120
tgaccagaaa agtcacgtgt aattttgtaa ctcaccgcat tctagcggtc cctgtcgtgc 180
acactgcact caacaccata aaccttagca acctccaaag gaaatcaccg tataacaaag 240
ccacagtttt acaacttagt ctcttatgaa gttacttacc aatgagaaat agaggctctt 300
tctcgagaaa tatgaatatg gatatatata tatatatata tatatatata tatatatatg 360
taaacttggt tcttttttag cttgtgatct ctagcttggg tctctctctg tcgtaacagt 420
tgtgatatcg tttcttaaca attgaaaagg aactaagaaa gtataataat aacaagaata 480
aagtataatt aac 493
<210>178
<211>461
<212>DNA
<213>CUP1启动子
<400>178
gccgatccca ttaccgacat ttgggcgcta tacgtgcata tgttcatgta tgtatctgta 60
tttaaaacac ttttgtatta tttttcctca tatatgtgta taggtttata cggatgattt 120
aattattact tcaccaccct ttatttcagg ctgatatctt agccttgtta ctagttagaa 180
aaagacattt ttgctgtcag tcactgtcaa gagattcttt tgctggcatt tcttctagaa 240
gcaaaaagag cgatgcgtct tttccgctga accgttccag caaaaaagac taccaacgca 300
atatggattg tcagaatcat ataaaagaga agcaaataac tccttgtctt gtatcaattg 360
cattataata tcttcttgtt agtgcaatat catatagaag tcatcgaaat agatattaag 420
aaaaacaaac tgtacaatca atcaatcaat catcacataa a 461
<210>179
<211>1197
<212>DNA
<213>Ca-ter
<400>179
atgatagtaa aagcaaagtt tgtaaaagga tttatcagag atgtacatcc ttatggttgc 60
agaagggaag tactaaatca aatagattat tgtaagaagg ctattgggtt taggggacca 120
aagaaggttt taattgttgg agcctcatct gggtttggtc ttgctactag aatttcagtt 180
gcatttggag gtccagaagc tcacacaatt ggagtatcct atgaaacagg agctacagat 240
agaagaatag gaacagcggg atggtataat aacatatttt ttaaagaatt tgctaaaaaa 300
aaaggattag ttgcaaaaaa cttcattgag gatgcctttt ctaatgaaac caaagataaa 360
gttattaagt atataaagga tgaatttggt aaaatagatt tatttgttta tagtttagct 420
gcgcctagga gaaaggacta taaaactgga aatgtttata cttcaagaat aaaaacaatt 480
ttaggagatt ttgagggacc gactattgat gttgaaagag acgagattac tttaaaaaag 540
gttagtagtg ctagcattga agaaattgaa gaaactagaa aggtaatggg tggagaggat 600
tggcaagagt ggtgtgaaga gctgctttat gaagattgtt tttcggataa agcaactacc 660
atagcatact cgtatatagg atccccaaga acctacaaga tatatagaga aggtactata 720
ggaatagcta aaaaggatct tgaagataag gctaagctta taaatgaaaa acttaacaga 780
gttataggtg gtagagcctt tgtgtctgtg aataaagcat tagttacaaa agcaagtgca 840
tatattccaa cttttcctct ttatgcagct attttatata aggtcatgaa agaaaaaaat 900
attcatgaaa attgtattat gcaaattgag agaatgtttt ctgaaaaaat atattcaaat 960
gaaaaaatac aatttgatga caagggaaga ttaaggatgg acgatttaga gcttagaaaa 1020
gacgttcaag acgaagttga tagaatatgg agtaatatta ctcctgaaaa ttttaaggaa 1080
ttatctgatt ataagggata caaaaaagaa ttcatgaact taaacggttt tgatctagat 1140
ggggttgatt atagtaaaga cctggatata gaattattaa gaaaattaga accttaa 1197
<210>180
<211>1194
<212>DNA
<213>Ah-ter
<400>180
atgatcatta aaccgaaagt tcgtggcttc atttgtacca ccactcatcc ggttggctgt 60
gaagctaatg tacgccgcca gatcgcgtat accaaagcaa aaggcactat cgaaaacggc 120
cctaagaaag tgctggtgat tggtgcgagc accggttacg gtctggcgtc ccgcattgca 180
gcggcgttcg gtagcggcgc cgcgaccctg ggtgttttct tcgaaaaagc gggctccgaa 240
actaaaaccg cgaccgcagg ttggtacaac tctgccgcgt ttgacaaagc cgccaaagag 300
gctggcctgt atgcgaaatc tattaacggt gacgcgttca gcaacgaatg ccgtgctaaa 360
gtgatcgaac tgatcaaaca ggatctgggc caaattgatc tggttgttta ttctctggcc 420
tccccggttc gtaaactgcc ggataccggc gaagttgtgc gcagcgctct gaaacctatt 480
ggtgaagtgt acaccacgac cgcaattgat actaataagg accagattat caccgcaacc 540
gtcgagccgg ccaacgagga agagatccag aataccatca ctgtgatggg cggtcaagac 600
tgggaactgt ggatggcagc actgcgcgac gcaggtgttc tggcagacgg tgcaaagagc 660
gtcgcttact cttacatcgg cactgacctg acttggccga tctactggca tggcaccctg 720
ggtcgcgcga aagaggatct ggatcgcgca gcggcagcga tccgcggtga tctggccggt 780
aagggcggta ctgcgcacgt tgccgttctg aaatccgtgg tcacccaggc atcttctgca 840
atcccggtga tgccgctgta tatttctatg gcctttaaaa tcatgaaaga gaagggtatc 900
cacgaaggct gtatggagca agtggaccgc atgatgcgta ctcgcctgta cgcggcggac 960
atggcactgg atgaccaggc gcgtatccgt atggacgatt gggaactgcg tgaagatgtt 1020
cagcagactt gccgtgatct gtggccgtcc attacctccg aaaacctgtg cgagctgacc 1080
gattacactg gttacaaaca ggaatttctg cgtctgttcg gtttcggtct ggaagaagta 1140
gactacgatg cagacgttaa cccggacgtt aaatttgatg ttgtcgaact gtga 1194
<210>181
<211>1218
<212>DNA
<213>Eg-ter
<400>181
atggccatgt tcaccactac cgccaaggtt attcagccga aaatccgtgg ttttatctgt 60
acgaccaccc acccgattgg ctgtgaaaaa cgcgtgcagg aagaaattgc ttacgcacgt 120
gcacatccac cgaccagccc gggtccgaaa cgtgtcctgg tcatcggctg ttccactggc 180
tacggcctgt ctactcgtat caccgcagct ttcggctatc aggcggctac tctgggcgtg 240
ttcctggctg gtccgccgac taaaggtcgc ccggctgcgg ccggttggta taacaccgta 300
gctttcgaaa aagcggccct ggaagccggt ctgtatgccc gctccctgaa cggtgacgct 360
tttgactcta ctaccaaagc acgcaccgtg gaagctatca aacgtgacct gggcaccgtt 420
gacctggtgg tttatagcat tgcagctccg aaacgtaccg atccggctac cggcgtgctg 480
cacaaagcgt gtctgaaacc gatcggtgcg acctacacca accgtacggt aaatactgac 540
aaagctgaag ttacggacgt gtccatcgaa ccggcgagcc cagaagaaat tgcagacact 600
gtgaaagtaa tgggtggcga agactgggaa ctgtggattc aggctctgtc tgaagccggc 660
gttctggcag aaggcgcgaa aaccgtcgca tactcttata tcggtccgga gatgacctgg 720
ccggtgtact ggtccggcac cattggtgaa gccaaaaagg atgttgaaaa agccgctaaa 780
cgtattaccc agcagtacgg ctgtccggca tacccggttg tggcaaaagc actggtgacg 840
caggcatcct ccgcgatccc ggtcgtcccg ctgtatattt gtctgctgta ccgtgtaatg 900
aaagaaaaag gcactcacga aggttgcatc gaacaaatgg tgcgtctgct gaccacgaaa 960
ctgtacccgg aaaacggtgc cccgatcgtt gatgaagcgg gccgtgttcg tgtggacgat 1020
tgggaaatgg cagaagacgt tcagcaagcc gttaaagacc tgtggagcca ggtgagcacg 1080
gcaaacctga aagatatttc cgacttcgcc ggttaccaaa ccgagttcct gcgcctgttt 1140
ggttttggta tcgatggcgt ggactatgac cagccggttg acgtagaggc agacctgccg 1200
agcgcagctc agcagtaa 1218
<210>182
<211>1344
<212>DNA
<213>Sc-ccr
<400>182
atgaccgtga aagacattct ggacgctatt caatctaaag acgccacttc cgcggatttc 60
gcagctctgc aactgccgga gtcctaccgt gccatcaccg ttcacaaaga tgaaactgaa 120
atgttcgcgg gtctggaaac tcgtgacaaa gatccacgta aatccattca cctggacgaa 180
gttccagtgc cggaactggg tccgggcgaa gccctggtgg cagttatggc aagctccgtt 240
aactacaact ctgtatggac gtctatcttt gaaccggtaa gcaccttcgc cttcctggaa 300
cgctacggca aactgtctcc gctgaccaaa cgtcatgatc tgccatacca catcatcggt 360
tctgacctgg caggcgtcgt cctgcgtacc ggccctggtg ttaacgcctg gcagccgggt 420
gacgaagtcg ttgcccattg cctgtctgtt gaactggaat cccctgatgg ccatgatgac 480
accatgctgg acccggagca gcgtatttgg ggcttcgaaa ctaactttgg tggtctggct 540
gagattgctc tggtgaagac taaccagctg atgccgaaac caaaacacct gacttgggaa 600
gaagccgcgg ctccgggcct ggtcaacagc actgcgtatc gtcagctggt ttctcgtaac 660
ggtgctgcta tgaaacaggg tgataacgtt ctgatctggg gcgcgtccgg tggtctgggc 720
tcttacgcga cccagttcgc actggccggt ggcgcgaatc cgatctgcgt tgttagctct 780
ccgcagaaag ctgaaatttg tcgttctatg ggcgcagaag cgatcattga tcgcaacgca 840
gagggctaca aattttggaa agacgaacat acccaggacc ctaaggaatg gaagcgtttc 900
ggcaaacgta tccgcgaact gactggtggt gaagacattg atatcgtttt tgaacaccct 960
ggtcgtgaga cttttggtgc gtctgtatac gttacccgca agggcggtac gatcaccacc 1020
tgtgcatcta cctctggcta catgcatgag tatgataacc gttacctgtg gatgtccctg 1080
aaacgtatca tcggctctca ctttgctaac tatcgcgaag cctatgaggc aaaccgtctg 1140
atcgctaaag gcaaaattca tccgactctg tctaaaacct attccctgga ggaaactggc 1200
caggcggcct acgacgtaca ccgtaacctg caccagggca aagttggcgt tctgtgcctg 1260
gctccggaag aaggtctggg tgttcgtgac gctgaaatgc gtgctcagca cattgacgcg 1320
attaaccgtt tccgtaatgt gtga 1344
<210>183
<211>36
<212>DNA
<213>Gevo-345
<400>183
atgtttgtcg acatgatagt aaaagcaaag tttgta 36
<210>184
<211>41
<212>DNA
<213>Gevo-346
<400>184
cttaatgcgg ccgcttaagg ttctaatttt cttaataatt c 41
<210>185
<211>35
<212>DNA
<213>Gevo-343
<400>185
gcttgagtcg acatgatcat taaaccgaaa gttcg 35
<210>186
<211>37
<212>DNA
<213>Gevo-344
<400>186
atttaaggat cctcacagtt cgacaacatc aaattta 37
<210>187
<211>32
<212>DNA
<213>Gevo-347
<400>187
catcacgtcg acatggccat gt tcaccact ac 32
<210>188
<211>31
<212>DNA
<213>Gevo-348
<400>188
ctcgcgggat ccttactgct gagctgcgct c 31
<210>189
<211>33
<212>DNA
<213>Gevo-341
<400>189
gtcttagtcg acatgaccgt gaaagacatt ctg 33
<210>190
<211>34
<212>DNA
<213>Gevo-342
<400>190
attggcggat cctcacacat tacggaaacg gtta 34