由代谢工程化酵母进行的丁醇生产.pdf

上传人:00062****4422 文档编号:878345 上传时间:2018-03-16 格式:PDF 页数:175 大小:8.42MB
返回 下载 相关 举报
摘要
申请专利号:

CN200780051627.8

申请日:

2007.12.21

公开号:

CN101652482A

公开日:

2010.02.17

当前法律状态:

撤回

有效性:

无权

法律详情:

发明专利申请公布后的视为撤回IPC(主分类):C12P 7/16申请公布日:20100217|||实质审查的生效IPC(主分类):C12P 7/16申请日:20071221|||公开

IPC分类号:

C12P7/16

主分类号:

C12P7/16

申请人:

格沃股份有限公司

发明人:

尤维尼·古纳沃德纳; 彼得·迈因霍尔德; 马修·W·彼得斯; 琼·尤拉诺; 里德·M·R·费尔德曼

地址:

美国加利福尼亚州

优先权:

2006.12.21 US 60/871,427; 2007.2.2 US 60/888,016; 2007.5.8 US 60/928,283

专利代理机构:

北京市柳沈律师事务所

代理人:

岑晓东

PDF下载: PDF下载
内容摘要

公开了代谢工程化酵母及生产正丁醇的方法。在一个实施方案中,代谢工程化酵母能够代谢碳源以生成正丁醇,至少一种途径生成相对于野生型酵母所生成的胞质乙酰-CoA增加的胞质乙酰-CoA,且至少一种异源基因编码并表达能够利用NADH来将乙酰-CoA转化成正丁醇的代谢途径的至少一种酶。在另一个实施方案中,生产正丁醇的方法包括(a)提供如下代谢工程化酵母,其能够代谢碳源以生成正丁醇,至少一种途径生成相对于野生型酵母所生成的胞质乙酰-CoA增加的胞质乙酰-CoA,且至少一种异源基因编码并表达能够利用NADH来将乙酰-CoA转化成正丁醇的代谢途径的至少一种酶;并(b)培养该酵母以生成正丁醇。还公开了其它实施方案。

权利要求书

1: 一种代谢工程化酵母,其能够代谢碳源以生成正丁醇,至少一种途 径配置成生成相对于野生型酵母所生成的另一胞质乙酰-CoA量增加的胞质 乙酰-CoA量,且至少一种异源基因编码并表达能够利用NADH来将乙酰 -CoA转化成正丁醇的代谢途径的至少一种酶。
2: 权利要求1的酵母,其中所述至少一种异源基因单独地编码并表达 能够利用NADH来将乙酰-CoA转化成正丁醇的代谢途径的至少一种酶。
3: 权利要求1的酵母,其中所述至少一种异源基因与至少一种天然酵 母基因组合地编码并表达能够利用NADH来将乙酰-CoA转化成正丁醇的代 谢途径的至少一种酶。
4: 权利要求1的酵母,其中所述酵母过表达丙酮酸脱羧酶以提高胞质 乙酰-CoA生成。
5: 权利要求4的酵母,其中所述丙酮酸脱羧酶是由酿酒酵母基因PDC1 所编码的。
6: 权利要求4的酵母,其中所述丙酮酸脱羧酶是由酿酒酵母基因 PDC1、PDC5、和PDC6中至少一种所编码的。
7: 权利要求1的酵母,其中所述酵母过表达醛脱氢酶以提高胞质乙酰 -CoA生成。
8: 权利要求7的酵母,其中所述醛脱氢酶是由酿酒酵母基因ALD6所编 码的。
9: 权利要求7的酵母,其中所述醛脱氢酶是由乳酸克鲁维酵母基因 ALD6所编码的。
10: 权利要求1的酵母,其中所述酵母过表达乙酰-CoA合成酶以提高胞 质乙酰-CoA生成。
11: 权利要求10的酵母,其中所述乙酰-CoA合成酶是由酿酒酵母基因 ACS1和酿酒酵母基因ACS2中至少一种所编码的。
12: 权利要求10的酵母,其中所述乙酰-CoA合成酶是由乳酸克鲁维酵母 基因ACS1和乳酸克鲁维酵母基因ACS2中至少一种所编码的。
13: 权利要求1的酵母,其中所述酵母过表达醛脱氢酶和乙酰-CoA合成 酶二者以提高胞质乙酰-CoA生成。
14: 权利要求13的酵母,其中所述醛脱氢酶是由酿酒酵母基因ALD6所 编码的,且所述乙酰-CoA合成酶是由酿酒酵母基因ACS1和酿酒酵母基因 ACS2中至少一种所编码的。
15: 权利要求13的酵母,其中所述醛脱氢酶是由乳酸克鲁维酵母基因 ALD6所编码的,且所述乙酰-CoA合成酶是由乳酸克鲁维酵母基因ACS1和乳 酸克鲁维酵母基因ACS2中至少一种所编码的。
16: 权利要求13的酵母,其中所述酵母过表达丙酮酸脱羧酶以提高胞质 乙酰-CoA生成。
17: 权利要求16的酵母,其中所述丙酮酸脱羧酶是由PDC1、PDC5和 PDC6中至少一种所编码的,醛脱氢酶是由酿酒酵母基因ALD6所编码的,且 所述乙酰-CoA合成酶是由酿酒酵母基因ACS1和酿酒酵母基因ACS2中至少一 种所编码的。
18: 权利要求16的酵母,其中所述丙酮酸脱羧酶是由乳酸克鲁维酵母基 因PDC1所编码的,醛脱氢酶是由乳酸克鲁维酵母基因ALD6所编码的,且所 述乙酰-CoA合成酶是由乳酸克鲁维酵母基因ACS1和乳酸克鲁维酵母基因 ACS2中至少一种所编码的。
19: 权利要求1的酵母,其中所述酵母过表达丙酮酸脱氢酶以提高胞质 乙酰-CoA生成。
20: 权利要求19的酵母,其中所述酵母过表达由大肠杆菌基因aceE、 aceF、lpdA所编码的丙酮酸脱氢酶以提高胞质乙酰-CoA生成。
21: 权利要求20的酵母,其中PDC活性是降低的和消除的之一。
22: 权利要求19的酵母,其中所述酵母过表达由删除了N-末端线粒体靶 向信号的酿酒酵母基因PDA1、PDB1、PDX1、LAT1、LPD1所编码的丙酮酸 脱氢酶以提高胞质乙酰-CoA生成。
23: 权利要求22的酵母,其中PDC活性是降低的和消除的之一。
24: 权利要求23的酵母,其中所述酵母是(1)基因型pdc2Δ,及(2)基因型 pdc1Δ、基因型pdc5Δ、和基因型pdc6Δ之一的酿酒酵母。
25: 权利要求23的酵母,其中所述酵母是基因型pdc1Δ的乳酸克鲁维酵 母。
26: 权利要求1的酵母,其中所述酵母过表达丙酮酸甲酸裂合酶和甲酸 脱氢酶二者以提高胞质乙酰-CoA生成。
27: 权利要求26的酵母,其中所述酵母过表达由大肠杆菌基因pflA和大 肠杆菌基因pflB所编码的丙酮酸甲酸裂合酶,并与博伊丁氏假丝酵母基因 FDH1组合以提高胞质乙酰-CoA生成。
28: 权利要求27的酵母,其中PDC活性是降低的和消除的之一。
29: 权利要求27的酵母,其中所述酵母是(1)基因型pdc2Δ,及2)基因型 pdc1Δ、基因型pdc5Δ、和基因型pdc6Δ之一的酿酒酵母。
30: 权利要求27的酵母,其中所述酵母是基因型pdc1Δ的乳酸克鲁维酵 母。
31: 权利要求1的酵母,其中所述至少一种异源基因中至少一种已经进 行了分子进化以增强由其所编码的蛋白质的酶活性。
32: 权利要求1的酵母,其中至少一种另外的编码醇脱氢酶的基因被灭 活,使得醇脱氢酶活性充分降低以相对于野生型生成提高胞质乙酰-CoA生 成。
33: 权利要求32的酵母,其中所述酵母是酿酒酵母,且所述醇脱氢酶是 由ADH1所编码的。
34: 权利要求32的酵母,其中所述酵母是乳酸克鲁维酵母,其所述醇脱 氢酶是由ADH1所编码的。
35: 权利要求32的酵母,其中所述酵母是酿酒酵母,且所述醇脱氢酶是 由ADH1、ADH2、ADH3和ADH4所编码的。
36: 权利要求32的酵母,其中所述酵母是乳酸克鲁维酵母,且所述醇脱 氢酶是由ADHI、ADHII、ADHIII和ADHIV所编码的。
37: 权利要求1的酵母,其中所述酵母是来自以下属之一的物种:酵母 属、德克酵母属、毕赤酵母属、汉逊酵母属、西洋蓍霉属、曲霉属、克鲁维 酵母属、管囊酵母属、裂殖酵母属、假丝酵母属、丝孢酵母属、Yamadazyma、 有孢圆酵母属、和隐球菌属。
38: 权利要求1的酵母,其中所述途径在代谢碳源以生成正丁醇时提供 平衡的NADH生成和消耗。
39: 一种生产正丁醇的方法,该方法包括: (a)提供如下代谢工程化酵母,其能够代谢碳源以生成正丁醇,至少一 种途径配置成生成相对于野生型酵母所生成的另一胞质乙酰-CoA量增加的 胞质乙酰-CoA量,且至少一种异源基因编码并表达能够利用NADH来将乙酰 -CoA转化成正丁醇的代谢途径的至少一种酶;并 (b)培养该代谢工程化酵母,培养的时间和条件用以生成正丁醇。
40: 一种使用酵母生产正丁醇的方法,该方法包括: (a)代谢工程改造酵母以提高胞质乙酰-CoA生成; (b)代谢工程改造酵母以表达将碳源转化成正丁醇的代谢途径,其中该 途径需要至少一种对于该酵母而言非天然的酶,其中步骤(a)和(b)可以以任一 次序实施;并 (c)培养该酵母,培养的时间和条件用以生成可回收量的正丁醇。
41: 一种使用酵母生产正丁醇的方法,该方法包括: (a)培养代谢工程化酵母,培养的时间和条件用以生成酵母细胞生物质 但不激活正丁醇生成;并 (b)在另一段时间改变培养条件,培养的时间和条件用以生成可回收量 的正丁醇。
42: 一种代谢工程化酵母,其能够代谢碳源并生成相对于野生型酵母所 生成的胞质乙酰-CoA量增加的乙酰-CoA量。
43: 权利要求42的酵母,其中所述酵母过表达丙酮酸脱羧酶、醛脱氢酶 和乙酰-CoA合成酶以提高胞质乙酰-CoA生成。
44: 权利要求42的酵母,其中所述丙酮酸脱羧酶是由酿酒酵母基因 PDC1、PDC5和PDC6中至少一种所编码的,醛脱氢酶是由酿酒酵母基因 ALD6所编码的,且乙酰-CoA合成酶是由酿酒酵母基因ACS1和ACS2中至少一 种所编码的。
45: 权利要求44的酵母,其中所述醇脱氢酶是通过删除酿酒酵母基因 ADH1而灭活的。
46: 权利要求42的酵母,其中所述酵母是克鲁维酵母属的,所述丙酮酸 脱羧酶是由乳酸克鲁维酵母基因KIPDC1所编码的,醛脱氢酶是由乳酸克鲁 维酵母基因KIALD6所编码的,且乙酰-CoA合成酶是由乳酸克鲁维酵母基因 KIACS1和KIACS2中至少一种所编码的。
47: 权利要求46的酵母,其中所述醇脱氢酶是通过删除乳酸克鲁维酵母 基因ADH1而灭活的。
48: 权利要求42的酵母,其中所述酵母过表达丙酮酸脱氢酶以提高胞质 乙酰-CoA生成。
49: 权利要求48的酵母,其中所述酵母过表达由大肠杆菌基因aceE、大 肠杆菌基因aceF和大肠杆菌基因lpdA所编码的丙酮酸脱氢酶以提高胞质乙 酰-CoA生成。
50: 权利要求49的酵母,其中PDC活性是降低的和消除的之一。
51: 权利要求49的酵母,其中所述酵母是(1)基因型pdc2Δ,及(2)基因型 pdc1Δ、基因型pdc5Δ、和基因型pdc6Δ之一的酿酒酵母。
52: 权利要求49的酵母,其中所述酵母是基因型pdc1Δ的乳酸克鲁维酵 母。
53: 权利要求48的酵母,其中所述酵母过表达由删除了N-末端线粒体靶 向信号的酿酒酵母基因PDA1、PDB1、PDX1、LAT1、和LPD1所编码的丙酮 酸脱氢酶以提高胞质乙酰-CoA生成。
54: 权利要求53的酵母,其中PDC活性是降低的和消除的之一。
55: 权利要求53的酵母,其中所述酵母是(1)基因型pdc2Δ,及(2)基因型 pdc1Δ、基因型pdc5Δ、和基因型pdc6Δ之一的酿酒酵母。
56: 权利要求53的酵母,其中所述酵母是基因型pdc1Δ的乳酸克鲁维酵 母。
57: 权利要求42的酵母,其中所述酵母过表达丙酮酸甲酸裂合酶和甲酸 脱氢酶二者以提高胞质乙酰-CoA生成。
58: 权利要求57的酵母,其中所述酵母过表达由大肠杆菌基因pflA、pflB 所编码的丙酮酸甲酸裂合酶,并与博伊丁氏假丝酵母基因FDH1组合以提高 胞质乙酰-CoA生成。
59: 权利要求58的酵母,其中PDC活性是降低的和消除的之一。
60: 权利要求59的酵母,其中所述酵母是(1)基因型pdc2Δ,及(2)基因型 pdc1Δ、基因型pdc5Δ、和基因型pdc6Δ之一的酿酒酵母。
61: 权利要求59的酵母,其中所述酵母是基因型pdc1的乳酸克鲁维酵 母。
62: 权利要求42的酵母,其中至少一种基因已经进行了分子进化以增强 由其所编码的蛋白质的酶活性。
63: 一种提高酵母的代谢活性的方法,该方法包括酵母生成相对于野生 型酵母所生成的另一胞质乙酰-CoA量增加的胞质乙酰-CoA量。
64: 一种代谢工程化酵母,其具有至少一种途径,该途径配置成生成相 对于野生型酵母所生成的另一胞质乙酰-CoA量增加的胞质乙酰-CoA量。

说明书


由代谢工程化酵母进行的丁醇生产

    致有关人员:

    声明如下,我们(下文列出了姓名、住址、和国籍)发明了以下说明书中描述的、题为“由代谢工程化酵母进行的丁醇生产”的发明。

    Uvini Gunawardena

    住址:帕萨迪纳,加利福尼亚

    国籍:斯里兰卡

    Peter Meinhold

    住址:帕萨迪纳,加利福尼亚

    国籍:德国

    Matthew W.Peters

    住址:帕萨迪纳,加利福尼亚

    国籍:美国

    Jun Urano

    住址:卡尔弗城,加利福尼亚

    国籍:美国

    Reid M.Renny Feldman

    住址:洛杉矶,加利福尼亚

    国籍:美国

    本申请要求(1)Jun Urano等人于2006年12月21日提交的美国临时专利申请流水号60/871,427,“由代谢工程化酵母进行的丁醇生产”(BUTANOLPRODUCTION BY METABOLICALLY ENGINEERED YEAST);(2)JunUrano等人于2007年2月2日提交的美国临时专利申请流水号60/888,016,“由代谢工程化酵母进行的正丁醇生产”(N-BUTANOL PRODUCTION BYMETABOLICALLY ENGINEERED YEAST);和(3)Uvini P.Gunawardena等人于2007年5月8日提交的美国临时专利申请流水号60/928,283,“由代谢工程化酵母进行的丁醇生产”(BUTANOL PRODUCTION BY METABOLICALLYENGINEERED YEAST)的权益。在此通过述及将上述每一篇申请收入本文。

    【发明领域】

    本发明涉及代谢工程改造的酵母细胞,用于以高产率生产正丁醇,作为替代的且可再生的运输燃料,及用于其它应用。本发明的酵母被工程化改造成包含将诸如葡萄糖和/或其它可代谢碳水化合物的碳源以及生物质等等转化成正丁醇的代谢途径。

    【发明背景】

    当前,美国每年消费大约1400亿加仑汽油,而全世界每年消费大约3400亿加仑汽油。这些消费数量还在增加中。2005年能源政策法案(Energy PolicyAct of 2005)规定了到2012年要在汽油中使用75亿加仑可再生燃料。在他的2007年国情咨文(2007 State of the Union address)中,总统要求提高可再生燃料标准(renewable fuel standard)(RFS)的大小和扩大可再生燃料标准的范围,要求在2017年使用350亿加仑可再生的替代燃料。能源部已经设定了到2030年用生物燃料替换美国当前汽油消耗的30%的目标(即“30X30”提案)。在2007年5月,巴西和美国签署了“乙醇协议”(the Ethanol Agreement),以促进美洲生物燃料的开发,联合世界最大生物燃料生产商-当前占世界乙醇生产的70%。

    生物燃料不仅具有降低美国对外国石油输入的依赖性(这对于国土安全是至关重要的)的潜力,而且具有显著降低与全球变暖有关的温室气体排放的潜力。自基于碳的原料的转化能获得生物燃料。农业原料被认为是可再生的,原因在于,虽然它们在燃烧时释放二氧化碳,但是它们通过光合作用捕获几乎相等量的二氧化碳。

    在美国,乙醇日益用作标准汽油的氧化添加剂,作为甲基叔丁基醚(MTBE)的替代品,后一种化学品难以自地下水和土壤污染中收回。在10%混合物,通过提高辛烷值,乙醇降低发动机爆震(engine knock)的可能性。10%乙醇汽油的使用在有些城市是强制性的,在这些城市中有害水平的汽车排气的可能性是有可能的,尤其是在冬季的几个月里。北美车辆自大约1980年起无需改装就能以10%乙醇/90%汽油(即E10)运行。

    然而,为了以更高浓度使用乙醇,必须专门地工程化改造或改装车辆的发动机和燃料系统。设计了可变燃料车辆(flexible fuel vehicle)(FFV),以汽油或者以高至85%乙醇(E85)的混合物运行。然而,因为一加仑乙醇含有的能量比一加仑汽油少,所以FFV在以E85作为燃料时通常每加仑获得的里程少大于20-30%。可获得转化包,用于将常规车辆转化成FFV,其通常包括电子装置以提高每个循环所注入的燃料体积(因为乙醇的能含量较低)和有些情况中的化学处理以保护发动机免于腐蚀。当前美国有超过400万辆可变燃料车辆在路上行驶,虽然2002年的研究发现这些车辆所消费的燃料中E85少于1%。

    丁醇作为燃料具有数项胜过乙醇的优点。虽然它能自与乙醇相同的原料来制备,但是与乙醇不同,它与汽油和柴油在任意比例相容。丁醇还能在现有汽车中无需改装用作纯燃料,而且Virgin航空公司的Richard Branson爵士小组已经提出将丁醇用作喷气发动机燃料。与乙醇不同,丁醇不吸收水,而且如此能在现有的石化基础设施中储存和配给。由于其较高的能含量,燃料经济(每加仑里程)好于乙醇。还有,丁醇-汽油混合物具有比乙醇-汽油混合物低的蒸气压,这在降低蒸气碳氢化合物排放中是重要的。这些特性为丁醇提供了以与汽油完全相同的方式使用的潜力,而无需改装车辆且消费者没有不得不更频繁补充燃料的负担。

    使用经由自丁酰-CoA通向正丁醇的途径而天然生成正丁醇的梭菌属(Clostridum)菌株,能生成正丁醇。梭菌属菌株的一项缺点在于正丁醇生成以两个步骤的过程发生,其牵涉酸生成生长期和之后地溶剂生成期。还有,在这种过程中生成大量的副产物,诸如氢、乙醇、和丙酮,如此将正丁醇的化学计量产率限制为大约0.6mol正丁醇每mol消耗的葡萄糖。另外,梭菌属菌株丧失了它们在连续培养条件下生成溶剂的能力(Cornillot等,J.Bacteriol.179:5442-5447,1997)。图1中显示了梭菌途径,显示了丙酮丁醇梭菌(Clostridum acetobutylicum)中葡萄糖转化成酸和溶剂,包括自乙酰-CoA生成正丁醇的途径。

    发明概述

    在一个实施方案中,提供了如下代谢工程化酵母,其能够代谢碳源以生成正丁醇,至少一种途径配置成生成相对于野生型酵母所生成的另一胞质乙酰-CoA量增加的胞质乙酰-CoA量,且至少一种异源基因编码并表达能够利用NADH来将乙酰-CoA转化成正丁醇的代谢途径的至少一种酶。

    在另一个实施方案中,提供了生产正丁醇的方法,该方法包括(a)提供如下代谢工程化酵母,其能够代谢碳源以生成正丁醇,至少一种途径配置成生成相对于野生型酵母所生成的另一胞质乙酰-CoA量增加的胞质乙酰-CoA量,且至少一种异源基因编码并表达能够利用NADH来将乙酰-CoA转化成正丁醇的代谢途径的至少一种酶;并(b)培养该代谢工程化酵母,培养的时间和条件用以生成正丁醇。

    在又一个实施方案中,提供了使用酵母生产正丁醇的方法,该方法包括(a)代谢工程改造酵母以提高胞质乙酰-CoA生成;(b)代谢工程改造酵母以表达将碳源转化成正丁醇的代谢途径,其中该途径需要至少一种对于该酵母而言非天然的酶,其中步骤(a)和(b)可以以任一次序实施;并(c)培养该酵母,培养的时间和条件用以生成可回收量的正丁醇。

    在还有一个实施方案中,提供了使用酵母生产正丁醇的方法,该方法包括(a)培养代谢工程化酵母,培养的时间和条件用以生成酵母细胞生物质但不激活正丁醇生成;并(b)在另一段时间改变培养条件,培养的时间和条件用以生成可回收量的正丁醇。

    在另一个实施方案中,提供了如下代谢工程化酵母,其能够代谢碳源并生成相对于野生型酵母所生成的乙酰-CoA量增加的乙酰-CoA量。

    在又一个实施方案中,提供了提高酵母的代谢活性的方法,该方法包括酵母生成相对于野生型酵母所生成的另一胞质乙酰-CoA量增加的胞质乙酰-CoA量。

    在还有一个实施方案中,提供了如下代谢工程化酵母,其具有至少一种途径配置成生成相对于野生型酵母所生成的另一胞质乙酰-CoA量增加的胞质乙酰-CoA量。

    还公开了其它实施方案。

    附图简述

    附图中图示了本发明的例示性实施方案,其中:

    图1图示了丙酮丁醇梭菌中葡萄糖、戊糖、和淀粉粒(granulose)转化成酸和溶剂中所牵涉的代谢途径。己糖(例如葡萄糖)和戊糖被转化成丙酮酸、ATP和NADH。随后,丙酮酸被丙酮酸-铁氧还蛋白氧化还原酶氧化性脱羧成乙酰-CoA。在此步骤中所生成的还原当量被只含铁的氢化酶(iron-onlyhydrogenase)转化成氢。乙酰-CoA是分支点中间产物,通向有机酸(乙酸和丁酸)和溶剂(丙酮、丁醇和乙醇)的生成。

    图2图示了在酵母中生成丁醇的化学途径。

    图3图示了酿酒酵母(Sacchromyces cerevisiae)生成乙酰-CoA所使用的途径。

    图4和5图示了可用于依照本公开内容表达各种酶的各种例示性质粒。

    图4图示了可用于如表1中所描述的依照本公开内容表达各种酶的示例性质粒。

    图5图示了可用于如表2中所描述的依照本公开内容表达各种酶的示例性质粒。

    图6图示了Gevo 1099和Gevo 1103随时间的正丁醇生成,与只含载体的对照隔离群、Gevo 1110和Gevo 1111相比较,如下:

    Gevo 1099;

    Gevo 1103;

    Gevo 1110;和

    Gevo 1111。

    图7图示了含有来自丙酮丁醇梭菌的bcd、etfb、和etfa基因的pGV1090质粒,所述基因插入在EcoR1和BamHI位点处和改良的噬菌体λLacO-1启动子(PL-lac)的下游。该质粒还携带pBR322的复制起点基因和氯霉素抗性基因。

    图8图示了用于表达来自丙酮丁醇梭菌的丁醛脱氢酶(bdhB)的pGV1095质粒,该丁醛脱氢酶插入在EcoRI和BamHI位点处和改良噬菌粒λLacO-1启动子(PL-lac)的下游。该质粒还携带CoIEI复制起点基因和氯霉素抗性基因。

    图9图示了用于表达来自丙酮丁醇梭菌的巴豆酸酶(crt)的pGV1094质粒,该巴豆酸酶插入在EcoRI和BamHI位点处和改良噬菌体λLacO-1启动子(PL-lac)的下游。该质粒还携带ori基因和氯霉素抗性基因。

    图10图示了用于表达来自丙酮丁醇梭菌的羟丁酰-CoA脱氢酶(hbd)的pGV1037质粒,该羟丁酰-CoA脱氢酶插入在EcoRI和BamHI位点处和改良噬菌体λLacO-1启动子(PL-lac)的下游。该质粒还携带ori基因和氯霉素抗性基因。

    图11图示了用于表达来自丙酮丁醇梭菌的硫解酶(thl)的pGV1031质粒,该硫解酶插入在EcoRI和BamHI位点处和LacZ基因的下游。该质粒还携带pBR322的复制起点基因和氨苄青霉素抗性基因。

    图12图示了用于表达来自拜氏梭菌(Clostridium beijerinckii)的巴豆酸酶(crt)的pGV1049质粒,该巴豆酸酶插入在EcoRI和BamHI位点处和改良噬菌体λLacO-1启动子(PL-lac)的下游。该质粒还携带ori基因和氯霉素抗性基因。

    图13图示了用于表达来自拜氏梭菌的羟丁酰-CoA脱氢酶(hbd)的pGV1050质粒,该羟丁酰-CoA脱氢酶插入在EcoRI和BamHI位点处和改良噬菌体λLacO-1启动子(PL-lac)的下游。该质粒还携带ori基因和氯霉素抗性基因。

    图14图示了用于表达来自拜氏梭菌的醇脱氢酶(adhA)的pGV1091质粒,该醇脱氢酶插入在HindIII和BamHI位点处和改良噬菌体λLacO-1启动子(PL-lac)的下游。该质粒还携带氯霉素抗性基因。

    图15图示了用于表达来自拜氏梭菌的醇脱氢酶(aldh)的pGV1096质粒,该醇脱氢酶插入在EcoRI和BamHI位点处和改良噬菌体λLacO-1启动子(PL-lac)的下游。该质粒还携带ori基因和氯霉素抗性基因。

    发明详述

    描述了被工程化改造成以高产率将碳源转化成正丁醇的重组酵母微生物。具体而言,描述了能够代谢碳源以理论值的至少5%的产率和有些情况中超过理论值的50%的产率生成正丁醇的重组酵母微生物。如本文中所使用的,术语“产率”指摩尔产率。例如,当1摩尔葡萄糖被转化成1摩尔正丁醇时,产率等于100%。具体而言,术语“产率”定义为每摩尔碳源单体获得的产物摩尔数,而且可表述为百分比。除非另有说明,产率表述为理论产率的百分比。“理论产率”定义为根据用于生成产物的代谢途径的化学计量的规定,每摩尔指定底物能生成的产物最大摩尔数。例如,葡萄糖变成正丁醇的一种典型转化的理论产率为100%。因此,葡萄糖变成正丁醇的产率为95%会表述为理论产率的95%或95%理论产率。

    本文中所公开的微生物是使用遗传工程技术被工程化改造的,以提供利用异源表达的酶来以高产率生成正丁醇的微生物。丁醇产率取决于碳源变成乙酰-CoA的高产率转化和后续的乙酰-CoA变成丁醇的高产率转化。本发明涉及这两个方面的组合,导致以高产率生成正丁醇的微生物。

    如本文中所使用的,术语“微生物”包括原核的和真核的微生物物种,其来自细菌和真核生物范畴(Domains Bacteria and Eukaryote),后者包括酵母和丝状真菌、原生动物、藻类、或高等原生生物。术语“细胞”和“微生物细胞”可以与术语“微生物”互换使用。在一个优选的实施方案中,微生物是酵母(例如啤酒糖酵母/酿酒酵母(Saccharomyces cerevisiae)或乳酸克鲁维酵母(Kluyveromyce lactis))或大肠埃希氏菌/大肠杆菌(E.coli)。

    “酵母”指真核生物体的一个范畴,在系统发生学上位于真菌界中,在子囊菌和担子菌门(phyla Ascomycota and Basidiomycota)下。迄今描述了大约1500种酵母物种。酵母主要是单细胞微生物,主要通过无性芽殖来繁殖,尽管描述了一些多细胞酵母和通过二元裂殖来繁殖的酵母。大多数物种被归类为需氧菌,但是兼性的和厌氧的酵母也是众所周知的。与酵母发酵性生理学有关,酵母被归类为两组:Crabtree阳性的和Crabtree阴性的。

    简言之,Crabtree效应定义为在需氧条件下培养时由于高葡萄糖浓度(例如50克葡萄糖/L)的存在微生物的氧消耗受到抑制。如此,由于葡萄糖的存在,具有Crabtree阳性表型的酵母细胞继续发酵,不管氧的可得性,而具有Crabtree阴性表型的酵母细胞不展现葡萄糖介导的对氧消耗的抑制。通常具有Crabtree阳性表型的酵母细胞的例子包括但不限于酵母属(Saccharomyces)、接合酵母属(Zygosaccharomyces)、有孢圆酵母属(Torulaspora)和德克酵母属(Dekkera)的酵母细胞。通常具有Crabtree阴性表型的酵母细胞的例子包括但不限于克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichis)、汉逊酵母属(Hansenula)和假丝酵母属(Candida)的酵母细胞。

    在本申请中所使用的某些术语的定义之后,下文例示了本发明的某些详细方面和实施方案。术语“碳源”一般指适合用作酵母细胞生长的碳来源的底物或化合物。碳源可以是各种形式,包括,但不限于聚合物诸如木聚糖和果胶、碳水化合物、酸、醇、醛、酮、氨基酸、肽等。此类碳源更具体地包括,例如,各种单糖诸如葡萄糖和果糖、寡糖诸如乳糖或蔗糖、多糖、纤维素材料、饱和的或不饱和的脂肪酸、琥珀酸、乳酸、乙酸、乙醇,或其混合物和来自可再生原料的未纯化混合物,诸如干酪乳清渗透物(cheese whey permeate)、玉米浆(corn steep liquor)、甜菜糖蜜(sugar beet molasses)、和大麦芽。

    充当用于生成正丁醇产物的合适起始材料的碳源包括,但不限于,生物质水解产物、葡萄糖、淀粉、纤维素、半纤维素、木糖、木质素、右旋糖、果糖、半乳糖、玉米、液化玉米粉、玉米浆(玉米湿磨工艺的副产品,其含有浸泡期间自玉米浸出的营养物)、糖蜜、木质纤维素、和麦芽糖。光合生物体能另外生成碳源,作为光合作用的产物。在一个优选的实施方案中,碳源可选自生物质水解产物和葡萄糖。葡萄糖、右旋糖和淀粉可以来自内源的或外源的来源。

    应当注意,可以用其它更加易得的和/或便宜的碳源替代葡萄糖,这对宿主微生物的改动是较为微小的。例如,在某些实施方案中,使用其它可再生的和经济上可行的底物可能是优选的。这些包括:农业废物、基于淀粉的包装材料、玉米纤维水解产物、大豆糖蜜、水果加工业废物、和乳清渗透物等。

    五碳糖只被能够加工这些糖的微生物菌株用作碳源,例如大肠杆菌B。在一些实施方案中,可以使用甘油(glycerol)(一种三碳碳水化合物)作为生物转化的碳源。在其它实施方案中,可以使用甘油(glycerin)或通过水解来自植物和动物脂肪和油的甘油三酸酯得到的不纯的甘油作为碳源,只要任何杂质不会对宿主微生物产生不利影响。

    术语“酶”,如本文中所使用的,指任何催化或促进一种或多种化学或生物化学反应的物质,其通常包括完全或部分由多肽构成的酶,但是可以包括由不同分子(包括多核苷酸)构成的酶。

    术语“多核苷酸”在本文中可以与术语“核酸”互换使用,指由两个或更多个单体(包括核苷酸、核苷或其类似物)构成的有机聚合物,包括但不限于单链的或双链的、有义的或反义的任何长度脱氧核糖核酸(DNA)及适当时单链的或双链的、有义的或反义的任何长度核糖核酸(RNA),包括siRNA。术语“核苷酸”指数种由核糖或脱氧核糖与嘌呤或嘧啶碱基及与磷酸基团相连接而组成的化合物之任一,其是核酸的基本结构单元。术语“核苷”指由嘌呤或嘧啶碱基与脱氧核糖或核糖相组合而组成的化合物(像鸟苷或腺苷),其尤其见于核酸。术语“核苷酸类似物”或“核苷类似物”分别指其中一个或多个单独的原子被不同的原子或被不同的官能团替换的核苷酸或核苷。因而,术语多核苷酸包括任何长度的核酸、DNA、RNA、其类似物和片段。三个或更多个核苷酸的多核苷酸也称作核苷酸寡聚物或寡核苷酸。

    术语“蛋白质”或“多肽”,如本文中所使用的,指由两个或更多个氨基酸单体和/或其类似物构成的有机聚合物。如本文中所使用的,术语“氨基酸”或“氨基酸单体”指任何天然的和/或合成的氨基酸,包括甘氨酸和D或L两种光学异构体。术语“氨基酸类似物”指其中一个或多个单独的原子被不同的原子或不同的官能团替换的氨基酸。因而,术语多肽包括任何长度的氨基酸聚合物,包括全长蛋白质,和肽以及其类似物和片段。三个或更多个氨基酸的多肽也称作蛋白质寡聚物或寡肽。

    术语“异源”或“外源”,如本文中关于分子(特别是酶和多核苷酸)所使用的,指在它们起源的或在自然界中发现它们的生物体以外的生物体中表达的分子,无关乎表达水平,其可以低于、等于或高于该分子在天然微生物中的表达水平。

    另一方面,术语“天然”或“内源”,如本文中关于分子(特别是酶和多核苷酸)所使用的,指在它们起源的或在自然界中发现它们的生物体中表达的分子,无关乎表达水平,其可以低于、等于或高于该分子在天然微生物中的表达水平。

    在某些实施方案中,天然的、未工程化改造的微生物不能将碳源转化成正丁醇或一种或多种其代谢中间产物,因为,例如,此类野生型宿主缺乏正丁醇生成途径中所需要的一种或多种酶。

    在某些实施方案中,天然的、未工程化改造的微生物只能够以小于理论产率的0.1%的产率将微量的碳源转化成正丁醇。

    例如,微生物诸如大肠杆菌或酵母属菌种(Saccharomyces sp.)一般不具有将糖诸如葡萄糖转化成正丁醇的代谢途径,但是有可能将来自生成正丁醇的菌株(例如梭菌)的正丁醇生成途径转移入细菌的或真核的异源宿主中,诸如大肠杆菌或酵母属菌种,并使用所得重组微生物来生产正丁醇。

    微生物,一般而言,作为宿主是合适的,如果它们拥有内在特性,诸如溶剂抗性,这会容许它们在含有溶剂的环境中代谢碳源。

    术语“宿主”、“宿主细胞”和“重组宿主细胞”在本文中可以互换使用,不仅指特定的受试细胞而且指这样的细胞的后代或潜在后代。因为在后续世代中由于突变或环境影响可能发生某些修饰,所以这样的后代事实上与亲本细胞可能不是同样的,但是仍然包括在如本文中所使用的该术语的范围内。

    对于生产正丁醇有用的宿主可以是真核的或原核的微生物。酵母细胞是优选的宿主,诸如,但不限于酿酒酵母或乳酸克鲁维酵母。在某些实施方案中,其它合适的酵母宿主微生物包括,但不限于毕赤酵母属(Pichia)、西洋蓍霉属(Yarrowia)、曲霉属(Aspergillus)、克鲁维酵母属(Kluyveromyces)、管囊酵母属(Pachysolen)、红酵母属(Rhodotorula)、接合酵母属(Zygosaccharomyces)、半乳糖霉属(Galactomyces)、裂殖酵母属(Schizosaccharomyces)、青霉属(Penicillium)、有孢圆酵母属(Torulaspora)、德巴利酵母属(Debaryomyces)、拟威尔酵母属(Williopsis)、德克酵母属(Dekkera)、克勒克酵母属(Kloeckera)、梅奇酵母属(Metschnikowia)和假丝酵母属(Candida)物种。

    具体而言,本文中所公开的重组微生物被工程化改造以活化(特别是表达)能在正丁醇生产中使用的异源酶。具体而言,在某些实施方案中,该重组微生物被工程化改造以活化催化乙酰-CoA转化成正丁醇的异源酶。

    术语“活化”,如本文中关于生物学活性分子(诸如酶)所使用的,指微生物的基因组和/或蛋白质组中提高该微生物中的生物学活性分子的生物学活性的任何修饰。例示性的活化包括但不限于导致分子从生物学无活性形式变成生物学有活性形式及从生物学有活性形式变成生物学更有活性形式的转化的修饰,及导致生物学活性分子在微生物中表达的修饰,其中该生物学活性分子先前不表达。例如,生物学活性分子的活化可以如下来实施,即在微生物中表达编码生物学活性分子的天然的或异源的多核苷酸,在微生物中表达编码生物学活性分子的合成途径中所牵涉的酶的天然的或异源的多核苷酸,在微生物中表达增强生物学活性分子的表达的天然的或异源的分子。

    若基因或DNA序列作为其正常存在形式不是微生物的基因组的一部分,即它在天然情况中不是野生型微生物的基因组的一部分,则该基因或DNA序列对于该微生物而言是“异源的”。举例而言且不加限制,对于酿酒酵母,认为编码以下任一项的DNA是异源的。大肠杆菌蛋白质或酶、来自酿酒酵母以外的任何其它微生物的蛋白质或酶、非转录和翻译的控制序列、及突变的或其它方式修饰的酿酒酵母蛋白质或RNA,无论突变体是通过选择而产生的,或者是被工程化改造入酿酒酵母中的。另外,认为具有在异源调节元件(诱导型启动子、增强子等)的转录和/或翻译控制下的野生型酿酒酵母蛋白质的构建体也是异源DNA。

    当碳源的氧化反应期间所生成的NADH等于被利用来将乙酰-CoA转化成代谢终产物的NADH时,说碳源的代谢是“平衡的”。只有在这些条件下,所有NADH才是循环的。在没有循环的情况中,NADH/NAD+比变得失衡(即升高),这能将生物体引向最终死亡,除非有替代的代谢途径来维持平衡的NADH/NAD+比。

    在某些实施方案中,如果微生物不使用需氧或厌氧呼吸,那么正丁醇产率最高,因为在这些情况中碳以二氧化碳的形式流失(lost)。

    在某些实施方案中,微生物在厌氧条件下发酵性地生成正丁醇,使得碳不以二氧化碳的形式流失。

    术语“需氧呼吸”指其中氧是最终电子受体且能量通常以ATP分子的形式生成的呼吸途径。术语“需氧呼吸途径”在本文中与措词“需氧代谢”、“氧化性代谢”或“细胞呼吸”可互换使用。

    另一方面,术语“厌氧呼吸”指其中氧不是最终电子受体且能量通常以ATP分子的形式生成的呼吸途径。这包括其中氧以外的有机或无机分子(例如硝酸、延胡索酸、二甲亚砜、含硫化合物诸如硫酸和金属氧化物)是最终电子受体的呼吸途径。措词“厌氧呼吸途径”在本文中与措词“厌氧代谢”和“厌氧呼吸”可互换使用。

    “厌氧呼吸”必须与“发酵”区分开。在“发酵”中,NADH将其电子贡献给由生成NADH中携带的电子的同一代谢途径所生成的分子。例如,在大肠杆菌的发酵性途径之一中,通过糖酵解生成的NADH将其电子转移给丙酮酸,产生乳酸。

    在发酵性条件下运行的微生物只能在发酵是“平衡”的情况中代谢碳源。在碳源的氧化反应期间所生成的NADH等于乙酰-CoA转化成发酵终产物所利用的NADH时,说发酵是“平衡”的。只有在这些条件下,所有NADH才是再循环的。如果没有再循环,NADH/NAD+比会变得不平衡,这导致生物体最终死亡,除非有可用的备选代谢途径来维持平衡NADH/NAD+比。在氧化期间所生成的氢等于转移给发酵终产物的氢时,则说书面发酵(written fermentation)是“平衡”的。只有在这些条件下,所有NADH和还原型铁氧还蛋白才再循环成氧化形式。重要的是要知道,发酵是否是平衡的,因为如果不是这样,那么整体书面反应是不正确的。

    厌氧条件是高产率地生成正丁醇的微生物所优选的。

    图2图示了酵母中依照本发明的实施方案将碳源转化成正丁醇的途径。此途径可视为具有两个独特部分,其包括(1)碳源转化成乙酰-CoA,和(2)乙酰-CoA转化成正丁醇。由于酵母(和其它真核生物)中代谢反应的区室化和为了确保自葡萄糖生成足量的乙酰-CoA以驱动该途径的第二部分,胞质溶胶中乙酰-CoA的生成是必要的,而且因此在本文中所公开的某些工程化变体中是升高的。

    关于部分(1)即碳源转化成丁醇,可以工程化改造酵母微生物以提高胞质溶胶中丙酮酸变成乙酰-CoA的通量。

    如图3中所示,酿酒酵母在线粒体中和在胞质溶胶中生成乙酰-CoA。因为乙酰-CoA变成正丁醇的转化发生在胞质溶胶中,所以在工程化细胞中胞质溶胶中的乙酰-CoA生成升高了。任选的是,可降低或遏制线粒体中的乙酰-CoA生成。

    在一个实施方案中,通过提高穿过胞质“丙酮酸脱氢酶旁路”(Prank等,(1996).Yeast 12(16):1607)的通量,可以自丙酮酸生成乙酰-CoA,如图3步骤1-3所图示的。为了提高穿过此路径的通量,可以过表达丙酮酸脱羧酶(PDC)、醛脱氢酶(ALD)、和乙酰-CoA合酶(ACS)中的一种或多种酶。

    此提高“PDH旁路”路径的活性或通量的操作能导致超过理论最大值的5%的丁醇产率的实现。

    因为此乙酰-CoA生成路径生成乙醛作为中间产物,所以优选将乙醛进入远离乙酰-CoA合成的途径的分流降至最低,主要是通过醇脱氢酶(ADH)的活性将乙醛进一步还原成乙醇。因此,降低或消除ADH活性可进一步提高丙酮酸脱氢酶旁路途径的乙酰-CoA生成。

    例如,Crabtree阳性酵母酿酒酵母的基因组含有7种已知的ADH基因。其中,ADH1是胞质ADH活性的主要来源,而且删除了ADH1的细胞不能够厌氧生长(Drewke等,(1990).J.Bacteriology 172(7):3909)。如此,可能优选删除ADH1以将乙醛变成乙醇的转化降至最低。然而,其它ADH同等型可催化乙醛变成乙醇的还原,而且本发明也涵盖它们的降低或删除。

    此降低乙醛变成乙醇的转化的操作单独地或与上文所述“PDH旁路”通量升高组合地能导致超过理论最大值的10%的丁醇产率的实现。

    另外,丙酮酸脱氢酶催化丙酮酸变成乙酰-CoA和CO2的直接转化,同时将NAD+还原成NADH。如此在某些实施方案中,在酵母胞质溶胶中过表达丙酮酸脱氢酶。或者,将丙酮酸转化成甲酸和乙酰-CoA,并且通过甲酸脱氢酶(其也将NAD+还原成NADH)的活性将所得甲酸进一步代谢成CO2。

    因为上述乙酰-CoA生成路径利用丙酮酸作为底物,所以优选将丙酮酸进入其它代谢途径的分流降至最低。丙酮酸脱羧酶(PDC)活性代表了丙酮酸代谢的主要细胞质路径。因此,降低或消除PDC活性可进一步提高上述路径的乙酰-CoA生成。

    与消除PDC活性(如此消除“PDH旁路”路径)组合地,对将丙酮酸转化成乙酰-CoA的代谢途径的操作可实现超过理论最大值的50%的丁醇产率。此改善是对酵母细胞天然代谢途径的三项重要操作的结果:(1)消除经由乙醇生成的碳流失;(2)消除细胞中在消耗大量能量的乙酰-CoA合成酶活性;和(3)平衡葡萄糖变成丁醇的转化中所牵涉的整个途径的辅因子(例如NAD+/NADH)的生成和消耗(葡萄糖变成乙酰-CoA生成4个NADH,而乙酰-CoA变成丁醇的转化消耗4个NADH)。通过提高宿主酵母细胞的整体代谢适合度,由此通过使得有ATP可被生物合成过程利用和降低细胞中的NAD+/NADH比失衡来促进丁醇途径功能,后两种操作会对产率升高贡献最大。

    关于部分(2),即碳源变成丁醇的转化,可工程化改造酵母以将乙酰-CoA转化成丁醇。

    在一个所例示的实施方案中,乙酰-CoA-乙酰转移酶将乙酰-CoA转化成乙酰乙酰-CoA,羟丁酰-CoA脱氢酶将乙酰乙酰-CoA转化成羟丁酰-CoA,巴豆酸酶将羟丁酰-CoA转化成巴豆酰-CoA,丁酰-CoA脱氢酶(bcd)将巴豆酰-CoA转化成丁酰-CoA。为了偶联巴豆酰-CoA的还原与NADH的氧化,Bcd需要电子转移蛋白(etfA和etfB)的存在和活性。然后丁醛脱氢酶/丁醇脱氢酶将丁酰-CoA转化成丁醛并将丁醛转化成丁醇。该酶可来自丙酮丁醇梭菌。

    2007年12月3日提交的美国专利申请流水号11/949,724(在此通过述及收入本文)中记载了使用异源表达的途径及来自产溶剂细菌(例如梭菌属物种)的基因将乙酰-CoA转化成正丁醇的途径的第二部分的例子。

    在一些实施方案中,重组微生物可表达一种或多种异源基因,其编码赋予生成正丁醇的能力的酶。例如,重组微生物可表达编码厌氧活性丙酮酸脱氢酶(Pdh)、丙酮酸甲酸裂合酶(Pfl)、NADH依赖性甲酸脱氢酶(Fdh)、乙酰-CoA-乙酰转移酶(硫解酶)、羟丁酰-CoA脱氢酶、巴豆酸酶、丁酰-CoA脱氢酶、丁醛脱氢酶、正丁醇脱氢酶、双功能丁醛/正丁醇脱氢酶中的一种或多种的异源基因。此类异源DNA序列优选是自异源微生物(诸如丙酮丁醇梭菌或拜氏梭菌)获得的,而且可以使用常规分子生物学技术将这些异源基因中的一种或多种导入适宜宿主。这些异源DNA序列使得重组微生物能够生成正丁醇,至少以比野生型对应微生物所生成的量大的量生成正丁醇或其代谢中间产物。

    在某些实施方案中,本文中所公开的重组微生物表达异源硫解酶或乙酰-CoA-乙酰转移酶,诸如由来自梭菌属的thl基因所编码的。

    硫解酶(E.C.2.3.1.19)或乙酰-CoA乙酰转移酶是催化乙酰基缩合到乙酰-CoA分子上的酶。该酶在丙酮丁醇梭菌中由基因thl编码(GenBank登录号U08465,蛋白质ID AAA82724.1),在其它酶中,该酶在大肠杆菌中在其用于丙酮生成的天然启动子下过表达(Bermejo等,Appl.Environ.Mirobiol.64:1079-1085,1998)。同源酶也已经鉴定,而且通过实施针对上文蛋白质序列的BLAST搜索能容易地鉴定。这些同系物(homolog)也能充当异源表达的正丁醇途径中的合适硫解酶。仅举几例,这些同源酶包括,但不限于那些来自以下各项的:丙酮丁醇梭菌(例如,蛋白质ID AAC26026.1),巴氏梭菌(C.pasteurianum)(例如,蛋白质ID ABA18857.1),拜氏梭菌(例如,蛋白质IDEAP59904.1或EAP59331.1),产气荚膜梭菌(Clostridium perfringens)(例如,蛋白质ID ABG86544.1,ABG83108.1),艰难梭菌(Clostridium difficile)(例如,蛋白质ID CAJ67900.1或ZP_01231975.1),热解糖热厌氧杆菌(Thermoanaerobacterium thermosaccharolyticum)(例如,蛋白质IDCAB07500.1),腾冲热厌氧杆菌(Thermoanaerobacter tengcongensis)(例如,AAM23825.1),生氢氧化碳嗜热菌(Carboxydothermus hydrogenoformans)(例如,蛋白质ID ABB 13995.1),Desulfotomaculum reducens MI-1(例如,蛋白质ID EAR45123.1),热带假丝酵母(Candida tropicalis)(例如,蛋白质IDBAA02716.1或BAA02715.1),酿酒酵母(例如,蛋白质ID AAA62378.1或CAA30788.1),芽孢杆菌属菌种,埃氏巨球形菌(Megasphaera elsdenii),和溶纤维丁酸弧菌(Butyrivibrio fibrisolvens)。另外,内源酿酒酵母硫解酶在异源表达的正丁醇途径(ScERGIO)中也可以是有活性的。

    根据NCBI的BLAST的计算,共享至少约55%、60%、65%、70%、75%或80%序列同一性,或至少约65%、70%、80%或90%序列同源性的同系物是能在本发明的重组微生物中使用的合适硫解酶同系物。此类同系物包括(但不限于):拜氏梭菌NCIMB 8052(ZP_00909576.1或ZP_00909989.1),丙酮丁醇梭菌ATCC 824(NP_149242.1),破伤风梭菌(Clostridium tetani)E88(NP_781017.1),产气荚膜梭菌菌株13(NP_563111.1),产气荚膜梭菌SM101(YP_699470.1),巴氏梭菌(ABA18857.1),热解糖热厌氧杆菌(CAB04793.1),艰难梭菌QCD-32g58(ZP_01231975.1),和艰难梭菌630(CAJ67900.1)。

    在某些实施方案中,本发明的重组微生物表达异源3-羟基丁酰-CoA脱氢酶,诸如由来自梭菌属的hbd基因所编码的。

    3-羟丁酰-CoA脱氢酶(BHBD)是催化乙酰乙酰-CoA转化成3-羟基丁酰-CoA的酶。此酶存在生成3-羟基丁酰-CoA的(S)或(R)异构体的不同变体。本领域技术人员通过例如实施针对上文丙酮丁醇梭菌BHBD的BLAST搜索能容易地鉴定同源酶。所有这些同源酶能充当异源表达的正丁醇途径中的BHBD。这些同源酶包括,但不限于以下各项:克氏梭菌(Clostridium kluyveri),其表达此酶的两种不同形式(Miller等,J.Bacteriol.138:99-104,1979);和解纤维丁酸弧菌(Butyrivibrio fibrisolvens),其含有bhbd基因,其组织在其丁酸途径剩余部分的相同基因座内(Asanuma等,Current Microbiology 51:91-94,2005;Asanuma等,Current Microbiology 47:203-207,2003)。编码短链酰基-CoA脱氢酶(SCAD)的基因克隆自埃氏巨球形菌并在大肠杆菌中表达。能测定体外活性(Becker等,Biochemistry 32:10736-10742,1993)。在其它梭菌属菌株中鉴定了其它同系物,诸如克氏梭菌(Hillmer等,FEBS Lett.21:351-354,1972;Madan等,Eur.J.Biochem.32:51-56,1973)、拜氏梭菌、热解糖梭菌(C.thermosaccharolyticum)、破伤风梭菌。

    在某些实施方案中,其中表达BHBD,选择与上游硫解酶或下游巴豆酸酶起源相同的生物体的酶可能是有益的。这可避免在表达来自不同生物体的酶时对该途径中邻近蛋白质之间的潜在蛋白质-蛋白质相互作用的破坏。

    在某些实施方案中,本文中所公开的重组微生物表达异源巴豆酸酶,诸如由来自梭菌属的crt基因所编码的。

    巴豆酸酶或烯酰-CoA水合酶是催化顺式和反式烯酰-CoA底物可逆水合成相应的β-羟酰CoA衍生物的酶。在丙酮丁醇梭菌中,丁酸代谢的这个步骤由crt基因所编码的EC 4.2.1.55来催化(GenBank蛋白质编号AAA95967,Kanehisa,Kanehisa,Novartis Found Symp.247:91-101,2002;讨论01-3,19-28,244-52)。来自丙酮丁醇梭菌的巴豆酸酶(Crt)已经纯化至均质并得到了表征(Waterson等,J.Biol.Chem.247:5266-5271,1972)。它在天然的和变性的状态都表现为均质的蛋白质。该酶表现出作为四聚体发挥功能,亚基分子量为28.2kDa和261个残基(Waterson等报道了分子量为40kDa和长度为370个残基)。纯化的酶在缓冲溶液中在4℃保存时或在冷冻时丧失活性(Waterson等,J.Biol.Chem.247:5266-5271,1972)。该酶的最适pH为pH 8.4(Schomburg等,NucleicAcids Res.32:D431-433,2004)。与具有广泛底物特异性的哺乳动物巴豆酸酶不同,细菌的酶只水合巴豆酰-CoA和己烯酰-CoA。为巴豆酰-CoA得到了Vmax和Km值为6.5x106摩尔每分每摩尔和3x 10-5M。该酶在巴豆酰-CoA浓度高于7x105M时受到抑制(Waterson等,J.Biol.Chem.247:5252-5257,1972;Waterson等,J.Biol.Chem.247:5258-5265,1972)。

    已经解析出了巴豆酸酶家族的许多酶的结构(Engel等,J.Mol.Biol.275:847-859,1998)。crt基因在大肠杆菌中高表达,而且展现出比在丙酮丁醇梭菌中所看到的更高的比活(187.5U/mg胜过128.6U/mg)(Boynton等,J.Bacteriol.178:3015-3024,1996)。真核生物和原核生物中编码了巴豆酸酶的许多不同同系物,它们作为丁酸代谢、脂肪酸合成、β-氧化和其它相关途径的一部分发挥作用(Kanehisa,Novartis Found Symp.247:91-101,2002;讨论01-3,19-28,244-52;Schomburg等,Nucleic Acids Res.32:D431-433,2003)。这些酶中许多已经被深入研究。来自牛肝的烯酰-CoA水合酶得到了极度深入的研究和彻底的表征(Waterson等,J.Biol.Chem.247:5252-5257,1972)。生成了来自细菌的巴豆酸酶的20种最亲近直向同系物的ClustalW比对。同系物的序列同一性的从40%到85%不等。

    根据NCBI的BLAST的计算,共享至少约45%、50%、55%、60%、65%或70%序列同一性,或至少约55%、65%、75%或85%序列同源性的同系物是能在本发明的重组微生物中使用的合适Crt同系物。此类同系物包括,但不限于:破伤风梭菌E88(NP_782956.1),产气荚膜梭菌SM101(YP_699562.1),产气荚膜梭菌菌株13(NP_563217.1),拜氏梭菌NCIMB 8052(ZP_00909698.1或ZP_00910124.1),沃氏共养单胞菌沃氏亚种哥廷根菌株(Syntrophomonas wolfeisubsp.wolfei str.Goettingen)(YP_754604.1),Desulfotomaculum reducens MI-1(ZP_01147473.1或ZP_01149651.1),热解糖热厌氧杆菌(CAB07495.1),和生氢氧化碳嗜热菌Z-2901(YP_360429.1)。

    在梭菌中进行的研究证明了编码巴豆酸酶的crt基因是作为更大的BCS操纵子的一部分编码的。然而,对溶纤维丁酸弧菌(B.fibriosolvens)(一种来自瘤胃的生成丁酸的细菌)的研究显示了略有不同的排列。虽然I型溶纤维丁酸弧菌具有作为操纵子的部分而簇集和排列的thl、crt、hbd、bcd、etfA和etfB基因,但是II型菌株具有类似的簇但缺少crt基因(Asanuma等,Curr.Microbiol.51:91-94,2005;Asanuma等,Curr.Microbiol.47:203-207,2003)。既然该蛋白质在大肠杆菌中充分表达且彻底表征,那么丙酮丁醇梭菌酶是异源表达的正丁醇途径所优选的酶。其它可能的靶物是来自聚核梭杆菌文氏亚种(Fusobacterium nucleatum subsp.Vincentii)(Q7P3U9-Q7P3U9_FUSNV)、艰难梭菌(P45361-CRT CLODI)、巴氏梭菌(P81357-CRT_CLOPA)、和马尔他布鲁氏菌(Brucella melitensis)(Q8YDG2-Q8YDG2_BRUME)的同源基因。

    在某些实施方案中,本文中所公开的重组微生物表达异源丁酰-CoA脱氢酶和必要时相应的电子传递蛋白,诸如由来自梭菌属的bcd、etfA、和etfB基因所编码的。

    丙酮丁醇梭菌丁酰-CoA脱氢酶(Bcd)是催化巴豆酰-CoA中的碳-碳双键还原以产生丁酰-CoA的酶。此还原偶联NADH的氧化。然而,该酶需要两种电子传递蛋白,即etf和etfB(Bennett等,Ferns Microbiology Reviews 17:241-249,1995)。

    丙酮丁醇梭菌ATCC 824的编码酶β-羟基丁酰-辅酶A(CoA)脱氢酶、巴豆酸酶和丁酰-CoA脱氢酶的基因在BCS操纵子上簇集,其GenBank登录号为U17110。

    丁酰-CoA脱氢酶(Bcd)蛋白质序列(GenBank登录号AAA95968.1)显示于SEQ ID NO:3。

    根据NCBI的BLAST的计算,共享至少约55%、60%、65%、70%、75%或80%序列同一性,或至少约70%、80%、85%或90%序列同源性的同系物是能在本发明的重组微生物中使用的合适Bcd同系物。此类同系物包括,但不限于:破伤风梭菌E88(NP_782955.1或NP_781376.1),产气荚膜梭菌菌株13(NP_563216.1),拜氏梭菌(AF494018_2),拜氏梭菌NCIMB 8052(ZP_00910125.1或ZP_00909697.1),和热解糖热厌氧杆菌(CAB07496.1),腾冲热厌氧杆菌MB4(NP_622217.1)。

    根据NCBI的BLAST的计算,共享至少约45%、50%、55%、60%、65%或70%序列同一性,或至少约60%、70%、80%或90%序列同源性的同系物是能在本文中所描述的重组微生物中使用的合适Hbd同系物。此类同系物包括,但不限于:丙酮丁醇梭菌ATCC 824(NP_349314.1),破伤风梭菌E88(NP_782952.1),产气荚膜梭菌SM101(YP_699558.1),产气荚膜梭菌菌株13(NP_563213.1),糖丁酸梭菌(Clostridium saccharobutylicum)(AAA23208.1),拜氏梭菌NCIMB 8052(ZP_00910128.1),拜氏梭菌(AF494018_5),腾冲热厌氧杆菌MB4(NP_622220.1),热解糖热厌氧杆菌(CAB04792.1),和Alkaliphilusmetalliredigenes QYMF(ZP_00802337.1)。

    Bcd对丁酰-CoA的Km为5。丙酮丁醇梭菌bcd和编码相应ETF的基因已经克隆入大肠杆菌-丙酮丁醇梭菌穿梭载体中。在用此质粒转化的丙酮丁醇梭菌ATCC 824中检测到升高的Bcd活性(Boynton等,Journal of Bacteriology178:3015-3024,1996)。丙酮丁醇梭菌P26 2Bcd对丁酰-CoA的Km为大约6μM(DiezGonzalez等,Current Microbiology 34:162-166,1997)。Bcd的同系物(homologues)和相关ETF已经在生成丁酸的厌氧生物埃氏巨球形菌(Williamson等,Biochemical Journal 218:521-529,1984)、埃氏消化链球菌(Peptostreptococcus elsdenii)(Engel等,Biochemical Journal 125:879,1971)、布氏共养生孢菌(Syntrophospora bryanti)(Dong等,Antonie Van LeeuwenhoekInternational Journal of General and Molecular Microbiology 67:345-350,1995)、和溃蚀密螺旋体(Treponema phagedemes)(George等,Journal ofBacteriology 152:1049-1059,1982)中鉴定。埃氏巨球形菌Bcd的结构已经解析(Djordjevic等,Biochemistry 34:2163-2171,1995)。丙酮丁醇梭菌ATCC 824 Bcd的BLAST搜索在极其多个物种中鉴定了大量同源序列,本文中上文列举了同系物中的一些。任何编码这些同系物的基因都可用于本发明。注意到,在一种微生物(诸如大肠杆菌)中异源表达这些基因时可产生表达问题和/或电子传递问题,但是在另一种微生物中则不然。另外,一种同源酶可在给定微生物中具有表达和/或电子传递问题,但是其它同源酶则可不然。不同的、大体等同的基因的可得性在工程化改造重组微生物时提供了更多设计选择。

    一种早已在大肠杆菌中克隆和表达的有前途的bcd来自埃氏巨球形菌,而且所表达的酶的体外活性能测定(Becker等,Biochemistry 32:10736-10742,1993)。O′Neill等报道了etfA和eftB基因在大肠杆菌中的克隆和异源表达及对所编码的来自埃氏巨球形菌的蛋白质的功能表征(O′Neill等,J.Biol.Chem.273:21015-21024,1998)。用ETF测定法测量了活性,该测定法将NADH氧化与巴豆酰-CoA的还原经Bcd偶联起来。含Bcd的重组ETF在ETF测定法中的活性与如Whitfield和Mayhew所报道的天然酶活性类似。因此,利用埃氏巨球形菌Bcd及其ETF蛋白提供了合成丁酰-CoA的解决方案。埃氏巨球形菌Bcd在重组表达时的Km测量为5μM,而在天然宿主中表达时为14μM(DuPlessis等,Biochemistry 37:10469-77,1998)。埃氏巨球形菌Bcd表现出在极低浓度受到乙酰乙酸抑制(Ki为0.1uM)(Vanberkel等,Eur.J.Biochem.178:197-207,1988)。在两个生成丁酸的解纤维丁酸弧菌的菌株中鉴定了含有thl、crt、hbd、bcd、etfA、和etfB的基因簇。与丙酮丁醇梭菌相比,这些蛋白质的氨基酸序列相似性是高的(Asanuma等,Current Microbiology 51:91-94,2005;Asanuma等,CurrentMicrobiology 47:203-207,2003)。在哺乳动物系统中,在线粒体中找到了牵涉短链脂肪酸氧化的类似的酶。

    在某些实施方案中,本文中所公开的重组微生物表达异源“反式-2-烯酰-CoA还原酶”或“TER”。

    反式-2-烯酰-CoA还原酶或TER是能够催化巴豆酰-CoA转化成丁酰-CoA的蛋白质。在某些实施方案中,重组微生物表达与来自梭菌属和其它细菌物种的Bcd/EtfA/EtfB催化相同反应的TER。来自纤细眼虫(E.gracilis)的线粒体TER已有描述,而且衍生自许多物种的许多TER蛋白和具有TER活性的蛋白质已经鉴定,形成TER蛋白质家族(美国专利申请2007/0022497,Cirpus等;Hoffmeister等,J.Biol.Chem.,280:4329-4338,2005,在此通过提述将它们完整并入本文)。纤细眼虫基因的截短cDNA已经在大肠杆菌中功能性表达。此cDNA或来自其它微生物的同系物的基因能与正丁醇途径基因thl、crt、adhE2、和hbd一起表达,用以在大肠杆菌、酿酒酵母或其它宿主中生成正丁醇。

    TER蛋白还可通过普遍公知的生物信息学方法来鉴定,诸如BLAST。TER蛋白的例子包括,但不限于,来自诸如以下物种的TER:眼虫属(Euglena spp.),包括但不限于纤细眼虫;气单胞菌属(Aeromonas spp.),包括但不限于嗜水气单胞菌(A.hydrophila);冷单胞菌属(Psychromonas spp.),包括但不限于深海冷单胞菌(P.ingrahamii);发光杆菌属(Photobacterium spp.),包括但不限于深海发光杆菌(P.profundum);弧菌属(Vibrio spp.),包括但不限于Vangustum、霍乱弧菌(V.cholerae)、解藻朊酸弧菌(V.alginolyticus)、副溶血弧菌(V.parahaemolyticus)、创伤弧菌(V.vulnificus)、费氏弧菌(V.fischeri)、灿烂弧菌(V.splendidus);希瓦氏菌属(Shewanella spp.),包括但不限于S.amazonensis,S.woodyi,S.frigidimarina,S.paeleana,S.baltica,反硝化希瓦氏菌(S.denitrificans);海洋螺菌属(Oceanospirillum spp.);黄单胞菌属(Xanthomonasspp.),包括但不限于稻黄单胞菌(X.oryzae)、田野黄单胞菌(X.campestris);色盐杆菌属(Chromohalobacter spp.),包括但不限于需盐色盐杆菌(C.salexigens);Idiomarina spp.,包括但不限于I.baltica;交替假单胞菌属(Pseudoalteromonasspp.),包括但不限于大西洋交替假单胞菌(Patlantica);交替单胞菌属(Alteromonas spp.);Saccharophagus spp.,包括但不限于S.degradans,S.marinegamma proteobacterium,S.alpha proteobacterium,假单胞菌属(Pseudomonasspp.),包括但不限于铜绿假单胞菌(P.aeruginosa)、恶臭假单胞菌(P.putida)、荧光假单胞菌(P.fluorescens);伯克霍尔德菌属(Burkholderia spp.),包括但不限于B.phytofirmans,新洋葱伯克霍尔德氏菌(B.cenocepacia),洋葱伯克霍尔德氏菌(B.cepacia),B.ambifaria,越南伯克霍尔德氏菌(B.vietnamensis),B.multivorans,B.dolosa;甲基杆菌属(Methylbacillus spp.),包括但不限于M.flageliatus;寡养单胞菌属(Stenotrophomonas spp.),包括但不限于嗜麦芽糖寡养单胞菌(S.maltophilia);聚集杆菌属(Congregibacter spp.),包括但不限于C.litoralis;沙雷氏菌属(Serratia spp.),包括但不限于变形斑沙雷氏菌(S.proteamaadans);海洋单胞菌(Marinomonas spp.);Xytella spp.,包括但不限于X.fastidiosa;Reinekea spp.;科尔韦尔氏菌属(Colwellia spp.),包括但不限于C.psychrerythraea;耶尔森氏菌属(Yersinia spp.),包括但不限于鼠疫耶尔森氏菌(Y.pestis)、假结核耶尔森氏菌(Y.pseudotuberculosis);甲基菌属(Methylobacillus spp.),包括但不限于M.flageliatus;噬纤维菌菌属(Cytophagaspp.),包括但不限于哈氏噬纤维菌(C.hutchinsonii);黄杆菌属(Flavobacteriumspp.),包括但不限于F.johnsoniae;微颤菌属(Microscilla spp.),包括但不限于M.marina;极地杆菌属(Polaribacter spp.),包括但不限于P.irgensii;梭菌属,包括但不限于丙酮丁醇梭菌、拜氏梭菌、解纤维梭菌;柯克斯体属(Coxiellaspp.),包括但不限于贝氏柯克斯体(C.burnetii)。

    在前述之外,术语“反式-2-烯酰-CoA还原酶”或“TER”指能够催化巴豆酰-CoA转化成丁酰-CoA且根据使用缺省参数的NCBI BLAST的计算,与截短的纤细眼虫TER或全长的嗜水气单胞菌TER之任一或二者共享至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更大序列同一性,或至少约50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或更大序列相似性的蛋白质。

    如本文中所使用的,“序列同一性”指所比对的序列中同一位置中完全相同核苷酸或氨基酸的存在。“序列相似性”考虑到了大致匹配,而且只在依照“差异”或“相同性”的一些量度对此类替代打分时有意义,在所述度量中保守的或高度可能的替代被赋以比非保守的或不大可能的替代更有利的得分。

    使用TER代替Bcd/EtfA/EtfB的另一个优点是TER在单体形式是有活性的,而且蛋白质表达和酶自身都对氧不敏感。

    如本文中所使用的,“反式-2-烯酰-CoA还原酶(TER)同系物”指来自其它生物体(例如,属于眼虫或气单胞菌类(phylum))的酶同源多肽,其具有与上文所定义的相同的TER本质特征,但是共享小于40%的序列同一性和50%的序列相似性标准,如上文所讨论的。突变涵盖一个或多个氨基酸残基的替代、添加、删除、倒位或插入。这容许需氧生长和正丁醇过程的表达阶段期间的酶表达,能潜在容许更加高效的生物燃料生成过程。

    在某些实施方案中,本文中所公开的重组微生物表达异源丁醛脱氢酶/正丁醇脱氢酶,诸如由来自梭菌属的bdhA/bdhB、aad、或adhE2基因所编码的。

    丁醛脱氢酶(BYDH)是催化丁酰-CoA NADH依赖性还原成丁醛的酶。丁醛进一步被正丁醇脱氢酶(BDH)还原成正丁醇。此还原也伴有NADH氧化。丙酮丁醇梭菌含有已经显示出将丁酰-CoA转化成正丁醇的数种酶的基因。

    这些酶之一由aad编码(Nair等,J.Bacteriol.176:871-885,1994)。此基因在丙酮丁醇梭菌菌株DSM 792中称作adhE。该酶是sol操纵子的一部分,而且它编码双功能BYDH/BDH(Fischer等,Journal of Bacteriology 175:6959-6969,1993;Nair等,J.Bacteriol.176:871-885,1994)。

    aad的基因产物在大肠杆菌中功能性表达。然而,在需氧条件下,所得活性保持很低,指示氧敏感性。根据对丁醛的活性相对于对乙醛的活性为超过100倍高,Aad的主要作用在正丁醇的形成中而非乙醇(Hair等,Journal ofBacteriology 176:5843-5846,1994)。

    根据NCBI的BLAST的计算,共享至少约50%、55%、60%或65%序列同一性,或至少约70%、75%或80%序列同源性的同系物是能在本文中所公开的重组微生物中使用的合适同系物。此类同系物包括(但不限于):破伤风梭菌E88(NP_781989.1),产气荚膜梭菌菌株13(NP_563447.1),产气荚膜梭菌ATCC13124(YP_697219.1),产气荚膜梭菌SM101(YP_699787.1),拜氏梭菌NCIMB8052(ZP_00910108.1),丙酮丁醇梭菌ATCC 824(NP_149199.1),艰难梭菌630(CAJ69859.1),艰难梭菌QCD-32g58(ZP_01229976.1),和热纤维梭菌(Clostridium thermocellum)ATCC 27405(ZP_00504828.1)。

    另外两种NADH依赖性正丁醇脱氢酶(BDH I,BDH II)已经纯化,而且它们的基因(bdhA,bdhB)已经克隆。BDH I的GenBank登录号是AAA23206.1,而蛋白质序列显示于SEQ ID NO:10。

    BDH II的GenBank登录号是AAA23207.1,而蛋白质序列显示于SEQ IDNO:11。

    这些基因在染色体上是相邻的,但是由它们自己的启动子转录(Walter等,Gene 134:107-111,1993)。BDH I利用NADPH作为辅因子,而BDH II利用NADH。然而,注意到相对辅因子偏爱是pH依赖性的。在自质粒表达bdhA后在大肠杆菌裂解物中观察到BDH I活性(Petersen等,Journal of Bacteriology173:1831-1834,1991)。BDH II据报道具有的对丁醛的活性是对乙醛的活性的46倍高,而且在逆方向的活性低50倍。BDH I对丁醛的活性只为对乙醛的活性约2倍高(Welch等,Archives of Biochemistry and Biophysics 273:309-318,1989)。如此,在一个实施方案中,在异源表达的正丁醇途径中使用BDH II或BDH II同系物。另外,这些酶在5.5的相对较低pH最有活性,在选择合适的宿主和/或工艺条件时可考虑此性状。

    虽然上文所述基因在产溶剂的条件下转录,一种不同的基因,adhE2在产醇的条件下转录(Fontaine等,J.Bacteriol.184:821-830,2002,GenBank登录号AF321779)。这些条件在相对中性的pH存在。该酶已经在大肠杆菌的厌氧培养中过表达,且具有高NADH依赖性BYDH和BDH活性。在某些实施方案中,此酶是优选的酶。此酶的蛋白质序列(GenBank登录号AAK09379.1)显示于SEQID NO:1。

    根据NCBI的BLAST的计算,共享至少约50%、55%、60%或65%序列同一性,或至少约70%、75%或80%序列同源性的同系物是能在本文中所公开的重组微生物中使用的合适同系物。此类同系物包括,但不限于:产气荚膜梭菌SM101(YP_699787.1),产气荚膜梭菌菌株13(NP_563447.1),产气荚膜梭菌ATCC 13124(YP_697219.1),破伤风梭菌E88(NP_781989.1),拜氏梭菌NCIMB8052(ZP_00910108.1),艰难梭菌QCD-32g58(ZP_01229976.1),艰难梭菌630(CAJ69859.1),丙酮丁醇梭菌ATCC 824(NP_149325.1),和热纤维梭菌ATCC27405(ZP_00504828.1)。

    在某些实施方案中,可以使用与任何上述多肽至少约70%、80%、90%、95%、99%同一的,或共享至少约60%、70%、80%、90%、95%序列同源性(相似的)的任何同源酶代替这些野生型多肽。这些共享必需序列同一性或相似性的酶可以是来自不同生物体的野生型酶,或者可以是人工的重组的酶。

    在某些实施方案中,可以使用编码具有与任何上述酶相同活性的酶的任何基因代替编码上述酶的基因。这些酶可以是来自不同生物体的野生型酶,或者可以是人工的、重组的、或工程化改造的酶。

    另外,由于遗传密码的内在简并性,也可以使用编码基本上相同的或功能上等同的氨基酸序列的其它核酸序列来克隆和表达编码此类酶的多核苷酸。本领域技术人员会理解,修饰编码序列以增强其在特定宿主中的表达会是有利的。在一种物种中最常被利用的密码子称作最佳密码子(optimalcodon),而不太经常利用的密码子归为罕见或低使用率密码子。可以替代密码子以反映宿主优选的密码子选择,即有时称作“密码子优化”或“控制物种密码子偏好”的过程。提供了为植物中的表达而优化核苷酸序列的方法学,例如,在美国专利No.6,015,891及其中引用的参考文献中。

    在某些实施方案中,本文中所公开的重组微生物具有一种或多种来自产溶剂的梭菌属,诸如丙酮丁醇梭菌或拜氏梭菌的异源DNA序列。例示性的丙酮丁醇梭菌是菌株ATCC824,而例示性的拜氏梭菌是菌株NCIMB 8052。

    基因的表达可以通过常规分子生物学手段来实现。例如,异源基因可以在诱导型启动子或组成性启动子的控制下。异源基因可以整合入宿主微生物的染色体中,或者作为能稳定传递(“遗传”)给子细胞的染色体外遗传元件存在。此类染色体外遗传元件(诸如质粒、BAC、YAC等)可以另外含有确保此类遗传元件在子细胞中的存在的选择标志。

    在某些实施方案中,本文中所公开的重组微生物还可生成正丁醇生成途径的一种或多种代谢中间产物,诸如乙酰乙酰-CoA、羟基丁酰-CoA、巴豆酰-CoA、丁酰-CoA、或丁醛,和/或其衍生物,诸如丁酸。

    在一些实施方案中,本文中所描述的为生成正丁醇而被工程化改造以活化一种或多种上文所述异源酶的重组微生物经异源途径生成正丁醇。

    如本文中所使用的,术语“途径”指包括一种或多种受酶控制的、将底物转化成产物的化学反应的生物学过程。因而,用于将碳源转化成正丁醇的途径是包括一种或多种受酶控制的、将碳源转化成正丁醇的反应的生物学过程。“异源途径”指其中至少一种或多种化学反应之至少一种由至少一种异源酶催化的途径。另一方面,“天然途径”指其中的一种或多种化学反应由天然酶催化的途径。

    在某些实施方案中,本文中所公开的重组微生物被工程化改造以活化生成正丁醇的异源途径(在本文中也称作正丁醇途径),其包含:(1)2个乙酰-CoA转化成乙酰乙酰-CoA,(2)乙酰乙酰-CoA转化成羟基丁酰-CoA,(3)羟基丁酰-CoA转化成巴豆酰-CoA,(4)巴豆酰-CoA转化成丁酰-CoA,(5)丁醛转化成正丁醇(见图2例示性图解)。

    2个乙酰-CoA转化成乙酰乙酰-CoA可通过在重组微生物中表达编码乙酰-CoA-乙酰转移酶(硫解酶)或Thl的天然或异源基因来实施。在本文中所公开的重组微生物中合适的例示性硫解酶由如下基因编码:来自丙酮丁醇梭菌(具体而言来自菌株ATCC 824)的thl,或来自巴氏梭菌、拜氏梭菌(具体而言来自菌株NCIMB 8052或菌株BA101)、热带假丝酵母、芽孢杆菌属、埃氏巨球形菌、或解纤维丁酸弧菌的编码同源酶的基因,或选自fadA或atoB的大肠杆菌硫解酶基因。

    乙酰乙酰-CoA转化成羟基丁酰-CoA可通过在重组微生物中表达编码羟基丁酰-CoA脱氢酶Hbd的天然或异源基因来实施。在本文中所公开的重组微生物中合适的例示性Hbd由如下基因编码:来自丙酮丁醇梭菌(具体而言来自菌株ATCC 824)的hbd,或来自克氏梭菌、拜氏梭菌(具体而言来自菌株NCIMB8052或菌株BA101)、热解糖梭菌、破伤风梭菌、解纤维丁酸弧菌、埃氏巨球形菌、或大肠杆菌(fadB)的编码同源酶的基因。

    羟基丁酰-CoA转化成巴豆酰-CoA可通过在重组微生物中表达编码巴豆酸酶或Crt的天然或异源基因来实施。在本文中所公开的重组微生物中合适的例示性crt由来自丙酮丁醇梭菌(具体而言来自菌株ATCC 824)的crt,或来自溶纤维丁酸弧菌、聚核梭杆菌文氏亚种、艰难梭菌、巴氏梭菌、或马尔他布鲁氏菌的编码同源酶的基因编码。

    巴豆酰-CoA转化成丁酰-CoA可通过在重组微生物中表达编码丁酰-CoA脱氢酶的天然或异源基因来实施。在本文中所公开的重组微生物中合适的例示性丁酰-CoA脱氢酶由来自丙酮丁醇梭菌(具体而言来自菌株ATCC 824)的bcd/etfA/etfB,或来自埃氏巨球形菌、埃氏消化链球菌、布氏共养生孢菌、溃蚀密螺旋体、解纤维丁酸弧菌的编码同源酶的基因,或哺乳动物线粒体Bcd同系物编码。

    丁醛转化成正丁醇可通过在重组微生物中表达编码丁醛脱氢酶或正丁醇脱氢酶的天然或异源基因来实施。在本文中所公开的重组微生物中合适的例示性丁醛脱氢酶/正丁醇脱氢酶由来自丙酮丁醇梭菌(具体而言来自菌株ATCC824)的bdhA、bdhB、aad、或adhE2,或来自拜氏梭菌(具体而言来自菌株NCIMB8052或菌株BA101)的编码ADH-1、ADH-2、或ADH-3的基因编码。

    在某些实施方案中,自乙酰-CoA至正丁醇的代谢途径的酶是(i)硫解酶(Thl),(ii)羟基丁酰-CoA脱氢酶(Hbd),(iii)巴豆酸酶(Crt),(iv)醇脱氢酶(AdhE2),或正丁醇脱氢酶(Aad)或丁醛脱氢酶(Ald)加之单功能正丁醇脱氢酶(BdhA/BdhB)中的至少一种,和(v)反式-2-烯酰-CoA还原酶(TER)(图2)。在某些实施方案中,Thl、Hbd、Crt、AdhE2、Ald、BdhA/BdhB和Aad来自梭菌属。在某些实施方案中,梭菌属是丙酮丁醇梭菌。在某些实施方案中,TER来自纤细眼虫或来自嗜水气单胞菌。

    在某些实施方案中,一种或多种异源基因编码乙酰-CoA-乙酰转移酶(硫解酶)、羟丁酰-CoA脱氢酶(hbd)、巴豆酸酶(crt)、和醇脱氢酶(adhE2)、丁酰-CoA脱氢酶(bcd)、丁醛脱氢酶(bdhA/bdhB)/丁醇脱氢酶(aad)、和反式-2-烯酰-CoA还原酶(TER)中的一种或多种。

    例如,乙酰-CoA-乙酰转移酶(硫解酶)可以是来自丙酮丁醇梭菌的thl,或来自巴氏梭菌、拜氏梭菌、热带假丝酵母、芽孢杆菌属菌种、埃氏巨球形菌、或溶纤维丁酸弧菌的同源酶,或选自fadA或atoB的大肠杆菌硫解酶。

    羟丁酰-CoA脱氢酶可以是来自丙酮丁醇梭菌的hbd,或来自克氏梭菌、拜氏梭菌、热解糖梭菌、破伤风梭菌、解纤维丁酸弧菌、埃氏巨球形菌、或大肠杆菌(fadB)的同源酶。

    巴豆酸酶可以是来自丙酮丁醇梭菌的crt,或来自溶纤维丁酸弧菌、聚核梭杆菌文氏亚种、艰难梭菌、巴氏梭菌、或马尔他布鲁氏菌的同源酶。

    丁酰-CoA脱氢酶可以是来自丙酮丁醇梭菌的bcd/etfA/etfB,或来自埃氏巨球形菌、埃氏消化链球菌、布氏共养生孢菌、溃蚀密螺旋体、解纤维丁酸弧菌的同源酶,或真核线粒体bcd同系物。

    丁醛脱氢酶/丁醇脱氢酶可以是来自丙酮丁醇梭菌的bdhA、bdhB、aad、或adhE2,或来自拜氏梭菌的ADH-1、ADH-2、或ADH-3。

    反式-2-烯酰-CoA还原酶(TER)可以来自纤细眼虫或嗜水气单胞菌。

    一种或多种异源DNA序列可以来自选自丙酮丁醇梭菌或拜氏梭菌的产溶剂梭菌,或来自艰难梭菌、巴氏梭菌、克氏梭菌、热解糖梭菌、破伤风梭菌、热带假丝酵母、芽孢杆菌属菌种、马尔他布鲁氏菌、埃氏巨球形菌、溶纤维丁酸弧菌、聚核梭杆菌文氏亚种、埃氏消化链球菌、布氏共养生孢菌、溃蚀密螺旋体、或大肠杆菌。

    在某些实施方案中,丙酮丁醇梭菌是菌株ATCC824,而拜氏梭菌是菌株NCIMB 8052或菌株BA101。在某些实施方案中,共享至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%序列同一性,或至少约50%、60%、70%、80%、90%序列同一性(根据NCBI BLAST的计算,使用缺省参数)的同系物对于本发明是合适的。

    部分(1):工程化改造丙酮酸变成乙酰-CoA的转化

    如上所述,丙酮酸变成乙酰-CoA的转化可通过两种一般路径发生在工程化细胞中:(A)如上所述的“PDH旁路”路径或(B)胞质溶胶中通过PDH或通过PFL进行的丙酮酸变成乙酰-CoA的直接转化。

    (A)经“PDH旁路”路径生成乙酰-CoA

    关于自丙酮酸生成乙酰-CoA的路径(A),胞质乙酰-CoA生成途径是由三种酶催化的,如图3中步骤1、2和3所示。通过提高那些限速的酶的活性实现了生成乙酰-CoA的更有效途径。例如,在酿酒酵母中,如果ALD活性在途径中是限制性的,那么ALD6的过表达会由此提高通过该途径的整体通量。经以下机制之一或其组合实现了胞质溶胶中升高的乙酰-CoA形成:

    在一个实施方案中,通过丙酮酸脱羧酶基因(例如,酿酒酵母PDC1、PDC5和/或PDC6;步骤1)的过表达可生成升高的乙酰-CoA。

    在另一个实施方案中,通过乙醛脱氢酶基因(例如,酿酒酵母ALD6;步骤2)的过表达可生成升高的乙酰-CoA。

    在又一个实施方案中,通过乙酰-CoA合酶基因(例如,酿酒酵母ACS1或ACS2或二者;步骤3)的过表达可生成升高的乙酰-CoA。

    在一个不同的实施方案中,ALD和ACS(酿酒酵母ALD6;步骤2)二者的同时过表达可生成升高的乙酰-CoA(步骤2和3)。

    在另一个实施方案中,PDC、ALD、和ACS基因的同时过表达可生成升高的乙酰-CoA生成(步骤1-3)。

    为了进一步提高乙酰-CoA生成,可以降低或消除酵母中的主要胞质乙醇生成途径。在Crabtree阳性酿酒酵母中,这是通过删除ADH1来实现的,ADH1是胞质ADH活性的主要来源。删除了ADH1的细胞不能够厌氧生长(Drewke等,(1990).J.Bacteriology 172(7):3909),而且如此可能优选删除ADH1以将乙醛变成乙醇的转化降至最低。消除此途径选择性驱动乙醛通向乙酸且随后通向乙酰-CoA生成(图3,步骤5)。因此,可以在具有降低的或消除的ADH活性的细胞中实施上文所述基因的过表达。

    类似的,可以在Crabtree阴性酵母诸如乳酸克鲁维酵母中通过删除ADHI或ADHII降低或消除胞质ADH活性,用以提高经“PDH旁路”路径自丙酮酸至乙酰-CoA的通量。因此,在此生物体中,与上文对酿酒酵母所提议的类似,可以经由单独的或组合的KIALD6、KIACS1或KIACS2的过表达来提高经过“PDH旁路”路径的通量。

    (B)自丙酮酸直接生成乙酰-CoA

    关于自丙酮酸生成乙酰-CoA的路径(B),可以通过形成完整PDH复合物的基因的过表达来提高乙酰-CoA生成。例如,过表达的基因可以来自大肠杆菌(aceE、aceF、和lpdA)、运动发酵单胞菌(Zymomonas mobilis)(pdhAa、pdhAβ、pdhB、和Ipd)、金黄色葡萄球菌(Staphylococcus aureus)(pdhA、pdhB、pdhC、和Ipd)、枯草芽孢杆菌(Bacillus subtilis)、谷氨酸棒杆菌(Corynebacteriumglutamicum)、或铜绿假单胞菌(Pseudomonas aeruginosa)(步骤4)。

    丙酮酸脱氢酶复合物催化丙酮酸变成乙酰-CoA的转化。在酿酒酵母中,此复合物定位在线粒体内膜空间中。因此,在酿酒酵母的细胞质中获得更高水平乙酰-CoA的另一种方法是工程化改造细胞以过表达能在细胞质中发挥功能的真核的或原核的丙酮酸脱氢酶复合物(步骤4)。在某些实施方案中,本文中所公开的重组微生物包括在厌氧或微需氧条件下有活性的丙酮酸脱氢酶(Pdh)。丙酮酸脱氢酶或NADH依赖性甲酸脱氢酶对于重组微生物而言可以是异源的,即编码这些酶的编码序列是异源的,或转录调节区是异源的(包括人工的),或所编码的多肽包含包含序列变化,其使得该酶对某些代谢中间产物或底物带来的反馈抑制有抗性。

    直到最近,才广泛接受了Pdh在厌氧条件下不发挥功能,但是数份最近的报告证明了情况并非如此(de Graef,M.等,1999,Journal of Bacteriology,181,2351-57;Vernuri,G.N.等,2002,Applied and Environmental Microbiology,68,1715-27)。此外,其它微生物诸如粪肠球菌(Enterococcus faecalis)即使在厌氧条件下也展现出Pdh复合物的高体内活性,前提是生长条件使得稳态NADH/NAD+比足够低(Snoep,J.L.等,1991,Ferns Microbiology Letters,81,63-66)。代替调节Pdh表达和功能的氧,已经显示了Pdh受到NADH/NAD+比的调节(de Graef,M.等,1999,Journal of Bacteriology,181,2351-57)。如果在宿主细胞中表达的正丁醇途径消耗NADH快得足以在细胞内部维持低NADH/NAD+水平,那么内源或异源表达的Pdh可维持活性和提供NADH,其足以平衡该途径。

    这些Pdh酶能在本文中所公开的重组微生物中平衡正丁醇途径。

    在厌氧条件下功能性的Pdh的表达预期提高每摩尔葡萄糖获得的NADH摩尔数。Kim等记载了Pdh使得在大肠杆菌中消耗每摩尔葡萄糖可得到多达4摩尔NADH(Kim,Y.等(2007).Appl.Environm.Microbiol.,73,1766-1771)。也可以工程化改造酵母,以表达来自各式各样细菌来源的PDH复合物。例如,来自粪肠球菌的Pdh与来自大肠杆菌的Pdh类似,但是在低得多的NADH/NAD+水平被灭活。另外,有些生物体诸如枯草芽孢杆菌和几乎所有乳酸细菌菌株在厌氧代谢中使用Pdh。如果正丁醇生成途径能与内源发酵性途径竞争的话,那么在表达厌氧活性Pdh的微生物中表达正丁醇生成途径预期导致大于1.4%的正丁醇产率。

    或者,可以通过过表达两种细菌酶,即丙酮酸甲酸裂合酶(例如大肠杆菌pflB)和甲酸脱氢酶(例如博伊丁氏假丝酵母(Candida boidnii)fdh1),在胞质溶胶中生成乙酰-CoA。使用此途径,丙酮酸被转化成乙酰-CoA和甲酸。然后甲酸脱氢酶催化甲酸变成二氧化碳的NADH依赖性转化。这些反应的净结果与丙酮酸脱氢酶复合物将丙酮酸转化成乙酰-CoA的情况相同:

    丙酮酸+NAD+→乙酰-CoA+NADH+CO2。

    NADH依赖性甲酸脱氢酶(Fdh;EC 1.2.1.2)催化甲酸变成CO2的氧化和同时的NAD+变成NADH的还原。Fdh可依照本发明用于提高宿主微生物内的NADH胞内可得性,而且可用于在NADH方面平衡正丁醇生成途径。具体而言,可以在宿主微生物中活化(具体而言是过表达)生物学活性NADH依赖性的Fdh。在存在这种新引入的甲酸脱氢酶途径时,1摩尔甲酸转化成二氧化碳时会形成1摩尔NADH。在某些实施方案中,在天然微生物中,甲酸脱氢酶将甲酸转化成CO2和H2,不牵涉辅因子。

    另外,可以使用本领域技术人员已知的方法对任何编码外来酶的基因(或本文中所提及的任何其它的)(或任何控制或调控其表达的调节元件)进行定向进化。此类动作容许本领域技术人员为酵母中的表达和活性优化酶。

    另外,为了调控此途径,可以表达来自其它真菌和细菌物种的丙酮酸脱羧酶、乙酰-CoA合成酶、和乙醛脱氢酶基因。多种生物体能充当这些酶的来源,包括,但不限于:酵母属菌种,包括酿酒酵母突变株和葡萄汁酵母(S.uvarum);克鲁维酵母属,包括耐热克鲁维酵母(K.thermotolerans)、乳酸克鲁维酵母、和马克思克鲁维酵母(K.marxianus);毕赤酵母属;汉逊酵母属,包括多形汉逊酵母(H.polymorpha);假丝酵母属;丝孢酵母属(Trichosporon)、Yamadazyma,包括Y.stipitis;Torulaspora pretoriensis;粟酒裂殖酵母(Schizosaccharomyce pombe);隐球菌属菌种(Cryptococcus sp.);曲霉属菌种;脉孢菌属菌种(Neurospora sp.)或黑粉菌属菌种(Ustilago sp.)。有用丙酮酸脱羧酶的例子是那些来自贝酵母(Saccharomyces bayanus)(1PYD)、Candidaglabrata、乳酸克鲁维酵母(KIPDC1)、或构巢曲霉(Aspergillus nidulans)(PdcA)、和来自白色假丝酵母(Candida albicans)、粗糙脉孢菌(Neurosporacrassa)、构巢曲霉、或乳酸克鲁维酵母(ACS1)的乙酰-CoA合酶,和来自黑曲霉(Aspergillus niger)(ALDDH)、白色假丝酵母、新生隐球菌(Cryptococcusneoformans)(alddh)的乙醛脱氢酶。有用原核酶的来源包括,但不限于大肠杆菌、运动发酵单胞菌、芽孢杆菌属菌种、梭菌属菌种、假单胞菌属菌种、乳球菌属菌种(Lactococcus sp.)、肠杆菌属菌种(Enterobacter sp.)和沙门氏菌属菌种(Salmonella sp.)。通过工程化改造这些酶以实现增强的活性,可获得此途径的进一步增强,其通过定点诱变和其它进化方法(这包括本领域技术人员已知的技术)来实现。

    原核生物,诸如,但不限于,大肠杆菌、运动发酵单胞菌、金黄色葡萄球菌、芽孢杆菌属菌种、梭菌属菌种、棒杆菌属菌种、假单胞菌属菌种、乳球菌属菌种、肠杆菌属菌种、和沙门氏菌属菌种,能充当这种酶复合物的来源。例如,来自大肠杆菌(aceE、aceF、和lpdA)、运动发酵单胞菌(pdhAα、pdhAβ、pdhB、和Ipd)、金黄色葡萄球菌(pdhA、pdhB、pdhC、和pdhC)、枯草芽孢杆菌、谷氨酸棒杆菌、和铜绿假单胞菌的丙酮酸脱氢酶复合物可用于此目的。

    培养和操作酵母的方法是本领域公知的。在酵母细胞中过表达基因、以各种较低的水平表达基因、遏制基因表达、或删除基因的方法是本领域公知的,而且本发明涵盖任何此类方法用于构建本发明的酵母菌株。

    可使用任何方法来将外源核酸分子导入酵母中,而且许多此类方法是本领域技术人员公知的。例如,转化、电穿孔、接合、和原生质体融合是用于将核酸导入酵母细胞的常用方法。参见例如Ito等,J.Bacterol.153:163-168(1983);Durrens等,Curr.Genet.18:7-12(1990);及Becker和Guarente,Methodsin Enzymology 194:182-187(1991)。

    在一个实施方案中,感兴趣基因进入DNA片段或靶基因的整合依照同源重组的原理发生。依照这个实施方案,含有包含至少一种酵母标志基因的模块、有或无待整合基因(内部模块)的整合盒任一侧翼均为与靶定整合位点的末端同源的DNA片段(致重组序列)。通过适宜方法用该盒转化酵母后,致重组序列之间的同源重组可导致内部模块替换基因组中与整合盒的致重组序列对应的两个位点之间的染色体区域。

    在一个实施方案中,为了删除基因,整合盒可包括适宜的酵母选择标志,其侧翼为致重组序列。在一个实施方案中,为了异源基因整合入酵母染色体中,整合盒包括在适宜启动子和终止子控制下的异源基因,与选择标志一起,侧翼为致重组序列。在一个实施方案中,异源基因包含适宜的天然基因,期望提高天然基因的拷贝数。选择标志基因可以是任何在酵母中使用的标志基因,包括,但不限于,来自酿酒酵母的URA3基因或同源基因;或潮霉素抗性基因,它们分别用于对转化细胞进行基于营养缺陷型互补或抗生素抗性的选择。可以随意选择致重组序列,这取决于适合于期望应用的期望整合位点。

    另外,在一个实施方案中,使用本领域技术人员公知的技术自基因组中清除某些被导入的标志基因。例如,通过将含有URA3的细胞在含有FOA(5-氟-乳清酸)的培养基中涂板,并选择FOA抗性菌落,能获得URA3标志丢失(Boeke,J.等,1984,Mol.Gen.Genet.197,345-47)。

    可以将包含在本公开内容酵母细胞内的外源核酸分子以任何形式维持在该细胞内。例如,可以将外源核酸分子整合入细胞的基因组中,或维持在附加体状态,其能稳定地传递(“遗传”)给子细胞。此类染色体外遗传元件(诸如质粒等)可以另外含有确保此类遗传元件在子细胞中的存在的选择标志。此外,可以稳定地或瞬时地转化酵母细胞。另外,本文中所描述的酵母细胞可含有单拷贝或多拷贝的如上所述特定外源核酸分子。

    用于自外源核酸分子表达多肽的方法是本领域技术人员公知的。此类方法包括但不限于构建核酸,使得调节元件促进编码期望多肽的核酸序列的表达。典型的是,调节元件是在转录水平调节其它DNA序列表达的DNA序列。如此,调节元件包括但不限于启动子、增强子等等。例如,外源基因可以在诱导型或组成性启动子的控制下。此外,用于在酵母中自外源核酸分子表达多肽的方法是本领域技术人员公知的。例如,能够在克鲁维酵母属(参见例如美国专利No.4,859,596和4,943,529,通过述及将每一篇完整收入本文)和酵母属(参见例如Gelissen等,Gene 190(1):87-97(1997))中表达外源多肽的核酸构建体是公知的。在另一个实施方案中,异源控制元件可用于活化或遏制内源基因的表达。另外,在要遏制或消除表达时,可以通过已知的删除技术来消除有关酶、蛋白质或RNA的基因。

    如本文中所描述的,本公开内容范围内的酵母可通过对所表达的、过表达的或遏制的特定酶特异性的选择技术来鉴定。鉴定具有期望表型的菌株的方法是本领域技术人员公知的。此类方法包括但不限于PCR和核酸杂交技术诸如Northern和Southern分析,在特定基底(substrate)上或在存在特定底物(substrate)、化学品、选择剂等时改变的生长能力。在有些情况中,可使用免疫组织化学和生物化学技术通过检测所编码多肽的表达来测定细胞是否含有特定核酸。例如,可使用对所编码的酶具有特异性的抗体来测定特定酵母细胞是否含有该所编码的酶。另外,可使用生物化学技术通过检测作为酶多肽表达的结果而生成的产物来测定细胞是否含有编码酶多肽的特定核酸分子。例如,用编码乙酰-CoA合成酶的载体转化细胞并检测到升高的胞质乙酰-CoA浓度指示载体存在且基因产物有活性。用于检测特定酶活性或特定产物的存在的方法是本领域技术人员公知的。例如,可以如Dalluge等,Anal.Bioanal.Chem.374(5):835-840(2002)所记载的来测定乙酰-CoA的存在。

    本发明的酵母细胞具有降低的酶活性,诸如降低的醇脱氢酶活性。术语“降低的”,如本文中关于细胞和特定酶活性所使用的,指比在相同物种的可比较酵母细胞中所测量到的水平要低的酶活性。如此,缺乏醇脱氢酶活性的酵母细胞视为具有降低的醇脱氢酶活性,因为大多数(如果不是所有的话)可比较的酵母菌株具有至少一些醇脱氢酶活性。此类降低的酶活性的原因可以是较低的酶浓度、较低的酶比活、或其组合。许多不同方法可用于使得酵母具有降低的酶活性。例如,可以工程化改造酵母细胞,以具有遭到破坏的编码酶的基因座,其使用常用诱变或敲除技术来实现。参见例如Methods inYeast Genetics(1997年版),Adams,Gottschling,Kaiser,和Stems,Cold SpringHarbor Press(1998)。

    或者,可使用反义技术来降低酶活性。例如,可以工程化改造酵母,以含有编码反义分子的cDNA,该反义分子阻止酶生成。术语“反义分子”,如本文中所使用的,涵盖任何含有与内源多肽编码链对应的序列的核酸分子。反义分子还可具有侧翼序列(例如调节序列)。如此,反义分子可以是核酶或反义寡核苷酸。核酶可具有任何通用结构,包括,但不限于,发夹、锤头、或斧头(axhead)结构,前提是该分子切割RNA。

    具有降低的酶活性的酵母可使用任何方法来鉴定。例如,可使用常用方法来容易地鉴定具有降低的醇脱氢酶活性的酵母,例如通过经气相层析测量乙醇形成。

    在一个实施方案中,可以使用两步过程自本公开内容的代谢工程化菌株之一生成正丁醇。因为高水平的丁醇(例如在培养基中为1.5%,这一般随酵母和菌种而变化)对于细胞可以是有毒性的,一种获得大量正丁醇的策略是培养能够在其中不生成丁醇或只生成不显著的、无毒性的量的丁醇的条件下生成正丁醇的菌株。此步骤容许大量活细胞的积累,即显著量的生物质,然后可以将其转换成其中生成正丁醇的生长条件。这样的策略容许在毒性问题变得重要和减缓细胞生长之前生成大量正丁醇。例如,可以在需氧条件下培养细胞(其中正丁醇生成受到遏制或缺失),然后转换成厌氧或微需氧条件以生成正丁醇(例如通过活化已经依照本发明被工程化改造入菌种中的适宜的代谢途径)。或者,有关酶的表达可以在诱导型控制下,例如热敏感性启动子或其它热敏感性步骤(诸如酶自身的热稳定性),使得第一个步骤发生时伴有有关途径或酶关闭(即无活性),诱导发生(例如温度转变)和正丁醇生成。用于对基因进行诱导型控制的方法是公知的。热稳定的酶是已知的,或者可以通过本领域已知方法来选择。正如在本公开内容的其它过程中那样,一旦生成正丁醇,就可以依照一个实施方案回收它。

    用于自微生物(包括酵母)回收正丁醇的过程披露于2007年12月3日提交的美国临时申请流水号11/949,724,通过述及收入本文。

    本领域技术人员会领会,可以对上文所描述的发明进行各种省略、添加和修改,而不偏离本发明的范围,而且所有此类修改和变化意图落在所附权利要求书限定的发明范围内。在此通过述及将所引用的所有参考文献、专利、专利申请、和其它文件收入本文。

    实施例

    表1列举了实施例1-38中所描述的一组基因。给出了可用于扩增每一种基因的有关引物(正向的和反向的)、以及每一种引物的序列。基因是依照对每一种物种适宜的命名规则列举的;在某些所列举的基因前面有两个字母,它们代表了给定基因起源的属和种的第一个字母。对于某些基因名称,附有后缀“-co”,指示使用细菌大肠杆菌或酵母酿酒酵母优选的密码子使用率构建了经过密码子优化的合成基因,正如正文中所指明的。

    表1

      基因  基因  SEQ  ID  NO:  引物名称  SEQ  ID  NO:  引物序列  Cb-hbd  155  Gevo-311  42  GAGGTTGTCGACATGAAAAAGATTTTTGTACTTGGAG  Gevo-175  43  AATTGGATCCTTATTTAGAATAATCATAGAATCCT  Cb-crt  156  Gevo-312  44  GTTCTTGTCGACATGGAATTAAAAAATGTTATTCTTG  Gevo-171  45  AATTGGATCCTTATTTATTTTGAAAATTCTTTTCTGC  Cb-bcd  157  Gevo-313  46  CAAGAGGTCGACATGAATTTCCAATTAACTAGAGAAC  Gevo-314  47  GCGTCCGGATCCCTATCTTAAAATGCTTCCTGCG  Cb-etfA  158  Gevo-315  48  CGGAAAGTCGACATGAATATAGCAGATTACAAAGGC  Gevo-173  49  AATTGGATCCTTATTCAGCGCTCTTTATTTCTTTA  Cb-etfB  159  Gevo-316  50  CAAAATGTCGACATGAATATAGTAGTTTGTGTAAAAC  Gevo-317  51  TAATTTGGATCCTTAGATGTAGTGTTTTTCTTTTAAT  Cb-  adhA  160  Gevo-319  52  GAACCAGTCGACATGGCACGTTTTACTTTACCAAG  Gevo-177  53  AATTGGATCCTTACAAATTAACTTTAGTTCCATAG  Cb-aldh  161  Gevo-318  54  TCCATAGTCGACATGAATAAAGACACACTAATACCT  Gevo-249  55  AATTGGATCCTTAGCCGGCAAGTACACATCTTCTTTGTC  T  Ca-thl  162  Gevo-308  56  GATCGAGTCGACATGAAAGAAGTTGTAATAGCTAG  Gevo-309  57  GTTATAGGATCCCTAGCACTTTTCTAGCAATATTG  Ca-hbd  163  Gevo-281  58  GTGGATGTCGACATGAAAAAGGTATGTGTTATAGGTG  Gevo-161  59  AATTGGATCCTTATTTTGAATAATCGTAGAAACCT  Ca-crt  164  Gevo-282  60  TCCTACGTCGACATGGAACTAAACAATGTCATCCT  Gevo-283  61  TAACTTGGATCCCTATCTATTTTTGAAGCCTTCAAT  Ca-bcd  165  Gevo-284  62  CAAGAGGTCGACATGGATTTTAATTTAACAAGAGAAC  Gevo-285  63  CAATAAGGATCCTTATCTAAAAATTTTTCCTGAAATAAC  Ca-etfA  166  Gevo-286  64  CGGGAAGTCGACATGAATAAAGCAGATTACAAGGGC  Gevo-287  65  GTTCAAGGATCCTTAATTATTAGCAGCTTTAACTTG  Ca-etfB  167  Gevo-288  66  CAAAATTGTCGACATGAATATAGTTGTTTGTTTAAAAC  Gevo-289  67  GTTTTAGGATCCTTAAATATAGTGTTCTTCTTTTAATTTT

      基因  基因  SEQ  ID  NO:  引物名称  SEQ  ID  NO:  引物序列  G  Ca-  adhE2  168  Gevo-292  68  CAAGAAGTCGACATGAAAGTTACAAATCAAAAAGAAC  Gevo-293  69  TCCTATGCGGCCGCTTAAAATGATTTTATATAGATATCC  T  Ca-aad  169  Gevo-290  70  AGGAAAGTCGACATGAAAGTCACAACAGTAAAGGA  Gevo-291  71  ATTTAAGCGGCCGCTTAAGTTGTTTTTTAAAACAATTT  A  Ca-  bdhA  170  Gevo-294  72  CATAACGTCGACATGCTAAGTTTTGATTATTCAATAC  Gevo-247  73  AAT TGGATCCTTAATAAGATTTTTTAAATATCTCAA  Ca-  bdhB  171  Gevo-295  74  CATAACGTCGACATGGTTGATTTCGAATATTCAATAC  Gevo-159  75  AATTGGATCCTTACACAGATTTTTTGAATATTTGTA  Ca-thl-  co  1  Gevo-310  76  GATCGAGAATTCATGAAAGAAGTTGTAATAGCTAG  Gevo-309  77  GTTATAGGATCCCTAGCACTTTTCTAGCAATATTG  Ca-hbd-  co  2  Gevo-296  78  CGGATAGTCGACATGAAAAAGGTATGTGTTATAGGC  Gevo-297  79  TCCCAAGGATCCTTATTTTGAATAATCGTAGAAACCCT  Ca-crt-  co  3  Gevo-282  80  TCCTACGTCGACATGGAACTAAACAATGTCATCCT  Gevo-283  81  TAACTTGGATCCCTATCTATTTTTGAAGCCTTCAAT  Ca-bcd-  co  4  Gevo-284  82  CAAGAGGTCGACATGGATTTTAATTTAACAAGAGAAC  Gevo-298  83  GTAAAGGGATCCTTAACTAAAAATTTTTCCTGAAATG  Ca-eftA-  co  5  Gevo-286  84  CGGGAAGTCGACATGAATAAAGCAGATTACAAGGGC  Gevo-299  85  GTTCAAGGATCCTTAATTATTAGCAGCTTTAACCTG  Ca-eftB-  co  6  Gevo-288  86  CAAAATTGTCGACATGAATATAGTTGTTTGTTTAAAAC  Gevo-300  87  GACTTTGGATCCTTAAATATAGTGTTCTTCTTTCAG  Ca-  adhE2-  co  7  Gevo-292  88  CAAGAAGTCGACATGAAAGTTACAAATCAAAAAGAAC  Gevo-301  89  ATTTTCGGATCCTTAAAATGATTTTATATAGATATCTTTT  A  Me-bcd-  co  8  Gevo-302  90  CTTATAGTCGACATGGATTTTAACTTAACAGATATTC  Gevo-303  91  CCGCCAGGATCCTTAACGTAACAGAGCACCGCCGGT  Me-effA-  co  9  Gevo-304  92  CGGAAAGTCGACATGGATTTAGCAGAATACAAAGGC  Gevo-305  93  CTTTGTGGATCCTTATGCAATGCCTTTCTGTTTC  Me-eftB-  co  10  Gevo-306  94  CAAACTGAATTCATGGAAATATTGGTATGTGTCAAAC  Gevo-307  95  ACCAACGGATCCTTAAATGATTTTCTGGGCAACCA  ERG10  154  Gevo-273  96  GTTACAGTCGACATGTCTCAGAACGTTTACATTG  Gevo-274  97  GATAACGGATCCTCATATCTTTTCAATGACAATAG  IpdA  20  Gevo-610  119  ttttGTCGACACTAGTatgagtactgaaatcaaaactcagggtcgtg  Gevo-611  120  ttttCTCGAGttacttcttcttcgctttcgggttcgg

      基因  基因  SEQ  ID  NO:  引物名称  SEQ  ID  NO:  引物序列  aceE  21  Gevo-606  116  ttttGTCGACACTAGTatgtcagaacgtttcccaaatgacgtgg  Gevo-607  117  ttttCTCGAGttacgccagacgcgggttaactttatctg  aceF  22  Gevo-653  136  ttttGTCGACACTAGTatggctatcgaaatcaaagtaccggacatcggg  Gevo-609  118  ttttCTCGAGttacatcaccagacggcgaatgtcagacag  PDA1  23  Gevo-660  143  ttttCTCGAGactagtATGgcaactttaaaaacaactgataagaagg  Gevo-661  144  ttttagatctTTAATCCCTAGAGGCAAAACCTTGC  PDB1  24  Gevo-662  145  ttttCTCGAGactagtATGgcggaagaattggaccgtgatgatg  Gevo-663  146  tttGGATCCTTATTCAATTGACAAGACTTCTTTGACAG  PDX1  25  Gevo-664  147  TtttCTCGAGactagtATGttacttgctgtaaagacattttcaatgcc  Gevo-665  148  ttttggatccTCAAAATGATTCTAACTCCCTTACGTAATC  LAT1  26  Gevo-656  139  ttttCTCGAGgctagcATGGCATCGTACCCAGAGCACACCAT  TATTGG  Gevo-657  140  ttttGGATCCTCACAATAGCATTTCCAAAGGATTTTCAAT  LPD1  27  Gevo-658  141  ttttCTCGAGactagtATGGTCATCATCGGTGGTGGCCCTGC  TGG  Gevo-659  142  ttttGGATCCTCAACAATGAATAGCTTTATCATAGG  PDC1  28  Gevo-639  129  ttttctcgagactagtATGTCTGAAATTACTTTGGG  Gevo-640  130  ttttggatccTTATTGCTTAGCGTTGGTAGCAGCAG  CUP1  prom  178  Gevo-637  127  ttttGAGCTCgccgatcccattaccgacatttggg  Gevo-638  128  aaaGTCGACaccgatatacctgtatgtgtcaccaccaatgtatctataagtatc  catGCTAGCCCTAGGtttatgtgatgattgattgattgattg  pflA  36  PflA_forw  98  cattgaattcatgtcagttattggtcgcattcac  PflA_Rev  99  cattgtcgacttagaacattaccttatgaccgtactg  pflB  37  PflB_forw  100  cattgaattcatgtccgagcttaatgaaaagttagcc  PflB_Rev  101  cattgtcgacttacatagattgagtgaaggtacgag  Cb-  FDH1  38  fdh1_forw  102  cattgaattcatgaagatcgttttagtcttatatggtgc  fdh1_rev  103  cattgtcgacttatttcttatcgtgtttaccgtaagc  KIALD6  39  KIALD6_rig  ht3  104  gttaggatccttaatccaacttgatcctgacggccttg  KIALD6_Lef  t5  105  ccaagtcgacatgtcctctacaattgctgagaaattgaacctc  KIACS1  40  KIACS1_Ri  ght3  106  gttagcggccgcttataatttcacggaatcgatcaagtgc  KIACS1_Lef  t5  107  ccaagctagcatgtctcctgctgttgataccgcttcc  KIACS2  41  KIACS2_rig  ht3  108  ggttggatccttatttcttctgctgactgaaaaattgattttctactgc  KIACS2_Lef  t5  109  ccaagaattcatgtcgtcggataaattgcataagg  ACS1  30  Gevo-479  112  catgccgtcgacatgtcgccctctgccgtac  Gevo-480  113  gattaagcggccgcttacaacttgaccgaatcaattag  ACS2  31  Gevo-483  114  gatgaagtcgacatgacaatcaaggaacataaagtag  Gevo-484  115  gttaaaggatccttatttctttttttgagagaaaaattg  ALD6  29  Gevo-643  133  ccaagtcgacatgactaagctacactttgacac  Gevo-644  134  gtcggtaagagtgttgctgtggactcg  Ca-ter  179  Gevo-345  183  atgtttgtcgacatgatagtaaaagcaaagtttgta  Gevo-346  184  cttaatgcggccgcttaaggttctaattttcttaataattc  Ah-ter  180  Gevo-343  185  Gcttgagtcgacatgatcattaaaccgaaagttcg

      基因  基因  SEQ  ID  NO:  引物名称  SEQ  ID  NO:  引物序列  Gevo-344  186  atttaaggatcctcacagttcgacaacatcaaattta  Eg-ter  181  Gevo-347  187  catcacgtcgacatggccatgttcaccactac  Gevo-348  188  ctcgcgggatccttactgctgagctgcgctc  Sc-ccr  182  Gevo-341  189  gtcttagtcgacatgaccgtgaaagacattctg  Gevo-342  190  attggcggatcctcacacattacggaaacggtta

    表2列举了一组质粒构建体及其有关特征,正如实施例中所描述的。表中包括有关质粒名称(pGV);存在的原养型标志,其对于质粒在适宜的营养缺陷型菌种中的选择和维持是有用的;启动子序列(来自给定酿酒酵母基因区域);前述启动子控制下的基因;另外的启动子+基因组合,如果存在的话。

    表2:实施例中的质粒的有关特征的汇总表

      名称  原养型标志  启动子  1  基因  1  启动子  2  基因  2  pGV1099  HIS3  TEF1  (AU1 tag)  pGV1100  TRP1  TEF1  (HA tag)  pGV1101  LEU2  TEF1  (AU1 tag)  pGV1102  URA3  TEF1  (HA tag)  pGV1103  HIS3  TDH3  (myc tag)  pGV1104  TRP1  TDH3  (myc tag)  pGV1105  LEU2  TDH3  (myc tag)  pGV1106  URA3  TDH3  (myc tag)  pGV1208  TRP1  TEF1  Ca-hbd-co  pGV1209  LEU2  TEF1  Ca-crt-co  pGV1213  URA3  TEF1  Ca-adhE2-co  pGV1214  HIS3  TDH3  Me-bcd-co  pGV1217  TRP1  TEF1  Ca-hbd-co  TDH3  Ca-eftA-co  pGV1218  LEU2  TEF1  Ca-crt-co  TDH3  Ca-eftB-co  pGV1219  HIS3  TEF1  ScERG10  TDH3  Me-bcd-co  pGV1220  HIS3  TEF1  Ca-thl-co  TDH3  Ca-bcd-co  pGV1221  TRP1  TEF1  Ca-hbd-co  TDH3  Me-eftA-co  pGV1222  LEU2  TEF1  Ca-crt-co  TDH3  Me-eftB-co  pGV1223  HIS3  TEF1  ScERG10  TDH3  Ca-bcd-co  pGV1224  HIS3  TEF1  Ca-thl-co  TDH3  Me-bcd-co  pGV1225  HIS3  TEF1  Ca-thl-co  TDH3  Ca-ter  pGV1226  HIS3  TEF1  Ca-thl-co  TDH3  Ah-ter

      名称  原养型标志  启动子  1  基因  1  启动子  2  基因  2  pGV1227  HIS3  TEF1  Ca-thl-co  TDH3  Eg-ter  pGV1228  HIS3  TEF1  Ca-thl-co  TDH3  Sc-ccr  pGV1262  LEU2  TEF1  ScACS1  pGV1263  URA3  TEF1  ScACS2  pGV1319  URA3  TDH3  Ca-AdhE2_co  TEF1  ACS1  pGV1320  URA3  TDH3  Ca-AdhE2_co  TEF1  ACS2  pGV1321  LEU2  TDH3  ALD6  pGV1326  LEU2  TEF1  ALD6  pGV1334  HIS3  TDH3  /pdA  pGV1339  LEU2  TEF1  Ca_Crt_co  TDH3  ALD6  pGV1379  HIS3  TDH3  aceE  pGV1380  HIS3  TDH3  aceF  pGV1381  HIS3  TDH3  LAT1  pGV1383  HIS3  TDH3  PDA1  pGV1384  HIS3  TDH3  PDB1  pGV1385  HIS3  TDH3  PDX1  pGV1388  URA3  CUP1  n/a  pGV1389  URA3  TDH3  PDC1  pGV1399  LEU2  TEF1  Ca-hbd-co  TDH3  ALD6  pGV1414  URA3  MET3  n/a  pGV1428  HIS3  TDH3  n/a  pGV1429  TRP1  TDH3  n/a  pGV1430  LEU2  TDH3  n/a  pGV1483  URA3  MEt3  n/a  pGV1603  TRP1  TDH3  aceE  pGV1604  LEU2  TDH3  aceF  pGV1605  URA3  TEF1  adhE2  TDH3  PDC1  1102Fdh1  URA3  TEF1  Cb-FDH1  1103PflA  HIS3  TDH3  pflA  1104PflB  TRP1  TDH3  pflB  1208_PflA  TRP1  TEF1  Ca_hbd_co  TDH3  pflA  1208KI  HIS3  TEF1  Ca_hbd_co  1208KIALD6  HIS3  TEF1  Ca_hbd_co  TDH3  KIALD6  1208KIPflA  HIS3  TEF1  Ca_hbd_co  TDH3  pflA  1208KIPflA  TRP1  TEF1  Ca_Crt_co  TDH3  pflB  1208-IpdA  TRP1  TEF1  thl  TDH3  -IpdA  1209_PflB  LEU2  TEF1  Ca_Crt_co  TDH3  pflB  1209-aceE  LEU2  TEF1  crt  TDH3  aceE  1209KI  TRP1  TEF1  Ca_Crt_co

      名称  原养型标志  启动子  1  基因  1  启动子  2  基因  2  1209kIACS1  LEU2  TEF1  Ca_Crt_co  TDH3  KIACS1  1209kIACS2  LEU2  TEF1  Ca_Crt_co  TDH3  KIACS2  1213_Fdh1  URA3  TDH3  Ca_AdhE2_co  TEF1  Cb-FDH1  1213-aceF  URA3  TEF1  adhE2  TDH3  aceF  1213KI  URA3  TDH3  Ca_AdhE2_co  1213KIPflA  LEU2  TEF1  Ca_thl_co  TDH3  Cb-FDH1  1227KI  LEU2  TEF1  Ca_thl_co  TDH3  Eg-TER-co  1388-PDC1  URA3  CUP1  PDC1  1428_PflA  HIS3  TDH3  pflA  1428ALD6  HIS3  TDH3  KIALD6  1428-IpdA  HIS3  TDH3  IpdA  1429_PflB  TRP1  TDH3  pflB  1429-aceE  TRP1  TDH3  aceE  1429ACS1  TRP1  TDH3  KIACS1  1430_Fdh1  LEU2  TDH3  Cb-FDH1  1430-aceF  LEU2  TDH3  aceF  1431ACS2  URA3  TDH3  KIACS2  pGV1103-  Ipd1  HIS3  TDH3  LPD1

    表3描述了携带各种质粒并由此表达一组所导入的基因(如列举的)的酵母酿酒(菌株W303a)酵母中所生成的丁醇

    表3:酿酒酵母转化体的丁醇生成

      隔离群名称  质粒组合  所导入的基因  丁醇量  72h p.i(μM)  Gevo 1094;  Gevo 1095  pGV1208;  pGV1209;  pGV1225;  pGV1213  Ca-hbd-co;Ca-Crt-co;  Ca-thl-co+Ca-ter;Ca-  adhE2-co  129;145  Gevo 1096;  Gevo 1097  pGV1208;  pGV1209;  pGV1226;  pGV1213  Ca-hbd;Ca-Crt;Ca-thl-  co+Ah-ter;Ca-adhE2-  co  207;216  Gevo 1098;  Gevo 1099  pGV1208;  pGV1209;  pGV1227;  pGV1213  Ca-hbd;Ca-Crt;Ca-thl-  co+Eg-ter;Ca-adhE2-  co  251;313  Gevo 1100,  Gevo 1101  pGV1208;  pGV1209;  Ca-hbd;Ca-Crt;Ca-thl-  co+Sc-ter;Ca-adhE2-  109;109

    所有基因克隆和组合规程最初是使用已建立的方法(Miller,J.H.,1992;Sambrook,J.等,2001)在大肠杆菌中实施的。

    对于在酵母酿酒酵母中的表达有用的一组载体先前已有记载(Mumberg,D.等(1995)Gene 156:119-122;Sikorski和Heiter(1989)Genetics 122:19-27)。具体而言,这些出版物记载了一组选择标志(HIS3、LEU2、TRP1、URA3)和酿酒酵母复制起点,它们在表2中所列举的许多载体中也有使用。

    实施例1:用于在酵母酿酒酵母中表达丁醇途径基因的质粒构建

    使用刚好在起始密码子上游引入SalI位点和刚好在终止密码子之后引入BamHI位点的引物,通过PCR自来自酿酒酵母菌株W303a的基因组DNA克隆了酿酒酵母硫解酶基因ERG10。将此PCR产物用SalI和BamHI消化并克隆入pUC19(Yanisch-Perron,C,Vieira,J.,1985,Gene,33,103-19)的相同位点以生成pGV1120。

    分别使用质粒pGV1031、pGV1037、pGV1094、和pGV1095作为PCR扩增丙酮丁醇梭菌基因(Ca-)Ca-thl、Ca-hbd、Ca-crt、和Ca-bdhB的模板。使用pGV1090作为PCR扩增Ca-bcd、Ca-etfA、和Ca-etfB的模板。使用梭菌ATCC824的基因组DNA来扩增Ca-bdhA。将扩增片段用SalI和BamHI消化并克隆入pUC19的相同位点。此方案生成质粒pGV1121、pGV1122、pGV1123、pGV1124、pGV1125、pGV1126、pGV1127、pGV1128,它们分别含有基因Ca-thl、Ca-hbd、Ca-crt、Ca-bcd、Ca-etfA、Ca-etfB、Ca-bdhA、和Ca-bdhB。

    使用设计成刚好在起始密码子上游引入SalI位点和刚好在终止密码子下游引入BamHI位点的引物,通过PCR扩增拜氏梭菌(Cb-)基因Cb-hbd、Cb-crt、Cb-bcd、Cb-etfA、Cb-etfB、Cb-aldh、和Cb-adhA。分别使用质粒pGV1050、pGV1049、pGV1096和pGV1091作为PCR扩增Cb-hbd、Cb-crt、Cb-aldh、和Cb-adhA的模板。使用拜氏梭菌ATCC 51743的基因组DNA作为Cb-bcd、Cb-etfA、和Cb-etfB的模板。将PCR扩增片段用SalI和BamHI消化并克隆入pUC19的相同位点。此规程生成质粒pGV1129、pGV1130、pGV1131、pGV1132、pGV1133、pGV1134、和pGV1135,它们分别含有基因Cb-hbd、Cb-crt、Cb-bcd、Cb-etfA、Cb-etfB、Cb-aldh、和Cb-adhA。

    还克隆了为在大肠杆菌中表达进行过密码子优化的(-co)丙酮丁醇梭菌和埃氏巨球形菌(Me-)基因。这些基因包括Ca-thl-co、Ca-hbd-co、Ca-crt-co、Ca-bcd-co、Ca-etfA-co、Ca-etfB-co、Ca-adhE2-co、Me-bcd-co、Me-etfA-co、和Me-etfB-co。使用设计成刚好在起始密码子的上游引入SalI位点和刚好在终止密码子下游引入BamHI位点的引物,扩增除了Ca-thl-co和Me-etfB-co以外的这些基因。在Ca-thl-co和Me-etfB-co的情况中,引物设计成刚好在起始密码子的上游引入EcoRI位点和刚好在终止密码子的下游引入BamHI位点。将所得PCR产物用适宜的限制酶消化(SalI和BamHI或EcoRI和BamHI)并克隆入pUC19的相同位点以生成质粒pGV1197、pGV1198、pGV1199、pGV1200、pGV1201、pGV1202、pGV1203、pGV1205、pGV1206,它们分别含有基因Ca-thl-co、Ca-hbd-co、Ca-crt-co、Ca-bcd-co、Ca-etfA-co、Ca-etfB-co、Ca-adhE2-co、Me-etfA-co、和Me-etfB-co。将Me-bcd-co基因作为SalI-BamHI片段直接克隆入pGV1103中以生成pGV1214。

    将上述基因克隆入高拷贝酵母表达载体pGV1099、pGV1100、pGV1101、pGV1102、pGV1103、pGV1104、pGV1105和pGV1106。表2中描述了用于基因克隆的载体和所得质粒构建体的特性。

    使用SalI和BamHI分别自pGV1120和pGV1121释放硫解酶基因ERG10和Ca-thl并克隆入pGV1099(携带HIS3标志)以生成pGV1138和pGV1139。使用EcoRI和BamHI自pGV1197取出经过密码子优化的硫解酶基因Ca-thl-co并克隆入pGV1099以生成pGV1207。如此,这些基因克隆成符合两个拷贝的AU1标签(SEQ ID NO:172)的读码框并使用酿酒酵母TEF1启动子区(SEQ IDNO:175)表达。使用SalI和BamHI分别将羟丁酰-CoA-脱氢酶基因Ca-hbd(来自pGV1122)、Cb-hbd(来自pGV1129)、和Ca-hbd-co(来自pGV1198)克隆入pGV1100(携带LEU2标志)以生成pGV1140、pGV1141、和pGV1208。这导致这些基因克隆成符合HA标签(SEQ ID NO:173)的读码框并使用TEF1启动子表达。使用SalI和BamHI分别将巴豆酸酶基因Ca-crt(来自pGV1123)、Cb-crt(来自pGV1130)、Ca-crt-co(来自pGV1199)克隆入pGV1101(携带TRP1标志物)以生成pGV1142、pGV1143、和pGV1209。如此,这些基因克隆成符合两个拷贝的AU1标签的读码框并使用TEF1启动子表达。

    将丁酰-CoA脱氢酶和相应的电子传递基因etfA和etfB克隆到myc标签(SEQ ID NO:174)后面,使用来自酿酒酵母的TDH3启动子区(SEQ ID NO:176)表达。将Ca-bcd(来自pGV1124)、Cb-bcd(来自pGV1131)、Ca-bcd-co(来自pGV1200)和Me-bcd-co基因克隆入pGV1103(携带HIS3标志)以生成pGV1144、pGV1145、pGV1210、和pGV1214。分别将Ca-etfA(来自pGV1125)、Ca-etfB(来自pGV1126)、Cb-etfA(来自pGV1132)、Cb-etfB(来自pGV1133)、Ca-etfB-co(来自pGV1202)、和Me-etfA-co(来自pGV1205)基因克隆入pGV1104(携带LEU2标志)以生成pGV1146、pGV1147、pGV1148、pGV1149、pGV1212、和pGV1215。分别将Ca-etfA-co(来自pGV1201)和Me-etfB-co(来自pGV1206)克隆入pGV1104(携带TRP1标志)以生成pGV1211和pGV1216。

    将醛脱氢酶基因Cb-aldh(来自pGV1134)克隆入pGV1102(携带URA3标志)以生成pGV1150。将Cb-aldh基因放置成符合HA标签(SEQ ID NO:173)的读码框,使用TEF1启动子表达。将双功能醛/醇脱氢酶Ca-aad、Ca-adhE2、和Ca-adhE2-co及特定醇脱氢酶Ca-bdhA、Ca-bdhB、和Cb-adhA克隆到myc标签后面,在TDH3启动子控制下表达。使用设计成刚好在起始密码子上游引入SalI位点和刚好在终止密码子下游引入NotI位点的引物,通过PCR扩增Ca-aad和Ca-adhE2。使用质粒pGV1089作为Ca-aad的模板,而使用丙酮丁醇梭菌基因组DNA作为Ca-adhE2的模板。使用SalI和NotI将这些PCR产物克隆入pGV1106(携带URA3标志)以生成pGV1136(Ca-aad)和pGV1137(Ca-adhE2)。使用SalI和BamHI将经过密码子优化的Ca-adhE2-co(来自pGV1203)克隆入pGV1106以生成pGV1213。使用SalI和BamHI分别将醇脱氢酶Ca-bdhA(来自pGV1127)、Ca-bdhB(来自pGV1128)、和Cb-adhA(来自pGV1135)克隆入pGV1106以生成pGV1151、pGV1152、和pGV1153。

    因此,将丁酰-coA脱氢酶、电子传递蛋白A、电子传递蛋白B、和特定醇脱氢酶的上文所述酵母表达基因与TEF1启动子驱动的硫解酶、羟丁酰-CoA脱氢酶、巴豆酸酶、或醛脱氢酶以成对方式组合,如表2中所汇总的。

    为此目的,分别将来自pGV1144(TDH3启动子和Ca-bcd)和来自pGV1145(TDH3启动子和Cb-bcd)的EcoICRI至XhoI片段克隆入pGV1138的NotI(用Klenow填平)至XhoI位点以生成pGV1167(ERG10+Ca-bcd)和pGV1168(ERG10+Cb-bcd)。还分别将这些相同的EcoICRI至XhoI片段类似地克隆入pGV1139以生成pGV1169(Ca-thl+Ca-bcd)和pGV1170(Ca-thl+Cb-bcd)。使用相同的策略,分别将来自pGV1146(TDH3启动子和Ca-etfA)、pGV1148(TDH3启动子和Ca-etfB)、pGV1147(TDH3启动子和Cb-etfA)、和pGV1149(TDH3启动子和Cb-etfB)的EcoICRI至XhoI片段克隆入pGV1140、pGV1141、pGV1142、pGV1143的NotI(用Klenow填平)至XhoI位点以生成pGV1171(Ca-hbd+Ca-etfA)、pGV1172(Ca-crt+Ca-etfB)、pGV1173(Cb-hbd+Cb-etfA)、和pGV1174(Cb-crt+Cb-etfB)。类似地通过分别将来自pGV1151(TDH3启动子和Ca-bdhA)、pGV1152(TDH3启动子和Ca-bdhB)和pGV1153(TDH3启动子和Cb-adhA)的EcoICRI至XhoI片段克隆入pGV1150的(用Klenow填平)至XhoI位点以生成pGV1175(Cb-aldh+Ca-bdhA)、pGV1176(Cb-aldh+Ca-bdhB)、和pGV1177(Cb-aldh+Cb-adhA),将醛脱氢酶和醇脱氢酶组合。

    在经过密码子优化的基因的情况中,分别将来自pGV1210(TDH3启动子和Ca-bcd-co)、pGV1211(TDH3启动子和Ca-etfA-co)、pGV1212(TDH3启动子和Ca-etfB-co)的EcoICRI至XhoI片段克隆入pGV1207、pGV1208、和pGV1209的BamHI(用Klenow补平)至XhoI位点以生成pGV 1220(Ca-thl-co+Ca-bcd-co)、pGV1217(Ca-hbd-co+Ca-etfA-co)、和pGV1218(Ca-crt-co+Ca-etfB-co)。分别将来自pGV1214(TDH3启动子和Me-bcd-co)、pGV1215(TDH3启动子和Me-etfA-co)、pGV1216(TDH3启动子和Me-etfB-co)的EcoICRI至XhoI片段克隆入同一组载体以生成pGV1224(Ca-thl-co+Me-bcd-co)、pGV 1221(Ca-hbd-co+Me-etfA-co)、和pGV1222(Ca-crt-co+Me-etfB-co)。另外,将来自pGV1210(TDH3启动子和Ca-bcd-co)和来自pGV1214(TDH3启动子和Me-bcd-co)的EcoICRI至XhoI片段克隆入pGV1138的BamHI(用Klenow补平)至XhoI位点以生成pGV1223(ERG10+Ca-bcd-co)和pGV1219(ERG10+Me-bcd-co)。

    在上述途径之外,生成了利用bcd/etfA/etfB复合物的替代物,即反式-烯酰还原酶和巴豆酰-CoA还原酶的构建体。自丙酮丁醇梭菌(Ca-ter)、嗜水气单胞菌(Ah-ter)、和纤细眼虫(Eg-ter)克隆了反式-烯酰还原酶基因,而且自山丘链霉菌(Streptomyces collinus)(Sc-ccr)克隆了巴豆酰-coA还原酶。使用设计成刚好在起始密码子上游引入SalI位点和刚好在终止密码子下游引入NotI位点的引物,自丙酮丁醇梭菌基因组DNA PCR扩增了Ca-fer。使用设计成刚好在起始密码子的上游引入SalI位点和刚好在终止密码子的下游引入BamHI位点的引物,分别自pGV1114、pGV1115、和pGV1166PCR扩增了Ah-ter、Eg-ter、和Sc-ccr。这三种基因的序列已经为大肠杆菌中的表达进行了密码子优化。还有,Eg-ter序列编码缺失可能牵涉线粒体定位的N-末端区域的蛋白质。使用适宜的限制酶将相应的PCR产物克隆入pGV1103以生成pGV1155(Ca-ter)、pGV1156(Ah-ter)、pGV1157(Eg-ter)和pGV1158(Sc-ccr)。

    为了用于在酵母中表达丁醇途径,将bcd/etfA/etfB复合物的这些替代物中每一种与硫解酶基因在一个质粒上组合。将Ca-ter、Ah-ter、Eg-ter和Sc-ccr基因与Ca-thl-co基因组合,通过分别将来自pGV1155、pGV1156、pGV1157和pGV1158的EcoICRI至XhoI片段克隆入pGV1207的BamHI(用Klenow补平)至XhoI位点以生成pGV1225(Ca-thl-co+Ca-ter)、pGV 1226(Ca-thl-co+Ah-ter)、pGV1227(Ca-thl-co+Eg-ter)和pGV1228(Ca-thl-co+Sc-ccr)。

    实施例2:酵母提取物/Western印迹分析

    为了分析蛋白质表达,通过快速TCA沉淀方案制备粗制酵母蛋白质提取物。收集1个OD600当量的细胞并在冰上用200μL 1.85N NaOH/7.4%2-巯基乙醇处理10分钟。添加200μL 50%TCA并将样品在冰上再温育10分钟。通过以25,000rcf离心2分钟来收集所沉淀的蛋白质并用1ml冰冷的丙酮清洗。再次通过以25,000rcf离心2分钟来收集蛋白质。然后将沉淀物重悬于SDS样品缓冲液并煮沸(99℃)10分钟。将样品在离心机中以最大速离心30秒以清除不溶物。

    将样品通过SDS-PAGE分开并转移至硝酸纤维素。使用TMB Western印迹试剂盒(KPL)进行Western分析。HA.11、myc(9E10)、和AU1抗体得自Covance。如制造商所述的那样实施Westerns,只是在使用myc抗体时,使用补充有1%检测块粉(detector block powder)的0.3x至0.5x检测块溶液(detectorblock solution)。利用这种方法检验了实施例1中所描述的所有基因的表达。

    实施例3:酵母转化

    使用乙酸锂法(Gietz,R.D.a.R.A.W.,2002,Methods in Enzymology,350,87-96)进行了酿酒酵母(W303a)转化。简言之,将1ml过夜酵母培养物稀释入50mL新鲜YPD培养基并在30℃摇床中温育5-6小时。收集细胞,用50mL无菌水清洗,再用25mL无菌水清洗。用1mL 100mM乙酸锂重悬细胞并转移至微量离心管。通过离心10秒来沉淀细胞。丢弃上清液并将细胞重悬于4倍体积的100mM乙酸锂。将15μL细胞添加至DNA混合物(72μL 50%PEG、10μL 1M乙酸锂、3uL 10mg/ml变性鲑鱼精DNA、2μL每种期望的质粒DNA和无菌水至总体积100μL)。将样品于30℃温育30分钟并于42℃热激22分钟。然后通过离心10秒来收集细胞,重悬于100μL SOS培养基(Sambrook,J.,Fritsch,E.F.,Maniatis,T.,1989),并在不含尿嘧啶、色氨酸、亮氨酸或组氨酸的适宜SC选择板(Kaiser C,M.,S.和Mitchel,A,1994)上涂布。

    实施例4:正丁醇的生成

    对表达与所建议的丁醇生成途径有关的酶的不同组合的转化体(上文表1)评估正丁醇生成。如下制备隔离群的预培养物,即将来自SC琼脂板的少数菌落接种入3ml SC培养基(Kaiser C,M.,S.和Mitchel,A,1994),在需氧条件下于30℃以250rpm摇动16小时。将所得细胞以4000xg沉淀5分钟并重悬于500μlSC培养基。通过合适稀释度的600nm吸光度来评估细胞生长。对于所测试的每一种隔离群,将产生15个OD的细胞注射(200μl)入装有5ml先前已经用N2气饱和以消除溶解氧的SC厌氧培养基的厌氧balch管。将管于30℃温育,以250rpm摇动来防止细胞沉降。

    在接种后10、26、44和70小时对管取样,即用无菌注射器取出500μl培养物。之后,将250μl 40%葡萄糖溶液注射入每一个管以维持培养基中适量的碳。在每一个时间点,将所回收的样品离心以沉淀细胞,并立即冷冻上清液直至收集了所有样品。

    通过气相层析(GC)分析测定转化体的正丁醇生成。将所有冷冻样品于室温融化并将400μl每一种样品及作为内部对照添加的80μl 10mM戊醇通过0.2μm滤器过滤。将200μl所得滤出液置于GC管形瓶中并进行GC分析。在配备有HP-7673自动取样系统的带火焰离子化检测仪(FID)的系列II Plus气相层析仪上运行样品。基于可信标准品的保留时间来鉴定分析物,并使用5点校准曲线来定量。以1μl体积注射所有样品。在连接FID检测仪的DB-FFAP毛细管柱(30m长度,0.32mm ID,0.25μm薄膜厚度)上实施正丁醇产物的直接分析。用于将醇产物分开的温度程序为225℃注射器,225℃检测仪,50℃烤箱0分钟、然后8℃/分钟梯度至80℃、13℃/分钟梯度至170℃、50℃/分钟梯度至220℃、然后220℃3分钟。

    为了评估丁醇生成,测试了每一种质粒组合的两个独立转化体。上文表3总结了结果。“隔离群名称”下的两个Gevo名称指为每一种质粒组合所评估的两个独立转化体。

    下文(图6)显示了相对于仅用空载体即Gevo1110和Gevo1111转化的隔离群,最好的两种生产者即转化体Gevo1099和Gevo1102随时间变化所生成的丁醇量。Gevo1099和Gevo1102展现出丁醇生成随时间的升高,在接种后24-72小时丁醇浓度分别自123μM升高至313μM和自57μM升高至317μM。

    实施例5:大肠杆菌丙酮酸脱氢酶亚基在酿酒酵母中的克隆和表达

    此实施例的目的是描述如何自一起包含在大肠杆菌中找到的丙酮酸脱氢酶(PDH)的三种亚基的大肠杆菌克隆aceE、aceF、和lpdA基因。使用PCR自基因组DNA扩增这三种基因。此实施例还例示了这三种基因的蛋白质产物如何在宿主生物体即酿酒酵母中表达。

    使用大肠杆菌基因组DNA作为模板,通过PCR扩增来自大肠杆菌的lpdA基因。为了特异性扩增lpdA,使用引物Gevo-610和Gevo-611;制造商的试剂盒中供应了其它PCR扩增试剂,例如,KOD热启动聚合酶(Novagen,Inc.,产品目录#71086-5),并依照制造商的方案来使用。正向和反向引物分别掺入编码SalI和XhoI限制性内切核酸酶位点的核苷酸。将所得PCR产物用SalI和XhoI消化并克隆入pGV1103,产生pGV1334。对所插入的lpdA DNA完整测序。

    使用与上文所述类似的办法,将来自大肠杆菌的aceE和aceF基因插入pGV1334。使用引物Gevo-606和Gevo-607自大肠杆菌基因组DNA扩增aceE基因,用SalI+XhoI消化,并克隆入经SalI+XhoI切割的载体pGV1334,产生pGV1379。对aceE插入物完整测序。为了获得具有适合于酿酒酵母表达的不同原养型选择标志的质粒,作为SalI+XhoI片段自pGV1379克隆出aceE插入物并克隆入经SalI+XhoI切割的pGV1104,产生pGV1603。

    使用引物Gevo-653和Gevo-609自大肠杆菌基因组DNA扩增aceF基因。将所得1.9kb产物用SalI+XhoI消化并克隆入经相同酶切割的载体pGV1334,产生pGV1380。对aceF插入物完整测序。为了获得具有适合于酿酒酵母表达的不同选择标志的质粒,自pGV1380克隆出aceF插入物并克隆入pGV1105,产生pGV1604。

    为了在酿酒酵母中表达这些蛋白质,用pGV1334、pGV1603、和pGV1604的任意组合转化酿酒酵母菌株Gevo1187(CEN.PK),并在适宜淘汰培养基(dropout media)上选择转化体,正如实施例3中所描述的。作为对照,用相应的空载体即pGV1103、pGV1104、和pGV1105分别转化细胞。如下对自转化体培养得到的培养物测定LpdA、AceE、或AceF表达,即制备粗制酵母蛋白质提取物并通过Western印迹分析它们(基于检测每一种蛋白质中所存在的Myc表位),正如实施例2中所描述的。

    实施例6:自基因组DNA克隆酿酒酵母PDH亚基,消除内源线粒体靶向序列的修饰,和它们在酿酒酵母细胞中的表达

    在大多数真核生物中,丙酮酸脱氢酶(PDH)复合物定位在线粒体内部。凭借它们在它们的N-末端区域中含有通常称作线粒体靶向序列的20-40个左右的氨基酸,包含PDH的各种蛋白质被引向进入线粒体。这样的序列的存在可通过实验或计算(例如通过程序MitoProt:http://mips.qsf.de/cqi-bin/proi/medqen/mitofilter)来测定。蛋白质成功输入线粒体后发生特异性蛋白水解切割,靶向序列被消除,导致“经过切割的”输入形式。众所周知,通过遗传改变蛋白质的编码序列自该蛋白质消除这样的序列引起该蛋白质变得不能够移行入线粒体。如此,一种用于将正常情况中在线粒体中的蛋白质改向进入胞质溶胶的诱人策略牵涉只表达编码蛋白质在线粒体输入和后续蛋白酶切割之后剩余的“经过切割的”部分的那部分基因。

    此实施例的目的是描述构成酿酒酵母丙酮酸脱氢酶复合物的数种基因的克隆,及这些基因在酿酒酵母细胞培养物中的表达和检测。

    通过PCR克隆编码PDH各亚基的数种基因,其基本上使用实施例5中所描述的规程,只是模板是酿酒酵母基因组DNA。表1中显示了要扩增的酿酒酵母基因和所使用的相应引物。

    为了生成编码预测定位在胞质溶胶中的蛋白质的基因,每一对引物(表1中所列举的)中所列举的第一种引物设计成扩增每一种基因中预测编码线粒体靶向序列的那部分下游的区域。使用用于扩增每一种基因的引物中所编码的独特限制酶位点,将所得PCR产物克隆入载体pGV1103,产生表2中所列举的质粒。对每一种插入物完整测序。为了测试每一种基因的表达,仅用pGV1381、pGV1383、pGV1384、或pGV1385中每一种转化酿酒酵母菌株Gevo1187(CEN.PK),其基本上遵循实施例3中所描述的规程,并在SC-his限定的淘汰培养基上选择HIS+菌落。通过溶胞物制备和和Western印迹(用以检测每一种蛋白质中所存在的Myc标签)来测定蛋白质表达,正如实施例2中所描述的。

    实施例7:酿酒酵母亚基LPD1的克隆和表达及其在酿酒酵母细胞中的表达

    此实施例描述了如何通过PCR自酿酒酵母基因组DNA克隆基因LPD1,及如何检测LPD1在宿主酿酒酵母细胞中的表达。

    在PCR反应中使用引物Gevo-658加Gevo-659扩增缺乏那些预测编码线粒体靶向序列的核苷酸的Lpd1可读框,基本上如实施例5中所描述的。将1.5kb产物用XhoI+BamHI消化并克隆入经相同限制酶切割的pGV1103。将所得克隆pGV1103-1pd1转化入Gevo1187并通过HIS+原养型来选择所得菌落,基本上如实施例3中所描述的。培养含有pGV1103-1pd1的细胞的培养物并如下检测LPD1表达,即收获细胞,接着是Western印迹(针对蛋白质上所存在的Myc标签),基本上如实施例2中所描述的。

    实施例8:大肠杆菌PDH亚基的克隆及其在乳酸克鲁维酵母中的表达

    某些酵母,尤其是那些已知是“Crabtree阴性”,提供了作为生产宿主的独特优点。与在需氧条件下将过量葡萄糖发酵成乙醇的Crabtree阳性菌株(例如酿酒酵母)不同,Crabtree阴性菌株(诸如克鲁维酵母属的那些)取而代之地会经TCA循环来代谢葡萄糖以生成生物质。因此,Crabtree阴性酵母耐受所谓的葡萄糖异化PDH旁路路径的灭活(例如通过删除KIPDC1基因)(在需氧生长期间)。

    以下实施例描述了如何将编码大肠杆菌PDH的三种亚基的基因克隆入适合于在酵母乳酸克鲁维酵母中表达的载体,以及还有如何检测那些基因的表达。

    如实施例5中所述PCR扩增大肠杆菌基因lpdA、aceE、和aceF。将所得PCR产物用SalI+XhoI消化并分别克隆入均经SalI+XhoI切割的载体pGV1428、pGV1429、和pGV1430。这些步骤产生了质粒pGV1428-lpdA、pGV1429-aceE、和pGV1430-aceF。对每一种插入物完整测序。依照已知方法(例如Kooistra R,Hooykaas PJ,Steensma HY.(2004)Yeast.15;21(9):781-92)用这些质粒之一或任意组合转化乳酸克鲁维酵母菌种(例如Gevo1287),并通过适宜的原养型来选择所得菌落。如实施例2中所述使用粗制酵母蛋白质提取物和Western印迹分析(基于检测每一种蛋白质中所存在的Myc表位)对自转化体培养得到的培养物测定LpdA、AceE、或AceF表达。

    实施例9:过表达PDH亚基的细胞中PDH活性的测量

    此实施例的目的是描述如何通过体外测定法的手段来测量PDH活性。

    文献中记载了对细胞溶胞物中PDH活性定量的方法(Wenzel TJ等(1992).Eur J Biochem 209(2):697-705)。此方法利用自富含线粒体的细胞级分衍生的溶胞物。此方法的一个不同实施方案利用自全细胞获得的细胞溶胞物作为PDH来源。此类溶胞物是如先前(实施例2)所述制备的。此测定方法的另一个实施方案使用自高度富含胞质(非线粒体)蛋白质的细胞级分衍生的细胞溶胞物。此生物化学分级会降低内源线粒体PDH在测定法中的贡献。制备此类富集溶胞物的方法是商品化的且本领域技术人员公知的(例如线粒体/胞质溶胶分级试剂盒,Bio Vision,Inc.,Mountain View,CA)。

    在另一个实施方案中,借助一种或多种表达质粒中所编码的Myc表位标签的存在自细胞免疫纯化PDH活性。免疫纯化带表位标签的蛋白质的方法是本领域技术人员公知的(例如Harlow和Lane,Antibodies:A Laboratory Manual,(1988)CSHL Press)。经过免疫纯化的PDH复合物如此有别于内源复合物并充当前述PDH体外测定法中的活性来源。

    实施例10:过表达PDH的细胞中增加的胞内乙酰-CoA的测量

    此实施例的目的是描述如何能在一群培养的酵母细胞中测量乙酰-CoA(即PDH的产物)的胞内水平。

    为了测量胞内乙酰-CoA,对那些携带表达整套PHD基因所必需的适宜质粒组合(例如pGV1334、pGV1603、和pGV1604)的酵母转化体评估细胞乙酰-CoA水平,与只含载体的对照转化体(例如pGV1103、pGV1104、和pGV1105)进行比较。在摇瓶中在适当限定的淘汰培养基(例如SC-His、-Leu、-Trp)中将酵母细胞培养至饱和。测定培养物的光密度(OD600)并通过以2800xg离心5分钟来沉淀细胞。使用珠式破碎仪(bead beater)裂解细胞并将溶胞物用于使用已建立方法(Zhang等,Connection of Propionyl-CoA Metabolism to PolyketideBiosynthesis in Aspergillus nidulans.Genetics,168:785-794)进行的蛋白质测定和乙酰-CoA测定分析。

    实施例11:大肠杆菌PDH亚基基因和丁醇生成途径在酿酒酵母中的共表达

    此实施例的目的是描述如何在宿主酿酒酵母中与那些构成丁醇生成途径的基因一起共表达编码大肠杆菌PDH亚基的基因。与丁醇生成途径一起共表达PDH会相对于只表达丁醇途径而胞质溶胶中没有异源表达的功能性PDH提高所生成的丁醇的产率。

    将所克隆的基因lpdA、aceE和aceF(见实施例5)亚克隆入丁醇途径基因质粒,具体是pGV1208、pGV1209和pGV1213(表2)。为此,将pGV1334、pGV1603和pGV1604均用限制酶EcoICRI+XhoI消化,并将所得释放的插入物连接入pGV1208、pGV1209和pGV1213,这些质粒经BamHI消化,用Klenow DNA聚合酶补平悬垂,然后经XhoI消化,所有这些操作均使用标准分子生物学方法(Sambrook,J.Fritsch,E.F.,Maniatis,T.,1989)。这些步骤分别产生了pGV1208-lpdA、pGV1209-aceE和pGV1213-aceF。将所得质粒与pGV1227一起转化入Gevo1187并选择HIS、LEU、TRP和URA原养型,所有操作基本上如实施例3中所描述的。使用经亲本质粒pGV1208加pGV1209加pVG1213加pGV1227转化的菌株作为对照,用以评估PDH共表达对丁醇生成的影响。丁醇生成是如实施例4中所述实施的。正丁醇产率大于10%。

    实施例12:在厌氧条件下或在过量NADH条件下功能性的一种PDH形式的生成

    此实施例的目的是描述在厌氧下有活性的,或在存在相对于正常需氧生长期间所存在的比要高的[NADH]/[NAD+]比时有活性的突变型PDH的分离。这样的突变型PDH是想要的,因为它可容许甚至在微需氧或厌氧条件下都有持续的PDH酶活性。

    先前(Kim,Y.等(2007).Appl.Environm.Microbiol.,73,1766-1771;美国专利申请No.11/949,724,完整收入本文)记载了获取和鉴定允许微需氧或厌氧活性的改变型式PDH的方法。

    实施例13:具有降低的丙酮酸脱羧酶活性或没有丙酮酸脱羧酶活性的酿酒酵母菌株中大肠杆菌PDH亚基基因和丁醇生成途径的共表达

    此实施例的目的是描述如何在具有降低的丙酮酸脱羧酶(PDC)活性或没有丙酮酸脱羧酶(PDC)的宿主酿酒酵母菌株中与构成丁醇生成途径的基因共表达编码大肠杆菌PDH亚基的基因。PDC和PDH二者利用并因此竞争可利用的丙酮酸池。尽管PDH的产物乙酰-CoA能直接被丁醇途径所利用,但是PDC的产物乙醛能被进一步还原成乙醇(经醇脱氢酶),丁醇发酵的一种不想要的副产物,或者能经乙醛脱氢酶加乙酰-CoA合酶的协同作用被转化成乙酰-CoA。如此,降低或消除PDC活性会提高在胞质溶胶中还过表达功能性PDH的细胞中丙酮酸变成丁醇的产率。

    pdc-酿酒酵母菌株的生成

    文献(例如Flikweert,M.T.等,(1996).Yeast 15;12(3):247-57;Flikweert MT等,(1999).FEMS Microbiol Lett.1;174(1):73-9;van Maris AJ等,(2004)ApplEnviron Microbiol.70(1):159-66)中记载了具有降低的PDC活性或没有PDC活性的酿酒酵母菌株,而且它们是本领域技术人员公知的。在一个实施方案中,缺乏所有PDC活性的酿酒酵母菌株具有基因型pdc1Δpdc5Δpdc6Δ。此类菌株缺乏可检测到的PDC活性,而且不能够在作为唯一碳源的葡萄糖上生长,但是能在生长培养基补充有作为替代碳源的乙醇或乙酸时存活。在另一个实施方案中,此菌株的衍生物已经进化成在葡萄糖上生长,葡萄糖是方便且常用的碳源。具有大大降低的PDC活性的菌株的第三个实施方案是有关基因型pdc2Δ的菌株,在文献(Flikweert MT等,(1999).Biotechnol Bioeng.66(1):42-50)中也有记载。任何这些菌株均能充当PDH加丁醇途径表达的有用宿主。在必要时,可以通过标准分子生物学手段和酵母遗传技术来工程化改造任何pdc-突变株,使得那些营养缺陷型标志可利用,使得能选择质粒pGV1208-lpdA、pGV1209-aceE、和pGV1213-aceF并在宿主细胞中稳定维持。此类遗传工程会通过破坏有关内源基因来发生,其通过基于URA3的破坏盒,及后续通过FOA反选择来消除URA3标志来实施。

    过表达PDH的pdc-菌株中的丁醇生成

    将所克隆的基因lpdA、aceE和aceF(见实施例5)亚克隆入丁醇途径基因质粒,具体是pGV1208、pGV1209和pGV1213(表2),基本上如实施例11中所描述的。

    将质粒组pGV1208-lpdA加pGV1209-aceE加pGV1213-aceF加pGV1227、或作为对照的组pGV1208加pGV1209加pGV1213加pGV1227转化入适宜的pdc-酵母突变株并在液体培养物中培养所得菌落。如实施例4中所述实施丁醇生成。正丁醇产率大于50%。

    有可能的是,具有降低的PDC活性或没有PDC活性的菌株会展现出显著的生长缺陷,并因此可能不得不补充另外的碳源(例如乙酸或乙醇)。因为pdc-酿酒酵母中的生长缺陷源自它们胞质乙酰-CoA池的缺失,所以预期PDH在胞质溶胶中的成功表达会生成足够的乙酰-CoA来挽救此生长缺陷。此类生长恢复可充当胞质溶胶中PDH活性的有用体内读出。

    实施例14:酿酒酵母中的pfl(丙酮酸甲酸裂合酶)和FDH1(甲酸脱氢酶)表达

    大肠杆菌pflB(无活性的丙酮酸甲酸裂合酶)和pflA(丙酮酸甲酸裂合酶活化酶)的克隆

    为了克隆大肠杆菌pflB和pflA,分别使用大肠杆菌基因组DNA和pflB_forw、PflB_rev和PflA_forw、PflA_rev引物扩增基因。为了克隆博伊丁氏假丝酵母FDH1(Cb-FDH1)基因,与fdh_forw和fdh_rev引物一起使用博伊丁氏假丝酵母的基因组DNA。利用分别掺入正向和反向基因扩增引物的限制性位点SalI和EcoRI,将所扩增的DNA连接到经SalI和EcoRI消化的pGV1103、pGV1104和pGV1102上,产生pGV1103pflA、pGV1104pflB和pGV1002fdh1。自所得质粒表达的蛋白质分别带myc、myc和HA标签。

    利用所得质粒(pGV1103pflA、pGV1104pflB和pGV1002fdh1)和载体(pGV1103、pGV1104和pGV1102)来转化酵母菌株Gevo1187,如实施例3所指出的,以生成表达PflA、PflB、Fdh1(PFL+)的转化体和对照(PFL-)转化体。通过HIS、TRP和URA原养型选择来选择这两组转化体。

    如实施例2中所述使用粗制酵母蛋白质提取物和Western印迹分析对所得转化体评估PflA、PflB和Cb-Fdh1表达。

    对那些被证实表达所有三种蛋白质的酵母转化体评估细胞乙酰-CoA水平,与只含载体的对照转化体进行比较。为此,以摇瓶形式在Sc-ura,his,trp培养基中培养PFL+和PFL-细胞。测定培养物的光密度(OD600)并通过以2800xrcf离心5分钟来沉淀细胞。使用珠式破碎仪裂解细胞并将溶胞物用于使用已建立方法(Zhang等,Connection of Propionyl-CoA Metabolism toPolyketide Biosynthesis in Aspergillus nidulans.Genetics,168:785-794)进行的蛋白质测定和乙酰-CoA测定分析。评估每mg细胞总蛋白质的乙酰-CoA量。

    为了评估PflA、PflB和Fdh1表达对正丁醇生成的影响,将pflA、pflB和Cb-FDH1亚克隆入含有pGV1208、pGV1209和pGV1213的丁醇途径基因(表1)。为此,使用标准分子生物学方法(Sambrook,J.Fritsch,E.F.,Maniatis,T.,1989),将pGV1103pflA、pGV1104pflB和pGV1002fdh1用EcoICRI+XhoI限制酶消化并连接入经BamHI(随后用Klenow补平末端)+XhoI消化的pGV1208、pGV1209和pGV1213以生成pGV1208PflA、pGV1209PflB和pGV1213Fdh1。将所得质粒与pGV1227一起转化入Gevo1187并选择His、Leu、Trp和Ura原养型。使用Gevo1110和Gevo1111作为对照隔离群(表1)。如实施例4中所述实施丁醇生成。正丁醇产率大于10%。

    实施例15:具有降低的丙酮酸脱羧酶活性或没有丙酮酸脱羧酶活性的酿酒酵母中的PflA、PflB和Fdh1表达

    如实施例14中所述进行大肠杆菌pflB(无活性的丙酮酸甲酸裂合酶)和pflA(丙酮酸甲酸裂合酶活化酶)和Cb-FDH1的克隆。

    利用所得质粒(pGV1103pflA、pGV1104pflB和pGV1002fdh1)和载体(pGV1103、pGV1104和pGV1102)来转化酿酒酵母(有关基因型:ura3、trp1、his3、leu2、pdc1、pdc5、pdc6)酵母菌株,如实施例3所指出的,以生成表达PflA、PflB、Cb-Fdh1的(PFL+)转化体和对照(PFL-)转化体。通过HIS、TRP和URA原养型选择来选择这两组转化体。

    如实施例2中所述使用粗制酵母蛋白质提取物和Western印迹分析对所得转化体评估PflA、PflB和Fdh1表达。

    如实施例14中所述,对那些被证实表达所有三种蛋白质的酵母转化体评估细胞乙酰-CoA水平,与只含载体的对照转化体进行比较。

    为了评估表达PflA、PflB和Fdh1对正丁醇生成的影响,将pGV1208PflA1、pGV1209PflB和pGV1213Fdh1与pGV1227一起转化入酿酒酵母(MAT A、ura3、trp1、his3、leu2、pdc1、pdc5、pdc6)并选择His、Leu、Trp和Ura原养型。使用Gevo1110和1111作为对照隔离群(表1)。如实施例4中所述实施丁醇生成。正丁醇产率大于50%。

    实施例16:具有降低的ADH1活性或没有ADH1活性的酿酒酵母中的Pfl和Fdh1表达

    大肠杆菌pflB(无活性的丙酮酸甲酸裂合酶)和pflA(丙酮酸甲酸裂合酶活化酶)的克隆

    如实施例14中所述进行大肠杆菌pflB(无活性的丙酮酸甲酸裂合酶)和pflA(丙酮酸甲酸裂合酶活化酶)和Cb-FDHI的克隆。

    如实施例3中所述,利用所得质粒(pGV1103pflA、pGV1104pflB和pGV1002fdh1)和载体(pGV1103、pGV1104和pGV1102)来转化酵母菌株Gevo1253(adh1Δ)以生成表达PflA、PflB、Fdh1的(PFL+)转化体和对照(PFL-)转化体。通过HIS、TRP和URA原养型选择来选择这两组转化体。

    如实施例2中所述使用粗制酵母蛋白质提取物和Western印迹分析对所得转化体评估PflA、PflB和Fdh1表达。

    如实施例14中所述对那些被证实表达所有三种蛋白质的酵母转化体评估细胞乙酰-CoA水平,与只含载体的对照转化体进行比较。

    为了评估过表达PflA、PflB和Fdh1对正丁醇生成的影响,将pGV1208PflA、pGV1209PflB和pGV1213Fdh1与pGV1227一起转化入Gevo1253并选择His、Leu、Trp和Ura原养型。使用Gevo1110和1111作为对照隔离群(表1)。如实施例4中所述实施丁醇生成。正丁醇产率大于10%。

    实施例17:自酿酒酵母克隆PDC1基因及其在酿酒酵母中的过表达

    此实施例的目的是描述在组成性有活性的启动子控制下克隆编码丙酮酸脱羧酶的基因,及描述这样的基因在酿酒酵母宿主细胞中的表达。

    在基本上如实施例5中所述实施的PCR反应中使用引物Gevo-639加Gevo-640自酿酒酵母基因组DNA扩增完整PDC1 ORF。将所得1.7kb产物用XhoI+BamHI消化并连接入经SalI+BamHI切割的载体pGV1106,产生pGV1389(见表2)。将插入物完整测序。

    为了在酿酒酵母中过表达Pdc1,用pGV1389转化酿酒酵母菌株Gevo1187(CEN.PK)并在SC-ura淘汰培养基上选择转化体,如实施例3中所描述的。使用粗制酵母蛋白质提取物和Western印迹分析(基于对重组表达蛋白质中所存在的Myc表位的检测)对自转化体培养得到的培养物测定Pdc1表达,如实施例2中所描述的。

    实施例18:克隆以容许丙酮酸脱羧酶基因的诱导型表达

    基因(例如丙酮酸脱羧酶)的组成性表达在培养物生长期间的某些点可能是不想要的,或可能对那些过表达细胞施加意外代谢或选择压力。如此,需要采用基因表达受调节的系统,由此感兴趣基因可主要在最佳时间表达以使培养物生长以及在后续发酵中的性能最大化。

    此实施例的目的是描述在可诱导调节的启动子控制下克隆编码丙酮酸脱羧酶的基因,及描述这样的基因在酿酒酵母宿主细胞中的表达。

    作为XbaI+BamHI片段释放pGV1389(见实施例19)中所存在的PDC1 ORF并克隆入经AvrII+BamHI消化的载体pGV1414,产生载体pGV1483。如此,载体pGV1483(表2)的特征在于酿酒酵母MET3基因启动子(SEQ ID NO:177)驱动PDC1基因的表达。MET3启动子在存在甲硫氨酸时在转录方面是沉默的,但是在甲硫氨酸水平落到某阈值以下时变得有活性。将质粒pGV1483转化入Gevo1187并通过SC-ura培养基上的选择来鉴定转化体,如实施例3中所描述的。培养携带pGV1483的Gevo1187的培养物并测定PDC1表达,基本上如实施例2中所描述的。

    在此实施例的另一个实施方案中,PDC1基因在酿酒酵母铜诱导的CUP1基因启动子(SEQ ID NO:178)控制下表达。首先,在基本上如实施例5中所述的反应中使用引物通过PCR自酿酒酵母基因组DNA扩增CUP1基因启动子。将PCR产物用SacI+SalI消化并插入经SacI+SalI切割的pGV1106,产生pGV1388。对所插入的CUP1启动子序列完整测序。接着,将来自pGV1389、含有PDC1基因的XbaI+BamHI片段插入经AvrII+BamHI消化的pGV1388,产生pGV1388-PDC1。将质粒pGV1388-PDC1转化入Gevo1187,如实施例3中所描述的,并在缺少铜的SC-ura限定培养基上鉴定转化体。在没有补充铜的SC-ura培养基中培养转化细胞的培养物,直至它们达到OD600>0.5,那时添加硫酸铜至终浓度0.5mM。将培养物根据需要再培养24小时至48小时,然后通过Western印迹测定Pdc1表达,基本上如实施例2中所描述的。

    实施例19:测量过表达丙酮酸脱羧酶的酵母细胞的培养物中所生成的PDC活性的体外测定法

    此实施例的目的是描述对于测定细胞(特别是来自过表达PDC酶的一群细胞)中所存在的总丙酮酸脱羧酶活性有用的体外测定法。

    用于测量来自总细胞溶胞物的PDC活性的测定法已有记载而且是本领域技术人员公知的(Maitra PK和Lobo Z.1971.J Biol Chem.25;246(2):475-88;Schmitt HD和Zimmermann FK.1982.J Bacterid.151(3):1146-52;Eberhardt等,(1999)Eur.J.Biochem.262(1),191-201)。

    在此实施例的另一个实施方案中,如下测量通过如实施例17和18中所述表达PDC所生成的PDC活性,即首先使用针对PDC的特异性抗体或使用针对如实施例RF20和RF21中所表达的过表达的(但不是内源的)PDC中所存在的Myc表位标签的抗体免疫沉淀PDC。用于特异性免疫沉淀复合物混合物中所存在的蛋白质的方法是本领域技术人员公知的(例如Harlow和Lane,1988,Antibodies:A Laboratory Manual,CSHL Press)。然后免疫沉淀的PDC复合物充当要使用前述测定法测定的材料的来源。此方法如此容许异源的、过表达的PDC的特异性测定。

    实施例20:还含有功能性丁醇生成途径的酿酒酵母中PDC过表达引起的升高的丁醇生产率

    此实施例的目的是例示PDC过表达如何提高还表达丁醇生成途径的酿酒酵母培养物中的丁醇生产率。

    过表达PDC基因的酿酒酵母菌株先前已有记载(van Hoek等,(1998).ApplEnviron Microbiol.64(6):2133-40)。这些实验揭示了(1)酿酒酵母中的内源PDC水平虽然占总细胞蛋白质的高达3.4%,仍能通过过表达构建体的存在而进一步提高;和(2)处于高生长速率的过表达PDC的培养物的发酵能力(乙醇生成的最大比速率)相对于对照菌株升高。这些结果提示PDC在某些生长条件下的过表达会提高经由异源提供的丁醇生成途径的通量。

    为了在存在丁醇途径的情况中过表达PDC基因,通过SpeI消化自pGV1389切出PDC1基因,用Klenow DNA聚合酶片段将切出的DNA悬垂补平,然后用XhoI消化载体。将片段插入pGV1213(此载体经BamHI消化,用Klenow酶补平切过的末端,然后用XhoI消化),产生质粒pGV1605。将质粒pGV1605或pGV1057(Mumberg,D.,等(1995)Gene 156:119-122)与质粒pGV1208、pGV1209、和pGV1213一起转化入Gevo1187,基本上如实施例3中所述,并选择His、Leu、Trp、和Ura原养型。实施发酵以生成丁醇,如实施例4中所述测量。包含pGV1605导致比前述发酵中包含pGV1057及质粒pGV1208、pGV1209、和pGV1213更高的丁醇生产率(每单位时间所生成的丁醇量)。正丁醇产率大于5%。

    实施例21:具有降低的醇脱氢酶活性且还含有功能性丁醇生成途径的酿酒酵母细胞中PDC过表达引起的升高的丁醇生产率

    此实施例的目的是演示如何通过在醇脱氢酶(ADH)活性缺陷的酵母菌株中在存在丁醇生成途径的情况中过表达PDC基因来获得增强的丁醇生产率。

    由PDC自丙酮酸生成的乙醛有两种主要命运:它能通过乙醛脱氢酶和乙酰-CoA合酶的作用被进一步代谢成乙酰-CoA,它然后可以作为丁醇合成途径的有用底物;或者,它能通过醇脱氢酶(ADH)的作用通过还原过程被进一步代谢成乙醇。因此,降低或消除ADH(尤其是那些偏爱乙醛的ADH酶)会降低或消除这种不想要的乙醛异化路径并提高丁醇途径可利用的乙酰-CoA池。

    同时将质粒pGV1208、pGV1209、pGV1213、和pGV1605共转化入菌株Gevo1187(其具有有关基因型ADH1+)或菌株Gevo1266(其具有有关基因型adh1Δ)。对转化菌落选择His、Leu、Trp、和Ura原养型,基本上如实施例3中所描述的。实施发酵以生成丁醇,如实施例4中所述测量。正丁醇产率大于10%。菌株Gevo1266(adh1Δ)展现出比在菌株Gevo1187(ADH1+)中实施的平行发酵改善的丁醇产率。

    实施例22:具有降低的醇脱氢酶活性且表达功能性丁醇生成途径的乳酸克鲁维酵母细胞中PDC过表达引起的升高的丁醇产率

    此实施例的目的是描述具有大大降低的ADH活性或没有ADH活性的乳酸克鲁维酵母菌株中的丁醇生成。预测这样的菌株中表达丁醇途径会产生比在具有ADH活性的菌株中表达丁醇途径显著更大的丁醇产率每输入葡萄糖。

    具有降低的醇脱氢酶活性的乳酸克鲁维酵母菌株的生成。

    转化乳酸克鲁维酵母的细胞和破坏乳酸克鲁维酵母中的基因的方法(即用选择标志替换功能性可读框,接着后续消除标志)先前已有记载(Kooistra R,Hooykaas PJ,Steensma HY.(2004)Yeast.15;21(9):781-92)。乳酸克鲁维酵母具有四种编码ADH酶的基因,其中两种(即KIADH1和KIADH2)定位于胞质。文献(Saliola,M.,等,(1994)Yeast 10(9):1133-40)中已经记载了删除了这所有四种基因的乳酸克鲁维酵母突变衍生物(称作乳酸克鲁维酵母adh0),以及理想地培养这种菌株所要求的培养条件。这种办法的一种备选型式采用赋予对药物G418/遗传霉素(geneticin)的抗性的标志,例如如kan基因所提供的。这样的办法是有用的,因为它留下URA3标志可供用作后续转化中的选择标志。

    乳酸克鲁维酵母adh0菌株中丁醇表达途径的表达

    同时将质粒pGV1208、pGV1209、pGV1213、和pGV1605共转化入菌株Gevo1287(其是ADH+)或adh0菌株。对转化菌落选择His、Leu、Trp、和Ura原养型。实施发酵以生成丁醇,如实施例4中所述测量。正丁醇产率大于10%。菌株Gevo1287生成比在其它方面同基因的adh0菌株中实施的平行发酵显著更多的丁醇。

    实施例23:酿酒酵母中的ALD6过表达

    为了克隆酿酒酵母的ALD6基因,采用两步融合PCR法,其消除内部SalI限制酶位点以便于后续分子生物学操作。使用引物对Gevo-643+Gevo-644和Gevo-645+Gevo-646及作为模板的酿酒酵母基因组DNA生成跨越酿酒酵母ALD6基因序列的两种交叠PCR产物。用SalI+BamHI消化所得PCR片段并连接入经类似限制性消化的pGV1105和pGV1101以生成pGV1321和pGV1326。随后,亚克隆ALD6,即用EcoICRI+XhoI消化pGV1321和pGV1326并分别连接入BamHI(并随后用Klenow补平末端)+XhoI消化的pGV1209和pGV1208以生成pGV1339和pGV1399。

    分别利用所得质粒(pGV1339和pGV1399)和载体(pGV1105和pGV1101)来转化酵母菌株Gevo1187,如实施例3中所描述的,以生成过表达ALD6的(“Ald6+”)转化体或对照转化体。通过在适宜淘汰培养基中选择TRP和LEU原养型来选择这两组转化体。

    使用粗制酵母蛋白质提取物和Western印迹分析对所得转化体评估Ald6表达,如实施例2中所描述的。

    对那些被证实表达Ald6蛋白的酵母转化体评估增强的乙醛脱氢酶活性,与只含载体的对照转化体进行比较。为此,在摇瓶中在适宜的淘汰培养基中培养Ald6+和对照细胞。测定培养物的光密度(OD600)并通过以2800xg离心5分钟来沉淀细胞。使用珠式破碎仪裂解细胞并将溶胞物用于使用已建立方法(例如Van Urk等,Biochim.Biophys.Acta.191:769)进行的蛋白质测定和醛脱氢酶活性分析。

    为了评估过表达Ald6对正丁醇生成的影响,将pGV1339与pGV1208、pGV1227和pGV1213一起转化入Gevo1187并选择His、Leu、Trp和Ura原养型。使用Gevo1110和1111作为对照隔离群(表1)。如实施例4中所述实施丁醇生成。正丁醇产率大于5%。

    实施例24:没有醇脱氢酶I活性(adh1Δ)的酿酒酵母中的Ald6过表达

    如实施例23中所述实施ALD6基因的克隆。

    如实施例3中所述分别利用所得质粒(pGV1339和pGV1399)和载体(pGV1100和pGV1101)来转化酵母菌株Gevo1253以生成过表达Ald6+的转化体和对照转化体。在适宜的淘汰培养基上选择这两组转化体。

    如实施例2中所述使用粗制酵母蛋白质提取物和Western印迹分析对所得转化体评估Ald6表达。

    如实施例23中所述对那些被证实表达Ald6蛋白的酵母转化体评估增强的乙醛脱氢酶活性。

    为了评估过表达对正丁醇生成的后果,将pGV1339与pGV1209、pGV1227和pGV1213一起转化入Gevo1253并选择His、Leu、Trp和Ura原养型。使用Gevo1110和1111作为对照隔离群(表1)。如实施例4中所述实施丁醇生成。正丁醇产率大于10%。

    实施例25:乙酰-CoA合酶基因在酿酒酵母中的过表达

    此实施例的目的是描述编码乙酰-CoA合酶活性的基因的克隆,及这样的基因在宿主酿酒酵母细胞中的表达。具体而言,酿酒酵母基因ACS1或ACS2任一或二者编码乙酰-CoA合酶活性。

    为了克隆ACS1和ACS2基因,利用作为模板的酿酒酵母基因组DNA,及引物Gevo-479+Gevo-480(ACS1)和Gevo-483+Gevo-484(ACS2),每一组分别在正向和反向引物中含有SalI和BamHI限制性位点。将所得PCR片段用SalI+BamHI消化并连接入经类似限制性消化的pGV1101和pGV1102以生成pGV1262和pGV1263。随后,亚克隆ACS1和ACS2,即用EcoICRI+XhoI消化pGV1262和pGV1263并连接入经BamHI(且随后用Klenwo补平末端)+XhoI消化的pGV1213以生成pGV1319和pGV1320。

    如实施例3中所述分别利用所得质粒pGV1262和pGV1263及载体pGV1101和pGV1102来转化酵母菌株Gevo1187以生成过表达ACS1+、ACS2+的转化体和对照转化体。通过LEU、URA原养型选择来选择这两组转化体。如实施例2中所述使用粗制酵母蛋白质提取物和Western印迹分析对转化体评估Acs1或Acs2表达。

    对那些被证实表达Acs1或Acs2蛋白的酵母转化体评估增强的乙酰-CoA合酶活性,与只含载体的对照转化体进行比较。为此,以摇瓶型式在SC-LEU、URA培养基中培养ACS1+或ACS2+和对照细胞。测定培养物的光密度(OD600)并通过以2800xrcf离心5分钟来沉淀细胞。使用珠式破碎仪裂解细胞并将溶胞物用于使用已建立方法(Van Urk等,Biochim.Biophys.Acta.191:769)进行的蛋白质测定和乙酰-CoA合酶活性分析。

    为了评估Acs1或Acs2过表达对正丁醇生成的影响,将pGV1319和1320与pGV1208、pGV1209和pGV1227一起转化入Gevo1187并选择His、Leu、Trp和Ura原养型。使用Gevo1110和1111作为对照隔离群(表1)。如实施例4中所述实施丁醇生成。正丁醇产率大于5%。

    实施例26:没有醇脱氢酶I活性(adh1Δ)的酿酒酵母细胞中乙酰-CoA合酶的过表达

    如实施例25中所述克隆酿酒酵母的ACS1和ACS2基因。

    如实施例3中所述分别利用所得质粒pGV1262和pGV1263及载体pGV1101和pGV1102来转化酵母菌株Gevo1253以生成过表达ACS1+、ACS2+的转化体和对照转化体。通过LEU、URA原养型选择来选择这两组转化体。如实施例25中所述使用粗制酵母蛋白质提取物和Western印迹分析对转化体评估Acs1或Acs2表达。

    如实施例26中所述对那些被证实表达Acs1或Acs2蛋白的酵母转化体评估增强的乙酰-CoA合酶活性。

    为了评估过表达Acs1或Acs2对丁醇生成的影响,将pGV1319和1320与pGV1208、pGV1209和pGV1227一起转化入Gevo1253并选择His、Leu、Trp和Ura原养型。使用Gevo1110和1111作为对照隔离群(表1)。如实施例4中所述实施丁醇生成。正丁醇产率大于5%。

    实施例27:ALD6、ACS1和ACS2在酿酒酵母中的过表达

    如实施例23和25中所述克隆ALD6、ACS1和ACS2基因。

    如实施例3中所述分别利用所得质粒pGV1321和pGV1262或pGV1263和载体pGV1105和pGV1102来转化酵母菌株Gevo1187以生成过表达ALD6+ACS1+、ALD6+ACS2+的转化体和对照转化体。通过LEU和URA原养型选择来选择这两组转化体。

    对转化体ALD6+ACS1+和ALD6+ACS2+评估增强的乙酰-CoA合酶活性,与只含载体的对照转化体进行比较。为此,如实施例25中所述以摇瓶型式在SC-LEU、URA培养基中培养ALD6+ACS1+、ALD6+ACS2+和对照细胞。

    为了评估Ald6加Acs1或Acs2的过表达如何导致更高的丁醇生成,将Gevo1187用pGV1208、pGV1339、pGV1227和pGV1319或1320转化并选择His、Leu、Trp和Ura原养型。使用Gevo1110和1111作为对照隔离群(表1)。如实施例4中所述评估丁醇生成。正丁醇产率大于5%。

    实施例28:没有醇脱氢酶I活性(adhlΔ)的酿酒酵母中的ALD6加ACS1或ACS2过表达

    如实施例23和25中所述克隆ALD6、ACS1和ACS2基因。

    如实施例3中所述分别利用所得质粒pGV1321和pGV1262或pGV1263及载体pGV1105和pGV1102来转化酵母菌株Gevo1253(ΔADH1)以生成过表达ALD6+ACS1+或ALD6+ACS2+的菌株或对照转化体。通过LEU和URA原养型选择来选择这两组转化体。

    对转化体ALD6+ACS1+或ALD6+ACS2+评估增强的乙酰-CoA合酶活性,与只含载体的对照转化体进行比较。为此,如实施例25中所述以摇瓶型式在SC-LEU、URA培养基中培养ALD6+ACS 1+或ALD6+ACS2+和对照细胞。

    为了评估过表达SALD6和ACS1或ACS2对丁醇生成的影响,将Gevo1253用pGV1208、pGV1339、pGV1227和pGV1319或1320转化并选择HIS、LEU、TRP和URA原养型。使用Gevo1110和1111作为对照隔离群(表1)。如实施例4中所述实施丁醇生成。正丁醇产率大于10%。

    实施例29:将丁醇途径克隆入用于在克鲁维酵母属的酵母中进行表达的载体

    为了将丁醇途径基因克隆入适合于在菌株乳酸克鲁维酵母中进行表达的载体,通过SacI和NotI限制性消化自pGV1208、pGV1209和pGV1227释放hbd、Crt、Thl+TER并克隆入经类似消化的pGV1428、1429和1430以生成pGV1208KI、pGV1209KI和pGV1227KI。为了将ADHE2克隆入乳酸克鲁维酵母,将pGV1213用MluI和SacI消化并连接入经类似消化的pGV1431以生成pGV1213KI。将所得质粒pGV1208KI、pGV1209KI、pGV1227KI和pGV1213KI转化入乳酸克鲁维酵母(菌株Gevo1287;有关基因型:MATa、trp1、his3、leu2、ura3)并对转化体选择TRP、HIS、LEU和URA原养型(Kooistra R,Hooykaas PJ,Steensma HY.(2004)Yeast.15;21(9):781-92)。如实施例4中所述实施丁醇生成。

    实施例30:丙酮酸甲酸裂合酶和甲酸脱氢酶I在乳酸克鲁维酵母中的表达

    大肠杆菌pflB(无活性的丙酮酸甲酸裂合酶)和pflA(丙酮酸甲酸裂合酶活化酶)的克隆

    为了克隆大肠杆菌pflB和pflA,分别使用大肠杆菌基因组DNA和pflB_forw、PflB_rev和PflA_forw、PflA_rev引物扩增基因。为了克隆博伊丁氏假丝酵母FDH1基因,在PCR反应中使用作为模板的博伊丁氏假丝酵母的基因组DNA及fdh_forw和fdh_rev引物。利用分别掺入正向和反向基因扩增引物的限制性位点SalI和EcoRI,将所扩增的DNA连接到经SalI和EcoRI消化的pGV1428、pGV1429和pGV1430上,生成pGV1428pflA、pGV1429pflB和pGV1430fdh1。自所得质粒表达的蛋白质带myc标签,用以进行蛋白质表达研究。

    通过已知方法(Kooistra R,Hooykaas PJ,Steensma HY.(2004)Yeast.15;21(9):781-92)利用所得质粒(pGV1428pflA、pGV1429pflB和pGV1430fdh1)和载体(pGV1428、pGV1429和pGV1430)来转化酵母菌株乳酸克鲁维酵母(Gevo1287;有关基因型:MatA、trp1、his3、leu2和ura3)以生成表达PflA、PflB、Cb-Fdh1的(PFL+)转化体和对照(PFL-)转化体。通过HIS、TRP和LEU原养型选择来选择这两组转化体。

    如实施例2中所述使用粗制酵母蛋白质提取物和Western印迹分析对所得转化体评估PflA、PflB和Fdh1表达。

    对那些被证实表达所有三种蛋白质的酵母转化体评估细胞乙酰-CoA水平,与只含载体的对照转化体进行比较。为此,以摇瓶型式在SC-LEU、HIS、TRP培养基中培养PFL+和PFL-细胞。测定培养物的光密度(OD600)并以2800xrcf离心5分钟以沉淀细胞。使用珠式破碎仪裂解细胞并将溶胞物用于使用已建立方法(Zhang等,Connection of Propionyl-CoA Metabolism toPolyketide Biosynthesis in Aspergillus nidulans.Genetics,168:785-794)进行的蛋白质测定和乙酰-CoA测定分析。评估每mg细胞总蛋白质的乙酰-CoA量。

    为了评估PflA、PflB和Fdh1表达对丁醇生成的影响,将pflA、pflB和Cb-FDHI亚克隆入含有pGV1208KI、pGV1209KI、pGV1227KI和pGV1213KI的丁醇途径基因(表1)。为此,使用标准分子生物学方法(Sambrook,J.Fritsch,E.F.,Maniatis,T.,1989),将pGV1428pflA、pGV1429pflB和pGV1002fdh1用EcoICRI+XhoI限制酶消化并连接入经BamHI(随后用Klenow补平末端)+XhoI消化的pGV1208KI、pGV1209KI和pGV1213KI以生成pGV1208KIPflA、pGV1209KIPflB和pGV1213KIFdh1。将所得质粒与pGV1227KI一起转化入乳酸克鲁维酵母菌株(MATa、pdc1、trp1、his3、leu2 ura3)并选择His、Leu、Trp和Ura原养型。使用包含pGV1428、pGV1429、pGV1430和pGV1431的乳酸克鲁维酵母转化体作为对照隔离群。如实施例4中所述实施丁醇生成。正丁醇产率大于10%。

    实施例31:丙酮酸甲酸裂合酶和甲酸脱氢酶I在缺乏丙酮酸脱羧酶活性的乳酸克鲁维酵母中的表达

    如实施例30中所述克隆大肠杆菌pflB(无活性的丙酮酸甲酸裂合酶)和pflA(丙酮酸甲酸裂合酶活化酶)Cb-FDHI。

    通过已知方法(Kooistra R,Hooykaas PJ,Steensma HY.(2004)Yeast.15;21(9):781-92)利用所得质粒(pGV1428pflA、pGV1429pflB和pGV1430fdh1)和载体(pGV1428、pGV1429和pGV1430)来转化酵母菌株乳酸克鲁维酵母(MatA、pdc1、trp1、his3、leu2和ura3)以生成PflA、PflB、Cb-Fdh1的(PFL+)转化体和对照(PFL-)转化体。通过HIS、TRP和LEU原养型选择来选择这两组转化体。

    如实施例2中所述使用粗制酵母蛋白质提取物和Western印迹分析对所得转化体评估PflA、PflB和Cb-Fdh1表达。

    对那些被证实表达所有三种蛋白质的酵母转化体评估细胞乙酰-CoA水平,与只含载体的对照转化体进行比较。为此,如实施例30中所述以摇瓶型式在SC-LEU、HIS、TRP培养基中培养PFL+和PFL-细胞并评估。

    为了评估PflA、PflB和Fdh1的表达如何导致更高的丁醇生成,将pGV1208KIPflA、pGV1209KIPflB和pGV1213KIFdh 1与pGV1227KI一起转化入乳酸克鲁维酵母(MATa、pddΔ、trp1、his3、leu2、ura3)并选择His、Leu、Trp和Ura原养型。使用包含pGV1428、pGV1429、pGV1430和pGV1431的乳酸克鲁维酵母转化体作为对照隔离群。如实施例4中所述实施丁醇生成。正丁醇产率大于50%。

    实施例32:Pf1(丙酮酸甲酸裂合酶)和Fdh1(甲酸脱氢酶I)在缺乏Adh1活性的乳酸克鲁维酵母中的表达

    如实施例30中所述克隆大肠杆菌pflB(无活性的丙酮酸甲酸裂合酶)、pflA(丙酮酸甲酸裂合酶活化酶)和Cb-FDH1。

    通过已知方法(Kooistra R,Hooykaas PJ,Steensma HY.(2004)Yeast.15;21(9):781-92)利用所得质粒(pGV1428pflA、pGV1429pflB和pGV1430fdh1)和载体(pGV1428、pGV1429和pGV1430)来转化酵母菌株乳酸克鲁维酵母(MATa、trp1、his3、Leu2、ura3)以生成表达PflA、PflB1、Fdh1的(EcPFL+)转化体和对照(EcPFL-)转化体。通过HIS、TRP和LEU原养型选择来选择这两组转化体。

    如实施例2中所述使用粗制酵母蛋白质提取物和Western印迹分析对所得转化体评估PflA、PflB和Fdh1表达。

    对那些被证实表达所有三种蛋白质的酵母转化体评估细胞乙酰-CoA水平,与只含载体的对照转化体进行比较。为此,如实施例30中所述以摇瓶型式在SC-LEU、HIS、TRP培养基中培养EcPFL+和EcPFL-细胞并评估。

    为了评估PflA、PflB和Fdh1的表达如何导致更高的丁醇生成,将pGV1208KIPflA、pGV1209KIPflB和pGV1213KIFdh1与pGV1227KI一起转化入乳酸克鲁维酵母(MATa、adh1Δ、trp1、his3、leu2、ura3)并选择His、Leu、Trp和Ura原养型。使用包含pGV1428、pGV1429、pGV1430和pGV1431的乳酸克鲁维酵母转化体作为对照隔离群。如实施例4中所述实施丁醇生成。正丁醇产率大于20%。

    实施例33:KIALD6在乳酸克鲁维酵母中的过表达

    为了克隆KIALD6,在PCR反应中使用作为模板的乳酸克鲁维酵母基因组DNA及引物KIALD6_left5和KIALD6_right3(见表1),其它方面与实施例5中所述类似。前述引物分别包含SalI和BamHI限制性位点,将所得PCR片段用SalI+BamHI消化并连接入经类似限制性消化的pGV1428以生成pGV1428KLALD6。随后,亚克隆KIALD6,即将pGV1428ALD6用EcoICRI+XhoI消化并连接入经BamHI(随后用Klenow补平末端)+XhoI消化的pGV1208KI以生成pGV1208KIALD6。

    通过已知方法(Kooistra R,Hooykaas PJ,Steensma HY.(2004)Yeast.15;21(9):781-92)分别利用所得质粒pGV1428ALD6KI和载体pGV1428来转化酵母菌株乳酸克鲁维酵母(MATa、trp1、his3、leu2、ura3)以生成过表达KIALD6+和KIALD6-的转化体和对照转化体。通过HIS原养型选择来选择这两组转化体。

    如实施例2中所述使用粗制酵母蛋白质提取物和Western印迹分析对所得转化体KIALD6+和KIALD6-评估KIAld6表达。

    对那些被证实过表达KIAld6蛋白的乳酸克鲁维酵母转化体评估增强的乙醛脱氢酶活性,与只含载体的对照转化体进行比较。为此,如实施例23中所述以摇瓶型式在SC-HIS培养基中培养KIALD6+和KIALD6-细胞并评估。

    为了评估KIALD6的过表达如何导致更高的丁醇生成,将pGV1208KIALD6与pGV1209KI、pGV1227KI和pGV1213KI一起转化入乳酸克鲁维酵母(MATa、trp1、his3、leu2、ura3)并选择HIS、LEU、TRP和URA原养型。使用用pGV1428、pGV1429、pGV1430和pGV1431转化乳酸克鲁维酵母产生的转化体作为对照隔离群。如实施例4中所述实施丁醇生成。正丁醇产率大于5%。

    实施例34:醛脱氢酶在缺乏Adh1活性的乳酸克鲁维酵母中的过表达

    实施例33中记载了克鲁维酵母KIALD6基因的克隆。

    通过已知方法(Kooistra R,Hooykaas PJ,Steensma HY.(2004)Yeast.15;21(9):781-92)分别利用所得质粒pGV1428ALD6和载体pGV1428来转化酵母菌株乳酸克鲁维酵母(MATa、adh1Δ、trp1、his3、leu2、ura3)以生成过表达KIALD6+和KIALD6-的转化体和对照转化体。通过HIS原养型选择来选择这两组转化体。

    如实施例2中所述使用粗制酵母蛋白质提取物和Western印迹分析对所得转化体评估KIAld6表达。

    如实施例30中所述对那些被证实表达KIAld6蛋白质的乳酸克鲁维酵母转化体评估增强的乙醛脱氢酶活性。

    为了评估KIAld6的过表达如何导致更高的丁醇生成,将pGV1208KIALD6与pGV1209KI、pGV1227KI和pGV1213KI一起转化入乳酸克鲁维酵母(MATa、adh1Δ、trp1、his3、leu2、ura3)并选择HIS、LEU、TRP和URA原养型。使用用pGV1428、pGV1429、pGV1430和pGV1431转化乳酸克鲁维酵母产生的转化体作为对照隔离群。如实施例4中所述实施丁醇生成。正丁醇产率大于10%。

    实施例35:乙酰-CoA合酶基因在酵母乳酸克鲁维酵母中的过表达

    酵母乳酸克鲁维酵母基因组中的两种侧向同源基因(即KIACS1和KIACS2)编码乙酰-CoA活性。为了克隆KIACS1和KIACS2,利用作为模板的乳酸克鲁维酵母基因组DNA及引物KIACS1_left5+KIACS2_Right3(ACS1)和KIACS2_Left5+KIACS2_Right3(ACS2)(见表1),其分别在正向和反向引物中含有NotI+SalI和SalI+BamHI限制性位点。将所得PCR片段用适宜酶消化并连接入经类似限制性消化的pGV1429和pGV1431以生成pGV1429ACS1和pGV1431ACS2。随后,亚克隆KIACS1和KIACS2,即将pGV1429ACS1和pGV1431ACS2用SacId和NotI消化并连接入经类似消化的pGV1209KI和pGV1213KI以生成pGV1209KIACS1和pGVKIACS2。

    通过已知方法分别利用所得质粒pGV1429ACS1和pGV1431ACS2及空载体pGV1429和pGV1431来转化乳酸克鲁维酵母(MATa、trp1、his3、leu2、ura3)以生成过表达KIACS1+、KIACS2+和KIACS-蛋白的转化体和对照转化体。通过TRP、URA原养型选择来选择这两组转化体。如实施例2中所述使用粗制酵母蛋白质提取物和Western印迹分析对转化体评估KIAcs1和KIAcs2表达。

    对那些被证实表达KIAcs1和KIAcs2蛋白的酵母转化体评估增强的乙酰-CoA合酶活性,与只含载体的对照转化体进行比较。为此,如实施例25中所述以摇瓶型式在SC-TRP、URA培养基中培养KIACS1+、KIACS2+和KIACS-细胞并评估。

    为了评估KIACS1和KIACS2的过表达如何导致更高的丁醇生成,将pGV1209KIACS1和pGV1209KIACS2与pGV1208KI和pGV1227KI一起转化入菌株Gevo1287并对转化细胞选择His、Leu、Trp和Ura原养型。使用用pGV1428、pGV1429、pGV1430和pGV1431转化乳酸克鲁维酵母(MATa、trp1、his3、leu2、ura3)产生的转化体作为对照隔离群。如实施例4中所述实施丁醇生成。正丁醇产率大于5%。

    实施例36:乙酰-CoA合酶基因在缺乏Adh1活性的酵母乳酸克鲁维酵母中的过表达

    实施例35中记载了乳酸克鲁维酵母KIACSI和KIACS2基因的克隆。

    通过已知方法利用所得质粒pGV1429ACS1和pGV1431ACS2及空载体pGV1429和pGV1431来转化乳酸克鲁维酵母(MATa、adh1Δ、trp1、his3、leu2、ura3)以生成过表达KIACS1+和KIACS2+的转化体和对照转化体。通过TRP和URA原养型选择来选择这两组转化体。如实施例2中所述使用粗制酵母蛋白质提取物和Western印迹分析对转化体评估KIAcs1和KIAcs2表达。

    如实施例25中所述对那些被证实表达KlAcs1和KIAcs2蛋白的酵母转化体评估增强的乙酰-CoA合酶活性。

    为了评估KIACS1和KIACS2的过表达如何导致更高的丁醇生成,将pGV1209KIACS1和pGV1209KIACS2与pGV1208KI和pGV1227KI一起转化入乳酸克鲁维酵母(MatA、adh1、trp1、his3、leu2和ura3)。如实施例4中所述实施丁醇生成。正丁醇产率大于10%。

    实施例37:KIALD6和KIACS1或KIACS2在乳克鲁维氏酵母中的过表达

    如上文实施例33和35中所述克隆KIALD6、KIACS1和KIACS2基因。

    通过已知方法分别利用所得质粒pGV1428ALD6和pGV1429ACS1或pGV1430及载体pGV1428和pGV1429或pGV1430来转化乳酸克鲁维酵母(MATa、trp1、his3、leu2、ura3)以生成过表达KIALD6+KIACS1+、KIALD6+KIACS2+和KIALD-KIACS-的转化体和对照转化体。分别通过HIS、TRP和HIS、LEU原养型选择来选择这两组转化体。

    对转化体KIALD6+KIACS 1+和KIALD6+KIACS2+评估增强的乙酰-CoA合酶活性,与只含载体的对照转化体(ALD-ACS-)进行比较。为此,如实施例25中所述以摇瓶型式分别在SC-HIS、TRP和HIS、LEU培养基中培养KIALD6+KIACS1+、KIALD6+KIACS2+和KIALD-KIACS-细胞并评估。

    为了评估KIAld6和KIAcs1或KIAcs2的过表达如何导致更高的丁醇生成,将乳酸克鲁维酵母(MATa、trp1、his3、leu2ura3)用pGV1208KIALD6、pGV1209KIACS1或pGV1209KIACS2、pGV1227KI、pGV1213KI转化并选择HIS、LEU、TRP和URA原养型。使用用pGV1428、pGV1429、pGV1430和pGV1431转化乳酸克鲁维酵母(MATa、trp1、his3、leu2ura3)产生的转化体作为对照隔离群。如实施例4中所述实施丁醇生成。正丁醇产率大于5%。

    实施例38:KIALD6、KIACS1和KIACS2在缺乏KIAdh1活性(Kladh1Δ)的乳酸克鲁维酵母中的过表达

    如实施例33和35中所述克隆KIALD6、KIACS1和KIACS2基因。

    通过已知方法分别利用所得质粒pGV1428ALD6和pGV1429ACS1或pGV1430ACS2及载体pGV1428和pGV1429或pGV1430来转化乳酸克鲁维酵母(MATa、Kladh1Δtrp1、his3、leu2 ura3)以生成过表达KIALD6+KIACS1+、KIALD6+KIACS2+和KIALD-KIACS-的转化体和对照转化体。分别通过HIS、TRP和HIS、LEU原养型选择来选择这两组转化体。

    如实施例14中所述对转化体KIALD6+KIACS1+和KIALD6+KIACS2+评估细胞乙酰-CoA水平。

    为了评估KIAld6和KIAcs1或KIAcs2的过表达是否导致更高的丁醇生成,将乳酸克鲁维酵母(MATa、Kladh1Δtrp1、his3、leu2 ura3)用pGV1208KIALD6、pGV1209KIACS1或pGV1209KIACS2、pGV1227KI、pGV1213KI转化。如实施例4中所述实施丁醇生成。正丁醇产率大于10%。

    【序列表】

    <110>格沃股份有限公司(GEVO,INC.)

    <120>由代谢工程化酵母进行的丁醇生产

    <130>56836.830003.US1

    <150>60/871,427

    <151>2006-12-21

    <150>60/888,016

    <151>2007-02-02

    <150>60/928,283

    <151>2007-05-08

    <160>190

    <170>PatentIn version 3.4

    <210>1

    <211>1179

    <212>DNA

    <213>Ca-thl-co

    <400>1

    atgaaagaag ttgtaatagc tagcgcggtg cgtaccgcca ttggctctta tggtaaaagt     60

    ctgaaggatg ttccggcagt cgacttaggg gctacggcga tcaaagaagc cgtaaaaaag    120

    gcaggaatta aaccagagga tgtgaatgaa gttatcctgg gcaacgtcct gcaggctggt    180

    ttagggcaaa atcctgcgcg ccaggcctca tttaaagcag gactgccggt agagattcca    240

    gctatgacta tcaacaaggt gtgcggctcc ggtctgcgga cagtttcgtt agcggcccaa    300

    attatcaaag caggcgacgc tgatgtcatt atcgcgggtg ggatggaaaa tatgagccgt    360

    gccccttacc tggcaaacaa tgcgcgctgg ggatatcgta tgggcaacgc taaattcgtg    420

    gacgaaatga ttaccgatgg tctgtgggat gcctttaatg actaccatat gggcatcacg    480

    gcagagaaca ttgcggaacg ctggaatatc tctcgggagg aacaggatga gttcgcttta    540

    gccagtcaga agaaagcaga ggaagcgatt aaatcaggtc aatttaagga cgagatcgta    600

    ccggttgtga ttaaagggcg taaaggagaa actgtcgttg atacagacga acacccgcgc    660

    ttcggctcca ccattgaggg tctggctaag ctgaaaccag cctttaaaaa ggatgggacg    720

    gtaaccgcag gcaacgcgtc gggtttaaat gattgtgccg cagtgctggt catcatgagc    780

    gcggaaaaag ctaaagagct gggagttaag cctctggcca aaattgtgtc ttatggcagt    840

    gcgggtgtag acccggctat catggggtac ggcccgttct atgcaactaa agccgcgatt    900

    gaaaaggctg gttggacagt cgatgaatta gacctgatcg agtcaaacga agcatttgcc    960

    gcgcagtccc tggctgttgc aaaagattta aaattcgata tgaataaggt gaacgtaaat   1020

    ggaggcgcca ttgcgctggg tcatccaatc ggggcttcgg gagcacgtat tctggttacg   1080

    ttagtgcacg ccatgcaaaa acgcgacgcg aaaaagggcc tggctaccct gtgcatcggt   1140

    gggggccagg gtactgcaat attgctagaa aagtgctag                          1179

    <210>2

    <211>849

    <212>DNA

    <213>Ca-hbd-co

    <400>2

    atgaaaaagg tatgtgttat aggcgcggga accatgggta gcggtattgc ccaggcattt     60

    gctgcaaaag gtttcgaagt ggttctgcgt gatatcaagg acgagtttgt cgatcgcggc    120

    ttagacttca ttaataaaaa cctgtctaaa ctggtaaaga aagggaaaat cgaagaggcg    180

    acgaaggtgg aaattttaac tcggatcagt ggaacagttg atctgaatat ggccgctgac    240

    tgcgatctgg tcattgaagc ggccgtagag cgtatggata tcaaaaaaca aatttttgca    300

    gacttagata acatctgtaa gccggaaacc attctggctt caaatacgtc ctcgctgagc    360

    atcactgagg tggcgtctgc cacaaaacgc ccagacaaag ttattggcat gcatttcttt    420

    aaccctgcac cggtcatgaa gttagtggaa gtaatccgtg ggattgctac cagtcaggaa    480

    acgttcgatg cggttaaaga gacctcaatc gccattggaa aagacccagt ggaagtcgca    540

    gaggcgcctg gctttgttgt aaatcgcatt ctgatcccga tgattaacga agctgtggga    600

    atcctggccg aaggaattgc atccgtcgag gatatcgaca aggcgatgaa attaggcgct    660

    aatcacccga tgggtccact ggaactgggc gacttcattg gtctggatat ctgcttagcc    720

    attatggacg ttctgtattc ggagactggg gatagcaaat accggcctca tacactgtta    780

    aagaaatatg tgcgtgcagg atggctgggc cgcaaatctg gtaagggttt ctacgattat    840

    tcaaaataa                                                            849

    <210>3

    <211>786

    <212>DNA

    <213>Ca-crt-co

    <400>3

    atggaactaa acaatgtcat cctggaaaaa gagggcaagg tggcggttgt caccattaat     60

    cgtccgaaag ccttaaacgc actgaatagc gatacgctga aagaaatgga ctatgtaatc    120

    ggtgagattg aaaacgattc tgaagtgtta gctgttatcc tgactggggc gggagagaag    180

    agttttgtcg ccggcgcaga catttcagaa atgaaagaga tgaatacaat cgaaggtcgc    240

    aaattcggga ttctgggaaa caaggtattt cggcgtttag aactgctgga gaaaccagtg    300

    atcgctgcgg ttaatggctt cgccttaggt ggcggttgcg aaattgcaat gtcctgtgat    360

    atccgcattg cttcgagcaa cgcgcgtttt gggcagcctg aggtcggact gggcatcaca    420

    ccgggtttcg gcggtacgca acgcctgtct cggttagtgg ggatgggaat ggccaaacag    480

    ctgattttta ctgcacaaaa tatcaaggct gacgaagcgc tgcgtattgg cctggtaaac    540

    aaagttgtgg aaccaagtga gttaatgaat acagccaaag aaatcgcaaa caagattgtc    600

    tcaaatgcgc ctgttgctgt aaaactgtcc aaacaggcca ttaaccgcgg tatgcagtgc    660

    gatatcgaca ccgcactggc gttcgagtcg gaagcttttg gggaatgttt cagcacggag    720

    gaccaaaagg atgccatgac cgcatttatt gaaaaacgta aaattgaagg cttcaaaaat    780

    agatag                                                               786

    <210>4

    <211>1140

    <212>DNA

    <213>Ca-bcd-co

    <400>4

    atggatttta atttaacaag agaacaggaa ctggtccgtc agatggtacg tgaatttgca     60

    gaaaacgagg ttaaaccgat tgctgcagag attgatgaga ctgaacgctt cccgatggaa    120

    aacgtcaaaa agatgggtca gtatggcatg atgggcattc cgttctctaa agagtacggc    180

    ggtgcgggtg gcgacgttct gtcttatatc atcgctgtag aggaactgtc caaagtatgt    240

    ggcaccacgg gcgtgatcct gtccgcgcac acctctctgt gcgcaagcct gatcaacgaa    300

    cacggcaccg aggaacagaa gcaaaaatac ctggtcccgc tggccaaagg tgaaaagatc    360

    ggtgcatacg gtctgacgga accgaacgca ggtacggaca gcggcgcaca acagacggtt    420

    gcggtactgg aaggcgacca ctacgttatt aacggtagca aaatcttcat cacgaacggt    480

    ggcgtggctg acacctttgt tatcttcgcg atgaccgacc gcactaaagg cactaaaggt    540

    atctctgcgt tcatcatcga gaagggtttc aagggttttt ctatcggcaa agtggaacag    600

    aagctgggta tccgtgcctc ctctactacc gagctggttt tcgaagacat gattgtgccg    660

    gttgaaaata tgatcggcaa agaaggcaaa ggcttcccga tcgctatgaa aaccctggat    720

    ggcggccgta tcggcattgc agcacaggca ctgggtatcg cagaaggcgc tttcaacgaa    780

    gcacgtgcgt acatgaaaga acgtaaacag tttggccgtt ctctggataa atttcaaggc    840

    ctggcgtgga tgatggcaga catggacgta gcgattgaat ctgcgcgcta cctggtctat    900

    aaagcagctt acctgaaaca ggcaggtctg ccttacaccg ttgacgcagc acgtgcgaaa    960

    ctgcacgcgg ccaacgttgc catggatgtt accaccaaag ccgtgcaact gtttggcggt   1020

    tacggctata ctaaggatta tccggttgaa cgtatgatgc gtgacgcgaa aatcaccgaa   1080

    atctatgaag gtacttccga agtgcagaaa ctggtcattt caggaaaaat ttttagttaa   1140

    <210>5

    <211>1011

    <212>DNA

    <213>Ca-eftA-co

    <400>5

    atgaataaag cagattacaa gggcgtttgg gtctttgcgg aacagcgtga tggtgaactg     60

    cagaaagtgt ccctggaact gctgggcaaa ggcaaggaga tggcagaaaa actgggtgtt    120

    gaactgaccg cagttctgct gggtcacaac actgaaaaga tgtccaaaga cctgctgtcc    180

    catggcgcag acaaggtgct ggctgcggac aacgaactgc tggctcactt tagcaccgac    240

    ggttatgcaa aagtaatctg cgacctggtt aacgagcgca agccggaaat cctgttcatc    300

    ggcgccactt ttattggtcg cgacctgggc cctcgtattg ctgcgcgtct gtccactggc    360

    ctgactgcgg attgcacctc cctggacatt gatgttgaaa accgtgatct gctggcaact    420

    cgcccggcat tcggcggcaa cctgatcgcc accatcgtat gttccgacca ccgtccgcaa    480

    atggctactg tacgtccggg cgtatttgaa aagctgccgg tgaacgacgc aaacgtttcc    540

    gacgacaaaa tcgaaaaagt tgctatcaag ctgaccgcta gcgatatccg taccaaagtt    600

    tctaaagtag tgaaactggc gaaggacatc gcagatattg gtgaagcaaa agttctggtg    660

    gcaggcggtc gtggcgtcgg ttccaaagag aacttcgaaa aactggagga actggcgtct    720

    ctgctgggcg gtactattgc agcgtcccgt gcagcaatcg aaaaagaatg ggtggacaag    780

    gatctgcagg tgggccagac tggtaaaacc gttcgtccga ccctgtacat cgcctgcggc    840

    atctccggtg ctattcagca cctggccggc atgcaggaca gcgactacat catcgccatc    900

    aacaaagacg ttgaagctcc gatcatgaaa gtggcggacc tggcaatcgt tggtgacgtg    960

    aacaaagttg ttccggaact gatcgcgcag gttaaagctg ctaataatta a            1011

    <210>6

    <211>780

    <212>DNA

    <213>Ca-eftB-co

    <400>6

    atgaatatag ttgtttgttt aaaacaggtc ccggacaccg cagaagttcg tattgatcca     60

    gtaaagggta cgctgattcg cgagggcgtg ccgtctatca tcaacccaga tgacaagaac    120

    gccctggaag aagcactggt cctgaaagat aattacggcg ctcacgtaac tgttatctct    180

    atgggtccgc cgcaagcgaa aaatgcgctg gttgaagctc tggcgatggg cgctgacgag    240

    gctgttctgc tgactgatcg tgctttcggt ggtgcggaca ccctggccac ttcccacact    300

    atcgcggcag gtatcaagaa actgaaatat gacattgtgt ttgctggtcg tcaggctatt    360

    gacggtgaca cggcacaggt aggcccggaa atcgccgaac acctgggtat tccgcaggtg    420

    acctacgtag aaaaagtaga agtagacggt gataccctga aaatccgcaa agcatgggaa    480

    gatggctacg aggtggttga agtaaaaacc ccggtactgc tgaccgctat caaagagctg    540

    aatgtaccgc gttacatgtc tgttgagaaa atcttcggcg cgttcgacaa ggaagtaaag    600

    atgtggaccg ctgatgatat tgacgttgac aaagcgaatc tgggcctgaa gggctcccca    660

    actaaagtta agaagtcctc tactaaagaa gtgaagggtc agggtgaggt gattgataaa    720

    cctgttaaag aagctgctgc gtacgtggtt tctaagctga aagaagaaca ctatatttaa    780

    <210>7

    <211>2577

    <212>DNA

    <213>Ca-adhE2-co

    <400>7

    atgaaagtta caaatcaaaa agaactgaaa cagaagttaa atgagctgcg tgaggcgcaa     60

    aaaaaatttg ccacctatac gcaggaacaa gtggataaga ttttcaaaca gtgcgcaatc    120

    gctgcggcca aagaacgcat taacctggca aagttagctg ttgaagagac tggcatcggt    180

    ctggtcgagg acaaaattat caaaaatcat tttgcggccg agtacattta taacaagtac    240

    aaaaacgaga aaacctgtgg gatcattgac cacgatgata gcctgggaat cacaaaggta     300

    gcagaaccga ttggcatcgt ggctgcgatt gttccaacga ctaatcctac atctaccgcc     360

    atcttcaaaa gtttaatttc actgaaaacg cggaatgcaa tctttttctc cccgcatcca     420

    cgtgctaaga aatcgaccat tgcggccgca aaactgattt tagacgcggc tgtcaaggcc     480

    ggtgcaccta aaaacatcat tgggtggatc gacgaaccga gcattgaact gtctcaggat     540

    ctgatgagtg aggcggacat cattttagct actggaggcc cgtcaatggt aaaagccgca     600

    tattcctcgg gtaagccagc gatcggcgtg ggtgctggga atactcctgc cattatcgac     660

    gaaagcgcag acattgatat ggcggtttct agtatcattc tgtcaaaaac gtacgacaac     720

    ggagtcatct gcgcctccga acagtcgatt ctggtgatga atagcatcta tgagaaagta     780

    aaggaagagt ttgttaaacg cggctcttac attctgaacc agaatgaaat tgcaaaaatc     840

    aaggaaacca tgttcaaaaa cggtgcgatt aatgctgata tcgtgggcaa aagtgcctat     900

    attatcgcga agatggctgg tattgaggtc ccgcaaacta caaaaatctt aattggggaa     960

    gttcagtcag tagaaaaatc cgagctgttt agccacgaaa agctgtcgcc ggtgttagca    1020

    atgtataaag tcaaagattt cgacgaggcc ctgaagaaag cgcagcgtct gatcgaatta    1080

    ggaggctctg gtcataccag ttcactgtac attgatagcc aaaacaataa agacaaggtt    1140

    aaagaatttg ggctggctat gaaaacgtcc cgcaccttta tcaacatgcc atcgtctcag    1200

    ggcgcaagtg gtgatttata taatttcgcc attgcgccta gctttactct gggatgtggc    1260

    acatggggtg ggaactcagt gtcccaaaat gtagagccga agcatctgct gaacatcaaa    1320

    tcggtcgctg aacggcgtga gaatatgtta tggttcaaag ttccacagaa gatttacttt    1380

    aaatatggct gcctgcgctt cgcactgaaa gaattaaagg atatgaacaa aaaacgtgcc    1440

    tttatcgtga cggacaagga tctgttcaaa ctgggttacg taaataaaat taccaaggtt    1500

    ttagacgaaa ttgatatcaa atattctatt tttactgaca tcaaaagcga tccgacaatt    1560

    gatagtgtga agaaaggagc gaaagagatg ctgaacttcg aacctgacac gatcatttca    1620

    atcggcggtg ggtccccgat ggatgctgca aaggtcatgc atctgttata cgagtatcca    1680

    gaagccgaaa ttgagaatct ggcgatcaac tttatggaca ttcgcaaacg gatctgtaat    1740

    tttccgaaac tgggaaccaa ggctattagc gttgcaatcc ctactacggc cggcaccggt    1800

    tcggaagcga caccgttcgc tgtgattacc aacgatgaga ctgggatgaa atatccactg    1860

    acatcttacg aattaacgcc gaatatggca atcattgata ccgaactgat gctgaacatg    1920

    cctcgtaaat taactgccgc gacgggcatt gacgcactgg tacacgccat cgaggcgtat    1980

    gtcagtgtta tggcaaccga ttacacagac gaactggcgt tacgcgctat taagatgatc    2040

    tttaaatatc tgccacgtgc ctacaaaaat ggtactaacg atattgaagc gcgcgagaag    2100

    atggctcatg catcaaatat cgccggaatg gcgttcgcta acgcatttct gggcgtgtgc    2160

    cacagcatgg cccataaatt aggtgcgatg caccatgtac cgcatgggat tgcttgtgca    2220

    gtcctgatcg aagaggttat taaatataat gccacggact gccctaccaa gcagacagcg    2280

    ttcccgcaat acaaatcccc aaacgctaaa cggaagtatg cagaaatcgc cgaatatctg    2340

    aatctgaaag gcacttcgga tacggagaaa gtgaccgcgt taattgaagc tatctctaag    2400

    ctgaaaattg atctgagtat cccgcagaac atttcagcag ccggtattaa taaaaaggac    2460

    ttttacaaca ccttagataa aatgagcgag ctggcgttcg acgatcaatg tacaactgct    2520

    aatcctcgtt atccgctgat ctccgaatta aaagatatct atataaaatc attttaa       2577

    <210>8

    <211>1152

    <212>DNA

    <213>Me-bcd-co

    <400>8

    atggatttta acttaacaga tattcagcaa gacttcctga agctggcaca cgactttggt     60

    gaaaagaaac tggcccctac tgttaccgaa cgcgaccaca aaggtatcta cgataaagaa    120

    ctgattgacg aactgctgtc tctgggtatc accggcgcat acttcgaaga aaaatacggc    180

    ggtagcggtg acgacggtgg cgatgtactg tcttatatcc tggccgtaga agaactggcg    240

    aaatacgacg ctggtgttgc tatcactctg tctgccaccg taagcctgtg tgcgaatccg    300

    atttggcagt ttggtactga ggctcagaaa gaaaagtttc tggttccact ggtcgaaggt    360

    actaaactgg gtgcgtttgg tctgaccgaa ccgaacgcgg gcactgatgc gagcggccag    420

    caaactattg ctactaaaaa cgatgacggc acgtacaccc tgaacggtag caaaatcttc    480

    atcaccaacg gtggcgctgc cgatatctac atcgtatttg cgatgaccga caaaagcaag    540

    ggtaaccatg gcatcaccgc gttcatcctg gaagatggca ctccgggttt cacctacggc    600

    aaaaaggaag ataaaatggg tatccacacc tctcagacta tggaactggt tttccaggac    660

    gttaaggtcc cggccgagaa catgctgggc gaagaaggca aaggcttcaa gattgcaatg    720

    atgaccctgg acggcggtcg cattggcgtt gcggcccagg cactgggcat cgcagaggca    780

    gcgctggccg acgctgttga atacagcaaa cagcgtgttc agtttggcaa acctctgtgc    840

    aaattccaat ccattagctt taagctggcc gatatgaaaa tgcagatcga agccgcacgc    900

    aacctggtat ataaagctgc atgcaagaaa caagaaggta aaccgttcac cgtagacgct    960

    gcgatcgcga aacgtgtagc cagcgatgtg gcaatgcgcg tgactaccga agcagttcag   1020

    attttcggtg gctatggtta ctctgaagaa tacccggtgg ctcgccacat gcgcgacgca   1080

    aaaatcactc agatctacga gggtacgaac gaagtgcagc tgatggtcac cggcggtgct   1140

    ctgttaagtt aa                                                       1152

    <210>9

    <211>1017

    <212>DNA

    <213>Me-eftA-co

    <400>9

    atggatttag cagaatacaa aggcatctac gtgatcgcag agcagttcga aggtaaactg     60

    cgtgacgttt ctttcgaact gctgggtcaa gcgcgcatcc tggcggacac gatcggcgac    120

    gaagtaggcg caatcctgat tggcaaagat gtaaaaccac tggcgcagga actgatcgcg    180

    catggtgctc ataaagtgta cgtctatgac gacccgcagc tggaacatta caacacgact    240

    gcctatgcca aagtgatttg cgacttcttt catgaagaga aaccaaacgt tttcctggtt    300

    ggtgcaacta acatcggtcg tgacctgggt ccacgtgtag cgaacagcct gaaaaccggt    360

    ctgactgcgg attgtaccca gctgggtgtt gatgatgata agaaaaccat cgtttggacc    420

    cgtccggcac tgggcggcaa catcatggcg gaaattatct gtccagataa ccgcccgcag    480

    atgggcactg tgcgtcctca tgtcttcaaa aagccggaag ccgacccgag cgcaactggt    540

    gaagtcattg aaaagaaagc gaacctgtct gacgctgatt tcatgactaa gttcgtagaa    600

    ctgatcaaac tgggtggtga aggcgttaaa atcgaggatg ccgatgttat tgttgctggt    660

    ggccgtggca tgaatagcga agagcctttt aaaaccggta tcctgaaaga gtgcgcggac    720

    gtactgggcg gtgctgtcgg tgccagccgt gccgccgtgg acgcgggctg gatcgacgct    780

    ctgcaccagg tcggccagac tggcaaaacc gttggtccga aaatctacat tgcttgtgcg    840

    attagcggtg ctatccagcc gctggcaggc atgacgggct ctgattgtat tatcgcaatt    900

    aacaaagatg aagacgcgcc tattttcaag gtgtgcgact atggcattgt gggcgatgtg    960

    ttcaaagtgc tgccactgct gactgaggcg atcaagaaac agaaaggcat tgcataa      1017

    <210>10

    <211>813

    <212>DNA

    <213>Me-eftB-co

    <400>10

    atggaaatat tggtatgtgt caaacaagtg ccggatactg cagaagtcaa aattgatccg     60

    gttaaacaca ccgtgattcg tgcgggtgtg ccgaatatct tcaacccgtt cgaccaaaac    120

    gcgctggaag cggcgctggc gctgaaggac gcggataaag acgttaagat tactctgctg    180

    tctatgggcc cggaccaggc aaaagatgtt ctgcgtgaag gcctggccat gggcgctgat    240

    gacgcgtacc tgctgtccga tcgtaaactg ggtggctccg acactctggc caccggttat    300

    gctctggccc aggctattaa gaaactggct gcggacaagg gtattgagca attcgacatc    360

    atcctgtgtg gtaagcaagc gattgacggt gataccgctc aggtaggtcc acagatcgct    420

    tgtgagctgg gcatcccgca gatcacttat gctcgtgaca tcaaggttga gggcgataag    480

    gttactgtgc agcaggaaaa cgaagagggt tacatcgtga ccgaagcgca gttcccggtt    540

    ctgatcaccg cggttaaaga cctgaacgaa cctcgtttcc cgaccatccg tggcaccatg    600

    aaggcgaagc gtcgtgaaat cccgaacctg gacgcagctg cagttgccgc ggacgacgcg    660

    cagatcggcc tgtccggttc tccgaccaaa gtacgcaaaa ttttcacccc accgcagcgt    720

    tccggcggtc tggtactgaa agtggaagac gacaacgaac aggccattgt cgaccaggtt    780

    atggaaaaac tggttgccca gaaaatcatt  taa                                813

    <210>11

    <211>5024

    <212>DNA

    <213>pGV1090

    <400>11

    ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa      60

    tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat     120

    atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct     180

    gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac     240

    cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat     300

    attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa     360

    catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc     420

    ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga     480

    aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac     540

    cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag     600

    aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc     660

    cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc     720

    aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt     780

    ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag     840

    tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt     900

    tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg     960

    cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt    1020

    gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttcaaaattg    1080

    aaggcttcaa aaatagatag gaggtaagtt tatatggatt ttaatttaac aagagaacag    1140

    gaactggtcc gtcagatggt acgtgaattt gcagaaaacg aggttaaacc gattgctgca    1200

    gagattgatg agactgaacg cttcccgatg gaaaacgtca aaaagatggg tcagtatggc    1260

    atgatgggca ttccgttctc taaagagtac ggcggtgcgg gtggcgacgt tctgtcttat    1320

    atcatcgctg tagaggaact gtccaaagta tgtggcacca cgggcgtgat cctgtccgcg    1380

    cacacctctc tgtgcgcaag cctgatcaac gaacacggca ccgaggaaca gaagcaaaaa    1440

    tacctggtcc cgctggccaa aggtgaaaag atcggtgcat acggtctgac ggaaccgaac    1500

    gcaggtacgg acagcggcgc acaacagacg gttgcggtac tggaaggcga ccactacgtt    1560

    attaacggta gcaaaatctt catcacgaac ggtggcgtgg ctgacacctt tgttatcttc    1620

    gcgatgaccg accgcactaa aggcactaaa ggtatctctg cgttcatcat cgagaagggt    1680

    ttcaagggtt tttctatcgg caaagtggaa cagaagctgg gtatccgtgc ctcctctact    1740

    accgagctgg ttttcgaaga catgattgtg ccggttgaaa atatgatcgg caaagaaggc    1800

    aaaggcttcc cgatcgctat gaaaaccctg gatggcggcc gtatcggcat tgcagcacag    1860

    gcactgggta tcgcagaagg cgctttcaac gaagcacgtg cgtacatgaa agaacgtaaa    1920

    cagtttggcc gttctctgga taaatttcaa ggcctggcgt ggatgatggc agacatggac    1980

    gtagcgattg aatctgcgcg ctacctggtc tataaagcag cttacctgaa acaggcaggt    2040

    ctgccttaca ccgttgacgc agcacgtgcg aaactgcacg cggccaacgt tgccatggat    2100

    gttaccacca aagccgtgca actgtttggc ggttacggct atactaagga ttatccggtt    2160

    gaacgtatga tgcgtgacgc gaaaatcacc gaaatctatg aaggtacttc cgaagtgcag    2220

    aaactggtca tttcaggaaa aatttttagt taattaaagg aggttaagag gatgaatata    2280

    gttgtttgtt taaaacaggt cccggacacc gcagaagttc gtattgatcc agtaaagggt    2340

    acgctgattc gcgagggcgt gccgtctatc atcaacccag atgacaagaa cgccctggaa    2400

    gaagcactgg tcctgaaaga taattacggc gctcacgtaa ctgttatctc tatgggtccg    2460

    ccgcaagcga aaaatgcgct ggttgaagct ctggcgatgg gcgctgacga ggctgttctg    2520

    ctgactgatc gtgctttcgg tggtgcggac accctggcca cttcccacac tatcgcggca    2580

    ggtatcaaga aactgaaata tgacattgtg tttgctggtc gtcaggctat tgacggtgac    2640

    acggcacagg taggcccgga aatcgccgaa cacctgggta ttccgcaggt gacctacgta    2700

    gaaaaagtag aagtagacgg tgataccctg aaaatccgca aagcatggga agatggctac    2760

    gaggtggttg aagtaaaaac cccggtactg ctgaccgcta tcaaagagct gaatgtaccg    2820

    cgttacatgt ctgttgagaa aatcttcggc gcgttcgaca aggaagtaaa gatgtggacc    2880

    gctgatgata ttgacgttga caaagcgaat ctgggcctga agggctcccc aactaaagtt    2940

    aagaagtcct ctactaaaga agtgaagggt cagggtgagg tgattgataa acctgttaaa    3000

    gaagctgctg cgtacgtggt ttctaagctg aaagaagaac actatattta agttaggagg    3060

    gatttttcaa tgaataaagc agattacaag ggcgtttggg tctttgcgga acagcgtgat    3120

    ggtgaactgc agaaagtgtc cctggaactg ctgggcaaag gcaaggagat ggcagaaaaa    3180

    ctgggtgttg aactgaccgc agttctgctg ggtcacaaca ctgaaaagat gtccaaagac    3240

    ctgctgtccc atggcgcaga caaggtgctg gctgcggaca acgaactgct ggctcacttt    3300

    agcaccgacg gttatgcaaa agtaatctgc gacctggtta acgagcgcaa gccggaaatc    3360

    ctgttcatcg gcgccacttt tattggtcgc gacctgggcc ctcgtattgc tgcgcgtctg    3420

    tccactggcc tgactgcgga ttgcacctcc ctggacattg atgttgaaaa ccgtgatctg    3480

    ctggcaactc gcccggcatt cggcggcaac ctgatcgcca ccatcgtatg ttccgaccac    3540

    cgtccgcaaa tggctactgt acgtccgggc gtatttgaaa agctgccggt gaacgacgca    3600

    aacgtttccg acgacaaaat cgaaaaagtt gctatcaagc tgaccgctag cgatatccgt    3660

    accaaagttt ctaaagtagt gaaactggcg aaggacatcg cagatattgg tgaagcaaaa    3720

    gttctggtgg caggcggtcg tggcgtcggt tccaaagaga acttcgaaaa actggaggaa    3780

    ctggcgtctc tgctgggcgg tactattgca gcgtcccgtg cagcaatcga aaaagaatgg    3840

    gtggacaagg atctgcaggt gggccagact ggtaaaaccg ttcgtccgac cctgtacatc    3900

    gcctgcggca tctccggtgc tattcagcac ctggccggca tgcaggacag cgactacatc    3960

    atcgccatca acaaagacgt tgaagctccg atcatgaaag tggcggacct ggcaatcgtt    4020

    ggtgacgtga acaaagttgt tccggaactg atcgcgcagg ttaaagctgc taataattaa    4080

    ggatcccatg gtacgcgtgc tagaggcatc aaataaaacg aaaggctcag tcgaaagact    4140

    gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg acaaatccgc    4200

    cgccctagac ctaggcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat    4260

    acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca    4320

    aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc    4380

    tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata    4440

    aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc    4500

    gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcaatgctc    4560

    acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga    4620

    accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc    4680

    ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag    4740

    gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag    4800

    gacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag    4860

    ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca    4920

    gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga    4980

    cgctcagtgg aacgaaaact cacgttaagg gattttggtc atga                     5024

    <210>12

    <211>3206

    <212>DNA

    <213>pGV1095

    <400>12

    ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60

    tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120

    atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180

    gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240

    cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300

    attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360

    catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420

    ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480

    aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540

    cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600

    aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660

    cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720

    aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt     780

    ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag     840

    tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt     900

    tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg     960

    cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt    1020

    gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttcaacagga    1080

    ggggttaaag tggttgattt cgaatattca ataccaacta gaattttttt cggtaaagat    1140

    aagataaatg tacttggaag agagcttaaa aaatatggtt ctaaagtgct tatagtttat    1200

    ggtggaggaa gtataaagag aaatggaata tatgataaag ctgtaagtat acttgaaaaa    1260

    aacagtatta aattttatga acttgcagga gtagagccaa atccaagagt aactacagtt    1320

    gaaaaaggag ttaaaatatg tagagaaaat ggagttgaag tagtactagc tataggtgga    1380

    ggaagtgcaa tagattgcgc aaaggttata gcagcagcat gtgaatatga tggaaatcca    1440

    tgggatattg tgttagatgg ctcaaaaata aaaagggtgc ttcctatagc tagtatatta    1500

    accattgctg caacaggatc agaaatggat acgtgggcag taataaataa tatggataca    1560

    aacgaaaaac taattgcggc acatccagat atggctccta agttttctat attagatcca    1620

    acgtatacgt ataccgtacc taccaatcaa acagcagcag gaacagctga tattatgagt    1680

    catatatttg aggtgtattt tagtaataca aaaacagcat atttgcagga tagaatggca    1740

    gaagcgttat taagaacttg tattaaatat ggaggaatag ctcttgagaa gccggatgat    1800

    tatgaggcaa gagccaatct aatgtgggct tcaagtcttg cgataaatgg acttttaaca    1860

    tatggtaaag acactaattg gagtgtacac ttaatggaac atgaattaag tgcttattac    1920

    gacataacac acggcgtagg gcttgcaatt ttaacaccta attggatgga gtatatttta    1980

    aataatgata cagtgtacaa gtttgttgaa tatggtgtaa atgtttgggg aatagacaaa    2040

    gaaaaaaatc actatgacat agcacatcaa gcaatacaaa aaacaagaga ttactttgta    2100

    aatgtactag gtttaccatc tagactgaga gatgttggaa ttgaagaaga aaaattggac    2160

    ataatggcaa aggaatcagt aaagcttaca ggaggaacca taggaaacct aagaccagta    2220

    aacgcctccg aagtcctaca aatattcaaa aaatctgtgt aaggatccca tggtacgcgt    2280

    gctagaggca tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt cgttttatct    2340

    gttgtttgtc ggtgaacgct ctcctgagta ggacaaatcc gccgccctag acctaggcgt    2400

    tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc    2460

    aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa    2520

    aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa    2580

    tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc    2640

    ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc    2700

    cgcctttctc ccttcgggaa gcgtggcgct ttctcaatgc tcacgctgta ggtatctcag    2760

    ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga    2820

    ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc    2880

    gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac    2940

    agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg    3000

    cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca    3060

    aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa    3120

    aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa    3180

    ctcacgttaa gggattttgg tcatga                                         3206

    <210>13

    <211>2836

    <212>DNA

    <213>pGV1094

    <400>13

    ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa    60

    tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120

    atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180

    gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240

    cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300

    attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360

    catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420

    ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480

    aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540

    cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600

    aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660

    cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720

    aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780

    ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840

    tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900

    tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg    960

    cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt   1020

    gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccggg aattcctatc   1080

    tatttttgaa gccttcaatt tttcttttct ctatgaaagc tgtcattgca tccttttgat   1140

    cctctgttga aaagcattct ccaaatgctt ctgattcaaa tgctaaagca gtatcaatat   1200

    cacactgcat tcctctatta atagcctgtt tgcttaactt aacagctact ggagcattgc   1260

    tcacaatttt gtttgcaatt tcttttgctg tattcattaa ttcactaggt tctactacct   1320

    tatttacaag tccgattctt aatgcttcat ctgcctttat attttgtgca gtaaatataa   1380

    gctgctttgc catgcccatt ccaactaatc ttgaaagtct ttgtgtacca ccaaaaccag    1440

    gtgttattcc gagacctact tctggttgac caaatcttgc gttgcttgaa gctattctta    1500

    tatcacaaga catagctatt tcgcatccgc ctcctaaagc aaaaccatta acagctgcta    1560

    ttacaggctt ttcaagaagt tctaatcttc taaacacttt atttccaagt atcccgaatt    1620

    ttctaccttc aatggtattc atttccttca tctcagaaat atctgctcct gctacaaatg    1680

    atttttctcc tgctccagtt aaaattactg caagtacttc gctatcattt tcaatttcac    1740

    ctataacata atccatttct tttagtgtat cactatttaa cgcatttaat gctttaggtc    1800

    tgttaatggt aactacagca actttacctt ccttttcaag gatgacattg tttagttcca    1860

    tgactaatcc tcctaaaata ttggatccga tccgatccca tggtacgcgt gctagaggca    1920

    tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt cgttttatct gttgtttgtc    1980

    ggtgaacgct ctcctgagta ggacaaatcc gccgccctag acctaggcgt tcggctgcgg    2040

    cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac    2100

    gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg    2160

    ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca    2220

    agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc    2280

    tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc    2340

    ccttcgggaa gcgtggcgct ttctcaatgc tcacgctgta ggtatctcag ttcggtgtag    2400

    gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc    2460

    ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca    2520

    gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg    2580

    aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg    2640

    aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct    2700

    ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa    2760

    gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa    2820

    gggattttgg tcatga                                                    2836

    <210>14

    <211>2908

    <212>DNA

    <213>pGV1037

    <400>14

    ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60

    tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120

    atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180

    gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240

    cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300

    attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa     360

    catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc     420

    ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga     480

    aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac     540

    cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag     600

    aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc     660

    cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc     720

    aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt     780

    ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag     840

    tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt     900

    tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg     960

    cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt    1020

    gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgga attcattgat    1080

    agtttcttta aatttaggga ggtctgttta atgaaaaagg tatgtgttat aggtgcaggt    1140

    actatgggtt caggaattgc tcaggcattt gcagctaaag gatttgaagt agtattaaga    1200

    gatattaaag atgaatttgt tgatagagga ttagatttta tcaataaaaa tctttctaaa    1260

    ttagttaaaa aaggaaagat agaagaagct actaaagttg aaatcttaac tagaatttcc    1320

    ggaacagttg accttaatat ggcagctgat tgcgatttag ttatagaagc agctgttgaa    1380

    agaatggata ttaaaaagca gatttttgct gacttagaca atatatgcaa gccagaaaca    1440

    attcttgcat caaatacatc atcactttca ataacagaag tggcatcagc aactaaaaga    1500

    cctgataagg ttataggtat gcatttcttt aatccagctc ctgttatgaa gcttgtagag    1560

    gtaataagag gaatagctac atcacaagaa acttttgatg cagttaaaga gacatctata    1620

    gcaataggaa aagatcctgt agaagtagca gaagcaccag gatttgttgt aaatagaata    1680

    ttaataccaa tgattaatga agcagttggt atattagcag aaggaatagc ttcagtagaa    1740

    gacatagata aagctatgaa acttggagct aatcacccaa tgggaccatt agaattaggt    1800

    gattttatag gtcttgatat atgtcttgct ataatggatg ttttatactc agaaactgga    1860

    gattctaagt atagaccaca tacattactt aagaagtatg taagagcagg atggcttgga    1920

    agaaaatcag gaaaaggttt ctacgattat tcaaaataag gatccgatcc catggtacgc    1980

    gtgctagagg catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat    2040

    ctgttgtttg tcggtgaacg ctctcctgag taggacaaat ccgccgccct agacctaggc    2100

    gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa    2160

    tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt    2220

    aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa    2280

    aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt    2340

    ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg    2400

    tccgcctttc tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc    2460

    agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc    2520

    gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta    2580

    tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct    2640

    acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc    2700

    tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa    2760

    caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa    2820

    aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa    2880

    aactcacgtt aagggatttt ggtcatga                                       2908

    <210>15

    <211>6219

    <212>DNA

    <213>pGV1031

    <400>15

    tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca     60

    cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg    120

    ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc    180

    accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc    240

    attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat    300

    tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt    360

    tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt accatatgca    420

    taagtttaat ttttttgtta aaaaatatta aactttgtgt tttttttaac aaaatatatt    480

    gataaaaata ataatagtgg gtataattaa gttgttagag aaaacgtata aattagggat    540

    aaactatgga acttatgaaa tagattgaaa tggtttatct gttaccccgt atcaaaattt    600

    aggaggttag ttagaatgaa agaagttgta atagctagtg cagtaagaac agcgattgga    660

    tcttatggaa agtctcttaa ggatgtacca gcagtagatt taggagctac agctataaag    720

    gaagcagtta aaaaagcagg aataaaacca gaggatgtta atgaagtcat tttaggaaat    780

    gttcttcaag caggtttagg acagaatcca gcaagacagg catcttttaa agcaggatta    840

    ccagttgaaa ttccagctat gactattaat aaggtttgtg gttcaggact tagaacagtt    900

    agcttagcag cacaaattat aaaagcagga gatgctgacg taataatagc aggtggtatg    960

    gaaaatatgt ctagagctcc ttacttagcg aataacgcta gatggggata tagaatggga   1020

    aacgctaaat ttgttgatga aatgatcact gacggattgt gggatgcatt taatgattac   1080

    cacatgggaa taacagcaga aaacatagct gagagatgga acatttcaag agaagaacaa   1140

    gatgagtttg ctcttgcatc acaaaaaaaa gctgaagaag ctataaaatc aggtcaattt   1200

    aaagatgaaa tagttcctgt agtaattaaa ggcagaaagg gagaaactgt agttgataca   1260

    gatgagcacc ctagatttgg atcaactata gaaggacttg caaaattaaa acctgccttc    1320

    aaaaaagatg gaacagttac agctggtaat gcatcaggat taaatgactg tgcagcagta    1380

    cttgtaatca tgagtgcaga aaaagctaaa gagcttggag taaaaccact tgctaagata    1440

    gtttcttatg gttcagcagg agttgaccca gcaataatgg gatatggacc tttctatgca    1500

    acaaaagcag ctattgaaaa agcaggttgg acagttgatg aattagattt aatagaatca    1560

    aatgaagctt ttgcagctca aagtttagca gtagcaaaag atttaaaatt tgatatgaat    1620

    aaagtaaatg taaatggagg agctattgcc cttggtcatc caattggagc atcaggtgca    1680

    agaatactcg ttactcttgt acacgcaatg caaaaaagag atgcaaaaaa aggcttagca    1740

    actttatgta taggtggcgg acaaggaaca gcaatattgc tagaaaagtg ctagaaagga    1800

    tccagaattt aaaaggaggg attaaaatga actctaaaat aattagattt gaaaatttaa    1860

    ggtcattctt taaagatggg atgacaatta tgattggagg ttttttaaac tgtggcactc    1920

    caaccaaatt aattgatttt ttagttaatt taaatataaa gaatttaacg attataagta    1980

    atgatacatg ttatcctaat acaggtattg gtaagttaat atcaaataat caagtaaaaa    2040

    agcttattgc ttcatatata ggcagcaacc cagatactgg caaaaaactt tttaataatg    2100

    aacttgaagt agagctctct ccccaaggaa ctctagtgga aagaatacgt gcaggcggat    2160

    ctggcttagg tggtgtacta actaaaacag gtttaggaac tttgattgaa aaaggaaaga    2220

    aaaaaatatc tataaatgga acggaatatt tgttagagct acctcttaca gccgatgtag    2280

    cattaattaa aggtagtatt gtagatgagg ccggaaacac cttctataaa ggtactacta    2340

    aaaactttaa tccctatatg gcaatggcag ctaaaaccgt aatagttgaa gctgaaaatt    2400

    tagttagctg tgaaaaacta gaaaaggaaa aagcaatgac ccccggagtt cttataaatt    2460

    atatagtaaa ggagcctgca taaaatgatt aatgataaaa acctagcgaa agaaataata    2520

    gccaaaagag ttgcaagaga attaaaaaat ggtcaacttg taaacttagg tgtaggtctt    2580

    cctaccatgg ttgcagatta tataccaaaa aatttcaaaa ttactttcca atcagaaaac    2640

    ggaatagttg gaatgggcgc tagtcctaaa ataaatgagg cagataaaga tgtagtaaat    2700

    gcaggaggag actatacaac agtacttcct gacggcacat ttttcgatag ctcagtttcg    2760

    ttttcactaa tccgtggtgg tcacgtagat gttactgttt taggggctct ccaggtagat    2820

    gaaaagggta atatagccaa ttggattgtt cctggaaaaa tgctctctgg tatgggtgga    2880

    gctatggatt tagtaaatgg agctaagaaa gtaataattg caatgagaca tacaaataaa    2940

    ggtcaaccta aaattttaaa aaaatgtaca cttcccctca cggcaaagtc tcaagcaaat    3000

    ctaattgtaa cagaacttgg agtaattgag gttattaatg atggtttact tctcactgaa    3060

    attaataaaa acacaaccat tgatgaaata aggtctttaa ctgctgcaga tttactcata    3120

    tccaatgaac ttagacccat ggctgtttag aaagaattct tgatatcagg aaggtgactt    3180

    ttatgttaaa ggatgaagta attaaacaaa ttagcacgcc attaacttcg cctgcatttc    3240

    ctagaggacc ctataaattt cataatcgtg agtattttaa cattgtatat cgtacagata    3300

    tggatgctct tcgtaaagtt gtgccagagc ctttagaaat tgatgagccc ttagtcaggt    3360

    ttgaaattat ggcaatgcat gatacgagtg gacttggttg ttatacagaa agcggacagg    3420

    ctattcccgt aagctgtaat ggagttaagg gagattatct tcatatgatg tatttagata    3480

    atgagcctgc aattgcagta ggaagggaat taagtgcata tcctaaaaag ctcgggtatc    3540

    caaagctttt tgtggattca gatactttag taggaacttt agactatgga aaacttagag    3600

    ttgcgacagc tacaatgggg tacaaacata aagccttaga tgctaatgaa gcaaaggatc    3660

    aaatttgtcg ccctaattat atgttgaaaa taatacccaa ttatgatgga agccctagga    3720

    tatgtgagct tataaatgcg aaaatcacag atgttaccgt acatgaagct tggacaggac    3780

    caactcgact gcagttattt gatcacgcta tggcgccact taatgatttg ccagtaaaag    3840

    agattgtttc tagctctcac attcttgcag atataatatt gcctagagct gaagttatat    3900

    atgattatct taagtaataa aaataagagt taccttaaat ggtaactctt atttttttaa    3960

    tgtcgacctg caggcatgca agcttggcgt aatcatggtc atagctgttt cctgtgtgaa    4020

    attgttatcc gctcacaatt ccacacaaca tacgagccgg aagcataaag tgtaaagcct    4080

    ggggtgccta atgagtgagc taactcacat taattgcgtt gcgctcactg cccgctttcc    4140

    agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg    4200

    gtttgcgtat tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc    4260

    ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag    4320

    gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa    4380

    aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc    4440

    gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc    4500

    ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg    4560

    cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt    4620

    cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc    4680

    gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc    4740

    cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag    4800

    agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg    4860

    ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa    4920

    ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag    4980

    gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact    5040

    cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa    5100

    attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt    5160

    accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag    5220

    ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca    5280

    gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc    5340

    agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt    5400

    ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg    5460

    ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca    5520

    gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg    5580

    ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca    5640

    tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg    5700

    tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct    5760

    cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca    5820

    tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca    5880

    gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg    5940

    tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac    6000

    ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt    6060

    attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc    6120

    cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat    6180

    taacctataa aaataggcgt atcacgaggc cctttcgtc                           6219

    <210>16

    <211>2855

    <212>DNA

    <213>pGV1049

    <400>16

    ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60

    tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120

    atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180

    gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240

    cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300

    attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360

    catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420

    ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480

    aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540

    cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600

    aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660

    cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720

    aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780

    ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840

    tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900

    tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg     960

    cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt    1020

    gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttcattaaag    1080

    aggagaaagg taccaaaata agcaagtttg aaggaggtcc ttagaatgga attaaaaaat    1140

    gttattcttg aaaaagaagg gcatttagct attgttacaa tcaatagacc aaaggcatta    1200

    aatgcattga attcagaaac actaaaagat ttaaatgttg ttttagatga tttagaagca    1260

    gacaacaatg tgtatgcagt tatagttaca ggtgctggtg agaaatcttt tgttgctgga    1320

    gcagatattt cagaaatgaa agatcttaat gaagaacaag gtaaagaatt tggtatttta    1380

    ggaaacaatg tcttcagaag attagaaaaa ttggataagc cagttatcgc agctatatca    1440

    ggatttgctc ttggtggtgg atgtgaactt gctatgtcat gtgacataag aatagcttca    1500

    gttaaagcta aatttggtca accagaagca ggacttggaa taactccagg atttggtgga    1560

    actcaaagat tagctagaat tgtagggcca ggaaaagcta aagaattaat ttatacttgt    1620

    gaccttataa atgcagaaga agcttataga ataggtttag ttaataaagt agttgaatta    1680

    gaaaaattga tggaagaagc aaaagcaatg gctaacaaga ttgcagctaa tgctccaaaa    1740

    gcagttgcat attgtaaaga tgctatagac agaggaatgc aagttgatat agatgcagct    1800

    atattaatag aagcagaaga ctttggaaag tgctttgcaa cagaagatca aacagaagga    1860

    atgactgcgt tcttagaaag aagagcagaa aagaattttc aaaataaata aggatcccat    1920

    ggtacgcgtg ctagaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc    1980

    gttttatctg ttgtttgtcg gtgaacgctc tcctgagtag gacaaatccg ccgccctaga    2040

    cctaggcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc    2100

    cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag    2160

    gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca    2220

    tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca    2280

    ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg    2340

    atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcaatgct cacgctgtag    2400

    gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt    2460

    tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca    2520

    cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg    2580

    cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt    2640

    tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc    2700

    cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg    2760

    cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg    2820

    gaacgaaaac tcacgttaag ggattttggt catga                               2855

    <210>17

    <211>2891

    <212>DNA

    <213>pGV1050

    <400>17

    ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa      60

    tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat     120

    atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct     180

    gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac     240

    cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat     300

    attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa     360

    catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc     420

    ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga     480

    aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac     540

    cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag     600

    aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc     660

    cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc     720

    aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt     780

    ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag     840

    tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt     900

    tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg     960

    cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt    1020

    gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttcaaaagat    1080

    ttagaggagg aataattcat gaaaaagatt tttgtacttg gagcaggaac aatgggtgct    1140

    ggtatcgttc aagcattcgc tcaaaaaggt tgtgaagtaa ttgtaagaga cataaaggaa    1200

    gaatttgttg acagaggaat agctggaatc actaaaggat tagaaaagca agttgctaaa    1260

    ggaaaaatgt ctgaagaaga taaagaagct atactttcaa gaatttcagg aacaactgat    1320

    atgaaattag ctgctgactg tgatttagta gttgaagctg caatcgaaaa catgaaaatt    1380

    aagaaggaaa tcttcgctga attagatgga atttgtaagc cagaagcgat tttagcttca    1440

    aacacttcat ctttatcaat tactgaagtt gcttcagcta caaagagacc tgataaagtt    1500

    atcggaatgc atttctttaa tccagctcca gtaatgaagc ttgttgaaat tattaaagga    1560

    atagctactt ctcaagaaac ttttgatgct gttaaggaat tatcagttgc tattggaaaa    1620

    gaaccagtag aagttgcaga agctccagga ttcgttgtaa acagaatatt aatcccaatg    1680

    attaacgaag cttcatttat cctacaagaa ggaatagctt cagttgaaga tattgataca    1740

    gctatgaaat atggtgctaa ccatccaatg ggacctttag ctttaggaga tcttattgga    1800

    ttagacgttt gcttagctat catggatgtt ttattcactg aaacaggtga taacaagtac    1860

    agagctagca gcatattaag aaaatatgtt agagctggat ggcttggaag aaaatcagga    1920

    aaaggattct atgattattc taaataagga tcccatggta cgcgtgctag aggcatcaaa    1980

    taaaacgaaa ggctcagtcg aaagactggg cctttcgttt tatctgttgt ttgtcggtga    2040

    acgctctcct gagtaggaca aatccgccgc cctagaccta ggcgttcggc tgcggcgagc    2100

    ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg    2160

    aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct    2220

    ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca    2280

    gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct    2340

    cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc    2400

    gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat ctcagttcgg tgtaggtcgt    2460

    tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc    2520

    cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc    2580

    cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg    2640

    gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc    2700

    agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag    2760

    cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga    2820

    tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat    2880

    tttggtcatg a                                                         2891

    <210>18

    <211>3205

    <212>DNA

    <213>pGV1091

    <400>18

    ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60

    tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120

    atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180

    gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240

    cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300

    attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360

    catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420

    ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480

    aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540

    cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600

    aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660

    cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720

    aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780

    ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag     840

    tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt     900

    tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg     960

    cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt    1020

    gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttcattaaag    1080

    aggagaaagg taccatggca cgttttactt taccaagaga catttatcat ggagaaggag    1140

    cacttgaggc acttaaaact ttaaaaggta agaaagcttt cttagtagtt ggtggcggat    1200

    caatgaaaag atttggattt cttaaacaag ttgaagatta tttaaaagaa gcaggaatgg    1260

    aagtagaatt atttgaaggt gttgaaccag atccatcagt ggaaacagta atgaaaggcg    1320

    cagaagctat gagaaacttt gagcctgatt ggatagttgc aatgggtgga ggatcaccaa    1380

    ttgatgctgc aaaggctatg tggatattct acgaataccc agattttact tttgaacaag    1440

    cagttgttcc atttggatta ccagacctta gacaaaaagc taagtttgta gctattccat    1500

    caacaagcgg tacagctaca gaagttacag cattctcagt tatcacaaat tattcagaaa    1560

    aaattaaata tcctttagct gattttaaca taactccaga tatagcaata gttgatccag    1620

    cacttgctca aactatgcca aaaactttaa cagctcatac tggaatggat gcattaactc    1680

    acgctataga agcatacact gcatcacttc aatcaaattt ctcagatcca ttagcaatta    1740

    aagctgtaga aatggttcaa gaaaatttaa tcaaatcatt tgaaggagat aaagaagcta    1800

    gaaatctaat gcatgaagct caatgtttag ctggaatggc attttctaat gcattacttg    1860

    gaatagttca ctcaatggct cataaggttg gtgctgtatt ccatattcct catggatgtg    1920

    caaatgctat atttttacca tatgtaattg agtataacag aacaaaatgc gaaaatagat    1980

    atggagatat tgcgagagcc ttaaaattaa aaggaaacaa tgatgccgag ttaactgatt    2040

    cattaattga attaattaat ggattaaatg ataagttaga gattcctcac tcaatgaaag    2100

    agtatggagt tactgaagaa gattttaaag ctaatctttc atttatcgct cataacgcag    2160

    tattagatgc atgcacagga tcaaatccta gagaaataga tgatgctaca atggaaaaat    2220

    tatttgaatg cacatactat ggaactaaag ttaatttgta aggatcccat ggtacgcgtg    2280

    ctagaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc gttttatctg    2340

    ttgtttgtcg gtgaacgctc tcctgagtag gacaaatccg ccgccctaga cctaggcgtt    2400

    cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca    2460

    ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa    2520

    aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat    2580

    cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc    2640

    cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc    2700

    gcctttctcc cttcgggaag cgtggcgctt tctcaatgct cacgctgtag gtatctcagt    2760

    tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac    2820

    cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg    2880

    ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca    2940

    gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc    3000

    gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa    3060

    accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa    3120

    ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac    3180

    tcacgttaag ggattttggt catga                                          3205

    <210>19

    <211>3449

    <212>DNA

    <213>pGV1096

    <400>19

    ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60

    tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120

    atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180

    gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240

    cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300

    attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360

    catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420

    ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480

    aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540

    cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600

    aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660

    cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720

    aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780

    ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840

    tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900

    tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg    960

    cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt   1020

    gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccggg aattcggagg   1080

    aatagttcat gaataaagac acactaatac ctacaactaa agatttaaaa gtaaaaacaa   1140

    atggtgaaaa cattaattta aagaactaca aggataattc ttcatgtttc ggagtattcg   1200

    aaaatgttga aaatgctata agcagcgctg tacacgcaca aaagatatta tcccttcatt   1260

    atacaaaaga gcaaagagaa aaaatcataa ctgagataag aaaggccgca ttacaaaata   1320

    aagaggtctt ggctacaatg attctagaag aaacacatat gggaagatat gaggataaaa   1380

    tattaaaaca tgaattggta gctaaatata ctcctggtac agaagattta actactactg   1440

    cttggtcagg tgataatggt cttacagttg tagaaatgtc tccatatggt gttataggtg    1500

    caataactcc ttctacgaat ccaactgaaa ctgtaatatg taatagcata ggcatgatag    1560

    ctgctggaaa tgctgtagta tttaacggac acccatgcgc taaaaaatgt gttgcctttg    1620

    ctgttgaaat gataaataag gcaattattt catgtggcgg tcctgaaaat ctagtaacaa    1680

    ctataaaaaa tccaactatg gagtctctag atgcaattat taagcatcct tcaataaaac    1740

    ttctttgcgg aactgggggt ccaggaatgg taaaaaccct cttaaattct ggtaagaaag    1800

    ctataggtgc tggtgctgga aatccaccag ttattgtaga tgatactgct gatatagaaa    1860

    aggctggtag gagcatcatt gaaggctgtt cttttgataa taatttacct tgtattgcag    1920

    aaaaagaagt atttgttttt gagaatgttg cagatgattt aatatctaac atgctaaaaa    1980

    ataatgctgt aattataaat gaagatcaag tatcaaaatt aatagattta gtattacaaa    2040

    aaaataatga aactcaagaa tactttataa acaaaaaatg ggtaggaaaa gatgcaaaat    2100

    tattcttaga tgaaatagat gttgagtctc cttcaaatgt taaatgcata atctgcgaag    2160

    taaatgcaaa tcatccattt gttatgacag aactcatgat gccaatattg ccaattgtaa    2220

    gagttaaaga tatagatgaa gctattaaat atgcaaagat agcagaacaa aatagaaaac    2280

    atagtgccta tatttattct aaaaatatag acaacctaaa tagatttgaa agagaaatag    2340

    atactactat ttttgtaaag aatgctaaat cttttgctgg tgttggttat gaagcagaag    2400

    gatttacaac tttcactatt gctggatcta ctggtgaggg aataacctct gcaaggaatt    2460

    ttacaagaca aagaagatgt gtacttgccg gctaaggatc cgatccgatc ccatggtacg    2520

    cgtgctagag gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta    2580

    tctgttgttt gtcggtgaac gctctcctga gtaggacaaa tccgccgccc tagacctagg    2640

    cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga    2700

    atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg    2760

    taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa    2820

    aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt    2880

    tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct    2940

    gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct gtaggtatct    3000

    cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc    3060

    cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt    3120

    atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc    3180

    tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat    3240

    ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa    3300

    acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa    3360

    aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga    3420

    aaactcacgt taagggattt tggtcatga                                      3449

    <210>20

    <211>1425

    <212>DNA

    <213>1pdA

    <400>20

    atgagtactg aaatcaaaac tcaggtcgtg gtacttgggg caggccccgc aggttactcc      60

    gctgccttcc gttgcgctga tttaggtctg gaaaccgtaa tcgtagaacg ttacaacacc     120

    cttggcggtg tttgcctgaa cgtcggctgt atcccttcta aagcactgct gcacgtagca     180

    aaagttatcg aagaagccaa agcgctggct gaacacggta tcgtcttcgg cgaaccgaaa     240

    accgatatcg acaagattcg tacctggaaa gagaaagtga tcaatcagct gaccggtggt     300

    ctggctggta tggcgaaagg ccgcaaagtc aaagtggtca acggtctggg taaattcacc     360

    ggggctaaca ccctggaagt tgaaggtgag aacggcaaaa ccgtgatcaa cttcgacaac     420

    gcgatcattg cagcgggttc tcgcccgatc caactgccgt ttattccgca tgaagatccg     480

    cgtatctggg actccactga cgcgctggaa ctgaaagaag taccagaacg cctgctggta     540

    atgggtggcg gtatcatcgg tctggaaatg ggcaccgttt accacgcgct gggttcacag     600

    attgacgtgg ttgaaatgtt cgaccaggtt atcccggcag ctgacaaaga catcgttaaa     660

    gtcttcacca agcgtatcag caagaaattc aacctgatgc tggaaaccaa agttaccgcc     720

    gttgaagcga aagaagacgg catttatgtg acgatggaag gcaaaaaagc acccgctgaa     780

    ccgcagcgtt acgacgccgt gctggtagcg attggtcgtg tgccgaacgg taaaaacctc     840

    gacgcaggca aagcaggcgt ggaagttgac gaccgtggtt tcatccgcgt tgacaaacag     900

    ctgcgtacca acgtaccgca catctttgct atcggcgata tcgtcggtca accgatgctg     960

    gcacacaaag gtgttcacga aggtcacgtt gccgctgaag ttatcgccgg taagaaacac    1020

    tacttcgatc cgaaagttat cccgtccatc gcctataccg aaccagaagt tgcatgggtg    1080

    ggtctgactg agaaagaagc gaaagagaaa ggcatcagct atgaaaccgc caccttcccg    1140

    tgggctgctt ctggtcgtgc tatcgcttcc gactgcgcag acggtatgac caagctgatt    1200

    ttcgacaaag aatctcaccg tgtgatcggt ggtgcgattg tcggtactaa cggcggcgag    1260

    ctgctgggtg aaatcggcct ggcaatcgaa atgggttgtg atgctgaaga catcgcactg    1320

    accatccacg cgcacccgac tctgcacgag tctgtgggcc tggcggcaga agtgttcgaa    1380

    ggtagcatta ccgacctgcc gaacccgaaa gcgaagaaga agtaa                    1425

    <210>21

    <211>2664

    <212>DNA

    <213>aceE

    <400>21

    atgtcagaac gtttcccaaa tgacgtggat ccgatcgaaa ctcgcgactg gctccaggcg     60

    atcgaatcgg tcatccgtga agaaggtgtt gagcgtgctc agtatctgat cgaccaactg    120

    cttgctgaag cccgcaaagg cggtgtaaac gtagccgcag gcacaggtat cagcaactac    180

    atcaacacca tccccgttga agaacaaccg gagtatccgg gtaatctgga actggaacgc     240

    cgtattcgtt cagctatccg ctggaacgcc atcatgacgg tgctgcgtgc gtcgaaaaaa     300

    gacctcgaac tgggcggcca tatggcgtcc ttccagtctt ccgcaaccat ttatgatgtg     360

    tgctttaacc acttcttccg tgcacgcaac gagcaggatg gcggcgacct ggtttacttc     420

    cagggccaca tctccccggg cgtgtacgct cgtgctttcc tggaaggtcg tctgactcag     480

    gagcagctgg ataacttccg tcaggaagtt cacggcaatg gcctctcttc ctatccgcac     540

    ccgaaactga tgccggaatt ctggcagttc ccgaccgtat ctatgggtct gggtccgatt     600

    ggtgctattt accaggctaa attcctgaaa tatctggaac accgtggcct gaaagatacc     660

    tctaaacaaa ccgtttacgc gttcctcggt gacggtgaaa tggacgaacc ggaatccaaa     720

    ggtgcgatca ccatcgctac ccgtgaaaaa ctggataacc tggtcttcgt tatcaactgt     780

    aacctgcagc gtcttgacgg cccggtcacc ggtaacggca agatcatcaa cgaactggaa     840

    ggcatcttcg aaggtgctgg ctggaacgtg atcaaagtga tgtggggtag ccgttgggat     900

    gaactgctgc gtaaggatac cagcggtaaa ctgatccagc tgatgaacga aaccgttgac     960

    ggcgactacc agaccttcaa atcgaaagat ggtgcgtacg ttcgtgaaca cttcttcggt    1020

    aaatatcctg aaaccgcagc actggttgca gactggactg acgagcagat ctgggcactg    1080

    aaccgtggtg gtcacgatcc gaagaaaatc tacgctgcat tcaagaaagc gcaggaaacc    1140

    aaaggcaaag cgacagtaat ccttgctcat accattaaag gttacggcat gggcgacgcg    1200

    gctgaaggta aaaacatcgc gcaccaggtt aagaaaatga acatggacgg tgtgcgtcat    1260

    atccgcgacc gtttcaatgt gccggtgtct gatgcagata tcgaaaaact gccgtacatc    1320

    accttcccgg aaggttctga agagcatacc tatctgcacg ctcagcgtca gaaactgcac    1380

    ggttatctgc caagccgtca gccgaacttc accgagaagc ttgagctgcc gagcctgcaa    1440

    gacttcggcg cgctgttgga agagcagagc aaagagatct ctaccactat cgctttcgtt    1500

    cgtgctctga acgtgatgct gaagaacaag tcgatcaaag atcgtctggt accgatcatc    1560

    gccgacgaag cgcgtacttt cggtatggaa ggtctgttcc gtcagattgg tatttacagc    1620

    ccgaacggtc agcagtacac cccgcaggac cgcgagcagg ttgcttacta taaagaagac    1680

    gagaaaggtc agattctgca ggaagggatc aacgagctgg gcgcaggttg ttcctggctg    1740

    gcagcggcga cctcttacag caccaacaat ctgccgatga tcccgttcta catctattac    1800

    tcgatgttcg gcttccagcg tattggcgat ctgtgctggg cggctggcga ccagcaagcg    1860

    cgtggcttcc tgatcggcgg tacttccggt cgtaccaccc tgaacggcga aggtctgcag    1920

    cacgaagatg gtcacagcca cattcagtcg ctgactatcc cgaactgtat ctcttacgac    1980

    ccggcttacg cttacgaagt tgctgtcatc atgcatgacg gtctggagcg tatgtacggt    2040

    gaaaaacaag agaacgttta ctactacatc actacgctga acgaaaacta ccacatgccg    2100

    gcaatgccgg aaggtgctga ggaaggtatc cgtaaaggta tctacaaact cgaaactatt    2160

    gaaggtagca aaggtaaagt tcagctgctc ggctccggtt ctatcctgcg tcacgtccgt    2220

    gaagcagctg agatcctggc gaaagattac ggcgtaggtt ctgacgttta tagcgtgacc    2280

    tccttcaccg agctggcgcg tgatggtcag gattgtgaac gctggaacat gctgcacccg    2340

    ctggaaactc cgcgcgttcc gtatatcgct caggtgatga acgacgctcc ggcagtggca    2400

    tctaccgact atatgaaact gttcgctgag caggtccgta cttacgtacc ggctgacgac    2460

    taccgcgtac tgggtactga tggcttcggt cgttccgaca gccgtgagaa cctgcgtcac    2520

    cacttcgaag ttgatgcttc ttatgtcgtg gttgcggcgc tgggcgaact ggctaaacgt    2580

    ggcgaaatcg ataagaaagt ggttgctgac gcaatcgcca aattcaacat cgatgcagat    2640

    aaagttaacc cgcgtctggc gtaa                                           2664

    <210>22

    <211>1893

    <212>DNA

    <213>aceF

    <400>22

    atggctatcg aaatcaaagt accggacatc ggggctgatg aagttgaaat caccgagatc     60

    ctggtcaaag tgggcgacaa agttgaagcc gaacagtcgc tgatcaccgt agaaggcgac    120

    aaagcctcta tggaagttcc gtctccgcag gcgggtatcg ttaaagagat caaagtctct    180

    gttggcgata aaacccagac cggcgcactg attatgattt tcgattccgc cgacggtgca    240

    gcagacgctg cacctgctca ggcagaagag aagaaagaag cagctccggc agcagcacca    300

    gcggctgcgg cggcaaaaga cgttaacgtt ccggatatcg gcagcgacga agttgaagtg    360

    accgaaatcc tggtgaaagt tggcgataaa gttgaagctg aacagtcgct gatcaccgta    420

    gaaggcgaca aggcttctat ggaagttccg gctccgtttg ctggcaccgt gaaagagatc    480

    aaagtgaacg tgggtgacaa agtgtctacc ggctcgctga ttatggtctt cgaagtcgcg    540

    ggtgaagcag gcgcggcagc tccggccgct aaacaggaag cagctccggc agcggcccct    600

    gcaccagcgg ctggcgtgaa agaagttaac gttccggata tcggcggtga cgaagttgaa    660

    gtgactgaag tgatggtgaa agtgggcgac aaagttgccg ctgaacagtc actgatcacc    720

    gtagaaggcg acaaagcttc tatggaagtt ccggcgccgt ttgcaggcgt cgtgaaggaa    780

    ctgaaagtca acgttggcga taaagtgaaa actggctcgc tgattatgat cttcgaagtt    840

    gaaggcgcag cgcctgcggc agctcctgcg aaacaggaag cggcagcgcc ggcaccggca    900

    gcaaaagctg aagccccggc agcagcacca gctgcgaaag cggaaggcaa atctgaattt    960

    gctgaaaacg acgcttatgt tcacgcgact ccgctgatcc gccgtctggc acgcgagttt   1020

    ggtgttaacc ttgcgaaagt gaagggcact ggccgtaaag gtcgtatcct gcgcgaagac   1080

    gttcaggctt acgtgaaaga agctatcaaa cgtgcagaag cagctccggc agcgactggc   1140

    ggtggtatcc ctggcatgct gccgtggccg aaggtggact tcagcaagtt tggtgaaatc   1200

    gaagaagtgg aactgggccg catccagaaa atctctggtg cgaacctgag ccgtaactgg   1260

    gtaatgatcc cgcatgttac tcacttcgac aaaaccgata tcaccgagtt ggaagcgttc   1320

    cgtaaacagc agaacgaaga agcggcgaaa cgtaagctgg atgtgaagat caccccggtt    1380

    gtcttcatca tgaaagccgt tgctgcagct cttgagcaga tgcctcgctt caatagttcg    1440

    ctgtcggaag acggtcagcg tctgaccctg aagaaataca tcaacatcgg tgtggcggtg    1500

    gataccccga acggtctggt tgttccggta ttcaaagacg tcaacaagaa aggcatcatc    1560

    gagctgtctc gcgagctgat gactatttct aagaaagcgc gtgacggtaa gctgactgcg    1620

    ggcgaaatgc agggcggttg cttcaccatc tccagcatcg gcggcctggg tactacccac    1680

    ttcgcgccga ttgtgaacgc gccggaagtg gctatcctcg gcgtttccaa gtccgcgatg    1740

    gagccggtgt ggaatggtaa agagttcgtg ccgcgtctga tgctgccgat ttctctctcc    1800

    ttcgaccacc gcgtgatcga cggtgctgat ggtgcccgtt tcattaccat cattaacaac    1860

    acgctgtctg acattcgccg tctggtgatg taa                                 1893

    <210>23

    <211>1263

    <212>DNA

    <213>PDA1

    <400>23

    atgcttgctg cttcattcaa acgccaacca tcacaattgg tccgcgggtt aggagctgtt     60

    cttcgcactc ccaccaggat aggtcatgtt cgtaccatgg caactttaaa aacaactgat    120

    aagaaggccc ctgaggacat cgagggctcg gacacagtgc aaattgagtt gcctgaatct    180

    tccttcgagt cgtatatgct agagcctcca gacttgtctt atgagacttc gaaagccacc    240

    ttgttacaga tgtataaaga tatggtcatc atcagaagaa tggagatggc ttgtgacgcc    300

    ttgtacaagg ccaagaaaat cagaggtttt tgccatctat ctgttggtca ggaggccatt    360

    gctgtcggta tcgagaatgc catcacaaaa ttggattcca tcatcacatc ttacagatgt    420

    cacggtttca cttttatgag aggtgcctca gtgaaagccg ttctggctga attgatgggt    480

    agaagagccg gtgtctctta tggtaagggt ggttccatgc acctttacgc tccaggcttc    540

    tatggtggta atggtatcgt gggtgcccag gttcctttag gtgcaggttt agcttttgct    600

    caccaataca agaacgagga cgcctgctct ttcactttgt atggtgatgg tgcctctaat    660

    caaggtcaag tttttgaatc tttcaacatg gccaaattat ggaatttgcc cgtcgtgttt    720

    tgctgtgaga acaacaagta cggtatgggt accgccgctt caagatcctc cgcgatgact    780

    gaatatttca agcgtggtca atatattcca ggtttaaaag ttaacggtat ggatattcta    840

    gctgtctacc aagcatccaa gtttgctaag gactggtgtc tatccggcaa aggtcctctc    900

    gttctagaat atgaaaccta taggtacggt ggccattcta tgtctgatcc cggtactacc    960

    tacagaacta gagacgagat tcagcatatg agatccaaga acgatccaat tgctggtctt   1020

    aagatgcatt tgattgatct aggtattgcc actgaagctg aagtcaaagc ttacgacaag   1080

    tccgctagaa aatacgttga cgaacaagtt gaattagctg atgctgctcc tcctccagaa   1140

    gccaaattat ccatcttgtt tgaagacgtc tacgtgaaag gtacagaaac tccaacccta   1200

    agaggtagga tccctgaaga tacttgggac ttcaaaaagc aaggttttgc ctctagggat   1260

    taa                                                                 1163

    <210>24

    <211>1101

    <212>DNA

    <213>PDB1

    <400>24

    atgttttcca gactgccaac atcattggcc agaaatgttg cacgtcgtgc cccaacttct     60

    tttgtaagac cctctgcagc agcagcagca ttgagattct catcaacaaa gacgatgacc    120

    gtcagagagg ccttgaatag tgccatggcg gaagaattgg accgtgatga tgatgtcttc    180

    cttattggtg aagaagttgc acaatataac ggggcttata aggtgtcaaa gggtttattg    240

    gacaggttcg gtgaacgtcg tgtggttgac acacctatta ccgaatacgg gttcacaggt    300

    ttggccgttg gtgccgcttt gaagggtttg aagccaattg tagagtttat gtcgttcaat    360

    ttctctatgc aagctatcga tcatgttgtc aattccgctg caaagactca ctacatgtct    420

    ggtggtactc aaaaatgtca aatggtcttc agaggtccta atggtgctgc agtgggtgtt    480

    ggtgctcaac attcacagga cttttctcct tggtacggtt ccattccagg gttaaaggtc    540

    cttgtccctt attctgctga agatgctagg ggtttgttaa aggccgccat cagagatcca    600

    aaccctgttg tatttttaga gaacgaattg ttgtacggtg aatcttttga aatctcagaa    660

    gaagctttat cccctgagtt caccttgcca tacaaggcta agatcgaaag agaaggtacc    720

    gatatttcca ttgttacgta cacaagaaac gttcagtttt ctttggaagc cgctgaaatt    780

    ctacaaaaga aatatggtgt ctctgcagaa gttatcaact tgcgttctat tagaccttta    840

    gatactgaag ctatcatcaa aactgtcaag aagacaaacc acttgattac tgttgaatcc    900

    actttcccat catttggtgt tggtgctgaa attgtcgccc aagttatgga gtctgaagcc    960

    tttgattact tggatgctcc aatccaaaga gttactggtg ccgatgttcc aacaccttac   1020

    gctaaagaat tagaagattt cgctttccct gatactccaa ccatcgttaa agctgtcaaa   1080

    gaagtcttgt caattgaata a                                             1101

    <210>25

    <211>1233

    <212>DNA

    <213>PDX1

    <400>25

    atgctaagtg caatttccaa agtctccact ttaaaatcat gtacaagata tttaaccaaa     60

    tgcaactatc atgcatcagc taaattactt gctgtaaaga cattttcaat gcctgcaatg    120

    tctcctacta tggagaaagg ggggattgtg tcttggaaat ataaagttgg cgaaccattc    180

    agcgcgggcg atgtgatatt agaagtggaa acagataaat ctcaaattga tgtggaagca    240

    ctggacgatg gtaaactagc taagatcctg aaagatgaag gctctaaaga tgttgatgtt    300

    ggtgaaccta ttgcttatat tgctgatgtt gatgatgatt tagctactat aaagttaccc    360

    caagaggcca acaccgcaaa tgcgaaatct attgaaatta agaagccatc cgcagatagt    420

    actgaagcaa cacaacaaca tttaaaaaaa gccacagtta caccaataaa aaccgttgac    480

    ggcagccaag ccaatcttga acagacgcta ttaccatccg tgtcattact actggctgag    540

    aacaatatat ccaaacaaaa ggctttgaag gaaattgcgc catctggttc caacggtaga    600

    ctattaaagg gtgatgtgct agcataccta gggaaaatac cacaagattc ggttaacaag    660

    gtaacagaat ttatcaagaa gaacgaacgt ctcgatttat cgaacattaa acctatacag    720

    ctcaaaccaa aaatagccga gcaagctcaa acaaaagctg ccgacaagcc aaagattact    780

    cctgtagaat ttgaagagca attagtgttc catgctcccg cctctattcc gtttgacaaa    840

    ctgagtgaat cattgaactc tttcatgaaa gaagcttacc agttctcaca cggaacacca    900

    ctaatggaca caaattcgaa atactttgac cctattttcg aggaccttgt caccttgagc    960

    ccaagagagc caagatttaa attttcctat gacttgatgc aaattcccaa agctaataac   1020

    atgcaagaca cgtacggtca agaagacata tttgacctct taacaggttc agacgcgact   1080

    gcctcatcag taagacccgt tgaaaagaac ttacctgaaa aaaacgaata tatactagcg   1140

    ttgaatgtta gcgtcaacaa caagaagttt aatgacgcgg aggccaaggc aaaaagattc   1200

    cttgattacg taagggagtt agaatcattt  tga                               1233

    <210>26

    <211>1449

    <212>DNA

    <213>LAT1

    <400>26

    atgtctgcct ttgtcagggt ggttccaaga atatccagaa gttcagtact caccagatca     60

    ttgagactgc aattgagatg ctacgcatcg tacccagagc acaccattat tggtatgccg    120

    gcactgtctc ctacgatgac gcaaggtaat cttgctgctt ggactaagaa ggaaggtgac    180

    caattgtctc ccggtgaagt tattgccgaa atagaaacag acaaggctca aatggacttt    240

    gagttccaag aagatggtta cttagccaag attctagttc ctgaaggtac aaaggacatt    300

    cctgtcaaca agcctattgc cgtctatgtg gaggacaaag ctgatgtgcc agcttttaag    360

    gactttaagc tggaggattc aggttctgat tcaaagacca gtacgaaggc tcagcctgcc    420

    gaaccacagg cagaaaagaa acaagaagcg ccagctgaag agaccaagac ttctgcacct    480

    gaagctaaga aatctgacgt tgctgctcct caaggtagga tttttgcctc tccacttgcc    540

    aagactatcg ccttggaaaa gggtatttct ttgaaggatg ttcacggcac tggaccccgc    600

    ggtagaatta ccaaggctga cattgagtca tatctagaaa agtcgtctaa gcagtcttct    660

    caaaccagtg gtgctgccgc cgccactcct gccgccgcta cctcaagcac tactgctggc    720

    tctgctccat cgccttcttc tacagcatca tatgaggatg ttccaatttc aaccatgaga    780

    agcatcattg gagaacgttt attgcaatct actcaaggca ttccatcata catcgtttcc    840

    tccaagatat ccatctccaa acttttgaaa ttgagacagt ccttgaacgc tacagcaaac    900

    gacaagtaca aactgtccat taatgaccta ttagtaaaag ccatcactgt tgcggctaag    960

    agggtgccag atgccaatgc ctactggtta cctaatgaga acgttatccg taaattcaag    1020

    aatgtcgatg tctcagtcgc tgttgccaca ccaacaggat tattgacacc aattgtcaag    1080

    aattgtgagg ccaagggctt gtcgcaaatc tctaacgaaa tcaaggaact agtcaagcgt    1140

    gccagaataa acaaattggc accagaggaa ttccaaggtg ggaccatttg catatccaat    1200

    atgggcatga ataatgctgt taacatgttt acttcgatta tcaacccacc acagtctaca    1260

    atcttggcca tcgctactgt tgaaagggtc gctgtggaag acgccgctgc tgagaacgga    1320

    ttctcctttg ataaccaggt taccataaca gggacctttg atcatagaac cattgatggc    1380

    gccaaaggtg cagaattcat gaaggaattg aaaactgtta ttgaaaatcc tttggaaatg    1440

    ctattgtga                                                            1449

    <210>27

    <211>1500

    <212>DNA

    <213>LPD1

    <400>27

    atgttaagaa tcagatcact cctaaataat aagcgtgcct tttcgtccac agtcaggaca     60

    ttgaccatta acaagtcaca tgatgtagtc atcatcggtg gtggccctgc tggttacgtg    120

    gctgctatca aagctgctca attgggattt aacactgcat gtgtagaaaa aagaggcaaa    180

    ttaggcggta cctgtcttaa cgttggatgt atcccctcca aagcacttct aaataattct    240

    catttattcc accaaatgca tacggaagcg caaaagagag gtattgacgt caacggtgat    300

    atcaaaatta acgtagcaaa cttccaaaag gctaaggatg acgctgttaa gcaattaact    360

    ggaggtattg agcttctgtt caagaaaaat aaggtcacct attataaagg taatggttca    420

    ttcgaagacg aaacgaagat cagagtaact cccgttgatg ggttggaagg cactgtcaag    480

    gaagaccaca tactagatgt taagaacatc atagtcgcca cgggctctga agttacaccc    540

    ttccccggta ttgaaataga tgaggaaaaa attgtctctt caacaggtgc tctttcgtta    600

    aaggaaattc ccaaaagatt aaccatcatt ggtggaggaa tcatcggatt ggaaatgggt    660

    tcagtttact ctagattagg ctccaaggtt actgtagtag aatttcaacc tcaaattggt    720

    gcatctatgg acggcgaggt tgccaaagcc acccaaaagt tcttgaaaaa gcaaggtttg    780

    gacttcaaat taagcaccaa agttatttct gcaaagagaa acgacgacaa gaacgtcgtc    840

    gaaattgttg tagaagatac taaaacgaat aagcaagaaa atttggaagc tgaagttttg    900

    ctggttgctg ttggtagaag accttacatt gctggcttag gggctgaaaa gattggatta    960

    gaagtagaca aaaggggacg cctagtcatt gatgaccaat ttaattccaa gttcccacac   1020

    attaaagtgg taggagatgt tacatttggt ccaatgctgg ctcacaaagc cgaagaggaa   1080

    ggtattgcag ctgtcgaaat gttgaaaact ggtcacggtc atgtcaacta taacaacatt   1140

    ccttcggtca tgtattctca cccagaagta gcatgggttg gtaaaaccga agagcaattg   1200

    aaagaagccg gcattgacta taaaattggt aagttcccct ttgcggccaa ttcaagagcc   1260

    aagaccaacc aagacactga aggtttcgtg aagattttga tcgattccaa gaccgagcgt   1320

    attttggggg ctcacattat cggtccaaat gccggtgaaa tgattgctga agctggctta    1380

    gccttagaat atggcgcttc cgcagaagat gttgctaggg tctgccatgc tcatcctact    1440

    ttgtccgaag catttaagga agctaacatg gctgcctatg ataaagctat tcattgttga    1500

    <210>28

    <211>1692

    <212>DNA

    <213>PDC1

    <400>28

    atgtctgaaa ttactttggg taaatatttg ttcgaaagat taaagcaagt caacgttaac     60

    accgttttcg gtttgccagg tgacttcaac ttgtccttgt tggacaagat ctacgaagtt    120

    gaaggtatga gatgggctgg taacgccaac gaattgaacg ctgcttacgc cgctgatggt    180

    tacgctcgta tcaagggtat gtcttgtatc atcaccacct tcggtgtcgg tgaattgtct    240

    gctttgaacg gtattgccgg ttcttacgct gaacacgtcg gtgttttgca cgttgttggt    300

    gtcccatcca tctctgctca agctaagcaa ttgttgttgc accacacctt gggtaacggt    360

    gacttcactg ttttccacag aatgtctgcc aacatttctg aaaccactgc tatgatcact    420

    gacattgcta ccgccccagc tgaaattgac agatgtatca gaaccactta cgtcacccaa    480

    agaccagtct acttaggttt gccagctaac ttggtcgact tgaacgtccc agctaagttg    540

    ttgcaaactc caattgacat gtctttgaag ccaaacgatg ctgaatccga aaaggaagtc    600

    attgacacca tcttggcttt ggtcaaggat gctaagaacc cagttatctt ggctgatgct    660

    tgttgttcca gacacgacgt caaggctgaa actaagaagt tgattgactt gactcaattc    720

    ccagctttcg tcaccccaat gggtaagggt tccattgacg aacaacaccc aagatacggt    780

    ggtgtttacg tcggtacctt gtccaagcca gaagttaagg aagccgttga atctgctgac    840

    ttgattttgt ctgtcggtgc tttgttgtct gatttcaaca ccggttcttt ctcttactct    900

    tacaagacca agaacattgt cgaattccac tccgaccaca tgaagatcag aaacgccact    960

    ttcccaggtg tccaaatgaa attcgttttg caaaagttgt tgaccactat tgctgacgcc   1020

    gctaagggtt acaagccagt tgctgtccca gctagaactc cagctaacgc tgctgtccca   1080

    gcttctaccc cattgaagca agaatggatg tggaaccaat tgggtaactt cttgcaagaa   1140

    ggtgatgttg tcattgctga aaccggtacc tccgctttcg gtatcaacca aaccactttc   1200

    ccaaacaaca cctacggtat ctctcaagtc ttatggggtt ccattggttt caccactggt   1260

    gctaccttgg gtgctgcttt cgctgctgaa gaaattgatc caaagaagag agttatctta   1320

    ttcattggtg acggttcttt gcaattgact gttcaagaaa tctccaccat gatcagatgg   1380

    ggcttgaagc catacttgtt cgtcttgaac aacgatggtt acaccattga aaagttgatt   1440

    cacggtccaa aggctcaata caacgaaatt caaggttggg accacctatc cttgttgcca   1500

    actttcggtg ctaaggacta tgaaacccac agagtcgcta ccaccggtga atgggacaag   1560

    ttgacccaag acaagtcttt caacgacaac tctaagatca gaatgattga aatcatgttg   1620

    ccagtcttcg atgctccaca aaacttggtt gaacaagcta agttgactgc tgctaccaac   1680

    gctaagcaat  aa                                                      1692

    <210>29

    <211>1503

    <212>DNA

    <213>ALD6

    <400>29

    atgactaagc tacactttga cactgctgaa ccagtcaaga tcacacttcc aaatggtttg     60

    acatacgagc aaccaaccgg tctattcatt aacaacaagt ttatgaaagc tcaagacggt    120

    aagacctatc ccgtcgaaga tccttccact gaaaacaccg tttgtgaggt ctcttctgcc    180

    accactgaag atgttgaata tgctatcgaa tgtgccgacc gtgctttcca cgacactgaa    240

    tgggctaccc aagacccaag agaaagaggc cgtctactaa gtaagttggc tgacgaattg    300

    gaaagccaaa ttgacttggt ttcttccatt gaagctttgg acaatggtaa aactttggcc    360

    ttagcccgtg gggatgttac cattgcaatc aactgtctaa gagatgctgc tgcctatgcc    420

    gacaaagtca acggtagaac aatcaacacc ggtgacggct acatgaactt caccacctta    480

    gagccaatcg gtgtctgtgg tcaaattatt ccatggaact ttccaataat gatgttggct    540

    tggaagatcg ccccagcatt ggccatgggt aacgtctgta tcttgaaacc cgctgctgtc    600

    acacctttaa atgccctata ctttgcttct ttatgtaaga aggttggtat tccagctggt    660

    gtcgtcaaca tcgttccagg tcctggtaga actgttggtg ctgctttgac caacgaccca    720

    agaatcagaa agctggcttt taccggttct acagaagtcg gtaagagtgt tgctgtcgac    780

    tcttctgaat ctaacttgaa gaaaatcact ttggaactag gtggtaagtc cgcccatttg    840

    gtctttgacg atgctaacat taagaagact ttaccaaatc tagtaaacgg tattttcaag    900

    aacgctggtc aaatttgttc ctctggttct agaatttacg ttcaagaagg tatttacgac    960

    gaactattgg ctgctttcaa ggcttacttg gaaaccgaaa tcaaagttgg taatccattt   1020

    gacaaggcta acttccaagg tgctatcact aaccgtcaac aattcgacac aattatgaac   1080

    tacatcgata tcggtaagaa agaaggcgcc aagatcttaa ctggtggcga aaaagttggt   1140

    gacaagggtt acttcatcag accaaccgtt ttctacgatg ttaatgaaga catgagaatt   1200

    gttaaggaag aaatttttgg accagttgtc actgtcgcaa agttcaagac tttagaagaa   1260

    ggtgtcgaaa tggctaacag ctctgaattc ggtctaggtt ctggtatcga aacagaatct   1320

    ttgagcacag gtttgaaggt ggccaagatg ttgaaggccg gtaccgtctg gatcaacaca   1380

    tacaacgatt ttgactccag agttccattc ggtggtgtta agcaatctgg ttacggtaga   1440

    gaaatgggtg aagaagtcta ccatgcatac actgaagtaa aagctgtcag aattaagttg   1500

    taa                                                                 1503

    <210>30

    <211>2142

    <212>DNA

    <213>ACS1

    atgtcgccct ctgccgtaca atcatcaaaa ctagaagaac agtcaagtga aattgacaag      60

    ttgaaagcaa aaatgtccca gtctgccgcc actgcgcagc agaagaagga acatgagtat     120

    gaacatttga cttcggtcaa gatcgtgcca caacggccca tctcagatag actgcagccc     180

    gcaattgcta cccactattc tccacacttg gacgggttgc aggactatca gcgcttgcac     240

    aaggagtcta ttgaagaccc tgctaagttc ttcggttcta aagctaccca atttttaaac     300

    tggtctaagc cattcgataa ggtgttcatc ccagacccta aaacgggcag gccctccttc     360

    cagaacaatg catggttcct caacggccaa ttaaacgcct gttacaactg tgttgacaga     420

    catgccttga agactcctaa caagaaagcc attattttcg aaggtgacga gcctggccaa     480

    ggctattcca ttacctacaa ggaactactt gaagaagttt gtcaagtggc acaagtgctg     540

    acttactcta tgggcgttcg caagggcgat actgttgccg tgtacatgcc tatggtccca     600

    gaagcaatca taaccttgtt ggccatttcc cgtatcggtg ccattcactc cgtagtcttt     660

    gccgggtttt cttccaactc cttgagagat cgtatcaacg atggggactc taaagttgtc     720

    atcactacag atgaatccaa cagaggtggt aaagtcattg agactaaaag aattgttgat     780

    gacgcgctaa gagagacccc aggcgtgaga cacgtcttgg tttatagaaa gaccaacaat     840

    ccatctgttg ctttccatgc ccccagagat ttggattggg caacagaaaa gaagaaatac     900

    aagacctact atccatgcac acccgttgat tctgaggatc cattattctt gttgtatacg     960

    tctggttcta ctggtgcccc caagggtgtt caacattcta ccgcaggtta cttgctggga    1020

    gctttgttga ccatgcgcta cacttttgac actcaccaag aagacgtttt cttcacagct    1080

    ggagacattg gctggattac aggccacact tatgtggttt atggtccctt actatatggt    1140

    tgtgccactt tggtctttga agggactcct gcgtacccaa attactcccg ttattgggat    1200

    attattgatg aacacaaagt cacccaattt tatgttgcgc caactgcttt gcgtttgttg    1260

    aaaagagctg gtgattccta catcgaaaat cattccttaa aatctttgcg ttgcttgggt    1320

    tcggtcggtg agccaattgc tgctgaagtt tgggagtggt actctgaaaa aataggtaaa    1380

    aatgaaatcc ccattgtaga cacctactgg caaacagaat ctggttcgca tctggtcacc    1440

    ccgctggctg gtggtgttac accaatgaaa ccgggttctg cctcattccc cttcttcggt    1500

    attgatgcag ttgttcttga ccctaacact ggtgaagaac ttaacaccag ccacgcagag    1560

    ggtgtccttg ccgtcaaagc tgcatggcca tcatttgcaa gaactatttg gaaaaatcat    1620

    gataggtatc tagacactta tttgaaccct taccctggct actatttcac tggtgatggt    1680

    gctgcaaagg ataaggatgg ttatatctgg attttgggtc gtgtagacga tgtggtgaac    1740

    gtctctggtc accgtctgtc taccgctgaa attgaggctg ctattatcga agatccaatt    1800

    gtggccgagt gtgctgttgt cggattcaac gatgacttga ctggtcaagc agttgctgca    1860

    tttgtggtgt tgaaaaacaa atctagttgg tccaccgcaa cagatgatga attacaagat    1920

    atcaagaagc atttggtctt tactgttaga aaagacatcg ggccatttgc cgcaccaaaa    1980

    ttgatcattt tagtggatga cttgcccaag acaagatccg gcaaaattat gagacgtatt    2040

    ttaagaaaaa tcctagcagg agaaagtgac caactaggcg acgtttctac attgtcaaac    2100

    cctggcattg ttagacatct aattgattcg gtcaagttgt aa                       2142

    <210>31

    <211>2052

    <212>DNA

    <213>ACS2

    <400>31

    atgacaatca aggaacataa agtagtttat gaagctcaca acgtaaaggc tcttaaggct     60

    cctcaacatt tttacaacag ccaacccggc aagggttacg ttactgatat gcaacattat    120

    caagaaatgt atcaacaatc tatcaatgag ccagaaaaat tctttgataa gatggctaag    180

    gaatacttgc attgggatgc tccatacacc aaagttcaat ctggttcatt gaacaatggt    240

    gatgttgcat ggtttttgaa cggtaaattg aatgcatcat acaattgtgt tgacagacat    300

    gcctttgcta atcccgacaa gccagctttg atctatgaag ctgatgacga atccgacaac    360

    aaaatcatca catttggtga attactcaga aaagtttccc aaatcgctgg tgtcttaaaa    420

    agctggggcg ttaagaaagg tgacacagtg gctatctatt tgccaatgat tccagaagcg    480

    gtcattgcta tgttggctgt ggctcgtatt ggtgctattc actctgttgt ctttgctggg    540

    ttctccgctg gttcgttgaa agatcgtgtc gttgacgcta attctaaagt ggtcatcact    600

    tgtgatgaag gtaaaagagg tggtaagacc atcaacacta aaaaaattgt tgacgaaggt    660

    ttgaacggag tcgatttggt ttcccgtatc ttggttttcc aaagaactgg tactgaaggt    720

    attccaatga aggccggtag agattactgg tggcatgagg aggccgctaa gcagagaact    780

    tacctacctc ctgtttcatg tgacgctgaa gatcctctat ttttattata cacttccggt    840

    tccactggtt ctccaaaggg tgtcgttcac actacaggtg gttatttatt aggtgccgct    900

    ttaacaacta gatacgtttt tgatattcac ccagaagatg ttctcttcac tgccggtgac    960

    gtcggctgga tcacgggtca cacctatgct ctatatggtc cattaacctt gggtaccgcc   1020

    tcaataattt tcgaatccac tcctgcctac ccagattatg gtagatattg gagaattatc   1080

    caacgtcaca aggctaccca tttctatgtg gctccaactg ctttaagatt aatcaaacgt   1140

    gtaggtgaag ccgaaattgc caaatatgac acttcctcat tacgtgtctt gggttccgtc   1200

    ggtgaaccaa tctctccaga cttatgggaa tggtatcatg aaaaagtggg taacaaaaac   1260

    tgtgtcattt gtgacactat gtggcaaaca gagtctggtt ctcatttaat tgctcctttg   1320

    gcaggtgctg tcccaacaaa acctggttct gctaccgtgc cattctttgg tattaacgct   1380

    tgtatcattg accctgttac aggtgtggaa ttagaaggta atgatgtcga aggtgtcctt   1440

    gccgttaaat caccatggcc atcaatggct agatctgttt ggaaccacca cgaccgttac   1500

    atggatactt acttgaaacc ttatcctggt cactatttca caggtgatgg tgctggtaga   1560

    gatcatgatg gttactactg gatcaggggt agagttgacg acgttgtaaa tgtttccggt   1620

    catagattat ccacatcaga aattgaagca tctatctcaa atcacgaaaa cgtctcggaa   1680

    gctgctgttg tcggtattcc agatgaattg accggtcaaa ccgtcgttgc atatgtttcc    1740

    ctaaaagatg gttatctaca aaacaacgct actgaaggtg atgcagaaca catcacacca    1800

    gataatttac gtagagaatt gatcttacaa gttaggggtg agattggtcc tttcgcctca    1860

    ccaaaaacca ttattctagt tagagatcta ccaagaacaa ggtcaggaaa gattatgaga    1920

    agagttctaa gaaaggttgc ttctaacgaa gccgaacagc taggtgacct aactactttg    1980

    gccaacccag aagttgtacc tgccatcatt tctgctgtag agaaccaatt tttctctcaa    2040

    aaaaagaaat  aa                                                       2052

    <210>32

    <211>5206

    <212>DNA

    <213>pGV1428

    <400>32

    ccataacaca gtcctttccc gcaattttct ttttctatta ctcttggcct cctctagtac     60

    actctatatt tttttatgcc tcggtaatga ttttcatttt tttttttccc ctagcggatg    120

    actctttttt tttcttagcg attggcatta tcacataatg aattatacat tatataaagt    180

    aatgtgattt cttcgaagaa tatactaaaa aatgagcagg caagataaac gaaggcaaag    240

    atgacagagc agaaagccct agtaaagcgt attacaaatg aaaccaagat tcagattgcg    300

    atctctttaa agggtggtcc cctagcgata gagcactcga tcttcccaga aaaagaggca    360

    gaagcagtag cagaacaggc cacacaatcg caagtgatta acgtccacac aggtataggg    420

    tttctggacc atatgataca tgctctggcc aagcattccg gctggtcgct aatcgttgag    480

    tgcattggtg acttacacat agacgaccat cacaccactg aagactgcgg gattgctctc    540

    ggtcaagctt ttaaagaggc cctaggggcc gtgcgtggag taaaaaggtt tggatcagga    600

    tttgcgcctt tggatgaggc actttccaga gcggtggtag atctttcgaa caggccgtac    660

    gcagttgtcg aacttggttt gcaaagggag aaagtaggag atctctcttg cgagatgatc    720

    ccgcattttc ttgaaagctt tgcagaggct agcagaatta ccctccacgt tgattgtctg    780

    cgaggcaaga atgatcatca ccgtagtgag agtgcgttca aggctcttgc ggttgccata    840

    agagaagcca cctcgcccaa tggtaccaac gatgttccct ccaccaaagg tgttcttatg    900

    tagtgacacc gattatttaa agctgcagca tacgatatat atacatgtgt atatatgtat    960

    acctatgaat gtcagtaagt atgtatacga acagtatgat actgaagatg acaaggtaat   1020

    gcatcattct atacgtgtca ttctgaacga ggcgacgtcg ccggcgatca cagcggacgg   1080

    tggtggcatg atggggcttg cgatgctatg tttgtttgtt ttgtgatgat gtatattatt   1140

    attgaaaaac gatatcagac atttgtctga taatgcttca ttatcagaca aatgtctgat   1200

    atcgtttgga gaaaaagaaa aggaaaacaa actaaatatc tactatatac cactgtattt   1260

    tatactaatg actttctacg cctagtgtca ccctctcgtg tacccattga ccctgtatcg   1320

    gcgcgttgcc tcgcgttcct gtaccatata tttttgttta tttaggtatt aaaatttact   1380

    ttcctcatac aaatattaaa ttcaccaaac ttctcaaaaa ctaattattc gtagttacaa    1440

    actctatttt acaatcacgt ttattcaacc attctacatc caataaccaa aatgcccatg    1500

    tacctctcag cgaagtccaa cggtactgtc caatattctc attaaatagt ctttcatcta    1560

    tatatcagaa ggtaattata attagagatt tcgaatcatt accgtgccga ttcgcacgct    1620

    gcaacggcat gcatcactaa tgaaaagcat acgacgcctg cgtctgacat gcactcattc    1680

    tgaagaagat tctgggcgcg tttcgttctc gttttcctct gtatattgta ctctggtgga    1740

    caatttgaac ataacgtctt tcacctcgcc attctcaata atgggttcca attctatcca    1800

    ggtagcggtt aattgacggt gcttaagccg tatgctcact ctaacgctac cgttgtccaa    1860

    acaacggacc cctttgtgac gggtgtaaga cccatcatga agtaaaacat ctctaacggt    1920

    atggaaaaga gtggtacggt caagtttcct ggcacgagtc aattttccct cttcgtgtag    1980

    atcggtaccg gccgcaaatt aaagccttcg agcgtcccaa aaccttctca agcaaggttt    2040

    tcagtataat gttacatgcg tacacgcgtc tgtacagaaa aaaaagaaaa atttgaaata    2100

    taaataacgt tcttaatact aacataacta taaaaaaata aatagggacc tagacttcag    2160

    gttgtctaac tccttccttt tcggttagag cggatgtggg gggagggcgt gaatgtaagc    2220

    gtgacataac taattacatg actcgagcgg ccgcggatcc cgggaattcg tcgacaccat    2280

    cttcttctga gatgagtttt tgttccatgc tagttctaga atccgtcgaa actaagttct    2340

    ggtgttttaa aactaaaaaa aagactaact ataaaagtag aatttaagaa gtttaagaaa    2400

    tagatttaca gaattacaat caatacctac cgtctttata tacttattag tcaagtaggg    2460

    gaataatttc agggaactgg tttcaacctt ttttttcagc tttttccaaa tcagagagag    2520

    cagaaggtaa tagaaggtgt aagaaaatga gatagataca tgcgtgggtc aattgccttg    2580

    tgtcatcatt tactccaggc aggttgcatc actccattga ggttgtgccc gttttttgcc    2640

    tgtttgtgcc cctgttctct gtagttgcgc taagagaatg gacctatgaa ctgatggttg    2700

    gtgaagaaaa caatattttg gtgctgggat tctttttttt tctggatgcc agcttaaaaa    2760

    gcgggctcca ttatatttag tggatgccag gaataaactg ttcacccaga cacctacgat    2820

    gttatatatt ctgtgtaacc cgccccctat tttgggcatg tacgggttac agcagaatta    2880

    aaaggctaat tttttgacta aataaagtta ggaaaatcac tactattaat tatttacgta    2940

    ttctttgaaa tggcgagtat tgataatgat aaactgagct agatctgggc ccgagctcca    3000

    gcttttgttc cctttagtga gggttaattg cgcgcttggc gtaatcatgg tcatagctgt    3060

    ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa cataggagcc ggaagcataa    3120

    agtgtaaagc ctggggtgcc taatgagtga ggtaactcac attaattgcg ttgcgctcac    3180

    tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg    3240

    cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact gactcgctgc    3300

    gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat    3360

    ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca    3420

    ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc    3480

    atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc    3540

    aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg    3600

    gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta    3660

    ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg    3720

    ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac    3780

    acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag    3840

    gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat    3900

    ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat    3960

    ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc    4020

    gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt    4080

    ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct    4140

    agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt    4200

    ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc    4260

    gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac    4320

    catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat    4380

    cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg    4440

    cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata    4500

    gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta    4560

    tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt    4620

    gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag    4680

    tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa    4740

    gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc    4800

    gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt    4860

    taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc    4920

    tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta    4980

    ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa    5040

    taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca    5100

    tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac    5160

    aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgt                   5206

    <210>33

    <211>5157

    <212>DNA

    <213>pGV1429

    <400>33

    caggcaagtg cacaaacaat acttaaataa atactactca gtaataacct atttcttagc      60

    atttttgacg aaatttgcta ttttgttaga gtcttttaca ccatttgtct ccacacctcc    120

    gcttacatca acaccaataa cgccatttaa tctaagcgca tcaccaacat tttctggcgt    180

    cagtccacca gctaacataa aatgtaagct ttcggggctc tcttgccttc caacccagtc    240

    agaaatcgag ttccaatcca aaagttcacc tgtcccacct gcttctgaat caaacaaggg    300

    aataaacgaa tgaggtttct gtgaagctgc actgagtagt atgttgcagt cttttggaaa    360

    tacgagtctt ttaataactg gcaaaccgag gaactcttgg tattcttgcc acgactcatc    420

    tccatgcagt tggacgatat caatgccgta atcattgacc agagccaaaa catcctcctt    480

    aggttgatta cgaaacacgc caaccaagta tttcggagtg cctgaactat ttttatatgc    540

    ttttacaaga cttgaaattt tccttgcaat aaccgggtca attgttctct ttctattggg    600

    cacacatata atacccagca agtcagcatc ggaatctaga gcacattctg cggcctctgt    660

    gctctgcaag ccgcaaactt tcaccaatgg accagaacta cctgtgaaat taataacaga    720

    catactccaa gctgcctttg tgtgcttaat cacgtatact cacgtgctca atagtcacca    780

    atgccctccc tcttggccct ctccttttct tttttcgacc gaattaattc ttaatcggca    840

    aaaaaagaaa agctccggat caagattgta cgtaaggtga caagctattt ttcaataaag    900

    aatatcttcc actactgcca tctggcgtca taactgcaaa gtacacatat attacgatgc    960

    tgtctattaa atgcttccta tattatatat atagtaatgt cgttgacgtc gccggcgatc   1020

    acagcggacg gtggtggcat gatggggctt gcgatgctat gtttgtttgt tttgtgatga   1080

    tgtatattat tattgaaaaa cgatatcaga catttgtctg ataatgcttc attatcagac   1140

    aaatgtctga tatcgtttgg agaaaaagaa aaggaaaaca aactaaatat ctactatata   1200

    ccactgtatt ttatactaat gactttctac gcctagtgtc accctctcgt gtacccattg   1260

    accctgtatc ggcgcgttgc ctcgcgttcc tgtaccatat atttttgttt atttaggtat   1320

    taaaatttac tttcctcata caaatattaa attcaccaaa cttctcaaaa actaattatt   1380

    cgtagttaca aactctattt tacaatcacg tttattcaac cattctacat ccaataacca   1440

    aaatgcccat gtacctctca gcgaagtcca acggtactgt ccaatattct cattaaatag   1500

    tctttcatct atatatcaga aggtaattat aattagagat ttcgaatcat taccgtgccg   1560

    attcgcacgc tgcaacggca tgcatcacta atgaaaagca tacgacgcct gcgtctgaca   1620

    tgcactcatt ctgaagaaga ttctgggcgc gtttcgttct cgttttcctc tgtatattgt   1680

    actctggtgg acaatttgaa cataacgtct ttcacctcgc cattctcaat aatgggttcc   1740

    aattctatcc aggtagcggt taattgacgg tgcttaagcc gtatgctcac tctaacgcta   1800

    ccgttgtcca aacaacggac ccctttgtga cgggtgtaag acccatcatg aagtaaaaca   1860

    tctctaacgg tatggaaaag agtggtacgg tcaagtttcc tggcacgagt caattttccc   1920

    tcttcgtgta gatcggtacc ggccgcaaat taaagccttc gagcgtccca aaaccttctc   1980

    aagcaaggtt ttcagtataa tgttacatgc gtacacgcgt ctgtacagaa aaaaaagaaa   2040

    aatttgaaat ataaataacg ttcttaatac taacataact ataaaaaaat aaatagggac   2100

    ctagacttca ggttgtctaa ctccttcctt ttcggttaga gcggatgtgg ggggagggcg    2160

    tgaatgtaag cgtgacataa ctaattacat gactcgagcg gccgcggatc ccgggaattc    2220

    gtcgacacca tcttcttctg agatgagttt ttgttccatg ctagttctag aatccgtcga    2280

    aactaagttc tggtgtttta aaactaaaaa aaagactaac tataaaagta gaatttaaga    2340

    agtttaagaa atagatttac agaattacaa tcaataccta ccgtctttat atacttatta    2400

    gtcaagtagg ggaataattt cagggaactg gtttcaacct tttttttcag ctttttccaa    2460

    atcagagaga gcagaaggta atagaaggtg taagaaaatg agatagatac atgcgtgggt    2520

    caattgcctt gtgtcatcat ttactccagg caggttgcat cactccattg aggttgtgcc    2580

    cgttttttgc ctgtttgtgc ccctgttctc tgtagttgcg ctaagagaat ggacctatga    2640

    actgatggtt ggtgaagaaa acaatatttt ggtgctggga ttcttttttt ttctggatgc    2700

    cagcttaaaa agcgggctcc attatattta gtggatgcca ggaataaact gttcacccag    2760

    acacctacga tgttatatat tctgtgtaac ccgcccccta ttttgggcat gtacgggtta    2820

    cagcagaatt aaaaggctaa ttttttgact aaataaagtt aggaaaatca ctactattaa    2880

    ttatttacgt attctttgaa atggcgagta ttgataatga taaactgagc tagatctggg    2940

    cccgagctcc agcttttgtt ccctttagtg agggttaatt gcgcgcttgg cgtaatcatg    3000

    gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca acataggagc    3060

    cggaagcata aagtgtaaag cctggggtgc ctaatgagtg aggtaactca cattaattgc    3120

    gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat    3180

    cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac    3240

    tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt    3300

    aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca    3360

    gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc    3420

    ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact    3480

    ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct    3540

    gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag    3600

    ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca    3660

    cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa    3720

    cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc    3780

    gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag    3840

    aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg    3900

    tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca    3960

    gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc    4020

    tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag    4080

    gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata    4140

    tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat    4200

    ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg    4260

    ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc    4320

    tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc    4380

    aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc    4440

    gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc    4500

    gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc    4560

    ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa    4620

    gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat    4680

    gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata    4740

    gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca    4800

    tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag    4860

    gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc    4920

    agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc    4980

    aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata    5040

    ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta    5100

    gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgt       5157

    <210>34

    <211>6041

    <212>DNA

    <213>pGV1430

    <400>34

    ccagttaact gtgggaatac tcaggtatcg taagatgcaa gagttcgaat ctcttagcaa     60

    ccattatttt tttcctcaac ataacgagaa cacacagggg cgctatcgca cagaatcaaa    120

    ttcgatgact ggaaattttt tgttaatttc agaggtcgcc tgacgcatat acctttttca    180

    actgaaaaat tgggagaaaa aggaaaggtg agagcgccgg aaccggcttt tcatatagaa    240

    tagagaagcg ttcatgacta aatgcttgca tcacaatact tgaagttgac aatattattt    300

    aaggacctat tgttttttcc aataggtggt tagcaatcgt cttactttct aacttttctt    360

    accttttaca tttcagcaat atatatatat atatttcaag gatataccat tctaatgtct    420

    gcccctaaga agatcgtcgt tttgccaggt gaccacgttg gtcaagaaat cacagccgaa    480

    gccattaagg ttcttaaagc tatttctgat gttcgttcca atgtcaagtt cgatttcgaa    540

    aatcatttaa ttggtggtgc tgctatcgat gctacaggtg ttccacttcc agatgaggcg    600

    ctggaagcct ccaagaaggc tgatgccgtt ttgttaggtg ctgtgggtgg tcctaaatgg    660

    ggtaccggta gtgttagacc tgaacaaggt ttactaaaaa tccgtaaaga acttcaattg    720

    tacgccaact taagaccatg taactttgca tccgactctc ttttagactt atctccaatc    780

    aagccacaat ttgctaaagg tactgacttc gttgttgtca gagaattagt gggaggtatt     840

    tactttggta agagaaagga agacgatggt gatggtgtcg cttgggatag tgaacaatac     900

    accgttccag aagtgcaaag aatcacaaga atggccgctt tcatggccct acaacatgag     960

    ccaccattgc ctatttggtc cttggataaa gctaatgttt tggcctcttc aagattatgg    1020

    agaaaaactg tggaggaaac catcaagaac gaattcccta cattgaaggt tcaacatcaa    1080

    ttgattgatt ctgccgccat gatcctagtt aagaacccaa cccacctaaa tggtattata    1140

    atcaccagca acatgtttgg tgatatcatc tccgatgaag cctccgttat cccaggttcc    1200

    ttgggtttgt tgccatctgc gtccttggcc tctttgccag acaagaacac cgcatttggt    1260

    ttgtacgaac catgccacgg ttctgctcca gatttgccaa agaataaggt caaccctatc    1320

    gccactatct tgtctgctgc aatgatgttg aaattgtcat tgaacttgcc tgaagaaggt    1380

    aaggccattg aagatgcagt taaaaaggtt ttggatgcag gtatcagaac tggtgattta    1440

    ggtggttcca acagtaccac cgaagtcggt gatgctgtcg ccgaagaagt taagaaaatc    1500

    cttgcttaaa aagattctct ttttttatga tatttgtaca taaactttat aaatgaaatt    1560

    cataatagaa acgacacgaa attacaaaat ggaatatgtt catagggtag acgaaactat    1620

    atacgcaatc tacatacatt tatcaagaag gagaaaaagg aggatgtaaa ggaatacagg    1680

    taagcaaatt gatactaatg gctcaacgtg ataaggaaaa agaattgcac tttaacatta    1740

    atattgacaa ggaggagggc accacacaaa aagttaggtg taacagaaaa tcatgaaact    1800

    atgattccta atttatatat tggaggattt tctctaaaaa aaaaaaaata caacaaataa    1860

    aaaacactca atgacctgac catttgatgg agttgccggc gatcacagcg gacggtggtg    1920

    gcatgatggg gcttgcgatg ctatgtttgt ttgttttgtg atgatgtata ttattattga    1980

    aaaacgatat cagacatttg tctgataatg cttcattatc agacaaatgt ctgatatcgt    2040

    ttggagaaaa agaaaaggaa aacaaactaa atatctacta tataccactg tattttatac    2100

    taatgacttt ctacgcctag tgtcaccctc tcgtgtaccc attgaccctg tatcggcgcg    2160

    ttgcctcgcg ttcctgtacc atatattttt gtttatttag gtattaaaat ttactttcct    2220

    catacaaata ttaaattcac caaacttctc aaaaactaat tattcgtagt tacaaactct    2280

    attttacaat cacgtttatt caaccattct acatccaata accaaaatgc ccatgtacct    2340

    ctcagcgaag tccaacggta ctgtccaata ttctcattaa atagtctttc atctatatat    2400

    cagaaggtaa ttataattag agatttcgaa tcattaccgt gccgattcgc acgctgcaac    2460

    ggcatgcatc actaatgaaa agcatacgac gcctgcgtct gacatgcact cattctgaag    2520

    aagattctgg gcgcgtttcg ttctcgtttt cctctgtata ttgtactctg gtggacaatt    2580

    tgaacataac gtctttcacc tcgccattct caataatggg ttccaattct atccaggtag    2640

    cggttaattg acggtgctta agccgtatgc tcactctaac gctaccgttg tccaaacaac    2700

    ggaccccttt gtgacgggtg taagacccat catgaagtaa aacatctcta acggtatgga    2760

    aaagagtggt acggtcaagt ttcctggcac gagtcaattt tccctcttcg tgtagatcgg    2820

    taccggccgc aaattaaagc cttcgagcgt cccaaaacct tctcaagcaa ggttttcagt    2880

    ataatgttac atgcgtacac gcgtctgtac agaaaaaaaa gaaaaatttg aaatataaat    2940

    aacgttctta atactaacat aactataaaa aaataaatag ggacctagac ttcaggttgt    3000

    ctaactcctt ccttttcggt tagagcggat gtggggggag ggcgtgaatg taagcgtgac    3060

    ataactaatt acatgactcg agcggccgcg gatcccggga attcgtcgac accatcttct    3120

    tctgagatga gtttttgttc catgctagtt ctagaatccg tcgaaactaa gttctggtgt    3180

    tttaaaacta aaaaaaagac taactataaa agtagaattt aagaagttta agaaatagat    3240

    ttacagaatt acaatcaata cctaccgtct ttatatactt attagtcaag taggggaata    3300

    atttcaggga actggtttca accttttttt tcagcttttt ccaaatcaga gagagcagaa    3360

    ggtaatagaa ggtgtaagaa aatgagatag atacatgcgt gggtcaattg ccttgtgtca    3420

    tcatttactc caggcaggtt gcatcactcc attgaggttg tgcccgtttt ttgcctgttt    3480

    gtgcccctgt tctctgtagt tgcgctaaga gaatggacct atgaactgat ggttggtgaa    3540

    gaaaacaata ttttggtgct gggattcttt ttttttctgg atgccagctt aaaaagcggg    3600

    ctccattata tttagtggat gccaggaata aactgttcac ccagacacct acgatgttat    3660

    atattctgtg taacccgccc cctattttgg gcatgtacgg gttacagcag aattaaaagg    3720

    ctaatttttt gactaaataa agttaggaaa atcactacta ttaattattt acgtattctt    3780

    tgaaatggcg agtattgata atgataaact gagctagatc tgggcccgag ctccagcttt    3840

    tgttcccttt agtgagggtt aattgcgcgc ttggcgtaat catggtcata gctgtttcct    3900

    gtgtgaaatt gttatccgct cacaattcca cacaacatag gagccggaag cataaagtgt    3960

    aaagcctggg gtgcctaatg agtgaggtaa ctcacattaa ttgcgttgcg ctcactgccc    4020

    gctttccagt cgggaaacct gtcgtgccag ctgcattaat gaatcggcca acgcgcgggg    4080

    agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg    4140

    gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca    4200

    gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac    4260

    cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac    4320

    aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg    4380

    tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac    4440

    ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat    4500

    ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag    4560

    cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac    4620

    ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt    4680

    gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt    4740

    atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc    4800

    aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga    4860

    aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac    4920

    gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc    4980

    cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct    5040

    gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca    5100

    tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct    5160

    ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca    5220

    ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc    5280

    atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg    5340

    cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct    5400

    tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa    5460

    aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta    5520

    tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc    5580

    ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg    5640

    agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa    5700

    gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg    5760

    agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc    5820

    accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg    5880

    gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat    5940

    cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata    6000

    ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg t                        6041

    <210>35

    <211>5639

    <212>DNA

    <213>pGV1431

    <400>35

    ctgattggaa agaccattct gctttacttt tagagcatct tggtcttctg agctcattat     60

    acctcaatca aaactgaaat taggtgcctg tcacggctct ttttttactg tacctgtgac    120

    ttcctttctt atttccaagg atgctcatca caatacgctt ctagatctat tatgcattat    180

    aattaatagt tgtagctaca aaaggtaaaa gaaagtccgg ggcaggcaac aatagaaatc    240

    ggcaaaaaaa actacagaaa tactaagagc ttcttcccca ttcagtcatc gcatttcgaa    300

    acaagagggg aatggctctg gctagggaac taaccaccat cgcctgactc tatgcactaa    360

    ccacgtgact acatatatgt gatcgttttt aacatttttc aaaggctgtg tgtctggctg    420

    tttccattaa ttttcactga ttaagcagtc atattgaatc tgagctcatc accaacaaga    480

    aatactaccg taaaagtgta aaagttcgtt taaatcattt gtaaactgga acagcaagag    540

    gaagtatcat cagctagccc cataaactaa tcaaaggagg atgtctacta agagttactc    600

    ggaaagagca gctgctcata gaagtccagt tgctgccaag cttttaaact tgatggaaga    660

    gaagaagtca aacttatgtg cttctcttga tgttcgtaaa acagcagagt tgttaagatt     720

    agttgaggtt ttgggtccat atatctgtct attgaagaca catgtagata tcttggagga     780

    tttcagcttt gagaatacca ttgtgccgtt gaagcaatta gcagagaaac acaagttttt     840

    gatatttgaa gacaggaagt ttgccgacat tgggaacact gttaaattac aatacacgtc     900

    tggtgtatac cgtatcgccg aatggtctga tatcaccaat gcacacggtg tgactggtgc     960

    gggcattgtt gctggtttga agcaaggtgc cgaggaagtt acgaaagaac ctagagggtt    1020

    gttaatgctt gccgagttat cgtccaaggg gtctctagcg cacggtgaat acactcgtgg    1080

    gaccgtggaa attgccaaga gtgataagga ctttgttatt ggatttattg ctcaaaacga    1140

    tatgggtgga agagaagagg gctacgattg gttgatcatg acgccaggtg ttggtcttga    1200

    tgacaaaggt gatgctttgg gacaacaata cagaactgtg gatgaagttg ttgccggtgg    1260

    atcagacatc attattgttg gtagaggtct tttcgcaaag ggaagagatc ctgtagtgga    1320

    aggtgagaga tacagaaagg cgggatggga cgcttacttg aagagagtag gcagatccgc    1380

    ttaagagttc tccgagaaca agcagaggtt cgagtgtact cggatcagaa gttacaagtt    1440

    gatcgtttat atataaacta tacagagatg ttagagtgta atggcattgc gtgccggcga    1500

    tcacagcgga cggtggtggc atgatggggc ttgcgatgct atgtttgttt gttttgtgat    1560

    gatgtatatt attattgaaa aacgatatca gacatttgtc tgataatgct tcattatcag    1620

    acaaatgtct gatatcgttt ggagaaaaag aaaaggaaaa caaactaaat atctactata    1680

    taccactgta ttttatacta atgactttct acgcctagtg tcaccctctc gtgtacccat    1740

    tgaccctgta tcggcgcgtt gcctcgcgtt cctgtaccat atatttttgt ttatttaggt    1800

    attaaaattt actttcctca tacaaatatt aaattcacca aacttctcaa aaactaatta    1860

    ttcgtagtta caaactctat tttacaatca cgtttattca accattctac atccaataac    1920

    caaaatgccc atgtacctct cagcgaagtc caacggtact gtccaatatt ctcattaaat    1980

    agtctttcat ctatatatca gaaggtaatt ataattagag atttcgaatc attaccgtgc    2040

    cgattcgcac gctgcaacgg catgcatcac taatgaaaag catacgacgc ctgcgtctga    2100

    catgcactca ttctgaagaa gattctgggc gcgtttcgtt ctcgttttcc tctgtatatt    2160

    gtactctggt ggacaatttg aacataacgt ctttcacctc gccattctca ataatgggtt    2220

    ccaattctat ccaggtagcg gttaattgac ggtgcttaag ccgtatgctc actctaacgc    2280

    taccgttgtc caaacaacgg acccctttgt gacgggtgta agacccatca tgaagtaaaa    2340

    catctctaac ggtatggaaa agagtggtac ggtcaagttt cctggcacga gtcaattttc    2400

    cctcttcgtg tagatcggta ccggccgcaa attaaagcct tcgagcgtcc caaaaccttc    2460

    tcaagcaagg ttttcagtat aatgttacat gcgtacacgc gtctgtacag aaaaaaaaga    2520

    aaaatttgaa atataaataa cgttcttaat actaacataa ctataaaaaa ataaataggg    2580

    acctagactt caggttgtct aactccttcc ttttcggtta gagcggatgt ggggggaggg    2640

    cgtgaatgta agcgtgacat aactaattac atgactcgag cggccgcgga tcccgggaat    2700

    tcgtcgacac catcttcttc tgagatgagt ttttgttcca tgctagttct agaatccgtc    2760

    gaaactaagt tctggtgttt taaaactaaa aaaaagacta actataaaag tagaatttaa    2820

    gaagtttaag aaatagattt acagaattac aatcaatacc taccgtcttt atatacttat    2880

    tagtcaagta ggggaataat ttcagggaac tggtttcaac cttttttttc agctttttcc    2940

    aaatcagaga gagcagaagg taatagaagg tgtaagaaaa tgagatagat acatgcgtgg    3000

    gtcaattgcc ttgtgtcatc atttactcca ggcaggttgc atcactccat tgaggttgtg    3060

    cccgtttttt gcctgtttgt gcccctgttc tctgtagttg cgctaagaga atggacctat    3120

    gaactgatgg ttggtgaaga aaacaatatt ttggtgctgg gattcttttt ttttctggat    3180

    gccagcttaa aaagcgggct ccattatatt tagtggatgc caggaataaa ctgttcaccc    3240

    agacacctac gatgttatat attctgtgta acccgccccc tattttgggc atgtacgggt    3300

    tacagcagaa ttaaaaggct aattttttga ctaaataaag ttaggaaaat cactactatt    3360

    aattatttac gtattctttg aaatggcgag tattgataat gataaactga gctagatctg    3420

    ggcccgagct ccagcttttg ttccctttag tgagggttaa ttgcgcgctt ggcgtaatca    3480

    tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatagga    3540

    gccggaagca taaagtgtaa agcctggggt gcctaatgag tgaggtaact cacattaatt    3600

    gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga    3660

    atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc    3720

    actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg    3780

    gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc    3840

    cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc    3900

    ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga    3960

    ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc    4020

    ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat    4080

    agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg    4140

    cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc    4200

    aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga    4260

    gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact    4320

    agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt    4380

    ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag    4440

    cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg    4500

    tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa    4560

    aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata    4620

    tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg    4680

    atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata    4740

    cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg    4800

    gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct    4860

    gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt    4920

    tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc    4980

    tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga    5040

    tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt    5100

    aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc    5160

    atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa    5220

    tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca    5280

    catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca    5340

    aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct    5400

    tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc    5460

    gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa    5520

    tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt    5580

    tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgt     5639

    <210>36

    <211>741

    <212>DNA

    <213>pf1A

    <400>36

    atgtcagtta ttggtcgcat tcactccttt gaatcctgtg gaaccgtaga cggcccaggt     60

    attcgcttta tcaccttttt ccagggctgc ctgatgcgct gcctgtattg tcataaccgc    120

    gacacctggg acacgcatgg cggtaaagaa gttaccgttg aagatttgat gaaggaagtg    180

    gtgacctatc gccactttat gaacgcttcc ggcggcggcg ttaccgcatc cggcggtgaa    240

    gcaatcctgc aagctgagtt tgttcgtgac tggttccgcg cctgcaaaaa agaaggcatt    300

    catacctgtc tggacaccaa cggttttgtt cgtcgttacg atccggtgat tgatgaactg    360

    ctggaagtaa ccgacctggt aatgctcgat ctcaaacaga tgaacgacga gatccaccaa    420

    aatctggttg gagtttccaa ccaccgcacg ctggagttcg ctaaatatct ggcgaacaaa    480

    aatgtgaagg tgtggatccg ctacgttgtt gtcccaggct ggtctgacga tgacgattca    540

    gcgcatcgcc tcggtgaatt tacccgtgat atgggcaacg ttgagaaaat cgagcttctc    600

    ccctaccacg agctgggcaa acacaaatgg gtggcaatgg gtgaagagta caaactcgac    660

    ggtgttaaac caccgaagaa agagaccatg gaacgcgtga aaggcattct tgagcagtac    720

    ggtcataagg taatgttcta a                                              741

    <210>37

    <211>2283

    <212>DNA

    <213>pflB

    <400>37

    atgtccgagc ttaatgaaaa gttagccaca gcctgggaag gttttaccaa aggtgactgg      60

    cagaatgaag taaacgtccg tgacttcatt cagaaaaact acactccgta cgagggtgac     120

    gagtccttcc tggctggcgc tactgaagcg accaccaccc tgtgggacaa agtaatggaa     180

    ggcgttaaac tggaaaaccg cactcacgcg ccagttgact ttgacaccgc tgttgcttcc     240

    accatcacct ctcacgacgc tggctacatc aacaagcagc ttgagaaaat cgttggtctg     300

    cagactgaag ctccgctgaa acgtgctctt atcccgttcg gtggtatcaa aatgatcgaa     360

    ggttcctgca aagcgtacaa ccgcgaactg gatccgatga tcaaaaaaat cttcactgaa     420

    taccgtaaaa ctcacaacca gggcgtgttc gacgtttaca ctccggacat cctgcgttgc     480

    cgtaaatctg gtgttctgac cggtctgcca gatgcatatg gccgtggccg tatcatcggt     540

    gactaccgtc gcgttgcgct gtacggtatc gactacctga tgaaagacaa actggcacag     600

    ttcacttctc tgcaggctga tctggaaaac ggcgtaaacc tggaacagac tatccgtctg     660

    cgcgaagaaa tcgctgaaca gcaccgcgct ctgggtcaga tgaaagaaat ggctgcgaaa     720

    tacggctacg acatctctgg tccggctacc aacgctcagg aagctatcca gtggacttac     780

    ttcggctacc tggctgctgt taagtctcag aacggtgctg caatgtcctt cggtcgtacc     840

    tccaccttcc tggatgtgta catcgaacgt gacctgaaag ctggcaagat caccgaacaa     900

    gaagcgcagg aaatggttga ccacctggtc atgaaactgc gtatggttcg cttcctgcgt     960

    actccggaat acgatgaact gttctctggc gacccgatct gggcaaccga atctatcggt    1020

    ggtatgggcc tcgacggtcg taccctggtt accaaaaaca gcttccgttt cctgaacacc    1080

    ctgtacacca tgggtccgtc tccggaaccg aacatgacca ttctgtggtc tgaaaaactg    1140

    ccgctgaact tcaagaaatt cgccgctaaa gtgtccatcg acacctcttc tctgcagtat    1200

    gagaacgatg acctgatgcg tccggacttc aacaacgatg actacgctat tgcttgctgc    1260

    gtaagcccga tgatcgttgg taaacaaatg cagttcttcg gtgcgcgtgc aaacctggcg    1320

    aaaaccatgc tgtacgcaat caacggcggc gttgacgaaa aactgaaaat gcaggttggt    1380

    ccgaagtctg aaccgatcaa aggcgatgtc ctgaactatg atgaagtgat ggagcgcatg    1440

    gatcacttca tggactggct ggctaaacag tacatcactg cactgaacat catccactac    1500

    atgcacgaca agtacagcta cgaagcctct ctgatggcgc tgcacgaccg tgacgttatc    1560

    cgcaccatgg cgtgtggtat cgctggtctg tccgttgctg ctgactccct gtctgcaatc    1620

    aaatatgcga aagttaaacc gattcgtgac gaagacggtc tggctatcga cttcgaaatc    1680

    gaaggcgaat acccgcagtt tggtaacaat gatccgcgtg tagatgacct ggctgttgac    1740

    ctggtagaac gtttcatgaa gaaaattcag aaactgcaca cctaccgtga cgctatcccg    1800

    actcagtctg ttctgaccat cacttctaac gttgtgtatg gtaagaaaac gggtaacacc    1860

    ccagacggtc gtcgtgctgg cgcgccgttc ggaccgggtg ctaacccgat gcacggtcgt    1920

    gaccagaaag gtgcagtagc ctctctgact tccgttgcta aactgccgtt tgcttacgct    1980

    aaagatggta tctcctacac cttctctatc gttccgaacg cactgggtaa agacgacgaa    2040

    gttcgtaaga ccaacctggc tggtctgatg gatggttact tccaccacga agcatccatc    2100

    gaaggtggtc agcacctgaa cgttaacgtg atgaaccgtg aaatgctgct cgacgcgatg    2160

    gaaaacccgg aaaaatatcc gcagctgacc atccgtgtat ctggctacgc agtacgtttc    2220

    aactcgctga ctaaagaaca gcagcaggac gttattactc gtaccttcac tcaatctatg    2280

    taa                                                                  2283

    <210>38

    <211>1095

    <212>DNA

    <213>Cb-FDH1

    <400>38

    atgaagatcg ttttagtctt atatggtgct ggtaaacacg ctgccgatga agaaaaatta     60

    tacggttgta ctgaaaacaa attaggtatt gccaattggt tgaaagatca aggacatgaa    120

    ctaatcacca cgtctgataa agaaggcgga aacagtgtgt tggatcaaca tataccagat    180

    gccgatatta tcattacaac tcctttccat cctgcttata tcactaagga aagaatcgac    240

    aaggctaaaa aattgaaatt agttgttgtc gctggtgtcg gttctgatca tattgatttg    300

    gattatatca accaaacagg taggaaaatc tccgtcttgg aagttaccgg ttctaatgtt    360

    gtctctgttg cagaacacgt tgtcatgacc atgcttgtct tggttagaaa ttttgttcca    420

    gctcacgaac aaaacattaa ccacgattgg gaggttgctg ctatcgctaa ggatgcttac    480

    gatatcgaag gtaaaactat cgccaccatt ggtgccggta gaattggtta cagagtcttg    540

    gaaagattag tcccattcaa tcctaaagaa ttattatact acgattatca agctttacca    600

    aaagatgctg aagaaaaagt tggtgctaga agggttgaaa atattgaaga attggttgcc    660

    caagctgata tagttacagt taatgctcca ttacacgctg gtacaaaagg tttaattaac    720

    aaggaattat tgtctaaatt caagaaaggt gcttggttag tcaatactgc aagaggtgcc    780

    atttgtgttg ccgaagatgt tgctgcagct ttagaatctg gtcaattaag aggttatggt    840

    ggtgatgttt ggttcccaca accagctcca aaagatcacc catggagaga tatgagaaac    900

    aaatatggtg ctggtaacgc cacgactcct cattactctg gtactacttt agatgctcaa    960

    actagatacg ctcaaggtac taaaaatatc ttggagtcat tctttactgg taagtttgat   1020

    tacagaccac aagatatcat cttattaaac ggtgaatacg ttaccaaagc ttacggtaaa   1080

    cacgataaga aataa                                                    1095

    <210>39

    <211>1524

    <212>DNA

    <213>K1ALD6

    <400>39

    atgtcctcta caattgctga gaaattgaac ctcaagatcg tcgaacaaga cgctgttagc     60

    atcactttgc caaacggttt gacttaccaa caaccaactg gtttgttcat caacaatcag    120

    ttcatcaagt ctcaagacgg taagactttg aaggttgaaa acccatctac tgaggaaatc    180

    attgtcgaag tccaatctgc tacttctcaa gacgtcgagt acgccgttga agctgccgat    240

    gctgctttca actccgaatg gtctactatg gacccaaaaa agcgtggttc tttgttgttt    300

    aagttggctg acttgattga agctcaaaag gaattgattg cttctatcga atctgctgac    360

    aacggtaaga ctttggccct agccagaggt gatgttggtt tggtcattga ctacatcaga    420

    tctgctgctg gttatgctga caagttgggt ggtagaacta tcaacactgg tgatggttac    480

    gctaacttca cttacaagga acctctaggt gtctgtggtc aaatcatccc atggaacttc    540

    ccattgatga tgctttcttg gaagatcgcc cctgctttgg ttgctggtaa caccgttatc    600

    ttgaagccag cttccccaac cccattgaac gctttgttct ttgcttcttt gtgtaaggaa    660

    gcaggtatcc cagctggtgt cgttaacatc gttccaggtc caggtagatc cgttggtgac    720

    accatcacca accatccaaa aattagaaag attgccttca ctggttccac tgacattggt    780

    agagacgttg ctatcaaggc tgcccaatct aacttgaaga aggtcacctt ggaattgggt    840

    ggtaaatccg ctcatttggt ctttgaagat gccaacatta agaagactat tccaaacttg    900

    gtcaacggta ttttcaagaa tgctggtcaa atttgttcct ctggttccag aatctatgtc    960

    caagacacca tctacgatca actattgtct gaattcaaga cttacctgga aactgaaatt   1020

    aaggtcggtt ccccattcga tgaatctaac ttccaagctg ctatcaacaa caaggctcaa   1080

    ttcgaaacta tcttgaacta catcgacatc ggtaagaagg aaggtgcttc tatcttgact   1140

    ggtggtgaaa gagtaggcaa caagggttac ttcattaaac caactgtatt ctacaacgtt   1200

    aaggaagata tgagaatcgt caaggaagaa atctttggtc ctgtcgtcac catctccaag   1260

    ttctctactg tcgacgaagc tgtcgctttg gctaacgact ccgaattcgg tttgggtgct   1320

    ggtatcgaaa ctgaaaacat ctccgttgcc ttgaaggtcg caaagagact aaaagctggt   1380

    accgtctgga tcaacactta caacgatttc gacgctgccg ttccattcgg tggttacaag   1440

    caatctggtt acggtagaga aatgggtgaa gaagctttcg aatcttacac tcaaatcaag   1500

    gccgtcagga tcaagttgga ttaa                                          1524

    <210>40

    <211>2124

    <212>DNA

    <213>K1ACS1

    <400>40

    atgtctcctg ctgttgatac cgcttccacc gccaaagatc caatctcagt catgaaatct     60

    aacgcttcag ctgccgctgc agaccaaatt aagacccatg aatacgaaca tttaacttct    120

    gtgcctatag tgcagcctct accaattact gataggttga gcagcgaagc agctcaaaaa    180

    tataaaccta atttgccagg tgggttcgaa gagtacaagt ctttgcacaa ggaatcactt    240

    gaaaatccag ccaagtttta ccatgaacgt gctcagctgt tgaattggtt caaaccatac    300

    gatcaagttt tcatcccaga taccgaaggt aaaccaactt ttgagaacaa cgcttggttt    360

    accaacggtc aattgaacgc ttgttacaat ttggtagaca gacatgcctt cactcaacca     420

    aacaaggttg ccattcttta tgaagctgat gaaccaggtc aaggttatag tctcacttat     480

    gcggaattgt tagaacaagt ctgtaaagtt gctcaaatct tgcaatactc gatgaacgtc     540

    aagaaaggtg acacggtcgc agtttatatg ccaatgatcc cacaggcttt gattaccttg     600

    ttggcaatta ctcgtatcgg tgccattcat tccgttgttt ttgctgggtt ctcttcgaat     660

    tcattgcgtg atcgtattaa cgatgcttac tcaaagacag tcatcaccac cgatgaatct     720

    aagagaggtg gtaagaccat cgaaaccaag cgtatcgtcg atgaagcctt gaaggatacc     780

    cctcaagtaa caaacgtttt ggtcttcaaa cgtactcata acgaaaatat caagtacatt     840

    ccaggtaggg atttggactg ggatgaggaa gtcaagaagt acaaatctta caccccatgc     900

    gaacctgttg actctgaaca tcctttgttc ttattgtata cttcgggttc caccggtgct     960

    ccaaagggtg ttcaacattc tacagcaggt tacttgctcc aagcattatt aagtatgaaa    1020

    tacacctttg acatccaaaa cgatgacatc ttcttcaccg caggtgacat tggttggatc    1080

    actggtcaca catactgtgt ttacggtcca ttgttacaag gttgtactac tttggtgttc    1140

    gaaggtacac ctgcctatcc aaacttttct cgttattggg aaattgttga caagtaccaa    1200

    gtgactcaat tctatgtagc cccaactgca ctacgtctat tgaagagagc tggtgattcc    1260

    tttactgaag gattctctct caagtcattg cgctccttgg gttccgttgg tgaacctatc    1320

    gctgctgaag tttgggaatg gtactctgaa aagattggta agaatgagct accaatcgta    1380

    gacacatact ggcaaactga atctggctcc cacttggtca ctccattggc tggtggtgct    1440

    actccaatga aaccaggtgc agcggcattc ccattctttg gtattgattt ggcagtgttg    1500

    gatccaacca caggtatcga gcaaactggt gaacatgcag aaggtgttct tgccattaaa    1560

    agaccttggc catctttcgc aagaaccatt tggaagaata acgataggtt cttagacacg    1620

    tacttgaaac catacccggg ctattacttc actggtgatg gtgttgcccg tgataaagat    1680

    ggattcttct ggatcttggg tcgtgttgat gatgttgtta acgtctcagg tcacaggttg    1740

    tctactgctg aaattgaagc tgctatcatt gaagatgata tggttgccga atgtgcagtt    1800

    gttgggttta acgacgaatt gactggtcaa gccgttgctg cctttgtagt attgaagaac    1860

    aagtctagtt taactgctgc aagcgagtcc gagttacaag acatcaaaaa gcatttgatc    1920

    atcaccgtta gaaaggatat tggtccattc gctgctccta agttgatcgt cctagttgat    1980

    gatctaccaa agactagatc tggcaagatt atgagacgta ttttgagaaa gatcctagcc    2040

    ggtgaatctg atcaattggg cgacgtctcc acattatcca accctggtat cgttaagcac    2100

    ttgatcgatt ccgtgaaatt ataa                                           2124

    <210>41

    <211>2055

    <212>DNA

    <213>K1ACS2

    <400>41

    atgtcgtcgg ataaattgca taaggttgtg catgaagctc acgatgttga agctcgtcat      60

    gctccagaac atttctacaa ttctcaaccg ggtaaatcgt actgtactga tgaagaacat    120

    taccgtgaga tgtacactca gtccattgag gacccagcag ggtttttcgg tccattggcc    180

    aaggaatatc tagattggga tcgtccattc acccaagtcc aaagcggttc tttggaacac    240

    ggtgacattg cctggttctt aaatggtgaa ctgaatgctt cttataactg tgttgacaga    300

    cacgcttttg ccaacccaga caagccagct ttaatctacg aagccgacga tgaatctgaa    360

    aacaaggtga tcacttttgg cgaattgttg agacaggtct ctgaagtggc tggtgtcttg    420

    caatcttggg gtgtcaagaa aggagacacc gtcgccgttt acttgccaat gattcctgct    480

    gcagttgttg ctatgttggc cgttgcaaga ttaggtgcca ttcattcggt tatctttgcc    540

    ggtttctctg ccggttcctt gaaggaaaga gttgtcgatg caggctgtaa agtggtcatc    600

    acttgcgatg aaggtaagag aggtggtaag accgttcata ccaagaagat tgtcgacgaa    660

    ggtttggccg gtgtcgattc cgtttccaag atcttggttt tccaaagaac tggtactcaa    720

    ggtatcccaa tgaagccagc tagagatttc tggtggcacg aagagtgtgt caagcaaaga    780

    ggttacttgc cacctgtccc agtcaactcc gaagatccat tgttcttgtt gtacacctct    840

    ggttccaccg gttctccaaa aggtgtcgtg cactctactg ctggttactt gttaggttct    900

    gctttgacca ccagattcgt tttcgatatt catccagaag atgttttgtt cactgctggt    960

    gacgtcggtt ggattaccgg ccacacttac gccttgtacg gtccattgac cttaggtacc   1020

    gctaccatta ttttcgaatc tactccagct tacccagatt atggtagata ctggagaatc   1080

    attgaacgtc atagagctac ccacttctac gtcgccccaa ctgccctaag attgatcaaa   1140

    cgtgtcggtg aagaagaaat tgccaagtat gatacctcct ccttaagagt cttgggttct   1200

    gtcggtgaac caatctctcc agatctatgg gaatggtacc acgaaaaggt tggtaagaat   1260

    aactgtgtta tctgtgacac catgtggcaa accgaatccg gttcacactt gattgcccca   1320

    ttggctggtg ctgtcccaac caaaccaggt tccgctaccg tcccattctt cggtattaac   1380

    gcctgtatca tcgacccagt ttctggtgaa gaattgaagg gtaacgatgt tgaaggtgtc   1440

    ttggcagtga agtccccatg gccttctatg gccagatctg tctggaacaa ccatgctcgt   1500

    tacttcgaaa cttatttgaa gccataccca ggatactact tcacaggtga tggtgctggt   1560

    agagatcacg acggttacta ctggatcaga ggtagagttg acgatgtcgt taacgtttcc   1620

    ggtcacagac tttctactgc tgaaatcgaa gctgctctag ctgaacacga aggtgtttct   1680

    gaagctgccg ttgttggtat cactgatgaa ctaacaggtc aagctgtcat tgcattcgtt   1740

    tccttgaagg acggctatct gtctgaaaat gcggtagagg gtgacagtac ccacatctct   1800

    ccagacaact tacgtcgtga gttgattcta caagtcagag gtgaaattgg tccattcgct   1860

    gcaccaaaga ccgttgttgt tgtcaacgat ttgccaaaaa ctagatccgg taaaattatg   1920

    agaagagtct tgagaaaggt tgcatccaag gaagctgatc aattgggtga tctaagtacc   1980

    ttagccaatg cagacgttgt accatctatc atttctgcag tagaaaatca atttttcagt   2040

    cagcagaaga aataa                                                    2055

    <210>42

    <211>37

    <212>DNA

    <213>Gevo-311

    <400>42

    gaggt tgtcg acatgaaaaa gatttttgta cttggag                     37

    <210>43

    <211>35

    <212>DNA

    <213>Gevo-175

    <400>43

    aattggatcc ttatttagaa taatcataga atcct                        35

    <210>44

    <211>37

    <212>DNA

    <213>Gevo-312

    <400>44

    gttcttgtcg acatggaatt aaaaaatgtt attcttg                      37

    <210>45

    <211>37

    <212>DNA

    <213>Gevo-171

    <400>45

    aattggatcc ttatttattt tgaaaattct tttctgc                      37

    <210>46

    <211>37

    <212>DNA

    <213>Gevo-313

    <400>46

    caagaggtcg acatgaattt ccaattaact agagaac                      37

    <210>47

    <211>34

    <212>DNA

    <213>Gevo-314

    <400>47

    gcgtccggat ccctatctta aaatgcttcc tgcg                         34

    <210>48

    <211>36

    <212>DNA

    <213>Gevo-315

    <400>48

    cggaaagtcg acatgaatat agcagattac aaaggc                       36

    <210>49

    <211>35

    <212>DNA

    <213>Gevo-173

    <400>49

    aattggatcc ttattcagcg ctctttattt cttta                              35

    <210>50

    <211>37

    <212>DNA

    <213>Gevo-316

    <400>50

    caaaatgtcg acatgaatat agtagtttgt gtaaaac                            37

    <210>51

    <211>37

    <212>DNA

    <213>Gevo-317

    <400>51

    taatttggat ccttagatgt agtgtttttc ttttaat                            37

    <210>52

    <211>35

    <212>DNA

    <213>Gevo-319

    <400>52

    gaaccagtcg acatggcacg ttttacttta ccaag                              35

    <210>53

    <211>35

    <212>DNA

    <213>Gevo-177

    <400>53

    aattggatcc ttacaaatta actttagttc catag                              35

    <210>54

    <211>36

    <212>DNA

    <213>Gevo-318

    <400>54

    tccatagtcg acatgaataa agacacacta atacct                             36

    <210>55

    <211>40

    <212>DNA

    <213>Gevo-249

    <400>55

    aattggatcc ttagccggca agtacacatc ttctttgtct                         40

    <210>56

    <211>35

    <212>DNA

    <213>Gevo-308

    <400>56

    gatcgagtcg acatgaaaga agttgtaata gctag                              35

    <210>57

    <211>35

    <212>DNA

    <213>Gevo-309

    <400>57

    gttataggat ccctagcact tttctagcaa tattg                               35

    <210>58

    <211>37

    <212>DNA

    <213>Gevo-281

    <400>58

    gtggatgtcg acatgaaaaa ggtatgtgtt ataggtg                             37

    <210>59

    <211>35

    <212>DNA

    <213>Gevo-161

    <400>59

    aattggatcc ttattttgaa taatcgtaga aacct                               35

    <210>60

    <211>35

    <212>DNA

    <213>Gevo-282

    <400>60

    tcctacgtcg acatggaact aaacaatgtc atcct                               35

    <210>61

    <211>36

    <212>DNA

    <213>Gevo-283

    <400>61

    taacttggat ccctatctat ttttgaagcc ttcaat                              36

    <210>62

    <211>37

    <212>DNA

    <213>Gevo-284

    <400>62

    caagaggtcg acatggattt taatttaaca agagaac                             37

    <210>63

    <211>39

    <212>DNA

    <213>Gevo-285

    <400>63

    caataaggat ccttatctaa aaatttttcc tgaaataac                           39

    <210>64

    <211>36

    <212>DNA

    <213>Gevo-286

    <400>64

    cgggaagtcg acatgaataa agcagattac aagggc                          36

    <210>65

    <211>36

    <212>DNA

    <213>Gevo-287

    <400>65

    gttcaaggat ccttaattat tagcagcttt aacttg                          36

    <210>66

    <211>38

    <212>DNA

    <213>Gevo-288

    <400>66

    caaaattgtc gacatgaata tagttgtttg tttaaaac                        38

    <210>67

    <211>41

    <212>DNA

    <213>Gevo-289

    <400>67

    gttttaggat ccttaaatat agtgttcttc ttttaatttt g                    41

    <210>68

    <211>37

    <212>DNA

    <213>Gevo-292

    <400>68

    caagaagtcg acatgaaagt tacaaatcaa aaagaac                         37

    <210>69

    <211>40

    <212>DNA

    <213>Gevo-293

    <400>69

    tcctatgcgg ccgcttaaaa tgattttata tagatatcct                      40

    <210>70

    <211>35

    <212>DNA

    <213>Gevo-290

    <400>70

    aggaaagtcg acatgaaagt cacaacagta aagga                           35

    <210>71

    <211>40

    <212>DNA

    <213>Gevo-291

    <400>71

    atttaagcgg ccgcttaagg ttgtttttta aaacaattta                      40

    <210>72

    <211>37

    <212>DNA

    <213>Gevo-294

    <400>72

    cataacgtcg acatgctaag ttttgattat tcaatac                    37

    <210>73

    <211>36

    <212>DNA

    <213>Gevo-247

    <400>73

    aattggatcc ttaataagat tttttaaata tctcaa                     36

    <210>74

    <211>37

    <212>DNA

    <213>Gevo-295

    <400>74

    cataacgtcg acatggttga tttcgaatat tcaatac                    37

    <210>75

    <211>36

    <212>DNA

    <213>Gevo-159

    <400>75

    aattggatcc ttacacagat tttttgaata tttgta                     36

    <210>76

    <211>35

    <212>DNA

    <213>Gevo-310

    <400>76

    gatcgagaat tcatgaaaga agttgtaata gctag                      35

    <210>77

    <211>35

    <212>DNA

    <213>Gevo-309

    <400>77

    gttataggat ccctagcact tttctagcaa tattg                      35

    <210>78

    <211>36

    <212>DNA

    <213>Gevo-296

    <400>78

    cggatagtcg acatgaaaaa ggtatgtgtt ataggc                     36

    <210>79

    <211>38

    <212>DNA

    <213>Gevo-297

    <400>79

    tcccaaggat ccttattttg aataatcgta gaaaccct                38

    <210>80

    <211>35

    <212>DNA

    <213>Gevo-282

    <400>80

    tcctacgtcg acatggaact aaacaatgtc atcct                   35

    <210>81

    <211>36

    <212>DNA

    <213>Gevo-283

    <400>81

    taacttggat ccctatctat ttttgaagcc ttcaat                  36

    <210>82

    <211>37

    <212>DNA

    <213>Gevo-284

    <400>82

    caagaggtcg acatggattt taatttaaca agagaac                 37

    <210>83

    <211>37

    <212>DNA

    <213>Gevo-298

    <400>83

    gtaaagggat ccttaactaa aaatttttcc tgaaatg                 37

    <210>84

    <211>36

    <212>DNA

    <213>Gevo-286

    <400>84

    cgggaagtcg acatgaataa agcagattac aagggc                  36

    <210>85

    <211>36

    <212>DNA

    <213>Gevo-299

    <400>85

    gttcaaggat ccttaattat tagcagcttt aacctg                  36

    <210>86

    <211>38

    <212>DNA

    <213>Gevo-288

    <400>86

    caaaattgtc gacatgaata tagttgtttg tttaaaac                38

    <210>87

    <211>36

    <212>DNA

    <213>Gevo-300

    <400>87

    gactttggat ccttaaatat agtgttcttc tttcag                      36

    <210>88

    <211>37

    <212>DNA

    <213>Gevo-292

    <400>88

    caagaagtcg acatgaaagt tacaaatcaa aaagaac                     37

    <210>89

    <211>41

    <212>DNA

    <213>Gevo-301

    <400>89

    attttcggat ccttaaaatg attttatata gatatctttt a                41

    <210>90

    <211>37

    <212>DNA

    <213>Gevo-302

    <400>90

    cttatagtcg acatggattt taacttaaca gatattc                     37

    <210>91

    <211>36

    <212>DNA

    <213>Gevo-303

    <400>91

    ccgccaggat ccttaacgta acagagcacc gccggt                      36

    <210>92

    <211>36

    <212>DNA

    <213>Gevo-304

    <400>92

    cggaaagtcg acatggattt agcagaatac aaaggc                      36

    <210>93

    <211>34

    <212>DNA

    <213>Gevo-305

    <400>93

    ctttgtggat ccttatgcaa tgcctttctg tttc                        34

    <210>94

    <211>37

    <212>DNA

    <213>Gevo-306

    <400>94

    caaactgaat tcatggaaat attggtatgt gtcaaac                37

    <210>95

    <211>35

    <212>DNA

    <213>Gevo-307

    <400>95

    accaacggat ccttaaatga ttttctgggc aacca                  35

    <210>96

    <211>34

    <212>DNA

    <213>Gevo-273

    <400>96

    gttacagtcg acatgtctca gaacgtttac attg                   34

    <210>97

    <211>35

    <212>DNA

    <213>Gevo-274

    <400>97

    gataacggat cctcatatct tttcaatgac aatag                  35

    <210>98

    <211>34

    <212>DNA

    <213>PflA_forw

    <400>98

    cattgaattc atgtcagtta ttggtcgcat tcac                   34

    <210>99

    <211>37

    <212>DNA

    <213>PflA_Rev

    <400>99

    cattgtcgac ttagaacatt accttatgac cgtactg                37

    <210>100

    <211>37

    <212>DNA

    <213>PflB_forw

    <400>100

    cattgaattc atgtccgagc ttaatgaaaa gttagcc                37

    <210>101

    <211>36

    <212>DNA

    <213>PflB_Rev

    <400>101

    cattgtcgac ttacatagat tgagtgaagg tacgag                 36

    <210>102

    <211>39

    <212>DNA

    <213>fdh1_forw

    <400>102

    cattgaattc atgaagatcg ttttagtctt atatggtgc                39

    <210>103

    <211>37

    <212>DNA

    <213>fdh1_rev

    <400>103

    cattgtcgac ttatttctta tcgtgtttac cgtaagc                  37

    <210>104

    <211>38

    <212>DNA

    <213>K1ALD6_右3

    <400>104

    gttaggatcc ttaatccaac ttgatcctga cggccttg                 38

    <210>105

    <211>43

    <212>DNA

    <213>K1ALD6_左5

    <400>105

    ccaagtcgac atgtcctcta caattgctga gaaattgaac ctc           43

    <210>106

    <211>40

    <212>DNA

    <213>K1ACS1_右3

    <400>106

    gttagcggcc gcttataatt tcacggaatc gatcaagtgc               40

    <210>107

    <211>37

    <212>DNA

    <213>K1ACS1_左5

    <400>107

    ccaagctagc atgtctcctg ctgttgatac cgcttcc                  37

    <210>108

    <211>49

    <212>DNA

    <213>K1ACS2_右3

    <400>108

    ggttggatcc ttatttcttc tgctgactga aaaattgatt ttctactgc     49

    <210>109

    <211>35

    <212>DNA

    <213>K1ACS2_左5

    <400>109

    ccaagaattc atgtcgtcgg ataaattgca taagg                    35

    <210>110

    <211>26

    <212>DNA

    <213>Gevo-350

    <400>110

    cttaaattct acttttatag ttagtc                            26

    <210>111

    <211>20

    <212>DNA

    <213>Gevo-352

    <400>111

    ccttcctttt cggttagagc                                   20

    <210>112

    <211>31

    <212>DNA

    <213>Gevo-479

    <400>112

    catgccgtcg acatgtcgcc ctctgccgta c                      31

    <210>113

    <211>38

    <212>DNA

    <213>Gevo-480

    <400>113

    gattaagcgg ccgcttacaa cttgaccgaa tcaattag               38

    <210>114

    <211>37

    <212>DNA

    <213>Gevo-483

    <400>114

    gatgaagtcg acatgacaat caaggaacat aaagtag                37

    <210>115

    <211>39

    <212>DNA

    <213>Gevo-484

    <400>115

    gttaaaggat ccttatttct ttttttgaga gaaaaattg              39

    <210>116

    <211>44

    <212>DNA

    <213>Gevo-606

    <400>116

    ttttgtcgac actagtatgt cagaacgttt cccaaatgac gtgg        44

    <210>117

    <211>39

    <212>DNA

    <213>Gevo-607

    <400>117

    ttttctcgag ttacgccaga cgcgggttaa ctttatctg                39

    <210>118

    <211>40

    <212>DNA

    <213>Gevo-609

    <400>118

    ttttctcgag ttacatcacc agacggcgaa tgtcagacag               40

    <210>119

    <211>46

    <212>DNA

    <213>Gevo-610

    <400>119

    ttttgtcgac actagtatga gtactgaaat caaaactcag gtcgtg        46

    <210>120

    <211>37

    <212>DNA

    <213>Gevo-611

    <400>120

    ttttctcgag ttacttcttc ttcgctttcg ggttcgg                  37

    <210>121

    <211>21

    <212>DNA

    <213>Gevo-616

    <400>121

    ctatttacca ggctaaattc c                                   21

    <210>122

    <211>22

    <212>DNA

    <213>Gevo-617

    <400>122

    tgaaggtaaa aacatcgcgc ac                                  22

    <210>123

    <211>23

    <212>DNA

    <213>Gevo-618

    <400>123

    cgtggcttcc tgatcggcgg tac                                 23

    <210>124

    <211>24

    <212>DNA

    <213>Gevo-619

    <400>124

    caccagcggc tggcgtgaaa gaag                                24

    <210>125

    <211>24

    <212>DNA

    <213>Gevo-620

    <400>125

    gaagtggaac tgggccgcat ccag                                           24

    <210>126

    <211>22

    <212>DNA

    <213>Gevo-621

    <400>126

    gacgtggttg aaatgttcga cc                                             22

    <210>127

    <211>35

    <212>DNA

    <213>Gevo-637

    <400>127

    ttttgagctc gccgatccca ttaccgacat ttggg                               35

    <210>128

    <211>96

    <212>DNA

    <213>Gevo-638

    <400>128

    aaagtcgaca ccgatatacc tgtatgtgtc accaccaatg tatctataag tatccatgct    60

    agccctaggt ttatgtgatg attgattgat tgattg                              96

    <210>129

    <211>36

    <212>DNA

    <213>Gevo-639

    <400>129

    ttttctcgag actagtatgt ctgaaattac tttggg                              36

    <210>130

    <211>36

    <212>DNA

    <213>Gevo-640

    <400>130

    ttttggatcc ttattgctta gcgttggtag cagcag                              36

    <210>131

    <211>27

    <212>DNA

    <213>Gevo-641

    <400>131

    gttatcttgg ctgatgcttg ttgttcc                                        27

    <210>132

    <211>41

    <212>DNA

    <213>Gevo-642

    <400>132

    ttttgtcgac actagtatga gtactgaaat caaaactcag g                       41

    <210>133

    <211>33

    <212>DNA

    <213>Gevo-643

    <400>133

    ccaagtcgac atgactaagc tacactttga cac                                33

    <210>134

    <211>27

    <212>DNA

    <213>Gevo-644

    <400>134

    gtcggtaaga gtgttgctgt ggactcg                                       27

    <210>135

    <211>42

    <212>DNA

    <213>Gevo-646

    <400>135

    ccaaggatcc ttacaactta attctgacag cttttacttc ag                      42

    <210>136

    <211>49

    <212>DNA

    <213>Gevo-653

    <400>136

    ttttgtcgac actagtatgg ctatcgaaat caaagtaccg gacatcggg               49

    <210>137

    <211>25

    <212>DNA

    <213>Gevo-654

    <400>137

    cttccataga agctttgtcg ccttc                                         25

    <210>138

    <211>25

    <212>DNA

    <213>Gevo-655

    <400>138

    gtgcaatatc atatagaagt catcg                                         25

    <210>139

    <211>48

    <212>DNA

    <213>Gevo-656

    <400>139

    ttttctcgag gctagcatgg catcgtaccc agagcacacc attattgg                48

    <210>140

    <211>40

    <212>DNA

    <213>Gevo-657

    <400>140

    ttttggatcc tcacaatagc atttccaaag gattttcaat                        40

    <210>141

    <211>45

    <212>DNA

    <213>Gevo-658

    <400>141

    ttttctcgag actagtatgg tcatcatcgg tggtggccct gctgg                  45

    <210>142

    <211>36

    <212>DNA

    <213>Gevo-659

    <400>142

    ttttggatcc tcaacaatga atagctttat catagg                            36

    <210>143

    <211>47

    <212>DNA

    <213>Gevo-660

    <400>143

    ttttctcgag actagtatgg caactttaaa aacaactgat aagaagg                47

    <210>144

    <211>35

    <212>DNA

    <213>Gevo-661

    <400>144

    ttttagatct ttaatcccta gaggcaaaac cttgc                             35

    <210>145

    <211>44

    <212>DNA

    <213>Gevo-662

    <400>145

    ttttctcgag actagtatgg cggaagaatt ggaccgtgat gatg                   44

    <210>146

    <211>38

    <212>DNA

    <213>Gevo-663

    <400>146

    tttggatcct tattcaattg acaagacttc tttgacag                          38

    <210>147

    <211>48

    <212>DNA

    <213>Gevo-664

    <400>147

    ttttctcgag actagtatgt tacttgctgt aaagacattt tcaatgcc                48

    <210>148

    <211>40

    <212>DNA

    <213>Gevo-665

    <400>148

    ttttggatcc tcaaaatgat tctaactccc ttacgtaatc                         40

    <210>149

    <211>27

    <212>DNA

    <213>Gevo-666

    <400>149

    ggtagaatta ccaaggctga cattgag                                       27

    <210>150

    <211>21

    <212>DNA

    <213>Gevo-667

    <400>150

    cattggtgga ggaatcatcg g                                             21

    <210>151

    <211>24

    <212>DNA

    <213>Gevo-668

    <400>151

    caccaataca agaacgagga cgcc                                          24

    <210>152

    <211>28

    <212>DNA

    <213>Gevo-669

    <400>152

    tggtacggtt ccattccagg gttaaagg                                      28

    <210>153

    <211>25

    <212>DNA

    <213>Gevo-670

    <400>153

    gggtgatgtg ctagcatacc taggg                                         25

    <210>154

    <211>1197

    <212>DNA

    <213>ERG10

    <400>154

    atgtctcaga acgtttacat tgtatcgact gccagaaccc caattggttc attccagggt   60

    tctctatcct ccaagacagc agtggaattg ggtgctgttg ctttaaaagg cgccttggct    120

    aaggttccag aattggatgc atccaaggat tttgacgaaa ttatttttgg taacgttctt    180

    tctgccaatt tgggccaagc tccggccaga caagttgctt tggctgccgg tttgagtaat    240

    catatcgttg caagcacagt taacaaggtc tgtgcatccg ctatgaaggc aatcattttg    300

    ggtgctcaat ccatcaaatg tggtaatgct gatgttgtcg tagctggtgg ttgtgaatct    360

    atgactaacg caccatacta catgccagca gcccgtgcgg gtgccaaatt tggccaaact    420

    gttcttgttg atggtgtcga aagagatggg ttgaacgatg cgtacgatgg tctagccatg    480

    ggtgtacacg cagaaaagtg tgcccgtgat tgggatatta ctagagaaca acaagacaat    540

    tttgccatcg aatcctacca aaaatctcaa aaatctcaaa aggaaggtaa attcgacaat    600

    gaaattgtac ctgttaccat taagggattt agaggtaagc ctgatactca agtcacgaag    660

    gacgaggaac ctgctagatt acacgttgaa aaattgagat ctgcaaggac tgttttccaa    720

    aaagaaaacg gtactgttac tgccgctaac gcttctccaa tcaacgatgg tgctgcagcc    780

    gtcatcttgg tttccgaaaa agttttgaag gaaaagaatt tgaagccttt ggctattatc    840

    aaaggttggg gtgaggccgc tcatcaacca gctgatttta catgggctcc atctcttgca    900

    gttccaaagg ctttgaaaca tgctggcatc gaagacatca attctgttga ttactttgaa    960

    ttcaatgaag ccttttcggt tgtcggtttg gtgaacacta agattttgaa gctagaccca   1020

    tctaaggtta atgtatatgg tggtgctgtt gctctaggtc acccattggg ttgttctggt   1080

    gctagagtgg ttgttacact gctatccatc ttacagcaag aaggaggtaa gatcggtgtt   1140

    gccgccattt gtaatggtgg tggtggtgct tcctctattg tcattgaaaa gatatga      1197

    <210>155

    <211>849

    <212>DNA

    <213>Cb-hbd

    <400>155

    atgaaaaaga tttttgtact tggagcagga acaatgggtg ctggtatcgt tcaagcattc     60

    gctcaaaaag gttgtgaagt aattgtaaga gacataaagg aagaatttgt tgacagagga    120

    atagctggaa tcactaaagg attagaaaag caagttgcta aaggaaaaat gtctgaagaa    180

    gataaagaag ctatactttc aagaatttca ggaacaactg atatgaaatt agctgctgac    240

    tgtgatttag tagttgaagc tgcaatcgaa aacatgaaaa ttaagaagga aatcttcgct    300

    gaattagatg gaatttgtaa gccagaagcg attttagctt caaacacttc atctttatca    360

    attactgaag ttgcttcagc tacaaagaga cctgataaag ttatcggaat gcatttcttt    420

    aatccagctc cagtaatgaa gcttgttgaa attattaaag gaatagctac ttctcaagaa    480

    acttttgatg ctgttaagga attatcagtt gctattggaa aagaaccagt agaagttgca    540

    gaagctccag gattcgttgt aaacagaata ttaatcccaa tgattaacga agcttcattt    600

    atcctacaag aaggaatagc ttcagttgaa gatattgata cagctatgaa atatggtgct    660

    aaccatccaa tgggaccttt agctttagga gatcttattg gattagacgt ttgcttagct    720

    atcatggatg ttttattcac tgaaacaggt gataacaagt acagagctag cagcatatta    780

    agaaaatatg ttagagctgg atggcttgga agaaaatcag gaaaaggatt ctatgattat    840

    tctaaataa                                                            849

    <210>156

    <211>786

    <212>DNA

    <213>Cb-crt

    <400>156

    atggaattaa aaaatgttat tcttgaaaaa gaagggcatt tagctattgt tacaatcaat     60

    agaccaaagg cattaaatgc attgaattca gaaacactaa aagatttaaa tgttgtttta    120

    gatgatttag aagcagacaa caatgtgtat gcagttatag ttacaggtgc tggtgagaaa    180

    tcttttgttg ctggagcaga tatttcagaa atgaaagatc ttaatgaaga acaaggtaaa    240

    gaatttggta ttttaggaaa caatgtcttc agaagattag aaaaattgga taagccagtt    300

    atcgcagcta tatcaggatt tgctcttggt ggtggatgtg aacttgctat gtcatgtgac    360

    ataagaatag cttcagttaa agctaaattt ggtcaaccag aagcaggact tggaataact    420

    ccaggatttg gtggaactca aagattagct agaattgtag ggccaggaaa agctaaagaa    480

    ttaatttata cttgtgacct tataaatgca gaagaagctt atagaatagg tttagttaat    540

    aaagtagttg aattagaaaa attgatggaa gaagcaaaag caatggctaa caagattgca    600

    gctaatgctc caaaagcagt tgcatattgt aaagatgcta tagacagagg aatgcaagtt    660

    gatatagatg cagctatatt aatagaagca gaagactttg gaaagtgctt tgcaacagaa    720

    gatcaaacag aaggaatgac tgcgttctta gaaagaagag cagaaaagaa ttttcaaaat    780

    aaataa                                                               786

    <210>157

    <211>1140

    <212>DNA

    <213>Cb-bcd

    <400>157

    atgaatttcc aattaactag agaacaacaa ttagtacaac aaatggttag agaattcgca     60

    gtaaatgaag ttaagccaat agctgctgaa atcgacgaat cagaaagatt ccctatggaa    120

    aacgttgaaa aaatggctaa gcttaaaatg atgggtatcc cattttctaa agaatttggt    180

    ggagcaggcg gagatgttct ttcatatata atatctgtgg aagaattatc aaaagtttgt    240

    ggtactacag gagttattct ttcagcgcat acatcattat gtgcatcagt aattaatgaa    300

    aatggaacta acgaacaaag agcaaaatat ttgccagatc tttgtagtgg taagaaaatc    360

    ggtgctttcg gattaacaga accaggcgct ggtacagatg ctgcaggaca acaaacaact    420

    gctgtattag aaggagacca ttatgtatta aatggttcaa aaatcttcat aacaaatggt    480

    ggagttgctg aaactttcat aatatttgct atgacagata agagtcaagg aacaaaagga    540

    atttctgcat tcatagtaga aaagtcattc ccaggattct caataggaaa attagaaaac    600

    aagatgggga tcagagcatc ttcaactact gagttagtta tggaaaactg tatagtacca   660

    aaagaaaacc tacttagcaa agaaggtaag ggatttggta tagcaatgaa aactcttgat   720

    ggaggaagaa ttggtatagc tgctcaagct ttaggtattg cagaaggagc ttttgaagaa   780

    gctgttaact atatgaaaga aagaaaacaa tttggtaaac cattatcagc attccaagga   840

    ttacaatggt atatagctga aatggatgtt aaaatccaag ctgctaaata cttagtatac   900

    ctagctgcaa caaagaagca agctggtgag ccttactcag tggatgctgc aagagctaaa   960

    ttatttgcgg cagatgttgc aatggaagtt acaactaaag cagttcaaat ctttggtgga  1020

    tatggttaca ctaaggaata cccagtagaa agaatgatga gagatgctaa aatatgcgaa  1080

    atctacgaag gaacttcaga agttcaaaag atggttatcg caggaagcat tttaagatag  1140

    <210>158

    <211>1140

    <212>DNA

    <213>Cb-etfA

    <400>158

    atgaatttcc aattaactag agaacaacaa ttagtacaac aaatggttag agaattcgca    60

    gtaaatgaag ttaagccaat agctgctgaa atcgacgaat cagaaagatt ccctatggaa   120

    aacgttgaaa aaatggctaa gcttaaaatg atgggtatcc cattttctaa agaatttggt   180

    ggagcaggcg gagatgttct ttcatatata atatctgtgg aagaattatc aaaagtttgt   240

    ggtactacag gagttattct ttcagcgcat acatcattat gtgcatcagt aattaatgaa   300

    aatggaacta acgaacaaag agcaaaatat ttgccagatc tttgtagtgg taagaaaatc   360

    ggtgctttcg gattaacaga accaggcgct ggtacagatg ctgcaggaca acaaacaact   420

    gctgtattag aaggagacca ttatgtatta aatggttcaa aaatcttcat aacaaatggt   480

    ggagttgctg aaactttcat aatatttgct atgacagata agagtcaagg aacaaaagga   540

    atttctgcat tcatagtaga aaagtcattc ccaggattct caataggaaa attagaaaac   600

    aagatgggga tcagagcatc ttcaactact gagttagtta tggaaaactg tatagtacca   660

    aaagaaaacc tacttagcaa agaaggtaag ggatttggta tagcaatgaa aactcttgat   720

    ggaggaagaa ttggtatagc tgctcaagct ttaggtattg cagaaggagc ttttgaagaa   780

    gctgttaact atatgaaaga aagaaaacaa tttggtaaac cattatcagc attccaagga   840

    ttacaatggt atatagctga aatggatgtt aaaatccaag ctgctaaata cttagtatac   900

    ctagctgcaa caaagaagca agctggtgag ccttactcag tggatgctgc aagagctaaa   960

    ttatttgcgg cagatgttgc aatggaagtt acaactaaag cagttcaaat ctttggtgga  1020

    tatggttaca ctaaggaata cccagtagaa agaatgatga gagatgctaa aatatgcgaa  1080

    atctacgaag gaacttcaga agttcaaaag atggttatcg caggaagcat tttaagatag  1140

    <210>159

    <211>780

    <212>DNA

    <213>Cb-etfB

    <400>159

    atgaatatag tagtttgtgt aaaacaagtt ccagatacta cagcagtaaa aattgatcct     60

    aaaactggta cattaataag agatggtgtt ccatcaataa tgaatccaga ggataaacac    120

    gctttagaag gtgcattaca attaaaagaa aaagttggag gaaaagttac tgtaataagt    180

    atgggacttc caatggctaa agcagtatta agagaagcat tatgtatggg agctgatgaa    240

    gctgtcctat taacagatag agcacttgga ggagcagata ctttagcaac ttcaaaggca    300

    cttgcaggag taatagctaa gttagattat gatttggtat ttgctggaag acaagcaatt    360

    gatggagata ctgcacaagt aggaccagaa atagcagaac atttaaacat tccgcaagta    420

    acttacgttc aagacgttaa agttgaagga aatacattaa tagtaaatag agcactagaa    480

    gatggacatc aagtagtaga agttaaaact ccatgtctat taactgcaat cgaagaatta    540

    aatgaaacta gatatatgaa tgttgtagat atattcgaaa cttcagatga tgaaatcaaa    600

    gttatgagcg cagctgatat agatgtagat gtagctgaat tagggcttaa aggctcacct    660

    acaaaggtta agaagtcaat gactaaggaa gttaaaggtg caggagaaat cgtaagagaa    720

    gcacctaaaa atgcagcata ctatgttgta ggaaaattaa aagaaaaaca ctacatctaa    780

    <210>160

    <211>1167

    <212>DNA

    <213>Cb-adhA

    <400>160

    atggcacgtt ttactttacc aagagacatt tatcatggag aaggagcact tgaggcactt     60

    aaaactttaa aaggtaagaa agctttctta gtagttggtg gcggatcaat gaaaagattt    120

    ggatttctta aacaagttga agattattta aaagaagcag gaatggaagt agaattattt    180

    gaaggtgttg aaccagatcc atcagtggaa acagtaatga aaggcgcaga agctatgaga    240

    aactttgagc ctgattggat agttgcaatg ggtggaggat caccaattga tgctgcaaag    300

    gctatgtgga tattctacga atacccagat tttacttttg aacaagcagt tgttccattt    360

    ggattaccag accttagaca aaaagctaag tttgtagcta ttccatcaac aagcggtaca    420

    gctacagaag ttacagcatt ctcagttatc acaaattatt cagaaaaaat taaatatcct    480

    ttagctgatt ttaacataac tccagatata gcaatagttg atccagcact tgctcaaact    540

    atgccaaaaa ctttaacagc tcatactgga atggatgcat taactcacgc tatagaagca    600

    tacactgcat cacttcaatc aaatttctca gatccattag caattaaagc tgtagaaatg    660

    gttcaagaaa atttaatcaa atcatttgaa ggagataaag aagctagaaa tctaatgcat    720

    gaagctcaat gtttagctgg aatggcattt tctaatgcat tacttggaat agttcactca    780

    atggctcata aggttggtgc tgtattccat attcctcatg gatgtgcaaa tgctatattt    840

    ttaccatatg taattgagta taacagaaca aaatgcgaaa atagatatgg agatattgcg    900

    agagccttaa aattaaaagg aaacaatgat gccgagttaa ctgattcatt aattgaatta    960

    attaatggat taaatgataa gttagagatt cctcactcaa tgaaagagta tggagttact    1020

    gaagaagatt ttaaagctaa tctttcattt atcgctcata acgcagtatt agatgcatgc    1080

    acaggatcaa atcctagaga aatagatgat gctacaatgg aaaaattatt tgaatgcaca    1140

    tactatggaa ctaaagttaa tttgtaa                                        1167

    <210>161

    <211>1407

    <212>DNA

    <213>Cb-aldh

    <400>161

    atgaataaag acacactaat acctacaact aaagatttaa aagtaaaaac aaatggtgaa     60

    aacattaatt taaagaacta caaggataat tcttcatgtt tcggagtatt cgaaaatgtt    120

    gaaaatgcta taagcagcgc tgtacacgca caaaagatat tatcccttca ttatacaaaa    180

    gagcaaagag aaaaaatcat aactgagata agaaaggccg cattacaaaa taaagaggtc    240

    ttggctacaa tgattctaga agaaacacat atgggaagat atgaggataa aatattaaaa    300

    catgaattgg tagctaaata tactcctggt acagaagatt taactactac tgcttggtca    360

    ggtgataatg gtcttacagt tgtagaaatg tctccatatg gtgttatagg tgcaataact    420

    ccttctacga atccaactga aactgtaata tgtaatagca taggcatgat agctgctgga    480

    aatgctgtag tatttaacgg acacccatgc gctaaaaaat gtgttgcctt tgctgttgaa    540

    atgataaata aggcaattat ttcatgtggc ggtcctgaaa atctagtaac aactataaaa    600

    aatccaacta tggagtctct agatgcaatt attaagcatc cttcaataaa acttctttgc    660

    ggaactgggg gtccaggaat ggtaaaaacc ctcttaaatt ctggtaagaa agctataggt    720

    gctggtgctg gaaatccacc agttattgta gatgatactg ctgatataga aaaggctggt    780

    aggagcatca ttgaaggctg ttcttttgat aataatttac cttgtattgc agaaaaagaa    840

    gtatttgttt ttgagaatgt tgcagatgat ttaatatcta acatgctaaa aaataatgct    900

    gtaattataa atgaagatca agtatcaaaa ttaatagatt tagtattaca aaaaaataat    960

    gaaactcaag aatactttat aaacaaaaaa tgggtaggaa aagatgcaaa attattctta   1020

    gatgaaatag atgttgagtc tccttcaaat gttaaatgca taatctgcga agtaaatgca   1080

    aatcatccat ttgttatgac agaactcatg atgccaatat tgccaattgt aagagttaaa   1140

    gatatagatg aagctattaa atatgcaaag atagcagaac aaaatagaaa acatagtgcc   1200

    tatatttatt ctaaaaatat agacaaccta aatagatttg aaagagaaat agatactact   1260

    atttttgtaa agaatgctaa atcttttgct ggtgttggtt atgaagcaga aggatttaca   1320

    actttcacta ttgctggatc tactggtgag ggaataacct ctgcaaggaa ttttacaaga   1380

    caaagaagat gtgtacttgc cggctaa                                       1407

    <210>162

    <211>1179

    <212>DNA

    <213>Ca-thl

    atgaaagaag ttgtaatagc tagtgcagta agaacagcga ttggatctta tggaaagtct     60

    cttaaggatg taccagcagt agatttagga gctacagcta taaaggaagc agttaaaaaa    120

    gcaggaataa aaccagagga tgttaatgaa gtcattttag gaaatgttct tcaagcaggt    180

    ttaggacaga atccagcaag acaggcatct tttaaagcag gattaccagt tgaaattcca    240

    gctatgacta ttaataaggt ttgtggttca ggacttagaa cagttagctt agcagcacaa    300

    attataaaag caggagatgc tgacgtaata atagcaggtg gtatggaaaa tatgtctaga    360

    gctccttact tagcgaataa cgctagatgg ggatatagaa tgggaaacgc taaatttgtt    420

    gatgaaatga tcactgacgg attgtgggat gcatttaatg attaccacat gggaataaca    480

    gcagaaaaca tagctgagag atggaacatt tcaagagaag aacaagatga gtttgctctt    540

    gcatcacaaa aaaaagctga agaagctata aaatcaggtc aatttaaaga tgaaatagtt    600

    cctgtagtaa ttaaaggcag aaagggagaa actgtagttg atacagatga gcaccctaga    660

    tttggatcaa ctatagaagg acttgcaaaa ttaaaacctg ccttcaaaaa agatggaaca    720

    gttacagctg gtaatgcatc aggattaaat gactgtgcag cagtacttgt aatcatgagt    780

    gcagaaaaag ctaaagagct tggagtaaaa ccacttgcta agatagtttc ttatggttca    840

    gcaggagttg acccagcaat aatgggatat ggacctttct atgcaacaaa agcagctatt    900

    gaaaaagcag gttggacagt tgatgaatta gatttaatag aatcaaatga agcttttgca    960

    gctcaaagtt tagcagtagc aaaagattta aaatttgata tgaataaagt aaatgtaaat   1020

    ggaggagcta ttgcccttgg tcatccaatt ggagcatcag gtgcaagaat actcgttact   1080

    cttgtacacg caatgcaaaa aagagatgca aaaaaaggct tagcaacttt atgtataggt   1140

    ggcggacaag gaacagcaat attgctagaa aagtgctag                          1179

    <210>163

    <211>849

    <212>DNA

    <213>Ca-hbd

    <400>163

    atgaaaaagg tatgtgttat aggtgcaggt actatgggtt caggaattgc tcaggcattt     60

    gcagctaaag gatttgaagt agtattaaga gatattaaag atgaatttgt tgatagagga    120

    ttagatttta tcaataaaaa tctttctaaa ttagttaaaa aaggaaagat agaagaagct    180

    actaaagttg aaatcttaac tagaatttcc ggaacagttg accttaatat ggcagctgat    240

    tgcgatttag ttatagaagc agctgttgaa agaatggata ttaaaaagca gatttttgct    300

    gacttagaca atatatgcaa gccagaaaca attcttgcat caaatacatc atcactttca    360

    ataacagaag tggcatcagc aactaaaaga cctgataagg ttataggtat gcatttcttt    420

    aatccagctc ctgttatgaa gcttgtagag gtaataagag gaatagctac atcacaagaa    480

    acttttgatg cagttaaaga gacatctata gcaataggaa aagatcctgt agaagtagca    540

    gaagcaccag gatttgttgt aaatagaata ttaataccaa tgattaatga agcagttggt    600

    atattagcag aaggaatagc ttcagtagaa gacatagata aagctatgaa acttggagct    660

    aatcacccaa tgggaccatt agaattaggt gattttatag gtcttgatat atgtcttgct    720

    ataatggatg ttttatactc agaaactgga gattctaagt atagaccaca tacattactt    780

    aagaagtatg taagagcagg atggcttgga agaaaatcag gaaaaggttt ctacgattat    840

    tcaaaataa                                                            849

    <210>164

    <211>786

    <212>DNA

    <213>Ca-crt

    <400>164

    atggaactaa acaatgtcat ccttgaaaag gaaggtaaag ttgctgtagt taccattaac     60

    agacctaaag cattaaatgc gttaaatagt gatacactaa aagaaatgga ttatgttata    120

    ggtgaaattg aaaatgatag cgaagtactt gcagtaattt taactggagc aggagaaaaa    180

    tcatttgtag caggagcaga tatttctgag atgaaggaaa tgaataccat tgaaggtaga    240

    aaattcggga tacttggaaa taaagtgttt agaagattag aacttcttga aaagcctgta    300

    atagcagctg ttaatggttt tgctttagga ggcggatgcg aaatagctat gtcttgtgat    360

    ataagaatag cttcaagcaa cgcaagattt ggtcaaccag aagtaggtct cggaataaca    420

    cctggttttg gtggtacaca aagactttca agattagttg gaatgggcat ggcaaagcag    480

    cttatattta ctgcacaaaa tataaaggca gatgaagcat taagaatcgg acttgtaaat    540

    aaggtagtag aacctagtga attaatgaat acagcaaaag aaattgcaaa caaaattgtg    600

    agcaatgctc cagtagctgt taagttaagc aaacaggcta ttaatagagg aatgcagtgt    660

    gatattgata ctgctttagc atttgaatca gaagcatttg gagaatgctt ttcaacagag    720

    gatcaaaagg atgcaatgac agctttcata gagaaaagaa aaattgaagg cttcaaaaat    780

    agatag                                                               786

    <210>165

    <211>1140

    <212>DNA

    <213>Ca-bcd

    <400>165

    atggatttta atttaacaag agaacaagaa ttagtaagac agatggttag agaatttgct     60

    gaaaatgaag ttaaacctat agcagcagaa attgatgaaa cagaaagatt tccaatggaa    120

    aatgtaaaga aaatgggtca gtatggtatg atgggaattc cattttcaaa agagtatggt    180

    ggcgcaggtg gagatgtatt atcttatata atcgccgttg aggaattatc aaaggtttgc    240

    ggtactacag gagttattct ttcagcacat acatcacttt gtgcttcatt aataaatgaa    300

    catggtacag aagaacaaaa acaaaaatat ttagtacctt tagctaaagg tgaaaaaata    360

    ggtgcttatg gattgactga gccaaatgca ggaacagatt ctggagcaca acaaacagta    420

    gctgtacttg aaggagatca ttatgtaatt aatggttcaa aaatattcat aactaatgga    480

    ggagttgcag atacttttgt tatatttgca atgactgaca gaactaaagg aacaaaaggt    540

    atatcagcat ttataataga aaaaggcttc aaaggtttct ctattggtaa agttgaacaa    600

    aagcttggaa taagagcttc atcaacaact gaacttgtat ttgaagatat gatagtacca    660

    gtagaaaaca tgattggtaa agaaggaaaa ggcttcccta tagcaatgaa aactcttgat    720

    ggaggaagaa ttggtatagc agctcaagct ttaggtatag ctgaaggtgc tttcaacgaa    780

    gcaagagctt acatgaagga gagaaaacaa tttggaagaa gccttgacaa attccaaggt    840

    cttgcatgga tgatggcaga tatggatgta gctatagaat cagctagata tttagtatat    900

    aaagcagcat atcttaaaca agcaggactt ccatacacag ttgatgctgc aagagctaag    960

    cttcatgctg caaatgtagc aatggatgta acaactaagg cagtacaatt atttggtgga   1020

    tacggatata caaaagatta tccagttgaa agaatgatga gagatgctaa gataactgaa   1080

    atatatgaag gaacttcaga agttcagaaa ttagttattt caggaaaaat ttttagataa   1140

    <210>166

    <211>1011

    <212>DNA

    <213>Ca-etfA

    <400>166

    atgaataaag cagattacaa gggcgtatgg gtgtttgctg aacaaagaga cggagaatta     60

    caaaaggtat cattggaatt attaggtaaa ggtaaggaaa tggctgagaa attaggcgtt    120

    gaattaacag ctgttttact tggacataat actgaaaaaa tgtcaaagga tttattatct    180

    catggagcag ataaggtttt agcagcagat aatgaacttt tagcacattt ttcaacagat    240

    ggatatgcta aagttatatg tgatttagtt aatgaaagaa agccagaaat attattcata    300

    ggagctactt tcataggaag agatttagga ccaagaatag cagcaagact ttctactggt    360

    ttaactgctg attgtacatc acttgacata gatgtagaaa atagagattt attggctaca    420

    agaccagcgt ttggtggaaa tttgatagct acaatagttt gttcagacca cagaccacaa    480

    atggctacag taagacctgg tgtgtttgaa aaattacctg ttaatgatgc aaatgtttct    540

    gatgataaaa tagaaaaagt tgcaattaaa ttaacagcat cagacataag aacaaaagtt    600

    tcaaaagttg ttaagcttgc taaagatatt gcagatatcg gagaagctaa ggtattagtt    660

    gctggtggta gaggagttgg aagcaaagaa aactttgaaa aacttgaaga gttagcaagt    720

    ttacttggtg gaacaatagc cgcttcaaga gcagcaatag aaaaagaatg ggttgataag    780

    gaccttcaag taggtcaaac tggtaaaact gtaagaccaa ctctttatat tgcatgtggt    840

    atatcaggag ctatccagca tttagcaggt atgcaagatt cagattacat aattgctata    900

    aataaagatg tagaagcccc aataatgaag gtagcagatt tggctatagt tggtgatgta    960

    aataaagttg taccagaatt aatagctcaa gttaaagctg ctaataatta a            1011

    <210>167

    <211>780

    <212>DNA

    <213>Ca-etfB

    <400>167

    atgaatatag ttgtttgttt aaaacaagtt ccagatacag cggaagttag aatagatcca     60

    gttaagggaa cacttataag agaaggagtt ccatcaataa taaatccaga tgataaaaac    120

    gcacttgagg aagctttagt attaaaagat aattatggtg cacatgtaac agttataagt    180

    atgggacctc cacaagctaa aaatgcttta gtagaagctt tggctatggg tgctgatgaa    240

    gctgtacttt taacagatag agcatttgga ggagcagata cacttgcgac ttcacataca    300

    attgcagcag gaattaagaa gctaaaatat gatatagttt ttgctggaag gcaggctata    360

    gatggagata cagctcaggt tggaccagaa atagctgagc atcttggaat acctcaagta    420

    acttatgttg agaaagttga agttgatgga gatactttaa agattagaaa agcttgggaa    480

    gatggatatg aagttgttga agttaagaca ccagttcttt taacagcaat taaagaatta    540

    aatgttccaa gatatatgag tgtagaaaaa atattcggag catttgataa agaagtaaaa    600

    atgtggactg ccgatgatat agatgtagat aaggctaatt taggtcttaa aggttcacca    660

    actaaagtta agaagtcatc aactaaagaa gttaaaggac agggagaagt tattgataag    720

    cctgttaagg aagcagctgc atatgttgtc tcaaaattaa aagaagaaca ctatatttaa    780

    <210>168

    <211>2577

    <212>DNA

    <213>Ca-adhE2

    <400>168

    atgaaagtta caaatcaaaa agaactaaaa caaaagctaa atgaattgag agaagcgcaa     60

    aagaagtttg caacctatac tcaagagcaa gttgataaaa tttttaaaca atgtgccata    120

    gccgcagcta aagaaagaat aaacttagct aaattagcag tagaagaaac aggaataggt    180

    cttgtagaag ataaaattat aaaaaatcat tttgcagcag aatatatata caataaatat    240

    aaaaatgaaa aaacttgtgg cataatagac catgacgatt ctttaggcat aacaaaggtt    300

    gctgaaccaa ttggaattgt tgcagccata gttcctacta ctaatccaac ttccacagca    360

    attttcaaat cattaatttc tttaaaaaca agaaacgcaa tattcttttc accacatcca    420

    cgtgcaaaaa aatctacaat tgctgcagca aaattaattt tagatgcagc tgttaaagca    480

    ggagcaccta aaaatataat aggctggata gatgagccat caatagaact ttctcaagat    540

    ttgatgagtg aagctgatat aatattagca acaggaggtc cttcaatggt taaagcggcc    600

    tattcatctg gaaaacctgc aattggtgtt ggagcaggaa atacaccagc aataatagat    660

    gagagtgcag atatagatat ggcagtaagc tccataattt tatcaaagac ttatgacaat    720

    ggagtaatat gcgcttctga acaatcaata ttagttatga attcaatata cgaaaaagtt    780

    aaagaggaat ttgtaaaacg aggatcatat atactcaatc aaaatgaaat agctaaaata    840

    aaagaaacta tgtttaaaaa tggagctatt aatgctgaca tagttggaaa atctgcttat    900

    ataattgcta aaatggcagg aattgaagtt cctcaaacta caaagatact tataggcgaa    960

    gtacaatctg ttgaaaaaag cgagctgttc tcacatgaaa aactatcacc agtacttgca    1020

    atgtataaag ttaaggattt tgatgaagct ctaaaaaagg cacaaaggct aatagaatta    1080

    ggtggaagtg gacacacgtc atctttatat atagattcac aaaacaataa ggataaagtt    1140

    aaagaatttg gattagcaat gaaaacttca aggacattta ttaacatgcc ttcttcacag    1200

    ggagcaagcg gagatttata caattttgcg atagcaccat catttactct tggatgcggc    1260

    acttggggag gaaactctgt atcgcaaaat gtagagccta aacatttatt aaatattaaa    1320

    agtgttgctg aaagaaggga aaatatgctt tggtttaaag tgccacaaaa aatatatttt    1380

    aaatatggat gtcttagatt tgcattaaaa gaattaaaag atatgaataa gaaaagagcc    1440

    tttatagtaa cagataaaga tctttttaaa cttggatatg ttaataaaat aacaaaggta    1500

    ctagatgaga tagatattaa atacagtata tttacagata ttaaatctga tccaactatt    1560

    gattcagtaa aaaaaggtgc taaagaaatg cttaactttg aacctgatac tataatctct    1620

    attggtggtg gatcgccaat ggatgcagca aaggttatgc acttgttata tgaatatcca    1680

    gaagcagaaa ttgaaaatct agctataaac tttatggata taagaaagag aatatgcaat    1740

    ttccctaaat taggtacaaa ggcgatttca gtagctattc ctacaactgc tggtaccggt    1800

    tcagaggcaa caccttttgc agttataact aatgatgaaa caggaatgaa atacccttta    1860

    acttcttatg aattgacccc aaacatggca ataatagata ctgaattaat gttaaatatg    1920

    cctagaaaat taacagcagc aactggaata gatgcattag ttcatgctat agaagcatat    1980

    gtttcggtta tggctacgga ttatactgat gaattagcct taagagcaat aaaaatgata    2040

    tttaaatatt tgcctagagc ctataaaaat gggactaacg acattgaagc aagagaaaaa    2100

    atggcacatg cctctaatat tgcggggatg gcatttgcaa atgctttctt aggtgtatgc    2160

    cattcaatgg ctcataaact tggggcaatg catcacgttc cacatggaat tgcttgtgct    2220

    gtattaatag aagaagttat taaatataac gctacagact gtccaacaaa gcaaacagca    2280

    ttccctcaat ataaatctcc taatgctaag agaaaatatg ctgaaattgc agagtatttg    2340

    aatttaaagg gtactagcga taccgaaaag gtaacagcct taatagaagc tatttcaaag    2400

    ttaaagatag atttgagtat tccacaaaat ataagtgccg ctggaataaa taaaaaagat    2460

    ttttataata cgctagataa aatgtcagag cttgcttttg atgaccaatg tacaacagct    2520

    aatcctaggt atccacttat aagtgaactt aaggatatct atataaaatc attttaa       2577

    <210>169

    <211>2589

    <212>DNA

    <213>Ca-aad

    <400>169

    atgaaagtca caacagtaaa ggaattagat gaaaaactca aggtaattaa agaagctcaa     60

    aaaaaattct cttgttactc gcaagaaatg gttgatgaaa tctttagaaa tgcagcaatg    120

    gcagcaatcg acgcaaggat agagctagca aaagcagctg ttttggaaac cggtatgggc    180

    ttagttgaag acaaggttat aaaaaatcat tttgcaggcg aatacatcta taacaaatat    240

    aaggatgaaa aaacctgcgg tataattgaa cgaaatgaac cctacggaat tacaaaaata     300

    gcagaaccta taggagttgt agctgctata atccctgtaa caaaccccac atcaacaaca     360

    atatttaaat ccttaatatc ccttaaaact agaaatggaa ttttcttttc gcctcaccca     420

    agggcaaaaa aatccacaat actagcagct aaaacaatac ttgatgcagc cgttaagagt     480

    ggtgccccgg aaaatataat aggttggata gatgaacctt caattgaact aactcaatat     540

    ttaatgcaaa aagcagatat aacccttgca actggtggtc cctcactagt taaatctgct     600

    tattcttccg gaaaaccagc aataggtgtt ggtccgggta acaccccagt aataattgat     660

    gaatctgctc atataaaaat ggcagtaagt tcaattatat tatccaaaac ctatgataat     720

    ggtgttatat gtgcttctga acaatctgta atagtcttaa aatccatata taacaaggta     780

    aaagatgagt tccaagaaag aggagcttat ataataaaga aaaacgaatt ggataaagtc     840

    cgtgaagtga tttttaaaga tggatccgta aaccctaaaa tagtcggaca gtcagcttat     900

    actatagcag ctatggctgg cataaaagta cctaaaacca caagaatatt aataggagaa     960

    gttacctcct taggtgaaga agaacctttt gcccacgaaa aactatctcc tgttttggct    1020

    atgtatgagg ctgacaattt tgatgatgct ttaaaaaaag cagtaactct aataaactta    1080

    ggaggcctcg gccatacctc aggaatatat gcagatgaaa taaaagcacg agataaaata    1140

    gatagattta gtagtgccat gaaaaccgta agaacctttg taaatatccc aacctcacaa    1200

    ggtgcaagtg gagatctata taattttaga ataccacctt ctttcacgct tggctgcgga    1260

    ttttggggag gaaattctgt ttccgagaat gttggtccaa aacatctttt gaatattaaa    1320

    accgtagctg aaaggagaga aaacatgctt tggtttagag ttccacataa agtatatttt    1380

    aagttcggtt gtcttcaatt tgctttaaaa gatttaaaag atctaaagaa aaaaagagcc    1440

    tttatagtta ctgatagtga cccctataat ttaaactatg ttgattcaat aataaaaata    1500

    cttgagcacc tagatattga ttttaaagta tttaataagg ttggaagaga agctgatctt    1560

    aaaaccataa aaaaagcaac tgaagaaatg tcctccttta tgccagacac tataatagct    1620

    ttaggtggta cccctgaaat gagctctgca aagctaatgt gggtactata tgaacatcca    1680

    gaagtaaaat ttgaagatct tgcaataaaa tttatggaca taagaaagag aatatatact    1740

    ttcccaaaac tcggtaaaaa ggctatgtta gttgcaatta caacttctgc tggttccggt    1800

    tctgaggtta ctccttttgc tttagtaact gacaataaca ctggaaataa gtacatgtta    1860

    gcagattatg aaatgacacc aaatatggca attgtagatg cagaacttat gatgaaaatg    1920

    ccaaagggat taaccgctta ttcaggtata gatgcactag taaatagtat agaagcatac    1980

    acatccgtat atgcttcaga atacacaaac ggactagcac tagaggcaat acgattaata    2040

    tttaaatatt tgcctgaggc ttacaaaaac ggaagaacca atgaaaaagc aagagagaaa    2100

    atggctcacg cttcaactat ggcaggtatg gcatccgcta atgcatttct aggtctatgt    2160

    cattccatgg caataaaatt aagttcagaa cacaatattc ctagtggcat tgccaatgca    2220

    ttactaatag aagaagtaat aaaatttaac gcagttgata atcctgtaaa acaagcccct    2280

    tgcccacaat ataagtatcc aaacaccata tttagatatg ctcgaattgc agattatata    2340

    aagcttggag gaaatactga tgaggaaaag gtagatctct taattaacaa aatacatgaa    2400

    ctaaaaaaag ctttaaatat accaacttca ataaaggatg caggtgtttt ggaggaaaac    2460

    ttctattcct cccttgatag aatatctgaa cttgcactag atgatcaatg cacaggcgct    2520

    aatcctagat ttcctcttac aagtgagata aaagaaatgt atataaattg ttttaaaaaa    2580

    caaccttaa                                                            2589

    <210>170

    <211>1167

    <212>DNA

    <213>Ca-bdhA

    <400>170

    atgctaagtt ttgattattc aataccaact aaagtttttt ttggaaaagg aaaaatagac     60

    gtaattggag aagaaattaa gaaatatggc tcaagagtgc ttatagttta tggcggagga    120

    agtataaaaa ggaacggtat atatgataga gcaacagcta tattaaaaga aaacaatata    180

    gctttctatg aactttcagg agtagagcca aatcctagga taacaacagt aaaaaaaggc    240

    atagaaatat gtagagaaaa taatgtggat ttagtattag caataggggg aggaagtgca    300

    atagactgtt ctaaggtaat tgcagctgga gtttattatg atggcgatac atgggacatg    360

    gttaaagatc catctaaaat aactaaagtt cttccaattg caagtatact tactctttca    420

    gcaacagggt ctgaaatgga tcaaattgca gtaatttcaa atatggagac taatgaaaag    480

    cttggagtag gacatgatga tatgagacct aaattttcag tgttagatcc tacatatact    540

    tttacagtac ctaaaaatca aacagcagcg ggaacagctg acattatgag tcacaccttt    600

    gaatcttact ttagtggtgt tgaaggtgct tatgtgcagg acggtatagc agaagcaatc    660

    ttaagaacat gtataaagta tggaaaaata gcaatggaga agactgatga ttacgaggct    720

    agagctaatt tgatgtgggc ttcaagttta gctataaatg gtctattatc acttggtaag    780

    gatagaaaat ggagttgtca tcctatggaa cacgagttaa gtgcatatta tgatataaca    840

    catggtgtag gacttgcaat tttaacacct aattggatgg aatatattct aaatgacgat    900

    acacttcata aatttgtttc ttatggaata aatgtttggg gaatagacaa gaacaaagat    960

    aactatgaaa tagcacgaga ggctattaaa aatacgagag aatactttaa ttcattgggt   1020

    attccttcaa agcttagaga agttggaata ggaaaagata aactagaact aatggcaaag   1080

    caagctgtta gaaattctgg aggaacaata ggaagtttaa gaccaataaa tgcagaggat   1140

    gttcttgaga tatttaaaaa atcttat                                       1167

    <210>171

    <211>1173

    <212>DNA

    <213>Ca-bdhB

    <400>171

    atggttgatt tcgaatattc aataccaact agaatttttt tcggtaaaga taagataaat     60

    gtacttggaa gagagcttaa aaaatatggt tctaaagtgc ttatagttta tggtggagga   120

    agtataaaga gaaatggaat atatgataaa gctgtaagta tacttgaaaa aaacagtatt   180

    aaattttatg aacttgcagg agtagagcca aatccaagag taactacagt tgaaaaagga   240

    gttaaaatat gtagagaaaa tggagttgaa gtagtactag ctataggtgg aggaagtgca   300

    atagattgcg caaaggttat agcagcagca tgtgaatatg atggaaatcc atgggatatt   360

    gtgttagatg gctcaaaaat aaaaagggtg cttcctatag ctagtatatt aaccattgct   420

    gcaacaggat cagaaatgga tacgtgggca gtaataaata atatggatac aaacgaaaaa   480

    ctaattgcgg cacatccaga tatggctcct aagttttcta tattagatcc aacgtatacg   540

    tataccgtac ctaccaatca aacagcagca ggaacagctg atattatgag tcatatattt   600

    gaggtgtatt ttagtaatac aaaaacagca tatttgcagg atagaatggc agaagcgtta   660

    ttaagaactt gtattaaata tggaggaata gctcttgaga agccggatga ttatgaggca   720

    agagccaatc taatgtgggc ttcaagtctt gcgataaatg gacttttaac atatggtaaa   780

    gacactaatt ggagtgtaca cttaatggaa catgaattaa gtgcttatta cgacataaca   840

    cacggcgtag ggcttgcaat tttaacacct aattggatgg agtatatttt aaataatgat   900

    acagtgtaca agtttgttga atatggtgta aatgtttggg gaatagacaa agaaaaaaat   960

    cactatgaca tagcacatca agcaatacaa aaaacaagag attactttgt aaatgtacta  1020

    ggtttaccat ctagactgag agatgttgga attgaagaag aaaaattgga cataatggca  1080

    aaggaatcag taaagcttac aggaggaacc ataggaaacc taagaccagt aaacgcctcc  1140

    gaagtcctac aaatattcaa aaaatctgtg taa                               1173

    <210>172

    <211>48

    <212>DNA

    <213>AU1标签

    <400>172

    atggatactt atagatacat tggtggtgac acatacaggt atatcggt                 48

    <210>173

    <211>33

    <212>DNA

    <213>HA标签

    <400>173

    atgtacccat acgatgttcc tgactatgcg ggt                                 33

    <210>174

    <211>33

    <212>DNA

    <213>myc标签

    <400>174

    atggaacaaa aactcatctc agaagaagat ggt                                 33

    <210>175

    <211>403

    <212>DNA

    <213>TEF1启动子

    <400>175

    catagcttca aaatgtttct actccttttt tactcttcca gattttctcg gactccgcgc   60

    atcgccgtac cacttcaaaa cacccaagca cagcatacta aatttcccct ctttcttcct  120

    ctagggtgtc gttaattacc cgtactaaag gtttggaaaa gaaaaaagag accgcctcgt  180

    ttctttttct tcgtcgaaaa aggcaataaa aatttttatc acgtttcttt ttcttgaaaa  240

    tttttttttt gatttttttc tctttcgatg acctcccatt gatatttaag ttaataaacg  300

    gtcttcaatt tctcaagttt cagtttcatt tttcttgttc tattacaact ttttttactt  360

    cttgctcatt agaaagaaag catagcaatc taatctaagt ttt                    403

    <210>176

    <211>650

    <212>DNA

    <213>TDH3启动子

    <400>176

    agtttatcat tatcaatact cgccatttca aagaatacgt aaataattaa tagtagtgat   60

    tttcctaact ttatttagtc aaaaaattag ccttttaatt ctgctgtaac ccgtacatgc  120

    ccaaaatagg gggcgggtta cacagaatat ataacatcgt aggtgtctgg gtgaacagtt  180

    tattcctggc atccactaaa tataatggag cccgcttttt aagctggcat ccagaaaaaa  240

    aaagaatccc agcaccaaaa tattgttttc ttcaccaacc atcagttcat aggtccattc  300

    tcttagcgca actacagaga acaggggcac aaacaggcaa aaaacgggca caacctcaat  360

    ggagtgatgc aacctgcctg gagtaaatga tgacacaagg caattgaccc acgcatgtat  420

    ctatctcatt ttcttacacc ttctattacc ttctgctctc tctgatttgg aaaaagctga  480

    aaaaaaaggt tgaaaccagt tccctgaaat tattccccta cttgactaat aagtatataa  540

    agacggtagg tattgattgt aattctgtaa atctatttct taaacttctt aaattctact  600

    tttatagtta gtcttttttt tagttttaaa acaccagaac ttagtttcga             650

    <210>177

    <211>493

    <212>DNA

    <213>MET3启动子

    <400>177

    tttagtacta acagagactt ttgtcacaac tacatataag tgtacaaata tagtacagat   60

    atgacacact tgtagcgcca acgcgcatcc tacggattgc tgacagaaaa aaaggtcacg  120

    tgaccagaaa agtcacgtgt aattttgtaa ctcaccgcat tctagcggtc cctgtcgtgc  180

    acactgcact caacaccata aaccttagca acctccaaag gaaatcaccg tataacaaag  240

    ccacagtttt acaacttagt ctcttatgaa gttacttacc aatgagaaat agaggctctt  300

    tctcgagaaa tatgaatatg gatatatata tatatatata tatatatata tatatatatg  360

    taaacttggt tcttttttag cttgtgatct ctagcttggg tctctctctg tcgtaacagt  420

    tgtgatatcg tttcttaaca attgaaaagg aactaagaaa gtataataat aacaagaata  480

    aagtataatt aac                                                     493

    <210>178

    <211>461

    <212>DNA

    <213>CUP1启动子

    <400>178

    gccgatccca ttaccgacat ttgggcgcta tacgtgcata tgttcatgta tgtatctgta   60

    tttaaaacac ttttgtatta tttttcctca tatatgtgta taggtttata cggatgattt  120

    aattattact tcaccaccct ttatttcagg ctgatatctt agccttgtta ctagttagaa  180

    aaagacattt ttgctgtcag tcactgtcaa gagattcttt tgctggcatt tcttctagaa  240

    gcaaaaagag cgatgcgtct tttccgctga accgttccag caaaaaagac taccaacgca  300

    atatggattg tcagaatcat ataaaagaga agcaaataac tccttgtctt gtatcaattg  360

    cattataata tcttcttgtt agtgcaatat catatagaag tcatcgaaat agatattaag  420

    aaaaacaaac tgtacaatca atcaatcaat catcacataa a                      461

    <210>179

    <211>1197

    <212>DNA

    <213>Ca-ter

    <400>179

    atgatagtaa aagcaaagtt tgtaaaagga tttatcagag atgtacatcc ttatggttgc   60

    agaagggaag tactaaatca aatagattat tgtaagaagg ctattgggtt taggggacca  120

    aagaaggttt taattgttgg agcctcatct gggtttggtc ttgctactag aatttcagtt  180

    gcatttggag gtccagaagc tcacacaatt ggagtatcct atgaaacagg agctacagat  240

    agaagaatag gaacagcggg atggtataat aacatatttt ttaaagaatt tgctaaaaaa  300

    aaaggattag ttgcaaaaaa cttcattgag gatgcctttt ctaatgaaac caaagataaa  360

    gttattaagt atataaagga tgaatttggt aaaatagatt tatttgttta tagtttagct  420

    gcgcctagga gaaaggacta taaaactgga aatgtttata cttcaagaat aaaaacaatt  480

    ttaggagatt ttgagggacc gactattgat gttgaaagag acgagattac tttaaaaaag  540

    gttagtagtg ctagcattga agaaattgaa gaaactagaa aggtaatggg tggagaggat  600

    tggcaagagt ggtgtgaaga gctgctttat gaagattgtt tttcggataa agcaactacc  660

    atagcatact cgtatatagg atccccaaga acctacaaga tatatagaga aggtactata  720

    ggaatagcta aaaaggatct tgaagataag gctaagctta taaatgaaaa acttaacaga  780

    gttataggtg gtagagcctt tgtgtctgtg aataaagcat tagttacaaa agcaagtgca  840

    tatattccaa cttttcctct ttatgcagct attttatata aggtcatgaa agaaaaaaat  900

    attcatgaaa attgtattat gcaaattgag agaatgtttt ctgaaaaaat atattcaaat  960

    gaaaaaatac aatttgatga caagggaaga ttaaggatgg acgatttaga gcttagaaaa 1020

    gacgttcaag acgaagttga tagaatatgg agtaatatta ctcctgaaaa ttttaaggaa    1080

    ttatctgatt ataagggata caaaaaagaa ttcatgaact taaacggttt tgatctagat    1140

    ggggttgatt atagtaaaga cctggatata gaattattaa gaaaattaga accttaa       1197

    <210>180

    <211>1194

    <212>DNA

    <213>Ah-ter

    <400>180

    atgatcatta aaccgaaagt tcgtggcttc atttgtacca ccactcatcc ggttggctgt     60

    gaagctaatg tacgccgcca gatcgcgtat accaaagcaa aaggcactat cgaaaacggc    120

    cctaagaaag tgctggtgat tggtgcgagc accggttacg gtctggcgtc ccgcattgca    180

    gcggcgttcg gtagcggcgc cgcgaccctg ggtgttttct tcgaaaaagc gggctccgaa    240

    actaaaaccg cgaccgcagg ttggtacaac tctgccgcgt ttgacaaagc cgccaaagag    300

    gctggcctgt atgcgaaatc tattaacggt gacgcgttca gcaacgaatg ccgtgctaaa    360

    gtgatcgaac tgatcaaaca ggatctgggc caaattgatc tggttgttta ttctctggcc    420

    tccccggttc gtaaactgcc ggataccggc gaagttgtgc gcagcgctct gaaacctatt    480

    ggtgaagtgt acaccacgac cgcaattgat actaataagg accagattat caccgcaacc    540

    gtcgagccgg ccaacgagga agagatccag aataccatca ctgtgatggg cggtcaagac    600

    tgggaactgt ggatggcagc actgcgcgac gcaggtgttc tggcagacgg tgcaaagagc    660

    gtcgcttact cttacatcgg cactgacctg acttggccga tctactggca tggcaccctg    720

    ggtcgcgcga aagaggatct ggatcgcgca gcggcagcga tccgcggtga tctggccggt    780

    aagggcggta ctgcgcacgt tgccgttctg aaatccgtgg tcacccaggc atcttctgca    840

    atcccggtga tgccgctgta tatttctatg gcctttaaaa tcatgaaaga gaagggtatc    900

    cacgaaggct gtatggagca agtggaccgc atgatgcgta ctcgcctgta cgcggcggac    960

    atggcactgg atgaccaggc gcgtatccgt atggacgatt gggaactgcg tgaagatgtt   1020

    cagcagactt gccgtgatct gtggccgtcc attacctccg aaaacctgtg cgagctgacc   1080

    gattacactg gttacaaaca ggaatttctg cgtctgttcg gtttcggtct ggaagaagta   1140

    gactacgatg cagacgttaa cccggacgtt aaatttgatg ttgtcgaact gtga         1194

    <210>181

    <211>1218

    <212>DNA

    <213>Eg-ter

    <400>181

    atggccatgt tcaccactac cgccaaggtt attcagccga aaatccgtgg ttttatctgt     60

    acgaccaccc acccgattgg ctgtgaaaaa cgcgtgcagg aagaaattgc ttacgcacgt    120

    gcacatccac cgaccagccc gggtccgaaa cgtgtcctgg tcatcggctg ttccactggc    180

    tacggcctgt ctactcgtat caccgcagct ttcggctatc aggcggctac tctgggcgtg    240

    ttcctggctg gtccgccgac taaaggtcgc ccggctgcgg ccggttggta taacaccgta    300

    gctttcgaaa aagcggccct ggaagccggt ctgtatgccc gctccctgaa cggtgacgct    360

    tttgactcta ctaccaaagc acgcaccgtg gaagctatca aacgtgacct gggcaccgtt    420

    gacctggtgg tttatagcat tgcagctccg aaacgtaccg atccggctac cggcgtgctg    480

    cacaaagcgt gtctgaaacc gatcggtgcg acctacacca accgtacggt aaatactgac    540

    aaagctgaag ttacggacgt gtccatcgaa ccggcgagcc cagaagaaat tgcagacact    600

    gtgaaagtaa tgggtggcga agactgggaa ctgtggattc aggctctgtc tgaagccggc    660

    gttctggcag aaggcgcgaa aaccgtcgca tactcttata tcggtccgga gatgacctgg    720

    ccggtgtact ggtccggcac cattggtgaa gccaaaaagg atgttgaaaa agccgctaaa    780

    cgtattaccc agcagtacgg ctgtccggca tacccggttg tggcaaaagc actggtgacg    840

    caggcatcct ccgcgatccc ggtcgtcccg ctgtatattt gtctgctgta ccgtgtaatg    900

    aaagaaaaag gcactcacga aggttgcatc gaacaaatgg tgcgtctgct gaccacgaaa    960

    ctgtacccgg aaaacggtgc cccgatcgtt gatgaagcgg gccgtgttcg tgtggacgat   1020

    tgggaaatgg cagaagacgt tcagcaagcc gttaaagacc tgtggagcca ggtgagcacg   1080

    gcaaacctga aagatatttc cgacttcgcc ggttaccaaa ccgagttcct gcgcctgttt   1140

    ggttttggta tcgatggcgt ggactatgac cagccggttg acgtagaggc agacctgccg   1200

    agcgcagctc agcagtaa                                                 1218

    <210>182

    <211>1344

    <212>DNA

    <213>Sc-ccr

    <400>182

    atgaccgtga aagacattct ggacgctatt caatctaaag acgccacttc cgcggatttc     60

    gcagctctgc aactgccgga gtcctaccgt gccatcaccg ttcacaaaga tgaaactgaa    120

    atgttcgcgg gtctggaaac tcgtgacaaa gatccacgta aatccattca cctggacgaa    180

    gttccagtgc cggaactggg tccgggcgaa gccctggtgg cagttatggc aagctccgtt    240

    aactacaact ctgtatggac gtctatcttt gaaccggtaa gcaccttcgc cttcctggaa    300

    cgctacggca aactgtctcc gctgaccaaa cgtcatgatc tgccatacca catcatcggt    360

    tctgacctgg caggcgtcgt cctgcgtacc ggccctggtg ttaacgcctg gcagccgggt    420

    gacgaagtcg ttgcccattg cctgtctgtt gaactggaat cccctgatgg ccatgatgac    480

    accatgctgg acccggagca gcgtatttgg ggcttcgaaa ctaactttgg tggtctggct    540

    gagattgctc tggtgaagac taaccagctg atgccgaaac caaaacacct gacttgggaa    600

    gaagccgcgg ctccgggcct ggtcaacagc actgcgtatc gtcagctggt ttctcgtaac    660

    ggtgctgcta tgaaacaggg tgataacgtt ctgatctggg gcgcgtccgg tggtctgggc    720

    tcttacgcga cccagttcgc actggccggt ggcgcgaatc cgatctgcgt tgttagctct    780

    ccgcagaaag ctgaaatttg tcgttctatg ggcgcagaag cgatcattga tcgcaacgca     840

    gagggctaca aattttggaa agacgaacat acccaggacc ctaaggaatg gaagcgtttc     900

    ggcaaacgta tccgcgaact gactggtggt gaagacattg atatcgtttt tgaacaccct     960

    ggtcgtgaga cttttggtgc gtctgtatac gttacccgca agggcggtac gatcaccacc    1020

    tgtgcatcta cctctggcta catgcatgag tatgataacc gttacctgtg gatgtccctg    1080

    aaacgtatca tcggctctca ctttgctaac tatcgcgaag cctatgaggc aaaccgtctg    1140

    atcgctaaag gcaaaattca tccgactctg tctaaaacct attccctgga ggaaactggc    1200

    caggcggcct acgacgtaca ccgtaacctg caccagggca aagttggcgt tctgtgcctg    1260

    gctccggaag aaggtctggg tgttcgtgac gctgaaatgc gtgctcagca cattgacgcg    1320

    attaaccgtt tccgtaatgt gtga                                           1344

    <210>183

    <211>36

    <212>DNA

    <213>Gevo-345

    <400>183

    atgtttgtcg acatgatagt aaaagcaaag tttgta                               36

    <210>184

    <211>41

    <212>DNA

    <213>Gevo-346

    <400>184

    cttaatgcgg ccgcttaagg ttctaatttt cttaataatt c                         41

    <210>185

    <211>35

    <212>DNA

    <213>Gevo-343

    <400>185

    gcttgagtcg acatgatcat taaaccgaaa gttcg                                35

    <210>186

    <211>37

    <212>DNA

    <213>Gevo-344

    <400>186

    atttaaggat cctcacagtt cgacaacatc aaattta                              37

    <210>187

    <211>32

    <212>DNA

    <213>Gevo-347

    <400>187

    catcacgtcg acatggccat gt tcaccact ac                                  32

    <210>188

    <211>31

    <212>DNA

    <213>Gevo-348

    <400>188

    ctcgcgggat ccttactgct gagctgcgct c                               31

    <210>189

    <211>33

    <212>DNA

    <213>Gevo-341

    <400>189

    gtcttagtcg acatgaccgt gaaagacatt ctg                             33

    <210>190

    <211>34

    <212>DNA

    <213>Gevo-342

    <400>190

    attggcggat cctcacacat tacggaaacg gtta                            34

由代谢工程化酵母进行的丁醇生产.pdf_第1页
第1页 / 共175页
由代谢工程化酵母进行的丁醇生产.pdf_第2页
第2页 / 共175页
由代谢工程化酵母进行的丁醇生产.pdf_第3页
第3页 / 共175页
点击查看更多>>
资源描述

《由代谢工程化酵母进行的丁醇生产.pdf》由会员分享,可在线阅读,更多相关《由代谢工程化酵母进行的丁醇生产.pdf(175页珍藏版)》请在专利查询网上搜索。

公开了代谢工程化酵母及生产正丁醇的方法。在一个实施方案中,代谢工程化酵母能够代谢碳源以生成正丁醇,至少一种途径生成相对于野生型酵母所生成的胞质乙酰-CoA增加的胞质乙酰-CoA,且至少一种异源基因编码并表达能够利用NADH来将乙酰-CoA转化成正丁醇的代谢途径的至少一种酶。在另一个实施方案中,生产正丁醇的方法包括(a)提供如下代谢工程化酵母,其能够代谢碳源以生成正丁醇,至少一种途径生成相对于野生型。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 化学;冶金 > 生物化学;啤酒;烈性酒;果汁酒;醋;微生物学;酶学;突变或遗传工程


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1