来自木糖氧化无色杆菌的丁醇脱氢酶.pdf

上传人:e2 文档编号:861012 上传时间:2018-03-15 格式:PDF 页数:38 大小:1.28MB
返回 下载 相关 举报
摘要
申请专利号:

CN200980114986.2

申请日:

2009.04.28

公开号:

CN102016013A

公开日:

2011.04.13

当前法律状态:

撤回

有效性:

无权

法律详情:

发明专利申请公布后的视为撤回IPC(主分类):C12N 9/04申请公布日:20110413|||实质审查的生效IPC(主分类):C12N 9/04申请日:20090428|||公开

IPC分类号:

C12N9/04; C12P7/16

主分类号:

C12N9/04

申请人:

布特马斯先进生物燃料公司

发明人:

M·G·布拉穆奇; A·C·埃利奥特; L·A·马吉奥-霍尔; C·E·纳卡穆拉

地址:

美国特拉华州

优先权:

2008.04.28 US 61/048291

专利代理机构:

中国专利代理(香港)有限公司 72001

代理人:

李波;李连涛

PDF下载: PDF下载
内容摘要

从分离自环境样本的细菌菌株中,在包含1-丁醇作碳源的培养基中富集后,鉴定了具有丁醇脱氢酶活性的新酶。该酶能够将丁醛转化成1-丁醇、将异丁醛转化成异丁醇、以及将2-丁酮转化成2-丁醇,并且因此对在生产这些底物的重组微生物宿主中的丁醇生物合成是有用的。从经鉴定为木糖氧化无色杆菌的分离蛋白的菌株中分离称为sadB的编码基因。

权利要求书

1: 分离的核酸分子,所述分离的核酸分子包含编码至少约 250 个氨基酸的多肽的第一 核苷酸序列,所述多肽基于 Smith-Waterman 比对方法在与具有如 SEQ ID NO :2 所示序 列的多肽进行比较时具有至少约 70%的同一性,或者所述分离的核酸分子包含第二核苷 酸序列,所述第二核苷酸序列包含第一核苷酸序列的互补序列,其中所述酶具有丁醇脱 氢酶活性。
2: 编码丁醇脱氢酶的分离的核酸分子,所述分离的核酸分子选自 : a) 编码如 SEQ ID NO :2 所示的氨基酸序列的分离的核酸分子 ; b) 在如下所述的杂交条件下与 (a) 杂交的分离的核酸分子 :0.1XSSC、0.1% SDS, 65℃以及用 2X SSC、0.1% SDS 洗涤,之后用 0.1X SSC、0.1% SDS 洗涤 ;或 与 (a) 或 (b) 互补的分离的核酸分子。
3: 权利要求 1 或 2 的分离的核酸分子,所述分离的核酸分子具有选自 SEQ ID NO :1 和 SEQ ID NO :3 的序列。
4: 具有如 SEQ ID NO :2 所示的氨基酸序列的多肽。
5: 包含权利要求 1 或 2 的分离的核酸分子的嵌合基因,所述分离的核酸分子可操作地 连接至合适的调控序列。
6: 包含权利要求 1 或 2 的核酸分子的转化的宿主细胞。
7: 权利要求 6 的转化的宿主细胞,其中所述宿主细胞选自细菌、蓝细菌、丝状真菌和 酵母。
8: 权利要求 7 的转化的宿主细胞,其中所述宿主细胞为选自下组的属的成员 :梭菌 属、发酵单胞菌属、埃希氏菌属、沙门氏菌属、红球菌属、假单胞菌属、芽孢杆菌属、 乳杆菌属、肠球菌属、产碱杆菌属、克雷伯氏菌属、类芽胞杆菌属、节杆菌属、棒状杆 菌属、短杆菌属、毕赤酵母属、假丝酵母属、汉逊酵母属、克鲁维酵母属和糖酵母属。
9: 生产 2- 丁醇的方法,所述方法包括 : a) 提供包含权利要求 1 或 2 中任一项的分离的核酸分子的重组微生物生产宿主细胞, 所述分离的核酸分子编码具有丁醇脱氢酶活性的多肽,并且提供 2- 丁酮来源 ; b) 使 (a) 的微生物宿主细胞在表达所述分离的核酸分子并将所述 2- 丁酮转化成 2- 丁 醇的条件下生长 ;以及 c) 任选地回收所述 2- 丁醇。
10: 生产异丁醇的方法,所述方法包括 a) 提供包含权利要求 1 或 2 中任一项的分离的核酸分子的重组微生物生产宿主细胞, 所述分离的核酸分子编码具有丁醇脱氢酶活性的多肽,并且提供异丁醛来源 ; b) 使 (a) 的微生物宿主细胞在表达所述分离的核酸分子并将所述异丁醛转化成异丁 醇的条件下生长 ;以及 c) 任选地回收所述异丁醇。
11: 生产 1- 丁醇的方法,所述方法包括 a) 提供包含权利要求 1 或 2 中任一项的分离的核酸分子的重组微生物生产宿主细胞, 所述分离的核酸分子编码具有丁醇脱氢酶活性的多肽,并且提供丁醛来源 ;以及 b) 使 (a) 的微生物宿主细胞在表达所述分离的核酸分子并将所述丁醛转化成 1- 丁醇 的条件下生长 ; 2 c) 并且任选地回收所述 1- 丁醇。
12: 根据权利要求 9、10、或 11 的方法,其中 (a) 的重组微生物宿主细胞选自细菌、 蓝细菌、丝状真菌和酵母。
13: 根据权利要求 12 的方法,其中所述重组微生物宿主细胞为选自下组的属的成员 : 梭菌属、发酵单胞菌属、埃希氏菌属、沙门氏菌属、红球菌属、假单胞菌属、芽孢杆菌 属、乳杆菌属、肠球菌属、产碱杆菌属、克雷伯氏菌属、类芽胞杆菌属、节杆菌属、棒 状杆菌属、短杆菌属、毕赤酵母属、假丝酵母属、汉逊酵母属、克鲁维酵母属和糖酵母 属。

说明书


来自木糖氧化无色杆菌的丁醇脱氢酶

    发明领域 本发明涉及分子生物学和微生物学领域。 更具体地讲,该领域与用于在微生物 中生产丁醇的丁醇脱氢酶相关。
     发明背景
     丁醇是一种重要的工业化学品,其可用作燃料添加剂、塑料工业中的化学原料 以及食品和香料工业中的食品级萃取剂。 每年通过石油化学手段生产 100 至 120 亿磅的 丁醇,并且对该日用化学品的需求可能还会增加。
     可对微生物进行工程化以表达生物合成途径用于丁醇生产。 共有的和共同未决 的美国专利申请公布 US 20070092957A1 公开了对重组微生物进行工程化以用于生产异丁 醇 (2- 甲基 -1- 丙醇 )。 共有的和共同未决的美国专利申请公布 US20080182308A1 公 开了工程化重组微生物用于生产 1- 丁醇。 共有的和共同未决的美国专利申请公布 US 20070259410A1 和 US 20070292927A1 公开了对重组微生物进行工程化以用于生产 2- 丁 醇。 描述了用于异丁醇和 2- 丁醇生产的多个途径。 在用于全部三个产物的所有所述途径 中的最终步骤是通过具有丁醇脱氢酶活性的酶将氧化程度较高的部分还原成醇部分。 已 知的醇脱氢酶能够进行这些转化。
     期望具有丁醇脱氢酶活性的附加酶在具有工程化丁醇生物合成途径的重组宿 主微生物中用于生产丁醇。 申请人通过以下方法已经解决了该问题 :在环境细菌分 离蛋白中发现具有丁醇脱氢酶活性的酶、分离该酶、并且从鉴定的木糖氧化无色杆菌 (Achromobacter xylosoxidans) 分离蛋白中鉴定编码的核酸序列。
     发明概述
     本文所述的是具有丁醇脱氢酶活性的新酶以及编码分离的核酸分子。
     本发明提供分离的核酸分子,所述分离的核酸分子包含编码至少约 250 个氨基 酸的多肽的第一核苷酸序列,所述多肽基于 Smith-Waterman 比对方法在与具有如 SEQ ID NO :2 所示的序列的多肽进行比较时具有至少约 70%的同一性,或者所述分离的核酸分 子包含所述第一核苷酸序列的互补序列的第二核苷酸序列,其中所述酶具有丁醇脱氢酶 活性。
     在另一方面,本发明提供编码丁醇脱氢酶的分离的核酸分子,所述分离的核酸 分子选自 :
     a) 编码如 SEQ ID NO :2 所示的氨基酸序列的分离的核酸分子 ;
     b) 在如下杂交条件下与 (a) 杂交的分离的核酸分子 :0.1X SSC、0.1 % SDS, 65℃以及用 2X SSC、0.1% SDS 洗涤,之后用 0.1X SSC、0.1% SDS 洗涤 ;或
     与 (a) 或 (b) 互补的分离的核酸分子。
     此外本发明提供由所述核酸分子以及包含可操作地连接至少一种调控元件的核 酸分子的嵌合基因编码的多肽,以及包含所述核酸分子的转化的宿主细胞。
     在一个实施方案中,本发明提供了生产 2- 丁醇的方法,所述方法包括 :
     a) 提供包含本发明的分离的核酸分子的重组微生物生产宿主细胞,所述分离的
     核酸分子编码具有丁醇脱氢酶活性的多肽,并且提供 2- 丁酮来源 ;
     b) 使 (a) 的微生物宿主细胞在表达分离的核酸分子并将 2- 丁酮转化成 2- 丁醇的 条件下生长 ;以及
     c) 任选地回收所述 2- 丁醇。
     在另一个实施方案中,本发明提供了生产异丁醇的方法,所述方法包括 :
     a) 提供包含本发明的分离的核酸分子的重组微生物生产宿主细胞,所述分离的 核酸分子编码具有丁醇脱氢酶活性的多肽,并且提供异丁醛来源 ;
     b) 使 (a) 的微生物宿主细胞在表达分离的核酸分子并将异丁醛转化成异丁醇的 条件下生长 ;以及
     c) 任选地回收所述异丁醇。
     在另一个实施方案中,本发明提供了生产 1- 丁醇的方法,所述方法包括 :
     a) 提供包含本发明的分离的核酸分子的重组微生物生产宿主细胞,所述分离的 核酸分子编码具有丁醇脱氢酶活性的多肽,并且提供丁醛来源 ;以及
     b) 使 (a) 的微生物宿主细胞在中表达分离的核酸分子并将丁醛转化成 1- 丁醇的 条件下生长 ;
     c) 并且任选地回收所述 1- 丁醇。
     序列描述
     通过下面的发明详述、附图和随附的序列描述可以更全面地理解本发明,这些 详细描述、附图和序列描述形成了本专利申请的一部分。
     下 面 的 序 列 遵 照 37C.F.R.1.821-1.825( “Requirements for Patent Applications Containing Nucleotide Sequences and/or Amino Acid Sequence Disclosures-the Sequence Rules”( 对含有核酸序列和 / 或氨基酸序列公开的专利申请的要求 - 序列规则 )),并且符 合 World Intellectual Property Organization( 世界知识产权组织,WIPO)ST.25 标准 (1998) 以 及 EPO 和 PCT 的序列清单要求 ( 规则 5.2 和 49.5(a-bis) 以及 Administrative Instructions( 行 政指令 ) 的第 208 节和附录 C)。 用于核苷酸和氨基酸序列数据的符号和格式遵循在 37C. F.R.§1.822 中示出的规则。
     SEQ ID NO :1 是来自木糖氧化无色杆菌的丁醇脱氢酶 (sadB) 的鉴定编码区。
     SEQ ID NO :2 是来自木糖氧化无色杆菌的鉴定的丁醇脱氢酶的蛋白序列。
     SEQ ID NO :3 是木糖氧化无色杆菌丁醇脱氢酶的编码区,其密码子经优化以在 啤酒糖酵母 (Saccharomyces cerevisiae) 中表达。
     SEQ ID NO :4 和 5 是用于菌株 BUTCON-516S rRNA 的 PCR 扩增的引物。
     SEQ ID NO :6 是菌株 BUTCON-5 的 16S rDNA 序列。
     SEQ ID NO :7 是木糖氧化无色杆菌丁醇脱氢酶的 N- 末端肽序列。
     SEQ ID NO :8 是简并引物 N331。
     SEQ ID NO :9-26 是木糖氧化无色杆菌丁醇脱氢酶编码区的测序引物。 SEQ ID NO :27 和 28 是用于 sadB 编码区的 PCR 扩增的引物,该编码区具有用于空隙修复克隆的 延伸部分。
     SEQ ID NO :29 是酵母 GPM 启动子。
     SEQ ID NO :30 是酵母 ADH1 终止子。SEQ ID NO :31 是乳酸乳球菌 (Lactococcus lactis)kivD 编码区。
     SEQ ID NO :32 和 33 是用于确认 pRS425::GPM-sadB 的测序引物。
     SEQ ID NO :34 和 35 是用于增加 NheI 位点的定点诱变引物。
     发明详述
     本文所述的是从细菌的环境分离蛋白中分离得到的新型丁醇脱氢酶,该细菌经 鉴定为木糖氧化无色杆菌。 本发明提供了该蛋白的氨基酸序列和具有至少约 70%的氨 基酸同一性并具有丁醇脱氢酶活性的蛋白。 此外,提供了编码这些蛋白的分离的核酸分 子,它们可用于嵌合基因以在微生物中表达丁醇脱氢酶。 可使用木糖氧化无色杆菌丁醇 脱氢酶和相关序列的酶在重组微生物中从 2- 丁酮中生产 2- 丁醇、从异丁醛中生产异丁 醇、或者从丁醛中生产 1- 丁醇,所述重组微生物具有其中一种这些底物的来源。
     丁醇是一种具有多种应用的重要工业日用化学品,其中其作为燃料或燃料添加 剂的潜力尤为重要。 尽管丁醇仅仅是一种四碳醇,但是其具有与汽油相似的能含量,并 且可以与任何化石燃料共混。 丁醇是优选的燃料或燃料添加剂,因为它在标准内燃机中 燃烧时仅生成 CO2 并且几乎不产生或根本不产生 SOX 或 NOX。 另外,丁醇的腐蚀性不及 乙醇,是目前为止最优选的燃料添加剂。 丁醇除了可用作生物燃料或燃料添加剂之外,在新兴的燃料电池工业中还具有 影响氢分配问题的潜力。 如今,由于氢的运输和分配存在安全隐患,燃料电池饱受困 扰。 可以容易地对丁醇重整其氢含量,并且可以通过现有的加油站以燃料电池或汽车中 的内燃机所需的纯度进行分配。
     以下缩写和定义将用于说明书和权利要求的判读。
     如本文所用,术语 “包含”、“由 ... 组成”、“包括”、“涵盖”、“具有”、 “含有”、 “包容” 或 “容纳” 或其任何其它变型旨在包括非排他的包含物。 例如,包 含一系列元素的组合物、混合物、工艺、方法、制品或设备不必仅限于那些元素,而可 以包括其它未明确列出的元素,或此类组合物、混合物、工艺、方法、制品或设备固有 的元素。 此外,除非有相反的明确说明, “或” 是指包含性的 “或”,而不是指排他性 的 “或”。 例如,以下任何一种情况均满足条件 A 或 B :A 是真的 ( 或存在的 ) 且 B 是 假的 ( 或不存在的 )、A 是假的 ( 或不存在的 ) 且 B 是真的 ( 或存在的 )、以及 A 和 B 都 是真的 ( 或存在的 )。
     同样,涉及元素或组分例证 ( 即出现 ) 次数的位于本发明元素或组分前的不定冠 词 “一个” 或 “一种” 旨在是非限制性的。 因此,应将 “一个” 或 “一种” 理解为包 括一个或至少一个,并且元素或组分的词语单数形式也包括复数形式,除非有数字明显 表示单数。
     如本文所用,术语 “发明” 或 “本发明” 是非限制性的术语,并且不旨在指 本方面的任何单个实施方案,而是涵盖如说明书和权利要求中所述的所有可能的实施方 案。
     如本文所用,修饰本发明使用的成分或反应物的量的术语 “约” 是指可以通过 例如以下方式而发生的用数字表示的量的变化 :在真实世界中用于制备浓缩物或使用溶 液的一般测量和液体处理操作 ;这些操作中非故意的误差 ;用于制备组合物或执行方法 的成分的制造、来源或纯度中的差异 ;等等。 术语 “约” 还包括由于对于起因于特定起
     始混合物的组合物的不同平衡条件而不同的量。 无论是否通过术语 “约” 来修饰,权利 要求包括量的等同量。 在一个实施方案中,术语 “约”指在报告数值的 10%范围内,优 选地在报告数值的 5%范围内。
     如本文所用,术语 “丁醇” 指 1- 丁醇、2- 丁醇、异丁醇、或它们的混合物。
     术语 “丁醇生物合成途径” 指制备 1- 丁醇、2- 丁醇、或异丁醇的酶途径。
     术语 “1- 丁醇生物合成途径” 指从乙酰 - 辅酶 A( 乙酰 -CoA) 中制备 1- 丁醇 的酶途径。
     术语 “2- 丁醇生物合成途径” 指从丙酮酸中制备 2- 丁醇的酶途径。
     术语 “异丁醇生物合成途径” 指从丙酮酸中制备异丁醇的酶途径。
     术语 “兼性厌氧菌” 指既能在有氧环境下生长又能在无氧环境下生长的微生 物。
     术语 “碳底物” 或 “可发酵碳底物” 指能够被本发明的宿主生物体代谢的碳 源,并且特别是选自由下列的碳源 :单糖、低聚糖、多糖和一碳底物或它们的混合物。
     术语 “基因” 指能够被表达为特定蛋白质的核酸片段,其任选包括编码序列前 的调节序列 (5′非编码序列 ) 和编码序列后的调节序列 (3′非编码序列 )。 “天然基因” 是指天然存在的具有其自己的调控序列的基因。 “嵌合基因” 是指不是天然基因的任何 基因,包含在天然情况下不是一起存在的调控序列和编码序列。 因此,嵌合基因可包括 源于不同来源的调控序列和编码序列,或者包括源于同一来源但以不同于天然存在的方 式排列的调控序列和编码序列。 “内源性基因” 指位于生物基因组内它的天然位置的天 然基因。 “外源” 或 “异源” 基因指通常不存在于宿主生物中的基因,它通过基因转 移导入宿主生物。 外来基因可以包含插入到非天然生物体内的天然基因,或嵌合基因。 “转基因” 是已通过转化方法导入基因组内的基因。 如本文所用的, “分离的核酸片段” 或 “分离的核酸分子” 将可互换使用,并 且将指单链或双链的,任选含有合成的、非天然的或改变了的核苷酸碱基的 RNA 或 DNA 聚合物。 DNA 聚合物形式的分离的核酸片段可由 cDNA、基因组 DNA 或合成 DNA 的一 个或多个片段构成。
     当在合适的温度和溶液离子强度条件下单链形式的核酸片段可以退火至另一核 酸片段时,核酸片段 “可杂交” 至另一核酸片段,例如 cDNA、基因组 DNA 或 RNA 分 子。 杂交条件和洗涤条件是众所周知的,并在 Sambrook,J.,Fritsch,E.F. 和 Maniatis, T.Molecular Cloning :A Laboratory Manual,第 2 版,Cold Spring Harbor Laboratory :Cold Spring Harbor, NY(1989) 中有举例说明,尤其是其中的第 11 章和表 11.1( 将其全部内容 以引用的方式并入本文 )。 温度和离子强度条件确定了杂交的 “严格性”。 可以调节严 格性条件以筛选中度相似的片段 ( 例如来自远缘生物的同源序列 ),到筛选高度相似的片 段 ( 例如从近缘生物复制功能性酶的基因 )。 杂交后的洗涤确定严格性条件。 一组优选 的条件采用一系列如下洗涤 :开始采用 6X SSC、0.5% SDS 在室温下持续洗涤 15 分钟, 然后再使用 2X SSC、0.5% SDS 在 45℃下洗涤 30 分钟,最后使用 0.2X SSC、0.5% SDS 在 50℃下重复洗涤 30 分钟两次。 更优选的一组严格性条件采用更高的温度,其中洗涤与 上述洗涤相同,不同的是最后两次在 0.2X SSC、0.5% SDS 中洗涤 30 分钟时的温度被增 加到 60℃。 另一组优选的高严格性条件是最后两次洗涤是在 65℃下用 0.1X SSC、0.1%
     SDS 进行。 例如,另一组严格性条件包括在 0.1X SSC、0.1% SDS 中于 65℃下杂交,并 用 2X SSC、0.1% SDS 洗涤,随后用 0.1X SSC、0.1% SDS 洗涤。
     杂交需要两种核酸含有互补序列,但是取决于杂交的严格性,碱基之间可能会 发生错配。 用于使核酸杂交的合适严格性取决于核酸的长度和互补的程度,所述长度 和互补程度是本领域内所熟知的变量。 两条核苷酸序列之间的相似性或同源性程度越 高,具有那些序列的核酸的杂交体的 Tm 值就越大。 核酸杂交的相对稳定性 ( 对应较高 的 Tm) 按以下顺序依次降低 :RNA:RNA、 DNA:RNA、 DNA:DNA。 对于长度超过 100 个核苷酸的杂交体,已经推导出了用于计算 Tm 的公式 ( 请参见 Sambrook 等人,同上, 9.50-9.51)。 对于较短核酸 ( 即寡核苷酸 ) 的杂交,错配的位置变得更重要,而且寡核 苷酸的长度决定了其特异性 ( 参见 Sambrook 等人,同上, 11.7-11.8)。 在一个实施方案 中,可杂交核酸的长度为至少约 10 个核苷酸。 优选地,可杂交核酸的最小长度为至少约 15 个核苷酸 ;更优选至少约 20 个核苷酸 ;并且最优选地,长度为至少约 30 个核苷酸。 此外,技术人员将认识到,可根据需要根据诸如探针长度之类的因素来调节温度和洗涤 溶液盐浓度。
     术语 “互补的” 用于描述核苷酸碱基之间能够彼此杂交的关系。 例如,对于 DNA,腺嘌呤与胸腺嘧啶互补,而胞嘧啶与鸟嘌呤互补。 如本领域所熟知的,术语 “百分比同一性” 是两条或更多条多肽序列之间或两 条或更多条多核苷酸序列之间的关系,该关系通过对序列进行比较确定。 在本领域中, “同一性” 还表示多肽或多核苷酸序列之间序列关联的程度,根据具体情况,它由这些 序列的序列串之间的匹配程度确定。 “同一性” 和 “相似性” 可容易地通过已知方法计 算出来,所述的方法包括但不限于以下文献中所描述的那些 :1.)Computational Molecular Biology(Lesk, A.M. 编辑 )Oxford University :NY(1988) ;2.)Biocomputing :Informatics and Genome Projects(Smith, D.W. 编 辑 )Academic :NY(1993) ;3.)Computer Analysis of Sequence Data, Part I(Griffin, A.M. 和 Griffin, H.G. 编辑 )Humania :NJ(1994) ;4.) Sequence Analysis in Molecular Biology(von Heinje, G. 编 辑 )Academic(1987) ; 和 5.) Sequence Analysis Primer(Gribskov, M. 和 Devereux, J. 编辑 )Stockton :NY(1991)。
     设定确定同一性的优选方法来用于给出待测试序列之间的最佳匹配。 确定同 一性和相似性的方法在可公开获得的计算机程序中编成了代码。 序列比对和同一性 百分比计算可以用 LASERGENE 生物信息学计算软件包 (LASERGENE bioinformatics computing suite(DNASTAR Inc., Madison, WI)) 中 的 MegAlignTM 程 序 进 行。 序 列的多重比对采用包括几种改变形式的算法在内的 “Clustal 比对方法” 进行,包括 “Clustal V 比对方法”,该方法相当于称为 Clustal V( 在 Higgins 和 Sharp, CABIOS.5 : 151-153(1989) ;Higgins, D.G. 等人, Comput.Appl.Biosci.,8 :189-191(1992)),并且 可以在 LASERGENE 生物信息学计算软件包 (DNASTAR Inc.) 中的 MegAlignTM 程序中 找到的比对方法。 对于多重比对,默认值对应于缺口罚分 (GAP PENALTY) = 10 和缺 口长度罚分 (GAP LENGTH PENALTY) = 10。 用 Clustal 方法进行成对比对和蛋白质 序列的百分比同一性计算的默认参数为 KTUPLE = 1、缺口罚分= 3、窗口 (WINDOW) = 5 和 DIAGONALS SAVED = 5。 对于核酸,这些参数为 KTUPLE = 2,缺口罚分= 5,窗口= 4 和 DIAGONALS SAVED = 4。 在用 Clustal V 程序进行序列比对后,有可能
     通过观察相同程序中的 “序列距离” 表来获得 “百分比同一性”。 此外,也可以使用 “Clustal W 比对方法”,该方法相当于称为 Clustal W( 在 Higgins 和 Sharp,CABIOS.5 : 151-153(1989) ;Higgins, D.G. 等人, Comput.Appl.Biosci.8 :189-191(1992) 中有所描 述 ) 和可以在 LASERGENE 生物信息学计算软件包 (DNASTAR Inc.) 中的 MegAlignTM v6.1 程序中找到的比对方法。 用于多重比对的默认参数 ( 缺口罚分= 10、缺口长度罚分 = 0.2、延迟发散序列 (Delay Divergen Seqs)(% ) = 30、 DNA 转换权重 (DNA Transition Weight) = 0.5、蛋白质权重矩阵 (Protein Weight Matrix) = Gonnet 系列和 DNA 权重矩阵 (DNAWeight Matrix) = IUB)。 在使用 Clustal W 程序对序列进行比对之后,可通过查看 同一程序中的 “序列距离” 表来获得 “百分比同一性”。
     本领域的技术人员非常清楚,多种程度的序列同一性可用于从其他物种中鉴定 多肽,其中这类多肽具有相同或相似的功能或活性。 可用的同一性百分比的实例包括但 不限于 :70%、75%、80%、85%、90%、或 95%、或者从 70%至 100%的任何整数百 分比都可用于描述本发明,例如 70%、71%、72%、73%、74%、75%、76%、77%、 78 %、79 %、80 %、81 %、82 %、83 %、84 %、85 %、86 %、87 %、88 %、89 %、 90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%。 合适的核酸片段编 码具有以上同一性并且通常编码具有至少约 250 个氨基酸,优选至少 300 个氨基酸,并且 最优选至少约 348 个氨基酸的多肽。
     术语 “序列分析软件” 指可用于分析核苷酸或氨基酸序列的任何计算机算法 或软件程序。 “序列分析软件” 可商购获得或独立开发。 典型的序列分析软件包括但 不 限 于 :1.)GCG 程 序 包 (Wisconsin Package 9.0 版, Genetics Computer Group(GCG), Madison , WI ) ;2 . ) BLASTP 、 BLASTN 、 BLASTX ( Altschul 等 人, J.Biol. , 215 :403-410(1990)) ;3.)DNASTAR(DNASTAR 有 限 公 司, Madison, WI) ;4.) Sequencher(Gene Codes Corporation, Ann Arbor, MI) ;和 5.) 整合了 Smith-Waterman 算 法的 FASTA 程序 (W.R.Pearson,Comput.Methods Genome Res.,[Proc.Int.Symp.](1994), 公开时间 :1992,111-20. 编辑 :Suhai, Sandor.Plenum :New York, NY)。 在本专利申 请的上下文中应当理解,使用序列分析软件进行分析时,除非另外指明,否则分析结果 将基于所参考程序的 “默认值”。 在此所用的 “默认值” 将指在首次初始化软件时软件 最初加载的任何值或参数集。
     氨基酸或核苷酸序列的 “基本部分” 指这样的部分,该部分包括的多肽的氨 基酸序列或基因的核苷酸序列足以推定鉴定所述多肽或基因,所述鉴定或者可以由本领 域技术人员通过人工评价序列来完成,或者可以利用诸如 BLAST(Altschul, S.F. 等人, J.Mol.Bio.,215 :403-410(1993)) 之类的算法通过计算机自动化序列比较和鉴定来完 成。 一般来讲,为了推测鉴定多肽或核酸序列是否与已知的蛋白质或基因同源,需要有 10 个或更多邻接氨基酸或者 30 个或更多核苷酸的序列。 此外,对于核苷酸序列,包含 20-30 个邻接核苷酸的基因特异性寡核苷酸探针可用于序列依赖性的基因鉴定 ( 如 DNA 杂交 ) 和基因分离 ( 如细菌菌落或噬斑的原位杂交 ) 的方法中。 此外,12-15 个碱基的短 寡核苷酸可在 PCR 中用作扩增引物,以便获得包含该引物的特定核酸片段。 因此,核苷 酸序列的 “基本部分” 所包含的序列应足以特异性地鉴定和 / 或分离包含该序列的核酸 片段。 本说明书教导了编码特定醇脱氢酶蛋白的完整的氨基酸和核苷酸序列。 利用本文所公开的序列,技术人员现在可以利用本发明所公开序列的全部或基本部分,以用于本 领域技术人员已知的目的。 因此,本发明包括如随附的序列表中所示的完整序列,以及 如上文定义的这些序列的基本部分。
     本发明涵盖的不仅仅是具体的示例性序列,因为本领域熟知的是 :不影响编码 蛋白的功能特性的氨基酸序列或编码区中的改变 ( 其中一个化学上等同的氨基酸在给定 位点上被取代 ) 是常见的。 为了本发明的目的,取代定义为在下述 5 组之一内的交换 :
     1. 小的脂族非极性残基或微极性的残基 :Ala、 Ser、 Thr(Pro、 Gly) ;
     2. 极性的、带负电荷的残基和它们的酰胺 :Asp、 Asn、 Glu、 Gln ;
     3. 极性的、带正电荷的残基 :His、 Arg、 Lys ;
     4. 大的脂族非极性残基 :Met、 Leu、 Ile、 Val(Cys) ;以及
     5. 大的芳族残基 :Phe、 Tyr、 Trp。
     因此,关于氨基酸丙氨酸 - 一种疏水性氨基酸的密码子可以被编码另一个疏水 性更弱的残基 ( 例如甘氨酸 ) 或疏水性更强的残基 ( 例如缬氨酸、亮氨酸或异亮氨酸 ) 取 代。 类似地,导致用一个带负电荷的残基替换另一个带负电荷的残基 ( 例如天冬氨酸替 代谷氨酸 ) 或者一个带正电荷的残基替换另一个带正电荷的残基 ( 例如赖氨酸替换精氨 酸 ) 的改变也可以预期产生功能上等价的产物。 在许多情况下,导致蛋白质分子的 N- 末 端和 C- 末端部分改变的核苷酸变化也预期不改变蛋白质的活性。 因此本发明涵盖具有所 述密码子变异的编码区和具有所述氨基酸变异的蛋白。 如本文所用,术语 “编码序列” 或 “CDS” 是指编码特定氨基酸序列的 DNA 序列。 “合适的调控序列” 指位于编码序列的上游 (5′非编码序列 )、中间或下游 (3′ 非编码序列 ) 的核苷酸序列,其可影响转录、 RNA 加工或稳定性,或者相关编码序列的 翻译。 调节序列可包括启动子、翻译前导序列、内含子、多腺苷酸化识别序列、RNA 加 工位点、效应子结合位点和茎环结构。
     术语 “启动子”指能够控制编码序列或功能性 RNA 表达的 DNA 序列。 一般来 讲,编码序列位于启动子序列的 3′端。启动子可整个源于天然基因,或者由源于不同的 天然存在的启动子的不同元件组成,或者甚至包含合成的 DNA 片段。 本领域内的技术人 员应当理解,不同的启动子可以在不同的组织或细胞类型中,或者在不同的发育阶段, 或者响应不同的环境条件或生理条件而引导基因的表达。 导致基因在大部分时间内在大 多数细胞类型中表达的启动子通常称为 “组成型启动子”。 还应当进一步认识到,由于 在大多数情况下调节序列的确切边界尚未完全确定,因此不同长度的 DNA 片段可能具有 相同的启动子活性。
     术语 “可操作地连接” 指单个核酸片段上的核酸序列的关联,使得其中一个核 酸序列的功能受到另一个核酸序列的影响。 例如,当启动子能够影响编码序列的表达 ( 即,该编码序列受到该启动子的转录控制 ) 时,则该启动子与该编码序列可操作地连 接。 编码序列可以以有义或反义的取向可操作地连接至调节序列。
     如本文所用,术语 “表达” 指源于本发明核酸片段的有义 RNA(mRNA) 或反义 RNA 的转录和稳定积聚。 表达也可指将 mRNA 翻译成多肽。
     如本文所用,术语 “转化” 指将核酸片段转移至宿主生物体内,导致在基因上 稳定遗传。 含有转化核酸片段的宿主生物被称为 “转基因” 或 “重组” 或 “转化” 生
     物体。 术语 “质粒” 和 “载体” 指通常携带有不属于细胞中心代谢的部分的基因的染 色体外元件,并且常常是环状双链 DNA 片段的形式。 这类元件可为源自任何来源的自主 复制序列、基因组整合序列、噬菌体或单链或双链 DNA 或 RNA 的核苷酸序列 ( 线性或 环状 ),其中多个核苷酸序列已连接或重组进入一种独特构建体中,该独特构建体能够将 所选基因产物的启动子片段和 DNA 序列与相应的 3′末端非翻译序列一起引入细胞中。 “转化载体” 指含有外来基因并且除了该外来基因外还含有有利于转化特定宿主细胞转 化的元件的特定载体。
     如本文所用,术语 “密码子简并性” 指允许核苷酸序列在不影响所编码的多肽 的氨基酸序列的情况下发生变化的遗传密码的性质。 技术人员非常了解具体宿主细胞在 使用核苷酸密码子确定给定氨基酸时所表现出的 “密码子偏好性”。 因此,当合成基因 用以改善在宿主细胞中的表达时,希望对基因进行设计,使得其密码子使用频率接近该 宿主细胞优选的密码子使用频率。
     术语 “经密码子优化的” 在其涉及用于转化不同宿主的核酸分子的基因或编码 区时是指在不改变由 DNA 编码的多肽的情况下,改变核酸分子的基因或编码区中的密码 子以反映宿主生物体通常的密码子使用。
     本文使用的标准重组 DNA 和分子克隆技术是本领域熟知的并且已经在如下文 献 中 有 所 描 述 :Sambrook, J., Fritsch, E.F. 和 Maniatis, T. 的 Molecular Cloning :A Laboratory Manual,第二版, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY(1989)( 下 文 称 为 “Maniatis” ) ;以 及 Silhavy, T.J., Bennan, M.L. 和 Enquist, L.W., Experiments with Gene Fusions, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY(1984) ;以及 Ausubel, F.M. 等人, Current Protocols in Molecular Biology, Greene Publishing Assoc.and Wiley-Interscience (1987)。该处使用的附加方法是在 Methods in Enzymology,第 194 卷,Guide to Yeast Genetics and Molecular and Cell Biology(Part A, 2004, Christine Guthrie 和 Gerald R.Fink( 编辑 ), Elsevier Academic Press, San Diego, CA) 中的方法。
     木糖氧化无色杆菌的丁醇脱氢酶活性
     通过在包含 1- 丁醇的培养基上的连续培养富集环境污泥样本,申请人能分离能 够利用 1- 丁醇作唯一碳源的微生物。 一种分离蛋白通过其 16S rRNA 序列鉴定为属于菌 种木糖氧化无色杆菌。 申请人发现该分离蛋白有丁醇脱氢酶活性,它可相互转化丁醛和 1- 丁醇。申请人也发现该丁醇脱氢酶活性也催化异丁醛和异丁醇、以及 2- 丁酮和 2- 丁醇 的相互转化。 令人惊讶地是,该酶对替代底物的动力学常数与对用于富集培养基的 1- 丁 醇底物的动力学常数相当或比其更高。 这些结果指示可使用该木糖氧化无色杆菌丁醇脱 氢酶在分别具有丁醛、异丁醛或 2- 丁酮底物来源的重组微生物宿主细胞中生产 1- 丁醇、 异丁醇、或 2- 丁醇。
     丁醇脱氢酶蛋白和编码序列
     在木糖氧化无色杆菌中鉴定的核苷酸序列编码具有丁醇脱氢酶活性 ( 称为 sadB) 的酶,该序列如 SEQ ID NO :1 所示。 全长蛋白的氨基酸序列如 SEQ ID NO :2 所示。 该氨基酸序列与公开数据库中的序列的比较结果揭示该蛋白具有与已知醇脱氢酶的令人
     惊讶的低相似性。 使用具有计分矩阵 BLOSUM62 的 BLAST,期望临界值 (cutoff) 为 10 并且定序列长度 (word size) 为 3,测得最相似的已知序列与 SEQ ID NO :2 在其长度 为 348 个氨基酸的部分上具有 67%的同一性。 使用的空位开放罚分为 11,空位延伸为 1。 发现与脑膜炎奈瑟氏球菌 (Neisseria meningitidis)MC58(Accession#AAF41759.1) 含锌 醇脱氢酶的最高相似度为 67 %的氨基酸同一性,与无乳支原体 (Mycoplasma agalactiae) (Accession#A5IY63) 含锌醇脱氢酶的最高相似度为 67%的氨基酸同一性。 其氨基酸序列 与木糖氧化无色杆菌丁醇脱氢酶的序列 (SEQ ID NO :2) 具有大于 67%的同一性的蛋白 是本发明的蛋白,它在本文中被鉴定并分离。 本发明蛋白的氨基酸序列与 SEQ ID NO : 2 具有至少约 70% -75%,约 75% -80%,约 80% -85%,或者约 85% -90%的同一性, 其中更优选约 90% -95%的同一性。 最优选的氨基酸序列与 SEQ ID NO :2 具有至少约 95%的同一性。
     使用 BLAST 默认参数与公开序列进行比较时,编码木糖氧化无色杆菌丁醇 脱 氢 酶 的 核 酸 序 列 (SEQ ID NO :1) 与 编 码 脑 膜 炎 奈 瑟 氏 球 菌 MC58 含 锌 醇 脱 氢 酶 (Accession#NC003112) 的序列具有最高的同一性 ( 约 65% )。 本发明的核酸分子是那些 能够编码至少约 250 个氨基酸并且具有丁醇脱氢酶活性的多肽,它具有与 SEQ ID NO : 2 至少约 70%的同一性。 核酸分子可编码至少约 300 个氨基酸或者约 348 个氨基酸的多 肽。核酸分子可编码与 SEQ ID NO :2 具有至少约 75% -80%、80% -85%、85% -90%、 90% -95%、或 95% -100%的同一性的多肽。 本发明的附加核酸分子可通过与编码丁醇脱氢酶的 SEQ ID NO :2 的核酸分子 在以下条件下杂交进行鉴定 :0.1X SSC,0.1% SDS,65℃并且用 2X SSC,0.1% SDS 洗 涤,随后用 0.1X SSC,0.1% SDS 洗涤。 在本发明的方面中附加地包括与任何上述核酸分 子互补的核酸分子。 最合适的是编码 SEQ ID NO :2 的多肽的核酸分子,其实例是 SEQ ID NO :1 和 3。 由于遗传密码的简并性,多个核酸序列可编码 SEQ ID NO :2 的多肽, 这是本领域的技术人员熟知的。 例如编码序列可经密码子优化用于在特定宿主中的最大 化表达,如序列经密码子经优化以在啤酒糖酵母中表达,即 SEQ ID NO :3。
     同源物的分离
     编码木糖氧化无色杆菌丁醇脱氢酶的核酸分子,例如 SEQ ID NO :1 可用于分离 编码同源蛋白的核酸分子,所述核酸分子与来自相同或其他微生物菌种的这种核酸片段 具有至少 70% -75%、75% -80%、80% -85%、85% -90%、90% -95%、或 95% -100% 的序列同一性。 可如下评估编码的同源蛋白的丁醇脱氢酶活性。 使用序列依赖性规程分 离同源物是本领域熟知的。 序列依赖型规程的实例包括但不限于核酸杂交方法、DNA 和 RNA 扩增方法例如核酸扩增技术的多种应用 ( 例如聚合酶链反应 (PCR), Mullis 等人, 美国专利公开 4,683,202 ;连接酶链反应 (LCR),Tabor,S. 等人,Proc.Natl.Acad.Sci.USA 82,1074, (1985 ;或链置换扩增反应 (SDA), Walker 等人, Proc.Natl.Acad.Sci.U.S.A., 89 :392, (1992))。
     例如,本发明的核酸片段可通过使用所有或部分 SEQ ID NO :1 的核酸片段作 为 DNA 杂交探针,使用本领域的技术人员熟知的方法来筛选来自任何所需细菌的文库而 得以直接分离。 基于 SEQ ID NO :1 的特异性,寡核苷酸探针可通过本领域已知的方法 (Maniatis,同上 ) 设计和合成。 此外序列可直接用于通过熟练技术人员已知的方法,例
     如随机引物 DNA 标记、切口平移或末端标记技术,来合成 DNA 探针,或使用可获得的 体外转录体系来合成 RNA 探针。 此外,能设计特异性引物并用于扩增 SEQ ID NO :1 同源物的部分或全长。 所得的扩增产物可在扩增反应过程中直接标记或在扩增反应后标 记,并用作探针以在合适的严格条件下分离全长的 DNA 片段。
     通常在 PCR 类型的扩增技术中,引物具有不同的序列而且彼此之间不互补。 取决于期望的检测条件,应当设计引物序列以提供既有效又可靠的靶核酸的复制。 PCR 引物设计方法是常见的,并且是本领域熟知的。 (Thein 和 Wallace, “The use of oligonucleotide as specific hybridization probes in the Diagnosis of Genetic Disorders”, Human Genetic Diseases :APractical Approach, K.E.Davis 编辑 (1986) 第 33-50 页, IRL Press, Herndon, Virginia) ;Rychlik, W.(1993), White, B.A.( 编 辑 ), Methods in Molecular Biology,第 15 卷第 31-39 页,PCR Protocols :Current Methods and Applications. Humania Press, Inc., Totowa, NJ。 )
     通常可使用本发明核酸序列的两个短片段设计引物用于聚合酶链反应规程以扩 增较长的核酸片段,该核酸片段编码来自 DNA 或 RNA 的同源编码区。可使用包含与 SEQ ID NO :1 同源的核酸序列的任何 DNA 作模板进行 PCR,包括例如用基因组 DNA、cDNA 或质粒 DNA 作模板。 当使用克隆 cDNA 的文库时,一个引物的序列来源于 SEQ ID NO : 1,并且其他引物的序列利用在编码微生物基因的 mRNA 前体的 3′末端存在的多腺苷酸 片。 作为另一种选择,第二个引物序列可以基于来源于克隆载体的序列。 例如技术人员 可按照 RACE 规程,使用 mRNA 作模板 (Frohman 等人, Proc.Natl.Acad.Sci.USA,85 : 8998(1988)),通过用 PCR 扩增在转录物内单个位点与 3′或 5′端之间的区域的拷贝来 产生 cDNA。 以 3′和 5′方向取向的引物可用本发明的核酸序列设计。 使用可商购获 得的 3′ RACE 或 5′ RACE 体系 (Life Technologies,Rockville,MD),可以分离特异性 的 3′或 5′ cDNA 片段 (Ohara 等人, Proc.Natl.Acad.Sci.USA 86 :5673(1989) ;Loh 等 人, Science 243 :217(1989))。
     作为另外一种选择,可使用 SEQ ID NO :1 的核酸分子或其互补序列作为杂交试 剂用于同源物的鉴定。 核酸杂交试验的基本组成包括探针、怀疑含有目的基因或基因片 段的样本及特定的杂交方法。 本发明的探针通常是与待检测的核酸序列互补的单链核酸 序列。 探针与待检测的核酸序列是 “可杂交的”。 探针长度可从 5 个碱基至数万个碱基 不等,这将取决于具体待完成的测试。 通常约 15 个碱基至约 30 个碱基的探针长度是合 适的。 只需要探针分子的部分与待检测的核酸序列互补。 另外,探针和靶序列之间不需 要完全互补。 杂交确实可以在并不完全互补的分子之间发生,结果是杂交区内的一定比 率的碱基未与适当的互补碱基配对。
     杂交方法是有严格规定的。 通常探针和样本必须在允许核酸杂交的条件下混 合。 这涉及在适当浓度和温度条件下在存在无机或有机盐时使探针和样品接触。 探针和 样品核酸必须接触足够长的时间,使探针和样品核酸之间的任何可能的杂交均可发生。 混合物中的探针或标记的浓度将决定杂交发生所需的时间。 探针或靶标的浓度越高,所 需的杂交孵育时间就越短。 任选地,可以加入离液剂。 离液剂通过抑制核酸酶活性来 稳定核酸。 此外,离液剂允许短寡核苷酸探针在室温下的敏感和严格杂交 (Van Ness 和 Chen, Nucl.Acids Res.19 :5143-5151(1991))。 合适的离液剂包括氯化胍、硫氰酸胍、硫氰酸钠、四氯乙酸锂、高氯酸钠、四氯乙酸铷、碘化钾和三氟乙酸铯等。 通常,离液 剂的终浓度将为约 3M。 如果需要,可以将甲酰胺加入到杂交混合物中,通常为 30-50% (v/v)。
     可以采用多种杂交溶液。 通常,这些杂交溶液包含约 20 %至 60 %体积,优 选 30 %体积的极性有机溶剂。 通常的杂交溶液采用约 30-50 % v/v 甲酰胺、约 0.15 至 1M 氯化钠、约 0.05 至 0.1M 缓冲液 ( 如柠檬酸钠、 Tris-HCl、 PIPES 或 HEPES(pH 范 围 约 6-9))、 约 0.05 至 0.2 % 的 去 污 剂 ( 如 十 二 烷 基 硫 酸 钠 ) 或 0.5-20mM 的 EDTA、 FICOLL(Pharmacia Inc.)( 约 300-500 千 道 尔 顿 (kD))、 聚 乙 烯 吡 咯 烷 酮 ( 约 250-500kD)、和血清白蛋白。 一般的杂交溶液还将包含约 0.1 至 5mg/mL 未经标记的载 体核酸、片段化的核酸 DNA( 如小牛胸腺或鲑精 DNA 或酵母 RNA),以及任选约 0.5%至 2%重量 / 体积的甘氨酸。 还可以包含其他添加剂,例如包括多种极性水溶性或可膨胀试 剂如聚乙二醇、阴离子聚合物如聚丙烯酸酯或聚甲基丙烯酸酯和阴离子糖类聚合物如硫 酸葡聚糖在内的体积排阻剂。
     核酸杂交可适用于多种测定形式。 最合适的形式之一是夹心测定形式。 夹心测 定尤其适用于在非变性条件下杂交。 夹心型测定的主要成分是固体支持体。 固体支持 体具有吸附或共价连接至其上的固定核酸探针,该探针未经标记并且与序列的一部分互 补。
     此外,因为微生物基因组序列迅速变成公开可获得的,可单独使用生物信息学 方法鉴定同源物,这是本领域技术人员熟知的。
     丁醇脱氢酶活性
     本发明的蛋白与 SEQ ID NO :2 具有至少约 70%或更高的氨基酸同一性,并且 具有丁醇脱氢酶活性。 本发明的核酸分子编码与 SEQ ID NO :2 具有至少约 70%或更高 的氨基酸同一性并具有丁醇脱氢酶活性的蛋白。 本领域的技术人员能够容易地评估蛋白 中的丁醇脱氢酶活性。 如下所述在微生物细胞中表达蛋白,并且测定细胞提取物、粗制 酶制剂、或者纯化酶制剂中的丁醇脱氢酶活性。 例如如本文实施例 1 所述测定纯化酶和 粗制酶制剂。 1- 丁醇脱氢酶活性的检测分析法用分光光度计在 340nm 监控 NADH 氧化成 NAD+ 的情况,该检测法在 35℃下,使用在包含 50mM 丁醛和 0.2mM NADH 的 50mM 磷 酸钾缓冲液中 (pH6.2) 的合适量的酶。 具有醇底物的替代检测分析法在 35℃下,在 pH8.5 的包含 3mM NAD+ 和不同浓度醇的 TRIS 缓冲液中进行,或者具有酮或醛底物的检测分析 法在 35℃下,在 pH6.0 的包含 200μm NADH 和不同浓度的酮或醛的 50mM MES 缓冲液 中进行。 通过这些或其他可容易地执行的检测分析法,将丁醇脱氢酶功能与由分离的核 酸分子编码的鉴定蛋白的结构相关联,两种均具有经鉴定的序列。
     重组表达
     本发明的核酸片段可在微生物宿主细胞中表达,如在细菌、蓝细菌、丝状真菌 和酵母中表达,导致表达编码的丁醇脱氢酶。 宿主菌株的实例包括但不限于梭菌属、 发酵单胞菌属、埃希氏菌属、沙门氏菌属、红球菌属、假单胞菌属、芽孢杆菌属、乳酸 杆菌属、肠球菌属、片球菌属、产碱杆菌属、克雷白氏杆菌属、类芽胞杆菌属、节杆菌 属、棒状杆菌属、短杆菌属、假丝酵母属、汉逊酵母属、克鲁维酵母属和糖酵母属。
     含有引导外来蛋白质高水平表达的调控序列的微生物表达系统和表达载体是本领域技术人员熟知的。 可使用任何这些系统和载体来构建嵌合基因,用于生产本发明的 核酸分子编码的蛋白。 然后可以将这些嵌合基因通过转化导入合适的微生物中以提供酶 的高水平表达。
     可用于转化多种宿主细胞的载体是常见的并且可以从一些公司商购获得,例如 (Madison,WI)、Invitrogen Corp.(Carlsbad,CA)、Stratagene(LaJolla, CA) 和 New England Biolabs,Inc.(Beverly,MA)。 使用大肠杆菌 - 酵母穿梭载体克隆嵌 合基因用于酵母表达。 通常载体含有选择标记和允许在期望宿主中自主复制或染色体整 合的序列。 此外,合适的载体可包含启动子区域,该区域包含转录启动控制和转录终止 控制区,在它们之间可插入编码区 DNA 片段以提供插入编码区的表达。 这两种控制区均 可来源于与转化的宿主细胞同源的基因,但是应当理解,这种控制区也可能来源于对被 选择作生产宿主的特定物种来说是非天然的基因。
     可用于驱动本发明丁醇脱氢酶编码区在所需宿主细胞中表达的起始控制区或启 动子有很多,并且是本领域技术人员熟悉的。 合适的启动子包括但不限于来源于以下基 因的启动子 :CYC1、HIS3、GAL1、GAL10、ADH1、PGK、PHO5、GAPDH、ADC1、 TRP1、 URA3、 LEU2、 ENO、 TPI、 CUP1、 FBA、 GPD、和 GPM( 用于在糖酵母属中表 达 ) ;AOX1( 可用于在毕赤酵母菌属中的表达 ) ;以及 lac、 ara、 tet、 trp、 lPL、 lPR、 T7、tac、和 trc 启动子 ( 用于在大肠杆菌、产碱杆菌、和假单胞菌中表达 ) ;amy、apr、 和 npr 启动子、以及用于在枯草芽孢杆菌、地衣芽孢杆菌、和浸麻类芽孢杆菌中表达的多 种噬菌体启动子 ;nisA( 用于在革兰氏阳性细菌中表达,Eichenbaum 等人,Appl.Environ. Microbiol.64(8) :2763-2769(1998)) ;和 合 成 P11 启 动 子 ( 用 于 在 植 物 乳 杆 菌 中 表 达 (Rud 等人, Microbiology 152 :1011-1019(2006))。 终止控制区也可以源于对优选宿主 天然的多种基因。 任选地,终止位点可为非必需的 ;然而,如果包括则是最优选的。
     某些载体能够在广泛的宿主细菌中复制并可通过接合进行转移。 pRK404 和三 个相关载体 :pRK437、 pRK442、和 pRK442(H) 的完全注解序列是可用的。 这些衍生 物已被证明是在革兰氏阴性菌中进行遗传操纵的有用工具 (Scott 等人, Plasmid 50(1) : 74-79(2003))。 也可获得广宿主范围的 Inc P4 质粒 RSF1010 的几种衍生质粒,其具有在 一系列革兰氏阴性菌中发挥功能的启动子。 质粒 pAYC36 和 pAYC37 具有连同多个克隆 位点一起的活性启动子,使得在革兰氏阴性菌中的异源基因能够表达。
     适 于 革 兰 氏 阳 性 细 菌 的 载 体 的 一 些 实 例 包 括 pAM β1 及 其 衍 生 物 (Renault 等 人, Gene 183 :175-182(1996) ; 和 O’ Sullivan 等 人, Gene137 : 227-231(1993)) ;pMBB1 和 pHW800, pMBB1 的 衍 生 物 (Wyckoff 等 人, Appl. Environ.Microbiol.62 :1481-1486(1996)) ;pMG1, 接 合 质 粒 (Tanimoto 等 人, J.Bacteriol. 184 :5800-5804(2002)) ;pNZ 9520( Kleerebezem 等 人, Appl.Environ. Microbiol.63 :4581-4584(1997)) ;pAM401(Fujimoto 等人, Appl.Environ.Microbiol.67 : 1262-1267(2001)) ; 和 pAT392(Arthur 等 人, Antimicrob.AgentsChemother.38 : 1899-1903(1994))。 也已经报道了几种来源于植物乳杆菌的质粒 (van Kranenburg 等人, Appl.Environ.Microbiol.71(3) :1223-1230(2005))。
     用于酵母中基因表达的方法是本领域已知的 ( 参见例如 Enzymology, Volume 194, Guide to Yeast Genetics and Molecular and Cell Biology, PartA,2004, ChristineGuthrie 和 Gerald R.Fink( 编辑 ), Elsevier Academic Press, San Diego, CA 中的方法 )。 酵母中通常使用的质粒是穿梭载体 pRS423、 pRS424、 pRS425、和 pRS426( 美国典型培 养物保藏中心, Rockville, MD),它们包含大肠杆菌复制起点 ( 例如 pMB1)、酵母 2μ 复制起点、和营养选择标记。 这四个载体的选择标记是 His3( 载体 pRS423)、Trp1( 载体 pRS424)、 Leu2( 载体 pRS425) 和 Ura3( 载体 pRS426)。 用编码本发明丁醇脱氢酶的嵌 合基因构建表达载体可通过在大肠杆菌中的标准分子克隆技术或通过在酵母中的空隙修 复重组方法进行。 这些载体可以在大肠杆菌和酵母菌株中繁殖。
     本发明的嵌合基因可从稳定复制的质粒中表达,或者可被整合进宿主基因组 中。 用于 DNA 整合的质粒可包括转座子、与在宿主基因组中的整合靶位点同源的核酸序 列区域、或者参与整合的其他序列。 可使用例如可从 商购获得的体系转 座制备其他类型的载体。 如何选择适用于期望靶宿主和期望功能的合适载体是熟知的。 此外,可将编码本发明的丁醇脱氢酶的核酸分子以可操作地连接的方式邻近整合进宿主 基因组中的内源启动子。
     丁醇微生物生产宿主
     表达本发明的分离的核酸分子提供靶向转化的重组微生物宿主细胞,它具有丁 醇脱氢酶活性,以此在存在丁醛、异丁醛、或 2- 丁酮的情况下制备丁醇。 这些底物中 的每一种可在宿主细胞中被天然制备,或者作为宿主细胞中的工程化生物合成途径的 产物而被制备。 可在微生物中进行工程化以生产异丁醇、2- 丁醇、或 1- 丁醇的生物 合 成 途 径 在美 国专 利申请公布 20070092957A1、20070259410A1、20070292927A1、 和 US20080182308A1 中进行了描述,它们全文以引用方式并入本文。 当忽略每个所述途径 中的最终步骤时,产物是丁醛、异丁醛、或 2- 丁酮。 因此经工程化具有其中一个这些缺 失最终步骤的所述途径的重组微生物宿主细胞有丁醛、异丁醛、或 2- 丁酮来源。 本发明 的分离的核酸分子在细胞中的附加表达导致存在丁醇脱氢酶活性,该酶活性将丁醛转化 成 1- 丁醇、将异丁醛转化成异丁醇、或者将 2- 丁酮转化成 2- 丁醇。
     生长以生产丁醇
     包含本发明的分离的核酸分子并具有丁醛、异丁醛、或 2- 丁酮的重组微生物生 产宿主在包含合适碳底物的发酵培养基中生长。 合适的底物可包括但不限于 :单糖, 例如葡萄糖和果糖 ;低聚糖,例如乳糖或蔗糖 ;多糖,例如淀粉、纤维素或它们的混合 物 ;以及来自可再生原料的未纯化混合物,例如干酪乳清渗透物、玉米浆、甜菜糖蜜及 大麦麦芽。 另外,碳底物也可以为已证明可以被代谢转化为关键生化中间产物的诸如二 氧化碳之类的一碳底物或甲醇。 甲基营养生物体也已知可以利用多种其他含碳化合物, 例如甲胺、葡糖胺及用于代谢活动的多种氨基酸。 例如,甲基营养酵母已知可利用来自 甲胺的碳来形成海藻糖或甘油 (Bellion 等人, Microb.Growth C1Compd., [Int.Symp.], 第 7 界 (1993),415-32, 编 辑 :Murrell, J.Collin ;Kelly, Don P. 出 版 社 :Intercept, Andover, UK)。 类似地,假丝酵母属的多种物种将会代谢丙氨酸或油酸 (Sulter 等人, Arch.Microbiol.153 :485-489(1990))。 因此,预期本发明中所利用的碳源可涵盖各种含 碳底物并且将仅受限于生物体的选择。
     尽管预期所有上述碳底物及它们的混合物都适用于本发明,但优选的碳底物为 葡萄糖、果糖和蔗糖。 蔗糖可来源于可再生的糖源如甘蔗、糖用甜菜、木薯、甜高粱、以及它们的混合物。 葡萄糖和右旋糖可来源于可再生的谷物来源,经由糖化淀粉基的原 料包括谷物如玉米、小麦、裸麦、大麦、燕麦、以及它们的混合物。 此外,可发酵糖可 通过预处理和糖化过程来源于可再生的纤维质或木质纤维质生物质,这在例如共有的和 共同未决的美国专利申请公布 2007/0031918A1 中进行了描述,该专利以引用方式并入本 文。 生物质指任何纤维质或木质纤维质材料,包括包含纤维素的材料,并且任选地还包 含半纤维素、木质素、淀粉、低聚糖和 / 或单糖的材料。 生物质也可包括附加组分如蛋 白质和 / 或脂质。 生物质可来源于单一来源,或者生物质可包括来源于一种以上来源的 混合物 ;例如,生物质可包括玉米芯和玉米秸秆的混合物,或草和叶片的混合物。 生物 质包括但不限于生物能作物、农业残余物、市政固体垃圾、工业固体垃圾、来自造纸业 的淤渣、庭院垃圾、木材和林业垃圾。 生物质的实例包括但不限于 :玉米粒、玉米芯、 作物残余如玉米壳、玉米秸秆、草、小麦、小麦秸秆、大麦、大麦秸秆、干草、稻秆、 柳枝稷、废纸、蔗渣、高粱、大豆、获取自谷物、树、枝、根、叶、木屑、锯末、灌木 及矮树丛、蔬菜、水果、花、动物粪肥、以及它们的混合物的研磨物的组分。
     除了合适的碳源外,发酵培养基还必须含有本领域技术人员已知的适于培养物 生长并促进生产 2- 丁酮所必需的酶途径的矿物质、盐、辅因子、缓冲剂及其他组分。
     培养条件
     通常,使细胞在约 20℃至约 40℃的温度范围下在合适的培养基中生长。 本发明 中的合适培养基是普通的商业制备的培养基,例如 Luria Bertani(LB) 肉汤、沙氏葡萄糖 肉汤 (SD) 肉汤、酵母培养基 (YM) 肉汤、或者包括酵母氮基、硫酸铵、和右旋糖 ( 作为 碳源 / 能源 ) 的肉汤或 YPD 培养基,它是蛋白胨、酵母提取物、和右旋糖的最佳比例共 混物,用于培养啤酒糖酵母菌株。 也可以使用其他确定的或合成的生长培养基,微生物 学或发酵科学领域的技术人员将知道用于具体微生物生长的合适培养基。 已知可以直接 或间接调节分解代谢物阻遏的试剂,如环腺苷酸 2′,3′ - 单磷酸,也可以掺入发酵培 养基中。
     适于酵母发酵的 pH 范围介于 pH 5.0 至 pH 9.0 之间,其中优选将 pH6.0 至 pH 8.0 作为初始生长条件的范围。 适于其他微生物发酵的 pH 范围介于 pH 3.0 至 pH 7.5 之间, 其中优选将 pH 4.5.0 至 pH 6.5 作为初始生长条件的范围。
     发酵可以在有氧或厌氧条件下进行,厌氧或微氧条件是优选的。
     工业分批发酵和连续发酵
     发酵可为分批发酵方法。 经典的分批发酵是封闭系统,其中培养基的组成在发 酵开始时设定并且在发酵过程中不进行人工改变。 因此在发酵开始时,用所需生物体对 培养基进行接种,在不向系统添加任何物质的情况下进行发酵。 然而,通常来说, “分 批” 发酵是指碳源的添加是成批的,但经常试图控制诸如 pH 和氧浓度之类的因素。 在 分批发酵系统中,代谢产物和生物质组成持续改变直至发酵结束时。 在分批培养物内, 细胞缓慢通过静态延滞期到达高速生长对数期,并最后达到稳定期,此时生长速率减缓 或终止。 如果不加以处理,稳定期中的细胞将最终死亡。 通常,对数期中的细胞负责产 生大部分终产物或中间产物。
     标准分批式系统的一种变型是补料分批系统。 - 补料分批发酵工艺也适用于本 发明,并且包括典型的分批式系统,不同的是随着发酵进程递增地添加底物。 在代谢产物往往抑制细胞的代谢作用,以及其中期望培养基中具有有限量的底物时,补料 - 分批 式系统是有用的。 补料分批式系统中的实际底物浓度难于测量并因而可根据一些可测量 因素 ( 例如 pH、溶解的氧以及废气例如 CO2 的分压 ) 进行评估。 分批发酵和补料 - 分 批发酵在本领域内是常用的且众所周知,并且实例可见于如下文献 :Thomas D.Brock, Biotechnology :A Textbook of Industrial Microbiology,第二版,Sinauer Associates,Inc., Sunderland, MA(1989) 或 Deshpande, Mukund V., Appl.Biochem.Biotechnol.36 :227, (1992),该文献以引用方式并入本文。
     发酵培养物可适应连续发酵方法。 连续发酵是一种开放式系统,其中将设定好 的发酵培养基连续加入生物反应器中,并同时移出等量条件培养基用于加工。 连续发酵 一般保持恒定高密度的培养物。
     连续发酵允许调节一种因素或任意数目的因素,这些因素影响细胞生长或终产 物浓度。 例如,一种方法将以固定的速率维持限制性营养物质例如碳源或氮水平并且允 许所有其他参数适度。 在其他系统中,影响生长的许多因素可以连续改变,而通过培养 基浊度测量的细胞浓度保持不变。 连续系统力求维持稳态的生长条件,并因而在发酵过 程中由于培养基被取出而导致的细胞损失必须与细胞的生长率保持平衡。 用于调节连续 发酵工艺中的营养物质和生长因子的方法以及使产物形成速率保持最高水平的方法是工 业微生物领域众所周知的,并且多种方法已由 Brock( 同上 ) 详细描述。
     预期分批、补料 - 分批、连续方法、或任何已知模式的发酵适于所述的重组微 生物宿主细胞的生长。 另外,预期可以将细胞固定在底物上而作为完整的细胞催化剂并 让其经受发酵条件以生产 2- 丁醇。
     用于从发酵培养基中分离丁醇的方法
     可使用发酵领域已知的方法如 ABE 从发酵培养基中分离生物生产的丁醇 ( 参 见 例 如 Durre, Appl.Microbiol.Biotechnol.49 :639-648(1998), Groot 等 人, Process Biochem.27 :61-75(1992),以及本文参考 )。 例如,可通过离心、过滤、滗析等方法从 发酵培养基中移除固体。 然后,可使用诸如蒸馏、共沸蒸馏、液液萃取、吸附、汽提、 膜蒸发、或全蒸发的方法从发酵培养基中分离丁醇。
     因为丁醇与水形成低沸点的共沸混合物,可使用蒸馏分离混合物及其共沸组合 物。 可将蒸馏与另一种分离方法联合使用以分离共沸物。 可与蒸馏联合使用以分离并 纯化丁醇的方法包括但不限于滗析、液液萃取、吸附、和基于膜的技术。 此外,可使 用共沸蒸馏,用夹带剂 ( 参见例如 Doherty 和 Malone, Conceptual Design of Distillation Systems, McGraw Hill, New York,2001) 分离丁醇。
     丁醇 - 水混合物形成非均相共沸物,以便蒸馏可与滗析联合使用以分离并纯化 丁醇。 用这种方法,将包含发酵液的丁醇蒸馏至接近共沸组合物。 然后冷凝共沸混合 物,并且通过滗析从发酵培养基中分离丁醇。 可将滗析的含水相作为回流返回第一蒸馏 塔。 可在第二蒸馏塔中通过蒸馏进一步纯化富含丁醇的滗析有机相。
     也可联合使用液 - 液萃取和蒸馏从发酵培养基中分离丁醇。 用这种方法,用合 适的溶剂通过液 - 液萃取从发酵液中提取丁醇。 然后蒸馏包含丁醇的有机相以从溶剂中 分离丁醇。
     也可组合使用蒸馏和吸附以从发酵培养基中分离丁醇。 用这种方法,将包含丁醇的发酵液蒸馏至接近共沸组合物,然后使用吸附剂除去剩余的水如分子筛 (Aden 等 人, Lignocellulosic Biomass to Ethanol Process Design and Economics Utilizing Co-Current Dilute Acid Prehydrolysis and Enzymatic Hydrolysis for Corn Stover , Report NREL / TP-510-32438, National Renewable Energy Laboratory,2002 年 6 月 )。
     此外,蒸馏与全蒸发联合使用可从发酵培养基中分离并纯化丁醇。 用这种方 法,将包含丁醇的发酵液蒸馏至接近共沸组合物,然后通过全蒸发用亲水膜除去剩余的 水 (Guo 等人, J.Membr.Sci.245,199-210(2004))。 实施例 本发明将在下面的实施例中进一步限定。 应该理解,这些实施例尽管说明了本 发明的优选实施方案,但仅是以例证的方式给出的。 根据上面的论述和这些实施例,本 领域的技术人员能确定本发明的基本特征,并在不脱离本发明的精神和范围的情况下, 能够对本发明做出多种改变和修饰,以使其适用于多种用法和条件。
     一般方法
     实施例中所述的标准重组 DNA 技术和分子克隆技术在领域内是众所周知的, 并 且 在 下 列 文 献 中 有 所 描 述 :Sambrook, J., Fritsch, E.F. 和 Maniatis, T.Molecular Cloning :A Laboratory Manual ;Cold Spring Harbor Laboratory Press :Cold Spring Harbor, NY, (1989)(Maniatis) 和 T.J.Silhavy, M.L.Bennan 和 L.W.Enquist, Experiments with Gene Fusions, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(1984) 以及 Ausubel,F.M 等人,Current Protocols in Molecular Biology,出版 :Greene Publishing Assoc.and Wiley-Interscience(1987), 以 及 Methods in Yeast Genetics,2005, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY
     适合细菌培养物维持及生长的材料和方法在本领域内是众所周知的。 适用于 下面实施例的技术可参见 Manual of Methods for General Bacteriology(Phillipp Gerhardt, R.G.E.Murray, Ralph N.Costilow, Eugene W.Nester, Willis A.Wood, Noel R.Krieg 和 G.Briggs Phillips 编辑 ), American Society for Microbiology, Washington, DC.(1994)), 或者 Thomas D.Brock, Biotechnology :A Textbook of Industrial Microbiology,第二版, Sinauer Associates, Inc., Sunderland, MA(1989)。 除非另外指明,使用的用于细菌细 胞生长和维持的所有试剂、限制性内切酶和材料均得自 Aldrich Chemicals(Milwaukee, WI)、 BD Diagnostic Systems(Sparks, MD)、 Life Technologies(Rockville, MD) 或 Sigma Chemical Company(St.Louis, MO)。
     除 非 另 外 指 明, 微 生 物 菌 株 获 取 自 美 国 典 型 培 养 物 保 藏 中 心 (ATCC), Manassas, VA。
     缩写的含义如下 :“s” 指秒, “min” 指分钟, “h” 指小时, “psi” 指磅每 平方英寸, “nm” 指纳米, “d” 指天, “μL” 指微升, “mL” 指毫升, “L” 指 升, “mm” 指毫米, “nm” 指纳米, “mM” 指毫摩尔每升, “μM” 指微摩尔的, “M” 指摩尔的, “mmol” 指毫摩尔, “μmol” 指微摩尔, “g” 指克, “μg” 指 微克而 “ng” 指纳克, “PCR” 指聚合酶链反应, “OD” 指光密度, “OD600” 指在 600nm 波长下测量的光密度, “kDa” 指千道尔顿, “g” 指引力常数, “bp” 指碱基
     对, “kbp” 指千碱基对, “% w/v” 指重量 / 体积百分比, “% v/v” 指体积 / 体积 百分比, “HPLC” 指高效液相色谱, “GC” 指气相色谱。 术语 “摩尔选择性” 是消 耗的每摩尔糖底物制备的产物摩尔数,用百分比表示。
     “Km” 是在给定酶浓度的酶反应中导致产物生产速率等于 Vmax 的二分之一的底 物浓度。
     “Vmax” 是在给定酶浓度的酶反应中生产产物的最大速率。 一般单位是产物微 摩尔数每分钟反应时间。
     实施例 1
     从木糖氧化无色杆菌的环境分离蛋白中分离并表征丁醇脱氢酶
     使用富集方法以测定从环境废水污泥样本中分离能够利用 1- 丁醇作为唯一碳 源的微生物是否是可能的。 通过以下方法获取富集培养物 :将 1mL 活化污泥接种到 10mL S12 培养基中 (0.01M 硫酸铵,0.05M 磷酸钾,pH7.0,2mM MgCl2,0.7mM CaCl2, 50μM MnCl2,1μM FeCl3,1μM ZnCl2,1.72μM CuSO4,2.53μM CoCl2,2.42μM Na2MoO4,2μM 硫胺素盐酸盐 ),该培养基在 125mL 锥形瓶中包含酵母提取物 ( 终浓度 0.001% ) 和 0.1% (w/v) 的 1- 丁醇。 从 DuPont 废水处理设备中获取活化污泥。 富集培 养物在 37℃下往复振荡培养。 培养物最初每隔 1 至 2 天通过用 9mL 的培养基置换相同体 积的培养物来稀释培养物。 随后,将更高的稀释液转入包含 0.1-0.4% (w/v) 的初始 1- 丁 醇浓度的相同培养基中导致生长速率 (34℃,250rpm) 接近 0.55hr-1。
     将富集培养物的样本 (10μL) 平铺在 LB 琼脂或胰酪胨大豆琼脂上,并且在 35℃ 培养大约 20 小时。 通过在相同培养基上划线接种并在 35℃培养该培养物纯化代表性的菌 落。 选择分离物进行进一步检查。 将一个分离物命名为 BUTCON-5。 通过 rRNA 表征 分析 BUTCON-5 菌株的同一性。
     通过 PCR 扩增菌株 BUTCON-5 的 16S rRNA 并如下进行分析。 菌株 BUTCON-5 在 LB 中, 在 37 ℃ 下 振 荡 生 长 16 小 时。 使 用 Ultraclean Microbial DNA 分 离 试 剂 盒 (MoBio, part#12224),按照制造商的说明书从菌株 BUTCON-5 中提取 DNA。 使用 商购获得的试剂盒,按照制造商的说明书 (Perkin Elmer, Norwalk, CT),通过 PCR 扩 增 16S rRNA 基 因 序 列, 引 物 为 JCR14(ACGGGCGGTGTGTAC ;SEQ ID NO :4) 和 JCR15(GCCAGCAGCCGCGGTA ;SEQ ID NO :5)。 在 Perkin Elmer GeneAmp 9600 中 进行 PCR。 样本在 94℃下培养 2 分钟,然后如下循环 30 次 :在 94℃下 1 分钟,接着在 55℃下 1 分钟,72℃下 1 分钟,并在 72℃下保持 5 分钟。 使用商购获得的试剂盒,按照 制造商的说明书 (QIAquick PCR Purification Kit, Valencia, CA) 纯化扩增的 16S rRNA 序 列片段,并且在自动 ABI 测序仪 (Applied Biosystems, Foster City, CA) 上测序。 测序 反应的起始引物是 JCR14(SEQ ID NO :4) 和 JCR15(SEQ ID NO :5)。 用 16S rRNA 基 因序列作为查询序列进行 GenBank 中可利用序列的 BLAST 搜索 (Altschul 等人, Nucleic Acids Res.25 :3389-3402(1997)) 以获取相似序列。 来自菌株 BUTCON-5(SEQ IDNO : 6) 的 16S rRNA 基因序列与若干个属于菌种木糖氧化无色杆菌的细菌 16S rRNA 基因序列 具有高序列同一性。 BUTCON-5 序列与从木糖氧化无色杆菌菌株 NFRI-A1(GenBank 登 陆号 AB161691) 中分离的 16SrRNA 基因序列具有最高的同一性 (99% )。
     纯化来自木糖氧化无色杆菌的丁醇脱氢酶活性来自木糖氧化无色杆菌 BUTCON-5 菌株的丁醇脱氢酶的纯化从在上述培养 基中生长菌株的 500mL 过夜培养物开始进行。 沉淀细胞 (Sorvall RC5B, F10 转子, 6000RPM,20 分钟,10℃ ) 并用 pH 7.0 的 25mL 20mM 磷酸钾洗涤两次。 将洗涤后的沉 淀物重悬在 pH7.0 的 30mL20mM 磷酸钾中,并且在冰上冷冻。 超声波降解 (Heat Systems Ultrasonics, Cell Disrupter model W375, Power level 50, Pulsed Mode,70 %占空比,5 分钟 ) 细胞。 通过离心 (Sorvall RC5B, SS34 转子,18000RPM,20 分钟,10℃ ) 细胞 降解产物制备细胞游离提取物。 将上清液以等分试样贮存在 -80 ℃。 解冻两份等分试 样 (9.12mL),将它们混合并用硫酸鱼精蛋白沉淀。 在 15 分钟内四次逐滴加入 100μL 的 50mg/mL 硫酸鱼精蛋白溶液 ( 总计 15% w/w 蛋白 )。 离心 (Beckman 冷冻离心机, 20,000RCF,4℃,10 分钟 ) 移除沉淀。
     Superdex prep 200 柱用 20mM 磷酸钾,20mM KCl, pH7.0 平衡。 用 Centriprep 浓缩机将来自硫酸鱼精蛋白沉淀的上清液浓缩至约 1.3mL,装入柱中并用相同缓冲液以 1.00mL/ 分钟等度洗脱。 收集组分并测定 1- 丁醇脱氢酶活性。 该检测分析法用分光光 度计在 340nm 监控 NADH 氧化成 NAD+ 的情况,该检测法在 35℃下,使用在包含 50mM 丁醛和 0.2mMNADH 的 50mM 磷酸钾缓冲液中 (pH6.2) 的合适量的酶。 收集具有高比活 性的组分并浓缩以提供高纯度组分,该组分具有 19μmol/ 分钟 / 毫克蛋白的比活性。
     来自木糖氧化无色杆菌的分离丁醇脱氢酶的活性染色
     使用非变性聚丙烯酰胺凝胶 (8-16% Tris- 甘氨酸梯度凝胶,Invitrogen) 对纯化酶 和分子量标准品进行电泳。在电泳后,除去凝胶并对其进行蛋白染色 (Simply Blue Protein Stain,Invitrogen) 或活性染色,染色通过耦合 1- 丁醇加 NAD+ 变成丁醛加 NADH 的转化 与 3[4,5- 二甲基 -2- 噻唑基 ]-2,5- 二苯基四氮唑溴盐 (MTT) 变成深色甲臜 (formazan) 的转化进行,使用吩嗪硫酸二甲酯 (PMS) 作调节剂 (Tang 等人,等人, J.Bacteriol.140, 182(1997))。 活性溶液包含 0.5mg PMS,5mg MTT,20mg NAD+ 和 1mL 1- 丁醇,总体 积为 25mL。 所得活性染色与介于 B- 藻红蛋白 (242 千道尔顿 ) 和乳酸脱氢酶 (146 千道 尔顿 ) 蛋白标准品之间的中间条带一起迁移。 随后使用 2- 丁醇 ( 生成 2- 丁酮 ) 或异丁 醇 ( 生成异丁醛 ) 进行的活性染色生成具有相同分子量的条带,指示相同蛋白对这些丁醇 异构体具有活性。
     来自木糖氧化无色杆菌的丁醇脱氢酶的动力学表征
     用 1- 丁醇、2- 丁醇、丁醛、2- 丁酮 ( 甲基乙基酮 )、和异丁醛作底物测定还 原 ( 酮和醛 ) 或氧化 ( 醇 ) 的木糖氧化无色杆菌丁醇脱氢酶动力学参数。 用醇底物进 行的反应在 35℃的 TRIS 缓冲液中进行,该缓冲液 pH8.5,包含 3mM NAD+ 和不同浓度 的醇。 用酮或醛底物进行的反应在 35 ℃用 pH6.0 的 50mM MES 缓冲,200μm NADH 和不同浓度的酮或醛进行。 使用获取自木糖氧化无色杆菌或重组大肠杆菌菌株 Mach1/ pTrc99a::sadB( 如下文实施例 3 所述 ) 的粗制酶制剂。 根据结果计算每种底物的 Vmax 和 Km,这些数据在表 1 中提供。
     表 1 :木糖氧化无色杆菌丁醇脱氢酶的动力学常数。
     实施例 2
     获取木糖氧化无色杆菌丁醇脱氢酶的编码序列
     从如实施例 1 所述制备的凝胶中切除对应于木糖氧化无色杆菌丁醇脱氢酶 的合适分子量的条带,使用标准方法分离蛋白并测定 N- 末端序列。 将序列测定为 MKALVYHGDHKISLGDKPKP(SEQ ID NO :7)。
     从编码该肽的计划 DNA 序列中设计测序引物。 简并引物 N331(SEQID NO :8) 在以下实验中成功地提供第一序列信息。 从木糖氧化无色杆菌菌株 BUTCON-5 中制备 基因组 DNA,使用 Gentra Puregene 试剂盒 (Gentra Systems, Inc., Minneapolis, MN ; 目录号 D-5500A) 按照革兰氏阴性菌生物推荐的规程进行制备。 最初使用从纯化基因 组 DNA(gDNA) 进行测序的改进规程从编码区的 5’ 末端朝着 3’ 末端进行染色体行 走。 就每个测序引物反应而言,将 20μL 纯化 gDNA( ~ 200ng/μL) 加到 16μL BigDye v3.1Sequencing Reagent(Applied Biosystems Cat.No.4337457),3μL 10μm 引物,和 1μL DMSO(Sigma-Aldrich Cat.No.D8418) 中。 然后如下进行热循环测序反应 :96℃ 3 分钟, 随后进行 200 个循环 (95℃ 30 秒 +55℃ 20 秒 +60℃ 2 分钟 ),然后 4℃贮存。 在测序之 前,使用 Edge Biosystem(Gaithersburg,MD 20877,USA) 纯化板移除未掺入的 ddNTP。 就每个测序反应而言,将总计 40μL 吸移到预离心过的 96- 孔纯化板的一个孔中。 然后 在 Sorvall RT-7 冷冻离心机中以 5,000×g 将板离心 5 分钟。 然后将纯化后的反应物直接 置于 Applied Biosystems 3730DNA 测序仪上,并用自动碱基判定测序。
     通过 BLASTX 搜索公开可获得的序列分析用简并引物 N331 获取的序列,并且 分析该序列与脑膜炎奈瑟氏球菌锌依赖醇脱氢酶的编码氨基酸序列具有 65%的相似度, 而与来自其他生物具有相关活性的蛋白的相似程度更低。 从用引物 N331 获取的序列中 制备附加引物,并且进行第二轮测序。 从引物 N401( 正向 ;SEQ ID NO :9)、N402( 反 向 ;SEQID NO :10) 和 N406( 正向 ;SEQ ID NO :11) 获取的结果揭示了起始密码子和 推定的锌结合 cys-X-X-X-cys-X-X-cys 基序。 从新获得的序列中设计附加的正向和反 向测序引物。 从引物 N412(SEQ ID NO :12)、 N421(SEQ ID NO :13) 和 N422(SEQ ID NO :14) 获取的测序结果与从引物 N331 和 N402 获取的测序结果部分相同,使得能够装 配 426nt 的重叠群。
     然后如下使用 GenomiPhi(GE Healthcare Cat.No.25-6600-01) 扩增 gDNA 以改善 测序阅读长度。 将一纳克纯化 gDNA 加到 9μL 样本缓冲液中并加热到 95℃保持 3 分钟, 随后冷却至 4℃。 将 10μL 酶混合物 ( 由 9μL 反应缓冲液 +1μL 酶组成 ) 加到每个冷却
     样本中并将混合物在 30℃培养 18 小时。 随后通过加热至 65℃保持 10 分钟灭活酶。 样本 在 4℃贮存直至测序。 就每个测序引物反应而言,将 8μL 扩增的 DNA 加到 8μLBigDye v3.1Sequencing Reagent(Applied Biosystems Cat.No.4337457),4μ5X 测序缓冲液 (Applied Biosystems,4336699),3μL 10μM 引 物, 和 16μL 分 子 生 物 学 级 别 水 (Mediatech, Inc.),以及 1μL DMSO(Sigma-Aldrich Cat.No.D8418) 中。
     用引物 N462(SEQ ID NO :17)、N464(SEQ ID NO :19) 和 N465(SEQ ID NO : 20)( 所有引物从 426nt 重叠群序列中制备 ) 对扩增 DNA 进行的测序完成了编码区的 3’末 端并且使得能够装配 1047nt 的开放阅读框。 就最后的确认而言,正向和反向引物分别是 N473(SEQ ID NO :24) 和 N469(SEQ ID NO :23),它们从 “粗”重叠群装配物中设计以 PCR 扩增来自纯化 gDNA 的完整编码序列,扩增使用高保真 PhusionTM 扩增试剂盒 (New England Biolabs Cat.No.F-531S)。将 PCR 严物 TOPO-Blunt 克隆到 pCR4BLUNT(Invitrogen Cat.No.K2835-20) 中以制备 pCR4Blunt::sadB,它按照制造商的规程被转化到大肠杆菌 Mach-1 细胞 ( 在试剂盒中提供 ) 中。 随后从四个克隆中分离质粒,并且用侧接载体 - 特 异性引物 (M13 正向和反向 ;SEQ ID NO :25,26) 和编码序列插入序列特异性的引物 N456(SEQ ID NO :15)、 N457(SEQ ID NO :16)、 N462(SEQ ID NO :17)、 N463(SEQ ID NO :18)、N465(SEQ ID NO :20)、N466(SEQ ID NO :21)、及 N467(SEQ ID NO : 22) 对插入序列进行测序。达到了至少 4X 的覆盖率,这确认了 1047nt 的编码区序列 (SEQ IDNO :1)。
     将编码鉴定的木糖氧化无色杆菌丁醇脱氢酶的基因命名为 sadB,用于仲醇脱氢 酶 -2- 丁醇。 如实施例 1 所示,该酶显示具有比包括 1- 丁醇和异丁醇在内的 2- 丁醇仲 醇更广的底物范围,使其成为丁醇脱氢酶。 将从最终的 1047nt 编码序列翻译得到的蛋白 (SEQ ID NO :2) 用作 BLASTP 查询序列,使用默认参数查询公开可得到的序列。发现它 与来自脑膜炎奈瑟氏球菌的推定锌依赖醇脱氢酶 (GenBank 登录号 AAF41759) 最相似, 它与 sadB 氨基酸序列具有 67%的同一性。 通过 BLAST 分析公开可得到的序列,发现木 糖氧化无色杆菌丁醇脱氢酶的 DNA 编码序列与脑膜炎奈瑟氏球菌 MC58 锌依赖醇脱氢酶 (GenBank 登录号 NC003112) 的编码序列具有 64.5%的同一性。
     实施例 3
     将 2- 丁酮转化成 2- 丁醇的表达木糖氧化无色杆菌醇脱氢酶的大肠杆菌构建体
     仲醇脱氢酶 (sadB) 来自木糖氧化无色杆菌,将其克隆进载体 pTrc99a(Amann 等 人, Gene 69(2) :301-315(1988)) 中。 使用来自木糖氧化无色杆菌基因组 DNA 的标准 条件扩增编码区 (SEQ ID NO :1),用 Gentra Puregene 试剂盒 (Gentra Systems, Inc., Minneapolis,MN ;目录号 D-5500A),使用正向和反向引物 N473 和 N469(SEQ ID NO : 24 和 23),按照推荐用于革兰氏阴性菌生物的规程制备。 将 PCR 产物 TOPO-Blunt 克隆 进 pCR4BLUNT(Invitrogen) 以制备 pCR4Blunt::sadB,它被用于转化大肠杆菌 Mach-1 细 胞。 随后从四个克隆中分离质粒 DNA,并且确认序列。 然后用 EcoRI 消化质粒,释放 sadB 片段,该片段与用 EcoRI 消化的 pTrc99a 连接以生成 pTrc99a::sadB。 用质粒转化大 肠杆菌 Mach 1 细胞,将所得转化体命名为 Mach1/pTrc99a::sadB。测定这些细胞中的 sadB 基因表达的酶的活性并将结果在实施例 1 的表 1 中给出。
     实施例 4酵母表达由 pRS425::GPM-sadB 的 sadB 构建体编码的丁醇脱氢酶
     从 pCR4Blunt::sadB 中 PCR 扩增 sadB 基因编码区。 PCR 引物 N583 和 N584(SEQ ID NO :27 和 28) 包含附加的 5’序列,它与酵母 GPM 启动子 (SEQ ID NO :29) 和 ADH1 终止子 (SEQ ID NO :30) 部分相同。 然后使用啤酒糖酵母 (Ma 等人,同上 ) 中的 “空 隙修复”方法将 PCR 产物如下克隆进酵母 - 大肠杆菌穿梭载体 pRS425::GPM::kivD::ADH 中。 该载体包含嵌合基因,所述嵌合基因将酵母 GPM 启动子 (SEQ ID NO :29)、乳酸乳 球菌 kivD 编码区 (SEQ ID NO :31)、和 ADH1 终止子 (SEQ IDNO :30) 包含在 pRS425 载体 ( 来自 pRS400 系列 :Christianson 等人, Gene 110 :119-122(1992)) 中,并且在共 有的和共同未决的美国专利申请公布 #20070092957A1 的实施例 17 中进行了描述 )。 用 BbvCI 和 PacI 限制性酶消化该载体以释放 kivD 编码区。 使用大约 1μg 剩余的载体片段 连同 1μg sadB PCR 产物一起转化啤酒糖酵母菌株 BY4741。 在缺乏亮氨酸的合成完全培 养基上选择转化体。 通过 PCR 使用引物 N142 和 N459(SEQ ID NO :32 和 33) 确认合适 的重组事件生成 pRS425::GPM-sadB。
     在缺乏亮氨酸的合成完全培养基中培养三个克隆以生成待测定的细胞。 通过标 准小珠研磨方法,使用 1mL 0.5mm 小珠和 1.5mL 酵母细胞悬浮液制备细胞游离提取物。 如下测量经测定为 MEK 还原酶活性的活性。将酵母细胞游离提取物 ( 如表 2 所示,50μL 样本和其中一个 100μL 的样本 ) 加到包含 920 或 870μL 的 50mM MES 缓冲液 (pH 6), 10μL 的 20mM NADH,和 10μL 的 100mM DTT 的石英比色杯中。 在将 10μL 的 500mM 2- 丁酮加到反应中前,监控在 340nm 的吸光度 1 分钟以获得背景速率。 监控在 340nm 的 吸光度附加的 2 分钟以获取反应速率。 在表 2 中报道了与仅用于载体的对照物 (BY4741/ pRS426) 相比包含显著的 MEK 还原活性的所有三个克隆,用活性 (μ 摩尔 / 分钟 / 毫克 ) 表示。
     表 2 :在酵母中表达的木糖氧化无色杆菌丁醇脱氢酶的活性
     实施例 5密码子优化的 sadB 在啤酒糖酵母中的表达
     编码木糖氧化无色杆菌丁醇脱氢酶的序列经密码子优化以在啤酒糖酵母中表 达,表达使用在由 Kazusa DNA Research Institute(Japan) 保存的 Codon Usage Database 中 报道的标准密码子使用信息,通过 DNA 2.0(Menlo Park,CA) 进行。 从 DNA 2.0 中接受 包含称为 sadBy(SEQ IDNO :3) 的最优化编码区的克隆 DNA 片段。 如下构建包含 GPM 启动子 -sadBy 编码区 -ADH1 终止子的嵌合基因。
     如实施例 4 所述用引物 OT1074 和 OT1075(SEQ ID NO :34 和 35) 进行的定点诱 变用于生成在 pRS425::GPM-sadB 中的 sadB 编码区的 ATG 密码子上游的 NheI 限制性位 点,制备载体 pRS425::GPMp-sadB(NheI)-ADH1t。 使用 NheI 和 PacI 限制性位点将密码 子优化的 sadBy 片段亚克隆到 pRS425::GPMp-sadB(NheI)-ADH1t 中,置换最初的 sadB 编 码区。 将所得质粒称为 pRS425::GPMp-sadBy-ADH1t。
     用 质 粒 pRS425-GPMp-sadBy-ADH1t, 利 用 标 准 遗 传 方 法 (Methods in Yeast Genetics , 2005 , Cold Spring Harbor Laboratory Press , Cold Spring Harbor , NY , pp.201-202) 转化啤酒糖酵母 BY4741(ATCC#201388),并且在缺乏亮氨酸并补充有 2%葡 萄糖的合成完全培养基上,在 30℃下选择转化体。 BY4741pRS425::GPMp-sadBy-ADH1t 在缺乏亮氨酸并补充有 2%葡萄糖的合成完全培养基上,在 30℃下过夜生长,并且将其 接种到 200mL 相同培养基中至最终 OD600 为 0.2。 在 30℃下以 220rpm 振荡培养所述培 养物直至在 OD600 为 0.8-1.0 时离心收获,并且贮存在 -80℃。
     如上文实施例 4 所述制备酵母提取物。 如上文实施例 4 所述进行 2- 丁酮还原的 活性测定。 在表 3 中提供了来自各个测定的比活性 (μ 摩尔 / 分钟 / 毫克 )。
     表 3 :在具有密码子优化的编码区的酵母中表达的木糖氧化无色杆菌丁醇脱氢 酶的活性。
     样本 BY4741pRS425::GPMp-sadBy-ADH1t Clone A(50μL) BY4741pRS425::GPMp-sadBy-ADH1t CLone B(50μL) BY4741pRS425::GPMp-sadBy-ADH1t Clone A(100μL) BY4741pRS425::GPMp-sadBy-ADH1t Clone B(100μL) 平均值
     发明背景
     丁醇是一种重要的工业化学品,其可用作燃料添加剂、塑料工业中的化学原料 以及食品和香料工业中的食品级萃取剂。 每年通过石油化学手段生产 100 至 120 亿磅的 丁醇,并且对该日用化学品的需求可能还会增加。
     可对微生物进行工程化以表达生物合成途径用于丁醇生产。 共有的和共同未决 的美国专利申请公布 US 20070092957A1 公开了对重组微生物进行工程化以用于生产异丁 醇 (2- 甲基 -1- 丙醇 )。 共有的和共同未决的美国专利申请公布 US20080182308A1 公 开了工程化重组微生物用于生产 1- 丁醇。 共有的和共同未决的美国专利申请公布 US 20070259410A1 和 US 20070292927A1 公开了对重组微生物进行工程化以用于生产 2- 丁 醇。 描述了用于异丁醇和 2- 丁醇生产的多个途径。 在用于全部三个产物的所有所述途径 中的最终步骤是通过具有丁醇脱氢酶活性的酶将氧化程度较高的部分还原成醇部分。 已 知的醇脱氢酶能够进行这些转化。
    期望具有丁醇脱氢酶活性的附加酶在具有工程化丁醇生物合成途径的重组宿 主微生物中用于生产丁醇。 申请人通过以下方法已经解决了该问题 :在环境细菌分 离蛋白中发现具有丁醇脱氢酶活性的酶、分离该酶、并且从鉴定的木糖氧化无色杆菌 (Achromobacter xylosoxidans) 分离蛋白中鉴定编码的核酸序列。
     发明概述
     本文所述的是具有丁醇脱氢酶活性的新酶以及编码分离的核酸分子。
     本发明提供分离的核酸分子,所述分离的核酸分子包含编码至少约 250 个氨基 酸的多肽的第一核苷酸序列,所述多肽基于 Smith-Waterman 比对方法在与具有如 SEQ ID NO :2 所示的序列的多肽进行比较时具有至少约 70%的同一性,或者所述分离的核酸分 子包含所述第一核苷酸序列的互补序列的第二核苷酸序列,其中所述酶具有丁醇脱氢酶 活性。
     在另一方面,本发明提供编码丁醇脱氢酶的分离的核酸分子,所述分离的核酸 分子选自 :
     a) 编码如 SEQ ID NO :2 所示的氨基酸序列的分离的核酸分子 ;
     b) 在如下杂交条件下与 (a) 杂交的分离的核酸分子 :0.1X SSC、0.1 % SDS, 65℃以及用 2X SSC、0.1% SDS 洗涤,之后用 0.1X SSC、0.1% SDS 洗涤 ;或
     与 (a) 或 (b) 互补的分离的核酸分子。
     此外本发明提供由所述核酸分子以及包含可操作地连接至少一种调控元件的核 酸分子的嵌合基因编码的多肽,以及包含所述核酸分子的转化的宿主细胞。
     在一个实施方案中,本发明提供了生产 2- 丁醇的方法,所述方法包括 :
     a) 提供包含本发明的分离的核酸分子的重组微生物生产宿主细胞,所述分离的
     发明概述
     本文所述的是具有丁醇脱氢酶活性的新酶以及编码分离的核酸分子。
     本发明提供分离的核酸分子,所述分离的核酸分子包含编码至少约 250 个氨基 酸的多肽的第一核苷酸序列,所述多肽基于 Smith-Waterman 比对方法在与具有如 SEQ ID NO :2 所示的序列的多肽进行比较时具有至少约 70%的同一性,或者所述分离的核酸分 子包含所述第一核苷酸序列的互补序列的第二核苷酸序列,其中所述酶具有丁醇脱氢酶 活性。
     在另一方面,本发明提供编码丁醇脱氢酶的分离的核酸分子,所述分离的核酸 分子选自 :
     a) 编码如 SEQ ID NO :2 所示的氨基酸序列的分离的核酸分子 ;
     b) 在如下杂交条件下与 (a) 杂交的分离的核酸分子 :0.1X SSC、0.1 % SDS, 65℃以及用 2X SSC、0.1% SDS 洗涤,之后用 0.1X SSC、0.1% SDS 洗涤 ;或
     与 (a) 或 (b) 互补的分离的核酸分子。
     此外本发明提供由所述核酸分子以及包含可操作地连接至少一种调控元件的核 酸分子的嵌合基因编码的多肽,以及包含所述核酸分子的转化的宿主细胞。
     在一个实施方案中,本发明提供了生产 2- 丁醇的方法,所述方法包括 :
     a) 提供包含本发明的分离的核酸分子的重组微生物生产宿主细胞,所述分离的
     核酸分子编码具有丁醇脱氢酶活性的多肽,并且提供 2- 丁酮来源 ;
     b) 使 (a) 的微生物宿主细胞在表达分离的核酸分子并将 2- 丁酮转化成 2- 丁醇的 条件下生长 ;以及
     c) 任选地回收所述 2- 丁醇。
     在另一个实施方案中,本发明提供了生产异丁醇的方法,所述方法包括 :
     a) 提供包含本发明的分离的核酸分子的重组微生物生产宿主细胞,所述分离的 核酸分子编码具有丁醇脱氢酶活性的多肽,并且提供异丁醛来源 ;
     b) 使 (a) 的微生物宿主细胞在表达分离的核酸分子并将异丁醛转化成异丁醇的 条件下生长 ;以及
     c) 任选地回收所述异丁醇。
     在另一个实施方案中,本发明提供了生产 1- 丁醇的方法,所述方法包括 :
     a) 提供包含本发明的分离的核酸分子的重组微生物生产宿主细胞,所述分离的 核酸分子编码具有丁醇脱氢酶活性的多肽,并且提供丁醛来源 ;以及
     b) 使 (a) 的微生物宿主细胞在中表达分离的核酸分子并将丁醛转化成 1- 丁醇的 条件下生长 ;
     c) 并且任选地回收所述 1- 丁醇。
     序列描述
     通过下面的发明详述、附图和随附的序列描述可以更全面地理解本发明,这些 详细描述、附图和序列描述形成了本专利申请的一部分。
     下 面 的 序 列 遵 照 37C.F.R.1.821-1.825( “Requirements for Patent Applications Containing Nucleotide Sequences and/or Amino Acid Sequence Disclosures-the Sequence Rules”( 对含有核酸序列和 / 或氨基酸序列公开的专利申请的要求 - 序列规则 )),并且符 合 World Intellectual Property Organization( 世界知识产权组织,WIPO)ST.25 标准 (1998) 以 及 EPO 和 PCT 的序列清单要求 ( 规则 5.2 和 49.5(a-bis) 以及 Administrative Instructions( 行 政指令 ) 的第 208 节和附录 C)。 用于核苷酸和氨基酸序列数据的符号和格式遵循在 37C. F.R.§1.822 中示出的规则。
     SEQ ID NO :1 是来自木糖氧化无色杆菌的丁醇脱氢酶 (sadB) 的鉴定编码区。
     SEQ ID NO :2 是来自木糖氧化无色杆菌的鉴定的丁醇脱氢酶的蛋白序列。
     SEQ ID NO :3 是木糖氧化无色杆菌丁醇脱氢酶的编码区,其密码子经优化以在 啤酒糖酵母 (Saccharomyces cerevisiae) 中表达。
     SEQ ID NO :4 和 5 是用于菌株 BUTCON-516S rRNA 的 PCR 扩增的引物。
     SEQ ID NO :6 是菌株 BUTCON-5 的 16S rDNA 序列。
     SEQ ID NO :7 是木糖氧化无色杆菌丁醇脱氢酶的 N- 末端肽序列。
     SEQ ID NO :8 是简并引物 N331。
     SEQ ID NO :9-26 是木糖氧化无色杆菌丁醇脱氢酶编码区的测序引物。 SEQ ID NO :27 和 28 是用于 sadB 编码区的 PCR 扩增的引物,该编码区具有用于空隙修复克隆的 延伸部分。
     SEQ ID NO :29 是酵母 GPM 启动子。
     SEQ ID NO :30 是酵母 ADH1 终止子。SEQ ID NO :31 是乳酸乳球菌 (Lactococcus lactis)kivD 编码区。
     SEQ ID NO :32 和 33 是用于确认 pRS425::GPM-sadB 的测序引物。
     SEQ ID NO :34 和 35 是用于增加 NheI 位点的定点诱变引物。
     发明详述
     本文所述的是从细菌的环境分离蛋白中分离得到的新型丁醇脱氢酶,该细菌经 鉴定为木糖氧化无色杆菌。 本发明提供了该蛋白的氨基酸序列和具有至少约 70%的氨 基酸同一性并具有丁醇脱氢酶活性的蛋白。 此外,提供了编码这些蛋白的分离的核酸分 子,它们可用于嵌合基因以在微生物中表达丁醇脱氢酶。 可使用木糖氧化无色杆菌丁醇 脱氢酶和相关序列的酶在重组微生物中从 2- 丁酮中生产 2- 丁醇、从异丁醛中生产异丁 醇、或者从丁醛中生产 1- 丁醇,所述重组微生物具有其中一种这些底物的来源。
     丁醇是一种具有多种应用的重要工业日用化学品,其中其作为燃料或燃料添加 剂的潜力尤为重要。 尽管丁醇仅仅是一种四碳醇,但是其具有与汽油相似的能含量,并 且可以与任何化石燃料共混。 丁醇是优选的燃料或燃料添加剂,因为它在标准内燃机中 燃烧时仅生成 CO2 并且几乎不产生或根本不产生 SOX 或 NOX。 另外,丁醇的腐蚀性不及 乙醇,是目前为止最优选的燃料添加剂。 丁醇除了可用作生物燃料或燃料添加剂之外,在新兴的燃料电池工业中还具有 影响氢分配问题的潜力。 如今,由于氢的运输和分配存在安全隐患,燃料电池饱受困 扰。 可以容易地对丁醇重整其氢含量,并且可以通过现有的加油站以燃料电池或汽车中 的内燃机所需的纯度进行分配。
     以下缩写和定义将用于说明书和权利要求的判读。
     如本文所用,术语 “包含”、“由 ... 组成”、“包括”、“涵盖”、“具有”、 “含有”、 “包容” 或 “容纳” 或其任何其它变型旨在包括非排他的包含物。 例如,包 含一系列元素的组合物、混合物、工艺、方法、制品或设备不必仅限于那些元素,而可 以包括其它未明确列出的元素,或此类组合物、混合物、工艺、方法、制品或设备固有 的元素。 此外,除非有相反的明确说明, “或” 是指包含性的 “或”,而不是指排他性 的 “或”。 例如,以下任何一种情况均满足条件 A 或 B :A 是真的 ( 或存在的 ) 且 B 是 假的 ( 或不存在的 )、A 是假的 ( 或不存在的 ) 且 B 是真的 ( 或存在的 )、以及 A 和 B 都 是真的 ( 或存在的 )。
     同样,涉及元素或组分例证 ( 即出现 ) 次数的位于本发明元素或组分前的不定冠 词 “一个” 或 “一种” 旨在是非限制性的。 因此,应将 “一个” 或 “一种” 理解为包 括一个或至少一个,并且元素或组分的词语单数形式也包括复数形式,除非有数字明显 表示单数。
     如本文所用,术语 “发明” 或 “本发明” 是非限制性的术语,并且不旨在指 本方面的任何单个实施方案,而是涵盖如说明书和权利要求中所述的所有可能的实施方 案。
     如本文所用,修饰本发明使用的成分或反应物的量的术语 “约” 是指可以通过 例如以下方式而发生的用数字表示的量的变化 :在真实世界中用于制备浓缩物或使用溶 液的一般测量和液体处理操作 ;这些操作中非故意的误差 ;用于制备组合物或执行方法 的成分的制造、来源或纯度中的差异 ;等等。 术语 “约” 还包括由于对于起因于特定起
     始混合物的组合物的不同平衡条件而不同的量。 无论是否通过术语 “约” 来修饰,权利 要求包括量的等同量。 在一个实施方案中,术语 “约”指在报告数值的 10%范围内,优 选地在报告数值的 5%范围内。
     如本文所用,术语 “丁醇” 指 1- 丁醇、2- 丁醇、异丁醇、或它们的混合物。
     术语 “丁醇生物合成途径” 指制备 1- 丁醇、2- 丁醇、或异丁醇的酶途径。
     术语 “1- 丁醇生物合成途径” 指从乙酰 - 辅酶 A( 乙酰 -CoA) 中制备 1- 丁醇 的酶途径。
     术语 “2- 丁醇生物合成途径” 指从丙酮酸中制备 2- 丁醇的酶途径。
     术语 “异丁醇生物合成途径” 指从丙酮酸中制备异丁醇的酶途径。
     术语 “兼性厌氧菌” 指既能在有氧环境下生长又能在无氧环境下生长的微生 物。
     术语 “碳底物” 或 “可发酵碳底物” 指能够被本发明的宿主生物体代谢的碳 源,并且特别是选自由下列的碳源 :单糖、低聚糖、多糖和一碳底物或它们的混合物。
     术语 “基因” 指能够被表达为特定蛋白质的核酸片段,其任选包括编码序列前 的调节序列 (5′非编码序列 ) 和编码序列后的调节序列 (3′非编码序列 )。 “天然基因” 是指天然存在的具有其自己的调控序列的基因。 “嵌合基因” 是指不是天然基因的任何 基因,包含在天然情况下不是一起存在的调控序列和编码序列。 因此,嵌合基因可包括 源于不同来源的调控序列和编码序列,或者包括源于同一来源但以不同于天然存在的方 式排列的调控序列和编码序列。 “内源性基因” 指位于生物基因组内它的天然位置的天 然基因。 “外源” 或 “异源” 基因指通常不存在于宿主生物中的基因,它通过基因转 移导入宿主生物。 外来基因可以包含插入到非天然生物体内的天然基因,或嵌合基因。 “转基因” 是已通过转化方法导入基因组内的基因。 如本文所用的, “分离的核酸片段” 或 “分离的核酸分子” 将可互换使用,并 且将指单链或双链的,任选含有合成的、非天然的或改变了的核苷酸碱基的 RNA 或 DNA 聚合物。 DNA 聚合物形式的分离的核酸片段可由 cDNA、基因组 DNA 或合成 DNA 的一 个或多个片段构成。
     当在合适的温度和溶液离子强度条件下单链形式的核酸片段可以退火至另一核 酸片段时,核酸片段 “可杂交” 至另一核酸片段,例如 cDNA、基因组 DNA 或 RNA 分 子。 杂交条件和洗涤条件是众所周知的,并在 Sambrook,J.,Fritsch,E.F. 和 Maniatis, T.Molecular Cloning :A Laboratory Manual,第 2 版,Cold Spring Harbor Laboratory :Cold Spring Harbor, NY(1989) 中有举例说明,尤其是其中的第 11 章和表 11.1( 将其全部内容 以引用的方式并入本文 )。 温度和离子强度条件确定了杂交的 “严格性”。 可以调节严 格性条件以筛选中度相似的片段 ( 例如来自远缘生物的同源序列 ),到筛选高度相似的片 段 ( 例如从近缘生物复制功能性酶的基因 )。 杂交后的洗涤确定严格性条件。 一组优选 的条件采用一系列如下洗涤 :开始采用 6X SSC、0.5% SDS 在室温下持续洗涤 15 分钟, 然后再使用 2X SSC、0.5% SDS 在 45℃下洗涤 30 分钟,最后使用 0.2X SSC、0.5% SDS 在 50℃下重复洗涤 30 分钟两次。 更优选的一组严格性条件采用更高的温度,其中洗涤与 上述洗涤相同,不同的是最后两次在 0.2X SSC、0.5% SDS 中洗涤 30 分钟时的温度被增 加到 60℃。 另一组优选的高严格性条件是最后两次洗涤是在 65℃下用 0.1X SSC、0.1%
     SDS 进行。 例如,另一组严格性条件包括在 0.1X SSC、0.1% SDS 中于 65℃下杂交,并 用 2X SSC、0.1% SDS 洗涤,随后用 0.1X SSC、0.1% SDS 洗涤。
     杂交需要两种核酸含有互补序列,但是取决于杂交的严格性,碱基之间可能会 发生错配。 用于使核酸杂交的合适严格性取决于核酸的长度和互补的程度,所述长度 和互补程度是本领域内所熟知的变量。 两条核苷酸序列之间的相似性或同源性程度越 高,具有那些序列的核酸的杂交体的 Tm 值就越大。 核酸杂交的相对稳定性 ( 对应较高 的 Tm) 按以下顺序依次降低 :RNA:RNA、 DNA:RNA、 DNA:DNA。 对于长度超过 100 个核苷酸的杂交体,已经推导出了用于计算 Tm 的公式 ( 请参见 Sambrook 等人,同上, 9.50-9.51)。 对于较短核酸 ( 即寡核苷酸 ) 的杂交,错配的位置变得更重要,而且寡核 苷酸的长度决定了其特异性 ( 参见 Sambrook 等人,同上, 11.7-11.8)。 在一个实施方案 中,可杂交核酸的长度为至少约 10 个核苷酸。 优选地,可杂交核酸的最小长度为至少约 15 个核苷酸 ;更优选至少约 20 个核苷酸 ;并且最优选地,长度为至少约 30 个核苷酸。 此外,技术人员将认识到,可根据需要根据诸如探针长度之类的因素来调节温度和洗涤 溶液盐浓度。
     术语 “互补的” 用于描述核苷酸碱基之间能够彼此杂交的关系。 例如,对于 DNA,腺嘌呤与胸腺嘧啶互补,而胞嘧啶与鸟嘌呤互补。 如本领域所熟知的,术语 “百分比同一性” 是两条或更多条多肽序列之间或两 条或更多条多核苷酸序列之间的关系,该关系通过对序列进行比较确定。 在本领域中, “同一性” 还表示多肽或多核苷酸序列之间序列关联的程度,根据具体情况,它由这些 序列的序列串之间的匹配程度确定。 “同一性” 和 “相似性” 可容易地通过已知方法计 算出来,所述的方法包括但不限于以下文献中所描述的那些 :1.)Computational Molecular Biology(Lesk, A.M. 编辑 )Oxford University :NY(1988) ;2.)Biocomputing :Informatics and Genome Projects(Smith, D.W. 编 辑 )Academic :NY(1993) ;3.)Computer Analysis of Sequence Data, Part I(Griffin, A.M. 和 Griffin, H.G. 编辑 )Humania :NJ(1994) ;4.) Sequence Analysis in Molecular Biology(von Heinje, G. 编 辑 )Academic(1987) ; 和 5.) Sequence Analysis Primer(Gribskov, M. 和 Devereux, J. 编辑 )Stockton :NY(1991)。
     设定确定同一性的优选方法来用于给出待测试序列之间的最佳匹配。 确定同 一性和相似性的方法在可公开获得的计算机程序中编成了代码。 序列比对和同一性 百分比计算可以用 LASERGENE 生物信息学计算软件包 (LASERGENE bioinformatics computing suite(DNASTAR Inc., Madison, WI)) 中 的 MegAlignTM 程 序 进 行。 序 列的多重比对采用包括几种改变形式的算法在内的 “Clustal 比对方法” 进行,包括 “Clustal V 比对方法”,该方法相当于称为 Clustal V( 在 Higgins 和 Sharp, CABIOS.5 : 151-153(1989) ;Higgins, D.G. 等人, Comput.Appl.Biosci.,8 :189-191(1992)),并且 可以在 LASERGENE 生物信息学计算软件包 (DNASTAR Inc.) 中的 MegAlignTM 程序中 找到的比对方法。 对于多重比对,默认值对应于缺口罚分 (GAP PENALTY) = 10 和缺 口长度罚分 (GAP LENGTH PENALTY) = 10。 用 Clustal 方法进行成对比对和蛋白质 序列的百分比同一性计算的默认参数为 KTUPLE = 1、缺口罚分= 3、窗口 (WINDOW) = 5 和 DIAGONALS SAVED = 5。 对于核酸,这些参数为 KTUPLE = 2,缺口罚分= 5,窗口= 4 和 DIAGONALS SAVED = 4。 在用 Clustal V 程序进行序列比对后,有可能
     通过观察相同程序中的 “序列距离” 表来获得 “百分比同一性”。 此外,也可以使用 “Clustal W 比对方法”,该方法相当于称为 Clustal W( 在 Higgins 和 Sharp,CABIOS.5 : 151-153(1989) ;Higgins, D.G. 等人, Comput.Appl.Biosci.8 :189-191(1992) 中有所描 述 ) 和可以在 LASERGENE 生物信息学计算软件包 (DNASTAR Inc.) 中的 MegAlignTM v6.1 程序中找到的比对方法。 用于多重比对的默认参数 ( 缺口罚分= 10、缺口长度罚分 = 0.2、延迟发散序列 (Delay Divergen Seqs)(% ) = 30、 DNA 转换权重 (DNA Transition Weight) = 0.5、蛋白质权重矩阵 (Protein Weight Matrix) = Gonnet 系列和 DNA 权重矩阵 (DNAWeight Matrix) = IUB)。 在使用 Clustal W 程序对序列进行比对之后,可通过查看 同一程序中的 “序列距离” 表来获得 “百分比同一性”。
     本领域的技术人员非常清楚,多种程度的序列同一性可用于从其他物种中鉴定 多肽,其中这类多肽具有相同或相似的功能或活性。 可用的同一性百分比的实例包括但 不限于 :70%、75%、80%、85%、90%、或 95%、或者从 70%至 100%的任何整数百 分比都可用于描述本发明,例如 70%、71%、72%、73%、74%、75%、76%、77%、 78 %、79 %、80 %、81 %、82 %、83 %、84 %、85 %、86 %、87 %、88 %、89 %、 90%、91%、92%、93%、94%、95%、96%、97%、98%或 99%。 合适的核酸片段编 码具有以上同一性并且通常编码具有至少约 250 个氨基酸,优选至少 300 个氨基酸,并且 最优选至少约 348 个氨基酸的多肽。
     术语 “序列分析软件” 指可用于分析核苷酸或氨基酸序列的任何计算机算法 或软件程序。 “序列分析软件” 可商购获得或独立开发。 典型的序列分析软件包括但 不 限 于 :1.)GCG 程 序 包 (Wisconsin Package 9.0 版, Genetics Computer Group(GCG), Madison , WI ) ;2 . ) BLASTP 、 BLASTN 、 BLASTX ( Altschul 等 人, J.Biol. , 215 :403-410(1990)) ;3.)DNASTAR(DNASTAR 有 限 公 司, Madison, WI) ;4.) Sequencher(Gene Codes Corporation, Ann Arbor, MI) ;和 5.) 整合了 Smith-Waterman 算 法的 FASTA 程序 (W.R.Pearson,Comput.Methods Genome Res.,[Proc.Int.Symp.](1994), 公开时间 :1992,111-20. 编辑 :Suhai, Sandor.Plenum :New York, NY)。 在本专利申 请的上下文中应当理解,使用序列分析软件进行分析时,除非另外指明,否则分析结果 将基于所参考程序的 “默认值”。 在此所用的 “默认值” 将指在首次初始化软件时软件 最初加载的任何值或参数集。
     氨基酸或核苷酸序列的 “基本部分” 指这样的部分,该部分包括的多肽的氨 基酸序列或基因的核苷酸序列足以推定鉴定所述多肽或基因,所述鉴定或者可以由本领 域技术人员通过人工评价序列来完成,或者可以利用诸如 BLAST(Altschul, S.F. 等人, J.Mol.Bio.,215 :403-410(1993)) 之类的算法通过计算机自动化序列比较和鉴定来完 成。 一般来讲,为了推测鉴定多肽或核酸序列是否与已知的蛋白质或基因同源,需要有 10 个或更多邻接氨基酸或者 30 个或更多核苷酸的序列。 此外,对于核苷酸序列,包含 20-30 个邻接核苷酸的基因特异性寡核苷酸探针可用于序列依赖性的基因鉴定 ( 如 DNA 杂交 ) 和基因分离 ( 如细菌菌落或噬斑的原位杂交 ) 的方法中。 此外,12-15 个碱基的短 寡核苷酸可在 PCR 中用作扩增引物,以便获得包含该引物的特定核酸片段。 因此,核苷 酸序列的 “基本部分” 所包含的序列应足以特异性地鉴定和 / 或分离包含该序列的核酸 片段。 本说明书教导了编码特定醇脱氢酶蛋白的完整的氨基酸和核苷酸序列。 利用本文所公开的序列,技术人员现在可以利用本发明所公开序列的全部或基本部分,以用于本 领域技术人员已知的目的。 因此,本发明包括如随附的序列表中所示的完整序列,以及 如上文定义的这些序列的基本部分。
     本发明涵盖的不仅仅是具体的示例性序列,因为本领域熟知的是 :不影响编码 蛋白的功能特性的氨基酸序列或编码区中的改变 ( 其中一个化学上等同的氨基酸在给定 位点上被取代 ) 是常见的。 为了本发明的目的,取代定义为在下述 5 组之一内的交换 :
     1. 小的脂族非极性残基或微极性的残基 :Ala、 Ser、 Thr(Pro、 Gly) ;
     2. 极性的、带负电荷的残基和它们的酰胺 :Asp、 Asn、 Glu、 Gln ;
     3. 极性的、带正电荷的残基 :His、 Arg、 Lys ;
     4. 大的脂族非极性残基 :Met、 Leu、 Ile、 Val(Cys) ;以及
     5. 大的芳族残基 :Phe、 Tyr、 Trp。
     因此,关于氨基酸丙氨酸 - 一种疏水性氨基酸的密码子可以被编码另一个疏水 性更弱的残基 ( 例如甘氨酸 ) 或疏水性更强的残基 ( 例如缬氨酸、亮氨酸或异亮氨酸 ) 取 代。 类似地,导致用一个带负电荷的残基替换另一个带负电荷的残基 ( 例如天冬氨酸替 代谷氨酸 ) 或者一个带正电荷的残基替换另一个带正电荷的残基 ( 例如赖氨酸替换精氨 酸 ) 的改变也可以预期产生功能上等价的产物。 在许多情况下,导致蛋白质分子的 N- 末 端和 C- 末端部分改变的核苷酸变化也预期不改变蛋白质的活性。 因此本发明涵盖具有所 述密码子变异的编码区和具有所述氨基酸变异的蛋白。 如本文所用,术语 “编码序列” 或 “CDS” 是指编码特定氨基酸序列的 DNA 序列。 “合适的调控序列” 指位于编码序列的上游 (5′非编码序列 )、中间或下游 (3′ 非编码序列 ) 的核苷酸序列,其可影响转录、 RNA 加工或稳定性,或者相关编码序列的 翻译。 调节序列可包括启动子、翻译前导序列、内含子、多腺苷酸化识别序列、RNA 加 工位点、效应子结合位点和茎环结构。
     术语 “启动子”指能够控制编码序列或功能性 RNA 表达的 DNA 序列。 一般来 讲,编码序列位于启动子序列的 3′端。启动子可整个源于天然基因,或者由源于不同的 天然存在的启动子的不同元件组成,或者甚至包含合成的 DNA 片段。 本领域内的技术人 员应当理解,不同的启动子可以在不同的组织或细胞类型中,或者在不同的发育阶段, 或者响应不同的环境条件或生理条件而引导基因的表达。 导致基因在大部分时间内在大 多数细胞类型中表达的启动子通常称为 “组成型启动子”。 还应当进一步认识到,由于 在大多数情况下调节序列的确切边界尚未完全确定,因此不同长度的 DNA 片段可能具有 相同的启动子活性。
     术语 “可操作地连接” 指单个核酸片段上的核酸序列的关联,使得其中一个核 酸序列的功能受到另一个核酸序列的影响。 例如,当启动子能够影响编码序列的表达 ( 即,该编码序列受到该启动子的转录控制 ) 时,则该启动子与该编码序列可操作地连 接。 编码序列可以以有义或反义的取向可操作地连接至调节序列。
     如本文所用,术语 “表达” 指源于本发明核酸片段的有义 RNA(mRNA) 或反义 RNA 的转录和稳定积聚。 表达也可指将 mRNA 翻译成多肽。
     如本文所用,术语 “转化” 指将核酸片段转移至宿主生物体内,导致在基因上 稳定遗传。 含有转化核酸片段的宿主生物被称为 “转基因” 或 “重组” 或 “转化” 生
     物体。 术语 “质粒” 和 “载体” 指通常携带有不属于细胞中心代谢的部分的基因的染 色体外元件,并且常常是环状双链 DNA 片段的形式。 这类元件可为源自任何来源的自主 复制序列、基因组整合序列、噬菌体或单链或双链 DNA 或 RNA 的核苷酸序列 ( 线性或 环状 ),其中多个核苷酸序列已连接或重组进入一种独特构建体中,该独特构建体能够将 所选基因产物的启动子片段和 DNA 序列与相应的 3′末端非翻译序列一起引入细胞中。 “转化载体” 指含有外来基因并且除了该外来基因外还含有有利于转化特定宿主细胞转 化的元件的特定载体。
     如本文所用,术语 “密码子简并性” 指允许核苷酸序列在不影响所编码的多肽 的氨基酸序列的情况下发生变化的遗传密码的性质。 技术人员非常了解具体宿主细胞在 使用核苷酸密码子确定给定氨基酸时所表现出的 “密码子偏好性”。 因此,当合成基因 用以改善在宿主细胞中的表达时,希望对基因进行设计,使得其密码子使用频率接近该 宿主细胞优选的密码子使用频率。
     术语 “经密码子优化的” 在其涉及用于转化不同宿主的核酸分子的基因或编码 区时是指在不改变由 DNA 编码的多肽的情况下,改变核酸分子的基因或编码区中的密码 子以反映宿主生物体通常的密码子使用。
    本文使用的标准重组 DNA 和分子克隆技术是本领域熟知的并且已经在如下文 献 中 有 所 描 述 :Sambrook, J., Fritsch, E.F. 和 Maniatis, T. 的 Molecular Cloning :A Laboratory Manual,第二版, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY(1989)( 下 文 称 为 “Maniatis” ) ;以 及 Silhavy, T.J., Bennan, M.L. 和 Enquist, L.W., Experiments with Gene Fusions, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY(1984) ;以及 Ausubel, F.M. 等人, Current Protocols in Molecular Biology, Greene Publishing Assoc.and Wiley-Interscience (1987)。该处使用的附加方法是在 Methods in Enzymology,第 194 卷,Guide to Yeast Genetics and Molecular and Cell Biology(Part A, 2004, Christine Guthrie 和 Gerald R.Fink( 编辑 ), Elsevier Academic Press, San Diego, CA) 中的方法。
     木糖氧化无色杆菌的丁醇脱氢酶活性
     通过在包含 1- 丁醇的培养基上的连续培养富集环境污泥样本,申请人能分离能 够利用 1- 丁醇作唯一碳源的微生物。 一种分离蛋白通过其 16S rRNA 序列鉴定为属于菌 种木糖氧化无色杆菌。 申请人发现该分离蛋白有丁醇脱氢酶活性,它可相互转化丁醛和 1- 丁醇。申请人也发现该丁醇脱氢酶活性也催化异丁醛和异丁醇、以及 2- 丁酮和 2- 丁醇 的相互转化。 令人惊讶地是,该酶对替代底物的动力学常数与对用于富集培养基的 1- 丁 醇底物的动力学常数相当或比其更高。 这些结果指示可使用该木糖氧化无色杆菌丁醇脱 氢酶在分别具有丁醛、异丁醛或 2- 丁酮底物来源的重组微生物宿主细胞中生产 1- 丁醇、 异丁醇、或 2- 丁醇。
     丁醇脱氢酶蛋白和编码序列
     在木糖氧化无色杆菌中鉴定的核苷酸序列编码具有丁醇脱氢酶活性 ( 称为 sadB) 的酶,该序列如 SEQ ID NO :1 所示。 全长蛋白的氨基酸序列如 SEQ ID NO :2 所示。 该氨基酸序列与公开数据库中的序列的比较结果揭示该蛋白具有与已知醇脱氢酶的令人
     惊讶的低相似性。 使用具有计分矩阵 BLOSUM62 的 BLAST,期望临界值 (cutoff) 为 10 并且定序列长度 (word size) 为 3,测得最相似的已知序列与 SEQ ID NO :2 在其长度 为 348 个氨基酸的部分上具有 67%的同一性。 使用的空位开放罚分为 11,空位延伸为 1。 发现与脑膜炎奈瑟氏球菌 (Neisseria meningitidis)MC58(Accession#AAF41759.1) 含锌 醇脱氢酶的最高相似度为 67 %的氨基酸同一性,与无乳支原体 (Mycoplasma agalactiae) (Accession#A5IY63) 含锌醇脱氢酶的最高相似度为 67%的氨基酸同一性。 其氨基酸序列 与木糖氧化无色杆菌丁醇脱氢酶的序列 (SEQ ID NO :2) 具有大于 67%的同一性的蛋白 是本发明的蛋白,它在本文中被鉴定并分离。 本发明蛋白的氨基酸序列与 SEQ ID NO : 2 具有至少约 70% -75%,约 75% -80%,约 80% -85%,或者约 85% -90%的同一性, 其中更优选约 90% -95%的同一性。 最优选的氨基酸序列与 SEQ ID NO :2 具有至少约 95%的同一性。
     使用 BLAST 默认参数与公开序列进行比较时,编码木糖氧化无色杆菌丁醇 脱 氢 酶 的 核 酸 序 列 (SEQ ID NO :1) 与 编 码 脑 膜 炎 奈 瑟 氏 球 菌 MC58 含 锌 醇 脱 氢 酶 (Accession#NC003112) 的序列具有最高的同一性 ( 约 65% )。 本发明的核酸分子是那些 能够编码至少约 250 个氨基酸并且具有丁醇脱氢酶活性的多肽,它具有与 SEQ ID NO : 2 至少约 70%的同一性。 核酸分子可编码至少约 300 个氨基酸或者约 348 个氨基酸的多 肽。核酸分子可编码与 SEQ ID NO :2 具有至少约 75% -80%、80% -85%、85% -90%、 90% -95%、或 95% -100%的同一性的多肽。 本发明的附加核酸分子可通过与编码丁醇脱氢酶的 SEQ ID NO :2 的核酸分子 在以下条件下杂交进行鉴定 :0.1X SSC,0.1% SDS,65℃并且用 2X SSC,0.1% SDS 洗 涤,随后用 0.1X SSC,0.1% SDS 洗涤。 在本发明的方面中附加地包括与任何上述核酸分 子互补的核酸分子。 最合适的是编码 SEQ ID NO :2 的多肽的核酸分子,其实例是 SEQ ID NO :1 和 3。 由于遗传密码的简并性,多个核酸序列可编码 SEQ ID NO :2 的多肽, 这是本领域的技术人员熟知的。 例如编码序列可经密码子优化用于在特定宿主中的最大 化表达,如序列经密码子经优化以在啤酒糖酵母中表达,即 SEQ ID NO :3。
     同源物的分离
     编码木糖氧化无色杆菌丁醇脱氢酶的核酸分子,例如 SEQ ID NO :1 可用于分离 编码同源蛋白的核酸分子,所述核酸分子与来自相同或其他微生物菌种的这种核酸片段 具有至少 70% -75%、75% -80%、80% -85%、85% -90%、90% -95%、或 95% -100% 的序列同一性。 可如下评估编码的同源蛋白的丁醇脱氢酶活性。 使用序列依赖性规程分 离同源物是本领域熟知的。 序列依赖型规程的实例包括但不限于核酸杂交方法、DNA 和 RNA 扩增方法例如核酸扩增技术的多种应用 ( 例如聚合酶链反应 (PCR), Mullis 等人, 美国专利公开 4,683,202 ;连接酶链反应 (LCR),Tabor,S. 等人,Proc.Natl.Acad.Sci.USA 82,1074, (1985 ;或链置换扩增反应 (SDA), Walker 等人, Proc.Natl.Acad.Sci.U.S.A., 89 :392, (1992))。
     例如,本发明的核酸片段可通过使用所有或部分 SEQ ID NO :1 的核酸片段作 为 DNA 杂交探针,使用本领域的技术人员熟知的方法来筛选来自任何所需细菌的文库而 得以直接分离。 基于 SEQ ID NO :1 的特异性,寡核苷酸探针可通过本领域已知的方法 (Maniatis,同上 ) 设计和合成。 此外序列可直接用于通过熟练技术人员已知的方法,例
     如随机引物 DNA 标记、切口平移或末端标记技术,来合成 DNA 探针,或使用可获得的 体外转录体系来合成 RNA 探针。 此外,能设计特异性引物并用于扩增 SEQ ID NO :1 同源物的部分或全长。 所得的扩增产物可在扩增反应过程中直接标记或在扩增反应后标 记,并用作探针以在合适的严格条件下分离全长的 DNA 片段。
     通常在 PCR 类型的扩增技术中,引物具有不同的序列而且彼此之间不互补。 取决于期望的检测条件,应当设计引物序列以提供既有效又可靠的靶核酸的复制。 PCR 引物设计方法是常见的,并且是本领域熟知的。 (Thein 和 Wallace, “The use of oligonucleotide as specific hybridization probes in the Diagnosis of Genetic Disorders”, Human Genetic Diseases :APractical Approach, K.E.Davis 编辑 (1986) 第 33-50 页, IRL Press, Herndon, Virginia) ;Rychlik, W.(1993), White, B.A.( 编 辑 ), Methods in Molecular Biology,第 15 卷第 31-39 页,PCR Protocols :Current Methods and Applications. Humania Press, Inc., Totowa, NJ。 )
     通常可使用本发明核酸序列的两个短片段设计引物用于聚合酶链反应规程以扩 增较长的核酸片段,该核酸片段编码来自 DNA 或 RNA 的同源编码区。可使用包含与 SEQ ID NO :1 同源的核酸序列的任何 DNA 作模板进行 PCR,包括例如用基因组 DNA、cDNA 或质粒 DNA 作模板。 当使用克隆 cDNA 的文库时,一个引物的序列来源于 SEQ ID NO : 1,并且其他引物的序列利用在编码微生物基因的 mRNA 前体的 3′末端存在的多腺苷酸 片。 作为另一种选择,第二个引物序列可以基于来源于克隆载体的序列。 例如技术人员 可按照 RACE 规程,使用 mRNA 作模板 (Frohman 等人, Proc.Natl.Acad.Sci.USA,85 : 8998(1988)),通过用 PCR 扩增在转录物内单个位点与 3′或 5′端之间的区域的拷贝来 产生 cDNA。 以 3′和 5′方向取向的引物可用本发明的核酸序列设计。 使用可商购获 得的 3′ RACE 或 5′ RACE 体系 (Life Technologies,Rockville,MD),可以分离特异性 的 3′或 5′ cDNA 片段 (Ohara 等人, Proc.Natl.Acad.Sci.USA 86 :5673(1989) ;Loh 等 人, Science 243 :217(1989))。
     作为另外一种选择,可使用 SEQ ID NO :1 的核酸分子或其互补序列作为杂交试 剂用于同源物的鉴定。 核酸杂交试验的基本组成包括探针、怀疑含有目的基因或基因片 段的样本及特定的杂交方法。 本发明的探针通常是与待检测的核酸序列互补的单链核酸 序列。 探针与待检测的核酸序列是 “可杂交的”。 探针长度可从 5 个碱基至数万个碱基 不等,这将取决于具体待完成的测试。 通常约 15 个碱基至约 30 个碱基的探针长度是合 适的。 只需要探针分子的部分与待检测的核酸序列互补。 另外,探针和靶序列之间不需 要完全互补。 杂交确实可以在并不完全互补的分子之间发生,结果是杂交区内的一定比 率的碱基未与适当的互补碱基配对。
     杂交方法是有严格规定的。 通常探针和样本必须在允许核酸杂交的条件下混 合。 这涉及在适当浓度和温度条件下在存在无机或有机盐时使探针和样品接触。 探针和 样品核酸必须接触足够长的时间,使探针和样品核酸之间的任何可能的杂交均可发生。 混合物中的探针或标记的浓度将决定杂交发生所需的时间。 探针或靶标的浓度越高,所 需的杂交孵育时间就越短。 任选地,可以加入离液剂。 离液剂通过抑制核酸酶活性来 稳定核酸。 此外,离液剂允许短寡核苷酸探针在室温下的敏感和严格杂交 (Van Ness 和 Chen, Nucl.Acids Res.19 :5143-5151(1991))。 合适的离液剂包括氯化胍、硫氰酸胍、硫氰酸钠、四氯乙酸锂、高氯酸钠、四氯乙酸铷、碘化钾和三氟乙酸铯等。 通常,离液 剂的终浓度将为约 3M。 如果需要,可以将甲酰胺加入到杂交混合物中,通常为 30-50% (v/v)。
     可以采用多种杂交溶液。 通常,这些杂交溶液包含约 20 %至 60 %体积,优 选 30 %体积的极性有机溶剂。 通常的杂交溶液采用约 30-50 % v/v 甲酰胺、约 0.15 至 1M 氯化钠、约 0.05 至 0.1M 缓冲液 ( 如柠檬酸钠、 Tris-HCl、 PIPES 或 HEPES(pH 范 围 约 6-9))、 约 0.05 至 0.2 % 的 去 污 剂 ( 如 十 二 烷 基 硫 酸 钠 ) 或 0.5-20mM 的 EDTA、 FICOLL(Pharmacia Inc.)( 约 300-500 千 道 尔 顿 (kD))、 聚 乙 烯 吡 咯 烷 酮 ( 约 250-500kD)、和血清白蛋白。 一般的杂交溶液还将包含约 0.1 至 5mg/mL 未经标记的载 体核酸、片段化的核酸 DNA( 如小牛胸腺或鲑精 DNA 或酵母 RNA),以及任选约 0.5%至 2%重量 / 体积的甘氨酸。 还可以包含其他添加剂,例如包括多种极性水溶性或可膨胀试 剂如聚乙二醇、阴离子聚合物如聚丙烯酸酯或聚甲基丙烯酸酯和阴离子糖类聚合物如硫 酸葡聚糖在内的体积排阻剂。
     核酸杂交可适用于多种测定形式。 最合适的形式之一是夹心测定形式。 夹心测 定尤其适用于在非变性条件下杂交。 夹心型测定的主要成分是固体支持体。 固体支持 体具有吸附或共价连接至其上的固定核酸探针,该探针未经标记并且与序列的一部分互 补。
     此外,因为微生物基因组序列迅速变成公开可获得的,可单独使用生物信息学 方法鉴定同源物,这是本领域技术人员熟知的。
     丁醇脱氢酶活性
     本发明的蛋白与 SEQ ID NO :2 具有至少约 70%或更高的氨基酸同一性,并且 具有丁醇脱氢酶活性。 本发明的核酸分子编码与 SEQ ID NO :2 具有至少约 70%或更高 的氨基酸同一性并具有丁醇脱氢酶活性的蛋白。 本领域的技术人员能够容易地评估蛋白 中的丁醇脱氢酶活性。 如下所述在微生物细胞中表达蛋白,并且测定细胞提取物、粗制 酶制剂、或者纯化酶制剂中的丁醇脱氢酶活性。 例如如本文实施例 1 所述测定纯化酶和 粗制酶制剂。 1- 丁醇脱氢酶活性的检测分析法用分光光度计在 340nm 监控 NADH 氧化成 NAD+ 的情况,该检测法在 35℃下,使用在包含 50mM 丁醛和 0.2mM NADH 的 50mM 磷 酸钾缓冲液中 (pH6.2) 的合适量的酶。 具有醇底物的替代检测分析法在 35℃下,在 pH8.5 的包含 3mM NAD+ 和不同浓度醇的 TRIS 缓冲液中进行,或者具有酮或醛底物的检测分析 法在 35℃下,在 pH6.0 的包含 200μm NADH 和不同浓度的酮或醛的 50mM MES 缓冲液 中进行。 通过这些或其他可容易地执行的检测分析法,将丁醇脱氢酶功能与由分离的核 酸分子编码的鉴定蛋白的结构相关联,两种均具有经鉴定的序列。
     重组表达
     本发明的核酸片段可在微生物宿主细胞中表达,如在细菌、蓝细菌、丝状真菌 和酵母中表达,导致表达编码的丁醇脱氢酶。 宿主菌株的实例包括但不限于梭菌属、 发酵单胞菌属、埃希氏菌属、沙门氏菌属、红球菌属、假单胞菌属、芽孢杆菌属、乳酸 杆菌属、肠球菌属、片球菌属、产碱杆菌属、克雷白氏杆菌属、类芽胞杆菌属、节杆菌 属、棒状杆菌属、短杆菌属、假丝酵母属、汉逊酵母属、克鲁维酵母属和糖酵母属。
     含有引导外来蛋白质高水平表达的调控序列的微生物表达系统和表达载体是本领域技术人员熟知的。 可使用任何这些系统和载体来构建嵌合基因,用于生产本发明的 核酸分子编码的蛋白。 然后可以将这些嵌合基因通过转化导入合适的微生物中以提供酶 的高水平表达。
     可用于转化多种宿主细胞的载体是常见的并且可以从一些公司商购获得,例如 (Madison,WI)、Invitrogen Corp.(Carlsbad,CA)、Stratagene(LaJolla, CA) 和 New England Biolabs,Inc.(Beverly,MA)。 使用大肠杆菌 - 酵母穿梭载体克隆嵌 合基因用于酵母表达。 通常载体含有选择标记和允许在期望宿主中自主复制或染色体整 合的序列。 此外,合适的载体可包含启动子区域,该区域包含转录启动控制和转录终止 控制区,在它们之间可插入编码区 DNA 片段以提供插入编码区的表达。 这两种控制区均 可来源于与转化的宿主细胞同源的基因,但是应当理解,这种控制区也可能来源于对被 选择作生产宿主的特定物种来说是非天然的基因。
     可用于驱动本发明丁醇脱氢酶编码区在所需宿主细胞中表达的起始控制区或启 动子有很多,并且是本领域技术人员熟悉的。 合适的启动子包括但不限于来源于以下基 因的启动子 :CYC1、HIS3、GAL1、GAL10、ADH1、PGK、PHO5、GAPDH、ADC1、 TRP1、 URA3、 LEU2、 ENO、 TPI、 CUP1、 FBA、 GPD、和 GPM( 用于在糖酵母属中表 达 ) ;AOX1( 可用于在毕赤酵母菌属中的表达 ) ;以及 lac、 ara、 tet、 trp、 lPL、 lPR、 T7、tac、和 trc 启动子 ( 用于在大肠杆菌、产碱杆菌、和假单胞菌中表达 ) ;amy、apr、 和 npr 启动子、以及用于在枯草芽孢杆菌、地衣芽孢杆菌、和浸麻类芽孢杆菌中表达的多 种噬菌体启动子 ;nisA( 用于在革兰氏阳性细菌中表达,Eichenbaum 等人,Appl.Environ. Microbiol.64(8) :2763-2769(1998)) ;和 合 成 P11 启 动 子 ( 用 于 在 植 物 乳 杆 菌 中 表 达 (Rud 等人, Microbiology 152 :1011-1019(2006))。 终止控制区也可以源于对优选宿主 天然的多种基因。 任选地,终止位点可为非必需的 ;然而,如果包括则是最优选的。
     某些载体能够在广泛的宿主细菌中复制并可通过接合进行转移。 pRK404 和三 个相关载体 :pRK437、 pRK442、和 pRK442(H) 的完全注解序列是可用的。 这些衍生 物已被证明是在革兰氏阴性菌中进行遗传操纵的有用工具 (Scott 等人, Plasmid 50(1) : 74-79(2003))。 也可获得广宿主范围的 Inc P4 质粒 RSF1010 的几种衍生质粒,其具有在 一系列革兰氏阴性菌中发挥功能的启动子。 质粒 pAYC36 和 pAYC37 具有连同多个克隆 位点一起的活性启动子,使得在革兰氏阴性菌中的异源基因能够表达。
     适 于 革 兰 氏 阳 性 细 菌 的 载 体 的 一 些 实 例 包 括 pAM β1 及 其 衍 生 物 (Renault 等 人, Gene 183 :175-182(1996) ; 和 O’ Sullivan 等 人, Gene137 : 227-231(1993)) ;pMBB1 和 pHW800, pMBB1 的 衍 生 物 (Wyckoff 等 人, Appl. Environ.Microbiol.62 :1481-1486(1996)) ;pMG1, 接 合 质 粒 (Tanimoto 等 人, J.Bacteriol. 184 :5800-5804(2002)) ;pNZ 9520( Kleerebezem 等 人, Appl.Environ. Microbiol.63 :4581-4584(1997)) ;pAM401(Fujimoto 等人, Appl.Environ.Microbiol.67 : 1262-1267(2001)) ; 和 pAT392(Arthur 等 人, Antimicrob.AgentsChemother.38 : 1899-1903(1994))。 也已经报道了几种来源于植物乳杆菌的质粒 (van Kranenburg 等人, Appl.Environ.Microbiol.71(3) :1223-1230(2005))。
     用于酵母中基因表达的方法是本领域已知的 ( 参见例如 Enzymology, Volume 194, Guide to Yeast Genetics and Molecular and Cell Biology, PartA,2004, ChristineGuthrie 和 Gerald R.Fink( 编辑 ), Elsevier Academic Press, San Diego, CA 中的方法 )。 酵母中通常使用的质粒是穿梭载体 pRS423、 pRS424、 pRS425、和 pRS426( 美国典型培 养物保藏中心, Rockville, MD),它们包含大肠杆菌复制起点 ( 例如 pMB1)、酵母 2μ 复制起点、和营养选择标记。 这四个载体的选择标记是 His3( 载体 pRS423)、Trp1( 载体 pRS424)、 Leu2( 载体 pRS425) 和 Ura3( 载体 pRS426)。 用编码本发明丁醇脱氢酶的嵌 合基因构建表达载体可通过在大肠杆菌中的标准分子克隆技术或通过在酵母中的空隙修 复重组方法进行。 这些载体可以在大肠杆菌和酵母菌株中繁殖。
     本发明的嵌合基因可从稳定复制的质粒中表达,或者可被整合进宿主基因组 中。 用于 DNA 整合的质粒可包括转座子、与在宿主基因组中的整合靶位点同源的核酸序 列区域、或者参与整合的其他序列。 可使用例如可从 商购获得的体系转 座制备其他类型的载体。 如何选择适用于期望靶宿主和期望功能的合适载体是熟知的。 此外,可将编码本发明的丁醇脱氢酶的核酸分子以可操作地连接的方式邻近整合进宿主 基因组中的内源启动子。
     丁醇微生物生产宿主
     表达本发明的分离的核酸分子提供靶向转化的重组微生物宿主细胞,它具有丁 醇脱氢酶活性,以此在存在丁醛、异丁醛、或 2- 丁酮的情况下制备丁醇。 这些底物中 的每一种可在宿主细胞中被天然制备,或者作为宿主细胞中的工程化生物合成途径的 产物而被制备。 可在微生物中进行工程化以生产异丁醇、2- 丁醇、或 1- 丁醇的生物 合 成 途 径 在美 国专 利申请公布 20070092957A1、20070259410A1、20070292927A1、 和 US20080182308A1 中进行了描述,它们全文以引用方式并入本文。 当忽略每个所述途径 中的最终步骤时,产物是丁醛、异丁醛、或 2- 丁酮。 因此经工程化具有其中一个这些缺 失最终步骤的所述途径的重组微生物宿主细胞有丁醛、异丁醛、或 2- 丁酮来源。 本发明 的分离的核酸分子在细胞中的附加表达导致存在丁醇脱氢酶活性,该酶活性将丁醛转化 成 1- 丁醇、将异丁醛转化成异丁醇、或者将 2- 丁酮转化成 2- 丁醇。
     生长以生产丁醇
     包含本发明的分离的核酸分子并具有丁醛、异丁醛、或 2- 丁酮的重组微生物生 产宿主在包含合适碳底物的发酵培养基中生长。 合适的底物可包括但不限于 :单糖, 例如葡萄糖和果糖 ;低聚糖,例如乳糖或蔗糖 ;多糖,例如淀粉、纤维素或它们的混合 物 ;以及来自可再生原料的未纯化混合物,例如干酪乳清渗透物、玉米浆、甜菜糖蜜及 大麦麦芽。 另外,碳底物也可以为已证明可以被代谢转化为关键生化中间产物的诸如二 氧化碳之类的一碳底物或甲醇。 甲基营养生物体也已知可以利用多种其他含碳化合物, 例如甲胺、葡糖胺及用于代谢活动的多种氨基酸。 例如,甲基营养酵母已知可利用来自 甲胺的碳来形成海藻糖或甘油 (Bellion 等人, Microb.Growth C1Compd., [Int.Symp.], 第 7 界 (1993),415-32, 编 辑 :Murrell, J.Collin ;Kelly, Don P. 出 版 社 :Intercept, Andover, UK)。 类似地,假丝酵母属的多种物种将会代谢丙氨酸或油酸 (Sulter 等人, Arch.Microbiol.153 :485-489(1990))。 因此,预期本发明中所利用的碳源可涵盖各种含 碳底物并且将仅受限于生物体的选择。
     尽管预期所有上述碳底物及它们的混合物都适用于本发明,但优选的碳底物为 葡萄糖、果糖和蔗糖。 蔗糖可来源于可再生的糖源如甘蔗、糖用甜菜、木薯、甜高粱、以及它们的混合物。 葡萄糖和右旋糖可来源于可再生的谷物来源,经由糖化淀粉基的原 料包括谷物如玉米、小麦、裸麦、大麦、燕麦、以及它们的混合物。 此外,可发酵糖可 通过预处理和糖化过程来源于可再生的纤维质或木质纤维质生物质,这在例如共有的和 共同未决的美国专利申请公布 2007/0031918A1 中进行了描述,该专利以引用方式并入本 文。 生物质指任何纤维质或木质纤维质材料,包括包含纤维素的材料,并且任选地还包 含半纤维素、木质素、淀粉、低聚糖和 / 或单糖的材料。 生物质也可包括附加组分如蛋 白质和 / 或脂质。 生物质可来源于单一来源,或者生物质可包括来源于一种以上来源的 混合物 ;例如,生物质可包括玉米芯和玉米秸秆的混合物,或草和叶片的混合物。 生物 质包括但不限于生物能作物、农业残余物、市政固体垃圾、工业固体垃圾、来自造纸业 的淤渣、庭院垃圾、木材和林业垃圾。 生物质的实例包括但不限于 :玉米粒、玉米芯、 作物残余如玉米壳、玉米秸秆、草、小麦、小麦秸秆、大麦、大麦秸秆、干草、稻秆、 柳枝稷、废纸、蔗渣、高粱、大豆、获取自谷物、树、枝、根、叶、木屑、锯末、灌木 及矮树丛、蔬菜、水果、花、动物粪肥、以及它们的混合物的研磨物的组分。
     除了合适的碳源外,发酵培养基还必须含有本领域技术人员已知的适于培养物 生长并促进生产 2- 丁酮所必需的酶途径的矿物质、盐、辅因子、缓冲剂及其他组分。
     培养条件
     通常,使细胞在约 20℃至约 40℃的温度范围下在合适的培养基中生长。 本发明 中的合适培养基是普通的商业制备的培养基,例如 Luria Bertani(LB) 肉汤、沙氏葡萄糖 肉汤 (SD) 肉汤、酵母培养基 (YM) 肉汤、或者包括酵母氮基、硫酸铵、和右旋糖 ( 作为 碳源 / 能源 ) 的肉汤或 YPD 培养基,它是蛋白胨、酵母提取物、和右旋糖的最佳比例共 混物,用于培养啤酒糖酵母菌株。 也可以使用其他确定的或合成的生长培养基,微生物 学或发酵科学领域的技术人员将知道用于具体微生物生长的合适培养基。 已知可以直接 或间接调节分解代谢物阻遏的试剂,如环腺苷酸 2′,3′ - 单磷酸,也可以掺入发酵培 养基中。
     适于酵母发酵的 pH 范围介于 pH 5.0 至 pH 9.0 之间,其中优选将 pH6.0 至 pH 8.0 作为初始生长条件的范围。 适于其他微生物发酵的 pH 范围介于 pH 3.0 至 pH 7.5 之间, 其中优选将 pH 4.5.0 至 pH 6.5 作为初始生长条件的范围。
     发酵可以在有氧或厌氧条件下进行,厌氧或微氧条件是优选的。
     工业分批发酵和连续发酵
     发酵可为分批发酵方法。 经典的分批发酵是封闭系统,其中培养基的组成在发 酵开始时设定并且在发酵过程中不进行人工改变。 因此在发酵开始时,用所需生物体对 培养基进行接种,在不向系统添加任何物质的情况下进行发酵。 然而,通常来说, “分 批” 发酵是指碳源的添加是成批的,但经常试图控制诸如 pH 和氧浓度之类的因素。 在 分批发酵系统中,代谢产物和生物质组成持续改变直至发酵结束时。 在分批培养物内, 细胞缓慢通过静态延滞期到达高速生长对数期,并最后达到稳定期,此时生长速率减缓 或终止。 如果不加以处理,稳定期中的细胞将最终死亡。 通常,对数期中的细胞负责产 生大部分终产物或中间产物。
     标准分批式系统的一种变型是补料分批系统。 - 补料分批发酵工艺也适用于本 发明,并且包括典型的分批式系统,不同的是随着发酵进程递增地添加底物。 在代谢产物往往抑制细胞的代谢作用,以及其中期望培养基中具有有限量的底物时,补料 - 分批 式系统是有用的。 补料分批式系统中的实际底物浓度难于测量并因而可根据一些可测量 因素 ( 例如 pH、溶解的氧以及废气例如 CO2 的分压 ) 进行评估。 分批发酵和补料 - 分 批发酵在本领域内是常用的且众所周知,并且实例可见于如下文献 :Thomas D.Brock, Biotechnology :A Textbook of Industrial Microbiology,第二版,Sinauer Associates,Inc., Sunderland, MA(1989) 或 Deshpande, Mukund V., Appl.Biochem.Biotechnol.36 :227, (1992),该文献以引用方式并入本文。
     发酵培养物可适应连续发酵方法。 连续发酵是一种开放式系统,其中将设定好 的发酵培养基连续加入生物反应器中,并同时移出等量条件培养基用于加工。 连续发酵 一般保持恒定高密度的培养物。
     连续发酵允许调节一种因素或任意数目的因素,这些因素影响细胞生长或终产 物浓度。 例如,一种方法将以固定的速率维持限制性营养物质例如碳源或氮水平并且允 许所有其他参数适度。 在其他系统中,影响生长的许多因素可以连续改变,而通过培养 基浊度测量的细胞浓度保持不变。 连续系统力求维持稳态的生长条件,并因而在发酵过 程中由于培养基被取出而导致的细胞损失必须与细胞的生长率保持平衡。 用于调节连续 发酵工艺中的营养物质和生长因子的方法以及使产物形成速率保持最高水平的方法是工 业微生物领域众所周知的,并且多种方法已由 Brock( 同上 ) 详细描述。
     预期分批、补料 - 分批、连续方法、或任何已知模式的发酵适于所述的重组微 生物宿主细胞的生长。 另外,预期可以将细胞固定在底物上而作为完整的细胞催化剂并 让其经受发酵条件以生产 2- 丁醇。
     用于从发酵培养基中分离丁醇的方法
     可使用发酵领域已知的方法如 ABE 从发酵培养基中分离生物生产的丁醇 ( 参 见 例 如 Durre, Appl.Microbiol.Biotechnol.49 :639-648(1998), Groot 等 人, Process Biochem.27 :61-75(1992),以及本文参考 )。 例如,可通过离心、过滤、滗析等方法从 发酵培养基中移除固体。 然后,可使用诸如蒸馏、共沸蒸馏、液液萃取、吸附、汽提、 膜蒸发、或全蒸发的方法从发酵培养基中分离丁醇。
     因为丁醇与水形成低沸点的共沸混合物,可使用蒸馏分离混合物及其共沸组合 物。 可将蒸馏与另一种分离方法联合使用以分离共沸物。 可与蒸馏联合使用以分离并 纯化丁醇的方法包括但不限于滗析、液液萃取、吸附、和基于膜的技术。 此外,可使 用共沸蒸馏,用夹带剂 ( 参见例如 Doherty 和 Malone, Conceptual Design of Distillation Systems, McGraw Hill, New York,2001) 分离丁醇。
     丁醇 - 水混合物形成非均相共沸物,以便蒸馏可与滗析联合使用以分离并纯化 丁醇。 用这种方法,将包含发酵液的丁醇蒸馏至接近共沸组合物。 然后冷凝共沸混合 物,并且通过滗析从发酵培养基中分离丁醇。 可将滗析的含水相作为回流返回第一蒸馏 塔。 可在第二蒸馏塔中通过蒸馏进一步纯化富含丁醇的滗析有机相。
     也可联合使用液 - 液萃取和蒸馏从发酵培养基中分离丁醇。 用这种方法,用合 适的溶剂通过液 - 液萃取从发酵液中提取丁醇。 然后蒸馏包含丁醇的有机相以从溶剂中 分离丁醇。
     也可组合使用蒸馏和吸附以从发酵培养基中分离丁醇。 用这种方法,将包含丁醇的发酵液蒸馏至接近共沸组合物,然后使用吸附剂除去剩余的水如分子筛 (Aden 等 人, Lignocellulosic Biomass to Ethanol Process Design and Economics Utilizing Co-Current Dilute Acid Prehydrolysis and Enzymatic Hydrolysis for Corn Stover , Report NREL / TP-510-32438, National Renewable Energy Laboratory,2002 年 6 月 )。
     此外,蒸馏与全蒸发联合使用可从发酵培养基中分离并纯化丁醇。 用这种方 法,将包含丁醇的发酵液蒸馏至接近共沸组合物,然后通过全蒸发用亲水膜除去剩余的 水 (Guo 等人, J.Membr.Sci.245,199-210(2004))。 实施例 本发明将在下面的实施例中进一步限定。 应该理解,这些实施例尽管说明了本 发明的优选实施方案,但仅是以例证的方式给出的。 根据上面的论述和这些实施例,本 领域的技术人员能确定本发明的基本特征,并在不脱离本发明的精神和范围的情况下, 能够对本发明做出多种改变和修饰,以使其适用于多种用法和条件。
     一般方法
     实施例中所述的标准重组 DNA 技术和分子克隆技术在领域内是众所周知的, 并 且 在 下 列 文 献 中 有 所 描 述 :Sambrook, J., Fritsch, E.F. 和 Maniatis, T.Molecular Cloning :A Laboratory Manual ;Cold Spring Harbor Laboratory Press :Cold Spring Harbor, NY, (1989)(Maniatis) 和 T.J.Silhavy, M.L.Bennan 和 L.W.Enquist, Experiments with Gene Fusions, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(1984) 以及 Ausubel,F.M 等人,Current Protocols in Molecular Biology,出版 :Greene Publishing Assoc.and Wiley-Interscience(1987), 以 及 Methods in Yeast Genetics,2005, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY
     适合细菌培养物维持及生长的材料和方法在本领域内是众所周知的。 适用于 下面实施例的技术可参见 Manual of Methods for General Bacteriology(Phillipp Gerhardt, R.G.E.Murray, Ralph N.Costilow, Eugene W.Nester, Willis A.Wood, Noel R.Krieg 和 G.Briggs Phillips 编辑 ), American Society for Microbiology, Washington, DC.(1994)), 或者 Thomas D.Brock, Biotechnology :A Textbook of Industrial Microbiology,第二版, Sinauer Associates, Inc., Sunderland, MA(1989)。 除非另外指明,使用的用于细菌细 胞生长和维持的所有试剂、限制性内切酶和材料均得自 Aldrich Chemicals(Milwaukee, WI)、 BD Diagnostic Systems(Sparks, MD)、 Life Technologies(Rockville, MD) 或 Sigma Chemical Company(St.Louis, MO)。
     除 非 另 外 指 明, 微 生 物 菌 株 获 取 自 美 国 典 型 培 养 物 保 藏 中 心 (ATCC), Manassas, VA。
     缩写的含义如下 :“s” 指秒, “min” 指分钟, “h” 指小时, “psi” 指磅每 平方英寸, “nm” 指纳米, “d” 指天, “μL” 指微升, “mL” 指毫升, “L” 指 升, “mm” 指毫米, “nm” 指纳米, “mM” 指毫摩尔每升, “μM” 指微摩尔的, “M” 指摩尔的, “mmol” 指毫摩尔, “μmol” 指微摩尔, “g” 指克, “μg” 指 微克而 “ng” 指纳克, “PCR” 指聚合酶链反应, “OD” 指光密度, “OD600” 指在 600nm 波长下测量的光密度, “kDa” 指千道尔顿, “g” 指引力常数, “bp” 指碱基
     对, “kbp” 指千碱基对, “% w/v” 指重量 / 体积百分比, “% v/v” 指体积 / 体积 百分比, “HPLC” 指高效液相色谱, “GC” 指气相色谱。 术语 “摩尔选择性” 是消 耗的每摩尔糖底物制备的产物摩尔数,用百分比表示。
     “Km” 是在给定酶浓度的酶反应中导致产物生产速率等于 Vmax 的二分之一的底 物浓度。
     “Vmax” 是在给定酶浓度的酶反应中生产产物的最大速率。 一般单位是产物微 摩尔数每分钟反应时间。
     实施例 1
     从木糖氧化无色杆菌的环境分离蛋白中分离并表征丁醇脱氢酶
     使用富集方法以测定从环境废水污泥样本中分离能够利用 1- 丁醇作为唯一碳 源的微生物是否是可能的。 通过以下方法获取富集培养物 :将 1mL 活化污泥接种到 10mL S12 培养基中 (0.01M 硫酸铵,0.05M 磷酸钾,pH7.0,2mM MgCl2,0.7mM CaCl2, 50μM MnCl2,1μM FeCl3,1μM ZnCl2,1.72μM CuSO4,2.53μM CoCl2,2.42μM Na2MoO4,2μM 硫胺素盐酸盐 ),该培养基在 125mL 锥形瓶中包含酵母提取物 ( 终浓度 0.001% ) 和 0.1% (w/v) 的 1- 丁醇。 从 DuPont 废水处理设备中获取活化污泥。 富集培 养物在 37℃下往复振荡培养。 培养物最初每隔 1 至 2 天通过用 9mL 的培养基置换相同体 积的培养物来稀释培养物。 随后,将更高的稀释液转入包含 0.1-0.4% (w/v) 的初始 1- 丁 醇浓度的相同培养基中导致生长速率 (34℃,250rpm) 接近 0.55hr-1。
     将富集培养物的样本 (10μL) 平铺在 LB 琼脂或胰酪胨大豆琼脂上,并且在 35℃ 培养大约 20 小时。 通过在相同培养基上划线接种并在 35℃培养该培养物纯化代表性的菌 落。 选择分离物进行进一步检查。 将一个分离物命名为 BUTCON-5。 通过 rRNA 表征 分析 BUTCON-5 菌株的同一性。
     通过 PCR 扩增菌株 BUTCON-5 的 16S rRNA 并如下进行分析。 菌株 BUTCON-5 在 LB 中, 在 37 ℃ 下 振 荡 生 长 16 小 时。 使 用 Ultraclean Microbial DNA 分 离 试 剂 盒 (MoBio, part#12224),按照制造商的说明书从菌株 BUTCON-5 中提取 DNA。 使用 商购获得的试剂盒,按照制造商的说明书 (Perkin Elmer, Norwalk, CT),通过 PCR 扩 增 16S rRNA 基 因 序 列, 引 物 为 JCR14(ACGGGCGGTGTGTAC ;SEQ ID NO :4) 和 JCR15(GCCAGCAGCCGCGGTA ;SEQ ID NO :5)。 在 Perkin Elmer GeneAmp 9600 中 进行 PCR。 样本在 94℃下培养 2 分钟,然后如下循环 30 次 :在 94℃下 1 分钟,接着在 55℃下 1 分钟,72℃下 1 分钟,并在 72℃下保持 5 分钟。 使用商购获得的试剂盒,按照 制造商的说明书 (QIAquick PCR Purification Kit, Valencia, CA) 纯化扩增的 16S rRNA 序 列片段,并且在自动 ABI 测序仪 (Applied Biosystems, Foster City, CA) 上测序。 测序 反应的起始引物是 JCR14(SEQ ID NO :4) 和 JCR15(SEQ ID NO :5)。 用 16S rRNA 基 因序列作为查询序列进行 GenBank 中可利用序列的 BLAST 搜索 (Altschul 等人, Nucleic Acids Res.25 :3389-3402(1997)) 以获取相似序列。 来自菌株 BUTCON-5(SEQ IDNO : 6) 的 16S rRNA 基因序列与若干个属于菌种木糖氧化无色杆菌的细菌 16S rRNA 基因序列 具有高序列同一性。 BUTCON-5 序列与从木糖氧化无色杆菌菌株 NFRI-A1(GenBank 登 陆号 AB161691) 中分离的 16SrRNA 基因序列具有最高的同一性 (99% )。
     纯化来自木糖氧化无色杆菌的丁醇脱氢酶活性来自木糖氧化无色杆菌 BUTCON-5 菌株的丁醇脱氢酶的纯化从在上述培养 基中生长菌株的 500mL 过夜培养物开始进行。 沉淀细胞 (Sorvall RC5B, F10 转子, 6000RPM,20 分钟,10℃ ) 并用 pH 7.0 的 25mL 20mM 磷酸钾洗涤两次。 将洗涤后的沉 淀物重悬在 pH7.0 的 30mL20mM 磷酸钾中,并且在冰上冷冻。 超声波降解 (Heat Systems Ultrasonics, Cell Disrupter model W375, Power level 50, Pulsed Mode,70 %占空比,5 分钟 ) 细胞。 通过离心 (Sorvall RC5B, SS34 转子,18000RPM,20 分钟,10℃ ) 细胞 降解产物制备细胞游离提取物。 将上清液以等分试样贮存在 -80 ℃。 解冻两份等分试 样 (9.12mL),将它们混合并用硫酸鱼精蛋白沉淀。 在 15 分钟内四次逐滴加入 100μL 的 50mg/mL 硫酸鱼精蛋白溶液 ( 总计 15% w/w 蛋白 )。 离心 (Beckman 冷冻离心机, 20,000RCF,4℃,10 分钟 ) 移除沉淀。
     Superdex prep 200 柱用 20mM 磷酸钾,20mM KCl, pH7.0 平衡。 用 Centriprep 浓缩机将来自硫酸鱼精蛋白沉淀的上清液浓缩至约 1.3mL,装入柱中并用相同缓冲液以 1.00mL/ 分钟等度洗脱。 收集组分并测定 1- 丁醇脱氢酶活性。 该检测分析法用分光光 度计在 340nm 监控 NADH 氧化成 NAD+ 的情况,该检测法在 35℃下,使用在包含 50mM 丁醛和 0.2mMNADH 的 50mM 磷酸钾缓冲液中 (pH6.2) 的合适量的酶。 收集具有高比活 性的组分并浓缩以提供高纯度组分,该组分具有 19μmol/ 分钟 / 毫克蛋白的比活性。
     来自木糖氧化无色杆菌的分离丁醇脱氢酶的活性染色
     使用非变性聚丙烯酰胺凝胶 (8-16% Tris- 甘氨酸梯度凝胶,Invitrogen) 对纯化酶 和分子量标准品进行电泳。在电泳后,除去凝胶并对其进行蛋白染色 (Simply Blue Protein Stain,Invitrogen) 或活性染色,染色通过耦合 1- 丁醇加 NAD+ 变成丁醛加 NADH 的转化 与 3[4,5- 二甲基 -2- 噻唑基 ]-2,5- 二苯基四氮唑溴盐 (MTT) 变成深色甲臜 (formazan) 的转化进行,使用吩嗪硫酸二甲酯 (PMS) 作调节剂 (Tang 等人,等人, J.Bacteriol.140, 182(1997))。 活性溶液包含 0.5mg PMS,5mg MTT,20mg NAD+ 和 1mL 1- 丁醇,总体 积为 25mL。 所得活性染色与介于 B- 藻红蛋白 (242 千道尔顿 ) 和乳酸脱氢酶 (146 千道 尔顿 ) 蛋白标准品之间的中间条带一起迁移。 随后使用 2- 丁醇 ( 生成 2- 丁酮 ) 或异丁 醇 ( 生成异丁醛 ) 进行的活性染色生成具有相同分子量的条带,指示相同蛋白对这些丁醇 异构体具有活性。
     来自木糖氧化无色杆菌的丁醇脱氢酶的动力学表征
     用 1- 丁醇、2- 丁醇、丁醛、2- 丁酮 ( 甲基乙基酮 )、和异丁醛作底物测定还 原 ( 酮和醛 ) 或氧化 ( 醇 ) 的木糖氧化无色杆菌丁醇脱氢酶动力学参数。 用醇底物进 行的反应在 35℃的 TRIS 缓冲液中进行,该缓冲液 pH8.5,包含 3mM NAD+ 和不同浓度 的醇。 用酮或醛底物进行的反应在 35 ℃用 pH6.0 的 50mM MES 缓冲,200μm NADH 和不同浓度的酮或醛进行。 使用获取自木糖氧化无色杆菌或重组大肠杆菌菌株 Mach1/ pTrc99a::sadB( 如下文实施例 3 所述 ) 的粗制酶制剂。 根据结果计算每种底物的 Vmax 和 Km,这些数据在表 1 中提供。
     表 1 :木糖氧化无色杆菌丁醇脱氢酶的动力学常数。
    实施例 2
     获取木糖氧化无色杆菌丁醇脱氢酶的编码序列
     从如实施例 1 所述制备的凝胶中切除对应于木糖氧化无色杆菌丁醇脱氢酶 的合适分子量的条带,使用标准方法分离蛋白并测定 N- 末端序列。 将序列测定为 MKALVYHGDHKISLGDKPKP(SEQ ID NO :7)。
     从编码该肽的计划 DNA 序列中设计测序引物。 简并引物 N331(SEQID NO :8) 在以下实验中成功地提供第一序列信息。 从木糖氧化无色杆菌菌株 BUTCON-5 中制备 基因组 DNA,使用 Gentra Puregene 试剂盒 (Gentra Systems, Inc., Minneapolis, MN ; 目录号 D-5500A) 按照革兰氏阴性菌生物推荐的规程进行制备。 最初使用从纯化基因 组 DNA(gDNA) 进行测序的改进规程从编码区的 5’ 末端朝着 3’ 末端进行染色体行 走。 就每个测序引物反应而言,将 20μL 纯化 gDNA( ~ 200ng/μL) 加到 16μL BigDye v3.1Sequencing Reagent(Applied Biosystems Cat.No.4337457),3μL 10μm 引物,和 1μL DMSO(Sigma-Aldrich Cat.No.D8418) 中。 然后如下进行热循环测序反应 :96℃ 3 分钟, 随后进行 200 个循环 (95℃ 30 秒 +55℃ 20 秒 +60℃ 2 分钟 ),然后 4℃贮存。 在测序之 前,使用 Edge Biosystem(Gaithersburg,MD 20877,USA) 纯化板移除未掺入的 ddNTP。 就每个测序反应而言,将总计 40μL 吸移到预离心过的 96- 孔纯化板的一个孔中。 然后 在 Sorvall RT-7 冷冻离心机中以 5,000×g 将板离心 5 分钟。 然后将纯化后的反应物直接 置于 Applied Biosystems 3730DNA 测序仪上,并用自动碱基判定测序。
     通过 BLASTX 搜索公开可获得的序列分析用简并引物 N331 获取的序列,并且 分析该序列与脑膜炎奈瑟氏球菌锌依赖醇脱氢酶的编码氨基酸序列具有 65%的相似度, 而与来自其他生物具有相关活性的蛋白的相似程度更低。 从用引物 N331 获取的序列中 制备附加引物,并且进行第二轮测序。 从引物 N401( 正向 ;SEQ ID NO :9)、N402( 反 向 ;SEQID NO :10) 和 N406( 正向 ;SEQ ID NO :11) 获取的结果揭示了起始密码子和 推定的锌结合 cys-X-X-X-cys-X-X-cys 基序。 从新获得的序列中设计附加的正向和反 向测序引物。 从引物 N412(SEQ ID NO :12)、 N421(SEQ ID NO :13) 和 N422(SEQ ID NO :14) 获取的测序结果与从引物 N331 和 N402 获取的测序结果部分相同,使得能够装 配 426nt 的重叠群。
     然后如下使用 GenomiPhi(GE Healthcare Cat.No.25-6600-01) 扩增 gDNA 以改善 测序阅读长度。 将一纳克纯化 gDNA 加到 9μL 样本缓冲液中并加热到 95℃保持 3 分钟, 随后冷却至 4℃。 将 10μL 酶混合物 ( 由 9μL 反应缓冲液 +1μL 酶组成 ) 加到每个冷却
     样本中并将混合物在 30℃培养 18 小时。 随后通过加热至 65℃保持 10 分钟灭活酶。 样本 在 4℃贮存直至测序。 就每个测序引物反应而言,将 8μL 扩增的 DNA 加到 8μLBigDye v3.1Sequencing Reagent(Applied Biosystems Cat.No.4337457),4μ5X 测序缓冲液 (Applied Biosystems,4336699),3μL 10μM 引 物, 和 16μL 分 子 生 物 学 级 别 水 (Mediatech, Inc.),以及 1μL DMSO(Sigma-Aldrich Cat.No.D8418) 中。
     用引物 N462(SEQ ID NO :17)、N464(SEQ ID NO :19) 和 N465(SEQ ID NO : 20)( 所有引物从 426nt 重叠群序列中制备 ) 对扩增 DNA 进行的测序完成了编码区的 3’末 端并且使得能够装配 1047nt 的开放阅读框。 就最后的确认而言,正向和反向引物分别是 N473(SEQ ID NO :24) 和 N469(SEQ ID NO :23),它们从 “粗”重叠群装配物中设计以 PCR 扩增来自纯化 gDNA 的完整编码序列,扩增使用高保真 PhusionTM 扩增试剂盒 (New England Biolabs Cat.No.F-531S)。将 PCR 严物 TOPO-Blunt 克隆到 pCR4BLUNT(Invitrogen Cat.No.K2835-20) 中以制备 pCR4Blunt::sadB,它按照制造商的规程被转化到大肠杆菌 Mach-1 细胞 ( 在试剂盒中提供 ) 中。 随后从四个克隆中分离质粒,并且用侧接载体 - 特 异性引物 (M13 正向和反向 ;SEQ ID NO :25,26) 和编码序列插入序列特异性的引物 N456(SEQ ID NO :15)、 N457(SEQ ID NO :16)、 N462(SEQ ID NO :17)、 N463(SEQ ID NO :18)、N465(SEQ ID NO :20)、N466(SEQ ID NO :21)、及 N467(SEQ ID NO : 22) 对插入序列进行测序。达到了至少 4X 的覆盖率,这确认了 1047nt 的编码区序列 (SEQ IDNO :1)。
     将编码鉴定的木糖氧化无色杆菌丁醇脱氢酶的基因命名为 sadB,用于仲醇脱氢 酶 -2- 丁醇。 如实施例 1 所示,该酶显示具有比包括 1- 丁醇和异丁醇在内的 2- 丁醇仲 醇更广的底物范围,使其成为丁醇脱氢酶。 将从最终的 1047nt 编码序列翻译得到的蛋白 (SEQ ID NO :2) 用作 BLASTP 查询序列,使用默认参数查询公开可得到的序列。发现它 与来自脑膜炎奈瑟氏球菌的推定锌依赖醇脱氢酶 (GenBank 登录号 AAF41759) 最相似, 它与 sadB 氨基酸序列具有 67%的同一性。 通过 BLAST 分析公开可得到的序列,发现木 糖氧化无色杆菌丁醇脱氢酶的 DNA 编码序列与脑膜炎奈瑟氏球菌 MC58 锌依赖醇脱氢酶 (GenBank 登录号 NC003112) 的编码序列具有 64.5%的同一性。
     实施例 3
     将 2- 丁酮转化成 2- 丁醇的表达木糖氧化无色杆菌醇脱氢酶的大肠杆菌构建体
     仲醇脱氢酶 (sadB) 来自木糖氧化无色杆菌,将其克隆进载体 pTrc99a(Amann 等 人, Gene 69(2) :301-315(1988)) 中。 使用来自木糖氧化无色杆菌基因组 DNA 的标准 条件扩增编码区 (SEQ ID NO :1),用 Gentra Puregene 试剂盒 (Gentra Systems, Inc., Minneapolis,MN ;目录号 D-5500A),使用正向和反向引物 N473 和 N469(SEQ ID NO : 24 和 23),按照推荐用于革兰氏阴性菌生物的规程制备。 将 PCR 产物 TOPO-Blunt 克隆 进 pCR4BLUNT(Invitrogen) 以制备 pCR4Blunt::sadB,它被用于转化大肠杆菌 Mach-1 细 胞。 随后从四个克隆中分离质粒 DNA,并且确认序列。 然后用 EcoRI 消化质粒,释放 sadB 片段,该片段与用 EcoRI 消化的 pTrc99a 连接以生成 pTrc99a::sadB。 用质粒转化大 肠杆菌 Mach 1 细胞,将所得转化体命名为 Mach1/pTrc99a::sadB。测定这些细胞中的 sadB 基因表达的酶的活性并将结果在实施例 1 的表 1 中给出。
     实施例 4酵母表达由 pRS425::GPM-sadB 的 sadB 构建体编码的丁醇脱氢酶
     从 pCR4Blunt::sadB 中 PCR 扩增 sadB 基因编码区。 PCR 引物 N583 和 N584(SEQ ID NO :27 和 28) 包含附加的 5’序列,它与酵母 GPM 启动子 (SEQ ID NO :29) 和 ADH1 终止子 (SEQ ID NO :30) 部分相同。 然后使用啤酒糖酵母 (Ma 等人,同上 ) 中的 “空 隙修复”方法将 PCR 产物如下克隆进酵母 - 大肠杆菌穿梭载体 pRS425::GPM::kivD::ADH 中。 该载体包含嵌合基因,所述嵌合基因将酵母 GPM 启动子 (SEQ ID NO :29)、乳酸乳 球菌 kivD 编码区 (SEQ ID NO :31)、和 ADH1 终止子 (SEQ IDNO :30) 包含在 pRS425 载体 ( 来自 pRS400 系列 :Christianson 等人, Gene 110 :119-122(1992)) 中,并且在共 有的和共同未决的美国专利申请公布 #20070092957A1 的实施例 17 中进行了描述 )。 用 BbvCI 和 PacI 限制性酶消化该载体以释放 kivD 编码区。 使用大约 1μg 剩余的载体片段 连同 1μg sadB PCR 产物一起转化啤酒糖酵母菌株 BY4741。 在缺乏亮氨酸的合成完全培 养基上选择转化体。 通过 PCR 使用引物 N142 和 N459(SEQ ID NO :32 和 33) 确认合适 的重组事件生成 pRS425::GPM-sadB。
     在缺乏亮氨酸的合成完全培养基中培养三个克隆以生成待测定的细胞。 通过标 准小珠研磨方法,使用 1mL 0.5mm 小珠和 1.5mL 酵母细胞悬浮液制备细胞游离提取物。 如下测量经测定为 MEK 还原酶活性的活性。将酵母细胞游离提取物 ( 如表 2 所示,50μL 样本和其中一个 100μL 的样本 ) 加到包含 920 或 870μL 的 50mM MES 缓冲液 (pH 6), 10μL 的 20mM NADH,和 10μL 的 100mM DTT 的石英比色杯中。 在将 10μL 的 500mM 2- 丁酮加到反应中前,监控在 340nm 的吸光度 1 分钟以获得背景速率。 监控在 340nm 的 吸光度附加的 2 分钟以获取反应速率。 在表 2 中报道了与仅用于载体的对照物 (BY4741/ pRS426) 相比包含显著的 MEK 还原活性的所有三个克隆,用活性 (μ 摩尔 / 分钟 / 毫克 ) 表示。
     表 2 :在酵母中表达的木糖氧化无色杆菌丁醇脱氢酶的活性
    实施例 5密码子优化的 sadB 在啤酒糖酵母中的表达
     编码木糖氧化无色杆菌丁醇脱氢酶的序列经密码子优化以在啤酒糖酵母中表 达,表达使用在由 Kazusa DNA Research Institute(Japan) 保存的 Codon Usage Database 中 报道的标准密码子使用信息,通过 DNA 2.0(Menlo Park,CA) 进行。 从 DNA 2.0 中接受 包含称为 sadBy(SEQ IDNO :3) 的最优化编码区的克隆 DNA 片段。 如下构建包含 GPM 启动子 -sadBy 编码区 -ADH1 终止子的嵌合基因。
     如实施例 4 所述用引物 OT1074 和 OT1075(SEQ ID NO :34 和 35) 进行的定点诱 变用于生成在 pRS425::GPM-sadB 中的 sadB 编码区的 ATG 密码子上游的 NheI 限制性位 点,制备载体 pRS425::GPMp-sadB(NheI)-ADH1t。 使用 NheI 和 PacI 限制性位点将密码 子优化的 sadBy 片段亚克隆到 pRS425::GPMp-sadB(NheI)-ADH1t 中,置换最初的 sadB 编 码区。 将所得质粒称为 pRS425::GPMp-sadBy-ADH1t。
     用 质 粒 pRS425-GPMp-sadBy-ADH1t, 利 用 标 准 遗 传 方 法 (Methods in Yeast Genetics , 2005 , Cold Spring Harbor Laboratory Press , Cold Spring Harbor , NY , pp.201-202) 转化啤酒糖酵母 BY4741(ATCC#201388),并且在缺乏亮氨酸并补充有 2%葡 萄糖的合成完全培养基上,在 30℃下选择转化体。 BY4741pRS425::GPMp-sadBy-ADH1t 在缺乏亮氨酸并补充有 2%葡萄糖的合成完全培养基上,在 30℃下过夜生长,并且将其 接种到 200mL 相同培养基中至最终 OD600 为 0.2。 在 30℃下以 220rpm 振荡培养所述培 养物直至在 OD600 为 0.8-1.0 时离心收获,并且贮存在 -80℃。
     如上文实施例 4 所述制备酵母提取物。 如上文实施例 4 所述进行 2- 丁酮还原的 活性测定。 在表 3 中提供了来自各个测定的比活性 (μ 摩尔 / 分钟 / 毫克 )。
     表 3 :在具有密码子优化的编码区的酵母中表达的木糖氧化无色杆菌丁醇脱氢 酶的活性。
    样本 BY4741pRS425::GPMp-sadBy-ADH1t Clone A(50μL) BY4741pRS425::GPMp-sadBy-ADH1t CLone B(50μL) BY4741pRS425::GPMp-sadBy-ADH1t Clone A(100μL) BY4741pRS425::GPMp-sadBy-ADH1t Clone B(100μL) 平均值
    *比活性 0.174 0.253 0.118 0.192 0.184*标准偏差= 0.05625CN 102016013 A CN 102016023 A
    序列表1/13 页
     26CN 102016013 A CN 102016023 A序列表2/13 页
    27CN 102016013 A CN 102016023 A序列表3/13 页
    28CN 102016013 A CN 102016023 A序列表4/13 页
    29CN 102016013 A CN 102016023 A序列表5/13 页
    30CN 102016013 A CN 102016023 A序列表6/13 页
    31CN 102016013 A CN 102016023 A序列表7/13 页
    32CN 102016013 A CN 102016023 A序列表8/13 页
    33CN 102016013 A CN 102016023 A序列表9/13 页
    34CN 102016013 A CN 102016023 A序列表10/13 页
    35CN 102016013 A CN 102016023 A序列表11/13 页
    36CN 102016013 A CN 102016023 A序列表12/13 页
    37CN 102016013 A CN 102016023 A序列表13/13 页38

来自木糖氧化无色杆菌的丁醇脱氢酶.pdf_第1页
第1页 / 共38页
来自木糖氧化无色杆菌的丁醇脱氢酶.pdf_第2页
第2页 / 共38页
来自木糖氧化无色杆菌的丁醇脱氢酶.pdf_第3页
第3页 / 共38页
点击查看更多>>
资源描述

《来自木糖氧化无色杆菌的丁醇脱氢酶.pdf》由会员分享,可在线阅读,更多相关《来自木糖氧化无色杆菌的丁醇脱氢酶.pdf(38页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN102016013A43申请公布日20110413CN102016013ACN102016013A21申请号200980114986222申请日2009042861/04829120080428USC12N9/04200601C12P7/1620060171申请人布特马斯先进生物燃料公司地址美国特拉华州72发明人MG布拉穆奇AC埃利奥特LA马吉奥霍尔CE纳卡穆拉74专利代理机构中国专利代理香港有限公司72001代理人李波李连涛54发明名称来自木糖氧化无色杆菌的丁醇脱氢酶57摘要从分离自环境样本的细菌菌株中,在包含1丁醇作碳源的培养基中富集后,鉴定了具有丁醇脱氢酶活性的新酶。该。

2、酶能够将丁醛转化成1丁醇、将异丁醛转化成异丁醇、以及将2丁酮转化成2丁醇,并且因此对在生产这些底物的重组微生物宿主中的丁醇生物合成是有用的。从经鉴定为木糖氧化无色杆菌的分离蛋白的菌株中分离称为SADB的编码基因。30优先权数据85PCT申请进入国家阶段日2010102786PCT申请的申请数据PCT/US2009/0418602009042887PCT申请的公布数据WO2009/134730EN2009110551INTCL19中华人民共和国国家知识产权局12发明专利申请权利要求书2页说明书22页序列表13页附图0页CN102016023A1/2页21分离的核酸分子,所述分离的核酸分子包含编码。

3、至少约250个氨基酸的多肽的第一核苷酸序列,所述多肽基于SMITHWATERMAN比对方法在与具有如SEQIDNO2所示序列的多肽进行比较时具有至少约70的同一性,或者所述分离的核酸分子包含第二核苷酸序列,所述第二核苷酸序列包含第一核苷酸序列的互补序列,其中所述酶具有丁醇脱氢酶活性。2编码丁醇脱氢酶的分离的核酸分子,所述分离的核酸分子选自A编码如SEQIDNO2所示的氨基酸序列的分离的核酸分子;B在如下所述的杂交条件下与A杂交的分离的核酸分子01XSSC、01SDS,65以及用2XSSC、01SDS洗涤,之后用01XSSC、01SDS洗涤;或与A或B互补的分离的核酸分子。3权利要求1或2的分离。

4、的核酸分子,所述分离的核酸分子具有选自SEQIDNO1和SEQIDNO3的序列。4具有如SEQIDNO2所示的氨基酸序列的多肽。5包含权利要求1或2的分离的核酸分子的嵌合基因,所述分离的核酸分子可操作地连接至合适的调控序列。6包含权利要求1或2的核酸分子的转化的宿主细胞。7权利要求6的转化的宿主细胞,其中所述宿主细胞选自细菌、蓝细菌、丝状真菌和酵母。8权利要求7的转化的宿主细胞,其中所述宿主细胞为选自下组的属的成员梭菌属、发酵单胞菌属、埃希氏菌属、沙门氏菌属、红球菌属、假单胞菌属、芽孢杆菌属、乳杆菌属、肠球菌属、产碱杆菌属、克雷伯氏菌属、类芽胞杆菌属、节杆菌属、棒状杆菌属、短杆菌属、毕赤酵母属。

5、、假丝酵母属、汉逊酵母属、克鲁维酵母属和糖酵母属。9生产2丁醇的方法,所述方法包括A提供包含权利要求1或2中任一项的分离的核酸分子的重组微生物生产宿主细胞,所述分离的核酸分子编码具有丁醇脱氢酶活性的多肽,并且提供2丁酮来源;B使A的微生物宿主细胞在表达所述分离的核酸分子并将所述2丁酮转化成2丁醇的条件下生长;以及C任选地回收所述2丁醇。10生产异丁醇的方法,所述方法包括A提供包含权利要求1或2中任一项的分离的核酸分子的重组微生物生产宿主细胞,所述分离的核酸分子编码具有丁醇脱氢酶活性的多肽,并且提供异丁醛来源;B使A的微生物宿主细胞在表达所述分离的核酸分子并将所述异丁醛转化成异丁醇的条件下生长;。

6、以及C任选地回收所述异丁醇。11生产1丁醇的方法,所述方法包括A提供包含权利要求1或2中任一项的分离的核酸分子的重组微生物生产宿主细胞,所述分离的核酸分子编码具有丁醇脱氢酶活性的多肽,并且提供丁醛来源;以及B使A的微生物宿主细胞在表达所述分离的核酸分子并将所述丁醛转化成1丁醇的条件下生长;权利要求书CN102016013ACN102016023A2/2页3C并且任选地回收所述1丁醇。12根据权利要求9、10、或11的方法,其中A的重组微生物宿主细胞选自细菌、蓝细菌、丝状真菌和酵母。13根据权利要求12的方法,其中所述重组微生物宿主细胞为选自下组的属的成员梭菌属、发酵单胞菌属、埃希氏菌属、沙门氏。

7、菌属、红球菌属、假单胞菌属、芽孢杆菌属、乳杆菌属、肠球菌属、产碱杆菌属、克雷伯氏菌属、类芽胞杆菌属、节杆菌属、棒状杆菌属、短杆菌属、毕赤酵母属、假丝酵母属、汉逊酵母属、克鲁维酵母属和糖酵母属。权利要求书CN102016013ACN102016023A1/22页4来自木糖氧化无色杆菌的丁醇脱氢酶发明领域0001本发明涉及分子生物学和微生物学领域。更具体地讲,该领域与用于在微生物中生产丁醇的丁醇脱氢酶相关。0002发明背景0003丁醇是一种重要的工业化学品,其可用作燃料添加剂、塑料工业中的化学原料以及食品和香料工业中的食品级萃取剂。每年通过石油化学手段生产100至120亿磅的丁醇,并且对该日用化学。

8、品的需求可能还会增加。0004可对微生物进行工程化以表达生物合成途径用于丁醇生产。共有的和共同未决的美国专利申请公布US20070092957A1公开了对重组微生物进行工程化以用于生产异丁醇2甲基1丙醇。共有的和共同未决的美国专利申请公布US20080182308A1公开了工程化重组微生物用于生产1丁醇。共有的和共同未决的美国专利申请公布US20070259410A1和US20070292927A1公开了对重组微生物进行工程化以用于生产2丁醇。描述了用于异丁醇和2丁醇生产的多个途径。在用于全部三个产物的所有所述途径中的最终步骤是通过具有丁醇脱氢酶活性的酶将氧化程度较高的部分还原成醇部分。已知的。

9、醇脱氢酶能够进行这些转化。0005期望具有丁醇脱氢酶活性的附加酶在具有工程化丁醇生物合成途径的重组宿主微生物中用于生产丁醇。申请人通过以下方法已经解决了该问题在环境细菌分离蛋白中发现具有丁醇脱氢酶活性的酶、分离该酶、并且从鉴定的木糖氧化无色杆菌ACHROMOBACTERXYLOSOXIDANS分离蛋白中鉴定编码的核酸序列。0006发明概述0007本文所述的是具有丁醇脱氢酶活性的新酶以及编码分离的核酸分子。0008本发明提供分离的核酸分子,所述分离的核酸分子包含编码至少约250个氨基酸的多肽的第一核苷酸序列,所述多肽基于SMITHWATERMAN比对方法在与具有如SEQIDNO2所示的序列的多肽。

10、进行比较时具有至少约70的同一性,或者所述分离的核酸分子包含所述第一核苷酸序列的互补序列的第二核苷酸序列,其中所述酶具有丁醇脱氢酶活性。0009在另一方面,本发明提供编码丁醇脱氢酶的分离的核酸分子,所述分离的核酸分子选自0010A编码如SEQIDNO2所示的氨基酸序列的分离的核酸分子;0011B在如下杂交条件下与A杂交的分离的核酸分子01XSSC、01SDS,65以及用2XSSC、01SDS洗涤,之后用01XSSC、01SDS洗涤;或0012与A或B互补的分离的核酸分子。0013此外本发明提供由所述核酸分子以及包含可操作地连接至少一种调控元件的核酸分子的嵌合基因编码的多肽,以及包含所述核酸分子。

11、的转化的宿主细胞。0014在一个实施方案中,本发明提供了生产2丁醇的方法,所述方法包括0015A提供包含本发明的分离的核酸分子的重组微生物生产宿主细胞,所述分离的说明书CN102016013ACN102016023A2/22页5核酸分子编码具有丁醇脱氢酶活性的多肽,并且提供2丁酮来源;0016B使A的微生物宿主细胞在表达分离的核酸分子并将2丁酮转化成2丁醇的条件下生长;以及0017C任选地回收所述2丁醇。0018在另一个实施方案中,本发明提供了生产异丁醇的方法,所述方法包括0019A提供包含本发明的分离的核酸分子的重组微生物生产宿主细胞,所述分离的核酸分子编码具有丁醇脱氢酶活性的多肽,并且提供。

12、异丁醛来源;0020B使A的微生物宿主细胞在表达分离的核酸分子并将异丁醛转化成异丁醇的条件下生长;以及0021C任选地回收所述异丁醇。0022在另一个实施方案中,本发明提供了生产1丁醇的方法,所述方法包括0023A提供包含本发明的分离的核酸分子的重组微生物生产宿主细胞,所述分离的核酸分子编码具有丁醇脱氢酶活性的多肽,并且提供丁醛来源;以及0024B使A的微生物宿主细胞在中表达分离的核酸分子并将丁醛转化成1丁醇的条件下生长;0025C并且任选地回收所述1丁醇。0026序列描述0027通过下面的发明详述、附图和随附的序列描述可以更全面地理解本发明,这些详细描述、附图和序列描述形成了本专利申请的一部。

13、分。0028下面的序列遵照37CFR18211825“REQUIREMENTSFORPATENTAPPLICATIONSCONTAININGNUCLEOTIDESEQUENCESAND/ORAMINOACIDSEQUENCEDISCLOSURESTHESEQUENCERULES”对含有核酸序列和/或氨基酸序列公开的专利申请的要求序列规则,并且符合WORLDINTELLECTUALPROPERTYORGANIZATION世界知识产权组织,WIPOST25标准1998以及EPO和PCT的序列清单要求规则52和495ABIS以及ADMINISTRATIVEINSTRUCTIONS行政指令的第208节。

14、和附录C。用于核苷酸和氨基酸序列数据的符号和格式遵循在37CFR1822中示出的规则。0029SEQIDNO1是来自木糖氧化无色杆菌的丁醇脱氢酶SADB的鉴定编码区。0030SEQIDNO2是来自木糖氧化无色杆菌的鉴定的丁醇脱氢酶的蛋白序列。0031SEQIDNO3是木糖氧化无色杆菌丁醇脱氢酶的编码区,其密码子经优化以在啤酒糖酵母SACCHAROMYCESCEREVISIAE中表达。0032SEQIDNO4和5是用于菌株BUTCON516SRRNA的PCR扩增的引物。0033SEQIDNO6是菌株BUTCON5的16SRDNA序列。0034SEQIDNO7是木糖氧化无色杆菌丁醇脱氢酶的N末端肽。

15、序列。0035SEQIDNO8是简并引物N331。0036SEQIDNO926是木糖氧化无色杆菌丁醇脱氢酶编码区的测序引物。SEQIDNO27和28是用于SADB编码区的PCR扩增的引物,该编码区具有用于空隙修复克隆的延伸部分。0037SEQIDNO29是酵母GPM启动子。0038SEQIDNO30是酵母ADH1终止子。说明书CN102016013ACN102016023A3/22页60039SEQIDNO31是乳酸乳球菌LACTOCOCCUSLACTISKIVD编码区。0040SEQIDNO32和33是用于确认PRS425GPMSADB的测序引物。0041SEQIDNO34和35是用于增加N。

16、HEI位点的定点诱变引物。0042发明详述0043本文所述的是从细菌的环境分离蛋白中分离得到的新型丁醇脱氢酶,该细菌经鉴定为木糖氧化无色杆菌。本发明提供了该蛋白的氨基酸序列和具有至少约70的氨基酸同一性并具有丁醇脱氢酶活性的蛋白。此外,提供了编码这些蛋白的分离的核酸分子,它们可用于嵌合基因以在微生物中表达丁醇脱氢酶。可使用木糖氧化无色杆菌丁醇脱氢酶和相关序列的酶在重组微生物中从2丁酮中生产2丁醇、从异丁醛中生产异丁醇、或者从丁醛中生产1丁醇,所述重组微生物具有其中一种这些底物的来源。0044丁醇是一种具有多种应用的重要工业日用化学品,其中其作为燃料或燃料添加剂的潜力尤为重要。尽管丁醇仅仅是一种。

17、四碳醇,但是其具有与汽油相似的能含量,并且可以与任何化石燃料共混。丁醇是优选的燃料或燃料添加剂,因为它在标准内燃机中燃烧时仅生成CO2并且几乎不产生或根本不产生SOX或NOX。另外,丁醇的腐蚀性不及乙醇,是目前为止最优选的燃料添加剂。0045丁醇除了可用作生物燃料或燃料添加剂之外,在新兴的燃料电池工业中还具有影响氢分配问题的潜力。如今,由于氢的运输和分配存在安全隐患,燃料电池饱受困扰。可以容易地对丁醇重整其氢含量,并且可以通过现有的加油站以燃料电池或汽车中的内燃机所需的纯度进行分配。0046以下缩写和定义将用于说明书和权利要求的判读。0047如本文所用,术语“包含”、“由组成”、“包括”、“涵。

18、盖”、“具有”、“含有”、“包容”或“容纳”或其任何其它变型旨在包括非排他的包含物。例如,包含一系列元素的组合物、混合物、工艺、方法、制品或设备不必仅限于那些元素,而可以包括其它未明确列出的元素,或此类组合物、混合物、工艺、方法、制品或设备固有的元素。此外,除非有相反的明确说明,“或”是指包含性的“或”,而不是指排他性的“或”。例如,以下任何一种情况均满足条件A或BA是真的或存在的且B是假的或不存在的、A是假的或不存在的且B是真的或存在的、以及A和B都是真的或存在的。0048同样,涉及元素或组分例证即出现次数的位于本发明元素或组分前的不定冠词“一个”或“一种”旨在是非限制性的。因此,应将“一个。

19、”或“一种”理解为包括一个或至少一个,并且元素或组分的词语单数形式也包括复数形式,除非有数字明显表示单数。0049如本文所用,术语“发明”或“本发明”是非限制性的术语,并且不旨在指本方面的任何单个实施方案,而是涵盖如说明书和权利要求中所述的所有可能的实施方案。0050如本文所用,修饰本发明使用的成分或反应物的量的术语“约”是指可以通过例如以下方式而发生的用数字表示的量的变化在真实世界中用于制备浓缩物或使用溶液的一般测量和液体处理操作;这些操作中非故意的误差;用于制备组合物或执行方法的成分的制造、来源或纯度中的差异;等等。术语“约”还包括由于对于起因于特定起说明书CN102016013ACN10。

20、2016023A4/22页7始混合物的组合物的不同平衡条件而不同的量。无论是否通过术语“约”来修饰,权利要求包括量的等同量。在一个实施方案中,术语“约”指在报告数值的10范围内,优选地在报告数值的5范围内。0051如本文所用,术语“丁醇”指1丁醇、2丁醇、异丁醇、或它们的混合物。0052术语“丁醇生物合成途径”指制备1丁醇、2丁醇、或异丁醇的酶途径。0053术语“1丁醇生物合成途径”指从乙酰辅酶A乙酰COA中制备1丁醇的酶途径。0054术语“2丁醇生物合成途径”指从丙酮酸中制备2丁醇的酶途径。0055术语“异丁醇生物合成途径”指从丙酮酸中制备异丁醇的酶途径。0056术语“兼性厌氧菌”指既能在有。

21、氧环境下生长又能在无氧环境下生长的微生物。0057术语“碳底物”或“可发酵碳底物”指能够被本发明的宿主生物体代谢的碳源,并且特别是选自由下列的碳源单糖、低聚糖、多糖和一碳底物或它们的混合物。0058术语“基因”指能够被表达为特定蛋白质的核酸片段,其任选包括编码序列前的调节序列5非编码序列和编码序列后的调节序列3非编码序列。“天然基因”是指天然存在的具有其自己的调控序列的基因。“嵌合基因”是指不是天然基因的任何基因,包含在天然情况下不是一起存在的调控序列和编码序列。因此,嵌合基因可包括源于不同来源的调控序列和编码序列,或者包括源于同一来源但以不同于天然存在的方式排列的调控序列和编码序列。“内源性。

22、基因”指位于生物基因组内它的天然位置的天然基因。“外源”或“异源”基因指通常不存在于宿主生物中的基因,它通过基因转移导入宿主生物。外来基因可以包含插入到非天然生物体内的天然基因,或嵌合基因。“转基因”是已通过转化方法导入基因组内的基因。0059如本文所用的,“分离的核酸片段”或“分离的核酸分子”将可互换使用,并且将指单链或双链的,任选含有合成的、非天然的或改变了的核苷酸碱基的RNA或DNA聚合物。DNA聚合物形式的分离的核酸片段可由CDNA、基因组DNA或合成DNA的一个或多个片段构成。0060当在合适的温度和溶液离子强度条件下单链形式的核酸片段可以退火至另一核酸片段时,核酸片段“可杂交”至另。

23、一核酸片段,例如CDNA、基因组DNA或RNA分子。杂交条件和洗涤条件是众所周知的,并在SAMBROOK,J,FRITSCH,EF和MANIATIS,TMOLECULARCLONINGALABORATORYMANUAL,第2版,COLDSPRINGHARBORLABORATORYCOLDSPRINGHARBOR,NY1989中有举例说明,尤其是其中的第11章和表111将其全部内容以引用的方式并入本文。温度和离子强度条件确定了杂交的“严格性”。可以调节严格性条件以筛选中度相似的片段例如来自远缘生物的同源序列,到筛选高度相似的片段例如从近缘生物复制功能性酶的基因。杂交后的洗涤确定严格性条件。一组优。

24、选的条件采用一系列如下洗涤开始采用6XSSC、05SDS在室温下持续洗涤15分钟,然后再使用2XSSC、05SDS在45下洗涤30分钟,最后使用02XSSC、05SDS在50下重复洗涤30分钟两次。更优选的一组严格性条件采用更高的温度,其中洗涤与上述洗涤相同,不同的是最后两次在02XSSC、05SDS中洗涤30分钟时的温度被增加到60。另一组优选的高严格性条件是最后两次洗涤是在65下用01XSSC、01说明书CN102016013ACN102016023A5/22页8SDS进行。例如,另一组严格性条件包括在01XSSC、01SDS中于65下杂交,并用2XSSC、01SDS洗涤,随后用01XSS。

25、C、01SDS洗涤。0061杂交需要两种核酸含有互补序列,但是取决于杂交的严格性,碱基之间可能会发生错配。用于使核酸杂交的合适严格性取决于核酸的长度和互补的程度,所述长度和互补程度是本领域内所熟知的变量。两条核苷酸序列之间的相似性或同源性程度越高,具有那些序列的核酸的杂交体的TM值就越大。核酸杂交的相对稳定性对应较高的TM按以下顺序依次降低RNARNA、DNARNA、DNADNA。对于长度超过100个核苷酸的杂交体,已经推导出了用于计算TM的公式请参见SAMBROOK等人,同上,950951。对于较短核酸即寡核苷酸的杂交,错配的位置变得更重要,而且寡核苷酸的长度决定了其特异性参见SAMBROO。

26、K等人,同上,117118。在一个实施方案中,可杂交核酸的长度为至少约10个核苷酸。优选地,可杂交核酸的最小长度为至少约15个核苷酸;更优选至少约20个核苷酸;并且最优选地,长度为至少约30个核苷酸。此外,技术人员将认识到,可根据需要根据诸如探针长度之类的因素来调节温度和洗涤溶液盐浓度。0062术语“互补的”用于描述核苷酸碱基之间能够彼此杂交的关系。例如,对于DNA,腺嘌呤与胸腺嘧啶互补,而胞嘧啶与鸟嘌呤互补。0063如本领域所熟知的,术语“百分比同一性”是两条或更多条多肽序列之间或两条或更多条多核苷酸序列之间的关系,该关系通过对序列进行比较确定。在本领域中,“同一性”还表示多肽或多核苷酸序列。

27、之间序列关联的程度,根据具体情况,它由这些序列的序列串之间的匹配程度确定。“同一性”和“相似性”可容易地通过已知方法计算出来,所述的方法包括但不限于以下文献中所描述的那些1COMPUTATIONALMOLECULARBIOLOGYLESK,AM编辑OXFORDUNIVERSITYNY1988;2BIOCOMPUTINGINFORMATICSANDGENOMEPROJECTSSMITH,DW编辑ACADEMICNY1993;3COMPUTERANALYSISOFSEQUENCEDATA,PARTIGRIFFIN,AM和GRIFFIN,HG编辑HUMANIANJ1994;4SEQUENCEANAL。

28、YSISINMOLECULARBIOLOGYVONHEINJE,G编辑ACADEMIC1987;和5SEQUENCEANALYSISPRIMERGRIBSKOV,M和DEVEREUX,J编辑STOCKTONNY1991。0064设定确定同一性的优选方法来用于给出待测试序列之间的最佳匹配。确定同一性和相似性的方法在可公开获得的计算机程序中编成了代码。序列比对和同一性百分比计算可以用LASERGENE生物信息学计算软件包LASERGENEBIOINFORMATICSCOMPUTINGSUITEDNASTARINC,MADISON,WI中的MEGALIGNTM程序进行。序列的多重比对采用包括几种改变。

29、形式的算法在内的“CLUSTAL比对方法”进行,包括“CLUSTALV比对方法”,该方法相当于称为CLUSTALV在HIGGINS和SHARP,CABIOS51511531989;HIGGINS,DG等人,COMPUTAPPLBIOSCI,81891911992,并且可以在LASERGENE生物信息学计算软件包DNASTARINC中的MEGALIGNTM程序中找到的比对方法。对于多重比对,默认值对应于缺口罚分GAPPENALTY10和缺口长度罚分GAPLENGTHPENALTY10。用CLUSTAL方法进行成对比对和蛋白质序列的百分比同一性计算的默认参数为KTUPLE1、缺口罚分3、窗口WIN。

30、DOW5和DIAGONALSSAVED5。对于核酸,这些参数为KTUPLE2,缺口罚分5,窗口4和DIAGONALSSAVED4。在用CLUSTALV程序进行序列比对后,有可能说明书CN102016013ACN102016023A6/22页9通过观察相同程序中的“序列距离”表来获得“百分比同一性”。此外,也可以使用“CLUSTALW比对方法”,该方法相当于称为CLUSTALW在HIGGINS和SHARP,CABIOS51511531989;HIGGINS,DG等人,COMPUTAPPLBIOSCI81891911992中有所描述和可以在LASERGENE生物信息学计算软件包DNASTARINC。

31、中的MEGALIGNTMV61程序中找到的比对方法。用于多重比对的默认参数缺口罚分10、缺口长度罚分02、延迟发散序列DELAYDIVERGENSEQS30、DNA转换权重DNATRANSITIONWEIGHT05、蛋白质权重矩阵PROTEINWEIGHTMATRIXGONNET系列和DNA权重矩阵DNAWEIGHTMATRIXIUB。在使用CLUSTALW程序对序列进行比对之后,可通过查看同一程序中的“序列距离”表来获得“百分比同一性”。0065本领域的技术人员非常清楚,多种程度的序列同一性可用于从其他物种中鉴定多肽,其中这类多肽具有相同或相似的功能或活性。可用的同一性百分比的实例包括但不限。

32、于70、75、80、85、90、或95、或者从70至100的任何整数百分比都可用于描述本发明,例如70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98或99。合适的核酸片段编码具有以上同一性并且通常编码具有至少约250个氨基酸,优选至少300个氨基酸,并且最优选至少约348个氨基酸的多肽。0066术语“序列分析软件”指可用于分析核苷酸或氨基酸序列的任何计算机算法或软件程序。“序列分析软件”可商购获得或独立开发。典型的序列分析软件包括但不限于1GCG程序包WISCONSINPA。

33、CKAGE90版,GENETICSCOMPUTERGROUPGCG,MADISON,WI;2BLASTP、BLASTN、BLASTXALTSCHUL等人,JBIOL,2154034101990;3DNASTARDNASTAR有限公司,MADISON,WI;4SEQUENCHERGENECODESCORPORATION,ANNARBOR,MI;和5整合了SMITHWATERMAN算法的FASTA程序WRPEARSON,COMPUTMETHODSGENOMERES,PROCINTSYMP1994,公开时间1992,11120编辑SUHAI,SANDORPLENUMNEWYORK,NY。在本专利申请。

34、的上下文中应当理解,使用序列分析软件进行分析时,除非另外指明,否则分析结果将基于所参考程序的“默认值”。在此所用的“默认值”将指在首次初始化软件时软件最初加载的任何值或参数集。0067氨基酸或核苷酸序列的“基本部分”指这样的部分,该部分包括的多肽的氨基酸序列或基因的核苷酸序列足以推定鉴定所述多肽或基因,所述鉴定或者可以由本领域技术人员通过人工评价序列来完成,或者可以利用诸如BLASTALTSCHUL,SF等人,JMOLBIO,2154034101993之类的算法通过计算机自动化序列比较和鉴定来完成。一般来讲,为了推测鉴定多肽或核酸序列是否与已知的蛋白质或基因同源,需要有10个或更多邻接氨基酸或。

35、者30个或更多核苷酸的序列。此外,对于核苷酸序列,包含2030个邻接核苷酸的基因特异性寡核苷酸探针可用于序列依赖性的基因鉴定如DNA杂交和基因分离如细菌菌落或噬斑的原位杂交的方法中。此外,1215个碱基的短寡核苷酸可在PCR中用作扩增引物,以便获得包含该引物的特定核酸片段。因此,核苷酸序列的“基本部分”所包含的序列应足以特异性地鉴定和/或分离包含该序列的核酸片段。本说明书教导了编码特定醇脱氢酶蛋白的完整的氨基酸和核苷酸序列。利用本文说明书CN102016013ACN102016023A7/22页10所公开的序列,技术人员现在可以利用本发明所公开序列的全部或基本部分,以用于本领域技术人员已知的目。

36、的。因此,本发明包括如随附的序列表中所示的完整序列,以及如上文定义的这些序列的基本部分。0068本发明涵盖的不仅仅是具体的示例性序列,因为本领域熟知的是不影响编码蛋白的功能特性的氨基酸序列或编码区中的改变其中一个化学上等同的氨基酸在给定位点上被取代是常见的。为了本发明的目的,取代定义为在下述5组之一内的交换00691小的脂族非极性残基或微极性的残基ALA、SER、THRPRO、GLY;00702极性的、带负电荷的残基和它们的酰胺ASP、ASN、GLU、GLN;00713极性的、带正电荷的残基HIS、ARG、LYS;00724大的脂族非极性残基MET、LEU、ILE、VALCYS;以及00735。

37、大的芳族残基PHE、TYR、TRP。0074因此,关于氨基酸丙氨酸一种疏水性氨基酸的密码子可以被编码另一个疏水性更弱的残基例如甘氨酸或疏水性更强的残基例如缬氨酸、亮氨酸或异亮氨酸取代。类似地,导致用一个带负电荷的残基替换另一个带负电荷的残基例如天冬氨酸替代谷氨酸或者一个带正电荷的残基替换另一个带正电荷的残基例如赖氨酸替换精氨酸的改变也可以预期产生功能上等价的产物。在许多情况下,导致蛋白质分子的N末端和C末端部分改变的核苷酸变化也预期不改变蛋白质的活性。因此本发明涵盖具有所述密码子变异的编码区和具有所述氨基酸变异的蛋白。0075如本文所用,术语“编码序列”或“CDS”是指编码特定氨基酸序列的DN。

38、A序列。“合适的调控序列”指位于编码序列的上游5非编码序列、中间或下游3非编码序列的核苷酸序列,其可影响转录、RNA加工或稳定性,或者相关编码序列的翻译。调节序列可包括启动子、翻译前导序列、内含子、多腺苷酸化识别序列、RNA加工位点、效应子结合位点和茎环结构。0076术语“启动子”指能够控制编码序列或功能性RNA表达的DNA序列。一般来讲,编码序列位于启动子序列的3端。启动子可整个源于天然基因,或者由源于不同的天然存在的启动子的不同元件组成,或者甚至包含合成的DNA片段。本领域内的技术人员应当理解,不同的启动子可以在不同的组织或细胞类型中,或者在不同的发育阶段,或者响应不同的环境条件或生理条件。

39、而引导基因的表达。导致基因在大部分时间内在大多数细胞类型中表达的启动子通常称为“组成型启动子”。还应当进一步认识到,由于在大多数情况下调节序列的确切边界尚未完全确定,因此不同长度的DNA片段可能具有相同的启动子活性。0077术语“可操作地连接”指单个核酸片段上的核酸序列的关联,使得其中一个核酸序列的功能受到另一个核酸序列的影响。例如,当启动子能够影响编码序列的表达即,该编码序列受到该启动子的转录控制时,则该启动子与该编码序列可操作地连接。编码序列可以以有义或反义的取向可操作地连接至调节序列。0078如本文所用,术语“表达”指源于本发明核酸片段的有义RNAMRNA或反义RNA的转录和稳定积聚。表。

40、达也可指将MRNA翻译成多肽。0079如本文所用,术语“转化”指将核酸片段转移至宿主生物体内,导致在基因上稳定遗传。含有转化核酸片段的宿主生物被称为“转基因”或“重组”或“转化”生说明书CN102016013ACN102016023A8/22页11物体。0080术语“质粒”和“载体”指通常携带有不属于细胞中心代谢的部分的基因的染色体外元件,并且常常是环状双链DNA片段的形式。这类元件可为源自任何来源的自主复制序列、基因组整合序列、噬菌体或单链或双链DNA或RNA的核苷酸序列线性或环状,其中多个核苷酸序列已连接或重组进入一种独特构建体中,该独特构建体能够将所选基因产物的启动子片段和DNA序列与相。

41、应的3末端非翻译序列一起引入细胞中。“转化载体”指含有外来基因并且除了该外来基因外还含有有利于转化特定宿主细胞转化的元件的特定载体。0081如本文所用,术语“密码子简并性”指允许核苷酸序列在不影响所编码的多肽的氨基酸序列的情况下发生变化的遗传密码的性质。技术人员非常了解具体宿主细胞在使用核苷酸密码子确定给定氨基酸时所表现出的“密码子偏好性”。因此,当合成基因用以改善在宿主细胞中的表达时,希望对基因进行设计,使得其密码子使用频率接近该宿主细胞优选的密码子使用频率。0082术语“经密码子优化的”在其涉及用于转化不同宿主的核酸分子的基因或编码区时是指在不改变由DNA编码的多肽的情况下,改变核酸分子的。

42、基因或编码区中的密码子以反映宿主生物体通常的密码子使用。0083本文使用的标准重组DNA和分子克隆技术是本领域熟知的并且已经在如下文献中有所描述SAMBROOK,J,FRITSCH,EF和MANIATIS,T的MOLECULARCLONINGALABORATORYMANUAL,第二版,COLDSPRINGHARBORLABORATORYPRESS,COLDSPRINGHARBOR,NY1989下文称为“MANIATIS”;以及SILHAVY,TJ,BENNAN,ML和ENQUIST,LW,EXPERIMENTSWITHGENEFUSIONS,COLDSPRINGHARBORLABORATORY。

43、PRESS,COLDSPRINGHARBOR,NY1984;以及AUSUBEL,FM等人,CURRENTPROTOCOLSINMOLECULARBIOLOGY,GREENEPUBLISHINGASSOCANDWILEYINTERSCIENCE1987。该处使用的附加方法是在METHODSINENZYMOLOGY,第194卷,GUIDETOYEASTGENETICSANDMOLECULARANDCELLBIOLOGYPARTA,2004,CHRISTINEGUTHRIE和GERALDRFINK编辑,ELSEVIERACADEMICPRESS,SANDIEGO,CA中的方法。0084木糖氧化无色杆。

44、菌的丁醇脱氢酶活性0085通过在包含1丁醇的培养基上的连续培养富集环境污泥样本,申请人能分离能够利用1丁醇作唯一碳源的微生物。一种分离蛋白通过其16SRRNA序列鉴定为属于菌种木糖氧化无色杆菌。申请人发现该分离蛋白有丁醇脱氢酶活性,它可相互转化丁醛和1丁醇。申请人也发现该丁醇脱氢酶活性也催化异丁醛和异丁醇、以及2丁酮和2丁醇的相互转化。令人惊讶地是,该酶对替代底物的动力学常数与对用于富集培养基的1丁醇底物的动力学常数相当或比其更高。这些结果指示可使用该木糖氧化无色杆菌丁醇脱氢酶在分别具有丁醛、异丁醛或2丁酮底物来源的重组微生物宿主细胞中生产1丁醇、异丁醇、或2丁醇。0086丁醇脱氢酶蛋白和编码。

45、序列0087在木糖氧化无色杆菌中鉴定的核苷酸序列编码具有丁醇脱氢酶活性称为SADB的酶,该序列如SEQIDNO1所示。全长蛋白的氨基酸序列如SEQIDNO2所示。该氨基酸序列与公开数据库中的序列的比较结果揭示该蛋白具有与已知醇脱氢酶的令人说明书CN102016013ACN102016023A9/22页12惊讶的低相似性。使用具有计分矩阵BLOSUM62的BLAST,期望临界值CUTOFF为10并且定序列长度WORDSIZE为3,测得最相似的已知序列与SEQIDNO2在其长度为348个氨基酸的部分上具有67的同一性。使用的空位开放罚分为11,空位延伸为1。发现与脑膜炎奈瑟氏球菌NEISSERIA。

46、MENINGITIDISMC58ACCESSIONAAF417591含锌醇脱氢酶的最高相似度为67的氨基酸同一性,与无乳支原体MYCOPLASMAAGALACTIAEACCESSIONA5IY63含锌醇脱氢酶的最高相似度为67的氨基酸同一性。其氨基酸序列与木糖氧化无色杆菌丁醇脱氢酶的序列SEQIDNO2具有大于67的同一性的蛋白是本发明的蛋白,它在本文中被鉴定并分离。本发明蛋白的氨基酸序列与SEQIDNO2具有至少约7075,约7580,约8085,或者约8590的同一性,其中更优选约9095的同一性。最优选的氨基酸序列与SEQIDNO2具有至少约95的同一性。0088使用BLAST默认参数与。

47、公开序列进行比较时,编码木糖氧化无色杆菌丁醇脱氢酶的核酸序列SEQIDNO1与编码脑膜炎奈瑟氏球菌MC58含锌醇脱氢酶ACCESSIONNC003112的序列具有最高的同一性约65。本发明的核酸分子是那些能够编码至少约250个氨基酸并且具有丁醇脱氢酶活性的多肽,它具有与SEQIDNO2至少约70的同一性。核酸分子可编码至少约300个氨基酸或者约348个氨基酸的多肽。核酸分子可编码与SEQIDNO2具有至少约7580、8085、8590、9095、或95100的同一性的多肽。0089本发明的附加核酸分子可通过与编码丁醇脱氢酶的SEQIDNO2的核酸分子在以下条件下杂交进行鉴定01XSSC,01S。

48、DS,65并且用2XSSC,01SDS洗涤,随后用01XSSC,01SDS洗涤。在本发明的方面中附加地包括与任何上述核酸分子互补的核酸分子。最合适的是编码SEQIDNO2的多肽的核酸分子,其实例是SEQIDNO1和3。由于遗传密码的简并性,多个核酸序列可编码SEQIDNO2的多肽,这是本领域的技术人员熟知的。例如编码序列可经密码子优化用于在特定宿主中的最大化表达,如序列经密码子经优化以在啤酒糖酵母中表达,即SEQIDNO3。0090同源物的分离0091编码木糖氧化无色杆菌丁醇脱氢酶的核酸分子,例如SEQIDNO1可用于分离编码同源蛋白的核酸分子,所述核酸分子与来自相同或其他微生物菌种的这种核酸。

49、片段具有至少7075、7580、8085、8590、9095、或95100的序列同一性。可如下评估编码的同源蛋白的丁醇脱氢酶活性。使用序列依赖性规程分离同源物是本领域熟知的。序列依赖型规程的实例包括但不限于核酸杂交方法、DNA和RNA扩增方法例如核酸扩增技术的多种应用例如聚合酶链反应PCR,MULLIS等人,美国专利公开4,683,202;连接酶链反应LCR,TABOR,S等人,PROCNATLACADSCIUSA82,1074,1985;或链置换扩增反应SDA,WALKER等人,PROCNATLACADSCIUSA,89392,1992。0092例如,本发明的核酸片段可通过使用所有或部分SEQIDNO1的核酸片段作为DNA杂交探针,使用本领域的技术人员熟知的方法来筛选来自任何所需细菌的文库而得以直接分离。基于SEQIDNO1的特异性,寡核苷酸探针可通过本领域已知的方法MANIATIS,同上设计和合成。此外序列可直接用于通过熟练技术人员已知的方法,例说明书CN102016013ACN102016023A10/22页13如随机。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 化学;冶金 > 生物化学;啤酒;烈性酒;果汁酒;醋;微生物学;酶学;突变或遗传工程


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1