杂合-淀粉酶.pdf

上传人:1520****312 文档编号:8859211 上传时间:2021-01-08 格式:PDF 页数:42 大小:1.73MB
返回 下载 相关 举报
摘要
申请专利号:

CN200980150419.2

申请日:

20091211

公开号:

CN102245764A

公开日:

20111116

当前法律状态:

有效性:

有效

法律详情:

IPC分类号:

C12N9/28,C12N15/56,C07K19/00,C12N1/15,C12N1/21

主分类号:

C12N9/28,C12N15/56,C07K19/00,C12N1/15,C12N1/21

申请人:

丹尼斯科美国公司

发明人:

S·D·鲍尔,A·肖

地址:

美国加利福尼亚州

优先权:

61/122,628

专利代理机构:

北京市中咨律师事务所

代理人:

胡志君;黄革生

PDF下载: PDF下载
内容摘要

提供了与野生型透阿米尔样α-淀粉酶例如芽孢杆菌淀粉酶整体或部分地共享保守3D结构的杂合α-淀粉酶。在该杂合体中,透阿米尔样α-淀粉酶的N端部分以来自古细菌α-淀粉酶的序列替换。这两个淀粉酶序列之间的序列相似性可以小于60%。该杂合体中保留野生型3D结构有利于获得有酶活性的淀粉酶。在一个实施方案中,一个或两个淀粉酶序列向B结构域贡献残基,从而产生特别有利的特性。例如,用不结合Ca2+的古细菌α-淀粉酶的B结构域序列替换透阿米尔样α-淀粉酶B结构域中的Ca2+结合位点可以产生在Ca2+不存在下具有充分活性的杂合体。

权利要求书

1.杂合淀粉酶,其包含从N端至C端具有式(I)的多肽:A-x-y-B(I),其中A是来自古细菌α-淀粉酶的第一氨基酸序列;B是来自野生型透阿米尔样α-淀粉酶的或来自与野生型透阿米尔样α-淀粉酶具有至少80%序列同一性的变体的第二氨基酸序列;x是第一氨基酸序列的C端残基;y是第二氨基酸序列的N端残基;其中第一和第二氨基酸序列一起含有约400至约500个氨基酸残基;其中杂合淀粉酶中约10%至约80%之间的总氨基酸由古细菌α-淀粉酶贡献;并且其中与野生型透阿米尔样α-淀粉酶相比,残基x和y在杂合淀粉酶中是结构上保守的。 2.权利要求1所述的杂合淀粉酶,其中与野生型透阿米尔样α-淀粉酶相比,杂合淀粉酶具有改变水平的重组表达、溶解度、pH活性谱、底物特异性或比活性。 3.权利要求1所述的杂合淀粉酶,其中与野生型透阿米尔样α-淀粉酶三维结构相比,残基x和y中的α-碳之间的均方根距离不多于约 4.权利要求1所述的杂合淀粉酶,其中与野生型透阿米尔样α-淀粉酶相比,第一氨基酸序列A在杂合淀粉酶中是结构上保守的。 5.权利要求1所述的杂合淀粉酶,其中野生型透阿米尔样α-淀粉酶是芽孢杆菌(Bacillus)α-淀粉酶。 6.权利要求5所述的杂合淀粉酶,其中芽孢杆菌α-淀粉酶是嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)α-淀粉酶、地衣芽孢杆菌(B.licheniformis)α-淀粉酶、枯草芽孢杆菌(B.subtilis)α-淀粉酶、芽孢杆菌属物种(Bacillus sp.)KSM-K38α-淀粉酶或盐敏芽孢杆菌(B.halmapalus)α-淀粉酶。 7.权利要求6所述的杂合淀粉酶,其中芽孢杆菌α-淀粉酶是嗜热脂肪芽孢杆菌α-淀粉酶。 8.权利要求1所述的杂合淀粉酶,其中野生型透阿米尔样α-淀粉酶是嗜热脂肪芽孢杆菌α-淀粉酶的变体,其中淀粉结合结构域从嗜热脂肪芽孢杆菌α-淀粉酶的羧基端移除。 9.权利要求1所述的杂合淀粉酶,其中古细菌α-淀粉酶是Ultrathinα-淀粉酶。 10.权利要求1所述的杂合淀粉酶,其中第一和第二氨基酸序列从共享小于约60%序列同一性的淀粉酶衍生。 11.权利要求1所述的杂合淀粉酶,其中残基x和y在B结构域中。 12.权利要求1所述的杂合淀粉酶,其中第一氨基酸序列贡献B结构域的至少80%氨基酸残基。 13.权利要求1所述的杂合淀粉酶,其中第一氨基酸序列包含Zn结合位点。 14.权利要求1所述的杂合淀粉酶,其中野生型透阿米尔样α-淀粉酶的Ca结合位点中的至少一个氨基酸以来自第一氨基酸序列的氨基酸残基替换。 15.权利要求1所述的杂合淀粉酶,其中杂合淀粉酶具有α-淀粉酶活性,并且其中该活性不受Ca浓度影响。 16.权利要求1所述的杂合淀粉酶,其包含SEQ ID NO:1-8任一序列中所示的氨基酸序列。 17.权利要求16所述的杂合淀粉酶,其中淀粉酶包含SEQ ID NOS:1、2、6、7或8任一序列中所示的氨基酸序列。 18.权利要求1所述的杂合淀粉酶,其中杂合淀粉酶是被纯化的。 19.核酸,其编码权利要求1的杂合淀粉酶。 20.载体,其包含权利要求19的核酸。 21.宿主细胞,其包含权利要求19的核酸或权利要求20的载体。 22.权利要求21所述的宿主细胞,其中宿主细胞是细菌或真菌。 23.权利要求22所述的宿主细胞,其中细菌是芽孢杆菌属物种(Bacillus sp)。 24.一种设计权利要求19的核酸的方法,包括:(a)在计算机执行的操作中比对古细菌α-淀粉酶和野生型透阿米尔样α-淀粉酶的3D结构;(b)选择结构上保守的氨基酸残基x和y;和(c)设计编码杂合淀粉酶的核酸。 25.权利要求24所述的方法,其中与野生型透阿米尔α-淀粉酶三维结构相比,残基x和y中的α-碳之间的均方根距离不多于约 26.权利要求25所述的方法,其中计算机执行的操作包括在计算机监视器上显示三维结构比对结果。

说明书

序列表

附上包含SEQ ID NO:1-27的序列表并将其通过引用的方式完整并 入。

优先权

本申请要求2008年12月15日提交的由此通过引用方式并入的美国临 时申请系列号61/122,628的优先权。

发明领域

提供了包含古细菌(archae)α-淀粉酶序列和透阿米尔样α-淀粉酶 (Termamyl-like α-amylase)序列的杂合淀粉酶。与野生型透阿米尔样α- 淀粉酶相比,该杂合淀粉酶可以具有改变的特性。

发明背景

具有共同功能的相关酶可以具有或可以不具有显著的序列同一性。例 如,若其氨基酸序列与地衣芽孢杆菌(B.licheniformis)α-淀粉酶共有60%或 更高的同一性,则芽孢杆菌(Bacillus)α-淀粉酶(1,4-α-D-葡聚糖葡聚糖水解 酶,EC 3.2.1.1)分类为“透阿米尔样”。参见WO 96/23874。可以在共享62% 或更高序列同一性的淀粉酶之间产生杂合淀粉酶。参见Gray等人,J. Bacteriology 166:635-43(1986);美国专利号6,143,708。例如,已经重组 表达并且结晶出含有解淀粉芽孢杆菌(Bacillus amyloliquefaciens)第1-300 位残基和地衣芽孢杆菌第301-483位残基的嵌合淀粉酶。见Brzozowski等 人,Biochemistry 39:9099-107(2000);还见WO 96/23874;WO 97/41213。 然而,甚至共享小于25%序列同一性的淀粉酶如来自枯草芽孢杆菌 (Bacillus subtilis)和地衣芽孢杆菌的淀粉酶却可以共享共同的催化功能和 总体保守的三维立体(3D)折叠。

许多淀粉酶的晶体结构是目前可获得的。见上文Brzozowski等人 (2000)。Protein Data Bank(PDB)例如含有至少在表1中所示的淀粉酶的 3D结构。

表1

这些晶体结构的比较揭示了三维(3D)结构的高度保守性,甚至在不存 在明显的序列相似性时。所报道的全部α-淀粉酶结构共享有(β/α)8催化核 心结构域,为结构域A。“(β/α)8”指定义为保守蛋白质3D构象的所谓“TIM 桶结构”或由沿着肽主链交替分布的8个α-螺旋和8条平行β-链组成的“折 叠”。见Lolis等人,Biochemistry 29:6609-18(1990)。B结构域是结构域A 的桶状链β-3与螺旋α-3之间的偏移(excursion)或延伸结构。一般为8链β 折叠的C结构域形成淀粉酶的其余C端部分。下文更详细地描述淀粉酶的 结构域构造。

本领域对提供变体α-淀粉酶存在持续需求,其中所述的变体α-淀粉酶 在重组宿主细胞中正确折叠、维持稳定性并展示高效表达,而无需对蛋白 质的氨基酸序列或3D结构做出大规模改变。

发明概述

使用透阿米尔样α-淀粉酶的3D结构作为构建新杂合α-淀粉酶的准则。 在杂合淀粉酶中,透阿米尔样α-淀粉酶N端的一部分以来自古细菌淀粉酶 的序列替换。这两种淀粉酶共享保守的3D结构。另外,所述淀粉酶之间 的序列同一性可以小于60%。在一个实施方案中,杂合淀粉酶含有约400 至约500个氨基酸残基。杂合淀粉酶中约10%和约80%之间的总氨基酸由 古细菌α-淀粉酶贡献。预测杂合酶中被替换的部分具有在结构上整体或部 分地与透阿米尔样淀粉酶保守的3D结构。在一个实施方案中,至少古细 菌淀粉酶序列的C端残基(残基“x”)和透阿米尔样淀粉酶序列的N端残基 (残基“y”)是结构上保守的。该杂合淀粉酶可以有利地组合构成性淀粉酶序 列的所希望有的特性,如改变水平的重组表达、改变的溶解度,和所希望 有的性能特性,如最适pH活性谱、底物特异性、产物特征和比活性。

由于蛋白质结构域经常被认为折叠成独立的单元,故可能期望不得不 将结构域作为整体单元替换以在杂合酶中维持正确的折叠。然而,通过设 计杂合体以维持野生型芽孢杆菌酶的保守折叠,α-淀粉酶序列不需要在结 构域边界处融合。在一些实施方案中,杂合淀粉酶包含来自第一α-淀粉酶 的含有一部分B结构域的第一氨基酸序列,其与来自芽孢杆菌α-淀粉酶的 含有B结构域其余部分的第二氨基酸序列融合。以这种方式,可以设计具 有独特特性的杂合淀粉酶,这取决于融合在一起的B结构域的特定部分。

例如,某些实施方案涉及的杂合淀粉酶含有来自嗜热脂肪芽孢杆菌α- 淀粉酶(AmyS;本领域也称作嗜热脂肪土芽孢杆菌(Geobacillus  stearothermophilus))的序列,其与来自“Ultrathin”(一种在Richardson等 人.,J.Biol.Chem.277:26501-07(2002)中公开的古细菌α-淀粉酶 (GenBankTM登录号AAM48114))的序列融合。在本文中公开的多个实施方 案中,杂合体的N端由来自Ultrathin的氨基酸残基(即,第一氨基酸序列) 组成,而C端由来自AmyS的氨基酸残基(即,第二氨基酸序列)组成。具 体的Ultrathin残基命名为“UT n”,其中n是自N端起的氨基酸残基编号。 例如,Ultrathin的第104位残基命名为“UT 104”。术语“des-Met Ultrathin” 指缺N端甲硫氨酸残基的Ultrathin。Ultrathin第1-104位残基与AmyS 第100-483位残基之间的杂合淀粉酶例如命名为“UT 1-104:AmyS 100-483”。

象其他古细菌淀粉酶,Ultrathin在B结构域中具有Zn2+结合位点。 相反,芽孢杆菌α-淀粉酶的B结构域具有Ca2+-Na+-Ca2+结合位点。含有 与来自芽孢杆菌α-淀粉酶的剩余B结构域融合的Ultrathin Zn2+结合位点 的杂合体可以具有芽孢杆菌α-淀粉酶的性能特征,而不需要Ca2+用于酶活 性。与另一种酶如葡糖淀粉酶组合使用时,这种杂合淀粉酶可能特别有用, 其中所述的另一种酶具有不同于野生型芽孢杆菌α-淀粉酶的钙需求。例 如,该杂合淀粉酶可以用来例如在与葡糖淀粉酶相同的反应容器中糖化淀 粉,其中Ca2+浓度可以针对该葡糖淀粉酶的性能进行优化。

因此,本公开提供杂合淀粉酶,其包含从氨基端至羧基端具有式(I)的 多肽:

A-x-y-B(I),

其中A是来自古细菌α-淀粉酶的第一氨基酸序列,B是来自野生型透 阿米尔样α-淀粉酶或其变体的第二氨基酸序列,x是第一氨基酸序列的C 端残基,并且y是第二氨基酸序列的N端残基。透阿米尔样α-淀粉酶变体 可以与野生型透阿米尔样α-淀粉酶具有至少约80%、约85%、约90%、 约95%、或约99%序列同一性。第一和第二氨基酸序列一起可以含有约 400、约410、约420、约430、约440、约450、约460、约470、约480、 约490或约500个氨基酸残基。该杂合淀粉酶中约10%、约20%、约30%、 约40%、约50%、约60%、约70%或约80%的氨基酸可以由古细菌α- 淀粉酶贡献。与野生型透阿米尔样α-淀粉酶相比,残基x和y在杂合淀粉 酶中均是结构上保守的。该杂合淀粉酶可以包含SEQ ID NO:1-8任一者 中所示的氨基酸序列。在又一个方面,该杂合淀粉酶可以被纯化。

在一个方面,与野生型透阿米尔α-淀粉酶3D结构相比,残基x和y 中的α-碳之间的均方根距离不多于约约约约或约在另一个方面,与野生型透阿米尔样α-淀粉酶相比,第一氨 基酸序列A在杂合淀粉酶中是结构上保守的。野生型透阿米尔样α-淀粉酶 可以是芽孢杆菌α-淀粉酶。该芽孢杆菌α-淀粉酶可以是嗜热脂肪芽孢杆菌 α-淀粉酶、地衣芽孢杆菌α-淀粉酶、枯草芽孢杆菌α-淀粉酶、芽孢杆菌属 物种KSM-K38α-淀粉酶或盐敏芽孢杆菌α-淀粉酶。透阿米尔样α-淀粉酶 变体可以通过去掉亲本酶的C端从嗜热脂肪芽孢杆菌α-淀粉酶衍生。古细 菌α-淀粉酶可以是Ultrathinα-淀粉酶。杂合淀粉酶的第一和第二氨基酸 序列从可以共享小于约60%、约55%、约50%、约45%、约40%、约 35%或约30%序列同一性的淀粉酶衍生。也构思了在其第一氨基酸序列内 部包含Zn2+结合位点的杂合淀粉酶。该杂合淀粉酶可以使得野生型透阿米 尔样α-淀粉酶的Ca2+结合位点的至少一个氨基酸置换为来自第一氨基酸 序列的氨基酸残基。

在又一个方面,残基x和y处于B结构域中。第一氨基酸序列可以贡 献B结构域的至少约80%、约85%、约90%、约95%或约98%氨基酸残 基。

另一方面构思了与野生型透阿米尔样α-淀粉酶相比,具有改变水平的 重组表达、溶解度、pH活性谱、底物特异性或比活性的杂合淀粉酶。该 杂合淀粉酶可以具有不受Ca2+浓度影响的α-淀粉酶活性。

也构思了编码如现在公开的杂合淀粉酶的核酸。又一个方面是包含该 核酸的载体。又一个方面构思了含有该核酸或载体的宿主细胞。宿主细胞 可以是细菌或真菌。在又一个方面,细菌可以是芽孢杆菌属物种。

又一个方面构思了设计编码杂合酶的核酸的方法。该方法包括:在计 算机执行的操作中比对古细菌α-淀粉酶和野生型透阿米尔样α-淀粉酶的 3D结构,选择结构上保守的氨基酸残基x和y,并且设计编码该杂合酶的 核酸。计算机执行的操作可以包括在计算机监视器上显示3D结构比对结 果。与野生型透阿米尔α-淀粉酶3D结构相比,残基x和y中的α-碳之间 的均方根距离不多于约约约约或约

附图简述

并入附图在本说明书中,并且它们构成本说明书的一部分并说明多个 实施方案。

图1描述了成熟形式(即缺少信号序列)的嗜热脂肪芽孢杆菌α-淀粉酶 (“MatAmyS”:SEQ ID NO:10)和成熟形式的des-Met Ultrathin淀粉酶 (“MatUltrathin”:SEQ ID NO:9)之间的氨基酸序列比对和共有序列。

图2描述了使用比色淀粉酶测试法(Magle Life Sciences)时 多种淀粉酶的相对活性。底物由带有化学连接的水溶性蓝色染料的水不溶 性淀粉微球组成。淀粉酶水解该淀粉,从而释放通过620nm处吸收的变 化所测量的蓝色染料。在pH 7(分图A)和pH 10(分图B)上检测培养上清液 样品的稀释物系列。将任意单位的吸光度作为淀粉酶试样的稀释的函数作 图。分析了以下杂合淀粉酶:

杂合体A:UT 1-104:AmyS 100-483(SEQ ID NO:1);

杂合体B:UT 1-113:AmyS 109-483(SEQ ID NO:2);

杂合体C:UT 1-128:AmyS 140-483(SEQ ID NO:3);

杂合体D:UT 1-145:AmyS 161-483(SEQ ID NO:4);

杂合体E:UT 1-163:AmyS 203-483(SEQ ID NO:5);

杂合体F:UT 1-175:AmyS 215-483(SEQ ID NO:6);

杂合体G:UT 1-191:AmyS 228-483(SEQ ID NO:7);和

杂合体H:UT 1-209:AmyS 246-483(SEQ ID NO:8)。

图3描述了des-Met Ultrathin淀粉酶(SEQ ID NO:9)的氨基酸序列。 粗体、加下划线的氨基酸残基表示图2中所示的杂合体中Ultrathin部分的 多个C端残基。将UltrathinS中的“交换(cross-over)位置”以粗体并加下划 线显示。

图4描述了具有去掉淀粉结合结构域的C端截短的AmyS变体的氨基 酸序列(SEQ ID NO:11)。粗体、加下划线的氨基酸残基表示图2中所示的 杂合体中AmyS部分的N端残基。将AmyS中的“交换位置”以粗体并加下 划线显示。

图5A描述了AmyS的两个立体视图,B-结构域为黑体。B-结构域后 的圆球代表结合的Na+和Ca2+的原子。

图5B描述了UT 1-104:AmyS 100-483的两个立体视图,残基UT 1-104 为黑体。B-结构域后的圆球代表结合的Na+和Ca2+的原子。

图5C描述了UT 1-209:AmyS 246-483的两个立体视图,残基UT 1-209为黑体。B-结构域后的圆球代表结合的Na+和Ca2+的原子。

发明详述

提供了与野生型透阿米尔样α-淀粉酶例如芽孢杆菌淀粉酶整体或部 分地共享保守3D结构的杂合α-淀粉酶。在该杂合体中,透阿米尔样α-淀 粉酶的N端部分用来自古细菌α-淀粉酶的序列替换。这两个淀粉酶之间的 序列相似性可以小于60%。该杂合体中保留野生型3D结构有利于获得有 酶活性的淀粉酶。在一个实施方案中,一个或两个淀粉酶序列向B结构域 贡献残基,从而产生特别有利的特性。例如,用不结合Ca2+的古细菌α- 淀粉酶的B结构域序列替换透阿米尔样α-淀粉酶B结构域中的Ca2+结合 位点可以产生在Ca2+不存在下具有充分活性的杂合体。

1.定义和缩写

根据这份详细的描述,以下缩写和定义适用。应当指出如本文中所用, 单数形式“一个”、“一种”和“该”包括复数称谓,除非上下文另外清楚地指 出并非如此。因此,例如,对“一种酶”的提及包括多种此类酶,并且对“该 制剂”的提及包括对本领域技术人员已知的一种或多种制剂和其等同物的 提及等。

除非另外定义,本文中所用的全部技术及科学术语具有与本领域普通 技术人员通常所理解的相同意义。下文提供以下术语。

1.1.定义

如本文中所用,“古细菌”指与原核生物和真核生物明显不同的一个界 的单细胞生物。古细菌包括嗜热菌、嗜盐菌和产甲烷菌。

淀粉酶是切割淀粉中α-D-(1→4)O-糖苷键的羟化酶并且包括葡糖淀粉 酶和β-淀粉酶以及α-淀粉酶。然而,为本公开的目的,“淀粉酶”指α-淀粉 酶,除非另外指出并非如此。α-淀粉酶(EC 3.2.1.1;α-D-(1→4)-葡聚糖葡 聚糖水解酶)定义为以随机方式切割淀粉分子内部α-D-(1→4)O-糖苷键的 内切作用酶。相反,外切作用解淀粉酶,如β-淀粉酶(EC 3.2.1.2;α-D-(1→4)- 葡聚糖麦芽糖水解酶)和一些产物特异性淀粉酶如生麦芽糖α-淀粉酶(EC 3.2.1.133)从底物的非还原性末端切割淀粉分子。β-淀粉酶、α-葡糖苷酶(EC 3.2.1.20;α-D-葡糖苷葡萄糖水解酶)、葡糖淀粉酶(EC 3.2.1.3;α-D-(1→4)- 葡聚糖葡萄糖水解酶)和产物特异性淀粉酶可以从淀粉产生特定长度的麦 芽低聚糖。

“透阿米尔样”α-淀粉酶与野生型地衣芽孢杆菌α-淀粉酶具有至少约 60%序列同一性。

“野生型”酶指天然存在的酶。“野生型透阿米尔样α-淀粉酶”因而指与 野生型地衣芽孢杆菌α-淀粉酶具有至少约60%序列同一性的天然存在的 α-淀粉酶。

通过使用在美国国家医学图书馆国家生物技术信息中心(National  Center for Biotechnology Information(NCBI)of the National Library of  Medicine)的网站可获得的BLAST程序,以默认比对值比对两个序列并比 较它们来确定“序列同一性百分数”。

“变体”或“多个变体”可以指多肽或核酸。出于本公开的目的,“变体” 包括含有来自两种不同亲本淀粉酶的氨基酸序列的杂合蛋白。术语“变体” 可以与术语“突变体”可互换地使用。与野生型序列相比,变体分别包括在 氨基酸或核苷酸序列中的一个或多个位置处插入、替换、颠换、截短和/ 或倒位。短语“变体多肽”和“变体酶”因此意指蛋白质,其具有来自野生型 蛋白氨基酸序列的已经被修饰的氨基酸序列。变体多肽包括与亲本酶具有 某个百分数例如至少约80%、85%、90%、95%或99%序列同一性的多肽。 与野生型序列相比,变体可以具有1、2、3、4、5、10、15、20或30个或 在1-30范围内任意整数值的氨基酸置换、添加或缺失。变体可以表达为含 有异源多肽的融合蛋白。例如,变体可以包含另一种蛋白质的信号肽或设 计旨在辅助鉴定或纯化所表达融合蛋白的序列,如His标签序列。

术语“融合蛋白”指通过本领域已知的任意手段接合起来的两个或多个 多肽。这些手段包括化学合成法或通过重组工程剪接编码性核酸。

如本文中所用,术语“杂合蛋白”是特殊形式的融合蛋白。如同融合蛋 白,来自第一蛋白质(古细菌α-淀粉酶)的氨基酸序列与来自第二蛋白质(透 阿米尔样α-淀粉酶)的氨基酸序列融合或接合以形成杂合蛋白。在本公开的 杂合α-淀粉酶中,来自古细菌α-淀粉酶的第一氨基酸序列替换透阿米尔样 α-淀粉酶的一部分,同时保留透阿米尔样α-淀粉酶的所替换部分的全部或 部分3D结构。衍生杂合淀粉酶的古细菌α-淀粉酶和/或透阿米尔样α-淀粉 酶可以是野生型淀粉酶的“变体”。

“α-碳”指多肽链中的主链碳,是与羰基碳结合的碳。

如本文中所用,第一3D结构或折叠或其部分在比对结构从而α-碳的 均方根距离(RMSD)不多于约时与第二3D结构或其部分是“在结构上 保守的”。还见Orengo等人,Protein Eng.6:485-500(1993)。

如本文中所用,术语“片段”指多核苷酸序列或多肽序列,其小于全长 并且是包含两个或多个氨基酸或核酸残基(例如,5、10、15、20、30或50 个残基)的序列。

如本文中所用,术语“表达”指基于基因的核酸序列产生多肽的过程。 该过程包括转录和翻译。

“分离的”意指该序列至少基本上不含与所述序列天然相关并存在于自 然界中的至少一种其他组分,例如,基因组序列。

“纯化”意指该物质处于相对纯的状态,例如,至少约90%纯度,至少 约95%纯度或至少约98%纯度。

“热稳定的”意指该酶在暴露于升高的温度后仍保留活性。酶的热稳定 性由其半寿期(t1/2)度量,其中一半的酶活性在半寿期期间丧失。在定义的 条件下通过测量残余淀粉酶活性计算半寿期值。为测定酶的半寿期,将样 品加热至测试温度1-10分钟,并且使用用于该酶活性的标准测定法测量活 性。

如本文中所用,“氨基酸序列”同义于术语“多肽”和/或术语“蛋白质”。 在一些情况下,术语“氨基酸序列”同义于术语“肽”;在一些情况下,术语“氨 基酸序列”同义于术语“酶”。

如本文中所用,“核苷酸序列”或“核酸序列”指寡核苷酸序列或多核苷 酸序列和其变体、同源物、片段和衍生物。核苷酸序列可以是基因组的、 合成的或重组来源的并且可以是双链或单链,无论代表有义或反义链。如 本文中所用,术语“核苷酸序列”包括基因组DNA、cDNA、合成的DNA 和RNA。

“同源物”意指与主题氨基酸序列和主题核苷酸序列具有某种程度序列 同一性的实体。“同源序列”包括与另一个序列具有某个百分比例如至少约 80%、85%、90%、95%或99%的序列同一性的多核苷酸或多肽。一般而 言,同源物将包含与主题氨基酸序列相同的活性部位残基。虽然同源物可 以具有与野生型酶不同的酶特性,但是同源物也保留酶活性。

如本文中所用,“杂交”包括一条核酸链通过碱基配对作用与互补链结 合的过程,以及如聚合酶链反应(PCR)技术中那样所实施的扩增过程。变 体核酸可以作为单链或双链DNA或RNA、RNA/DNA异双链体或 RNA/DNA共聚物存在。如本文中所用,“共聚物”指同时包含核糖核苷酸 和脱氧核糖核苷酸的单条核酸链。变体核酸可以进行密码子优化以进一步 增加表达。

如本文中所用,通过体外化学或酶促合成产生“合成的化合物”。它包 括,但不限于采用宿主生物如酵母细胞宿主或所选其他表达宿主的最佳密 码子选择的情况下所产生的变体核酸。

如本文中所用,“转化细胞”包括已经利用重组DNA技术转化的细胞, 包括细菌细胞和真菌细胞。转化一般通过一个或多个核苷酸序列插入细胞 中发生。插入的核苷酸序列可以是异源核苷酸序列,即,是对待转化细胞 而言并非天然的序列,如融合蛋白。

如本文中所用,“有效连接”意指所述组件处于允许它们以其意图方式 发挥功能的关系。例如,与编码序列有效连接的调节序列以这样的方式连 接,从而在与该调控序列相容的条件下实现编码序列的表达。

如本文中所用,“生物活性的”指与天然存在序列具有相似的结构、调 节功能或生物化学功能的序列,尽管不必需是相同的程度。

如本文中所用,术语“淀粉”指由植物(如谷物)的复杂多糖碳水化合物 组成的任何物质,所述的复杂多糖碳水化合物由具有式(C6H10O5)x的直链 淀粉和支链淀粉组成,其中X可以是任意数字。

1.2.缩写

除非另外说明,使用以下缩写:

2.工程化具有保守3D结构的融合蛋白

当融合不相似的氨基酸序列以产生杂合酶时,特别当这两个序列在某 结构域的中央接合时,结构域结构可能被破坏。结构域结构的破坏转而可 以导致更低的活性和/或蛋白质折叠困难,从而导致所表达的融合蛋白的产 量损失。通过在来自第一蛋白质的氨基酸序列与来自芽孢杆菌蛋白质的氨 基酸序列之间选择适宜的融合位点解决这个该问题。即,这两个序列在这 两个淀粉酶序列的3D结构保守的位点处融合。以这种方式,当这两个序 列在杂合酶中接合时,发生最小的3D结构改变。另外,这种方法促进构 建有活性的杂合体,即便所述淀粉酶共享小于60%序列同一性时。

两种蛋白质的结构比对结果可以用来确定全部或部分的3D结构是否 在两种蛋白质之间是保守的。为此目的,第一蛋白质的3D结构可以叠加 到第二蛋白质的3D结构上或与之比对。这种叠加或比对可以在整个蛋白 质结构或二级结构元件范围内进行。例如,可以比对二级结构元件,如β- 桶中的中央β-链。叠加或比对结构的方法是本领域已知的。在一个实施方 案中,用计算机执行的操作,如Chemical Computing Group提供的分子 运行环境(Molecular Operating Environment)比对算法,实行比对。在另 一个实施方案中,比对的结果显示在计算机监视器或显示系统上。

当比对两个结构时,可以确定这两个结构的α-碳链的比对程度。选择 结构上保守的氨基酸。为本公开的目的,第一3D结构或折叠在结构中α- 碳的RMSD不多于约时是对第二3D结构“在结构上保守”。结构保守 性可以延伸遍及至少两个或多个氨基酸残基并且可以包括杂合淀粉酶中 古细菌α-淀粉酶贡献的整个部分。在一个实施方案中,结构保守的程度足 够高,以致α-碳的RMSD不多于约

杂合淀粉酶从N端至C端具有式(I)中所示的通式结构:

A-x-y-B(I),

其中A是来自古细菌α-淀粉酶的第一氨基酸序列,B是来自野生型透 阿米尔样α-淀粉酶或其变体的第二氨基酸序列,x是第一氨基酸序列的C 端残基,并且y是第二氨基酸序列的N端残基。在一个实施方案中,至少 残基x和y是对野生型透阿米尔样α-淀粉酶在结构上保守的。即,残基x 和y中α-碳的RMSD不多于约在另一个实施方案中,残基x和y中 α-碳的RMSD不多于约

与式(I)中x相对应的代表性氨基酸残基显示为图3中所述的粗体、加 下划线的氨基酸残基。与式(I)中y相对应的代表性氨基酸残基显示为图4 中所述的粗体、加下划线的氨基酸残基。残基x和y出现在“交换位置 (cross-over positions)”处。接合两种淀粉酶的序列以形成该杂合体的过程 可以通过本领域已知的任意方法进行。例如,氨基酸序列可以通过氨基酸 在多肽序列末端处的化学缀合作用接合。备选地,编码性核酸可以重组工 程化设计以在表达宿主细胞中编码杂合蛋白。重组工程化的方法是本领域 熟知的。例如可以在目前可获得的任意实验手册如Sambrook等人, MOLECULAR:A LABORATORY MANUAL,第3版,冷泉港实验室出版社,冷 泉港,纽约(Cold Spring Harbor Laboratory Press,Cold Spring Harbor, New York)(2001)中找到适宜的方法。

3.芽孢杆菌淀粉酶的结构域结构

芽孢杆菌α-淀粉酶由3个球状结构域A、B和C构成。充分讨论见 WO 96/23874。所述结构域可以定义为:结构域A是第1-103和第206-395 位残基,结构域B是第104-205位残基,并且结构域C是第396-483位残 基,编号参照地衣芽孢杆菌α-淀粉酶。芽孢杆菌α-淀粉酶是拉伸的分子, 最长轴是约垂直这个轴的最宽点是大约并且跨中央A结构域。 地衣芽孢杆菌α-淀粉酶的活性部位残基是D323、D231和E261。

3.1.结构域A

结构域A是最大的结构域并且含有活性部位,其包含一簇在该酶表面 的深裂口中的3个氨基酸残基。全部已知α-淀粉酶结构的结构域A均具有 相同的总体折叠,即,具有8条中央β-链和8个侧翼α-螺旋的(β/α)8桶。β- 链1的C末端通过名为环1的一个环与螺旋1连接,并且其他环存在相同 的模式。这些环显示尺寸上的某些变异,并且一些环可以是相当舒展的。

(β/α)8桶中的8条中央β-链在多种已知α-淀粉酶结构中充分地叠加, 并且该结构的这个部分,包括位于β-链C末端处的活性部位的密切环境, 在不同淀粉酶之间显示高的相似性。

连接β-链和α-螺旋的环在透阿米尔样α-淀粉酶和真菌α-淀粉酶之间 表现高的变异性。这些环构成活性部位的结构性环境,并且在位于这些环 中的残基之间存在与底物的大部分接触。此类重要特征如底物特异性、底 物结合、pH/活性谱、淀粉剪切模式由这些环中的氨基酸及它们的位置决 定。

3.2.结构域B

结构域B是具有极高数目带电荷残基的紧密结构域。B结构域作为结 构域A的链3与螺旋3之间的环的延伸出现并且含有一个5链反平行β折 叠结构,其含有至少一个长的环结构并具有连通性-1、+3、-1X、+2。见 Richardson,Adv.Protein Chem.34,167-339(1981)。

B结构域的前4条链形成2个发夹环,它们相互盘绕如一对交错的指 头(右手盘绕)。主链折叠成一条β-链,其连接两个小的β-折叠结构。在一 个折叠片中转一个弯后,主链折回并产生一个与α-淀粉酶结构中的结构域 A和一个内部孔相接触的双链折叠片。然后,主链向上折叠成一个小折叠 结构,几乎与头两个折叠片垂直。在进入β-链3顶部上的螺旋3之前,结 构域B中的大约24个最末氨基酸形成在结构域A的接触区域内的2个钙 结合位点。

结构域B通过两个肽段与结构域A连接,所述的两个肽段将结构域- 结构域接触区一分为二。结构域B通过一个钙结合区和一个含有水分子的 内埋孔洞与结构域A接触。存在许多类型的分子接触。酸性与碱性氨基酸 之间的离子相互作用是可能的,这些相互作用对高pH时的总体稳定性并 对保持钙结合位点完整是极重要的。

3.3.结构域C

结构域C是由第394-483位氨基酸组成的该蛋白质C端。结构域C完 全由β-链组成,所述的β-链形成自身回折的单一8链折叠结构。这个折叠 结构因而可以描述为β-夹心结构。连通性是+1、+1、+5、-3、+1、+1、-3, 虽然链6和链7仅松散地连接。β折叠的一部分形成针对结构域A的界面。

3.4.Ca2+-结合位点和Na+-结合位点

透阿米尔样α-淀粉酶的结构含有4个钙结合位点和1个钠结合位点, 虽然所述钙离子之一显示极弱的配位作用。所述钙离子中的两个形成一个 线形三离子簇的部分,中央离子被认为是钠,其位于A和B结构域的交界 处。

对于最接近活性部位的钙离子,主链羰基来自His235和Asp194、侧 链原子来自残基Asp194、Asn102和Asp200、且一个水分子结合钙。对于 钠离子,该结合位点涉及Asp194、Asp200、Asp183和Asp159和来自Val201 的主链羰基。结构域A与B之间的钙结合位点涉及Asp204和Asp159、来 自Asp183和Ala181的主链羰基、来自Asp202的原子和一个水分子。

一个钙离子位于A和C结构域之间,另一个钙离子位于C结构域中。 所提及的第一个钙结合来自Gly300、Tyr302和His406的羰基主链、来自 Asp430的原子、来自Asp407的原子和一个水分子。弱配位的钙位点包含 4个水分子和来自Glu447和Asn444的原子。

4.杂合淀粉酶

提供了可以被分离和/或纯化的杂合淀粉酶。该杂合淀粉酶包含第一α- 淀粉酶的N端片段和作为芽孢杆菌α-淀粉酶的第二α-淀粉酶的C端片段。 在一个实施方案中,芽孢杆菌α-淀粉酶是透阿米尔样淀粉酶。在一个具体 的实施方案中,芽孢杆菌α-淀粉酶是AmyS。在一个实施方案中,第一和 第二淀粉酶可以共享小于约60%的序列同一性。例如,所述淀粉酶可以共 享小于约50%、40%、30%或20%的序列同一性。第一α-淀粉酶序列包 含占该杂合体的至少约10%、但不多于80%的氨基酸序列。在多个实施方 案中,第一α-淀粉酶包含占该杂合体至少约10%、20%、30%、40%、50%、 60%、70%、80%或在10-80%之间任意整数值百分数的氨基酸残基。

在杂合淀粉酶中使用时,第一α-淀粉酶序列维持对芽孢杆菌α-淀粉酶 的部分或全部相应部分保守的3D结构,其中所述的相应部分在该杂合体 中被替换。第一α-淀粉酶可以是古细菌α-淀粉酶。古细菌α-淀粉酶包括以 GenBankTM登录号AAM48115.1(SEQ ID NO:11)中公开的Ultrathin。如 Ultrathin那样,古细菌α-淀粉酶在与芽孢杆菌淀粉酶中Ca2+-Na+-Ca2+结 合位点中相同的总体位置内具有Zn2+结合位点。Ca2+对古细菌α-淀粉酶的 稳定性或活性没有明显影响。如图1中所示,Ultrathin对AmyS显示相对 弱的序列同一性。然而,Ultrathin在3D结构水平对AmyS显示相对高的 相似性。

图5显示对代表性杂合淀粉酶的3D结构的立体描述。所述结构通过 下文实施例中所述的一系列建模算法产生。在图5A中,B结构域以黑体 显示。在图5B中,AmyS的N端残基被Ultrathin第1-104位残基替换。 在该实施方案中,仅小部分的B结构域被替换。比较图5B中该杂合体的 3D结构与5A图中的野生型AmyS结构显示了在该杂合体中高比例的3D 结构是保守的。图5C中所述的杂合体结构描述了其中N端AmyS残基以 Ultrathin第1-209位残基替换的杂合体。尽管该杂合体的总体结构与芽孢 杆菌酶相似,但是如术语在上文定义那样,并非全部杂合体结构必需是“保 守的”。

在一个实施方案中,杂合淀粉酶包含古细菌α-淀粉酶(如Ultrathinα- 淀粉酶)的Zn2+结合区。因而可以使该杂合淀粉酶对Ca2+浓度不敏感,与 此同时该杂合体仍保持野生型芽孢杆菌α-淀粉酶的活性和结构稳定性特 征。例如,杂合淀粉酶包括与含有Zn2+结合位点的Ultrathin部分融合的 AmyS C端部分。根据这些原理构建的具体杂合构建体含有Ultrathin(UT) α-淀粉酶B结构域的多个部分。

杂合体A:UT 1-104:AmyS 100-483(SEQ ID NO:1);

杂合体B:UT 1-113:AmyS 109-483(SEQ ID NO:2);

杂合体C:UT 1-128:AmyS 140-483(SEQ ID NO:3);

杂合体D:UT 1-145:AmyS 161-483(SEQ ID NO:4);

杂合体E:UT 1-163:AmyS 203-483(SEQ ID NO:5);

杂合体F:UT 1-175:AmyS 215-483(SEQ ID NO:6);

杂合体G:UT 1-191:AmyS 228-483(SEQ ID NO:7);和

杂合体H:UT 1-209:AmyS 246-483(SEQ ID NO:8)。

可以工程化杂合淀粉酶以提供具有改善特性的淀粉酶,如改变的Ca2+需求,增加的热稳定性、改变的比活性、改变的内切或外切淀粉酶活性或 改变的最适pH。

也提供编码杂合淀粉酶的核酸。以非限制性实例的方式,编码杂合淀 粉酶的核酸可以是编码蛋白质SEQ ID NO:1、SEQ ID NO:2、SEQ ID  NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7或 SEQ ID NO:8的cDNA。如本领域技术人员充分理解,遗传密码子具有简 并性,这意指在一些情况下多个密码子可以编码相同的氨基酸。核酸包括 编码杂合淀粉酶的基因组DNA、mRNA和cDNA。编码杂合淀粉酶的代表 性核酸包括分别编码杂合淀粉酶SEQ ID NO:1-8的SEQ ID NO:20-27。

4.1.具有变异序列的杂合淀粉酶

在一个实施方案中,包含杂合淀粉酶的序列是天然或野生型序列的变 体。在一方面,仅与第一淀粉酶对应的杂合体的片段是相对于相同连续残 基范围内其天然序列而言的变体。在另一方面,仅与芽孢杆菌淀粉酶对应 的杂合体的片段是相对于相同连续残基范围内其天然序列而言的变体。例 如,可以从SEQ ID NO:11中所述的具有C端截短的AmyS选择AmyS 序列,其中所述的截短去掉淀粉结合结构域。在一些实施方案中,将宿主 细胞基因工程化以表达具有下述氨基酸序列的折叠片段融合变体,其中所 述的氨基酸序列与SEQ ID NOS:1-8具有至少约80%、85%、90%、95%、 96%、97%、98%或99%同一性。

基因修饰和重组生产淀粉酶和其变体的方法是本领域熟知的,并且包 括在美国专利号7,166,453;6,890,572;和6,667,065中描述的那些方法。 编码性多核苷酸序列、引物、载体的制备、选择方法、宿主细胞、所表达 的淀粉酶变体的纯化和重构及其表征,包括用于酶测定法的缓冲液、pH 范围、底物浓度和酶浓度,均是本领域熟知的。如本文中所述,也可以根 据本领域熟知的方法合成地或通过在宿主细胞中重组表达而产生由变异 序列组成的杂合淀粉酶。

5.0折叠片段融合物的产生

5.1.载体

在一些实施方案中,将表达载体中包含核酸的DNA构建体转移至宿 主细胞,其中其中所述的核酸编码杂合淀粉酶,包括如上文所述的杂合淀 粉酶的变体,所述的表达载体包含与杂合淀粉酶编码序列有效连接的调节 序列。载体可以是导入宿主细胞时能够整合至宿主细胞基因组中且复制的 任意载体。合适的表达载体和/或整合载体的额外实例在Sambrook等人, Molecular Cloning:A Laboratory Manual,第三版,Cold Spring Harbor  Laboratory Press,Cold Spring Harbor,New York(2001);Bennett等人, More Gene Manipulations in Fungi,Academic Press,San Diego(1991),第 396-428页和美国专利号5,874,276中提供。示例载体包括pFB6、pBR322、 PUC18、pUC100和pENTR/D、pDONTM201、pDONRTM221、pENTRTM、 3Z和4Z。用于细菌细胞中的示例载体例如包括允许在大 肠杆菌(E.coli)中复制的pBR322与pUC19和允许在芽孢杆菌(Bacillus)中 复制的pE194。

在一些实施方案中,编码杂合酶的核酸与允许在宿主细胞中转录的合 适启动子有效连接。该启动子可以从编码对该宿主细胞同源或异源的蛋白 质的基因衍生。启动子的合适非限制性实例包括cbh1、cbh2、egl1和egl2 启动子。在一个实施方案中,该启动子是对宿主细胞为天然的一种启动子。 例如,当芽孢杆菌细胞是表达宿主细胞时,该启动子是天然的芽孢杆菌启 动子。“诱导型启动子”是在环境或发育调节作用下有活性的启动子。在另 一个实施方案中,该启动子是对宿主细胞为异源的一种启动子。

在一些实施方案中,编码序列与信号序列有效连接。编码信号序列的 DNA可以是与待表达的杂合淀粉酶核酸天然相关的DNA序列。在其他实 施方案中,编码该信号序列的DNA以编码来自芽孢杆菌以外物种的信号 序列的核苷酸序列替换。在这个实施方案中,编码该信号序列的多核苷酸 紧邻于编码所述多肽的多核苷酸上游并与其形成可读框。信号序列可以从 与宿主细胞相同的物种选择。在一个非限制性实例中,信号序列是来自芽 孢杆菌属物种的环糊精葡聚糖转移酶(CGT酶;EC 2.4.1.19)信号序列,并 且在枯草芽孢杆菌宿主细胞中表达杂合淀粉酶。甲硫氨酸残基可以添加至 信号序列的N端。

在额外的实施方案中,包含于待导入真菌宿主细胞的DNA构建体或 载体中的信号序列和启动子序列衍生自相同的来源。在一些实施方案中, 表达载体也包括终止序列。在一个实施方案中,该终止序列和启动子序列 衍生自相同的来源。在另一个实施方案中,该终止序列与宿主细胞同源。

在一些实施方案中,表达载体包含选择标记。合适选择标记的实例包 括赋予抗微生物剂(例如潮霉素或博来霉素)抗性的那些选择标记。营养选 择标记也适用并且包括amdS、argB和pyr4。在一个实施方案中,选择标 记是编码乙酰胺酶的amdS基因;它允许转化的细胞依赖乙酰胺作为氮源 生长。构巢曲霉(A.nidulan)amdS基因作为选择标记的用途在Kelley等人, (1985)EMBO J.4:475-479和Penttila等人,(1987)Gene 61:155-164中描 述。

包含带有编码杂合淀粉酶的多核苷酸的DNA构建体的合适表达载体 可以是能够在给定宿主生物中自主复制或整合到宿主DNA中的任意载体。 在一些实施方案中,该表达载体是质粒。在一些实施方案中,构思了用于 获得cDNA表达的两个类型的表达载体。第一表达载体包含了其中启动子、 杂合淀粉酶编码区和终止子均源自待表达cDNA序列的DNA序列。在一 些实施方案中,通过缺失不想要的DNA序列(例如编码不想要的C端淀粉 结合结构域的DNA)获得基因截短,旨在使待表达的结构域处于自身转录 性与翻译性调节序列的控制下。第二类型的表达载体是预装配的,并且含 有高水平转录所需要的序列和选择标记。在一些实施方案中,将杂合淀粉 酶cDNA或其部分的编码区插入通用型表达载体,从而该编码区处于表达 构建体的启动子和终止子序列的转录性控制下。在一些实施方案中,将基 因或其部分插入强cbh1启动子的下游。

5.2.宿主细胞的转化、表达和培养

将DNA构建体或载体导入宿主细胞包括诸项技术,如转化法;电穿 孔法;核微量注射法;转导法;转染法(例如,脂质转染介导和DEAE-葡 聚糖介导的转染法);与磷酸钙DNA沉淀物孵育;用DNA涂敷的微粒高 速轰击法;和原生质体融合法。常用转化技术是本领域已知的。例如,见 上文的Ausubel等人(1987),第9章;上文的Sambrook等(2001);和 Campbell等人,(1989)Curr.Genet.16:53-56。异源蛋白在木霉 (Trichoderma)中的表达例如在美国专利号6,022,725;美国专利号 6,268,328;Harkki等人,(1991)Enzyme Microb.Technol.13:227-233; Harkki等人,(1989)BioTechnol.7:596-603;EP 244,234;和EP 215,594 中描述。在一个实施方案中,遗传稳定的转化体用编码杂合淀粉酶的核酸 稳定整合到宿主细胞染色体中的载体系统构建。随后通过已知技术纯化转 化体。

在一个非限制性实例中,包括amdS标记的稳定转化体与不稳定的转 化体因它们更快的生长速率和在含有乙酰胺的固体培养基上形成具有光 滑而不是不规则轮廓的环状菌落而区别。额外地,在一些情况下,通过如 此方式进行又一项稳定性试验,即在固体非选择性培养基(例如缺少乙酰胺 的培养基)上培育所述转化体,从这种培养基收获孢子并且测定在含有乙酰 胺的选择性培养基上随后萌发并生长的那些孢子的百分数。本领域已知的 其他方法可以用来选择转化体。

示例性宿主细胞包括革兰氏阳性菌,如枯草芽孢杆菌、地衣芽孢杆菌、 缓慢芽孢杆菌(B.lentus)、短小芽孢杆菌(B.brevis)、嗜热脂肪芽胞杆菌 (B.stearothermophilus)、嗜碱芽胞杆菌(B.alkalophilus)、解淀粉芽孢杆菌 (B.amyloliquefaciens)、凝结芽孢杆菌(B.coagulans)、环状芽孢杆菌 (B.circulans)、灿烂芽胞杆菌(B.lautus)、苏云金芽孢杆菌(B.thuringiensis)、 变铅青链霉菌(Streptomyces lividans)或鼠灰链霉菌(S.murinus);或革兰氏 阴性细菌,如大肠杆菌(Escherichia coli)或假单胞菌属(Pseudomonas)物种。

6.0杂合淀粉酶的产生和表征

6.1.用于纯化杂合淀粉酶的方法

通常,在细胞培养中产生的杂合淀粉酶被分泌到培养基中并且可以被 纯化或分离,例如,通过去除来自细胞培养基的非目的组分。在一些情况 下,可以从细胞裂解物回收杂合淀粉酶。在此类情况下,使用本领域技术 人员例行使用的技术,从产生杂合淀粉酶的细胞纯化该酶。实例包括,但 不限于亲和层析法、离子交换层析法(包括高分辨率离子交换法、疏水相互 作用层析法)、双相分配法、乙醇沉淀法、反相HPLC、在硅胶或阳离子树 脂(例如DEAE)上的层析法、聚焦层析法、SDS-PAGE、硫酸铵沉淀法和 例如使用Sephadex G-75的凝胶过滤法。用于蛋白质纯化的其他技术是本 领域熟知且广泛可获得的。

6.2.杂合淀粉酶活性的鉴定

为评价杂合淀粉酶在宿主细胞中的表达,可以使用测定法来测量表达 的蛋白质、相应的mRNA或α-淀粉酶活性。示例性测定法包括RNA印迹 法和DNA印迹法、RT-PCR(逆转录酶聚合酶链反应)和使用适宜标记的杂 交探针情况下的原位(in situ)杂交法。测定法也包括测量样品中的杂合淀粉 酶活性。用于所表达杂合淀粉酶的外切活性的测定法包括,但不限于 测定法(Megazyme,爱尔兰)。用于杂合淀粉酶内切活性的合适 测定法包括,但不限于淀粉酶测定法(Magle Life Sciences)。测 定法也包括HPLC分析在杂合淀粉酶存在下制备的液化物(liquefact)。通 过将DP-3和DP-4糖类与该测定法的其他组分分开,HPLC可以用来测量 淀粉酶活性。

6.3.杂合淀粉酶变体表征

杂合淀粉酶可以通过它们的核酸序列和一级多肽序列、通过三维空间 结构模型和/或通过它们的比活性来特征。杂合淀粉酶的额外特征例如包括 稳定性、pH范围、氧化稳定性和热稳定性。可以使用本领域技术人员已 知的标准测定法评估表达水平和酶活性。在另一方面,相对于野生型酶, 变体展示改良的性能特征,如在高温(例如65-85℃)下改良的稳定性。杂合 淀粉酶有利于在液化或要求升高温度的其他工艺如焙烘中使用。例如,热 稳定的杂合淀粉酶可以在约55℃至约85℃或更高温度上降解淀粉。

表达特征意指在特定宿主细胞中产生变体时,该变体的改变的表达水 平。表达通常涉及有活性变体的量,其中所述的有活性变体是使用本领域 已知的标准技术,在给定量的时间范围从发酵培养液可回收的。表达也可 涉及在宿主细胞内产生或由所述宿主细胞分泌的变体的量和速率。表达也 可涉及翻译编码变体酶的mRNA的速率。

提供了与编码本文中所述任意杂合淀粉酶的核酸互补的核酸。另外, 提供了能够与该互补物杂交的核酸。在另一个实施方案中,用于本文所述 的方法和组合物中的序列是合成的序列。它包括但不限于采用宿主生物如 酵母中表达的最佳密码子选择的情况下所产生的序列。

7.杂合淀粉酶的组合物和用途

通过上述方法产生和纯化的杂合淀粉酶对于多种工业用途有用。使用 特定杂合淀粉酶的合意性将取决于杂合淀粉酶相对于特定应用的要求所 显示的总体特性表现。

在一个实施方案中,杂合淀粉酶用于淀粉转化工艺中,尤其在淀粉(例 如,玉米淀粉、小麦淀粉或大麦淀粉)的糖化工艺中。想要的终产物可以是 通过酶促转化淀粉底物可产生的任意产物。例如,想要的产物可以是富含 用于发酵的糖(尤其麦芽三糖、葡萄糖和/或麦芽糖)的糖浆。

芽孢杆菌淀粉酶常用来催化可以含有30-40%w/w干固体(ds)的淀粉 混悬液降解成麦芽糖糊精。因为液化一般在高温例如90-100℃进行,故对 该步骤而言,优选热稳定的α淀粉酶,如芽孢杆菌α淀粉酶。芽孢杆菌淀 粉酶一般不产生显著的量的葡萄糖。取而代之的是,所得的液化物具有低 的右旋糖当量(dextrose equivalent;DE)并且含有麦芽糖和具有高聚合度 (DPn)的糖类。

液化物因而通常经历一个额外的糖化反应,其可以由葡糖淀粉酶和/ 或生麦芽糖α-淀粉酶催化。这些酶催化在液化后形成的麦芽糖糊精的非还 原性末端水解,从而释放D-葡萄糖、麦芽糖和异麦芽糖。糖化产生富含葡 萄糖糖浆或高麦芽糖糖浆。在前者情况中,葡糖淀粉酶一般在酸性条件下 在升高的温度催化糖化,例如60℃,pH 4.3。该过程中所用的葡糖淀粉酶 一般从真菌获得,例如在L400中使用的黑曲霉葡糖淀粉酶或灰 腐质霉葡糖淀粉酶。去分支酶如支链淀粉酶可以辅助糖化。然而,葡糖淀 粉酶在Ca2+存在下一般性能不好。出于这个原因,必须在耗时操作中的糖 化之前去掉用来支持液化步骤中芽孢杆菌淀粉酶最适活性的Ca2+。

在液化淀粉的过程中使用时,本文中公开的杂合淀粉酶是特别有利 的。因为一些本发明杂合淀粉酶的活性不需要Ca2+,故这些杂合淀粉酶可 以用来在添加的Ca2+不存在下液化淀粉。液化的淀粉随后可以用葡糖淀粉 酶直接糖化,无需首先去除Ca2+,从而加速总体反应和提高糖生产的效率。

本领域技术人员轻显而易见可以对组合物和使用它们的方法进行各 种修改和变化而不脱离预期用途的精神和范围。因此,若所述修改和变化 处在所附权利要求书及其等同物的范围内,则它们是本发明的修改和变 化。

实施例

实施例1

1.1.淀粉酶结构的比对

在初步步骤中,将沃氏热球菌淀粉酶的3D结构(PDP登录号:1MXG) 与AmyS的3D结构(PDB登录号:1HVX)比对。使用沃氏热球菌结构作 为准则,随后确定古细菌α-淀粉酶des-Met Ultrathin(GenBankTM登录号: AAM48115.1;SEQ ID NO:9)的3D结构。Ultrathin与沃氏热球菌淀粉酶 共享高水平的序列同一性(86.7%),这促进精确3D结构模型的构建。用 ClustalW程序进行建模。见Thompson等人,Nucleic Acids Res.22: 4673-46(1994)。

最后,使用ClustalW将des-Met Ultrathin结构与AmyS比对。最终 叠加基于具有彼此相距约RMSD的对齐的α-碳。具有下述α-碳的比对 残基被鉴定为杂合淀粉酶中接合Ultrathin和AmyS序列的优选位置,其 中所述的α-碳具有的RMSD。

1.2.杂合体构建和表达

设计和构建编码杂合淀粉酶的核酸。为本实施例的目的,SEQ ID NO: 1-8的杂合淀粉酶具有表2中所示的缩写。残基编号之间和之后的括号指 示在融合蛋白中连接的氨基酸残基。在图3和图4中分别描述这些残基相 对于Ultrathin和AmyS全长序列的位置。括号中的Ultrathin残基代表式 (I)A-x-y-B中的残基x,而括号中的AmyS残基代表式(I)中的残基y。

表2

  融合蛋白   Ultrathin残基   AmyS残基   A(SEQ ID NO:1)   1-104(I)   (A)100-483   B(SEQ ID NO:2)   1-113(A)   (G)109-483   融合蛋白   Ultrathin残基   AmyS残基   C(SEQ ID NO:3)   1-128(W)   (T)140-483   D(SEQ ID NO:4)   1-145(D)   (F)161-483   E(SEQ ID NO:5)   1-163(P)   (D)203-483   F(SEQ ID NO:6)   1-175(W)   (L)215-483   G(SEQ ID NO:7)   1-191(G)   (I)228-483   H(SEQ ID NO:8)   1-209(K)   (D)246-483

使用本领域熟知的标准技术,化学地合成杂合体A。使用杂合体A作 为在剩余杂合体中克隆的主链。杂合体A编码性核酸具有1551碱基对长 度并且含有在位置1199处的一个BssHII限制性位点。合成其余杂合基因 直至这个BssHII限制性位点,因为它们均含有从这个限制性位点至该基因 结尾相同的DNA序列。这允许轻易地克隆到含有杂合体A主链直至BssHII 位点的载体中。

构建了具有以下元件的质粒:赋予氨苄青霉素/羧苄青霉素抗性的β内 酰胺酶基因;枯草芽孢杆菌AprE(碱性蛋白酶)启动子,其具有与芽孢杆菌 宿主染色体同源的促进整合到该宿主基因组中的区域;枯草芽孢杆菌 AprE信号序列;编码杂合淀粉酶的核酸;地衣芽孢杆菌LAT(热稳定的地 衣芽孢杆菌淀粉酶)终止子;用于氯霉素抗性的氯霉素乙酰基转移酶基因; 和大肠杆菌复制起点。

采用以下引物,使用PCR扩增编码杂合淀粉酶的核酸:

PstI-NheI-F:ctcagctctgcagctagcgcagcaa  (SEQ ID NO:12)

BssHII-Ethyl Rev:gtgtggaattgtgagcggcca (SEQ ID NO:13)

PCR反应内容物包括5μL pFU UltraBuffer(10X),42μL H2O,0.5μL 引物:PstI-NheI-F,0.5μL引物:BssHII-Ethyl Rev,1μL Roche dNTP(5 mM母液),1μL杂合DNA和1μL pFU Ultra HF DNA聚合酶。PCR程 序循环是使用热循环仪(MJPTC-200 Peltier),95℃1分钟,18x (95℃1分钟,60℃1分钟,68℃2分钟20秒),随后68℃7分钟并且保 持在4℃。

使用Qiaquick PCR纯化试剂盒纯化扩增的线性1.5Kb片段。 质粒pJH101(一种用于枯草芽孢杆菌中表达的整合型载体(Ferrari等人, J.Bacteriol.154:1513-15(1983)))用于表达全部杂合淀粉酶。杂合体A基 因和整合型载体(pJH101)均用限制性酶HindIII和NheI双酶切消化以产 生粘性末端,并且使用T4DNA连接酶DNA连接试剂盒(Takara Bio,目 录编号6023试剂盒),将杂合体A基因连接到载体pJH101中。100μL的 Top 10感受态大肠杆菌细胞(Invitrogen)用5μL连接反应物转化并且涂布 在LA(Luria琼脂)+50ppm羧苄青霉素上并在37℃孵育过夜。在细菌菌 落已经长成后,选择单个克隆,使用来自GE Healthcare的puReTaq  Ready-To-Go PCR BeadsTM进行菌落PCR。挑取菌落并直接转移入PCR 管中。使用的PCR引物是:

pAprBbsGTG-201-fwd:agcgagagatgatataccta (SEQ ID NO:14)

pJH101-end-rev:tttcggcgtgggtatggtggc (SEQ ID NO:15)

来自每个PCR反应的DNA在琼脂糖凝胶上分离以证实菌落PCR已 经成功。

克隆随后送至QuintaraBio(Berkeley,CA)以使用以下引物进行DNA 序列分析:

pAprBbsGTG-201-fwd:agcgagagatgatataccta (SEQ ID NO:14)

pJH101-end-rev:tttcggcgtgggtatggtggc (SEQ ID NO:15)

Et538-fwd:ggtggacgccgtcgaagtcaat (SEQ ID NO:16)

Et1130-F:cgcacgttaatgaccaatacac (SEQ ID NO:17)

使用杂合体A载体,克隆了剩余杂合体。从Gene Oracle Inc.供应的 载体中直接切下用于杂合体B、C、E、F、G和H的基因。简而言之,将 Gene Oracle Inc.供应的大肠杆菌穿刺培养物在LA+50ppm羧苄青霉素 平板上划线,并且培养物在37℃培育过夜。使用Qiagen Miniprep试剂盒 制备来自这些培养物的DNA。

杂合体B、C、E、F、G和H的基因用限制性酶BssHII和NheI双酶 切消化以产生粘性末端。这些粘性末端允许所述杂合体基因直接连接到杂 合体A的骨架载体中。使用Qiagen凝胶提取试剂盒对所述杂合体基因进 行凝胶提取和纯化。使用T4DNA连接酶DNA连接试剂盒(Takara Bio,目 录编号6023试剂盒),将所述杂合体基因连接到杂合体A的骨架载体中。

使用以下引物扩增杂合体D的基因:

PstI-NheI-F:ctcagctctgcagctagcgcagcaa (SEQ ID NO:18)

BssHII-Eth-new2R:gacgacgagcgcgcgatcagaag (SEQ ID NO:19)

PCR反应内容物包括5μL pFU UltraBuffer(10X),42μL H2O,0.5μL 引物:PstI-NheI-F,0.5μL引物:BssHII-Ethyl-new2R,1μL Roche dNTP(5 mM母液),1μL Ultra-Ethyl杂合DNA和1μL pFU Ultra HF DNA聚合 酶。PCR程序循环是使用MJPTC-200Peltier热循环仪,95℃ 2分钟,18x(95℃1分钟,56℃1分钟,68℃1分钟15秒),68℃1分钟 15秒,随后保持在4℃。

通常,在进行特定基因的PCR后,在琼脂糖凝胶上仅分析约2-5μL 每种反应物以证实DNA正确扩增。使用Qiagen PCR纯化试剂盒纯化其 余的初始反应物。然而,在本实施例中,在分析性凝胶上观察到两个条带。 因而,将全部PCR反应物施加至琼脂糖凝胶以提取并纯化与正确DNA长 度(约1100碱基对)对应的条带。使用Qiagen凝胶提取试剂盒从该凝胶分 离DNA。

随后,使用BssHII酶和NheI酶,依次消化纯化的线性片段(约1100 碱基对)。全部样品使用Qiagen PCR纯化试剂盒纯化。杂合体A的骨架载 体也类似地进行消化并使用Qiagen凝胶提取试剂盒进行凝胶提取。使用 Takara Bio批号#6023试剂盒,将杂合体D基因连接到杂合体A的骨架载 体中。Top 10感受态大肠杆菌细胞(Invitrogen)用5μL每种连接反应物转 化并且将转化反应物涂布在LA+50ppm羧苄青霉素上并在37℃孵育过 夜。

使用滚环扩增(RCA)TempliPhi试剂盒(Amersham目录号256400), 按照制造商的方案,扩增杂合体B、C、E、F、G和H的连接反应物。Top 10感受态大肠杆菌细胞(Invitrogen)用5μL每种连接反应物转化并且将转 化反应物涂布在LA+50ppm羧苄青霉素上并在37℃孵育过夜。

从全部杂合构建体的培养物选出单个克隆。使用puReTaq  Ready-To-Go PCR Beads(GE Healthcare),对单菌落进行菌落PCR。将 菌落直接挑入PCR管。使用的PCR引物是:

pAprBbsGTG-201-fwd:agcgagagatgatataccta (SEQ ID NO:14)

pJH101-end-rev:tttcggcgtgggtatggtggc (SEQ ID NO:15)

进行琼脂糖凝胶电泳以证实菌落PCR反应已经成功。克隆随后送至 QuintaraBio以使用以下引物进行DNA序列分析:

pAprBbsGTG-201-fwd:agcgagagatgatataccta (SEQ ID NO:14)

pJH101-end-rev:tttcggcgtgggtatggtggc (SEQ ID NO:15)

Et538-fwd:ggtggacgccgtcgaagtcaat (SEQ ID NO:16)

Et1130-F:cgcacgttaatgaccaatacac (SEQ ID NO:17)

带有正确DNA序列的克隆的液体培养物在15%总体积的甘油中冷冻 于-80℃。

使用Qiagen微量制备试剂盒对克隆进行质粒微量制备。5μL质粒 DNA(0.4-0.5μg)的样品转化入100μL BG6006芽孢杆菌细胞(表型: DaprE,DnprE,Depr,DispA,Dbpr,Dvpr,DwprA,Dmpr-ybfJ,DnprB, degUHy32,oppA,DspoIIE3501,amyE::xylRPxylAcomK-ermC)。反应混 合物在摇床中于37℃孵育1小时并且涂布到含有1%不溶性玉米淀粉+5 ppm氯霉素的平板上并在37℃孵育过夜(至少16小时)。质粒pJH101是 整合型载体(缺少芽孢杆菌的复制起点)并且因而具有将自身整合到宿主 基因组中的能力。通过将细胞涂布到含有更高浓度抗生素的平板上,旨在强 迫该载体将多个自身拷贝插入基因组以在高浓度的抗生素下存活,实现质 粒整合。具体而言,菌落在1%不溶性淀粉+25ppm氯霉素LB平板上反 复划线几次。在本实施例中,在菌落显示抵抗高浓度的抗生素之前,将杂 合体反复划线总计4次。在此阶段,杂合体为使用下文描述的淀粉平板测 定法分析淀粉酶活性做好准备,其中所述的淀粉平板测定法依赖于平板基 质内部淀粉浊度的变化作为淀粉水解的读出数。

实施例2

2.1.杂合淀粉酶的制备

克隆在枯草芽孢杆菌BG6006宿主细胞中的不同杂合淀粉酶的新鲜甘 油储存物划线到含有1%不溶性玉米淀粉+25ppm氯霉素的LB平板上 并且在37℃孵育过夜。次日早上,在5mL含有25ppm氯霉素的培养基 中培育起子培养物。允许起子培养物在摇床(250转/分钟)中在37℃生长8 小时15分钟。随后,将30μL这种预培养物添加到装有30mL培养基(下 文描述)的250mL烧瓶中,所述的培养基补充有25ppm氯霉素和5mM CaCl2。摇瓶在37℃孵育60-65小时,伴以250转/分钟混合。该培养基是 基于MOPS缓冲液的强化的半确定成分培养基,以脲作为主要氮源,葡萄 糖作为主要碳源并且补充有1%大豆胨用于活跃细胞生长。细胞生长后, 将培养物分成两组:组1维持天然pH 7并且组2培养物的pH提高至约 10.5。来自每个组1培养物的25mL细胞悬液以5000转/分钟离心20分钟 以将上清液中的蛋白质与细胞沉淀物分开。对于组2,将1.5mL每个培养 物等分入2ml离心管并且添加1-3μl NaOH以提高pH至10.5。诸样品以 14,000转/分钟离心5分钟。将(含有目的蛋白的)上清液转移至清洁管并置 于冰箱中直至用于测试。

2.2.用于淀粉酶活性的Phadebas测定法

使用比色Phadebas测定法对上文制备的杂合淀粉酶测试淀粉酶活性, 其中使用Ultrathin作为对照。在图2中描述了测定法的结果。使用 染料连接的淀粉底物,在Millipore multiscreen-HV平板 (#MAHVN4550)中测试(如上文所述制备的)来自不同淀粉酶杂合体摇瓶的 培养上清液的淀粉酶活性。来自Magle Life Sciences的淀粉酶 测试药片溶解于测试缓冲液(50mm马来酸钠,50mM NaCl,2mM CaCl2, pH 5.2)中,伴以偶尔涡旋混合,5-10分钟。添加来自每个组蛋白质样品的 15μL培养上清液至96孔平板顶端行内的135μL测试缓冲液(1∶10稀释), 并且通过抽吸混合样品。来自这些孔中每孔的50μL等份样品转移至含有 100μL测试缓冲液的下一行(1∶3稀释),通过抽吸稀释,随后沿平板向下连 续转移50μL用于后续的稀释。添加100μL等份的底物溶液至每孔。将平 板盖好,在平板转动/混合器上短暂混合并且置于培养箱于37℃孵育45分 钟。在这次孵育后,平板安置在Millipore真空多联支架(Millipore vacuum  manifold)中,将内容物过滤到标准平底平板中,并且在微量平板读数仪中 测量620nm处的光密度。

2.3.用于淀粉酶活性的淀粉平板测定法

在本测定法中,通过将芽孢杆菌克隆涂布到补充有1%不溶性淀粉+ 25ppm氯霉素的LA平板上并且在37℃孵育所述平板过夜(至少16小时), 测试了由表达不同淀粉酶杂合体的细胞产生的淀粉酶。次日,通过观察淀 粉平板上清亮区带的存在并赋予相对晕圈尺寸而定性评定诸克隆。使用 Ultrathin作为对照。虽然Ultrathin一般在37℃培养,但是测试平板不得 不在70℃培养以观察晕圈。

2.4.结果

使用Ultrathin作为对照,在图2和表3中描述了实施例2.2.和2.3.中 所述的测定法的结果。在表3的第2列中显示晕圈测定法(halo assay)的结 果,并且在第3列中显示比色测定法的结果。

表3

  杂合体   晕圈大小   相对酶活性   Ultrathin   中等   1.0   A   中等   1.3   B   大   0.3   C   无   ND   E   无   ND   F   小   0.2   G   小   ND   H   很大   3.5

杂合体B含有AmyS第109-483位残基,这意味它没有参与钙结合的 B结构域第102位残基。然而,该杂合体表现明显的淀粉酶活性,从而展 示从各自含有一部分B结构域的淀粉酶序列中形成杂合体的可行性。淀粉 酶活性测量(如图2的分图A和B上所示)表明杂合体(如杂合体A和杂合 体H)可以在所测试的两种pH条件下比Ultrathin野生型酶有效得多地水 解不溶性淀粉。

杂合体G和H表现的相对高的活性是特别令人感兴趣的。这些杂合 体分别含有AmyS的第215-483位和第246-483位残基,这意味它们拥有 Ultrathin的完整B结构域以及Ultrathin催化性A结构域的显著部分。如 果使用缺少29个氨基酸C端淀粉结合结构域的AmyS变体来贡献杂合体 H中的AmyS序列,则该杂合体的约50%残基会是Ultrathin残基。预期 这些杂合淀粉酶会不需要Ca2+,因为AmyS的钙结合位点被来自Ultrathin 的锌结合位点彻底替换。

本领域技术人员显而易见可以对组合物和使用它们的方法进行各种 修改和变化而不脱离本文中预期用途的精神和范围。因此,若所述修改和 变化处在所附权利要求书及其等同物的范围内,则它们是本发明的修改和 变化。

序列表

SEQ ID NO:1:杂合体A:AAM48115.1 A1至I104/AmyS A100至 R483。第1-488位残基。

1-104=AAM48115.1(w/o N端Met)残基以粗体显示

105-488=AmyS第100-483位残基

A K Y S E L E K G G V I M Q A F Y W D V P S G G I W W D T I R Q K

I P E W Y D A G I S A I W I P P A S K G M G G A Y S M G Y D P Y D

F F D L G E Y D Q K G T V E T R F G S K Q E L V N M I N T A H A Y

G M K V I A D V V F D H K G G A D G T E W V D A V E V N P S D R N

Q E I S G T Y Q I Q A W T K F D F P G R G N T Y S S F K W R W Y H

F D G V D W D E S R K L S R I Y K F R G I G K A W D W E V D T E N

G N Y D Y L M Y A D L D M D H P E V V T E L K N W G K W Y V N T T

N I D G F R L D A V K H I K F S F F P D W L S Y V R S Q T G K P L

F T V G E Y W S Y D I N K L H N Y I T K T N G T M S L F D A P L H

N K F Y T A S K S G G A F D M R T L M T N T L M K D Q P T L A V T

F V D N H D T E P G Q A L Q S W V D P W F K P L A Y A F I L T R Q

E G Y P C V F Y G D Y Y G I P Q Y N I P S L K S K I D P L L I A R

R D Y A Y G T Q H D Y L D H S D I I G W T R E G V T E K P G S G L

A A L I T D G P G G S K W M Y V G K Q H A G K V F Y D L T G N R S

D T V T I N S D G W G E F K V N G G S V S V W V P R

SEQ ID NO:2:杂合体B:AAM48115.1A1至A 113/AmyS G109至 R483。第1-488位残基。

1-113=AAM48115.1(w/o N端Met)残基以粗体显示

114-488=AmyS第109-483位残基

G A D G T E W V D A V E V N P S D R N

Q E I S G T Y Q I Q A W T K F D F P G R G N T Y S S F K W R W Y H

F D G V D W D E S R K L S R I Y K F R G I G K A W D W E V D T E N

G N Y D Y L M Y A D L D M D H P E V V T E L K N W G K W Y V N T T

N I D G F R L D A V K H I K F S F F P D W L S Y V R S Q T G K P L

F T V G E Y W S Y D I N K L H N Y I T K T N G T M S L F D A P L H

N K F Y T A S K S G G A F D M R T L M T N T L M K D Q P T L A V T

F V D N H D T E P G Q A L Q S W V D P W F K P L A Y A F I L T R Q

E G Y P C V F Y G D Y Y G I P Q Y N I P S L K S K I D P L L I A R

R D Y A Y G T Q H D Y L D H S D I I G W T R E G V T E K P G S G L

A A L I T D G P G G S K W M Y V G K Q H A G K V F Y D L T G N R S

D T V T I N S D G W G E F K V N G G S V S V W V P R

SEQ ID NO:3:杂合体C:AAM48115.1A1至W128/AmyS T140至 R483。

第1-472位残基。

1-128=AAM48115.1(w/o N端Met)残基以粗体显示

129-472=AmyS第140-483位残基

T K F D

F P G R G N T Y S S F K W R W Y H F D G V D W D E S R K L S R I Y

K F R G I G K A W D W E V D T E N G N Y D Y L M Y A D L D M D H P

E V V T E L K N W G K W Y V N T T N I D G F R L D A V K H I K F S

F F P D W L S Y V R S Q T G K P L F T V G E Y W S Y D I N K L H N

Y I T K T N G T M S L F D A P L H N K F Y T A S K S G G A F D M R

T L M T N T L M K D Q P T L A V T F V D N H D T E P G Q A L Q S W

V D P W F K P L A Y A F I L T R Q E G Y P C V F Y G D Y Y G I P Q

Y N I P S L K S K I D P L L I A R R D Y A Y G T Q H D Y L D H S D

I I G W T R E G V T E K P G S G L A A L I T D G P G G S K W M Y V

G K Q H A G K V F Y D L T G N R S D T V T I N S D G W G E F K V N

G G S V S V W V P R

SEQ ID NO:4:杂合体D:AAM48115.1A1至D145/AmyS F161至 R483。第1-468位残基。

1-145=AAM48115.1(w/o N端Met)残基以粗体显示

146-468=AmyS第161-483位残基

F D G V D W D E S R K L S R I Y K F R G

I G K A W D W E V D T E N G N Y D Y L M Y A D L D M D H P E V V T

E L K N W G K W Y V N T T N I D G F R L D A V K H I K F S F F P D

W L S Y V R S Q T G K P L F T V G E Y W S Y D I N K L H N Y I T K

T N G T M S L F D A P L H N K F Y T A S K S G G A F D M R T L M T

N T L M K D Q P T L A V T F V D N H D T E P G Q A L Q S W V D P W

F K P L A Y A F I L T R Q E G Y P C V F Y G D Y Y G I P Q Y N I P

S L K S K I D P L L I A R R D Y A Y G T Q H D Y L D H S D I I G W

T R E G V T E K P G S G L A A L I T D G P G G S K W M Y V G K Q H

A G K V F Y D L T G N R S D T V T I N S D G W G E F K V N G G S V

S V W V P R

SEQ ID NO:5:杂合体E:AAM48115.1A1至P163/AmyS D203至 R483。

第1-444位残基。

1-163=AAM48115.1(w/o N端Met)残基以粗体显示

164-444=AmyS第203-483位残基

D L

D M D H P E V V T E L K N W G K W Y V N T T N I D G F R L D A V K

H I K F S F F P D W L S Y V R S Q T G K P L F T V G E Y W S Y D I

N K L H N Y I T K T N G T M S L F D A P L H N K F Y T A S K S G G

A F D M R T L M T N T L M K D Q P T L A V T F V D N H D T E P G Q

A L Q S W V D P W F K P L A Y A F I L T R Q E G Y P C V F Y G D Y

Y G I P Q Y N I P S L K S K I D P L L I A R R D Y A Y G T Q H D Y

L D H S D I I G W T R E G V T E K P G S G L A A L I T D G P G G S

K W M Y V G K Q H A G K V F Y D L T G N R S D T V T I N S D G W G

E F K V N G G S V S V W V P R

SEQ ID NO:6:杂合体F:AAM48115.1A1至W175/AmyS L215至 R483。

第1-444位残基。

1-175=AAM48115.1(w/o N端Met)残基以粗体显示

176-444=AmyS第215-483位残基

L K N W G K W Y V N T T N I D G F R L D A V K

H I K F S F F P D W L S Y V R S Q T G K P L F T V G E Y W S Y D I

N K L H N Y I T K T N G T M S L F D A P L H N K F Y T A S K S G G

A F D M R T L M T N T L M K D Q P T L A V T F V D N H D T E P G Q

A L Q S W V D P W F K P L A Y A F I L T R Q E G Y P C V F Y G D Y

Y G I P Q Y N I P S L K S K I D P L L I A R R D Y A Y G T Q H D Y

L D H S D I I G W T R E G V T E K P G S G L A A L I T D G P G G S

K W M Y V G K Q H A G K V F Y D L T G N R S D T V T I N S D G W G

E F K V N G G S V S V W V P R

SEQ ID NO:7:杂合体G:AAM48115.1A1至G191/AmyS I228至 483。

第1-447位残基。

1-191=AAM48115.1(w/o N端Met)残基以粗体显示。

192-447=AmyS第228-483位残基

I D G F R L D

A V K H I K F S F F P D W L S Y V R S Q T G K P L F T V G E Y W S

Y D I N K L H N Y I T K T N G T M S L F D A P L H N K F Y T A S K

S G G A F D M R T L M T N T L M K D Q P T L A V T F V D N H D T E

P G Q A L Q S W V D P W F K P L A Y A F I L T R Q E G Y P C V F Y

G D Y Y G I P Q Y N I P S L K S K I D P L L I A R R D Y A Y G T Q

H D Y L D H S D I I G W T R E G V T E K P G S G L A A L I T D G P

G G S K W M Y V G K Q H A G K V F Y D L T G N R S D T V T I N S D

G W G E F K V N G G S V S V W V P R

SEQ ID NO:8:杂合体H:AAM48115.1A1至K209/AmyS A246至 R483。

第1-447位残基。

1-209=AAM48115.1(w/o N端Met)残基以粗体显示

210-447=AmyS第246-483位残基

D W L S Y V R S Q T G K P L F T V G E Y W S

Y D I N K L H N Y I T K T N G T M S L F D A P L H N K F Y T A S K

S G G A F D M R T L M T N T L M K D Q P T L A V T F V D N H D T E

P G Q A L Q S W V D P W F K P L A Y A F I L T R Q E G Y P C V F Y

G D Y Y G I P Q Y N I P S L K S K I D P L L I A R R D Y A Y G T Q

H D Y L D H S D I I G W T R E G V T E K P G S G L A A L I T D G P

G G S K W M Y V G K Q H A G K V F Y D L T G N R S D T V T I N S D

G W G E F K V N G G S V S V W V P R

SEQ ID NO:9:Ultrathinα-淀粉酶(登录号AAM48115.1)

MAKYSELEKGGVIMQAFYWDVPSGGIWWDTIRQKIPEWYDAGISAIWIPPASKGMGGAYSMGYDP

YDFFDLGEYDQKGTVETRFGSKQELVNMINTAHAYGMKVIADIVINHRAGGDLEWNPFVNDYTWT

DFSKVASGKYTANYLDFHPNELHAGDSGTFGGYPDICHDKSWDQYWLWASQESYAAYLRSIGIDA

WRFDYVKGYAPWVVKDWLNWWGGWAVGEYWDTNVDAVLNWAYSSGAKVFDFALYYKMDEAFDNKN

IPALVSALQNGQTVVSRDPFKAVTFVANHDTDIIWNKYPAYAFILTYEGQPTIFYRDYEEWLNKD

KLKNLIWIHENLAGGSTDIVYYDNDELIFVRNGYGDKPGLITYINLGSSKAGRWVYVPKFAGACI

HEYTGNLGGWVDKYVYSSGWVYLEAPAYDPANGQYGYSVWSYCGVG

SEQ ID NO:10:AmyS,全长蛋白质序列(嗜热脂肪芽孢杆菌淀粉 酶)(NCBI PDB结构编号1HVX,蛋白质编号1HVX.A)

  1 AAPFNGTMMQ YFEWYLPDDG TLWTKVANEA NNLSSLGITA LWLPPAYKGT SRSDVGYGVY

 61 DLYDLGEFNQ KGAVRTKYGT KAQYLQAIQA AHAAGMQVYA DVVFDHKGGA DGTEWVDAVE

121 VNPSDRNQEI SGTYQIQAWT KFDFPGRGNT YSSFKWRWYH FDGVDWDESR KLSRIYKFRG

181 IGKAWDWEVD TENGNYDYLM YADLDMDHPE VVTELKSWGK WYVNTTNIDG FRLDAVKHIK

241 FSFFPDWLSY VRSQTGKPLF TVGEYWSYDI NKLHNYIMKT NGTMSLFDAP LHNKFYTASK

301 SGGTFDMRTL MTNTIMKDQP TLAVTFVDNH DTEPGQALQS WVDPWFKPLA YAFILTRQEG

361 YPCVFYGDYY GIPQYNIPSL KSKIDPLLIA RRDYAYGTQH DYLDHSDIIG WTREGVTEKP

421 GSGLAALITD GPGGSKWMYV GKQHAGKVFY DLTGNRSDTV TINSDGWGEF KVNGGSVSVW

481 VPRKTTVSTI AWSITTRPWT DEFVRWTEPR LVAWP

SEQ ID NO:11:AmyS,在羧基端截短(嗜热脂肪土芽孢杆菌淀粉 酶)(NCBI PDB结构编号1HVX,蛋白质编号1HVX.A)

        10         20         30         40         50         60

AAPFNGTMMQ YFEWYLPDDG TLWTKVANEA NNLSSLGITA LWLPPAYKGT SRSDVGYGVY

        70         80         90        100        110        120

DLYDLGEFNQ KGTVRTKYGT KAQYLQAIQA AHAAGMQVYA DVVFDHKGGA DGTEWVDAVE

       130        140        150        160        170        180

VNPSDRNQEI SGTYQIQAWT KFDFPGRGNT YSSFKWRWYH FDGVDWDESR KLSRIYKFRG

       190        200        210        220        230        240

IGKAWDWEVD TENGNYDYLM YADLDMDHPE VVTELKNWGK WYVNTTNIDG FRLDAVKHIK

       250        260        270        280        290        300

FSFFPDWLSY VRSQTGKPLF TVGEYWSYDI NKLHNYITKT NGTMSLFDAP LHNKFYTASK

       310        320        330        340        350        360

SGGAFDMRTL MTNTLMKDQP TLAVTFVDNH DTEPGQALQS WVDPWFKPLA YAFILTRQEG

       370        380        390        400        410        420

YPCVFYGDYY GIPQYNIPSL KSKIDPLLIA RRDYAYGTQH DYLDHSDIIG WTREGVTEKP

       430        440        450        460        470        480

GSGLAALITD GPGGSKWMYV GKQHAGKVFY DLTGNRSDTV TINSDGWGEF KVNGGSVSVW

VPRKTT

SEQ ID NO:12:

合成的序列

ctcagctctgcagctagcgcagcaa

SEQ ID NO:13:

合成的序列

gtgtggaattgtgagcggcca

SEQ ID NO:14:

合成的序列

agcgagagatgatataccta

SEQ ID NO:15:

合成的序列

tttcggcgtgggtatggtggc

SEQ ID NO:16:

合成的序列

ggtggacgccgtcgaagtcaat

SEQ ID NO:17:

合成的序列

cgcacgttaatgaccaatacac

SEQ ID NO:18:

合成的序列

ctcagctctgcagctagcgcagcaa

SEQ ID NO:19:

合成的序列

gacgacgagcgcgcgatcagaag

SEQ ID NO:20:杂合体A核苷酸序列:AAM48115.1/AmyS

GCCGATGTCGTGT

TCGACCATAAAGGCGGCGCTGACGGCACGGAATGGGTGGACGCCGTCGAAGTCAATCCGTCCGAC

CGCAACCAAGAAATCTCAGGCACCTATCAAATCCAAGCATGGACGAAATTTGATTTTCCCGGGCG

GGGCAACACATACTCTAGCTTTAAGTGGCGCTGGTACCATTTTGACGGCGTTGATTGGGACGAAA

GCCGTAAATTAAGCCGCATTTACAAATTCCGCGGCATCGGCAAAGCGTGGGATTGGGAAGTAGAC

ACAGAAAACGGAAACTATGACTACTTAATGTATGCCGACCTTGATATGGACCATCCGGAAGTCGT

GACCGAGCTCAAAAACTGGGGGAAATGGTATGTCAACACAACGAACATTGATGGGTTCCGGCTTG

ATGCCGTCAAGCATATTAAGTTCAGCTTTTTTCCTGATTGGTTGTCATATGTGCGTTCTCAGACT

GGCAAGCCGCTGTTTACAGTCGGGGAATATTGGAGCTATGATATCAACAAGTTGCACAATTACAT

TACGAAAACAAACGGAACGATGTCTTTGTTTGATGCCCCGTTACACAACAAATTTTATACCGCTT

CCAAAAGCGGGGGCGCATTTGATATGCGCACGTTAATGACCAATACACTGATGAAAGATCAACCG

ACATTGGCCGTCACGTTCGTTGATAATCATGACACAGAGCCGGGCCAAGCGCTTCAGTCATGGGT

CGACCCATGGTTCAAACCGTTGGCTTACGCCTTTATTCTGACACGGCAGGAAGGATACCCGTGCG

TCTTTTATGGTGACTATTATGGCATTCCACAATATAACATTCCTTCTCTGAAAAGCAAAATCGAT

CCGCTTCTGATCGCGCGCCGTGATTATGCTTACGGAACGCAACATGATTATCTTGATCACTCAGA

CATCATTGGGTGGACAAGAGAAGGGGTCACAGAAAAACCAGGATCAGGCCTCGCCGCACTGATCA

CGGATGGGCCGGGAGGAAGCAAATGGATGTACGTTGGCAAACAGCATGCTGGAAAAGTGTTCTAT

GACCTTACAGGCAACCGGAGCGACACAGTCACGATCAACTCAGATGGATGGGGGGAATTCAAAGT

CAATGGCGGTAGCGTTTCAGTTTGGGTTCCTAGA

SEQ ID NO:21:杂合体B核苷酸序列

GGCGCTGACGGCACGGAATGGGTGGACGCCGTCGAAGTCAATCCGTCCGAC

CGCAACCAAGAAATCTCAGGCACCTATCAAATCCAAGCATGGACGAAATTTGATTTTCCCGGGCG

GGGCAACACATACTCTAGCTTTAAGTGGCGCTGGTACCATTTTGACGGCGTTGATTGGGACGAAA

GCCGTAAATTAAGCCGCATTTACAAATTCCGCGGCATCGGCAAAGCGTGGGATTGGGAAGTAGAC

ACAGAAAACGGAAACTATGACTACTTAATGTATGCCGACCTTGATATGGACCATCCGGAAGTCGT

GACCGAGCTCAAAAACTGGGGGAAATGGTATGTCAACACAACGAACATTGATGGGTTCCGGCTTG

ATGCCGTCAAGCATATTAAGTTCAGCTTTTTTCCTGATTGGTTGTCATATGTGCGTTCTCAGACT

GGCAAGCCGCTGTTTACAGTCGGGGAATATTGGAGCTATGATATCAACAAGTTGCACAATTACAT

TACGAAAACAAACGGAACGATGTCTTTGTTTGATGCCCCGTTACACAACAAATTTTATACCGCTT

CCAAAAGCGGGGGCGCATTTGATATGCGCACGTTAATGACCAATACACTGATGAAAGATCAACCG

ACATTGGCCGTCACGTTCGTTGATAATCATGACACAGAGCCGGGCCAAGCGCTTCAGTCATGGGT

CGACCCATGGTTCAAACCGTTGGCTTACGCCTTTATTCTGACACGGCAGGAAGGATACCCGTGCG

TCTTTTATGGTGACTATTATGGCATTCCACAATATAACATTCCTTCTCTGAAAAGCAAAATCGAT

CCGCTTCTGATCGCGCGCCGTGATTATGCTTACGGAACGCAACATGATTATCTTGATCACTCAGA

CATCATTGGGTGGACAAGAGAAGGGGTCACAGAAAAACCAGGATCAGGCCTCGCCGCACTGATCA

CGGATGGGCCGGGAGGAAGCAAATGGATGTACGTTGGCAAACAGCATGCTGGAAAAGTGTTCTAT

GACCTTACAGGCAACCGGAGCGACACAGTCACGATCAACTCAGATGGATGGGGGGAATTCAAAGT

CAATGGCGGTAGCGTTTCAGTTTGGGTTCCTAGA

SEQ ID NO:22:杂合体C核苷酸序列

ACGAAA

TTTGATTTTCCCGGGCGGGGCAACACATACTCTAGCTTTAAGTGGCGCTGGTACCATTTTGACGG

CGTTGATTGGGACGAAAGCCGTAAATTAAGCCGCATTTACAAATTCCGCGGCATCGGCAAAGCGT

GGGATTGGGAAGTAGACACAGAAAACGGAAACTATGACTACTTAATGTATGCCGACCTTGATATG

GACCATCCGGAAGTCGTGACCGAGCTCAAAAACTGGGGGAAATGGTATGTCAACACAACGAACAT

TGATGGGTTCCGGCTTGATGCCGTCAAGCATATTAAGTTCAGCTTTTTTCCTGATTGGTTGTCAT

ATGTGCGTTCTCAGACTGGCAAGCCGCTGTTTACAGTCGGGGAATATTGGAGCTATGATATCAAC

AAGTTGCACAATTACATTACGAAAACAAACGGAACGATGTCTTTGTTTGATGCCCCGTTACACAA

CAAATTTTATACCGCTTCCAAAAGCGGGGGCGCATTTGATATGCGCACGTTAATGACCAATACAC

TGATGAAAGATCAACCGACATTGGCCGTCACGTTCGTTGATAATCATGACACAGAGCCGGGCCAA

GCGCTTCAGTCATGGGTCGACCCATGGTTCAAACCGTTGGCTTACGCCTTTATTCTGACACGGCA

GGAAGGATACCCGTGCGTCTTTTATGGTGACTATTATGGCATTCCACAATATAACATTCCTTCTC

TGAAAAGCAAAATCGATCCGCTTCTGATCGCGCGCCGTGATTATGCTTACGGAACGCAACATGAT

TATCTTGATCACTCAGACATCATTGGGTGGACAAGAGAAGGGGTCACAGAAAAACCAGGATCAGG

CCTCGCCGCACTGATCACGGATGGGCCGGGAGGAAGCAAATGGATGTACGTTGGCAAACAGCATG

CTGGAAAAGTGTTCTATGACCTTACAGGCAACCGGAGCGACACAGTCACGATCAACTCAGATGGA

TGGGGGGAATTCAAAGTCAATGGCGGTAGCGTTTCAGTTTGGGTTCCTAGA

SEQ ID NO:23:杂合体D核苷酸序列

TTTGACGGCGTTGATTGGGACGAAAGCCGTAAATTAAGCCGCATT

TACAAATTCCGCGGCATCGGCAAAGCGTGGGATTGGGAAGTAGACACAGAAAACGGAAAC

TATGACTACTTAATGTATGCCGACCTTGATATGGACCATCCGGAAGTCGTGACCGAGCTC

AAAAACTGGGGGAAATGGTATGTCAACACAACGAACATTGATGGGTTCCGGCTTGATGCC

GTCAAGCATATTAAGTTCAGCTTTTTTCCTGATTGGTTGTCATATGTGCGTTCTCAGACT

GGCAAGCCGCTGTTTACAGTCGGGGAATATTGGAGCTATGATATCAACAAGTTGCACAAT

TACATTACGAAAACAAACGGAACGATGTCTTTGTTTGATGCCCCGTTACACAACAAATTT

TATACCGCTTCCAAAAGCGGGGGCGCATTTGATATGCGCACGTTAATGACCAATACACTG

ATGAAAGATCAACCGACATTGGCCGTCACGTTCGTTGATAATCATGACACAGAGCCGGGC

CAAGCGCTTCAGTCATGGGTCGACCCATGGTTCAAACCGTTGGCTTACGCCTTTATTCTG

ACACGGCAGGAAGGATACCCGTGCGTCTTTTATGGTGACTATTATGGCATTCCACAATAT

AACATTCCTTCTCTGAAAAGCAAAATCGATCCGCTTCTGATCGCGCGCCGTGATTATGCT

TACGGAACGCAACATGATTATCTTGATCACTCAGACATCATTGGGTGGACAAGAGAAGGG

GTCACAGAAAAACCAGGATCAGGCCTCGCCGCACTGATCACGGATGGGCCGGGAGGAAGC

AAATGGATGTACGTTGGCAAACAGCATGCTGGAAAAGTGTTCTATGACCTTACAGGCAAC

CGGAGCGACACAGTCACGATCAACTCAGATGGATGGGGGGAATTCAAAGTCAATGGCGGT

AGCGTTTCAGTTTGGGTTCCTAGA

SEQ ID NO:24:杂合体E核苷酸序列

GACCTTGATATGGACCATCCGGAAGTCGTGA

CCGAGCTCAAAAACTGGGGGAAATGGTATGTCAACACAACGAACATTGATGGGTTCCGGCTTGAT

GCCGTCAAGCATATTAAGTTCAGCTTTTTTCCTGATTGGTTGTCATATGTGCGTTCTCAGACTGG

CAAGCCGCTGTTTACAGTCGGGGAATATTGGAGCTATGATATCAACAAGTTGCACAATTACATTA

CGAAAACAAACGGAACGATGTCTTTGTTTGATGCCCCGTTACACAACAAATTTTATACCGCTTCC

AAAAGCGGGGGCGCATTTGATATGCGCACGTTAATGACCAATACACTGATGAAAGATCAACCGAC

ATTGGCCGTCACGTTCGTTGATAATCATGACACAGAGCCGGGCCAAGCGCTTCAGTCATGGGTCG

ACCCATGGTTCAAACCGTTGGCTTACGCCTTTATTCTGACACGGCAGGAAGGATACCCGTGCGTC

TTTTATGGTGACTATTATGGCATTCCACAATATAACATTCCTTCTCTGAAAAGCAAAATCGATCC

GCTTCTGATCGCGCGCCGTGATTATGCTTACGGAACGCAACATGATTATCTTGATCACTCAGACA

TCATTGGGTGGACAAGAGAAGGGGTCACAGAAAAACCAGGATCAGGCCTCGCCGCACTGATCACG

GATGGGCCGGGAGGAAGCAAATGGATGTACGTTGGCAAACAGCATGCTGGAAAAGTGTTCTATGA

CCTTACAGGCAACCGGAGCGACACAGTCACGATCAACTCAGATGGATGGGGGGAATTCAAAGTCA

ATGGCGGTAGCGTTTCAGTTTGGGTTCCTAGA

SEQ ID NO:25:杂合体F核苷酸序列

CTCAAAAACTGGGGGAAATGGTATGTCAACACAACGAACATTGATGGGTTCCGGCTTGAT

GCCGTCAAGCATATTAAGTTCAGCTTTTTTCCTGATTGGTTGTCATATGTGCGTTCTCAGACTGG

CAAGCCGCTGTTTACAGTCGGGGAATATTGGAGCTATGATATCAACAAGTTGCACAATTACATTA

CGAAAACAAACGGAACGATGTCTTTGTTTGATGCCCCGTTACACAACAAATTTTATACCGCTTCC

AAAAGCGGGGGCGCATTTGATATGCGCACGTTAATGACCAATACACTGATGAAAGATCAACCGAC

ATTGGCCGTCACGTTCGTTGATAATCATGACACAGAGCCGGGCCAAGCGCTTCAGTCATGGGTCG

ACCCATGGTTCAAACCGTTGGCTTACGCCTTTATTCTGACACGGCAGGAAGGATACCCGTGCGTC

TTTTATGGTGACTATTATGGCATTCCACAATATAACATTCCTTCTCTGAAAAGCAAAATCGATCC

GCTTCTGATCGCGCGCCGTGATTATGCTTACGGAACGCAACATGATTATCTTGATCACTCAGACA

TCAT TGGGTGGACAAGAGAAGGGGTCACAGAAAAACCAGGATCAGGCCTCGCCGCACTGATCACG

GATGGGCCGGGAGGAAGCAAATGGATGTACGTTGGCAAACAGCATGCTGGAAAAGTGTTCTATGA

CCTTACAGGCAACCGGAGCGACACAGTCACGATCAACTCAGATGGATGGGGGGAATTCAAAGTCA

ATGGCGGTAGCGTTTCAGTTTGGGTTCCTAGA

SEQ ID NO:26:杂合体G核苷酸序列

ATTGATGGGTTC

CGGCTTGATGCCGTCAAGCATATTAAGTTCAGCTTTTTTCCTGATTGGTTGTCATATGTGCGTTC

TCAGACTGGCAAGCCGCTGTTTACAGTCGGGGAATATTGGAGCTATGATATCAACAAGTTGCACA

ATTACATTACGAAAACAAACGGAACGATGTCTTTGTTTGATGCCCCGTTACACAACAAATTTTAT

ACCGCTTCCAAAAGCGGGGGCGCATTTGATATGCGCACGTTAATGACCAATACACTGATGAAAGA

TCAACCGACATTGGCCGTCACGTTCGTTGATAATCATGACACAGAGCCGGGCCAAGCGCTTCAGT

CATGGGTCGACCCATGGTTCAAACCGTTGGCTTACGCCTTTATTCTGACACGGCAGGAAGGATAC

CCGTGCGTCTTTTATGGTGACTATTATGGCATTCCACAATATAACATTCCTTCTCTGAAAAGCAA

AATCGATCCGCTTCTGATCGCGCGCCGTGATTATGCTTACGGAACGCAACATGATTATCTTGATC

ACTCAGACATCATTGGGTGGACAAGAGAAGGGGTCACAGAAAAACCAGGATCAGGCCTCGCCGCA

CTGATCACGGATGGGCCGGGAGGAAGCAAATGGATGTACGTTGGCAAACAGCATGCTGGAAAAGT

GTTCTATGACCTTACAGGCAACCGGAGCGACACAGTCACGATCAACTCAGATGGATGGGGGGAAT

TCAAAGTCAATGGCGGTAGCGTTTCAGTTTGGGTTCCTAGA

SEQ ID NO:27:杂合体H核苷酸序列

GATTGGTTGTCATATGTGCGTTC

TCAGACTGGCAAGCCGCTGTTTACAGTCGGGGAATATTGGAGCTATGATATCAACAAGTTGCACA

ATTACATTACGAAAACAAACGGAACGATGTCTTTGTTTGATGCCCCGTTACACAACAAATTTTAT

ACCGCTTCCAAAAGCGGGGGCGCATTTGATATGCGCACGTTAATGACCAATACACTGATGAAAGA

TCAACCGACATTGGCCGTCACGTTCGTTGATAATCATGACACAGAGCCGGGCCAAGCGCTTCAGT

CATGGGTCGACCCATGGTTCAAACCGTTGGCTTACGCCTTTATTCTGACACGGCAGGAAGGATAC

CCGTGCGTCTTTTATGGTGACTATTATGGCATTCCACAATATAACATTCCTTCTCTGAAAAGCAA

AATCGATCCGCTTCTGATCGCGCGCCGTGATTATGCTTACGGAACGCAACATGATTATCTTGATC

ACTCAGACATCATTGGGTGGACAAGAGAAGGGGTCACAGAAAAACCAGGATCAGGCCTCGCCGCA

CTGATCACGGATGGGCCGGGAGGAAGCAAATGGATGTACGTTGGCAAACAGCATGCTGGAAAAGT

GTTCTATGACCTTACAGGCAACCGGAGCGACACAGTCACGATCAACTCAGATGGATGGGGGGAAT

TCAAAGTCAATGGCGGTAGCGTTTCAGTTTGGGTTCCTAGA

杂合-淀粉酶.pdf_第1页
第1页 / 共42页
杂合-淀粉酶.pdf_第2页
第2页 / 共42页
杂合-淀粉酶.pdf_第3页
第3页 / 共42页
点击查看更多>>
资源描述

《杂合-淀粉酶.pdf》由会员分享,可在线阅读,更多相关《杂合-淀粉酶.pdf(42页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 102245764 A (43)申请公布日 2011.11.16 CN 102245764 A *CN102245764A* (21)申请号 200980150419.2 (22)申请日 2009.12.11 61/122,628 2008.12.15 US C12N 9/28(2006.01) C12N 15/56(2006.01) C07K 19/00(2006.01) C12N 1/15(2006.01) C12N 1/21(2006.01) (71)申请人 丹尼斯科美国公司 地址 美国加利福尼亚州 (72)发明人 SD鲍尔 A肖 (74)专利代理机构 北京市中。

2、咨律师事务所 11247 代理人 胡志君 黄革生 (54) 发明名称 杂合 - 淀粉酶 (57) 摘要 提供了与野生型透阿米尔样 - 淀粉酶例如 芽孢杆菌淀粉酶整体或部分地共享保守 3D 结构 的杂合 - 淀粉酶。在该杂合体中, 透阿米尔样 - 淀粉酶的 N 端部分以来自古细菌 - 淀粉酶 的序列替换。这两个淀粉酶序列之间的序列相似 性可以小于60。 该杂合体中保留野生型3D结构 有利于获得有酶活性的淀粉酶。在一个实施方案 中, 一个或两个淀粉酶序列向 B 结构域贡献残基, 从而产生特别有利的特性。 例如, 用不结合Ca2+的 古细菌 - 淀粉酶的 B 结构域序列替换透阿米尔 样 - 淀粉酶 。

3、B 结构域中的 Ca2+结合位点可以产 生在 Ca2+不存在下具有充分活性的杂合体。 (30)优先权数据 (85)PCT申请进入国家阶段日 2011.06.15 (86)PCT申请的申请数据 PCT/US2009/067639 2009.12.11 (87)PCT申请的公布数据 WO2010/074999 EN 2010.07.01 (51)Int.Cl. (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 2 页 说明书 32 页 附图 7 页 CN 102245770 A1/2 页 2 1. 杂合淀粉酶, 其包含从 N 端至 C 端具有式 (I) 的多肽 : A-x-y。

4、-B(I), 其中 A 是来自古细菌 - 淀粉酶的第一氨基酸序列 ; B 是来自野生型透阿米尔样 - 淀粉酶的或来自与野生型透阿米尔样 - 淀粉酶具有 至少 80序列同一性的变体的第二氨基酸序列 ; x 是第一氨基酸序列的 C 端残基 ; y 是第二氨基酸序列的 N 端残基 ; 其中第一和第二氨基酸序列一起含有约 400 至约 500 个氨基酸残基 ; 其中杂合淀粉酶中约 10至约 80之间的总氨基酸由古细菌 - 淀粉酶贡献 ; 并且 其中与野生型透阿米尔样 - 淀粉酶相比, 残基 x 和 y 在杂合淀粉酶中是结构上保守 的。 2.权利要求1所述的杂合淀粉酶, 其中与野生型透阿米尔样-淀粉酶相。

5、比, 杂合淀粉 酶具有改变水平的重组表达、 溶解度、 pH 活性谱、 底物特异性或比活性。 3.权利要求1所述的杂合淀粉酶, 其中与野生型透阿米尔样-淀粉酶三维结构相比, 残基 x 和 y 中的 - 碳之间的均方根距离不多于约 4.权利要求1所述的杂合淀粉酶, 其中与野生型透阿米尔样-淀粉酶相比, 第一氨基 酸序列 A 在杂合淀粉酶中是结构上保守的。 5. 权利要求 1 所述的杂合淀粉酶, 其中野生型透阿米尔样 - 淀粉酶是芽孢杆菌 (Bacillus)- 淀粉酶。 6. 权利要求 5 所述的杂合淀粉酶, 其中芽孢杆菌 - 淀粉酶是嗜热脂肪芽孢杆 菌 (Bacillus stearotherm。

6、ophilus)- 淀 粉 酶、地 衣 芽 孢 杆 菌 (B.licheniformis) - 淀粉酶、 枯草芽孢杆菌 (B.subtilis)- 淀粉酶、 芽孢杆菌属物种 (Bacillus sp.) KSM-K38- 淀粉酶或盐敏芽孢杆菌 (B.halmapalus)- 淀粉酶。 7. 权利要求 6 所述的杂合淀粉酶, 其中芽孢杆菌 - 淀粉酶是嗜热脂肪芽孢杆菌 - 淀粉酶。 8. 权利要求 1 所述的杂合淀粉酶, 其中野生型透阿米尔样 - 淀粉酶是嗜热脂肪芽孢 杆菌 - 淀粉酶的变体, 其中淀粉结合结构域从嗜热脂肪芽孢杆菌 - 淀粉酶的羧基端移 除。 9. 权利要求 1 所述的杂合淀粉酶。

7、, 其中古细菌 - 淀粉酶是 Ultrathin- 淀粉酶。 10. 权利要求 1 所述的杂合淀粉酶, 其中第一和第二氨基酸序列从共享小于约 60序 列同一性的淀粉酶衍生。 11. 权利要求 1 所述的杂合淀粉酶, 其中残基 x 和 y 在 B 结构域中。 12. 权利要求 1 所述的杂合淀粉酶, 其中第一氨基酸序列贡献 B 结构域的至少 80氨 基酸残基。 13. 权利要求 1 所述的杂合淀粉酶, 其中第一氨基酸序列包含 Zn2+结合位点。 14. 权利要求 1 所述的杂合淀粉酶, 其中野生型透阿米尔样 - 淀粉酶的 Ca2+结合位 点中的至少一个氨基酸以来自第一氨基酸序列的氨基酸残基替换。。

8、 15. 权利要求 1 所述的杂合淀粉酶, 其中杂合淀粉酶具有 - 淀粉酶活性, 并且其中该 权 利 要 求 书 CN 102245764 A CN 102245770 A2/2 页 3 活性不受 Ca2+浓度影响。 16. 权利要求 1 所述的杂合淀粉酶, 其包含 SEQ ID NO : 1-8 任一序列中所示的氨基酸 序列。 17. 权利要求 16 所述的杂合淀粉酶, 其中淀粉酶包含 SEQ ID NOS : 1、 2、 6、 7 或 8 任一 序列中所示的氨基酸序列。 18. 权利要求 1 所述的杂合淀粉酶, 其中杂合淀粉酶是被纯化的。 19. 核酸, 其编码权利要求 1 的杂合淀粉酶。。

9、 20. 载体, 其包含权利要求 19 的核酸。 21. 宿主细胞, 其包含权利要求 19 的核酸或权利要求 20 的载体。 22. 权利要求 21 所述的宿主细胞, 其中宿主细胞是细菌或真菌。 23. 权利要求 22 所述的宿主细胞, 其中细菌是芽孢杆菌属物种 (Bacillus sp)。 24. 一种设计权利要求 19 的核酸的方法, 包括 : (a) 在计算机执行的操作中比对古细菌 - 淀粉酶和野生型透阿米尔样 - 淀粉酶的 3D 结构 ; (b) 选择结构上保守的氨基酸残基 x 和 y ; 和 (c) 设计编码杂合淀粉酶的核酸。 25. 权利要求 24 所述的方法, 其中与野生型透阿米。

10、尔 - 淀粉酶三维结构相比, 残基 x 和 y 中的 - 碳之间的均方根距离不多于约 26. 权利要求 25 所述的方法, 其中计算机执行的操作包括在计算机监视器上显示三维 结构比对结果。 权 利 要 求 书 CN 102245764 A CN 102245770 A1/32 页 4 杂合 - 淀粉酶 0001 序列表 0002 附上包含 SEQ ID NO : 1-27 的序列表并将其通过引用的方式完整并入。 0003 优先权 0004 本申请要求 2008 年 12 月 15 日提交的由此通过引用方式并入的美国临时申请系 列号 61/122,628 的优先权。 发明领域 0005 提 供 。

11、了 包 含 古 细 菌 (archae)- 淀 粉 酶 序 列 和 透 阿 米 尔 样 - 淀 粉 酶 (Termamyl-like -amylase) 序列的杂合淀粉酶。与野生型透阿米尔样 - 淀粉酶相比, 该杂合淀粉酶可以具有改变的特性。 0006 发明背景 0007 具有共同功能的相关酶可以具有或可以不具有显著的序列同一性。例如, 若其氨 基酸序列与地衣芽孢杆菌 (B.licheniformis)- 淀粉酶共有 60或更高的同一性, 则芽 孢杆菌 (Bacillus)- 淀粉酶 (1, 4-D- 葡聚糖葡聚糖水解酶, EC 3.2.1.1) 分类为 “透 阿米尔样” 。参见 WO 96/。

12、23874。可以在共享 62或更高序列同一性的淀粉酶之间产生杂 合淀粉酶。参见 Gray 等人, J.Bacteriology 166 : 635-43(1986) ; 美国专利号 6,143,708。 例如, 已经重组表达并且结晶出含有解淀粉芽孢杆菌 (Bacillus amyloliquefaciens) 第 1-300 位残基和地衣芽孢杆菌第 301-483 位残基的嵌合淀粉酶。见 Brzozowski 等人, Biochemistry 39 : 9099-107(2000) ; 还见WO 96/23874 ; WO 97/41213。 然而, 甚至共享小于 25序列同一性的淀粉酶如来自。

13、枯草芽孢杆菌(Bacillus subtilis)和地衣芽孢杆菌的淀 粉酶却可以共享共同的催化功能和总体保守的三维立体 (3D) 折叠。 0008 许多淀粉酶的晶体结构是目前可获得的。见上文 Brzozowski 等人 (2000)。 Protein Data Bank(PDB) 例如含有至少在表 1 中所示的淀粉酶的 3D 结构。 0009 表 1 0010 说 明 书 CN 102245764 A CN 102245770 A2/32 页 5 0011 这些晶体结构的比较揭示了三维 (3D) 结构的高度保守性, 甚至在不存在明显的 序列相似性时。所报道的全部 - 淀粉酶结构共享有 (/)8。

14、催化核心结构域, 为结构 域 A。 “(/)8” 指定义为保守蛋白质 3D 构象的所谓 “TIM 桶结构” 或由沿着肽主链交替 分布的 8 个 - 螺旋和 8 条平行 - 链组成的 “折叠” 。见 Lolis 等人, Biochemistry 29 : 6609-18(1990)。B 结构域是结构域 A 的桶状链 -3 与螺旋 -3 之间的偏移 (excursion) 或延伸结构。一般为 8 链 折叠的 C 结构域形成淀粉酶的其余 C 端部分。下文更详细地 描述淀粉酶的结构域构造。 0012 本领域对提供变体 - 淀粉酶存在持续需求, 其中所述的变体 - 淀粉酶在重组 宿主细胞中正确折叠、 维。

15、持稳定性并展示高效表达, 而无需对蛋白质的氨基酸序列或 3D 结 构做出大规模改变。 0013 发明概述 0014 使用透阿米尔样 - 淀粉酶的 3D 结构作为构建新杂合 - 淀粉酶的准则。在杂 合淀粉酶中, 透阿米尔样 - 淀粉酶 N 端的一部分以来自古细菌淀粉酶的序列替换。这两 种淀粉酶共享保守的 3D 结构。另外, 所述淀粉酶之间的序列同一性可以小于 60。在一 个实施方案中, 杂合淀粉酶含有约 400 至约 500 个氨基酸残基。杂合淀粉酶中约 10和约 80之间的总氨基酸由古细菌 - 淀粉酶贡献。预测杂合酶中被替换的部分具有在结构上 说 明 书 CN 102245764 A CN 1。

16、02245770 A3/32 页 6 整体或部分地与透阿米尔样淀粉酶保守的 3D 结构。在一个实施方案中, 至少古细菌淀粉酶 序列的 C 端残基 ( 残基 “x” ) 和透阿米尔样淀粉酶序列的 N 端残基 ( 残基 “y” ) 是结构上 保守的。该杂合淀粉酶可以有利地组合构成性淀粉酶序列的所希望有的特性, 如改变水平 的重组表达、 改变的溶解度, 和所希望有的性能特性, 如最适 pH 活性谱、 底物特异性、 产物 特征和比活性。 0015 由于蛋白质结构域经常被认为折叠成独立的单元, 故可能期望不得不将结构域作 为整体单元替换以在杂合酶中维持正确的折叠。然而, 通过设计杂合体以维持野生型芽孢 。

17、杆菌酶的保守折叠, - 淀粉酶序列不需要在结构域边界处融合。在一些实施方案中, 杂合 淀粉酶包含来自第一 - 淀粉酶的含有一部分 B 结构域的第一氨基酸序列, 其与来自芽孢 杆菌 - 淀粉酶的含有 B 结构域其余部分的第二氨基酸序列融合。以这种方式, 可以设计 具有独特特性的杂合淀粉酶, 这取决于融合在一起的 B 结构域的特定部分。 0016 例如, 某些实施方案涉及的杂合淀粉酶含有来自嗜热脂肪芽孢杆菌 - 淀粉酶 (AmyS ; 本领域也称作嗜热脂肪土芽孢杆菌 (Geobacillus stearothermophilus) 的序列, 其与来自 “Ultrathin” ( 一种在 Richa。

18、rdson 等人 ., J.Biol.Chem.277 : 26501-07(2002) 中 公开的古细菌 - 淀粉酶 (GenBankTM登录号 AAM48114) 的序列融合。在本文中公开的多 个实施方案中, 杂合体的 N 端由来自 Ultrathin 的氨基酸残基 ( 即, 第一氨基酸序列 ) 组 成, 而 C 端由来自 AmyS 的氨基酸残基 ( 即, 第二氨基酸序列 ) 组成。具体的 Ultrathin 残 基命名为 “UT n” , 其中 n 是自 N 端起的氨基酸残基编号。例如, Ultrathin 的第 104 位残 基命名为 “UT 104” 。术语 “des-Met Ult。

19、rathin”指缺 N 端甲硫氨酸残基的 Ultrathin。 Ultrathin 第 1-104 位残基与 AmyS 第 100-483 位残基之间的杂合淀粉酶例如命名为 “UT 1-104 : AmyS100-483” 。 0017 象其他古细菌淀粉酶, Ultrathin 在 B 结构域中具有 Zn2+结合位点。相反, 芽孢杆 菌 - 淀粉酶的 B 结构域具有 Ca2+-Na+-Ca2+结合位点。含有与来自芽孢杆菌 - 淀粉酶的 剩余B结构域融合的Ultrathin Zn2+结合位点的杂合体可以具有芽孢杆菌-淀粉酶的性 能特征, 而不需要Ca2+用于酶活性。 与另一种酶如葡糖淀粉酶组合使。

20、用时, 这种杂合淀粉酶 可能特别有用, 其中所述的另一种酶具有不同于野生型芽孢杆菌 - 淀粉酶的钙需求。例 如, 该杂合淀粉酶可以用来例如在与葡糖淀粉酶相同的反应容器中糖化淀粉, 其中 Ca2+浓 度可以针对该葡糖淀粉酶的性能进行优化。 0018 因此, 本公开提供杂合淀粉酶, 其包含从氨基端至羧基端具有式 (I) 的多肽 : 0019 A-x-y-B(I), 0020 其中 A 是来自古细菌 - 淀粉酶的第一氨基酸序列, B 是来自野生型透阿米尔样 - 淀粉酶或其变体的第二氨基酸序列, x 是第一氨基酸序列的 C 端残基, 并且 y 是第二氨 基酸序列的 N 端残基。透阿米尔样 - 淀粉酶变。

21、体可以与野生型透阿米尔样 - 淀粉酶具 有至少约80、 约85、 约90、 约95、 或约99序列同一性。 第一和第二氨基酸序列一 起可以含有约 400、 约 410、 约 420、 约 430、 约 440、 约 450、 约 460、 约 470、 约 480、 约 490 或约 500 个氨基酸残基。该杂合淀粉酶中约 10、 约 20、 约 30、 约 40、 约 50、 约 60、 约 70或约 80的氨基酸可以由古细菌 - 淀粉酶贡献。与野生型透阿米尔样 - 淀粉酶 相比, 残基 x 和 y 在杂合淀粉酶中均是结构上保守的。该杂合淀粉酶可以包含 SEQ ID NO : 1-8 任一者。

22、中所示的氨基酸序列。在又一个方面, 该杂合淀粉酶可以被纯化。 说 明 书 CN 102245764 A CN 102245770 A4/32 页 7 0021 在一个方面, 与野生型透阿米尔-淀粉酶3D结构相比, 残基x和y中的-碳之 间的均方根距离不多于约约约约或约在另一个方面, 与野生型透阿米尔样-淀粉酶相比, 第一氨基酸序列A在杂合淀粉酶中是结构上保守的。 野生型透阿米尔样 - 淀粉酶可以是芽孢杆菌 - 淀粉酶。该芽孢杆菌 - 淀粉酶可以是 嗜热脂肪芽孢杆菌 - 淀粉酶、 地衣芽孢杆菌 - 淀粉酶、 枯草芽孢杆菌 - 淀粉酶、 芽孢 杆菌属物种 KSM-K38- 淀粉酶或盐敏芽孢杆菌 -。

23、 淀粉酶。透阿米尔样 - 淀粉酶变体 可以通过去掉亲本酶的 C 端从嗜热脂肪芽孢杆菌 - 淀粉酶衍生。古细菌 - 淀粉酶可以 是 Ultrathin- 淀粉酶。杂合淀粉酶的第一和第二氨基酸序列从可以共享小于约 60、 约 55、 约 50、 约 45、 约 40、 约 35或约 30序列同一性的淀粉酶衍生。也构思了 在其第一氨基酸序列内部包含Zn2+结合位点的杂合淀粉酶。 该杂合淀粉酶可以使得野生型 透阿米尔样-淀粉酶的Ca2+结合位点的至少一个氨基酸置换为来自第一氨基酸序列的氨 基酸残基。 0022 在又一个方面, 残基 x 和 y 处于 B 结构域中。第一氨基酸序列可以贡献 B 结构域 的。

24、至少约 80、 约 85、 约 90、 约 95或约 98氨基酸残基。 0023 另一方面构思了与野生型透阿米尔样 - 淀粉酶相比, 具有改变水平的重组表 达、 溶解度、 pH 活性谱、 底物特异性或比活性的杂合淀粉酶。该杂合淀粉酶可以具有不受 Ca2+浓度影响的 - 淀粉酶活性。 0024 也构思了编码如现在公开的杂合淀粉酶的核酸。又一个方面是包含该核酸的载 体。又一个方面构思了含有该核酸或载体的宿主细胞。宿主细胞可以是细菌或真菌。在又 一个方面, 细菌可以是芽孢杆菌属物种。 0025 又一个方面构思了设计编码杂合酶的核酸的方法。该方法包括 : 在计算机执行的 操作中比对古细菌 - 淀粉酶和。

25、野生型透阿米尔样 - 淀粉酶的 3D 结构, 选择结构上保守 的氨基酸残基 x 和 y, 并且设计编码该杂合酶的核酸。计算机执行的操作可以包括在计算 机监视器上显示 3D 结构比对结果。与野生型透阿米尔 - 淀粉酶 3D 结构相比, 残基 x 和 y 中的 - 碳之间的均方根距离不多于约约约约或约 0026 附图简述 0027 并入附图在本说明书中, 并且它们构成本说明书的一部分并说明多个实施方案。 0028 图 1 描述了成熟形式 ( 即缺少信号序列 ) 的嗜热脂肪芽孢杆菌 - 淀粉酶 ( “MatAmyS” : SEQ ID NO : 10) 和成熟形式的 des-Met Ultrathi。

26、n 淀粉酶 ( “MatUltrathin” : SEQ ID NO : 9) 之间的氨基酸序列比对和共有序列。 0029 图2描述了使用比色淀粉酶测试法(Magle Life Sciences)时多种 淀粉酶的相对活性。底物由带有化学连接的水溶性蓝色染料的水不溶性淀粉微球组成。淀 粉酶水解该淀粉, 从而释放通过 620nm 处吸收的变化所测量的蓝色染料。在 pH 7( 分图 A) 和 pH 10( 分图 B) 上检测培养上清液样品的稀释物系列。将任意单位的吸光度作为淀粉酶 试样的稀释的函数作图。分析了以下杂合淀粉酶 : 0030 杂合体 A : UT 1-104 : AmyS 100-483。

27、(SEQ ID NO : 1) ; 0031 杂合体 B : UT 1-113 : AmyS 109-483(SEQ ID NO : 2) ; 0032 杂合体 C : UT 1-128 : AmyS 140-483(SEQ ID NO : 3) ; 0033 杂合体 D : UT 1-145 : AmyS 161-483(SEQ ID NO : 4) ; 说 明 书 CN 102245764 A CN 102245770 A5/32 页 8 0034 杂合体 E : UT 1-163 : AmyS 203-483(SEQ ID NO : 5) ; 0035 杂合体 F : UT 1-175 。

28、: AmyS 215-483(SEQ ID NO : 6) ; 0036 杂合体 G : UT 1-191 : AmyS 228-483(SEQ ID NO : 7) ; 和 0037 杂合体 H : UT 1-209 : AmyS 246-483(SEQ ID NO : 8)。 0038 图 3 描述了 des-Met Ultrathin 淀粉酶 (SEQ ID NO : 9) 的氨基酸序列。粗体、 加下划线的氨基酸残基表示图 2 中所示的杂合体中 Ultrathin 部分的多个 C 端残基。将 UltrathinS 中的 “交换 (cross-over) 位置” 以粗体并加下划线显示。 0。

29、039 图 4 描述了具有去掉淀粉结合结构域的 C 端截短的 AmyS 变体的氨基酸序列 (SEQ ID NO : 11)。粗体、 加下划线的氨基酸残基表示图 2 中所示的杂合体中 AmyS 部分的 N 端残 基。将 AmyS 中的 “交换位置” 以粗体并加下划线显示。 0040 图 5A 描述了 AmyS 的两个立体视图, B- 结构域为黑体。B- 结构域后的圆球代表结 合的 Na+和 Ca2+的原子。 0041 图 5B 描述了 UT 1-104 : AmyS 100-483 的两个立体视图, 残基 UT 1-104 为黑体。 B- 结构域后的圆球代表结合的 Na+和 Ca2+的原子。 0。

30、042 图 5C 描述了 UT 1-209 : AmyS 246-483 的两个立体视图, 残基 UT1-209 为黑体。 B- 结构域后的圆球代表结合的 Na+和 Ca2+的原子。 0043 发明详述 0044 提供了与野生型透阿米尔样 - 淀粉酶例如芽孢杆菌淀粉酶整体或部分地共享 保守 3D 结构的杂合 - 淀粉酶。在该杂合体中, 透阿米尔样 - 淀粉酶的 N 端部分用来自 古细菌 - 淀粉酶的序列替换。这两个淀粉酶之间的序列相似性可以小于 60。该杂合 体中保留野生型 3D 结构有利于获得有酶活性的淀粉酶。在一个实施方案中, 一个或两个淀 粉酶序列向 B 结构域贡献残基, 从而产生特别有。

31、利的特性。例如, 用不结合 Ca2+的古细菌 - 淀粉酶的 B 结构域序列替换透阿米尔样 - 淀粉酶 B 结构域中的 Ca2+结合位点可以产 生在 Ca2+不存在下具有充分活性的杂合体。 0045 1. 定义和缩写 0046 根据这份详细的描述, 以下缩写和定义适用。应当指出如本文中所用, 单数形式 “一个” 、“一种” 和 “该” 包括复数称谓, 除非上下文另外清楚地指出并非如此。因此, 例如, 对 “一种酶” 的提及包括多种此类酶, 并且对 “该制剂” 的提及包括对本领域技术人员已知 的一种或多种制剂和其等同物的提及等。 0047 除非另外定义, 本文中所用的全部技术及科学术语具有与本领域。

32、普通技术人员通 常所理解的相同意义。下文提供以下术语。 0048 1.1. 定义 0049 如本文中所用,“古细菌” 指与原核生物和真核生物明显不同的一个界的单细胞生 物。古细菌包括嗜热菌、 嗜盐菌和产甲烷菌。 0050 淀粉酶是切割淀粉中 -D-(1 4)O- 糖苷键的羟化酶并且包括葡糖淀粉酶和 - 淀粉酶以及 - 淀粉酶。然而, 为本公开的目的,“淀粉酶” 指 - 淀粉酶, 除非另外指 出并非如此。- 淀粉酶 (EC 3.2.1.1 ; -D-(1 4)- 葡聚糖葡聚糖水解酶 ) 定义为以随 机方式切割淀粉分子内部-D-(14)O-糖苷键的内切作用酶。 相反, 外切作用解淀粉酶, 如 - 。

33、淀粉酶 (EC 3.2.1.2 ; -D-(1 4)- 葡聚糖麦芽糖水解酶 ) 和一些产物特异性淀 说 明 书 CN 102245764 A CN 102245770 A6/32 页 9 粉酶如生麦芽糖 - 淀粉酶 (EC3.2.1.133) 从底物的非还原性末端切割淀粉分子。- 淀 粉酶、 - 葡糖苷酶 (EC3.2.1.20 ; -D- 葡糖苷葡萄糖水解酶 )、 葡糖淀粉酶 (EC 3.2.1.3 ; -D-(1 4)- 葡聚糖葡萄糖水解酶 ) 和产物特异性淀粉酶可以从淀粉产生特定长度的麦 芽低聚糖。 0051 “透阿米尔样” - 淀粉酶与野生型地衣芽孢杆菌 - 淀粉酶具有至少约 60序列。

34、 同一性。 0052 “野生型” 酶指天然存在的酶。 “野生型透阿米尔样 - 淀粉酶” 因而指与野生型 地衣芽孢杆菌 - 淀粉酶具有至少约 60序列同一性的天然存在的 - 淀粉酶。 0053 通过使用在美国国家医学图书馆国家生物技术信息中心 (National Center for Biotechnology Information(NCBI)of the National Library of Medicine) 的网站可获 得的 BLAST 程序, 以默认比对值比对两个序列并比较它们来确定 “序列同一性百分数” 。 0054 “变体” 或 “多个变体” 可以指多肽或核酸。出于本公开的目的,。

35、“变体” 包括含有 来自两种不同亲本淀粉酶的氨基酸序列的杂合蛋白。术语 “变体” 可以与术语 “突变体” 可 互换地使用。与野生型序列相比, 变体分别包括在氨基酸或核苷酸序列中的一个或多个位 置处插入、 替换、 颠换、 截短和 / 或倒位。短语 “变体多肽” 和 “变体酶” 因此意指蛋白质, 其 具有来自野生型蛋白氨基酸序列的已经被修饰的氨基酸序列。 变体多肽包括与亲本酶具有 某个百分数例如至少约 80、 85、 90、 95或 99序列同一性的多肽。与野生型序列相 比, 变体可以具有 1、 2、 3、 4、 5、 10、 15、 20 或 30 个或在 1-30 范围内任意整数值的氨基酸置 。

36、换、 添加或缺失。变体可以表达为含有异源多肽的融合蛋白。例如, 变体可以包含另一种蛋 白质的信号肽或设计旨在辅助鉴定或纯化所表达融合蛋白的序列, 如 His 标签序列。 0055 术语 “融合蛋白” 指通过本领域已知的任意手段接合起来的两个或多个多肽。这 些手段包括化学合成法或通过重组工程剪接编码性核酸。 0056 如本文中所用, 术语 “杂合蛋白” 是特殊形式的融合蛋白。如同融合蛋白, 来自第 一蛋白质 ( 古细菌 - 淀粉酶 ) 的氨基酸序列与来自第二蛋白质 ( 透阿米尔样 - 淀粉 酶 ) 的氨基酸序列融合或接合以形成杂合蛋白。在本公开的杂合 - 淀粉酶中, 来自古细 菌 - 淀粉酶的第。

37、一氨基酸序列替换透阿米尔样 - 淀粉酶的一部分, 同时保留透阿米尔 样 - 淀粉酶的所替换部分的全部或部分 3D 结构。衍生杂合淀粉酶的古细菌 - 淀粉酶 和 / 或透阿米尔样 - 淀粉酶可以是野生型淀粉酶的 “变体” 。 0057 “- 碳” 指多肽链中的主链碳, 是与羰基碳结合的碳。 0058 如本文中所用, 第一3D结构或折叠或其部分在比对结构从而-碳的均方根距离 (RMSD) 不多于约时与第二 3D 结构或其部分是 “在结构上保守的” 。还见 Orengo 等人, Protein Eng.6 : 485-500(1993)。 0059 如本文中所用, 术语 “片段” 指多核苷酸序列或多。

38、肽序列, 其小于全长并且是包含 两个或多个氨基酸或核酸残基 ( 例如, 5、 10、 15、 20、 30 或 50 个残基 ) 的序列。 0060 如本文中所用, 术语 “表达” 指基于基因的核酸序列产生多肽的过程。该过程包括 转录和翻译。 0061 “分离的” 意指该序列至少基本上不含与所述序列天然相关并存在于自然界中的 至少一种其他组分, 例如, 基因组序列。 0062 “纯化” 意指该物质处于相对纯的状态, 例如, 至少约90纯度, 至少约95纯度或 说 明 书 CN 102245764 A CN 102245770 A7/32 页 10 至少约 98纯度。 0063 “热稳定的” 意。

39、指该酶在暴露于升高的温度后仍保留活性。酶的热稳定性由其半寿 期 (t1/2) 度量, 其中一半的酶活性在半寿期期间丧失。在定义的条件下通过测量残余淀粉 酶活性计算半寿期值。为测定酶的半寿期, 将样品加热至测试温度 1-10 分钟, 并且使用用 于该酶活性的标准测定法测量活性。 0064 如本文中所用,“氨基酸序列” 同义于术语 “多肽” 和 / 或术语 “蛋白质” 。在一些 情况下, 术语 “氨基酸序列” 同义于术语 “肽” ; 在一些情况下, 术语 “氨基酸序列” 同义于术 语 “酶” 。 0065 如本文中所用,“核苷酸序列” 或 “核酸序列” 指寡核苷酸序列或多核苷酸序列和 其变体、 同。

40、源物、 片段和衍生物。核苷酸序列可以是基因组的、 合成的或重组来源的并且可 以是双链或单链, 无论代表有义或反义链。如本文中所用, 术语 “核苷酸序列” 包括基因组 DNA、 cDNA、 合成的 DNA 和 RNA。 0066 “同源物” 意指与主题氨基酸序列和主题核苷酸序列具有某种程度序列同一性的 实体。 “同源序列” 包括与另一个序列具有某个百分比例如至少约 80、 85、 90、 95或 99的序列同一性的多核苷酸或多肽。一般而言, 同源物将包含与主题氨基酸序列相同的 活性部位残基。 虽然同源物可以具有与野生型酶不同的酶特性, 但是同源物也保留酶活性。 0067 如本文中所用,“杂交” 。

41、包括一条核酸链通过碱基配对作用与互补链结合的过程, 以及如聚合酶链反应 (PCR) 技术中那样所实施的扩增过程。变体核酸可以作为单链或双链 DNA 或 RNA、 RNA/DNA 异双链体或 RNA/DNA 共聚物存在。如本文中所用,“共聚物” 指同时包 含核糖核苷酸和脱氧核糖核苷酸的单条核酸链。 变体核酸可以进行密码子优化以进一步增 加表达。 0068 如本文中所用, 通过体外化学或酶促合成产生 “合成的化合物” 。 它包括, 但不限于 采用宿主生物如酵母细胞宿主或所选其他表达宿主的最佳密码子选择的情况下所产生的 变体核酸。 0069 如本文中所用,“转化细胞” 包括已经利用重组DNA技术转化。

42、的细胞, 包括细菌细胞 和真菌细胞。转化一般通过一个或多个核苷酸序列插入细胞中发生。插入的核苷酸序列可 以是异源核苷酸序列, 即, 是对待转化细胞而言并非天然的序列, 如融合蛋白。 0070 如本文中所用,“有效连接” 意指所述组件处于允许它们以其意图方式发挥功能的 关系。 例如, 与编码序列有效连接的调节序列以这样的方式连接, 从而在与该调控序列相容 的条件下实现编码序列的表达。 0071 如本文中所用,“生物活性的” 指与天然存在序列具有相似的结构、 调节功能或生 物化学功能的序列, 尽管不必需是相同的程度。 0072 如本文中所用, 术语 “淀粉” 指由植物 ( 如谷物 ) 的复杂多糖碳。

43、水化合物组成的任 何物质, 所述的复杂多糖碳水化合物由具有式 (C6H10O5)x的直链淀粉和支链淀粉组成, 其中 X 可以是任意数字。 0073 1.2. 缩写 0074 除非另外说明, 使用以下缩写 : 0075 说 明 书 CN 102245764 A CN 102245770 A8/32 页 11 0076 说 明 书 CN 102245764 A CN 102245770 A9/32 页 12 0077 2. 工程化具有保守 3D 结构的融合蛋白 0078 当融合不相似的氨基酸序列以产生杂合酶时, 特别当这两个序列在某结构域的中 央接合时, 结构域结构可能被破坏。结构域结构的破坏转而。

44、可以导致更低的活性和 / 或蛋 白质折叠困难, 从而导致所表达的融合蛋白的产量损失。通过在来自第一蛋白质的氨基酸 序列与来自芽孢杆菌蛋白质的氨基酸序列之间选择适宜的融合位点解决这个该问题。即, 这两个序列在这两个淀粉酶序列的 3D 结构保守的位点处融合。以这种方式, 当这两个序列 在杂合酶中接合时, 发生最小的 3D 结构改变。另外, 这种方法促进构建有活性的杂合体, 即 便所述淀粉酶共享小于 60序列同一性时。 0079 两种蛋白质的结构比对结果可以用来确定全部或部分的 3D 结构是否在两种蛋白 质之间是保守的。为此目的, 第一蛋白质的 3D 结构可以叠加到第二蛋白质的 3D 结构上或 与之。

45、比对。这种叠加或比对可以在整个蛋白质结构或二级结构元件范围内进行。例如, 可 说 明 书 CN 102245764 A CN 102245770 A10/32 页 13 以比对二级结构元件, 如 - 桶中的中央 - 链。叠加或比对结构的方法是本领域已知的。 在一个实施方案中, 用计算机执行的操作, 如 Chemical Computing Group 提供的分子运行 环境 (Molecular Operating Environment) 比对算法, 实行比对。在另一个实施方案中, 比 对的结果显示在计算机监视器或显示系统上。 0080 当比对两个结构时, 可以确定这两个结构的 - 碳链的比对。

46、程度。选择结构上保 守的氨基酸。为本公开的目的, 第一 3D 结构或折叠在结构中 - 碳的 RMSD 不多于约 时是对第二 3D 结构 “在结构上保守” 。结构保守性可以延伸遍及至少两个或多个氨基酸残 基并且可以包括杂合淀粉酶中古细菌 - 淀粉酶贡献的整个部分。在一个实施方案中, 结 构保守的程度足够高, 以致 - 碳的 RMSD 不多于约 0081 杂合淀粉酶从 N 端至 C 端具有式 (I) 中所示的通式结构 : 0082 A-x-y-B(I), 0083 其中 A 是来自古细菌 - 淀粉酶的第一氨基酸序列, B 是来自野生型透阿米尔样 - 淀粉酶或其变体的第二氨基酸序列, x 是第一氨基。

47、酸序列的 C 端残基, 并且 y 是第二氨 基酸序列的 N 端残基。在一个实施方案中, 至少残基 x 和 y 是对野生型透阿米尔样 - 淀 粉酶在结构上保守的。即, 残基 x 和 y 中 - 碳的 RMSD 不多于约在另一个实施方案 中, 残基 x 和 y 中 - 碳的 RMSD 不多于约 0084 与式 (I) 中 x 相对应的代表性氨基酸残基显示为图 3 中所述的粗体、 加下划线的 氨基酸残基。与式 (I) 中 y 相对应的代表性氨基酸残基显示为图 4 中所述的粗体、 加下划 线的氨基酸残基。残基 x 和 y 出现在 “交换位置 (cross-over positions)” 处。接合两种。

48、 淀粉酶的序列以形成该杂合体的过程可以通过本领域已知的任意方法进行。例如, 氨基酸 序列可以通过氨基酸在多肽序列末端处的化学缀合作用接合。备选地, 编码性核酸可以重 组工程化设计以在表达宿主细胞中编码杂合蛋白。重组工程化的方法是本领域熟知的。例 如可以在目前可获得的任意实验手册如Sambrook等人, MOLECULAR: A LABORATORY MANUAL, 第3版, 冷 泉港实验室出版社, 冷泉港, 纽约 (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York)(2001) 中找到适宜的方法。 0085 3.。

49、 芽孢杆菌淀粉酶的结构域结构 0086 芽孢杆菌 - 淀粉酶由 3 个球状结构域 A、 B 和 C 构成。充分讨论见 WO 96/23874。 所述结构域可以定义为 : 结构域 A 是第 1-103 和第 206-395 位残基, 结构域 B 是第 104-205 位残基, 并且结构域 C 是第 396-483 位残基, 编号参照地衣芽孢杆菌 - 淀粉酶。芽孢杆菌 - 淀粉酶是拉伸的分子, 最长轴是约垂直这个轴的最宽点是大约并且跨中央 A 结构域。地衣芽孢杆菌 - 淀粉酶的活性部位残基是 D323、 D231 和 E261。 0087 3.1. 结构域 A 0088 结构域 A 是最大的结构域并且含有活性部位, 其包含一簇在该酶表面的深裂口中 的 3 个氨基酸残基。全部已知 - 淀粉酶结构的结构域 A 均具有相同的总体折叠, 即, 具有 8 条中央 - 链和 8 个侧翼 - 螺旋的 (/)8桶。- 链 1 的 C 末端通过名为环 1 的一 个环与螺旋 1 连接, 并且其他环存在相同的模式。这些环显示尺寸上的某些变异, 并且一些 环可以是相当舒展的。 0089 (/)8桶中的 8 条中央 - 链在多种已知 - 淀粉酶结构中充分地叠加, 并且 该结构的这个部分, 包括位于-链C末端处的活性部位的密切环境, 在不同淀粉酶之间显。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 >


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1