在糖工程化的酵母巴斯德毕赤酵母中对半乳糖同化途径的代谢工程化.pdf

上传人:00062****4422 文档编号:1253114 上传时间:2018-04-10 格式:PDF 页数:162 大小:11.89MB
返回 下载 相关 举报
摘要
申请专利号:

CN201080011713.8

申请日:

2010.02.24

公开号:

CN102333872A

公开日:

2012.01.25

当前法律状态:

终止

有效性:

无权

法律详情:

未缴年费专利权终止IPC(主分类):C12N 15/81申请日:20100224授权公告日:20140709终止日期:20150224|||授权|||专利申请权的转移IPC(主分类):C12N 15/81变更事项:申请人变更前权利人:默沙东公司变更后权利人:先灵公司变更事项:地址变更前权利人:美国新泽西州变更后权利人:美国新泽西州登记生效日:20121101|||著录事项变更IPC(主分类):C12N 15/81变更事项:申请人变更前:先灵公司变更后:默沙东公司变更事项:地址变更前:美国新泽西州变更后:美国新泽西州|||实质审查的生效IPC(主分类):C12N 15/81申请日:20100224|||公开

IPC分类号:

C12N15/81; C12N15/54; C12N15/61; C12N9/12; C12N9/90; C12N1/16; C12P21/00; C07K16/18

主分类号:

C12N15/81

申请人:

默沙东公司

发明人:

R·C·戴维森; P·波布罗维奇; 查冬兴

地址:

美国新泽西州

优先权:

2009.02.25 US 61/208582

专利代理机构:

中国专利代理(香港)有限公司 72001

代理人:

李波;刘健

PDF下载: PDF下载
内容摘要

描述了通常不能利用半乳糖作为碳源但根据本文的方法已被基因工程化为利用半乳糖作为单一碳源的低等真核细胞例如巴斯德毕赤酵母。细胞被基因工程化为表达包含Leloir途径的酶中的几种。具体地,细胞被基因工程化为表达半乳糖激酶、UDP-半乳糖-C4-差向异构酶和半乳糖-1-磷酸尿苷酰转移酶,以及任选地半乳糖通透酶。另外,提供了用于改进在已被基因工程化为产生具有N-聚糖(其具有半乳糖残基)的糖蛋白但通常缺乏包含Leloir途径的酶的细胞中具有半乳糖末端的或含有半乳糖的N-聚糖的产量的方法,所述方法包括用编码半乳糖激酶、UDP-半乳糖-C4-差向异构酶和半乳糖-1-磷酸尿苷酰转移酶的一种或多种核酸分子转化细胞。描述的方法和宿主细胞使得同化半乳糖的能力的存在或缺乏作为用于制备重组细胞的选择方法。所述方法和宿主细胞在本文显示对于制备具有半乳糖末端的或含有半乳糖的N-聚糖的免疫球蛋白和类似物是特别有用的。

权利要求书

1: 一种巴斯德毕赤酵母 (Pichia pastoris) 宿主细胞, 其已被基因工程化为表达半乳 糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任 选地半乳糖通透酶活性, 其中所述宿主细胞能够利用半乳糖作为单一碳能源。
2: 根据权利要求 1 的宿主细胞, 其中所述宿主细胞已进一步被基因工程化为能够产生 重组糖蛋白, 所述重组糖蛋白具有包含半乳糖残基的杂合或复合 N- 聚糖。
3: 根据权利要求 2 的宿主细胞, 其中所述 UDP- 半乳糖 -4- 差向异构酶活性被提供在融 合蛋白中, 所述融合蛋白包含半乳糖基转移酶的催化结构域和 UDP- 半乳糖 -4- 差向异构酶 的催化结构域。
4: 根据权利要求 2 的宿主细胞, 其中所述宿主细胞产生具有复合 N- 聚糖的糖蛋白, 其 中复合 N- 聚糖的 G0 ∶ G1/G2 比值小于 2 ∶ 1。
5: 根据权利要求 2 的宿主细胞, 其中所述宿主细胞产生糖蛋白, 所述糖蛋白 主要 具 有 选 自 GalGlcNAcMan5GlcNAc2、 NANAGalGlcNAcMan5GlcNAc2、 GalGlcNAcMan3GlcNAc2、 NANAGalGlcNAcMan 3 GlcNAc 2 、GalGlcNAc 2 Man 3 GlcNAc 2 、Gal 2 GlcNAc 2 Man 3 GlcNAc 2 、 NANAGal2GlcNAc2Man3GlcNAc2 和 NANA2Gal2GlcNAc2Man3GlcNAc2 的 N- 聚糖。
6: 根据权利要求 2 的宿主细胞, 其中所述 N- 聚糖是具有半乳糖末端的 N- 聚糖, 其选自 GalGlcNAcMan5GlcNAc2、 Gal2GlcNAc2Man3GlcNAc2 和 Gal2GlcNAc2Man3GlcNAc2。
7: 根据权利要求 2 的宿主细胞, 其中所述 N- 聚糖是具有半乳糖末端的杂合 N- 聚糖。
8: 根据权利要求 2 的宿主细胞, 其中所述 N- 聚糖是唾液酸化的 N- 聚糖, 其选自 NANAGalGlcNAcMan5GlcNAc2、 NANAGal2GlcNAc2Man3GlcNAc2 和 NANA2Gal2GlcNAc2Man3GlcNAc2。
9: 根据权利要求 2 的宿主细胞, 其中所述重组糖蛋白选自红细胞生成素 (EPO), 细胞 因子例如干扰素 α、 干扰素 β、 干扰素 γ 和干扰素 ω, 和粒细胞集落刺激因子 (GCSF), GM-CSF, 凝固因子例如因子 VIII、 因子 IX 和人蛋白 C, 抗凝血酶 III, 凝血酶, 可溶性 IgE 受 体 α- 链, 免疫球蛋白例如 IgG、 IgG 片段、 IgG 融合体和 IgM, 免疫粘附素和其它 Fc 融合蛋 白例如可溶性 TNF 受体 -Fc 融合蛋白, RAGE-Fc 融合蛋白, 白细胞介素, 尿激酶, 糜蛋白酶和 尿胰蛋白酶抑制剂, IGF- 结合蛋白, 表皮生长因子, 生长激素释放因子, 膜联蛋白 V 融合蛋 白, 制管张素, 血管内皮生长因子 -2, 骨髓样前体抑制因子 -1, 骨保护蛋白, α-1- 抗胰蛋白 酶, 甲胎蛋白, DNA 酶 II, 人纤溶酶原的三环 3, 葡糖脑苷脂酶, TNF 结合蛋白 1, 促卵泡激素, 细胞毒性 T 淋巴细胞相关抗原 4-Ig, 跨膜激活剂和钙调节剂和亲环蛋白配体, 胰高血糖素 样蛋白 1 和 IL-2 受体激动剂。
10: 一种在巴斯德毕赤酵母宿主中产生具有 N- 聚糖的重组糖蛋白的方法, 所述 N- 聚糖 具有半乳糖残基, 所述方法包括 : a) 提供重组宿主细胞, 其已被基因工程化为表达 (i) 糖基化途径, 其使得所述宿主细胞能够产生重组糖蛋白, 所述重组糖蛋白具有包含 半乳糖残基的杂合或复合 N- 聚糖 ; (ii) 半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移 酶活性以及任选地半乳糖通透酶活性 ; 和 (iii) 重组糖蛋白 ; 和 b) 在含有半乳糖的培养基中培养所述宿主细胞以产生具有一个或多个 N- 聚糖的重组 糖蛋白, 所述 N- 聚糖具有半乳糖残基。 2
11: 根据权利要求 10 的方法, 其中所述 UDP- 半乳糖 -4- 差向异构酶活性被提供在融合 蛋白中, 所述融合蛋白包含半乳糖基转移酶的催化结构域和 UDP- 半乳糖 -4- 差向异构酶的 催化结构域。
12: 根据权利要求 10 的方法, 其中所述 N- 聚糖的 G0 ∶ G1/G2 比值小于 2 ∶ 1。
13: 根 据 权 利 要 求 10 的 方 法,其 中 所 述 重 组 糖 蛋 白 主 要 具 有 选 自 GalGlcNAcMan 5 GlcNAc 2 、NANAGalGlcNAcMan 5 GlcNAc 2 、GalGlcNAcMan 3 GlcNAc 2 、 NANAGalGlcNAcMan 3 GlcNAc 2 、GalGlcNAc 2 Man 3 GlcNAc 2 、Gal 2 GlcNAc 2 Man 3 GlcNAc 2 、 NANAGal2GlcNAc2Man3GlcNAc2 和 NANA2Gal2GlcNAc2Man3GlcNAc2 的 N- 聚糖。
14: 根据权利要求 10 的方法, 其中所述 N- 聚糖是具有半乳糖末端的 N- 聚糖, 其选自 GalGlcNAcMan5GlcNAc2、 Gal2GlcNAc2Man3GlcNAc2 和 Gal2GlcNAc2Man3GlcNAc2。
15: 根据权利要求 10 的方法, 其中所述 N- 聚糖是具有半乳糖末端的杂合 N- 聚糖。
16: 根 据 权 利 要 求 10 的 方 法, 其 中 所 述 N- 聚 糖 是 唾 液 酸 化 的 N- 聚 糖, 其选自 NANAGalGlcNAcMan5GlcNAc2、 NANAGal2GlcNAc2Man3GlcNAc2 和 NANA2Gal2GlcNAc2Man3GlcNAc2。
17: 根据权利要求 10 的方法, 其中所述重组糖蛋白选自红细胞生成素 (EPO), 细胞因子 例如干扰素 α、 干扰素 β、 干扰素 γ 和干扰素 ω, 和粒细胞集落刺激因子 (GCSF), GM-CSF, 凝固因子例如因子 VIII、 因子 IX 和人蛋白 C, 抗凝血酶 III, 凝血酶, 可溶性 IgE 受体 α- 链, 免疫球蛋白例如 IgG、 IgG 片段、 IgG 融合体和 IgM, 免疫粘附素和其它 Fc 融合蛋白例如可 溶性 TNF 受体 -Fc 融合蛋白, RAGE-Fc 融合蛋白, 白细胞介素, 尿激酶, 糜蛋白酶和尿胰蛋白 酶抑制剂, IGF- 结合蛋白, 表皮生长因子, 生长激素释放因子, 膜联蛋白 V 融合蛋白, 制管张 素, 血管内皮生长因子 -2, 骨髓样前体抑制因子 -1, 骨保护蛋白, α-1- 抗胰蛋白酶, 甲胎蛋 白, DNA 酶 II, 人纤溶酶原的三环 3, 葡糖脑苷脂酶, TNF 结合蛋白 1, 促卵泡激素, 细胞毒性 T 淋巴细胞相关抗原 4-Ig, 跨膜激活剂和钙调节剂和亲环蛋白配体, 胰高血糖素样蛋白 1 和 IL-2 受体激动剂。
18: 一种产生表达异源蛋白的重组巴斯德毕赤酵母宿主细胞的方法, 其包括 : (a) 提供已被基因工程化为表达一种或两种酶活性的宿主细胞, 所述酶活性选自半乳 糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性和半乳糖 -1- 磷酸尿苷酰转移酶活性 ; (b) 用编码异源蛋白和在步骤 (a) 的宿主细胞中不表达的选自步骤 (a) 的酶或多种酶 的一种或多种核酸分子转化所述宿主细胞 ; 和 (c) 在含有半乳糖作为单一碳能源的培养基中培养所述宿主细胞以提供表达异源蛋白 的重组巴斯德毕赤酵母宿主细胞。
19: 根据权利要求 18 的方法, 其中所述宿主细胞被进一步基因工程化为表达半乳糖通 透酶。
20: 根据权利要求 18 的方法, 其中所述宿主细胞被基因修饰以产生糖蛋白, 所述糖蛋 白具有一个或多个包含半乳糖的 N- 聚糖。
21: 一种产生和选择能够利用半乳糖作为单一碳源的巴斯德毕赤酵母宿主细胞的方 法, 所述方法包括 : a) 提供巴斯德毕赤酵母宿主细胞 ; b) 用编码半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿苷酰 转移酶活性以及任选地半乳糖通透酶的一种或多种核酸分子转化所述宿主细胞 ; 3 c) 在含有半乳糖作为单一碳源的培养基上培养转化的宿主细胞 ; 和 d) 选择可以在含有半乳糖作为单一碳源的培养基上生长的宿主细胞。
22: 一种包含糖蛋白的组合物, 其中在药学上可接受的载体中糖蛋白上的 G0 ∶ G1/G2 糖形比值小于 2 ∶ 1。
23: 根 据 权 利 要 求 22 的 糖 蛋 白 组 合 物, 其 中 所 述 糖 蛋 白 是 选 自 抗 -Her2 抗 体、 抗 -RSV( 呼吸道合胞病毒 ) 抗体、 抗 -TNFα 抗体、 抗 -VEGF 抗体、 抗 -CD3 受体抗体、 抗 -CD41 7E3 抗体、 抗 -CD25 抗体、 抗 -CD52 抗体、 抗 -CD33 抗体、 抗 -IgE 抗体、 抗 -CD11a 抗体、 抗 -EGF 受体抗体和抗 -CD20 抗体及其变体的抗体。
24: 根据权利要求 22 的糖蛋白组合物, 其中所述糖蛋白是 Fc 融合蛋白。
25: 根据权利要求 24 的糖蛋白组合物, 其中所述 Fc 融合蛋白是依那西普。
26: 一种重组巴斯德毕赤酵母宿主细胞, 其具有与重组巴斯德毕赤酵母菌株 YDX477 的 基因型相同的基因型。

说明书


在糖工程化的酵母巴斯德毕赤酵母中对半乳糖同化途径的 代谢工程化

    发明背景
     (1) 发明领域
     本发明涉及低等真核细胞, 例如巴斯德毕赤酵母 (Pichia pastoris), 其通常不能 利用半乳糖作为碳源, 但通过基因工程化细胞为表达包含 Leloir 途径的酶中的几种, 使其 能够利用半乳糖作为单一碳源。具体地, 细胞被基因工程化为表达半乳糖激酶、 UDP- 半乳 糖 -C4- 差向异构酶和半乳糖 -1- 磷酸尿苷酰转移酶, 以及任选地半乳糖通透酶。另外, 本 发明进一步涉及用于改进在已被基因工程化为产生具有 N- 聚糖 ( 其具有半乳糖残基 ) 的 糖蛋白但通常缺乏包含 Leloir 途径的酶的低等真核细胞中具有半乳糖末端的或含有半乳 糖的 N- 聚糖的产量的方法, 包含用编码半乳糖激酶、 UDP- 半乳糖 -C4- 差向异构酶和半乳 糖 -1- 磷酸尿苷酰转移酶的一个或多个核酸分子转化低等真核细胞。
     (2) 相关领域的描述
     基于蛋白的疗法组成了药物发现的最活跃领域之一并被期望是未来十年新的 治疗用化合物的主要来源 (Walsh, Nat.Biotechnol.18(8) : 831-3(2000))。治疗用蛋白 ( 在它们的天然状态未被糖基化 ) 可在缺乏糖基化机制的宿主中表达, 例如埃希氏大肠 杆菌 (Escherichia coli)。但是, 大多数治疗用蛋白是糖蛋白, 其需要在蛋白的特定天 冬酰胺残基翻译后添加聚糖, 以确保正确的折叠和随后在人血清中的稳定性 (Helenius 和 Aebi, Science 291 : 2364-9(2001))。在一些情况中, 治疗用蛋白的效力已通过在另外 的糖基化位点中的工程化而被改进。一个实例是人红细胞生成素, 其添加另外两个糖基 化位点后已表明在体内显示三倍长的半衰期 (Macdougall 等人, J.Am.Soc.Nephrol.10 : 2392-2395(1999))。意在人中用于治疗用途的大多数糖蛋白需要 N- 糖基化, 因此, 哺乳动 物细胞系, 例如中国仓鼠卵巢 (CHO) 细胞, 其具有类似的人糖蛋白加工, 目前最常用于生产 治疗用糖蛋白。但是, 这些细胞系具有明显的缺点, 包括较差的基因溯源性、 较长的发酵时 间、 异源糖基化和正在发生的病毒污染问题 (Birch 和 Racher, Adv. 药物 Deliv.Rev.58 : 671-85(2006) ; Kalyanpur, Mol.Biotechnol.22 : 87-98(2002))。
     许多工业蛋白表达系统基于可在化学上成分确定的培养基中生长至高细胞 密 度 且 通 常 不 受 上 述 限 制 的 酵 母 菌 株 (Cereghino 和 Cregg FEMS Microbiol.Rev.24 : 45-66(2000) ; Hollenberg 和 Gellisen , Curr.Opin.Biotechnol.8 : 554-560(1997) ; Muller, 酵母 14 : 1267-1283(1998)。尽管酵母已被用于生产缺乏糖基化的治疗用蛋白, 例 如胰岛素, 但是其仍未被用于糖蛋白生产, 因为酵母产生具有非人的、 高甘露糖型 N- 聚糖 的糖蛋白 ( 参见图 1), 其产生具有缩短的体内半衰期并在高等哺乳动物中具有免疫原潜能 的糖蛋白 (Tanner 等人, Biochim.Biophys.Acta.906 : 81-99(1987))。
     为解决这些问题, 本发明人和其他研究者已聚焦到各种不同酵母和丝状真菌中糖 基化途径的再工程化, 以从这些蛋白表达宿主中获得人样糖蛋白。例如, Gerngross 等人, 美国公开的申请号 2004/0018590( 所述公开内容在此通过参考并入本文 ) 提供酵母巴斯德 毕赤酵母的细胞, 其已被基因工程化为消除酵母和丝状真菌典型的高甘露糖 - 型 N- 聚糖的
     产生和提供具有糖基化机制的宿主细胞以产生具有杂合或复合 N- 聚糖的糖蛋白, 即哺乳 动物细胞产生的更典型的糖蛋白。
     Gerngross 等 人 如 上 公 开 了 重 组 酵 母 菌 株, 该重组酵母菌株可生产其 上 高 百 分 比 的 N- 聚 糖 含 有 半 乳 糖 残 基 的 重 组 糖 蛋 白 : 即, 产生主要具有寡糖结 构 GalGlcNAc2Man3GlcNAc2(G1) 或 Gal2GlcNAc2Man3GlcNAc2(G2) 和 较 少 量 寡 糖 结 构 GlcNAc2Man3GlcNAc2(G0) 的 N- 聚糖的酵母菌株。已获得 70-85%的 G2 产率。但是, 已发现 在这些细胞中生产的一些糖蛋白例如免疫球蛋白和免疫粘附素, 其中 G0 ∶ G1/G2 的比值降 低至约 2 ∶ 1( 参见例如, Li 等人, Nature Biotechnol.24 : 210-215(2006), 其中通过用半 乳糖和可溶型 β-1, 4- 半乳糖基转移酶体外处理糖蛋白, 这些细胞中半乳糖末端的 N- 聚糖 的产率得到改进 )。相反, 哺乳动物细胞例如 CHO 细胞中生产的免疫球蛋白的 G0 ∶ G1/G2 的比值约 1 ∶ 1。因此, 期望的是提供能够在体内产生 G0 ∶ G1/G2 比值小于 2 ∶ 1 的重组 糖蛋白的重组酵母宿主细胞。
     巴斯德毕赤酵母仅可利用有限数量的碳源以生存。目前, 这些碳源是甘油、 葡萄 糖、 甲醇以及可能是鼠李糖和甘露糖, 但不是半乳糖。 期望的是具有可利用上述所列以外的 碳源的巴斯德毕赤酵母菌株。 发明概述
     本发明解决了上述确定的问题。本发明提供方法和材料用于从缺乏同化半乳糖 作为碳源的能力的宿主细胞产生具有利用半乳糖作为能源的能力的重组宿主细胞。当重 组宿主细胞被进一步基因工程化为生产具有半乳糖末端的或含有半乳糖的 N- 聚糖的糖 蛋白时, 该宿主细胞能够产生重组糖蛋白例如抗体, 其中 G0 ∶ G1/G2 比值小于 2 ∶ 1、 或 G0 ∶ G1/G2 比值为 1 ∶ 1 或更小或 G0 ∶ G1/G2 比值为 1 ∶ 2 或更小。一般而言, 所述包括 将编码 Leloir 途径酶 ( 半乳糖激酶、 UDP- 半乳糖 -C4- 差向异构酶和半乳糖 -1- 磷酸尿苷 酰转移酶以及任选地半乳糖通透酶 ) 引入宿主细胞核酸分子。因此, 本文中的方法和材料 提供选择系统, 其仅通过在含有半乳糖作为碳源的培养基上培养细胞可用于鉴定已被转化 宿主细胞, 以及提供用于生产糖蛋白 ( 具有高水平的末端的或含有半乳糖的 N- 聚糖 ) 例如 免疫球蛋白的方法。
     利用半乳糖作为碳源的能力提供了选择使用的表达系统的灵活性和经济性。例 如, 在设计用于表达具有末端半乳糖或末端唾液酸化的重组糖蛋白的系统中, 可将半乳 糖添加至培养基, 半乳糖被细胞吸收和被细胞利用作为能源并提供半乳糖残基用于参入 N- 聚糖, 其在重组糖蛋白上被合成。本发明的优势是通过使半乳糖存在于培养基或在发酵 过程中添加半乳糖和 / 或诱导重组糖蛋白, 重组蛋白的生产可得到高水平的半乳糖基化的 或唾液酸化的糖蛋白。因此, 如巴斯德毕赤酵母所表明的, 通常缺乏 Leloir 途径的酵母物 种, 以本文公开的方式基因工程化巴斯德毕赤酵母产生可利用半乳糖作为单一碳源的重组 巴斯德毕赤酵母细胞系。另外, 基因工程化巴斯德毕赤酵母细胞系 ( 包括 Leloir 途径酶和 使得细胞能够产生具有半乳糖末端的或含有半乳糖的 N- 聚糖的糖蛋白所需的酶 ) 产生了 这样的重组细胞系, 其中半乳糖末端的或含有半乳糖的 N- 聚糖的产率大于缺乏 Leloir 途 径酶的细胞系。因此, 本发明引起了已被基因工程化为生产半乳糖基化的或唾液酸化的糖 蛋白的巴斯德毕赤酵母细胞系的增加的生产率。
     具体地, 本发明提供了用于在体内生产具有高水平半乳糖或唾液酸的抗体的方法
     和材料。 利用本发明的方法和材料, 将半乳糖添加至细胞生长培养基以完成多个目的, 包括 (a) 能够利用半乳糖作为糖源的宿主细胞的选择 ; (b) 提供用于宿主细胞生长的碳源和 (c) 提供用于参入 N- 聚糖的半乳糖残基来源, 其作为 N- 聚糖中的末端半乳糖残基或提供底物 用于末端唾液酸残基随后添加至 N- 聚糖。因此, 本发明提供方法和材料, 通过该方法和材 料, 可通过体内过程而不是使用更低效和更昂贵的体外反应使半乳糖基化的水平增加, 在 体外反应中, 带电的半乳糖和可溶性半乳糖基转移酶被添加至含有纯化的但部分半乳糖基 化的重组糖蛋白的培养基或溶液中。
     本发明的一个实施方案是发展能够在半乳糖作为单一碳能源存在的培养基上生 存的巴斯德毕赤酵母宿主细胞。利用本发明的方法和材料, 本领域普通技术人员将能够从 本文公开的利用半乳糖作为碳源的转化的宿主细胞生产重组糖蛋白用于选择和维持转化 的宿主细胞。另外, 当宿主细胞已被基因工程化为产生半乳糖基化的或唾液酸化的 N- 聚糖 时, 通过提供具有半乳糖的细胞培养基, 本发明可用于增加从细胞产生的半乳糖基化的或 唾液酸化的糖蛋白的水平。
     因此, 提供巴斯德毕赤酵母宿主细胞, 其已被基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性, 以及任选地半乳糖通 透酶活性, 其中所述宿主细胞能够利用半乳糖作为单一碳能源。 在具体方面, 巴斯德毕赤酵母宿主细胞已被进一步基因工程化为能够产生这样的 重组糖蛋白, 其具有包含半乳糖残基的杂合或复合 N- 聚糖。在具体实施方案中, UDP- 半乳 糖 -4- 差向异构酶活性被提供在融合蛋白中, 所述融合蛋白包含半乳糖基转移酶的催化结 构域和 UDP- 半乳糖 -4- 差向异构酶的催化结构域。
     一般而言, 宿主细胞能够产生具有复合 N- 聚糖的糖蛋白, 其中复合 N- 聚糖的 G0 ∶ G1/G2 比值小于 2 ∶ 1。
     在具体实施方案中, 上述细胞产生的糖蛋白主要具有选自 GalGlcNAcMan5GlcNAc2、 NANAGalGlcNAcMan 5 GlcNAc 2 、GalGlcNAcMan 3 GlcNAc 2 、NANAGalGlcNAcMan 3 GlcNAc 2 、 GalGlcNAc 2 Man 3 GlcNAc 2 、Gal 2 GlcNAc 2 Man 3 GlcNAc 2 、NANAGal 2 GlcNAc 2 Man 3 GlcNAc 2 和 NANA2Gal2GlcNAc2Man3GlcNAc2 的 N- 聚糖。
     在 另 外 的 实 施 方 案 中, N- 聚 糖 是 半 乳 糖 末 端 的 N- 聚 糖,其 选 自 GalGlcNAcMan5GlcNAc2、 Gal2GlcNAc2Man3GlcNAc2 和 Gal2GlcNAc2Man3GlcNAc2。 在 其 他 实 施方案中, N- 聚糖是半乳糖末端的杂合 N- 聚糖 ; 以及在另外的实施方案中, N- 聚糖是 唾液酸化的 N- 聚糖, 其选自 NANAGalGlcNAcMan5GlcNAc2、 NANAGal2GlcNAc2Man3GlcNAc2 和 NANA2Gal2GlcNAc2Man3GlcNAc2。
     另外提供的是在巴斯德毕赤酵母宿主中生产具有 N- 聚糖的重组糖蛋白的方法, 所述 N- 聚糖具有半乳糖残基, 所述方法包括 : a) 提供重组宿主细胞, 其已被基因工程化为 表达 (i) 糖基化途径, 其使得所述宿主细胞能够产生重组糖蛋白, 所述重组糖蛋白具有包 含半乳糖残基的杂合或复合 N- 聚糖 ; (ii) 半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶 活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性 ; 和 (iii) 重组糖蛋 白; 和 b) 在含有半乳糖的培养基中培养所述宿主细胞以产生具有一个或多个 N- 聚糖的重 组糖蛋白, 所述 N- 聚糖具有半乳糖残基。
     在所述方法的进一步的方面, UDP- 半乳糖 -4- 差向异构酶活性被提供在融合蛋白
     中, 所述融合蛋白包含半乳糖基转移酶的催化结构域和 UDP- 半乳糖 -4- 差向异构酶的催化 结构域。
     本发明另外提供选择表达异源蛋白的重组宿主细胞的方法。 用编码异源蛋白和不 存在于重组宿主细胞的 Leloir 途径酶的一个或多个核酸分子转化表达一种或两种但不是 全部的 Leloir 途径酶活性的重组宿主细胞。由于转化的重组宿主细胞含有完整的 Leloir 途径, 从非转化的细胞中选择表达异源蛋白的转化的重组宿主细胞可通过在半乳糖是单一 碳源的培养基中培养转化的重组宿主细胞获得。因此, 另外提供的是产生表达异源蛋白的 重组宿主细胞的方法, 其包括 : (a) 提供已被基因工程化为表达一种或两种酶的宿主细胞, 所述酶选自半乳糖激酶、 UDP- 半乳糖 -4- 差向异构酶和半乳糖 -1- 磷酸尿苷酰转移酶 ; (b) 用编码异源蛋白和在步骤 (a) 的宿主细胞中不表达的选自步骤 (a) 的酶或多种酶的一个或 多个核酸分子转化所述宿主细胞 ; 和 (c) 在含有半乳糖作为单一碳能源的培养基中培养所 述宿主细胞以提供表达异源蛋白的重组巴斯德毕赤酵母宿主细胞。 在所述方法的进一步的 方面, 宿主细胞被基因工程化为表达半乳糖通透酶。 在还进一步的方面, 宿主细胞被基因修 饰以产生糖蛋白, 所述糖蛋白具有一个或多个包含半乳糖的 N- 聚糖。
     另外提供的是产生和选择能够利用半乳糖作为单一碳源的巴斯德毕赤酵母宿主 细胞的方法, 所述方法包括 : a) 提供巴斯德毕赤酵母宿主细胞 ; b) 用编码半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通 透酶的一个或多个核酸分子转化所述宿主细胞 ; c) 在含有半乳糖作为单一碳源的培养基 上培养转化的宿主细胞 ; 和 d) 选择可以在含有半乳糖作为单一碳源的培养基上生长的宿 主细胞。 本文中的宿主细胞和方法能够生产包含重组糖蛋白的组合物, 其中在药学上可接 受的载体中重组糖蛋白上的 G0 ∶ G1/G2 糖形的比值小于 2 ∶ 1。在具体实施方案中, 重组 糖蛋白选自红细胞生成素 (EPO), 细胞因子例如干扰素 α、 干扰素 β、 干扰素 γ 和干扰素 ω, 和粒细胞集落刺激因子 (GCSF), GM-CSF, 凝固因子例如因子 VIII、 因子 IX 和人蛋白 C, 抗凝血酶 III, 凝血酶, 可溶性 IgE 受体 α- 链, 免疫球蛋白例如 IgG、 IgG 片段、 IgG 融合体 和 IgM, 免疫粘附素和其它 Fc 融合蛋白例如可溶性 TNF 受体 -Fc 融合蛋白, RAGE-Fc 融合蛋 白, 白细胞介素, 尿激酶, 糜蛋白酶和尿胰蛋白酶抑制剂, IGF- 结合蛋白, 表皮生长因子, 生 长激素释放因子, 膜联蛋白 V 融合蛋白, 制管张素, 血管内皮生长因子 -2, 骨髓样前体抑制 因子 -1, 骨保护蛋白, α-1- 抗胰蛋白酶, 甲胎蛋白, DNA 酶 II, 人纤溶酶原的三环 3, 葡糖脑 苷脂酶, TNF 结合蛋白 1, 促卵泡激素, 细胞毒性 T 淋巴细胞相关抗原 4-Ig, 跨膜激活剂和钙 调节剂和亲环蛋白配体, 胰高血糖素样蛋白 1 和 IL-2 受体激动剂。
     在另外的实施方案中, 糖蛋白是抗体, 具体是人源化的、 嵌合或人抗体。在具体 实施方案中, 抗体选自抗 -Her2 抗体、 抗 -RSV( 呼吸道合胞病毒 ) 抗体、 抗 -TNFα 抗体、 抗 -VEGF 抗体、 抗 -CD3 受体抗体、 抗 -CD41 7E3 抗体、 抗 -CD25 抗体、 抗 -CD52 抗体、 抗 -CD33 抗体、 抗 -IgE 抗体、 抗 -CD11a 抗体、 抗 -EGF 受体抗体和抗 -CD20 抗体及其变体。抗体的实 例包括莫罗单抗 -CD3、 阿昔单抗、 利妥昔单抗、 达珠单抗、 巴利昔单抗、 帕利珠单抗、 英利昔 单抗、 曲妥珠单抗、 吉姆单抗奥佐米星、 阿仑单抗、 替伊莫单抗、 阿达木单抗、 奥马珠单抗、 托 西莫单抗 -131I、 依法利珠单抗、 西妥昔单抗、 戈利木单抗和贝伐单抗。
     在还进一步的实施方案中, 糖蛋白是 Fc 融合蛋白, 例如依那西普。
     尽管巴斯德毕赤酵母证实作为如本文所公开的可被修饰的宿主细胞的实例, 但是 方法和宿主细胞不限于巴斯德毕赤酵母。 本文的方法可用于产生来自其他低等真核细胞物 种的重组宿主细胞, 所述物种通常不表达 Leloir 途径酶并如此不能利用半乳糖作为碳源。 因此, 在另外的实施方案中, 宿主细胞是通常不表达 Leloir 途径酶的任何低等真核细胞物 种。
     定义
     除非另有定义, 本文所用的所有技术和科学具有与本发明所属领域的普通技术人 员通常理解的相同含义。另外, 除非上下文另有要求, 单数术语应包括复数和复数术语应 包括单数。通常地, 所用的相关命名和本文所述的生化、 酶学、 分子和细胞生物学、 微生物 学、 遗传学以及蛋白和核酸化学以及杂交技术是本领域熟知并通常使用的。本发明的方法 和技术通常根据本领域熟知的常规方法并如贯穿本说明书引用和讨论的各种一般和更具 体的参考中所述的进行, 除非另有说明。参见, 例如, Sambrook 等人 Molecular Cloning : A Laboratory Manual, 2d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(1989) ; Ausubel 等人, Current Protocols in Molecular Biology, Greene Publishing Associates(1992, 和 Supplements to 2002) ; Harlow 和 Lane, Antibodies : A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(1990) ; Taylor 和 Drickamer, Inrroduction to Glycobiology, Oxford Univ. Press(2003) ; Worthington Enzyme Manual, Worthington Biochemical Corp., Freehold, NJ ; Handbook of Biochemistry : Section A Proteins, Vol I, CRC Press(1976) ; Handbook of Biochemistry : Section A Proteins, Vol II, CRC Press(1976) ; Essentials of Glycobiology, Cold Spring Harbor Laboratory Press(1999)。示例性方法和材料如下 述, 虽然与本文所述类似或等同的方法和材料也可用于本发明的实践并应对本领域普通技 术人员是显而易见的。 本文提及的所有公开和其他参考通过参考对于它们引用的公开内容 而被整体引入。在矛盾的情况下, 以本说明书 ( 包括定义 ) 为准。材料、 方法和实施例仅是 说明性的, 且意图不是以任何方式限制。
     以下术语, 除非另有说明, 应理解具有以下含有 :
     如本文所用, 术语 “人源化的” 、 “人源化” 和 “人样” 可互换地使用, 是指以一种方 式工程化非人细胞例如低等真核宿主细胞的方法, 其中该方式引起工程化的细胞具有产生 蛋白特别是糖蛋白的能力, 所述糖蛋白具有糖基化, 比相同物种的非工程化的、 野生型非人 细胞产生的糖蛋白具有更类似哺乳动物糖基化的模式。人源化可对于 N- 糖基化、 O- 糖基 化或二者进行。例如, 野生型巴斯德毕赤酵母和其它低等真核细胞通常在 N- 糖基化位点产 生高甘露糖基化的蛋白。在本发明优选的实施方案中, 本发明的 “人源化的” 宿主细胞能够 产生具有杂合和 / 或复合 N- 聚糖的糖蛋白 ; 即 “人样 N- 糖基化” 。人源化的宿主细胞产生 的糖蛋白上主要存在的特定 “人样” 聚糖将取决于进行的特定人源化步骤。
     如本文所用, 术语 “N- 聚糖” 和 “糖形” 可互换地使用和是指 N- 连接的寡糖, 例如, 通过天冬酰胺 -N- 乙酰基葡糖胺连接而连接到多肽的天冬酰胺残基的寡糖。N- 连接的糖 蛋白含有连接到蛋白中天冬酰胺残基的酰胺氮上的 N- 乙酰基葡糖胺残基。糖蛋白上发现 的主要糖是葡萄糖、 半乳糖、 甘露糖、 果糖、 N- 乙酰基半乳糖胺 (GalNAc)、 N- 乙酰基葡糖胺 (GlcNAc) 和唾液酸 ( 例如 N- 乙酰基 - 神经氨酸 (NANA))。对于 N- 连接的糖蛋白, 糖基团的加工在 ER 的腔中与翻译同时发生并在高尔基体中继续。
     N- 聚糖具有共同的五糖核心 Man3GlcNAc2(“Man” 是指甘露糖 ; “Glc” 是指葡萄糖 和 “NAc” 是指 N- 乙酰基、 GlcNAc 是指 N- 乙酰基葡糖胺 )。根据分支 ( 触角 ) 的数量, N- 聚 糖不同, 所述分支 ( 触角 ) 包含被添加至 Man3GlcNAc2(“Man3” ) 核心结构 ( 还称为 “三甘 露糖核心” 、 “五糖核心” 或 “少甘露糖核心” ) 的外周糖 ( 例如 GlcNAc、 半乳糖、 果糖和唾液 酸 )。N- 聚糖根据它们分支的成分 ( 例如高甘露糖、 复合或杂合 ) 而分类。 “高甘露糖” 型 N- 聚糖具有 5 个或更多个甘露糖残基。 “复合” 型 N- 聚糖通常具有至少一个连接至 1, 3甘 露糖臂的 GlcNAc 和至少一个连接至 “三甘露糖” 核心的 1, 6 甘露糖臂的 GlcNAc。复合 N- 聚 糖也可具有半乳糖 (“Gal” ) 或 N- 乙酰基半乳糖胺 (“GalNAc” ) 残基, 其任选地用唾液 酸或衍生物 ( 例如, “NANA” 或 “NeuAc” , 其中 “Neu” 是指神经氨酸和 “Ac” 是指乙酰基 ) 修 饰。复合 N- 聚糖也可具有链内置换, 其包含 “等分的” GlcNAc 和核心果糖 (“Fuc” )。复合 N- 聚糖也可在 “三甘露糖核心” 上具有多个触角, 通常称为 “多触角聚糖” 。 “杂合” N- 聚糖 在三甘露糖核心的 1, 3 甘露糖臂末端具有至少一个 GlcNAc 并在三甘露糖核心的 1, 6 甘露 糖臂上具有 0 或多个甘露糖。多种 N- 聚糖也称为 “糖形” 。图 2 显示多种高甘露糖、 杂合和 复合 N- 聚糖, 其已在基因工程化为产生哺乳动物样 N- 聚糖的巴斯德毕赤酵母中产生。 如本文所用, 术语 “O- 聚糖” 和 “糖形” 可互换地使用和是指 O- 连接的寡糖, 例如, 经由丝氨酸或苏氨酸残基的羟基连接至肽链的聚糖 . 在真菌细胞中, 天然 O- 糖基化通过将 在内质网中从多萜醇单磷酸甘露糖 (Dol-P-Man) 转移的第一个甘露糖基残基连接到蛋白 而发生, 和另外的甘露糖基残基可在高尔基体中经由从 GPD-Man 转移而被连接。高等真核 细胞, 例如人或哺乳动物细胞, 通过将 N- 乙酰基 - 半乳糖胺 (GlcNac) 共价连接到丝氨酸或 苏氨酸残基经历 O- 糖基化。
     如本文所用, 术语 “人样 O- 糖基化” 应理解为含义是真菌 - 特定的磷酸化甘露糖结 构被降低或消除, 引起电荷和 β- 甘露糖结构的降低或消除, 或糖蛋白上存在的和糖蛋白 组合物中的主要 O- 聚糖种类包括具有选自 GlcNac、 Gal 或 NANA( 或 Sia) 的末端残基加帽 的聚糖。以这种方式, 具有主要人样 O- 糖基化的重组糖蛋白可被人或哺乳动物细胞识别, 如同它是天然产生的糖蛋白, 其产生重组糖蛋白的改进的治疗用性质。
     本文所用的缩写是本领域常见使用的, 参见, 例如, 上述糖的缩写。其他常见缩写 包括 “PNGase” 或 “聚糖酶” 或 “葡糖苷酶” 均是指肽 N- 糖苷酶 F(EC 3.2.2.18)。
     如本文所用, 术语 “抗体” 、 “免疫球蛋白” 和 “免疫球蛋白分子” 可互换地使用。每 个免疫球蛋白分子具有独特结构, 使得其结合它的特异性抗原, 但所有免疫球蛋白具有本 文所述的相同整体结构。基础的免疫球蛋白结构单元已知包括亚基的四聚体。每个四聚 体具有两对相同的多肽链, 每对具有一个 “轻” 链 (LC)( 约 25kDa) 和一个 “重” 链 (HC)( 约 50-70kDa)。每个链的氨基 - 末端部分包括约 100-110 或更多个氨基酸的可变区, 主要负责 抗原识别。每个链的羧基 - 末端部分确定恒定区, 主要负责效应物功能。轻链 (LCs) 被分 类为 κ 或 λ。重链 (HCs) 分类为 γ、 μ、 α、 δ 或 ε 和确定抗体同种型分别为 IgG、 IgM、 IgA、 IgD 和 IgE。
     轻 和 重 链 被 亚 分 类 为 可 变 区 和 恒 定 区 ( 通 常 参 见 Fundamental Immunology(Paul, W., ed., 2nd ed.Raven Press, N.Y., 1989), Ch.7。每个轻 / 重链对的可 变区形成抗体结合位点。因此, 天然抗体具有两个结合位点。除了双功能或双特异抗体, 两
     个结合位点是相同。链都显示相同的通常结构, 被三个高度可变区连接的相对保守构架区 (FR), 还称为互补决定区或 CDR。来自每对的两个链的 CDR 通过构架区连接, 使得结合特异 性表位。术语包括天然形成形式、 以及片段和衍生物。包括在术语范围内的是免疫球蛋白 (Igs) 的种类, 称为 IgG、 IgA、 IgE、 IgM 和 IgD。还包括在术语范围内的是 IgG 的亚型, 称为 IgG1、 IgG2、 gG3 和 IgG4。术语用于最广泛的含义并包括单个单克隆抗体 ( 包括激动剂和 拮抗剂抗体 ) 以及结合多个表位或抗原的抗体组合物。术语特定地覆盖单克隆抗体 ( 包括 全长单克隆抗体 )、 多克隆抗体、 多特异抗体 ( 例如双特异抗体 ) 和抗体片段, 只要它们含 有或被修饰为含有重链免疫球蛋白恒定区的 CH2 结构域的至少一部分, 其包括 CH2 结构域的 N- 连接的糖基化位点或其变体。包括在术语内的是仅包含 Fc 区的分子, 例如免疫黏附素 ( 美国公开的专利申请号 20040136986)、 Fc 融合和抗体样分子。可选地, 这些术语可以是 指至少 Fab 区的抗体片段, 其至少含有 N- 连接的糖基化位点。
     术语 “Fc” 片段是指抗体的 “片段结晶的” C- 末端区, 其含有 CH2 和 CH3 结构域。术 语 “Fab” 片段是指抗体的 “片段抗原结合” 区, 其含有 VH、 CH1、 VL 和 CL 结构域。
     如本文所用术语 “单克隆抗体” (mAb) 是指获自基本上均一的抗体群体的抗体, 即 包含群体是相同的单独的抗体, 除了可以小量存在的可能天然存在的突变。单克隆抗体是 高度特异性的, 是针对单个抗原性位点。另外, 与通常包括针对不同决定簇 ( 表位 ) 的不 同抗体的常规 ( 多克隆 ) 抗体制备物相反, 每个 mAb 针对抗原上的单个决定簇。除了它们 特异性, 单克隆抗体是有利的, 原因在于它们可以是通过杂交瘤培养合成的, 不被其他免疫 球蛋白污染。术语 “单克隆” 指示抗体的特征为获自基本上均一的抗体群体, 并且不解释为 要求通过任何具体方法产生抗体。例如, 根据本发明使用的单克隆抗体可由 Kohler 等人, (1975)Nature, 256 : 495 首次描述的杂交瘤方法制备或可通过重组 DNA 方法制备 ( 参见, 例 如, Cabilly 等人的美国专利号 4,816,567)。
     在术语 “抗体” 或 “免疫球蛋白” 范围内的术语 “片段” 包括 those 通过用多种蛋白 酶消化产生的、 通过化学切割和 / 或化学解离产生的和重组地产生的片段, 只要片段保持 能够特异性结合靶分子。在这类片段中的是 Fc、 Fab、 Fab’ 、 Fv、 F(ab’ )2 和单链 Fv(scFv) 片段。下文中, 术语 “免疫球蛋白” 也包括术语 “片段” 。
     免疫球蛋白另外包括免疫球蛋白或片段, 其在序列上已被修饰但保持能够特异 性结合靶分子, 包括 : 物种间嵌合和人源化的抗体 ; 抗体融合 ; 异聚体抗体复合物和抗体 融合, 例如双抗体 ( 双特异抗体 ), 单链双抗体和胞内抗体 ( 参见, 例如, Intracellular Antibodies : Research and Disease Applications, (Marasco, ed., Springer-Verlag New York, Inc., 1998)。
     术语 “催化抗体” 是指能够催化生化反应的免疫球蛋白分子。 催化抗体是本领域熟 知的并已被描述在 Schochetman 等人的美国专利号 7,205,136 ; 4,888,281 和 5,037,750, 以及 Barbas, III 等人的美国专利号 5,733,757 ; 5,985,626 和 6,368,839 中。
     如本文所用术语 “载体” 意图是指能够转运已被连接的另一个核酸的核酸分子。 一 种类型的载体是 “质粒” , 其是指环状双链 DNA 环, 在其中另外的 DNA 片段可被连接。其他载 体包括黏粒、 细菌人工染色体 (BAC) 和酵母人工染色体 (YAC)。 另一种类型的载体是病毒载 体, 其中另外的 DNA 片段可连接至病毒基因组 ( 如下更详细讨论 )。某些载体能够在它们 被引入的宿主细胞中自我复制 ( 例如, 载体具有在宿主细胞中发挥作用的复制起点 )。其他载体在引入宿主细胞后可以被整合到宿主细胞的基因组, 以及从而随宿主基因组一起复 制。另外, 某些优选的载体能够引导被可操作地连接的基因的表达。这类载体在本文称为 “重组表达载体” ( 或简称 “表达载体” )。
     如本文所用, 术语 “目的序列” 或 “目的基因” 是指核酸序列, 通常编码蛋白, 其通常 不能在宿主细胞中产生。 本文公开的方法使得稳定整合到宿主细胞基因组中的一个或多个 目的序列或目的基因的有效表达。 目的序列的非限制实例包括编码一个或多个具有酶促活 性的多肽的序列, 例如, 所述酶为在宿主中影响 N- 聚糖合成酶, 例如甘露糖基转移酶、 N- 乙 酰基葡糖胺转移酶、 UDP-N- 乙酰基葡糖胺转运蛋白、 半乳糖基转移酶、 UDP-N- 乙酰基半乳 糖基转移酶、 唾液酸转移酶和岩藻糖基转移酶。
     术语 “标记序列” 或 “标记基因” 是指这样的核酸序列, 其能够表达使得对于在宿主 细胞存在或缺乏序列进行阳性或阴性选择的活性。例如, 巴斯德毕赤酵母 URA5 基因是标记 基因, 因为它的存在可以是通过含有基因的细胞在尿嘧啶缺乏下生长的能力而被选择。它 的存在还可通过含有基因的细胞不能在 5-FOA 存在下生长而被选择。标记序列或基因不必 需地显示阳性和阴性可选择性。 来自巴斯德毕赤酵母的标记序列或基因的非限制实例包括 ADE1、 ARG4、 HIS4 和 URA3。对于抗生素抗性标记基因, 通常利用卡那霉素、 新霉素、 遗传霉素 ( 或 G418)、 巴龙霉素和潮霉素抗性基因以允许在这些抗生素存在下生长。 术语 “可操作地连接” 表达控制序列是指这样的连接, 其中表达控制序列与目的基 因是连续的以控制目的基因以及表达控制序列, 其以反式或以一定距离发挥作用以控制目 的基因。
     术语 “表达控制序列” 或 “调节序列” 可互换地使用和如本文所用是指多核苷酸序 列, 其对影响被可操作地连接的编码序列的表达是必需的。 表达控制序列是控制转录、 转录 后事件和核酸序列翻译的序列。 表达控制序列包括适当的转录起始、 终止、 启动子和增强子 序列 ; 有效 RNA 加工信号例如剪切和多聚腺苷酸信号 ; 稳定细胞质 mRNA 的序列 ; 增强翻译 效率的序列 ( 例如, 核糖体结合位点 ) ; 增强蛋白稳定性的序列和当期望时, 增强蛋白分泌 的序列。 这类控制序列的性质根据宿主生物而不同 ; 在原核生物中, 这类控制序列通常包括 启动子、 核糖体结合位点和转录终止序列。术语 “控制序列” 意图最小程度地包括其存在对 表达是必要的所有成分, 还可包括其存在是有利的另外的成分, 例如, 引导序列和融合配偶 体序列。
     如本文所用, 术语 “重组宿主细胞” (“表达宿主细胞” , “表达宿主系统” , “表达系 统” 或简称″宿主细胞″ ) 意图是指重组载体已被引入其中的细胞。应理解的是这类术语 意图不仅是指具体对象细胞, 而且是指这类细胞的后代。 因为某些修饰可在后代中发生, 原 因在于突变或环境影响, 这类后代实际上可以与母本细胞不相同, 但仍包括在本文所用的 术语 “宿主细胞” 范围内。重组宿主细胞可以是分离的细胞或在培养物中生长的细胞系或 可以是存在于活体组织或生物中的细胞。
     术语 “真核” 是指有核细胞或生物并包括昆虫细胞、 植物细胞、 哺乳动物细胞、 动物 细胞和低等真核细胞 .
     术语 “低等真核细胞” 包括酵母、 真菌、 领鞭毛虫、 微孢子虫、 alveolates( 例如腰 鞭毛虫 )、 原生藻 ( 例如褐色藻类、 原生动物 )、 红藻 ( 例如红藻 (red algae))、 植物 ( 例如 绿藻、 植物细胞、 苔藓 ) 和其它原生生物。 酵母和丝状真菌包括但不限于 : 巴斯德毕赤酵母、
     芬兰毕赤酵母 (Pichia finlandica)、 喜海藻糖毕赤酵母 (Pichia trehalophila)、 Pichia koclamae、 膜醭毕赤酵母 (Pichia membranaefaciens)、 微小毕赤酵母 (Pichia minuta) (Ogataea minuta、 Pichia lindneri)、 Pichia opuntiae、 Pichia thermotolerans、 柳毕 赤酵母 (Pichia salictaria)、 Pichia guercuum、 皮杰普毕赤酵母 (Pichia pijperi)、 树 干毕赤酵母 (Pichia stiptis)、 甲醇毕赤酵母 (Pichia methanolica)、 毕赤酵母属的种 (Pichia sp.)、 酿酒酵母 (Saccharomyces cerevisiae)、 酵母菌属的种 (Saccharomyces sp.)、 多形汉逊酵母 (Hansenula polymorpha)、 克鲁维酵母属的种 (Kluyveromyces sp.)、 乳酸克鲁维酵母 (Kluyveromyces lactis)、 白色念珠菌 (Candida albicans)、 构巢曲霉 (Aspergillus nidulans)、 黑曲霉 (Aspergillus niger)、 米曲霉 (Aspergillus oryzae)、 里氏木霉 (Trichoderma reesei)、 Chrysosporium lucknowense、 镰孢菌属的种 (Fusarium sp.)、 禾谷镰孢菌 (Fusarium gramineum)、 Fusarium venenatum、 Physcomitrella patens 和粗糙脉胞菌 (Neurospora crassa)。
     本文所用术语 “肽” 指短的多肽, 例如通常少于约 50 个氨基酸长度且更通常少于 约 30 个氨基酸长度的多肽。如本文所用的术语包括类似物和模拟结构并因此模拟生物学 功能的模拟物。
     术语 “多肽” 包括天然形成的和非天然形成的蛋白及其片段、 突变体、 衍生物和类 似物。多肽可单体的或多聚体的。另外, 多肽可包括多个不同结构域, 其中各个具有一种或 多种独特的活性。
     术语 “分离的蛋白” 或 “分离的多肽” 是这样的蛋白或多肽, 由于其衍生的起源或 来源 (1 不与在其天然状态中伴随它的天然结合的成分结合, (2) 在自然界中未发现以纯化 物存在, 其中可以就其它细胞成份而论判断纯化物 ( 例如, 不含来自同一物种的其它蛋白 质 ), (3) 由来自不同物种的细胞表达, 或 (4) 在自然界中不存在 ( 例如, 它是在自然界中发 现的多肽的片段或它包括在自然界中没有发现的氨基酸类似物或衍生物或不是标准肽键 的连接 ) 的蛋白质或多肽。因此, 化学合成的多肽或在与多肽所来源的细胞体系不同的细 胞体系中合成的多肽将从其天然结合的成分中 “分离” 。 也可以使用本领域熟知的蛋白纯化 技术, 通过分离, 使多肽或蛋白质基本上不含或纯化天然结合的成分。 如这样所定义的, “分 离的” 不必要求这样描述的蛋白质、 多肽、 肽或寡肽已经从其自然环境中物理地移出。
     本文所用术语 “多肽片段” 是指具有缺失, 例如, 与全长多肽比较的氨基端和 / 或 羧基端缺失的多肽。 在优选的实施方案中, 多肽片段是连续序列, 其中片段的氨基酸序列与 在天然存在的序列中的相应位置同一。片段的长度典型地为至少 5、 6、 7、 8、 9 或 10 个氨基 酸, 优选至少 12、 14、 16 或 18 个氨基酸, 更优选至少 20 个氨基酸, 更优选至少 25、 30、 35、 40 或 45 个氨基酸, 甚至更优选至少 50 或 60 个氨基酸, 和甚至更优选至少 70 个氨基酸。
     修饰的衍生物” 指在一级结构序列中基本上同源的, 但包括, 例如, 在体内的或在 体外的化学修饰和生物化学修饰的、 或掺入在天然多肽中没有发现的氨基酸的多肽或其片 段。这样的修饰包括, 例如, 乙酰化、 羧化、 磷酰化、 糖基化、 泛素化、 标记例如用放射性核 素、 和各种酶的修饰, 如将容易被本领域的技术人员所了解的。标记多肽的多种方法和用 32 35 于此目的的多种取代物或标记物为本领域所熟知, 并包括放射性同位素例如 125I、 P、 S、 3 和 H, 结合至标记的抗配体 ( 例如, 抗体 ) 的配体, 荧光团, 化学发光剂, 酶, 和可以用作标 记的配体的特异性结合配对成员的抗配体。标记物的选择依赖于所需要的灵敏度、 与引物结合的容易程度、 稳定性要求、 和可利用的仪器。用于标记多肽的方法为本领域所熟知。 见, 例如, Ausubel 等, Current Protocols in Molecular Biology, Greene Publishing Associates(1992, 和 2002 的增刊 )( 通过引用并入本文中 )。
     术语 “嵌合基因” 或 “嵌合核苷酸序列” 是指核苷酸序列, 其包含偶联到异源核苷 酸序列的核苷酸序列或片段。嵌合序列用于融合蛋白的表达。嵌合基因或嵌合核苷酸序列 也可包括一个或多个片段或结构域, 其对于意图的宿主细胞是异源的, 并且可具有产生异 源重组蛋白的优势性质。通常, 嵌合核苷酸序列包括来自基因的至少 30 个连续核苷酸, 更 优选至少 60 或 90 或更多个核苷酸。嵌合核苷酸序列在本发明中具有特别用途, 所述嵌合 核苷酸序列具有至少一个对于意图的宿主细胞是异源的但与意图的重组蛋白同源的片段 或结构域。例如, 意图用于在利用巴斯德毕赤酵母宿主细胞以表达重组人糖蛋白的表达系 统中的嵌合基因应优选具有至少一个片段或结构域, 其是人来源的, 例如编码具有潜在治 疗用价值的人蛋白的序列, 而嵌合基因的其余部分, 例如应使得宿主细胞处理并表达嵌合 基因的调节序列, 应优选是巴斯德毕赤酵母来源的。 如果期望的, 人来源的片段也可以是对 于在宿主细胞中表达是密码子最优化的。( 参见, 例如, 美国专利 6,884,602, 在此通过引用 并入 )。
     术语 “融合蛋白” 或 “嵌合蛋白” 是指包含与异源氨基酸序列偶联的多肽或片段的 多肽。融合蛋白是有用的, 因为它们可以被构建以包含来自两种或更多种不同蛋白的两个 或多个所需功能元件。融合蛋白包含来自目的多肽的至少 10 个连续氨基酸, 优选至少 20 或 30 个氨基酸, 甚至更优选至少 40、 50 或 60 个氨基酸, 还更优选至少 75、 100 或 125 个氨 基酸。包括整个本发明蛋白的融合具有特殊的效用。包含于本发明融合蛋白内的异源多肽 的长度为至少 6 个氨基酸, 通常至少 8 个氨基酸, 和有用地为至少 15、 20、 和 25 个氨基酸。 融合体还包括较大的多肽、 或甚至整个蛋白质, 例如绿色荧光蛋白 (“GFP” ), 具有特殊效用 的含发色团的蛋白质。 可以通过将编码多肽或其片段的核酸序列在框内与编码不同蛋白质 或多肽的核酸序列一起构建, 然后表达融合蛋白, 来重组产生融合蛋白。或者, 可以通过交 联多肽或其片段至另一蛋白质, 来以化学方法产生融合蛋白。
     术语 “非肽类似物” 是指具有与那些参考多肽类似的性质的化合物。 非肽化合物也 可以称为 “肽模拟物” 或 “拟肽” . 参见, 例如, Jones, Amino Acid and Peptide Synthesis, Oxford University Press(1992) ; Jung, Combinatorial Peptide and Nonpeptide 文 库: A Handbook, John Wiley(1997) ; Bodanszky 等, Peptide Chemistry-A Practical Textbook, Springer Verlag(1993) ; Synthetic Peptides : A Users Guide, (Grant, 编辑, W.H.Freeman and Co., 1992) ; Evans 等, J.Med.Chem.30 : 1229(1987) ; Fauchere, J.Adv. Drug Res.15 : 29(1986) ; Veber 和 Freidinger, Trends Neurosci., 8: 392-396(1985) ; 和在 以上各出版物中所引用的参考文献, 其通过参考并入本文。这样的化合物经常在计算机分 子模拟的帮助下开发。 在结构上与本发明的有用肽相似的肽模拟物可用于产生同等作用并 因此被考虑为本发明的一部分。
     术语 “区域” 如本文所用是指生物分子的一级结构的在物理上的邻接部分。对于 蛋白质而言, 区域被定义为该蛋白质的氨基酸序列连续部分。
     术语 “结构域” 如本文所用是指作用于生物分子已知或未知功能的生物分子结构。 结构域可与区域或其部分共延伸 ; 结构域也可以包括生物分子的不同的、 非连续的区域。如本文所用, 术语 “分子” 意思是任意化合物, 包括但不是限于小分子、 肽、 蛋白质、 糖、 核苷酸、 核酸、 脂类等, 并且这样的化合物可以是天然的或合成的。
     如本文所用, 术语 “包括” (“comprise” ) 或变化例如 “包括” (“comprises” )或 “包括” (“comprising” ), 应理解为意指包含规定的整体或成组的整体但不排除任何其它 的整体或成组的整体。
     如本文所用, 术语 “主要地” 或变化例如 “主要的” 或 “其是主要的” 应理解为意指 在已经用 PNG 酶处理糖蛋白并由质谱例如 MALDI-TOF MS 分析释放的聚糖之后具有最高摩 尔百分比 (% ) 的总 O- 聚糖或 N- 聚糖的聚糖种类。换言之, 短语 “主要地” 被定义为为个 体实体, 以使特定 “主要” 糖形以比任何其它个体实体更大的摩尔百分比存在。例如, 如果 组合物由 40 摩尔百分比的种类 A、 35 摩尔百分比的种类 B 和 25 摩尔百分比的种类 C 组成, 则组合物主要包含种类 A。 附图说明
     图 1 图解了人和巴斯德毕赤酵母中 N- 糖基化途径。ER 中的早期事件是高度保守 的, 包括由葡糖苷酶 I 和 II 去除三个葡萄糖残基和由 ER 甘露糖苷酶处理单个特定 α-1, 2- 连接的甘露糖残基, 引起相同核心结构 Man8GlcNAc2(Man8B)。 但是, 加工事件在高尔基体 中不同。Mns, α-1, 2- 甘露糖苷酶 ; MnsII, 甘露糖苷酶 II ; GnT I, α-1, 2-N- 乙酰基葡糖 胺转移酶 I ; GnT II, α-1, 2-N- 乙酰基葡糖胺转移酶 II ; MnT, 甘露糖基转移酶。两个核心 GlcNAc 残基虽然在所有情况中存在, 但在命名中忽略。
     图 2 图解了 N- 糖基化中的关键中间步骤以及缩写命名, 其指产生各自聚糖结构 (GS) 的基因工程化巴斯德毕赤酵母菌株。
     图 3 图解了 N- 糖苷酶 F 释放的 N- 聚糖的 MALDI-TOF 质谱 (MS) 分析。K3( 人纤 溶酶原的三环 3 结构域 ) 在巴斯德毕赤酵母菌株 GS115 来源的野生型对照 (Invitrogen, Carlsbad, CA)、 YSH44、 YSH71、 RDP52 和 RDP80 中产生并通过 Ni- 亲和层析从培养物上清液 中纯化。通过 N- 糖苷酶 F 处理释放 N- 聚糖并进行 MALDI-TOF MS 分析 ( 阳性模式, 除了图 3G 是阴性模式 ), 其表现为钠或钾络合物。两个核心 GlcNAc 残基虽然存在, 但在命名中忽 略。GN, GlcNAc ; M, 甘露糖。
     图 3A : GS115 来源的野生型对照菌株中产生的 N- 聚糖 ;
     图 3B : 菌株 YSH44 中 K3 上产生的 N- 聚糖 ;
     图 3C : 菌株 YSH71(YSH44 表达 hGalTI) 中 K3 上产生的 N- 聚糖,
     图 (3D) 菌株 RDP52(YSH44 表达 hGalTI 和 SpGALE) 中 K3 上产生的 N- 聚糖,
     图 (3E) 菌株 RDP80(YSH44 表达 hGalTI、 SpGALE 和 DmUGT) 中 K3 上产生的 N- 聚 糖;
     图 (3F) 在 α- 半乳糖苷酶体外处理后来自 RDP80 的聚糖 ; 和
     图 (3G) 在用 α-2, 6-(N)- 唾液酸转移酶处理后在阴性模式中来自 RDP80 的聚糖。
     图 4 图解了 Leloir 半乳糖利用途径。经由半乳糖通透酶引入细胞外半乳糖。通 过酶半乳糖激酶, 半乳糖 -1- 磷酸尿苷酰转移酶和 UDP- 半乳糖 C4- 差向异构酶的作用半乳 糖被转化成葡萄糖 -6- 磷酸。来自酿酒酵母的蛋白名称在括号中。
     图 5 显 示 巴 斯 德 毕 赤 酵 母 糖 工 程 化 的 菌 株 YGLY578-1 的 构 建。 编 码 高 尔基 体 糖 基 转 移 酶 的 巴 斯 德 毕 赤 酵 母 基 因 OCH1, MNN4, PNO1, MNN4L1 和 BMT2 被 敲 除 然 后 敲 入 12 个 异 源 基 因, 包 括 分 泌 的 hK3 的 表 达 盒。YGLY578-1 能 够 生 产 糖 蛋 白 具 有 Gal2GlcNAc2Man3GlcNAc2N- 聚糖。CS, 反选择。
     图 6 显示质粒 pRCD977b 的示意图。该质粒是 arg1::HIS1 敲除质粒, 其整合进并 删除巴斯德毕赤酵母 ARG1 基因而利用 PpHIS1 基因作为选择标记并含有分别在 PpOCH1、 PpGAPDH、 PpPMA1 和 PpTEF 启动子的控制下编码全长黑腹果蝇高尔基体 UDP- 半乳糖转运蛋 白 (DmUGT)、 全长酿酒酵母半乳糖激酶 (ScGAL1)、 全长酿酒酵母半乳糖 -1- 磷酸尿苷酰转移 酶 (ScGAL7) 和酿酒酵母半乳糖通透酶 (ScGAL2) 的表达盒。TT 是指转录终止序列。
     图 7 显示表达酿酒酵母 GAL1、 GAL2 和 GAL7 基因的糖工程化的巴斯德毕赤酵母菌 株可在半乳糖 ( 作为单一碳源 ) 上生长而母本菌株不能。 糖工程化的菌株 YGLY578-1( 表达 ScGAL10 和 hGalTIβ) 用质粒 pRCD977b 转化, 所述质粒含有编码 ScGAL1、 ScGAL7 和 ScGAL2 的表达盒。菌株在成分确定的培养基上培养, 所述培养基含有酵母氮源、 生物素和 3%半乳 糖或 2%葡萄糖作为碳源或二者均无。
     图 8 显示巴斯德毕赤酵母糖工程化的菌株 YGLY317-36 的构建。 通过敲除五个酵母 糖基转移酶产生巴斯德毕赤酵母菌株 YGLY16-3。随后敲入八个异源基因, 得到 RDP696-2, 能够将人 N- 聚糖 Gal2GlcNAc2Man3GlcNAc2 转移到分泌的蛋白的菌株。经由 CSTR 培养和引 入表达分泌的人 Fc 的质粒选择健康 (robust) 克隆得到菌株 YGLY317-36。CS, 反选择。
     图 9 显示质粒 pGLY954 的示意图。该质粒是 KINKO 质粒, 其整合进巴斯德毕赤酵 母 TRP1 基因座而不删除基因。 质粒含有分别在 PpHHT1 和 PpPMA1 启动子的控制下编码全长 酿酒酵母半乳糖激酶 (ScGAL1) 和全长酿酒酵母半乳糖 -1- 磷酸尿苷酰转移酶 (ScGAL7) 的 表达盒。质粒还含有在 PpGAPDH 启动子的控制下编码分泌途径靶向融合蛋白 (CO hGalTI) ( 包含 ScMnt1(ScKre2) 前导肽 (33) 融合至人半乳糖基转移酶 I 催化结构域的 N- 末端 ) 的 表达盒。TT 是指转录终止序列。
     图 10 显示单独在 BMMY 培养基中诱导或在含有葡萄糖或半乳糖的培养基中诱导的 菌株 PBP317-36 和 RDP783 中产生的人 Fc 片段上 N- 聚糖的 MALDI-TOF MS 分析。菌株从饱 和的种子培养物接种至约一个 OD, 在 800mL BMGY 中培养 72 小时, 然后分离 (split) 并将 100mL 培养液等分样离心和在 25mL BMMY、 25mL BMMY+0.5%葡萄糖或 25mL BMMY+0.5%半乳 糖中诱导 24 小时。 蛋白 A 纯化的蛋白进行蛋白 N- 糖苷酶 F 消化和通过 MALDI-TOF MS 分析 释放的 N- 聚糖。图 A-C, 菌株 PBP317-36 中产生的人 Fc 上的 N- 聚糖 ; 图 D-E, 菌株 RDP783 中产生的人 Fc 上的 N- 聚糖。
     图 11 显示巴斯德毕赤酵母糖工程化的菌株 YDX477 的构建。敲除五种酵母糖基转 移酶产生巴斯德毕赤酵母菌株 YGLY16-3(Δoch1, Δpno1, Δbmt2, Δmnn4a, Δmnn4b)。随 后敲入八个异源基因, 得到 RDP697-1, 能够将人 N- 聚糖 Gal2GlcNAc2Man3GlcNAc2 转移到分 泌的蛋白的菌株。引入表达分泌的抗体的质粒和表达分泌的形式的里氏木霉 MNS1 的质粒 得到菌株 YDX477。CS, 反选择。
     图 12 显示质粒 pGLY1418 的示意图。该质粒是 KINKO 质粒, 其整合进巴斯德毕赤 酵母 TRP1 基因座而不删除基因。质粒含有分别在 PpHHT1 和 PpPMA1 启动子的控制下编码 全长 ScGAL1 和 ScGAL7 的表达盒。质粒还含有在 PpGAPDH 启动子的控制下编码分泌途径靶 向融合蛋白 (hGalTI)( 包含 ScMnt1(ScKre2) 前导肽融合至人半乳糖基转移酶 I 催化结构域的 N- 末端 ) 的表达盒。TT 是指转录终止序列。
     图 13A-F 显示单独在 BMMY 培养基中诱导或在含有半乳糖的培养基中诱导的菌 株 YDX477 和 RDP968-1 中产生的抗 -Her2 抗体上 N- 聚糖的 MALDI-TOF MS 分析。菌株在 150mL BMGY 中培养 72 小时, 然后分离并将 50mL 培养液等分样离心和在 25mL BMMY、 25mL BMMY+0.1%半乳糖或 25mL BMMY+0.5%半乳糖中诱导 24 小时。 蛋白 A 纯化的蛋白进行蛋白 N- 糖苷酶 F 消化和通过 MALDI-TOF MS 分析释放的 N- 聚糖。图 13A-C, 菌株 YDX477 中产生 的抗体上的 N- 聚糖 ; 图 13D-F, 菌株 RDP968-1 中产生的抗体上的 N- 聚糖。
     图 14 显示质粒 pAS24 的示意图。该质粒是巴斯德毕赤酵母 bmt2 敲除质粒, 其含 有 PpURA3 选择标记和含有在 PpOCH1 启动子的控制下编码全长小鼠高尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 的表达盒。TT 是指转录终止序列。
     图 15 显示质粒 pRCD742b 的示意图。该质粒是 KINKO 质粒, 其含有 PpURA5 选择标 记以及在 PpGAPDH 启动子的控制下编码分泌途径靶向融合蛋白 (FB8 MannI)( 包含融合至 小鼠甘露糖苷酶 I 催化结构域的 N- 末端的 ScSec12 前导肽 ) 的表达盒、 在 PpPMA1 启动子 的控制下编码分泌途径靶向融合蛋白 (CONA10)( 包含融合至人 GlcNAc 转移酶 I(GnT I) 催 化结构域的 N- 末端的 PpSec12 前导肽 ) 的表达盒和在 PpSEC4 启动子的控制下编码小鼠高 尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 的全长基因。TT 是指转录终止序列。
     图 16 显示质粒 pDMG47 的示意图。质粒包括在 PpGAPDH 的控制下启动子编码分泌 途径靶向融合蛋白 (KD53)( 包含融合至黑腹果蝇甘露糖苷酶 II 催化结构域的 N- 末端的 ScMnn2 前导肽 ) 的表达盒。质粒还含有在 PpPMA1 启动子的控制下编码分泌途径靶向融合 蛋白 (TC54)( 包含融合至大鼠 GlcNAc 转移酶 II(GnT II) 催化结构域的 N- 末端的 ScMnn2 前导肽 ) 的表达盒。TT 是指转录终止序列。
     图 17 显示质粒 pRCD823b 的示意图。该质粒是 KINKO 质粒, 其整合进巴斯德毕赤 酵母 HIS4 基因座而不删除基因, 并含有 PpURA5 选择标记。质粒包括在 PpGAPDH 启动子的 控制下编码分泌途径靶向融合蛋白 (TA54)( 包含 ScMnn2 前导肽融合至大鼠 GlcNAc 转移酶 II(GnTII) 催化结构域的 N- 末端 ) 的表达盒和分别在 PpOCH1 和 PpPMA1 启动子的控制下编 码全长黑腹果蝇高尔基体 UDP- 半乳糖转运蛋白 (DmUGT) 和酿酒酵母 UDP- 半乳糖 C4- 差向 异构酶 (ScGAL10) 的表达盒。TT 是指转录终止序列。
     图 18 显示质粒 pGLY893a 的示意图。该质粒是巴斯德毕赤酵母 his1 敲除质粒, 其 含有 PpARG4 选择标记。质粒含有在 PpPMA1 启动子的控制下编码分泌途径靶向融合蛋白 (KD10)( 包含 PpSEC12 前导肽融合至黑腹果蝇甘露糖苷酶 II 催化结构域的 N- 末端 ) 的表达 盒, 在 PpTEF 启动子的控制下编码分泌途径靶向融合蛋白 (TA33)( 包含 ScMnt1(ScKre2) 前 导肽融合至大鼠 GlcNAc 转移酶 II(GnT II) 催化结构域的 N- 末端 ) 的表达盒和在 PpGAPDH 启动子的控制下编码分泌途径靶向融合蛋白 ( 包含 ScMnn2 前导肽融合至人半乳糖基转移 酶 I 催化结构域的 N- 末端 ) 表达盒。TT 是指转录终止序列。
     图 19 显示质粒 pRCD742a 的示意图。该质粒是 KINKO 质粒, 其整合进巴斯德毕赤 酵母 ADE1 基因座而不删除基因并含有 PpURA5 选择标记。质粒含有在 PpGAPDH 启动子的控 制下编码分泌途径靶向融合蛋白 (FB8 MannI)( 包含 ScSEC12 前导肽融合至小鼠甘露糖苷 酶 I 催化结构域的 N- 末端 ) 的表达盒、 在 PpPMA1 启动子的控制下编码分泌途径靶向融合蛋 白 (CONA10)( 包含 PpSEC12 前导肽融合至人 GlcNAc 转移酶 I(GnT I) 催化结构域的 N- 末端 ) 的表达盒和在 PpSEC4 启动子的控制下编码全长小鼠高尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 的表达盒。TT 是指转录终止序列。
     图 20 显示质粒 pRCD1006 的示意图。该质粒是巴斯德毕赤酵母 his1 敲除质粒, 其 含有 PpURA5 基因作为选择标记。质粒含有在 PpGAPDH 启动子的控制下编码分泌途径靶向 融合蛋白 (XB33)( 包含 ScMnt1(ScKre2) 前导肽融合至人半乳糖基转移酶 I 催化结构域的 N- 末端 ) 的表达盒和分别在 PpOCH1 和 PpPMA1 启动子的控制下编码全长黑腹果蝇高尔基体 UDP- 半乳糖转运蛋白 (DmUGT) 和粟酒裂殖酵母 UDP- 半乳糖 C4- 差向异构酶 (SpGALE) 的表 达盒。TT 是指转录终止序列。
     图 21 显示质粒 pGLY167b 的示意图。该质粒是巴斯德毕赤酵母 arg1 敲除质粒, 其含有 PpURA3 选择标记并含有在 PpGAPDH 启动子的控制下编码分泌途径靶向融合蛋白 (CO-KD53)( 包含 ScMNN2 前导肽融合至黑腹果蝇甘露糖苷酶 II 催化结构域的 N- 末端 ) 的 表达盒和在 PpPMA1 启动子的控制下编码分泌途径靶向融合蛋白 (CO-TC54)( 包含 ScMnn2 前导肽融合至大鼠 GlcNAc 转移酶 II(GnT II) 催化结构域的 N- 末端 ) 的表达盒。TT 是指 转录终止序列。
     图 22 显示质粒 pBK 138 的示意图。该质粒是滚入 (roll-in) 质粒, 其整合进巴斯 德毕赤酵母 AOX1 启动子同时复制启动子。质粒含有编码融合蛋白 ( 包含酿酒酵母 A 交配 因子前信号序列融合至人 Fc 抗体片段 ( 人 IgG1H 链的 C- 末端 233-aa) 的 N- 末端 ) 的表 达盒。TT 是指转录终止序列。
     图 23 显示质粒 pGLY510 的示意图。该质粒是滚入质粒, 其整合进巴斯德毕赤酵母 TRP2 基因同时复制基因并含有 AOX1 启动子 -ScCYC1 终止子表达盒以及 PpARG1 选择标记。 TT 是指转录终止序列。
     图 24 显示质粒 pDX459-1 的示意图。 该质粒是滚入质粒, 其靶向并整合进巴斯德毕 R 赤酵母 AOX2 启动子和含有 Zeo 同时复制启动子。质粒含有分开的表达盒, 其编码抗 -HER2 抗体重链和抗 -HER2 抗体轻链, 每个在 N- 末端融合至黑曲霉 α- 淀粉酶信号序列并在巴斯 德毕赤酵母 AOX1 启动子的控制下。TT 是指转录终止序列。
     图 25 显示质粒 pGLY1138 的示意图。该质粒是滚入质粒, 其整合进巴斯德毕赤酵 母 ADE1 基因座同时复制基因和含有 ScARR3 选择标记基因盒 ( 其赋予亚砷酸盐抗性 ) 以及 在 PpAOX1 启动子的控制下编码分泌的里氏木霉 MNS1( 包含 MNS1 催化结构域在其 N- 末端 融合至酿酒酵母 α 因子前信号序列 ) 的表达盒。TT 是指转录终止序列。
     发明详述
     酵母已被成功用于生产细胞内和分泌的重组蛋白 ( 参见例如, Cereghino Cregg FEMS Microbiology Reviews 24(1) : 45-66(2000) ; Harkki, 等人 Bio-Technology 7(6) : 596(1989) ; Berka, 等人 Abstr.Papers Amer.Chem.Soc.203 : 121-BIOT(1992) ; Svetina, 等 人 J.Biotechnol.76(2-3) : 245-251(2000))。多种酵母, 例如乳酸克鲁维酵母、 巴斯德毕赤 酵母、 甲醇毕赤酵母和多形汉逊酵母, 已作为用于生产重组蛋白的真核表达系统发挥特别 重要的作用, 因为它们能够生长至高细胞密度和分泌大量重组蛋白。 但是, 在任意这些真核 微生物中的糖蛋白表达在 N- 聚糖结构上实质不同于哺乳动物中产生的糖蛋白表达。糖基 化中的该差异已阻止酵母或丝状真菌用作用于生产许多治疗用糖蛋白的宿主。
     为了能够利用酵母以产生治疗用糖蛋白, 酵母已被基因工程化为产生具有杂合或复合 N- 聚糖的糖蛋白。能够生产包含具体杂合或复合 N- 聚糖的组合物的重组酵母已在例 如, 美国专利号 7,029,872 和美国专利号 7,449,308 中公开。 另外, Hamilton 等人, Science 313 : 1441-1443(2006) 和美国公开的申请号 2006/0286637 报道了酵母巴斯德毕赤酵母中 糖基化途径的人源化和具有复合 N- 糖基化 ( 具有末端唾液酸 ) 的重组人糖蛋白的分泌。 对 于末端唾液酸的具有寡糖结构 Gal2GlcNAc2Man3GlcNAc2(G2) 前体 N- 聚糖是也作为从人血清 中分离的几种蛋白上主要 N- 聚糖发现的结构, 所述从人血清中分离的几种蛋白包括促卵 泡激素 (FSH)、 脱唾液酸转铁蛋白, 以及最显著的是在人免疫球蛋白 ( 抗体 ) 以不同的量存 在。Davidson 等人在美国公开的申请号 2006/0040353 教导了利用已被基因工程化为产生 半乳糖末端的 N- 聚糖的酵母细胞获得半乳糖基化的糖蛋白的有效方法。这些宿主细胞能 够生产糖蛋白组合物具有 G2 或 G1(GalGlcNAc2Man3GlcNAc2) 寡糖结构的多种混合物, 其具 有 G0 寡糖结构的变化量。 G0 是 GlcNAc2Man3GlcNAc2, 其是半乳糖基转移酶的底物。 但是, 对 于某些糖蛋白, 特别是抗体和 Fc 片段, 已发现半乳糖转移过程的效率不是最适的。在抗体 和 Fc 片段的情况下, 认为的是在细胞内加工期间抗体或 Fc 片段上糖基化位点的定位和可 及性抑制半乳糖有效转移到抗体或 Fc 片段的 N- 聚糖上。因此, 含有半乳糖的寡糖结构的 量小于其他糖蛋白例如三环 3 蛋白中已观察到的量。为了克服该问题, 本发明提供增加半 乳糖转移到抗体或 Fc 片段的 N- 聚糖上的量的方法, 因此增加含有抗体或 Fc 片段的 G1 和 G2 的量高于含有抗体或 Fc 片段的 G0。
     巴斯德毕赤酵母仅可利用有限数量的碳源进行生存。 目前, 这些碳源已知是甘油、 葡萄糖、 甲醇以及可能是鼠李糖和甘露糖但不是半乳糖。 在许多商业生产过程中, 利用巴斯 德毕赤酵母, 重组蛋白的表达在 AOX 启动子的控制下, 其 w 在甲醇存在下是有活性的但在甘 油存在下被抑制。因此, 巴斯德毕赤酵母通常在含有甘油或甘油 / 甲醇的培养基中生长直 到细胞的浓度达到期望的水平, 在此时, 通过用仅含有甲醇作为碳源的培养基替换培养基 来进行重组蛋白的表达。但是, 细胞处于低能量状态, 因为甲醇仅含有一个碳, 使其成为贫 瘠碳源。因此, 期望的是具有这样的生产过程, 其中巴斯德毕赤酵母可利用更高级的能源, 例如半乳糖。 本发明通过提供能够利用半乳糖作为单一碳源的基因工程化巴斯德毕赤酵母 也解决了该问题。
     因此, 本发明已解决上述确定的两个问题。 本发明提供重组低等真核细胞, 特别是 酵母和真菌细胞, 其已被糖工程化以产生糖蛋白例如抗体或 Fc 片段, 其中与未被如本文所 教导的基因工程化的细胞相比, 其上 N- 聚糖上的末端半乳糖水平增加。基因工程化宿主细 胞可用于产生具有 N- 聚糖 ( 含有半乳糖 ) 的糖蛋白的方法, 其中所述 N- 聚糖中半乳糖的 量高于未被如本文所教导的基因工程化的宿主细胞中可获得的量。 本发明还提供基因工程 化宿主细胞, 其中通常不能利用半乳糖作为单一碳源的宿主细胞已被如本文所教导的基因 工程化以能够利用半乳糖作为单一碳源。 本文的使得宿主细胞能够利用半乳糖作为单一碳 源的方法利用巴斯德毕赤酵母作为模型。 本文的方法可用于使得通常不能利用半乳糖作为 碳源的其他酵母或真菌物种能够利用半乳糖作为碳源。
     为 解 决 两 个 问 题, 基因工程化的宿主细胞 ( 其已被基因工程化为能够产生 半乳糖末端的 N- 聚糖 ) 被进一步基因工程化为表达 Leloir 途径酶 : 半乳糖激酶 (EC 2.7.1.6)、 UDP- 半乳糖 -4- 差向异构酶 (EC 5.1.3.2) 和半乳糖 -1- 磷酸尿苷酰转移酶 (EC 2.7.7.12)。任选地, 宿主细胞可另外表达半乳糖通透酶。这使得宿主细胞能够利用半乳糖作为碳源并产生 UDP- 半乳糖库, 其反过来作为涉及包括半乳糖残基的 N- 聚糖合成的半乳 糖转移酶的底物。 因此, 本文中的宿主细胞和方法能够产生糖蛋白组合物, 特别是抗体和 Fc 片段组合物, 其中所述半乳糖末端的 N- 聚糖的比例高于在糖工程化的低等真核细胞中可 获得的比例。重组宿主细胞可生产重组糖蛋白例如抗体和 Fc 融合蛋白, 其中 G0 ∶ G1/G2 比值小于 2 ∶ 1 或 G0 ∶ G1/G2 比值为 1 ∶ 1 或更小或 G0 ∶ G1/G2 比值为 1 ∶ 2 或更小。
     本文所述的宿主细胞和方法特别用于生产这样的抗体和 Fc 片段, 其含有具有 N- 聚糖的融合蛋白, 所述 N- 聚糖具有半乳糖残基末端。在抗体或抗体片段重链 Asn-297 处的 N- 聚糖对抗体的结构和功能重要。这些功能包括 Fcγ 受体结合、 激活补体的能力、 激 活细胞毒性 T 细胞 (ADCC) 的能力和血清稳定性。但是, 在酵母或哺乳动物细胞中目前的抗 体生产通常缺乏对于 N- 糖基化的控制, 特别是在重链的恒定区或 Fc 区 Asn-297 处发生的 N- 糖基化, 以及特别是控制在 N- 聚糖上末端半乳糖的水平的能力。一般而言, 已发现尽管 已被基因工程化为产生在 N- 聚糖中包括半乳糖残基的糖蛋白的酵母细胞可以高效地产生 许多具有含有半乳糖的 N- 聚糖的糖蛋白, 但是细胞产生抗体具有含有半乳糖的 N- 聚糖的 能力并不一样高效。 如本文所示, 本文的宿主细胞和方法提供这样的宿主细胞, 其与未被如 本文所述基因工程化的细胞相比, 可以产生更高水平的具有含有半乳糖的 N- 聚糖的抗体。
     尽管在不具有末端半乳糖残基的 N- 聚糖上末端的半乳糖水平可以在体外在利用 可溶性半乳糖基转移酶以将带电的半乳糖残基添加到 N- 聚糖的末端的反应中增加, 但是 该体外方法费用高、 复杂并且不容易扩大规模用于生产大量糖蛋白。 因此, 本文公开的宿主 细胞 ( 并且其能够在体内产生分泌的具有增加的末端半乳糖水平的 N- 聚糖的糖蛋白, 包 括抗体或抗体片段 ) 提供生产具有含有增加的半乳糖水平的 N- 聚糖的抗体组合物的更理 想的方法。因此, 本发明在抗体生产中具有显著改进并且首次提供控制具体抗体特征例如 N- 聚糖中半乳糖水平的能力, 和特别是生产具有改进的功能性特征的重组糖蛋白。
     另外, 当本文的方法用于已被基因工程化为产生具有唾液酸化的 N- 聚糖的糖蛋 白的宿主细胞中时, 半乳糖末端的 N- 聚糖是唾液酸转移酶的底物。因此, 唾液酸化的 N- 聚 糖的量部分地随可用于唾液酸化的半乳糖末端的 N- 聚糖的量而变化。本文中的宿主细胞 和方法提供用于增加半乳糖末端的或含有半乳糖的 N- 聚糖的量的方法, 其中当在已被基 因工程化为产生唾液酸化的 N- 聚糖的宿主细胞中生产时, 产生这样的宿主细胞, 其与未被 如本文所教导的基因工程化的宿主细胞相比, 产生增加量的唾液酸化的 N- 聚糖。
     尽管本发明用于生产包含半乳糖末端的或含有半乳糖的 N- 聚糖的糖蛋白, 但是 本发明还用作用于选择表达任意类型异源蛋白 ( 不论是否是糖蛋白 ) 的重组宿主细胞的 选择方法。表达一种或两种但不是全部 Leloir 途径酶活性的重组宿主细胞用编码异源蛋 白和不存在于重组宿主细胞中的 Leloir 途径酶的一个或多个核酸分子转化。由于转化的 重组宿主细胞含有完整的 Leloir 途径, 可通过在半乳糖是单一碳源的培养基中培养转化 的重组宿主细胞来获得选择表达对于非转化的细胞是异源蛋白的转化的重组宿主细胞。 因 此, 提供的是用于产生表达异源蛋白的重组宿主细胞的方法, 其包含以下步骤。提供宿主 细胞, 其已被基因工程化为表达一种或两种选自半乳糖激酶、 UDP- 半乳糖 -4- 差向异构酶 和半乳糖 -1- 磷酸尿苷酰转移酶的 Leloir 途径酶。在一些实施方案中, 宿主细胞能够产生 具有人样 N- 聚糖的糖蛋白, 和在其他实施方案中, 宿主细胞不产生具有人样 N- 聚糖的糖蛋 白, 因为要在宿主细胞中表达的异源蛋白不具有 N- 聚糖。用编码异源蛋白和提供的重组宿主细胞中不表达的 Leloir 途径酶或多种酶的一个或多个核酸分子转化宿主细胞。转化的 宿主细胞在含有半乳糖作为单一碳能源的培养基中培养以提供表达异源蛋白的重组宿主 细胞。任选地, 宿主细胞可另外包括编码半乳糖通透酶的核酸分子。在具体实施方案中, 宿 主细胞被基因工程化为控制 O- 糖基化或在控制 O- 糖基化的条件下生长或二者。在另外的 实施方案中, 宿主细胞另外已被修饰为降低磷酸甘露糖基转移酶和 / 或 β- 甘露糖基转移 酶活性 .
     在低等真核细胞中基因工程化糖基化途径
     在 大 多 数 真 核 细 胞 中 N- 糖 基 化 通 过 将 脂 类 - 连 接 的 Glc3Man9GlcNAc2 寡 糖 结 构 转 移 到 新 生 多 肽 的 特 定 Asn 残 基 上 在 内 质 网 (ER) 中 起 始 (Lehle 和 Tanner, Biochim.Biophys.Acta 399 : 364-74(1975) ; Kornfeld 和 Kornfeld, Annu.Rev.Biochem 54 : 631-64(1985) ; Burda 和 Aebi, Biochim.Biophys.Acta-General Subjects 1426 : 239-257(1999))。对来自 N- 连接寡糖的所有三个葡萄糖部分和单个特定甘露糖的修饰 产生 Man 8GlcNAc2( 参见图 1), 其使得糖蛋白易位到高尔基体, 在高尔基体中发生进一步 寡 糖 加 工 (Herscovics, Biochim.Biophys.Acta 1426 : 275-285(1999) ; Moremen 等 人, Glycobiology 4 : 113-125(1994))。在高尔基体中, 哺乳动物 N- 聚糖加工不同于酵母和许 多其他真核细胞, 包括植物和昆虫。哺乳动物以特定反应顺序加工 N- 聚糖, 涉及在从寡糖 在添加 GlcNAc 以形成杂合中间体 N- 聚糖 GlcNAcMan5GlcNAc2 之前, 去除三个末端 α-1, 2- 甘露糖 (Schachter, Glycoconj.J.17 : 465-483(2000))( 参见图 1)。该杂合结构是甘露 糖苷酶 II 的底物, 所述甘露糖苷酶 II 在寡糖上去除末端 α-1, 3- 和 α-1, 6- 甘露糖以得到 N- 聚糖 GlcNAcMan3GlcNAc2(Moremen, Biochim.Biophys.Acta 1573(3) : 225-235(1994))。 最后, 如图 1 所示, 通过在添加半乳糖和唾液酸残基后, 添加至少一个另外的 GlcNAc 残基, 产生复合 N- 聚糖 (Schachter, (2000), 如上 ), 虽然唾液酸通常在某些人蛋白, 包括 IgGs 上 缺乏 (Keusch 等人, Clin.Chim.Acta 252 : 147-158(1996) ; Creus 等人, Clin.Endocrinol. (Oxf)44 : 181-189(1996))。
     在酿酒酵母中, N- 聚糖加工涉及在其通过整个高尔基体时, 添加甘露糖至寡糖, 有 时产生具有大于 100 个甘露糖残基的高甘露糖基化的聚糖 (Trimble 和 Verostek, Trends Glycosci.Glycotechnol.7 : 1-30(1995) ; Dean, Biochim.Biophys.Acta-General Subjects 1426 : 309-322(1999))( 参见图 1)。在通过 α-1, 6- 甘露糖基转移酶 (Ochlp) 将第一个 α-1, 6- 甘露糖添加到 Man8GlcNAc2 后, 另外的甘露糖基转移酶延伸具有 α-1, 2-、 α-1, 6- 和末端 α-1, 3- 连接的甘露糖以及甘露糖基磷酸的 Man9GlcNAc2 聚糖。 巴斯德毕赤酵母是 甲基营养酵母, 通常用于异源蛋白的表达, 具有与酿酒酵母类似的糖基化机制 (Bretthauer 和 Castellino, Biotechnol.Appl.Biochem.30 : 193-200(1999) ; Cereghino 和 Cregg, Fems Microbiol.Rev.24 : 45-66(2000) ; Verostek 和 Trimble, Glycobiol.5 : 671-681(1995))。 但 是, 与 N- 糖基化的复杂度一致, 巴斯德毕赤酵母中的糖基化不同于酿酒酵母中的糖基化, 原因在于它缺乏添加末端 α-1, 3- 连接的甘露糖的能力, 而是添加其他甘露糖残基, 包括 磷酸甘露糖和 β- 连接的甘露糖 (Miura 等人, 基因 324 : 129-137(2004) ; Blanchard 等人, Glycoconj.J.24 : 33-47(2007) ; Mille 等人, J.Biol.Chem.283 : 9724-9736(2008))。
     在 以往工 作中, 我 们证明巴斯 德毕 赤酵 母 的 och1 突 变 体 缺乏 起 始 酵母 型 外 链 形 成 的 能 力, 并 且 因 此, 不 能 高 甘 露 糖 化 N- 聚 糖 (Choi 等 人, Proc.Natl.Acad.Sci.USA 100 : 5022-5027(2003))。另外, 我们鉴定了编码负责 β- 甘露糖转移的高尔基体定 位 (residing) 酶的新的基因家族并证明该家族的多个成员的缺失降低或消除免疫原性 β- 甘露糖转移 ( 参见美国公开的申请号 US2006/0211085)。随后引入五种单独的糖基 化酶得到在分泌的模式蛋白上产生复合人 N- 聚糖的菌株 ( 参见图 3A 相对于图 3B)(Choi 等 人, Proc.Natl.Acad.Sci.USA 100 : 5022-5027(2003) ; Hamilton 等 人 Science 310 : 1244-1246(2003) ; 美国专利号 7,029,872 ; 美国公开的申请号 2004/0018590 ; 美国公开的 申请号 2004/023004 ; 美国公开的申请号 2005/0208617 ; 美国公开的申请号 2004/0171826 ; 美国公开的申请号 2005/0208617 ; 美国公开的申请号 2005/0170452 和美国公开的申请 号 2006/0040353。更近期地, 构建能够在酵母菌株产生的分泌的蛋白上产生充分唾液酸 化的 N- 聚糖的重组酵母菌株已在美国公开的申请号 2005/0260729 和 2006/0286637 和 Hamilton 等人, Science 313 : 1441-1443(2006) 中描述。
     复合 N- 聚糖的成熟涉及添加半乳糖至末端 GlcNAc 部分, 这是可以被几种半乳糖 基转移酶 (GalT) 催化的反应。在人中, 存在 GalT 的七种同种型 (I-VII), 其中至少四种 已显示在体外在 UDP- 半乳糖存在下转移半乳糖至末端 GlcNAc(Guo, 等人, Glycobiol.11 : 813-820(2001))。最先鉴定的酶, 已知为 GalTI, 通常被认为是作用 N- 聚糖的主要酶, 这 已由体外实验、 小鼠敲除研究和组织分布分析支持 (Berger 和 Rohrer, Biochimie 85 : 261-74(2003) ; Furukawa 和 Sato, Biochim.Biophys.Acta 1473 : 54-66(1999))。 如 本 文 所示, 人 GalTI 的表达, 当其在宿主细胞高尔基体适当定位时, 可以在能够产生含有末端 GlcNA 的前体的糖工程化的酵母菌株中转移半乳糖至复合 N- 聚糖上。另外, UDP- 半乳糖 4- 差向异构酶的表达以产生 UDP- 半乳糖库和 UDP- 半乳糖转运蛋白的表达以将底物移动至 高尔基体在能够产生末端 GlcNAc 前体的菌株中产生几乎相当量的 β-1, 4- 半乳糖转移到 N- 聚糖上。 经由对于中间 N- 聚糖底物在 GlcNAc 和半乳糖基转移酶之间的分离和降低的竞 争, 定位子文库的重复筛选得到复合 N- 聚糖结构高于于杂合 N- 聚糖结构的改进的产生。
     以往, 在一组精确设计的实验 (an elegant set of experiments) 中, 人 GalTI 显 示具有将 β-1, 4- 半乳糖转移到末端 GlcNAc 的活性, 这要求首先产生 Alg1p 酶的突变体, 其将核心或少甘露糖转移到在生长中的 N- 聚糖前体分子 (Schwientek 等人, J.of Biol. Chem 271 : 3398-3405(1996))。该突变引起 GlcNAc2 截短的 N- 聚糖部分地转移到蛋白, 并 产生末端 GlcNAc。这之后, 作者表明人 GalTI 能够将半乳糖以 β-1, 4- 连接转移到该人工 末端 GlcNAc 结构。重要的是, 显示了人 GalTI 可以在酵母的高尔基体中以活性形式表达。
     基于上述, 首先利用靶向宿主细胞高尔基体的人 GalTI- 前导肽融合蛋白的表达 来检测本发明。在随后筛选人 GalTII、 GalTIII、 GaITIV、 GalTV、 牛 GalTI 和一对推测的线 虫 (C.elegans)GalT 后, 发现人 GalTI 看起来是在该异源的系统中将半乳糖转移到复合双 触角 N- 聚糖的最具活性的酶。 这可能表明 hGalTI 是用于转移至该底物 ( 双触角复合 N- 聚 糖 ) 的最具能力的酶或它可能仅是检测的 GalT 酶中最稳定的和最具活性的或二者的组合。 有意思的是, 当利用将甘露糖苷酶 II 和 GnT II 催化结构域 - 引导融合蛋白定位于高尔基体 的相同前导肽将 GalT 定位于高尔基体时, 产生其中末端半乳糖在 α-1, 3 臂上的杂合 N- 聚 糖结构的显著百分比 ( 直至 20% )。甘露糖苷酶 II 或 GnT II 活性的表达的增加不能显著 降低该现象。但是, 筛选酵母型 II 分泌途径定位前导肽 ( 定位于分泌途径期望的细胞器例 如 ER、 高尔基体或反式高尔基体网络的肽 ) 文库得到几种活性 GalT- 前导肽融合蛋白, 其当被转化至宿主细胞时, 产生显著降低水平的杂合 N- 聚糖结构和增加的复合 N- 聚糖结构。 之 前, 已报道等分的 (bisecting)GlcNAc 转移是高尔基体中 N- 聚糖的成熟中对于随后糖转移 的停止信号, 包括阻止果糖的转移 (Umana 等人, Nature Biotechnol.17 : 176-180(1999))。 此处的数据表明半乳糖转移到 α-1, 3 臂产生类似的停止信号, 阻止甘露糖苷酶 II 和 GnT II 进行的 α-1, 6 臂的成熟。
     上述结果表明在重组宿主细胞中产生的具有半乳糖末端或含有半乳糖的杂合 N- 聚糖与具有半乳糖末端的或含有半乳糖的复合 N- 聚糖的比值是 GalTI 位于高尔基体相 对于甘露糖苷酶 II 和 GnT II 位于高尔基体中的结果, 并且通过操纵三种酶的定位, 可以操 纵杂合 N- 聚糖与复合 N- 聚糖的比值。为了增加具有半乳糖末端的或含有半乳糖的杂合 N- 聚糖的产率, 所有三种酶活性应被靶向至高尔基体的相同区域, 例如通过利用相同分泌 途径靶向前导肽来靶向所有三种酶活性。或者, 筛选 GalT- 前导肽融合蛋白的文库来鉴定 将 GalT 活性定位于高尔基体的融合蛋白, 在高尔基体中更可能的是在其他两个酶可以发 挥作用之前, GalT 作用 N- 聚糖底物。 该增加了具有半乳糖末端的或含有半乳糖的杂合 N- 聚 糖相比于具有半乳糖末端的或含有半乳糖的复合 N- 聚糖的产率。相反地, 为了降低具有半 乳糖末端的或含有半乳糖的杂合 N- 聚糖的产率, 应利用与其他两种酶活性所利用的分泌 途径靶向前导肽不同的分泌途径靶向前导肽来定位 GalT 活性。这可通过筛选 GalT- 前导 肽融合蛋白文库以鉴定 GalT- 前导肽融合蛋白组合来获得, 所述 GalT- 前导肽融合蛋白组 合产生这样的宿主细胞, 在其中与具有半乳糖末端的或含有半乳糖的杂合 N- 聚糖的产率 相比, 具有半乳糖末端的或含有半乳糖的复合 N- 聚糖的产率增加。
     该结果进一步强调了当在异源宿主系统中表达嵌合糖基化酶时, 筛选催化结构 域和分泌途径定位前导肽文库的价值, 这是之前在 Choi 等人, Proc.Natl.Acad.Sci.USA 100 : 5022-5027(2003) 中说明的并在美国专利号 7,029,872 和 7,449,308 中描述的概念。 由于全基因组序列的可获得性、 更复杂的 PCR 和克隆技术以及更高通量的分析技术如质 谱, 筛选数以百计甚至数以千计的组合是可能的。重要的是, 这种类型的组合筛选已证实 在检测酶活性与驱动逐步反应之间的差异, 每个依赖于之前的产物而完成。此处, 尽管在 UDP- 半乳糖 4- 差向异构酶的情况下, 筛选的几种酶看起来具有产生 UDP- 半乳糖库相对相 同的能力, 但是检测的四种 UDP- 半乳糖转运蛋白中仅一种在该异源宿主中证实有活性, 包 括令人惊讶地, 来自一种酵母 ( 粟酒裂殖酵母 ) 的一种无活性转运蛋白。另外, 从多种分泌 途径定位前导肽的筛选中, 其中许多产生活性酶组合, 发现仅三种得到较高程度的具有双 触角末端半乳糖 (G2) 的均一的复合 N- 聚糖 ( > 85% )。高甘露糖和杂合中间结构的减少 对于这类异源表达系统在生产治疗用糖蛋白中的用途具有重要的作用, 因为高甘露糖结构 已显示具有有效免疫原性并且最近的证据已表明肝毒性可源自过于丰富的杂合 N- 聚糖。
     因此, 美国公开的申请号 2006/0286637 教导了在不通常产生含有半乳糖的糖蛋 白的宿主细胞中获得半乳糖转移的方法, 三种条件已被克服 : (1) 在高尔基体中内源半乳 糖基转移酶 (GalT) 的缺乏, (2) 内源 UDP-Gal 不能转运至高尔基体和 (3) 低的内源细胞质 UDP-Gal 库。在缺乏 UDP-Gal 转运蛋白的情况下, 半乳糖向 N- 聚糖上末端 GlcNAc 残基的转 移为约 55-60%。在缺乏 UDP- 葡萄糖 -4- 差向异构酶的情况下, 半乳糖向 N- 聚糖上末端 GlcNAc 残基的转移为约 10-15%。
     利用具有暴露的 N- 聚糖 ( 其在人中通常被唾液酸化 ) 的报告子蛋白 ( 人纤溶酶原的 K3 结构域 ) 已制备了所有上述修饰以产生宿主细胞 ( 其可产生半乳糖基化的 N- 聚糖 ), 并在美国公开的申请号 20060040353 中报道。但是, 以可与哺乳动物细胞相比较的方式, 这 些糖工程化的酵母菌株仅产生部分的半乳糖转移到抗体 Fc 聚糖上, 引起具有小于 10% G2 和小于 25% G1 结构的 N- 聚糖库, 偏好于具有末端 GlcNAc 的复合 N- 聚糖。这与哺乳动物 细胞系类似, 其中抗体 (IgG Fc Asn 297)N- 聚糖含有减少量的末端半乳糖。
     半乳糖残基转移到 N- 聚糖上需要活化的半乳糖 (UDP-Gal) 库。 在低等真核细胞中 产生高于内源水平的这类库的一种方式是如上所述并在美国公开的申请号 2006/0040353 所示的 UDP- 半乳糖 4 差向异构酶的表达。另一种方式本发明, 其包括上述细胞, 其中用核 酸分子转化所述宿主细胞, 所述核酸分子编码至少以下三种 Leloir 途径酶 : 半乳糖激酶 (EC2.7.1.6)、 半乳糖 -1- 磷酸尿苷酰转移酶 EC 2.7.7.12) 和 UDP- 半乳糖 4 差向异构酶 (EC 5.1.3.2)。半乳糖激酶是催化半乳糖代谢的第一步 ( 称为半乳糖磷酸化为半乳糖 -1- 磷 酸 ) 的酶。半乳糖 -1- 磷酸尿苷酰转移酶催化半乳糖代谢的第二步骤, 其是 UDP- 葡萄糖和 半乳糖 -1- 磷酸转换为 UDP- 半乳糖和葡萄糖 -1- 磷酸。任选地, 另外可以包括的是编码质 膜半乳糖通透酶的核酸分子。半乳糖通透酶是质膜己糖转运蛋白, 其从外部来源输入半乳 糖。Leloir 途径显示于图 4。
     如本文所示, 当编码半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳 糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性的基因被引入上述酵母, 同时 向该酵母给料酵母外源半乳糖, 并诱导抗体表达时, 抗体 Fc N- 聚糖上末端半乳糖的水平实 质增加, 因此增加产生的 G2N- 聚糖的量 : N- 聚糖可在人 Fc 上获得, 其中大于 50%的 N- 聚 糖是 G2。通透酶是任选的, 因为发现细胞中的内源通透酶能够将半乳糖输入细胞。因此, 当使用时, 半乳糖通透酶可以是能够使半乳糖穿过细胞膜转运的任意质膜己糖转运蛋白, 例如, 来自酿酒酵母的 GAL2 半乳糖通透酶 ( 参见 GenBank : M81879)。半乳糖激酶可以是能 够催化半乳糖磷酸化为半乳糖 -1- 磷酸的任意酶, 例如, 来自酿酒酵母的 GAL1 基因 ( 参见 GenBank : X76078)。半乳糖 -1- 磷酸尿苷酰转移酶可以是催化 UDP- 葡萄糖和半乳糖 -1- 磷 酸转换为 UDP- 半乳糖和葡萄糖 -1- 磷酸的任意酶, 例如, 酿酒酵母的 GAL7( 参见 GenBank : M12348)。UDP- 半乳糖 4 差向异构酶可以是催化 UDP- 葡萄糖转换为 UDP- 半乳糖的任意酶, 例如酿酒酵母的 GAL10( 参见 GenBank NC_001134), 粟酒裂殖酵母的 GALE( 参见 GenBank NC_003423) 和人的 hGALE( 参见 GenBank NM_000403)。差向异构酶还可提供为融合蛋白, 其中差向异构酶的催化结构域被融合至半乳糖基转移酶的催化结构域 ( 参见美国公开的 申请号 US2006/0040353)。
     将上述 Leloir 途径酶引入巴斯德毕赤酵母菌株产生能够同化环境半乳糖的重组 细胞。另外, 当上述 Leloir 途径酶被引入能够生产具有含有半乳糖的 N- 聚糖的糖蛋白的 细胞中时, 得到的重组细胞能够产生与未被如此工程化的细胞产生的糖蛋白相比, 在复合 N- 聚糖上具有更高水平 β-1, 4- 半乳糖的糖蛋白。因此, 这些工程化步骤的组合已得到这 样的宿主细胞, 其被特定地糖工程化和代谢地工程化为对于糖蛋白例如抗体和 Fc- 融合蛋 白的 N- 聚糖的糖基化的增加的控制。因此, 这些糖工程化的酵母细胞系能够有效的产生重 组抗体和 Fc 融合蛋白同时允许控制 N- 聚糖加工。
     表达载体
     一般而言, 半乳糖激酶、 UDP- 半乳糖 -4- 差向异构酶和半乳糖 -1- 磷酸尿苷酰转移酶 ( 以及任选地半乳糖通透酶 ) 作为来自表达载体的表达盒的组分而表达。在另外的方 面, 在宿主细胞中另外包括的是编码重组目的蛋白的表达载体, 其在具体的实施方案中另 外包括促进重组蛋白从宿主细胞中分泌的序列。对于每种 Leloir 途径酶和重组目的蛋白, 编码它的表达载体最低程度含有这样的序列, 其影响编码 Leloir 途径酶或重组蛋白的核 酸序列的表达。该序列被可操作连接到编码 Leloir 途径酶或重组蛋白的核酸分子。这类 表达载体还可含有另外的元件, 如复制起点、 选择标记、 转录或终止信号、 着丝粒、 自我复制 序列等。
     根据本发明, 编码重组目的蛋白和上述 Leloir 途径酶的核酸分子可以分别地位 于表达载体中以允许过表达的重组目的蛋白和上述 Leloir 途径酶的受调节的表达。尽管 重组蛋白和上述 Leloir 途径酶可以在相同的表达载体中编码, 但是上述 Leloir 途径酶优 选地在与编码重组蛋白的载体分开的表达载体中编码。编码上述 Leloir 途径酶和重组蛋 白的核酸分子位于分开的表达载体中可以增加产生的重组蛋白的量。
     如本文所用, 表达载体可以是可复制的或不可复制的表达载体。可复制的表达载 体可以不依赖于宿主细胞染色体 DNA 复制或因为这类载体具有整合到宿主细胞染色体 DNA 而依赖于宿主细胞染色体 DNA 复制。整合至宿主细胞染色体 DNA 后, 这类表达载体可以失 去一些结构元件但保留编码重组蛋白或上述 Leloir 途径酶的核酸分子和可以作用于重组 蛋白或上述 Leloir 途径酶的表达的片段。因此, 本发明的表达载体可以是染色体整合或染 色体非整合的表达载体。
     在引入编码上述 Leloir 途径酶和重组蛋白的核酸分子后, 然后通过诱导编码重 组蛋白的核酸的表达, 使重组蛋白过表达。在另一实施方案中, 建立这样的细胞系, 其组成 型或诱导型表达上述 Leloir 途径酶。编码将被过表达的重组蛋白的表达载体被引入这类 细胞系以获得重组蛋白的增加的产生。在具体实施方案中, 编码 Leloir 途径酶的核酸分子 被可操作连接到组成型启动子。
     本发明表达载体可以是在一种宿主细胞类型例如大肠杆菌 (Escherichia coli) 中可复制的并在另一种宿主细胞类型例如真核宿主细胞中进行很少复制或不能复制的, 只 要表达载体允许上述 Leloir 途径酶或过表达的重组蛋白的表达并因而促进这类重组蛋白 在选择的宿主细胞类型中的分泌。
     如本文所述的表达载体包括这样的 DNA 或 RNA 分子, 其被工程化为对期望的基因 即编码上述 Leloir 途径酶或重组蛋白的基因的控制表达。这类载体还编码核酸分子片段, 其被可操作连接到编码本发明上述 Leloir 途径酶或重组蛋白的核酸分子。在本发明上下 文中, 可操作连接意思是这类片段可以作用于编码上述 Leloir 途径酶或重组蛋白的核酸 分子的表达。这些核酸序列包括启动子、 增强子、 上游控制元件、 转录因子或抑制子结合位 点、 终止信号和可以在预期的宿主细胞中控制基因表达的其它元件。 优选载体是载体、 细菌 噬菌体、 黏粒或病毒。
     本发明的表达载体在酵母或哺乳动物细胞中发挥功能。酵母载体可以包括酵母 2μ 环及其衍生物, 编码酵母自我复制序列的酵母载体, 酵母小染色体, 任意酵母整合载体 等。多种类型酵母载体的详细列表在 Parent 等人 (Yeast 1 : 83-138(1985)) 中提供。
     能够作用于基因产物的表达的元件或核酸序列包括启动子、 增强子元件、 上游激 活序列、 转录终止信号和多聚腺苷酸位点。所有这类启动子和转录调节元件, 单独或组合,被预期用于本发明的表达载体中。另外, 基因 - 工程化的和突变的调节序列还在本文中的 预期。
     启动子是用于控制基因表达的 DNA 序列元件。具体地, 启动子确定转录起始位点 并可以包括 TATA 盒和上游启动子元件。选择的启动子是期望在选择的具体宿主系统中可 操纵的那些。例如, 当利用酵母宿主细胞例如酿酒酵母、 乳酸克鲁维酵母或巴斯德毕赤酵 母时, 酵母启动子用于本发明的表达载体, 而真菌启动子将用于宿主细胞例如黑曲霉、 粗糙 脉胞菌或里氏木霉。酵母启动子的实例包括但不限于 GAPDH, AOX1, SEC4, HH1, PMA1, OCH1, GAL1, PGK, GAP, TPI, CYC1, ADH2, PHO5, CUP1, MFα1, FLD1, PMA1, PDI, TEF 和 GUT1 启动子。 Romanos 等人 (Yeast 8 : 423-488(1992)) 提供了酵母启动子和表达载体的综述。Hartner 等人, Nucl.Acid Res.36 : e76( 于 2008 年 6 月 6 日在线出版 ) 描述了用于巴斯德毕赤酵母 中异源蛋白精确调节表达的启动子文库。
     可操作连接本文公开的核酸分子的启动子可以是组成型启动子和诱导型启动子。 诱导型启动子是结合转录因子后以增加或降低的速率引导转录的启动子。 如本文所用的转 录因子包括可以结合启动子的调节或控制区并因而影响转录的任意因子。 在宿主细胞中转 录因子的合成或启动子结合能力可以通过将宿主暴露于诱导物或将诱导物从宿主细胞培 养基中去除来控制。 因此, 为了调节诱导型启动子的表达, 将诱导物添加或从宿主细胞的生 长培养基中去除。这类诱导物可以包括糖、 磷酸、 醇、 金属离子、 激素、 热、 冷等。例如, 在酵 母中常用诱导物是葡萄糖、 半乳糖等。
     选择的转录终止序列是在选择的具体宿主系统中可操纵的那些。例如, 当利用酵 母宿主细胞例如酿酒酵母、 乳酸克鲁维酵母或巴斯德毕赤酵母时, 酵母转录终止序列用于 本发明的表达载体, 而真菌转录终止序列将用于宿主细胞例如黑曲霉、 粗糙脉胞菌或里氏 木霉。转录终止序列包括但不限于酿酒酵母 CYC 转录终止序列 (ScCYC TT)、 巴斯德毕赤酵 母 ALG3 转录终止序列 (ALG3 TT)、 巴斯德毕赤酵母 ALG6 转录终止序列 (ALG6 TT)、 巴斯德毕 赤酵母 ALG12 转录终止序列 (ALG12 TT)、 巴斯德毕赤酵母 AOX1 转录终止序列 (AOX1 TT)、 巴 斯德毕赤酵母 OCH1 转录终止序列 (OCH1 TT) 和巴斯德毕赤酵母 PMA1 转录终止序列 (PMA1 TT)。
     本发明的表达载体还可编码选择标记。选择标记是基因功能物, 其赋予宿主细胞 可鉴定的性状以使用携带选择标记的载体转化的细胞可以与非转化的细胞区分。 载体中包 含选择标记还可用于确保连接到标记的基因功能物保留在宿主细胞群体中。 这类选择标记 可以赋予任意容易鉴定的显性性状, 例如药物抗性、 合成或代谢细胞营养物的能力等。
     酵母选择标记包括药物抗性标记和基因功能物, 其允许酵母宿主细胞合成基本 的细胞营养物, 例如氨基酸。常用于酵母的药物抗性标记包括氯霉素、 卡那霉素、 甲氨蝶 呤、 G418( 遗传霉素 )、 博莱霉素等。允许酵母宿主细胞合基本的细胞营养物的基因功能物 与在相应基因组功能中具有营养缺陷型突变的可利用的酵母菌株一起使用。常见酵母选 择标记提供用于合成亮氨酸 (LEU2)、 色氨酸 (TRP1 和 TRP2)、 尿嘧啶 (URA3, URA5, URA6)、 组氨酸 (HIS3)、 赖氨酸 (LYS2)、 腺嘌呤 (ADE1 或 ADE2) 等的基因功能物。其他酵母选择 标记包括来自酿酒酵母的 ARR3 基因, 其赋予在亚砷酸盐存在下生长的酵母细胞亚砷酸 盐 抗 性 (Bobrowicz 等 人, Yeast, 13 : 819-828(1997) ; Wysocki 等 人, J.Biol.Chem.272 : 30061-30066(1997))。大量合适的整合位点包括美国公开的申请号 2007/0072262 中列举的那些并包括与已知酿酒酵母和其它酵母或真菌的基因座的同源物。 用于将载体整合至酵 母的方法是熟知的, 例如, 参见 WO2007136865。
     因此, 本发明表达载体可以编码选择标记, 其用于在存在于培养物中的细胞群体 中鉴定和维持含有载体的宿主细胞。在一些环境下, 选择标记还可用于扩增表达载体的拷 贝数。在诱导来自本发明表达载体的转录以产生编码过表达的重组蛋白或 Leloir 途径酶 的 RNA 后, RNA 被细胞因子翻译以产生重组蛋白或 Leloir 途径酶。
     在酵母和其它真核细胞中, 通过核糖体结合 mRNA 的 5′帽和核糖体延 mRNA 移动至 第一个 AUG 起始密码子 ( 在此处多肽合成可以开始 ) 而启动信使 RNA(mRNA) 的翻译。在酵 母和哺乳动物细胞中的表达通常不需要核糖体 - 结合位点和起始密码子之间特定数量的 核苷酸 ( 如有时在原核表达系统中需要的 )。但是, 对于在酵母或哺乳动物宿主细胞中表 达, mRNA 中第一个 AUG 密码子优选是期望的翻译起始密码子。
     另外, 当表达在酵母宿主细胞中进行时, 长的非翻译引导序列例如长于 50-100 个 核苷酸的存在可以减弱 mRNA 的翻译。酵母 mRNA 引导序列具有约 50 个核苷酸的平均长度, 富含腺嘌呤, 具有较少的二级结构和几乎通常使用第一个 AUG 来起始。由于不具有这些特 征的引导序列可以降低蛋白翻译的效率, 酵母引导序列优选用于在酵母宿主细胞中过表达 的基因产物或分子伴侣蛋白的表达。 许多酵母引导序列的序列是本领域技术人员已知的和 可利用的, 例如, 参考 Cigan 等人 (Gene 59 : 1-18(1987)). 除了启动子、 核糖体 - 结合位点和起始密码子的位置, 可以影响得到的表达水平 的因素包括可复制的表达载体的拷贝数。 通常通过载体复制起点和与其关联的任意顺式作 用控制元件来确定载体的拷贝数。例如, 编码调节的着丝粒的酵母游离载体的拷贝数的增 加可通过诱导紧密排列至着丝粒的启动子的转录来获得。 另外, 在酵母载体中编码酵母 FLP 功能物还可增加载体的拷贝数。
     通过组合来自可利用的载体的 DNA 片段, 通过合成编码这类调节元件的核酸分子 或通过克隆新的调节元件并使新的调节元件位于该载体, 本领域技术人员还可容易地设计 和制备包括上述序列的表达载体。产生表达载体的方法是熟知的。过表达的 DNA 方法见于 种种关于基因工程的标准实验室手册中的任意。
     本发明的表达载体可以通过以适当的方法将上述 Leloir 途径酶和重组蛋白的编 码区连接到启动子和用于控制基因表达的其它序列元件上来制备。在该表达载体构建后, 这类载体被转化至宿主细胞, 其中可以表达过表达的重组蛋白和 Leloir 途径酶。用表达载 体转化酵母和其它低等真核细胞的方法是本领域技术人员熟知的和容易利用的。例如, 表 达载体可以通过几种方法包括醋酸锂、 原生质体、 电穿孔和类似方法中的任意被转化至酵 母细胞。
     宿主细胞
     酵母例如巴斯德毕赤酵母、 甲醇毕赤酵母和多形汉逊酵母可用于细胞培养, 因为 它们能够生长至高细胞密度和分泌大量重组蛋白。 同样, 丝状真菌例如黑曲霉、 镰孢菌属的 种、 粗糙脉胞菌等可用于以工业规模产生本发明的糖蛋白。 一般而言, 用于实践本文的方法 的低等真核细胞包括通常不能利用半乳糖作为碳源的酵母和真菌。 不能利用半乳糖作为碳 源的酵母的实例包括但不限于毕赤酵母属的甲基营养酵母, 例如巴斯德毕赤酵母, 和酵母, 例如 S.kudriavzevii、 C.glabrata、 K.waltii 和 E.gossypii。酵母可用于糖蛋白的表达,
     因为它们可以是较经济地培养, 提供高产量, 并且当适当修饰时, 能够合适的糖基化。酵母 特别提供了确定的遗传学, 允许快速转化、 测试蛋白定位策略和容易的基因敲除技术。 合适 的载体具有表达控制序列, 例如启动子, 包括 3- 磷酸甘油酸激酶或其他糖酵解酶, 以及复 制起点, 终止序列等, 如期望的。因此, 上述宿主细胞 ( 其不能通常利用半乳糖作为碳源 ) 已被基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷 酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性, 使得宿主细胞能够利用半乳糖作为碳 源。
     低等真核细胞, 特别是酵母, 还可被基因修饰以使它们表达糖蛋白, 其中糖基化模 式是人样或人源化的。这可通过如 Gerngross 等人, 美国公开的申请号 2004/0018590 所述 去除选择的内源糖基化酶和 / 或提供外源酶来获得。例如, 宿主细胞可以被选择或工程化 为缺乏 1, 6- 甘露糖基转移酶活性, 其将另外添加甘露糖残基至糖蛋白的 N- 聚糖上。
     在一个实施方案中, 如本文所述被基因工程化为同化环境半乳糖作为碳源的宿主 细胞还如下所述被基因工程化为产生复合 N- 聚糖。这类宿主细胞另外包括 α1, 2- 甘露糖 苷酶催化结构域 ( 其融合至通常不与催化结构域结合的细胞靶向信号肽并被选择将 α1, 2- 甘露糖苷酶活性靶向宿主细胞的 ER 或高尔基体 )。重组糖蛋白经过宿主细胞的 ER 或 高尔基体产生包含 Man5GlcNAc2 糖形的重组糖蛋白, 例如包含主要 Man5GlcNAc2 糖形的重组 糖蛋白组合物。例如, 美国专利号 7,029,872 和美国公开的专利申请号 2004/0018590 和 2005/0170452 公开了能够产生包含 Man5GlcNAc2 糖形的糖蛋白的低等真核生物宿主细胞。 这些宿主细胞当进一步如本文所教导的被基因工程化为表达半乳糖激酶活性、 UDP- 半乳 糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性 时, 能够利用半乳糖作为碳源。
     紧接前述宿主细胞另外包括 GlcNAc 转移酶 I(GnT I) 催化结构域 ( 其融合至通常 不与催化结构域结合的细胞靶向信号肽并被选择将 GlcNAc 转移酶 I 活性靶向宿主细胞的 ER 或高尔基体 )。重组糖蛋白经过宿主细胞的 ER 或高尔基体产生包含 GlcNAcMan5GlcNAc2 糖形的重组糖蛋白, 例如包含主要 GlcNAcMan5GlcNAc2 糖形的重组糖蛋白组合物。美国专 利号 7,029,872 和美国公开的专利申请号 2004/0018590 和 2005/0170452 公开了能够产生 包含 GlcNAcMan5GlcNAc2 的糖蛋白的低等真核生物宿主细胞。上述细胞产生的糖蛋白可以 体外用氨基己糖苷酶处理以产生包含 Man5GlcNAc2 糖形的重组糖蛋白。这些宿主细胞当进 一步如本文所教导的被基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活 性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性时, 能够利用半乳糖 作为碳源。
     然后, 紧接前述宿主细胞另外包括甘露糖苷酶 II 催化结构域 ( 其融合至通常不与 催化结构域结合的细胞靶向信号肽并被选择将甘露糖苷酶 II 活性靶向宿主细胞的 ER 或 高尔基体 )。重组糖蛋白经过宿主细胞的 ER 或高尔基体产生包含 GlcNAcMan3GlcNAc2 糖形 的重组糖蛋白, 例如包含主要 GlcNAcMan3GlcNAc2 糖形的重组糖蛋白组合物。美国专利号 7,029,872 和美国公开的专利申请号 2004/0230042 公开了表达甘露糖苷酶 II 酶和能够生 产糖蛋白具有主要 GlcNAc2Man3GlcNAc2 糖形的低等真核生物宿主细胞。上述细胞产生的糖 蛋白可以体外用氨基己糖苷酶处理以产生包含 Man3GlcNAc2 糖形的重组糖蛋白。这些宿主 细胞当进一步如本文所教导的被基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性时, 能够利 用半乳糖作为碳源。
     然后, 紧接前述宿主细胞另外包括 GlcNAc 转移酶 II(GnT II) 催化结构域 ( 其 融合至通常不与催化结构域结合的细胞靶向信号肽并被选择将 the GlcNAc 转移酶 II 活 性靶向宿主细胞的 ER 或高尔基体 )。重组糖蛋白经过宿主细胞的 ER 或高尔基体产生包 含 GlcNAc2Man3GlcNAc2(G0) 糖形的重组糖蛋白, 例如包含主要 GlcNAc2Man3GlcNAc2 糖形的 重组糖蛋白组合物。美国专利号 7,029,872 和美国公开的专利申请号 2004/0018590 和 2005/0170452 公开了能够产生包含 GlcNAc2Man3GlcNAc2 糖形的糖蛋白的低等真核生物宿 主细胞。上述细胞产生的糖蛋白可以体外用氨基己糖苷酶处理以产生包含 Man3GlcNAc2 糖 形的重组糖蛋白。 这些宿主细胞当进一步如本文所教导的被基因工程化为表达半乳糖激酶 活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半 乳糖通透酶活性时, 能够利用半乳糖作为碳源。
     最 后, 紧接前述宿主细胞另外包括半乳糖基转移酶催化结构域 ( 其融合至 通常不与催化结构域结合的细胞靶向信号肽并被选择将半乳糖基转移酶活性靶向 宿 主 细 胞 的 ER 或 高 尔 基 体 )。 重 组 糖 蛋 白 经 过 宿 主 细 胞 的 ER 或 高 尔 基 体 产 生 包 含 GalGlcNAc2Man3GlcNAc2(G1) 或 Gal2GlcNAc2Man3GlcNAc2(G2) 糖 形 或 其 混 合 物 的 重 组 糖 蛋 白, 例 如 包 含 主 要 GalGlcNAc2Man3GlcNAc2(G1) 糖 形 或 Gal2GlcNAc2Man3GlcNAc2(G2) 糖 形或其混合物的重组糖蛋白组合物。美国专利号 7,029,872 和美国公开的专利申请 号 2006/0040353 公 开 了 能 够 产 生 包 含 Gal2GlcNAc2Man3GlcNAc2 糖 形 的 糖 蛋 白 的 低 等 真核生物宿主细胞。上述细胞产生的糖蛋白可以体外用半乳糖苷酶处理以产生包含 GlcNAc2Man3GlcNAc2 糖形的重组糖蛋白, 例如包含主要 GlcNAc2Man3GlcNAc2 糖形的重组糖蛋 白组合物。这些宿主细胞当进一步如本文所教导的被基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通 透酶活性时, 能够利用半乳糖作为碳源并能够生产这样的糖蛋白, 其中含有半乳糖的 N- 聚 糖的比例大于未被基因工程化为包括上述 Leloir 途径酶的宿主细胞中的比例。
     在另一实施方案中, 紧接前述宿主细胞 ( 其如本文所公开的能够产生具有半乳糖 末端的复合 N- 聚糖并能够同化半乳糖作为碳源 ) 可另外包括唾液酸转移酶催化结构域 ( 其融合至通常不与催化结构域结合的细胞靶向信号肽并被选择将唾液酸转移酶活性靶向 宿主细胞的 ER 或高尔基体 )。重组糖蛋白经过宿主细胞的 ER 或高尔基体产生包含主要 NANA2Gal2GlcNAc2Man3GlcNAc2 糖形或 NANAGal2GlcNAc2Man3GlcNAc2 糖形或其混合物的重组 糖蛋白。对于低等真核生物宿主细胞例如酵母和丝状真菌, 有用的是宿主细胞另外包括提 供 CMP- 唾液酸用于转移至 N- 聚糖的方法。美国公开的专利申请号 2005/0260729 公开了 基因工程化低等真核细胞以具有 CMP- 唾液酸合成途径的方法, 和美国公开的专利申请号 2006/0286637 公开了基因工程化低等真核细胞以产生唾液酸化的糖蛋白的方法。 这些宿主 细胞当进一步如本文所教导的被基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差向 异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性时, 能够利 用半乳糖作为碳源并能够生产这样的糖蛋白, 其中含有半乳糖的 N- 聚糖的比例大于未被 基因工程化为包括上述 Leloir 途径酶的宿主细胞中的比例。
     在另一实施方案中, 产生主要具有 GlcNAcMan5GlcNAc2 N- 聚糖的糖蛋白的宿主细胞另外包括半乳糖基转移酶催化结构域 ( 其融合至通常不与催化结构域结合的细胞靶向 信号肽并被选择将半乳糖基转移酶活性靶向宿主细胞的 ER 或高尔基体 )。 重组糖蛋白经过 宿主细胞的 ER 或高尔基体产生包含主要 GalGlcNAcMan5GlcNAc2 糖形的重组糖蛋白。 这些宿 主细胞当进一步如本文所教导的被基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差 向异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性时, 能够 利用半乳糖作为碳源。
     在另一实施方案中, 紧接前述宿主细胞 ( 其如本文所公开的能够产生具有半乳 糖末端的杂合 N- 聚糖并能够同化半乳糖作为碳源 ) 可另外包括唾液酸转移酶催化结构 域 ( 其融合至通常不与催化结构域结合的细胞靶向信号肽并被选择将唾液酸转移酶活性 靶向宿主细胞的 ER 或高尔基体 )。重组糖蛋白经过宿主细胞的 ER 或高尔基体产生包含 NANAGalGlcNAcMan5GlcNAc2 糖形的重组糖蛋白。这些宿主细胞当进一步如本文所教导的被 基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿 苷酰转移酶活性以及任选地半乳糖通透酶活性时, 能够利用半乳糖作为碳源。
     多种前述宿主细胞另外包括一个或多个糖转运蛋白, 例如 UDP-GlcNAc 转运蛋白 ( 例如乳酸克鲁维酵母和小家鼠 (Mus musculus)UDP-GlcNAc 转运蛋白 )、 UDP- 半乳糖转运 蛋白 ( 例如黑腹果蝇 UDP- 半乳糖转运蛋白 ) 和 CMP- 唾液酸转运蛋白 ( 例如人唾液酸转运 蛋白 )。 因为低等真核生物宿主细胞例如酵母和丝状真菌缺乏上述转运蛋白, 优选的是低等 真核生物宿主细胞例如酵母和丝状真菌被基因工程化为包括上述转运蛋白。
     宿主细胞另外包括这样的细胞, 其通过删除或破坏一个或多个 β- 甘露糖基转移 酶基因 ( 例如 BMT1, BMT2, BMT3 和 BMT4) 被基因工程化为消除具有 α- 甘露糖苷酶 - 抗性 的 N- 聚糖的糖蛋白 ( 参见, 美国公开的专利申请号 2006/0211085) 和通过删除或破坏磷酸 甘露糖基转移酶基因 PNO1 和 MNN4B 之一或二者被基因工程化为消除具有磷酸甘露糖残基 的糖蛋白 ( 参见例如, 美国专利号 7,198,921 和 7,259,007), 在另外的方面, 还可包括删除 或破坏 MNN4A 基因。破坏包括破坏编码特定酶的开放读码框或利用干扰 RNA、 反义 RNA 或 类似物破坏编码一种或多种 β- 甘露糖基转移酶和 / 或磷酸甘露糖基转移酶的开放读码框 的表达或消除编码一种或多种 β- 甘露糖基转移酶和 / 或磷酸甘露糖基转移酶的 RNA 的翻 译。宿主细胞可另外包括任意一种修饰为产生特定 N- 聚糖结构的前述宿主细胞。
     宿主细胞另外包括这样的低等真核细胞 ( 例如酵母例如巴斯德毕赤酵母 ), 其通 过删除或破坏一个或多个蛋白 O- 甘露糖基转移酶 (Dol-P-Man : 蛋白 (Ser/Thr) 甘露糖基 转移酶基因 )(PMT) 被基因修饰以控制糖蛋白的 O- 糖基化 ( 参见美国专利号 5,714,377) 或如公开的国际申请号 WO 2007061631 中公开的在 Pmtp 抑制剂和 / 或 α- 甘露糖苷酶存 在下生长, 或二者。 破坏包括破坏编码 Pmtp 的开放读码框或利用干扰 RNA、 反义 RNA 或类似 物破坏编码一个或多个 Pmtp 的开放读码框的表达或消除编码一个或多个 Pmtp 的 RNA 的翻 译。宿主细胞可另外包括任意一种修饰为产生特定 N- 聚糖结构的前述宿主细胞。
     Pmtp 抑制剂包括但不限于苯亚甲基噻唑烷二酮类。 可以利用的苯亚甲基噻唑烷二 酮的实例是 5-[[3, 4- 双 ( 苯基甲氧基 ) 苯基 ] 亚甲基 ]-4- 氧代 -2- 硫代 -3- 噻唑烷乙酸 ; 5-[[3-(1- 苯基乙氧基 )-4-(2- 苯基乙氧基 )] 苯基 ] 亚甲基 ]-4- 氧代 -2- 硫代 -3- 噻唑 烷乙酸和 5-[[3-(1- 苯基 -2- 羟基 ) 乙氧基 )-4-(2- 苯基乙氧基 )] 苯基 ] 亚甲基 ]-4- 氧 代 -2- 硫代 -3- 噻唑烷乙酸 .在具体实施方案中, 至少一个内源 PMT 基因的功能或表达被降低、 破坏或缺失。例 如, 在具体的实施方案中, 至少一个选自 PMT1、 PMT2、 PMT3 和 PMT4 基因的内源 PMT 基因的功 能或表达被降低、 破坏或缺失 ; 或在一个或多个 PMT 抑制剂存在下培养宿主细胞。 在另外的 实施方案中, 宿主细胞包括一个或多个 PMT 基因缺失或破坏以及在一个或多个 Pmtp 抑制剂 存在下培养宿主细胞。在这些实施方案的具体方面, 宿主细胞还表达分泌的 α-1, 2- 甘露 糖苷酶。
     PMT 缺失或破坏和 / 或 Pmtp 抑制剂通过降低 O- 糖基化占据 (occupancy) 即通过 降低在糖蛋白上被糖基化的 O- 糖基化位点的总数来控制 O- 糖基化。进一步添加细胞分泌 的 α-1, 2- 甘露糖苷酶降低糖蛋白上 O- 聚糖的甘露糖链长度来控制 O- 糖基化。因此, 将 PMT 缺失或破坏和 / 或 Pmtp 抑制剂与分泌的 α-1, 2- 甘露糖苷酶的表达组合通过降低占据 和链长度来控制 O- 糖基化。在具体的情况中, 确定 PMT 缺失或破坏、 Pmtp 抑制剂和 α-1, 2- 甘露糖苷酶的具体组合, 经验上是因为具体的异源糖蛋白 ( 例如 Fab 和抗体 ) 可通过 具有不同效率程度的高尔基体被表达和转运, 因此可需要 PMT 缺失或破坏、 Pmtp 抑制剂和 α-1, 2- 甘露糖苷酶的具体组合。 在另一方面, 编码一个或多个内源甘露糖基转移酶的基因 被缺失。该缺失可以与提供分泌的 α-1, 2- 甘露糖苷酶和 / 或 PMT 抑制剂组合或可以代替 提供分泌的 α-1, 2- 甘露糖苷酶和 / 或 PMT 抑制剂。
     因此, O- 糖基化的控制可以用于在本文公开的宿主细胞中以更高的总产量或适当 组装的糖蛋白的产量生产具体糖蛋白。 O- 糖基化的降低或消除看起来具有组装和转运完整 抗体和 Fab 片段的优势效果, 因为它们穿越分泌途径和被转运至细胞表面。因此, 在 O- 糖 基化被控制的细胞中, 适当组装的抗体或 Fab 片段的产率比在 O- 糖基化未被控制的宿主细 胞中得到的产率增加。
     因 此, 预 期 的 是 已 被 基 因 修 饰 的 宿 主 细 胞, 以 产 生 糖 蛋 白, 其中在糖蛋白上 的 主 要 N- 聚 糖 包 括 但 不 限 于 Man8GlcNAc2、 Man7GlcNAc2、 Man6GlcNAc2、 Man5GlcNAc2、 GlcNAcMan5GlcNAc2、 GalGlcNAcMan5GlcNAc2、 NANAGalGlcNAcMan5GlcNAc2、 Man3GlcNAc2、 GlcNAc (1-4) Man 2 GlcNAc 2 、Gal (1-4) GlcNAc (1-4) Man 3 GlcNAc 2 、NANA (1-4) Gal (1-4) GlcNAc (1-4) Man3GlcNAc2。 另外包括的是这样的宿主细胞, 其产生具有前述 N- 聚糖的具体混合物的糖蛋 白。
     本文中的宿主细胞和方法用于产生广泛的重组蛋白和糖蛋白。 可以在本文公开的 宿主细胞中产生的重组蛋白和糖蛋白的实例包括但不限于红细胞生成素 (EPO), 细胞因子 例如干扰素 α、 干扰素 β、 干扰素 γ 和干扰素 ω, 和粒细胞集落刺激因子 (GCSF), GM-CSF, 凝固因子例如因子 VIII、 因子 IX 和人蛋白 C, 抗凝血酶 III, 凝血酶, 可溶性 IgE 受体 α- 链, 免疫球蛋白例如 IgG、 IgG 片段、 IgG 融合体和 IgM, 免疫粘附素和其它 Fc 融合蛋白例如可 溶性 TNF 受体 -Fc 融合蛋白, RAGE-Fc 融合蛋白, 白细胞介素, 尿激酶, 糜蛋白酶和尿胰蛋白 酶抑制剂, IGF- 结合蛋白, 表皮生长因子, 生长激素释放因子, 膜联蛋白 V 融合蛋白, 制管张 素, 血管内皮生长因子 -2, 骨髓样前体抑制因子 -1, 骨保护蛋白, α-1- 抗胰蛋白酶, 甲胎蛋 白, DNA 酶 II, 人纤溶酶原的三环 3, 葡糖脑苷脂酶, TNF 结合蛋白 1, 促卵泡激素, 细胞毒性 T 淋巴细胞相关抗原 4-Ig, 跨膜激活剂和钙调节剂和亲环蛋白配体, 胰高血糖素样蛋白 1 和 IL-2 受体激动剂。
     本文公开的本发明的重组宿主细胞特别用于生产抗体、 Fc 融合蛋白等, 期望的是与在进行如本文所教导的修饰之前的宿主细胞中获得的抗体组合物的半乳糖百分比相比, 在重组宿主细胞中提供增加的含有半乳糖的 N- 聚糖的百分比的抗体组合物。一般而言, 宿 主细胞能够使得这样的抗体组合物产生, 其中所述 G0 ∶ G1/G2 糖形的比值小于 2 ∶ 1。可 以在本文中的宿主细胞中产生并具有 G0 ∶ G1/G2 的比值小于 2 ∶ 1 的抗体的实例包括但不 限于人抗体、 人源化的抗体、 嵌合抗体、 重链抗体 ( 例如骆驼 (camel 或 llama))。具体抗体 包括但不限于以其通用名称 ( 靶 ) 引用的以下抗体 : 莫罗单抗 -CD3( 抗 -CD3 受体抗体 )、 阿 昔单抗 ( 抗 -CD417E3 抗体 )、 利妥昔单抗 ( 抗 -CD20 抗体 )、 达珠单抗 ( 抗 -CD25 抗体 )、 巴 利昔单抗 ( 抗 -CD25 抗体 )、 帕利珠单抗 ( 抗 -RSV( 呼吸道合胞病毒 ) 抗体 )、 英夫利昔单 抗 ( 抗 -TNFα 抗体 )、 曲妥珠单抗 ( 抗 -Her2 抗体 )、 吉姆单抗奥佐米星 ( 抗 -CD33 抗体 )、 阿仑单抗 ( 抗 -CD52 抗体 )、 替伊莫单抗 ( 抗 -CD20 抗体 )、 阿达木单抗 ( 抗 -TNFα 抗体 )、 131 奥马珠单抗 ( 抗 -IgE 抗体 )、 托西莫单抗 - I( 抗 -CD20 抗体的碘化的衍生物 )、 依法利珠 单抗 ( 抗 -CD11a 抗体 )、 西妥昔单抗 ( 抗 -EGF 受体抗体 )、 戈利木单抗 ( 抗 -TNFα 抗体 )、 贝伐单抗 ( 抗 VEGF-A 抗体 ) 及其变体。可以在本文中的宿主细胞中产生的 Fc- 融合蛋白 的实例包括但不限于依那西普 (TNFR-Fc 融合蛋白 )、 FGF-21-Fc 融合蛋白、 GLP-1-Fc 融合 蛋白、 RAGE-Fc 融合蛋白、 EPO-Fc 融合蛋白、 ActRIIA-Fc 融合蛋白、 ActRIIB-Fc 融合蛋白、 胰高血糖素 -Fc 融合物、 泌酸调节肽 -Fc- 融合物及其类似物和变体。 本文公开的重组细胞可用于产生适合于化学缀合异源的肽或药物分子的抗体和 Fc 片段。例如 WO2005047334、 WO2005047336、 WO2005047337 和 WO2006107124 公开了将肽 或药物分子与 Fc 片段化学缀合。EP1180121、 EP1105409 和 US6593295 公开了将血液组分 与肽等化学缀合, 其包括完整抗体。
     如本文所教导的宿主细胞和 / 或编码 Leloir 途径酶的多种组合的质粒载体可以 作为试剂盒提供, 其提供用于产生表达异源蛋白的重组巴斯德毕赤酵母的选择系统。巴斯 德毕赤酵母宿主细胞被基因工程化为表达选自半乳糖激酶、 UDP- 半乳糖 -4- 差向异构酶和 半乳糖 -1- 磷酸尿苷酰转移酶的 Leloir 途径酶中的一种或两种。任选地, 宿主细胞也可表 达半乳糖通透酶。克隆载体包括多克隆位点和编码宿主细胞中未提供的 Leloir 途径酶的 表达盒。载体可另外包括在多克隆位点两侧的巴斯德毕赤酵母可操纵的启动子和转录终 止序列以及可另外包括用于将载体靶向到宿主细胞基因组中的具体位置的靶向序列。在 一些实施方案中, 试剂盒提供这样的载体, 其编码所有三个 Leloir 途径酶 ( 半乳糖激酶、 UDP- 半乳糖 -4- 差向异构酶和半乳糖 -1- 磷酸尿苷酰转移酶 ) 和包括多克隆位点和缺乏三 种 Leloir 途径酶的宿主细胞。试剂盒应另外包括说明书、 载体图谱等。
     以下实施例意图是促进对本发明的进一步理解。
     实施例 1
     在该实施例中, 通常根据 Davidson 等人在美国公开的申请号 2006/0040353 中公 开的方法构建能够产生含有半乳糖的 N- 聚糖的巴斯德毕赤酵母宿主细胞。本文的方法可 用于将其他物种的通常不能利用半乳糖作为碳源的重组宿主细胞变成能够利用半乳糖作 为单一碳源的重组宿主细胞。
     半 乳 糖 基 转 移 酶 I 嵌 合 酶。 利 用 PCR 引 物 RCD192(5’ -GCCGCGACCTGAGCC GCCTGCCCCAAC-3’ (SEQ ID NO : 1)) 和 RCD186(5’ -CTAGCTCGGTGTCCCGATGTCCACTGT-3’ (SEQ ID NO : 2)) 从人肾脏 cDNA(Clontech)PCR 扩增智人 (Homo sapiens)β-1, 4- 半乳糖基转移
     酶 I 基因 (hGalTI, Genbank AH003575)。该 PCR 产物被克隆至 pCR2.1 载体 (Invitrogen) 并测序。从该克隆进行 PCR 重叠突变发生用于三个目的 : 1) 去除开放读码框内的 NotI 位 点同时维持野生型蛋白序列, 2) 在内源跨膜结构域的立即下游截短蛋白以仅提供催化结构 域和 3) 在 5’ 和 3’ 端分别引入 AscI 和 PacI 位点用于克隆。为了进行 PCR 重叠突变发生, 利用 PCR 引物 RCD198(5’ -CTTAGGCGCGCCGGCCGCGACCTGAGCCGCCTGCCC-3’ (SEQ ID NO : 3)) 和 RCD201(5’ -GGGGCATATCTGCCGCCCATC-3’ (SEQ ID NO : 4))PCR 扩增基因的 5’ 端直至 NotI 位点和利用 PCR 引物 RCD200(5’ -GATGGGCGGCAGATATGCCCC-3’ (SEQ ID NO : 5)) 和 RCD199( 5’ -CTTCTTAATTAACTAGCTCGGTGTCCCGATGTCCAC-3’ (SEQ ID NO : 6))PCR 扩增 3’ 端。用引物 RCD198 和 RCD199 将产物在一起重叠以重合成具有野生型氨基酸序列同时去除 NotI 位点的 截短的编码半乳糖基转移酶的开放读码框 (ORF)。新的 hGalTIβPCR 催化结构域产物被克 隆至 pCR2.1 载体 (Invitrogen, Carlsbad, CA) 并测序。引入的 AscI 和 PacI 位点用它们 识别的限制酶切割并将 DNA 片段亚克隆进质粒 pRCD259 的 PpGAPDH 启动子下游以产生质粒 pRCD260。编码 hGalTI43 催化结构域 ( 缺乏最先的 43 个氨基酸 ; SEQ ID NO : 50) 的核苷酸 序列显示于 SEQ ID NO : 49。
     来自酿酒酵母、 巴斯德毕赤酵母和乳酸克鲁维酵母的将蛋白靶向到高尔基体中的 各种位置的酵母引导序列文库被连接到该载体 NotI 和 AscI 位点之间, 从而将这些引导 编码序列符合读框地与编码 hGalTIβ43 催化结构域的开放读码框融合。上述 GalT 融合 蛋白的组合文库在 YSH44 中表达并通过从来自各个转化子的纯化的 K3 释放 N- 聚糖和用 MALDI-TOF MS 测定它们各自分子量分析得到的转化子。 巴斯德毕赤酵母菌株 YSH44 表达人 纤溶酶原的三环 3 结构域 (K3), 其为实质上均一的具有双触角末端 GlcNAc 残基的复合糖形 (GlcNAc2Man3GlcNAc2, 参见图 1)。活性构建体之一是 Mnn2-hGalTIβ43, 其编码融合蛋白, 所述融合蛋白包含酿酒酵母 Mnn2 靶向肽的的 N- 末端 ( 氨基酸 1-36(53)SEQ ID NO : 20) 融 合至 hGalTIβ43 催化结构域的 N- 末端 ( 氨基酸 44-398 ; SEQ ID NO : 50)。引导序列含有 酿酒酵母 MNN2 基因最先的 108bp 并且该序列确实已被插入 pRCD260 的 NotI 和 AscI 位点 之间以产生质粒 pXB53。用 XbaI 线性化质粒 pXB53 并转化至酵母菌株 YSH44 以产生菌株 YSH71。菌株 YSH44 已描述在美国公开的申请号 20070037248、 20060040353、 20050208617 和 20040230042 中以及菌株 YSH71 已描述在美国公开的申请号 20060040353 中。
     如 图 3C 所 示, 菌 株 YSH71 产 生 的 一 小 部 分 ( 约 10 % )N- 聚 糖 具 有 与 单 个 半 乳 糖 添 加 到 K3 上 的 GlcNAc2Man3GlcNAc2(G0)N- 聚 糖 底 物 一 致 的 质 量 以 产 生 而其余的 N- 聚糖与母本菌株 YSH44 产生的 N- 聚糖相 GalGlcNAc2Man3GlcNAc2(G1)N- 聚糖, 同 ( 图 3B)。图 3A 显示野生型酵母中产生的 N- 聚糖。
     我们认为对于不完全的半乳糖转移存在几种解释。这些解释包括较差的 UDP- 半 乳 糖 转 运、 较 低 的 内 源 水 平 UDP- 半 乳 糖 或 亚 最 适 的 (suboptimal)GalT 活 性。 看 起 来 半乳糖转移到 N- 聚糖上可能较低, 因为菌株可能需要转运蛋白以将 UDP- 半乳糖从细 胞 质 转 位 至 高 尔 基 体 (Ishida 等 人, J.Biochem.120 : 1074-1078(1996) ; Miura 等 人, J.Biochem(Tokyo)120 : 236-241(1996) ; Tabuchi 等 人, Biochem.Biophys.Res.Com.232 : 121-125(1997) ; Segawa 等人, FEBS Letts.451 : 295-298(1999))。转运蛋白是具有多个 跨膜结构域的复合蛋白, 其可以不适当地定位于异源宿主。但是, 几种糖核苷酸转运蛋 白, 包括 UDP- 半乳糖转运蛋白已在异源系统中活跃表达 (Sun-Wada 等人, J.Biochem.(Tokyo)123 : 912-917(1998) ; Segawa 等 人 Eur.J.Biochem.269 : 128-138(2002) ; Kainuma 等 人, Glycobiol.9 : 133-141(1999) ; Choi 等 人, Proc Natl Acad Sci U S A 100(9) : 5022-5027(2003))。为确保 UDP- 半乳糖有效转运至高尔基体, 编码 UDP- 半乳糖转运蛋 白的黑腹果蝇基因 DmUGT(GenBank 登记号 AB055493) 被克隆并将该克隆如下转化至表达 MNN2-hGalTIβ43 构建体的菌株 YSH71。
     UDP- 半乳糖转运蛋白的克隆。利用 PCR 引物 DmUGT-5’ (5’ -GGCTCGAGCGGCCGCCA CCATGAATAGCATACACATGAACGCCAATACG-3’ (SEQ ID NO : 7)) 和 DmUGT-3’ (5’ -CCCTCGAGTTAA TTAACTAGACGCGCGGCAGCAGCTTCTCCTCATCG-3’ (SEQ ID NO : 8)), 从黑腹果蝇 cDNA 文库 (UC Berkeley Drosophila 基因组 Project, 卵巢 λ-ZAP 文库 GM)PCR 扩增编码 UDP 半乳糖转运 蛋白的黑腹果蝇基因 (GenBank AB055493), 称为 DmUGT, 并将 PCR 扩增的 DNA 片段克隆至 pCR2.1(Invitrogen, Carlsbad, CA) 并测序。然后利用 NotI 和 PacI 位点将该开放读码框 亚克隆至质粒 pRCD393 的 PpOCH1 启动子下游 NotI 和 PacI 位点之间以产生质粒 pSH263。 编码 DmUGT 的核苷酸序列显示于 SEQ ID NO : 37 和 DmUGT 的氨基酸序列显示于 SEQ ID NO : 38。将该质粒用 AgeI 线性化并转化至菌株 YSH71 以产生菌株 YSH80。但是, 当编码 DmUGT 的质粒被转化至 YSH71 时, 发现 K3 的 N- 聚糖分布情况没有显著变化。因此, 我们决定将精 力集中于增强 UDP- 半乳糖细胞内库 (pool)。
     因为巴斯德毕赤酵母不能同化半乳糖作为碳源 (Kurtzman Pichia.The Yeasts : A Taxonomic Study.C.P.a.F.Kurtzman, J.W.Amsterdam, Elsevier Science Publ. : 273-352(1998)), 我们推测菌株中的 UDP- 半乳糖库可能不充分。在半乳糖同化生物包括 细菌和哺乳动物中保守的 UDP- 半乳糖 4- 差向异构酶催化 Leloir 途径的第三步。该酶通 常位于真核细胞的细胞质并负责 UDP- 葡萄糖和 UDP- 半乳糖的可逆转换 (Allard 等人, 细 胞 .Mol.Life Sci.58 : 1650-1665(2001))。我们推论异源 UDP- 半乳糖 4- 差向异构酶的表 达将产生细胞质 UDP- 半乳糖库, 去转运至高尔基体后, 将使得半乳糖转移酶将半乳糖转移 到 N- 聚糖上。
     UDP- 半 乳 糖 4- 差 向 异 构 酶 的 克 隆。 从 粟 酒 裂 殖 酵 母 (Schizosaccharomyces pombe) 克隆之前未表征的基因, 以下命名为 SpGALE, 其编码与已知的 UDP- 半乳糖 4- 差 向异构酶具有显著同一性的蛋白。利用 PCR 引物 GALE2-L(5’ -ATGACTGGTGTTCATGAAGGG -3’ (SEQ ID NO : 9)) 和 GALE2-R(5’ -TTACTTATA TGTCTTGGTATG-3’ ((SEQ ID NO : 10)), 从粟酒裂殖酵母 (ATCC24843) 基因组 DNA PCR 扩增编码预测的 UDP 半乳糖 -4- 差向异 构 酶 (GenBank NC_003423) 的 1.1Kb 粟 酒 裂 殖 酵 母 基 因, 称 为 SpGALE。PCR 扩 增 的 产 物 被 克 隆 至 pCR2.1(Invitrogen, Carlsbad, CA) 并 测 序。 测 序 显示 在 +66 位 存 在 内 含 子 (175bp)。 为 了 消 除 内 含 子, 设 计 上 游 PCR 引 物 GD1(5’ -GCGGCCGCATGA CTGGTGTTCA TGAAGGGACT GTGTTGGTTACTGGCGGCGC TGGTTATATA GGTTCTCATA CGTGCGTTGTTTTGTTAGAA AA-3’ ((SEQ ID NO : 11)), 其具有 NotI 位点, 位于内含子上游第 66 个碱基处, 然后在内含 子之前 20 个碱基和下游 PCR 引物 GD2(5’ -TTAATTAATT ACTTATATGT CTTGGTATG-3’ ((SEQ ID NO : 12)) 具有 PacI 位点。利用引物 GD1 和 GD2 以从 pCR2.1 亚克隆扩增 SpGALE 内含 子缺少的基因并将产物再克隆至 pCR2.1 并测序。然后将 SpGALE 在 NotI 和 PacI 位点之 间分别亚克隆至质粒 pRCD402 和 pRCD403 以产生质粒 pRCD406(POCH1-SpGALE-CYC1TT) 和 pRCD407(PSEC4-SpGALE-CYC1TT)。这些质粒已在之前的美国公开的申请号 20060040353 中描述。编码不含内含子的 SpGALE 的核苷酸序列显示于 SEQ ID NO : 35 和氨基酸序列显示于 SEQ ID NO : 36。
     人 UDP 半乳糖 -4- 差向异构酶 (hGalE) 具有 SEQ ID NO : 48 所示的氨基酸序列, 其 由 SEQ ID NO : 47 所示的核苷酸序列编码。可以利用 hGalE 代替 SpGALE。
     双 GalT/ 半乳糖 -4- 差向异构酶构建体的构建。含有 ScMNN2-hGalTIβ43 融合基 因的质粒 pXB53 用 XhoI 线性化并用 T4DNA 聚合酶产生平端。然后用 XhoI 和 SphI 并将末 端用 T4DNA 聚合酶产生平端从质粒 pRCD406 去除 PPpOCH1SpGALE-CYC1TT 表达盒, 并将片段插 入上述 pXB53 质粒以产生质粒 pRCD425。将该质粒用 XbaI 线性化并转化至菌株 YSH44 以 产生菌株 RDP52, 其已在之前的美国公开的申请号 20060040353 中描述。通过 MALDI-TOF MS 分析从几种转化子分离的纯化的 K3 上的 N- 聚糖。如图 3D 所示, 发现相当比例的 N- 聚 糖已获得与两个 ( 约 20 % G2 : Gal2GlcNAc2Man3GlcNAc2) 或单个半乳糖部分 ( 约 40 % G1 : Gal1GlcNAc2Man3GlcNAc2) 添加到 G0(GlcNAc2Man3GlcNAc2) 底物上的一致的质量, 而其余的 N- 聚糖保持与 YSH44 母本中发现的质量没有改变 ( 图 3B), 即 G0。
     三 GalT/ 半乳糖 -4- 差向异构酶 /UDP 半乳糖转运蛋白构建体的构建。 通过用 SacI R 消化将含有 POCH1-DmUGT-CYC1TT 的 G418 质粒 pSH263 线性化并用 T4 DNA 聚合酶进行末端 平端化。通过用 XhoI 和 SphI 消化将 PSEC4-SpGALE-CYC1TT 表达盒从质粒 pRCD407 去除并用 T4 DNA 聚合酶进行末端平端化。 然后将平末端的 SpGALE 片段插入上述 pSH263 以产生质粒 pRCD446。通过用 BglII/BamHI 消化从质粒 pXB53 释放 PGAPDHScMNN2-hGalTIβ43-CYC1TT 表 达盒并用 T4 DNA 聚合酶进行末端平端化。 然后将平末端的 hGalTI-53 插入 pRCD446 的平端 的 EcoRI 位点以产生质粒 pRCD465, 其是含有 hGalTI-53、 SpGALE 和 DmUGT 的三 G418R 质粒。 用 AgeI 线性化质粒 pRCD465 并转化至菌株 YSH44 以产生菌株 RDP80, 其如美国公开的申请 号 20060040353 中描述的。通过 MALDI-TOF MS 分析从菌株产生的分泌的 K3 释放的 N- 聚 糖。发现 N- 聚糖具有定量添加两个半乳糖残基到 G0 底物上一致的质量以产生人半乳糖基 化、 双触角复合 N- 聚糖 G2(Gal2GlcNAc2Man3GlcNAc2)( 图 3E)。 该 N- 聚糖的体外 β- 半乳糖 苷酶消化产生对应于去除两个半乳糖残基的降低的质量, 得到 G0(GlcNAc2Man3GlcNAc2)( 图 3F)。
     另外, 在 CMP- 唾液酸存在下用大鼠 α-2, 6-N- 唾液酸转移酶体外处理从菌株 RDP80 纯化的 K3 产生几乎均一地转换成 NANA2Gal2GlcNAc2Man3GlcNAc2( 图 3G)。这些结果 表明通过 (1) 充分的细胞内 UDP- 半乳糖库的代谢工程, (2) 活性的和适当定位的 GalT 的 表达和 (3) 通过活性 UDP- 半乳糖转运蛋白的 UDP- 半乳糖至高尔基体的易位, 可获得在巴 斯德毕赤酵母产生的复合 N- 聚糖高效延伸。但是, 半乳糖转移的效率通过进一步包括将 Leloir 途径的酶引入宿主细胞来改进, 如实施例 2 所示。
     菌株和培养基。大肠杆菌菌株 TOP10 或 DH5α 用于重组 DNA 工作。来源于菌株 JC308(J.Cregg, Claremont, CA) 的巴斯德毕赤酵母菌株 YSH44(Hamilton 等人, Science 301 : 1244-1246(2003)) 用于产生多种酵母菌株。酵母菌株的转化通过如前报道的电穿孔 进行 (Cregg, 等人, Mol.Biotechnol.16 : 23-52(2000))。在室温在 96 孔板形式中进行蛋白 表达 ( 除了生物反应器实验 ), 使用缓冲的甘油 - 复合培养基 (BMGY), 由 1%酵母提取物, -5 2 %蛋白胨, 100mM 磷酸钾缓冲液, pH 6.0, 1.34 %酵母氮源, 4X10 %生物素和 1 %甘油组 成, 作为生长培养基 ; 以及缓冲的甲醇 - 复合培养基 (BMMY), 由 1%甲醇替代甘油的 BMGY 组成作为诱导培养基。YPD 是 1%酵母提取物、 2%蛋白胨、 2%葡萄糖和 2%琼脂。
     限 制 和 修 饰 酶 来 自 New England BioLabs(Beverly, MA)。 寡 核 苷 酸 获 自 Integrated DNA Technologies(Coralville, IA)。β- 半乳糖苷酶获自 QAbio(San Mateo, CA)。 96 孔裂解物清除板 (lysate-clearing plate) 来自 Promega(Madison, WI)。 蛋白 - 结 合 96 孔板来自 Millipore(Bedford, MA)。盐和缓冲剂来自 Sigma(St.Louis, MO)。MALDI 基质来自 Aldrich(Milwaukee, WI)。
     蛋 白 纯 化 和 N- 聚 糖 分 析。K3 纯 化 如 前 述 (Choi 等 人, Proc.Natl.Acad.Sci. U.S.A.100 : 5022-5027(2003))。 利 用 获 自 New England BioLabs(Beverly, MA) 的 N- 糖 苷酶 F 从 K3 释放 N- 聚糖, 如前述 (Choi 等人, ibid.)。利用 Applied Bio 系统 (Foster City, CA) 的 Voyager DE PRO 线性 MALDI-TOF 质谱仪测定聚糖的分子量, 如前述 (Choi 等 人, ibid.)。
     生物反应器培养。用 1mL 的种子培养物 ( 参见摇瓶培养 ) 接种含有 150mL BMGY 培养基的 500mL 带挡板的容量瓶。在 24℃将接种物培养至 OD600 为 4-6( 大约 18 小时 )。 然后将来自接种培养物的细胞离心并重悬至 50mL 发酵培养基 ( 每升培养基 : CaSO4.2H2O 0.30g, K2SO46.00g, MgSO4.7H2O 5.00g,甘 油 40.0g, PTM1 盐 2.0mL,生 物 素 4x10-3g, H3PO4(85% )30mL, PTM1 盐每升 : CuSO4.H2O 6.00g, NaI0.08g, MnSO4.7H2O 3.00g, NaMoO4.2H2O 0.20g, H3BO3 0.02g, CoCl2.6H2O 0.50g, ZnCl2 20.0g, FeSO4.7H2O 65.0g, 生物素 0.20g, H2SO4(98% )5.00mL)。
     在 3 升碟形底 (1.5 升初始进料体积 )Applikon 生物反应器中进行发酵。 发酵罐在 24℃的温度下以分批补料模式运行, 并将 pH 控制在 4.5±0.1 利用 30%氢氧化铵。通过调 整搅拌速率 (450-900rpm) 和纯氧提供, 将溶解氧维持在 40%以上, 相对于在 1atm 下用空气 饱和。空气流动速率维持在 1vvm。当在分批培养期 (the batch phase) 初始甘油 (40g/L) 被耗尽时, 这是 DO 增加的指示, 将含有 12ml/L PTM1 盐的 50%甘油溶液以 12mL/L/h 的进料 速率补料直到达到所期望的生物质浓度。在半小时饥饿期后, 起始甲醇补料 ( 含有 12mL/L PTM1 的 100%甲醇 )。 甲醇进料速率用于控制发酵罐中甲醇浓度在 0.2-0.5%之间。 利用位 于发酵罐的排出气中 TGS 气体传感器 (TGS822, 来自 Figaro Engineering Inc.) 在线测量 甲醇浓度。每 8 小时对发酵罐中进行取样和分析生物质 (OD600, 湿细胞重和细胞计数 ), 剩 余碳源水平 ( 利用 Aminex 87H 通过 HPLC 测量甘油和甲醇 ) 和细胞外蛋白含量 ( 通过 SDS page 和 Bio-Rad 蛋白测定 )。
     体外 β- 半乳糖苷酶消化。来自 RDP80 的 N- 聚糖与 β1, 4- 半乳糖苷酶 (QA bio, San Mateo, CA) 在 50mM NH4HCO3, pH6.0 中在 37℃孵育 16-20 小时。
     体外唾液酸转移。从菌株 RDP80 纯化的 K3 用作唾液酸转移的底物。将 200μg 该蛋白与 50μg CMP- 唾液酸和 15mU 大鼠重组 α-(2, 6)-(N)- 唾液酸转移酶 ( 来自 EMD Biosciences(San Diego, CA, formerly Calbiochem)) 在 50mM NH4HCO3, pH6.0 中在 37℃孵 育 16-20 小时。然后通过 PNGaseF 消化释放 N- 聚糖并通过 MALDI-TOF MS 检测。
     实施例 2
     UDP- 半乳糖 4- 差向异构酶催化 Leloir 途径的第三步 ( 图 4)。如实施例 1 所示, 在糖工程化的巴斯德毕赤酵母菌株中编码该酶的基因的异源表达引起 UDP- 半乳糖细胞内 库的产生, 如表达该异源基因的菌株中半乳糖转移显著增加所证实的。但是, 还如所示的,仅添加该酶不能赋予巴斯德毕赤酵母菌株在半乳糖 ( 作为单一碳源 ) 上生长的能力 ( 参见 图 7, 菌株 RDP578-1)。因此, 将酿酒酵母中 Leloir 途径的其余酶引入实施例 1 的各种菌株 中。因此, 在该实施例中, 构建了能够利用半乳糖作为单一碳源的巴斯德毕赤酵母宿主细 胞。 本文的方法可用于将通常不能利用半乳糖作为碳源的其他物种的重组宿主细胞制备成 能够利用半乳糖作为单一碳源的重组宿主细胞。
     酿酒酵母 GAL1 的克隆。 利用 PCR 引物 PB158(5’ -TTAGCGGCCGCAGGAATGACTAAATCTC ATTCA-3’ (SEQ ID NO : 13)) 和 PB159(5’ -AACTTAATTAAGCTTATAATTCATATAGACAGC-3’ (SEQ ID NO : 14)), 从酿酒酵母基因组 DNA( 菌株 W303, 标准 smash 和 grab 基因组 DNA 制备 )PCR 扩增 编码半乳糖激酶 (GenBank NP_009576) 的酿酒酵母基因 ( 称为 ScGAL1), 将 PCR 扩增的 DNA 片段克隆至 pCR2.1(Invitrogen, Carlsbad, CA) 并测序。得到的质粒命名为 pRCD917。用 NotI 和 PacI 将编码半乳糖激酶的 DNA 片段从质粒释放并将 DNA 片段亚克隆进质粒 pGLY894 的巴斯德毕赤酵母 HHT1 强组成型启动子下游 NotI 和 PacI 位点之间以产生质粒 pGLY939。 半乳糖激酶具有 SEQ ID NO : 40 所示的氨基酸序列并由 SEQ ID NO : 39 所示的核苷酸序列编 码。
     酿酒酵母 GAL2 的克隆。利用 PCR 引物 PB156(5’ -TTAGCGGCCGC-3’ (SEQ ID NO : 15)) 和 PB157(5’ -AACTTAATTAA-3’ (SEQ ID NO : 16)) 从酿酒酵母基因组 DNA( 菌株 W303, 标准 “smash and grab” 基因组 DNA 制备 )PCR 扩增编码半乳糖通透酶 (GenBankNP_013182) 的酿酒酵母基因 ( 称为 ScGAL2), 将 PCR 扩增的 DNA 片段亚克隆进 pCR2.1(Invitrogen, Carlsbad, CA) 并测序。得到的质粒命名为 pPB290。用 NotI 和 PacI 将编码半乳糖通透酶 的 DNA 片段从质粒释放并将 DNA 片段亚克隆进质粒 pJN664 的 PpPMA1 启动子下游 NotI 和 PacI 位点之间以产生质粒 pPB292。半乳糖通透酶具有 SEQ ID NO : 44 所示的氨基酸序列并 由 SEQ ID NO : 43 所示的核苷酸序列编码。
     酿 酒 酵 母 GAL7 的 克 隆。 利 用 PCR 引 物 PB160(5’ -TTAGCGGCCGCAGGAATGAC TGCTGAAGAA TT-3’ (SEQ ID NO : 17)) 和 PB161(5’ -AACTTAATTA AGCTTACAGT CTTTGTAGAT AATC-3’ (SEQ ID NO : 18) 从酿酒酵母基因组 DNA( 菌株 W303, 标准 smash and grab 基因组 DNA 制备 )PCR 扩增编码半乳糖 -1- 磷酸尿苷酰转移酶 (GenBank NP_009574) 的酿酒酵母 基因 ( 称为 ScGAL7), 将 PCR 扩增的 DNA 片段克隆至 pCR2.1(Invitrogen, Carlsbad, CA) 并 测序。得到的质粒命名为 pRCD918。用 NotI 和 PacI 将编码半乳糖 -1- 磷酸尿苷酰转移酶 的 DNA 片段从质粒释放并将 DNA 片段亚克隆进质粒 pGLY143 的 PpPMA1 强组成型启动子下 游 NotI 和 PacI 位点之间以产生质粒 pGLY940。个别地, NotI 和 PacI 位点还用于亚克隆该 ORF 至质粒 pRCD830 巴斯德毕赤酵母 TEF1 强组成型启动子下游的 NotI/PacI 处以产生质 粒 pRCD929。半乳糖 -1- 磷酸尿苷酰转移酶具有 SEQ ID NO : 42 所示的氨基酸序列并由 SEQ ID NO : 41 所示的核苷酸序列编码。
     三 ScGAL1/ScGAL7/ScGAL2 构建体的构建。将来自 pGLY917 的 ScGAL1 开放读码 框亚克隆至 pJN702, 一种巴斯德毕赤酵母 his1 敲除载体, 具有巴斯德毕赤酵母 ARG1 选 择标记 (his1::ARG1, 参见美国专利号 7,479,389) 且还含有 PGAPDH- 启动子表达盒 ; 含有 PGAPDH-ScGAL1 融合的这种新的载体命名为 pRCD928。将来自 pGLY929 的 PTEF1-ScGAL7 表达盒 亚克隆至 pGLY928, 新的载体命名为 pGLY946a。下一步, 将来自 pRCD634 的 POCH1-DmUGT( 高 尔基体 UDP- 半乳糖转运蛋白 ) 表达盒亚克隆至 pGLY946a 以产生 pGLY956b。最后, 将来自pPB292 的 PGAPDH-ScGAL2 表达盒亚克隆至 pRCD956b 以产生质粒 pRCD977b( 参见图 6)。质粒 pRCD977b 含有 DmUGT、 ScGAL1、 ScGAL7 和 ScGAL2 表达盒并具有 ARG1 显性选择标记盒。
     双 ScGAL1/ScGAL7 构建体的构建。 将来自 pGLY939 的 PTEF1-ScGAL1 表达盒亚克隆至 pGLY941, 一种敲入载体, 具有巴斯德毕赤酵母 ARG1 选择标记、 TRP1 基因座敲入区、 还含有 PGAPDH-hGalTIβ 表达盒, 该新的载体命名为 pGLY952。将来自 pGLY940 的 PPMA1-ScGAL7 表达 盒亚克隆至 pGLY952, 新的载体命名为 pGLY955。最后, 将诺尔丝菌素抗性表达盒 (NATR) 从 pGLY597( 最初来自 pAG25, 来自 EROSCARF, Scientific Research and Development GmbH, Daimlerstrasse 13a, D-61352 Bad Homburg, Germany, 参见 Goldstein 等人, 1999, Yeast 15 : 1541) 亚克隆至 pGLY952 以产生质粒 pGLY1418( 参见图 12), 其含有 hGalTIβ、 ScGAL1 R 和 ScGAL7 表达盒并具有 NAT 显性选择标记盒。
     具有所有三个基因的单一整合质粒 pRCD977b( 图 6) 被转化至巴斯德毕赤酵母菌 株 RDP578-1 以产生菌株 RDP635-1、 -2 和 -3。菌株 RDP578-1 已含有异源基因和基因敲除 用于产生含有末端 β-1, 4- 半乳糖残基的人 N- 聚糖 ( 参见图 5 和实施例 3 用于构建体 )。 菌株 RDP578-1 也包括编码酿酒酵母 UDP- 半乳糖 4- 差向异构酶编码基因 ScGAL10 的表达 盒并表达测试蛋白人三环 3。得到的菌株 RDP635-1、 -2 和 -3 具有两个拷贝的 DmUGT 半乳 糖转运蛋白。 母 本 菌 株 RDP578-1 和 具 有 ScGAL1、 ScGAL2、 ScGAL7 和 ScGAL10 基 因 的 转 化 子 (RDP635-1、 -2 和 -3) 在含有葡萄糖、 半乳糖或无碳源的最低培养基生长五天然后拍照。有 意思的是, 尽管具有分泌具有半乳糖末端的 N- 聚糖的蛋白的能力, RDP578-1 显示出不能 同化半乳糖, 同时在葡萄糖上正常生长, 如野生型巴斯德毕赤酵母所期望的。但是, 表达 ScGAL1、 ScGAL2 和 ScGAL7 基因的转化子能够同化半乳糖, 如图 7 所示。如期望的, 在缺乏 碳源的平板上观察到最低生长。这些结果表明可以构建重组巴斯德毕赤酵母, 当与 Leloir 半乳糖同化途径的基础结构 ( 但不是调节 ) 元件重构时其可同化半乳糖作为碳源。
     在糖工程化的巴斯德毕赤酵母中表达的 Fc 第 297 位 Asn 残基上 N- 聚糖的测定。 人 IgG 的 Fc 部分在每个重链二聚体上含有单个 N- 聚糖位点 (Asn297, Kabat numbering), 其通常含有不同于其他分泌的人蛋白的 N- 聚糖分布情况。通常地, 天然存在的人抗体含有 具有末端 GlcNAc 和一定量末端半乳糖的 N- 聚糖, 其基于多种因素而不同, 并很少含有显著 量的末端唾液酸。在证明 N- 聚糖的高水平末端 β-1, 4- 半乳糖后, 我们试图测定在这类糖 工程化的酵母菌株产生的抗体上观察到的 N- 聚糖分布情况。因此, 用在 AOX1 启动子的控 制下编码人免疫球蛋白 G1(IgG1) 重链的 Fc 结构域或 C- 末端半部分的质粒 (pBK138) 转化 已被基因工程化为产生具有末端半乳糖的 N- 聚糖的巴斯德毕赤酵母菌株 (YGB02 ; 参见图 8 和实施例 4)。由 PCR 鉴定的选择的阳性克隆命名为 PBP317-36( 图 8 和实施例 4)。该菌株 在摇瓶中生长并用甲醇作为单一碳源诱导。通过离心收获上清并通过蛋白 A 亲和层析进行 纯化。 纯化的蛋白在 SDS-PAGE 上分离并进行考马斯染色。 观察到具有期望大小的标记的条 带。然后将纯化的蛋白进行 PNGase 消化并通过 MALDI-TOF MS 分析释放的 N- 聚糖。得到 的 N- 聚糖 ( 图 10A) 显示与具有末端 GlcNAc 的复合人核心结构 (G0 : GlcNAc2Man3GlcNAc2) 一致的主要质量, 较少种类具有单个末端半乳糖 (G1 : GalGlcNAc2Man3GlcNAc2) 和次要种类
     (minor 物种 ) 具有用半乳糖加帽复合种类的两个臂 (G2 : Gal2GlcNAc2Man3GlcNAc2)。这些 种类的质量不同于预测的文献中报道的规范值, 原因在于缺乏单个果糖残基。糖工程化的酵母菌株不含有内源岩藻糖基转移酶, 因此缺乏将果糖添加至核心人 N- 聚糖结构的内在 性质。还观察到与 Man5GlcNAc2 一致的另一次要种类。
     然后将上述菌株 PBP317-36( 其表达组装具有末端半乳糖的人样 N- 聚糖所需的 糖基化活性和还表达 SpGALE(UDP- 半乳糖 4- 差向异构酶 )) 基因工程化为能够利用外 源半乳糖作为碳源并以代谢工程化的方式控制 N- 糖基化。构建在组成型启动子控制下 表达 ScGAL1 和 ScGAL7 的整合质粒 pGLY954( 图 9) 并将其转化至巴斯德毕赤酵母菌株 PBP317-36。质粒 pGLY954 赋予菌株 PBP317-36( 其已含有 SpGALEUDP- 半乳糖差向异构酶, 图 8) 在半乳糖 ( 作为单一碳源 ) 上生长的能力。该 gal+ 菌株命名为 RDP783。因为尽管我 们没有将半乳糖通透酶引入至细胞, 细胞仍能够利用半乳糖作为碳源, 我们得出结论 : 对巴 斯德毕赤酵母是内源的一般己糖转运蛋白能够充分穿过细胞膜转运半乳糖。
     巴斯德毕赤酵母菌株 PBP317-36 和 RDP783 具有在甲醇 - 诱导型 AOX1 启动子控制 下编码人 Fc 结构域作为分泌的报告子蛋白的整合质粒构建体。菌株 PBP317-36 和 RDP783 在标准培养基中在摇瓶中培养, 所述标准培养基含有甘油和在甲醇作为单一碳源存在下诱 导或用甲醇与不同浓度葡萄糖或半乳糖组合诱导。收获的上清蛋白通过蛋白 A 被亲和纯 化, 进行 PNGase 消化通过 MALDI-TOF MS 分析。从菌株 RDP783 的人 Fc 释放的 N- 聚糖产生 与用甲醇单独诱导或在葡萄糖或甘露糖存在下诱导后在 PBP317-36 中观察到的分布情况 类似的 N- 聚糖, 具有主要糖形 G0(GlcNAc2Man3GlcNAc2)( 图 10)。但是, 外源半乳糖给料后, 菌株 RDP783( 但不是母本菌株 PBP317-36) 产生在人 Fc 上的含有半乳糖的 N- 聚糖的剂量 依赖增加, 其主要糖形现在转移到 G1(GalGlcNAc2Man3GlcNAc2) 且在完全地 β-1, 4- 半乳糖 加帽的糖形 G2(Gal2GlcNAc2Man3GlcNAc2) 中污染增加 ( 图 10)。
     最后, 为证明用人 Fc 观察到的利用外源半乳糖控制糖基化的能力可应用于全 长单克隆抗体, 产生糖工程化的酵母菌株 YDX477( 图 11, 实施例 5), 其表达抗 -Her2 单 克 隆 抗 体。 该 菌 株 还 工 程 化 为 转 移 G2 形 的 人 N- 聚 糖 (Gal2GlcNAc2Man3GlcNAc2) 到 分 泌的糖蛋白上。在 mAb-A 的表达后 N- 聚糖的释放显示 N- 聚糖模式 ( 图 13A), 其由与 G0(GlcNAc2Man3GlcNAc2) 一致的主要峰组成, 具有与 G1(GalGlcNAc2Man3GlcNAc2) 一致的次 主要峰, 以及 G2(Gal2GlcNAc2Man3GlcNAc2) 和 M5(Man5GlcNAc2) 的次要峰。该数据与对于人 IgG1 的截短的 Fc 部分观察到的相似并且是期望的, 因为在相同残基处 (Asn-297)N- 糖基 化。构建具有 ScGAL1 和 ScGAL7 的整合质粒 pGLY1418( 图 12) 和转化至巴斯德毕赤酵母菌 株 YDX477 以制备菌株 RDP968-1。该质粒赋予菌株 YDX477( 其已含有 SpGALE UDP- 半乳糖 差向异构酶, 图 11) 在半乳糖 ( 作为单一碳源 ) 上生长的能力。
     菌株 YDX477 和 RDP968-1 在标准培养基中在摇瓶中培养, 所述标准培养基含有甘 油和在甲醇作为单一碳源存在下诱导或用甲醇与不同浓度半乳糖组合诱导。 收获的上清蛋 白通过蛋白 A 被亲和纯化, 进行 PNGase 消化通过 MALDI-TOF MS 分析。两种菌株产生与之 前用甲醇单独诱导或在葡萄糖或甘露糖存在下诱导后在 PBP317-36 中观察到的分布情况 类似的 N- 聚糖, 具有主要糖形 G0(GlcNAc2Man3GlcNAc2)( 图 10A 相对于图 13A 和 13D)。但 是, 外源半乳糖给料后, 菌株 RDP968-1( 但不是母本菌株 YDX477) 产生在抗体上的含有半乳 糖的 N- 聚糖的剂量依赖增加, 其主要糖形现在转移到 G1(GalGlcNAc2Man3GlcNAc2) 且在完 全地 β-1, 4- 半乳糖加帽的糖形 G2(Gal2GlcNAc2Man3GlcNAc2) 中污染增加 ( 图 13E 和 F)。
     实施例 3菌株 RDP578-1 的构建显示于图 5 并涉及以下步骤。菌株 JC308 是起始菌株。该 菌株已在 Choi 等人, Proc.Natl.Acad.Sci.USA 100 : 5022-5027(2003) 中描述, 但简言之, 菌株是 ura3, ade1, arg4, his4。通过利用质粒 pJN329 破坏 OCH1 基因并根据 Choi 等人 (ibid.) 和美国专利号 7,449,308 中描述的方法, 使得该菌株缺乏 α-1, 6 甘露糖基转移酶 活性以产生菌株 YJN153。质粒 pJN329 携带 PPURA3 显性选择标记, 在反选择 ura- 活性后, 通过利用质粒载体 pJN503b 和 pAS19 破坏 PNO1、 MMN4A 和 MNN4B 基因并根据美国专利号 7,259,007 中描述的方法, 使得得到的菌株 YJN156 缺乏磷酸甘露糖基转移酶活性以产生菌 株 YAS180-2。包含本文中的融合蛋白的分泌途径靶向前导肽定位催化结构域, 其被融合至 ER、 高尔基体或反式高尔基体网络。
     在 反 选 择 ura- 活 性 后, 通 常 如 美 国 专 利 号 7,465,577 中 描 述 的 利 用 质 粒 pAS24( 参见图 14) 使得得到的菌株 YAS187-2 缺乏 β- 甘露糖基转移酶活性以制备菌株 YAS218-2。质粒 pAS24 是巴斯德毕赤酵母 BMT2 敲除质粒, 其含有 PpURA3 选择标记和在 PpOCH1 启动子的下游含有编码全长小鼠高尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 的表 达盒。MmSLC35A3 具有 SEQ ID NO : 34 所示的氨基酸序列, 其由 SEQ ID NO ; 33 所示的核苷 酸序列编码。可以如美国专利号 7,465,577 所示获得在序列两侧的 5’ 和 3’ BMT2 用于去除 β- 甘露糖基转移酶活性 ( 其归因于 bmt2p)。 在对于 ura- 活性反选择菌株 YAS218-2 后, 得 到的菌株 YAS269-2 是 ura- 并具有插入 BMT2 基因的小鼠高尔基体 UDP-GlcNAc 转运蛋白。
     然后用质粒 pRCD742b( 参见图 15) 转化菌株 YAS269-2, 质粒 pRCD742b 包括编码 嵌合小鼠 α-1, 2- 甘露糖基转移酶 I(FB8 MannI)、 嵌合人 GlcNAc 转移酶 I(CONA10) 和 全长基因编码小鼠高尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 的表达盒并将质粒靶向 ADE1 基因座 ( 参见 PCT/US2008/13719)。质粒 pRCD742b 是敲入敲除 (KINKO) 质粒, 其已 在 WO2007/136865 和 WO2007136752 中描述。质粒整合进巴斯德毕赤酵母 ADE1 基因而不删 除编码 Ade1p 的开放读码框。质粒还含有 PpURA5 选择标记。编码分泌途径靶向融合蛋白 (FB8MannI) 的表达盒包括在 PpGAPDH 启动子的控制下融合至小鼠 α-1, 2- 甘露糖基转移酶 I 催化结构域 (FB MannI : SEQ ID NO : 54) 的 N- 末端的 ScSec12 前导肽 (ScSec12(8) : SEQ ID NO : 32 的最先的 103 个氨基酸 )。编码分泌途径靶向融合蛋白 CONA10 的表达盒包括在 PpPMA1 启动子的控制下融合至人 GlcNAc 转移酶 I(GnT I) 催化结构域 (SEQ ID NO : 52) 的 N- 末端的 PpSec12 前导肽 (PpSec12(10) : SEQ ID NO : 28 的最先的 29 个氨基酸 )。 质粒另外 包括在 PpSEC4 启动子的控制下编码全长小鼠高尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 的表达盒。将质粒 pRCD742b 转染进菌株 YAS269-2 产生菌株 RDP307。该菌株能够产生具有 GlcNAcMan5GlcNAc2 N- 聚糖的糖蛋白。SEQ ID NO : 53 和 51 是分别编码小鼠 α-1, 2- 甘露 糖基转移酶 I 和人 GlcNAc 转移酶 I(GnT I) 催化结构域的核苷酸序列。编码人 GnT I 的核 苷酸序列被密码子最优化用于在巴斯德毕赤酵母中表达。SEQ ID NO : 27 和 31 是分别编码 PpSEC12(10) 和 ScSEC12(8) 的核苷酸序列。
     菌株 RDP361 如下构建 : 用质粒 pDMG47 转化菌株 RDP307 以产生菌株 RDP361。质 粒 pDMG47( 参见图 16) 是 KINKO 质粒, 其整合进巴斯德毕赤酵母 TRP1 基因座而不删除编 码 Trp1p 的开放读码框。质粒还含有 PpURA3 选择标记并包括编码分泌途径靶向融合蛋白 (KD53) 的表达盒, 其包含在 PpGAPDH 启动子的控制下融合至黑腹果蝇甘露糖苷酶 II(KD : SEQ ID NO : 63) 催化结构域的 N- 末端的 ScMnn2 引导靶向肽 (ScMnn2(53) : SEQ ID NO : 19最先的 36 个氨基酸 )。质粒还含有编码分泌途径靶向融合蛋白 (TC54) 的表达盒, 其包含 在 PpPMA1 启动子的控制下融合至大鼠 GlcNAc 转移酶 II(TC : SEQ ID NO : 58) 的催化结构 域的 N- 末端的 ScMnn2 引导靶向肽 (ScMnn2(54) : SEQ ID NO : 22 的最先的 97 个氨基酸 )。 ScMnn2 前导区 53 和 54 的核酸序列分别显示于 SEQ ID NO : 19 和 21。编码黑腹果蝇甘露糖 苷酶 II 和大鼠 GlcNAc 转移酶 II(GnTII) 的催化结构域的核酸序列分别显示于 SEQ ID NO : 62 和 57。
     上述菌株 RDP361 用质粒 pRCD823b 转化以产生菌株 RDP415-1。质粒 pRCD823b( 参 见 图 17) 是 KINKO 质 粒, 其 整 合 进 巴 斯 德 毕 赤 酵 母 HIS4 基 因 座 ( 参 见 美 国 专 利 号 7,479,389) 而不删除编码 His4p 的开放读码框, 并含有 PpURA5 选择标记 ( 参见美国公开 的申请号 20040229306) 以及编码分泌途径靶向融合蛋白 (TA54) 的表达盒, 其包含大鼠 GlcNAc 转移酶 II 催化结构域 (TA : SEQ ID NO : 61), 如上述在它的 N- 末端与 ScMnn2(54) 的 最先的 97 个氨基酸融合但在 PpGAPDH 启动子的控制下。质粒还含有在 PpOCH1 启动子的控 制下编码全长黑腹果蝇高尔基体 UDP- 半乳糖转运蛋白 (DmUGT) 和在 PpPMA1 启动子的控制 下编码全长酿酒酵母 UDP- 半乳糖 4- 差向异构酶 (ScGAL10) 的表达盒。ScGAL10 具有 SEQ ID NO : 46 所示的氨基酸序列, 其由 SEQ ID NO : 45 所示的核苷酸序列编码。大鼠 GlcNAc 转 移酶 II(TA) 的核苷酸序列显示于 SEQ ID NO : 60。
     上 述 菌 株 RDP415-1 用 质 粒 pRCD893a 转 化 以 产 生 菌 株 RDP523-1。 质 粒 pGLY893a( 参见图 18) 是巴斯德毕赤酵母 his1 敲除质粒, 其含有 PpARG4 选择标记 ( 参见 美国专利号 7,479,389)。质粒包括编码分泌途径靶向融合蛋白 (KD10) 的表达盒, 其包含 在 PpPMA1 启动子的控制下融合至黑腹果蝇甘露糖苷酶 II(KD : SEQ ID NO : 63) 的催化结 构域的 N- 末端的 PpSEC12 引导靶向肽 (PpSEC12(10) : SEQ ID NO : 28 的最先的 29 个氨基 酸 )。质粒还含有编码分泌途径靶向融合蛋白 (TA33) 的表达盒, 其包含在 PpTEF1 启动子 的控制下融合至大鼠 GlcNAc 转移酶 II(TA : SEQ ID NO : 61) 的催化结构域的 N- 末端的 ScMntIp(ScKre2p) 引导靶向肽 (ScMntIp(ScKre2p)(33) : SEQ ID NO : 30 的最先的 53 个氨 基酸 )。质粒还含有编码分泌途径靶向融合蛋白 (XB53) 的表达盒, 其包含融合至人半乳糖 基转移酶 I(hGalTIβ43 ; SEQ ID NO : 50) 的催化结构域的 N- 末端的 ScMnn2p 前导肽 (53) 的最先的 36 个氨基酸。PpSEC12 和 ScMNTI(ScKRE2) 前导区的核酸序列分别显示于 SEQ ID NO : 27 和 29。编码黑腹果蝇甘露糖苷酶 II、 大鼠 GlcNAc 转移酶 II(GnT II) 和人 GalTI 的 催化结构域的核酸序列分别显示于 SEQ ID NO : 62、 60 和 49。该菌株可产生具有 N- 聚糖的 糖蛋白, 所述 N- 聚糖具有末端半乳糖残基。菌株编码两个拷贝的黑腹果蝇甘露糖苷酶 II 催化结构域和三个拷贝的大鼠 GnTII 催化结构域。
     最后, 上述菌株 RDP523-1 用质粒 pBK64 转化以产生菌株 RDP578-1。质粒 pBK64 编 码人三环 3 测试蛋白并已在 Choi 等人, Proc.Natl.Acad.Sci.USA 100 : 5022-5027(2003) 中描述。
     实施例 4
     菌株 PBP317-36 的构建显示于图 8。起始菌株是 YGLY16-3。这是具有 OCH1, PNO1, MNN4A, Mnn4B 和 BMT2 基因缺失的 ura- 菌株并可以根据实施例 3 所用方法制备。菌株 YGLY16-3 还在 WO2007136752 中公开。
     菌株 YGLY16-3 用质粒 pRCD742a( 参见图 19) 转化以制备菌株 RDP616-2。质粒pRCD742a( 参见图 19) 是 KINKO 质粒, 其整合进巴斯德毕赤酵母 ADE1 基因而不删除编码 Ade1p 的开放读码框。 质粒还含有 PpURA5 选择标记和包括编码嵌合小鼠 α-1, 2- 甘露糖基 转移酶 (FB8MannI)、 嵌合人 GlcNAc 转移酶 I(CONA10) 和全长小鼠高尔基体 UDP-GlcNAc 转 运蛋白 (MmSLC35A3) 的表达盒。 质粒与质粒 pRCD742b 相同, 除了编码嵌合人 GlcNAc 转移酶 I 的表达盒的方向为相反方向。 将质粒 pRCD742a 转染进菌株 YGLY16-3 产生菌株 RDP616-2。 该菌株能够产生具有 GlcNAcMan5GlcNAc2N- 聚糖的糖蛋白。
     反选择菌株 RDP616-2 以产生 ura- 菌株 RDP641-3 后, 然后将质粒 pRCD1006 转化至 菌株以制备菌株 RDP666。质粒 pRCD1006( 参见图 20) 是巴斯德毕赤酵母 his1 敲除质粒, 其 含有 PpURA5 基因作为选择标记。质粒含有在 PpGAPDH 启动子的控制下编码分泌途径靶向 融合蛋白 (XB33) 的表达盒 ( 其包含融合至人半乳糖基转移酶 I 催化结构域 (hGalTIβ43) 的 N- 末端的 ScMnt1p(ScKre2p)(33) 的最先的 58 个氨基酸 ) ; 在 PpOCH1 启动子的控制下 编码全长黑腹果蝇高尔基体 UDP- 半乳糖转运蛋白 (DmUGT) 的表达盒和在 PpPMA1 启动子的 控制下编码粟酒裂殖酵母 UDP- 半乳糖 4- 差向异构酶 (SpGALE) 的表达盒。
     菌株 RDP666 用质粒 pGLY167b 转化以制备菌株 RDP696-2。质粒 pGLY167b( 参见 图 21) 是巴斯德毕赤酵母 arg1 敲除质粒, 其含有 PpURA3 选择标记。质粒含有在 PpGAPDH 启动子的控制下编码分泌途径靶向融合蛋白 (CO-KD53) 的表达盒 ( 其包含融合至黑腹果蝇 甘露糖苷酶 II 催化结构域 (KD) 的 N- 末端的 ScMnn2p(53) 的最先的 36 个氨基酸 ) 和在 PpPMA1 启动子的控制下表达分泌途径靶向融合蛋白 (CO-TC54) 的表达盒 ( 其包含融合至大 鼠 GlcNAc 转移酶 II 催化结构域 (TC) 的 N- 末端的 ScMnn2p(54) 的最先的 97 个氨基酸 )。 得到的菌株 RDP696-2 进行恒化器选择 ( 参见 Dykhuizen 和 Hartl, Microbiol.Revs.47 : 150-168(1983) 关于恒化器选择的综述 )。恒化器选择产生菌株 YGB02。菌株 YGB02 可产生 具有 N- 聚糖的糖蛋白, 所述 N- 聚糖具有末端半乳糖残基。在该菌株中, 甘露糖苷酶 II 催 化结构域 (KD) 和 GnTII(TC) 被密码子最优化为在巴斯德毕赤酵母中表达的核酸分子 ( 分 别为 SEQ ID NO : 64 和 59) 编码。
     菌株 YGB02 用质粒 pBK138 转染以产生菌株 PBP317-36。质粒 pBK138( 参见图 22) 是滚入 (roll-in) 质粒, 其整合进巴斯德毕赤酵母 AOX1 启动子同时复制启动子。质粒含有 编码融合蛋白的表达盒, 其包含融合至人 Fc 抗体片段 (C- 末端 233-aa of a 人 IgG1 重链, SEQ ID NO : 66) 的 N- 末端的酿酒酵母 A 交配因子前信号序列 (SEQ ID NO : 24)。编码酿酒 酵母 A 交配因子前信号序列的核酸序列显示于 SEQ ID NO : 23 和编码人 IgG1 重链的 C- 末 端 233-aa 的核酸序列显示于 SEQ ID NO : 65)。
     实施例 5
     菌株 YDX477 的构建显示于图 11。起始菌株是 YGLY16-3。菌株 YGLY16-3 用质粒 pRCD742a( 参见图 19) 转化以制备菌株 RDP616-2。质粒 pRCD742a( 参见图 19) 是 KINKO 质粒, 其整合进巴斯德毕赤酵母 ADE1 基因而不删除编码 ade1p 的开放读码框。质粒还含 有 PpURA5 选择标记和包括编码嵌合小鼠 α-1, 2- 甘露糖基转移酶 (FB8MannI)、 嵌合人 GlcNAc 转移酶 I(CONA10) 和全长小鼠高尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 表达 盒。质粒与质粒 pRCD742b 相同, 除了编码嵌合人 GlcNAc 转移酶 I 的表达盒的方向为相反 方向。将质粒 pRCD742a 转染进菌株 YGLY16-3 产生菌株 RDP616-2。该菌株能够产生具有 GlcNAcMan5GlcNAc2N- 聚糖的糖蛋白。反选择菌株 RDP616-2 以产生 ura- 菌株 RDP641-4 后, 然后将质粒 pRCD1006 转化至 菌株以制备菌株 RDP667-1. 质粒 pRCD1006( 参见图 20) 是巴斯德毕赤酵母 his1 敲除质粒, 其含有 PpURA5 基因作为选择标记。 质粒含有在 PpGAPDH 启动子的控制下编码分泌途径靶向 融合蛋白 (XB33) 的表达盒 ( 其包含融合至人半乳糖基转移酶 I 催化结构域 (hGalTIβ43) 的 N- 末端的 ScMnt1p(ScKre2p)(33) 的最先的 58 个氨基酸 ) ; 在 PpOCH1 启动子的控制下 编码全长黑腹果蝇高尔基体 UDP- 半乳糖转运蛋白 (DmUGT) 的表达盒和在 PpPMA1 启动子的 控制下编码粟酒裂殖酵母 UDP- 半乳糖 4- 差向异构酶 (SpGALE) 的表达盒。
     菌株 RDP667-1 用质粒 pGLY167b 转化以制备菌株 RDP697-1。质粒 pGLY167b( 参见 图 21) 是巴斯德毕赤酵母 arg1 敲除质粒, 其含有 PpURA3 选择标记。质粒含有在 PpGAPDH 启动子的控制下编码分泌途径靶向融合蛋白 (CO-KD53) 的表达盒 ( 其包含融合至黑腹果蝇 甘露糖苷酶 II 催化结构域 (KD) 的 N- 末端的 ScMnn2p(53) 的最先的 36 个氨基酸 ) 和在 PpPMA1 启动子的控制下表达分泌途径靶向融合蛋白 (CO-TC54) 的表达盒 ( 其包含融合至大 鼠 GlcNAc 转移酶 II 催化结构域 (TC) 的 N- 末端的 ScMnn2p(54) 的最先的 97 个氨基酸 )。 编码甘露糖苷酶 II 和 GnT II 催化结构域的核酸分子被密码子最优化用于在巴斯德毕赤酵 母中表达 ( 分别为 SEQ ID NO : 64 和 59)。该菌株可产生具有 N- 聚糖的糖蛋白, 所述 N- 聚 糖具有末端半乳糖残基。
     用 质 粒 pGLY510 转 化 菌 株 RDP697-1 以 制 备 菌 株 YDX414。 质 粒 pGLY510( 参 见 图 23) 是滚入质粒, 其整合进巴斯德毕赤酵母 TRP2 基因座同时复制基因并含有 AOX1 启动 子 -ScCYC1 终止子表达盒以及 PpARG1 选择标记。
     用质粒 pDX459-1(mAb-A) 转化菌株 YDX414 以制备菌株 YDX458。 质粒 pDX459-1( 参 见图 24) 是滚入质粒, 其靶向并整合进巴斯德毕赤酵母 AOX2 启动子并含有 ZeoR 同时复制 启动子。质粒含有编码抗 -HER2 抗体重链和抗 -HER2 抗体轻链 ( 分别为 SEQ ID NO : 68 和 70) 的分开的表达盒, 其各个在 N- 末端融合黑曲霉 α- 淀粉酶信号序列 (SEQ ID NO : 26) 并 被巴斯德毕赤酵母 AOX1 启动子控制。编码重链和轻链的核酸序列分别显示于 SEQ ID NO : 67 和 69, 和编码黑曲霉 α- 淀粉酶信号序列的核酸序列显示于 SEQ ID NO : 25。
     用质粒 pGLY1138 转化菌株 YDX458 以制备菌株 YDX477。质粒 pGLY1138( 参见图 25) 是滚入质粒, 其整合进巴斯德毕赤酵母 ADE1 基因座同时复制基因。 质粒含有 ScARR3 选 择标记基因盒。来自酿酒酵母的 ARR3 基因赋予细胞亚砷酸盐抗性, 使细胞可在亚砷酸盐存 在下生长 (Bobrowicz 等人, Yeast, 13 : 819-828(1997) ; Wysocki 等人, J.Biol.Chem.272 : 30061-30066(1997))。质粒含有在 PpAOX1 启动子的控制下编码分泌的融合蛋白的表达盒, 其包含融合至里氏木霉 (MNS1) 催化结构域 (SEQ ID NO : 56, 由 SEQ ID NO : 55 的核苷酸序 列编码 ) 的 N- 末端的酿酒酵母 α 因子前信号序列 (SEQ ID NO : 24)。融合蛋白分泌至培 养基中。
     尽管本发明参考例举的实施方案在本文中描述, 但应理解的是本发明不限于此。 具有本领域普通技术且获得本文教导的人员应认识到在其范围内的另外的修改和实施方 案。因此, 本发明仅通过本文所附权利要限制。
     (1) 发明领域
     本发明涉及低等真核细胞, 例如巴斯德毕赤酵母 (Pichia pastoris), 其通常不能 利用半乳糖作为碳源, 但通过基因工程化细胞为表达包含 Leloir 途径的酶中的几种, 使其 能够利用半乳糖作为单一碳源。具体地, 细胞被基因工程化为表达半乳糖激酶、 UDP- 半乳 糖 -C4- 差向异构酶和半乳糖 -1- 磷酸尿苷酰转移酶, 以及任选地半乳糖通透酶。另外, 本 发明进一步涉及用于改进在已被基因工程化为产生具有 N- 聚糖 ( 其具有半乳糖残基 ) 的 糖蛋白但通常缺乏包含 Leloir 途径的酶的低等真核细胞中具有半乳糖末端的或含有半乳 糖的 N- 聚糖的产量的方法, 包含用编码半乳糖激酶、 UDP- 半乳糖 -C4- 差向异构酶和半乳 糖 -1- 磷酸尿苷酰转移酶的一个或多个核酸分子转化低等真核细胞。
     (2) 相关领域的描述
     基于蛋白的疗法组成了药物发现的最活跃领域之一并被期望是未来十年新的 治疗用化合物的主要来源 (Walsh, Nat.Biotechnol.18(8) : 831-3(2000))。治疗用蛋白 ( 在它们的天然状态未被糖基化 ) 可在缺乏糖基化机制的宿主中表达, 例如埃希氏大肠 杆菌 (Escherichia coli)。但是, 大多数治疗用蛋白是糖蛋白, 其需要在蛋白的特定天 冬酰胺残基翻译后添加聚糖, 以确保正确的折叠和随后在人血清中的稳定性 (Helenius 和 Aebi, Science 291 : 2364-9(2001))。在一些情况中, 治疗用蛋白的效力已通过在另外 的糖基化位点中的工程化而被改进。一个实例是人红细胞生成素, 其添加另外两个糖基 化位点后已表明在体内显示三倍长的半衰期 (Macdougall 等人, J.Am.Soc.Nephrol.10 : 2392-2395(1999))。意在人中用于治疗用途的大多数糖蛋白需要 N- 糖基化, 因此, 哺乳动 物细胞系, 例如中国仓鼠卵巢 (CHO) 细胞, 其具有类似的人糖蛋白加工, 目前最常用于生产 治疗用糖蛋白。但是, 这些细胞系具有明显的缺点, 包括较差的基因溯源性、 较长的发酵时 间、 异源糖基化和正在发生的病毒污染问题 (Birch 和 Racher, Adv. 药物 Deliv.Rev.58 : 671-85(2006) ; Kalyanpur, Mol.Biotechnol.22 : 87-98(2002))。
     许多工业蛋白表达系统基于可在化学上成分确定的培养基中生长至高细胞 密 度 且 通 常 不 受 上 述 限 制 的 酵 母 菌 株 (Cereghino 和 Cregg FEMS Microbiol.Rev.24 : 45-66(2000) ; Hollenberg 和 Gellisen , Curr.Opin.Biotechnol.8 : 554-560(1997) ; Muller, 酵母 14 : 1267-1283(1998)。尽管酵母已被用于生产缺乏糖基化的治疗用蛋白, 例 如胰岛素, 但是其仍未被用于糖蛋白生产, 因为酵母产生具有非人的、 高甘露糖型 N- 聚糖 的糖蛋白 ( 参见图 1), 其产生具有缩短的体内半衰期并在高等哺乳动物中具有免疫原潜能 的糖蛋白 (Tanner 等人, Biochim.Biophys.Acta.906 : 81-99(1987))。
     为解决这些问题, 本发明人和其他研究者已聚焦到各种不同酵母和丝状真菌中糖 基化途径的再工程化, 以从这些蛋白表达宿主中获得人样糖蛋白。例如, Gerngross 等人, 美国公开的申请号 2004/0018590( 所述公开内容在此通过参考并入本文 ) 提供酵母巴斯德 毕赤酵母的细胞, 其已被基因工程化为消除酵母和丝状真菌典型的高甘露糖 - 型 N- 聚糖的
     产生和提供具有糖基化机制的宿主细胞以产生具有杂合或复合 N- 聚糖的糖蛋白, 即哺乳 动物细胞产生的更典型的糖蛋白。
     Gerngross 等 人 如 上 公 开 了 重 组 酵 母 菌 株, 该重组酵母菌株可生产其 上 高 百 分 比 的 N- 聚 糖 含 有 半 乳 糖 残 基 的 重 组 糖 蛋 白 : 即, 产生主要具有寡糖结 构 GalGlcNAc2Man3GlcNAc2(G1) 或 Gal2GlcNAc2Man3GlcNAc2(G2) 和 较 少 量 寡 糖 结 构 GlcNAc2Man3GlcNAc2(G0) 的 N- 聚糖的酵母菌株。已获得 70-85%的 G2 产率。但是, 已发现 在这些细胞中生产的一些糖蛋白例如免疫球蛋白和免疫粘附素, 其中 G0 ∶ G1/G2 的比值降 低至约 2 ∶ 1( 参见例如, Li 等人, Nature Biotechnol.24 : 210-215(2006), 其中通过用半 乳糖和可溶型 β-1, 4- 半乳糖基转移酶体外处理糖蛋白, 这些细胞中半乳糖末端的 N- 聚糖 的产率得到改进 )。相反, 哺乳动物细胞例如 CHO 细胞中生产的免疫球蛋白的 G0 ∶ G1/G2 的比值约 1 ∶ 1。因此, 期望的是提供能够在体内产生 G0 ∶ G1/G2 比值小于 2 ∶ 1 的重组 糖蛋白的重组酵母宿主细胞。
     巴斯德毕赤酵母仅可利用有限数量的碳源以生存。目前, 这些碳源是甘油、 葡萄 糖、 甲醇以及可能是鼠李糖和甘露糖, 但不是半乳糖。 期望的是具有可利用上述所列以外的 碳源的巴斯德毕赤酵母菌株。 发明概述
     本发明解决了上述确定的问题。本发明提供方法和材料用于从缺乏同化半乳糖 作为碳源的能力的宿主细胞产生具有利用半乳糖作为能源的能力的重组宿主细胞。当重 组宿主细胞被进一步基因工程化为生产具有半乳糖末端的或含有半乳糖的 N- 聚糖的糖 蛋白时, 该宿主细胞能够产生重组糖蛋白例如抗体, 其中 G0 ∶ G1/G2 比值小于 2 ∶ 1、 或 G0 ∶ G1/G2 比值为 1 ∶ 1 或更小或 G0 ∶ G1/G2 比值为 1 ∶ 2 或更小。一般而言, 所述包括 将编码 Leloir 途径酶 ( 半乳糖激酶、 UDP- 半乳糖 -C4- 差向异构酶和半乳糖 -1- 磷酸尿苷 酰转移酶以及任选地半乳糖通透酶 ) 引入宿主细胞核酸分子。因此, 本文中的方法和材料 提供选择系统, 其仅通过在含有半乳糖作为碳源的培养基上培养细胞可用于鉴定已被转化 宿主细胞, 以及提供用于生产糖蛋白 ( 具有高水平的末端的或含有半乳糖的 N- 聚糖 ) 例如 免疫球蛋白的方法。
     利用半乳糖作为碳源的能力提供了选择使用的表达系统的灵活性和经济性。例 如, 在设计用于表达具有末端半乳糖或末端唾液酸化的重组糖蛋白的系统中, 可将半乳 糖添加至培养基, 半乳糖被细胞吸收和被细胞利用作为能源并提供半乳糖残基用于参入 N- 聚糖, 其在重组糖蛋白上被合成。本发明的优势是通过使半乳糖存在于培养基或在发酵 过程中添加半乳糖和 / 或诱导重组糖蛋白, 重组蛋白的生产可得到高水平的半乳糖基化的 或唾液酸化的糖蛋白。因此, 如巴斯德毕赤酵母所表明的, 通常缺乏 Leloir 途径的酵母物 种, 以本文公开的方式基因工程化巴斯德毕赤酵母产生可利用半乳糖作为单一碳源的重组 巴斯德毕赤酵母细胞系。另外, 基因工程化巴斯德毕赤酵母细胞系 ( 包括 Leloir 途径酶和 使得细胞能够产生具有半乳糖末端的或含有半乳糖的 N- 聚糖的糖蛋白所需的酶 ) 产生了 这样的重组细胞系, 其中半乳糖末端的或含有半乳糖的 N- 聚糖的产率大于缺乏 Leloir 途 径酶的细胞系。因此, 本发明引起了已被基因工程化为生产半乳糖基化的或唾液酸化的糖 蛋白的巴斯德毕赤酵母细胞系的增加的生产率。
     具体地, 本发明提供了用于在体内生产具有高水平半乳糖或唾液酸的抗体的方法
     本发明解决了上述确定的问题。本发明提供方法和材料用于从缺乏同化半乳糖 作为碳源的能力的宿主细胞产生具有利用半乳糖作为能源的能力的重组宿主细胞。当重 组宿主细胞被进一步基因工程化为生产具有半乳糖末端的或含有半乳糖的 N- 聚糖的糖 蛋白时, 该宿主细胞能够产生重组糖蛋白例如抗体, 其中 G0 ∶ G1/G2 比值小于 2 ∶ 1、 或 G0 ∶ G1/G2 比值为 1 ∶ 1 或更小或 G0 ∶ G1/G2 比值为 1 ∶ 2 或更小。一般而言, 所述包括 将编码 Leloir 途径酶 ( 半乳糖激酶、 UDP- 半乳糖 -C4- 差向异构酶和半乳糖 -1- 磷酸尿苷 酰转移酶以及任选地半乳糖通透酶 ) 引入宿主细胞核酸分子。因此, 本文中的方法和材料 提供选择系统, 其仅通过在含有半乳糖作为碳源的培养基上培养细胞可用于鉴定已被转化 宿主细胞, 以及提供用于生产糖蛋白 ( 具有高水平的末端的或含有半乳糖的 N- 聚糖 ) 例如 免疫球蛋白的方法。
     利用半乳糖作为碳源的能力提供了选择使用的表达系统的灵活性和经济性。例 如, 在设计用于表达具有末端半乳糖或末端唾液酸化的重组糖蛋白的系统中, 可将半乳 糖添加至培养基, 半乳糖被细胞吸收和被细胞利用作为能源并提供半乳糖残基用于参入 N- 聚糖, 其在重组糖蛋白上被合成。本发明的优势是通过使半乳糖存在于培养基或在发酵 过程中添加半乳糖和 / 或诱导重组糖蛋白, 重组蛋白的生产可得到高水平的半乳糖基化的 或唾液酸化的糖蛋白。因此, 如巴斯德毕赤酵母所表明的, 通常缺乏 Leloir 途径的酵母物 种, 以本文公开的方式基因工程化巴斯德毕赤酵母产生可利用半乳糖作为单一碳源的重组 巴斯德毕赤酵母细胞系。另外, 基因工程化巴斯德毕赤酵母细胞系 ( 包括 Leloir 途径酶和 使得细胞能够产生具有半乳糖末端的或含有半乳糖的 N- 聚糖的糖蛋白所需的酶 ) 产生了 这样的重组细胞系, 其中半乳糖末端的或含有半乳糖的 N- 聚糖的产率大于缺乏 Leloir 途 径酶的细胞系。因此, 本发明引起了已被基因工程化为生产半乳糖基化的或唾液酸化的糖 蛋白的巴斯德毕赤酵母细胞系的增加的生产率。
     具体地, 本发明提供了用于在体内生产具有高水平半乳糖或唾液酸的抗体的方法
     和材料。 利用本发明的方法和材料, 将半乳糖添加至细胞生长培养基以完成多个目的, 包括 (a) 能够利用半乳糖作为糖源的宿主细胞的选择 ; (b) 提供用于宿主细胞生长的碳源和 (c) 提供用于参入 N- 聚糖的半乳糖残基来源, 其作为 N- 聚糖中的末端半乳糖残基或提供底物 用于末端唾液酸残基随后添加至 N- 聚糖。因此, 本发明提供方法和材料, 通过该方法和材 料, 可通过体内过程而不是使用更低效和更昂贵的体外反应使半乳糖基化的水平增加, 在 体外反应中, 带电的半乳糖和可溶性半乳糖基转移酶被添加至含有纯化的但部分半乳糖基 化的重组糖蛋白的培养基或溶液中。
     本发明的一个实施方案是发展能够在半乳糖作为单一碳能源存在的培养基上生 存的巴斯德毕赤酵母宿主细胞。利用本发明的方法和材料, 本领域普通技术人员将能够从 本文公开的利用半乳糖作为碳源的转化的宿主细胞生产重组糖蛋白用于选择和维持转化 的宿主细胞。另外, 当宿主细胞已被基因工程化为产生半乳糖基化的或唾液酸化的 N- 聚糖 时, 通过提供具有半乳糖的细胞培养基, 本发明可用于增加从细胞产生的半乳糖基化的或 唾液酸化的糖蛋白的水平。
     因此, 提供巴斯德毕赤酵母宿主细胞, 其已被基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性, 以及任选地半乳糖通 透酶活性, 其中所述宿主细胞能够利用半乳糖作为单一碳能源。 在具体方面, 巴斯德毕赤酵母宿主细胞已被进一步基因工程化为能够产生这样的 重组糖蛋白, 其具有包含半乳糖残基的杂合或复合 N- 聚糖。在具体实施方案中, UDP- 半乳 糖 -4- 差向异构酶活性被提供在融合蛋白中, 所述融合蛋白包含半乳糖基转移酶的催化结 构域和 UDP- 半乳糖 -4- 差向异构酶的催化结构域。
     一般而言, 宿主细胞能够产生具有复合 N- 聚糖的糖蛋白, 其中复合 N- 聚糖的 G0 ∶ G1/G2 比值小于 2 ∶ 1。
     在具体实施方案中, 上述细胞产生的糖蛋白主要具有选自 GalGlcNAcMan5GlcNAc2、 NANAGalGlcNAcMan 5 GlcNAc 2 、GalGlcNAcMan 3 GlcNAc 2 、NANAGalGlcNAcMan 3 GlcNAc 2 、 GalGlcNAc 2 Man 3 GlcNAc 2 、Gal 2 GlcNAc 2 Man 3 GlcNAc 2 、NANAGal 2 GlcNAc 2 Man 3 GlcNAc 2 和 NANA2Gal2GlcNAc2Man3GlcNAc2 的 N- 聚糖。
     在 另 外 的 实 施 方 案 中, N- 聚 糖 是 半 乳 糖 末 端 的 N- 聚 糖,其 选 自 GalGlcNAcMan5GlcNAc2、 Gal2GlcNAc2Man3GlcNAc2 和 Gal2GlcNAc2Man3GlcNAc2。 在 其 他 实 施方案中, N- 聚糖是半乳糖末端的杂合 N- 聚糖 ; 以及在另外的实施方案中, N- 聚糖是 唾液酸化的 N- 聚糖, 其选自 NANAGalGlcNAcMan5GlcNAc2、 NANAGal2GlcNAc2Man3GlcNAc2 和 NANA2Gal2GlcNAc2Man3GlcNAc2。
     另外提供的是在巴斯德毕赤酵母宿主中生产具有 N- 聚糖的重组糖蛋白的方法, 所述 N- 聚糖具有半乳糖残基, 所述方法包括 : a) 提供重组宿主细胞, 其已被基因工程化为 表达 (i) 糖基化途径, 其使得所述宿主细胞能够产生重组糖蛋白, 所述重组糖蛋白具有包 含半乳糖残基的杂合或复合 N- 聚糖 ; (ii) 半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶 活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性 ; 和 (iii) 重组糖蛋 白; 和 b) 在含有半乳糖的培养基中培养所述宿主细胞以产生具有一个或多个 N- 聚糖的重 组糖蛋白, 所述 N- 聚糖具有半乳糖残基。
     在所述方法的进一步的方面, UDP- 半乳糖 -4- 差向异构酶活性被提供在融合蛋白
     一般而言, 宿主细胞能够产生具有复合 N- 聚糖的糖蛋白, 其中复合 N- 聚糖的 G0 ∶ G1/G2 比值小于 2 ∶ 1。
     在具体实施方案中, 上述细胞产生的糖蛋白主要具有选自 GalGlcNAcMan5GlcNAc2、 NANAGalGlcNAcMan 5 GlcNAc 2 、GalGlcNAcMan 3 GlcNAc 2 、NANAGalGlcNAcMan 3 GlcNAc 2 、 GalGlcNAc 2 Man 3 GlcNAc 2 、Gal 2 GlcNAc 2 Man 3 GlcNAc 2 、NANAGal 2 GlcNAc 2 Man 3 GlcNAc 2 和 NANA2Gal2GlcNAc2Man3GlcNAc2 的 N- 聚糖。
     在 另 外 的 实 施 方 案 中, N- 聚 糖 是 半 乳 糖 末 端 的 N- 聚 糖,其 选 自 GalGlcNAcMan5GlcNAc2、 Gal2GlcNAc2Man3GlcNAc2 和 Gal2GlcNAc2Man3GlcNAc2。 在 其 他 实 施方案中, N- 聚糖是半乳糖末端的杂合 N- 聚糖 ; 以及在另外的实施方案中, N- 聚糖是 唾液酸化的 N- 聚糖, 其选自 NANAGalGlcNAcMan5GlcNAc2、 NANAGal2GlcNAc2Man3GlcNAc2 和 NANA2Gal2GlcNAc2Man3GlcNAc2。
     另外提供的是在巴斯德毕赤酵母宿主中生产具有 N- 聚糖的重组糖蛋白的方法, 所述 N- 聚糖具有半乳糖残基, 所述方法包括 : a) 提供重组宿主细胞, 其已被基因工程化为 表达 (i) 糖基化途径, 其使得所述宿主细胞能够产生重组糖蛋白, 所述重组糖蛋白具有包 含半乳糖残基的杂合或复合 N- 聚糖 ; (ii) 半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶 活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性 ; 和 (iii) 重组糖蛋 白; 和 b) 在含有半乳糖的培养基中培养所述宿主细胞以产生具有一个或多个 N- 聚糖的重 组糖蛋白, 所述 N- 聚糖具有半乳糖残基。
     在所述方法的进一步的方面, UDP- 半乳糖 -4- 差向异构酶活性被提供在融合蛋白
     中, 所述融合蛋白包含半乳糖基转移酶的催化结构域和 UDP- 半乳糖 -4- 差向异构酶的催化 结构域。
     本发明另外提供选择表达异源蛋白的重组宿主细胞的方法。 用编码异源蛋白和不 存在于重组宿主细胞的 Leloir 途径酶的一个或多个核酸分子转化表达一种或两种但不是 全部的 Leloir 途径酶活性的重组宿主细胞。由于转化的重组宿主细胞含有完整的 Leloir 途径, 从非转化的细胞中选择表达异源蛋白的转化的重组宿主细胞可通过在半乳糖是单一 碳源的培养基中培养转化的重组宿主细胞获得。因此, 另外提供的是产生表达异源蛋白的 重组宿主细胞的方法, 其包括 : (a) 提供已被基因工程化为表达一种或两种酶的宿主细胞, 所述酶选自半乳糖激酶、 UDP- 半乳糖 -4- 差向异构酶和半乳糖 -1- 磷酸尿苷酰转移酶 ; (b) 用编码异源蛋白和在步骤 (a) 的宿主细胞中不表达的选自步骤 (a) 的酶或多种酶的一个或 多个核酸分子转化所述宿主细胞 ; 和 (c) 在含有半乳糖作为单一碳能源的培养基中培养所 述宿主细胞以提供表达异源蛋白的重组巴斯德毕赤酵母宿主细胞。 在所述方法的进一步的 方面, 宿主细胞被基因工程化为表达半乳糖通透酶。 在还进一步的方面, 宿主细胞被基因修 饰以产生糖蛋白, 所述糖蛋白具有一个或多个包含半乳糖的 N- 聚糖。
     另外提供的是产生和选择能够利用半乳糖作为单一碳源的巴斯德毕赤酵母宿主 细胞的方法, 所述方法包括 : a) 提供巴斯德毕赤酵母宿主细胞 ; b) 用编码半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通 透酶的一个或多个核酸分子转化所述宿主细胞 ; c) 在含有半乳糖作为单一碳源的培养基 上培养转化的宿主细胞 ; 和 d) 选择可以在含有半乳糖作为单一碳源的培养基上生长的宿 主细胞。 本文中的宿主细胞和方法能够生产包含重组糖蛋白的组合物, 其中在药学上可接 受的载体中重组糖蛋白上的 G0 ∶ G1/G2 糖形的比值小于 2 ∶ 1。在具体实施方案中, 重组 糖蛋白选自红细胞生成素 (EPO), 细胞因子例如干扰素 α、 干扰素 β、 干扰素 γ 和干扰素 ω, 和粒细胞集落刺激因子 (GCSF), GM-CSF, 凝固因子例如因子 VIII、 因子 IX 和人蛋白 C, 抗凝血酶 III, 凝血酶, 可溶性 IgE 受体 α- 链, 免疫球蛋白例如 IgG、 IgG 片段、 IgG 融合体 和 IgM, 免疫粘附素和其它 Fc 融合蛋白例如可溶性 TNF 受体 -Fc 融合蛋白, RAGE-Fc 融合蛋 白, 白细胞介素, 尿激酶, 糜蛋白酶和尿胰蛋白酶抑制剂, IGF- 结合蛋白, 表皮生长因子, 生 长激素释放因子, 膜联蛋白 V 融合蛋白, 制管张素, 血管内皮生长因子 -2, 骨髓样前体抑制 因子 -1, 骨保护蛋白, α-1- 抗胰蛋白酶, 甲胎蛋白, DNA 酶 II, 人纤溶酶原的三环 3, 葡糖脑 苷脂酶, TNF 结合蛋白 1, 促卵泡激素, 细胞毒性 T 淋巴细胞相关抗原 4-Ig, 跨膜激活剂和钙 调节剂和亲环蛋白配体, 胰高血糖素样蛋白 1 和 IL-2 受体激动剂。
     在另外的实施方案中, 糖蛋白是抗体, 具体是人源化的、 嵌合或人抗体。在具体 实施方案中, 抗体选自抗 -Her2 抗体、 抗 -RSV( 呼吸道合胞病毒 ) 抗体、 抗 -TNFα 抗体、 抗 -VEGF 抗体、 抗 -CD3 受体抗体、 抗 -CD41 7E3 抗体、 抗 -CD25 抗体、 抗 -CD52 抗体、 抗 -CD33 抗体、 抗 -IgE 抗体、 抗 -CD11a 抗体、 抗 -EGF 受体抗体和抗 -CD20 抗体及其变体。抗体的实 例包括莫罗单抗 -CD3、 阿昔单抗、 利妥昔单抗、 达珠单抗、 巴利昔单抗、 帕利珠单抗、 英利昔 单抗、 曲妥珠单抗、 吉姆单抗奥佐米星、 阿仑单抗、 替伊莫单抗、 阿达木单抗、 奥马珠单抗、 托 西莫单抗 -131I、 依法利珠单抗、 西妥昔单抗、 戈利木单抗和贝伐单抗。
     在还进一步的实施方案中, 糖蛋白是 Fc 融合蛋白, 例如依那西普。
     在另外的实施方案中, 糖蛋白是抗体, 具体是人源化的、 嵌合或人抗体。在具体 实施方案中, 抗体选自抗 -Her2 抗体、 抗 -RSV( 呼吸道合胞病毒 ) 抗体、 抗 -TNFα 抗体、 抗 -VEGF 抗体、 抗 -CD3 受体抗体、 抗 -CD41 7E3 抗体、 抗 -CD25 抗体、 抗 -CD52 抗体、 抗 -CD33 抗体、 抗 -IgE 抗体、 抗 -CD11a 抗体、 抗 -EGF 受体抗体和抗 -CD20 抗体及其变体。抗体的实 例包括莫罗单抗 -CD3、 阿昔单抗、 利妥昔单抗、 达珠单抗、 巴利昔单抗、 帕利珠单抗、 英利昔 单抗、 曲妥珠单抗、 吉姆单抗奥佐米星、 阿仑单抗、 替伊莫单抗、 阿达木单抗、 奥马珠单抗、 托 西莫单抗 -131I、 依法利珠单抗、 西妥昔单抗、 戈利木单抗和贝伐单抗。
     在还进一步的实施方案中, 糖蛋白是 Fc 融合蛋白, 例如依那西普。
     尽管巴斯德毕赤酵母证实作为如本文所公开的可被修饰的宿主细胞的实例, 但是 方法和宿主细胞不限于巴斯德毕赤酵母。 本文的方法可用于产生来自其他低等真核细胞物 种的重组宿主细胞, 所述物种通常不表达 Leloir 途径酶并如此不能利用半乳糖作为碳源。 因此, 在另外的实施方案中, 宿主细胞是通常不表达 Leloir 途径酶的任何低等真核细胞物 种。
     定义
     除非另有定义, 本文所用的所有技术和科学具有与本发明所属领域的普通技术人 员通常理解的相同含义。另外, 除非上下文另有要求, 单数术语应包括复数和复数术语应 包括单数。通常地, 所用的相关命名和本文所述的生化、 酶学、 分子和细胞生物学、 微生物 学、 遗传学以及蛋白和核酸化学以及杂交技术是本领域熟知并通常使用的。本发明的方法 和技术通常根据本领域熟知的常规方法并如贯穿本说明书引用和讨论的各种一般和更具 体的参考中所述的进行, 除非另有说明。参见, 例如, Sambrook 等人 Molecular Cloning : A Laboratory Manual, 2d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(1989) ; Ausubel 等人, Current Protocols in Molecular Biology, Greene Publishing Associates(1992, 和 Supplements to 2002) ; Harlow 和 Lane, Antibodies : A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(1990) ; Taylor 和 Drickamer, Inrroduction to Glycobiology, Oxford Univ. Press(2003) ; Worthington Enzyme Manual, Worthington Biochemical Corp., Freehold, NJ ; Handbook of Biochemistry : Section A Proteins, Vol I, CRC Press(1976) ; Handbook of Biochemistry : Section A Proteins, Vol II, CRC Press(1976) ; Essentials of Glycobiology, Cold Spring Harbor Laboratory Press(1999)。示例性方法和材料如下 述, 虽然与本文所述类似或等同的方法和材料也可用于本发明的实践并应对本领域普通技 术人员是显而易见的。 本文提及的所有公开和其他参考通过参考对于它们引用的公开内容 而被整体引入。在矛盾的情况下, 以本说明书 ( 包括定义 ) 为准。材料、 方法和实施例仅是 说明性的, 且意图不是以任何方式限制。
     以下术语, 除非另有说明, 应理解具有以下含有 :
     如本文所用, 术语 “人源化的” 、 “人源化” 和 “人样” 可互换地使用, 是指以一种方 式工程化非人细胞例如低等真核宿主细胞的方法, 其中该方式引起工程化的细胞具有产生 蛋白特别是糖蛋白的能力, 所述糖蛋白具有糖基化, 比相同物种的非工程化的、 野生型非人 细胞产生的糖蛋白具有更类似哺乳动物糖基化的模式。人源化可对于 N- 糖基化、 O- 糖基 化或二者进行。例如, 野生型巴斯德毕赤酵母和其它低等真核细胞通常在 N- 糖基化位点产 生高甘露糖基化的蛋白。在本发明优选的实施方案中, 本发明的 “人源化的” 宿主细胞能够 产生具有杂合和 / 或复合 N- 聚糖的糖蛋白 ; 即 “人样 N- 糖基化” 。人源化的宿主细胞产生 的糖蛋白上主要存在的特定 “人样” 聚糖将取决于进行的特定人源化步骤。
     如本文所用, 术语 “N- 聚糖” 和 “糖形” 可互换地使用和是指 N- 连接的寡糖, 例如, 通过天冬酰胺 -N- 乙酰基葡糖胺连接而连接到多肽的天冬酰胺残基的寡糖。N- 连接的糖 蛋白含有连接到蛋白中天冬酰胺残基的酰胺氮上的 N- 乙酰基葡糖胺残基。糖蛋白上发现 的主要糖是葡萄糖、 半乳糖、 甘露糖、 果糖、 N- 乙酰基半乳糖胺 (GalNAc)、 N- 乙酰基葡糖胺 (GlcNAc) 和唾液酸 ( 例如 N- 乙酰基 - 神经氨酸 (NANA))。对于 N- 连接的糖蛋白, 糖基团的加工在 ER 的腔中与翻译同时发生并在高尔基体中继续。
     N- 聚糖具有共同的五糖核心 Man3GlcNAc2(“Man” 是指甘露糖 ; “Glc” 是指葡萄糖 和 “NAc” 是指 N- 乙酰基、 GlcNAc 是指 N- 乙酰基葡糖胺 )。根据分支 ( 触角 ) 的数量, N- 聚 糖不同, 所述分支 ( 触角 ) 包含被添加至 Man3GlcNAc2(“Man3” ) 核心结构 ( 还称为 “三甘 露糖核心” 、 “五糖核心” 或 “少甘露糖核心” ) 的外周糖 ( 例如 GlcNAc、 半乳糖、 果糖和唾液 酸 )。N- 聚糖根据它们分支的成分 ( 例如高甘露糖、 复合或杂合 ) 而分类。 “高甘露糖” 型 N- 聚糖具有 5 个或更多个甘露糖残基。 “复合” 型 N- 聚糖通常具有至少一个连接至 1, 3甘 露糖臂的 GlcNAc 和至少一个连接至 “三甘露糖” 核心的 1, 6 甘露糖臂的 GlcNAc。复合 N- 聚 糖也可具有半乳糖 (“Gal” ) 或 N- 乙酰基半乳糖胺 (“GalNAc” ) 残基, 其任选地用唾液 酸或衍生物 ( 例如, “NANA” 或 “NeuAc” , 其中 “Neu” 是指神经氨酸和 “Ac” 是指乙酰基 ) 修 饰。复合 N- 聚糖也可具有链内置换, 其包含 “等分的” GlcNAc 和核心果糖 (“Fuc” )。复合 N- 聚糖也可在 “三甘露糖核心” 上具有多个触角, 通常称为 “多触角聚糖” 。 “杂合” N- 聚糖 在三甘露糖核心的 1, 3 甘露糖臂末端具有至少一个 GlcNAc 并在三甘露糖核心的 1, 6 甘露 糖臂上具有 0 或多个甘露糖。多种 N- 聚糖也称为 “糖形” 。图 2 显示多种高甘露糖、 杂合和 复合 N- 聚糖, 其已在基因工程化为产生哺乳动物样 N- 聚糖的巴斯德毕赤酵母中产生。 如本文所用, 术语 “O- 聚糖” 和 “糖形” 可互换地使用和是指 O- 连接的寡糖, 例如, 经由丝氨酸或苏氨酸残基的羟基连接至肽链的聚糖 . 在真菌细胞中, 天然 O- 糖基化通过将 在内质网中从多萜醇单磷酸甘露糖 (Dol-P-Man) 转移的第一个甘露糖基残基连接到蛋白 而发生, 和另外的甘露糖基残基可在高尔基体中经由从 GPD-Man 转移而被连接。高等真核 细胞, 例如人或哺乳动物细胞, 通过将 N- 乙酰基 - 半乳糖胺 (GlcNac) 共价连接到丝氨酸或 苏氨酸残基经历 O- 糖基化。
     如本文所用, 术语 “人样 O- 糖基化” 应理解为含义是真菌 - 特定的磷酸化甘露糖结 构被降低或消除, 引起电荷和 β- 甘露糖结构的降低或消除, 或糖蛋白上存在的和糖蛋白 组合物中的主要 O- 聚糖种类包括具有选自 GlcNac、 Gal 或 NANA( 或 Sia) 的末端残基加帽 的聚糖。以这种方式, 具有主要人样 O- 糖基化的重组糖蛋白可被人或哺乳动物细胞识别, 如同它是天然产生的糖蛋白, 其产生重组糖蛋白的改进的治疗用性质。
     本文所用的缩写是本领域常见使用的, 参见, 例如, 上述糖的缩写。其他常见缩写 包括 “PNGase” 或 “聚糖酶” 或 “葡糖苷酶” 均是指肽 N- 糖苷酶 F(EC 3.2.2.18)。
     如本文所用, 术语 “抗体” 、 “免疫球蛋白” 和 “免疫球蛋白分子” 可互换地使用。每 个免疫球蛋白分子具有独特结构, 使得其结合它的特异性抗原, 但所有免疫球蛋白具有本 文所述的相同整体结构。基础的免疫球蛋白结构单元已知包括亚基的四聚体。每个四聚 体具有两对相同的多肽链, 每对具有一个 “轻” 链 (LC)( 约 25kDa) 和一个 “重” 链 (HC)( 约 50-70kDa)。每个链的氨基 - 末端部分包括约 100-110 或更多个氨基酸的可变区, 主要负责 抗原识别。每个链的羧基 - 末端部分确定恒定区, 主要负责效应物功能。轻链 (LCs) 被分 类为 κ 或 λ。重链 (HCs) 分类为 γ、 μ、 α、 δ 或 ε 和确定抗体同种型分别为 IgG、 IgM、 IgA、 IgD 和 IgE。
     轻 和 重 链 被 亚 分 类 为 可 变 区 和 恒 定 区 ( 通 常 参 见 Fundamental Immunology(Paul, W., ed., 2nd ed.Raven Press, N.Y., 1989), Ch.7。每个轻 / 重链对的可 变区形成抗体结合位点。因此, 天然抗体具有两个结合位点。除了双功能或双特异抗体, 两
     个结合位点是相同。链都显示相同的通常结构, 被三个高度可变区连接的相对保守构架区 (FR), 还称为互补决定区或 CDR。来自每对的两个链的 CDR 通过构架区连接, 使得结合特异 性表位。术语包括天然形成形式、 以及片段和衍生物。包括在术语范围内的是免疫球蛋白 (Igs) 的种类, 称为 IgG、 IgA、 IgE、 IgM 和 IgD。还包括在术语范围内的是 IgG 的亚型, 称为 IgG1、 IgG2、 gG3 和 IgG4。术语用于最广泛的含义并包括单个单克隆抗体 ( 包括激动剂和 拮抗剂抗体 ) 以及结合多个表位或抗原的抗体组合物。术语特定地覆盖单克隆抗体 ( 包括 全长单克隆抗体 )、 多克隆抗体、 多特异抗体 ( 例如双特异抗体 ) 和抗体片段, 只要它们含 有或被修饰为含有重链免疫球蛋白恒定区的 CH2 结构域的至少一部分, 其包括 CH2 结构域的 N- 连接的糖基化位点或其变体。包括在术语内的是仅包含 Fc 区的分子, 例如免疫黏附素 ( 美国公开的专利申请号 20040136986)、 Fc 融合和抗体样分子。可选地, 这些术语可以是 指至少 Fab 区的抗体片段, 其至少含有 N- 连接的糖基化位点。
     术语 “Fc” 片段是指抗体的 “片段结晶的” C- 末端区, 其含有 CH2 和 CH3 结构域。术 语 “Fab” 片段是指抗体的 “片段抗原结合” 区, 其含有 VH、 CH1、 VL 和 CL 结构域。
     如本文所用术语 “单克隆抗体” (mAb) 是指获自基本上均一的抗体群体的抗体, 即 包含群体是相同的单独的抗体, 除了可以小量存在的可能天然存在的突变。单克隆抗体是 高度特异性的, 是针对单个抗原性位点。另外, 与通常包括针对不同决定簇 ( 表位 ) 的不 同抗体的常规 ( 多克隆 ) 抗体制备物相反, 每个 mAb 针对抗原上的单个决定簇。除了它们 特异性, 单克隆抗体是有利的, 原因在于它们可以是通过杂交瘤培养合成的, 不被其他免疫 球蛋白污染。术语 “单克隆” 指示抗体的特征为获自基本上均一的抗体群体, 并且不解释为 要求通过任何具体方法产生抗体。例如, 根据本发明使用的单克隆抗体可由 Kohler 等人, (1975)Nature, 256 : 495 首次描述的杂交瘤方法制备或可通过重组 DNA 方法制备 ( 参见, 例 如, Cabilly 等人的美国专利号 4,816,567)。
     在术语 “抗体” 或 “免疫球蛋白” 范围内的术语 “片段” 包括 those 通过用多种蛋白 酶消化产生的、 通过化学切割和 / 或化学解离产生的和重组地产生的片段, 只要片段保持 能够特异性结合靶分子。在这类片段中的是 Fc、 Fab、 Fab’ 、 Fv、 F(ab’ )2 和单链 Fv(scFv) 片段。下文中, 术语 “免疫球蛋白” 也包括术语 “片段” 。
     免疫球蛋白另外包括免疫球蛋白或片段, 其在序列上已被修饰但保持能够特异 性结合靶分子, 包括 : 物种间嵌合和人源化的抗体 ; 抗体融合 ; 异聚体抗体复合物和抗体 融合, 例如双抗体 ( 双特异抗体 ), 单链双抗体和胞内抗体 ( 参见, 例如, Intracellular Antibodies : Research and Disease Applications, (Marasco, ed., Springer-Verlag New York, Inc., 1998)。
     术语 “催化抗体” 是指能够催化生化反应的免疫球蛋白分子。 催化抗体是本领域熟 知的并已被描述在 Schochetman 等人的美国专利号 7,205,136 ; 4,888,281 和 5,037,750, 以及 Barbas, III 等人的美国专利号 5,733,757 ; 5,985,626 和 6,368,839 中。
     如本文所用术语 “载体” 意图是指能够转运已被连接的另一个核酸的核酸分子。 一 种类型的载体是 “质粒” , 其是指环状双链 DNA 环, 在其中另外的 DNA 片段可被连接。其他载 体包括黏粒、 细菌人工染色体 (BAC) 和酵母人工染色体 (YAC)。 另一种类型的载体是病毒载 体, 其中另外的 DNA 片段可连接至病毒基因组 ( 如下更详细讨论 )。某些载体能够在它们 被引入的宿主细胞中自我复制 ( 例如, 载体具有在宿主细胞中发挥作用的复制起点 )。其他载体在引入宿主细胞后可以被整合到宿主细胞的基因组, 以及从而随宿主基因组一起复 制。另外, 某些优选的载体能够引导被可操作地连接的基因的表达。这类载体在本文称为 “重组表达载体” ( 或简称 “表达载体” )。
     如本文所用, 术语 “目的序列” 或 “目的基因” 是指核酸序列, 通常编码蛋白, 其通常 不能在宿主细胞中产生。 本文公开的方法使得稳定整合到宿主细胞基因组中的一个或多个 目的序列或目的基因的有效表达。 目的序列的非限制实例包括编码一个或多个具有酶促活 性的多肽的序列, 例如, 所述酶为在宿主中影响 N- 聚糖合成酶, 例如甘露糖基转移酶、 N- 乙 酰基葡糖胺转移酶、 UDP-N- 乙酰基葡糖胺转运蛋白、 半乳糖基转移酶、 UDP-N- 乙酰基半乳 糖基转移酶、 唾液酸转移酶和岩藻糖基转移酶。
     术语 “标记序列” 或 “标记基因” 是指这样的核酸序列, 其能够表达使得对于在宿主 细胞存在或缺乏序列进行阳性或阴性选择的活性。例如, 巴斯德毕赤酵母 URA5 基因是标记 基因, 因为它的存在可以是通过含有基因的细胞在尿嘧啶缺乏下生长的能力而被选择。它 的存在还可通过含有基因的细胞不能在 5-FOA 存在下生长而被选择。标记序列或基因不必 需地显示阳性和阴性可选择性。 来自巴斯德毕赤酵母的标记序列或基因的非限制实例包括 ADE1、 ARG4、 HIS4 和 URA3。对于抗生素抗性标记基因, 通常利用卡那霉素、 新霉素、 遗传霉素 ( 或 G418)、 巴龙霉素和潮霉素抗性基因以允许在这些抗生素存在下生长。 术语 “可操作地连接” 表达控制序列是指这样的连接, 其中表达控制序列与目的基 因是连续的以控制目的基因以及表达控制序列, 其以反式或以一定距离发挥作用以控制目 的基因。
     术语 “表达控制序列” 或 “调节序列” 可互换地使用和如本文所用是指多核苷酸序 列, 其对影响被可操作地连接的编码序列的表达是必需的。 表达控制序列是控制转录、 转录 后事件和核酸序列翻译的序列。 表达控制序列包括适当的转录起始、 终止、 启动子和增强子 序列 ; 有效 RNA 加工信号例如剪切和多聚腺苷酸信号 ; 稳定细胞质 mRNA 的序列 ; 增强翻译 效率的序列 ( 例如, 核糖体结合位点 ) ; 增强蛋白稳定性的序列和当期望时, 增强蛋白分泌 的序列。 这类控制序列的性质根据宿主生物而不同 ; 在原核生物中, 这类控制序列通常包括 启动子、 核糖体结合位点和转录终止序列。术语 “控制序列” 意图最小程度地包括其存在对 表达是必要的所有成分, 还可包括其存在是有利的另外的成分, 例如, 引导序列和融合配偶 体序列。
     如本文所用, 术语 “重组宿主细胞” (“表达宿主细胞” , “表达宿主系统” , “表达系 统” 或简称″宿主细胞″ ) 意图是指重组载体已被引入其中的细胞。应理解的是这类术语 意图不仅是指具体对象细胞, 而且是指这类细胞的后代。 因为某些修饰可在后代中发生, 原 因在于突变或环境影响, 这类后代实际上可以与母本细胞不相同, 但仍包括在本文所用的 术语 “宿主细胞” 范围内。重组宿主细胞可以是分离的细胞或在培养物中生长的细胞系或 可以是存在于活体组织或生物中的细胞。
     术语 “真核” 是指有核细胞或生物并包括昆虫细胞、 植物细胞、 哺乳动物细胞、 动物 细胞和低等真核细胞 .
     术语 “低等真核细胞” 包括酵母、 真菌、 领鞭毛虫、 微孢子虫、 alveolates( 例如腰 鞭毛虫 )、 原生藻 ( 例如褐色藻类、 原生动物 )、 红藻 ( 例如红藻 (red algae))、 植物 ( 例如 绿藻、 植物细胞、 苔藓 ) 和其它原生生物。 酵母和丝状真菌包括但不限于 : 巴斯德毕赤酵母、
     芬兰毕赤酵母 (Pichia finlandica)、 喜海藻糖毕赤酵母 (Pichia trehalophila)、 Pichia koclamae、 膜醭毕赤酵母 (Pichia membranaefaciens)、 微小毕赤酵母 (Pichia minuta) (Ogataea minuta、 Pichia lindneri)、 Pichia opuntiae、 Pichia thermotolerans、 柳毕 赤酵母 (Pichia salictaria)、 Pichia guercuum、 皮杰普毕赤酵母 (Pichia pijperi)、 树 干毕赤酵母 (Pichia stiptis)、 甲醇毕赤酵母 (Pichia methanolica)、 毕赤酵母属的种 (Pichia sp.)、 酿酒酵母 (Saccharomyces cerevisiae)、 酵母菌属的种 (Saccharomyces sp.)、 多形汉逊酵母 (Hansenula polymorpha)、 克鲁维酵母属的种 (Kluyveromyces sp.)、 乳酸克鲁维酵母 (Kluyveromyces lactis)、 白色念珠菌 (Candida albicans)、 构巢曲霉 (Aspergillus nidulans)、 黑曲霉 (Aspergillus niger)、 米曲霉 (Aspergillus oryzae)、 里氏木霉 (Trichoderma reesei)、 Chrysosporium lucknowense、 镰孢菌属的种 (Fusarium sp.)、 禾谷镰孢菌 (Fusarium gramineum)、 Fusarium venenatum、 Physcomitrella patens 和粗糙脉胞菌 (Neurospora crassa)。
     本文所用术语 “肽” 指短的多肽, 例如通常少于约 50 个氨基酸长度且更通常少于 约 30 个氨基酸长度的多肽。如本文所用的术语包括类似物和模拟结构并因此模拟生物学 功能的模拟物。
     术语 “多肽” 包括天然形成的和非天然形成的蛋白及其片段、 突变体、 衍生物和类 似物。多肽可单体的或多聚体的。另外, 多肽可包括多个不同结构域, 其中各个具有一种或 多种独特的活性。
     术语 “分离的蛋白” 或 “分离的多肽” 是这样的蛋白或多肽, 由于其衍生的起源或 来源 (1 不与在其天然状态中伴随它的天然结合的成分结合, (2) 在自然界中未发现以纯化 物存在, 其中可以就其它细胞成份而论判断纯化物 ( 例如, 不含来自同一物种的其它蛋白 质 ), (3) 由来自不同物种的细胞表达, 或 (4) 在自然界中不存在 ( 例如, 它是在自然界中发 现的多肽的片段或它包括在自然界中没有发现的氨基酸类似物或衍生物或不是标准肽键 的连接 ) 的蛋白质或多肽。因此, 化学合成的多肽或在与多肽所来源的细胞体系不同的细 胞体系中合成的多肽将从其天然结合的成分中 “分离” 。 也可以使用本领域熟知的蛋白纯化 技术, 通过分离, 使多肽或蛋白质基本上不含或纯化天然结合的成分。 如这样所定义的, “分 离的” 不必要求这样描述的蛋白质、 多肽、 肽或寡肽已经从其自然环境中物理地移出。
     本文所用术语 “多肽片段” 是指具有缺失, 例如, 与全长多肽比较的氨基端和 / 或 羧基端缺失的多肽。 在优选的实施方案中, 多肽片段是连续序列, 其中片段的氨基酸序列与 在天然存在的序列中的相应位置同一。片段的长度典型地为至少 5、 6、 7、 8、 9 或 10 个氨基 酸, 优选至少 12、 14、 16 或 18 个氨基酸, 更优选至少 20 个氨基酸, 更优选至少 25、 30、 35、 40 或 45 个氨基酸, 甚至更优选至少 50 或 60 个氨基酸, 和甚至更优选至少 70 个氨基酸。
     修饰的衍生物” 指在一级结构序列中基本上同源的, 但包括, 例如, 在体内的或在 体外的化学修饰和生物化学修饰的、 或掺入在天然多肽中没有发现的氨基酸的多肽或其片 段。这样的修饰包括, 例如, 乙酰化、 羧化、 磷酰化、 糖基化、 泛素化、 标记例如用放射性核 素、 和各种酶的修饰, 如将容易被本领域的技术人员所了解的。标记多肽的多种方法和用 32 35 于此目的的多种取代物或标记物为本领域所熟知, 并包括放射性同位素例如 125I、 P、 S、 3 和 H, 结合至标记的抗配体 ( 例如, 抗体 ) 的配体, 荧光团, 化学发光剂, 酶, 和可以用作标 记的配体的特异性结合配对成员的抗配体。标记物的选择依赖于所需要的灵敏度、 与引物结合的容易程度、 稳定性要求、 和可利用的仪器。用于标记多肽的方法为本领域所熟知。 见, 例如, Ausubel 等, Current Protocols in Molecular Biology, Greene Publishing Associates(1992, 和 2002 的增刊 )( 通过引用并入本文中 )。
     术语 “嵌合基因” 或 “嵌合核苷酸序列” 是指核苷酸序列, 其包含偶联到异源核苷 酸序列的核苷酸序列或片段。嵌合序列用于融合蛋白的表达。嵌合基因或嵌合核苷酸序列 也可包括一个或多个片段或结构域, 其对于意图的宿主细胞是异源的, 并且可具有产生异 源重组蛋白的优势性质。通常, 嵌合核苷酸序列包括来自基因的至少 30 个连续核苷酸, 更 优选至少 60 或 90 或更多个核苷酸。嵌合核苷酸序列在本发明中具有特别用途, 所述嵌合 核苷酸序列具有至少一个对于意图的宿主细胞是异源的但与意图的重组蛋白同源的片段 或结构域。例如, 意图用于在利用巴斯德毕赤酵母宿主细胞以表达重组人糖蛋白的表达系 统中的嵌合基因应优选具有至少一个片段或结构域, 其是人来源的, 例如编码具有潜在治 疗用价值的人蛋白的序列, 而嵌合基因的其余部分, 例如应使得宿主细胞处理并表达嵌合 基因的调节序列, 应优选是巴斯德毕赤酵母来源的。 如果期望的, 人来源的片段也可以是对 于在宿主细胞中表达是密码子最优化的。( 参见, 例如, 美国专利 6,884,602, 在此通过引用 并入 )。
     术语 “融合蛋白” 或 “嵌合蛋白” 是指包含与异源氨基酸序列偶联的多肽或片段的 多肽。融合蛋白是有用的, 因为它们可以被构建以包含来自两种或更多种不同蛋白的两个 或多个所需功能元件。融合蛋白包含来自目的多肽的至少 10 个连续氨基酸, 优选至少 20 或 30 个氨基酸, 甚至更优选至少 40、 50 或 60 个氨基酸, 还更优选至少 75、 100 或 125 个氨 基酸。包括整个本发明蛋白的融合具有特殊的效用。包含于本发明融合蛋白内的异源多肽 的长度为至少 6 个氨基酸, 通常至少 8 个氨基酸, 和有用地为至少 15、 20、 和 25 个氨基酸。 融合体还包括较大的多肽、 或甚至整个蛋白质, 例如绿色荧光蛋白 (“GFP” ), 具有特殊效用 的含发色团的蛋白质。 可以通过将编码多肽或其片段的核酸序列在框内与编码不同蛋白质 或多肽的核酸序列一起构建, 然后表达融合蛋白, 来重组产生融合蛋白。或者, 可以通过交 联多肽或其片段至另一蛋白质, 来以化学方法产生融合蛋白。
     术语 “非肽类似物” 是指具有与那些参考多肽类似的性质的化合物。 非肽化合物也 可以称为 “肽模拟物” 或 “拟肽” . 参见, 例如, Jones, Amino Acid and Peptide Synthesis, Oxford University Press(1992) ; Jung, Combinatorial Peptide and Nonpeptide 文 库: A Handbook, John Wiley(1997) ; Bodanszky 等, Peptide Chemistry-A Practical Textbook, Springer Verlag(1993) ; Synthetic Peptides : A Users Guide, (Grant, 编辑, W.H.Freeman and Co., 1992) ; Evans 等, J.Med.Chem.30 : 1229(1987) ; Fauchere, J.Adv. Drug Res.15 : 29(1986) ; Veber 和 Freidinger, Trends Neurosci., 8: 392-396(1985) ; 和在 以上各出版物中所引用的参考文献, 其通过参考并入本文。这样的化合物经常在计算机分 子模拟的帮助下开发。 在结构上与本发明的有用肽相似的肽模拟物可用于产生同等作用并 因此被考虑为本发明的一部分。
     术语 “区域” 如本文所用是指生物分子的一级结构的在物理上的邻接部分。对于 蛋白质而言, 区域被定义为该蛋白质的氨基酸序列连续部分。
     术语 “结构域” 如本文所用是指作用于生物分子已知或未知功能的生物分子结构。 结构域可与区域或其部分共延伸 ; 结构域也可以包括生物分子的不同的、 非连续的区域。如本文所用, 术语 “分子” 意思是任意化合物, 包括但不是限于小分子、 肽、 蛋白质、 糖、 核苷酸、 核酸、 脂类等, 并且这样的化合物可以是天然的或合成的。
     如本文所用, 术语 “包括” (“comprise” ) 或变化例如 “包括” (“comprises” )或 “包括” (“comprising” ), 应理解为意指包含规定的整体或成组的整体但不排除任何其它 的整体或成组的整体。
     如本文所用, 术语 “主要地” 或变化例如 “主要的” 或 “其是主要的” 应理解为意指 在已经用 PNG 酶处理糖蛋白并由质谱例如 MALDI-TOF MS 分析释放的聚糖之后具有最高摩 尔百分比 (% ) 的总 O- 聚糖或 N- 聚糖的聚糖种类。换言之, 短语 “主要地” 被定义为为个 体实体, 以使特定 “主要” 糖形以比任何其它个体实体更大的摩尔百分比存在。例如, 如果 组合物由 40 摩尔百分比的种类 A、 35 摩尔百分比的种类 B 和 25 摩尔百分比的种类 C 组成, 则组合物主要包含种类 A。 附图说明
     图 1 图解了人和巴斯德毕赤酵母中 N- 糖基化途径。ER 中的早期事件是高度保守 的, 包括由葡糖苷酶 I 和 II 去除三个葡萄糖残基和由 ER 甘露糖苷酶处理单个特定 α-1, 2- 连接的甘露糖残基, 引起相同核心结构 Man8GlcNAc2(Man8B)。 但是, 加工事件在高尔基体 中不同。Mns, α-1, 2- 甘露糖苷酶 ; MnsII, 甘露糖苷酶 II ; GnT I, α-1, 2-N- 乙酰基葡糖 胺转移酶 I ; GnT II, α-1, 2-N- 乙酰基葡糖胺转移酶 II ; MnT, 甘露糖基转移酶。两个核心 GlcNAc 残基虽然在所有情况中存在, 但在命名中忽略。
     图 2 图解了 N- 糖基化中的关键中间步骤以及缩写命名, 其指产生各自聚糖结构 (GS) 的基因工程化巴斯德毕赤酵母菌株。
     图 3 图解了 N- 糖苷酶 F 释放的 N- 聚糖的 MALDI-TOF 质谱 (MS) 分析。K3( 人纤 溶酶原的三环 3 结构域 ) 在巴斯德毕赤酵母菌株 GS115 来源的野生型对照 (Invitrogen, Carlsbad, CA)、 YSH44、 YSH71、 RDP52 和 RDP80 中产生并通过 Ni- 亲和层析从培养物上清液 中纯化。通过 N- 糖苷酶 F 处理释放 N- 聚糖并进行 MALDI-TOF MS 分析 ( 阳性模式, 除了图 3G 是阴性模式 ), 其表现为钠或钾络合物。两个核心 GlcNAc 残基虽然存在, 但在命名中忽 略。GN, GlcNAc ; M, 甘露糖。
     图 3A : GS115 来源的野生型对照菌株中产生的 N- 聚糖 ;
     图 3B : 菌株 YSH44 中 K3 上产生的 N- 聚糖 ;
     图 3C : 菌株 YSH71(YSH44 表达 hGalTI) 中 K3 上产生的 N- 聚糖,
     图 (3D) 菌株 RDP52(YSH44 表达 hGalTI 和 SpGALE) 中 K3 上产生的 N- 聚糖,
     图 (3E) 菌株 RDP80(YSH44 表达 hGalTI、 SpGALE 和 DmUGT) 中 K3 上产生的 N- 聚 糖;
     图 (3F) 在 α- 半乳糖苷酶体外处理后来自 RDP80 的聚糖 ; 和
     图 (3G) 在用 α-2, 6-(N)- 唾液酸转移酶处理后在阴性模式中来自 RDP80 的聚糖。
     图 4 图解了 Leloir 半乳糖利用途径。经由半乳糖通透酶引入细胞外半乳糖。通 过酶半乳糖激酶, 半乳糖 -1- 磷酸尿苷酰转移酶和 UDP- 半乳糖 C4- 差向异构酶的作用半乳 糖被转化成葡萄糖 -6- 磷酸。来自酿酒酵母的蛋白名称在括号中。
     图 5 显 示 巴 斯 德 毕 赤 酵 母 糖 工 程 化 的 菌 株 YGLY578-1 的 构 建。 编 码 高 尔基 体 糖 基 转 移 酶 的 巴 斯 德 毕 赤 酵 母 基 因 OCH1, MNN4, PNO1, MNN4L1 和 BMT2 被 敲 除 然 后 敲 入 12 个 异 源 基 因, 包 括 分 泌 的 hK3 的 表 达 盒。YGLY578-1 能 够 生 产 糖 蛋 白 具 有 Gal2GlcNAc2Man3GlcNAc2N- 聚糖。CS, 反选择。
     图 6 显示质粒 pRCD977b 的示意图。该质粒是 arg1::HIS1 敲除质粒, 其整合进并 删除巴斯德毕赤酵母 ARG1 基因而利用 PpHIS1 基因作为选择标记并含有分别在 PpOCH1、 PpGAPDH、 PpPMA1 和 PpTEF 启动子的控制下编码全长黑腹果蝇高尔基体 UDP- 半乳糖转运蛋 白 (DmUGT)、 全长酿酒酵母半乳糖激酶 (ScGAL1)、 全长酿酒酵母半乳糖 -1- 磷酸尿苷酰转移 酶 (ScGAL7) 和酿酒酵母半乳糖通透酶 (ScGAL2) 的表达盒。TT 是指转录终止序列。
     图 7 显示表达酿酒酵母 GAL1、 GAL2 和 GAL7 基因的糖工程化的巴斯德毕赤酵母菌 株可在半乳糖 ( 作为单一碳源 ) 上生长而母本菌株不能。 糖工程化的菌株 YGLY578-1( 表达 ScGAL10 和 hGalTIβ) 用质粒 pRCD977b 转化, 所述质粒含有编码 ScGAL1、 ScGAL7 和 ScGAL2 的表达盒。菌株在成分确定的培养基上培养, 所述培养基含有酵母氮源、 生物素和 3%半乳 糖或 2%葡萄糖作为碳源或二者均无。
     图 8 显示巴斯德毕赤酵母糖工程化的菌株 YGLY317-36 的构建。 通过敲除五个酵母 糖基转移酶产生巴斯德毕赤酵母菌株 YGLY16-3。随后敲入八个异源基因, 得到 RDP696-2, 能够将人 N- 聚糖 Gal2GlcNAc2Man3GlcNAc2 转移到分泌的蛋白的菌株。经由 CSTR 培养和引 入表达分泌的人 Fc 的质粒选择健康 (robust) 克隆得到菌株 YGLY317-36。CS, 反选择。
     图 9 显示质粒 pGLY954 的示意图。该质粒是 KINKO 质粒, 其整合进巴斯德毕赤酵 母 TRP1 基因座而不删除基因。 质粒含有分别在 PpHHT1 和 PpPMA1 启动子的控制下编码全长 酿酒酵母半乳糖激酶 (ScGAL1) 和全长酿酒酵母半乳糖 -1- 磷酸尿苷酰转移酶 (ScGAL7) 的 表达盒。质粒还含有在 PpGAPDH 启动子的控制下编码分泌途径靶向融合蛋白 (CO hGalTI) ( 包含 ScMnt1(ScKre2) 前导肽 (33) 融合至人半乳糖基转移酶 I 催化结构域的 N- 末端 ) 的 表达盒。TT 是指转录终止序列。
     图 10 显示单独在 BMMY 培养基中诱导或在含有葡萄糖或半乳糖的培养基中诱导的 菌株 PBP317-36 和 RDP783 中产生的人 Fc 片段上 N- 聚糖的 MALDI-TOF MS 分析。菌株从饱 和的种子培养物接种至约一个 OD, 在 800mL BMGY 中培养 72 小时, 然后分离 (split) 并将 100mL 培养液等分样离心和在 25mL BMMY、 25mL BMMY+0.5%葡萄糖或 25mL BMMY+0.5%半乳 糖中诱导 24 小时。 蛋白 A 纯化的蛋白进行蛋白 N- 糖苷酶 F 消化和通过 MALDI-TOF MS 分析 释放的 N- 聚糖。图 A-C, 菌株 PBP317-36 中产生的人 Fc 上的 N- 聚糖 ; 图 D-E, 菌株 RDP783 中产生的人 Fc 上的 N- 聚糖。
     图 11 显示巴斯德毕赤酵母糖工程化的菌株 YDX477 的构建。敲除五种酵母糖基转 移酶产生巴斯德毕赤酵母菌株 YGLY16-3(Δoch1, Δpno1, Δbmt2, Δmnn4a, Δmnn4b)。随 后敲入八个异源基因, 得到 RDP697-1, 能够将人 N- 聚糖 Gal2GlcNAc2Man3GlcNAc2 转移到分 泌的蛋白的菌株。引入表达分泌的抗体的质粒和表达分泌的形式的里氏木霉 MNS1 的质粒 得到菌株 YDX477。CS, 反选择。
     图 12 显示质粒 pGLY1418 的示意图。该质粒是 KINKO 质粒, 其整合进巴斯德毕赤 酵母 TRP1 基因座而不删除基因。质粒含有分别在 PpHHT1 和 PpPMA1 启动子的控制下编码 全长 ScGAL1 和 ScGAL7 的表达盒。质粒还含有在 PpGAPDH 启动子的控制下编码分泌途径靶 向融合蛋白 (hGalTI)( 包含 ScMnt1(ScKre2) 前导肽融合至人半乳糖基转移酶 I 催化结构域的 N- 末端 ) 的表达盒。TT 是指转录终止序列。
     图 13A-F 显示单独在 BMMY 培养基中诱导或在含有半乳糖的培养基中诱导的菌 株 YDX477 和 RDP968-1 中产生的抗 -Her2 抗体上 N- 聚糖的 MALDI-TOF MS 分析。菌株在 150mL BMGY 中培养 72 小时, 然后分离并将 50mL 培养液等分样离心和在 25mL BMMY、 25mL BMMY+0.1%半乳糖或 25mL BMMY+0.5%半乳糖中诱导 24 小时。 蛋白 A 纯化的蛋白进行蛋白 N- 糖苷酶 F 消化和通过 MALDI-TOF MS 分析释放的 N- 聚糖。图 13A-C, 菌株 YDX477 中产生 的抗体上的 N- 聚糖 ; 图 13D-F, 菌株 RDP968-1 中产生的抗体上的 N- 聚糖。
     图 14 显示质粒 pAS24 的示意图。该质粒是巴斯德毕赤酵母 bmt2 敲除质粒, 其含 有 PpURA3 选择标记和含有在 PpOCH1 启动子的控制下编码全长小鼠高尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 的表达盒。TT 是指转录终止序列。
     图 15 显示质粒 pRCD742b 的示意图。该质粒是 KINKO 质粒, 其含有 PpURA5 选择标 记以及在 PpGAPDH 启动子的控制下编码分泌途径靶向融合蛋白 (FB8 MannI)( 包含融合至 小鼠甘露糖苷酶 I 催化结构域的 N- 末端的 ScSec12 前导肽 ) 的表达盒、 在 PpPMA1 启动子 的控制下编码分泌途径靶向融合蛋白 (CONA10)( 包含融合至人 GlcNAc 转移酶 I(GnT I) 催 化结构域的 N- 末端的 PpSec12 前导肽 ) 的表达盒和在 PpSEC4 启动子的控制下编码小鼠高 尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 的全长基因。TT 是指转录终止序列。
     图 16 显示质粒 pDMG47 的示意图。质粒包括在 PpGAPDH 的控制下启动子编码分泌 途径靶向融合蛋白 (KD53)( 包含融合至黑腹果蝇甘露糖苷酶 II 催化结构域的 N- 末端的 ScMnn2 前导肽 ) 的表达盒。质粒还含有在 PpPMA1 启动子的控制下编码分泌途径靶向融合 蛋白 (TC54)( 包含融合至大鼠 GlcNAc 转移酶 II(GnT II) 催化结构域的 N- 末端的 ScMnn2 前导肽 ) 的表达盒。TT 是指转录终止序列。
     图 17 显示质粒 pRCD823b 的示意图。该质粒是 KINKO 质粒, 其整合进巴斯德毕赤 酵母 HIS4 基因座而不删除基因, 并含有 PpURA5 选择标记。质粒包括在 PpGAPDH 启动子的 控制下编码分泌途径靶向融合蛋白 (TA54)( 包含 ScMnn2 前导肽融合至大鼠 GlcNAc 转移酶 II(GnTII) 催化结构域的 N- 末端 ) 的表达盒和分别在 PpOCH1 和 PpPMA1 启动子的控制下编 码全长黑腹果蝇高尔基体 UDP- 半乳糖转运蛋白 (DmUGT) 和酿酒酵母 UDP- 半乳糖 C4- 差向 异构酶 (ScGAL10) 的表达盒。TT 是指转录终止序列。
     图 18 显示质粒 pGLY893a 的示意图。该质粒是巴斯德毕赤酵母 his1 敲除质粒, 其 含有 PpARG4 选择标记。质粒含有在 PpPMA1 启动子的控制下编码分泌途径靶向融合蛋白 (KD10)( 包含 PpSEC12 前导肽融合至黑腹果蝇甘露糖苷酶 II 催化结构域的 N- 末端 ) 的表达 盒, 在 PpTEF 启动子的控制下编码分泌途径靶向融合蛋白 (TA33)( 包含 ScMnt1(ScKre2) 前 导肽融合至大鼠 GlcNAc 转移酶 II(GnT II) 催化结构域的 N- 末端 ) 的表达盒和在 PpGAPDH 启动子的控制下编码分泌途径靶向融合蛋白 ( 包含 ScMnn2 前导肽融合至人半乳糖基转移 酶 I 催化结构域的 N- 末端 ) 表达盒。TT 是指转录终止序列。
     图 19 显示质粒 pRCD742a 的示意图。该质粒是 KINKO 质粒, 其整合进巴斯德毕赤 酵母 ADE1 基因座而不删除基因并含有 PpURA5 选择标记。质粒含有在 PpGAPDH 启动子的控 制下编码分泌途径靶向融合蛋白 (FB8 MannI)( 包含 ScSEC12 前导肽融合至小鼠甘露糖苷 酶 I 催化结构域的 N- 末端 ) 的表达盒、 在 PpPMA1 启动子的控制下编码分泌途径靶向融合蛋 白 (CONA10)( 包含 PpSEC12 前导肽融合至人 GlcNAc 转移酶 I(GnT I) 催化结构域的 N- 末端 ) 的表达盒和在 PpSEC4 启动子的控制下编码全长小鼠高尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 的表达盒。TT 是指转录终止序列。
     图 20 显示质粒 pRCD1006 的示意图。该质粒是巴斯德毕赤酵母 his1 敲除质粒, 其 含有 PpURA5 基因作为选择标记。质粒含有在 PpGAPDH 启动子的控制下编码分泌途径靶向 融合蛋白 (XB33)( 包含 ScMnt1(ScKre2) 前导肽融合至人半乳糖基转移酶 I 催化结构域的 N- 末端 ) 的表达盒和分别在 PpOCH1 和 PpPMA1 启动子的控制下编码全长黑腹果蝇高尔基体 UDP- 半乳糖转运蛋白 (DmUGT) 和粟酒裂殖酵母 UDP- 半乳糖 C4- 差向异构酶 (SpGALE) 的表 达盒。TT 是指转录终止序列。
     图 21 显示质粒 pGLY167b 的示意图。该质粒是巴斯德毕赤酵母 arg1 敲除质粒, 其含有 PpURA3 选择标记并含有在 PpGAPDH 启动子的控制下编码分泌途径靶向融合蛋白 (CO-KD53)( 包含 ScMNN2 前导肽融合至黑腹果蝇甘露糖苷酶 II 催化结构域的 N- 末端 ) 的 表达盒和在 PpPMA1 启动子的控制下编码分泌途径靶向融合蛋白 (CO-TC54)( 包含 ScMnn2 前导肽融合至大鼠 GlcNAc 转移酶 II(GnT II) 催化结构域的 N- 末端 ) 的表达盒。TT 是指 转录终止序列。
     图 22 显示质粒 pBK 138 的示意图。该质粒是滚入 (roll-in) 质粒, 其整合进巴斯 德毕赤酵母 AOX1 启动子同时复制启动子。质粒含有编码融合蛋白 ( 包含酿酒酵母 A 交配 因子前信号序列融合至人 Fc 抗体片段 ( 人 IgG1H 链的 C- 末端 233-aa) 的 N- 末端 ) 的表 达盒。TT 是指转录终止序列。
     图 23 显示质粒 pGLY510 的示意图。该质粒是滚入质粒, 其整合进巴斯德毕赤酵母 TRP2 基因同时复制基因并含有 AOX1 启动子 -ScCYC1 终止子表达盒以及 PpARG1 选择标记。 TT 是指转录终止序列。
     图 24 显示质粒 pDX459-1 的示意图。 该质粒是滚入质粒, 其靶向并整合进巴斯德毕 R 赤酵母 AOX2 启动子和含有 Zeo 同时复制启动子。质粒含有分开的表达盒, 其编码抗 -HER2 抗体重链和抗 -HER2 抗体轻链, 每个在 N- 末端融合至黑曲霉 α- 淀粉酶信号序列并在巴斯 德毕赤酵母 AOX1 启动子的控制下。TT 是指转录终止序列。
     图 25 显示质粒 pGLY1138 的示意图。该质粒是滚入质粒, 其整合进巴斯德毕赤酵 母 ADE1 基因座同时复制基因和含有 ScARR3 选择标记基因盒 ( 其赋予亚砷酸盐抗性 ) 以及 在 PpAOX1 启动子的控制下编码分泌的里氏木霉 MNS1( 包含 MNS1 催化结构域在其 N- 末端 融合至酿酒酵母 α 因子前信号序列 ) 的表达盒。TT 是指转录终止序列。
     发明详述
     酵母已被成功用于生产细胞内和分泌的重组蛋白 ( 参见例如, Cereghino Cregg FEMS Microbiology Reviews 24(1) : 45-66(2000) ; Harkki, 等人 Bio-Technology 7(6) : 596(1989) ; Berka, 等人 Abstr.Papers Amer.Chem.Soc.203 : 121-BIOT(1992) ; Svetina, 等 人 J.Biotechnol.76(2-3) : 245-251(2000))。多种酵母, 例如乳酸克鲁维酵母、 巴斯德毕赤 酵母、 甲醇毕赤酵母和多形汉逊酵母, 已作为用于生产重组蛋白的真核表达系统发挥特别 重要的作用, 因为它们能够生长至高细胞密度和分泌大量重组蛋白。 但是, 在任意这些真核 微生物中的糖蛋白表达在 N- 聚糖结构上实质不同于哺乳动物中产生的糖蛋白表达。糖基 化中的该差异已阻止酵母或丝状真菌用作用于生产许多治疗用糖蛋白的宿主。
     为了能够利用酵母以产生治疗用糖蛋白, 酵母已被基因工程化为产生具有杂合或复合 N- 聚糖的糖蛋白。能够生产包含具体杂合或复合 N- 聚糖的组合物的重组酵母已在例 如, 美国专利号 7,029,872 和美国专利号 7,449,308 中公开。 另外, Hamilton 等人, Science 313 : 1441-1443(2006) 和美国公开的申请号 2006/0286637 报道了酵母巴斯德毕赤酵母中 糖基化途径的人源化和具有复合 N- 糖基化 ( 具有末端唾液酸 ) 的重组人糖蛋白的分泌。 对 于末端唾液酸的具有寡糖结构 Gal2GlcNAc2Man3GlcNAc2(G2) 前体 N- 聚糖是也作为从人血清 中分离的几种蛋白上主要 N- 聚糖发现的结构, 所述从人血清中分离的几种蛋白包括促卵 泡激素 (FSH)、 脱唾液酸转铁蛋白, 以及最显著的是在人免疫球蛋白 ( 抗体 ) 以不同的量存 在。Davidson 等人在美国公开的申请号 2006/0040353 教导了利用已被基因工程化为产生 半乳糖末端的 N- 聚糖的酵母细胞获得半乳糖基化的糖蛋白的有效方法。这些宿主细胞能 够生产糖蛋白组合物具有 G2 或 G1(GalGlcNAc2Man3GlcNAc2) 寡糖结构的多种混合物, 其具 有 G0 寡糖结构的变化量。 G0 是 GlcNAc2Man3GlcNAc2, 其是半乳糖基转移酶的底物。 但是, 对 于某些糖蛋白, 特别是抗体和 Fc 片段, 已发现半乳糖转移过程的效率不是最适的。在抗体 和 Fc 片段的情况下, 认为的是在细胞内加工期间抗体或 Fc 片段上糖基化位点的定位和可 及性抑制半乳糖有效转移到抗体或 Fc 片段的 N- 聚糖上。因此, 含有半乳糖的寡糖结构的 量小于其他糖蛋白例如三环 3 蛋白中已观察到的量。为了克服该问题, 本发明提供增加半 乳糖转移到抗体或 Fc 片段的 N- 聚糖上的量的方法, 因此增加含有抗体或 Fc 片段的 G1 和 G2 的量高于含有抗体或 Fc 片段的 G0。
     巴斯德毕赤酵母仅可利用有限数量的碳源进行生存。 目前, 这些碳源已知是甘油、 葡萄糖、 甲醇以及可能是鼠李糖和甘露糖但不是半乳糖。 在许多商业生产过程中, 利用巴斯 德毕赤酵母, 重组蛋白的表达在 AOX 启动子的控制下, 其 w 在甲醇存在下是有活性的但在甘 油存在下被抑制。因此, 巴斯德毕赤酵母通常在含有甘油或甘油 / 甲醇的培养基中生长直 到细胞的浓度达到期望的水平, 在此时, 通过用仅含有甲醇作为碳源的培养基替换培养基 来进行重组蛋白的表达。但是, 细胞处于低能量状态, 因为甲醇仅含有一个碳, 使其成为贫 瘠碳源。因此, 期望的是具有这样的生产过程, 其中巴斯德毕赤酵母可利用更高级的能源, 例如半乳糖。 本发明通过提供能够利用半乳糖作为单一碳源的基因工程化巴斯德毕赤酵母 也解决了该问题。
     因此, 本发明已解决上述确定的两个问题。 本发明提供重组低等真核细胞, 特别是 酵母和真菌细胞, 其已被糖工程化以产生糖蛋白例如抗体或 Fc 片段, 其中与未被如本文所 教导的基因工程化的细胞相比, 其上 N- 聚糖上的末端半乳糖水平增加。基因工程化宿主细 胞可用于产生具有 N- 聚糖 ( 含有半乳糖 ) 的糖蛋白的方法, 其中所述 N- 聚糖中半乳糖的 量高于未被如本文所教导的基因工程化的宿主细胞中可获得的量。 本发明还提供基因工程 化宿主细胞, 其中通常不能利用半乳糖作为单一碳源的宿主细胞已被如本文所教导的基因 工程化以能够利用半乳糖作为单一碳源。 本文的使得宿主细胞能够利用半乳糖作为单一碳 源的方法利用巴斯德毕赤酵母作为模型。 本文的方法可用于使得通常不能利用半乳糖作为 碳源的其他酵母或真菌物种能够利用半乳糖作为碳源。
     为 解 决 两 个 问 题, 基因工程化的宿主细胞 ( 其已被基因工程化为能够产生 半乳糖末端的 N- 聚糖 ) 被进一步基因工程化为表达 Leloir 途径酶 : 半乳糖激酶 (EC 2.7.1.6)、 UDP- 半乳糖 -4- 差向异构酶 (EC 5.1.3.2) 和半乳糖 -1- 磷酸尿苷酰转移酶 (EC 2.7.7.12)。任选地, 宿主细胞可另外表达半乳糖通透酶。这使得宿主细胞能够利用半乳糖作为碳源并产生 UDP- 半乳糖库, 其反过来作为涉及包括半乳糖残基的 N- 聚糖合成的半乳 糖转移酶的底物。 因此, 本文中的宿主细胞和方法能够产生糖蛋白组合物, 特别是抗体和 Fc 片段组合物, 其中所述半乳糖末端的 N- 聚糖的比例高于在糖工程化的低等真核细胞中可 获得的比例。重组宿主细胞可生产重组糖蛋白例如抗体和 Fc 融合蛋白, 其中 G0 ∶ G1/G2 比值小于 2 ∶ 1 或 G0 ∶ G1/G2 比值为 1 ∶ 1 或更小或 G0 ∶ G1/G2 比值为 1 ∶ 2 或更小。
     本文所述的宿主细胞和方法特别用于生产这样的抗体和 Fc 片段, 其含有具有 N- 聚糖的融合蛋白, 所述 N- 聚糖具有半乳糖残基末端。在抗体或抗体片段重链 Asn-297 处的 N- 聚糖对抗体的结构和功能重要。这些功能包括 Fcγ 受体结合、 激活补体的能力、 激 活细胞毒性 T 细胞 (ADCC) 的能力和血清稳定性。但是, 在酵母或哺乳动物细胞中目前的抗 体生产通常缺乏对于 N- 糖基化的控制, 特别是在重链的恒定区或 Fc 区 Asn-297 处发生的 N- 糖基化, 以及特别是控制在 N- 聚糖上末端半乳糖的水平的能力。一般而言, 已发现尽管 已被基因工程化为产生在 N- 聚糖中包括半乳糖残基的糖蛋白的酵母细胞可以高效地产生 许多具有含有半乳糖的 N- 聚糖的糖蛋白, 但是细胞产生抗体具有含有半乳糖的 N- 聚糖的 能力并不一样高效。 如本文所示, 本文的宿主细胞和方法提供这样的宿主细胞, 其与未被如 本文所述基因工程化的细胞相比, 可以产生更高水平的具有含有半乳糖的 N- 聚糖的抗体。
     尽管在不具有末端半乳糖残基的 N- 聚糖上末端的半乳糖水平可以在体外在利用 可溶性半乳糖基转移酶以将带电的半乳糖残基添加到 N- 聚糖的末端的反应中增加, 但是 该体外方法费用高、 复杂并且不容易扩大规模用于生产大量糖蛋白。 因此, 本文公开的宿主 细胞 ( 并且其能够在体内产生分泌的具有增加的末端半乳糖水平的 N- 聚糖的糖蛋白, 包 括抗体或抗体片段 ) 提供生产具有含有增加的半乳糖水平的 N- 聚糖的抗体组合物的更理 想的方法。因此, 本发明在抗体生产中具有显著改进并且首次提供控制具体抗体特征例如 N- 聚糖中半乳糖水平的能力, 和特别是生产具有改进的功能性特征的重组糖蛋白。
     另外, 当本文的方法用于已被基因工程化为产生具有唾液酸化的 N- 聚糖的糖蛋 白的宿主细胞中时, 半乳糖末端的 N- 聚糖是唾液酸转移酶的底物。因此, 唾液酸化的 N- 聚 糖的量部分地随可用于唾液酸化的半乳糖末端的 N- 聚糖的量而变化。本文中的宿主细胞 和方法提供用于增加半乳糖末端的或含有半乳糖的 N- 聚糖的量的方法, 其中当在已被基 因工程化为产生唾液酸化的 N- 聚糖的宿主细胞中生产时, 产生这样的宿主细胞, 其与未被 如本文所教导的基因工程化的宿主细胞相比, 产生增加量的唾液酸化的 N- 聚糖。
     尽管本发明用于生产包含半乳糖末端的或含有半乳糖的 N- 聚糖的糖蛋白, 但是 本发明还用作用于选择表达任意类型异源蛋白 ( 不论是否是糖蛋白 ) 的重组宿主细胞的 选择方法。表达一种或两种但不是全部 Leloir 途径酶活性的重组宿主细胞用编码异源蛋 白和不存在于重组宿主细胞中的 Leloir 途径酶的一个或多个核酸分子转化。由于转化的 重组宿主细胞含有完整的 Leloir 途径, 可通过在半乳糖是单一碳源的培养基中培养转化 的重组宿主细胞来获得选择表达对于非转化的细胞是异源蛋白的转化的重组宿主细胞。 因 此, 提供的是用于产生表达异源蛋白的重组宿主细胞的方法, 其包含以下步骤。提供宿主 细胞, 其已被基因工程化为表达一种或两种选自半乳糖激酶、 UDP- 半乳糖 -4- 差向异构酶 和半乳糖 -1- 磷酸尿苷酰转移酶的 Leloir 途径酶。在一些实施方案中, 宿主细胞能够产生 具有人样 N- 聚糖的糖蛋白, 和在其他实施方案中, 宿主细胞不产生具有人样 N- 聚糖的糖蛋 白, 因为要在宿主细胞中表达的异源蛋白不具有 N- 聚糖。用编码异源蛋白和提供的重组宿主细胞中不表达的 Leloir 途径酶或多种酶的一个或多个核酸分子转化宿主细胞。转化的 宿主细胞在含有半乳糖作为单一碳能源的培养基中培养以提供表达异源蛋白的重组宿主 细胞。任选地, 宿主细胞可另外包括编码半乳糖通透酶的核酸分子。在具体实施方案中, 宿 主细胞被基因工程化为控制 O- 糖基化或在控制 O- 糖基化的条件下生长或二者。在另外的 实施方案中, 宿主细胞另外已被修饰为降低磷酸甘露糖基转移酶和 / 或 β- 甘露糖基转移 酶活性 .
     在低等真核细胞中基因工程化糖基化途径
     在 大 多 数 真 核 细 胞 中 N- 糖 基 化 通 过 将 脂 类 - 连 接 的 Glc3Man9GlcNAc2 寡 糖 结 构 转 移 到 新 生 多 肽 的 特 定 Asn 残 基 上 在 内 质 网 (ER) 中 起 始 (Lehle 和 Tanner, Biochim.Biophys.Acta 399 : 364-74(1975) ; Kornfeld 和 Kornfeld, Annu.Rev.Biochem 54 : 631-64(1985) ; Burda 和 Aebi, Biochim.Biophys.Acta-General Subjects 1426 : 239-257(1999))。对来自 N- 连接寡糖的所有三个葡萄糖部分和单个特定甘露糖的修饰 产生 Man 8GlcNAc2( 参见图 1), 其使得糖蛋白易位到高尔基体, 在高尔基体中发生进一步 寡 糖 加 工 (Herscovics, Biochim.Biophys.Acta 1426 : 275-285(1999) ; Moremen 等 人, Glycobiology 4 : 113-125(1994))。在高尔基体中, 哺乳动物 N- 聚糖加工不同于酵母和许 多其他真核细胞, 包括植物和昆虫。哺乳动物以特定反应顺序加工 N- 聚糖, 涉及在从寡糖 在添加 GlcNAc 以形成杂合中间体 N- 聚糖 GlcNAcMan5GlcNAc2 之前, 去除三个末端 α-1, 2- 甘露糖 (Schachter, Glycoconj.J.17 : 465-483(2000))( 参见图 1)。该杂合结构是甘露 糖苷酶 II 的底物, 所述甘露糖苷酶 II 在寡糖上去除末端 α-1, 3- 和 α-1, 6- 甘露糖以得到 N- 聚糖 GlcNAcMan3GlcNAc2(Moremen, Biochim.Biophys.Acta 1573(3) : 225-235(1994))。 最后, 如图 1 所示, 通过在添加半乳糖和唾液酸残基后, 添加至少一个另外的 GlcNAc 残基, 产生复合 N- 聚糖 (Schachter, (2000), 如上 ), 虽然唾液酸通常在某些人蛋白, 包括 IgGs 上 缺乏 (Keusch 等人, Clin.Chim.Acta 252 : 147-158(1996) ; Creus 等人, Clin.Endocrinol. (Oxf)44 : 181-189(1996))。
     在酿酒酵母中, N- 聚糖加工涉及在其通过整个高尔基体时, 添加甘露糖至寡糖, 有 时产生具有大于 100 个甘露糖残基的高甘露糖基化的聚糖 (Trimble 和 Verostek, Trends Glycosci.Glycotechnol.7 : 1-30(1995) ; Dean, Biochim.Biophys.Acta-General Subjects 1426 : 309-322(1999))( 参见图 1)。在通过 α-1, 6- 甘露糖基转移酶 (Ochlp) 将第一个 α-1, 6- 甘露糖添加到 Man8GlcNAc2 后, 另外的甘露糖基转移酶延伸具有 α-1, 2-、 α-1, 6- 和末端 α-1, 3- 连接的甘露糖以及甘露糖基磷酸的 Man9GlcNAc2 聚糖。 巴斯德毕赤酵母是 甲基营养酵母, 通常用于异源蛋白的表达, 具有与酿酒酵母类似的糖基化机制 (Bretthauer 和 Castellino, Biotechnol.Appl.Biochem.30 : 193-200(1999) ; Cereghino 和 Cregg, Fems Microbiol.Rev.24 : 45-66(2000) ; Verostek 和 Trimble, Glycobiol.5 : 671-681(1995))。 但 是, 与 N- 糖基化的复杂度一致, 巴斯德毕赤酵母中的糖基化不同于酿酒酵母中的糖基化, 原因在于它缺乏添加末端 α-1, 3- 连接的甘露糖的能力, 而是添加其他甘露糖残基, 包括 磷酸甘露糖和 β- 连接的甘露糖 (Miura 等人, 基因 324 : 129-137(2004) ; Blanchard 等人, Glycoconj.J.24 : 33-47(2007) ; Mille 等人, J.Biol.Chem.283 : 9724-9736(2008))。
     在 以往工 作中, 我 们证明巴斯 德毕 赤酵 母 的 och1 突 变 体 缺乏 起 始 酵母 型 外 链 形 成 的 能 力, 并 且 因 此, 不 能 高 甘 露 糖 化 N- 聚 糖 (Choi 等 人, Proc.Natl.Acad.Sci.USA 100 : 5022-5027(2003))。另外, 我们鉴定了编码负责 β- 甘露糖转移的高尔基体定 位 (residing) 酶的新的基因家族并证明该家族的多个成员的缺失降低或消除免疫原性 β- 甘露糖转移 ( 参见美国公开的申请号 US2006/0211085)。随后引入五种单独的糖基 化酶得到在分泌的模式蛋白上产生复合人 N- 聚糖的菌株 ( 参见图 3A 相对于图 3B)(Choi 等 人, Proc.Natl.Acad.Sci.USA 100 : 5022-5027(2003) ; Hamilton 等 人 Science 310 : 1244-1246(2003) ; 美国专利号 7,029,872 ; 美国公开的申请号 2004/0018590 ; 美国公开的 申请号 2004/023004 ; 美国公开的申请号 2005/0208617 ; 美国公开的申请号 2004/0171826 ; 美国公开的申请号 2005/0208617 ; 美国公开的申请号 2005/0170452 和美国公开的申请 号 2006/0040353。更近期地, 构建能够在酵母菌株产生的分泌的蛋白上产生充分唾液酸 化的 N- 聚糖的重组酵母菌株已在美国公开的申请号 2005/0260729 和 2006/0286637 和 Hamilton 等人, Science 313 : 1441-1443(2006) 中描述。
     复合 N- 聚糖的成熟涉及添加半乳糖至末端 GlcNAc 部分, 这是可以被几种半乳糖 基转移酶 (GalT) 催化的反应。在人中, 存在 GalT 的七种同种型 (I-VII), 其中至少四种 已显示在体外在 UDP- 半乳糖存在下转移半乳糖至末端 GlcNAc(Guo, 等人, Glycobiol.11 : 813-820(2001))。最先鉴定的酶, 已知为 GalTI, 通常被认为是作用 N- 聚糖的主要酶, 这 已由体外实验、 小鼠敲除研究和组织分布分析支持 (Berger 和 Rohrer, Biochimie 85 : 261-74(2003) ; Furukawa 和 Sato, Biochim.Biophys.Acta 1473 : 54-66(1999))。 如 本 文 所示, 人 GalTI 的表达, 当其在宿主细胞高尔基体适当定位时, 可以在能够产生含有末端 GlcNA 的前体的糖工程化的酵母菌株中转移半乳糖至复合 N- 聚糖上。另外, UDP- 半乳糖 4- 差向异构酶的表达以产生 UDP- 半乳糖库和 UDP- 半乳糖转运蛋白的表达以将底物移动至 高尔基体在能够产生末端 GlcNAc 前体的菌株中产生几乎相当量的 β-1, 4- 半乳糖转移到 N- 聚糖上。 经由对于中间 N- 聚糖底物在 GlcNAc 和半乳糖基转移酶之间的分离和降低的竞 争, 定位子文库的重复筛选得到复合 N- 聚糖结构高于于杂合 N- 聚糖结构的改进的产生。
     以往, 在一组精确设计的实验 (an elegant set of experiments) 中, 人 GalTI 显 示具有将 β-1, 4- 半乳糖转移到末端 GlcNAc 的活性, 这要求首先产生 Alg1p 酶的突变体, 其将核心或少甘露糖转移到在生长中的 N- 聚糖前体分子 (Schwientek 等人, J.of Biol. Chem 271 : 3398-3405(1996))。该突变引起 GlcNAc2 截短的 N- 聚糖部分地转移到蛋白, 并 产生末端 GlcNAc。这之后, 作者表明人 GalTI 能够将半乳糖以 β-1, 4- 连接转移到该人工 末端 GlcNAc 结构。重要的是, 显示了人 GalTI 可以在酵母的高尔基体中以活性形式表达。
     基于上述, 首先利用靶向宿主细胞高尔基体的人 GalTI- 前导肽融合蛋白的表达 来检测本发明。在随后筛选人 GalTII、 GalTIII、 GaITIV、 GalTV、 牛 GalTI 和一对推测的线 虫 (C.elegans)GalT 后, 发现人 GalTI 看起来是在该异源的系统中将半乳糖转移到复合双 触角 N- 聚糖的最具活性的酶。 这可能表明 hGalTI 是用于转移至该底物 ( 双触角复合 N- 聚 糖 ) 的最具能力的酶或它可能仅是检测的 GalT 酶中最稳定的和最具活性的或二者的组合。 有意思的是, 当利用将甘露糖苷酶 II 和 GnT II 催化结构域 - 引导融合蛋白定位于高尔基体 的相同前导肽将 GalT 定位于高尔基体时, 产生其中末端半乳糖在 α-1, 3 臂上的杂合 N- 聚 糖结构的显著百分比 ( 直至 20% )。甘露糖苷酶 II 或 GnT II 活性的表达的增加不能显著 降低该现象。但是, 筛选酵母型 II 分泌途径定位前导肽 ( 定位于分泌途径期望的细胞器例 如 ER、 高尔基体或反式高尔基体网络的肽 ) 文库得到几种活性 GalT- 前导肽融合蛋白, 其当被转化至宿主细胞时, 产生显著降低水平的杂合 N- 聚糖结构和增加的复合 N- 聚糖结构。 之 前, 已报道等分的 (bisecting)GlcNAc 转移是高尔基体中 N- 聚糖的成熟中对于随后糖转移 的停止信号, 包括阻止果糖的转移 (Umana 等人, Nature Biotechnol.17 : 176-180(1999))。 此处的数据表明半乳糖转移到 α-1, 3 臂产生类似的停止信号, 阻止甘露糖苷酶 II 和 GnT II 进行的 α-1, 6 臂的成熟。
     上述结果表明在重组宿主细胞中产生的具有半乳糖末端或含有半乳糖的杂合 N- 聚糖与具有半乳糖末端的或含有半乳糖的复合 N- 聚糖的比值是 GalTI 位于高尔基体相 对于甘露糖苷酶 II 和 GnT II 位于高尔基体中的结果, 并且通过操纵三种酶的定位, 可以操 纵杂合 N- 聚糖与复合 N- 聚糖的比值。为了增加具有半乳糖末端的或含有半乳糖的杂合 N- 聚糖的产率, 所有三种酶活性应被靶向至高尔基体的相同区域, 例如通过利用相同分泌 途径靶向前导肽来靶向所有三种酶活性。或者, 筛选 GalT- 前导肽融合蛋白的文库来鉴定 将 GalT 活性定位于高尔基体的融合蛋白, 在高尔基体中更可能的是在其他两个酶可以发 挥作用之前, GalT 作用 N- 聚糖底物。 该增加了具有半乳糖末端的或含有半乳糖的杂合 N- 聚 糖相比于具有半乳糖末端的或含有半乳糖的复合 N- 聚糖的产率。相反地, 为了降低具有半 乳糖末端的或含有半乳糖的杂合 N- 聚糖的产率, 应利用与其他两种酶活性所利用的分泌 途径靶向前导肽不同的分泌途径靶向前导肽来定位 GalT 活性。这可通过筛选 GalT- 前导 肽融合蛋白文库以鉴定 GalT- 前导肽融合蛋白组合来获得, 所述 GalT- 前导肽融合蛋白组 合产生这样的宿主细胞, 在其中与具有半乳糖末端的或含有半乳糖的杂合 N- 聚糖的产率 相比, 具有半乳糖末端的或含有半乳糖的复合 N- 聚糖的产率增加。
     该结果进一步强调了当在异源宿主系统中表达嵌合糖基化酶时, 筛选催化结构 域和分泌途径定位前导肽文库的价值, 这是之前在 Choi 等人, Proc.Natl.Acad.Sci.USA 100 : 5022-5027(2003) 中说明的并在美国专利号 7,029,872 和 7,449,308 中描述的概念。 由于全基因组序列的可获得性、 更复杂的 PCR 和克隆技术以及更高通量的分析技术如质 谱, 筛选数以百计甚至数以千计的组合是可能的。重要的是, 这种类型的组合筛选已证实 在检测酶活性与驱动逐步反应之间的差异, 每个依赖于之前的产物而完成。此处, 尽管在 UDP- 半乳糖 4- 差向异构酶的情况下, 筛选的几种酶看起来具有产生 UDP- 半乳糖库相对相 同的能力, 但是检测的四种 UDP- 半乳糖转运蛋白中仅一种在该异源宿主中证实有活性, 包 括令人惊讶地, 来自一种酵母 ( 粟酒裂殖酵母 ) 的一种无活性转运蛋白。另外, 从多种分泌 途径定位前导肽的筛选中, 其中许多产生活性酶组合, 发现仅三种得到较高程度的具有双 触角末端半乳糖 (G2) 的均一的复合 N- 聚糖 ( > 85% )。高甘露糖和杂合中间结构的减少 对于这类异源表达系统在生产治疗用糖蛋白中的用途具有重要的作用, 因为高甘露糖结构 已显示具有有效免疫原性并且最近的证据已表明肝毒性可源自过于丰富的杂合 N- 聚糖。
     因此, 美国公开的申请号 2006/0286637 教导了在不通常产生含有半乳糖的糖蛋 白的宿主细胞中获得半乳糖转移的方法, 三种条件已被克服 : (1) 在高尔基体中内源半乳 糖基转移酶 (GalT) 的缺乏, (2) 内源 UDP-Gal 不能转运至高尔基体和 (3) 低的内源细胞质 UDP-Gal 库。在缺乏 UDP-Gal 转运蛋白的情况下, 半乳糖向 N- 聚糖上末端 GlcNAc 残基的转 移为约 55-60%。在缺乏 UDP- 葡萄糖 -4- 差向异构酶的情况下, 半乳糖向 N- 聚糖上末端 GlcNAc 残基的转移为约 10-15%。
     利用具有暴露的 N- 聚糖 ( 其在人中通常被唾液酸化 ) 的报告子蛋白 ( 人纤溶酶原的 K3 结构域 ) 已制备了所有上述修饰以产生宿主细胞 ( 其可产生半乳糖基化的 N- 聚糖 ), 并在美国公开的申请号 20060040353 中报道。但是, 以可与哺乳动物细胞相比较的方式, 这 些糖工程化的酵母菌株仅产生部分的半乳糖转移到抗体 Fc 聚糖上, 引起具有小于 10% G2 和小于 25% G1 结构的 N- 聚糖库, 偏好于具有末端 GlcNAc 的复合 N- 聚糖。这与哺乳动物 细胞系类似, 其中抗体 (IgG Fc Asn 297)N- 聚糖含有减少量的末端半乳糖。
     半乳糖残基转移到 N- 聚糖上需要活化的半乳糖 (UDP-Gal) 库。 在低等真核细胞中 产生高于内源水平的这类库的一种方式是如上所述并在美国公开的申请号 2006/0040353 所示的 UDP- 半乳糖 4 差向异构酶的表达。另一种方式本发明, 其包括上述细胞, 其中用核 酸分子转化所述宿主细胞, 所述核酸分子编码至少以下三种 Leloir 途径酶 : 半乳糖激酶 (EC2.7.1.6)、 半乳糖 -1- 磷酸尿苷酰转移酶 EC 2.7.7.12) 和 UDP- 半乳糖 4 差向异构酶 (EC 5.1.3.2)。半乳糖激酶是催化半乳糖代谢的第一步 ( 称为半乳糖磷酸化为半乳糖 -1- 磷 酸 ) 的酶。半乳糖 -1- 磷酸尿苷酰转移酶催化半乳糖代谢的第二步骤, 其是 UDP- 葡萄糖和 半乳糖 -1- 磷酸转换为 UDP- 半乳糖和葡萄糖 -1- 磷酸。任选地, 另外可以包括的是编码质 膜半乳糖通透酶的核酸分子。半乳糖通透酶是质膜己糖转运蛋白, 其从外部来源输入半乳 糖。Leloir 途径显示于图 4。
     如本文所示, 当编码半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳 糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性的基因被引入上述酵母, 同时 向该酵母给料酵母外源半乳糖, 并诱导抗体表达时, 抗体 Fc N- 聚糖上末端半乳糖的水平实 质增加, 因此增加产生的 G2N- 聚糖的量 : N- 聚糖可在人 Fc 上获得, 其中大于 50%的 N- 聚 糖是 G2。通透酶是任选的, 因为发现细胞中的内源通透酶能够将半乳糖输入细胞。因此, 当使用时, 半乳糖通透酶可以是能够使半乳糖穿过细胞膜转运的任意质膜己糖转运蛋白, 例如, 来自酿酒酵母的 GAL2 半乳糖通透酶 ( 参见 GenBank : M81879)。半乳糖激酶可以是能 够催化半乳糖磷酸化为半乳糖 -1- 磷酸的任意酶, 例如, 来自酿酒酵母的 GAL1 基因 ( 参见 GenBank : X76078)。半乳糖 -1- 磷酸尿苷酰转移酶可以是催化 UDP- 葡萄糖和半乳糖 -1- 磷 酸转换为 UDP- 半乳糖和葡萄糖 -1- 磷酸的任意酶, 例如, 酿酒酵母的 GAL7( 参见 GenBank : M12348)。UDP- 半乳糖 4 差向异构酶可以是催化 UDP- 葡萄糖转换为 UDP- 半乳糖的任意酶, 例如酿酒酵母的 GAL10( 参见 GenBank NC_001134), 粟酒裂殖酵母的 GALE( 参见 GenBank NC_003423) 和人的 hGALE( 参见 GenBank NM_000403)。差向异构酶还可提供为融合蛋白, 其中差向异构酶的催化结构域被融合至半乳糖基转移酶的催化结构域 ( 参见美国公开的 申请号 US2006/0040353)。
     将上述 Leloir 途径酶引入巴斯德毕赤酵母菌株产生能够同化环境半乳糖的重组 细胞。另外, 当上述 Leloir 途径酶被引入能够生产具有含有半乳糖的 N- 聚糖的糖蛋白的 细胞中时, 得到的重组细胞能够产生与未被如此工程化的细胞产生的糖蛋白相比, 在复合 N- 聚糖上具有更高水平 β-1, 4- 半乳糖的糖蛋白。因此, 这些工程化步骤的组合已得到这 样的宿主细胞, 其被特定地糖工程化和代谢地工程化为对于糖蛋白例如抗体和 Fc- 融合蛋 白的 N- 聚糖的糖基化的增加的控制。因此, 这些糖工程化的酵母细胞系能够有效的产生重 组抗体和 Fc 融合蛋白同时允许控制 N- 聚糖加工。
     表达载体
     一般而言, 半乳糖激酶、 UDP- 半乳糖 -4- 差向异构酶和半乳糖 -1- 磷酸尿苷酰转移酶 ( 以及任选地半乳糖通透酶 ) 作为来自表达载体的表达盒的组分而表达。在另外的方 面, 在宿主细胞中另外包括的是编码重组目的蛋白的表达载体, 其在具体的实施方案中另 外包括促进重组蛋白从宿主细胞中分泌的序列。对于每种 Leloir 途径酶和重组目的蛋白, 编码它的表达载体最低程度含有这样的序列, 其影响编码 Leloir 途径酶或重组蛋白的核 酸序列的表达。该序列被可操作连接到编码 Leloir 途径酶或重组蛋白的核酸分子。这类 表达载体还可含有另外的元件, 如复制起点、 选择标记、 转录或终止信号、 着丝粒、 自我复制 序列等。
     根据本发明, 编码重组目的蛋白和上述 Leloir 途径酶的核酸分子可以分别地位 于表达载体中以允许过表达的重组目的蛋白和上述 Leloir 途径酶的受调节的表达。尽管 重组蛋白和上述 Leloir 途径酶可以在相同的表达载体中编码, 但是上述 Leloir 途径酶优 选地在与编码重组蛋白的载体分开的表达载体中编码。编码上述 Leloir 途径酶和重组蛋 白的核酸分子位于分开的表达载体中可以增加产生的重组蛋白的量。
     如本文所用, 表达载体可以是可复制的或不可复制的表达载体。可复制的表达载 体可以不依赖于宿主细胞染色体 DNA 复制或因为这类载体具有整合到宿主细胞染色体 DNA 而依赖于宿主细胞染色体 DNA 复制。整合至宿主细胞染色体 DNA 后, 这类表达载体可以失 去一些结构元件但保留编码重组蛋白或上述 Leloir 途径酶的核酸分子和可以作用于重组 蛋白或上述 Leloir 途径酶的表达的片段。因此, 本发明的表达载体可以是染色体整合或染 色体非整合的表达载体。
     在引入编码上述 Leloir 途径酶和重组蛋白的核酸分子后, 然后通过诱导编码重 组蛋白的核酸的表达, 使重组蛋白过表达。在另一实施方案中, 建立这样的细胞系, 其组成 型或诱导型表达上述 Leloir 途径酶。编码将被过表达的重组蛋白的表达载体被引入这类 细胞系以获得重组蛋白的增加的产生。在具体实施方案中, 编码 Leloir 途径酶的核酸分子 被可操作连接到组成型启动子。
     本发明表达载体可以是在一种宿主细胞类型例如大肠杆菌 (Escherichia coli) 中可复制的并在另一种宿主细胞类型例如真核宿主细胞中进行很少复制或不能复制的, 只 要表达载体允许上述 Leloir 途径酶或过表达的重组蛋白的表达并因而促进这类重组蛋白 在选择的宿主细胞类型中的分泌。
     如本文所述的表达载体包括这样的 DNA 或 RNA 分子, 其被工程化为对期望的基因 即编码上述 Leloir 途径酶或重组蛋白的基因的控制表达。这类载体还编码核酸分子片段, 其被可操作连接到编码本发明上述 Leloir 途径酶或重组蛋白的核酸分子。在本发明上下 文中, 可操作连接意思是这类片段可以作用于编码上述 Leloir 途径酶或重组蛋白的核酸 分子的表达。这些核酸序列包括启动子、 增强子、 上游控制元件、 转录因子或抑制子结合位 点、 终止信号和可以在预期的宿主细胞中控制基因表达的其它元件。 优选载体是载体、 细菌 噬菌体、 黏粒或病毒。
     本发明的表达载体在酵母或哺乳动物细胞中发挥功能。酵母载体可以包括酵母 2μ 环及其衍生物, 编码酵母自我复制序列的酵母载体, 酵母小染色体, 任意酵母整合载体 等。多种类型酵母载体的详细列表在 Parent 等人 (Yeast 1 : 83-138(1985)) 中提供。
     能够作用于基因产物的表达的元件或核酸序列包括启动子、 增强子元件、 上游激 活序列、 转录终止信号和多聚腺苷酸位点。所有这类启动子和转录调节元件, 单独或组合,被预期用于本发明的表达载体中。另外, 基因 - 工程化的和突变的调节序列还在本文中的 预期。
     启动子是用于控制基因表达的 DNA 序列元件。具体地, 启动子确定转录起始位点 并可以包括 TATA 盒和上游启动子元件。选择的启动子是期望在选择的具体宿主系统中可 操纵的那些。例如, 当利用酵母宿主细胞例如酿酒酵母、 乳酸克鲁维酵母或巴斯德毕赤酵 母时, 酵母启动子用于本发明的表达载体, 而真菌启动子将用于宿主细胞例如黑曲霉、 粗糙 脉胞菌或里氏木霉。酵母启动子的实例包括但不限于 GAPDH, AOX1, SEC4, HH1, PMA1, OCH1, GAL1, PGK, GAP, TPI, CYC1, ADH2, PHO5, CUP1, MFα1, FLD1, PMA1, PDI, TEF 和 GUT1 启动子。 Romanos 等人 (Yeast 8 : 423-488(1992)) 提供了酵母启动子和表达载体的综述。Hartner 等人, Nucl.Acid Res.36 : e76( 于 2008 年 6 月 6 日在线出版 ) 描述了用于巴斯德毕赤酵母 中异源蛋白精确调节表达的启动子文库。
     可操作连接本文公开的核酸分子的启动子可以是组成型启动子和诱导型启动子。 诱导型启动子是结合转录因子后以增加或降低的速率引导转录的启动子。 如本文所用的转 录因子包括可以结合启动子的调节或控制区并因而影响转录的任意因子。 在宿主细胞中转 录因子的合成或启动子结合能力可以通过将宿主暴露于诱导物或将诱导物从宿主细胞培 养基中去除来控制。 因此, 为了调节诱导型启动子的表达, 将诱导物添加或从宿主细胞的生 长培养基中去除。这类诱导物可以包括糖、 磷酸、 醇、 金属离子、 激素、 热、 冷等。例如, 在酵 母中常用诱导物是葡萄糖、 半乳糖等。
     选择的转录终止序列是在选择的具体宿主系统中可操纵的那些。例如, 当利用酵 母宿主细胞例如酿酒酵母、 乳酸克鲁维酵母或巴斯德毕赤酵母时, 酵母转录终止序列用于 本发明的表达载体, 而真菌转录终止序列将用于宿主细胞例如黑曲霉、 粗糙脉胞菌或里氏 木霉。转录终止序列包括但不限于酿酒酵母 CYC 转录终止序列 (ScCYC TT)、 巴斯德毕赤酵 母 ALG3 转录终止序列 (ALG3 TT)、 巴斯德毕赤酵母 ALG6 转录终止序列 (ALG6 TT)、 巴斯德毕 赤酵母 ALG12 转录终止序列 (ALG12 TT)、 巴斯德毕赤酵母 AOX1 转录终止序列 (AOX1 TT)、 巴 斯德毕赤酵母 OCH1 转录终止序列 (OCH1 TT) 和巴斯德毕赤酵母 PMA1 转录终止序列 (PMA1 TT)。
     本发明的表达载体还可编码选择标记。选择标记是基因功能物, 其赋予宿主细胞 可鉴定的性状以使用携带选择标记的载体转化的细胞可以与非转化的细胞区分。 载体中包 含选择标记还可用于确保连接到标记的基因功能物保留在宿主细胞群体中。 这类选择标记 可以赋予任意容易鉴定的显性性状, 例如药物抗性、 合成或代谢细胞营养物的能力等。
     酵母选择标记包括药物抗性标记和基因功能物, 其允许酵母宿主细胞合成基本 的细胞营养物, 例如氨基酸。常用于酵母的药物抗性标记包括氯霉素、 卡那霉素、 甲氨蝶 呤、 G418( 遗传霉素 )、 博莱霉素等。允许酵母宿主细胞合基本的细胞营养物的基因功能物 与在相应基因组功能中具有营养缺陷型突变的可利用的酵母菌株一起使用。常见酵母选 择标记提供用于合成亮氨酸 (LEU2)、 色氨酸 (TRP1 和 TRP2)、 尿嘧啶 (URA3, URA5, URA6)、 组氨酸 (HIS3)、 赖氨酸 (LYS2)、 腺嘌呤 (ADE1 或 ADE2) 等的基因功能物。其他酵母选择 标记包括来自酿酒酵母的 ARR3 基因, 其赋予在亚砷酸盐存在下生长的酵母细胞亚砷酸 盐 抗 性 (Bobrowicz 等 人, Yeast, 13 : 819-828(1997) ; Wysocki 等 人, J.Biol.Chem.272 : 30061-30066(1997))。大量合适的整合位点包括美国公开的申请号 2007/0072262 中列举的那些并包括与已知酿酒酵母和其它酵母或真菌的基因座的同源物。 用于将载体整合至酵 母的方法是熟知的, 例如, 参见 WO2007136865。
     因此, 本发明表达载体可以编码选择标记, 其用于在存在于培养物中的细胞群体 中鉴定和维持含有载体的宿主细胞。在一些环境下, 选择标记还可用于扩增表达载体的拷 贝数。在诱导来自本发明表达载体的转录以产生编码过表达的重组蛋白或 Leloir 途径酶 的 RNA 后, RNA 被细胞因子翻译以产生重组蛋白或 Leloir 途径酶。
     在酵母和其它真核细胞中, 通过核糖体结合 mRNA 的 5′帽和核糖体延 mRNA 移动至 第一个 AUG 起始密码子 ( 在此处多肽合成可以开始 ) 而启动信使 RNA(mRNA) 的翻译。在酵 母和哺乳动物细胞中的表达通常不需要核糖体 - 结合位点和起始密码子之间特定数量的 核苷酸 ( 如有时在原核表达系统中需要的 )。但是, 对于在酵母或哺乳动物宿主细胞中表 达, mRNA 中第一个 AUG 密码子优选是期望的翻译起始密码子。
     另外, 当表达在酵母宿主细胞中进行时, 长的非翻译引导序列例如长于 50-100 个 核苷酸的存在可以减弱 mRNA 的翻译。酵母 mRNA 引导序列具有约 50 个核苷酸的平均长度, 富含腺嘌呤, 具有较少的二级结构和几乎通常使用第一个 AUG 来起始。由于不具有这些特 征的引导序列可以降低蛋白翻译的效率, 酵母引导序列优选用于在酵母宿主细胞中过表达 的基因产物或分子伴侣蛋白的表达。 许多酵母引导序列的序列是本领域技术人员已知的和 可利用的, 例如, 参考 Cigan 等人 (Gene 59 : 1-18(1987)). 除了启动子、 核糖体 - 结合位点和起始密码子的位置, 可以影响得到的表达水平 的因素包括可复制的表达载体的拷贝数。 通常通过载体复制起点和与其关联的任意顺式作 用控制元件来确定载体的拷贝数。例如, 编码调节的着丝粒的酵母游离载体的拷贝数的增 加可通过诱导紧密排列至着丝粒的启动子的转录来获得。 另外, 在酵母载体中编码酵母 FLP 功能物还可增加载体的拷贝数。
     通过组合来自可利用的载体的 DNA 片段, 通过合成编码这类调节元件的核酸分子 或通过克隆新的调节元件并使新的调节元件位于该载体, 本领域技术人员还可容易地设计 和制备包括上述序列的表达载体。产生表达载体的方法是熟知的。过表达的 DNA 方法见于 种种关于基因工程的标准实验室手册中的任意。
     本发明的表达载体可以通过以适当的方法将上述 Leloir 途径酶和重组蛋白的编 码区连接到启动子和用于控制基因表达的其它序列元件上来制备。在该表达载体构建后, 这类载体被转化至宿主细胞, 其中可以表达过表达的重组蛋白和 Leloir 途径酶。用表达载 体转化酵母和其它低等真核细胞的方法是本领域技术人员熟知的和容易利用的。例如, 表 达载体可以通过几种方法包括醋酸锂、 原生质体、 电穿孔和类似方法中的任意被转化至酵 母细胞。
     宿主细胞
     酵母例如巴斯德毕赤酵母、 甲醇毕赤酵母和多形汉逊酵母可用于细胞培养, 因为 它们能够生长至高细胞密度和分泌大量重组蛋白。 同样, 丝状真菌例如黑曲霉、 镰孢菌属的 种、 粗糙脉胞菌等可用于以工业规模产生本发明的糖蛋白。 一般而言, 用于实践本文的方法 的低等真核细胞包括通常不能利用半乳糖作为碳源的酵母和真菌。 不能利用半乳糖作为碳 源的酵母的实例包括但不限于毕赤酵母属的甲基营养酵母, 例如巴斯德毕赤酵母, 和酵母, 例如 S.kudriavzevii、 C.glabrata、 K.waltii 和 E.gossypii。酵母可用于糖蛋白的表达,
     因为它们可以是较经济地培养, 提供高产量, 并且当适当修饰时, 能够合适的糖基化。酵母 特别提供了确定的遗传学, 允许快速转化、 测试蛋白定位策略和容易的基因敲除技术。 合适 的载体具有表达控制序列, 例如启动子, 包括 3- 磷酸甘油酸激酶或其他糖酵解酶, 以及复 制起点, 终止序列等, 如期望的。因此, 上述宿主细胞 ( 其不能通常利用半乳糖作为碳源 ) 已被基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷 酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性, 使得宿主细胞能够利用半乳糖作为碳 源。
     低等真核细胞, 特别是酵母, 还可被基因修饰以使它们表达糖蛋白, 其中糖基化模 式是人样或人源化的。这可通过如 Gerngross 等人, 美国公开的申请号 2004/0018590 所述 去除选择的内源糖基化酶和 / 或提供外源酶来获得。例如, 宿主细胞可以被选择或工程化 为缺乏 1, 6- 甘露糖基转移酶活性, 其将另外添加甘露糖残基至糖蛋白的 N- 聚糖上。
     在一个实施方案中, 如本文所述被基因工程化为同化环境半乳糖作为碳源的宿主 细胞还如下所述被基因工程化为产生复合 N- 聚糖。这类宿主细胞另外包括 α1, 2- 甘露糖 苷酶催化结构域 ( 其融合至通常不与催化结构域结合的细胞靶向信号肽并被选择将 α1, 2- 甘露糖苷酶活性靶向宿主细胞的 ER 或高尔基体 )。重组糖蛋白经过宿主细胞的 ER 或 高尔基体产生包含 Man5GlcNAc2 糖形的重组糖蛋白, 例如包含主要 Man5GlcNAc2 糖形的重组 糖蛋白组合物。例如, 美国专利号 7,029,872 和美国公开的专利申请号 2004/0018590 和 2005/0170452 公开了能够产生包含 Man5GlcNAc2 糖形的糖蛋白的低等真核生物宿主细胞。 这些宿主细胞当进一步如本文所教导的被基因工程化为表达半乳糖激酶活性、 UDP- 半乳 糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性 时, 能够利用半乳糖作为碳源。
     紧接前述宿主细胞另外包括 GlcNAc 转移酶 I(GnT I) 催化结构域 ( 其融合至通常 不与催化结构域结合的细胞靶向信号肽并被选择将 GlcNAc 转移酶 I 活性靶向宿主细胞的 ER 或高尔基体 )。重组糖蛋白经过宿主细胞的 ER 或高尔基体产生包含 GlcNAcMan5GlcNAc2 糖形的重组糖蛋白, 例如包含主要 GlcNAcMan5GlcNAc2 糖形的重组糖蛋白组合物。美国专 利号 7,029,872 和美国公开的专利申请号 2004/0018590 和 2005/0170452 公开了能够产生 包含 GlcNAcMan5GlcNAc2 的糖蛋白的低等真核生物宿主细胞。上述细胞产生的糖蛋白可以 体外用氨基己糖苷酶处理以产生包含 Man5GlcNAc2 糖形的重组糖蛋白。这些宿主细胞当进 一步如本文所教导的被基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活 性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性时, 能够利用半乳糖 作为碳源。
     然后, 紧接前述宿主细胞另外包括甘露糖苷酶 II 催化结构域 ( 其融合至通常不与 催化结构域结合的细胞靶向信号肽并被选择将甘露糖苷酶 II 活性靶向宿主细胞的 ER 或 高尔基体 )。重组糖蛋白经过宿主细胞的 ER 或高尔基体产生包含 GlcNAcMan3GlcNAc2 糖形 的重组糖蛋白, 例如包含主要 GlcNAcMan3GlcNAc2 糖形的重组糖蛋白组合物。美国专利号 7,029,872 和美国公开的专利申请号 2004/0230042 公开了表达甘露糖苷酶 II 酶和能够生 产糖蛋白具有主要 GlcNAc2Man3GlcNAc2 糖形的低等真核生物宿主细胞。上述细胞产生的糖 蛋白可以体外用氨基己糖苷酶处理以产生包含 Man3GlcNAc2 糖形的重组糖蛋白。这些宿主 细胞当进一步如本文所教导的被基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性时, 能够利 用半乳糖作为碳源。
     然后, 紧接前述宿主细胞另外包括 GlcNAc 转移酶 II(GnT II) 催化结构域 ( 其 融合至通常不与催化结构域结合的细胞靶向信号肽并被选择将 the GlcNAc 转移酶 II 活 性靶向宿主细胞的 ER 或高尔基体 )。重组糖蛋白经过宿主细胞的 ER 或高尔基体产生包 含 GlcNAc2Man3GlcNAc2(G0) 糖形的重组糖蛋白, 例如包含主要 GlcNAc2Man3GlcNAc2 糖形的 重组糖蛋白组合物。美国专利号 7,029,872 和美国公开的专利申请号 2004/0018590 和 2005/0170452 公开了能够产生包含 GlcNAc2Man3GlcNAc2 糖形的糖蛋白的低等真核生物宿 主细胞。上述细胞产生的糖蛋白可以体外用氨基己糖苷酶处理以产生包含 Man3GlcNAc2 糖 形的重组糖蛋白。 这些宿主细胞当进一步如本文所教导的被基因工程化为表达半乳糖激酶 活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半 乳糖通透酶活性时, 能够利用半乳糖作为碳源。
     最 后, 紧接前述宿主细胞另外包括半乳糖基转移酶催化结构域 ( 其融合至 通常不与催化结构域结合的细胞靶向信号肽并被选择将半乳糖基转移酶活性靶向 宿 主 细 胞 的 ER 或 高 尔 基 体 )。 重 组 糖 蛋 白 经 过 宿 主 细 胞 的 ER 或 高 尔 基 体 产 生 包 含 GalGlcNAc2Man3GlcNAc2(G1) 或 Gal2GlcNAc2Man3GlcNAc2(G2) 糖 形 或 其 混 合 物 的 重 组 糖 蛋 白, 例 如 包 含 主 要 GalGlcNAc2Man3GlcNAc2(G1) 糖 形 或 Gal2GlcNAc2Man3GlcNAc2(G2) 糖 形或其混合物的重组糖蛋白组合物。美国专利号 7,029,872 和美国公开的专利申请 号 2006/0040353 公 开 了 能 够 产 生 包 含 Gal2GlcNAc2Man3GlcNAc2 糖 形 的 糖 蛋 白 的 低 等 真核生物宿主细胞。上述细胞产生的糖蛋白可以体外用半乳糖苷酶处理以产生包含 GlcNAc2Man3GlcNAc2 糖形的重组糖蛋白, 例如包含主要 GlcNAc2Man3GlcNAc2 糖形的重组糖蛋 白组合物。这些宿主细胞当进一步如本文所教导的被基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通 透酶活性时, 能够利用半乳糖作为碳源并能够生产这样的糖蛋白, 其中含有半乳糖的 N- 聚 糖的比例大于未被基因工程化为包括上述 Leloir 途径酶的宿主细胞中的比例。
     在另一实施方案中, 紧接前述宿主细胞 ( 其如本文所公开的能够产生具有半乳糖 末端的复合 N- 聚糖并能够同化半乳糖作为碳源 ) 可另外包括唾液酸转移酶催化结构域 ( 其融合至通常不与催化结构域结合的细胞靶向信号肽并被选择将唾液酸转移酶活性靶向 宿主细胞的 ER 或高尔基体 )。重组糖蛋白经过宿主细胞的 ER 或高尔基体产生包含主要 NANA2Gal2GlcNAc2Man3GlcNAc2 糖形或 NANAGal2GlcNAc2Man3GlcNAc2 糖形或其混合物的重组 糖蛋白。对于低等真核生物宿主细胞例如酵母和丝状真菌, 有用的是宿主细胞另外包括提 供 CMP- 唾液酸用于转移至 N- 聚糖的方法。美国公开的专利申请号 2005/0260729 公开了 基因工程化低等真核细胞以具有 CMP- 唾液酸合成途径的方法, 和美国公开的专利申请号 2006/0286637 公开了基因工程化低等真核细胞以产生唾液酸化的糖蛋白的方法。 这些宿主 细胞当进一步如本文所教导的被基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差向 异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性时, 能够利 用半乳糖作为碳源并能够生产这样的糖蛋白, 其中含有半乳糖的 N- 聚糖的比例大于未被 基因工程化为包括上述 Leloir 途径酶的宿主细胞中的比例。
     在另一实施方案中, 产生主要具有 GlcNAcMan5GlcNAc2 N- 聚糖的糖蛋白的宿主细胞另外包括半乳糖基转移酶催化结构域 ( 其融合至通常不与催化结构域结合的细胞靶向 信号肽并被选择将半乳糖基转移酶活性靶向宿主细胞的 ER 或高尔基体 )。 重组糖蛋白经过 宿主细胞的 ER 或高尔基体产生包含主要 GalGlcNAcMan5GlcNAc2 糖形的重组糖蛋白。 这些宿 主细胞当进一步如本文所教导的被基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差 向异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性时, 能够 利用半乳糖作为碳源。
     在另一实施方案中, 紧接前述宿主细胞 ( 其如本文所公开的能够产生具有半乳 糖末端的杂合 N- 聚糖并能够同化半乳糖作为碳源 ) 可另外包括唾液酸转移酶催化结构 域 ( 其融合至通常不与催化结构域结合的细胞靶向信号肽并被选择将唾液酸转移酶活性 靶向宿主细胞的 ER 或高尔基体 )。重组糖蛋白经过宿主细胞的 ER 或高尔基体产生包含 NANAGalGlcNAcMan5GlcNAc2 糖形的重组糖蛋白。这些宿主细胞当进一步如本文所教导的被 基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿 苷酰转移酶活性以及任选地半乳糖通透酶活性时, 能够利用半乳糖作为碳源。
     多种前述宿主细胞另外包括一个或多个糖转运蛋白, 例如 UDP-GlcNAc 转运蛋白 ( 例如乳酸克鲁维酵母和小家鼠 (Mus musculus)UDP-GlcNAc 转运蛋白 )、 UDP- 半乳糖转运 蛋白 ( 例如黑腹果蝇 UDP- 半乳糖转运蛋白 ) 和 CMP- 唾液酸转运蛋白 ( 例如人唾液酸转运 蛋白 )。 因为低等真核生物宿主细胞例如酵母和丝状真菌缺乏上述转运蛋白, 优选的是低等 真核生物宿主细胞例如酵母和丝状真菌被基因工程化为包括上述转运蛋白。
     宿主细胞另外包括这样的细胞, 其通过删除或破坏一个或多个 β- 甘露糖基转移 酶基因 ( 例如 BMT1, BMT2, BMT3 和 BMT4) 被基因工程化为消除具有 α- 甘露糖苷酶 - 抗性 的 N- 聚糖的糖蛋白 ( 参见, 美国公开的专利申请号 2006/0211085) 和通过删除或破坏磷酸 甘露糖基转移酶基因 PNO1 和 MNN4B 之一或二者被基因工程化为消除具有磷酸甘露糖残基 的糖蛋白 ( 参见例如, 美国专利号 7,198,921 和 7,259,007), 在另外的方面, 还可包括删除 或破坏 MNN4A 基因。破坏包括破坏编码特定酶的开放读码框或利用干扰 RNA、 反义 RNA 或 类似物破坏编码一种或多种 β- 甘露糖基转移酶和 / 或磷酸甘露糖基转移酶的开放读码框 的表达或消除编码一种或多种 β- 甘露糖基转移酶和 / 或磷酸甘露糖基转移酶的 RNA 的翻 译。宿主细胞可另外包括任意一种修饰为产生特定 N- 聚糖结构的前述宿主细胞。
     宿主细胞另外包括这样的低等真核细胞 ( 例如酵母例如巴斯德毕赤酵母 ), 其通 过删除或破坏一个或多个蛋白 O- 甘露糖基转移酶 (Dol-P-Man : 蛋白 (Ser/Thr) 甘露糖基 转移酶基因 )(PMT) 被基因修饰以控制糖蛋白的 O- 糖基化 ( 参见美国专利号 5,714,377) 或如公开的国际申请号 WO 2007061631 中公开的在 Pmtp 抑制剂和 / 或 α- 甘露糖苷酶存 在下生长, 或二者。 破坏包括破坏编码 Pmtp 的开放读码框或利用干扰 RNA、 反义 RNA 或类似 物破坏编码一个或多个 Pmtp 的开放读码框的表达或消除编码一个或多个 Pmtp 的 RNA 的翻 译。宿主细胞可另外包括任意一种修饰为产生特定 N- 聚糖结构的前述宿主细胞。
     Pmtp 抑制剂包括但不限于苯亚甲基噻唑烷二酮类。 可以利用的苯亚甲基噻唑烷二 酮的实例是 5-[[3, 4- 双 ( 苯基甲氧基 ) 苯基 ] 亚甲基 ]-4- 氧代 -2- 硫代 -3- 噻唑烷乙酸 ; 5-[[3-(1- 苯基乙氧基 )-4-(2- 苯基乙氧基 )] 苯基 ] 亚甲基 ]-4- 氧代 -2- 硫代 -3- 噻唑 烷乙酸和 5-[[3-(1- 苯基 -2- 羟基 ) 乙氧基 )-4-(2- 苯基乙氧基 )] 苯基 ] 亚甲基 ]-4- 氧 代 -2- 硫代 -3- 噻唑烷乙酸 .在具体实施方案中, 至少一个内源 PMT 基因的功能或表达被降低、 破坏或缺失。例 如, 在具体的实施方案中, 至少一个选自 PMT1、 PMT2、 PMT3 和 PMT4 基因的内源 PMT 基因的功 能或表达被降低、 破坏或缺失 ; 或在一个或多个 PMT 抑制剂存在下培养宿主细胞。 在另外的 实施方案中, 宿主细胞包括一个或多个 PMT 基因缺失或破坏以及在一个或多个 Pmtp 抑制剂 存在下培养宿主细胞。在这些实施方案的具体方面, 宿主细胞还表达分泌的 α-1, 2- 甘露 糖苷酶。
     PMT 缺失或破坏和 / 或 Pmtp 抑制剂通过降低 O- 糖基化占据 (occupancy) 即通过 降低在糖蛋白上被糖基化的 O- 糖基化位点的总数来控制 O- 糖基化。进一步添加细胞分泌 的 α-1, 2- 甘露糖苷酶降低糖蛋白上 O- 聚糖的甘露糖链长度来控制 O- 糖基化。因此, 将 PMT 缺失或破坏和 / 或 Pmtp 抑制剂与分泌的 α-1, 2- 甘露糖苷酶的表达组合通过降低占据 和链长度来控制 O- 糖基化。在具体的情况中, 确定 PMT 缺失或破坏、 Pmtp 抑制剂和 α-1, 2- 甘露糖苷酶的具体组合, 经验上是因为具体的异源糖蛋白 ( 例如 Fab 和抗体 ) 可通过 具有不同效率程度的高尔基体被表达和转运, 因此可需要 PMT 缺失或破坏、 Pmtp 抑制剂和 α-1, 2- 甘露糖苷酶的具体组合。 在另一方面, 编码一个或多个内源甘露糖基转移酶的基因 被缺失。该缺失可以与提供分泌的 α-1, 2- 甘露糖苷酶和 / 或 PMT 抑制剂组合或可以代替 提供分泌的 α-1, 2- 甘露糖苷酶和 / 或 PMT 抑制剂。
     因此, O- 糖基化的控制可以用于在本文公开的宿主细胞中以更高的总产量或适当 组装的糖蛋白的产量生产具体糖蛋白。 O- 糖基化的降低或消除看起来具有组装和转运完整 抗体和 Fab 片段的优势效果, 因为它们穿越分泌途径和被转运至细胞表面。因此, 在 O- 糖 基化被控制的细胞中, 适当组装的抗体或 Fab 片段的产率比在 O- 糖基化未被控制的宿主细 胞中得到的产率增加。
     因 此, 预 期 的 是 已 被 基 因 修 饰 的 宿 主 细 胞, 以 产 生 糖 蛋 白, 其中在糖蛋白上 的 主 要 N- 聚 糖 包 括 但 不 限 于 Man8GlcNAc2、 Man7GlcNAc2、 Man6GlcNAc2、 Man5GlcNAc2、 GlcNAcMan5GlcNAc2、 GalGlcNAcMan5GlcNAc2、 NANAGalGlcNAcMan5GlcNAc2、 Man3GlcNAc2、 GlcNAc (1-4) Man 2 GlcNAc 2 、Gal (1-4) GlcNAc (1-4) Man 3 GlcNAc 2 、NANA (1-4) Gal (1-4) GlcNAc (1-4) Man3GlcNAc2。 另外包括的是这样的宿主细胞, 其产生具有前述 N- 聚糖的具体混合物的糖蛋 白。
     本文中的宿主细胞和方法用于产生广泛的重组蛋白和糖蛋白。 可以在本文公开的 宿主细胞中产生的重组蛋白和糖蛋白的实例包括但不限于红细胞生成素 (EPO), 细胞因子 例如干扰素 α、 干扰素 β、 干扰素 γ 和干扰素 ω, 和粒细胞集落刺激因子 (GCSF), GM-CSF, 凝固因子例如因子 VIII、 因子 IX 和人蛋白 C, 抗凝血酶 III, 凝血酶, 可溶性 IgE 受体 α- 链, 免疫球蛋白例如 IgG、 IgG 片段、 IgG 融合体和 IgM, 免疫粘附素和其它 Fc 融合蛋白例如可 溶性 TNF 受体 -Fc 融合蛋白, RAGE-Fc 融合蛋白, 白细胞介素, 尿激酶, 糜蛋白酶和尿胰蛋白 酶抑制剂, IGF- 结合蛋白, 表皮生长因子, 生长激素释放因子, 膜联蛋白 V 融合蛋白, 制管张 素, 血管内皮生长因子 -2, 骨髓样前体抑制因子 -1, 骨保护蛋白, α-1- 抗胰蛋白酶, 甲胎蛋 白, DNA 酶 II, 人纤溶酶原的三环 3, 葡糖脑苷脂酶, TNF 结合蛋白 1, 促卵泡激素, 细胞毒性 T 淋巴细胞相关抗原 4-Ig, 跨膜激活剂和钙调节剂和亲环蛋白配体, 胰高血糖素样蛋白 1 和 IL-2 受体激动剂。
     本文公开的本发明的重组宿主细胞特别用于生产抗体、 Fc 融合蛋白等, 期望的是与在进行如本文所教导的修饰之前的宿主细胞中获得的抗体组合物的半乳糖百分比相比, 在重组宿主细胞中提供增加的含有半乳糖的 N- 聚糖的百分比的抗体组合物。一般而言, 宿 主细胞能够使得这样的抗体组合物产生, 其中所述 G0 ∶ G1/G2 糖形的比值小于 2 ∶ 1。可 以在本文中的宿主细胞中产生并具有 G0 ∶ G1/G2 的比值小于 2 ∶ 1 的抗体的实例包括但不 限于人抗体、 人源化的抗体、 嵌合抗体、 重链抗体 ( 例如骆驼 (camel 或 llama))。具体抗体 包括但不限于以其通用名称 ( 靶 ) 引用的以下抗体 : 莫罗单抗 -CD3( 抗 -CD3 受体抗体 )、 阿 昔单抗 ( 抗 -CD417E3 抗体 )、 利妥昔单抗 ( 抗 -CD20 抗体 )、 达珠单抗 ( 抗 -CD25 抗体 )、 巴 利昔单抗 ( 抗 -CD25 抗体 )、 帕利珠单抗 ( 抗 -RSV( 呼吸道合胞病毒 ) 抗体 )、 英夫利昔单 抗 ( 抗 -TNFα 抗体 )、 曲妥珠单抗 ( 抗 -Her2 抗体 )、 吉姆单抗奥佐米星 ( 抗 -CD33 抗体 )、 阿仑单抗 ( 抗 -CD52 抗体 )、 替伊莫单抗 ( 抗 -CD20 抗体 )、 阿达木单抗 ( 抗 -TNFα 抗体 )、 131 奥马珠单抗 ( 抗 -IgE 抗体 )、 托西莫单抗 - I( 抗 -CD20 抗体的碘化的衍生物 )、 依法利珠 单抗 ( 抗 -CD11a 抗体 )、 西妥昔单抗 ( 抗 -EGF 受体抗体 )、 戈利木单抗 ( 抗 -TNFα 抗体 )、 贝伐单抗 ( 抗 VEGF-A 抗体 ) 及其变体。可以在本文中的宿主细胞中产生的 Fc- 融合蛋白 的实例包括但不限于依那西普 (TNFR-Fc 融合蛋白 )、 FGF-21-Fc 融合蛋白、 GLP-1-Fc 融合 蛋白、 RAGE-Fc 融合蛋白、 EPO-Fc 融合蛋白、 ActRIIA-Fc 融合蛋白、 ActRIIB-Fc 融合蛋白、 胰高血糖素 -Fc 融合物、 泌酸调节肽 -Fc- 融合物及其类似物和变体。 本文公开的重组细胞可用于产生适合于化学缀合异源的肽或药物分子的抗体和 Fc 片段。例如 WO2005047334、 WO2005047336、 WO2005047337 和 WO2006107124 公开了将肽 或药物分子与 Fc 片段化学缀合。EP1180121、 EP1105409 和 US6593295 公开了将血液组分 与肽等化学缀合, 其包括完整抗体。
     如本文所教导的宿主细胞和 / 或编码 Leloir 途径酶的多种组合的质粒载体可以 作为试剂盒提供, 其提供用于产生表达异源蛋白的重组巴斯德毕赤酵母的选择系统。巴斯 德毕赤酵母宿主细胞被基因工程化为表达选自半乳糖激酶、 UDP- 半乳糖 -4- 差向异构酶和 半乳糖 -1- 磷酸尿苷酰转移酶的 Leloir 途径酶中的一种或两种。任选地, 宿主细胞也可表 达半乳糖通透酶。克隆载体包括多克隆位点和编码宿主细胞中未提供的 Leloir 途径酶的 表达盒。载体可另外包括在多克隆位点两侧的巴斯德毕赤酵母可操纵的启动子和转录终 止序列以及可另外包括用于将载体靶向到宿主细胞基因组中的具体位置的靶向序列。在 一些实施方案中, 试剂盒提供这样的载体, 其编码所有三个 Leloir 途径酶 ( 半乳糖激酶、 UDP- 半乳糖 -4- 差向异构酶和半乳糖 -1- 磷酸尿苷酰转移酶 ) 和包括多克隆位点和缺乏三 种 Leloir 途径酶的宿主细胞。试剂盒应另外包括说明书、 载体图谱等。
     以下实施例意图是促进对本发明的进一步理解。
     实施例 1
     在该实施例中, 通常根据 Davidson 等人在美国公开的申请号 2006/0040353 中公 开的方法构建能够产生含有半乳糖的 N- 聚糖的巴斯德毕赤酵母宿主细胞。本文的方法可 用于将其他物种的通常不能利用半乳糖作为碳源的重组宿主细胞变成能够利用半乳糖作 为单一碳源的重组宿主细胞。
     半 乳 糖 基 转 移 酶 I 嵌 合 酶。 利 用 PCR 引 物 RCD192(5’ -GCCGCGACCTGAGCC GCCTGCCCCAAC-3’ (SEQ ID NO : 1)) 和 RCD186(5’ -CTAGCTCGGTGTCCCGATGTCCACTGT-3’ (SEQ ID NO : 2)) 从人肾脏 cDNA(Clontech)PCR 扩增智人 (Homo sapiens)β-1, 4- 半乳糖基转移
     酶 I 基因 (hGalTI, Genbank AH003575)。该 PCR 产物被克隆至 pCR2.1 载体 (Invitrogen) 并测序。从该克隆进行 PCR 重叠突变发生用于三个目的 : 1) 去除开放读码框内的 NotI 位 点同时维持野生型蛋白序列, 2) 在内源跨膜结构域的立即下游截短蛋白以仅提供催化结构 域和 3) 在 5’ 和 3’ 端分别引入 AscI 和 PacI 位点用于克隆。为了进行 PCR 重叠突变发生, 利用 PCR 引物 RCD198(5’ -CTTAGGCGCGCCGGCCGCGACCTGAGCCGCCTGCCC-3’ (SEQ ID NO : 3)) 和 RCD201(5’ -GGGGCATATCTGCCGCCCATC-3’ (SEQ ID NO : 4))PCR 扩增基因的 5’ 端直至 NotI 位点和利用 PCR 引物 RCD200(5’ -GATGGGCGGCAGATATGCCCC-3’ (SEQ ID NO : 5)) 和 RCD199( 5’ -CTTCTTAATTAACTAGCTCGGTGTCCCGATGTCCAC-3’ (SEQ ID NO : 6))PCR 扩增 3’ 端。用引物 RCD198 和 RCD199 将产物在一起重叠以重合成具有野生型氨基酸序列同时去除 NotI 位点的 截短的编码半乳糖基转移酶的开放读码框 (ORF)。新的 hGalTIβPCR 催化结构域产物被克 隆至 pCR2.1 载体 (Invitrogen, Carlsbad, CA) 并测序。引入的 AscI 和 PacI 位点用它们 识别的限制酶切割并将 DNA 片段亚克隆进质粒 pRCD259 的 PpGAPDH 启动子下游以产生质粒 pRCD260。编码 hGalTI43 催化结构域 ( 缺乏最先的 43 个氨基酸 ; SEQ ID NO : 50) 的核苷酸 序列显示于 SEQ ID NO : 49。
     来自酿酒酵母、 巴斯德毕赤酵母和乳酸克鲁维酵母的将蛋白靶向到高尔基体中的 各种位置的酵母引导序列文库被连接到该载体 NotI 和 AscI 位点之间, 从而将这些引导 编码序列符合读框地与编码 hGalTIβ43 催化结构域的开放读码框融合。上述 GalT 融合 蛋白的组合文库在 YSH44 中表达并通过从来自各个转化子的纯化的 K3 释放 N- 聚糖和用 MALDI-TOF MS 测定它们各自分子量分析得到的转化子。 巴斯德毕赤酵母菌株 YSH44 表达人 纤溶酶原的三环 3 结构域 (K3), 其为实质上均一的具有双触角末端 GlcNAc 残基的复合糖形 (GlcNAc2Man3GlcNAc2, 参见图 1)。活性构建体之一是 Mnn2-hGalTIβ43, 其编码融合蛋白, 所述融合蛋白包含酿酒酵母 Mnn2 靶向肽的的 N- 末端 ( 氨基酸 1-36(53)SEQ ID NO : 20) 融 合至 hGalTIβ43 催化结构域的 N- 末端 ( 氨基酸 44-398 ; SEQ ID NO : 50)。引导序列含有 酿酒酵母 MNN2 基因最先的 108bp 并且该序列确实已被插入 pRCD260 的 NotI 和 AscI 位点 之间以产生质粒 pXB53。用 XbaI 线性化质粒 pXB53 并转化至酵母菌株 YSH44 以产生菌株 YSH71。菌株 YSH44 已描述在美国公开的申请号 20070037248、 20060040353、 20050208617 和 20040230042 中以及菌株 YSH71 已描述在美国公开的申请号 20060040353 中。
     如 图 3C 所 示, 菌 株 YSH71 产 生 的 一 小 部 分 ( 约 10 % )N- 聚 糖 具 有 与 单 个 半 乳 糖 添 加 到 K3 上 的 GlcNAc2Man3GlcNAc2(G0)N- 聚 糖 底 物 一 致 的 质 量 以 产 生 而其余的 N- 聚糖与母本菌株 YSH44 产生的 N- 聚糖相 GalGlcNAc2Man3GlcNAc2(G1)N- 聚糖, 同 ( 图 3B)。图 3A 显示野生型酵母中产生的 N- 聚糖。
     我们认为对于不完全的半乳糖转移存在几种解释。这些解释包括较差的 UDP- 半 乳 糖 转 运、 较 低 的 内 源 水 平 UDP- 半 乳 糖 或 亚 最 适 的 (suboptimal)GalT 活 性。 看 起 来 半乳糖转移到 N- 聚糖上可能较低, 因为菌株可能需要转运蛋白以将 UDP- 半乳糖从细 胞 质 转 位 至 高 尔 基 体 (Ishida 等 人, J.Biochem.120 : 1074-1078(1996) ; Miura 等 人, J.Biochem(Tokyo)120 : 236-241(1996) ; Tabuchi 等 人, Biochem.Biophys.Res.Com.232 : 121-125(1997) ; Segawa 等人, FEBS Letts.451 : 295-298(1999))。转运蛋白是具有多个 跨膜结构域的复合蛋白, 其可以不适当地定位于异源宿主。但是, 几种糖核苷酸转运蛋 白, 包括 UDP- 半乳糖转运蛋白已在异源系统中活跃表达 (Sun-Wada 等人, J.Biochem.(Tokyo)123 : 912-917(1998) ; Segawa 等 人 Eur.J.Biochem.269 : 128-138(2002) ; Kainuma 等 人, Glycobiol.9 : 133-141(1999) ; Choi 等 人, Proc Natl Acad Sci U S A 100(9) : 5022-5027(2003))。为确保 UDP- 半乳糖有效转运至高尔基体, 编码 UDP- 半乳糖转运蛋 白的黑腹果蝇基因 DmUGT(GenBank 登记号 AB055493) 被克隆并将该克隆如下转化至表达 MNN2-hGalTIβ43 构建体的菌株 YSH71。
     UDP- 半乳糖转运蛋白的克隆。利用 PCR 引物 DmUGT-5’ (5’ -GGCTCGAGCGGCCGCCA CCATGAATAGCATACACATGAACGCCAATACG-3’ (SEQ ID NO : 7)) 和 DmUGT-3’ (5’ -CCCTCGAGTTAA TTAACTAGACGCGCGGCAGCAGCTTCTCCTCATCG-3’ (SEQ ID NO : 8)), 从黑腹果蝇 cDNA 文库 (UC Berkeley Drosophila 基因组 Project, 卵巢 λ-ZAP 文库 GM)PCR 扩增编码 UDP 半乳糖转运 蛋白的黑腹果蝇基因 (GenBank AB055493), 称为 DmUGT, 并将 PCR 扩增的 DNA 片段克隆至 pCR2.1(Invitrogen, Carlsbad, CA) 并测序。然后利用 NotI 和 PacI 位点将该开放读码框 亚克隆至质粒 pRCD393 的 PpOCH1 启动子下游 NotI 和 PacI 位点之间以产生质粒 pSH263。 编码 DmUGT 的核苷酸序列显示于 SEQ ID NO : 37 和 DmUGT 的氨基酸序列显示于 SEQ ID NO : 38。将该质粒用 AgeI 线性化并转化至菌株 YSH71 以产生菌株 YSH80。但是, 当编码 DmUGT 的质粒被转化至 YSH71 时, 发现 K3 的 N- 聚糖分布情况没有显著变化。因此, 我们决定将精 力集中于增强 UDP- 半乳糖细胞内库 (pool)。
     因为巴斯德毕赤酵母不能同化半乳糖作为碳源 (Kurtzman Pichia.The Yeasts : A Taxonomic Study.C.P.a.F.Kurtzman, J.W.Amsterdam, Elsevier Science Publ. : 273-352(1998)), 我们推测菌株中的 UDP- 半乳糖库可能不充分。在半乳糖同化生物包括 细菌和哺乳动物中保守的 UDP- 半乳糖 4- 差向异构酶催化 Leloir 途径的第三步。该酶通 常位于真核细胞的细胞质并负责 UDP- 葡萄糖和 UDP- 半乳糖的可逆转换 (Allard 等人, 细 胞 .Mol.Life Sci.58 : 1650-1665(2001))。我们推论异源 UDP- 半乳糖 4- 差向异构酶的表 达将产生细胞质 UDP- 半乳糖库, 去转运至高尔基体后, 将使得半乳糖转移酶将半乳糖转移 到 N- 聚糖上。
     UDP- 半 乳 糖 4- 差 向 异 构 酶 的 克 隆。 从 粟 酒 裂 殖 酵 母 (Schizosaccharomyces pombe) 克隆之前未表征的基因, 以下命名为 SpGALE, 其编码与已知的 UDP- 半乳糖 4- 差 向异构酶具有显著同一性的蛋白。利用 PCR 引物 GALE2-L(5’ -ATGACTGGTGTTCATGAAGGG -3’ (SEQ ID NO : 9)) 和 GALE2-R(5’ -TTACTTATA TGTCTTGGTATG-3’ ((SEQ ID NO : 10)), 从粟酒裂殖酵母 (ATCC24843) 基因组 DNA PCR 扩增编码预测的 UDP 半乳糖 -4- 差向异 构 酶 (GenBank NC_003423) 的 1.1Kb 粟 酒 裂 殖 酵 母 基 因, 称 为 SpGALE。PCR 扩 增 的 产 物 被 克 隆 至 pCR2.1(Invitrogen, Carlsbad, CA) 并 测 序。 测 序 显示 在 +66 位 存 在 内 含 子 (175bp)。 为 了 消 除 内 含 子, 设 计 上 游 PCR 引 物 GD1(5’ -GCGGCCGCATGA CTGGTGTTCA TGAAGGGACT GTGTTGGTTACTGGCGGCGC TGGTTATATA GGTTCTCATA CGTGCGTTGTTTTGTTAGAA AA-3’ ((SEQ ID NO : 11)), 其具有 NotI 位点, 位于内含子上游第 66 个碱基处, 然后在内含 子之前 20 个碱基和下游 PCR 引物 GD2(5’ -TTAATTAATT ACTTATATGT CTTGGTATG-3’ ((SEQ ID NO : 12)) 具有 PacI 位点。利用引物 GD1 和 GD2 以从 pCR2.1 亚克隆扩增 SpGALE 内含 子缺少的基因并将产物再克隆至 pCR2.1 并测序。然后将 SpGALE 在 NotI 和 PacI 位点之 间分别亚克隆至质粒 pRCD402 和 pRCD403 以产生质粒 pRCD406(POCH1-SpGALE-CYC1TT) 和 pRCD407(PSEC4-SpGALE-CYC1TT)。这些质粒已在之前的美国公开的申请号 20060040353 中描述。编码不含内含子的 SpGALE 的核苷酸序列显示于 SEQ ID NO : 35 和氨基酸序列显示于 SEQ ID NO : 36。
     人 UDP 半乳糖 -4- 差向异构酶 (hGalE) 具有 SEQ ID NO : 48 所示的氨基酸序列, 其 由 SEQ ID NO : 47 所示的核苷酸序列编码。可以利用 hGalE 代替 SpGALE。
     双 GalT/ 半乳糖 -4- 差向异构酶构建体的构建。含有 ScMNN2-hGalTIβ43 融合基 因的质粒 pXB53 用 XhoI 线性化并用 T4DNA 聚合酶产生平端。然后用 XhoI 和 SphI 并将末 端用 T4DNA 聚合酶产生平端从质粒 pRCD406 去除 PPpOCH1SpGALE-CYC1TT 表达盒, 并将片段插 入上述 pXB53 质粒以产生质粒 pRCD425。将该质粒用 XbaI 线性化并转化至菌株 YSH44 以 产生菌株 RDP52, 其已在之前的美国公开的申请号 20060040353 中描述。通过 MALDI-TOF MS 分析从几种转化子分离的纯化的 K3 上的 N- 聚糖。如图 3D 所示, 发现相当比例的 N- 聚 糖已获得与两个 ( 约 20 % G2 : Gal2GlcNAc2Man3GlcNAc2) 或单个半乳糖部分 ( 约 40 % G1 : Gal1GlcNAc2Man3GlcNAc2) 添加到 G0(GlcNAc2Man3GlcNAc2) 底物上的一致的质量, 而其余的 N- 聚糖保持与 YSH44 母本中发现的质量没有改变 ( 图 3B), 即 G0。
     三 GalT/ 半乳糖 -4- 差向异构酶 /UDP 半乳糖转运蛋白构建体的构建。 通过用 SacI R 消化将含有 POCH1-DmUGT-CYC1TT 的 G418 质粒 pSH263 线性化并用 T4 DNA 聚合酶进行末端 平端化。通过用 XhoI 和 SphI 消化将 PSEC4-SpGALE-CYC1TT 表达盒从质粒 pRCD407 去除并用 T4 DNA 聚合酶进行末端平端化。 然后将平末端的 SpGALE 片段插入上述 pSH263 以产生质粒 pRCD446。通过用 BglII/BamHI 消化从质粒 pXB53 释放 PGAPDHScMNN2-hGalTIβ43-CYC1TT 表 达盒并用 T4 DNA 聚合酶进行末端平端化。 然后将平末端的 hGalTI-53 插入 pRCD446 的平端 的 EcoRI 位点以产生质粒 pRCD465, 其是含有 hGalTI-53、 SpGALE 和 DmUGT 的三 G418R 质粒。 用 AgeI 线性化质粒 pRCD465 并转化至菌株 YSH44 以产生菌株 RDP80, 其如美国公开的申请 号 20060040353 中描述的。通过 MALDI-TOF MS 分析从菌株产生的分泌的 K3 释放的 N- 聚 糖。发现 N- 聚糖具有定量添加两个半乳糖残基到 G0 底物上一致的质量以产生人半乳糖基 化、 双触角复合 N- 聚糖 G2(Gal2GlcNAc2Man3GlcNAc2)( 图 3E)。 该 N- 聚糖的体外 β- 半乳糖 苷酶消化产生对应于去除两个半乳糖残基的降低的质量, 得到 G0(GlcNAc2Man3GlcNAc2)( 图 3F)。
     另外, 在 CMP- 唾液酸存在下用大鼠 α-2, 6-N- 唾液酸转移酶体外处理从菌株 RDP80 纯化的 K3 产生几乎均一地转换成 NANA2Gal2GlcNAc2Man3GlcNAc2( 图 3G)。这些结果 表明通过 (1) 充分的细胞内 UDP- 半乳糖库的代谢工程, (2) 活性的和适当定位的 GalT 的 表达和 (3) 通过活性 UDP- 半乳糖转运蛋白的 UDP- 半乳糖至高尔基体的易位, 可获得在巴 斯德毕赤酵母产生的复合 N- 聚糖高效延伸。但是, 半乳糖转移的效率通过进一步包括将 Leloir 途径的酶引入宿主细胞来改进, 如实施例 2 所示。
     菌株和培养基。大肠杆菌菌株 TOP10 或 DH5α 用于重组 DNA 工作。来源于菌株 JC308(J.Cregg, Claremont, CA) 的巴斯德毕赤酵母菌株 YSH44(Hamilton 等人, Science 301 : 1244-1246(2003)) 用于产生多种酵母菌株。酵母菌株的转化通过如前报道的电穿孔 进行 (Cregg, 等人, Mol.Biotechnol.16 : 23-52(2000))。在室温在 96 孔板形式中进行蛋白 表达 ( 除了生物反应器实验 ), 使用缓冲的甘油 - 复合培养基 (BMGY), 由 1%酵母提取物, -5 2 %蛋白胨, 100mM 磷酸钾缓冲液, pH 6.0, 1.34 %酵母氮源, 4X10 %生物素和 1 %甘油组 成, 作为生长培养基 ; 以及缓冲的甲醇 - 复合培养基 (BMMY), 由 1%甲醇替代甘油的 BMGY 组成作为诱导培养基。YPD 是 1%酵母提取物、 2%蛋白胨、 2%葡萄糖和 2%琼脂。
     限 制 和 修 饰 酶 来 自 New England BioLabs(Beverly, MA)。 寡 核 苷 酸 获 自 Integrated DNA Technologies(Coralville, IA)。β- 半乳糖苷酶获自 QAbio(San Mateo, CA)。 96 孔裂解物清除板 (lysate-clearing plate) 来自 Promega(Madison, WI)。 蛋白 - 结 合 96 孔板来自 Millipore(Bedford, MA)。盐和缓冲剂来自 Sigma(St.Louis, MO)。MALDI 基质来自 Aldrich(Milwaukee, WI)。
     蛋 白 纯 化 和 N- 聚 糖 分 析。K3 纯 化 如 前 述 (Choi 等 人, Proc.Natl.Acad.Sci. U.S.A.100 : 5022-5027(2003))。 利 用 获 自 New England BioLabs(Beverly, MA) 的 N- 糖 苷酶 F 从 K3 释放 N- 聚糖, 如前述 (Choi 等人, ibid.)。利用 Applied Bio 系统 (Foster City, CA) 的 Voyager DE PRO 线性 MALDI-TOF 质谱仪测定聚糖的分子量, 如前述 (Choi 等 人, ibid.)。
     生物反应器培养。用 1mL 的种子培养物 ( 参见摇瓶培养 ) 接种含有 150mL BMGY 培养基的 500mL 带挡板的容量瓶。在 24℃将接种物培养至 OD600 为 4-6( 大约 18 小时 )。 然后将来自接种培养物的细胞离心并重悬至 50mL 发酵培养基 ( 每升培养基 : CaSO4.2H2O 0.30g, K2SO46.00g, MgSO4.7H2O 5.00g,甘 油 40.0g, PTM1 盐 2.0mL,生 物 素 4x10-3g, H3PO4(85% )30mL, PTM1 盐每升 : CuSO4.H2O 6.00g, NaI0.08g, MnSO4.7H2O 3.00g, NaMoO4.2H2O 0.20g, H3BO3 0.02g, CoCl2.6H2O 0.50g, ZnCl2 20.0g, FeSO4.7H2O 65.0g, 生物素 0.20g, H2SO4(98% )5.00mL)。
     在 3 升碟形底 (1.5 升初始进料体积 )Applikon 生物反应器中进行发酵。 发酵罐在 24℃的温度下以分批补料模式运行, 并将 pH 控制在 4.5±0.1 利用 30%氢氧化铵。通过调 整搅拌速率 (450-900rpm) 和纯氧提供, 将溶解氧维持在 40%以上, 相对于在 1atm 下用空气 饱和。空气流动速率维持在 1vvm。当在分批培养期 (the batch phase) 初始甘油 (40g/L) 被耗尽时, 这是 DO 增加的指示, 将含有 12ml/L PTM1 盐的 50%甘油溶液以 12mL/L/h 的进料 速率补料直到达到所期望的生物质浓度。在半小时饥饿期后, 起始甲醇补料 ( 含有 12mL/L PTM1 的 100%甲醇 )。 甲醇进料速率用于控制发酵罐中甲醇浓度在 0.2-0.5%之间。 利用位 于发酵罐的排出气中 TGS 气体传感器 (TGS822, 来自 Figaro Engineering Inc.) 在线测量 甲醇浓度。每 8 小时对发酵罐中进行取样和分析生物质 (OD600, 湿细胞重和细胞计数 ), 剩 余碳源水平 ( 利用 Aminex 87H 通过 HPLC 测量甘油和甲醇 ) 和细胞外蛋白含量 ( 通过 SDS page 和 Bio-Rad 蛋白测定 )。
     体外 β- 半乳糖苷酶消化。来自 RDP80 的 N- 聚糖与 β1, 4- 半乳糖苷酶 (QA bio, San Mateo, CA) 在 50mM NH4HCO3, pH6.0 中在 37℃孵育 16-20 小时。
     体外唾液酸转移。从菌株 RDP80 纯化的 K3 用作唾液酸转移的底物。将 200μg 该蛋白与 50μg CMP- 唾液酸和 15mU 大鼠重组 α-(2, 6)-(N)- 唾液酸转移酶 ( 来自 EMD Biosciences(San Diego, CA, formerly Calbiochem)) 在 50mM NH4HCO3, pH6.0 中在 37℃孵 育 16-20 小时。然后通过 PNGaseF 消化释放 N- 聚糖并通过 MALDI-TOF MS 检测。
     实施例 2
     UDP- 半乳糖 4- 差向异构酶催化 Leloir 途径的第三步 ( 图 4)。如实施例 1 所示, 在糖工程化的巴斯德毕赤酵母菌株中编码该酶的基因的异源表达引起 UDP- 半乳糖细胞内 库的产生, 如表达该异源基因的菌株中半乳糖转移显著增加所证实的。但是, 还如所示的,仅添加该酶不能赋予巴斯德毕赤酵母菌株在半乳糖 ( 作为单一碳源 ) 上生长的能力 ( 参见 图 7, 菌株 RDP578-1)。因此, 将酿酒酵母中 Leloir 途径的其余酶引入实施例 1 的各种菌株 中。因此, 在该实施例中, 构建了能够利用半乳糖作为单一碳源的巴斯德毕赤酵母宿主细 胞。 本文的方法可用于将通常不能利用半乳糖作为碳源的其他物种的重组宿主细胞制备成 能够利用半乳糖作为单一碳源的重组宿主细胞。
     酿酒酵母 GAL1 的克隆。 利用 PCR 引物 PB158(5’ -TTAGCGGCCGCAGGAATGACTAAATCTC ATTCA-3’ (SEQ ID NO : 13)) 和 PB159(5’ -AACTTAATTAAGCTTATAATTCATATAGACAGC-3’ (SEQ ID NO : 14)), 从酿酒酵母基因组 DNA( 菌株 W303, 标准 smash 和 grab 基因组 DNA 制备 )PCR 扩增 编码半乳糖激酶 (GenBank NP_009576) 的酿酒酵母基因 ( 称为 ScGAL1), 将 PCR 扩增的 DNA 片段克隆至 pCR2.1(Invitrogen, Carlsbad, CA) 并测序。得到的质粒命名为 pRCD917。用 NotI 和 PacI 将编码半乳糖激酶的 DNA 片段从质粒释放并将 DNA 片段亚克隆进质粒 pGLY894 的巴斯德毕赤酵母 HHT1 强组成型启动子下游 NotI 和 PacI 位点之间以产生质粒 pGLY939。 半乳糖激酶具有 SEQ ID NO : 40 所示的氨基酸序列并由 SEQ ID NO : 39 所示的核苷酸序列编 码。
     酿酒酵母 GAL2 的克隆。利用 PCR 引物 PB156(5’ -TTAGCGGCCGC-3’ (SEQ ID NO : 15)) 和 PB157(5’ -AACTTAATTAA-3’ (SEQ ID NO : 16)) 从酿酒酵母基因组 DNA( 菌株 W303, 标准 “smash and grab” 基因组 DNA 制备 )PCR 扩增编码半乳糖通透酶 (GenBankNP_013182) 的酿酒酵母基因 ( 称为 ScGAL2), 将 PCR 扩增的 DNA 片段亚克隆进 pCR2.1(Invitrogen, Carlsbad, CA) 并测序。得到的质粒命名为 pPB290。用 NotI 和 PacI 将编码半乳糖通透酶 的 DNA 片段从质粒释放并将 DNA 片段亚克隆进质粒 pJN664 的 PpPMA1 启动子下游 NotI 和 PacI 位点之间以产生质粒 pPB292。半乳糖通透酶具有 SEQ ID NO : 44 所示的氨基酸序列并 由 SEQ ID NO : 43 所示的核苷酸序列编码。
     酿 酒 酵 母 GAL7 的 克 隆。 利 用 PCR 引 物 PB160(5’ -TTAGCGGCCGCAGGAATGAC TGCTGAAGAA TT-3’ (SEQ ID NO : 17)) 和 PB161(5’ -AACTTAATTA AGCTTACAGT CTTTGTAGAT AATC-3’ (SEQ ID NO : 18) 从酿酒酵母基因组 DNA( 菌株 W303, 标准 smash and grab 基因组 DNA 制备 )PCR 扩增编码半乳糖 -1- 磷酸尿苷酰转移酶 (GenBank NP_009574) 的酿酒酵母 基因 ( 称为 ScGAL7), 将 PCR 扩增的 DNA 片段克隆至 pCR2.1(Invitrogen, Carlsbad, CA) 并 测序。得到的质粒命名为 pRCD918。用 NotI 和 PacI 将编码半乳糖 -1- 磷酸尿苷酰转移酶 的 DNA 片段从质粒释放并将 DNA 片段亚克隆进质粒 pGLY143 的 PpPMA1 强组成型启动子下 游 NotI 和 PacI 位点之间以产生质粒 pGLY940。个别地, NotI 和 PacI 位点还用于亚克隆该 ORF 至质粒 pRCD830 巴斯德毕赤酵母 TEF1 强组成型启动子下游的 NotI/PacI 处以产生质 粒 pRCD929。半乳糖 -1- 磷酸尿苷酰转移酶具有 SEQ ID NO : 42 所示的氨基酸序列并由 SEQ ID NO : 41 所示的核苷酸序列编码。
     三 ScGAL1/ScGAL7/ScGAL2 构建体的构建。将来自 pGLY917 的 ScGAL1 开放读码 框亚克隆至 pJN702, 一种巴斯德毕赤酵母 his1 敲除载体, 具有巴斯德毕赤酵母 ARG1 选 择标记 (his1::ARG1, 参见美国专利号 7,479,389) 且还含有 PGAPDH- 启动子表达盒 ; 含有 PGAPDH-ScGAL1 融合的这种新的载体命名为 pRCD928。将来自 pGLY929 的 PTEF1-ScGAL7 表达盒 亚克隆至 pGLY928, 新的载体命名为 pGLY946a。下一步, 将来自 pRCD634 的 POCH1-DmUGT( 高 尔基体 UDP- 半乳糖转运蛋白 ) 表达盒亚克隆至 pGLY946a 以产生 pGLY956b。最后, 将来自pPB292 的 PGAPDH-ScGAL2 表达盒亚克隆至 pRCD956b 以产生质粒 pRCD977b( 参见图 6)。质粒 pRCD977b 含有 DmUGT、 ScGAL1、 ScGAL7 和 ScGAL2 表达盒并具有 ARG1 显性选择标记盒。
     双 ScGAL1/ScGAL7 构建体的构建。 将来自 pGLY939 的 PTEF1-ScGAL1 表达盒亚克隆至 pGLY941, 一种敲入载体, 具有巴斯德毕赤酵母 ARG1 选择标记、 TRP1 基因座敲入区、 还含有 PGAPDH-hGalTIβ 表达盒, 该新的载体命名为 pGLY952。将来自 pGLY940 的 PPMA1-ScGAL7 表达 盒亚克隆至 pGLY952, 新的载体命名为 pGLY955。最后, 将诺尔丝菌素抗性表达盒 (NATR) 从 pGLY597( 最初来自 pAG25, 来自 EROSCARF, Scientific Research and Development GmbH, Daimlerstrasse 13a, D-61352 Bad Homburg, Germany, 参见 Goldstein 等人, 1999, Yeast 15 : 1541) 亚克隆至 pGLY952 以产生质粒 pGLY1418( 参见图 12), 其含有 hGalTIβ、 ScGAL1 R 和 ScGAL7 表达盒并具有 NAT 显性选择标记盒。
     具有所有三个基因的单一整合质粒 pRCD977b( 图 6) 被转化至巴斯德毕赤酵母菌 株 RDP578-1 以产生菌株 RDP635-1、 -2 和 -3。菌株 RDP578-1 已含有异源基因和基因敲除 用于产生含有末端 β-1, 4- 半乳糖残基的人 N- 聚糖 ( 参见图 5 和实施例 3 用于构建体 )。 菌株 RDP578-1 也包括编码酿酒酵母 UDP- 半乳糖 4- 差向异构酶编码基因 ScGAL10 的表达 盒并表达测试蛋白人三环 3。得到的菌株 RDP635-1、 -2 和 -3 具有两个拷贝的 DmUGT 半乳 糖转运蛋白。 母 本 菌 株 RDP578-1 和 具 有 ScGAL1、 ScGAL2、 ScGAL7 和 ScGAL10 基 因 的 转 化 子 (RDP635-1、 -2 和 -3) 在含有葡萄糖、 半乳糖或无碳源的最低培养基生长五天然后拍照。有 意思的是, 尽管具有分泌具有半乳糖末端的 N- 聚糖的蛋白的能力, RDP578-1 显示出不能 同化半乳糖, 同时在葡萄糖上正常生长, 如野生型巴斯德毕赤酵母所期望的。但是, 表达 ScGAL1、 ScGAL2 和 ScGAL7 基因的转化子能够同化半乳糖, 如图 7 所示。如期望的, 在缺乏 碳源的平板上观察到最低生长。这些结果表明可以构建重组巴斯德毕赤酵母, 当与 Leloir 半乳糖同化途径的基础结构 ( 但不是调节 ) 元件重构时其可同化半乳糖作为碳源。
     在糖工程化的巴斯德毕赤酵母中表达的 Fc 第 297 位 Asn 残基上 N- 聚糖的测定。 人 IgG 的 Fc 部分在每个重链二聚体上含有单个 N- 聚糖位点 (Asn297, Kabat numbering), 其通常含有不同于其他分泌的人蛋白的 N- 聚糖分布情况。通常地, 天然存在的人抗体含有 具有末端 GlcNAc 和一定量末端半乳糖的 N- 聚糖, 其基于多种因素而不同, 并很少含有显著 量的末端唾液酸。在证明 N- 聚糖的高水平末端 β-1, 4- 半乳糖后, 我们试图测定在这类糖 工程化的酵母菌株产生的抗体上观察到的 N- 聚糖分布情况。因此, 用在 AOX1 启动子的控 制下编码人免疫球蛋白 G1(IgG1) 重链的 Fc 结构域或 C- 末端半部分的质粒 (pBK138) 转化 已被基因工程化为产生具有末端半乳糖的 N- 聚糖的巴斯德毕赤酵母菌株 (YGB02 ; 参见图 8 和实施例 4)。由 PCR 鉴定的选择的阳性克隆命名为 PBP317-36( 图 8 和实施例 4)。该菌株 在摇瓶中生长并用甲醇作为单一碳源诱导。通过离心收获上清并通过蛋白 A 亲和层析进行 纯化。 纯化的蛋白在 SDS-PAGE 上分离并进行考马斯染色。 观察到具有期望大小的标记的条 带。然后将纯化的蛋白进行 PNGase 消化并通过 MALDI-TOF MS 分析释放的 N- 聚糖。得到 的 N- 聚糖 ( 图 10A) 显示与具有末端 GlcNAc 的复合人核心结构 (G0 : GlcNAc2Man3GlcNAc2) 一致的主要质量, 较少种类具有单个末端半乳糖 (G1 : GalGlcNAc2Man3GlcNAc2) 和次要种类
    (minor 物种 ) 具有用半乳糖加帽复合种类的两个臂 (G2 : Gal2GlcNAc2Man3GlcNAc2)。这些 种类的质量不同于预测的文献中报道的规范值, 原因在于缺乏单个果糖残基。糖工程化的酵母菌株不含有内源岩藻糖基转移酶, 因此缺乏将果糖添加至核心人 N- 聚糖结构的内在 性质。还观察到与 Man5GlcNAc2 一致的另一次要种类。
     然后将上述菌株 PBP317-36( 其表达组装具有末端半乳糖的人样 N- 聚糖所需的 糖基化活性和还表达 SpGALE(UDP- 半乳糖 4- 差向异构酶 )) 基因工程化为能够利用外 源半乳糖作为碳源并以代谢工程化的方式控制 N- 糖基化。构建在组成型启动子控制下 表达 ScGAL1 和 ScGAL7 的整合质粒 pGLY954( 图 9) 并将其转化至巴斯德毕赤酵母菌株 PBP317-36。质粒 pGLY954 赋予菌株 PBP317-36( 其已含有 SpGALEUDP- 半乳糖差向异构酶, 图 8) 在半乳糖 ( 作为单一碳源 ) 上生长的能力。该 gal+ 菌株命名为 RDP783。因为尽管我 们没有将半乳糖通透酶引入至细胞, 细胞仍能够利用半乳糖作为碳源, 我们得出结论 : 对巴 斯德毕赤酵母是内源的一般己糖转运蛋白能够充分穿过细胞膜转运半乳糖。
     巴斯德毕赤酵母菌株 PBP317-36 和 RDP783 具有在甲醇 - 诱导型 AOX1 启动子控制 下编码人 Fc 结构域作为分泌的报告子蛋白的整合质粒构建体。菌株 PBP317-36 和 RDP783 在标准培养基中在摇瓶中培养, 所述标准培养基含有甘油和在甲醇作为单一碳源存在下诱 导或用甲醇与不同浓度葡萄糖或半乳糖组合诱导。收获的上清蛋白通过蛋白 A 被亲和纯 化, 进行 PNGase 消化通过 MALDI-TOF MS 分析。从菌株 RDP783 的人 Fc 释放的 N- 聚糖产生 与用甲醇单独诱导或在葡萄糖或甘露糖存在下诱导后在 PBP317-36 中观察到的分布情况 类似的 N- 聚糖, 具有主要糖形 G0(GlcNAc2Man3GlcNAc2)( 图 10)。但是, 外源半乳糖给料后, 菌株 RDP783( 但不是母本菌株 PBP317-36) 产生在人 Fc 上的含有半乳糖的 N- 聚糖的剂量 依赖增加, 其主要糖形现在转移到 G1(GalGlcNAc2Man3GlcNAc2) 且在完全地 β-1, 4- 半乳糖 加帽的糖形 G2(Gal2GlcNAc2Man3GlcNAc2) 中污染增加 ( 图 10)。
     最后, 为证明用人 Fc 观察到的利用外源半乳糖控制糖基化的能力可应用于全 长单克隆抗体, 产生糖工程化的酵母菌株 YDX477( 图 11, 实施例 5), 其表达抗 -Her2 单 克 隆 抗 体。 该 菌 株 还 工 程 化 为 转 移 G2 形 的 人 N- 聚 糖 (Gal2GlcNAc2Man3GlcNAc2) 到 分 泌的糖蛋白上。在 mAb-A 的表达后 N- 聚糖的释放显示 N- 聚糖模式 ( 图 13A), 其由与 G0(GlcNAc2Man3GlcNAc2) 一致的主要峰组成, 具有与 G1(GalGlcNAc2Man3GlcNAc2) 一致的次 主要峰, 以及 G2(Gal2GlcNAc2Man3GlcNAc2) 和 M5(Man5GlcNAc2) 的次要峰。该数据与对于人 IgG1 的截短的 Fc 部分观察到的相似并且是期望的, 因为在相同残基处 (Asn-297)N- 糖基 化。构建具有 ScGAL1 和 ScGAL7 的整合质粒 pGLY1418( 图 12) 和转化至巴斯德毕赤酵母菌 株 YDX477 以制备菌株 RDP968-1。该质粒赋予菌株 YDX477( 其已含有 SpGALE UDP- 半乳糖 差向异构酶, 图 11) 在半乳糖 ( 作为单一碳源 ) 上生长的能力。
     菌株 YDX477 和 RDP968-1 在标准培养基中在摇瓶中培养, 所述标准培养基含有甘 油和在甲醇作为单一碳源存在下诱导或用甲醇与不同浓度半乳糖组合诱导。 收获的上清蛋 白通过蛋白 A 被亲和纯化, 进行 PNGase 消化通过 MALDI-TOF MS 分析。两种菌株产生与之 前用甲醇单独诱导或在葡萄糖或甘露糖存在下诱导后在 PBP317-36 中观察到的分布情况 类似的 N- 聚糖, 具有主要糖形 G0(GlcNAc2Man3GlcNAc2)( 图 10A 相对于图 13A 和 13D)。但 是, 外源半乳糖给料后, 菌株 RDP968-1( 但不是母本菌株 YDX477) 产生在抗体上的含有半乳 糖的 N- 聚糖的剂量依赖增加, 其主要糖形现在转移到 G1(GalGlcNAc2Man3GlcNAc2) 且在完 全地 β-1, 4- 半乳糖加帽的糖形 G2(Gal2GlcNAc2Man3GlcNAc2) 中污染增加 ( 图 13E 和 F)。
     实施例 3菌株 RDP578-1 的构建显示于图 5 并涉及以下步骤。菌株 JC308 是起始菌株。该 菌株已在 Choi 等人, Proc.Natl.Acad.Sci.USA 100 : 5022-5027(2003) 中描述, 但简言之, 菌株是 ura3, ade1, arg4, his4。通过利用质粒 pJN329 破坏 OCH1 基因并根据 Choi 等人 (ibid.) 和美国专利号 7,449,308 中描述的方法, 使得该菌株缺乏 α-1, 6 甘露糖基转移酶 活性以产生菌株 YJN153。质粒 pJN329 携带 PPURA3 显性选择标记, 在反选择 ura- 活性后, 通过利用质粒载体 pJN503b 和 pAS19 破坏 PNO1、 MMN4A 和 MNN4B 基因并根据美国专利号 7,259,007 中描述的方法, 使得得到的菌株 YJN156 缺乏磷酸甘露糖基转移酶活性以产生菌 株 YAS180-2。包含本文中的融合蛋白的分泌途径靶向前导肽定位催化结构域, 其被融合至 ER、 高尔基体或反式高尔基体网络。
     在 反 选 择 ura- 活 性 后, 通 常 如 美 国 专 利 号 7,465,577 中 描 述 的 利 用 质 粒 pAS24( 参见图 14) 使得得到的菌株 YAS187-2 缺乏 β- 甘露糖基转移酶活性以制备菌株 YAS218-2。质粒 pAS24 是巴斯德毕赤酵母 BMT2 敲除质粒, 其含有 PpURA3 选择标记和在 PpOCH1 启动子的下游含有编码全长小鼠高尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 的表 达盒。MmSLC35A3 具有 SEQ ID NO : 34 所示的氨基酸序列, 其由 SEQ ID NO ; 33 所示的核苷 酸序列编码。可以如美国专利号 7,465,577 所示获得在序列两侧的 5’ 和 3’ BMT2 用于去除 β- 甘露糖基转移酶活性 ( 其归因于 bmt2p)。 在对于 ura- 活性反选择菌株 YAS218-2 后, 得 到的菌株 YAS269-2 是 ura- 并具有插入 BMT2 基因的小鼠高尔基体 UDP-GlcNAc 转运蛋白。
     然后用质粒 pRCD742b( 参见图 15) 转化菌株 YAS269-2, 质粒 pRCD742b 包括编码 嵌合小鼠 α-1, 2- 甘露糖基转移酶 I(FB8 MannI)、 嵌合人 GlcNAc 转移酶 I(CONA10) 和 全长基因编码小鼠高尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 的表达盒并将质粒靶向 ADE1 基因座 ( 参见 PCT/US2008/13719)。质粒 pRCD742b 是敲入敲除 (KINKO) 质粒, 其已 在 WO2007/136865 和 WO2007136752 中描述。质粒整合进巴斯德毕赤酵母 ADE1 基因而不删 除编码 Ade1p 的开放读码框。质粒还含有 PpURA5 选择标记。编码分泌途径靶向融合蛋白 (FB8MannI) 的表达盒包括在 PpGAPDH 启动子的控制下融合至小鼠 α-1, 2- 甘露糖基转移酶 I 催化结构域 (FB MannI : SEQ ID NO : 54) 的 N- 末端的 ScSec12 前导肽 (ScSec12(8) : SEQ ID NO : 32 的最先的 103 个氨基酸 )。编码分泌途径靶向融合蛋白 CONA10 的表达盒包括在 PpPMA1 启动子的控制下融合至人 GlcNAc 转移酶 I(GnT I) 催化结构域 (SEQ ID NO : 52) 的 N- 末端的 PpSec12 前导肽 (PpSec12(10) : SEQ ID NO : 28 的最先的 29 个氨基酸 )。 质粒另外 包括在 PpSEC4 启动子的控制下编码全长小鼠高尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 的表达盒。将质粒 pRCD742b 转染进菌株 YAS269-2 产生菌株 RDP307。该菌株能够产生具有 GlcNAcMan5GlcNAc2 N- 聚糖的糖蛋白。SEQ ID NO : 53 和 51 是分别编码小鼠 α-1, 2- 甘露 糖基转移酶 I 和人 GlcNAc 转移酶 I(GnT I) 催化结构域的核苷酸序列。编码人 GnT I 的核 苷酸序列被密码子最优化用于在巴斯德毕赤酵母中表达。SEQ ID NO : 27 和 31 是分别编码 PpSEC12(10) 和 ScSEC12(8) 的核苷酸序列。
     菌株 RDP361 如下构建 : 用质粒 pDMG47 转化菌株 RDP307 以产生菌株 RDP361。质 粒 pDMG47( 参见图 16) 是 KINKO 质粒, 其整合进巴斯德毕赤酵母 TRP1 基因座而不删除编 码 Trp1p 的开放读码框。质粒还含有 PpURA3 选择标记并包括编码分泌途径靶向融合蛋白 (KD53) 的表达盒, 其包含在 PpGAPDH 启动子的控制下融合至黑腹果蝇甘露糖苷酶 II(KD : SEQ ID NO : 63) 催化结构域的 N- 末端的 ScMnn2 引导靶向肽 (ScMnn2(53) : SEQ ID NO : 19最先的 36 个氨基酸 )。质粒还含有编码分泌途径靶向融合蛋白 (TC54) 的表达盒, 其包含 在 PpPMA1 启动子的控制下融合至大鼠 GlcNAc 转移酶 II(TC : SEQ ID NO : 58) 的催化结构 域的 N- 末端的 ScMnn2 引导靶向肽 (ScMnn2(54) : SEQ ID NO : 22 的最先的 97 个氨基酸 )。 ScMnn2 前导区 53 和 54 的核酸序列分别显示于 SEQ ID NO : 19 和 21。编码黑腹果蝇甘露糖 苷酶 II 和大鼠 GlcNAc 转移酶 II(GnTII) 的催化结构域的核酸序列分别显示于 SEQ ID NO : 62 和 57。
     上述菌株 RDP361 用质粒 pRCD823b 转化以产生菌株 RDP415-1。质粒 pRCD823b( 参 见 图 17) 是 KINKO 质 粒, 其 整 合 进 巴 斯 德 毕 赤 酵 母 HIS4 基 因 座 ( 参 见 美 国 专 利 号 7,479,389) 而不删除编码 His4p 的开放读码框, 并含有 PpURA5 选择标记 ( 参见美国公开 的申请号 20040229306) 以及编码分泌途径靶向融合蛋白 (TA54) 的表达盒, 其包含大鼠 GlcNAc 转移酶 II 催化结构域 (TA : SEQ ID NO : 61), 如上述在它的 N- 末端与 ScMnn2(54) 的 最先的 97 个氨基酸融合但在 PpGAPDH 启动子的控制下。质粒还含有在 PpOCH1 启动子的控 制下编码全长黑腹果蝇高尔基体 UDP- 半乳糖转运蛋白 (DmUGT) 和在 PpPMA1 启动子的控制 下编码全长酿酒酵母 UDP- 半乳糖 4- 差向异构酶 (ScGAL10) 的表达盒。ScGAL10 具有 SEQ ID NO : 46 所示的氨基酸序列, 其由 SEQ ID NO : 45 所示的核苷酸序列编码。大鼠 GlcNAc 转 移酶 II(TA) 的核苷酸序列显示于 SEQ ID NO : 60。
     上 述 菌 株 RDP415-1 用 质 粒 pRCD893a 转 化 以 产 生 菌 株 RDP523-1。 质 粒 pGLY893a( 参见图 18) 是巴斯德毕赤酵母 his1 敲除质粒, 其含有 PpARG4 选择标记 ( 参见 美国专利号 7,479,389)。质粒包括编码分泌途径靶向融合蛋白 (KD10) 的表达盒, 其包含 在 PpPMA1 启动子的控制下融合至黑腹果蝇甘露糖苷酶 II(KD : SEQ ID NO : 63) 的催化结 构域的 N- 末端的 PpSEC12 引导靶向肽 (PpSEC12(10) : SEQ ID NO : 28 的最先的 29 个氨基 酸 )。质粒还含有编码分泌途径靶向融合蛋白 (TA33) 的表达盒, 其包含在 PpTEF1 启动子 的控制下融合至大鼠 GlcNAc 转移酶 II(TA : SEQ ID NO : 61) 的催化结构域的 N- 末端的 ScMntIp(ScKre2p) 引导靶向肽 (ScMntIp(ScKre2p)(33) : SEQ ID NO : 30 的最先的 53 个氨 基酸 )。质粒还含有编码分泌途径靶向融合蛋白 (XB53) 的表达盒, 其包含融合至人半乳糖 基转移酶 I(hGalTIβ43 ; SEQ ID NO : 50) 的催化结构域的 N- 末端的 ScMnn2p 前导肽 (53) 的最先的 36 个氨基酸。PpSEC12 和 ScMNTI(ScKRE2) 前导区的核酸序列分别显示于 SEQ ID NO : 27 和 29。编码黑腹果蝇甘露糖苷酶 II、 大鼠 GlcNAc 转移酶 II(GnT II) 和人 GalTI 的 催化结构域的核酸序列分别显示于 SEQ ID NO : 62、 60 和 49。该菌株可产生具有 N- 聚糖的 糖蛋白, 所述 N- 聚糖具有末端半乳糖残基。菌株编码两个拷贝的黑腹果蝇甘露糖苷酶 II 催化结构域和三个拷贝的大鼠 GnTII 催化结构域。
     最后, 上述菌株 RDP523-1 用质粒 pBK64 转化以产生菌株 RDP578-1。质粒 pBK64 编 码人三环 3 测试蛋白并已在 Choi 等人, Proc.Natl.Acad.Sci.USA 100 : 5022-5027(2003) 中描述。
     实施例 4
     菌株 PBP317-36 的构建显示于图 8。起始菌株是 YGLY16-3。这是具有 OCH1, PNO1, MNN4A, Mnn4B 和 BMT2 基因缺失的 ura- 菌株并可以根据实施例 3 所用方法制备。菌株 YGLY16-3 还在 WO2007136752 中公开。
     菌株 YGLY16-3 用质粒 pRCD742a( 参见图 19) 转化以制备菌株 RDP616-2。质粒pRCD742a( 参见图 19) 是 KINKO 质粒, 其整合进巴斯德毕赤酵母 ADE1 基因而不删除编码 Ade1p 的开放读码框。 质粒还含有 PpURA5 选择标记和包括编码嵌合小鼠 α-1, 2- 甘露糖基 转移酶 (FB8MannI)、 嵌合人 GlcNAc 转移酶 I(CONA10) 和全长小鼠高尔基体 UDP-GlcNAc 转 运蛋白 (MmSLC35A3) 的表达盒。 质粒与质粒 pRCD742b 相同, 除了编码嵌合人 GlcNAc 转移酶 I 的表达盒的方向为相反方向。 将质粒 pRCD742a 转染进菌株 YGLY16-3 产生菌株 RDP616-2。 该菌株能够产生具有 GlcNAcMan5GlcNAc2N- 聚糖的糖蛋白。
     反选择菌株 RDP616-2 以产生 ura- 菌株 RDP641-3 后, 然后将质粒 pRCD1006 转化至 菌株以制备菌株 RDP666。质粒 pRCD1006( 参见图 20) 是巴斯德毕赤酵母 his1 敲除质粒, 其 含有 PpURA5 基因作为选择标记。质粒含有在 PpGAPDH 启动子的控制下编码分泌途径靶向 融合蛋白 (XB33) 的表达盒 ( 其包含融合至人半乳糖基转移酶 I 催化结构域 (hGalTIβ43) 的 N- 末端的 ScMnt1p(ScKre2p)(33) 的最先的 58 个氨基酸 ) ; 在 PpOCH1 启动子的控制下 编码全长黑腹果蝇高尔基体 UDP- 半乳糖转运蛋白 (DmUGT) 的表达盒和在 PpPMA1 启动子的 控制下编码粟酒裂殖酵母 UDP- 半乳糖 4- 差向异构酶 (SpGALE) 的表达盒。
     菌株 RDP666 用质粒 pGLY167b 转化以制备菌株 RDP696-2。质粒 pGLY167b( 参见 图 21) 是巴斯德毕赤酵母 arg1 敲除质粒, 其含有 PpURA3 选择标记。质粒含有在 PpGAPDH 启动子的控制下编码分泌途径靶向融合蛋白 (CO-KD53) 的表达盒 ( 其包含融合至黑腹果蝇 甘露糖苷酶 II 催化结构域 (KD) 的 N- 末端的 ScMnn2p(53) 的最先的 36 个氨基酸 ) 和在 PpPMA1 启动子的控制下表达分泌途径靶向融合蛋白 (CO-TC54) 的表达盒 ( 其包含融合至大 鼠 GlcNAc 转移酶 II 催化结构域 (TC) 的 N- 末端的 ScMnn2p(54) 的最先的 97 个氨基酸 )。 得到的菌株 RDP696-2 进行恒化器选择 ( 参见 Dykhuizen 和 Hartl, Microbiol.Revs.47 : 150-168(1983) 关于恒化器选择的综述 )。恒化器选择产生菌株 YGB02。菌株 YGB02 可产生 具有 N- 聚糖的糖蛋白, 所述 N- 聚糖具有末端半乳糖残基。在该菌株中, 甘露糖苷酶 II 催 化结构域 (KD) 和 GnTII(TC) 被密码子最优化为在巴斯德毕赤酵母中表达的核酸分子 ( 分 别为 SEQ ID NO : 64 和 59) 编码。
     菌株 YGB02 用质粒 pBK138 转染以产生菌株 PBP317-36。质粒 pBK138( 参见图 22) 是滚入 (roll-in) 质粒, 其整合进巴斯德毕赤酵母 AOX1 启动子同时复制启动子。质粒含有 编码融合蛋白的表达盒, 其包含融合至人 Fc 抗体片段 (C- 末端 233-aa of a 人 IgG1 重链, SEQ ID NO : 66) 的 N- 末端的酿酒酵母 A 交配因子前信号序列 (SEQ ID NO : 24)。编码酿酒 酵母 A 交配因子前信号序列的核酸序列显示于 SEQ ID NO : 23 和编码人 IgG1 重链的 C- 末 端 233-aa 的核酸序列显示于 SEQ ID NO : 65)。
     实施例 5
     菌株 YDX477 的构建显示于图 11。起始菌株是 YGLY16-3。菌株 YGLY16-3 用质粒 pRCD742a( 参见图 19) 转化以制备菌株 RDP616-2。质粒 pRCD742a( 参见图 19) 是 KINKO 质粒, 其整合进巴斯德毕赤酵母 ADE1 基因而不删除编码 ade1p 的开放读码框。质粒还含 有 PpURA5 选择标记和包括编码嵌合小鼠 α-1, 2- 甘露糖基转移酶 (FB8MannI)、 嵌合人 GlcNAc 转移酶 I(CONA10) 和全长小鼠高尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 表达 盒。质粒与质粒 pRCD742b 相同, 除了编码嵌合人 GlcNAc 转移酶 I 的表达盒的方向为相反 方向。将质粒 pRCD742a 转染进菌株 YGLY16-3 产生菌株 RDP616-2。该菌株能够产生具有 GlcNAcMan5GlcNAc2N- 聚糖的糖蛋白。反选择菌株 RDP616-2 以产生 ura- 菌株 RDP641-4 后, 然后将质粒 pRCD1006 转化至 菌株以制备菌株 RDP667-1. 质粒 pRCD1006( 参见图 20) 是巴斯德毕赤酵母 his1 敲除质粒, 其含有 PpURA5 基因作为选择标记。 质粒含有在 PpGAPDH 启动子的控制下编码分泌途径靶向 融合蛋白 (XB33) 的表达盒 ( 其包含融合至人半乳糖基转移酶 I 催化结构域 (hGalTIβ43) 的 N- 末端的 ScMnt1p(ScKre2p)(33) 的最先的 58 个氨基酸 ) ; 在 PpOCH1 启动子的控制下 编码全长黑腹果蝇高尔基体 UDP- 半乳糖转运蛋白 (DmUGT) 的表达盒和在 PpPMA1 启动子的 控制下编码粟酒裂殖酵母 UDP- 半乳糖 4- 差向异构酶 (SpGALE) 的表达盒。
     菌株 RDP667-1 用质粒 pGLY167b 转化以制备菌株 RDP697-1。质粒 pGLY167b( 参见 图 21) 是巴斯德毕赤酵母 arg1 敲除质粒, 其含有 PpURA3 选择标记。质粒含有在 PpGAPDH 启动子的控制下编码分泌途径靶向融合蛋白 (CO-KD53) 的表达盒 ( 其包含融合至黑腹果蝇 甘露糖苷酶 II 催化结构域 (KD) 的 N- 末端的 ScMnn2p(53) 的最先的 36 个氨基酸 ) 和在 PpPMA1 启动子的控制下表达分泌途径靶向融合蛋白 (CO-TC54) 的表达盒 ( 其包含融合至大 鼠 GlcNAc 转移酶 II 催化结构域 (TC) 的 N- 末端的 ScMnn2p(54) 的最先的 97 个氨基酸 )。 编码甘露糖苷酶 II 和 GnT II 催化结构域的核酸分子被密码子最优化用于在巴斯德毕赤酵 母中表达 ( 分别为 SEQ ID NO : 64 和 59)。该菌株可产生具有 N- 聚糖的糖蛋白, 所述 N- 聚 糖具有末端半乳糖残基。
    用 质 粒 pGLY510 转 化 菌 株 RDP697-1 以 制 备 菌 株 YDX414。 质 粒 pGLY510( 参 见 图 23) 是滚入质粒, 其整合进巴斯德毕赤酵母 TRP2 基因座同时复制基因并含有 AOX1 启动 子 -ScCYC1 终止子表达盒以及 PpARG1 选择标记。
     用质粒 pDX459-1(mAb-A) 转化菌株 YDX414 以制备菌株 YDX458。 质粒 pDX459-1( 参 见图 24) 是滚入质粒, 其靶向并整合进巴斯德毕赤酵母 AOX2 启动子并含有 ZeoR 同时复制 启动子。质粒含有编码抗 -HER2 抗体重链和抗 -HER2 抗体轻链 ( 分别为 SEQ ID NO : 68 和 70) 的分开的表达盒, 其各个在 N- 末端融合黑曲霉 α- 淀粉酶信号序列 (SEQ ID NO : 26) 并 被巴斯德毕赤酵母 AOX1 启动子控制。编码重链和轻链的核酸序列分别显示于 SEQ ID NO : 67 和 69, 和编码黑曲霉 α- 淀粉酶信号序列的核酸序列显示于 SEQ ID NO : 25。
     用质粒 pGLY1138 转化菌株 YDX458 以制备菌株 YDX477。质粒 pGLY1138( 参见图 25) 是滚入质粒, 其整合进巴斯德毕赤酵母 ADE1 基因座同时复制基因。 质粒含有 ScARR3 选 择标记基因盒。来自酿酒酵母的 ARR3 基因赋予细胞亚砷酸盐抗性, 使细胞可在亚砷酸盐存 在下生长 (Bobrowicz 等人, Yeast, 13 : 819-828(1997) ; Wysocki 等人, J.Biol.Chem.272 : 30061-30066(1997))。质粒含有在 PpAOX1 启动子的控制下编码分泌的融合蛋白的表达盒, 其包含融合至里氏木霉 (MNS1) 催化结构域 (SEQ ID NO : 56, 由 SEQ ID NO : 55 的核苷酸序 列编码 ) 的 N- 末端的酿酒酵母 α 因子前信号序列 (SEQ ID NO : 24)。融合蛋白分泌至培 养基中。
    
    
    
    
    
    
    
    
    
    尽管本发明参考例举的实施方案在本文中描述, 但应理解的是本发明不限于此。 具有本领域普通技术且获得本文教导的人员应认识到在其范围内的另外的修改和实施方 案。因此, 本发明仅通过本文所附权利要限制。
    63102333872 A CN 102333887
    序列表1/70 页
     64102333872 A CN 102333887序列表2/70 页
    65102333872 A CN 102333887序列表3/70 页
    66102333872 A CN 102333887序列表4/70 页
    67102333872 A CN 102333887序列表5/70 页
    68102333872 A CN 102333887序列表6/70 页
    69102333872 A CN 102333887序列表7/70 页
    70102333872 A CN 102333887序列表8/70 页
    71102333872 A CN 102333887序列表9/70 页
    72102333872 A CN 102333887序列表10/70 页
    73102333872 A CN 102333887序列表11/70 页
    74102333872 A CN 102333887序列表12/70 页
    75102333872 A CN 102333887序列表13/70 页
    76102333872 A CN 102333887序列表14/70 页
    77102333872 A CN 102333887序列表15/70 页
    78102333872 A CN 102333887序列表16/70 页
    79102333872 A CN 102333887序列表17/70 页
    80102333872 A CN 102333887序列表18/70 页
    81102333872 A CN 102333887序列表19/70 页
    82102333872 A CN 102333887序列表20/70 页
    83102333872 A CN 102333887序列表21/70 页
    84102333872 A CN 102333887序列表22/70 页
    85102333872 A CN 102333887序列表23/70 页
    86102333872 A CN 102333887序列表24/70 页
    87102333872 A CN 102333887序列表25/70 页
    88102333872 A CN 102333887序列表26/70 页
     定义
     除非另有定义, 本文所用的所有技术和科学具有与本发明所属领域的普通技术人 员通常理解的相同含义。另外, 除非上下文另有要求, 单数术语应包括复数和复数术语应 包括单数。通常地, 所用的相关命名和本文所述的生化、 酶学、 分子和细胞生物学、 微生物 学、 遗传学以及蛋白和核酸化学以及杂交技术是本领域熟知并通常使用的。本发明的方法 和技术通常根据本领域熟知的常规方法并如贯穿本说明书引用和讨论的各种一般和更具 体的参考中所述的进行, 除非另有说明。参见, 例如, Sambrook 等人 Molecular Cloning : A Laboratory Manual, 2d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(1989) ; Ausubel 等人, Current Protocols in Molecular Biology, Greene Publishing Associates(1992, 和 Supplements to 2002) ; Harlow 和 Lane, Antibodies : A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(1990) ; Taylor 和 Drickamer, Inrroduction to Glycobiology, Oxford Univ. Press(2003) ; Worthington Enzyme Manual, Worthington Biochemical Corp., Freehold, NJ ; Handbook of Biochemistry : Section A Proteins, Vol I, CRC Press(1976) ; Handbook of Biochemistry : Section A Proteins, Vol II, CRC Press(1976) ; Essentials of Glycobiology, Cold Spring Harbor Laboratory Press(1999)。示例性方法和材料如下 述, 虽然与本文所述类似或等同的方法和材料也可用于本发明的实践并应对本领域普通技 术人员是显而易见的。 本文提及的所有公开和其他参考通过参考对于它们引用的公开内容 而被整体引入。在矛盾的情况下, 以本说明书 ( 包括定义 ) 为准。材料、 方法和实施例仅是 说明性的, 且意图不是以任何方式限制。
     以下术语, 除非另有说明, 应理解具有以下含有 :
     如本文所用, 术语 “人源化的” 、 “人源化” 和 “人样” 可互换地使用, 是指以一种方 式工程化非人细胞例如低等真核宿主细胞的方法, 其中该方式引起工程化的细胞具有产生 蛋白特别是糖蛋白的能力, 所述糖蛋白具有糖基化, 比相同物种的非工程化的、 野生型非人 细胞产生的糖蛋白具有更类似哺乳动物糖基化的模式。人源化可对于 N- 糖基化、 O- 糖基 化或二者进行。例如, 野生型巴斯德毕赤酵母和其它低等真核细胞通常在 N- 糖基化位点产 生高甘露糖基化的蛋白。在本发明优选的实施方案中, 本发明的 “人源化的” 宿主细胞能够 产生具有杂合和 / 或复合 N- 聚糖的糖蛋白 ; 即 “人样 N- 糖基化” 。人源化的宿主细胞产生 的糖蛋白上主要存在的特定 “人样” 聚糖将取决于进行的特定人源化步骤。
     如本文所用, 术语 “N- 聚糖” 和 “糖形” 可互换地使用和是指 N- 连接的寡糖, 例如, 通过天冬酰胺 -N- 乙酰基葡糖胺连接而连接到多肽的天冬酰胺残基的寡糖。N- 连接的糖 蛋白含有连接到蛋白中天冬酰胺残基的酰胺氮上的 N- 乙酰基葡糖胺残基。糖蛋白上发现 的主要糖是葡萄糖、 半乳糖、 甘露糖、 果糖、 N- 乙酰基半乳糖胺 (GalNAc)、 N- 乙酰基葡糖胺 (GlcNAc) 和唾液酸 ( 例如 N- 乙酰基 - 神经氨酸 (NANA))。对于 N- 连接的糖蛋白, 糖基团的加工在 ER 的腔中与翻译同时发生并在高尔基体中继续。
     N- 聚糖具有共同的五糖核心 Man3GlcNAc2(“Man” 是指甘露糖 ; “Glc” 是指葡萄糖 和 “NAc” 是指 N- 乙酰基、 GlcNAc 是指 N- 乙酰基葡糖胺 )。根据分支 ( 触角 ) 的数量, N- 聚 糖不同, 所述分支 ( 触角 ) 包含被添加至 Man3GlcNAc2(“Man3” ) 核心结构 ( 还称为 “三甘 露糖核心” 、 “五糖核心” 或 “少甘露糖核心” ) 的外周糖 ( 例如 GlcNAc、 半乳糖、 果糖和唾液 酸 )。N- 聚糖根据它们分支的成分 ( 例如高甘露糖、 复合或杂合 ) 而分类。 “高甘露糖” 型 N- 聚糖具有 5 个或更多个甘露糖残基。 “复合” 型 N- 聚糖通常具有至少一个连接至 1, 3甘 露糖臂的 GlcNAc 和至少一个连接至 “三甘露糖” 核心的 1, 6 甘露糖臂的 GlcNAc。复合 N- 聚 糖也可具有半乳糖 (“Gal” ) 或 N- 乙酰基半乳糖胺 (“GalNAc” ) 残基, 其任选地用唾液 酸或衍生物 ( 例如, “NANA” 或 “NeuAc” , 其中 “Neu” 是指神经氨酸和 “Ac” 是指乙酰基 ) 修 饰。复合 N- 聚糖也可具有链内置换, 其包含 “等分的” GlcNAc 和核心果糖 (“Fuc” )。复合 N- 聚糖也可在 “三甘露糖核心” 上具有多个触角, 通常称为 “多触角聚糖” 。 “杂合” N- 聚糖 在三甘露糖核心的 1, 3 甘露糖臂末端具有至少一个 GlcNAc 并在三甘露糖核心的 1, 6 甘露 糖臂上具有 0 或多个甘露糖。多种 N- 聚糖也称为 “糖形” 。图 2 显示多种高甘露糖、 杂合和 复合 N- 聚糖, 其已在基因工程化为产生哺乳动物样 N- 聚糖的巴斯德毕赤酵母中产生。 如本文所用, 术语 “O- 聚糖” 和 “糖形” 可互换地使用和是指 O- 连接的寡糖, 例如, 经由丝氨酸或苏氨酸残基的羟基连接至肽链的聚糖 . 在真菌细胞中, 天然 O- 糖基化通过将 在内质网中从多萜醇单磷酸甘露糖 (Dol-P-Man) 转移的第一个甘露糖基残基连接到蛋白 而发生, 和另外的甘露糖基残基可在高尔基体中经由从 GPD-Man 转移而被连接。高等真核 细胞, 例如人或哺乳动物细胞, 通过将 N- 乙酰基 - 半乳糖胺 (GlcNac) 共价连接到丝氨酸或 苏氨酸残基经历 O- 糖基化。
     如本文所用, 术语 “人样 O- 糖基化” 应理解为含义是真菌 - 特定的磷酸化甘露糖结 构被降低或消除, 引起电荷和 β- 甘露糖结构的降低或消除, 或糖蛋白上存在的和糖蛋白 组合物中的主要 O- 聚糖种类包括具有选自 GlcNac、 Gal 或 NANA( 或 Sia) 的末端残基加帽 的聚糖。以这种方式, 具有主要人样 O- 糖基化的重组糖蛋白可被人或哺乳动物细胞识别, 如同它是天然产生的糖蛋白, 其产生重组糖蛋白的改进的治疗用性质。
     本文所用的缩写是本领域常见使用的, 参见, 例如, 上述糖的缩写。其他常见缩写 包括 “PNGase” 或 “聚糖酶” 或 “葡糖苷酶” 均是指肽 N- 糖苷酶 F(EC 3.2.2.18)。
     如本文所用, 术语 “抗体” 、 “免疫球蛋白” 和 “免疫球蛋白分子” 可互换地使用。每 个免疫球蛋白分子具有独特结构, 使得其结合它的特异性抗原, 但所有免疫球蛋白具有本 文所述的相同整体结构。基础的免疫球蛋白结构单元已知包括亚基的四聚体。每个四聚 体具有两对相同的多肽链, 每对具有一个 “轻” 链 (LC)( 约 25kDa) 和一个 “重” 链 (HC)( 约 50-70kDa)。每个链的氨基 - 末端部分包括约 100-110 或更多个氨基酸的可变区, 主要负责 抗原识别。每个链的羧基 - 末端部分确定恒定区, 主要负责效应物功能。轻链 (LCs) 被分 类为 κ 或 λ。重链 (HCs) 分类为 γ、 μ、 α、 δ 或 ε 和确定抗体同种型分别为 IgG、 IgM、 IgA、 IgD 和 IgE。
     轻 和 重 链 被 亚 分 类 为 可 变 区 和 恒 定 区 ( 通 常 参 见 Fundamental Immunology(Paul, W., ed., 2nd ed.Raven Press, N.Y., 1989), Ch.7。每个轻 / 重链对的可 变区形成抗体结合位点。因此, 天然抗体具有两个结合位点。除了双功能或双特异抗体, 两
     如本文所用, 术语 “人样 O- 糖基化” 应理解为含义是真菌 - 特定的磷酸化甘露糖结 构被降低或消除, 引起电荷和 β- 甘露糖结构的降低或消除, 或糖蛋白上存在的和糖蛋白 组合物中的主要 O- 聚糖种类包括具有选自 GlcNac、 Gal 或 NANA( 或 Sia) 的末端残基加帽 的聚糖。以这种方式, 具有主要人样 O- 糖基化的重组糖蛋白可被人或哺乳动物细胞识别, 如同它是天然产生的糖蛋白, 其产生重组糖蛋白的改进的治疗用性质。
     本文所用的缩写是本领域常见使用的, 参见, 例如, 上述糖的缩写。其他常见缩写 包括 “PNGase” 或 “聚糖酶” 或 “葡糖苷酶” 均是指肽 N- 糖苷酶 F(EC 3.2.2.18)。
     如本文所用, 术语 “抗体” 、 “免疫球蛋白” 和 “免疫球蛋白分子” 可互换地使用。每 个免疫球蛋白分子具有独特结构, 使得其结合它的特异性抗原, 但所有免疫球蛋白具有本 文所述的相同整体结构。基础的免疫球蛋白结构单元已知包括亚基的四聚体。每个四聚 体具有两对相同的多肽链, 每对具有一个 “轻” 链 (LC)( 约 25kDa) 和一个 “重” 链 (HC)( 约 50-70kDa)。每个链的氨基 - 末端部分包括约 100-110 或更多个氨基酸的可变区, 主要负责 抗原识别。每个链的羧基 - 末端部分确定恒定区, 主要负责效应物功能。轻链 (LCs) 被分 类为 κ 或 λ。重链 (HCs) 分类为 γ、 μ、 α、 δ 或 ε 和确定抗体同种型分别为 IgG、 IgM、 IgA、 IgD 和 IgE。
     轻 和 重 链 被 亚 分 类 为 可 变 区 和 恒 定 区 ( 通 常 参 见 Fundamental Immunology(Paul, W., ed., 2nd ed.Raven Press, N.Y., 1989), Ch.7。每个轻 / 重链对的可 变区形成抗体结合位点。因此, 天然抗体具有两个结合位点。除了双功能或双特异抗体, 两
     个结合位点是相同。链都显示相同的通常结构, 被三个高度可变区连接的相对保守构架区 (FR), 还称为互补决定区或 CDR。来自每对的两个链的 CDR 通过构架区连接, 使得结合特异 性表位。术语包括天然形成形式、 以及片段和衍生物。包括在术语范围内的是免疫球蛋白 (Igs) 的种类, 称为 IgG、 IgA、 IgE、 IgM 和 IgD。还包括在术语范围内的是 IgG 的亚型, 称为 IgG1、 IgG2、 gG3 和 IgG4。术语用于最广泛的含义并包括单个单克隆抗体 ( 包括激动剂和 拮抗剂抗体 ) 以及结合多个表位或抗原的抗体组合物。术语特定地覆盖单克隆抗体 ( 包括 全长单克隆抗体 )、 多克隆抗体、 多特异抗体 ( 例如双特异抗体 ) 和抗体片段, 只要它们含 有或被修饰为含有重链免疫球蛋白恒定区的 CH2 结构域的至少一部分, 其包括 CH2 结构域的 N- 连接的糖基化位点或其变体。包括在术语内的是仅包含 Fc 区的分子, 例如免疫黏附素 ( 美国公开的专利申请号 20040136986)、 Fc 融合和抗体样分子。可选地, 这些术语可以是 指至少 Fab 区的抗体片段, 其至少含有 N- 连接的糖基化位点。
     术语 “Fc” 片段是指抗体的 “片段结晶的” C- 末端区, 其含有 CH2 和 CH3 结构域。术 语 “Fab” 片段是指抗体的 “片段抗原结合” 区, 其含有 VH、 CH1、 VL 和 CL 结构域。
     如本文所用术语 “单克隆抗体” (mAb) 是指获自基本上均一的抗体群体的抗体, 即 包含群体是相同的单独的抗体, 除了可以小量存在的可能天然存在的突变。单克隆抗体是 高度特异性的, 是针对单个抗原性位点。另外, 与通常包括针对不同决定簇 ( 表位 ) 的不 同抗体的常规 ( 多克隆 ) 抗体制备物相反, 每个 mAb 针对抗原上的单个决定簇。除了它们 特异性, 单克隆抗体是有利的, 原因在于它们可以是通过杂交瘤培养合成的, 不被其他免疫 球蛋白污染。术语 “单克隆” 指示抗体的特征为获自基本上均一的抗体群体, 并且不解释为 要求通过任何具体方法产生抗体。例如, 根据本发明使用的单克隆抗体可由 Kohler 等人, (1975)Nature, 256 : 495 首次描述的杂交瘤方法制备或可通过重组 DNA 方法制备 ( 参见, 例 如, Cabilly 等人的美国专利号 4,816,567)。
     在术语 “抗体” 或 “免疫球蛋白” 范围内的术语 “片段” 包括 those 通过用多种蛋白 酶消化产生的、 通过化学切割和 / 或化学解离产生的和重组地产生的片段, 只要片段保持 能够特异性结合靶分子。在这类片段中的是 Fc、 Fab、 Fab’ 、 Fv、 F(ab’ )2 和单链 Fv(scFv) 片段。下文中, 术语 “免疫球蛋白” 也包括术语 “片段” 。
     免疫球蛋白另外包括免疫球蛋白或片段, 其在序列上已被修饰但保持能够特异 性结合靶分子, 包括 : 物种间嵌合和人源化的抗体 ; 抗体融合 ; 异聚体抗体复合物和抗体 融合, 例如双抗体 ( 双特异抗体 ), 单链双抗体和胞内抗体 ( 参见, 例如, Intracellular Antibodies : Research and Disease Applications, (Marasco, ed., Springer-Verlag New York, Inc., 1998)。
     术语 “催化抗体” 是指能够催化生化反应的免疫球蛋白分子。 催化抗体是本领域熟 知的并已被描述在 Schochetman 等人的美国专利号 7,205,136 ; 4,888,281 和 5,037,750, 以及 Barbas, III 等人的美国专利号 5,733,757 ; 5,985,626 和 6,368,839 中。
     如本文所用术语 “载体” 意图是指能够转运已被连接的另一个核酸的核酸分子。 一 种类型的载体是 “质粒” , 其是指环状双链 DNA 环, 在其中另外的 DNA 片段可被连接。其他载 体包括黏粒、 细菌人工染色体 (BAC) 和酵母人工染色体 (YAC)。 另一种类型的载体是病毒载 体, 其中另外的 DNA 片段可连接至病毒基因组 ( 如下更详细讨论 )。某些载体能够在它们 被引入的宿主细胞中自我复制 ( 例如, 载体具有在宿主细胞中发挥作用的复制起点 )。其他载体在引入宿主细胞后可以被整合到宿主细胞的基因组, 以及从而随宿主基因组一起复 制。另外, 某些优选的载体能够引导被可操作地连接的基因的表达。这类载体在本文称为 “重组表达载体” ( 或简称 “表达载体” )。
     如本文所用, 术语 “目的序列” 或 “目的基因” 是指核酸序列, 通常编码蛋白, 其通常 不能在宿主细胞中产生。 本文公开的方法使得稳定整合到宿主细胞基因组中的一个或多个 目的序列或目的基因的有效表达。 目的序列的非限制实例包括编码一个或多个具有酶促活 性的多肽的序列, 例如, 所述酶为在宿主中影响 N- 聚糖合成酶, 例如甘露糖基转移酶、 N- 乙 酰基葡糖胺转移酶、 UDP-N- 乙酰基葡糖胺转运蛋白、 半乳糖基转移酶、 UDP-N- 乙酰基半乳 糖基转移酶、 唾液酸转移酶和岩藻糖基转移酶。
     术语 “标记序列” 或 “标记基因” 是指这样的核酸序列, 其能够表达使得对于在宿主 细胞存在或缺乏序列进行阳性或阴性选择的活性。例如, 巴斯德毕赤酵母 URA5 基因是标记 基因, 因为它的存在可以是通过含有基因的细胞在尿嘧啶缺乏下生长的能力而被选择。它 的存在还可通过含有基因的细胞不能在 5-FOA 存在下生长而被选择。标记序列或基因不必 需地显示阳性和阴性可选择性。 来自巴斯德毕赤酵母的标记序列或基因的非限制实例包括 ADE1、 ARG4、 HIS4 和 URA3。对于抗生素抗性标记基因, 通常利用卡那霉素、 新霉素、 遗传霉素 ( 或 G418)、 巴龙霉素和潮霉素抗性基因以允许在这些抗生素存在下生长。 术语 “可操作地连接” 表达控制序列是指这样的连接, 其中表达控制序列与目的基 因是连续的以控制目的基因以及表达控制序列, 其以反式或以一定距离发挥作用以控制目 的基因。
     术语 “表达控制序列” 或 “调节序列” 可互换地使用和如本文所用是指多核苷酸序 列, 其对影响被可操作地连接的编码序列的表达是必需的。 表达控制序列是控制转录、 转录 后事件和核酸序列翻译的序列。 表达控制序列包括适当的转录起始、 终止、 启动子和增强子 序列 ; 有效 RNA 加工信号例如剪切和多聚腺苷酸信号 ; 稳定细胞质 mRNA 的序列 ; 增强翻译 效率的序列 ( 例如, 核糖体结合位点 ) ; 增强蛋白稳定性的序列和当期望时, 增强蛋白分泌 的序列。 这类控制序列的性质根据宿主生物而不同 ; 在原核生物中, 这类控制序列通常包括 启动子、 核糖体结合位点和转录终止序列。术语 “控制序列” 意图最小程度地包括其存在对 表达是必要的所有成分, 还可包括其存在是有利的另外的成分, 例如, 引导序列和融合配偶 体序列。
     如本文所用, 术语 “重组宿主细胞” (“表达宿主细胞” , “表达宿主系统” , “表达系 统” 或简称″宿主细胞″ ) 意图是指重组载体已被引入其中的细胞。应理解的是这类术语 意图不仅是指具体对象细胞, 而且是指这类细胞的后代。 因为某些修饰可在后代中发生, 原 因在于突变或环境影响, 这类后代实际上可以与母本细胞不相同, 但仍包括在本文所用的 术语 “宿主细胞” 范围内。重组宿主细胞可以是分离的细胞或在培养物中生长的细胞系或 可以是存在于活体组织或生物中的细胞。
     术语 “真核” 是指有核细胞或生物并包括昆虫细胞、 植物细胞、 哺乳动物细胞、 动物 细胞和低等真核细胞 .
     术语 “低等真核细胞” 包括酵母、 真菌、 领鞭毛虫、 微孢子虫、 alveolates( 例如腰 鞭毛虫 )、 原生藻 ( 例如褐色藻类、 原生动物 )、 红藻 ( 例如红藻 (red algae))、 植物 ( 例如 绿藻、 植物细胞、 苔藓 ) 和其它原生生物。 酵母和丝状真菌包括但不限于 : 巴斯德毕赤酵母、
     术语 “表达控制序列” 或 “调节序列” 可互换地使用和如本文所用是指多核苷酸序 列, 其对影响被可操作地连接的编码序列的表达是必需的。 表达控制序列是控制转录、 转录 后事件和核酸序列翻译的序列。 表达控制序列包括适当的转录起始、 终止、 启动子和增强子 序列 ; 有效 RNA 加工信号例如剪切和多聚腺苷酸信号 ; 稳定细胞质 mRNA 的序列 ; 增强翻译 效率的序列 ( 例如, 核糖体结合位点 ) ; 增强蛋白稳定性的序列和当期望时, 增强蛋白分泌 的序列。 这类控制序列的性质根据宿主生物而不同 ; 在原核生物中, 这类控制序列通常包括 启动子、 核糖体结合位点和转录终止序列。术语 “控制序列” 意图最小程度地包括其存在对 表达是必要的所有成分, 还可包括其存在是有利的另外的成分, 例如, 引导序列和融合配偶 体序列。
     如本文所用, 术语 “重组宿主细胞” (“表达宿主细胞” , “表达宿主系统” , “表达系 统” 或简称″宿主细胞″ ) 意图是指重组载体已被引入其中的细胞。应理解的是这类术语 意图不仅是指具体对象细胞, 而且是指这类细胞的后代。 因为某些修饰可在后代中发生, 原 因在于突变或环境影响, 这类后代实际上可以与母本细胞不相同, 但仍包括在本文所用的 术语 “宿主细胞” 范围内。重组宿主细胞可以是分离的细胞或在培养物中生长的细胞系或 可以是存在于活体组织或生物中的细胞。
     术语 “真核” 是指有核细胞或生物并包括昆虫细胞、 植物细胞、 哺乳动物细胞、 动物 细胞和低等真核细胞 .
     术语 “低等真核细胞” 包括酵母、 真菌、 领鞭毛虫、 微孢子虫、 alveolates( 例如腰 鞭毛虫 )、 原生藻 ( 例如褐色藻类、 原生动物 )、 红藻 ( 例如红藻 (red algae))、 植物 ( 例如 绿藻、 植物细胞、 苔藓 ) 和其它原生生物。 酵母和丝状真菌包括但不限于 : 巴斯德毕赤酵母、
     芬兰毕赤酵母 (Pichia finlandica)、 喜海藻糖毕赤酵母 (Pichia trehalophila)、 Pichia koclamae、 膜醭毕赤酵母 (Pichia membranaefaciens)、 微小毕赤酵母 (Pichia minuta) (Ogataea minuta、 Pichia lindneri)、 Pichia opuntiae、 Pichia thermotolerans、 柳毕 赤酵母 (Pichia salictaria)、 Pichia guercuum、 皮杰普毕赤酵母 (Pichia pijperi)、 树 干毕赤酵母 (Pichia stiptis)、 甲醇毕赤酵母 (Pichia methanolica)、 毕赤酵母属的种 (Pichia sp.)、 酿酒酵母 (Saccharomyces cerevisiae)、 酵母菌属的种 (Saccharomyces sp.)、 多形汉逊酵母 (Hansenula polymorpha)、 克鲁维酵母属的种 (Kluyveromyces sp.)、 乳酸克鲁维酵母 (Kluyveromyces lactis)、 白色念珠菌 (Candida albicans)、 构巢曲霉 (Aspergillus nidulans)、 黑曲霉 (Aspergillus niger)、 米曲霉 (Aspergillus oryzae)、 里氏木霉 (Trichoderma reesei)、 Chrysosporium lucknowense、 镰孢菌属的种 (Fusarium sp.)、 禾谷镰孢菌 (Fusarium gramineum)、 Fusarium venenatum、 Physcomitrella patens 和粗糙脉胞菌 (Neurospora crassa)。
     本文所用术语 “肽” 指短的多肽, 例如通常少于约 50 个氨基酸长度且更通常少于 约 30 个氨基酸长度的多肽。如本文所用的术语包括类似物和模拟结构并因此模拟生物学 功能的模拟物。
     术语 “多肽” 包括天然形成的和非天然形成的蛋白及其片段、 突变体、 衍生物和类 似物。多肽可单体的或多聚体的。另外, 多肽可包括多个不同结构域, 其中各个具有一种或 多种独特的活性。
     术语 “分离的蛋白” 或 “分离的多肽” 是这样的蛋白或多肽, 由于其衍生的起源或 来源 (1 不与在其天然状态中伴随它的天然结合的成分结合, (2) 在自然界中未发现以纯化 物存在, 其中可以就其它细胞成份而论判断纯化物 ( 例如, 不含来自同一物种的其它蛋白 质 ), (3) 由来自不同物种的细胞表达, 或 (4) 在自然界中不存在 ( 例如, 它是在自然界中发 现的多肽的片段或它包括在自然界中没有发现的氨基酸类似物或衍生物或不是标准肽键 的连接 ) 的蛋白质或多肽。因此, 化学合成的多肽或在与多肽所来源的细胞体系不同的细 胞体系中合成的多肽将从其天然结合的成分中 “分离” 。 也可以使用本领域熟知的蛋白纯化 技术, 通过分离, 使多肽或蛋白质基本上不含或纯化天然结合的成分。 如这样所定义的, “分 离的” 不必要求这样描述的蛋白质、 多肽、 肽或寡肽已经从其自然环境中物理地移出。
     本文所用术语 “多肽片段” 是指具有缺失, 例如, 与全长多肽比较的氨基端和 / 或 羧基端缺失的多肽。 在优选的实施方案中, 多肽片段是连续序列, 其中片段的氨基酸序列与 在天然存在的序列中的相应位置同一。片段的长度典型地为至少 5、 6、 7、 8、 9 或 10 个氨基 酸, 优选至少 12、 14、 16 或 18 个氨基酸, 更优选至少 20 个氨基酸, 更优选至少 25、 30、 35、 40 或 45 个氨基酸, 甚至更优选至少 50 或 60 个氨基酸, 和甚至更优选至少 70 个氨基酸。
     修饰的衍生物” 指在一级结构序列中基本上同源的, 但包括, 例如, 在体内的或在 体外的化学修饰和生物化学修饰的、 或掺入在天然多肽中没有发现的氨基酸的多肽或其片 段。这样的修饰包括, 例如, 乙酰化、 羧化、 磷酰化、 糖基化、 泛素化、 标记例如用放射性核 素、 和各种酶的修饰, 如将容易被本领域的技术人员所了解的。标记多肽的多种方法和用 32 35 于此目的的多种取代物或标记物为本领域所熟知, 并包括放射性同位素例如 125I、 P、 S、 3 和 H, 结合至标记的抗配体 ( 例如, 抗体 ) 的配体, 荧光团, 化学发光剂, 酶, 和可以用作标 记的配体的特异性结合配对成员的抗配体。标记物的选择依赖于所需要的灵敏度、 与引物结合的容易程度、 稳定性要求、 和可利用的仪器。用于标记多肽的方法为本领域所熟知。 见, 例如, Ausubel 等, Current Protocols in Molecular Biology, Greene Publishing Associates(1992, 和 2002 的增刊 )( 通过引用并入本文中 )。
     术语 “嵌合基因” 或 “嵌合核苷酸序列” 是指核苷酸序列, 其包含偶联到异源核苷 酸序列的核苷酸序列或片段。嵌合序列用于融合蛋白的表达。嵌合基因或嵌合核苷酸序列 也可包括一个或多个片段或结构域, 其对于意图的宿主细胞是异源的, 并且可具有产生异 源重组蛋白的优势性质。通常, 嵌合核苷酸序列包括来自基因的至少 30 个连续核苷酸, 更 优选至少 60 或 90 或更多个核苷酸。嵌合核苷酸序列在本发明中具有特别用途, 所述嵌合 核苷酸序列具有至少一个对于意图的宿主细胞是异源的但与意图的重组蛋白同源的片段 或结构域。例如, 意图用于在利用巴斯德毕赤酵母宿主细胞以表达重组人糖蛋白的表达系 统中的嵌合基因应优选具有至少一个片段或结构域, 其是人来源的, 例如编码具有潜在治 疗用价值的人蛋白的序列, 而嵌合基因的其余部分, 例如应使得宿主细胞处理并表达嵌合 基因的调节序列, 应优选是巴斯德毕赤酵母来源的。 如果期望的, 人来源的片段也可以是对 于在宿主细胞中表达是密码子最优化的。( 参见, 例如, 美国专利 6,884,602, 在此通过引用 并入 )。
     术语 “融合蛋白” 或 “嵌合蛋白” 是指包含与异源氨基酸序列偶联的多肽或片段的 多肽。融合蛋白是有用的, 因为它们可以被构建以包含来自两种或更多种不同蛋白的两个 或多个所需功能元件。融合蛋白包含来自目的多肽的至少 10 个连续氨基酸, 优选至少 20 或 30 个氨基酸, 甚至更优选至少 40、 50 或 60 个氨基酸, 还更优选至少 75、 100 或 125 个氨 基酸。包括整个本发明蛋白的融合具有特殊的效用。包含于本发明融合蛋白内的异源多肽 的长度为至少 6 个氨基酸, 通常至少 8 个氨基酸, 和有用地为至少 15、 20、 和 25 个氨基酸。 融合体还包括较大的多肽、 或甚至整个蛋白质, 例如绿色荧光蛋白 (“GFP” ), 具有特殊效用 的含发色团的蛋白质。 可以通过将编码多肽或其片段的核酸序列在框内与编码不同蛋白质 或多肽的核酸序列一起构建, 然后表达融合蛋白, 来重组产生融合蛋白。或者, 可以通过交 联多肽或其片段至另一蛋白质, 来以化学方法产生融合蛋白。
     术语 “非肽类似物” 是指具有与那些参考多肽类似的性质的化合物。 非肽化合物也 可以称为 “肽模拟物” 或 “拟肽” . 参见, 例如, Jones, Amino Acid and Peptide Synthesis, Oxford University Press(1992) ; Jung, Combinatorial Peptide and Nonpeptide 文 库: A Handbook, John Wiley(1997) ; Bodanszky 等, Peptide Chemistry-A Practical Textbook, Springer Verlag(1993) ; Synthetic Peptides : A Users Guide, (Grant, 编辑, W.H.Freeman and Co., 1992) ; Evans 等, J.Med.Chem.30 : 1229(1987) ; Fauchere, J.Adv. Drug Res.15 : 29(1986) ; Veber 和 Freidinger, Trends Neurosci., 8: 392-396(1985) ; 和在 以上各出版物中所引用的参考文献, 其通过参考并入本文。这样的化合物经常在计算机分 子模拟的帮助下开发。 在结构上与本发明的有用肽相似的肽模拟物可用于产生同等作用并 因此被考虑为本发明的一部分。
     术语 “区域” 如本文所用是指生物分子的一级结构的在物理上的邻接部分。对于 蛋白质而言, 区域被定义为该蛋白质的氨基酸序列连续部分。
     术语 “结构域” 如本文所用是指作用于生物分子已知或未知功能的生物分子结构。 结构域可与区域或其部分共延伸 ; 结构域也可以包括生物分子的不同的、 非连续的区域。如本文所用, 术语 “分子” 意思是任意化合物, 包括但不是限于小分子、 肽、 蛋白质、 糖、 核苷酸、 核酸、 脂类等, 并且这样的化合物可以是天然的或合成的。
     如本文所用, 术语 “包括” (“comprise” ) 或变化例如 “包括” (“comprises” )或 “包括” (“comprising” ), 应理解为意指包含规定的整体或成组的整体但不排除任何其它 的整体或成组的整体。
     如本文所用, 术语 “主要地” 或变化例如 “主要的” 或 “其是主要的” 应理解为意指 在已经用 PNG 酶处理糖蛋白并由质谱例如 MALDI-TOF MS 分析释放的聚糖之后具有最高摩 尔百分比 (% ) 的总 O- 聚糖或 N- 聚糖的聚糖种类。换言之, 短语 “主要地” 被定义为为个 体实体, 以使特定 “主要” 糖形以比任何其它个体实体更大的摩尔百分比存在。例如, 如果 组合物由 40 摩尔百分比的种类 A、 35 摩尔百分比的种类 B 和 25 摩尔百分比的种类 C 组成, 则组合物主要包含种类 A。 附图说明
     图 1 图解了人和巴斯德毕赤酵母中 N- 糖基化途径。ER 中的早期事件是高度保守 的, 包括由葡糖苷酶 I 和 II 去除三个葡萄糖残基和由 ER 甘露糖苷酶处理单个特定 α-1, 2- 连接的甘露糖残基, 引起相同核心结构 Man8GlcNAc2(Man8B)。 但是, 加工事件在高尔基体 中不同。Mns, α-1, 2- 甘露糖苷酶 ; MnsII, 甘露糖苷酶 II ; GnT I, α-1, 2-N- 乙酰基葡糖 胺转移酶 I ; GnT II, α-1, 2-N- 乙酰基葡糖胺转移酶 II ; MnT, 甘露糖基转移酶。两个核心 GlcNAc 残基虽然在所有情况中存在, 但在命名中忽略。
     图 2 图解了 N- 糖基化中的关键中间步骤以及缩写命名, 其指产生各自聚糖结构 (GS) 的基因工程化巴斯德毕赤酵母菌株。
     图 3 图解了 N- 糖苷酶 F 释放的 N- 聚糖的 MALDI-TOF 质谱 (MS) 分析。K3( 人纤 溶酶原的三环 3 结构域 ) 在巴斯德毕赤酵母菌株 GS115 来源的野生型对照 (Invitrogen, Carlsbad, CA)、 YSH44、 YSH71、 RDP52 和 RDP80 中产生并通过 Ni- 亲和层析从培养物上清液 中纯化。通过 N- 糖苷酶 F 处理释放 N- 聚糖并进行 MALDI-TOF MS 分析 ( 阳性模式, 除了图 3G 是阴性模式 ), 其表现为钠或钾络合物。两个核心 GlcNAc 残基虽然存在, 但在命名中忽 略。GN, GlcNAc ; M, 甘露糖。
     图 3A : GS115 来源的野生型对照菌株中产生的 N- 聚糖 ;
     图 3B : 菌株 YSH44 中 K3 上产生的 N- 聚糖 ;
     图 3C : 菌株 YSH71(YSH44 表达 hGalTI) 中 K3 上产生的 N- 聚糖,
     图 (3D) 菌株 RDP52(YSH44 表达 hGalTI 和 SpGALE) 中 K3 上产生的 N- 聚糖,
     图 (3E) 菌株 RDP80(YSH44 表达 hGalTI、 SpGALE 和 DmUGT) 中 K3 上产生的 N- 聚 糖;
     图 (3F) 在 α- 半乳糖苷酶体外处理后来自 RDP80 的聚糖 ; 和
     图 (3G) 在用 α-2, 6-(N)- 唾液酸转移酶处理后在阴性模式中来自 RDP80 的聚糖。
     图 4 图解了 Leloir 半乳糖利用途径。经由半乳糖通透酶引入细胞外半乳糖。通 过酶半乳糖激酶, 半乳糖 -1- 磷酸尿苷酰转移酶和 UDP- 半乳糖 C4- 差向异构酶的作用半乳 糖被转化成葡萄糖 -6- 磷酸。来自酿酒酵母的蛋白名称在括号中。
     图 5 显 示 巴 斯 德 毕 赤 酵 母 糖 工 程 化 的 菌 株 YGLY578-1 的 构 建。 编 码 高 尔基 体 糖 基 转 移 酶 的 巴 斯 德 毕 赤 酵 母 基 因 OCH1, MNN4, PNO1, MNN4L1 和 BMT2 被 敲 除 然 后 敲 入 12 个 异 源 基 因, 包 括 分 泌 的 hK3 的 表 达 盒。YGLY578-1 能 够 生 产 糖 蛋 白 具 有 Gal2GlcNAc2Man3GlcNAc2N- 聚糖。CS, 反选择。
     图 6 显示质粒 pRCD977b 的示意图。该质粒是 arg1::HIS1 敲除质粒, 其整合进并 删除巴斯德毕赤酵母 ARG1 基因而利用 PpHIS1 基因作为选择标记并含有分别在 PpOCH1、 PpGAPDH、 PpPMA1 和 PpTEF 启动子的控制下编码全长黑腹果蝇高尔基体 UDP- 半乳糖转运蛋 白 (DmUGT)、 全长酿酒酵母半乳糖激酶 (ScGAL1)、 全长酿酒酵母半乳糖 -1- 磷酸尿苷酰转移 酶 (ScGAL7) 和酿酒酵母半乳糖通透酶 (ScGAL2) 的表达盒。TT 是指转录终止序列。
     图 7 显示表达酿酒酵母 GAL1、 GAL2 和 GAL7 基因的糖工程化的巴斯德毕赤酵母菌 株可在半乳糖 ( 作为单一碳源 ) 上生长而母本菌株不能。 糖工程化的菌株 YGLY578-1( 表达 ScGAL10 和 hGalTIβ) 用质粒 pRCD977b 转化, 所述质粒含有编码 ScGAL1、 ScGAL7 和 ScGAL2 的表达盒。菌株在成分确定的培养基上培养, 所述培养基含有酵母氮源、 生物素和 3%半乳 糖或 2%葡萄糖作为碳源或二者均无。
     图 8 显示巴斯德毕赤酵母糖工程化的菌株 YGLY317-36 的构建。 通过敲除五个酵母 糖基转移酶产生巴斯德毕赤酵母菌株 YGLY16-3。随后敲入八个异源基因, 得到 RDP696-2, 能够将人 N- 聚糖 Gal2GlcNAc2Man3GlcNAc2 转移到分泌的蛋白的菌株。经由 CSTR 培养和引 入表达分泌的人 Fc 的质粒选择健康 (robust) 克隆得到菌株 YGLY317-36。CS, 反选择。
     图 9 显示质粒 pGLY954 的示意图。该质粒是 KINKO 质粒, 其整合进巴斯德毕赤酵 母 TRP1 基因座而不删除基因。 质粒含有分别在 PpHHT1 和 PpPMA1 启动子的控制下编码全长 酿酒酵母半乳糖激酶 (ScGAL1) 和全长酿酒酵母半乳糖 -1- 磷酸尿苷酰转移酶 (ScGAL7) 的 表达盒。质粒还含有在 PpGAPDH 启动子的控制下编码分泌途径靶向融合蛋白 (CO hGalTI) ( 包含 ScMnt1(ScKre2) 前导肽 (33) 融合至人半乳糖基转移酶 I 催化结构域的 N- 末端 ) 的 表达盒。TT 是指转录终止序列。
     图 10 显示单独在 BMMY 培养基中诱导或在含有葡萄糖或半乳糖的培养基中诱导的 菌株 PBP317-36 和 RDP783 中产生的人 Fc 片段上 N- 聚糖的 MALDI-TOF MS 分析。菌株从饱 和的种子培养物接种至约一个 OD, 在 800mL BMGY 中培养 72 小时, 然后分离 (split) 并将 100mL 培养液等分样离心和在 25mL BMMY、 25mL BMMY+0.5%葡萄糖或 25mL BMMY+0.5%半乳 糖中诱导 24 小时。 蛋白 A 纯化的蛋白进行蛋白 N- 糖苷酶 F 消化和通过 MALDI-TOF MS 分析 释放的 N- 聚糖。图 A-C, 菌株 PBP317-36 中产生的人 Fc 上的 N- 聚糖 ; 图 D-E, 菌株 RDP783 中产生的人 Fc 上的 N- 聚糖。
     图 11 显示巴斯德毕赤酵母糖工程化的菌株 YDX477 的构建。敲除五种酵母糖基转 移酶产生巴斯德毕赤酵母菌株 YGLY16-3(Δoch1, Δpno1, Δbmt2, Δmnn4a, Δmnn4b)。随 后敲入八个异源基因, 得到 RDP697-1, 能够将人 N- 聚糖 Gal2GlcNAc2Man3GlcNAc2 转移到分 泌的蛋白的菌株。引入表达分泌的抗体的质粒和表达分泌的形式的里氏木霉 MNS1 的质粒 得到菌株 YDX477。CS, 反选择。
     图 12 显示质粒 pGLY1418 的示意图。该质粒是 KINKO 质粒, 其整合进巴斯德毕赤 酵母 TRP1 基因座而不删除基因。质粒含有分别在 PpHHT1 和 PpPMA1 启动子的控制下编码 全长 ScGAL1 和 ScGAL7 的表达盒。质粒还含有在 PpGAPDH 启动子的控制下编码分泌途径靶 向融合蛋白 (hGalTI)( 包含 ScMnt1(ScKre2) 前导肽融合至人半乳糖基转移酶 I 催化结构域的 N- 末端 ) 的表达盒。TT 是指转录终止序列。
     图 13A-F 显示单独在 BMMY 培养基中诱导或在含有半乳糖的培养基中诱导的菌 株 YDX477 和 RDP968-1 中产生的抗 -Her2 抗体上 N- 聚糖的 MALDI-TOF MS 分析。菌株在 150mL BMGY 中培养 72 小时, 然后分离并将 50mL 培养液等分样离心和在 25mL BMMY、 25mL BMMY+0.1%半乳糖或 25mL BMMY+0.5%半乳糖中诱导 24 小时。 蛋白 A 纯化的蛋白进行蛋白 N- 糖苷酶 F 消化和通过 MALDI-TOF MS 分析释放的 N- 聚糖。图 13A-C, 菌株 YDX477 中产生 的抗体上的 N- 聚糖 ; 图 13D-F, 菌株 RDP968-1 中产生的抗体上的 N- 聚糖。
     图 14 显示质粒 pAS24 的示意图。该质粒是巴斯德毕赤酵母 bmt2 敲除质粒, 其含 有 PpURA3 选择标记和含有在 PpOCH1 启动子的控制下编码全长小鼠高尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 的表达盒。TT 是指转录终止序列。
     图 15 显示质粒 pRCD742b 的示意图。该质粒是 KINKO 质粒, 其含有 PpURA5 选择标 记以及在 PpGAPDH 启动子的控制下编码分泌途径靶向融合蛋白 (FB8 MannI)( 包含融合至 小鼠甘露糖苷酶 I 催化结构域的 N- 末端的 ScSec12 前导肽 ) 的表达盒、 在 PpPMA1 启动子 的控制下编码分泌途径靶向融合蛋白 (CONA10)( 包含融合至人 GlcNAc 转移酶 I(GnT I) 催 化结构域的 N- 末端的 PpSec12 前导肽 ) 的表达盒和在 PpSEC4 启动子的控制下编码小鼠高 尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 的全长基因。TT 是指转录终止序列。
     图 16 显示质粒 pDMG47 的示意图。质粒包括在 PpGAPDH 的控制下启动子编码分泌 途径靶向融合蛋白 (KD53)( 包含融合至黑腹果蝇甘露糖苷酶 II 催化结构域的 N- 末端的 ScMnn2 前导肽 ) 的表达盒。质粒还含有在 PpPMA1 启动子的控制下编码分泌途径靶向融合 蛋白 (TC54)( 包含融合至大鼠 GlcNAc 转移酶 II(GnT II) 催化结构域的 N- 末端的 ScMnn2 前导肽 ) 的表达盒。TT 是指转录终止序列。
     图 17 显示质粒 pRCD823b 的示意图。该质粒是 KINKO 质粒, 其整合进巴斯德毕赤 酵母 HIS4 基因座而不删除基因, 并含有 PpURA5 选择标记。质粒包括在 PpGAPDH 启动子的 控制下编码分泌途径靶向融合蛋白 (TA54)( 包含 ScMnn2 前导肽融合至大鼠 GlcNAc 转移酶 II(GnTII) 催化结构域的 N- 末端 ) 的表达盒和分别在 PpOCH1 和 PpPMA1 启动子的控制下编 码全长黑腹果蝇高尔基体 UDP- 半乳糖转运蛋白 (DmUGT) 和酿酒酵母 UDP- 半乳糖 C4- 差向 异构酶 (ScGAL10) 的表达盒。TT 是指转录终止序列。
     图 18 显示质粒 pGLY893a 的示意图。该质粒是巴斯德毕赤酵母 his1 敲除质粒, 其 含有 PpARG4 选择标记。质粒含有在 PpPMA1 启动子的控制下编码分泌途径靶向融合蛋白 (KD10)( 包含 PpSEC12 前导肽融合至黑腹果蝇甘露糖苷酶 II 催化结构域的 N- 末端 ) 的表达 盒, 在 PpTEF 启动子的控制下编码分泌途径靶向融合蛋白 (TA33)( 包含 ScMnt1(ScKre2) 前 导肽融合至大鼠 GlcNAc 转移酶 II(GnT II) 催化结构域的 N- 末端 ) 的表达盒和在 PpGAPDH 启动子的控制下编码分泌途径靶向融合蛋白 ( 包含 ScMnn2 前导肽融合至人半乳糖基转移 酶 I 催化结构域的 N- 末端 ) 表达盒。TT 是指转录终止序列。
     图 19 显示质粒 pRCD742a 的示意图。该质粒是 KINKO 质粒, 其整合进巴斯德毕赤 酵母 ADE1 基因座而不删除基因并含有 PpURA5 选择标记。质粒含有在 PpGAPDH 启动子的控 制下编码分泌途径靶向融合蛋白 (FB8 MannI)( 包含 ScSEC12 前导肽融合至小鼠甘露糖苷 酶 I 催化结构域的 N- 末端 ) 的表达盒、 在 PpPMA1 启动子的控制下编码分泌途径靶向融合蛋 白 (CONA10)( 包含 PpSEC12 前导肽融合至人 GlcNAc 转移酶 I(GnT I) 催化结构域的 N- 末端 ) 的表达盒和在 PpSEC4 启动子的控制下编码全长小鼠高尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 的表达盒。TT 是指转录终止序列。
     图 20 显示质粒 pRCD1006 的示意图。该质粒是巴斯德毕赤酵母 his1 敲除质粒, 其 含有 PpURA5 基因作为选择标记。质粒含有在 PpGAPDH 启动子的控制下编码分泌途径靶向 融合蛋白 (XB33)( 包含 ScMnt1(ScKre2) 前导肽融合至人半乳糖基转移酶 I 催化结构域的 N- 末端 ) 的表达盒和分别在 PpOCH1 和 PpPMA1 启动子的控制下编码全长黑腹果蝇高尔基体 UDP- 半乳糖转运蛋白 (DmUGT) 和粟酒裂殖酵母 UDP- 半乳糖 C4- 差向异构酶 (SpGALE) 的表 达盒。TT 是指转录终止序列。
     图 21 显示质粒 pGLY167b 的示意图。该质粒是巴斯德毕赤酵母 arg1 敲除质粒, 其含有 PpURA3 选择标记并含有在 PpGAPDH 启动子的控制下编码分泌途径靶向融合蛋白 (CO-KD53)( 包含 ScMNN2 前导肽融合至黑腹果蝇甘露糖苷酶 II 催化结构域的 N- 末端 ) 的 表达盒和在 PpPMA1 启动子的控制下编码分泌途径靶向融合蛋白 (CO-TC54)( 包含 ScMnn2 前导肽融合至大鼠 GlcNAc 转移酶 II(GnT II) 催化结构域的 N- 末端 ) 的表达盒。TT 是指 转录终止序列。
     图 22 显示质粒 pBK 138 的示意图。该质粒是滚入 (roll-in) 质粒, 其整合进巴斯 德毕赤酵母 AOX1 启动子同时复制启动子。质粒含有编码融合蛋白 ( 包含酿酒酵母 A 交配 因子前信号序列融合至人 Fc 抗体片段 ( 人 IgG1H 链的 C- 末端 233-aa) 的 N- 末端 ) 的表 达盒。TT 是指转录终止序列。
     图 23 显示质粒 pGLY510 的示意图。该质粒是滚入质粒, 其整合进巴斯德毕赤酵母 TRP2 基因同时复制基因并含有 AOX1 启动子 -ScCYC1 终止子表达盒以及 PpARG1 选择标记。 TT 是指转录终止序列。
     图 24 显示质粒 pDX459-1 的示意图。 该质粒是滚入质粒, 其靶向并整合进巴斯德毕 R 赤酵母 AOX2 启动子和含有 Zeo 同时复制启动子。质粒含有分开的表达盒, 其编码抗 -HER2 抗体重链和抗 -HER2 抗体轻链, 每个在 N- 末端融合至黑曲霉 α- 淀粉酶信号序列并在巴斯 德毕赤酵母 AOX1 启动子的控制下。TT 是指转录终止序列。
     图 25 显示质粒 pGLY1138 的示意图。该质粒是滚入质粒, 其整合进巴斯德毕赤酵 母 ADE1 基因座同时复制基因和含有 ScARR3 选择标记基因盒 ( 其赋予亚砷酸盐抗性 ) 以及 在 PpAOX1 启动子的控制下编码分泌的里氏木霉 MNS1( 包含 MNS1 催化结构域在其 N- 末端 融合至酿酒酵母 α 因子前信号序列 ) 的表达盒。TT 是指转录终止序列。
     发明详述
     酵母已被成功用于生产细胞内和分泌的重组蛋白 ( 参见例如, Cereghino Cregg FEMS Microbiology Reviews 24(1) : 45-66(2000) ; Harkki, 等人 Bio-Technology 7(6) : 596(1989) ; Berka, 等人 Abstr.Papers Amer.Chem.Soc.203 : 121-BIOT(1992) ; Svetina, 等 人 J.Biotechnol.76(2-3) : 245-251(2000))。多种酵母, 例如乳酸克鲁维酵母、 巴斯德毕赤 酵母、 甲醇毕赤酵母和多形汉逊酵母, 已作为用于生产重组蛋白的真核表达系统发挥特别 重要的作用, 因为它们能够生长至高细胞密度和分泌大量重组蛋白。 但是, 在任意这些真核 微生物中的糖蛋白表达在 N- 聚糖结构上实质不同于哺乳动物中产生的糖蛋白表达。糖基 化中的该差异已阻止酵母或丝状真菌用作用于生产许多治疗用糖蛋白的宿主。
     为了能够利用酵母以产生治疗用糖蛋白, 酵母已被基因工程化为产生具有杂合或复合 N- 聚糖的糖蛋白。能够生产包含具体杂合或复合 N- 聚糖的组合物的重组酵母已在例 如, 美国专利号 7,029,872 和美国专利号 7,449,308 中公开。 另外, Hamilton 等人, Science 313 : 1441-1443(2006) 和美国公开的申请号 2006/0286637 报道了酵母巴斯德毕赤酵母中 糖基化途径的人源化和具有复合 N- 糖基化 ( 具有末端唾液酸 ) 的重组人糖蛋白的分泌。 对 于末端唾液酸的具有寡糖结构 Gal2GlcNAc2Man3GlcNAc2(G2) 前体 N- 聚糖是也作为从人血清 中分离的几种蛋白上主要 N- 聚糖发现的结构, 所述从人血清中分离的几种蛋白包括促卵 泡激素 (FSH)、 脱唾液酸转铁蛋白, 以及最显著的是在人免疫球蛋白 ( 抗体 ) 以不同的量存 在。Davidson 等人在美国公开的申请号 2006/0040353 教导了利用已被基因工程化为产生 半乳糖末端的 N- 聚糖的酵母细胞获得半乳糖基化的糖蛋白的有效方法。这些宿主细胞能 够生产糖蛋白组合物具有 G2 或 G1(GalGlcNAc2Man3GlcNAc2) 寡糖结构的多种混合物, 其具 有 G0 寡糖结构的变化量。 G0 是 GlcNAc2Man3GlcNAc2, 其是半乳糖基转移酶的底物。 但是, 对 于某些糖蛋白, 特别是抗体和 Fc 片段, 已发现半乳糖转移过程的效率不是最适的。在抗体 和 Fc 片段的情况下, 认为的是在细胞内加工期间抗体或 Fc 片段上糖基化位点的定位和可 及性抑制半乳糖有效转移到抗体或 Fc 片段的 N- 聚糖上。因此, 含有半乳糖的寡糖结构的 量小于其他糖蛋白例如三环 3 蛋白中已观察到的量。为了克服该问题, 本发明提供增加半 乳糖转移到抗体或 Fc 片段的 N- 聚糖上的量的方法, 因此增加含有抗体或 Fc 片段的 G1 和 G2 的量高于含有抗体或 Fc 片段的 G0。
     巴斯德毕赤酵母仅可利用有限数量的碳源进行生存。 目前, 这些碳源已知是甘油、 葡萄糖、 甲醇以及可能是鼠李糖和甘露糖但不是半乳糖。 在许多商业生产过程中, 利用巴斯 德毕赤酵母, 重组蛋白的表达在 AOX 启动子的控制下, 其 w 在甲醇存在下是有活性的但在甘 油存在下被抑制。因此, 巴斯德毕赤酵母通常在含有甘油或甘油 / 甲醇的培养基中生长直 到细胞的浓度达到期望的水平, 在此时, 通过用仅含有甲醇作为碳源的培养基替换培养基 来进行重组蛋白的表达。但是, 细胞处于低能量状态, 因为甲醇仅含有一个碳, 使其成为贫 瘠碳源。因此, 期望的是具有这样的生产过程, 其中巴斯德毕赤酵母可利用更高级的能源, 例如半乳糖。 本发明通过提供能够利用半乳糖作为单一碳源的基因工程化巴斯德毕赤酵母 也解决了该问题。
     因此, 本发明已解决上述确定的两个问题。 本发明提供重组低等真核细胞, 特别是 酵母和真菌细胞, 其已被糖工程化以产生糖蛋白例如抗体或 Fc 片段, 其中与未被如本文所 教导的基因工程化的细胞相比, 其上 N- 聚糖上的末端半乳糖水平增加。基因工程化宿主细 胞可用于产生具有 N- 聚糖 ( 含有半乳糖 ) 的糖蛋白的方法, 其中所述 N- 聚糖中半乳糖的 量高于未被如本文所教导的基因工程化的宿主细胞中可获得的量。 本发明还提供基因工程 化宿主细胞, 其中通常不能利用半乳糖作为单一碳源的宿主细胞已被如本文所教导的基因 工程化以能够利用半乳糖作为单一碳源。 本文的使得宿主细胞能够利用半乳糖作为单一碳 源的方法利用巴斯德毕赤酵母作为模型。 本文的方法可用于使得通常不能利用半乳糖作为 碳源的其他酵母或真菌物种能够利用半乳糖作为碳源。
     为 解 决 两 个 问 题, 基因工程化的宿主细胞 ( 其已被基因工程化为能够产生 半乳糖末端的 N- 聚糖 ) 被进一步基因工程化为表达 Leloir 途径酶 : 半乳糖激酶 (EC 2.7.1.6)、 UDP- 半乳糖 -4- 差向异构酶 (EC 5.1.3.2) 和半乳糖 -1- 磷酸尿苷酰转移酶 (EC 2.7.7.12)。任选地, 宿主细胞可另外表达半乳糖通透酶。这使得宿主细胞能够利用半乳糖作为碳源并产生 UDP- 半乳糖库, 其反过来作为涉及包括半乳糖残基的 N- 聚糖合成的半乳 糖转移酶的底物。 因此, 本文中的宿主细胞和方法能够产生糖蛋白组合物, 特别是抗体和 Fc 片段组合物, 其中所述半乳糖末端的 N- 聚糖的比例高于在糖工程化的低等真核细胞中可 获得的比例。重组宿主细胞可生产重组糖蛋白例如抗体和 Fc 融合蛋白, 其中 G0 ∶ G1/G2 比值小于 2 ∶ 1 或 G0 ∶ G1/G2 比值为 1 ∶ 1 或更小或 G0 ∶ G1/G2 比值为 1 ∶ 2 或更小。
     本文所述的宿主细胞和方法特别用于生产这样的抗体和 Fc 片段, 其含有具有 N- 聚糖的融合蛋白, 所述 N- 聚糖具有半乳糖残基末端。在抗体或抗体片段重链 Asn-297 处的 N- 聚糖对抗体的结构和功能重要。这些功能包括 Fcγ 受体结合、 激活补体的能力、 激 活细胞毒性 T 细胞 (ADCC) 的能力和血清稳定性。但是, 在酵母或哺乳动物细胞中目前的抗 体生产通常缺乏对于 N- 糖基化的控制, 特别是在重链的恒定区或 Fc 区 Asn-297 处发生的 N- 糖基化, 以及特别是控制在 N- 聚糖上末端半乳糖的水平的能力。一般而言, 已发现尽管 已被基因工程化为产生在 N- 聚糖中包括半乳糖残基的糖蛋白的酵母细胞可以高效地产生 许多具有含有半乳糖的 N- 聚糖的糖蛋白, 但是细胞产生抗体具有含有半乳糖的 N- 聚糖的 能力并不一样高效。 如本文所示, 本文的宿主细胞和方法提供这样的宿主细胞, 其与未被如 本文所述基因工程化的细胞相比, 可以产生更高水平的具有含有半乳糖的 N- 聚糖的抗体。
     尽管在不具有末端半乳糖残基的 N- 聚糖上末端的半乳糖水平可以在体外在利用 可溶性半乳糖基转移酶以将带电的半乳糖残基添加到 N- 聚糖的末端的反应中增加, 但是 该体外方法费用高、 复杂并且不容易扩大规模用于生产大量糖蛋白。 因此, 本文公开的宿主 细胞 ( 并且其能够在体内产生分泌的具有增加的末端半乳糖水平的 N- 聚糖的糖蛋白, 包 括抗体或抗体片段 ) 提供生产具有含有增加的半乳糖水平的 N- 聚糖的抗体组合物的更理 想的方法。因此, 本发明在抗体生产中具有显著改进并且首次提供控制具体抗体特征例如 N- 聚糖中半乳糖水平的能力, 和特别是生产具有改进的功能性特征的重组糖蛋白。
     另外, 当本文的方法用于已被基因工程化为产生具有唾液酸化的 N- 聚糖的糖蛋 白的宿主细胞中时, 半乳糖末端的 N- 聚糖是唾液酸转移酶的底物。因此, 唾液酸化的 N- 聚 糖的量部分地随可用于唾液酸化的半乳糖末端的 N- 聚糖的量而变化。本文中的宿主细胞 和方法提供用于增加半乳糖末端的或含有半乳糖的 N- 聚糖的量的方法, 其中当在已被基 因工程化为产生唾液酸化的 N- 聚糖的宿主细胞中生产时, 产生这样的宿主细胞, 其与未被 如本文所教导的基因工程化的宿主细胞相比, 产生增加量的唾液酸化的 N- 聚糖。
     尽管本发明用于生产包含半乳糖末端的或含有半乳糖的 N- 聚糖的糖蛋白, 但是 本发明还用作用于选择表达任意类型异源蛋白 ( 不论是否是糖蛋白 ) 的重组宿主细胞的 选择方法。表达一种或两种但不是全部 Leloir 途径酶活性的重组宿主细胞用编码异源蛋 白和不存在于重组宿主细胞中的 Leloir 途径酶的一个或多个核酸分子转化。由于转化的 重组宿主细胞含有完整的 Leloir 途径, 可通过在半乳糖是单一碳源的培养基中培养转化 的重组宿主细胞来获得选择表达对于非转化的细胞是异源蛋白的转化的重组宿主细胞。 因 此, 提供的是用于产生表达异源蛋白的重组宿主细胞的方法, 其包含以下步骤。提供宿主 细胞, 其已被基因工程化为表达一种或两种选自半乳糖激酶、 UDP- 半乳糖 -4- 差向异构酶 和半乳糖 -1- 磷酸尿苷酰转移酶的 Leloir 途径酶。在一些实施方案中, 宿主细胞能够产生 具有人样 N- 聚糖的糖蛋白, 和在其他实施方案中, 宿主细胞不产生具有人样 N- 聚糖的糖蛋 白, 因为要在宿主细胞中表达的异源蛋白不具有 N- 聚糖。用编码异源蛋白和提供的重组宿主细胞中不表达的 Leloir 途径酶或多种酶的一个或多个核酸分子转化宿主细胞。转化的 宿主细胞在含有半乳糖作为单一碳能源的培养基中培养以提供表达异源蛋白的重组宿主 细胞。任选地, 宿主细胞可另外包括编码半乳糖通透酶的核酸分子。在具体实施方案中, 宿 主细胞被基因工程化为控制 O- 糖基化或在控制 O- 糖基化的条件下生长或二者。在另外的 实施方案中, 宿主细胞另外已被修饰为降低磷酸甘露糖基转移酶和 / 或 β- 甘露糖基转移 酶活性 .
     在低等真核细胞中基因工程化糖基化途径
     在 大 多 数 真 核 细 胞 中 N- 糖 基 化 通 过 将 脂 类 - 连 接 的 Glc3Man9GlcNAc2 寡 糖 结 构 转 移 到 新 生 多 肽 的 特 定 Asn 残 基 上 在 内 质 网 (ER) 中 起 始 (Lehle 和 Tanner, Biochim.Biophys.Acta 399 : 364-74(1975) ; Kornfeld 和 Kornfeld, Annu.Rev.Biochem 54 : 631-64(1985) ; Burda 和 Aebi, Biochim.Biophys.Acta-General Subjects 1426 : 239-257(1999))。对来自 N- 连接寡糖的所有三个葡萄糖部分和单个特定甘露糖的修饰 产生 Man 8GlcNAc2( 参见图 1), 其使得糖蛋白易位到高尔基体, 在高尔基体中发生进一步 寡 糖 加 工 (Herscovics, Biochim.Biophys.Acta 1426 : 275-285(1999) ; Moremen 等 人, Glycobiology 4 : 113-125(1994))。在高尔基体中, 哺乳动物 N- 聚糖加工不同于酵母和许 多其他真核细胞, 包括植物和昆虫。哺乳动物以特定反应顺序加工 N- 聚糖, 涉及在从寡糖 在添加 GlcNAc 以形成杂合中间体 N- 聚糖 GlcNAcMan5GlcNAc2 之前, 去除三个末端 α-1, 2- 甘露糖 (Schachter, Glycoconj.J.17 : 465-483(2000))( 参见图 1)。该杂合结构是甘露 糖苷酶 II 的底物, 所述甘露糖苷酶 II 在寡糖上去除末端 α-1, 3- 和 α-1, 6- 甘露糖以得到 N- 聚糖 GlcNAcMan3GlcNAc2(Moremen, Biochim.Biophys.Acta 1573(3) : 225-235(1994))。 最后, 如图 1 所示, 通过在添加半乳糖和唾液酸残基后, 添加至少一个另外的 GlcNAc 残基, 产生复合 N- 聚糖 (Schachter, (2000), 如上 ), 虽然唾液酸通常在某些人蛋白, 包括 IgGs 上 缺乏 (Keusch 等人, Clin.Chim.Acta 252 : 147-158(1996) ; Creus 等人, Clin.Endocrinol. (Oxf)44 : 181-189(1996))。
     在酿酒酵母中, N- 聚糖加工涉及在其通过整个高尔基体时, 添加甘露糖至寡糖, 有 时产生具有大于 100 个甘露糖残基的高甘露糖基化的聚糖 (Trimble 和 Verostek, Trends Glycosci.Glycotechnol.7 : 1-30(1995) ; Dean, Biochim.Biophys.Acta-General Subjects 1426 : 309-322(1999))( 参见图 1)。在通过 α-1, 6- 甘露糖基转移酶 (Ochlp) 将第一个 α-1, 6- 甘露糖添加到 Man8GlcNAc2 后, 另外的甘露糖基转移酶延伸具有 α-1, 2-、 α-1, 6- 和末端 α-1, 3- 连接的甘露糖以及甘露糖基磷酸的 Man9GlcNAc2 聚糖。 巴斯德毕赤酵母是 甲基营养酵母, 通常用于异源蛋白的表达, 具有与酿酒酵母类似的糖基化机制 (Bretthauer 和 Castellino, Biotechnol.Appl.Biochem.30 : 193-200(1999) ; Cereghino 和 Cregg, Fems Microbiol.Rev.24 : 45-66(2000) ; Verostek 和 Trimble, Glycobiol.5 : 671-681(1995))。 但 是, 与 N- 糖基化的复杂度一致, 巴斯德毕赤酵母中的糖基化不同于酿酒酵母中的糖基化, 原因在于它缺乏添加末端 α-1, 3- 连接的甘露糖的能力, 而是添加其他甘露糖残基, 包括 磷酸甘露糖和 β- 连接的甘露糖 (Miura 等人, 基因 324 : 129-137(2004) ; Blanchard 等人, Glycoconj.J.24 : 33-47(2007) ; Mille 等人, J.Biol.Chem.283 : 9724-9736(2008))。
     在 以往工 作中, 我 们证明巴斯 德毕 赤酵 母 的 och1 突 变 体 缺乏 起 始 酵母 型 外 链 形 成 的 能 力, 并 且 因 此, 不 能 高 甘 露 糖 化 N- 聚 糖 (Choi 等 人, Proc.Natl.Acad.Sci.USA 100 : 5022-5027(2003))。另外, 我们鉴定了编码负责 β- 甘露糖转移的高尔基体定 位 (residing) 酶的新的基因家族并证明该家族的多个成员的缺失降低或消除免疫原性 β- 甘露糖转移 ( 参见美国公开的申请号 US2006/0211085)。随后引入五种单独的糖基 化酶得到在分泌的模式蛋白上产生复合人 N- 聚糖的菌株 ( 参见图 3A 相对于图 3B)(Choi 等 人, Proc.Natl.Acad.Sci.USA 100 : 5022-5027(2003) ; Hamilton 等 人 Science 310 : 1244-1246(2003) ; 美国专利号 7,029,872 ; 美国公开的申请号 2004/0018590 ; 美国公开的 申请号 2004/023004 ; 美国公开的申请号 2005/0208617 ; 美国公开的申请号 2004/0171826 ; 美国公开的申请号 2005/0208617 ; 美国公开的申请号 2005/0170452 和美国公开的申请 号 2006/0040353。更近期地, 构建能够在酵母菌株产生的分泌的蛋白上产生充分唾液酸 化的 N- 聚糖的重组酵母菌株已在美国公开的申请号 2005/0260729 和 2006/0286637 和 Hamilton 等人, Science 313 : 1441-1443(2006) 中描述。
     复合 N- 聚糖的成熟涉及添加半乳糖至末端 GlcNAc 部分, 这是可以被几种半乳糖 基转移酶 (GalT) 催化的反应。在人中, 存在 GalT 的七种同种型 (I-VII), 其中至少四种 已显示在体外在 UDP- 半乳糖存在下转移半乳糖至末端 GlcNAc(Guo, 等人, Glycobiol.11 : 813-820(2001))。最先鉴定的酶, 已知为 GalTI, 通常被认为是作用 N- 聚糖的主要酶, 这 已由体外实验、 小鼠敲除研究和组织分布分析支持 (Berger 和 Rohrer, Biochimie 85 : 261-74(2003) ; Furukawa 和 Sato, Biochim.Biophys.Acta 1473 : 54-66(1999))。 如 本 文 所示, 人 GalTI 的表达, 当其在宿主细胞高尔基体适当定位时, 可以在能够产生含有末端 GlcNA 的前体的糖工程化的酵母菌株中转移半乳糖至复合 N- 聚糖上。另外, UDP- 半乳糖 4- 差向异构酶的表达以产生 UDP- 半乳糖库和 UDP- 半乳糖转运蛋白的表达以将底物移动至 高尔基体在能够产生末端 GlcNAc 前体的菌株中产生几乎相当量的 β-1, 4- 半乳糖转移到 N- 聚糖上。 经由对于中间 N- 聚糖底物在 GlcNAc 和半乳糖基转移酶之间的分离和降低的竞 争, 定位子文库的重复筛选得到复合 N- 聚糖结构高于于杂合 N- 聚糖结构的改进的产生。
     以往, 在一组精确设计的实验 (an elegant set of experiments) 中, 人 GalTI 显 示具有将 β-1, 4- 半乳糖转移到末端 GlcNAc 的活性, 这要求首先产生 Alg1p 酶的突变体, 其将核心或少甘露糖转移到在生长中的 N- 聚糖前体分子 (Schwientek 等人, J.of Biol. Chem 271 : 3398-3405(1996))。该突变引起 GlcNAc2 截短的 N- 聚糖部分地转移到蛋白, 并 产生末端 GlcNAc。这之后, 作者表明人 GalTI 能够将半乳糖以 β-1, 4- 连接转移到该人工 末端 GlcNAc 结构。重要的是, 显示了人 GalTI 可以在酵母的高尔基体中以活性形式表达。
     基于上述, 首先利用靶向宿主细胞高尔基体的人 GalTI- 前导肽融合蛋白的表达 来检测本发明。在随后筛选人 GalTII、 GalTIII、 GaITIV、 GalTV、 牛 GalTI 和一对推测的线 虫 (C.elegans)GalT 后, 发现人 GalTI 看起来是在该异源的系统中将半乳糖转移到复合双 触角 N- 聚糖的最具活性的酶。 这可能表明 hGalTI 是用于转移至该底物 ( 双触角复合 N- 聚 糖 ) 的最具能力的酶或它可能仅是检测的 GalT 酶中最稳定的和最具活性的或二者的组合。 有意思的是, 当利用将甘露糖苷酶 II 和 GnT II 催化结构域 - 引导融合蛋白定位于高尔基体 的相同前导肽将 GalT 定位于高尔基体时, 产生其中末端半乳糖在 α-1, 3 臂上的杂合 N- 聚 糖结构的显著百分比 ( 直至 20% )。甘露糖苷酶 II 或 GnT II 活性的表达的增加不能显著 降低该现象。但是, 筛选酵母型 II 分泌途径定位前导肽 ( 定位于分泌途径期望的细胞器例 如 ER、 高尔基体或反式高尔基体网络的肽 ) 文库得到几种活性 GalT- 前导肽融合蛋白, 其当被转化至宿主细胞时, 产生显著降低水平的杂合 N- 聚糖结构和增加的复合 N- 聚糖结构。 之 前, 已报道等分的 (bisecting)GlcNAc 转移是高尔基体中 N- 聚糖的成熟中对于随后糖转移 的停止信号, 包括阻止果糖的转移 (Umana 等人, Nature Biotechnol.17 : 176-180(1999))。 此处的数据表明半乳糖转移到 α-1, 3 臂产生类似的停止信号, 阻止甘露糖苷酶 II 和 GnT II 进行的 α-1, 6 臂的成熟。
     上述结果表明在重组宿主细胞中产生的具有半乳糖末端或含有半乳糖的杂合 N- 聚糖与具有半乳糖末端的或含有半乳糖的复合 N- 聚糖的比值是 GalTI 位于高尔基体相 对于甘露糖苷酶 II 和 GnT II 位于高尔基体中的结果, 并且通过操纵三种酶的定位, 可以操 纵杂合 N- 聚糖与复合 N- 聚糖的比值。为了增加具有半乳糖末端的或含有半乳糖的杂合 N- 聚糖的产率, 所有三种酶活性应被靶向至高尔基体的相同区域, 例如通过利用相同分泌 途径靶向前导肽来靶向所有三种酶活性。或者, 筛选 GalT- 前导肽融合蛋白的文库来鉴定 将 GalT 活性定位于高尔基体的融合蛋白, 在高尔基体中更可能的是在其他两个酶可以发 挥作用之前, GalT 作用 N- 聚糖底物。 该增加了具有半乳糖末端的或含有半乳糖的杂合 N- 聚 糖相比于具有半乳糖末端的或含有半乳糖的复合 N- 聚糖的产率。相反地, 为了降低具有半 乳糖末端的或含有半乳糖的杂合 N- 聚糖的产率, 应利用与其他两种酶活性所利用的分泌 途径靶向前导肽不同的分泌途径靶向前导肽来定位 GalT 活性。这可通过筛选 GalT- 前导 肽融合蛋白文库以鉴定 GalT- 前导肽融合蛋白组合来获得, 所述 GalT- 前导肽融合蛋白组 合产生这样的宿主细胞, 在其中与具有半乳糖末端的或含有半乳糖的杂合 N- 聚糖的产率 相比, 具有半乳糖末端的或含有半乳糖的复合 N- 聚糖的产率增加。
     该结果进一步强调了当在异源宿主系统中表达嵌合糖基化酶时, 筛选催化结构 域和分泌途径定位前导肽文库的价值, 这是之前在 Choi 等人, Proc.Natl.Acad.Sci.USA 100 : 5022-5027(2003) 中说明的并在美国专利号 7,029,872 和 7,449,308 中描述的概念。 由于全基因组序列的可获得性、 更复杂的 PCR 和克隆技术以及更高通量的分析技术如质 谱, 筛选数以百计甚至数以千计的组合是可能的。重要的是, 这种类型的组合筛选已证实 在检测酶活性与驱动逐步反应之间的差异, 每个依赖于之前的产物而完成。此处, 尽管在 UDP- 半乳糖 4- 差向异构酶的情况下, 筛选的几种酶看起来具有产生 UDP- 半乳糖库相对相 同的能力, 但是检测的四种 UDP- 半乳糖转运蛋白中仅一种在该异源宿主中证实有活性, 包 括令人惊讶地, 来自一种酵母 ( 粟酒裂殖酵母 ) 的一种无活性转运蛋白。另外, 从多种分泌 途径定位前导肽的筛选中, 其中许多产生活性酶组合, 发现仅三种得到较高程度的具有双 触角末端半乳糖 (G2) 的均一的复合 N- 聚糖 ( > 85% )。高甘露糖和杂合中间结构的减少 对于这类异源表达系统在生产治疗用糖蛋白中的用途具有重要的作用, 因为高甘露糖结构 已显示具有有效免疫原性并且最近的证据已表明肝毒性可源自过于丰富的杂合 N- 聚糖。
     因此, 美国公开的申请号 2006/0286637 教导了在不通常产生含有半乳糖的糖蛋 白的宿主细胞中获得半乳糖转移的方法, 三种条件已被克服 : (1) 在高尔基体中内源半乳 糖基转移酶 (GalT) 的缺乏, (2) 内源 UDP-Gal 不能转运至高尔基体和 (3) 低的内源细胞质 UDP-Gal 库。在缺乏 UDP-Gal 转运蛋白的情况下, 半乳糖向 N- 聚糖上末端 GlcNAc 残基的转 移为约 55-60%。在缺乏 UDP- 葡萄糖 -4- 差向异构酶的情况下, 半乳糖向 N- 聚糖上末端 GlcNAc 残基的转移为约 10-15%。
     利用具有暴露的 N- 聚糖 ( 其在人中通常被唾液酸化 ) 的报告子蛋白 ( 人纤溶酶原的 K3 结构域 ) 已制备了所有上述修饰以产生宿主细胞 ( 其可产生半乳糖基化的 N- 聚糖 ), 并在美国公开的申请号 20060040353 中报道。但是, 以可与哺乳动物细胞相比较的方式, 这 些糖工程化的酵母菌株仅产生部分的半乳糖转移到抗体 Fc 聚糖上, 引起具有小于 10% G2 和小于 25% G1 结构的 N- 聚糖库, 偏好于具有末端 GlcNAc 的复合 N- 聚糖。这与哺乳动物 细胞系类似, 其中抗体 (IgG Fc Asn 297)N- 聚糖含有减少量的末端半乳糖。
     半乳糖残基转移到 N- 聚糖上需要活化的半乳糖 (UDP-Gal) 库。 在低等真核细胞中 产生高于内源水平的这类库的一种方式是如上所述并在美国公开的申请号 2006/0040353 所示的 UDP- 半乳糖 4 差向异构酶的表达。另一种方式本发明, 其包括上述细胞, 其中用核 酸分子转化所述宿主细胞, 所述核酸分子编码至少以下三种 Leloir 途径酶 : 半乳糖激酶 (EC2.7.1.6)、 半乳糖 -1- 磷酸尿苷酰转移酶 EC 2.7.7.12) 和 UDP- 半乳糖 4 差向异构酶 (EC 5.1.3.2)。半乳糖激酶是催化半乳糖代谢的第一步 ( 称为半乳糖磷酸化为半乳糖 -1- 磷 酸 ) 的酶。半乳糖 -1- 磷酸尿苷酰转移酶催化半乳糖代谢的第二步骤, 其是 UDP- 葡萄糖和 半乳糖 -1- 磷酸转换为 UDP- 半乳糖和葡萄糖 -1- 磷酸。任选地, 另外可以包括的是编码质 膜半乳糖通透酶的核酸分子。半乳糖通透酶是质膜己糖转运蛋白, 其从外部来源输入半乳 糖。Leloir 途径显示于图 4。
     如本文所示, 当编码半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳 糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性的基因被引入上述酵母, 同时 向该酵母给料酵母外源半乳糖, 并诱导抗体表达时, 抗体 Fc N- 聚糖上末端半乳糖的水平实 质增加, 因此增加产生的 G2N- 聚糖的量 : N- 聚糖可在人 Fc 上获得, 其中大于 50%的 N- 聚 糖是 G2。通透酶是任选的, 因为发现细胞中的内源通透酶能够将半乳糖输入细胞。因此, 当使用时, 半乳糖通透酶可以是能够使半乳糖穿过细胞膜转运的任意质膜己糖转运蛋白, 例如, 来自酿酒酵母的 GAL2 半乳糖通透酶 ( 参见 GenBank : M81879)。半乳糖激酶可以是能 够催化半乳糖磷酸化为半乳糖 -1- 磷酸的任意酶, 例如, 来自酿酒酵母的 GAL1 基因 ( 参见 GenBank : X76078)。半乳糖 -1- 磷酸尿苷酰转移酶可以是催化 UDP- 葡萄糖和半乳糖 -1- 磷 酸转换为 UDP- 半乳糖和葡萄糖 -1- 磷酸的任意酶, 例如, 酿酒酵母的 GAL7( 参见 GenBank : M12348)。UDP- 半乳糖 4 差向异构酶可以是催化 UDP- 葡萄糖转换为 UDP- 半乳糖的任意酶, 例如酿酒酵母的 GAL10( 参见 GenBank NC_001134), 粟酒裂殖酵母的 GALE( 参见 GenBank NC_003423) 和人的 hGALE( 参见 GenBank NM_000403)。差向异构酶还可提供为融合蛋白, 其中差向异构酶的催化结构域被融合至半乳糖基转移酶的催化结构域 ( 参见美国公开的 申请号 US2006/0040353)。
     将上述 Leloir 途径酶引入巴斯德毕赤酵母菌株产生能够同化环境半乳糖的重组 细胞。另外, 当上述 Leloir 途径酶被引入能够生产具有含有半乳糖的 N- 聚糖的糖蛋白的 细胞中时, 得到的重组细胞能够产生与未被如此工程化的细胞产生的糖蛋白相比, 在复合 N- 聚糖上具有更高水平 β-1, 4- 半乳糖的糖蛋白。因此, 这些工程化步骤的组合已得到这 样的宿主细胞, 其被特定地糖工程化和代谢地工程化为对于糖蛋白例如抗体和 Fc- 融合蛋 白的 N- 聚糖的糖基化的增加的控制。因此, 这些糖工程化的酵母细胞系能够有效的产生重 组抗体和 Fc 融合蛋白同时允许控制 N- 聚糖加工。
     表达载体
     一般而言, 半乳糖激酶、 UDP- 半乳糖 -4- 差向异构酶和半乳糖 -1- 磷酸尿苷酰转移酶 ( 以及任选地半乳糖通透酶 ) 作为来自表达载体的表达盒的组分而表达。在另外的方 面, 在宿主细胞中另外包括的是编码重组目的蛋白的表达载体, 其在具体的实施方案中另 外包括促进重组蛋白从宿主细胞中分泌的序列。对于每种 Leloir 途径酶和重组目的蛋白, 编码它的表达载体最低程度含有这样的序列, 其影响编码 Leloir 途径酶或重组蛋白的核 酸序列的表达。该序列被可操作连接到编码 Leloir 途径酶或重组蛋白的核酸分子。这类 表达载体还可含有另外的元件, 如复制起点、 选择标记、 转录或终止信号、 着丝粒、 自我复制 序列等。
     根据本发明, 编码重组目的蛋白和上述 Leloir 途径酶的核酸分子可以分别地位 于表达载体中以允许过表达的重组目的蛋白和上述 Leloir 途径酶的受调节的表达。尽管 重组蛋白和上述 Leloir 途径酶可以在相同的表达载体中编码, 但是上述 Leloir 途径酶优 选地在与编码重组蛋白的载体分开的表达载体中编码。编码上述 Leloir 途径酶和重组蛋 白的核酸分子位于分开的表达载体中可以增加产生的重组蛋白的量。
     如本文所用, 表达载体可以是可复制的或不可复制的表达载体。可复制的表达载 体可以不依赖于宿主细胞染色体 DNA 复制或因为这类载体具有整合到宿主细胞染色体 DNA 而依赖于宿主细胞染色体 DNA 复制。整合至宿主细胞染色体 DNA 后, 这类表达载体可以失 去一些结构元件但保留编码重组蛋白或上述 Leloir 途径酶的核酸分子和可以作用于重组 蛋白或上述 Leloir 途径酶的表达的片段。因此, 本发明的表达载体可以是染色体整合或染 色体非整合的表达载体。
     在引入编码上述 Leloir 途径酶和重组蛋白的核酸分子后, 然后通过诱导编码重 组蛋白的核酸的表达, 使重组蛋白过表达。在另一实施方案中, 建立这样的细胞系, 其组成 型或诱导型表达上述 Leloir 途径酶。编码将被过表达的重组蛋白的表达载体被引入这类 细胞系以获得重组蛋白的增加的产生。在具体实施方案中, 编码 Leloir 途径酶的核酸分子 被可操作连接到组成型启动子。
     本发明表达载体可以是在一种宿主细胞类型例如大肠杆菌 (Escherichia coli) 中可复制的并在另一种宿主细胞类型例如真核宿主细胞中进行很少复制或不能复制的, 只 要表达载体允许上述 Leloir 途径酶或过表达的重组蛋白的表达并因而促进这类重组蛋白 在选择的宿主细胞类型中的分泌。
     如本文所述的表达载体包括这样的 DNA 或 RNA 分子, 其被工程化为对期望的基因 即编码上述 Leloir 途径酶或重组蛋白的基因的控制表达。这类载体还编码核酸分子片段, 其被可操作连接到编码本发明上述 Leloir 途径酶或重组蛋白的核酸分子。在本发明上下 文中, 可操作连接意思是这类片段可以作用于编码上述 Leloir 途径酶或重组蛋白的核酸 分子的表达。这些核酸序列包括启动子、 增强子、 上游控制元件、 转录因子或抑制子结合位 点、 终止信号和可以在预期的宿主细胞中控制基因表达的其它元件。 优选载体是载体、 细菌 噬菌体、 黏粒或病毒。
     本发明的表达载体在酵母或哺乳动物细胞中发挥功能。酵母载体可以包括酵母 2μ 环及其衍生物, 编码酵母自我复制序列的酵母载体, 酵母小染色体, 任意酵母整合载体 等。多种类型酵母载体的详细列表在 Parent 等人 (Yeast 1 : 83-138(1985)) 中提供。
     能够作用于基因产物的表达的元件或核酸序列包括启动子、 增强子元件、 上游激 活序列、 转录终止信号和多聚腺苷酸位点。所有这类启动子和转录调节元件, 单独或组合,被预期用于本发明的表达载体中。另外, 基因 - 工程化的和突变的调节序列还在本文中的 预期。
     启动子是用于控制基因表达的 DNA 序列元件。具体地, 启动子确定转录起始位点 并可以包括 TATA 盒和上游启动子元件。选择的启动子是期望在选择的具体宿主系统中可 操纵的那些。例如, 当利用酵母宿主细胞例如酿酒酵母、 乳酸克鲁维酵母或巴斯德毕赤酵 母时, 酵母启动子用于本发明的表达载体, 而真菌启动子将用于宿主细胞例如黑曲霉、 粗糙 脉胞菌或里氏木霉。酵母启动子的实例包括但不限于 GAPDH, AOX1, SEC4, HH1, PMA1, OCH1, GAL1, PGK, GAP, TPI, CYC1, ADH2, PHO5, CUP1, MFα1, FLD1, PMA1, PDI, TEF 和 GUT1 启动子。 Romanos 等人 (Yeast 8 : 423-488(1992)) 提供了酵母启动子和表达载体的综述。Hartner 等人, Nucl.Acid Res.36 : e76( 于 2008 年 6 月 6 日在线出版 ) 描述了用于巴斯德毕赤酵母 中异源蛋白精确调节表达的启动子文库。
     可操作连接本文公开的核酸分子的启动子可以是组成型启动子和诱导型启动子。 诱导型启动子是结合转录因子后以增加或降低的速率引导转录的启动子。 如本文所用的转 录因子包括可以结合启动子的调节或控制区并因而影响转录的任意因子。 在宿主细胞中转 录因子的合成或启动子结合能力可以通过将宿主暴露于诱导物或将诱导物从宿主细胞培 养基中去除来控制。 因此, 为了调节诱导型启动子的表达, 将诱导物添加或从宿主细胞的生 长培养基中去除。这类诱导物可以包括糖、 磷酸、 醇、 金属离子、 激素、 热、 冷等。例如, 在酵 母中常用诱导物是葡萄糖、 半乳糖等。
     选择的转录终止序列是在选择的具体宿主系统中可操纵的那些。例如, 当利用酵 母宿主细胞例如酿酒酵母、 乳酸克鲁维酵母或巴斯德毕赤酵母时, 酵母转录终止序列用于 本发明的表达载体, 而真菌转录终止序列将用于宿主细胞例如黑曲霉、 粗糙脉胞菌或里氏 木霉。转录终止序列包括但不限于酿酒酵母 CYC 转录终止序列 (ScCYC TT)、 巴斯德毕赤酵 母 ALG3 转录终止序列 (ALG3 TT)、 巴斯德毕赤酵母 ALG6 转录终止序列 (ALG6 TT)、 巴斯德毕 赤酵母 ALG12 转录终止序列 (ALG12 TT)、 巴斯德毕赤酵母 AOX1 转录终止序列 (AOX1 TT)、 巴 斯德毕赤酵母 OCH1 转录终止序列 (OCH1 TT) 和巴斯德毕赤酵母 PMA1 转录终止序列 (PMA1 TT)。
     本发明的表达载体还可编码选择标记。选择标记是基因功能物, 其赋予宿主细胞 可鉴定的性状以使用携带选择标记的载体转化的细胞可以与非转化的细胞区分。 载体中包 含选择标记还可用于确保连接到标记的基因功能物保留在宿主细胞群体中。 这类选择标记 可以赋予任意容易鉴定的显性性状, 例如药物抗性、 合成或代谢细胞营养物的能力等。
     酵母选择标记包括药物抗性标记和基因功能物, 其允许酵母宿主细胞合成基本 的细胞营养物, 例如氨基酸。常用于酵母的药物抗性标记包括氯霉素、 卡那霉素、 甲氨蝶 呤、 G418( 遗传霉素 )、 博莱霉素等。允许酵母宿主细胞合基本的细胞营养物的基因功能物 与在相应基因组功能中具有营养缺陷型突变的可利用的酵母菌株一起使用。常见酵母选 择标记提供用于合成亮氨酸 (LEU2)、 色氨酸 (TRP1 和 TRP2)、 尿嘧啶 (URA3, URA5, URA6)、 组氨酸 (HIS3)、 赖氨酸 (LYS2)、 腺嘌呤 (ADE1 或 ADE2) 等的基因功能物。其他酵母选择 标记包括来自酿酒酵母的 ARR3 基因, 其赋予在亚砷酸盐存在下生长的酵母细胞亚砷酸 盐 抗 性 (Bobrowicz 等 人, Yeast, 13 : 819-828(1997) ; Wysocki 等 人, J.Biol.Chem.272 : 30061-30066(1997))。大量合适的整合位点包括美国公开的申请号 2007/0072262 中列举的那些并包括与已知酿酒酵母和其它酵母或真菌的基因座的同源物。 用于将载体整合至酵 母的方法是熟知的, 例如, 参见 WO2007136865。
     因此, 本发明表达载体可以编码选择标记, 其用于在存在于培养物中的细胞群体 中鉴定和维持含有载体的宿主细胞。在一些环境下, 选择标记还可用于扩增表达载体的拷 贝数。在诱导来自本发明表达载体的转录以产生编码过表达的重组蛋白或 Leloir 途径酶 的 RNA 后, RNA 被细胞因子翻译以产生重组蛋白或 Leloir 途径酶。
     在酵母和其它真核细胞中, 通过核糖体结合 mRNA 的 5′帽和核糖体延 mRNA 移动至 第一个 AUG 起始密码子 ( 在此处多肽合成可以开始 ) 而启动信使 RNA(mRNA) 的翻译。在酵 母和哺乳动物细胞中的表达通常不需要核糖体 - 结合位点和起始密码子之间特定数量的 核苷酸 ( 如有时在原核表达系统中需要的 )。但是, 对于在酵母或哺乳动物宿主细胞中表 达, mRNA 中第一个 AUG 密码子优选是期望的翻译起始密码子。
     另外, 当表达在酵母宿主细胞中进行时, 长的非翻译引导序列例如长于 50-100 个 核苷酸的存在可以减弱 mRNA 的翻译。酵母 mRNA 引导序列具有约 50 个核苷酸的平均长度, 富含腺嘌呤, 具有较少的二级结构和几乎通常使用第一个 AUG 来起始。由于不具有这些特 征的引导序列可以降低蛋白翻译的效率, 酵母引导序列优选用于在酵母宿主细胞中过表达 的基因产物或分子伴侣蛋白的表达。 许多酵母引导序列的序列是本领域技术人员已知的和 可利用的, 例如, 参考 Cigan 等人 (Gene 59 : 1-18(1987)). 除了启动子、 核糖体 - 结合位点和起始密码子的位置, 可以影响得到的表达水平 的因素包括可复制的表达载体的拷贝数。 通常通过载体复制起点和与其关联的任意顺式作 用控制元件来确定载体的拷贝数。例如, 编码调节的着丝粒的酵母游离载体的拷贝数的增 加可通过诱导紧密排列至着丝粒的启动子的转录来获得。 另外, 在酵母载体中编码酵母 FLP 功能物还可增加载体的拷贝数。
     通过组合来自可利用的载体的 DNA 片段, 通过合成编码这类调节元件的核酸分子 或通过克隆新的调节元件并使新的调节元件位于该载体, 本领域技术人员还可容易地设计 和制备包括上述序列的表达载体。产生表达载体的方法是熟知的。过表达的 DNA 方法见于 种种关于基因工程的标准实验室手册中的任意。
     本发明的表达载体可以通过以适当的方法将上述 Leloir 途径酶和重组蛋白的编 码区连接到启动子和用于控制基因表达的其它序列元件上来制备。在该表达载体构建后, 这类载体被转化至宿主细胞, 其中可以表达过表达的重组蛋白和 Leloir 途径酶。用表达载 体转化酵母和其它低等真核细胞的方法是本领域技术人员熟知的和容易利用的。例如, 表 达载体可以通过几种方法包括醋酸锂、 原生质体、 电穿孔和类似方法中的任意被转化至酵 母细胞。
     宿主细胞
     酵母例如巴斯德毕赤酵母、 甲醇毕赤酵母和多形汉逊酵母可用于细胞培养, 因为 它们能够生长至高细胞密度和分泌大量重组蛋白。 同样, 丝状真菌例如黑曲霉、 镰孢菌属的 种、 粗糙脉胞菌等可用于以工业规模产生本发明的糖蛋白。 一般而言, 用于实践本文的方法 的低等真核细胞包括通常不能利用半乳糖作为碳源的酵母和真菌。 不能利用半乳糖作为碳 源的酵母的实例包括但不限于毕赤酵母属的甲基营养酵母, 例如巴斯德毕赤酵母, 和酵母, 例如 S.kudriavzevii、 C.glabrata、 K.waltii 和 E.gossypii。酵母可用于糖蛋白的表达,
     因为它们可以是较经济地培养, 提供高产量, 并且当适当修饰时, 能够合适的糖基化。酵母 特别提供了确定的遗传学, 允许快速转化、 测试蛋白定位策略和容易的基因敲除技术。 合适 的载体具有表达控制序列, 例如启动子, 包括 3- 磷酸甘油酸激酶或其他糖酵解酶, 以及复 制起点, 终止序列等, 如期望的。因此, 上述宿主细胞 ( 其不能通常利用半乳糖作为碳源 ) 已被基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷 酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性, 使得宿主细胞能够利用半乳糖作为碳 源。
     低等真核细胞, 特别是酵母, 还可被基因修饰以使它们表达糖蛋白, 其中糖基化模 式是人样或人源化的。这可通过如 Gerngross 等人, 美国公开的申请号 2004/0018590 所述 去除选择的内源糖基化酶和 / 或提供外源酶来获得。例如, 宿主细胞可以被选择或工程化 为缺乏 1, 6- 甘露糖基转移酶活性, 其将另外添加甘露糖残基至糖蛋白的 N- 聚糖上。
     在一个实施方案中, 如本文所述被基因工程化为同化环境半乳糖作为碳源的宿主 细胞还如下所述被基因工程化为产生复合 N- 聚糖。这类宿主细胞另外包括 α1, 2- 甘露糖 苷酶催化结构域 ( 其融合至通常不与催化结构域结合的细胞靶向信号肽并被选择将 α1, 2- 甘露糖苷酶活性靶向宿主细胞的 ER 或高尔基体 )。重组糖蛋白经过宿主细胞的 ER 或 高尔基体产生包含 Man5GlcNAc2 糖形的重组糖蛋白, 例如包含主要 Man5GlcNAc2 糖形的重组 糖蛋白组合物。例如, 美国专利号 7,029,872 和美国公开的专利申请号 2004/0018590 和 2005/0170452 公开了能够产生包含 Man5GlcNAc2 糖形的糖蛋白的低等真核生物宿主细胞。 这些宿主细胞当进一步如本文所教导的被基因工程化为表达半乳糖激酶活性、 UDP- 半乳 糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性 时, 能够利用半乳糖作为碳源。
     紧接前述宿主细胞另外包括 GlcNAc 转移酶 I(GnT I) 催化结构域 ( 其融合至通常 不与催化结构域结合的细胞靶向信号肽并被选择将 GlcNAc 转移酶 I 活性靶向宿主细胞的 ER 或高尔基体 )。重组糖蛋白经过宿主细胞的 ER 或高尔基体产生包含 GlcNAcMan5GlcNAc2 糖形的重组糖蛋白, 例如包含主要 GlcNAcMan5GlcNAc2 糖形的重组糖蛋白组合物。美国专 利号 7,029,872 和美国公开的专利申请号 2004/0018590 和 2005/0170452 公开了能够产生 包含 GlcNAcMan5GlcNAc2 的糖蛋白的低等真核生物宿主细胞。上述细胞产生的糖蛋白可以 体外用氨基己糖苷酶处理以产生包含 Man5GlcNAc2 糖形的重组糖蛋白。这些宿主细胞当进 一步如本文所教导的被基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活 性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性时, 能够利用半乳糖 作为碳源。
     然后, 紧接前述宿主细胞另外包括甘露糖苷酶 II 催化结构域 ( 其融合至通常不与 催化结构域结合的细胞靶向信号肽并被选择将甘露糖苷酶 II 活性靶向宿主细胞的 ER 或 高尔基体 )。重组糖蛋白经过宿主细胞的 ER 或高尔基体产生包含 GlcNAcMan3GlcNAc2 糖形 的重组糖蛋白, 例如包含主要 GlcNAcMan3GlcNAc2 糖形的重组糖蛋白组合物。美国专利号 7,029,872 和美国公开的专利申请号 2004/0230042 公开了表达甘露糖苷酶 II 酶和能够生 产糖蛋白具有主要 GlcNAc2Man3GlcNAc2 糖形的低等真核生物宿主细胞。上述细胞产生的糖 蛋白可以体外用氨基己糖苷酶处理以产生包含 Man3GlcNAc2 糖形的重组糖蛋白。这些宿主 细胞当进一步如本文所教导的被基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性时, 能够利 用半乳糖作为碳源。
     然后, 紧接前述宿主细胞另外包括 GlcNAc 转移酶 II(GnT II) 催化结构域 ( 其 融合至通常不与催化结构域结合的细胞靶向信号肽并被选择将 the GlcNAc 转移酶 II 活 性靶向宿主细胞的 ER 或高尔基体 )。重组糖蛋白经过宿主细胞的 ER 或高尔基体产生包 含 GlcNAc2Man3GlcNAc2(G0) 糖形的重组糖蛋白, 例如包含主要 GlcNAc2Man3GlcNAc2 糖形的 重组糖蛋白组合物。美国专利号 7,029,872 和美国公开的专利申请号 2004/0018590 和 2005/0170452 公开了能够产生包含 GlcNAc2Man3GlcNAc2 糖形的糖蛋白的低等真核生物宿 主细胞。上述细胞产生的糖蛋白可以体外用氨基己糖苷酶处理以产生包含 Man3GlcNAc2 糖 形的重组糖蛋白。 这些宿主细胞当进一步如本文所教导的被基因工程化为表达半乳糖激酶 活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半 乳糖通透酶活性时, 能够利用半乳糖作为碳源。
     最 后, 紧接前述宿主细胞另外包括半乳糖基转移酶催化结构域 ( 其融合至 通常不与催化结构域结合的细胞靶向信号肽并被选择将半乳糖基转移酶活性靶向 宿 主 细 胞 的 ER 或 高 尔 基 体 )。 重 组 糖 蛋 白 经 过 宿 主 细 胞 的 ER 或 高 尔 基 体 产 生 包 含 GalGlcNAc2Man3GlcNAc2(G1) 或 Gal2GlcNAc2Man3GlcNAc2(G2) 糖 形 或 其 混 合 物 的 重 组 糖 蛋 白, 例 如 包 含 主 要 GalGlcNAc2Man3GlcNAc2(G1) 糖 形 或 Gal2GlcNAc2Man3GlcNAc2(G2) 糖 形或其混合物的重组糖蛋白组合物。美国专利号 7,029,872 和美国公开的专利申请 号 2006/0040353 公 开 了 能 够 产 生 包 含 Gal2GlcNAc2Man3GlcNAc2 糖 形 的 糖 蛋 白 的 低 等 真核生物宿主细胞。上述细胞产生的糖蛋白可以体外用半乳糖苷酶处理以产生包含 GlcNAc2Man3GlcNAc2 糖形的重组糖蛋白, 例如包含主要 GlcNAc2Man3GlcNAc2 糖形的重组糖蛋 白组合物。这些宿主细胞当进一步如本文所教导的被基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通 透酶活性时, 能够利用半乳糖作为碳源并能够生产这样的糖蛋白, 其中含有半乳糖的 N- 聚 糖的比例大于未被基因工程化为包括上述 Leloir 途径酶的宿主细胞中的比例。
     在另一实施方案中, 紧接前述宿主细胞 ( 其如本文所公开的能够产生具有半乳糖 末端的复合 N- 聚糖并能够同化半乳糖作为碳源 ) 可另外包括唾液酸转移酶催化结构域 ( 其融合至通常不与催化结构域结合的细胞靶向信号肽并被选择将唾液酸转移酶活性靶向 宿主细胞的 ER 或高尔基体 )。重组糖蛋白经过宿主细胞的 ER 或高尔基体产生包含主要 NANA2Gal2GlcNAc2Man3GlcNAc2 糖形或 NANAGal2GlcNAc2Man3GlcNAc2 糖形或其混合物的重组 糖蛋白。对于低等真核生物宿主细胞例如酵母和丝状真菌, 有用的是宿主细胞另外包括提 供 CMP- 唾液酸用于转移至 N- 聚糖的方法。美国公开的专利申请号 2005/0260729 公开了 基因工程化低等真核细胞以具有 CMP- 唾液酸合成途径的方法, 和美国公开的专利申请号 2006/0286637 公开了基因工程化低等真核细胞以产生唾液酸化的糖蛋白的方法。 这些宿主 细胞当进一步如本文所教导的被基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差向 异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性时, 能够利 用半乳糖作为碳源并能够生产这样的糖蛋白, 其中含有半乳糖的 N- 聚糖的比例大于未被 基因工程化为包括上述 Leloir 途径酶的宿主细胞中的比例。
     在另一实施方案中, 产生主要具有 GlcNAcMan5GlcNAc2 N- 聚糖的糖蛋白的宿主细胞另外包括半乳糖基转移酶催化结构域 ( 其融合至通常不与催化结构域结合的细胞靶向 信号肽并被选择将半乳糖基转移酶活性靶向宿主细胞的 ER 或高尔基体 )。 重组糖蛋白经过 宿主细胞的 ER 或高尔基体产生包含主要 GalGlcNAcMan5GlcNAc2 糖形的重组糖蛋白。 这些宿 主细胞当进一步如本文所教导的被基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差 向异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性时, 能够 利用半乳糖作为碳源。
     在另一实施方案中, 紧接前述宿主细胞 ( 其如本文所公开的能够产生具有半乳 糖末端的杂合 N- 聚糖并能够同化半乳糖作为碳源 ) 可另外包括唾液酸转移酶催化结构 域 ( 其融合至通常不与催化结构域结合的细胞靶向信号肽并被选择将唾液酸转移酶活性 靶向宿主细胞的 ER 或高尔基体 )。重组糖蛋白经过宿主细胞的 ER 或高尔基体产生包含 NANAGalGlcNAcMan5GlcNAc2 糖形的重组糖蛋白。这些宿主细胞当进一步如本文所教导的被 基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿 苷酰转移酶活性以及任选地半乳糖通透酶活性时, 能够利用半乳糖作为碳源。
     多种前述宿主细胞另外包括一个或多个糖转运蛋白, 例如 UDP-GlcNAc 转运蛋白 ( 例如乳酸克鲁维酵母和小家鼠 (Mus musculus)UDP-GlcNAc 转运蛋白 )、 UDP- 半乳糖转运 蛋白 ( 例如黑腹果蝇 UDP- 半乳糖转运蛋白 ) 和 CMP- 唾液酸转运蛋白 ( 例如人唾液酸转运 蛋白 )。 因为低等真核生物宿主细胞例如酵母和丝状真菌缺乏上述转运蛋白, 优选的是低等 真核生物宿主细胞例如酵母和丝状真菌被基因工程化为包括上述转运蛋白。
     宿主细胞另外包括这样的细胞, 其通过删除或破坏一个或多个 β- 甘露糖基转移 酶基因 ( 例如 BMT1, BMT2, BMT3 和 BMT4) 被基因工程化为消除具有 α- 甘露糖苷酶 - 抗性 的 N- 聚糖的糖蛋白 ( 参见, 美国公开的专利申请号 2006/0211085) 和通过删除或破坏磷酸 甘露糖基转移酶基因 PNO1 和 MNN4B 之一或二者被基因工程化为消除具有磷酸甘露糖残基 的糖蛋白 ( 参见例如, 美国专利号 7,198,921 和 7,259,007), 在另外的方面, 还可包括删除 或破坏 MNN4A 基因。破坏包括破坏编码特定酶的开放读码框或利用干扰 RNA、 反义 RNA 或 类似物破坏编码一种或多种 β- 甘露糖基转移酶和 / 或磷酸甘露糖基转移酶的开放读码框 的表达或消除编码一种或多种 β- 甘露糖基转移酶和 / 或磷酸甘露糖基转移酶的 RNA 的翻 译。宿主细胞可另外包括任意一种修饰为产生特定 N- 聚糖结构的前述宿主细胞。
     宿主细胞另外包括这样的低等真核细胞 ( 例如酵母例如巴斯德毕赤酵母 ), 其通 过删除或破坏一个或多个蛋白 O- 甘露糖基转移酶 (Dol-P-Man : 蛋白 (Ser/Thr) 甘露糖基 转移酶基因 )(PMT) 被基因修饰以控制糖蛋白的 O- 糖基化 ( 参见美国专利号 5,714,377) 或如公开的国际申请号 WO 2007061631 中公开的在 Pmtp 抑制剂和 / 或 α- 甘露糖苷酶存 在下生长, 或二者。 破坏包括破坏编码 Pmtp 的开放读码框或利用干扰 RNA、 反义 RNA 或类似 物破坏编码一个或多个 Pmtp 的开放读码框的表达或消除编码一个或多个 Pmtp 的 RNA 的翻 译。宿主细胞可另外包括任意一种修饰为产生特定 N- 聚糖结构的前述宿主细胞。
     Pmtp 抑制剂包括但不限于苯亚甲基噻唑烷二酮类。 可以利用的苯亚甲基噻唑烷二 酮的实例是 5-[[3, 4- 双 ( 苯基甲氧基 ) 苯基 ] 亚甲基 ]-4- 氧代 -2- 硫代 -3- 噻唑烷乙酸 ; 5-[[3-(1- 苯基乙氧基 )-4-(2- 苯基乙氧基 )] 苯基 ] 亚甲基 ]-4- 氧代 -2- 硫代 -3- 噻唑 烷乙酸和 5-[[3-(1- 苯基 -2- 羟基 ) 乙氧基 )-4-(2- 苯基乙氧基 )] 苯基 ] 亚甲基 ]-4- 氧 代 -2- 硫代 -3- 噻唑烷乙酸 .在具体实施方案中, 至少一个内源 PMT 基因的功能或表达被降低、 破坏或缺失。例 如, 在具体的实施方案中, 至少一个选自 PMT1、 PMT2、 PMT3 和 PMT4 基因的内源 PMT 基因的功 能或表达被降低、 破坏或缺失 ; 或在一个或多个 PMT 抑制剂存在下培养宿主细胞。 在另外的 实施方案中, 宿主细胞包括一个或多个 PMT 基因缺失或破坏以及在一个或多个 Pmtp 抑制剂 存在下培养宿主细胞。在这些实施方案的具体方面, 宿主细胞还表达分泌的 α-1, 2- 甘露 糖苷酶。
     PMT 缺失或破坏和 / 或 Pmtp 抑制剂通过降低 O- 糖基化占据 (occupancy) 即通过 降低在糖蛋白上被糖基化的 O- 糖基化位点的总数来控制 O- 糖基化。进一步添加细胞分泌 的 α-1, 2- 甘露糖苷酶降低糖蛋白上 O- 聚糖的甘露糖链长度来控制 O- 糖基化。因此, 将 PMT 缺失或破坏和 / 或 Pmtp 抑制剂与分泌的 α-1, 2- 甘露糖苷酶的表达组合通过降低占据 和链长度来控制 O- 糖基化。在具体的情况中, 确定 PMT 缺失或破坏、 Pmtp 抑制剂和 α-1, 2- 甘露糖苷酶的具体组合, 经验上是因为具体的异源糖蛋白 ( 例如 Fab 和抗体 ) 可通过 具有不同效率程度的高尔基体被表达和转运, 因此可需要 PMT 缺失或破坏、 Pmtp 抑制剂和 α-1, 2- 甘露糖苷酶的具体组合。 在另一方面, 编码一个或多个内源甘露糖基转移酶的基因 被缺失。该缺失可以与提供分泌的 α-1, 2- 甘露糖苷酶和 / 或 PMT 抑制剂组合或可以代替 提供分泌的 α-1, 2- 甘露糖苷酶和 / 或 PMT 抑制剂。
     因此, O- 糖基化的控制可以用于在本文公开的宿主细胞中以更高的总产量或适当 组装的糖蛋白的产量生产具体糖蛋白。 O- 糖基化的降低或消除看起来具有组装和转运完整 抗体和 Fab 片段的优势效果, 因为它们穿越分泌途径和被转运至细胞表面。因此, 在 O- 糖 基化被控制的细胞中, 适当组装的抗体或 Fab 片段的产率比在 O- 糖基化未被控制的宿主细 胞中得到的产率增加。
     因 此, 预 期 的 是 已 被 基 因 修 饰 的 宿 主 细 胞, 以 产 生 糖 蛋 白, 其中在糖蛋白上 的 主 要 N- 聚 糖 包 括 但 不 限 于 Man8GlcNAc2、 Man7GlcNAc2、 Man6GlcNAc2、 Man5GlcNAc2、 GlcNAcMan5GlcNAc2、 GalGlcNAcMan5GlcNAc2、 NANAGalGlcNAcMan5GlcNAc2、 Man3GlcNAc2、 GlcNAc (1-4) Man 2 GlcNAc 2 、Gal (1-4) GlcNAc (1-4) Man 3 GlcNAc 2 、NANA (1-4) Gal (1-4) GlcNAc (1-4) Man3GlcNAc2。 另外包括的是这样的宿主细胞, 其产生具有前述 N- 聚糖的具体混合物的糖蛋 白。
     本文中的宿主细胞和方法用于产生广泛的重组蛋白和糖蛋白。 可以在本文公开的 宿主细胞中产生的重组蛋白和糖蛋白的实例包括但不限于红细胞生成素 (EPO), 细胞因子 例如干扰素 α、 干扰素 β、 干扰素 γ 和干扰素 ω, 和粒细胞集落刺激因子 (GCSF), GM-CSF, 凝固因子例如因子 VIII、 因子 IX 和人蛋白 C, 抗凝血酶 III, 凝血酶, 可溶性 IgE 受体 α- 链, 免疫球蛋白例如 IgG、 IgG 片段、 IgG 融合体和 IgM, 免疫粘附素和其它 Fc 融合蛋白例如可 溶性 TNF 受体 -Fc 融合蛋白, RAGE-Fc 融合蛋白, 白细胞介素, 尿激酶, 糜蛋白酶和尿胰蛋白 酶抑制剂, IGF- 结合蛋白, 表皮生长因子, 生长激素释放因子, 膜联蛋白 V 融合蛋白, 制管张 素, 血管内皮生长因子 -2, 骨髓样前体抑制因子 -1, 骨保护蛋白, α-1- 抗胰蛋白酶, 甲胎蛋 白, DNA 酶 II, 人纤溶酶原的三环 3, 葡糖脑苷脂酶, TNF 结合蛋白 1, 促卵泡激素, 细胞毒性 T 淋巴细胞相关抗原 4-Ig, 跨膜激活剂和钙调节剂和亲环蛋白配体, 胰高血糖素样蛋白 1 和 IL-2 受体激动剂。
     本文公开的本发明的重组宿主细胞特别用于生产抗体、 Fc 融合蛋白等, 期望的是与在进行如本文所教导的修饰之前的宿主细胞中获得的抗体组合物的半乳糖百分比相比, 在重组宿主细胞中提供增加的含有半乳糖的 N- 聚糖的百分比的抗体组合物。一般而言, 宿 主细胞能够使得这样的抗体组合物产生, 其中所述 G0 ∶ G1/G2 糖形的比值小于 2 ∶ 1。可 以在本文中的宿主细胞中产生并具有 G0 ∶ G1/G2 的比值小于 2 ∶ 1 的抗体的实例包括但不 限于人抗体、 人源化的抗体、 嵌合抗体、 重链抗体 ( 例如骆驼 (camel 或 llama))。具体抗体 包括但不限于以其通用名称 ( 靶 ) 引用的以下抗体 : 莫罗单抗 -CD3( 抗 -CD3 受体抗体 )、 阿 昔单抗 ( 抗 -CD417E3 抗体 )、 利妥昔单抗 ( 抗 -CD20 抗体 )、 达珠单抗 ( 抗 -CD25 抗体 )、 巴 利昔单抗 ( 抗 -CD25 抗体 )、 帕利珠单抗 ( 抗 -RSV( 呼吸道合胞病毒 ) 抗体 )、 英夫利昔单 抗 ( 抗 -TNFα 抗体 )、 曲妥珠单抗 ( 抗 -Her2 抗体 )、 吉姆单抗奥佐米星 ( 抗 -CD33 抗体 )、 阿仑单抗 ( 抗 -CD52 抗体 )、 替伊莫单抗 ( 抗 -CD20 抗体 )、 阿达木单抗 ( 抗 -TNFα 抗体 )、 131 奥马珠单抗 ( 抗 -IgE 抗体 )、 托西莫单抗 - I( 抗 -CD20 抗体的碘化的衍生物 )、 依法利珠 单抗 ( 抗 -CD11a 抗体 )、 西妥昔单抗 ( 抗 -EGF 受体抗体 )、 戈利木单抗 ( 抗 -TNFα 抗体 )、 贝伐单抗 ( 抗 VEGF-A 抗体 ) 及其变体。可以在本文中的宿主细胞中产生的 Fc- 融合蛋白 的实例包括但不限于依那西普 (TNFR-Fc 融合蛋白 )、 FGF-21-Fc 融合蛋白、 GLP-1-Fc 融合 蛋白、 RAGE-Fc 融合蛋白、 EPO-Fc 融合蛋白、 ActRIIA-Fc 融合蛋白、 ActRIIB-Fc 融合蛋白、 胰高血糖素 -Fc 融合物、 泌酸调节肽 -Fc- 融合物及其类似物和变体。 本文公开的重组细胞可用于产生适合于化学缀合异源的肽或药物分子的抗体和 Fc 片段。例如 WO2005047334、 WO2005047336、 WO2005047337 和 WO2006107124 公开了将肽 或药物分子与 Fc 片段化学缀合。EP1180121、 EP1105409 和 US6593295 公开了将血液组分 与肽等化学缀合, 其包括完整抗体。
     如本文所教导的宿主细胞和 / 或编码 Leloir 途径酶的多种组合的质粒载体可以 作为试剂盒提供, 其提供用于产生表达异源蛋白的重组巴斯德毕赤酵母的选择系统。巴斯 德毕赤酵母宿主细胞被基因工程化为表达选自半乳糖激酶、 UDP- 半乳糖 -4- 差向异构酶和 半乳糖 -1- 磷酸尿苷酰转移酶的 Leloir 途径酶中的一种或两种。任选地, 宿主细胞也可表 达半乳糖通透酶。克隆载体包括多克隆位点和编码宿主细胞中未提供的 Leloir 途径酶的 表达盒。载体可另外包括在多克隆位点两侧的巴斯德毕赤酵母可操纵的启动子和转录终 止序列以及可另外包括用于将载体靶向到宿主细胞基因组中的具体位置的靶向序列。在 一些实施方案中, 试剂盒提供这样的载体, 其编码所有三个 Leloir 途径酶 ( 半乳糖激酶、 UDP- 半乳糖 -4- 差向异构酶和半乳糖 -1- 磷酸尿苷酰转移酶 ) 和包括多克隆位点和缺乏三 种 Leloir 途径酶的宿主细胞。试剂盒应另外包括说明书、 载体图谱等。
     以下实施例意图是促进对本发明的进一步理解。
     实施例 1
     在该实施例中, 通常根据 Davidson 等人在美国公开的申请号 2006/0040353 中公 开的方法构建能够产生含有半乳糖的 N- 聚糖的巴斯德毕赤酵母宿主细胞。本文的方法可 用于将其他物种的通常不能利用半乳糖作为碳源的重组宿主细胞变成能够利用半乳糖作 为单一碳源的重组宿主细胞。
     半 乳 糖 基 转 移 酶 I 嵌 合 酶。 利 用 PCR 引 物 RCD192(5’ -GCCGCGACCTGAGCC GCCTGCCCCAAC-3’ (SEQ ID NO : 1)) 和 RCD186(5’ -CTAGCTCGGTGTCCCGATGTCCACTGT-3’ (SEQ ID NO : 2)) 从人肾脏 cDNA(Clontech)PCR 扩增智人 (Homo sapiens)β-1, 4- 半乳糖基转移
     酶 I 基因 (hGalTI, Genbank AH003575)。该 PCR 产物被克隆至 pCR2.1 载体 (Invitrogen) 并测序。从该克隆进行 PCR 重叠突变发生用于三个目的 : 1) 去除开放读码框内的 NotI 位 点同时维持野生型蛋白序列, 2) 在内源跨膜结构域的立即下游截短蛋白以仅提供催化结构 域和 3) 在 5’ 和 3’ 端分别引入 AscI 和 PacI 位点用于克隆。为了进行 PCR 重叠突变发生, 利用 PCR 引物 RCD198(5’ -CTTAGGCGCGCCGGCCGCGACCTGAGCCGCCTGCCC-3’ (SEQ ID NO : 3)) 和 RCD201(5’ -GGGGCATATCTGCCGCCCATC-3’ (SEQ ID NO : 4))PCR 扩增基因的 5’ 端直至 NotI 位点和利用 PCR 引物 RCD200(5’ -GATGGGCGGCAGATATGCCCC-3’ (SEQ ID NO : 5)) 和 RCD199( 5’ -CTTCTTAATTAACTAGCTCGGTGTCCCGATGTCCAC-3’ (SEQ ID NO : 6))PCR 扩增 3’ 端。用引物 RCD198 和 RCD199 将产物在一起重叠以重合成具有野生型氨基酸序列同时去除 NotI 位点的 截短的编码半乳糖基转移酶的开放读码框 (ORF)。新的 hGalTIβPCR 催化结构域产物被克 隆至 pCR2.1 载体 (Invitrogen, Carlsbad, CA) 并测序。引入的 AscI 和 PacI 位点用它们 识别的限制酶切割并将 DNA 片段亚克隆进质粒 pRCD259 的 PpGAPDH 启动子下游以产生质粒 pRCD260。编码 hGalTI43 催化结构域 ( 缺乏最先的 43 个氨基酸 ; SEQ ID NO : 50) 的核苷酸 序列显示于 SEQ ID NO : 49。
     来自酿酒酵母、 巴斯德毕赤酵母和乳酸克鲁维酵母的将蛋白靶向到高尔基体中的 各种位置的酵母引导序列文库被连接到该载体 NotI 和 AscI 位点之间, 从而将这些引导 编码序列符合读框地与编码 hGalTIβ43 催化结构域的开放读码框融合。上述 GalT 融合 蛋白的组合文库在 YSH44 中表达并通过从来自各个转化子的纯化的 K3 释放 N- 聚糖和用 MALDI-TOF MS 测定它们各自分子量分析得到的转化子。 巴斯德毕赤酵母菌株 YSH44 表达人 纤溶酶原的三环 3 结构域 (K3), 其为实质上均一的具有双触角末端 GlcNAc 残基的复合糖形 (GlcNAc2Man3GlcNAc2, 参见图 1)。活性构建体之一是 Mnn2-hGalTIβ43, 其编码融合蛋白, 所述融合蛋白包含酿酒酵母 Mnn2 靶向肽的的 N- 末端 ( 氨基酸 1-36(53)SEQ ID NO : 20) 融 合至 hGalTIβ43 催化结构域的 N- 末端 ( 氨基酸 44-398 ; SEQ ID NO : 50)。引导序列含有 酿酒酵母 MNN2 基因最先的 108bp 并且该序列确实已被插入 pRCD260 的 NotI 和 AscI 位点 之间以产生质粒 pXB53。用 XbaI 线性化质粒 pXB53 并转化至酵母菌株 YSH44 以产生菌株 YSH71。菌株 YSH44 已描述在美国公开的申请号 20070037248、 20060040353、 20050208617 和 20040230042 中以及菌株 YSH71 已描述在美国公开的申请号 20060040353 中。
     如 图 3C 所 示, 菌 株 YSH71 产 生 的 一 小 部 分 ( 约 10 % )N- 聚 糖 具 有 与 单 个 半 乳 糖 添 加 到 K3 上 的 GlcNAc2Man3GlcNAc2(G0)N- 聚 糖 底 物 一 致 的 质 量 以 产 生 而其余的 N- 聚糖与母本菌株 YSH44 产生的 N- 聚糖相 GalGlcNAc2Man3GlcNAc2(G1)N- 聚糖, 同 ( 图 3B)。图 3A 显示野生型酵母中产生的 N- 聚糖。
     我们认为对于不完全的半乳糖转移存在几种解释。这些解释包括较差的 UDP- 半 乳 糖 转 运、 较 低 的 内 源 水 平 UDP- 半 乳 糖 或 亚 最 适 的 (suboptimal)GalT 活 性。 看 起 来 半乳糖转移到 N- 聚糖上可能较低, 因为菌株可能需要转运蛋白以将 UDP- 半乳糖从细 胞 质 转 位 至 高 尔 基 体 (Ishida 等 人, J.Biochem.120 : 1074-1078(1996) ; Miura 等 人, J.Biochem(Tokyo)120 : 236-241(1996) ; Tabuchi 等 人, Biochem.Biophys.Res.Com.232 : 121-125(1997) ; Segawa 等人, FEBS Letts.451 : 295-298(1999))。转运蛋白是具有多个 跨膜结构域的复合蛋白, 其可以不适当地定位于异源宿主。但是, 几种糖核苷酸转运蛋 白, 包括 UDP- 半乳糖转运蛋白已在异源系统中活跃表达 (Sun-Wada 等人, J.Biochem.(Tokyo)123 : 912-917(1998) ; Segawa 等 人 Eur.J.Biochem.269 : 128-138(2002) ; Kainuma 等 人, Glycobiol.9 : 133-141(1999) ; Choi 等 人, Proc Natl Acad Sci U S A 100(9) : 5022-5027(2003))。为确保 UDP- 半乳糖有效转运至高尔基体, 编码 UDP- 半乳糖转运蛋 白的黑腹果蝇基因 DmUGT(GenBank 登记号 AB055493) 被克隆并将该克隆如下转化至表达 MNN2-hGalTIβ43 构建体的菌株 YSH71。
     UDP- 半乳糖转运蛋白的克隆。利用 PCR 引物 DmUGT-5’ (5’ -GGCTCGAGCGGCCGCCA CCATGAATAGCATACACATGAACGCCAATACG-3’ (SEQ ID NO : 7)) 和 DmUGT-3’ (5’ -CCCTCGAGTTAA TTAACTAGACGCGCGGCAGCAGCTTCTCCTCATCG-3’ (SEQ ID NO : 8)), 从黑腹果蝇 cDNA 文库 (UC Berkeley Drosophila 基因组 Project, 卵巢 λ-ZAP 文库 GM)PCR 扩增编码 UDP 半乳糖转运 蛋白的黑腹果蝇基因 (GenBank AB055493), 称为 DmUGT, 并将 PCR 扩增的 DNA 片段克隆至 pCR2.1(Invitrogen, Carlsbad, CA) 并测序。然后利用 NotI 和 PacI 位点将该开放读码框 亚克隆至质粒 pRCD393 的 PpOCH1 启动子下游 NotI 和 PacI 位点之间以产生质粒 pSH263。 编码 DmUGT 的核苷酸序列显示于 SEQ ID NO : 37 和 DmUGT 的氨基酸序列显示于 SEQ ID NO : 38。将该质粒用 AgeI 线性化并转化至菌株 YSH71 以产生菌株 YSH80。但是, 当编码 DmUGT 的质粒被转化至 YSH71 时, 发现 K3 的 N- 聚糖分布情况没有显著变化。因此, 我们决定将精 力集中于增强 UDP- 半乳糖细胞内库 (pool)。
     因为巴斯德毕赤酵母不能同化半乳糖作为碳源 (Kurtzman Pichia.The Yeasts : A Taxonomic Study.C.P.a.F.Kurtzman, J.W.Amsterdam, Elsevier Science Publ. : 273-352(1998)), 我们推测菌株中的 UDP- 半乳糖库可能不充分。在半乳糖同化生物包括 细菌和哺乳动物中保守的 UDP- 半乳糖 4- 差向异构酶催化 Leloir 途径的第三步。该酶通 常位于真核细胞的细胞质并负责 UDP- 葡萄糖和 UDP- 半乳糖的可逆转换 (Allard 等人, 细 胞 .Mol.Life Sci.58 : 1650-1665(2001))。我们推论异源 UDP- 半乳糖 4- 差向异构酶的表 达将产生细胞质 UDP- 半乳糖库, 去转运至高尔基体后, 将使得半乳糖转移酶将半乳糖转移 到 N- 聚糖上。
     UDP- 半 乳 糖 4- 差 向 异 构 酶 的 克 隆。 从 粟 酒 裂 殖 酵 母 (Schizosaccharomyces pombe) 克隆之前未表征的基因, 以下命名为 SpGALE, 其编码与已知的 UDP- 半乳糖 4- 差 向异构酶具有显著同一性的蛋白。利用 PCR 引物 GALE2-L(5’ -ATGACTGGTGTTCATGAAGGG -3’ (SEQ ID NO : 9)) 和 GALE2-R(5’ -TTACTTATA TGTCTTGGTATG-3’ ((SEQ ID NO : 10)), 从粟酒裂殖酵母 (ATCC24843) 基因组 DNA PCR 扩增编码预测的 UDP 半乳糖 -4- 差向异 构 酶 (GenBank NC_003423) 的 1.1Kb 粟 酒 裂 殖 酵 母 基 因, 称 为 SpGALE。PCR 扩 增 的 产 物 被 克 隆 至 pCR2.1(Invitrogen, Carlsbad, CA) 并 测 序。 测 序 显示 在 +66 位 存 在 内 含 子 (175bp)。 为 了 消 除 内 含 子, 设 计 上 游 PCR 引 物 GD1(5’ -GCGGCCGCATGA CTGGTGTTCA TGAAGGGACT GTGTTGGTTACTGGCGGCGC TGGTTATATA GGTTCTCATA CGTGCGTTGTTTTGTTAGAA AA-3’ ((SEQ ID NO : 11)), 其具有 NotI 位点, 位于内含子上游第 66 个碱基处, 然后在内含 子之前 20 个碱基和下游 PCR 引物 GD2(5’ -TTAATTAATT ACTTATATGT CTTGGTATG-3’ ((SEQ ID NO : 12)) 具有 PacI 位点。利用引物 GD1 和 GD2 以从 pCR2.1 亚克隆扩增 SpGALE 内含 子缺少的基因并将产物再克隆至 pCR2.1 并测序。然后将 SpGALE 在 NotI 和 PacI 位点之 间分别亚克隆至质粒 pRCD402 和 pRCD403 以产生质粒 pRCD406(POCH1-SpGALE-CYC1TT) 和 pRCD407(PSEC4-SpGALE-CYC1TT)。这些质粒已在之前的美国公开的申请号 20060040353 中描述。编码不含内含子的 SpGALE 的核苷酸序列显示于 SEQ ID NO : 35 和氨基酸序列显示于 SEQ ID NO : 36。
     人 UDP 半乳糖 -4- 差向异构酶 (hGalE) 具有 SEQ ID NO : 48 所示的氨基酸序列, 其 由 SEQ ID NO : 47 所示的核苷酸序列编码。可以利用 hGalE 代替 SpGALE。
     双 GalT/ 半乳糖 -4- 差向异构酶构建体的构建。含有 ScMNN2-hGalTIβ43 融合基 因的质粒 pXB53 用 XhoI 线性化并用 T4DNA 聚合酶产生平端。然后用 XhoI 和 SphI 并将末 端用 T4DNA 聚合酶产生平端从质粒 pRCD406 去除 PPpOCH1SpGALE-CYC1TT 表达盒, 并将片段插 入上述 pXB53 质粒以产生质粒 pRCD425。将该质粒用 XbaI 线性化并转化至菌株 YSH44 以 产生菌株 RDP52, 其已在之前的美国公开的申请号 20060040353 中描述。通过 MALDI-TOF MS 分析从几种转化子分离的纯化的 K3 上的 N- 聚糖。如图 3D 所示, 发现相当比例的 N- 聚 糖已获得与两个 ( 约 20 % G2 : Gal2GlcNAc2Man3GlcNAc2) 或单个半乳糖部分 ( 约 40 % G1 : Gal1GlcNAc2Man3GlcNAc2) 添加到 G0(GlcNAc2Man3GlcNAc2) 底物上的一致的质量, 而其余的 N- 聚糖保持与 YSH44 母本中发现的质量没有改变 ( 图 3B), 即 G0。
     三 GalT/ 半乳糖 -4- 差向异构酶 /UDP 半乳糖转运蛋白构建体的构建。 通过用 SacI R 消化将含有 POCH1-DmUGT-CYC1TT 的 G418 质粒 pSH263 线性化并用 T4 DNA 聚合酶进行末端 平端化。通过用 XhoI 和 SphI 消化将 PSEC4-SpGALE-CYC1TT 表达盒从质粒 pRCD407 去除并用 T4 DNA 聚合酶进行末端平端化。 然后将平末端的 SpGALE 片段插入上述 pSH263 以产生质粒 pRCD446。通过用 BglII/BamHI 消化从质粒 pXB53 释放 PGAPDHScMNN2-hGalTIβ43-CYC1TT 表 达盒并用 T4 DNA 聚合酶进行末端平端化。 然后将平末端的 hGalTI-53 插入 pRCD446 的平端 的 EcoRI 位点以产生质粒 pRCD465, 其是含有 hGalTI-53、 SpGALE 和 DmUGT 的三 G418R 质粒。 用 AgeI 线性化质粒 pRCD465 并转化至菌株 YSH44 以产生菌株 RDP80, 其如美国公开的申请 号 20060040353 中描述的。通过 MALDI-TOF MS 分析从菌株产生的分泌的 K3 释放的 N- 聚 糖。发现 N- 聚糖具有定量添加两个半乳糖残基到 G0 底物上一致的质量以产生人半乳糖基 化、 双触角复合 N- 聚糖 G2(Gal2GlcNAc2Man3GlcNAc2)( 图 3E)。 该 N- 聚糖的体外 β- 半乳糖 苷酶消化产生对应于去除两个半乳糖残基的降低的质量, 得到 G0(GlcNAc2Man3GlcNAc2)( 图 3F)。
     另外, 在 CMP- 唾液酸存在下用大鼠 α-2, 6-N- 唾液酸转移酶体外处理从菌株 RDP80 纯化的 K3 产生几乎均一地转换成 NANA2Gal2GlcNAc2Man3GlcNAc2( 图 3G)。这些结果 表明通过 (1) 充分的细胞内 UDP- 半乳糖库的代谢工程, (2) 活性的和适当定位的 GalT 的 表达和 (3) 通过活性 UDP- 半乳糖转运蛋白的 UDP- 半乳糖至高尔基体的易位, 可获得在巴 斯德毕赤酵母产生的复合 N- 聚糖高效延伸。但是, 半乳糖转移的效率通过进一步包括将 Leloir 途径的酶引入宿主细胞来改进, 如实施例 2 所示。
     菌株和培养基。大肠杆菌菌株 TOP10 或 DH5α 用于重组 DNA 工作。来源于菌株 JC308(J.Cregg, Claremont, CA) 的巴斯德毕赤酵母菌株 YSH44(Hamilton 等人, Science 301 : 1244-1246(2003)) 用于产生多种酵母菌株。酵母菌株的转化通过如前报道的电穿孔 进行 (Cregg, 等人, Mol.Biotechnol.16 : 23-52(2000))。在室温在 96 孔板形式中进行蛋白 表达 ( 除了生物反应器实验 ), 使用缓冲的甘油 - 复合培养基 (BMGY), 由 1%酵母提取物, -5 2 %蛋白胨, 100mM 磷酸钾缓冲液, pH 6.0, 1.34 %酵母氮源, 4X10 %生物素和 1 %甘油组 成, 作为生长培养基 ; 以及缓冲的甲醇 - 复合培养基 (BMMY), 由 1%甲醇替代甘油的 BMGY 组成作为诱导培养基。YPD 是 1%酵母提取物、 2%蛋白胨、 2%葡萄糖和 2%琼脂。
     限 制 和 修 饰 酶 来 自 New England BioLabs(Beverly, MA)。 寡 核 苷 酸 获 自 Integrated DNA Technologies(Coralville, IA)。β- 半乳糖苷酶获自 QAbio(San Mateo, CA)。 96 孔裂解物清除板 (lysate-clearing plate) 来自 Promega(Madison, WI)。 蛋白 - 结 合 96 孔板来自 Millipore(Bedford, MA)。盐和缓冲剂来自 Sigma(St.Louis, MO)。MALDI 基质来自 Aldrich(Milwaukee, WI)。
     蛋 白 纯 化 和 N- 聚 糖 分 析。K3 纯 化 如 前 述 (Choi 等 人, Proc.Natl.Acad.Sci. U.S.A.100 : 5022-5027(2003))。 利 用 获 自 New England BioLabs(Beverly, MA) 的 N- 糖 苷酶 F 从 K3 释放 N- 聚糖, 如前述 (Choi 等人, ibid.)。利用 Applied Bio 系统 (Foster City, CA) 的 Voyager DE PRO 线性 MALDI-TOF 质谱仪测定聚糖的分子量, 如前述 (Choi 等 人, ibid.)。
     生物反应器培养。用 1mL 的种子培养物 ( 参见摇瓶培养 ) 接种含有 150mL BMGY 培养基的 500mL 带挡板的容量瓶。在 24℃将接种物培养至 OD600 为 4-6( 大约 18 小时 )。 然后将来自接种培养物的细胞离心并重悬至 50mL 发酵培养基 ( 每升培养基 : CaSO4.2H2O 0.30g, K2SO46.00g, MgSO4.7H2O 5.00g,甘 油 40.0g, PTM1 盐 2.0mL,生 物 素 4x10-3g, H3PO4(85% )30mL, PTM1 盐每升 : CuSO4.H2O 6.00g, NaI0.08g, MnSO4.7H2O 3.00g, NaMoO4.2H2O 0.20g, H3BO3 0.02g, CoCl2.6H2O 0.50g, ZnCl2 20.0g, FeSO4.7H2O 65.0g, 生物素 0.20g, H2SO4(98% )5.00mL)。
     在 3 升碟形底 (1.5 升初始进料体积 )Applikon 生物反应器中进行发酵。 发酵罐在 24℃的温度下以分批补料模式运行, 并将 pH 控制在 4.5±0.1 利用 30%氢氧化铵。通过调 整搅拌速率 (450-900rpm) 和纯氧提供, 将溶解氧维持在 40%以上, 相对于在 1atm 下用空气 饱和。空气流动速率维持在 1vvm。当在分批培养期 (the batch phase) 初始甘油 (40g/L) 被耗尽时, 这是 DO 增加的指示, 将含有 12ml/L PTM1 盐的 50%甘油溶液以 12mL/L/h 的进料 速率补料直到达到所期望的生物质浓度。在半小时饥饿期后, 起始甲醇补料 ( 含有 12mL/L PTM1 的 100%甲醇 )。 甲醇进料速率用于控制发酵罐中甲醇浓度在 0.2-0.5%之间。 利用位 于发酵罐的排出气中 TGS 气体传感器 (TGS822, 来自 Figaro Engineering Inc.) 在线测量 甲醇浓度。每 8 小时对发酵罐中进行取样和分析生物质 (OD600, 湿细胞重和细胞计数 ), 剩 余碳源水平 ( 利用 Aminex 87H 通过 HPLC 测量甘油和甲醇 ) 和细胞外蛋白含量 ( 通过 SDS page 和 Bio-Rad 蛋白测定 )。
     体外 β- 半乳糖苷酶消化。来自 RDP80 的 N- 聚糖与 β1, 4- 半乳糖苷酶 (QA bio, San Mateo, CA) 在 50mM NH4HCO3, pH6.0 中在 37℃孵育 16-20 小时。
     体外唾液酸转移。从菌株 RDP80 纯化的 K3 用作唾液酸转移的底物。将 200μg 该蛋白与 50μg CMP- 唾液酸和 15mU 大鼠重组 α-(2, 6)-(N)- 唾液酸转移酶 ( 来自 EMD Biosciences(San Diego, CA, formerly Calbiochem)) 在 50mM NH4HCO3, pH6.0 中在 37℃孵 育 16-20 小时。然后通过 PNGaseF 消化释放 N- 聚糖并通过 MALDI-TOF MS 检测。
     实施例 2
     UDP- 半乳糖 4- 差向异构酶催化 Leloir 途径的第三步 ( 图 4)。如实施例 1 所示, 在糖工程化的巴斯德毕赤酵母菌株中编码该酶的基因的异源表达引起 UDP- 半乳糖细胞内 库的产生, 如表达该异源基因的菌株中半乳糖转移显著增加所证实的。但是, 还如所示的,仅添加该酶不能赋予巴斯德毕赤酵母菌株在半乳糖 ( 作为单一碳源 ) 上生长的能力 ( 参见 图 7, 菌株 RDP578-1)。因此, 将酿酒酵母中 Leloir 途径的其余酶引入实施例 1 的各种菌株 中。因此, 在该实施例中, 构建了能够利用半乳糖作为单一碳源的巴斯德毕赤酵母宿主细 胞。 本文的方法可用于将通常不能利用半乳糖作为碳源的其他物种的重组宿主细胞制备成 能够利用半乳糖作为单一碳源的重组宿主细胞。
     酿酒酵母 GAL1 的克隆。 利用 PCR 引物 PB158(5’ -TTAGCGGCCGCAGGAATGACTAAATCTC ATTCA-3’ (SEQ ID NO : 13)) 和 PB159(5’ -AACTTAATTAAGCTTATAATTCATATAGACAGC-3’ (SEQ ID NO : 14)), 从酿酒酵母基因组 DNA( 菌株 W303, 标准 smash 和 grab 基因组 DNA 制备 )PCR 扩增 编码半乳糖激酶 (GenBank NP_009576) 的酿酒酵母基因 ( 称为 ScGAL1), 将 PCR 扩增的 DNA 片段克隆至 pCR2.1(Invitrogen, Carlsbad, CA) 并测序。得到的质粒命名为 pRCD917。用 NotI 和 PacI 将编码半乳糖激酶的 DNA 片段从质粒释放并将 DNA 片段亚克隆进质粒 pGLY894 的巴斯德毕赤酵母 HHT1 强组成型启动子下游 NotI 和 PacI 位点之间以产生质粒 pGLY939。 半乳糖激酶具有 SEQ ID NO : 40 所示的氨基酸序列并由 SEQ ID NO : 39 所示的核苷酸序列编 码。
     酿酒酵母 GAL2 的克隆。利用 PCR 引物 PB156(5’ -TTAGCGGCCGC-3’ (SEQ ID NO : 15)) 和 PB157(5’ -AACTTAATTAA-3’ (SEQ ID NO : 16)) 从酿酒酵母基因组 DNA( 菌株 W303, 标准 “smash and grab” 基因组 DNA 制备 )PCR 扩增编码半乳糖通透酶 (GenBankNP_013182) 的酿酒酵母基因 ( 称为 ScGAL2), 将 PCR 扩增的 DNA 片段亚克隆进 pCR2.1(Invitrogen, Carlsbad, CA) 并测序。得到的质粒命名为 pPB290。用 NotI 和 PacI 将编码半乳糖通透酶 的 DNA 片段从质粒释放并将 DNA 片段亚克隆进质粒 pJN664 的 PpPMA1 启动子下游 NotI 和 PacI 位点之间以产生质粒 pPB292。半乳糖通透酶具有 SEQ ID NO : 44 所示的氨基酸序列并 由 SEQ ID NO : 43 所示的核苷酸序列编码。
     酿 酒 酵 母 GAL7 的 克 隆。 利 用 PCR 引 物 PB160(5’ -TTAGCGGCCGCAGGAATGAC TGCTGAAGAA TT-3’ (SEQ ID NO : 17)) 和 PB161(5’ -AACTTAATTA AGCTTACAGT CTTTGTAGAT AATC-3’ (SEQ ID NO : 18) 从酿酒酵母基因组 DNA( 菌株 W303, 标准 smash and grab 基因组 DNA 制备 )PCR 扩增编码半乳糖 -1- 磷酸尿苷酰转移酶 (GenBank NP_009574) 的酿酒酵母 基因 ( 称为 ScGAL7), 将 PCR 扩增的 DNA 片段克隆至 pCR2.1(Invitrogen, Carlsbad, CA) 并 测序。得到的质粒命名为 pRCD918。用 NotI 和 PacI 将编码半乳糖 -1- 磷酸尿苷酰转移酶 的 DNA 片段从质粒释放并将 DNA 片段亚克隆进质粒 pGLY143 的 PpPMA1 强组成型启动子下 游 NotI 和 PacI 位点之间以产生质粒 pGLY940。个别地, NotI 和 PacI 位点还用于亚克隆该 ORF 至质粒 pRCD830 巴斯德毕赤酵母 TEF1 强组成型启动子下游的 NotI/PacI 处以产生质 粒 pRCD929。半乳糖 -1- 磷酸尿苷酰转移酶具有 SEQ ID NO : 42 所示的氨基酸序列并由 SEQ ID NO : 41 所示的核苷酸序列编码。
     三 ScGAL1/ScGAL7/ScGAL2 构建体的构建。将来自 pGLY917 的 ScGAL1 开放读码 框亚克隆至 pJN702, 一种巴斯德毕赤酵母 his1 敲除载体, 具有巴斯德毕赤酵母 ARG1 选 择标记 (his1::ARG1, 参见美国专利号 7,479,389) 且还含有 PGAPDH- 启动子表达盒 ; 含有 PGAPDH-ScGAL1 融合的这种新的载体命名为 pRCD928。将来自 pGLY929 的 PTEF1-ScGAL7 表达盒 亚克隆至 pGLY928, 新的载体命名为 pGLY946a。下一步, 将来自 pRCD634 的 POCH1-DmUGT( 高 尔基体 UDP- 半乳糖转运蛋白 ) 表达盒亚克隆至 pGLY946a 以产生 pGLY956b。最后, 将来自pPB292 的 PGAPDH-ScGAL2 表达盒亚克隆至 pRCD956b 以产生质粒 pRCD977b( 参见图 6)。质粒 pRCD977b 含有 DmUGT、 ScGAL1、 ScGAL7 和 ScGAL2 表达盒并具有 ARG1 显性选择标记盒。
     双 ScGAL1/ScGAL7 构建体的构建。 将来自 pGLY939 的 PTEF1-ScGAL1 表达盒亚克隆至 pGLY941, 一种敲入载体, 具有巴斯德毕赤酵母 ARG1 选择标记、 TRP1 基因座敲入区、 还含有 PGAPDH-hGalTIβ 表达盒, 该新的载体命名为 pGLY952。将来自 pGLY940 的 PPMA1-ScGAL7 表达 盒亚克隆至 pGLY952, 新的载体命名为 pGLY955。最后, 将诺尔丝菌素抗性表达盒 (NATR) 从 pGLY597( 最初来自 pAG25, 来自 EROSCARF, Scientific Research and Development GmbH, Daimlerstrasse 13a, D-61352 Bad Homburg, Germany, 参见 Goldstein 等人, 1999, Yeast 15 : 1541) 亚克隆至 pGLY952 以产生质粒 pGLY1418( 参见图 12), 其含有 hGalTIβ、 ScGAL1 R 和 ScGAL7 表达盒并具有 NAT 显性选择标记盒。
     具有所有三个基因的单一整合质粒 pRCD977b( 图 6) 被转化至巴斯德毕赤酵母菌 株 RDP578-1 以产生菌株 RDP635-1、 -2 和 -3。菌株 RDP578-1 已含有异源基因和基因敲除 用于产生含有末端 β-1, 4- 半乳糖残基的人 N- 聚糖 ( 参见图 5 和实施例 3 用于构建体 )。 菌株 RDP578-1 也包括编码酿酒酵母 UDP- 半乳糖 4- 差向异构酶编码基因 ScGAL10 的表达 盒并表达测试蛋白人三环 3。得到的菌株 RDP635-1、 -2 和 -3 具有两个拷贝的 DmUGT 半乳 糖转运蛋白。 母 本 菌 株 RDP578-1 和 具 有 ScGAL1、 ScGAL2、 ScGAL7 和 ScGAL10 基 因 的 转 化 子 (RDP635-1、 -2 和 -3) 在含有葡萄糖、 半乳糖或无碳源的最低培养基生长五天然后拍照。有 意思的是, 尽管具有分泌具有半乳糖末端的 N- 聚糖的蛋白的能力, RDP578-1 显示出不能 同化半乳糖, 同时在葡萄糖上正常生长, 如野生型巴斯德毕赤酵母所期望的。但是, 表达 ScGAL1、 ScGAL2 和 ScGAL7 基因的转化子能够同化半乳糖, 如图 7 所示。如期望的, 在缺乏 碳源的平板上观察到最低生长。这些结果表明可以构建重组巴斯德毕赤酵母, 当与 Leloir 半乳糖同化途径的基础结构 ( 但不是调节 ) 元件重构时其可同化半乳糖作为碳源。
     在糖工程化的巴斯德毕赤酵母中表达的 Fc 第 297 位 Asn 残基上 N- 聚糖的测定。 人 IgG 的 Fc 部分在每个重链二聚体上含有单个 N- 聚糖位点 (Asn297, Kabat numbering), 其通常含有不同于其他分泌的人蛋白的 N- 聚糖分布情况。通常地, 天然存在的人抗体含有 具有末端 GlcNAc 和一定量末端半乳糖的 N- 聚糖, 其基于多种因素而不同, 并很少含有显著 量的末端唾液酸。在证明 N- 聚糖的高水平末端 β-1, 4- 半乳糖后, 我们试图测定在这类糖 工程化的酵母菌株产生的抗体上观察到的 N- 聚糖分布情况。因此, 用在 AOX1 启动子的控 制下编码人免疫球蛋白 G1(IgG1) 重链的 Fc 结构域或 C- 末端半部分的质粒 (pBK138) 转化 已被基因工程化为产生具有末端半乳糖的 N- 聚糖的巴斯德毕赤酵母菌株 (YGB02 ; 参见图 8 和实施例 4)。由 PCR 鉴定的选择的阳性克隆命名为 PBP317-36( 图 8 和实施例 4)。该菌株 在摇瓶中生长并用甲醇作为单一碳源诱导。通过离心收获上清并通过蛋白 A 亲和层析进行 纯化。 纯化的蛋白在 SDS-PAGE 上分离并进行考马斯染色。 观察到具有期望大小的标记的条 带。然后将纯化的蛋白进行 PNGase 消化并通过 MALDI-TOF MS 分析释放的 N- 聚糖。得到 的 N- 聚糖 ( 图 10A) 显示与具有末端 GlcNAc 的复合人核心结构 (G0 : GlcNAc2Man3GlcNAc2) 一致的主要质量, 较少种类具有单个末端半乳糖 (G1 : GalGlcNAc2Man3GlcNAc2) 和次要种类
    (minor 物种 ) 具有用半乳糖加帽复合种类的两个臂 (G2 : Gal2GlcNAc2Man3GlcNAc2)。这些 种类的质量不同于预测的文献中报道的规范值, 原因在于缺乏单个果糖残基。糖工程化的酵母菌株不含有内源岩藻糖基转移酶, 因此缺乏将果糖添加至核心人 N- 聚糖结构的内在 性质。还观察到与 Man5GlcNAc2 一致的另一次要种类。
     然后将上述菌株 PBP317-36( 其表达组装具有末端半乳糖的人样 N- 聚糖所需的 糖基化活性和还表达 SpGALE(UDP- 半乳糖 4- 差向异构酶 )) 基因工程化为能够利用外 源半乳糖作为碳源并以代谢工程化的方式控制 N- 糖基化。构建在组成型启动子控制下 表达 ScGAL1 和 ScGAL7 的整合质粒 pGLY954( 图 9) 并将其转化至巴斯德毕赤酵母菌株 PBP317-36。质粒 pGLY954 赋予菌株 PBP317-36( 其已含有 SpGALEUDP- 半乳糖差向异构酶, 图 8) 在半乳糖 ( 作为单一碳源 ) 上生长的能力。该 gal+ 菌株命名为 RDP783。因为尽管我 们没有将半乳糖通透酶引入至细胞, 细胞仍能够利用半乳糖作为碳源, 我们得出结论 : 对巴 斯德毕赤酵母是内源的一般己糖转运蛋白能够充分穿过细胞膜转运半乳糖。
     巴斯德毕赤酵母菌株 PBP317-36 和 RDP783 具有在甲醇 - 诱导型 AOX1 启动子控制 下编码人 Fc 结构域作为分泌的报告子蛋白的整合质粒构建体。菌株 PBP317-36 和 RDP783 在标准培养基中在摇瓶中培养, 所述标准培养基含有甘油和在甲醇作为单一碳源存在下诱 导或用甲醇与不同浓度葡萄糖或半乳糖组合诱导。收获的上清蛋白通过蛋白 A 被亲和纯 化, 进行 PNGase 消化通过 MALDI-TOF MS 分析。从菌株 RDP783 的人 Fc 释放的 N- 聚糖产生 与用甲醇单独诱导或在葡萄糖或甘露糖存在下诱导后在 PBP317-36 中观察到的分布情况 类似的 N- 聚糖, 具有主要糖形 G0(GlcNAc2Man3GlcNAc2)( 图 10)。但是, 外源半乳糖给料后, 菌株 RDP783( 但不是母本菌株 PBP317-36) 产生在人 Fc 上的含有半乳糖的 N- 聚糖的剂量 依赖增加, 其主要糖形现在转移到 G1(GalGlcNAc2Man3GlcNAc2) 且在完全地 β-1, 4- 半乳糖 加帽的糖形 G2(Gal2GlcNAc2Man3GlcNAc2) 中污染增加 ( 图 10)。
     最后, 为证明用人 Fc 观察到的利用外源半乳糖控制糖基化的能力可应用于全 长单克隆抗体, 产生糖工程化的酵母菌株 YDX477( 图 11, 实施例 5), 其表达抗 -Her2 单 克 隆 抗 体。 该 菌 株 还 工 程 化 为 转 移 G2 形 的 人 N- 聚 糖 (Gal2GlcNAc2Man3GlcNAc2) 到 分 泌的糖蛋白上。在 mAb-A 的表达后 N- 聚糖的释放显示 N- 聚糖模式 ( 图 13A), 其由与 G0(GlcNAc2Man3GlcNAc2) 一致的主要峰组成, 具有与 G1(GalGlcNAc2Man3GlcNAc2) 一致的次 主要峰, 以及 G2(Gal2GlcNAc2Man3GlcNAc2) 和 M5(Man5GlcNAc2) 的次要峰。该数据与对于人 IgG1 的截短的 Fc 部分观察到的相似并且是期望的, 因为在相同残基处 (Asn-297)N- 糖基 化。构建具有 ScGAL1 和 ScGAL7 的整合质粒 pGLY1418( 图 12) 和转化至巴斯德毕赤酵母菌 株 YDX477 以制备菌株 RDP968-1。该质粒赋予菌株 YDX477( 其已含有 SpGALE UDP- 半乳糖 差向异构酶, 图 11) 在半乳糖 ( 作为单一碳源 ) 上生长的能力。
     菌株 YDX477 和 RDP968-1 在标准培养基中在摇瓶中培养, 所述标准培养基含有甘 油和在甲醇作为单一碳源存在下诱导或用甲醇与不同浓度半乳糖组合诱导。 收获的上清蛋 白通过蛋白 A 被亲和纯化, 进行 PNGase 消化通过 MALDI-TOF MS 分析。两种菌株产生与之 前用甲醇单独诱导或在葡萄糖或甘露糖存在下诱导后在 PBP317-36 中观察到的分布情况 类似的 N- 聚糖, 具有主要糖形 G0(GlcNAc2Man3GlcNAc2)( 图 10A 相对于图 13A 和 13D)。但 是, 外源半乳糖给料后, 菌株 RDP968-1( 但不是母本菌株 YDX477) 产生在抗体上的含有半乳 糖的 N- 聚糖的剂量依赖增加, 其主要糖形现在转移到 G1(GalGlcNAc2Man3GlcNAc2) 且在完 全地 β-1, 4- 半乳糖加帽的糖形 G2(Gal2GlcNAc2Man3GlcNAc2) 中污染增加 ( 图 13E 和 F)。
     实施例 3菌株 RDP578-1 的构建显示于图 5 并涉及以下步骤。菌株 JC308 是起始菌株。该 菌株已在 Choi 等人, Proc.Natl.Acad.Sci.USA 100 : 5022-5027(2003) 中描述, 但简言之, 菌株是 ura3, ade1, arg4, his4。通过利用质粒 pJN329 破坏 OCH1 基因并根据 Choi 等人 (ibid.) 和美国专利号 7,449,308 中描述的方法, 使得该菌株缺乏 α-1, 6 甘露糖基转移酶 活性以产生菌株 YJN153。质粒 pJN329 携带 PPURA3 显性选择标记, 在反选择 ura- 活性后, 通过利用质粒载体 pJN503b 和 pAS19 破坏 PNO1、 MMN4A 和 MNN4B 基因并根据美国专利号 7,259,007 中描述的方法, 使得得到的菌株 YJN156 缺乏磷酸甘露糖基转移酶活性以产生菌 株 YAS180-2。包含本文中的融合蛋白的分泌途径靶向前导肽定位催化结构域, 其被融合至 ER、 高尔基体或反式高尔基体网络。
     在 反 选 择 ura- 活 性 后, 通 常 如 美 国 专 利 号 7,465,577 中 描 述 的 利 用 质 粒 pAS24( 参见图 14) 使得得到的菌株 YAS187-2 缺乏 β- 甘露糖基转移酶活性以制备菌株 YAS218-2。质粒 pAS24 是巴斯德毕赤酵母 BMT2 敲除质粒, 其含有 PpURA3 选择标记和在 PpOCH1 启动子的下游含有编码全长小鼠高尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 的表 达盒。MmSLC35A3 具有 SEQ ID NO : 34 所示的氨基酸序列, 其由 SEQ ID NO ; 33 所示的核苷 酸序列编码。可以如美国专利号 7,465,577 所示获得在序列两侧的 5’ 和 3’ BMT2 用于去除 β- 甘露糖基转移酶活性 ( 其归因于 bmt2p)。 在对于 ura- 活性反选择菌株 YAS218-2 后, 得 到的菌株 YAS269-2 是 ura- 并具有插入 BMT2 基因的小鼠高尔基体 UDP-GlcNAc 转运蛋白。
     然后用质粒 pRCD742b( 参见图 15) 转化菌株 YAS269-2, 质粒 pRCD742b 包括编码 嵌合小鼠 α-1, 2- 甘露糖基转移酶 I(FB8 MannI)、 嵌合人 GlcNAc 转移酶 I(CONA10) 和 全长基因编码小鼠高尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 的表达盒并将质粒靶向 ADE1 基因座 ( 参见 PCT/US2008/13719)。质粒 pRCD742b 是敲入敲除 (KINKO) 质粒, 其已 在 WO2007/136865 和 WO2007136752 中描述。质粒整合进巴斯德毕赤酵母 ADE1 基因而不删 除编码 Ade1p 的开放读码框。质粒还含有 PpURA5 选择标记。编码分泌途径靶向融合蛋白 (FB8MannI) 的表达盒包括在 PpGAPDH 启动子的控制下融合至小鼠 α-1, 2- 甘露糖基转移酶 I 催化结构域 (FB MannI : SEQ ID NO : 54) 的 N- 末端的 ScSec12 前导肽 (ScSec12(8) : SEQ ID NO : 32 的最先的 103 个氨基酸 )。编码分泌途径靶向融合蛋白 CONA10 的表达盒包括在 PpPMA1 启动子的控制下融合至人 GlcNAc 转移酶 I(GnT I) 催化结构域 (SEQ ID NO : 52) 的 N- 末端的 PpSec12 前导肽 (PpSec12(10) : SEQ ID NO : 28 的最先的 29 个氨基酸 )。 质粒另外 包括在 PpSEC4 启动子的控制下编码全长小鼠高尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 的表达盒。将质粒 pRCD742b 转染进菌株 YAS269-2 产生菌株 RDP307。该菌株能够产生具有 GlcNAcMan5GlcNAc2 N- 聚糖的糖蛋白。SEQ ID NO : 53 和 51 是分别编码小鼠 α-1, 2- 甘露 糖基转移酶 I 和人 GlcNAc 转移酶 I(GnT I) 催化结构域的核苷酸序列。编码人 GnT I 的核 苷酸序列被密码子最优化用于在巴斯德毕赤酵母中表达。SEQ ID NO : 27 和 31 是分别编码 PpSEC12(10) 和 ScSEC12(8) 的核苷酸序列。
     菌株 RDP361 如下构建 : 用质粒 pDMG47 转化菌株 RDP307 以产生菌株 RDP361。质 粒 pDMG47( 参见图 16) 是 KINKO 质粒, 其整合进巴斯德毕赤酵母 TRP1 基因座而不删除编 码 Trp1p 的开放读码框。质粒还含有 PpURA3 选择标记并包括编码分泌途径靶向融合蛋白 (KD53) 的表达盒, 其包含在 PpGAPDH 启动子的控制下融合至黑腹果蝇甘露糖苷酶 II(KD : SEQ ID NO : 63) 催化结构域的 N- 末端的 ScMnn2 引导靶向肽 (ScMnn2(53) : SEQ ID NO : 19最先的 36 个氨基酸 )。质粒还含有编码分泌途径靶向融合蛋白 (TC54) 的表达盒, 其包含 在 PpPMA1 启动子的控制下融合至大鼠 GlcNAc 转移酶 II(TC : SEQ ID NO : 58) 的催化结构 域的 N- 末端的 ScMnn2 引导靶向肽 (ScMnn2(54) : SEQ ID NO : 22 的最先的 97 个氨基酸 )。 ScMnn2 前导区 53 和 54 的核酸序列分别显示于 SEQ ID NO : 19 和 21。编码黑腹果蝇甘露糖 苷酶 II 和大鼠 GlcNAc 转移酶 II(GnTII) 的催化结构域的核酸序列分别显示于 SEQ ID NO : 62 和 57。
     上述菌株 RDP361 用质粒 pRCD823b 转化以产生菌株 RDP415-1。质粒 pRCD823b( 参 见 图 17) 是 KINKO 质 粒, 其 整 合 进 巴 斯 德 毕 赤 酵 母 HIS4 基 因 座 ( 参 见 美 国 专 利 号 7,479,389) 而不删除编码 His4p 的开放读码框, 并含有 PpURA5 选择标记 ( 参见美国公开 的申请号 20040229306) 以及编码分泌途径靶向融合蛋白 (TA54) 的表达盒, 其包含大鼠 GlcNAc 转移酶 II 催化结构域 (TA : SEQ ID NO : 61), 如上述在它的 N- 末端与 ScMnn2(54) 的 最先的 97 个氨基酸融合但在 PpGAPDH 启动子的控制下。质粒还含有在 PpOCH1 启动子的控 制下编码全长黑腹果蝇高尔基体 UDP- 半乳糖转运蛋白 (DmUGT) 和在 PpPMA1 启动子的控制 下编码全长酿酒酵母 UDP- 半乳糖 4- 差向异构酶 (ScGAL10) 的表达盒。ScGAL10 具有 SEQ ID NO : 46 所示的氨基酸序列, 其由 SEQ ID NO : 45 所示的核苷酸序列编码。大鼠 GlcNAc 转 移酶 II(TA) 的核苷酸序列显示于 SEQ ID NO : 60。
     上 述 菌 株 RDP415-1 用 质 粒 pRCD893a 转 化 以 产 生 菌 株 RDP523-1。 质 粒 pGLY893a( 参见图 18) 是巴斯德毕赤酵母 his1 敲除质粒, 其含有 PpARG4 选择标记 ( 参见 美国专利号 7,479,389)。质粒包括编码分泌途径靶向融合蛋白 (KD10) 的表达盒, 其包含 在 PpPMA1 启动子的控制下融合至黑腹果蝇甘露糖苷酶 II(KD : SEQ ID NO : 63) 的催化结 构域的 N- 末端的 PpSEC12 引导靶向肽 (PpSEC12(10) : SEQ ID NO : 28 的最先的 29 个氨基 酸 )。质粒还含有编码分泌途径靶向融合蛋白 (TA33) 的表达盒, 其包含在 PpTEF1 启动子 的控制下融合至大鼠 GlcNAc 转移酶 II(TA : SEQ ID NO : 61) 的催化结构域的 N- 末端的 ScMntIp(ScKre2p) 引导靶向肽 (ScMntIp(ScKre2p)(33) : SEQ ID NO : 30 的最先的 53 个氨 基酸 )。质粒还含有编码分泌途径靶向融合蛋白 (XB53) 的表达盒, 其包含融合至人半乳糖 基转移酶 I(hGalTIβ43 ; SEQ ID NO : 50) 的催化结构域的 N- 末端的 ScMnn2p 前导肽 (53) 的最先的 36 个氨基酸。PpSEC12 和 ScMNTI(ScKRE2) 前导区的核酸序列分别显示于 SEQ ID NO : 27 和 29。编码黑腹果蝇甘露糖苷酶 II、 大鼠 GlcNAc 转移酶 II(GnT II) 和人 GalTI 的 催化结构域的核酸序列分别显示于 SEQ ID NO : 62、 60 和 49。该菌株可产生具有 N- 聚糖的 糖蛋白, 所述 N- 聚糖具有末端半乳糖残基。菌株编码两个拷贝的黑腹果蝇甘露糖苷酶 II 催化结构域和三个拷贝的大鼠 GnTII 催化结构域。
     最后, 上述菌株 RDP523-1 用质粒 pBK64 转化以产生菌株 RDP578-1。质粒 pBK64 编 码人三环 3 测试蛋白并已在 Choi 等人, Proc.Natl.Acad.Sci.USA 100 : 5022-5027(2003) 中描述。
     实施例 4
     菌株 PBP317-36 的构建显示于图 8。起始菌株是 YGLY16-3。这是具有 OCH1, PNO1, MNN4A, Mnn4B 和 BMT2 基因缺失的 ura- 菌株并可以根据实施例 3 所用方法制备。菌株 YGLY16-3 还在 WO2007136752 中公开。
     菌株 YGLY16-3 用质粒 pRCD742a( 参见图 19) 转化以制备菌株 RDP616-2。质粒pRCD742a( 参见图 19) 是 KINKO 质粒, 其整合进巴斯德毕赤酵母 ADE1 基因而不删除编码 Ade1p 的开放读码框。 质粒还含有 PpURA5 选择标记和包括编码嵌合小鼠 α-1, 2- 甘露糖基 转移酶 (FB8MannI)、 嵌合人 GlcNAc 转移酶 I(CONA10) 和全长小鼠高尔基体 UDP-GlcNAc 转 运蛋白 (MmSLC35A3) 的表达盒。 质粒与质粒 pRCD742b 相同, 除了编码嵌合人 GlcNAc 转移酶 I 的表达盒的方向为相反方向。 将质粒 pRCD742a 转染进菌株 YGLY16-3 产生菌株 RDP616-2。 该菌株能够产生具有 GlcNAcMan5GlcNAc2N- 聚糖的糖蛋白。
     反选择菌株 RDP616-2 以产生 ura- 菌株 RDP641-3 后, 然后将质粒 pRCD1006 转化至 菌株以制备菌株 RDP666。质粒 pRCD1006( 参见图 20) 是巴斯德毕赤酵母 his1 敲除质粒, 其 含有 PpURA5 基因作为选择标记。质粒含有在 PpGAPDH 启动子的控制下编码分泌途径靶向 融合蛋白 (XB33) 的表达盒 ( 其包含融合至人半乳糖基转移酶 I 催化结构域 (hGalTIβ43) 的 N- 末端的 ScMnt1p(ScKre2p)(33) 的最先的 58 个氨基酸 ) ; 在 PpOCH1 启动子的控制下 编码全长黑腹果蝇高尔基体 UDP- 半乳糖转运蛋白 (DmUGT) 的表达盒和在 PpPMA1 启动子的 控制下编码粟酒裂殖酵母 UDP- 半乳糖 4- 差向异构酶 (SpGALE) 的表达盒。
     菌株 RDP666 用质粒 pGLY167b 转化以制备菌株 RDP696-2。质粒 pGLY167b( 参见 图 21) 是巴斯德毕赤酵母 arg1 敲除质粒, 其含有 PpURA3 选择标记。质粒含有在 PpGAPDH 启动子的控制下编码分泌途径靶向融合蛋白 (CO-KD53) 的表达盒 ( 其包含融合至黑腹果蝇 甘露糖苷酶 II 催化结构域 (KD) 的 N- 末端的 ScMnn2p(53) 的最先的 36 个氨基酸 ) 和在 PpPMA1 启动子的控制下表达分泌途径靶向融合蛋白 (CO-TC54) 的表达盒 ( 其包含融合至大 鼠 GlcNAc 转移酶 II 催化结构域 (TC) 的 N- 末端的 ScMnn2p(54) 的最先的 97 个氨基酸 )。 得到的菌株 RDP696-2 进行恒化器选择 ( 参见 Dykhuizen 和 Hartl, Microbiol.Revs.47 : 150-168(1983) 关于恒化器选择的综述 )。恒化器选择产生菌株 YGB02。菌株 YGB02 可产生 具有 N- 聚糖的糖蛋白, 所述 N- 聚糖具有末端半乳糖残基。在该菌株中, 甘露糖苷酶 II 催 化结构域 (KD) 和 GnTII(TC) 被密码子最优化为在巴斯德毕赤酵母中表达的核酸分子 ( 分 别为 SEQ ID NO : 64 和 59) 编码。
     菌株 YGB02 用质粒 pBK138 转染以产生菌株 PBP317-36。质粒 pBK138( 参见图 22) 是滚入 (roll-in) 质粒, 其整合进巴斯德毕赤酵母 AOX1 启动子同时复制启动子。质粒含有 编码融合蛋白的表达盒, 其包含融合至人 Fc 抗体片段 (C- 末端 233-aa of a 人 IgG1 重链, SEQ ID NO : 66) 的 N- 末端的酿酒酵母 A 交配因子前信号序列 (SEQ ID NO : 24)。编码酿酒 酵母 A 交配因子前信号序列的核酸序列显示于 SEQ ID NO : 23 和编码人 IgG1 重链的 C- 末 端 233-aa 的核酸序列显示于 SEQ ID NO : 65)。
     实施例 5
     菌株 YDX477 的构建显示于图 11。起始菌株是 YGLY16-3。菌株 YGLY16-3 用质粒 pRCD742a( 参见图 19) 转化以制备菌株 RDP616-2。质粒 pRCD742a( 参见图 19) 是 KINKO 质粒, 其整合进巴斯德毕赤酵母 ADE1 基因而不删除编码 ade1p 的开放读码框。质粒还含 有 PpURA5 选择标记和包括编码嵌合小鼠 α-1, 2- 甘露糖基转移酶 (FB8MannI)、 嵌合人 GlcNAc 转移酶 I(CONA10) 和全长小鼠高尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 表达 盒。质粒与质粒 pRCD742b 相同, 除了编码嵌合人 GlcNAc 转移酶 I 的表达盒的方向为相反 方向。将质粒 pRCD742a 转染进菌株 YGLY16-3 产生菌株 RDP616-2。该菌株能够产生具有 GlcNAcMan5GlcNAc2N- 聚糖的糖蛋白。反选择菌株 RDP616-2 以产生 ura- 菌株 RDP641-4 后, 然后将质粒 pRCD1006 转化至 菌株以制备菌株 RDP667-1. 质粒 pRCD1006( 参见图 20) 是巴斯德毕赤酵母 his1 敲除质粒, 其含有 PpURA5 基因作为选择标记。 质粒含有在 PpGAPDH 启动子的控制下编码分泌途径靶向 融合蛋白 (XB33) 的表达盒 ( 其包含融合至人半乳糖基转移酶 I 催化结构域 (hGalTIβ43) 的 N- 末端的 ScMnt1p(ScKre2p)(33) 的最先的 58 个氨基酸 ) ; 在 PpOCH1 启动子的控制下 编码全长黑腹果蝇高尔基体 UDP- 半乳糖转运蛋白 (DmUGT) 的表达盒和在 PpPMA1 启动子的 控制下编码粟酒裂殖酵母 UDP- 半乳糖 4- 差向异构酶 (SpGALE) 的表达盒。
     菌株 RDP667-1 用质粒 pGLY167b 转化以制备菌株 RDP697-1。质粒 pGLY167b( 参见 图 21) 是巴斯德毕赤酵母 arg1 敲除质粒, 其含有 PpURA3 选择标记。质粒含有在 PpGAPDH 启动子的控制下编码分泌途径靶向融合蛋白 (CO-KD53) 的表达盒 ( 其包含融合至黑腹果蝇 甘露糖苷酶 II 催化结构域 (KD) 的 N- 末端的 ScMnn2p(53) 的最先的 36 个氨基酸 ) 和在 PpPMA1 启动子的控制下表达分泌途径靶向融合蛋白 (CO-TC54) 的表达盒 ( 其包含融合至大 鼠 GlcNAc 转移酶 II 催化结构域 (TC) 的 N- 末端的 ScMnn2p(54) 的最先的 97 个氨基酸 )。 编码甘露糖苷酶 II 和 GnT II 催化结构域的核酸分子被密码子最优化用于在巴斯德毕赤酵 母中表达 ( 分别为 SEQ ID NO : 64 和 59)。该菌株可产生具有 N- 聚糖的糖蛋白, 所述 N- 聚 糖具有末端半乳糖残基。
    用 质 粒 pGLY510 转 化 菌 株 RDP697-1 以 制 备 菌 株 YDX414。 质 粒 pGLY510( 参 见 图 23) 是滚入质粒, 其整合进巴斯德毕赤酵母 TRP2 基因座同时复制基因并含有 AOX1 启动 子 -ScCYC1 终止子表达盒以及 PpARG1 选择标记。
     用质粒 pDX459-1(mAb-A) 转化菌株 YDX414 以制备菌株 YDX458。 质粒 pDX459-1( 参 见图 24) 是滚入质粒, 其靶向并整合进巴斯德毕赤酵母 AOX2 启动子并含有 ZeoR 同时复制 启动子。质粒含有编码抗 -HER2 抗体重链和抗 -HER2 抗体轻链 ( 分别为 SEQ ID NO : 68 和 70) 的分开的表达盒, 其各个在 N- 末端融合黑曲霉 α- 淀粉酶信号序列 (SEQ ID NO : 26) 并 被巴斯德毕赤酵母 AOX1 启动子控制。编码重链和轻链的核酸序列分别显示于 SEQ ID NO : 67 和 69, 和编码黑曲霉 α- 淀粉酶信号序列的核酸序列显示于 SEQ ID NO : 25。
     用质粒 pGLY1138 转化菌株 YDX458 以制备菌株 YDX477。质粒 pGLY1138( 参见图 25) 是滚入质粒, 其整合进巴斯德毕赤酵母 ADE1 基因座同时复制基因。 质粒含有 ScARR3 选 择标记基因盒。来自酿酒酵母的 ARR3 基因赋予细胞亚砷酸盐抗性, 使细胞可在亚砷酸盐存 在下生长 (Bobrowicz 等人, Yeast, 13 : 819-828(1997) ; Wysocki 等人, J.Biol.Chem.272 : 30061-30066(1997))。质粒含有在 PpAOX1 启动子的控制下编码分泌的融合蛋白的表达盒, 其包含融合至里氏木霉 (MNS1) 催化结构域 (SEQ ID NO : 56, 由 SEQ ID NO : 55 的核苷酸序 列编码 ) 的 N- 末端的酿酒酵母 α 因子前信号序列 (SEQ ID NO : 24)。融合蛋白分泌至培 养基中。
    
    
    
    
    
    
    
    
    
    尽管本发明参考例举的实施方案在本文中描述, 但应理解的是本发明不限于此。 具有本领域普通技术且获得本文教导的人员应认识到在其范围内的另外的修改和实施方 案。因此, 本发明仅通过本文所附权利要限制。
    63102333872 A CN 102333887
    序列表1/70 页
     64102333872 A CN 102333887序列表2/70 页
    65102333872 A CN 102333887序列表3/70 页
    66102333872 A CN 102333887序列表4/70 页
    67102333872 A CN 102333887序列表5/70 页
    68102333872 A CN 102333887序列表6/70 页
    69102333872 A CN 102333887序列表7/70 页
    70102333872 A CN 102333887序列表8/70 页
    71102333872 A CN 102333887序列表9/70 页
    72102333872 A CN 102333887序列表10/70 页
    73102333872 A CN 102333887序列表11/70 页
    74102333872 A CN 102333887序列表12/70 页
    75102333872 A CN 102333887序列表13/70 页
    76102333872 A CN 102333887序列表14/70 页
    77102333872 A CN 102333887序列表15/70 页
    78102333872 A CN 102333887序列表16/70 页
    79102333872 A CN 102333887序列表17/70 页
    80102333872 A CN 102333887序列表18/70 页
    81102333872 A CN 102333887序列表19/70 页
    82102333872 A CN 102333887序列表20/70 页
    83102333872 A CN 102333887序列表21/70 页
    84102333872 A CN 102333887序列表22/70 页
    85102333872 A CN 102333887序列表23/70 页
    86102333872 A CN 102333887序列表24/70 页
    87102333872 A CN 102333887序列表25/70 页
    88102333872 A CN 102333887序列表26/70 页
    89102333872 A CN 102333887序列表27/70 页
    90102333872 A CN 102333887序列表28/70 页
    91102333872 A CN 102333887序列表29/70 页
    92102333872 A CN 102333887序列表30/70 页
    93102333872 A CN 102333887序列表31/70 页
    94102333872 A CN 102333887序列表32/70 页
    95102333872 A CN 102333887序列表33/70 页
    96102333872 A CN 102333887序列表34/70 页
    97102333872 A CN 102333887序列表35/70 页
    98102333872 A CN 102333887序列表36/70 页
    99102333872 A CN 102333887序列表37/70 页
    100102333872 A CN 102333887序列表38/70 页
    101102333872 A CN 102333887序列表39/70 页
    102102333872 A CN 102333887序列表40/70 页
    103102333872 A CN 102333887序列表41/70 页
    104102333872 A CN 102333887序列表42/70 页
    105102333872 A CN 102333887序列表43/70 页
    106102333872 A CN 102333887序列表44/70 页
    107102333872 A CN 102333887序列表45/70 页
    108102333872 A CN 102333887序列表46/70 页
    109102333872 A CN 102333887序列表47/70 页
    110102333872 A CN 102333887序列表48/70 页
    111102333872 A CN 102333887序列表49/70 页
    112102333872 A CN 102333887序列表50/70 页
    113102333872 A CN 102333887序列表51/70 页
    114102333872 A CN 102333887序列表52/70 页
    115102333872 A CN 102333887序列表53/70 页
    116102333872 A CN 102333887序列表54/70 页
    117102333872 A CN 102333887序列表55/70 页
    118102333872 A CN 102333887序列表56/70 页
    119102333872 A CN 102333887序列表57/70 页
    120102333872 A CN 102333887序列表58/70 页
    121102333872 A CN 102333887序列表59/70 页
    122102333872 A CN 102333887序列表60/70 页
    123102333872 A CN 102333887序列表61/70 页
     如本文所用, 术语 “包括” (“comprise” ) 或变化例如 “包括” (“comprises” )或 “包括” (“comprising” ), 应理解为意指包含规定的整体或成组的整体但不排除任何其它 的整体或成组的整体。
     如本文所用, 术语 “主要地” 或变化例如 “主要的” 或 “其是主要的” 应理解为意指 在已经用 PNG 酶处理糖蛋白并由质谱例如 MALDI-TOF MS 分析释放的聚糖之后具有最高摩 尔百分比 (% ) 的总 O- 聚糖或 N- 聚糖的聚糖种类。换言之, 短语 “主要地” 被定义为为个 体实体, 以使特定 “主要” 糖形以比任何其它个体实体更大的摩尔百分比存在。例如, 如果 组合物由 40 摩尔百分比的种类 A、 35 摩尔百分比的种类 B 和 25 摩尔百分比的种类 C 组成, 则组合物主要包含种类 A。 附图说明
     图 1 图解了人和巴斯德毕赤酵母中 N- 糖基化途径。ER 中的早期事件是高度保守 的, 包括由葡糖苷酶 I 和 II 去除三个葡萄糖残基和由 ER 甘露糖苷酶处理单个特定 α-1, 2- 连接的甘露糖残基, 引起相同核心结构 Man8GlcNAc2(Man8B)。 但是, 加工事件在高尔基体 中不同。Mns, α-1, 2- 甘露糖苷酶 ; MnsII, 甘露糖苷酶 II ; GnT I, α-1, 2-N- 乙酰基葡糖 胺转移酶 I ; GnT II, α-1, 2-N- 乙酰基葡糖胺转移酶 II ; MnT, 甘露糖基转移酶。两个核心 GlcNAc 残基虽然在所有情况中存在, 但在命名中忽略。
     图 2 图解了 N- 糖基化中的关键中间步骤以及缩写命名, 其指产生各自聚糖结构 (GS) 的基因工程化巴斯德毕赤酵母菌株。
     图 3 图解了 N- 糖苷酶 F 释放的 N- 聚糖的 MALDI-TOF 质谱 (MS) 分析。K3( 人纤 溶酶原的三环 3 结构域 ) 在巴斯德毕赤酵母菌株 GS115 来源的野生型对照 (Invitrogen, Carlsbad, CA)、 YSH44、 YSH71、 RDP52 和 RDP80 中产生并通过 Ni- 亲和层析从培养物上清液 中纯化。通过 N- 糖苷酶 F 处理释放 N- 聚糖并进行 MALDI-TOF MS 分析 ( 阳性模式, 除了图 3G 是阴性模式 ), 其表现为钠或钾络合物。两个核心 GlcNAc 残基虽然存在, 但在命名中忽 略。GN, GlcNAc ; M, 甘露糖。
     图 3A : GS115 来源的野生型对照菌株中产生的 N- 聚糖 ;
     图 3B : 菌株 YSH44 中 K3 上产生的 N- 聚糖 ;
     图 3C : 菌株 YSH71(YSH44 表达 hGalTI) 中 K3 上产生的 N- 聚糖,
     图 (3D) 菌株 RDP52(YSH44 表达 hGalTI 和 SpGALE) 中 K3 上产生的 N- 聚糖,
     图 (3E) 菌株 RDP80(YSH44 表达 hGalTI、 SpGALE 和 DmUGT) 中 K3 上产生的 N- 聚 糖;
     图 (3F) 在 α- 半乳糖苷酶体外处理后来自 RDP80 的聚糖 ; 和
     图 (3G) 在用 α-2, 6-(N)- 唾液酸转移酶处理后在阴性模式中来自 RDP80 的聚糖。
     图 4 图解了 Leloir 半乳糖利用途径。经由半乳糖通透酶引入细胞外半乳糖。通 过酶半乳糖激酶, 半乳糖 -1- 磷酸尿苷酰转移酶和 UDP- 半乳糖 C4- 差向异构酶的作用半乳 糖被转化成葡萄糖 -6- 磷酸。来自酿酒酵母的蛋白名称在括号中。
     图 5 显 示 巴 斯 德 毕 赤 酵 母 糖 工 程 化 的 菌 株 YGLY578-1 的 构 建。 编 码 高 尔基 体 糖 基 转 移 酶 的 巴 斯 德 毕 赤 酵 母 基 因 OCH1, MNN4, PNO1, MNN4L1 和 BMT2 被 敲 除 然 后 敲 入 12 个 异 源 基 因, 包 括 分 泌 的 hK3 的 表 达 盒。YGLY578-1 能 够 生 产 糖 蛋 白 具 有 Gal2GlcNAc2Man3GlcNAc2N- 聚糖。CS, 反选择。
     图 6 显示质粒 pRCD977b 的示意图。该质粒是 arg1::HIS1 敲除质粒, 其整合进并 删除巴斯德毕赤酵母 ARG1 基因而利用 PpHIS1 基因作为选择标记并含有分别在 PpOCH1、 PpGAPDH、 PpPMA1 和 PpTEF 启动子的控制下编码全长黑腹果蝇高尔基体 UDP- 半乳糖转运蛋 白 (DmUGT)、 全长酿酒酵母半乳糖激酶 (ScGAL1)、 全长酿酒酵母半乳糖 -1- 磷酸尿苷酰转移 酶 (ScGAL7) 和酿酒酵母半乳糖通透酶 (ScGAL2) 的表达盒。TT 是指转录终止序列。
     图 7 显示表达酿酒酵母 GAL1、 GAL2 和 GAL7 基因的糖工程化的巴斯德毕赤酵母菌 株可在半乳糖 ( 作为单一碳源 ) 上生长而母本菌株不能。 糖工程化的菌株 YGLY578-1( 表达 ScGAL10 和 hGalTIβ) 用质粒 pRCD977b 转化, 所述质粒含有编码 ScGAL1、 ScGAL7 和 ScGAL2 的表达盒。菌株在成分确定的培养基上培养, 所述培养基含有酵母氮源、 生物素和 3%半乳 糖或 2%葡萄糖作为碳源或二者均无。
     图 8 显示巴斯德毕赤酵母糖工程化的菌株 YGLY317-36 的构建。 通过敲除五个酵母 糖基转移酶产生巴斯德毕赤酵母菌株 YGLY16-3。随后敲入八个异源基因, 得到 RDP696-2, 能够将人 N- 聚糖 Gal2GlcNAc2Man3GlcNAc2 转移到分泌的蛋白的菌株。经由 CSTR 培养和引 入表达分泌的人 Fc 的质粒选择健康 (robust) 克隆得到菌株 YGLY317-36。CS, 反选择。
     图 9 显示质粒 pGLY954 的示意图。该质粒是 KINKO 质粒, 其整合进巴斯德毕赤酵 母 TRP1 基因座而不删除基因。 质粒含有分别在 PpHHT1 和 PpPMA1 启动子的控制下编码全长 酿酒酵母半乳糖激酶 (ScGAL1) 和全长酿酒酵母半乳糖 -1- 磷酸尿苷酰转移酶 (ScGAL7) 的 表达盒。质粒还含有在 PpGAPDH 启动子的控制下编码分泌途径靶向融合蛋白 (CO hGalTI) ( 包含 ScMnt1(ScKre2) 前导肽 (33) 融合至人半乳糖基转移酶 I 催化结构域的 N- 末端 ) 的 表达盒。TT 是指转录终止序列。
     图 10 显示单独在 BMMY 培养基中诱导或在含有葡萄糖或半乳糖的培养基中诱导的 菌株 PBP317-36 和 RDP783 中产生的人 Fc 片段上 N- 聚糖的 MALDI-TOF MS 分析。菌株从饱 和的种子培养物接种至约一个 OD, 在 800mL BMGY 中培养 72 小时, 然后分离 (split) 并将 100mL 培养液等分样离心和在 25mL BMMY、 25mL BMMY+0.5%葡萄糖或 25mL BMMY+0.5%半乳 糖中诱导 24 小时。 蛋白 A 纯化的蛋白进行蛋白 N- 糖苷酶 F 消化和通过 MALDI-TOF MS 分析 释放的 N- 聚糖。图 A-C, 菌株 PBP317-36 中产生的人 Fc 上的 N- 聚糖 ; 图 D-E, 菌株 RDP783 中产生的人 Fc 上的 N- 聚糖。
     图 11 显示巴斯德毕赤酵母糖工程化的菌株 YDX477 的构建。敲除五种酵母糖基转 移酶产生巴斯德毕赤酵母菌株 YGLY16-3(Δoch1, Δpno1, Δbmt2, Δmnn4a, Δmnn4b)。随 后敲入八个异源基因, 得到 RDP697-1, 能够将人 N- 聚糖 Gal2GlcNAc2Man3GlcNAc2 转移到分 泌的蛋白的菌株。引入表达分泌的抗体的质粒和表达分泌的形式的里氏木霉 MNS1 的质粒 得到菌株 YDX477。CS, 反选择。
     图 12 显示质粒 pGLY1418 的示意图。该质粒是 KINKO 质粒, 其整合进巴斯德毕赤 酵母 TRP1 基因座而不删除基因。质粒含有分别在 PpHHT1 和 PpPMA1 启动子的控制下编码 全长 ScGAL1 和 ScGAL7 的表达盒。质粒还含有在 PpGAPDH 启动子的控制下编码分泌途径靶 向融合蛋白 (hGalTI)( 包含 ScMnt1(ScKre2) 前导肽融合至人半乳糖基转移酶 I 催化结构域的 N- 末端 ) 的表达盒。TT 是指转录终止序列。
     图 13A-F 显示单独在 BMMY 培养基中诱导或在含有半乳糖的培养基中诱导的菌 株 YDX477 和 RDP968-1 中产生的抗 -Her2 抗体上 N- 聚糖的 MALDI-TOF MS 分析。菌株在 150mL BMGY 中培养 72 小时, 然后分离并将 50mL 培养液等分样离心和在 25mL BMMY、 25mL BMMY+0.1%半乳糖或 25mL BMMY+0.5%半乳糖中诱导 24 小时。 蛋白 A 纯化的蛋白进行蛋白 N- 糖苷酶 F 消化和通过 MALDI-TOF MS 分析释放的 N- 聚糖。图 13A-C, 菌株 YDX477 中产生 的抗体上的 N- 聚糖 ; 图 13D-F, 菌株 RDP968-1 中产生的抗体上的 N- 聚糖。
     图 14 显示质粒 pAS24 的示意图。该质粒是巴斯德毕赤酵母 bmt2 敲除质粒, 其含 有 PpURA3 选择标记和含有在 PpOCH1 启动子的控制下编码全长小鼠高尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 的表达盒。TT 是指转录终止序列。
     图 15 显示质粒 pRCD742b 的示意图。该质粒是 KINKO 质粒, 其含有 PpURA5 选择标 记以及在 PpGAPDH 启动子的控制下编码分泌途径靶向融合蛋白 (FB8 MannI)( 包含融合至 小鼠甘露糖苷酶 I 催化结构域的 N- 末端的 ScSec12 前导肽 ) 的表达盒、 在 PpPMA1 启动子 的控制下编码分泌途径靶向融合蛋白 (CONA10)( 包含融合至人 GlcNAc 转移酶 I(GnT I) 催 化结构域的 N- 末端的 PpSec12 前导肽 ) 的表达盒和在 PpSEC4 启动子的控制下编码小鼠高 尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 的全长基因。TT 是指转录终止序列。
     图 16 显示质粒 pDMG47 的示意图。质粒包括在 PpGAPDH 的控制下启动子编码分泌 途径靶向融合蛋白 (KD53)( 包含融合至黑腹果蝇甘露糖苷酶 II 催化结构域的 N- 末端的 ScMnn2 前导肽 ) 的表达盒。质粒还含有在 PpPMA1 启动子的控制下编码分泌途径靶向融合 蛋白 (TC54)( 包含融合至大鼠 GlcNAc 转移酶 II(GnT II) 催化结构域的 N- 末端的 ScMnn2 前导肽 ) 的表达盒。TT 是指转录终止序列。
     图 17 显示质粒 pRCD823b 的示意图。该质粒是 KINKO 质粒, 其整合进巴斯德毕赤 酵母 HIS4 基因座而不删除基因, 并含有 PpURA5 选择标记。质粒包括在 PpGAPDH 启动子的 控制下编码分泌途径靶向融合蛋白 (TA54)( 包含 ScMnn2 前导肽融合至大鼠 GlcNAc 转移酶 II(GnTII) 催化结构域的 N- 末端 ) 的表达盒和分别在 PpOCH1 和 PpPMA1 启动子的控制下编 码全长黑腹果蝇高尔基体 UDP- 半乳糖转运蛋白 (DmUGT) 和酿酒酵母 UDP- 半乳糖 C4- 差向 异构酶 (ScGAL10) 的表达盒。TT 是指转录终止序列。
     图 18 显示质粒 pGLY893a 的示意图。该质粒是巴斯德毕赤酵母 his1 敲除质粒, 其 含有 PpARG4 选择标记。质粒含有在 PpPMA1 启动子的控制下编码分泌途径靶向融合蛋白 (KD10)( 包含 PpSEC12 前导肽融合至黑腹果蝇甘露糖苷酶 II 催化结构域的 N- 末端 ) 的表达 盒, 在 PpTEF 启动子的控制下编码分泌途径靶向融合蛋白 (TA33)( 包含 ScMnt1(ScKre2) 前 导肽融合至大鼠 GlcNAc 转移酶 II(GnT II) 催化结构域的 N- 末端 ) 的表达盒和在 PpGAPDH 启动子的控制下编码分泌途径靶向融合蛋白 ( 包含 ScMnn2 前导肽融合至人半乳糖基转移 酶 I 催化结构域的 N- 末端 ) 表达盒。TT 是指转录终止序列。
     图 19 显示质粒 pRCD742a 的示意图。该质粒是 KINKO 质粒, 其整合进巴斯德毕赤 酵母 ADE1 基因座而不删除基因并含有 PpURA5 选择标记。质粒含有在 PpGAPDH 启动子的控 制下编码分泌途径靶向融合蛋白 (FB8 MannI)( 包含 ScSEC12 前导肽融合至小鼠甘露糖苷 酶 I 催化结构域的 N- 末端 ) 的表达盒、 在 PpPMA1 启动子的控制下编码分泌途径靶向融合蛋 白 (CONA10)( 包含 PpSEC12 前导肽融合至人 GlcNAc 转移酶 I(GnT I) 催化结构域的 N- 末端 ) 的表达盒和在 PpSEC4 启动子的控制下编码全长小鼠高尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 的表达盒。TT 是指转录终止序列。
     图 20 显示质粒 pRCD1006 的示意图。该质粒是巴斯德毕赤酵母 his1 敲除质粒, 其 含有 PpURA5 基因作为选择标记。质粒含有在 PpGAPDH 启动子的控制下编码分泌途径靶向 融合蛋白 (XB33)( 包含 ScMnt1(ScKre2) 前导肽融合至人半乳糖基转移酶 I 催化结构域的 N- 末端 ) 的表达盒和分别在 PpOCH1 和 PpPMA1 启动子的控制下编码全长黑腹果蝇高尔基体 UDP- 半乳糖转运蛋白 (DmUGT) 和粟酒裂殖酵母 UDP- 半乳糖 C4- 差向异构酶 (SpGALE) 的表 达盒。TT 是指转录终止序列。
     图 21 显示质粒 pGLY167b 的示意图。该质粒是巴斯德毕赤酵母 arg1 敲除质粒, 其含有 PpURA3 选择标记并含有在 PpGAPDH 启动子的控制下编码分泌途径靶向融合蛋白 (CO-KD53)( 包含 ScMNN2 前导肽融合至黑腹果蝇甘露糖苷酶 II 催化结构域的 N- 末端 ) 的 表达盒和在 PpPMA1 启动子的控制下编码分泌途径靶向融合蛋白 (CO-TC54)( 包含 ScMnn2 前导肽融合至大鼠 GlcNAc 转移酶 II(GnT II) 催化结构域的 N- 末端 ) 的表达盒。TT 是指 转录终止序列。
     图 22 显示质粒 pBK 138 的示意图。该质粒是滚入 (roll-in) 质粒, 其整合进巴斯 德毕赤酵母 AOX1 启动子同时复制启动子。质粒含有编码融合蛋白 ( 包含酿酒酵母 A 交配 因子前信号序列融合至人 Fc 抗体片段 ( 人 IgG1H 链的 C- 末端 233-aa) 的 N- 末端 ) 的表 达盒。TT 是指转录终止序列。
     图 23 显示质粒 pGLY510 的示意图。该质粒是滚入质粒, 其整合进巴斯德毕赤酵母 TRP2 基因同时复制基因并含有 AOX1 启动子 -ScCYC1 终止子表达盒以及 PpARG1 选择标记。 TT 是指转录终止序列。
     图 24 显示质粒 pDX459-1 的示意图。 该质粒是滚入质粒, 其靶向并整合进巴斯德毕 R 赤酵母 AOX2 启动子和含有 Zeo 同时复制启动子。质粒含有分开的表达盒, 其编码抗 -HER2 抗体重链和抗 -HER2 抗体轻链, 每个在 N- 末端融合至黑曲霉 α- 淀粉酶信号序列并在巴斯 德毕赤酵母 AOX1 启动子的控制下。TT 是指转录终止序列。
     图 25 显示质粒 pGLY1138 的示意图。该质粒是滚入质粒, 其整合进巴斯德毕赤酵 母 ADE1 基因座同时复制基因和含有 ScARR3 选择标记基因盒 ( 其赋予亚砷酸盐抗性 ) 以及 在 PpAOX1 启动子的控制下编码分泌的里氏木霉 MNS1( 包含 MNS1 催化结构域在其 N- 末端 融合至酿酒酵母 α 因子前信号序列 ) 的表达盒。TT 是指转录终止序列。
     发明详述
     酵母已被成功用于生产细胞内和分泌的重组蛋白 ( 参见例如, Cereghino Cregg FEMS Microbiology Reviews 24(1) : 45-66(2000) ; Harkki, 等人 Bio-Technology 7(6) : 596(1989) ; Berka, 等人 Abstr.Papers Amer.Chem.Soc.203 : 121-BIOT(1992) ; Svetina, 等 人 J.Biotechnol.76(2-3) : 245-251(2000))。多种酵母, 例如乳酸克鲁维酵母、 巴斯德毕赤 酵母、 甲醇毕赤酵母和多形汉逊酵母, 已作为用于生产重组蛋白的真核表达系统发挥特别 重要的作用, 因为它们能够生长至高细胞密度和分泌大量重组蛋白。 但是, 在任意这些真核 微生物中的糖蛋白表达在 N- 聚糖结构上实质不同于哺乳动物中产生的糖蛋白表达。糖基 化中的该差异已阻止酵母或丝状真菌用作用于生产许多治疗用糖蛋白的宿主。
     为了能够利用酵母以产生治疗用糖蛋白, 酵母已被基因工程化为产生具有杂合或复合 N- 聚糖的糖蛋白。能够生产包含具体杂合或复合 N- 聚糖的组合物的重组酵母已在例 如, 美国专利号 7,029,872 和美国专利号 7,449,308 中公开。 另外, Hamilton 等人, Science 313 : 1441-1443(2006) 和美国公开的申请号 2006/0286637 报道了酵母巴斯德毕赤酵母中 糖基化途径的人源化和具有复合 N- 糖基化 ( 具有末端唾液酸 ) 的重组人糖蛋白的分泌。 对 于末端唾液酸的具有寡糖结构 Gal2GlcNAc2Man3GlcNAc2(G2) 前体 N- 聚糖是也作为从人血清 中分离的几种蛋白上主要 N- 聚糖发现的结构, 所述从人血清中分离的几种蛋白包括促卵 泡激素 (FSH)、 脱唾液酸转铁蛋白, 以及最显著的是在人免疫球蛋白 ( 抗体 ) 以不同的量存 在。Davidson 等人在美国公开的申请号 2006/0040353 教导了利用已被基因工程化为产生 半乳糖末端的 N- 聚糖的酵母细胞获得半乳糖基化的糖蛋白的有效方法。这些宿主细胞能 够生产糖蛋白组合物具有 G2 或 G1(GalGlcNAc2Man3GlcNAc2) 寡糖结构的多种混合物, 其具 有 G0 寡糖结构的变化量。 G0 是 GlcNAc2Man3GlcNAc2, 其是半乳糖基转移酶的底物。 但是, 对 于某些糖蛋白, 特别是抗体和 Fc 片段, 已发现半乳糖转移过程的效率不是最适的。在抗体 和 Fc 片段的情况下, 认为的是在细胞内加工期间抗体或 Fc 片段上糖基化位点的定位和可 及性抑制半乳糖有效转移到抗体或 Fc 片段的 N- 聚糖上。因此, 含有半乳糖的寡糖结构的 量小于其他糖蛋白例如三环 3 蛋白中已观察到的量。为了克服该问题, 本发明提供增加半 乳糖转移到抗体或 Fc 片段的 N- 聚糖上的量的方法, 因此增加含有抗体或 Fc 片段的 G1 和 G2 的量高于含有抗体或 Fc 片段的 G0。
     巴斯德毕赤酵母仅可利用有限数量的碳源进行生存。 目前, 这些碳源已知是甘油、 葡萄糖、 甲醇以及可能是鼠李糖和甘露糖但不是半乳糖。 在许多商业生产过程中, 利用巴斯 德毕赤酵母, 重组蛋白的表达在 AOX 启动子的控制下, 其 w 在甲醇存在下是有活性的但在甘 油存在下被抑制。因此, 巴斯德毕赤酵母通常在含有甘油或甘油 / 甲醇的培养基中生长直 到细胞的浓度达到期望的水平, 在此时, 通过用仅含有甲醇作为碳源的培养基替换培养基 来进行重组蛋白的表达。但是, 细胞处于低能量状态, 因为甲醇仅含有一个碳, 使其成为贫 瘠碳源。因此, 期望的是具有这样的生产过程, 其中巴斯德毕赤酵母可利用更高级的能源, 例如半乳糖。 本发明通过提供能够利用半乳糖作为单一碳源的基因工程化巴斯德毕赤酵母 也解决了该问题。
     因此, 本发明已解决上述确定的两个问题。 本发明提供重组低等真核细胞, 特别是 酵母和真菌细胞, 其已被糖工程化以产生糖蛋白例如抗体或 Fc 片段, 其中与未被如本文所 教导的基因工程化的细胞相比, 其上 N- 聚糖上的末端半乳糖水平增加。基因工程化宿主细 胞可用于产生具有 N- 聚糖 ( 含有半乳糖 ) 的糖蛋白的方法, 其中所述 N- 聚糖中半乳糖的 量高于未被如本文所教导的基因工程化的宿主细胞中可获得的量。 本发明还提供基因工程 化宿主细胞, 其中通常不能利用半乳糖作为单一碳源的宿主细胞已被如本文所教导的基因 工程化以能够利用半乳糖作为单一碳源。 本文的使得宿主细胞能够利用半乳糖作为单一碳 源的方法利用巴斯德毕赤酵母作为模型。 本文的方法可用于使得通常不能利用半乳糖作为 碳源的其他酵母或真菌物种能够利用半乳糖作为碳源。
     为 解 决 两 个 问 题, 基因工程化的宿主细胞 ( 其已被基因工程化为能够产生 半乳糖末端的 N- 聚糖 ) 被进一步基因工程化为表达 Leloir 途径酶 : 半乳糖激酶 (EC 2.7.1.6)、 UDP- 半乳糖 -4- 差向异构酶 (EC 5.1.3.2) 和半乳糖 -1- 磷酸尿苷酰转移酶 (EC 2.7.7.12)。任选地, 宿主细胞可另外表达半乳糖通透酶。这使得宿主细胞能够利用半乳糖作为碳源并产生 UDP- 半乳糖库, 其反过来作为涉及包括半乳糖残基的 N- 聚糖合成的半乳 糖转移酶的底物。 因此, 本文中的宿主细胞和方法能够产生糖蛋白组合物, 特别是抗体和 Fc 片段组合物, 其中所述半乳糖末端的 N- 聚糖的比例高于在糖工程化的低等真核细胞中可 获得的比例。重组宿主细胞可生产重组糖蛋白例如抗体和 Fc 融合蛋白, 其中 G0 ∶ G1/G2 比值小于 2 ∶ 1 或 G0 ∶ G1/G2 比值为 1 ∶ 1 或更小或 G0 ∶ G1/G2 比值为 1 ∶ 2 或更小。
     本文所述的宿主细胞和方法特别用于生产这样的抗体和 Fc 片段, 其含有具有 N- 聚糖的融合蛋白, 所述 N- 聚糖具有半乳糖残基末端。在抗体或抗体片段重链 Asn-297 处的 N- 聚糖对抗体的结构和功能重要。这些功能包括 Fcγ 受体结合、 激活补体的能力、 激 活细胞毒性 T 细胞 (ADCC) 的能力和血清稳定性。但是, 在酵母或哺乳动物细胞中目前的抗 体生产通常缺乏对于 N- 糖基化的控制, 特别是在重链的恒定区或 Fc 区 Asn-297 处发生的 N- 糖基化, 以及特别是控制在 N- 聚糖上末端半乳糖的水平的能力。一般而言, 已发现尽管 已被基因工程化为产生在 N- 聚糖中包括半乳糖残基的糖蛋白的酵母细胞可以高效地产生 许多具有含有半乳糖的 N- 聚糖的糖蛋白, 但是细胞产生抗体具有含有半乳糖的 N- 聚糖的 能力并不一样高效。 如本文所示, 本文的宿主细胞和方法提供这样的宿主细胞, 其与未被如 本文所述基因工程化的细胞相比, 可以产生更高水平的具有含有半乳糖的 N- 聚糖的抗体。
     尽管在不具有末端半乳糖残基的 N- 聚糖上末端的半乳糖水平可以在体外在利用 可溶性半乳糖基转移酶以将带电的半乳糖残基添加到 N- 聚糖的末端的反应中增加, 但是 该体外方法费用高、 复杂并且不容易扩大规模用于生产大量糖蛋白。 因此, 本文公开的宿主 细胞 ( 并且其能够在体内产生分泌的具有增加的末端半乳糖水平的 N- 聚糖的糖蛋白, 包 括抗体或抗体片段 ) 提供生产具有含有增加的半乳糖水平的 N- 聚糖的抗体组合物的更理 想的方法。因此, 本发明在抗体生产中具有显著改进并且首次提供控制具体抗体特征例如 N- 聚糖中半乳糖水平的能力, 和特别是生产具有改进的功能性特征的重组糖蛋白。
     另外, 当本文的方法用于已被基因工程化为产生具有唾液酸化的 N- 聚糖的糖蛋 白的宿主细胞中时, 半乳糖末端的 N- 聚糖是唾液酸转移酶的底物。因此, 唾液酸化的 N- 聚 糖的量部分地随可用于唾液酸化的半乳糖末端的 N- 聚糖的量而变化。本文中的宿主细胞 和方法提供用于增加半乳糖末端的或含有半乳糖的 N- 聚糖的量的方法, 其中当在已被基 因工程化为产生唾液酸化的 N- 聚糖的宿主细胞中生产时, 产生这样的宿主细胞, 其与未被 如本文所教导的基因工程化的宿主细胞相比, 产生增加量的唾液酸化的 N- 聚糖。
     尽管本发明用于生产包含半乳糖末端的或含有半乳糖的 N- 聚糖的糖蛋白, 但是 本发明还用作用于选择表达任意类型异源蛋白 ( 不论是否是糖蛋白 ) 的重组宿主细胞的 选择方法。表达一种或两种但不是全部 Leloir 途径酶活性的重组宿主细胞用编码异源蛋 白和不存在于重组宿主细胞中的 Leloir 途径酶的一个或多个核酸分子转化。由于转化的 重组宿主细胞含有完整的 Leloir 途径, 可通过在半乳糖是单一碳源的培养基中培养转化 的重组宿主细胞来获得选择表达对于非转化的细胞是异源蛋白的转化的重组宿主细胞。 因 此, 提供的是用于产生表达异源蛋白的重组宿主细胞的方法, 其包含以下步骤。提供宿主 细胞, 其已被基因工程化为表达一种或两种选自半乳糖激酶、 UDP- 半乳糖 -4- 差向异构酶 和半乳糖 -1- 磷酸尿苷酰转移酶的 Leloir 途径酶。在一些实施方案中, 宿主细胞能够产生 具有人样 N- 聚糖的糖蛋白, 和在其他实施方案中, 宿主细胞不产生具有人样 N- 聚糖的糖蛋 白, 因为要在宿主细胞中表达的异源蛋白不具有 N- 聚糖。用编码异源蛋白和提供的重组宿主细胞中不表达的 Leloir 途径酶或多种酶的一个或多个核酸分子转化宿主细胞。转化的 宿主细胞在含有半乳糖作为单一碳能源的培养基中培养以提供表达异源蛋白的重组宿主 细胞。任选地, 宿主细胞可另外包括编码半乳糖通透酶的核酸分子。在具体实施方案中, 宿 主细胞被基因工程化为控制 O- 糖基化或在控制 O- 糖基化的条件下生长或二者。在另外的 实施方案中, 宿主细胞另外已被修饰为降低磷酸甘露糖基转移酶和 / 或 β- 甘露糖基转移 酶活性 .
     在低等真核细胞中基因工程化糖基化途径
     在 大 多 数 真 核 细 胞 中 N- 糖 基 化 通 过 将 脂 类 - 连 接 的 Glc3Man9GlcNAc2 寡 糖 结 构 转 移 到 新 生 多 肽 的 特 定 Asn 残 基 上 在 内 质 网 (ER) 中 起 始 (Lehle 和 Tanner, Biochim.Biophys.Acta 399 : 364-74(1975) ; Kornfeld 和 Kornfeld, Annu.Rev.Biochem 54 : 631-64(1985) ; Burda 和 Aebi, Biochim.Biophys.Acta-General Subjects 1426 : 239-257(1999))。对来自 N- 连接寡糖的所有三个葡萄糖部分和单个特定甘露糖的修饰 产生 Man 8GlcNAc2( 参见图 1), 其使得糖蛋白易位到高尔基体, 在高尔基体中发生进一步 寡 糖 加 工 (Herscovics, Biochim.Biophys.Acta 1426 : 275-285(1999) ; Moremen 等 人, Glycobiology 4 : 113-125(1994))。在高尔基体中, 哺乳动物 N- 聚糖加工不同于酵母和许 多其他真核细胞, 包括植物和昆虫。哺乳动物以特定反应顺序加工 N- 聚糖, 涉及在从寡糖 在添加 GlcNAc 以形成杂合中间体 N- 聚糖 GlcNAcMan5GlcNAc2 之前, 去除三个末端 α-1, 2- 甘露糖 (Schachter, Glycoconj.J.17 : 465-483(2000))( 参见图 1)。该杂合结构是甘露 糖苷酶 II 的底物, 所述甘露糖苷酶 II 在寡糖上去除末端 α-1, 3- 和 α-1, 6- 甘露糖以得到 N- 聚糖 GlcNAcMan3GlcNAc2(Moremen, Biochim.Biophys.Acta 1573(3) : 225-235(1994))。 最后, 如图 1 所示, 通过在添加半乳糖和唾液酸残基后, 添加至少一个另外的 GlcNAc 残基, 产生复合 N- 聚糖 (Schachter, (2000), 如上 ), 虽然唾液酸通常在某些人蛋白, 包括 IgGs 上 缺乏 (Keusch 等人, Clin.Chim.Acta 252 : 147-158(1996) ; Creus 等人, Clin.Endocrinol. (Oxf)44 : 181-189(1996))。
     在酿酒酵母中, N- 聚糖加工涉及在其通过整个高尔基体时, 添加甘露糖至寡糖, 有 时产生具有大于 100 个甘露糖残基的高甘露糖基化的聚糖 (Trimble 和 Verostek, Trends Glycosci.Glycotechnol.7 : 1-30(1995) ; Dean, Biochim.Biophys.Acta-General Subjects 1426 : 309-322(1999))( 参见图 1)。在通过 α-1, 6- 甘露糖基转移酶 (Ochlp) 将第一个 α-1, 6- 甘露糖添加到 Man8GlcNAc2 后, 另外的甘露糖基转移酶延伸具有 α-1, 2-、 α-1, 6- 和末端 α-1, 3- 连接的甘露糖以及甘露糖基磷酸的 Man9GlcNAc2 聚糖。 巴斯德毕赤酵母是 甲基营养酵母, 通常用于异源蛋白的表达, 具有与酿酒酵母类似的糖基化机制 (Bretthauer 和 Castellino, Biotechnol.Appl.Biochem.30 : 193-200(1999) ; Cereghino 和 Cregg, Fems Microbiol.Rev.24 : 45-66(2000) ; Verostek 和 Trimble, Glycobiol.5 : 671-681(1995))。 但 是, 与 N- 糖基化的复杂度一致, 巴斯德毕赤酵母中的糖基化不同于酿酒酵母中的糖基化, 原因在于它缺乏添加末端 α-1, 3- 连接的甘露糖的能力, 而是添加其他甘露糖残基, 包括 磷酸甘露糖和 β- 连接的甘露糖 (Miura 等人, 基因 324 : 129-137(2004) ; Blanchard 等人, Glycoconj.J.24 : 33-47(2007) ; Mille 等人, J.Biol.Chem.283 : 9724-9736(2008))。
     在 以往工 作中, 我 们证明巴斯 德毕 赤酵 母 的 och1 突 变 体 缺乏 起 始 酵母 型 外 链 形 成 的 能 力, 并 且 因 此, 不 能 高 甘 露 糖 化 N- 聚 糖 (Choi 等 人, Proc.Natl.Acad.Sci.USA 100 : 5022-5027(2003))。另外, 我们鉴定了编码负责 β- 甘露糖转移的高尔基体定 位 (residing) 酶的新的基因家族并证明该家族的多个成员的缺失降低或消除免疫原性 β- 甘露糖转移 ( 参见美国公开的申请号 US2006/0211085)。随后引入五种单独的糖基 化酶得到在分泌的模式蛋白上产生复合人 N- 聚糖的菌株 ( 参见图 3A 相对于图 3B)(Choi 等 人, Proc.Natl.Acad.Sci.USA 100 : 5022-5027(2003) ; Hamilton 等 人 Science 310 : 1244-1246(2003) ; 美国专利号 7,029,872 ; 美国公开的申请号 2004/0018590 ; 美国公开的 申请号 2004/023004 ; 美国公开的申请号 2005/0208617 ; 美国公开的申请号 2004/0171826 ; 美国公开的申请号 2005/0208617 ; 美国公开的申请号 2005/0170452 和美国公开的申请 号 2006/0040353。更近期地, 构建能够在酵母菌株产生的分泌的蛋白上产生充分唾液酸 化的 N- 聚糖的重组酵母菌株已在美国公开的申请号 2005/0260729 和 2006/0286637 和 Hamilton 等人, Science 313 : 1441-1443(2006) 中描述。
     复合 N- 聚糖的成熟涉及添加半乳糖至末端 GlcNAc 部分, 这是可以被几种半乳糖 基转移酶 (GalT) 催化的反应。在人中, 存在 GalT 的七种同种型 (I-VII), 其中至少四种 已显示在体外在 UDP- 半乳糖存在下转移半乳糖至末端 GlcNAc(Guo, 等人, Glycobiol.11 : 813-820(2001))。最先鉴定的酶, 已知为 GalTI, 通常被认为是作用 N- 聚糖的主要酶, 这 已由体外实验、 小鼠敲除研究和组织分布分析支持 (Berger 和 Rohrer, Biochimie 85 : 261-74(2003) ; Furukawa 和 Sato, Biochim.Biophys.Acta 1473 : 54-66(1999))。 如 本 文 所示, 人 GalTI 的表达, 当其在宿主细胞高尔基体适当定位时, 可以在能够产生含有末端 GlcNA 的前体的糖工程化的酵母菌株中转移半乳糖至复合 N- 聚糖上。另外, UDP- 半乳糖 4- 差向异构酶的表达以产生 UDP- 半乳糖库和 UDP- 半乳糖转运蛋白的表达以将底物移动至 高尔基体在能够产生末端 GlcNAc 前体的菌株中产生几乎相当量的 β-1, 4- 半乳糖转移到 N- 聚糖上。 经由对于中间 N- 聚糖底物在 GlcNAc 和半乳糖基转移酶之间的分离和降低的竞 争, 定位子文库的重复筛选得到复合 N- 聚糖结构高于于杂合 N- 聚糖结构的改进的产生。
     以往, 在一组精确设计的实验 (an elegant set of experiments) 中, 人 GalTI 显 示具有将 β-1, 4- 半乳糖转移到末端 GlcNAc 的活性, 这要求首先产生 Alg1p 酶的突变体, 其将核心或少甘露糖转移到在生长中的 N- 聚糖前体分子 (Schwientek 等人, J.of Biol. Chem 271 : 3398-3405(1996))。该突变引起 GlcNAc2 截短的 N- 聚糖部分地转移到蛋白, 并 产生末端 GlcNAc。这之后, 作者表明人 GalTI 能够将半乳糖以 β-1, 4- 连接转移到该人工 末端 GlcNAc 结构。重要的是, 显示了人 GalTI 可以在酵母的高尔基体中以活性形式表达。
     基于上述, 首先利用靶向宿主细胞高尔基体的人 GalTI- 前导肽融合蛋白的表达 来检测本发明。在随后筛选人 GalTII、 GalTIII、 GaITIV、 GalTV、 牛 GalTI 和一对推测的线 虫 (C.elegans)GalT 后, 发现人 GalTI 看起来是在该异源的系统中将半乳糖转移到复合双 触角 N- 聚糖的最具活性的酶。 这可能表明 hGalTI 是用于转移至该底物 ( 双触角复合 N- 聚 糖 ) 的最具能力的酶或它可能仅是检测的 GalT 酶中最稳定的和最具活性的或二者的组合。 有意思的是, 当利用将甘露糖苷酶 II 和 GnT II 催化结构域 - 引导融合蛋白定位于高尔基体 的相同前导肽将 GalT 定位于高尔基体时, 产生其中末端半乳糖在 α-1, 3 臂上的杂合 N- 聚 糖结构的显著百分比 ( 直至 20% )。甘露糖苷酶 II 或 GnT II 活性的表达的增加不能显著 降低该现象。但是, 筛选酵母型 II 分泌途径定位前导肽 ( 定位于分泌途径期望的细胞器例 如 ER、 高尔基体或反式高尔基体网络的肽 ) 文库得到几种活性 GalT- 前导肽融合蛋白, 其当被转化至宿主细胞时, 产生显著降低水平的杂合 N- 聚糖结构和增加的复合 N- 聚糖结构。 之 前, 已报道等分的 (bisecting)GlcNAc 转移是高尔基体中 N- 聚糖的成熟中对于随后糖转移 的停止信号, 包括阻止果糖的转移 (Umana 等人, Nature Biotechnol.17 : 176-180(1999))。 此处的数据表明半乳糖转移到 α-1, 3 臂产生类似的停止信号, 阻止甘露糖苷酶 II 和 GnT II 进行的 α-1, 6 臂的成熟。
     上述结果表明在重组宿主细胞中产生的具有半乳糖末端或含有半乳糖的杂合 N- 聚糖与具有半乳糖末端的或含有半乳糖的复合 N- 聚糖的比值是 GalTI 位于高尔基体相 对于甘露糖苷酶 II 和 GnT II 位于高尔基体中的结果, 并且通过操纵三种酶的定位, 可以操 纵杂合 N- 聚糖与复合 N- 聚糖的比值。为了增加具有半乳糖末端的或含有半乳糖的杂合 N- 聚糖的产率, 所有三种酶活性应被靶向至高尔基体的相同区域, 例如通过利用相同分泌 途径靶向前导肽来靶向所有三种酶活性。或者, 筛选 GalT- 前导肽融合蛋白的文库来鉴定 将 GalT 活性定位于高尔基体的融合蛋白, 在高尔基体中更可能的是在其他两个酶可以发 挥作用之前, GalT 作用 N- 聚糖底物。 该增加了具有半乳糖末端的或含有半乳糖的杂合 N- 聚 糖相比于具有半乳糖末端的或含有半乳糖的复合 N- 聚糖的产率。相反地, 为了降低具有半 乳糖末端的或含有半乳糖的杂合 N- 聚糖的产率, 应利用与其他两种酶活性所利用的分泌 途径靶向前导肽不同的分泌途径靶向前导肽来定位 GalT 活性。这可通过筛选 GalT- 前导 肽融合蛋白文库以鉴定 GalT- 前导肽融合蛋白组合来获得, 所述 GalT- 前导肽融合蛋白组 合产生这样的宿主细胞, 在其中与具有半乳糖末端的或含有半乳糖的杂合 N- 聚糖的产率 相比, 具有半乳糖末端的或含有半乳糖的复合 N- 聚糖的产率增加。
     该结果进一步强调了当在异源宿主系统中表达嵌合糖基化酶时, 筛选催化结构 域和分泌途径定位前导肽文库的价值, 这是之前在 Choi 等人, Proc.Natl.Acad.Sci.USA 100 : 5022-5027(2003) 中说明的并在美国专利号 7,029,872 和 7,449,308 中描述的概念。 由于全基因组序列的可获得性、 更复杂的 PCR 和克隆技术以及更高通量的分析技术如质 谱, 筛选数以百计甚至数以千计的组合是可能的。重要的是, 这种类型的组合筛选已证实 在检测酶活性与驱动逐步反应之间的差异, 每个依赖于之前的产物而完成。此处, 尽管在 UDP- 半乳糖 4- 差向异构酶的情况下, 筛选的几种酶看起来具有产生 UDP- 半乳糖库相对相 同的能力, 但是检测的四种 UDP- 半乳糖转运蛋白中仅一种在该异源宿主中证实有活性, 包 括令人惊讶地, 来自一种酵母 ( 粟酒裂殖酵母 ) 的一种无活性转运蛋白。另外, 从多种分泌 途径定位前导肽的筛选中, 其中许多产生活性酶组合, 发现仅三种得到较高程度的具有双 触角末端半乳糖 (G2) 的均一的复合 N- 聚糖 ( > 85% )。高甘露糖和杂合中间结构的减少 对于这类异源表达系统在生产治疗用糖蛋白中的用途具有重要的作用, 因为高甘露糖结构 已显示具有有效免疫原性并且最近的证据已表明肝毒性可源自过于丰富的杂合 N- 聚糖。
     因此, 美国公开的申请号 2006/0286637 教导了在不通常产生含有半乳糖的糖蛋 白的宿主细胞中获得半乳糖转移的方法, 三种条件已被克服 : (1) 在高尔基体中内源半乳 糖基转移酶 (GalT) 的缺乏, (2) 内源 UDP-Gal 不能转运至高尔基体和 (3) 低的内源细胞质 UDP-Gal 库。在缺乏 UDP-Gal 转运蛋白的情况下, 半乳糖向 N- 聚糖上末端 GlcNAc 残基的转 移为约 55-60%。在缺乏 UDP- 葡萄糖 -4- 差向异构酶的情况下, 半乳糖向 N- 聚糖上末端 GlcNAc 残基的转移为约 10-15%。
     利用具有暴露的 N- 聚糖 ( 其在人中通常被唾液酸化 ) 的报告子蛋白 ( 人纤溶酶原的 K3 结构域 ) 已制备了所有上述修饰以产生宿主细胞 ( 其可产生半乳糖基化的 N- 聚糖 ), 并在美国公开的申请号 20060040353 中报道。但是, 以可与哺乳动物细胞相比较的方式, 这 些糖工程化的酵母菌株仅产生部分的半乳糖转移到抗体 Fc 聚糖上, 引起具有小于 10% G2 和小于 25% G1 结构的 N- 聚糖库, 偏好于具有末端 GlcNAc 的复合 N- 聚糖。这与哺乳动物 细胞系类似, 其中抗体 (IgG Fc Asn 297)N- 聚糖含有减少量的末端半乳糖。
     半乳糖残基转移到 N- 聚糖上需要活化的半乳糖 (UDP-Gal) 库。 在低等真核细胞中 产生高于内源水平的这类库的一种方式是如上所述并在美国公开的申请号 2006/0040353 所示的 UDP- 半乳糖 4 差向异构酶的表达。另一种方式本发明, 其包括上述细胞, 其中用核 酸分子转化所述宿主细胞, 所述核酸分子编码至少以下三种 Leloir 途径酶 : 半乳糖激酶 (EC2.7.1.6)、 半乳糖 -1- 磷酸尿苷酰转移酶 EC 2.7.7.12) 和 UDP- 半乳糖 4 差向异构酶 (EC 5.1.3.2)。半乳糖激酶是催化半乳糖代谢的第一步 ( 称为半乳糖磷酸化为半乳糖 -1- 磷 酸 ) 的酶。半乳糖 -1- 磷酸尿苷酰转移酶催化半乳糖代谢的第二步骤, 其是 UDP- 葡萄糖和 半乳糖 -1- 磷酸转换为 UDP- 半乳糖和葡萄糖 -1- 磷酸。任选地, 另外可以包括的是编码质 膜半乳糖通透酶的核酸分子。半乳糖通透酶是质膜己糖转运蛋白, 其从外部来源输入半乳 糖。Leloir 途径显示于图 4。
     如本文所示, 当编码半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳 糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性的基因被引入上述酵母, 同时 向该酵母给料酵母外源半乳糖, 并诱导抗体表达时, 抗体 Fc N- 聚糖上末端半乳糖的水平实 质增加, 因此增加产生的 G2N- 聚糖的量 : N- 聚糖可在人 Fc 上获得, 其中大于 50%的 N- 聚 糖是 G2。通透酶是任选的, 因为发现细胞中的内源通透酶能够将半乳糖输入细胞。因此, 当使用时, 半乳糖通透酶可以是能够使半乳糖穿过细胞膜转运的任意质膜己糖转运蛋白, 例如, 来自酿酒酵母的 GAL2 半乳糖通透酶 ( 参见 GenBank : M81879)。半乳糖激酶可以是能 够催化半乳糖磷酸化为半乳糖 -1- 磷酸的任意酶, 例如, 来自酿酒酵母的 GAL1 基因 ( 参见 GenBank : X76078)。半乳糖 -1- 磷酸尿苷酰转移酶可以是催化 UDP- 葡萄糖和半乳糖 -1- 磷 酸转换为 UDP- 半乳糖和葡萄糖 -1- 磷酸的任意酶, 例如, 酿酒酵母的 GAL7( 参见 GenBank : M12348)。UDP- 半乳糖 4 差向异构酶可以是催化 UDP- 葡萄糖转换为 UDP- 半乳糖的任意酶, 例如酿酒酵母的 GAL10( 参见 GenBank NC_001134), 粟酒裂殖酵母的 GALE( 参见 GenBank NC_003423) 和人的 hGALE( 参见 GenBank NM_000403)。差向异构酶还可提供为融合蛋白, 其中差向异构酶的催化结构域被融合至半乳糖基转移酶的催化结构域 ( 参见美国公开的 申请号 US2006/0040353)。
     将上述 Leloir 途径酶引入巴斯德毕赤酵母菌株产生能够同化环境半乳糖的重组 细胞。另外, 当上述 Leloir 途径酶被引入能够生产具有含有半乳糖的 N- 聚糖的糖蛋白的 细胞中时, 得到的重组细胞能够产生与未被如此工程化的细胞产生的糖蛋白相比, 在复合 N- 聚糖上具有更高水平 β-1, 4- 半乳糖的糖蛋白。因此, 这些工程化步骤的组合已得到这 样的宿主细胞, 其被特定地糖工程化和代谢地工程化为对于糖蛋白例如抗体和 Fc- 融合蛋 白的 N- 聚糖的糖基化的增加的控制。因此, 这些糖工程化的酵母细胞系能够有效的产生重 组抗体和 Fc 融合蛋白同时允许控制 N- 聚糖加工。
     表达载体
     一般而言, 半乳糖激酶、 UDP- 半乳糖 -4- 差向异构酶和半乳糖 -1- 磷酸尿苷酰转移酶 ( 以及任选地半乳糖通透酶 ) 作为来自表达载体的表达盒的组分而表达。在另外的方 面, 在宿主细胞中另外包括的是编码重组目的蛋白的表达载体, 其在具体的实施方案中另 外包括促进重组蛋白从宿主细胞中分泌的序列。对于每种 Leloir 途径酶和重组目的蛋白, 编码它的表达载体最低程度含有这样的序列, 其影响编码 Leloir 途径酶或重组蛋白的核 酸序列的表达。该序列被可操作连接到编码 Leloir 途径酶或重组蛋白的核酸分子。这类 表达载体还可含有另外的元件, 如复制起点、 选择标记、 转录或终止信号、 着丝粒、 自我复制 序列等。
     根据本发明, 编码重组目的蛋白和上述 Leloir 途径酶的核酸分子可以分别地位 于表达载体中以允许过表达的重组目的蛋白和上述 Leloir 途径酶的受调节的表达。尽管 重组蛋白和上述 Leloir 途径酶可以在相同的表达载体中编码, 但是上述 Leloir 途径酶优 选地在与编码重组蛋白的载体分开的表达载体中编码。编码上述 Leloir 途径酶和重组蛋 白的核酸分子位于分开的表达载体中可以增加产生的重组蛋白的量。
     如本文所用, 表达载体可以是可复制的或不可复制的表达载体。可复制的表达载 体可以不依赖于宿主细胞染色体 DNA 复制或因为这类载体具有整合到宿主细胞染色体 DNA 而依赖于宿主细胞染色体 DNA 复制。整合至宿主细胞染色体 DNA 后, 这类表达载体可以失 去一些结构元件但保留编码重组蛋白或上述 Leloir 途径酶的核酸分子和可以作用于重组 蛋白或上述 Leloir 途径酶的表达的片段。因此, 本发明的表达载体可以是染色体整合或染 色体非整合的表达载体。
     在引入编码上述 Leloir 途径酶和重组蛋白的核酸分子后, 然后通过诱导编码重 组蛋白的核酸的表达, 使重组蛋白过表达。在另一实施方案中, 建立这样的细胞系, 其组成 型或诱导型表达上述 Leloir 途径酶。编码将被过表达的重组蛋白的表达载体被引入这类 细胞系以获得重组蛋白的增加的产生。在具体实施方案中, 编码 Leloir 途径酶的核酸分子 被可操作连接到组成型启动子。
     本发明表达载体可以是在一种宿主细胞类型例如大肠杆菌 (Escherichia coli) 中可复制的并在另一种宿主细胞类型例如真核宿主细胞中进行很少复制或不能复制的, 只 要表达载体允许上述 Leloir 途径酶或过表达的重组蛋白的表达并因而促进这类重组蛋白 在选择的宿主细胞类型中的分泌。
     如本文所述的表达载体包括这样的 DNA 或 RNA 分子, 其被工程化为对期望的基因 即编码上述 Leloir 途径酶或重组蛋白的基因的控制表达。这类载体还编码核酸分子片段, 其被可操作连接到编码本发明上述 Leloir 途径酶或重组蛋白的核酸分子。在本发明上下 文中, 可操作连接意思是这类片段可以作用于编码上述 Leloir 途径酶或重组蛋白的核酸 分子的表达。这些核酸序列包括启动子、 增强子、 上游控制元件、 转录因子或抑制子结合位 点、 终止信号和可以在预期的宿主细胞中控制基因表达的其它元件。 优选载体是载体、 细菌 噬菌体、 黏粒或病毒。
     本发明的表达载体在酵母或哺乳动物细胞中发挥功能。酵母载体可以包括酵母 2μ 环及其衍生物, 编码酵母自我复制序列的酵母载体, 酵母小染色体, 任意酵母整合载体 等。多种类型酵母载体的详细列表在 Parent 等人 (Yeast 1 : 83-138(1985)) 中提供。
     能够作用于基因产物的表达的元件或核酸序列包括启动子、 增强子元件、 上游激 活序列、 转录终止信号和多聚腺苷酸位点。所有这类启动子和转录调节元件, 单独或组合,被预期用于本发明的表达载体中。另外, 基因 - 工程化的和突变的调节序列还在本文中的 预期。
     启动子是用于控制基因表达的 DNA 序列元件。具体地, 启动子确定转录起始位点 并可以包括 TATA 盒和上游启动子元件。选择的启动子是期望在选择的具体宿主系统中可 操纵的那些。例如, 当利用酵母宿主细胞例如酿酒酵母、 乳酸克鲁维酵母或巴斯德毕赤酵 母时, 酵母启动子用于本发明的表达载体, 而真菌启动子将用于宿主细胞例如黑曲霉、 粗糙 脉胞菌或里氏木霉。酵母启动子的实例包括但不限于 GAPDH, AOX1, SEC4, HH1, PMA1, OCH1, GAL1, PGK, GAP, TPI, CYC1, ADH2, PHO5, CUP1, MFα1, FLD1, PMA1, PDI, TEF 和 GUT1 启动子。 Romanos 等人 (Yeast 8 : 423-488(1992)) 提供了酵母启动子和表达载体的综述。Hartner 等人, Nucl.Acid Res.36 : e76( 于 2008 年 6 月 6 日在线出版 ) 描述了用于巴斯德毕赤酵母 中异源蛋白精确调节表达的启动子文库。
     可操作连接本文公开的核酸分子的启动子可以是组成型启动子和诱导型启动子。 诱导型启动子是结合转录因子后以增加或降低的速率引导转录的启动子。 如本文所用的转 录因子包括可以结合启动子的调节或控制区并因而影响转录的任意因子。 在宿主细胞中转 录因子的合成或启动子结合能力可以通过将宿主暴露于诱导物或将诱导物从宿主细胞培 养基中去除来控制。 因此, 为了调节诱导型启动子的表达, 将诱导物添加或从宿主细胞的生 长培养基中去除。这类诱导物可以包括糖、 磷酸、 醇、 金属离子、 激素、 热、 冷等。例如, 在酵 母中常用诱导物是葡萄糖、 半乳糖等。
     选择的转录终止序列是在选择的具体宿主系统中可操纵的那些。例如, 当利用酵 母宿主细胞例如酿酒酵母、 乳酸克鲁维酵母或巴斯德毕赤酵母时, 酵母转录终止序列用于 本发明的表达载体, 而真菌转录终止序列将用于宿主细胞例如黑曲霉、 粗糙脉胞菌或里氏 木霉。转录终止序列包括但不限于酿酒酵母 CYC 转录终止序列 (ScCYC TT)、 巴斯德毕赤酵 母 ALG3 转录终止序列 (ALG3 TT)、 巴斯德毕赤酵母 ALG6 转录终止序列 (ALG6 TT)、 巴斯德毕 赤酵母 ALG12 转录终止序列 (ALG12 TT)、 巴斯德毕赤酵母 AOX1 转录终止序列 (AOX1 TT)、 巴 斯德毕赤酵母 OCH1 转录终止序列 (OCH1 TT) 和巴斯德毕赤酵母 PMA1 转录终止序列 (PMA1 TT)。
     本发明的表达载体还可编码选择标记。选择标记是基因功能物, 其赋予宿主细胞 可鉴定的性状以使用携带选择标记的载体转化的细胞可以与非转化的细胞区分。 载体中包 含选择标记还可用于确保连接到标记的基因功能物保留在宿主细胞群体中。 这类选择标记 可以赋予任意容易鉴定的显性性状, 例如药物抗性、 合成或代谢细胞营养物的能力等。
     酵母选择标记包括药物抗性标记和基因功能物, 其允许酵母宿主细胞合成基本 的细胞营养物, 例如氨基酸。常用于酵母的药物抗性标记包括氯霉素、 卡那霉素、 甲氨蝶 呤、 G418( 遗传霉素 )、 博莱霉素等。允许酵母宿主细胞合基本的细胞营养物的基因功能物 与在相应基因组功能中具有营养缺陷型突变的可利用的酵母菌株一起使用。常见酵母选 择标记提供用于合成亮氨酸 (LEU2)、 色氨酸 (TRP1 和 TRP2)、 尿嘧啶 (URA3, URA5, URA6)、 组氨酸 (HIS3)、 赖氨酸 (LYS2)、 腺嘌呤 (ADE1 或 ADE2) 等的基因功能物。其他酵母选择 标记包括来自酿酒酵母的 ARR3 基因, 其赋予在亚砷酸盐存在下生长的酵母细胞亚砷酸 盐 抗 性 (Bobrowicz 等 人, Yeast, 13 : 819-828(1997) ; Wysocki 等 人, J.Biol.Chem.272 : 30061-30066(1997))。大量合适的整合位点包括美国公开的申请号 2007/0072262 中列举的那些并包括与已知酿酒酵母和其它酵母或真菌的基因座的同源物。 用于将载体整合至酵 母的方法是熟知的, 例如, 参见 WO2007136865。
     因此, 本发明表达载体可以编码选择标记, 其用于在存在于培养物中的细胞群体 中鉴定和维持含有载体的宿主细胞。在一些环境下, 选择标记还可用于扩增表达载体的拷 贝数。在诱导来自本发明表达载体的转录以产生编码过表达的重组蛋白或 Leloir 途径酶 的 RNA 后, RNA 被细胞因子翻译以产生重组蛋白或 Leloir 途径酶。
     在酵母和其它真核细胞中, 通过核糖体结合 mRNA 的 5′帽和核糖体延 mRNA 移动至 第一个 AUG 起始密码子 ( 在此处多肽合成可以开始 ) 而启动信使 RNA(mRNA) 的翻译。在酵 母和哺乳动物细胞中的表达通常不需要核糖体 - 结合位点和起始密码子之间特定数量的 核苷酸 ( 如有时在原核表达系统中需要的 )。但是, 对于在酵母或哺乳动物宿主细胞中表 达, mRNA 中第一个 AUG 密码子优选是期望的翻译起始密码子。
     另外, 当表达在酵母宿主细胞中进行时, 长的非翻译引导序列例如长于 50-100 个 核苷酸的存在可以减弱 mRNA 的翻译。酵母 mRNA 引导序列具有约 50 个核苷酸的平均长度, 富含腺嘌呤, 具有较少的二级结构和几乎通常使用第一个 AUG 来起始。由于不具有这些特 征的引导序列可以降低蛋白翻译的效率, 酵母引导序列优选用于在酵母宿主细胞中过表达 的基因产物或分子伴侣蛋白的表达。 许多酵母引导序列的序列是本领域技术人员已知的和 可利用的, 例如, 参考 Cigan 等人 (Gene 59 : 1-18(1987)). 除了启动子、 核糖体 - 结合位点和起始密码子的位置, 可以影响得到的表达水平 的因素包括可复制的表达载体的拷贝数。 通常通过载体复制起点和与其关联的任意顺式作 用控制元件来确定载体的拷贝数。例如, 编码调节的着丝粒的酵母游离载体的拷贝数的增 加可通过诱导紧密排列至着丝粒的启动子的转录来获得。 另外, 在酵母载体中编码酵母 FLP 功能物还可增加载体的拷贝数。
     通过组合来自可利用的载体的 DNA 片段, 通过合成编码这类调节元件的核酸分子 或通过克隆新的调节元件并使新的调节元件位于该载体, 本领域技术人员还可容易地设计 和制备包括上述序列的表达载体。产生表达载体的方法是熟知的。过表达的 DNA 方法见于 种种关于基因工程的标准实验室手册中的任意。
     本发明的表达载体可以通过以适当的方法将上述 Leloir 途径酶和重组蛋白的编 码区连接到启动子和用于控制基因表达的其它序列元件上来制备。在该表达载体构建后, 这类载体被转化至宿主细胞, 其中可以表达过表达的重组蛋白和 Leloir 途径酶。用表达载 体转化酵母和其它低等真核细胞的方法是本领域技术人员熟知的和容易利用的。例如, 表 达载体可以通过几种方法包括醋酸锂、 原生质体、 电穿孔和类似方法中的任意被转化至酵 母细胞。
     宿主细胞
     酵母例如巴斯德毕赤酵母、 甲醇毕赤酵母和多形汉逊酵母可用于细胞培养, 因为 它们能够生长至高细胞密度和分泌大量重组蛋白。 同样, 丝状真菌例如黑曲霉、 镰孢菌属的 种、 粗糙脉胞菌等可用于以工业规模产生本发明的糖蛋白。 一般而言, 用于实践本文的方法 的低等真核细胞包括通常不能利用半乳糖作为碳源的酵母和真菌。 不能利用半乳糖作为碳 源的酵母的实例包括但不限于毕赤酵母属的甲基营养酵母, 例如巴斯德毕赤酵母, 和酵母, 例如 S.kudriavzevii、 C.glabrata、 K.waltii 和 E.gossypii。酵母可用于糖蛋白的表达,
     因为它们可以是较经济地培养, 提供高产量, 并且当适当修饰时, 能够合适的糖基化。酵母 特别提供了确定的遗传学, 允许快速转化、 测试蛋白定位策略和容易的基因敲除技术。 合适 的载体具有表达控制序列, 例如启动子, 包括 3- 磷酸甘油酸激酶或其他糖酵解酶, 以及复 制起点, 终止序列等, 如期望的。因此, 上述宿主细胞 ( 其不能通常利用半乳糖作为碳源 ) 已被基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷 酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性, 使得宿主细胞能够利用半乳糖作为碳 源。
     低等真核细胞, 特别是酵母, 还可被基因修饰以使它们表达糖蛋白, 其中糖基化模 式是人样或人源化的。这可通过如 Gerngross 等人, 美国公开的申请号 2004/0018590 所述 去除选择的内源糖基化酶和 / 或提供外源酶来获得。例如, 宿主细胞可以被选择或工程化 为缺乏 1, 6- 甘露糖基转移酶活性, 其将另外添加甘露糖残基至糖蛋白的 N- 聚糖上。
     在一个实施方案中, 如本文所述被基因工程化为同化环境半乳糖作为碳源的宿主 细胞还如下所述被基因工程化为产生复合 N- 聚糖。这类宿主细胞另外包括 α1, 2- 甘露糖 苷酶催化结构域 ( 其融合至通常不与催化结构域结合的细胞靶向信号肽并被选择将 α1, 2- 甘露糖苷酶活性靶向宿主细胞的 ER 或高尔基体 )。重组糖蛋白经过宿主细胞的 ER 或 高尔基体产生包含 Man5GlcNAc2 糖形的重组糖蛋白, 例如包含主要 Man5GlcNAc2 糖形的重组 糖蛋白组合物。例如, 美国专利号 7,029,872 和美国公开的专利申请号 2004/0018590 和 2005/0170452 公开了能够产生包含 Man5GlcNAc2 糖形的糖蛋白的低等真核生物宿主细胞。 这些宿主细胞当进一步如本文所教导的被基因工程化为表达半乳糖激酶活性、 UDP- 半乳 糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性 时, 能够利用半乳糖作为碳源。
     紧接前述宿主细胞另外包括 GlcNAc 转移酶 I(GnT I) 催化结构域 ( 其融合至通常 不与催化结构域结合的细胞靶向信号肽并被选择将 GlcNAc 转移酶 I 活性靶向宿主细胞的 ER 或高尔基体 )。重组糖蛋白经过宿主细胞的 ER 或高尔基体产生包含 GlcNAcMan5GlcNAc2 糖形的重组糖蛋白, 例如包含主要 GlcNAcMan5GlcNAc2 糖形的重组糖蛋白组合物。美国专 利号 7,029,872 和美国公开的专利申请号 2004/0018590 和 2005/0170452 公开了能够产生 包含 GlcNAcMan5GlcNAc2 的糖蛋白的低等真核生物宿主细胞。上述细胞产生的糖蛋白可以 体外用氨基己糖苷酶处理以产生包含 Man5GlcNAc2 糖形的重组糖蛋白。这些宿主细胞当进 一步如本文所教导的被基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活 性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性时, 能够利用半乳糖 作为碳源。
     然后, 紧接前述宿主细胞另外包括甘露糖苷酶 II 催化结构域 ( 其融合至通常不与 催化结构域结合的细胞靶向信号肽并被选择将甘露糖苷酶 II 活性靶向宿主细胞的 ER 或 高尔基体 )。重组糖蛋白经过宿主细胞的 ER 或高尔基体产生包含 GlcNAcMan3GlcNAc2 糖形 的重组糖蛋白, 例如包含主要 GlcNAcMan3GlcNAc2 糖形的重组糖蛋白组合物。美国专利号 7,029,872 和美国公开的专利申请号 2004/0230042 公开了表达甘露糖苷酶 II 酶和能够生 产糖蛋白具有主要 GlcNAc2Man3GlcNAc2 糖形的低等真核生物宿主细胞。上述细胞产生的糖 蛋白可以体外用氨基己糖苷酶处理以产生包含 Man3GlcNAc2 糖形的重组糖蛋白。这些宿主 细胞当进一步如本文所教导的被基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性时, 能够利 用半乳糖作为碳源。
     然后, 紧接前述宿主细胞另外包括 GlcNAc 转移酶 II(GnT II) 催化结构域 ( 其 融合至通常不与催化结构域结合的细胞靶向信号肽并被选择将 the GlcNAc 转移酶 II 活 性靶向宿主细胞的 ER 或高尔基体 )。重组糖蛋白经过宿主细胞的 ER 或高尔基体产生包 含 GlcNAc2Man3GlcNAc2(G0) 糖形的重组糖蛋白, 例如包含主要 GlcNAc2Man3GlcNAc2 糖形的 重组糖蛋白组合物。美国专利号 7,029,872 和美国公开的专利申请号 2004/0018590 和 2005/0170452 公开了能够产生包含 GlcNAc2Man3GlcNAc2 糖形的糖蛋白的低等真核生物宿 主细胞。上述细胞产生的糖蛋白可以体外用氨基己糖苷酶处理以产生包含 Man3GlcNAc2 糖 形的重组糖蛋白。 这些宿主细胞当进一步如本文所教导的被基因工程化为表达半乳糖激酶 活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半 乳糖通透酶活性时, 能够利用半乳糖作为碳源。
     最 后, 紧接前述宿主细胞另外包括半乳糖基转移酶催化结构域 ( 其融合至 通常不与催化结构域结合的细胞靶向信号肽并被选择将半乳糖基转移酶活性靶向 宿 主 细 胞 的 ER 或 高 尔 基 体 )。 重 组 糖 蛋 白 经 过 宿 主 细 胞 的 ER 或 高 尔 基 体 产 生 包 含 GalGlcNAc2Man3GlcNAc2(G1) 或 Gal2GlcNAc2Man3GlcNAc2(G2) 糖 形 或 其 混 合 物 的 重 组 糖 蛋 白, 例 如 包 含 主 要 GalGlcNAc2Man3GlcNAc2(G1) 糖 形 或 Gal2GlcNAc2Man3GlcNAc2(G2) 糖 形或其混合物的重组糖蛋白组合物。美国专利号 7,029,872 和美国公开的专利申请 号 2006/0040353 公 开 了 能 够 产 生 包 含 Gal2GlcNAc2Man3GlcNAc2 糖 形 的 糖 蛋 白 的 低 等 真核生物宿主细胞。上述细胞产生的糖蛋白可以体外用半乳糖苷酶处理以产生包含 GlcNAc2Man3GlcNAc2 糖形的重组糖蛋白, 例如包含主要 GlcNAc2Man3GlcNAc2 糖形的重组糖蛋 白组合物。这些宿主细胞当进一步如本文所教导的被基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通 透酶活性时, 能够利用半乳糖作为碳源并能够生产这样的糖蛋白, 其中含有半乳糖的 N- 聚 糖的比例大于未被基因工程化为包括上述 Leloir 途径酶的宿主细胞中的比例。
     在另一实施方案中, 紧接前述宿主细胞 ( 其如本文所公开的能够产生具有半乳糖 末端的复合 N- 聚糖并能够同化半乳糖作为碳源 ) 可另外包括唾液酸转移酶催化结构域 ( 其融合至通常不与催化结构域结合的细胞靶向信号肽并被选择将唾液酸转移酶活性靶向 宿主细胞的 ER 或高尔基体 )。重组糖蛋白经过宿主细胞的 ER 或高尔基体产生包含主要 NANA2Gal2GlcNAc2Man3GlcNAc2 糖形或 NANAGal2GlcNAc2Man3GlcNAc2 糖形或其混合物的重组 糖蛋白。对于低等真核生物宿主细胞例如酵母和丝状真菌, 有用的是宿主细胞另外包括提 供 CMP- 唾液酸用于转移至 N- 聚糖的方法。美国公开的专利申请号 2005/0260729 公开了 基因工程化低等真核细胞以具有 CMP- 唾液酸合成途径的方法, 和美国公开的专利申请号 2006/0286637 公开了基因工程化低等真核细胞以产生唾液酸化的糖蛋白的方法。 这些宿主 细胞当进一步如本文所教导的被基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差向 异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性时, 能够利 用半乳糖作为碳源并能够生产这样的糖蛋白, 其中含有半乳糖的 N- 聚糖的比例大于未被 基因工程化为包括上述 Leloir 途径酶的宿主细胞中的比例。
     在另一实施方案中, 产生主要具有 GlcNAcMan5GlcNAc2 N- 聚糖的糖蛋白的宿主细胞另外包括半乳糖基转移酶催化结构域 ( 其融合至通常不与催化结构域结合的细胞靶向 信号肽并被选择将半乳糖基转移酶活性靶向宿主细胞的 ER 或高尔基体 )。 重组糖蛋白经过 宿主细胞的 ER 或高尔基体产生包含主要 GalGlcNAcMan5GlcNAc2 糖形的重组糖蛋白。 这些宿 主细胞当进一步如本文所教导的被基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差 向异构酶活性、 半乳糖 -1- 磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性时, 能够 利用半乳糖作为碳源。
     在另一实施方案中, 紧接前述宿主细胞 ( 其如本文所公开的能够产生具有半乳 糖末端的杂合 N- 聚糖并能够同化半乳糖作为碳源 ) 可另外包括唾液酸转移酶催化结构 域 ( 其融合至通常不与催化结构域结合的细胞靶向信号肽并被选择将唾液酸转移酶活性 靶向宿主细胞的 ER 或高尔基体 )。重组糖蛋白经过宿主细胞的 ER 或高尔基体产生包含 NANAGalGlcNAcMan5GlcNAc2 糖形的重组糖蛋白。这些宿主细胞当进一步如本文所教导的被 基因工程化为表达半乳糖激酶活性、 UDP- 半乳糖 -4- 差向异构酶活性、 半乳糖 -1- 磷酸尿 苷酰转移酶活性以及任选地半乳糖通透酶活性时, 能够利用半乳糖作为碳源。
     多种前述宿主细胞另外包括一个或多个糖转运蛋白, 例如 UDP-GlcNAc 转运蛋白 ( 例如乳酸克鲁维酵母和小家鼠 (Mus musculus)UDP-GlcNAc 转运蛋白 )、 UDP- 半乳糖转运 蛋白 ( 例如黑腹果蝇 UDP- 半乳糖转运蛋白 ) 和 CMP- 唾液酸转运蛋白 ( 例如人唾液酸转运 蛋白 )。 因为低等真核生物宿主细胞例如酵母和丝状真菌缺乏上述转运蛋白, 优选的是低等 真核生物宿主细胞例如酵母和丝状真菌被基因工程化为包括上述转运蛋白。
     宿主细胞另外包括这样的细胞, 其通过删除或破坏一个或多个 β- 甘露糖基转移 酶基因 ( 例如 BMT1, BMT2, BMT3 和 BMT4) 被基因工程化为消除具有 α- 甘露糖苷酶 - 抗性 的 N- 聚糖的糖蛋白 ( 参见, 美国公开的专利申请号 2006/0211085) 和通过删除或破坏磷酸 甘露糖基转移酶基因 PNO1 和 MNN4B 之一或二者被基因工程化为消除具有磷酸甘露糖残基 的糖蛋白 ( 参见例如, 美国专利号 7,198,921 和 7,259,007), 在另外的方面, 还可包括删除 或破坏 MNN4A 基因。破坏包括破坏编码特定酶的开放读码框或利用干扰 RNA、 反义 RNA 或 类似物破坏编码一种或多种 β- 甘露糖基转移酶和 / 或磷酸甘露糖基转移酶的开放读码框 的表达或消除编码一种或多种 β- 甘露糖基转移酶和 / 或磷酸甘露糖基转移酶的 RNA 的翻 译。宿主细胞可另外包括任意一种修饰为产生特定 N- 聚糖结构的前述宿主细胞。
     宿主细胞另外包括这样的低等真核细胞 ( 例如酵母例如巴斯德毕赤酵母 ), 其通 过删除或破坏一个或多个蛋白 O- 甘露糖基转移酶 (Dol-P-Man : 蛋白 (Ser/Thr) 甘露糖基 转移酶基因 )(PMT) 被基因修饰以控制糖蛋白的 O- 糖基化 ( 参见美国专利号 5,714,377) 或如公开的国际申请号 WO 2007061631 中公开的在 Pmtp 抑制剂和 / 或 α- 甘露糖苷酶存 在下生长, 或二者。 破坏包括破坏编码 Pmtp 的开放读码框或利用干扰 RNA、 反义 RNA 或类似 物破坏编码一个或多个 Pmtp 的开放读码框的表达或消除编码一个或多个 Pmtp 的 RNA 的翻 译。宿主细胞可另外包括任意一种修饰为产生特定 N- 聚糖结构的前述宿主细胞。
     Pmtp 抑制剂包括但不限于苯亚甲基噻唑烷二酮类。 可以利用的苯亚甲基噻唑烷二 酮的实例是 5-[[3, 4- 双 ( 苯基甲氧基 ) 苯基 ] 亚甲基 ]-4- 氧代 -2- 硫代 -3- 噻唑烷乙酸 ; 5-[[3-(1- 苯基乙氧基 )-4-(2- 苯基乙氧基 )] 苯基 ] 亚甲基 ]-4- 氧代 -2- 硫代 -3- 噻唑 烷乙酸和 5-[[3-(1- 苯基 -2- 羟基 ) 乙氧基 )-4-(2- 苯基乙氧基 )] 苯基 ] 亚甲基 ]-4- 氧 代 -2- 硫代 -3- 噻唑烷乙酸 .在具体实施方案中, 至少一个内源 PMT 基因的功能或表达被降低、 破坏或缺失。例 如, 在具体的实施方案中, 至少一个选自 PMT1、 PMT2、 PMT3 和 PMT4 基因的内源 PMT 基因的功 能或表达被降低、 破坏或缺失 ; 或在一个或多个 PMT 抑制剂存在下培养宿主细胞。 在另外的 实施方案中, 宿主细胞包括一个或多个 PMT 基因缺失或破坏以及在一个或多个 Pmtp 抑制剂 存在下培养宿主细胞。在这些实施方案的具体方面, 宿主细胞还表达分泌的 α-1, 2- 甘露 糖苷酶。
     PMT 缺失或破坏和 / 或 Pmtp 抑制剂通过降低 O- 糖基化占据 (occupancy) 即通过 降低在糖蛋白上被糖基化的 O- 糖基化位点的总数来控制 O- 糖基化。进一步添加细胞分泌 的 α-1, 2- 甘露糖苷酶降低糖蛋白上 O- 聚糖的甘露糖链长度来控制 O- 糖基化。因此, 将 PMT 缺失或破坏和 / 或 Pmtp 抑制剂与分泌的 α-1, 2- 甘露糖苷酶的表达组合通过降低占据 和链长度来控制 O- 糖基化。在具体的情况中, 确定 PMT 缺失或破坏、 Pmtp 抑制剂和 α-1, 2- 甘露糖苷酶的具体组合, 经验上是因为具体的异源糖蛋白 ( 例如 Fab 和抗体 ) 可通过 具有不同效率程度的高尔基体被表达和转运, 因此可需要 PMT 缺失或破坏、 Pmtp 抑制剂和 α-1, 2- 甘露糖苷酶的具体组合。 在另一方面, 编码一个或多个内源甘露糖基转移酶的基因 被缺失。该缺失可以与提供分泌的 α-1, 2- 甘露糖苷酶和 / 或 PMT 抑制剂组合或可以代替 提供分泌的 α-1, 2- 甘露糖苷酶和 / 或 PMT 抑制剂。
     因此, O- 糖基化的控制可以用于在本文公开的宿主细胞中以更高的总产量或适当 组装的糖蛋白的产量生产具体糖蛋白。 O- 糖基化的降低或消除看起来具有组装和转运完整 抗体和 Fab 片段的优势效果, 因为它们穿越分泌途径和被转运至细胞表面。因此, 在 O- 糖 基化被控制的细胞中, 适当组装的抗体或 Fab 片段的产率比在 O- 糖基化未被控制的宿主细 胞中得到的产率增加。
     因 此, 预 期 的 是 已 被 基 因 修 饰 的 宿 主 细 胞, 以 产 生 糖 蛋 白, 其中在糖蛋白上 的 主 要 N- 聚 糖 包 括 但 不 限 于 Man8GlcNAc2、 Man7GlcNAc2、 Man6GlcNAc2、 Man5GlcNAc2、 GlcNAcMan5GlcNAc2、 GalGlcNAcMan5GlcNAc2、 NANAGalGlcNAcMan5GlcNAc2、 Man3GlcNAc2、 GlcNAc (1-4) Man 2 GlcNAc 2 、Gal (1-4) GlcNAc (1-4) Man 3 GlcNAc 2 、NANA (1-4) Gal (1-4) GlcNAc (1-4) Man3GlcNAc2。 另外包括的是这样的宿主细胞, 其产生具有前述 N- 聚糖的具体混合物的糖蛋 白。
     本文中的宿主细胞和方法用于产生广泛的重组蛋白和糖蛋白。 可以在本文公开的 宿主细胞中产生的重组蛋白和糖蛋白的实例包括但不限于红细胞生成素 (EPO), 细胞因子 例如干扰素 α、 干扰素 β、 干扰素 γ 和干扰素 ω, 和粒细胞集落刺激因子 (GCSF), GM-CSF, 凝固因子例如因子 VIII、 因子 IX 和人蛋白 C, 抗凝血酶 III, 凝血酶, 可溶性 IgE 受体 α- 链, 免疫球蛋白例如 IgG、 IgG 片段、 IgG 融合体和 IgM, 免疫粘附素和其它 Fc 融合蛋白例如可 溶性 TNF 受体 -Fc 融合蛋白, RAGE-Fc 融合蛋白, 白细胞介素, 尿激酶, 糜蛋白酶和尿胰蛋白 酶抑制剂, IGF- 结合蛋白, 表皮生长因子, 生长激素释放因子, 膜联蛋白 V 融合蛋白, 制管张 素, 血管内皮生长因子 -2, 骨髓样前体抑制因子 -1, 骨保护蛋白, α-1- 抗胰蛋白酶, 甲胎蛋 白, DNA 酶 II, 人纤溶酶原的三环 3, 葡糖脑苷脂酶, TNF 结合蛋白 1, 促卵泡激素, 细胞毒性 T 淋巴细胞相关抗原 4-Ig, 跨膜激活剂和钙调节剂和亲环蛋白配体, 胰高血糖素样蛋白 1 和 IL-2 受体激动剂。
     本文公开的本发明的重组宿主细胞特别用于生产抗体、 Fc 融合蛋白等, 期望的是与在进行如本文所教导的修饰之前的宿主细胞中获得的抗体组合物的半乳糖百分比相比, 在重组宿主细胞中提供增加的含有半乳糖的 N- 聚糖的百分比的抗体组合物。一般而言, 宿 主细胞能够使得这样的抗体组合物产生, 其中所述 G0 ∶ G1/G2 糖形的比值小于 2 ∶ 1。可 以在本文中的宿主细胞中产生并具有 G0 ∶ G1/G2 的比值小于 2 ∶ 1 的抗体的实例包括但不 限于人抗体、 人源化的抗体、 嵌合抗体、 重链抗体 ( 例如骆驼 (camel 或 llama))。具体抗体 包括但不限于以其通用名称 ( 靶 ) 引用的以下抗体 : 莫罗单抗 -CD3( 抗 -CD3 受体抗体 )、 阿 昔单抗 ( 抗 -CD417E3 抗体 )、 利妥昔单抗 ( 抗 -CD20 抗体 )、 达珠单抗 ( 抗 -CD25 抗体 )、 巴 利昔单抗 ( 抗 -CD25 抗体 )、 帕利珠单抗 ( 抗 -RSV( 呼吸道合胞病毒 ) 抗体 )、 英夫利昔单 抗 ( 抗 -TNFα 抗体 )、 曲妥珠单抗 ( 抗 -Her2 抗体 )、 吉姆单抗奥佐米星 ( 抗 -CD33 抗体 )、 阿仑单抗 ( 抗 -CD52 抗体 )、 替伊莫单抗 ( 抗 -CD20 抗体 )、 阿达木单抗 ( 抗 -TNFα 抗体 )、 131 奥马珠单抗 ( 抗 -IgE 抗体 )、 托西莫单抗 - I( 抗 -CD20 抗体的碘化的衍生物 )、 依法利珠 单抗 ( 抗 -CD11a 抗体 )、 西妥昔单抗 ( 抗 -EGF 受体抗体 )、 戈利木单抗 ( 抗 -TNFα 抗体 )、 贝伐单抗 ( 抗 VEGF-A 抗体 ) 及其变体。可以在本文中的宿主细胞中产生的 Fc- 融合蛋白 的实例包括但不限于依那西普 (TNFR-Fc 融合蛋白 )、 FGF-21-Fc 融合蛋白、 GLP-1-Fc 融合 蛋白、 RAGE-Fc 融合蛋白、 EPO-Fc 融合蛋白、 ActRIIA-Fc 融合蛋白、 ActRIIB-Fc 融合蛋白、 胰高血糖素 -Fc 融合物、 泌酸调节肽 -Fc- 融合物及其类似物和变体。 本文公开的重组细胞可用于产生适合于化学缀合异源的肽或药物分子的抗体和 Fc 片段。例如 WO2005047334、 WO2005047336、 WO2005047337 和 WO2006107124 公开了将肽 或药物分子与 Fc 片段化学缀合。EP1180121、 EP1105409 和 US6593295 公开了将血液组分 与肽等化学缀合, 其包括完整抗体。
     如本文所教导的宿主细胞和 / 或编码 Leloir 途径酶的多种组合的质粒载体可以 作为试剂盒提供, 其提供用于产生表达异源蛋白的重组巴斯德毕赤酵母的选择系统。巴斯 德毕赤酵母宿主细胞被基因工程化为表达选自半乳糖激酶、 UDP- 半乳糖 -4- 差向异构酶和 半乳糖 -1- 磷酸尿苷酰转移酶的 Leloir 途径酶中的一种或两种。任选地, 宿主细胞也可表 达半乳糖通透酶。克隆载体包括多克隆位点和编码宿主细胞中未提供的 Leloir 途径酶的 表达盒。载体可另外包括在多克隆位点两侧的巴斯德毕赤酵母可操纵的启动子和转录终 止序列以及可另外包括用于将载体靶向到宿主细胞基因组中的具体位置的靶向序列。在 一些实施方案中, 试剂盒提供这样的载体, 其编码所有三个 Leloir 途径酶 ( 半乳糖激酶、 UDP- 半乳糖 -4- 差向异构酶和半乳糖 -1- 磷酸尿苷酰转移酶 ) 和包括多克隆位点和缺乏三 种 Leloir 途径酶的宿主细胞。试剂盒应另外包括说明书、 载体图谱等。
     以下实施例意图是促进对本发明的进一步理解。
     实施例 1
     在该实施例中, 通常根据 Davidson 等人在美国公开的申请号 2006/0040353 中公 开的方法构建能够产生含有半乳糖的 N- 聚糖的巴斯德毕赤酵母宿主细胞。本文的方法可 用于将其他物种的通常不能利用半乳糖作为碳源的重组宿主细胞变成能够利用半乳糖作 为单一碳源的重组宿主细胞。
     半 乳 糖 基 转 移 酶 I 嵌 合 酶。 利 用 PCR 引 物 RCD192(5’ -GCCGCGACCTGAGCC GCCTGCCCCAAC-3’ (SEQ ID NO : 1)) 和 RCD186(5’ -CTAGCTCGGTGTCCCGATGTCCACTGT-3’ (SEQ ID NO : 2)) 从人肾脏 cDNA(Clontech)PCR 扩增智人 (Homo sapiens)β-1, 4- 半乳糖基转移
     酶 I 基因 (hGalTI, Genbank AH003575)。该 PCR 产物被克隆至 pCR2.1 载体 (Invitrogen) 并测序。从该克隆进行 PCR 重叠突变发生用于三个目的 : 1) 去除开放读码框内的 NotI 位 点同时维持野生型蛋白序列, 2) 在内源跨膜结构域的立即下游截短蛋白以仅提供催化结构 域和 3) 在 5’ 和 3’ 端分别引入 AscI 和 PacI 位点用于克隆。为了进行 PCR 重叠突变发生, 利用 PCR 引物 RCD198(5’ -CTTAGGCGCGCCGGCCGCGACCTGAGCCGCCTGCCC-3’ (SEQ ID NO : 3)) 和 RCD201(5’ -GGGGCATATCTGCCGCCCATC-3’ (SEQ ID NO : 4))PCR 扩增基因的 5’ 端直至 NotI 位点和利用 PCR 引物 RCD200(5’ -GATGGGCGGCAGATATGCCCC-3’ (SEQ ID NO : 5)) 和 RCD199( 5’ -CTTCTTAATTAACTAGCTCGGTGTCCCGATGTCCAC-3’ (SEQ ID NO : 6))PCR 扩增 3’ 端。用引物 RCD198 和 RCD199 将产物在一起重叠以重合成具有野生型氨基酸序列同时去除 NotI 位点的 截短的编码半乳糖基转移酶的开放读码框 (ORF)。新的 hGalTIβPCR 催化结构域产物被克 隆至 pCR2.1 载体 (Invitrogen, Carlsbad, CA) 并测序。引入的 AscI 和 PacI 位点用它们 识别的限制酶切割并将 DNA 片段亚克隆进质粒 pRCD259 的 PpGAPDH 启动子下游以产生质粒 pRCD260。编码 hGalTI43 催化结构域 ( 缺乏最先的 43 个氨基酸 ; SEQ ID NO : 50) 的核苷酸 序列显示于 SEQ ID NO : 49。
     来自酿酒酵母、 巴斯德毕赤酵母和乳酸克鲁维酵母的将蛋白靶向到高尔基体中的 各种位置的酵母引导序列文库被连接到该载体 NotI 和 AscI 位点之间, 从而将这些引导 编码序列符合读框地与编码 hGalTIβ43 催化结构域的开放读码框融合。上述 GalT 融合 蛋白的组合文库在 YSH44 中表达并通过从来自各个转化子的纯化的 K3 释放 N- 聚糖和用 MALDI-TOF MS 测定它们各自分子量分析得到的转化子。 巴斯德毕赤酵母菌株 YSH44 表达人 纤溶酶原的三环 3 结构域 (K3), 其为实质上均一的具有双触角末端 GlcNAc 残基的复合糖形 (GlcNAc2Man3GlcNAc2, 参见图 1)。活性构建体之一是 Mnn2-hGalTIβ43, 其编码融合蛋白, 所述融合蛋白包含酿酒酵母 Mnn2 靶向肽的的 N- 末端 ( 氨基酸 1-36(53)SEQ ID NO : 20) 融 合至 hGalTIβ43 催化结构域的 N- 末端 ( 氨基酸 44-398 ; SEQ ID NO : 50)。引导序列含有 酿酒酵母 MNN2 基因最先的 108bp 并且该序列确实已被插入 pRCD260 的 NotI 和 AscI 位点 之间以产生质粒 pXB53。用 XbaI 线性化质粒 pXB53 并转化至酵母菌株 YSH44 以产生菌株 YSH71。菌株 YSH44 已描述在美国公开的申请号 20070037248、 20060040353、 20050208617 和 20040230042 中以及菌株 YSH71 已描述在美国公开的申请号 20060040353 中。
     如 图 3C 所 示, 菌 株 YSH71 产 生 的 一 小 部 分 ( 约 10 % )N- 聚 糖 具 有 与 单 个 半 乳 糖 添 加 到 K3 上 的 GlcNAc2Man3GlcNAc2(G0)N- 聚 糖 底 物 一 致 的 质 量 以 产 生 而其余的 N- 聚糖与母本菌株 YSH44 产生的 N- 聚糖相 GalGlcNAc2Man3GlcNAc2(G1)N- 聚糖, 同 ( 图 3B)。图 3A 显示野生型酵母中产生的 N- 聚糖。
     我们认为对于不完全的半乳糖转移存在几种解释。这些解释包括较差的 UDP- 半 乳 糖 转 运、 较 低 的 内 源 水 平 UDP- 半 乳 糖 或 亚 最 适 的 (suboptimal)GalT 活 性。 看 起 来 半乳糖转移到 N- 聚糖上可能较低, 因为菌株可能需要转运蛋白以将 UDP- 半乳糖从细 胞 质 转 位 至 高 尔 基 体 (Ishida 等 人, J.Biochem.120 : 1074-1078(1996) ; Miura 等 人, J.Biochem(Tokyo)120 : 236-241(1996) ; Tabuchi 等 人, Biochem.Biophys.Res.Com.232 : 121-125(1997) ; Segawa 等人, FEBS Letts.451 : 295-298(1999))。转运蛋白是具有多个 跨膜结构域的复合蛋白, 其可以不适当地定位于异源宿主。但是, 几种糖核苷酸转运蛋 白, 包括 UDP- 半乳糖转运蛋白已在异源系统中活跃表达 (Sun-Wada 等人, J.Biochem.(Tokyo)123 : 912-917(1998) ; Segawa 等 人 Eur.J.Biochem.269 : 128-138(2002) ; Kainuma 等 人, Glycobiol.9 : 133-141(1999) ; Choi 等 人, Proc Natl Acad Sci U S A 100(9) : 5022-5027(2003))。为确保 UDP- 半乳糖有效转运至高尔基体, 编码 UDP- 半乳糖转运蛋 白的黑腹果蝇基因 DmUGT(GenBank 登记号 AB055493) 被克隆并将该克隆如下转化至表达 MNN2-hGalTIβ43 构建体的菌株 YSH71。
     UDP- 半乳糖转运蛋白的克隆。利用 PCR 引物 DmUGT-5’ (5’ -GGCTCGAGCGGCCGCCA CCATGAATAGCATACACATGAACGCCAATACG-3’ (SEQ ID NO : 7)) 和 DmUGT-3’ (5’ -CCCTCGAGTTAA TTAACTAGACGCGCGGCAGCAGCTTCTCCTCATCG-3’ (SEQ ID NO : 8)), 从黑腹果蝇 cDNA 文库 (UC Berkeley Drosophila 基因组 Project, 卵巢 λ-ZAP 文库 GM)PCR 扩增编码 UDP 半乳糖转运 蛋白的黑腹果蝇基因 (GenBank AB055493), 称为 DmUGT, 并将 PCR 扩增的 DNA 片段克隆至 pCR2.1(Invitrogen, Carlsbad, CA) 并测序。然后利用 NotI 和 PacI 位点将该开放读码框 亚克隆至质粒 pRCD393 的 PpOCH1 启动子下游 NotI 和 PacI 位点之间以产生质粒 pSH263。 编码 DmUGT 的核苷酸序列显示于 SEQ ID NO : 37 和 DmUGT 的氨基酸序列显示于 SEQ ID NO : 38。将该质粒用 AgeI 线性化并转化至菌株 YSH71 以产生菌株 YSH80。但是, 当编码 DmUGT 的质粒被转化至 YSH71 时, 发现 K3 的 N- 聚糖分布情况没有显著变化。因此, 我们决定将精 力集中于增强 UDP- 半乳糖细胞内库 (pool)。
     因为巴斯德毕赤酵母不能同化半乳糖作为碳源 (Kurtzman Pichia.The Yeasts : A Taxonomic Study.C.P.a.F.Kurtzman, J.W.Amsterdam, Elsevier Science Publ. : 273-352(1998)), 我们推测菌株中的 UDP- 半乳糖库可能不充分。在半乳糖同化生物包括 细菌和哺乳动物中保守的 UDP- 半乳糖 4- 差向异构酶催化 Leloir 途径的第三步。该酶通 常位于真核细胞的细胞质并负责 UDP- 葡萄糖和 UDP- 半乳糖的可逆转换 (Allard 等人, 细 胞 .Mol.Life Sci.58 : 1650-1665(2001))。我们推论异源 UDP- 半乳糖 4- 差向异构酶的表 达将产生细胞质 UDP- 半乳糖库, 去转运至高尔基体后, 将使得半乳糖转移酶将半乳糖转移 到 N- 聚糖上。
     UDP- 半 乳 糖 4- 差 向 异 构 酶 的 克 隆。 从 粟 酒 裂 殖 酵 母 (Schizosaccharomyces pombe) 克隆之前未表征的基因, 以下命名为 SpGALE, 其编码与已知的 UDP- 半乳糖 4- 差 向异构酶具有显著同一性的蛋白。利用 PCR 引物 GALE2-L(5’ -ATGACTGGTGTTCATGAAGGG -3’ (SEQ ID NO : 9)) 和 GALE2-R(5’ -TTACTTATA TGTCTTGGTATG-3’ ((SEQ ID NO : 10)), 从粟酒裂殖酵母 (ATCC24843) 基因组 DNA PCR 扩增编码预测的 UDP 半乳糖 -4- 差向异 构 酶 (GenBank NC_003423) 的 1.1Kb 粟 酒 裂 殖 酵 母 基 因, 称 为 SpGALE。PCR 扩 增 的 产 物 被 克 隆 至 pCR2.1(Invitrogen, Carlsbad, CA) 并 测 序。 测 序 显示 在 +66 位 存 在 内 含 子 (175bp)。 为 了 消 除 内 含 子, 设 计 上 游 PCR 引 物 GD1(5’ -GCGGCCGCATGA CTGGTGTTCA TGAAGGGACT GTGTTGGTTACTGGCGGCGC TGGTTATATA GGTTCTCATA CGTGCGTTGTTTTGTTAGAA AA-3’ ((SEQ ID NO : 11)), 其具有 NotI 位点, 位于内含子上游第 66 个碱基处, 然后在内含 子之前 20 个碱基和下游 PCR 引物 GD2(5’ -TTAATTAATT ACTTATATGT CTTGGTATG-3’ ((SEQ ID NO : 12)) 具有 PacI 位点。利用引物 GD1 和 GD2 以从 pCR2.1 亚克隆扩增 SpGALE 内含 子缺少的基因并将产物再克隆至 pCR2.1 并测序。然后将 SpGALE 在 NotI 和 PacI 位点之 间分别亚克隆至质粒 pRCD402 和 pRCD403 以产生质粒 pRCD406(POCH1-SpGALE-CYC1TT) 和 pRCD407(PSEC4-SpGALE-CYC1TT)。这些质粒已在之前的美国公开的申请号 20060040353 中描述。编码不含内含子的 SpGALE 的核苷酸序列显示于 SEQ ID NO : 35 和氨基酸序列显示于 SEQ ID NO : 36。
     人 UDP 半乳糖 -4- 差向异构酶 (hGalE) 具有 SEQ ID NO : 48 所示的氨基酸序列, 其 由 SEQ ID NO : 47 所示的核苷酸序列编码。可以利用 hGalE 代替 SpGALE。
     双 GalT/ 半乳糖 -4- 差向异构酶构建体的构建。含有 ScMNN2-hGalTIβ43 融合基 因的质粒 pXB53 用 XhoI 线性化并用 T4DNA 聚合酶产生平端。然后用 XhoI 和 SphI 并将末 端用 T4DNA 聚合酶产生平端从质粒 pRCD406 去除 PPpOCH1SpGALE-CYC1TT 表达盒, 并将片段插 入上述 pXB53 质粒以产生质粒 pRCD425。将该质粒用 XbaI 线性化并转化至菌株 YSH44 以 产生菌株 RDP52, 其已在之前的美国公开的申请号 20060040353 中描述。通过 MALDI-TOF MS 分析从几种转化子分离的纯化的 K3 上的 N- 聚糖。如图 3D 所示, 发现相当比例的 N- 聚 糖已获得与两个 ( 约 20 % G2 : Gal2GlcNAc2Man3GlcNAc2) 或单个半乳糖部分 ( 约 40 % G1 : Gal1GlcNAc2Man3GlcNAc2) 添加到 G0(GlcNAc2Man3GlcNAc2) 底物上的一致的质量, 而其余的 N- 聚糖保持与 YSH44 母本中发现的质量没有改变 ( 图 3B), 即 G0。
     三 GalT/ 半乳糖 -4- 差向异构酶 /UDP 半乳糖转运蛋白构建体的构建。 通过用 SacI R 消化将含有 POCH1-DmUGT-CYC1TT 的 G418 质粒 pSH263 线性化并用 T4 DNA 聚合酶进行末端 平端化。通过用 XhoI 和 SphI 消化将 PSEC4-SpGALE-CYC1TT 表达盒从质粒 pRCD407 去除并用 T4 DNA 聚合酶进行末端平端化。 然后将平末端的 SpGALE 片段插入上述 pSH263 以产生质粒 pRCD446。通过用 BglII/BamHI 消化从质粒 pXB53 释放 PGAPDHScMNN2-hGalTIβ43-CYC1TT 表 达盒并用 T4 DNA 聚合酶进行末端平端化。 然后将平末端的 hGalTI-53 插入 pRCD446 的平端 的 EcoRI 位点以产生质粒 pRCD465, 其是含有 hGalTI-53、 SpGALE 和 DmUGT 的三 G418R 质粒。 用 AgeI 线性化质粒 pRCD465 并转化至菌株 YSH44 以产生菌株 RDP80, 其如美国公开的申请 号 20060040353 中描述的。通过 MALDI-TOF MS 分析从菌株产生的分泌的 K3 释放的 N- 聚 糖。发现 N- 聚糖具有定量添加两个半乳糖残基到 G0 底物上一致的质量以产生人半乳糖基 化、 双触角复合 N- 聚糖 G2(Gal2GlcNAc2Man3GlcNAc2)( 图 3E)。 该 N- 聚糖的体外 β- 半乳糖 苷酶消化产生对应于去除两个半乳糖残基的降低的质量, 得到 G0(GlcNAc2Man3GlcNAc2)( 图 3F)。
     另外, 在 CMP- 唾液酸存在下用大鼠 α-2, 6-N- 唾液酸转移酶体外处理从菌株 RDP80 纯化的 K3 产生几乎均一地转换成 NANA2Gal2GlcNAc2Man3GlcNAc2( 图 3G)。这些结果 表明通过 (1) 充分的细胞内 UDP- 半乳糖库的代谢工程, (2) 活性的和适当定位的 GalT 的 表达和 (3) 通过活性 UDP- 半乳糖转运蛋白的 UDP- 半乳糖至高尔基体的易位, 可获得在巴 斯德毕赤酵母产生的复合 N- 聚糖高效延伸。但是, 半乳糖转移的效率通过进一步包括将 Leloir 途径的酶引入宿主细胞来改进, 如实施例 2 所示。
     菌株和培养基。大肠杆菌菌株 TOP10 或 DH5α 用于重组 DNA 工作。来源于菌株 JC308(J.Cregg, Claremont, CA) 的巴斯德毕赤酵母菌株 YSH44(Hamilton 等人, Science 301 : 1244-1246(2003)) 用于产生多种酵母菌株。酵母菌株的转化通过如前报道的电穿孔 进行 (Cregg, 等人, Mol.Biotechnol.16 : 23-52(2000))。在室温在 96 孔板形式中进行蛋白 表达 ( 除了生物反应器实验 ), 使用缓冲的甘油 - 复合培养基 (BMGY), 由 1%酵母提取物, -5 2 %蛋白胨, 100mM 磷酸钾缓冲液, pH 6.0, 1.34 %酵母氮源, 4X10 %生物素和 1 %甘油组 成, 作为生长培养基 ; 以及缓冲的甲醇 - 复合培养基 (BMMY), 由 1%甲醇替代甘油的 BMGY 组成作为诱导培养基。YPD 是 1%酵母提取物、 2%蛋白胨、 2%葡萄糖和 2%琼脂。
     限 制 和 修 饰 酶 来 自 New England BioLabs(Beverly, MA)。 寡 核 苷 酸 获 自 Integrated DNA Technologies(Coralville, IA)。β- 半乳糖苷酶获自 QAbio(San Mateo, CA)。 96 孔裂解物清除板 (lysate-clearing plate) 来自 Promega(Madison, WI)。 蛋白 - 结 合 96 孔板来自 Millipore(Bedford, MA)。盐和缓冲剂来自 Sigma(St.Louis, MO)。MALDI 基质来自 Aldrich(Milwaukee, WI)。
     蛋 白 纯 化 和 N- 聚 糖 分 析。K3 纯 化 如 前 述 (Choi 等 人, Proc.Natl.Acad.Sci. U.S.A.100 : 5022-5027(2003))。 利 用 获 自 New England BioLabs(Beverly, MA) 的 N- 糖 苷酶 F 从 K3 释放 N- 聚糖, 如前述 (Choi 等人, ibid.)。利用 Applied Bio 系统 (Foster City, CA) 的 Voyager DE PRO 线性 MALDI-TOF 质谱仪测定聚糖的分子量, 如前述 (Choi 等 人, ibid.)。
     生物反应器培养。用 1mL 的种子培养物 ( 参见摇瓶培养 ) 接种含有 150mL BMGY 培养基的 500mL 带挡板的容量瓶。在 24℃将接种物培养至 OD600 为 4-6( 大约 18 小时 )。 然后将来自接种培养物的细胞离心并重悬至 50mL 发酵培养基 ( 每升培养基 : CaSO4.2H2O 0.30g, K2SO46.00g, MgSO4.7H2O 5.00g,甘 油 40.0g, PTM1 盐 2.0mL,生 物 素 4x10-3g, H3PO4(85% )30mL, PTM1 盐每升 : CuSO4.H2O 6.00g, NaI0.08g, MnSO4.7H2O 3.00g, NaMoO4.2H2O 0.20g, H3BO3 0.02g, CoCl2.6H2O 0.50g, ZnCl2 20.0g, FeSO4.7H2O 65.0g, 生物素 0.20g, H2SO4(98% )5.00mL)。
     在 3 升碟形底 (1.5 升初始进料体积 )Applikon 生物反应器中进行发酵。 发酵罐在 24℃的温度下以分批补料模式运行, 并将 pH 控制在 4.5±0.1 利用 30%氢氧化铵。通过调 整搅拌速率 (450-900rpm) 和纯氧提供, 将溶解氧维持在 40%以上, 相对于在 1atm 下用空气 饱和。空气流动速率维持在 1vvm。当在分批培养期 (the batch phase) 初始甘油 (40g/L) 被耗尽时, 这是 DO 增加的指示, 将含有 12ml/L PTM1 盐的 50%甘油溶液以 12mL/L/h 的进料 速率补料直到达到所期望的生物质浓度。在半小时饥饿期后, 起始甲醇补料 ( 含有 12mL/L PTM1 的 100%甲醇 )。 甲醇进料速率用于控制发酵罐中甲醇浓度在 0.2-0.5%之间。 利用位 于发酵罐的排出气中 TGS 气体传感器 (TGS822, 来自 Figaro Engineering Inc.) 在线测量 甲醇浓度。每 8 小时对发酵罐中进行取样和分析生物质 (OD600, 湿细胞重和细胞计数 ), 剩 余碳源水平 ( 利用 Aminex 87H 通过 HPLC 测量甘油和甲醇 ) 和细胞外蛋白含量 ( 通过 SDS page 和 Bio-Rad 蛋白测定 )。
     体外 β- 半乳糖苷酶消化。来自 RDP80 的 N- 聚糖与 β1, 4- 半乳糖苷酶 (QA bio, San Mateo, CA) 在 50mM NH4HCO3, pH6.0 中在 37℃孵育 16-20 小时。
     体外唾液酸转移。从菌株 RDP80 纯化的 K3 用作唾液酸转移的底物。将 200μg 该蛋白与 50μg CMP- 唾液酸和 15mU 大鼠重组 α-(2, 6)-(N)- 唾液酸转移酶 ( 来自 EMD Biosciences(San Diego, CA, formerly Calbiochem)) 在 50mM NH4HCO3, pH6.0 中在 37℃孵 育 16-20 小时。然后通过 PNGaseF 消化释放 N- 聚糖并通过 MALDI-TOF MS 检测。
     实施例 2
     UDP- 半乳糖 4- 差向异构酶催化 Leloir 途径的第三步 ( 图 4)。如实施例 1 所示, 在糖工程化的巴斯德毕赤酵母菌株中编码该酶的基因的异源表达引起 UDP- 半乳糖细胞内 库的产生, 如表达该异源基因的菌株中半乳糖转移显著增加所证实的。但是, 还如所示的,仅添加该酶不能赋予巴斯德毕赤酵母菌株在半乳糖 ( 作为单一碳源 ) 上生长的能力 ( 参见 图 7, 菌株 RDP578-1)。因此, 将酿酒酵母中 Leloir 途径的其余酶引入实施例 1 的各种菌株 中。因此, 在该实施例中, 构建了能够利用半乳糖作为单一碳源的巴斯德毕赤酵母宿主细 胞。 本文的方法可用于将通常不能利用半乳糖作为碳源的其他物种的重组宿主细胞制备成 能够利用半乳糖作为单一碳源的重组宿主细胞。
     酿酒酵母 GAL1 的克隆。 利用 PCR 引物 PB158(5’ -TTAGCGGCCGCAGGAATGACTAAATCTC ATTCA-3’ (SEQ ID NO : 13)) 和 PB159(5’ -AACTTAATTAAGCTTATAATTCATATAGACAGC-3’ (SEQ ID NO : 14)), 从酿酒酵母基因组 DNA( 菌株 W303, 标准 smash 和 grab 基因组 DNA 制备 )PCR 扩增 编码半乳糖激酶 (GenBank NP_009576) 的酿酒酵母基因 ( 称为 ScGAL1), 将 PCR 扩增的 DNA 片段克隆至 pCR2.1(Invitrogen, Carlsbad, CA) 并测序。得到的质粒命名为 pRCD917。用 NotI 和 PacI 将编码半乳糖激酶的 DNA 片段从质粒释放并将 DNA 片段亚克隆进质粒 pGLY894 的巴斯德毕赤酵母 HHT1 强组成型启动子下游 NotI 和 PacI 位点之间以产生质粒 pGLY939。 半乳糖激酶具有 SEQ ID NO : 40 所示的氨基酸序列并由 SEQ ID NO : 39 所示的核苷酸序列编 码。
     酿酒酵母 GAL2 的克隆。利用 PCR 引物 PB156(5’ -TTAGCGGCCGC-3’ (SEQ ID NO : 15)) 和 PB157(5’ -AACTTAATTAA-3’ (SEQ ID NO : 16)) 从酿酒酵母基因组 DNA( 菌株 W303, 标准 “smash and grab” 基因组 DNA 制备 )PCR 扩增编码半乳糖通透酶 (GenBankNP_013182) 的酿酒酵母基因 ( 称为 ScGAL2), 将 PCR 扩增的 DNA 片段亚克隆进 pCR2.1(Invitrogen, Carlsbad, CA) 并测序。得到的质粒命名为 pPB290。用 NotI 和 PacI 将编码半乳糖通透酶 的 DNA 片段从质粒释放并将 DNA 片段亚克隆进质粒 pJN664 的 PpPMA1 启动子下游 NotI 和 PacI 位点之间以产生质粒 pPB292。半乳糖通透酶具有 SEQ ID NO : 44 所示的氨基酸序列并 由 SEQ ID NO : 43 所示的核苷酸序列编码。
     酿 酒 酵 母 GAL7 的 克 隆。 利 用 PCR 引 物 PB160(5’ -TTAGCGGCCGCAGGAATGAC TGCTGAAGAA TT-3’ (SEQ ID NO : 17)) 和 PB161(5’ -AACTTAATTA AGCTTACAGT CTTTGTAGAT AATC-3’ (SEQ ID NO : 18) 从酿酒酵母基因组 DNA( 菌株 W303, 标准 smash and grab 基因组 DNA 制备 )PCR 扩增编码半乳糖 -1- 磷酸尿苷酰转移酶 (GenBank NP_009574) 的酿酒酵母 基因 ( 称为 ScGAL7), 将 PCR 扩增的 DNA 片段克隆至 pCR2.1(Invitrogen, Carlsbad, CA) 并 测序。得到的质粒命名为 pRCD918。用 NotI 和 PacI 将编码半乳糖 -1- 磷酸尿苷酰转移酶 的 DNA 片段从质粒释放并将 DNA 片段亚克隆进质粒 pGLY143 的 PpPMA1 强组成型启动子下 游 NotI 和 PacI 位点之间以产生质粒 pGLY940。个别地, NotI 和 PacI 位点还用于亚克隆该 ORF 至质粒 pRCD830 巴斯德毕赤酵母 TEF1 强组成型启动子下游的 NotI/PacI 处以产生质 粒 pRCD929。半乳糖 -1- 磷酸尿苷酰转移酶具有 SEQ ID NO : 42 所示的氨基酸序列并由 SEQ ID NO : 41 所示的核苷酸序列编码。
     三 ScGAL1/ScGAL7/ScGAL2 构建体的构建。将来自 pGLY917 的 ScGAL1 开放读码 框亚克隆至 pJN702, 一种巴斯德毕赤酵母 his1 敲除载体, 具有巴斯德毕赤酵母 ARG1 选 择标记 (his1::ARG1, 参见美国专利号 7,479,389) 且还含有 PGAPDH- 启动子表达盒 ; 含有 PGAPDH-ScGAL1 融合的这种新的载体命名为 pRCD928。将来自 pGLY929 的 PTEF1-ScGAL7 表达盒 亚克隆至 pGLY928, 新的载体命名为 pGLY946a。下一步, 将来自 pRCD634 的 POCH1-DmUGT( 高 尔基体 UDP- 半乳糖转运蛋白 ) 表达盒亚克隆至 pGLY946a 以产生 pGLY956b。最后, 将来自pPB292 的 PGAPDH-ScGAL2 表达盒亚克隆至 pRCD956b 以产生质粒 pRCD977b( 参见图 6)。质粒 pRCD977b 含有 DmUGT、 ScGAL1、 ScGAL7 和 ScGAL2 表达盒并具有 ARG1 显性选择标记盒。
     双 ScGAL1/ScGAL7 构建体的构建。 将来自 pGLY939 的 PTEF1-ScGAL1 表达盒亚克隆至 pGLY941, 一种敲入载体, 具有巴斯德毕赤酵母 ARG1 选择标记、 TRP1 基因座敲入区、 还含有 PGAPDH-hGalTIβ 表达盒, 该新的载体命名为 pGLY952。将来自 pGLY940 的 PPMA1-ScGAL7 表达 盒亚克隆至 pGLY952, 新的载体命名为 pGLY955。最后, 将诺尔丝菌素抗性表达盒 (NATR) 从 pGLY597( 最初来自 pAG25, 来自 EROSCARF, Scientific Research and Development GmbH, Daimlerstrasse 13a, D-61352 Bad Homburg, Germany, 参见 Goldstein 等人, 1999, Yeast 15 : 1541) 亚克隆至 pGLY952 以产生质粒 pGLY1418( 参见图 12), 其含有 hGalTIβ、 ScGAL1 R 和 ScGAL7 表达盒并具有 NAT 显性选择标记盒。
     具有所有三个基因的单一整合质粒 pRCD977b( 图 6) 被转化至巴斯德毕赤酵母菌 株 RDP578-1 以产生菌株 RDP635-1、 -2 和 -3。菌株 RDP578-1 已含有异源基因和基因敲除 用于产生含有末端 β-1, 4- 半乳糖残基的人 N- 聚糖 ( 参见图 5 和实施例 3 用于构建体 )。 菌株 RDP578-1 也包括编码酿酒酵母 UDP- 半乳糖 4- 差向异构酶编码基因 ScGAL10 的表达 盒并表达测试蛋白人三环 3。得到的菌株 RDP635-1、 -2 和 -3 具有两个拷贝的 DmUGT 半乳 糖转运蛋白。 母 本 菌 株 RDP578-1 和 具 有 ScGAL1、 ScGAL2、 ScGAL7 和 ScGAL10 基 因 的 转 化 子 (RDP635-1、 -2 和 -3) 在含有葡萄糖、 半乳糖或无碳源的最低培养基生长五天然后拍照。有 意思的是, 尽管具有分泌具有半乳糖末端的 N- 聚糖的蛋白的能力, RDP578-1 显示出不能 同化半乳糖, 同时在葡萄糖上正常生长, 如野生型巴斯德毕赤酵母所期望的。但是, 表达 ScGAL1、 ScGAL2 和 ScGAL7 基因的转化子能够同化半乳糖, 如图 7 所示。如期望的, 在缺乏 碳源的平板上观察到最低生长。这些结果表明可以构建重组巴斯德毕赤酵母, 当与 Leloir 半乳糖同化途径的基础结构 ( 但不是调节 ) 元件重构时其可同化半乳糖作为碳源。
     在糖工程化的巴斯德毕赤酵母中表达的 Fc 第 297 位 Asn 残基上 N- 聚糖的测定。 人 IgG 的 Fc 部分在每个重链二聚体上含有单个 N- 聚糖位点 (Asn297, Kabat numbering), 其通常含有不同于其他分泌的人蛋白的 N- 聚糖分布情况。通常地, 天然存在的人抗体含有 具有末端 GlcNAc 和一定量末端半乳糖的 N- 聚糖, 其基于多种因素而不同, 并很少含有显著 量的末端唾液酸。在证明 N- 聚糖的高水平末端 β-1, 4- 半乳糖后, 我们试图测定在这类糖 工程化的酵母菌株产生的抗体上观察到的 N- 聚糖分布情况。因此, 用在 AOX1 启动子的控 制下编码人免疫球蛋白 G1(IgG1) 重链的 Fc 结构域或 C- 末端半部分的质粒 (pBK138) 转化 已被基因工程化为产生具有末端半乳糖的 N- 聚糖的巴斯德毕赤酵母菌株 (YGB02 ; 参见图 8 和实施例 4)。由 PCR 鉴定的选择的阳性克隆命名为 PBP317-36( 图 8 和实施例 4)。该菌株 在摇瓶中生长并用甲醇作为单一碳源诱导。通过离心收获上清并通过蛋白 A 亲和层析进行 纯化。 纯化的蛋白在 SDS-PAGE 上分离并进行考马斯染色。 观察到具有期望大小的标记的条 带。然后将纯化的蛋白进行 PNGase 消化并通过 MALDI-TOF MS 分析释放的 N- 聚糖。得到 的 N- 聚糖 ( 图 10A) 显示与具有末端 GlcNAc 的复合人核心结构 (G0 : GlcNAc2Man3GlcNAc2) 一致的主要质量, 较少种类具有单个末端半乳糖 (G1 : GalGlcNAc2Man3GlcNAc2) 和次要种类
    (minor 物种 ) 具有用半乳糖加帽复合种类的两个臂 (G2 : Gal2GlcNAc2Man3GlcNAc2)。这些 种类的质量不同于预测的文献中报道的规范值, 原因在于缺乏单个果糖残基。糖工程化的酵母菌株不含有内源岩藻糖基转移酶, 因此缺乏将果糖添加至核心人 N- 聚糖结构的内在 性质。还观察到与 Man5GlcNAc2 一致的另一次要种类。
     然后将上述菌株 PBP317-36( 其表达组装具有末端半乳糖的人样 N- 聚糖所需的 糖基化活性和还表达 SpGALE(UDP- 半乳糖 4- 差向异构酶 )) 基因工程化为能够利用外 源半乳糖作为碳源并以代谢工程化的方式控制 N- 糖基化。构建在组成型启动子控制下 表达 ScGAL1 和 ScGAL7 的整合质粒 pGLY954( 图 9) 并将其转化至巴斯德毕赤酵母菌株 PBP317-36。质粒 pGLY954 赋予菌株 PBP317-36( 其已含有 SpGALEUDP- 半乳糖差向异构酶, 图 8) 在半乳糖 ( 作为单一碳源 ) 上生长的能力。该 gal+ 菌株命名为 RDP783。因为尽管我 们没有将半乳糖通透酶引入至细胞, 细胞仍能够利用半乳糖作为碳源, 我们得出结论 : 对巴 斯德毕赤酵母是内源的一般己糖转运蛋白能够充分穿过细胞膜转运半乳糖。
     巴斯德毕赤酵母菌株 PBP317-36 和 RDP783 具有在甲醇 - 诱导型 AOX1 启动子控制 下编码人 Fc 结构域作为分泌的报告子蛋白的整合质粒构建体。菌株 PBP317-36 和 RDP783 在标准培养基中在摇瓶中培养, 所述标准培养基含有甘油和在甲醇作为单一碳源存在下诱 导或用甲醇与不同浓度葡萄糖或半乳糖组合诱导。收获的上清蛋白通过蛋白 A 被亲和纯 化, 进行 PNGase 消化通过 MALDI-TOF MS 分析。从菌株 RDP783 的人 Fc 释放的 N- 聚糖产生 与用甲醇单独诱导或在葡萄糖或甘露糖存在下诱导后在 PBP317-36 中观察到的分布情况 类似的 N- 聚糖, 具有主要糖形 G0(GlcNAc2Man3GlcNAc2)( 图 10)。但是, 外源半乳糖给料后, 菌株 RDP783( 但不是母本菌株 PBP317-36) 产生在人 Fc 上的含有半乳糖的 N- 聚糖的剂量 依赖增加, 其主要糖形现在转移到 G1(GalGlcNAc2Man3GlcNAc2) 且在完全地 β-1, 4- 半乳糖 加帽的糖形 G2(Gal2GlcNAc2Man3GlcNAc2) 中污染增加 ( 图 10)。
     最后, 为证明用人 Fc 观察到的利用外源半乳糖控制糖基化的能力可应用于全 长单克隆抗体, 产生糖工程化的酵母菌株 YDX477( 图 11, 实施例 5), 其表达抗 -Her2 单 克 隆 抗 体。 该 菌 株 还 工 程 化 为 转 移 G2 形 的 人 N- 聚 糖 (Gal2GlcNAc2Man3GlcNAc2) 到 分 泌的糖蛋白上。在 mAb-A 的表达后 N- 聚糖的释放显示 N- 聚糖模式 ( 图 13A), 其由与 G0(GlcNAc2Man3GlcNAc2) 一致的主要峰组成, 具有与 G1(GalGlcNAc2Man3GlcNAc2) 一致的次 主要峰, 以及 G2(Gal2GlcNAc2Man3GlcNAc2) 和 M5(Man5GlcNAc2) 的次要峰。该数据与对于人 IgG1 的截短的 Fc 部分观察到的相似并且是期望的, 因为在相同残基处 (Asn-297)N- 糖基 化。构建具有 ScGAL1 和 ScGAL7 的整合质粒 pGLY1418( 图 12) 和转化至巴斯德毕赤酵母菌 株 YDX477 以制备菌株 RDP968-1。该质粒赋予菌株 YDX477( 其已含有 SpGALE UDP- 半乳糖 差向异构酶, 图 11) 在半乳糖 ( 作为单一碳源 ) 上生长的能力。
     菌株 YDX477 和 RDP968-1 在标准培养基中在摇瓶中培养, 所述标准培养基含有甘 油和在甲醇作为单一碳源存在下诱导或用甲醇与不同浓度半乳糖组合诱导。 收获的上清蛋 白通过蛋白 A 被亲和纯化, 进行 PNGase 消化通过 MALDI-TOF MS 分析。两种菌株产生与之 前用甲醇单独诱导或在葡萄糖或甘露糖存在下诱导后在 PBP317-36 中观察到的分布情况 类似的 N- 聚糖, 具有主要糖形 G0(GlcNAc2Man3GlcNAc2)( 图 10A 相对于图 13A 和 13D)。但 是, 外源半乳糖给料后, 菌株 RDP968-1( 但不是母本菌株 YDX477) 产生在抗体上的含有半乳 糖的 N- 聚糖的剂量依赖增加, 其主要糖形现在转移到 G1(GalGlcNAc2Man3GlcNAc2) 且在完 全地 β-1, 4- 半乳糖加帽的糖形 G2(Gal2GlcNAc2Man3GlcNAc2) 中污染增加 ( 图 13E 和 F)。
     实施例 3菌株 RDP578-1 的构建显示于图 5 并涉及以下步骤。菌株 JC308 是起始菌株。该 菌株已在 Choi 等人, Proc.Natl.Acad.Sci.USA 100 : 5022-5027(2003) 中描述, 但简言之, 菌株是 ura3, ade1, arg4, his4。通过利用质粒 pJN329 破坏 OCH1 基因并根据 Choi 等人 (ibid.) 和美国专利号 7,449,308 中描述的方法, 使得该菌株缺乏 α-1, 6 甘露糖基转移酶 活性以产生菌株 YJN153。质粒 pJN329 携带 PPURA3 显性选择标记, 在反选择 ura- 活性后, 通过利用质粒载体 pJN503b 和 pAS19 破坏 PNO1、 MMN4A 和 MNN4B 基因并根据美国专利号 7,259,007 中描述的方法, 使得得到的菌株 YJN156 缺乏磷酸甘露糖基转移酶活性以产生菌 株 YAS180-2。包含本文中的融合蛋白的分泌途径靶向前导肽定位催化结构域, 其被融合至 ER、 高尔基体或反式高尔基体网络。
     在 反 选 择 ura- 活 性 后, 通 常 如 美 国 专 利 号 7,465,577 中 描 述 的 利 用 质 粒 pAS24( 参见图 14) 使得得到的菌株 YAS187-2 缺乏 β- 甘露糖基转移酶活性以制备菌株 YAS218-2。质粒 pAS24 是巴斯德毕赤酵母 BMT2 敲除质粒, 其含有 PpURA3 选择标记和在 PpOCH1 启动子的下游含有编码全长小鼠高尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 的表 达盒。MmSLC35A3 具有 SEQ ID NO : 34 所示的氨基酸序列, 其由 SEQ ID NO ; 33 所示的核苷 酸序列编码。可以如美国专利号 7,465,577 所示获得在序列两侧的 5’ 和 3’ BMT2 用于去除 β- 甘露糖基转移酶活性 ( 其归因于 bmt2p)。 在对于 ura- 活性反选择菌株 YAS218-2 后, 得 到的菌株 YAS269-2 是 ura- 并具有插入 BMT2 基因的小鼠高尔基体 UDP-GlcNAc 转运蛋白。
     然后用质粒 pRCD742b( 参见图 15) 转化菌株 YAS269-2, 质粒 pRCD742b 包括编码 嵌合小鼠 α-1, 2- 甘露糖基转移酶 I(FB8 MannI)、 嵌合人 GlcNAc 转移酶 I(CONA10) 和 全长基因编码小鼠高尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 的表达盒并将质粒靶向 ADE1 基因座 ( 参见 PCT/US2008/13719)。质粒 pRCD742b 是敲入敲除 (KINKO) 质粒, 其已 在 WO2007/136865 和 WO2007136752 中描述。质粒整合进巴斯德毕赤酵母 ADE1 基因而不删 除编码 Ade1p 的开放读码框。质粒还含有 PpURA5 选择标记。编码分泌途径靶向融合蛋白 (FB8MannI) 的表达盒包括在 PpGAPDH 启动子的控制下融合至小鼠 α-1, 2- 甘露糖基转移酶 I 催化结构域 (FB MannI : SEQ ID NO : 54) 的 N- 末端的 ScSec12 前导肽 (ScSec12(8) : SEQ ID NO : 32 的最先的 103 个氨基酸 )。编码分泌途径靶向融合蛋白 CONA10 的表达盒包括在 PpPMA1 启动子的控制下融合至人 GlcNAc 转移酶 I(GnT I) 催化结构域 (SEQ ID NO : 52) 的 N- 末端的 PpSec12 前导肽 (PpSec12(10) : SEQ ID NO : 28 的最先的 29 个氨基酸 )。 质粒另外 包括在 PpSEC4 启动子的控制下编码全长小鼠高尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 的表达盒。将质粒 pRCD742b 转染进菌株 YAS269-2 产生菌株 RDP307。该菌株能够产生具有 GlcNAcMan5GlcNAc2 N- 聚糖的糖蛋白。SEQ ID NO : 53 和 51 是分别编码小鼠 α-1, 2- 甘露 糖基转移酶 I 和人 GlcNAc 转移酶 I(GnT I) 催化结构域的核苷酸序列。编码人 GnT I 的核 苷酸序列被密码子最优化用于在巴斯德毕赤酵母中表达。SEQ ID NO : 27 和 31 是分别编码 PpSEC12(10) 和 ScSEC12(8) 的核苷酸序列。
     菌株 RDP361 如下构建 : 用质粒 pDMG47 转化菌株 RDP307 以产生菌株 RDP361。质 粒 pDMG47( 参见图 16) 是 KINKO 质粒, 其整合进巴斯德毕赤酵母 TRP1 基因座而不删除编 码 Trp1p 的开放读码框。质粒还含有 PpURA3 选择标记并包括编码分泌途径靶向融合蛋白 (KD53) 的表达盒, 其包含在 PpGAPDH 启动子的控制下融合至黑腹果蝇甘露糖苷酶 II(KD : SEQ ID NO : 63) 催化结构域的 N- 末端的 ScMnn2 引导靶向肽 (ScMnn2(53) : SEQ ID NO : 19最先的 36 个氨基酸 )。质粒还含有编码分泌途径靶向融合蛋白 (TC54) 的表达盒, 其包含 在 PpPMA1 启动子的控制下融合至大鼠 GlcNAc 转移酶 II(TC : SEQ ID NO : 58) 的催化结构 域的 N- 末端的 ScMnn2 引导靶向肽 (ScMnn2(54) : SEQ ID NO : 22 的最先的 97 个氨基酸 )。 ScMnn2 前导区 53 和 54 的核酸序列分别显示于 SEQ ID NO : 19 和 21。编码黑腹果蝇甘露糖 苷酶 II 和大鼠 GlcNAc 转移酶 II(GnTII) 的催化结构域的核酸序列分别显示于 SEQ ID NO : 62 和 57。
     上述菌株 RDP361 用质粒 pRCD823b 转化以产生菌株 RDP415-1。质粒 pRCD823b( 参 见 图 17) 是 KINKO 质 粒, 其 整 合 进 巴 斯 德 毕 赤 酵 母 HIS4 基 因 座 ( 参 见 美 国 专 利 号 7,479,389) 而不删除编码 His4p 的开放读码框, 并含有 PpURA5 选择标记 ( 参见美国公开 的申请号 20040229306) 以及编码分泌途径靶向融合蛋白 (TA54) 的表达盒, 其包含大鼠 GlcNAc 转移酶 II 催化结构域 (TA : SEQ ID NO : 61), 如上述在它的 N- 末端与 ScMnn2(54) 的 最先的 97 个氨基酸融合但在 PpGAPDH 启动子的控制下。质粒还含有在 PpOCH1 启动子的控 制下编码全长黑腹果蝇高尔基体 UDP- 半乳糖转运蛋白 (DmUGT) 和在 PpPMA1 启动子的控制 下编码全长酿酒酵母 UDP- 半乳糖 4- 差向异构酶 (ScGAL10) 的表达盒。ScGAL10 具有 SEQ ID NO : 46 所示的氨基酸序列, 其由 SEQ ID NO : 45 所示的核苷酸序列编码。大鼠 GlcNAc 转 移酶 II(TA) 的核苷酸序列显示于 SEQ ID NO : 60。
     上 述 菌 株 RDP415-1 用 质 粒 pRCD893a 转 化 以 产 生 菌 株 RDP523-1。 质 粒 pGLY893a( 参见图 18) 是巴斯德毕赤酵母 his1 敲除质粒, 其含有 PpARG4 选择标记 ( 参见 美国专利号 7,479,389)。质粒包括编码分泌途径靶向融合蛋白 (KD10) 的表达盒, 其包含 在 PpPMA1 启动子的控制下融合至黑腹果蝇甘露糖苷酶 II(KD : SEQ ID NO : 63) 的催化结 构域的 N- 末端的 PpSEC12 引导靶向肽 (PpSEC12(10) : SEQ ID NO : 28 的最先的 29 个氨基 酸 )。质粒还含有编码分泌途径靶向融合蛋白 (TA33) 的表达盒, 其包含在 PpTEF1 启动子 的控制下融合至大鼠 GlcNAc 转移酶 II(TA : SEQ ID NO : 61) 的催化结构域的 N- 末端的 ScMntIp(ScKre2p) 引导靶向肽 (ScMntIp(ScKre2p)(33) : SEQ ID NO : 30 的最先的 53 个氨 基酸 )。质粒还含有编码分泌途径靶向融合蛋白 (XB53) 的表达盒, 其包含融合至人半乳糖 基转移酶 I(hGalTIβ43 ; SEQ ID NO : 50) 的催化结构域的 N- 末端的 ScMnn2p 前导肽 (53) 的最先的 36 个氨基酸。PpSEC12 和 ScMNTI(ScKRE2) 前导区的核酸序列分别显示于 SEQ ID NO : 27 和 29。编码黑腹果蝇甘露糖苷酶 II、 大鼠 GlcNAc 转移酶 II(GnT II) 和人 GalTI 的 催化结构域的核酸序列分别显示于 SEQ ID NO : 62、 60 和 49。该菌株可产生具有 N- 聚糖的 糖蛋白, 所述 N- 聚糖具有末端半乳糖残基。菌株编码两个拷贝的黑腹果蝇甘露糖苷酶 II 催化结构域和三个拷贝的大鼠 GnTII 催化结构域。
     最后, 上述菌株 RDP523-1 用质粒 pBK64 转化以产生菌株 RDP578-1。质粒 pBK64 编 码人三环 3 测试蛋白并已在 Choi 等人, Proc.Natl.Acad.Sci.USA 100 : 5022-5027(2003) 中描述。
     实施例 4
     菌株 PBP317-36 的构建显示于图 8。起始菌株是 YGLY16-3。这是具有 OCH1, PNO1, MNN4A, Mnn4B 和 BMT2 基因缺失的 ura- 菌株并可以根据实施例 3 所用方法制备。菌株 YGLY16-3 还在 WO2007136752 中公开。
     菌株 YGLY16-3 用质粒 pRCD742a( 参见图 19) 转化以制备菌株 RDP616-2。质粒pRCD742a( 参见图 19) 是 KINKO 质粒, 其整合进巴斯德毕赤酵母 ADE1 基因而不删除编码 Ade1p 的开放读码框。 质粒还含有 PpURA5 选择标记和包括编码嵌合小鼠 α-1, 2- 甘露糖基 转移酶 (FB8MannI)、 嵌合人 GlcNAc 转移酶 I(CONA10) 和全长小鼠高尔基体 UDP-GlcNAc 转 运蛋白 (MmSLC35A3) 的表达盒。 质粒与质粒 pRCD742b 相同, 除了编码嵌合人 GlcNAc 转移酶 I 的表达盒的方向为相反方向。 将质粒 pRCD742a 转染进菌株 YGLY16-3 产生菌株 RDP616-2。 该菌株能够产生具有 GlcNAcMan5GlcNAc2N- 聚糖的糖蛋白。
     反选择菌株 RDP616-2 以产生 ura- 菌株 RDP641-3 后, 然后将质粒 pRCD1006 转化至 菌株以制备菌株 RDP666。质粒 pRCD1006( 参见图 20) 是巴斯德毕赤酵母 his1 敲除质粒, 其 含有 PpURA5 基因作为选择标记。质粒含有在 PpGAPDH 启动子的控制下编码分泌途径靶向 融合蛋白 (XB33) 的表达盒 ( 其包含融合至人半乳糖基转移酶 I 催化结构域 (hGalTIβ43) 的 N- 末端的 ScMnt1p(ScKre2p)(33) 的最先的 58 个氨基酸 ) ; 在 PpOCH1 启动子的控制下 编码全长黑腹果蝇高尔基体 UDP- 半乳糖转运蛋白 (DmUGT) 的表达盒和在 PpPMA1 启动子的 控制下编码粟酒裂殖酵母 UDP- 半乳糖 4- 差向异构酶 (SpGALE) 的表达盒。
     菌株 RDP666 用质粒 pGLY167b 转化以制备菌株 RDP696-2。质粒 pGLY167b( 参见 图 21) 是巴斯德毕赤酵母 arg1 敲除质粒, 其含有 PpURA3 选择标记。质粒含有在 PpGAPDH 启动子的控制下编码分泌途径靶向融合蛋白 (CO-KD53) 的表达盒 ( 其包含融合至黑腹果蝇 甘露糖苷酶 II 催化结构域 (KD) 的 N- 末端的 ScMnn2p(53) 的最先的 36 个氨基酸 ) 和在 PpPMA1 启动子的控制下表达分泌途径靶向融合蛋白 (CO-TC54) 的表达盒 ( 其包含融合至大 鼠 GlcNAc 转移酶 II 催化结构域 (TC) 的 N- 末端的 ScMnn2p(54) 的最先的 97 个氨基酸 )。 得到的菌株 RDP696-2 进行恒化器选择 ( 参见 Dykhuizen 和 Hartl, Microbiol.Revs.47 : 150-168(1983) 关于恒化器选择的综述 )。恒化器选择产生菌株 YGB02。菌株 YGB02 可产生 具有 N- 聚糖的糖蛋白, 所述 N- 聚糖具有末端半乳糖残基。在该菌株中, 甘露糖苷酶 II 催 化结构域 (KD) 和 GnTII(TC) 被密码子最优化为在巴斯德毕赤酵母中表达的核酸分子 ( 分 别为 SEQ ID NO : 64 和 59) 编码。
     菌株 YGB02 用质粒 pBK138 转染以产生菌株 PBP317-36。质粒 pBK138( 参见图 22) 是滚入 (roll-in) 质粒, 其整合进巴斯德毕赤酵母 AOX1 启动子同时复制启动子。质粒含有 编码融合蛋白的表达盒, 其包含融合至人 Fc 抗体片段 (C- 末端 233-aa of a 人 IgG1 重链, SEQ ID NO : 66) 的 N- 末端的酿酒酵母 A 交配因子前信号序列 (SEQ ID NO : 24)。编码酿酒 酵母 A 交配因子前信号序列的核酸序列显示于 SEQ ID NO : 23 和编码人 IgG1 重链的 C- 末 端 233-aa 的核酸序列显示于 SEQ ID NO : 65)。
     实施例 5
     菌株 YDX477 的构建显示于图 11。起始菌株是 YGLY16-3。菌株 YGLY16-3 用质粒 pRCD742a( 参见图 19) 转化以制备菌株 RDP616-2。质粒 pRCD742a( 参见图 19) 是 KINKO 质粒, 其整合进巴斯德毕赤酵母 ADE1 基因而不删除编码 ade1p 的开放读码框。质粒还含 有 PpURA5 选择标记和包括编码嵌合小鼠 α-1, 2- 甘露糖基转移酶 (FB8MannI)、 嵌合人 GlcNAc 转移酶 I(CONA10) 和全长小鼠高尔基体 UDP-GlcNAc 转运蛋白 (MmSLC35A3) 表达 盒。质粒与质粒 pRCD742b 相同, 除了编码嵌合人 GlcNAc 转移酶 I 的表达盒的方向为相反 方向。将质粒 pRCD742a 转染进菌株 YGLY16-3 产生菌株 RDP616-2。该菌株能够产生具有 GlcNAcMan5GlcNAc2N- 聚糖的糖蛋白。反选择菌株 RDP616-2 以产生 ura- 菌株 RDP641-4 后, 然后将质粒 pRCD1006 转化至 菌株以制备菌株 RDP667-1. 质粒 pRCD1006( 参见图 20) 是巴斯德毕赤酵母 his1 敲除质粒, 其含有 PpURA5 基因作为选择标记。 质粒含有在 PpGAPDH 启动子的控制下编码分泌途径靶向 融合蛋白 (XB33) 的表达盒 ( 其包含融合至人半乳糖基转移酶 I 催化结构域 (hGalTIβ43) 的 N- 末端的 ScMnt1p(ScKre2p)(33) 的最先的 58 个氨基酸 ) ; 在 PpOCH1 启动子的控制下 编码全长黑腹果蝇高尔基体 UDP- 半乳糖转运蛋白 (DmUGT) 的表达盒和在 PpPMA1 启动子的 控制下编码粟酒裂殖酵母 UDP- 半乳糖 4- 差向异构酶 (SpGALE) 的表达盒。
     菌株 RDP667-1 用质粒 pGLY167b 转化以制备菌株 RDP697-1。质粒 pGLY167b( 参见 图 21) 是巴斯德毕赤酵母 arg1 敲除质粒, 其含有 PpURA3 选择标记。质粒含有在 PpGAPDH 启动子的控制下编码分泌途径靶向融合蛋白 (CO-KD53) 的表达盒 ( 其包含融合至黑腹果蝇 甘露糖苷酶 II 催化结构域 (KD) 的 N- 末端的 ScMnn2p(53) 的最先的 36 个氨基酸 ) 和在 PpPMA1 启动子的控制下表达分泌途径靶向融合蛋白 (CO-TC54) 的表达盒 ( 其包含融合至大 鼠 GlcNAc 转移酶 II 催化结构域 (TC) 的 N- 末端的 ScMnn2p(54) 的最先的 97 个氨基酸 )。 编码甘露糖苷酶 II 和 GnT II 催化结构域的核酸分子被密码子最优化用于在巴斯德毕赤酵 母中表达 ( 分别为 SEQ ID NO : 64 和 59)。该菌株可产生具有 N- 聚糖的糖蛋白, 所述 N- 聚 糖具有末端半乳糖残基。
    用 质 粒 pGLY510 转 化 菌 株 RDP697-1 以 制 备 菌 株 YDX414。 质 粒 pGLY510( 参 见 图 23) 是滚入质粒, 其整合进巴斯德毕赤酵母 TRP2 基因座同时复制基因并含有 AOX1 启动 子 -ScCYC1 终止子表达盒以及 PpARG1 选择标记。
     用质粒 pDX459-1(mAb-A) 转化菌株 YDX414 以制备菌株 YDX458。 质粒 pDX459-1( 参 见图 24) 是滚入质粒, 其靶向并整合进巴斯德毕赤酵母 AOX2 启动子并含有 ZeoR 同时复制 启动子。质粒含有编码抗 -HER2 抗体重链和抗 -HER2 抗体轻链 ( 分别为 SEQ ID NO : 68 和 70) 的分开的表达盒, 其各个在 N- 末端融合黑曲霉 α- 淀粉酶信号序列 (SEQ ID NO : 26) 并 被巴斯德毕赤酵母 AOX1 启动子控制。编码重链和轻链的核酸序列分别显示于 SEQ ID NO : 67 和 69, 和编码黑曲霉 α- 淀粉酶信号序列的核酸序列显示于 SEQ ID NO : 25。
     用质粒 pGLY1138 转化菌株 YDX458 以制备菌株 YDX477。质粒 pGLY1138( 参见图 25) 是滚入质粒, 其整合进巴斯德毕赤酵母 ADE1 基因座同时复制基因。 质粒含有 ScARR3 选 择标记基因盒。来自酿酒酵母的 ARR3 基因赋予细胞亚砷酸盐抗性, 使细胞可在亚砷酸盐存 在下生长 (Bobrowicz 等人, Yeast, 13 : 819-828(1997) ; Wysocki 等人, J.Biol.Chem.272 : 30061-30066(1997))。质粒含有在 PpAOX1 启动子的控制下编码分泌的融合蛋白的表达盒, 其包含融合至里氏木霉 (MNS1) 催化结构域 (SEQ ID NO : 56, 由 SEQ ID NO : 55 的核苷酸序 列编码 ) 的 N- 末端的酿酒酵母 α 因子前信号序列 (SEQ ID NO : 24)。融合蛋白分泌至培 养基中。
    
    
    
    
    
    
    
    
    
    尽管本发明参考例举的实施方案在本文中描述, 但应理解的是本发明不限于此。 具有本领域普通技术且获得本文教导的人员应认识到在其范围内的另外的修改和实施方 案。因此, 本发明仅通过本文所附权利要限制。
    63102333872 A CN 102333887
    序列表1/70 页
     64102333872 A CN 102333887序列表2/70 页
    65102333872 A CN 102333887序列表3/70 页
    66102333872 A CN 102333887序列表4/70 页
    67102333872 A CN 102333887序列表5/70 页
    68102333872 A CN 102333887序列表6/70 页
    69102333872 A CN 102333887序列表7/70 页
    70102333872 A CN 102333887序列表8/70 页
    71102333872 A CN 102333887序列表9/70 页
    72102333872 A CN 102333887序列表10/70 页
    73102333872 A CN 102333887序列表11/70 页
    74102333872 A CN 102333887序列表12/70 页
    75102333872 A CN 102333887序列表13/70 页
    76102333872 A CN 102333887序列表14/70 页
    77102333872 A CN 102333887序列表15/70 页
    78102333872 A CN 102333887序列表16/70 页
    79102333872 A CN 102333887序列表17/70 页
    80102333872 A CN 102333887序列表18/70 页
    81102333872 A CN 102333887序列表19/70 页
    82102333872 A CN 102333887序列表20/70 页
    83102333872 A CN 102333887序列表21/70 页
    84102333872 A CN 102333887序列表22/70 页
    85102333872 A CN 102333887序列表23/70 页
    86102333872 A CN 102333887序列表24/70 页
    87102333872 A CN 102333887序列表25/70 页
    88102333872 A CN 102333887序列表26/70 页
    89102333872 A CN 102333887序列表27/70 页
    90102333872 A CN 102333887序列表28/70 页
    91102333872 A CN 102333887序列表29/70 页
    92102333872 A CN 102333887序列表30/70 页
    93102333872 A CN 102333887序列表31/70 页
    94102333872 A CN 102333887序列表32/70 页
    95102333872 A CN 102333887序列表33/70 页
    96102333872 A CN 102333887序列表34/70 页
    97102333872 A CN 102333887序列表35/70 页
    98102333872 A CN 102333887序列表36/70 页
    99102333872 A CN 102333887序列表37/70 页
    100102333872 A CN 102333887序列表38/70 页
    101102333872 A CN 102333887序列表39/70 页
    102102333872 A CN 102333887序列表40/70 页
    103102333872 A CN 102333887序列表41/70 页
    104102333872 A CN 102333887序列表42/70 页
    105102333872 A CN 102333887序列表43/70 页
    106102333872 A CN 102333887序列表44/70 页
    107102333872 A CN 102333887序列表45/70 页
    108102333872 A CN 102333887序列表46/70 页
    109102333872 A CN 102333887序列表47/70 页
    110102333872 A CN 102333887序列表48/70 页
    111102333872 A CN 102333887序列表49/70 页
    112102333872 A CN 102333887序列表50/70 页
    113102333872 A CN 102333887序列表51/70 页
    114102333872 A CN 102333887序列表52/70 页
    115102333872 A CN 102333887序列表53/70 页
    116102333872 A CN 102333887序列表54/70 页
    117102333872 A CN 102333887序列表55/70 页
    118102333872 A CN 102333887序列表56/70 页
    119102333872 A CN 102333887序列表57/70 页
    120102333872 A CN 102333887序列表58/70 页
    121102333872 A CN 102333887序列表59/70 页
    122102333872 A CN 102333887序列表60/70 页
    123102333872 A CN 102333887序列表61/70 页
    124102333872 A CN 102333887序列表62/70 页
    125102333872 A CN 102333887序列表63/70 页
    126102333872 A CN 102333887序列表64/70 页
    127102333872 A CN 102333887序列表65/70 页
    128102333872 A CN 102333887序列表66/70 页
    129102333872 A CN 102333887序列表67/70 页
    130102333872 A CN 102333887序列表68/70 页
    131102333872 A CN 102333887序列表69/70 页
    132102333872 A CN 102333887序列表70/70 页

在糖工程化的酵母巴斯德毕赤酵母中对半乳糖同化途径的代谢工程化.pdf_第1页
第1页 / 共162页
在糖工程化的酵母巴斯德毕赤酵母中对半乳糖同化途径的代谢工程化.pdf_第2页
第2页 / 共162页
在糖工程化的酵母巴斯德毕赤酵母中对半乳糖同化途径的代谢工程化.pdf_第3页
第3页 / 共162页
点击查看更多>>
资源描述

《在糖工程化的酵母巴斯德毕赤酵母中对半乳糖同化途径的代谢工程化.pdf》由会员分享,可在线阅读,更多相关《在糖工程化的酵母巴斯德毕赤酵母中对半乳糖同化途径的代谢工程化.pdf(162页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN102333872A43申请公布日20120125CN102333872ACN102333872A21申请号201080011713822申请日2010022461/20858220090225USC12N15/81200601C12N15/54200601C12N15/61200601C12N9/12200601C12N9/90200601C12N1/16200601C12P21/00200601C07K16/1820060171申请人默沙东公司地址美国新泽西州72发明人RC戴维森P波布罗维奇查冬兴74专利代理机构中国专利代理香港有限公司72001代理人李波刘健54发明名称。

2、在糖工程化的酵母巴斯德毕赤酵母中对半乳糖同化途径的代谢工程化57摘要描述了通常不能利用半乳糖作为碳源但根据本文的方法已被基因工程化为利用半乳糖作为单一碳源的低等真核细胞例如巴斯德毕赤酵母。细胞被基因工程化为表达包含LELOIR途径的酶中的几种。具体地,细胞被基因工程化为表达半乳糖激酶、UDP半乳糖C4差向异构酶和半乳糖1磷酸尿苷酰转移酶,以及任选地半乳糖通透酶。另外,提供了用于改进在已被基因工程化为产生具有N聚糖其具有半乳糖残基的糖蛋白但通常缺乏包含LELOIR途径的酶的细胞中具有半乳糖末端的或含有半乳糖的N聚糖的产量的方法,所述方法包括用编码半乳糖激酶、UDP半乳糖C4差向异构酶和半乳糖1磷。

3、酸尿苷酰转移酶的一种或多种核酸分子转化细胞。描述的方法和宿主细胞使得同化半乳糖的能力的存在或缺乏作为用于制备重组细胞的选择方法。所述方法和宿主细胞在本文显示对于制备具有半乳糖末端的或含有半乳糖的N聚糖的免疫球蛋白和类似物是特别有用的。30优先权数据85PCT申请进入国家阶段日2011082586PCT申请的申请数据PCT/US2010/0251632010022487PCT申请的公布数据WO2010/099153EN2010090251INTCL19中华人民共和国国家知识产权局12发明专利申请权利要求书3页说明书59页序列表70页附图29页CN102333887A1/3页21一种巴斯德毕赤酵母。

4、PICHIAPASTORIS宿主细胞,其已被基因工程化为表达半乳糖激酶活性、UDP半乳糖4差向异构酶活性、半乳糖1磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性,其中所述宿主细胞能够利用半乳糖作为单一碳能源。2根据权利要求1的宿主细胞,其中所述宿主细胞已进一步被基因工程化为能够产生重组糖蛋白,所述重组糖蛋白具有包含半乳糖残基的杂合或复合N聚糖。3根据权利要求2的宿主细胞,其中所述UDP半乳糖4差向异构酶活性被提供在融合蛋白中,所述融合蛋白包含半乳糖基转移酶的催化结构域和UDP半乳糖4差向异构酶的催化结构域。4根据权利要求2的宿主细胞,其中所述宿主细胞产生具有复合N聚糖的糖蛋白,其中复合N聚糖的。

5、G0G1/G2比值小于21。5根据权利要求2的宿主细胞,其中所述宿主细胞产生糖蛋白,所述糖蛋白主要具有选自GALGLCNACMAN5GLCNAC2、NANAGALGLCNACMAN5GLCNAC2、GALGLCNACMAN3GLCNAC2、NANAGALGLCNACMAN3GLCNAC2、GALGLCNAC2MAN3GLCNAC2、GAL2GLCNAC2MAN3GLCNAC2、NANAGAL2GLCNAC2MAN3GLCNAC2和NANA2GAL2GLCNAC2MAN3GLCNAC2的N聚糖。6根据权利要求2的宿主细胞,其中所述N聚糖是具有半乳糖末端的N聚糖,其选自GALGLCNACMAN5G。

6、LCNAC2、GAL2GLCNAC2MAN3GLCNAC2和GAL2GLCNAC2MAN3GLCNAC2。7根据权利要求2的宿主细胞,其中所述N聚糖是具有半乳糖末端的杂合N聚糖。8根据权利要求2的宿主细胞,其中所述N聚糖是唾液酸化的N聚糖,其选自NANAGALGLCNACMAN5GLCNAC2、NANAGAL2GLCNAC2MAN3GLCNAC2和NANA2GAL2GLCNAC2MAN3GLCNAC2。9根据权利要求2的宿主细胞,其中所述重组糖蛋白选自红细胞生成素EPO,细胞因子例如干扰素、干扰素、干扰素和干扰素,和粒细胞集落刺激因子GCSF,GMCSF,凝固因子例如因子VIII、因子IX和人。

7、蛋白C,抗凝血酶III,凝血酶,可溶性IGE受体链,免疫球蛋白例如IGG、IGG片段、IGG融合体和IGM,免疫粘附素和其它FC融合蛋白例如可溶性TNF受体FC融合蛋白,RAGEFC融合蛋白,白细胞介素,尿激酶,糜蛋白酶和尿胰蛋白酶抑制剂,IGF结合蛋白,表皮生长因子,生长激素释放因子,膜联蛋白V融合蛋白,制管张素,血管内皮生长因子2,骨髓样前体抑制因子1,骨保护蛋白,1抗胰蛋白酶,甲胎蛋白,DNA酶II,人纤溶酶原的三环3,葡糖脑苷脂酶,TNF结合蛋白1,促卵泡激素,细胞毒性T淋巴细胞相关抗原4IG,跨膜激活剂和钙调节剂和亲环蛋白配体,胰高血糖素样蛋白1和IL2受体激动剂。10一种在巴斯德毕。

8、赤酵母宿主中产生具有N聚糖的重组糖蛋白的方法,所述N聚糖具有半乳糖残基,所述方法包括A提供重组宿主细胞,其已被基因工程化为表达I糖基化途径,其使得所述宿主细胞能够产生重组糖蛋白,所述重组糖蛋白具有包含半乳糖残基的杂合或复合N聚糖;II半乳糖激酶活性、UDP半乳糖4差向异构酶活性、半乳糖1磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性;和III重组糖蛋白;和B在含有半乳糖的培养基中培养所述宿主细胞以产生具有一个或多个N聚糖的重组糖蛋白,所述N聚糖具有半乳糖残基。权利要求书CN102333872ACN102333887A2/3页311根据权利要求10的方法,其中所述UDP半乳糖4差向异构酶活性被提。

9、供在融合蛋白中,所述融合蛋白包含半乳糖基转移酶的催化结构域和UDP半乳糖4差向异构酶的催化结构域。12根据权利要求10的方法,其中所述N聚糖的G0G1/G2比值小于21。13根据权利要求10的方法,其中所述重组糖蛋白主要具有选自GALGLCNACMAN5GLCNAC2、NANAGALGLCNACMAN5GLCNAC2、GALGLCNACMAN3GLCNAC2、NANAGALGLCNACMAN3GLCNAC2、GALGLCNAC2MAN3GLCNAC2、GAL2GLCNAC2MAN3GLCNAC2、NANAGAL2GLCNAC2MAN3GLCNAC2和NANA2GAL2GLCNAC2MAN3GL。

10、CNAC2的N聚糖。14根据权利要求10的方法,其中所述N聚糖是具有半乳糖末端的N聚糖,其选自GALGLCNACMAN5GLCNAC2、GAL2GLCNAC2MAN3GLCNAC2和GAL2GLCNAC2MAN3GLCNAC2。15根据权利要求10的方法,其中所述N聚糖是具有半乳糖末端的杂合N聚糖。16根据权利要求10的方法,其中所述N聚糖是唾液酸化的N聚糖,其选自NANAGALGLCNACMAN5GLCNAC2、NANAGAL2GLCNAC2MAN3GLCNAC2和NANA2GAL2GLCNAC2MAN3GLCNAC2。17根据权利要求10的方法,其中所述重组糖蛋白选自红细胞生成素EPO,细。

11、胞因子例如干扰素、干扰素、干扰素和干扰素,和粒细胞集落刺激因子GCSF,GMCSF,凝固因子例如因子VIII、因子IX和人蛋白C,抗凝血酶III,凝血酶,可溶性IGE受体链,免疫球蛋白例如IGG、IGG片段、IGG融合体和IGM,免疫粘附素和其它FC融合蛋白例如可溶性TNF受体FC融合蛋白,RAGEFC融合蛋白,白细胞介素,尿激酶,糜蛋白酶和尿胰蛋白酶抑制剂,IGF结合蛋白,表皮生长因子,生长激素释放因子,膜联蛋白V融合蛋白,制管张素,血管内皮生长因子2,骨髓样前体抑制因子1,骨保护蛋白,1抗胰蛋白酶,甲胎蛋白,DNA酶II,人纤溶酶原的三环3,葡糖脑苷脂酶,TNF结合蛋白1,促卵泡激素,细胞。

12、毒性T淋巴细胞相关抗原4IG,跨膜激活剂和钙调节剂和亲环蛋白配体,胰高血糖素样蛋白1和IL2受体激动剂。18一种产生表达异源蛋白的重组巴斯德毕赤酵母宿主细胞的方法,其包括A提供已被基因工程化为表达一种或两种酶活性的宿主细胞,所述酶活性选自半乳糖激酶活性、UDP半乳糖4差向异构酶活性和半乳糖1磷酸尿苷酰转移酶活性;B用编码异源蛋白和在步骤A的宿主细胞中不表达的选自步骤A的酶或多种酶的一种或多种核酸分子转化所述宿主细胞;和C在含有半乳糖作为单一碳能源的培养基中培养所述宿主细胞以提供表达异源蛋白的重组巴斯德毕赤酵母宿主细胞。19根据权利要求18的方法,其中所述宿主细胞被进一步基因工程化为表达半乳糖通。

13、透酶。20根据权利要求18的方法,其中所述宿主细胞被基因修饰以产生糖蛋白,所述糖蛋白具有一个或多个包含半乳糖的N聚糖。21一种产生和选择能够利用半乳糖作为单一碳源的巴斯德毕赤酵母宿主细胞的方法,所述方法包括A提供巴斯德毕赤酵母宿主细胞;B用编码半乳糖激酶活性、UDP半乳糖4差向异构酶活性、半乳糖1磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶的一种或多种核酸分子转化所述宿主细胞;权利要求书CN102333872ACN102333887A3/3页4C在含有半乳糖作为单一碳源的培养基上培养转化的宿主细胞;和D选择可以在含有半乳糖作为单一碳源的培养基上生长的宿主细胞。22一种包含糖蛋白的组合物,其中在药。

14、学上可接受的载体中糖蛋白上的G0G1/G2糖形比值小于21。23根据权利要求22的糖蛋白组合物,其中所述糖蛋白是选自抗HER2抗体、抗RSV呼吸道合胞病毒抗体、抗TNF抗体、抗VEGF抗体、抗CD3受体抗体、抗CD417E3抗体、抗CD25抗体、抗CD52抗体、抗CD33抗体、抗IGE抗体、抗CD11A抗体、抗EGF受体抗体和抗CD20抗体及其变体的抗体。24根据权利要求22的糖蛋白组合物,其中所述糖蛋白是FC融合蛋白。25根据权利要求24的糖蛋白组合物,其中所述FC融合蛋白是依那西普。26一种重组巴斯德毕赤酵母宿主细胞,其具有与重组巴斯德毕赤酵母菌株YDX477的基因型相同的基因型。权利要求。

15、书CN102333872ACN102333887A1/59页5在糖工程化的酵母巴斯德毕赤酵母中对半乳糖同化途径的代谢工程化0001发明背景00021发明领域0003本发明涉及低等真核细胞,例如巴斯德毕赤酵母PICHIAPASTORIS,其通常不能利用半乳糖作为碳源,但通过基因工程化细胞为表达包含LELOIR途径的酶中的几种,使其能够利用半乳糖作为单一碳源。具体地,细胞被基因工程化为表达半乳糖激酶、UDP半乳糖C4差向异构酶和半乳糖1磷酸尿苷酰转移酶,以及任选地半乳糖通透酶。另外,本发明进一步涉及用于改进在已被基因工程化为产生具有N聚糖其具有半乳糖残基的糖蛋白但通常缺乏包含LELOIR途径的酶的。

16、低等真核细胞中具有半乳糖末端的或含有半乳糖的N聚糖的产量的方法,包含用编码半乳糖激酶、UDP半乳糖C4差向异构酶和半乳糖1磷酸尿苷酰转移酶的一个或多个核酸分子转化低等真核细胞。00042相关领域的描述0005基于蛋白的疗法组成了药物发现的最活跃领域之一并被期望是未来十年新的治疗用化合物的主要来源WALSH,NATBIOTECHNOL18883132000。治疗用蛋白在它们的天然状态未被糖基化可在缺乏糖基化机制的宿主中表达,例如埃希氏大肠杆菌ESCHERICHIACOLI。但是,大多数治疗用蛋白是糖蛋白,其需要在蛋白的特定天冬酰胺残基翻译后添加聚糖,以确保正确的折叠和随后在人血清中的稳定性HEL。

17、ENIUS和AEBI,SCIENCE291236492001。在一些情况中,治疗用蛋白的效力已通过在另外的糖基化位点中的工程化而被改进。一个实例是人红细胞生成素,其添加另外两个糖基化位点后已表明在体内显示三倍长的半衰期MACDOUGALL等人,JAMSOCNEPHROL10239223951999。意在人中用于治疗用途的大多数糖蛋白需要N糖基化,因此,哺乳动物细胞系,例如中国仓鼠卵巢CHO细胞,其具有类似的人糖蛋白加工,目前最常用于生产治疗用糖蛋白。但是,这些细胞系具有明显的缺点,包括较差的基因溯源性、较长的发酵时间、异源糖基化和正在发生的病毒污染问题BIRCH和RACHER,ADV药物DEL。

18、IVREV58671852006;KALYANPUR,MOLBIOTECHNOL2287982002。0006许多工业蛋白表达系统基于可在化学上成分确定的培养基中生长至高细胞密度且通常不受上述限制的酵母菌株CEREGHINO和CREGGFEMSMICROBIOLREV2445662000;HOLLENBERG和GELLISEN,CURROPINBIOTECHNOL85545601997;MULLER,酵母14126712831998。尽管酵母已被用于生产缺乏糖基化的治疗用蛋白,例如胰岛素,但是其仍未被用于糖蛋白生产,因为酵母产生具有非人的、高甘露糖型N聚糖的糖蛋白参见图1,其产生具有缩短的体内。

19、半衰期并在高等哺乳动物中具有免疫原潜能的糖蛋白TANNER等人,BIOCHIMBIOPHYSACTA90681991987。0007为解决这些问题,本发明人和其他研究者已聚焦到各种不同酵母和丝状真菌中糖基化途径的再工程化,以从这些蛋白表达宿主中获得人样糖蛋白。例如,GERNGROSS等人,美国公开的申请号2004/0018590所述公开内容在此通过参考并入本文提供酵母巴斯德毕赤酵母的细胞,其已被基因工程化为消除酵母和丝状真菌典型的高甘露糖型N聚糖的说明书CN102333872ACN102333887A2/59页6产生和提供具有糖基化机制的宿主细胞以产生具有杂合或复合N聚糖的糖蛋白,即哺乳动物细。

20、胞产生的更典型的糖蛋白。0008GERNGROSS等人如上公开了重组酵母菌株,该重组酵母菌株可生产其上高百分比的N聚糖含有半乳糖残基的重组糖蛋白即,产生主要具有寡糖结构GALGLCNAC2MAN3GLCNAC2G1或GAL2GLCNAC2MAN3GLCNAC2G2和较少量寡糖结构GLCNAC2MAN3GLCNAC2G0的N聚糖的酵母菌株。已获得7085的G2产率。但是,已发现在这些细胞中生产的一些糖蛋白例如免疫球蛋白和免疫粘附素,其中G0G1/G2的比值降低至约21参见例如,LI等人,NATUREBIOTECHNOL242102152006,其中通过用半乳糖和可溶型1,4半乳糖基转移酶体外处理。

21、糖蛋白,这些细胞中半乳糖末端的N聚糖的产率得到改进。相反,哺乳动物细胞例如CHO细胞中生产的免疫球蛋白的G0G1/G2的比值约11。因此,期望的是提供能够在体内产生G0G1/G2比值小于21的重组糖蛋白的重组酵母宿主细胞。0009巴斯德毕赤酵母仅可利用有限数量的碳源以生存。目前,这些碳源是甘油、葡萄糖、甲醇以及可能是鼠李糖和甘露糖,但不是半乳糖。期望的是具有可利用上述所列以外的碳源的巴斯德毕赤酵母菌株。0010发明概述0011本发明解决了上述确定的问题。本发明提供方法和材料用于从缺乏同化半乳糖作为碳源的能力的宿主细胞产生具有利用半乳糖作为能源的能力的重组宿主细胞。当重组宿主细胞被进一步基因工程。

22、化为生产具有半乳糖末端的或含有半乳糖的N聚糖的糖蛋白时,该宿主细胞能够产生重组糖蛋白例如抗体,其中G0G1/G2比值小于21、或G0G1/G2比值为11或更小或G0G1/G2比值为12或更小。一般而言,所述包括将编码LELOIR途径酶半乳糖激酶、UDP半乳糖C4差向异构酶和半乳糖1磷酸尿苷酰转移酶以及任选地半乳糖通透酶引入宿主细胞核酸分子。因此,本文中的方法和材料提供选择系统,其仅通过在含有半乳糖作为碳源的培养基上培养细胞可用于鉴定已被转化宿主细胞,以及提供用于生产糖蛋白具有高水平的末端的或含有半乳糖的N聚糖例如免疫球蛋白的方法。0012利用半乳糖作为碳源的能力提供了选择使用的表达系统的灵活性。

23、和经济性。例如,在设计用于表达具有末端半乳糖或末端唾液酸化的重组糖蛋白的系统中,可将半乳糖添加至培养基,半乳糖被细胞吸收和被细胞利用作为能源并提供半乳糖残基用于参入N聚糖,其在重组糖蛋白上被合成。本发明的优势是通过使半乳糖存在于培养基或在发酵过程中添加半乳糖和/或诱导重组糖蛋白,重组蛋白的生产可得到高水平的半乳糖基化的或唾液酸化的糖蛋白。因此,如巴斯德毕赤酵母所表明的,通常缺乏LELOIR途径的酵母物种,以本文公开的方式基因工程化巴斯德毕赤酵母产生可利用半乳糖作为单一碳源的重组巴斯德毕赤酵母细胞系。另外,基因工程化巴斯德毕赤酵母细胞系包括LELOIR途径酶和使得细胞能够产生具有半乳糖末端的或含。

24、有半乳糖的N聚糖的糖蛋白所需的酶产生了这样的重组细胞系,其中半乳糖末端的或含有半乳糖的N聚糖的产率大于缺乏LELOIR途径酶的细胞系。因此,本发明引起了已被基因工程化为生产半乳糖基化的或唾液酸化的糖蛋白的巴斯德毕赤酵母细胞系的增加的生产率。0013具体地,本发明提供了用于在体内生产具有高水平半乳糖或唾液酸的抗体的方法说明书CN102333872ACN102333887A3/59页7和材料。利用本发明的方法和材料,将半乳糖添加至细胞生长培养基以完成多个目的,包括A能够利用半乳糖作为糖源的宿主细胞的选择;B提供用于宿主细胞生长的碳源和C提供用于参入N聚糖的半乳糖残基来源,其作为N聚糖中的末端半乳糖。

25、残基或提供底物用于末端唾液酸残基随后添加至N聚糖。因此,本发明提供方法和材料,通过该方法和材料,可通过体内过程而不是使用更低效和更昂贵的体外反应使半乳糖基化的水平增加,在体外反应中,带电的半乳糖和可溶性半乳糖基转移酶被添加至含有纯化的但部分半乳糖基化的重组糖蛋白的培养基或溶液中。0014本发明的一个实施方案是发展能够在半乳糖作为单一碳能源存在的培养基上生存的巴斯德毕赤酵母宿主细胞。利用本发明的方法和材料,本领域普通技术人员将能够从本文公开的利用半乳糖作为碳源的转化的宿主细胞生产重组糖蛋白用于选择和维持转化的宿主细胞。另外,当宿主细胞已被基因工程化为产生半乳糖基化的或唾液酸化的N聚糖时,通过提供。

26、具有半乳糖的细胞培养基,本发明可用于增加从细胞产生的半乳糖基化的或唾液酸化的糖蛋白的水平。0015因此,提供巴斯德毕赤酵母宿主细胞,其已被基因工程化为表达半乳糖激酶活性、UDP半乳糖4差向异构酶活性、半乳糖1磷酸尿苷酰转移酶活性,以及任选地半乳糖通透酶活性,其中所述宿主细胞能够利用半乳糖作为单一碳能源。0016在具体方面,巴斯德毕赤酵母宿主细胞已被进一步基因工程化为能够产生这样的重组糖蛋白,其具有包含半乳糖残基的杂合或复合N聚糖。在具体实施方案中,UDP半乳糖4差向异构酶活性被提供在融合蛋白中,所述融合蛋白包含半乳糖基转移酶的催化结构域和UDP半乳糖4差向异构酶的催化结构域。0017一般而言,。

27、宿主细胞能够产生具有复合N聚糖的糖蛋白,其中复合N聚糖的G0G1/G2比值小于21。0018在具体实施方案中,上述细胞产生的糖蛋白主要具有选自GALGLCNACMAN5GLCNAC2、NANAGALGLCNACMAN5GLCNAC2、GALGLCNACMAN3GLCNAC2、NANAGALGLCNACMAN3GLCNAC2、GALGLCNAC2MAN3GLCNAC2、GAL2GLCNAC2MAN3GLCNAC2、NANAGAL2GLCNAC2MAN3GLCNAC2和NANA2GAL2GLCNAC2MAN3GLCNAC2的N聚糖。0019在另外的实施方案中,N聚糖是半乳糖末端的N聚糖,其选自GA。

28、LGLCNACMAN5GLCNAC2、GAL2GLCNAC2MAN3GLCNAC2和GAL2GLCNAC2MAN3GLCNAC2。在其他实施方案中,N聚糖是半乳糖末端的杂合N聚糖;以及在另外的实施方案中,N聚糖是唾液酸化的N聚糖,其选自NANAGALGLCNACMAN5GLCNAC2、NANAGAL2GLCNAC2MAN3GLCNAC2和NANA2GAL2GLCNAC2MAN3GLCNAC2。0020另外提供的是在巴斯德毕赤酵母宿主中生产具有N聚糖的重组糖蛋白的方法,所述N聚糖具有半乳糖残基,所述方法包括A提供重组宿主细胞,其已被基因工程化为表达I糖基化途径,其使得所述宿主细胞能够产生重组糖蛋。

29、白,所述重组糖蛋白具有包含半乳糖残基的杂合或复合N聚糖;II半乳糖激酶活性、UDP半乳糖4差向异构酶活性、半乳糖1磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶活性;和III重组糖蛋白;和B在含有半乳糖的培养基中培养所述宿主细胞以产生具有一个或多个N聚糖的重组糖蛋白,所述N聚糖具有半乳糖残基。0021在所述方法的进一步的方面,UDP半乳糖4差向异构酶活性被提供在融合蛋白说明书CN102333872ACN102333887A4/59页8中,所述融合蛋白包含半乳糖基转移酶的催化结构域和UDP半乳糖4差向异构酶的催化结构域。0022本发明另外提供选择表达异源蛋白的重组宿主细胞的方法。用编码异源蛋白和不存。

30、在于重组宿主细胞的LELOIR途径酶的一个或多个核酸分子转化表达一种或两种但不是全部的LELOIR途径酶活性的重组宿主细胞。由于转化的重组宿主细胞含有完整的LELOIR途径,从非转化的细胞中选择表达异源蛋白的转化的重组宿主细胞可通过在半乳糖是单一碳源的培养基中培养转化的重组宿主细胞获得。因此,另外提供的是产生表达异源蛋白的重组宿主细胞的方法,其包括A提供已被基因工程化为表达一种或两种酶的宿主细胞,所述酶选自半乳糖激酶、UDP半乳糖4差向异构酶和半乳糖1磷酸尿苷酰转移酶;B用编码异源蛋白和在步骤A的宿主细胞中不表达的选自步骤A的酶或多种酶的一个或多个核酸分子转化所述宿主细胞;和C在含有半乳糖作为。

31、单一碳能源的培养基中培养所述宿主细胞以提供表达异源蛋白的重组巴斯德毕赤酵母宿主细胞。在所述方法的进一步的方面,宿主细胞被基因工程化为表达半乳糖通透酶。在还进一步的方面,宿主细胞被基因修饰以产生糖蛋白,所述糖蛋白具有一个或多个包含半乳糖的N聚糖。0023另外提供的是产生和选择能够利用半乳糖作为单一碳源的巴斯德毕赤酵母宿主细胞的方法,所述方法包括A提供巴斯德毕赤酵母宿主细胞;B用编码半乳糖激酶活性、UDP半乳糖4差向异构酶活性、半乳糖1磷酸尿苷酰转移酶活性以及任选地半乳糖通透酶的一个或多个核酸分子转化所述宿主细胞;C在含有半乳糖作为单一碳源的培养基上培养转化的宿主细胞;和D选择可以在含有半乳糖作为。

32、单一碳源的培养基上生长的宿主细胞。0024本文中的宿主细胞和方法能够生产包含重组糖蛋白的组合物,其中在药学上可接受的载体中重组糖蛋白上的G0G1/G2糖形的比值小于21。在具体实施方案中,重组糖蛋白选自红细胞生成素EPO,细胞因子例如干扰素、干扰素、干扰素和干扰素,和粒细胞集落刺激因子GCSF,GMCSF,凝固因子例如因子VIII、因子IX和人蛋白C,抗凝血酶III,凝血酶,可溶性IGE受体链,免疫球蛋白例如IGG、IGG片段、IGG融合体和IGM,免疫粘附素和其它FC融合蛋白例如可溶性TNF受体FC融合蛋白,RAGEFC融合蛋白,白细胞介素,尿激酶,糜蛋白酶和尿胰蛋白酶抑制剂,IGF结合蛋白。

33、,表皮生长因子,生长激素释放因子,膜联蛋白V融合蛋白,制管张素,血管内皮生长因子2,骨髓样前体抑制因子1,骨保护蛋白,1抗胰蛋白酶,甲胎蛋白,DNA酶II,人纤溶酶原的三环3,葡糖脑苷脂酶,TNF结合蛋白1,促卵泡激素,细胞毒性T淋巴细胞相关抗原4IG,跨膜激活剂和钙调节剂和亲环蛋白配体,胰高血糖素样蛋白1和IL2受体激动剂。0025在另外的实施方案中,糖蛋白是抗体,具体是人源化的、嵌合或人抗体。在具体实施方案中,抗体选自抗HER2抗体、抗RSV呼吸道合胞病毒抗体、抗TNF抗体、抗VEGF抗体、抗CD3受体抗体、抗CD417E3抗体、抗CD25抗体、抗CD52抗体、抗CD33抗体、抗IGE抗体。

34、、抗CD11A抗体、抗EGF受体抗体和抗CD20抗体及其变体。抗体的实例包括莫罗单抗CD3、阿昔单抗、利妥昔单抗、达珠单抗、巴利昔单抗、帕利珠单抗、英利昔单抗、曲妥珠单抗、吉姆单抗奥佐米星、阿仑单抗、替伊莫单抗、阿达木单抗、奥马珠单抗、托西莫单抗131I、依法利珠单抗、西妥昔单抗、戈利木单抗和贝伐单抗。0026在还进一步的实施方案中,糖蛋白是FC融合蛋白,例如依那西普。说明书CN102333872ACN102333887A5/59页90027尽管巴斯德毕赤酵母证实作为如本文所公开的可被修饰的宿主细胞的实例,但是方法和宿主细胞不限于巴斯德毕赤酵母。本文的方法可用于产生来自其他低等真核细胞物种的重。

35、组宿主细胞,所述物种通常不表达LELOIR途径酶并如此不能利用半乳糖作为碳源。因此,在另外的实施方案中,宿主细胞是通常不表达LELOIR途径酶的任何低等真核细胞物种。0028定义0029除非另有定义,本文所用的所有技术和科学具有与本发明所属领域的普通技术人员通常理解的相同含义。另外,除非上下文另有要求,单数术语应包括复数和复数术语应包括单数。通常地,所用的相关命名和本文所述的生化、酶学、分子和细胞生物学、微生物学、遗传学以及蛋白和核酸化学以及杂交技术是本领域熟知并通常使用的。本发明的方法和技术通常根据本领域熟知的常规方法并如贯穿本说明书引用和讨论的各种一般和更具体的参考中所述的进行,除非另有说。

36、明。参见,例如,SAMBROOK等人MOLECULARCLONINGALABORATORYMANUAL,2DED,COLDSPRINGHARBORLABORATORYPRESS,COLDSPRINGHARBOR,NY1989;AUSUBEL等人,CURRENTPROTOCOLSINMOLECULARBIOLOGY,GREENEPUBLISHINGASSOCIATES1992,和SUPPLEMENTSTO2002;HARLOW和LANE,ANTIBODIESALABORATORYMANUAL,COLDSPRINGHARBORLABORATORYPRESS,COLDSPRINGHARBOR,NY1。

37、990;TAYLOR和DRICKAMER,INRRODUCTIONTOGLYCOBIOLOGY,OXFORDUNIVPRESS2003;WORTHINGTONENZYMEMANUAL,WORTHINGTONBIOCHEMICALCORP,FREEHOLD,NJ;HANDBOOKOFBIOCHEMISTRYSECTIONAPROTEINS,VOLI,CRCPRESS1976;HANDBOOKOFBIOCHEMISTRYSECTIONAPROTEINS,VOLII,CRCPRESS1976;ESSENTIALSOFGLYCOBIOLOGY,COLDSPRINGHARBORLABORATORYPRE。

38、SS1999。示例性方法和材料如下述,虽然与本文所述类似或等同的方法和材料也可用于本发明的实践并应对本领域普通技术人员是显而易见的。本文提及的所有公开和其他参考通过参考对于它们引用的公开内容而被整体引入。在矛盾的情况下,以本说明书包括定义为准。材料、方法和实施例仅是说明性的,且意图不是以任何方式限制。0030以下术语,除非另有说明,应理解具有以下含有0031如本文所用,术语“人源化的”、“人源化”和“人样”可互换地使用,是指以一种方式工程化非人细胞例如低等真核宿主细胞的方法,其中该方式引起工程化的细胞具有产生蛋白特别是糖蛋白的能力,所述糖蛋白具有糖基化,比相同物种的非工程化的、野生型非人细胞产。

39、生的糖蛋白具有更类似哺乳动物糖基化的模式。人源化可对于N糖基化、O糖基化或二者进行。例如,野生型巴斯德毕赤酵母和其它低等真核细胞通常在N糖基化位点产生高甘露糖基化的蛋白。在本发明优选的实施方案中,本发明的“人源化的”宿主细胞能够产生具有杂合和/或复合N聚糖的糖蛋白;即“人样N糖基化”。人源化的宿主细胞产生的糖蛋白上主要存在的特定“人样”聚糖将取决于进行的特定人源化步骤。0032如本文所用,术语“N聚糖”和“糖形”可互换地使用和是指N连接的寡糖,例如,通过天冬酰胺N乙酰基葡糖胺连接而连接到多肽的天冬酰胺残基的寡糖。N连接的糖蛋白含有连接到蛋白中天冬酰胺残基的酰胺氮上的N乙酰基葡糖胺残基。糖蛋白上。

40、发现的主要糖是葡萄糖、半乳糖、甘露糖、果糖、N乙酰基半乳糖胺GALNAC、N乙酰基葡糖胺GLCNAC和唾液酸例如N乙酰基神经氨酸NANA。对于N连接的糖蛋白,糖基团说明书CN102333872ACN102333887A6/59页10的加工在ER的腔中与翻译同时发生并在高尔基体中继续。0033N聚糖具有共同的五糖核心MAN3GLCNAC2“MAN”是指甘露糖;“GLC”是指葡萄糖和“NAC”是指N乙酰基、GLCNAC是指N乙酰基葡糖胺。根据分支触角的数量,N聚糖不同,所述分支触角包含被添加至MAN3GLCNAC2“MAN3”核心结构还称为“三甘露糖核心”、“五糖核心”或“少甘露糖核心”的外周糖例。

41、如GLCNAC、半乳糖、果糖和唾液酸。N聚糖根据它们分支的成分例如高甘露糖、复合或杂合而分类。“高甘露糖”型N聚糖具有5个或更多个甘露糖残基。“复合”型N聚糖通常具有至少一个连接至1,3甘露糖臂的GLCNAC和至少一个连接至“三甘露糖”核心的1,6甘露糖臂的GLCNAC。复合N聚糖也可具有半乳糖“GAL”或N乙酰基半乳糖胺“GALNAC”残基,其任选地用唾液酸或衍生物例如,“NANA”或“NEUAC”,其中“NEU”是指神经氨酸和“AC”是指乙酰基修饰。复合N聚糖也可具有链内置换,其包含“等分的”GLCNAC和核心果糖“FUC”。复合N聚糖也可在“三甘露糖核心”上具有多个触角,通常称为“多触角。

42、聚糖”。“杂合”N聚糖在三甘露糖核心的1,3甘露糖臂末端具有至少一个GLCNAC并在三甘露糖核心的1,6甘露糖臂上具有0或多个甘露糖。多种N聚糖也称为“糖形”。图2显示多种高甘露糖、杂合和复合N聚糖,其已在基因工程化为产生哺乳动物样N聚糖的巴斯德毕赤酵母中产生。0034如本文所用,术语“O聚糖”和“糖形”可互换地使用和是指O连接的寡糖,例如,经由丝氨酸或苏氨酸残基的羟基连接至肽链的聚糖在真菌细胞中,天然O糖基化通过将在内质网中从多萜醇单磷酸甘露糖DOLPMAN转移的第一个甘露糖基残基连接到蛋白而发生,和另外的甘露糖基残基可在高尔基体中经由从GPDMAN转移而被连接。高等真核细胞,例如人或哺乳动。

43、物细胞,通过将N乙酰基半乳糖胺GLCNAC共价连接到丝氨酸或苏氨酸残基经历O糖基化。0035如本文所用,术语“人样O糖基化”应理解为含义是真菌特定的磷酸化甘露糖结构被降低或消除,引起电荷和甘露糖结构的降低或消除,或糖蛋白上存在的和糖蛋白组合物中的主要O聚糖种类包括具有选自GLCNAC、GAL或NANA或SIA的末端残基加帽的聚糖。以这种方式,具有主要人样O糖基化的重组糖蛋白可被人或哺乳动物细胞识别,如同它是天然产生的糖蛋白,其产生重组糖蛋白的改进的治疗用性质。0036本文所用的缩写是本领域常见使用的,参见,例如,上述糖的缩写。其他常见缩写包括“PNGASE”或“聚糖酶”或“葡糖苷酶”均是指肽N。

44、糖苷酶FEC32218。0037如本文所用,术语“抗体”、“免疫球蛋白”和“免疫球蛋白分子”可互换地使用。每个免疫球蛋白分子具有独特结构,使得其结合它的特异性抗原,但所有免疫球蛋白具有本文所述的相同整体结构。基础的免疫球蛋白结构单元已知包括亚基的四聚体。每个四聚体具有两对相同的多肽链,每对具有一个“轻”链LC约25KDA和一个“重”链HC约5070KDA。每个链的氨基末端部分包括约100110或更多个氨基酸的可变区,主要负责抗原识别。每个链的羧基末端部分确定恒定区,主要负责效应物功能。轻链LCS被分类为或。重链HCS分类为、或和确定抗体同种型分别为IGG、IGM、IGA、IGD和IGE。003。

45、8轻和重链被亚分类为可变区和恒定区通常参见FUNDAMENTALIMMUNOLOGYPAUL,W,ED,2NDEDRAVENPRESS,NY,1989,CH7。每个轻/重链对的可变区形成抗体结合位点。因此,天然抗体具有两个结合位点。除了双功能或双特异抗体,两说明书CN102333872ACN102333887A7/59页11个结合位点是相同。链都显示相同的通常结构,被三个高度可变区连接的相对保守构架区FR,还称为互补决定区或CDR。来自每对的两个链的CDR通过构架区连接,使得结合特异性表位。术语包括天然形成形式、以及片段和衍生物。包括在术语范围内的是免疫球蛋白IGS的种类,称为IGG、IGA、。

46、IGE、IGM和IGD。还包括在术语范围内的是IGG的亚型,称为IGG1、IGG2、GG3和IGG4。术语用于最广泛的含义并包括单个单克隆抗体包括激动剂和拮抗剂抗体以及结合多个表位或抗原的抗体组合物。术语特定地覆盖单克隆抗体包括全长单克隆抗体、多克隆抗体、多特异抗体例如双特异抗体和抗体片段,只要它们含有或被修饰为含有重链免疫球蛋白恒定区的CH2结构域的至少一部分,其包括CH2结构域的N连接的糖基化位点或其变体。包括在术语内的是仅包含FC区的分子,例如免疫黏附素美国公开的专利申请号20040136986、FC融合和抗体样分子。可选地,这些术语可以是指至少FAB区的抗体片段,其至少含有N连接的糖基。

47、化位点。0039术语“FC”片段是指抗体的“片段结晶的”C末端区,其含有CH2和CH3结构域。术语“FAB”片段是指抗体的“片段抗原结合”区,其含有VH、CH1、VL和CL结构域。0040如本文所用术语“单克隆抗体”MAB是指获自基本上均一的抗体群体的抗体,即包含群体是相同的单独的抗体,除了可以小量存在的可能天然存在的突变。单克隆抗体是高度特异性的,是针对单个抗原性位点。另外,与通常包括针对不同决定簇表位的不同抗体的常规多克隆抗体制备物相反,每个MAB针对抗原上的单个决定簇。除了它们特异性,单克隆抗体是有利的,原因在于它们可以是通过杂交瘤培养合成的,不被其他免疫球蛋白污染。术语“单克隆”指示抗。

48、体的特征为获自基本上均一的抗体群体,并且不解释为要求通过任何具体方法产生抗体。例如,根据本发明使用的单克隆抗体可由KOHLER等人,1975NATURE,256495首次描述的杂交瘤方法制备或可通过重组DNA方法制备参见,例如,CABILLY等人的美国专利号4,816,567。0041在术语“抗体”或“免疫球蛋白”范围内的术语“片段”包括THOSE通过用多种蛋白酶消化产生的、通过化学切割和/或化学解离产生的和重组地产生的片段,只要片段保持能够特异性结合靶分子。在这类片段中的是FC、FAB、FAB、FV、FAB2和单链FVSCFV片段。下文中,术语“免疫球蛋白”也包括术语“片段”。0042免疫球。

49、蛋白另外包括免疫球蛋白或片段,其在序列上已被修饰但保持能够特异性结合靶分子,包括物种间嵌合和人源化的抗体;抗体融合;异聚体抗体复合物和抗体融合,例如双抗体双特异抗体,单链双抗体和胞内抗体参见,例如,INTRACELLULARANTIBODIESRESEARCHANDDISEASEAPPLICATIONS,MARASCO,ED,SPRINGERVERLAGNEWYORK,INC,1998。0043术语“催化抗体”是指能够催化生化反应的免疫球蛋白分子。催化抗体是本领域熟知的并已被描述在SCHOCHETMAN等人的美国专利号7,205,136;4,888,281和5,037,750,以及BARBAS,III等人的美国专利号5,733,757;5,985,626和6,368,839中。0044如本文所用术语“载体”意图是指能够转运已被连接的另一个核酸的核酸分子。一种类型的载体是“质粒”,其是指环状双链DNA环,在其中另外的DNA片段可被连接。其他载体包括黏粒、细菌人工染色体BAC和酵母人工染色体YAC。另一种类型的载体是病毒载体,其中另外的DNA片段可连接至病毒基因组如下更详细讨论。某些载体能够在它们被引入的宿主细胞中自我复制例如,载体具有在宿主细胞中发挥作用的复制起点。其说明书。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 化学;冶金 > 生物化学;啤酒;烈性酒;果汁酒;醋;微生物学;酶学;突变或遗传工程


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1