技术领域
本发明涉及任选地经至少一个非天然编码氨基酸修饰的胰岛素多肽。
背景技术
糖尿病目前影响全世界2.46亿人且预期到2025年会影响3.8亿人(国际糖尿 病联盟(InternationalDiabetesFederation)到2007年11月15日为止的统计)。2 型糖尿病在发达国家占所有糖尿病病例的约85%到95%且在发展中国家占甚至更 高的百分比。糖尿病的流行病性质持续影响全世界越来越多的人,而公众意识仍 然很低。
糖尿病是任何特征为过量排尿的病症。糖尿病(diabetes)的最常见形式是糖 尿病(diabetesmellitus),它是一种由于胰岛素功能紊乱而无法氧化碳水化合物的 代谢紊乱。糖尿病的特征为血浆中的葡萄糖增多和阶段性酮酸中毒。糖尿病的其 它症状包括烦渴、糖尿、多尿、脂血和饥饿。如果不进行治疗,那么所述疾病会 导致致命的酮酸中毒。糖尿病的其它形式包括尿崩症和脆性糖尿病。尿崩症是缺 乏抗利尿激素的结果。尿崩症的主要症状(过量排尿)由肾无法再吸收水而引起。 脆性糖尿病是一种极难控制的形式。其特征为低血糖与酸中毒之间的无法解释的 波动。
临床上确定个体罹患糖尿病的标准包括:(1)空腹血浆葡萄糖水平超过126 mg/dL(7mmol/L)。正常水平应小于100mg/dL(5.6mmol/L);或(2)在口服葡 萄糖耐量试验(oralglucosetolerancetest;OGTT)期间的两个时间点,血浆葡萄 糖水平超过200mg/dL(11mmol/L),其中一个时间点必须在摄取葡萄糖后2小 时内。
个人越早诊断出患有糖尿病,所述个人越有可能减轻原发性负面后果,所述 后果为由循环问题引起的肾衰竭、失明和截肢。美国糖尿病协会(American DiabetesAssociation)已讨论建议,如果患者的空腹血糖水平超过100mg/dL但小 于125mg/dL且在口服葡萄糖耐量试验(OGTT)后其葡萄糖水平为至少140mg/dL 但小于200mg/dL,那么医生认为所述患者为糖尿病前期。
糖尿病是具有许多病因的不同种类的临床病症。存在两种主要类别的糖尿病, 即特发性和继发性。特发性糖尿病分为两种主要类型;胰岛素依赖性和非胰岛素 依赖性。胰岛素依赖性糖尿病(insulin-dependentdiabetesmellitus;IDDM)(更通 常称为1型糖尿病)的定义是在不进行胰岛素疗法的情况下发展成酮酸中毒。1 型糖尿病最通常出现在儿童期(因此也称为青少年发病型糖尿病)并且是胰脏b 细胞的自体免疫破坏的结果。非胰岛素依赖性糖尿病(non-insulin-dependent diabetesmellitus;NIDDM)(更通常称为2型糖尿病)的特征为持续性高血糖, 但很少导致酮酸中毒。2型糖尿病通常出现在40岁以后且因此旧称为成年发病型 糖尿病。2型糖尿病可由引起胰岛素抗性和胰岛素缺乏的遗传缺陷引起。存在两 种主要形式的2型糖尿病:(1)与肥胖相关的迟发型;和(2)与肥胖无关的迟发 型。忍受2型糖尿病的许多(如果不是所有)负面长期影响归因于持续性高血糖。 因此,对2型糖尿病的治疗性干预的主要目的是降低循环葡萄糖水平。
胰岛素的主要功能是对抗多种产生高血糖的激素的协同作用和维持低血糖水 平。因为存在多种高血糖激素,所以未经治疗的与胰岛素相关的病症通常导致严 重高血糖并且缩短寿命。
胰岛素除了在调节葡萄糖代谢中的作用外,其还刺激脂肪生成,减少脂肪分 解,并且增加氨基酸转运到细胞中。胰岛素还调节转录,从而改变许多mRNA的 细胞含量。其刺激生长、DNA合成和细胞复制,即其与胰岛素样生长因子 (insulin-likegrowthfactor;IGF)和松弛素共同控制的作用。
发明内容
本发明提供任选地经至少一个非天然编码氨基酸修饰的胰岛素多肽。本说明 书将提供一些实施例,然而,应了解这些实施例是用于说明本发明的目的,且不 应理解为限制如权利要求书所界定的本发明的范围。
在非糖尿病个体中,胰脏持续供应低(或基础)水平的胰岛素。当身体处于 空腹状态时,肝脏向身体的其余部分供应葡萄糖。这通常被称为肝脏葡萄糖生成。 对膳食作出反应后,由胰脏释放高水平的胰岛素。胰岛素首先与肝脏相互作用, 向肝脏传导信号以停止肝脏葡萄糖生成并开始吸收作为膳食的一部分而摄取的葡 萄糖。一些由胰脏释放的胰岛素团块穿过肝脏并且与其它体细胞(特别是肌细胞) 相互作用,向其传导信号以吸收和使用葡萄糖。然而,在糖尿病患者中,由胰脏 和肝脏完成的这一串联工作可能受到破坏并且需要向糖尿病患者提供治疗,帮助 其将葡萄糖维持在健康界限内而不经历高血糖或低血糖和这些波动相关的短期与 长期影响。因此,胰岛素疗法的目的长期以来一直是模拟正常个体的内源性胰岛 素分泌的模式。对胰岛素的每日生理需求有波动且可分成两个阶段:(a)吸收阶 段,其需要一定冲量的胰岛素来处理膳食相关血糖波动;和(b)吸收后阶段,其 需要持续量的胰岛素来调节肝脏葡萄糖排出量以维持最佳空腹血糖。因此,有效 疗法通常涉及两种外源性胰岛素的组合使用:通过快速注射提供的速效进餐时间 胰岛素和通过每日注射一次或两次所投与的长效基础胰岛素。
在受让于EliLilly的专利申请案,以引用的方式并入本文中的美国公开案第 20040242460号中,揭示一类用作长效基础胰岛素疗法的酰化胰岛素。通过用活 化的脂肪酸衍生物选择性酰化单体胰岛素(包括正常胰岛素和某些胰岛素类似物) 的游离氨基来制备酰化胰岛素。适用的脂肪酸衍生物包括链长为至少六(6)个碳 原子的反应性脂肪酸型化合物和尤其那些链中具有8到21个碳原子的脂肪酸衍生 物。用棕榈酸衍生物酰化的单酰化正常人类胰岛素是尤其有前途的候选物。属于 这一类别的胰岛素描述于日本专利申请案1-254,699中。本发明的实施例提供含有 一个或一个以上非天然氨基酸的酰化胰岛素。本发明的另一实施例包括一个或一 个以上非天然编码氨基酸与水溶性聚合物(诸如聚乙二醇(PEG))连接的酰化胰 岛素。
根据本发明的实施例的方法可使具有健康肝脏(即能够正常吸收和产生葡萄 糖的肝脏,但不存在调节激素胰岛素)的糖尿病个体恢复葡萄糖内稳定。本发明 的方法可通过活化肝脏以调节血糖水平来减少或消除与常规糖尿病治疗方法相关 的高血糖和/或低血糖。根据本发明的实施例的方法还可减少或消除通常与糖尿病 相关的微血管并发症(例如肾病、视网膜病和/或神经病)和/或大血管并发症(例 如心肌梗塞和/或中风)的一些(如果不是所有)疾病。此外,根据本发明的实施 例的方法可减少或消除与外周投与(例如皮下、肺内、鼻内、口腔粘膜)胰岛素 相关的高胰岛素血症。此外,根据本发明的实施例的方法可通过活化肝脏以改善 其脂肪酸代谢来减少或消除与糖尿病相关的高脂质血症。适当活化肝脏也可恢复 其它肝脏细胞,与糖尿病相关并发症有关的基因调控的代谢途径。
在一些实施例中,胰岛素多肽包含一个或一个以上翻译后修饰。在一些实施 例中,胰岛素多肽与连接子、聚合物或生物活性分子连接。在一些实施例中,胰 岛素多肽与双官能聚合物、双官能连接子或至少一个其它胰岛素多肽连接。
在一些实施例中,非天然编码氨基酸与水溶性聚合物连接。在一些实施例中, 所述水溶性聚合物包含聚(乙二醇)部分。在一些实施例中,非天然编码氨基酸由 连接子与水溶性聚合物连接或与水溶性聚合物键结。在一些实施例中,聚(乙二醇) 分子为双官能聚合物。在一些实施例中,所述双官能聚合物与第二种多肽连接。 在一些实施例中,所述第二种多肽为胰岛素多肽。
在一些实施例中,胰岛素多肽包含至少两个与包含聚(乙二醇)部分的水溶性 聚合物连接的氨基酸。在一些实施例中,至少一个氨基酸为非天然编码氨基酸。
在一些实施例中,胰岛素多肽包含至少两个与包含聚(乙二醇)部分的水溶性 聚合物连接的氨基酸。在一些实施例中,至少一个氨基酸为非天然编码氨基酸。
在一些实施例中,一个或一个以上非天然编码氨基酸在一个或一个以上以下 位置处并入胰岛素、胰岛素类似物、赖脯胰岛素(insulinlispro)、赖谷胰岛素(insulin glulisine)、地特胰岛素(insulindetemir)或甘精胰岛素(insulinglargine)多肽中 的任一种中:在A链中,位置1(即在N端)之前、1、2、3、4、5、6、7、8、 9、10、11、12、13、14、15、16、17、18、19、20、21、22(即在蛋白质的羧基 端),和其任何组合(SEQIDNO:1,或SEQIDNO:3、SEQIDNO:5、SEQIDNO: 7、SEQIDNO:9或SEQIDNO:11中的相应氨基酸);和/或在B链中,位置1(即 在N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、 17、18、19、20、21、22、23、24、25、26、27、28、29、30、31(SEQIDNO: 2,或SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO: 12中的相应氨基酸)。在一些实施例中,一个或一个以上非天然编码氨基酸并入 胰岛素中的一个或一个以上以下位置处:位置1(即在N端)之前、1、2、3、4、 5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、 24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、 42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、 60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、 78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、 96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、 111(即在SEQIDNO:13的蛋白质的羧基端或SEQIDNO:14中的相应氨基酸)。 在一些实施例中,一个或一个以上非天然编码氨基酸在一个或一个以上以下位置 处并入胰岛素、胰岛素类似物、赖脯胰岛素、赖谷胰岛素、地特胰岛素或甘精胰 岛素多肽中的任一种中:在A链中,1、9、14、15(SEQIDNO:1,或SEQIDNO: 3、5、7、9、11中的相应氨基酸位置)。在一些实施例中,一个或一个以上非天 然编码氨基酸在一个或一个以上以下位置处并入胰岛素、胰岛素类似物、赖脯胰 岛素、赖谷胰岛素、地特胰岛素或甘精胰岛素多肽中的任一种中:在B链中,1、 22、28(SEQIDNO:2,或SEQIDNO:2、4、6、8、10、12中的相应氨基酸位置)。 在一些实施例中,一个或一个以上非天然编码氨基酸在一个或一个以上以下位置 处并入胰岛素、胰岛素类似物、赖脯胰岛素、赖谷胰岛素、地特胰岛素或甘精胰 岛素多肽中的任一种中:在A链中,1、4、5、8、9、12、14、15、18(SEQIDNO: 1,或SEQIDNO:3、5、7、9、11中的相应氨基酸位置)。在一些实施例中,一 个或一个以上非天然编码氨基酸在一个或一个以上以下位置处并入胰岛素、胰岛 素类似物、赖脯胰岛素、赖谷胰岛素、地特胰岛素或甘精胰岛素多肽中的任一种 中:在B链中,1、3、4、21、22、28、29(SEQIDNO:2,或SEQIDNO:2、4、 6、8、10、12中的相应氨基酸位置)。
在一些实施例中,一个或一个以上非天然编码氨基酸在胰岛素或胰岛素类似 物的一个或一个以上以下位置处并入:A链位置8、9、10、14(SEQIDNO:1、 SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11); 链位置1、17、21、25、28(SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQ IDNO:8、SEQIDNO:10、SEQIDNO:12)。在一些实施例中,一个或一个以上 非天然编码氨基酸在胰岛素的一个或一个以上以下位置处并入:A链位置8、9、 10、14(SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO: 9、SEQIDNO:11);链位置1、17、21、25、28(SEQIDNO:2、SEQIDNO:4、 SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12)。在一些实施例 中,一个或一个以上非天然编码氨基酸在胰岛素类似物的一个或一个以上以下位 置处并入:A链位置8、9、10、14(SEQIDNO:1、SEQIDNO:3、SEQIDNO: 5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11);链位置1、17、21、25、28 (SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、 SEQIDNO:12)。
在一些实施例中,一个或一个以上这些位置的非天然编码氨基酸与水溶性聚 合物连接,所述位置包括(但不限于)以下位置:在A链中,位置1(即在N端) 之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、21、22(即在蛋白质的羧基端),和其任何组合(SEQIDNO:1,或SEQIDNO: 3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9或SEQIDNO:11中的相应氨基 酸);和/或在B链中,位置1(即在N端)之前、1、2、3、4、5、6、7、8、9、 10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、 28、29、30、31(SEQIDNO:2,或SEQIDNO:4、SEQIDNO:6、SEQIDNO: 8、SEQIDNO:10、SEQIDNO:12中的相应氨基酸)。在一些实施例中,一个或 一个以上这些位置的非天然编码氨基酸与水溶性聚合物连接,所述位置包括(但 不限于):位置1(即在N端)前、1、2、3、4、5、6、7、8、9、10、11、12、 13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、 31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、 49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、 67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、 85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、 102、103、104、105、106、107、108、109、110、111(即SEQIDNO:13的蛋 白质的羧基端或SEQIDNO:14中的相应氨基酸)。在一些实施例中,一个或一个 以上这些位置的非天然编码氨基酸与水溶性聚合物连接,所述位置包括(但不限 于):在A链中,1、4、5、8、9、12、14、15、18(SEQIDNO:1,或SEQIDNO: 3、5、7、9、11中的相应氨基酸位置)。在一些实施例中,一个或一个以上这些 位置的非天然编码氨基酸与水溶性聚合物连接,所述位置包括(但不限于):在B 链中,1、3、4、21、22、28、29(SEQIDNO:2,或SEQIDNO:2、4、6、8、 10、12中的相应氨基酸位置)。
在一些实施例中,一个或一个以上这些位置的非天然编码氨基酸与水溶性聚 合物连接,所述位置包括(但不限于)以下位置:A链位置8、9、10、14(SEQID NO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO: 11);链位置1、17、21、25、28(SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、 SEQIDNO:8、SEQIDNO:10、SEQIDNO:12)。在一些实施例中,一个或一个 以上这些位置的非天然编码氨基酸与水溶性聚合物连接,所述位置包括(但不限 于)以下位置:A链位置8、9、10、14(SEQIDNO:1、SEQIDNO:3、SEQID NO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11);链位置1、17、21、25、 28(SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、 SEQIDNO:12)。在一些实施例中,一个或一个以上这些位置的非天然编码氨基 酸与水溶性聚合物连接,所述位置包括(但不限于)以下位置:A链位置8、9、 10、14(SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO: 9、SEQIDNO:11);B链位置1、17、21、25、28(SEQIDNO:2、SEQIDNO: 4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12)。
在一些实施例中,一个或一个以上非天然编码氨基酸在一个或一个以上以下 位置处并入胰岛素、胰岛素类似物、赖脯胰岛素、赖谷胰岛素、地特胰岛素或甘 精胰岛素多肽中的任一种中:B链位置1、2、9、10、28、29、30(SEQIDNO:2、 SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12)。 在一些实施例中,一个或一个以上这些位置的非天然编码氨基酸与水溶性聚合物 连接,所述位置包括(但不限于)以下位置:B链位置1、2、9、10、28、29、 30(SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、 SEQIDNO:12)。
在一些实施例中,一个或一个以上非天然编码氨基酸在一个或一个以上以下 位置处并入胰岛素、胰岛素类似物、赖脯胰岛素、赖谷胰岛素、地特胰岛素或甘 精胰岛素多肽中的任一种中:A链21,或B链位置1、10、13、16、28、29、31 或32(即蛋白质的羧基端)(SEQIDNO:1到SEQIDNO:12)。在一些实施例中, 一个或一个以上这些位置的非天然编码氨基酸与水溶性聚合物连接,所述位置包 括(但不限于)以下位置:A链21,或B链位置1、10、13、16、28、29、31或 32(即在蛋白质的羧基端)(SEQIDNO:1到SEQIDNO:12)。
在一些实施例中,一个或一个以上非天然编码氨基酸在一个或一个以上以下 位置处并入胰岛素、胰岛素类似物、赖脯胰岛素、赖谷胰岛素、地特胰岛素或甘 精胰岛素多肽中的任一种中:A链位置8、9、10、14(SEQIDNO:1、SEQIDNO: 3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11)。在一些实施 例中,一个或一个以上这些位置的非天然编码氨基酸与水溶性聚合物连接,所述 位置包括(但不限于)以下位置:A链位置8、9、10、14(SEQIDNO:1、SEQID NO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11)。
在一些实施例中,一个或一个以上非天然编码氨基酸在一个或一个以上以下 位置处并入胰岛素、胰岛素类似物、赖脯胰岛素、赖谷胰岛素、地特胰岛素或甘 精胰岛素多肽中的任一种中:B链位置17、21、25、28(SEQIDNO:2、SEQID NO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12)。在一 些实施例中,一个或一个以上这些位置的非天然编码氨基酸与水溶性聚合物连接, 所述位置包括(但不限于)以下位置:B链位置17、21、25、28(SEQIDNO:2、 SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12)。
在一些实施例中,一个或一个以上非天然编码氨基酸在一个或一个以上以下 位置处并入胰岛素、胰岛素类似物、赖脯胰岛素、赖谷胰岛素、地特胰岛素或甘 精胰岛素多肽中的任一种中:A链位置4、8、9、10、14、18、21(SEQIDNO:1、 SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO:11)。 在一些实施例中,一个或一个以上这些位置的非天然编码氨基酸与水溶性聚合物 连接,所述位置包括(但不限于)以下位置:A链位置4、8、9、10、14、18、 21(SEQIDNO:1、SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、SEQIDNO:9、 SEQIDNO:11)。
在一些实施例中,一个或一个以上非天然编码氨基酸在一个或一个以上以下 位置处并入胰岛素、胰岛素类似物、赖脯胰岛素、赖谷胰岛素、地特胰岛素或甘 精胰岛素多肽中的任一种中:B链位置1、5、17、21、25、29、30(SEQIDNO: 2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12)。 在一些实施例中,一个或一个以上这些位置的非天然编码氨基酸与水溶性聚合物 连接,所述位置包括(但不限于)以下位置:B链位置1、5、17、21、25、29、 30(SEQIDNO:2、SEQIDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、 SEQIDNO:12)。
在一些实施例中,一个或一个以上非天然编码氨基酸并入胰岛素的一个或一 个以上以下位置处:在A链中,位置1(即在N端)之前、1、2、3、4、5、6、 7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22(即在蛋白质 的羧基端),和其任何组合(SEQIDNO:1);或在B链中,位置1(即在N端) 之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、21、22、23、24、25、26、27、28、29、30、31(SEQIDNO:2)。在一些实 施例中,一个或一个以上非天然编码氨基酸并入赖脯胰岛素的一个或一个以上以 下位置处:在A链中,位置1(即在N端)之前、1、2、3、4、5、6、7、8、9、 10、11、12、13、14、15、16、17、18、19、20、21、22(即在蛋白质的羧基端), 和其任何组合(SEQIDNO:3);或在B链中,位置1(即在N端)之前、1、2、 3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、 23、24、25、26、27、28、29、30、31(SEQIDNO:4)。在一些实施例中,一个 或一个以上非天然编码氨基酸并入门冬胰岛素的一个或一个以上以下位置处:在 A链中,位置1(即在N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、 13、14、15、16、17、18、19、20、21、22(即在蛋白质的羧基端),和其任何组 合(SEQIDNO:5);或在B链中,位置1(即在N端)之前、1、2、3、4、5、6、 7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、 26、27、28、29、30、31(SEQIDNO:6)。在一些实施例中,一个或一个以上非 天然编码氨基酸并入赖谷胰岛素的一个或一个以上以下位置处:在A链中,位置 1(即在N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、 16、17、18、19、20、21、22(即在蛋白质的羧基端),和其任何组合(SEQIDNO: 7);或在B链中,位置1(即在N端)之前、1、2、3、4、5、6、7、8、9、10、 11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、 29、30、31(SEQIDNO:8)。在一些实施例中,一个或一个以上非天然编码氨基 酸并入地特胰岛素的一个或一个以上以下位置处:在A链中,位置1(即在N端) 之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、21、22(即在蛋白质的羧基端),和其任何组合(SEQIDNO:9);或在B链 中,位置1(即在N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、 14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31 (SEQIDNO:10)。在一些实施例中,一个或一个以上非天然编码氨基酸并入甘精 胰岛素的一个或一个以上以下位置处:在A链中,位置1(即在N端)之前、1、 2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、 22(即在蛋白质的羧基端),和其任何组合(SEQIDNO:11);或在B链中,位置 1(即在N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、 16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31(SEQID NO:12)。
在一些实施例中,在胰岛素、赖脯胰岛素、赖谷胰岛素、地特胰岛素或甘精 胰岛素多肽中的任一种中的一个或一个以上这些位置的非天然编码氨基酸与水溶 性聚合物连接,所述位置包括(但不限于)以下位置:在位置1(即在N端)之 前,在A链中,位置1(即在N端)之前、1、2、3、4、5、6、7、8、9、10、 11、12、13、14、15、16、17、18、19、20、21、22(即在蛋白质的羧基端),和 其任何组合(SEQIDNO:1,或SEQIDNO:3、SEQIDNO:5、SEQIDNO:7、 SEQIDNO:9或SEQIDNO:11中的相应氨基酸);或在B链中,位置1(即在N 端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、 19、20、21、22、23、24、25、26、27、28、29、30、31(SEQIDNO:2,或SEQ IDNO:4、SEQIDNO:6、SEQIDNO:8、SEQIDNO:10、SEQIDNO:12中的 相应氨基酸)。
在一些实施例中,胰岛素多肽中的一个或一个以上这些位置的非天然编码氨 基酸与水溶性聚合物连接,所述位置包括(但不限于)以下位置:位置1(即在N 端)前,在A链中,位置1(即在N端)之前、1、2、3、4、5、6、7、8、9、 10、11、12、13、14、15、16、17、18、19、20、21、22(即在蛋白质的羧基端), 和其任何组合(SEQIDNO:1);或在B链中,位置1(即在N端)之前、1、2、 3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、 23、24、25、26、27、28、29、30、31(SEQIDNO:2)。在一些实施例中,赖脯 胰岛素多肽中的一个或一个以上这些位置的非天然编码氨基酸与水溶性聚合物连 接,所述位置包括(但不限于)以下位置:在A链中,位置1(即在N端)之前、 1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、 21、22(即在蛋白质的羧基端),和其任何组合(SEQIDNO:3);或在B链中, 位置1(即在N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、 15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31(SEQ IDNO:4)。在一些实施例中,门冬胰岛素多肽中的一个或一个以上这些位置的非 天然编码氨基酸与水溶性聚合物连接,所述位置包括(但不限于)以下位置:在 A链中,位置1(即在N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、 13、14、15、16、17、18、19、20、21、22(即在蛋白质的羧基端),和其任何组 合(SEQIDNO:5);或在B链中,在位置1(即在N端)之前、1、2、3、4、5、 6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、 25、26、27、28、29、30、31(SEQIDNO:6)。在一些实施例中,赖谷胰岛素多 肽中的一个或一个以上这些位置的非天然编码氨基酸与水溶性聚合物连接,所述 位置包括(但不限于)以下位置:在A链中,位置1(即在N端)之前、1、2、 3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22 (即在蛋白质的羧基端),和其任何组合(SEQIDNO:7);或在B链中,位置1(即 在N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、 17、18、19、20、21、22、23、24、25、26、27、28、29、30、31(SEQIDNO: 8)。在一些实施例中,地特胰岛素多肽中的一个或一个以上这些位置的非天然编 码氨基酸与水溶性聚合物连接,所述位置包括(但不限于)以下位置:在A链中, 位置1(即在N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、 15、16、17、18、19、20、21、22(即在蛋白质的羧基端),和其任何组合(SEQ IDNO:9);或在B链中,位置1(即在N端)之前、1、2、3、4、5、6、7、8、 9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、 27、28、29、30、31(SEQIDNO:10)。在一些实施例中,甘精胰岛素多肽中的 一个或一个以上这些位置的非天然编码氨基酸与水溶性聚合物连接,所述位置包 括(但不限于)以下位置:在A链中,位置1(即在N端)之前、1、2、3、4、 5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22(即在 蛋白质的羧基端),和其任何组合(SEQIDNO:11);或在B链中,位置1(即在 N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、 18、19、20、21、22、23、24、25、26、27、28、29、30、31(SEQIDNO:12)。
在一些实施例中,一个或一个以上非天然编码氨基酸在一个或一个以上以下 位置处并入胰岛素、赖脯胰岛素、赖谷胰岛素、地特胰岛素或甘精胰岛素多肽中 的任一种中:28、36、76、80、107、108、111、8、15、19、36、42、46、48、 49、80、108、111、113、155和其任何组合(SEQIDNO:1和SEQIDNO:2;SEQ IDNO:3和SEQIDNO:4;SEQIDNO:5和SEQIDNO:6;SEQIDNO:7和SEQ IDNO:8;SEQIDNO:9和SEQIDNO:10;或SEQIDNO:11和SEQIDNO:12)。
本发明的方法可用于制造含有一个或一个以上非天然编码氨基酸的胰岛素类 似物晶体。受让于Sanofi-AventisDeutschlandGmbH的美国专利第7,193,035号(以 引用的方式并入本文中)揭示胰岛素类似物晶体的形成和用途。
调配物
在本发明的广泛实践中,还涵盖调配物可含有胰岛素、胰岛素类似物、酰化 胰岛素或酰化胰岛素类似物中的两种或两种以上的混合物,其中所述混合物的至 少一种组分含有非天然编码氨基酸。在本发明的另一实施例中,含有胰岛素、胰 岛素类似物、酰化胰岛素或酰化胰岛素类似物中的两种或两种以上的混合物(其 中所述混合物的至少一种组分含有非天然编码氨基酸)的调配物还包括至少一种 水溶性聚合物与至少一种非天然编码氨基酸连接。
本发明还包括异质混合物,其中通过本发明中所揭示的方法制备胰岛素多肽 和胰岛素类似物且接着混合以致可向有需要的患者投与调配物,所述调配物含有 例如25%在聚乙二醇化的B链位置28含有非天然编码氨基酸的胰岛素多肽;25% 在B链位置10含有非天然编码氨基酸的胰岛素多肽,所述非天然编码氨基酸与 水溶性聚合物偶合;和50%胰岛素多肽,其中非天然编码氨基酸出现在胰岛素B 链的位置31(SEQIDNO:2;或者SEQIDNO:4、6、8、10或12)。不同百分比 量的胰岛素多肽变异体的所有不同混合物,其中所述胰岛素多肽包括具有不同尺 寸PEG的变种(1),或(2)在序列中的不同位置包括PEG。此打算作为实例且 决不应视为限制通过本发明变成可能的调配物并对于所属领域的技术人员将显而 易见。在另一实施例中,调配物混合物中所包括的胰岛素多肽变异体将根据其不 同分解时间(dissociationtime)来选择以致调配物可向有需要的患者提供持续释 放的胰岛素。
本发明的调配物可包括胰高血糖素。
本发明的包括吸入用调配物的其它实施例
在本发明的另一实施例中,有可能使用本文所揭示的技术来制造药物动力学 和药效学性质增加的胰岛素类似物以通过投与肺来用于患者,导致胰岛素的血液 水平提高,其在投与后持续至少6小时,且更通常至少8、10、12、14、18、24 小时或更久。本发明的另一实施例虑及适合于设计成以吸入剂形式投与患者的治 疗性调配物的胰岛素类似物的有利混合物。
在本发明的一些实施例中,天然胰岛素分子中的以下位点可经非天然编码氨 基酸取代且任选地进一步通过共价连接水溶性聚合物(诸如PEG)来修饰:A与 B链的2个C端、Arg22B、His10B、His5A、Glu4A、Glu17A、Glu13B和Glu21B。
除天然胰岛素外,本发明提供一个或一个以上非天然编码氨基酸经取代或插 入信号序列中的非天然胰岛素多肽和胰岛素类似物,其也可提供用于合并一个或 一个以上水溶性聚合物(诸如PEG)的位点。本发明的这一实施例尤其适用于在 胰岛素分子中引入其它定制聚乙二醇化位点,例如形成酶降解抗性增加的PEG- 胰岛素。所述方法在设计具有活性、稳定性、溶解性和药理学性质之间的所需平 衡的最佳胰岛素结合物方面提供较大灵活性。可在胰岛素分子中的许多位置进行 突变,即通过位点特异性突变诱发。用于本发明的PEG可具有多种结构:线性、 叉状、分支、哑铃状等等。通常,用适合于偶合胰岛素分子上的所需位点的合适 活化基团使PEG活化。活化PEG将在末端具有反应性基团以与胰岛素反应。代 表性活化PEG衍生物和使这些药剂与药物(诸如胰岛素)结合的方法为所属技术 中所已知且进一步描述于Zalipsky,S.等人,″UseofFunctionalizedPoly(Ethylene Glycols)forModificationofPolypeptides″,PolyethyleneGlycolChemistry: BiotechnicalandBiomedicalApplications,J.M.Harris,PlenusPress,NewYork (1992),和AdvancedDrugReviews,16:157-182(1995)中。
在本发明的一特定实施例中,结合物的PEG部分不存在一个或一个以上有效 显著改变聚合物或聚合物-胰岛素结合物的水溶性的亲脂性基团。那就是说,本发 明的结合物的聚合物或非胰岛素部分可含有认为亲脂性高于亲水性的原子的基团 (例如具有约2到8-12个碳原子的碳链),然而,如果所述基团的存在不会有效显 著改变聚合物或结合物的亲水性,那么本发明的结合物中可含有所述部分。也就 是说,通过胰岛素、胰岛素多肽和胰岛素类似物的位点特异性突变,本发明的胰 岛素结合物自身可展现亲水性,而非亲脂性或两亲性。在本发明的可存在亲脂性 部分的某些实施例中,所述部分优选不位于PEG链的末端。
用于本发明的结合物中的分支PEG包括国际专利公开案WO96/21469中所述 的那些PEG,所述专利的内容明确地以全文引用的方式并入本文中。通常,分支 PEG可由式R(PEG--OH).sub.n表示,其中R表示中心“核心”分子且.sub.n表示 臂的数目。分支PEG具有中心核心,从所述中心核心伸出2个或2个以上“PEG” 臂。在分支构型中,分支聚合物核心具有用于连接胰岛素的单个反应性位点。用 于本发明的分支PEG通常将包含少于4个PEG臂,且更优选将包含少于3个PEG 臂。分支PEG提供单个反应性位点所偶合的聚合物云状物比其线性PEG对应物 更大且更致密的优点。一种特定类型的分支PEG可表示为(MeO-PEG-).sub.p R--X,其中p等于2或3,R为连接有2或3个PEG臂的中心核心结构(诸如赖 氨酸或甘油),且X表示任何受到活化或可受到活化以偶合胰岛素的合适官能团。 一种尤其优选的分支PEG为具有结构mPEG2-赖氨酸-丁二酰亚胺的mPEG2-NHS (ShearwaterCorporation,Alabama)。
在另一种分支结构中,“侧位PEG”具有沿PEG主链而非在PEG链末端安置 的用于偶合蛋白质的反应性基团。从PEG主链伸出以与胰岛素偶合的反应性基团 可相同或不同。侧位PEG结构可为适用的,但通常次优选,尤其对于吸入用组合 物来说。
或者,PEG-胰岛素结合物的PEG部分可具有叉状结构,其在聚合物链的一端 具有分支部分和两个(或2的任何倍数个)与所述分支部分连接的游离反应性基 团以与胰岛素连接。示范性叉状PEG描述于国际专利公开案第WO99/45964号中, 所述专利的内容明确地以引用的方式并入本文中。叉状聚乙二醇可任选地在聚合 物链的另一端包括烷基或“R”基团。更具体来说,本发明的叉状PEG-胰岛素结 合物具有式:R-PEG-L(Y-胰岛素)n,其中R为烷基,L为水解稳定的分支点且Y 为提供叉状聚合物与胰岛素的化学连接的连接基团,且n为2的倍数。L可表示 单个“核心”基团,诸如“--CH--”,或可包含较长原子链。示范性L基团包括赖 氨酸、甘油、季戊四醇或山梨糖醇。通常,分支部分中的特定分支原子是碳。
在本发明的一特定实施例中,叉状PEG与胰岛素分子的连接(Y)是水解稳 定的。在一优选实施例中,n为2。合适的Y部分在与胰岛素上的反应性位点结 合之前包括(但不限于)活性酯、活性碳酸酯、醛、异氰酸酯、异硫氰酸酯、环 氧化物、醇、顺丁烯二酰亚胺、乙烯砜、酰肼、二硫吡啶和碘乙酰胺。合适的活 化基团的选择将视胰岛素分子上的所欲连接位点而定且可易于由所属领域的技术 人员确定。所得PEG-胰岛素结合物中的相应Y基团是由活化叉状聚合物与胰岛 素上的合适反应性位点反应所产生的Y基团。所述最后连接的特定特性对于所属 领域的技术人员将显而易见。举例来说,如果反应性叉状PEG含有活化酯(诸如 丁二酰亚胺或顺丁烯二酰亚胺酯),那么通过胰岛素上的胺位点结合将导致形成相 应酰胺键。这些特定叉状聚合物尤其具有吸引力,因为其提供胰岛素与PEG的摩 尔比为2∶1或更大的结合物。所述结合物不太可能阻断胰岛素受体位点,同时仍 提供在保护胰岛素以防酶降解(例如通过胰岛素降解酶)的设计方面的灵活性。
在一相关实施例中,叉状PEG-胰岛素结合物可用于本发明中,其由式 R-[PEG-L(Y-胰岛素)2]n表示。在这种情况下,R表示连接有至少一个PEG-二聚 胰岛素结合物的非天然编码氨基酸。具体来说,根据本发明的这一方面的优选叉 状聚合物是n选自由1、2、3、4、5和6组成的群组的那些聚合物。在一替代实 施例中,胰岛素、胰岛素多肽或胰岛素类似物中的非天然氨基酸与聚合物分支点 之间的化学键是可降解的(即水解不稳定)。或者,聚合物骨架中可含有一个或一 个以上可降解键以使得活体内产生PEG链比最初投与的结合物中的PEG链小的 PEG-胰岛素结合物。举例来说,可投与大且相对惰性的结合物(即连接有一个或 一个以上高分子量PEG链,例如一个或一个以上分子量超过约10,000的PEG链, 其中结合物基本上不具有生物活性),其随后在肺中或在血流中水解产生具有最初 存在的PEG链的一部分的生物活性结合物。水解可降解键在活体内裂解后,接着 释放游离胰岛素(视可降解键的位置而定)或连接有小聚乙烯标记的胰岛素且其 更易吸收穿过肺和/或在血液中循环。
在本发明的这一实施例的一个特征中,在投与后,完整聚合物-结合物在水解 之前最低限度地降解,以致可裂解键的水解有效地控制活性胰岛素进入血流的缓 慢释放速率,这与胰岛素在释放到全身循环中之前的酶降解相反。
适当生理学上可裂解的键包括(但不限于)酯、碳酸酯、氨基甲酸酯、硫酸 酯、磷酸酯、酰氧基烷基醚、缩醛和缩酮。所述结合物应具有生理学上可裂解的 键,其在贮存后和投与后是稳定的。举例来说,在制造最终医药组合物后,在溶 解于适当传递媒剂(如果使用)中,和在不管途径投与后,PEG-可裂解键-胰岛素 结合物应维持其完整性。
单链胰岛素
当关注外周胰岛素抗性时,所选药物是噻唑烷二酮,它是一类胰岛素增敏剂。 举例来说,曲格列酮(Troglitazone;TRG)是噻唑烷二酮化学品系列的口服活性 抗糖尿病药。已显示这种药物逆转患有NIDDM和葡萄糖耐量异常的患者的胰岛 素抗性,并且在胰岛素抗性的许多遗传和获得性啮齿动物模型中可增强胰岛素作 用。TRG的抗高血糖作用由其增加胰岛素依赖性葡萄糖处理和减少肝脏葡萄糖生 成的能力引起。相信TRG治疗通过增强胰岛素作用可在较低循环胰岛素水平下使 得血糖正常。在这点上,在正常和糖尿病啮齿动物和人类临床试验中的研究尚未 揭露低血糖是噻唑烷二酮疗法的并发症。另一方面,向正常或胰岛素缺陷型糖尿 病动物投与这些药物无法改变血浆葡萄糖或胰岛素或葡萄糖耐量,尽管胰岛素敏 感性仍增加。
胰岛素的双链结构使得胰岛素采用多种构型,且数个发现已表明胰岛素具有 显著构型变化的倾向且所述变化的可能性的限制显著降低胰岛素受体对配体的亲 和力。胰岛素原对胰岛素受体的亲和力是天然胰岛素的1/100。阻断胰岛素中的氨 基酸残基A1还会导致弱受体结合,这与胰岛素的A链的游离N端和B链的游离 C端对于结合胰岛素受体很重要的定理一致。
胰岛素分子的固有物理和化学稳定性是糖尿病的胰岛素疗法的基础条件。这 些基础性质对于胰岛素调配物和适用胰岛素投药方法,以及医药制剂的存放期和 贮存条件是基本的。在投与胰岛素时使用溶液会使分子暴露于各种因素的组合, 例如高温、可变空气-液体-固体界面(interphase)以及剪切力,这可导致不可逆 的构象变化,例如纤维化。这对于外部穿戴或植入的输注泵中的胰岛素溶液尤其 有关,这使分子长时间暴露于这些因素的组合以及因泵移动而产生的剪切力。因 此,当使用输注泵作为胰岛素传递系统时,特别关注纤维化。此外,胰岛素的溶 解性受多种因素影响且显示在4.2到6.6的pH值范围内显著降低。pH值沉淀区 通常对调配物有所限制,但也有意用于开发和调配某些类似物。
因此,在本发明的另一实施例中,一个或一个以上非天然编码氨基酸并入单 链胰岛素或单链胰岛素类似物中。EP1,193,272中揭示具有胰岛素活性的单链胰 岛素。这些单链胰岛素具有5-18个氨基酸的经修饰C肽且报道具有高达42%胰岛 素活性。EP1,193,272揭示连接B30与A21的以下经修饰C肽: Gly-Gly-Gly-Pro-Gly-Lys-Arg、Arg-Arg-Gly-Pro-Gly-Gly-Gly、 Gly-Gly-Gly-Gly-Gly-Lys-Arg、Arg-Arg-Gly-Gly-Gly-Gly-Gly、 Gly-Gly-Ala-Pro-Gly-Asp-Val-Lys-Arg、Arg-Arg-Ala-Pro-Gly-Asp-Val-Gly-Gly、 Gly-Gly-Tyr-Pro-Gly-Asp-Val-Lys-Arg、Arg-Arg-Tyr-Pro-Gly-Asp-Val-Gly-Gly、 Gly-Gly-His-Pro-Gly-Asp-Val-Lys-Arg和Arg-Arg-His-Pro-Gly-Asp-Val-Gly-Gly。EP 741,188揭示具有经修饰C肽的单链胰岛素,所述C肽具有10-14个氨基酸残基 且具有14%到34%胰岛素活性并具有以下连接肽
Gln-Pro-Leu-Ala-Leu-Glu-Gly-Ser-Leu-Gln-Lys-Arg和 Gly-Tyr-Gly-Ser-Ser-Ser-Arg-Arg-Ala-Pro-Gln-Thr。WO95/16708揭示具有1-15个 氨基酸残基的连接肽且无Lys或Arg作为连接肽中的C端氨基酸残基的单链胰岛 素。WO95/16708揭示以下C肽序列 Gly-Tyr-Gly-Ser-Ser-Ser-Arg-Arg-Ala-Pro-Gln-Thr和 Gly-Tyr-Gly-Ser-Ser-Ser-Ala-Ala-Ala-Pro-Gln-Thr。这些单链胰岛素经报道具有胰 岛素活性,而且对IGF-1受体的亲和力相当高。
诺和诺德公司(NovoNordisk,Inc.)美国专利公开案第20070129284号揭示 在B链与A链之间引入C肽以降低分子柔性且伴随降低纤维化倾向并限制或改变 pH值沉淀区的单链胰岛素类似物。由诺和诺德公司(NovoNordisk,Inc.)揭示的 单链胰岛素的一个实例包含由连接肽连接的人类胰岛素或其类似物或衍生物的B 链和A链,其中所述连接肽具有5-11个氨基酸残基,但是如果连接肽含有两个相 邻碱性氨基酸残基,那么B链和/或A链中的至少一个天然氨基酸残基经另一个 可编码氨基酸残基取代,或A链、B链或连接肽中的至少一个赖氨酸残基已通过 酰化反应以化学方式加以修饰或连接肽不是以下序列之一: G1y-Gly-Gly-Pro-Gly-Lys-Arg、Arg-Arg-Gly-Pro-Gly-Gly-Gly、 Gly-Gly-Gly-Gly-Gly-Lys-Arg、Arg-Arg-Gly-Gly-Gly-Gly-Gly、 Gly-Gly-Ala-Pro-Gly-Asp-Val-Lys-Arg、Arg-Arg-Ala-Pro-Gly-Asp-Val-Gly-Gly、 Gly-Gly-Tyr-Pro-Gly-Asp-Val-Lys-Arg、Arg-Arg-Tyr-Pro-Gly-Asp-Val-Gly-Gly、 Gly-Gly-His-Pro-Gly-Asp-Val-Lys-Arg或Arg-Arg-His-Pro-Gly-Asp-Val-Gly-Gly。
在一些实施例中,本发明的多肽在信号序列中包含一个或一个以上非天然编 码氨基酸取代、添加或缺失。在一些实施例中,本发明的多肽在用于胰岛素或本 说明书中所揭示的胰岛素类似物或多肽中的任一种的信号序列中包含一个或一个 以上非天然编码氨基酸取代、添加或缺失。在一些实施例中,本发明的多肽在信 号序列中包含一个或一个以上天然编码氨基酸取代、添加或缺失,以及在用于胰 岛素或本说明书中所揭示的胰岛素类似物或多肽中的任一种的信号序列中包含一 个或一个以上非天然编码氨基酸取代、添加或缺失。在一些实施例中,一个或一 个以上非天然氨基酸并入用于胰岛素或本说明书中所揭示的胰岛素类似物或多肽 中的任一种的前导序列或信号序列中。
在一些实施例中,胰岛素多肽包含调节胰岛素多肽对胰岛素多肽受体或结合 搭配物(包括(但不限于)蛋白质、多肽、小分子或核酸)的亲和力的取代、添 加或缺失。在一些实施例中,胰岛素多肽包含取代、添加或缺失,与无取代、添 加或缺失的相应胰岛素的稳定性相比,所述取代、添加或缺失增加胰岛素多肽的 稳定性。稳定性和/或溶解性可使用所属领域的技术人员已知的许多不同测定来测 量。所述测定包括(但不限于)SE-HPLC和RP-HPLC。在一些实施例中,胰岛 素多肽包含取代、添加或缺失,与无取代、添加或缺失的相应胰岛素的免疫原性 相比,所述取代、添加或缺失调节胰岛素多肽的免疫原性。在一些实施例中,胰 岛素多肽包含取代、添加或缺失,与无取代、添加或缺失的相应胰岛素的血清半 衰期或循环时间相比,所述取代、添加或缺失调节胰岛素多肽的血清半衰期或循 环时间。
在一些实施例中,胰岛素多肽包含取代、添加或缺失,与无取代、添加或缺 失的相应胰岛素的水溶性相比,所述取代、添加或缺失增加胰岛素多肽的水溶性。 在一些实施例中,胰岛素多肽包含取代、添加或缺失,与无取代、添加或缺失的 相应胰岛素的溶解性相比,所述取代、添加或缺失增加宿主细胞中所产生的胰岛 素多肽的溶解性。在一些实施例中,胰岛素多肽包含取代、添加或缺失,与无取 代、添加或缺失的相应胰岛素的表达或合成相比,所述取代、添加或缺失增加胰 岛素多肽在宿主细胞中的表达或增加活体外合成。包含这一取代的胰岛素多肽保 留激动剂活性且保留或改良在宿主细胞中的表达水平。在一些实施例中,胰岛素 多肽包含取代、添加或缺失,与无取代、添加或缺失的相应胰岛素的蛋白酶抗性 相比,所述取代、添加或缺失增加胰岛素多肽的蛋白酶抗性。在一些实施例中, 胰岛素多肽包含取代、添加或缺失,与和无取代、添加或缺失的相应胰岛素多肽 相互作用后的胰岛素受体的信号转导活性相比,所述取代、添加或缺失调节受体 的活性。在一些实施例中,胰岛素多肽包含取代、添加或缺失,与无取代、添加 或缺失的相应胰岛素多肽与另一分子(诸如受体)的结合相比,所述取代、添加 或缺失调节其结合。在一些实施例中,胰岛素多肽包含取代、添加或缺失,与无 取代、添加或缺失的相应胰岛素多肽的抗病毒活性相比,所述取代、添加或缺失 调节其抗病毒活性。在一些实施例中,胰岛素多肽包含取代、添加或缺失,与无 取代、添加或缺失的相应胰岛素多肽的葡萄糖代谢活性相比,所述取代、添加或 缺失增强其葡萄糖代谢活性。
在一些实施例中,胰岛素多肽包含取代、添加或缺失,与无取代、添加或缺 失的相应胰岛素与医药防腐剂(例如间甲酚、苯酚、苄醇)的相容性相比,所述 取代、添加或缺失增加胰岛素多肽苄醇的相容性。这得到增加的相容性将使得能 够制备出维持蛋白质在贮存期间的生理化学性质和生物活性的防腐医药调配物。
在一些实施例中,产生与一个或一个以上非天然氨基酸的一个或一个以上工 程改造键。分子内键可以许多方式产生,包括(但不限于)在合适的条件下于蛋 白质中的两个氨基酸之间反应(一个或两个氨基酸可为非天然氨基酸);在合适的 条件下与两个氨基酸(其中每一个氨基酸可为天然编码或非天然编码氨基酸)、与 连接子、聚合物或其它分子反应;等。
在一些实施例中,胰岛素多肽中的一个或一个以上氨基酸取代可用一个或一 个以上天然存在的氨基酸或非天然编码氨基酸进行。在一些实施例中,胰岛素多 肽中的氨基酸取代可用天然存在的氨基酸或非天然编码氨基酸进行,但是至少一 个取代是用非天然编码氨基酸进行。在一些实施例中,胰岛素多肽中的一个或一 个以上氨基酸取代可用一个或一个以上天然存在的氨基酸进行,且另外,至少一 个取代是用非天然编码氨基酸进行。
在一些实施例中,非天然编码氨基酸包含羰基、乙酰基、氨氧基、肼基、酰 肼基、氨基脲基、叠氮基或炔基。
在一些实施例中,非天然编码氨基酸包含羰基。在一些实施例中,非天然编 码氨基酸具有以下结构:
其中n为0-10;R1为烷基、芳基、经取代烷基或经取代芳基;R2为H、烷 基、芳基、经取代烷基和经取代芳基;且R3为H、氨基酸、多肽或氨基端修饰 基团,且R4为H、氨基酸、多肽或羧基端修饰基团。
在一些实施例中,非天然编码氨基酸包含氨氧基。在一些实施例中,非天然 编码氨基酸包含酰肼基。在一些实施例中,非天然编码氨基酸包含肼基。在一些 实施例中,非天然编码氨基酸残基包含氨基脲基。
在一些实施例中,非天然编码氨基酸残基包含叠氮基。在一些实施例中,非 天然编码氨基酸具有以下结构:
其中n为0-10;R1为烷基、芳基、经取代烷基、经取代芳基或不存在;X为 O、N、S或不存在;m为0-10;R2为H、氨基酸、多肽或氨基端修饰基团,且 R3为H、氨基酸、多肽或羧基端修饰基团。
在一些实施例中,非天然编码氨基酸包含炔基。在一些实施例中,非天然编 码氨基酸具有以下结构:
其中n为0-10;R1为烷基、芳基、经取代烷基或经取代芳基;X为O、N、 S或不存在;m为0-10,R2为H、氨基酸、多肽或氨基端修饰基团,且R3为H、 氨基酸、多肽或羧基端修饰基团。
在一些实施例中,多肽为胰岛素多肽激动剂、部分激动剂、拮抗剂、部分拮 抗剂或反向激动剂。在一些实施例中,所述胰岛素多肽激动剂、部分激动剂、拮 抗剂、部分拮抗剂或反向激动剂包含与水溶性聚合物连接的非天然编码氨基酸。 在一些实施例中,所述水溶性聚合物包含聚(乙二醇)部分。在一些实施例中,胰 岛素多肽激动剂、部分激动剂、拮抗剂、部分拮抗剂或反向激动剂包含非天然编 码氨基酸和一个或一个以上翻译后修饰、连接子、聚合物或生物活性分子。
本发明还提供分离的核酸,其包含在严格条件下与编码SEQIDNO:1、2、3、 4、5、6、7、8、9、10、11和12的胰岛素多肽的核酸杂交的多核苷酸。本发明 还提供分离的核酸,其包含在严格条件下与编码SEQIDNO:1和2的胰岛素多肽 的核酸杂交的多核苷酸。本发明还提供分离的核酸,其包含在严格条件下与编码 如SEQIDNO:1、2、3、4、5、6、7、8、9、10、11和12所示的多肽的多核苷 酸杂交的多核苷酸,其中所述多核苷酸包含至少一个选择密码子。本发明还提供 分离的核酸,其包含在严格条件下与编码如SEQIDNO:1和2所示的多肽的多核 苷酸杂交的多核苷酸,其中所述多核苷酸包含至少一个选择密码子。本发明提供 分离的核酸,其包含编码如SEQIDNO.:1和2所示的多肽的多核苷酸。本发明 还提供分离的核酸,其包含编码如SEQIDNO.:1、2、3、4、5、6、7、8、9、10、 11和12所示的多肽的多核苷酸。本发明提供分离的核酸,其包含编码如SEQID NO.:1和2所示且具有一个或一个以上非天然编码氨基酸的多肽的多核苷酸。本 发明还提供分离的核酸,其包含编码如SEQIDNO.:1、2、3、4、5、6、7、8、9、 10、11和12所示且具有一个或一个以上非天然编码氨基酸的多肽的多核苷酸。 对于所属领域的技术人员显而易见,许多不同多核苷酸可编码本发明的任何多肽。
在一些实施例中,所述选择密码子是选自由琥珀密码子、赭石密码子、蛋白 石密码子、独特密码子、稀有密码子、五碱基密码子和四碱基密码子组成的群组。
本发明还提供制备与水溶性聚合物连接的胰岛素多肽的方法。在一些实施例 中,所述方法包含使包含非天然编码氨基酸的分离的胰岛素多肽与包含与所述非 天然编码氨基酸反应的部分的水溶性聚合物接触。在一些实施例中,并入胰岛素 多肽中的非天然编码氨基酸对水溶性聚合物具有反应性,另外对20种常见氨基酸 中的任一种不具有反应性。在一些实施例中,并入胰岛素多肽中的非天然编码氨 基酸对连接子、聚合物或生物活性分子具有反应性,另外对20种常见氨基酸中的 任一种不具有反应性。
在一些实施例中,通过使包含含羰基氨基酸的胰岛素多肽与包含氨氧基、肼 基、酰肼基或氨基脲基的聚(乙二醇)分子反应来制备与水溶性聚合物连接的胰岛 素多肽。在一些实施例中,氨氧基、肼基、酰肼基或氨基脲基通过酰胺键与聚(乙 二醇)分子连接。在一些实施例中,氨氧基、肼基、酰肼基或氨基脲基通过氨基甲 酸酯键与聚(乙二醇)分子连接。
在一些实施例中,通过使包含羰基的聚(乙二醇)分子与包含含有氨氧基、肼 基、酰肼基或氨基脲基的非天然编码氨基酸的多肽反应来制备与水溶性聚合物连 接的胰岛素多肽。
在一些实施例中,通过使包含含炔氨基酸的胰岛素多肽与包含叠氮基部分的 聚(乙二醇)分子反应来制备与水溶性聚合物连接的胰岛素多肽。在一些实施例中, 叠氮基或炔基通过酰胺键与聚(乙二醇)分子连接。
在一些实施例中,通过使包含含叠氮基氨基酸的胰岛素多肽与包含炔部分的 聚(乙二醇)分子反应来制备与水溶性聚合物连接的胰岛素多肽。在一些实施例中, 叠氮基或炔基通过酰胺键与聚(乙二醇)分子连接。
在一些实施例中,聚(乙二醇)分子的分子量介于约0.1kDa与约100kDa之间。 在一些实施例中,聚(乙二醇)分子的分子量介于约0.1kDa与50kDa之间。
在一些实施例中,聚(乙二醇)分子为分支聚合物。在一些实施例中,聚(乙二 醇)分支聚合物的每一分支的分子量介于1kDa与100kDa之间或介于1kDa与50 kDa之间。
在一些实施例中,与胰岛素多肽连接的水溶性聚合物包含聚烷二醇部分。在 一些实施例中,并入胰岛素多肽中的非天然编码氨基酸残基包含羰基、氨氧基、 酰肼基、肼、氨基脲基、叠氮基或炔基。在一些实施例中,并入胰岛素多肽中的 非天然编码氨基酸残基包含羰基部分且水溶性聚合物包含氨氧基、酰肼、肼或氨 基脲部分。在一些实施例中,并入胰岛素多肽中的非天然编码氨基酸残基包含炔 部分且水溶性聚合物包含叠氮部分。在一些实施例中,并入胰岛素多肽中的非天 然编码氨基酸残基包含叠氮部分且水溶性聚合物包含炔部分。
本发明还提供包含含有非天然编码氨基酸的胰岛素多肽和医药学上可接受的 载剂的组合物。在一些实施例中,非天然编码氨基酸与水溶性聚合物连接。
本发明还提供包含编码胰岛素多肽且包含选择密码子的多核苷酸的细胞。在 一些实施例中,所述细胞包含正交RNA合成酶和/或正交tRNA以将非天然编码 氨基酸取代到胰岛素多肽中。
本发明还提供制备包含非天然编码氨基酸的胰岛素多肽的方法。在一些实施 例中,所述方法包含在允许胰岛素多肽表达的条件下培养包含编码胰岛素多肽的 多核苷酸、正交RNA合成酶和/或正交tRNA的细胞;和从所述细胞和/或培养基 中纯化胰岛素多肽。
本发明还提供增加胰岛素多肽的治疗半衰期、血清半衰期或循环时间的方法。 本发明还提供调节胰岛素多肽的免疫原性的方法。在一些实施例中,所述方法包 含用非天然编码氨基酸取代天然存在的胰岛素多肽中的任一个或一个以上氨基酸 和/或将所述胰岛素多肽与连接子、聚合物、水溶性聚合物或生物活性分子连接。
本发明还提供用有效量的本发明的胰岛素分子治疗需要所述治疗的患者的方 法。在一些实施例中,所述方法包含向所述患者投与治疗有效量的医药组合物, 所述组合物包含含有非天然编码氨基酸的胰岛素多肽和医药学上可接受的载剂。 在一些实施例中,非天然编码氨基酸与水溶性聚合物连接。在一些实施例中,胰 岛素多肽经糖基化。在一些实施例中,胰岛素多肽未经糖基化。
本发明还提供包含SEQIDNO:1和2所示的序列或任何其它胰岛素多肽序列 (这些序列的非限制性实例为SEQIDNO:3到12)的胰岛素多肽,除了至少一个 氨基酸经非天然编码氨基酸取代。在一些实施例中,非天然编码氨基酸与水溶性 聚合物连接。在一些实施例中,所述水溶性聚合物包含聚(乙二醇)部分。在一些 实施例中,非天然编码氨基酸包含羰基、氨氧基、酰肼基、肼基、氨基脲基、叠 氮基或炔基。
本发明还提供包含医药学上可接受的载剂和胰岛素多肽的医药组合物,所述 胰岛素多肽包含SEQIDNO:1到12所示的序列或任何其它胰岛素多肽序列,其 中至少一个氨基酸经非天然编码氨基酸取代。本发明还提供包含医药学上可接受 的载剂和胰岛素多肽的医药组合物,所述胰岛素多肽包含A链和B链(例如SEQ IDNO:1和2将产生胰岛素,SEQIDNO3和4将产生赖脯胰岛素等)SEQIDNO: 1到12所示的序列或任何其它胰岛素多肽序列,其中至少一个氨基酸经非天然编 码氨基酸取代。本发明还提供包含医药学上可接受的载剂和胰岛素多肽的医药组 合物,所述胰岛素多肽包含SEQIDNO:1和2所示的序列。本发明还提供包含医 药学上可接受的载剂和胰岛素多肽的医药组合物,所述胰岛素多肽包含SEQID NO:1到12所示的序列。在一些实施例中,非天然编码氨基酸包含糖部分。在一 些实施例中,水溶性聚合物通过糖部分与多肽连接。在一些实施例中,连接子、 聚合物或生物活性分子通过糖部分与胰岛素多肽连接。
本发明还提供一种胰岛素多肽,其包含在单个氨基酸处通过共价键与所述胰 岛素多肽连接的水溶性聚合物。在一些实施例中,所述水溶性聚合物包含聚(乙二 醇)部分。在一些实施例中,与水溶性聚合物共价连接的氨基酸为多肽中所存在的 非天然编码氨基酸。
本发明提供一种胰岛素多肽,其包含至少一个连接子、聚合物或生物活性分 子,其中所述连接子、聚合物或生物活性分子通过以核糖体形式并入多肽中的非 天然编码氨基酸的官能团与多肽连接。在一些实施例中,多肽经单聚乙二醇化。 本发明还提供一种胰岛素多肽,其包含与一个或一个以上非天然编码氨基酸连接 的连接子、聚合物或生物活性分子,其中所述非天然编码氨基酸以核糖体形式并 入多肽中的预选位点。
胰岛素前导序列或信号序列包括在本发明的范围内,其实例可视为胰岛素原。 所选的异源前导序列或信号序列应为经识别和处理,例如由宿主细胞分泌系统分 泌且可能通过宿主细胞被信号肽酶裂解的序列。一种用本发明的胰岛素或胰岛素 多肽或类似物治疗病状或病症的方法打算隐含用含有或不含有信号肽或前导肽的 胰岛素治疗。
本发明还提供诱导葡萄糖代谢增加的方法,所述方法包含向所述细胞投与有 效诱导葡萄糖代谢活性增加的量的胰岛素。
在另一实施例中,由于用于与非天然氨基酸结合的独特化学反应,包含一个 或一个以上非天然编码氨基酸的胰岛素多肽与另一分子(包括(但不限于)PEG) 的结合提供实质上纯化的胰岛素。可能在其它纯化技术在结合步骤之前或之后进 行的情况下使包含一个或一个以上非天然编码氨基酸的胰岛素与另一分子(诸如 PEG)结合,以提供实质上纯的胰岛素。
附图说明
图1展示胰岛素的晶体结构的两个模型以及胰岛素的氨基酸序列。
图2为胰岛素的晶体结构的模型。展示所选经非天然编码氨基酸取代的位点。
图3为一级胰岛素原的图式。
图4展示胰岛素、优泌乐(humalog)、诺和乐(novolog)、甘精胰岛素和地 特胰岛素的图式。
图5展示胰岛素原表达质粒pVK6-赖脯胰岛素以及赖脯胰岛素插入物的序 列。
图6展示对本发明的胰岛素多肽的十二烷基硫酸钠-聚丙烯酰胺凝胶电泳 (SDS-PAGE)凝胶分析,其包括在Q15A链(SEQIDNO:3)、Y14A链(SEQID NO:3)、R22B链(SEQIDNO:4)、F1B链(SEQIDNO:4)、G1A链(SEQID NO:3)、S9A链(SEQIDNO:3)和K28B链(SEQIDNO:4)处经取代的那些 多肽,每一取代各由非天然氨基酸(pAF)进行。
图7展示聚乙二醇化和未聚乙二醇化的胰岛素多肽的尺寸排阻色谱-高效液相 色谱(SEC-HPLC)。
图8展示用于克隆到毕赤酵母(Pichia)中的质粒的图。
图9展示本发明的两种胰岛素多肽A14pAF-PEG-A21N和A14pAF-PEG-A21G 的曲线下面积(AreaUndertheCurve)柱状图。
图10展示如实例36中进一步所论述,A21G胰岛素多肽的再折叠反应的结 果的凝胶。
图11展示实例36的QHP纯化和再折叠的胰岛素原的HPLC。
图12展示实例36中所述的聚乙二醇化反应的HPLC。
具体实施方式
定义
应了解,本发明并不限于本文中所述的特定方法、方案、细胞系、构筑体和 试剂,并且同样可改变。也应了解,本文中使用的术语只是为了描述特定实施例, 而并不打算限制本发明的范围,所述范围应仅由随附权利要求加以限制。
除非上下文另外明确指出,否则如本文和随附权利要求中所使用,单数形式 “一”和“所述”包括多个提及物。因此,举例来说,提及“胰岛素”或“胰岛素 多肽”和各种带连字符和不带连字符的形式是提及一种或一种以上所述蛋白质, 并且包括所属领域的技术人员已知的其等效物等。
除非另外定义,否则本文中使用的所有科技术语都具有与本发明所属领域的 技术人员通常所了解的含义相同的含义。虽然可将与本文中所述类似或等效的任 何方法、装置和材料用于本发明的实践或测试中,但现仅对优选方法、装置和材 料加以描述。
本文中所提及的所有公开案和专利都是以引用的方式并入本文中,以达到描 述和揭示例如所述公开案中所述的可能与当前所述的发明结合使用的构筑体和方 法的目的。本文中所讨论的公开案仅提供本申请案的申请日期之前的揭示内容。 本文决不应解释为承认发明者无权由于先前发明或任何其它原因而使所述揭示案 的日期提前。
术语“实质上经纯化”是指可实质上或基本上不含通常伴随天然存在环境(即 天然细胞,或者在重组产生胰岛素多肽的情况下为宿主细胞)中存在的蛋白质或 与天然存在环境中存在的蛋白质相互作用的组分的胰岛素多肽。可实质上不含细 胞物质的胰岛素多肽包括具有小于约30%、小于约25%、小于约20%、小于约15%、 小于约10%、小于约5%、小于约4%、小于约3%、小于约2%或小于约1%(以 干重计)的污染蛋白的蛋白制剂。当胰岛素多肽或其变异体是由宿主细胞重组产 生时,蛋白质可以细胞干重的约30%、约25%、约20%、约15%、约10%、约5%、 约4%、约3%、约2%或约1%或1%以下存在。当胰岛素多肽或其变异体是由宿 主细胞重组产生时,蛋白质可以细胞干重计约5g/L、约4g/L、约3g/L、约2g/L、 约1g/L、约750mg/L、约500mg/L、约250mg/L、约100mg/L、约50mg/L、约 10mg/L或约1mg/L或1mg/L以下存在于培养基中。因此,由本发明方法产生的 “实质上经纯化”的胰岛素多肽可具有如通过适当方法(例如SDS/PAGE分析、 反相高效液相色谱(RP-HPLC)、SEC和毛细管电泳)所测定至少约30%、至少 约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至 少约65%、至少约70%的纯度水平,特定来说至少约75%、80%、85%的纯度水 平,并且更特定来说至少约90%的纯度水平、至少约95%的纯度水平、至少约99% 或99%以上的纯度水平。
“重组宿主细胞”或“宿主细胞”是指不管何种方法用于插入(例如直接摄取、 转导、f配对(f-mating)或所属领域中已知用于产生重组宿主细胞的其它方法), 包括外源多核苷酸的细胞。外源多核苷酸可保持非整合载体(例如质粒)形式, 或者可整合到宿主基因组中。
如本文中所用,术语“培养基”包括可支撑或容纳任何宿主细胞的任何培养 基、溶液、固体、半固体或刚性支撑物,所述宿主细胞包括细菌宿主细胞、酵母 宿主细胞、昆虫宿主细胞、植物宿主细胞、真核宿主细胞、哺乳动物宿主细胞、 中国仓鼠卵巢(CHO)细胞、原核宿主细胞、大肠杆菌(E.coli)或假单胞菌 (Pseudomonas)宿主细胞和细胞内含物。因此,所述术语可涵盖已生长宿主细胞 的培养基,例如已分泌胰岛素多肽的培养基,包括在增殖步骤之前或之后的培养 基。诸如在胰岛素多肽已在细胞内产生并且宿主细胞已溶解或破裂以释放胰岛素 多肽的情况下,所述术语也可涵盖含有宿主细胞溶解产物的缓冲液或试剂。
如本文中关于蛋白质再折叠所用的“还原剂”是定义为使巯基保持还原状态 并还原分子内或分子间二硫键的任何化合物或物质。合适的还原剂包括(但不限 于)二硫苏糖醇(dithiothreitol;DTT)、2-巯基乙醇、二硫赤藓糖醇、半胱氨酸、 半胱胺(2-氨基乙硫醇)以及还原型谷胱甘肽。所属领域的技术人员显而易见, 多种还原剂适用于本发明的方法和组合物中。
如本文中关于蛋白质再折叠所用的“氧化剂”是定义为能够从所氧化的化合 物移除电子的任何化合物或物质。合适的氧化剂包括(但不限于)氧化型谷胱甘 肽、胱氨酸、胱胺、氧化型二硫苏糖醇、氧化型赤藓糖醇和氧气。所属领域的技 术人员显而易见,多种氧化剂适用于本发明的方法中。
如本文中所用,“变性剂”是定义为会造成蛋白质可逆展开的任何化合物或物 质。变性剂的强度将由特定变性剂的性质和浓度决定。合适的变性剂可为离液剂 (chaotrope)、清洁剂、有机溶剂、水可混溶溶剂、磷脂或两种或两种以上所述试 剂的组合。合适的离液剂包括(但不限于)尿素、胍和硫氰酸钠。适用的清洁剂 可包括(但不限于)强清洁剂,例如十二烷基硫酸钠或聚氧乙烯醚(例如吐温 (Tween)或曲拉通(Triton)清洁剂)、月桂酰基肌氨酸钠(Sarkosyl);温和非离 子型清洁剂(例如毛地黄皂苷(digitonin));温和阳离子型清洁剂,例如N->2,3-(二 油烯基氧基)-丙基-N,N,N-三甲基铵;温和离子型清洁剂(例如胆酸钠或脱氧胆酸 钠);或两性离子型清洁剂,包括(但不限于)硫代甜菜碱(Zwittergent)、3-(3- 胆酰胺基丙基)二甲基氨基-1-丙烷硫酸盐(CHAPS)以及3-(3-胆酰胺基丙基)二甲 基铵基-2-羟基-1-丙烷磺酸盐(CHAPSO)。可使用例如乙腈、低碳烷醇(尤其C2-C4 烷醇,例如乙醇或异丙醇)或低碳烷二醇(尤其C2-C4烷二醇,例如乙二醇)等 有机、水可混溶溶剂作为变性剂。适用于本发明中的磷脂可为天然存在磷脂,例 如磷脂酰乙醇胺、磷脂酰胆碱、磷脂酰丝氨酸和磷脂酰肌醇;或合成磷脂衍生物 或变异体,例如二己酰基磷脂酰胆碱或二庚酰基磷脂酰胆碱。
如本文中所用,“再折叠”描述将含有二硫键的多肽从不当折叠或展开状态转 化为二硫键的天然或适当折叠的构象的任何过程、反应或方法。
如本文中所用,“共折叠”特定是指使用至少两种彼此相互作用的多肽并使得 展开或不当折叠的多肽转化为天然、适当折叠多肽的再折叠过程、反应或方法。
如本文中所用,术语“胰岛素原”是下式的适当交联蛋白质(crosslineprotein): B-C-A
其中:
A为胰岛素的A链或其官能衍生物;
B为胰岛素的B链或其官能衍生物,其具有ε-氨基;且
C为胰岛素原的连接肽。优选地,胰岛素原为人类胰岛素的A链、人类胰岛 素的B链,且C为天然连接肽。当胰岛素原是天然序列时,胰岛素原具有三个游 离氨基:苯丙氨酸(1)(α-氨基)、赖氨酸(29)(ε-氨基)和赖氨酸(64)(ε -氨基)。
如本文中所用,术语“胰岛素类似物”是展现胰岛素活性的下式的适当交联 蛋白质:
A-B
其中:
A为胰岛素的A链或胰岛素A链的官能衍生物;且
B为胰岛素的B链或胰岛素B链的官能衍生物,其具有ε-氨基,且A或B 中的至少一个含有来自天然序列的氨基酸修饰。
在本说明书中,无论术语胰岛素以复数或普遍意义使用,都打算涵盖天然存 在的胰岛素与胰岛素类似物和其衍生物。如本文中所用,“胰岛素多肽”意思是具 有类似于人类胰岛素的分子结构的化合物,包括Cys.sup.A7与Cys.sup.B7之间和 Cys.sup.A20与Cys.sup.B19之间的二硫桥键以及Cys.sup.A6与Cys.sup.A11之间 的内部二硫桥键,且其具有胰岛素活性。
如本文中所用,术语“胰岛素”是指人类胰岛素,其氨基酸序列和立体结构 是众所周知的。人类胰岛素由通过二硫键交联的21个氨基酸的A链和30个氨基 酸的B链构成。适当交联胰岛素含有三个二硫桥键:一个位于A链的位置7与B 链的位置7之间,第二个位于A链的位置20与B链的位置19之间,且第三个位 于A链的位置6与11之间[Nicol,D.S.H.W.和Smith,L.F.,Nature,187,483-485 (1960)]。
胰岛素肽包括(但不限于)人类胰岛素;猪胰岛素;人类IGF-I;胰岛素样生 长因子II(69-84);人类胰岛素原样生长因子II(68-102);人类胰岛素原样生长 因子II(105-128);人类[AspB28]-胰岛素;人类[LysB28]-胰岛素;人类[LeuB28]- 胰岛素;人类[ValB28]-胰岛素;人类[AlaB28]-胰岛素;人类[AspB28,ProB29]-胰 岛素;人类[LysB28,ProB29]-胰岛素;人类[LeuB28,ProB29]-胰岛素;人类[ValB28, ProB29]-胰岛素;人类[AlaB28,ProB29]-胰岛素;人类[GlyA21]-胰岛素;人类 [GlyA21GlnB3]-胰岛素;人类[AlaA21]-胰岛素;人类[AlaA21Gln.sup.B3]胰岛素; 人类[GlnB3]-胰岛素;人类[GlnB30]-胰岛素;人类[GlyA21GluB30]-胰岛素;人类 [GlyA21GlnB3GluB30]-胰岛素;人类[GlnB3GluB30]-胰岛素;人类B22-B30胰 岛素;人类B23-B30胰岛素;人类B25-B30胰岛素;人类B26-B30胰岛素;人类 B27-B30胰岛素;人类B29-B30胰岛素;人类胰岛素的A链和人类胰岛素的B链。
术语“胰岛素类似物”意思是如下蛋白质:其A链和B链的氨基酸序列分别 实质上与人类胰岛素的A链和/或B链的氨基酸序列相同,但与人类胰岛素的A 链和B链不同的是具有不破坏胰岛素类似物的胰岛素活性的一个或一个以上氨基 酸缺失、一个或一个以上氨基酸置换和/或一个或一个以上氨基酸添加。等电点“高 于”胰岛素的等电点的胰岛素类似物是一种类型的胰岛素类似物。另一种类型胰 岛素类似物是“单体胰岛素类似物”。
“单体胰岛素类似物”是人类胰岛素的速效类似物,其包括例如位置B28的 Pro经Asp、Lys、Leu、Val或Ala取代且位置B29的Lys为Lys或经Pro取代的 人类胰岛素。另一种也称为des(B27)人类胰岛素的单体胰岛素类似物是B链的 位置27的Thr缺失的人类胰岛素。单体胰岛素类似物揭示于以下文献中:Chance, R.E.等人,美国专利第5,514,646号,1996年5月7日颁布;Brems,D.N.等人 ProteinEngineering,5,527-533(1992);Brange,J.J.V.等人,EPO公开案第214,826 号(1987年3月18日公开);和Brange,J.J.V.等人,CurrentOpinioninStructural Biology,1,934-940(1991)。用于本发明调配物中的单体胰岛素类似物在与人类胰 岛素中相同的位置适当交联。
胰岛素肽包括(但不限于)人类胰岛素;猪胰岛素;人类IGF-I;胰岛素样生 长因子II(69-84);人类胰岛素原样生长因子II(68-102);人类胰岛素原样生长 因子II(105-128);人类[AspB28]-胰岛素;人类[LysB28]-胰岛素;人类[LeuB28]- 胰岛素;人类[ValB28]-胰岛素;人类[AlaB28]-胰岛素;人类[AspB28,ProB29]-胰 岛素;人类[LysB28,ProB29]-胰岛素;人类[LeuB28,ProB29]-胰岛素;人类[ValB28, ProB29]-胰岛素;人类[AlaB28,ProB29]-胰岛素;人类[GlyA21]-胰岛素;人类 [GlyA21GlnB3]-胰岛素;人类[AlaA21]-胰岛素;人类[AlaA21Gln.sup.B3]胰岛素; 人类[GlnB3]-胰岛素;人类[GlnB30]-胰岛素;人类[GlyA21GluB30]-胰岛素;人类 [GlyA21GlnB3GluB30]-胰岛素;人类[GlnB3GluB30]-胰岛素;人类B22-B30胰 岛素;人类B23-B30胰岛素;人类B25-B30胰岛素;人类B26-B30胰岛素;人类 B27-B30胰岛素;人类B29-B30胰岛素;人类胰岛素的A链和人类胰岛素的B链。
另一方面,本发明提供编码变异蛋白的重组核酸、含有变异核酸的表达载体、 包含变异核酸和/或表达载体的宿主细胞和产生变异蛋白的方法。另一方面,本发 明通过向患者投与治疗有效量的通常与医药载剂一起的变异蛋白治疗胰岛素反应 性病症。另一方面,本发明提供通过改变MHCII类表位调节胰岛素多肽的免疫 原性(尤其降低免疫原性)的方法。
术语“胰岛素多肽”还包括天然存在胰岛素的医药学上可接受的盐和前药, 以及盐的前药、多形体、水合物、溶剂化物、生物活性片段、生物活性变异体和 立体异构体,以及天然存在胰岛素和其多肽融合体的激动剂、模拟物和拮抗剂变 异体。术语“胰岛素多肽”涵盖氨基端、羧基端或两个末端处包含其它氨基酸的 融合体。示范性融合体包括(但不限于):例如,由缺乏前导肽或信号肽的胰岛素 的成熟形式或其部分重组表达所产生的使蛋氨酸与胰岛素的N端连接的蛋氨酰基 胰岛素(蛋氨酸与胰岛素的N端连接,由重组表达产生);出于纯化目的而形成 的融合体(包括(但不限于)与聚组氨酸或亲和性表位融合);与血清白蛋白结合 肽形成的融合体;和与血清蛋白(例如血清白蛋白)形成的融合体。美国专利第 5,750,373号(其以引用的方式并入本文中)描述一种选择新颖蛋白质(例如生长 激素)和对各别受体分子的结合性质已改变的抗体片段变异体的方法。所述方法 包含将编码所关注蛋白质的基因与丝状噬菌体M13的基因III外壳蛋白的羧基端 域融合。嵌合分子包含胰岛素和一个或一个以上其它分子。嵌合分子可含有胰岛 素与其它分子中一种或两种分子的特定区或片段。可通过标准生物化学方法由蛋 白质制备任何所述片段,或通过表达编码所述片段的多核苷酸来制备所述片段。 胰岛素或其片段可以包含人类血清白蛋白(HSA)、Fc或其部分的融合蛋白形式 产生。所述融合构筑体适于增强胰岛素或其片段在真核宿主细胞中的表达。如美 国专利第5,766,883号和公开案WO97/24445(其以引用的方式并入本文中)中所 揭示,示范性HSA部分包括N端多肽(氨基酸1-369、1-419,以及由氨基酸1 开始的中间长度)。其它嵌合多肽可包括具有与HSA的C端和N端各自连接的胰 岛素或其片段的HSA蛋白。所述HSA构筑体揭示于以引用的方式并入本文中的 美国专利第5,876,969号中。其它融合体可通过融合胰岛素与a)免疫球蛋白的Fc 部分、b)免疫球蛋白的Fc部分的类似物和c)免疫球蛋白的Fc部分的片段来产 生。
多个参考文献揭示通过聚合物结合或糖基化对多肽进行修饰。术语“胰岛素 多肽”包括与例如PEG等聚合物结合的多肽,并且可包含一种或一种以上由半胱 氨酸、赖氨酸或其它残基进行的其它衍生。另外,胰岛素多肽可包含连接子或聚 合物,其中与连接子或聚合物结合的氨基酸可为本发明的非天然氨基酸,或可利 用所属领域中已知的技术(例如与赖氨酸或半胱氨酸偶合)使所述氨基酸与天然 编码氨基酸结合。
术语“胰岛素多肽”也包括糖基化胰岛素,例如(但不限于)在任何氨基酸 位置处糖基化的多肽、多肽的N连接或O连接糖基化形式。含有单一核苷酸变化 的变异体也被视为胰岛素多肽的生物活性变异体。另外,也包括剪接变异体。术 语“胰岛素多肽”也包括由化学方式连接或以融合蛋白形式表达的任何一种或一 种以上胰岛素多肽或任何其它多肽、蛋白质、碳水化合物、聚合物、小分子、连 接子、配体或任何类型的其它生物活性分子的胰岛素多肽异源二聚物、同源二聚 物、异源多聚物或同源多聚物,以及含有例如特定缺失或其它修饰但仍保持生物 活性的多肽类似物。
术语“胰岛素多肽”或“胰岛素”涵盖包含一个或一个以上氨基酸取代、添 加或缺失的胰岛素多肽。本发明的胰岛素多肽可包含一个或一个以上天然氨基酸 修饰以及一个或一个以上非天然氨基酸修饰。已描述在天然存在胰岛素多肽中的 多个氨基酸位置中的示范性取代,其包括(但不限于)调节医药稳定性的取代、 调节胰岛素多肽的一种或一种以上生物活性(例如(但不限于)增加激动剂活性、 增加多肽溶解性、降低蛋白酶敏感性、将多肽转化成拮抗剂等)的取代,并且术 语“胰岛素多肽”涵盖所述取代。在一些实施例中,胰岛素拮抗剂包含与胰岛素 分子的受体结合区中存在的水溶性聚合物连接的非天然编码氨基酸。
在一些实施例中,胰岛素多肽进一步包含调节胰岛素多肽的生物活性的添加、 取代或缺失。在一些实施例中,胰岛素多肽进一步包含调节胰岛素多肽的抗病毒 活性的添加、取代或缺失。在一些实施例中,胰岛素多肽进一步包含增强胰岛素 多肽的抗病毒活性的添加、取代或缺失。举例来说,添加、取代或缺失可调节胰 岛素的一种或一种以上性质或活性。举例来说,添加、取代或缺失可调节对胰岛 素受体的亲和性,调节循环半衰期,调节治疗半衰期,调节多肽的稳定性,调节 由蛋白酶进行的裂解,调节剂量,调节释放或生物可用性,促进纯化,或改良或 改变特定投药途径。类似地,胰岛素多肽可包含蛋白酶裂解序列、反应性基团、 抗体结合域(包括(但不限于)FLAG或poly-His)或其它基于亲和性的序列(包 括(但不限于)FLAG、poly-His、GST等)或改良多肽的检测(包括(但不限于) GFP)、纯化或其它特性的连接分子(包括(但不限于)生物素)。
术语“胰岛素多肽”也涵盖所连接的同源二聚物、异源二聚物、同源多聚物 和异源多聚物,其包括(但不限于)通过非天然编码氨基酸侧链与相同或不同的 非天然编码氨基酸侧链、与天然编码氨基酸侧链直接连接或通过连接子间接连接 者。示范性连接子包括(但不限于)小的有机化合物、各种长度的水溶性聚合物 (例如聚(乙二醇)或葡聚糖)或各种长度的多肽。
“非天然编码氨基酸”是指并非20种常见氨基酸或吡咯赖氨酸或硒代半胱氨 酸中的一种的氨基酸。可与术语“非天然编码氨基酸”同义使用的其它术语为“非 天然氨基酸”、“非天然存在氨基酸”。术语“非天然编码氨基酸”还包括(但不限 于)通过修饰(例如翻译后修饰)天然编码氨基酸(包括(但不限于)20种常见 氨基酸或吡咯赖氨酸和硒代半胱氨酸)而存在,但本身无法通过翻译复合物天然 并入正在生长的多肽链中的氨基酸。这些非天然存在氨基酸的实例包括(但不限 于)N-乙酰基葡糖胺基-L-丝氨酸、N-乙酰基葡糖胺基-L-苏氨酸以及O-磷酸酪氨 酸。
“氨基端修饰基”是指可与多肽的氨基端连接的任何分子。类似地,“羧基端 修饰基”是指可与多肽的羧基端连接的任何分子。末端修饰基包括(但不限于) 各种水溶性聚合物、肽或蛋白质(例如血清白蛋白),或增加肽的血清半衰期的其 它部分。
术语“官能团”、“活性部分”、“活化基团”、“离去基”、“反应性位点”、“化 学反应性基团”和“化学反应性部分”在所属领域和本文中是用于指代分子中独 特的可限定部分或单元。这些术语在化学领域中在一定程度上同义,并且在本文 中是用于指示执行某种功能或活性并可与其它分子反应的分子部分。
术语“键”或“连接子”在本文中用于指通常由于化学反应而形成并且通常 为共价键的基团或键。水解稳定的键意思是所述键在水中实质上稳定并且在适用 的pH值下(包括(但不限于)在生理条件下)长时间(或许甚至无限期)不与 水反应。水解不稳定或可降解的键意思是所述键可在水或水溶液(包括例如血液) 中降解。酶促不稳定或可降解的键意思是所述键可由一种或一种以上酶降解。所 属领域中应了解,PEG和相关聚合物在聚合物主链中或在聚合物主链与聚合物分 子的一个或一个以上末端官能团之间的连接基团中可包括可降解键。举例来说, 由PEG羧酸或活化PEG羧酸与生物活性剂上的醇基反应所形成的酯键通常在生 理条件下水解以释放所述生物活性剂。其它水解可降解的键包括(但不限于)碳 酸酯键;由胺与醛反应所产生的亚胺键;由醇与磷酸酯基反应所形成的磷酸酯键; 作为酰肼与醛的反应产物的腙键;作为醛与醇的反应产物的缩醛键;作为甲酸酯 与醇的反应产物的原酸酯键;由包括(但不限于)例如PEG等聚合物的末端的胺 基与肽的羧基形成的肽键;以及由包括(但不限于)聚合物末端的亚磷酰胺 (phosphoramidite)基与寡核苷酸的5′羟基形成的寡核苷酸键。
术语“生物活性分子”、“生物活性部分”或“生物活性剂”在用于本文中时 意思是可影响与生物体(包括(但不限于)病毒、细菌、噬菌体、转位子、朊病 毒、昆虫、真菌、植物、动物以及人类)有关的生物系统、路径、分子或相互作 用的任何物理或生物化学性质的任何物质。具体来说,如本文中所用,生物活性 分子包括(但不限于)打算用于诊断、治愈、缓解、治疗或预防人类或其它动物 的疾病或用于以其它方式增强人类或动物的身体或精神健康状况的任何物质。生 物活性分子的实例包括(但不限于)肽、蛋白质、酶、小分子药物、疫苗、免疫 原、硬药(harddrug)、软药(softdrug)、碳水化合物、无机原子或分子、染料、 脂质、核苷、放射性核素、寡核苷酸、类毒素、毒素、原核和真核细胞、病毒、 多糖、从病毒、细菌、昆虫、动物或任何其它细胞或细胞类型、脂质体、微粒和 微胞获得或得到的核酸和其部分。可将胰岛素多肽加入微胞调配物中;参见美国 专利第5,833,948号,其以全文引用的方式并入本文中。适用于本发明的生物活性 剂的种类包括(但不限于)药物、前药、放射性核素、显影剂、聚合物、抗生素、 杀真菌剂、抗病毒剂、消炎药、抗肿瘤药、心血管药、抗焦虑药、激素、生长因 子、类固醇药、微生物产生的毒素等等。
“双官能聚合物”是指包含两个能够与其它部分(包括(但不限于)氨基酸侧 基)特异性反应以形成共价或非共价键的不连续官能团的聚合物。具有一个可与 特定生物活性组分上的基团反应的官能团和另一个可与第二生物组分上的基团反 应的基团的双官能连接子可用于形成包括第一生物活性组分、双官能连接子以及 第二生物活性组分的结合物。已知使各种化合物与肽连接的众多程序和连接分子。 例如参见欧洲专利申请案第188,256号、美国专利第4,671,958号、第4,659,839 号、第4,414,148号、第4,699,784号、第4,680,338号和第4,569,789号,其是以 引用的方式并入本文中。“多官能聚合物”是指包含两个或两个以上能够与其它部 分(包括(但不限于)氨基酸侧基)特异性反应以形成共价或非共价键的不连续 官能团的聚合物。双官能聚合物或多官能聚合物可具有任何所需长度或分子量, 并且可经选择以在与胰岛素连接的一个或一个以上分子与其受体或胰岛素之间提 供特定所需间隔或构象。
当由从左向右书写的常规化学式表示取代基时,同样涵盖由从右向左书写的 结构得到的化学上相同的取代基,例如结构CH2O等同于结构-OCH2。
术语“取代基”包括(但不限于)“无干扰取代基”。“无干扰取代基”为产生 稳定化合物的基团。合适的无干扰取代基或基团包括(但不限于)卤基、C1-C10 烷基、C2-C10烯基、C2-C10炔基、C1-C10烷氧基、C1-C12芳烷基、C1-C12烷 芳基、C3-C12环烷基、C3-C12环烯基、苯基、经取代苯基、甲苯酰基、二甲苯 基、联苯基、C2-C12烷氧基烷基、C2-C12烷氧基芳基、C7-C12芳氧基烷基、C7-C12 氧基芳基、C1-C6烷基亚磺酰基、C1-C10烷基磺酰基、--(CH2)m--O--(C1-C10烷 基)(其中m为1到8)、芳基、经取代芳基、经取代烷氧基、氟烷基、杂环基、 经取代杂环基、硝基烷基、--NO2、--CN、--NRC(O)--(C1-C10烷基)、--C(O)--(C1-C10 烷基)、C2-C10烷基硫烷基、--C(O)O--(C1-C10烷基)、--OH、--SO2、=S、--COOH、 --NR2、羰基、--C(O)--(C1-C10烷基)-CF3、--C(O)--CF3、--C(O)NR2、--(C1-C10 芳基)-S--(C6-C10芳基)、--C(O)--(C1-C10芳基)、 --(CH2)m--O--(--(CH2)m--O--(C1-C10烷基)(其中各m为1到8)、--C(O)NR2、 --C(S)NR2、--SO2NR2、--NRC(O)NR2、--NRC(S)NR2、其盐等。如本文中所用, 各R为H、烷基或经取代烷基、芳基或经取代芳基、芳烷基或烷芳基。
术语“卤素”包括氟、氯、碘和溴。
除非另外说明,否则术语“烷基”本身或作为另一取代基的一部分时意思是 直链或支链或环状烃基或其组合,其可为完全饱和、单不饱和或多不饱和的并且 可包括具有指定碳原子数目(即C1-C10意思是1到10个碳)的二价基团和多价 基团。饱和烃基的实例包括(但不限于)以下基团,例如甲基、乙基、正丙基、 异丙基、正丁基、叔丁基、异丁基、仲丁基、环己基、(环己基)甲基、环丙基甲 基;例如正戊基、正己基、正庚基、正辛基等的同系物和异构体。不饱和烷基为 具有一个或一个以上双键或三键的烷基。不饱和烷基的实例包括(但不限于)乙 烯基、2-丙烯基、巴豆基、2-异戊烯基、2-(丁二烯基)、2,4-戊二烯基、3-(1,4-戊二 烯基)、乙炔基、1-丙炔基和3-丙炔基、3-丁炔基以及高级同系物和异构体。除非 另外说明,否则术语“烷基”还打算包括下文更详细定义的烷基的衍生物,例如 “杂烷基”。只限于烃基的烷基被称作“同系烷基(homoalkyl)”。
术语“亚烷基”本身或作为另一取代基的一部分时意思是由烷烃衍生的二价 基团,例如(但不限于)结构-CH2CH2-和-CH2CH2CH2CH2-,并且进一步包括下 文描述为“亚杂烷基”的基团。通常,烷基(或亚烷基)将具有1到24个碳原子, 其中具有10个或10个以下碳原子的基团为本文中所述的方法和组合物的特定实 施例。“低碳烷基”或“低碳亚烷基”为通常具有8个或8个以下碳原子的较短链 烷基或亚烷基。
术语“烷氧基”、“烷基氨基”和“烷硫基”(或硫烷氧基)是以其常规意义使 用,并且是指分别通过氧原子、氨基或硫原子与分子的其余部分连接的烷基。
除非另外说明,否则术语“杂烷基”本身或与另一术语组合时意思是由指定 数目的碳原子以及至少一个选自由O、N、Si和S组成的群组的杂原子组成的稳 定直链或支链或环状烃基或其组合,并且其中氮和硫原子可任选地经氧化且氮杂 原子可任选地经季铵化。杂原子O、N和S以及Si可位于杂烷基的任何内部位置 或位于烷基与分子的其余部分连接的位置。实例包括(但不限于) -CH2-CH2-O-CH3、-CH2-CH2-NH-CH3、-CH2-CH2-N(CH3)-CH3、 -CH2-S-CH2-CH3、-CH2-CH2、-S(O)-CH3、-CH2-CH2-S(O)2-CH3、 -CH=CH-O-CH3、-Si(CH3)3、-CH2-CH=N-OCH3和-CH=CH-N(CH3)-CH3。至多 两个杂原子可相邻,例如-CH2-NH-OCH3和-CH2-O-Si(CH3)3。类似地,术语“亚 杂烷基”本身或作为另一取代基的一部分时意思是由杂烷基衍生的二价基团,例 如(但不限于)-CH2-CH2-S-CH2-CH2-和-CH2-S-CH2-CH2-NH-CH2-。对于亚杂 烷基来说,相同或不同的杂原子也可占据链的一端或两端(包括(但不限于)亚 烷基氧基、亚烷基二氧基、亚烷基氨基、亚烷基二氨基、氨氧基亚烷基等)。此外, 对于亚烷基和亚杂烷基连接基团来说,连接基团的化学式所书写的方向并不表示 连接基团的定向。举例来说,式-C(O)2R′-表示-C(O)2R′-与-R′C(O)2-。
除非另外说明,否则术语“环烷基”和“杂环烷基”本身或与其它术语组合 时分别表示“烷基”和“杂烷基”的环状形式。因此,环烷基或杂环烷基包括饱 和、部分不饱和和完全不饱和的环键。另外,对于杂环烷基来说,杂原子可占据 杂环与分子的其余部分连接的位置。环烷基的实例包括(但不限于)环戊基、环 己基、1-环己烯基、3-环己烯基、环庚基等。杂环烷基的实例包括(但不限于) 1-(1,2,5,6-四氢吡啶基)、1-哌啶基、2-哌啶基、3-哌啶基、4-吗啉基、3-吗啉基、 四氢呋喃-2-基、四氢呋喃-3-基、四氢噻吩-2-基、四氢噻吩-3-基、1-哌嗪基、2- 哌嗪基等。另外,所述术语涵盖双环和三环结构。类似地,术语“亚杂环烷基” 本身或作为另一取代基的一部分时意思是由杂环烷基衍生的二价基团,并且术语 “亚环烷基”本身或作为另一取代基的一部分时意思是由环烷基衍生的二价基团。
如本文中所用,术语“水溶性聚合物”是指可溶于水性溶剂中的任何聚合物。 水溶性聚合物与胰岛素多肽的连接可产生以下改变,其包括(但不限于)相对于 未经修饰形式增加或经调节的血清半衰期或者增加或经调节的治疗半衰期、经调 节的免疫原性、经调节的物理缔合特性(例如聚集和多聚物形成)、改变的受体结 合、改变的与一种或一种以上结合搭配物的结合,以及改变的受体二聚或多聚。 水溶性聚合物可能具有或可能不具有其本身的生物活性,并且可用作连接胰岛素 与其它物质(包括(但不限于)一种或一种以上胰岛素多肽或一种或一种以上生 物活性分子)的连接子。合适的聚合物包括(但不限于)聚乙二醇、聚乙二醇丙 醛、其单C1-C10烷氧基或芳氧基衍生物(描述于美国专利第5,252,714号中,所 述专利是以引用的方式并入本文中)、单甲氧基-聚乙二醇、聚乙烯吡咯烷酮、聚 乙烯醇、聚氨基酸、二乙烯醚马来酸酐、N-(2-羟基丙基)-甲基丙烯酰胺、葡聚糖、 葡聚糖衍生物(包括硫酸葡聚糖)、聚丙二醇、聚氧化丙烯/氧化乙烯共聚物、聚 氧乙烯化多元醇、肝素、肝素片段、多糖、寡糖、聚糖、纤维素和纤维素衍生物 (包括(但不限于)甲基纤维素和羧甲基纤维素)、淀粉和淀粉衍生物、多肽、聚 烷二醇和其衍生物、聚烷二醇和其衍生物的共聚物、聚乙烯基乙醚以及α-β-聚 [(2-羟乙基)-DL-天冬酰胺等,或其混合物。所述水溶性聚合物的实例包括(但不 限于)聚乙二醇和血清白蛋白。
如本文中所用,术语“聚烷二醇”或“聚(烷二醇)”是指聚乙二醇(聚(乙二 醇))、聚丙二醇、聚丁二醇和其衍生物。术语“聚烷二醇”涵盖线性和分支聚合 物且平均分子量介于0.1kDa与100kDa之间。其它示范性实施例列于例如商业供 应商目录中,例如ShearwaterCorporation的目录“PolyethyleneGlycoland DerivativesforBiomedicalApplications”(2001)。
除非另外说明,否则术语“芳基”意思是可为单环或稠合在一起或共价连接 的多环(包括(但不限于)1到3个环)的多不饱和芳香族烃取代基。术语“杂 芳基”是指含有1到4个选自N、O和S的杂原子的芳基(或环),其中氮和硫原 子任选地经氧化,并且氮原子任选地经季铵化。杂芳基可通过杂原子与分子的其 余部分连接。芳基和杂芳基的非限制性实例包括苯基、1-萘基、2-萘基、4-联苯基、 1-吡咯基、2-吡咯基、3-吡咯基、3-吡唑基、2-咪唑基、4-咪唑基、吡嗪基、2-噁 唑基、4-噁唑基、2-苯基-4-噁唑基、5-噁唑基、3-异噁唑基、4-异噁唑基、5-异噁 唑基、2-噻唑基、4-噻唑基、5-噻唑基、2-呋喃基、3-呋喃基、2-噻吩基、3-噻吩 基、2-吡啶基、3-吡啶基、4-吡啶基、2-嘧啶基、4-嘧啶基、5-苯并噻唑基、嘌呤 基、2-苯并咪唑基、5-吲哚基、1-异喹啉基、5-异喹啉基、2-喹喔啉基、5-喹喔啉 基、3-喹啉基和6-喹啉基。上述芳基和杂芳基环系统中的每一个的取代基都选自 下文所述的可接受取代基的群组。
为了简便起见,当与其它术语组合使用时(包括(但不限于)芳氧基、芳基 硫氧基、芳基烷基),术语“芳基”包括如上文所定义的芳基与杂芳基环。因此, 术语“芳基烷基”打算包括芳基与烷基连接的基团(包括(但不限于)苄基、苯 乙基、吡啶基甲基等),所述烷基包括碳原子(包括(但不限于)亚甲基)已经例 如氧原子置换的烷基(包括(但不限于)苯氧基甲基、2-吡啶基氧基甲基、3-(1- 萘基氧基)丙基等)。
以上术语(包括(但不限于)“烷基”、“杂烷基”、“芳基”以及“杂芳基”) 各自打算包括指定基团的经取代与未经取代形式。各类型基团的示范性取代基提 供如下。
烷基和杂烷基(包括通常被称作亚烷基、烯基、亚杂烷基、杂烯基、炔基、 环烷基、杂环烷基、环烯基以及杂环烯基的基团)的取代基可为选自(但不限于) 以下的多种基团中的一种或一种以上基团:-OR′、=O、=NR′、=N-OR′、-NR′R″、 -SR′、-卤素、-SiR′R″R″′、OC(O)R′、-C(O)R′、-CO2R′、-CONR′R″、-OC(O)NR′R″、 -NR″C(O)R′、NR′-C(O)NR″R″、-NR″C(O)2R′、-NR-C(NR′R″R″′)=NR″″、NR C(NR′R″)=NR″′、-S(O)R′、-S(O)2R′、-S(O)2NR′R″、NRSO2R′、-CN以及-NO2, 其数目在0到(2m′+1)的范围内,其中m′为此类基团中碳原子的总数。R′、R″、R″′ 和R″″各独立地指代氢、经取代或未经取代杂烷基、经取代或未经取代芳基(其 包括(但不限于)经1-3个卤素取代的芳基)、经取代或未经取代烷基、烷氧基或 硫烷氧基或芳基烷基。举例来说,当本发明的化合物包括一个以上R基团时,各 R基团是独立地经选择,而当存在R′、R″、R″′和R″″基团中的一个以上时,这些 基团同样是各独立地经选择。当R′和R″与同一氮原子连接时,其可与氮原子组合 形成5元、6元或7元环。举例来说,-NR′R″打算包括(但不限于)1-吡咯烷基和 4-吗啉基。根据对取代基的上述论述,所属领域的技术人员应了解术语“烷基” 打算包括包含与除氢基之外的基团结合的碳原子的基团,例如卤烷基(包括(但 不限于)-CF3和-CH2CF3)和酰基(包括(但不限于)-C(O)CH3、-C(O)CF3、 -C(O)CH2OCH3等)。
与对于烷基所述的取代基类似,芳基和杂芳基的取代基存在改变且选自(但 不限于):卤素、OR′、=O、=NR′、=N-OR′、-NR′R″、-SR′、-卤素、-SiR′R″R″′、 OC(O)R′、-C(O)R′、-CO2R′、-CONR′R″、-OC(O)NR′R″、-NR″C(O)R′、NR′ C(O)NR″R″′、-NR″C(O)2R′、NR-C(NR′R″R″′)=NR″′、NRC(NR′R″)=NR″′、-S(O)R′、 -S(O)2R′、-S(O)2NR′R″、NRSO2R′、-CN和-NO2、-R′、-N3、-CH(Ph)2、氟(C1-C4) 烷氧基和氟(C1-C4)烷基,其数目在0到芳环系统上开放价态的总数的范围内;并 且其中R′、R″、R″′和R″″独立地选自氢、烷基、杂烷基、芳基和杂芳基。举例来 说,当本发明的化合物包括一个以上R基团时,各R基团是独立地经选择,而当 存在R′、R″、R″′和R″″基团中的一个以上时,这些基团同样是各独立地经选择。
如本文中所用,术语“经调节的血清半衰期”意思是经修饰胰岛素的循环半 衰期相对于其未经修饰形式的正变化或负变化。通过在投与胰岛素后的各个时间 点取血样并测定每一样品中所述分子的浓度来测量血清半衰期。血清浓度与时间 的相关性允许计算血清半衰期。血清半衰期的增加理想地为至少约两倍,但例如 当较小增加能够促成令人满意的给药方案或避免毒性作用时,较小增加也可适用。 在一些实施例中,所述增加为至少约3倍、至少约5倍或至少约10倍。
如本文中所用,术语“经调节的治疗半衰期”意思是治疗有效量的胰岛素的 半衰期相对于其未经修饰形式的正变化或负变化。通过在投与后的各个时间点测 量分子的药物动力学和/或药效性质来测量治疗半衰期。增加的治疗半衰期理想地 能够促成特定有益的给药方案、特定有益的总剂量或避免不需要的作用。在一些 实施例中,增加的治疗半衰期是由效力增加、经修饰分子与其标靶的结合增加或 降低、酶(例如蛋白酶)对分子的分解增加或降低或未经修饰分子的另一参数或 作用机制增加或降低或者分子的受体介导清除增加或降低引起。
当应用于核酸或蛋白质时,术语“分离”表示所述核酸或蛋白质不含其在天 然状态下缔合的细胞组分中的至少一些组分,或所述核酸或蛋白质已浓缩到高于 其活体内或活体外产生浓度的程度。其可为均质状态。分离的物质可为干燥或半 干燥状态,或为溶液(包括(但不限于)水溶液)形式。其可为包含其它医药学 上可接受的载剂和/或赋形剂的医药组合物的组分。通常使用例如聚丙烯酰胺凝胶 电泳或高效液相色谱等分析化学技术来测定纯度和均质性。作为制剂中存在的主 要物质的蛋白质实质上已经纯化。具体来说,分离的基因是从侧接所述基因并编 码除所关注基因之外的蛋白质的开放阅读框分离。术语“经纯化”表示核酸或蛋 白质在电泳凝胶中产生实质上一个条带。具体来说,其意思可能是核酸或蛋白质 为至少85%纯、至少90%纯、至少95%纯、至少99%纯或更纯。
术语“核酸”是指单链或双链形式的脱氧核糖核苷酸、脱氧核糖核苷、核糖 核苷或核糖核苷酸以及其聚合物。除非特定限制,否则所述术语涵盖含有天然核 苷酸的已知类似物的核酸,所述核酸具有与参考核酸相似的结合性质并且是以类 似于天然存在核苷酸的方式代谢。除非另外特定限制,否则所述术语也是指寡核 苷酸类似物,其包括PNA(肽核酸)、反义技术中使用的DNA类似物(硫代磷酸 酯、氨基磷酸酯等)。除非另外说明,否则特定核酸序列也隐含地涵盖其保守修饰 变异体(包括(但不限于)简并密码子取代)和互补序列以及明确指示的序列。 具体来说,可通过产生一个或一个以上所选(或所有)密码子的第三位置是经混 合碱基和/或脱氧肌苷残基取代的序列来实现简并密码子取代(Batzer等人, NucleicAcidRes.19:5081(1991);Ohtsuka等人,J.Biol.Chem.260:2605-2608 (1985);Rossolini等人,Mol.Cell.Probes8:91-98(1994))。
术语“多肽”、“肽”和“蛋白质”在本文中可互换使用来指代氨基酸残基的 聚合物。也就是说,针对多肽的描述同样适用于对肽的描述以及对蛋白质的描述, 并且反之亦然。所述术语适用于天然存在氨基酸聚合物以及一个或一个以上氨基 酸残基为非天然编码氨基酸的氨基酸聚合物。如本文中所用,所述术语涵盖任何 长度的氨基酸链,包括全长蛋白质,其中氨基酸残基是通过共价肽键连接。
术语“氨基酸”是指天然存在和非天然存在氨基酸,以及以与天然存在氨基 酸类似的方式起作用的氨基酸类似物和氨基酸模拟物。天然编码氨基酸为20种常 见氨基酸(丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨 酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、蛋氨酸、苯丙氨酸、脯氨酸、 丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸)以及吡咯赖氨酸和硒代半胱氨酸。 氨基酸类似物是指具有与天然存在氨基酸相同的基本化学结构(即与氢、羧基、氨 基和R基团结合的α碳)的化合物,例如高丝氨酸、正亮氨酸、蛋氨酸亚砜、蛋氨 酸甲基锍。所述类似物具有经修饰R基团(例如正亮氨酸)或经修饰肽主链,但 仍保持与天然存在氨基酸相同的基本化学结构。对氨基酸的提及包括例如天然存 在的蛋白源性L-氨基酸、D-氨基酸;经化学修饰的氨基酸,例如氨基酸变异体和 衍生物;天然存在的非蛋白源性氨基酸,例如β-丙氨酸、鸟氨酸等;以及具有所 属领域中已知为氨基酸特征的性质的化学合成化合物。非天然存在氨基酸的实例 包括(但不限于)α-甲基氨基酸(例如α-甲基丙氨酸)、D-氨基酸、类组氨酸的 氨基酸(例如2-氨基-组氨酸、β-羟基-组氨酸、高组氨酸、α-氟甲基-组氨酸和 α-甲基-组氨酸)、侧链中另外具有亚甲基的氨基酸(“高”氨基酸),以及侧链中 的羧酸官能团经磺酸基置换的氨基酸(例如半胱氨酸)。在本发明蛋白质中并入非 天然氨基酸,包括合成非天然氨基酸、经取代氨基酸或一个或一个以上D-氨基酸 宜以若干不同的方式进行。含D-氨基酸肽等与含L-氨基酸对应物相比展现增加的 活体外或活体内稳定性。因此,当期望或需要较高细胞内稳定性时,构筑并入D- 氨基酸的肽等可能尤其适用。更具体来说,D-肽等抗内源肽酶和蛋白酶,从而在 期望改进的分子生物可用性和延长的活体内寿命时,提供这些性质。另外,不能 有效处理D-肽等用于T辅助细胞的主要组织相容性复合体II类限制呈递,且因此 不太可能在整个生物体中引发体液免疫反应。
在本文中,氨基酸可由其通常已知的三字母符号或由IUPAC-IUB生物化学命 名委员会(IUPAC-IUBBiochemicalNomenclatureCommission)推荐的单字母符号 来指代。同样,核苷酸可由其通常接受的单字母代码来指代。
“保守性修饰变异体”适用于氨基酸与核酸序列。对于特定核酸序列来说,“保 守性修饰变异体”是指编码一致或基本上一致的氨基酸序列的核酸,或当核酸不 编码氨基酸序列时是指基本上一致的序列。由于遗传密码的简并性,大量功能相 同的核酸编码任何给定蛋白质。举例来说,密码子GCA、GCC、GCG和GCU都 编码氨基酸丙氨酸。因此,在丙氨酸由密码子指定的每一位置处,密码子可改变 为所述相应密码子中的任一个而不会改变所编码的多肽。所述核酸变异为“沉默 变异(silentvariation)”,其为保守性修饰变异中的一种。本文中编码多肽的每一 核酸序列也描述核酸的每一种可能的沉默变异。所属领域的技术人员应认识到, 核酸中的各密码子(除AUG和TGG之外,AUG通常为蛋氨酸的独特密码子,而 TGG通常为色氨酸的独特密码子)都可经修饰以产生功能相同的分子。因此,编 码多肽的核酸的各沉默变异都隐含在各所述序列中。
关于氨基酸序列,所属领域的技术人员应认识到,改变、添加或缺失所编码 序列中的单一氨基酸或少量氨基酸的对核酸、肽、多肽或蛋白质序列的个别取代、 缺失或添加为“保守性修饰变异体”,其中所述改变将导致氨基酸缺失、氨基酸添 加或氨基酸经化学上类似的氨基酸取代。所属领域的技术人员已知提供功能类似 氨基酸的保守性取代表。所述保守性修饰变异体除为多态变异体之外(并且不排 除这些变异体),还为种间同源物和本发明的等位基因。
所属领域的技术人员已知提供功能类似胺基酸的保守性取代表。以下八组各 自含有彼此为保守性取代的氨基酸:
1)丙氨酸(A)、甘氨酸(G);
2)天冬氨酸(D)、谷氨酸(E);
3)天冬酰胺(N)、谷氨酰胺(Q);
4)精氨酸(R)、赖氨酸(K);
5)异亮氨酸(I)、亮氨酸(L)、蛋氨酸(M)、缬氨酸(V);
6)苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W);
7)丝氨酸(S)、苏氨酸(T);和
8)半胱氨酸(C)、蛋氨酸(M)
(例如参见Creighton,Proteins:StructuresandMolecularProperties(WH Freeman&Co.;第2版(1993年12月))。
在两个或两个以上核酸或多肽序列的情形中,术语“一致”或“一致性”百 分比是指相同的两个或两个以上序列或子序列。当通过比较窗比较和比对最大对 应性时,或如使用下列序列比较算法(或所属领域的技术人员可用的其它算法) 中的一种或通过手工比对和目测检查来测量指定区时,如果序列具有相同(即, 在指定区上具有约60%一致性,约65%、约70%、约75%、约80%、约85%、约 90%或约95%一致性)的氨基酸残基或核苷酸百分比,那么所述序列为“实质上 一致”的。此定义也是指测试序列的互补序列。一致性可存在于长度为至少约50 个氨基酸或核苷酸的区上,或长度为75-100个氨基酸或核苷酸的区上,或(在未 指定时)多核苷酸或多肽的整个序列上。可通过包含以下步骤的方法获得编码本 发明多肽的多核苷酸(包括来自非人类物种的同源物):在严格杂交条件下用具有 本发明的多核苷酸序列或其片段的经标记探针筛选文库,以及分离全长cDNA和 含有所述多核苷酸序列的基因组克隆。所属领域的技术人员熟知所述杂交技术。
对于序列比较来说,通常一个序列充当与测试序列相比较的参考序列。在使 用序列比较算法时,将测试序列与参考序列输入计算机中,必要时指定子序列坐 标,并且指定序列算法程序参数。可使用默认程序参数,或可指定替代参数。随 后,序列比较算法根据程序参数计算测试序列相对于参考序列的序列一致性百分 比。
如本文中所用,“比较窗”包括参考选自由20到600、通常约50到约200、 更通常约100到约150组成的群组的连续位置数中的任一者的区段,其中可在将 序列与具有相同数目的连续位置的参考序列最佳比对后对两个序列进行比较。所 属领域的技术人员已知用于比较的序列比对方法。可通过以下方法进行用于比较 的最佳序列比对,所述方法包括(但不限于)Smith和Waterman(1970)Adv.Appl. Math.2:482c的局部同源算法;Needleman和Wunsch(1970)J.Mol.Biol.48:443 的同源比对算法;搜索Pearson和Lipman(1988)Proc.Nat′l.Acad.Sci.USA85:2444 的相似方法;所述算法的计算机化实施(WisconsinGeneticsSoftwarePackage, GeneticsComputerGroup,575ScienceDr.,Madison,WI中的GAP、BESTFIT、 FASTA和TFASTA);或手工比对和目测检查(例如参见Ausubel等人,Current ProtocolsinMolecularBiology(1995年增刊))。
适用于测定序列一致性百分比和序列相似性百分比的算法的一个实例为 BLAST和BLAST2.0算法,其分别描述于Altschul等人,(1997)Nuc.AcidsRes. 25:3389-3402和Altschul等人,(1990)J.Mol.Biol.215:403-410中。用于进行 BLAST分析的软件可通过经由万维网在ncbi.nlm.nih.gov上访问的美国国家生物 技术信息中心(NationalCenterforBiotechnologyInformation)公开获得。BLAST 算法参数W、T和X将决定比对的灵敏性和速度。BLASTN程序(对于核苷酸序 列来说)使用字长(W)11、期望值(E)10、M=5、N=-4以及两条链的比较 作为默认值。对于氨基酸序列来说,BLASTP程序使用字长3和期望值(E)10 以及BLOSUM62得分矩阵(参见Henikoff和Henikoff(1992)Proc.Natl.Acad.Sci. USA89:10915)比对数(B)50、期望值(E)10、M=5、N=-4以及两条链的比 较作为默认值。通常在“低复杂性”过滤器关闭的情况下进行BLAST算法。
BLAST算法也进行两个序列之间相似性的统计学分析(例如参见Karlin和 Altschul(1993)Proc.Natl.Acad.Sci.USA90:5873-5787)。由BLAST算法提供的相 似性的一个量度为最小和概率(smallestsumprobability,P(N)),其提供关于两个 核苷酸或氨基酸序列之间偶然会发生匹配的概率的指标。举例来说,如果在测试 核酸与参考核酸的比较中最小和概率小于约0.2、或小于约0.01,或小于约0.001, 那么认为所述核酸与参考序列相似。
短语“与...选择性(或特异性)杂交”是指当复杂混合物(包括(但不限于) 总细胞或文库DNA或RNA)中存在特定核苷酸序列时,在严格杂交条件下分子 仅与所述序列结合、双联或杂交。
短语“严格杂交条件”是指在所属领域中已知的低离子强度和高温条件下 DNA、RNA、PNA或其它核酸模拟物或其组合的序列的杂交。通常,在严格条件 下,探针会与其在核酸的复杂混合物(包括(但不限于)总细胞或文库DNA或 RNA)中的标靶子序列杂交,但不与复杂混合物中的其它序列杂交。严格条件具 有序列依赖性并且在不同环境下会不同。较长序列在较高温度下特异性杂交。对 核酸杂交的广泛指导可见于Tijssen,LaboratoryTechniquesinBiochemistryand MolecularBiology-HybridizationwithNucleicProbes,″Overviewofprinciplesof hybridizationandthestrategyofnucleicacidassays″(1993)中。通常,选择严格条件 为在规定离子强度、pH值下比特异性序列的热力学熔点(Tm)低约5℃-10℃。 Tm为与标靶互补的探针的50%与标靶序列杂交处于平衡(因为标靶序列过量存 在,在Tm下,在平衡时占据50%的探针)时的温度(在指定离子强度、pH值以 及核酸浓度下)。严格条件可为在pH值为7.0到8.3下盐浓度小于约1.0M钠离 子、通常约0.01M到1.0M钠离子浓度(或其它盐)且温度对于短探针(包括(但 不限于)10到50个核苷酸)来说为至少约30℃且对于长探针(包括(但不限于) 大于50个核苷酸)来说为至少约60℃的条件。也可通过添加例如甲酰胺等去稳 定剂来实现严格条件。对于选择性或特异性杂交来说,阳性信号可为至少两倍背 景、任选地10倍背景杂交。示范性严格杂交条件可如下:50%甲酰胺、5×SSC 和1%SDS,在42℃下培育;或5×SSC、1%SDS,在65℃下培育,其中在65℃ 下用0.2×SSC和0.1%SDS洗涤。所述洗涤可进行5、15、30、60、120分钟或 更长时间。
如本文中所用,术语“真核生物”是指属于系统发育域(phylogeneticdomain) 真核域(Eucarya)的生物体,例如动物(包括(但不限于)哺乳动物、昆虫、爬 行动物、鸟类等)、纤毛虫、植物(包括(但不限于)单子叶植物、双子叶植物、 藻类等)、真菌、酵母、鞭毛虫、微孢子虫、原生生物等。
如本文中所用,术语“非真核生物”是指非真核生物体。举例来说,非真核 生物体可属于真细菌(Eubacteria)(包括(但不限于)大肠杆菌、嗜热栖热菌 (Thermusthermophilus)、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)、荧光 假单胞菌(Pseudomonasfluorescens)、绿脓杆菌(Pseudomonasaeruginosa)、恶臭 假单胞菌(Pseudomonasputida)等)系统发育域,或古生菌(Archaea)(包括(但 不限于)詹氏甲烷球菌(Methanococcusjannaschii)、嗜热自养甲烷杆菌 (Methanobacteriumthermoautotrophicum)、嗜盐菌(Halobacterium)(例如沃氏嗜 盐富饶菌(Haloferaxvolcanii)和嗜盐菌NRC-1)、超嗜热古菌(Archaeoglobus fulgidus)、强烈炽热球菌(Pyrococcusfuriosus)、极端嗜热古菌(Pyrococcus horikoshii)、嗜热泉生古细菌(Aeuropyrumpernix)等)系统发育域。
如本文中所用,术语“个体”是指动物,在一些实施例中为哺乳动物,并且 在其它实施例中为人类,其为治疗、观察或实验的对象。动物可为伴侣动物(例 如狗、猫等)、家畜(例如牛、羊、猪、马等)或实验动物(例如大鼠、小鼠、天 竺鼠等)。
如本文中所用,术语“有效量”是指所投与的经修饰非天然氨基酸多肽的量, 所述量会在一定程度上减轻所治疗的疾病、病状或病症的一种或一种以上症状。 可投与含有本文中所述的经修饰非天然氨基酸多肽的组合物来进行预防性、增强 性和/或治疗性处理。
术语“增强”意思是增加或延长所需作用的效力或持续时间。因此,对于增 强治疗剂的作用来说,术语“增强”是指增加或延长其它治疗剂对系统的作用的 效力或持续时间的能力。如本文中所用,“增强有效量”是指足以增强另一治疗剂 在所需系统中的作用的量。当用于患者中时,关于此用途有效的量将视以下因素 而定:疾病、病症或病状的严重性和病程、先前疗法、患者的健康状况和对药物 的反应以及主治医师的判断。
如本文中所用,术语“经修饰”是指对给定多肽作出的任何改变,例如多肽 长度、多肽的胺基酸序列、化学结构、共翻译修饰或翻译后修饰的改变。形式“(经 修饰)”术语意思是所讨论的多肽任选地经修饰,也就是说,所讨论的多肽可经修 饰或未经修饰。
术语“翻译后修饰”是指在天然或非天然氨基酸已并入多肽链中之后相对所 述氨基酸发生的任何修饰。仅举例来说,所述术语涵盖共翻译活体内修饰、共翻 译活体外修饰(例如在不含细胞的翻译系统中)、翻译后活体内修饰以及翻译后活 体外修饰。
在预防应用中,将含有胰岛素多肽的组合物投与易患特定疾病、病症或病状 或者处于患特定疾病、病症或病状的风险中的患者。所述量是定义为“预防有效 量”。在这一用途中,精确量也视患者的健康状况、体重等而定。认为通过常规实 验(例如剂量递增临床试验)确定所述预防有效量完全在所属领域的技能范围内。
术语“经保护”是指存在防止化学反应性官能团在特定反应条件下发生反应 的“保护基”或部分。保护基将视所保护的化学反应性基团的类型而改变。举例 来说,如果化学反应性基团为胺或酰肼,那么保护基可选自叔丁氧羰基(t-Boc) 和9-芴基甲氧基羰基(Fmoc)的群组。如果化学反应性基团为硫醇,那么保护基 可为邻吡啶基二硫化物。如果化学反应性基团为羧酸(例如丁酸或丙酸)或羟基, 那么保护基可为苄基或例如甲基、乙基或叔丁基等烷基。所属领域中已知的其它 保护基也可用于本文中所述的方法和组合物中或与所述方法和组合物一起使用, 其包括例如Nvoc和MeNvoc等光不稳定基团。所属领域中已知的其它保护基也 可用于本文中所述的方法和组合物中或与所述方法和组合物一起使用。
仅举例来说,封端基/保护基可选自:
其它保护基描述于Greene和Wuts,ProtectiveGroupsinOrganicSynthesis,第 3版,JohnWiley&Sons,NewYork,NY,1999中,其是以全文引用的方式并入本文 中。
在治疗应用中,将足以治愈或至少部分抑制疾病、病症或病状的症状的量的 含有经修饰非天然氨基酸多肽的组合物投与已罹患所述疾病、病状或病症的患者。 所述量是定义为“治疗有效量”,且将视以下因素而定:疾病、病症或病状的严重 性和病程、先前疗法、患者的健康状况和对药物的反应以及主治医师的判断。认 为通过常规实验(例如剂量递增临床试验)确定所述治疗有效量完全在所属领域 的技能范围内。
术语“治疗”是用于指预防性和/或治疗性处理。
本文中提出的非天然编码氨基酸多肽可包括一个或一个以上原子经原子质量 或质量数与自然界中通常可见的原子质量或质量数不同的原子置换的经同位素标 记的化合物。可并入本发明化合物中的同位素的实例包括氢、碳、氮、氧、氟和 氯的同位素,分别为例如2H、3H、13C、14C、15N、18O、17O、35S、18F、36Cl。 本文中所述的某些经同位素标记的化合物(例如合并有例如3H和14C等放射性 同位素的化合物)可用于药物和/或底物组织分布测定中。此外,用例如氘(即2H) 等同位素取代可提供由较高代谢稳定性产生的某些治疗优点,例如增加的活体内 半衰期或降低的剂量需求。
所有异构体(包括(但不限于)非对映异构体、对映异构体和其混合物)都 被视为本文中所述组合物的一部分。在另外或其它的实施例中,非天然编码氨基 酸多肽在向需要产生代谢物的生物体投与之后代谢,所述代谢物随后用于产生所 需作用(包括所需治疗作用)。在其它或另外的实施例中,其为非天然编码氨基酸 多肽的活性代谢物。
在一些情况下,非天然编码氨基酸多肽可以互变异构体形式存在。另外,本 文中所述的非天然编码氨基酸多肽可以未溶剂化形式以及与医药学上可接受的溶 剂(例如水、乙醇等)形成的溶剂化形式存在。也认为本文中揭示所述溶剂化形 式。所属领域的技术人员应认识到,本文中的一些化合物可以若干互变异构形式 存在。所有这种互变异构形式都被视作本文中所述组合物的一部分。
除非另外说明,否则使用所属领域的技能范围内的质谱、核磁共振(NMR)、 HPLC、蛋白质化学、生物化学、重组DNA技术以及药理学的常规方法。
I.引言
本发明提供包含至少一个非天然氨基酸的胰岛素多肽。在本发明的某些实施 例中,具有至少一个非天然氨基酸的胰岛素多肽包括至少一个翻译后修饰。在一 实施例中,所述至少一个翻译后修饰包含利用所属领域的技术人员已知适用于特 定反应性基团的化学方法,使包含第二反应性基团的分子与至少一个包含第一反 应性基团的非天然氨基酸连接,所述包含第二反应性基团的分子包括(但不限于): 标记、染料、聚合物、水溶性聚合物、聚乙二醇的衍生物、光交联剂、放射性核 素、细胞毒性化合物、药物、亲和性标记、光亲和性标记、反应性化合物、树脂、 第二蛋白质或多肽或多肽类似物、抗体或抗体片段、金属螯合剂、辅因子、脂肪 酸、碳水化合物、多核苷酸、DNA、RNA、反义多核苷酸、糖类、水溶性树枝状 聚合物、环糊精、抑制性核糖核酸、生物材料、纳米粒子、自旋标记、荧光团、 含金属的部分、放射性部分、新颖官能团、与其它分子共价或非共价相互作用的 基团、光笼化部分、光化辐射可激发的部分、可光致异构化部分、生物素、生物 素衍生物、生物素类似物、结合有重原子的部分、可化学裂解的基团、可光裂解 的基团、延长的侧链、碳连接的糖、氧化还原活性剂、氨基硫代酸、毒性部分、 经同位素标记的部分、生物物理探针、磷光基团、化学发光基团、电子致密基团、 磁性基团、插入基团、发色团、能量转移剂、生物活性剂、可检测标记、小分子、 量子点、纳米传递素、放射性核苷酸、放射性传递素、中子俘获剂或上述物质的 任何组合,或任何其它所需化合物或物质。举例来说,第一反应性基团为炔基部 分(包括(但不限于)在非天然氨基酸对炔丙基氧基苯丙氨酸中,其中炔丙基有 时也被称作乙炔部分),并且第二反应性基团为叠氮基部分,并利用[3+2]环加成 化学方法。在另一实例中,第一反应性基团为叠氮基部分(包括(但不限于)在 非天然氨基酸对叠氮基-L-苯丙氨酸中),并且第二反应性基团为炔基部分。在本 发明的经修饰胰岛素多肽的某些实施例中,使用至少一种包含至少一个翻译后修 饰的非天然氨基酸(包括(但不限于)含有酮基官能团的非天然氨基酸),其中所 述至少一个翻译后修饰包含糖部分。在某些实施例中,翻译后修饰是在真核细胞 或非真核细胞中活体内进行。连接子、聚合物、水溶性聚合物或其它分子可将所 述分子与多肽连接。分子可与多肽直接连接。
在某些实施例中,蛋白质包括至少一个由一种宿主细胞在活体内进行的翻译 后修饰,其中所述翻译后修饰通常无法通过另一种宿主细胞类型进行。在某些实 施例中,蛋白质包括至少一个由真核细胞在活体内进行的翻译后修饰,其中所述 翻译后修饰通常无法通过非真核细胞进行。翻译后修饰的实例包括(但不限于) 糖基化、乙酰化、酰化、脂质修饰、棕榈酰化、棕榈酸盐加成(palmitateaddition)、 磷酸化、糖脂键修饰等。
在一些实施例中,胰岛素多肽包含一个或一个以上用于多肽的糖基化、乙酰 化、酰化、脂质修饰、棕榈酰化、棕榈酸盐加成、磷酸化或糖脂键修饰的非天然 编码氨基酸。在一些实施例中,胰岛素多肽包含一个或一个以上用于多肽糖基化 的非天然编码氨基酸。在一些实施例中,胰岛素多肽包含一个或一个以上用于多 肽的糖基化、乙酰化、酰化、脂质修饰、棕榈酰化、棕榈酸盐加成、磷酸化或糖 脂键修饰的天然编码氨基酸。在一些实施例中,胰岛素多肽包含一个或一个以上 用于多肽糖基化的天然编码氨基酸。
在一些实施例中,胰岛素多肽包含一个或一个以上增强多肽的糖基化的非天 然编码氨基酸添加和/或取代。在一些实施例中,胰岛素多肽包含一个或一个以上 增强多肽的糖基化的缺失。在一些实施例中,胰岛素多肽包含一个或一个以上增 强多肽中不同氨基酸处的糖基化的非天然编码氨基酸添加和/或取代。在一些实施 例中,胰岛素多肽包含一个或一个以上增强多肽中不同氨基酸处的糖基化的缺失。 在一些实施例中,胰岛素多肽包含一个或一个以上增强多肽中非天然编码氨基酸 处的糖基化的非天然编码氨基酸添加和/或取代。在一些实施例中,胰岛素多肽包 含一个或一个以上增强多肽中天然编码氨基酸处的糖基化的非天然编码氨基酸添 加和/或取代。在一些实施例中,胰岛素多肽包含一个或一个以上增强多肽中不同 氨基酸处的糖基化的天然编码氨基酸添加和/或取代。在一些实施例中,胰岛素多 肽包含一个或一个以上增强多肽中天然编码氨基酸处的糖基化的非天然编码氨基 酸添加和/或取代。在一些实施例中,胰岛素多肽包含一个或一个以上增强多肽中 非天然编码氨基酸处的糖基化的非天然编码氨基酸添加和/或取代。
在一个实施例中,翻译后修饰包含通过GlcNAc-天冬酰胺键使寡糖与天冬酰 胺连接(包括(但不限于)其中寡糖包含(GlcNAc-Man)2-Man-GlcNAc-GlcNAc等)。 在另一实施例中,翻译后修饰包含通过GalNAc-丝氨酸、GalNAc-苏氨酸、GlcNAc- 丝氨酸或GlcNAc-苏氨酸键使寡糖(包括(但不限于)Gal-GalNAc、Gal-GlcNAc 等)与丝氨酸或苏氨酸连接。在某些实施例中,本发明的蛋白质或多肽可包含分 泌或定位序列、表位标签、FLAG标签、聚组氨酸标签、GST融合体等。分泌信 号序列的实例包括(但不限于)原核生物分泌信号序列、真核生物分泌信号序列、 为进行细菌表达而优化5′的真核生物分泌信号序列、新颖分泌信号序列、果胶裂 解酶分泌信号序列、OmpA分泌信号序列和噬菌体分泌信号序列。分泌信号序列 的实例包括(但不限于)STII(原核生物)、FdGIII和M13(噬菌体)、Bgl2(酵 母)和源自转位子的信号序列bla。任何此类序列都可经修饰以使多肽具有所需结 果,包括(但不限于)用不同信号序列取代一个信号序列,用不同前导序列取代 一个前导序列等。
所关注的蛋白质或多肽可含有至少一个、至少两个、至少三个、至少四个、 至少五个、至少六个、至少七个、至少八个、至少九个或十个或十个以上非天然 氨基酸。所述非天然氨基酸可相同或不同,例如在蛋白质中可存在1、2、3、4、 5、6、7、8、9、10或10个以上不同位点,其包含1、2、3、4、5、6、7、8、9、 10或10个以上不同的非天然氨基酸。在某些实施例中,蛋白质的天然存在形式 中所存在的至少一个(但少于全部)特定氨基酸是经非天然氨基酸取代。
本发明提供基于包含至少一个非天然编码氨基酸的胰岛素的方法和组合物。 将至少一个非天然编码氨基酸引入胰岛素中可允许应用涉及特定化学反应(包括 (但不限于)与一个或一个以上非天然编码氨基酸反应而不与通常存在的20种氨 基酸反应)的结合化学。在一些实施例中,包含非天然编码氨基酸的胰岛素是通 过非天然编码氨基酸的侧链与水溶性聚合物(例如聚乙二醇(PEG))连接。本发 明提供一种用PEG衍生物选择性修饰蛋白质的高效方法,其涉及响应选择密码子 将非遗传编码氨基酸(包括(但不限于)含有在20种天然并入氨基酸中未发现的 官能团或取代基(包括(但不限于)酮、叠氮或乙炔部分)的氨基酸)选择性并 入蛋白质中,并且随后用合适的反应性PEG衍生物修饰所述氨基酸。一旦并入氨 基酸侧链,就可通过利用所属领域的技术人员已知适用于非天然编码氨基酸中存 在的特定官能团或取代基的化学方法来修饰氨基酸侧链。多种已知的化学方法适 用于在本发明中将水溶性聚合物并入蛋白质中。所述方法包括(但不限于)分别 与(包括(但不限于))乙炔或叠氮化物衍生物进行休斯根[3+2]环加成反应(Huisgen [3+2]cycloadditionreaction)(例如参见Padwa,A.ComprehensiveOrganicSynthesis, 第4卷,(1991)Trost,B.M.编,Pergamon,Oxford,第1069-1109页;以及Huisgen,R. 1,3-DipolarCycloadditionChemistry,(1984)Padwa,A.编,Wiley,NewYork,第 1-176页)。
因为休斯根[3+2]环加成方法涉及环加成而非亲核取代反应,所以蛋白质可在 极高选择性下经修饰。通过向反应混合物中添加催化量的Cu(I)盐,可在室温下在 水性条件下以优良区域选择性(1,4>1,5)进行此反应。例如参见Tornoe等人,(2002) J.Org.Chem.67:3057-3064;和Rostovtsev等人,(2002)Angew.Chem.Int.Ed. 41:2596-2599;以及WO03/101972。可通过[3+2]环加成而加成到本发明蛋白质上 的分子包括具有合适的官能团或取代基(包括(但不限于)叠氮基或乙炔衍生物) 的几乎任何分子。这些分子可分别加成到具有乙炔基的非天然氨基酸(包括(但 不限于)对炔丙基氧基苯丙氨酸)或具有叠氮基的非天然氨基酸(包括(但不限 于)对叠氮基-苯丙氨酸)上。
由休斯根[3+2]环加成得到的5元环在还原性环境中通常为不可逆的,并且在 水性环境中长时间对水解稳定。因此,可在苛刻水性条件下用本发明的活性PEG 衍生物修饰多种物质的物理和化学特征。甚至更重要的是,因为叠氮部分和乙炔 部分彼此具有特异性(并且例如不与20种常见的遗传编码氨基酸中的任一种反 应),所以可在一个或一个以上特异性位点中以极高的选择性修饰蛋白质。
本发明还提供PEG衍生物的水溶性和水解稳定衍生物以及具有一个或一个 以上乙炔或叠氮部分的相关亲水性聚合物。含有乙炔部分的PEG聚合物衍生物以 极高选择性与已响应选择密码子而选择性地引入蛋白质中的叠氮部分偶合。类似 地,含有叠氮部分的PEG聚合物衍生物以极高选择性与已响应选择密码子而选择 性地引入蛋白质中的乙炔部分偶合。
更具体来说,叠氮部分包含(但不限于)烷基叠氮化物、芳基叠氮化物和这 些叠氮化物的衍生物。烷基和芳基叠氮化物的衍生物可包括其它取代基,只要保 持乙炔特异性反应性即可。乙炔部分包含烷基和芳基乙炔和各自的衍生物。烷基 和芳基乙炔的衍生物可包括其它取代基,只要保持叠氮化物特异性反应性即可。
本发明提供具有多种官能团、取代基或部分的物质与其它物质的结合物,所 述其它物质包括(但不限于)标记;染料;聚合物;水溶性聚合物;聚乙二醇的 衍生物;光交联剂;放射性核素;细胞毒性化合物;药物;亲和性标记;光亲和 性标记;反应性化合物;树脂;第二蛋白质或多肽或多肽类似物;抗体或抗体片 段;金属螯合剂;辅因子;脂肪酸;碳水化合物;多核苷酸;DNA;RNA;反义 多核苷酸;糖类;水溶性树枝状聚合物;环糊精;抑制性核糖核酸;生物材料; 纳米粒子;自旋标记;荧光团;含金属的部分;放射性部分;新颖官能团;与其 它分子共价或非共价相互作用的基团;光笼化部分;光化辐射可激发的部分;可 光致异构化部分;生物素;生物素衍生物;生物素类似物;结合有重原子的部分; 可化学裂解的基团;可光裂解的基团;延长的侧链;碳连接的糖;氧化还原活性 剂;氨基硫代酸;毒性部分;经同位素标记的部分;生物物理探针;磷光基团; 化学发光基团;电子致密基团;磁性基团;插入基团;发色团;能量转移剂;生 物活性剂;可检测标记;小分子;量子点;纳米传递素;放射性核苷酸;放射性 传递素;中子俘获剂;或上述物质的任何组合,或任何其它所需化合物或物质。 本发明还包括具有叠氮或乙炔部分的物质与具有相应乙炔或叠氮部分的PEG聚 合物衍生物的结合物。举例来说,含有叠氮部分的PEG聚合物可在蛋白质中含有 带有乙炔官能团的非遗传编码氨基酸的位置处与生物活性分子偶合。使PEG与生 物活性分子偶合的键包括(但不限于)休斯根[3+2]环加成产物。
所属领域中已明确确立,PEG可用于修饰生物材料的表面(例如参见美国专 利6,610,281;Mehvar,R.,J.PharmPharmSci.,3(1):125-136(2000),其是以引用的 方式并入本文中)。本发明还包括包含具有一个或一个以上反应性叠氮基或乙炔位 点的表面的生物材料,和通过休斯根[3+2]环加成键与所述表面偶合的一种或一种 以上本发明的含叠氮基或乙炔的聚合物。生物材料和其它物质也可通过除叠氮基 或乙炔键以外的其它键(例如通过包含羧酸、胺、醇或硫醇部分的键)与由叠氮 化物或乙炔活化的聚合物衍生物偶合以留下叠氮或乙炔部分用于后续反应。
本发明包括一种合成本发明的含叠氮基聚合物和含乙炔聚合物的方法。在含 叠氮基的PEG衍生物的情况下,可使叠氮化物与聚合物的碳原子直接键结。或者, 可通过将一端具有叠氮部分的连接剂与常规活化聚合物连接来制备含叠氮基的 PEG衍生物,使得所得聚合物在其末端具有叠氮部分。在含乙炔的PEG衍生物的 情况下,可使乙炔与聚合物的碳原子直接键结。或者,可通过将一端具有乙炔部 分的连接剂与常规活化聚合物连接来制备含乙炔的PEG衍生物,使得所得聚合物 在其末端具有乙炔部分。
更具体来说,在含叠氮基的PEG衍生物的情况下,具有至少一个活性羟基部 分的水溶性聚合物进行反应以产生具有反应性更强的部分(例如甲磺酸根、三氟 乙磺酸根、甲苯磺酸根或卤素离去基)的经取代聚合物。所属领域的技术人员已 知含有磺酰卤、卤素原子以及其它离去基的PEG衍生物的制备和使用。所得经取 代的聚合物随后进行反应以在聚合物的末端用叠氮部分取代反应性更强的部分。 或者,具有至少一个活性亲核或亲电子部分的水溶性聚合物与一端具有叠氮基的 连接剂发生反应,使得在PEG聚合物与连接剂之间形成共价键,并且叠氮部分位 于聚合物的末端。所属领域的技术人员已知亲核和亲电子部分,其包括胺、硫醇、 酰肼、肼、醇、羧酸酯、醛、酮、硫酯等。
更具体来说,在含乙炔的PEG衍生物的情况下,具有至少一个活性羟基部分 的水溶性聚合物进行反应以从含有乙炔部分的前体置换卤素或其它经活化的离去 基。或者,具有至少一个活性亲核或亲电子部分的水溶性聚合物与一端具有乙炔 的连接剂发生反应,使得在PEG聚合物与连接剂之间形成共价键,并且乙炔部分 位于聚合物的末端。所属领域的技术人员充分确定卤素部分、经活化的离去基、 亲核和亲电子部分在有机合成情形中的使用以及PEG衍生物的制备和使用。
本发明还提供一种选择性修饰蛋白质以将其它物质添加到经修饰蛋白质上的 方法,所述其它物质包括(但不限于)水溶性聚合物,例如PEG和含有叠氮或乙 炔部分的PEG衍生物。含叠氮基和含乙炔的PEG衍生物可用于改变表面和分子 的性质(其中生物相容性、稳定性、溶解性和缺乏免疫原性较为重要),并同时提 供一种比所属领域中先前已知的选择性更强的使PEG衍生物与蛋白质连接的方 法。
本发明中使用的一般重组核酸方法
在本发明的众多实施例中,将使用重组方法分离、克隆并通常改变编码所关 注的胰岛素多肽的核酸。所述实施例是用于(包括(但不限于))蛋白质表达或用 于源自胰岛素多肽的变异体、衍生物、表达盒或其它序列的产生期间。在一些实 施例中,编码本发明多肽的序列是可操作地连接到异源启动子上。
可以母体多肽的氨基酸序列(包括(但不限于)具有SEQIDNO:1和SEQID NO:2所示的氨基酸序列)为基础来合成编码包含非天然编码氨基酸的胰岛素多 肽的核苷酸序列,并且随后改变所述核苷酸序列以引入(即并入或取代)或移除 (即缺失或取代)相关氨基酸残基。宜根据常规方法通过定点诱变来修饰核苷酸序 列。或者,可由化学合成来制备核苷酸序列,包括(但不限于)通过使用寡核苷 酸合成器并且优先选择将产生重组多肽的宿主细胞中所偏好的密码子来制备核苷 酸序列,其中寡核苷酸是根据所需多肽的氨基酸序列进行设计。
本发明利用重组遗传学领域中的常规技术。揭示本发明中使用的一般方法的 基础文章包括Sambrook等人,MolecularCloning,ALaboratoryManual(第3版, 2001);Kriegler,GeneTransferandExpression:ALaboratoryManual(1990);以及 CurrentProtocolsinMolecularBiology(Ausubel等人编,1994)。
描述分子生物技术的一般文章包括Berger和Kimmel,GuidetoMolecular CloningTechniques,MethodsinEnzymology,第152卷,AcademicPress,Inc.,San Diego,CA(Berger);Sambrook等人,MolecularCloning-ALaboratoryManual(第2 版),第1-3卷,ColdSpringHarborLaboratory,ColdSpringHarbor,NewYork,1989 (″Sambrook″)以及CurrentProtocolsinMolecularBiology,F.M.Ausubel等人编, CurrentProtocols,GreenePublishingAssociates,Inc.与JohnWiley&Sons,Inc.的合 资企业,(1999年全年增补)(″Ausubel″)。这些文章描述诱变、载体和启动子的使用 以及许多其它相关主题,所述相关主题涉及(包括(但不限于))包括用于制备包 括非天然氨基酸、正交tRNA、正交合成酶以及其对的蛋白质的选择密码子的基 因或多核苷酸的产生。
本发明出于多种目的使用各种类型的诱变,所述目的包括(但不限于)产生 新颖合成酶或tRNA、使tRNA分子突变、使编码合成酶的多核苷酸突变、产生 tRNA文库、产生合成酶文库、产生选择密码子、在所关注的蛋白质或多肽中插 入编码非天然氨基酸的选择密码子。所述诱变包括(但不限于)定点诱变、随机 点诱变、同源重组、DNA改组或其它递归诱变方法、嵌合构建、使用含有尿嘧啶 的模板的诱变、寡核苷酸定向诱变、硫代磷酸酯修饰的DNA诱变、使用带缺口 的双螺旋DNA的诱变等、PCT介导的诱变,或其任何组合。其它合适的方法包 括点错配修复、使用修复缺陷型宿主菌株的诱变、限制选择和限制纯化、缺失诱 变、通过总基因合成进行的诱变、双链断裂修复等。(包括(但不限于))涉及嵌 合构筑体的诱变也包括在本发明中。在一实施例中,可由天然存在分子或已改变 或突变的天然存在分子的已知信息(包括(但不限于)序列、序列比较、物理性 质、二级、三级或四级结构、晶体结构等)来指导诱变。
本文中可见的文章和实例描述这些程序。其它信息可见于以下公开案和其中 引用的参考文献中:Ling等人,ApproachestoDNAmutagenesis:anoverview,Anal Biochem.254(2):157-178(1997);Dale等人,Oligonucleotide-directedrandom mutagenesisusingthephosphorothioatemethod,MethodsMol.Biol.57:369-374 (1996);Smith,Invitromutagenesis,Ann.Rev.Genet.19:423-462(1985);Botstein 和Shortle,Strategiesandapplicationsofinvitromutagenesis,Science229:1193-1201 (1985);Carter,Site-directedmutagenesis,Biochem.J.237:1-7(1986);Kunkel,The efficiencyofoligonucleotidedirectedmutagenesis,NucleicAcids&Molecular Biology(Eckstein,F.和Lilley,D.M.J编,SpringerVerlag,Berlin)(1987);Kunkel, Rapidandefficientsite-specificmutagenesis-withoutphenotypicselection,Proc.Natl. Acad.Sci.USA82:488-492(1985);Kunkel等人,Rapidandefficientsite-specific mutagenesiswithoutphenotypicselection,MethodsinEnzymol.154,367-382 (1987);Bass等人,MutantTrprepressorswithnewDNA-bindingspecificities, Science242:240-245(1988);Zoller和Smith,Oligonucleotide-directedmutagenesis usingM13-derivedvectors:anefficientandgeneralprocedurefortheproductionof pointmutationsinanyDNAfragment,NucleicAcidsRes.10:6487-6500(1982); Zoller和Smith,Oligonucleotide-directedmutagenesisofDNAfragmentsclonedinto M13vectors,MethodsinEnzymol.100:468-500(1983);Zoller和Smith, Oligonucleotide-directedmutagenesis:asimplemethodusingtwooligonucleotide primersandasingle-strandedDNAtemplate,MethodsinEnzymol.154:329-350 (1987);Taylor等人,Theuseofphosphorothioate-modifiedDNAinrestrictionenzyme reactionstopreparenickedDNA,Nucl.AcidsRes.13:8749-8764(1985);Taylor等人, Therapidgenerationofoligonucleotide-directedmutationsathighfrequencyusing phosphorothioate-modifiedDNA,Nucl.AcidsRes.13:8765-8785(1985);Nakamaye 和Eckstein,InhibitionofrestrictionendonucleaseNciIcleavagebyphosphorothioate groupsanditsapplicationtooligonucleotide-directedmutagenesis,Nucl.AcidsRes. 14:9679-9698(1986);Sayers等人,5′-3′Exonucleasesinphosphorothioate-based oligonucleotide-directedmutagenesis,Nucl.AcidsRes.16:791-802(1988);Sayers等 人,Strandspecificcleavageofphosphorothioate-containingDNAbyreactionwith restrictionendonucleasesinthepresenceofethidiumbromide,(1988)Nucl.AcidsRes. 16:803-814;Kramer等人,ThegappedduplexDNAapproachto oligonucleotide-directedmutationconstruction,Nucl.AcidsRes.12:9441-9456 (1984);Kramer和FritzOligonucleotide-directedconstructionofmutationsviagapped duplexDNA,MethodsinEnzymol.154:350-367(1987);Kramer等人,Improved enzymaticinvitroreactionsinthegappedduplexDNAapproachto oligonucleotide-directedconstructionofmutations,Nucl.AcidsRes.16:7207(1988); Fritz等人,Oligonucleotide-directedconstructionofmutations:agappedduplexDNA procedurewithoutenzymaticreactionsinvitro,Nucl.AcidsRes.16:6987-6999 (1988);Kramer等人,Differentbase/basemismatchesarecorrectedwithdifferent efficienciesbythemethyl-directedDNAmismatch-repairsystemofE.coli,Cell 38:879-887(1984);Carter等人,Improvedoligonucleotidesite-directedmutagenesis usingM13vectors,Nucl.AcidsRes.13:4431-4443(1985);Carter,Improved oligonucleotide-directedmutagenesisusingM13vectors,MethodsinEnzymol.154: 382-403(1987);Eghtedarzadeh和Henikoff,Useofoligonucleotidestogeneratelarge deletions,Nucl.AcidsRes.14:5115(1986);Wells等人,Importanceof hydrogen-bondformationinstabilizingthetransitionstateofsubtilisin,Phil.Trans.R. Soc.Lond.A317:415-423(1986);Nambiar等人,Totalsynthesisandcloningofa genecodingfortheribonucleaseSprotein,Science223:1299-1301(1984);Sakamar 和Khorana,Totalsynthesisandexpressionofageneforthealpha-subunitofbovine rodoutersegmentguaninenucleotide-bindingprotein(transducin),Nucl.AcidsRes. 14:6361-6372(1988);Wells等人,Cassettemutagenesis:anefficientmethodfor generationofmultiplemutationsatdetinedsites,Gene34:315-323(1985); Grundstrom等人,Oligonucleotide-directedmutagenesisbymicroscale′shot-gun′gene synthesis,Nucl.AcidsRes.13:3305-3316(1985);Mandecki, Oligonucleotide-directeddouble-strandbreakrepairinplasmidsofEscherichiacoli:a methodforsite-specificmutagenesis,Proc.Natl.Acad.Sci.USA,83:7177-7181 (1986);Arnold,Proteinengineeringforunusualenvironments,CurrentOpinionin Biotechnology4:450-455(1993);Sieber等人,NatureBiotechnology,19:456-460 (2001);W.P.C.Stemmer,Nature370,389-91(1994);以及I.A.Lorimer,I.Pastan, NucleicAcidsRes.23,3067-8(1995)。关于众多上述方法的其它细节可见于 MethodsinEnzymology第154卷中,所述文献也描述对于各种诱变方法带来的故 障查找问题的有效控制。
通常根据由Beaucage和Caruthers,TetrahedronLetts.22(20):1859-1862,(1981) 所描述的固相亚磷酰胺三酯法,例如使用如Needham-VanDevanter等人,Nucleic acidsRes.,12:6159-6168(1984)中所述的自动合成器以化学方式合成例如用于本 发明的诱变(例如使合成酶文库突变或改变tRNA)中的寡核苷酸。
本发明也涉及通过正交tRNA/RS对在活体内并入非天然氨基酸的真核宿主 细胞、非真核宿主细胞和生物体。用本发明的多核苷酸或包括本发明多核苷酸的 构筑体(包括(但不限于)本发明的载体,其可为例如克隆载体或表达载体)以 遗传学方式工程改造(包括(但不限于)转化、转导或转染)宿主细胞。举例来 说,正交tRNA、正交tRNA合成酶和欲衍生的蛋白质的编码区可操作地连接到在 所需宿主细胞中起作用的基因表达控制元件上。载体可为例如质粒、粘粒 (cosmid)、噬菌体、细菌、病毒、裸多核苷酸或结合多核苷酸的形式。通过标准 方法将载体引入细胞和/或微生物中,所述方法包括电穿孔(Fromm等人,Proc.Natl. Acad.Sci.USA82,5824(1985))、通过病毒载体感染、在小珠粒或粒子基质内或在 表面上由具有核酸的小粒子高速弹道渗透(Klein等人,Nature327,70-73(1987)) 等。适合活体外将核酸转移到细胞中的技术包括使用脂质体、显微注射、细胞融 合、DEAE-葡聚糖、磷酸钙沉淀法等。活体内基因转移技术包括(但不限于)用 病毒(通常逆转录病毒)载体转染和病毒外壳蛋白-脂质体介导的转染[Dzau等 人,TrendsinBiotechnology11:205-210(1993)]。在一些情形下,可能期望给核酸 源提供例如对细胞表面膜蛋白或靶细胞具有特异性的抗体、靶细胞上的受体的配 体等靶向靶细胞的因子。当使用脂质体时,可使用结合与胞吞作用相关的细胞表 面膜蛋白的蛋白质来靶向和/或促进摄取例如衣壳蛋白或其对特定细胞类型具有 向性的片段、在循环中经历内化的蛋白质的抗体、靶向细胞内定位和增加细胞内 半衰期的蛋白质。
可在经改良适于例如筛选步骤、活化启动子或选择转化株等活动的常规营养 培养基中培养工程改造过的宿主细胞。这些细胞可任选地经培养并进入转基因生 物体中。(包括(但不限于))关于细胞分离和培养(例如关于后续核酸分离)的 其它有用参考文献包括Freshney(1994)CultureofAnimalCells,aManualofBasic Technique,第3版,Wiley-Liss,NewYork以及其中引用的参考文献;Payne等人, (1992)PlantCellandTissueCultureinLiquidSystemsJohnWiley&Sons,Inc.New York,NY;Gamborg和Phillips(编)(1995)PlantCell,TissueandOrganCulture; FundamentalMethodsSpringerLabManual,Springer-Verlag(BerlinHeidelbergNew York)以及Atlas和Parks(编)TheHandbookofMicrobiologicalMedia(1993)CRC Press,BocaRaton,FL。
可使用将标靶核酸引入细胞中的数种熟知方法,其中任一种方法都可用于本 发明中。这些方法包括:受体细胞与含有DNA的细菌原生质体融合、电穿孔、 基因枪法(projectilebombardment)以及经病毒载体(在下文中进一步论述)感 染等。细菌细胞可用于扩增含有本发明的DNA构筑体的质粒的数目。使细菌生 长到对数生长期并且可通过所属领域中已知的多种方法分离细菌中的质粒(例如 参见Sambrook)。另外,可购得试剂盒以从细菌中纯化质粒(例如参见来自 PharmaciaBiotech的EasyPrepTM、FlexiPrepTM;来自Stratagene的StrataCleanTM; 以及来自Qiagen的QIAprepTM)。随后,进一步操纵分离并纯化过的质粒以产生 其它质粒,使用所述质粒来转染细胞或将其并入相关载体中以感染生物体。典型 载体含有转录和翻译终止子、转录和翻译起始序列以及可用于调节特定标靶核酸 的表达的启动子。载体任选地包含通用表达盒,其含有至少一个独立的终止子序 列、允许所述表达盒在真核细胞或原核细胞或两者中复制的序列(包括(但不限 于)穿梭载体)以及用于原核系统与真核系统的选择标记。载体适于在原核细胞、 真核细胞或两者中复制和整合。参见Giliman和Smith,Gene8:81(1979);Roberts 等人,Nature.328:731(1987);Schneider,B.等人,ProteinExpr.Purif.6435:10 (1995);Ausubel,Sambrook,Berger(都同上文)。适用于克隆的细菌和噬菌体的目 录由例如ATCC提供,例如由ATCC出版的TheATCCCatalogueofBacteriaand Bacteriophage(1992),Gherna等人(编)。用于测序、克隆和分子生物学的其它方 面的其它基本程序以及基础理论考虑因素也可见于Watson等人,(1992) RecombinantDNA第2版ScientificAmericanBooks,NY中。另外,基本上任何 核酸(以及实际上任何经标记核酸,无论标准或非标准)都可从多种商业来源中 的任一种定制或标准定购,这些商业来源例如MidlandCertifiedReagentCompany (Midland,TX,可通过万维网(WorldWideWeb)在mcrc.com上获得)、TheGreat AmericanGeneCompany(Ramona,CA,可通过万维网在genco.com上获得)、 ExpressGenInc.(Chicago,IL,可通过万维网在expressgen.com上获得)、Operon TechnologiesInc.(Alameda,CA)以及许多其它来源。
选择密码子
本发明的选择密码子扩展蛋白质生物合成机制的遗传密码子框架。举例来说, 选择密码子包括(但不限于)独特三碱基密码子、无义密码子(例如终止密码子, 包括(但不限于)琥珀密码子(UAG)、赭石密码子或蛋白石密码子(UGA))、 非天然密码子、四个或四个以上碱基的密码子、稀有密码子等。所属领域的技术 人员显而易见,可引入所需基因或多核苷酸中的选择密码子的数目范围很广,其 包括(但不限于)在编码胰岛素多肽的至少一部分的单一多核苷酸中存在一个或 一个以上、两个或两个以上、三个或三个以上、4个、5个、6个、7个、8个、9 个、10个或10个以上选择密码子。所属领域的技术人员还显而易见,可引入所 需基因或多核苷酸中的选择密码子的数目范围很广,其包括(但不限于)在编码 胰岛素多肽的至少一部分的A链和B链多核苷酸序列中存在总计一个或一个以 上、两个或两个以上、三个或三个以上、4个、5个、6个、7个、8个、9个、10 个或10个以上选择密码子。
在一实施例中,所述方法涉及使用作为终止密码子的选择密码子以在活体内 并入一个或一个以上非天然氨基酸。举例来说,产生识别终止密码子(包括(但 不限于)UAG)的O-tRNA,并且通过O-RS利用所需非天然氨基酸使O-tRNA氨 酰基化。此O-tRNA无法由天然存在宿主的氨酰基-tRNA合成酶识别。可使用常 规定点诱变在所关注多肽中的所关注位点处引入终止密码子(包括(但不限于) TAG)。例如参见Sayers,J.R.等人,(1988),5′-3′Exonucleasein phosphorothioate-basedoligonucleotide-directedmutagenesis.NucleicAcidsRes, 16:791-802。当O-RS、O-tRNA和编码所关注多肽的核酸在活体内组合时,响应 UAG密码子而并入非天然氨基酸以得到在指定位置处含有非天然氨基酸的多肽。
活体内并入非天然氨基酸可在不显著干扰真核宿主细胞的情况下进行。举例 来说,因为对于UAG密码子的抑制效率取决于O-tRNA(包括(但不限于)琥珀 抑制因子tRNA)与真核释放因子(包含但不限于eRF)(其与终止密码子结合并 起始核糖体释放正在生长的肽)之间的竞争,所以可通过(包括(但不限于))增 加O-tRNA和/或抑制因子tRNA的表达水平来调节抑制效率。
也可利用稀有密码子来编码非天然氨基酸。举例来说,当活体外蛋白质合成 反应中的精氨酸浓度降低时,已证明稀有精氨酸密码子AGG有效用于通过经丙 氨酸酰化的合成tRNA插入Ala。例如参见Ma等人,Biochemistry,32:7939(1993)。 在这种情况下,合成tRNA与在大肠杆菌中作为次要物质存在的天然存在tRNA Arg竞争。一些生物体不使用所有三联体密码子。已利用藤黄微球菌(Micrococcus luteus)中的未指定密码子AGA在活体外转录/翻译提取物中插入氨基酸。例如参 见Kowal和Oliver,Nucl.Acid.Res.,25:4685(1997)。可产生本发明的组分以在活 体内使用这些稀有密码子。
选择密码子还包含延长密码子,其包括(但不限于)四个或四个以上碱基的 密码子,例如四个、五个、六个或六个以上碱基的密码子。四碱基密码子的实例 包括(但不限于)AGGA、CUAG、UAGA、CCCU等。五碱基密码子的实例包括 (但不限于)AGGAC、CCCCU、CCCUC、CUAGA、CUACU、UAGGC等。本发 明的特征包括使用基于移码抑制(frameshiftsuppression)的延长密码子。四个或 四个以上碱基的密码子可将(包括(但不限于))一个或多个非天然氨基酸插入同 一蛋白质中。举例来说,在存在具有反密码子环(例如具有至少8-10nt的反密码 子环)的突变O-tRNA(包括(但不限于)特定移码抑制因子tRNA)的情况下, 将四个或四个以上碱基的密码子读作单一氨基酸。在其它实施例中,反密码子环 可解码(包括(但不限于))至少一个四碱基密码子、至少一个五碱基密码子或至 少一个六碱基密码子或更多碱基的密码子。因为存在256种可能的四碱基密码子, 所以可使用四个或四个以上碱基的密码子在同一细胞中编码多个非天然氨基酸。 参见Anderson等人,(2002)ExploringtheLimitsofCodonandAnticodonSize, ChemistryandBiology,9:237-244;Magliery,(2001)ExpandingtheGeneticCode: SelectionofEfficientSuppressorsofFour-baseCodonsandIdentificationof″Shifty″ Four-baseCodonswithaLibraryApproachinEscherichiacoli,J.Mol.Biol.307: 755-769。
举例来说,使用活体外生物合成方法,已经用四碱基密码子将非天然氨基酸 并入蛋白质中。例如参见Ma等人,(1993)Biochemistry,32:7939;以及Hohsaka等 人,(1999)J.Am.Chem.Soc.121:34。使用CGGG和AGGU,从而在活体外利用两 个化学酰化的移码抑制因子tRNA将2-萘基丙氨酸和赖氨酸的NBD衍生物同时并 入抗生蛋白链菌素中。例如参见Hohsaka等人,(1999)J.Am.Chem.Soc, 121:12194。在活体内研究中,Moore等人研究具有NCUA反密码子的tRNALeu 衍生物抑制UAGN密码子(N可为U、A、G或C)的能力,并且发现四联体UAGA 可由具有UCUA反密码子的tRNALeu以13%到26%的效率解码,其中在0或-1 框架中极少解码。参见Moore等人,(2000)J.Mol.Biol.,298:195。在一实施例中, 可在本发明中使用基于稀有密码子或无义密码子的延长密码子,其可减少在其它 不合需要的位点处的错义通读和移码抑制。
对于给定系统来说,选择密码子也可包括一个天然三碱基密码子,其中内源 系统不使用(或很少使用)天然碱基密码子。举例来说,这包括缺乏识别天然三 碱基密码子的tRNA的系统和/或三碱基密码子为稀有密码子的系统。
选择密码子任选地包括非天然碱基对。这些非天然碱基对进一步扩展现有遗 传代码。一个额外的碱基对使三联体密码子的数目从64增加到125。第三碱基对 的性质包括稳定且具有选择性的碱基配对、通过聚合酶以高保真性有效地酶促并 入DNA中以及在合成新的非天然碱基对之后有效的持续引物延伸。可适于方法 和组合物的非天然碱基对的描述包括例如Hirao等人,(2002)Anunnaturalbase pairforincorporatingaminoacidanaloguesintoprotein,NatureBiotechnology, 20:177-182。还参见Wu,Y.等人,(2002)J.Am.Chem.Soc.124:14626-14630。其它 相关公开案列于下文中。
对于活体内使用来说,非天然核苷是膜可渗透的并且经磷酸化以形成相应的 三磷酸盐。另外,增加的遗传信息稳定并且不受细胞酶破坏。Benner等人先前的 工作利用与规范沃森-克里克(Watson-Crick)配对不同的氢键结模式,其中最值 得注意的实例为iso-C:iso-G配对。例如参见Switzer等人,(1989)J.Am.Chem.Soc111:8322;以及Piccirilli等人,(1990)Nature,343:33;Kool,(2000)Curr.Opin.Chem.Biol.,4:602。这些碱基通常在一定程度上与天然碱基错配且不能酶促复制。Kool 和同事证实碱基之间的疏水性堆积相互作用可代替氢键结来驱动碱基对的形成。 参见Kool,(2000)Curr.Opin.Chem.Biol.,4:602;以及Guckian和Kool,(1998) Angew.Chem.Int.Ed.Engl.,36,2825。在致力于开发满足所有上述要求的非天然 碱基对的过程中,Schultz、Romesberg和同事已系统地合成并研究了一系列非天 然疏水性碱基。发现PICS:PICS自身配对比天然碱基对稳定,并可通过大肠杆菌 DNA聚合酶I的克列诺片段(Klenowfragment,KF)有效地并入DNA中。例如 参见McMinn等人,(1999)J.Am.Chem.Soc,121:11585-6;以及Ogawa等人,(2000) J.Am.Chem.Soc,122:3274。可通过KF以足以用于生物功能的效率和选择性合成 3MN:3MN自身配对。例如参见Ogawa等人,(2000)J.Am.Chem.Soc,122:8803。 然而,这两种碱基都充当用于进一步复制的链终止子。突变DNA聚合酶近来已 得到发展,其可用于复制PICS自身配对。另外,也可复制7AI自身配对。例如 参见Tae等人,(2001)J.Am.Chem.Soc,123:7439。也已开发新颖金属碱基对 Dipic:Py,其在结合Cu(II)后形成稳定配对。参见Meggers等人,(2000)J.Am.Chem. Soc,122:10714。因为延长密码子和非天然密码子固有地与天然密码子正交,所以 本发明的方法可利用这一性质来产生正交tRNA以供其使用。
也可使用翻译旁路系统(translationalbypassingsystem)将非天然氨基酸并入 所需多肽中。在翻译旁路系统中,将大序列并入基因中,但并未将其翻译成蛋白 质。所述序列含有充当诱导核糖体跳过所述序列并在插入下游重新开始翻译的提 示的结构。
在某些实施例中,在本发明的方法和/或组合物中的所关注的蛋白质或多肽 (或其部分)是由核酸编码。通常,核酸包含至少一个选择密码子、至少两个选择 密码子、至少三个选择密码子、至少四个选择密码子、至少五个选择密码子、至 少六个选择密码子、至少七个选择密码子、至少八个选择密码子、至少九个选择 密码子、十个或十个以上选择密码子。
可使用所属领域的技术人员已知并且在本文中描述的方法来诱变所关注的蛋 白质或多肽的编码基因,从而使其包括例如一个或一个以上选择密码子以并入非 天然氨基酸。举例来说,诱变所关注蛋白质的核酸以使其包括一个或一个以上选 择密码子,从而提供一个或一个以上非天然氨基酸的并入。本发明包括例如包括 至少一个非天然氨基酸的任何蛋白的任何这种变异体(包括(但不限于)突变体) 形式。类似地,本发明还包括相应核酸,即具有一个或一个以上编码一个或一个 以上非天然氨基酸的选择密码子的任何核酸。
可容易地使编码所关注蛋白质(例如胰岛素多肽)的核酸分子突变以在多肽 的任何所需位置处引入半胱氨酸。半胱氨酸广泛用于将反应性分子、水溶性聚合 物、蛋白质或多种其它分子引入所关注蛋白质上。所属领域的技术人员已知适于 将半胱氨酸并入多肽的所需位置中的方法,例如美国专利第6,608,183号(其是以 引用的方式并入本文中)中所述的方法,以及标准诱变技术。
非天然编码氨基酸
多种非天然编码氨基酸适用于本发明中。可将任何数目的非天然编码氨基酸 引入胰岛素多肽中。一般来说,引入的非天然编码氨基酸实质上对20种常见的遗 传编码氨基酸(即丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、 谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、蛋氨酸、苯丙氨酸、脯 氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸)呈化学惰性。在一些实施例 中,非天然编码氨基酸包括与20种常见氨基酸中不存在的官能团(包括(但不限 于)叠氮基、酮基、醛基以及氨氧基)有效并选择性地反应形成稳定结合物的侧 链官能团。举例来说,包括含有叠氮基官能团的非天然编码氨基酸的胰岛素多肽 可与聚合物(包括(但不限于)聚(乙二醇))或者含有炔部分的第二多肽反应, 以形成由于叠氮基与炔官能团选择性反应形成休斯根[3+2]环加成产物而引起的 稳定结合物。
α-氨基酸的一般结构说明如下(式I):
非天然编码氨基酸通常为具有以上所列结构式(其中R基团为除用于20种 天然氨基酸中的取代基之外的任何取代基)的任何结构,并且可适用于本发明中。 因为本发明的非天然编码氨基酸通常仅关于侧链结构与天然氨基酸存在不同,所 以非天然编码氨基酸以与天然存在多肽中形成酰胺键相同的方式与其它氨基酸 (包括(但不限于)天然或非天然编码氨基酸)形成酰胺键。
然而,非天然编码氨基酸具有使其区别于天然氨基酸的侧链基团。举例来说, R任选地包含烷基-、芳基-、酰基-、酮基-、叠氮基-、羟基-、肼、氰基-、卤基-、 酰肼、烯基、炔基、醚、硫醇、硒基-、磺酰基-、硼酸酯基(borate)、硼酸酯基 (boronate)、磷酸基、膦酰基、膦、杂环基、烯酮、亚胺、醛、酯、硫代酸、羟胺、 氨基等或其任何组合。所关注的可适用于本发明中的其它非天然存在氨基酸包括 (但不限于)包含可光活化交联剂的氨基酸、自旋标记的氨基酸、荧光氨基酸、结 合金属的氨基酸、含金属的氨基酸、放射性氨基酸、具有新颖官能团的氨基酸、 与其它分子共价或非共价相互作用的氨基酸、光笼化和/或可光致异构化的氨基 酸、包含生物素或生物素类似物的氨基酸、糖基化氨基酸(例如糖取代丝氨酸)、 其它碳水化合物修饰的氨基酸、含酮基的氨基酸、包含聚乙二醇或聚醚的氨基酸、 经重原子取代的氨基酸、可化学裂解和/或可光裂解的氨基酸、与天然氨基酸相比 具有延长侧链(包括(但不限于)聚醚或长链烃,包括(但不限于)约5个以上 或约10个以上碳)的氨基酸、含碳连接的糖的氨基酸、氧化还原活性氨基酸、含 氨基硫代酸的氨基酸以及包含一个或一个以上毒性部分的氨基酸。
可适用于本发明中并且适用于与水溶性聚合物反应的示范性非天然编码氨基 酸包括(但不限于)具有羰基、氨氧基、肼、酰肼、氨基脲、叠氮化物以及炔反 应性基团的非天然编码氨基酸。在一些实施例中,非天然编码氨基酸包含糖部分。 所述氨基酸的实例包括N-乙酰基-L-葡糖胺基-L-丝氨酸、N-乙酰基-L-半乳糖胺基 -L-丝氨酸、N-乙酰基-L-葡糖胺基-L-苏氨酸、N-乙酰基-L-葡糖胺基-L-天冬酰胺和 O-甘露糖胺基-L-丝氨酸。这些氨基酸的实例还包括氨基酸与糖之间的天然存在 N-或O-连接是由自然界中通常不存在的共价键(包括(但不限于)烯烃、肟、硫 醚、酰胺等)置换的实例。这些氨基酸的实例还包括天然存在蛋白质中通常不存 在的糖,例如2-脱氧-葡萄糖、2-脱氧半乳糖等。
本文中提供的多种非天然编码氨基酸可购自例如Sigma-Aldrich(St.Louis, MO,USA)、Novabiochem(EMDBiosciences的分公司,Darmstadt,Germany)或 Peptech(Burlington,MA,USA)。不可购得的非天然编码氨基酸是任选地如本文 中所提供而合成,或使用所属领域的技术人员已知的标准方法合成。关于有机合 成技术,例如参见Fessendon和Fessendon,OrganicChemistry,(1982,第2版, WillardGrantPress,BostonMass.);March,AdvancedOrganicChemistry(第3版, 1985,WileyandSons,NewYork);以及Carey和Sundberg,AdvancedOrganicChemistry(第3版,A和B部分,1990,PlenumPress,NewYork)。还参见美国专利 第7,045,337号和第7,083,970号,其是以引用的方式并入本文中。除含有新颖侧 链的非天然氨基酸之外,可适用于本发明中的非天然氨基酸也任选地包含经修饰 的主链结构,包括(但不限于)如式II和III的结构所说明的结构:
其中Z通常包含OH、NH2、SH、NH-R′或S-R′;X和Y可相同或不同,通常 包含S或O;并且R和R′任选地相同或不同,通常选自上文对于具有式I的非天 然氨基酸所述的R基团的组成部分的相同清单以及氢。举例来说,本发明的非天 然氨基酸任选地包含如式II和III所说明的氨基或羧基中的取代。这种类型的非 天然氨基酸包括(但不限于)α-羟基酸、α-硫代酸、α-氨基硫代羧酸盐,包括 (但不限于)具有对应于20种常见天然氨基酸的侧链或非天然侧链的非天然氨基 酸。另外,在α-碳上的取代任选地包括(但不限于)L、D或α-α-二取代氨基酸, 例如D-谷氨酸、D-丙氨酸、D-甲基-O-酪氨酸、氨基丁酸等。其它结构替代物包 括环状氨基酸,例如脯氨酸类似物以及3、4、6、7、8和9元环脯氨酸类似物; β和γ氨基酸,例如经取代β-丙氨酸和γ-氨基丁酸。
多种非天然氨基酸是基于例如酪氨酸、谷氨酰胺、苯丙氨酸等天然氨基酸并 且适用于本发明中。酪氨酸类似物包括(但不限于)对位取代的酪氨酸、邻位取 代的酪氨酸以及间位取代的酪氨酸,其中经取代酪氨酸包含(包括(但不限于)) 酮基(包括(但不限于)乙酰基)、苯甲酰基、氨基、肼、羟胺、硫醇基、羧基、 异丙基、甲基、C6-C20直链或分支链烃、饱和或不饱和烃、O-甲基、聚醚基团、 硝基、炔基等。另外,也涵盖多取代芳环。可适用于本发明中的谷氨酰胺类似物 包括(但不限于)a-羟基衍生物、g-取代衍生物、环状衍生物以及酰胺取代的谷 氨酰胺衍生物。可适用于本发明中的示范性苯丙氨酸类似物包括(但不限于)对 位取代的苯丙氨酸、邻位取代的苯丙氨酸和间位取代的苯丙氨酸,其中取代基包 含(包括(但不限于))羟基、甲氧基、甲基、烯丙基、醛、叠氮基、碘基、溴基、 酮基(包括(但不限于)乙酰基)、苯甲酰基、炔基等。可适用于本发明中的非天 然氨基酸的特定实例包括(但不限于)对乙酰基-L-苯丙氨酸、O-甲基-L-酪氨酸、 L-3-(2-萘基)丙氨酸、3-甲基-苯丙氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、 三-O-乙酰基-GlcNAcβ-丝氨酸、L-多巴(L-Dopa)、氟化苯丙氨酸、异丙基-L-苯 丙氨酸、对叠氮基-L-苯丙氨酸、对酰基-L-苯丙氨酸、对苯甲酰基-L-苯丙氨酸、 L-磷酸丝氨酸、膦酰基丝氨酸、膦酰基酪氨酸、对碘苯丙氨酸、对溴苯丙氨酸、 对氨基-L-苯丙氨酸、异丙基-L-苯丙氨酸以及对炔丙基氧基-苯丙氨酸等。可适用 于本发明中的多种非天然氨基酸的结构的实例是提供于例如标题为“Invivo incorporationofunnaturalaminoacids”的WO2002/085923中。关于其它蛋氨酸类 似物,还参见Kiick等人,(2002)Incorporationofazidesintorecombinantproteinsfor chemoselectivemodificationbytheStaudingerligation,PNAS99:19-24,其是以引用 的方式并入本文中。标题为“CompositionsContaining,MethodsInvolving,andUses ofNon-naturalAminoAcidsandPolypeptides”的国际申请案第PCT/US06/47822号 (其以引用的方式并入本文中)描述芳香族胺部分(包括(但不限于)对氨基苯丙 氨酸)的还原性烷基化,和还原性胺化。
在一实施例中,提供包括非天然氨基酸(例如对(炔丙基氧基)-苯丙氨酸)的 胰岛素多肽的组合物。还提供包含对(炔丙基氧基)-苯丙氨酸和(包括(但不限于)) 蛋白质和/或细胞的各种组合物。一方面,包括对(炔丙基氧基)-苯丙氨酸非天然氨 基酸的组合物进一步包括正交tRNA。非天然氨基酸可与正交tRNA键结(包括(但 不限于)共价键结),其包括(但不限于)通过氨酰基键与正交tRNA共价键结、 与正交tRNA的末端核糖的3′OH或2′OH共价键结等。
可借助于非天然氨基酸并入蛋白质中的化学部分提供蛋白质的多种优点和操 纵性。举例来说,酮基官能团的独特反应性允许利用多种含肼或含羟胺试剂中的 任一者在活体外以及活体内选择性修饰蛋白质。举例来说,重原子非天然氨基酸 可适用于定相X射线结构数据。使用非天然氨基酸进行重原子的位点特异性引入 还为选择重原子的位置提供选择性和灵活性。举例来说,光反应性非天然氨基酸 (包括(但不限于)具有二苯甲酮和芳基叠氮化物(包括(但不限于)叠氮基苯) 侧链的氨基酸)允许蛋白质的活体内和活体外有效光交联。光反应性非天然氨基 酸的实例包括(但不限于)对叠氮基-苯丙氨酸以及对苯甲酰基-苯丙氨酸。随后, 可通过激发光反应性基团(提供时间控制)使具有光反应性非天然氨基酸的蛋白 质随意交联。在一实例中,(包括(但不限于))在使用核磁共振以及振动光谱的 情况下,可由作为局部结构和动力学的探针的经同位素标记的(包括(但不限于)) 甲基取代非天然氨基酸的甲基。举例来说,炔基或叠氮基官能团允许利用分子通 过[3+2]环加成反应选择性修饰蛋白质。
并入多肽的氨基端的非天然氨基酸可由R基团(其为除用于20种天然氨基 酸中的取代基之外的任何取代基)和不同于α-氨基酸(参见式I)中通常存在的 NH2基团的第二反应性基团构成。类似的非天然氨基酸可在羧基端并入不同于α -氨基酸(参见式I)中通常存在的COOH基团的第二反应性基团。
可选择或设计本发明的非天然氨基酸以提供20种天然氨基酸中不可获得的 其它特性。举例来说,可任选地设计或选择非天然氨基酸以改良例如并有所述非 天然氨基酸的蛋白质的生物性质。举例来说,可任选地通过在蛋白质中包括非天 然氨基酸来改变以下性质:毒性、生物分布(biodistribution)、溶解性、稳定性(例 如热稳定性、水解稳定性、氧化稳定性、酶促降解抗性等)、纯化和加工便利性、 结构性质、光谱性质、化学和/或光化学性质、催化活性、氧化还原电位、半衰期、 与其它分子例如共价或非共价反应的能力等。
非天然氨基酸的结构与合成:羰基、羰基样基团、经掩蔽羰基、经保护羰基 和羟胺基
在一些实施例中,本发明提供通过肟键与例如PEG等水溶性聚合物连接的胰 岛素。
多种类型的非天然编码氨基酸适用于形成肟键。这些氨基酸包括(但不限于) 含有羰基、二羰基或羟胺基的非天然编码氨基酸。此类氨基酸是描述于美国专利 公开案第2006/0194256号、第2006/0217532号和第2006/0217289号以及标题为 “Compositionscontaining,methodsinvolving,andusesofnon-naturalaminoacids andpolypeptides”的WO2006/069246中,所述文献是以全文引用的方式并入本文 中。非天然编码氨基酸也描述于美国专利第7,083,970号和美国专利第7,045,337 号中,所述文献是以全文引用的方式并入本文中。
本发明的一些实施例利用在一个或一个以上位置处经对乙酰基苯丙氨酸氨基 酸取代的胰岛素多肽。对乙酰基-(+/-)-苯丙氨酸和间乙酰基-(+/-)-苯丙氨酸的合成 描述于Zhang,Z.等人,Biochemistry42:6735-6746(2003)中,所述文献是以引用的 方式并入本文中。所属领域的技术人员可类似地制备其它含羰基或含二羰基的氨 基酸。此外,本文中所包括的非天然氨基酸的非限制性示范性合成呈现于美国专 利第7,083,970号的图4、24-34和36-39中,所述专利是以全文引用的方式并入 本文中。
具有亲电子反应性基团的氨基酸允许多种通过亲核加成反应连接分子的反 应。所述亲电子反应性基团包括羰基(包括酮基和二羰基)、羰基样基团(其具有 类似于羰基(包括酮基和二羰基)的反应性并且在结构上与羰基类似)、经掩蔽羰 基(其可容易地转化为羰基(包括酮基和二羰基)),或经保护羰基(其在脱除保 护基后具有与羰基(包括酮基和二羰基)类似的反应性)。所述氨基酸包括具有式 (IV)结构的氨基酸:
其中:
A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚环烷 基、经取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳亚杂 烷基、经取代亚杂烷基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、经 取代亚芳基、亚杂芳基、经取代亚杂芳基、亚烷芳基、经取代亚烷芳基、亚芳烷 基或经取代亚芳烷基;
B是任选的,并且当存在时为选自由以下各基团组成的群组的连接子:低碳 亚烷基、经取代低碳亚烷基、低碳亚烯基、经取代低碳亚烯基、低碳亚杂烷基、 经取代低碳亚杂烷基、-O-、-O-(亚烷基或经取代亚烷基)-、-S-、-S-(亚烷基或经 取代亚烷基)-、-S(O)k-(其中k为1、2或3)、-S(O)k(亚烷基或经取代亚烷基)-、 -C(O)-、-C(O)-(亚烷基或经取代亚烷基)-、-C(S)-、-C(S)-(亚烷基或经取代亚烷基)-、 -N(R′)-、-NR′-(亚烷基或经取代亚烷基)-、-C(O)N(R′)-、-CON(R′)-(亚烷基或经取 代亚烷基)-、-CSN(R′)-、-CSN(R′)-(亚烷基或经取代亚烷基)-、-N(R′)CO-(亚烷基 或经取代亚烷基)-、-N(R′)C(O)O-、-S(O)kN(R′)-、-N(R′)C(O)N(R′)-、 -N(R′)C(S)N(R′)-、-N(R′)S(O)kN(R′)-、-N(R′)-N=、-C(R′)=N-、-C(R′)=N-N(R′)-、 -C(R′)=N-N=、-C(R′)2-N=N-和-C(R′)2-N(R′)-N(R′)-,其中R′各独立地为H、烷基或 经取代烷基;
R为H、烷基、经取代烷基、环烷基或经取代环烷基;
R″各独立地为H、烷基、经取代烷基或保护基,或当存在一个以上R″基团时, 两个R″任选地形成杂环烷基;
R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核 苷酸;并且
R2是任选的,并且当存在时为OH、酯保护基、树脂、氨基酸、多肽或多核 苷酸;
R3和R4各独立地为H、卤素、低碳烷基或经取代低碳烷基,或R3和R4或两 个R3基团任选地形成环烷基或杂环烷基;
或-A-B-J-R基团合起来形成包含至少一个羰基(包括二羰基)、经保护羰基(包 括经保护二羰基)或经掩蔽羰基(包括经掩蔽二羰基)的双环或三环环烷基或杂 环烷基;
或-J-R基团合起来形成包含至少一个羰基(包括二羰基)、经保护羰基(包括 经保护二羰基)或经掩蔽羰基(包括经掩蔽二羰基)的单环或双环环烷基或杂环 烷基;
条件是当A为亚苯基并且R3各为H时,B存在;并且当A为-(CH2)4-并且 R3各为H时,B不为-NHC(O)(CH2CH2)-;并且当A与B都不存在并且R3各为H 时,R不为甲基。
另外,包括具有式(V)结构的氨基酸:
其中:
A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚环烷 基、经取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳亚杂 烷基、经取代亚杂烷基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、经 取代亚芳基、亚杂芳基、经取代亚杂芳基、亚烷芳基、经取代亚烷芳基、亚芳烷 基或经取代亚芳烷基;
B是任选的,并且当存在时为选自由以下各基团组成的群组的连接子:低碳 亚烷基、经取代低碳亚烷基、低碳亚烯基、经取代低碳亚烯基、低碳亚杂烷基、 经取代低碳亚杂烷基、-O-、-O-(亚烷基或经取代亚烷基)-、-S-、-S-(亚烷基或经 取代亚烷基)-、-S(O)k-(其中k为1、2或3)、-S(O)k(亚烷基或经取代亚烷基)-、 -C(O)-、-C(O)-(亚烷基或经取代亚烷基)-、-C(S)-、-C(S)-(亚烷基或经取代亚烷基)-、 -N(R′)-、-NR′-(亚烷基或经取代亚烷基)-、-C(O)N(R′)-、-CON(R′)-(亚烷基或经取 代亚烷基)-、-CSN(R′)-、-CSN(R′)-(亚烷基或经取代亚烷基)-、-N(R′)CO-(亚烷基 或经取代亚烷基)-、-N(R′)C(O)O-、-S(O)kN(R′)-、-N(R′)C(O)N(R′)-、 -N(R′)C(S)N(R′)-、-N(R′)S(O)kN(R′)-、-N(R′)-N=、-C(R′)=N-、-C(R′)=N-N(R′)-、 -C(R′)=N-N=、-C(R′)2-N=N-和-C(R′)2-N(R′)-N(R′)-,其中R′各独立地为H、烷基或 经取代烷基;
R为H、烷基、经取代烷基、环烷基或经取代环烷基;
R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核 苷酸;并且
R2是任选的,并且当存在时为OH、酯保护基、树脂、氨基酸、多肽或多核 苷酸;
条件是当A为亚苯基时,B存在;并且当A为-(CH2)4-时,B不为 -NHC(O)(CH2CH2)-;并且当A与B都不存在时,R不为甲基。
另外,包括具有式(VI)结构的氨基酸:
其中:
B是选自由以下各基团组成的群组的连接子:低碳亚烷基、经取代低碳亚烷 基、低碳亚烯基、经取代低碳亚烯基、低碳亚杂烷基、经取代低碳亚杂烷基、-O-、 -O-(亚烷基或经取代亚烷基)-、-S-、-S-(亚烷基或经取代亚烷基)-、-S(O)k-(其中 k为1、2或3)、-S(O)k(亚烷基或经取代亚烷基)-、-C(O)-、-C(O)-(亚烷基或经取 代亚烷基)-、-C(S)-、-C(S)-(亚烷基或经取代亚烷基)-、-N(R′)-、-NR′-(亚烷基或经 取代亚烷基)-、-C(O)N(R′)-、-CON(R′)-(亚烷基或经取代亚烷基)-、-CSN(R′)-、 -CSN(R′)-(亚烷基或经取代亚烷基)-、-N(R′)CO-(亚烷基或经取代亚烷基)-、 -N(R′)C(O)O-、-S(O)kN(R′)-、-N(R′)C(O)N(R′)-、-N(R′)C(S)N(R′)-、 -N(R′)S(O)kN(R′)-、-N(R′)-N=、-C(R′)=N-、-C(R′)=N-N(R′)-、-C(R′)=N-N=、 -C(R′)2-N=N-和-C(R′)2-N(R′)-N(R′)-,其中R′各独立地为H、烷基或经取代烷基;
R为H、烷基、经取代烷基、环烷基或经取代环烷基;
R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核 苷酸;并且
R2是任选的,并且当存在时为OH、酯保护基、树脂、氨基酸、多肽或多核 苷酸;
Ra是各独立地选自由H、卤素、烷基、经取代烷基、-N(R′)2、-C(O)kR′(其中 k为1、2或3)、-C(O)N(R′)2、-OR′和-S(O)kR′组成的群组,其中R′各独立地为H、 烷基或经取代烷基。
另外,包括以下氨基酸:
其中所述化合物任选地氨基经保护、羧基经保护,或为其盐。另外,以下非天然氨基酸中的任一者都可并入非天然氨基酸多肽中。
另外,包括以下具有式(VII)结构的氨基酸:
其中
B是任选的,并且当存在时为选自由以下各基团组成的群组的连接子:低碳 亚烷基、经取代低碳亚烷基、低碳亚烯基、经取代低碳亚烯基、低碳亚杂烷基、 经取代低碳亚杂烷基、-O-、-O-(亚烷基或经取代亚烷基)-、-S-、-S-(亚烷基或经 取代亚烷基)-、-S(O)k-(其中k为1、2或3)、-S(O)k(亚烷基或经取代亚烷基)-、 -C(O)-、-C(O)-(亚烷基或经取代亚烷基)-、-C(S)-、-C(S)-(亚烷基或经取代亚烷基)-、 -N(R′)-、-NR′-(亚烷基或经取代亚烷基)-、-C(O)N(R′)-、-CON(R′)-(亚烷基或经取 代亚烷基)-、-CSN(R′)-、-CSN(R′)-(亚烷基或经取代亚烷基)-、-N(R′)CO-(亚烷基 或经取代亚烷基)-、-N(R′)C(O)O-、-S(O)kN(R′)-、-N(R′)C(O)N(R′)-、 -N(R′)C(S)N(R′)-、-N(R′)S(O)kN(R′)-、-N(R′)-N=、-C(R′)=N-、-C(R′)=N-N(R′)-、 -C(R′)=N-N=、-C(R′)2-N=N-和-C(R′)2-N(R′)-N(R′)-,其中R′各独立地为H、烷基或 经取代烷基;
R为H、烷基、经取代烷基、环烷基或经取代环烷基;
R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核 苷酸;并且
R2是任选的,并且当存在时为OH、酯保护基、树脂、氨基酸、多肽或多核 苷酸;
Ra各独立地选自由H、卤素、烷基、经取代烷基、-N(R′)2、-C(O)kR′(其中k 为1、2或3)、-C(O)N(R′)2、-OR′和-S(O)kR′组成的群组,其中R′各独立地为H、 烷基或经取代烷基;并且n为0到8;
条件是当A为-(CH2)4-时,B不为-NHC(O)(CH2CH2)-。
另外,包括以下氨基酸:
其中所述化合物任选地氨基经保护、任选地羧基经保护、任选地氨基经保护并且羧基也经保护,或为其盐。另外,这些非天然氨基酸以及以下非天然氨基酸中的任一者都可并入非天然氨基酸多肽中。
另外,包括以下具有式(VIII)结构的氨基酸:
其中A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚 环烷基、经取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳 亚杂烷基、经取代亚杂烷基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、 经取代亚芳基、亚杂芳基、经取代亚杂芳基、亚烷芳基、经取代亚烷芳基、亚芳 烷基或经取代亚芳烷基;
B是任选的,并且当存在时为选自由以下各基团组成的群组的连接子:低碳 亚烷基、经取代低碳亚烷基、低碳亚烯基、经取代低碳亚烯基、低碳亚杂烷基、 经取代低碳亚杂烷基、-O-、-O-(亚烷基或经取代亚烷基)-、-S-、-S-(亚烷基或经 取代亚烷基)-、-S(O)k-(其中k为1、2或3)、-S(O)k(亚烷基或经取代亚烷基)-、 -C(O)-、-C(O)-(亚烷基或经取代亚烷基)-、-C(S)-、-C(S)-(亚烷基或经取代亚烷基)-、 -N(R′)-、-NR′-(亚烷基或经取代亚烷基)-、-C(O)N(R′)-、-CON(R′)-(亚烷基或经取 代亚烷基)-、-CSN(R′)-、-CSN(R′)-(亚烷基或经取代亚烷基)-、-N(R′)CO-(亚烷基 或经取代亚烷基)-、-N(R′)C(O)O-、-S(O)kN(R′)-、-N(R′)C(O)N(R′)-、 -N(R′)C(S)N(R′)-、-N(R′)S(O)kN(R′)-、-N(R′)-N=、-C(R′)=N-、-C(R′)=N-N(R′)-、 -C(R′)=N-N=、-C(R′)2-N=N-和-C(R′)2-N(R′)-N(R′)-,其中R′各独立地为H、烷基或 经取代烷基;
R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核 苷酸;并且
R2是任选的,并且当存在时为OH、酯保护基、树脂、氨基酸、多肽或多核 苷酸。
另外,包括以下具有式(IX)结构的氨基酸:
B是任选的,并且当存在时为选自由以下各基团组成的群组的连接子:低碳 亚烷基、经取代低碳亚烷基、低碳亚烯基、经取代低碳亚烯基、低碳亚杂烷基、 经取代低碳亚杂烷基、-O-、-O-(亚烷基或经取代亚烷基)-、-S-、-S-(亚烷基或经 取代亚烷基)-、-S(O)k-(其中k为1、2或3)、-S(O)k(亚烷基或经取代亚烷基)-、 -C(O)-、-C(O)-(亚烷基或经取代亚烷基)-、-C(S)-、-C(S)-(亚烷基或经取代亚烷基)-、 -N(R′)-、-NR′-(亚烷基或经取代亚烷基)-、-C(O)N(R′)-、-CON(R′)-(亚烷基或经取 代亚烷基)-、-CSN(R′)-、-CSN(R′)-(亚烷基或经取代亚烷基)-、-N(R′)CO-(亚烷基 或经取代亚烷基)-、-N(R′)C(O)O-、-S(O)kN(R′)-、-N(R′)C(O)N(R′)-、 -N(R′)C(S)N(R′)-、-N(R′)S(O)kN(R′)-、-N(R′)-N=、-C(R′)=N-、-C(R′)=N-N(R′)-、 -C(R′)=N-N=、-C(R′)2-N=N-和-C(R′)2-N(R′)-N(R′)-,其中R′各独立地为H、烷基或 经取代烷基;
R为H、烷基、经取代烷基、环烷基或经取代环烷基;
R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核 苷酸;并且
R2是任选的,并且当存在时为OH、酯保护基、树脂、氨基酸、多肽或多核 苷酸;
其中Ra各独立地选自由H、卤素、烷基、经取代烷基、-N(R′)2、-C(O)kR′(其 中k为1、2或3)、-C(O)N(R′)2、-OR′和-S(O)kR′组成的群组,其中R′各独立地为 H、烷基或经取代烷基。
另外,包括以下氨基酸:
其中所述化合物任选地氨基经保护、任选地羧基经保护、任选地氨基经保护并且羧基也经保护,或为其盐。另外,这些非天然氨基酸以及以下非天然氨基酸中的任一者都可并入非天然氨基酸多肽中。
另外,包括以下具有式(X)结构的氨基酸:
其中B是任选的,并且当存在时为选自由以下各基团组成的群组的连接子: 低碳亚烷基、经取代低碳亚烷基、低碳亚烯基、经取代低碳亚烯基、低碳亚杂烷 基、经取代低碳亚杂烷基、-O-、-O-(亚烷基或经取代亚烷基)-、-S-、-S-(亚烷基 或经取代亚烷基)-、-S(O)k-(其中k为1、2或3)、-S(O)k(亚烷基或经取代亚烷基)-、 -C(O)-、-C(O)-(亚烷基或经取代亚烷基)-、-C(S)-、-C(S)-(亚烷基或经取代亚烷基)-、 -N(R′)-、-NR′-(亚烷基或经取代亚烷基)-、-C(O)N(R′)-、-CON(R′)-(亚烷基或经取 代亚烷基)-、-CSN(R′)-、-CSN(R′)-(亚烷基或经取代亚烷基)-、-N(R′)CO-(亚烷基 或经取代亚烷基)-、-N(R′)C(O)O-、-S(O)kN(R′)-、-N(R′)C(O)N(R′)-、 -N(R′)C(S)N(R′)-、-N(R′)S(O)kN(R′)-、-N(R′)-N=、-C(R′)=N-、-C(R′)=N-N(R′)-、 -C(R′)=N-N=、-C(R′)2-N=N-和-C(R′)2-N(R′)-N(R′)-,其中R′各独立地为H、烷基或 经取代烷基;
R为H、烷基、经取代烷基、环烷基或经取代环烷基;
R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核 苷酸;并且
R2是任选的,并且当存在时为OH、酯保护基、树脂、氨基酸、多肽或多核 苷酸;
Ra各独立地选自由H、卤素、烷基、经取代烷基、-N(R′)2、-C(O)kR′(其中 k为1、2或3)、-C(O)N(R′)2、-OR′和-S(O)kR′组成的群组,其中R′各独立地为H、 烷基或经取代烷基;并且n为0到8。
另外,包括以下氨基酸:
其中所述化合物任选地氨基经保护、任选地羧基经保护、任选地氨基经保护并且羧基也经保护,或为其盐。另外,这些非天然氨基酸以及以下非天然氨基酸中的任一者都可并入非天然氨基酸多肽中。
除单羰基结构之外,本文中所述的非天然氨基酸也可包括例如二羰基、二羰 基样基团、经掩蔽二羰基和经保护二羰基等基团。
举例来说,包括以下具有式(XI)结构的氨基酸:
其中A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚 环烷基、经取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳 亚杂烷基、经取代亚杂烷基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、 经取代亚芳基、亚杂芳基、经取代亚杂芳基、亚烷芳基、经取代亚烷芳基、亚芳 烷基或经取代亚芳烷基;
B是任选的,并且当存在时为选自由以下各基团组成的群组的连接子:低碳 亚烷基、经取代低碳亚烷基、低碳亚烯基、经取代低碳亚烯基、低碳亚杂烷基、 经取代低碳亚杂烷基、-O-、-O-(亚烷基或经取代亚烷基)-、-S-、-S-(亚烷基或经 取代亚烷基)-、-S(O)k-(其中k为1、2或3)、-S(O)k(亚烷基或经取代亚烷基)-、 C(O)-、C(O)-(亚烷基或经取代亚烷基)-、-C(S)-、C(S)-(亚烷基或经取代亚烷基)-、 -N(R′)-、NR′-(亚烷基或经取代亚烷基)-、C(O)N(R′)-、CON(R′)-(亚烷基或经取代 亚烷基)-、-CSN(R′)-、CSN(R′)-(亚烷基或经取代亚烷基)-、N(R′)CO-(亚烷基或经 取代亚烷基)-、N(R′)C(O)O-、S(O)kN(R′)-、N(R′)C(O)N(R′)-、N(R′)C(S)N(R′)-、 N(R′)S(O)kN(R′)-、N(R′)-N=、-C(R′)=N-、-C(R′)=N-N(R′)-、-C(R′)=N-N=、 C(R′)2-N=N-和-C(R′)2N(R′)N(R′)-,其中R′各独立地为H、烷基或经取代烷基;
R为H、烷基、经取代烷基、环烷基或经取代环烷基;
R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核 苷酸;并且
R2是任选的,并且当存在时为OH、酯保护基、树脂、氨基酸、多肽或多核 苷酸。
另外,包括以下具有式(XII)结构的氨基酸:
B是任选的,并且当存在时为选自由以下各基团组成的群组的连接子:低碳 亚烷基、经取代低碳亚烷基、低碳亚烯基、经取代低碳亚烯基、低碳亚杂烷基、 经取代低碳亚杂烷基、-O-、-O-(亚烷基或经取代亚烷基)-、-S-、-S-(亚烷基或经 取代亚烷基)-、-S(O)k-(其中k为1、2或3)、-S(O)k(亚烷基或经取代亚烷基)-、 -C(O)-、-C(O)-(亚烷基或经取代亚烷基)-、-C(S)-、-C(S)-(亚烷基或经取代亚烷基)-、 -N(R′)-、-NR′-(亚烷基或经取代亚烷基)-、-C(O)N(R′)-、-CON(R′)-(亚烷基或经取 代亚烷基)-、-CSN(R′)-、-CSN(R′)-(亚烷基或经取代亚烷基)-、-N(R′)CO-(亚烷基 或经取代亚烷基)-、-N(R′)C(O)O-、-S(O)kN(R′)-、-N(R′)C(O)N(R′)-、 -N(R′)C(S)N(R′)-、-N(R′)S(O)kN(R′)-、-N(R′)-N=、-C(R′)=N-、-C(R′)=N-N(R′)-、 -C(R′)=N-N=、-C(R′)2-N=N-和-C(R′)2-N(R′)-N(R′)-,其中R′各独立地为H、烷基或 经取代烷基;
R为H、烷基、经取代烷基、环烷基或经取代环烷基;
R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核 苷酸;并且
R2是任选的,并且当存在时为OH、酯保护基、树脂、氨基酸、多肽或多核 苷酸;
其中Ra各独立地选自由H、卤素、烷基、经取代烷基、-N(R′)2、-C(O)kR′ (其中k为1、2或3)、-C(O)N(R′)2、-OR′和-S(O)kR′组成的群组,其中R′各独立 地为H、烷基或经取代烷基。
另外,包括以下氨基酸:
其中所述化合物任选地氨基经保护、任选地羧基经保护、任选地氨基经保护并且羧基也经保护,或为其盐。另外,这些非天然氨基酸以及以下非天然氨基酸中的任一者都可并入非天然氨基酸多肽中。
另外,包括以下具有式(XIII)结构的氨基酸:
其中B是任选的,并且当存在时为选自由以下各基团组成的群组的连接子: 低碳亚烷基、经取代低碳亚烷基、低碳亚烯基、经取代低碳亚烯基、低碳亚杂烷 基、经取代低碳亚杂烷基、-O-、-O-(亚烷基或经取代亚烷基)-、-S-、-S-(亚烷基 或经取代亚烷基)-、-S(O)k-(其中k为1、2或3)、-S(O)k(亚烷基或经取代亚烷基)-、 -C(O)-、-C(O)-(亚烷基或经取代亚烷基)-、-C(S)-、-C(S)-(亚烷基或经取代亚烷基)-、 -N(R′)-、-NR′-(亚烷基或经取代亚烷基)-、-C(O)N(R′)-、-CON(R′)-(亚烷基或经取 代亚烷基)-、-CSN(R′)-、-CSN(R′)-(亚烷基或经取代亚烷基)-、-N(R′)CO-(亚烷基 或经取代亚烷基)-、-N(R′)C(O)O-、-S(O)kN(R′)-、-N(R′)C(O)N(R′)-、 -N(R′)C(S)N(R′)-、-N(R′)S(O)kN(R′)-、-N(R′)-N=、-C(R′)=N-、-C(R′)=N-N(R′)-、 -C(R′)=N-N=、-C(R′)2-N=N-和-C(R′)2-N(R′)-N(R′)-,其中R′各独立地为H、烷基或 经取代烷基;
R为H、烷基、经取代烷基、环烷基或经取代环烷基;
R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核 苷酸;并且
R2是任选的,并且当存在时为OH、酯保护基、树脂、氨基酸、多肽或多核 苷酸;
Ra各独立地选自由H、卤素、烷基、经取代烷基、-N(R′)2、-C(O)kR′(其中k 为1、2或3)、-C(O)N(R′)2、-OR′和-S(O)kR′组成的群组,其中R′各独立地为H、 烷基或经取代烷基;并且n为0到8。
另外,包括以下氨基酸:
其中所述化合物任选地氨基经保护、任选地羧基经保护、任选地氨基经保护并且羧基也经保护,或为其盐。另外,这些非天然氨基酸以及以下非天然氨基酸中的任一者都可并入非天然氨基酸多肽中。
另外,包括以下具有式(XIV)结构的氨基酸:
其中:
A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚环烷 基、经取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳亚杂 烷基、经取代亚杂烷基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、经 取代亚芳基、亚杂芳基、经取代亚杂芳基、亚烷芳基、经取代亚烷芳基、亚芳烷 基或经取代亚芳烷基;
R为H、烷基、经取代烷基、环烷基或经取代环烷基;
R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核 苷酸;并且
R2是任选的,并且当存在时为OH、酯保护基、树脂、氨基酸、多肽或多核 苷酸;
X1为C、S或S(O);并且L为亚烷基、经取代亚烷基、N(R′)(亚烷基)或N(R′)(经 取代亚烷基),其中R′为H、烷基、经取代烷基、环烷基或经取代环烷基。
另外,包括以下具有式(XIV-A)结构的氨基酸:
其中:
A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚环烷 基、经取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳亚杂 烷基、经取代亚杂烷基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、经 取代亚芳基、亚杂芳基、经取代亚杂芳基、亚烷芳基、经取代亚烷芳基、亚芳烷 基或经取代亚芳烷基;
R为H、烷基、经取代烷基、环烷基或经取代环烷基;
R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核 苷酸;并且
R2是任选的,并且当存在时为OH、酯保护基、树脂、氨基酸、多肽或多核 苷酸;
L为亚烷基、经取代亚烷基、N(R′)(亚烷基)或N(R′)(经取代亚烷基),其中R′ 为H、烷基、经取代烷基、环烷基或经取代环烷基。
另外,包括以下具有式(XIV-B)结构的氨基酸:
其中:
A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚环烷 基、经取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳亚杂 烷基、经取代亚杂烷基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、经 取代亚芳基、亚杂芳基、经取代亚杂芳基、亚烷芳基、经取代亚烷芳基、亚芳烷 基或经取代亚芳烷基;
R为H、烷基、经取代烷基、环烷基或经取代环烷基;
R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核 苷酸;并且
R2是任选的,并且当存在时为OH、酯保护基、树脂、氨基酸、多肽或多核 苷酸;
L为亚烷基、经取代亚烷基、N(R′)(亚烷基)或N(R′)(经取代亚烷基),其中R′ 为H、烷基、经取代烷基、环烷基或经取代环烷基。
另外,包括以下具有式(XV)结构的氨基酸:
其中:
A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚环烷 基、经取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳亚杂 烷基、经取代亚杂烷基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、经 取代亚芳基、亚杂芳基、经取代亚杂芳基、亚烷芳基、经取代亚烷芳基、亚芳烷 基或经取代亚芳烷基;
R为H、烷基、经取代烷基、环烷基或经取代环烷基;
R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核 苷酸;并且
R2是任选的,并且当存在时为OH、酯保护基、树脂、氨基酸、多肽或多核 苷酸;
X1为C、S或S(O);并且n为0、1、2、3、4或5;并且各CR8R9基团上的 R8和R9是各独立地选自由H、烷氧基、烷基胺、卤素、烷基、芳基组成的群组, 或任何R8和R9可合起来形成=O或环烷基,或任何两个相邻R8基团可合起来形 成环烷基。
另外,包括以下具有式(XV-A)结构的氨基酸:
其中:
A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚环烷 基、经取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳亚杂 烷基、经取代亚杂烷基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、经 取代亚芳基、亚杂芳基、经取代亚杂芳基、亚烷芳基、经取代亚烷芳基、亚芳烷 基或经取代亚芳烷基;
R为H、烷基、经取代烷基、环烷基或经取代环烷基;
R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核 苷酸;并且
R2是任选的,并且当存在时为OH、酯保护基、树脂、氨基酸、多肽或多核 苷酸;
n为0、1、2、3、4或5;并且各CR8R9基团上的R8和R9各独立地选自由H、 烷氧基、烷基胺、卤素、烷基、芳基组成的群组,或任何R8和R9可合起来形成 =O或环烷基,或任何两个相邻R8基团可合起来形成环烷基。
另外,包括以下具有式(XV-B)结构的氨基酸:
其中:
A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚环烷 基、经取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳亚杂 烷基、经取代亚杂烷基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、经 取代亚芳基、亚杂芳基、经取代亚杂芳基、亚烷芳基、经取代亚烷芳基、亚芳烷 基或经取代亚芳烷基;
R为H、烷基、经取代烷基、环烷基或经取代环烷基;
R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核 苷酸;并且
R2是任选的,并且当存在时为OH、酯保护基、树脂、氨基酸、多肽或多核 苷酸;
n为0、1、2、3、4或5;并且各CR8R9基团上的R8和R9各独立地选自由H、 烷氧基、烷基胺、卤素、烷基、芳基组成的群组,或任何R8和R9可合起来形成 =O或环烷基,或任何两个相邻R8基团可合起来形成环烷基。
另外,包括以下具有式(XVI)结构的氨基酸:
其中:
A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚环烷 基、经取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳亚杂 烷基、经取代亚杂烷基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、经 取代亚芳基、亚杂芳基、经取代亚杂芳基、亚烷芳基、经取代亚烷芳基、亚芳烷 基或经取代亚芳烷基;
R为H、烷基、经取代烷基、环烷基或经取代环烷基;
R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核 苷酸;并且
R2是任选的,并且当存在时为OH、酯保护基、树脂、氨基酸、多肽或多核 苷酸;
X1为C、S或S(O);并且L为亚烷基、经取代亚烷基、N(R′)(亚烷基)或N(R′)(经 取代亚烷基),其中R′为H、烷基、经取代烷基、环烷基或经取代环烷基。
另外,包括以下具有式(XVI-A)结构的氨基酸:
其中:
A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚环烷 基、经取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳亚杂 烷基、经取代亚杂烷基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、经 取代亚芳基、亚杂芳基、经取代亚杂芳基、亚烷芳基、经取代亚烷芳基、亚芳烷 基或经取代亚芳烷基;
R为H、烷基、经取代烷基、环烷基或经取代环烷基;
R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核 苷酸;并且
R2是任选的,并且当存在时为OH、酯保护基、树脂、氨基酸、多肽或多核 苷酸;
L为亚烷基、经取代亚烷基、N(R′)(亚烷基)或N(R′)(经取代亚烷基),其中R′ 为H、烷基、经取代烷基、环烷基或经取代环烷基。
另外,包括以下具有式(XVI-B)结构的氨基酸:
其中:
A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚环烷 基、经取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳亚杂 烷基、经取代亚杂烷基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、经 取代亚芳基、亚杂芳基、经取代亚杂芳基、亚烷芳基、经取代亚烷芳基、亚芳烷 基或经取代亚芳烷基;
R为H、烷基、经取代烷基、环烷基或经取代环烷基;
R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核 苷酸;并且
R2是任选的,并且当存在时为OH、酯保护基、树脂、氨基酸、多肽或多核 苷酸;
L为亚烷基、经取代亚烷基、N(R′)(亚烷基)或N(R′)(经取代亚烷基),其中R′ 为H、烷基、经取代烷基、环烷基或经取代环烷基。
另外,包括具有式(XVII)结构的氨基酸:
其中:
A是任选的,并且当存在时为低碳亚烷基、经取代低碳亚烷基、低碳亚环烷 基、经取代低碳亚环烷基、低碳亚烯基、经取代低碳亚烯基、亚炔基、低碳亚杂 烷基、经取代亚杂烷基、低碳亚杂环烷基、经取代低碳亚杂环烷基、亚芳基、经 取代亚芳基、亚杂芳基、经取代亚杂芳基、亚烷芳基、经取代亚烷芳基、亚芳烷 基或经取代亚芳烷基;
M为-C(R3)-、其中(a)表示与A基团键结,并且(b)表示与各自的羰基键结,R3和R4独立地选自H、卤素、烷基、经取代烷基、环烷基或经取代环烷基,或R3和R4或两个R3基团或两个R4基团任选地形成环烷基或杂环烷基;
R为H、卤素、烷基、经取代烷基、环烷基或经取代环烷基;
T3为键、C(R)(R)、O或S,并且R为H、卤素、烷基、经取代烷基、环烷基 或经取代环烷基;
R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核 苷酸;并且
R2是任选的,并且当存在时为OH、酯保护基、树脂、氨基酸、多肽或多核 苷酸。
另外,包括具有式(XVIII)结构的氨基酸:
其中:
M为-C(R3)-、其中(a)表示与A基团键结,并且(b)表示与各自的羰基键结,R3和R4独立地选自H、卤素、烷基、经取代烷基、环烷基或经取代环烷基,或R3和R4或两个R3基团或两个R4基团任选地形成环烷基或杂环烷基;
R为H、卤素、烷基、经取代烷基、环烷基或经取代环烷基;
T3为键、C(R)(R)、O或S,并且R为H、卤素、烷基、经取代烷基、环烷基 或经取代环烷基;
R1是任选的,并且当存在时为H、氨基保护基、树脂、氨基酸、多肽或多核 苷酸;并且
R2是任选的,并且当存在时为OH、酯保护基、树脂、氨基酸、多肽或多核 苷酸;
Ra是各独立地选自由H、卤素、烷基、经取代烷基、-N(R′)2、-C(O)kR′(其中 k为1、2或3)、-C(O)N(R′)2、-OR′和-S(O)kR′组成的群组,其中R′各独立地为H、 烷基或经取代烷基。
另外,包括具有式(XIX)结构的氨基酸:
其中:
R为H、卤素、烷基、经取代烷基、环烷基或经取代环烷基;并且
T3为O或S。
另外,包括具有式(XX)结构的氨基酸:
其中:
R为H、卤素、烷基、经取代烷基、环烷基或经取代环烷基。
另外,包括以下具有式(XXI)结构的氨基酸:
在一些实施例中,以化学方式修饰包含非天然氨基酸的多肽以产生反应性羰 基或二羰基官能团。举例来说,可由具有相邻氨基和羟基的官能团产生可用于结 合反应的醛官能团。当生物活性分子为多肽时,例如可使用N端丝氨酸或苏氨酸 (其可正常存在,或可通过化学或酶促消化而暴露)在温和的氧化裂解条件下使用 高碘酸盐产生醛官能团。例如参见Gaertner等人,Bioconjug.Chem.3:262-268 (1992);Geoghegan,K.和Stroh,J.,Bioconjug.Chem.3:138-146(1992);Gaertner等 人,J.Biol.Chem.269:7224-7230(1994)。然而,所属领域中已知的方法局限于肽 或蛋白质的N端氨基酸。
在本发明中,带有相邻羟基和氨基的非天然编码氨基酸可作为“经掩蔽”的 醛官能团并入多肽中。举例来说,5-羟基赖氨酸带有与ε胺相邻的羟基。用于产 生醛的反应条件通常涉及在温和条件下添加摩尔过量的偏高碘酸钠,以避免在多 肽内的其它位点处发生氧化。氧化反应的pH值通常为约7.0。典型反应涉及向多 肽的缓冲溶液中添加约1.5摩尔过量的偏高碘酸钠,接着在黑暗环境中培育约10 分钟。例如参见美国专利第6,423,685号。
羰基或二羰基官能团可在温和条件下在水溶液中与含羟胺的试剂选择性反 应,从而形成在生理条件下稳定的相应肟键。例如参见Jencks,W.P.,J.Am.Chem. Soc.81,475-481(1959);Shao,J.和Tam,J.P.,J.Am.Chem.Soc.117:3893-3899 (1995)。此外,羰基或二羰基的独特反应性允许在存在其它氨基酸侧链的情况下 进行选择性修饰。例如参见Cornish,V.W.等人,J.Am.Chem.Soc.118:8150-8151 (1996);Geoghegan,K.F.和Stroh,J.G.,Bioconjug.Chem.3:138-146(1992);Mahal, L.K.等人,Science276:1125-1128(1997)。
非天然氨基酸的结构与合成:含羟胺的氨基酸
美国专利申请案第11/316,534号(美国公开案第20060189529号)是以全文 引用的方式并入本文中。因此,美国专利申请案第11/316,534号(美国公开案第 20060189529号)中的第V章(标题为“Non-naturalAminoAcids”B部分(标题 为“StructureandSynthesisofNon-NaturalAminoAcids:Hydroxylamine-Containing AminoAcids”)中所提供的揭示内容完全适用于制备、纯化、表征和使用本文中 所述的非天然氨基酸、非天然氨基酸多肽和经修饰的非天然氨基酸多肽的方法、 组合物(包括式I-XXXV)、技术和策略,其应用程度就如同所述揭示内容完全呈 现于本文中。美国专利公开案第2006/0194256号、第2006/0217532号和第 2006/0217289号以及标题为“Compositionscontaining,methodsinvolving,anduses ofnon-naturalaminoacidsandpolypeptides”的WO2006/069246也是以全文引用 的方式并入本文中。
非天然氨基酸的化学合成
适用于本发明中的多种非天然氨基酸可购自例如Sigma(USA)或Aldrich (Milwaukee,WI,USA)。无法购得的非天然氨基酸是任选地如本文中所提供或如 各种公开案中所提供而合成,或使用所属领域的技术人员已知的标准方法合成。 关于有机合成技术,例如参见Fessendon和Fessendon,OrganicChemistry,(1982,第 2版,WillardGrantPress,BostonMass.);March,AdvancedOrganicChemistry(第3 版,1985,WileyandSons,NewYork);以及Carey和Sundberg,AdvancedOrganic Chemistry(第3版,A和B部分,1990,PlenumPress,NewYork)。描述非天然氨基 酸合成的其它公开案包括例如标题为“InvivoincorporationofUnnaturalAmino Acids”的WO2002/085923;Matsoukas等人,(1995)J.Med.Chem.,38,4660-4669; King,F.E.和Kidd,D.A.A.(1949)ANewSynthesisofGlutamineandofγ -DipeptidesofGlutamicAcidfromPhthylatedIntermediates,J.Chem.Soc, 3315-3319;Friedman,O.M.和Chatterrji,R.(1959)SynthesisofDerivativesof GlutamineasModelSubstratesforAnti-TumorAgents.J.Am.Chem.Soc.81, 3750-3752;Craig,J.C.等人,(1988)AbsoluteConfigurationoftheEnantiomersof 7-Chloro-4[[4-(diethylamino)-1-methylbutyl]amino]quinoline(Chloroquine).J.Org. Chem.53,1167-1170;Azoulay,M.,Vilmont,M.和Frappier,F.(1991)Glutamine analoguesasPotentialAntimalarials,.Eur.J.Med.Chem.26,201-5;Koskinen,A.M.P. 和Rapoport,H.(1989)Synthesisof4-SubstitutedProlinesasConformationally ConstrainedAminoAcidAnalogues.J.Org.Chem.54,1859-1866;Christie,B.D.和 Rapoport,H.(1985)SynthesisofOpticallyPurePipecolatesfromL-Asparagine. ApplicationtotheTotalSynthesisof(+)-ApovincaminethroughAminoAcid DecarbonylationandIminiumIonCyclization.J.Org.Chem.50:1239-1246;Barton 等人,(1987)SynthesisofNovelalpha-Amino-AcidsandDerivativesUsingRadical Chemistry:SynthesisofL-andD-alpha-Amino-AdipicAcids,L-alpha-aminopimelic AcidandAppropriateUnsaturatedDerivatives.Tetrahedron43:4297-4308;以及 Subasinghe等人,(1992)Quisqualicacidanalogues:synthesisofbeta-heterocyclic 2-aminopropanoicacidderivativesandtheiractivityatanovelquisqualate-sensitized site.J.Med.Chem.35:4602-7。还参见标题为“ProteinArrays”的美国专利公开案 第US2004/0198637号,其是以引用的方式并入本文中。
A.羰基反应性基团
具有羰基反应性基团的氨基酸允许多种通过亲核加成或醇醛缩合反应连接分 子(包括(但不限于)PEG或其它水溶性分子)的反应。
示范性含羰基的氨基酸可如下表示:
其中n为0-10;R1为烷基、芳基、经取代烷基或经取代芳基;R2为H、烷基、 芳基、经取代烷基和经取代芳基;并且R3为H、氨基酸、多肽或氨基端修饰基团, 并且R4为H、氨基酸、多肽或羧基端修饰基团。在一些实施例中,n为1,R1为 苯基并且R2为简单烷基(即甲基、乙基或丙基),并且酮部分位于相对于烷基侧 链的对位。在一些实施例中,n为1,R1为苯基并且R2为简单烷基(即甲基、乙 基或丙基),并且酮部分位于相对于烷基侧链的间位。
对乙酰基-(+/-)-苯丙氨酸和间乙酰基-(+/-)-苯丙氨酸的合成描述于Zhang,Z. 等人,Biochemistry42:6735-6746(2003)中,其是以引用的方式并入本文中。所属 领域的技术人员可类似地制备其它含羰基的氨基酸。
在一些实施例中,以化学方式修饰包含非天然编码氨基酸的多肽以产生反应 性羰基官能团。举例来说,可由具有相邻氨基和羟基的官能团产生可用于结合反 应的醛官能团。当生物活性分子为多肽时,例如可使用N端丝氨酸或苏氨酸(其 可正常存在,或可通过化学或酶促消化而暴露)在温和的氧化裂解条件下使用高 碘酸盐产生醛官能团。例如参见Gaertner等人,Bioconjug.Chem.3:262-268 (1992);Geoghegan,K.和Stroh,J.,Bioconjug.Chem.3:138-146(1992);Gaertner等 人,J.Biol.Chem.269:7224-7230(1994)。然而,所属领域中已知的方法局限于肽 或蛋白质的N端氨基酸。
在本发明中,带有相邻羟基和氨基的非天然编码氨基酸可作为“经掩蔽”的 醛官能团并入多肽中。举例来说,5-羟基赖氨酸带有与ε胺相邻的羟基。用于产 生醛的反应条件通常涉及在温和条件下添加摩尔过量的偏高碘酸钠,以避免在多 肽内的其它位点处发生氧化。氧化反应的pH值通常为约7.0。典型反应涉及向多 肽的缓冲溶液中添加约1.5摩尔过量的偏高碘酸钠,接着在黑暗环境中培育约10 分钟。例如参见美国专利第6,423,685号,其是以引用的方式并入本文中。
羰基官能团可在温和条件下在水溶液中与含肼、酰肼、羟胺或氨基脲的试剂 选择性反应,以分别形成在生理条件下稳定的相应腙、肟或缩氨基脲 (semicarbazone)键。例如参见Jencks,W.P.,J.Am.Chem.Soc.81,475-481(1959); Shao,J.和Tam,J.P.,J.Am.Chem.Soc.117:3893-3899(1995)。此外,羰基的独特反 应性允许在存在其它氨基酸侧链的情况下进行选择性修饰。例如参见Cornish,V. W.等人,J.Am.Chem.Soc.118:8150-8151(1996);Geoghegan,K.F.和Stroh,J.G., Bioconjug.Chem.3:138-146(1992);Mahal,L.K.等人,Science276:1125-1128 (1997)。
B.肼、酰肼或氨基脲反应性基团
含有亲核基团(例如肼、酰肼或氨基脲)的非天然编码氨基酸允许与多种亲 电子基团反应形成结合物(包括(但不限于)与PEG或其它水溶性聚合物反应)。
示范性含肼、酰肼或氨基脲的氨基酸可如下表示:
其中n为0-10;R1为烷基、芳基、经取代烷基或经取代芳基或不存在;X为 O、N或S或不存在;R2为H、氨基酸、多肽或氨基端修饰基团,并且R3为H、 氨基酸、多肽或羧基端修饰基团。
在一些实施例中,n为4,R1不存在并且X为N。在一些实施例中,n为2, R1不存在并且X不存在。在一些实施例中,n为1,R1为苯基,X为O,并且氧 原子位于芳环上脂肪族基团的对位。
含酰肼、肼和氨基脲的氨基酸可获自商业来源。举例来说,L-谷氨酸-□-酰 肼可获自SigmaChemical(St.Louis,MO)。无法购得的其它氨基酸可由所属领域 的技术人员制备。例如参见美国专利第6,281,211号,其是以引用的方式并入本文 中。
含有带有酰肼、肼或氨基脲官能团的非天然编码氨基酸的多肽可与多种含有 醛或具有类似化学反应性的其它官能团的分子有效并选择性地反应。例如参见 Shao,J.和Tam,J.,J.Am.Chem.Soc.117:3893-3899(1995)。与20种常见氨基酸上 存在的亲核基团(包括(但不限于)丝氨酸或苏氨酸的羟基或赖氨酸的氨基以及 N端)相比,酰肼、肼和氨基脲官能团的独特反应性使其对醛、酮和其它亲电子 基团的反应性显著更强。
C.含氨氧基的氨基酸
含有氨氧基(也被称作羟胺)的非天然编码氨基酸允许与多种亲电子基团反 应形成结合物(包括(但不限于)与PEG或其它水溶性聚合物反应)。如同肼、 酰肼以及氨基脲一样,氨氧基的增强的亲核性使其与多种含有醛或具有类似化学 反应性的其它官能团的分子有效并选择性地反应。例如参见Shao,J.和Tam,J.,J. Am.Chem.Soc.117:3893-3899(1995);H.Hang和C.Bertozzi,Acc.Chem.Res.34: 727-736(2001)。尽管与肼基团反应的结果为相应腙,但氨氧基与含羰基的基团(例 如酮)的反应通常产生肟。
示范性含氨氧基的氨基酸可如下表示:
其中n为0-10;R1为烷基、芳基、经取代烷基或经取代芳基或不存在;X为 O、N、S或不存在;m为0-10;Y=C(O)或不存在;R2为H、氨基酸、多肽或氨 基端修饰基团,并且R3为H、氨基酸、多肽或羧基端修饰基团。在一些实施例中, n为1,R1为苯基,X为O,m为1,并且Y存在。在一些实施例中,n为2,R1和X不存在,m为0,并且Y不存在。
含氨氧基的氨基酸可由可易于获得的氨基酸前体(高丝氨酸、丝氨酸以及苏 氨酸)制备。例如参见M.Carrasco和R.Brown,J.Org.Chem.68:8853-8858(2003)。 某些含氨氧基的氨基酸(例如L-2-氨基-4-(氨氧基)丁酸)已从天然来源分离 (Rosenthal,G.,LifeSci.60:1635-1641(1997))。其它含氨氧基的氨基酸可由所属领 域的技术人员来制备。
D.叠氮化物和炔反应性基团
叠氮化物和炔官能团的独特反应性使其极适用于多肽和其它生物分子的选择 性修饰。有机叠氮化物(尤其是脂肪族叠氮化物)以及炔通常对常见的反应性化 学条件稳定。具体来说,叠氮化物与炔官能团都对天然存在多肽中可见的20种常 见氨基酸的侧链(即R基团)呈惰性。然而,当叠氮化物和炔基团靠近时,其“弹 簧加压(spring-loaded)”性质显露,并且其通过休斯根[3+2]环加成反应选择性并 有效地反应产生相应三唑。例如参见ChinJ.等人,Science301:964-7(2003);Wang, Q.等人,J.Am.Chem.Soc.125,3192-3193(2003);Chin,J.W.等人,J.Am.Chem.Soc. 124:9026-9027(2002)。
因为休斯根环加成反应涉及选择性环加成反应(例如参见Padwa,A., ComprehensiveOrganicSynthesis,第4卷,(Trost,B.M.编,1991),第1069-1109页; Huisgen,R.,1,3-DipolarCycloadditionChemistry,(Padwa,A.编,1984),第1-176页) 而非亲核取代,所以并入带有含叠氮基和含炔的侧链的非天然编码氨基酸使得所 得多肽在非天然编码氨基酸的位置处经选择性修饰。涉及含叠氮基或含炔的胰岛 素多肽的环加成反应可在室温下在水性条件下通过在催化量的用于将Cu(II)原位 还原为Cu(I)的还原剂存在下添加Cu(II)(包括(但不限于)呈催化量的CuSO4的形式)来进行。例如参见Wang,Q.等人,J.Am.Chem.Soc.125,3192-3193(2003); Tornoe,C.W.等人,J.Org.Chem.67:3057-3064(2002);Rostovtsev等人,Angew. Chem.Int.Ed.41:2596-2599(2002)。示范性还原剂包括(包括(但不限于))抗坏 血酸盐、金属铜、奎宁(quinine)、氢醌、维生素K、谷胱甘肽、半胱氨酸、Fe2+、 Co2+以及外加电位。
在一些需要叠氮化物与炔之间的休斯根[3+2]环加成反应的情况下,胰岛素多 肽包含包括炔部分的非天然编码氨基酸并且欲与氨基酸连接的水溶性聚合物包含 叠氮部分。或者,也可进行逆向反应(即在氨基酸上具有叠氮部分并且在水溶性 聚合物上存在炔部分)。
叠氮官能团也可与含有芳基酯并且经芳基膦部分适当官能化的水溶性聚合物 选择性地反应以产生酰胺键。芳基膦基团原位还原叠氮基,并且所得胺随后与最 接近的酯键有效反应以产生相应酰胺。例如参见E.Saxon和C.Bertozzi,Science 287,2007-2010(2000)。含叠氮基的氨基酸可为烷基叠氮化物(包括(但不限于) 2-氨基-6-叠氮基-1-己酸)或芳基叠氮化物(对叠氮基-苯丙氨酸)。
含有芳基酯和膦部分的示范性水溶性聚合物可如下表示:
其中X可为O、N、S或不存在,Ph为苯基,W为水溶性聚合物并且R可为 H、烷基、芳基、经取代烷基和经取代芳基。示范性R基团包括(但不限于)-CH2、 -C(CH3)3、-OR′、-NR′R″、-SR′、-卤素、-C(O)R′、-CONR′R″、-S(O)2R′、-S(O)2NR′R″、 -CN以及-NO2。R′、R″、R″′和R″″各独立地指代氢、经取代或未经取代杂烷基、 经取代或未经取代芳基(包括(但不限于)经1-3个卤素取代的芳基)、经取代或 未经取代烷基、烷氧基或硫烷氧基或芳基烷基。举例来说,当本发明的化合物包 括一个以上R基团时,各R基团是独立地经选择,而当存在R′、R″、R″′和R″″ 基团中的一者以上时,这些基团同样是各独立地经选择。当R′和R″与同一氮原子 连接时,其可与氮原子组合形成5元、6元或7元环。举例来说,-NR′R″打算包 括(但不限于)1-吡咯烷基和4-吗啉基。根据对取代基的上述论述,所属领域的 技术人员应了解术语“烷基”打算包括包含与除氢基之外的基团结合的碳原子的 基团,例如卤烷基(包括(但不限于)-CF3和-CH2CF3)和酰基(包括(但不限 于)-C(O)CH3、-C(O)CF3、-C(O)CH2OCH3等)。
叠氮官能团也可与含有硫酯并且经芳基膦部分适当官能化的水溶性聚合物选 择性地反应以产生酰胺键。芳基膦基团原位还原叠氮基,并且所得胺随后与硫酯 键有效反应以产生相应酰胺。含有硫酯和膦部分的示范性水溶性聚合物可如下表 示:
其中n为1-10;X可为O、N、S或不存在,Ph为苯基,且W为水溶性聚合 物。
示范性含炔的氨基酸可如下表示:
其中n为0-10;R1为烷基、芳基、经取代烷基或经取代芳基或不存在;X为 O、N、S或不存在;m为0-10,R2为H、氨基酸、多肽或氨基端修饰基团,并且 R3为H、氨基酸、多肽或羧基端修饰基团。在一些实施例中,n为1,R1为苯基, X不存在,m为0并且乙炔部分位于相对于烷基侧链的对位。在一些实施例中,n 为1,R1为苯基,X为O,m为1并且炔丙基氧基位于相对于烷基侧链的对位(即 O-炔丙基-酪氨酸)。在一些实施例中,n为1,R1和X不存在且m为0(即炔丙 基甘氨酸)。
含炔的氨基酸在市面上有售。举例来说,炔丙基甘氨酸可购自Peptech (Burlington,MA)。或者,可根据标准方法来制备含炔的氨基酸。举例来说,例如 可如Deiters,A.等人,J.Am.Chem.Soc.125:11782-11783(2003)中所述来合成对炔 丙基氧基苯丙氨酸,并且可如Kayser,B.等人,Tetrahedron53(7):2475-2484(1997) 中所述来合成4-炔基-L-苯丙氨酸。所属领域的技术人员可制备其它含炔的氨基 酸。
示范性含叠氮基的氨基酸可如下表示:
其中n为0-10;R1为烷基、芳基、经取代烷基、经取代芳基或不存在;X为 O、N、S或不存在;m为0-10;R2为H、氨基酸、多肽或氨基端修饰基团,并且 R3为H、氨基酸、多肽或羧基端修饰基团。在一些实施例中,n为1,R1为苯基, X不存在,m为0并且叠氮部分位于烷基侧链的对位。在一些实施例中,n为0-4 并且R1和X不存在,并且m=0。在一些实施例中,n为1,R1为苯基,X为O, m为2并且β叠氮基乙氧基部分位于相对于烷基侧链的对位。
含叠氮基的氨基酸可获自商业来源。举例来说,4-叠氮基苯丙氨酸可获自 Chem-ImpexInternational,Inc.(WoodDale,IL)。对于无法购得的含叠氮基的氨基 酸,可相对容易地使用所属领域的技术人员已知的标准方法来制备叠氮基,所述 方法包括(但不限于)通过置换合适的离去基(包括(但不限于)卤离子、甲磺 酸根、甲苯磺酸根)或通过打开经适当保护的内酯。例如参见March,AdvancedOrganicChemistry(第3版,1985,WileyandSons,NewYork)。
E.氨基硫醇反应性基团
β取代的氨基硫醇官能团的独特反应性使其极其适用于通过形成噻唑烷来选 择性修饰含有醛基的多肽和其它生物分子。例如参见J.Shao和J.Tam,J.Am.Chem. Soc.1995,117(14)3893-3899。在一些实施例中,β取代的氨基硫醇氨基酸可并入 胰岛素多肽中并且随后与包含醛官能团的水溶性聚合物反应。在一些实施例中, 水溶性聚合物、药物结合物或其它有效负载可通过形成噻唑烷而与包含β取代的 氨基硫醇氨基酸的胰岛素多肽偶合。
F.其它反应性基团
以下专利申请案中描述可并入本发明的胰岛素多肽中的其它反应性基团和非 天然编码氨基酸(包括(但不限于)对氨基-苯丙氨酸),所述专利申请案都是以 全文引用的方式并入本文中:美国专利公开案第2006/0194256号;美国专利公开 案第2006/0217532号;美国专利公开案第2006/0217289号;美国临时专利第 60/755,338号;美国临时专利第60/755,711号;美国临时专利第60/755,018号; 国际专利申请案第PCT/US06/49397号;WO2006/069246;美国临时专利第 60/743,041号;美国临时专利第60/743,040号;国际专利申请案第PCT/US06/47822 号;美国临时专利第60/882,819号;美国临时专利第60/882,500号;和美国临时 专利第60/870,594号。这些申请案还论述可存在于PEG或其它聚合物上的反应性 基团,包括(但不限于)结合用羟胺基(氨氧基)。
非天然氨基酸的细胞摄取
细胞对非天然氨基酸的摄取为设计并选择(包括(但不限于))用于并入蛋白 质中的非天然氨基酸时通常考虑的一个问题。举例来说,α-氨基酸的高电荷密度 表明这些化合物不可能为细胞可渗透的。通过以蛋白质为基础的转运系统的集合 将天然氨基酸吸收到真核细胞中。可进行快速筛选以评估哪些非天然氨基酸(如 果存在)是由细胞吸收。例如参见例如标题为“ProteinArrays”的美国专利公开 案第US2004/0198637号(其是以引用的方式并入本文中)以及Liu,D.R.和Schultz, P.G.(1999)Progresstowardtheevolutionofanorganismwithanexpandedgenetic code.PNASUnitedStates96:4780-4785中的毒性测定。尽管通过各种测定可容易 地分析摄取,但设计适用于细胞摄取途径的非天然氨基酸的替代方案为提供在活 体内产生氨基酸的生物合成途径。
非天然氨基酸的生物合成
许多生物合成途径已存在于细胞中以用于产生氨基酸和其它化合物。自然界 (包括(但不限于)细胞)中可能不存在特定非天然氨基酸的生物合成方法,但本 发明提供所述方法。举例来说,任选地通过添加新酶或改变现有宿主细胞途径而 在宿主细胞中产生非天然氨基酸的生物合成途径。其它新酶任选地为天然存在的 酶或人工开发的酶。举例来说,对氨基苯丙氨酸的生物合成(如在标题为“Invivo incorporationofunnaturalaminoacids”的WO2002/085923中的实例中所呈现)依 赖来自其它生物体的已知酶的组合的加入。可通过利用包含这些酶的基因的质粒 转化细胞而将所述基因引入真核细胞中。当在细胞中表达时,所述基因提供合成 所需化合物的酶促途径。任选地添加的酶类型的实例提供于下文实例中。其它酶 序列可见于例如Genbank中。人工开发的酶也任选地以相同方式添加到细胞中。 以此方式操纵细胞的细胞机构和资源以产生非天然氨基酸。
多种方法可用于产生用于生物合成途径中或用于发展现有途径的新颖酶。举 例来说,任选地使用包括(但不限于)如Maxygen,Inc.(可通过万维网在 maxygen.com上获得)所开发的递归重组来开发新颖酶和途径。例如参见Stemmer (1994),RapidevolutionofaproteininvitrobyDNAshuffling,Nature 370(4):389-391;以及Stemmer,(1994),DNAshufflingbyrandomfragmentationand reassembly:Invitrorecombinationformolecularevolution,Proc.Natl.Acad.Sci. USA.,91:10747-10751。类似地,任选地将Genencor(可通过万维网在genencor.com 上获得)所开发的DesignPathTM用于代谢途径工程改造,包括(但不限于)工程 改造在细胞中产生O-甲基-L-酪氨酸的途径。这项技术使用新基因(包括(但不限 于))经由功能基因组学以及分子进化和设计所鉴别的基因)的组合在宿主生物体 中重建现有途径。Diversa公司(可通过万维网在diversa.com上获得)还提供快 速筛选基因文库和基因途径的技术,从而包括(但不限于)建立新途径。
通常,由本发明的工程改造过的生物合成途径产生的非天然氨基酸是以足以 进行有效蛋白质生物合成(包括(但不限于)天然细胞量),但未达到影响其它氨 基酸的浓度或耗尽细胞资源的程度的浓度产生。以此方式在活体内产生的典型浓 度为约10mM到约0.05mM。在利用包含用于产生特定途径所需的酶的基因的质 粒转化细胞并产生非天然氨基酸后,任选地使用活体内选择以针对核糖体蛋白质 合成和细胞生长进一步优化非天然氨基酸的产生。
具有非天然氨基酸的多肽
可出于多种目的并入非天然氨基酸,所述目的包括(但不限于)调整蛋白质 结构和/或功能的改变;改变尺寸、酸度、亲核性、氢键结、疏水性、蛋白酶标靶 位点的可接近性;靶向部分(包括(但不限于)对于蛋白质阵列);添加生物活性 分子;连接聚合物;连接放射性核素;调节血清半衰期;调节组织渗透(例如肿 瘤);调节主动转运;调节组织、细胞或器官特异性或分布;调节免疫原性;调节 蛋白酶抗性等。包括非天然氨基酸的蛋白质可具有增强或甚至全新的催化或生物 物合理质。举例来说,任选地通过在蛋白质中包括非天然氨基酸来改良以下性质: 毒性、生物分布、结构性质、光谱性质、化学和/或光化学性质、催化能力、半衰 期(包括(但不限于)血清半衰期)、与其它分子反应的能力(包括(但不限于) 共价或非共价)等。包括包含至少一个非天然氨基酸的蛋白质的组合物适用于(包 括(但不限于))新颖治疗剂、诊断剂、催化酶、工业酶、结合蛋白(包括(但不 限于)抗体)以及(包括(但不限于))蛋白质结构和功能的研究。例如参见Dougherty, (2000)UnnaturalAminoAcidsasProbesofProteinStructureandFunction,Current OpinioninChemicalBiology,4:645-652。
在本发明的一方面,组合物包括至少一种具有至少一个(包括(但不限于) 至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、 至少九个或至少十个或十个以上)非天然氨基酸的蛋白质。非天然氨基酸可相同 或不同,包括(但不限于)在蛋白质中可存在1、2、3、4、5、6、7、8、9或10 或10个以上不同位点,其包含1、2、3、4、5、6、7、8、9或10或10个以上不 同的非天然氨基酸。另一方面,组合物包括蛋白质中存在的至少一个(但少于全 部)特定氨基酸经非天然氨基酸取代的蛋白质。对于具有一个以上非天然氨基酸 的给定蛋白质来说,非天然氨基酸可相同或不同(包括(但不限于)所述蛋白质 可包括两个或两个以上不同类型的非天然氨基酸,或可包括两个相同的非天然氨 基酸)。对于具有两个以上非天然氨基酸的给定蛋白质来说,非天然氨基酸可相同、 不同或为相同种类的多个非天然氨基酸与至少一个不同的非天然氨基酸的组合。
所关注的具有至少一个非天然氨基酸的蛋白质或多肽为本发明的特征。本发 明还包括使用本发明的组合物和方法产生的具有至少一个非天然氨基酸的多肽或 蛋白质。赋形剂(包括(但不限于)医药学上可接受的赋形剂)也可与蛋白质一 起存在。
通过在真核细胞中利用至少一个非天然氨基酸来产生所关注蛋白质或多肽, 蛋白质或多肽通常应包括真核生物翻译后修饰。在某些实施例中,蛋白质包括至 少一个非天然氨基酸和至少一个由真核细胞在活体内进行的翻译后修饰,其中所 述翻译后修饰并非由原核细胞进行。举例来说,翻译后修饰包括(包括(但不限 于))乙酰化、酰化、脂质修饰、棕榈酰化、棕榈酸盐加成、磷酸化、糖脂键修饰、 糖基化等。一方面,翻译后修饰包括通过GlcNAc-天冬酰胺键使寡糖(包括(但 不限于)(GlcNAc-Man)2-Man-GlcNAc-GlcNAc)与天冬酰胺连接。参见表1,其 列出真核生物蛋白的N-连接寡糖的一些实例(也可存在其它未绘示的残基)。另 一方面,翻译后修饰包括通过GalNAc-丝氨酸或GalNAc-苏氨酸键或GlcNAc-丝 氨酸或GlcNAc-苏氨酸键使寡糖(包括(但不限于)Gal-GalNAc、Gal-GlcNAc等) 与丝氨酸或苏氨酸连接。
表1:通过GlcNAc键连接的寡糖的实例
另一方面,翻译后修饰包括前体(包括(但不限于)降血钙素前体、降血钙 素基因相关肽前体、前甲状旁腺激素原(preproparathyroidhormone)、前胰岛素原、 胰岛素原、前阿黑皮素原(preproopiomelanocortin)、阿黑皮素原等)的蛋白水解 加工,组装成多亚单位蛋白或大分子组装物,翻译到细胞中的另一位点中(包括 (但不限于)翻译到例如内质网、高尔基体(Golgiapparatus)、核、溶酶体、过氧 化物酶体、线粒体、叶绿体、液泡等细胞器中,或通过分泌途径)。在某些实施例 中,蛋白质包含分泌或定位序列、表位标签、FLAG标签、聚组氨酸标签、GST 融合体等。
非天然氨基酸的一个优点在于,其提供可用于添加其它分子的其它化学部分。 这些修饰可在真核细胞或非真核细胞中活体内进行或在活体外进行。因此,在某 些实施例中,翻译后修饰是通过非天然氨基酸进行。举例来说,翻译后修饰可通 过亲核-亲电子反应进行。目前用于蛋白质的选择性修饰的大多数反应涉及亲核与 亲电子反应搭配物之间的共价键形成,包括(但不限于)α-卤代酮与组氨酸或半 胱氨酸侧链的反应。在这些情况下,选择性是由蛋白质中亲核残基的数目和可接 近性决定。在本发明的蛋白质中,可在活体外以及活体内使用其它选择性更大的 反应,例如非天然酮基氨基酸与酰肼或氨氧基化合物的反应。例如参见Cornish 等人,(1996)J.Am.Chem.Soc,118:8150-8151;Mahal等人,(1997)Science, 276:1125-1128;Wang等人,(2001)Science292:498-500;Chin等人,(2002)J.Am. Chem.Soc.124:9026-9027;Chin等人,(2002)Proc.Natl.Acad.Sci.. 99:11020-11024;Wang等人,(2003)Proc.Natl.Acad.Sci.,100:56-61;Zhang等人, (2003)Biochemistry,42:6735-6746;以及Chin等人,(2003)Science,301:964-7,所 述文献都是以引用的方式并入本文中。这允许用包括荧光团、交联剂、糖类衍生 物以及细胞毒性分子的大量试剂选择性标记几乎任何蛋白质。还参见标题为 “Glycoproteinsynthesis”的美国专利第6,927,042号,其是以引用的方式并入本文 中。包括(但不限于)通过叠氮基氨基酸进行的翻译后修饰也可通过施陶丁格连 接反应(Staudingerligation)(包括(但不限于)用三芳基膦试剂)进行。例如参 见Kiick等人,(2002)Incorporationofazidesintorecombinantproteinsfor chemoselectivemodificationbytheStaudingerligation,PNAS99:19-24。
本发明提供选择性修饰蛋白质的另一种极为有效的方法,其涉及响应选择密 码子而将非天然氨基酸(包括(但不限于)含有叠氮基或炔基部分)遗传并入蛋 白质中。然后,可通过包括(但不限于)休斯根[3+2]环加成反应(例如参见Padwa, A.,ComprehensiveOrganicSynthesis,第4卷,(1991)Trost,B.M.编,Pergamon, Oxford,第1069-1109页;和Huisgen,R.,1,3-DipolarCycloadditionChemistry,(1984) Padwa,A.编,Wiley,NewYork,第1-176页)分别用包括(但不限于)炔基或叠氮 衍生物来修饰这些氨基酸侧链。因为此方法涉及环加成而非亲核取代,所以可以 极高选择性修饰蛋白质。可在室温下在水性条件下通过向反应混合物中添加催化 量的Cu(I)盐而以极佳区域选择性(1,4>1,5)进行此反应。例如参见Tornoe等人, (2002)J.Org.Chem.67:3057-3064;以及Rostovtsev等人,(2002)Angew.Chem.Int. Ed.41:2596-2599。可使用的另一方法为在双砷化合物上用四半胱氨酸基元进行配 体交换,例如参见Griffin等人,(1998)Science281:269-272。
可通过[3+2]环加成而加成到本发明的蛋白质中的分子包括具有叠氮基或炔 基衍生物的几乎任何分子。这些分子包括(但不限于)染料、荧光团、交联剂、 糖类衍生物、聚合物(包括(但不限于)聚乙二醇的衍生物)、光交联剂、化学毒 性化合物、亲和性标记、生物素衍生物、树脂、珠粒、第二蛋白质或多肽(或更 多)、多核苷酸(包括(但不限于)DNA、RNA等)、金属螯合剂、辅因子、脂肪 酸、碳水化合物等。这些分子可分别加成到具有炔基的非天然氨基酸(包括(但 不限于)对炔丙基氧基苯丙氨酸)或具有叠氮基的非天然氨基酸(包括(但不限 于)对叠氮基-苯丙氨酸)中。
包含非天然编码氨基酸的胰岛素多肽的活体内产生
可使用经修饰的tRNA和tRNA合成酶在活体内产生本发明的胰岛素多肽, 以添加无法在天然存在的系统中编码的氨基酸或用所述氨基酸取代。
使用天然存在的系统中无法编码的氨基酸来产生tRNA和tRNA合成酶的方 法是描述于例如美国专利第7,045,337号和第7,083,970号中,所述专利是以引用 的方式并入本文中。这些方法涉及产生独立于翻译系统的内源性合成酶和tRNA 起作用(且因此有时被称作“正交”)的翻译机构。通常,翻译系统包含正交tRNA (O-tRNA)以及正交氨酰基tRNA合成酶(O-RS)。通常,O-RS在翻译系统中优 先利用至少一种非天然存在氨基酸使O-tRNA氨酰化且O-tRNA识别至少一个不 被系统中的其它tRNA识别的选择密码子。因此,翻译系统响应经编码的选择密 码子而将非天然编码氨基酸插入系统中所产生的蛋白质中,从而“取代”氨基酸 使其进入编码多肽的某一位置中。
所属领域中已描述用于将特定合成氨基酸插入多肽中的多种正交tRNA和氨 酰基tRNA合成酶,并且其通常适用于本发明中。举例来说,酮基特异性O-tRNA/ 氨酰基-tRNA合成酶是描述于Wang,L.等人,Proc.Natl.Acad.Sci.USA100:56-61 (2003)以及Zhang,Z.等人,Biochem.42(22):6735-6746(2003)中。示范性O-RS或其 部分是由多核苷酸序列编码并且包括美国专利第7,045,337号和第7,083,970号中 所揭示的氨基酸序列,所述专利各以引用的方式并入本文中。与O-RS一起使用 的相应O-tRNA分子也描述于美国专利第7,045,337号和第7,083,970号中,所述 专利是以引用的方式并入本文中。O-tRNA/氨酰基-tRNA合成酶对的其它实例描 述于WO2005/007870、WO2005/007624和WO2005/019415中。
叠氮基特异性O-tRNA/氨酰基-tRNA合成酶系统的实例描述于Chin,J.W.等 人,J,Am.Chem.Soc.124:9026-9027(2002)中。对叠氮基-L-Phe的示范性O-RS序 列包括(但不限于)如美国专利第7,083,970号(其以引用的方式并入本文中)中 所揭示的核苷酸序列SEQIDNO:14-16和29-32以及氨基酸序列SEQIDNO: 46-48和61-64。适用于本发明中的示范性O-tRNA序列包括(但不限于)如美国 专利第7,083,970号(其以引用的方式并入本文中)中所揭示的核苷酸序列SEQID NO:1-3。对特定非天然编码氨基酸具特异性的O-tRNA/氨酰基-tRNA合成酶对的 其它实例描述于美国专利第7,045,337号(其以引用的方式并入本文中)中。在酿 酒酵母中并入含酮基与含叠氮基的氨基酸的O-RS和O-tRNA描述于Chin,J.W. 等人,Science301:964-967(2003)中。
已报道若干种其它正交对。已描述用于将非天然氨基酸潜在地并入大肠杆菌 中的来源于酿酒酵母tRNA和合成酶的谷氨酰胺酰基(例如参见Liu,D.R.和 Schultz,P.G.(1999)Proc.Natl.Acad.Sci.U.S.A.96:4780-4785)、天冬氨酰基(例 如参见Pastrnak,M.等人,(2000)Helv.Chim.Acta83:2277-2286)和酪氨酰基(例 如参见Ohno,S.等人,(1998)J.Biochem.(Tokyo,Jpn.)124:1065-1068;以及Kowal, A.K.等人,(2001)Proc.Natl.Acad.Sci.U.S.A.98:2268-2273)系统。已描述用于 酿酒酵母的来源于大肠杆菌谷氨酰胺酰基(例如参见Kowal,A.K.等人,(2001) Proc.Natl.Acad.Sci.U.S.A.98:2268-2273)和酪氨酰基(例如参见Edwards,H. 和Schimmel,P.(1990)Mol.Cell.Biol.10:1633-1641)合成酶的系统。大肠杆菌酪 氨酰基系统已用于在哺乳动物细胞中活体内并入3-碘-L-酪氨酸。参见Sakamoto. K..等人,(2002)NucleicAcidsRes.30:4692-4699。
O-tRNA/氨酰基-tRNA合成酶的使用涉及选择编码非天然编码氨基酸的特定 密码子。尽管可使用任何密码子,但通常希望选择在表达O-tRNA/氨酰基-tRNA 合成酶的细胞中很少或从未使用的密码子。举例来说,示范性密码子包括无义密 码子(例如终止密码子(琥珀、赭石和蛋白石))、四个或四个以上碱基的密码子 以及很少使用或未使用过的其它天然三碱基密码子。
可使用所属领域中已知的诱变方法(包括(但不限于)位点特异性诱变、盒 式诱变、限制选择诱变等)将特定的选择密码子引入胰岛素多核苷酸编码序列的 适当位置中。
用于产生可用于并入非天然编码氨基酸的蛋白质生物合成机构的组分(例如 O-RS、O-tRNA以及正交O-tRNA/O-RS对)的方法描述于Wang,L.等人,Science 292:498-500(2001);Chin,J.W.等人,J.Am.Chem.Soc.124:9026-9027(2002); Zhang,Z.等人,Biochemistry42:6735-6746(2003)中。用于活体内并入非天然编码 氨基酸的方法和组合物描述于美国专利第7,045,337号中,所述专利是以引用的方 式并入本文中。用于选择用于生物体的活体内翻译系统中的正交tRNA-tRNA合成 酶对的方法也描述于美国专利第7,045,337号和美国专利第7,083,970号中,所述 专利是以引用的方式并入本文中。标题为“SiteSpecificIncorporationofKeto AminoAcidsintoProteins”的PCT公开案第WO04/035743号(其是以全文引用 的方式并入本文中)描述用于并入酮基氨基酸的正交RS和tRNA对。标题为 “ExpandingtheEukaryoticGeneticCode”的PCT公开案第WO04/094593号(其 是以全文引用的方式并入本文中)描述在真核宿主细胞中并入非天然编码氨基酸 的正交RS和tRNA对。
用于产生至少一种重组正交氨酰基-tRNA合成酶(O-RS)的方法包含:(a) 自第一生物体产生来源于至少一种氨酰基-tRNA合成酶(RS)的(任选地突变) RS的文库,所述第一生物体包括(但不限于)原核生物体,例如詹氏甲烷球菌、 嗜热自养甲烷杆菌、嗜盐菌、大肠杆菌、超嗜热古菌、强烈炽热球菌、极端嗜热 古菌、嗜热泉生古细菌、极端嗜热菌(T.thermophilus)等;或真核生物体;(b) 在RS(任选地突变RS)的文库中选择(和/或筛选)在存在非天然编码氨基酸和 天然氨基酸的情况下使正交tRNA(O-tRNA)氨酰基化的成员,从而提供活性(任 选地突变)RS的池;和/或(c)在所述池中选择(任选地通过阴性选择)在不存 在非天然编码氨基酸的情况下优先使O-tRNA氨酰基化的活性RS(包括(但不限 于)突变RS),从而提供至少一种重组O-RS;其中所述至少一种重组O-RS利用 非天然编码氨基酸优先使O-tRNA氨酰化。
在一实施例中,RS为非活性RS。非活性RS可通过使活性RS突变而产生。 举例来说,可通过使至少约1个、至少约2个、至少约3个、至少约4个、至少 约5个、至少约6个或至少约10个或10个以上氨基酸突变为不同氨基酸(包括 (但不限于)丙氨酸)来产生非活性RS。
可使用所属领域中已知的各种技术来产生突变RS的文库,所述技术包括(但 不限于)以蛋白质三维RS结构为基础的合理设计或在随机或合理设计技术中RS 核苷酸的诱变。举例来说,可通过位点特异性突变、随机突变、产生多样性的重 组突变、嵌合构筑体、合理设计以及本文中所述或所属领域中已知的其它方法产 生突变RS。
在一实施例中,在RS(任选地突变RS)的文库中选择(和/或筛选)(包括 (但不限于))在存在非天然编码氨基酸和天然氨基酸的情况下使正交tRNA (O-tRNA)氨酰基化的活性成员包括:将阳性选择或筛选标记(包括(但不限于) 抗生素抗性基因等)和(任选地突变)RS的文库引入多个细胞中,其中阳性选择 和/或筛选标记包含至少一个选择密码子(包括(但不限于)琥珀、赭石或蛋白石 密码子);使所述多个细胞在存在选择剂的情况下生长;通过抑制阳性选择或筛选 标记中的至少一个选择密码子来鉴别在存在选择剂和/或筛选剂的情况下存活(或 显示特异性反应)的细胞,从而提供含有活性(任选地突变)RS的池的经阳性选 择细胞的子集。任选地可改变选择剂和/或筛选剂浓度。
一方面,阳性选择标记为氯霉素(chloramphenicol)乙酰基转移酶(CAT) 基因并且在CAT基因中,选择密码子为琥珀终止密码子。任选地,阳性选择标记 为β-内酰胺酶基因且在β-内酰胺酶基因中,选择密码子为琥珀终止密码子。另 一方面,阳性筛选标记包含荧光或发光筛选标记或基于亲和性的筛选标记(包括 (但不限于)细胞表面标记)。
在一实施例中,在池中阴性选择或筛选在不存在非天然编码氨基酸的情况下 优先使O-tRNA氨酰基化的活性RS(任选地突变体)包括:将阴性选择或筛选标 记与来自阳性选择或筛选的活性(任选地突变)RS的池引入第二生物体的多个细 胞中,其中阴性选择或筛选标记包含至少一个选择密码子(包括(但不限于)抗 生素抗性基因,其包括(但不限于)氯霉素乙酰基转移酶(CAT)基因);以及鉴 别在补充有非天然编码氨基酸和筛选剂或选择剂的第一培养基中存活或显示特异 性筛选反应、但在未补充非天然编码氨基酸和选择剂或筛选剂的第二培养基中不 能存活或显示特异性反应的细胞,从而提供具有至少一种重组O-RS的存活细胞 或筛选细胞。举例来说,CAT鉴别方案在适当O-RS重组体的确定中任选地充当 阳性选择和/或阴性筛选。举例来说,任选地在存在或不存在一个或一个以上非天 然编码氨基酸的情况下在含有CAT(其包含至少一个选择密码子)的生长板上复 制克隆池。因此,认为仅在含有非天然编码氨基酸的平板上生长的菌落含有重组 O-RS。一方面,改变选择(和/或筛选)剂的浓度。在一些方面中,第一生物体与 第二生物体不同。因此,第一生物体和/或第二生物体任选地包含:原核生物、真 核生物、哺乳动物、大肠杆菌、真菌、酵母、古细菌(archaebacterium)、真细菌 (eubacterium)、植物、昆虫、原生生物等。在其它实施例中,筛选标记包含荧光 或发光筛选标记或基于亲和性的筛选标记。
在另一实施例中,在池中筛选或选择(包括(但不限于)阴性选择)活性(任 选地突变)RS包括:从阳性选择步骤(b)分离活性突变RS的池;将阴性选择 或筛选标记和活性(任选地突变)RS的池引入第二生物体的多个细胞中,其中阴 性选择或筛选标记包含至少一个选择密码子(包括(但不限于)包含至少一个选 择密码子的毒性标记基因,其包括(但不限于)核糖核酸酶barnase基因);以及 鉴别在未补充非天然编码氨基酸的第一培养基中存活或显示特异性筛选反应、但 在补充有非天然编码氨基酸的第二培养基中不能存活或显示特异性筛选反应的细 胞,从而提供具有至少一种重组O-RS的存活细胞或筛选细胞,其中所述至少一 种重组O-RS对非天然编码氨基酸具特异性。一方面,所述至少一个选择密码子 包含约两个或两个以上选择密码子。这些实施例任选地可包括所述至少一个选择 密码子包含两个或两个以上选择密码子的情形,以及第一生物体与第二生物体不 同(包括(但不限于)各生物体任选地为(包括(但不限于))原核生物、真核生 物、哺乳动物、大肠杆菌、真菌、酵母、古细菌、真细菌、植物、昆虫、原生生 物等)的情形。另外,一些方面包括阴性选择标记包含核糖核酸酶barnase基因(其 包含至少一个选择密码子)的情形。其它方面包括筛选标记任选地包含荧光或发 光筛选标记或基于亲和性的筛选标记的情形。在本文中的实施例中,筛选和/或选 择任选地包括筛选和/或选择严格度的变化。
在一实施例中,用于产生至少一种重组正交氨酰基-tRNA合成酶(O-RS)的 方法可进一步包含:(d)分离所述至少一种重组O-RS;(e)产生来源于所述至少 一种重组O-RS的第二组O-RS(任选地突变体);以及(f)重复步骤(b)和(c), 直到获得包含优先使O-tRNA氨酰基化的能力的突变O-RS。任选地,将步骤(d) -(f)重复(包括(但不限于))至少约两次。一方面,可通过诱变(包括(但不 限于)随机诱变、位点特异性诱变、重组或其组合)产生来源于至少一种重组O-RS 的第二组突变O-RS。
在上述方法中,选择/筛选步骤(包括(但不限于)阳性选择/筛选步骤(b)、 阴性选择/筛选步骤(c)或阳性与阴性选择/筛选步骤(b)与(c))的严格度任选 地包括改变选择/筛选严格度。在另一实施例中,阳性选择/筛选步骤(b)、阴性选 择/筛选步骤(c)或阳性与阴性选择/筛选步骤(b)与(c)包含使用报告基因, 其中报告基因是通过荧光激活细胞分类(FACS)检测或其中报告基因是通过发光 检测。报告基因任选地呈现于细胞表面、噬菌体呈现上等且根据涉及非天然编码 氨基酸或类似物的亲和性或催化活性进行选择。在一实施例中,突变合成酶是呈 现于细胞表面、噬菌体呈现(phagedisplay)等上。
用于产生重组正交tRNA(O-tRNA)的方法包括:(a)由第一生物体产生来 源于至少一种tRNA(包括(但不限于)抑制银子tRNA)的突变tRNA文库;(b) 在所述文库中选择(包括(但不限于)阴性选择)或筛选在不存在来自第一生物 体的RS的情况下由来自第二生物体的氨酰基-tRNA合成酶(RS)氨酰基化的(任 选地突变)tRNA,从而提供tRNA(任选地突变体)的池;以及(c)在所述tRNA (任选地突变体)池中选择或筛选通过引入的正交RS(O-RS)氨酰基化的成员, 从而提供至少一种重组O-tRNA;其中所述至少一种重组O-tRNA识别选择密码子 且无法由来自第二生物体的RS有效识别且通过O-RS优先氨酰基化。在一些实施 例中,所述至少一种tRNA为抑制因子tRNA和/或包含具有天然和/或非天然碱基 的独特三碱基密码子,或为无义密码子、稀有密码子、非天然密码子、包含至少 4个碱基的密码子、琥珀密码子、赭石密码子或蛋白石终止密码子。在一实施例 中,重组O-tRNA具有正交性的改良。应了解在一些实施例中,O-tRNA无需修饰 而任选地从第二生物体引入第一生物体中。在各种实施例中,第一生物体与第二 生物体相同或不同并且任选地选自(包括(但不限于))原核生物(包括(但不限 于)詹氏甲烷球菌、嗜热自养甲烷杆菌、大肠杆菌、嗜盐菌等)、真核生物、哺乳 动物、真菌、酵母、古细菌、真细菌、植物、昆虫、原生生物等。另外,重组tRNA 是由非天然编码氨基酸任选地氨酰基化,其中非天然编码氨基酸是在活体内天然 生物合成或通过基因操纵生物合成。任选地将非天然编码氨基酸添加到至少第一 生物体或第二生物体的生长培养基中。
一方面,在所述文库中选择(包括(但不限于)阴性选择)或筛选通过氨酰 基-tRNA合成酶氨酰基化的(任选地突变)tRNA(步骤(b))包括:将毒性标记 基因和(任选地突变)tRNA文库引入来自第二生物体的多个细胞中,其中毒性 标记基因包含至少一个选择密码子(或导致产生毒性剂或抑制剂(staticagent)的 基因或生物体必需的基因,其中所述标记基因包含至少一个选择密码子);以及选 择存活细胞,其中存活细胞含有包含至少一个正交tRNA或非功能性tRNA的(任 选地突变)tRNA的池。举例来说,可通过使用比较比率细胞密度测定来选择存 活细胞。
另一方面,毒性标记基因可包括两个或两个以上选择密码子。在所述方法的 另一实施例中,毒性标记基因为核糖核酸酶barnase基因,其中核糖核酸酶barnase 基因包含至少一个琥珀密码子。核糖核酸酶barnase基因任选地可包括两个或两个 以上琥珀密码子。
在一实施例中,在(任选地突变)tRNA的池中选择或筛选通过引入的正交 RS(O-RS)氨酰基化的成员可包括:将阳性选择或筛选标记基因以及O-RS和(任 选地突变)tRNA的池引入来自第二生物体的多个细胞中,其中阳性标记基因包 含药物抗性基因(其包括(但不限于)β-内酰胺酶基因,其包含至少一个选择密 码子,例如至少一个琥珀终止密码子)或生物体必需的基因或使得毒性剂解毒的 基因;以及鉴别在存在选择剂或筛选剂(包括(但不限于)抗生素)的情况下生 长的存活或筛选细胞,从而提供具有至少一种重组tRNA的细胞池,其中所述至 少一种重组tRNA是通过O-RS氨酰基化且响应所述至少一个选择密码子而将氨 基酸插入由阳性标记基因编码的翻译产物中。在另一实施例中,改变选择剂和/ 或筛选剂的浓度。
提供用于产生特异性O-tRNA/O-RS对的方法。所述方法包括:(a)由第一生 物体产生来源于至少一种tRNA的突变tRNA的文库;(b)在所述文库中阴性选 择或筛选在不存在来自第一生物体的RS的情况下通过来自第二生物体的氨酰基 -tRNA合成酶(RS)氨酰基化的(任选地突变)tRNA,从而提供(任选地突变) tRNA池;(c)在(任选地突变)tRNA池中选择或筛选通过引入的正交RS(O-RS) 氨酰基化的成员,从而提供至少一种重组O-tRNA。所述至少一种重组O-tRNA 识别选择密码子并且无法由来自第二生物体的RS有效识别且通过O-RS优先氨酰 基化。所述方法还包括(d)由第三生物体产生来源于至少一种氨酰基-tRNA合成 酶(RS)的(任选地突变)RS的文库;(e)在所述突变RS文库中选择或筛选在 存在非天然编码氨基酸和天然氨基酸的情况下优先使所述至少一种重组O-tRNA 氨酰基化的成员,从而提供活性(任选地突变)RS池;和(f)在所述池中阴性 选择或筛选在不存在非天然编码氨基酸的情况下优先使所述至少一种重组 O-tRNA氨酰基化的活性(任选地突变)RS,从而提供至少一个特异性 O-tRNA/O-RS对,其中所述至少一个特异性O-tRNA/O-RS对包含至少一种对非 天然编码氨基酸具特异性的重组O-RS和所述至少一种重组O-tRNA。包括由所述 方法产生的特异性O-tRNA/O-RS对。举例来说,特异性O-tRNA/O-RS对可包括 (包括(但不限于))mutRNATyr-mutTyrRS对(例如mutRNATyr-SS12TyrRS对)、 mutRNALeu-mutLeuRS对、mutRNAThr-mutThrRS对、mutRNAGlu-mutGluRS对 等。另外,所述方法包括第一与第三生物体相同(其包括(但不限于)詹氏甲烷 球菌)的情形。
本发明中还包括选择用于第二生物体的活体内翻译系统中的正交 tRNA-tRNA合成酶对的方法。所述方法包括:将标记基因、tRNA和从第一生物 体分离或获得的氨酰基-tRNA合成酶(RS)引入来自第二生物体的第一组细胞中; 将标记基因和tRNA引入来自第二生物体的复制细胞组中;以及选择在复制细胞 组中不能存活的第一组中的存活细胞或筛选显示特异性筛选反应但在复制细胞组 中不能提供这种反应的细胞,其中第一组与复制细胞组是在存在选择剂或筛选剂 的情况下生长,其中存活或筛选细胞包含用于第二生物体的活体内翻译系统中的 正交tRNA-tRNA合成酶对。在一实施例中,比较和选择或筛选包括活体内互补测 定。可改变选择剂或筛选剂的浓度。
本发明的生物体包含多种生物体和多种组合。举例来说,本发明方法的第一 生物体与第二生物体可能相同或不同。在一实施例中,生物体任选地为原核生物 体,包括(但不限于)詹氏甲烷球菌、嗜热自养甲烷杆菌、嗜盐菌、大肠杆菌、 超嗜热古菌、强烈炽热球菌、极端嗜热古菌、嗜热泉生古细菌、极端嗜热菌等。 或者,生物体任选地包含真核生物体,包括(但不限于)植物(包括(但不限于) 复杂植物,例如单子叶植物或双子叶植物)、藻类、原生生物、真菌(包括(但不 限于)酵母等)、动物(包括(但不限于)哺乳动物、昆虫、节肢动物等)等。在 另一实施例中,第二生物体为原核生物体,包括(但不限于)詹氏甲烷球菌、嗜 热自养甲烷杆菌、嗜盐菌、大肠杆菌、超嗜热古菌、嗜盐菌、强烈炽热球菌、极 端嗜热古菌、嗜热泉生古细菌、极端嗜热菌等。或者,第二生物体可为真核生物 体,包括(但不限于)酵母、动物细胞、植物细胞、真菌、哺乳动物细胞等。在 各个实施例中,第一生物体与第二生物体不同。
非天然存在氨基酸在胰岛素多肽中的位置
本发明涵盖将一个或一个以上非天然存在氨基酸并入胰岛素多肽中。可将一 个或一个以上非天然存在氨基酸并入特定位置处而不破坏多肽活性。这可通过进 行“保守”取代来实现,所述取代包括(但不限于)用疏水性氨基酸取代疏水性 氨基酸、用庞大氨基酸取代庞大氨基酸、用亲水性氨基酸取代亲水性氨基酸和/ 或在活性不需要的位置中插入非天然存在氨基酸。
可使用多种生物化学和结构方法来选择胰岛素多肽内供非天然编码氨基酸取代所需的位点。所属领域的技术人员显而易见,多肽链的任何位置都适于选择以并入非天然编码氨基酸,并且选择可基于合理设计或通过随机选择来进行以实现任何目的或无特定需要的目的。所需位点的选择可用于产生具有任何所需性质或活性的胰岛素分子(包括(但不限于)激动剂、超激动剂、反向激动剂、拮抗剂、受体结合调节剂、受体活性调节剂)、二聚物或多聚物形成、与天然分子相比不改变活性或性质,或操纵多肽的任何物理或化学性质(例如溶解性、聚集或稳定性)。举例来说,可使用所属领域中已知的点突变分析、丙氨酸扫描、饱和诱变和生物活性筛选或同源物扫描方法来鉴别多肽中为胰岛素多肽的生物活性所需的位置。可使用其它方法鉴别用于修饰胰岛素多肽的残基,包括(但不限于)序列信息分析(sequenceprofiling)(Bowie和Eisenberg,Science253(5016):164-70,(1991))、旋转异构体文库选择(Dahiyat和Mayo,ProteinSci5(5):895-903(1996);Dahiyat和Mayo,Science278(5335):82-7(1997);Desjarlais和Handel,ProteinScience4:2006-2018(1995);Harbury等人,PNASUSA92(18):8408-8412(1995);Kono等人,Proteins:Structure,FunctionandGenetics19:244-255(1994);Hellinga和Richards,PNASUSA91:5803-5807(1994));和残基对势(residuepairpotential)(Jones,ProteinScience3:567-574,(1994))以及使用ProteinDesign技术合理设计。(参见美国专利第6,188,965号、第6,269,312号、第6,403,312号、WO98/47089,其以引用的方式并入本文中)。对胰岛素生物活性至关重要的残基、与医药稳定性有关的残基、抗体表位或受体结合残基可发生突变。美国专利第5,580,723号、第5,834,250号、第6,013,478号、第6,428,954号和第6,451,561号(其是以引用的方式并入本文中)描述通过用标靶物质鉴别影响多肽活性的活性域来系统分析多肽(诸如胰岛素)的结构和功能的方法。除通过丙氨酸或同源物扫描诱变被鉴别为对生物活性至关重要的残基之外的残基可视多肽所追求的所需活性而为供非天然编码氨基酸取代的良好候选者。或者,经鉴别为对生物活性至关重要的位点也可视多肽所追求的所需活性而为供非天然编码氨基酸取代的良好候选者。另一替代方法将为在多肽链上的各个位置中利用非天然编码氨基酸简单地进行连续取代并且观察对多肽活性的影响。所属领域的技术人员显而易见,在任何多肽中选择供非天然氨基酸取代的位置的任何方式、技术或方法都适用于本发明中。
也可检查含有缺失的胰岛素多肽的突变体的结构和活性以确定可能允许用非 天然编码氨基酸进行取代的蛋白质区。可以类似方式使用蛋白酶消化和单克隆抗 体来鉴别负责结合胰岛素受体的胰岛素区。在排除可能不允许经非天然编码氨基 酸取代的残基后,可研究所提出的取代在各剩余位置处的影响。可根据其它胰岛 素家族成员和胰岛素受体的三维晶体结构产生模型。蛋白质数据库(ProteinData Bank;PDB,通过万维网在rcsb.org上获得)是含有蛋白质和核酸大分子的三维 结构数据的集中数据库。如果无法获得三维结构数据,那么可建立模型来研究多 肽的二级和三级结构。因此,所属领域的技术人员可容易地鉴别可经非天然编码 氨基酸取代的氨基酸位置。
在一些实施例中,本发明的胰岛素多肽包含位于不破坏多肽的结构的蛋白质 区中的一个或一个以上非天然编码氨基酸。
并入非天然编码氨基酸的示范性残基可能为潜在受体结合区中不包括的残 基,可能完全或部分暴露在溶剂中,与附近残基具有最小或无氢键结相互作用, 可能最低程度地受到附近的反应性残基影响,可能位于一个或一个以上暴露面上, 可能为一个或一个以上与第二胰岛素或其它分子或其片段并列的位点,可能处于 如根据与受体结合或未结合或者与另一生物活性分子偶合或未偶合的胰岛素的三 维、二级、三级或四级结构所预测的高度柔性或结构呈刚性的区中,或可能通过 按需要改变完整结构的柔性或刚性来调节胰岛素本身或包含一个或一个以上胰岛 素的二聚物或多聚物的构象。
所属领域的技术人员认识到,这种对胰岛素的分析使得能够确定哪些氨基酸 残基相比于隐藏在蛋白质三级结构内的氨基酸残基来说是表面暴露的。因此,用 非天然编码氨基酸取代作为表面暴露残基的氨基酸是本发明的一实施例。
在一些实施例中,一个或一个以上非天然编码氨基酸并入胰岛素的一个或一 个以上以下位置处:在A链中,位置1(即在N端)之前、1、2、3、4、5、6、 7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22(即在蛋白质 的羧基端)和其任何组合(SEQIDNO:1);或在B链中,位置1(即在N端)之 前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、21、22、23、24、25、26、27、28、29、30、31(SEQIDNO:2)。
关于胰岛素的晶体结构以及其与胰岛素受体的相互作用的研究可指示哪些特 定氨基酸残基具有可完全或部分接近溶剂的侧链。这些位置处的非天然编码氨基 酸侧链可远离蛋白质表面并进入溶剂中。
在一些实施例中,一个或一个以上以下位置处的非天然编码氨基酸与水溶性 聚合物连接,包括(但不限于)位置:在A链中,位置1(即在N端)之前、1、 2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、 22(即在蛋白质的羧基端)和其任何组合(SEQIDNO:1);或在B链中,位置1 (即在N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、 17、18、19、20、21、22、23、24、25、26、27、28、29、30、31(SEQIDNO: 2)。
可用多种非天然编码氨基酸取代胰岛素多肽中的给定位置,或可将多种非天 然编码氨基酸并入胰岛素多肽中的给定位置中。一般来说,根据对胰岛素多肽或 其它胰岛素家族成员或胰岛素类似物与其受体的三维晶体结构的研究来选择供并 入的特定非天然编码氨基酸,其中优选保守取代(即,用基于芳基的非天然编码 氨基酸(例如对乙酰基苯丙氨酸或O-炔丙基酪氨酸)取代Phe、Tyr或Trp)以及 希望引入胰岛素多肽中的特异性结合化学(例如,如果需要利用具有炔部分的水 溶性聚合物来实现休根斯[3+2]环加成,或需要利用具有芳基酯(其又并入膦部分) 的水溶性聚合物来形成酰胺键,那么引入4-叠氮基苯丙氨酸)。
在一实施例中,所述方法进一步包括将非天然氨基酸并入蛋白质中,其中所 述非天然氨基酸包含第一反应性基团;以及使蛋白质与包含第二反应性基团的分 子(包括(但不限于)标记、染料、聚合物、水溶性聚合物、聚乙二醇的衍生物、 光交联剂、放射性核素、细胞毒性化合物、药物、亲和性标记、光亲和性标记、 反应性化合物、树脂、第二蛋白质或多肽或多肽类似物、抗体或抗体片段、金属 螯合剂、辅因子、脂肪酸、碳水化合物、多核苷酸、DNA、RNA、反义多核苷酸、 糖类、水溶性树枝状聚合物、环糊精、抑制性核糖核酸、生物材料、纳米粒子、 自旋标记、荧光团、含金属的部分、放射性部分、新颖官能团、与其它分子共价 或非共价相互作用的基团、光笼化部分、光化辐射可激发的部分、可光致异构化 部分、生物素、生物素衍生物、生物素类似物、结合有重原子的部分、可化学裂 解的基团、可光裂解的基团、延长的侧链、碳连接的糖、氧化还原活性剂、氨基 硫代酸、毒性部分、经同位素标记的部分、生物物理探针、磷光基团、化学发光 基团、电子致密基团、磁性基团、插入基团、发色团、能量转移剂、生物活性剂、 可检测标记、小分子、量子点、纳米传递素、放射性核苷酸、放射性传递素、中 子俘获剂或上述物质的任何组合,或任何其它所需化合物或物质)接触。第一反 应性基团与第二反应性基团反应以使分子通过[3+2]环加成与非天然氨基酸连接。 在一实施例中,第一反应性基团为炔基或叠氮部分,并且第二反应性基团为叠氮 基或炔基部分。举例来说,第一反应性基团为炔基部分(包括(但不限于)在非 天然氨基酸对炔丙基氧基苯丙氨酸中)并且第二反应性基团为叠氮部分。在另一 实例中,第一反应性基团为叠氮部分(包括(但不限于)在非天然氨基酸对叠氮 基-L-苯丙氨酸中)并且第二反应性基团为炔基部分。
在一些情况下,将非天然编码氨基酸取代与胰岛素多肽内的其它添加、取代 或缺失组合以影响胰岛素多肽的其它生物特性。在一些情况下,其它添加、取代 或缺失可增加胰岛素多肽的稳定性(包括(但不限于)对蛋白水解降解的抗性) 或增加胰岛素多肽对其受体的亲和性。在一些情况下,其它添加、取代或缺失可 增加胰岛素多肽的医药稳定性。在一些情况下,其它添加、取代或缺失可增强胰 岛素多肽的抗病毒活性。在一些情况下,其它添加、取代或缺失可增加胰岛素多 肽的溶解性(包括(但不限于)在大肠杆菌或其它宿主细胞中表达时)。在一些实 施例中,添加、取代或缺失可增加胰岛素多肽在大肠杆菌或其它重组宿主细胞中 表达之后的溶解性。在一些实施例中,除并入非天然氨基酸的位点外还选择另一 位点以供天然编码或非天然氨基酸取代,这使得在大肠杆菌或其它重组宿主细胞 中表达后多肽溶解性增加。在一些实施例中,胰岛素多肽包含另一添加、取代或 缺失,其调节对胰岛素多肽受体、结合蛋白或缔合配体的亲和性,调节与胰岛素 受体结合后的信号转导,调节循环半衰期,调节释放或生物可用性,促进纯化或 改良或改变特定投药途径。在一些实施例中,胰岛素多肽包含增加胰岛素变异体 对其受体的亲和性的添加、取代或缺失。类似地,胰岛素多肽可包含改良多肽的 检测(包括(但不限于)GFP)、纯化、通过组织或细胞膜的转运、前药释放或活 化、胰岛素尺寸减小或其它特性的化学或酶裂解序列、蛋白酶裂解序列、反应性 基团、抗体结合域(包括(但不限于)FLAG或poly-His)或其它基于亲和性的 序列(包括(但不限于)FLAG、poly-His、GST等)或连接分子(包括(但不限 于)生物素)。
在一些实施例中,非天然编码氨基酸的取代产生胰岛素拮抗剂。在一些实施 例中,在与受体结合有关的区中取代或添加非天然编码氨基酸。在一些实施例中, 胰岛素拮抗剂包含至少一个使胰岛素充当拮抗剂的取代。在一些实施例中,胰岛 素拮抗剂包含与水溶性聚合物连接的非天然编码氨基酸,其存在于胰岛素分子的 受体结合区中。
在一些情况下,用一个或一个以上非天然编码氨基酸取代1、2、3、4、5、6、 7、8、9、10或10个以上氨基酸。在一些情况下,胰岛素多肽进一步包括1、2、 3、4、5、6、7、8、9、10或10个以上用一个或一个以上非天然编码氨基酸对天 然存在氨基酸的取代。举例来说,在一些实施例中,用一个或一个以上非天然编 码氨基酸取代胰岛素中的一个或一个以上残基。在一些情况下,将一个或一个以 上非天然编码残基与一个或一个以上较低分子量的线性或分支PEG连接,从而相 对于与单一较高分子量PEG连接的物质增强结合亲和性并且具有相当的血清半 衰期。
在一些实施例中,胰岛素的以下残基中至多有两个残基经一个或一个以上非 天然编码氨基酸取代。
非真核细胞和真核细胞中的表达
为获得克隆胰岛素多核苷酸的高水平表达,通常将编码本发明的胰岛素多肽 的多核苷酸亚克隆到含有指导转录的强启动子、转录/翻译终止子以及(如果就编 码蛋白质的核酸来说)供翻译起始的核糖体结合位点的表达载体中。所属领域的 技术人员已知合适的细菌启动子,并且其例如描述于Sambrook等人以及Ausubel 等人中。
用于表达本发明的胰岛素多肽的细菌表达系统可在(包括(但不限于))大肠 杆菌、芽孢杆菌(Bacillussp.)、荧光假单胞菌、绿脓杆菌、恶臭假单胞菌和沙门 氏菌(Salmonella)中获得(Palva等人,Gene22:229-235(1983);Mosbach等人, Nature302:543-545(1983))。用于这些表达系统的试剂盒在市面上有售。所属领域 的技术人员已知哺乳动物细胞、酵母和昆虫细胞的真核表达系统,并且其也在市 面上有售。在使用正交tRNA和氨酰基tRNA合成酶(上述)来表达本发明的胰 岛素多肽的情况下,用于表达的宿主细胞是根据其使用正交组分的能力进行选择。 示范性宿主细胞包括革兰氏阳性细菌(Gram-positivebacteria)(包括(但不限于) 短小芽孢杆菌(B.brevis)、枯草杆菌(B.subtilis)或链霉菌(Streptomyces))和 革兰氏阴性细菌(Gram-negativebacteria)(大肠杆菌、荧光假单胞菌、绿脓杆菌、 恶臭假单胞菌),以及酵母和其它真核细胞。如本文中所述,可使用包含 O-tRNA/O-RS对的细胞。
本发明的真核宿主细胞或非真核宿主细胞提供合成较大有用量的包含非天然 氨基酸的蛋白质的能力。一方面,组合物任选地包括(包括(但不限于))至少 10微克、至少50微克、至少75微克、至少100微克、至少200微克、至少250 微克、至少500微克、至少1毫克、至少10毫克、至少100毫克、至少1克或1 克以上包含非天然氨基酸的蛋白质,或可通过活体内蛋白质制备方法所实现的量 的所述蛋白质(关于重组蛋白制备和纯化的细节提供于本文中)。另一方面,所述 蛋白质任选地以在(包括(但不限于))细胞溶菌液、缓冲液、医药缓冲液或其它 液体悬浮液(包括(但不限于)体积(包括(但不限于))约为约1nl到约100L 或100L以上)中(包括(但不限于))每升至少10微克蛋白质、每升至少50微 克蛋白质、每升至少75微克蛋白质、每升至少100微克蛋白质、每升至少200 微克蛋白质、每升至少250微克蛋白质、每升至少500微克蛋白质、每升至少1 毫克蛋白质或每升至少10毫克或10毫克以上蛋白质的浓度存在于组合物中。在 真核细胞中产生大量(包括(但不限于)大于用其它方法(包括(但不限于)活 体外翻译)通常可能获得的量)包括至少一个非天然氨基酸的蛋白质是本发明的 特征。
本发明的真核宿主细胞或非真核宿主细胞提供生物合成较大有用量的包含非 天然氨基酸的蛋白质的能力。举例来说,可在细胞提取物、细胞溶菌液、培养基、 缓冲液等中产生蛋白质浓度为(包括(但不限于))至少10微克/升、至少50微 克/升、至少75微克/升、至少100微克/升、至少200微克/升、至少250微克/升 或至少500微克/升、至少1毫克/升、至少2毫克/升、至少3毫克/升、至少4毫 克/升、至少5毫克/升、至少6毫克/升、至少7毫克/升、至少8毫克/升、至少9 毫克/升、至少10毫克/升、至少20、30、40、50、60、70、80、90、100、200、 300、400、500、600、700、800、900毫克/升、1克/升、5克/升、10克/升或10 克/升以上的包含非天然氨基酸的蛋白质。
多种适于表达胰岛素的载体都可购得。有效用于真核生物宿主的表达载体包 括(但不限于)包含来自SV40、牛乳头瘤病毒、腺病毒以及细胞肥大病毒的表达 控制序列的载体。这些载体包括pCDNA3.1(+)\Hyg(Invitrogen,Carlsbad,Calif, USA)和pCI-neo(Stratagene,LaJolla,Calif.,USA)。可使用细菌质粒,例如来自 大肠杆菌的质粒(包括pBR322、pET3a和pET12a)、较宽宿主范围质粒(例如 RP4);噬菌体DNA,例如噬菌体λ(例如NM989)和其它DNA噬菌体(例如 M13和丝状单链DNA噬菌体)的多种衍生物。2μ质粒和其衍生物、POT1载体 (美国专利第4,931,373号,其以引用的方式并入本文中)、(Okkels,Ann.NewYork Aced.Sci.782,202207,1996)中描述的pJS037载体以及pPICZA、B或C (Invitrogen)可与酵母宿主细胞一起使用。对于昆虫细胞,载体包括(但不限于) pVL941、pBG311(Cate等人,″IsolationoftheBovineandHumanGenesfor MullerianInhibitingSubstanceAndExpressionoftheHumanGeneInAnimalCells″, Cell,45,第68598页(1986))、pBluebac4.5以及pMelbac(Invitrogen,Carlsbad, CA)。
编码胰岛素多肽的核苷酸序列还可包括或可不包括编码信号肽的序列。当多 肽是由表达所述多肽的细胞分泌时,存在信号肽。这种信号肽可为任何序列。信 号肽可为原核生物信号肽或真核生物信号肽。Coloma,M(1992)J.Imm.Methods 152:89104)描述用于哺乳动物细胞中的信号肽(鼠类Igκ轻链信号肽)。其它信 号肽包括(但不限于)来自酿酒酵母的α-因子信号肽(美国专利第4,870,008号, 其以引用的方式并入本文中)、小鼠唾液淀粉酶的信号肽(O.Hagenbuchle等人, Nature289,1981,第643-646页)、经修饰的羧基肽酶信号肽(L.A.Vails等人,Cell 48,1987,第887-897页)、酵母BAR1信号肽(WO87/02670,其以引用的方式并 入本文中)以及酵母天冬胺酸蛋白酶3(yeastasparticprotease3,YAP3)信号肽 (参见M.Egel-Mitani等人,Yeast6,1990,第127-137页)。
所属领域的技术人员已知合适哺乳动物宿主细胞的实例。这些宿主细胞可为 中国仓鼠卵巢(Chinesehamsterovary,CHO)细胞(例如CHO-K1;ATCC-CCL-61)、 绿猴细胞(GreenMonkeycell,COS)(例如COS1(ATCCCRL-1650)、COS7 (ATCCCRL-1651))、小鼠细胞(例如NS/O)、幼仓鼠肾(BabyHamsterKidney, BHK)细胞系(例如(ATCCCRL-1632或ATCCCCL-10)和人类细胞(例如HEK 293(ATCCCRL-1573))以及组织培养中的植物细胞。这些细胞系和其它细胞系 可自例如美国典型微生物菌种保藏中心(AmericanTypeCultureCollection, Rockville,Md)等公共寄存场所获得。为改进胰岛素多肽的糖基化,可修饰哺乳 动物宿主细胞以表达唾液酸转移酶,举例来说,如例如美国专利第5,047,335号中 所述的1,6-唾液酸转移酶,所述专利以引用的方式并入本文中。
将外源DNA引入哺乳动物宿主细胞中的方法包括(但不限于)磷酸钙介导 的转染、电穿孔、DEAE-葡聚糖介导的转染、脂质体介导的转染、病毒载体以及 LifeTechnologiesLtd,Paisley,UK中所述的使用Lipofectamine2000的转染方法和 RocheDiagnosticsCorporation,Indianapolis,USA中所述的使用FuGENE6的转染 方法。这些方法在所属领域中为众所周知的且由Ausbel等人(编),1996,Current ProtocolsinMolecularBiology,JohnWiley&Sons,NewYork,USA描述。哺乳动物 细胞的培养可根据例如如(AnimalCellBiotechnology,MethodsandProtocols, NigelJenkins编,1999,HumanPressInc.Totowa,N.J.,USA;以及HarrisonMass.和 RaeIF,GeneralTechniquesofCellCulture,CambridgeUniversityPress1997)中所揭 示的确定方法来进行。
表达系统、培养和分离
胰岛素多肽可在任何数目的合适表达系统(例如包括酵母、昆虫细胞、哺乳 动物细胞和细菌)中表达。示范性表达系统的描述提供于下文中。
酵母如本文中所用,术语“酵母”包括能够表达编码胰岛素多肽的基因的各 种酵母中的任一种。所述酵母包括(但不限于)产子囊酵母(ascosporogenousyeast) (内孢霉目(Endomycetales))、担孢子酵母(basidiosporogenous)和属于半知菌 (芽孢纲(Blastomycetes))类的酵母。产子囊酵母分为两个科:蚀精霉科 (Spermophthoraceae)和酵母菌科(Saccharomycetaceae)。后者包含四个亚科,即 裂殖酵母亚科(Schizosaccharomycoideae)(例如裂殖酵母(Schizosaccharomyces) 属)、拿逊酵母亚科(Nadsonioideae)、脂酵母亚科(Lipomycoideae)以及酵母亚 科(Saccharomycoideae)(例如毕赤酵母(Pichia)属、克鲁维酵母(Kluyveromyces) 属和酵母菌(Saccharomyces)属)。担孢子酵母包括白冬孢酵母(Leucosporidium) 属、红冬孢酵母(Rhodosporidium)属、锁掷酵母(Sporidiobolus)属、线黑粉酵 母(Filobasidium)属和香灰拟锁担菌(Filobasidiella)属。属于半知菌(芽孢纲) 类的酵母分为两个科:掷孢酵母科(Sporobolomycelaceae)(例如掷孢酵母 (Sporoholomyces)属和布勒掷孢酵母(Bullera)属)和隐球酵母科(Cryptococcaceae) (例如假丝酵母(Candida)属)。
尤其受关注的供本发明使用的物种为毕赤酵母属、克鲁维酵母属、酵母菌属、 裂殖酵母属(Schizosaccharomyces)、汉逊酵母属(Hansenula)、球拟酵母属 (Torulopsis)和假丝酵母属内的物种,其包括(但不限于)巴斯德毕赤酵母(P. pastoris)、谷勒氏酵母(P.guillerimondii)、酿酒酵母、卡尔斯伯酵母(S. carlsbergensis)、糖化酵母(S.diastaticus)、道格拉斯酵母(S.douglasii)、克鲁维 酵母(S.kluyveri)、诺本酵母(S.norbensis)、卵形酵母(S.oviformis)、乳酸克 鲁维酵母(K.lactis)、脆壁克鲁维酵母(K.fragilis)、白假丝酵母菌(C.albicans)、 麦芽糖假丝酵母(C.maltosa)和汉森酵母(H.polymorpha)。
适用于表达胰岛素多肽的酵母的选择是在所属领域的技术人员的技能范围 内。在选择用于表达的酵母宿主时,合适的宿主可包括显示具有例如良好分泌能 力、低蛋白水解活性、良好分泌能力、良好可溶性蛋白质产生以及总体坚固性的 酵母宿主。酵母通常可获自多种来源,包括(但不限于)加利福尼亚大学生物物 理和医学物理系酵母基因保藏中心(YeastGeneticStockCenter,Departmentof BiophysicsandMedicalPhysics,UniversityofCalifornia,Berkeley,CA)和美国典型 菌种保藏中心(AmericanTypeCultureCollection,“ATCC”)(Manassas,VA)。
术语“酵母宿主”或“酵母宿主细胞”包括可用作或已用作重组载体或其它 转移DNA的接受者的酵母。所述术语包括已接受重组载体或其它转移DNA的原 始酵母宿主细胞的后代。应了解,由于偶发突变或故意突变,单一母体细胞的后 代在形态上或在与原始母体互补的基因组DNA或总DNA方面可能未必完全一 致。与将要以相关性质(例如存在编码胰岛素多肽的核苷酸序列)表征的母体充 分类似的母体细胞的后代包括在由此定义所指代的后代中。
已开发包括染色体外复制子或整合载体的表达和转化载体以将其转化到多种 酵母宿主中。举例来说,已开发用于以下各酵母的表达载体:酿酒酵母(Sikorski 等人,GENETICS(1989)122:19;Ito等人,J.BACTERIOL.(1983)153:163;Hinnen 等人,PROC.NATL.ACAD.SCI.USA(1978)75:1929);白假丝酵母菌(Kurtz等人, MOL.CELL.BIOL.(1986)6:142);麦芽糖假丝酵母(Kunze等人,J.BASIC MICROBIOL.(1985)25:141);汉森酵母(Gleeson等人,J.GEN.MICROBIOL. (1986)132:3459;Roggenkamp等人,MOL.GENETICSANDGENOMICS(1986) 202:302);脆壁克鲁维酵母(Das等人,J.BACTERIOL.(1984)158:1165);乳酸克 鲁维酵母(DeLouvencourt等人,J.BACTERIOL.(1983)154:737;VandenBerg等 人,BIOTECHNOLOGY(NY)(1990)8:135);谷勒氏酵母(Kunze等人,J.BASIC MICROBIOL.(1985)25:141);巴斯德毕赤酵母(美国专利第5,324,639号;第 4,929,555号;和第4,837,148号;Cregg等人,MOL.CELL.BIOL.(1985)5:3376); 粟酒裂殖酵母(Schizosaccharomycespombe)(Beach等人,NATURE(1982) 300:706);以及解脂耶氏酵母(Y.lipolytica);构巢曲霉(A.nidulans)(Ballance 等人,BIOCHEM.BIOPHYS.RES.COMMUN.(1983)112:284-89;Tilburn等人, GENE(1983)26:205-221;和Yelton等人,PROC.NATL.ACAD.SCI.USA(1984) 8l:1470-74);黑曲霉(A.niger)(Kelly和Hynes,EMBOJ.(1985)4:475-479);里 氏木霉(T.reesia)(EP0244234);和丝状真菌,例如脉孢菌(Neurospora)、青 霉菌(Penicillium)、弯颈霉(Tolypocladium)(WO91/00357),其中各文献是以 引用的方式并入本文中。
所属领域的技术人员已知用于酵母载体的控制序列,并且所述序列包括(但 不限于)来自以下基因的启动子区:例如,醇脱氢酶(ADH)(EP0284044);烯 醇酶;葡萄糖激酶;葡萄糖-6-磷酸异构酶;甘油醛-3-磷酸-脱氢酶(GAP或 GAPDH);己糖激酶;磷酸果糖激酶;3-磷酸甘油酸变位酶;和丙酮酸激酶(PyK) (EP0329203)。编码酸性磷酸酶的酵母PHO5基因也可提供适用的启动子序列 (Miyanohara等人,PROC.NATL.ACAD.SCI.USA(1983)80:1)。用于酵母宿主的 其它合适的启动子序列可包括3-磷酸甘油酸激酶(Hitzeman等人,J.BIOL.CHEM. (1980)255:12073)和其它糖解酶(例如丙酮酸脱羧酶、磷酸丙糖异构酶和磷酸葡 萄糖异构酶(Holland等人,BIOCHEMISTRY(1978)17:4900;Hess等人,J.ADV. ENZYMEREG.(1969)7:149))的启动子。具有由生长条件控制的转录的其它优点 的可诱导酵母启动子可包括醇脱氢酶2、异细胞色素C、酸性磷酸酶、金属硫蛋 白、甘油醛-3-磷酸脱氢酶、与氮代谢相关的降解酶以及负责麦芽糖和半乳糖利用 的酶的启动子区。适用于酵母表达的载体和启动子进一步描述于EP0073657中。
酵母增强子也可与酵母启动子一起使用。另外,合成启动子也可充当酵母启 动子。举例来说,酵母启动子的上游活化序列(UAS)可与另一酵母启动子的转 录活化区连接,从而产生合成杂合启动子。所述杂合启动子的实例包括与GAP转 录活化区连接的ADH调节序列。参见美国专利第4,880,734号和第4,876,197号, 其是以引用的方式并入本文中。杂合启动子的其它实例包括由ADH2、GAL4、 GAL10或PHO5基因的调节序列连接糖解酶基因(例如GAP或PyK)的转录活 化区所组成的启动子。参见EP0164556。此外,酵母启动子可包括具有与酵母 RNA聚合酶结合并起始转录的能力的非酵母来源的天然存在启动子。
可构成酵母表达载体的一部分的其它控制元件包括例如来自GAPDH或烯醇 酶基因的终止子(Holland等人,J.BIOL.CIIEM.(1981)256:1385)。另外,来自2 μ质粒来源的复制起点适用于酵母。适用于酵母的选择基因为酵母质粒中存在的 trp1基因。参见Tschumper等人,GENE(1980)10:157;Kingsman等人,GENE(1979) 7:141。trp1基因为缺乏在色氨酸中生长的能力的酵母的突变菌株提供选择标记。 类似地,由带有Leu2基因的已知质粒补充Leu2缺陷型酵母菌株(ATCC20,622 或38,626)。
所属领域的技术人员已知将外源DNA引入酵母宿主中的方法,并且所述方 法通常包括(但不限于)转化原生质球状体或经碱性阳离子处理的完整酵母宿主 细胞。举例来说,可根据Hsiao等人,PROC.NATL.ACAD.SCI.USA(1979)76:3829 和VanSolingen等人,J.BACT.(1977)130:946中所述的方法来进行酵母的转化。 然而,也可如SAMBROOK等人,MOLECULARCLONING:ALAB.MANUAL (2001)中通常所述来使用将DNA引入细胞中的其它方法(例如通过核注射、电穿 孔或原生质体融合)。随后,可使用所属领域的技术人员已知的标准技术来培养酵 母宿主细胞。
所属领域的技术人员已知在酵母宿主细胞中表达异源蛋白的其它方法。通常 参见美国专利公开案第20020055169号;美国专利第6,361,969号;第6,312,923 号;第6,183,985号;第6,083,723号;第6,017,731号;第5,674,706号;第5,629,203 号;第5,602,034号;和第5,089,398号;美国复审专利第RE37,343号和第RE35,749 号;PCT公开专利申请案WO99/07862;WO98/37208;和WO98/26080;欧洲 专利申请案EP0946736;EP0732403;EP0480480;WO90/10277;EP0340986; EP0329203;EP0324274;和EP0164556。还参见Gellissen等人,ANTON1E VANLEEUWENHOEK(1992)62(1-2):79-93;Romanos等人,YEAST(1992) 8(6):423-488;Goeddel,METHODSINENZYMOLOGY(1990)185:3-7,其各自以 引用的方式并入本文中。
在使用所属领域的技术人员已知的标准进料分批发酵方法进行的扩增阶段期 间,可使酵母宿主菌株在发酵罐中生长。所述发酵方法可适用于解释特定酵母宿 主的碳利用途径或表达控制模式的差异。举例来说,酵母菌酵母宿主的发酵可能 需要单一葡萄糖进料、复杂氮源(例如酪蛋白水解产物)和多种维生素补充。相 反,甲基营养型酵母巴斯德毕赤酵母可能需要甘油、甲醇和痕量矿物进料,但仅 需要简单铵(氮)盐以进行最佳生长和表达。例如参见美国专利第5,324,639号; Elliott等人,J.PROTEINCHEM.(1990)9:95;和Fieschko等人,BIOTECH.BIOENG. (1987)29:1113,其是以引用的方式并入本文中。
然而,所述发酵方法可具有与所用的酵母宿主菌株无关的某些常见特征。举 例来说,在扩增阶段期间,可将限制生长的营养素(通常为碳)添加到发酵罐中 以允许最大生长。另外,发酵方法通常使用经设计成含有适量碳、氮、基本盐、 磷和其它微量营养素(维生素、痕量矿物和盐等)的发酵培养基。适用于毕赤酵 母的发酵培养基的实例描述于美国专利第5,324,639号和第5,231,178号中,其是 以引用的方式并入本文中。
感染杆状病毒的昆虫细胞术语“昆虫宿主”或“昆虫宿主细胞”是指可用作 或已用作重组载体或其它转移DNA的接受者的昆虫。所述术语包括已经转染的 原始昆虫宿主细胞的后代。应了解,由于偶发突变或故意突变,单一母体细胞的 后代在形态上或在与原始母体互补的基因组DNA或总DNA方面可能未必完全相 同。与将要以相关性质(例如存在编码胰岛素多肽的核苷酸序列)表征的母体充 分类似的母体细胞的后代包括在由此定义所指代的后代中。胰岛素多肽的杆状病 毒表达适用于本发明且因为胰岛素可在包括细菌、哺乳动物细胞、昆虫细胞、酵 母或真菌的许多宿主细胞中生物合成,所以使用rDNA技术、多肽或其前体。本 发明的一实施例包括在细菌、酵母或哺乳动物细胞中生物合成胰岛素、经修饰胰 岛素、胰岛素多肽或胰岛素类似物。本发明的另一实施例包括在大肠杆菌或酵母 中进行生物合成。在哺乳动物细胞和转基因动物中生物合成的实例描述于Hakola, K.[MolecularandCellularEndocrinology,127:59-69,(1997)]中。
所属领域的技术人员已知适用于表达胰岛素多肽的昆虫细胞的选择。多种昆 虫物种在所属领域中得到充分描述并且在市面上有售,其包括埃及伊蚊(Aedes aegypti)、桑蚕(Bombyxmori)、黑腹果蝇(Drosophilamelanogaster)、草地贪夜 蛾(Spodopterafrugiperda)和粉纹夜蛾(Trichoplusiani)。在选择用于表达的昆 虫宿主时,合适的宿主可包括显示具有良好分泌能力、低蛋白水解活性和总体稳 固性的宿主。昆虫通常可获自多种来源,包括(但不限于)加利福尼亚大学生物 物理和医学物理系昆虫基因保藏中心(Berkeley,CA);和美国典型菌种保藏中心 (“ATCC”)(Manassas,VA)。
通常,感染杆状病毒的昆虫表达系统的组分包括:转移载体(通常为细菌质 粒),其含有杆状病毒基因组的片段和用于插入欲表达的异源基因的便利限制位 点;野生型杆状病毒,其具有与转移载体中的杆状病毒特异性片段同源的序列(这 允许将异源基因同源重组到杆状病毒基因组中);以及适当的昆虫宿主细胞和生长 培养基。所属领域中已知用于构建载体、转染细胞、挑选斑块、使细胞在培养物 中生长等的材料、方法和技术并且可使用描述这些技术的手册。
在将异源基因插入转移载体中之后,将载体和野生型病毒基因组转染到昆虫 宿主细胞中,其中载体与病毒基因组重组。表达经包装的重组病毒,并且鉴别和 纯化重组体斑块。用于杆状病毒/昆虫细胞表达系统的材料和方法可以试剂盒形式 购自例如InvitrogenCorp.(Carlsbad,CA)。所属领域的技术人员通常已知这些技 术,并且所述技术全面描述于SUMMERSANDSMITH,TEXASAGRICULTURAL EXPERIMENTSTATIONBULLETIN,第1555期,(1987)中,其是以引用的方式并 入本文中。还参见RICHARDSON,39METHODSINMOLECULARBIOLOGY: BACULOVIRUSEXPRESSIONPROTOCOLS(1995);AUSUBEL等人,CURRENT PROTOCOLSINMOLECULARBIOLOGY16.9-16.11(1994);KING和POSSEE, THEBACULOVIRUSSYSTEM:ALABORATORYGUIDE(1992);以及O′REILLY 等人,BACULOVIRUSEXPRESSIONVECTORS:ALABORATORYMANUAL (1992)。
实际上,所属领域的技术人员已知使用杆状病毒/昆虫细胞表达系统来制备各 种异源蛋白质。例如参见美国专利第6,368,825号;第6,342,216号;第6,338,846 号;第6,261,805号;第6,245,528号;第6,225,060号;第6,183,987号;第6,168,932 号;第6,126,944号;第6,096,304号;第6,013,433号;第5,965,393号;第5,939,285 号;第5,891,676号;第5,871,986号;第5,861,279号;第5,858,368号;第5,843,733 号;第5,762,939号;第5,753,220号;第5,605,827号;第5,583,023号;第5,571,709 号;第5,516,657号;第5,290,686号;WO02/06305;WO01/90390;WO01/27301; WO01/05956;WO00/55345;WO00/20032;WO99/51721;WO99/45130;WO 99/31257;WO99/10515;WO99/09193;WO97/26332;WO96/29400;WO 96/25496;WO96/06161;WO95/20672;WO93/03173;WO92/16619;WO 92/02628;WO92/01801;WO90/14428;WO90/10078;WO90/02566;WO 90/02186;WO90/01556;WO89/01038;WO89/01037;WO88/07082,其是以引 用的方式并入本文中。
所属领域中已知适用于杆状病毒/昆虫细胞表达系统的载体,并且所述载体例 如包括从杆状病毒苜蓿银纹夜蛾(Autographacalifornica)核型多角体病毒 (AcNPV)获得的昆虫表达和转移载体,其为不依赖于辅助细胞的病毒表达载体。 从此系统得到的病毒表达载体通常使用强病毒多角体蛋白基因启动子来驱动异源 基因的表达。通常参见O′Reilly等人,BACULOVIRUSEXPRESSIONVECTORS:A LABORATORYMANUAL(1992)。
在将外来基因插入杆状病毒基因组中之前,通常将包含启动子、前导序列(必 要时)、所关注的编码序列和转录终止序列的上述组分组装到中间错位构筑体 (intermediatetransplacementconstruct)(转移载体)中。中间错位构筑体通常保持 在能够稳定保持在宿主(例如细菌)中的复制子(例如染色体外元件(例如质粒)) 中。复制子将具有复制系统,因此使其保持在适用于克隆和扩增的宿主中。更具 体来说,质粒可含有多角体蛋白聚腺苷酸化信号(Miller,ANN.REV.MICROBIOL. (1988)42:177)和用于在大肠杆菌中选择和繁殖的原核氨比西林(ampicillin)抗 性(amp)基因和复制起点。
一种将外来基因引入AcNPV中的常用转移载体为pAc373。也已经对所属领 域的技术人员已知的多种其它载体进行设计,所述载体包括例如pVL985,其将多 角体蛋白起始密码子从ATG改变为ATT,并且其在ATT下游32个碱基对处引入 BamHI克隆位点。参见Luckow和Summers,VIROLOGY170:31(1989)。其它市售 载体例如包括PBlueBac4.5/V5-His;pBlueBacHis2;pMelBac;pBlueBac4.5 (InvitrogenCorp.,Carlsbad,CA)。
在插入异源基因之后,将转移载体和野生型杆状病毒基因组共转染到昆虫细 胞宿主中。所属领域中已知将异源DNA引入杆状病毒的所需位点中的方法。参 见SUMMERS和SMITH,TEXASAGRICULTURALEXPERIMENTSTATION BULLETIN,第1555期,(1987);Smith等人,MOL.CELL.BIOL.(1983)3:2156; Luckow和Summers,Virology(1989)170:31。举例来说,可通过同源双交叉重组插 入例如多角体蛋白基因等基因中;也可插入所需杆状病毒基因中工程改造过的限 制酶位点中。参见Miller等人,BIOESSAYS(1989)11(4):91。
可通过电穿孔来实现转染。参见TROTTER和WOOD,39METHODSINMOLECULARBIOLOGY(1995);Mann和King,J.GEN.VIROL.(1989)70:3501。或者,可使用脂质体以重组表达载体和杆状病毒转染昆虫细胞。例如参见Liebman等人,BIOTECHNIQUES(1999)26(1):36;Graves等人,BIOCHEMISTRY(1998)37:6050;Nomura等人,J.BIOL.CHEM.(1998)273(22):13570;Schmidt等人,PROTEINEXPRESSIONANDPURIFICATION(1998)12:323;Siffert等人,NATUREGENETICS(1998)18:45;TILK1NS等人,CELLBIOLOGY:ALABORATORYHANDBOOK145-154(1998);Cai等人,PROTEINEXPRESSIONANDPURIFICATION(1997)10:263;Dolphin等人,NATUREGENETICS(1997)17:491;Kost等人,GENE(1997)190:139;Jakobsson等人,J.BIOL.CHEM.(1996)271:22203;Rowles等人,J.BIOL.CHEM.(1996)271(37):223/6;Reverey等人,J.BIOL.CHEM.(1996)271(39):23607-10;Stanley等人,J.Biol.Chem.(1995)270:4121;Sisk等人,J.Virol.(1994)68(2):766;以及Peng等人,BIOTECHNIQUES(1993)14(2):274。市售脂质体例如包括和(Invitrogen,Corp.,Carlsbad,CA)。另外,也可使用磷酸钙转染。参见TROTTER和WOOD,39METHODSINMOLECULARBIOLOGY(1995);Kitts,NAR(1990)18(19):5667;以及Mann和King,J.GEN.VIROL.(1989)70:3501。
杆状病毒表达载体通常含有杆状病毒启动子。杆状病毒启动子是能够与杆状 病毒RNA聚合酶结合并起始编码序列(例如结构基因)下游(3′)转录进入mRNA 中的任何DNA序列。启动子将具有通常与编码序列的5′端最接近放置的转录起始 区。此转录起始区通常包括RNA聚合酶结合位点和转录起始位点。杆状病毒启动 子也可具有被称作增强子的第二域,当存在所述域时,其通常在结构基因的末梢。 此外,表达可经调节或为组成性的。
在感染周期的末期大量转录的结构基因提供尤其适用的启动子序列。实例包 括源自编码病毒多面体蛋白的基因(FRIESEN等人,TheRegulationofBaculovirus GeneExpression,THEMOLECULARBIOLOGYOFBACULOVIRUSES(1986);EP 0127839和0155476)和编码p10蛋白的基因(Vlak等人,J.GEN.VIROL.(1988) 69:765)的序列。
将新近形成的杆状病毒表达载体包装到感染性重组杆状病毒中并且随后可通 过所属领域的技术人员已知的技术来纯化所生长斑块。参见Miller等人, BIOESSAYS(1989)11(4):91;SUMMERS和SMITH,TEXASAGRICULTURAL EXPERIMENTSTATIONBULLETIN,第1555期,(1987)。
已开发用于感染到多种昆虫细胞中的重组杆状病毒表达载体。举例来说,已 开发用于埃及伊蚊(ATCC第CCL-125号)、桑蚕(ATCC第CRL-8910号)、黑腹 果蝇(ATCC第1963号)、草地贪夜蛾和粉纹夜蛾的重组杆状病毒。参见Wright, NATURE(1986)321:718;Carbonell等人,J.VIROL(1985)56:153;Smith等人, MOL.CELL.BIOL.(1983)3:2156。通常参见Fraser等人,INVITROCELL.DEV. BIOL.(1989)25:225。更具体来说,用于杆状病毒表达载体系统的细胞系通常包括 (但不限于)Sf9(草地贪夜蛾)(ATCC第CRL-1711号)、Sf21(草地贪夜蛾) (InvitrogenCorp.,目录号11497-013(Carlsbad,CA))、Tri-368(粉纹夜蛾)和 High-FiveTMBTI-TN-5B1-4(粉纹夜蛾)。
用于异源多肽在杆状病毒/表达载体中的直接表达和融合表达的细胞和培养 基在市面上有售,并且所属领域的技术人员通常已知细胞培养技术。
大肠杆菌、假单胞菌属和其它原核生物所属领域的技术人员已知细菌表达技 术。多种载体可用于细菌宿主中。载体可为单拷贝或低或高的多拷贝载体。载体 可用于克隆和/或表达。鉴于关于载体的丰富文献、多种载体的商业可得性以及甚 至描述载体和其限制酶图谱以及特征的手册,在本文中无需广泛讨论。众所周知, 载体通常涉及允许选择的标记,这些标记可提供细胞毒性剂抗性、原营养或免疫 性。通常存在多个标记,其提供不同特征。
细菌启动子为能够结合细菌RNA聚合酶并起始编码序列(例如结构基因)下 游(3′)转录进入mRNA中的任何DNA序列。启动子将具有通常与编码序列的 5′端最接近放置的转录起始区。此转录起始区通常包括RNA聚合酶结合位点和转 录起始位点。细菌启动子也可具有被称作操纵基因的第二域,其可与开始RNA 合成的相邻RNA聚合酶结合位点重叠。操纵基因允许阴性调节(可诱导)转录, 这是因为基因抑制蛋白可结合操纵基因并从而抑制特定基因的转录。在不存在阴 性调节元件(例如操纵基因)的情况下可发生组成性表达。另外,可通过基因活 化蛋白结合序列实现阳性调节,当存在所述结合序列时,所述序列通常最接近 RNA聚合酶结合序列的(5′)。基因活化蛋白的实例为代谢产物活化蛋白(CAP), 其有助于起始大肠杆菌中lac操纵子的转录[Raibaud等人,ANNU.REV.GENET. (1984)18:173]。因此,经调节的表达可为阳性或阴性,从而增强或减弱转录。
编码代谢途径酶的序列提供尤其适用的启动子序列。实例包括来源于糖代谢 酶(例如半乳糖、乳糖(lac)[Chang等人,NATURE(1977)198:1056]以及麦芽糖) 的启动子序列。其它实例包括来源于生物合成酶(例如色氨酸(trp))的启动子 序列[Goeddel等人,NUC.ACIDSRES.(1980)8:4057;Yelverton等人,NUCL. ACIDSRES.(1981)9:731;美国专利第4,738,921号;欧洲公开案第036776号以 及第121775号,其是以引用的方式并入本文中]。β-半乳糖苷酶(bla)启动子 系统[Weissmann(1981)″Thecloningofinterferonandothermistakes.″Interferon3 (I.Gresser编)]、噬菌体λPL[Shimatake等人,NATURE(1981)292:128]以及T5[美 国专利第4,689,406号,其是以引用的方式并入本文中]启动子系统还提供适用的 启动子序列。本发明的优选方法利用强启动子(例如T7启动子)来诱导高含量 的胰岛素多肽。所属领域的技术人员已知这些载体的实例,并且其包括来自 Novagen的pET29系列以及WO99/05297(其是以引用的方式并入本文中)中所 述的pPOP载体。这些表达系统在宿主中产生高含量的胰岛素多肽,而不损害宿 主细胞生存能力或生长参数。pET19(Novagen)是所属领域中已知的另一种载体。
另外,在自然界中不存在的合成启动子也充当细菌启动子。举例来说,可将 一个细菌或噬菌体启动子的转录活化序列与另一细菌或噬菌体启动子的操纵子序 列连接,从而产生合成杂合启动子[美国专利第4,551,433号,其是以引用的方式 并入本文中]。举例来说,tac启动子是包含trp启动子与lac操纵子序列的杂合 trp-lac启动子,其由lac阻遏物调节[Amann等人,GENE(1983)25:167;deBoer 等人,PROC.NATL.ACAD.SCI.(1983)80:21]。此外,细菌启动子可包括非细菌来 源的天然存在启动子,其具有与细菌RNA聚合酶结合并起始转录的能力。也可将 非细菌来源的天然存在启动子与可相容的RNA聚合酶偶合以产生一些基因在原 核生物中的高水平表达。噬菌体T7RNA聚合酶/启动子系统是偶合启动子系统的 实例[Studier等人,J.MOL.BIOL.(1986)189:113;Tabor等人,ProcNatl.Acad.Sci. (1985)82:1074]。另外,杂合启动子也可包含噬菌体启动子和大肠杆菌操纵基因区 (欧洲公开案第267851号)。
除功能启动子序列之外,有效核糖体结合位点也适用于在原核生物中表达外 来基因。在大肠杆菌中,核糖体结合位点被称作Shine-Dalgarno(SD)序列并包 括起始密码子(ATG)和位于起始密码子上游3-11个核苷酸处的长度为3-9个核 苷酸的序列[Shine等人,NATURE(1975)254:34]。认为SD序列通过SD序列与大 肠杆菌16SrRNA的3′端之间的碱基配对来促进mRNA与核糖体的结合[Steitz等 人,″GeneticsignalsandnucleotidesequencesinmessengerRNA″,Biological RegulationandDevelopment:GeneExpression(Ed.R.F.Goldberger,1979)]。为表达 具有弱核糖体结合位点的真核基因和原核基因[Sambrook等人,″Expressionof clonedgenesinEscherichiacoli″,MolecularCloning:ALaboratoryManual,1989]。
术语“细菌宿主”或“细菌宿主细胞”是指可用作或已用作重组载体或其它 转移DNA的接受者的细菌。所述术语包括已经转染的原始细菌宿主细胞的后代。 应了解,由于偶发突变或故意突变,单一母体细胞的后代在形态上或在与原始母 体互补的基因组DNA或总DNA方面可能未必完全相同。与将要以相关性质(例 如存在编码胰岛素多肽的核苷酸序列)表征的母体充分类似的母体细胞的后代包 括在由此定义所指代的后代中。
所属领域的技术人员已知适用于表达胰岛素多肽的宿主细菌的选择。在选择 用于表达的细菌宿主时,合适的宿主可包括显示具有良好包涵体形成能力、低蛋 白水解活性以及总体稳固性的宿主。细菌宿主通常可获自多种来源,包括(但不 限于)加利福尼亚大学生物物理和医学物理系细菌基因保藏中心(Berkeley,CA); 以及美国典型菌种保藏中心(“ATCC”)(Manassas,VA)。工业/医药发酵通常使用 来源于K菌株的细菌(例如W3110)或来源于B菌株的细菌(例如BL21)。这些 菌株因其生长参数为人熟知且稳定而特别适用。另外,这些菌株为非病原性的, 出于安全性和环境原因,其在商业上较为重要。合适的大肠杆菌宿主的其它实例 包括(但不限于)BL21、DH10B或其衍生物的菌株。在本发明方法的另一实施例 中,大肠杆菌宿主为蛋白酶缺乏菌株,其包括(但不限于)OMP-和LON-。宿主 细胞株可为假单胞菌种,包括(但不限于)荧光假单胞菌、绿脓杆菌以及恶臭假 单胞菌。已知荧光假单胞菌生物型1(命名为菌株MB101)适用于重组制备且可 用于治疗性蛋白质的制备过程。假单胞菌表达系统的实例包括可以宿主菌株形式 获自DowChemicalCompany的系统(Midland,MI,可通过万维网在dow.com上 获得)。
在形成重组宿主细胞株(即,已将表达构筑体引入宿主细胞中并且分离出具 有合适表达构筑体的宿主细胞)后,在适于产生胰岛素多肽的条件下培养重组宿 主细胞株。所属领域的技术人员显而易见,重组宿主细胞株的培养方法将依赖于 所利用的表达构筑体的性质以及宿主细胞的特点。通常使用所属领域的技术人员 已知的方法来培养重组宿主菌株。重组宿主细胞通常是在含有可吸收的碳、氮以 及无机盐来源并且任选地含有维生素、氨基酸、生长因子和所属领域的技术人员 已知的其它蛋白质培养补充物的液体培养基中培养。用于培养宿主细胞的液体培 养基可任选地含有抗生素或抗真菌剂以防止不合需要的微生物和/或化合物(包括 (但不限于)用于选择含有表达载体的宿主细胞的抗生素)的生长。
重组宿主细胞可以分批或连续模式培养,其中细胞收集(在胰岛素多肽在细 胞内积聚的情况下)或培养物上清液的收集为分批或连续模式。对于原核宿主细 胞中的制备来说,优选分批培养和细胞收集。
本发明的胰岛素多肽通常是在重组系统中表达之后纯化。胰岛素多肽可通过 所属领域中已知的多种方法从宿主细胞或培养基中纯化。细菌宿主细胞中所产生 的胰岛素多肽可具有弱溶解性或不可溶(呈包涵体形式)。在本发明的一实施例中, 使用本文中揭示的方法以及所属领域中已知的方法,可容易地在胰岛素多肽中进 行为增加重组产生的蛋白质的溶解性而选择的氨基酸取代。在不溶性蛋白质的情 况下,可通过离心从宿主细胞溶菌液收集蛋白质,并且其后可接着进行细胞的均 质化。在具有弱溶解性的蛋白质的情况下,可添加包括(但不限于)聚乙烯亚胺 (PEI)的化合物以诱导部分可溶性蛋白质的沉淀。随后可通过离心便利地收集沉 淀的蛋白。使用所属领域的技术人员已知的多种方法,可使重组宿主细胞破裂或 均质化以从细胞内部释放包涵体。可使用熟知的技术来进行宿主细胞的破裂或均 质化,这些技术包括(但不限于)酶促细胞破裂、超声波降解法、杜恩斯均质化 (douncehomogenization)或高压释放破裂。在本发明方法的一实施例中,使用高 压释放技术使大肠杆菌宿主细胞破裂以释放胰岛素多肽的包涵体。在处理胰岛素 多肽的包涵体时,最好使重复过程的均质化时间最小化以使包涵体产率最大化且 不会由于例如溶解、机械剪切或蛋白质水解等因素造成损失。
随后,可使用所属领域中已知的多种合适的增溶剂中的任一种来溶解不溶性 或沉淀的胰岛素多肽。可用尿素或盐酸胍溶解胰岛素多肽。应使溶解的胰岛素多 肽的体积最小化,从而可使用可方便操作的批量大小来制备大批量。在重组宿主 可以体积为数千升的批量生长的大规模商业装置中,这个因素可为重要的。另外, 当在大规模商业装置中制造胰岛素多肽时,特别是对于人类医药用途来说,如果 可能的话,应避免可损害机器和容器的苛刻化学品或其蛋白质产物。本发明的方 法中已展示,可使用较温和的变性剂尿素代替较苛刻的变性剂盐酸胍来溶解胰岛 素多肽包涵体。尿素的使用显著降低损害胰岛素多肽的制造和纯化过程中使用的 不锈钢设备的风险,同时有效溶解胰岛素多肽包涵体。
在可溶性胰岛素蛋白的情况下,可将胰岛素分泌到周质空间或培养基中。另 外,可溶性胰岛素可能存在于宿主细胞的细胞质中。可能需要在进行纯化步骤之 前浓缩可溶性胰岛素。可使用所属领域的技术人员已知的标准技术从例如细胞溶 菌液或培养基浓缩可溶性胰岛素。另外,可使用所属领域的技术人员已知的标准 技术来破裂宿主细胞且从宿主细胞的细胞质或周质空间释放可溶性胰岛素。
当制备呈融合蛋白形式的胰岛素多肽时,可去除融合序列。可通过酶促或化 学裂解来实现融合序列的去除。可使用所属领域的技术人员已知的方法来实现融 合序列的酶促去除。所属领域的技术人员将显而易见,用于去除融合序列的酶的 选择将由融合体的特点决定,并且反应条件将根据酶的选择进行指定。可使用所 属领域的技术人员已知的试剂(包括(但不限于)溴化氰、TEV蛋白酶和其它试 剂)来实现化学裂解。可通过所属领域的技术人员已知的方法从裂解的融合序列 中纯化裂解的胰岛素多肽。所属领域的技术人员将显而易见,所述方法将由融合 序列和胰岛素多肽的特点和性质决定。纯化方法可包括(但不限于)尺寸排阻色 谱、疏水性相互作用色谱、离子交换色谱或透析或其任何组合。
也可纯化胰岛素多肽以从蛋白质溶液中去除DNA。虽然可通过所属领域中已 知的任何合适的方法(例如沉淀或离子交换色谱)去除DNA,但也可通过用核酸 沉淀剂(例如(但不限于)硫酸鱼精蛋白)沉淀来去除DNA。可使用包括(但不 限于)离心或过滤的熟知的标准方法使胰岛素多肽与沉淀的DNA分离。在将使 用胰岛素多肽来治疗人类的背景中,宿主核酸分子的去除为重要因素,并且本发 明的方法将宿主细胞DNA降到医药学上可接受的水平。
用于小规模或大规模发酵的方法也可用于蛋白质表达中,所述方法包括(但 不限于)发酵罐、振荡烧瓶、流化床生物反应器、中空纤维生物反应器、滚瓶培 养系统以及搅拌槽生物反应器系统。这些方法中的每一种都可以分批、分批馈料 或连续模式方法进行。
通常,可使用所属领域中的标准方法来回收本发明的人类胰岛素多肽。举例 来说,可离心或过滤培养基或细胞溶菌液以去除细胞碎片。可将上清液浓缩或稀 释到所需体积或透滤到合适的缓冲液中以调节供进一步纯化的制剂。本发明的胰 岛素多肽的进一步纯化包括从完整形式中分离脱除酰胺基和剪短形式的胰岛素多 肽变异体。
以下示范性程序中的任一种都可用于纯化本发明的胰岛素多肽:亲和色谱; 阴离子或阳离子交换色谱(使用(包括(但不限于))DEAESEPHAROSE);硅胶 色谱;高效液相色谱(HPLC);反相HPLC;凝胶过滤(使用(包括(但不限于)) SEPHADEXG-75);疏水性相互作用色谱;尺寸排阻色谱;金属螯合物色谱;超 滤/透滤;乙醇沉淀;硫酸铵沉淀;色谱聚焦;置换色谱;电泳程序(包括(但不 限于)制备型等电聚焦);差异溶解度(包括(但不限于)硫酸铵沉淀);SDS-PAGE; 或萃取。
根据所属领域的技术人员已知并使用的标准程序,可将本发明的蛋白质(包 括(但不限于)包含非天然氨基酸的蛋白质、包含非天然氨基酸的肽、包含非天 然氨基酸的蛋白质的抗体、包含非天然氨基酸的蛋白质的结合搭配物等)部分或 实质上纯化成均质。因此,可通过所属领域的技术人员已知的多种方法中的任一 种来回收和纯化本发明的多肽,这些方法包括(但不限于)硫酸铵或乙醇沉淀、 酸或碱萃取、柱色谱、亲和柱色谱、阴离子或阳离子交换色谱、磷酸纤维素色谱、 疏水性相互作用色谱、羟基磷灰石色谱、外源凝集素色谱、凝胶电泳等。在制备 正确折叠的成熟蛋白质时,必要时可使用蛋白质再折叠步骤。当需要高纯度时, 在最后纯化步骤中可使用高效液相色谱(HPLC)、亲和色谱或其它合适的方法。 在一实施例中,使用针对非天然氨基酸(或包含非天然氨基酸的蛋白质或肽)形 成的抗体作为纯化试剂,从而(包括(但不限于))用于包含一个或一个以上非天 然氨基酸的蛋白质或肽的以亲和性为基础的纯化。必要时,在部分纯化或纯化成 均质后,任选地将所述多肽用于多种应用,包括(但不限于)用作测定组分、治 疗剂、预防剂、诊断剂、研究试剂和/或用作抗体产生的免疫原。可通过使用常规 方案向动物(优选非人类动物)投与本发明的多肽或带表位的片段或细胞来获得 针对本发明的多肽而产生的抗体。所属领域的技术人员可使用多种已知技术来产 生抗体。此外,可使用转基因小鼠或其它生物体(包括其它哺乳动物)来表达人 源化抗体。可使用上述抗体来分离或鉴别表达多肽的克隆或纯化多肽。也可利用 针对本发明的多肽而产生的抗体来治疗疾病。
本发明的多肽和多核苷酸也可用作疫苗。因此,另一方面,本发明涉及一种 在哺乳动物中诱导免疫反应的方法,其包含使哺乳动物接种足以产生抗体和/或T 细胞免疫反应(例如包括产生细胞因子的T细胞或细胞毒性T细胞)的本发明多 肽以保护所述动物免患疾病,而无论个体是否已产生所述疾病。也可用以下方法 诱导哺乳动物中的免疫反应,所述方法包含:在活体内通过指导多核苷酸表达并 编码多肽的载体传递本发明的多肽,以诱导所述免疫反应,从而产生抗体来保护 所述动物免患本发明的疾病。一种投与载体的方式是以粒子上的涂层的形式或以 其它形式使其加速进入所需细胞中。所述核酸载体可包含DNA、RNA、经修饰核 酸或DNA/RNA杂合体。为用作疫苗,多肽或核酸载体通常将以疫苗调配物(组 合物)形式提供。调配物可进一步包含合适的载剂。因为多肽可在胃中分解,所 以其可肠外(例如皮下、肌肉内、静脉内或皮内注射)投与。适于肠外投与的调 配物包括:水性和非水性的无菌注射溶液,其可含有抗氧化剂、缓冲剂、抑菌剂 和使调配物与接收者的血液等张的溶质;以及水性和非水性的无菌悬浮液,其可 包括悬浮剂或增稠剂。疫苗调配物也可包括所属领域的技术人员已知的用于增强 调配物的免疫原性的佐剂系统。剂量将视疫苗的特定活性而定并且可通过常规实 验容易地确定。
替代系统中的表达
已使用多种策略将非天然氨基酸引入非重组宿主细胞、诱变宿主细胞或不含 细胞的系统中的蛋白质中。这些系统也适用于制备本发明的胰岛素多肽。例如Lys、 Cys和Tyr等具有反应性侧链的氨基酸的衍生使得赖氨酸转化为N2-乙酰基-赖氨 酸。化学合成还提供合并非天然氨基酸的直接方法。通过肽片段的酶促连接和天 然化学连接的新近发展,有可能制造较大蛋白质。例如参见P.E.Dawson和S.B. H.Kent,Annu.Rev.Biochem,69:923(2000)。化学肽连接和天然化学连接描述于美 国专利第6,184,344号、美国专利公开案第2004/0138412号、美国专利公开案第 2003/0208046号、WO02/098902和WO03/042235中,所述专利是以引用的方式 并入本文中。已使用将利用所需非天然氨基酸以化学方式酰化的抑制因子tRNA 添加到能够支持蛋白质生物合成的活体外提取物中的通用活体外生物合成方法将 超过100个非天然氨基酸位点特异性地并入几乎任何尺寸的多种蛋白质中。例如 参见V.W.Cornish,D.Mendel和P.G.Schultz,Angew.Chem.Int.Ed.Engl.1995, 34:621(1995);C.J.Noren,S.J.Anthony-Cahill,M.C.Griffith,P.G.Schultz,Ageneral methodforsite-specificincorporationofunnaturalaminoacidsintoproteins,Science244:182-188(1989);以及J.D.Bain,C.G.Glabe,T.A.Dix,A.R.Chamberlin,E.S. Diala,Biosyntheticsite-specificincorporationofaunnaturalaminoacidintoa polypeptide,J.Am.Chem.Soc.111:8013-8014(1989)。已经将多种官能团引入蛋白 质中以供研究蛋白质稳定性、蛋白质折叠、酶机理和信号转导。
除了本文中指出的其它参考文献外,所属领域的技术人员还已知多种纯化/ 蛋白质折叠方法,其包括(但不限于)以下文献中列出的那些方法:R.Scopes, ProteinPurification.Springer-Verlag,N.Y.(1982);Deutscher,Methodsin Enzymology第182卷:GuidetoProteinPurification,AcademicPress,Inc.N.Y. (1990);Sandana,(1997)BioseparationofProteins.AcademicPress,Inc.;Bollag等 人,(1996)ProteinMethods,第2版,Wiley-Liss,NY;Walker,(1996)TheProtein ProtocolsHandbookHumanaPress,NJ;Harris和Angal,(1990)ProteinPurification Applications:APracticalApproachIRLPressatOxford,Oxford,England;Harris和 Angal,ProteinPurificationMethods:APracticalApproachIRLPressatOxford, Oxford,England;Scopes,(1993)ProteinPurification:PrinciplesandPractice第3版 SpringerVerlag,NY;Janson和Ryden,(1998)ProteinPurification:Principles,High ResolutionMethodsandApplications,第2版,Wiley-VCH,NY;以及Walker(1998), ProteinProtocolsonCD-ROMHumanaPress,NJ;以及其中引用的参考文献。
在真核宿主细胞或非真核宿主细胞中产生所关注的具有非天然氨基酸的蛋白 质或多肽的一个优点在于,所述蛋白质或多肽通常将折叠成其天然构象。然而, 在本发明的某些实施例中,所属领域的技术人员应认识到,在合成、表达和/或纯 化之后,蛋白质或肽可能具有与相关多肽所需的构象不同的构象。在本发明的一 方面,任选地使所表达的蛋白质或多肽变性并且随后使其复性。这是利用所属领 域中已知的方法来实现,所述方法包括(但不限于)向所关注的蛋白质或多肽中 添加伴侣蛋白(chaperonin)、将蛋白质溶解于例如盐酸胍等离液剂中、利用蛋白 质二硫化物异构酶等。
一般来说,有时需要使所表达的多肽变性和还原并且随后使多肽再折叠成优 选构象。举例来说,可将胍、尿素、DTT、DTE和/或伴侣蛋白添加到所关注的翻 译产物中。所属领域的技术人员已知使蛋白质还原、变性和复性的方法(参见上 述参考文献以及Debinski等人,(1993)J.Biol.Chem.,268:14065-14070;Kreitman 和Pastan(1993)Bioconjug.Chem.,4:581-585;以及Buchner等人,(1992)Anal. Biochem.,205:263-270)。举例来说,Debinski等人描述胍-DTE中包涵体蛋白质 的变性和还原。可在含有(包括(但不限于))氧化型谷胱甘肽和L-精氨酸的氧 化还原缓冲剂中使蛋白质再折叠。可使再折叠试剂流动或以其它方式移动以与一 种或一种以上多肽或其它表达产物接触,或者反之亦然。
在原核制备胰岛素多肽的情况下,如此产生的胰岛素多肽可能错误折叠并且 因而缺乏生物活性或者生物活性降低。可通过“再折叠”来恢复蛋白质的生物活 性。一般来说,通过使用例如一种或一种以上离液剂(例如尿素和/或胍)和能够 还原二硫键的还原剂(例如二硫苏糖醇、DTT或2-巯基乙醇(2-ME))溶解(其 中胰岛素多肽也不可溶)、展开并还原多肽链而使错误折叠的胰岛素多肽再折叠。 在中等浓度的离液剂下,随后添加氧化剂(例如氧、胱氨酸或胱胺),这可再形成 二硫键。可使用所属领域中已知的标准方法使胰岛素多肽再折叠,所述方法例如 美国专利第4,511,502号、第4,511,503号和第4,512,922号中所述的方法,所述文 献是以引用的方式并入本文中。胰岛素多肽也可与其它蛋白质共折叠以形成异源 二聚体或异源多聚体。
在再折叠之后,可进一步纯化胰岛素。可使用所属领域的技术人员已知的多 种技术纯化胰岛素,所述技术包括疏水性相互作用色谱、尺寸排阻色谱、离子交 换色谱、反相高效液相色谱、亲和色谱等或其任何组合。其它纯化也可包括干燥 或沉淀经纯化蛋白质的步骤。
在纯化后,可将胰岛素交换到不同缓冲液中和/或通过所属领域中已知的多种 方法(包括(但不限于)透滤和透析)中的任一种使其浓缩。以单一纯化蛋白质 形式提供的胰岛素可进行聚集和沉淀。
经纯化胰岛素可为至少90%纯(如由反相高效液相色谱(RP-HPLC)或十二 烷基硫酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE)所测量),或至少95%纯,或至少 98%纯,或至少99%或更纯。无论胰岛素的纯度的确切数值如何,胰岛素对于用 作医药产品或用于进一步处理(例如与例如PEG等水溶性聚合物结合)来说都是 足够纯的。
在不存在其它活性成分或蛋白质(除赋形剂、载剂和稳定剂、血清白蛋白等 之外)的情况下,某些胰岛素分子可用作治疗剂,或其可与另一种蛋白质或聚合 物复合。
一般纯化方法可以任何适当顺序对包含胰岛素多肽的细胞溶菌液、提取物、 培养基、包涵体、宿主细胞的周质空间、宿主细胞的细胞质或其它材料或由任何 分离步骤得到的任何胰岛素多肽混合物进行多种分离步骤中的任一种,所述任何 分离步骤包括(但不限于)亲和色谱、离子交换色谱、疏水性相互作用色谱、凝 胶过滤色谱、高效液相色谱(“HPLC”)、反相HPLC(“RP-HPLC”)、膨胀床吸附 或其任何组合和/或重复。
用于实施本文中所述的技术的设备和其它必要材料在市面上有售。泵、馏分 收集器、监控器、记录器以及整个系统都可获自例如AppliedBiosystems(Foster City,CA)、Bio-RadLaboratories,Inc.(Hercules,CA)以及AmershamBiosciences, Inc.(Piscataway,NJ)。包括(但不限于)交换基质材料、培养基以及缓冲液的色 谱材料也可获自这些公司。
使用专用设备(例如泵)可更迅速地实现平衡以及在本文中所述的柱色谱过程中的其它步骤(例如洗涤和洗提)。市售泵包括(但不限于)泵P-50、蠕动泵P-1、泵P-901和泵P-903(AmershamBiosciences,Piscataway,NJ)。
馏分收集器的实例包括RediFrac馏分收集器、FRAC-100和FRAC-200馏分收集器以及馏分收集器(AmershamBiosciences,Piscataway,NJ)。也可使用混合器来形成pH值和线性浓度梯度。市售混合器包括梯度混合器GM-1和管道混合器(AmershamBiosciences,Piscataway,NJ)。
可使用任何市售监控器来监控色谱过程。这些监控器可用于收集如UV、pH值和传导率的信息。检测器的实例包括监控器UV-1、SII、监控器UV-MII、监控器UV-900、监控器UPC-900、监控器pH/C-900以及传导率监控器(AmershamBiosciences,Piscataway,NJ)。实际上,整个系统都在市面上有售,其包括来自AmershamBiosciences(Piscataway,NJ)的各种系统。
在本发明的一实施例中,例如,可通过首先在尿素中使所得的经纯化胰岛素 多肽变性,接着在合适的pH值下在含有还原剂(例如DTT)的TRIS缓冲液中稀 释来还原胰岛素多肽并使其变性。在另一实施例中,使胰岛素多肽以约2M到约 9M的浓度范围在尿素中变性,接着在约5.0到约8.0的范围内的pH值下在TRIS 缓冲液中稀释。随后可培育这个实施例的再折叠混合物。在一实施例中,再折叠 混合物在室温下培育4小时到24小时。随后,可进一步分离或纯化经还原并变性 的胰岛素多肽混合物。
如本文中所述,在进行任何后续分离步骤之前,可调节第一胰岛素多肽混合 物的pH值。另外,可使用所属领域中已知的技术来浓缩第一胰岛素多肽混合物 或其任何后续混合物。此外,可使用所属领域的技术人员已知的技术将包含第一 胰岛素多肽混合物或其任何后续混合物的洗提缓冲液交换为适用于下个分离步骤 的缓冲液。
离子交换色谱在一实施例中,并且作为任选的额外步骤,可对第一胰岛素多肽混合物进行离子交换色谱。通常参见IONEXCHANGECHROMATOGRAPHY:PRINCIPLESANDMETHODS(目录号18-1114-21,AmershamBiosciences(Piscataway,NJ))。市售离子交换柱包括和柱(AmershamBiosciences,Piscataway,NJ)。这些柱利用强阴离子交换剂,例如QFastFlow、QHighPerformance和QXL;强阳离子交换剂,例如SPHighPerformance、SPFastFlow和SPXL;弱阴离子交换剂,例如DEAEFastFlow;以及弱阳离子交换剂,例如CMFastFlow(AmershamBiosciences,Piscataway,NJ)。可在纯化过程的任何阶段对胰岛素多肽进行阴离子或阳离子交换柱色谱以分离实质上经纯化的胰岛素多肽。可使用任何合适的阳离子交换基质来进行阳离子交换色谱步骤。适用的阳离子交换基质包括(但不限于)纤维状、多孔、无孔、微粒、珠粒或交联阳离子交换基质材料。这些阳离子交换基质材料包括(但不限于)纤维素、琼脂糖、葡聚糖、聚丙烯酸酯、聚乙烯、聚苯乙烯、二氧化硅、聚醚或任何上述物质的复合物。
阳离子交换基质可为任何合适的阳离子交换剂,包括强阳离子交换剂和弱阳 离子交换剂。强阳离子交换剂可能在宽pH值范围内保持离子化,并因此可能能 够在宽pH值范围内与胰岛素结合。然而,弱阳离子交换剂可能随着pH值变化而 丧失离子化。举例来说,当pH值降到约pH4或pH5以下时,弱阳离子交换剂 可能失去电荷。合适的强阳离子交换剂包括(但不限于)带电官能团,例如磺丙 基(SP)、甲基磺酰基(S)或磺乙基(SE)。阳离子交换基质可为优选具有约2.5 到约6.0的胰岛素结合pH值范围的强阳离子交换剂。或者,强阳离子交换剂可具 有约pH2.5到约pH5.5的胰岛素结合pH值范围。阳离子交换基质可为具有约3.0 的胰岛素结合pH值的强阳离子交换剂。或者,阳离子交换基质可为优选具有约 6.0到约8.0的胰岛素结合pH值范围的强阳离子交换剂。阳离子交换基质可为优 选具有约8.0到约12.5的胰岛素结合pH值范围的强阳离子交换剂。或者,强阳 离子交换剂可具有约pH8.0到约pH12.0的胰岛素结合pH值范围。
在装载胰岛素之前,例如可使用多个柱体积的稀弱酸(例如4个柱体积的20 mM乙酸,pH3)来平衡阳离子交换基质。平衡后可添加胰岛素并且在洗提实质 上经纯化的胰岛素之前,也可使用弱酸溶液(例如弱乙酸或磷酸溶液)将柱洗涤 一到数次。举例来说,可使用约2-4个柱体积的20mM乙酸(pH3)来洗涤柱。 举例来说,使用2-4个柱体积的0.05M乙酸钠(pH5.5)或使用与0.1M氯化钠 混合的0.05M乙酸钠(pH5.5)进行其它洗涤。或者,使用所属领域中已知的方 法,可使用多个柱体积的稀弱酸来平衡阳离子交换基质。
或者,可通过使阳离子交换剂基质与具有足够低的pH值或离子强度的缓冲 液接触而置换基质中的胰岛素来洗提实质上经纯化的胰岛素。洗提缓冲液的pH 值可在约pH2.5到约pH6.0的范围内。更具体来说,洗提缓冲液的pH值可在约 pH2.5到约pH5.5、约pH2.5到约pH5.0的范围内。洗提缓冲液可具有约3.0的 pH值。另外,洗提缓冲液的量可在较大范围内改变并且通常将在约2到约10个 柱体积的范围内。
在使胰岛素多肽吸附到阳离子交换剂基质上之后,可通过使基质与具有足够 高的pH值或离子强度的缓冲液接触而置换基质中的胰岛素多肽来洗提实质上经 纯化的胰岛素多肽。适用于实质上经纯化的胰岛素多肽的高pH值洗提的缓冲液 可包括(但不限于)浓度在至少约5mM到至少约100mM范围内的柠檬酸盐、 磷酸盐、甲酸盐、乙酸盐、HEPES以及MES缓冲液。
反相色谱可根据所属领域的技术人员已知的合适方案进行RP-PIPLC以纯化 蛋白质。例如参见Pearson等人,ANALBIOCHEM.(1982)124:217-230(1982); Rivier等人,J.CHROM.(1983)268:112-119;Kunitani等人,J,CHROM.(1986) 359:391-402。可对胰岛素多肽进行RP-HPLC以分离实质上经纯化的胰岛素多肽。 关于这一点,可使用含有具有多种长度(包括(但不限于)至少约C3到至少约 C30、至少约C3到至少约C20或至少约C3到至少约C18树脂)的烷基官能团的 二氧化硅衍生的树脂。或者,可使用聚合树脂。举例来说,可使用TosoHaas AmberchromeCG1000sd树脂,其为苯乙烯聚合物树脂。也可使用具有多种烷基链 长度的氰基或聚合树脂。此外,可用例如乙醇等溶剂洗涤RP-HPLC柱。SourceRP 柱是RP-HPLC柱的另一个实例。
可使用含有离子配对剂和有机改质剂(例如甲醇、异丙醇、四氢呋喃、乙腈 或乙醇)的合适洗提缓冲液从RP-HPLC柱洗提胰岛素多肽。最常用的离子配对剂 包括(但不限于)乙酸、甲酸、高氯酸、磷酸、三氟乙酸、七氟丁酸、三乙胺、 四甲基铵、四丁基铵和乙酸三乙基铵。可使用一种或一种以上梯度或等度条件来 进行洗提,其中优选减少分离时间并降低峰宽度的梯度条件。另一种方法涉及使 用两种具有不同溶剂浓度范围的梯度。适用于本文中的洗提缓冲液的实例可包括 (但不限于)乙酸铵和乙腈溶液。
疏水性相互作用色谱纯化技术可对胰岛素多肽进行疏水性相互作用色谱(HIC)。通常参见HYDROPHOBICINTERACTIONCHROMATOGRAPHYHANDBOOK:PRINCIPLESANDMETHODS(目录号18-1020-90,AmershamBiosciences(Piscataway,NJ)),其是以引用的方式并入本文中。合适的HIC基质可包括(但不限于)经烷基或芳基取代的基质,例如经丁基、己基、辛基或苯基取代的基质,所述基质包括琼脂糖、交联琼脂糖、琼脂糖凝胶(sepharose)、纤维素、二氧化硅、葡聚糖、聚苯乙烯、聚(甲基丙烯酸酯)基质以及混合模式树脂(包括(但不限于)聚乙二胺树脂或经丁基或苯基取代的聚(甲基丙烯酸酯)基质)。疏水性相互作用柱色谱的市售来源包括(但不限于)和柱(AmershamBiosciences,Piscataway,NJ)。
简单地说,在装载之前,可使用所属领域的技术人员已知的标准缓冲液(例 如乙酸/氯化钠溶液或含有硫酸铵的HEPES)来平衡HIC柱。硫酸铵可用作装载 HIC柱的缓冲液。在装载胰岛素多肽后,随后可使用标准缓冲液和条件来洗涤柱 以去除不需要的物质,但将胰岛素多肽留在HIC柱上。可用约3到约10个柱体 积的标准缓冲液(例如含有EDTA和浓度低于平衡缓冲液的硫酸铵的HEPES缓冲 液,或乙酸/氯化钠缓冲液)来洗提胰岛素多肽。也可使用例如使用磷酸钾梯度的 降低的线性盐梯度来洗提胰岛素分子。随后,可例如通过过滤(例如透滤或超滤) 来浓缩洗出液。可利用透滤来去除用于洗提胰岛素多肽的盐。
其它纯化技术可对第一胰岛素多肽混合物或其任何后续混合物进行使用例 如凝胶过滤(GELFILTRATION:PRINCIPLESANDMETHODS(目录号 18-1022-18,AmershamBiosciences,Piscataway,NJ),其是以引用的方式并入本文 中)、羟基磷灰石色谱(合适的基质包括(但不限于)HA-Ultrogel、HighResolution (Calbiochem)、CHT陶瓷羟基磷灰石(BioRad)、Bio-GelHTP羟基磷灰石 (BioRad))、HPLC、膨胀床吸附、超滤、透滤、冻干等的另一分离步骤,以去除 任何过量盐并且用合适的缓冲液来代替所述缓冲液以用于下个分离步骤或甚至最 终药物产品的调配。
可使用所属领域的技术人员已知的技术来监控本文中所述的各步骤中胰岛素 多肽(包括实质上经纯化的胰岛素多肽)的产率。所述技术也可用于在最后分离 步骤后评估实质上经纯化的胰岛素多肽的产率。举例来说,可使用多个具有多种 烷基链长度的反相高压液相色谱柱(例如氰基RP-HPLC、C18RP-HPLC以及阳离 子交换HPLC和凝胶过滤HPLC)中的任一种来监控胰岛素多肽的产率。
在本发明的特定实施例中,各纯化步骤后胰岛素的产率可为各纯化步骤的起 始物质中的胰岛素的至少约30%、至少约35%、至少约40%、至少约45%、至少 约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至 少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、 至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、 至少约99.9%或至少约99.99%。
可使用例如SDS-PAGE等标准技术或通过使用Western印迹法和ELISA测定 测量胰岛素多肽来测定纯度。举例来说,可针对从阴性对照酵母发酵和阳离子交 换回收分离的蛋白质产生多克隆抗体。所述抗体也可用于探测污染性宿主细胞蛋 白质的存在。
RP-HPLC材料VydacC4(Vydac)由硅胶粒子组成,其表面带有C4烷基链。 胰岛素多肽与蛋白质杂质的分离是基于疏水性相互作用强度的差异。用稀三氟乙 酸中的乙腈梯度进行洗提。使用不锈钢柱(填充2.8到3.2升VydacC4硅胶)进 行制备型HPLC。通过添加三氟乙酸来酸化羟基磷灰石Ultrogel洗出液并且将其 装载于VydacC4柱上。使用稀三氟乙酸中的乙腈梯度进行洗涤和洗提。收集洗提 部分并且立即用磷酸盐缓冲液中和。汇集在IPC限度内的胰岛素多肽洗提部分。
DEAESepharose(Pharmacia)材料由与琼脂糖凝胶珠粒的表面共价结合的二 乙基氨基乙基(DEAE)基团组成。通过离子性相互作用来介导胰岛素多肽与DEAE 基团的结合。乙腈和三氟乙酸无滞留地通过柱。在这些物质被洗掉之后,通过用 低pH值的乙酸盐缓冲液洗涤柱来去除痕量杂质。随后用中性磷酸盐缓冲液洗涤 柱并且用具有增加的离子强度的缓冲液洗提胰岛素多肽。用DEAESepharosefast flow填充柱。调节柱体积以确保胰岛素多肽装载量在每毫升凝胶3-10mg胰岛素 多肽的范围内。用水和平衡缓冲液(磷酸钠/钾)洗涤柱。装填HPLC洗出液的汇 集洗提部分并且用平衡缓冲液洗涤柱。随后用洗涤缓冲液(乙酸钠缓冲液)洗涤 柱,接着用平衡缓冲液洗涤。随后,用洗提缓冲液(氯化钠、磷酸钠/磷酸钾)从 柱中洗提胰岛素多肽并根据主要洗提概况将其收集成单一洗提部分。将DEAE Sepharose柱的洗出液调节到指定传导率。将所得药物无菌过滤到特富龙(Teflon) 瓶中并贮存在-70℃下。
可使用的其它方法包括(但不限于)去除内毒素的步骤。内毒素为位于革兰 氏阴性宿主细胞(例如大肠杆菌)的外膜上的脂多糖(LPS)。所属领域的技术人 员已知用于降低内毒素含量的方法,并且所述方法包括(但不限于)使用二氧化 硅支撑物、玻璃粉或羟基磷灰石的纯化技术;反相色谱;亲和色谱;尺寸排阻色 谱;阴离子交换色谱;疏水性相互作用色谱;这些方法的组合等。可能需要修改 或其它方法以从所关注的多肽中去除污染物(例如共迁移蛋白质)。所属领域的技 术人员已知用于测量内毒素含量的方法,并且所述方法包括(但不限于)鲎变形 细胞溶菌液(LimulusAmebocyteLysate;LAL)测定。EndosafeTM-PTS测定为利 用预装载LAL试剂、发色底物和对照标准内毒素的料筒以及手持式分光光度计的 比色、单管系统。替代方法包括(但不限于)测量浊度并且使用96孔形式的动力 学LAL方法。
可使用多种方法和程序来评估包含一个或一个以上非天然编码氨基酸的胰岛 素蛋白质的产率和纯度,所述方法包括(但不限于)Bradford测定、SDS-PAGE、 银染色SDS-PAGE、考马斯(coomassie)染色SDS-PAGE、质谱(包括(但不限 于)MALDI-TOF)以及所属领域的技术人员已知的用于表征蛋白质的其它方法。
其它方法包括(但不限于):与蛋白质染色法结合的SDS-PAGE、免疫印迹法、 基质辅助激光解吸附/离子化质谱(MALDI-MS)、液相色谱/质谱、等电聚焦、分 析型阴离子交换、色谱聚焦和圆二色谱。
已开发被称作选择性压力并入的活体内方法以使用野生型合成酶的杂乱性。 例如参见N.Budisa,C.Minks,S.Alefelder,W.Wenger,F.M.Dong,L.Moroder和 R.Huber,FASEBJ.,13:41(1999)。使向细胞供应特定天然氨基酸的相关代谢路径 关闭的营养缺陷型菌株在含有有限浓度的天然氨基酸的基本培养基中生长,而靶 基因的转录受到抑制。在静止生长期开始时,天然氨基酸被耗尽并且由非天然氨 基酸类似物置换。对重组蛋白表达的诱导使得含有非天然类似物的蛋白质积聚。 举例来说,已使用这种策略将邻氟苯丙氨酸、间氟苯丙氨酸和对氟苯丙氨酸并入 蛋白质中,并且其在UV光谱中显示两个可容易地鉴别的特征肩峰,例如参见C. Minks,R.Huber,L.Moroder和N.Budisa,Anal.Biochem.,284:29(2000);已使用三 氟蛋氨酸来代替噬菌体T4溶菌酶中的蛋氨酸,从而通过19FNMR研究其与壳寡 糖配体的相互作用,例如参见H.Duewel,E.Daub,V.Robinson和J.F.Honek, Biochemistry,36:3404(1997);并且已并入三氟亮氨酸来代替亮氨酸,从而使亮氨 酸拉链蛋白的热稳定性和化学稳定性增加。例如参见Y.Tang,G.Ghirlanda,W.A. Petka,T.Nakajima,W.F.DeGrado和D.A.Tirrell,Angew.Chem.Int.Ed.Engl., 40:1494(2001)。此外,将硒代蛋氨酸和碲代蛋氨酸并入各种重组蛋白中以促进X 射线结晶学中的相溶解。例如参见W.A.Hendrickson,J.R.Horton和D.M. Lemaster,EMBOJ.,9:1665(1990);J.O.Boles,K.Lewinski,M.Kunkle,J.D.Odom, B.Dunlap,L.Lebioda和M.Hatada,Nat.Struct.Biol.,1:283(1994);N.Budisa,B. Steipe,P.Demange,C.Eckerskorn,J.Kellermann和R.Huber,Eur.J.Biochem., 230:788(1995);以及N.Budisa,W.Karnbrock,S.Steinbacher,A.Humm,L.Prade,T. Neuefeind,L.Moroder和R.Huber,J.Mol.Biol.,270:616(1997)。也已有效并入具 有烯或炔官能团的蛋氨酸类似物,从而允许通过化学方式对蛋白质进行其它修饰。 例如参见J.C.M.vanHest和D.A.Tirrell,FEBSLett.,428:68(1998);J.C.M.van Hest,K.L.Kiick和D.A.Tirrell,J.Am.Chem.Soc.122:1282(2000);以及K.L. Kiick和D.A.Tirrell,Tetrahedron,56:9487(2000);美国专利第6,586,207号;美国 专利公开案第2002/0042097号,其是以引用的方式并入本文中。
这种方法的成功取决于氨酰基tRNA合成酶对非天然氨基酸类似物的识别, 所述合成酶通常需要高选择性以确保蛋白质翻译的保真度。一种扩展这种方法的 范围的方式在于放宽氨酰基tRNA合成酶的底物特异性,这已在有限数目的情况 下达成。举例来说,在大肠杆菌苯丙氨酰基tRNA合成酶(PheRS)中由Gly置换 Ala294可增加底物结合袋的尺寸,并且导致对氯苯丙氨酸(p-Cl-Phe)使tRNAPhe 酰化。参见M.Ibba,P.Kast和H.Hennecke,Biochemistry,33:7107(1994)。带有这 种突变PheRS的大肠杆菌菌株允许并入对氯苯丙氨酸或对溴苯丙氨酸来代替苯丙 氨酸。例如参见M.Ibba和H.Hennecke,FEBSLett.,364:272(1995);以及N.Sharma, R.Furter,P.Kast和D.A.Tirrell,FEBSLett.,467:37(2000)。类似地,显示接近大 肠杆菌酪氨酰基tRNA合成酶的氨基酸结合位点的点突变Phe130Ser允许氮杂酪 氨酸比酪氨酸更有效地并入。参见F.Hamano-Takaku,T.Iwama,S.Saito-Yano,K. Takaku,Y.Monden,M.Kitabatake,D.Soil和S.Nishimura,J.Biol.Chem., 275:40324(2000)。
在活体内将非天然氨基酸并入蛋白质中的另一种策略是修饰具有校对机制的 合成酶。这些合成酶无法区分在结构上与同源天然氨基酸类似的氨基酸并且因此 使其活化。此错误在单独位点上得到修正,这使来自tRNA的错配氨基酸去酰化 以保持蛋白质翻译的保真度。如果合成酶失去校对活性,那么错误活化的结构类 似物可避开编辑功能并且被并入。目前已用缬氨酰基tRNA合成酶(ValRS)证实 这种方法。参见V.Doring,H.D.Mootz,L.A.Nangle,T.L.Hendrickson,V.de Crecy-Lagard,P.Schimmel和P.Marliere,Science,292:501(2001)。ValRS可利用 Cys、Thr或氨基丁酸(Abu)使tRNAVal错误氨酰基化;随后,通过编辑域水解 这些非同源氨基酸。在使大肠杆菌染色体随机诱变之后,选择在ValRS的编辑位 点中具有突变的突变大肠杆菌菌株。这种编辑缺陷型ValRS错误地使tRNAVal装 有Cys。因为Abu与Cys在空间上类似(Cys的-SH基团是由Abu中的-CH3置换), 所以当这种突变大肠杆菌菌株在存在Abu的情况下生长时,突变ValRS也将Abu 并入蛋白质中。质谱分析显示在天然蛋白质中的各缬氨酸位置处约24%的缬氨酸 由Abu置换。
固相合成和半合成方法也已允许合成含有新颖氨基酸的多种蛋白质。举例来 说,参见以下公开案和其中引用的如下参考文献:Crick,F.H.C.,Barrett,L.Brenner, S.Watts-Tobin,R.Generalnatureofthegeneticcodeforproteins.Nature, 192:1227-1232(1961);Hofmann,K.,Bohn,H.Studiesonpolypeptides.XXXVI,The effectofpyrazole-imidazolereplacementsontheS-proteinactivatingpotencyofon S-peptidefragment,J.AmChem,88(24):5914-5919(1966);Kaiser,E.T.Synthetic approachestobiologicallyactivepeptidesandproteinsincludingenyzmes,AceChemRes,22:47-54(1989);Nakatsuka,T.,Sasaki,T.,Kaiser,E.T.Peptidesegmentcoupling catalyzedbythesemisyntheticenzymethiosubtilisin,JAmChemSoc,109:3808-3810 (1987);Schnolzer,M.,Kent,SBH.Constructingproteinsbydovetailingunprotected syntheticpeptides:backbone-engineeredHIVprotease,Science,256(5054):221-225 (1992);Chaiken,I.M.Semisyntheticpeptidesandproteins,CRCCritRevBiochem, 11(3):255-301(1981);Offord,R.E.Proteinengineeringbychemicalmeans?ProteinEng.,1(3):151-157(1987);以及Jackson,D.Y.,Burnier,J.,Quan,C,Stanley,M.,Tom, J.,Wells,J.A.ADesignedPeptideLigaseforTotalSynthesofRibonucleaseAwith UnnaturalCatalyticResidues,Science,266(5183):243(1994)。
已使用化学修饰在活体外将包括辅因子、自旋标记和寡核苷酸的多种非天然 侧链引入蛋白质中。例如参见Corey,D.R.,Schultz,P.G.Generationofahybrid sequence-specificsingle-strandeddeoxyribonuclease,Science,238(4832):1401-1403 (1987);Kaiser,E.T.,LawrenceD.S.,Rokita,S.E.Thechemicalmodificationof enzymaticspecificity,AnnuRevBiochem,54:565-595(1985);Kaiser,E.T.,Lawrence, D.S.Chemicalmutationofenyzmeactivesites,Science,226(4674):505-511(1984); Neet,K.E.,NanciA,Koshland,D.E.Propertiesofthiol-subtilisin,JBiol.Chem, 243(24):6392-6401(1968);Polgar,L.etM.L.Bender,Anewenzymecontaininga syntheticallyformedactivesite.Thiol-subtilisin.J.AmChemSoc,88:3153-3154 (1966);以及Pollack,S.J.,Nakayama,G.Schultz,P.G.Introductionofnucleophiles andspectroscopicprobesintoantibodycombiningsites,Science, 242(4881):1038-1040(1988)。
或者,使用以化学方式修饰的氨酰基tRNA的生物合成方法已用于将多种生 物物理探针并入在活体外合成的蛋白质中。参见以下公开案和其中所引用的参考 文献:Brunner,J.NewPhotolabelingandcrosslinkingmethods,Annu.RevBiochem, 62:483-514(1993);以及Krieg,U.C.,Walter,P.,Hohnson,A.E.Photocrosslinkingof thesignalsequenceofnascentpreprolactinofthe54-kilodaltonpolypeptideofthe signalrecognitionparticle,Proc.Natl.Acad.Sci,83(22):8604-8608(1986)。
先前已显示,可通过向利用含有所需琥珀无义突变的基因编程的蛋白质合成 反应中添加以化学方式氨酰基化的抑制因子tRNA而在活体外将非天然氨基酸位 点特异性地并入蛋白质中。使用这些方法,可使用特定氨基酸的营养缺陷型菌株, 用密切结构同源物取代20种常见氨基酸中的多种氨基酸,例如用氟苯丙氨酸取代 苯丙氨酸。例如参见Noren,C.J.,Anthony-Cahill,Griffith,M.C.,Schultz,P.G.A generalmethodforsite-specificincorporationofunnaturalaminoacidsintoproteins, Science,244:182-188(1989);M.W.Nowak等人,Science268:439-42(1995);Bain, J.D.,Glabe,C.G.,Dix,T.A.,Chamberlin,A.R.,Diala,E.S.Biosyntheticsite-specific Incorporationofanon-naturalaminoacidintoapolypeptide,J.AmChemSoc, 111:8013-8014(1989);N.Budisa等人,FASEBJ.13:41-51(1999);Ellman,J.A., Mendel,D.,Anthony-Cahill,S.,Noren,C.J.,Schultz,P.G.Biosyntheticmethodfor introducingunnaturalaminoacidssite-specificallyintoproteins,MethodsinEnz.,第 202卷,301-336(1992);以及Mendel,D.,Cornish,V.W.和Schultz,P.G.Site-Directed MutagenesiswithanExpandedGeneticCode,AnnuRevBiophvs.BiomolStruct.24, 435-62(1995)。
举例来说,制备识别终止密码子UAG的抑制因子tRNA并且用非天然氨基酸 以化学方式使其氨酰基化。使用常规定点诱变在蛋白质基因中的所关注位点处引 入终止密码子TAG。例如参见Sayers,J.R.,Schmidt,W.Eckstein,F.5′-3′ Exonucleaseinphosphorothioate-basedolignoucleotide-directedmutagensis,NucleicAcidsRes,16(3):791-802(1988)。当将酰基化抑制因子tRNA和突变基因组合到活 体外转录/翻译系统中时,回应UAG密码子而并入非天然氨基酸,这得到在指定 位置处含有所述氨基酸的蛋白质。使用[3H]-Phe的实验以及使用α-羟基酸的实验 证实,在由UAG密码子指定的位置处仅并入所需氨基酸且此氨基酸未在蛋白质 中的任何其它位点处并入。例如参见Noren等人,同上文;Kobayashi等人,(2003) NatureStructuralBiology10(6):425-432;以及Ellman,J.A.,Mendel,D.,Schultz,P.G. Site-specificincorporationofnovelbackbonestructuresintoproteins,Science, 255(5041):197-200(1992)。
可通过任何方法或技术(包括(但不限于)化学或酶促氨酰基化)利用所需 氨基酸使tRNA氨酰基化。
可通过氨酰基tRNA合成酶或其它酶促分子(包括(但不限于)核糖酶)来 实现氨酰基化。术语“核糖酶”可与“催化性RNA”互换。Cech和同事(Cech,1987, Science,236:1532-1539;McCorkle等人,1987,ConceptsBiochem.64:221-226)证 实存在可充当催化剂的天然存在RNA(核糖酶)。然而,尽管仅证实这些天然RNA 催化剂对核糖核酸底物具有裂解和剪接作用,但关于核糖酶人工开发的新近发展 已将催化谱系扩大到各种化学反应。研究已鉴别出可催化自身(2′)3′末端的氨酰 基RNA键的RNA分子(Illangakekare等人,1995Science267:643-647),以及可 将氨基酸从一个RNA分子转移到另一个RNA分子的RNA分子(Lohse等人,1996, Nature381:442-444)。
美国专利申请公开案2003/0228593(其是以引用的方式并入本文中)描述构 建核糖酶的方法和其在利用天然编码和非天然编码氨基酸使tRNA氨酰基化中的 用途。可使tRNA氨酰基化的酶分子(包括(但不限于)核糖酶)的底物固定形 式使得能够有效地亲和纯化氨酰基化产物。合适的底物的实例包括琼脂糖、琼脂 糖凝胶和磁性珠粒。用于氨酰基化的底物固定形式的核糖酶的制备和使用描述于 ChemistryandBiology2003,10:1077-1084以及美国专利申请公开案2003/0228593 中,其是以引用的方式并入本文中。
化学氨酰基化方法包括(但不限于)避免在氨酰基化过程中使用合成酶的由 Hecht和同事(Hecht,S.M.Ace.Chem.Res.1992,25,545;Heckler,T.G.;Roesser,J. R.;Xu,C;Chang,P.;Hecht,S.M.Biochemistry1988,27,7254;Hecht,S.M.;Alford, B.L.;Kuroda,Y.;Kitano,S.J.Biol.Chem.1978,253,4517)以及由Schultz、 Chamberlin、Dougherty和其它人(Cornish,V.W.;Mendel,D.;Schultz,P.G.Angew. Chem.Int.Ed.Engl.1995,34,621;Robertson,S.A.;Ellman,J.A.;Schultz,P.G.J. Am.Chem.Soc.1991,113,2722;Noren,C.J.;Anthony-Cahill,S.J.;Griffith,M.C; Schultz,P.G.Science1989,244,182;Bain,J.D.;Glabe,C.G.;Dix,T.A.; Chamberlin,A.R.J.Am.Chem.Soc.1989,111,8013;Bain,J.D.等人,Nature1992, 356,537;Gallivan,J.P.;Lester,H.A.;Dougherty,D.A.Chem.Biol.1997,4,740; Turcatti等人,J.Biol.Chem.1996,271,19991;Nowak,M.W.等人,Science,1995, 268,439;Saks,M.E.等人,J.Biol.Chem.1996,271,23169;Hohsaka,T.等人,J.Am. Chem.Soc.1999,121,34)(其是以引用的方式并入本文中)介绍方法。所述方法 或其它化学氨酰基化方法可用于使tRNA分子氨酰基化。
产生催化性RNA的方法可涉及产生单独的随机核糖酶序列的池,对所述池进 行定向演化,针对所需氨酰基化活性筛选所述池,并且选择显示所需氨酰基化活 性的核糖酶序列。
核糖酶可包含促进酰化活性的基元和/或区,例如GGU基元和富含U的区。 举例来说,已报道富含U的区可促进氨基酸底物的识别,并且GGU基元可与tRNA 的3′末端形成碱基对。GGU基元和富含U的区的组合促进氨基酸与tRNA的同时 识别,并且从而促进tRNA的3′末端的氨酰基化。
可通过使用与tRNAAsnCCCG结合的部分随机化r24mini进行活体外选择,接着 系统性工程改造在活性克隆中发现的一致序列来产生核糖酶。由这种方法获得的 示范性核糖酶被称作“Fx3核糖酶”并且描述于美国公开申请案第2003/0228593 号(其内容是以引用的方式并入本文中)中,其充当合成各种装载有同源非天然 氨基酸的氨酰基tRNA的通用催化剂。
在底物上固定可用于促成氨酰基化tRNA的有效亲和性纯化。合适的底物的 实例包括(但不限于)琼脂糖、琼脂糖凝胶和磁性珠粒。可利用RNA的化学结构 将核糖酶固定在树脂上,例如,可用高碘酸盐氧化RNA核糖上的3′-顺式二醇以 产生相应的二醛,从而促进RNA在树脂上的固定。可使用各种类型的树脂(包括 廉价的酰肼树脂),其中还原性胺化使树脂与核糖酶之间的相互作用产生不可逆连 接。可通过这项柱上氨酰基化技术显著促进氨酰基tRNA的合成。Kourouklis等 人,Methods2005;36:239-4描述一种以柱为基础的氨酰基化系统。
可以多种方式实现氨酰基化tRNA的分离。一种合适的方法是用缓冲液从柱 中洗提氨酰基化tRNA,所述缓冲液例如具有10mMEDTA的乙酸钠溶液、含有 50mMN-(2-羟基乙基)哌嗪-N′-(3-丙烷磺酸)、12.5mMKCl(pH7.0)、10mMEDTA 的缓冲液或简单经EDTA缓冲的水(pH7.0)。
可将氨酰基化tRNA添加到翻译反应中以便将使tRNA氨酰基化的氨基酸并 入翻译反应所产生的多肽中的所选位置中。可使用本发明的氨酰基化tRNA的翻 译系统的实例包括(但不限于)细胞溶菌液。细胞溶菌液提供由所输入的mRNA 活体外翻译多肽所必需的反应组分。所述反应组分的实例包括(但不限于)核糖 体蛋白、rRNA、氨基酸、tRNA、GTP、ATP、翻译起始和延伸因子以及与翻译相 关的其它因子。另外,翻译系统可为分批翻译或间隔翻译(compartmentalized translation)。分批翻译系统将反应组分组合到单一隔室中,而间隔翻译系统将翻 译反应组分与可抑制翻译效率的反应产物分隔开。这些翻译系统在市面上有售。
此外,可使用偶合转录/翻译系统。偶合转录/翻译系统允许将所输入的DNA 转录为相应mRNA,而所述mRNA又由反应组分进行翻译。市售偶合转录/翻译 的实例为RapidTranslationSystem(RTS,RocheInc.)。所述系统包括含有大肠杆 菌溶菌液的混合物以提供例如核糖体和翻译因子等翻译组分。另外,还包括RNA 聚合酶以将所输入DNA转录为mRNA模板以用于翻译。RTS可经由反应隔室(包 括供应/消耗隔室和转录/翻译隔室)之间插入的膜来分隔反应组分。
可由其它试剂(包括(但不限于)转移酶、聚合酶、催化抗体、多功能蛋白 质等)进行tRNA的氨酰基化。
Stephan在Scientist,2005年10月10日;第30-33页中描述将非天然编码氨 基酸并入蛋白质中的其它方法。Lu等人在MolCell.2001年10月;8(4);759-69中 描述一种以化学方式使蛋白质与含有非天然氨基酸的合成肽化学连接(经表达的 蛋白质连接)的方法。
也已使用微注射技术将非天然氨基酸并入蛋白质中。例如参见M.W.Nowak, P.C.Kearney,J.R.Sampson,M.E.Saks,C.G.Labarca,S.K.Silverman,W.G. Zhong,J.Thorson,J.N.Abelson,N.Davidson,P.G.Schultz,D.A.Dougherty和H.A. Lester,Science,268:439(1995);以及D.A.Dougherty,Curr.Opin.Chem.Biol., 4:645(2000)。将爪蟾卵母细胞(Xenopusoocyte)与活体外产生的以下两种RNA 物质共同注射:在所关注的氨基酸位置处具有UAG终止密码子的编码标靶蛋白 的mRNA,和经所需非天然氨基酸氨酰基化的琥珀抑制因子tRNA。随后,卵母 细胞的翻译机构将非天然氨基酸插入由UAG指定的位置处。这种方法已允许通 常不适用于活体外表达系统的整体膜蛋白的活体内结构-功能研究。实例包括将荧 光氨基酸并入速激肽神经激肽-2受体中以通过荧光共振能量转移来测量距离,例 如参见G.Turcatti,K.Nemeth,M.D.Edgerton,U.Meseth,F.Talabot,M.Peitsch,J. Knowles,H.Vogel和A.Chollet,J.Biol.Chem.,271:19991(1996);并入生物素化氨 基酸以鉴别离子通道中表面暴露的残基,例如参见J.P.Gallivan,H.A.Lester和 D.A.Dougherty,Chem.Biol.,4:739(1997);使用笼化的酪胺酸类似物以实时监控 离子通道中的构象变化,例如参见J.C.Miller,S.K.Silverman,P.M.England,D.A. Dougherty和H.A.Lester,Neuron,20:619(1998);以及使用α羟基氨基酸以改变用 于探究其门控机制的离子通道主链。例如参见P.M.England,Y.Zhang,D.A. Dougherty和H.A.Lester,Cell,96:89(1999);以及T.Lu,A.Y.Ting,J.Mainland,L. Y.Jan,P.G.Schultz和J.Yang,Nat.Neurosci4:239(2001)。
在活体内直接将非天然氨基酸并入蛋白质中的能力提供多种优点,其包括(但 不限于)突变蛋白的高产率、技术简易性、在细胞中或可能在活生物体中研究突 变蛋白的可能性以及这些突变蛋白在治疗性治疗和诊断使用中的使用。将具有各 种尺寸、酸度、亲核性、疏水性以及其它性质的非天然氨基酸包括在蛋白质中的 能力可极大地扩展理性并系统性地操纵蛋白质结构的能力,从而探究蛋白质功能 并且产生具有新颖性质的新蛋白质或生物体。
在位点特异性地并入para-F-Phe的一次尝试中,将酵母琥珀抑制因子 tRNAPheCUA/苯丙氨酰基tRNA合成酶对用于p-F-Phe抗性、Phe营养缺陷型大肠 杆菌菌株中。例如参见R.Furter,ProteinSci.,7:419(1998)。
使用不含无细胞的(活体外)翻译系统获得本发明的胰岛素多核苷酸的表达 也为是可能的。翻译系统可为细胞或无细胞翻译系统细胞性或不含细胞,并且可 为原核或真核翻译系统。细胞翻译系统包括(但不限于)其中可将所需核酸序列 可经转录为mRNA并且翻译所述mRNA经翻译的全细胞制剂,例如渗透细胞或 细胞培养物。不含无细胞的翻译系统在市面上有售,并且众所周知许多不同的类 型和系统。不含无细胞的系统的实例包括(但不限于)原核细胞溶菌液,例如大 肠杆菌溶菌液;以及真核细胞溶菌液,例如麦芽提取物、昆虫细胞溶菌液、兔网 织红细胞网状细胞溶菌液、兔卵母细胞溶菌液和人类细胞溶菌液。当所得蛋白质 经糖基化、磷酸化或以其它方式经修饰时,可优选真核细胞提取物或溶菌液,这 是因为许多所述修饰只可能在真核系统中发生。一些所述提取物和溶菌液在市面 上有售(Promega;Madison,Wis.;Stratagene;LaJolla,Calif.;Amersham;Arlington Heights,Ill.;GIBCO/BRL;GrandIsland,N.Y.)。也可用膜提取物(例如含有微粒 体膜的犬胰腺提取物),其适用于翻译分泌蛋白。在可包括mRNA作为模板(活 体外翻译)或包括DNA作为模板(组合型活体外转录和翻译)的这些系统中, 由核糖体指导活体外合成。已进行相当多的尝试来开发无细胞的蛋白质表达系统。 例如参见Kim,D.M.和J.R.Swartz,BiotechnologyandBioengineering,74:309-316 (2001);Kim,D.M.和J.R.Swartz,BiotechnologyLetters,22,1537-1542,(2000);Kim, D.M.和J.R.Swartz,BiotechnologyProgress,16,385-390,(2000);Kim,D.M.和J.R. Swartz,BiotechnologyandBioengineering,66,180-188,(1999);以及Patnaik,R.和 J.R.Swartz,Biotechniques24,862-868,(1998);美国专利第6,337,191号;美国专 利公开案第2002/0081660号;WO00/55353;WO90/05785,其是以引用的方式 并入本文中。另一种可用于表达包含非天然编码氨基酸的胰岛素多肽的方法包括 mRNA-肽融合技术。例如参见R.Roberts和J.Szostak,Proc.NatlAcad.Sci.(USA) 94:12297-12302(1997);A.Frankel等人,Chemistry&Biology10:1043-1050 (2003)。在这种方法中,在核糖体上将与嘌呤霉素(puromycin)连接的mRNA模 板翻译为肽。如果已对一种或一种以上tRNA分子进行修饰,那么也可将非天然 氨基酸并入肽中。在已读取最后一个mRNA密码子之后,嘌呤霉素捕获肽的C端。 如果发现所得mRNA-肽结合物在活体外测定中具有引人关注的性质,那么易于由 mRNA序列揭示其特性。用这种方式,可筛选包含一个或一个以上非天然编码氨 基酸的胰岛素多肽的文库,以鉴别具有所需性质的多肽。最近,已报道利用经纯 化组分的活体外核糖体翻译,其允许合成经非天然编码氨基酸取代的肽。例如参 见A.Forster等人,Proc.NatlAcad.Sci.(USA)100:6353(2003)。
也可使用重构翻译系统。已成功地使用经纯化翻译因子的混合物以及溶菌液 或补充有经纯化翻译因子(例如起始因子-1(IF-1)、IF-2、IF-3(α或β)、延伸 因子T(EF-Tu)或终止因子)的溶菌液的组合将mRNA翻译为蛋白质。无细胞 系统也可为偶合转录/翻译系统,其中如CurrentProtocolsinMolecularBiology(F. M.Ausubel等人编辑,WileyInterscience,1993)(其以引用的方式特别并入本文 中)中所述,将DNA引入所述系统中,转录成mRNA并翻译所述mRNA。在真 核转录系统中转录的RNA可为异核RNA(hnRNA)或5′端戴帽(7-甲基鸟苷) 和3′端加聚腺苷酸尾的成熟mRNA的形式,其在某些翻译系统中可为优点。举例 来说,在网织红细胞溶菌液系统中,以高效率翻译戴帽的mRNA。
与胰岛素多肽偶合的大分子聚合物
可使用本文中所述的组合物、方法、技术和策略来实现对本文中所述的非天 然氨基酸多肽的各种修饰。这些修饰包括将其它官能团并入到多肽的非天然氨基 酸组分上,所述官能团包括(但不限于)标记;染料;聚合物;水溶性聚合物; 聚乙二醇的衍生物;光交联剂;放射性核素;细胞毒性化合物;药物;亲和性标 记;光亲和性标记;反应性化合物;树脂;第二蛋白质或多肽或多肽类似物;抗 体或抗体片段;金属螯合剂;辅因子;脂肪酸;碳水化合物;多核苷酸;DNA; RNA;反义多核苷酸;糖类;水溶性树枝状聚合物;环糊精;抑制性核糖核酸; 生物材料;纳米粒子;自旋标记;荧光团;含金属的部分;放射性部分;新颖官 能团;与其它分子共价或非共价相互作用的基团;光笼化部分;光化辐射可激发 的部分;可光致异构化部分;生物素;生物素衍生物;生物素类似物;结合有重 原子的部分;可化学裂解的基团;可光裂解的基团;延长的侧链;碳连接的糖; 氧化还原活性剂;氨基硫代酸;毒性部分;经同位素标记的部分;生物物理探针; 磷光基团;化学发光基团;电子致密基团;磁性基团;插入基团;发色团;能量 转移剂;生物活性剂;可检测标记;小分子;量子点;纳米传递素;放射性核苷 酸;放射性传递素;中子俘获剂;或上述物质的任何组合,或任何其它所需化合 物或物质。作为本文中所述的组合物、方法、技术和策略的说明性、非限制性实 例,以下描述将集中在将大分子聚合物添加到非天然氨基酸多肽上,同时应了解, 相关的组合物、方法、技术和策略也适用于(必要时适当修饰,并且所属领域的 技术人员可用本文中的揭示内容进行)添加其它官能团(包括(但不限于)上文 列出的官能团)。
多种大分子聚合物和其它分子可与本发明的胰岛素多肽连接以调节胰岛素多 肽的生物性质和/或对胰岛素分子提供新颖的生物性质。这些大分子聚合物可通过 天然编码氨基酸、通过非天然编码氨基酸或天然或非天然氨基酸的任何官能取代 基或添加到天然或非天然氨基酸中的任何取代基或官能团与胰岛素多肽连接。聚 合物的分子量可具有宽范围,包括(但不限于)介于约100Da与约100,000Da 或100,000Da以上之间。聚合物的分子量可介于约100Da与约100,000Da之间, 包括(但不限于)100,000Da、95,000Da、90,000Da、85,000Da、80,000Da、75,000 Da、70,000Da、65,000Da、60,000Da、55,000Da、50,000Da、45,000Da、40,000 Da、35,000Da、30,000Da、25,000Da、20,000Da、15,000Da、10,000Da、9,000 Da、8,000Da、7,000Da、6,000Da、5,000Da、4,000Da、3,000Da、2,000Da、 1,000Da、900Da、800Da、700Da、600Da、500Da、400Da、300Da、200Da 和100Da。在一些实施例中,聚合物的分子量介于约100Da与约50,000Da之间。 在一些实施例中,聚合物的分子量介于约100Da与约40,000Da之间。在一些实 施例中,聚合物的分子量介于约1,000Da与约40,000Da之间。在一些实施例中, 聚合物的分子量介于约5,000Da与约40,000Da之间。在一些实施例中,聚合物 的分子量介于约10,000Da与约40,000Da之间。
本发明提供实质上均质的聚合物:蛋白质结合物的制剂。如本文中所用,“实 质上均质”意思是观察到聚合物:蛋白质结合物分子大于总蛋白质的一半。所述聚 合物:蛋白质结合物具有生物活性并且本文中提供的本发明的“实质上均质”的聚 乙二醇化胰岛素多肽制剂为足够均质以致显示均质制剂的优点(例如易于在临床 应用中预测各批次之间的药物动力学)的制剂。
也可选择制备聚合物:蛋白质结合物分子的混合物,并且本文中提供的优点在 于可选择包括在素数混合物中的单一聚合物:蛋白质结合物的比例。因此,必要时, 可制备各种蛋白质与各种数目的所连接的聚合物部分(即两个、三个、四个部分 等)的混合物,并且将所述结合物与使用本发明的方法制备的单一聚合物:蛋白质 结合物组合,并获得具有预定的单聚合物:蛋白质结合物比例的混合物。
所选聚合物可为水溶性的,以致其所连接的蛋白质在水性环境(例如生理环 境)中不沉淀。聚合物可为分支或未分支的。对于最终产品制剂的治疗性使用来 说,聚合物将为医药学上可接受的。
聚合物的实例包括(但不限于)聚烷基醚和其经烷氧基封端的类似物(例如 聚氧乙二醇(polyoxyethyleneglycol)、聚氧乙二醇/丙二醇以及其经甲氧基或乙氧 基封端的类似物,尤其聚氧乙二醇,后者也被称作聚乙二醇(polyethyleneglycol) 或PEG);聚乙烯吡咯烷酮;聚乙烯基烷基醚;聚噁唑啉、聚烷基噁唑啉和聚羟 基烷基噁唑啉;聚丙烯酰胺、聚烷基丙烯酰胺和聚羟基烷基丙烯酰胺(例如聚羟 基丙基甲基丙烯酰胺和其衍生物);聚羟基烷基丙烯酸酯;聚唾液酸和其类似物; 亲水性肽序列;聚糖和其衍生物,其包括葡聚糖和葡聚糖衍生物,例如羧甲基葡 聚糖、硫酸葡聚糖、氨基葡聚糖;纤维素和其衍生物,例如羧甲基纤维素、羟基 烷基纤维素;几丁质和其衍生物,例如壳聚糖、丁二酰基壳聚糖、羧甲基几丁质、 羧甲基壳聚糖;透明质酸和其衍生物;淀粉;海藻酸盐;硫酸软骨素;白蛋白; 支链淀粉和羧甲基支链淀粉;聚氨基酸和其衍生物,例如聚谷氨酸、聚赖氨酸、 聚天冬氨酸、聚天冬酰胺;顺丁烯二酸酐共聚物,例如苯乙烯顺丁烯二酸酐共聚 物、二乙烯基乙醚顺丁烯二酸酐共聚物;聚乙烯醇;其共聚物;其三聚物;其混 合物;以及上述物质的衍生物。
聚乙二醇分子与蛋白质分子的比例将改变,其在反应混合物中的浓度也将改 变。一般来说,可通过所选聚乙二醇的分子量和可提供的可用反应性基团的数目 来确定最佳比率(就存在最小过量的未反应蛋白质或聚合物的反应的效率来说)。 当涉及分子量时,通常聚合物的分子量越高,可与蛋白质连接的聚合物分子的数 目就越少。类似地,当优化这些参数时,应将聚合物的分支考虑在内。通常,分 子量越高(或支链越多),聚合物:蛋白质比率就越高。
如本文中所用,并且当涵盖PEG:胰岛素多肽结合物时,术语“治疗有效量” 是指使患者得到所需益处的量。所述量将随个体而变化并且将视多种因素而定, 包括患者的整体身体状况和欲治疗病状的潜伏病因。用于疗法的胰岛素多肽的量 提供可接受的变化速率并且将所需反应维持在有益水平上。所属领域的技术人员 使用可公开获得的材料和程序可容易地确定本发明组合物的治疗有效量。
水溶性聚合物可为任何结构形式,包括(但不限于)线性、分叉或分支形式。 水溶性聚合物通常为聚(烷二醇)(例如聚(乙二醇)(PEG)),但也可使用其它水溶 性聚合物。举例来说,使用PEG来描述本发明的某些实施例。
PEG为众所周知的水溶性聚合物,其在市面上有售或可根据所属领域的技术 人员已知的方法(Sandler和Karo,PolymerSynthesis,AcademicPress,NewYork,第 3卷,第138-161页)通过乙二醇的开环聚合来制备。术语“PEG”广泛用于涵盖 任何聚乙二醇分子而不用考虑PEG的尺寸或其末端的修饰,并且可由下式表示为 与胰岛素多肽连接:
XO-(CH2CH2O)n-CH2CH2-Y
其中n为2到10,000并且X为H或末端修饰,其包括(但不限于)C1-4烷基、 保护基或末端官能团。
在一些情况下,本发明中所用的PEG在一端以羟基或甲氧基封端,即X为H 或CH3(“甲氧基PEG”)。或者,PEG可以反应性基团封端,从而形成双官能聚 合物。典型反应性基团可包括通常用于与20种常见氨基酸中所见的官能团反应的 反应性基团(包括(但不限于)顺丁烯二酰亚胺基、活化碳酸酯(包括(但不限 于)对硝基苯酯)、活化酯(包括(但不限于)N-羟基丁二酰亚胺、对硝基苯酯) 和醛)以及对20种常见氨基酸呈惰性、但与非天然编码氨基酸中存在的互补官能 团特异性反应的官能团(包括(但不限于)叠氮基、炔基)。应注意,PEG的另 一端(在上式中由Y表示)将与胰岛素多肽直接连接或通过天然存在或非天然编 码氨基酸间接与胰岛素多肽连接。举例来说,Y可为与多肽的胺基(包括(但不 限于)赖氨酸的ε胺或N端)连接的酰胺键、氨基甲酸酯键或尿素键。或者,Y 可为与硫醇基团(包括(但不限于)半胱氨酸的硫醇基团)连接的顺丁烯二酰亚 胺键。或者,Y可为与通过20种常见氨基酸通常不可接近的残基连接的键。举例 来说,PEG上的叠氮基可与胰岛素多肽上的炔基反应以形成休斯根[3+2]环加成产 物。或者,PEG上的炔基可与非天然编码氨基酸中存在的叠氮基反应以形成类似 产物。在一些实施例中,强亲核试剂(包括(但不限于)肼、酰肼、羟胺、氨基 脲)可与非天然编码氨基酸中存在的醛或酮基反应以形成腙、肟或缩氨基脲,在 一些情况下,适当时可通过由适当还原剂处理而进一步还原腙、肟或缩氨基脲。 或者,强亲核试剂可通过非天然编码氨基酸并入胰岛素多肽中并且可用于优先与 水溶性聚合物中存在的酮或醛基反应。
可按照实际需要使用任何分子质量的PEG,所述分子质量视需要包括(但不 限于)约100道尔顿(Dalton;Da)到100,000Da或100,000Da以上(包括(但 不限于)有时为0.1-50kDa或10-40kDa)。PEG的分子量可具有宽范围,包括(但 不限于)介于约100Da与约100,000Da或100,000Da以上之间。PEG可介于约 100Da与约100,000Da之间,包括(但不限于)100,000Da、95,000Da、90,000Da、 85,000Da、80,000Da、75,000Da、70,000Da、65,000Da、60,000Da、55,000Da、 50,000Da、45,000Da、40,000Da、35,000Da、30,000Da、25,000Da、20,000Da、 15,000Da、10,000Da、9,000Da、8,000Da、7,000Da、6,000Da、5,000Da、4,000 Da、3,000Da、2,000Da、1,000Da、900Da、800Da、700Da、600Da、500Da、 400Da、300Da、200Da和100Da。在一些实施例中,PEG介于约100Da与约 50,000Da之间。在一些实施例中,PEG介于约100Da与约40,000Da之间。在 一些实施例中,PEG介于约1,000Da与约40,000Da之间。在一些实施例中,PEG 介于约5,000Da与约40,000Da之间。在一些实施例中,PEG介于约10,000Da 与约40,000Da之间。也可使用支链PEG,其包括(但不限于)各链具有在1-100 kDa(包括(但不限于)1-50kDa或5-20kDa)范围内的MW的PEG分子。支链 PEG的各链的分子量可(包括(但不限于))介于约1,000Da与约100,000Da或 100,000Da之间。支链PEG的各链的分子量可介于约1,000Da与约100,000Da 之间,包括(但不限于)100,000Da、95,000Da、90,000Da、85,000Da、80,000Da、 75,000Da、70,000Da、65,000Da、60,000Da、55,000Da、50,000Da、45,000Da、 40,000Da、35,000Da、30,000Da、25,000Da、20,000Da、15,000Da、10,000Da、 9,000Da、8,000Da、7,000Da、6,000Da、5,000Da、4,000Da、3,000Da、2,000Da 和1,000Da。在一些实施例中,支链PEG的各链的分子量介于约1,000Da与约 50,000Da之间。在一些实施例中,支链PEG的各链的分子量介于约1,000Da与 约40,000Da之间。在一些实施例中,支链PEG的各链的分子量介于约5,000Da 与约40,000Da之间。在一些实施例中,支链PEG的各链的分子量介于约5,000Da 与约20,000Da之间。多种PEG分子描述于(包括(但不限于))ShearwaterPolymers, Inc.目录、NektarTherapeutics目录中,所述目录以引用的方式并入本文中。
通常,PEG分子的至少一个末端可用于与非天然编码氨基酸反应。举例来说, 可使用具有与氨基酸侧链反应的炔基和叠氮部分的PEG衍生物来使PEG与如本 文中所述的非天然编码氨基酸连接。如果非天然编码氨基酸包含叠氮基,那么PEG 通常将含有炔部分以实现[3+2]环加成产物的形成,或含有膦基的活化PEG物质 (即酯、碳酸酯)以实现酰胺键形成。或者,如果非天然编码氨基酸包含炔,那么 PEG通常将含有实现叠氮部分以实现[3+2]休斯根环加成产物的形成。如果非天然 编码氨基酸包含羰基,那么PEG通常将分别包含有效亲核试剂(包括(但不限于) 酰肼、肼、羟胺或氨基脲官能团)以实现相应腙、肟和缩氨基脲键的形成。在其 它替代方案中,可使用上述反应性基团的相反定向,即可使非天然编码氨基酸中 的叠氮部分与含有炔的PEG衍生物反应。
在一些实施例中,具有PEG衍生物的胰岛素多肽变异体含有可与非天然编码 氨基酸侧链上存在的化学官能团反应的化学官能团。
在一些实施例中,本发明提供含叠氮基和乙炔的聚合物衍生物,其包含具有 约800Da到约100,000Da的平均分子量的水溶性聚合物主链。水溶性聚合物的聚 合物主链可为聚(乙二醇)。然而,应了解包括(但不限于)聚(乙二醇)和其它相关 聚合物(包括聚葡聚糖和聚(丙二醇))的多种水溶性聚合物也适用于实施本发明, 并且术语PEG或聚(乙二醇)的使用打算涵盖并且包括所有这些分子。术语PEG包 括(但不限于)呈任何形式的聚(乙二醇),包括双官能PEG、多臂PEG、衍生PEG、 分叉PEG、支链PEG、侧接PEG(即具有一个或一个以上侧接到聚合物主链上的 官能团的PEG或相关聚合物)或具有可降解键的PEG。
PEG通常为透明、无色、无味的,可溶于水中,对热稳定,对许多化学试剂 呈惰性,不水解或变质,并且通常无毒。认为聚(乙二醇)为生物相容性的,也就 是说PEG能够与活组织或生物体共存而不引起危害。更具体来说,PEG实质上为 非免疫原性的,也就是说PEG不倾向于在体内产生免疫反应。当与体内具有一些 所要功能的分子(例如生物活性剂)连接时,PEG倾向于掩蔽所述试剂并且可减 少或消除任何免疫反应,从而使生物体可耐受所述试剂的存在。PEG结合物倾向 于不产生实质免疫反应或引起凝血或其它不需的作用。具有式 --CH2CH2O--(CH2CH2O)n--CH2CH2--(其中n为约3到约4000,通常约20到约2000) 的PEG适用于本发明中。在本发明的一些实施例中,具有约800Da到约100,000
Da的分子量的PEG尤其适于用作聚合物主链。PEG的分子量可具有宽范围,包 括(但不限于)介于约100Da与约100,000Da或100,000Da以上之间。PEG的 分子量可介于约100Da与约100,000Da之间,包括(但不限于)100,000Da、95,000 Da、90,000Da、85,000Da、80,000Da、75,000Da、70,000Da、65,000Da、60,000 Da、55,000Da、50,000Da、45,000Da、40,000Da、35,000Da、30,000Da、25,000 Da、20,000Da、15,000Da、10,000Da、9,000Da、8,000Da、7,000Da、6,000Da、 5,000Da、4,000Da、3,000Da、2,000Da、1,000Da、900Da、800Da、700Da、 600Da、500Da、400Da、300Da、200Da和100Da。在一些实施例中,PEG的 分子量介于约100Da与约50,000Da之间。在一些实施例中,PEG的分子量介于 约100Da与约40,000Da之间。在一些实施例中,PEG的分子量介于约1,000Da 与约40,000Da之间。在一些实施例中,PEG的分子量介于约5,000Da与约40,000 Da之间。在一些实施例中,PEG的分子量介于约10,000Da与约40,000Da之间。
聚合物主链可为线性或分支的。所属领域中通常已知分支聚合物主链。通常, 分支聚合物具有一个中心分支核心部分和多个与中心分支核心连接的线性聚合物 链。PEG通常以分支形式使用,所述形式可通过将氧化乙烯添加到各种多元醇(例 如甘油、甘油寡聚物、季戊四醇以及山梨糖醇)上来制备。中心分支部分也可源 自多种氨基酸(例如赖氨酸)。分支聚(乙二醇)可以一般形式R(-PEG-OH)m表示, 其中R是源自例如甘油、甘油寡聚物或季戊四醇等核心部分,并且m表示臂的数 目。多臂PEG分子(例如在美国专利第5,932,462号;第5,643,575号;第5,229,490 号;第4,289,872号;美国专利申请案2003/0143596;WO96/21469;以及WO 93/21259中所述的多臂PEG分子,所述文献各自以全文引用的方式并入本文中) 也可用作聚合物主链。
分支PEG也可为由PEG(-YCHZ2)n表示的分叉PEG形式,其中Y为连接基 团并且Z为通过规定长度的原子链与CH连接的活化末端基团。
另一种分支形式侧接PEG沿PEG主链而不是在PEG链的末端处具有例如羧 基等反应性基团。
除这些PEG形式之外,也可制备主链中具有弱键或可降解键的聚合物。举例 来说,可制备聚合物主链中具有经受水解作用的酯键的PEG。如下文所示,这一 水解作用使聚合物裂解为较低分子量的片段:
-PEG-CO2-PEG-+H2O→PEG-CO2H+HO-PEG-
所属领域的技术人员应了解,术语聚(乙二醇)或PEG表示或包括所属领域中 已知的所有形式,其包括(但不限于)在本文中所揭示的形式。
许多其它聚合物也适用于本发明中。在一些实施例中,具有2到约300个末端 的水溶性聚合物主链尤其适用于本发明中。合适的聚合物的实例包括(但不限于) 其它聚(烷二醇),例如聚(丙二醇)(“PPG”)、其共聚物(包括(但不限于)乙二 醇与丙二醇的共聚物)、其三聚物、其混合物等。尽管聚合物主链的各链的分子量 可改变,但其通常在约800Da到约100,000Da、通常约6,000Da到约80,000Da的范 围内。聚合物主链的各链的分子量可介于约100Da与约100,000Da之间,包括(但 不限于)100,000Da、95,000Da、90,000Da、85,000Da、80,000Da、75,000Da、70,000 Da、65,000Da、60,000Da、55,000Da、50,000Da、45,000Da、40,000Da、35,000Da、 30,000Da、25,000Da、20,000Da、15,000Da、10,000Da、9,000Da、8,000Da、7,000 Da、6,000Da、5,000Da、4,000Da、3,000Da、2,000Da、1,000Da、900Da、800Da、 700Da、600Da、500Da、400Da、300Da、200Da和100Da。在一些实施例中,聚 合物主链的各链的分子量介于约100Da与约50,000Da之间。在一些实施例中,聚 合物主链的各链的分子量介于约100Da与约40,000Da之间。在一些实施例中,聚 合物主链的各链的分子量介于约1,000Da与约40,000Da之间。在一些实施例中, 聚合物主链的各链的分子量介于约5,000Da与约40,000Da之间。在一些实施例中, 聚合物主链的各链的分子量介于约10,000Da与约40,000Da之间。
所属领域的技术人员应认识到,实质上水溶性主链的上述清单无论如何并不 详尽并且仅具有说明性,并且预期具有上述性质的所有聚合物材料都适用于本发 明中。
在本发明的一些实施例中,聚合物衍生物为“多官能的”,意思是聚合物主链 具有至少两个经官能团官能化或活化的末端并且可能具有多达约300个末端。多 官能聚合物衍生物包括(但不限于)具有两个末端的线性聚合物,其中各末端与 可相同或不同的官能团键结。
在一实施例中,聚合物衍生物具有以下结构:
X-A-POLY-B-N=N=N
其中:
N=N=N为叠氮部分;
B为连接部分,其可存在或不存在;
POLY为水溶性非抗原聚合物;
A为连接部分,其可存在或不存在并且其可与B相同或不同;并且
X为第二官能团。
A和B的连接部分的实例包括(但不限于)含有多达18个并且可含有1-10 个碳原子的多官能烷基。烷基链中可包括例如氮、氧或硫等杂原子。烷基链也可 在杂原子处分支。A和B的连接部分的其它实例包括(但不限于)含有多达10 个并且可含有5-6个碳原子的多官能芳基。芳基的一个或一个以上碳原子可经氮、 氧或硫原子取代。合适的连接基团的其它实例包括美国专利第5,932,462号;第 5,643,575号;以及美国专利申请公开案2003/0143596中所述的连接基团,所述文 献各自以引用的方式并入本文中。所属领域的技术人员应认识到,连接部分的上 述清单无论如何并不详尽并且仅具有说明性,并且预期具有上述性质的所有连接 部分都适用于本发明中。
适合用作X的官能团的实例包括(但不限于)羟基、经保护羟基、烷氧基、 活性酯(例如N-羟基丁二酰亚胺酯和1-苯并三唑酯)、活性碳酸酯(例如碳酸N- 羟基丁二酰亚胺酯和碳酸1-苯并三唑酯)、乙缩醛、醛、水合醛、烯基、丙烯酸酯、 甲基丙烯酸酯、丙烯酰胺、活性砜、胺、氨氧基、经保护胺、酰肼、经保护酰肼、 经保护硫醇、羧酸、经保护羧酸、异氰酸酯、异硫氰酸酯、顺丁烯二酰亚胺、乙 烯基砜、二硫代吡啶、乙烯基吡啶、碘乙酰胺、环氧化物、乙二醛、二酮、甲磺 酸酯、甲苯磺酸酯、三氟乙磺酸酯、烯烃、酮和叠氮化物。所属领域的技术人员 应了解,所选X部分应与叠氮基相容以使得不与叠氮基发生反应。含叠氮基的聚 合物衍生物可为同双官能的,意思是第二官能团(即X)也是叠氮部分;或为异 双官能的,意思是第二官能团为不同的官能团。
术语“经保护”是指存在防止化学反应性官能团在某些反应条件下发生反应 的保护基或保护部分。保护基应视所保护的化学反应性基团的类型而改变。举例 来说,如果化学反应性基团是胺或酰肼,那么保护基可选自叔丁氧羰基(t-Boc) 和9-芴基甲氧基羰基(Fmoc)的群组。如果化学反应性基团为硫醇,那么保护基 可为邻吡啶基二硫化物。如果化学反应性基团为羧酸(例如丁酸或丙酸)或羟基, 那么保护基可为苄基或例如甲基、乙基或叔丁基等烷基。所属领域中已知的其它 保护基也可用于本发明中。
文献中末端官能团的特定实例包括(但不限于)碳酸N-丁二酰亚胺酯(例如 参见美国专利第5,281,698号、第5,468,478号)、胺(例如参见Buckmann等人, Makromol.Chem.182:1379(1981);Zalipsky等人,Eur.Polym.J.19:1177(1983))、 酰肼(例如参见Andresz等人,Makromol.Chem.179:301(1978))、丙酸丁二酰亚 胺酯和丁酸丁二酰亚胺酯(例如参见Olson等人,Poly(ethyleneglycol)Chemistry& BiologicalApplications,第170-181页,Harris和Zalipsky编,ACS,Washington,D.C., 1997;还参见美国专利第5,672,662号)、丁二酸丁二酰亚胺酯(例如参见 Abuchowski等人,CancerBiochem.Biophys.7:175(1984)以及Joppich等人, Makromol.Chem.180:1381(1979))、丁二酰亚胺酯(例如参见美国专利第4,670,417 号)、碳酸苯并三唑酯(例如参见美国专利第5,650,234号)、缩水甘油醚(例如参 见Pitha等人,Eur.JBiochem.94:11(1979);Elling等人,Biotech.Appl.Biochem. 13:354(1991))、氧羰基咪唑(例如参见Beauchamp等人,Anal.Biochem.131:25 (1983);Tondelli等人,J.ControlledRelease1:251(1985))、碳酸对硝基苯酯(例如 参见Veronese等人,Appl.Biochem.Biotech.,11:141(1985);以及Sartore等人,Appl. Biochem.Biotech.,27:45(1991))、醛(例如参见Harris等人,J.Polym.Sci.Chem.Ed. 22:341(1984);美国专利第5,824,784号、美国专利第5,252,714号)、顺丁烯二酰 亚胺(例如参见Goodson等人,Biotechnology(NY)8:343(1990);Romani等人, ChemistryofPeptidesandProteins2:29(1984));以及Kogan,SyntheticComm. 22:2417(1992))、邻吡啶基二硫化物(例如参见Woghiren等人,Bioconj.Chem. 4:314(1993))、丙烯醇(例如参见Sawhney等人,Macromolecules,26:581(1993))、 乙烯基砜(例如参见美国专利第5,900,461号)。所有上述参考文献和专利都是以 引用的方式并入本文中。
在本发明的某些实施例中,本发明的聚合物衍生物包含具有以下结构的聚合 物主链:
X-CH2CH2O--(CH2CH2O)n--CH2CH2-N=N=N
其中:
X为如上所述的官能团;并且
n为约20到约4000。
在另一实施例中,本发明的聚合物衍生物包含具有以下结构的聚合物主链:
X-CH2CH2O--(CH2CH2O)n--CH2CH2-O-(CH2)m-W-N=N=N
其中:
W为包含1-10个碳原子的脂肪族或芳香族连接部分;
n为约20到约4000;并且
X为如上所述的官能团,m介于1与10之间。
可通过所属领域中已知和/或本文中所揭示的多种方法来制备本发明的含叠 氮基的PEG衍生物。在下文展示的一种方法中,具有约800Da到约100,000Da 的平均分子量的水溶性聚合物主链(所述聚合物主链具有与第一官能团键结的第 一末端和与合适的离去基键结的第二末端)与叠氮基阴离子(其可与多种合适的 抗衡离子(包括钠、钾、叔丁基铵等)中的任一种配对)反应。离去基进行亲核 置换并且由叠氮部分置换,从而得到所需的含叠氮基的PEG聚合物。
X-PEG-L+N3-→X-PEG-N3
如上所示,适用于本发明的聚合物主链具有式X-PEG-L,其中PEG为聚(乙 二醇)并且X为不与叠氮基反应的官能团,并且L为合适的离去基。合适的官能 团的实例包括(但不限于)羟基、经保护羟基、缩醛、烯基、胺、氨氧基、经保 护胺、经保护酰肼、经保护硫醇、羧酸、经保护羧酸、顺丁烯二酰亚胺、二硫代 吡啶和乙烯基吡啶以及酮。合适的离去基的实例包括(但不限于)氯离子、溴离 子、碘离子、甲磺酸根、三氟乙磺酸根以及甲苯磺酸根。
在另一种制备本发明的含叠氮基的聚合物衍生物的方法中,使具有叠氮基官 能团的连接剂与平均分子量为约800Da到约100,000Da的水溶性聚合物主链接 触,其中连接剂具有将与PEG聚合物上的化学官能团选择性反应的化学官能团, 以形成含叠氮基的聚合物衍生物产物,其中叠氮基是通过连接基团与聚合物主链 分隔开。
示范性反应流程展示如下:
X-PEG-M+N-连接子-N=N=N→PG-X-PEG-连接子-N=N=N
其中:
PEG为聚(乙二醇)并且X为例如烷氧基等封端基团或如上所述的官能团;并 且
M为不可与叠氮基官能团反应、但可与N官能团有效且选择性反应的官能团。
合适的官能团的实例包括(但不限于):如果N为胺,那么M为羧酸、碳酸 酯或活性酯;如果N为酰肼或氨氧基部分,那么M为酮;如果N为亲核基团, 那么M为离去基。
可由已知方法(包括(但不限于)沉淀产物,必要时接着进行色谱)实现粗 产物的纯化。
下文展示在PEG二胺的情况下的更特定实例,其中一个胺经例如叔丁基-Boc 等保护基部分保护并且所得单保护的PEG二胺与具有叠氮基官能团的连接部分 反应:
BocHN-PEG-NH2+HO2C-(CH2)3-N=N=N
在这种情况下,可使用多种活化剂(例如亚硫酰氯或碳化二亚胺试剂以及N- 羟基丁二酰亚胺或N-羟基苯并三唑)使胺基与羧酸基团偶合以在单胺PEG衍生 物与具有叠氮基的连接部分之间产生酰胺键。在成功形成酰胺键之后,所得经N- 叔丁基-Boc-保护的含叠氮基的衍生物可直接用于修饰生物活性分子,或其可进一 步经精细修饰以安装其它适用的官能团。举例来说,可通过用强酸处理使N-t-Boc 基团水解以产生ω-氨基-PEG-叠氮化物。可使用所得胺作为合成把手(synthetic handle)来安装其它适用的官能团(例如顺丁烯二酰亚胺基团、活化二硫化物、 活化酯等)以产生有价值的异双官能试剂。
当需要将不同分子与聚合物的各末端连接时,异双官能衍生物尤其有用。举 例来说,ω-N-氨基-N-叠氮基PEG将允许具有活性亲电子基团(例如醛、酮、活 性酯、活性碳酸酯等)的分子与PEG的一个末端连接,并且将允许具有乙炔基团 的分子与PEG的另一个末端连接。
在本发明的另一实施例中,聚合物衍生物具有以下结构:
X-A-POLY-B-C≡C-R
其中:
R可为H或烷基、烯烃、烷氧基或芳基或经取代芳基;
B为连接部分,其可存在或不存在;
POLY为水溶性非抗原性聚合物;
A为连接部分,其可存在或不存在且其可与B相同或不同;并且
X为第二官能团。
A和B的连接部分的实例包括(但不限于)含有多达18个且可含有1-10个 碳原子的多官能烷基。烷基链中可包括例如氮、氧或硫等杂原子。烷基链也可在 杂原子处分支。A和B的连接部分的其它实例包括(但不限于)含有多达10个 并且可含有5-6个碳原子的多官能芳基。芳基的一个或一个以上个碳原子原子可 经氮、氧或硫原子取代。合适的连接基团的其它实例包括美国专利第5,932,462 号和第5,643,575号以及美国专利申请公开案2003/0143596中所述的连接基团, 所述文献各自以引用的方式并入本文中。所属领域的技术人员应认识到,连接部 分的上述清单无论如何并不详尽并且仅具有说明性,并且预期具有上述性质的多 种连接部分适用于本发明中。
适用作X的官能团的实例包括羟基、经保护羟基、烷氧基、活性酯(例如 N-羟基丁二酰亚胺酯和1-苯并三唑酯)、活性碳酸酯(例如碳酸N-羟基丁二酰亚 胺酯和碳酸1-苯并三唑酯)、乙缩醛、醛、水合醛、烯基、丙烯酸酯、甲基丙烯酸 酯、丙烯酰胺、活性砜、胺、氨氧基、经保护胺、酰肼、经保护酰肼、经保护硫 醇、羧酸、经保护羧酸、异氰酸酯、异硫氰酸酯、顺丁烯二酰亚胺、乙烯基砜、 二硫代吡啶、乙烯基吡啶、碘乙酰胺、环氧化物、乙二醛、二酮、甲磺酸酯、甲 苯磺酸酯和三氟乙磺酸酯、烯烃、酮以及乙炔。应了解,所选X部分应与乙炔基 相容以使得不与乙炔基发生反应。含乙炔的聚合物衍生物可为同双官能的,意思 是第二官能团(即X)也是乙炔部分,或异双官能的,意思是第二官能团是不同 的官能团。
在本发明的另一实施例中,聚合物衍生物包含具有以下结构的聚合物主链:
X-CH2CH2O-(CH2CH2O)n-CH2CH2-O-(CH2)m-C≡CH
其中:
X为如上所述的官能团;
n为约20到约4000;并且
m介于1与10之间。
各异双官能PEG聚合物的特定实例展示如下。
可使用所属领域的技术人员已知和/或本文中所揭示的方法来制备本发明的 含乙炔的PEG衍生物。在一种方法中,使具有约800Da到约100,000Da的平均 分子量的水溶性聚合物主链(所述聚合物主链具有与第一官能团键结的第一末端 和与合适的亲核基团键结的第二末端)与具有乙炔官能团和适于与PEG上的亲核 基团反应的离去基的化合物反应。当具有亲核部分的PEG聚合物与具有离去基的 分子组合时,离去基进行亲核置换并且由亲核部分置换,从而得到所需含乙炔的 聚合物。
X-PEG-Nu+L-A-C→X-PEG-Nu-A-C≡CR′
如上所示,用于反应中的优选聚合物主链具有式X-PEG-Nu,其中PEG为聚(乙 二醇),Nu为亲核部分并且X为不与Nu、L或乙炔官能团反应的官能团。
Nu的实例包括(但不限于)主要通过SN2型机制反应的胺、烷氧基、芳氧 基、巯基、亚氨基、羧酸酯基、酰肼基、氨氧基。Nu基团的其它实例包括主要通 过亲核加成反应来反应的官能团。L基团的实例包括氯离子、溴离子、碘离子、 甲磺酸根、三氟乙磺酸根和甲苯磺酸根和预期进行亲核置换的其它基团,以及酮、 醛、硫酯、烯烃、α-β不饱和羰基、碳酸酯基和预期进行亲核试剂加成的其它亲 电子基团。
在本发明的另一实施例中,A为具有1-10个碳原子的脂肪族连接子或具有 6-14个碳原子的经取代芳环。X为不与叠氮基反应的官能团,并且L为合适的离 去基。
在另一种用于制备本发明的含乙炔的聚合物衍生物的方法中,使具有约800 Da到约100,000Da的平均分子量、在一个末端上具有经保护官能团或封端剂并且 在另一个末端上具有合适的离去基的PEG聚合物与乙炔阴离子接触。
示范性反应流程展示如下:
X-PEG-L+-C≡CR′→X-PEG-C≡CR′
其中:
PEG为聚(乙二醇)并且X为例如烷氧基等封端基团或如上所述的官能团;并 且
R′为H、烷基、烷氧基、芳基或芳氧基或经取代烷基、烷氧基、芳基或芳氧 基。
在上文实例中,当与足够浓度的乙炔阴离子接触时,离去基L应充分反应以 进行SN2型置换反应。所属领域的技术人员已知由乙炔阴离子实现离去基的SN2 置换所需的反应条件。
通常可由所属领域中已知的方法(包括(但不限于)沉淀产物,必要时接着 进行色谱)来实现粗产物的纯化。
水溶性聚合物可与本发明的胰岛素多肽连接。水溶性聚合物可通过并入胰岛 素多肽中的非天然编码氨基酸或非天然编码或天然编码氨基酸的任何官能团或取 代基或添加到非天然编码或天然编码氨基酸中的任何官能团或取代基连接。或者, 水溶性聚合物是通过天然存在氨基酸(包括(但不限于)半胱氨酸、赖氨酸或N 端残基的胺基)与并有非天然编码氨基酸的胰岛素多肽连接。在一些情况下,本 发明的胰岛素多肽包含1、2、3、4、5、6、7、8、9、10个非天然氨基酸,其中 一个或一个以上非天然编码氨基酸与水溶性聚合物(包括(但不限于)PEG和/ 或寡糖)连接。在一些情况下,本发明的胰岛素多肽进一步包含1、2、3、4、5、 6、7、8、9、10或10个以上与水溶性聚合物连接的天然编码氨基酸。在一些情 况下,本发明的胰岛素多肽包含一个或一个以上与水溶性聚合物连接的非天然编 码氨基酸以及一个或一个以上与水溶性聚合物连接的天然存在氨基酸。在一些实 施例中,相对于未结合形式,本发明中所用的水溶性聚合物增加胰岛素多肽的血 清半衰期。
可调节与本发明的胰岛素多肽连接的水溶性聚合物的数目(即聚乙二醇化或 糖基化程度)以提供改变(包括(但不限于)增加或降低)的药理学、药物动力 学或药效特征,例如活体内半衰期。在一些实施例中,胰岛素的半衰期比未经修 饰的多肽增加至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、 增加到2倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、 15倍、16倍、17倍、18倍、19倍、20倍、25倍、30倍、35倍、40倍、50倍 或至少约100倍。
含有强亲核基团(即酰肼、肼、羟胺或氨基脲)的PEG衍生物
在本发明的一实施例中,用含有直接与PEG主链连接的末端肼、羟胺、酰肼 或氨基脲部分的PEG衍生物修饰包含含羰基的非天然编码氨基酸的胰岛素多肽。
在一些实施例中,羟胺末端PEG衍生物将具有以下结构:
RO-(CH2CH2O)n-O-(CH2)m-O-NH2
其中R为简单烷基(甲基、乙基、丙基等),m为2-10并且n为100-1,000 (即平均分子量介于5-40kDa之间)。
在一些实施例中,含肼或含酰肼的PEG衍生物将具有以下结构:
RO-(CH2CH2O)n-O-(CH2)m-X-NH-NH2
其中R为简单烷基(甲基、乙基、丙基等),m为2-10并且n为100-1,000 并且X任选地为可存在或不存在的羰基(C=O)。
在一些实施例中,含氨基脲的PEG衍生物将具有以下结构:
RO-(CH2CH2O)n-O-(CH2)m-NH-C(O)-NH-NH2
其中R为简单烷基(甲基、乙基、丙基等),m为2-10并且n为100-1,000。
在本发明的另一实施例中,用含有借助于酰胺键与PEG主链连接的末端羟 胺、酰肼、肼或氨基脲部分的PEG衍生物修饰包含含羰基的氨基酸的胰岛素多肽。
在一些实施例中,羟胺末端PEG衍生物具有以下结构:
RO-(CH2CH2O)n-O-(CH2)2-NH-C(O)(CH2)m-O-NH2
其中R为简单烷基(甲基、乙基、丙基等),m为2-10并且n为100-1,000 (即平均分子量介于5-40kDa之间)。
在一些实施例中,含肼或含酰肼的PEG衍生物具有以下结构:
RO-(CH2CH2O)n-O-(CH2)2-NH-C(O)(CH2)m-X-NH-NH2
其中R为简单烷基(甲基、乙基、丙基等),m为2-10,n为100-1,000并且 X任选地为可存在或不存在的羰基(C=O)。
在一些实施例中,含氨基脲的PEG衍生物具有以下结构:
RO-(CH2CH2O)n-O-(CH2)2-NH-C(O)(CH2)m-NH-C(O)-NH-NH2
其中R为简单烷基(甲基、乙基、丙基等),m为2-10并且n为100-1,000。
在本发明的另一实施例中,用含有末端肼、羟胺、酰肼或氨基脲部分的分支 PEG衍生物修饰包含含羰基的氨基酸的胰岛素多肽,其中分支PEG的各链具有在 10-40kDa范围内并且可为5-20kDa的MW。
在本发明的另一实施例中,用具有分支结构的PEG衍生物修饰包含非天然编 码氨基酸的胰岛素多肽。举例来说,在一些实施例中,肼或酰肼末端PEG衍生物 将具有以下结构:
[RO-(CH2CH2O)n-O-(CH2)2-NH-C(O)]2CH(CH2)m-X-NH-NH2
其中R为简单烷基(甲基、乙基、丙基等),m为2-10并且n为100-1,000, 并且X任选地为可存在或不存在的羰基(C=O)。
在一些实施例中,含有氨基脲基团的PEG衍生物将具有以下结构:
[RO-(CH2CH2O)n-O-(CH2)2-C(O)-NH-CH2-CH2]2CH-X-(CH2)m-NH-C(O)-N H-NH2
其中R为简单烷基(甲基、乙基、丙基等),X任选地为NH、O、S、C(O) 或不存在,m为2-10并且n为100-1,000。
在一些实施例中,含有羟胺基团的PEG衍生物将具有以下结构:
[RO-(CH2CH2O)n-O-(CH2)2-C(O)-NH-CH2-CH2]2CH-X-(CH2)m-O-NH2
其中R为简单烷基(甲基、乙基、丙基等),X任选地为NH、O、S、C(O) 或不存在,m为2-10并且n为100-1,000。
水溶性聚合物与胰岛素多肽连接的程度和位点可调节胰岛素多肽与胰岛素多 肽受体的结合。在一些实施例中,安置各键,使得胰岛素多肽以通过平衡结合测定 (例如在Spencer等人,J.Biol.Chem.,263:7862-7867(1988)中胰岛素所述)所测量约 400nM或400nM以下的Kd、以150nM或150nM以下的Kd并且在一些情况下以100 nM或100nM以下的Kd与胰岛素多肽受体结合。
用于聚合物活化以及肽结合的方法和化学描述于文献中并且在所属技术领域 中为已知的。聚合物活化的常用方法包括(但不限于)用溴化氰、高碘酸盐、戊 二醛、双环氧化物(biepoxide)、表氯醇(epichlorohydrin)、二乙烯基砜、碳化二 亚胺、磺酰卤、三氯三嗪等活化官能团。(参见R.F.Taylor,(1991),PROTEIN IMMOBILISATION.FUNDAMENTALANDAPPLICATIONS,MarcelDekker,N.Y.; S.S.Wong,(1992),CHEMISTRYOFPROTEINCONJUGATIONAND CROSSLINKING,CRCPress,BocaRaton;G.T.Hermanson等人,(1993), IMMOBILIZEDAFFINITYLIGANDTECHNIQUES,N.Y.;Dunn,R.L.等人编, POLYMERICDRUGSANDDRUGDELIVERYSYSTEMS,ACSSymposiumSeries, 第469卷,AmericanChemicalSociety,Washington,D.C.1991)。
可获得关于PEG的官能化和结合的若干评论和专论。例如参见Harris, Macromol.Chem.Phys.C25:325-373(1985);Scouten,MethodsinEnzymology135: 30-65(1987);Wong等人,EnzymeMicrob.Technol14:866-874(1992);Delgado等 人,CriticalReviewsinTherapeuticDrugCarrierSystems9:249-304(1992);Zalipsky, BioconjugateChem.6:150-165(1995)。
活化聚合物的方法也可见于WO94/17039、美国专利第5,324,844号、WO 94/18247、WO94/04193、美国专利第5,219,564号、美国专利第5,122,614号、 WO90/13540、美国专利第5,281,698号和WO93/15189中,且使活化聚合物与酶 结合的方法可见于以下对应不同酶的参考文献中,所述酶包括(但不限于)凝血 因子VIII(WO94/15625)、血红蛋白(WO94/09027)、载氧分子(美国专利第 4,412,989号)、核糖核酸酶和超氧化物歧化酶(Veronese等人,App.Biochem. Biotech.11:141-52(1985))。所引用的所有参考文献和专利都是以引用的方式并入 本文中。
通过任何便利方法来使得含有非天然编码氨基酸(例如对叠氮基-L-苯丙氨酸)的胰岛素多肽聚乙二醇化(即添加任何水溶性聚合物)。举例来说,用经炔封端的mPEG衍生物使胰岛素多肽聚乙二醇化。简单地说,在室温下在搅拌下向含对叠氮基-L-Phe的胰岛素多肽的水溶液中添加过量固体。通常,用pKa接近进行反应的pH值(通常pH值约为4-10)的缓冲液缓冲水溶液。例如,适于在pH7.5下聚乙二醇化的缓冲液的实例包括(但不限于)HEPES、磷酸盐、硼酸盐、TRIS-HCl、EPPS和TES。必要时,连续监控并调节pH值。通常使反应持续进行约1-48小时。
随后,使反应产物经受疏水性相互作用色谱,以使聚乙二醇化胰岛素多肽变 异体与游离mPEG(5000)-O-CH2-C≡CH以及当在分子的两端使未阻断PEG活化 从而使胰岛素多肽变异体分子交联时可形成的聚乙二醇化胰岛素多肽的任何高分 子量复合物分离开来。疏水性相互作用色谱期间的条件应使得游离 mPEG(5000)-O-CH2-C≡CH流过柱,而任何交联的聚乙二醇化胰岛素多肽变异体 复合物则在实现所需形式后洗提出来,所需形式含有一个与一个或一个以上PEG 基团结合的胰岛素多肽变异体分子。合适的条件视交联复合物相对于所需结合物 的相对大小而改变,并且易于由所属领域的技术人员确定。通过超滤来浓缩含有 所需结合物的洗出液且通过透滤使其脱盐。
必要时,可由所属领域的技术人员已知的一种或一种以上程序进一步纯化获 自疏水性色谱的聚乙二醇化胰岛素多肽,所述程序包括(但不限于)亲和色谱; 阴离子或阳离子交换色谱(使用(包括(但不限于))DEAE琼脂糖凝胶);硅胶 色谱;反相HPLC;凝胶过滤(使用(包括(但不限于))SEPHADEXG-75);疏 水性相互作用色谱;尺寸排阻色谱;金属螯合物色谱;超滤/透滤;乙醇沉淀;硫 酸铵沉淀;色谱聚焦;置换色谱;电泳程序(包括(但不限于)制备型等电聚焦); 差异溶解度(包括(但不限于)硫酸铵沉淀);或萃取。可通过与球状蛋白质标准 物(Preneta,AZ,PROTEINPURIFICATIONMETHODS,APRACTICAL APPROACH(Harris和Angal编)IRLPress1989,293-306)进行比较由GPC来估 算表观分子量。可通过蛋白水解降解(包括(但不限于)胰蛋白酶裂解),接着质 谱分析来评估胰岛素-PEG结合物的纯度。PepinskyRB.等人,J,Pharmcol.&Exp. Ther.297(3):1059-66(2001)。
与本发明的胰岛素多肽的氨基酸连接的水溶性聚合物可进一步不受限制地衍 生或经取代。
含叠氮基的PEG衍生物
在本发明的另一实施例中,用含有叠氮部分的PEG衍生物修饰胰岛素多肽, 所述叠氮部分将与非天然编码氨基酸侧链上存在的炔部分反应。一般来说,PEG 衍生物将具有在1-100kDa范围内并且在一些实施例中在10-40kDa范围内的平均 分子量。
在一些实施例中,叠氮基末端PEG衍生物将具有以下结构:
RO-(CH2CH2O)n-O-(CH2)m-N3
其中R为简单烷基(甲基、乙基、丙基等),m为2-10并且n为100-1,000 (即平均分子量介于5-40kDa之间)。
在另一实施例中,叠氮基末端PEG衍生物将具有以下结构:
RO-(CH2CH2O)n-O-(CH2)m-NH-C(O)-(CH2)p-N3
其中R为简单烷基(甲基、乙基、丙基等),m为2-10,p为2-10并且n为 100-1,000(即平均分子量介于5-40kDa之间)。
在本发明的另一实施例中,用含有末端叠氮部分的分支PEG衍生物修饰包含 含炔的氨基酸的胰岛素多肽,其中分支PEG的各链具有在10-40kDa范围内并且 可为5-20kDa的MW。举例来说,在一些实施例中,叠氮基末端PEG衍生物将 具有以下结构:
[RO-(CH2CH2O)n-O-(CH2)2-NH-C(O)]2CH(CH2)m-X-(CH2)pN3
其中R为简单烷基(甲基、乙基、丙基等),m为2-10,p为2-10,并且n 为100-1,000,并且X任选地为O、N、S或羰基(C=O),在各情况下,X都可存 在或不存在。
含炔的PEG衍生物
在本发明的另一实施例中,用含有炔部分的PEG衍生物修饰胰岛素多肽,所 述炔部分将与非天然编码氨基酸侧链上存在的叠氮部分反应。
在一些实施例中,炔末端PEG衍生物将具有以下结构:
其中R为简单烷基(甲基、乙基、丙基等),m为2-10并且n为100-1,000 (即平均分子量介于5-40kDa之间)。
在本发明的另一实施例中,用含有借助于酰胺键与PEG主链连接的末端叠氮 部分或末端炔部分的PEG衍生物修饰包含含炔的非天然编码氨基酸的胰岛素多 肽。
在一些实施例中,炔末端PEG衍生物将具有以下结构:
其中R为简单烷基(甲基、乙基、丙基等),m为2-10,p为2-10并且n为 100-1,000。
在本发明的另一实施例中,用含有末端炔部分的分支PEG衍生物修饰包含含 叠氮基的氨基酸的胰岛素多肽,其中分支PEG的各链具有在10-40kDa范围内并且 可为5-20kDa的MW。举例来说,在一些实施例中,炔末端PEG衍生物将具有以下 结构:
其中R为简单烷基(甲基、乙基、丙基等),m为2-10,p为2-10,并且n 为100-1,000,并且X任选地为O、N、S或羰基(C=O)或不存在。
含膦的PEG衍生物
在本发明的另一实施例中,用含有活化官能团(包括(但不限于)酯、碳酸 酯)的PEG衍生物修饰胰岛素多肽,所述官能团进一步包含将与非天然编码氨基 酸侧链上存在的叠氮部分反应的芳基膦基团。一般来说,PEG衍生物将具有在 1-100kDa范围内并且在一些实施例中在10-40kDa范围内的平均分子量。
在一些实施例中,PEG衍生物将具有以下结构:
其中n为1-10;X可为O、N、S或不存在,Ph为苯基,并且W为水溶性聚 合物。
在一些实施例中,PEG衍生物将具有以下结构:
其中X可为O、N、S或不存在,Ph为苯基,W为水溶性聚合物并且R可为 H、烷基、芳基、经取代烷基和经取代芳基。示范性R基团包括(但不限于)-CH2、 -C(CH3)3、-OR′、-NR′R″、-SR′、-卤素、-C(O)R′、-CONR′R″、-S(O)2R′、-S(O)2NR′R″、 -CN和-NO2。R′、R″、R″′和R″″各独立地指代氢、经取代或未经取代杂烷基、经 取代或未经取代芳基(包括(但不限于)经1-3个卤素取代的芳基)、经取代或未 经取代烷基、烷氧基或硫烷氧基或芳基烷基。例如,当本发明的化合物包括一个 以上R基团时,R基团是各独立地经选择,而当存在R′、R″、R″′和R″″基团中的 一者以上时,这些基团同样是各独立地经选择。当R′和R″与同一氮原子连接时, 其可与氮原子组合形成5元、6元或7元环。举例来说,-NR′R″打算包括(但不 限于)1-吡咯烷基和4-吗啉基。根据对取代基的上述论述,所属领域的技术人员 应了解术语“烷基”打算包括包含与除氢基之外的基团结合的碳原子的基团,例 如卤烷基(包括(但不限于)-CF3和-CH2CF3)和酰基(包括(但不限于)-C(O)CH3、 -C(O)CF3、-C(O)CH2OCH3等)。
其它PEG衍生物和一般聚乙二醇化技术
例如,可与胰岛素多肽连接的其它示范性PEG分子以及聚乙二醇化方法包括 以下文献中所述的分子和方法:美国专利公开案第2004/0001838号;第 2002/0052009号;第2003/0162949号;第2004/0013637号;第2003/0228274号; 第2003/0220447号;第2003/0158333号;第2003/0143596号;第2003/0114647 号;第2003/0105275号;第2003/0105224号;第2003/0023023号;第2002/0156047 号;第2002/0099133号;第2002/0086939号;第2002/0082345号;第2002/0072573 号;第2002/0052430号;第2002/0040076号;第2002/0037949号;第2002/0002250 号;第2001/0056171号;第2001/0044526号;第2001/0021763号;美国专利第 6,646,110号;第5,824,778号;第5,476,653号;第5,219,564号;第5,629,384号; 第5,736,625号;第4,902,502号;第5,281,698号;第5,122,614号;第5,473,034 号;第5,516,673号;第5,382,657号;第6,552,167号;第6,610,281号;第6,515,100 号;第6,461,603号;第6,436,386号;第6,214,966号;第5,990,237号;第5,900,461 号;第5,739,208号;第5,672,662号;第5,446,090号;第5,808,096号;第5,612,460 号;第5,324,844号;第5,252,714号;第6,420,339号;第6,201,072号;第6,451,346 号;第6,306,821号;第5,559,213号;第5,747,646号;第5,834,594号;第5,849,860 号;第5,980,948号;第6,004,573号;第6,129,912;WO97/32607、EP229,108、 EP402,378、WO92/16555、WO94/04193、WO94/14758、WO94/17039、WO 94/18247、WO94/28024、WO95/00162、WO95/11924、WO95/13090、WO 95/33490、WO96/00080、WO97/18832、WO98/41562、WO98/48837、WO 99/32134、WO99/32139、WO99/32140、WO96/40791、WO98/32466、WO 95/06058、EP439508、WO97/03106、WO96/21469、WO95/13312、EP921131、 WO98/05363、EP809996、WO96/41813、WO96/07670、EP605963、EP510356、 EP400472、EP183503和EP154316,其是以引用的方式并入本文中。本文中所 述的任一种PEG分子都可以包括(但不限于)单链、分支链、多臂链、单官能、 双官能、多官能形式或其任何组合的任何形式使用。
其它聚合物和PEG衍生物(包括(但不限于)羟胺(氨氧基)PEG衍生物) 描述于以下专利申请案中,所述专利申请案都是以全文引用的方式并入本文中: 美国专利公开案第2006/0194256号;美国专利公开案第2006/0217532号;美国专 利公开案第2006/0217289号;美国临时专利第60/755,338号;美国临时专利第 60/755,711号;美国临时专利第60/755,018号;国际专利申请案第PCT/US06/49397 号;WO2006/069246;美国临时专利第60/743,041号;美国临时专利第60/743,040 号;国际专利申请案第PCT/US06/47822号;美国临时专利第60/882,819号;美 国临时专利第60/882,500号;以及美国临时专利第60/870,594号。
异源Fc融合蛋白
上述胰岛素化合物可直接或通过肽连接子与免疫球蛋白的Fc部分融合。免疫 球蛋白是含有通过二硫键结合在一起的多肽链的分子,通常具有两个轻链和两个 重链。在各链中,一个域(V)具有取决于分子的抗体特异性的可变氨基酸序列。 其它域(C)具有为相同类别的分子所共有的相当恒定的序列。
如本文中所用,免疫球蛋白的Fc部分具有免疫学领域中通常赋予这一术语的 含义。具体来说,这一术语是指通过从抗体中去除两个抗原结合区(Fab片段) 获得的抗体片段。一种去除Fab片段的方法是用木瓜蛋白酶消化免疫球蛋白。因 此,Fc部分是由来自两个重链的大小近似相等的恒定区片段形成,所述片段通过 非共价相互作用和二硫键缔合。Fc部分可包括铰链区且延伸穿过抗体的CH2和 CH3域到达C端。人类和小鼠免疫球蛋白的代表性铰链区可见于Antibody Engineering,APracticalGuide,Borrebaeck,C.A.K.编,W.H.FreemanandCo.,1992 中,其教示以引用的方式并入本文中。Fc部分可进一步包括一个或一个以上糖基 化位点。所属领域中熟知多种含有铰链区、CH2和CH3域以及一个N-糖基化位 点的代表性Fc蛋白的氨基酸序列。
存在五种类型的具有不同效应功能和药物动力学性质的人类免疫球蛋白Fc 区:IgG、IgA、IgM、IgD以及IgE。IgG是血清中最丰富的免疫球蛋白。IgG还 具有任何免疫球蛋白中最长的血清半衰期(23天)。不同于其它免疫球蛋白,IgG 在与Fc受体结合后可有效地再循环。存在四个IgG亚类G1、G2、G3以及G4, 其各自具有不同的效应功能。G1、G2以及G3能结合C1q和固定补体,而G4则 不能。虽然G3能够比G1有效地结合C1q,但G1在介导补体导向的细胞溶解中 更有效。G2以极低效率固定补体。IgG中的C1q结合位点位于CH2域的羧基端 区。
所有IgG亚类都能够结合Fc受体(CD16、CD32、CD64),其中G1和G3 比G2和G4有效。IgG的Fc受体结合区是由位于CH2域的铰链区和羧基端区中 的残基形成。
IgA可以单体形式和通过J-链结合在一起的二聚物形式存在。IgA是血清中第 二丰富的Ig,但其半衰期仅为6天。IgA具有三种效应功能。其结合巨噬细胞和 嗜酸性粒细胞上的IgA特异性受体,所述受体分别驱动吞噬作用和脱粒作用。其 也可经由未知的替代途径固定补体。
IgM表达为通过J-链结合在一起的五聚物或六聚物。IgM具有5天的血清半 衰期。其经由位于CH3域中的结合位点微弱地结合C1q。IgD具有3天的血清半 衰期。尚不清楚哪些效应功能是归因于这种Ig。IgE是单体Ig且具有2.5天的血 清半衰期。IgE结合驱动脱粒作用且引起促发炎剂释放的两种Fc受体。
取决于期望的活体内效应,本发明的异源融合蛋白可含有任一上述同种型, 或可含有补体和/或Fc受体结合功能已改变的突变Fc区。因此,本发明的异源融 合蛋白可含有与胰岛素化合物融合的免疫球蛋白的整个Fc部分、免疫球蛋白的 Fc部分的片段或其类似物。
本发明的融合蛋白可由单链蛋白质组成或呈多链多肽形式。可产生两种或两 种以上Fc融合蛋白,以致其通过天然形成于Fc区之间的二硫键相互作用。这些 多聚物就胰岛素化合物来说可为同源的,或其可含有不同的在融合蛋白的Fc部分 的N端处融合的胰岛素化合物。
不管融合蛋白的最终结构如何,Fc或Fc样区可用于延长在N端处融合的胰 岛素化合物的活体内血浆半衰期。同时,融合蛋白化合物的胰岛素组成部分应保 持胰岛素的至少一种生物活性。可使用本文描述或所属领域中已知的比较融合蛋 白的半衰期与单独胰岛素化合物的半衰期的方法证明治疗或循环半衰期增加。生 物活性可用所属领域已知的活体外和活体内方法确定。
因为由蛋白水解所产生的IgG的Fc区具有与完整IgG分子相同的活体内半 衰期且Fab片段快速降解,所以认为用于延长半衰期的相关序列驻留在CH2和/ 或CH3域中。另外,文献中已显示不结合高亲和力Fc受体或C1q的IgG变异体 的分解代谢率与亲本野生型抗体的清除率很难区分,表明分解代谢位点不同于参 与Fc受体或C1q结合的位点。[Wawrzynczak等人,(1992)MolecularImmunology 29:221]。使用鼠类IgG1Fc区的定点诱变研究提示,控制分解代谢率的IgG1Fc 区的位点位于CH2-CH3域的界面处。Fc区可在分解代谢位点处经修饰以优化融 合蛋白的半衰期。用于本发明的融合蛋白的Fc区可源自IgG1或IgG4Fc区,且 可含有CH2和CH3区(包括铰链区)。
异源白蛋白融合蛋白
本文所述的胰岛素可直接或通过肽连接子、水溶性聚合物或前药连接子与白 蛋白或其类似物、片段或衍生物融合。作为本发明融合蛋白的一部分的白蛋白一 般可源自从包括人类的任何物种克隆的白蛋白。人类血清白蛋白(HSA)由具有 585个氨基酸的单个非糖基化多肽链组成,化学式分子量为66,500。已知人类HSA 的氨基酸序列[参见Meloun等人(1975)FEBSLetters58:136;Behrens等人,(1975) Fed.Proc.34:591;Lawn等人(1981)NucleicAcidsResearch9:6102-6114;Minghetti 等人(1986)J.Biol.Chem.261:6747,其各自以引用的方式并入本文中]。已描述 白蛋白的多种多形变异体以及类似物和片段。[参见Weitkamp等人,(1973)Ann. Hum.Genet.37:219]。举例来说,在EP322,094中,各种较短形式的HSA。已揭 示这些HSA片段中的一些,包括HSA(1-373)、HSA(1-388)、HSA(1-389)、HSA(1-369) 和HSA(1-419)以及1-369与1-419之间的片段。EP399,666揭示白蛋白片段,包 括HSA(1-177)和HSA(1-200)以及HSA(1-177)与HSA(1-200)之间的片段。
应了解,本发明的异源融合蛋白(包括片段、类似物和衍生物)包括与任何 白蛋白偶合的胰岛素化合物,其中所述融合蛋白具有生物活性且血浆半衰期比单 独胰岛素化合物长。因此,融合蛋白的白蛋白部分不必具有与天然人类白蛋白相 等的血浆半衰期。片段、类似物和衍生物是已知的或可产生而具有较长半衰期或 具有介于天然人类白蛋白与相关胰岛素化合物之间的半衰期。
本发明的异源融合蛋白涵盖在融合蛋白的胰岛素化合物和/或Fc或白蛋白部 分中具有保守性氨基酸取代的蛋白质。“保守性取代”是用另一带相同净电荷且具 有大致相同的大小和形状的氨基酸置换氨基酸。当具有脂肪族或经取代脂肪族氨 基酸侧链的氨基酸的侧链中的碳和杂原子总数相差不超过约4时,具有大致相同 的大小。当侧链中的分支数相差不超过1时,具有大致相同的形状。侧链中具有 苯基或经取代苯基的氨基酸视为具有大致相同的大小和形状。除非本文另外特别 提供,否则保守性取代优选用天然存在氨基酸进行。
野生型白蛋白和免疫球蛋白可从多种来源获得。举例来说,这些蛋白质可从 cDNA文库获得,该文库又可从以可检测水平表达相关mRNA的组织或细胞制备。 可用使用公开DNA或蛋白质序列针对相关特定蛋白质设计的探针筛选文库。举 例来说,以下文献中描述免疫球蛋白轻链或重链恒定区:Adams等人(1980) Biochemistry19:2711-2719;Goughet等人(1980)Biochemistry19:2702-2710;Dolby 等人(1980)Proc.Natl.Acad.Sci.USA77:6027-6031;Rice等人(1982)Proc.Natl. Acad.Sci.USA79:7862-7862;Falkner等人(1982)Nature298:286-288;和Morrison 等人(1984)Ann.Rev.Immunol.2:239-256。一些揭示白蛋白和DNA序列的参考 文献包括Meloun等人(1975)FEBSLetters58:136;Behrens等人(1975)Fed.Proc. 34:591;Lawn等人(1981)NucleicAcidsResearch9:6102-6114;和Minghetti等人 (1986)J.Biol.Chem.261:6747。
表征本发明的异源融合蛋白
存在许多表征本发明融合蛋白的方法。一些这类方法包括(但不限于)与蛋 白质染色法结合的SDS-PAGE或使用抗IgG或抗HSA抗体的免疫印迹法。其它 方法例如包括基质辅助激光解吸附/离子化质谱(MALDI-MS)、液相色谱/质谱、 等电聚焦、分析型阴离子交换、色谱聚焦和圆二色谱。
增强对血清白蛋白的亲和性
也可使各种分子与本发明的胰岛素多肽融合以调节胰岛素多肽在血清中的半 衰期。在一些实施例中,使分子与本发明的胰岛素多肽连接或融合以增强对动物 中的内源血清白蛋白的亲和性。
举例来说,在一些情况下,制备胰岛素多肽与白蛋白结合序列的重组融合体。 示范性白蛋白结合序列包括(但不限于)来自链球菌(streptococcal)蛋白G的白 蛋白结合域(例如参见Makrides等人,J.Pharmacol.Exp.Ther.277:534-542(1996); 和sjolander等人,J,Immunol.Methods201:115-123(1997)),或白蛋白结合肽,例 如在例如Dennis等人,J.Biol.Chem.277:35035-35043(2002)中所述的白蛋白结合 肽。
在其它实施例中,用脂肪酸使本发明的胰岛素多肽酰化。在一些情况下,脂 肪酸促进与血清白蛋白的结合。例如参见Kurtzhals等人,Biochem.J.312:725-731 (1995)。
在其它实施例中,本发明的胰岛素多肽是直接与血清白蛋白(包括(但不限 于)人类血清白蛋白)融合。所属领域的技术人员应认识到,也可使多种其它分 子与本发明的胰岛素连接以调节与血清白蛋白或其它血清组分的结合。
胰岛素多肽的糖基化
本发明包括并有一种或一种以上带有糖残基的非天然编码氨基酸的胰岛素多 肽。糖残基可为天然残基(包括(但不限于)N-乙酰基葡糖胺)或非天然残基(包 括(但不限于)3-氟半乳糖)。糖可通过N或O-连接的糖苷键(包括(但不限于) N-乙酰基半乳糖-L-丝氨酸)或非天然键(包括(但不限于)肟或相应的C或S- 连接的糖苷)与非天然编码氨基酸连接。
可在活体内或活体外将糖(包括(但不限于)糖基)部分添加到胰岛素多肽 中。在本发明的一些实施例中,用由氨氧基衍生的糖修饰包含含羰基的非天然编 码氨基酸的胰岛素多肽,以产生通过肟键连接的相应糖基化多肽。在糖与非天然 编码氨基酸连接后,可通过用糖基转移酶和其它酶处理来进一步精细修饰糖以产 生结合于胰岛素多肽的寡糖。例如参见H.Liu等人,J.Am.Chem.Soc.125: 1702-1703(2003)。
在本发明的一些实施例中,直接用以氨氧基衍生物形式制备的具有规定结构 的聚糖修饰包含含羰基的非天然编码氨基酸的胰岛素多肽。所属领域的技术人员 应认识到,可使用其它官能团(包括叠氮化物、炔、酰肼、肼和氨基脲)使糖与 非天然编码氨基酸连接。
在本发明的一些实施例中,随后可通过(包括(但不限于))休斯根[3+2]环 加成反应分别用(包括(但不限于))炔基或叠氮基衍生物修饰包含含叠氮基或炔 基的非天然编码氨基酸的胰岛素多肽。这种方法允许以极高选择性修饰蛋白质。
胰岛素二聚物和多聚物
本发明还提供胰岛素和胰岛素类似物组合,例如同源二聚物、异源二聚物、 同源多聚物或异源多聚物(即三聚物、四聚物等),其中含有一个或一个以上非天 然编码氨基酸的胰岛素直接与多肽主链结合,或通过连接子与另一胰岛素或其胰 岛素变异体或非胰岛素或其胰岛素变异体的任何其它多肽结合。由于与单体相比 分子量增加,所以胰岛素二聚物或多聚物结合物可展现新颖或所需性质,包括(但 不限于)相对于单体胰岛素展现不同的药理学、药物动力学、药效学性质、经调 节的治疗半衰期或经调节的血浆半衰期。单体胰岛素类似物的实例例如参见1992 年11月17日颁布的Balschmidt,P.等人,美国专利第5,164,366号;1997年4月8 日颁布的Brange,J.等人,美国专利第5,618,913号;1996年5月7日颁布的Chance, R.E.等人,美国专利第5,514,646号;和Ertl,J.等人,欧洲专利局公开案第885,961 号,1998年12月23日。本发明的一些实施例提供含有一个或一个以上非天然编 码氨基酸残基的单体胰岛素类似物,并且在一些实施例中,这些胰岛素类似物包 括位置B28为Asp、Lys、Ile、Leu、Val或Ala且位置B29的氨基酸残基为Lys 或Pro的单体胰岛素类似物;具有Lys(B28)Pro(B29)的单体胰岛素类似物- 人类胰岛素;单体胰岛素类似物Asp(B28)-人类胰岛素;和单体胰岛素类似物 Lys(B3)Ile(B28)-人类胰岛素。在一些实施例中,本发明的胰岛素二聚物将 调节胰岛素受体的信号转导。在其它实施例中,本发明的胰岛素二聚物或多聚物 将充当胰岛素受体的拮抗剂、激动剂或调节剂。
在一些实施例中,在含有胰岛素的二聚物或多聚物中存在的一个或一个以上 胰岛素分子包含与水溶性聚合物连接的非天然编码氨基酸。
在一些实施例中,胰岛素多肽是(包括(但不限于))通过Asn-Lys酰胺键或 Cys-Cys二硫键直接连接。在一些实施例中,胰岛素多肽和/或连接的非胰岛素分 子将包含不同的非天然编码氨基酸以促进二聚化,其包括(但不限于)第一胰岛 素多肽的一个非天然编码氨基酸中的炔与第二分子的第二非天然编码氨基酸中的 叠氮化物将通过休斯根[3+2]环加成结合。或者,包含含酮的非天然编码氨基酸的 胰岛素和/或连接的非胰岛素分子可与包含含羟胺的非天然编码氨基酸的第二多 肽结合,并且所述多肽是通过形成相应肟进行反应。
或者,两种胰岛素多肽和/或连接的非胰岛素分子是通过连接子连接。可使用 任何异型双官能连接子或同型双官能连接子来连接两种分子和/或连接的非胰岛 素分子,其可具有相同或不同的一级序列。在一些情况下,用于将胰岛素和/或连 接的非胰岛素分子连接在一起的连接子可为双官能PEG试剂。连接子可具有各种 分子量或分子长度。可使用较大或较小分子量的连接子在胰岛素与连接实体之间 或在胰岛素与其受体之间或在连接实体与其结合搭配物(如果存在的话)之间提 供所需空间关系或构象。也可使用具有较长或较短分子长度的连接子在胰岛素与 连接实体之间或在连接实体与其结合搭配物(如果存在的话)之间提供所需空间 或柔性。
在一些实施例中,本发明提供具有哑铃结构的水溶性双官能连接子,所述结 构包括:a)在聚合物主链的至少一个第一末端上的叠氮基、炔、肼、酰肼、羟胺 或含羰基的部分;以及b)至少一个在聚合物主链的第二末端上的第二官能团。 第二官能团可与第一官能团相同或不同。在一些实施例中,第二官能团不与第一 官能团反应。在一些实施例中,本发明提供包含分支分子结构的至少一个臂的水 溶性化合物。举例来说,分支分子结构可为树枝状。
在一些实施例中,本发明提供通过与水溶性活化聚合物反应而形成的包含一 个或一个以上胰岛素多肽的多聚物,所述水溶性活化聚合物具有以下结构:
R-(CH2CH2O)n-O-(CH2)m-X
其中n为约5到3,000,m为2-10,X可为叠氮基、炔、肼、酰肼、氨氧基、 羟胺、乙酰基或含羰基的部分,并且R为可与X相同或不同的封端基团、官能团 或离去基。R可为例如选自由以下组成的群组的官能团:羟基、经保护羟基、烷 氧基、N-羟基丁二酰亚胺酯、1-苯并三唑酯、碳酸N-羟基丁二酰亚胺酯、碳酸1- 苯并三唑酯、乙缩醛、醛、水合醛、烯基、丙烯酸酯、甲基丙烯酸酯、丙烯酰胺、 活性砜、胺、氨氧基、经保护胺、酰肼、经保护酰肼、经保护硫醇、羧酸、经保 护羧酸、异氰酸酯、异硫氰酸酯、顺丁烯二酰亚胺、乙烯基砜、二硫代吡啶、乙 烯基吡啶、碘乙酰胺、环氧化物、乙二醛、二酮、甲磺酸酯、甲苯磺酸酯和三氟 乙磺酸酯、烯烃以及酮。
测量胰岛素多肽活性和胰岛素多肽对胰岛素受体的亲和性
可使用标准或已知活体外或活体内测定确定胰岛素多肽活性。可用所属领域 中已知的合适方法分析胰岛素多肽的生物活性。如Meager,J.Immunol.Meth., 261:21-36(2002)中所述,所述测定包括(但不限于)干扰素应答基因的激活、受 体结合测定、抗病毒活性测定、细胞病变效应抑制测定(Familletti等人,Meth. Enzymol.78:387-394)、抗增殖测定(Aebersold和Sample,Meth.Enzymol. 119:579-582)、免疫调节测定(美国专利第4,914,033号、第4,753,795号)和监 测MHC分子诱发的测定(例如Hokland等人,Meth.Enzymol.119:688-693)。
3T3-1脂肪细胞中的葡萄糖摄取可使用以下方法评估。从美国典型菌种保藏 中心(ATCC,Rockville,Md.)获得3T3-L1细胞。将细胞培养在含有含10%富铁 胎牛血清的杜尔贝科氏改良伊格尔培养基(Dulbecco′smodifiedEagle′smedium) 的生长培养基(growthmedium,GM)中。对于标准脂肪细胞分化来说,在细胞 汇合(称为第0天)后2天,使细胞暴露在含有10%胎牛血清、10μg/ml胰岛 素、1μM地塞米松(dexamethasone)和0.5μM异丁基甲基黄嘌呤的分化培养 基(differentiationmedium,DM)中历时48小时。随后将细胞维持在含有10%胎 牛血清和10μg/ml胰岛素的分化后培养基中。活体外效能可使用所属领域的技 术人员已知的葡萄糖摄取测定来测量。活体外效能可定义为在基于细胞的测定中 胰岛素化合物的葡萄糖摄取的量度并且是胰岛素化合物的生物效能的量度。其可 表示为EC50,即化合物在单剂量反应实验中产生50%活性的有效浓度。
葡萄糖转运测定--胰岛素依赖性--如通过0.1mM2-脱氧-D-[14C]葡萄糖的累 积所测定,如下测量己醣摄取:用升温到37℃并且含有0.2%BSA的KRP缓冲液 (136mMNaCl、4.7mMKCl、10mMNaPO4、0.9mMCaCl2、0.9mMMgSO4(pH 7.4))洗涤12孔板中的3T3-L1脂肪细胞两次,在37℃下在室内空气中在含有0.2% BSA的莱氏L-15培养基(Leibovitz′sL-15medium)中培育2小时,再次用含有 0.2%BSA缓冲液的KRP洗涤两次,并且在37℃下在室内空气中在含有0.2%BSA 缓冲液和不存在渥曼青霉素(wortmannin)(仅存在Me2SO)或存在渥曼青霉素 的KRP中培育30分钟。随后添加胰岛素直到100nM的最终浓度历时15分钟, 并且测量2-脱氧-D-[14C]葡萄糖的摄取历时最后4分钟。所有值减去在10μM 细胞分裂抑素B(cytochalasinB)存在下测出的非特异性摄取。使用Pierce二喹 啉甲酸(bicinchoninicacid)测定来确定蛋白质浓度。通常以每一实验一式三份或 一式四份来测量摄取。可研究在胰岛素存在下用FGF-21短期和长期预处理3T3-L1 脂肪细胞的作用。
葡萄糖转运测定--胰岛素非依赖性--将3T3-L1纤维母细胞涂在96孔板中并且 分化成脂肪细胞历时2周。分化后,使其在无血清培养基中饥饿并且用本发明的 各种胰岛素多肽处理24小时。处理后,用含有0.1%BSA的KRBH缓冲液洗涤细 胞两次。在含经标记葡萄糖的KPBH缓冲液存在下摄取葡萄糖。这允许定性评估 通过本发明制造的多种胰岛素多肽和类似物,和那些经聚乙二醇化的胰岛素多肽 和类似物(因为已知聚乙二醇化使得天然分子的效率降低),并且比较不同胰岛素 的功效。另外,本发明的胰岛素多肽显示在离体组织模型中诱导葡萄糖摄取。
在离体葡萄糖转运模型中,葡萄糖转运测定描述如下:克-汉二氏缓冲液储备 溶液(Krebs-HenseleitBufferStockSolution)--贮存物1:NaCl(1.16M);KCl(0.046 M);KH2PO4(0.0116M);NaHCO3(0.0253M)。贮存物2:CaCl2(0.025M); MgSO4(2H2O)(0.0116M)。BSA:利用ICN科恩分部分离法V(CohnFraction V),不经透析直接使用的无脂肪酸BSA。培养基制备:将50ml克氏(Krebs)贮 存物1添加到395mldH2O和含有95%O2/5%CO2的气体中历时1小时。添加 50ml贮存物2并且用dH2O使其达到500ml。添加500mgICN无脂肪酸BSA。 预培育和培育培养基:32mM甘露糖醇、8mM葡萄糖。洗涤培养基:40mM甘 露糖醇、2mM丙酮酸酯。转运培养基:39mM甘露糖醇、1mM2-DG;32mM 甘露糖醇、8mM3-O-MG。胰岛素溶液:(猪胰岛素[Lilly]100,000,000μU/ml), 最终浓度为2000μU/ml或13.3nM。放射性标记培养基制备:所用的比活性: 2DG=1.5mCi/ml;3-O-MG=437μCi/ml;或甘露糖醇=8μCi/m。每100g体 重用0.1cc戊巴比妥钠(Nembutal)使大鼠麻醉。切除肌肉组织且用0.9%生理食 盐水冲洗,随后在29℃下放入预培育培养基(2ml)中1小时。将肌肉组织转移 到培育培养基(2ml;与预培育相同,除了包括胰岛素或测试化合物)中且培育 30分钟(视实验条件而定)。随后在29℃下将肌肉组织转移到洗涤培养基(2ml) 中10分钟,随后转移到标记培养基(1.5ml)中10分钟(3-O-MG)或20分钟(2DG)。 整理肌肉组织,称重并放入干冰上的聚丙烯管中。将1ml1NKOH添加到所述管 中,随后放入70℃水浴中10-15分钟,每隔数分钟使管涡流。在冰上冷却管且添 加1ml1NHCl,随后充分混合。随后将200μl上清液放入两份闪烁瓶中且在闪 烁计数器上计数,将其与已知放射性标准品相比较。
关于收缩,首先将肌肉在预培育/培育培养基中培育1小时。1小时后,将每 一对肌肉(每只大鼠一对)中的一个肌肉钉在刺激装置上且将另一个肌肉转移到 新培育培养基烧瓶中。通过70Hz的200毫秒(msec)脉冲串来刺激收缩的肌肉, 其中串中的每一脉冲是0.1毫秒。所述脉冲串在10-15V下以1/sec传递2×10分 钟,其间停止1分钟。在刺激期结束时,从刺激装置上移除肌肉且放入洗涤培养 基中10分钟,随后放入如上文所概述的标记培养基中。
无论用于产生本发明胰岛素类似物的方法如何,都使类似物进行生物活性测 定。可进行氚化胸腺嘧啶测定来确定细胞分裂的程度。然而,可使用其它生物测 定来确定期望活性。可分析胰岛素多肽的抗病毒活性和/或抗增殖活性。所属领域 的技术人员已知抗增殖测定。Basu等人BioconjugateChem(2006)17:618-630描 述使用A549细胞和MTT测量增殖的抗增殖测定。例如测定抑制病毒复制的能力 的生物测定还指示胰岛素活性。还可使用所属领域的技术人员已知的测定评估本 发明胰岛素多肽的生物活性和潜在的副作用。
本发明的胰岛素、胰岛素多肽和/或胰岛素类似物的平均量可变化且尤其应基 于取得资格的医师的推荐和处方。本发明的胰岛素、胰岛素多肽和/或胰岛素类似 物的确切量见仁见智受以下因素影响,例如所治疗的病状的确切类型和/或严重程 度、所治疗的患者的病状以及组合物中的其它成分。本发明还提供治疗有效量的 另一活性剂的投药。所给的量可容易地由所属领域的技术人员基于用胰岛素的疗 法、可使用的胰岛素疗法和/或其它胰岛素类似物确定。
可以常规方式制造本发明医药组合物。
实例
提供下列实例以说明本发明,但不限制本发明。
实例1
本实例描述选择将非天然编码氨基酸并入胰岛素中的位点的许多组可能标准 中的一种标准。
图1展示胰岛素(NP_000198-人类蛋白质登录号)的结构和序列,并且下表 包括具有全长人类胰岛素序列的SEQIDNO:13、具有全长人类胰岛素序列而无 前导序列的SEQIDNO:14,SEQIDNO:1-12含有胰岛素、赖脯胰岛素、门冬胰 岛素、赖谷胰岛素、地特胰岛素和甘精的A链和B链序列。通过用非天然编码氨 基酸取代天然编码氨基酸来产生胰岛素多肽。各多肽具有一个经对乙酰基苯丙氨 酸或经对氨基苯丙氨酸取代的氨基酸。所产生的多肽缺乏前导序列并且是A/B链 胰岛素多肽(SEQIDNO.1-14)。所产生的多肽各在以下位置处具有非天然编码 氨基酸取代:SEQIDNO:1的1、5、8、9、10、12、14、15、18、19和21以及 SEQIDNO:2的1、2、3、4、17、20、21、22、25、28和29。
图2展示使用PyMOL软件(DeLanoScientific;PaloAlto,CA)标记的人类胰 岛素的结构和本发明的胰岛素多肽中的一些对应于那些经对乙酰基苯丙氨酸取代 的氨基酸的氨基酸。图6展示胰岛素与已知胰岛素类似物之间的序列同源性。
选择并入非天然编码氨基酸的优选位点的另一组标准包括从蛋白质数据库或 其它数据库中使用和比较晶体结构,用于模拟胰岛素的结构并且识别以下残基:1) 不会干扰与FGF受体或肝素的结合和2)不存在于蛋白质的内部。在一些实施例 中,一个或一个以上非天然编码编码氨基酸并入胰岛素的一个或一个以上以下位 置处:SEQIDNO:1的1、5、8、9、10、12、14、15、18、19和21以及SEQID NO:2的1、2、3、4、17、20、21、22、25、28和29。在一些实施例中,一个或 一个以上非天然编码编码氨基酸并入(但不限于)胰岛素的一个或一个以上以下 位置处:SEQIDNO:1的1、5、8、9、10、12、14、15、18、19和21(或在SEQ IDNO:3、5、7、9、11中的相应氨基酸)。在一些实施例中,一个或一个以上非 天然编码编码氨基酸并入(但不限于)胰岛素的一个或一个以上以下位置处:SEQ IDNO:2的1、2、3、4、17、20、21、22、25、28和29(或在SEQIDNO:4、6、 8、10、12中的相应氨基酸)。在一些实施例中,一个或一个以上非天然编码编码 氨基酸并入(但不限于)胰岛素的一个或一个以上以下位置处:SEQIDNO:1的 1、5、8、9、10和12(或在SEQIDNO:3、5、7、9、11中的相应氨基酸)。在 一些实施例中,一个或一个以上非天然编码编码氨基酸并入(但不限于)胰岛素 的一个或一个以上以下位置处:SEQIDNO:2的1、2、3、4、17和20(或在SEQ IDNO:4、6、8、10、12中的相应氨基酸)。在一些实施例中,一个或一个以上非 天然编码编码氨基酸并入(但不限于)胰岛素的一个或一个以上以下位置处:SEQ IDNO:1的14、15、18、19和21(或在SEQIDNO:3、5、7、9、11中的相应 氨基酸)。在一些实施例中,一个或一个以上非天然编码编码氨基酸并入(但不限 于)胰岛素的一个或一个以上以下位置处:SEQIDNO:2的21、22、25、28和 29(或在SEQIDNO:4、6、8、10、12中的相应氨基酸)。
使用以下标准评估胰岛素和胰岛素类似物的各位置以引入非天然编码氨基 酸:残基(a)基于结构分析不应干扰胰岛素受体的结合,b)不应受丙氨酸或同 系物扫描诱变影响,(c)应表面暴露并与周围残基展现最小的范德华力(vander Waals)或氢键相互作用,(d)在胰岛素变异体中应可缺失或可变异,(e)经非天 然编码氨基酸取代后将产生保守性变化,以及(f)可见于高度柔性区域或结构刚 性区域中。另外,可使用Cx程序(Pintar等人(2002)Bioinformatics,18,第980 页)评估各蛋白质原子的突出程度,来进一步计算胰岛素分子。
在一些实施例中,一个或一个以上非天然编码氨基酸并入胰岛素中的一个或 一个以上以下位置处:位置1(即在N端)之前、1、2、3、4、5、6、7、8、9、 10、11、12、13、14、15、16、17、18、19、20、21、22(即在蛋白质的羧基端) (SEQIDNO:1或在SEQIDNO:3、5、7、9、11中的相应氨基酸)。在一些实施 例中,一个或一个以上非天然编码氨基酸并入胰岛素中的一个或一个以上以下位 置处:位置1(即在N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、 14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、 32(即在蛋白质的羧基端)(SEQIDNO:2或在SEQIDNO:4、6、8、10、12中 的相应氨基酸)。在一些实施例中,一个或一个以上非天然编码氨基酸并入胰岛素 中的一个或一个以上以下位置处:8、9、10、14(SEQIDNO:1或在SEQIDNO: 3、5、7、9、11中的相应氨基酸)。在一些实施例中,一个或一个以上非天然编 码氨基酸并入胰岛素中的一个或一个以上以下位置处:1、17、25、28(SEQIDNO: 2或在SEQIDNO:4、6、8、10、12中的相应氨基酸)。
实例2
本实例详述包括非天然编码氨基酸的胰岛素多肽在大肠杆菌中的克隆和表 达。
所属领域的技术人员已知克隆胰岛素的方法。胰岛素的多肽和多核苷酸序列 和胰岛素于宿主细胞中的克隆详述于以下文献中:美国专利第5,962,267号;美国 专利第4,751,180号、第7,105,314号、第6,630,348号、第6,777号和第7,091,032 号,标题为“ExpressionofahumaninsulinprecursorinP.pastoris”的Annibali专 利,以及美国专利公开案第20080268519号、第20080255045号、第20080227205 号、第20080207877号、第20080207877号、第20080213828号、第20080261311 号和第20080227195号;所有专利和公开申请案都以引用的方式并入本文中。
编码赖脯形式的胰岛素的cDNA如SEQIDNO:34、35、36和37所示。这一 成熟多肽如SEQIDNO:3和4所示。
使用包含正交tRNA(O-tRNA)和正交氨酰基tRNA合成酶(O-RS)的引入 翻译系统表达含有非天然编码氨基酸的胰岛素或胰岛素类似物。O-RS优先利用非 天然编码氨基酸使O-tRNA氨酰化。翻译系统又应答编码的选择密码子将非天然 编码氨基酸插入胰岛素或胰岛素类似物中。合适的O-RS和O-tRNA序列描述于 标题为“CompositionsofAminoacyl-tRNASynthetaseandUsesThereof”的WO 2006/068802中(E9;SEQIDNO:15)和标题为“CompositionsoftRNAandUses Thereof”的WO2007/021297中(F13;SEQIDNO:16),其以全文引用的方式并 入本文中。
用含有经修饰胰岛素或胰岛素类似物基因和正交氨酰基tRNA合成酶/tRNA 对(对所需非天然编码氨基酸具有特异性)的质粒转化大肠杆菌使得可将非天然 编码氨基酸位点特异性地并入胰岛素多肽中。
通过PCR,由使用标准方案的cDNA合成反应扩增野生型成熟胰岛素并且克 隆到pET30(NcoI-BamHI)中。在序列确定之前或者之后,在来源于大肠杆菌脂 蛋白启动子序列(Miller,J.H.,Gene,1986)的合成启动子的组成性控制下,将包 括N端HHHHHHSGG序列的胰岛素从詹氏甲烷球菌(MjtRNATyr/CUA)亚克隆 到含有琥珀抑制因子酪氨酰基tRNATyr/CUA的抑制载体中,以及在大肠杆菌 GlnRS启动子的控制下,亚克隆正交酪氨酰基tRNA合成酶(MjTyrRS)。在T7 启动子的控制下表达胰岛素。使用标准快速变化突变方案(Stratagene;LaJolla, California)引入琥珀突变。验证构筑体的序列。
长效胰岛素化合物的测试可使用STZ糖尿病大鼠模型(PCO08-400-209)来 进行。
用对乙酰基-苯丙氨酸(pAcF)抑制
将质粒(pVK6-赖辅胰岛素)转化于大肠杆菌的W3110B2菌株中,其中T7 聚合酶的表达在阿拉伯糖诱导性启动子的控制下。将过夜细菌培养物1∶100稀释 到含有2×YT培养基的摇瓶中并且在37℃下生长到OD600为约0.8。通过添加阿 拉伯糖(0.2%最终)和对乙酰基-苯丙氨酸(pAcF)到4mM的最终浓度来诱导蛋 白质表达。在37℃下培育培养物5小时。使细胞成球状且再悬浮于100μl/OD/ml B-PER溶解缓冲液(Pierce)+10μg/mlDNase中并在37℃下培育30分钟。通 过离心移除细胞物质并且移除上清液。将小球再悬浮于等量SDS-PAGE蛋白质加 载缓冲液中。将所有样品都加载到含有MES和DTT的4-12%PAGE凝胶上。所 属领域的技术人员已知纯化胰岛素的方法并且通过SDS-PAGE、西方印迹分析或 电喷雾-电离离子阱质谱法等来证实。
所用的质粒和序列如图5所示,且N端标记His的胰岛素的表达和7个琥珀 位点处的抑制如图6所示。胰岛素原多肽用箭头标记。图6展示B-PER小球样品 -泳道1的左侧:标记物;泳道1:VK6-胰岛素原-pAF-Q15;泳道2:VK6-胰岛素 原-pAF-Y14;泳道3:VK6-胰岛素原-pAF-R22;泳道4:VK6-胰岛素原-pAF-F1; 泳道5:VK6-胰岛素原-pAF-G1;泳道6:VK6-胰岛素原-pAF-S9、0.2%阿拉伯糖; 泳道7:VK6-胰岛素原-pAF-K28。关于泳道1、2、5和6中的氨基酸取代所示的 位置编号是基于赖脯胰岛素A链SEQIDNO:3,且关于泳道3、4和7中的氨基 酸取代所示的位置编号是基于赖脯胰岛素B链SEQIDNO:4。
标记His的突变胰岛素蛋白可使用所属领域的技术人员已知的方法纯化。可 通过由制造商提供的标准标记His的蛋白质纯化程序来使用ProBond镍螯合树脂 (Invitrogen,Carlsbad,CA)。蛋白质的功能性测量可通过所属领域中已知的方法、 本申请案和所并入的参考文献中提供的方法进行,或者,可开发针对活细胞的 ELISA来评估本发明的胰岛素多肽。
实例3
本实例详述含羰基的氨基酸的引入以及其与含氨氧基的PEG的后续反应。
本实例展示一种产生合并有含酮的非天然编码氨基酸的胰岛素多肽的方法, 所述多肽随后与约5,000MW的含氨氧基的PEG反应。在位置1(即在N端)之 前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、21、22(即在SEQIDNO:1的蛋白质的羧基端或在SEQIDNO:3、5、7、9、 11中的相应氨基酸)处的各残基和在位置1(即在N端)之前、1、2、3、4、5、 6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、 25、26、27、28、29、30、31、32(即在SEQIDNO:2的蛋白质的羧基端或在 SEQIDNO:4、6、8、10、12中的相应氨基酸)处的各残基分别由具有以下结构 的非天然编码氨基酸取代:
用于将对乙酰基-苯丙氨酸位点特异性地并入胰岛素中的序列为SEQIDNO: 1和2(胰岛素的A链和B链),和SEQIDNO:16或17(muttRNA,詹氏甲烷球 菌),以及在上述实例2中所述的SEQIDNO:15、29、30或31(TyrRSLW1、5 或6)。
包含含羰基的氨基酸的胰岛素多肽变异体在经修饰后与以下形式的含氨氧基 的PEG衍生物反应:
R-PEG(N)-O-(CH2)n-O-NH2
其中R为甲基,n为3并且N为约5,000MW。将含有对乙酰基苯丙氨酸的 经纯化胰岛素以10mg/mL溶解于25mMMES(SigmaChemical,St.Louis,MO) (pH6.0)、25mMHepes(SigmaChemical,St.Louis,MO)(pH7.0)或10mM乙 酸钠(SigmaChemical,St.Louis,MO)(pH4.5)中,与10倍到100倍过量的含 氨氧基的PEG反应,并且随后在室温下搅拌10-16小时(Jencks,W.J.Am.Chem, Soc.1959,81,第475页)。随后,将PEG-胰岛素稀释于适当缓冲液中立即进行纯 化和分析。
实例4
本实例详述含羰基的氨基酸的引入以及其与含氨氧基的PEG的后续反应。
本实例展示一种产生合并有含酮的非天然编码氨基酸的胰岛素多肽的方法, 所述多肽随后与约20,000MW的含氨氧基的PEG反应。在位置1(即在N端) 之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、21、22(即在SEQIDNO:1的蛋白质的羧基端或在SEQIDNO:3、5、7、9、 11中的相应氨基酸)处的各残基和在位置1(即在N端)之前、1、2、3、4、5、 6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、 25、26、27、28、29、30、31、32(即在SEQIDNO:2的蛋白质的羧基端或在 SEQIDNO:4、6、8、10、12中的相应氨基酸)处的各残基分别由具有以下结构 的非天然编码氨基酸取代:
用于将对氨基-苯丙氨酸位点特异性地并入到胰岛素中的序列为SEQIDNO: 1和2(胰岛素的A链和B链),和SEQIDNO:16或17(muttRNA,詹氏甲烷球 菌),以及以上所述并且用于位点特异性地并入对氨基-苯丙氨酸所并入的序列。
包含含羰基的氨基酸的胰岛素多肽变异体在经修饰后与以下形式的含氨氧基 的PEG衍生物反应:
R-PEG(N)-O-(CH2)n-O-NH2
其中R为甲基,n为3并且N为约20,000MW。将含有对氨基苯丙氨酸的经 纯化胰岛素以10mg/mL溶解于25mMMES(SigmaChemical,St.Louis,MO)(pH 6.0)、25mMHepes(SigmaChemical,St.Louis,MO)(pH7.0)或10mM乙酸钠 (SigmaChemical,St.Louis,MO)(pH4.5)中,与10倍到100倍过量的含氨氧基 的PEG反应,并且随后在室温下搅拌10-16小时(Jencks,W.J.Am.Chem,Soc.1959, 81,第475页)。随后,将PEG-胰岛素稀释于适当缓冲液中立即进行纯化和分析。
实例5
本实例详述含羰基的氨基酸的引入以及其与含氨氧基的PEG的后续反应。
本实例展示一种产生合并有含酮的非天然编码氨基酸的胰岛素多肽的方法, 所述多肽随后与约20,000MW的含氨氧基的PEG反应。在位置1(即在N端) 之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、 38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、 56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、 74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、 92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、 108、109、110、111(即在SEQIDNO:13的蛋白质的羧基端)处的各残基分别 由具有以下结构的非天然编码氨基酸取代:
用于将对氨基-苯丙氨酸位点特异性地并入到胰岛素中的序列为SEQIDNO: 13,和SEQIDNO:16或17(muttRNA,詹氏甲烷球菌),以及以上所述并且用于 位点特异性地并入对氨基-苯丙氨酸所并入的序列。
包含含羰基的氨基酸的胰岛素多肽变异体在经修饰后与以下形式的含氨氧基 的PEG衍生物反应:
R-PEG(N)-O-(CH2)n-O-NH2
其中R为甲基,n为3并且N为约20,000MW。将含有对氨基苯丙氨酸的经 纯化胰岛素以10mg/mL溶解于25mMMES(SigmaChemical,St.Louis,MO)(pH 6.0)、25mMHepes(SigmaChemical,St.Louis,MO)(pH7.0)或10mM乙酸钠 (SigmaChemical,St.Louis,MO)(pH4.5)中,与10倍到100倍过量的含氨氧基 的PEG反应,并且随后在室温下搅拌10-16小时(Jencks,W.J.Am.Chem,Soc.1959, 81,第475页)。随后,将PEG-胰岛素稀释于适当缓冲液中立即进行纯化和分析。
实例6
本实例详述含羰基的氨基酸的引入以及其与含氨氧基的PEG的后续反应。
本实例展示一种产生合并有含酮的非天然编码氨基酸的胰岛素多肽的方法, 所述多肽随后与约20,000MW的含氨氧基的PEG反应。在位置1(即在N端) 之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、 38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、 56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、 74、75、76、77、78、79、80、81、82、83、84、85、86、87(即在SEQIDNO: 14的蛋白质的羧基端)处的各残基分别由具有以下结构的非天然编码氨基酸取 代:
用于将对氨基-苯丙氨酸位点特异性地并入到胰岛素中的序列为SEQIDNO: 14,和SEQIDNO:16或17(muttRNA,詹氏甲烷球菌),以及以上所述并且用于 位点特异性地并入对氨基-苯丙氨酸所并入的序列。
包含含羰基的氨基酸的胰岛素多肽变异体在经修饰后与以下形式的含氨氧基 的PEG衍生物反应:
R-PEG(N)-O-(CH2)n-O-NH2
其中R为甲基,n为3并且N为约20,000MW。将含有对氨基苯丙氨酸的经 纯化胰岛素以10mg/mL溶解于25mMMES(SigmaChemical,St.Louis,MO)(pH 6.0)、25mMHepes(SigmaChemical,St.Louis,MO)(pH7.0)或10mM乙酸钠 (SigmaChemical,St.Louis,MO)(pH4.5)中,与10倍到100倍过量的含氨氧基 的PEG反应,并且随后在室温下搅拌10-16小时(Jencks,W.J.Am.Chem,Soc.1959, 81,第475页)。随后,将PEG-胰岛素稀释于适当缓冲液中立即进行纯化和分析。
实例7
本实例详述含羰基的氨基酸的引入以及其与含氨氧基的PEG的后续反应。
本实例展示一种产生合并有含酮的非天然编码氨基酸的胰岛素多肽的方法, 所述多肽随后与约30,000MW的含氨氧基的PEG反应。在位置1(即在N端) 之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、 38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、 56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、 74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、 92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、 108、109、110、111(即在SEQIDNO:13的蛋白质的羧基端或在SEQIDNO:1-12 和14中的相应位置)处的各残基分别由具有以下结构的非天然编码氨基酸取代:
用于将对氨基-苯丙氨酸位点特异性地并入到胰岛素中的序列为SEQIDNO: 13(或SEQIDNO:1、2或14),和SEQIDNO:16或17(muttRNA,詹氏甲烷 球菌),以及以上所述并且用于位点特异性地并入对氨基-苯丙氨酸所并入的序列。
包含含羰基的氨基酸的胰岛素多肽变异体在经修饰后与以下形式的含氨氧基 的PEG衍生物反应:
R-PEG(N)-O-(CH2)n-O-NH2
其中R为甲基,n为3并且N为约30,000MW。将含有对氨基苯丙氨酸的经 纯化胰岛素以10mg/mL溶解于25mMMES(SigmaChemical,St.Louis,MO)(pH 6.0)、25mMHepes(SigmaChemical,St.Louis,MO)(pH7.0)或10mM乙酸钠 (SigmaChemical,St.Louis,MO)(pH4.5)中,与10倍到100倍过量的含氨氧基 的PEG反应,并且随后在室温下搅拌10-16小时(Jencks,W.J.Am.Chem,Soc.1959, 81,第475页)。随后,将PEG-胰岛素稀释于适当缓冲液中立即进行纯化和分析。
实例8
本实例详述含羰基的氨基酸的引入以及其与含氨氧基的PEG的后续反应。
本实例展示一种产生合并有含酮的非天然编码氨基酸的胰岛素多肽的方法, 所述多肽随后与约40,000MW的含氨氧基的PEG反应。在位置1(即在N端) 之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、 38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、 56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、 74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、 92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、 108、109、110、111(即在SEQIDNO:13的蛋白质的羧基端或在SEQIDNO:1-12 和14中的相应位置)处的各残基分别由具有以下结构的非天然编码氨基酸取代:
用于将对氨基-苯丙氨酸位点特异性地并入到胰岛素中的序列为SEQIDNO: 13(或SEQIDNO:1、2或14),和SEQIDNO:16或17(muttRNA,詹氏甲烷 球菌),以及以上所述并且用于位点特异性地并入对氨基-苯丙氨酸所并入的序列。
包含含羰基的氨基酸的胰岛素多肽变异体在经修饰后与以下形式的含氨氧基 的PEG衍生物反应:
R-PEG(N)-O-(CH2)n-O-NH2
其中R为甲基,n为3并且N为约40,000MW。将含有对氨基苯丙氨酸的经 纯化胰岛素以10mg/mL溶解于25mMMES(SigmaChemical,St.Louis,MO)(pH 6.0)、25mMHepes(SigmaChemical,St.Louis,MO)(pH7.0)或10mM乙酸钠 (SigmaChemical,St.Louis,MO)(pH4.5)中,与10倍到100倍过量的含氨氧基 的PEG反应,并且随后在室温下搅拌10-16小时(Jencks,W.J.Am.Chem,Soc.1959, 81,第475页)。随后,将PEG-胰岛素稀释于适当缓冲液中立即进行纯化和分析。
实例9
本实例详述含羰基的氨基酸的引入以及其与含氨氧基的PEG的后续反应。
本实例展示一种产生合并有含酮的非天然编码氨基酸的胰岛素多肽的方法, 所述多肽随后与约10,000MW的含氨氧基的PEG反应。在位置1(即在N端) 之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、 38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、 56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、 74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、 92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、 108、109、110、111(即在SEQIDNO:13的蛋白质的羧基端或在SEQIDNO:1-12 和14中的相应位置)处的各残基分别由具有以下结构的非天然编码氨基酸取代:
用于将对氨基-苯丙氨酸位点特异性地并入到胰岛素中的序列为SEQIDNO: 13(或在SEQIDNO:1、2或14中的相应位置),和SEQIDNO:16或17(muttRNA, 詹氏甲烷球菌),以及以上所述并且用于位点特异性地并入对氨基-苯丙氨酸所并 入的序列。
包含含羰基的氨基酸的胰岛素多肽变异体在经修饰后与以下形式的含氨氧基 的PEG衍生物反应:
R-PEG(N)-O-(CH2)n-O-NH2
其中R为甲基,n为3并且N为约10,000MW。将含有对氨基苯丙氨酸的经 纯化胰岛素以10mg/mL溶解于25mMMES(SigmaChemical,St.Louis,MO)(pH 6.0)、25mMHepes(SigmaChemical,St.Louis,MO)(pH7.0)或10mM乙酸钠 (SigmaChemical,St.Louis,MO)(pH4.5)中,与10倍到100倍过量的含氨氧 基的PEG反应,并且随后在室温下搅拌10-16小时(Jencks,W.J.Am.Chem,Soc. 1959,81,第475页)。随后,将PEG-胰岛素稀释于适当缓冲液中立即进行纯化和 分析。
实例10
与由通过酰胺键与PEG连接的羟胺基组成的PEG结合。
具有以下结构的PEG试剂是使用实例3-9中所述的程序与含酮的非天然编码 氨基酸偶合:
R-PEG(N)-O-(CH2)2-NH-C(O)(CH2)n-O-NH2
其中R为甲基,n=4并且N为约5,000MW-40,000MW。反应、纯化和分析 条件如所属领域中所述和已知。
实例11
本实例详述将两种不同的非天然编码氨基酸引入胰岛素多肽和胰岛素类似物 多肽中。
本实例展示一种产生在以下残基中的两个位置处并入包含酮官能团的非天然 编码氨基酸的胰岛素多肽的方法:位置1(即在N端)之前、1、2、3、4、5、6、 7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、 26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、 44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、 62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、 80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、 98、99、100、101、102、103、104、105、106、107、108、109、110、111(即 在SEQIDNO:13的蛋白质的羧基端或在SEQIDNO:1-12和14中的相应位置)。 除选择密码子是在核酸内的两个不同位点处引入之外,如以上所述来制备胰岛素 多肽。
实例12
本实例详述胰岛素多肽或胰岛素类似物多肽与含酰肼的PEG的结合以及后 续的原位还原。
合并有含羰基的氨基酸的胰岛素多肽是根据以上所述的程序来制备。具有以 下结构的含酰肼的PEG在经修饰后与胰岛素多肽结合:
R-PEG(N)-O-(CH2)2-NH-C(O)(CH2)n-X-NH-NH2
其中R为甲基,n=2且N=5,000、10,000、20,000、30,000或40,000MW, 并且X为羰基(C=O)。将含有对乙酰基苯丙氨酸的经纯化胰岛素以介于0.1-10 mg/mL之间的浓度溶解于25mMMES(SigmaChemical,St.Louis,MO)(pH6.0)、 25mMHepes(SigmaChemical,St.Louis,MO)(pH7.0)或10mM乙酸钠(Sigma Chemical,St.Louis,MO)(pH4.5)中,与1倍到100倍过量的含酰肼的PEG反 应,并且通过加入溶解于H2O中直到最终浓度为10-50mM的贮存物1M NaCNBH3(SigmaChemical,St.Louis,MO)原位还原相应腙。在黑暗环境中在4□ C到室温下反应进行18-24小时。通过加入约pH7.6的1MTris(SigmaChemical, St.Louis,MO)直到最终Tris浓度为50mM来终止反应或将反应稀释于适当缓冲 液中立即进行纯化。
实例13
本实例详述胰岛素多肽或胰岛素类似物多肽与含酰肼的PEG的结合以及后 续的原位还原。
合并有含羰基的氨基酸的胰岛素多肽是根据以上所述的程序来制备。具有以 下结构的含酰肼的PEG在经修饰后与胰岛素多肽结合:
R-PEG(N)-O-(CH2)2-NH-C(O)(CH2)n-X-NH-NH2
其中R为甲基,n=2且N=20,000MW,并且X为羰基(C=O)。将含有对 乙酰基苯丙氨酸的经纯化胰岛素以介于0.1-10mg/mL之间的浓度溶解于25mM MES(SigmaChemical,St.Louis,MO)(pH6.0)、25mMHepes(SigmaChemical, St.Louis,MO)(pH7.0)或10mM乙酸钠(SigmaChemical,St.Louis,MO)(pH 4.5)中,与1倍到100倍过量的含酰肼的PEG反应,并且通过加入溶解于H2O 中直到最终浓度为10-50mM的贮存物1MNaCNBH3(SigmaChemical,St.Louis, MO)原位还原相应腙。在黑暗环境中在4℃到室温下反应进行18-24小时。通过 加入约pH7.6的1MTris(SigmaChemical,St.Louis,MO)直到最终Tris浓度为 50mM来终止反应或将反应稀释于适当缓冲液中立即进行纯化。
实例14
本实例详述将含炔的氨基酸引入胰岛素多肽或胰岛素类似物多肽中以及用 mPEG-叠氮化物使其衍生化。
在位置1(即在N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、13、 14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、 32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、 50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、 68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、 86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、 103、104、105、106、107、108、109、110、111(即在SEQIDNO:13的蛋白质 的羧基端或在SEQIDNO:1-12和14中的相应位置)处的残基各自由以下非天然 编码氨基酸取代:
用于将对炔丙基-酪氨酸位点特异性地并入胰岛素中的序列为SEQIDNO:13 (或在SEQIDNO:1、2或14中的相应位置),SEQIDNO:16或17(muttRNA, 詹氏甲烷球菌),和以上所述的SEQIDNO:22、23或24。在大肠杆菌中表达含 有炔丙基酪氨酸的胰岛素多肽并且使用以上所述的条件进行纯化。
将含有炔丙基-酪氨酸的经纯化胰岛素以介于0.1-10mg/mL的浓度溶解于PB 缓冲液(100mM磷酸钠,0.15MNaCl,pH=8)中并且向反应混合物中加入10 倍到1000倍过量的含叠氮基的PEG。随后,将催化量的CuSO4和铜丝加入反应 混合物中。在混合物经培育(包括(但不限于)在室温或37℃下约4小时,或在 4℃下过夜)后,加入H2O并且通过透析膜过滤混合物。可包括(但不限于)通 过实例3中所述的类似程序来分析样品的添加。在本实例中,PEG将具有以下结 构:
R-PEG(N)-O-(CH2)2-NH-C(O)(CH2)n-N3
其中R为甲基,n为4并且N为5,000、10,000、20,000、30,000或40,000MW。
实例15
本实例详述胰岛素多肽中用炔丙基酪氨酸取代大的疏水性氨基酸。
存在于胰岛素的一个以下区域中的Phe、Trp或Tyr残基:位置1(即在N端) 之前、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、 38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、 56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、 74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、 92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、 108、109、110、111(即在SEQIDNO:13的蛋白质的羧基端或在SEQIDNO:1-12 和14中的相应氨基酸)如以上所述由以下非天然编码氨基酸取代:
PEG在经修饰后连接到包含含炔的氨基酸的胰岛素多肽变异体上。PEG将具 有以下结构:
Me-PEG(N)-O-(CH2)2-N3
并且偶合程序将遵循以上实例中的程序。这个过程会产生胰岛素多肽变异体, 其包含大致与一种天然存在的大的疏水性氨基酸等比容的非天然编码氨基酸并且 在所述多肽内的不同位点处经PEG衍生物修饰。
实例16
本实例详述由一个或一个以上PEG连接子分隔的胰岛素多肽同源二聚物、异 源二聚物、同源多聚物或异源多聚物的产生。胰岛素多肽多聚物可在胰岛素原之 间形成或在本发明的成熟A链与B链胰岛素多肽之间形成。
使以上实例中产生的含炔的胰岛素多肽变异体与以下形式的双官能PEG衍 生物反应:
N3-(CH2)n-C(O)-NH-(CH2)2-O-PEG(N)-O-(CH2)2-NH-C(O)-(CH2)n-N3
其中n为4并且PEG具有约5,000、10,000、20,000、30,000或40,000MW 的平均分子量,以产生两个胰岛素分子由PEG实体分隔开的相应胰岛素多肽同源 二聚物。胰岛素多肽可以类似方式与一种或一种以上其它多肽偶合以形成异源二 聚物、同源多聚物或异源多聚物。如同以上实例中进行偶合、纯化和分析。
实例17
本实例详述由一个或一个以上PEG连接子分隔的胰岛素多肽同源二聚物、异 源二聚物、同源多聚物或异源多聚物的产生。胰岛素多肽多聚物可在A链与其它 A链或B链与其它B链之间形成。
使以上实例中产生的含炔的胰岛素多肽变异体与以下形式的双官能PEG衍 生物反应:
N3-(CH2)n-C(O)-NH-(CH2)2-O-PEG(N)-O-(CH2)2-NH-C(O)-(CH2)n-N3
其中n为4并且PEG具有约5,000、10,000、20,000、30,000或40,000MW 的平均分子量,以产生两个胰岛素分子由PEG实体分隔开的相应胰岛素多肽同源 二聚物。胰岛素多肽可以类似方式与一种或一种以上其它多肽偶合以形成异源二 聚物、同源多聚物或异源多聚物。如同以上实例中进行偶合、纯化和分析。
实例18
本实例详述糖部分与胰岛素多肽的偶合。
以下位置1(即在N端)之前、1、2、3、4、5、6、7、8、9、10、11、12、 13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、 31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、 49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、 67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、 85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、 102、103、104、105、106、107、108、109、110、111(即在SEQIDNO:13的 蛋白质的羧基端或在SEQIDNO:1-12和14中的相应位置)处的一个残基如以上 所述由以下非天然编码氨基酸取代。
包含含羰基的氨基酸的胰岛素多肽变异体在经修饰后与N-乙酰基葡糖胺 (GlcNAc)的β-连接氨氧基类似物反应。在100mM水性乙酸钠缓冲液(pH5.5) 中混合胰岛素多肽变异体(10mg/mL)与氨氧基糖(21mM),并且在37℃下培 育7小时到26小时。通过在环境温度下将结合糖的胰岛素多肽(5mg/mL)与 UDP-半乳糖(16mM)和β-1,4-半乳糖基转移酶(0.4单位/毫升)在150mMHEPES 缓冲液(pH7.4)中培育48小时而使第二种糖与第一种糖酶促偶合(Schanbacher 等人,J.Biol.Chem.1970,245,5057-5061)。
实例19
本实例详述聚乙二醇化胰岛素多肽拮抗剂的产生。
残基(包括(但不限于)与胰岛素受体结合有关的残基)如以上所述由以下 非天然编码氨基酸取代。包含含羰基的氨基酸的胰岛素多肽变异体在经修饰后与 以下形式的含氨氧基的PEG衍生物反应:
R-PEG(N)-O-(CH2)n-O-NH2
其中R为甲基,n为4并且N为5,000、10,000、20,000、30,000或40,000MW, 以产生在多肽内的单一位点处经PEG衍生物修饰的包含非天然编码氨基酸的胰 岛素多肽拮抗剂。如以上所述进行偶合、纯化和分析。
实例20
直接连接胰岛素分子的胰岛素多肽同源二聚物、异源二聚物、同源多聚物或 异源多聚物的产生
包含含炔的氨基酸的胰岛素多肽变异体可与另一种包含含叠氮基的氨基酸的 胰岛素多肽变异体直接偶合。胰岛素多肽多肽可以类似方式与一种或一种以上其 它多肽偶合以形成异源二聚物、同源多聚物或异源多聚物。关于可形成的多聚物 的更多描述在以上实例16和17中提供并且如以上所述进行偶合、纯化和分析。
实例21
PEG-OH+Br-(CH2)n-C≡CR′→PEG-O-(CH2)n-C=CR′
AB
使聚烷二醇(P-OH)与烷基卤化物(A)反应形成醚(B)。在这些化合物中, n为1到9的整数并且R′可为直链或支链、饱和或不饱和的C1到C20烷基或杂 烷基。R′也可为C3到C7饱和或不饱和的环状烷基或环状杂烷基,经取代或未经 取代的芳基或杂芳基,或经取代或未经取代的烷芳基(所述烷基为C1到C20饱 和或不饱和烷基)或杂烷芳基。通常,PEG-OH为具有800道尔顿到40,000道尔 顿(Da)的分子量的聚乙二醇(PEG)或单甲氧基聚乙二醇(mPEG)。
实例22
mPEG-OH+Br-CH2-C≡CH→mPEG-O-CH2-C≡CH
用THF(35mL)中的NaH(12mg,0.5mmol)处理具有20,000Da的分子 量的mPEG-OH(mPEG-OH20kDa;2.0g,0.1mmol,Sunbio)。随后,将溶解于 二甲苯中的80重量%溶液形式的炔丙基溴溶液(0.56mL,5mmol,50当量, Aldrich)和催化量的KI加入溶液中并且将所得混合物加热到回流历时2小时。 随后加入水(1mL)并且在真空下移除溶剂。向残余物中加入CH2Cl2(25mL) 并且分离有机层,用无水Na2SO4干燥,并将体积缩减到约2mL。将此CH2Cl2 溶液逐滴加入乙醚(150mL)中。收集所得沉淀物,用若干份冷乙醚洗涤并干燥, 得到炔丙基-O-PEG。
实例23
mPEG-OH+Br-(CH2)3-C≡CH→mPEG-O-(CH2)3-C≡CH
用THF(35mL)中的NaH(12mg,0.5mmol)处理具有20,000Da的分子 量的mPEG-OH(mPEG-OH20kDa;2.0g,0.1mmol,Sunbio)。随后,将50当 量的5-溴-1-戊炔(0.53mL,5mmol,Aldrich)和催化量的KI加入混合物中。将 所得混合物加热到回流历时16小时。随后加入水(1mL)并且在真空下移除溶 剂。向残余物中加入CH2Cl2(25mL)并且分离有机层,用无水Na2SO4干燥, 并将体积缩减到约2mL。将此CH2Cl2溶液逐滴添加到乙醚(150mL)中。收集 所得沉淀物,用若干份冷乙醚洗涤并干燥,得到相应炔。5-氯-1-戊炔可用于类似 反应中。
实例24
(1)m-HOCH2C6H4OH+NaOH+Br-CH2-C≡CH→m-HOCH2C6H4O-CH2-C ≡CH
(2)m-HOCH2C6H4O-CH2-C≡CH+MsCl+N(Et)3→ m-MsOCH2C6H4O-CH2-C≡CH
(3)m-MsOCH2C6H4O-CH2-C≡CH+LiBr→m-Br-CH2C6H4O-CH2-C≡CH
(4)mPEG-OH+m-Br-CH2C6H4O-CH2-C≡CH→mPEG-O-CH2-C6H4O-CH2-C ≡CH
首先向3-羟基苄醇(2.4g,20mmol)溶于THF(50mL)和水(2.5mL)中 的溶液中加入粉末状氢氧化钠(1.5g,37.5mmol),并且随后加入溶解于二甲苯 中的80重量%溶液形式的炔丙基溴溶液(3.36mL,30mmol)。将反应混合物在 回流下加热6小时。向混合物中加入10%柠檬酸(2.5mL)并且在真空下移除溶 剂。用乙酸乙酯(3×15mL)萃取残余物并且用饱和NaCl溶液(10mL)洗涤合 并的有机层,用MgSO4干燥并浓缩,得到3-炔丙基氧基苄醇。
在0℃下,将甲烷磺酰氯(2.5g,15.7mmol)和三乙胺(2.8mL,20mmol) 加入化合物3(2.0g,11.0mmol)溶于CH2Cl2中的溶液中,并且将反应液放置 到冰箱中达16小时。常用处理得到呈浅黄色油状的甲磺酸酯。将所述油状物(2.4 g,9.2mmol)溶解于THF(20mL)中并且加入LiBr(2.0g,23.0mmol)。将反 应混合物加热到回流历时1小时并且随后冷却到室温。向混合物中加入水(2.5 mL)并在真空下移除溶剂。用乙酸乙酯(3×15mL)萃取残余物并且用饱和NaCl 溶液(10mL)洗涤合并的有机层,用无水Na2SO4干燥并浓缩,得到所需溴化物。
将mPEG-OH20kDa(1.0g,0.05mmol,Sunbio)溶解于THF(20mL)中 并且在冰浴中冷却所述溶液。在强烈搅拌下历经数分钟加入NaH(6mg,0.25 mmol),接着加入上文获得的溴化物(2.55g,11.4mmol)和催化量的KI。移除 冷却浴并且将所得混合物加热到回流历时12小时。向混合物中加入水(1.0mL) 并在真空下移除溶剂。向残余物中加入CH2Cl2(25mL)并且分离有机层,用无 水Na2SO4干燥,并将体积缩减到约2mL。逐滴加入乙醚溶液(150mL)中,产 生白色沉淀物,收集所述沉淀物以得到PEG衍生物。
实例25
mPEG-NH2+X-C(O)-(CH2)n-C≡CR′→mPEG-NH-C(O)-(CH2)n-C≡CR′
如上所示,也可通过使含有末端官能团的聚(乙二醇)聚合物与含有炔官能团 的反应性分子偶合来获得末端含炔的聚(乙二醇)聚合物。n介于1与10之间。R′ 可为H或C1到C4的小烷基。
实例26
(1)HO2C-(CH2)2-C≡CH+NHS+DCC→NHSO-C(O)-(CH2)2-C≡CH
(2)mPEG-NH2+NHSO-C(O)-(CH2)2-C≡CH→mPEG-NH-C(O)-(CH2)2-C ≡CH
将4-戊炔酸(2.943g,3.0mmol)溶解于CH2Cl2(25mL)中。加入N-羟基 丁二酰亚胺(3.80g,3.3mmol)和DCC(4.66g,3.0mmol)并且在室温下将溶 液搅拌过夜。所得粗NHS酯7未经进一步纯化即用于下一反应中。
将具有5,000Da的分子量的mPEG-NH2(mPEG-NH2,1g,Sunbio)溶解于THF (50mL)中并且将混合物冷却到4℃。在强烈搅拌下逐份加入NHS酯7(400mg, 0.4mmol)。将混合物搅拌3小时,同时升温到室温。随后加入水(2mL)并在真 空下移除溶剂。向残余物中加入CH2Cl2(50mL)并且分离有机层,用无水Na2SO4 干燥,并将体积缩减到约2mL。将此CH2Cl2溶液逐滴加入乙醚(150mL)中。收 集所得沉淀物并在真空中干燥。
实例27
本实例表示聚(乙二醇)的甲烷磺酰基酯(其也可称作聚(乙二醇)的甲烷磺酸酯 或甲磺酸酯)的制备。可通过类似程序来制备相应的甲苯磺酸酯和卤化物。
mPEG-OH+CH3SO2Cl+N(Et)3→mPEG-O-SO2CH3→mPEG-N3
在氮气下,将150mL甲苯中的mPEG-OH(MW=3,400,25g,10mmol)共 沸蒸馏2小时并且将溶液冷却到室温。将40mL无水CH2Cl2和2.1mL无水三乙胺 (15mmol)加入溶液中。在冰浴中冷却所述溶液并且逐滴加入1.2mL经蒸馏的甲 烷磺酰氯(15mmol)。在氮气下,在室温下,将溶液搅拌过夜,并且通过加入2mL 无水乙醇来中止反应。在真空下蒸发所述混合物以移除溶剂(主要是除甲苯之外 的溶剂),过滤,再次真空浓缩并且随后在100mL乙醚中沉淀。用数份冷乙醚洗 涤滤液并在真空下干燥,得到甲磺酸酯。
将甲磺酸酯(20g,8mmol)溶解于75mlTHF中并且将溶液冷却到4℃。向 冷却的溶液中加入叠氮化钠(1.56g,24mmol)。在氮气下,将反应加热到回流历 时2小时。随后蒸发溶剂并且用CH2Cl2(50mL)稀释残余物。用NaCl溶液洗 涤有机部分并且用无水MgSO4干燥。将体积缩减到20ml,并通过加入150ml 冷的无水乙醚中使产物沉淀。
实例28
(1)N3-C6H4-CO2H→N3-C6H4CH2OH
(2)N3-C6H4CH2OH→Br-CH2-C6H4-N3
(3)mPEG-OH+Br-CH2-C6H4-N3→mPEG-O-CH2-C6H4-N3可使用美国专利第5,998,595号中所述的方法来制备4-叠氮基苄醇,所述专利 是以引用的方式并入本文中。在0℃下将甲烷磺酰氯(2.5g,15.7mmol)和三乙 胺(2.8mL,20mmol)加入4-叠氮基苄醇(1.75g,11.0mmol)的CH2Cl2溶液中, 并且将反应液放置到冰箱中达16小时。常用处理得到呈浅黄色油状的甲磺酸酯。 将所述油状物(9.2mmol)溶解于THF(20mL)中并且加入LiBr(2.0g,23.0mmol)。 将反应混合物加热到回流历时1小时并且随后冷却到室温。向混合物中加入水(2.5 mL)并在真空下移除溶剂。用乙酸乙酯(3×15mL)萃取残余物并且用饱和NaCl 溶液(10mL)洗涤合并的有机层,用无水Na2SO4干燥并浓缩,得到所需溴化物。
用THF(35mL)中的NaH(12mg,0.5mmol)处理mPEG-OH20kDa(2.0g, 0.1mmol,Sunbio)并且向混合物中加入溴化物(3.32g,15mmol)和催化量的 KI。将所得混合物加热到回流历时12小时。将水(1.0mL)加入混合物中并在真 空下移除溶剂。向残余物中加入CH2Cl2(25mL)并且分离有机层,用无水Na2SO4 干燥,并将体积缩减到约2mL。逐滴加入乙醚溶液(150mL)中,产生沉淀物, 收集所述沉淀物以得到mPEG-O-CH2-C6H4-N3。
实例29
NH2-PEG-O-CH2CH2CO2H+N3-CH2CH2CO2-NHS→ N3-CH2CH2-C(O)NH-PEG-O-CH2CH2CO2H
将NH2-PEG-O-CH2CH2CO2H(MW3,400Da,2.0g)溶解于NaHCO3饱和水溶 液(10mL)中并且将溶液冷却到0℃。在强烈搅拌下加入丙酸3-叠氮基-1-N-羟基 丁二酰亚胺酯(5当量)。3小时后,加入20mLH2O并且在室温下再将混合物搅拌 45分钟。用0.5NH2SO4将pH值调节到3并且加入NaCl直到浓度为约15重量%。用 CH2Cl2(100mL×3)萃取反应混合物,用Na2SO4干燥并浓缩。用冷乙醚沉淀后, 通过过滤收集产物并在真空下干燥,得到ω-羧基-叠氮化物PEG衍生物。
实例30
mPEG-OMs+HC≡CLi→mPEG-O-CH2-CH2-C≡C-H
在强烈搅拌下,向如所属领域中已知所制备并冷却到-78℃的乙炔锂(4当量) 的THF溶液中逐滴加入溶解于THF中的mPEG-OMs溶液。3小时后,使反应升 温到室温并通过加入1mL丁醇中止反应。随后加入20mLH2O并且在室温下再 将混合物搅拌45分钟。用0.5NH2SO4将pH值调节到3并且加入NaCl直到浓 度为约15重量%。用CH2Cl2(100mL×3)萃取反应混合物,用Na2SO4干燥并 浓缩。用冷乙醚沉淀后,通过过滤收集产物并在真空下干燥,得到1-(丁-3-炔基 氧基)-甲氧基聚乙二醇(mPEG)。
实例31
可使用以下文献中描述的方法将含叠氮基的氨基酸和含乙炔的氨基酸位点选 择性地并入蛋白质中:L.Wang等人,(2001),Science292:498-500;J.W.Chin等人, Science301:964-7(2003);J.W.Chin等人,(2002),JournaloftheAmericanChemical Society124:9026-9027;J.W.Chin和P.G.Schultz,(2002),ChemBioChem 11:1135-1137;J.W.Chin等人,(2002),PNASUnitedStatesofAmerica 99:11020-11024;以及L.Wang和P.G.Schultz,(2002),Chem.Comm.,1:1-11。并入 氨基酸后,随即在37℃下,在存在2mMPEG衍生物、1mMCuSO4和约1mg铜丝 的情况下,用磷酸盐缓冲液(PB)(pH8)中的0.01mM蛋白质进行环加成反应达 4小时。
实例32
本实例描述对乙酰基-D,L-苯丙氨酸(pAF)和m-PEG-羟胺衍生物的合成。
使用先前描述于Zhang,Z.,Smith,B.A.C,Wang,L.,Brock,A.,Cho,C.和 Schultz,P.G.,Biochemistry(2003)42,6735-6746中的程序来合成外消旋pAF。
为合成m-PEG-羟胺衍生物,完成以下程序。向在室温(RT)下搅拌1小时 的(N-t-Boc-氨氧基)乙酸(0.382g,2.0mmol)和1,3-二异丙基碳化二亚胺(0.16mL, 1.0mmol)的二氯甲烷(DCM,70mL)溶液中加入甲氧基-聚乙二醇胺 (m-PEG-NH2,7.5g,0.25mmol,Mt.30K,来自BioVectra)和二异丙基乙胺(0.1 mL,0.5mmol)。将反应物在室温下搅拌48小时,并且接着浓缩到约100mL。将 混合物逐滴加入冷乙醚(800mL)中。经t-Boc保护的产物沉淀出来并通过过滤 收集,用乙醚(3×100mL)洗涤。通过再次溶解于DCM(100mL)中并且在乙 醚(800mL)中沉淀两次使其进一步纯化。在真空中干燥产物,得到7.2g(96%), 通过NMR和茚三酮试验(Nihydrintest)加以确认。
在0℃下在50%TFA/DCM(40mL)中脱除上文获得的经保护产物(7.0g) 的Boc达1小时并且接着在室温下进行1.5小时。在真空中移除大部分TFA后, 通过向残余物中加入4NHCl的二噁烷(1mL)溶液而使羟胺衍生物的TFA盐转 化为盐酸盐。将沉淀物溶解于DCM(50mL)中并且再次在乙醚(800mL)中沉 淀。通过过滤收集最终产物(6.8g,97%),用乙醚(3×100mL)洗涤,在真空 中干燥,在氮气下贮存。使用相同程序合成其它PEG(5K、20K)羟胺衍生物。
实例33
聚乙二醇化胰岛素的活体内研究
向小鼠或大鼠投与PEG-胰岛素、未经修饰的胰岛素和缓冲溶液。结果 显示,本发明的聚乙二醇化胰岛素与未经修饰的胰岛素相比具有优良的活性和延 长的半衰期。类似地,向小鼠或大鼠投与经修饰的胰岛素、未经修饰的胰岛素和 缓冲溶液。
药物动力学分析
通过静脉内或皮下途径向小鼠投与本发明的胰岛素多肽。在给药之前和给药 之后的多个时间点对动物采血。采集各样品的血浆并通过放射免疫测定分析。可 计算消除半衰期并且在包含非天然编码氨基酸的胰岛素多肽与野生型胰岛素或本 发明的各种胰岛素类似物多肽之间进行比较。类似地,可向猕猴投与本发明的胰 岛素多肽。在给药之前和给药之后的多个时间点对动物采血。采集各样品的血浆 并通过放射免疫测定分析。
可向ZDF雄性大鼠(糖尿病肥胖大鼠;在研究开始时为8周龄,Charles River-GMI)投与本发明的多肽。使大鼠随意食用Purina5008饲料。设置以下测 试组:生理食盐水;胰岛素,每天4U;本发明的胰岛素多肽,每天8U,短期(向 短期给药组给药一次且在给药后T=0、2、4、8和24小时时采血);本发明的胰 岛素多肽,每天6U;本发明的胰岛素多肽,每天4U;本发明的胰岛素多肽,每 天3U;本发明的胰岛素多肽,每天2U;瘦组,生理食盐水;瘦组,胰岛素,每 天4U;和接受每天6U、每天4U和每天2U胰岛素多肽的非糖尿病大鼠组。瘦组 表示非糖尿病瘦ZDF大鼠。
每天一次皮下注射化合物,且接着通过每隔一天注射来维持具有相同投药量 的第二组。给对照组大鼠注射媒剂(PBS;0.1ml)。给药7天后,使动物经受口 服葡萄糖耐量试验。通过在无麻醉的情况下截尾放血(tailclipbleeding)来采集用 于葡萄糖和三酸甘油酯测定的血液。胰岛素多肽可以剂量依赖性方式降低血浆葡 萄糖水平。也可以相较于给与野生型胰岛素的大鼠在暴露于本发明的胰岛素多肽 后测试瘦ZDF大鼠的低血糖。
ob/ob肥胖模型
ob/ob小鼠模型是高血糖、胰岛素抗性和肥胖的动物模型。与媒剂和胰岛素对 照组相比,可在ob/ob小鼠中测量用胰岛素多肽处理后的血浆葡萄糖水平。在这 一肥胖模型中,给雄性ob/ob小鼠(7周龄)之测试组皮下注射单独媒剂(PBS)、 胰岛素(每天4U)或如上文所述的胰岛素多肽(0.1ml,每天一次且在其它测试 组中每隔一天一次且在其它测试组中每周一次),历时14天。在第1、3和7、9、 11、14天,在第一次化合物注射后1小时,通过截尾放血来采集血液,并且使用 标准方案测量血浆葡萄糖水平。如果与媒剂对照组相比,本发明的胰岛素多肽降 低血浆葡萄糖水平,那么其刺激葡萄糖摄取。可在用本发明的胰岛素多肽处理后 比较与其它分子相比的三酸甘油酯水平。可通过多次剂量、连续输注或单次剂量 等向小鼠投与多肽。
实例34
使用Novagen(诱导性T7启动子;以引用的方式并入本文中的pETSystem Manual(第9版)中详细描述)的胰岛素表达系统、表达载体pET30a和表达菌 株BL21(DE3)。
给2mLLB/卡那霉素(10μg/ml)培养物接种用所需类似物转化的BL21 (DE3)板的扫落物(sweep)。此举减少由菌落之间的表达水平变化所引起的影响。 在37℃下在剧烈震荡下使这一培养物生长过夜并且在第二天给10mlLB/卡那霉 素培养物接种1ml过夜培养物(OD600~0.4-0.5)。可将剩余几毫升过夜培养物 冷冻作为甘油贮存物。
将10mL生长培养物放在37℃和250rpm下30-45分钟直到OD600达到 0.8-0.9。随后用1mMIPTG诱导这一物质(其中可留出1mL作为非诱导性培养 对照组)并且通常在诱导后3-4小时收集且在SDS-PAGE上进行分析。
也有可能进行一定时间过程的表达(例如诱导后1、2、4、6小时的时间点和 O/N)以确定累积率、蛋白质稳定性等。
凝胶分析:在诱导后的所需时间点,从培养物收集1mL,将细胞离心,再悬 浮于100μl2×SDS-PAGE中,声波处理以降低粘度并且将10μl在SDS-PAGE 上过柱。必要时,可将此与非诱导性对照组和/或已知阳性对照组或标准物相比并 且可估计表达水平(例如良好表达可为>100μg/ml)。也可使用西方印迹分析。 也可能留出4ml培养物,制备包涵体(如果表达不溶性类似物)并且对这些包涵 体进行质谱分析以证实过表达的蛋白质的一致性。
对于大规模蛋白质表达来说,给>250mLLB/卡那霉素(10μg/ml)接种250 μL冷冻甘油贮存物并且生长过夜。第二天,给10×1LLB/卡那霉素培养物接 种25mL过夜培养物(OD600~0.1)。
在37℃和250rpm下使1L培养物生长约2小时直到OD600达到0.8-0.9。随后用1 mMIPTG诱导这一物质并且在诱导后4小时或第二天早晨收集(收集可使用在 4,000rpm下离心15分钟)。如果需要减少内毒素并且促进纯化,那么用50mM Tris-HCl(pH8.0)(每一小球50ml+用于冲洗瓶子的50ml)冲洗小球。将小球混 合在一起并且再次旋转。
实例35
毕赤酵母表达研究-DNA制备、电穿孔、表达方案
本实例提供一种在毕赤酵母中制备本发明的胰岛素多肽的方案。使用SEQID NO:34、35、36和37,且图8展示用于克隆到毕赤酵母中的质粒并且这种或其它 经修饰质粒可用于获得胰岛素多肽在毕赤酵母中的蛋白质表达,使用所属领域中 已知的方法对质粒进行修饰。
在所述方案的第1天,进行过夜消化,通常每微克待消化的DNA使用2U酶 并且从甘油贮存物中将10mL酵母植物蛋白胨右旋糖(YPhyD)培养物接种于50 mL烧瓶中过夜,同时在260rpm、30℃下震荡。
DNA制备
通过首先添加1/10体积的无菌3MNaOAc且接着添加0.7体积的无菌IPA来使 DNA沉淀且随后有力地混合样品并在-20℃下或在-70℃下继续沉淀过夜直到冻 住。随后通过离心(benchtop离心机,14,000rpm/10分钟)使DNA成球状,移除 上清液,并且使用500μL无菌70%乙醇(ETOH)洗涤小球。旋转(bench-top离 心机,14,000rpm/10分钟)并且倾析上清液以及风干小球15-20分钟。用无菌水使 DNA小球再悬浮直到1μg/μl并且用10μgDNA转化毕赤酵母。
电穿孔
使用OD600过夜培养物,用YPhyD稀释到OD600=0.2。在260rpm、30℃下 震荡培养物直到OD600达到0.8-1.0。通过离心(4000rpm/5分钟)收集细胞。倾 析培养基,用20mL冰冷无菌水洗涤细胞,再次倾析并且重复。水洗涤后,用20 mL冰冷无菌1M山梨糖醇洗涤小球,倾析,并且将洗过的细胞小球再悬浮于600 μL1M冷山梨糖醇中,随后将这一悬浮液贮存在冰上。
在无菌1.5mL离心管(eppendorftube)中将来自经洗涤细胞的50μL与10 μg线性化DNA混合,轻轻地混合并且在冰上培育25分钟。使用长移液管尖将 细胞/DNA混合物转移到预冷却的0.2cm比色皿中。使用BioRadGenePulsarII装 置,在以下设置下对细胞进行电穿孔:2000V、200欧姆、25μFd(使用单脉冲) 并且立即将0.5mLYPhyD培养基添加到比色皿中并通过移液操作来混合。将全部 内容物转移到无菌圆底试管中并且在30℃下轻轻地震荡(200rpm)30分钟。均 匀地涂布和展布细胞并且在30℃下倒置培育培养板3天。
培育三天后,用环挑取菌落并且接种到50ml烧瓶中的10ml缓冲酵母植物 蛋白胨右旋糖(BYPhyD)培养基中且在30℃下培育3天。对20μl培养板上的 菌落进行计数并且记录平均数目且接着收集细胞,首先准备2组标有菌株名称和 克隆数目、胰岛素(即所表达的蛋白质)和日期的冷冻管。将培养物转移到15ml 锥形管中,获得各培养物的OD600,用YPhyD培养基以1∶50或1∶20稀释培养物。 保留培养物的等分试样作为甘油贮存物。随后在4000rpm、室温下使酵母成球状 5分钟,将上清液转移到新的有标记的15mL锥形管中,并且贮存在-20℃或-80 ℃下直到分析数据需要时。
蛋白质表达分析
将样品在4-12%NuPAGETB凝胶(Novex)上过柱。使用来自Invitrogen的 SDS-PAGE试剂,通过西方印迹法或染色凝胶分析来分析。
培养基配方
缓冲酵母植物蛋白胨右旋糖(BufferedYeastPhytoneDextrose,BYPhyD)
酵母提取物10g/L
植物蛋白胨20g/L
1M磷酸钾缓冲液(pH6)100ml/L
10×酵母氮源(YNB)100mL/L
20%右旋糖100mL/L
酵母植物蛋白胨右旋糖(YeastPhytoneDextrose,YPhyD)
酵母提取物10g/L
植物蛋白胨20g/L
20%右旋糖100ml/L
10×YNB(13.4%含硫酸铵但不含氨基酸的酵母氮源)
酵母氮源134g/L
实例36
胰岛素A21G制造
在本实例中,使4.0L培养物发酵以产生13.4g湿细胞糊状物并且在有或无 Triton-X100的情况下制备包涵体。以此方式制造2.07g湿包涵体,并且随后进行 溶解和再折叠。每克湿包涵体(IB)用200mLH20使包涵体再悬浮直到3mM的 最终浓度并且将半胱氨酸添加到再悬浮液中。随后通过在室温下使pH值增加到 11.5历时1小时来溶解IB。随后通过使所溶解的物质的pH值下降到10.6±0.1并 且贮存在2-8℃下约72小时来使得发生再折叠且在图10中展示这些结果。通过添 加HCl直到3.0的最终pH值来中止再折叠反应,0.45μM过滤并且贮存在2-8 ℃下直到进一步处理。
通过用Tris基剂使淬灭的再折叠的pH值增加到8.0并且直接加载到QHP管 柱上来纯化再折叠的蛋白质(如图11中所示)。在所示情况下加载的传导率为>3.5 mS/cm。过柱条件是(A)20mMTris(8.0);(B)20mMTris(8.0);200mMNaCl 并且在30CV下存在0-100%B。混合正确再折叠的胰岛素原并且回收79mg胰岛 素原。
进行超滤/透滤(UF/DF)并且用25mM锌进行沉淀,用20mMNaOAc(4.0)、 30%乙睛(ACN)、5mMEDTA使所沉淀的蛋白质再悬浮直到2mg/mL的浓度并 且添加20KPEG直到PEG与蛋白质的最终摩尔比为10∶1且在28℃下培育48-72 小时。
用0.5×PEG缓冲液A以1∶10稀释PEG反应物,0.22μM过滤并且在SP650S 管柱上过柱。过柱条件是(A)10mMNaOAc(4.0)、1mMEDTA;(B)10mM NaOAc(4.0)、1mMEDTA、0.4MNaCl;在20CV下0-50%B和用10mM柠檬 酸钠(6.5)调配的PEG样品;150mMNaCl,并且在图12中展示这一情况。
使用这些方法制造多种具有非天然氨基酸的胰岛素多肽并且经纯化和聚乙二 醇化的变异体的末端蛋白质含量的范围为0.1-22mg。发现在PEG反应中ACN有 助于溶解PEG/蛋白质混合物且在pI下的锌沉淀促进在CAN存在下浓缩。
实例37
在STZ糖尿病大鼠模型中测试胰岛素多肽
利用单独注射本发明的两种不同胰岛素多肽来处理大鼠:A14pAF-PEG-A21N 赖脯胰岛素和A14pAF-PEG-A21G赖脯胰岛素,各以四种不同含量;568nmol/kg; 94nmol/kg;56.8nmol/kg;和9.4nmol/kg(每千克胰岛素含量3、0.5、0.3、0.05 mg)。随后在给药后1、2、4、8、12、24、48、72、96、120小时测量血糖并且 在图9中展示平均曲线下面积,即上述各种情况的0-120小时的血糖的量度,包 括仅注射媒剂的对照组。
实例38
包含非天然编码氨基酸的聚乙二醇化胰岛素的安全性和/或功效的人类临床 试验。
目的:为了观测经皮下投与的包含非天然编码氨基酸的聚乙二醇化重组 人类胰岛素的安全性和药物动力学。
患者在研究中招募18名年龄介于20-40岁之间并且体重介于60-90kg之间 的健康志愿者。所述个体应不会具有临床上显著异常的针对血液学或血清化学以 及阴性尿毒物学筛选、HIV筛选和B型肝炎表面抗原的实验值。其不应具有任何 以下迹象:高血压;任何原发性血液病史;严重肝病、肾病、心血管疾病、胃肠 疾病、泌尿生殖系统疾病、代谢疾病、神经病史;贫血或癫痫病史;已知对细菌 或哺乳动物来源的产品、PEG或人类血清白蛋白具有过敏性;含咖啡因的饮料的 习惯性和重度消费者;在进入研究的30天内参与任何其它临床试验或经输血或献 血;在进入研究的3个月内曾接触胰岛素;在进入研究的7天内患病;以及研究 前身体检查或在进入研究的14天内临床实验室评估时具有显著异常。可对所有个 体评估安全性,并且定时采集所有血液采集物用于药物动力学分析。所有研究都 是在机构伦理委员会批准和患者同意下进行。
研究设计:其应为在健康男性志愿者中的第I阶段、单一中心、开放标记、 随机性、两个周期的交叉研究。将18名个体随机分配到两个治疗顺序组中的一组 中(每组9名个体)。使用相等剂量的包含非天然编码氨基酸的聚乙二醇化胰岛素 和所选的市售产品,在大腿上部经两个分开的给药期以皮下团注形式投与胰岛素。 投与市售产品的剂量和频率是按照包装标签中所指示来进行。可通过包括其它个 体组而在研究中加入使用市售产品的其它剂量、给药频率或所需的其它参数。各 给药期由14天的清洗期分隔开。对于两个给药期的每一时期来说,在给药之前至 少12小时以及给药后72小时将个体限制在研究中心,但在给药期之间不必如此。 如果也存在其它剂量、频率或其它参数,那么也可加入其它个体组来测试聚乙二 醇化胰岛素。胰岛素的实验调配物为包含非天然编码氨基酸的聚乙二醇化胰岛素。
血液取样:在投与胰岛素之前和之后,通过直接静脉穿刺连续取血。在给 药之前约30分钟、20分钟和10分钟(3个基线样品)以及在给药后大致以下时 间:30分钟和1小时、2小时、5小时、8小时、12小时、15小时、18小时、24 小时、30小时、36小时、48小时、60小时和72小时,获得胰岛素静脉血样(5mL) 用于测定血清胰岛素浓度。将各血清样品分为两个等分试样。将所有血清样品贮 存在-20℃下。以干冰运输血清样品。在第1天初始给药前即刻、第4天早晨、第 16天给药前即刻以及第19天早晨进行空腹临床实验测试(血液学、血清化学和 尿分析)。
生物分析方法:使用ELISA试剂盒来测定血清胰岛素浓度。
安全性测定:在每次给药(第1天和第16天)之前以及在每次给药后6 小时、24小时、48小时和72小时即刻记录生命体征。安全性测定是基于不利事 件的发生率和类型以及临床实验测试与基线相比的变化。另外,评估生命体征测 量结果(包括血压)和身体检查结果与研究前相比的变化。
数据分析:通过从给药后的每一个值减去通过对给药前30分钟、20分钟和 10分钟时采集的三个样品的胰岛素水平取平均值而测定出的平均基线胰岛素浓 度而关于给药前基线胰岛素浓度来修正给药后血清浓度值。如果给药前血清胰岛 素浓度低于测定的定量水平,那么其不包括在平均值的计算中。由关于基线胰岛 素浓度所修正的血清浓度数据测定药物动力学参数。使用BIOAVL软件的最新版 本,通过利用DigitalEquipmentCorporationVAX8600计算机系统的不依赖于模 型的方法来计算药物动力学参数。测定以下药物动力学参数:峰值血清浓度 (Cmax);到达峰值血清浓度的时间(tmax);通过使用线性梯形规则计算的从时 间零时到最后血液取样时间(AUC0-72)的浓度-时间曲线下面积(AUC);以及 根据消除速率常数计算的末期消除半衰期(t1/2)。在对数-线性浓度-时间曲线的 末期线性区域中,通过连续数据点的线性回归来估算消除速率常数。对于每一次 治疗,计算药物动力学参数的平均标准偏差(SD)和变异系数(CV)。计算参数 平均值的比率(经保存调配物/未经保存调配物)。
安全性结果:在各治疗组中,不利事件的发生率分布相同。与基线或研究 前临床实验测试或血压相比无临床显著变化,并且身体检查结果和生命体征测量 结果与研究前相比也无显著变化。两个治疗组的安全性概况看来应类似。
药物动力学结果:在各时间点,测量所有18名个体在接受包含非天然编码氨 基酸的聚乙二醇化胰岛素后的平均血清胰岛素浓度-时间概况(未关于基线胰岛素 水平进行修正)。所有个体都应具有在正常生理学范围内的给药前基线胰岛素浓 度。根据关于给药前平均基线胰岛素浓度所修正的血清数据来测定药物动力学参 数,并且测定Cmax和tmax。所选的任何临床比较物的平均tmax都比包含非天 然编码氨基酸的聚乙二醇化胰岛素的tmax显著更短。与包含非天然编码氨基酸的 聚乙二醇化胰岛素的末期半衰期相比,所测试的临床前比较物的末期半衰期的值 显著更短。
尽管本发明的研究是在健康男性个体中进行,但预期将在其它患者群体中出 现类似的吸收特征和安全性概况;所述群体例如患有糖尿病的男性或女性患者、 患有癌症或慢性肾衰竭的男性或女性患者、儿童肾衰竭患者、预存自体程序中的 患者或计划择期手术的患者。
总之,经皮下投与的单一剂量的包含非天然编码氨基酸的聚乙二醇化胰岛素 应为安全的,并且被健康男性个体良好耐受。根据不利事件的相对发生率、临床 实验值、生命体征和身体检查结果,市售形式的胰岛素与包含非天然编码氨基酸 的聚乙二醇化胰岛素的安全性概况应相当。包含非天然编码氨基酸的聚乙二醇化 胰岛素向患者和医务工作者(healthcareprovider)潜在地提供巨大临床效用。
应了解,本文所述的实例和实施例仅用于说明性目的且所属领域的技术人员 将想到关于其的各种修改或改变并包括在本申请案的精神和权限以及随附权利要 求书的范围内。本申请案中所引用的所有公开案、专利、专利申请案和/或其它文 献都以全文引用的方式并入本文中以用于所有目的,所引用的程度就如同已个别 地指示各个公开案、专利、专利申请案和/或其它文献以引用的方式并入本文中以 用于所有目的。
表1:所引用的序列
SEQ ID NO: 序列名称 序列 1 胰岛素A链,氨基 酸序列 GIVEQCCTSICSLYQLENYCN 2 胰岛素B链,氨基酸 序列 FVNQHLCGSHLVEALYLVCGERGFFYTPKT 3 赖脯胰岛素A链, 氨基酸序列(优泌 乐) GIVEQCCTSICSLYQLENYCN 4 赖脯胰岛素B链,氨 基酸序列(优泌乐 ) FVNQHLCGSHLVEALYLVCGERGFFYTKPT 5 门冬胰岛素A链, 氨基酸序列(诺和 乐) GIVEQCCTSICSLYQLENYCN 6 门冬胰岛素B链,氨 基酸序列(诺和乐) FVNQHLCGSHLVEALYLVCGERGFFYTDKT 7 甘精胰岛素A链, 氨基酸序列(爱胰达 (Apidra)) GIVEQCCTSICSLYQLENYCN 8 甘精胰岛素B链,氨 基酸序列(爱胰达) FVkQHLCGSHLVEALYLVCGERGFFYTDeT 9 地特胰岛素A链, GIVEQCCTSICSLYQLENYCG
氨基酸序列(瑞和密 尔(Levemir)) 10 地特胰岛素B链,氨 基酸序列(瑞和密 尔) FVNQHLCGSHLVEALTLVCGERGFFYTDK 11 甘精胰岛素A链, 氨基酸序列(来得时 (Lantus)) GIVEQCCTSICSIYQLENYCG 12 甘精胰岛素B链,氨 基酸序列(来得时) FVNQHLCGSHLVEALYLVCGERGFFYTPKTRR 13 具有前导序列的全 长胰岛素氨基酸序 列 MALWMRLLPLLALLALWGPDPAAAFVNQHLCGSHL VEALYLVCGERGFFYTPKTRREAEDLQVGQVELGGG PGAGSLQPLALEGSLQKRGIVEQCCTSICSLYQLENYCN 14 无前导序列的全长 胰岛素氨基酸序列 FVNQHLCGSHLVEALYLVCGERGFFYTPK TRREAEDLQVGQVELGGGPGAGSLQPLAL EGSLQKRGIVEQCCTSICSLYQLENYCN
在毕赤酵母中表达的赖脯胰岛素的DNA序列
赖脯胰 岛素和 长度 (aa) 构象 长度 (bp) DNA序列 INS1 69 SEQ ID NO:3 4 KR- EEAEAEAEPK-B1-30-RRLQKR- A1-21 213 aagcgtgaggaggctgaggctgaggctgagcctaag ttcgtcaaccaacacttgtgcggttctcacttggttgaggccctttacttggtttgcggtgagcgtggtttcttctacaccaagcctact cgtcgtttacaaaagcgt ggtatcgttgagcaatgctgcacctctatctgctccttgtaccaattggagaactactgcaac taatga INS2 59 SEQ ID NO:35 KR-B1-30- RRLQKR-A1-21 183 Aagcgtttcgtcaaccaacacttgtgcggttctcacttggttgaggccctttacttggtttgcgggtgagcgtggtttcttctacaccaagcctact cgtcgtttacaaaagcgt ggtatc gttgagcaatgctgcacctctatctgctccttgtaccaattggagaactactgcaac taatga INS3 55 SEQ ID NO:36 KR-B1-30-KR-A1-21 171 aagcgtttcgtcaaccaacacugtgcggttctcacttggttgaggccctttacttggtttgcggtgagcgtggtttcttctacaccaagcctactaagcgt ggtatcgttgagcaatgctgcacctctatctgctccttg taccaattggagaactactgcaactaatga INS4 65 SEQ ID NO:37 KR- EEAEAEAEPK-B1-30-KR-A1-21 201 aagcgtgaggaggctgaggctgaggctgagcctaag ttcgtc aaccaacacttgtgcggttc tcacttggttggaggccctttacttggtttgcggtgagcgtggtttcttctacaccaagcctactaagcgt ggtatcgttgagcaatgctgcacctctatctgctccttgtaccaattggagaactactgcaac taatga