脂连蛋白变体 在先申请的交叉参考
本申请要求在先的2005年1月7日提交的美国临时申请号60/642,476、2005年2月3日提交的美国临时申请号60/650,411、2005年7月11日提交的美国临时申请号60/698,358、2005年9月26日提交的美国临时申请号60/720,768、2005年11月2日提交的美国临时申请号60/733,137的优先权,将它们完整引入本文作为参考。
【技术领域】
本发明一般涉及脂连蛋白(adiponectin)。更具体地,本发明涉及人脂连蛋白变体和具有改进的性质的其他C1q/TNF-α相关的蛋白质,所述改进的性质包括提高的重组蛋白表达水平、增强的溶解度或者可溶性表达和稳定性、较低的免疫原性,和改善的药物代谢动力学和/或药效动力学,以及制备此类变体和使用它们治疗疾病的方法。
背景技术
除了储存脂肪沉着体,脂肪细胞还分泌在哺乳动物中调节脂类和葡萄糖代谢中重要的一些细胞因子。这些所谓的“adipokines”包括脂连蛋白(“Ad”)、adipsin、瘦素和vaspin。在文献中,将脂连蛋白称作GBP28、ApM1、ACRP30、AdipoQ和OBG3。然而,不像其他adipokines,脂连蛋白的血清水平与肥胖症、胰岛素耐受性和缺血性心脏病负相关(Goldstein和Scalia(2004)The Journal of Clinical Endocrinologyand蛋氨酸abolism 89:2563-8,完整引入作为参考)。然而,正常人体中脂连蛋白的血清水平通常为2到10μg/ml,在肥胖或者糖尿病个体中循环Ad的水平显著降低。因此,已经提出Ad替代疗法作为逆转II型糖尿病中胰岛素耐受性和减轻处于危险的心脏病患者中血管动脉粥样硬化的可能的治疗。
已经表明Ad治疗动员葡萄糖和脂肪酸清除以及诱导正常和胰岛素耐受性组织中的胰岛素敏感性(Wu等人(2003)Diabetes 52:1355-63;Fruebis等人(2001)PNAS 98:2005-10;Berg等人(2002)TRENDS inEndocrinology and蛋氨酸abolism 13:84-9;都完整引入作为参考)。这些效应似乎是由于Ad诱导的骨骼肌和肝脏中转运蛋白和代谢性酶的活化。已知Ad刺激5’-AMP激活的蛋白质激酶(AMPK)、酰基辅酶A羧化酶(ACC)的磷酸化和随后的激活(Yamauchi等人(2002)Nature Medicine8:1288-95,完整引入作为参考),并且还激活类固醇激素受体的pPAR家族(Yamauchi等人(200)Journal of Biological Chemistry 278:2461-8,完整引入作为参考)。其他的研究已经表明Ad具有心脏保护和抗炎性质(Shimada等人(2004)Clinica.Chemica.Acta.344:1-12;Hug和Lodish(2005)Current Opinion in Pharmacology 5:129-34,都完整引入作为参考)。最近的研究表明脂连蛋白可以与一些生长因子相互作用并改变它们的活性,所述生长因子包括血小板衍生生长因子BB(PDGF-BB)、肝素结合的表皮生长因子样生长因子(HB-EGF)和碱性成纤维细胞生长因子(碱性FGF)(Wang等人(2005)Journal of Biological Chemistry280:18341-7,完整引入作为参考)。
Ad是30kD的糖蛋白,其由含有多个G-X-X-G重复的N-末端胶原样结构域和结构上类似于C1Q和TNF超家族成员的球形部分的C-末端结构域组成。至少两个蛋白酶剪切位点位于胶原和C1Q样结构域之间。在人血清中发现全长和蛋白酶剪切的形式。Ad的球形部分(“球形”Ad或者gAd)形成三聚体结构,而全长Ad(Ad)能够形成三聚体、六聚体和其他更高等级的寡聚体。位于胶原结构域(在所有已知的哺乳动物Ad中保守)的半胱氨酸残基的突变破坏了六聚体和更高等级的寡聚体的形成。
Ad的同源蛋白质包括,但不限于小鼠C1q/TNF-α相关的蛋白质1(CTRP1)、CTRP2、CTRP3、CTRP4、CTRP5、CTRP6和CTRP7。这些蛋白质的至少一种(CTRP2)能够刺激骨骼肌中的脂肪酸氧化,从而类似于Ad的功能性质(Wong等人(2004)Proc.Natl.Acad.Sci.101:10302-7,完整引入作为参考)。
在特定人群中发现了一些Ad多态性。表型的严重性取决于突变的位置。例如,G84R、G90S、Y111H和I164T突变由于不能形成在肝脏调节胰岛素敏感性中可能重要的更高级的寡聚体,而导致糖尿病和低脂连蛋白血症(Waki等人(2003)J.Biol.Chem.278:40352-63,完整引入作为参考)。功能上良性的多态性包括R221S和H241P。
基于它们的氨基酸序列,预测两种已知的Ad受体(AdipoR1和AdipoR2)含有7个跨膜α螺旋但是不与G偶联蛋白受体有关(Yamauchi等人(2003)Nature 423:762-9,完整引入作为参考)。尽管AdipoR1和AdipoR2是同源的(>67%同一性),但是它们与Ad和gAd的相对亲和力不同。AdipoR1主要在骨骼肌中表达,比结合Ad更高的亲和力结合gAd,而AdipoR2主要在肝脏中表达,优先结合Ad。在小鼠中的体内结果提示三聚体gAd在减轻重量和提高胰岛素敏感方面比Ad的六聚体和更高级寡聚体形式可能更有效(Yamauchi等人(2001)Nature Medicine 7:941-6,完整引入作为参考)。
【发明内容】
本发明提供了新的脂连蛋白变体,其经优化而具有更高水平的重组蛋白表达、提高的溶解度或者溶解表达和稳定性、更低的免疫原性和提高的药物代谢动力学和/或药效动力学。
因此,本发明描述了脂连蛋白变体,其包含对对应的野生型脂连蛋白在具有预定疏水性、预定极性、预定静电电位、蛋氨酸、芳族氨基酸、对应于SEQ ID NO:1的152位的半胱氨酸、影响野生型或者变体脂连蛋白的等电点的氨基酸、影响β折叠形成、螺旋帽化或者偶极相互作用或者其组合的氨基酸的位置上的一个或多个氨基酸修饰。该脂连蛋白变体与对应的野生型脂连蛋白相比显示出提高的稳定性、溶解度或者可溶性表达、表达产量、诱导5’-AMP-激活的蛋白质激酶(AMPK)的磷酸化的能力,或者其组合。
在一方面,本发明描述了包含变体人脂连蛋白肽的组合物。该变体包含式V(109)-V(110)-V(111)-F(112)-F(113-121)-V(122)-F(123-124)-V(125)-F(126-127)-V(128)-F(129-134)-V(135)-F(136-151)-V(152)-F(153-163)-F(164)-F(165-181)-V(182)-F(183)-V(184)-F(185-206)-V(207)-F(208-220)-F(221)-F(222-223)-V(224)-V(225)-F(226)-V(227)-F(228)-V(229)。V(109)选自野生型氨基酸V;变体氨基酸D、E、H、K、N、Q和R的任一种;和V109的缺失;V(110)选自:野生型氨基酸V;变体氨基酸D、E、H、K、N、Q、R和S的任一种;和V110的缺失;V(111)选自:野生型氨基酸Y和H;变体氨基酸D、E、N、R和S的任一种;和Y122的缺失;F(112)选自野生型氨基酸R和C;F(113-121)选自:野生型氨基酸序列SAFSVGLET;和S113、A114、F115、S116、V117、G118、L119、E120和T121任一个的缺失;V(122)选自:野生型氨基酸Y;变体氨基酸D、E、H、N、R和S的任一种;和Y122的缺失;F(123-124)选自:野生型氨基酸序列VT;和,V123和T124任一个的缺失;V(125)选自:野生型氨基酸I;变体氨基酸D、E、H、K、N、Q、R、S和T的任一个;和I125的缺失;F(126-127)包含野生型氨基酸序列PN;V(128)选自:野生型氨基酸M;和变体氨基酸A,D,E,H,K,N,Q,R,S,和T的任一个;F(129-134)包含野生型氨基酸序列PIRFTK;V(135)选自:野生型氨基酸I;和变体氨基酸D、E、H、K、N、Q和R的任一个;F(136-151)包含野生型氨基酸序列FYNQQNHYDGSTGKFH;V(152)选自:野生型氨基酸C;和变体氨基酸A、N和S的任一个;F(153-163)包含野生型氨基酸序列NIPGLYYFAYH;F(164)选自野生型氨基酸I和T;F(165-181)包含野生型氨基酸序列TVYMKDVKVSLFKKDKA;V(182)选自:野生型氨基酸M;和变体氨基酸A、D、E、K、N、Q、R、S、和T的任一个;F(183)包含野生型氨基酸L;V(184)包含野生型氨基酸F;和变体氨基酸D、H、K、N和R的任一个;F(185-206)包含野生型氨基酸序列TYDQYQENNVDQASGSVLLHLE;V(207)选自:野生型氨基酸V;和变体氨基酸D、E、H、K、N、Q、R、和S的任一个;F(208-220)包含野生型氨基酸序列GDQVWLQVYGEGE;F(221)选自野生型氨基酸R和S;F(222-223)包含野生型氨基酸序列NG;V(224)选自:野生型氨基酸L;和变体氨基酸D、E、H、K、N、Q、R和S的任一个;V(225)选自:野生型氨基酸Y;和变体氨基酸D、E、H、K、N、Q、R和S的任一个;F(226)包含野生型氨基酸A;V(227)选自:野生型氨基酸D;和变体氨基酸H、K和R的任一个;F(228)包含野生型氨基酸N;或者V(229)选自:野生型氨基酸D;和变体氨基酸H、K和R的任一个。
在一个实施方案中,所述变体含有选自如下的取代:122H;122S;125E;125H;125T;184H;207E;和207K。
在另一实施方案中,变体包含至少两个修饰,如取代。
在一些实施方案中,变体的溶解度或者可溶性表达提高至少n倍,其中n是2到2000之间的任何数字。例如,变体的溶解度或者可溶性表达提高至少30、100、300和1000倍。
在一些实施方案中,变体的表达产量提高至少n倍,其中n是2到10000之间的任何数字。例如,变体的表达产量提高至少2-、5-、10-、50-、100-、300-、500-、1000-、3000-和10000倍。
在一些实施方案中,变体诱导肌细胞中AMPK的磷酸化的能力提高至少30%或者100%。
对应的野生型脂连蛋白可以是人脂连蛋白(SEQ ID NO:1),变体可以包括在SEQ ID NO:1的109、110、115、122、123、125、128、130、132、135、150、152、160、164、166、171、173、175、182、184、205、207、211、213、215、224、225、227、229、或234位的一个或多个氨基酸修饰。备选地,对应的野生型脂连蛋白可以是非人脂连蛋白。
另一方面,本发明描述了包含编码上述脂连蛋白变体的多核苷酸的组合物。
本发明还包括包含变体脂连蛋白肽的组合物,所述变体脂连蛋白肽的溶解度或者可溶性表达提高至n倍,其中n是2到2000之间的任何数字。例如,变体的溶解度或者可溶性表达可以提高至少30、100、300和1000倍。
对Ad的特别优选的修饰包括但不限于,下面的取代:Y109D、Y109E、Y109H、Y109K、Y109N、Y109Q、Y109R、V110D、V110E、V110H、V110K、V110N、V110Q、V110R、V110S、Y111D、Y111E、Y111K、Y111N、Y111Q、Y111R、Y122D、Y122E、Y122H、Y122N、Y122R、Y122S、I125D、I125E、I125H、I125K、I125N、I125Q、I125R、I125S、M128A、M128D、M128E、M128H、M128K、M128N、M128Q、M128R、M128S、M128T、I135D、I135E、I135H、I135K、I135N、I135Q、I135R、C152A、C152N、C152S、M182A、M182D、M182E、M182K、M182N、M182Q、M182R、M182S、M182T、F184D、F184H、F184K、F184N、F184R、V207D、V207E、V207H、V207K、V207N、V207Q、V207R、V207S、L224D、L224E、L224H、L224K、L224N、L224Q、L224R、L224S、Y225D、Y225E、Y225H、Y225K、Y225N、Y225Q、Y225R、Y225S、D227H、D227K、D227R、D229H、D229K、D229R或者其组合。
通过阐明下面的描述,结合附图,本发明的上述和其他特征和得到和使用它们的方式将变得显而易见并且被最佳地理解。这些附图仅仅描绘了本发明的典型实施方案并且不因此限制其范围。
【附图说明】
图1显示了全长人脂连蛋白氨基酸序列(SEQ ID NO:I,Genbank检索号Q15848,残基1-244),胶原区用下划线标出。
图2显示了全长人脂连蛋白(SEQ ID NO:1)和胶原序列的比对。
图3显示了全长人、小鼠、大鼠、猕猴、狗、野猪、奶牛和鸡脂连蛋白的ClustalW比对。
图4是曲线图,以图阐述了氨基酸表面暴露和该氨基酸的相对疏水性之间的关系。
图5显示了含有34个单一氨基酸取代的gAd变体的SDS-PAGE分析。蛋白质在大肠杆菌中表达并且在去污剂存在下制备裂解物。
图6显示了含有所选的单个氨基酸取代的gAd变体的溶解度或者可溶性表达分析。蛋白质在大肠杆菌中表达并且在无去污剂的条件下制备裂解物。
图7显示了含有8个单一氨基酸和23个双氨基酸取代的gAd的SDS-PAGE分析。蛋白质在大肠杆菌中表达并且在去污剂存在下制备裂解物。
图8显示了含有所选的单个和两个氨基酸取代的gAd变体的溶解度或者可溶性表达分析。蛋白质在大肠杆菌中表达并且在无去污剂的条件下制备裂解物。
图9显示了SDS-PAGE,其含有来自天然和V207E/I125E gAd的无去污剂的可溶裂解物。
图10显示了小鼠C2C12肌管分化的相差时间过程图像。
图11显示了用gAd变体和对照对C2C12肌管的处理。
图12显示了用gAd变体处理分化的人肌细胞诱导AMPK磷酸化。
图13显示了球形脂连蛋白结构域(表19中第二种最低能量的序列溶液)的低能量核心设计的三维结构。暗灰色球棍描绘了天然构象中的野生型侧链(I164和V166),而亮灰色原子描绘了低能量氨基酸取代I164V和V166F。
图14显示了使用分子量2000的PEG和使用半胱氨酸-马来酰亚胺附着部分对脂连蛋白的聚乙二醇(PEG)位点的优化。使用500条避免自身附着的PEG链群体评估可能的附着位点。对gAd的每个位置绘出了不与gAd结构碰撞的链的百分比。对单体(上方图)和三聚体gAd结构描绘非碰撞链的百分比。
【发明内容】
为了可以更完全地理解本发明,在下面给出一些定义。这些定义意在包括语法上的等同物。
本文的“脂连蛋白”指主要在脂肪细胞中产生的多肽,并且其是图3中所示任一序列的直向同源物,包括天然存在的脂连蛋白的片段,特别是含有脂连蛋白的球形结构域的片段。
本文的“脂连蛋白变体”指功能上等同于脂连蛋白但是含有天然存在的脂连蛋白序列的修饰的多肽。
本文的“球形结构域”在Ad的背景中指C1q/TNF-α结构域并且不包括胶原结构域。该区域可以包括但不限于人Ad前体形式的残基108-244(SEQ ID NO:1,图1)。
“疏水残基”和语法等同物指缬氨酸、异亮氨酸、亮氨酸、甲硫氨酸、苯丙氨酸、酪氨酸、色氨酸和其功能等同物。
“极性残基”和语法等同物在本文中指天冬氨酸、天冬酰胺、谷氨酸、谷氨酰胺、赖氨酸、精氨酸、组氨酸、丝氨酸和其功能等同物。
本文的“蛋白质性质”指物理、化学和生物学性质,包括但不限于物理性质(包括分子量、流体动力学性质如回转半径、净电荷、等电点和光谱性质,如消光系数)、结构性质(包括二级、三级和四级结构元件)、稳定性(包括热稳定性、随着pH或者溶液条件的稳定性、贮存稳定性和对泛蛋白化、蛋白水解降解、或者化学修饰,如甲硫氨酸氧化、天冬酰胺和谷氨酰胺脱酰胺作用、侧链外消旋或者差向异构化和肽键水解的抗性或者敏感性)、溶解度(包括在多种条件下对团聚的敏感性、寡聚化状态和可结晶性)、动力学性质(包括柔性、刚性、折叠率、折叠机制、变构效应、和经历构象改变和相关运动的能力)、结合亲和性和特异性(对一种或多种分子,包括蛋白质、核酸、多糖、脂类和小分子的结合亲和性和特异性,并且包括亲和性和结合和解离率)、酶促活性(包括底物特异性;结合、反应,和解离速率;反应机理;和pH谱)、对合成修饰(包括PEG化和附着到其他分子或者表面)的顺从性、表达性质(如一种或多种表达宿主中的产率、可溶对包含体表达、亚细胞定位、被分泌的能力,和在细胞表面上展示的能力)、加工和翻译后修饰(包括蛋白水解加工、N-或者C-连接的糖基化、脂质化、硫酸化和磷酸化)、药物代谢动力学和药效学性质(包括皮下、肌内、经口或者肺递送后的生物利用率;血清半寿期、分布和清除机理和速率),和诱导改变的表型或者改变的生理的能力(包括免疫原性、毒性、发信号或者抑制信号传递的能力、刺激或者抑制细胞增殖、分化或者迁移的能力、诱导细胞凋亡的能力,和治疗疾病的能力)。
本文的“溶解度”和语法等同物指在特定条件(例如,pH、温度、任何缓冲成分的浓度、盐、去污剂、渗透物,等等)的溶液中,所希望的或者生理上合适的寡聚状态的蛋白质的最大可能的浓度。
本文中的“提高的溶解度”和语法等同物指在溶液中,所希望的或者生理上合适的寡聚状态的蛋白质的最大可能浓度的升高。例如,如果天然存在的蛋白质可以浓缩到1mM,并且变体可以在相同条件下浓缩到5mM,那么可以说变体具有提高的溶解度。在优选的实施方案中,溶解度增加至少2倍,特别优选增加至少5倍或者10倍。如本领域技术人员将明白的,溶解度是溶液条件的函数。对于本发明,应该在药学上可接受的溶液条件下评估溶解度。特别地,pH将在6.0到8.0,盐浓度将为50到250mM。可以包括额外的缓冲组分,如赋形剂;然而优选不需要白蛋白。
本文的“可溶性表达”和语法等同物指不存在去污剂时,制备的粗品上清液中靶蛋白质的量。例如,靶蛋白质在合适的表达系统中表达,收获细胞并在不存在去污剂时裂解,并通过标准方法制备粗品上清液。粗品上清液中靶蛋白质的量为表达的可溶蛋白质。
本文中“提高的可溶性表达”和语法等同物指不存在去污剂时,所制备的粗品上清液中变体蛋白质的量相对于亲本蛋白质增加。
“修饰”和语法等同物指对蛋白质或者核酸序列的一个或多个插入、缺失或取代。插入和缺失包括天然或者非天然存在的氨基酸和核苷酸,以及它们的功能等同物。
本文中的“天然存在的”或“野生型”或者“wt”和其语法等同物指在自然中发现的氨基酸序列或者核苷酸序列,包括等位基因变异。在优选的实施方案中,野生型序列是最优势的人序列。然而,野生型Ad核酸和蛋白质可以是较不占优势的人等位基因或者来自任一种生物的Ad核酸和蛋白质,所述生物包括但不限于啮齿动物(大鼠、小鼠、仓鼠、豚鼠等等)、灵长类、和农场动物(包括绵羊、山羊、猪、奶牛、马等等)。
本文的“表达产量”和语法等同物指在给定表达方案(即,特定表达宿主、转染方法、培养基、时间等等)下产生或者分泌的蛋白质的量,优选以mg/L或者PCD(皮克/细胞/天)表示。
本文中“提高的表达产量”和语法等同物指在给定组的表达条件下,相对于野生型或者亲本蛋白质,表达产量的增加。在优选的实施方案中,实现至少50%的提高,特别优选至少100%、5倍、10倍或者以上的提高。
如前面提到的,健康个体中内源Ad的血清水平通常为2到10μg/ml,其相对于其他血清蛋白质是相当大的量。如果这些量是治疗例如肥胖症或糖尿病的有效取代疗法所需的,那么将需要大量的高度可溶的、不易聚集的蛋白质。这将有助于Ad施用于患者并且将可能导致有效的产品生产。
本发明至少部分是基于如下出乎意料的发现:可以修饰脂连蛋白使得该多肽的物理性质和/或生物学活性得到改善。因此,本发明提供了与对应的野生型脂连蛋白相比,具有改善的物理性质(例如,稳定性、溶解度或者可溶性表达、和表达产量)和/或生物学活性(例如,诱导AMPK的磷酸化的能力)的脂连蛋白变体。该变体包含对对应的野生型脂连蛋白的一个或多个氨基酸修饰。所述修饰可以在下面的位置做出:
(1)具有预定的疏水性和暴露百分数的位置。可以如下述或者通过本领域公知的任一方法确定氨基酸的疏水性和暴露百分数。在优选的实施方案中,选择所暴露的疏水氨基酸的前10%用于修饰。
(2)具有预定极性的位置。极性残基的实例包括天冬氨酸、天冬酰胺、谷氨酸、谷氨酰胺、赖氨酸、精氨酸、组氨酸和丝氨酸。在一些实施方案中,用带电的极性残基取代脂连蛋白中天然存在的中性极性残基。
(3)具有预定的静电电位的位置。可以如下述或者通过本领域中公知的任一种方法确定氨基酸的静电电位。在优选的实施方案中,选择具有大于0.5千卡/mol或者小于-0.5千卡/mol的静电电位的氨基酸用于修饰。
(4)具有蛋氨酸的位置,例如,SEQ ID NO:1的40、128、168和182位。
(5)具有羟脯氨酸的位置,例如,SEQ ID NO:1的44、47、53、62、71、86、95和104位。
(6)具有芳族氨基酸的位置,例如,SEQ ID NO:1的46、49和94位。
(7)对应于SEQ ID NO:1的152位的半胱氨酸。
(8)具有PEG化位点的位置,例如,SEQ ID NO:1的108、109、110、120、127、133、136、137、139、141、146、170、179、180、184、186、188、189、191、192、196、202、204、206、207、208、218、220、221、223、224、225、226、227、229、240、243和244位。
(9)具有影响野生型或者变体脂连蛋白的等电点的氨基酸的位置。此类氨基酸可以通过本领域公知的任一种方法确定。此类氨基酸的实例包括天冬氨酸、谷氨酸、组氨酸、赖氨酸、精氨酸、酪氨酸和半胱氨酸。
(10)具有影响β折叠形成、螺旋帽化或者偶极相互作用的氨基酸的位置。此类氨基酸可以通过本领域公知的任一种方法确定。
用于提高稳定性或者可溶性表达的策略
多种策略可以用于设计具有提高的溶解度或者可溶性表达和表达产量的脂连蛋白变体。在优选的实施方案中,使用一种或多种下面的策略:1)通过用合适的极性残基取代一个或多个暴露于溶剂的疏水残基来减小疏水性,2)通过用带电的极性残基取代一个或多个中性极性残基增加极性特征,3)增加蛋白质稳定性,例如,通过促进疏水核心中的包装、增加β折叠形成倾向、提高螺旋帽化和偶极相互作用或者除去不利的静电相互作用的一种或多种修饰(增加蛋白质的稳定性可以通过减少易于聚集的部分折叠或者错误折叠状态的群体而提高溶解度或者可溶性表达),4)修饰可以影响蛋白质的等电点的一个或多个残基(即,天冬氨酸、谷氨酸、组氨酸、赖氨酸、精氨酸、酪氨酸和半胱氨酸残基)。当蛋白质的等电点等于周围溶液的pH时,蛋白质溶解度或者可溶性表达通常最低。因此,干扰蛋白质的等电点使其远离周围环境如血清的pH的修饰可以用于提高溶解度或者可溶性表达。此外,降低蛋白质的等电点的修饰可以提高注射部位吸收(Holash等人(2002)Proc.Nat.Acad.Sci.USA99:11393-8,完整引入作为参考),5)N-或者C-末端残基的截短,6)溶解度或者可溶性表达标签(例如,具有高溶解度或者可溶性表达的肽或者化学部分)的加入或者化学附着,7)PEG化,和8)导入糖基化位点。额外的策略可以包括使用定向进化方法以发现提高溶解度或者可溶性表达的变体(见例如,Waldo(2002)Curr Opin Chem Biol.7(1):33-8)。
提高表达产量的策略
多种核酸性质和蛋白质性质可以影响表达产量;进而,表达宿主和表达方案对产量有影响。这些参数的任一种可以经优化以提高表达产量。而且,如下文所述,通过掺入赋予提高的稳定性和/或溶解度或可溶性表达的一个或多个突变可以提高表达产量。此外,前结构域(pro-domain)和成熟结构域之间的相互作用可以影响折叠效率,并且因此还可以靶定前结构域用于修饰。
在备选实施方案中,如果表达是在真核系统中,那么可以使用下面的策略优化核酸性质以提高表达产量:1)置换有缺陷的Kozak序列,2)减少RNA的5’GC含量和二级结构,3)优化密码子选择,4)使用备选前导序列,5)包括嵌合内含子,或6)向mRNA的C-末端加入优化的多聚-A尾。在另一优选实施方案中,使用一种或多种下面的策略优化蛋白质性质以提高表达产量:1)优化信号序列,2)优化蛋白酶解加工位点,3)替换一个或多个半胱氨酸残基以便减少不当的二硫键形成,4)提高蛋白质折叠速率或者效率,或者5)增加蛋白质稳定性,特别是蛋白水解稳定性。在备选的优选实施方案中,使用备选的前结构域序列。例如,可以使用来自脂连蛋白-2的前结构域帮助脂连蛋白-4的表达(Wozney等人(1988)Science 242:1528-34,完整引入作为参考)。可以使用的前结构域包括但不限于来自任一TNF-α超家族序列前结构域的前结构域。前结构域可以以顺式或者反式表达。
用于降低免疫原性的策略
已经开发了一些方法用来调节蛋白质的免疫原性。在一些情况中,已经观察到PEG化通过空间阻断接近抗体限制位从而降低了产生中和性抗体的患者的比例(见例如,Hershfield等人(1991)PNAS 88:7185-9;Bailon等人(2001)Bioconjug.Chem.12:195-202;He等人(1999)LifeSci.65:355-68,都完整引入作为参考)。提高蛋白质治疗剂的溶解性质的方法也可以降低免疫原性,因为已经观察到聚集体比可溶性蛋白质更具免疫原性。用于降低免疫原性的其他方法包括除去潜在的MHC限制位和/或T细胞表位,和进行减少抗原性的修饰。
合理的PEG化
在另一优选实施方案中,将一个或多个半胱氨酸、赖氨酸、组氨酸或者其他反应性氨基酸设计成变体Ad或者gAd蛋白质以便掺入PEG化位点。还可能除去一个或多个半胱氨酸、赖氨酸、组氨酸或者其他反应性氨基酸以便防止在特定位置掺入PEG化位点。例如,在优选的实施方案中,为了最小化活性的损失,从Ad的三聚化界面和受体结合所需要的任何位点良好地除去所选择的非易变(non-labile)的PEG化位点。
蛋白质设计和工程化方法
可以用多种方法对将要产生具有提高的溶解度或者可溶性表达并且保留或者提高了调节细胞增殖、迁移、分化和凋亡的能力的Ad变体的修饰(即插入、缺失或者取代突变)的鉴定。这些方法包括但不限于,序列分布图分析(Bowie和Eisenberg(1991)Science 253:164-70)、旋转异构体文库选择(Dahiyat和Mayo(1996)Protein Sci5:895-903;Dahiyat和Mayo(1997)Science 278:82-7;Desjarlais和Handel(1995)Prot.Sci.4:2006-18;Harbury等人(1995)Proc.Nat.Acad.Sci.USA92:8408-12;Kono等人(1994)Proteins 19:244-55;Hellinga和Richards(1994)Proc.Nat.Acad.Sci.USA 91:5803-7);和残基对电位(Jones(1994)Prot.Sci.3:567-74),都完整引入作为参考。
在优选的实施方案中,分析Ad和相关蛋白质的一个或多个序列比对以鉴定可能与每个位置相容的残基。在优选的实施方案中,用PFAM、BLAST、或ClustalW比对算法产生多个物种Ad直向同源物、C1q/TNF-α超家族或者额外的CTRP家族成员、同源物、直向同源物或者共生同源物的比对。对于每个可变位置,可以将合适的取代定义为在同源序列中相同位置上观察到的那些残基。特别优选的取代是经常在同源序列中观察到的那些取代。
在特别优选的实施方案中,通过使用蛋白质设计自动化(ProteinDesign)()技术实现改进的Ad变体的合理设计;见美国专利号6,188,965;6,269,312;6,403,312;6,708,120;WO98/47089;USSNs 09/058,459;09/127,926;60/104,612;60/158,700;09/419,351;60/181,630;60/186,904;09/782,004;09/927,790;60/347,772;10/218,102;60/345,805;60/373,453;60/374,035;和PCT/US01/218,102,都完整引入作为参考。
技术结合可产生质量序列多样性(qualitys equencediversity)的计算机设计算法及其实验性高通量筛选来发现具有改进性质的蛋白质。计算机成分使用原子水平评分函数、侧链旋转异构体采样,和高等优化方法来准确地捕获蛋白质序列、结构和功能之间的关系。计算以蛋白质的三维结构和优化蛋白质的一种或多种性质的策略开始。然后技术探索包含靶定用于设计的位置上的所有恰当氨基酸(如果希望,包括非天然氨基酸)的序列空间。这通过采样所允许的氨基酸的构象状态并使用参数化和实验验证的函数对它们打分来完成,所述函数描述了控制蛋白质结构的物理和化学力。然后用强大的组合搜索算法在最初的系列空间(其可以由1050个序列或者更多序列组成)中搜索,快速返回预测满足设计标准的易处理数目的序列。该技术的有用的模式从组合序列设计跨越到最佳的单个位点取代的优先选择。
在优选的实施方案中,用一组离散的低能量的侧链构象代表每个极性残基(见例如,Dunbrack(2002)Curr.Opin.Struct.Biol.12:431-40,完整引入作为参考)。优选的力场可以包括描述范德瓦尔斯相互作用、氢键、静电相互作用和溶剂化等等的术语。
在优选的实施方案中,用盲端消除(DEE)鉴定具有最有利的能量的每个极性残基的旋转异构体(见Gordon等人(2003)J.Comput Chem.24:232-43,Goldstein(1994)Biophys.J.66:1335-40,和Lasters和Des蛋氨酸(1993)Prot.Eng.6:717-22,都完整引入作为参考)。
在备选实施方案中,可以用Monte Carlo结合DEE来鉴定具有有利的能量的极性残基。
在优选的实施方案中,进行一次或多次技术计算后,设计、通过实验构建变体蛋白质文库,并筛选所希望的性质。
在备选的优选实施方案中,用序列预测算法(SPA)设计与已知的蛋白质主链结构相容的蛋白质(Raha等人(2000)Protein Sci 9:1106-19和USSNs 09/877,695和10/071,859,都完整引入作为参考)。
文库选择
进行一次或多次上述计算后,可以提出包含一个或多个优选的修饰的文库。可以通过实验制备所得文库并筛选文库来证实一个或多个变体具有希望的性质。在优选的实施方案中,文库包括使用至少一个上述计算鉴定的优选的点突变。
在备选实施方案中,文库是组合物文库,表示该文库包含在每个可变位置上优选的残基的所有可能的组合。例如,如果允许位置3和9改变,在位置3的优选选择是A、V和I,在位置9的优选选择是E和Q,那么文库包括下面的六个可变序列:3A/9E、3A/9Q、3V/9E、3V/9Q、3I/9E、和3I/9Q。
在备选实施方案中,在主gAd序列中进行文库构建。N-末端截短点可以在包括但不限于100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125和126的位置上。
为每个暴露的疏水位置鉴定合适的极性残基
在优选的实施方案中,将溶剂暴露的疏水残基用结构上和功能上相容的极性残基替换。丙氨酸和甘氨酸可以作为合适的取代,使其构成疏水性的降低。此外,增加具有极性特征的突变,如Phe向Tyr的突变,和降低疏水性的突变如Ile向Val的突变是合适的。
在优选的实施方案中,通过分析Ad的三维结构或者模型鉴定Ad中溶剂暴露的疏水残基。在优选的实施方案中,使用本领域中已知的多种方法的任一种计算溶剂可接近的表面面积。在优选的实施方案中,溶剂可接近的表面面积与疏水性指数组合。在优选的实施方案中,通过将残基的部分溶剂暴露乘以该氨基酸氨基类型的Fauchere和Pliska疏水性指数(Fauchere和Pliska(1983)Eur.J.Med.Chem.18:369-75,完整引入作为参考)来计算每个残基的疏水性暴露指数(HEI)。在优选的实施方案中,选择具有正HEI的残基用于修饰。
在优选的实施方案中,根据上述标准选择用于修饰的位置和变体,然后根据提高的表达水平,根据经验来选择通过实验产生的优选的变体。
在优选的实施方案中,将优选的合适的极性残基定义为这样的极性残基:1)其在最佳的旋转异构体构型中的能量(如使用技术确定的)比该位置上暴露的疏水残基的能量更有利和2)其在最佳的旋转异构体构型中的能量是在位置上所有极性残基的一组能量中最有利的。
在优选的实施方案中,通过技术计算并通过序列比对数据,认为文库中包括的每个可变位置上的极性残基是合适的。备选地,通过技术计算并通过序列比对数据,认为文库中包括的一个或多个极性残基是合适的。
对Ad的特别优选的修饰包括但不限于下面的取代:Y109D、Y109E、Y109H、Y109K、Y109N、Y109Q、Y109R、V110D、V110E、V110H、V110K、V110N、V110Q、V110R、V110S、Y111D、Y111E、Y111K、Y111N、Y111Q、Y111R、Y122D、Y122E、Y122H、Y122N、Y122R、Y122S、I 125D、I 125E、I125H、I125K、I125N、I125Q、I125R、I125S、M128A、M128D、M128E、M128H、M128K、M128N、M128Q、M128R、M128S、M128T、I135D、I135E、I135H、I135K、I135N、I135Q、I135R、C152A、C152N、C152S、M182A、M182D、M182E、M182K、M182N、M182Q、M182R、M182S、M182T、F184D、F184H、F184K、F184N、F184R、V207D、V207E、V207H、V207K、V207N、V207Q、V207R、V207S、L224D、L224E、L224H、L224K、L224N、L224Q、L224R、L224S、Y225D、Y225E、Y225H、Y225K、Y225N、Y225Q、Y225R、Y225S、D227H、D227K、D227R、D229H、D229K、D229R,和其组合。
本领域技术人员将认识到可以应用上面的取代来优化Ad的全长和片段以及用于修饰非人脂连蛋白直向同源物。
本发明还提供了包含编码上述脂连蛋白变体的序列的多核苷酸(DNA或者RNA)。
本发明的脂连蛋白变体和多核苷酸可以如下述制备或者通过本领域技术人员公知的任一种化学合成或者基因工程方法制备。本发明的多核苷酸可以用于产生本发明的脂连蛋白变体,其又可以用于产生抗体。
可以将本发明的脂连蛋白变体和多核苷酸掺入药物组合物中。此类组合物通常包括脂连蛋白变体或多核苷酸和药学可接受的载体。配制药物组合物使其与它的预期施用途径相容。见例如美国专利号6,756,196,完整引入作为参考。施用途径的实例包括肠胃外,例如,静脉内、皮内、皮下、经口(例如,吸入)、经皮(局部)、经粘膜和直肠施用。用于肠胃外、皮内或者皮下应用的溶液剂或者混悬剂可以包括下面的组分:无菌稀释剂,如注射用水、盐溶液、不挥发油、聚乙二醇、甘油、丙二醇或者其他合成的溶剂、抗细菌剂,如苯甲醇或者对羟基苯甲酸甲酯,抗氧化剂,如抗坏血酸或者亚硫酸氢钠、螯合剂,如乙二胺四乙酸,缓冲剂,如乙酸盐、柠檬酸盐,或者磷酸盐,和用于调节张力的试剂,如氯化钠或者葡萄糖。可以用酸或碱,如盐酸或者氢氧化钠调节pH。肠胃外制剂可以封装在由玻璃或者塑料制造的安瓿、一次性注射器或者多剂量瓶中。
在一个实施方案中,将本发明的脂连蛋白变体和多核苷酸与载体配制,所述载体将保护脂连蛋白变体和多核苷酸免于从身体快速清除,如控释制剂,包括植入物和微囊化的递送系统。可以使用生物可降解的、生物相容的聚合物,如乙烯乙酸乙烯酯、聚酐、聚乙醇酸、胶原、聚原酸酯和聚乳酸。用于制备此类制剂的方法将是本领域技术人员显而易见的。所述材料还可以从Alza公司和Nova制药公司商购得到。脂质体混悬液(包括用针对病毒抗原的单克隆抗体靶定受感染的细胞的脂质体)也可以用作可药用载体。这些可以根据本领域技术人员已知的方法制备,如美国专利号4,522,811所述,将其完整引入作为参考。
以剂量单位形式配制口服或者肠胃外组合物以简化施用和剂量的均匀性是有利的。本文使用的“剂量单位形式”指适于作为将治疗的受试者的单一剂量的物理上分散的单位,每个单位含有预定量的活性化合物,所述量经计算与所需要的药物载体结合产生所希望的治疗效果。
药物组合物可以与施用说明书一起包括在容器、包装或者分配器中以形成包装的产品。例如,包装产品可以包含容器、有效量的本发明的脂连蛋白变体或者多核苷酸,和伴随容器的插页,其指出施用该化合物用于治疗脂连蛋白相关的状况。
治疗方法
本发明另外提供了通过对需要其的受试者施用有效量的上述组合物治疗脂连蛋白相关的状况的方法。术语“治疗”定义为对受试者施用一种物质,目的是治疗、减轻、缓解、补救、预防或者改善病症、病症的症状、病症继发的疾病状态或者对该病症的倾向。本文使用的“受试者”指人和非人动物,包括所有脊椎动物,例如,哺乳动物,如非人灵长类(尤其高等灵长类)、绵羊、狗、啮齿类(例如,小鼠或大鼠)、豚鼠、山羊、猪、猫、兔、奶牛和非哺乳动物,如鸡、两栖类、爬行动物,等等。在优选的实施方案中,受试者是人。在另一实施方案中,受试者是实验动物或适于作为疾病模型的动物。候选受试者的鉴定可以由受试者或卫生保健专业人员判断,并且可以主观的(例如,意见)或者客观的(例如,通过测试或者诊断方法可测量的)。“有效量”是能够在所治疗的受试者中产生医学上希望的结果的组合物的量。医学上希望的结果可以是客观的(即,通过一些测试或者标记物可以测量,例如,基因的降低或者升高的表达)或者主观的(即,受试者给出效果的指示或者感觉)。治疗方法可以单独或者与其他药物和/或疗法结合进行。
在一种体内方法中,对受试者施用包含本发明的脂连蛋白变体的组合物。通常,经口、静脉内(i.v.)输注或者注射或者皮下植入、肌内、鞘内、腹膜内、直肠内、阴道内、鼻内、胃内、气管内或者肺内施用。所需的剂量取决于施用途径的选择、制剂的选择、受试者疾病的性质、受试者的大小、体重、表面积、年龄、和性别、施用的其他药物,和主治医生的判断。合适的剂量在0.01-100.0mg/kg范围内。考虑到可用的化合物的多样性和不同施用途径的不同效率,将预期所需的剂量具有很大差异。例如,将预期经口施用比静脉内注射需要更高的剂量。这些剂量水平的差异可以使用如本领域公知的标准经验优化途径来调节。将组合物封装在合适的递送载体(例如,聚合物微粒或者可植入的装置)可以提高递送、尤其经口递送的效率。
在一些实施方案中,对受试者使用多核苷酸如DNA和RNA。可以通过例如使用本领域已知的聚合的生物可降解的微粒或者微囊可以递送多核苷酸。实现核酸的摄入的另一种途径是使用通过标准方法制备的脂质体。多核苷酸可以单独掺入到递送载体中或者与组织特异性或者肿瘤特异性抗体共同掺入。备选地,可以制备由通过静电或者共价力连接到聚-L-赖氨酸的多核苷酸组成的分子缀合物。聚-L-赖氨酸结合到配体,该配体可以结合到靶细胞上的受体。“裸DNA”(即没有递送载体)还可以递送到肌内、皮内或者皮下部位。多核苷酸的优选的施用剂量为约106到1012个拷贝的多核苷酸分子。
在相关多核苷酸(例如,表达载体)中,编码有义或者反义RNA的核酸序列有效连接到启动子或者增强子-启动子组合。合适的表达载体包括质粒和病毒载体,如疱疹病毒、逆转录病毒、痘苗病毒、减毒的痘苗病毒、金丝雀痘病毒、腺病毒和腺伴随病毒,等等。
在优选的实施方案中,脂连蛋白或者球形脂连蛋白或者全长或者球形脂连蛋白的变体将单独或者与疗法组合使用,用于治疗代谢疾病,包括但不限于,肥胖症和代谢综合征(Moller和Kaufman(2005)Ann.Rev.Med.56:45-62,完整引入作为参考)。因此,本发明的脂连蛋白变体可以用于治疗肥胖症、胰岛素耐受性、葡萄糖耐受不良、高血压、血脂异常(高甘油三酸酯血和低HDL胆固醇水平)、冠心病、和糖尿病。此外,在这些治疗方式中,脂连蛋白或者球形脂连蛋白可以与下面的物质组合使用:胰岛素或者胰岛素类似物、PPAR-激动剂,包括但不限于TZD或者fibrate类药物、磺酰脲类药物的任一成员、胰岛素敏化剂二甲双胍、GLP-1拮抗剂药物或者食欲抑制剂,如奥利斯特、rimonobant或者其他饱满感诱导物质。脂连蛋白和这些额外物质任一种的组合可以提高两种药物,特别与胰岛素的组合疗法的治疗效果。
下面的实施例意在阐明但不限制本发明的范围。这些实施例不意在将本发明限制到任何具体应用或者操作理论。尽管此类实施例是可能使用的典型实施例,但是可以备选地利用本领域技术人员已知的其他方法。实际上,本领域技术人员可以基于本文的教导不用过度实验就可以容易地设想和产生其他实施方案。对于本发明中讨论的所有位置,编号是根据全长人脂连蛋白,如图1中所列。
实施例1:Ad胶原区的同源性建模
将胶原的晶体结构(Protein Data Bank条目1K6F)用作模板来产生随后的计算所需的三聚化人Ad胶原区的模型。用本领域公知的方法产生人同源性模型。
实施例2:鉴定Ad胶原区中暴露的疏水残基
分析Ad胶原区结构以鉴定暴露于溶剂的疏水区。使用Lee和Richards((1971)J.Mol.Biol.55:379-400,完整引入作为参考)的方法,用1.4(埃)的附加半径计算每条链的每个残基的绝对的和部分溶剂暴露的疏水表面积。在表1中列出了所有三条链的平均值。
通过将残基的部分溶胶暴露乘以该氨基酸残基类型(Fauchere和Pliska(1983)Eur.J.Med.Chem.18:369-75,完整引入作为参考)的Fauchere和Pliska疏水性指数计算每个残基的疏水性暴露指数(HEI)并在图1中列出。
将Ad胶原区域中溶剂暴露的疏水残基定义为具有至少50(平方埃)暴露于疏水表面区域和大于0.4的HEI值的疏水残基。
实施例3:基于Ad直向同源物比对鉴定备选的极性残基
从NCBI得到小鼠(Genbank检索号Q60994)、大鼠(Genbank检索号NP653345)、猕猴(Genbank检索号AAK92202)、狗(Genbank检索号NP001006645)、野猪(Genbank检索号NP9995 35)、奶牛(Genbank检索号NP777167)和鸡(Genbank检索号AAV48534)直向同源Ad序列,使用ClustalW算法(Higgins等人(1994)Nucleic Acids Res.22:4673-80,完整引入作为参考)与人序列(Genbank检索号Q15848,SEQ ID NO:1)比对并在图3中图解。存在于这些物种中SEQ ID NO:1的残基号43-97的所有备选氨基酸类型在表2中列出,从这些鉴定了可能的极性残基。
实施例4:Ad胶原区中高静电电位区域的鉴定
每个氨基酸周围的局部静电环境可以促进蛋白质的总体稳定性。理想地,例如,如果带负电荷的氨基酸(例如,中性pH下的天冬氨酸)位于正静电电位的环境中和反之亦然,那么赋予稳定性。例如,如果天冬氨酸残基位于负电位的局部环境中,那么将其用带正电的残基或者中性极性残基取代可以有利地稳定蛋白质。当然,该取代取决于技术可以解释的许多结构因素。检查高静电电位的区域可以指向蛋白质的需要最优残基取代以提高总体蛋白质稳定性的区域。
在Ad胶原区域三聚体的背景中,使用Debye-Huckel方程确定Ad胶原区域中每个位置的静电电位。在三条链的任一条中具有大于0.5或者小于-0.5的静电电位的位置在表3中列出;在这些位置的修饰可以赋予增加的稳定性或者受体结合特异性。在野生型氨基酸的静电电位和电荷相一致的位置上补偿突变是不必要的;该信息在表3中记录。
实施例5:Ad中甲硫氨酸的替换以提高稳定性
尽管所生产的蛋白质治疗剂的氧化可以依赖于制剂和储存调节(例如,温度和pH),但是氧化导致的异质性可以不利地影响临床功效和安全性。Ad含有40、128、168和182位的甲硫氨酸残基。除去可以降低制剂依赖的异质性和提高贮存稳定性。在优选的实施方案中,Ad蛋氨酸残基被包括但不限于ALA、ARG、ASN、ASP、GLN、GLU、HIS、ILE、LEU、LYS、SER、THR或VAL的残基取代。
实施例6:Ad胶原区中羟脯氨酸的取代以提高细菌表达
胶原相关的结构基序具有作为它们的基础的氨基酸序列图式...[GXY][GXY][GXY]...,其中X和Y可以是氨基酸或者亚氨基酸。人胶原对Y位的PRO的不同的偏爱。通常,Y位上PRO通过氧化成羟脯氨酸翻译后修饰。相比,在细菌胶原中,Y位被THR或者GLN而不是PRO优先占据(Rasmussen等人(2003)J.Biol.Chem.278(34):32313-6,完整引入作为参考),弥补了细菌中羟化反应的缺乏。在表4中,列出了Ad胶原区中的羟脯氨酸,以及合适的取代以提高细菌表达、稳定性和溶解度或者可溶性表达。
实施例7:取代Ad胶原区中的[GXY]或者[GXYGX’Y’]重复以提高稳定性
宿主-客体实验已经发现下面的序列基序在胶原中特别稳定:[GPR]、[GER]、[GPA]、[GDR]、[GKD]、[GEK]、[G_KGD_]、[G_KGE_]、[GE_G_K]、[G_KG_E]、[G_LGL_]、[GL_GL_](Per s ikov等人(2005)J.Biol.Chem.280(19):1934 3-9),其中“_”符号表示任一氨基酸或者亚氨基酸的占位符。在优选的实施方案中,在Ad胶原区中进行一个或多个氨基酸取代以产生一个或多个所列的稳定化基序。
实施例8:取代非球形Ad中芳族氨基酸以提高稳定性
已经发现芳族氨基酸(F,H,W,Y)去稳定胶原三股螺旋(Persikov等人(2005)J.Biol.Chem.280(19):19343-9,完整引入作为参考)。在表5中,列出了Ad胶原区中的芳族氨基酸,以及用于提高稳定性的合适的取代。
实施例9:特别优选的取代
在特别优选的实施方案中,从表6做出的氨基酸取代。
实施例10:Ad球形区的同源性建模
鼠gAd的晶体结构(Protein Data Bank条目1C3H,残基111-247)用作模板来产生随后的如上述的文库计算所需的人模型。图3显示了鼠和人Ad序列之间的序列比对。环重建不是必要的,因为比对表明在两个物种的球形结构域之间不存在插入或者缺失。用算法产生人同源性模型。
实施例11:Ad球形区中暴露的疏水残基的鉴定
分析gAd结构以鉴定溶剂暴露的疏水残基。用1.4(埃)的附加半径使用Lee和Richards((1971)J.Mol.Biol.55:379-400,完整引入作为参考)的方法计算每条链的每个残基的绝对的和部分溶剂暴露的疏水表面积。在表1中列出了所有三条链的平均值。在表7中列出了所有三条链的平均值。图4概述了gAd残基中每个位置的HEI。表8列出了具有最高HEI值的一小组表面暴露的疏水氨基酸并且为每个氨基酸提出了备选的极性残基。
如实施例2中所述计算每个残基的疏水性暴露指数(HEI)并且也在表7中列出。为了鉴定最可能影响溶解度或者可溶性表达的位置,将人gAd中溶剂暴露的疏水残基定义为具有疏水残基,其具有至少50(平方埃)暴露的疏水表面积和大于0.4的HEI值。
实施例12:基于Ad直向同源物比对的备选极性残基的鉴定
如实施例3中所述的将直向同源Ad序列与人序列(Genbank检索号Q15848,SEQ ID NO:1)比对。存在于这些物种中SEQ ID NO:1的残基号109-225上所有备选氨基酸类型在表9中列出。
从这些鉴定了可能的极性残基。
实施例13:鉴定对Ad的优选取代以提高溶解度或者可溶性表达
进行技术计算以鉴定与人Ad结构相容的备选残基。在每个可变位置,对每个野生型残基和具有降低的疏水或者增加的极性特征的备选残基计算能量。使用在实施例10中产生同源性来源的人gAd三聚体进行计算。
首先,对模型沿着每个单体链独立地运行点突变计算;不施加三聚体对称来限制相同等级次序的氨基酸。每个备选氨基酸在其最有利的旋转异构体构象中的能量与野生型处于结晶学观察到的旋转异构体构象的能量比较;表10中所有报导的能量为[E(最低能量变量)-E(后继变量)]。在一些情况中,野生型残基不展示出最低能量。因为在这些位置的wt残基是表面暴露的疏水氨基酸并且可能在能量上失去稳定,该结果并不令人惊奇。在表10中仅仅列出了显示出2.0千卡/mol最低能量氨基酸以内的能量的极性氨基酸。列出了来自所有三个三聚体链的结果并且在表11中组合成备选极性残基的优选列表。在优选的实施方案中,这些取代应用在单个位置。在更优选的实施方案中,在多个位置同时进行取代。然而,将对于三维空间中接近的位置进行的取代的能量结合可以限制一些同时取代的组合。
实施例14:鉴定gAd中的高静电电位区域
在gAd三聚体背景下,使用Debye-Huckel方程确定gAd中每个位置上的静电电位。在表12中列出了三条链任一条中静电电位大于0.5或者小于-0.5的位置;这些位置上的修饰可以赋予增加的稳定性或者受体结合特异性。在优选的实施方案中,将D227和D229(平均电位分别为-0.5和-0.6)用更优选的带正电荷的氨基酸替换。用技术将D227和D229用ARG、HIS(带正电的假定公式低于组氨酸的约6.0的pKa)或者LYS秩代入。将处于它的最有利的旋转异构体构象的每个带正电的氨基酸的能量与能量上最有利的残基的能量比较;表13中所有报导的能量为[E(最低能量变量)-E(后继变量)]。所有报导的能量在1.5千卡/mol最低能量氨基酸以内。在优选的实施方案中,将D227和/或D229用包含但不限于ARG、HIS和LYS的组取代。
实施例15:gAd中自由半胱氨酸的替换
Ad的球形部分在152位含有一个自由的半胱氨酸。尽管C152不暴露于晶体结构中的溶剂(所有三条链中溶剂可接近的表面面积平均为1.1),但是该残基位于外部环中并且可以具有局部柔性。在优选的实施方案中,除去该半胱氨酸可以降低非特异性二硫键形成和聚集,并且提高总体蛋白质贮存稳定性。
将处于最有利的旋转异构体构象中的每个备选氨基酸的能量与野生型半胱氨酸残基的能量比较;表14中所有报告的能量为[E(半胱氨酸)-E(后继变量)]。在该情况中,野生型残基显示出最低能量。仅仅列出了显示出能量在5.0千卡/mol最低能量氨基酸以内的氨基酸。在优选的实施方案中,将C152用包含但不限于ALA、ASN、SER、THR和VAL的组替换。
实施例16:替换gAd中甲硫氨酸以提高稳定性
Ad的球形部分含有三个甲硫氨酸残基(128、168和182),它们的两个暴露于溶剂(128和182的在所有三条链中平均的溶剂可接近的表面积分别为46.5和43.7)并且可能易于氧化。因此,除去这些可以减少制剂依赖性异质性和提高贮存稳定性。
将处于最有利的旋转异构构象的每个备选氨基酸的能量与能量上最有利的残基的能量比较;表15中所有报告的能量为[E(最低能量变量)-E(后继变量)]。仅仅列出了显示出能量在4.0千卡/mol最低能量氨基酸以内的氨基酸。在优选的实施方案中,将蛋氨酸128和182用包含但不限于ALA、ARG、ASN、ASP、GLN、GLU、HIS、LYS、SER或THR的组替换。
实施例17:鉴定对Ad的优选的成对取代以提高溶解度或可溶性表达
如上文讨论的,在三维空间接近的位置进行的取代的相互作用能量可以限制有利的氨基酸组合的身份。在优选的实施方案中,鉴定了包含实施例11中描述并且位于6球体内的一组表面暴露的疏水残基的位置并使用技术进行同时设计和优化。对于上述位置109、110、111、122、125、135、184、207、224、225,下面的三组是相互位于6球体内的残基簇:1)Y109、V110和V111,2)Y122和I125,和3)L224和Y225。剩余的位置(135,184和207)不位于实施例11中鉴定的任一其他表面暴露的疏水残基的6内。将处于最有利的旋转异构体构象的每个备选氨基酸的能量与能量上最有利的残基的能量比较;表16-18中的所有报导的能量为[E(最低能量变量组合)-E(后继变量组合)]。在计算中仅仅考虑极性氨基酸并且仅仅列出了显示出能量在2.0千卡/mol最低能量氨基酸取代的氨基酸组合。如其他实例中,对链A、B和C列出了差别能量。通过其中所列的取代在能量上有利的链的数目对残基组合分类。在优选的实施方案中,选择在三条链的至少一条链中能量上有利的取代组合。在更优选的实施方案中,选择在三条链的两条中有利的取代。在进一步优选的实施方案中,选择在所有三条链中有利的取代。
实施例18:用于提高稳定性的对gAd的核心设计
优化蛋白质治疗剂的核心内的堆积相互作用可能提高热稳定性、减少聚集、增加贮存架存期和改善药代动力学(Luo等人(2002)Proteins11:1218-26,完整引入作为参考)。将埋入的疏水残基(在所有三条链上平均<5溶剂可接近的表面面积)鉴定为潜在的核心残基。位于三聚体界面的疏水残基排除在考虑之外。埋入的核心残基的第一个壳定义为,但不限于,F115、V123、I130、F132、F150、F160、I164、V166、V171、V173、L175、L205、V211、L213、V215和F234。使用技术对这16个残基同时进行优化。仅仅考虑下面疏水残基的取代:F、I、L、V和W。在优选的实施方案中,认为所有极性氨基酸是能量上合适的取代。前100个序列解答在表19中列出并且通过它们相对于最低能量序列变量的能量排序(E(最低能量变量组合)-E(后继变量组合))。解答#2(I164V/V166F)的能量比天然序列低~2.5千卡/mol并且在图13中描绘;用PHE取代V166需要从位置164失去甲基。在另一优选实施方案中,在计算中可以包括额外的埋入残基,如残基V117、L119、I154和L238。在另一优选实施方案中,可以在单个核心位置或者组合进行优化。
实施例19:gAd的合理PEG化以改善药物动力学和药效动力学
本发明的方法已经用于基于实施例10中产生的原子坐标选择gAd中最佳的PEG化位点(见图1)。对于合理的PEG化分析,集中在A链。
首先分析模拟数据以鉴定具有高偶联效率的位点。对于PEG2000,认为大于20%的模拟的PEG链在自由状态是非碰撞的位点是附着的最佳位点(见图14,上图)。这些位点包括A108、Y109、V110、E120、N127、T133、F136、Y137、Q139、N141、S146、D170、D179、K180、F184、Y186、Q188、Y189、E191、K192、Q196、L202、H204、E206、V207、G208、D218、E220、R221、G223、L224、Y225、A226、D227、D229、Y240、T243和N244。
进一步筛选预测的高偶联效率位点以鉴定当受体结合时,这些位点的哪些保留PEG运动范围。对于PEG2000,大于20%的模拟的PEG链在结合状态是非碰撞的位点是优选的(见图14)。这些位点包括A108、Y109、N127、T133、N141、S146、D179、K180、E206、V207、G208、E220、R221、G223、L224、Y225、D227、T243和N244。对于PEG2000,大于30%的模拟的PEG在结合状态不碰撞的位点是特别优选的。这些位点包括A108、Y109、S146、D179、E220、R221和L224。
在优选的实施方案中,在这些或者其他位置任一个上位点特异性PEG化将需要将原有氨基酸用合适的氨基酸如半胱氨酸替换或者导入非天然氨基酸,如对-乙酰基-L-苯丙氨酸。
在另一优选实施方案中,二价PEG可以用于在两个gAd分子之间形成键。这可以置换胶原样结构域并且形成两个三聚体gAd单位的六聚体gAd单位。
实施例20:具有增强溶解度或者可溶性表达的氨基酸取代的球形脂连蛋白的构建和表达
用标准分子生物学方法构建球形脂连蛋白变体的表达文库。简言之,将gAd cDNA(编码氨基酸110-244)亚克隆到细菌表达载体pET-17b中。使用标准方法进行位点定向诱变以产生表20中所列的34个单一氨基酸取代变体。
我们使用标准蛋白质表达和分析方法表达表20中所列的单个氨基酸gAd变体。简言之,我们在BL21Star(DE3)细胞中产生了gAd变体的菌落的新鲜菌苔,并且收获整个菌苔并用于为每个克隆接种50mL起始培养物。培养物在37℃生长直到约1.5小时后它们达到0.6的光密度(OD600)。将培养物冷却到室温,用0.5mM IPTG诱导,并在设置到室温的摇床中继续培养数小时。收获培养物,测量OD600,并通过在6000rpm(转/分钟)离心15分钟制备细菌沉淀物。丢弃上清液并用BugBuster HT(专有的含有去污剂的细菌裂解试剂)溶解沉淀物。使用标准电泳方法通过SDS-PAGE分析可溶和不溶的裂解物级分。
图5描述了上样34中单个氨基酸取代变体的等量的可溶和不溶级分的9个SDS-PAGE凝胶。SDS-PAGE上样如表21中所示。球形脂连蛋白是分子量为~15kD的134个氨基酸的肽。在图5中,gAd通过左手页边上的箭头突出显示。
当在这些含有去污剂的条件(即,BugBuster)下裂解表达gAd的细胞时,发现天然gAd<10%可溶(图5,泳道12-13和40-41)。我们鉴定了在这些表达和裂解条件下具有提高的蛋白质溶解度或者可溶性表达的一些变体。变体Y122H(图5,泳道66和75),Y122S(图5,泳道22-23),I125E(图5,泳道32-33),I125H(图5,泳道42-43),I125T(图5,泳道50-51),F184H(图5,泳道69-70),V207E(图5,泳道16-17),和V207K(图5,泳道26-27)都具有等于或者在许多情况下远大于天然gAd的溶解度或者可溶性表达。
实施例21:不存在去污剂的条件下选择球形脂连蛋白单个氨基酸取代变体的溶解度或者可溶性表达分析
如从上述试验性表达研究判断的,基于它们的提高的溶解度性质选择变体Y122H、Y122S、I125E、I125H、I125T、F184H、V207E和V207K。为了阐明这些变体具有真实提高的溶解度,必须测量在不存在去污剂时表达这些蛋白质的细菌溶解时产生的可溶蛋白质的量。认为不存在去污剂时的溶解度是可溶蛋白质的更严格的测量并且它使得可以进行以后的下游方法改进并且可以导致流水线生产方法。
如上述表达变体,只是容器体积放大10倍(2000mL瓶中500mL)。在4℃过夜诱导后,通过离心收获细胞并将沉淀物在-80℃保存。将细胞沉淀与无去污剂的裂解缓冲液(20mM BisTris pH 6.0,1mM EDTA,0.5mM DTT)混合并通过超声破碎裂解。通过高速离心使所得材料澄清,并将得到的澄清的可溶和不可溶级分体积归一化并用SDS-PAGE分析。该方法允许确定总蛋白质表达/产量以及溶解度的提高。图6显示了含有天然gAd、空载体(pET-17b)或者所选变体的可溶和不溶级分的三个SDS-PAGE凝胶。如表22所述的上样凝胶;图的左手边上的箭头指向gAd对照。
当在这些无去污剂的条件下裂解表达gAd的细胞时,发现天然gAd几乎是不溶的(图6,泳道76-78,85-86,和99-A)。不存在去污剂时,测试的所有变体都具有显著提高的溶解度。在该方面特别有利的是取代I125E、I125T和Y122H。此外,因为这些样品是体积归一化的,所以我们鉴定了许多具有显著提高的蛋白质表达产量的变体。变体F184H、I125H和V207E对增加gAd蛋白质产量具有最大的效果。
实施例22:双变体球形脂连蛋白蛋白质的构建和表达分析
将具有增加的溶解度和表达产量的8个球形脂连蛋白氨基酸取代以逐对组合方式组合以产生脂连蛋白双变体文库。如上述的相同的分子生物学技术和密码子用于产生下面的双突变球形脂连蛋白变体;F184H/Y122H、F184H/Y122S、F184H/I125E、F184H/I125H、F184H/I125T、F184H/V207E、F184H/V207K、V207E/Y122H、V207E/Y122S、V207E/I125E、V207E/I 125H、V207E/I 125T、V207K/Y122H、V207E7Y122S、V207K/I125E、V207K/I125H、V207K/I125T、I125E/Y122H、I125E/Y122S、I125H/Y122H、I125H/Y122S、I125T/Y122H、I125T/Y122S。如上文实施例20中描述的表达和处理这些蛋白质。去污剂诱导的裂解后,我们比较了可溶蛋白质与总的和不溶级分的相对量。图7显示了11个SDS-PAGE凝胶,其含有双突变球形脂连蛋白变体的表达和溶解度信息。作为实验对照,包括单个突变体和天然球形脂连蛋白,以及空白载体对照。在SDS-PAGE上,一个箭头突出显示了球形脂连蛋白的位置。
一些双突变蛋白质具有显著提高的表达和溶解性质。在所测试的23中双变异蛋白质中,变体F184H/Y122H、F184H/I125H、F184H/I125T、F184H/V207K、V207E/I125E、V207K/Y122S、V207K/I125E和I125E/Y122S具有最显著的提高。
实施例23:不存在去污剂时,选择球形脂连蛋白双氨基酸取代变体的溶解度分析
将变体F184H/Y122H、F184H/I125H、F184H/I125T、F184H/V207K、V207E/I125E、V207K/Y122S、V207K/I125E和I125E/Y122S进行与实施例21描述的相同的蛋白质溶解度分析。图8显示了两个SDS-PAGE凝胶,其含有不存在去污剂时溶解度分析的结果。当通过超声处理裂解细菌时,当与天然蛋白质比较时,gAd双变体的总的和可溶蛋白质释放都增加了。表24显示了从双变体和天然蛋白质制备的裂解物的SDS-PAGE上样,包括最高表达的单一变体F184H作为额外的对照。
这些变体的多数在可溶和不溶级分之间具有几乎相等的蛋白质分配,提示具有约50%的溶剂度。变体F184H/Y122H、F184H/I125T和V207K/I125E似乎具有甚至大于50%的溶解度。最后当以天然蛋白质比较时,表达总的和可溶球形脂连蛋白的量增加几个数量级。
图9显示了SDS-PAGE,其含有来自天然和V207E/I125E gAd的无去污剂的可溶裂解物。将天然裂解物稀释12.5倍并与从表达V207E/I125EgAd变体的大肠杆菌制备的相同裂解物的相等或者顺序稀释液相比较。从该分析可以清楚看出相对于天然gAd,V207E/I125E gAd变体产生的可溶蛋白质的量有至少100-1000倍差异。
实施例24:gAd双变体诱导分化的小鼠C2C12细胞中的AMPK磷酸化
为了测量选择gAd变体的生物学活性,必须纯化重组gAd蛋白质以除去大肠杆菌宿主细胞污染物。我们开发了常规的层析方法,其由三个分离的柱步骤组成。简言之,将gAd变体如实施例20中描述的生长并加工成裂解物,将可溶级分应用于DEAE柱并用无梯度步骤以200mM NaCl洗脱。该物质作为非结合步骤经过Q柱(即,gAd流过柱子但是蛋白质污染物和内毒素结合),并且最后用制备S-100HR凝胶过滤柱进一步纯化。对于gAd变体,该方法将常规地产生100-300mg纯化的蛋白质/升大肠杆菌培养物。
我们使用分化成肌管的C2C12细胞来测量AMP激酶(AMPK)的gAd-诱导的磷酸化。如ATCC描述的培养生长C2C12细胞。将细胞转移到含有2%马血清的生长培养基中诱导分化。细胞在该培养基中保持长达几天。在该时间内,细胞伸长并融合在一起,形成多核肌管,其当在光学显微镜下观察时可以见到抽动。图10显示了一系列相差显微术照片,其显示了在1、3、4和7天时分化过程的低放大倍数(10X)图像。在第4天时细胞的高倍放大图像显示存在多核管状结构。将C2C12肌管原样放置或者用30μg/ml双氨基酸gAd变体V207K/I125E和F184H/Y122H处理60分钟。作为该实验的对照,肌管还用30μg/ml商业天然gAd(BioVision)处理。AICAR(AMPK的化学激活剂)用作阳性对照并且空载体对照裂解物(通过与gAd变体相同的层析方案处理)用作阴性对照。处理后,将C2C12细胞加工成裂解物并通过用总的或者磷特异性AMPK抗体,通过蛋白质印迹测定总的AMPK和磷酸化AMPK(pAMPK)的量。图10显示阳性对照AICAR诱导pAMPK的有效增加,而未处理的细胞和载体则不然。商业的天然gAd产生的pAMPK的轻微增加并且两种工程化的gAd变体甚至更有效。我们从该实验得出gAd变体V207K/I125E和F184H/Y122H保留了至少的等于或者大于天然gAd的生物活性。
实施例25:gAd双变体诱导不同鼠肌细胞中AMPK磷酸化
为了使用鼠C2C12肌管完成上面的结果,我们测量了gAd变体在分化的人肌细胞中诱导pAMPK的能力。从Cell Applications,Inc得到预先筛选的人骨骼肌细胞(HSkMC)并根据生产商的使用说明书在骨骼肌细胞生长培养基(Skeletal Muscle Cells Growth Medium)中增殖。为了诱导HSkMC分化成肌管,将6孔板中90%的汇合细胞培养物的培养基用来自相同供应商的适当体积的骨骼肌分化培养基(Skeletal MuscleDifferentiation Medium)更换。每隔一天更换分化培养基并在分化的第四天观察多核肌管。在gAd处理前18小时最终改变分化培养基。在gAd处理当天,将细胞洗涤并在骨骼肌细胞生长培养基中培育3小时,然后加入脂连蛋白变体。将HSkMC肌管不处理或者用50μg/mL的gAd变体F184H、F184H/I125H、F184H/I125T、V207K/I125E和Y122S/I125E处理15分钟。温育后,将细胞用冰预冷的PBS洗涤两次,然后向每孔加入补充磷酸酶抑制剂的200ml预热(90℃)的1×SDS样品缓冲液,并将平板放置在振荡器上2分钟以溶解细胞并产生粗细胞裂解物。收获该材料并转移到1.5mL eppendorf管中,在95℃额外加热10分钟并在-20℃过夜保存。第二天,将样品解冻并穿过27号注射器三次,然后以20000g离心15分钟。在NuPAGE 7%Tris-乙酸盐凝胶(1.0mm×10孔)上装载20ml每种样品并将凝胶在Tris-乙酸盐缓冲液中以150V恒压下电泳80分钟。完成时,将凝胶在具有0.01%SDS的2x转移缓冲液中温育20分钟,接着用100V恒压1小时转移到PVDF膜。将PVDF膜与TBS+Tween 20封闭缓冲液温育20分钟。抗-磷-AMPK抗体以1∶1000的稀释度加入TBST缓冲液并在40℃过夜温育。洗涤(3次,每次15分钟)后,在室温下用碱性磷酸酶偶联的二级抗体处理膜处理1小时。通过使用NBT/BCIP碱性磷酸酶底物将蛋白质显色。该实验的结果在图11中给出;测试的所有变体导致相对于未处理的对照,pAMPK水平升高约2倍。
尽管前面非常详细地并且按照优选的实施方案进行了描述,但是不应将这些理解为限制本公开或者下面的权利要求。在本领域技术人员的范围之内的修饰和改变意在落入本发明的范围内。例如,使用上述方法可以产生与脂连蛋白有关的多肽(例如,C1q/TNF-α超家族或者CTRP家族,和它们的同源物、直向同源物或共生同源物)的变体。