转铁蛋白变体和偶联物.pdf

上传人:大师****2 文档编号:1207142 上传时间:2018-04-06 格式:PDF 页数:170 大小:12.80MB
返回 下载 相关 举报
摘要
申请专利号:

CN200880110647.2

申请日:

2008.08.08

公开号:

CN101835801A

公开日:

2010.09.15

当前法律状态:

终止

有效性:

无权

法律详情:

未缴年费专利权终止IPC(主分类):C07K 14/79申请日:20080808授权公告日:20140910终止日期:20160808|||授权|||著录事项变更IPC(主分类):C07K 14/79变更事项:发明人变更前:达雷尔·斯利普 乔安妮·海 埃斯本·P·弗里斯变更后:达雷尔·斯利普 乔安娜·海 埃斯本·P·弗里斯|||著录事项变更IPC(主分类):C07K 14/79变更事项:发明人变更前:达雷尔·斯利普 乔安娜·海 埃斯本·P·弗里斯变更后:达雷尔·斯利普 乔安娜·海 埃斯本·P·弗里斯 克里斯托弗·J·A·菲尼斯|||实质审查的生效IPC(主分类):C07K 14/79申请日:20080808|||公开

IPC分类号:

C07K14/79; A61K47/48; A61K38/40; C12N5/10

主分类号:

C07K14/79

申请人:

诺维信生物制药丹麦公司

发明人:

达雷尔·斯利普; 乔安妮·海; 埃斯本·P·弗里斯

地址:

丹麦鲍斯韦

优先权:

2007.08.08 EP 07114012.3; 2008.04.02 EP 08153938.9

专利代理机构:

北京市柳沈律师事务所 11105

代理人:

史悦

PDF下载: PDF下载
内容摘要

根据转铁蛋白的三维结构,本发明人设计了具有一个或多个带有自由巯基的半胱氨酸残基的变体多肽(突变蛋白)(下文称为巯基转铁蛋白)。所述多肽变体可以通过半胱氨酸残基的硫原子与生物活性化合物偶联。

权利要求书

1: 多肽,其: 具有铁结合能力; 与受体结合,并且 具有氨基酸序列,所述氨基酸序列与SEQ ID NO:1的残基1-679或339-679、SEQ ID NO:11的残基1-691或者SEQ ID NO:15的残基1-738具有至少60%的同一性,并包含至少一个带有自由巯基的半胱氨酸残基。
2: 权利要求1的多肽,其与血清转铁蛋白,尤其是来源于脊椎动物、哺乳动物或人类的血清转铁蛋白具有至少95%的序列同一性。
3: 前述权利要求中任一项的多肽,其在SEQ ID NO:1的V1-T5、E13-H25、M26-S36、K42-S44、Y85-T93、K103-Q108、L112-K115、T120-W128、L139-P145、F154-G156、A159-F167、P168-L170;P175-C177、G178-F186、G187-K196、D197-D201、I210-N213、L214-N216、K217-R220、D221-Q222、L226-P234、S255-K259、E260-H273、F274-H300、V305-D310、Y317-E328、G329-P341、C402-N417、C418-D420、K434-T440、W441-N443、L444-G446、Y468-K470、I471-R475、A485-S501、G502-N504、L505-Y515、G516-V526、T537-Q540、N541-D548、P549-A551、K552-N555、D558-Y559、C563-T567、R568-P570、E572-N576、E594-F608、G609-V636、L641-T646、R663-S668或S669-R677的任一个相对应的位置,包含半胱氨酸对氨基酸的取代、半胱氨酸的插入或缺失。
4: 前述权利要求中任一项的多肽,其在SEQ ID NO:1的V1-K4、M26-P35、K42-S44、Y85-T93、K103-Q108、L112-K115、T120-W128、L139-P145、F154-S155、A159-F167、G178-F186、D197-D201、L214-N216、D221-Q222、L226-P234、S255-K259、F274-H300、V305-D310、G329-P341、C402-N417、K434-T440、L444-G446、I471-R475、A485-S501、L505-Y515、N541-D548、K552-N555、D558、C563-T567、G609-V636、L641-T646、R663-S668的任一个相对应的位置,包含半胱氨酸对氨基酸的取代、插入或缺失。
5: 前述权利要求中任一项的多肽,其在SEQ ID NO:1的V1-K4、K103-Q108、L112-K115、L139-P145、A159-F167、G178-F186、F274-H300、V305-D310、G329-P341、K434-T440、L444-G446、I471-R475、A485-S501、L505-Y515、G609-V636、L641-T646的任一个相对应的位置,包含半胱氨酸对氨基酸的取代、插入或缺失。
6: 前述权利要求中任一项的多肽,其在SEQ ID NO:1的V1、P2、D3、K4、T5、H14、Q20、S21、D24、K27、S28、V29、P31、S32、D33、A43、E89、D104、G106、G114、L122、G123、P145、S155、D163、T165、D166、P168、P175、G176、G178、C179、S180、T181、L182、Q184、F187、S189、D197、G198、E212、A215、N216、A218、D221、D229、G257、N268、D277、K278、K280、E281、S287、P288、H289、K291、S298、P307、L326、T330、P335、T336、N413、S415、D416、D420、K434、S435、A436、S437、D438、D442、N443、G446、N469、N472、G487、K489、D491、S501、G502、L503、N510、T518、P539、Q540、G543、G544、K545、P547、D548、P549、K552、N553、N555、D558、D565、T567、P570、N576、A595、S610、N611、V612、T613、D614、S616、G617、T626、D634、D643、S666、T667或S669的任一个相对应的位置,包含半胱氨酸对氨基酸的取代、插入或缺失。
7: 权利要求1的多肽,其中,至少一个半胱氨酸残基已被不同氨基酸残基尤其是Ser、Thr、Val或Ala所取代。
8: 权利要求7的多肽,其中,所述多肽与SEQ ID NO:1的残基1-679或339-679具有至少95%的序列同一性,并且所述至少一个半胱氨酸残基选自C19、C158、C161、C177、C179、C194、C227、C331、C339、C402、C418、C474、C495、C448、C506、C523、C563、C596、C615、C620、C665。
9: 前述权利要求中任一项的多肽,其进一步包含使N-连接糖基化或O-连接糖基化减少的至少一个突变。
10: 权利要求9的多肽,其与SEQ ID NO:1相比,在与S32、N413、S415、N611或T613相对应的位置包含氨基酸被取代,该取代后的氨基酸使得与S32、N413或N611相对应的位置不能糖基化。
11: 前述权利要求中任一项的多肽,其与SEQ ID NO:1具有至少99%的序列同一性,并且包含选自下述的一个或多个突变:V1C、S28C、S32C、D104C、T165C、P175C、A215C、P288C、T336C、S415C、D146C、C171A、S415C+D416的缺失、S415A+D416之前的C的插入、S501C、N553C、N611C、T613C、D643C和S28C+S415C。
12: 权利要求1~8中任一项的多肽,其与SEQ ID NO:11具有至少95%的序列同一性,并且包含突变S421C。
13: 编码权利要求1~12中任一项的多肽的多核苷酸。
14: 包含权利要求13的多核苷酸的质粒。
15: 包含权利要求13的多核苷酸或权利要求14的质粒的宿主细胞。
16: 权利要求15的宿主细胞,其是酵母细胞。
17: 一种包含生物活性化合物和权利要求1~12中任一项的多肽的偶联物,其中,所述生物活性化合物通过所述多肽的半胱氨酸残基的自由巯基进行连接。
18: 产生权利要求1~12中任一项的多肽的方法,其包括:在允许所述多肽表达的条件下培养权利要求15或16的宿主细胞;和回收所述多肽。
19: 产生权利要求17的偶联物的方法,其包括:将前述权利要求中任一项的多肽通过所述多肽中的半胱氨酸残基的硫原子与生物活性化合物连接。
20: 一种组合物,其包含权利要求17的偶联物和至少一种药学可接受的载体或稀释剂。
21: 根据前述权利要求所述的偶联物在治疗疾病、病症或诊断中的应用。
22: 制备多肽的方法,包括: 提供包含转铁蛋白序列的至少一个实例、铁原子和受体的三维模型, 选择转铁蛋白序列中与SEQ ID NO:1中的V1、P2或D3相对应的、或在所述转铁蛋白序列的每一个实例中满足以下条件的氨基酸残基: i)RMFS大于0.14, ii)溶剂表面可及性大于100%, 用半胱氨酸取代所选择的残基、或者在所选择的残基的N-侧或C-侧插入半胱氨酸, 任选的是,对所述转铁蛋白序列进行另外的改变,其中,每个改变是氨基酸的缺失、取代或插入,和 制备具有所得氨基酸序列的多肽。
23: 前述权利要求的方法,其进一步包括:测定所述多肽的Fe结合能力和/或受体结合能力和/或偶联能力;并选择具有Fe结合能力和/或受体结合能力和/或偶联能力的多肽。

说明书


转铁蛋白变体和偶联物

    序列表的引用

    本申请包含计算机可读形式的序列表。在此通过参考方式引入所述计算机可读形式。

    【发明领域】

    本发明涉及多肽和至少一个生物活性化合物的偶联物、用于制备所述偶联物的多肽、以及编码它们的多核苷酸。

    【发明背景】

    已知可以使用转铁蛋白和用于受体介导的胞吞作用的生物活性化合物的偶联物来改善跨胞运输。于是,N.J.Kavimandam等(Bioconjugate Chem.,2006,17,1376~1384,名称为“Synthesis and Characterization ofInsulin-Transferrin Conjugates”)、D.Shah等(Journal of PharmaceuticalSciences,第85卷,第12期,1996年12月,名称为“Transcellular Delivery of anInsulin-Transferrin Conjugate in Enterocyte-like Caco-2 Cells”和Fritzer等(1 996,Biochem.Pharm.,51,489~493,名称为“Cytodoxic Effects of aDoxorubicin-Transferrin Conjugate in Multidrug-Resistant KB Cells”)、以及US20030221201和20040023334描述了包含融合到治疗性蛋白的转铁蛋白蛋白  质的融合蛋白。

    已知人血清转铁蛋白(HST)为679个氨基酸残基的单链多肽,其含有38个半胱氨酸残基,连接在19个双硫桥中,该蛋白具有结合两个铁离子的能力。人转铁蛋白的三维结构由J.Wally等(Journal of Biological Chemistry,281(34),24934~24944(2006))公开。根据来自Wally等的人转铁蛋白晶体结构,HST包含由氨基酸1-331组成的N-叶(N-lobe)、由氨基酸339-679组成的C-叶(C-lobe)、和由氨基酸332-338组成的叶间接头(interlobe linker)。

    当含有铁的转铁蛋白遇到细胞表面上的转铁蛋白受体(TfR)时,转铁蛋白会结合到转铁蛋白受体上并在囊泡中被运输到细胞内。细胞将酸化囊泡,从而使转铁蛋白释放出铁离子。然后,受体通过胞吞循环运输回到所述细胞表面上,以备另一轮的铁摄取。

    Cheng,Y.(Cell(Cambridge,Mass.),第116卷,第565~576页(2004))描述了人转铁蛋白受体-转铁蛋白复合物的结构模型。发现所述结构在蛋白数据库(Protein Data Bank)中为1SUV。

    J.Wally等(Journal of Biological Chemistry,281(34),24934~24944(2006))描述了不含铁的人转铁蛋白的三维结构。发现所述结构在蛋白数据库中为2HAV。

    L.A.Lambert等(Comparative Biochemistry and Physiology,B部分142(2005)129~141)的文章名称为“Evolution of the transferrin family:Conservation of residues associated with iron and anion binding”。

    转铁蛋白形成具有高序列同源性的一组蛋白,包括人血清转铁蛋白(HST)、乳铁蛋白(lactoferrin)、黑素转铁蛋白(melanotransferrin)和卵转铁蛋白(ovotransferrin)。已知天然HST含有两叶(N-叶和C-叶),具19个二硫桥、在S32处的O-糖基化位点、和在N413和N611处的两个N-糖基化位点。

    Woodworth,R.C.等(1991,Biochemistry 30,10824~10829)公开了人血清转铁蛋白的N-端半分子的突变体,包括突变体D63C。Muralidhara,B.K.和Hirose,M.(2000,Protein Sci 9,1567~1575)公开了卵转铁蛋白的经分离的C-叶的选择性还原(selective reduction)。J.Williams等(Biochem.J.(1985)228,661~665)公开了卵转铁蛋白中的二硫桥或C-端半分子的选择性还原。US5986067(Funk等)公开了不允许进行糖基化的重组HST突变体。

    发明简述

    根据转铁蛋白的三维结构,本发明人已设计了具有一个或多个带有自由巯基(free thiol group)的半胱氨酸残基的变体多肽(突变蛋白)(下文称为巯基转铁蛋白(thiotransferrin))。所述变体多肽可以通过所述多肽的所述半胱氨酸残基的硫原子偶联到生物活性化合物上。

    因此,本发明提供了一种具有铁结合能力并与受体结合的多肽。

    所述多肽的氨基酸序列与SEQ ID NO:1的残基1-679或339-679、SEQ IDNO:11的残基1-691、或者SEQ ID NO:15的残基1-738具有至少40%或至少60%的同一性,并包含一个或多个带有自由巯基的半胱氨酸残基。

    这里使用的术语“巯基转铁蛋白”用来描述包含一个或多个未成对的半胱氨酸的转铁蛋白变体。与该术语类似的是,巯基乳铁蛋白(thiolactoferrin)和巯基黑素转铁蛋白(thiomelanotransferrin)也分别用来描述包含具有自由巯基的一个或多个未成对的半胱氨酸残基的乳铁蛋白的变体和黑素转铁蛋白的变体。

    通过插入半胱氨酸残基(增加氨基酸链长度)、用半胱氨酸取代两个或多个相邻残基(减小氨基酸链长度)、或用半胱氨酸取代氨基酸残基(氨基酸链长度不变)、缺失半胱氨酸残基或者以上情况的组合,可以创建所述多肽。

    在另一个方面,本发明涉及包含本发明的多肽和至少一个生物活性化合物的偶联物。

    附图简述

    图1显示质粒pDB2241的结构。

    图2显示质粒pDB3237的结构。

    图3显示质粒pDB3191的结构。

    图4显示三维转铁蛋白模型的构建。

    图5显示在3D模型中的两条Tf链中的残基的数据。细节在实施例中给出。

    图6~9显示多种转铁蛋白家族蛋白与HST(SEQ ID NO:1)的比对情况,NP_001054表示HST。

    图10显示来自pDB3191的3.259kb NotI表达盒的图谱,pDB3191上标示了所选的用于修饰的残基位置和方便克隆用的限制性内切酶位点。

    图11显示质粒pDB3806的结构。

    图12显示质粒pDB3809的结构。

    图13显示乳铁蛋白亚克隆质粒pDB3815和pDB3816的结构。

    图14显示巯基乳铁蛋白亚克隆质粒pDB3817的结构。

    图15显示乳铁蛋白表达质粒pDB3818和pDB3819的结构。

    图16显示巯基乳铁蛋白表达质粒pDB3820的结构。

    图17显示重组转铁蛋白(S415A、T613A)与来自酿酒酵母(S.cerevisiae)菌株Strain 1的分泌重组“巯基转铁蛋白”相比较的SDS-PAGE分析结果,所述酿酒酵母菌株Strain 1含有重组转铁蛋白(S415A、T613A)表达质粒pDB3237或者合适(appropriate)的重组巯基转铁蛋白表达质粒。将100μL深低温保存的酵母保存物(yeast stock)接种至10mL BMMD摇瓶中,并于30℃温育5天。凝胶1对应的是用Blue试剂(Pierce)在非还原SDS-PAGE(4%~12%MOPS缓冲液,Invitrogen)上进行分析的20μL上清液。凝胶2对应的是用Blue试剂(Pierce)在还原SDS-PAGE(4%~12%MOPS缓冲液,Invitrogen)进行分析的20μL上清液。

    在图17的凝胶1和凝胶2中,泳道对应以下样品:1=10μL SeeBlue PlusMarkers(Invitrogen),2=20μL Strain 1[pDB3237],3=20μL Strain 1[pDB3766],4=20μL Strain 1[pDB3767],5=20μL Strain 1[pDB3778],6=20μL Strain 1[pDB3769],7=20μL Strain 1[pDB3789],8=20μL Strain 1[pDB3770],9=20μL Strain 1[pDB3771],10=20μL Strain 1[pDB3779],11=20μL Strain 1[pDB3757],12=20μL Strain 1[pDB3761],13=10μL SeeBluePlus Markers(Invitrogen),14=20μL Strain 1[pDB3773],15=20μL Strain 1[pDB3763],16=20μL Strain 1[pDB3760],17=20μL Strain 1[pDB3745],18=20μL Strain 1[pDB3775],19=20μL Strain 1[pDB3758],20=20μLStrain 1[pDB3777],21=20μL Strain 1[pDB3765],22=20μL Strain 1[pDB3759],23=20μL Strain 1[pDB3237],24=10μL SeeBlue Plus Markers(Invitrogen)。

    图18显示分泌自专有酿酒酵母菌株的巯基转铁蛋白变体与分泌自酿酒酵母Strain 1的转铁蛋白(S415A、T613A)相比较的火箭免疫电泳(Rocketimmunoelectrophoresis)分析结果,所述专有酿酒酵母菌株含有巯基转铁蛋白变体表达质粒,所述酿酒酵母Strain 1含有转铁蛋白(S415A、T613A)表达质粒pDB3237。将100μL深低温保存的酵母保存物接种至10mL BMMD摇瓶中,并于30℃温育5天。按每孔4μL培养上清液将样品上样(每样品双份)于火箭免疫电泳凝胶(30μL羊抗-Tf/50mL琼脂糖)。重组人转铁蛋白(S415A、T613A)(Deltaferrin TM)标准品浓缩物(standards  concentrations)按20μg/mL~100μg/mL上样。沉淀物(Precipin)用考马斯蓝进行染色。凝胶1对应的是N-叶和叶间转铁蛋白变体的表达水平与Strain 1[pDB3237]表达相比较的表达水平,所述Strain 1[pDB3237]表达重组人转铁蛋白(S415A、T613A)。凝胶2对应的是C-叶转铁蛋白变体表达水平与Strain 1[pDB3237]表达相比较的表达水平,所述Strain 1[pDB3237]表达重组人转铁蛋白(S415A、T613A)。

    图19显示来自酿酒酵母Strain 1[pDB3809]的重组巯基转铁蛋白(S28C、S415C、T613A)与来自酿酒酵母Strain 1[pDB3767]、Strain 1[pDB3773]、Strain 1[pDB3237]的重组巯基转铁蛋白(S28C、S415A、T613A)、重组巯基转铁蛋白(S415C、T613A)和转铁蛋白(S415A、T613A)重组“巯基转铁蛋白”分泌物相比较的SDS-PAGE分析结果。将100μL深低温保存的酵母保存物接种至10mL BMMD摇瓶中,并于30℃温育5天。凝胶1对应的是用Blue试剂(Pierce)在非还原SDS-PAGE(4%~12%MOPS缓冲液,Invitrogen)上进行分析的20μL上清液。在图19的凝胶1中,泳道对应以下样品:1=10μL SeeBlue Plus Markers(Invitrogen),2=20μL Strain 1[pDB3237],3=20μL Strain 1[pDB3237],4=20μL Strain 1[pDB3767],5=20μL Strain 1[pDB3773],6=20μL Strain 1[pDB3809],7=20μL Strain 1[pDB3809]。在图19的凝胶2中,泳道对应以下样品:1=10μL SeeBlue Plus Markers(Invitrogen);2=无样品,3=20μL Strain 1[pDB3237],4=20μL Strain 1[pDB3237],5=20μL Strain 1[pDB3767],6=20μL Strain 1[pDB3773],7=20μL Strain 1[pDB3809],8=20μL Strain 1[pDB3809]。

    图20显示来自专有酿酒酵母Strain 1[pDB3809]的重组巯基转铁蛋白(S28C、S415C、T613A)与来自专有酿酒酵母Strain 1[pDB3767]、Strain 1[pDB3773]、Strain 1[pDB3237]的重组巯基转铁蛋白(S28C、S415A、T613A),重组巯基转铁蛋白(S415C、T613A)和转铁蛋白(S415A、T613A)重组“巯基转铁蛋白”分泌物相比较的火箭免疫电泳分析结果。将100μL深低温保存的酵母保存物接种至10mL BMMD摇瓶中,并于30℃温育5天。按每孔4μL培养上清液将样品上样(每样品双份)于火箭免疫电泳凝胶(30μL羊抗-Tf/50mL琼脂糖)。重组人转铁蛋白(S415A、T613A)(DeltaferrinTM)标准品浓缩物按20μg/mL~100μg/mL上样。沉淀物(Precipin)用考马斯蓝进行染色。

    图21显示来自酿酒酵母Strain 1[pDB3818]的重组乳铁蛋白(T139A、T480A、S625A)、来自酿酒酵母Strain 1[pDB3819]的重组乳铁蛋白(T139A、T480A、S625A)和来自酿酒酵母Strain 1[pDB3820]的重组巯基乳铁蛋白(T139A、S421C、T480A、S625A)与来自酿酒酵母Strain 1[pDB3237]的重组转铁蛋白(S415A、T613A)和来自酿酒酵母Strain 1[pDB3773]的重组巯基转铁蛋白(S415C)相比较的SDS-PAGE分析结果。将100μL深低温保存的酵母保存物接种至10mL BMMD摇瓶中,并于30℃温育5天。凝胶1对应的是用Blue试剂(Pierce)在非还原SDS-PAGE(4%~12%MOPS缓冲液,Invitrogen)上进行分析的20μL上清液。在图21的两块凝胶中,泳道对应以下样品:1=10μL SeeBlue Plus Markers(Invitrogen),2=20μLStrain 1[pDB3237],3=20μL Strain 1[pDB3773],4=20μL Strain 1[pDB3818],5=20μL Strain 1[pDB3818],6=20μL Strain 1[pDB3819],7=20μL Strain 1[pDB3819],8=20μL Strain 1[pDB3820],和9=20μL Strain 1[pDB3820]。

    图22显示经纯化的重组转铁蛋白(S415A、T613A)与经纯化的重组巯基转铁蛋白(S28C、S415A、T613A)、经纯化的巯基转铁蛋白(S32C、S415A、T613A)、经纯化的巯基转铁蛋白(A215C、S415A、T613A)、经纯化的巯基转铁蛋白(S415C、T613A)和经纯化的巯基转铁蛋白(S4125A、N553C、T613A)相比较的分析型TBE-尿素(analytical TBE-urea)凝胶分析结果。按照下文实施例中描述的方案制备样品。将5μg样品在6%TBE Urea PAGE(Invitrogen)上进行分离,然后用Coomassie G250(Pierce)进行染色。

    泳道1~2显示Strain 1[pDB3237]样品,泳道3显示Strain 1[pDB3767],泳道4显示Strain 1[pDB3779],泳道5显示Strain 1[pDB3758],泳道6显示Strain 1[pDB3773],而泳道7显示Strain 1[pDB3778]。

    泳道1显示重组转铁蛋白(S415A、T613A)突变体的无铁制备物(iron-freepreparation),泳道2显示重组转铁蛋白(S415A、T613A)突变体的载铁制备物(iron-loaded preparation),泳道3显示重组巯基转铁蛋白(S28C、S415A、T613A)突变体的载铁制备物,泳道3显示重组巯基转铁蛋白(S415A、N553C、T613A)突变体的载铁制备物,泳道3显示重组巯基转铁蛋白(S415C、T613A)突变体的载铁制备物,泳道3显示重组巯基转铁蛋白(S32C、S415A、T613A)突变体的载铁制备物。

    图23显示巯基转铁蛋白(S28C、S415A、T613A)、巯基转铁蛋白(A215C、S415A、T613A)、巯基转铁蛋白(S415C、T613A)、巯基转铁蛋白(S415A、N553C、T613A)和巯基转铁蛋白(S32C、S415A、T613A)变体与转铁蛋白(S415A、T613A)相比较的去卷积质谱(deconvolved mass spectra)分析结果,所述分析采用的是电喷雾-时间飞行(ESI-TOF)质谱测定术。谱A显示从高细胞密度发酵的YBX7[pDB3237]中纯化的转铁蛋白(S415A、T613A)的质谱。鉴定峰如下:A)天然分子(理论质量为75098Da),B)天然分子+1己糖(理论质量为75259Da)。谱B显示从高细胞密度发酵的Strain 1[pDB3767]中通过第一层析步骤纯化的巯基转铁蛋白(S28C、S415A、T613A)变体的质谱。鉴定峰如下:C)天然分子(理论质量为75114Da),D)天然分子+1己糖(理论质量为75274Da)。谱C显示从高细胞密度发酵的Strain 1[pDB3779]中通过第一层析步骤纯化的巯基转铁蛋白(A215C、S415A、T613A)变体的质谱。鉴定峰如下:E)天然分子(理论质量为75130Da),F)天然分子+1己糖(理论质量为75292Da)。谱D显示从高细胞密度发酵的Strain 1[pDB3773]中通过第一层析步骤纯化的巯基转铁蛋白(S415C、T613A)变体的质谱。鉴定峰如下:G)天然分子(理论质量为75130Da),H)天然分子+1己糖(理论质量为75292Da)。谱E显示从高细胞密度发酵的Strain 1[pDB3758]中通过第一层析步骤纯化的巯基转铁蛋白(S415A、N553C、T613A)变体的质谱。鉴定峰如下:I)天然分子(理论质量为75087Da),J)天然分子+1己糖(理论质量为75249Da)。谱F显示从高细胞密度发酵的Strain 1[pDB3778]中通过第一层析步骤纯化的巯基转铁蛋白(S32C、S415A、T613A)变体的质谱。鉴定峰如下:K)天然分子(理论质量为75114Da)。

    图24显示用DTNB处理的巯基转铁蛋白(S28C、S415A、T613A)、巯基转铁蛋白(A215C、S415A、T613A)、巯基转铁蛋白(S415C、T613A)、巯基转铁蛋白(N553C、S415A、T613A)和巯基转铁蛋白(S32C、S415A、T613A)变体与用DTNB处理的转铁蛋白(S415A、T613A)相比较的去卷积质谱分析结果,所述分析采用的是电喷雾-时间飞行(ESI-TOF)质谱测定术。谱A显示从高细胞密度发酵的YBX7[pDB3237]中纯化的转铁蛋白(S415A、T613A)的质谱。鉴定峰如下:A)天然分子(理论质量为75098Da),B)天然分子+1己糖(理论质量为75259Da)。谱B显示从高细胞密度发酵的Strain 1[pDB3767]中通过第一层析步骤纯化并且用DTNB处理的巯基转铁蛋白(S28C、S415A、T613A)变体的质谱。鉴定峰如下:C)天然分子+NTB(理论质量为75311Da),D)天然分子+1己糖+NTB(理论质量为75473Da)。谱C显示从高细胞密度发酵的Strain 1[pDB3779]中通过第一层析步骤纯化并且用DTNB处理的巯基转铁蛋白(A215C、S415A、T613A)变体的质谱。鉴定峰如下:E)天然分子+NTB(理论质量为75327Da),F)天然分子+1己糖+NTB(理论质量为75489Da)。谱D显示从高细胞密度发酵的Strain 1[pDB3773]中通过第一层析步骤纯化并且用DTNB处理的巯基转铁蛋白(S415C、T613A)变体的质谱。鉴定峰如下:G)天然分子+NTB(理论质量为75327Da),H)天然分子+1己糖+NTB(理论质量为75489Da)。谱E显示从高细胞密度发酵的Strain 1[pDB3758]中通过第一层析步骤纯化并且用DTNB处理的巯基转铁蛋白(N553C、S415A、T613A)变体的质谱。鉴定峰如下:I)天然分子+NTB(理论质量为75284Da),J)天然分子+1己糖+NTB(理论质量为75446Da)。谱F显示从高细胞密度发酵的Strain 1[pDB3778]中通过第一层析步骤纯化并且用DTNB处理的巯基转铁蛋白(S32C、S415A、T613A)变体的质谱。确定峰如下:K)天然分子+NTB(理论质量为75311Da)。

    图25显示巯基转铁蛋白变体与偶联在辣根过氧化物酶上的巯基转铁蛋白变体相比较的SDS-PAGE分析结果。用4倍摩尔过量(4 fold molar excess)的EZ-Link马来酰亚胺活化的辣根过氧化物酶(Pierce)处理经过第一层析步骤纯化的蛋白。凝胶1对应的是用Blue试剂(Pierce)在非还原SDS-PAGE(4%~12%MOPS缓冲液,Invitrogen)上进行分析的20μL样品。凝胶2对应的是用Blue试剂(Pierce)在还原SDS-PAGE(4%~12%MOPS缓冲液,Invitrogen)上进行分析的20μL上清液。泳道1=10μL SeeBlue Plus Markers(Invitrogen),2=转铁蛋白(S415A、T613A),3=转铁蛋白(S415A、T613A)+EZ-Link马来酰亚胺活化的辣根过氧化物酶,4=巯基转铁蛋白(S28C、S415A、T613A),5=巯基转铁蛋白(S28C、S415A、T613A)+EZ-Link马来酰亚胺活化的辣根过氧化物酶,6=巯基转铁蛋白(S32C、S415A、T613A),7=巯基转铁蛋白(S32C、S415A、T613A)+EZ-Link马来酰亚胺活化的辣根过氧化物酶,8=10μL SeeBlue Plus Markers(Invitrogen),9=巯基转铁蛋白(A215C、S415A、T613A),10=巯基转铁蛋白(A215C、S415A、T613A)+EZ-Link马来酰亚胺活化的辣根过氧化物酶,11=巯基转铁蛋白(S415C、T613A),12=巯基转铁蛋白(S415C、T613A)+EZ-Link马来酰亚胺活化的辣根过氧化物酶,13=巯基转铁蛋白(N553C、S415A、T613A),14=巯基转铁蛋白(N553C、S415A、T613A)+EZ-Link马来酰亚胺活化的辣根过氧化物酶。

    图26显示巯基转铁蛋白(S28C、S415A、T613A)与荧光素偶联的巯基转铁蛋白(S28C、S415A、T613A)相比较的去卷积质谱分析结果,所述分析采用的是电喷雾-时间飞行(ESI-TOF)质谱测定术。谱A显示巯基转铁蛋白(S28C、S415A、T613A)变体的质谱。鉴定峰如下:A)天然分子(理论质量为75114Da),B)天然分子+1己糖(理论质量为75272Da)。谱B显示荧光素偶联的巯基转铁蛋白(S28C、S415A、T613A)变体的质谱。鉴定峰如下:C)天然分子+荧光素(理论质量为75541Da),D)天然分子+荧光素+1己糖(理论质量为75701Da)。

    图27显示巯基转铁蛋白(S415C、T613A)与荧光素偶联的巯基转铁蛋白(S415C、T613A)相比较的去卷积质谱分析结果,所述分析采用的是电喷雾-时间飞行(ESI-TOF)质谱测定术。谱A显示巯基转铁蛋白(S415C、T613A)变体的质谱。鉴定峰如下:A)天然分子(理论质量为75130Da),B)天然分子+1己糖(理论质量为75292Da)。谱B显示荧光素偶联的巯基转铁蛋白(S415C、T613A)变体的质谱。鉴定峰如下:C)天然分子+荧光素(理论质量为75553Da),D)天然分子+荧光素+1己糖(理论质量为75716Da)。

    图28显示用DTNB处理的巯基转铁蛋白(S28C、S415A、T613A)与用DTNB处理的荧光素偶联的巯基转铁蛋白(S28C、S415A、T613A)相比较的去卷积质谱分析结果,所述分析采用的是电喷雾-时间飞行(ESI-TOF)质谱测定术。谱A显示用DTNB处理的巯基转铁蛋白(S28C、S415A、T613A)变体的质谱。鉴定峰如下:A)天然分子+NTB(理论质量为75311Da),B)天然分子+1己糖+NTB(理论质量为75473Da)。谱B显示用DTNB处理的荧光素偶联的巯基转铁蛋白(S28C、S415A、T613A)变体的质谱。鉴定峰如下:C)天然分子+荧光素(理论质量为75541Da),D)天然分子+荧光素+1己糖(理论质量为75701Da)。

    图29显示用DTNB处理的巯基转铁蛋白(S415C、T613A)与用DTNB处理的荧光素偶联的巯基转铁蛋白(S415C、T613A)相比较的去卷积质谱分析结果,所述分析采用的是电喷雾-时间飞行(ESI-TOF)质谱测定术。谱A显示用DTNB处理的巯基转铁蛋白(S415C、T613A)变体的质谱。鉴定峰如下:A)天然分子+NTB(理论质量为75327Da),B)天然分子+1己糖+NTB(理论质量为75489Da)。谱B显示用DTNB处理的荧光素偶联的巯基转铁蛋白(S28C、S415A、T613A)变体的质谱。鉴定峰如下:C)天然分子+荧光素(理论质量为75553Da),D)天然分子+荧光素+1己糖(理论质量为75716Da)。

    发明详述

    转铁蛋白

    本发明中使用的转铁蛋白可以是具有铁结合能力的任何蛋白,这些蛋白属于转铁蛋白家族,例如Lambert等(Comparative Biochemistry andPhysiology,B部分,142(2005),129~141)、Testa(Proteins of iron metabolism,CRC出版社,2002)以及Harris & Aisen(Iron carriers and iron proteins,第5卷,Physical Bioinorganic Chemistry,VCH,1991)所描述的转铁蛋白家族。

    转铁蛋白家族蛋白的例子是血清转铁蛋白、卵转铁蛋白、黑素转铁蛋白和乳铁蛋白以及它们的衍生物和变体,例如突变转铁蛋白(Mason等,(1993)Biochemistry,32,5472;Mason等,(1998),Biochem.J.,330,35)、截短的转铁蛋白、转铁蛋白叶(Mason等,(1996)Protein Expr.Purif.,8,119;Mason等,(1991)Protein Expr.Purif,2,214)、突变乳铁蛋白、截短的乳铁蛋白、乳铁蛋白叶、突变卵转铁蛋白、截短的卵转铁蛋白、黑素转铁蛋白叶、截短的黑素转铁蛋白或者上述任何一种蛋白与其它肽、多肽或蛋白的融合体(Shin等,(1995)Proc.Natl.Acad.Sci.USA,92,2820;Ali等,(1999)J.Biol.Chem.,274,24066;Mason等,(2002)Biochemistry,41,9448)。优选的是血清转铁蛋白,特别是人血清转铁蛋白(HST),其具有SEQ ID NO:1所示的氨基酸序列,有679个氨基酸,也被称为C1变体(登录号为NP 001054)。优选的是乳铁蛋白,特别是人乳铁蛋白,其具有SEQ ID NO:11所示的氨基酸序列,有691个氨基酸。优选的是黑素转铁蛋白,特别是人黑素转铁蛋白,其具有SEQID NO:15的氨基酸序列残基20-738。

    转铁蛋白通常具有以下氨基酸序列,所述序列与SEQ ID NO:1具有至少25%的同一性,特别是具有至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.9%的同一性。更特别的是,其可以具有100%的同一性。

    乳铁蛋白通常具有以下氨基酸序列,所述序列与SEQ ID NO:11具有至少25%的同一性,特别是具有至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.9%的同一性。更特别的是,其可以具有100%的同一性。

    黑素转铁蛋白通常具有以下氨基酸序列,所述序列与SEQ ID NO:15具有至少25%的同一性,特别是具有至少30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.9%的同一性。更特别的是,其可以具有100%的同一性。

    转铁蛋白家族蛋白的氨基酸序列可以具有至少167个氨基酸的长度,特别是具有至少300个氨基酸、630个氨基酸、691个氨基酸、694个氨基酸或695个氨基酸的长度。典型的是,所述长度至多为1274个氨基酸,特别是至多819个氨基酸、至多722个氨基酸、至多717个氨基酸或至多706个氨基酸。特别的是,所述长度可以是679个氨基酸。其可以是来自脊椎动物的具有691~717个氨基酸的转铁蛋白或长度为695~706个氨基酸的哺乳动物转铁蛋白。

    转铁蛋白家族蛋白,特别是长度为694~706个氨基酸的转铁蛋白家族蛋白,通常包含两个结构域(称为N-叶和C-叶),每一结构域具有约331~341个残基,并且每一结构域结合一个Fe(III)原子和一个碳酸根阴离子(carbonateanion),通过约为7个残基的叶间接头连接。典型的是,每个铁与4个保守的氨基酸残基(即1个Asp、2个Tyr和1个His)配位,且阴离子与Arg和Thr结合。

    本发明中使用的转铁蛋白家族蛋白与全长HST(SEQ ID NO:1所示的残基1-679)或者与HST的C-叶(SEQ ID NO:1所示的残基339-679)具有至少40%或至少60%的同一性。HST对于TfR的主要受体识别位点位于C-叶中,经蛋白水解分离的HST C-叶能够将铁离子运输至细胞。

    人血清转铁蛋白可以是称为Tf℃1、TfC2或TfC3的变体。

    已知许多蛋白存在于转铁蛋白家族内,非排它性的列表如下所示。列表显示了全长序列,包括成熟蛋白和前导序列。

       蛋白  物种  常用名 登录号  与SEQ ID  NO:1的同一  性(%)  长度  转铁蛋白  Homo sapiens  人 NP_001054  100  698aa(氨基  酸)  转铁蛋白  Canis lupus  familiaris  狗 XP_864515  73.2  706aa  转铁蛋白  Mus musculus  家鼠 NP_598738  73.7  697aa  转铁蛋白  Rattus  norvegicus  褐家鼠 NP_00101312 8  73.6  698aa  转铁蛋白  Sus scrofa  猪 CAA30943  71.6  696aa  转铁蛋白  Oryctolagus  cuniculus  兔 AAB94136  79.0  695aa


       蛋白  物种  常用名 登录号  与SEQ ID  NO:1的同一  性(%)  长度  转铁蛋白  Equus  caballus  马 NP_00107541 5  73.7  706aa  转铁蛋白  Bos taurus  牛 NP_803450  70.1  704aa  转铁蛋白  Gallus gallus  鸡 NP_990635  53.1  705aa  转铁蛋白  Marmota  monax  土拨鼠 AAP37129  694aa  转铁蛋白  Xenopus  laevis  非洲爪蛙 NP_00107981 2  717aa  转铁蛋白  Xenopus  tropicalis  非洲爪蛙 NP_00102748 7  49.6  703aa  转铁蛋白  Chamaeleo  calyptratus  高冠变色龙 CAK18229  710aa  转铁蛋白  Lacerta agilis  沙地蜥蜴 CAK18228  714aa  转铁蛋白  Eublepharis  macularius  豹纹守宫 CAK18227  703aa  转铁蛋白  Pogona  vitticeps  中部胡须鬣  蜥 CAK18226  702aa  转铁蛋白  Anolis sagrei  棕色蜥蜴 CAK18225  710aa  转铁蛋白  Lamprophis  fuliginosus  非洲家蛇 CAK18223  711aa  转铁蛋白  Natrix natrix  草蛇 CAK18221  50.0  710aa  转铁蛋白  Oncorhynchus  虹鳟 BAA84103  691aa mykiss  转铁蛋白 Oryzias latipes 日本鳉  BAA10901  690aa


       蛋白  物种  常用名 登录号  与SEQ ID  NO:1的同一  性(%)  长度  转铁蛋白 Oreochromis niloticus 尼罗河罗非 鱼  ABB70391  694aa  转铁蛋白 Oncorhynchus tshawytscha 大鳞鲑  AAF03084  672aa  转铁蛋白 Gadus morhua 大西洋鳕  AAB08440  642aa  转铁蛋白 Salmo trutta 褐鳟  BAA84102  691aa  转铁蛋白 Salvelinus namaycush 湖鳟  BAA84101  691aa  转铁蛋白 Salvelinus fontinalis 溪鳟  BAA84100  691aa  转铁蛋白 Salvelinus pluvius 日本鱼  BAA84099  691aa  转铁蛋白 Oncorhynchus masou 马苏大麻哈 鱼  BAA84098  691aa  转铁蛋白 Oncorhynchus rhodurus 玫瑰大麻哈 鱼(Amago)  BAA84097  691aa  转铁蛋白 Oncorhynchus nerka 红大麻哈鱼  BAA84096  50.2  691aa  转铁蛋白 Paralichthys olivaceus 牙鲆  BAA28944  685aa  转铁蛋白 Oncorhynchus kisutch 银大麻哈鱼  BAA13759  687aa  转铁蛋白 Oreochromis aureus 罗非鱼(丽体 鱼)  CAC59954  167aa  转铁蛋白 Danio rerio 斑马鱼  DAA01798  675aa  转铁蛋白 Pagrus major 红海鲷  AAP94279  691aa


       蛋白  物种  常用名 登录号  与SEQ ID  NO:1的同一  性(%)  长度  黑素转铁蛋  白  Homo sapiens  人 NP_005920  45.7  738aa  黑素转铁蛋  白  (Meanotransfe  rrin)  Canis lupus  familiaris  狗 XP_545158  42.3  1193aa  黑素转铁蛋  白  Mus musculus  家鼠 NP_038928  44.4  738aa  黑素转铁蛋  白  Rattus  norvegicus  褐家鼠 XP_237839  44.7  738aa  黑素转铁蛋  白  Gallus gallus  鸡 NP_990538  43.6  738aa  乳转铁蛋白  (Lactotransfer  rin)  H.sapiens  人 NP_002334  61.8  710aa  乳转铁蛋白  Pan  troglodytes  黑猩猩 XP_516417  62.0  711aa  乳转铁蛋白  Canis lupus  familiaris  狗 XP_864480  61.9  724aa  乳转铁蛋白  Mus musculus  家鼠 NP_032548  57.6  707aa  乳转铁蛋白  Rattus  norvegicus  褐家鼠 XP_236657  53.8  729aa  乳铁蛋白  Sus scrofa  猪 AAA31059  61.1  703aa  乳铁蛋白  Camelus  dromedarius  阿拉伯骆驼 CAB53387  62.0  708aa  乳铁蛋白  Equus  caballus  马 CAA09407  63.7  695aa


       蛋白  物种  常用名 登录号  与SEQ ID  NO:1的同一  性(%)  长度  乳铁蛋白  Bos taurus  牛 AAA30610  62.0  708aa  乳铁蛋白  Bubalus  bubalis  水牛  CAA06441  62.1  708aa  乳铁蛋白  Capra hircus  山羊  ABD49106  62.2  708aa  乳铁蛋白  Bos grunniens  家牦牛  ABD49105  62.0  708aa  乳铁蛋白  Ovis aries  绵羊  AAV92908  62.4  708aa  卵转铁蛋白  Anas  platyrhynchos  绿头鸭  P56410  54.4  686aa  卵转铁蛋白  Gallus gallus  鸡  CAA26040  53.1  705aa


    转铁蛋白可以任选地与其它蛋白融合,特别是与生物活性蛋白(如下文描述的那些蛋白)融合。融合体(fusion)可以在N-末端或C-末端或者包含插入物(insertion)。本领域技术人员也会理解,开放阅读框可以编码包含任何序列的蛋白,其可以是天然蛋白(包括酶原)或者天然蛋白的变体或者片段(例如,可以是结构域);或者是全合成的蛋白;或者是不同蛋白(天然的或合成的)的单融合体或多融合体。转铁蛋白融合体的例子在美国专利申请US2003/026778、US2003/0221201和US2003/0226155、Shin等(1995,Proc NatlAcad Sci USA,92,2820)、Ali等(1999,J Biol Chem,274,24066)、Mason等(2002,Biochemistry,41,9448)中给出,在此通过参考的方式引入所述内容。

    3D模型

    本发明中使用的3D模型包含至少一个分子的转铁蛋白和至少一个受体。图5给出了具有两个分子HST和两个分子TfR的模型的坐标(coordinate)。

    实施例4中描述有该模型的构建。

    其它包括转铁蛋白家族蛋白和受体的模型可以基于已发表的3D结构,如1CB6、1B0L、1LFG、1DTZ、1AIV、1DOT、1OVT、1H76、1JNF、2HAV和1SUV(蛋白数据库)按照相似的方式构建。

    氨基酸残基和区域的选择-步骤1

    基于在3D模型中每一个残基的C-α原子的位置,选择满足以下标准的残基。

    ·运动性(Mobility)符合RMSF>0.14、>0.16、>0.18、>0.20、>0.22、>0.24、>0.26、>0.28或>0.30。

    ·可及性(Accessibility)>30%、>40%、>50%、>60%、>70%、>80%、>90%、>100%、>110%、>120%、>130%或>140%。

    下面列出了运动性和可及性的一些特定组合和基于图5中显示的氨基酸残基的性质根据这些标准选择的氨基酸残基。残基的编号忽略了SEQ IDNO:1中的头3个残基,这3个残基在3D模型中是不能分辨的,所以在SEQ IDNO:1中以K4开始作为位置1。

     可及性>100%,RMSF>0.14

    D 21+S 25+V 26+P 28+S 29+A 40+E 86+D 101+G 103+G120+P 142+D 160+T 162+D 163+P 172+T 178+L 179+S 186+D 194+A212+A 215+D 218+D 226+G 254+N 265+D 274+S 295+304+L323+T 327+P 332+T 333+N 410+S 412+D 413+D 417+S 432+S 434+D 435+D 439+N 466+N 469+D488+S 498+L 500+N 507+T 515+G 540+P 544+P 546+N 550+N 552+D 562+N 573+A 592+S 607+N608+T 610+D 611+S 613+T 623+D 631+D 640+S 663+T 664+

     可及性>110%,RMSF>0.14

    D 21+V 26+P 28+S 29+A 40+D 101+G 120+D 160+T 162+D163+P 172+T 178+L 179+S 186+D 194+A 212+D 218+D 226+G254+D 274+S 295+P 304+L 323+T 333+S 412+D 413+D 417+S432+S 434+D 435+D 439+N 466+N 469+D 488+S 498+L 500+N 507+G 540+P 544+P 546+N 550+D 562+N 573+S 607+N 608+T 610+D611+S 613+T 623+D 631+D 640+T 664+

     可及性>120%,RMSF>0.14

    D 21+V 26+P 28+S29+A 40+D 101+D 160+T 162+D 163+P172+T 178+L 179+S 186+D 194+A 212+D 218+D 226+G 254+D274+T 333+S 412+D 413+D 417+S 432+S 434+D 435+D 439+N466+N 469+D 488+S 498+L 500+N 507+G 540+P 544+N 550+D562+N 573+S 607+N 608+D 611+S 613+T 623+D 631+D 640+

     可及性>130%,RMSF>0.14

    V 26+S 29+A 40+D 101+T 162+D 163+P 172+T 178+L 179+S186+D 194+D 226+D 274+T 333+S 412+D 413+S 432+S 434+N466+N 469+D 488+S 498+N 507+P 544+N 550+D 562+N 573+S607+D 611+T 623+D 640+

     可及性>140%,RMSF>0.14

    V 26+S 29+D101+T 162+D 163+P 172+L 179+D 194+D 226+D 274+T 333+S 412+D 413+S 432+N 466+N 469+D 488+N 507+P544+N 550+D 562+S 607+D640+

     可及性>90%,RMSF>0.16

    D 21+S25+V26+P28+S29+A40+P71+E86+D101+G103+G 120+P 139+P 142+S 152+D 160+T 162+D 163+P 165+P 172+T178+L 179+S 186+D 194+E 209+A 212+N 213+A 215+D 218+D226+G 254+N 265+D 274+S 283+P 285+S 295+P 304+L 323+T 327+V 357+N 410+S 412+D 413+D 417+S 432+S 434+D 435+D 439+N 440+N 466+N 469+D 488+M 496+S 498+G 499+L 500+N 507+T515+G 540+P 544+P 546+N 550+N 552+D 562+P 567+N 573+S607+N 608+T 610+D 611+S 613+G 614+T 623+D 625+D 640+S663+T 664+S666+

     可及性>100%,RMSF>0.16

    D 21+S 25+V 26+P 28+S 29+A 40+E 86+D 101+G 103+G 120+P 142+D 160+T 162+D 163+P 172+T 178+L 179+S 186+D 194+A212+A 215+D 218+D 226+G 254+N 265+D 274+S 295+P 304+L323+T 327+N 410+S 412+D 413+D 417+S 432+S 434+D 435+D439+N 466+N 469+D 488+S 498+L 500+N 507+T 515+G 540+P544+P 546+N 550+N 552+D 562+N 573+S 607+N 608+T 610+D611+S 613+T 623+D 640+S 663+T 664+

     可及性>110%,RMSF>0.16

    D21+V 26+P 28+S 29+A 40+D 101+G 120+D 160+T 162+D163+P 172+T 178+L 179+S 186+D 194+A 212+D 218+D 226+G254+D 274+S 295+P 304+L 323+S412+D 413+D 417+S 432+S 434+D 435+D 43 9+N 466+N 469+D 488+S 498+L 500+N 507+G 540+P 544+P 546+N 550+D 562+N 573+S 607+N 608+T 610+D 611+S613+T 623+D 640+T 664+

     可及性>120%,RMSF>0.16

    D 21+V 26+P 28+S 29+A 40+D 101+D 160+T 162+D 163+P172+T 178+L 179+S 186+D 194+A 212+D 218+D 226+G 254+D274+S 412+D 413+D 417+S 432+S 434+D 435+D 439+N 466+N469+D 488+S 498+L 500+N 507+G 540+P 544+N 550+D 562+N573+S 607+N 608+D 611+S 613+T 623+D 640+

     可及性>130%,RMSF>0.16

    V 26+S 29+A 40+D 101+T 162+D 163+P 172+T 178+L 179+S186+D 194+D 226+D 274+S 412+D 413+S 432+S 434+N 466+N469+D 488+S 498+N 507+P5 44+N 550+D 562+N 573+S 607+D611+T 623+D 640+

     可及性>140%,RMSF>0.16

    V 26+S 29+D 101+T 162+D 163+P 172+L 179+D 194+D 226+D 274+S 412+D 413+S 432+N 466+N 469+D 488+N 507+P 544+N550+D 562+S 607+D 640+

     可及性>90%,RMSF>0.18

    D 21+S 25+V 26+P 28+S 29+A 40+E 86+D 101+G 103+G 120+S 152+D 160+T 162+D 163+P 165+P 172+T 178+L 179+S 186+D194+E 209+A 212+N 213+A 215+D 218+G 254+N 265+D 274+S283+P 285+S 295+L 323+D 413+S 432+S 434+D 435+D 439+N 440+N 466+N 469+D 488+S 498+G 499+L 500+N 507+T 515+G 540+P 544+P 546+N 550+N 552+D 562+P 567+N 573+S 607+N 608+T610+D 611+S 613+G 614+T 623+D 640+S 663+T 664+S 666+

     可及性>100%,RMSF>0.18

    D21+S 25+V 26+P 28+S 29+A 40+E 86+D 101+G 103+G 120+D 160+T 162+D 163+P 172+T 178+L 179+S 186+D 194+A 212+A 215+D 218+G 254+N 265+D 274+S 295+L 323+D 413+S 432+S434+D 435+D 439+N466+N 469+D 488+S 498+L 500+N 507+T515+G 540+P 544+P 546+N 550+N 552+D 562+N 573+S 607+N608+T 610+D 611+S 613+T 623+D 640+S 663+T 664+

     可及性>110%,RMSF>0.18

    D 21+V 26+P 28+S 29+A 40+D 101+G 120+D 160+T 162+D163+P 172+T 178+L 179+S 186+D 194+A 212+D 218+G 254+D274+S 295+L 323+D 413+S 432+S 434+D 435+D 439+N 466+N469+D 488+S 498+L 500+N 507+G 540+P 544+P 546+N 550+D562+N 573+S 607+N 608+T 610+D 611+S 613+T 623+D 640+T664+

     可及性>120%,RMSF>0.18

    D 21+V 26+P 28+S 29+A 40+D 101+D 160+T 162+D 163+P172+T 178+L 179+S 186+D 194+A 212+D 218+G 254+D 274+D413+S 432+S 434+D 435+D 439+N 466+N 469+D 488+S 498+L500+N 507+G 540+P 544+N 550+D 562+N 573+S 607+N 608+D611+S 613+T623+D 640+

     可及性>130%,RMSF>0.18

    V 26+S 29+A 40+D 101+T 162+D 163+P 172+T 178+L 179+S186+D 194+D 274+D 413+S 432+S 434+N 466+N 469+D 488+S498+N 507+P 544+N 550+D 562+N 573+S 607+D 611+T 623+D640+

     可及性>140%,RMSF>0.18

    V 26+S 29+D101+T 162+D 163+P 172+L 179+D 194+D 274+D413+S 432+N 466+N 469+D 488+N 507+P 544+N 550+D 562+S607+D 640+

     可及性>70%,RMSF>0.2

    Q 17+S 18+D 21+S 25+V 26+P 28+S 29+A 40+D 101+G 103+G 111+G 120+S 152+D 160+T 162+D 163+P 165+Q 169+P 172+C176+T 178+L179+Q 181+S 186+D 194+G 195+E 209+A 212+N213+D 218+G 254+N 265+D 274+K 275+E 278+P 285+H 286+K288+L 323+S 432+S 434+D 435+D 439+N 440+G 443+N 466+N469+G 484+K 486+S 498+G 499+L 500+T 515+Q 537+G 540+K542+P 544+P 546+K 549+N 550+N 552+D 562+T 564+P 567+S 607+N 608+T 610+D 611+G 614+S 663+T 664+S 666+

     可及性>80%,RMSF>0.2

    Q 17+D 21+S 25+V 26+P 28+S 29+A 40+D 101+G 103+G 111+G 120+S 152+D 160+T 162+D 163+P 165+Q 169+P 172+T 178+L179+S 186+D 194+E 209+A 212+N 213+D 218+G 254+N 265+D274+E 278+P 285+H 286+K 288+L 323+S 432+S 434+D 435+D439+N 440+N 466+N 469+S 498+G 499+L 500+T 515+Q 537+G540+P 544+P 546+K 549+N 550+N 552+D 562+P 567+S 607+N608+T 610+D 611+G 614+S 663+T 664+S 666+

     可及性>90%,RMSF>0.2

    D 21+S 25+V 26+P 28+S 29+A 40+D 101+G 103+G 120+S152+D 160+T 162+D 163+P 165+P 172+T 178+L 179+S 186+D 194+E 209+A 212+N 213+D 218+G 254+N 265+D 274+P 285+L 323+S 432+S 434+D435+D 439+N 440+N 466+N 469+S 498+G 499+L500+T 515+G 540+P 544+P 546+N 550+N 552+D 562+P 567+S 607+N 608+T 610+D 611+G 614+S 663+T 664+S 666+

     可及性>100%,RMSF>0.2

    D 21+S 25+V 26+P 28+S 29+A 40+D 101+G 103+G 120+D160+T 162+D 163+P 172+T 178+L 179+S 186+D 194+A 212+D218+G 254+N 265+D 274+L 323+S 432+S 434+D 435+D 439+N466+N 469+S 498+L 500+T 515+G 540+P 544+P 546+N 550+N552+D562+S 607+N 608+T 610+D 611+S 663+T 664+

     可及性>110%,RMSF>0.2

    D 21+V 26+P 28+S 29+A 40+D 101+G 120+D 160+T 162+D163+P 172+T 178+L 179+S 186+D 194+A 212+D 218+G 254+D274+L 323+S 432+S 434+D 435+D 439+N 466+N 469+S 498+L500+G 540+P 544+P 546+N 550+D 562+S 607+N 608+T 610+D611+T 664+

     可及性>120%,RMSF>0.2

    D 21+V 26+P 28+S 29+A 40+D 101+D 160+T 162+D 163+P172+T 178+L 179+S 186+D 194+A 212+D 218+G 254+D 274+S432+S 434+D 435+D 439+N 466+N 469+S 498+L 500+G 540+P544+N 550+D 562+S 607+N 608+D 611+

     可及性>130%,RMSF>0.2

    V 26+S 29+A 40+D 101+T162+D 163+P 172+T 178+L 179+S186+D 194+D 274+S 432+S 434+N 466+N 469+S 498+P 544+N550+D 562+S 607+D 611+

     可及性>140%,RMSF>0.2

    V 26+S 29+D 101+T 162+D 163+P 172+L 179+D 194+D 274+S 432+N 466+N 469+P 544+N 550+D 562+S 607+

     可及性>50%,RMSF>0.22

    H 11+S 18+D 21+K 24+S 25+V 26+P 28+S 29+A 40+D 101+L 119+G 120+D 160+T 162+D 163+P 165+Q 169+P 172+G 173+C176+S 177+T 178+L 179+Q 181+F 183+S 186+D 194+G 195+E 209+A 212+N 213+G 254+N 265+D 274+K 275+K 277+E 278+P 285+H 286+K 431+S 432+A 433+S 434+D 435+N 466+G 499+T 515+P536+G 540+G 541+K 542+P 544+D 545+P 546+K 549+N 550+N552+D 555+D562+T 564+S 607+N 608+V 609+T 610+D 611+S663+T 664+

     可及性>60%,RMSF>0.22

    H 11+S 18+D21+K 24+S 25+V 26+P 28+S 29+A 40+D 101+L119+G 120+D 160+T 162+D 163+P 165+Q 169+P 172+C 176+T178+L 179+Q 181+F 183+S 186+D 194+G 195+E 209+A 212+N213+G 254+N 265+D 274+K 275+K 277+E 278+P 285+H 286+K431+S 432+S 434+D 435+N 466+G 499+T 515+G 540+K 542+P544+P 546+K 549+N 550+N 552+D 562+T 564+S 607+N 608+T610+D 611+S 663+T 664+

     可及性>70%,RMSF>0.22

    S 18+D 21+S 25+V 26+P 28+S 29+A 40+D 101+G 120+D 160+T 162+D 163+P 165+Q 169+P 172+C 176+T 178+L 179+Q 181+S186+D 194+G 195+E 209+A 212+N 213+G 254+N 265+D 274+K275+E 278+P 285+H 286+S 432+S 434+D 435+N 466+G 499+T515+G 540+K 542+P 544+P 546+K 549+N 550+N 552+D 562+T564+S 607+N 608+T 610+D 611+S 663+T 664+

     可及性>80%,RMSF>0.22

    D 21+S 25+V 26+P 28+S 29+A 40+D 101+G 120+D 160+T162+D 163+P 165+Q 169+P 172+T 178+L 179+S 186+D 194+E 209+A 212+N 213+G 254+N 265+D 274+E 278+P 285+H 286+S 432+S 434+D 435+N 466+G 499+T 515+G 540+P 544+P 546+K 549+N550+N 552+D 562+S 607+N 608+T 610+D 611+S 663+T 664+

     可及性>90%,RMSF>0.22

    D21+S 25+V 26+P 28+S 29+A 40+D 101+G 120+D 160+T162+D 163+P 165+P 172+T 178+L 179+S 186+D 194+E 209+A 212+N 213+G 254+N 265+D 274+P 285+S 432+S 434+D 435+N 466+G 499+T 515+G 540+P 544+P 546+N 550+N 552+D 562+S 607+N608+T 610+D 611+S 663+T 664+

     可及性>100%,RMSF>0.22

    D 21+S 25+V 26+P 28+S 29+A 40+D 101+G 120+D 160+T162+D 163+P 172+T 178+L 179+S 186+D 194+A 212+G 254+N265+D 274+S 432+S 434+D 435+N 466+T 515+G 540+P 544+P 546+N 550+N 552+D 562+S 607+N 608+T 610+D 611+S 663+T 664+

     可及性>110%,RMSF>0.22

    D 21+V 26+P 28+S 29+A 40+D 101+G 120+D 160+T 162+D163+P 172+T 178+L 179+S 186+D 194+A 212+G 254+D 274+S432+S 434+D 435+N 466+G 540+P 544+P 546+N 550+D 562+S607+N 608+T 610+D6 11+T 664+

     可及性>120%,RMSF>0.22

    D 21+V 26+P 28+S 29+A 40+D 101+D 160+T 162+D 163+P172+T 178+L 179+S 186+D 194+A 212+G 254+D 274+S 432+S434+D 435+N 466+G 540+P 544+N 550+D 562+S 607+N 608+D611+

     可及性>130%,RMSF>0.22

    V 26+S 29+A 40+D 101+T 162+D 163+P 172+T 178+L 179+S186+D 194+D 274+S 432+S 434+N 466+P 544+N 550+D 562+S607+D 611+

     可及性>140%,RMSF>0.22

    V 26+S 29+D 101+T 162+D 163+P 172+L 179+D 194+D 274+S 432+N 466+P 544+N 550+D 562+S 607+

     可及性>40%,RMSF>0.24

    D 21+K 24+S 25+V 26+P 28+S 29+D 30+G 120+D 160+T 162+D163+P 165+Q 169+P 172+G 173+G 175+C 176+S 177+T 178+L179+Q 181+F 183+S 186+D 194+G 195+A 212+N 213+K 277+E278+P 285+H 286+K 431+S 432+A 433+S 434+D 435+G 540+G541+K 542+P 544+D 545+P 546+K 549+N 550+N 552+S 607+N608+V 609+T 610+S 663+

     可及性>50%,RMSF>0.24

    D21+K 24+S 25+V 26+P 28+S 29+G 120+D 160+T 162+D

    163+P 165+Q 169+P 172+G 173+C 176+S 177+T 178+L 179+Q 181+F 183+S 186+D 194+G 195+A 212+N 213+K 277+E 278+P 285+H 286+K 431+S 432+A 433+S 434+D 435+G 540+G 541+K 542+P544+D 545+P 546+K 549+N 550+N 552+S 607+N 608+V 609+T610+S 663+

     可及性>60%,RMSF>0.24

    D 21+K 24+S 25+V 26+P 28+S 29+G 120+D 160+T 162+D163+P 165+Q 169+P 172+C 176+T 178+L 179+Q 181+F 183+S 186+D 194+G 195+A 212+N 213+K 277+E 278+P 285+H 286+K 431+S 432+S 434+D 435+G 540+K 542+P 544+P 546+K 549+N 550+N552+S 607+N 608+T 610+S 663+

     可及性>70%,RMSF>0.24

    D 21+S 25+V 26+P 28+S 29+G 120+D 160+T 162+D 163+P165+Q 169+P 172+C 176+T 178+L 179+Q 181+S 186+D 194+G195+A 212+N 213+E 278+P 285+H 286+S 432+S 434+D 435+G540+K 542+P 544+P 546+K 549+N 550+N 552+S 607+N 608+T610+S 663+

     可及性>80%,RRMSF>0.24

    D 21+S 25+V 26+P 28+S 29+G 120+D 160+T 162+D 163+P165+Q 169+P 172+T 178+L 179+S 186+D 194+A 212+N 213+E278+P 285+H 286+S 432+S 434+D 435+G 540+P 544+P 546+K 549+N 550+N 552+S 607+N 608+T 610+S 663+

     可及性>90%,RMSF>0.24

    D 21+S 25+V 26+P 28+S 29+G 120+D 160+T 162+D 163+P165+P 172+T 178+L 179+S 186+D 194+A 212+N 213+P 285+S 432+S 434+D 435+G 540+P 544+P 546+N 550+N 552+S 607+N 608+T610+S 663+

     可及性>100%,RMSF>0.24

    D 21+S 25+V 26+P 28+S 29+G 120+D 160+T 162+D 163+P172+T 178+L179+S 186+D 194+A 212+S 432+S 434+D 435+G540+P 544+P 546+N 550+N 552+S 607+N 608+T 610+S 663+

     可及性>110%,RMSF>0.24

    D 21+V 26+P 28+S 29+G 120+D 160+T 162+D 163+P 172+T178+L 179+S 186+D 194+A 212+S 432+S 434+D 435+G 540+P 544+P 546+N 550+S 607+N 608+T 610+

     可及性>120%,RMSF>0.24

    D21+V 26+P 28+S 29+D 160+T 162+D 163+P 172+T 178+L179+S 186+D 194+A 212+S 432+S 434+D 435+G 540+P 544+N550+S 607+N 608+

     可及性>130%,RMSF>0.24

    V 26+S 29+T 162+D 163+P 172+T 178+L 179+S 186+D 194+S432+S 434+P 544+N 550+S 607+

     可及性>140%,RMSF>0.24

    V 26+S 29+T 162+D 163+P 172+L 179+D 194+S 432+P 544+N 550+S 607+

     可及性>40%,RMSF>0.26

    D 21+K 24+S 25+V 26+P 28+S 29+D 30+T 162+P 172+G 173+G 175+C 176+S 177+T 178+L 179+Q 181+F 183+S 186+D 194+G195+K 277+E 278+S 432+G 540+G 541+P 546+K 549+N 550+N552+N 608+V 609+T 610+

     可及性>50%,RMSF>0.26

    D 21+K 24+S 25+V 26+P 28+S 29+T 162+P 172+G 173+C 176+S 177+T 178+L 179+Q 181+F 183+S 186+D 194+G 195+K 277+E278+S 432+G 540+G 541+P 546+K 549+N 550+N 552+N 608+V609+T 610+

     可及性>60%,RMSF>0.26

    D 21+K 24+S 25+V 26+P 28+S 29+T 162+P 172+C 176+T 178+L179+Q 181+F 183+S 186+D 194+G 195+K 277+E 278+S 432+G 540+P 546+K 549+N 550+N 552+N 608+T 610+

     可及性>70%,RMSF>0.26

    D 21+S 25+V 26+P 28+S 29+T 162+P 172+C 176+T 178+L179+Q 181+S 186+D 194+G 195+E 278+S 432+G 540+P 546+K549+N 550+N 552+N 608+T 610+

     可及性>80%,RMSF>0.26

    D 21+S 25+V 26+P 28+S 29+T 162+P 172+T 178+L 179+S186+D 194+E 278+S 432+G 540+P 546+K 549+N 550+N 552+N608+T 610+

     可及性>90%,RMSF>0.26

    D 21+S 25+V 26+P 28+S 29+T 162+P 172+T 178+L 179+S186+D 194+S 432+G 540+P 546+N 550+N 552+N 608+T 610+

     可及性>100%,RMSF>0.26

    D21+S 25+V 26+P 28+S 29+T 162+P 172+T 178+L 179+S186+D 194+S 432+G 540+P 546+N 550+N 552+N 608+T 610+

     可及性>110%,RMSF>0.26

    D 21+V 26+P 28+S 29+T 162+P 172+T 178+L 179+S 186+D194+S 432+G 540+P 546+N 550+N 608+T 610+

     可及性>120%,RMSF>0.26

    D 21+V 26+P 28+S 29+T 162+P 172+T 178+L 179+S 186+D194+S 432+G 540+N 550+N 608+

     可及性>130%,RMSF>0.26

    V 26+S 29+T 162+P 172+T 178+L 179+S 186+D 194+S 432+N550+

     可及性>140%,RMSF>0.26

    V 26+S 29+T 162+P 172+L 179+D 194+S 432+N 550+

     可及性>40%,RMSF>0.28

    K 24+S 25+V 26+P 28+S 29+P 172+G 173+G 175+C 176+S177+T 178+L179+Q 181+S 186+D 194+G 195+E 278+K 549+N550+N 608+T 610+

     可及性>50%,RMSF>0.28

    K 24+S 25+V 26+P 28+S 29+P 172+G 173+C 176+S 177+T178+L179+Q 181+S 186+D 194+G 195+E 278+K 549+N 550+N608+T 610+

     可及性>60%,RMSF>0.28

    K 24+S 25+V 26+P 28+S 29+P 172+C 176+T 178+L 179+Q181+S 186+D 194+G 195+E 278+K 549+N 550+N 608+T 610+

     可及性>70%,RMSF>0.28

    S 25+V 26+P 28+S 29+P 172+C 176+T 178+L 179+Q 181+S186+D 194+G 195+E 278+K 549+N 550+N 608+T 610+

     可及性>80%,RMSF>0.28

    S 25+V 26+P 28+S 29+P 172+T 178+L 179+S 186+D 194+E278+K 549+N 550+N 608+T 610+

     可及性>90%,RMSF>0.28

    S 25+V 26+P 28+S 29+P 172+T 178+L 179+S 186+D 194+N550+N 608+T610+

     可及性>100%,RMSF>0.28

    S 25+V 26+P 28+S 29+P 172+T 178+L 179+S 186+D 194+N550+N 608+T 610+

     可及性>110%,RMSF>0.28

    V 26+P 28+S 29+P 172+T 178+L 179+S 186+D 194+N 550+N608+T 610+

     可及性>120%,RMSF>0.28

    V 26+P 28+S 29+P 172+T 178+L 179+S 186+D 194+N 550+N608+

     可及性>130%,RMSF>0.28

    V 26+S 29+P 172+T 178+L 179+S 186+D 194+N 550+

     可及性>140%,RMSF>0.28

    V 26+S 29+P 172+L 179+D 194+N 550+

     可及性>40%,RMSF>0.3

    S 25+V 26+P 28+S 29+P 172+G 173+C 176+S 177+T 178+L179+S 186+G 195+N 550+N 608+

     可及性>50%,RMSF>0.3

    S 25+V 26+P 28+S 29+P 172+G 173+C 176+S 177+T 178+L179+S 186+G 195+N 550+N 608+

     可及性>60%,RMSF>0.3

    S 25+V 26+P 28+S 29+P 172+C 176+T 178+L 179+S 186+G195+N 550+N 608+

     可及性>70%,RMSF>0.3

    S 25+V 26+P 28+S 29+P 172+C 176+T 178+L 179+S 186+G195+N 550+N 608+

     可及性>80%,RMSF>0.3

    S 25+V 26+P 28+S 29+P 172+T 178+L 179+S 186+N 550+N608+

     可及性>90%,RMSF>0.3

    S 25+V 26+P 28+S 29+P 172+T 178+L 179+S 186+N 550+N608+

     可及性>100%,RMSF>0.3

    S 25+V 26+P 28+S 29+P 172+T 178+L 179+S 186+N 550+N608+

     可及性>110%,RMSF>0.3

    V 26+P 28+S 29+P 172+T 178+L 179+S 186+N 550+N 608+

     可及性>120%,RMSF>0.3

    V 26+P 28+S 29+P 172+T 178+L 179+S 186+N 550+N 608+

     可及性>130%,RMSF>0.3

    V 26+S 29+P 172+T 178+L 179+S 186+N 550+

     可及性>140%,RMSF>0.3

    V 26+S 29+P 172+L179+N 550+

    氨基酸残基和区域的选择-步骤2

    接下来,将3个不能分辨(unresolved)的N-末端氨基酸(Wally等,(2006)Journal of Biological Chemistry,281(34),24934~24944)V1、P2和D3加到所选择的氨基酸的列表中,因为加入了不能分辨的4个N-末端氨基酸,所以校正了上面所显示的所选择氨基酸的已分配的位置编号。

    此外,可以基于残基和区域在3D模型(α螺旋和β链)中与二级结构的关系来选择残基和区域。基于J.Wally等(Journal of Biological Chemistry,281(34),24934~24944(2006))的表2或本申请图5的分析表明,所选择的氨基酸位于以下所示的与二级结构有关的位置:

    表1

    

    

    基于实施例中描述的HST 3D结构,上面进行的可及性和RMSF分析(图5)以及所进行的图谱分析,用于引入一个或多个具有自由巯基的Cys残基的优选区域可以被作为在上表中鉴定的所有的环、片层和螺旋,即V1-T5、E13-H25、M26-S36、K42-S44、Y85-T93、K103-Q108、L112-K115、T120-W128、L139-P145、F154-G156、A159-F167、P168-L170;P175-C177、G178-F186、G187-K196、D197-D201、I210-N213、L214-N216、K217-R220、D221-Q222、L226-P234、S255-K259、E260-H273、F274-H300、V305-D310、Y317-E328、G329-P341、C402-N417、C418-D420、K434-T440、W441-N443、L444-G446、Y468-K470、I471-R475、A485-S501、G502-N504、L505-Y515、G516-V526、T537-Q540、N541-D548、P549-A551、K552-N555、D558-Y559、C563-T567、R568-P570、E572-N576、E594-F608、G609-V636、L641-T646、R663-S668、S669-R677。特别优选的范围包括表1所鉴定的所有的环,并因此排除了片层和螺旋,即V1-K4、M26-P35、K42-S44、Y85-T93、K103-Q108、L112-K115、T120-W128、L139-P145、F154-S155、A159-F167、G178-F186、D197-D201、L214-N216、D221-Q222、L226-P234、S255-K259、F274-H300、V305-D310、G329-P341、C402-N417、K434-T440、L444-G446、I471-R475、A485-S501、L505-Y515、N541-D548、K552-N555、D558、C563-T567、G609-V636、L641-T646、R663-S668。

    对于具有两个叶的转铁蛋白家族蛋白,所述叶可以如J.Wally等(Journalof Biological Chemistry,281(34),24934~24944(2006))所描述的那样进行比对(align),且可选择在两个叶中都满足所述标准的残基。最优选的范围涵盖表1的N-叶和C-叶中都鉴定的环,即V1-K4、K103-Q108、L112-K115、L139-P145、A159-F167、G178-F186、F274-H300、V305-D310、G329-P341、K434-T440、L444-G446、I471-R475、A485-S501、L505-Y515、G609-V636、L641-T646。

    用于引入一个或多个具有自由巯基的Cys残基的最优选的位置由表1所述的氨基酸限定,即V1、P2、D3、K4、T5、H14、Q20、S21、D24、K27、S28、V29、P31、S32、D33、A43、E89、D104、G106、G114、L122、G123、P145、S155、D163、T165、D166、P168、P175、G176、G178、C179、S180、T181、L182、Q184、F187、S189、D197、G198、E212、A215、N216、A218、D221、D229、G257、N268、D277、K278、K280、E281、S287、P288、H289、K291、S298、P307、L326、T330、P335、T336、N413、S415、D416、D420、K434、S435、A436、S437、D438、D442、N443、G446、N469、N472、G487、K489、D491、S501、G502、L503、N510、T518、P539、Q540、G543、G544、K545、P547、D548、P549、K552、N553、N555、D558、D565、T567、P570、N576、A595、S610、N611、V612、T613、D614、S616、G617、T626、D634、D643、S666、T667、S669。

    下文将进一步(特别是就转铁蛋白)详细描述本发明,然而,本领域的技术人员会理解,这些教导也同样适用于转铁蛋白家族的其它成员,如乳铁蛋白和黑素转铁蛋白。

    转铁蛋白氨基酸序列的改变

    通过如上所选择的位置进行取代或插入来改变氨基酸序列,可以将自由巯基引入转铁蛋白分子。因此,所选的残基可以被Cys取代(氨基酸长度不变),或者Cys可以被插入在所选残基的N末端侧或C末端侧(氨基酸链长度增加)或者可以用Cys取代包括所选残基在内的一个或多个相邻残基(氨基酸链长度减少)。可以对多肽进行多个改变。

    另一方式,可以选择存在于转铁蛋白分子中的Cys残基(在HST的情况中存在38个)中的一个,所选择的Cys可以缺失或者可以用不同的氨基酸,特别是Ser、Thr、Val或Ala取代。上面所选区域中的Cys残基对应于C19、C158、C161、C177、C179、C194、C227、C331、C339、C402、C418、C474、C495、C448、C506、C523、C563、C596、C615、C620、C665。所选的Cys残基可以具体对应于C227、C241、C474、C577、C563或C665。

    巯基转铁蛋白的产生

    可通过本领域已知方法制备巯基转铁蛋白或巯基转铁蛋白与其它一种或多种蛋白的融合体(Sanker,(2004),Genetic Eng.News,24,22~28,Schmidt,(2004),Appl.Microbiol.Biotechnol.,65,363~372),所述方法包括但不限于在下列体系中表达:通过转化或瞬时表达在来自例如CHO(及其变体)、NS0、BHK、HEK293、Vero或PERC6细胞的细胞系的哺乳动物细胞培养物中(Mason等,(2004),Protein Expr.Purif.,36,318~326;Mason等,(2002),Biochemistry,41,9448~9454);昆虫细胞培养物(Lim等,(2004)Biotechnol.Prog.,20,1192~1197);来自例如浮萍(Lemna)等植物的植物细胞培养物;转基因动物(Dyck等,(2003)Trends in Biotechnology,21,394~399);转基因植物(Ma等,(2003)Nature Reviews Genetics,4,794~805);革兰氏阳性和革兰氏阴性细菌例如芽孢杆菌(Bacillus)和大肠杆菌(Escherichia coli)(Steinlein和Ikeda,(1993),Enzyme Microb.Technol.,15,193~199);丝状真菌,包括但不限于曲霉属(Aspergillus spp)(EP 238023、US 5,364,770、US 5,578,463、EP184438、EP284603、WO 2000/056900、WO9614413)、木霉属(Trichoderma spp)和镰刀菌属(Fusarium spp)(Navalainen等,(2005),Trendsin Biotechnology,23,468~473)。

    全长HST变体的多肽可由幼仓鼠肾(BHK)细胞(Mason等,(2004),Protein Expr.Purif.,36,318~326,Mason等,(2002),Biochemistry,41,9448~9454)、黑腹果蝇(D.melanogastrr)S2细胞(Lim等,(2004),BiotechnolProg.,20,1192~1197)重组表达以及由BHK细胞(Mason等,(2001),ProteinExpr.Purif.,23,142~150;Mason等,(1993),Biochemistry,32,5472~5479)和酿酒酵母(S.cerevisiae)(Sargent等,(2006),Biometals 19,513~519)重组表达为非-N-连接糖基化突变体。HST的C-叶变体的多肽(NTf/2C)可以由BHK细胞表达(Mason等,(1997),Biochem.J.,326(Pt 1),77~85)。在一个实施方案中,宿主细胞是酵母细胞,例如酵母属(Saccharomyces)、克鲁维酵母属(Kluyveromyces)或毕赤酵母属(Pichia)的成员,如酿酒酵母(Saccharomycescerevisiae)、乳酸克鲁维酵母(Kluyveromyces lactis)、巴斯德毕赤酵母(Pichiapastoris)(Mason等,(1996),Protein Expr.Purif.,8,119~125,Steinlein等,1995Protein Expr.Purif.,6,619~624)、甲醇毕赤酵母(Pichia methanolica)(Mayson等,(2003)Biotechnol.Bioeng.,81,291~298)以及膜醭毕赤酵母(Pichiamembranaefaciens),或者鲁氏接合酵母(Zygosaccharomyces rouxii)(之前被归类为二孢接合酵母(Zygosaccharomyces bisporus))、拜耳接合酵母(Zygosaccharomyces bailii)、发酵型接合酵母(Zygosaccharomyces fermentati)、多形汉逊酵母(Hansenula polymorpha)(也被称为安格斯毕赤酵母(Pichiaangusta))或果蝇克鲁维酵母(Kluyveromyces drosophilarum)是优选的。

    宿主细胞可以是任何类型的细胞。宿主细胞可以是或者不是动物(例如哺乳动物、禽类、昆虫等)、植物、真菌或细菌细胞。细菌和真菌例如酵母宿主细胞可能是或可能不是优选的。

    典型的原核载体质粒是:pUC18、pUC19、pBR322和pBR329,其可获自Biorad Laboratories(Richmond,CA,USA);pTrc99A、pKK223-3、pKK233-3、pDR540和pRIT5,其可获自Pharmacia(Piscataway,NJ,USA);pBS载体、Phagescript载体、Bluescript载体、pNH8A、pNH 16A、pNH18A、pNH46A,其可获自Stratagene Cloning Systems(La Jolla,CA 92037,USA)。

    典型的哺乳动物细胞载体质粒是pSVL,其可获自Pharmacia(Piscataway,NJ,USA)。此载体使用SV40晚期启动子来驱动克隆基因的表达,在T抗原产生细胞(例如COS-1细胞)中发现最高的表达水平。可诱导哺乳动物表达载体的一个例子是pMSG,其也可获自Pharmacia (Piscataway,NJ,USA)。此载体使用小鼠乳瘤病毒长末端重复序列的糖皮质激素诱导型启动子来驱动克隆基因的表达。

    本领域技术人员公知的方法可用于构建含有编码序列以及例如合适的转录或翻译控制子的表达载体。一种这类方法包括通过粘末端进行连接。可以在DNA片段和载体上通过合适的限制性酶作用产生相容的粘末端。这些末端会通过互补碱基配对快速退火,以及可以通过DNA连接酶的作用封闭剩下的缺口。

    另一种方法使用合成的双链寡核苷酸接头和衔接子(adaptor)。通过噬菌体T4DNA聚合酶或者E.coli DNA聚合酶I产生具有平末端的DNA片段,所述酶除去突出的3’末端并填平凹进的3’末端。可通过T4DNA连接酶将含有针对确定限制性酶的识别序列的平末端双链DNA的合成接头和片段与平末端DNA片段连接。然后用合适的限制性酶对它们进行消化以产生粘末端,并与具有相容末端的表达载体连接。衔接子也可以是含有一个用于连接的平末端但是还含有一个预形成的粘末端的化学合成DNA片段。另一种方式,可以在任选地含有粘末端的一个或多个合成双链寡核苷酸存在或不存在的情况下,通过DNA连接酶的作用将一个或多个DNA片段连接在一起。

    含有多个限制性内切酶位点的合成接头可以购自多个来源,包括Sigma-Genosys Ltd,London Road,Pampisford,Cambridge,United Kingdom。

    巯基转铁蛋白或巯基转铁蛋白与其它一个或多个蛋白的融合体由一核苷酸序列表达,该核苷酸序列可含有或不含有一个或多个内含子。另外,所述核苷酸序列可以是或可以不是通过本领域已知的方法针对宿主进行了密码子优化的核苷酸序列。

    巯基转铁蛋白或巯基转铁蛋白与其它一个或多个蛋白的融合体可以表达为一种具有经减少(reduced)的N-连接糖基化的变体。因此,在人血清转铁蛋白(human serum transferring,HST)的情况下,N413可改变为任何氨基酸,优选可改变为Q、D、E或A;S415可改变为除了S或T之外的任意氨基酸,优选可改变为A;T613可改变为除了S或T之外的任意氨基酸,优选可改变为A;N611可改变为任意氨基酸;或者上述的组合。当转铁蛋白不是HST时,可通过对蛋白一级序列的类似修饰实现N-糖基化的减少。为清楚起见,巯基转铁蛋白或巯基转铁蛋白与其它一个或多个蛋白的融合体可以都是本发明的转铁蛋白变体并且具有减少的N-连接糖基化。

    使用缺少了一种或多种参与蛋白O-糖基化的蛋白甘露糖基转移酶的酵母可能会特别有利于表达,例如通过破坏基因编码序列。重组表达的蛋白会在生产用宿主细胞中受到不必要的翻译后修饰的作用。甘露糖基化转铁蛋白能够结合凝集素刀豆蛋白A(lectin Concanavalin A)。可通过使用缺少了一个或多个PMT基因的酵母菌株来减少酵母产生的甘露糖基化转铁蛋白的量(WO94/04687)。实现此目的的最简便方法是建立基因组缺陷的酵母,使得其中一种Pmt蛋白的表达水平降低。例如,编码序列或调控序列中(或者是在调控其中一种PMT基因表达的另一基因中)可能有或者没有缺失、插入或转座,使得产生很少的或者不产生Pmt蛋白。另一种方式,可转化酵母以产生抗Pmt物质,例如抗Pmt抗体。其它方式,可在抑制其中一种PMT基因活性的化合物存在下培养酵母(Duffy等,“Inhibition of protein mannosyltransferase 1(PMT1)activity in the pathogenic yeast Candida albicans”,International Conference onMolecular Mechanisms of Fungal Cell Wall Biogenesis,26~31,2001年8月,Monte Verita,Switzerland,公告摘要(Poster Abstract)P38;可以在http://www.micro.biol.ethz.ch/cellwall/看到所述公告摘要)。如果使用酿酒酵母之外的酵母,在该酵母上进行等同于酿酒酵母PMT基因的一个或多个基因的破坏也是有利的,例如在巴斯德毕赤酵母或者乳酸克鲁维酵母中。分离自酿酒酵母的PMT1(或者任何其它PMT基因)的序列可用于鉴定或破坏在其他真菌物种中编码类似酶活性的基因。乳酸克鲁维酵母的PMT1同源物的克隆描述于WO 94/04687。

    分别如WO 95/33833和WO 95/23857所教导的,所述酵母还可以具有或者可以不具有HSP150和/或YAP3基因的缺失。

    可通过重组表达和分泌产生HST变体。当表达系统(即宿主细胞)是酵母,例如酿酒酵母时,对酿酒酵母来说合适的启动子包括与下列相关的启动子:PGK1基因、GAL1或GAL10基因、TEF1、TEF2、PYK1、PMA1、CYC1、PHO5、TRP1、ADH1、ADH2、3-磷酸甘油醛脱氢酶基因、己糖激酶基因、丙酮酸脱羧酶基因、磷酸果糖激酶基因、丙糖磷酸异构酶基因、磷酸葡萄糖异构酶基因、葡萄糖激酶基因、α-接合因子信息素(mating factor pheromone)基因、a-接合因子信息素基因、PRB1启动子、PRA1启动子、GPD1启动子以及包含5’调控区域与其它启动子的5’调控区域或上游活化位点的杂合体的杂合启动子(例如EP-A-258067的启动子)。

    合适的转录终止信号是本领域公知的。当宿主细胞是真核细胞时,转录终止信号优选来源于真核基因的3’侧翼序列,其含有用于转录终止和多腺苷酸化的正确信号。合适的3’侧翼序列可以是,例如,天然连接于所用表达调控序列的基因的3’侧翼序列,即其可对应于启动子。在另一情况下,它们可以是不同的。在这种情况下,当宿主是酵母(优选酿酒酵母)时,酿酒酵母ADH1、ADH2、CYC1或PGK1基因的终止信号是优选的。

    对于编码包含转铁蛋白突变体序列的重组蛋白的基因的启动子和开放读码框来说可能有益的是,其侧翼连接转录终止序列使得在启动子和开放读码框的上游和下游都有转录终止序列,以防止转录通读(transcriptionalread-through)进入其它相邻基因,例如2μm基因,反之亦然。

    在一个实施方案中,酵母(例如酿酒酵母)中优选的调控序列包括:酵母启动子(例如酿酒酵母PRB1启动子),如EP 431880中教导的;和转录终止子,优选为来自酵母ADH1的终止子,如EP 60057中所教导的。

    对于非编码区域来说可能有益的是,并入多于一个的编码翻译终止密码子的DNA序列,例如UAA、UAG或UGA,使得翻译通读最小化,由此避免产生延长的非天然融合蛋白。优选的是翻译终止密码子UAA。

    在一个优选实施方案中,分泌包含转铁蛋白突变体序列的重组蛋白。在那种情况下,编码分泌前导序列的序列可包含在开放读码框中。因此,根据本发明的多核苷酸可包含编码重组蛋白的序列,该重组蛋白包含了能与编码分泌前导序列的多核苷酸序列可操作连接的转铁蛋白突变体的序列。前导序列经常(尽管不是必需)位于ORF的初始翻译产物的N-末端,一般来说(尽管不是必需的)在分泌过程中从蛋白质上被切下,而产生“成熟”蛋白质。因此,在一个实施方案中,在前导序列背景下术语“可操作连接”涵盖以下含义:编码包含转铁蛋白突变体序列的重组蛋白序列在其5’端和在框内与编码分泌前导序列的多核苷酸序列的3’端连接。在另外的情况下,编码分泌前导序列的多核苷酸序列可在框内,位于包含转铁蛋白突变体序列的重组蛋白的编码序列内,或者位于包含转铁蛋白突变体序列的重组蛋白的编码序列的3’端。

    已使用或开发了许多天然或人工多肽前导序列(也称为分泌前区域和前/原区域(pre/pro region))用于从宿主细胞分泌蛋白质。前导序列将初生蛋白(nascent protein)导向细胞机器,该细胞机器将蛋白质从细胞输出到周围的介质或者,在某些情况下,输出到周质空间中。

    对于在真核物种(例如酿酒酵母,接合酵母的各个种,乳酸克鲁维酵母和巴斯德毕赤酵母等酵母)中生产蛋白质来说,可使用分泌前导序列。这可以包括信号(前)序列或前原前导序列(prepro leader sequence)。信号序列已知在其氨基酸序列上是异源的(Nothwehr和Gordon 1990,Bioessays 12,479~484,或Gierasch 1989,Biochemistry 28,p923~930)。实质上,信号序列一般位于N-末端,其具有碱性n-区,疏水h-区和极性c-区。只要保留该结构,信号序列就可以工作,而与氨基酸组成无关。它们工作的情况如何,即分泌成熟蛋白质的多少,取决于氨基酸序列。因此,术语“信号肽”应理解为是本质上主要为疏水的前序列,它以在酵母中表达的胞外蛋白的前体形式的N-末端序列存在。信号肽的功能是使得所表达的蛋白质分泌进入内质网。在此过程中,信号肽通常被切下。信号肽可以是与生产蛋白质的酵母生物体同源或异源的。已知的前导序列包括来自下列的那些:酿酒酵母酸性磷酸酶蛋白(Pho5p)(参见EP 366400),转化酶蛋白(Suc2p)(参见Smith等(1985)Science,229,1219~1224)以及热休克蛋白-150(Hsp150p)(参见WO 95/33833)。另外,已使用来自酿酒酵母交配因子α-1蛋白(MFα-1)的前导序列和来自人溶菌酶和人血清白蛋白(HSA)的前导序列,后者尤其(尽管不是排他的)用于分泌人白蛋白。WO 90/01063公开了MFα-1和HSA前导序列的融合体。另外,天然转铁蛋白前导序列可以用于或可以不用于指导包含转铁蛋白突变体的序列的重组蛋白的分泌。

    本领域技术人员会理解的是,可使用任何合适的质粒,例如着丝粒质粒。实施例提供了用于转化本发明酵母宿主细胞的合适质粒(基于着丝粒型YCplac33的载体)。作为选择,可使用任何其它合适的质粒,例如与酵母相容的基于2μm的质粒(yeast-compatible 2μm-based plasmid)。

    从一种酵母类型获得的质粒可以在其它酵母类型中维持(Irie等,1991,Gene,108(1),139~144;Irie等,1991,Mol.Gen.Genet.,225(2),257~265)。例如,来自鲁氏接合酵母的pSR1可在酿酒酵母中维持。在一个实施方案中,所述质粒可以是或可以不是2μm家族质粒,宿主细胞将与所用的2μm家族质粒相容(参见下文对下述质粒的完整描述)。例如,当所述质粒基于pSR1、pSB3或pSB4时,则合适的酵母细胞是鲁氏接合酵母;当所述质粒基于pSB1或pSB2时,则合适的酵母细胞是拜耳接合酵母;当所述质粒基于pSM1时,则合适的酵母细胞是发酵型接合酵母;当所述质粒基于pKD1时,则合适的酵母细胞是果蝇克鲁维酵母;当所述质粒基于pPM1时,则合适的酵母细胞是膜醭毕赤酵母;当所述质粒基于2μm质粒时,则合适的酵母细胞是酿酒酵母或者卡尔斯伯酵母(Saccharomyces carlsbergensis)。因此,所述质粒可以基于2μm质粒,所述酵母细胞可以是酿酒酵母。如果其包含具有来源于天然存在质粒(naturally occurring plasmid)的序列的FLP、REP1和REP2基因中的1个、2个或所优选的3个,那么该2μm家族质粒可以被称为“基于”天然存在质粒。

    可采用的酵母附加型质粒(episomal plasmid)载体是pRS403-406和pRS413-416,一般可从Stratagene Cloning Systems(La Jolla,CA 92037,USA)、YEp24(Botstein,D.,等(1979)Gene 8,17~24)以及YEplac122、YEplac195和YEplac181(Gietz,R.D.和Sugino.A.(1988)Gene 74,527~534)获得。其它酵母质粒记载在WO 90/01063和EP 424117,以及EP-A-286424和WO2005061719的“非整合型载体(disintegration vector)”。质粒pRS403、pRS404、pRS405和pRS406是酵母整合型质粒(YIp),其包含酵母选择标记HIS3、TRP1、LEU2和URA3,如YIplac204、YIplac211和YIplac128(Gietz,R.D.和Sugino.A.(1988)Gene 74,527~534)。质粒pRS413-416是酵母着丝粒质粒(YCp),如YCplac22、YCplac33和YCplac111(Gietz,R.D.和Sugino.A.(1988)Gene 74,527~534)。

    当质粒携带的多核苷酸序列编码一个或多个辅助蛋白和/或所选择的蛋白产物时,可根据与所用质粒类型的相容性选择宿主细胞类型。这些质粒记载在WO2005061719。优选的辅助蛋白包括PDI1、AHA1、ATP11、CCT2、CCT3、CCT4、CCT5、CCT6、CCT7、CCT8、CNS1、CPR3、CPR6、DER1、DER3、DOA4、ERO1、EUG1、ERV2、EPS1、FKB2、FMO1、HCH1、HRD3、HSP10、HSP12、HSP104、HSP26、HSP30、HSP42、HSP60、HSP78、HSP82、KAR2、JEM1、MDJ1、MDJ2、MPD1、MPD2、PDI1、PFD1、ABC1、APJ1、ATP11、ATP12、BTT1、CDC37、CPR7、HSC82、KAR2、LHS1、MGE1、MRS11、NOB1、ECM10、SCJ1、SSA1、SSA2、SSA3、SSA4、SSB1、SSB2、SSC1、SSE2、SIL1、SLS1、ORM1、ORM2、PER1、PTC2、PSE1、UBC7、UBI4和HAC1或者截短的无内含子HAC1(Valkonen等,2003,Applied Environ.Micro.,69,2065)。这些辅助蛋白公开于WO 2005/061718、WO 2006/067511和WO 2006/136831。

    可通过标准技术将如上所定义的质粒引入到宿主中。有关原核宿主细胞的转化,参见例如Cohen等(1972)Proc.Natl.Acad.Sci.USA 69,2110和Sambrook等(2001)Molecular Cloning,A Laboratory Manual,第3版.ColdSpring Harbor Laboratory,Cold Spring Harbor,NY。记载在Sherman等(1986)Methods In Yeast Genetics,A Laboratory Manual,Cold Spring Harbor,NY。Beggs(1978)Nature 275,104~109中的酵母细胞转化方法也是可用的。转化酿酒酵母的方法在EP 251744、EP 258067和WO 90/01063中有一般性教导,其所有内容通过参考并入本文。关于脊椎动物细胞,可用于转染这些细胞的试剂,例如磷酸钙和DEAE-葡聚糖或者脂质体制剂可从Stratagene Cloning Systems或Life Technologies Inc.,Gaithersburg,MD 20877,USA获得。

    电穿孔也可用于转化细胞,其用于转化真菌(包括酵母)细胞、植物细胞、细菌细胞和动物(包括脊椎动物)细胞是本领域公知的。通过电穿孔转化酵母的方法公开于Becker&Guarente(1990)Methods Enzymol.194,182。

    一般来说,质粒并不会转化所有的宿主,因此需要选择所转化的宿主细胞。因此,质粒可包含选择标记,包括但不限于细菌选择标记和/或酵母选择标记。典型的细菌选择标记是β-内酰胺酶基因,不过许多其它标记也是本领域已知的。典型的酵母选择标记包括LEU2、TRP1、HIS3、HIS4、URA3、URA5、SFA1、ADE2、MET15、LYS5、LYS2、ILV2、FBA1、PSE1、PDI1和PGK1。本领域技术人员知道,当质粒上提供了功能性基因时,染色体缺失或失活导致宿主致死的任何基因(所谓的必需基因)可用作选择标记,如pgk1酵母菌株中的PGK1所证明的(Piper和Curran,1990,Curr.Genet.17,119)。合适的必需基因可在Stanford Genome Database(SGD)(http:://db.yeastgenome.org)中找到。当宿主细胞缺乏质粒而无法产生那个基因产物时,任何在缺失或失活时不导致营养缺陷型(生物合成)需求的必需基因产物(例如PDI1、PSE1、PGK1或FBA1)可用作质粒上的选择标记,以增加质粒稳定性,而同时又没有细胞必需培养在特异性选择条件下的缺陷。“营养缺陷型(生物合成)需求”涵盖可通过向生长培养基中添加物质或对其进行修饰来补足的缺陷。因此,本申请上下文中优选的“必需标记基因”是在宿主细胞中缺失或失活时,导致无法通过向生长培养基中添加物质或对其进行修饰来补足缺陷的基因。另外,质粒可包含一个以上的选择标记。

    转化的宿主细胞可在本领域技术人员已知的合适条件下培养足够的时间,考虑到本文所公开的教导,以允许辅助蛋白和所选蛋白产物表达。

    培养基可以是非选择性的,或者对质粒的维持施加选择压力。

    培养原核宿主细胞(例如大肠杆菌)和真核细胞(例如哺乳动物细胞)的方法是本领域公知的。培养酵母的方法在EP 330451和EP 361991中有一般性教导。

    由此产生的所选蛋白产物可以存在于细胞内,或者如果分泌的话,则存在于培养基和/或宿主细胞的周质空间。

    因此,本发明还提供产生所选蛋白产物的方法,该方法包括:a)提供如上所定义的本发明宿主细胞,它包含编码所选蛋白产物的多核苷酸;和b)使宿主细胞生长(例如,在培养基中培养宿主细胞);由此产生细胞培养物或重组生物体,与在相同条件下使未进行遗传修饰而引起一种或多种辅助蛋白过表达的相同宿主细胞生长(例如培养)所达到的所选蛋白产物生产水平相比,本发明宿主细胞的所选蛋白产物水平提高。

    使所述宿主细胞生长的步骤可以包括或不包括使来源于多细胞生物体的宿主细胞再次生长为多细胞重组生物体(例如植物或动物),以及任选地产生它们的一代或多代后代。

    所述方法可以另外包括或不包括从培养的宿主细胞、重组生物体或培养基中纯化由此表达的所选蛋白产物的步骤。

    “从培养的宿主细胞、重组生物体或培养基中纯化由此表达的所选蛋白产物”的步骤任选地包括细胞固定、细胞分离和/或细胞破碎,但是总是包括与细胞固定、分离和/或破碎的一个或多个步骤不同的至少一个其它纯化步骤。

    可以通过任何已发现可用于纯化这些蛋白质的技术从培养基中纯化本发明的巯基转铁蛋白。类似的,细胞分离技术,例如离心、过滤(例如错流过滤和膨胀床色谱等)是本领域公知的。同样,细胞破碎的方法,包括珠磨(beadmilling)、超声处理和酶接触等,也是本领域公知的。

    “至少一个其它纯化步骤”可以是本领域中已知的适于蛋白质纯化的任何其它步骤。例如,用于回收重组表达的白蛋白的纯化技术已公开于:WO92/04367,除去基质来源的染料;EP 464590,除去酵母来源的着色剂;EP319067,碱性沉淀和随后将白蛋白施加到亲脂相;以及WO 96/37515、US 5728553和WO 00/44772,其公开了完整的纯化过程;所有这些都通过参考并入本文。合适的方法包括硫酸铵或乙醇沉淀、酸或溶剂萃取、阴离子或阳离子交换色谱、磷酸纤维素色谱、疏水相互作用色谱、亲和色谱、羟基磷灰石色谱、凝集素色谱、浓缩、稀释、pH调节、渗滤、超滤、高效液相色谱(“HPLC”)、反相HPLC和传导性调节等。

    在一个实施方案中,上述技术的任一项或多项可用于或不用于进一步将由此分离的蛋白质纯化至商业或工业可接受的纯度水平。商业或工业可接受的纯度水平涵盖了所提供的蛋白的浓度至少为:10-4g.L-1、10-3g.L-1、0.01g.-1、0.02g.L-1、0.03g.L-1、0.04g.L-1、0.05g.L-1、0.06g.L-1,0.07g.L-1、0.08g.L-1、0.09g.L-1、0.1g.L-1、0.2g.L-1、0.3g.L-1、0.4g.L-1、0.5g.L-1、0.6g.L-1、0.7g.L-1、0.8g.L-1、0.9g.L-1、1g.L-1、2g.L-1、3g.L-1、4g.L-1、5g.L-1、6g.L-1、7g.L-1、8g.L-1、9g.L-1、10g.L-1、15g.L-1、20g.L-1、25g.L-1、30g.L-1、40g.L-1、50g.L-1、60g.L-1、70g.L-1、70g.L-1、90g.L-1、100g.L-1、150g.L-1、200g.L-1、250g.L-1、300g.L-1、350g.L-1、400g.L-1、500g.L-1、600g.L-1、700g.L-1、800g.L-1、900g.-1、1000g.L-1或更高。

    可通过相对粗的纯化方法获得商业或工业可接受的纯度水平,通过该方法,所选蛋白质产物被制成适合其预定目的的形式。除了所选蛋白质产物之外,已纯化至商业或工业可接受纯度水平的蛋白质制备物还可包含,例如,细胞培养物组分(如宿主细胞或来源于宿主细胞的碎片)。或者,可除去或者不除去(例如通过过滤或离心)高分子量组分(例如宿主细胞或来源于宿主细胞的碎片),以获得包含所选蛋白质产物,以及任选地功能上可接受水平的来源于细胞培养过程的低分子量污染物的组合物。

    蛋白质可经过纯化或不经过纯化来达到药学可接受的纯度水平。如果基本上无热原并且可用于其预定目的,因此可以以药学有效量施用而不造成与蛋白质活性不相关的医学作用,则蛋白质具有药学可接受的纯度水平。

    本发明的方法可以或不需要进一步包括将纯化的所选蛋白质产物与载体或稀释剂配制在一起,并任选地将由此配制的蛋白质以单位剂量形式提供的步骤。

    尽管通过本发明方法获得的可用于治疗的蛋白质可单独施用,但是优选将其与一种或多种可接受载体或稀释剂一起以药剂形式提供。所述载体或稀释剂必须是“可接受的”,意味着与所需蛋白质相容。通常,所述载体或稀释剂是无菌且无热原的水或盐水。

    另外,本发明的方法可以进一步包括或者可以不包括将由此纯化的所选蛋白质产物冻干的步骤。

     巯基转铁蛋白或偶联物的配制

    可通过在“Protein Formulation and Delivery”,E.J.McNally(编),由MarcelDekker Inc.出版,New York 2000和“Rational Design of Satble ProteinFormulations-Theory and Practice”;J.F.Carpenter和M.C.Manning(编)Pharmaceutical Biotechnology,第13卷.Kluwer Academic/Plenum Publishers,New York 2002,Yazdi和Murphy,(1994)Cancer Research 54,6387~6394,Widera等,(2003)Pharmaceutical Research 20,1231~1238;Lee等,(2005)Arch.Pharm.Res.28,722~729中给出的方法配制巯基转铁蛋白。配制方法的实例如下:

    方法#1:纯化之后,本发明的含自由巯基的转铁蛋白突变蛋白或偶联物可于4℃、-20℃或-80℃,保存在含有0.01M~0.2M NaCl的0.01M~0.1M磷酸缓冲盐溶液(pH 7.0~8.0)中。

    方法#2:纯化之后,本发明的含自由巯基的转铁蛋白突变蛋白或偶联物可于4℃、-20℃或-80℃,保存在含有0.01M~0.2M NaCl和含有10mg/L~20mg/L聚山梨醇酯80(Polysorbate 80)的0.01M~0.1M磷酸缓冲盐溶液(pH7.0~8.0)中。

    方法#3:纯化之后,本发明的含自由巯基的转铁蛋白突变蛋白或偶联物可于4℃、-20℃或-80℃,保存在0.01M~0.2M NaCl(pH 7.0~8.0)中。

    方法#4:纯化之后,本发明的含自由巯基的转铁蛋白突变蛋白或偶联物可于4℃、-20℃或-80℃,保存在含有10mg/L~20mg/L聚山梨醇酯80(Polysorbate 80)的0.01M~0.2M NaCl(pH 7.0~8.0)中。

     冻干制剂

    方法#5:纯化之后,本发明的含自由巯基的转铁蛋白突变蛋白或偶联物可用水进行透析,冻干并保存于4℃、-20℃或-80℃。

    方法#6:纯化之后,本发明的含自由巯基的转铁蛋白突变蛋白或偶联物可用0.01M~0.2M NaCl(pH 7.0~8.0)进行透析,冻干并保存于4℃、-20℃或-80℃。

     纳米颗粒

    方法#7:纯化之后,本发明的含自由巯基的转铁蛋白突变蛋白或偶联物可配制成根据制备纳米颗粒的已知方法制备的纳米颗粒,所述方法例如WO2004/071536A1和WO 2008/007146A1(两者均通过参考并入本文)中所公开的程序。

    生物活性化合物

    生物活性化合物可以是治疗性或诊断性化合物。治疗性化合物可以是用于癌症化疗的化疗药。所述生物活性化合物可以是细胞抑制性或细胞毒性生物活性化合物;所述生物活性化合物也可以是肿瘤抑制性物质。

    所述生物活性化合物可以已含有自由巯基,例如含具有自由巯基的半胱氨酸残基的多肽。在另一种情况下,所述生物活性化合物可以被修饰成含有自由巯基。因此,多肽的氨基酸序列经过改变可包含具有自由巯基的半胱氨酸残基,或者可以用化学方法将所述生物活性化合物衍生为包含自由巯基。

    所述生物活性化合物可以是多肽(蛋白质),特别是重组蛋白质药物。所述生物活性化合物可以是用于治疗癌症和其它相关疾病的化疗药或放疗药。

    本发明的含自由巯基的转铁蛋白突变蛋白(巯基转铁蛋白)可以根据本领域已知的方法,通过一个或多个自由巯基(如果本发明的转铁蛋白突变蛋白含有多于一个自由巯基的话)与至少一个生物活性化合物相偶联。所述生物活性化合物包括但不限于:肽、多肽或蛋白质(天然的、重组的或合成的)(Debinski,(2002)Cancer Investigation 20,801~809;O’Keefe和Draper等,(1985)JBC 260,932~937;Xia等,(2000)J.Pharmacology ExperimentalTherapeutics 295,594~600;Kavimandan等,(2006)Bioconjugate Chem.17,1376~1384;Humphries,等,(1994)J.Tissue Culture Methods 16,239~242;Wenning等,(1998)Biotech.Bioeng.57,484~496;Yazdi和Murphy,(1994)Cancer Research 54,6387~6394;Weaver和Laske(2003)J.Neuro-Oncology 65,3~13;Widera等,(2003)Pharmaceutical Research 20,1231~1238;Daniels,T.R.等(2006)Clinical Immunology 121,159~176以及其中包含的参考文献);治疗性和诊断性药物或化合物(Mishra等,(2006)J.Drug Targeting 14,45~53;Lim和Shen,(2004)Pharmaceutical Research 21,1985~1992;Fritzer等,(1996)Biochemical Pharmacology 51,489~493;Lubgan和JozWiak(2002)Cell.Mol.Biol.Lett.7,98;Daniels,T.R.等(2006)Clinical Immunology 121,159~176以及其中包含的参考文献);高分子量复合物,其包括但不限于脂质体、病毒和纳米颗粒(Mishra等,(2006)J.Drug Targeting 14,45~53;Daniels,T.R.等(2006)Clinical Immunology 121,159~176以及其中包含的参考文献);核酸和放射性核素,包括DNA,RNA(包括siRNA)及其类似物(Lee等,(2005)Arch.Pharm.Res.28,722~729;Huang等,(2007)FASEB J.21,1117~1125;Daniels,T.R.等(2006)Clinical Immunology 121,159~176以及其中包含的参考文献)以及装置(Humphries等,(1994)J.Tissue Culture Methods 16,239~242以及其中包含的参考文献)。另外,所述实体自身可被本领域已知的方法修饰。

     治疗性化合物

    4-1BB配体、5-螺旋、人C-C趋化因子、人L105趋化因子、命名为huL105_3的人L105趋化因子、γ-干扰素诱导的单核因子(MIG)、部分CXCR4B蛋白、血小板碱性蛋白(PBP)、α1-抗胰蛋白酶、ACRP-30同源物;补体组分C1q C、腺样增殖体表达的趋化因子(ADEC)、aFGF、FGF-1、AGF、AGF蛋白、白蛋白、依托泊苷、血管抑制素、炭疽疫苗、瓦解蛋白特异性抗体、antistasin、抗-TGFβ家族抗体、抗凝血酶III、APM-1、ACRP-30、Famoxin、载脂蛋白类(apo-lipoprotein species)、芳基硫酸酯酶B、b57蛋白、BCMA、β-血小板球蛋白(β-TG)、bFGF;FGF2、凝血因子、BMP加工酶Furin、BMP-10、BMP-12、BMP-15、BMP-17、BMP-18、BMP-2B、BMP-4、BMP-5、BMP-6、BMP-9、骨形态发生蛋白-2、降钙素、钙激活蛋白酶-10a、钙激活蛋白酶-10b、钙激活蛋白酶-10c、癌症疫苗、羧肽酶、C-C趋化因子、MCP2、CCR5变体、CCR7、CCR7、CD11a Mab、CD137;4-1BB受体蛋白、CD20Mab、CD27、CD27L、CD30、CD30配体、CD33免疫毒素、CD40、CD40L、CD52Mab、Cerebus蛋白、趋化因子嗜酸粒细胞趋化因子(Chemokine Eotaxin.)、趋化因子hIL-8、趋化因子hMCP1、趋化因子hMCP1a、趋化因子hMCP1b、趋化因子hMCP2、趋化因子hMCP3、趋化因子hSDF1b、趋化因子MCP-4、趋化因子TECK和TECK变体、趋化因子样蛋白IL-8M1全长和成熟蛋白、趋化因子样蛋白IL-8M10全长和成熟蛋白、趋化因子样蛋白IL-8M3、趋化因子样蛋白IL-8M8全长和成熟蛋白、趋化因子样蛋白IL-8M9全长和成熟蛋白、趋化因子样蛋白PF4-414全长和成熟蛋白、趋化因子样蛋白PF4-426全长和成熟蛋白、趋化因子样蛋白PF4-M2全长和成熟蛋白、霍乱疫苗、软骨调节素样蛋白、c-kit配体;SCF;肥大细胞生长因子;MGF;纤维肉瘤衍生干细胞因子、CNTF及其片段(如CNTFAx15`(AxokineTM))、凝血因子的前体形式和活性形式、胶原蛋白、补体C5Mab、结缔组织活化蛋白-III、CTAA16.88Mab、CTAP-III、CTLA4-Ig、CTLA-8、CXC3、CXC3、CXCR3;CXC趋化因子受体3、蓝藻抗病毒蛋白-N(cyanovirin-N)、达依泊汀(Darbepoetin)、命名为exodus,命名为huL105_7.、DIL-40、DNA酶、EDAR、EGF受体Mab、ENA-78、内皮抑素(Endostatin)、嗜酸粒细胞趋化因子(Eotaxin)、上皮嗜中性白细胞活化蛋白-78、EPO受体;EPOR、促红细胞生成素(EPO)和EPO模拟物、Eutropin、Exodus蛋白、因子IX、因子VII、因子VIII、因子X和因子XIII、FAS配体抑制蛋白(DcR3)、FasL、FasL、FasL、FGF、FGF-12;成纤维细胞生长因子同源因子-1、FGF-15、FGF-16、FGF-18、FGF-3;INT-2、FGF-4;白树素(gelonin)、HST-1;HBGF-4、FGF-5、FGF-6;肝素结合分泌型转化因子-2、FGF-8、FGF-9;神经胶质活化因子、纤维蛋白原、flt-1、flt-3配体、促滤泡激素α亚基、促滤泡激素β亚基,促滤泡素(Follitropin)、神经趋化蛋白(Fractalkine)、片段、肌原纤维蛋白、肌钙蛋白I、FSH、半乳糖苷酶、Galectin-4、G-CSF、GDF-1、基因治疗药、神经胶质瘤衍生生长因子、胰高血糖素、胰高血糖素样肽、葡糖脑苷脂酶、葡萄糖氧化酶、葡萄糖苷酶、Glycodelin-A;孕酮相关子宫内膜蛋白、GM-CSF、促性腺激素、粒细胞趋化蛋白-2(GCP-2)、粒细胞巨噬细胞集落刺激因子、生长激素、生长相关致癌基因-α(GRO-α)、生长相关致癌基因-β(GRO-β)、生长相关致癌基因-γ(GRO-γ)、hAPO-4;TROY、hCG、乙肝表面抗原、乙肝疫苗、HER2受体Mab、水蛭素、HIV gp120、HIVgp41、HIV抑制肽、HIV抑制肽、HIV抑制肽、HIV蛋白酶抑制肽、HIV-1蛋白酶抑制剂、HPV疫苗、人6CKine蛋白、人Act-2蛋白、人脂肪形成抑制因子、人B细胞刺激因子-2受体、人β-趋化因子H1305(MCP-2)、人C-C趋化因子DGWCC、人CC趋化因子ELC蛋白、人CC型趋化因子白介素C、人CCC3蛋白、人CCF 18趋化因子、命名为SLC的人CC-型趋化因子蛋白(次级淋巴趋化因子)、短形式的人趋化因子β-8、人趋化因子C10、人趋化因子CC-2、人趋化因子CC-3、人趋化因子CCR-2、人趋化因子Ckβ-7、人趋化因子ENA-78、人趋化因子嗜酸粒细胞趋化因子、人趋化因子GROα、人趋化因子GROα、人趋化因子GROβ、人趋化因子HCC-1、人趋化因子HCC-1、人趋化因子I-309、人趋化因子IP-10、人趋化因子L105_3、人趋化因子L105_7、人趋化因子MIG、人趋化因子MIG-β蛋白、人趋化因子MIP-1α、人趋化因子MIP1β、人趋化因子MIP-3α、人趋化因子MIP-3β、人趋化因子PF4、人趋化因子蛋白331D5、人趋化因子蛋白61164、人趋化因子受体CXCR3、人趋化因子SDF1α、人趋化因子SDF1β、人趋化因子ZSIG-35、人Chr19Kine蛋白、人CKβ-9、人CKβ-9、人CX3C 111氨基酸趋化因子、人DNAX白介素-40、人DVic-1C-C趋化因子、人EDIRF I蛋白序列、人EDIRF II蛋白序列、人嗜酸细胞CC型趋化因子嗜酸粒细胞趋化因子、人嗜酸细胞表达的趋化因子(EEC)、人快速收缩骨骼肌肌钙蛋白C、人快速收缩骨骼肌肌钙蛋白I、人快速收缩骨骼肌肌钙蛋白C亚基、人快速收缩骨骼肌肌钙蛋白I亚基蛋白、人快速收缩骨骼肌肌钙蛋白T亚基、人快速收缩骨骼肌肌钙蛋白T、人胎儿脾表达的趋化因子、FSEC、人GM-CSF受体、人gro-α趋化因子、人gro-β趋化因子、人gro-γ趋化因子、人IL-16蛋白、人IL-1RD10蛋白序列、人IL-1RD9、人IL-5受体α链、人IL-6受体、人IL-8受体蛋白hIL8RA、人IL-8受体蛋白hIL8RB、人IL-9受体蛋白、人IL-9受体蛋白变体#3、人IL-9受体蛋白变体片段、人IL-9受体蛋白变体片段#3、人白介素1δ、人白介素10、人白介素10、人白介素18、人白介素18衍生物、人白介素-1β前体、人白介素-1β前体、人白介素-1受体辅助蛋白、人白介素-1受体拮抗剂β、人白介素-13型受体、人白介素-10(前体)、人白介素-10(前体)、人白介素-11受体、人白介素-1240kD亚基、人白介素-12β-1受体、人白介素-12β-2受体、人白介素-12p35蛋白、人白介素-12p40蛋白、人白介素-12受体、人白介素-13α受体、人白介素-13β受体、人白介素-15、来自克隆P1的人白介素-15受体、人白介素-17受体、人白介素-18蛋白(IL-18)、人白介素-3、人白介素-3受体、人白介素-3变体、人白介素-4受体、人白介素-5、人白介素-6、人白介素-7、人白介素-7.、人白介素-8(IL-8)、人细胞内IL-1受体拮抗剂、人IP-10和HIV-1 gp120高可变区融合蛋白、人IP-10和人Muc-1核心表位(VNT)融合蛋白、人肝和活化调节趋化因子(LARC)、人Lkn-1全长和成熟蛋白、人乳腺相关趋化因子(MACK)蛋白全长和成熟蛋白、人成熟趋化因子Ckβ-7、人成熟gro-α、用于治疗败血症的人成熟gro-γ多肽、人MCP-3和人Muc-1核心表位(VNT)融合蛋白、人MI10蛋白、人MI1A蛋白、人单核细胞化学吸引剂因子hMCP-1、人单核细胞化学吸引剂因子hMCP-3、人单核细胞趋化前蛋白(MCPP)序列、人神经趋化因子样结构域(Human neurotactin chemokine likedomain)、人非ELR CXC趋化因子H174、人非ELR CXC趋化因子IP10、人非ELR CXC趋化因子Mig、人PAI-1突变体、具有IL-16活性的人蛋白、具有IL-16活性的人蛋白、人次级淋巴趋化因子(SLC)、人SISD蛋白、人STCP-1、人基质细胞衍生趋化因子、SDF-1、人T细胞混合淋巴细胞反应表达趋化因子(TMEC)、人胸腺和活化调节细胞因子(TARC)(人胸腺表达的)、人TNF-α、人TNF-α、人TNF-β(LT-α)、人CC型趋化因子嗜酸粒细胞趋化因子3蛋白序列、人II型白介素-1受体、人野生型白介素-4(hIL-4)蛋白、人ZCHEMO-8蛋白、人源化抗VEGF抗体及其片段、人源化抗VEGF抗体及其片段、透明质酸酶、ICE10kD亚基、ICE 20kD亚基、ICE 22kD亚基、艾杜糖醛酸-2-硫酸酯酶、艾杜糖酶、IL-1α、IL-1β、IL-1抑制剂(IL-1i).、IL-1成熟蛋白、IL-10受体、IL-11、IL-11、IL-12p40亚基、IL-13、IL-14、IL-15、IL-15受体、IL-17、IL-17受体、I1-17受体、I1-17受体、IL-19、IL-1i片段、IL1-受体拮抗剂、IL-21(TIF)、含IL-3融合蛋白、IL-3突变体蛋白、IL-3变体、IL-3变体、IL-4、IL-4突变蛋白、IL-4突变蛋白Y124G、IL-4突变蛋白Y124X、IL-4突变蛋白、Il-5受体、IL-6、II-6受体、IL-7受体克隆、IL-8受体、IL-9成熟蛋白变体(Met117版本)、免疫球蛋白或基于免疫球蛋白的分子或二者其一的片段(例如Small ModularImmunoPharmaceuticalTM(“SMIP”)或dAb、Fab’片段、F(ab’)2、scAb、scFv或scFv片段),包括但不限于血纤维蛋白溶酶原(plasminogen)、流感病毒疫苗、抑制素α、抑制素β、胰岛素、胰岛素样生长因子、整合素Mab、间-α胰蛋白酶抑制剂、间-α胰蛋白酶抑制剂、干扰素γ-可诱导型蛋白(IP-10)、干扰素(如干扰素α类及亚类、干扰素β类及亚类、干扰素γ类及亚类)、干扰素(如干扰素α类及亚类、干扰素β类及亚类、干扰素γ类及亚类)、白介素6、白介素8(IL-8)受体、白介素8受体B、白介素-1α、白介素-2受体相关蛋白p43、白介素-3、白介素-4突变蛋白、白介素-8(IL-8)蛋白、白介素-9、白介素-9(IL-9)成熟蛋白(Thr117版本)、白介素(如IL10、IL11和IL2)、白介素(如IL10、IL11和IL2)、日本脑炎病毒疫苗、激肽释放酶(kalikrein)抑制剂、角化细胞生长因子、Kunitz结构域蛋白(如抑蛋白酶肽(aprotinin)、淀粉样前体蛋白以及WO 03/066824中描述的那些蛋白,融合或没有融合白蛋白)、Kunitz结构域蛋白(如抑蛋白酶肽(aprotinin)、淀粉样前体蛋白以及WO 03/066824中描述的那些蛋白,融合或没有融合白蛋白)、LACI、乳铁蛋白、潜在TGF-β结合蛋白II、瘦素、肝表达的趋化因子-1(LVEC-1)、肝表达的趋化因子-2(LVEC-2)、LT-α、LT-β、黄体化激素、莱姆病疫苗、淋巴细胞趋化因子(Lymphotactin)、巨噬细胞来源的趋化因子类似物MDC(n+1)、巨噬细胞来源的趋化因子类似物MDC-eyfy、巨噬细胞来源的趋化因子类似物MDC-yl、巨噬细胞来源的趋化因子、MDC、巨噬细胞来源的趋化因子(MDC)、Maspin;蛋白酶抑制剂5、MCP-1受体、MCP-1a、MCP-1b、MCP-3、MCP-4受体、M-CSF、黑色素瘤抑制蛋白、膜结合蛋白、Met117人白介素9、MIP-3α、MIP-3β、MIP-γ、MIRAP、修饰的Rantes、单克隆抗体、MP52、突变体白介素6S176R、肌原纤维收缩蛋白、肌钙蛋白I、钠尿肽、神经生长因子-β、神经生长因子-β2、神经毡蛋白-1、神经毡蛋白-2、神经细胞趋化因子、神经营养因子-3、神经营养因子-4、神经营养因子-4a、神经营养因子-4b、神经营养因子-4c、神经营养因子-4d、嗜中性白细胞活化肽-2(NAP-2)、NOGO-66受体、NOGO-A、NOGO-B、NOGO-C、命名为PTEC的新型β-趋化因子、N-端修饰的趋化因子GroHEK/hSDF-1α、N-端修饰的趋化因子GroHEK/hSDF-1β.、N-端修饰的趋化因子met-hSDF-1α、N-端修饰的趋化因子met-hSDF-1β、OPGL、成骨蛋白-1;OP-1;BMP-7、成骨蛋白-2、OX40;ACT-4、OX40L、催产素(神经垂体素运载蛋白I)、甲状旁腺素、Patched、Patched-2、PDGF-D、百日咳毒素、垂体表达的趋化因子(PGEC)、胎盘生长因子、胎盘生长因子-2、血纤维蛋白溶酶原活化抑制剂-1;PAI-1、血纤维蛋白溶酶原活化抑制剂-2;PAI-2、血纤维蛋白溶酶原活化抑制剂-2;PAI-2、血小板衍生生长因子、血小板衍生生长因子Bv-sis、血小板衍生生长因子前体A、血小板衍生生长因子前体B、血小板Mab、血小板衍生内皮细胞生长因子(PD-ECGF)、血小板衍生生长因子A链、血小板衍生生长因子B链、用于治疗败血症的多肽、前原载脂蛋白(Preproapolipoprotein)“milano”变体、前原载脂蛋白“paris”变体、前-凝血酶、灵长类CC趋化因子″ILINCK″、灵长类CXC趋化因子″IBICK″、胰岛素原、促乳素、促乳素2、鞘脂激活肽(prosaptide)、蛋白酶抑制剂肽、蛋白C、蛋白S、凝血酶原、尿激酶原、RANTES、RANTES 8-68、RANTES 9-68、RANTES肽、RANTES受体、重组白介素-16、抵抗素、局限菌素、逆转录病毒蛋白酶抑制剂、篦麻毒素、轮状病毒疫苗、RSV Mab、皂草素、帚曲菌素(sarcin)、分泌跨膜多肽、分泌跨膜多肽、血清胆碱酯酶、血清蛋白(如凝血因子)、可溶性BMP受体激酶蛋白-3、可溶性VEGF受体、干细胞抑制因子、葡萄球菌疫苗、基质衍生因子-1α、基质衍生因子-1β、物质P(tachykinin)、T1249肽、T20肽、T4内切核酸酶(T4Endonuclease)、TACI、Tarc、TGF-β1、TGF-β2、Thr117人白介素9、凝血酶、促血小板生成素、促血小板生成素衍生物1、促血小板生成素衍生物2、促血小板生成素衍生物3、促血小板生成素衍生物4、促血小板生成素衍生物5、促血小板生成素衍生物6、促血小板生成素衍生物7、胸腺表达的趋化因子(TECK)、促甲状腺素、蜱抗凝剂肽、Tim-1蛋白、TNF-α前体、TNF-R、TNF-RII;TNF p75受体;死亡受体(Death Receptor)、tPA、转铁蛋白、转化生长因子β、肌钙蛋白肽、截短的单核细胞趋化蛋白2(6-76)、截短的单核细胞趋化蛋白2(6-76)、截短的RANTES蛋白(3-68)、肿瘤坏死因子、尿酸氧化酶、尿激酶、加压素(神经垂体素运载蛋白II(neurophysin II))、VEGF R-3;flt-4、VEGF曼体;KDR;flk-1、VEGF-110、VEGF-121、VEGF-138、VEGF-145、VEGF-162、VEGF-165、VEGF-182、VEGF-189、VEGF-206、VEGF-D、VEGF-E;VEGF-X、von Willebrand因子、野生型单核细胞趋化蛋白2、野生型单核细胞趋化蛋白2、ZTGF-beta 9。

     化疗药

    13-顺式-视黄酸、2-CdA、2-氯脱氧腺苷、5-阿扎胞苷、5-氟尿嘧啶、5-FU、6-巯基嘌呤、6-MP、6-TG、6-硫鸟嘌呤、A、Abraxane、放线菌素-D、阿地白介素、阿仑单抗、力比泰(ALIMTA)、阿利维A酸、全反视黄酸、α干扰素、六甲蜜胺、甲氨蝶呤、氨磷汀、氨鲁米特、阿那格雷、阿那曲唑、阿拉伯糖胞嘧啶、Ara-C、三氧化二砷、天冬酰胺酶、ATRA、阿扎胞苷、BCG、BCNU、贝伐单抗、贝沙罗汀、比卡鲁胺、BiCNU、争光霉素、硼替佐米、白消安、C225、甲酰四氢叶酸钙、喜树碱-11、卡培他滨、Carac TM、卡铂、卡莫司汀、卡莫司汀片(Carmustine Wafer)、CC-5013、CCNU、CDDP、CeeNU、西妥昔单抗、苯丁酸氮芥、顺铂、嗜橙菌因子、克拉屈滨、可的松、CPT-11、环磷酰胺、阿糖胞苷、阿糖胞苷脂质体、达卡巴嗪、地西他滨、放线菌素D、阿法达贝泊汀、达沙替尼、道诺霉素、道诺红菌素、道诺红菌素盐酸盐、柔红霉素脂质体、地塞米松、地西他滨、Denileukin diftitox、DepoCyt TM、地塞米松、乙酸地塞米松、地塞米松磷酸钠、地塞米松、右雷佐生、DHAD、DIC、Diodex、多西他赛、多柔比星、多柔比星脂质体、Droxia TM、DTIC、Eligard TM、Ellence TM、Eloxatin TM表柔比星、阿法依伯汀、Erbitux TM、埃罗替尼、欧文氏菌(Erwinia)L-天冬酰胺酶、雌氮芥、氨磷汀、依托泊苷、依托泊苷磷酸盐、依西美坦、非格司亭、氟脲脱氧核苷、Fludara氟达拉滨、氟尿嘧啶、氟尿嘧啶(霜)、氟甲睾酮、氟他胺、亚叶酸、氟维司群、G-CSF、吉非替尼、吉西他滨、吉妥单抗奥佐米星、Gleevec TMWafer、GM-CSF、戈舍瑞林、粒细胞集落刺激因子、粒细胞巨噬细胞集落刺激因子、地塞米松、六甲三聚氰胺、HMM、Hydrocort氢化可的松、氢化可的松磷酸钠、氢化可的松琥珀酸钠、氢化可的松磷酸盐、羟基脲、替伊莫单抗、替伊莫单抗Tiuxetan、伊达比星、IFN-α、异环磷酰胺、IL-11、IL-2、甲磺酸伊马替尼、达卡巴嗪、干扰素alfa、干扰素Alfa-2b(PEG偶联物)、白介素-2、白介素-11、(干扰素alfa-2b)、伊立替康、异维A酸、拉帕替尼、L-天冬酰胺酶、LCR、来那度胺、来曲唑、亚叶酸、留可然、Leukine TM、亮丙瑞林、长春新碱、Leustatin TM、脂质体Ara-C、Liquid洛莫司汀、L-PAM、L-沙可来新、LupronM、Maxidex、氮芥、氮芥盐酸盐、甲地孕酮、甲地孕酮乙酸盐、美法仑、巯嘌呤、美司钠、Mesnex TM、甲氨蝶呤、甲氨蝶呤钠、甲泼尼龙、丝裂霉素、丝裂霉素-C、米托蒽醌、MTC、MTX、氮芥、Mylocel TM奈拉滨、Neulasta TM尼鲁米特、氮芥、奥曲肽、奥曲肽乙酸盐、Onxal TM、奥普瑞白介素、奥沙利铂、紫杉醇、紫杉醇蛋白连接(protein-bound)、帕米膦酸、帕尼单抗、PEG干扰素、培门冬酶、PEG非格司亭(Pegfilgrastim)、PEG-INTRON TM、PEG-L-天冬酰胺酶、培美曲塞、喷司他丁、苯丙酸氮芥、泼尼松龙、泼尼松、丙卡巴肼、具有卡莫司汀植入物的Prolifeprospan 20、R、雷洛昔芬、利妥昔单抗、(干扰素Alfa-2a)、红比霉素盐酸盐、Sandostatin沙格司亭、索拉非尼、SPRYCELTM、STI-571、链佐星、SU11248、舒尼替尼、他莫昔芬、替莫唑胺、替尼泊苷、TESPA、沙利度胺、硫鸟嘌呤、Thioguanine硫代磷酰胺、塞替派、托泊替康、托瑞米芬、托西莫单抗、曲妥珠单抗、维A酸、Trexall TMTSPA、VCR、Vectibix TMViadur TM长春碱、长春碱硫酸盐、Vincasar长春新碱、长春瑞滨、长春瑞滨酒石酸盐、VLB、VM-26、伏林司他、VP-16、Zevalin TM唑来膦酸、Zolinza、

     放射性药物

    碳-11、碳-14、铬-51、钴-57、钴-58、铒-169、氟-18、镓-67、金-198、铟-111、铟-113m、碘-123、碘-125、碘-131、铁-59、氪-81m、氮-13、氧-15、磷-32、铼-186、铷-82、钐-153、硒-75、锶-89、锝-99m、铊-201、氚、氙-127、氙-133、钇-90。

     显像剂

    钆、铁氧体(magnetite)、锰、锝、I 125、I131、P32、TI201、碘帕醇(Iopamidol)、PET-FDG。

     纯化标签

    (Ala-Trp-Trp-Pro)n、亲和素/链霉亲和素/Strep-标签、BCCP、B-标签(蓝舌病毒的VP7蛋白区域)、钙调蛋白结合蛋白(CBP)、纤维素结合结构域(CBD)、几丁质结合结构域、氯霉素乙酰基转移酶、c-myc、二氢叶酸还原酶(DHFR)、FLAGTM肽(DYKDDDDK)、半乳糖结合蛋白、谷胱甘肽-S-转移酶(GST)、绿色荧光蛋白(GFP)、生长激素、N-末端、血凝素流感病毒(HAI)、His-patch硫氧还蛋白、His-标签、HSB-标签、KSI、lacZ(β-半乳糖苷酶)、麦芽糖结合蛋白(MB P)、NusA、ompT/ompA/pelB/DsbA/DsbC、聚精氨酸、聚天冬氨酸、聚半胱氨酸、聚苯丙氨酸、S-标签、葡萄球菌蛋白A、链球菌蛋白G、T4gp55、T7基因10、T7-标签、硫氧还蛋白、trpE、泛素。

     诊断性化合物

    诊断剂(diagnostic agent)或生物“造影”剂(“contrast”agent)是本领域公知的。诊断剂是用于部分诊断检测(即与评估测试结果所需的设备和程序一起使用)的任何药物产品。所述诊断剂可体内(in vivo)、离体(ex vivo)或体外(invitro)使用。例如,US 4,945,239描述了为检测存在乳癌细胞而开发的方法,该方法使用了透射成像装置。已知正常乳腺细胞和良性的乳腺肿瘤细胞不表达转铁蛋白受体,而乳腺癌具有非常高表达的转铁蛋白受体。已经将人转铁蛋白进行化学修饰,使得它在电磁辐射的可见光区显现强吸收,而大多数人体蛋白质、脂肪酸和其它体液吸收光线不显著。更具体地说,已使用异硫氰酸偶联法将荧光素与转铁蛋白共价偶接。偶联的蛋白质(FITC-Tf)在496nm有非常强的吸收。在一项前期研究中,证明了FITC-Tf偶联物可用于检测癌细胞。在二氧化碳培养箱中,EMT-6小鼠乳瘤细胞培养在含有10%胎牛血清的RPMI 1640培养基中,通过频繁分开(frequent splitting)使之维持在对数生长期。对该实验来说,用胰酶消化细胞,用磷酸缓冲盐溶液(PBS,pH7.4)洗涤细胞,并在37℃将细胞在PBS中温育30分钟,以将结合的转铁蛋白从细胞表面转铁蛋白受体上除去。然后,以500g离心细胞5分钟,用PBS再洗一次。在两个15ml尖底离心管的每一个中,用10ml PBS(pH7.4)悬浮一百万个细胞,在每个管中加入1.0ml 2.0mg/ml FITC-Tf或转铁蛋白。这些管在4℃温育45分钟。然后用PBS将细胞洗涤两次,以除去未结合的物质。然后,将洗过的沉淀悬浮于0.2ml PBS中,将细胞转移到96孔透明塑料滴定板(可获得自Dynatech公司),用于成像目的。

    比对和同一性(Alignment and identity)

    HST变体可与SEQ ID NO:1具有至少40%的同一性,特别是具有至少45%、50%、55%、60%、65%、70%、75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%的同一性。

    乳铁蛋白变体可与SEQ ID NO:11具有至少40%的同一性,特别是具有至少45%、50%、55%、60%、65%、70%、75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%的同一性。

    黑素转铁蛋白变体可与SEQ ID NO:15具有至少40%的同一性,特别是具有至少45%、50%、55%、60%、65%、70%、75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%或至少99%的同一性。

    图6~9显示了许多转铁蛋白家族蛋白与HST(SEQ ID NO:1)的比对。人乳铁蛋白与HST的结构比对由J.Wally等(Biometals(2007)20:249~262)所描述。这些比对可用于鉴定与如上所选择的HST中的那些区域和氨基酸残基相对应的区域和氨基酸残基。对于其它乳铁蛋白家族蛋白,可通过本领域已知的多种方法进行一级序列的比对。

    此类方法的一个实例是DNASTAR Inc.开发的MegAlign程序(第7版),其为Lasergene套装的一个部分,基于Hei n,J.J.(1990).“Unified approach toalignment and phylogenies.”In Methods in Enzymology,第183期:pp.626~645。使用Jotun Hein方法和设置GAP PENALTY=11、GAP LENGTHPENALTY=3(用于多序列比对)和KTUPLE=2(用于成对比对),可计算一系列百分比同一性值。

    也可通过使用EMBOSS软件包(http://emboss.org)2.8.0版中Needle程序确定两个氨基酸序列的比对。Needle程序执行Needleman,S.B.和Wunsch,C.D.((1970)J.Mol.Biol.48,443-453)所述的全面比对算法(global alignmentalgorithm)。所用的取代矩阵是BLOSUM62,缺口开放罚分(gap openingpenalty)是10,缺口延伸罚分(gap extension penalty)是0.5。

    用两个序列比对中确切匹配的数目除以两个序列中较短的那个序列的长度,计算得到给定氨基酸序列和SEQ ID NO:1之间的同一性程度。结果表示为百分比同一性。当两个序列在重叠的同一位置具有相同的氨基酸残基时,则为确切匹配。序列的长度是序列中的氨基酸残基数目。

    3D模型中残基的运动性(RMSF)

    使用Gromacs工具”g rmsf”,3.3版(其基于D.van der Spoel,E.Lindahl,B.Hess,G.Groenhof,A.E.Mark和H.J.C.Berendsen:GROMACS:Fast,Flexible and Free,J.Comp.Chem.26pp.1701~1718(2005))计算模拟(simulation)的最后一纳秒中Cα碳原子的均方根涨落(root mean squarefluctuation)。

     3D模型中残基的溶剂可及性

    使用DSSP软件(W.Kabsch和C.Sander,Biopolymers 22(1983)2577~2637)计算每个残基的溶剂可及表面积。每个溶剂可及表面积除以该位置上发现的特定氨基酸的标准值,并乘以100,由此得到占每个残基的标准值的百分比。

    20种不同氨基酸的标准溶剂可及表面积被定义为(使用单字母代码表示氨基酸):A=62、C=92、D=69、E=156、F=123、G=50、H=130、I=84、K=174、L=97、M=103、N=85、P=67、Q=127、R=211、S=64、T=80、V=81、W=126、Y=104。

    配体结合

    所述多肽可包含插入、缺失和取代(不管是保守的还是非保守的),其中这些改变基本上不降低转铁蛋白的有用的配体结合、免疫或受体结合性质。所述多肽可具有至少5%、10%、15%、20%、30%、40%或50%、60%、70%、至少80%、90%、95%、100%、105%或更高的人转铁蛋白受体结合活性(mol/mol)。所述多肽可具有增加的受体亲和性或者降低的铁释放(Adams等,2003J Biol Chem,278(8),6027~33;Baker等,2007Acta Crystallogr D BiolCrystallogr,63(Pt 3),408~14;He和Mason,2002Molecular and Cellular IronTransport,5~123;Mason等,2005Biochemistry,44(22),8013~21)。

    所述多肽可显示出经修饰的(例如减少的)糖基化,例如但不限于减少的N-连接糖基化或减少的O-连接糖基化。可通过添加/去除氨基酸糖基化共有序列(consensus sequence)例如位于N、X或S/T的任意或所有位置的N-X-S/T来修饰转铁蛋白分子的N-连接糖基化模式。转铁蛋白突变体可以具有改变的释放铁的能力和/或改变的再循环时间,使得突变体作为生物活性载体的效率得以改善(Lao等,2007J Control Release,117(3),403~12)。转铁蛋白突变体可以在它们对金属离子和/或其它蛋白质(例如转铁蛋白受体)的天然结合方面发生改变。以这种方式修饰的转铁蛋白突变体的实例在下文给出。

    我们还包括了人转铁蛋白或人转铁蛋白类似物的天然存在多态变体。一般来说,人转铁蛋白的变体或片段会具有至少5%、10%、15%、20%、30%、40%、50%、60%、70%(优选具有至少80%、90%、95%、100%、105%或更多)的人转铁蛋白配体结合活性(例如铁结合)(mol/mol)。

    铁结合测定

    铁结合能力指包含转铁蛋白突变体序列的重组蛋白可逆地结合铁的能力。不含铁的转铁蛋白是无色的,但是当结合铁时,它们具有特征性的橙红色(salmon-pink colour)。因此,可通过蛋白质在不含铁以及在完全载铁的状态下的470nm∶280nm吸光度比用分光光度法测定铁结合能力。如果巯基转铁蛋白具有不带半胱氨酸插入的相应多肽至少5%的铁结合能力,则认为它具有铁结合能力。

    除非另外指明,试剂应该是不含铁的。可通过用0.1M柠檬酸盐、0.1M乙酸盐,10mM EDTA(pH4.5)进行透析来除去转铁蛋白或测试样品中的铁。所述蛋白在100mM HEPES,10mM NaHCO3(pH8.0)中应该为约20mg/mL。测定在水中稀释的脱铁-转铁蛋白(apo-transferrin)(即无铁对照转铁蛋白)(Calbiochem,CN Biosciences,Nottingham,UK)的470nm∶280nm吸光度比,使得可用吸光光度法精确测定280nm处的吸光度(0%铁结合)。通过将191mg硝基三乙酸(nitrotriacetic acid)溶于2mL 1M NaOH,然后加入2mL 0.5M的氯化铁来制备20mM铁-氨三乙酸盐(FeNTA)溶液。用去离子水稀释至50mL。通过下述方法用铁完全加载脱铁-(对照)转铁蛋白(100%铁结合):加入足够过量的新鲜制备的20mM FeNTA,然后用100mM HEPES、10m MNaHCO3(pH 8.0)完全透析全-转铁蛋白(holo-transferrin),在测定470nm∶280nm处的吸光度比之前除去剩余的FeNTA。使用测试样品(即所讨论的包含转铁蛋白突变体序列的重组蛋白)重复该程序,所述测试样品最初应该是不含铁的,并将最终比值与对照进行比较。

     转铁蛋白总铁结合能力(Total Iron Binding Capacity(TIBC))的定量程序

    总铁结合能力(TIBC)表示使所有可用的转铁蛋白铁结合位点饱和所需的最大铁量。TIBC、血清铁的测定以及血清铁与TIBC(转铁蛋白饱和)的比值常用于临床诊断和监测(Huebers,H.A.等(1987),Clin Chem 33,273~7)。可使用Caraway(1963 Clinical Chem 9(2),188)所述的测定血清铁和铁结合能力(Determination of Serum Iron and Iron-Binding Capacity)的改进方法测定rTf的总铁结合能力。将rTf稀释至5mg/ml,然后加入1ml总铁结合缓冲液(0.5MTris(pH8)、0.5M NaHCO3)。向每个管加入0.220g±0.005g碳酸镁(以除去多余的铁),并使用振摇混合器(rock-roll mixer)混合45分钟。在17℃以5000rpm将样品离心25分钟。将含有转铁蛋白结合铁的上清液(650μl)转移到0.45μ微量离心旋转滤器(microfuge spin filter)的接收容器,并以8000rpm离心10分钟。除去接收容器,振荡混匀。将样品分为两个等分试样,将100微升的每个样品转移到微量离心管进行铁分析,剩下的150μl的每个样品转移到200μl小口(crimp top)HPLC管(02-CTV,Chromacol Ltd),使得可以通过RP-HPLC测定rTF浓度(在纯化章节中有述)。

    可使用针对铁的ferene-S比色试剂,并且通过监测595nm处的吸光度改变来测定蛋白质样品中的总铁。

    通过将50μl铁原子光谱标准品加入4.95mL水中制备10mg/L铁工作储存液标准品。在100μl终体积中制备1mg/L、2mg/L、3mg/L、4mg/L、5mg/L和10mg/L的铁标准品,绘制出标准曲线。向每个标准品中加入50μl 1.3M抗坏血酸,混合样品并在室温下温育。10分钟后,向所有样品中加入50μl20%(w/v)三氯乙酸。将100μl的标准品转移到10×4×45mm塑料杯,加入100μl乙酸铵,然后加入100μl 22.2nmol.L-1 ferene-S溶液和700μl水。在室温温育标准品10分钟,然后测定595nm处的吸光度(使用Shimadzu UV2501分光光度计或同类产品)。用595nm处的吸光度相对铁浓度(mg/L)绘制标准曲线。

    同时,将50μl 1.3M抗坏血酸加入到rTf样品(100μl)中,混合样品并在室温温育。10分钟后,加入50μl 20%(w/v)三氯乙酸,并向含有蛋白质的样品中加入50μl氯仿。所有样品通过涡旋振荡混合,并以14000rpm离心3分钟。将上清液(100μl)转移到10×4×45mm塑料杯,加入100μl 40%(w/v)乙酸铵,然后加入100μl 22.2nmol.L-1 ferene-S溶液和700μl水。在室温温育标准品10分钟,然后测定595nm处的吸光度(使用Shimadzu UV2501分光光度计或同类产品)。使用标准曲线计算铁浓度(mg/L),用铁浓度除以蛋白质浓度(g/L)计算得到铁含量(mg/g蛋白质)。

    偶联

    可通过本领域已知的方法将本发明的转铁蛋白突变蛋白(巯基转铁蛋白)共价连接到生物活性化合物上(http://www.piercenet.com/files/1601361Crosslink.pdf)。这些方法包括但不限于:将巯基反应基团合并或改造至生物活性化合物之中或之上,例如通过合并或改造生物活性化合物上存在的另一个自由巯基;或者通过合并或改造生物活性化合物上的吡啶二硫基(pyridyldisulphide group);或者通过合并或改造生物活性化合物上的碘乙酰基;或者合并或改造生物活性化合物上的马来酰亚胺基。例如,N-乙基马来酰亚胺(NEM,Pierce)、2-氨基-2’-氨基乙烷硫代磺酸酯(Pierce)、N-β-马来酰亚胺基丙酸(BMPA Pierce)、甲基甲烷硫代磺酸酯(MMTS,Pierce)、荧光素-5-马来酰亚胺(Pierce)、5-碘代乙酰氨基-荧光素(5-IAF,Pierce)或者N-[6-7-氨基-4-甲基香豆素-3-乙酰氨基)己基]-3′-[2′-吡啶二硫代]丙酰胺(AMCA-HPDP,Pierce)

    如果生物活性化合物含有至少一个巯基,那么所述生物活性化合物可通过本领域已知的方法与本发明的转铁蛋白突变蛋白交联,所述方法例如但不限于:氧化或者通过使用交联试剂,例如但不限于1,4-双-马来酰亚胺基丁烷(BMB,Pierce);1,4-双-马来酰亚胺基-2,3-二羟基丁烷(BMDB,Pierce);双-马来酰亚胺基己烷(BMH,Pierce)、双-马来酰亚胺基乙烷(BMOE,Pierce);1,8-双-马来酰亚胺基三甘醇(BM[PEO]3 Pierce);1,11-双-马来酰亚胺基四甘醇(BM[PEO]4 Pierce);1,4-二-[3’-(2’-吡啶二硫代)-丙酰胺基]丁烷(DPDPB,Pierce);二硫代-双-马来酰亚胺基乙烷(DTME Pierce);1,6-己烷-双-乙烯基砜(HBVS,Pierce)和三-[2-马来酰亚胺基乙基]胺(TMEA,Pierce)。

    如果生物活性化合物不含有巯基活性基团,那么可通过本领域已知方法利用化学修饰或基因工程改造进行修饰以并入一个或多个此类基团(Chapman,A.P.(2002)Adv.Drug Deliv.Rev.,54531~545:Humphreys,D.P.等Protein Engineering,Design & Selection vol.20no.5pp.227~234,2007)。尽管这两篇参考文献描述的是将PEG与抗体或抗体片段内改造出的自由巯基相交联的方法,但是此技术可用于将生物活性化合物与本发明的转铁蛋白突变蛋白内改造出的自由巯基相交联。另外,可使用ConjuChem Inc.(Montreal,Quebec,Canada,H2X 3Y8)开发的药物亲和复合物(Drug AffinityComplex(DACTM))技术,例如WO200069902中所述。每个DACTM构建物有三个部分:1)药物组分(负责生物活性的部分);2)与所述药物组分相连的接头;和3)接头另一侧的反应性化学基团,通常是对巯基有选择性的温和的亲电试剂(soft electrophile selective for thiols);马来酰亚胺是最有用的实施方案。

    如果生物活性化合物不含巯基反应性基团,但是含有一个或多个氨基,那么可通过本领域已知方法进行修饰,通过化学修饰并入一个或多个巯基反应性基团,所述方法例如使用交联试剂,所述交联试剂例如但不限于:N-5-叠氮基-2-硝基苯甲酰氧基琥珀酰亚胺(AMAS,Pierce)、N-[β-马来酰亚胺基丙氧基]琥珀酰亚胺酯(BMPS,Pierce)、N-η-马来酰亚胺基己酸(EMCA,Pierce)、N-[η-马来酰亚胺基己酰氧基]琥珀酰亚胺酯(EMCS,Pierce)、N-[η-马来酰亚胺基己酰氧基]磺基琥珀酰亚胺酯(sulfo-EMCS,Pierce)、N-[γ-马来酰亚胺基丁酰氧基]琥珀酰亚胺酯(GMBS,Pierce)、N-[γ-马来酰亚胺基丁酰氧基]磺基琥珀酰亚胺酯(sulfo-GMBS,Pierce)、N-κ-马来酰亚胺基十一酸(KMUA,Pierce)、N-[κ-马来酰亚胺基十一酸]酰肼(KMUH,Pierce)、N-[κ-马来酰亚胺基十一酰氧基]磺基琥珀酰亚胺酯(sulfo-KMUS,Pierce)、m-马来酰亚胺基苯甲酰基-N-羟基琥珀酰亚胺(MBS,Pierce)、m-马来酰亚胺基苯甲酰基-N-羟基磺基琥珀酰亚胺酯(sulfo-MBS,Pierce)、S-乙酰基硫代乙酸N-琥珀酰亚胺酯(SATA,Pierce)、S-乙酰基硫代丙酸N-琥珀酰亚胺酯(SATP,Pierce)、3-[溴乙酰氨基]丙酸琥珀酰亚胺酯(SBAP,Pierce)、碘代乙酸N-琥珀酰亚胺酯(SIA,Pierce)、N-琥珀酰亚胺基[4-碘代乙酰基]氨基苯甲酸酯(SIAB,Pierce)、磺基琥珀酰亚胺基[4-碘代乙酰基]氨基苯甲酸酯(sulfo-SIAB,Pierce)、[4-[N-马来酰亚胺基甲基]环己烷-1-羧酸琥珀酰亚胺酯(SMCC,Pierce)、[4-[N-马来酰亚胺基甲基]环己烷-1-羧酸硫代琥珀酰亚胺酯(sulfo-SMCC,Pierce)、琥珀酰亚胺基-[4-[N-马来酰亚胺基甲基]环己烷-1-羧基-[6-氨基己酸酯(LC-SMCC,Pierce)、4-琥珀酰亚胺氧羰基-甲基-α[2-吡啶二硫代]甲苯(SMPT,Pierce)、磺基琥珀酰亚胺基-6-[α-甲基-α2-吡啶二硫代)甲苯酰胺]己酸酯(sulfo-LC-SMPT,Pierce)、4-[对-马来酰亚胺苯基]-丁酸琥珀酰亚胺酯(SMPB,Pierce)、4-[对-马来酰亚胺基苯基]-丁酸磺基琥珀酰亚胺酯(sulfo-SMPB,Pierce)、琥珀酰亚胺基-6-[(β-马来酰亚胺基丙酰胺基)己酸酯](SMPH,Pierce)、3-[2-吡啶二硫代]丙酸N-琥珀酰亚胺酯(SPDP,Pierce)、[3-(2-吡啶二硫代)丙酰胺基]己酸琥珀酰亚胺酯(LC-SPDP,Pierce)、[3’-(2-吡啶二硫代)丙酰胺基]己酸磺基琥珀酰亚胺酯(sulfo-LC-SPDP,Pierce)以及N-琥珀酰亚胺基-[4-乙烯基磺酰基]苯甲酸酯(SVSB Pierce)。如Kavimandan等((2006)Bioconjugate Chem.17,1376~1384)所述,封闭某些胺残基可能是有利的。

    如果生物活性化合物不含巯基反应性基团,但是含有一个或多个羰基(氧化的碳水化合物)基团,那么可通过本领域已知方法进行修饰,通过化学修饰并入一个或多个巯基反应性基团,所述方法例如使用交联试剂,所述交联试剂例如但不限于:N-[η-马来酰亚胺基己酸]酰肼(EMCH,Pierce)、4-[N-马来酰亚胺基甲基]环己烷-1-羧基酰肼·HCl·1/2二噁烷(M2C2H,Pierce)、3-马来酰亚胺基苯基硼酸(MPBH,Pierce)以及3-[2-吡啶二硫代]丙酰肼(PDPH,Pierce)。

    如果生物活性化合物不含巯基反应性基团,但是含有一个或多个羟基,那么可通过本领域已知方法进行修饰,通过化学修饰并入一个或多个巯基反应性基团,所述方法例如使用交联试剂,所述交联试剂例如但不限于:N-[对-马来酰亚胺基苯基]异氰酸酯(PMPI,Pierce)。

    转铁蛋白变体的偶联能力(conjugation competence)

    可通过荧光标记和细胞摄取来检测本发明多肽的偶联能力,如McGraw等((1987),The Journal of Cell Biology,105,207~214)和(Presley等,(1993),The Journal of Cell Biology,122,1231~1241)所述。

    实施例

    材料与方法

    除非另有说明,否则以下实施例中使用的化学品均由Merch提供。

    尿素凝胶电泳

    采用Makey和Seal的程序(Monthony等,1978,Clin.Chem.,24,1825-1827;Harris & Aisen,1989,Physical biochemistry of the transferrins,VCH;Makey & Seal,1976,Biochim.Biophys.Acta.,453,250~256;Evans &Williams,1980,Biochem.J.,189,541~546)的经改进程序,以商用微型凝胶(6%的均质TBE尿素(TBE Urea),Invitrogen)进行尿素凝胶电泳。包含约10μg蛋白的样品按1∶1稀释在TBE-Urea样品缓冲液(Invitrogen)中,在180V分离550Vh至600Vh,并用Blue试剂(Pierce)染色。通过用0.1M柠檬酸盐、0.1M乙酸盐、10mM EDTA(pH 4.5)进行透析来制备脱铁转铁蛋白(Apo-transferrin)。将溶液过滤(0.22μm)、使用Vivaspin聚醚砜(polyethersulphone)10,000NMWCO离心浓缩机浓缩至10mg/ml,并用10倍体积的水进行渗滤(diafilter),再用10倍体积的0.1M HEPES,0.1M NaHCO3(pH8.0)进行渗滤。利用漂洗从所述浓缩机中回收样品,并使终浓度为5mg/ml。由该溶液通过添加10μl 1mM FeNTA(新鲜制备的在氨三乙酸二钠中的氯化铁等摩尔溶液)将重建的全-转铁蛋白(Reconstituted holo-transferrin)制备成50μl等分试样并放置10分钟,让CO2溶解以在电泳分析前完成铁结合。该技术分离到四种具有不同铁负载量的分子形式,即(按运动性增大顺序)脱铁-转铁蛋白、C-叶结合单铁转铁蛋白、N-叶结合单铁转铁蛋白和全-转铁蛋白。据信这四种形式的转铁蛋白的分离是由于在4M~6M尿素中的部分变性所致;其中在任一叶中的铁结合都会导致构象改变,从而造成对变性的抗性增加。因此,叶中铁的存在造成结构更紧凑,电泳迁移性更高。N-叶由于具有比C-叶少的二硫键(分别为8与11),因此其在没有铁的情况下进一步展开,使得C-叶上结合有铁的单铁形式的运动性最小。

    自由巯基测定法

    使用Ellman试剂通过分光光度计法可以测定蛋白上自由巯基的数目。Ellman试剂(5’5’-二硫代-双(2-硝基苯甲酸)(DTNB))是芳香族二硫化物,其与巯基反应形成蛋白的混合的二硫化物和1摩尔的2-硝基-5-硫代苯甲酸酯(NTB)(每摩尔的蛋白硫化基(sulphidyl group))。NTB的形成可以通过测量412nm处的吸光度进行监测。摩尔吸光度系数为13,600M-1cm-1

    采用Ellman试剂的自由巯基测定法可以用来测定蛋白的自由巯基的数目。为了测定自由巯基的数目,将样品蛋白于7.4mM磷酸缓冲盐溶液(pH 7.4)中稀释至已知浓度(例如10mg/mL),终体积为1mL。用在37mM磷酸缓冲盐溶液(pH8.3)中新鲜制得的5,5’-二硫代-双(2-硝基苯甲酸)(DTNB)处理蛋白溶液(600mL)。在EDTA存在的情况下于室温放置45分钟后,测量所述溶液在412nm处的吸光度(相对于试剂空白样),并用E412=13600M-1cm-1计算反应硫化基的数目。

    微生物

    在以下实施例中使用的标为Strain 1的宿主菌株是DXY1的hsp150缺陷型菌株,由S.M.Kerry-Williams等(1998,Yeast 14:161~169)披露。WO95/33833教导本领域技术人员如何制备hsp150缺陷型酵母。

    实施例1:转铁蛋白突变蛋白表达质粒的构建

    可以以如下针对Tf变体S415A、T613A所述的类似方式构建本发明的转铁蛋白变体的表达质粒。

    通过定点诱变对pDB3237的质粒(图2)进行修饰来制备转铁蛋白突变蛋白。通过可商购获得的试剂盒(例如Stratagene的QuikchangeTM试剂盒),使用所示程序,用重叠诱变寡核苷酸序列对编码半胱氨酸残基的任意DNA序列的所选的一个或多个残基的密码子(TGT或TGC)进行修饰。

    转铁蛋白(S415A、T613A)表达质粒pDB3237的构建

    使用重叠寡核苷酸引物来创建合成的DNA,该DNA编码一种能与人转铁蛋白(S415A、T613A)可操作连接的转化酶前导序列,其中的人转铁蛋白(S415A、T613A)是密码子经优化而用在酿酒酵母(S.cerevisiae)中表达的。

    SEQ ID No.2是基于成熟人转铁蛋白C1变体蛋白序列的DNA序列,所述成熟人转铁蛋白C1变体蛋白序列分别在丝氨酸415和苏氨酸613被修饰为丙氨酸密码子,以防止在天冬酰胺413和天冬酰胺611位点发生N-连接糖基化。使该序列在侧翼具有SphI和AflII限制性内切酶位点,以便于进行克隆。SEQID NO:2包含在丝氨酸415和苏氨酸613被修饰为丙氨酸密码子的成熟人转铁蛋白C1变体蛋白编码序列(核苷酸124-2160),以防止在天冬酰胺413和天冬酰胺611位点发生N-连接糖基化;两个翻译终止密码子(核苷酸2161-2166);转化酶前导序列(信号)蛋白编码序列(核苷酸67-123);3’UTR和ADH1基因终止子直至(up to)SphI克隆位点的部分(核苷酸2167-2359);5’UTR和PRB1基因启动子直至AflII克隆位点的部分(核苷酸1-66)。

    转化酶前导(信号)蛋白编码序列(核苷酸67-123)编码信号肽MLLQAFLFLLAGFAAKISA(SEQ ID NO:3的-19至-1)。SEQ ID NO:3的1-679包含在丝氨酸415和苏氨酸613被修饰为丙氨酸密码子的成熟人转铁蛋白C1变体蛋白编码序列,以防止在天冬酰胺413和天冬酰胺611位点发生N-连接糖基化。

    编码能与人转铁蛋白(S415A、T613A)(SEQ ID NO:2)可操作连接的转化酶前导序列的合成DNA序列以SphI和AflII彻底消化,产生2.357kb的片段。使用限制性内切酶SphI和AflII将质粒pDB2241(4.383kb,在WO 00/44772中有描述)彻底消化而产生4.113kb片段,随后使用牛小肠碱性磷酸酶将该片段去磷酸化。将2.537kb转化酶前导序列人转铁蛋白(S415A、T613A)DNA片段从pDB2241连接到4.113kb SphI/AflII片段,而产生质粒pDB3191(图3)。用NotI限制性内切酶将质粒pDB3191彻底消化,从而释放出3.259kb转化酶前导序列人转铁蛋白(S415A、T613A)表达盒。

    WO/2005061719 A1描述了质粒pDB2690的构建。使用限制性内切酶NotI将质粒pDB2690(13.018kb)彻底消化,用牛小肠碱性磷酸酶进行去磷酸化,并与3.259kb NotI转铁蛋白(S415A、T613A)表达盒连接,而制得具有与LEU2基因反向的转铁蛋白(S415A、T613A)表达盒的16.306kb pDB3237(图2)。

    巯基转铁蛋白突变体表达质粒的构建

    另外的实施方式,可以通过将合成DNA片段亚克隆到质粒pDB3191(图3)中,然后将NotI转铁蛋白变体表达盒亚克隆到pDB2690中,制得用于本发明的巯基转铁蛋白变体的表达质粒。

    pDB3191(图3)的转铁蛋白DNA序列含有独特的AflII、XcmI、NcoI和AccI限制性内切酶位点。在pDB3191(图10)的转铁蛋白表达盒序列上对所提议的突变位置进行作图。SEQ ID No.4、5、6和7是基于成熟人转铁蛋白C1变体蛋白部分序列的DNA序列,所述成熟人转铁蛋白C1变体蛋白序列在丝氨酸415被修饰为丙氨酸密码子,以防止在天冬酰胺413位点发生N-连接糖基化。使所述序列的侧翼具有AflII和XcmI限制性内切酶位点以便于克隆。通过对在AflII和XcmI限制性内切酶位点之间的DNA序列进行修饰来产生14个巯基转铁蛋白变体(表2)。SEQ ID No:4包含在丝氨酸415被修饰为丙氨酸的成熟人转铁蛋白C1变体蛋白的部分编码序列,以防止在天冬酰胺413位点直至XcmI克隆位点(核苷酸124-1487)发生N-连接糖基化;转化酶前导序列(信号)蛋白编码序列(核苷酸67-123),和PRB1基因启动子直至AflII克隆位点的部分(核苷酸1-66)。有11个SEQ ID No:4变体被合成,其中转铁蛋白蛋白质编码序列在所选密码子处被修饰为半胱氨酸密码子。

    对于巯基转铁蛋白变体(V1C),转铁蛋白的蛋白质编码序列被修饰,位置1的缬氨酸密码子被取代为半胱氨酸密码子(TGT)。

    对于巯基转铁蛋白变体(S28C),转铁蛋白的蛋白质编码序列被修饰,位置28的丝氨酸密码子被取代为半胱氨酸密码子(TGT)。

    对于巯基转铁蛋白变体(S32C),转铁蛋白的蛋白质编码序列被修饰,位置32的丝氨酸密码子被取代为半胱氨酸密码子(TGT)。

    对于巯基转铁蛋白变体(D104C),转铁蛋白的蛋白质编码序列被修饰,位置104的天冬氨酸密码子被取代为半胱氨酸密码子(TGT)。

    对于巯基转铁蛋白变体(T165C),转铁蛋白的蛋白质编码序列被修饰,位置165的苏氨酸密码子被取代为半胱氨酸密码子(TGT)。

    对于巯基转铁蛋白变体(P175C),转铁蛋白的蛋白质编码序列被修饰,位置175的脯氨酸密码子被取代为半胱氨酸密码子(TGT)。

    对于巯基转铁蛋白变体(A215C),转铁蛋白的蛋白质编码序列被修饰,位置215的丙氨酸密码子被取代为半胱氨酸密码子(TGT)。

    对于巯基转铁蛋白变体(P288C),转铁蛋白的蛋白质编码序列被修饰,位置288的脯氨酸密码子被取代为半胱氨酸密码子(TGT)。

    对于巯基转铁蛋白变体(T336C),转铁蛋白的蛋白质编码序列被修饰,位置336的苏氨酸密码子被取代为半胱氨酸密码子(TGT)。

    对于巯基转铁蛋白变体(S415C),转铁蛋白的蛋白质编码序列被修饰,位置415的丝氨酸密码子被取代为半胱氨酸密码子(TGT)。

    对于巯基转铁蛋白变体(D416C),转铁蛋白的蛋白质编码序列被修饰,位置416的天冬氨酸密码子被取代为半胱氨酸密码子(TGT)。

    SEQ ID NO:5包含在丝氨酸415被修饰为丙氨酸的成熟人转铁蛋白C1变体蛋白的部分编码序列,以防止在天冬酰胺413位点发生N-连接糖基化,并将171位半胱氨酸修饰为丙氨酸密码子,从而在半胱氨酸179位点直至XcmI克隆位点(核苷酸124-1487)产生未成对半胱氨酸;还包含转化酶前导(信号)蛋白的编码序列(核苷酸67-123)、和PRB1基因启动子直至AflII克隆位点的部分(核苷酸1-66)。

    使用AflII和XcmI对适当(appropriate)的SEQ ID No:4变体或SEQ IDNo:5DNA序列进行彻底消化而产生1.479kb DNA片段。使用限制性内切酶AflII和XcmI对质粒pDB3191(6.47kb)进行彻底消化而产生4.991kb片段,随后使用虾碱性磷酸酶将所述片段去磷酸化。将所述适当的1.479kb巯基转铁蛋白变体DNA片段亚克隆到来自pDB3191的4.991kb AflII/XcmI片段中,从而产生质粒pDB3714、pDB3715、pDB3752、pDB3716、pDB3717、pDB3754、pDB3740、pDB3741、pDB3742、pDB3755、pDB3744或pDB3756(表2)。

    SEQ ID No.6是基于成熟人转铁蛋白C1变体蛋白序列的DNA序列,所述成熟人转铁蛋白C1变体蛋白序列通过将丝氨酸415和天冬氨酸416密码子取代为半胱氨酸密码子(使得氨基酸链的长度减小)来进行修饰。使所述序列的侧翼具有AflII和XcmI限制性内切酶位点以便于克隆。SEQ ID No:6包含成熟人转铁蛋白C1变体蛋白的部分编码序列直至XcmI克隆位点(核苷酸124-1484),该变体蛋白的两个残基即丝氨酸415和天冬氨酸416被取代为半胱氨酸密码子(氨基酸链长度减小),还包含转化酶前导(信号)蛋白编码序列(核苷酸67-123)、和PRB1基因启动子直至AflII克隆位点的部分(核苷酸1-66)。

    

    使用AflII和XcmI将SEQ ID No:6DNA序列彻底消化而产生1.476kb片段。使用限制性内切酶AflII和XcmI将质粒pDB3191(6.47kb)彻底消化而产生4.991kb片段,随后使用虾碱性磷酸酶将该片段去磷酸化。将1.476kb巯基转铁蛋白变体(缺失416C)DNA片段亚克隆到来自pDB3191的4.991kbAflII/XcmI片段中,从而产生6.467kb质粒pDB3743(表2)。

    SEQ ID No.7是基于成熟人转铁蛋白C1变体蛋白序列的DNA序列,所述成熟人转铁蛋白C1变体蛋白序列在丝氨酸415被修饰为丙氨酸密码子,以防止在天冬酰胺413位点发生N-连接糖基化,并且经修饰使得半胱氨酸密码子被插入到天冬氨酸416残基的N-末端侧(使得氨基酸链长度增加)。使所述序列的侧翼具有AflII和XcmI限制性内切酶位点以便于克隆。SEQ ID No.7包含在丝氨酸415被修饰为丙氨酸残基的成熟人转铁蛋白C1变体蛋白的部分编码序列直至XcmI克隆位点(核苷酸124-1490),以防止在天冬酰胺413位点发生N-连接糖基化,并在天冬氨酸416进行修饰,使半胱氨酸密码子被插入到天冬氨酸416的N-末端侧;还包含转化酶前导(信号)蛋白编码序列(核苷酸67-123)、和PRB1基因启动子直至AflII克隆位点的部分(核苷酸1-66)。

    使用AflII和XcmI将SEQ ID No:7DNA序列彻底消化而产生1.482kb片段。使用限制性内切酶AflII和XcmI将质粒pDB3191(6.47kb)彻底消化而产生4.991kb片段,随后使用虾碱性磷酸酶将该片段去磷酸化。将1.482kb巯基转铁蛋白变体(插入415C416)DNA片段亚克隆到来自pDB3191的4.991kb AflII/XcmI片段中而产生6.473kb质粒pDB3712(表2)。

    SEQ ID No.8是基于成熟人转铁蛋白C1变体蛋白序列的一部分的DNA序列。使所述序列的侧翼具有XcmI和NcoI限制性内切酶位点以便于克隆。SEQ ID No.8包含在丝氨酸501被修饰为半胱氨酸密码子(TGT)的部分成熟人转铁蛋白C1变体蛋白编码序列(核苷酸1-301)。

    使用XcmI和NcoI将SEQ ID No:8DNA序列彻底消化而产生0.288kb片段。使用限制性内切酶XcmI和NcoI将质粒pDB3191(6.47kb)彻底消化而产生6.182kb片段,随后使用虾碱性磷酸酶将该片段去磷酸化。将所述0.288kb巯基转铁蛋白(S415A、S501C、T613A)变体DNA片段亚克隆到来自pDB3191的6.182kb XcmI/NcoI片段中而产生6.47kb质粒pDB3713(表2)。

    SEQ ID No.9是基于成熟人转铁蛋白C1变体蛋白序列的一部分的DNA序列,所述成熟人转铁蛋白C1变体蛋白序列的一部分在苏氨酸613被修饰为丙氨酸密码子,以防止在天冬酰胺611位点发生N-连接糖基化。使所述序列的侧翼具有NcoI和AccI限制性内切酶位点以便于克隆。

    通过修饰NcoI和AccI限制位点之间的DNA序列,产生了4个巯基转铁蛋白变体。

    SEQ ID No:9包含成熟人转铁蛋白C1变体蛋白编码序列的一部分(核苷酸1-393),该变体始于NcoI克隆位点,并在苏氨酸613被修饰为丙氨酸密码子,以防止在天冬酰胺611位点发生N-连接糖基化;还包含两个翻译终止密码子(核苷酸394-399)、3’UTR和ADH1基因终止子直至AccI克隆位点的部分(核苷酸1-462)。

    合成4条SEQ ID No:9变体,其中,转铁蛋白蛋白质编码序列在所选残基被修饰为半胱氨酸密码子(TGT)。

    对于巯基转铁蛋白变体(N553C),氨基酸序列被修饰为在位置553的天冬酰胺密码子被取代为半胱氨酸密码子(TGT)。

    对于巯基转铁蛋白变体(N611C),氨基酸序列被修饰为在位置611的天冬酰胺密码子被取代为半胱氨酸密码子(TGT)。

    对于巯基转铁蛋白变体(T613C),氨基酸序列被修饰为在位置613的苏氨酸密码子被取代为半胱氨酸密码子(TGT)。

    对于巯基转铁蛋白变体(D643C),氨基酸序列被修饰为在位置643的天冬氨酸密码子被取代为半胱氨酸密码子(TGT)。

    使用NcoI和AccI将适当的SEQ ID No:9巯基转铁蛋白变体DNA序列彻底消化而产生0.457kb DNA片段。使用限制性内切酶NcoI和AccI将质粒pDB3191(6.47kb)彻底消化而产生6.013kb片段,随后使用虾碱性磷酸酶将该片段去磷酸化。将所述适当的0.457kb巯基转铁蛋白变体DNA片段亚克隆到来自pDB3191的6.013kb NcoI/AccI片段中,从而产生6.47kb质粒pDB3748、pDB3749、pDB3750、pDB3751(表2)。

    使用NotI限制性内切酶将适当的巯基转铁蛋白变体亚克隆质粒pDB3714、pDB3715、pDB3752、pDB3716、pDB3717、pDB3754、pDB3740、pDB3741、pDB3742、pDB3755、pDB3744、pDB3756、pDB3713、pDB3748、pDB3749、pDB3750或pDB3751彻底消化,从而释放适当的3.259kb巯基转铁蛋白变体表达盒。

    质粒pDB2690的构建在WO/2005061719 A1中已有描述。使用限制性内切酶NotI将质粒pDB2690(13.018kb)彻底消化,使用虾碱性磷酸酶进行去磷酸化,并与3.259kb NotI巯基转铁蛋白变体表达盒连接,以产生16.306kb的在与LEU2基因相同取向具有巯基转铁蛋白变体表达盒的质粒pDB3778、pDB3770、pDB3779、pDB3757、pDB3761、pDB3773、pDB3763、pDB3771、pDB3775、pDB3777,或者在与LEU2基因相反方向具有巯基转铁蛋白变体表达盒的质粒pDB3766、pDB3767、pDB3769、pDB3789、pDB3758、pDB3765、pDB3759。这些实例表明,为本发明的一部分,表达盒可以以任一取向克隆到的表达载体中。

    一个实例描述如下,其中通过插入半胱氨酸密码子而导入自由巯基(氨基酸链长度增加)。使用限制性内切酶NotI将质粒pDB3712彻底消化而释放3.262kb的巯基转铁蛋白(插入415C416)变体表达盒。使用限制性内切酶NotI将质粒pDB2690(13.018kb)彻底消化,使用虾碱性磷酸酶进行去磷酸化,并与3.262kb NotI巯基转铁蛋白变体表达盒连接,从而产生16.309kb的质粒pDB3745,其与LEU2基因具有相同取向并具有巯基转铁蛋白变体表达盒。

    一个实例描述如下,其中通过将两个密码子取代为半胱氨酸密码子而导入自由巯基(氨基酸链长度减小)。使用限制性内切酶NotI将质粒pDB3743彻底消化而释放3.256kb的巯基转铁蛋白(缺失416C)变体表达盒。使用限制性内切酶NotI将质粒pDB2690(13.018kb)彻底消化,使用虾碱性磷酸酶进行去磷酸化,并与3.256kb NotI巯基转铁蛋白变体表达盒连接,从而产生16.303kb的质粒pDB3760,其与LEU2基因具有相同取向并具有巯基转铁蛋白变体表达盒。

    巯基转铁蛋白(S28C、S415C)突变体表达质粒的构建

    一个实例描述如下,其中通过将丝氨酸28密码子取代为半胱氨酸密码子,以及丝氨酸415密码子取代为半胱氨酸密码子而引入两个自由巯基。

    SEQ ID 10是基于以下的DNA序列:成熟人转铁蛋白C1变体蛋白编码序列,其在苏氨酸613被修饰为丙氨酸密码子以防止在天冬酰胺611位点发生N-连接糖基化,在丝氨酸415被修饰为半胱氨酸密码子(TGT)以防止在天冬酰胺413位点发生N-连接糖基化,以及在丝氨酸28被修饰为半胱氨酸密码子(TGT)使得产生多于一个的(两个)自由巯基(核苷酸124-2160),两个翻译终止密码子(核苷酸2161-2166);转化酶前导(信号)蛋白编码序列(核苷酸67-123);3’UTR和ADH1基因终止子直至SphI克隆位点的部分(核苷酸2167-2359);5’UTR和PRB1基因启动子直至AflII克隆位点的部分(核苷酸1-66)。通过将pDB3744的1.737kb BsaBI DNA片段上存在的S415C、T613A突变亚克隆到质粒pDB3715中而构建表达质粒。用限制性内切酶BsaBI彻底消化质粒pDB3744,以释放巯基转铁蛋白(S415C)变体表达盒的1.737kb部分。用限制性内切酶BsaBI彻底消化质粒pDB3715,通过凝胶提取回收4.733kb片段并使用虾碱性磷酸酶去磷酸化。将来自质粒pDB3715的4.733kb片段与来自质粒pDB3744的1.737kb BsaBI巯基转铁蛋白变体片段相连接,而产生6.470kb质粒pDB3806(图11)。用限制性内切酶NotI彻底消化巯基转铁蛋白(S28C、S415C、T613A)变体亚克隆质粒pDB3806,以释放3.259kb巯基转铁蛋白(S28C、S415C、T613A)变体表达盒。用限制性内切酶NotI彻底消化质粒pDB2690(13.018kb),使用虾碱性磷酸酶去磷酸化,并将其与3.259kb NotI巯基转铁蛋白(S28C、S415C、T613A)变体表达盒相连接,以产生16.306kb质粒pDB3809(图12),该质粒具有与LEU2基因相反取向的巯基转铁蛋白(S28C、S415C、T613A)变体表达盒。

    用转铁蛋白表达质粒pDB3237以及巯基转铁蛋白表达质粒pDB3766、pDB3767、pDB3778、pDB3769、pDB3789pDB3770、pDB3771、pDB3779、pDB3757、pDB3761、pDB3773、pDB3763、pDB3760、pDB3745、pDB3775、pDB3758、pDB3777、pDB3765、pDB3809将酿酒酵母菌株(Strain 1)转化为亮氨酸原养型(leucine prototrophy)。使用改进的乙酸锂法(Sigma yeasttransformation kit,YEAST-1,方案2;Ito等,1983,J.Bacteriol.,153,16;Elble,1992,Biotechniques,13,18)转化酵母。在BMMD-琼脂平板上选择转化体,然后将转化体挑取到BMMD-琼脂平板上(patched out on BMMD-agarplates)。BMMD的组成由Sleep等(2002,Yeast,18,403)所描述。在20%(w/v)海藻糖中制备来自10mL BMMD摇瓶培养物(24小时,30℃,200rpm)的深低温保存物。

    乳铁蛋白突变蛋白表达质粒的构建

    转铁蛋白形成一组具有高度序列同源性的蛋白质,包括但不限于:人血清转铁蛋白(HST)、乳铁蛋白、黑素转铁蛋白和卵转铁蛋白。

    使用重叠寡核苷酸引物来产生合成DNA,该DNA编码可操作连接人乳铁蛋白(T139A、T480A、S625A)的转化酶前导序列,其可针对酿酒酵母中的表达进行或不进行密码子优化。SEQ ID No.11基于成熟人乳铁蛋白变体蛋白序列(登录号NP_002334),在苏氨酸139、苏氨酸480和丝氨酸625被修饰为丙氨酸密码子,以分别防止在天冬酰胺137、天冬酰胺478和天冬酰胺623位点的N-连接糖基化。

    SEQ ID No.12是编码转化酶前导蛋白序列的酿酒酵母天然DNA序列,该转化酶前导蛋白编码序列与编码人乳铁蛋白(T139A、T480A、S625A)的变体蛋白的人天然DNA序列(登录号NM_002343)可操作连接,所述变体蛋白在苏氨酸139、苏氨酸480和丝氨酸625被修饰为丙氨酸密码子,以分别防止在天冬酰胺137、天冬酰胺478和天冬酰胺623位点的N-连接糖基化(核苷酸124-2196),还包含两个终止密码子(核苷酸2197-2202);天然酿酒酵母转化酶前导(信号)蛋白编码序列(核苷酸67-123);3’UTR和ADH1基因终止子直至SphI克隆位点的部分(核苷酸2203-2395);5’UTR和PRB1基因启动子直至AflII克隆位点的部分(核苷酸1-66)。使所述序列侧翼具有SphI和AflII限制性内切酶位点,以便于克隆。

    SEQ ID No.13是编码转化酶前导蛋白序列的DNA序列,序列的密码子经优化而利于在酿酒酵母中表达,该转化酶前导蛋白编码序列与编码成熟人乳铁蛋白(T139A、T480A、S625A)变体蛋白的DNA序列可操作连接,所述变体蛋白在苏氨酸139、苏氨酸480和丝氨酸625被修饰为丙氨酸密码子,以分别防止在天冬酰胺137、天冬酰胺478和天冬酰胺623位点的N-连接糖基化(核苷酸124-2196),还包含两个终止密码子(核苷酸2197-2202);针对在酿酒酵母中表达而进行了密码子优化的转化酶前导(信号)蛋白编码序列(核苷酸67-123);3’UTR和ADH1基因终止子直至SphI克隆位点的部分(核苷酸2203-2395);5’UTR和PRB1基因启动子直至AflII克隆位点的部分(核苷酸1-66)。使所述序列侧翼具有SphI和AflII限制性内切酶位点,以便于克隆。

    对人转铁蛋白蛋白质和人乳铁蛋白蛋白质进行序列比对,来鉴定乳铁蛋白蛋白质序列中适于修饰成半胱氨酸残基从而产生自由巯基的氨基酸残基。表2所示从人转铁蛋白蛋白质序列中选择出用于修饰成半胱氨酸残基的氨基酸残基,这些残基在人转铁蛋白和人乳铁蛋白蛋白质序列比对中绘出。乳铁蛋白蛋白质序列上位置421处的丝氨酸残基对应于转铁蛋白蛋白质序列上位置415处的丝氨酸残基,因此选择丝氨酸421用于半胱氨酸残基的修饰。

    SEQ ID No.14是编码转化酶前导蛋白序列的DNA序列,序列的密码子经优化而利于在酿酒酵母中表达,该转化酶前导蛋白编码序列与编码成熟人乳铁蛋白(T139A、S421C、T480A、S625A)变体蛋白的DNA序列可操作连接,所述变体蛋白在苏氨酸139、苏氨酸480和丝氨酸625被修饰为丙氨酸密码子,以分别防止在天冬酰胺137、天冬酰胺478和天冬酰胺623位点的N-连接糖基化,以及在丝氨酸421被修饰为半胱氨酸密码子(TGT),密码子经优化而利于在酿酒酵母中表达(核苷酸124-2196),还包含两个终止密码子(核苷酸2197-2202);针对在酿酒酵母中表达而进行了密码子优化的转化酶前导(信号)蛋白编码序列(核苷酸67-123);3’UTR和ADH1基因终止子直至SphI克隆位点的部分(核苷酸2203-2395);5’UTR和PRB1基因启动子直至AflII克隆位点的部分(核苷酸1-66)。使所述序列侧翼具有SphI和AflII限制性内切酶位点,以便于克隆。

    用SphI和AflII彻底消化编码与人乳铁蛋白(T139A、T480A、S625A)可操作连接的转化酶前导序列的合成DNA序列(SEQ ID NO.12),以产生2.393kb片段。用限制性内切酶SphI和AflII彻底消化质粒pDB3191(6.470kb)(图3),以产生4.113kb片段,然后使用虾肠碱性磷酸酶将所述片段去磷酸化。将2.393kb转化酶前导序列-人乳铁蛋白(T139A、T480A、S625A)DNA片段连接到pDB3191来源的4.113kb SphI/AflII片段,以产生质粒pDB3815(图13)。

    用SphI和AflII彻底消化编码与人乳铁蛋白(T139A、T480A、S625A)可操作连接的转化酶前导序列的合成DNA序列(SEQ ID NO.13),以产生2.393kb片段,该DNA序列针对在酿酒酵母中表达而进行了密码子优化。用限制性内切酶SphI和AflII彻底消化质粒pDB3191(6.470kb)(图3),以产生4.113kb片段,然后使用虾肠碱性磷酸酶将所述片段去磷酸化。将2.393kb转化酶前导序列-人乳铁蛋白(T139A、T480A、S625A)DNA片段连接到pDB3191来源的4.113kb SphI/AflII片段,以产生质粒pDB3816(图13)。

    用SphI和AflII彻底消化编码与人乳铁蛋白(T139A、S421C、T480A、S625A)可操作连接的转化酶前导序列的合成DNA序列(SEQ ID NO.14),以产生2.393kb片段,该DNA序列针对在酿酒酵母中表达而进行了密码子优化。用限制性内切酶SphI和AflII彻底消化质粒pDB3191(6.470kb)(图3),以产生4.113kb片段,然后使用虾肠碱性磷酸酶将所述片段去磷酸化。将2.393kb转化酶前导序列-人乳铁蛋白(T139A、T480A、S625A)DNA片段连接进来自pDB3191的4.113kb SphI/AflII片段,以产生质粒pDB3817(图14)。

    用NotI限制性内切酶彻底消化质粒pDB3815和pDB3816,以释放编码转化酶前导序列人乳铁蛋白(T139A、T480A、S625A)表达盒的3.259kb DNA序列。用NotI限制性内切酶彻底消化质粒pDB3817,以释放3.259kb转化酶前导序列人乳铁蛋白(T139A、T480A、S421C、S625A)表达盒。

    质粒pDB2690的构建已描述于WO/2005061719 A1中。用限制性内切酶NotI彻底消化质粒pDB2690(13.018kb),使用虾碱性磷酸酶去磷酸化,将其分别与适当的来自pDB3815、pDB3816和pDB3817的3.259kb NotI乳铁蛋白变体表达盒相连接,以产生16.342kb质粒pDB3818、pDB3819(图15)和pDB3820(图16),其与LEU2基因具有相同方向的乳铁蛋白变体表达盒。

    用乳铁蛋白表达质粒pDB3818、pDB3819和pDB3820将酿酒酵母菌株(Strain 1)转化为亮氨酸原养型。利用改进的乙酸锂法(Sigma yeasttransformation kit,YEAST-1,方案2;Ito等,1983,J.Bacteriol.,153,16;Elble,1992,Biotechniques,13,18)转化酵母。在BMMD-琼脂平板上选择转化体,然后将转化体挑取到BMMD-琼脂平板上。BMMD的组成由Sleep等(2002,Yeast,18,403)所描述。在20%(w/v)海藻糖中制备来自10mL BMMD摇瓶培养物(24小时,30℃,200rpm)的深低温保存物。

    在这些实施例中,使用给定的密码子TGT用于半胱氨酸密码子,但是本发明中也可使用TGC密码子。

    实施例1:转铁蛋白和巯基转铁蛋白突变蛋白的纯化

    实施例1的转化体按照下述方式培养:

    在50ml锥形瓶中用10ml培养基在30℃,200rpm下使用YEPD培养基(1%(w/v)酵母提取物、2%(w/v)Bactopeptone、2%(w/v)葡萄糖)或BMMD(缓冲的极限培养基,0.67%(w/v)不具有氨基酸的Bacto Yeast NitrogenBase、36mM柠檬酸/126mM正磷酸氢二钠(pH 6.5)、2%(w/v)葡萄糖)培养摇瓶培养物。

    在10mL BMMD摇瓶中培养酵母转化体5天。将细胞离心后,通过4%~12%梯度SDS非还原凝胶(SDS-PAGE)和4%~12%梯度SDS还原凝胶(SDS-PAGE)将分泌进上清液的巯基转铁蛋白变体蛋白与Strain 1[pDB3237]表达的重组人转铁蛋白(S415A、T613A)进行比较(图17)。所有菌株分泌出与来自Strain 1[pDB3237]的重组人转铁蛋白(S415A、T613A)条带共迁移的蛋白条带。

    将10ml BMMD摇瓶中5天后表达的重组转铁蛋白变体的效价通过火箭免疫电泳与Strain 1[pDB3237]的效价进行比较(图18)。来自菌株:Strain 1[pDB3766]、Strain 1[pDB3767]、Strain 1[pDB3778]、Strain 1[pDB3769]、Strain 1[pDB3789]、Strain 1[pDB3770]、Strain 1[pDB3779]、Strain 1[pDB3757]、Strain 1[pDB3761]、Strain 1[pDB3773]、Strain 1[pDB3775]、Strain 1[pDB3758]、Strain 1[pDB3777]和Strain 1[pDB3765]的巯基转铁蛋白变体的分泌转铁蛋白效价类似于Strain 1[pDB3237](图18)。当通过火箭免疫电泳与Strain 1[pDB3237]的进行比较时,从Strain 1[pDB3771]、Strain 1[pDB3763]、Strain 1[pDB3760]Strain 1[pDB3745]和Strain 1[pDB3759]检测到较低的表达。

    通过如本发明所述的插入半胱氨酸残基(氨基酸链长度增加),用半胱氨酸取代两个或更多个相邻残基(氨基酸链长度减少),或用半胱氨酸取代氨基酸残基(氨基酸链长度不变),缺失半胱氨酸残基或上述的组合产生的巯基转铁蛋白突变蛋白表达为全长单体蛋白质的形式,其与重组转铁蛋白(S415A、T613A)具有相同的分子量,与转铁蛋白抗体具有相同的反应性(由火箭免疫电泳所测定的),证明修饰为半胱氨酸残基的氨基酸修饰对蛋白表达没有不利的影响。

    在10L Braun Biostat E发酵罐中在30℃进行补料-分批发酵(Feb-batchfermentation);监测pH,并根据需要通过加入氨或硫酸进行调节。氨还为培养提供了氮源。监测溶解氧的水平,并与搅拌速率相关联,以维持>20%的饱和度。接种物在缓冲的极限培养基中在摇瓶中培养。对于批次期(batch-phase),将培养物接种于含2%(w/v)蔗糖的发酵罐培养基中(约50%的发酵罐体积)。溶解氧水平急剧升高自动引发补料期。通过控制补料速率将蔗糖保持在生长限制浓度,以设定标称生长速率(nominal growth rate)。补料由含有50%(w/v)蔗糖的发酵培养基组成,其基本上均如Collins,S.H.,(1990)(S.H.Collins,Production of secreted proteins in yeast,于T.J.R.Harris(编)Protein production by biotechnology中,Elsevier,London,1990,pp.61~77)所述。

    通过离心收集培养上清液。使用两步离子交换色谱程序制备突变体转铁蛋白(巯基转铁蛋白)。用水稀释培养上清液,以得到适于结合第一柱子(例如SP-FF)的传导性(conductivity)。在SP-FF的情况下,在用冰醋酸将pH调至5.0后,将培养上清液稀释至3.0±0.3mS/cm。

    第一层析步骤使用SP-Sepharose Fast Flow(GE Healthcare)柱子(床体积为约400ml,床高度为11cm),其用50mM乙酸钠(pH 5.0)平衡。将10mg~25mg突变体转铁蛋白/ml基质(matrix)上样。用3倍柱体积的平衡缓冲液洗涤柱子,用约2倍柱体积的50mM磷酸钠,25mM氯化钠(pH 7.0)洗脱蛋白质。在上样和洗涤过程中线性流速为330cm/h,在洗脱过程中为165cm/h。

    对于第二个步骤,在用氢氧化钠将pH调至9.0~9.3后,将洗脱液约稀释3倍,得到<3.0±0.3mS/cm的传导性。将其上样到DEAE-Sepharose FastFlow(GE Healthcare)柱(床体积为约800ml,床高度为11cm),其用15.7mM四硼酸钾(pH 9.2)平衡。上样为5mg~10mg突变体转铁蛋白/ml基质。用5倍柱体积的平衡缓冲液洗涤柱子,用4~5倍柱体积的60mM四硼酸钾(pH9.35)洗脱。在上样和洗涤过程中线性流速为286cm/h,在洗脱过程中为264cm/h。浓缩洗脱液,使用Pall Centramate10,000NMWCO膜以10mM HEPES缓冲液进行渗滤,得到约20mg/ml的终浓度,并保存于-80℃。

    通过反相高效液相色谱(RP-HPLC),使用在Shimadzu VP7.3客户端服务器软件的控制下装备了UV检测器的Agilent 1100双梯度系统,来测定重组巯基转铁蛋白突变体蛋白质浓度。在45℃以1ml/min的流速包括流动相A(水中0.1%TFA,5%乙腈)、流动相B(水中0.1%TFA,95%乙腈)向Phenomenex Jupiter C4(50×4.6mm,5μm)上注射多至100μL,使用梯度时间程序0至3分钟30%B、3至13分钟从30至55%B(线性梯度)、13至14分钟55%B、14至15分钟55至30%B(线性梯度)、15至20分钟30%B(等度)。在214nm吸光度处检测到峰值,利用0.1μg~10μg的人转铁蛋白(Calbiochem)标准曲线进行定量。

    表达巯基转铁蛋白(S32C、S415A、T613A)变体的Strain 1[pDB3778]、表达巯基转铁蛋白(A215C、S415A、T613A)变体的Strain 1[pDB3779]和表达巯基转铁蛋白(S415A、N553C、T613A)变体的Strain 1[pDB3758]的高细胞密度补料-分批发酵分别得到1.95、1.75和0.61mg.mL-1的产率(n=1)。表达巯基转铁蛋白(S28C、S415A、T613A)的Strain 1[pDB3767]的高细胞密度补料-分批发酵得到约1.67mg.mL-1(n=2)的产率,以及表达巯基转铁蛋白(S415C、T613A)的Strain 1[pDB3773]的高细胞密度补料-分批发酵得到约1.06mg.mL-1(n=2)的产率。

    使用全铁化(holoisation)程序制备载铁的重组巯基转铁蛋白变体蛋白。向纯化的巯基转铁蛋白样品中加入碳酸氢钠至终浓度为20mM。计算达到目标2mol Fe3+.mol-1转铁蛋白的铁的量(10mg.mL-1(16.5%~18.5%Fe)柠檬酸铁铵的形式),添加到重组转铁蛋白/20mM碳酸氢钠制备物,使其在环境温度(2l℃~25℃)混合至少60分钟,然后超滤至145mM NaCl中。

    实施例2:转铁蛋白受体结合

    按照如下所述测定转铁蛋白受体结合。

     红白血病K562细胞中的55Fe摄取竞争

    提供从10mM磷酸缓冲盐溶液(pH7.4)冻干的人血浆来源的脱铁-转铁蛋白(Calbiochem 616419,组织培养级,无热原)。如上所述进行表达、纯化和定量转铁蛋白突变蛋白。

    对于从标记的二铁转铁蛋白摄取铁-55,用含有HEPES缓冲液和1mg/ml牛血清白蛋白的无血清培养基洗涤在标准条件(碳酸氢盐缓冲液,5%(v/v)CO2,抗生素,10%(v/v)胎牛血清)下、在RPMI细胞培养基中培养的K562红白血病细胞,在此培养基中以1千万个细胞/ml的浓度使用。将所检测的样品制备成等摩尔浓度的脱铁-转铁蛋白突变蛋白。通过用0.1M柠檬酸盐、0.1M乙酸盐、10mM EDTA(pH 4.5)透析来制备脱铁-转铁蛋白突变蛋白。过滤溶液(0.22μm),使用Vivaspin聚醚砜10,000NMWCO离心浓缩机将其浓缩至10mg/ml,用10倍体积的水、然后再用10倍体积的0.1M HEPES、0.1MNaHCO3(pH 8.0)进行渗滤。利用漂洗从浓缩机中回收样品,并制成终浓度为5mg/ml。使用氨三乙酸铁作为铁源,据标准程序用铁加载转铁蛋白突变蛋白(Bates和Schlabach,J Biol Chem,248,3228~3232,1973)。通常,向450μl转铁蛋白突变蛋白保存溶液(pH为碱性或中性)中添加50μl的1M NaClO4。通过将8.5μl 50mM NTA(pH 8.25)、18.9μl 0.1M Tris、98.8μl Millipore-纯化的水和7.5μl的在0.5N HCl中的55FeCl3(NEN产品)混合来制备55Fe-NTA-加载缓冲液。小心混合(逐滴)500μl转铁蛋白突变蛋白和55Fe-NTA-加载缓冲液,然后与310μl的5mM Hepes混合。加入NaOH/0.1M NaClO4。将混合物在4℃温育60分钟,然后用PD-10柱(含有Sephadex G-25)脱盐并透析。PD-10柱用5ml平衡缓冲液(5mM Hepes/NaOH,0.1M NaClO4,0.1g BSA(Amresco))平衡,然后用5ml洗涤缓冲液(5mM Hepes/NaOH,0.1M NaClO4)洗3遍。将铁(55Fe)-加载的转铁蛋白突变蛋白上样到柱子上,用洗脱缓冲液(5mMHepes/NaOH,0.1M NaClO4)洗脱。洗脱的铁(55Fe)-加载的转铁蛋白突变蛋白在4℃用5mM Hepes,0.15mM NaCl(pH 7.4)透析。

    标记有55Fe的浓度递增的人血浆转铁蛋白或转铁蛋白突变蛋白样品(0、25nM、100nM、200nM、400nM、800nM、1600nM)与25μl培养基混合。加入300μl的细胞悬液开始反应。在百倍过量的未标记二铁转铁蛋白存在下(以导致非特异性结合)进行第二系列的平行实验。在37℃下25分钟后,通过浸入冰浴中停止反应,将3份60μl细胞悬液等分试样转移到新管,冷冻离心所述细胞,在加入二乙基邻苯二甲酸酯/二丁基邻苯二甲酸酯的油层之后再次离心。除去上清液,将细胞沉淀转移进计数器管,用0.5M KOH+1%(v/v)Triton X-100裂解。过夜裂解后,裂解物用1M HCl中和,与Readysolv闪烁混合物(Readysolv scintillation cocktail)混合,并在Packard液体闪烁计数器(Packard Liquid Scintillation Counter)中计数。结果通常以fmol55Fe/百万细胞给出。

     转铁蛋白突变蛋白和放射标记的血浆转铁蛋白对铁摄取进入人K562细胞的竞争

    另外,使用恒定浓度的55Fe-加载的血浆转铁蛋白以及浓度范围为0至1600nM(0、25nM、100nM、200nM、400nM、800nM、1600nM)的非放射性标记的全转铁蛋白突变蛋白进行竞争测定。铁(55Fe)-加载的血浆转铁蛋白如上所述制备。将K562细胞添加到温育混合物,使细胞密度变为106细胞/ml。使用含有0.1%(w/v)牛血清白蛋白和10mM Hepes的RPMI培养基稀释转铁蛋白和细胞。在37℃下25分钟后,通过浸入冰浴中停止反应,将3份60μl细胞悬液等分试样转移到新管,冷冻离心所述细胞,在加入二乙基邻苯二甲酸酯/二丁基邻苯二甲酸酯的油层之后再次离心。除去上清液,将细胞沉淀转移进计数器管,用0.5M KOH,1%(v/v)Triton X-100裂解。过夜裂解后,裂解物用1M HCl中和,与Readysolv闪烁混合物混合,在Packard液体闪烁计数器中计数。结果通常以fmol55Fe/百万细胞给出。

    如果巯基转铁蛋白具有不带Cys插入的相应多肽的至少5%的受体结合能力,就认为它结合到转铁蛋白受体上。

    实施例3:三维模型构建

    为了获得合理的转铁蛋白模型,在可鉴定出铁和受体的结合区域以及表面暴露区域的情况下,使用下列方法:

    最初的模型构建由Pymol(Warren L.DeLano″The PyMOL MolecularGraphics System.″,DeLano Scientific LLC,San Carlos,CA,USA.http://www.pymol.org)进行。使用两种结构作为模板:

    1.脱铁-人血清转铁蛋白的链A,PDB entry 2HAV

    2.人转铁蛋白受体-转铁蛋白复合物,PDB entry 1SUV

    在模型构建中使用下列步骤:

    1.直接将1SUV的链A和B复制到新模型,并分别命名为链R和S。

    2.使用Pymol中的“比对”命令,将2HAV的链A的拷贝与1SUV的链D和F进行比对。只有C-α碳原子用于比对。在此位置,观察到与1SUV的链A和B有严重冲突(clash),因此手动除去此结构,以减少冲突。将结果复制为新模型的链A。

    3.使用Pymol中的“比对”命令,将2HAV的链A的另一个拷贝与1SUV的链C进行比对。仅考虑直至2HAV的链A的332号的残基,只有C-α碳原子用于比对。将结果复制为新模型的链B。

    使用Gromacs 3.3软件(D.van der Spoel,E.Lindahl,B.Hess,G.Groenhof,A.E.Mark和H.J.C.Berendsen:GROMACS:Fast,Flexible and Free,J.Comp.Chem.26 pp.1701~1718(2005))对模型进行分子力学模拟。利用分子动力学级联:

    1.最快下降最小化的100步

    2.使用周期边界条件嵌入16×16×16nm溶剂水框(solvent waterbox)。

    3.最快下降最小化100步。

    4.在300K的2ns NVT分子动力学。

    分子动力学模拟400ps后记录结构快照。获得模型的每个残基的三组数据:

    1.处理2ns分子动力学模拟的轨道,并使用Gromacs工具”g_rmsf”计算模拟的最后一纳秒的过程中C-α碳原子的均方根涨落。

    2.使用DSSP软件(W.Kabsch和C.Sander,Biopolymers 22(1983)2577~2637)计算400ps快照结构中每个残基的溶剂可及表面积。将每个溶剂可及表面积除以该位置上发现的特定氨基酸的标准值,并乘以100,由此获得每个残基的标准值百分比。

    20种不同氨基酸的标准溶剂可及表面积被定义为(使用单字母代码表示氨基酸):

    A=62、C=92、D=69、E=156、F=123、G=50、H=130、I=84、K=174、L=97、M=103、N=85、P=67、Q=127、R=211、S=64、T=80、V=81、W=126、Y=104

    3.使用DSSP软件(W.Kabsch和C.Sander,Biopolymers 22(1983)2577~2637)确定400ps快照结构中每个残基的二级结构。如果二级结构被确定为H(螺旋)、B(分离的β桥(isolated beta bridge))或E(延伸片层),则将该残基记为’1’,否则就记为’0’。

    弃去有关模型的链R和S的数据。收集链A和链B(三个数据组中的每一个)的数据。

    实施例4:含有多于一个自由巯基的巯基转铁蛋白突变体蛋白的表达

    在该实施例中,通过用半胱氨酸残基取代丝氨酸-28以及用半胱氨酸残基取代丝氨酸-415而引入两个自由巯基。将巯基转铁蛋白(S28C、S415C、T613A)变体的分泌与巯基转铁蛋白(S28C、S415A、T613A)变体、巯基转铁蛋白(S415C、T613A)变体以及转铁蛋白(S415A、T613A)的分泌进行比较。巯基转铁蛋白(S28C、S415C、T613A)变体表达质粒pDB3809的构建在实施例1中已记载。

    将Strain 1[pDB3809]、Strain 1[pDB3767]、Strain 1[pDB3773]以及Strain1[pDB3237]在10ml BMMD摇瓶中培养5天。将细胞离心后,通过4%~12%梯度SDS非还原凝胶(SDS-PAGE)以及4%~12%梯度SDS还原凝胶(SDS-PAGE)对由Strain 1[pDB3809]、Strain 1[pDB3767]、Strain 1[pDB3773]分泌到上清液中的巯基转铁蛋白(S28C、S415C、T613A)变体、巯基转铁蛋白(S28C、S415A、T613A)变体、和巯基转铁蛋白(S415C、T613A)变体蛋白与由Strain 1[pDB3237]分泌的重组人转铁蛋白(S415A、T613A)进行比较(图19)。检测到对应于由Strain 1[pDB3709]分泌的巯基转铁蛋白(S28C、S415C、T613A)蛋白的蛋白条带,其与分别由Strain 1[pDB3767]、Strain 1[pDB3773]和Strain 1[pDB3237]分泌的重组人转铁蛋白(S415A、T613A)、巯基转铁蛋白(S28C、S415A、T613A)、巯基转铁蛋白(S415C、T613A)条带共迁移,证明了由Strain 1[pDB3709]分泌的巯基转铁蛋白(S28C、S415C、T613A)蛋白是作为单体蛋白质分泌的。

    通过火箭免疫电泳,在10mL BMMD摇瓶中培养5天后,将Strain 1[pDB3709]分泌的重组巯基转铁蛋白(S28C、S415C、T613A)的效价与Strain1[pDB3767]分泌的重组巯基转铁蛋白(S28C、S415A、T613A)、Strain 1[pDB3773]分泌的重组巯基转铁蛋白(S415C、T613A)和Strain 1[pDB3237]分泌的重组转铁蛋白(S415A、T613A)进行比较。(图20)Strain 1[pDB3709]分泌的重组巯基转铁蛋白(S28C、S415C、T613A)的火箭免疫电泳和SDS-PAGE分析证明,转铁蛋白蛋白质的一个以上所选氨基酸残基被修饰成半胱氨酸残基对全长单体蛋白质的蛋白表达没有不利的影响。

    实施例5:乳铁蛋白和巯基乳铁蛋白突变体蛋白的表达

    乳铁蛋白(T139A、T480A、S625A)和巯基乳铁蛋白(T139A、S421C、T480A、S625A)表达质粒pDB3818-20的构建在实施例1中已记载。

    将Strain 1[pDB3818]、Strain 1[pDB3719]、Strain 1[pDB3720]、Strain 1[pDB3773]和Strain 1[pDB3237]在10mL BMMD摇瓶中培养5天。将细胞离心后,通过4%~12%梯度SDS非还原凝胶(SDS-PAGE)以及4%~12%梯度SDS还原凝胶(SDS-PAGE)对Strain 1[pDB3818]、Strain 1[pDB3719]和Strain 1[pDB3720]分泌到上清液中的乳铁蛋白(T139A、T480A、S625A)和巯基乳铁蛋白(T139A、S421C、T480、S625)变体蛋白与Strain 1[pDB3237]分泌的重组人转铁蛋白(S415A、T613A)和Strain 1[pDB3773]表达的巯基转铁蛋白(S415C、T613A)进行比较(图21)。

    检测到对应于Strain 1[pDB3818]和Strain 1[pDB3819]均分泌的乳铁蛋白(T139A、T480A、S625A)蛋白的蛋白条带,其迁移在约80kDa,表明乳铁蛋白(T139A、T480A、S625A)可由微生物宿主表达;表达质粒可以针对在微生物宿主中的表达进行或不进行密码子优化。乳铁蛋白蛋白质序列的位置421的丝氨酸残基等同于转铁蛋白蛋白质序列的位置415的丝氨酸残基(参见实施例1),因此对由Strain 1[pDB3820]表达的巯基乳铁蛋白(T139A、S421C、T480A、S625A)与由Strain 1[pDB3773]表达的巯基转铁蛋白(S415C、T613A)进行比较(图16)。也检测到对应于由Strain 1[pDB3820]分泌的乳铁蛋白(T139A、S421C、T480A、S625A)蛋白的蛋白条带,其与乳铁蛋白(T139A、T480A、S625A)共迁移,证明所选氨基酸残基被修饰成半胱氨酸残基对蛋白质表达没有不利的影响,以及其它转铁蛋白家族蛋白也可用于本发明。

    实施例6:巯基转铁蛋白突变体蛋白的铁结合

    使用两个实验程序测定本发明中所述的巯基转铁蛋白突变体蛋白结合铁的能力,并将其与重组人转铁蛋白(S415A、T613A)标准品进行比较,所述程序是用于总铁结合能力的尿素凝胶分析和分光光度测定。

    将重组巯基转铁蛋白(S28C、S415A、T613A)、重组巯基转铁蛋白(S32C、S415A、T613A)、重组巯基转铁蛋白(A215C、S415A、T613A)、重组巯基转铁蛋白(S415C、T613A)和重组巯基转铁蛋白(S415A、N553C、T613A)的铁结合能力与纯化的重组人转铁蛋白(S415A、T613A)标准品的铁结合能力进行比较。如实施例2中所述对重组巯基转铁蛋白(S28C、S415A、T613A)、重组巯基转铁蛋白(S32C、S415A、T613A)、重组巯基转铁蛋白(A215C、S415A、T613A)、重组巯基转铁蛋白(S415C、T613A)和重组巯基转铁蛋白(S415A、N553C、T613A)进行铁加载。

    在6% TBE Urea PAGE(Invitrogen)上分离5μg样品,并用CoomassieG250(Pierce)染色(图22)。该技术分离到四种具有不同铁负载量的分子形式,即(按运动性增大顺序)脱铁-转铁蛋白、C-叶结合单铁转铁蛋白、N-叶结合单铁转铁蛋白和全铁-转铁蛋白。据信这四种形式的转铁蛋白的分离是由于在4M~6M尿素中的部分变性所致;其中在任一叶中的铁结合都会导致构象改变,从而造成对变性的抗性增加。因此,叶中铁的存在造成结构更紧凑,电泳迁移性更高。N-叶由于具有比C-叶少的二硫键(分别为8与11),因此其在没有铁的情况下进一步展开,使得C-叶上结合有铁的单铁形式的运动性最小。

    巯基转铁蛋白变体能够结合铁,但是在实验条件下,纯化的重组巯基转铁蛋白(S28C、S415A、T613A)、重组巯基转铁蛋白(S32C、S415A、T613A)、重组巯基转铁蛋白(A215C、S415A、T613A)、重组巯基转铁蛋白(S415C、T613A)和重组巯基转铁蛋白(S415A、N553C、T613A)(图22的泳道3~7)看起来没有被铁完全饱和,并且通过分析型TBE尿素凝胶显示比重组转铁蛋白(S415A、T613A)(图22中的泳道2)迁移慢的条带,并观察到不均匀性。其中一个蛋白条带与对应于二铁转铁蛋白的全铁-转铁蛋白形式的重组人转铁蛋白(S415A、T613A)条带共迁移。巯基转铁蛋白变体还看起来含有单铁转铁蛋白级分。需要认真解读这些结果。存在对应于单铁(巯基)转铁蛋白变体的条带显示,铁加入没有导致饱和二铁转铁蛋白典型的更高的电泳迁移性。但是,因为该技术依赖于铁结合的稳定性,所以突变阻止了铁结合的结论并不可靠;叶对于尿素变性的不稳定性会导致同样的结果。

    如本申请中所述,使用Caraway(1963 Clinical Chem 9(2))所述的测定血清铁和铁结合能力的改进方法来测定本发明所述重组巯基转铁蛋白和重组人转铁蛋白(S415A、T613A)(DeltaferrinTM)标准品的总铁结合能力(TIBC)。

    测得重组人转铁蛋白(S415A、T613A)的总铁结合能力(TIBC)为2.14。重组巯基转铁蛋白(S28C、S415A、T613A)变体的总铁结合能力为1.91,重组巯基转铁蛋白(A215C、S415A、T613A)变体为2.23,重组巯基转铁蛋白(S415A、N553C、T613A)变体为2.00、重组巯基转铁蛋白(S415C、T613A)变体为2.18以及重组巯基转铁蛋白(S32C、S415A、T613A)变体为2.42(表3),表明所选残基被修饰为半胱氨酸没有改变转铁蛋白突变蛋白的总体结构,也没有阻碍巯基转铁蛋白突变蛋白与铁结合的能力。

    实施例7:相比于重组转铁蛋白(S415A、T613A),重组巯基转铁蛋白变体的转铁蛋白受体结合能力

    通过表面等离子体共振(SPR)分析来评估重组转铁蛋白变体的受体结合能力。使用表面等离子体共振(SPR)可检测转铁蛋白样品与转铁蛋白受体的结合活性,SPR是一种非侵入性光学技术,其中SPR响应是检测器表面由于分子结合或解离造成的质量浓度改变的度量。通过微流体系统以恒定流速将样品送至传感器芯片表面。在此分析中,如果转铁蛋白样品能够结合至TfR,则表面传感器芯片上的质量由于TfR和Tf分子之间的结合而增加,产生表面等离子体波,与结合的量成比例的SPR信号的变换可以由于共振单位(RU)的改变而被检测出来。1RU的响应等同于表面浓度改变约1pg.mm-2

    通过首先固定转铁蛋白受体抗体,然后添加转铁蛋白来制备用于转铁蛋白和转铁蛋白受体之间的相互作用分析的Biacore传感器芯片。具体而言,使用胺偶联化学技术在25℃将抗转铁蛋白受体(抗-TfR)抗体固定于CM5传感器芯片表面(GE Healthcare,目录号:BR-1000-14)。通过添加N-羟基琥珀酰亚胺:N-乙基-N’-(二甲基氨基丙基)碳二亚胺(NHS:EDC)将CM5传感器芯片流体细胞流动池(flow cell)的羧甲基化葡聚糖表面转化为活性琥珀酰胺酯。

    

    可通过以下方法来确认(转铁蛋白)受体特异性结合:同时制备具有除了转铁蛋白受体之外的固定蛋白质的传感器芯片,并减去在样品样本被允许在此芯片上流动时共振单位的改变以排除溶剂等造成的所谓的体积效应(bulkeffect)。在10mM乙酸钠(pH5.0)(GE Healthcare目录号BR-1003-50)中将抗TfR抗体(AbD Serotec目录号为MCA1148)稀释到10μg.mL-1,仅注射到流动池2上。而50μL转铁蛋白受体(TfR)(AbD Serotec目录号为9110-300)(在HBS-EP(10mM HEPES,150mM NaCl,3mM EDTA,0.005%表面活性剂P-20,pH 7.4)中稀释到10μg.mL-1~20μg.mL-1)注射到两个流动池上。使用乙醇胺盐酸盐(1M pH 8.5)使传感器芯片表面上过量的酯基失活。

    使用HBS-EP作为相互作用分析的运行缓冲液(running buffer)和稀释缓冲液。将采用第一层析步骤进行纯化的纯化的载铁的重组转铁蛋白(S415A、T613A)或者重组巯基转铁蛋白(S28C、S415A、T613A)、重组巯基转铁蛋白(S32C、S415A、T613A)、重组巯基转铁蛋白(A215C、S415A、T613A)、重组巯基转铁蛋白(S415C、T613A)、和重组巯基转铁蛋白(S415A、N553C、T613A)稀释到20μg.mL-1,并注射50μL到两个流动池上。设置重复以确保可重复性,在样品注射间隙通过6~12秒注射10mM乙酸钠pH 4.5(GEHealthcare目录号BR-1003-50),从而在加入纯化的重组转铁蛋白变体间隙使所制备的Biacore传感器芯片表面再生。根据需要进行最多三次注射,直至恢复基线。

    对第一层析步骤纯化的重组巯基转铁蛋白(S28C、S415A、T613A)、重组巯基转铁蛋白(S32C、S415A、T613A)、重组巯基转铁蛋白(A215C、S415A、T613A)、重组巯基转铁蛋白(S415C、T613A)和重组巯基转铁蛋白(S415A、N553C、T613A)样品与纯化载铁重组转铁蛋白(S415A、T613A)的结合转铁蛋白受体能力进行比较。

    如果巯基转铁蛋白具有不带半胱氨酸插入的相应多肽的至少5%的受体结合能力,则认为它结合转铁蛋白受体。通过定量SPR分析,所有巯基转铁蛋白突变蛋白能够结合转铁蛋白受体。

    实施例8:重组巯基转铁蛋白变体的质谱分析

    对于本实施例,根据实施例2通过第一层析步骤纯化而制备的纯化重组巯基转铁蛋白变体,通过ESITOF质谱进行分析,并将其与纯化的转铁蛋白(S415A、T613A)进行比较。

    将样品制备成测试蛋白的用于质谱分析的水溶液,所述测试蛋白使用反相(RP-)HPLC脱盐/浓缩,在典型的20nmol/mL~100nmol/mL浓度回收蛋白质。在Brownlee Aquapore BU-300(C4)7mm,100×2.1mm柱子上进行RP-HPLC脱盐,该方法使用0.1%(v/v)三氟乙酸(TFA)为溶剂A和70%(v/v)乙腈、0.1%(v/v)TFA为溶剂B的双梯度,收集的洗脱组分在280nm处检测UV(紫外)吸光度。对于时间飞行质谱,将样品引入杂交四极杆时间飞行质谱仪(QqOaTOF,Applied Biosystems,该质谱仪装备有正离子模式的IonSprayTM源,使用流动注射分析(FIA)。主动调节的设备参数只有去耦电压(Decoupling Potential(DP)),其通常设置为250V。通常平均进行2分钟样品扫描。对于蛋白质分析来说,TOF分析仪针对质子化马肌球蛋白(Sigma)分子离子进行校准,分辨率一般是12000。使用AnalystTM QS v1.1软件(Applied Biosystems)进行设备控制和数据获取和处理。

    图23显示巯基转铁蛋白(S28C、S415A、T613A)变体、巯基转铁蛋白(A215C、S415A、T613A)变体、巯基转铁蛋白(S415C、T613A)变体、巯基转铁蛋白(S415A、N553C、T613A)变体和巯基转铁蛋白(S32C、S415A、T613A)变体的质谱图(与转铁蛋白(S415A、T613A)相比)。转铁蛋白(S415A、T613A)的质谱分析显示两个峰。在此例中,一个峰(在图23中记为“A”)对应于未修饰的转铁蛋白(S415A、T613A)分子,标称质量75097(理论质量75098Da)(图23)。另有一个大峰(在图23中记为“B”),其具有预期的由于单个己糖加成导致的162道尔顿的增量。这可能表示有O-连接糖基化。

    谱B显示来自高细胞密度发酵的Strain 1[pDB3767]的由第一层析步骤纯化的巯基转铁蛋白(S28C、S415A、T613A)变体的质谱图。当位置28的丝氨酸残基被修饰为半胱氨酸时,预期质量为75114,分子发生折叠使得38个半胱氨酸残基呈二硫键形式,并具有一个自由巯基。在该情况下,最大的单峰(在图23中记为“C”)对应于标称质量为75116(理论质量为75114Da)的未修饰分子。有一个大峰(在图23中记为“D”),其具有预期的由于单个己糖加成导致的162道尔顿的增量。这可能表示有O-连接糖基化。

    谱C显示来自高细胞密度发酵的Strain 1[pDB3779]的由第一层析步骤纯化的巯基转铁蛋白(A215C、S415A、T613A)变体的质谱图。当位置215的丙氨酸残基被修饰为半胱氨酸时,预期质量为75130,分子发生折叠使得38个半胱氨酸残基呈二硫键形式,并具有一个自由巯基。在该情况下,最大的单峰(在图23中记为“E”)对应于标称质量为75130(理论质量为75130Da)的未修饰分子。有一个大峰(在图23中记为“F”),其具有预期的由于单个己糖加成导致的162道尔顿的增量。这可能表示有O-连接糖基化。

    谱D显示来自高细胞密度发酵的Strain 1[pDB3773]的由第一层析步骤纯化的巯基转铁蛋白(S415C、T613A)变体的质谱图。当位置415的丝氨酸残基被修饰为半胱氨酸时,预期质量为75130,分子发生折叠使得38个半胱氨酸残基呈二硫键形式,并具有一个自由巯基。在该情况下,最大的单峰(在图23中记为“G”)对应于标称质量为75127(理论质量为75130Da)的未修饰分子。有一个大峰(在图23中记为“H”),其具有预期的由于单个己糖加成导致的162道尔顿的增量。这可能表示有O-连接糖基化。

    谱E显示来自高细胞密度发酵的Strain 1[pDB3758]的由第一层析步骤纯化的巯基转铁蛋白(S415A、N553C、T613A)变体的质谱图。当位置553的天冬酰胺残基被修饰为半胱氨酸时,预期质量为75087,分子发生折叠使得38个半胱氨酸残基呈二硫键形式,并具有一个自由巯基。在该情况下,最大的单峰(在图23中记为“I”)对应于标称质量为75082(理论质量为75087Da)的未修饰分子。有一个大峰(在图23中记为“J”),其具有预期的由于单个己糖加成导致的162道尔顿的增量。这可能表示有O-连接糖基化。

    谱F显示来自高细胞密度发酵的Strain 1[pDB3778]的由第一层析步骤纯化的巯基转铁蛋白(S32C、S415A、T613A)变体的质谱图。巯基转铁蛋白(S32C、S415A、T613A)的质谱分析仅显示一个主要峰。当位置32的丝氨酸残基被修饰为半胱氨酸时,预期质量为75114,分子发生折叠使得38个半胱氨酸残基呈二硫键形式,并具有一个自由巯基。在该情况下,最大的单峰(在图23中记为“K”)对应于标称质量为75110(理论质量为75114Da)的未修饰分子。与其它转铁蛋白/巯基转铁蛋白质谱分析不同的是,没有检测到对应于由于单个己糖加成导致的162道尔顿增量的额外峰,表明丝氨酸-32突变为半胱氨酸的突变阻止了此位置的O-连接糖基化。

    实施例9:用ELLMAN试剂(5’5’-二硫代-双(2-硝基苯甲酸)(DTNB)处理的重组巯基转铁蛋白变体的质谱分析

    可使用Ellman试剂用分光光度法测定蛋白质上自由巯基的数目。Ellman试剂(5’5’-二硫代-双(2-硝基苯甲酸)(DTNB)是芳香族二硫化物,其与巯基反应形成蛋白的混合二硫化物和1摩尔2-硝基-5-硫代-苯甲酸酯(TNB)(每摩尔的蛋白硫化基)。作为选择,可使用经DTNB试剂处理的蛋白质样品的质谱分析测定蛋白质上的自由巯基的数目。5-硫代-2-硝基苯甲酸(TNB)的分子量是199Da,因此197Da的质量增加(TNB减去与测试蛋白上自由巯基形成二硫桥时的H2损失)表明蛋白质样品上存在一个自由巯基。

    将100μl测试蛋白样品(20mg.mL-1)添加到100μl缓冲液2(4mg.mL-1DTNB和500mM磷酸钠,pH 7.0)和900μl缓冲液1(0.1M TRIS-HCl,100mMEDTA,pH8.0)。使制备物在环境温度(21℃~25℃)混合25分钟,然后通过低分子质量截留滤器(Vivaspin 2-10000 MWCO Sartorius Stedim Germany)进行过滤。用两倍体积的0.1%三氟乙酸(TFA)洗涤滤器,将样品重悬于300μl的0.1%TFA。使用反相(RP-)HPLC脱盐/浓缩制备用于质谱分析的TNB标记的样品。在Brownlee Aquapore BU-300(C4)7mm,100×2.1mm柱上进行RP-HPLC脱盐,该方法使用0.1%(v/v)三氟乙酸(TFA)为溶剂A和70%(v/v)乙腈、0.1%(v/v)TFA为溶剂B的双梯度,收集的洗脱组分在280nm处检测UV吸光度。

    对于时间飞行质谱,将样品引入杂交四极杆时间飞行质谱仪(QqOaTOF,Applied Biosystems,该质谱仪装备有正离子模式的IonSprayTM源,使用如实施例9所述的流动注射分析(FIA)。

    图24显示用DTNB处理的巯基转铁蛋白(S28C、S415A、T613A)变体、巯基转铁蛋白(A215C、S415A、T613A)变体、巯基转铁蛋白(S415C、T613A)变体、巯基转铁蛋白(S415A、N553C、T613A)变体和巯基转铁蛋白(S32C、S415A、T613A)变体的质谱图(与经DTNB处理的转铁蛋白(S415A、T613A)相比较)。DTNB处理的转铁蛋白(S415A、T613A)的质谱分析显示了两个峰。在该情况下,一个峰(在图24中记为“A”)对应于标称质量为75097(理论质量为75098Da)的未修饰转铁蛋白(S415A、T613A)分子(图24)。另有一个由于单个己糖加成而预期增加162道尔顿的大峰(在图24中记为“B”)。这可能表示有O-连接糖基化。在质谱中未检测到195Da的质量变化,确认了转铁蛋白(S415A、T613A)(DeltaferrinTM标准品)中所有38个半胱氨酸残基都呈二硫键形式,不存在自由巯基。

    谱B显示来自高细胞密度发酵的Strain 1[pDB3767]的巯基转铁蛋白(S28C、S415A、T613A)变体的质谱图,所述变体由第一层析步骤纯化,已经过DTNB处理。当位置28的丝氨酸残基被修饰为半胱氨酸时,预期质量为75311,分子发生折叠使得38个半胱氨酸残基呈二硫键形式,1摩尔NTB结合于巯基上。在该情况下,最大的单峰(在图24中记为“C”)对应于结合于巯基转铁蛋白分子的1摩尔NTB,标称质量为75311(理论质量为75311Da)。有一个大峰(在图24中记为“D”),其具有预期的由于单个己糖加成导致的162道尔顿的增量。这可能表示有O-连接糖基化。

    谱C显示来自高细胞密度发酵的Strain 1[pDB3779]的巯基转铁蛋白(A215C、S415A、T613A)变体的质谱图,所述变体由第一层析步骤纯化,已经过DTNB处理。当位置215的丙氨酸残基被修饰为半胱氨酸时,预期质量为75327,分子发生折叠使得38个半胱氨酸残基呈二硫键形式,1摩尔NTB结合于巯基上。在该情况下,最大的单峰(在图24中记为“E”)对应于结合于巯基转铁蛋白分子的1摩尔NTB,标称质量为75325(理论质量为75327Da)。有一个大峰(在图24中记为“F”),其具有预期的由于单个己糖加成导致的162道尔顿的增量。这可能表示有O-连接糖基化。

    谱D显示来自高细胞密度发酵的Strain 1[pDB3773]的巯基转铁蛋白(S415C、T613A)变体的质谱图,所述变体由第一层析步骤纯化,已经过DTNB处理。当位置415的丝氨酸残基被修饰为半胱氨酸时,预期质量为75327,分子发生折叠使得38个半胱氨酸残基呈二硫键形式,1摩尔NTB结合于巯基上。在该情况下,最大的单峰(在图24中记为“G”)对应于结合于巯基转铁蛋白分子的1摩尔NTB,标称质量为75324(理论质量为75327Da)。有一个大峰(在图24中记为“H”),其具有预期的由于单个己糖加成导致的162道尔顿的增量。这可能表示有O-连接糖基化。

    谱E显示来自高细胞密度发酵的Strain 1[pDB3758]的巯基转铁蛋白(S415A、N553C、T613A)变体的质谱图,所述变体由第一层析步骤纯化,已经过DTNB处理。当位置553的天冬酰胺残基被修饰为半胱氨酸时,预期质量为75284,分子发生折叠使得38个半胱氨酸残基呈二硫键形式,1摩尔NTB结合于巯基上。在该情况下,最大的单峰(在图24中记为“I”)对应于结合于巯基转铁蛋白分子的1摩尔NTB,标称质量为75281(理论质量为75284Da)。有一个大峰(在图24中记为“J”),其具有预期的由于单个己糖加成导致的162道尔顿的增量。这可能表示有O-连接糖基化。

    谱F显示来自高细胞密度发酵的Strain 1[pDB3778]的巯基转铁蛋白(S32C、S415A、T613A)变体的质谱图,所述变体由第一层析步骤纯化,已经过DTNB处理。巯基转铁蛋白(S32C)的质谱分析仅显示一个主要峰。当位置32的丝氨酸残基被修饰为半胱氨酸时,预期质量为75311,分子发生折叠使得38个半胱氨酸残基呈二硫键形式,1摩尔NTB结合于巯基上。在该情况下,最大的单峰(在图24中记为“K”)对应于结合于巯基转铁蛋白分子的1摩尔NTB,标称质量为75307(理论质量为75311Da)。此结果表明丝氨酸-32的突变阻碍了此位置的O-连接糖基化。

    DTNB处理的巯基转铁蛋白变体的质谱分析确认了每个巯基转铁蛋白突变蛋白具有一个自由巯基,而转铁蛋白(S415A、T613A)标准品不能在相同实验条件下使用DTNB来标记。

    实施例10:辣根过氧化物酶蛋白与巯基转铁蛋白变体的偶联

    通过本领域已知的方法测定本发明的巯基转铁蛋白共价连接生物活性化合物的能力。马来酰亚胺基团主要与巯基(sulfhydryl)在pH 6.5~7.5下反应形成稳定的硫醚键。马来酰亚胺标记试剂可用于使用生物活性分子例如蛋白质、药物和显像剂来标记含有自由巯基的蛋白质分子。在pH7时,马来酰亚胺基对巯基的反应性是对胺基(Pierce)的约1000倍。将采用第一层析步骤进行纯化的纯化重组人转铁蛋白(DeltaferrinTM)和巯基转铁蛋白变体在磷酸缓冲盐溶液(PBS)中稀释至50μg.mL-1,与4倍摩尔过量的马来酰亚胺活化的辣根过氧化物酶(Pierce)在4℃过夜混合。通过非还原4%~12%SDS-PAGE分离蛋白质,用Blue试剂(Pierce)染色(图25)。对于每个未与马来酰亚胺活化的辣根过氧化物酶(Pierce)反应的巯基转铁蛋白变体蛋白质,检测到与重组人转铁蛋白(DeltaferrinTM)(图25的泳道2中标记为A)共迁移的蛋白条带(在图25的泳道4、6、9、11和13中标记为A)。在用马来酰亚胺活化的辣根过氧化物酶(Pierce)处理的样品泳道中检测到与未反应的马来酰亚胺活化的辣根过氧化物酶(Pierce)相对应的条带(在图25的泳道3、5、7、10、12和14中标记为B)。还检测到被认为对应于马来酰亚胺在伯胺基非特异性结合转铁蛋白(S415A,T613A)的浅条带,所述条带在图25的泳道2中标记为C。在用马来酰亚胺活化的辣根过氧化物酶(Pierce)处理的样品泳道中,检测到对应于与辣根过氧化物酶偶联的巯基转铁蛋白变体的更明显条带(在图25的泳道3、5、7、10、12和14中标记为C)。此实施例证明,含有一个或多个未成对半胱氨酸残基的巯基转铁蛋白突变蛋白蛋白质,例如本发明所述引入自由巯基,可共价结合生物活性分子,例如马来酰亚胺活化的蛋白质。

    实施例11:荧光素与巯基转铁蛋白变体的偶联

    通过本领域已知的方法测定巯基转铁蛋白(S28C、S415A、T613A)和巯基转铁蛋白(S415C、T613A)共价结合荧光素-5-马来酰亚胺的能力。马来酰亚胺基团主要与巯基在pH 6.5~7.5下反应形成稳定的硫醚键。在pH7时,马来酰亚胺基团对巯基的反应性是对胺基(Pierce)的约1000倍。

    在与荧光素-5-马来酰亚胺偶联前,对如实施例2所述制备的巯基转铁蛋白变体进行尺寸排阻色谱。在如实施例2所述的巯基转铁蛋白制备物中有可能存在巯基转铁蛋白二聚体。因此,包括尺寸排阻色谱作为精制步骤(polishing step)是有利的,尽管使用本文所述方法可达到高纯度。所述精制步骤除去了低水平或者痕量的这些污染物。

    用Superdex 200制备级介质(GE Healthcare)装填柱子(26×920mm,488mL)。在蛋白质样品上样之前,用0.5M NaOH清洁柱子。通过实施例2中所述方案制备的巯基转铁蛋白(S28C、S415A、T613A)或巯基转铁蛋白(S415C、T613A)上样于柱子上。

    样品上样量是柱体积的2%。流速是3.5mL.分-1。运行缓冲液是Dulbecco磷酸缓冲盐溶液(DPBS,Sigma)或者蛋白质在其中是稳定的任何其它缓冲液,在跨峰每1分钟收集级分(3.5mL级分)。使用GP.HPLC方法测定每个级分的单体含量。GP-HPLC方法由以下组成:运行于25mM磷酸钠中的TosohTSK3000GWxL柱、0.1M硫酸钠、0.05%叠氮化钠(pH 7.0),以1ml.分-1注射25μL。

    将已经通过尺寸排阻层析步骤纯化的巯基转铁蛋白(S28C、S415A、T613A)和巯基转铁蛋白(S415C、T613A)制备物分成两份。一份样品使用荧光素-5-马来酰亚胺与荧光素偶联,另一份样品作为“未偶联”巯基转铁蛋白样品保存。

    通过将约15倍摩尔过量的荧光素-5-马来酰亚胺加入到巯基转铁蛋白(S28C、S415A、T613A),使其在环境温度(21℃~25℃)混合75分钟,来制备荧光素偶联的巯基转铁蛋白(S28C、S415A、T613A)样品。

    通过将约15倍摩尔过量的荧光素-5-马来酰亚胺加入到巯基转铁蛋白(S415C、T613A),使其在环境温度(21℃~25℃)混合110分钟,来制备荧光素偶联的巯基转铁蛋白(S415C、T613A)样品。

    将荧光素偶联的巯基转铁蛋白(S28C、S415A、T613A)和未偶联的巯基转铁蛋白(S28C、S415A、T613A)、荧光素偶联的巯基转铁蛋白(S415C、T613A)以及荧光素偶联的巯基转铁蛋白(S415C、T613A)制备物各分为两份样品。一份样品进行铁加载步骤,而另一份样品进行除去铁的步骤。

    为制备已通过尺寸排阻色谱进一步纯化的无铁重组荧光素偶联的巯基转铁蛋白蛋白质或重组未偶联的巯基转铁蛋白蛋白质,将样品在0.1M柠檬酸钠,0.1M乙酸钠,10mM EDTA(pH 4.5)中环境温度下温育至少180分钟,然后先超滤至水中以除去脱离的铁,然后再超滤至100mM HEPES,10mM碳酸钠缓冲液(pH 8.0)中。

    制备无铁巯基转铁蛋白突变蛋白样品:无铁荧光素偶联的巯基转铁蛋白(S28C、S415A、T613A)、无铁未偶联巯基转铁蛋白(S28C、S415A、T613A)、无铁荧光素偶联的巯基转铁蛋白(S415C、T613A)、和无铁未偶联的巯基转铁蛋白(S415C、T613A)。在实施例13、14和16中将进一步分析这些样品。

    用实施例3中所述的铁加载(全铁化(holoisation))程序来制备已通过尺寸排阻色谱进一步纯化的载铁的重组荧光素偶联的巯基转铁蛋白蛋白质、或重组未偶联的巯基转铁蛋白蛋白质。将碳酸氢钠加入到纯化的荧光素巯基转铁蛋白样品以得到20mM的终浓度。计算达到目标2mol Fe3+.mol-1转铁蛋白的铁的量(10mg.mL-1(16.5%~18.5%Fe)柠檬酸铁铵的形式),添加到重组转铁蛋白/20mM碳酸氢钠制备物,使其在环境温度(21℃~25℃)混合至少60分钟,然后超滤至145mM NaCl中。

    由此制备4种载铁巯基转铁蛋白突变蛋白样品:载铁的荧光素偶联的巯基转铁蛋白(S28C、S415A、T613A)、载铁的未偶联的巯基转铁蛋白(S28C、S415A、T613A)、载铁的荧光素偶联的巯基转铁蛋白(S415C、T613A)、和载铁的未偶联的巯基转铁蛋白(S415C、T613A)。在实施例13、14和15中将进一步分析这些样品。

    实施例12:荧光素偶联的巯基转铁蛋白变体的质谱测定

    通过ESITOF质谱测定法分析荧光素偶联的重组巯基转铁蛋白(S28C、S415A、T613A)和荧光素偶联的重组巯基转铁蛋白(S415C、T613A),并与重组巯基转铁蛋白(S28C、S415A、T613A)和重组巯基转铁蛋白(S415C、T613A)比较。分析载铁的(全)巯基转铁蛋白和无铁(脱铁)巯基转铁蛋白(S28C、S415A、T613A)两者以及巯基转铁蛋白(S415C、T613A)制备物。无铁巯基转铁蛋白样品(数据未显示)给出与所示载铁(全)样品相当的结果。

    制备实施例12中所制备的荧光素偶联的和未偶联的巯基转铁蛋白(S28C、S415A、T613A)以及巯基转铁蛋白(S415C、T613A)样品,以用于使用实施例9中所述方案进行质谱测定。

    图26显示未偶联的巯基转铁蛋白(S28C、S415A、T613A)变体和荧光素偶联的巯基转铁蛋白(S28C、S415A、T613A)变体的质谱。谱A显示巯基转铁蛋白(S28C、S415A、T613A)的质谱。巯基转铁蛋白(S28C、S415A、T613A)质谱分析显示两个峰。当位置28的丝氨酸残基被修饰为半胱氨酸时,预期质量为75114,分子发生折叠使得38个半胱氨酸残基呈二硫键形式,有一个自由巯基。在该情况下,最大的单峰(在图26中记为“A”)对应于标称质量为75111(理论质量为75114Da)的未修饰分子。有一个大峰(在图26中记为“B”),其具有预期的由于单个己糖加成导致的162道尔顿的增量。这可能表示有O-连接糖基化。谱B显示荧光素偶联的巯基转铁蛋白(S28C、S415A、T613A)的质谱。荧光素偶联的巯基转铁蛋白(S28C、S415A、T613A)的质谱分析显示两个峰。当位置28的丝氨酸残基被修饰为半胱氨酸时,预期质量为75541,分子发生折叠使得38个半胱氨酸残基呈二硫键形成,有偶联于自由巯基上的荧光素分子。在该情况下,最大的单峰(在图26中记为“A”)对应于标称质量为75555(理论质量为75541Da)的荧光素偶联的分子。有一个大峰(在图26中记为“B”),其具有预期的由于单个己糖加成导致的162道尔顿的增量。这可能表示有O-连接糖基化。

    图27显示未偶联的巯基转铁蛋白(S28C、S415A、T613A)变体和荧光素偶联的巯基转铁蛋白(S28C、S415A、T613A)变体的质谱。谱A显示巯基转铁蛋白(S415C、T613A)变体的质谱。当位置415的丝氨酸残基被修饰为半胱氨酸时,预期质量为75130,分子发生折叠使得38个半胱氨酸残基呈二硫键形式,有偶联于自由巯基上的荧光素分子。在该情况下,最大的单峰(在图27中记为“A”)对应于标称质量为75126(理论质量为75130Da)的未修饰分子。有一个大峰(在图27中记为“B”),其具有预期的由于单个己糖加成导致的162道尔顿的增量。这可能表示有O-连接糖基化。谱B显示荧光素偶联的巯基转铁蛋白(S415C、T613A)变体的质谱。当位置415的丝氨酸残基被修饰为半胱氨酸时,预期质量为75557,分子发生折叠使得38个半胱氨酸残基呈二硫键形式,有一个自由巯基。在该情况下,最大的单峰(在图27中记为“A”)对应于标称质量为75574(理论质量为75557Da)的荧光素偶联的分子。有一个大峰(在图27中记为“B”),其具有预期的由于单个己糖加成导致的162道尔顿的增量。这可能表示有O-连接糖基化。

    实施例13:用ELLMAN(5’5’-二硫代-双(2-硝基苯甲酸)(DTNB)试剂处理的荧光素偶联的巯基转铁蛋白变体的质谱

    为了确认荧光素-5-马来酰亚胺试剂与巯基转铁蛋白(S28C、S415A、T613A)变体和巯基转铁蛋白(S415C、T613A)变体上的自由巯基反应产生荧光素偶联的巯基转铁蛋白变体,使用实施例10中所述自由巯基测定来测定荧光素偶联的巯基转铁蛋白样品,并与“未偶联的”巯基转铁蛋白样品的质谱进行比较。

    样品用DTNB处理,并制备成用于实施例10中所述的质谱测定。

    图28显示DTNB处理的未偶联的巯基转铁蛋白(S28C、S415A、T613A)变体和荧光素偶联的巯基转铁蛋白(S28C、S415A、T613A)变体的质谱。

    谱A显示已经过DTNB处理的巯基转铁蛋白(S28C、S415A、T613A)的质谱。巯基转铁蛋白(S28C、S415A、T613A)的质谱分析显示两个峰。当位置28的丝氨酸残基被修饰为半胱氨酸时,预期质量为75311,分子发生折叠使得38个半胱氨酸残基呈二硫键形式,1摩尔NTB结合于巯基上。在该情况下,最大的单峰(在图28中记为“A”)对应于标称质量为75307(理论质量为75311Da)的未修饰分子。有一个大峰(在图28中记为“B”),其具有预期的由于单个己糖加成导致的162道尔顿的增量。这可能表示有O-连接糖基化。

    谱B显示已经过DTNB处理的荧光素偶联的巯基转铁蛋白(S28C、S415A、T613A)的质谱。荧光素偶联的巯基转铁蛋白(S28C、S415A、T613A)的质谱分析显示两个峰。当位置28的丝氨酸残基被修饰为半胱氨酸时,预期质量为75541,分子发生折叠使得38个半胱氨酸残基呈二硫键形式,有偶联于自由巯基上的荧光素分子。在该情况下,最大的单峰(在图28中记为“C”)对应于标称质量为75561(理论质量为75541Da)的荧光素偶联的分子。有一个大峰(在图28中记为“D”),其具有预期的由于单个己糖加成导致的162道尔顿的增量。这可能表示有O-连接糖基化。此图谱等同于在没有DTNB时所见的图谱(图26),表明荧光素通过丝氨酸28的自由巯基偶联,这是因为DTNB的加入没有导致额外的197Da的质量变化。

    图29显示用DTNB处理的未偶联的巯基转铁蛋白(S415C、T613A)变体和荧光素偶联的巯基转铁蛋白(S415C、T613A)变体的质谱。

    谱A显示已经过DTNB处理的巯基转铁蛋白(S415C、T613A)的质谱。巯基转铁蛋白(S415C、T613A)的质谱分析显示两个峰。当位置28的丝氨酸残基被修饰为半胱氨酸时,预期质量为75327,分子发生折叠使得38个半胱氨酸残基呈二硫键形式,1摩尔NTB结合于巯基上。在该情况下,最大的单峰(在图29中记为“A”)对应于标称质量为75328(理论质量为75327Da)的未修饰分子。有一个大峰(在图29中记为“B”),其具有预期的由于单个己糖加成导致的162道尔顿的增量。这可能表示有O-连接糖基化。

    谱B显示已经过DTNB处理的荧光素偶联的巯基转铁蛋白(S415C、T613A)的质谱。荧光素偶联的巯基转铁蛋白(S415C、T613A)的质谱分析显示两个峰。当位置415的丝氨酸残基被修饰为半胱氨酸时,预期质量为75557,分子发生折叠使得38个半胱氨酸残基呈二硫键形式,有偶联自由巯基上的荧光素分子。在该情况下,最大的单峰(在图29中记为“C”)对应于标称质量为75573(理论质量为75557Da)的荧光素偶联的分子。有一个大峰(在图29中记为“D”),其具有预期的由于单个己糖加成导致的162道尔顿的增量。这可能表示有O-连接糖基化。此图谱等同于在没有DTNB时所见的图谱(图27),表明荧光素通过丝氨酸415的自由巯基偶联,这是因为DTNB的加入没有导致额外的197Da的质量变化。

    DTNB处理的巯基转铁蛋白(S28C、S415A、T613A)和巯基转铁蛋白(S415C、T613A)的质谱分析确认了巯基转铁蛋白(S28C、S415A、T613A)和巯基转铁蛋白(S415C、T613A)具有一个自由巯基,而荧光素偶联的巯基转铁蛋白(S28C、S415A、T613A)和荧光素偶联的巯基转铁蛋白(S415C、T613A)不能在相同实验条件下使用DTNB进行标记,证明荧光素-5-马来酰亚胺通过巯基转铁蛋白(S28C、S415A、T613A)和巯基转铁蛋白(S415C、T613A)的自由巯基来标记巯基转铁蛋白(S28C、S415A、T613A)和巯基转铁蛋白(S415C、T613A)。

    实施例14:转铁蛋白受体结合(由SPR测量)

    通过表面等离子体共振(SPR)使用与实施例8中所述相同的方案比较如实施例12所述表达、纯化和定量的巯基转铁蛋白突变蛋白和荧光素偶联的巯基转铁蛋白突变蛋白的转铁蛋白受体结合能力。

    已与荧光素偶联的巯基转铁蛋白(S28C、S415A、T613A)样品能够结合转铁蛋白受体(由SPR测量)。实施例8中由SPR分析对转铁蛋白受体结合的测量显示:所选残基例如丝氨酸28被修饰成半胱氨酸残基不改变转铁蛋白的总体结构,也不阻止转铁蛋白与其受体的结合。

    类似地,通过SPR分析,荧光素偶联的巯基转铁蛋白(S415C、T613A)样品能够以等同于未偶联样品的方式结合转铁蛋白受体。实施例8中SPR分析对转铁蛋白受体结合的测量显示:所选残基例如丝氨酸415被修饰成半胱氨酸残基不改变转铁蛋白的总体结构,也不阻碍转铁蛋白与其受体的结合。

    本实施例证明了当生物活性分子通过半胱氨酸残基的硫原子偶联巯基转铁蛋白突变蛋白时,巯基转铁蛋白突变蛋白保留了其结合转铁蛋白受体的能力。

    实施例15:转铁蛋白受体结合

    可通过测量红白血病K562细胞中的55Fe摄取竞争来测定转铁蛋白受体结合。将巯基转铁蛋白(S28C、S415A、T613A)、荧光素偶联的巯基转铁蛋白(S28C、S415A、T613A)、巯基转铁蛋白(S415C、T613A)、荧光素偶联的巯基转铁蛋白(S415C、T613A)的转铁蛋白受体结合,与转铁蛋白(S415A、T613A)和人血浆来源的脱铁-转铁蛋白的转铁蛋白受体结合进行比较。

    如实施例11所述,以等摩尔浓度(约5mg/mL)制备巯基转铁蛋白(S28C、S415A、T613A)、荧光素偶联的巯基转铁蛋白(S28C、S415A、T613A)、巯基转铁蛋白(S415C、T613A)、荧光素偶联的巯基转铁蛋白(S415C、T613A)的无铁样品,并通过实施例3中所述的方案测定它们将55Fe输送至红白血病K562细胞的能力。

    当巯基转铁蛋白具有不带半胱氨酸插入的相应多肽的至少5%的受体结合能力,则认为它能结合转铁蛋白受体。为了测定转铁蛋白介导的铁摄取,必须选择需要铁的细胞模型。因为所有增殖细胞都需要铁作为必需的生长因子,所以任何快速生长的培养细胞系都可以使用。此类型测定的经典模型是人红白血病K562细胞系,其源自慢性髓细胞白血病急变期的患者。使用此细胞系进行实验对阐明受体介导的胞吞作用机制来说是必需的(Klausner等,1983).[Klausner,R.D.,Van Renswoude,J.,Ashwell,G.,Kempf,C.,Schechter,A.N.,Dean,A.& Bridges,K.R.(1983)Receptor-mediated endocytosis oftransferrin in K562 cells.J Biol Chem 258,4715~4724]。

    通过下述步骤可容易地测定借助受体介导的胞吞作用的铁摄取:用放射性铁(55Fe)标记转铁蛋白,在合适的细胞与不同浓度的标记转铁蛋白一起温育合适的时间段后测定细胞放射性。假若胞吞-释放系统正常工作,则铁摄取随时间线性进行,其可简单地从计数数据中看出。

    通过加入大大过量的未标记二铁转铁蛋白可测定摄取过程的非特异性组分。可通过非特异性摄取解释在这些条件下测得的残余放射性,并从总数中扣去。非特异性结合、和所得的来自重组转铁蛋白或巯基转铁蛋白的铁摄取不能明显高于来自天然转铁蛋白的铁摄取,否则,它们可以以非受控的方式向细胞输送铁,而导致可能的细胞损伤。

    因为受体数目是摄取过程的限制因素,所测得的亲和性和最大能力将代表转铁蛋白受体的结合亲和性和最大结合位点数目。

    如下所述进行来自标记的二铁转铁蛋白的铁摄取。在标准条件(碳酸氢盐缓冲的,5% CO2,抗生素,10%胎牛血清)下培养于RPMI细胞培养基中的K562红白血病细胞,用含HEPES缓冲液和1mg/ml牛血清白蛋白的无血清培养基洗涤,并以此培养基中1千万细胞/ml的浓度使用。

    将用55Fe标记的浓度递增的血浆转铁蛋白或相应的重组转铁蛋白样品(12.5nM、25nM、100nM、200nM、300nM、500nM、600nM、800nM、1200nM、1600nM、2000nM)与100μl培养基混合。通过加入50μl细胞悬液开始反应。

    在百倍过量的未标记二铁转铁蛋白存在能导致非特异性结合的情况下,进行第二系列的平行相同实验。

    在37℃下25分钟后,通过浸入冰浴中停止反应,将三份的30μl细胞悬液等分试样转移到新管,冷冻离心所述细胞,在加入二乙基邻苯二甲酸酯/二丁基邻苯二甲酸酯的油层之后再次离心。除去上清液,将细胞沉淀转移进计数器管,用0.5M KOH+1%Triton X-100裂解。过夜裂解后,用1M HCl中和裂解液,与Readysolv闪烁混合物(Readysolv scintillation cocktail)混合,在Packard液体闪烁计数器(Packard Liquid Scintillation Counter)中计数。

    使用氨三乙酸铁作为铁源,据标准程序用铁加载转铁蛋白(Bates和Schlabach,1973).[Bates,G.W.和M.R.Schlabach(1973).″The reaction offerric salts with transferrin.″J Biol Chem 248(9):3228~32]。

    结果以fmol 55Fe/百万细胞表示。所有数据是三次实验的平均值±S.E.M.。结果在表4中提供。由这些结果可以看出:所有转铁蛋白样品都能够通过受体介导的胞吞作用(特异性铁摄取)将铁输送到K562细胞,其水平大于转铁蛋白(S415A、T613A)对照水平的5%。Kd值表明转铁蛋白(S415A、T613A)至少和血浆来源转铁蛋白对照一样与受体结合,而巯基转铁蛋白(S28C、S415A、T613A)和巯基转铁蛋白(S415C、T613A)似乎具有略低的受体结合(即较高的Kd值)。令人惊奇的是,在本实验中,荧光素与巯基转铁蛋白变体的偶联没有导致与转铁蛋白受体的结合的降低。

    

    【序列表】

     

    <110>诺维信生物制药丹麦公司(Novozymes Biopharma DK A/S)

     

    <120>转铁蛋白变体和偶联物

     

    <130>11195.204-WO

     

    <160>15

     

    <170>PatentIn version 3.5

     

    <210>1

    <211>679

    <212>PRT

    <213>人(Homo Sapiens)

     

    <400>1

     

    Val Pro Asp Lys Thr Val Arg Trp Cys Ala Val Ser Glu His Glu Ala

    1               5                   10                  15

    Thr Lys Cys Gln Ser Phe Arg Asp His Met Lys Ser Val Ile Pro Ser

                20                  25                  30

    Asp Gly Pro Ser Val Ala Cys Val Lys Lys Ala Ser Tyr Leu Asp Cys

            35                  40                  45

    Ile Arg Ala Ile Ala Ala Asn Glu Ala Asp Ala Val Thr Leu Asp Ala

        50                  55                  60

    Gly Leu Val Tyr Asp Ala Tyr Leu Ala Pro Asn Asn Leu Lys Pro Val

    65                  70                  75                  80

    Val Ala Glu Phe Tyr Gly Ser Lys Glu Asp Pro Gln Thr Phe Tyr Tyr

                    85                  90                  95

    Ala Val Ala Val Val Lys Lys Asp Ser Gly Phe Gln Met Asn Gln Leu

                100                 105                 110

    Arg Gly Lys Lys Ser Cys His Thr Gly Leu Gly Arg Ser Ala Gly Trp

            115                 120                 125

    Asn Ile Pro Ile Gly Leu Leu Tyr Cys Asp Leu Pro Glu Pro Arg Lys

        130                 135                 140

    Pro Leu Glu Lys Ala Val Ala Asn Phe Phe Ser Gly Ser Cys Ala Pro

    145                 150                 155                 160

    Cys Ala Asp Gly Thr Asp Phe Pro Gln Leu Cys Gln Leu Cys Pro Gly

                    165                 170                 175

    Cys Gly Cys Ser Thr Leu Asn Gln Tyr Phe Gly Tyr Ser Gly Ala Phe

                180                 185                 190

    Lys Cys Leu Lys Asp Gly Ala Gly Asp Val Ala Phe Val Lys His Ser

            195                 200                 205

    Thr Ile Phe Glu Asn Leu Ala Asn Lys Ala Asp Arg Asp Gln Tyr Glu

        210                 215                 220

    Leu Leu Cys Leu Asp Asn Thr Arg Lys Pro Val Asp Glu Tyr Lys Asp

    225                 230                 235                 240

    Cys His Leu Ala Gln Val Pro Ser His Thr Val Val Ala Arg Ser Met

                    245                 250                 255

    Gly Gly Lys Glu Asp Leu Ile Trp Glu Leu Leu Asn Gln Ala Gln Glu

                260                 265                 270

    His Phe Gly Lys Asp Lys Ser Lys Glu Phe Gln Leu Phe Ser Ser Pro

            275                 280                 285

    His Gly Lys Asp Leu Leu Phe Lys Asp Ser Ala His Gly Phe Leu Lys

        290                 295                 300

    Val Pro Pro Arg Met Asp Ala Lys Met Tyr Leu Gly Tyr Glu Tyr Val

    305                 310                 315                 320

    Thr Ala Ile Arg Asn Leu Arg Glu Gly Thr Cys Pro Glu Ala Pro Thr

                    325                 330                 335

    Asp Glu Cys Lys Pro Val Lys Trp Cys Ala Leu Ser His His Glu Arg

                340                 345                 350

    Leu Lys Cys Asp Glu Trp Ser Val Asn Ser Val Gly Lys Ile Glu Cys

            355                 360                 365

    Val Ser Ala Glu Thr Thr Glu Asp Cys Ile Ala Lys Ile Met Asn Gly

        370                 375                 380

    Glu Ala Asp Ala Met Ser Leu Asp Gly Gly Phe Val Tyr Ile Ala Gly

    385                 390                 395                 400

    Lys Cys Gly Leu Val Pro Val Leu Ala Glu Asn Tyr Asn Lys Ser Asp

                    405                 410                 415

    Asn Cys Glu Asp Thr Pro Glu Ala Gly Tyr Phe Ala Val Ala Val Val

                420                 425                 430

    Lys Lys Ser Ala Ser Asp Leu Thr Trp Asp Asn Leu Lys Gly Lys Lys

            435                 440                 445

    Ser Cys His Thr Ala Val Gly Arg Thr Ala Gly Trp Asn Ile Pro Met

        450                 455                 460

    Gly Leu Leu Tyr Asn Lys Ile Asn His Cys Arg Phe Asp Glu Phe Phe

    465                 470                 475                 480

    Ser Glu Gly Cys Ala Pro Gly Ser Lys Lys Asp Ser Ser Leu Cys Lys

                    485                 490                 495

    Leu Cys Met Gly Ser Gly Leu Asn Leu Cys Glu Pro Asn Asn Lys Glu

                500                 505                 510

    Gly Tyr Tyr Gly Tyr Thr Gly Ala Phe Arg Cys Leu Val Glu Lys Gly

            515                 520                 525

    Asp Val Ala Phe Val Lys His Gln Thr Val Pro Gln Asn Thr Gly Gly

        530                 535                 540

    Lys Asn Pro Asp Pro Trp Ala Lys Asn Leu Asn Glu Lys Asp Tyr Glu

    545                 550                 555                 560

    Leu Leu Cys Leu Asp Gly Thr Arg Lys Pro Val Glu Glu Tyr Ala Asn

                    565                 570                 575

    Cys His Leu Ala Arg Ala Pro Asn His Ala Val Val Thr Arg Lys Asp

                580                 585                 590

    Lys Glu Ala Cys Val His Lys Ile Leu Arg Gln Gln Gln His Leu Phe

            595                 600                 605

    Gly Ser Asn Val Thr Asp Cys Ser Gly Asn Phe Cys Leu Phe Arg Ser

        610                 615                 620

    Glu Thr Lys Asp Leu Leu Phe Arg Asp Asp Thr Val Cys Leu Ala Lys

    625                 630                 635                 640

    Leu His Asp Arg Asn Thr Tyr Glu Lys Tyr Leu Gly Glu Glu Tyr Val

                    645                 650                 655

    Lys Ala Val Gly Asn Leu Arg Lys Cys Ser Thr Ser Ser Leu Leu Glu

                660                 665                 670

    Ala Cys Thr Phe Arg Arg Pro

            675

     

    <210>2

    <211>2359

    <212>DNA

    <213>人工的

     

    <220>

    <223>合成的

     

    <220>

    <221>CDS

    <222>(67)..(2160)

     

    <220>

    <221>sig_peptide

    <222>(67)..(123)

     

    <220>

    <221>mat_peptide

    <222>(124)..(2160)

     

    <400>2

    cttaagagtc caattagctt catcgccaat aaaaaaacaa gcttaaccta attctaacaa    60

    gcaaag atg ttg ttg caa gct ttt ttg ttt ttg ttg gct ggt ttt gct      108

           Met Leu Leu Gln Ala Phe Leu Phe Leu Leu Ala Gly Phe Ala

                           -15                 -10

    gct aaa att tct gct gtt cca gat aaa aca gtt aga tgg tgt gct gtt     156

    Ala Lys Ile Ser Ala Val Pro Asp Lys Thr Val Arg Trp Cys Ala Val

    -5              -1  1               5                   10

    tct gaa cat gaa gct act aaa tgt caa tct ttt aga gat cat atg aaa     204

    Ser Glu His Glu Ala Thr Lys Cys Gln Ser Phe Arg Asp His Met Lys

                15                  20                  25

    tct gtt att cca tct gat ggt cca tct gtt gct tgt gtt aaa aaa gct     252

    Ser Val Ile Pro Ser Asp Gly Pro Ser Val Ala Cys Val Lys Lys Ala

            30                  35                  40

    tct tat ttg gat tgt att aga gct att gct gct aat gaa gct gat gct     300

    Ser Tyr Leu Asp Cys Ile Arg Ala Ile Ala Ala Asn Glu Ala Asp Ala

        45                  50                  55

    gtt act ttg gat gct ggt tta gtt tat gat gct tat ttg gct cca aac     348

    Val Thr Leu Asp Ala Gly Leu Val Tyr Asp Ala Tyr Leu Ala Pro Asn

    60                  65                  70                  75

    aat ttg aaa cca gtt gtt gct gaa ttt tat ggt tct aag gaa gat cca     396

    Asn Leu Lys Pro Val Val Ala Glu Phe Tyr Gly Ser Lys Glu Asp Pro

                    80                  85                  90

    caa act ttt tat tat gct gta gcc gtt gta aaa aag gat tca ggt ttt     444

    Gln Thr Phe Tyr Tyr Ala Val Ala Val Val Lys Lys Asp Ser Gly Phe

                95                  100                 105

    caa atg aat caa ttg aga ggt aaa aaa tct tgt cat act ggt tta ggt     492

    Gln Met Asn Gln Leu Arg Gly Lys Lys Ser Cys His Thr Gly Leu Gly

            110                 115                 120

    aga tct gct gga tgg aat att cca att ggt ttg ttg tat tgt gat ttg     540

    Arg Ser Ala Gly Trp Asn Ile Pro Ile Gly Leu Leu Tyr Cys Asp Leu

        125                 130                 135

    cca gaa cca aga aaa cca ttg gaa aaa gct gtt gct aat ttt ttt tct     588

    Pro Glu Pro Arg Lys Pro Leu Glu Lys Ala Val Ala Asn Phe Phe Ser

    140                 145                 150                 155

    ggt tct tgt gct cca tgt gct gat ggt aca gat ttt cca caa ttg tgt     636

    Gly Ser Cys Ala Pro Cys Ala Asp Gly Thr Asp Phe Pro Gln Leu Cys

                    160                 165                 170

    caa tta tgt cca ggt tgt ggt tgt tct act ttg aat caa tat ttt ggt    684

    Gln Leu Cys Pro Gly Cys Gly Cys Ser Thr Leu Asn Gln Tyr Phe Gly

                175                 180                 185

    tat tct ggt gct ttt aaa tgt ttg aaa gat ggt gct ggt gat gtt gct    732

    Tyr Ser Gly Ala Phe Lys Cys Leu Lys Asp Gly Ala Gly Asp Val Ala

            190                 195                 200

    ttt gtt aaa cat tct act att ttt gaa aat ttg gca aac aaa gct gat    780

    Phe Val Lys His Ser Thr Ile Phe Glu Asn Leu Ala Asn Lys Ala Asp

        205                 210                 215

    aga gat caa tat gaa ttg ttg tgt ttg gat aat act aga aaa cca gtt    828

    Arg Asp Gln Tyr Glu Leu Leu Cys Leu Asp Asn Thr Arg Lys Pro Val

    220                 225                 230                 235

    gat gaa tat aaa gat tgt cat ttg gct caa gtt cca tct cat act gtt    876

    Asp Glu Tyr Lys Asp Cys His Leu Ala Gln Val Pro Ser His Thr Val

                    240                 245                 250

    gtt gct aga tct atg ggt ggt aaa gaa gat ttg att tgg gaa ttg ttg    924

    Val Ala Arg Ser Met Gly Gly Lys Glu Asp Leu Ile Trp Glu Leu Leu

                255                 260                 265

    aat caa gct caa gaa cat ttt ggt aaa gat aaa tct aaa gaa ttt caa    972

    Asn Gln Ala Gln Glu His Phe Gly Lys Asp Lys Ser Lys Glu Phe Gln

            270                 275                 280

    ttg ttt tct tct cca cat ggt aaa gat ttg ttg ttt aaa gat tct gct   1020

    Leu Phe Ser Ser Pro His Gly Lys Asp Leu Leu Phe Lys Asp Ser Ala

        285                 290                 295

    cat ggt ttt ttg aaa gtt cca cca aga atg gat gct aaa atg tat ttg   1068

    His Gly Phe Leu Lys Val Pro Pro Arg Met Asp Ala Lys Met Tyr Leu

    300                 305                 310                 315

    ggt tat gaa tac gtt act gct att aga aat ttg aga gaa ggt act tgt   1116

    Gly Tyr Glu Tyr Val Thr Ala Ile Arg Asn Leu Arg Glu Gly Thr Cys

                    320                 325                 330

    cca gaa gct cca act gat gaa tgt aaa cca gtt aaa tgg tgt gct ttg   1164

    Pro Glu Ala Pro Thr Asp Glu Cys Lys Pro Val Lys Trp Cys Ala Leu

                335                 340                 345

    tct cat cat gaa aga tta aaa tgt gat gaa tgg tct gtt aat tct gtt   1212

    Ser His His Glu Arg Leu Lys Cys Asp Glu Trp Ser Val Asn Ser Val

            350                 355                 360

    ggt aaa att gaa tgt gtt tct gct gaa act aca gaa gat tgt att gct   1260

    Gly Lys Ile Glu Cys Val Ser Ala Glu Thr Thr Glu Asp Cys Ile Ala

        365                 370                 375

    aaa att atg aat ggt gaa gct gat gct atg tct tta gat ggt ggt ttt   1308

    Lys Ile Met Asn Gly Glu Ala Asp Ala Met Ser Leu Asp Gly Gly Phe

    380                 385                 390                 395

    gta tat att gct ggt aaa tgt ggt tta gtt cca gtt ttg gct gaa aat   1356

    Val Tyr Ile Ala Gly Lys Cys Gly Leu Val Pro Val Leu Ala Glu Asn

                    400                 405                 410

    tat aac aaa gct gat aat tgt gaa gat act cca gaa gct ggt tat ttt   1404

    Tyr Asn Lys Ala Asp Asn Cys Glu Asp Thr Pro Glu Ala Gly Tyr Phe

                415                 420                 425

    gct gtt gct gtt gtt aaa aaa tct gct tct gat ttg act tgg gat aat   1452

    Ala Val Ala Val Val Lys Lys Ser Ala Ser Asp Leu Thr Trp Asp Asn

            430                 435                 440

    cta aaa gga aaa aag agt tgc cat aca gct gtt gga aga aca gcc gga   1500

    Leu Lys Gly Lys Lys Ser Cys His Thr Ala Val Gly Arg Thr Ala Gly

        445                 450                 455

    tgg aac att cca atg gga ttg cta tac aac aaa att aat cat tgt aga    1548

    Trp Asn Ile Pro Met Gly Leu Leu Tyr Asn Lys Ile Asn His Cys Arg

    460                 465                 470                 475

    ttt gat gaa ttt ttt tct gaa ggt tgt gct cca ggt tct aaa aaa gat    1596

    Phe Asp Glu Phe Phe Ser Glu Gly Cys Ala Pro Gly Ser Lys Lys Asp

                    480                 485                 490

    tct tct ttg tgt aaa ttg tgt atg ggt tct gga ttg aat ttg tgt gaa    1644

    Ser Ser Leu Cys Lys Leu Cys Met Gly Ser Gly Leu Asn Leu Cys Glu

                495                 500                 505

    cca aac aac aag gaa ggt tat tat ggt tat act ggt gct ttt aga tgt    1692

    Pro Asn Asn Lys Glu Gly Tyr Tyr Gly Tyr Thr Gly Ala Phe Arg Cys

            510                 515                 520

    tta gtt gaa aaa ggt gat gtt gct ttt gtt aaa cat caa aca gtt cca    1740

    Leu Val Glu Lys Gly Asp Val Ala Phe Val Lys His Gln Thr Val Pro

        525                 530                 535

    caa aat act ggt ggt aaa aat cca gat cca tgg gct aaa aat ttg aat    1788

    Gln Asn Thr Gly Gly Lys Asn Pro Asp Pro Trp Ala Lys Asn Leu Asn

    540                 545                 550                 555

    gaa aaa gat tac gaa tta cta tgt tta gat ggt aca aga aag cca gtt    1836

    Glu Lys Asp Tyr Glu Leu Leu Cys Leu Asp Gly Thr Arg Lys Pro Val

                    560                 565                 570

    gag gaa tac gct aat tgt cat tta gct aga gca cca aat cat gct gtt    1884

    Glu Glu Tyr Ala Asn Cys His Leu Ala Arg Ala Pro Asn His Ala Val

                575                 580                 585

    gtt act aga aaa gat aaa gaa gct tgt gtt cat aaa att ttg aga caa    1932

    Val Thr Arg Lys Asp Lys Glu Ala Cys Val His Lys Ile Leu Arg Gln

            590                 595                 600

    caa caa cat ttg ttt ggt tct aat gtt gct gat tgt tct ggt aat ttt    1980

    Gln Gln His Leu Phe Gly Ser Asn Val Ala Asp Cys Ser Gly Asn Phe

        605                 610                 615

    tgt ttg ttt aga tct gaa act aaa gat tta ttg ttt aga gat gat act    2028

    Cys Leu Phe Arg Ser Glu Thr Lys Asp Leu Leu Phe Arg Asp Asp Thr

    620                 625                 630                 635

    gtt tgt ttg gct aaa ttg cat gat aga aat act tat gaa aaa tat ttg    2076

    Val Cys Leu Ala Lys Leu His Asp Arg Asn Thr Tyr Glu Lys Tyr Leu

                    640                 645                 650

    ggt gaa gaa tac gtt aaa gct gtt ggt aat ttg aga aaa tgt tct act    2124

    Gly Glu Glu Tyr Val Lys Ala Val Gly Asn Leu Arg Lys Cys Ser Thr

                655                 660                 665

    tct tct ttg ttg gaa gct tgt act ttt aga agg cca taataagctt         2170

    Ser Ser Leu Leu Glu Ala Cys Thr Phe Arg Arg Pro

            670                 675

    aattcttatg atttatgatt tttattatta aataagttat aaaaaaaata agtgtataca  2230

    aattttaaag tgactcttag gttttaaaac gaaaattctt attcttgagt aactctttcc  2290

    tgtaggtcag gttgctttct caggtatagc atgaggtcgc tcttattgac cacacctcta  2350

    ccggcatgc                                                          2359

     

    <210>3

    <211>698

    <212>PRT

    <213>人工的

     

    <220>

    <223>合成的构建体

    <400>3

     

    Met Leu Leu Gln Ala Phe Leu Phe Leu Leu Ala Gly Phe Ala Ala Lys

                    -15                 -10                 -5

    Ile Ser Ala Val Pro Asp Lys Thr Val Arg Trp Cys Ala Val Ser Glu

            -1  1                   5                   10

    His Glu Ala Thr Lys Cys Gln Ser Phe Arg Asp His Met Lys Ser Val

        15                  20                  25

    Ile Pro Ser Asp Gly Pro Ser Val Ala Cys Val Lys Lys Ala Ser Tyr

    30                  35                  40                  45

    Leu Asp Cys Ile Arg Ala Ile Ala Ala Asn Glu Ala Asp Ala Val Thr

                    50                  55                  60

    Leu Asp Ala Gly Leu Val Tyr Asp Ala Tyr Leu Ala Pro Asn Asn Leu

                65                  70                  75

    Lys Pro Val Val Ala Glu Phe Tyr Gly Ser Lys Glu Asp Pro Gln Thr

            80                  85                  90

    Phe Tyr Tyr Ala Val Ala Val Val Lys Lys Asp Ser Gly Phe Gln Met

        95                  100                 105

    Asn Gln Leu Arg Gly Lys Lys Ser Cys His Thr Gly Leu Gly Arg Ser

    110                 115                 120                 125

    Ala Gly Trp Asn Ile Pro Ile Gly Leu Leu Tyr Cys Asp Leu Pro Glu

                    130                 135                 140

    Pro Arg Lys Pro Leu Glu Lys Ala Val Ala Asn Phe Phe Ser Gly Ser

                145                 150                 155

    Cys Ala Pro Cys Ala Asp Gly Thr Asp Phe Pro Gln Leu Cys Gln Leu

            160                 165                 170

    Cys Pro Gly Cys Gly Cys Ser Thr Leu Asn Gln Tyr Phe Gly Tyr Ser

        175                 180                 185

    Gly Ala Phe Lys Cys Leu Lys Asp Gly Ala Gly Asp Val Ala Phe Val

    190                 195                 200                 205

    Lys His Ser Thr Ile Phe Glu Asn Leu Ala Asn Lys Ala Asp Arg Asp

                    210                 215                 220

    Gln Tyr Glu Leu Leu Cys Leu Asp Asn Thr Arg Lys Pro Val Asp Glu

                225                 230                 235

    Tyr Lys Asp Cys His Leu Ala Gln Val Pro Ser His Thr Val Val Ala

            240                 245                 250

    Arg Ser Met Gly Gly Lys Glu Asp Leu Ile Trp Glu Leu Leu Asn Gln

        255                 260                 265

    Ala Gln Glu His Phe Gly Lys Asp Lys Ser Lys Glu Phe Gln Leu Phe

    270                 275                 280                 285

    Ser Ser Pro His Gly Lys Asp Leu Leu Phe Lys Asp Ser Ala His Gly

                    290                 295                 300

    Phe Leu Lys Val Pro Pro Arg Met Asp Ala Lys Met Tyr Leu Gly Tyr

                305                 310                 315

    Glu Tyr Val Thr Ala Ile Arg Asn Leu Arg Glu Gly Thr Cys Pro Glu

            320                 325                 330

    Ala Pro Thr Asp Glu Cys Lys Pro Val Lys Trp Cys Ala Leu Ser His

        335                 340                 345

    His Glu Arg Leu Lys Cys Asp Glu Trp Ser Val Asn Ser Val Gly Lys

    350                 355                 360                 365

    Ile Glu Cys Val Ser Ala Glu Thr Thr Glu Asp Cys Ile Ala Lys Ile

                    370                 375                 380

    Met Asn Gly Glu Ala Asp Ala Met Ser Leu Asp Gly Gly Phe Val Tyr

                385                 390                 395

    Ile Ala Gly Lys Cys Gly Leu Val Pro Val Leu Ala Glu Asn Tyr Asn

            400                 405                 410

    Lys Ala Asp Asn Cys Glu Asp Thr Pro Glu Ala Gly Tyr Phe Ala Val

        415                 420                 425

    Ala Val Val Lys Lys Ser Ala Ser Asp Leu Thr Trp Asp Asn Leu Lys

    430                 435                 440                 445

    Gly Lys Lys Ser Cys His Thr Ala Val Gly Arg Thr Ala Gly Trp Asn

                    450                 455                 460

    Ile Pro Met Gly Leu Leu Tyr Asn Lys Ile Asn His Cys Arg Phe Asp

                465                 470                 475

    Glu Phe Phe Ser Glu Gly Cys Ala Pro Gly Ser Lys Lys Asp Ser Ser

            480                 485                 490

    Leu Cys Lys Leu Cys Met Gly Ser Gly Leu Asn Leu Cys Glu Pro Asn

        495                 500                 505

    Asn Lys Glu Gly Tyr Tyr Gly Tyr Thr Gly Ala Phe Arg Cys Leu Val

    510                 515                 520                 525

    Glu Lys Gly Asp Val Ala Phe Val Lys His Gln Thr Val Pro Gln Asn

                    530                 535                 540

    Thr Gly Gly Lys Asn Pro Asp Pro Trp Ala Lys Asn Leu Asn Glu Lys

                545                 550                 555

    Asp Tyr Glu Leu Leu Cys Leu Asp Gly Thr Arg Lys Pro Val Glu Glu

            560                 565                 570

    Tyr Ala Asn Cys His Leu Ala Arg Ala Pro Asn His Ala Val Val Thr

        575                 580                 585

    Arg Lys Asp Lys Glu Ala Cys Val His Lys Ile Leu Arg Gln Gln Gln

    590                 595                 600                 605

    His Leu Phe Gly Ser Asn Val Ala Asp Cys Ser Gly Asn Phe Cys Leu

                    610                 615                 620

    Phe Arg Ser Glu Thr Lys Asp Leu Leu Phe Arg Asp Asp Thr Val Cys

                625                 630                 635

    Leu Ala Lys Leu His Asp Arg Asn Thr Tyr Glu Lys Tyr Leu Gly Glu

            640                 645                 650

    Glu Tyr Val Lys Ala Val Gly Asn Leu Arg Lys Cys Ser Thr Ser Ser

        655                 660                 665

    Leu Leu Glu Ala Cys Thr Phe Arg Arg Pro

    670                 675

     

    <210>4

    <211>1487

    <212>DNA

    <213>人工的

     

    <220>

    <223>合成的

     

    <400>4

    cttaagagtc caattagctt catcgccaat aaaaaaacaa gcttaaccta attctaacaa    60

    gcaaagatgt tgttgcaagc ttttttgttt ttgttggctg gttttgctgc taaaatttct    120

    gctgttccag ataaaacagt tagatggtgt gctgtttctg aacatgaagc tactaaatgt    180

    caatctttta gagatcatat gaaatctgtt attccatctg atggtccatc tgttgcttgt    240

    gttaaaaaag cttcttattt ggattgtatt agagctattg ctgctaatga agctgatgct    300

    gttactttgg atgctggttt agtttatgat gcttatttgg ctccaaacaa tttgaaacca    360

    gttgttgctg aattttatgg ttctaaggaa gatccacaaa ctttttatta tgctgtagcc    420

    gttgtaaaaa aggattcagg ttttcaaatg aatcaattga gaggtaaaaa atcttgtcat    480

    actggtttag gtagatctgc tggatggaat attccaattg gtttgttgta ttgtgatttg    540

    ccagaaccaa gaaaaccatt ggaaaaagct gttgctaatt ttttttctgg ttcttgtgct    600

    ccatgtgctg atggtacaga ttttccacaa ttgtgtcaat tatgtccagg ttgtggttgt    660

    tctactttga atcaatattt tggttattct ggtgctttta aatgtttgaa agatggtgct    720

    ggtgatgttg cttttgttaa acattctact atttttgaaa atttggcaaa caaagctgat    780

    agagatcaat atgaattgtt gtgtttggat aatactagaa aaccagttga tgaatataaa    840

    gattgtcatt tggctcaagt tccatctcat actgttgttg ctagatctat gggtggtaaa    900

    gaagatttga tttgggaatt gttgaatcaa gctcaagaac attttggtaa agataaatct    960

    aaagaatttc aattgttttc ttctccacat ggtaaagatt tgttgtttaa agattctgct   1020

    catggttttt tgaaagttcc accaagaatg gatgctaaaa tgtatttggg ttatgaatac   1080

    gttactgcta ttagaaattt gagagaaggt acttgtccag aagctccaac tgatgaatgt   1140

    aaaccagtta aatggtgtgc tttgtctcat catgaaagat taaaatgtga tgaatggtct   1200

    gttaattctg ttggtaaaat tgaatgtgtt tctgctgaaa ctacagaaga ttgtattgct   1260

    aaaattatga atggtgaagc tgatgctatg tctttagatg gtggttttgt atatattgct   1320

    ggtaaatgtg gtttagttcc agttttggct gaaaattata acaaagctga taattgtgaa   1380

    gatactccag aagctggtta ttttgctgtt gctgttgtta aaaaatctgc ttctgatttg   1440

    acttgggata atctaaaagg aaaaaagagt tgccatacag ctgttgg                 1487

     

    <210>5

    <211>1487

    <212>DNA

    <213>人工的

     

    <220>

    <223>合成的

     

    <400>5

    cttaagagtc caattagctt catcgccaat aaaaaaacaa gcttaaccta attctaacaa     60

    gcaaagatgt tgttgcaagc ttttttgttt ttgttggctg gttttgctgc taaaatttct    120

    gctgttccag ataaaacagt tagatggtgt gctgtttctg aacatgaagc tactaaatgt    180

    caatctttta gagatcatat gaaatctgtt attccatctg atggtccatc tgttgcttgt    240

    gttaaaaaag cttcttattt ggattgtatt agagctattg ctgctaatga agctgatgct    300

    gttactttgg atgctggttt agtttatgat gcttatttgg ctccaaacaa tttgaaacca    360

    gttgttgctg aattttatgg ttctaaggaa gatccacaaa ctttttatta tgctgtagcc    420

    gttgtaaaaa aggattcagg ttttcaaatg aatcaattga gaggtaaaaa atcttgtcat     480

    actggtttag gtagatctgc tggatggaat attccaattg gtttgttgta ttgtgatttg     540

    ccagaaccaa gaaaaccatt ggaaaaagct gttgctaatt ttttttctgg ttcttgtgct     600

    ccatgtgctg atggtacaga ttttccacaa ttggctcaat tatgtccagg ttgtggttgt     660

    tctactttga atcaatattt tggttattct ggtgctttta aatgtttgaa agatggtgct     720

    ggtgatgttg cttttgttaa acattctact atttttgaaa atttggcaaa caaagctgat     780

    agagatcaat atgaattgtt gtgtttggat aatactagaa aaccagttga tgaatataaa     840

    gattgtcatt tggctcaagt tccatctcat actgttgttg ctagatctat gggtggtaaa     900

    gaagatttga tttgggaatt gttgaatcaa gctcaagaac attttggtaa agataaatct     960

    aaagaatttc aattgttttc ttctccacat ggtaaagatt tgttgtttaa agattctgct    1020

    catggttttt tgaaagttcc accaagaatg gatgctaaaa tgtatttggg ttatgaatac    1080

    gttactgcta ttagaaattt gagagaaggt acttgtccag aagctccaac tgatgaatgt    1140

    aaaccagtta aatggtgtgc tttgtctcat catgaaagat taaaatgtga tgaatggtct    1200

    gttaattctg ttggtaaaat tgaatgtgtt tctgctgaaa ctacagaaga ttgtattgct    1260

    aaaattatga atggtgaagc tgatgctatg tctttagatg gtggttttgt atatattgct    1320

    ggtaaatgtg gtttagttcc agttttggct gaaaattata acaaagctga taattgtgaa    1380

    gatactccag aagctggtta ttttgctgtt gctgttgtta aaaaatctgc ttctgatttg    1440

    acttgggata atctaaaagg aaaaaagagt tgccatacag ctgttgg                  1487

     

    <210>6

    <211>1484

    <212>DNA

    <213>人工的

     

    <220>

    <223>合成的

     

    <400>6

    cttaagagtc caattagctt catcgccaat aaaaaaacaa gcttaaccta attctaacaa      60

    gcaaagatgt tgttgcaagc ttttttgttt ttgttggctg gttttgctgc taaaatttct     120

    gctgttccag ataaaacagt tagatggtgt gctgtttctg aacatgaagc tactaaatgt     180

    caatctttta gagatcatat gaaatctgtt attccatctg atggtccatc tgttgcttgt     240

    gttaaaaaag cttcttattt ggattgtatt agagctattg ctgctaatga agctgatgct     300

    gttactttgg atgctggttt agtttatgat gcttatttgg ctccaaacaa tttgaaacca     360

    gttgttgctg aattttatgg ttctaaggaa gatccacaaa ctttttatta tgctgtagcc     420

    gttgtaaaaa aggattcagg ttttcaaatg aatcaattga gaggtaaaaa atcttgtcat     480

    actggtttag gtagatctgc tggatggaat attccaattg gtttgttgta ttgtgatttg     540

    ccagaaccaa gaaaaccatt ggaaaaagct gttgctaatt ttttttctgg ttcttgtgct     600

    ccatgtgctg atggtacaga ttttccacaa ttgtgtcaat tatgtccagg ttgtggttgt     660

    tctactttga atcaatattt tggttattct ggtgctttta aatgtttgaa agatggtgct     720

    ggtgatgttg cttttgttaa acattctact atttttgaaa atttggcaaa caaagctgat     780

    agagatcaat atgaattgtt gtgtttggat aatactagaa aaccagttga tgaatataaa     840

    gattgtcatt tggctcaagt tccatctcat actgttgttg ctagatctat gggtggtaaa     900

    gaagatttga tttgggaatt gttgaatcaa gctcaagaac attttggtaa agataaatct     960

    aaagaatttc aattgttttc ttctccacat ggtaaagatt tgttgtttaa agattctgct    1020

    catggttttt tgaaagttcc accaagaatg gatgctaaaa tgtatttggg ttatgaatac    1080

    gttactgcta ttagaaattt gagagaaggt acttgtccag aagctccaac tgatgaatgt    1140

    aaaccagtta aatggtgtgc tttgtctcat catgaaagat taaaatgtga tgaatggtct    1200

    gttaattctg ttggtaaaat tgaatgtgtt tctgctgaaa ctacagaaga ttgtattgct    1260

    aaaattatga atggtgaagc tgatgctatg tctttagatg gtggttttgt atatattgct    1320

    ggtaaatgtg gtttagttcc agttttggct gaaaattata acaaatgtaa ttgtgaagat    1380

    actccagaag ctggttattt tgctgttgct gttgttaaaa aatctgcttc tgatttgact    1440

    tgggataatc taaaaggaaa aaagagttgc catacagctg ttgg                     1484

     

    <210>7

    <211>1490

    <212>DNA

    <213>人工的

     

    <220>

    <223>合成的

     

    <400>7

    cttaagagtc caattagctt catcgccaat aaaaaaacaa gcttaaccta attctaacaa      60

    gcaaagatgt tgttgcaagc ttttttgttt ttgttggctg gttttgctgc taaaatttct     120

    gctgttccag ataaaacagt tagatggtgt gctgtttctg aacatgaagc tactaaatgt     180

    caatctttta gagatcatat gaaatctgtt attccatctg atggtccatc tgttgcttgt     240

    gttaaaaaag cttcttattt ggattgtatt agagctattg ctgctaatga agctgatgct     300

    gttactttgg atgctggttt agtttatgat gcttatttgg ctccaaacaa tttgaaacca     360

    gttgttgctg aattttatgg ttctaaggaa gatccacaaa ctttttatta tgctgtagcc     420

    gttgtaaaaa aggattcagg ttttcaaatg aatcaattga gaggtaaaaa atcttgtcat     480

    actggtttag gtagatctgc tggatggaat attccaattg gtttgttgta ttgtgatttg     540

    ccagaaccaa gaaaaccatt ggaaaaagct gttgctaatt ttttttctgg ttcttgtgct     600

    ccatgtgctg atggtacaga ttttccacaa ttgtgtcaat tatgtccagg ttgtggttgt     660

    tctactttga atcaatattt tggttattct ggtgctttta aatgtttgaa agatggtgct     720

    ggtgatgttg cttttgttaa acattctact atttttgaaa atttggcaaa caaagctgat     780

    agagatcaat atgaattgtt gtgtttggat aatactagaa aaccagttga tgaatataaa     840

    gattgtcatt tggctcaagt tccatctcat actgttgttg ctagatctat gggtggtaaa     900

    gaagatttga tttgggaatt gttgaatcaa gctcaagaac attttggtaa agataaatct     960

    aaagaatttc aattgttttc ttctccacat ggtaaagatt tgttgtttaa agattctgct    1020

    catggttttt tgaaagttcc accaagaatg gatgctaaaa tgtatttggg ttatgaatac    1080

    gttactgcta ttagaaattt gagagaaggt acttgtccag aagctccaac tgatgaatgt    1140

    aaaccagtta aatggtgtgc tttgtctcat catgaaagat taaaatgtga tgaatggtct    1200

    gttaattctg ttggtaaaat tgaatgtgtt tctgctgaaa ctacagaaga ttgtattgct    1260

    aaaattatga atggtgaagc tgatgctatg tctttagatg gtggttttgt atatattgct    1320

    ggtaaatgtg gtttagttcc agttttggct gaaaattata acaaagcttg tgataattgt    1380

    gaagatactc cagaagctgg ttattttgct gttgctgttg ttaaaaaatc tgcttctgat    1440

    ttgacttggg ataatctaaa aggaaaaaag agttgccata cagctgttgg               1490

     

    <210>8

    <211>301

    <212>DNA

    <213>人工的

     

    <220>

    <223>合成的

     

    <400>8

    ccatacagct gttggaagaa cagccggatg gaacattcca atgggattgc tatacaacaa      60

    aattaatcat tgtagatttg atgaattttt ttctgaaggt tgtgctccag gttctaaaaa     120

    agattcttct ttgtgtaaat tgtgtatggg ttgtggattg aatttgtgtg aaccaaacaa     180

    caaggaaggt tattatggtt atactggtgc ttttagatgt ttagttgaaa aaggtgatgt     240

    tgcttttgtt aaacatcaaa cagttccaca aaatactggt ggtaaaaatc cagatccatg     300

    g                                                                     301

     

    <210>9

    <211>462

    <212>DNA

    <213>人工的

     

    <220>

    <223>合成的

     

    <400>9

    ccatgggcta aaaatttgaa tgaaaaagat tacgaattac tatgtttaga tggtacaaga      60

    aagccagttg aggaatacgc taattgtcat ttagctagag caccaaatca tgctgttgtt     120

    actagaaaag ataaagaagc ttgtgttcat aaaattttga gacaacaaca acatttgttt     180

    ggttctaatg ttgctgattg ttctggtaat ttttgtttgt ttagatctga aactaaagat     240

    ttattgttta gagatgatac tgtttgtttg gctaaattgc atgatagaaa tacttatgaa     300

    aaatatttgg gtgaagaata cgttaaagct gttggtaatt tgagaaaatg ttctacttct     360

    tctttgttgg aagcttgtac ttttagaagg ccataataag cttaattctt atgatttatg     420

    atttttatta ttaaataagt tataaaaaaa ataagtgtat ac                        462

     

    <210>10

    <211>2359

    <212>DNA

    <213>人工的

     

    <220>

    <223>合成的

     

    <400>10

    cttaagagtc caattagctt catcgccaat aaaaaaacaa gcttaaccta attctaacaa      60

    gcaaagatgt tgttgcaagc ttttttgttt ttgttggctg gttttgctgc taaaatttct     120

    gctgttccag ataaaacagt tagatggtgt gctgtttctg aacatgaagc tactaaatgt     180

    caatctttta gagatcatat gaaatgtgtt attccatctg atggtccatc tgttgcttgt     240

    gttaaaaaag cttcttattt ggattgtatt agagctattg ctgctaatga agctgatgct     300

    gttactttgg atgctggttt agtttatgat gcttatttgg ctccaaacaa tttgaaacca     360

    gttgttgctg aattttatgg ttctaaggaa gatccacaaa ctttttatta tgctgtagcc     420

    gttgtaaaaa aggattcagg ttttcaaatg aatcaattga gaggtaaaaa atcttgtcat     480

    actggtttag gtagatctgc tggatggaat attccaattg gtttgttgta ttgtgatttg     540

    ccagaaccaa gaaaaccatt ggaaaaagct gttgctaatt ttttttctgg ttcttgtgct     600

    ccatgtgctg atggtacaga ttttccacaa ttgtgtcaat tatgtccagg ttgtggttgt     660

    tctactttga atcaatattt tggttattct ggtgctttta aatgtttgaa agatggtgct     720

    ggtgatgttg cttttgttaa acattctact atttttgaaa atttggcaaa caaagctgat     780

    agagatcaat atgaattgtt gtgtttggat aatactagaa aaccagttga tgaatataaa     840

    gattgtcatt tggctcaagt tccatctcat actgttgttg ctagatctat gggtggtaaa     900

    gaagatttga tttgggaatt gttgaatcaa gctcaagaac attttggtaa agataaatct     960

    aaagaatttc aattgttttc ttctccacat ggtaaagatt tgttgtttaa agattctgct    1020

    catggttttt tgaaagttcc accaagaatg gatgctaaaa tgtatttggg ttatgaatac    1080

    gttactgcta ttagaaattt gagagaaggt acttgtccag aagctccaac tgatgaatgt    1140

    aaaccagtta aatggtgtgc tttgtctcat catgaaagat taaaatgtga tgaatggtct    1200

    gttaattctg ttggtaaaat tgaatgtgtt tctgctgaaa ctacagaaga ttgtattgct    1260

    aaaattatga atggtgaagc tgatgctatg tctttagatg gtggttttgt atatattgct    1320

    ggtaaatgtg gtttagttcc agttttggct gaaaattata acaaatgtga taattgtgaa    1380

    gatactccag aagctggtta ttttgctgtt gctgttgtta aaaaatctgc ttctgatttg    1440

    acttgggata atctaaaagg aaaaaagagt tgccatacag ctgttggaag aacagccgga    1500

    tggaacattc caatgggatt gctatacaac aaaattaatc attgtagatt tgatgaattt    1560

    ttttctgaag gttgtgctcc aggttctaaa aaagattctt ctttgtgtaa attgtgtatg    1620

    ggttctggat tgaatttgtg tgaaccaaac aacaaggaag gttattatgg ttatactggt    1680

    gcttttagat gtttagttga aaaaggtgat gttgcttttg ttaaacatca aacagttcca    1740

    caaaatactg gtggtaaaaa tccagatcca tgggctaaaa atttgaatga aaaagattac    1800

    gaattactat gtttagatgg tacaagaaag ccagttgagg aatacgctaa ttgtcattta    1860

    gctagagcac caaatcatgc tgttgttact agaaaagata aagaagcttg tgttcataaa    1920

    attttgagac aacaacaaca tttgtttggt tctaatgttg ctgattgttc tggtaatttt    1980

    tgtttgttta gatctgaaac taaagattta ttgtttagag atgatactgt ttgtttggct    2040

    aaattgcatg atagaaatac ttatgaaaaa tatttgggtg aagaatacgt taaagctgtt    2100

    ggtaatttga gaaaatgttc tacttcttct ttgttggaag cttgtacttt tagaaggcca    2160

    taataagctt aattcttatg atttatgatt tttattatta aataagttat aaaaaaaata    2220

    agtgtataca aattttaaag tgactcttag gttttaaaac gaaaattctt attcttgagt    2280

    aactctttcc tgtaggtcag gttgctttct caggtatagc atgaggtcgc tcttattgac    2340

    cacacctcta ccggcatgc                                            2359

     

    <210>11

    <211>691

    <212>PRT

    <213>人(Homo Sapiens)

     

    <400>11

     

    Gly Arg Arg Arg Ser Val Gln Trp Cys Ala Val Ser Gln Pro Glu Ala

    1               5                   10                  15

    Thr Lys Cys Phe Gln Trp Gln Arg Asn Met Arg Lys Val Arg Gly Pro

                20                  25                  30

    Pro Val Ser Cys Ile Lys Arg Asp Ser Pro Ile Gln Cys Ile Gln Ala

            35                  40                  45

    Ile Ala Glu Asn Arg Ala Asp Ala Val Thr Leu Asp Gly Gly Phe Ile

        50                  55                  60

    Tyr Glu Ala Gly Leu Ala Pro Tyr Lys Leu Arg Pro Val Ala Ala Glu

    65                  70                  75                  80

    Val Tyr Gly Thr Glu Arg Gln Pro Arg Thr His Tyr Tyr Ala Val Ala

                    85                  90                  95

    Val Val Lys Lys Gly Gly Ser Phe Gln Leu Asn Glu Leu Gln Gly Leu

                100                 105                 110

    Lys Ser Cys His Thr Gly Leu Arg Arg Thr Ala Gly Trp Asn Val Pro

            115                 120                 125

    Ile Gly Thr Leu Arg Pro Phe Leu Asn Trp Ala Gly Pro Pro Glu Pro

        130                 135                 140

    Ile Glu Ala Ala Val Ala Arg Phe Phe Ser Ala Ser Cys Val Pro Gly

    145                 150                 155                 160

    Ala Asp Lys Gly Gln Phe Pro Asn Leu Cys Arg Leu Cys Ala Gly Thr

                    165                 170                 175

    Gly Glu Asn Lys Cys Ala Phe Ser Ser Gln Glu Pro Tyr Phe Ser Tyr

                180                 185                 190

    Ser Gly Ala Phe Lys Cys Leu Arg Asp Gly Ala Gly Asp Val Ala Phe

            195                 200                 205

    Ile Arg Glu Ser Thr Val Phe Glu Asp Leu Ser Asp Glu Ala Glu Arg

        210                 215                 220

    Asp Glu Tyr Glu Leu Leu Cys Pro Asp Asn Thr Arg Lys Pro Val Asp

    225                 230                 235                 240

    Lys Phe Lys Asp Cys His Leu Ala Arg Val Pro Ser His Ala Val Val

                    245                 250                 255

    Ala Arg Ser Val Asn Gly Lys Glu Asp Ala Ile Trp Asn Leu Leu Arg

                260                 265                 270

    Gln Ala Gln Glu Lys Phe Gly Lys Asp Lys Ser Pro Lys Phe Gln Leu

            275                 280                 285

    Phe Gly Ser Pro Ser Gly Gln Lys Asp Leu Leu Phe Lys Asp Ser Ala

        290                 295                 300

    Ile Gly Phe Ser Arg Val Pro Pro Arg Ile Asp Ser Gly Leu Tyr Leu

    305                 310                 315                 320

    Gly Ser Gly Tyr Phe Thr Ala Ile Gln Asn Leu Arg Lys Ser Glu Glu

                    325                 330                 335

    Glu Val Ala Ala Arg Arg Ala Arg Val Val Trp Cys Ala Val Gly Glu

                340                 345                 350

    Gln Glu Leu Arg Lys Cys Asn Gln Trp Ser Gly Leu Ser Glu Gly Ser

            355                 360                 365

    Val Thr Cys Ser Ser Ala Ser Thr Thr Glu Asp Cys Ile Ala Leu Val

        370                 375                 380

    Leu Lys Gly Glu Ala Asp Ala Met Ser Leu Asp Gly Gly Tyr Val Tyr

    385                 390                 395                 400

    Thr Ala Gly Lys Cys Gly Leu Val Pro Val Leu Ala Glu Asn Tyr Lys

                    405                 410                 415

    Ser Gln Gln Ser Ser Asp Pro Asp Pro Asn Cys Val Asp Arg Pro Val

                420                 425                 430

    Glu Gly Tyr Leu Ala Val Ala Val Val Arg Arg Ser Asp Thr Ser Leu

            435                 440                 445

    Thr Trp Asn Ser Val Lys Gly Lys Lys Ser Cys His Thr Ala Val Asp

        450                 455                 460

    Arg Thr Ala Gly Trp Asn Ile Pro Met Gly Leu Leu Phe Asn Gln Ala

    465                 470                 475                 480

    Gly Ser Cys Lys Phe Asp Glu Tyr Phe Ser Gln Ser Cys Ala Pro Gly

                    485                 490                 495

    Ser Asp Pro Arg Ser Asn Leu Cys Ala Leu Cys Ile Gly Asp Glu Gln

                500                 505                 510

    Gly Glu Asn Lys Cys Val Pro Asn Ser Asn Glu Arg Tyr Tyr Gly Tyr

            515                 520                 525

    Thr Gly Ala Phe Arg Cys Leu Ala Glu Asn Ala Gly Asp Val Ala Phe

        530                 535                 540

    Val Lys Asp Val Thr Val Leu Gln Asn Thr Asp Gly Asn Asn Asn Glu

    545                 550                 555                 560

    Ala Trp Ala Lys Asp Leu Lys Leu Ala Asp Phe Ala Leu Leu Cys Leu

                    565                 570                 575

    Asp Gly Lys Arg Lys Pro Val Thr Glu Ala Arg Ser Cys His Leu Ala

                580                 585                 590

    Met Ala Pro Asn His Ala Val Val Ser Arg Met Asp Lys Val Glu Arg

            595                 600                 605

    Leu Lys Gln Val Leu Leu His Gln Gln Ala Lys Phe Gly Arg Asn Gly

        610                 615                 620

    Ala Asp Cys Pro Asp Lys Phe Cys Leu Phe Gln Ser Glu Thr Lys Asn

    625                 630                 635                 640

    Leu Leu Phe Asn Asp Asn Thr Glu Cys Leu Ala Arg Leu His Gly Lys

                    645                 650                 655

    Thr Thr Tyr Glu Lys Tyr Leu Gly Pro Gln Tyr Val Ala Gly Ile Thr

                660                 665                 670

    Asn Leu Lys Lys Cys Ser Thr Ser Pro Leu Leu Glu Ala Cys Glu Phe

            675                 680                 685

    Leu Arg Lys

        690

     

    <210>12

    <211>2395

    <212>DNA

    <213>人工的

     

    <220>

    <223>合成的

     

    <400>12

    cttaagagtc caattagctt catcgccaat aaaaaaacaa gcttaaccta attctaacaa      60

    gcaaagatgc ttttgcaagc cttccttttc cttttggctg gttttgcagc caagatctct     120

    gctggccgta ggaggagtgt tcagtggtgc gccgtatccc aacccgaggc cacaaaatgc     180

    ttccaatggc aaaggaatat gagaaaagtg cgtggccctc ctgtcagctg cataaagaga     240

    gactccccca tccagtgtat ccaggccatt gcggaaaaca gggccgatgc tgtgaccctt     300

    gatggtggtt tcatatacga ggcaggcctg gccccctaca aactgcgacc tgtagcggcg     360

    gaagtctacg ggaccgaaag acagccacga actcactatt atgccgtggc tgtggtgaag     420

    aagggcggca gctttcagct gaacgaactg caaggtctga agtcctgcca cacaggcctt     480

    cgcaggaccg ctggatggaa tgtccctata gggacacttc gtccattctt gaattgggct     540

    ggtccacctg agcccattga ggcagctgtg gccaggttct tctcagccag ctgtgttccc     600

    ggtgcagata aaggacagtt ccccaacctg tgtcgcctgt gtgcggggac aggggaaaac     660

    aaatgtgcct tctcctccca ggaaccgtac ttcagctact ctggtgcctt caagtgtctg     720

    agagacgggg ctggagacgt ggcttttatc agagagagca cagtgtttga ggacctgtca     780

    gacgaggctg aaagggacga gtatgagtta ctctgcccag acaacactcg gaagccagtg     840

    gacaagttca aagactgcca tctggcccgg gtcccttctc atgccgttgt ggcacgaagt     900

    gtgaatggca aggaggatgc catctggaat cttctccgcc aggcacagga aaagtttgga     960

    aaggacaagt caccgaaatt ccagctcttt ggctccccta gtgggcagaa agatctgctg    1020

    ttcaaggact ctgccattgg gttttcgagg gtgcccccga ggatagattc tgggctgtac    1080

    cttggctccg gctacttcac tgccatccag aacttgagga aaagtgagga ggaagtggct    1140

    gcccggcgtg cgcgggtcgt gtggtgtgcg gtgggcgagc aggagctgcg caagtgtaac    1200

    cagtggagtg gcttgagcga aggcagcgtg acctgctcct cggcctccac cacagaggac    1260

    tgcatcgccc tggtgctgaa aggagaagct gatgccatga gtttggatgg aggatatgtg    1320

    tacactgcag gcaaatgtgg tttggtgcct gtcctggcag agaactacaa atcccaacaa    1380

    agcagtgacc ctgatcctaa ctgtgtggat agacctgtgg aaggatatct tgctgtggcg    1440

    gtggttagga gatcagacac tagccttacc tggaactctg tgaaaggcaa gaagtcctgc    1500

    cacaccgccg tggacaggac tgcaggctgg aatatcccca tgggcctgct cttcaaccag    1560

    gctggctcct gcaaatttga tgaatatttc agtcaaagct gtgcccctgg gtctgacccg    1620

    agatctaatc tctgtgctct gtgtattggc gacgagcagg gtgagaataa gtgcgtgccc    1680

    aacagcaacg agagatacta cggctacact ggggctttcc ggtgcctggc tgagaatgct    1740

    ggagacgttg catttgtgaa agatgtcact gtcttgcaga acactgatgg aaataacaat    1800

    gaggcatggg ctaaggattt gaagctggca gactttgcgc tgctgtgcct cgatggcaaa    1860

    cggaagcctg tgactgaggc tagaagctgc catcttgcca tggccccgaa tcatgccgtg    1920

    gtgtctcgga tggataaggt ggaacgcctg aaacaggtgt tgctccacca acaggctaaa    1980

    tttgggagaa atggagctga ctgcccggac aagttttgct tattccagtc tgaaaccaaa    2040

    aaccttctgt tcaatgacaa cactgagtgt ctggccagac tccatggcaa aacaacatat    2100

    gaaaaatatt tgggaccaca gtatgtcgca ggcattacta atctgaaaaa gtgctcaacc    2160

    tcccccctcc tggaagcctg tgaattcctc aggaagtaat aagcttaatt cttatgattt    2220

    atgattttta ttattaaata agttataaaa aaaataagtg tatacaaatt ttaaagtgac    2280

    tcttaggttt taaaacgaaa attcttattc ttgagtaact ctttcctgta ggtcaggttg    2340

    ctttctcagg tatagcatga ggtcgctctt attgaccaca cctctaccgg catgc         2395

     

    <210>13

    <211>2394

    <212>DNA

    <213>人工的

     

    <220>

    <223>合成的

     

    <400>13

    ttaagagtcc aattagcttc atcgccaata aaaaaacaag cttaacctaa ttctaacaag      60

    caaagatgtt gttgcaagct tttttgtttt tgttggctgg ttttgctgct aaaatttctg     120

    ctggtagaag aagatctgtt caatggtgtg ctgtttctca acctgaagct actaaatgtt     180

    ttcaatggca aagaaacatg agaaaagtta gaggtccacc agtttcttgt attaaaagag     240

    attctccaat tcaatgtatt caagctattg ctgaaaatag agctgatgct gttactttgg     300

    atggtggttt catttatgaa gctggtttgg ctccatacaa attaagacca gttgctgctg     360

    aagtttatgg tactgaaaga caaccaagaa ctcattatta tgctgttgct gttgttaaaa     420

    aaggtggttc tttccaattg aatgaattgc aaggtttgaa atcttgtcat actggtttga     480

    gaagaactgc tggttggaat gttccaattg gtactttaag accatttttg aattgggctg     540

    gtccaccaga accaattgaa gctgctgttg ctagattttt ttctgcttct tgtgttccag     600

    gtgctgataa aggtcaattt ccaaacttgt gtagattgtg tgctggtact ggtgaaaaca     660

    aatgtgcttt ctcttctcaa gaaccatatt tttcttactc tggtgctttt aaatgtttga     720

    gagatggtgc tggtgatgtt gcttttatta gagaatctac tgttttcgaa gatttgtctg     780

    atgaagctga aagagatgaa tacgaattgt tgtgtccaga taatactaga aaaccagttg     840

    ataagttcaa agattgtcat ttggctagag ttccatctca tgctgttgtt gctagatctg     900

    ttaatggtaa agaagatgct atttggaatt tgttgagaca agctcaagaa aaatttggta     960

    aggataagtc tccaaagttt caattgtttg gttctccatc tggtcaaaaa gatttgttgt    1020

    tcaaggattc tgctattggt ttttctagag ttccaccaag aattgattct ggtttgtatt    1080

    tgggttctgg ttattttact gctattcaaa acttgagaaa gtctgaagaa gaagttgctg    1140

    ctagaagagc tagagttgtt tggtgtgcag ttggtgaaca agaattgaga aagtgtaatc    1200

    aatggtctgg tttgtctgaa ggttctgtta cttgttcttc tgcttctact actgaagatt    1260

    gtattgcttt ggttttgaaa ggtgaagctg atgctatgtc attagatggt ggttacgttt    1320

    acactgctgg taaatgtggt ttggttccag ttttggctga aaattacaag tctcaacaat    1380

    cttctgatcc agatccaaat tgtgttgata gaccagttga aggttatttg gctgttgcag    1440

    ttgttagaag atctgatact tctttgactt ggaactctgt taaaggtaaa aagtcttgtc    1500

    atacagctgt tgatagaaca gcaggttgga atattcctat gggtttgttg tttaatcaag    1560

    ctggttcttg taaatttgat gaatacttct ctcaatcttg tgctccaggt tcagatccaa    1620

    gatctaattt gtgtgctttg tgtattggtg atgaacaagg tgaaaacaag tgtgttccaa    1680

    attctaatga aagatactat ggttatacag gtgcatttag atgtttagct gaaaatgcag    1740

    gtgatgttgc atttgttaag gatgttacag ttttgcaaaa tactgatggt aacaacaatg    1800

    aagcttgggc taaagatttg aaattggctg attttgcttt gttgtgtttg gatggtaaaa    1860

    gaaaacctgt tactgaagct agatcttgtc atttagctat ggctccaaat catgcagttg    1920

    tttctagaat ggataaggtt gaaagattga agcaagtttt gttgcatcaa caagctaaat    1980

    ttggtagaaa tggtgctgat tgtccagata agttttgttt gttccaatct gaaactaaga    2040

    acttgttgtt caacgataat actgaatgtt tggctagatt gcatggtaaa actacttacg    2100

    aaaaatactt gggtccacaa tacgttgctg gtattactaa tttgaagaag tgttctactt    2160

    ctccattgtt ggaagcttgt gaatttttga gaaagtaata agcttaattc ttatgattta    2220

    tgatttttat tattaaataa gttataaaaa aaataagtgt atacaaattt taaagtgact    2280

    cttaggtttt aaaacgaaaa ttcttattct tgagtaactc tttcctgtag gtcaggttgc    2340

    tttctcaggt atagcatgag gtcgctctta ttgaccacac ctctaccggc atgc          2394

     

    <210>14

    <211>2395

    <212>DNA

    <213>人工的

     

    <220>

    <223>合成的

     

    <400>14

    cttaagagtc caattagctt catcgccaat aaaaaaacaa gcttaaccta attctaacaa      60

    gcaaagatgt tgttgcaagc ttttttgttt ttgttggctg gttttgctgc taaaatttct     120

    gctggtagaa gaagatctgt tcaatggtgt gctgtttctc aacctgaagc tactaaatgt     180

    tttcaatggc aaagaaacat gagaaaagtt agaggtccac cagtttcttg tattaaaaga     240

    gattctccaa ttcaatgtat tcaagctatt gctgaaaata gagctgatgc tgttactttg     300

    gatggtggtt tcatttatga agctggtttg gctccataca aattaagacc agttgctgct     360

    gaagtttatg gtactgaaag acaaccaaga actcattatt atgctgttgc tgttgttaaa     420

    aaaggtggtt ctttccaatt gaatgaattg caaggtttga aatcttgtca tactggtttg     480

    agaagaactg ctggttggaa tgttccaatt ggtactttaa gaccattttt gaattgggct     540

    ggtccaccag aaccaattga agctgctgtt gctagatttt tttctgcttc ttgtgttcca     600

    ggtgctgata aaggtcaatt tccaaacttg tgtagattgt gtgctggtac tggtgaaaac     660

    aaatgtgctt tctcttctca agaaccatat ttttcttact ctggtgcttt taaatgtttg     720

    agagatggtg ctggtgatgt tgcttttatt agagaatcta ctgttttcga agatttgtct     780

    gatgaagctg aaagagatga atacgaattg ttgtgtccag ataatactag aaaaccagtt     840

    gataagttca aagattgtca tttggctaga gttccatctc atgctgttgt tgctagatct     900

    gttaatggta aagaagatgc tatttggaat ttgttgagac aagctcaaga aaaatttggt     960

    aaggataagt ctccaaagtt tcaattgttt ggttctccat ctggtcaaaa agatttgttg    1020

    ttcaaggatt ctgctattgg tttttctaga gttccaccaa gaattgattc tggtttgtat    1080

    ttgggttctg gttattttac tgctattcaa aacttgagaa agtctgaaga agaagttgct    1140

    gctagaagag ctagagttgt ttggtgtgca gttggtgaac aagaattgag aaagtgtaat    1200

    caatggtctg gtttgtctga aggttctgtt acttgttctt ctgcttctac tactgaagat    1260

    tgtattgctt tggttttgaa aggtgaagct gatgctatgt cattagatgg tggttacgtt    1320

    tacactgctg gtaaatgtgg tttggttcca gttttggctg aaaattacaa gtctcaacaa    1380

    tcttgtgatc cagatccaaa ttgtgttgat agaccagttg aaggttattt ggctgttgca    1440

    gttgttagaa gatctgatac ttctttgact tggaactctg ttaaaggtaa aaagtcttgt    1500

    catacagctg ttgatagaac agcaggttgg aatattccta tgggtttgtt gtttaatcaa    1560

    gctggttctt gtaaatttga tgaatacttc tctcaatctt gtgctccagg ttcagatcca    1620

    agatctaatt tgtgtgcttt gtgtattggt gatgaacaag gtgaaaacaa gtgtgttcca    1680

    aattctaatg aaagatacta tggttataca ggtgcattta gatgtttagc tgaaaatgca    1740

    ggtgatgttg catttgttaa ggatgttaca gttttgcaaa atactgatgg taacaacaat    1800

    gaagcttggg ctaaagattt gaaattggct gattttgctt tgttgtgttt ggatggtaaa    1860

    agaaaacctg ttactgaagc tagatcttgt catttagcta tggctccaaa tcatgcagtt    1920

    gtttctagaa tggataaggt tgaaagattg aagcaagttt tgttgcatca acaagctaaa    1980

    tttggtagaa atggtgctga ttgtccagat aagttttgtt tgttccaatc tgaaactaag    2040

    aacttgttgt tcaacgataa tactgaatgt ttggctagat tgcatggtaa aactacttac    2100

    gaaaaatact tgggtccaca atacgttgct ggtattacta atttgaagaa gtgttctact    2160

    tctccattgt tggaagcttg tgaatttttg agaaagtaat aagcttaatt cttatgattt    2220

    atgattttta ttattaaata agttataaaa aaaataagtg tatacaaatt ttaaagtgac    2280

    tcttaggttt taaaacgaaa attcttattc ttgagtaact ctttcctgta ggtcaggttg    2340

    ctttctcagg tatagcatga ggtcgctctt attgaccaca cctctaccgg catgc         2395

     

    <210>15

    <211>738

    <212>PRT

    <213>人(Homo Sapiens)

     

    <400>15

     

    Met Arg Gly Pro Ser Gly Ala Leu Trp Leu Leu Leu Ala Leu Arg Thr

    1               5                   10                  15

    Val Leu Gly Gly Met Glu Val Arg Trp Cys Ala Thr Ser Asp Pro Glu

                20                  25                  30

    Gln His Lys Cys Gly Asn Met Ser Glu Ala Phe Arg Glu Ala Gly Ile

            35                  40                  45

    Gln Pro Ser Leu Leu Cys Val Arg Gly Thr Ser Ala Asp His Cys Val

        50                  55                  60

    Gln Leu Ile Ala Ala Gln Glu Ala Asp Ala Ile Thr Leu Asp Gly Gly

    65                  70                  75                  80

    Ala Ile Tyr Glu Ala Gly Lys Glu His Gly Leu Lys Pro Val Val Gly

                    85                  90                  95

    Glu Val Tyr Asp Gln Glu Val Gly Thr Ser Tyr Tyr Ala Val Ala Val

                100                 105                 110

    Val Arg Arg Ser Ser His Val Thr Ile Asp Thr Leu Lys Gly Val Lys

            115                 120                 125

    Ser Cys His Thr Gly Ile Asn Arg Thr Val Gly Trp Asn Val Pro Val

        130                 135                 140

    Gly Tyr Leu Val Glu Ser Gly Arg Leu Ser Val Met Gly Cys Asp Val

    145                 150                 155                 160

    Leu Lys Ala Val Ser Asp Tyr Phe Gly Gly Ser Cys Val Pro Gly Ala

                    165                 170                 175

    Gly Glu Thr Ser Tyr Ser Glu Ser Leu Cys Arg Leu Cys Arg Gly Asp

                180                 185                 190

    Ser Ser Gly Glu Gly Val Cys Asp Lys Ser Pro Leu Glu Arg Tyr Tyr

            195                 200                 205

    Asp Tyr Ser Gly Ala Phe Arg Cys Leu Ala Glu Gly Ala Gly Asp Val

        210                 215                 220

    Ala Phe Val Lys His Ser Thr Val Leu Glu Asn Thr Asp Gly Lys Thr

    225                 230                 235                 240

    Leu Pro Ser Trp Gly Gln Ala Leu Leu Ser Gln Asp Phe Glu Leu Leu

                    245                 250                 255

    Cys Arg Asp Gly Ser Arg Ala Asp Val Thr Glu Trp Arg Gln Cys His

                260                 265                 270

    Leu Ala Arg Val Pro Ala His Ala Val Val Val Arg Ala Asp Thr Asp

            275                 280                 285

    Gly Gly Leu Ile Phe Arg Leu Leu Asn Glu Gly Gln Arg Leu Phe Ser

        290                 295                 300

    His Glu Gly Ser Ser Phe Gln Met Phe Ser Ser Glu Ala Tyr Gly Gln

    305                 310                 315                 320

    Lys Asp Leu Leu Phe Lys Asp Ser Thr Ser Glu Leu Val Pro Ile Ala

                    325                 330                 335

    Thr Gln Thr Tyr Glu Ala Trp Leu Gly His Glu Tyr Leu His Ala Met

                340                 345                 350

    Lys Gly Leu Leu Cys Asp Pro Asn Arg Leu Pro Pro Tyr Leu Arg Trp

            355                 360                 365

    Cys Val Leu Ser Thr Pro Glu Ile Gln Lys Cys Gly Asp Met Ala Val

        370                 375                 380

    Ala Phe Arg Arg Gln Arg Leu Lys Pro Glu Ile Gln Cys Val Ser Ala

    385                 390                 395                 400

    Lys Ser Pro Gln His Cys Met Glu Arg Ile Gln Ala Glu Gln Val Asp

                    405                 410                 415

    Ala Val Thr Leu Ser Gly Glu Asp Ile Tyr Thr Ala Gly Lys Thr Tyr

                420                 425                 430

    Gly Leu Val Pro Ala Ala Gly Glu His Tyr Ala Pro Glu Asp Ser Ser

            435                 440                 445

    Asn Ser Tyr Tyr Val Val Ala Val Val Arg Arg Asp Ser Ser His Ala

        450                 455                 460

    Phe Thr Leu Asp Glu Leu Arg Gly Lys Arg Ser Cys His Ala Gly Phe

    465                 470                 475                 480

    Gly Ser Pro Ala Gly Trp Asp Val Pro Val Gly Ala Leu Ile Gln Arg

                    485                 490                 495

    Gly Phe Ile Arg Pro Lys Asp Cys Asp Val Leu Thr Ala Val Ser Glu

                500                 505                 510

    Phe Phe Asn Ala Ser Cys Val Pro Val Asn Asn Pro Lys Asn Tyr Pro

            515                 520                 525

    Ser Ser Leu Cys Ala Leu Cys Val Gly Asp Glu Gln Gly Arg Asn Lys

        530                 535                 540

    Cys Val Gly Asn Ser Gln Glu Arg Tyr Tyr Gly Tyr Arg Gly Ala Phe

    545                 550                 555                 560

    Arg Cys Leu Val Glu Asn Ala Gly Asp Val Ala Phe Val Arg His Thr

                    565                 570                 575

    Thr Val Phe Asp Asn Thr Asn Gly His Asn Ser Glu Pro Trp Ala Ala

                580                 585                 590

    Glu Leu Arg Ser Glu Asp Tyr Glu Leu Leu Cys Pro Asn Gly Ala Arg

            595                 600                 605

    Ala Glu Val Ser Gln Phe Ala Ala Cys Asn Leu Ala Gln Ile Pro Pro

        610                 615                 620

    His Ala Val Met Val Arg Pro Asp Thr Asn Ile Phe Thr Val Tyr Gly

    625                 630                 635                 640

    Leu Leu Asp Lys Ala Gln Asp Leu Phe Gly Asp Asp His Asn Lys Asn

                    645                 650                 655

    Gly Phe Lys Met Phe Asp Ser Ser Asn Tyr His Gly Gln Asp Leu Leu

                660                 665                 670

    Phe Lys Asp Ala Thr Val Arg Ala Val Pro Val Gly Glu Lys Thr Thr

            675                 680                 685

    Tyr Arg Gly Trp Leu Gly Leu Asp Tyr Val Ala Ala Leu Glu Gly Met

        690                 695                 700

    Ser Ser Gln Gln Cys Ser Gly Ala Ala Ala Pro Ala Pro Gly Ala Pro

    705                 710                 715                 720

    Leu Leu Pro Leu Leu Leu Pro Ala Leu Ala Ala Arg Leu Leu Pro Pro

                    725                 730                 735

    Ala Leu

    

转铁蛋白变体和偶联物.pdf_第1页
第1页 / 共170页
转铁蛋白变体和偶联物.pdf_第2页
第2页 / 共170页
转铁蛋白变体和偶联物.pdf_第3页
第3页 / 共170页
点击查看更多>>
资源描述

《转铁蛋白变体和偶联物.pdf》由会员分享,可在线阅读,更多相关《转铁蛋白变体和偶联物.pdf(170页珍藏版)》请在专利查询网上搜索。

根据转铁蛋白的三维结构,本发明人设计了具有一个或多个带有自由巯基的半胱氨酸残基的变体多肽(突变蛋白)(下文称为巯基转铁蛋白)。所述多肽变体可以通过半胱氨酸残基的硫原子与生物活性化合物偶联。。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 化学;冶金 > 有机化学〔2〕


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1