新型蛋白质.pdf

摘要
申请专利号：	CN97193453.3	申请日：	1997.12.05
公开号：	CN1214693A	公开日：	1999.04.21
当前法律状态：	驳回	有效性：	无权
法律详情：	发明专利申请公布后的驳回\|\|\|\|\|\|公开
IPC分类号：	C07K14/435; C12N15/12; C12N15/63; C12N1/21; C12P21/02; C12Q1/68; A61K48/00; C07K16/18; G01N33/53; A61K39/395; //(C12N1/21,C12R1:19)	主分类号：	C07K14/435; C12N15/12; C12N15/63; C12N1/21; C12P21/02; C12Q1/68; A61K48/00; C07K16/18; G01N33/53; A61K39/395; //
申请人：	协和发酵工业株式会社; 财团法人上总DNA研究所
发明人：	石渡哲义; 桜田干子; 西村彩子; 中川智; 久我哲郎; 西达也; 野村信夫; 长濑隆弘; 泽田滋正; 武井正美
地址：	日本东京都
优先权：	1996.12.05 JP 325752/96
专利代理机构：	中国专利代理(香港)有限公司	代理人：	卢新华;齐曾度
PDF下载：	PDF下载

内容摘要

一种从IgA肾病患者白细胞中分离出的新型蛋白质;编码该蛋白质的DNA序列;以该DNA互补碱基序列为基础的寡核苷酸;与该蛋白质进行特异反应的抗体,以及含有该物质的IgA肾病诊断药及治疗药物。

权利要求书

1：具有序列号2中氨基酸序列的蛋白质。
2：编码权利要求1中蛋白质的DNA。
3：权利要求2中的DNA，它具有序列号1中的碱基序列。
4：在严格条件下与权利要求3的碱基序列构成的DNA进行杂交的 DNA。
5：权利要求2～4中的DNA与载体形成的重组载体。
6：将权利要求5的重组载体导入宿主细胞而形成的转化体。
7：蛋白质的制备方法，其特征在于在培养基中培养权利要求6的转化体，在培养物中生成、蓄积权利要求1中的蛋白质，以及从该培养物中收集该蛋白质。
8：含有权利要求2～4中DNA碱基序列的一部分的寡核苷酸。
9：含有权利要求2～4中DNA的互补碱基序列的一部分的寡核苷酸。
10：应用权利要求8和9中的寡核苷酸检测来自权利要求1中蛋白质的mRNA的方法。
11：含有权利要求8和9中寡核苷酸的IgA肾病诊断药物。
12：用权利要求8和9中寡核苷酸抑制权利要求1中蛋白质表达的方法。
13：含有权利要求8和9中寡核苷酸的IgA肾病的治疗药物。
14：与权利要求1中蛋白质进行特异性反应的抗体。
15：应用权利14中的抗体，对权利要求1中的蛋白质进行免疫学检测的方法。
16：含有权利要求14中抗体的IgA肾病的诊断药物。
17：含有权利要求14中抗体的IgA肾病的治疗药物。

说明书

新型蛋白质
    【技术领域】

    本发明涉及新型蛋白质，与健康人的白细胞相比，它是在IgA肾病患者的白细胞中表达增加的新型蛋白质，并且本发明涉及针对该蛋白质的抗体，编码该蛋白质的DNA及应用含有该DNA互补碱基序列的引物对该蛋白质、mRNA和DNA进行检测的方法，并涉及IgA肾病的诊断与治疗。

    背景技术

    IgA肾病是以来源于血液的IgA免疫复合物沉积于肾脏的肾小球内为特征的慢性肾小球肾炎。在日本，该疾病是原发性肾疾病的30％以上，是发病率最高的单纯性肾疾病，其中有15-30％由于预后不良而转变为肾功能不全。但是，由于IgA肾病的发病原因不明确，所以没有根本的治疗方法。此外，IgA肾病的确诊是对肾脏的一部分进行活检，通过对肾小球膜细胞中沉积的IgA免疫复合物进行免疫学染色的方法确定的，因此患者地负担很大。

    有这样的报道，IgA肾病患者中，大约50％病例的血中lgA值增多[肾疾病(Diseases of the Kidney)第5版(1993)，肾(Nephron29,170(1981)]。已知血液中IgA的产生和抑制分别由B细胞、T细胞担当，另外，有报道IgA患者的末梢T细胞中，细胞因子白细胞介素4、白细胞介素5、白细胞介素6或转化生长因子TGF-β的产生较健康人高[临床和实验免疫学(Clinical & Experimerntal Immunology),103,125(1996),国际肾脏学(Kidney International),46,862(1994)]，末梢淋巴细胞中，整合素象家族中VLA(极迟激话)(Verylate activation)-4和VLA-5具有非常强的活性[肾病学，透析，移植(Nephrology,Dialysis,Transplantation),10,1342(1995)]。由此可知、IgA肾病是因免疫系统失常产生过量的IgA，血液中的IgA免疫复合物沉积于肾小球，沉积的lgA免疫复合物使补体系统活化等而导致危及肾小球的损害，但对于IgA肾病的原因还不清楚。

    发明公开

    期望能够阐明IgA肾病的患病原因，能治疗IgA肾病或者有一种减弱患者负担的诊断。本发明提供在IgA肾病患者白细胞中表达增加的新型蛋白质及针对该蛋白质的抗体，编码该蛋白质的DNA和用含有该DNA互补碱基序列的寡核苷酸对该蛋白质、mRNA及DNA进行检测的方法，以及IgA肾病的诊断药物和治疗药物。

    本发明涉及具有序列号2中氨基酸序列的蛋白质，及编码本发明蛋白质的DNA，在严格的条件下与含有序列号1中碱基序列的DNA或由这些碱基序列形成的DNA进行杂交的DNA。此外本发明涉及蛋白质的制备方法，其特征在于，用该DNA与载体形成重组载体，将重组载体导入宿主细胞得到转化体，在培养基中培养该转化体，在培养物中生成、蓄积本发明的蛋白质，从该培养物中收集蛋白质。

    本发明涉及用含有本发明DNA及含有该DNA互补碱基序列一部分的寡核苷核，如用序列号6和7中的寡核苷酸对本发明蛋白质的mRNA进行检测的方法，或者涉及含有该寡核苷酸的IgA肾病的诊断药。

    本发明涉及用含有本发明DNA和含有该DNA互补碱基序列一部分的寡核苷酸，如用序列号6和7中的寡核苷酸对本发明蛋白质的表达进行抑制的方法，或涉及含有该寡核苷酸的lgA肾病的治疗药物。

    此外，本发明涉及与本发明的蛋白质进行特异反应的抗体，及用该抗体对本发明的蛋白质进行免疫学检测的方法，还涉及含有该抗体的IgA肾病的诊断药和治疗药物。

    本发明的蛋白质包含如序列号2中的氨基酸组成的蛋白质。本发明的DNA可以为编码本发明蛋白质的DNA序列或是序列号1中所示碱基序列构成的DNA或者是在严格条件下与该DNA进行杂交的DNA序列等。

    因为一般一个氨基酸对应几个遗传密码，所以编码本发明蛋白质的DNA中也包含具有与序列号1中碱基序列不同碱基序列的DNA。

    另外，与序列号1中的碱基序列在严格条件下进行杂交的DNA序列，是在不失去该蛋白质原有活性的范围内，经一处以上的置换缺失、插入或添加等变异而构成的DNA，以含有序列号1中碱基序列的DNA或其片段作探针，用菌落杂交法或噬斑杂交法f分子克隆：实验室手册(Moleular Cloning,A Laboratory manual),第2版〔Sambrook,Fritsch,Maniatis编集，冷泉港实验室出版(Cold Spring HarborLaboratory Press),1989年，以下简称为分子克隆：实验室手册，第2版]而得到的DNA。

    编码新型蛋白质的DNA的制备及表达可根据分子克隆：实验室手册(第2版)，分子生物学的现行方案(Current Protocols inMolecular Biology)、增刊(1～34)[Ausubel、Brent、Kingston、moore、Seidman、Smith、Struhl编集，Green PublishingAssociates and Wiley-Interscience发行，1987-1996年版，以后简称分子生物学的现行方案，增刊1～34]等记录的方法进行。

    为了获取新型基因，本发明中应用差示显示法[FEBS信件(FEBSLetters)351,231(1994)]观注IgA肾病患者与正常人白细胞中mRNA表达量的差异。该方法是以表达方式为指标对新型基因进行克隆的方法。即，应用针对细胞中提取出的总RNA或mRNA的各种引物进行聚合酶链式(PCR)反应，这样就可得到与健康人的白细胞相对照，在IgA肾病患者的白细胞中表达量显著增加或减少的新型基因的cDNA扩拉片段的方法。同时构建人未分化骨髓样细胞株KG-1的cDNA文库，预先确定各株cDNA的全部碱基序列，建立数据库，不仅看到其中的克隆株与上述cDNA扩增片段的碱基序列一致且可得到新型cDNA的全长。以下对其方法进行论述。

    从IgA肾病患者的白细胞和健康人的白细胞中制备总RNA的方法，可用硫氰酸胍三氟醋酸铯[酶学方法，154,3(1987)]、AGPC法[实验医学9、1937,(1991)]或用提取RNA的试剂盒RNAeasy(QIAGEN)等。

    此外，由总RNA制备poly(A)+RNA的方法，可用Oligo(dT)-纤维素层析柱法[分子克隆：实验室手册(第2版)]等。另外从IgA肾病患者和健康人的白细胞中制备mRNA的试剂盒可用快速追踪mRNA分离试剂盒(Fast Track mRNA Isolation kit;ィンビトロジェン公司)，快速制备mRNA纯化试剂盒(Quick Prep mRNA Purificationkit)Pharmacia公司)等。

    用锚定引物根据IgA肾病患者和健康人的白细胞中提取出的RNA合成cDNA，接着5′末端进行荧光标记的锚定引物和有机引物对该cDNA进行PCR反应。锚定引物是除胸腺嘧啶核苷外，将腺嘌呤、鸟嘌呤或胞嘧啶的寡核苷酸付加到与mRNA 3′末端polyA序列结合的Oligo dT序列的3′末端的引物。随机引物指能对多种cDNA序列进行扩增的引物，且优选应用在一次反应中能得到多个cDNA扩增片段的寡核苷酸，寡核苷酸的长度可为10聚体。

    PCR反应后进行聚丙烯酰胺凝胶电泳，用荧光检测仪进行荧光检测，以此来比较cDNA扩增片段的泳带。将只在IgA肾病患者的白细胞中出现的cDNA片段从胶中回收，将该cDNA扩增片段整合到载体中，用常用的碱基序列分析方法，如Sanger等的双脱氧法[美国国家科学院，院刊，74,5463(1977)]进行分析，以此来确定该DNA的碱基序列。

    整合了DNA片段的载体可以为pDIRECT[核酸研究(NucleicAcids Research)18,6069(1990)],pCR-Script Amp SK(+)[(Strategies),5,6264(1992)],pT7Blue(丿バジ一ン),pCRII[ィンビトロジェン,Biotechnology,9,657(1991)],pCR-TRAP(ジ一ンハンタ一)和pNOTAT7(5ブラィム-3ブラィム公司产品)等。

    碱基序列的分析，可用碱基序列自动分析装置，如用373A·DNA序仪(Amplimer Biosystems产品)进行。

    以前示所讲cDNA的扩增片段作探针，通过杂交，从cDNA文库中筛选可得到cDNA的全长，如本发明所讲，预先构建原始cDNA文库，确定每一克隆的全部碱基序列，建立数据库，从中可检查具有上述cDNA扩增片段碱基序列的克隆，由此也可得到有全长cDNA的克隆。以下论述cDNA文库的制备方法。

    cDNA文库的制备方法可参照分子克隆：实验室手册(第2版)和分子生物学的现行规程，增刊1～34中的方法或者用市售的试剂盒，如用cDNA合成和质粒克隆用超级SriptTM质粒系统(Super ScriptTMPlasmid System for cDNA Synthesis and plasmid Cloning,LifeTechnologies产品)和2AP-cDNA Synthesis Kis,Stratagene产品等。

    在制备cDNA文库的时候，以人未分化的骨髓样细胞株KG-1提取出的mRNA为模板合成cDNA，将该cDNA整合到载体中，只要能将该cDNA整合到载体中，那么任何一种载体均可应用。如可用ZAPExpress〔策略(Strategies)5,58(1992)〕、pBluescript Ⅱ SK(+)[核酸研究(Nucleic Acid Research)17,9494(1989)],λzap Ⅱ(Stratagene产品)λgt10、λgt11[DNA克隆，可行的方案(DNACloning,A Practical Approach), Vol.,49(1985)]、LambdaBlueMid(Clontech产品)、λExcell、PT7T318U(Pharmacia PcD2[分子细胞生物学(Mol.Cell.Biol.)3,280(1983)]和pUC18[基因(Gene),33,103(1985)]等。

    将用载体构建的cDNA文库导入大肠杆菌的时候，只要能导入、表达、维持cDNA文库，那么任一种大肠菌均可以。如用可XL1-BlueMRF′[策略(Strategies),5,81(1992)]、C600[基因学(Genetics),39,440(1954)]、Y1088、Y1090[科学)Science,222,778(1983)]、NM522[分子生物学杂交(J.Mol.Biol),166,(1983)]、K802[分子生物学杂志(J.Mol.Biol),16,118(1966)]及JM105 [基因(Gene),38,275(1985)]等。

    不制备cDNA文库的时候，合成cDNA后在两端付加衔接头，用基于该衔接头碱基序列和扩增片段碱基序列的引物进行PCR，得到5′RACE(cDNA未端的快速扩增)和3＇-RACE[美国国家科学院院刊(Proc.Natl Acad.Sci.,U.S.A),85,8998(1988)]。此外，也可用以序列号1中碱基序列为基础的PCR法或用DNA合成仪进行化学合成的方法。

    从cDNA文库筛选cDNA克隆的时候，可用同位素或荧光标记的探针，通过菌落杂交法或噬斑杂交法[分子克隆：实验手册，第2版]进行。另外，也可制备引物，以由poly(A)+RNA或mRNA而合成的cDNA或cDNA文库作模板，通过聚合酶链式反应(PCR)法[分子克隆：实验手册(第2版)，分子生物学的现行规程，增刊1～34]制备cDNA。

    用适当的限制性酶酶切用上述的方法筛选出的cDNA克隆，克隆到pBluescript KS(+)(Stratagene)等质粒中，用常规的碱基序列分析法，如用Sanger等的双脱氧法[美国国家科学院院刊，74,5463(1977)]进行分析，确定该DNA的碱基序列。也可用碱基序列自动分析装置，如用373A DNA测序仪(Amplier Biosystem产品)进行碱基序列的分析。

    将用上述方法得到的全长DNA插入到适宜载体的启动子下游，制成重组载体，将重组载体导入宿主细胞就可得到表达本发明蛋白质的转化体。

    细菌、酵母、动物细胞、昆虫细胞等只要能表达目的基因均可作为宿主细胞。如细胞可用大肠杆菌(Escherichia Coli)、枯草芽孢杆菌(Bacillus Subtilis)、淀粉液化芽孢杆菌(Bacillus amyloliquefaniens)、黄色短杆菌(Breribacterium flavum)、乳发酵短杆菌(Breribacterium Lactofermentum)、谷氨酸棒状杆菌(Corynebacterium glutamicum)、嗜氨微杆菌(Microbacteriumammoniaphilum)等大肠菌属、沙雷氏菌属、短杆菌属、棒状杆菌属、假单胞细菌属、芽胞杆菌属等。酵母可用啤酒糖酵母(Saccharomycescererisiae)、粟酒裂殖糖酵母(Schizosaccharomyces pomke)、乳克鲁维氏酵母(Kluyveromyces lactis)、茁芽丝孢酵母Trichosporonpullulans河岸许旺氏酵母(Schwanniomyces alluvius)等。动物细胞如人的ナマルバ细胞，猴子的COS细胞、中国公鼠的CHO细胞等。昆虫细胞如草地夜蛾(Spodoptera Frugiporda)的卵母细胞Sf9、Sf21[杆状病毒表达载体，实验室手册(Baulovirus ExpressionVectors,A Laboratory manual),Oreilly、Miller、Luckow著，W.H.Freeman and Company纽约(New York)1992年版(以后称作杆状病毒表达载体，实验室手册)]，粉纹夜蛾的卵细胞，Pharmingen生产的High5，即市售的Tn5等。

    作为导入本发明DNA的载体，只要能整合该DNA、在宿主细胞中能够表达，那些任一种载体均可。

    以细菌，如大肠杆菌(Escherichia Coli)作宿主细胞的时候，启动子、核糖体结合序列。本发明的DNA、转录终止序列、优选依不同的情况由启动子的调控序列构成。

    作为表达载体，如可用pKYP10(特开昭58-110600)、pLSA1[农业生物化学(Agril.Biol Chem,)53,277,(1989)]、pGEL1[美国国家科学院院刊，82,4306,(1985)]等。

    作为启动子，只要能在大肠杆菌等宿主细胞中表达就可。如可用trp启动子(P trp)、lac启动子(P lac)、T7 lac启动子、PL启动子、PR启动子等大肠杆菌、噬菌体来源的启动子。也可用2个连续的P trp启动子(P trp×2)、tac启动子等经过人为设计、改变过的启动了。

    作为核糖体结合序列，优选能将SD(Shine-Dalgarno)序列(以后略作SD序列)与起始密码子间调整到适当的距离(如6～18个碱基)的。

    为了使本发明DNA的碱基序列能以最适宜的密码子在宿主细胞中表达，必要时可置换本发明重组载体中的碱基。

    转录终止序列对本发明DNA的表达不一定是必要的，所以在本发明的重组载体中可优选在最合适的结构基因的正下方配置转录终止序列。

    将重组载体导入细胞的方法，只要具备将DNA导入细菌的方法，如用钙离子法[美国国家科学院院刊，69,2110-2114(1972)]原生质法(特开昭63-2483942等，任一种均可应用。

    以酵母作宿主细胞的时候，作为表达载体，如可用YEp13(ATCC37115)、YEp24(ATCC37051)、YCp50(ATCC37419)等。

    作为启动子，只要能在酵母中表达，那么用哪一种均可，如用是己糖激酶等具有降解作用基因的启动子、gal1启动子、gal10启动子、热休克蛋白质启动子、MFα1启动子、CUP1启动子等。作为将重组载体导入酵母的方法，只要是能将DNA导入酵母的方法，如电穿孔法[酶学方法，194,182-187(1990)]，原生质球法[美国国家科学院院刊，84,1929-1933(1978)]，醋酸锂法[细菌学杂志153,163-168(1983)]等，可用任一种。

    以动物细胞作宿主细胞的时候，表达载体可用，如pAGE107[特开平3-22979；细胞工程学(Cytotechnology),3,133,(1990)[pAS3-3(特开平2-227075),pAMoERC3Sc,pCDM8[自然(Nature),329,840(1987)],pcDNAI/Amp,pcDNAI(均为フナコシ产品)。

    作为启动子，只要能在动物细胞中表达，用任一种均可，如用巨细胞病毒(CEA)IE(立即早期(Immediatearly)基因的启动子，SV40或金属硫蛋白的启动子等。另外，人CMV的IE基因的增强子也可用启动子。

    将重组载体导入动物细胞的方法，如可用电穿孔法[Cytotechnology,3.133(1990)],磷酸钙法(特开平2-227075)，脂转染法[Proc.Nat.Acad.Sci.USA,84,7413(1987)]等中的任一种。昆虫细胞作宿主细胞的时候，可参照分子生物学的现行方案，增刊1～34，杆状病毒表达载体，实验室手册中的方法表达蛋白质。即，如下所述，将导入了重组基因的载体和杆状病毒共同导入昆虫细胞，在昆虫细胞培养养皮中得到重组病毒后，由用重组病毒感染昆虫细胞，就能获得表达蛋白质的昆虫细胞。

    作为转导基因的载体，如可用pVL1392,pVL1393,pBlueBacⅢ(均为ィンビトロジェン公司产品)等。

    作为杆状病毒，如可用感染夜盗蛾科昆虫的苜蓿银纹夜蛾核多角体病毒(Autographa californica nuclear polyhedrosis virus)等。

    为了制备重组病毒，将上述重组基因转导载体和上述杆状病毒共同导入昆虫细胞的方法，可用，如磷酸钙法(特开平2-227075)、脂转染法[美国国家科学院院刊，84,7413(1987)]等。

    基因的表达方法，除直接表达以外，可用分泌产生、融合蛋白表达等已建立的任一种方法。如，可按照J.Sambrook等(分子克隆第2版)描述的方法进行。

    酵母、动物细胞或昆虫细胞表达的时候，用外或内糖苷酶可得到付加了糖或糖链的蛋白质。

    在培养基中培养上面得到的转化体，在培养物中生成并蓄积本发明的蛋白质，收集该培养物就能制备出本发明的蛋白质。

    在培养基中培养本发明转化体的方法，可依照培养宿主细胞时用的常规方法进行。

    培养大肠菌或酵母等微生物作宿主细胞所得到的转化体时所用的培养基，只要含有微生物微生所需的碳源、氮源、无机盐类等。能高效地培养转化体，那么无论天然培养基、还是合成培养基均可。

    作为碳源，可用葡萄糖、果糖、蔗糖、糖蜜、淀粉、淀粉水解物等碳水化合物，醋酸、丙酸等有机酸，乙醇、丙醇等酒精类。

    作为氮源，可用氨、氯化铵、碳酸铵、醋酸铵、磷酸铵等无机酸、或有机酸的铵盐，或用其它含氮化合物以外的物质，蛋白胨、肉浸膏、酵母浸膏、コ一ンスチ一ブリカ一、酶蛋白水解物、大豆渣及大豆渣水解物、各种发酵菌体或其消化物等。

    作为无机物，可用磷酸氢二钾，磷酸二氢钾、磷酸镁、硫酸镁、氯化钠、硫酸铁、硫酸锰、硫酸铜、碳酸钙等。

    通常在振荡培养或深部通气搅拌培养等通过良好的情况下、15～40℃培养16～96小时。培养期间，pH保持在3.0～9.0。可用无机酸或有机酸、碱液、尿素、碳酸钙、氨等调整pH。

    培养中必要时可向培养基中加入氨苄青霉素、四环素等抗生素。

    当培养以诱导性启动子作启动子的表达载体转化的微生物时，必要时可向培养基中加入诱导物。如当培养启用lac启动子的表达载体转化的培养物时向培养基中加入异丙基硫代-β-D-半乳糖苷(IPTG)，而培养启用trp启动子的表达载体转化的微生物时向培养基中加入吲哚乙酸(IAA)。

    当培养以动物细胞作宿主细胞所得到的转化体时，常用通常使用的RPMI 1640培养基、Eagle的MEM培养基或者用向这些培养基中添加了胎牛血清的培养基。培养通常在5％CO2、35～37℃的条件下进行3～7天，培养中必要时可向培养基中加入卡那霉素、青霉素等抗生素。

    当培养以昆虫细胞作宿主细胞所得到的转化体时，可用通常使用的TNM-FH培养基[Pharmingen产品]，Sf 900 Ⅱ SFM[LifeTechnologies产品]，ExCell 400、Excell 405[均为JRH Bioscienes产品]等。于25～30℃培养1～4天，培养过程中必要时也可加入庆大霉素等抗生素。

    本发明的蛋白质在细胞内以溶解状态表达时或在细胞内形成不溶体的时候，都要在培养结束后，将细胞离心，分离，悬浮于水性缓冲液后，用超声波法、弗氏细胞压碎法将细胞弄破，从离心分离的上清中收回蛋白质。

    此外，当在细胞内形成不溶体的时候，用蛋白质变性剂将不溶体溶化后，在不含有蛋白质变性剂或蛋白质变性剂的浓度稀释到不能使蛋白质发生变性的溶液中稀释或进行透析，可形成蛋白质的立体构造。

    当本发明的蛋白质或其糖修饰体等衍生物在细胞外分泌产生的时候，可以从培养上清中收集到该蛋白质或其糖链付加体等的衍生物。对于分离纯化来讲，可单独应用或联合应用溶剂提取，用有机溶剂分别进行沉淀、盐析、透析、离心、超滤、离子交换层析、凝胶过滤层析、疏水性层析、亲和性层析、反相层析、结晶、电泳等分离过程。

    另外，本发明的蛋白质以序列号2中的氨基酸序列为基础，可用化学合成的方法进行制备。

    应用以本发明DNA的碱基序列为基础的寡核苷酸检测新型蛋白质mRNA的方法，可用Northern印迹法[分子克隆，实验室手册，第2版，冷泉港实验室出版(1989)]、PCR法[PCR方案(PCR Protcols)，学院出版社(Academic Press)(1990)]等。特别是RT-PCR法，简单便利，利于IgA肾病的诊断。具体地讲就是从人体采血，收集白细胞，从中分离出RNA，应用Oligo(dT)引物和逆转录酶将RNA变换成cDNA，之后应用与期望的mRNA相对应的一组寡核苷酸进行PCR反应，检测扩增片段。

    作为寡核苷酸引物，可用相当于期望检测出的mRNA一部分的碱基序列中5′末端碱基序列的有义引物及相当于3′末端碱基序列的反义引物。但是mRNA中相当于尿嘧啶的碱基在寡核苷酸引物中为胸腺嘧啶。

    作为有义引物及反义引物，优选应用融解温度(Tm)和碱基数没有很大变化的核苷酸。碱基数优选为15～40聚体。

    应用上述寡核苷酸引物所扩增的碱基序列部分，mRNA无论怎样的碱基序列区均可，但优选碱基序列的长度为50bp～2kbp，富含重复序列或GC(鸟嘌呤·胞嘧啶)碱基的序列。

    同样，应用反义RNA/DNA[化学46,681(1991)，生物技术(Biotechnology)9,358(1992)]，通过抑制DNA转录或mRNA翻译可阻碍蛋白质的表达。应用反义RNA/DNA技术抑制该蛋白质的生产是这样进行的设计，制备以编码本发明蛋白质的DNA的一部碱基序列为基础的寡核苷酸，优选以翻译起始区域10～50碱基的碱基序列为基础而设计的寡核苷酸，然后施与生物体内。合成寡核苷酸的碱基序列与编码本发明蛋白质的DNA的反义链的碱基序列的一部分相一致，或者可利用在能够抑制该蛋白质的活性表达而不失活性的范围内经过变动的序列。作为寡核苷酸可用DNA、RNA或其衍生物如甲基化和磷酸化。

    另外，可用本发明蛋白质或以序列号2中氨基酸序列为基础化学合成的本发明蛋白质一部分的肽作抗原进行免疫，来制备抗体。也就是说，将免疫动物的脾细胞与小鼠的骨髓瘤细胞融合制作杂交瘤，培养该杂交瘤，施用于动物使动物产生腹水癌，收集该培养液或腹水就能制备针对本发明蛋白质的单克隆抗体。此外，通过收集免疫动物的免疫血清就可制备针对本发明蛋白质的多克隆抗体。

    附图简述

    图1是实施例5中人组织和细胞中KIAA0235 Northern印迹的放射自显影图。A、B均来自人组织。A中，1为胰脏，2为肾脏、3为骨骼肌、4为肝脏、5为肺、6为胎盘、7为脑、8为心脏的RNA作印迹时滤膜的放射自显影图；B中分别为1末梢白细胞、2大肠、3小肠、4卵巢、5精囊、6前列腺、7胸腺、8脾脏的RNA作印迹时滤膜的放射自显影图。C来源于人细胞株，1、2分别为Hela、KG-1细胞株的RNA作印迹时滤膜的放射自显影图。A的左侧线为RNA标准参照物的位置，从上依次为9.5kb、7.5kb、4.4kb、2.4kb、1.35kb。

    图2是对实施例4中IgA肾病患者和健康人的白细胞的KIAAA0235的RT-PCR进行荧光检测的结果。1～5为5例健康人白细胞的RT-PCR,6～10是5例IgA肾病患者白细胞的RT-PCR,C是作为阳性对照，将差示显示所得的KIAA0235 cDNA的扩增片段整合到质粒中，以该质粒作模板进行的PCR反应。

    实施发明的最佳方案实施例1    制备人未分化骨髓样细胞株KG-1 cDNA文库(1)从KG-1细胞获取poly(A)+RNA

    在加有10％胎牛血清的Eagles修饰Dulbecco,s培养基(GibcoBRL公司)中培养人未分化骨髓样细胞株KG-1(ATCC-CCL246)，以细胞团回收细胞。每1ml细胞团加入2.8ml细胞溶解液[140mM NaCl、1,5mM MgCl2、10mM三(羟甲基)氨基甲烷(Tris)-HCl(pH8.5)0.5％NP-40]400mM氧钒硫酸核糖苷酸复合体0.2ml，在冰上溶解后，添加1ml的蔗糖溶液[140mM NaCl,1.5mM MgCl2、10mM Tris-HCl(pH8.5)1％NP-40、2.4％蔗糖]2℃、30,000rpm,离心30分钟。向含有RNA的4ml上清中加入4ml酶反应用缓冲液[200mM Tris-HCl(pH7.5)、25mM乙二胺四乙酸钠(EDTA)、300mM NaCl、2％十二烷基磺酸钠(SDS)]和10mg/ml蛋白酶K200μl,室温反应5分钟。用酚、氯仿进行萃取，乙醇沉淀，收回RNA。RNA在4.5ml缓冲液[20mM Tris-HCl(pH7.5)、0.1mM EDTA、0.1％ SDS]溶解良好后，在70℃加热5分钟后迅速冷却，加入5M LiCl0.5ml。在2℃、8,000rpm离心10分钟后，将血清在70℃加热5分钟，迅速冷却，填充剂用吸附缓冲液[20mM Tris-HCl(pH7.5)、500mMLiCl、0.1 mM EDTA、0.1％SDS]平衡过的Oligo(dT)纤维素层析柱[将oligo dT纤维素(Sigma公司吸附到巴斯德吸管中。将从柱中流出的溶液70℃加热5分钟后，迅速冷却，再次填柱，poly(A+)RNA得到吸附。用1ml吸附用缓冲液洗柱，再用吸附用缓冲液1.5ml洗3次，用洗涤用缓冲液[20mM Tris-HCl(pH7.5)/100mM LiCl、0.1mM EDTA]1.5ml洗柱5次，用溶出用缓冲液[10mM Tris-HCl(pH7.5)、0.1mMEDTA]3ml溶出，回收poly(A)+RNA。6ml(2g)细胞团得到8mg的总RNA，从中得到200μg poly(A)+RNA。(2)制备cDNA文库

    向所得poly(A)+RNA 40μg(40μl)中加入序列号3中所示polyd(T)-NotI引物-8μl(9.1μg)、5mM Tris-HCl(pH8.3)32μl、蒸馏水120μl。可参照核酸研究[Nucleic Acid Res.,12,4539(984)]中的方法进行DNA的合成。70℃加热10分钟后迅速冷却，加入64μl 5×逆转录酶反应用缓冲液[250mM Tris-HCl(pH8.3),375mM KCl,5mMMgCl2]32μl 100mM二硫苏糖醇(DTT)。8μl 20mM d NTP(dATP、dGTP、dTTP、dCTP)，37℃加温2分钟后，加入逆转录酶(SUPERSCRIPT RNaseH- Reverse Transcriptase)(Gibco BRL公司)3200单位(16μl),37℃反应1小时，合成cDNA。向该反应液中加入20mM dNTP 15μl、100mM DTT60μl、15mM β-烟酰胺核苷酸16μl、蒸馏水929μl，再加入E.Coli核糖核酸酶H(宝酒造)32单位(16μl)、DNA聚合酶Ⅰ(宝酒造)256单位(32μl)、E.ColiDNA连接酶(宝酒造)480单位(8μl)，在16℃反应2小时，cDNA变成双链。加入T4 DNA聚合酶48单位(24μl),16℃反应5分钟后，末端平端化，加入200mM EDTA 24μl,70℃加热10分钟使反应停止。用酚一氯仿萃取该反应液后，用乙醇沉淀，再用乙醇沉淀2次，纯化cDNA。将该双链cDNA在TE缓冲液[10mM Tris-Hcl(pH8.0)、1mMEDTA(pH8.0)]40μl中溶解，加入10×限制性酶反应用缓冲液[500mMTris-HCl(pH7.5)、100mM MgCl2、10mM DTT、1M NaCl、0.1％Triton X-100。0.1％牛血清白蛋白(BSA)]60μl蒸馏水460μl，再加入限制性酶NotI(宝酒造)320单位(40μl)、37℃2小时切割反应后，再加入Not I 192单位(24μl)、37℃反应1小时后，在70℃加热3分钟，反应停止。酚-氯仿萃取后，乙醇沉淀，再用乙醇反复沉淀2次，纯化cDNA。将该cDNA在5～30％的蔗糖密度梯度中24,000rpm离心24小时，分别得到大于6kd的级分、2-6kd的级分、小于2kb的级分。用NotI-EcoRV切割2～6kb的级分连接到质粒载体PBluesoript Sk+0.5μg中，导入到大肠菌DH10B(Gibco公司)中由此制备cDNA文库。(3)确定KG-1 cDNA文库中各克隆的cDNA碱基序列

    用Perkin-Elmer公司的373DNA测序仪来确定文库中各克隆的cDNA的碱基序列。测定碱基序列的具体试剂及方法是使用Perkin-Elmer一公司的Dye Primer cycle sequensing FS ReadyReaction试剂盒，按照试剂盒的说明进行。收集所得各cDNA的碱基序列作为数据库。实施例2新基因KIAA0235的cDNA片段的克隆化(1)由IgA肾病患者和健康人的白细胞获取总RNA

    分别从5名IgA肾病患者和5各健康人每个人采血20ml，加入1000单位/ml的肝素钠溶液(清水制药)500μl抗凝；剩入离心管中，室温3,300rpm离心15分钟，将中间白细胞成分的缓冲液层移到其它的离心层中后，根据AGPC法[实验室学9,1937,(1991)]提取总RNA。(2)用IgA肾病患者和健康人白细胞的总RNA进行荧光差异显示

    分别取总RNA2.5μg,加蒸馏水至共达9μl，加入5′端用异硫氰酸荧光素(以后称作FITC进行荧光标记的锚定引物FCH(碱基序列为序列号4：サヮディ一公司50μm)1μl,70℃加热10分钟后，立即冰冷。加入蒸馏水2μl、5×逆转录酶反应缓冲液4μl、100mM DTT 2μl、100mM dNTP 1μl、逆转录酶SUPERSCRIPT Ⅱ RNase HReverse Transcriptase(Gibco BRL公司)1μl(200单位)混合，于25℃反应10分钟，42℃反应50分钟，合成cDNA。90℃加热5分钟使反应停止。向该反应液中加入80μl TE缓冲液。

    向合成的各个cDNA 1μl中加入蒸馏水14.7μl 10×PCR缓冲液[100mM Tris-HCl(pH8.8)、500mM KCl、15mM MgCl2、1％triton X-100]2μl、2.5mM dNTP 0.8μl、50μm荧光标记的锚定引物-FCH 0.3μl、随机引物OPD-16(碱基序列为序列号5：ォブロン公司10μM)1μl、DNA聚合酶Gene Taq(日本基因，5单位/μl)0.2μl设置热循环。94℃3分钟、40℃5分钟、72℃5分钟反应后；95℃15秒、40℃2分钟72℃1分钟为一循环，进行27个循环的反应，最后在72℃反应5分钟完成PCR。

    向各个PCR反应液4μl中加入电泳样品溶液C 95％甲酰胺、0.1％二甲苯腈蓝、0.1％溴酚蓝)3μl 95℃加热2分钟后立即冷却，用6％聚丙烯酰胺于1500V电泳2.5小时。电泳所用缓冲液为89mM Tris、89mM硼酸、2mM EDTA。用荧光测量仪(Molecular Dynamicus)对电泳后的凝胶进行荧光检测。检测、比较PCR的扩增片段。与5例健康人相比，5例IgA肾病患者的白细胞中共有显著增加的带。再次从其它3名IgA肾病患者和3名健康人获取完全同样的总RNA，进行同样地差异显示，2次的差异显示中均看到表达量的增加，大约从凝胶中切出约200bp的带。

    向切出的约1/4的凝胶中加入蒸馏水3Sμl、10×PCR缓冲液5μl、2.5mM dNTP 4μl、荧光未标记的锚定引物-NC(碱基序列为序列号4：サヮディ一公司34μM)0.6μl、10μM随机引物OPD-16(碱基序列为序列号5)2μl、DNA聚合酶Gene Teq 0.5μl,94℃加热3分钟后，以95℃15秒、40℃2分钟72℃1分钟为1个循环、进行30个循环的反应，最后在72℃反应5分钟，如在进行PCR。用酚-氯仿(1∶1)萃取反应后的溶液，再用氯仿-异戊醇(24∶1)提取后，用乙醇沉淀，在10μl TE缓冲液中溶解。

    将扩增片段1μl与PCR片段克隆用的载体pTTBlueT-Vextor(丿バジェン)1μl混合，应用DNA连接试剂盒Ver.1(宝酒造)按照试剂盒的指示，将扩增片段整合到质粒中。转化大肠菌DH5α，得到氨苄青霉素耐药株。用众所周知的方法从该转化体中分离质料DNA。将该质料DNA 0.3ng溶解于19μl蒸馏水中。加入10×PCR缓冲液2.5μl、2.5mM dNTP 2μl、34μM锚定引物NC 0.3μl、10μ随机引物OPD-16 1μl、DNA聚合酶Gene Taq 0.5μl，在与扩增片段再扩增时相同的条件下进行PCR。大约200bp的片段得到扩增，由此可确定扩增片段整合到了质粒中。(3)测定扩增片段的碱基序列

    用DNA测序仪(Perkin-Elmer公司)确定扩增片段的碱基序列。测定碱基序列所用的试剂及方法是使用Perkin-Elmer公司的DyePrimer cycle sequensing FS Ready Reaction试剂盒。按照试剂盒的指示进行。所得碱基序列相当于序列号1的DNA序列中1076～1261位。当把所得的碱基序列与碱基序列数据库GeneBank进行比较时发现在数据库中的己有碱基序列中没有与该碱基序列相一致的碱基序列，因此考虑是新基因的cDNA片段。可是当该碱基序列与KG-1 cDNA文库中cDNA碱基序列数据库比较的时候，发现与基因KIAA0235的cDNA的碱基序列中的一部分完全一致，由此可见KIAA0235是IgA肾病患者白细胞中表达增加的新基因。如序列号1中所示，KIAA0235的5399bp的长度，其中从850氨基酸开始存在开放阅读框架(ORF)。氨基酸序列如序列号2所示。将KIAA0235的碱基序列与数据库Gene Bank/EMBL相比较，没有一致的碱基序列，由此可知是新基因的cDNA。另外，将编码该cDNA ORF的氨基酸序列与数据库相比较，发现在果蝇属胚胎发生时，与母亲来源的hunchback基因的mRNA相结合，对腹部体节形成起重要作用的pumilio基因[发育(Derelopment),114,221(1992),细胞(cen),80,747(1995)]的氨基酸序列与编码该cDNA ORF的氨基酸序列的C末端具有相同性。此外，该KG-1来源的cDNA克隆中与已经报道的KIAA 0099[DNA研究(DNAResearch),2,37(1995)]的ORF的氨基酸序列也有82％的相同性。实施例3  为了调节人的细胞和组织中新基因KIAA 0235 mRNA的表达，进行Northern印迹。

    制备人各组织中mRNA的图，用Clontech公司的胶片，通过Northermn印迹法检测人各组织中KIAA0235mRNA的表达。是用人MTV斑点(Human MTV Blot)胶片绘制心脏、脑、胎盘、肺、肝脏、骨骼肌、肾脏及胰脏mRNA的图。另外用人MTV斑点Ⅱ(HumanMTV Blot Ⅱ)绘制脾脏，胸腺、前列腺、精囊、卵巢、小肠、大肠和末梢白细胞的mRNA图。作为细胞，用人宫颈癌细胞株Hela细胞，用与实施例1相同的方法从细胞获取poly(A)+,RNA与KG-1的poly(A)+RNA各2μg进行聚丙烯酰胺凝胶电泳，转移到滤膜-BiodyneA(ボ一ル公司)上，同样通过Northern印迹法检测KIAA 0235的mRNA的表达。用Not Ⅰ(宝酒造)和Hind Ⅲ(宝酒造)酶切包含有实施例1中制备的cDNA文库中的KIAA 0235 cDNA的质粒克隆HA 4677纯化KIAA0235 cDNA片段，以作探针使用。用[α-32P]dCTP和BcaBEST标记试剂盒(宝酒造)进行32P标记，标记的具体试剂及方法按试剂盒的指示。

    将滤膜浸在杂交液[50％甲酰胺、5×SSC、5×Denhardt溶液(0.1％BSA、0.1％Ficol、0.1％聚乙烯吡咯烷酮)、0.25％SDS、100μg/ml超声波处理变性的(在微波炉中沸腾后冰中迅速，冷却。重复3次)鲑鱼精DNA]中，密封，37℃预杂交一晚。然后将探针在微波炉中沸腾后冰中迅速冷却，重复3次进行变性，加到杂交液中，浸泡滤膜密封，37℃杂交一晚上。

    取出滤膜，在含有0.1％SDS的1×SSC中室温振荡洗涤。换液，再重复数项洗涤，在含0.5％SDS的0.1×SSC中洗涤后，于含有0.5％SDS的0.1×SSC中50℃振荡洗涤1小时。最后在含有0.1％SDS的1×SSC中洗净风干。将滤膜与显影板(富土胶卷公司重叠，进行4小时的放射自显影，在生物成像板BAS2000(富士胶卷公司)上进行分析。其结果如图1所示。在心脏、脑、胎盘、肺、肝脏、骨骼肌、肾脏、胰脏、脾脏、胸腺、前列腺、精囊、卵巢、小肠、大肠和末梢白细胞的所有组织中检测出相当于5.5kb和6.8kb 2类长度mRNA的带。由此可知KIAA0235是在各组织中普遍表达的基因。另外，在KG-1及Hela细胞中同样检测出相当于5.5kb和6.8kb 2种长度mRNA的带，可以确认KIAA0235在二者中均有表达。实施例4  通过KIAA0235的RT-PCR检测表达的特异性。

    用单链cDNA合成试剂盒Superscript Preampification Systen(BRL公司)，通过试剂盒中配备的oligdT引物，对实例2中得到的，从5名IgA肾病患者和5名健康人的白细胞中获得的总RNA各2μg合成单链cDNA具体的试剂及方法参照试剂盒中配备的方案。向21μl反应后的溶液中加入蒸馏水399μl共达420μl，用其中的10μl进行RT-PCR，由此检测对应各扩增片段的mRNA的表达量。即，向白细胞的单链cDNA10μl中加入蒸馏水15.8μl、10×PCR缓冲液4μl、2.,5mM dNTP3.2μl、DMSO 2μl、10μm KIAA0235特异的5′有义引物(序列号6)2μl、10μm KIAA0235特异的3′反义引物(序列号7)2μl、稀释到1单位/μl的DNA聚合酶Gene Tap 2μl,97℃加热5分钟。冰浴中冷却5分钟后，以94℃30秒、65℃1分钟、72℃2分钟为1个循环进行28个循环的PCR反应。在2％琼脂糖凝胶电泳后，用0.01％サィバ一グリ一ン(宝酒造)染色，用荧光检测仪对扩增片段的量进行定量，作为mRNA的相对表达量。

    为了对mRNA的量进行校正，用序列号8及9中所示的特异引物对属于管家基因的甘油醛3-磷酸脱氢酶(G 3POH)基因进行同样的反应，各基因的mRNA表达量与G3PoH mRNA的表达量对比校正后，将5名IgA肾病患者的平均值与5名健康人的平均值进行比较。其结果如图2所示。可以确定IgA肾病患者白细胞中KIAA0235的表达是健康人的6.6倍。

    产业上利用的可能性

    应用本发明的新基因可进行IgA肾病的诊断和治疗。[序列表]序列号：1序列长度：5399序列类型：核酸链数：双链拓朴学：线性序列种类：cDNA起源生物名：人细胞株：KG-1A GAA TTT TCA AAT CCT GAA ACT CAG AAT CTG GAT GCC ATG GAA CAA GTT  49  Glu Phe Ser Asn Pro Glu Thr Gln Asn Leu Asp Ala Met Glu Gln Val   1               5                   10                  15GGT CTG GAA TCC TTA CAG TTT GAC TAT CCT GGT AAT CAG GTA CCA ATG    97Gly Leu Glu Ser Leu Gln Phe Asp Tyr Pro Gly Asn Gln Val Pro Met

            20                   25                  30GAC TCT TCA GGA GCT ACT GTA GGC CTT TTT GAC TAC AAT TCC CAG CAG   145Asp Ser Ser Gly Ala Thr Val Gly Leu Phe Asp Tyr Asn Ser Gln Gln

        35                  40                   45CAG CTC TTT CAG AGG ACT AAT GCA CTA ACA GTT CAA CAG TTA ACT GCA    193Gln Leu Phe Gln Arg Thr Asn Ala Leu Thr Val Gln Gln Leu Thr Ala

    50                  55                  60GCT CAA CAG CAG CAA TAT GCA TTA GCA GCA GCT CAG CAG CCA CAT ATA    241Ala Gln Gln Gln Gln Tyr Ala Leu Ala Ala Ala Gln Gln Pro His Ile65                   70                  75                 80GCT GGT GTA TTC TCA GCA GGC CTT GCT CCA GCT GCA TTT GTG CCA AAT    289Ala Gly Val Phe Ser Ala Gly Leu Ala Pro Ala Ala Phe Val Pro Asn

                85                   90                  95CCA TAC ATT ATT AGT GCT GCT CCT CCA GGG ACC GAT CCG TAT ACT GCA    337Pro Tyr Ile Ile Ser Ala Ala Pro Pro Gly Thr Asp Pro Tyr Thr Ala

             100                 105                 110 GCA GGA TTG GCT GCA GCA GCT ACA TTA GCA GGT CCA GCA GTG GTT CCA   385 Ala Gly Leu Ala Ala Ala Ala Thr Leu Ala Gly Pro Ala Val Val Pro

         115                 120                 125 CCT CAG TAT TAC GGC GTT CCA TGG GGG GTG TAT CCA GCC AAC TTA TTT   433 Pro Gln Tyr Tyr Gly Val Pro Trp Gly Val Tyr Pro Ala Asn Leu Phe

     130                 135                 140 CAG CAG CAA GCT GCA GCT GCG GCA AAT AAC ACA GCC AGT CAG CAA GCA   481 Gln Gln Gln Ala Ala Ala Ala Ala Asn Asn Thr Ala Ser Gln Gln Ala 145                 150                 155                 160 GCA TCA CAA GCT CAG CCT GGA CAG CAA CAG GTT CTC CGT GCT GGA GCA   529 Ala Ser Gln Ala Gln Pro Gly Gln Gln Gln Val Leu Arg Ala Gly Ala

                 165                 170                 175 GGT CAG CGT CCT CTT ACT CCC AAT CAG GGT CAG CAA GGG CAG CAA GCA   577 Gly Gln Arg Pro Leu Thr Pro Asn Gln Gly Gln Gln Gly Gln Gln Ala

             180                  185                190 GAA TCA CTT GCG GCA GCT GCA GCA GCA AAT CCA ACA TTG GCT TTT GGT   625 Glu Ser Leu Ala Ala Ala Ala Ala Ala Asn Pro Thr Leu Ala Phe Gly

         195                 200                 205 CAG GGT CTT GCT ACT GGC ATG CCA GGC TAT CAA GTA CTA GCT CCA ACT   673 Gln Gly Leu Ala Thr Gly Met Pro Gly Tyr Gln Val Leu Ala Pro Thr

     210                 215                 220 GCC TAT TAT GAT CAG ACT GGT GCC TTA GTG GTT GGC CCT GGA GCA AGG   721 Ala Tyr Tyr Asp Gln Thr Gly Ala Leu Val Val Gly Pro Gly Ala Arg 225                 230                 235                 240 ACT GGC CTT GGA GCT CCA GTT CGG TTA ATG GCT CCA ACA CCT GTT TTA   769 Thr Gly Leu Gly Ara Pro Val Arg Leu Met Ala Pro Thr Pro Val Leu

                 245                 250                 255 ATT AGT TCA GCA GCA GCA CAA GCT GCA GCA GCA GCA GCA GCT GGA GGA   817 Ile Ser Ser Ala Ala Ala Gln Ala Ala Ala Ala Ala Ala Ala Gly Gly

              260                 265                 270 ACT GCA AGT AGC CTT ACA GGC AGC ACA AAT GGT CTG TTT CGG CCA ATT   865 Thr Ala Ser Ser Leu Thr Gly Ser Thr Asn Gly Leu Phe Arg Pro Ile

         275                 280                 285 GGC ACT CAG CCA CCA CAG CAG CAG CAA CAG CAG CCA AGC ACT AAT CTG   913 Gly Thr Gln Pro Pro Gln Gln Gln Gln Gln Gln Pro Ser Thr Asn Leu

     290                 295                 300 CAA TCT AAT TCA TTT TAT GGA AGC AGT TCT TTG ACT AAT AGC TCC CAG   961 Gln Ser Asn Ser Phe Tyr Gly Ser Ser Ser Leu Thr Asn Ser Ser Gln 305                 310                 315                 320 AGT AGT TCT TTA TTT TCT CAT GGA CCT GGT CAA CCT GGA AGT ACA TCT  1009 Ser Ser Ser Leu Phe Ser His Gly Pro Gly Gln Pro Gly Ser Thr Ser

                 325                 330                 335 CTT GGC TTT GGA AGT GGT AAC TCT TTG GGT GCT GCT ATA GGC TCA GCC  1057 Leu Gly Phe Gly Ser Gly Asn Ser Leu Gly Ala Ala Ile Gly Ser Ala

             340                 345                 350 CTC AGT GGA TTT GGT TCA TCA GTT GGC AGT TCT GCA AGT AGT AGT GCC  1105 Leu Ser Gly Phe Gly Ser Ser Val Gly Ser Ser Ala Ser Ser Ser Ala

         355                  360                365 ACA AGG AGA GAG TCT CTA TCT ACT AGC TCT GAC TTG TAC AAA AGA TCT  1153 Thr Arg Arg Glu Ser Leu Ser Thr Ser Ser Asp Leu Tyr Lys Arg Ser

     370                 375                 380 AGT AGC AGC CTA GCA CCC ATA GGG CAA CCA TTT TAC AAT AGT CTG GGA  1201 Ser Ser Ser Leu Ala Pro Ile Gly Gln Pro Phe Tyr Asn Ser Leu Gly 385                 390                 395                 400 TTT TCC TCC TCT CCA AGT CCA ATA GGC ATG CCT CTG CCA AGC CAA ACT  1249 Phe Ser Ser Ser Pro Ser Pro Ile Gly Met Pro Leu Pro Ser Gln Thr

                 405                 410                 415 CCA GGA CAT TCA CTT ACG CCA CCG CCA TCA CTT TCA TCA CAT GGA TCC  1297 Pro Gly His Ser Leu Thr Pro Pro Pro Ser Leu Ser Ser His Gly Ser

            420                 425                 430TCA TCC AGT TTG CAT TTA GGA GGA CTG ACA AAT GGT AGT GGT CGA TAT   1345Ser Ser Ser Leu His Leu Gly Gly Leu Thr Asn Gly Ser Gly Arg Tyr

        435                 440                 445ATC TCT GCA GCA CCT GGA GCA GAA GCA AAA TAT CGA AGT GCT TCA AGC   1393Ile Ser Ala Ala Pro Gly Ala Glu Ala Lys Tyr Arg Ser Ala Ser Ser

    450                 455                 460ACT TCC AGT CTA TTT AGC TCC ACC AGC CAG CTC TTT CCT CCT TCC CGG   1441Thr Ser Ser Leu Phe Ser Ser Ser Ser Gln Leu Phe Pro Pro Ser Arg465                 470                 475                 480CTT CGG TAT AAT AGG TCT GAT ATT ATG CCT TCT GGC CGC AGT AGA TTA   1489Leu Arg Tyr Asn Arg Ser Asp Ile Met Pro Ser Gly Arg Ser Arg Leu

                485                 490                 495TTG GAA GAT TTC AGA AAC AAC CGC TTC CCA AAC CTT CAG CTT AGA GAC   1537Leu Glu Asp Phe Arg Asn Asn Arg Phe Pro Asn Leu Gln Leu Arg Asp

            500                 505                 510TTG ATT GGA CAT ATA GTT GAG TTT TCT CAA GAC CAG CAT GGT TCT AGA   1585Leu Ile Gly His Ile Val G1u Phe Ser Gln Asp Gln His Gly Ser Arg

        515                  520                525TTC ATA CAG CAA AAA CTA GAG AGA GCT ACT CCA GCT GAG CGA CAG ATG   1633Phe Ile Gln Gln Lys Leu Glu Arg Ala Thr Pro Ala Glu Arg Gln Met

    530                 535                 540GTA TTT AAT GAA ATT CTG CAA GCA GCC TAT CAA TTA ATG ACT GAT GTT   1681Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln Leu Met Thr Asp Val545                 550                 555                 560TTT GGC AAC TAT GTT ATA CAG AAG TTT TTT GAG TTT GGG AGT CTG GAT   1729Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly Ser Leu Asp

                565                 570                 575CAA AAA TTA GCC CTG GCT ACT CGT ATT CGT GGT CAT GTT CTA CCC TTA   1777Gln Lys Leu Ala Leu Ala Thr Arg Ile Arg Gly His Val Leu Pro Leu

            580                 585                 590GCC TTG CAG ATG TAT GGC TGC CGC GTT ATT CAG AAA GCA TTA GAA TCT   1825Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln Lys Ala Leu Glu Ser

        595                 600                 605ATT TCT TCT GAC CAG CAG AGT GAA ATG GTA AAG GAG CTG GAT GGT CAT   1873Ile Ser Ser Asp Gln Gln Ser Glu Met Val Lys Glu Leu Asp Gly His

    610                 615                 620GTG CTC AAA TGT GTG AAA GAT CAG AAT GGA AAC CAT GTT GTA CAA AAA   1921Val Leu Lys Cys Val Lys Asp Gln Asn Gly Asn His Val Val Gln Lys625                 630                 635                 640TGT ATC GAA TGT GTT CAG CCA CAG TCA CTA CAG TTC ATC ATT GAT GCT   1969Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln Phe Ile Ile Asp Ala

                645                 650                 655TTC AAG GGA CAA GTA TTT GTG CTT TCA ACT CAT CCT TAT GGC TGC AGA   2017Phe Lys Gly Gln Val Phe Val Leu Ser Thr His Pro Tyr Gly Cys Arg

            660                 665                 670GTA ATT CAG CGC ATC CTA GAG CAT TGC ACT GCA GAA CAG ACC TTA CCT   2065Val Ile Gln Arg Ile Leu Glu His Cys Thr Ala Glu Gln Thr Leu Pro

        675                 680                 685ATC TTA GAA GAA CTC CAC CAA CAT ACA GAG CAG TTG GTA CAG GAT CAG   2113Ile Leu Glu Glu Leu His Gln His Thr Glu Gln Leu Val Gln Asp Gln

    690                  695                700TAT GGC AAT TAT GTT ATT CAG CAT GTA CTG GAA CAC GGT CGA CCT GAA   2161Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu His Gly Arg Pro Glu705                 710                 715                 720GAC AAG AGC AAA ATT GTT TCC GAA ATC AGG GGA AAG GTT TTA GCC CTG   2209Asp Lys Ser Lys Ile Val Ser Glu Ile Arg Gly Lys Val Leu Ala Leu

                725                 730                 735AGT CAA CAC AAA TTT GCC AGC AAT GTA GTA GAA AAG TGT GTT ACT CAT   2257Ser Gln His Lys Phe Ala Ser Asn Val Val Glu Lys Cys Val Thr His

             740                 745                 750 GCC TCC CGT GCT GAG AGA GCT TTA CTG ATT GAC GAG GTT TGC TGC CAG        2305 Ala Ser Arg Ala Glu Arg Ala Leu Leu Ile Asp Glu Val Cys Cys Gln

         755                 760                 765 AAT GAT GGT CCT CAC AGT GCC TTA TAC ACC ATG ATG AAG GAC CAG TAT        2353 Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met Met Lys Asp Gln Tyr

     770                 775                 780 GCC AAT TAC GTG GTT CAA AAG ATG ATT GAT ATG GCT GAA CCT GCT CAG        2401 Ala Asn Tyr Val Val Gln Lys Met Ile Asp Met Ala Glu Pro Ala Gln 785                 790                 795                 800 AGA AAG ATA ATC ATG CAC AAG ATT CGA CCT CAC ATT ACT ACT TTG CGC        2449 Arg Lys Ile Ile Met His Lys Ile Arg Pro His Ile Thr Thr Leu Arg

                 805                 810                 815 AAA TAC ACA TAC GGG AAG CAT ATA CTG GCC AAG TTG GAA AAG TAT TAT        2497 Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys Leu Glu Lys Tyr Tyr

             820                 825                 830 TTG AAG AAT AGC CCG GAC CTA GGA CCT ATT GGA GGA CCA CCA AAT GGA        2545 Leu Lys Asn Ser Pro Asp Leu Gly Pro Ile Gly Gly Pro Pro Asn Gly

         835                 840                 845 ATG CTG TAAATTACAG GAGCAAGAGA AAGAAGATAA TTTAACCATG TGAAAAGAAT         2601Met Leu

    850                                                                      TTTTTTGTGC  GTGAATTATC  AAAACACAAC  TCAACTATGA  ATCTTCAATT  TTTTTTTAAA  2661GCAAAACTAT  TTATTGACTT  TATTCATCCA  TTTGTAAATT  TTTTAAGGTT  CTTGTGTATA  2771TTTGGGGGGT  GGGGGATGAA  TTATAAATTA  TATTCAGCCC  TGAGTGGAGA  CCTATCAGAT  2781TGGATTGCTG  GCAAAGCACA  GAATGCCTGT  ATATGATGTA  ACTGTATCAA  AAATAAAAAG  2841CTGTCACATA  TTTTGTAAAT  TTTTACCTTG  TAAAGTCACA  AAAATAGTTT  TTAAAGGAAA  2901AAGTACAGTA  TTCTTTTAAT  AAACTGGCTC  ACAGTCTGGT  AGGTCTACAA  CCCCATAGCA  2961CAACAGGTTT  ATAGAGATGT  ATATAGAATT  ATAGTCCTTA  TTTTTTTCCT  TTGCGTGAAA  3021CCTTTTATAA  CAGATTAACA  ATCAACTGCA  TAAATATTAT  TAATATTTTA  AAAAGAGTTA  3081AGTTGTATTT  TGATAATTCA  CAAACTATCA  TGCAAATAAC  GAGTAAGTAG  ACAAGAATAA  3141AGTGGTTTGA  GATGAAAAGA  ACCTAACATT  ATTTACAGTA  GATGTGGTTT  TAATACAATT  3201ACTGCCCTAA  AATGTCTCTG  GCAATGTACA  GAAATATTGT  ATATACTTAC  ATATGTAATT  3261GTTGTAAGAG  TTAAATACAA  AATCATGGTG  ACACTTCCAA  TTAAGTGCAC  TAAATGAAAA  3321GTTAAGTCAC  TTATTAACTT  TTCAGTTTGG  TTTGCAATGA  GAAAGAGTGG  AAATTTGTAT  3381TTTGTTTTGC  TTATAGAATT  ACAGACATGT  TGAGGAAGTG  TTGAGCTTTA  TTTTGCTTTT  3441TCATAGAGGC  AGAAAGTAGG  AACCAGATAG  AGATGAAAAG  GGGCCACTGA  AAAGTGAATT  3501TGATAGCTCA  GCATTTAAGC  ATGATTACAT  ATTCAGATAG  CTCTTTTTGC  TTTCTATAAA  3561TATATGCATT  GTGTGTGTAG  TAATAGATGT  AAGTTTACAC  TTTGAAAGGA  AATCTTGTTT  3621CAATGTTTAT  TATAAAAGCC  TTGCTAATTT  AGTAGTGATG  CTTTCCTTGG  TTGTACAGGT  3681GTACATTTGT  AAACCTTCAT  GCTGTAAATG  GAATTTGTTT  TATCTCTTTG  GGATACATTT  3741GCATTTTAGT  GTACATTTAC  GTCCCTGCCC  TCTTTGACCT  GGCAATATAG  TGTTGTATAA  3801TGTAAATTTA  TTTCTCCAAA  TCGAGAGTGA  TTTTTTAAAA  ATTTTTTATC  TTTATATGGT  3861TTCAGAAGTA  TGAACCAGCT  TTCTTTTTAT  TATTGTGAGA  TCATTTTGTT  TTATAACATA  3921GTTGTTGACT  GTTAATATGG  ACCTGCTAGA  ATTTGGATCA  CTTTCAATTG  AAGTCAGGGT  3981ATTGTGCATA  ATAGAAAGTA  TTGGACTGAG  ATATTTGGTT  ACCATGGAGG  CCAATGCTTT  4041TTTCATCTTA  TTAAATGTGA  TGTGACTTTT  TTCTTTGTAC  AGAAGAGTAC  TGTATTTTTG  4101AATAGCCTAC  TCCCAAGTAA  GAGCAAATCT  GTATGATAAC  ATTTTTTCCT  CTGGACATAA  4161GACATAACAG  TAACACGATG  TACATTTACA  AGCGGCCTTA  TGTACATTTC  CCAACAATCT  4221TTTTAAGGCA  AAATTGTGAC  CATATGTGTA  TAATTAAAAT  CGTTTTTAAT  CCTTTGCCTA  4281TGAAAATATT  TTGGAAAAAA  ACTTGCTGTG  TATATTCAGT  TTCTGAAAGA  TAAAGAAAGT  4341GCTTTGTATT  TTGTTGAAGT  CAGTATTTTG  TATAAACATT  TATGTTGACC  CACTTATGTT  4401CAGTGCTGAA  AACTAAAATG  AACATGCTAT  TCTGTCAGCT  GAATATGGAA  GAGATCTTTT  4461TTTACTAGAG  ATCTGCAGAA  GAAACGCAAT  CTTCTGAGCA  CAATATGGAA  TCTAAAGGTT  4521TTATCACTTA  GTTGTTCATA  TTATGAACCT  AAAAATAATG  GCATAAAGTT  TGGGGATGCC  4581AGGCATACTT  TTTCATGTTT  GGTGTTGAGT  TATTTTACTT  TTCTAACCCA  ACATTCCTTG  4641GTGAGACCAT  TAAATCCAAA  CACTTGTCAC  CGTTCCTTCT  CATAGTCACT  CTGGGTCATC  4701AGCATGTCCC  AGTCACTGCA  GCAACGCCTT  GTGTTTGTTT  CATTTTTTTA  AAACCCACAC  4761AAAGCCGCTG  TCTCACTTTT  TCCTACTTTA  CCAACCTCAG  AGTATTTCGG  CCCGTATCGA  4821ACTTTTGTTC  TCAGTATCAG  CCCATGGTTT  CAGGATCAAA  GCTGTCATGT  TGGAGATTGG  4881TAATGGCTTT  CCTGTCTTTG  TACAGTTGAA  TTCCTAGTCT  TCCTTCATCC  TTGCCCTCTG  4941TTGGCACAGG  CATTATCTCT  GCAATTTTAG  AAAATGACAA  GTAGAGAATA  CTACATTGAG  5001AAACTAAACC  CTCTTCTTGG  GGTCCTGATA  CTCATTCCCA  TTTGTCCCAG  TGCTGACAAC  5061CCAATCTTCC  CAATACTTTC  AGGCCTGCTC  TACAAAAGTA  CCTGTTCTTG  TAGAAATTTT  5121ACAGTCTGCC  ATTTTGGGTG  CCCACCCCAA  TTTTTACCTT  TTAGTAAGTT  GGCATGAAAT  5181TTTGGTAAAA  TCTGAAAATC  ACATTTCAGA  ATAAAACAAT  TGGGCAAAAC  TACCTAGGCT  5241TTACTCTTGA  GTGTCTCCTT  TTGATAGGGA  TTGTTTCTGG  ACCAGTTTGT  CTAAGTCCTG  5301GCTCTTATTG  GTTCATATGA  AATAATGTTA  ACTTCACTTC  TTTGTATATT  ATGTATAAAT  5361TAGAAAATGA  AAAATGTGTG  AATAACATTG  TATGAAAT                            5399序列号：2序列长度：850序列类型：氨基酸拓朴学：线性序列种类：蛋白质起源生物名：人细胞株：KG-1Glu Phe Ser Asn Pro Glu Thr Gln Asn Leu Asp Ala Met Glu Gln Val 1               5                   10                  15Gly Leu Glu Ser Leu Gln Phe Asp Tyr Pro Gly Asn Gln Val Pro Met

            20                   25                 30Asp Ser Ser Gly Ala Thr Val Gly Leu Phe Asp Tyr Asn Ser Gln Gln

         35                  40                  45Gln Leu Phe Gln Arg Thr Asn Ala Leu Thr Val Gln Gln Leu Thr Ala

    50                  55                   60Ala Gln Gln Gln Gln Tyr Ala Leu Ala Ala Ala Gln Gln Pro His Ile65                  70                  75                  80Ala Gly Val Phe Ser Ala Gly Leu Ala Pro Ala Ala Phe Val Pro Asn

                85                  90                  95Pro Tyr Ile Ile Ser Ala Ala Pro Pro Gly Thr Asp Pro Tyr Thr Ala

             100                 105                 110 Ala Gly Leu Ala Ala Ala Ala Thr Leu Ala Gly Pro Ala Val Val Pro

         115                 120                 125 Pro Gln Tyr Tyr Gly Val Pro Trp Gly Val Tyr Pro Ala Asn Leu Phe

     130                 135                 140 Gln Gln Gln Ala Ala Ala Ala Ala Asn Asn Thr Ala Ser Gln Gln Ala 145                 150                 155                 160 Ala Ser Gln Ala Gln Pro Gly Gln Gln Gln Val Leu Arg Ala Gly Ala

                 165                 170                 175 Gly Gln Arg Pro Leu Thr Pro Asn Gln Gly Gln Gln Gly Gln Gln Ala

             180                 185                 190 Glu Ser Leu Ala Ala Ala Ala Ala Ala Asn Pro Thr Leu Ala Phe Gly

         195                 200                 205 Gln Gly Leu Ala Thr Gly Met Pro Gly Tyr Gln Val Leu Ala Pro Thr

     210                 215                 220 Ala Tyr Tyr Asp Gln Thr G1y Ala Leu Val Val Gly Pro Gly Ala Arg 225                 230                 235                 240 Thr Gly Leu Gly Ala Pro Val Arg Leu Met Ala Pro Thr Pro Val Leu

                 245                 250                 255 Ile Ser Ser Ala Ala Ala Gln Ala Ala Ala Ala Ala Ala Ala Gly Gly

             260                 265                 270 Thr Ala Ser Ser Leu Thr Gly Ser Thr Asn Gly Leu Phe Arg Pro Ile

         275                 280                 285 Gly Thr Gln Pro Pro Gln Gln Gln Gln Gln Gln Pro Ser Thr Asn Leu

     290                 295                 300 Gln Ser Asn Ser Phe Tyr Gly Ser Ser Ser Leu Thr Asn Ser Ser Gln 305                 310                 315                 320 Ser Ser Ser Leu Phe Ser His Gly Pro Gly Gln Pro Gly Ser Thr Ser

                 325                 330                 335 Leu Gly Phe Gly Ser Gly Asn Ser Leu Gly Ala Ala Ile Gly Ser Ala

             340                 345                 350 Leu Ser Gly Phe G1y Ser Ser Val Gly Ser Ser Ala Ser Ser Ser Ala

         355                 360                 365 Thr Arg Arg Glu Ser Leu Ser Thr Ser Ser Asp Leu Tyr Lys Arg Ser

     370                 375                 380 Ser Ser Ser Leu Ala Pro Ile Gly Gln Pro Phe Tyr Asn Ser Leu Gly 385                 390                 395                 400 Phe Ser Ser Ser Pro Ser Pro Ile Gly Met Pro Leu Pro Ser Gln Thr

                 405                 410                 415 Pro Gly His Ser Leu Thr Pro Pro Pro Ser Leu Ser Ser His Gly Ser

             420                 425                 430 Ser Ser Ser Leu His Leu Gly Gly Leu Thr Asn Gly Ser Gly Arg Tyr

         435                 440                 445 Ile Ser Ala Ala Pro Gly Ala Glu Ala Lys Tyr Arg Ser Ala Ser Ser

     450                 455                 460 Thr Ser Ser Leu Phe Ser Ser Ser Ser Gln Leu Phe Pro Pro Ser Arg 465                 470                  475                480 Leu Arg Tyr Asn Arg Ser Asp Ile Met Pro Ser Gly Arg Ser Arg Leu

                 485                 490                 495 Leu Glu Asp Phe Arg Asn Asn Arg Phe Pro Asn Leu Gln Leu Arg Asp

             500                 505                 510 Leu Ile Gly His Ile Val Glu Phe Ser Gln Asp Gln His Gly Ser Arg

         515                 520                 525 Phe Ile Gln Gln Lys Leu Glu Arg Ala Thr Pro Ala Glu Arg Gln Met

     530                 535                 540 Val Phe Asn Glu Ile Leu Gln Ala Ala Tyr Gln Leu Met Thr Asp Val 545                 550                 555                 560 Phe Gly Asn Tyr Val Ile Gln Lys Phe Phe Glu Phe Gly Ser Leu Asp

                 565                 570                 575 Gln Lys Leu Ala Leu Ala Thr Arg Ile Arg Gly His Val Leu Pro Leu

            580                 585                 590Ala Leu Gln Met Tyr Gly Cys Arg Val Ile Gln Lys Ala Leu Glu Ser

        595                 600                 605Ile Ser Ser Asp Gln Gln Ser Glu Met Val Lys Glu Leu Asp Gly His

    610                 615                 620Val Leu Lys Cys Val Lys Asp Gln AsnGly Asn His Val Val Gln Lys625                 630                635                 640Cys Ile Glu Cys Val Gln Pro Gln Ser Leu Gln Phe Ile Ile Asp Ala

                645                 650                 655Phe Lys Gly Gln Val Phe Val Leu Ser Thr His Pro Tyr Gly Cys Arg

            660                 665                 670Val Ile Gln Arg lle Leu Glu His Cys Thr Ala Glu Gln Thr Leu Pro

        675                 680                 685Ile Leu Glu Glu Leu His Gln His Thr Glu Gln Leu Val Gln Asp Gln

    690                 695                 700Tyr Gly Asn Tyr Val Ile Gln His Val Leu Glu His Gly Arg Pro Glu705                 710                  715                720Asp Lys Ser Lys Ile Val Ser Glu Ile Arg Gly Lys Val Leu Ala Leu

                725                 730                 735Ser Gln His Lys Phe Ala Ser Asn Val Val Glu Lys Cys Val Thr His

            740                  745                 750Ala Ser Arg Ala Glu Arg Ala Leu Leu Ile Asp Glu Val Cys Cys Gln

        755                 760                 765Asn Asp Gly Pro His Ser Ala Leu Tyr Thr Met Met Lys Asp Gln Tyr

    770                 775                 780Ala Asn Tyr Val Val Gln Lys Met Ile Asp Met Ala Glu Pro Ala Gln785                 790                 795                 800Arg Lys Ile Ile Met His Lys Ile Arg Pro His Ile Thr Thr Leu Arg

                805                 810                 815Lys Tyr Thr Tyr Gly Lys His Ile Leu Ala Lys Leu Glu Lys Tyr Tyr

            820                 825                 830Leu Lys Asn Ser Pro Asp Leu Gly Pro Ile Gly Gly Pro Pro Asn Gly

        835                 840                 845Met Leu

    850序列号：3序列长度：50序列类型：核酸链数：单链拓朴学：线性序列种类：其它核酸、合成DNA序列CTCTAGAGGC GGCCGCTTTT TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT         50   序列号：4序列长度：17序列类型：核酸链数：单链拓朴学：线性序列种类：其它核酸、合成DNA序列GTTTTTTTTT  TTTTTTC                                            17序列号：5序列长度：10序列类型：核酸链数：单链拓朴学：线性序列种类：其它核酸、合成DNA序列AGGGCGTAAG                                                    10序列号：6序列长度：22序列类型：核酸链数：单链拓朴学：线性序列种类：其它核酸、合成DNA序列GCATGCCTAT TGGACTTGGG GA                                           22序列号：7序列长度：24序列类型：核酸链数：单链拓朴学：线性序列种类：其它核酸、合成DNA序列GTTGGCAGTT CTGCAAGTAG TAGT                                         24序列号：8序列长度：22序列类型：核酸链数：单链拓朴学：线性序列种类：其它核酸、合成DNA序列CCCATCACCA  TCTTCCAGGA  GC                                         22序列号：9序列长度：26序列类型：核酸链数：单链拓朴学：线性序列种类：其它核酸、合成DNA序列TTCACCACCT  TCTTGATGTC  ATCATA                                     26