与抗癌基因编码产物PRB相作用的人类基因PRB

摘要
申请专利号：	CN99119915.4	申请日：	1999.10.29
公开号：	CN1261105A	公开日：	2000.07.26
当前法律状态：	撤回	有效性：	无权
法律详情：	发明专利申请公布后的视为撤回\|\|\|公开\|\|\|实质审查的生效申请日:1999.10.29
IPC分类号：	C12N15/12; C07K14/435; C07H21/00	主分类号：	C12N15/12; C07K14/435; C07H21/00
申请人：	中国科学院上海生物化学研究所;
发明人：	敖世洲; 闻宏
地址：	200031上海市岳阳路320号
优先权：
专利代理机构：	上海华东专利事务所	代理人：	费开逵
PDF下载：	PDF下载

内容摘要

本发明涉及一种与抗癌基因编码产物pRB相作用的人体蛋白质编码基因pRb－BP125,它的cDNA由4335个核苷酸组成,编码序列编码838个氨基酸组成的蛋白质。它在人体的正常组织中广泛表达。pRb－BP125基因定位在第16号染色体p11.2－11.1区段。

权利要求书

1：一种与抗癌基因编码产物pRB相作用的人体蛋白质编码基因pRb- BP125，其特征在于它具有如序列表SEQ ID NO：3所示的核苷酸序列和如序列表SEQ ID NO：4所示的氨基酸序列。

说明书

与抗癌基因编码产物pRB相作用的人类基因pRb-BP125
    本发明涉及与抗癌基因编码产物pRB相作用的人体蛋白质编码基因pRb-BP125及它在人体各组织中的表达和在染色体上的定位，以探索肿瘤诊断和治疗的新途径。

    Rb基因是人类报道最早的肿瘤抑制基因，其正常的编码蛋白不仅是一种重要的细胞增殖抑制因子，还广泛参与了细胞分化、细胞凋亡、抑制肿瘤形成等多种复杂的生理过程(Mulligan，G.，TIG，1998，14：223-229；Knudsen，E.S.et al.，Genes & Dev.，1998，12：2278-2292；Luo，R.X.，et al.，Cell，1998，92：463-473；Macleod，K.，Curr.Opin.Genet.Dev.，1999，9(1)：31-39)其核心环节就是DNA与蛋白质，蛋白质与蛋白质相互作用，Rb发生作用主要是通过影响转录来实现的，它通过与多种转录因子的相互作用对转录发生正调控或负调控。

    正常的Rb具有抑癌功能，但Rb基因的一些缺失或突变所造成的突变体由于丧失了对细胞增殖、分化等的正常控制而导致细胞癌变。常见的由于Rb突变所导致的肿瘤有视网膜母细胞瘤、骨肉瘤、小细胞肺癌、前列腺癌和膀胱癌(Paggi，M.G.，et al.，J.Cell Biochem.，1996，62：418-430)。此外，Rb还是一些小的DNA肿瘤病毒的病毒抗原(如腺病毒的E1A蛋白、SV40的大T抗原)地早期作用因子。因此，Rb与各蛋白质因子之间的相互作用显得尤为重要，已成为人们注意的焦点。过去几年来，人们已经克隆了许多编码产物能够与pRB相作用的基因(Weinberg，R.A.，Science，1991，254：1138-1146；Cavanaugh，A.H.，et al.，Nature，1995，374：177-180；Wang，C.Y.，et al.，Science，1993，260：1330-1335；Dunaief，J.L.，et al.，Cell，1994，79：119-130；Woitach，J.T.，et al.，Nat.Genet.，1998，19(4)：371-374；Simons，A.，et al.，Oncogene，1997，14(2)：145-155)，一方面研究这些因子的结构特征，寻找它们与pRB的作用规律，另一方面致力于研究它们的功能。这两方面的研究为阐明pRB参与细胞各项生理过程的调控机制奠定了基础。同时研究Rb与其他蛋白质因子的相互作用，有助于探讨肿瘤的发病机制，为肿瘤的诊断和治疗提供新的设想和方案。

    酵母双杂交系统是近年来发展起来的一种在体内研究蛋白质之间相互作用的体系(Chien，C.T，et al.Proc.Acad.SCi.USA，1991，88：9578-9582)该系统的原理是基于酵母中的一种转录因子GAL4功能的重建。GAL4分子含有两个相对独立的功能域：DNA结合区和转录激活区。把欲验证存在相互作用的两个蛋白质(X和Y)的基因分别与GAL4的DNA结合区和转录激活区融合，再将这两个融合表达载体转入特殊的酵母细胞中，此酵母菌的染色体上，已整合了可被GAL4的DNA结合区所识别并结合的位点及下游报告基因(HIS3或LacZ)，如果两个蛋白质之间发生相互作用，报告基因就能表达。蛋白质Y也可是一个基因文库，这样就可以从中筛选与蛋白质X相互作用的新蛋白质基因。

    为此，本发明的目的是提供一种能与抗癌基因编码产物pRB相作用的人体蛋白质编码基因pRb-BP125全长cDNA序列，并表明它在16种正常人组织中表达水平及在染色体上的定位，在肿瘤的诊断和治疗上具有潜在的应用意义。

    本发明是一种与抗癌基因编码产物pRB相作用的人类新基因pRb-BP125，它是根据上述情况，利用pRB融合GAL4的DNA结合区，作为蛋白质X，以人胎脑cDNA文库融合GAL4的转录激活区为蛋白质Y，筛选到了一个人类新基因pRb-BP12.5。经原位杂交方法钓到了全长cDNA片段，测定了全序列，并进行了染色体定位和在16种正常人组织中的Northern杂交分析，为研究pRB的作用原理开辟了新的途径。

    本发明以pRB为靶分子，利用酵母双向杂交系统从人胎脑cDNA文库中筛选到多个阳性克隆，测定各阳性克隆的cDNA序列，得到一个长度为657bp的cDNA序列(序列表SEQ ID NO：1)，该cDNA序列编码一个219个氨基酸的肽段(序列表SEQ ID NO：2)。Northern杂交的结果表明，该基因全长mRNA约为4.5kb。以上述657bp的cDNA片段为探针，从HeLa细胞cDNA文库中获得了长约4.5kb的克隆片段(图1)。测定核苷酸序列后，确定pRb-BP125基因cDNA全长为4335bp(序列表SEQ ID NO：3)。其中5’非翻译区为112bp，编码区为2517bp，编码838个氨基酸组成的蛋白质(序列表SEQ ID NO：4)，3’非翻译区为1706bp。

    该基因的编码产物N端区(109-113位氨基酸)存在一个RB结合蛋白所特有的LxCxE结合模体(motif)，中部有入核序列(606-612和715-731位氨基酸)。经数据库检索，显示它与KIA0661蛋白编码基因可能属于mRNA前体选择性剪接的不同产物。

    进行16种正常人组织mRNA的Northern杂交分析，结果表明该基因在各种组织中广泛表达(图2)。其中在睾丸、心脏和胰脏组织中表达量最高。在胎盘、胸腺、脑、肝脏、肾脏、脾脏、骨胳肌、卵巢、小肠、结肠、前列腺、肺和外周血白细胞中都有一定表达。

    本发明还利用辐射杂交细胞系法(Radiation hybrid，简称RH)进行了pRb-BP125基因的染色体定位分析。在pRb-BP125基因3′非编码区合成一对引物(序列表SEQ ID NO：5)，对RH Mapping Kit中的83个辐射杂交细胞株的模板进行PCR反应，实验结果在计算机中进行连锁和统计分析，将该基因定位于第16号染色体的p11.2-11.1区段。

    本发明的优点与功能：

    1、提供一种全新的pRb-BP125基因的cDNA序列，它的编码产物能与抗癌基因的产物pRB相作用，在肿瘤的诊断和治疗上具有潜在的应用意义。

    2、pRb-BP125编码的蛋白产物含有核定位序列，可能为一种转录调控因子，有可能成为基因工程的产品。

    3、pRb-BP125在16种正常人组织中广泛表达，显示该基因在细胞内具有重要功能作用，可作为诊断指标。

    4、本发明已将pRb-BP125基因定位在16号染色体的p11.2-11.1区段，宜进行染色体上基因的连锁分析，应用于疾病的诊断。

    本发明通过以下附图和实施例作进一步阐述，但并不限制本发明的范围。

    附图说明：

    图1.pRb-BP125 cDNA片段的克隆、全序测定的战略及限制性内切酶的切点

    图中331-987代表序列表SEQ ID NO：1中的核苷酸序列

    图2.以pRb-BP125为探针，人不同组织mRNA的Northern杂交

    图中：  1.心脏    2.脑       3.胎盘     4.肺脏

            5.肝脏    6.骨胳肌   7.肾脏     8.胰脏

            9.脾脏    10.胸腺    11.前列腺  12.睾丸

           13.卵巢    14.小肠    15.结肠    16.外周血白细胞

    实施例1  酵母双向杂交系统筛选pRb-BP125 cDNA片段

    将pRB与GAL4 DNA结合结构域融合的表达质粒和人胎脑cDNA文库与GAL4转录激活结构域融合的表达质粒(均购自CLontech公司)共转化于酵母HF7c中。靶蛋白质粒的营养筛选标记为TRPl基因，文库质粒的营养筛选标记为LEU2基因，如果靶蛋白与被检测蛋白之间有相互结合，就激活HF7c中报告基因HIS3的表达，因此细胞就能在缺少Leu、Trp和His的基本培养基上生长。在1.5×106个转化子(在L-和W-平板上)中获得295个能在SD(W-L-H-)平板上生长的转化子。为了排除假阳性克隆，测定这些克隆的半乳糖苷酶活力，发现有57个克隆在X-gal平板上显蓝色。将阳性转化子接种于缺少Leu的培养液中培养，抽取质粒DNA，转化大肠杆菌，再制备质粒DNA。将该质粒与靶蛋白质粒转化到另一酵母菌株SFY526中，在X-gal平板上均显蓝色，表明有半乳糖苷酶活力，证明确为阳性克隆。对57个阳性克隆中的cDNA文库质粒分别进行限制性内切酶图谱分析和部分DNA序列测定，57个阳性克隆仅代表6个独立的基因，其中一个cDNA片段长度为657bp(序列表SEQ ID NO：1)，将它命名为pRb-BP125。

    实施例2.  pRb-BP125全长cDNA的克隆和测序

    以上述657bp cDNA片段为探针，按随机引物标记试剂盒(BoehringerMannheim公司)推荐的方法进行同位素标记，从HeLa细胞cDNA文库(Clontech公司)中筛选杂交克隆，噬菌斑原位杂交方法按cDNA文库说明书推荐方法进行。经三轮筛选，获得12个阳性克隆。对各个克隆进行限制酶切鉴定，其中两个克隆的长度约为4.5kb，可能为全长pRb-BP125 cDNA克隆(图1)。按照图1的限制性内切酶的切点，作不同长度的酶切片段：用EcoRI酶切得到全长约4.5Kb的片段；用EcoRI和SmaI酶切得到2Kb和约2.4K两种片段；用Hind III酶切取其中1Kb和2Kb的两种片段；用Sma I和Kpn I酶切取其中2Kb的片段，分别克隆到用相应限制性内切酶处理的pBSK质粒(Stratagene公司)中，以双脱氧终止法测定DNA序列(方法按Sambrook的Molecular cloning：A Laboratory Manual，2nd ed)。pRb-BP125 cDNA全长4335bp，5′非翻译区为112bp，编码区为2517bp，3′非翻译区为1706bp(序列表SEQ ID NO：3)。

    实施例3  pRb-BP125在人正常组织中表达分析

    将固定有人16种正常组织mRNA的尼龙膜(CLontech公司)，放入杂交管内，加入5ml 68℃预热的快速杂交液(CLontech公司)，68℃预杂交1小时，加入变性的同位素标记的pRb-BP125的0.6kb片段，68℃杂交2小时。取出杂交管洗膜，2×SSC，0.05％ SDS中室温10分钟，0.1×SSC，0.1％ SDS50℃洗两次，共30分钟。将膜置于滤纸上晾干，压片，即得图2。

    实施例4  pRb-BP125在染色体上的定位

    在pRb-BP125 cDNA的3′非编码区合成一对引物(SEQ ID NO：5)，对RH Mapping Kit(购自Stanford SHGC)中的83个辐射杂交细胞系的模板进行PCR反应：10μl体系，含25ng模板，1.5mM Mg2+，200μM dNTP，两种引物各8pM，1μl10×PCR Buffer，1U Taq酶，反应条件为95℃ 4分钟热启动后按94℃ 25秒，55℃ 30秒，72℃ 30秒的顺序进行35个循环的反应，最后在72℃继续延伸7分钟。电泳分析PCR结果，其PCR产物为310bp，有扩增产物的记为1，无扩增产物的记为0，按顺序将结果排成串，送到SHGC网站中在计算机中进行连锁和统计分析，找出与之连锁的已经定位的标记基因，从而将该基因定位于第16号染色体的p11.2-11.1区段。

                        序列表(1)一般信息

     (I)申请人：   中国科学院上海生物化学研究所

     (II)发明名称：与抗癌基因编码产物pRB相作用的人类基因pRb-BP125

     (III)序列数： 5(2)SEQ ID NO：1信息

    (I)序列特性：

       (A)长度：657个碱基对

       (B)类型：核酸

       (C)链型：双链

       (D)拓扑结构：线性

    (II)分子类型：cDNA

    (III)序列描述：SEQ ID NO：1：CCGAGAACGA   ATTGAGAAGT   TGGAGAAGCG   GCAGGCCACA   GATGATGCCA   CACTCCTCAT         60CGTCAATCGC   TACTGGGCCC   AGCTGGATGA   AACTGTGGAA   GCCCTTCTCC   GATGCCATGA        120GAGCCAGGGG   GAGCTGTCTT   CAGCGCCTGA   GGCACCTGGG   ACCCAGGAGG   GGCCAACATG        180TGATGGGACT   CCTCTCCCAG   AGCCGGGGAC   ATCAGAGCTG   AGAGACCCCT   TGCTGATGCA        240GCTGCGGCCC   CCTCTCAGTG   AGCCGGCCTT   GGCTTTTGTT   GGTGGCACTG   GGTGCAGCAG        300CAGTGAGGAG   GTGGAGCTGG   AGCTGCAAGG   CCGAATGGAG   TTCTCCAAGG   CAGCTGTGTC        360TCGTGTGGTA   GAGGCCTCAG   ACCGCCTACA   GCGCCGGGTG   GAGGAACTCT   GTCAGCGAGT        420GTACAGCCGA   GGGGACAGTG   AGCCCCTCAG   TGAGGCGGCT   CAGGCACACA   CCCGAGAGCT        480GGGCCGTGAG   AACCGGCGAC   TGCAGGACTT   GGCCACTCAG   CTGCAGGAGA   AACACCACCG        540CATCTCATTG   GAGTACTCCG   AGCTCCAGGA   TAAAGTGACA   TCGGCAGAGA   CCAAGGTGCT        600GGAGATGGAG   ACAACAGTGG   AGGACTTGCA   GTGGGACATC   GAGAAGCTGC   GGAAGCG           657(3)SEQ ID NO：2信息

    (I)序列特性：

       (A)长度：219个氨基酸

       (B)类型：氨基酸

       (C)链型：单链

       (D)拓扑结构：线性

    (II)分子类型：蛋白质

    (III)序列描述：SEQ ID NO：2：Arg Glu Arg Ile Glu Lys Leu Glu Lys Arg Gln Ala Thr Asp Asp   15Ala Thr Leu Leu Ile Val Asn Leu Tyr Trp Ala Gln Leu Asp Glu   30Thr Val Glu Ala Leu Leu Arg Cys His Glu Ser Gln Gly Glu Leu   45Ser Ser Ala Pro Glu Ala Pro Gly Thr Gln Glu Gly Pro Thr Cys   60Asp Gly Thr Pro Leu Pro Glu Pro Gly Thr Ser Glu Leu Arg Asp   75Pro Leu Leu Met Gln Leu Arg Pro Pro Leu Ser Glu Pro Ala Leu   90Ala Phe Val Val Ala Leu Gly Ala Ser Ser Ser Glu Glu Val Glu   105Leu Glu Leu Gln Gly Arg Met Glu Phe Ser Lys Ala Ala Val Ser   120Arg Val Val Glu Ala Ser Asp Arg Leu Gln Arg Arg Val Glu Glu   135Leu Cys Gln Arg Val Tyr Ser Arg Gly Asp Ser Glu Pro Leu Ser   150Glu Ala Ala Gln Ala His Thr Arg Glu Leu Gly Arg Glu Asn Arg   165Arg Leu Gln Asp Leu Ala Thr Gln Leu Gln Glu Lys His His Arg   180Ile Ser Leu Glu Tyr Ser Glu Leu Gln Asp Lys Val Thr Ser Ala   195Glu Thr Lys Val Leu Glu Met Glu Thr Thr Val Glu Asp Leu Gln   210Trp Asp Ile Glu Lys Leu Arg Lys Arg                           219(4)SEQ ID NO：3信息

    (I)序列特性：

       (A)长度：4335个碱基对

       (B)类型：核酸

       (C)链型：双链

       (D)拓扑结构：线性

    (II)分子类型：cDNA

    (III)序列描述：SEQ ID NO：3：GCGGCCGCGT   CGACGGCGGC   GCTAGGCTGA   CCCTCCTGCT   GGTGACGGAA   GTACCGCCTC      -51CTCCCGTCTG   ACGCCCCTCA   GGGGACCCTG   CATCGCTCCA   GCCGCCGCGG   CCATGTCTGG        8GCCAGGCAAC   AAACGCGCCG   CCGGCGACGG   GGGCTCAGGG   CCCCCGGAAA   AGAAGCTGAG       68TCGTGAGGAG   AAGACCACCA   CGACTCTTAT   CGAGCCCATT   CGTCTTGGAG   GCATCTCTTC      128CACGGAGGAG   ATGGACCTGA   AGGTACTACA   GTTCAAGAAC   AAGAAACTGG   CAGAGCGGCT      188GGAACAACGG   CAGGCTTGTG   AAGATGAACT   CCGAGAACGA   ATTGAGAAGT   TGGAGAAGCG      248GCAGGCCACA   GATGATGCCA   CACTCCTCAT   CGTCAATCTC   TACTGGGCCC   AGCTGGATGA      308AACTGTGGAA   GCCCTTCTCC   GATGCCATGA   GAGCCAGGGG   GAGCTGTCTT   CAGCGCCTGA      368GGCACCTGGG   ACCCAGGAGG   GGCCAACATG   TGATGGGACT   CCTCTCCCAG   AGCCGGGGAC      428ATCAGAGCTG   AGAGACCCCT   TGCTGATGCA   GCTGCGGCCC   CCTCTCAGTG   AGCCGGCCTT      488GGCTTTTGTG   GTGGCACTGG   GTGCCAGCAG   CAGTGAGGAG   GTGGAGCTGG   AGCTGCAAGG      548CCGAATGGAG   TTCTCCAAGG   CAGCTGTGTC   TCGTGTGGTA   GAGGCCTCAG   ACCGCCTACA      608GCGCCGGGTG   GAGGAACTCT   GTCAGCGAGT   GTACAGCCGA   GGGGACAGTG   AGCCCCTCAG      668TGAGGCGGCT   CAGGCACACA   CCCGAGAGCT   GGGCCGTGAG   AACCGGCGAC   TGCAGGACTT      728GGCCACTCAG   CTGCAGGAGA   AACACCACCG   CATCTCATTG   GAGTACTCCG   AGCTCCAGGA      788TAAAGTGACA   TCGGCAGAGA   CCAAGGTGCT   GGAGATGGAG   ACAACAGTGG   AGGACTTGCA      848GTGGGACATC   GAGAAGCTGC   GGAAGCGAGA   GCAAAAGCTC   AATAAGCACC   TGGCAGAGGC     1008CTTAGAGCAG   CTTAACTCTG   GCTACTATGT   ATCTGGGAGC   TCCTCAGGCT   TCCAGGGGGG     1068CCAGATCACA   CTCAGCATGC   AGAAGTTTGA   GATGCTGAAT   GCAGAGTTAG   AGGAAAACCA     1128GGAACTGGCC   AACAGCCGTA   TGGCAGAGCT   GGAGAAACTG   CAGGCCGAAC   TTCAGGGGGC     1188TGTGCGGACC   AATGAGCGCC   TCAAGGTGGC   CCTGCGGAGC   CTTCCTGAGG   AGGTAGTGCG     1248GGAGACGGGG   GAGTACCGCA   TGCTGCAGGC   CCAATTCTCA   CTGCTCTACA   ACGAGTCTCT     1308GCAAGTGAAG   ACCCAGCTAG   ACGAGGCTCG   GGGCCTGCTG   CTGGCCACAA   AGAACTCCCA     1368CCTGCGACAC   ATCGAGCACA   TGGAGAGCGA   CGAGCTGGGG   CTGCAGAAGA   AGCTACGCAC     1428AGAGGTCATT   CAGCTGGAGG   ACACGCTGGC   CCAGGTACGC   AAGGAGTATG   AGATGCTGCG     1488CATCGAGTTT   GAGCAGAATC   TGGCGGCCAA   CGAGCAGGCG   GGGCCCATCA   ACCGTGAGAT     1548GCGCCACCTG   ATTAGTAGTC   TTCAAAACCA   CAACCACCAG   CTAAAAGGGG   ACGCCCAGCG     1608ATACAAGCGG   AAGCTTCGAG   AAGTACAAGC   TGAGATTGGC   AAGCTCCGGG   CCCAGGCCAG     1668TGGCTCTGCC   CACTCCACCC   CCAACCTGGG   CCACCCAGAG   GATTCTGGCG   TCAGTGCCCC     1728AGCCCCAGGG   AAAGAGGAGG   GTGGGCCAGG   CCCTGTCAGT   ACCCCCGACA   ACAGAAAGGA     1788GATGGCTCCA   GTGCCTGGCA   CCACCACTAC   TACCACTTCA   GTGAAGAAGG   AGGAGCTGGT     1848

                                                                              后页续CCCCTCTGAA   GAGGACTTCC   AGGGTATAAC   CCCTGGGGCC   CAGGGCCCTT   CCTCCCGGGG     1908CCGAGAACCT   GAGGCCAGGC   CCAAGCGGGA   GCTTCGGGAA   CGGGAAGGTC   CCAGCCTAGG     1968ACCTCCACCT   GTAGCCTCCG   CTCTCTCAAG   GGCTGATCGG   GAGAAGGCCA   AGGTGGAAGA     2028AACCAAGCGG   AAGGAATCAG   AACTCCTCAA   GGGTCTCCGA   GCAGAGCTCA   AGAAGGCCCA     2088GGAGAGCCAG   AAGGAGATGA   AACTGCTGCT   GGATATGTAC   AAGTCAGCGC   CCAAGGAGCA     2148GCGGGATAAG   GTGCAGCTCA   TGGCAGCGGA   ACGCAAGGCT   AAGGCCGAGG   TTGATGAGCT     2208GCGGAGCCGC   ATCCGGGAAT   TGGAGGAGAG   GGATCGAAGG   GAGAGCAAGA   AGATCGCGGA     2268TGAGGATGCC   CTGCGGCGCA   TTCGGCAGGC   AGAGGAGCAG   ATAGAACACC   TGCAGCGCAA     2328GCTGGGTGCC   ACCAAGCAGG   AGGAGGAGGC   TCTGCTCTCA   GAGATGGATG   TGACAGGTCA     2388GGCTTTTGAG   GACATGCAGG   AACAGAACGG   GCGGCTGCTA   CAGCAGTTGC   GGGAAAAGGA     2448TGATGCCAAC   TTTAAGCTAA   TGTCAGAGCG   GATCAAGGCC   AACCAGATTC   ACAAGCTGCT     2508GCGGGAGGAG   AAGGATGAGT   TGGGCGAGCA   GGTCCTTGGC   CTCAAGTCCC   AGGTATGGCC     2568GCCGCCAGCT   TGCAGACTGG   AGCTGGAGAG   GTGGGGGTCA   TGGCCCTGAG   TCCTCCTCTG     2628GTCCTTAGGT   GGATGCCCAG   CTGCTGACTG   TGCAGAAGCT   GGAGGAGAAG   GAGCGAGCCT     2688TGCAGGGCAG   CCTCGGGGGT   GTGGAGAAGG   AGCTGACGCT   GCGCAGCCAA   GCCCTGGAGC     2748TCAACAAGCG   GAAGGCTGTA   GAAGCCGCCC   AGCTGGCCGA   GGACCTGAAG   GTGCAGCTGG     2808AGCACGTGCA   GACTCGGCTG   CGGGAGATCC   AGCCCTGCCT   GGCAGAGAGC   CGGGCTGCTC     2868GTGAGAAAGA   GAGCTTCAAC   CTCAAGAGGG   CTCAGGAGGA   CATCTCACGG   CTGCGGCGCA     2928AGCTGGAAAA   GCAGAGGAAG   GTGGAGGTCT   ACGCAGATGC   CGACGAAATC   CTCCAGGAGG     2988AGATCAAGGA   GTACAAGGCG   CGGTTGACCT   GCCCCTGCTG   TAACACCCGC   AAGAAGGATG     3048CAGTCCTTAC   CAAGTGCTTC   CACGTTTTCT   GCTTCGAGTG   CGTGCGGGGC   CGCTATGAGG     3108CCCGCCAGAG   GAAGTGCCCC   AAGTGCAACG   CGGGCTTTGG   TGCCCACGAC   TTGCATCGTA     3168TCTACATCAG   CTGAACCTGA   AACTCAGGGG   ACTCTGGAAC   ACCATGGACC   CTGGGGGCTG     3228TGCCCCCATC   TCCTCCCCAC   CCCAGGTCTA   GTGGCCCCAC   CCTCCATTCC   GGACCCCATG     3288GGCCCAGCCC   CTGCCCATCT   AGTTGGTTTG   GGGACCCTGG   TGCATGCTAG   TGGGCATGGG     3348ATCAGCCAAG   CTTCGTTCCA   TCTTTTCCTA   AAGGTCAGAG   CTGCAGCCTA   GGGGGCACTG     3408CCCTACAGAA   AAGGTCTGCC   TGAGAGGCCT   GAGGAGCCCA   GAGCACTTGA   CTGAGCTTCC     3468CGGAAACTGG   CCCTAACCTG   TCTGTCTCCG   TGGATGCATC   CTAACCCTAA   GGAAAATTCC     3528CCAGGCTGTG   ATCTACCCTA   GAGAAGGCTC   GCTCCCTGCC   TACTGGCTCA   CAAATGAGGA     3588CCAGTGAGCC   ATGTCCTTGT   TCCTTGTTTG   AGACTGGGCT   GCAGGCCCCA   GGAAGACTTT     3648CCTTCACCCA   CCATCCCCCT   AACCTCGGCA   GGGCTTCTGT   CCTGTGGAGT   TCCCTGGACA     3708CCTTGGTCTG   GCTCTTGTGC   CAAGGGCTGA   AGGAGGTACC   CTCTTGGCAG   ATGGGGGCAT     3768CACTTGCTTC   CTTTGGGAAG   CTCTAAGGTT   GCTGCAGTCA   CCTTCCTCAT   CTTGCAGGTG     3828CTGAACCAAC   ATCATCAGTT   TCTATTCTAA   TCAGGCCCCT   TCCCAATCTC   CATTTCTCTG     3888CCAAGCCCAT   TTACCCCCAC   CTCATGCATC   CCAAGGCTCT   ACTGGGTCCC   TGGACCTAAC     3948CCTGCTTTCA   TCCTGGTGGC   CTTAACTACA   GTGGAGGTGG   AACTTCCCAG   GAGGGGAAGG     4008GACAGACCAG   CCCCAGCCGC   TGGGCCAACT   TCCAATCATT   CCAGCTAGAA   GAGCTTCCCC     4068CTGACACCCT   GTGACTGAGC   CTGTGTCCTG   TCTGCCTGCC   CAGCCATGCT   CCATCGGCTG     4128TGAGGGCAGT   GCCCGGAGAG   GCCAGAGGGT   TGGAGCTGCA   GGGACCCGTT   TGGACCCACA     4188GCCTCTGTTC   TAGAGATGCT   TGTATAGGCT   GTTAATTGTG   ATGAATAAAC   GTTCAACCCT     4288CGGCCTGCAG   CCAGAGTAGC   CAGGCCGCGC   ACCCCAAAAA   AAAAAAAAAA   AAAAAAAAAA     4308AGTCGACGCG   GCCGC                                                              4323(5)SEQ ID NO：4信息

    (I)序列特性：

       (A)长度：838个氨基酸

       (B)类型：氨基酸

       (C)链型：单链

      (D)拓扑结构：线性

    (II)分子类型：蛋白质

    (III)序列特征1：109～113位为pRB结合蛋白所特有的结合模体(LxCxE，图中下划线的L、C和E为保守氨基酸)。

    (IV)序列特征2：606～612和715～731为核定位序列(图中用双重下划线表示)。

    (V)序列描述：SEQ ID NO：4：Met Ser Gly Pro Gly Asn Lys Arg Ala Ala Gly Asp Gly Gly Ser    15Gly Pro Pro Glu Lys Lys Leu Ser Arg Glu Glu Lys Thr Thr Thr    30Thr Leu Ile Glu Pro Ile Arg Leu Gly Gly Ile Ser Ser Thr Glu    45Glu Met Asp Leu Lys Val Leu Gln Phe Lys Asn Lys Lys Leu Ala    60Glu Arg Leu Glu Gln Arg Gln Ala Cys Glu Asp Glu Leu Arg Glu    75Arg Ile Glu Lys Leu Glu Lys Arg Gln Ala Thr Asp Asp Ala Thr    90Leu Leu Ile Val Asn Leu Tyr Trp Ala Gln Leu Asp Glu Thr Val   105Glu Ala Leu Leu Arg Cys His Glu Ser Gln Gly Glu Leu Ser Ser   120Ala Pro Glu Ala Pro Gly Thr Gln Glu Gly Pro Thr Cys Asp Gly   135Thr Pro Leu Pro Glu Pro Gly Thr Ser Glu Leu Arg Asp Pro Leu   150Leu Met Gln Leu Arg Pro Pro Leu Ser Glu Pro Ala Leu Ala Phe   165Val Val Ala Leu Gly Ala Ser Ser Ser Glu Glu Val Glu Leu Glu   180Leu Gln Gly Arg Met Glu Phe Ser Lys Ala Ala Val Ser Arg Val   195Val Glu Ala Ser Asp Arg Leu Gln Arg Arg Val Glu Glu Leu Cys   210Gln Arg Val Tyr Ser Arg Gly Asp Ser Glu Pro Leu Ser Glu Ala   225Ala Gln Ala His Thr Arg Glu Leu Gly Arg Glu Asn Arg Arg Leu   240Gln Asp Leu Ala Thr Gln Leu Gln Glu Lys His His Arg Ile Ser   255Leu Glu Tyr Ser Glu Leu Gln Asp Lys Val Thr Ser Ala Glu Thr   270Lys Val Leu Glu Met Glu Thr Thr Val Glu Asp Leu Gln Trp Asp   285Ile Glu Lys Leu Arg Lys Arg Glu Gln Lys Leu Asn Lys His Leu   300Ala Glu Ala Leu Glu Gln Leu Asn Ser Gly Tyr Tyr Val Ser Gly   315

                                                           后页续Ser Ser Ser Gly Phe Gln Gly Gly Gln Ile Thr Leu Ser Met Gln   330Lys Phe Glu Met Leu Asn Ala Glu Leu Glu Glu Asn Gln Glu Leu   345Ala Asn Ser Arg Met Ala Glu Leu Glu Lys Leu Gln Ala Glu Leu   360Gln Gly Ala Val Arg Thr Asn Glu Arg Leu Lys Val Ala Leu Arg   375Ser Leu Pro Glu Glu Val Val Arg Glu Thr Gly Glu Tyr Arg Met   390Leu Gln Ala Gln Phe Ser Leu Leu Tyr Asn Glu Ser Leu Gln Val   405Lys Thr Gln Leu Asp Glu Ala Arg Gly Leu Leu Leu Ala Thr Lys   420Asn Ser His Leu Arg His Ile Glu His Met Glu Ser Asp Glu Leu   435Gly Leu Gln Lys Lys Leu Arg Thr Glu Val Ile Gln Leu Glu Asp   450Thr Leu Ala Gln Val Arg Lys Glu Tyr Glu Met Leu Arg Ile Glu   465Phe Glu Gln Asn Leu Ala Ala Asn Glu Gln Ala Gly Pro Ile Asn   480Arg Glu Met Arg His Leu Ile Ser Ser Leu Gln Asn His Asn His   495Gln Leu Lys Gly Asp Ala Gln Arg Tyr Lys Arg Lys Leu Arg Glu   510Val Gln Ala Glu Ile Gly Lys Leu Arg Ala Gln Ala Ser Gly Ser   525Ala His Ser Thr Pro Asn Leu Gly His Pro Glu Asp Ser Gly Val   540Ser Ala Pro Ala Pro Gly Lys Glu Glu Gly Gly Pro Gly Pro Val   555Ser Thr Pro Asp Asn Arg Lys Glu Met Ala Pro Val Pro Gly Thr   570Thr Thr Thr Thr Thr Ser Val Lys Lys Glu Glu Leu Val Pro Ser   585Glu Glu Asp Phe Gln Gly Ile Thr Pro Gly Ala Gln Gly Pro Ser   600Ser Arg Gly Arg Glu Pro Glu Ala Arg Pro Lys Arg Glu Leu Arg   615Glu Arg Glu Gly Pro Ser Leu Gly Pro Pro Pro Val Ala Ser Ala   630Leu Ser Arg Ala Asp Arg Glu Lys Ala Lys Val Glu Glu Thr Lys   645Arg Lys Glu Ser Glu Leu Leu Lys Gly Leu Arg Ala Glu Leu Lys   660Lys Ala Gln Glu Ser Gln Lys Glu Met Lys Leu Leu Leu Asp Met   675Tyr Lys Ser Ala Pro Lys Glu Gln Arg Asp Lys Val Gln Leu Met   690Ala Ala Glu Arg Lys Ala Lys Ala Glu Val Asp Glu Leu Arg Ser   705Arg Ile Arg Glu Leu Glu Glu Arg Asp Arg Arg Glu Ser Lys Lys   720Ile Ala Asn Glu Asp Ala Leu Arg Arg Ile Arg Gln Ala Glu Glu   735Gln Ile Glu His Leu Gln Arg Lys Leu Gly Ala Thr Lys Gln Glu   750Glu Glu Ala Leu Leu Ser Glu Met Asp Val Thr Gly Gln Ala Phe   765Glu Asp Met Gln Glu Gln Asn Gly Arg Leu Leu Gln Gln Leu Arg   780Glu Lys Asp Asp Ala Asn Phe Lys Leu Met Ser Glu Arg Ile Lys   795Ala Asn Gln Ile His Lys Leu Leu Arg Glu Glu Lys Asp Glu Leu   810Gly Glu Gln Val Leu Gly Leu Lys Ser Gln Val Trp Pro Pro Pro   825Ala Cys Arg Leu Glu Leu Glu Arg Trp Gly Ser Trp Pro           838(6)SEQ ID NO：5信息

    (I)序列特性：

       (A)长度：22个碱基对

       (B)类型：核酸

       (C)链型：单链

       (D)拓扑结构：线性

    (II)分子类型：DNA(PCR引物)

    (III)序列描述：SEQ ID NO：5：

         5’引物： CCCTGCCTAC TGGCTCACAA AT  22

         3’引物： GGAAGGGGCC TGATTAGAAT AG  22

与抗癌基因编码产物PRB相作用的人类基因PRB－BP125.pdf