与抗癌基因编码产物pRB相作用的人类基因pRb-BP125 本发明涉及与抗癌基因编码产物pRB相作用的人体蛋白质编码基因pRb-BP125及它在人体各组织中的表达和在染色体上的定位,以探索肿瘤诊断和治疗的新途径。
Rb基因是人类报道最早的肿瘤抑制基因,其正常的编码蛋白不仅是一种重要的细胞增殖抑制因子,还广泛参与了细胞分化、细胞凋亡、抑制肿瘤形成等多种复杂的生理过程(Mulligan,G.,TIG,1998,14:223-229;Knudsen,E.S.et al.,Genes & Dev.,1998,12:2278-2292;Luo,R.X.,et al.,Cell,1998,92:463-473;Macleod,K.,Curr.Opin.Genet.Dev.,1999,9(1):31-39)其核心环节就是DNA与蛋白质,蛋白质与蛋白质相互作用,Rb发生作用主要是通过影响转录来实现的,它通过与多种转录因子的相互作用对转录发生正调控或负调控。
正常的Rb具有抑癌功能,但Rb基因的一些缺失或突变所造成的突变体由于丧失了对细胞增殖、分化等的正常控制而导致细胞癌变。常见的由于Rb突变所导致的肿瘤有视网膜母细胞瘤、骨肉瘤、小细胞肺癌、前列腺癌和膀胱癌(Paggi,M.G.,et al.,J.Cell Biochem.,1996,62:418-430)。此外,Rb还是一些小的DNA肿瘤病毒的病毒抗原(如腺病毒的E1A蛋白、SV40的大T抗原)地早期作用因子。因此,Rb与各蛋白质因子之间的相互作用显得尤为重要,已成为人们注意的焦点。过去几年来,人们已经克隆了许多编码产物能够与pRB相作用的基因(Weinberg,R.A.,Science,1991,254:1138-1146;Cavanaugh,A.H.,et al.,Nature,1995,374:177-180;Wang,C.Y.,et al.,Science,1993,260:1330-1335;Dunaief,J.L.,et al.,Cell,1994,79:119-130;Woitach,J.T.,et al.,Nat.Genet.,1998,19(4):371-374;Simons,A.,et al.,Oncogene,1997,14(2):145-155),一方面研究这些因子的结构特征,寻找它们与pRB的作用规律,另一方面致力于研究它们的功能。这两方面的研究为阐明pRB参与细胞各项生理过程的调控机制奠定了基础。同时研究Rb与其他蛋白质因子的相互作用,有助于探讨肿瘤的发病机制,为肿瘤的诊断和治疗提供新的设想和方案。
酵母双杂交系统是近年来发展起来的一种在体内研究蛋白质之间相互作用的体系(Chien,C.T,et al.Proc.Acad.SCi.USA,1991,88:9578-9582)该系统的原理是基于酵母中的一种转录因子GAL4功能的重建。GAL4分子含有两个相对独立的功能域:DNA结合区和转录激活区。把欲验证存在相互作用的两个蛋白质(X和Y)的基因分别与GAL4的DNA结合区和转录激活区融合,再将这两个融合表达载体转入特殊的酵母细胞中,此酵母菌的染色体上,已整合了可被GAL4的DNA结合区所识别并结合的位点及下游报告基因(HIS3或LacZ),如果两个蛋白质之间发生相互作用,报告基因就能表达。蛋白质Y也可是一个基因文库,这样就可以从中筛选与蛋白质X相互作用的新蛋白质基因。
为此,本发明的目的是提供一种能与抗癌基因编码产物pRB相作用的人体蛋白质编码基因pRb-BP125全长cDNA序列,并表明它在16种正常人组织中表达水平及在染色体上的定位,在肿瘤的诊断和治疗上具有潜在的应用意义。
本发明是一种与抗癌基因编码产物pRB相作用的人类新基因pRb-BP125,它是根据上述情况,利用pRB融合GAL4的DNA结合区,作为蛋白质X,以人胎脑cDNA文库融合GAL4的转录激活区为蛋白质Y,筛选到了一个人类新基因pRb-BP12.5。经原位杂交方法钓到了全长cDNA片段,测定了全序列,并进行了染色体定位和在16种正常人组织中的Northern杂交分析,为研究pRB的作用原理开辟了新的途径。
本发明以pRB为靶分子,利用酵母双向杂交系统从人胎脑cDNA文库中筛选到多个阳性克隆,测定各阳性克隆的cDNA序列,得到一个长度为657bp的cDNA序列(序列表SEQ ID NO:1),该cDNA序列编码一个219个氨基酸的肽段(序列表SEQ ID NO:2)。Northern杂交的结果表明,该基因全长mRNA约为4.5kb。以上述657bp的cDNA片段为探针,从HeLa细胞cDNA文库中获得了长约4.5kb的克隆片段(图1)。测定核苷酸序列后,确定pRb-BP125基因cDNA全长为4335bp(序列表SEQ ID NO:3)。其中5’非翻译区为112bp,编码区为2517bp,编码838个氨基酸组成的蛋白质(序列表SEQ ID NO:4),3’非翻译区为1706bp。
该基因的编码产物N端区(109-113位氨基酸)存在一个RB结合蛋白所特有的LxCxE结合模体(motif),中部有入核序列(606-612和715-731位氨基酸)。经数据库检索,显示它与KIA0661蛋白编码基因可能属于mRNA前体选择性剪接的不同产物。
进行16种正常人组织mRNA的Northern杂交分析,结果表明该基因在各种组织中广泛表达(图2)。其中在睾丸、心脏和胰脏组织中表达量最高。在胎盘、胸腺、脑、肝脏、肾脏、脾脏、骨胳肌、卵巢、小肠、结肠、前列腺、肺和外周血白细胞中都有一定表达。
本发明还利用辐射杂交细胞系法(Radiation hybrid,简称RH)进行了pRb-BP125基因的染色体定位分析。在pRb-BP125基因3′非编码区合成一对引物(序列表SEQ ID NO:5),对RH Mapping Kit中的83个辐射杂交细胞株的模板进行PCR反应,实验结果在计算机中进行连锁和统计分析,将该基因定位于第16号染色体的p11.2-11.1区段。
本发明的优点与功能:
1、提供一种全新的pRb-BP125基因的cDNA序列,它的编码产物能与抗癌基因的产物pRB相作用,在肿瘤的诊断和治疗上具有潜在的应用意义。
2、pRb-BP125编码的蛋白产物含有核定位序列,可能为一种转录调控因子,有可能成为基因工程的产品。
3、pRb-BP125在16种正常人组织中广泛表达,显示该基因在细胞内具有重要功能作用,可作为诊断指标。
4、本发明已将pRb-BP125基因定位在16号染色体的p11.2-11.1区段,宜进行染色体上基因的连锁分析,应用于疾病的诊断。
本发明通过以下附图和实施例作进一步阐述,但并不限制本发明的范围。
附图说明:
图1.pRb-BP125 cDNA片段的克隆、全序测定的战略及限制性内切酶的切点
图中331-987代表序列表SEQ ID NO:1中的核苷酸序列
图2.以pRb-BP125为探针,人不同组织mRNA的Northern杂交
图中: 1.心脏 2.脑 3.胎盘 4.肺脏
5.肝脏 6.骨胳肌 7.肾脏 8.胰脏
9.脾脏 10.胸腺 11.前列腺 12.睾丸
13.卵巢 14.小肠 15.结肠 16.外周血白细胞
实施例1 酵母双向杂交系统筛选pRb-BP125 cDNA片段
将pRB与GAL4 DNA结合结构域融合的表达质粒和人胎脑cDNA文库与GAL4转录激活结构域融合的表达质粒(均购自CLontech公司)共转化于酵母HF7c中。靶蛋白质粒的营养筛选标记为TRPl基因,文库质粒的营养筛选标记为LEU2基因,如果靶蛋白与被检测蛋白之间有相互结合,就激活HF7c中报告基因HIS3的表达,因此细胞就能在缺少Leu、Trp和His的基本培养基上生长。在1.5×106个转化子(在L-和W-平板上)中获得295个能在SD(W-L-H-)平板上生长的转化子。为了排除假阳性克隆,测定这些克隆的半乳糖苷酶活力,发现有57个克隆在X-gal平板上显蓝色。将阳性转化子接种于缺少Leu的培养液中培养,抽取质粒DNA,转化大肠杆菌,再制备质粒DNA。将该质粒与靶蛋白质粒转化到另一酵母菌株SFY526中,在X-gal平板上均显蓝色,表明有半乳糖苷酶活力,证明确为阳性克隆。对57个阳性克隆中的cDNA文库质粒分别进行限制性内切酶图谱分析和部分DNA序列测定,57个阳性克隆仅代表6个独立的基因,其中一个cDNA片段长度为657bp(序列表SEQ ID NO:1),将它命名为pRb-BP125。
实施例2. pRb-BP125全长cDNA的克隆和测序
以上述657bp cDNA片段为探针,按随机引物标记试剂盒(BoehringerMannheim公司)推荐的方法进行同位素标记,从HeLa细胞cDNA文库(Clontech公司)中筛选杂交克隆,噬菌斑原位杂交方法按cDNA文库说明书推荐方法进行。经三轮筛选,获得12个阳性克隆。对各个克隆进行限制酶切鉴定,其中两个克隆的长度约为4.5kb,可能为全长pRb-BP125 cDNA克隆(图1)。按照图1的限制性内切酶的切点,作不同长度的酶切片段:用EcoRI酶切得到全长约4.5Kb的片段;用EcoRI和SmaI酶切得到2Kb和约2.4K两种片段;用Hind III酶切取其中1Kb和2Kb的两种片段;用Sma I和Kpn I酶切取其中2Kb的片段,分别克隆到用相应限制性内切酶处理的pBSK质粒(Stratagene公司)中,以双脱氧终止法测定DNA序列(方法按Sambrook的Molecular cloning:A Laboratory Manual,2nd ed)。pRb-BP125 cDNA全长4335bp,5′非翻译区为112bp,编码区为2517bp,3′非翻译区为1706bp(序列表SEQ ID NO:3)。
实施例3 pRb-BP125在人正常组织中表达分析
将固定有人16种正常组织mRNA的尼龙膜(CLontech公司),放入杂交管内,加入5ml 68℃预热的快速杂交液(CLontech公司),68℃预杂交1小时,加入变性的同位素标记的pRb-BP125的0.6kb片段,68℃杂交2小时。取出杂交管洗膜,2×SSC,0.05% SDS中室温10分钟,0.1×SSC,0.1% SDS50℃洗两次,共30分钟。将膜置于滤纸上晾干,压片,即得图2。
实施例4 pRb-BP125在染色体上的定位
在pRb-BP125 cDNA的3′非编码区合成一对引物(SEQ ID NO:5),对RH Mapping Kit(购自Stanford SHGC)中的83个辐射杂交细胞系的模板进行PCR反应:10μl体系,含25ng模板,1.5mM Mg2+,200μM dNTP,两种引物各8pM,1μl10×PCR Buffer,1U Taq酶,反应条件为95℃ 4分钟热启动后按94℃ 25秒,55℃ 30秒,72℃ 30秒的顺序进行35个循环的反应,最后在72℃继续延伸7分钟。电泳分析PCR结果,其PCR产物为310bp,有扩增产物的记为1,无扩增产物的记为0,按顺序将结果排成串,送到SHGC网站中在计算机中进行连锁和统计分析,找出与之连锁的已经定位的标记基因,从而将该基因定位于第16号染色体的p11.2-11.1区段。
序列表(1)一般信息
(I)申请人: 中国科学院上海生物化学研究所
(II)发明名称:与抗癌基因编码产物pRB相作用的人类基因pRb-BP125
(III)序列数: 5(2)SEQ ID NO:1信息
(I)序列特性:
(A)长度:657个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:线性
(II)分子类型:cDNA
(III)序列描述:SEQ ID NO:1:CCGAGAACGA ATTGAGAAGT TGGAGAAGCG GCAGGCCACA GATGATGCCA CACTCCTCAT 60CGTCAATCGC TACTGGGCCC AGCTGGATGA AACTGTGGAA GCCCTTCTCC GATGCCATGA 120GAGCCAGGGG GAGCTGTCTT CAGCGCCTGA GGCACCTGGG ACCCAGGAGG GGCCAACATG 180TGATGGGACT CCTCTCCCAG AGCCGGGGAC ATCAGAGCTG AGAGACCCCT TGCTGATGCA 240GCTGCGGCCC CCTCTCAGTG AGCCGGCCTT GGCTTTTGTT GGTGGCACTG GGTGCAGCAG 300CAGTGAGGAG GTGGAGCTGG AGCTGCAAGG CCGAATGGAG TTCTCCAAGG CAGCTGTGTC 360TCGTGTGGTA GAGGCCTCAG ACCGCCTACA GCGCCGGGTG GAGGAACTCT GTCAGCGAGT 420GTACAGCCGA GGGGACAGTG AGCCCCTCAG TGAGGCGGCT CAGGCACACA CCCGAGAGCT 480GGGCCGTGAG AACCGGCGAC TGCAGGACTT GGCCACTCAG CTGCAGGAGA AACACCACCG 540CATCTCATTG GAGTACTCCG AGCTCCAGGA TAAAGTGACA TCGGCAGAGA CCAAGGTGCT 600GGAGATGGAG ACAACAGTGG AGGACTTGCA GTGGGACATC GAGAAGCTGC GGAAGCG 657(3)SEQ ID NO:2信息
(I)序列特性:
(A)长度:219个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线性
(II)分子类型:蛋白质
(III)序列描述:SEQ ID NO:2:Arg Glu Arg Ile Glu Lys Leu Glu Lys Arg Gln Ala Thr Asp Asp 15Ala Thr Leu Leu Ile Val Asn Leu Tyr Trp Ala Gln Leu Asp Glu 30Thr Val Glu Ala Leu Leu Arg Cys His Glu Ser Gln Gly Glu Leu 45Ser Ser Ala Pro Glu Ala Pro Gly Thr Gln Glu Gly Pro Thr Cys 60Asp Gly Thr Pro Leu Pro Glu Pro Gly Thr Ser Glu Leu Arg Asp 75Pro Leu Leu Met Gln Leu Arg Pro Pro Leu Ser Glu Pro Ala Leu 90Ala Phe Val Val Ala Leu Gly Ala Ser Ser Ser Glu Glu Val Glu 105Leu Glu Leu Gln Gly Arg Met Glu Phe Ser Lys Ala Ala Val Ser 120Arg Val Val Glu Ala Ser Asp Arg Leu Gln Arg Arg Val Glu Glu 135Leu Cys Gln Arg Val Tyr Ser Arg Gly Asp Ser Glu Pro Leu Ser 150Glu Ala Ala Gln Ala His Thr Arg Glu Leu Gly Arg Glu Asn Arg 165Arg Leu Gln Asp Leu Ala Thr Gln Leu Gln Glu Lys His His Arg 180Ile Ser Leu Glu Tyr Ser Glu Leu Gln Asp Lys Val Thr Ser Ala 195Glu Thr Lys Val Leu Glu Met Glu Thr Thr Val Glu Asp Leu Gln 210Trp Asp Ile Glu Lys Leu Arg Lys Arg 219(4)SEQ ID NO:3信息
(I)序列特性:
(A)长度:4335个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:线性
(II)分子类型:cDNA
(III)序列描述:SEQ ID NO:3:GCGGCCGCGT CGACGGCGGC GCTAGGCTGA CCCTCCTGCT GGTGACGGAA GTACCGCCTC -51CTCCCGTCTG ACGCCCCTCA GGGGACCCTG CATCGCTCCA GCCGCCGCGG CCATGTCTGG 8GCCAGGCAAC AAACGCGCCG CCGGCGACGG GGGCTCAGGG CCCCCGGAAA AGAAGCTGAG 68TCGTGAGGAG AAGACCACCA CGACTCTTAT CGAGCCCATT CGTCTTGGAG GCATCTCTTC 128CACGGAGGAG ATGGACCTGA AGGTACTACA GTTCAAGAAC AAGAAACTGG CAGAGCGGCT 188GGAACAACGG CAGGCTTGTG AAGATGAACT CCGAGAACGA ATTGAGAAGT TGGAGAAGCG 248GCAGGCCACA GATGATGCCA CACTCCTCAT CGTCAATCTC TACTGGGCCC AGCTGGATGA 308AACTGTGGAA GCCCTTCTCC GATGCCATGA GAGCCAGGGG GAGCTGTCTT CAGCGCCTGA 368GGCACCTGGG ACCCAGGAGG GGCCAACATG TGATGGGACT CCTCTCCCAG AGCCGGGGAC 428ATCAGAGCTG AGAGACCCCT TGCTGATGCA GCTGCGGCCC CCTCTCAGTG AGCCGGCCTT 488GGCTTTTGTG GTGGCACTGG GTGCCAGCAG CAGTGAGGAG GTGGAGCTGG AGCTGCAAGG 548CCGAATGGAG TTCTCCAAGG CAGCTGTGTC TCGTGTGGTA GAGGCCTCAG ACCGCCTACA 608GCGCCGGGTG GAGGAACTCT GTCAGCGAGT GTACAGCCGA GGGGACAGTG AGCCCCTCAG 668TGAGGCGGCT CAGGCACACA CCCGAGAGCT GGGCCGTGAG AACCGGCGAC TGCAGGACTT 728GGCCACTCAG CTGCAGGAGA AACACCACCG CATCTCATTG GAGTACTCCG AGCTCCAGGA 788TAAAGTGACA TCGGCAGAGA CCAAGGTGCT GGAGATGGAG ACAACAGTGG AGGACTTGCA 848GTGGGACATC GAGAAGCTGC GGAAGCGAGA GCAAAAGCTC AATAAGCACC TGGCAGAGGC 1008CTTAGAGCAG CTTAACTCTG GCTACTATGT ATCTGGGAGC TCCTCAGGCT TCCAGGGGGG 1068CCAGATCACA CTCAGCATGC AGAAGTTTGA GATGCTGAAT GCAGAGTTAG AGGAAAACCA 1128GGAACTGGCC AACAGCCGTA TGGCAGAGCT GGAGAAACTG CAGGCCGAAC TTCAGGGGGC 1188TGTGCGGACC AATGAGCGCC TCAAGGTGGC CCTGCGGAGC CTTCCTGAGG AGGTAGTGCG 1248GGAGACGGGG GAGTACCGCA TGCTGCAGGC CCAATTCTCA CTGCTCTACA ACGAGTCTCT 1308GCAAGTGAAG ACCCAGCTAG ACGAGGCTCG GGGCCTGCTG CTGGCCACAA AGAACTCCCA 1368CCTGCGACAC ATCGAGCACA TGGAGAGCGA CGAGCTGGGG CTGCAGAAGA AGCTACGCAC 1428AGAGGTCATT CAGCTGGAGG ACACGCTGGC CCAGGTACGC AAGGAGTATG AGATGCTGCG 1488CATCGAGTTT GAGCAGAATC TGGCGGCCAA CGAGCAGGCG GGGCCCATCA ACCGTGAGAT 1548GCGCCACCTG ATTAGTAGTC TTCAAAACCA CAACCACCAG CTAAAAGGGG ACGCCCAGCG 1608ATACAAGCGG AAGCTTCGAG AAGTACAAGC TGAGATTGGC AAGCTCCGGG CCCAGGCCAG 1668TGGCTCTGCC CACTCCACCC CCAACCTGGG CCACCCAGAG GATTCTGGCG TCAGTGCCCC 1728AGCCCCAGGG AAAGAGGAGG GTGGGCCAGG CCCTGTCAGT ACCCCCGACA ACAGAAAGGA 1788GATGGCTCCA GTGCCTGGCA CCACCACTAC TACCACTTCA GTGAAGAAGG AGGAGCTGGT 1848
后页续CCCCTCTGAA GAGGACTTCC AGGGTATAAC CCCTGGGGCC CAGGGCCCTT CCTCCCGGGG 1908CCGAGAACCT GAGGCCAGGC CCAAGCGGGA GCTTCGGGAA CGGGAAGGTC CCAGCCTAGG 1968ACCTCCACCT GTAGCCTCCG CTCTCTCAAG GGCTGATCGG GAGAAGGCCA AGGTGGAAGA 2028AACCAAGCGG AAGGAATCAG AACTCCTCAA GGGTCTCCGA GCAGAGCTCA AGAAGGCCCA 2088GGAGAGCCAG AAGGAGATGA AACTGCTGCT GGATATGTAC AAGTCAGCGC CCAAGGAGCA 2148GCGGGATAAG GTGCAGCTCA TGGCAGCGGA ACGCAAGGCT AAGGCCGAGG TTGATGAGCT 2208GCGGAGCCGC ATCCGGGAAT TGGAGGAGAG GGATCGAAGG GAGAGCAAGA AGATCGCGGA 2268TGAGGATGCC CTGCGGCGCA TTCGGCAGGC AGAGGAGCAG ATAGAACACC TGCAGCGCAA 2328GCTGGGTGCC ACCAAGCAGG AGGAGGAGGC TCTGCTCTCA GAGATGGATG TGACAGGTCA 2388GGCTTTTGAG GACATGCAGG AACAGAACGG GCGGCTGCTA CAGCAGTTGC GGGAAAAGGA 2448TGATGCCAAC TTTAAGCTAA TGTCAGAGCG GATCAAGGCC AACCAGATTC ACAAGCTGCT 2508GCGGGAGGAG AAGGATGAGT TGGGCGAGCA GGTCCTTGGC CTCAAGTCCC AGGTATGGCC 2568GCCGCCAGCT TGCAGACTGG AGCTGGAGAG GTGGGGGTCA TGGCCCTGAG TCCTCCTCTG 2628GTCCTTAGGT GGATGCCCAG CTGCTGACTG TGCAGAAGCT GGAGGAGAAG GAGCGAGCCT 2688TGCAGGGCAG CCTCGGGGGT GTGGAGAAGG AGCTGACGCT GCGCAGCCAA GCCCTGGAGC 2748TCAACAAGCG GAAGGCTGTA GAAGCCGCCC AGCTGGCCGA GGACCTGAAG GTGCAGCTGG 2808AGCACGTGCA GACTCGGCTG CGGGAGATCC AGCCCTGCCT GGCAGAGAGC CGGGCTGCTC 2868GTGAGAAAGA GAGCTTCAAC CTCAAGAGGG CTCAGGAGGA CATCTCACGG CTGCGGCGCA 2928AGCTGGAAAA GCAGAGGAAG GTGGAGGTCT ACGCAGATGC CGACGAAATC CTCCAGGAGG 2988AGATCAAGGA GTACAAGGCG CGGTTGACCT GCCCCTGCTG TAACACCCGC AAGAAGGATG 3048CAGTCCTTAC CAAGTGCTTC CACGTTTTCT GCTTCGAGTG CGTGCGGGGC CGCTATGAGG 3108CCCGCCAGAG GAAGTGCCCC AAGTGCAACG CGGGCTTTGG TGCCCACGAC TTGCATCGTA 3168TCTACATCAG CTGAACCTGA AACTCAGGGG ACTCTGGAAC ACCATGGACC CTGGGGGCTG 3228TGCCCCCATC TCCTCCCCAC CCCAGGTCTA GTGGCCCCAC CCTCCATTCC GGACCCCATG 3288GGCCCAGCCC CTGCCCATCT AGTTGGTTTG GGGACCCTGG TGCATGCTAG TGGGCATGGG 3348ATCAGCCAAG CTTCGTTCCA TCTTTTCCTA AAGGTCAGAG CTGCAGCCTA GGGGGCACTG 3408CCCTACAGAA AAGGTCTGCC TGAGAGGCCT GAGGAGCCCA GAGCACTTGA CTGAGCTTCC 3468CGGAAACTGG CCCTAACCTG TCTGTCTCCG TGGATGCATC CTAACCCTAA GGAAAATTCC 3528CCAGGCTGTG ATCTACCCTA GAGAAGGCTC GCTCCCTGCC TACTGGCTCA CAAATGAGGA 3588CCAGTGAGCC ATGTCCTTGT TCCTTGTTTG AGACTGGGCT GCAGGCCCCA GGAAGACTTT 3648CCTTCACCCA CCATCCCCCT AACCTCGGCA GGGCTTCTGT CCTGTGGAGT TCCCTGGACA 3708CCTTGGTCTG GCTCTTGTGC CAAGGGCTGA AGGAGGTACC CTCTTGGCAG ATGGGGGCAT 3768CACTTGCTTC CTTTGGGAAG CTCTAAGGTT GCTGCAGTCA CCTTCCTCAT CTTGCAGGTG 3828CTGAACCAAC ATCATCAGTT TCTATTCTAA TCAGGCCCCT TCCCAATCTC CATTTCTCTG 3888CCAAGCCCAT TTACCCCCAC CTCATGCATC CCAAGGCTCT ACTGGGTCCC TGGACCTAAC 3948CCTGCTTTCA TCCTGGTGGC CTTAACTACA GTGGAGGTGG AACTTCCCAG GAGGGGAAGG 4008GACAGACCAG CCCCAGCCGC TGGGCCAACT TCCAATCATT CCAGCTAGAA GAGCTTCCCC 4068CTGACACCCT GTGACTGAGC CTGTGTCCTG TCTGCCTGCC CAGCCATGCT CCATCGGCTG 4128TGAGGGCAGT GCCCGGAGAG GCCAGAGGGT TGGAGCTGCA GGGACCCGTT TGGACCCACA 4188GCCTCTGTTC TAGAGATGCT TGTATAGGCT GTTAATTGTG ATGAATAAAC GTTCAACCCT 4288CGGCCTGCAG CCAGAGTAGC CAGGCCGCGC ACCCCAAAAA AAAAAAAAAA AAAAAAAAAA 4308AGTCGACGCG GCCGC 4323(5)SEQ ID NO:4信息
(I)序列特性:
(A)长度:838个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线性
(II)分子类型:蛋白质
(III)序列特征1:109~113位为pRB结合蛋白所特有的结合模体(LxCxE,图中下划线的L、C和E为保守氨基酸)。
(IV)序列特征2:606~612和715~731为核定位序列(图中用双重下划线表示)。
(V)序列描述:SEQ ID NO:4:Met Ser Gly Pro Gly Asn Lys Arg Ala Ala Gly Asp Gly Gly Ser 15Gly Pro Pro Glu Lys Lys Leu Ser Arg Glu Glu Lys Thr Thr Thr 30Thr Leu Ile Glu Pro Ile Arg Leu Gly Gly Ile Ser Ser Thr Glu 45Glu Met Asp Leu Lys Val Leu Gln Phe Lys Asn Lys Lys Leu Ala 60Glu Arg Leu Glu Gln Arg Gln Ala Cys Glu Asp Glu Leu Arg Glu 75Arg Ile Glu Lys Leu Glu Lys Arg Gln Ala Thr Asp Asp Ala Thr 90Leu Leu Ile Val Asn Leu Tyr Trp Ala Gln Leu Asp Glu Thr Val 105Glu Ala Leu Leu Arg Cys His Glu Ser Gln Gly Glu Leu Ser Ser 120Ala Pro Glu Ala Pro Gly Thr Gln Glu Gly Pro Thr Cys Asp Gly 135Thr Pro Leu Pro Glu Pro Gly Thr Ser Glu Leu Arg Asp Pro Leu 150Leu Met Gln Leu Arg Pro Pro Leu Ser Glu Pro Ala Leu Ala Phe 165Val Val Ala Leu Gly Ala Ser Ser Ser Glu Glu Val Glu Leu Glu 180Leu Gln Gly Arg Met Glu Phe Ser Lys Ala Ala Val Ser Arg Val 195Val Glu Ala Ser Asp Arg Leu Gln Arg Arg Val Glu Glu Leu Cys 210Gln Arg Val Tyr Ser Arg Gly Asp Ser Glu Pro Leu Ser Glu Ala 225Ala Gln Ala His Thr Arg Glu Leu Gly Arg Glu Asn Arg Arg Leu 240Gln Asp Leu Ala Thr Gln Leu Gln Glu Lys His His Arg Ile Ser 255Leu Glu Tyr Ser Glu Leu Gln Asp Lys Val Thr Ser Ala Glu Thr 270Lys Val Leu Glu Met Glu Thr Thr Val Glu Asp Leu Gln Trp Asp 285Ile Glu Lys Leu Arg Lys Arg Glu Gln Lys Leu Asn Lys His Leu 300Ala Glu Ala Leu Glu Gln Leu Asn Ser Gly Tyr Tyr Val Ser Gly 315
后页续Ser Ser Ser Gly Phe Gln Gly Gly Gln Ile Thr Leu Ser Met Gln 330Lys Phe Glu Met Leu Asn Ala Glu Leu Glu Glu Asn Gln Glu Leu 345Ala Asn Ser Arg Met Ala Glu Leu Glu Lys Leu Gln Ala Glu Leu 360Gln Gly Ala Val Arg Thr Asn Glu Arg Leu Lys Val Ala Leu Arg 375Ser Leu Pro Glu Glu Val Val Arg Glu Thr Gly Glu Tyr Arg Met 390Leu Gln Ala Gln Phe Ser Leu Leu Tyr Asn Glu Ser Leu Gln Val 405Lys Thr Gln Leu Asp Glu Ala Arg Gly Leu Leu Leu Ala Thr Lys 420Asn Ser His Leu Arg His Ile Glu His Met Glu Ser Asp Glu Leu 435Gly Leu Gln Lys Lys Leu Arg Thr Glu Val Ile Gln Leu Glu Asp 450Thr Leu Ala Gln Val Arg Lys Glu Tyr Glu Met Leu Arg Ile Glu 465Phe Glu Gln Asn Leu Ala Ala Asn Glu Gln Ala Gly Pro Ile Asn 480Arg Glu Met Arg His Leu Ile Ser Ser Leu Gln Asn His Asn His 495Gln Leu Lys Gly Asp Ala Gln Arg Tyr Lys Arg Lys Leu Arg Glu 510Val Gln Ala Glu Ile Gly Lys Leu Arg Ala Gln Ala Ser Gly Ser 525Ala His Ser Thr Pro Asn Leu Gly His Pro Glu Asp Ser Gly Val 540Ser Ala Pro Ala Pro Gly Lys Glu Glu Gly Gly Pro Gly Pro Val 555Ser Thr Pro Asp Asn Arg Lys Glu Met Ala Pro Val Pro Gly Thr 570Thr Thr Thr Thr Thr Ser Val Lys Lys Glu Glu Leu Val Pro Ser 585Glu Glu Asp Phe Gln Gly Ile Thr Pro Gly Ala Gln Gly Pro Ser 600Ser Arg Gly Arg Glu Pro Glu Ala Arg Pro Lys Arg Glu Leu Arg 615Glu Arg Glu Gly Pro Ser Leu Gly Pro Pro Pro Val Ala Ser Ala 630Leu Ser Arg Ala Asp Arg Glu Lys Ala Lys Val Glu Glu Thr Lys 645Arg Lys Glu Ser Glu Leu Leu Lys Gly Leu Arg Ala Glu Leu Lys 660Lys Ala Gln Glu Ser Gln Lys Glu Met Lys Leu Leu Leu Asp Met 675Tyr Lys Ser Ala Pro Lys Glu Gln Arg Asp Lys Val Gln Leu Met 690Ala Ala Glu Arg Lys Ala Lys Ala Glu Val Asp Glu Leu Arg Ser 705Arg Ile Arg Glu Leu Glu Glu Arg Asp Arg Arg Glu Ser Lys Lys 720Ile Ala Asn Glu Asp Ala Leu Arg Arg Ile Arg Gln Ala Glu Glu 735Gln Ile Glu His Leu Gln Arg Lys Leu Gly Ala Thr Lys Gln Glu 750Glu Glu Ala Leu Leu Ser Glu Met Asp Val Thr Gly Gln Ala Phe 765Glu Asp Met Gln Glu Gln Asn Gly Arg Leu Leu Gln Gln Leu Arg 780Glu Lys Asp Asp Ala Asn Phe Lys Leu Met Ser Glu Arg Ile Lys 795Ala Asn Gln Ile His Lys Leu Leu Arg Glu Glu Lys Asp Glu Leu 810Gly Glu Gln Val Leu Gly Leu Lys Ser Gln Val Trp Pro Pro Pro 825Ala Cys Arg Leu Glu Leu Glu Arg Trp Gly Ser Trp Pro 838(6)SEQ ID NO:5信息
(I)序列特性:
(A)长度:22个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(II)分子类型:DNA(PCR引物)
(III)序列描述:SEQ ID NO:5:
5’引物: CCCTGCCTAC TGGCTCACAA AT 22
3’引物: GGAAGGGGCC TGATTAGAAT AG 22