具有促进3T3细胞转化功能的新的人蛋白及其编码序列.pdf

上传人:大师****2 文档编号:1138211 上传时间:2018-04-02 格式:PDF 页数:41 大小:2.72MB
返回 下载 相关 举报
摘要
申请专利号:

CN01126724.0

申请日:

2001.09.12

公开号:

CN1403476A

公开日:

2003.03.19

当前法律状态:

驳回

有效性:

无权

法律详情:

发明专利申请公布后的驳回|||实质审查的生效|||公开|||实质审查的生效

IPC分类号:

C07K14/435; C07K16/18; C12N15/10; C12N15/11; C12N15/63; C12N15/64; C07H21/00; C12P21/02

主分类号:

C07K14/435; C07K16/18; C12N15/10; C12N15/11; C12N15/63; C12N15/64; C07H21/00; C12P21/02

申请人:

上海新世界基因技术开发有限公司;

发明人:

顾健人; 杨胜利

地址:

200122上海市浦东新区张杨路500号23楼G座

优先权:

专利代理机构:

上海专利商标事务所

代理人:

徐迅

PDF下载: PDF下载
内容摘要

本发明公开了一类新的具有促进3T3细胞转化功能的人蛋白,编码此多肽的多核苷酸和经重组技术产生该多肽的方法。本发明还公开了抗此多肽的拮抗剂及其治疗作用。本发明还公开了编码这类新的具有促进3T3细胞转化功能的人蛋白的多核苷酸的用途。

权利要求书

1.一种分离的具有促进3T3细胞转化功能的人蛋白,其特征在于,它包含具有选自下
组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35;
或其保守性变异多肽、或其活性片段、或其活性衍生物。
2.如权利要求1所述的多肽,其特征在于,该多肽是具有选自下组的氨基酸序列的多
肽:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35。
3.一种分离的多核苷酸,其特征在于,它包含一核苷酸序列,该核苷酸序列与选自
下组的一种核苷酸序列有至少85%相同性:
(a)编码如权利要求1和2所述多肽的多核苷酸;
(b)与多核苷酸(a)互补的多核苷酸。
4.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸编码的多肽具有选自下组
的氨基酸序列:SEQ ID NO:2、5、8、11、14、17、20、23、26、29、32、35。
5.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸的序列选自下组:
SEQ ID NO:3、6、9、12、15、18、21、24、27、30、33、36的编码区序列或全长
序列。
6.一种载体,其特征在于,它含有权利要求3所述的多核苷酸。
7.一种遗传工程化的宿主细胞,其特征在于,它是选自下组的一种宿主细胞:
  (a)用权利要求6所述的载体转化或转导的宿主细胞;
  (b)用权利要求3所述的多核苷酸转化或转导的宿主细胞。
8.一种具有促进3T3细胞转化功能的人蛋白活性的多肽的制备方法,其特征在于,
该方法包含:
(a)在适合表达具有促进3T3细胞转化功能的人蛋白的条件下,培养权利要求7所述的
宿主细胞;
(b)从培养物中分离出具有促进3T3细胞转化功能的人蛋白活性的多肽。
9.一种能与权利要求1所述的具有促进3T3细胞转化功能的人蛋白特异性结合的抗
体。
10.一种核酸分子,它含有权利要求3所述的多核苷酸中连续的10-800个核苷酸。

说明书

具有促进3T3细胞转化功能的新的人蛋白及其编码序列

技术领域

本发明属于生物技术领域,具体地说,本发明涉及新的编码具有促进3T3细胞转化
功能的人蛋白的多核苷酸,以及此多核苷酸编码的多肽。本发明还涉及此多核苷酸和多
肽的用途和制备。

背景技术

人基因组学研究目前是国际上的热点,除人染色体DNA大规模测序,表达序列测序
(EST)的方法外,还缺少从功能开始的筛选具有功能基因的高通量的方法。

癌症是危害人类健康的主要疾病之一。为了有效地治疗和预防肿瘤,目前人们已越
来越关注肿瘤的基因治疗。因此,本领域迫切需要开发研究与癌细胞生长相关的人蛋白
及其激动剂/抑制剂。

发明内容

本发明的目的是提供一类新的具有促进3T3细胞转化功能的人蛋白多肽以及其片
段、类似物和衍生物。

本发明的另一目的是提供编码这些多肽的多核苷酸。

本发明的另一目的是提供生产这些多肽的方法以及该多肽和编码序列的用途。

在本发明的第一方面,提供新颖的分离出的具有促进3T3细胞转化功能的蛋白多肽,
它包含具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、14、17、20、23、
26、29、32、35;或其保守性变异多肽、或其活性片段、或其活性衍生物。

较佳地,该多肽是具有选自下组的氨基酸序列的多肽:SEQ ID NO:2、5、8、11、
14、17、20、23、26、29、32、35。

在本发明的第二方面,提供了一种分离的多核苷酸,它包含一核苷酸序列,该核苷
酸序列与选自下组的一种核苷酸序列有至少85%相同性:(a)编码上述的具有促进3T3细胞
转化功能的蛋白多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸。较佳地,该多核
苷酸编码的多肽具有选自下组的氨基酸序列:SEQ ID NO:2、5、8、11、14、17、20、
23、26、29、32、35。更佳地,该多核苷酸的序列选自下组:SEQ ID NO:3、6、9、12、
15、18、21、24、27、30、33、36的编码区序列或全长序列。

在本发明的第三方面,提供了含有上述多核苷酸的载体,以及被该载体转化或转导
的宿主细胞或者被上述多核苷酸直接转化或转导的宿主细胞。

在本发明的第四方面,提供了制备具有促进3T3细胞转化功能的蛋白活性的多肽的
制备方法,该方法包含:(a)在适合表达具有促进3T3细胞转化功能的蛋白的条件下,培
养上述被转化或转导的宿主细胞;(b)从培养物中分离出具有促进3T3细胞转化功能的蛋
白活性的多肽。

在本发明的第五方面,提供了与上述的具有促进3T3细胞转化功能的蛋白多肽特异
性结合的抗体。还提供了可用于检测的核酸分子,它含有上述的多核苷酸中连续10个核
苷酸至全长核苷酸,较佳地它含有连续的约10-800个核苷酸。

在本发明的第六方面,提供了一种药物组合物,它含有安全有效量的本发明的具有
促进3T3细胞转化功能的蛋白多肽以及药学上可接受的载体。这些药物组合物可用于促
进细胞的生长。本发明还提供了一种药物组合物,它含有安全有效量的针对本发明的具
有促进3T3细胞转化功能的蛋白多肽的拮抗剂(如抗体)以及药学上可接受的载体。该药
物组合物可治疗癌症以及细胞异常增殖等病症。

本发明的其它方面由于本文的技术的公开,对本领域的技术人员而言是显而易见
的。

具体实施方式

3T3细胞是一种小鼠成纤维细胞(J.Cell.Biol.,17:299,1963)(也称为NIH/3T3细胞)。
在癌症研究领域中,常将外源基因(尤其是人基因)引入3T3细胞,观察其对3T3细胞生
长的影响情况。通常认为,对3T3细胞生长(或恶性转化)有影响的基因是癌症相关基因,
其中对3T3细胞生长或转化有抑制作用的基因大多是抑癌基因,而对3T3细胞生长或转
化有促进作用的基因大多是(原)癌基因。

本发明采用大规模cDNA克隆转染小鼠胚胎成纤维细胞3T3,在获得具有促进生长
作用的基础上,经测序证明为新的基因,进一步得到全长cDNA克隆。DNA转染试验证
明,本发明的具有促进3T3细胞转化功能的蛋白对3T3细胞具有促进克隆形成的作用,
其促进率≥50%。

如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,
原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯
化的,但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离
纯化的。

如本文所用,“分离的具有促进3T3细胞转化功能的蛋白或多肽”是指具有促进3T3
细胞转化功能的蛋白多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。
本领域的技术人员能用标准的蛋白质纯化技术纯化具有促进3T3细胞转化功能的蛋白。
基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。

本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多
肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例
如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的
宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或
不包括起始的甲硫氨酸残基。

本发明还包括具有促进3T3细胞转化功能的人蛋白的片段、衍生物和类似物。如本
文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然具有促
进3T3细胞转化功能的人蛋白相同的生物学功能或活性的多肽。本发明的多肽片段、衍
生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残
基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或
(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物
(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基
酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序
列或蛋白原序列)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人
员公知的范围。

本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA
或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。以
PP2121蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区
序列可以与SEQID NO:3所示的编码区序列相同或者是简并的变异体。如本文所用,“简
并的变异体”对于PP2121而言是指编码具有SEQ ID NO:2的蛋白质,但与SEQ ID NO:3
所示的编码区序列有差别的核酸序列。再以PP7706蛋白(在本申请中,蛋白质的命名采
用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:6所示的编码区序列
相同或者是简并的变异体。如本文所用,“简并的变异体”对于PP7706而言是指编码具
有SEQ ID NO:5的蛋白质,但与SEQ ID NO:6所示的编码区序列有差别的核酸序列。对
于本发明其他具有促进3T3细胞转化功能的蛋白,依此类推。

编码成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟多肽的编码序列
和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。

术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括
附加编码和/或非编码序列的多核苷酸。

本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽
或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或
非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。
如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸
的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。

本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更
佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可
杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的
杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲
酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在
95%以上,更好是97%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQ ID
NO:2所示的成熟多肽(以PP2121蛋白为例)有相同的生物学功能和活性。

本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至
少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100
个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码具有促进
3T3细胞转化功能的蛋白的多聚核苷酸。

本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。

本发明的DNA序列能用几种方法获得。例如,用本领域熟知的杂交技术分离DNA。
这些技术包括但不局限于:1)用探针与基因组或cDNA文库杂交以检出同源性核苷酸序
列,和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的DNA片段。

编码具有促进3T3细胞转化功能的蛋白的特异DNA片段序列产生也能用下列方法获
得:1)从基因组DNA分离双链DNA序列;2)化学合成DNA序列以获得所需多肽的双链
DNA。

当需要的多肽产物的整个氨基酸序列已知时,DNA序列的直接化学合成是经常选用
的方法。如果所需的氨基酸的整个序列不清楚时,DNA序列的直接化学合成是不可能的,
选用的方法是cDNA序列的分离。分离感兴趣的cDNA的标准方法是从高表达该基因的供
体细胞分离mRNA并进行逆转录,形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多
种成熟的技术,试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是通常的方
法(Sambrook,et al.,Molecular Cloning,A Laboratory Manual,Cold Spring Harbor
Laboratory.New York,1989)。还可得到商业供应的cDNA文库,如Clontech公司的
不同cDNA文库。当结合使用聚合酶反应技术时,即使极少的表达产物也能克隆。

可用常规方法从这些cDNA文库中筛选本发明的基因。这些方法包括(但不限于):
(1)DNA-DNA或DNA-RNA杂交;(2)标志基因的功能出现或丧失;(3)测定具有促进3T3细
胞转化功能的蛋白的转录本的水平;(4)通过免疫学技术或测定生物学活性,来检测基因
表达的蛋白产物。上述方法可单用,也可多种方法联合应用。

在第(1)种方法中,杂交所用的探针是与本发明的多核苷酸的任何一部分同源,其
长度至少15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少
100个核苷酸。此外,探针的长度通常在2kb之内,较佳地为1kb之内。此处所用的探针
通常是在本发明的基因DNA序列信息的基础上化学合成的DNA序列。本发明的基因本身
或者片段当然可以用作探针。DNA探针的标记可用放射性同位素,荧光素或酶(如碱性磷
酸酶)等。

在第(4)种方法中,检测具有促进3T3细胞转化功能的蛋白基因表达的蛋白产物可用
免疫学技术如Western印迹法,放射免疫沉淀法,酶联免疫吸附法(ELISA)等。

应用PCR技术扩增DNA/RNA的方法(Saiki,et al. Science 1985;230:1350-1354)
被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用
RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序
列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩
增的DNA/RNA片段。

如上所述得到的本发明的基因,或者各种DNA片段等的核苷酸序列的测定可用常规
方法如双脱氧链终止法(Sanger et al.PNAS,1977,74:5463-5467)。这类核苷酸
序列测定也可用商业测序试剂盒等。为了获得全长的cDNA序列,测序需反复进行。有时
需要测定多个克隆的cDNA序列,才能拼接成全长的cDNA序列。

本发明也涉及包含本发明多核苷酸的载体,以及用本发明的载体或具有促进3T3细
胞转化功能的蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所
述多肽的方法。

通过常规的重组DNA技术(Science,1984;224:1431),可利用本发明的多聚核
苷酸序列可用来表达或生产重组的具有促进3T3细胞转化功能的蛋白多肽。一般来说有
以下步骤:

(1).用本发明的编码具有促进3T3细胞转化功能的人蛋白的多核苷酸(或变异体),
或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;

(2).在合适的培养基中培养的宿主细胞;

(3).从培养基或细胞中分离、纯化蛋白质。

本发明中,具有促进3T3细胞转化功能的人蛋白多核苷酸序列可插入到重组表达载
体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞
病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。在本发明中适用的载体包
括但不限于:在细菌中表达的基于T7的表达载体(Rosenberg,et al.Gene,1987,
56:125);在哺乳动物细胞中表达的pMSXND表达载体(Lee and Nathans,J Bio Chem.
263:3521,1988)和在昆虫细胞中表达的来源于杆状病毒的载体。总之,只要能在宿主体
内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起
点、启动子、标记基因和翻译控制元件。

本领域的技术人员熟知的方法能用于构建含具有促进3T3细胞转化功能的人蛋白编
码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、
DNA合成技术、体内重组技术等(Sambroook,et al)。所述的DNA序列可有效连接到表达
载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的1ac
或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、早期和晚期
SV40启动子和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。
表达载体还包括翻译起始用的核糖体结合位点和转录终止子。

此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿
主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋
白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。

包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当
的宿主细胞,以使其能够表达蛋白质。

宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高
等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌
的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS或
Bowes黑素瘤细胞的动物细胞等。

本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会
使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用
于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱
基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。

本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。

用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核
生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,
所用的步骤在本领域众所周知。可供选择的是用MgCl2。如果需要,转化也可用电穿孔的
方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机
械方法如显微注射、电穿孔、脂质体包装等。

获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的
宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下
进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)
诱导选择的启动子,将细胞再培养一段时间。

在上面的方法中的重组多肽可包被于细胞内、细胞外或在细胞膜上表达或分泌到细
胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重
组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常
规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分
子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相
层析技术及这些方法的结合。

重组的具有促进3T3细胞转化功能的人蛋白或多肽有多方面的用途。这些用途包括
(但不限于):直接做为药物治疗具有促进3T3细胞转化功能的蛋白功能低下或丧失所致
的疾病,和用于筛选促进或对抗具有促进3T3细胞转化功能的蛋白功能的抗体、多肽或
其它配体。例如,该抗体可用于治疗癌症或细胞异常增殖。用重组表达的本发明蛋白筛
选多肽库可用于寻找有治疗价值的能抑制或刺激具有促进3T3细胞转化功能的人蛋白功
能的多肽分子。

本发明也提供了筛选药物以鉴定提高(激动剂)或阻遏(拮抗剂)具有促进3T3细胞转
化功能的人蛋白的药剂的方法。激动剂提高具有促进3T3细胞转化功能的人蛋白刺激细
胞增殖等生物功能,而拮抗剂阻止和治疗与细胞过度增殖有关的紊乱如各种癌症。

具有促进3T3细胞转化功能的人蛋白的拮抗剂包括筛选出的抗体、化合物、受体缺
失物和类似物等。具有促进3T3细胞转化功能的人蛋白的拮抗剂可以与具有促进3T3细
胞转化功能的人蛋白结合并消除其功能,或是抑制具有促进3T3细胞转化功能的人蛋白
的产生,或是与多肽的活性位点结合使多肽不能发挥生物学功能。具有促进3T3细胞转
化功能的人蛋白的拮抗剂可用于治疗用途。

在筛选作为拮抗剂的化合物时,可以将具有促进3T3细胞转化功能的蛋白加入生物
分析测定中,通过测定化合物影响具有促进3T3细胞转化功能的蛋白和其受体之间的相
互作用来确定化合物是否是拮抗剂。用上述筛选化合物的同样方法,可以筛选出起拮抗
剂作用的受体缺失物和类似物。

本发明蛋白的拮抗剂可直接用于疾病治疗,例如,各种恶性肿瘤、和细胞异常增殖
等。

本发明的多肽,及其片段、衍生物、类似物或它们的细胞可以用来作为抗原以生产
抗体。这些抗体可以是多克隆或单克隆抗体。多克隆抗体可以通过将此多肽直接注射动
物的方法得到。制备单克隆抗体的技术包括杂交瘤技术,三瘤技术,人B-细胞杂交瘤技
术,EBV-杂交瘤技术等。

可以将本发明的多肽和拮抗剂与合适的药物载体组合后使用。这些载体可以是水、
葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或
拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。

本发明还提供含有一种或多种容器的药盒或试剂盒,容器中装有一种或多种本发明
的药用组合物成分。与这些容器一起,可以有由制造、使用或销售药品或生物制品的政
府管理机构所给出的指示性提示,该提示反映出生产、使用或销售的政府管理机构许可
其在人体上施用。此外,本发明的多肽可以与其它的治疗化合物结合使用。

药物组合物可以以方便的方式给药,如通过局部、静脉内、腹膜内、肌内、皮下、
鼻内或皮内的给药途径。具有促进3T3细胞转化功能的蛋白或其特异性抗体,可按有效
地治疗和/或预防具体的适应症的量来给药。施用于患者的具有促进3T3细胞转化功能的
蛋白的量和剂量范围将取决于许多因素,如给药方式、待治疗者的健康条件和诊断医生
的判断。

具有促进3T3细胞转化功能的人蛋白的多聚核苷酸也可用于多种治疗目的。基因治
疗技术可用于治疗由于具有促进3T3细胞转化功能的蛋白的无表达或异常/无活性的具有
促进3T3细胞转化功能的蛋白的表达所致的细胞发育或代谢异常。重组的基因治疗载体
(如病毒载体)可设计成表达变异的具有促进3T3细胞转化功能的蛋白,以抑制内源性的
具有促进3T3细胞转化功能的蛋白活性。例如,一种变异的具有促进3T3细胞转化功能
的蛋白可以是缩短的、缺失了信号传导功能域的具有促进3T3细胞转化功能的蛋白,虽
可与下游的底物结合,但缺乏信号传导活性。因此重组的基因治疗载体可用于治疗具有
促进3T3细胞转化功能的蛋白表达或活性异常所致的疾病。来源于病毒的表达载体如逆
转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将具有促进3T3
细胞转化功能的蛋白基因转移至细胞内。构建携带具有促进3T3细胞转化功能的蛋白基
因的重组病毒载体的方法可见于已有文献(Sambrook,et al.)。另外重组具有促进3T3细
胞转化功能的人蛋白基因可包装到脂质体中转移至细胞内。

抑制具有促进3T3细胞转化功能的人蛋白mRNA的寡聚核苷酸(包括反义RNA和DNA)
以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子,
其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和
DNA及核酶可用已有的任何RNA或DNA合成技术获得,如固相磷酸酰胺化学合成法合成寡
核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转
录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的
稳定性,可用多种方法对其进行修饰,如增加两侧的序列长度,核糖核苷之间的连接应
用磷酸硫酯键或肽键而非磷酸二酯键。

多聚核苷酸导入组织或细胞内的方法包括:将多聚核苷酸直接注入到体内组织中;
或在体外通过载体(如病毒、噬菌体或质粒等)先将多聚核苷酸导入细胞中,再将细胞移
植到体内等。由于本发明蛋白具有促进3T3细胞转化的功能,因此本发明蛋白编码序列
的反义序列,可被引入细胞以抑制细胞的异常增殖(如癌变)。

本发明还提供了针对具有促进3T3细胞转化功能的人蛋白抗原决定簇的抗体。这些
抗体包括(但不限于):多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab
表达文库产生的片段。

抗具有促进3T3细胞转化功能的人蛋白的抗体可用于免疫组织化学技术中,检测活
检标本中的具有促进3T3细胞转化功能的人蛋白。

与具有促进3T3细胞转化功能的人蛋白结合的单克隆抗体也可用放射性同位素标
记,注入体内可跟踪其位置和分布。这种放射性标记的抗体可作为一种非创伤性诊断方
法用于肿瘤细胞的定位和判断是否有转移。

本发明中的抗体可用于治疗或预防与具有促进3T3细胞转化功能的人蛋白相关的疾
病。给予适当剂量的抗体可以阻断具有促进3T3细胞转化功能的人蛋白的产生或活性,
从而抑制癌细胞的生长和/或细胞的异常增殖。

抗体也可用于设计针对体内某一特殊部位的免疫毒素。如具有促进3T3细胞转化功
能的人蛋白高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素,蓖麻蛋白,红豆碱
等)共价结合。一种通常的方法是用巯基交联剂如SPDP,攻击抗体的氨基,通过二硫键
的交换,将毒素结合于抗体上,这种杂交抗体可用于杀灭有关的阳性细胞(如癌细胞)。

多克隆抗体的生产可用具有促进3T3细胞转化功能的人蛋白或多肽免疫动物,如家
兔,小鼠,大鼠等。多种佐剂可用于增强免疫反应,包括但不限于弗氏佐剂等。

具有促进3T3细胞转化功能的人蛋白单克隆抗体可用杂交瘤技术生产(Kohler and
Milstein.Nature,1975,256:495-497)。将人恒定区和非人源的可变区结合的嵌合抗体
可用已有的技术生产(Morrison et al,PNAS,1985,81:6851)。而已有的生产单链抗体的
技术(U.S.Pat No.4946778)也可用于生产抗具有促进3T3细胞转化功能的人蛋白的单链
抗体。

能与具有促进3T3细胞转化功能的人蛋白结合的多肽分子可通过筛选由各种可能组
合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时,必须对具有促进3T3细胞
转化功能的人蛋白分子进行标记。

本发明还涉及定量和定位检测具有促进3T3细胞转化功能的人蛋白水平的诊断试验
方法。这些试验为本领域所熟知,且包括FISH测定和放射免疫测定。试验中所检测的具
有促进3T3细胞转化功能的蛋白水平,可以用作解释具有促进3T3细胞转化功能的蛋白
在各种疾病中的重要性和用于诊断具有促进3T3细胞转化功能的蛋白起作用的疾病。

具有促进3T3细胞转化功能的蛋白的多聚核苷酸可用于具有促进3T3细胞转化功能
的蛋白相关疾病的诊断和治疗。在诊断方面,具有促进3T3细胞转化功能的蛋白的多聚
核苷酸可用于检测具有促进3T3细胞转化功能的蛋白的表达与否或在疾病状态下具有促
进3T3细胞转化功能的蛋白的异常表达。如具有促进3T3细胞转化功能的蛋白DNA序列
可用于对活检标本的杂交以判断具有促进3T3细胞转化功能的蛋白的表达异常。杂交技
术包括Southern印迹法,Northern印迹法、原位杂交等。这些技术方法都是公开的成熟
技术,相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探
针固定在微阵列(Microarray)或DNA芯片(即基因芯片)上,用于分析组织中基因的差异
表达分析和基因诊断。用具有促进3T3细胞转化功能的蛋白特异的引物进行RNA-聚合酶
链反应(RT-PCR)体外扩增也可检测具有促进3T3细胞转化功能的蛋白的转录产物。

检测具有促进3T3细胞转化功能的蛋白基因的突变也可用于诊断具有促进3T3细胞
转化功能的蛋白相关的疾病。具有促进3T3细胞转化功能的蛋白突变的形式包括与正常
野生型具有促进3T3细胞转化功能的蛋白DNA序列相比的点突变、易位、缺失、重组和
其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交
检测突变。另外,突变有可能影响蛋白的表达,因此用Northern印迹法、Western印迹
法可间接判断基因有无突变。

本发明的序列对染色体鉴定也是有价值的。这些序列会特异性地针对某条人染色体
具体位置且并可以与其杂交。目前,需要鉴定染色体上的各基因的具体位点。然而现在
只有很少的基于实际序列数据(重复多态性)的染色体标记物可用于标记染色体位置。为
了将这些序列与疾病相关基因相关联。第一步就是将本发明DNA序列定位于染色体上。

简而言之,根据cDNA制备PCR引物(优选15-35bp),可以将序列定位于染色体上。
然后,将这些引物用于PCR筛选含各条人染色体的体细胞杂合细胞。只有那些含有相应
于引物的人基因的杂合细胞会产生扩增的片段。

体细胞杂合细胞的PCR定位法,是将DNA定位到具体染色体的快捷方法。使用本发
明的的寡核苷酸引物,通过类似方法,可利用一组来自特定染色体的片段或大量基因组
克隆而实现亚定位。可用于染色体定位的其它类似策略包括原位杂交、用标记的流式分
选的染色体预筛选和杂交预选,从而构建染色体特异的cDNA库。

将cDNA克隆与中期染色体进行荧光原位杂交(FISH),可以在一个步骤中精确地进
行染色体定位。此技术的综述,参见Verma等,Human Chromosomes:a Manual of Basic
Techniques,Pergamon Press,New York(1988)。

一旦序列被定位到准确的染色体位置,此序列在染色体上的物理位置就可以与基因
图数据相关联。这些数据可见于例如,V.Mckusick,Mendelian Inheritance in Man(可通过
与Johns Hopkins University Welch Medical Library联机获得)。然后可通过连锁分析,确
定基因与业已定位到染色体区域上的疾病之间的关系。

接着,需要测定患病和未患病个体间的cDNA或基因组序列差异。如果在一些或所
有的患病个体中观察到某突变,而该突变在任何正常个体中未观察到,则该突变可能是
疾病的病因。比较患病和未患病个体,通常涉及首先寻找染色体中结构的变化,如从染
色体水平可见的或用基于cDNA序列的PCR可检测的缺失或易位。

本发明的具有促进3T3细胞转化功能的蛋白核苷酸全长序列或其片段通常可以用
PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有
关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术
人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常
常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。

一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其
克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。

此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通
过先合成多个小片段,然后再进行连接可获得序列很长的片段。

目前,已经可以完全通过化学合成来编码本发明蛋白(或其片段,或其衍生物)的DNA
序列。然后可将该DNA序列引入本领域中的各种DNA分子(如载体)和细胞中。此外,还
可通过化学合成将突变引入本发明蛋白序列中。

此外,由于本发明的具有促进3T3细胞转化功能的蛋白具有源自人的天然氨基酸序
列,因此,与来源于其他物种的同族蛋白相比,预计在施用于人时将具有更高的活性和/
或更低的副作用(例如在人体内的免疫原性更低或没有)。

下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明
而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规
条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory
Press,1989)中所述的条件,或按照制造厂商所建议的条件。注意,在核苷酸和氨基酸组
合序列中,(1)给出的是起始和终止编码子第一个核苷酸的位置,(2)分子量单位是道尔顿。

实施例1:cDNA基因的获得及对小鼠NIH/3T3细胞克隆形成的促进作用

PP2121、PP7706、PP10484、PP10566、PP10631、PP10752、PP10881、
PP10897、PP10933、PP11246、PP11347和PP11517是通过用常规方法构建人胎盘
cDNA文库获得的。取3、6、9月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按
厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用pCMV-script
TMXR cDNA文库构建试剂盒(Stratagene公司)构建上述mRNA的cDNA文库。其中反转录
酶改用MMLV-RT-Superscript II(GIBCO BRL),反转录反应在42℃进行。转化XL 10-
Gold感受细胞,获得了1×106cfu/μg滴度的cDNA文库。第一轮随机挑取cDNA克隆,
其后以高丰度cDNA克隆和已证明有抑癌细胞生长功能的cDNA克隆为探针,杂交筛选
cDNA文库,挑取弱阳性及阴性克隆。用Qiagen 96孔板质粒抽提试剂盒,按厂家说明
书进行质粒DNA的提取。质粒DNA和空载体同时转染小鼠NIH/3T3细胞。100ng DNA酒
精沉淀干燥后,加6μl H2O溶解,待转染。每份DNA样品中加0.74μl脂质体及9.3μl
无血清培液,混匀后,室温放置10分钟。每管中加150μl无血清培液,均分加入3孔
生长于96孔板的小鼠NIH/3T3细胞中,37℃放置2小时,每孔再加50μl无血清培液,
37℃24小时。每孔换100μl全培液,37℃24小时,换含G418的全培液100μl,37
℃24-48小时,边观察,边换G418浓度不等的培液。约2-3次后,直到镜检细胞有克
隆形成,计数。发现上述克隆有促进细胞克隆形成作用,结果如下表所示。

              cDNA克隆转染细胞(3T3)克隆形成情况

  cDNA克隆名称
  cDNA克隆数(三个重复)
  空载体克隆数(三个重复)
    PP2121
    70
    76
    69
    13
    12
    15
    PP7706
    28
    25
    20
    13
    12
    15
    PP10484
    17
    31
    34
    13
    12
    15
    PP10566
    29
    32
    27
    13
    12
    15
    PP10631
    27
    29
    22
    13
    12
    15
    PP10752
    27
    24
    21
    13
    12
    15
    PP10881
    30
    25
    20
    13
    12
    15
    PP10897
    43
    42
    45
    13
    12
    15
    PP10933
    37
    35
    30
    13
    12
    15
    PP11246
    38
    40
    38
    13
    12
    15
    PP11347
    47
    48
    46
    13
    12
    15
    PP11517
    35
    39
    38
    13
    12
    15

对cDNA克隆采用双脱氧终止法,在ABI377 DNA自动测序仪上测定其一端近500bp
的核苷酸序列。分析后,确定为新基因克隆,进行另一端测序,仍未获得全长cDNA序
列,设计引物,再次进行测序,直到获得全长序列(SEQ ID NO:1、4、7、10、13、
16、19、22、25、28、31、34)。

实施例2:从胎盘cDNA中PCR获得全长基因和重组蛋白表达

取3、6、9月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提
取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用MMLV-RT-Superscript
II(GIBCO BRL),反转录酶在42℃进行反转录反应,获得胎盘cDNA。利用各个基因的
特异引物(如下表所示),按97℃3’1个循环。94℃30″60℃30″72℃1’35
个循环,72℃10’1个循环进行PCR扩增,获得含有完整开放阅读框序列的各蛋白基
因的扩增产物。扩增产物经测序验证,与实施例1测得的序列相符,随后用常规技术将
扩增产物转入宿主细胞,获得重组蛋白(SEQ ID NO:2、5、8、11、14、17、20、
23、26、29、32、35)。

                            基因特异引物

克隆名称
特异引物1(5’→3’)
 特异引物2(5’→3’)
PP2121
(193)CAAGGTGGGCAAGTTCGT
 TGGGAGGTGGAGAAGATTTGG(2181)
PP7706
(67)AATGGATGACCCTCCAATAT
 GTGTCCTTCGACGGAACA(2744)
PP10484
(478)ATTTGGTTGGACCTTGCG
 TCCCTTGACTTCTGAGTTCC(1501)
PP10566
(40)AGCTACCACTCAGCACCATG
 TCTCCTAGACCTGACCGACC(2418)
PP10631
(15)GGACGAAGCCGGAGTGTA
 AAGACGGAAGGAGAACCC(1783)
PP10752
(148)TGACCCAGTTGTGGTTGATG
 TGCAGGAGGTGGCCTTTC(1179)
PP10881
(765)ATTCTTTGAAATTAGGGTGC
 GTGTCGCTCTGAGGGAGA(2077)
PP10897
(308)TAGTGGCCTAGCTGGGTA
 CCTCTTAGCGAACTTGGG(2261)
PP10933
(371)GTAGTCTGGGTTGGAGGAGG
 CCGATGCGTACAGGAGCT(1470)
PP11246
(109)GGGGACATGGGCATTTGG
 CTAGCACGGTGACATGAGGT(2011)
PP11347
(733)GGGTGAGGTAAGCAACGC
 ATGACCGATGAACCCTCCG(2310)
PP11517
(240)CAACCAACTGGACCGCATCA
 AACTAACGAGGGAGGAGCC(2011)
实施例3:cDNA克隆序列分析
1.PP2121
A:核苷酸序列(SEQ ID NO:1)长度:2244个碱基

  1  CTTGGGGACC  CAGGGCCGGC  TGAGCCGCAC  GCTGCCAGCC  AGCGCGGAGG  AGCGCGATCG

 61  GCTGCTGCGC  CGCATGGAGA  GCATGCGCAA  GGAGAAGCGC  GTGTACAGCC  GCTTCGAGGT

121  CTTCTGCAAG  AAAGAGGAGG  CCAGCAGCCC  TGGGGCAGGG  GAAGGCCCCG  CGGAGGAGGG

181  CACCAGGGAC  AGCAAGGTGG  GCAAGTTCGT  GCCCAAGATC  CTGGGCACGT  TCAAAAGCAA

241  GAAGTGAGTC  TTCTGGCCTG  GCAACCCAGG  CCAGGGTGCC  CGCATCGCTG  CCCCGGTCAT

301  CCAGAAGCCC  CGCGGAACAG  AGAGCCCTGC  TCATGTGCTT  GAGCAGCGGC  TGTCAGGCCA

361  CGGCCGCTTG  GGGCTTGGCT  GAGTGCGCCA  GACCTCGGCT  CCACTGGAGG  CTCACCTGGC

421  AGCTGCCGTC  TCTGCCCCCT  GGCCTCCCCA  ACGCTGGGGC  TGCACCCCTC  GCCACCAGTG

481  CCTTTCTCCC  CTCAGCACCT  TCATCTCTGC  ACCGTCAGCC  TTGCGTGGCG  CAGCGTCTGG

541  CTCCGCCATC  TCTTTGTGCC  TCAGTCCCCC  CGGCCCCCTT  TATTTTTTTG  AGACCTAGGG

601  CTGGAGTGCA  GTTGAGCGGT  CTGGGCTCAC  TGCAACCTCT  GCCTCCCGGG  TTCCAGCGAT

661  TCTCCTGCCT  CAGCCTCCTG  AGTAGCTGGG  ATTACAGATG  TATGCTACCA  CGCCCAGGTA

721  GTTTTTGTAT  TTTTAGTAGA  GACAGGGTTT  CACTATGTTG  GCCAGGCTGG  TCTCCAACTC

781  CTGGCCTCAA  ATGATCAGCC  CGCTTCAGCC  TCCCAAAGTG  GGGGGATTAC  AGGCGTGAGC
 841  CTTGCACCCC  GCTAAGTCCC  CTATCCTCTT  GCAAGGGTCT  CGCCTCTGTG  CCTCAATTCC
 901  TCATTCTCTG  GGCCCTTCTC  CTCCTCAGGG  CCTCCTGTTC  TCAGGGCCTC  CCCCCTCCCC
 961  GCTCCCTCCC  TCTCTCAAGG  TCTCCTCCTT  CCCTCCCCCC  CCCGTCTCCC  CCCTCCCCCG
1021  CCTGGGCTTC  ACTTCCTTTC  CTACTTGGAT  TCTCCTGCTC  GCTGCCTCCC  AGCATCTTTT
1081  TTGGAGGCCC  GTCTCTTGCT  GTGGGGAAGA  CTGGGCTGGC  TGCGGGCAGT  TTGCAAGGGG
1141  TGGGTGGGGC  GGGGGGGGGA  GCTGGACCAG  AAGATGCCCC  TTGGAGTGGC  AAGGAAGCTG
1201  GACAGGGCAG  GCCTCTGGGG  ACGGGACACA  GGGAAGCCCG  AAGGGGCGCC  TTGGCCAGGT
1261  CTGCCATCTC  CTCCAGCGAG  GCTCTGGCCA  GCACTGGGTG  AGAGTGGGGA  GGGGGCACTG
1321  GCCTTTGCAG  CACAGTAAAA  CATGGTCCAG  ACAACCTGTG  GCCCCGGCCT  CATGAGCACC
1381  CCCTGCACAG  GCCCGGCCCA  AGCCAGGCGC  TAGAAGGGCT  GGTTGTGGAG  TGCTTATCCT
1441  TGACAGGTAT  GGGGCCAGGT  GAGGGCAGGG  GACAAGGTGC  AGCTGAGGCC  GAGCCCAACT
1501  AGGTCCTGGG  CACCCCTGCA  GGTGGGAGTG  GTCCTTGTCC  TCCTGGTATC  CAGCAGACAC
1561  CCCCCTCTCC  CCACCAGCCC  CATTCTCAGG  TCCTTTCCTC  TTTGTCACCA  ACACCAAGAA
1621  TCTGTCCAGG  GTTCTTGGCT  TATCTTTTAT  CTCTTTTCAC  TCCTAGAGAG  GAATTGCAAT
1681  TGACTCAGAA  TGACACATTT  TTGGCACCAC  GTGTGTAGAA  AGCCCCCACT  GTTAGATGAT
1741  AGCCTCGTGA  AATTCATGTT  TCTGTATTCT  CCTATTTCTT  TTCAAAAACT  AATTTTTTTT
1801  TTAGTGTAAT  AAATCCTAAG  AGGGAACTGA  TTTAAGAAAC  AAGGCCGCCA  AACAAAGGCA
1861  GCAGTTCCGA  CTCCAGCAGC  TGGGAAAGGA  AGGAAAGTGA  CCCCACTTTC  ACTCCTGCAC
1921  AGCCCACTGG  TTACCAAAAC  CACCGTGCAA  GTCGGGATGA  CAGCAGGGAC  TTCTGGCCAG
1981  GTGGGAAAAG  GTGCCTGGAA  GCGGGATGCG  CCTGTGCGTC  TCTTGGCCAT  GATGTTCTTG
2041  TGGGCATGTT  ATTCTTGGTG  CTGCCTGGGG  TGTTGCTGAG  CGGACAGGCT  CTCCAGCTGG
2101  AGTCCATGGA  GAGGCCAGAG  GCTGGCGGCC  CTGCCTGGGC  CTTCGGAGCC  TCCTGCCTGC
2161  ACCCTCCACC  TCTTCTAAAC  CATGATGTGG  CACATTTTGG  TGTTAATAAA  ACACAACACA
2221  CAAAGTAAAA  AAAAAAAAAA  AAAA
B:核苷酸序列(SEQ ID NO:2)长度:153个氨基酸

  1  MCLSSGCQAT  AAWGLAECAR  PRLHWRLTWQ  LPSLPPGLPN  AGAAPLATSA  FLPSAPSSLH

 61  RQPCVAQRLA  PPSLCASVPP  APFIFLRPRA  GVQLSGLGSL  QPLPPGFQRF  SCLSLLSSWD

121  YRCMLPRPGS  FCIFSRDRVS  LCWPGWSPTP  GLK
C.核苷酸及氨基酸组合序列(SEQ ID NO:3)克隆号:PP2121
起始编码子:333 ATG  终止编码子:792 TGA  蛋白质分子量:16448.31
(注:(1)给出的是起始和终止编码子第一个核苷酸的位置,(2)分子量单位是道尔顿)
  1    CT TGG GGA CCC AGG GCC GGC TGA GCC GCA CGC TGC CAG CCA GCG CGG     47
 48   AGG AGC GCG ATC GGC TGC TGC GCC GCA TGG AGA GCA TGC GCA AGG AGA     95
 96   AGC GCG TGT ACA GCC GCT TCG AGG TCT TCT GCA AGA AAG AGG AGG CCA    143
144   GCA GCC CTG GGG CAG GGG AAG GCC CCG CGG AGG AGG GCA CCA GGG ACA    191
192   GCA AGG TGG GCA AGT TCG TGC CCA AGA TCC TGG GCA CGT TCA AAA GCA    239
240   AGA AGT GAG TCT TCT GGC CTG GCA ACC CAG GCC AGG GTG CCC GCA TCG    287
288   CTG CCC CGG TCA TCC AGA AGC CCC GCG GAA CAG AGA GCC CTG CTC ATG    335
  1                                                               Met      1
336   TGC TTG AGC AGC GGC TGT CAG GCC ACG GCC GCT TGG GGC TTG GCT GAG    383
  2   Cys Leu Ser Ser Gly Cys Gln Ala Thr Ala Ala Trp Gly Leu Ala Glu     17
384   TGC GCC AGA CCT CGG CTC CAC TGG AGG CTC ACC TGG CAG CTG CCG TCT    431
 18   Cys Ala Arg Pro Arg Leu His Trp Arg Leu Thr Trp Gln Leu Pro Ser     33
432   CTG CCC CCT GGC CTC CCC AAC GCT GGG GCT GCA CCC CTC GCC ACC AGT    479
 34   Leu Pro Pro Gly Leu Pro Asn Ala Gly Ala Ala Pro Leu Ala Thr Ser     49
480   GCC TTT CTC CCC TCA GCA CCT TCA TCT CTG CAC CGT CAG CCT TGC GTG    527
 50   Ala Phe Leu Pro Ser Ala Pro Ser Ser Leu His Arg Gln Pro Cys Val     65
 528  GCG CAG CGT CTG GCT CCG CCA TCT CTT TGT GCC TCA GTC CCC CCG GCC     575
  66  Ala Gln Arg Leu Ala Pro Pro Ser Leu Cys Ala Ser Val Pro Pro Ala      81
 576  CCC TTT ATT TTT TTG AGA CCT AGG GCT GGA GTG CAG TTG AGC GGT CTG     623
  82  Pro Phe Ile Phe Leu Arg Pro Arg Ala Gly Val Gln Leu Ser Gly Leu      97
 624  GGC TCA CTG CAA CCT CTG CCT CCC GGG TTC CAG CGA TTC TCC TGC CTC     671
  98  Gly Ser Leu Gln Pro Leu Pro Pro Gly Phe Gln Arg Phe Ser Cys Leu     113
 672  AGC CTC CTG AGT AGC TGG GAT TAC AGA TGT ATG CTA CCA CGC CCA GGT     719
 114  Ser Leu Leu Ser Ser Trp Asp Tyr Arg Cys Met Leu Pro Arg Pro Gly     129
 720  AGT TTT TGT ATT TTT AGT AGA GAC AGG GTT TCA CTA TGT TGG CCA GGC     767
 130  Ser Phe Cys Ile Phe Ser Arg Asp Arg Val Ser Leu Cys Trp Pro Gly     145
 768  TGG TCT CCA ACT CCT GGC CTC AAA TGA TCA GCC CGC TTC AGC CTC CCA     815
 146  Trp Ser Pro Thr Pro Gly Leu Lys ***                                   154
 816  AAG TGG GGG GAT TAC AGG CGT GAG CCT TGC ACC CCG CTA AGT CCC CTA     863
 864  TCC TCT TGC AAG GGT CTC GCC TCT GTG CCT CAA TTC CTC ATT CTC TGG     911
 912  GCC CTT CTC CTC CTC AGG GCC TCC TGT TCT CAG GGC CTC CCC CCT CCC     959
 960  CGC TCC CTC CCT CTC TCA AGG TCT CCT CCT TCC CTC CCC CCC CCG TCT    1007
1008  CCC CCC TCC CCC GCC TGG GCT TCA CTT CCT TTC CTA CTT GGA TTC TCC    1055
1056  TGC TCG CTG CCT CCC AGC ATC TTT TTT GGA GGC CCG TCT CTT GCT GTG    1103
1104  GGG AAG ACT GGG CTG GCT GCG GGC AGT TTG CAA GGG GTG GGT GGG GCG    1151
1152  GGG GGG GGA GCT GGA CCA GAA GAT GCC CCT TGG AGT GGC AAG GAA GCT    1199
1200  GGA CAG GGC AGG CCT CTG GGG ACG GGA CAC AGG GAA GCC CGA AGG GGC    1247
1248  GCC TTG GCC AGG TCT GCC ATC TCC TCC AGC GAG GCT CTG GCC AGC ACT    1295
1296  GGG TGA GAG TGG GGA GGG GGC ACT GGC CTT TGC AGC ACA GTA AAA CAT    1343
1344  GGT CCA GAC AAC CTG TGG CCC CGG CCT CAT GAG CAC CCC CTG CAC AGG    1391
1392  CCC GGC CCA AGC CAG GCG CTA GAA GGG CTG GTT GTG GAG TGC TTA TCC    1439
1440  TTG ACA GGT ATG GGG CCA GGT GAG GGC AGG GGA CAA GGT GCA GCT GAG    1487
1488  GCC GAG CCC AAC TAG GTC CTG GGC ACC CCT GCA GGT GGG AGT GGT CCT    1535
1536  TGT CCT CCT GGT ATC CAG CAG ACA CCC CCC TCT CCC CAC CAG CCC CAT    1583
1584  TCT CAG GTC CTT TCC TCT TTG TCA CCA ACA CCA AGA ATC TGT CCA GGG    1631
1632  TTC TTG GCT TAT CTT TTA TCT CTT TTC ACT CCT AGA GAG GAA TTG CAA    1679
1680  TTG ACT CAG AAT GAC ACA TTT TTG GCA CCA CGT GTG TAG AAA GCC CCC    1727
1728  ACT GTT AGA TGA TAG CCT CGT GAA ATT CAT GTT TCT GTA TTC TCC TAT    1775
1776  TTC TTT TCA AAA ACT AAT TTT TTT TTT AGT GTA ATA AAT CCT AAG AGG    1823
1824  GAA CTG ATT TAA GAA ACA AGG CCG CCA AAC AAA GGC AGC AGT TCC GAC    1871
1872  TCC AGC AGC TGG GAA AGG AAG GAA AGT GAC CCC ACT TTC ACT CCT GCA    1919
1920  CAG CCC ACT GGT TAC CAA AAC CAC CGT GCA AGT CGG GAT GAC AGC AGG    1967
1968  GAC TTC TGG CCA GGT GGG AAA AGG TGC CTG GAA GCG GGA TGC GCC TGT    2015
2016  GCG TCT CTT GGC CAT GAT GTT CTT GTG GGC ATG TTA TTC TTG GTG CTG    2063
2064  CCT GGG GTG TTG CTG AGC GGA CAG GCT CTC CAG CTG GAG TCC ATG GAG    2111
2112  AGG CCA GAG GCT GGC GGC CCT GCC TGG GCC TTC GGA GCC TCC TGC CTG    2159
2160  CAC CCT CCA CCT CTT CTA AAC CAT GAT GTG GCA CAT TTT GGT GTT AAT    2207
2208  AAA ACA CAA CAC ACA AAG TAA AAA AAA AAA AAA AAA A                  2244
2.PP7706
A:核苷酸序列(SEQ ID NO:4)长度:2929个碱基
  1  GGAGAGAGAG  AGCACTAGTC  TCGCGTTTTT  TTTTTTTTTT  TTTGACAACT  TGCTCTTTTA
 61  ATGTGGAATG  GATGACCCTC  CAATATTTCC  CCAGAGCACC  CCATGCTCTT  CTATCAGGGA
121  ACTTATTAAA  ATCATGTAAC  ATGTTTCTTG  GTGACAAGAT  TTAGGTCTTT  TGTTTCTGTA
181  ACACATGCCA  GATACTTAGC  CCGGTATCTG  GCATGTGGCA  TGCCCAGTAA  ATGTTTGCTG
 241  AATAAGTGAA  TCTATGTCTC  TTGCTTGCCG  CTATTTGCCC  ACTGAATCCA  TGAAGTGAGT
 301  TTTCATAATG  ATTACCACTG  AAAATTCAAC  CCTGAAAAGA  ATGTCTTCGG  TTGTGGGCCC
 361  ATAAAGTCTT  AGAAATAGTG  AAGCTCCTAC  TGTCAGTCCT  TGAAAGGGAA  CAGGACAGCT
 421  GCTGTATGCC  TTGAGAATGG  GCAAAAGACA  AGCGACAAAA  AGAGCAGCGA  AGGCACCTAC
 481  TTGTCCCTCT  GGGCCAGGGC  CTCAGTGTAT  TGGTCGGGCT  TGACCTGGTC  TCCTGGTACA
 541  TCTTCCCAGT  TTTTGGTGAC  TCCCTTCAGT  TTCTCTGAGA  GCTCCAGGTT  ACACTCCTTC
 601  TCTGCTTCCA  CCAGAGCTGC  CATCCGCGCA  GCTTCATTCT  TTGCTAGCCT  GGATTCCTCC
 661  TGCAGAAGCT  GGATCTTATT  CTCCAAGAGC  TCATAAACAT  GCTCCGTCTC  CTGCTGTCGC
 721  TCCTCAAACT  GGCGTCGGAG  CTCAGCTTCA  TTCTGACTGT  TGAGATTCTC  CACATCAGCC
 781  CATGTTTTAT  CCAGATGCTG  TTTCTTGTCC  TGGAGTTCTC  GTTTCAAGCT  CTCCACTTCA
 841  ACCTTCAGCT  CAGTGTTCCG  CTTGTAGATG  TCCTCCCGGC  TGGCCTCATA  CTTCTGTTGC
 901  ATGCGCTCCT  CCAGGAAGTA  GATGAGCAGC  TTGAGGCTGA  AGTTCTCCTT  CTTCAGGTCA
 961  TTGAGGTGCT  TCTCAAAGTC  TCGAAGAGCC  TGGGTCTGTA  CCTGAGGGGG  TTTCTCAAAT
1021  GCTCTCAAGG  AATATGTCTG  CACAAACGGG  ACCTTTTCAC  CACTTCTCCA  GATCTGTGAC
1081  TGCACTGGAG  GGCCTCGATC  TTTAGTGTCA  CTAAGAAAAG  CTGCTGTGTG  ACTCGTTCTG
1141  GGTACCATCT  CCCCATCATC  CTCTGCAAAA  TAATCTCTCG  TCCAGGTCTG  CTCCATTTTC
1201  CAGGCTCTTT  CCTTAGTCTC  AGGACGCTCC  TCACCCGGGA  GGGGAAGCAG  CCTGGGAAAA
1261  TGAGAAGCCT  TGCCCACGAA  TCTCCAGCGC  AAAAGGCAGC  AGCTTTTTCC  TCCCCAGCTC
1321  CTTTCTGCGT  CGGCGGCGAA  GAGAGAGCTC  TGCTCCCTCG  GGAAAGTTTC  TTTGGAGGTC
1381  CGGCCCGGAG  CGGCCATGTC  CCACGGCCCC  AAGCAGCCCG  GCGCGGCCGC  CGCGCCGGCG
1441  GGCGGCAAGG  CTCCGGGCCA  GCATGGGGGC  TTCGTGGTGA  CTGTCAAGCA  AGAGCGCGGC
1501  GAGGGTCCAC  GCGCGGGCGA  GAAGGGGTCC  CACGAGGAGG  AGCCGGTGAA  GAAACGCGGC
1561  TGGCCCAAGG  GCAAGAAGCG  GAAGAAGATT  CTGCCGAATG  GGCCCAAGGC  ACCGGTCACG
1621  GGCTACGTGC  GCTTCCTGAA  CGAGCGGCGC  GAGCAGATCC  GCACGCGCCA  CCCGGATCTG
1681  CCCTTTCCCG  AGATCACCAA  GATGCTGGGC  GCCGAGTGGA  GCAAGCTGCA  GCCAACGGAA
1741  AAGCAGCGGT  ACCTGGATGA  GGCCGAGAGA  GAGAAGCAGC  AGTACATGAA  GGAGCTGCGG
1801  GCGTACCAGC  AGTCTGAAGC  CTATAAGATG  TGCACGGAGA  AGATCCAGGA  GAAGAAGATC
1861  AAGAAAGAAG  ACTCGAGCTC  TGGGCTCATG  AACACTCTCC  TGAATGGACA  CAAGGGTGGG
1921  GACTGCGATG  GCTTCTCCAC  CTTCGATGTT  CCCATCTTCA  CTGAAGAGTT  CTTGGACCAA
1981  AACAAAGCGC  GTGAGGCGGA  GCTTCGGCGC  TTCGGAAGAT  GAATGTGGCC  TTCGAGGAGC
2041  AGAACGCGGT  ACTGCAGAGG  CACACGCAGA  GCATGAGCAG  CGCGCGCGAG  CGTCTGGAGC
2101  AGGACGTGGC  GCTGGAGGAG  CGGAGGACGC  TGGCGCTGCA  GCAGCAGCTC  CAGGCCGTGC
2161  GCCAGGCGCT  CACCGCCAGC  TTCGCCTCAC  TGCCGGTGCC  GGGCACGGGC  GAAACGCCCA
2221  CGCTGGGCAC  TCTGGACTTC  TACATGGCCC  GGCTTCACGG  AGCCATCGAG  CGCGACCCCG
2281  CCCAGCACGA  GAAGCTCATC  GTCCGCATCA  AGGAAATCCT  GGCCCAGGTC  GCCAGCGAGC
2341  ACCTGTGAGG  AGTGGGCGGG  CCCACGATGC  AGAGGAGAAG  CTGTGGGCGC  GGCCCTGCCA
2401  CACCCCACCC  CGTGGACGAG  AGGCTGGGGG  TCCACCTTTG  GGGCCTGGTC  CCATCCTGCA
2461  CCTTGGGGGC  TCCAGCCCCC  CTAAAATTAA  ATTTCTGCAG  CATCCCTTTA  GCTTTCAATC
2521  TCCCCAGCCC  CCTGAACCCG  GAAAAAGCAC  CGTGCGCGAT  ACACCCAGAA  GAACCTCACA
2581  GCCGAGGGTG  CCCCTCCTCG  GAGGACAAGC  CACGCGCTAC  ACTGGCTCTC  CGGGCCACCC
2641  CCAGGACACA  GGGCAGACGA  AACCCACCCC  CAGCACACGG  CAGGACCCCC  CAAATTACTC
2701  ACTACGGGGG  GCTGTGCCAT  AGGCCACACA  GGAAGCTGCC  TTGTGGGGAC  TTACCTGGGG
2761  TGTCCCCCGC  ATGCCTGTAC  CCCAGATGGG  TGGGGGCCGG  CTTTGCCCAT  CCTGCTCTCC
2821  TCCAGCCGAG  GGACCCTGGT  GGGGGTGGCT  CCTTCTCACT  GCTGGATCCG  GACTTTTTAA
2881  ATAAAAACAA  GTAAAATTTG  TGTTTTAAAA  AAAAAAAAAA  AAAAAAAAA
B:核苷酸序列(SEQ ID NO:5)长度:272个氨基酸
  1  MDTRVGTAMA  SPPSMFPSSL  KSSWTKTKRV  RRSFGASEDE  CGLRGAERGT  AEAHAEHEQR
 61  ARASGAGRGA  GGAEDAGAAA  AAPGRAPGAH  RQLRLTAGAG  HGRNAHAGHS  GLLHGPASRS
121  HRARPRPARE  AHRPHQGNPG  PGRQRAPVRS  GRAHDAEEKL  WARPCHTPPR  GREAGGPPLG
181  PGPILHLGGS  SPPKIKFLQH  PFSFQSPQPP  EPGKSTVRDT  PRRTSQPRVP  LLGGQATRYT

241 GSPGHPQDTG QTKPTPSTRQ DPPNYSLRGA VP
C.核苷酸及氨基酸组合序列(SEQ ID NO:6)克隆号:PP7706
起始编码子:1904 ATG  终止编码子:2720 TAG  蛋白质分子量:28556.18
   1    G GAG AGA GAG AGC ACT AGT CTC GCG TTT TTT TTT TTT TTT TTT GAC      46
  47  AAC TTG CTC TTT TAA TGT GGA ATG GAT GAC CCT CCA ATA TTT CCC CAG      94
  95  AGC ACC CCA TGC TCT TCT ATC AGG GAA CTT ATT AAA ATC ATG TAA CAT     142
 143  GTT TCT TGG TGA CAA GAT TTA GGT CTT TTG TTT CTG TAA CAC ATG CCA     190
 191  GAT ACT TAG CCC GGT ATC TGG CAT GTG GCA TGC CCA GTA AAT GTT TGC     238
 239  TGA ATA AGT GAA TCT ATG TCT CTT GCT TGC CGC TAT TTG CCC ACT GAA     286
 287  TCC ATG AAG TGA GTT TTC ATA ATG ATT ACC ACT GAA AAT TCA ACC CTG     334
 335  AAA AGA ATG TCT TCG GTT GTG GGC CCA TAA AGT CTT AGA AAT AGT GAA     382
 383  GCT CCT ACT GTC AGT CCT TGA AAG GGA ACA GGA CAG CTG CTG TAT GCC     430
 431  TTG AGA ATG GGC AAA AGA CAA GCG ACA AAA AGA GCA GCG AAG GCA CCT     478
 479  ACT TGT CCC TCT GGG CCA GGG CCT CAG TGT ATT GGT CGG GCT TGA CCT     526
 527  GGT CTC CTG GTA CAT CTT CCC AGT TTT TGG TGA CTC CCT TCA GTT TCT     574
 575  CTG AGA GCT CCA GGT TAC ACT CCT TCT CTG CTT CCA CCA GAG CTG CCA     622
 623  TCC GCG CAG CTT CAT TCT TTG CTA GCC TGG ATT CCT CCT GCA GAA GCT     670
 671  GGA TCT TAT TCT CCA AGA GCT CAT AAA CAT GCT CCG TCT CCT GCT GTC     718
 719  GCT CCT CAA ACT GGC GTC GGA GCT CAG CTT CAT TCT GAC TGT TGA GAT     766
 767  TCT CCA CAT CAG CCC ATG TTT TAT CCA GAT GCT GTT TCT TGT CCT GGA     814
 815  GTT CTC GTT TCA AGC TCT CCA CTT CAA CCT TCA GCT CAG TGT TCC GCT     862
 863  TGT AGA TGT CCT CCC GGC TGG CCT CAT ACT TCT GTT GCA TGC GCT CCT     910
 911  CCA GGA AGT AGA TGA GCA GCT TGA GGC TGA AGT TCT CCT TCT TCA GGT     958
 959  CAT TGA GGT GCT TCT CAA AGT CTC GAA GAG CCT GGG TCT GTA CCT GAG    1006
1007  GGG GTT TCT CAA ATG CTC TCA AGG AAT ATG TCT GCA CAA ACG GGA CCT    1054
1055  TTT CAC CAC TTC TCC AGA TCT GTG ACT GCA CTG GAG GGC CTC GAT CTT    1102
1103  TAG TGT CAC TAA GAA AAG CTG CTG TGT GAC TCG TTC TGG GTA CCA TCT    1150
1151  CCC CAT CAT CCT CTG CAA AAT AAT CTC TCG TCC AGG TCT GCT CCA TTT    1198
1199  TCC AGG CTC TTT CCT TAG TCT CAG GAC GCT CCT CAC CCG GGA GGG GAA    1246
1247  GCA GCC TGG GAA AAT GAG AAG CCT TGC CCA CGA ATC TCC AGC GCA AAA    1294
1295  GGC AGC AGC TTT TTC CTC CCC AGC TCC TTT CTG CGT CGG CGG CGA AGA    1342
1343  GAG AGC TCT GCT CCC TCG GGA AAG TTT CTT TGG AGG TCC GGC CCG GAG    1390
1391  CGG CCA TGT CCC ACG GCC CCA AGC AGC CCG GCG CGG CCG CCG CGC CGG    1438
1439  CGG GCG GCA AGG CTC CGG GCC AGC ATG GGG GCT TCG TGG TGA CTG TCA    1486
1487  AGC AAG AGC GCG GCG AGG GTC CAC GCG CGG GCG AGA AGG GGT CCC ACG    1534
1535  AGG AGG AGC CGG TGA AGA AAC GCG GCT GGC CCA AGG GCA AGA AGC GGA    1582
1583  AGA AGA TTC TGC CGA ATG GGC CCA AGG CAC CGG TCA CGG GCT ACG TGC    1630
1631  GCT TCC TGA ACG AGC GGC GCG AGC AGA TCC GCA CGC GCC ACC CGG ATC    1678
1679  TGC CCT TTC CCG AGA TCA CCA AGA TGC TGG GCG CCG AGT GGA GCA AGC    1726
1727  TGC AGC CAA CGG AAA AGC AGC GGT ACC TGG ATG AGG CCG AGA GAG AGA    1774
1775  AGC AGC AGT ACA TGA AGG AGC TGC GGG CGT ACC AGC AGT CTG AAG CCT    1822
1823  ATA AGA TGT GCA CGG AGA AGA TCC AGG AGA AGA AGA TCA AGA AAG AAG    1870
1871  ACT CGA GCT CTG GGC TCA TGA ACA CTC TCC TGA ATG GAC ACA AGG GTG    1918
   1                                              Met Asp Thr Arg Val       5
1919  GGG ACT GCG ATG GCT TCT CCA CCT TCG ATG TTC CCA TCT TCA CTG AAG    1966
   6  Gly Thr Ala Met Ala Ser Pro Pro Ser Met Phe Pro Ser Ser Leu Lys      21
1967  AGT TCT TGG ACC AAA ACA AAG CGC GTG AGG CGG AGC TTC GGC GCT TCG    2014
  22  Ser Ser Trp Thr Lys Thr Lys Arg Val Arg Arg Ser Phe Gly Ala Ser      37
2015  GAA GAT GAA TGT GGC CTT CGA GGA GCA GAA CGC GGT ACT GCA GAG GCA    2062
  38  Glu Asp Glu Cys Gly Leu Arg Gly Ala Glu Arg Gly Thr Ala Glu Ala      53
2063  CAC GCA GAG CAT GAG CAG CGC GCG CGA GCG TCT GGA GCA GGA CGT GGC    2110
  54  His Ala Glu His Glu Gln Arg Ala Arg Ala Ser Gly Ala Gly Arg Gly      69
2111  GCT GGA GGA GCG GAG GAC GCT GGC GCT GCA GCA GCA GCT CCA GGC CGT    2158
  70  Ala Gly Gly Ala Glu Asp Ala Gly Ala Ala Ala Ala Ala Pro Gly Arg      85
2159  GCG CCA GGC GCT CAC CGC CAG CTT CGC CTC ACT GCC GGT GCC GGG CAC    2206
  86  Ala Pro Gly Ala His Arg Gln Leu Arg Leu Thr Ala Gly Ala Gly His     101
2207  GGG CGA AAC GCC CAC GCT GGG CAC TCT GGA CTT CTA CAT GGC CCG GCT    2254
 102  Gly Arg Asn Ala His Ala Gly His Ser Gly Leu Leu His Gly Pro Ala     117
2255  TCA CGG AGC CAT CGA GCG CGA CCC CGC CCA GCA CGA GAA GCT CAT CGT    2302
 118  Ser Arg Ser His Arg Ala Arg Pro Arg Pro Ala Arg Glu Ala His Arg     133
2303  CCG CAT CAA GGA AAT CCT GGC CCA GGT CGC CAG CGA GCA CCT GTG AGG    2350
 134  Pro His Gln Gly Asn Pro Gly Pro Gly Arg Gln Arg Ala Pro Val Arg     149
2351  AGT GGG CGG GCC CAC GAT GCA GAG GAG AAG CTG TGG GCG CGG CCC TGC    2398
 150  Ser Gly Arg Ala His Asp Ala Glu Glu Lys Leu Trp Ala Arg Pro Cys     165
2399  CAC ACC CCA CCC CGT GGA CGA GAG GCT GGG GGT CCA CCT TTG GGG CCT    2446
 166  His Thr Pro Pro Arg Gly Arg Glu Ala Gly Gly Pro Pro Leu Gly Pro     181
2447  GGT CCC ATC CTG CAC CTT GGG GGC TCC AGC CCC CCT AAA ATT AAA TTT    2494
 182  Gly Pro Ile Leu His Leu Gly Gly Ser Ser Pro Pro Lys Ile Lys Phe     197
2495  CTG CAG CAT CCC TTT AGC TTT CAA TCT CCC CAG CCC CCT GAA CCC GGA    2542
 198  Leu Gln His Pro Phe Ser Phe Gln Ser Pro Gln Pro Pro Glu Pro Gly     213
2543  AAA AGC ACC GTG CGC GAT ACA CCC AGA AGA ACC TCA CAG CCG AGG GTG    2590
 214  Lys Ser Thr Val Arg Asp Thr Pro Arg Arg Thr Ser Gln Pro Arg Val     229
2591  CCC CTC CTC GGA GGA CAA GCC ACG CGC TAC ACT GGC TCT CCG GGC CAC    2638
 230  Pro Leu Leu Gly Gly Gln Ala Thr Arg Tyr Thr Gly Ser Pro Gly His     245
2639  CCC CAG GAC ACA GGG CAG ACG AAA CCC ACC CCC AGC ACA CGG CAG GAC    2686
 246  Pro Gln Asp Thr Gly Gln Thr Lys Pro Thr Pro Ser Thr Arg Gln Asp     261
2687  CCC CCA AAT TAC TCA CTA CGG GGG GCT GTG CCA TAG GCC ACA CAG GAA    2734
 262  Pro Pro Asn Tyr Ser Leu Arg Gly Ala Val Pro ***                     273
2735  GCT GCC TTG TGG GGA CTT ACC TGG GGT GTC CCC CGC ATG CCT GTA CCC    2782
2783  CAG ATG GGT GGG GGC CGG CTT TGC CCA TCC TGC TCT CCT CCA GCC GAG    2830
2831  GGA CCC TGG TGG GGG TGG CTC CTT CTC ACT GCT GGA TCC GGA CTT TTT    2878
2879  AAA TAAAAA CAA GTA AAA TTT GTG TTT TAA AAA AAA AAA AAA AAA AAA     2926
2927  AAA                                                                2929
3.PPl0484
A:核苷酸序列(SEQ ID NO:7)长度:1788个碱基
  1  GGCTAAATCA  TATAACAGGG  TCACAGTAAT  GGGGGGTTTC  AAAGTGGAGA  ACCACACGGC
 61  GTGCCACTGC  AGTACTTGGT  AAAACATTTA  AGATTTGTGA  TAATAACAAG  TACTGCAGTG
121  GCACGCCGGG  CCCCCAGAAC  CCTATGAAGC  CCAGCAGTCT  GAGCCAATCG  CCTACTTCCG
181  GGGCCTACGG  CTGGTCATGA  GCCACGGCCC  ATACATCAAA  CTTATTACTG  GCTTCCTCTT
241  CACCTCCTTG  GCTTTCATGC  TGGTGGAGGG  GAACTTTGTC  TTGTTTTGCA  CCTACACCTT
301  GGGCTTCCGC  AATGAATTCC  AGAATCTACT  CCTGGCCATC  ATGGTGAGTG  GGACCTGAGC
361  AGGGGCGGGC  AGCCTGGGCT  GAGGTGACAT  AGGCTGTGGA  ATGGTTCTTG  GAATAGGCAG
421  AGGATGTTTC  TCAGGCTGGC  CCAAGGTCAT  GAAAGGATGA  GGGAGGCTTC  TCAGGGTATT
481  TGGTTGGACC  TTGCGAAGGT  AGGACTGTGA  AAGAAAGAGT  TTGAGGTTAG  ATGTTTGAGT
541  AGTGAGCACA  GCAAAAGCAA  GGGCGAGGAC  ACCAGGAACT  TGGCTCAGAG  GTTTGAGAGG
 601  GCAGCAGACA  AGGTGGGCCT  GGACCAGCTC  TGAGCTCCCC  TGGGGAGCCG  TCAAAGGTGC
 661  CTGTCATCTT  CGTTGCTGCC  CACATGATGT  CATCTGGCTG  CTCTTGGGCA  GGGCTGGGAG
 721  CCACTTTGGG  GTTCTGGGAA  GGGCAGGAGG  GGCTCTGTGG  CTCTAAAGCA  CCTCCCTTTA
 781  ACCCCCTTTG  TCCATCCACA  GCTCTCGGCC  ACTTTAACCA  TTCCCATCTG  GCAGTGGTTC
 841  TTGACCCGGT  TTGGCAAGAA  GACAGCTGTA  TATGTTGGGA  TCTCATCAGC  AGTGCCATTT
 901  CTCATCTTGG  TGGCCCTCAT  GGAGAGTAAC  CTCATCATTA  CATATGCGGT  AGCTGTGGCA
 961  GCTGGCATCA  GTGTGGCAGC  TGCCTTCTTA  CTACCCTGGT  CCATGCTGCC  TGATGTCATT
1021  GACGACTTCC  ATCTGAAGCA  GCCCCACTTC  CATGGAACCG  AGCCCATCTT  CTTCTCCTTC
1081  TATGTCTTCT  TCACCAAGTT  TGCCTCTGGA  GTGTCACTGG  GCATTTCTAC  CCTCAGTCTG
1141  GACTTTGCAG  GGTACCAGAC  CCGTGGCTGC  TCGCAGCCGG  AACGTGTCAA  GTTTACACTG
1201  AACATGCTCG  TGACCATGGC  TCCCATAGTT  CTCATCCTGC  TGGGCCTGCT  GCTCTTCAAA
1261  ATGTACCCCA  TTGATGAGGA  GAGGCGGCGG  CAGAATAAGA  AGGCCCTGCA  GGCACTGAGG
1321  GACGAGGCCA  GCAGCTCTGG  CTGCTCAGAA  ACAGACTCCA  CAGAGCTGGC  TAGCATCCTC
1381  TAGGGCCCGC  CACGTTGCCC  GAAGCCACCA  TGCAGAAGGC  CACAGAAGGG  ATCAGGACCT
1441  GTCTGCCGGC  TTGCTGAGCA  GCTGGACTGC  AGGTGCTAGG  AAGGGAACTG  AAGACTCAAG
1501  GAGGTGGCCC  AGGACACTTG  CTGTGCTCAC  TGTGGGGCCG  GCTGCTCTGT  GGCCTCCTGC
1561  CTCCCCTCTG  CCTGCCTGTG  GGGCCAAGCC  CTGGGGCTGC  CACTGTGAAT  ATGCCAAGGA
1621  CTGATCGGGC  CTAGCCCGGA  ACACTAATGT  AGAAACCTTT  TTTTTACAGA  GCCTAATTAA
1681  TAACTTAATG  ACTGTGTACA  TAGCAATGTG  TGTGTATGTA  TATGTCTGTG  AGCTATTAAT
1741  GTTATTAATT  TTCATAAAAG  CTGGAAAGCA  AAAAAAAAAA  AAAAAAAA
B:核苷酸序列(SEQ ID NO:8)长度:154个氨基酸

  1 MESNLIITYA VAVAAGISVA AAFLLPWSML PDVIDDFHLK QPHFHGTEPI FFSFYVFFTK

 61 FASGVSLGIS TLSLDFAGYQ TRGCSQPERV KFTLNMLVTM APIVLILLGL LLFKMYPIDE

121 ERRRQNKKAL QALRDEASSS GCSETDSTEL ASIL
C.核苷酸及氨基酸组合序列(SEQ ID NO:9)克隆号:PP10484
起始编码子:919 ATG  终止编码子:1381 TAG  蛋白质分子量:17057.85
  1  GGC TAA ATC ATA TAA CAG GGT CAC AGT AAT GGG GGG TTT CAA AGT GGA      48
 49  GAA CCA CAC GGC GTG CCA CTG CAG TAC TTG GTA AAA CAT TTA AGA TTT      96
 97  GTG ATA ATA ACA AGT ACT GCA GTG GCA CGC CGG GCC CCC AGA ACC CTA     144
145  TGA AGC CCA GCA GTC TGA GCC AAT CGC CTA CTT CCG GGG CCT ACG GCT     192
192  GGT CAT GAG CCA CGG CCC ATA CAT CAA ACT TAT TAC TGG CTT CCT CTT     240
241  CAC CTC CTT GGC TTT CAT GCT GGT GGA GGG GAA CTT TGT CTT GTT TTG     288
289  CAC CTA CAC CTT GGG CTT CCG CAA TGA ATT CCA GAA TCT ACT CCT GGC     336
337  CAT CAT GGT GAG TGG GAC CTG AGC AGG GGC GGG CAG CCT GGG CTG AGG     384
385  TGA CAT AGG CTG TGG AAT GGT TCT TGG AAT AGG CAG AGG ATG TTT CTC     432
433  AGG CTG GCC CAA GGT CAT GAA AGG ATG AGG GAG GCT TCT CAG GGT ATT     480
481  TGG TTG GAC CTT GCG AAG GTA GGA CTG TGA AAG AAA GAG TTT GAG GTT     528
529  AGA TGT TTG AGT AGT GAG CAC AGC AAA AGC AAG GGC GAG GAC ACC AGG     576
577  AAC TTG GCT CAG AGG TTT GAG AGG GCA GCA GAC AAG GTG GGC CTG GAC     624
625  CAG CTC TGA GCT CCC CTG GGG AGC CGT CAA AGG TGC CTG TCA TCT TCG     672
673  TTG CTG CCC ACA TGA TGT CAT CTG GCT GCT CTT GGG CAG GGC TGG GAG     720
721  CCA CTT TGG GGT TCT GGG AAG GGC AGG AGG GGC TCT GTG GCT CTA AAG     768
769  CAC CTC CCT TTA ACC CCC TTT GTC CAT CCA CAG CTC TCG GCC ACT TTA     816
817  ACC ATT CCC ATC TGG CAG TGG TTC TTG ACC CGG TTT GGC AAG AAG ACA     864
865  GCT GTA TAT GTT GGG ATC TCA TCA GCA GTG CCA TTT CTC ATC TTG GTG     912
913  GCC CTC ATG GAG AGT AAC CTC ATC ATT ACA TAT GCG GTA GCT GTG GCA     960
  1          Met Glu Ser Asn Leu Ile Ile Thr Tyr Ala Val Ala Val Ala     14
961  GCT GGC ATC AGT GTG GCA GCT GCC TTC TTA CTA CCC TGG TCC ATG CTG    1008
  15  Ala Gly Ile Ser Val Ala Ala Ala Phe Leu Leu Pro Trp Ser Met Leu      30
1009  CCT GAT GTC ATT GAC GAC TTC CAT CTG AAG CAG CCC CAC TTC CAT GGA    1056
  31  Pro Asp Val Ile Asp Asp Phe His Leu Lys Gln Pro His Phe His Gly      46
1057  ACC GAG CCC ATC TTC TTC TCC TTC TAT GTC TTC TTC ACC AAG TTT GCC    1104
  47  Thr Glu Pro Ile Phe Phe Ser Phe Tyr Val Phe Phe Thr Lys Phe Ala      62
1105  TCT GGA GTG TCA CTG GGC ATT TCT ACC CTC AGT CTG GAC TTT GCA GGG    1152
  63  Ser Gly Val Ser Leu Gly Ile Ser Thr Leu Ser Leu Asp Phe Ala Gly      78
1153  TAC CAG ACC CGT GGC TGC TCG CAG CCG GAA CGT GTC AAG TTT ACA CTG    1200
  79  Tyr Gln Thr Arg Gly Cys Ser Gln Pro Glu Arg Val Lys Phe Thr Leu      94
1201  AAC ATG CTC GTG ACC ATG GCT CCC ATA GTT CTC ATC CTG CTG GGC CTG    1248
  95  Asn Met Leu Val Thr Met Ala Pro Ile Val Leu Ile Leu Leu Gly Leu     110
1249  CTG CTC TTC AAA ATG TAC CCC ATT GAT GAG GAG AGG CGG CGG CAG AAT    1296
 111  Leu Leu Phe Lys Met Tyr Pro Ile Asp Glu Glu Arg Arg Arg Gln Asn     126
1297  AAG AAG GCC CTG CAG GCA CTG AGG GAC GAG GCC AGC AGC TCT GGC TGC    1344
 127  Lys Lys Ala Leu Gln Ala Leu Arg Asp Glu Ala Ser Ser Ser Gly Cys     142
1345  TCA GAA ACA GAC TCC ACA GAG CTG GCT AGC ATC CTC TAG GGC CCG CCA    1392
 143  Ser Glu Thr Asp Ser Thr Glu Leu Ala Ser Ile Leu ***                 155
1393  CGT TGC CCG AAG CCA CCA TGC AGA AGG CCA CAG AAG GGA TCA GGA CCT    1440
1441  GTC TGC CGG CTT GCT GAG CAG CTG GAC TGC AGG TGC TAG GAA GGG AAC    1488
1489  TGA AGA CTC AAG GAG GTG GCC CAG GAC ACT TGC TGT GCT CAC TGT GGG    1536
1537  GCC GGC TGC TCT GTG GCC TCC TGC CTC CCC TCT GCC TGC CTG TGG GGC    1584
1585  CAA GCC CTG GGG CTG CCA CTG TGA ATA TGC CAA GGA CTG ATC GGG CCT    1632
1633  AGC CCG GAA CAC TAA TGT AGA AAC CTT TTT TTT ACA GAG CCT AAT TAA    1680
1681  TAA CTT AAT GAC TGT GTA CAT AGC AAT GTG TGT GTA TGT ATA TGT CTG    1728
1729  TGA GCT ATT AAT GTT ATT AAT TTT CAT AAA AGC TGG AAA GCA AAA AAA    1776
1777  AAA AAA AAA AAA                                                    1788
4. PP10566
A:核苷酸序列(SEQ ID NO:10)长度:2559个碱基
   1  GCAGAGCCTG  AGCAGGCAGG  GCACCTCCAG  GTGGGCAGGA  GCTACCACTC  AGCACCATGA
  61  GCACCACCAC  AGGCCCAGAA  GCTGCCCCAA  AGCCAAGCGC  CAAGTCTATC  TATGAGCAGA
 121  GGAAGCGTTA  CTCCACAGTT  GTTATGGCTG  ATGTATCCCA  GTACCCAGTC  AATCACCTGG
 181  TGACGTTCTG  CCTGGGTGAG  GACGATGGCG  TGCATACCGT  GGAGGATGCC  TCCAGGAAGT
 241  TGGCCGTCAT  GGATAGCCAG  GGCCGAGTCT  GGGCACAGGA  GATGCTGCTG  CGAGTGTCTC
 301  CCGACCATGT  CACGCTGCTC  GACCCGGCCT  CCAAGGAGGA  GCTGGAGTCG  TACCCACTGG
 361  GCGCCATCGT  GCGCTGTGAC  GCGGTGATGC  CACCCGGCAG  GAGCCGCTCG  TTGCTGCTGC
 421  TCGTGTGCCA  GGAACCCGAG  CGCGCGCAGC  CCGACGTGCA  CTTCTTCCAG  GGCCTGCGCC
 481  TCGGGGCGGA  GCTGATCCGA  GAGGACATCC  AGGGGGCTCT  GCACAATTAC  CGCTCGGGCC
 541  GCGGGGAGCG  CAGGGCGGCG  GCGCTCAGGG  CCACGCAGGA  GGAGTTGCAG  CGCGACCGCT
 601  CGCCCGCCGC  TGAGACCCCG  CCCCTGCAGC  GCCGCCCGTC  AGTCCGCGCA  GTGATCAGCA
 661  CCGTAGAGCG  GGGCGCGGGC  CGCGGACGAC  CCCAGGCGAA  GCCCATTCCC  GAGGCAGAGG
 721  AGGCGCAGAG  GCCTGAGCCG  GTGGGGACCT  CGAGCAACGC  TGACTCGGCC  TCCCCGGACC
 781  TGGGTCCCCG  GGGTCCTGAC  CTGGCGGTTC  TGCAGGCGGA  GCGGGAAGTG  GACATCCTGA
 841  ACCACGTGTT  CGACGACGTA  GAGAGCTTTG  TATCGAGGCT  GCAGAAGTCG  GCGGAGGCGG
 901  CCAGGGTGCT  GGAGCACCGG  GAACGCGGCC  GCAGGAGCCG  GCGCCGGGCG  GCTGGGGAGG
 961  GCTTGCTGAC  GCTGCGGGCC  AAGCCGCCCT  CGGAGGCCGA  GTACACCGAC  GTGCTGCAGA
1021  AGATCAAGTA  CGCCTTCAGC  CTGCTGGCCC  GGCTGCGCGG  CAACATCGCC  GACCCCTCCT
1081  CTCCGGAGCT  GTTGCACTTC  CTTTTCGGGC  CTCTGCAGAT  GATTGTGAAC  ACGTCGGGGG
1141  GGCCGGAGTT  CGCGAGCAGT  GTGCGGCGGC  CGCATCTGAC  ATCGGATGCC  GTGGCGCTGC
1201  TGCGGGACAA  CGTCACTCCA  CGTGAAAACG  AGCTCTGGAC  CTCGCTGGGG  GACTCGTGGA
1261  CCCGCCCCGG  GCTGGAGCTG  TCCCCGGAGG  AGGGACCCCC  ATACAGACCC  GAGTTCTTCA
1321  GCGGCTGGGA  GCCGCCGGTC  ACTGACCCGC  AGAGCCGCGC  CTGGGAGGAC  CCAGTTGAGA
1381  AACAGCTACA  GCACGAGCGG  AGGCGCCGGC  AGCAAAGCGC  CCCCGAGGTC  GCTGTCAATG
1441  GTCACCGAGA  CTTGGAGCCA  GAATCTGAGC  CTCAGCTGGA  GTCAGAGACA  GCAGGAAAAT
1501  GGGTCCTGTG  TAATTATGAC  TTCCAGGCCC  GCAACAGCAG  TGAGCTGTCG  GTCAAGCAGC
1561  GGGACGTACT  GGAGGTCCTG  GATGACAGTC  GTAAGTGGTG  GAAGGTTCGG  GACCCAGCGG
1621  GGCAGGAGGG  ATATGTGCCC  TACAACATCC  TGACACCCTA  CCCCGGACCC  CGGCTGCACC
1681  ACAGCCAAAG  CCCTGCCCGC  AGCCTGAACA  GCACTCCTCC  TCCACCACCA  GCCCCAGCCC
1741  CGGCCCCACC  TCCAGCTCTG  GCTCGGCCCC  GCTGGGACAG  GCCCCGCTGG  GACAGCTGCG
1801  ATAGCCTCAA  CGGCTTGGAC  CCCAGCGAGA  AGGAGAAATT  CTCCCAGATG  CTCATCGTCA
1861  ACGAGGAACT  GCAGGCGCGC  CTGGCCCAGG  GCCGCTCGGG  ACCGAGCCGC  GCAGTCCCAG
1921  GGCCCCGCGC  CCCGGAACCG  CAGCTCAGCC  CGGGCTCGGA  CGCCTCCGAG  GTCCGCGCCT
1981  GGCTGCAGGC  CAAGGGCTTT  AGCTCCGGGA  CCGTGGACGC  GCTGGGTGTG  CTGACCGGGG
2041  CGCAGCTTTT  CTCGCTGCAG  AGGGAGGAGC  TGCGGGCGGT  GAGCCCCGAG  GAGGGGGCAC
2101  GTGTGTACAG  CCAGGTCACC  GTGCAGCGCT  CGCTGCTGGA  GGACAAAGAG  AAAGTGTCAG
2161  AGCTGGAGGC  AGTGATGGAG  AAGCAAAAGA  AGAAGGTGGA  AGGCGAGGTG  GAAATGGAGG
2221  TCATTTGACC  TGCCAGGCGC  CCTTCGCAAA  GAGTGACGAG  GCCCCGTGGG  AGAACGGACT
2281  CCTCAGACTC  TCCCCAATAG  CGGAAGTCGA  TCTTCTGAAG  GATGGCCAAT  CTGCTCCGGC
2341  CCTGGTCTTC  CCCCATCCCG  GTGGACAGAC  TTAACGATCC  TTGCTGCAGT  CCCTCCGGAG
2401  AGGATCTGGA  CTGGCTGGGA  GTGGGGAGGG  CGTGGAGACA  GTCTACGGAA  AGCGCTAGCA
2461  GACCCCCGAG  AGGGTGCAGT  GGAGCCCTGA  GCATTGTAAT  ATGCGGCCCA  GCCTATAAAC
2521  AGCCTCCGTG  CTTAGCAAAA  AAAAAAAAAA  AAAAAAAAA
B:核苷酸序列(SEQ ID NO:11)长度:723个氨基酸
  1  MSTTTGPEAA  PKPSAKSIYE  QRKRYSTVVM  ADVSQYPVNH  LVTFCLGEDD  GVHTVEDASR
 61  KLAVMDSQGR  VWAQEMLLRV  SPDHVTLLDP  ASKEELESYP  LGAIVRCDAV  MPPGRSRSLL
121  LLVCQEPERA  QPDVHFFQGL  RLGAELIRED  IQGALHNYRS  GRGERRAAAL  RATQEELQRD
181  RSPAAETPPL  QRRPSVRAVI  STVERGAGRG  RPQAKPIPEA  EEAQRPEPVG  TSSNADSASP
241  DLGPRGPDLA  VLQAEREVDI  LNHVFDDVES  FVSRLQKSAE  AARVLEHRER  GRRSRRRAAG
301  EGLLTLRAKP  PSEAEYTDVL  QKIKYAFSLL  ARLRGNIADP  SSPELLHFLF  GPLQMIVNTS
361  GGPEFASSVR  RPHLTSDAVA  LLRDNVTPRE  NELWTSLGDS  WTRPGLELSP  EEGPPYRPEF
421  FSGWEPPVTD  PQSRAWEDPV  EKQLQHERRR  RQQSAPEVAV  NGHRDLEPES  EPQLESETAG
481  KWLCNYDFQ   ARNSSELSVK  QRDVLEVLDD  SRKWWKVRDP  AGQEGYVPYN  ILTPYPGPRL
541  HHSQSPARSL  NSTPPPPPAP  APAPPPALAR  PRWDRPRWDS  CDSLNGLDPS  EKEKFSQMLI
601  VNEELQARLA  QGRSGPSRAV  PGPRAPEPQL  SPGSDASEVR  AWLQAKGFSS  GTVDALGVLT
661  GAQLFSLQRE  ELRAVSPEEG  ARVYSQVTVQ  RSLLEDKEKV  SELEAVMEKQ  KKKVEGEVEM
721  EVI
C.核苷酸及氨基酸组合序列(SEQ ID NO:12)克隆号:PP10566
起始编码子:57 ATG  终止编码子:2226 TGA  蛋白质分子量:80305.65
  1   GC AGA GCC TGA GCA GGC AGG GCA CCT CCA GGT GGG CAG GAG CTA CCA      47
 48  CTC AGC ACC ATG AGC ACC ACC ACA GGC CCA GAA GCT GCC CCA AAG CCA      95
  1              Met Ser Thr Thr Thr Gly Pro Glu Ala Ala Pro Lys Pro      13
 96  AGC GCC AAG TCT ATC TAT GAG CAG AGG AAG CGT TAC TCC ACA GTT GTT     143
 14  Ser Ala Lys Ser Ile Tyr Glu Gln Arg Lys Arg Tyr Ser Thr Val Val      29
144  ATG GCT GAT GTA TCC CAG TAC CCA GTC AAT CAC CTG GTG ACG TTC TGC     191
 30  Met Ala Asp Val Ser Gln Tyr Pro Val Asn His Leu Val Thr Phe Cys      45
192  CTG GGT GAG GAC GAT GGC GTG CAT ACC GTG GAG GAT GCC TCC AGG AAG     239
  46  Leu Gly Glu Asp Asp Gly Val His Thr Val Glu Asp Ala Ser Arg Lys      61
 240  TTG GCC GTC ATG GAT AGC CAG GGC CGA GTC TGG GCA CAG GAG ATG CTG     287
  62  Leu Ala Val Met Asp Ser Gln Gly Arg Val Trp Ala Gln Glu Met Leu      77
 288  CTG CGA GTG TCT CCC GAC CAT GTC ACG CTG CTC GAC CCG GCC TCC AAG     335
  78  Leu Arg Val Ser Pro Asp His Val Thr Leu Leu Asp Pro Ala Ser Lys      93
 336  GAG GAG CTG GAG TCG TAC CCA CTG GGC GCC ATC GTG CGC TGT GAC GCG     383
  94  Glu Glu Leu Glu Ser Tyr Pro Leu Gly Ala Ile Val Arg Cys Asp Ala     109
 384  GTG ATG CCA CCC GGC AGG AGC CGC TCG TTG CTG CTG GTC GTG TGC CAG     431
 110  Val Met Pro Pro Gly Arg Ser Arg Ser Leu Leu Leu Leu Val Cys Gln     125
 432  GAA CCC GAG CGC GCG CAG CCC GAC GTG CAC TTC TTC CAG GGC CTG CGC     479
 126  Glu Pro Glu Arg Ala Gln Pro Asp Val His Phe Phe Gln Gly Leu Arg     141
 480  CTC GGG GCG GAG CTG ATC CGA GAG GAC ATC CAG GGG GCT CTG CAC AAT     527
 142  Leu Gly Ala Glu Leu Ile Arg Glu Asp Ile Gln Gly Ala Leu His Asn     157
 528  TAC CGC TCG GGC CGC GGG GAG CGC AGG GCG GCG GCG CTC AGG GCC ACG     575
 158  Tyr Arg Ser Gly Arg Gly Glu Arg Arg Ala Ala Ala Leu Arg Ala Thr     173
 576  CAG GAG GAG TTG CAG CGC GAC CGC TCG CCC GCC GCT GAG ACC CCG CCC     623
 174  Gln Glu Glu Leu Gln Arg Asp Arg Ser Pro Ala Ala Glu Thr Pro Pro     189
 624  CTG CAG CGC CGC CCG TCA GTC CGC GCA GTG ATC AGC ACC GTA GAG CGG     671
 190  Leu Gln Arg Arg Pro Ser Val Arg Ala Val Ile Ser Thr Val Glu Arg     205
 672  GGC GCG GGC CGC GGA CGA CCC CAG GCG AAG CCC ATT CCC GAG GCA GAG     719
 206  Gly Ala Gly Arg Gly Arg Pro Gln Ala Lys Pro Ile Pro Glu Ala Glu     221
 720  GAG GCG CAG AGG CCT GAG CCG GTG GGG ACC TCG AGC AAC GCT GAC TCG     767
 222  Glu Ala Gln Arg Pro Glu Pro Val Gly Thr Ser Ser Asn Ala Asp Ser     237
 768  GCC TCC CCG GAG CTG GGT CCC CGG GGT CCT GAC CTG GCG GTT CTG CAG     815
 238  Ala Ser Pro Asp Leu Gly Pro Arg Gly Pro Asp Leu Ala Val Leu Gln     253
 816  GCG GAG CGG GAA GTG GAC ATC CTG AAC CAC GTG TTC GAC GAC GTA GAG     863
 254  Ala Glu Arg Glu Val Asp Ile Leu Asn His Va1 Phe Asp Asp Val Glu     269
 864  AGC TTT GTA TCG AGG CTG CAG AAG TCG GCG GAG GCG GCC AGG GTG CTG     911
 270  Ser Phe Val Ser Arg Leu Gln Lys Ser Ala Glu Ala Ala Arg Val Leu     285
 912  GAG CAC CGG GAA CGC GGC CGC AGG AGC CGG CGC CGG GCG GCT GGG GAG     959
 286  Glu His Arg Glu Arg Gly Arg Arg Ser Arg Arg Arg Ala Ala Gly Glu     301
 960  GGC TTG CTG ACG CTG CGG GCC AAG CCG CCC TCG GAG GCC GAG TAC ACC    1007
 302  Gly Leu Leu Thr Leu Arg Ala Lys Pro Pro Ser Glu Ala Glu Tyr Thr     317
1008  GAC GTG CTG CAG AAG ATC AAG TAC GCC TTC AGC CTG CTG GCC CGG CTG    1055
 318  Asp Val Leu Gln Lys Ile Lys Tyr Ala Phe Ser Leu Leu Ala Arg Leu     333
1056  CGC GGC AAC ATC GCC GAC CCC TCC TCT CCG GAG CTG TTG CAC TTC CTT    1103
 334  Arg Gly Asn Ile Ala Asp Pro Ser Ser Pro Glu Leu Leu His Phe Leu     349
1104  TTC GGG CCT CTG CAG ATG ATT GTG AAC ACG TCG GGG GGG CCG GAG TTC    1151
 350  Phe Gly Pro Leu Gln Met Ile Val Asn Thr Ser Gly Gly Pro Glu Phe     365
1152  GCG AGC AGT GTG CGG CGG CCG CAT CTG ACA TCG GAT GCC GTG GCG CTG    1199
 366  Ala Ser Ser Val Arg Arg Pro His Leu Thr Ser Asp Ala Val Ala Leu     381
1200  CTG CGG GAC AAC GTC ACT CCA CGT GAA AAC GAG CTC TGG ACC TCG CTG    1247
 382  Leu Arg Asp Asn Val Thr Pro Arg Glu Asn Glu Leu Trp Thr Ser Leu     397
1248  GGG GAC TCG TGG ACC CGC CCC GGG CTG GAG CTG TCC CCG GAG GAG GGA    1295
 398  Gly Asp Ser Trp Thr Arg Pro Gly Leu Glu Leu Ser Pro Glu Glu Gly     413
1296  CCC CCA TAC AGA CCC GAG TTC TTC AGC GGC TGG GAG CCG CCG GTC ACT    1343
 414  Pro Pro Tyr Arg Pro G1u Phe Phe Ser Gly Trp Glu Pro Pro Val Thr     429
1344  GAC CCG CAG AGC CGC GCC TGG GAG GAC CCA GTT GAG AAA CAG CTA CAG    1391
 430  Asp Pro Gln Ser Arg Ala Trp Glu Asp Pro Val Glu Lys Gln Leu Gln     445
1392  CAC GAG CGG AGG CGC CGG CAG CAA AGC GCC CCC GAG GTC GCT GTC AAT    1439
 446  His Glu Arg Arg Arg Arg Gln Gln Ser Ala Pro Glu Val Ala Val Asn     461
1440  GGT CAC CGA GAC TTG GAG CCA GAA TCT GAG CCT CAG CTG GAG TCA GAG    1487
 462  Gly His Arg Asp Leu Glu Pro Glu Ser Glu Pro Gln Leu Glu Ser Glu     477
1488  ACA GCA GGA AAA TGG GTC CTG TGT AAT TAT GAC TTC CAG GCC CGC AAC    1535
 478  Thr Ala Gly Lys Trp Val Leu Cys Asn Tyr Asp Phe Gln Ala Arg Asn     493
1536  AGC AGT GAG CTG TCG GTC AAG CAG CGG GAC GTA CTG GAG GTC CTG GAT    1583
 494  Ser Ser Glu Leu Ser Val Lys Gln Arg Asp Val Leu Glu Val Leu Asp     509
1584  GAC AGT CGT AAG TGG TGG AAG GTT CGG GAC CCA GCG GGG CAG GAG GGA    1631
 510  Asp Ser Arg Lys Trp Trp Lys Val Arg Asp Pro Ala Gly Gln Glu Gly     525
1632  TAT GTG CCC TAC AAC ATC CTG ACA CCC TAC CCC GGA CCC CGG CTG CAC    1679
 526  Tyr Val Pro Tyr Asn Ile Leu Thr Pro Tyr Pro Gly Pro Arg Leu His     541
1680  CAC AGC CAA AGC CCT GCC CGC AGC CTG AAC AGC ACT CCT CCT CCA CCA    1727
 542  His Ser Gln Ser Pro Ala Arg Ser Leu Asn Ser Thr Pro Pro Pro Pro     557
1728  CCA GCC CCA GCC CCG GCC CCA CCT CCA GCT CTG GCT CGG CCC CGC TGG    1775
 558  Pro Ala Pro Ala Pro Ala Pro Pro Pro Ala Leu Ala Arg Pro Arg Trp     573
1776  GAC AGG CCC CGC TGG GAC AGC TGC GAT AGC CTC AAC GGC TTG GAC CCC    1823
 574  Asp Arg Pro Arg Trp Asp Ser Cys Asp Ser Leu Asn Gly Leu Asp Pro     589
1824  AGC GAG AAG GAG AAA TTC TCC CAG ATG CTC ATC GTC AAC GAG GAA CTG    1871
 590  Ser Glu Lys Glu Lys Phe Ser Gln Met Leu Ile Val Asn Glu Glu Leu     605
1872  CAG GCG CGC CTG GCC CAG GGC CGC TCG GGA CCG AGC CGC GCA GTC CCA    1919
 606  Gln Ala Arg Leu Ala Gln Gly Arg Ser Gly Pro Ser Arg Ala Val Pro     621
1920  GGG CCC CGC GCC CCG GAA CCG CAG CTC AGC CCG GGC TCG GAC GCC TCC    1967
 622  Gly Pro Arg Ala Pro Glu Pro Gln Leu Ser Pro Gly Ser Asp Ala Ser     637
1968  GAG GTC CGC GCC TGG CTG CAG GCC AAG GGC TTT AGC TCC GGG ACC GTG    2015
 638  Glu Val Arg Ala Trp Leu Gln Ala Lys Gly Phe Ser Ser Gly Thr Val     653
2016  GAC GCG CTG GGT GTG CTG ACC GGG GCG CAG CTT TTC TCG CTG CAG AGG    2063
 654  Asp Ala Leu Gly Val Leu Thr Gly Ala Gln Leu Phe Ser Leu Gln Arg     669
2064  GAG GAG CTG CGG GCG GTG AGC CCC GAG GAG GGG GCA CGT GTG TAC AGC    2111
 670  Glu Glu Leu Arg Ala Val Ser Pro Glu Glu Gly Ala Arg Val Tyr Ser     685
2112  CAG GTC ACC GTG CAG CGC TCG CTG CTG GAG GAC AAA GAG AAA GTG TCA    2159
 686  Gln Val Thr Val Gln Arg Ser Leu Leu Glu Asp Lys Glu Lys Val Ser     701
2160  GAG CTG GAG GCA GTG ATG GAG AAG CAA AAG AAG AAG GTG GAA GGC GAG    2207
 702  Glu Leu Glu Ala Val Met Glu Lys Gln Lys Lys Lys Val Glu Gly Glu     717
2208  GTG GAA ATG GAG GTC ATT TGA CCT GCC AGG CGC CCT TCG CAA AGA GTG    2255
 718  Val Glu Met Glu Val Ile ***                                         724
2256  ACG AGG CCC CGT GGG AGA ACG GAC TCC TCA GAC TCT CCC CAA TAG CGG    2303
2304  AAG TCG ATC TTC TGA AGG ATG GCC AAT CTG CTC CGG CCC TGG TCT TCC    2351
2352  CCC ATC CCG GTG GAC AGA CTT AAC GAT CCT TGC TGC AGT CCC TCC GGA    2399
2400  GAG GAT CTG GAC TGG CTG GGA GTG GGG AGG GCG TGG AGA CAG TCT ACG    2447
2448  GAA AGC GCT AGC AGA CCC CCG AGA GGG TGC AGT GGA GCC CTG AGC ATT    2495
2496  GTA ATA TGC GGC CCA GCC TAT AAA CAG CCT CCG TGC TTA GCA AAA AAA    2543
2544  AAA AAA AAA AAA AAA A                                              2559
5.PP10631
A:核苷酸序列(SEQ ID NO:13)长度:3134个碱基
   1  GGGCGAGCAG  GACAGGACGA  AGCCGGAGTG  TAGGCGGCAG  AGGATTCGCT  CCCAGAGCAG
  61  CTGCGGCCAG  GTCGGAAAGA  GGCCGGGGCG  GCTGGGTATA  TGAATGACCT  AAAGGTACAA
 121  ATAAAGACGG  AGAGAGAACA  GTGCCAACTG  GGAGCAGGGC  AAGAATGCCA  ATTCCTCCTC
 181  CCCCGCCACC  CCCACCTGGT  CCTCCTCCAC  CTCCCACATT  TCATCAGGCA  AACACAGAGC
 241  AGCCCAAGCT  GAGTAGAGAT  GAGCAGCGGG  GTCGAGGCGC  CCTCTTACAG  GACATTTGCA
 301  AAGGGACCAA  GCTGAAGAAG  GTGACCAACA  TTAATGATCG  GAGTGCTCCC  ATCCTCGAGA
 361  AGCCGAAAGG  AAGCAGTGGT  GGCTATGGCT  CTGGAGGAGC  TGCCCTGCAG  CCCAAGGGAG
 421  GTCTCTTCCA  AGGAGGAGTG  CTGAAGCTTC  GACCTGTGGG  AGCCAAGGAT  GGTTCAGAGA
 481  ACCTAGCTGG  TAAGCCAGCC  CTGCAAATCC  CCAGTTCTCG  AGCTGCTGCC  CCAAGGCCTC
 541  CAGTATCTGC  CGCCAGCGGG  CGTCCTCAGG  ATGATACAGA  CAGCAGCCGG  GCCTCACTCC
 601  CAGAACTGCC  CCGGATGCAG  AGACCCTCTT  TACCGGACCT  CTCTCGGCCT  AATACCACCA
 661  GCAGTACGGG  CATGAAGCAC  AGCTCCTCTG  CCCCTCCCCC  ACCACCCCCA  GGGCGGCGTG
 721  CCAACGCACC  CCCCACACCT  CTGCCTATGC  ACAGCAGCAA  AGCCCCCGCC  TACAACAGAG
 781  AGAAACCCTT  GCCACCGACG  CCTGGACAAA  GGCTTCACCC  TGGTCGAGAG  GGACCTCCTG
 841  CTCCACCCCC  AGTCAAACCA  CCTCCTTCCC  CTGTGAATAT  CAGAACAGGA  CCAAGTGGCC
 901  AGTCTCTGGC  TCCTCCTCCT  CCGCCTTACC  GCCAGCCTCC  TGGGGTCCCC  AATGGACCCT
 961  CTAGCCCCAC  TAATGAGTCA  GCCCCTGAGC  TGCCACAGAG  ACACAATTCT  TTGCATAGGA
1021  AGACACCAGG  GCCTGTCAGA  GGCCTAGCAC  CTCCTCCACC  CACCTCGGCC  TCCCCATCTT
1081  TACTGAGTAA  TAGGCCACCT  CCCCCAGCCC  GAGACCCTCC  CAGTCGGGGA  GCAGCTCCTC
1141  CACCCCCACC  ACCTGTGATC  CGAAATGGTG  CCAGGGATGC  TCCCCCTCCC  CCACCACCAT
1201  ACCGAATGCA  TGGGTCAGAA  CCCCCGAGCC  GAGGAAAGCC  CCCACCTCCA  CCCTCAAGGA
1261  CGCCAGCTGG  GCCACCCCCC  TCCTCTTCCA  CCGCCCCTGA  GGAATGGCCA  CAGAGATTCT
1321  ATCACCACTG  TCCGGTCTTT  CTTGGATGAT  TTTGAGTCAA  AGTATTCCTT  CCATCCAGTA
1381  GAAGACTTTC  CTGCTCCAGA  AGAATATAAA  CACTTTCAGA  GGATATATCC  CAGCAAAACA
1441  AACCGAGCTG  CCCGTGGAGC  CCCACCTCTG  CCACCCATTC  TCAGGTGAAG  CCTGGCTTGG
1501  TCCCGTTCCT  CAGGAAAAGG  ATGGACCTTC  TCTTCTTCTC  AGATGGTCCC  TTCCATTCCC
1561  CTGAAACCTG  CATGAGAGCT  CCTAACATGT  TTCTCCAATG  CAATCAAGCC  CTAGACTCCA
1621  AATGTCCTCC  CAGCTCACCT  CCATCTATGC  ATCTCATCTC  TGGATTTGGT  GATCAGACTC
1681  TATATTGACA  GTAGGATCTC  AAACCCTGCA  TCCATCCTTC  CTCCAGCAAG  CCCTGCTAGC
1741  CACATGAGGA  ACAAGTTTCC  GTGTCTTCTG  CCTTCCTCTT  GGGGAAAGGT  GCCTTGTTGT
1801  GATGAATTAA  CTCACTGTTA  GGGCAGGGTG  GAGAATGGTA  CTCCTTCCTT  CTCCTGTCCA
1861  CTGTGGGGGA  AGCTTGGCAG  GTATATTATA  TTTCATCATT  TAGGAGGCTG  GCATGACCAG
1921  GACTTATGGG  TGGGAGGGGA  GCATTTTTAG  TGAAGCAAGA  AAGGAGTTTG  CCAAGAAGTG
1981  ATCTGTTTTA  AAGGTCATAT  TTGGAGAAAG  GGCAAGGAAT  TGGGTCTGCT  TTATTTTTGG
2041  GGGTATTTTG  TTTTTGTTCT  CACCTGCTGC  CCCCCCACCC  CACCACCCCA  GGGATAAATT
2101  GGATATAAAC  ACTAAATACT  AATCAGTTGA  ACTTAACATT  TAATAAAAAG  AAAGGGTGAA
2161  ATAAACTGAA  GACCATTTTA  GAACTAGTCA  GTTCTCTGCA  GCAAAGGGAA  CAGGAGCCAT
2221  TTGAACCCTC  TGGGACCCCT  CACCCCACTG  CTTCAGGGTG  CTAGGCTGAG  GGATGTTTTT
2281  CCTCCCCCTT  ACCGCCCATG  CCCTTGAAAG  AAAAGTCACT  TTTTGTGGAG  GGCATCATTC
2341  ATTCCTGATT  CACAAACCCC  AAAAACCTCT  GGTGGGAGAT  AGGAAGATAG  GGCGTGGGCC
2401  TGGGCCTTAA  CCTCAATCTT  GTGTCTGCCT  CAGTCTTTTC  TGACTGGCCC  TGAAGTTGTC
2461  AGTGGCTCTT  TCTGTCCTTC  AGCCCCTGGA  AGGTGCTCCA  GGATAACAAA  GAAGGGCAGG
2521  TTGAAGCCCC  TCATGGAAGG  AGCTGGCTTT  GTGGGGCTGC  AAAGGACTTT  TAAGTCCTGC
2581  CTGTACTGAA  GTTCACAGCC  CACCTGACTG  AGCAGACTCT  TCCTGTTCCT  TTCTCTACCA
2641  CCCTTGCCTT  CCCAGGACTG  CACGGTTTAA  CACAGCAGAG  TACAGAAGGG  TGAAGAAGTG
2701  AGCAGAGGCT  TATGAAGATA  TTCAGATACT  CTTCTATGCC  AGGAAGCACA  AAGACTTTGT
2761  TGAGATTTGC  CTCAGTTCAG  TAGATCTTCC  TTGGCAGCCA  GCCATAGGTT  GTTTCTTTGT
2821  CTTCCGGGTC  CTAAAGAGCA  CAGAGAAAAT  GGAGGTCCCC  AGTCTAGGTA  GGAAGCTGAT
2881  TGGATGAGGA  CTTCTTTTTT  TCCGACAGCA  GGATGGGGCT  CTTGGGCTCC  ACACACCAGA
2941  TGCTTTGGTT  TTCTACAACT  GTTGCTATGT  GTAGAGGGTG  CTCAGAGCGT  GGCATGAGAG
3001  CAAGGAGACC  ATGGCTACTC  TTTGAAATGG  ATGGGGAAAA  TTAGCTTAAA  AATTTAATCA
3061  CGAGATTGCG  CCACTGCACT  CCAGCCTGGG  CGACAGAGCC  AGACTCCGTC  TCAAAAAAAA
3121  AAAAAAAAAA  AAAA
B:核苷酸序列(SEQ ID NO:14)长度:394个氨基酸
  1  MPIPPPPPPP  PGPPPPPTFH  QANTEQPKLS  RDEQRGRGAL  LQDICKGTKL  KKVTNINDRS
 61  APILEKPKGS  SGGYGSGGAA  LQPKGGLFQG  GVLKLRPVGA  KDGSENLAGK  PALQIPSSRA
121  AAPRPPVSAA  SGRPQDDTDS  SRASLPELPR  MQRPSLPDLS  RPNTTSSTGM  KHSSSAPPPP
181  PPGRRANAPP  TPLPMHSSKA  PAYNREKPLP  PTPGQRLHPG  REGPPAPPPV  KPPPSPVNIR
241  TGPSGQSLAP  PPPPYRQPPG  VPNGPSSPTN  ESAPELPQRH  NSLHRKTPGP  VRGLAPPPPT
301  SASPSLLSNR  PPPPARDPPS  RGAAPPPPPP  VIRNGARDAP  PPPPPYRMHG  SEPPSRGKPP
361  PPPSRTPAGP  PPSSSTAPEE  WPQRFYHHCP  VFLG
C.核苷酸及氨基酸组合序列(SEQ ID NO.15)克隆号:PP10631
起始编码子:165 ATG  终止编码子:1347 TGA  蛋白质分子量:41006.14
  1   GG GCG AGC AGG ACA GGA CGA AGC CGG AGT GTA GGC GGC AGA GGA TTC      47
 48  GCT CCC AGA GCA GCT GCG GCC AGG TCG GAA AGA GGC CGG GGC GGC TGG      95
 96  GTA TAT GAA TGA CCT AAA GGT ACA AAT AAA GAC GGA GAG AGA ACA GTG     143
144  CCA ACT GGG AGC AGG GCA AGA ATG CCA ATT CCT CCT CCC CCG CCA CCC     191
  1                              Met Pro Ile Pro Pro Pro Pro Pro Pro       9
192  CCA CCT GGT CCT CCT CCA CCT CCC ACA TTT CAT CAG GCA AAC ACA GAG     239
 10  Pro Pro Gly Pro Pro Pro Pro Pro Thr Phe His Gln Ala Asn Thr Glu      25
240  CAG CCC AAG CTG AGT AGA GAT GAG CAG CGG GGT CGA GGC GCC CTC TTA     287
 26  Gln Pro Lys Leu Ser Arg Asp Glu Gln Arg Gly Arg Gly Ala Leu Leu      41
288  CAG GAC ATT TGC AAA GGG ACC AAG CTG AAG AAG GTG ACC AAC ATT AAT     335
 42  Gln Asp Ile Cys Lys Gly Thr Lys Leu Lys Lys Val Thr Asn Ile Asn      57
336  GAT CGG AGT GCT CCC ATC CTC GAG AAG CCG AAA GGA AGC AGT GGT GGC     383
 58  Asp Arg Ser Ala Pro Ile Leu Glu Lys Pro Lys Gly Ser Ser Gly Gly      73
384  TAT GGC TCT GGA GGA GCT GCC CTG CAG CCC AAG GGA GGT CTC TTC CAA     431
 74  Tyr Gly Ser Gly Gly Ala Ala Leu Gln Pro Lys Gly Gly Leu Phe Gln      89
432  GGA GGA GTG CTG AAG CTT CGA CCT GTG GGA GCC AAG GAT GGT TCA GAG     479
 90  Gly Gly Val Leu Lys Leu Arg Pro Val Gly Ala Lys Asp Gly Ser Glu     105
480  AAC CTA GCT GGT AAG CCA GCC CTG CAA ATC CCC AGT TCT CGA GCT GCT     527
106  Asn Leu Ala Gly Lys Pro Ala Leu Gln Ile Pro Ser Ser Arg Ala Ala     121
528  GCC CCA AGG CCT CCA GTA TCT GCC GCC AGC GGG CGT CCT CAG GAT GAT     575
122  Ala Pro Arg Pro Pro Val Ser Ala Ala Ser Gly Arg Pro Gln Asp Asp     137
576  ACA GAC AGC AGC CGG GCC TCA CTC CCA GAA CTG CCC CGG ATG CAG AGA     623
138  Thr Asp Ser Ser Arg Ala Ser Leu Pro Glu Leu Pro Arg Met Gln Arg     153
624  CCC TCT TTA CCG GAC CTC TCT CGG CCT AAT ACC ACC AGC AGT ACG GGC     671
154  Pro Ser Leu Pro Asp Leu Ser Arg Pro Asn Thr Thr Ser Ser Thr Gly     169
672  ATG AAG CAC AGC TCC TCT GCC CCT CCC CCA CCA CCC CCA GGG CGG CGT     719
170  Met Lys His Ser Ser Ser Ala Pro Pro Pro Pro Pro Pro Gly Arg Arg     185
720  GCC AAC GCA CCC CCC ACA CCT CTG CCT ATG CAC AGC AGC AAA GCC CCC     767
 186  Ala Asn Ala Pro Pro Thr Pro Leu Pro Met His Ser Ser Lys Ala Pro     201
 768  GCC TAC AAC AGA GAG AAA CCC TTG CCA CCG ACG CCT GGA CAA AGG CTT     815
 202  Ala Tyr Asn Arg Glu Lys Pro Leu Pro Pro Thr Pro Gly Gln Arg Leu     217
 816  CAC CCT GGT CGA GAG GGA CCT CCT GCT CCA CCC CCA GTC AAA CCA CCT     863
 218  His Pro Gly Arg Glu Gly Pro Pro Ala Pro Pro Pro Val Lys Pro Pro     233
 864  CCT TCC CCT GTG AAT ATC AGA ACA GGA CCA AGT GGC CAG TCT CTG GCT     911
 234  Pro Ser Pro Val Asn Ile Arg Thr Gly Pro Ser Gly Gln Ser Leu Ala     249
 912  CCT CCT CCT CCG CCT TAC CGC CAG CCT CCT GGG GTC CCC AAT GGA CCC     959
 250  Pro Pro Pro Pro Pro Tyr Arg Gln Pro Pro Gly Val Pro Asn Gly Pro     265
 960  TCT AGC CCC ACT AAT GAG TCA GCC CCT GAG CTG CCA CAG AGA CAC AAT    1007
 266  Ser Ser Pro Thr Asn Glu Ser Ala Pro Glu Leu Pro Gln Arg His Asn     281
1008  TCT TTG CAT AGG AAG ACA CCA GGG CCT GTC AGA GGC CTA GCA CCT CCT    1055
 282  Ser Leu His Arg Lys Thr Pro Gly Pro Val Arg Gly Leu Ala Pro Pro     297
1056  CCA CCC ACC TCG GCC TCC CCA TCT TTA CTG AGT AAT AGG CCA CCT CCC    1103
 298  Pro Pro Thr Ser Ala Ser Pro Ser Leu Leu Ser Asn Arg Pro Pro Pro     313
1104  CCA GCC CGA GAC CCT CCC AGT CGG GGA GCA GCT CCT CCA CCC CCA CCA    1151
 314  Pro Ala Arg Asp Pro Pro Ser Arg Gly Ala Ala Pro Pro Pro Pro Pro     329
1152  CCT GTG ATC CGA AAT GGT GCC AGG GAT GCT CCC CCT CCC CCA CCA CCA    1199
 330  Pro Val Ile Arg Asn Gly Ala Arg Asp Ala Pro Pro Pro Pro Pro Pro     345
1200  TAC CGA ATG CAT GGG TCA GAA CCC CCG AGC CGA GGA AAG CCC CCA CCT    1247
 346  Tyr Arg Met His Gly Ser Glu Pro Pro Ser Arg Gly Lys Pro Pro Pro     361
1248  CCA CCC TCA AGG ACG CCA GCT GGG CCA CCC CCC TCC TCT TCC ACC GCC    1295
 362  Pro Pro Ser Arg Thr Pro Ala Gly Pro Pro Pro Ser Ser Ser Thr Ala     377
1296  CCT GAG GAA TGG CCA CAG AGA TTC TAT CAC CAC TGT CCG GTC TTT CTT    1343
 378  Pro Glu Glu Trp Pro Gln Arg Phe Tyr His His Cys Pro Val Phe Leu     393
1344  GGA TGA TTT TGA GTC AAA GTA TTC CTT CCA TCC AGT AGA AGA CTT TCC    1391
 394  Gly ***                                                             395
1392  TGC TCC AGA AGA ATA TAA ACA CTT TCA GAG GAT ATA TCC CAG CAA AAC    1439
1440  AAA CCG AGC TGC CCG TGG AGC CCC ACC TCT GCC ACC CAT TCT CAG GTG    1487
1488  AAG CCT GGC TTG GTC CCG TTC CTC AGG AAA AGG ATG GAC CTT CTC TTC    1535
1536  TTC TCA GAT GGT CCC TTC CAT TCC CCT GAA ACC TGC ATG AGA GCT CCT    1583
1584  AAC ATG TTT CTC CAA TGC AAT CAA GCC CTA GAC TCC AAA TGT CCT CCC    1631
1632  AGC TCA CCT CCA TCT ATG CAT CTC ATC TCT GGA TTT GGT GAT CAG ACT    1679
1680  CTA TAT TGA CAG TAG GAT CTC AAA CCC TGC ATC CAT CCT TCC TCC AGC    1727
1728  AAG CCC TGC TAG CCA CAT GAG GAA CAA GTT TCC GTG TCT TCT GCC TTC    1775
1776  CTC TTG GGG AAA GGT GCC TTG TTG TGA TGA ATT AAC TCA CTG TTA GGG    1823
1824  CAG GGT GGA GAA TGG TAC TCC TTC CTT CTC CTG TCC ACT GTG GGG GAA    1871
1872  GCT TGG CAG GTA TAT TAT ATT TCA TCA TTT AGG AGG CTG GCA TGA CCA    1919
1920  GGA CTT ATG GGT GGG AGG GGA GCA TTT TTA GTG AAG CAA GAA AGG AGT    1967
1968  TTG CCA AGA AGT GAT CTG TTT TAA AGG TCA TAT TTG GAG AAA GGG CAA    2015
2016  GGA ATT GGG TCT GCT TTA TTT TTG GGG GTA TTT TGT TTT TGT TCT CAC    2063
2064  CTG CTG CCC CCC CAC CCC ACC ACC CCA GGG ATA AAT TGG ATA TAA ACA    2111
2112  CTA AAT ACT AAT CAG TTG AAC TTA ACA TTT AAT AAA AAG AAA GGG TGA    2159
2160  AAT AAA CTG AAG ACC ATT TTA GAA CTA GTC AGT TCT CTG CAG CAA AGG    2207
2208  GAA CAG GAG CCA TTT GAA CCC TCT GGG ACC CCT CAC CCC ACT GCT TCA    2255
2256  GGG TGC TAG GCT GAG GGA TGT TTT TCC TCC CCC TTA CCG CCC ATG CCC    2303
2304  TTG AAA GAA AAG TCA CTT TTT GTG GAG GGC ATC ATT CAT TCC TGA TTC    2351
2352  ACA AAC CCC AAA AAC CTC TGG TGG GAG ATA GGA AGA TAG GGC GTG GGC    2399
2400  CTG GGC CTT AAC CTC AAT CTT GTG TCT GCC TCA GTC TTT TCT GAC TGG    2447
2448  CCC TGA AGT TGT CAG TGG CTC TTT CTG TCC TTC AGC CCC TGG AAG GTG    2495
2496  CTC CAG GAT AAC AAA GAA GGG CAG GTT GAA GCC CCT CAT GGA AGG AGC    2543
2544  TGG CTT TGT GGG GCT GCA AAG GAC TTT TAA GTC CTG CCT GTA CTG AAG    2591
2592  TTC ACA GCC CAC CTG ACT GAG CAG ACT CTT CCT GTT CCT TTC TCT ACC    2639
2640  ACC CTT GCC TTC CCA GGA CTG CAC GGT TTA ACA CAG CAG AGT ACA GAA    2687
2688  GGG TGA AGA AGT GAG CAG AGG CTT ATG AAG ATA TTC AGA TAC TCT TCT    2735
2736  ATG CCA GGA AGC ACA AAG ACT TTG TTG AGA TTT GCC TCA GTT CAG TAG    2783
2784  ATC TTC CTT GGC AGC CAG CCA TAG GTT GTT TCT TTG TCT TCC GGG TCC    2831
2832  TAA AGA GCA CAG AGA AAA TGG AGG TCC CCA GTC TAG GTA GGA AGC TGA    2879
2880  TTG GAT GAG GAC TTC TTT TTT TCC GAC AGC AGG ATG GGG CTC TTG GGC    2927
2928  TCC ACA CAC CAG ATG CTT TGG TTT TCT ACA ACT GTT GCT ATG TGT AGA    2975
2976  GGG TGC TCA GAG CGT GGC ATG AGA GCA AGG AGA CCA TGG CTA CTC TTT    3023
3024  GAA ATG GAT GGG GAA AAT TAG CTT AAA AAT TTA ATC ACG AGA TTG CGC    3071
3072  CAC TGC ACT CCA GCC TGG GCG ACA GAG CCA GAC TCC GTC TCA AAA AAA    3119
3120  AAA AAA AAA AAA AAA                                                3134
6.PP10752
A:核苷酸序列(SEQ ID NO:16)长度:1528个碱基
   1  GCAGGAGGGT  AGCCTCCATG  CGTAGCCACC  CCACCTGGCA  GTGGTGGTGC  CAGTCGGGCA
  61  TGGAGTCCCT  CCACTCGCTG  ACCTCCTCCT  GCACGGCGCA  TAGCTCCTGC  TGCAAGAAGC
 121  GCCACATGTT  GGCCAGGTTG  AAGCCATTGA  CCCAGTTGTG  GTTGATGGAG  ATGGTGTCAT
 181  CCTGGAAGGG  GCACAGTGCA  GGCAGGCCTG  AGCCCATGGC  AGGTGCCCCC  TGACCAACCC
 241  ACATCTCCTG  CGCCAGGAAC  CCACTGTGGG  GTCCAGCCCT  CTGCAGCCAA  GAGGGCCCTC
 301  CTGTCTCCCA  GCAGGGCTTG  CTCAGCAGGG  AAGTGGGTGG  CGGGCTCGGA  CCACCTCAGG
 361  CCACAGTGAA  CCCAGAGCAA  GTAGACCCAG  GGACCGGCAG  TGGGTGAAAC  AGAGGCTAGG
 421  CCTCAGCGAC  ACCACCTTGT  GAAGGGGTCA  GCCTCACCCA  TGAGCCACCC  CATTCCAGCC
 481  CAGCTCTGGC  TGGGAGAGTG  GGGAGGTGGT  GCTGCCGTCT  TCCTGCAGGA  AGGCCCCTGA
 541  TAGGGGGCAG  GAGAAGCAGC  ACATTACCAG  GTTGTGCACC  TGGTGGTGCC  AGCCACTGGG
 601  CACAAACACC  ATCTCGCCCG  CTTCCTGCGT  GATCTCCAAG  GGTGGGCCAG  CAAGCTGGTT
 661  CCGTGGGTGC  AGGTGTGTGT  CGCAGAGTGC  TGGGGAGGTC  ACGTCGTAGG  GCAGGTTGCC
 721  GTGGCGGTCC  CGCAGCCTCT  TCCTGCCCTG  GGGGGAAGAG  GAGCCACTTC  TTCCTCCCAC
 781  AGACATTGAC  AGACCAGCTG  AAGGAGCGGA  AGATGTCAGC  ATGGAACGGG  GACCTGCGGC
 841  ACAAGAGCGC  CTGGTTCATG  CCTGTAGGGG  CTGGTATGGG  CTTTGCTTGG  CACCCCAGAG
 901  GCCTGGTCCA  ACTGAAGGAG  GGGTGGCCCC  TTGGTCTCAA  GGGATGGCAC  CCACTGTGAG
 961  GCCTGTGCCA  AGCAGCCCCC  CTCCTGCCAC  CCTGGGCCTC  CCAGTCTGTT  CTGTCACCAG
1021  GCCCCTTCGG  TTCCACTCCC  ACATCCGTGG  CCTCACCAGC  TGCCCGCAGG  CCCCGCGTAG
1081  ACAAAGCGGT  AGTCATCCAC  ATCCAGTGCA  TCCCAGAACT  CATTCAGCCA  GTCGGACGAG
1141  AAGTACACAG  GCAGGGTGAA  AACGTCCTCC  ACCGGAAAGT  CCCTGTGAGG  AGGGCGCAAG
1201  GGCACCACCG  ACAGCACGTG  AGGCACGAGG  AGACTAGGGC  AGCACGAGTG  GGGCAACTGA
1261  GACCAATCGG  CTCCAGTGGA  GCTTCCAGAT  GGCTGCAGCC  CCCAAAGAGC  CCCAGACCCT
1321  CCTCTGAGCC  AGACGCTGCT  GGCGGGGGAG  GGGGCGGGGC  AGTCTGACTA  CAATGGTTCT
1381  GCTTATTAGA  AAGTACTGAT  CATGCCTATA  ATCCCAGTGC  TTTGAGATGC  TGAGGTGGAT
1441  GCATCACCTG  AGCTCAGGAG  TTCAAGACCA  GCCTGGGCAA  CATGGTGAAA  CCTAGTCTCT
1501  TTAAAAAAAA  AAAAAAAAAA  AAAAAAAA
B:核苷酸序列(SEQ ID NO:17)长度:112个氨基酸

 1  MERGPAAQER LVHACRGWYG LCLAPQRPGP TEGGVAPWSQ GMAPTVRPVP SSPPPATLGL

61  PVCSVTRPLR FHSHIRGLTS CPQAPRRQSG SHPHPVHPRT HSASRTRSTQ AG
C.核苷酸及氨基酸组合序列(SEQ ID NO:18)克隆号:PP10752
起始编码子:821 ATG  终止编码子:1157 TGA  蛋白质分子量:11974.04
   1    G CAG GAG GGT AGC CTC CAT GCG TAG CCA CCC CAC CTG GCA GTG GTG      46
  47  GTG CCA GTC GGG CAT GGA GTC CCT CCA CTC GCT GAC CTC CTC CTG CAC      94
  95  GGC GCA TAG CTC CTG CTG CAA GAA GCG CCA CAT GTT GGC CAG GTT GAA     142
 143  GCC ATT GAC CCA GTT GTG GTT GAT GGA GAT GGT GTC ATC CTG GAA GGG     190
 191  GCA CAG TGC AGG GAG GCC TGA GCC CAT GGC AGG TGC CCC CTG ACC AAC     238
 239  CCA CAT CTC CTG CGC CAG GAA CCC ACT GTG GGG TCC AGC CCT CTG CAG     286
 287  CCA AGA GGG CCC TCC TGT CTC CCA GCA GGG CTT GCT CAG CAG GGA AGT     334
 335  GGG TGG CGG GCT CGG ACC ACC TCA GGC CAC AGT GAA CCC AGA GCA AGT     382
 383  AGA CCC AGG GAC CGG CAG TGG GTG AAA CAG AGG CTA GGC CTC AGC GAC     430
 431  ACC ACC TTG TGA AGG GGT CAG CCT CAC CCA TGA GCC ACC CCA TTC CAG     478
 479  CCC AGC TCT GGC TGG GAG AGT GGG GAG GTG GTG CTG CCG TCT TCC TGC     526
 527  AGG AAG GCC CCT GAT AGG GGG CAG GAG AAG CAG CAC ATT ACC AGG TTG     574
 575  TGC ACC TGG TGG TGC CAG CCA CTG GGC ACA AAC ACC ATC TCG CCC GCT     622
 623  TCC TGC GTG ATC TCC AAG GGT GGG CCA GCA AGC TGG TTC CGT GGG TGC     670
 671  AGG TGT GTG TCG CAG AGT GCT GGG GAG GTC ACG TCG TAG GGC AGG TTG     718
 719  CCG TGG CGG TCC CGC AGC CTC TTC CTG CCC TGG GGG GAA GAG GAG CCA     766
 767  CTT CTT CCT CCC ACA GAC ATT GAC AGA CCA GCT GAA GGA GCG GAA GAT     814
 815  GTC AGC ATG GAA CGG GGA CCT GCG GCA CAA GAG CGC CTG GTT CAT GCC     862
   1          Met Glu Arg Gly Pro Ala Ala Gln Glu Arg Leu Val His Ala      14
 863  TGT AGG GGC TGG TAT GGG CTT TGC TTG GCA CCC CAG AGG CCT GGT CCA     910
  15  Cys Arg Gly Trp Tyr Gly Leu Cys Leu Ala Pro Gln Arg Pro Gly Pro      30
 911  ACT GAA GGA GGG GTG GCC CCT TGG TCT CAA GGG ATG GCA CCC ACT GTG     958
  31  Thr Glu Gly Gly Val Ala Pro Trp Ser Gln Gly Met Ala Pro Thr Val      46
 959  AGG CCT GTG CCA AGC AGC CCC CCT CCT GCC ACC CTG GGC CTC CCA GTC    1006
  47  Arg Pro Val Pro Ser Ser Pro Pro Pro Ala Thr Leu Gly Leu Pro Val      62
1007  TGT TCT GTC ACC AGG CCC CTT CGG TTC CAC TCC CAC ATC CGT GGC CTC    1054
  63  Cys Ser Val Thr Arg Pro Leu Arg Phe His Ser His Ile Arg Gly Leu      78
1055  ACC AGC TGC CCG CAG GCC CCG CGT AGA CAA AGC GGT AGT CAT CCA CAT    1102
  79  Thr Ser Cys Pro Gln Ala Pro Arg Arg Gln Ser Gly Ser His Pro His      94
1103  CCA GTG CAT CCC AGA ACT CAT TCA GCC AGT CGG ACG AGA AGT ACA CAG    1150
  95  Pro Val His Pro Arg Thr His Ser Ala Ser Arg Thr Arg Ser Thr Gln     110
1151  GCA GGG TGA AAA CGT CCT CCA CCG GAA AGT CCC TGT GAG GAG GGC GCA    1198
 111  Ala Gly ***                                                         113
1199  AGG GCA CCA CCG ACA GCA CGT GAG GCA CGA GGA GAC TAG GGC AGC ACG    1246
1247  AGT GGG GCA ACT GAG ACC AAT CGG CTC CAG TGG AGC TTC CAG ATG GCT    1294
1295  GCA GCC CCC AAA GAG CCC CAG ACC CTC CTC TGA GCC AGA CGC TGC TGG    1342
1343  CGG GGG AGG GGG CGG GGC AGT CTG ACT ACA ATG GTT CTG CTT ATT AGA    1390
1391  AAG TAC TGA TCA TGC CTA TAA TCC CAG TGC TTT GAG ATG CTG AGG TGG    1438
1439  ATG CAT CAC CTG AGC TCA GGA GTT CAA GAC CAG CCT GGG CAA CAT GGT    1486
1487  GAA ACC TAG TCT CTT TAA AAA AAA AAA AAA AAA AAA AAA AAA            1528
7.PPl0881
A:核苷酸序列(SEQ ID NO:19)长度:2100个碱基

  1 GCCACTATGT CTGGCTGAGT ATGTCTCTTT TAGATTGTTT TATTTTGAGA ACTTCTGAAA

 61 CCATGTCAGA GACTGCTGAT GCTGTAGATG ATACTATATT ATTCAAGTCT TGATTATCTG

121 CTGTGAGTTT TCATGAATAA TTCACCTTTT TCATGCACGA CACAGAACTT GTTGGTAACA

181 GCACTCCAGT GTCGAACATG TCATTAATTC ATGTGCTAAA TCTCTTTTGG TCCACCATGA
 241  TACTGTTTCA  AATTAACAAC  CTATGTGAGC  TGGGGAAGTT  GCACAGATTC  TCATTTAGCC
 301  TGTTCTGACT  GAAGGGAAAA  CTAACAAGCT  TTCTGCAGTA  TAGTAGCTGA  AGTTTTCCCT
 361  GGTCAAACAT  CATATCCTTC  CCCAAAACAT  ATTCAGGTAA  TGTGGATGCA  AGTACTTCCA
 421  AGATTCATTC  AAACATACTA  ATTTTCATCC  AAATTTTAAT  TTAATCCTAT  CAGCCATTTC
 481  ATCCTCATAT  CCTGTCTTTC  TAGTTATTGC  CTCTGCTAGG  ATTTTACCAA  TAGGTTTTGG
 541  AATCAGAGGC  ACTGAATTCT  ATGTCAGGAA  CCCCTGGAAG  GTTTCTTTTT  TACCTTCTAT
 601  TGTACCTACA  GGTGTGCATA  TGGCCTTCAG  TCCCTACTAG  GAGATTAGTT  AAAAGAAAGC
 661  CCTGGTTCTG  TGTCAGTCCT  CATCCTGATT  AATTTGGTAG  CCCATCACCT  CTGATGATTT
 721  GAACTGAGGT  TCTTCATTGT  CATTTTTGCT  TCCCAGCTTG  GTGCATTCTT  TGAAATTAGG
 781  GTGCATAGAG  TGTTTGTTTA  GGGCCCTTCA  GTGTTGGGGG  ACTAAGAGGC  GCTCCCATTG
 841  GTAAACCTAA  CTTCTGATAG  TGCAGCATTA  AGACCTTTGT  GTTAACATCA  GTGTCCATTT
 901  TATTCATCCC  ATCTCTTAGT  AACCGTTTAA  AACTTCATCC  TGCTTGGGAC  TTCGTTGACT
 961  ATCTGTTTTG  TGTTACCCAT  TCACTTGTGA  TTCAGTCTTA  TTTTCTTAGC  ATCTGTAAGA
1021  CCCATATTAA  GAAGCTGAGA  CAACAAATCT  GACACATTTC  TTGGACCATT  GATAGATTTT
1081  GCAGCAGTTA  TATCAGATGC  CTGCCTAGCG  GGGCCCCTTC  AGTCACAGTA  TTTACCATGA
1141  TTTAAAGGGC  ATATTAAGGA  TGAACAAACA  TCCTGATGAC  CATGAAGTTA  ATCCAGCATG
1201  GTTTGCATAT  GCAGCTTACC  AGCTTTGTCA  TCTATGGAGG  AGTGCCACTT  GGCATTTAAA
1261  GGAGGGGAAG  GACCATTTCC  CTTTTCAGGG  TAAACAAATT  TTACAGTGGC  TTTTACCCAG
1321  TCCACCAGAC  TAGCTGTCCC  TTTAGGAACA  ATCTATTGTG  TGTTTGGATC  ATGTACAACA
1381  ATCCATGATT  GTTCAGTAAT  AAGGTTCCTG  CATCAACCCC  AAGCAGACTT  CTTCATTCTG
1441  CAACATTCAG  AATCAAAGAT  ACTGCTCCCA  AGTTAGTCAC  TCTCACAATC  TATTTTCTTA
1501  AATGTTTTTC  AGGAACCCGA  TGAATACCAG  TTCACAAGGC  AAGATAACTC  CTTCACACAT
1561  AACCCCTGCT  TCCAGTACTG  TCTTGGTTTT  GTCACCCACC  ATTTGGACAA  TGTTCCTGGT
1621  GGTCAAAGGC  CATAGATATA  CTGTCTGTTT  TTTTCAGCAT  AATTTTCCAT  TGGGTTTATC
1681  CTGGAGGCTA  ACAGCCATAG  CTCAAGCTAA  CCAAAATCCA  AGCTTTTTGA  GCATCAGGAT
1741  TTCCTTAACA  CTCTCTCTTA  CTTTCATTTT  AGCTGTTTTA  AAATACAGCA  GACTGGGCCA
1801  GGCGCAGTGG  CTCACATTGG  TAATCCCAGT  ACGTTGGGAG  GCCAAGTCGG  GCAGATCACT
1861  TGAGGCCAGG  AGTTTGAGAC  CAGCCTGACC  AACATGGTGA  AACCCTGTCT  CCACTAAAAA
1921  TACAAAAAAT  TAGCTTGGCT  TGGTGGCATG  CGCCTGTAAT  CCCAGCTACT  TGAGGGGCTG
1981  AGGCAGGAGA  ATCACTGGAA  CCCAGGAGGC  AGAGGTTGCA  GTGATCTGAG  ATCATGCCAC
2041  TGTACTCCAG  CCTGGGAGAC  ACAGCGAGAC  TCCCTCTCAA  AAAAAAAAAA  AAAAAAAAAA
B:核苷酸序列(SEQ ID NO:20)长度:128个氨基酸

  1 MFFRNPMNTS SQGKITPSHI TPASSTVLVL SPTIWTMFLV VKGHRYTVCF FQHNFPLGLS

 61 WRLTAIAQAN QNPSFLSIRI SLTLSLTFIL AVLKYSRLGQ AQWLTLVIPV RWEAKSGRSL

121 EARSLRPA
C.核苷酸及氨基酸组合序列(SEQ ID NO:21)克隆号:PPl0881
起始编码子:1502 ATG  终止编码子:1886 TGA  蛋白质分子量:14432.15
  1    G  CCA  CTA  TGT  CTG  GCT  GAG  TAT  GTC  TCT  TTT  AGA  TTG  TTT  TAT  TTT      46
 47  GAG  AAC  TTC  TGA  AAC  CAT  GTC  AGA  GAC  TGC  TGA  TGC  TGT  AGA  TGA  TAC      94
 95  TAT  ATT  ATT  CAA  GTC  TTG  ATT  ATC  TGC  TGT  GAG  TTT  TCA  TGA  ATA  ATT     142
143  CAC  CTT  TTT  CAT  GCA  CGA  CAC  AGA  ACT  TGT  TGG  TAA  CAG  CAC  TCC  AGT     190
191  GTC  GAA  CAT  GTC  ATT  AAT  TCA  TGT  GCT  AAA  TCT  CTT  TTG  GTC  CAC  CAT     238
239  GAT  ACT  GTT  TCA  AAT  TAA  CAA  CCT  ATG  TGA  GCT  GGG  GAA  GTT  GCA  CAG     286
287  ATT  CTC  ATT  TAG  CCT  GTT  CTG  ACT  GAA  GGG  AAA  ACT  AAC  AAG  CTT  TCT     334
335  GCA  GTA  TAG  TAG  CTG  AAG  TTT  TCC  CTG  GTC  AAA  CAT  CAT  ATC  CTT  CCC     382
383  CAA  AAC  ATA  TTC  AGG  TAA  TGT  GGA  TGC  AAG  TAC  TTC  CAA  GAT  TCA  TTC     430
431  AAA  CAT  ACT  AAT  TTT  CAT  CCA  AAT  TTT  AAT  TTA  ATC  CTA  TCA  GCC  ATT     478
479  TCA  TCC  TCA  TAT  CCT  GTC  TTT  CTA  GTT  ATT  GCC  TCT  GCT  AGG  ATT  TTA     526
527  CCA  ATA  GGT  TTT  GGA  ATC  AGA  GGC  ACT  GAA  TTC  TAT  GTC  AGG  AAC  CCC     574
 575  TGG AAG GTT TCT TTT TTA CCT TCT ATT GTA CCT ACA GGT GTG CAT ATG     622
 623  GCC TTC AGT CCC TAC TAG GAG ATT AGT TAA AAG AAA GCC CTG GTT CTG     670
 671  TGT CAG TCC TCA TCC TGA TTA ATT TGG TAG CCC ATC ACC TCT GAT GAT     718
 719  TTG AAC TGA GGT TCT TCA TTG TCA TTT TTG CTT CCC AGC TTG GTG CAT     766
 767  TCT TTG AAA TTA GGG TGC ATA GAG TGT TTG TTT AGG GCC CTT CAG TGT     814
 815  TGG GGG ACT AAG AGG CGC TCC CAT TGG TAA ACC TAA CTT CTG ATA GTG     862
 863  CAG CAT TAA GAC CTT TGT GTT AAC ATC AGT GTC CAT TTT ATT CAT CCC     910
 911  ATC TCT TAG TAA CCG TTT AAA ACT TCA TCC TGC TTG GGA CTT CGT TGA     958
 959  CTA TCT GTT TTG TGT TAC CCA TTC ACT TGT GAT TCA GTC TTA TTT TCT    1006
1007  TAG CAT CTG TAA GAC CCA TAT TAA GAA GCT GAG ACA ACA AAT CTG ACA    1054
1055  CAT TTC TTG GAC CAT TGA TAG ATT TTG CAG CAG TTA TAT CAG ATG CCT    1102
1103  GCC TAG CGG GGC CCC TTC AGT CAC AGT ATT TAC CAT GAT TTA AAG GGC    1150
1151  ATA TTA AGG ATG AAC AAA CAT CCT GAT GAC CAT GAA GTT AAT CCA GCA    1198
1199  TGG TTT GCA TAT GCA GCT TAC CAG CTT TGT CAT CTA TGG AGG AGT GCC    1246
1247  ACT TGG CAT TTA AAG GAG GGG AAG GAC CAT TTC CCT TTT CAG GGT AAA    1294
1295  CAA ATT TTA CAG TGG CTT TTA CCC AGT CCA CCA GAC TAG CTG TCC CTT    1342
1343  TAG GAA CAA TCT ATT GTG TGT TTG GAT CAT GTA CAA CAA TCC ATG ATT    1390
1391  GTT CAG TAA TAA GGT TCC TGC ATC AAC CCC AAG CAG ACT TCT TCA TTC    1438
1439  TGC AAC ATT CAG AAT CAA AGA TAC TGC TCC CAA GTT AGT CAC TCT CAC    1486
1487  AAT CTA TTT TCT TAA ATG TTT TTC AGG AAC CCG ATG AAT ACC AGT TCA    1534
   1                      Met Phe Phe Arg Asn Pro Met Asn Thr Ser Ser      11
1535  CAA GGC AAG ATA ACT CCT TCA CAC ATA ACC CCT GCT TCC AGT ACT GTC    1582
  12  Gln Gly Lys Ile Thr Pro Ser His Ile Thr Pro Ala Ser Ser Thr Val      27
1583  TTG GTT TTG TCA CCC ACC ATT TGG ACA ATG TTC CTG GTG GTC AAA GGC    1630
  28  Leu Val Leu Ser Pro Thr Ile Trp Thr Met Phe Leu Val Val Lys Gly      43
1631  CAT AGA TAT ACT GTC TGT TTT TTT CAG CAT AAT TTT CCA TTG GGT TTA    1678
  44  His Arg Tyr Thr Val Cys Phe Phe Gln His Asn Phe Pro Leu Gly Leu      59
1679  TCC TGG AGG CTA ACA GCC ATA GCT CAA GCT AAC CAA AAT CCA AGC TTT    1726
  60  Ser Trp Arg Leu Thr Ala Ile Ala Gln Ala Asn Gln Asn Pro Ser Phe      75
1727  TTG AGC ATC AGG ATT TCC TTA ACA CTC TCT CTT ACT TTC ATT TTA GCT    1774
  76  Leu Ser Ile Arg Ile Ser Leu Thr Leu Ser Leu Thr Phe Ile Leu Ala      91
1775  GTT TTA AAA TAC AGC AGA CTG GGC CAG GCG CAG TGG CTC ACA TTG GTA    1822
  92  Val Leu Lys Tyr Ser Arg Leu Gly Gln Ala Gln Trp Leu Thr Leu Val     107
1823  ATC CCA GTA CGT TGG GAG GCC AAG TCG GGC AGA TCA CTT GAG GCC AGG    1870
 108  Ile Pro Val Arg Trp Glu Ala Lys Ser Gly Arg Ser Leu Glu Ala Arg     123
1871  AGT TTG AGA CCA GCC TGA CCA ACA TGG TGA AAC CCT GTC TCC ACT AAA    1918
 124  Ser Leu Arg Pro Ala ***                                             129
1919  AAT ACA AAA AAT TAG CTT GGC TTG GTG GCA TGC GCC TGT AAT CCC AGC    1966
1967  TAC TTG AGG GGC TGA GGC AGG AGA ATC ACT GGA ACC CAG GAG GCA GAG    2014
2015  GTT GCA GTG ATC TGA GAT CAT GCC ACT GTA CTC CAG CCT GGG AGA CAC    2062
2063  AGC GAG ACT CCC TCT CAA AAA AAA AAA AAA AAA AAA AA                 2100
8. PP10897
A:核苷酸序列(SEQ ID NO:22)长度:2362个碱基

  1  GCATGAATCA  GGTAAGAAGC  CAGACTGCTG  AGGCAGAGTA  GGGGGGAAGG  AGGCACAAGG

 61  GCCTTGCACT  CCAGCAAAGA  TGGTAGAGAT  GGGGAAGCAT  TCGGGCTGGA  CAGGAGAGAC

121  CCAGGTTCCA  GGCGCAGTGT  GAAGCCTCAG  CAGACCCCAG  TTTCAGAGGT  TTGAGGAAGG

181  AAAATCAACA  GACACCCCGG  GTATGAAGTA  GGGGCCAGGT  TGTGGGCTCT  GCCTCTGGGG
 241  ACAGGGCAGA  TCCCTTCCTG  CTTTATTTGT  GAGCCACCTC  AACAGGACCC  AGGCCATCTG
 301  CAGGTACTAG  TGGCCTAGCT  GGGTAGTCTT  TCCTGAGGTC  TCACCTCAGG  CCTTTGTGCT
 361  GCTGCTGTTG  CTTCTGGCCT  TGAGCCTGAG  AGAGAGGTGA  GAGGAAGGAT  GCTTTCTCTA
 421  ACTTGGGCTC  CTCCAATCTC  TGGTTGCAAA  GCTGGGGTTG  GGGGAGAGAG  GACCACCCAA
 481  CCTGCCCTGT  ACAAGCATCA  GTAAGACTCC  AAGTTTCCCA  GGGCCCGAAC  ACTTGGGGGT
 541  TGTCTCTCAA  CACCCGGCTG  GAAGACAAGT  AGGTAACCAG  GTTCAGCCCC  ACCTGCCAAG
 601  AACACTGTGT  TTTGGGCCTG  GCAGAGCTGC  TACTCCCCCT  CTCCCTCCTA  AGAATGCCCA
 661  GAGAATCACT  TGCCAAGGCT  ACTCCTGGAG  CTCAGCTGTG  GGATCAGGGT  TTGGGCTGAG
 721  GATCAGGTGC  CTGTGTGCAC  ACATGTGCAC  ATTGTGTGTG  CCAATGGGTG  GTAGGGATTG
 781  AGCCCGTTGT  GAGAACATCC  AGCCAGGTTG  GAAGTGTGTA  CAGGTATCTG  AGGGTGTGCA
 841  CGTGAGCAAG  AGGGTGTGCA  AGATGTGGGT  GACTGTTGGG  ACCACAGAGC  TGAGGCCTGT
 901  GGTCAGCTCA  GGTCAGAACT  GGGAGGTCTG  TTTCCCTTGG  GAGGACCTGT  CTGCTCTGAG
 961  GGGGACCCGG  ACAAGTGCAC  ATATGCATGT  GTGTGTCTAC  ACACACACAC  ACACACACAC
1021  ACACACACAC  ACACACATAT  GCTTGCCTCC  CTCTCCAAGG  CAGACTTGCC  TGGGAAGTAC
1081  CCCTCCTCAG  CAGGAGCTCG  AAGACCCCTG  CCCAGTGCTG  TTTTCAGTAG  AGGGAGTGGA
1141  GCTGAGATGG  GGAGACCGTA  CTGAGCGGTC  CAGGAGTAGG  GAAACAGAGC  TGCTTTGCAG
1201  CTTCTGTTCC  AGAAGATGGG  GGTTGGGGGG  CGGGGTTGAG  GGCCAGGGGT  GGGAGCAGGA
1261  GCAGAACAGA  AAGCCTCCCT  GCTCACTGGC  CTTTCCCCTT  CCCTCACTGG  CTGCCCATGG
1321  AGCCAGGATC  AGCATGGGAA  CAATCAAGGA  GGCAGGGGCT  TATCAGTACT  ATGGACCCCT
1381  ACACTGCTCT  GCCTGGTGGT  TCTTCTCTTC  GCATACCAAA  GACAGAAATT  AAGCCTCCAA
1441  GAGTGGTAAC  TGACCTCGGT  CACACTTGGT  GGGTGTGGGA  AAGGATTCAA  ATGTAGGTCT
1501  GTTCTCTTCT  TCATCTATCA  TGGTCCCTGT  CCTGGAGGCA  AGTCGTCTGG  GGCTCAGAAA
1561  ACACCCCTGT  TGCCACTGAT  TGGAATTCCA  AGGGTCTGGG  TGAAGTGGGG  ATGGGCCTCC
1621  AGCTTGCCTC  CAGCCTGAAA  AAATAGTAGA  GGGTGTTGAG  GCTGGGAAGG  GAGGTGGGGC
1681  TCATGTTGTA  CAGGGCCTGA  GCCAGGGAGC  TTGGGCTTCA  TTCTGAGTAC  TGTGGCAGCC
1741  CTGGGAAGGT  TTGTAGCACA  GAGGGATATT  GTCATTTTTG  GAAAGATCCC  TTTGGCTGCT
1801  TAGGTAGAGA  AGGGCTTCAA  GAGGGCAGGA  AGGGACAGGA  CTACAGAAGG  GGCTGCTTCA
1861  GAGTCCAGAT  TAAGGAAGGA  GAGGCCTGGG  CAGTCAGAAA  GGAAGAGAAG  CCGGATGTGG
1921  TGGCTTGTAT  CTTCAATCCC  AGCACTTTGA  GAGGCCAAGG  TGGGAGGATC  ACTTGAGCCC
1981  AGGAGTTCAA  AACCAGCTTG  GGCAACATAG  TGAGACTCCC  ATCTCTCCAA  AAAAATTTAA
2041  AAACCAGCCA  GGTAGACTGG  GCGCAGTGGC  TCACGCCTGT  AATCCCAGAA  CTTTGGGAGG
2101  CCGAGGCAGG  CAGATCACGA  GGTCAAGAGT  TAGAGACCAG  CCTGACCAAC  ATGGTGAAAC
2161  CCCGTCTCTA  CTAAAAATAC  AAAACTTAGC  CAGGCCTGTG  GTGATGCGCA  CCTGTAGTCT
2221  CAGCTACTCA  GGAGGCTGAG  GCAGGAGAAT  CGCTTGAACC  CGGGAGGCAG  AGGTTGCACT
2281  GAGCTGAGAT  CACGCCACTG  CACTCCAGCC  TGGGCAACAG  AGTGAGACTC  CGTCTCAAAC
2341  AAAAAAAAAA  AAAAAAAAAA  AA
B:核苷酸序列(SEQ ID NO:23)长度:189个氨基酸

  1  MWVTVGTTEL  RPVVSSGQNW  EVCFPWEDLS  ALRGTRTSAH  MHVCVYTHTH  THTHTHTHIC

 61  LPPSPRQTCL  GSTPPQQELE  DPCPVLFSVE  GVELRWGDRT  ERSRSRETEL  LCSFCSRRWG

121  LGGGVEGQGW  EQEQNRKPPC  SLAFPLPSLA  AHGARISMGT  IKEAGAYQYY  GPLHCSAWWF

181  FSSHTKDRN
C.核苷酸及氨基酸组合序列(SEQ ID NO:24)克隆号:PP10897
起始编码子:863 ATG  终止编码子:1430 TAA  蛋白质分子量:21317.91
   1    G CAT GAA TCA GGT AAG AAG CCA GAC TGC TGA GGC AGA GTA GGG GGG    46
  47  AAG GAG GCA CAA GGG CCT TGC ACT CCA GCA AAG ATG GTA GAG ATG GGG    94
  95  AAG CAT TCG GGC TGG ACA GGA GAG ACC CAG GTT CCA GGC GCA GTG TGA    142
 143  AGC CTC AGC AGA CCC CAG TTT CAG AGG TTT GAG GAA GGA AAA TCA ACA    190
 191  GAC ACC CCG GGT ATG AAG TAG GGG CCA GGT TGT GGG CTC TGC CTC TGG    238
 239  GGA CAG GGC AGA TCC CTT CCT GCT TTA TTT GTG AGC CAC CTC AAC AGG    286
 287  ACC CAG GCC ATC TGC AGG TAC TAG TGG CCT AGC TGG GTA GTC TTT CCT     334
 335  GAG GTC TCA CCT CAG GCC TTT GTG CTG CTG CTG TTG CTT CTG GCC TTG     382
 383  AGC CTG AGA GAG AGG TGA GAG GAA GGA TGC TTT CTC TAA CTT GGG CTC     430
 431  CTC CAA TCT CTG GTT GCA AAG CTG GGG TTG GGG GAG AGA GGA CCA CCC     478
 479  AAC CTG CCC TGT ACA AGC ATC AGT AAG ACT CCA AGT TTC CCA GGG CCC     526
 527  GAA CAC TTG GGG GTT GTC TCT CAA CAC CCG GCT GGA AGA CAA GTA GGT     574
 575  AAC CAG GTT CAG CCC CAC CTG CCA AGA ACA CTG TGT TTT GGG CCT GGC     622
 623  AGA GCT GCT ACT CCC CCT CTC CCT CCT AAG AAT GCC CAG AGA ATC ACT     670
 671  TGC CAA GGC TAC TCC TGG AGC TCA GCT GTG GGA TCA GGG TTT GGG CTG     718
 719  AGG ATC AGG TGC CTG TGT GCA CAC ATG TGC ACA TTG TGT GTG CCA ATG     766
 767  GGT GGT AGG GAT TGA GCC CGT TGT GAG AAC ATC CAG CCA GGT TGG AAG     814
 815  TGT GTA CAG GTA TCT GAG GGT GTG CAC GTG AGC AAG AGG GTG TGC AAG     862
 863  ATG TGG GTG ACT GTT GGG ACC ACA GAG CTG AGG CCT GTG GTC AGC TCA     910
   1  Met Trp Val Thr Val Gly Thr Thr Glu Leu Arg Pro Val Val Ser Ser      16
 911  GGT CAG AAC TGG GAG GTC TGT TTC CCT TGG GAG GAC CTG TCT GCT CTG     958
  17  Gly Gln Asn Trp Glu Val Cys Phe Pro Trp Glu Asp Leu Ser Ala Leu      32
 959  AGG GGG ACC CGG ACA AGT GCA CAT ATG CAT GTG TGT GTC TAC ACA CAC    1006
  33  Arg Gly Thr Arg Thr Ser Ala His Met His Val Cys Val Tyr Thr His      48
1007  ACA CAC ACA CAC ACA CAC ACA CAC ACA CAC ATA TGC TTG CCT CCC TCT    1054
  49  Thr His Thr His Thr His Thr His Thr His Ile Cys Leu Pro Pro Ser      64
1055  CCA AGG CAG ACT TGC CTG GGA AGT ACC CCT CCT CAG CAG GAG CTC GAA    1102
  65  Pro Arg Gln Thr Cys Leu Gly Ser Thr Pro Pro Gln Gln Glu Leu Glu      80
1103  GAC CCC TGC CCA GTG CTG TTT TCA GTA GAG GGA GTG GAG CTG AGA TGG    1150
  81  Asp Pro Cys Pro Val Leu Phe Ser Val Glu Gly Val Glu Leu Arg Trp      96
1151  GGA GAC CGT ACT GAG CGG TCC AGG AGT AGG GAA ACA GAG CTG CTT TGC    1198
  97  Gly Asp Arg Thr Glu Arg Ser Arg Ser Arg Glu Thr Glu Leu Leu Cys     112
1199  AGC TTC TGT TCC AGA AGA TGG GGG TTG GGG GGC GGG GTT GAG GGC CAG    1246
 113  Ser Phe Cys Ser Arg Arg Trp Gly Leu Gly Gly Gly Val Glu Gly Gln     128
1247  GGG TGG GAG CAG GAG CAG AAC AGA AAG CCT CCC TGC TCA CTG GCC TTT    1294
 129  Gly Trp Glu Gln Glu Gln Asn Arg Lys Pro Pro Cys Ser Leu Ala Phe     144
1295  CCC CTT CCC TCA CTG GCT GCC CAT GGA GCC AGG ATC AGC ATG GGA ACA    1342
 145  Pro Leu Pro Ser Leu Ala Ala His Gly Ala Arg Ile Ser Met Gly Thr     160
1343  ATC AAG GAG GCA GGG GCT TAT CAG TAC TAT GGA CCC CTA CAC TGC TCT    1390
 161  Ile Lys Glu Ala Gly Ala Tyr Gln Tyr Tyr Gly Pro Leu His Cys Ser     176
1391  GCC TGG TGG TTC TTC TCT TCG CAT ACC AAA GAC AGA AAT TAA GCC TCC    1438
 177  Ala Trp Trp Phe Phe Ser Ser His Thr Lys Asp Arg Asn ***             190
1439  AAG AGT GGT AAC TGA CCT CGG TCA CAC TTG GTG GGT GTG GGA AAG GAT    1486
1487  TCA AAT GTA GGT CTG TTC TCT TCT TCA TCT ATC ATG GTC CCT GTC CTG    1534
1535  GAG GCA AGT CGT CTG GGG CTC AGA AAA CAC CCC TGT TGC CAC TGA TTG    1582
1583  GAA TTC CAA GGG TCT GGG TGA AGT GGG GAT GGG CCT CCA GCT TGC CTC    1630
1631  CAG CCT GAA AAA ATA GTA GAG GGT GTT GAG GCT GGG AAG GGA GGT GGG    1678
1679  GCT CAT GTT GTA CAG GGC CTG AGC CAG GGA GCT TGG GCT TCA TTC TGA    1726
1727  GTA CTG TGG CAG CCC TGG GAA GGT TTG TAG CAC AGA GGG ATA TTG TCA    1774
1775  TTT TTG GAA AGA TCC CTT TGG CTG CTT AGG TAG AGA AGG GCT TCA AGA    1822
1823  GGG CAG GAA GGG ACA GGA CTA CAG AAG GGG CTG CTT CAG AGT CCA GAT    1870
1871  TAA GGA AGG AGA GGC CTG GGC AGT CAG AAA GGA AGA GAA GCC GGA TGT    1918
1919 GGT GGC TTG TAT CTT CAA TCC CAG CAC TTT GAG AGG CCA AGG TGG GAG     1966
1967  GAT CAC TTG AGC CCA GGA GTT CAA AAC CAG CTT GGG CAA CAT AGT GAG    2014
2015  ACT CCC ATC TCT CCA AAA AAA TTT AAA AAC CAG CCA GGT AGA CTG GGC    2062
2063  GCA GTG GCT CAC GCC TGT AAT CCC AGA ACT TTG GGA GGC CGA GGC AGG    2110
2111  CAG ATC ACG AGG TCA AGA GTT AGA GAC CAG CCT GAC CAA CAT GGT GAA    2158
2159  ACC CCG TCT CTA CTA AAA ATA CAA AAC TTA GCC AGG CCT GTG GTG ATG    2206
2207  CGC ACC TGT AGT CTC AGC TAC TCA GGA GGC TGA GGC AGG AGA ATC GCT    2254
2255  TGA ACC CGG GAG GCA GAG GTT GCA CTG AGC TGA GAT CAC GCC ACT GCA    2302
2303  CTC CAG CCT GGG CAA CAG AGT GAG ACT CCG TCT CAA ACA AAA AAA AAA    2350
2351  AAA AAA AAA AAA                                                    2362
9.PP10933
A:核苷酸序列(SEQ ID NO:25)长度:1680个碱基
   1  GGGCGGGCGG  AGCGCGGGCG  CGGCGGGGGC  GGGCGGCCAG  GCTAGTCGGG  CGGGTGCGCG
  61  GGGCGCTCGG  GGCCCGGGGC  CAGAGCTGGA  GCCGGAGCCG  GGCGGGCGCC  ATGGAGGGGC
 121  TGCGGCGGGG  GCTGTCGCGC  TGGAAGCGCT  ACCACATCAA  GGTGCACCTG  GCGGACGAGG
 181  CGCTGCTGCT  ACCGCTGACC  GTGCGGCCGC  GGGACACGCT  CAGCGACCTG  CGCGCCCAGC
 241  TGGTGGGCCA  GGGCGTGAGC  TCCTGGAAGC  GCGCCTTCTA  CTACAACGCG  CGGCGGCTGG
 301  ACGACCACCA  GACGGTGCGC  GACGCGCGCC  TGCAGGACGG  CTCGGTGCTG  CTGCTCGTCA
 361  GCGACCCCAG  GTAGTCTGGG  TTGGAGGAGG  CAGAGCCATG  ACCAAGGGGA  CCTGGGTACT
 421  GGCTGAAGGA  ATAGGCTGGG  GTAGAGGGCA  CTTTTGGAAG  GCACTTCTCC  TGCCTCCTGG
 481  GAGCCTAGAT  CTCACTCCAG  GGTCTGGGCT  CCCAGGTGGA  CCATGAAACC  CTGGCCTGAC
 541  CAGCTGATGC  ACACTGCTTC  AGACACTCCT  GCTGGAGCCC  CAGTCCCTGA  CAAGGACCTA
 601  GGACATTTTT  GCTCCTGCCC  AGCCTATCGG  GAGGGAGCCT  TGAGCCTTTC  AGCTCTGCTG
 661  TGTGACTTTG  AGGTTGTTGC  TCCCCTCTTG  GGGCCCTGGG  TGCCCTGTCT  TCAGTGGAAA
 721  GCACTGTGCC  ACCTTGGAAA  GCTCCCATGG  GCAGCCAGAG  GGCATCGCAA  GAAGAGAAGC
 781  ACAGAAGGGG  CAGGAGAGAC  ACTCAGAGGC  ACTTCCGCTC  TTGCCCAGGA  CATTCTCCCA
 841  GCCACACCTT  TGCCCAAGCC  GTGCCCCCTG  CCTGGAGCAC  TTTTCAACCT  CTTCTCTGCA
 901  GCTCCAATAC  ACCTGGGATT  GCAGTCTCCT  CCAGGAAGTC  TTCTCAGATT  CCCTCCTTCC
 961  CAGCCAGAGA  GCACCTAGCC  TTCTTTGGGG  CCCCCACAGG  CCCTTTGTGC  AGTGAACAGC
1021  CCTGGCTGGG  GGTGCAGCCA  GTCGTGTCCG  AACTCTCCAA  TGACTAAGCG  GGGAGATGCG
1081  GACATCCTAG  CTCCTTCTCA  GGCCTCCAAC  TGTGCCCCAT  TTCCACCCCC  AAATACCTCC
1141  CCAGGAGGCA  CCTGTGCCCA  CCCCCTGGGC  TGTTTCCCCC  TTCCCCTTAA  ATCCGGATGC
1201  CTCGTCTTGC  ATAGGGTCTT  GGGGCAGCGG  GGAAGGGGTT  CTGAAGAACT  CTGGCCAAGA
1261  GGACGAGGAT  CTGGGGGTGG  GGAACTGGGC  CTAGCTGTGG  GAGGTCATCG  CGGGGCATTG
1321  CAGGGAGTGC  GTTGTGGGAA  TTCCGGGTGG  AGACCCTCAG  GGCAGTGTGC  CGGGCCTCCG
1381  TTGCACCTCT  GACCTGCAGC  CACGTCATCG  TTGCGCAGCC  CCTGGGGAGG  GTCTTTGGGG
1441  AGGGGGTGCC  GAGGCTACGC  ATGTCCTCGA  GGGCCGTGTA  CACTCTCCAG  GCACCATGGG
1501  CGGAGGCGCC  AGAGGCTGGG  AAGAAATAAT  GTTTTAGTTA  AGAGTCCTGT  TGGCTGCAGG
1561  ACTCAGAGCA  TGGACAGGTG  GATAGTAAAT  CACCACCACG  GGGAAAAAAA  AAAAAAAAAA
1621  AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAA  AAAAAAAAAA
B:核苷酸序列(SEQ ID NO:26)长度:151个氨基酸

  1  MKPWPDQLMH TASDTPAGAP VPDKDLGHFC SCPAYREGAL SLSALLCDFE VVAPLLGPWV

 61  PCLQWKALCH LGKLPWAARG HRKKRSTEGA GETLRGTSAL AQDILPATPL PKPCPLPGAL

121  FNLFSAAPIH LGLQSPPGSL LRFPPSQPES T
C.核苷酸及氨基酸组合序列(SEQ ID NO:27)克隆号:PP10933
起始编码子:523 ATG  终止编码子:976 TAG  蛋白质分子量:16073.76
   1 GGG CGG GCG GAG CGC GGG CGC GGC GGG GGC GGG CGG CCA GGC TAG TCG    48
  49 GGC GGG TGC GCG GGG CGC TCG GGG CCC GGG GCC AGA GCT GGA GCC GGA    96
  97 GCC GGG CGG GCG CCA TGG AGG GGC TGC GGC GGG GGC TGT CGC GCT GGA   144
 145  AGC GCT ACC ACA TCA AGG TGC ACC TGG CGG ACG AGG CGC TGC TGC TAC     192
 193  CGC TGA CCG TGC GGC CGC GGG ACA CGC TCA GCG ACC TGC GCG CCC AGC     240
 241  TGG TGG GCC AGG GCG TGA GCT CCT GGA AGC GCG CCT TCT ACT ACA ACG     288
 289  CGC GGC GGC TGG ACG ACC ACC AGA CGG TGC GCG ACG CGC GCC TGC AGG     336
 337  ACG GCT CGG TGC TGC TGC TCG TCA GCG ACC CCA GGT AGT CTG GGT TGG     384
 385  AGG AGG CAG AGC CAT GAC CAA GGG GAC CTG GGT ACT GGC TGA AGG AAT     432
 433  AGG CTG GGG TAG AGG GCA CTT TTG GAA GGC ACT TCT CCT GCC TCC TGG     480
 481  GAG CCT AGA TCT CAC TCC AGG GTC TGG GCT CCC AGG TGG ACC ATG AAA     528
   1                                                          Met Lys       2
 529  CCC TGG CCT GAC CAG CTG ATG CAC ACT GCT TCA GAC ACT CCT GCT GGA     576
   3  Pro Trp Pro Asp Gln Leu Met His Thr Ala Ser Asp Thr Pro Ala Gly      18
 577  GCC CCA GTC CCT GAC AAG GAC CTA GGA CAT TTT TGC TCC TGC CCA GCC     624
  19  Ala Pro Val Pro Asp Lys Asp Leu Gly His Phe Cys Ser Cys Pro Ala      34
 625  TAT CGG GAG GGA GCC TTG AGC CTT TCA GCT CTG CTG TGT GAG TTT GAG     672
  35  Tyr Arg Glu Gly Ala Leu Ser Leu Ser Ala Leu Leu Cys Asp Phe Glu      50
 673  GTT GTT GCT CCC CTC TTG GGG CCC TGG GTG CCC TGT CTT CAG TGG AAA     720
  51  Val Val Ala Pro Leu Leu Gly Pro Trp Val Pro Cys Leu Gln Trp Lys      66
 721  GCA CTG TGC CAC CTT GGA AAG CTC CCA TGG GCA GCC AGA GGG CAT CGC     768
  67  Ala Leu Cys His Leu Gly Lys Leu Pro Trp Ala Ala Arg Gly His Arg      82
 769  AAG AAG AGA AGC ACA GAA GGG GCA GGA GAG ACA CTC AGA GGC ACT TCC     816
  83  Lys Lys Arg Ser Thr Glu Gly Ala Gly Glu Thr Leu Arg Gly Thr Ser      98
 817  GCT CTT GCC CAG GAC ATT CTC CCA GCC ACA CCT TTG CCC AAG CCG TGC     864
  99  Ala Leu Ala Gln Asp Ile Leu Pro Ala Thr Pro Leu Pro Lys Pro Cys     114
 865  CCC CTG CCT GGA GCA CTT TTC AAC CTC TTC TCT GCA GCT CCA ATA CAC     912
 115  Pro Leu Pro Gly Ala Leu Phe Asn Leu Phe Ser Ala Ala Pro Ile His     130
 913  CTG GGA TTG CAG TCT CCT CCA GGA AGT CTT CTC AGA TTC CCT CCT TCC     960
 131  Leu Gly Leu Gln Ser Pro Pro Gly Ser Leu Leu Arg Phe Pro Pro Ser     146
 961  CAG CCA GAG AGC ACC TAG CCT TCT TTG GGG CCC CCA CAG GCC CTT TGT    1008
 147  Gln Pro Glu Ser Thr ***                                             152
1009  GCA GTG AAC AGC CCT GGC TGG GGG TGC AGC CAG TCG TGT CCG AAC TCT    1056
1057  CCA ATG ACT AAG CGG GGA GAT GCG GAC ATC CTA GCT CCT TCT CAG GCC    1104
1105  TCC AAC TGT GCC CCA TTT CCA CCC CCA AAT ACC TCC CCA GGA GGC ACC    1152
1153  TGT GCC CAC CCC CTG GGC TGT TTC CCC CTT CCC CTT AAA TCC GGA TGC    1200
1201  CTC GTC TTG CAT AGG GTC TTG GGG CAG CGG GGA AGG GGT TCT GAA GAA    1248
1249  CTC TGG CCA AGA GGA CGA GGA TCT GGG GGT GGG GAA CTG GGC CTA GCT    1296
1297  GTG GGA GGT CAT CGC GGG GCA TTG CAG GGA GTG CGT TGT GGG AAT TCC    1344
1345  GGG TGG AGA CCC TCA GGG CAG TGT GCC GGG CCT CCG TTG CAC CTC TGA    1392
1393  CCT GCA GCC ACG TCA TCG TTG CGC AGC CCC TGG GGA GGG TCT TTG GGG    1440
1441  AGG GGG TGC CGA GGC TAC GCA TGT CCT CGA GGG CCG TGT ACA CTC TCC    1488
1489  AGG CAC CAT GGG CGG AGG CGC CAG AGG CTG GGA AGA AAT AAT GTT TTA    1536
1537  GTT AAG AGT CCT GTT GGC TGC AGG ACT CAG AGC ATG GAC AGG TGG ATA    1584
1585  GTA AAT CAC CAC CAC GGG GAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    1632
1633  AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA    1680
10. PP11246
A:核苷酸序列(SEQ ID NO:28)长度:2059个碱基

 1 GAGCCTGAGG GACCCGGCGG CTGGTGAGCG CCCGCTGGAG GCTGGAGCTT CCGGGCCCTG

61 GAAAGGGGTC CCCGCGCGCC CCGGGTCGGA GGCAGACCCC TGGGTTTGGG GGACATGGGC
 121  ATTTGGGGCG  CCTGAACCCA  AGACCTCTGG  ATGGTAGGGA  TGCCCGGGCG  TCCTGGATAC
 181  CCTGCGGGAC  TCGGGGCTCC  TGCGGGGAAG  ATGGCACGTT  TTACTGCCCA  AGGAGTGGTC
 241  AGGGGGGTGG  AGAAGCGCTG  CGGATACCCT  CAGGAGGTCT  GCGACAGAGG  GGGCTAGCTG
 301  CGCAGCCCAG  GAGTGGTAGT  GGCCCCCCTG  GATGACAGGC  CTGCCCGTAT  CCTCCCCCAG
 361  AGCTGCCCCG  TTCAGACCAT  GGATCCTGAG  GTGACCTTGC  TTGTGCAGTG  CCCTGGCGGG
 421  GGCCTGCCCC  AGGAGCAGAT  ACAGGCCGAG  CTGAGCCCCG  CCCATGACCG  TCGCCCACTG
 481  CCAGGTGGGG  ACGAGGCCAT  CACTGCCATC  TGGGAGACCC  GGCTAAAGGC  CCAACCCTGG
 541  CTCTTCGACG  CCCCCAAGTT  CCGCCTGCAC  TCAGCCACCC  TGGCGCCTAT  TGGCTCTCGG
 601  GGGCCACAGC  TGCTCCTGCG  CCTGGGCCTT  ACTTCCTACC  GAGACTTCCT  GGGCACCAAC
 661  TGGTCCAGCT  CAGCTGCCTG  GCTGCGACAG  CAGGGTGCCA  CCGACTGGGG  TGACACGCAG
 721  GCCTATCTGG  CGGACCCACT  GGGGGTGGGC  GCTGCACTAG  CCACAGCCGA  TGACTTCCTT
 781  GTCTTCCTGC  GCCGCTCCCG  GCAGGTGGCT  GAGGCCCCTG  GGCTGGTGGA  CGTACCTGGT
 841  GGGCACCCTG  AGCCTCAGGT  GAGATTCCAG  GCTGGGCACA  AAGACCCAGA  CAGCTCAAGG
 901  GAGCTGCAGC  TCTCCACCCT  CCCAATCCTC  CCAGCTTTGG  TTTCCCCATC  CCTTAAAGGA
 961  AAATTGGCCT  GGTATTTCTC  TGGAAGTTTG  CTCAGGGCAG  TCCACCTGCC  TCCCCACTGA
1021  CCCCTGCCCC  AGTCCTGTGA  GAAACTAGAA  AACACGGGAG  GAAAGATTGG  GCACAGGAAG
1081  AAGATGCCCT  ACTCCACCCC  TGCCCCCTGT  GTATCTCCTT  TGAAGCTGGA  CCTCTGGTTG
1141  TCTGTCAGGG  AAAGGACACC  AGACTCAGGA  TCACTAACTC  TCTTACACTG  TGCCACATCA
1201  GACCCTCAAG  GCCAGCAGGT  ATAGGCTTGC  TGGTCCTGAG  ATGGGGCAGG  GGGAAGAGGT
1261  GGGGAGCAGG  GGCTGAGCCT  GACCTCTCAC  AGGCCCTGTG  CCCTGGTGGC  AGCCCCCAGC
1321  ACCAGGACCT  CGCTGGGCAG  CTGGTGGTAC  ATGAACTCTT  TTCCAGTGTC  CTTCAGGAGA
1381  TCTGTGATGA  GGTGAGTGAG  GTTGACCTGG  ACAGGGTGGT  AGACATGAAG  GGAGGGGGTA
1441  GGACTTGCCA  GAATTCTACA  GGTCTGGGCT  GGCAGGAGGC  CTGCAGGCAT  CTGGCCAGCA
1501  ATGAGGGAAG  AAGTTGGCTT  TGCAGCTATA  CATACTTGGA  GTGGAATTCT  AGCCGTCAGT
1561  ACCCTCTGCC  TTGGATTCTT  CTTCTTTTCT  TTTTTCTTTC  TTTTTTTTTT  TTTAGACAGA
1621  GTCTCGCTCT  GTTGCCCAGG  AGAATGGCGT  GAACCCGGGA  GGCGGAGGTT  GCAGTGAGCC
1681  GAAATCGCGC  CACTGCACTT  CAGCCTGGGC  GACAAAGCGA  GACTCCGTCT  CAAAAAAAAG
1741  AAAAAGGAGT  AAGTGTGGCA  GGGTGTGGTG  GCTCACACCT  GTAATCCCAG  CACTTTGGGA
1801  GGCCAAGGGC  CAGCGGATCA  CCTGAGGTCA  GGAGTTCGAG  ACCAGCCTGG  CCAACATGGA
1861  GAAACCCCAT  CTCTACTAAA  AATACAAAAA  ATTAGCCAGG  CGTTGTGGCG  TGCACCTGTA
1921  ATCCCAGCTA  CTCAGGAGGC  TGAGGCAGGA  GAATCACTTT  AACCTGGGAG  GCAGAGGTTG
1981  CAGTGAGCTG  AGATCGTGCC  ACTGTACTCC  AGCCTGGGCG  ACAGAGCGAG  ACTCCATCTC
2041  AAAAAAAAAA  AAAAAAAAA
B:核苷酸序列(SEQ ID NO:29)  长度:213个氨基酸

  1 MDPEVTLLVQ CPGGGLPQEQ IQAELSPAHD RRPLPGGDEA ITAIWETRLK AQPWLFDAPK

 61 FRLHSATLAP IGSRGPQLLL RLGLTSYRDF LGTNWSSSAA WLRQQGATDW GDTQAYLADP

121 LGVGAALATA DDFLVFLRRS RQVAEAPGLV DVPGGHPEPQ VRFQAGHKDP DSSRELQLST

181 LPILPALVSP SLKGKLAWYF SGSLLRAVHL PPH
C.核苷酸及氨基酸组合序列(SEQ ID NO:30)克隆号:PP11246
起始编码子:379 ATG  终止编码子:1018 TGA  蛋白质分子量:23100.94
   1  GAG CCT GAG GGA CCC GGC GGC TGG TGA GCG CCC GCT GGA GGC TGG AGC     48
  49  TTC CGG GCC CTG GAA AGG GGT CCC CGC GCG CCC CGG GTC GGA GGC AGA     96
  97  CCC CTG GGT TTG GGG GAC ATG GGC ATT TGG GGC GCC TGA ACC CAA GAC    144
 145  CTC TGG ATG GTA GGG ATG CCC GGG CGT CCT GGA TAC CCT GCG GGA CTC    192
 193  GGG GCT CCT GCG GGG AAG ATG GCA CGT TTT ACT GCC CAA GGA GTG GTC    240
 241  AGG GGG GTG GAG AAG CGC TGC GGA TAC CCT CAG GAG GTC TGC GAC AGA    288
 289  GGG GGC TAG CTG CGC AGC CCA GGA GTG GTA GTG GCC CCC CTG GAT GAC    336
 337  AGG CCT GCC CGT ATC CTC CCC CAG AGC TGC CCC GTT CAG ACC ATG GAT    384
   1                                                          Met Asp      2
 385  CCT GAG GTG ACC TTG CTT GTG CAG TGC CCT GGC GGG GGC CTG CCC CAG    432
   3  Pro Glu Val Thr Leu Leu Val Gln Cys Pro Gly Gly Gly Leu Pro Gln     18
 433  GAG CAG ATA CAG GCC GAG CTG AGC CCC GCC CAT GAC CGT CGC CCA CTG    480
  19  Glu Gln Ile Gln Ala Glu Leu Ser Pro Ala His Asp Arg Arg Pro Leu     34
 481  CCA GGT GGG GAC GAG GCC ATC ACT GCC ATC TGG GAG ACC CGG CTA AAG    528
  35  Pro Gly Gly Asp Glu Ala Ile Thr Ala Ile Trp Glu Thr Arg Leu Lys     50
 529  GCC CAA CCC TGG CTC TTC GAC GCC CCC AAG TTC CGC CTG CAC TCA GCC    576
  51  Ala Gln Pro Trp Leu Phe Asp Ala Pro Lys Phe Arg Leu His Ser Ala     66
 577  ACC CTG GCG CCT ATT GGC TCT CGG GGG CCA CAG CTG CTC CTG CGC CTG    624
  67  Thr Leu Ala Pro Ile Gly Ser Arg Gly Pro Gln Leu Leu Leu Arg Leu     82
 625  GGC CTT ACT TCC TAC CGA GAC TTC CTG GGC ACC AAC TGG TCC AGC TCA    672
  83  Gly Leu Thr Ser Tyr Arg Asp Phe Leu Gly Thr Asn Trp Ser Ser Ser     98
 673  GCT GCC TGG CTG CGA CAG CAG GGT GCC ACC GAC TGG GGT GAC ACG CAG    720
  99  Ala Ala Trp Leu Arg Gln Gln Gly Ala Thr Asp Trp Gly Asp Thr Gln    114
 721  GCC TAT CTG GCG GAC CCA CTG GGG GTG GGC GCT GCA CTA GCC ACA GCC    768
 115  Ala Tyr Leu Ala Asp Pro Leu Gly Val Gly Ala Ala Leu Ala Thr Ala    130
 769  GAT GAC TTC CTT GTC TTC CTG CGC CGC TCC CGG CAG GTG GCT GAG GCC    816
 131  Asp Asp Phe Leu Val Phe Leu Arg Arg Ser Arg Gln Val Ala Glu Ala    146
 817  CCT GGG CTG GTG GAC GTA CCT GGT GGG CAC CCT GAG CCT CAG GTG AGA    864
 147  Pro Gly Leu Val Asp Val Pro Gly Gly His Pro Glu Pro Gln Val Arg    162
 865  TTC CAG GCT GGG CAC AAA GAC CCA GAC AGC TCA AGG GAG CTG CAG CTC    912
 163  Phe Gln Ala Gly His Lys Asp Pro Asp Ser Ser Arg Glu Leu Gln Leu    178
 913  TCC ACC CTC CCA ATC CTC CCA GCT TTG GTT TCC CCA TCC CTT AAA GGA    960
 179  Ser Thr Leu Pro Ile Leu Pro Ala Leu Val Ser Pro Ser Leu Lys Gly    194
 961  AAA TTG GCC TGG TAT TTC TCT GGA AGT TTG CTC AGG GCA GTC CAC CTG   1008
 195  Lys Leu Ala Trp Tyr Phe Ser Gly Ser Leu Leu Arg Ala Val His Leu    210
1009  CCT CCC CAC TGA CCC CTG CCC CAG TCC TGT GAG AAA CTA GAA AAC ACG   1056
 211  Pro Pro His ***                                                    214
1057  GGA GGA AAG ATT GGG CAC AGG AAG AAG ATG CCC TAC TCC ACC CCT GCC   1104
1105  CCC TGT GTA TCT CCT TTG AAG CTG GAC CTC TGG TTG TCT GTC AGG GAA   1152
1153  AGG ACA CCA GAC TCA GGA TCA CTA ACT CTC TTA CAC TGT GCC ACA TCA   1200
1201  GAC CCT CAA GGC CAG CAG GTA TAG GCT TGC TGG TCC TGA GAT GGG GCA   1248
1249  GGG GGA AGA GGT GGG GAG CAG GGG CTG AGC CTG ACC TCT CAC AGG CCC   1296
1297  TGT GCC CTG GTG GCA GCC CCC AGC ACC AGG ACC TCG CTG GGC AGC TGG   1344
1345  TGG TAC ATG AAC TCT TTT CCA GTG TCC TTC AGG AGA TCT GTG ATG AGG   1392
1393  TGA GTG AGG TTG ACC TGG ACA GGG TGG TAG ACA TGA AGG GAG GGG GTA   1440
1441  GGA CTT GCC AGA ATT CTA CAG GTC TGG GCT GGC AGG AGG CCT GCA GGC   1488
1489  ATC TGG CCA GCA ATG AGG GAA GAA GTT GGC TTT GCA GCT ATA CAT ACT   1536
1537  TGG AGT GGA ATT CTA GCC GTC AGT ACC CTC TGC CTT GGA TTC TTC TTC   1584
1585  TTT TCT TTT TTC TTT CTT TTT TTT TTT TTA GAC AGA GTC TCG CTC TGT   1632
1633  TGC CCA GGA GAA TGG CGT GAA CCC GGG AGG CGG AGG TTG CAG TGA GCC   1680
1681  GAA ATC GCG CCA CTG CAC TTC AGC CTG GGC GAC AAA GCG AGA CTC CGT   1728
1729  CTC AAA AAA AAG AAA AAG GAG TAA GTG TGG CAG GGT GTG GTG GCT CAC   1776
1777  ACC TGT AAT CCC AGC ACT TTG GGA GGC CAA GGG CCA GCG GAT CAC CTG   1824
1825  AGG TCA GGA GTT CGA GAC CAG CCT GGC CAA CAT GGA GAA ACC CCA TCT   1872
1873  CTA CTA AAA ATA CAA AAA ATT AGC CAG GCG TTG TGG CGT GCA CCT GTA   1920
1921  ATC CCA GCT ACT CAG GAG GCT GAG GCA GGA GAA TCA CTT TAA CCT GGG   1968
1969   AGG CAG AGG TTG CAG TGA GCT GAG ATC GTG CCA CTG TAC TCC AGC CTG  2016
2017   GGC GAC AGA GCG AGA CTC CAT CTC AAA AAA AAA AAA AAA AAA A        2059
11.PP11347
A:核苷酸序列(SEQ ID NO:31)长度:2432个碱基
   1  GAAACGTCTT  GCATCCTTTT  TGTCACTCAT  CAACCAGAGG  GACAGACCAG  GCCCTGGGGT
  61  TTGAGTGTAC  TTTGAGAGCA  GAGTGGGATG  TCCCTGTGTT  TCCCACCTGT  TTGCAGAGAC
 121  AGAATGGGAA  AGGGTGAGTG  TCCTAACTGC  ATGCCCAACT  CATCTCCTGC  ACTCTGCATG
 181  CCGAGGTGCC  CCCCGAATGC  CAGGAAGGCA  TCTGTGGCTG  GGCATGGTGG  AGCCACCTTG
 241  ACAGAGCGCA  GAGAGCCGTT  TCCACTAACG  CCTCCCGGTG  CTGTCCTGGT  CGGCCTGCGA
 301  TGGGGGTCCT  GGCTGAGCCC  AAGCAAGGGG  AGGGAGCTCA  GGGCTGACCC  CTCTGCCAGA
 361  GATCGGCTCT  GTGCTTGGAA  TATGGAACCC  AAAGACCTTA  ACACTGCCCT  TCTCTCTGCC
 421  TTCACCACTC  CAGGAGCCCG  GTGGGCACCT  ACCACATCTC  TAGTCTAGCC  AGCACGCGAG
 481  TCCCGAGGGT  GGGCCTGAAT  TCCTGAGCTT  GCTCTCGCGT  GCCTTTCAGG  CGATGAGAAT
 541  GATTTATTTG  TTTGTGATGC  ATGTTTGCTG  AAAGATTAAT  AAATCATTTC  TGTGCCTTTA
 601  GCAAACTTCC  TGTGTTGCTC  TTAAAAAGGG  ATCATCCACC  TTCCCGGACC  ACAAGGTTAA
 661  GGTAACCCCG  CTAGGTAACC  CTGATAGGCC  TGCTGCGGGG  CAGACCGACA  GAGAGAGAGA
 721  GAGTGAGGGC  GAGGGTGAGG  TAAGCAACGC  CCCGGGAACC  CCGGGGTCCC  TGGCTCACAT
 781  CTCCTCGCCA  GCTCAGGCGC  CTTCTGGGAA  AATGAATCCT  TGCATTTTTC  TGTTCTCTAA
 841  TATGGCTTTT  GAGGTCTTAA  ATTTGAGGAG  CCGGAATCAT  GCCTTCCTCC  TAATCTGCAG
 901  GGCCTCTTTG  GAGCTGCCCC  CGCCAGCAGT  GAAGGGTGCT  TGTCGGCCAG  GGCGCCTCTC
 961  CCCGGGCGCC  TGGCTGGAGG  TGGCTGGAGC  TGGGACGGGC  AGGGCCCTGG  CTGGGGTGGT
1021  GGTTGGCAGC  TCAGCTCTCC  TCCCTTGGCT  GCCCTTGCTG  AACCCACCCC  TGACCTTTGT
1081  GGGCAGCTGC  AGTGTCAGGC  GGGAGCTCGG  GGCTCTTGCT  CCAAGACTCT  TGAGCTCCCA
1141  GGAAGACCTG  CCACACCGGC  ATCAGTGGCT  GCTGCTGTGG  CCACGTGAGG  TGGGGCTGTG
1201  AGGGGAGGCG  GCTGCTGTGG  ATGATGCCAG  GACCCTGGGG  GCAGAGCCTC  TGAGAAGGTG
1261  GGCTCCCTGG  CTGCACAGTG  TCAGGCAGAA  CCCCTGGCTG  CCTGCTGAAA  GCCCCAAGGT
1321  CAGGGGCTGC  CCAGCTCCCC  GCGCTGCGGT  CTGTGGTGGC  CCCGTGCATG  CACCGGGTGG
1381  CTGGCCCGCT  GAGCTTCCCC  GGCACCAGGT  GCCCTGGACC  TCGAGGTCCT  GAGCCTGACC
1441  CAGGGCTGGT  CTGACCGACT  CTCTGCTTCT  GGCTCCTGGG  CACTTCTTCT  CAGCTCAGGG
1501  CGTGCTCTGT  CAAAACCAAG  TCCTTTCTTG  GCTCTGTGTC  AGGCGGGGTG  TTCAGCAGGG
1561  GTCACCTGGC  TCTTCTGTCT  TTGCAGGGCC  CCCTCGTGCG  CTGGCTCAAG  GTGAACTTCA
1621  GTGAAGCCTT  CATTGCCTGG  ATCCACATCA  AGGCCCTGAG  AGTGTTTGTG  GAGTCCGTGC
1681  TCAGGTGCGT  GGCAGTGATG  CCCCGGCTGG  GACTGTCCTG  AGGATGGGCA  GGGTCTGGGG
1741  GAGCTATCGG  GGCACCCCAG  CTCCTGCCTT  CTCTCCATCC  TCCACCCGTC  TCCTTTCTGA
1801  GACTGTGGCT  GTTGGCAACA  CGCTCAATTC  CGAGTCAAGT  ACACCCTCCC  CTCAGCCCTG
1861  TGTCCCCTGC  TGTCTGCTCC  CTCCGTTCCT  GCTACACTTG  GGGCAAGTGT  CACCTGGGTT
1921  CTCCCCAGCT  GCCCTACCTG  CATGCCCTTG  TGGACCCTCT  GGCTGGCTCC  TGTCCCCACC
1981  CTCGTGAAGC  CGCAGGGCCG  AGTGGCTCCT  GGAAGGCGCT  CTCGGGCTGC  CTCCGTCCTC
2041  AGCCTGGAAG  CCGCACCCCT  CAAGGCAGTC  CAGAGAGAAA  ACCAAAACCA  CACCAACAAC
2101  AACAAAGCTT  ATTTTGCCTT  TTTTTTTTTT  ATTTGAGATG  GAGTTTCACT  CTTGTCGCCC
2161  AGGCTAGAGT  GCAATGGCAT  GTTCCTGGCT  CACTGAAACC  TCCACCTCTC  AGGTTCAGGA
2221  GATTCTCCTG  TCTCAGCCCA  CCTCTACTAA  AAATACAGAA  ATTAGCCGGG  TGTGGTGGCA
2281  TGGGCCTGTA  GTACTGGCTA  CTTGGGAGGC  TGAGGTGGGA  GGATCACTTG  AGCCTCGGAG
2341  CCGGAGGTTG  CAGTGAGCCG  AGATCGCGTC  ACTGCACTCG  AGCCTGGGCA  ACAAGAGAAA
2401  CTCCGGCTAT  AGAAAAAAAA  AAAAAAAAAA  AA
B:核苷酸序列(SEQ ID NO:32)长度:129个氨基酸

  1  MNPCIFLFSN MAFEVLNLRS RNHAFLLICR ASLELPPPAV KGACRPGRLS PGAWLEVAGA

 61  GTGRALAGVV VGSSALLPWL PLLNPPLTFV GSCSVRRELG ALAPRLLSSQ EDLPHRHQWL

121  LLWPREVGL
C.核苷酸及氨基酸组合序列(SEQ ID NO:33)克隆号:PP11347
起始编码子:812 ATG 终止编码子:1199 TGA  蛋白质分子量:13981.69
   1    G AAA CGT CTT GCA TCC TTT TTG TCA CTC ATC AAC CAG AGG GAC AGA      46
  47  CCA GGC CCT GGG GTT TGA GTG TAC TTT GAG AGC AGA GTG GGA TGT CCC      94
  95  TGT GTT TCC CAC CTG TTT GCA GAG ACA GAA TGG GAA AGG GTG AGT GTC     142
 143  CTA ACT GCA TGC CCA ACT CAT CTC CTG CAC TCT GCA TGC CGA GGT GCC     190
 191  CCC CGA ATG CCA GGA AGG CAT CTG TGG CTG GGC ATG GTG GAG CCA CCT     238
 239  TGA CAG AGC GCA GAG AGC CGT TTC CAC TAA CGC CTC CCG GTG CTG TCC     286
 287  TGG TCG GCC TGC GAT GGG GGT CCT GGC TGA GCC CAA GCA AGG GGA GGG     334
 335  AGC TCA GGG CTG ACC CCT CTG CCA GAG ATC GGC TCT GTG CTT GGA ATA     382
 383  TGG AAC CCA AAG ACC TTA ACA CTG CCC TTC TCT CTG CCT TCA CCA CTC     430
 431  CAG GAG CCC GGT GGG CAC CTA CCA CAT CTC TAG TCT AGC CAG CAC GCG     478
 479  AGT CCC GAG GGT GGG CCT GAA TTC CTG AGC TTG CTC TCG CGT GCC TTT     526
 527  CAG GCG ATG AGA ATG ATT TAT TTG TTT GTG ATG CAT GTT TGC TGA AAG     574
 575  ATT AAT AAA TCA TTT CTG TGC CTT TAG CAA ACT TCC TGT GTT GCT CTT     622
 623  AAA AAG GGA TCA TCC ACC TTC CCG GAC CAC AAG GTT AAG GTA ACC CCG     670
 671  CTA GGT AAC CCT GAT AGG CCT GCT GCG GGG CAG ACC GAC AGA GAG AGA     718
 719  GAG AGT GAG GGC GAG GGT GAG GTA AGC AAC GCC CCG GGA ACC CCG GGG     766
 767  TCC CTG GCT CAC ATC TCC TCG CCA GCT CAG GCG CCT TCT GGG AAA ATG     814
   1                                                              Met       1
 815  AAT CCT TGC ATT TTT CTG TTC TCT AAT ATG GCT TTT GAG GTC TTA AAT     862
   2  Asn Pro Cys Ile Phe Leu Phe Ser Asn Met Ala Phe Glu Val Leu Asn      17
 863  TTG AGG AGC CGG AAT CAT GCC TTC CTC CTA ATC TGC AGG GCC TCT TTG     910
  18  Leu Arg Ser Arg Asn His Ala Phe Leu Leu Ile Cys Arg Ala Ser Leu      33
 911  GAG CTG CCC CCG CCA GCA GTG AAG GGT GCT TGT CGG CCA GGG CGC CTC     958
  34  Glu Leu Pro Pro Pro Ala Val Lys Gly Ala Cys Arg Pro Gly Arg Leu     49
 959  TCC CCG GGC GCC TGG CTG GAG GTG GCT GGA GCT GGG ACG GGC AGG GCC    1006
  50  Ser Pro Gly Ala Trp Leu Glu Val Ala Gly Ala Gly Thr Gly Arg Ala      65
1007  CTG GCT GGG GTG GTG GTT GGC AGC TCA GCT CTC CTC CCT TGG CTG CCC    1054
  66  Leu Ala Gly Val Val Val Gly Ser Ser Ala Leu Leu Pro Trp Leu Pro      81
1055  TTG CTG AAC CCA CCC CTG ACC TTT GTG GGC AGC TGC AGT GTC AGG CGG    1102
  82  Leu Leu Asn Pro Pro Leu Thr Phe Val Gly Ser Cys Ser Val Arg Arg      97
1103  GAG CTC GGG GCT CTT GCT CCA AGA CTC TTG AGC TCC CAG GAA GAC CTG    1150
  98  Glu Leu Gly Ala Leu Ala Pro Arg Leu Leu Ser Ser Gln Glu Asp Leu     113
1151  CCA CAC CGG CAT CAG TGG CTG CTG CTG TGG CCA CGT GAG GTG GGG CTG    1198
 114  Pro His Arg His Gln Trp Leu Leu Leu Trp Pro Arg Glu Val Gly Leu     129
1199  TGA GGG GAG GCG GCT GCT GTG GAT GAT GCC AGG ACC CTG GGG GCA GAG    1246
 130  ***                                                                 130
1247  CCT CTG AGA AGG TGG GCT CCC TGG CTG CAC AGT GTC AGG CAG AAC CCC    1294
1295  TGG CTG CCT GCT GAA AGC CCC AAG GTC AGG GGC TGC CCA GCT CCC CGC    1342
1343  GCT GCG GTC TGT GGT GGC CCC GTG CAT GCA CCG GGT GGC TGG CCC GCT    1390
1391  GAG CTT CCC CGG CAC CAG GTG CCC TGG ACC TCG AGG TCC TGA GCC TGA    1438
1439  CCC AGG GCT GGT CTG ACC GAC TCT CTG CTT CTG GCT CCT GGG CAC TTC    1486
1487  TTC TCA GCT CAG GGC GTG CTC TGT CAA AAC CAA GTC CTT TCT TGG CTC    1534
1535  TGT GTC AGG CGG GGT GTT CAG CAG GGG TCA CCT GGC TCT TCT GTC TTT    1582
1583  GCA GGG CCC CCT CGT GCG CTG GCT CAA GGT GAA CTT CAG TGA AGC CTT    1630
1631  CAT TGC CTG GAT CCA CAT CAA GGC CCT GAG AGT GTT TGT GGA GTC CGT    1678
1679  GCT CAG GTG CGT GGC AGT GAT GCC CCG GCT GGG ACT GTC CTG AGG ATG        1726
1727  GGC AGG GTC TGG GGG AGC TAT CGG GGC ACC CCA GCT CCT GCC TTC TCT        1774
1775  CCA TCC TCC ACC CGT CTC CTT TCT GAG ACT GTG GCT GTT GGC AAC ACG        1822
1823  CTC AAT TCC GAG TCA AGT ACA CCC TCC CCT CAG CCC TGT GTC CCC TGC        1870
1871  TGT CTG CTC CCT CCG TTC CTG CTA CAC TTG GGG CAA GTG TCA CCT GGG        1918
1919  TTC TCC CCA GCT GCC CTA CCT GCA TGC CCT TGT GGA CCC TCT GGC TGG        1966
1967  CTC CTG TCC CCA CCC TCG TGA AGC CGC AGG GCC GAG TGG CTC CTG GAA        2014
2015  GGC GCT CTC GGG CTG CCT CCG TCC TCA GCC TGG AAG CCG CAC CCC TCA        2062
2063  AGG CAG TCC AGA GAG AAA ACC AAA ACC ACA CCA ACA ACA ACA AAG CTT        2110
2111  ATT TTG CCT TTT TTT TTT TTA TTT GAG ATG GAG TTT CAC TCT TGT CGC        2158
2159  CCA GGC TAG AGT GCA ATG GCA TGT TCC TGG CTC ACT GAA ACC TCC ACC        2206
2207  TCT CAG GTT CAG GAG ATT CTC CTG TCT CAG CCC ACC TCT ACT AAA AAT        2254
2255  ACA GAA ATT AGC CGG GTG TGG TGG CAT GGG CCT GTA GTA CTG GCT ACT        2302
2303  TGG GAG GCT GAG GTG GGA GGA TCA CTT GAG CCT CGG AGC CGG AGG TTG        2350
2351  CAG TGA GCC GAG ATC GCG TCA CTG CAC TCG AGC CTG GGC AAC AAG AGA        2398
2399  AAC TCC GGC TAT AGA AAA AAA AAA AAA AAA AAA A                          2432
12.PP11517
A:核苷酸序列(SEQ ID NO:34)长度:2169个碱基
   1  GCCAGTGGGA GCAGGCGCCC CGGCCAGCGC AGACCTGGAG GCGCACGGGC GCCGCACCGC
  61  ACGATTCGGC TCGGGGTAGA GCGGAGCCGC AGCCCCACGC GCAGCCCAGG ACCCACTCGC
 121  CACCGCCGCT TCCTCAGCAC CCATGGGGAC CAGGAGACTT TAAAGGAGTT TGGGGTTTCG
 181  GGAGCAGGGA AATCACGGAT CCCCGCTCCT GGCCCTCGCC TCGCCACCTC ATTGATGGGC
 241  AACCAACTGG ACCGCATCAC CCACCTCAAC TACAGCGAGT TGCCCACAGG GGACCCGTCG
 301  GGGATTGAAA AGGACGAACT GCGGGTCGGG GTTGCCTACT TCTTCTCGGA TGATGAGGAA
 361  GACCTGGACG AACGCGGGCA GCCCGACAAG TTTGGCGTGA AGGCCCCCCC GGTTGCACCC
 421  CCTGCCCGGA GAGCCCCAGC CGCCACCACC ACCACCTGCT GCACCAGCTG GTCCTCAACG
 481  AGACTCAGTT TTCCGCCTTT CGGGGCCAGG AATGCATCTT TTCCAAAGTG AGCGGTGGCC
 541  CTCAGGGCGC CGACCTAAGC GTCTACGCGG TCACCGCGCT GCCAGCCGTC TGCGAACCCG
 601  GCGACCTGCT GGAGCTGCTG TGGCTGCAGC CCGCGCCGGA GCCGCCCGCG CCCGCCCCGC
 661  ACTGGGCCGT CTACGTGGGC GGCGGGCAGA TCATCCACCT GCACCAAGGC GAGATCCGCC
 721  AGACAAGCCG GATGAGGCGG GCGCGGCCAA CGTGGGCCGG GTGGTGAATA GCTGGTACCG
 781  CTACCGCCCG CTGGTGGCCG AGCTGGTGGT GCAGAACGCC TGCGGCCACC TGGGCCTCAA
 841  GAGCGAGGAG ATCTGCTGGA CGAACTCGGA GAGCTTCGCC GCCTGGTGCC GCTTTGGCAA
 901  GCGGGAGTTC AAGGCGGGAG GGGAGGTGCC GGCACGGCTA GCCCCCGCAG CAGCAGTACT
 961  ATCTCAAGGT GCACCTGGGA GAGAACAAGG TCCACACCGC CAGTTTCACA GCCTGGAAGA
1021  CCTCATCCGC GAGAAGCGCC TGTATCGACG CCAGCGGCCG CCTGCGAGTG CTCCAGGAGC
1081  TCGCCGACCT CGTGGACGAC AAGGAGTAGC CGCCTAGGGG CTGCCGGCCC CTCTGCCTCC
1141  CCCGCACCTC GCTCCCTTCC CTTCCCCGCA CCCGGACTTC GCAGTCAGCG GTTCTAAACC
1201  TCTGCCCCGC CCCGCCACGC GCGTCCGCCG CCGGTGGCCC GGGCCCGGGC TTGCACCCCC
1261  GCATCCCCAA GCCAGCGGCA GGGAAGTCTC AGGAACTGCC CCAGGCCGAA AGGCGCCGCT
1321  GCGAGCGCCT GGCTGACAGC CACAGCGGTG GTGACGGTGC TGGGAGACCC CGCGTGCGCT
1381  TTCCCCTTGA GATGTAAACC GGGAACGGGG AAGGGGCTGA GGGGAGAAAG GACATGGCCT
1441  TCCCCGCGAG TCCATGGCCA GTGACTGTGG CCCGACTCGA AAACAACCCT CTTCTCAAAA
1501  GGGACCATCA CCGCCCCGAG CGTGCGCACA CAGACCGGTC GGAGGCGAGA ACTGGTCTCT
1561  ACAGGGCACA GTTCAGCTCC TCTGTGGATG CGTCCCCAGA TCGCAGGATT TCCAAGAAAT
1621  CGAGCCTGTC CCTTGTGCAC TTGGGAATAA TTCCCCAAGA CAGCACTTCG GGATTCCGGG
1681  TTATCCTGAG GCTGCCCGGG ACTTTTCCAG CTCTCCAGCC CCAGGTCTCC TGACATTGTG
1741  TTCCAGGCTG CGGGCTAAGC CAGACAGTGT TTGCCTCCGG TTCTTTCCAC CGTGGGAAGC
1801  GAACGCCACC CCCACCCGCC TTTGCCTGCG AGTCTCCCTC GCTGGCAGAA GGGAAGCCGG
1861  CCCGGTCCCG GGAGGAAGAT GGCCGCTGCG AATTCGGTGA GGACAGCCGG CCCCGCCCCC
  1921  GACAAGGAGC TCGCTCGTTC ACCTGGTGTC TGGGAACTTG AATGTGTGAA GGGCGCTTAT
  1981  TGTTCTGAAC CCTTGATTGC TCCCTCCTCG GGCTGCATTT CAAAAATAGT CATATTTTTA
  2041  AAGGAGTTGG AGGAGAGGGA GGGGGAGGAC ATGGCACCAT TCCAGAAACC AGCATTGCTA
  2101  CAACACCATA GCCAGTATAT TTAGCTTTGG CTTTTCCTAA CATAGAAATC TTCAAAGCTG
  2161  GGGAAGTGG
B:核苷酸序列  (SEQ ID NO:35)长度:201个氨基酸

  1 MHLFQSERWP SGRRPKRLRG HRAASRLRTR RPAGAAVAAA RAGAARARPA LGRLRGRRAD

 61 HPPAPRRDPP DKPDEAGAAN VGRVVNSWYR YRPLVAELVV QNACGHLGLK SEEICWTNSE

121 SFAAWCRFGK REFKAGGEVP ARLAPAAAVL SQGAPGREQG PHRQFHSLED LIREKRLYRR

181 QRPPASAPGA RRPRGRQGVA A
C.核苷酸及氨基酸组合序列(SEQ ID NO:36)克隆号:PP11517
起始编码子:512 ATG 终止编码子:1115 TAG  蛋白质分子量:22212.07
   1    G CCA GTG GGA GCA GGC GCC CCG GCC AGC GCA GAC CTG GAG GCG CAC      46
  47  GGG CGC CGC ACC GCA CGA TTC GGC TCG GGG TAG AGC GGA GCC GCA GCC      94
  95  CCA CGC GCA GCC CAG GAC CCA CTC GCC ACC GCC GCT TCC TCA GCA CCC     142
 143  ATG GGG ACC AGG AGA CTT TAA AGG AGT TTG GGG TTT CGG GAG CAG GGA     190
 191  AAT CAC GGA TCC CCG CTC CTG GCC CTC GCC TCG CCA CCT CAT TGA TGG     238
 239  GCA ACC AAC TGG ACC GCA TCA CCC ACC TCA ACT ACA GCG AGT TGC CCA     286
 287  CAG GGG ACC CGT CGG GGA TTG AAA AGG ACG AAC TGC GGG TCG GGG TTG     334
 335  CCT ACT TCT TCT CGG ATG ATG AGG AAG ACC TGG ACG AAC GCG GGC AGC     382
 383  CCG ACA AGT TTG GCG TGA AGG CCC CCC CGG TTG CAC CCC CTG CCC GGA     430
 431  GAG CCC CAG CCG CCA CCA CCA CCA CCT GCT GCA CCA GCT GGT CCT CAA     478
 479  CGA GAC TCA GTT TTC CGC CTT TCG GGG CCA GGA ATG CAT CTT TTC CAA     526
   1                                              Met His Leu Phe Gln       5
 527  AGT GAG CGG TGG CCC TCA GGG CGC CGA CCT AAG CGT CTA CGC GGT CAC     574
   6  Ser Glu Arg Trp Pro Ser Gly Arg Arg Pro Lys Arg Leu Arg Gly His      21
 575  CGC GCT GCC AGC CGT CTG CGA ACC CGG CGA CCT GCT GGA GCT GCT GTG     622
  22  Arg Ala Ala Ser Arg Leu Arg Thr Arg Arg Pro Ala Gly Ala Ala Val      37
 623  GCT GCA GCC CGC GCC GGA GCC GCC CGC GCC CGC CCC GCA CTG GGC CGT     670
  38  Ala Ala Ala Arg Ala Gly Ala Ala Arg Ala Arg Pro Ala Leu Gly Arg      53
 671  CTA CGT GGG CGG CGG GCA GAT CAT CCA CCT GCA CCA AGG CGA GAT CCG     718
  54  Leu Arg Gly Arg Arg Ala Asp His Pro Pro Ala Pro Arg Arg Asp Pro      69
 719  CCA GAC AAG CCG GAT GAG GCG GGC GCG GCC AAC GTG GGC CGG GTG GTG     766
  70  Pro Asp Lys Pro Asp Glu Ala Gly Ala Ala Asn Val Gly Arg Val Val      85
 767  AAT AGC TGG TAC CGC TAC CGC CCG CTG GTG GCC GAG CTG GTG GTG CAG     814
  86  Asn Ser Trp Tyr Arg Tyr Arg Pro Leu Val Ala Glu Leu Val Val Gln     101
 815  AAC GCC TGC GGC CAC CTG GGC CTC AAG AGC GAG GAG ATC TGC TGG ACG     862
 102  Asn Ala Cys Gly His Leu Gly Leu Lys Ser Glu Glu Ile Cys Trp Thr     117
 863  AAC TCG GAG AGC TTC GCC GCC TGG TGC CGC TTT GGC AAG CGG GAG TTC     910
 118  Asn Ser Glu Ser Phe Ala Ala Trp Cys Arg Phe Gly Lys Arg Glu Phe     133
 911  AAG GCG GGA GGG GAG GTG CCG GCA CGG CTA GCC CCC GCA GCA GCA GTA     958
 134  Lys Ala Gly Gly Glu Val Pro Ala Arg Leu Ala Pro Ala Ala Ala Val     149
 959  CTA TCT CAA GGT GCA CCT GGG AGA GAA CAA GGT CCA CAC CGC CAG TTT    1006
 150  Leu Ser Gln Gly Ala Pro Gly Arg Glu Gln Gly Pro His Arg Gln Phe     165
1007  CAC AGC CTG GAA GAC CTC ATC CGC GAG AAG CGC CTG TAT CGA CGC CAG    1054
 166  His Ser Leu Glu Asp Leu Ile Arg Glu Lys Arg Leu Tyr Arg Arg Gln     181
1055  CGG CCG CCT GCG AGT GCT CCA GGA GCT CGC CGA CCT CGT GGA CGA CAA    1102
 182  Arg Pro Pro Ala Ser Ala Pro Gly Ala Arg Arg Pro Arg Gly Arg Gln     197
1103  GGA GTA GCC GCC TAG GGG CTG CCG GCC CCT CTG CCT CCC CCG CAC CTC    1150
 198  Gly Val Ala Ala ***                                                 202
1151  GCT CCC TTC CCT TCC CCG CAC CCG GAC TTC GCA GTC AGC GGT TCT AAA    1198
1199  CCT CTG CCC CGC CCC GCC ACG CGC GTC CGC CGC CGG TGG CCC GGG CCC    1246
1247  GGG CTT GCA CCC CCG CAT CCC CAA GCC AGC GGC AGG GAA GTC TCA GGA    1294
1295  ACT GCC CCA GGC CGA AAG GCG CCG CTG CGA GCG CCT GGC TGA CAG CCA    1342
1343  CAG CGG TGG TGA CGG TGC TGG GAG ACC CCG CGT GCG CTT TCC CCT TGA    1390
1391  GAT GTA AAC CGG GAA CGG GGA AGG GGC TGA GGG GAG AAA GGA CAT GGC    1438
1439  CTT CCC CGC GAG TCC ATG GCC AGT GAC TGT GGC CCG ACT CGA AAA CAA    1486
1487  CCC TCT TCT CAA AAG GGA CCA TCA CCG CCC CGA GCG TGC GCA CAC AGA    1534
1535  CCG GTC GGA GGC GAG AAC TGG TCT CTA CAG GGC ACA GTT CAG CTC CTC    1582
1583  TGT GGA TGC GTC CCC AGA TCG CAG GAT TTC CAA GAA ATC GAG CCT GTC    1630
1631  CCT TGT GCA CTT GGG AAT AAT TCC CCA AGA CAG CAC TTC GGG ATT CCG    1678
1679  GGT TAT CCT GAG GCT GCC CGG GAC TTT TCC AGC TCT CCA GCC CCA GGT    1726
1727  CTC CTG ACA TTG TGT TCC AGG CTG CGG GCT AAG CCA GAC AGT GTT TGC    1774
1775  CTC CGG TTC TTT CCA CCG TGG GAA GCG AAC GCC ACC CCC ACC CGC CTT    1822
1823  TGC CTG CGA GTC TCC CTC GCT GGC AGA AGG GAA GCC GGC CCG GTC CCG    1870
1871  GGA GGA AGA TGG CCG CTG CGA ATT CGG TGA GGA CAG CCG GCC CCG CCC    1918
1919  CCG ACA AGG AGC TCG CTC GTT CAC CTG GTG TCT GGG AAC TTG AAT GTG    1966
1967  TGA AGG GCG CTT ATT GTT CTG AAC CCT TGA TTG CTC CCT CCT CGG GCT    2014
2015  GCA TTT CAA AAA TAG TCA TAT TTT TAA AGG AGT TGG AGG AGA GGG AGG    2062
2063  GGG AGG ACA TGG CAC CAT TCC AGA AAC CAG CAT TGC TAC AAC ACC ATA    2110
2111  GCC AGT ATA TTT AGC TTT GGC TTT TCC TAA CAT AGA AAT CTT CAA AGC    2158
2159  TGG GGA AGT GG                                                     2169

具有促进3T3细胞转化功能的新的人蛋白及其编码序列.pdf_第1页
第1页 / 共41页
具有促进3T3细胞转化功能的新的人蛋白及其编码序列.pdf_第2页
第2页 / 共41页
具有促进3T3细胞转化功能的新的人蛋白及其编码序列.pdf_第3页
第3页 / 共41页
点击查看更多>>
资源描述

《具有促进3T3细胞转化功能的新的人蛋白及其编码序列.pdf》由会员分享,可在线阅读,更多相关《具有促进3T3细胞转化功能的新的人蛋白及其编码序列.pdf(41页珍藏版)》请在专利查询网上搜索。

本发明公开了一类新的具有促进3T3细胞转化功能的人蛋白,编码此多肽的多核苷酸和经重组技术产生该多肽的方法。本发明还公开了抗此多肽的拮抗剂及其治疗作用。本发明还公开了编码这类新的具有促进3T3细胞转化功能的人蛋白的多核苷酸的用途。。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 化学;冶金 > 有机化学〔2〕


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1