具体实施方式
3T3细胞是一种小鼠成纤维细胞(J.Cell.Biol.,17:299,1963)(也称为NIH/3T3细胞)。
在癌症研究领域中,常将外源基因(尤其是人基因)引入3T3细胞,观察其对3T3细胞生
长的影响情况。通常认为,对3T3细胞生长(或恶性转化)有影响的基因是癌症相关基因,
其中对3T3细胞生长或转化有抑制作用的基因大多是抑癌基因,而对3T3细胞生长或转
化有促进作用的基因大多是(原)癌基因。
本发明采用大规模cDNA克隆转染小鼠胚胎成纤维细胞3T3,在获得具有促进生长
作用的基础上,经测序证明为新的基因,进一步得到全长cDNA克隆。DNA转染试验证
明,本发明的具有促进3T3细胞转化功能的蛋白对3T3细胞具有促进克隆形成的作用,
其促进率≥50%。
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,
原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯
化的,但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离
纯化的。
如本文所用,“分离的具有促进3T3细胞转化功能的蛋白或多肽”是指具有促进3T3
细胞转化功能的蛋白多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。
本领域的技术人员能用标准的蛋白质纯化技术纯化具有促进3T3细胞转化功能的蛋白。
基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。
本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多
肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例
如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的
宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或
不包括起始的甲硫氨酸残基。
本发明还包括具有促进3T3细胞转化功能的人蛋白的片段、衍生物和类似物。如本
文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然具有促
进3T3细胞转化功能的人蛋白相同的生物学功能或活性的多肽。本发明的多肽片段、衍
生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残
基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或
(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物
(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基
酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序
列或蛋白原序列)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人
员公知的范围。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA
或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。以
PP2121蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区
序列可以与SEQID NO:3所示的编码区序列相同或者是简并的变异体。如本文所用,“简
并的变异体”对于PP2121而言是指编码具有SEQ ID NO:2的蛋白质,但与SEQ ID NO:3
所示的编码区序列有差别的核酸序列。再以PP7706蛋白(在本申请中,蛋白质的命名采
用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO:6所示的编码区序列
相同或者是简并的变异体。如本文所用,“简并的变异体”对于PP7706而言是指编码具
有SEQ ID NO:5的蛋白质,但与SEQ ID NO:6所示的编码区序列有差别的核酸序列。对
于本发明其他具有促进3T3细胞转化功能的蛋白,依此类推。
编码成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟多肽的编码序列
和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括
附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽
或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或
非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。
如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸
的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更
佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可
杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的
杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲
酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在
95%以上,更好是97%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQ ID
NO:2所示的成熟多肽(以PP2121蛋白为例)有相同的生物学功能和活性。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至
少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100
个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码具有促进
3T3细胞转化功能的蛋白的多聚核苷酸。
本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
本发明的DNA序列能用几种方法获得。例如,用本领域熟知的杂交技术分离DNA。
这些技术包括但不局限于:1)用探针与基因组或cDNA文库杂交以检出同源性核苷酸序
列,和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的DNA片段。
编码具有促进3T3细胞转化功能的蛋白的特异DNA片段序列产生也能用下列方法获
得:1)从基因组DNA分离双链DNA序列;2)化学合成DNA序列以获得所需多肽的双链
DNA。
当需要的多肽产物的整个氨基酸序列已知时,DNA序列的直接化学合成是经常选用
的方法。如果所需的氨基酸的整个序列不清楚时,DNA序列的直接化学合成是不可能的,
选用的方法是cDNA序列的分离。分离感兴趣的cDNA的标准方法是从高表达该基因的供
体细胞分离mRNA并进行逆转录,形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多
种成熟的技术,试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是通常的方
法(Sambrook,et al.,Molecular Cloning,A Laboratory Manual,Cold Spring Harbor
Laboratory.New York,1989)。还可得到商业供应的cDNA文库,如Clontech公司的
不同cDNA文库。当结合使用聚合酶反应技术时,即使极少的表达产物也能克隆。
可用常规方法从这些cDNA文库中筛选本发明的基因。这些方法包括(但不限于):
(1)DNA-DNA或DNA-RNA杂交;(2)标志基因的功能出现或丧失;(3)测定具有促进3T3细
胞转化功能的蛋白的转录本的水平;(4)通过免疫学技术或测定生物学活性,来检测基因
表达的蛋白产物。上述方法可单用,也可多种方法联合应用。
在第(1)种方法中,杂交所用的探针是与本发明的多核苷酸的任何一部分同源,其
长度至少15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少
100个核苷酸。此外,探针的长度通常在2kb之内,较佳地为1kb之内。此处所用的探针
通常是在本发明的基因DNA序列信息的基础上化学合成的DNA序列。本发明的基因本身
或者片段当然可以用作探针。DNA探针的标记可用放射性同位素,荧光素或酶(如碱性磷
酸酶)等。
在第(4)种方法中,检测具有促进3T3细胞转化功能的蛋白基因表达的蛋白产物可用
免疫学技术如Western印迹法,放射免疫沉淀法,酶联免疫吸附法(ELISA)等。
应用PCR技术扩增DNA/RNA的方法(Saiki,et al. Science 1985;230:1350-1354)
被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用
RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序
列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩
增的DNA/RNA片段。
如上所述得到的本发明的基因,或者各种DNA片段等的核苷酸序列的测定可用常规
方法如双脱氧链终止法(Sanger et al.PNAS,1977,74:5463-5467)。这类核苷酸
序列测定也可用商业测序试剂盒等。为了获得全长的cDNA序列,测序需反复进行。有时
需要测定多个克隆的cDNA序列,才能拼接成全长的cDNA序列。
本发明也涉及包含本发明多核苷酸的载体,以及用本发明的载体或具有促进3T3细
胞转化功能的蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所
述多肽的方法。
通过常规的重组DNA技术(Science,1984;224:1431),可利用本发明的多聚核
苷酸序列可用来表达或生产重组的具有促进3T3细胞转化功能的蛋白多肽。一般来说有
以下步骤:
(1).用本发明的编码具有促进3T3细胞转化功能的人蛋白的多核苷酸(或变异体),
或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;
(2).在合适的培养基中培养的宿主细胞;
(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,具有促进3T3细胞转化功能的人蛋白多核苷酸序列可插入到重组表达载
体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞
病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。在本发明中适用的载体包
括但不限于:在细菌中表达的基于T7的表达载体(Rosenberg,et al.Gene,1987,
56:125);在哺乳动物细胞中表达的pMSXND表达载体(Lee and Nathans,J Bio Chem.
263:3521,1988)和在昆虫细胞中表达的来源于杆状病毒的载体。总之,只要能在宿主体
内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起
点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含具有促进3T3细胞转化功能的人蛋白编
码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、
DNA合成技术、体内重组技术等(Sambroook,et al)。所述的DNA序列可有效连接到表达
载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的1ac
或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、早期和晚期
SV40启动子和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。
表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿
主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋
白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当
的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高
等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌
的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS或
Bowes黑素瘤细胞的动物细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会
使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用
于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱
基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核
生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,
所用的步骤在本领域众所周知。可供选择的是用MgCl2。如果需要,转化也可用电穿孔的
方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机
械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的
宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下
进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)
诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可包被于细胞内、细胞外或在细胞膜上表达或分泌到细
胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重
组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常
规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分
子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相
层析技术及这些方法的结合。
重组的具有促进3T3细胞转化功能的人蛋白或多肽有多方面的用途。这些用途包括
(但不限于):直接做为药物治疗具有促进3T3细胞转化功能的蛋白功能低下或丧失所致
的疾病,和用于筛选促进或对抗具有促进3T3细胞转化功能的蛋白功能的抗体、多肽或
其它配体。例如,该抗体可用于治疗癌症或细胞异常增殖。用重组表达的本发明蛋白筛
选多肽库可用于寻找有治疗价值的能抑制或刺激具有促进3T3细胞转化功能的人蛋白功
能的多肽分子。
本发明也提供了筛选药物以鉴定提高(激动剂)或阻遏(拮抗剂)具有促进3T3细胞转
化功能的人蛋白的药剂的方法。激动剂提高具有促进3T3细胞转化功能的人蛋白刺激细
胞增殖等生物功能,而拮抗剂阻止和治疗与细胞过度增殖有关的紊乱如各种癌症。
具有促进3T3细胞转化功能的人蛋白的拮抗剂包括筛选出的抗体、化合物、受体缺
失物和类似物等。具有促进3T3细胞转化功能的人蛋白的拮抗剂可以与具有促进3T3细
胞转化功能的人蛋白结合并消除其功能,或是抑制具有促进3T3细胞转化功能的人蛋白
的产生,或是与多肽的活性位点结合使多肽不能发挥生物学功能。具有促进3T3细胞转
化功能的人蛋白的拮抗剂可用于治疗用途。
在筛选作为拮抗剂的化合物时,可以将具有促进3T3细胞转化功能的蛋白加入生物
分析测定中,通过测定化合物影响具有促进3T3细胞转化功能的蛋白和其受体之间的相
互作用来确定化合物是否是拮抗剂。用上述筛选化合物的同样方法,可以筛选出起拮抗
剂作用的受体缺失物和类似物。
本发明蛋白的拮抗剂可直接用于疾病治疗,例如,各种恶性肿瘤、和细胞异常增殖
等。
本发明的多肽,及其片段、衍生物、类似物或它们的细胞可以用来作为抗原以生产
抗体。这些抗体可以是多克隆或单克隆抗体。多克隆抗体可以通过将此多肽直接注射动
物的方法得到。制备单克隆抗体的技术包括杂交瘤技术,三瘤技术,人B-细胞杂交瘤技
术,EBV-杂交瘤技术等。
可以将本发明的多肽和拮抗剂与合适的药物载体组合后使用。这些载体可以是水、
葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或
拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。
本发明还提供含有一种或多种容器的药盒或试剂盒,容器中装有一种或多种本发明
的药用组合物成分。与这些容器一起,可以有由制造、使用或销售药品或生物制品的政
府管理机构所给出的指示性提示,该提示反映出生产、使用或销售的政府管理机构许可
其在人体上施用。此外,本发明的多肽可以与其它的治疗化合物结合使用。
药物组合物可以以方便的方式给药,如通过局部、静脉内、腹膜内、肌内、皮下、
鼻内或皮内的给药途径。具有促进3T3细胞转化功能的蛋白或其特异性抗体,可按有效
地治疗和/或预防具体的适应症的量来给药。施用于患者的具有促进3T3细胞转化功能的
蛋白的量和剂量范围将取决于许多因素,如给药方式、待治疗者的健康条件和诊断医生
的判断。
具有促进3T3细胞转化功能的人蛋白的多聚核苷酸也可用于多种治疗目的。基因治
疗技术可用于治疗由于具有促进3T3细胞转化功能的蛋白的无表达或异常/无活性的具有
促进3T3细胞转化功能的蛋白的表达所致的细胞发育或代谢异常。重组的基因治疗载体
(如病毒载体)可设计成表达变异的具有促进3T3细胞转化功能的蛋白,以抑制内源性的
具有促进3T3细胞转化功能的蛋白活性。例如,一种变异的具有促进3T3细胞转化功能
的蛋白可以是缩短的、缺失了信号传导功能域的具有促进3T3细胞转化功能的蛋白,虽
可与下游的底物结合,但缺乏信号传导活性。因此重组的基因治疗载体可用于治疗具有
促进3T3细胞转化功能的蛋白表达或活性异常所致的疾病。来源于病毒的表达载体如逆
转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将具有促进3T3
细胞转化功能的蛋白基因转移至细胞内。构建携带具有促进3T3细胞转化功能的蛋白基
因的重组病毒载体的方法可见于已有文献(Sambrook,et al.)。另外重组具有促进3T3细
胞转化功能的人蛋白基因可包装到脂质体中转移至细胞内。
抑制具有促进3T3细胞转化功能的人蛋白mRNA的寡聚核苷酸(包括反义RNA和DNA)
以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子,
其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和
DNA及核酶可用已有的任何RNA或DNA合成技术获得,如固相磷酸酰胺化学合成法合成寡
核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转
录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的
稳定性,可用多种方法对其进行修饰,如增加两侧的序列长度,核糖核苷之间的连接应
用磷酸硫酯键或肽键而非磷酸二酯键。
多聚核苷酸导入组织或细胞内的方法包括:将多聚核苷酸直接注入到体内组织中;
或在体外通过载体(如病毒、噬菌体或质粒等)先将多聚核苷酸导入细胞中,再将细胞移
植到体内等。由于本发明蛋白具有促进3T3细胞转化的功能,因此本发明蛋白编码序列
的反义序列,可被引入细胞以抑制细胞的异常增殖(如癌变)。
本发明还提供了针对具有促进3T3细胞转化功能的人蛋白抗原决定簇的抗体。这些
抗体包括(但不限于):多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab
表达文库产生的片段。
抗具有促进3T3细胞转化功能的人蛋白的抗体可用于免疫组织化学技术中,检测活
检标本中的具有促进3T3细胞转化功能的人蛋白。
与具有促进3T3细胞转化功能的人蛋白结合的单克隆抗体也可用放射性同位素标
记,注入体内可跟踪其位置和分布。这种放射性标记的抗体可作为一种非创伤性诊断方
法用于肿瘤细胞的定位和判断是否有转移。
本发明中的抗体可用于治疗或预防与具有促进3T3细胞转化功能的人蛋白相关的疾
病。给予适当剂量的抗体可以阻断具有促进3T3细胞转化功能的人蛋白的产生或活性,
从而抑制癌细胞的生长和/或细胞的异常增殖。
抗体也可用于设计针对体内某一特殊部位的免疫毒素。如具有促进3T3细胞转化功
能的人蛋白高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素,蓖麻蛋白,红豆碱
等)共价结合。一种通常的方法是用巯基交联剂如SPDP,攻击抗体的氨基,通过二硫键
的交换,将毒素结合于抗体上,这种杂交抗体可用于杀灭有关的阳性细胞(如癌细胞)。
多克隆抗体的生产可用具有促进3T3细胞转化功能的人蛋白或多肽免疫动物,如家
兔,小鼠,大鼠等。多种佐剂可用于增强免疫反应,包括但不限于弗氏佐剂等。
具有促进3T3细胞转化功能的人蛋白单克隆抗体可用杂交瘤技术生产(Kohler and
Milstein.Nature,1975,256:495-497)。将人恒定区和非人源的可变区结合的嵌合抗体
可用已有的技术生产(Morrison et al,PNAS,1985,81:6851)。而已有的生产单链抗体的
技术(U.S.Pat No.4946778)也可用于生产抗具有促进3T3细胞转化功能的人蛋白的单链
抗体。
能与具有促进3T3细胞转化功能的人蛋白结合的多肽分子可通过筛选由各种可能组
合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时,必须对具有促进3T3细胞
转化功能的人蛋白分子进行标记。
本发明还涉及定量和定位检测具有促进3T3细胞转化功能的人蛋白水平的诊断试验
方法。这些试验为本领域所熟知,且包括FISH测定和放射免疫测定。试验中所检测的具
有促进3T3细胞转化功能的蛋白水平,可以用作解释具有促进3T3细胞转化功能的蛋白
在各种疾病中的重要性和用于诊断具有促进3T3细胞转化功能的蛋白起作用的疾病。
具有促进3T3细胞转化功能的蛋白的多聚核苷酸可用于具有促进3T3细胞转化功能
的蛋白相关疾病的诊断和治疗。在诊断方面,具有促进3T3细胞转化功能的蛋白的多聚
核苷酸可用于检测具有促进3T3细胞转化功能的蛋白的表达与否或在疾病状态下具有促
进3T3细胞转化功能的蛋白的异常表达。如具有促进3T3细胞转化功能的蛋白DNA序列
可用于对活检标本的杂交以判断具有促进3T3细胞转化功能的蛋白的表达异常。杂交技
术包括Southern印迹法,Northern印迹法、原位杂交等。这些技术方法都是公开的成熟
技术,相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探
针固定在微阵列(Microarray)或DNA芯片(即基因芯片)上,用于分析组织中基因的差异
表达分析和基因诊断。用具有促进3T3细胞转化功能的蛋白特异的引物进行RNA-聚合酶
链反应(RT-PCR)体外扩增也可检测具有促进3T3细胞转化功能的蛋白的转录产物。
检测具有促进3T3细胞转化功能的蛋白基因的突变也可用于诊断具有促进3T3细胞
转化功能的蛋白相关的疾病。具有促进3T3细胞转化功能的蛋白突变的形式包括与正常
野生型具有促进3T3细胞转化功能的蛋白DNA序列相比的点突变、易位、缺失、重组和
其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交
检测突变。另外,突变有可能影响蛋白的表达,因此用Northern印迹法、Western印迹
法可间接判断基因有无突变。
本发明的序列对染色体鉴定也是有价值的。这些序列会特异性地针对某条人染色体
具体位置且并可以与其杂交。目前,需要鉴定染色体上的各基因的具体位点。然而现在
只有很少的基于实际序列数据(重复多态性)的染色体标记物可用于标记染色体位置。为
了将这些序列与疾病相关基因相关联。第一步就是将本发明DNA序列定位于染色体上。
简而言之,根据cDNA制备PCR引物(优选15-35bp),可以将序列定位于染色体上。
然后,将这些引物用于PCR筛选含各条人染色体的体细胞杂合细胞。只有那些含有相应
于引物的人基因的杂合细胞会产生扩增的片段。
体细胞杂合细胞的PCR定位法,是将DNA定位到具体染色体的快捷方法。使用本发
明的的寡核苷酸引物,通过类似方法,可利用一组来自特定染色体的片段或大量基因组
克隆而实现亚定位。可用于染色体定位的其它类似策略包括原位杂交、用标记的流式分
选的染色体预筛选和杂交预选,从而构建染色体特异的cDNA库。
将cDNA克隆与中期染色体进行荧光原位杂交(FISH),可以在一个步骤中精确地进
行染色体定位。此技术的综述,参见Verma等,Human Chromosomes:a Manual of Basic
Techniques,Pergamon Press,New York(1988)。
一旦序列被定位到准确的染色体位置,此序列在染色体上的物理位置就可以与基因
图数据相关联。这些数据可见于例如,V.Mckusick,Mendelian Inheritance in Man(可通过
与Johns Hopkins University Welch Medical Library联机获得)。然后可通过连锁分析,确
定基因与业已定位到染色体区域上的疾病之间的关系。
接着,需要测定患病和未患病个体间的cDNA或基因组序列差异。如果在一些或所
有的患病个体中观察到某突变,而该突变在任何正常个体中未观察到,则该突变可能是
疾病的病因。比较患病和未患病个体,通常涉及首先寻找染色体中结构的变化,如从染
色体水平可见的或用基于cDNA序列的PCR可检测的缺失或易位。
本发明的具有促进3T3细胞转化功能的蛋白核苷酸全长序列或其片段通常可以用
PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有
关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术
人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常
常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其
克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通
过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来编码本发明蛋白(或其片段,或其衍生物)的DNA
序列。然后可将该DNA序列引入本领域中的各种DNA分子(如载体)和细胞中。此外,还
可通过化学合成将突变引入本发明蛋白序列中。
此外,由于本发明的具有促进3T3细胞转化功能的蛋白具有源自人的天然氨基酸序
列,因此,与来源于其他物种的同族蛋白相比,预计在施用于人时将具有更高的活性和/
或更低的副作用(例如在人体内的免疫原性更低或没有)。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明
而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规
条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory
Press,1989)中所述的条件,或按照制造厂商所建议的条件。注意,在核苷酸和氨基酸组
合序列中,(1)给出的是起始和终止编码子第一个核苷酸的位置,(2)分子量单位是道尔顿。
实施例1:cDNA基因的获得及对小鼠NIH/3T3细胞克隆形成的促进作用
PP2121、PP7706、PP10484、PP10566、PP10631、PP10752、PP10881、
PP10897、PP10933、PP11246、PP11347和PP11517是通过用常规方法构建人胎盘
cDNA文库获得的。取3、6、9月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按
厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用pCMV-script
TMXR cDNA文库构建试剂盒(Stratagene公司)构建上述mRNA的cDNA文库。其中反转录
酶改用MMLV-RT-Superscript II(GIBCO BRL),反转录反应在42℃进行。转化XL 10-
Gold感受细胞,获得了1×106cfu/μg滴度的cDNA文库。第一轮随机挑取cDNA克隆,
其后以高丰度cDNA克隆和已证明有抑癌细胞生长功能的cDNA克隆为探针,杂交筛选
cDNA文库,挑取弱阳性及阴性克隆。用Qiagen 96孔板质粒抽提试剂盒,按厂家说明
书进行质粒DNA的提取。质粒DNA和空载体同时转染小鼠NIH/3T3细胞。100ng DNA酒
精沉淀干燥后,加6μl H2O溶解,待转染。每份DNA样品中加0.74μl脂质体及9.3μl
无血清培液,混匀后,室温放置10分钟。每管中加150μl无血清培液,均分加入3孔
生长于96孔板的小鼠NIH/3T3细胞中,37℃放置2小时,每孔再加50μl无血清培液,
37℃24小时。每孔换100μl全培液,37℃24小时,换含G418的全培液100μl,37
℃24-48小时,边观察,边换G418浓度不等的培液。约2-3次后,直到镜检细胞有克
隆形成,计数。发现上述克隆有促进细胞克隆形成作用,结果如下表所示。
cDNA克隆转染细胞(3T3)克隆形成情况
cDNA克隆名称
cDNA克隆数(三个重复)
空载体克隆数(三个重复)
PP2121
70
76
69
13
12
15
PP7706
28
25
20
13
12
15
PP10484
17
31
34
13
12
15
PP10566
29
32
27
13
12
15
PP10631
27
29
22
13
12
15
PP10752
27
24
21
13
12
15
PP10881
30
25
20
13
12
15
PP10897
43
42
45
13
12
15
PP10933
37
35
30
13
12
15
PP11246
38
40
38
13
12
15
PP11347
47
48
46
13
12
15
PP11517
35
39
38
13
12
15
对cDNA克隆采用双脱氧终止法,在ABI377 DNA自动测序仪上测定其一端近500bp
的核苷酸序列。分析后,确定为新基因克隆,进行另一端测序,仍未获得全长cDNA序
列,设计引物,再次进行测序,直到获得全长序列(SEQ ID NO:1、4、7、10、13、
16、19、22、25、28、31、34)。
实施例2:从胎盘cDNA中PCR获得全长基因和重组蛋白表达
取3、6、9月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提
取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用MMLV-RT-Superscript
II(GIBCO BRL),反转录酶在42℃进行反转录反应,获得胎盘cDNA。利用各个基因的
特异引物(如下表所示),按97℃3’1个循环。94℃30″60℃30″72℃1’35
个循环,72℃10’1个循环进行PCR扩增,获得含有完整开放阅读框序列的各蛋白基
因的扩增产物。扩增产物经测序验证,与实施例1测得的序列相符,随后用常规技术将
扩增产物转入宿主细胞,获得重组蛋白(SEQ ID NO:2、5、8、11、14、17、20、
23、26、29、32、35)。
基因特异引物
克隆名称
特异引物1(5’→3’)
特异引物2(5’→3’)
PP2121
(193)CAAGGTGGGCAAGTTCGT
TGGGAGGTGGAGAAGATTTGG(2181)
PP7706
(67)AATGGATGACCCTCCAATAT
GTGTCCTTCGACGGAACA(2744)
PP10484
(478)ATTTGGTTGGACCTTGCG
TCCCTTGACTTCTGAGTTCC(1501)
PP10566
(40)AGCTACCACTCAGCACCATG
TCTCCTAGACCTGACCGACC(2418)
PP10631
(15)GGACGAAGCCGGAGTGTA
AAGACGGAAGGAGAACCC(1783)
PP10752
(148)TGACCCAGTTGTGGTTGATG
TGCAGGAGGTGGCCTTTC(1179)
PP10881
(765)ATTCTTTGAAATTAGGGTGC
GTGTCGCTCTGAGGGAGA(2077)
PP10897
(308)TAGTGGCCTAGCTGGGTA
CCTCTTAGCGAACTTGGG(2261)
PP10933
(371)GTAGTCTGGGTTGGAGGAGG
CCGATGCGTACAGGAGCT(1470)
PP11246
(109)GGGGACATGGGCATTTGG
CTAGCACGGTGACATGAGGT(2011)
PP11347
(733)GGGTGAGGTAAGCAACGC
ATGACCGATGAACCCTCCG(2310)
PP11517
(240)CAACCAACTGGACCGCATCA
AACTAACGAGGGAGGAGCC(2011)
实施例3:cDNA克隆序列分析
1.PP2121
A:核苷酸序列(SEQ ID NO:1)长度:2244个碱基
1 CTTGGGGACC CAGGGCCGGC TGAGCCGCAC GCTGCCAGCC AGCGCGGAGG AGCGCGATCG
61 GCTGCTGCGC CGCATGGAGA GCATGCGCAA GGAGAAGCGC GTGTACAGCC GCTTCGAGGT
121 CTTCTGCAAG AAAGAGGAGG CCAGCAGCCC TGGGGCAGGG GAAGGCCCCG CGGAGGAGGG
181 CACCAGGGAC AGCAAGGTGG GCAAGTTCGT GCCCAAGATC CTGGGCACGT TCAAAAGCAA
241 GAAGTGAGTC TTCTGGCCTG GCAACCCAGG CCAGGGTGCC CGCATCGCTG CCCCGGTCAT
301 CCAGAAGCCC CGCGGAACAG AGAGCCCTGC TCATGTGCTT GAGCAGCGGC TGTCAGGCCA
361 CGGCCGCTTG GGGCTTGGCT GAGTGCGCCA GACCTCGGCT CCACTGGAGG CTCACCTGGC
421 AGCTGCCGTC TCTGCCCCCT GGCCTCCCCA ACGCTGGGGC TGCACCCCTC GCCACCAGTG
481 CCTTTCTCCC CTCAGCACCT TCATCTCTGC ACCGTCAGCC TTGCGTGGCG CAGCGTCTGG
541 CTCCGCCATC TCTTTGTGCC TCAGTCCCCC CGGCCCCCTT TATTTTTTTG AGACCTAGGG
601 CTGGAGTGCA GTTGAGCGGT CTGGGCTCAC TGCAACCTCT GCCTCCCGGG TTCCAGCGAT
661 TCTCCTGCCT CAGCCTCCTG AGTAGCTGGG ATTACAGATG TATGCTACCA CGCCCAGGTA
721 GTTTTTGTAT TTTTAGTAGA GACAGGGTTT CACTATGTTG GCCAGGCTGG TCTCCAACTC
781 CTGGCCTCAA ATGATCAGCC CGCTTCAGCC TCCCAAAGTG GGGGGATTAC AGGCGTGAGC
841 CTTGCACCCC GCTAAGTCCC CTATCCTCTT GCAAGGGTCT CGCCTCTGTG CCTCAATTCC
901 TCATTCTCTG GGCCCTTCTC CTCCTCAGGG CCTCCTGTTC TCAGGGCCTC CCCCCTCCCC
961 GCTCCCTCCC TCTCTCAAGG TCTCCTCCTT CCCTCCCCCC CCCGTCTCCC CCCTCCCCCG
1021 CCTGGGCTTC ACTTCCTTTC CTACTTGGAT TCTCCTGCTC GCTGCCTCCC AGCATCTTTT
1081 TTGGAGGCCC GTCTCTTGCT GTGGGGAAGA CTGGGCTGGC TGCGGGCAGT TTGCAAGGGG
1141 TGGGTGGGGC GGGGGGGGGA GCTGGACCAG AAGATGCCCC TTGGAGTGGC AAGGAAGCTG
1201 GACAGGGCAG GCCTCTGGGG ACGGGACACA GGGAAGCCCG AAGGGGCGCC TTGGCCAGGT
1261 CTGCCATCTC CTCCAGCGAG GCTCTGGCCA GCACTGGGTG AGAGTGGGGA GGGGGCACTG
1321 GCCTTTGCAG CACAGTAAAA CATGGTCCAG ACAACCTGTG GCCCCGGCCT CATGAGCACC
1381 CCCTGCACAG GCCCGGCCCA AGCCAGGCGC TAGAAGGGCT GGTTGTGGAG TGCTTATCCT
1441 TGACAGGTAT GGGGCCAGGT GAGGGCAGGG GACAAGGTGC AGCTGAGGCC GAGCCCAACT
1501 AGGTCCTGGG CACCCCTGCA GGTGGGAGTG GTCCTTGTCC TCCTGGTATC CAGCAGACAC
1561 CCCCCTCTCC CCACCAGCCC CATTCTCAGG TCCTTTCCTC TTTGTCACCA ACACCAAGAA
1621 TCTGTCCAGG GTTCTTGGCT TATCTTTTAT CTCTTTTCAC TCCTAGAGAG GAATTGCAAT
1681 TGACTCAGAA TGACACATTT TTGGCACCAC GTGTGTAGAA AGCCCCCACT GTTAGATGAT
1741 AGCCTCGTGA AATTCATGTT TCTGTATTCT CCTATTTCTT TTCAAAAACT AATTTTTTTT
1801 TTAGTGTAAT AAATCCTAAG AGGGAACTGA TTTAAGAAAC AAGGCCGCCA AACAAAGGCA
1861 GCAGTTCCGA CTCCAGCAGC TGGGAAAGGA AGGAAAGTGA CCCCACTTTC ACTCCTGCAC
1921 AGCCCACTGG TTACCAAAAC CACCGTGCAA GTCGGGATGA CAGCAGGGAC TTCTGGCCAG
1981 GTGGGAAAAG GTGCCTGGAA GCGGGATGCG CCTGTGCGTC TCTTGGCCAT GATGTTCTTG
2041 TGGGCATGTT ATTCTTGGTG CTGCCTGGGG TGTTGCTGAG CGGACAGGCT CTCCAGCTGG
2101 AGTCCATGGA GAGGCCAGAG GCTGGCGGCC CTGCCTGGGC CTTCGGAGCC TCCTGCCTGC
2161 ACCCTCCACC TCTTCTAAAC CATGATGTGG CACATTTTGG TGTTAATAAA ACACAACACA
2221 CAAAGTAAAA AAAAAAAAAA AAAA
B:核苷酸序列(SEQ ID NO:2)长度:153个氨基酸
1 MCLSSGCQAT AAWGLAECAR PRLHWRLTWQ LPSLPPGLPN AGAAPLATSA FLPSAPSSLH
61 RQPCVAQRLA PPSLCASVPP APFIFLRPRA GVQLSGLGSL QPLPPGFQRF SCLSLLSSWD
121 YRCMLPRPGS FCIFSRDRVS LCWPGWSPTP GLK
C.核苷酸及氨基酸组合序列(SEQ ID NO:3)克隆号:PP2121
起始编码子:333 ATG 终止编码子:792 TGA 蛋白质分子量:16448.31
(注:(1)给出的是起始和终止编码子第一个核苷酸的位置,(2)分子量单位是道尔顿)
1 CT TGG GGA CCC AGG GCC GGC TGA GCC GCA CGC TGC CAG CCA GCG CGG 47
48 AGG AGC GCG ATC GGC TGC TGC GCC GCA TGG AGA GCA TGC GCA AGG AGA 95
96 AGC GCG TGT ACA GCC GCT TCG AGG TCT TCT GCA AGA AAG AGG AGG CCA 143
144 GCA GCC CTG GGG CAG GGG AAG GCC CCG CGG AGG AGG GCA CCA GGG ACA 191
192 GCA AGG TGG GCA AGT TCG TGC CCA AGA TCC TGG GCA CGT TCA AAA GCA 239
240 AGA AGT GAG TCT TCT GGC CTG GCA ACC CAG GCC AGG GTG CCC GCA TCG 287
288 CTG CCC CGG TCA TCC AGA AGC CCC GCG GAA CAG AGA GCC CTG CTC ATG 335
1 Met 1
336 TGC TTG AGC AGC GGC TGT CAG GCC ACG GCC GCT TGG GGC TTG GCT GAG 383
2 Cys Leu Ser Ser Gly Cys Gln Ala Thr Ala Ala Trp Gly Leu Ala Glu 17
384 TGC GCC AGA CCT CGG CTC CAC TGG AGG CTC ACC TGG CAG CTG CCG TCT 431
18 Cys Ala Arg Pro Arg Leu His Trp Arg Leu Thr Trp Gln Leu Pro Ser 33
432 CTG CCC CCT GGC CTC CCC AAC GCT GGG GCT GCA CCC CTC GCC ACC AGT 479
34 Leu Pro Pro Gly Leu Pro Asn Ala Gly Ala Ala Pro Leu Ala Thr Ser 49
480 GCC TTT CTC CCC TCA GCA CCT TCA TCT CTG CAC CGT CAG CCT TGC GTG 527
50 Ala Phe Leu Pro Ser Ala Pro Ser Ser Leu His Arg Gln Pro Cys Val 65
528 GCG CAG CGT CTG GCT CCG CCA TCT CTT TGT GCC TCA GTC CCC CCG GCC 575
66 Ala Gln Arg Leu Ala Pro Pro Ser Leu Cys Ala Ser Val Pro Pro Ala 81
576 CCC TTT ATT TTT TTG AGA CCT AGG GCT GGA GTG CAG TTG AGC GGT CTG 623
82 Pro Phe Ile Phe Leu Arg Pro Arg Ala Gly Val Gln Leu Ser Gly Leu 97
624 GGC TCA CTG CAA CCT CTG CCT CCC GGG TTC CAG CGA TTC TCC TGC CTC 671
98 Gly Ser Leu Gln Pro Leu Pro Pro Gly Phe Gln Arg Phe Ser Cys Leu 113
672 AGC CTC CTG AGT AGC TGG GAT TAC AGA TGT ATG CTA CCA CGC CCA GGT 719
114 Ser Leu Leu Ser Ser Trp Asp Tyr Arg Cys Met Leu Pro Arg Pro Gly 129
720 AGT TTT TGT ATT TTT AGT AGA GAC AGG GTT TCA CTA TGT TGG CCA GGC 767
130 Ser Phe Cys Ile Phe Ser Arg Asp Arg Val Ser Leu Cys Trp Pro Gly 145
768 TGG TCT CCA ACT CCT GGC CTC AAA TGA TCA GCC CGC TTC AGC CTC CCA 815
146 Trp Ser Pro Thr Pro Gly Leu Lys *** 154
816 AAG TGG GGG GAT TAC AGG CGT GAG CCT TGC ACC CCG CTA AGT CCC CTA 863
864 TCC TCT TGC AAG GGT CTC GCC TCT GTG CCT CAA TTC CTC ATT CTC TGG 911
912 GCC CTT CTC CTC CTC AGG GCC TCC TGT TCT CAG GGC CTC CCC CCT CCC 959
960 CGC TCC CTC CCT CTC TCA AGG TCT CCT CCT TCC CTC CCC CCC CCG TCT 1007
1008 CCC CCC TCC CCC GCC TGG GCT TCA CTT CCT TTC CTA CTT GGA TTC TCC 1055
1056 TGC TCG CTG CCT CCC AGC ATC TTT TTT GGA GGC CCG TCT CTT GCT GTG 1103
1104 GGG AAG ACT GGG CTG GCT GCG GGC AGT TTG CAA GGG GTG GGT GGG GCG 1151
1152 GGG GGG GGA GCT GGA CCA GAA GAT GCC CCT TGG AGT GGC AAG GAA GCT 1199
1200 GGA CAG GGC AGG CCT CTG GGG ACG GGA CAC AGG GAA GCC CGA AGG GGC 1247
1248 GCC TTG GCC AGG TCT GCC ATC TCC TCC AGC GAG GCT CTG GCC AGC ACT 1295
1296 GGG TGA GAG TGG GGA GGG GGC ACT GGC CTT TGC AGC ACA GTA AAA CAT 1343
1344 GGT CCA GAC AAC CTG TGG CCC CGG CCT CAT GAG CAC CCC CTG CAC AGG 1391
1392 CCC GGC CCA AGC CAG GCG CTA GAA GGG CTG GTT GTG GAG TGC TTA TCC 1439
1440 TTG ACA GGT ATG GGG CCA GGT GAG GGC AGG GGA CAA GGT GCA GCT GAG 1487
1488 GCC GAG CCC AAC TAG GTC CTG GGC ACC CCT GCA GGT GGG AGT GGT CCT 1535
1536 TGT CCT CCT GGT ATC CAG CAG ACA CCC CCC TCT CCC CAC CAG CCC CAT 1583
1584 TCT CAG GTC CTT TCC TCT TTG TCA CCA ACA CCA AGA ATC TGT CCA GGG 1631
1632 TTC TTG GCT TAT CTT TTA TCT CTT TTC ACT CCT AGA GAG GAA TTG CAA 1679
1680 TTG ACT CAG AAT GAC ACA TTT TTG GCA CCA CGT GTG TAG AAA GCC CCC 1727
1728 ACT GTT AGA TGA TAG CCT CGT GAA ATT CAT GTT TCT GTA TTC TCC TAT 1775
1776 TTC TTT TCA AAA ACT AAT TTT TTT TTT AGT GTA ATA AAT CCT AAG AGG 1823
1824 GAA CTG ATT TAA GAA ACA AGG CCG CCA AAC AAA GGC AGC AGT TCC GAC 1871
1872 TCC AGC AGC TGG GAA AGG AAG GAA AGT GAC CCC ACT TTC ACT CCT GCA 1919
1920 CAG CCC ACT GGT TAC CAA AAC CAC CGT GCA AGT CGG GAT GAC AGC AGG 1967
1968 GAC TTC TGG CCA GGT GGG AAA AGG TGC CTG GAA GCG GGA TGC GCC TGT 2015
2016 GCG TCT CTT GGC CAT GAT GTT CTT GTG GGC ATG TTA TTC TTG GTG CTG 2063
2064 CCT GGG GTG TTG CTG AGC GGA CAG GCT CTC CAG CTG GAG TCC ATG GAG 2111
2112 AGG CCA GAG GCT GGC GGC CCT GCC TGG GCC TTC GGA GCC TCC TGC CTG 2159
2160 CAC CCT CCA CCT CTT CTA AAC CAT GAT GTG GCA CAT TTT GGT GTT AAT 2207
2208 AAA ACA CAA CAC ACA AAG TAA AAA AAA AAA AAA AAA A 2244
2.PP7706
A:核苷酸序列(SEQ ID NO:4)长度:2929个碱基
1 GGAGAGAGAG AGCACTAGTC TCGCGTTTTT TTTTTTTTTT TTTGACAACT TGCTCTTTTA
61 ATGTGGAATG GATGACCCTC CAATATTTCC CCAGAGCACC CCATGCTCTT CTATCAGGGA
121 ACTTATTAAA ATCATGTAAC ATGTTTCTTG GTGACAAGAT TTAGGTCTTT TGTTTCTGTA
181 ACACATGCCA GATACTTAGC CCGGTATCTG GCATGTGGCA TGCCCAGTAA ATGTTTGCTG
241 AATAAGTGAA TCTATGTCTC TTGCTTGCCG CTATTTGCCC ACTGAATCCA TGAAGTGAGT
301 TTTCATAATG ATTACCACTG AAAATTCAAC CCTGAAAAGA ATGTCTTCGG TTGTGGGCCC
361 ATAAAGTCTT AGAAATAGTG AAGCTCCTAC TGTCAGTCCT TGAAAGGGAA CAGGACAGCT
421 GCTGTATGCC TTGAGAATGG GCAAAAGACA AGCGACAAAA AGAGCAGCGA AGGCACCTAC
481 TTGTCCCTCT GGGCCAGGGC CTCAGTGTAT TGGTCGGGCT TGACCTGGTC TCCTGGTACA
541 TCTTCCCAGT TTTTGGTGAC TCCCTTCAGT TTCTCTGAGA GCTCCAGGTT ACACTCCTTC
601 TCTGCTTCCA CCAGAGCTGC CATCCGCGCA GCTTCATTCT TTGCTAGCCT GGATTCCTCC
661 TGCAGAAGCT GGATCTTATT CTCCAAGAGC TCATAAACAT GCTCCGTCTC CTGCTGTCGC
721 TCCTCAAACT GGCGTCGGAG CTCAGCTTCA TTCTGACTGT TGAGATTCTC CACATCAGCC
781 CATGTTTTAT CCAGATGCTG TTTCTTGTCC TGGAGTTCTC GTTTCAAGCT CTCCACTTCA
841 ACCTTCAGCT CAGTGTTCCG CTTGTAGATG TCCTCCCGGC TGGCCTCATA CTTCTGTTGC
901 ATGCGCTCCT CCAGGAAGTA GATGAGCAGC TTGAGGCTGA AGTTCTCCTT CTTCAGGTCA
961 TTGAGGTGCT TCTCAAAGTC TCGAAGAGCC TGGGTCTGTA CCTGAGGGGG TTTCTCAAAT
1021 GCTCTCAAGG AATATGTCTG CACAAACGGG ACCTTTTCAC CACTTCTCCA GATCTGTGAC
1081 TGCACTGGAG GGCCTCGATC TTTAGTGTCA CTAAGAAAAG CTGCTGTGTG ACTCGTTCTG
1141 GGTACCATCT CCCCATCATC CTCTGCAAAA TAATCTCTCG TCCAGGTCTG CTCCATTTTC
1201 CAGGCTCTTT CCTTAGTCTC AGGACGCTCC TCACCCGGGA GGGGAAGCAG CCTGGGAAAA
1261 TGAGAAGCCT TGCCCACGAA TCTCCAGCGC AAAAGGCAGC AGCTTTTTCC TCCCCAGCTC
1321 CTTTCTGCGT CGGCGGCGAA GAGAGAGCTC TGCTCCCTCG GGAAAGTTTC TTTGGAGGTC
1381 CGGCCCGGAG CGGCCATGTC CCACGGCCCC AAGCAGCCCG GCGCGGCCGC CGCGCCGGCG
1441 GGCGGCAAGG CTCCGGGCCA GCATGGGGGC TTCGTGGTGA CTGTCAAGCA AGAGCGCGGC
1501 GAGGGTCCAC GCGCGGGCGA GAAGGGGTCC CACGAGGAGG AGCCGGTGAA GAAACGCGGC
1561 TGGCCCAAGG GCAAGAAGCG GAAGAAGATT CTGCCGAATG GGCCCAAGGC ACCGGTCACG
1621 GGCTACGTGC GCTTCCTGAA CGAGCGGCGC GAGCAGATCC GCACGCGCCA CCCGGATCTG
1681 CCCTTTCCCG AGATCACCAA GATGCTGGGC GCCGAGTGGA GCAAGCTGCA GCCAACGGAA
1741 AAGCAGCGGT ACCTGGATGA GGCCGAGAGA GAGAAGCAGC AGTACATGAA GGAGCTGCGG
1801 GCGTACCAGC AGTCTGAAGC CTATAAGATG TGCACGGAGA AGATCCAGGA GAAGAAGATC
1861 AAGAAAGAAG ACTCGAGCTC TGGGCTCATG AACACTCTCC TGAATGGACA CAAGGGTGGG
1921 GACTGCGATG GCTTCTCCAC CTTCGATGTT CCCATCTTCA CTGAAGAGTT CTTGGACCAA
1981 AACAAAGCGC GTGAGGCGGA GCTTCGGCGC TTCGGAAGAT GAATGTGGCC TTCGAGGAGC
2041 AGAACGCGGT ACTGCAGAGG CACACGCAGA GCATGAGCAG CGCGCGCGAG CGTCTGGAGC
2101 AGGACGTGGC GCTGGAGGAG CGGAGGACGC TGGCGCTGCA GCAGCAGCTC CAGGCCGTGC
2161 GCCAGGCGCT CACCGCCAGC TTCGCCTCAC TGCCGGTGCC GGGCACGGGC GAAACGCCCA
2221 CGCTGGGCAC TCTGGACTTC TACATGGCCC GGCTTCACGG AGCCATCGAG CGCGACCCCG
2281 CCCAGCACGA GAAGCTCATC GTCCGCATCA AGGAAATCCT GGCCCAGGTC GCCAGCGAGC
2341 ACCTGTGAGG AGTGGGCGGG CCCACGATGC AGAGGAGAAG CTGTGGGCGC GGCCCTGCCA
2401 CACCCCACCC CGTGGACGAG AGGCTGGGGG TCCACCTTTG GGGCCTGGTC CCATCCTGCA
2461 CCTTGGGGGC TCCAGCCCCC CTAAAATTAA ATTTCTGCAG CATCCCTTTA GCTTTCAATC
2521 TCCCCAGCCC CCTGAACCCG GAAAAAGCAC CGTGCGCGAT ACACCCAGAA GAACCTCACA
2581 GCCGAGGGTG CCCCTCCTCG GAGGACAAGC CACGCGCTAC ACTGGCTCTC CGGGCCACCC
2641 CCAGGACACA GGGCAGACGA AACCCACCCC CAGCACACGG CAGGACCCCC CAAATTACTC
2701 ACTACGGGGG GCTGTGCCAT AGGCCACACA GGAAGCTGCC TTGTGGGGAC TTACCTGGGG
2761 TGTCCCCCGC ATGCCTGTAC CCCAGATGGG TGGGGGCCGG CTTTGCCCAT CCTGCTCTCC
2821 TCCAGCCGAG GGACCCTGGT GGGGGTGGCT CCTTCTCACT GCTGGATCCG GACTTTTTAA
2881 ATAAAAACAA GTAAAATTTG TGTTTTAAAA AAAAAAAAAA AAAAAAAAA
B:核苷酸序列(SEQ ID NO:5)长度:272个氨基酸
1 MDTRVGTAMA SPPSMFPSSL KSSWTKTKRV RRSFGASEDE CGLRGAERGT AEAHAEHEQR
61 ARASGAGRGA GGAEDAGAAA AAPGRAPGAH RQLRLTAGAG HGRNAHAGHS GLLHGPASRS
121 HRARPRPARE AHRPHQGNPG PGRQRAPVRS GRAHDAEEKL WARPCHTPPR GREAGGPPLG
181 PGPILHLGGS SPPKIKFLQH PFSFQSPQPP EPGKSTVRDT PRRTSQPRVP LLGGQATRYT
241 GSPGHPQDTG QTKPTPSTRQ DPPNYSLRGA VP
C.核苷酸及氨基酸组合序列(SEQ ID NO:6)克隆号:PP7706
起始编码子:1904 ATG 终止编码子:2720 TAG 蛋白质分子量:28556.18
1 G GAG AGA GAG AGC ACT AGT CTC GCG TTT TTT TTT TTT TTT TTT GAC 46
47 AAC TTG CTC TTT TAA TGT GGA ATG GAT GAC CCT CCA ATA TTT CCC CAG 94
95 AGC ACC CCA TGC TCT TCT ATC AGG GAA CTT ATT AAA ATC ATG TAA CAT 142
143 GTT TCT TGG TGA CAA GAT TTA GGT CTT TTG TTT CTG TAA CAC ATG CCA 190
191 GAT ACT TAG CCC GGT ATC TGG CAT GTG GCA TGC CCA GTA AAT GTT TGC 238
239 TGA ATA AGT GAA TCT ATG TCT CTT GCT TGC CGC TAT TTG CCC ACT GAA 286
287 TCC ATG AAG TGA GTT TTC ATA ATG ATT ACC ACT GAA AAT TCA ACC CTG 334
335 AAA AGA ATG TCT TCG GTT GTG GGC CCA TAA AGT CTT AGA AAT AGT GAA 382
383 GCT CCT ACT GTC AGT CCT TGA AAG GGA ACA GGA CAG CTG CTG TAT GCC 430
431 TTG AGA ATG GGC AAA AGA CAA GCG ACA AAA AGA GCA GCG AAG GCA CCT 478
479 ACT TGT CCC TCT GGG CCA GGG CCT CAG TGT ATT GGT CGG GCT TGA CCT 526
527 GGT CTC CTG GTA CAT CTT CCC AGT TTT TGG TGA CTC CCT TCA GTT TCT 574
575 CTG AGA GCT CCA GGT TAC ACT CCT TCT CTG CTT CCA CCA GAG CTG CCA 622
623 TCC GCG CAG CTT CAT TCT TTG CTA GCC TGG ATT CCT CCT GCA GAA GCT 670
671 GGA TCT TAT TCT CCA AGA GCT CAT AAA CAT GCT CCG TCT CCT GCT GTC 718
719 GCT CCT CAA ACT GGC GTC GGA GCT CAG CTT CAT TCT GAC TGT TGA GAT 766
767 TCT CCA CAT CAG CCC ATG TTT TAT CCA GAT GCT GTT TCT TGT CCT GGA 814
815 GTT CTC GTT TCA AGC TCT CCA CTT CAA CCT TCA GCT CAG TGT TCC GCT 862
863 TGT AGA TGT CCT CCC GGC TGG CCT CAT ACT TCT GTT GCA TGC GCT CCT 910
911 CCA GGA AGT AGA TGA GCA GCT TGA GGC TGA AGT TCT CCT TCT TCA GGT 958
959 CAT TGA GGT GCT TCT CAA AGT CTC GAA GAG CCT GGG TCT GTA CCT GAG 1006
1007 GGG GTT TCT CAA ATG CTC TCA AGG AAT ATG TCT GCA CAA ACG GGA CCT 1054
1055 TTT CAC CAC TTC TCC AGA TCT GTG ACT GCA CTG GAG GGC CTC GAT CTT 1102
1103 TAG TGT CAC TAA GAA AAG CTG CTG TGT GAC TCG TTC TGG GTA CCA TCT 1150
1151 CCC CAT CAT CCT CTG CAA AAT AAT CTC TCG TCC AGG TCT GCT CCA TTT 1198
1199 TCC AGG CTC TTT CCT TAG TCT CAG GAC GCT CCT CAC CCG GGA GGG GAA 1246
1247 GCA GCC TGG GAA AAT GAG AAG CCT TGC CCA CGA ATC TCC AGC GCA AAA 1294
1295 GGC AGC AGC TTT TTC CTC CCC AGC TCC TTT CTG CGT CGG CGG CGA AGA 1342
1343 GAG AGC TCT GCT CCC TCG GGA AAG TTT CTT TGG AGG TCC GGC CCG GAG 1390
1391 CGG CCA TGT CCC ACG GCC CCA AGC AGC CCG GCG CGG CCG CCG CGC CGG 1438
1439 CGG GCG GCA AGG CTC CGG GCC AGC ATG GGG GCT TCG TGG TGA CTG TCA 1486
1487 AGC AAG AGC GCG GCG AGG GTC CAC GCG CGG GCG AGA AGG GGT CCC ACG 1534
1535 AGG AGG AGC CGG TGA AGA AAC GCG GCT GGC CCA AGG GCA AGA AGC GGA 1582
1583 AGA AGA TTC TGC CGA ATG GGC CCA AGG CAC CGG TCA CGG GCT ACG TGC 1630
1631 GCT TCC TGA ACG AGC GGC GCG AGC AGA TCC GCA CGC GCC ACC CGG ATC 1678
1679 TGC CCT TTC CCG AGA TCA CCA AGA TGC TGG GCG CCG AGT GGA GCA AGC 1726
1727 TGC AGC CAA CGG AAA AGC AGC GGT ACC TGG ATG AGG CCG AGA GAG AGA 1774
1775 AGC AGC AGT ACA TGA AGG AGC TGC GGG CGT ACC AGC AGT CTG AAG CCT 1822
1823 ATA AGA TGT GCA CGG AGA AGA TCC AGG AGA AGA AGA TCA AGA AAG AAG 1870
1871 ACT CGA GCT CTG GGC TCA TGA ACA CTC TCC TGA ATG GAC ACA AGG GTG 1918
1 Met Asp Thr Arg Val 5
1919 GGG ACT GCG ATG GCT TCT CCA CCT TCG ATG TTC CCA TCT TCA CTG AAG 1966
6 Gly Thr Ala Met Ala Ser Pro Pro Ser Met Phe Pro Ser Ser Leu Lys 21
1967 AGT TCT TGG ACC AAA ACA AAG CGC GTG AGG CGG AGC TTC GGC GCT TCG 2014
22 Ser Ser Trp Thr Lys Thr Lys Arg Val Arg Arg Ser Phe Gly Ala Ser 37
2015 GAA GAT GAA TGT GGC CTT CGA GGA GCA GAA CGC GGT ACT GCA GAG GCA 2062
38 Glu Asp Glu Cys Gly Leu Arg Gly Ala Glu Arg Gly Thr Ala Glu Ala 53
2063 CAC GCA GAG CAT GAG CAG CGC GCG CGA GCG TCT GGA GCA GGA CGT GGC 2110
54 His Ala Glu His Glu Gln Arg Ala Arg Ala Ser Gly Ala Gly Arg Gly 69
2111 GCT GGA GGA GCG GAG GAC GCT GGC GCT GCA GCA GCA GCT CCA GGC CGT 2158
70 Ala Gly Gly Ala Glu Asp Ala Gly Ala Ala Ala Ala Ala Pro Gly Arg 85
2159 GCG CCA GGC GCT CAC CGC CAG CTT CGC CTC ACT GCC GGT GCC GGG CAC 2206
86 Ala Pro Gly Ala His Arg Gln Leu Arg Leu Thr Ala Gly Ala Gly His 101
2207 GGG CGA AAC GCC CAC GCT GGG CAC TCT GGA CTT CTA CAT GGC CCG GCT 2254
102 Gly Arg Asn Ala His Ala Gly His Ser Gly Leu Leu His Gly Pro Ala 117
2255 TCA CGG AGC CAT CGA GCG CGA CCC CGC CCA GCA CGA GAA GCT CAT CGT 2302
118 Ser Arg Ser His Arg Ala Arg Pro Arg Pro Ala Arg Glu Ala His Arg 133
2303 CCG CAT CAA GGA AAT CCT GGC CCA GGT CGC CAG CGA GCA CCT GTG AGG 2350
134 Pro His Gln Gly Asn Pro Gly Pro Gly Arg Gln Arg Ala Pro Val Arg 149
2351 AGT GGG CGG GCC CAC GAT GCA GAG GAG AAG CTG TGG GCG CGG CCC TGC 2398
150 Ser Gly Arg Ala His Asp Ala Glu Glu Lys Leu Trp Ala Arg Pro Cys 165
2399 CAC ACC CCA CCC CGT GGA CGA GAG GCT GGG GGT CCA CCT TTG GGG CCT 2446
166 His Thr Pro Pro Arg Gly Arg Glu Ala Gly Gly Pro Pro Leu Gly Pro 181
2447 GGT CCC ATC CTG CAC CTT GGG GGC TCC AGC CCC CCT AAA ATT AAA TTT 2494
182 Gly Pro Ile Leu His Leu Gly Gly Ser Ser Pro Pro Lys Ile Lys Phe 197
2495 CTG CAG CAT CCC TTT AGC TTT CAA TCT CCC CAG CCC CCT GAA CCC GGA 2542
198 Leu Gln His Pro Phe Ser Phe Gln Ser Pro Gln Pro Pro Glu Pro Gly 213
2543 AAA AGC ACC GTG CGC GAT ACA CCC AGA AGA ACC TCA CAG CCG AGG GTG 2590
214 Lys Ser Thr Val Arg Asp Thr Pro Arg Arg Thr Ser Gln Pro Arg Val 229
2591 CCC CTC CTC GGA GGA CAA GCC ACG CGC TAC ACT GGC TCT CCG GGC CAC 2638
230 Pro Leu Leu Gly Gly Gln Ala Thr Arg Tyr Thr Gly Ser Pro Gly His 245
2639 CCC CAG GAC ACA GGG CAG ACG AAA CCC ACC CCC AGC ACA CGG CAG GAC 2686
246 Pro Gln Asp Thr Gly Gln Thr Lys Pro Thr Pro Ser Thr Arg Gln Asp 261
2687 CCC CCA AAT TAC TCA CTA CGG GGG GCT GTG CCA TAG GCC ACA CAG GAA 2734
262 Pro Pro Asn Tyr Ser Leu Arg Gly Ala Val Pro *** 273
2735 GCT GCC TTG TGG GGA CTT ACC TGG GGT GTC CCC CGC ATG CCT GTA CCC 2782
2783 CAG ATG GGT GGG GGC CGG CTT TGC CCA TCC TGC TCT CCT CCA GCC GAG 2830
2831 GGA CCC TGG TGG GGG TGG CTC CTT CTC ACT GCT GGA TCC GGA CTT TTT 2878
2879 AAA TAAAAA CAA GTA AAA TTT GTG TTT TAA AAA AAA AAA AAA AAA AAA 2926
2927 AAA 2929
3.PPl0484
A:核苷酸序列(SEQ ID NO:7)长度:1788个碱基
1 GGCTAAATCA TATAACAGGG TCACAGTAAT GGGGGGTTTC AAAGTGGAGA ACCACACGGC
61 GTGCCACTGC AGTACTTGGT AAAACATTTA AGATTTGTGA TAATAACAAG TACTGCAGTG
121 GCACGCCGGG CCCCCAGAAC CCTATGAAGC CCAGCAGTCT GAGCCAATCG CCTACTTCCG
181 GGGCCTACGG CTGGTCATGA GCCACGGCCC ATACATCAAA CTTATTACTG GCTTCCTCTT
241 CACCTCCTTG GCTTTCATGC TGGTGGAGGG GAACTTTGTC TTGTTTTGCA CCTACACCTT
301 GGGCTTCCGC AATGAATTCC AGAATCTACT CCTGGCCATC ATGGTGAGTG GGACCTGAGC
361 AGGGGCGGGC AGCCTGGGCT GAGGTGACAT AGGCTGTGGA ATGGTTCTTG GAATAGGCAG
421 AGGATGTTTC TCAGGCTGGC CCAAGGTCAT GAAAGGATGA GGGAGGCTTC TCAGGGTATT
481 TGGTTGGACC TTGCGAAGGT AGGACTGTGA AAGAAAGAGT TTGAGGTTAG ATGTTTGAGT
541 AGTGAGCACA GCAAAAGCAA GGGCGAGGAC ACCAGGAACT TGGCTCAGAG GTTTGAGAGG
601 GCAGCAGACA AGGTGGGCCT GGACCAGCTC TGAGCTCCCC TGGGGAGCCG TCAAAGGTGC
661 CTGTCATCTT CGTTGCTGCC CACATGATGT CATCTGGCTG CTCTTGGGCA GGGCTGGGAG
721 CCACTTTGGG GTTCTGGGAA GGGCAGGAGG GGCTCTGTGG CTCTAAAGCA CCTCCCTTTA
781 ACCCCCTTTG TCCATCCACA GCTCTCGGCC ACTTTAACCA TTCCCATCTG GCAGTGGTTC
841 TTGACCCGGT TTGGCAAGAA GACAGCTGTA TATGTTGGGA TCTCATCAGC AGTGCCATTT
901 CTCATCTTGG TGGCCCTCAT GGAGAGTAAC CTCATCATTA CATATGCGGT AGCTGTGGCA
961 GCTGGCATCA GTGTGGCAGC TGCCTTCTTA CTACCCTGGT CCATGCTGCC TGATGTCATT
1021 GACGACTTCC ATCTGAAGCA GCCCCACTTC CATGGAACCG AGCCCATCTT CTTCTCCTTC
1081 TATGTCTTCT TCACCAAGTT TGCCTCTGGA GTGTCACTGG GCATTTCTAC CCTCAGTCTG
1141 GACTTTGCAG GGTACCAGAC CCGTGGCTGC TCGCAGCCGG AACGTGTCAA GTTTACACTG
1201 AACATGCTCG TGACCATGGC TCCCATAGTT CTCATCCTGC TGGGCCTGCT GCTCTTCAAA
1261 ATGTACCCCA TTGATGAGGA GAGGCGGCGG CAGAATAAGA AGGCCCTGCA GGCACTGAGG
1321 GACGAGGCCA GCAGCTCTGG CTGCTCAGAA ACAGACTCCA CAGAGCTGGC TAGCATCCTC
1381 TAGGGCCCGC CACGTTGCCC GAAGCCACCA TGCAGAAGGC CACAGAAGGG ATCAGGACCT
1441 GTCTGCCGGC TTGCTGAGCA GCTGGACTGC AGGTGCTAGG AAGGGAACTG AAGACTCAAG
1501 GAGGTGGCCC AGGACACTTG CTGTGCTCAC TGTGGGGCCG GCTGCTCTGT GGCCTCCTGC
1561 CTCCCCTCTG CCTGCCTGTG GGGCCAAGCC CTGGGGCTGC CACTGTGAAT ATGCCAAGGA
1621 CTGATCGGGC CTAGCCCGGA ACACTAATGT AGAAACCTTT TTTTTACAGA GCCTAATTAA
1681 TAACTTAATG ACTGTGTACA TAGCAATGTG TGTGTATGTA TATGTCTGTG AGCTATTAAT
1741 GTTATTAATT TTCATAAAAG CTGGAAAGCA AAAAAAAAAA AAAAAAAA
B:核苷酸序列(SEQ ID NO:8)长度:154个氨基酸
1 MESNLIITYA VAVAAGISVA AAFLLPWSML PDVIDDFHLK QPHFHGTEPI FFSFYVFFTK
61 FASGVSLGIS TLSLDFAGYQ TRGCSQPERV KFTLNMLVTM APIVLILLGL LLFKMYPIDE
121 ERRRQNKKAL QALRDEASSS GCSETDSTEL ASIL
C.核苷酸及氨基酸组合序列(SEQ ID NO:9)克隆号:PP10484
起始编码子:919 ATG 终止编码子:1381 TAG 蛋白质分子量:17057.85
1 GGC TAA ATC ATA TAA CAG GGT CAC AGT AAT GGG GGG TTT CAA AGT GGA 48
49 GAA CCA CAC GGC GTG CCA CTG CAG TAC TTG GTA AAA CAT TTA AGA TTT 96
97 GTG ATA ATA ACA AGT ACT GCA GTG GCA CGC CGG GCC CCC AGA ACC CTA 144
145 TGA AGC CCA GCA GTC TGA GCC AAT CGC CTA CTT CCG GGG CCT ACG GCT 192
192 GGT CAT GAG CCA CGG CCC ATA CAT CAA ACT TAT TAC TGG CTT CCT CTT 240
241 CAC CTC CTT GGC TTT CAT GCT GGT GGA GGG GAA CTT TGT CTT GTT TTG 288
289 CAC CTA CAC CTT GGG CTT CCG CAA TGA ATT CCA GAA TCT ACT CCT GGC 336
337 CAT CAT GGT GAG TGG GAC CTG AGC AGG GGC GGG CAG CCT GGG CTG AGG 384
385 TGA CAT AGG CTG TGG AAT GGT TCT TGG AAT AGG CAG AGG ATG TTT CTC 432
433 AGG CTG GCC CAA GGT CAT GAA AGG ATG AGG GAG GCT TCT CAG GGT ATT 480
481 TGG TTG GAC CTT GCG AAG GTA GGA CTG TGA AAG AAA GAG TTT GAG GTT 528
529 AGA TGT TTG AGT AGT GAG CAC AGC AAA AGC AAG GGC GAG GAC ACC AGG 576
577 AAC TTG GCT CAG AGG TTT GAG AGG GCA GCA GAC AAG GTG GGC CTG GAC 624
625 CAG CTC TGA GCT CCC CTG GGG AGC CGT CAA AGG TGC CTG TCA TCT TCG 672
673 TTG CTG CCC ACA TGA TGT CAT CTG GCT GCT CTT GGG CAG GGC TGG GAG 720
721 CCA CTT TGG GGT TCT GGG AAG GGC AGG AGG GGC TCT GTG GCT CTA AAG 768
769 CAC CTC CCT TTA ACC CCC TTT GTC CAT CCA CAG CTC TCG GCC ACT TTA 816
817 ACC ATT CCC ATC TGG CAG TGG TTC TTG ACC CGG TTT GGC AAG AAG ACA 864
865 GCT GTA TAT GTT GGG ATC TCA TCA GCA GTG CCA TTT CTC ATC TTG GTG 912
913 GCC CTC ATG GAG AGT AAC CTC ATC ATT ACA TAT GCG GTA GCT GTG GCA 960
1 Met Glu Ser Asn Leu Ile Ile Thr Tyr Ala Val Ala Val Ala 14
961 GCT GGC ATC AGT GTG GCA GCT GCC TTC TTA CTA CCC TGG TCC ATG CTG 1008
15 Ala Gly Ile Ser Val Ala Ala Ala Phe Leu Leu Pro Trp Ser Met Leu 30
1009 CCT GAT GTC ATT GAC GAC TTC CAT CTG AAG CAG CCC CAC TTC CAT GGA 1056
31 Pro Asp Val Ile Asp Asp Phe His Leu Lys Gln Pro His Phe His Gly 46
1057 ACC GAG CCC ATC TTC TTC TCC TTC TAT GTC TTC TTC ACC AAG TTT GCC 1104
47 Thr Glu Pro Ile Phe Phe Ser Phe Tyr Val Phe Phe Thr Lys Phe Ala 62
1105 TCT GGA GTG TCA CTG GGC ATT TCT ACC CTC AGT CTG GAC TTT GCA GGG 1152
63 Ser Gly Val Ser Leu Gly Ile Ser Thr Leu Ser Leu Asp Phe Ala Gly 78
1153 TAC CAG ACC CGT GGC TGC TCG CAG CCG GAA CGT GTC AAG TTT ACA CTG 1200
79 Tyr Gln Thr Arg Gly Cys Ser Gln Pro Glu Arg Val Lys Phe Thr Leu 94
1201 AAC ATG CTC GTG ACC ATG GCT CCC ATA GTT CTC ATC CTG CTG GGC CTG 1248
95 Asn Met Leu Val Thr Met Ala Pro Ile Val Leu Ile Leu Leu Gly Leu 110
1249 CTG CTC TTC AAA ATG TAC CCC ATT GAT GAG GAG AGG CGG CGG CAG AAT 1296
111 Leu Leu Phe Lys Met Tyr Pro Ile Asp Glu Glu Arg Arg Arg Gln Asn 126
1297 AAG AAG GCC CTG CAG GCA CTG AGG GAC GAG GCC AGC AGC TCT GGC TGC 1344
127 Lys Lys Ala Leu Gln Ala Leu Arg Asp Glu Ala Ser Ser Ser Gly Cys 142
1345 TCA GAA ACA GAC TCC ACA GAG CTG GCT AGC ATC CTC TAG GGC CCG CCA 1392
143 Ser Glu Thr Asp Ser Thr Glu Leu Ala Ser Ile Leu *** 155
1393 CGT TGC CCG AAG CCA CCA TGC AGA AGG CCA CAG AAG GGA TCA GGA CCT 1440
1441 GTC TGC CGG CTT GCT GAG CAG CTG GAC TGC AGG TGC TAG GAA GGG AAC 1488
1489 TGA AGA CTC AAG GAG GTG GCC CAG GAC ACT TGC TGT GCT CAC TGT GGG 1536
1537 GCC GGC TGC TCT GTG GCC TCC TGC CTC CCC TCT GCC TGC CTG TGG GGC 1584
1585 CAA GCC CTG GGG CTG CCA CTG TGA ATA TGC CAA GGA CTG ATC GGG CCT 1632
1633 AGC CCG GAA CAC TAA TGT AGA AAC CTT TTT TTT ACA GAG CCT AAT TAA 1680
1681 TAA CTT AAT GAC TGT GTA CAT AGC AAT GTG TGT GTA TGT ATA TGT CTG 1728
1729 TGA GCT ATT AAT GTT ATT AAT TTT CAT AAA AGC TGG AAA GCA AAA AAA 1776
1777 AAA AAA AAA AAA 1788
4. PP10566
A:核苷酸序列(SEQ ID NO:10)长度:2559个碱基
1 GCAGAGCCTG AGCAGGCAGG GCACCTCCAG GTGGGCAGGA GCTACCACTC AGCACCATGA
61 GCACCACCAC AGGCCCAGAA GCTGCCCCAA AGCCAAGCGC CAAGTCTATC TATGAGCAGA
121 GGAAGCGTTA CTCCACAGTT GTTATGGCTG ATGTATCCCA GTACCCAGTC AATCACCTGG
181 TGACGTTCTG CCTGGGTGAG GACGATGGCG TGCATACCGT GGAGGATGCC TCCAGGAAGT
241 TGGCCGTCAT GGATAGCCAG GGCCGAGTCT GGGCACAGGA GATGCTGCTG CGAGTGTCTC
301 CCGACCATGT CACGCTGCTC GACCCGGCCT CCAAGGAGGA GCTGGAGTCG TACCCACTGG
361 GCGCCATCGT GCGCTGTGAC GCGGTGATGC CACCCGGCAG GAGCCGCTCG TTGCTGCTGC
421 TCGTGTGCCA GGAACCCGAG CGCGCGCAGC CCGACGTGCA CTTCTTCCAG GGCCTGCGCC
481 TCGGGGCGGA GCTGATCCGA GAGGACATCC AGGGGGCTCT GCACAATTAC CGCTCGGGCC
541 GCGGGGAGCG CAGGGCGGCG GCGCTCAGGG CCACGCAGGA GGAGTTGCAG CGCGACCGCT
601 CGCCCGCCGC TGAGACCCCG CCCCTGCAGC GCCGCCCGTC AGTCCGCGCA GTGATCAGCA
661 CCGTAGAGCG GGGCGCGGGC CGCGGACGAC CCCAGGCGAA GCCCATTCCC GAGGCAGAGG
721 AGGCGCAGAG GCCTGAGCCG GTGGGGACCT CGAGCAACGC TGACTCGGCC TCCCCGGACC
781 TGGGTCCCCG GGGTCCTGAC CTGGCGGTTC TGCAGGCGGA GCGGGAAGTG GACATCCTGA
841 ACCACGTGTT CGACGACGTA GAGAGCTTTG TATCGAGGCT GCAGAAGTCG GCGGAGGCGG
901 CCAGGGTGCT GGAGCACCGG GAACGCGGCC GCAGGAGCCG GCGCCGGGCG GCTGGGGAGG
961 GCTTGCTGAC GCTGCGGGCC AAGCCGCCCT CGGAGGCCGA GTACACCGAC GTGCTGCAGA
1021 AGATCAAGTA CGCCTTCAGC CTGCTGGCCC GGCTGCGCGG CAACATCGCC GACCCCTCCT
1081 CTCCGGAGCT GTTGCACTTC CTTTTCGGGC CTCTGCAGAT GATTGTGAAC ACGTCGGGGG
1141 GGCCGGAGTT CGCGAGCAGT GTGCGGCGGC CGCATCTGAC ATCGGATGCC GTGGCGCTGC
1201 TGCGGGACAA CGTCACTCCA CGTGAAAACG AGCTCTGGAC CTCGCTGGGG GACTCGTGGA
1261 CCCGCCCCGG GCTGGAGCTG TCCCCGGAGG AGGGACCCCC ATACAGACCC GAGTTCTTCA
1321 GCGGCTGGGA GCCGCCGGTC ACTGACCCGC AGAGCCGCGC CTGGGAGGAC CCAGTTGAGA
1381 AACAGCTACA GCACGAGCGG AGGCGCCGGC AGCAAAGCGC CCCCGAGGTC GCTGTCAATG
1441 GTCACCGAGA CTTGGAGCCA GAATCTGAGC CTCAGCTGGA GTCAGAGACA GCAGGAAAAT
1501 GGGTCCTGTG TAATTATGAC TTCCAGGCCC GCAACAGCAG TGAGCTGTCG GTCAAGCAGC
1561 GGGACGTACT GGAGGTCCTG GATGACAGTC GTAAGTGGTG GAAGGTTCGG GACCCAGCGG
1621 GGCAGGAGGG ATATGTGCCC TACAACATCC TGACACCCTA CCCCGGACCC CGGCTGCACC
1681 ACAGCCAAAG CCCTGCCCGC AGCCTGAACA GCACTCCTCC TCCACCACCA GCCCCAGCCC
1741 CGGCCCCACC TCCAGCTCTG GCTCGGCCCC GCTGGGACAG GCCCCGCTGG GACAGCTGCG
1801 ATAGCCTCAA CGGCTTGGAC CCCAGCGAGA AGGAGAAATT CTCCCAGATG CTCATCGTCA
1861 ACGAGGAACT GCAGGCGCGC CTGGCCCAGG GCCGCTCGGG ACCGAGCCGC GCAGTCCCAG
1921 GGCCCCGCGC CCCGGAACCG CAGCTCAGCC CGGGCTCGGA CGCCTCCGAG GTCCGCGCCT
1981 GGCTGCAGGC CAAGGGCTTT AGCTCCGGGA CCGTGGACGC GCTGGGTGTG CTGACCGGGG
2041 CGCAGCTTTT CTCGCTGCAG AGGGAGGAGC TGCGGGCGGT GAGCCCCGAG GAGGGGGCAC
2101 GTGTGTACAG CCAGGTCACC GTGCAGCGCT CGCTGCTGGA GGACAAAGAG AAAGTGTCAG
2161 AGCTGGAGGC AGTGATGGAG AAGCAAAAGA AGAAGGTGGA AGGCGAGGTG GAAATGGAGG
2221 TCATTTGACC TGCCAGGCGC CCTTCGCAAA GAGTGACGAG GCCCCGTGGG AGAACGGACT
2281 CCTCAGACTC TCCCCAATAG CGGAAGTCGA TCTTCTGAAG GATGGCCAAT CTGCTCCGGC
2341 CCTGGTCTTC CCCCATCCCG GTGGACAGAC TTAACGATCC TTGCTGCAGT CCCTCCGGAG
2401 AGGATCTGGA CTGGCTGGGA GTGGGGAGGG CGTGGAGACA GTCTACGGAA AGCGCTAGCA
2461 GACCCCCGAG AGGGTGCAGT GGAGCCCTGA GCATTGTAAT ATGCGGCCCA GCCTATAAAC
2521 AGCCTCCGTG CTTAGCAAAA AAAAAAAAAA AAAAAAAAA
B:核苷酸序列(SEQ ID NO:11)长度:723个氨基酸
1 MSTTTGPEAA PKPSAKSIYE QRKRYSTVVM ADVSQYPVNH LVTFCLGEDD GVHTVEDASR
61 KLAVMDSQGR VWAQEMLLRV SPDHVTLLDP ASKEELESYP LGAIVRCDAV MPPGRSRSLL
121 LLVCQEPERA QPDVHFFQGL RLGAELIRED IQGALHNYRS GRGERRAAAL RATQEELQRD
181 RSPAAETPPL QRRPSVRAVI STVERGAGRG RPQAKPIPEA EEAQRPEPVG TSSNADSASP
241 DLGPRGPDLA VLQAEREVDI LNHVFDDVES FVSRLQKSAE AARVLEHRER GRRSRRRAAG
301 EGLLTLRAKP PSEAEYTDVL QKIKYAFSLL ARLRGNIADP SSPELLHFLF GPLQMIVNTS
361 GGPEFASSVR RPHLTSDAVA LLRDNVTPRE NELWTSLGDS WTRPGLELSP EEGPPYRPEF
421 FSGWEPPVTD PQSRAWEDPV EKQLQHERRR RQQSAPEVAV NGHRDLEPES EPQLESETAG
481 KWLCNYDFQ ARNSSELSVK QRDVLEVLDD SRKWWKVRDP AGQEGYVPYN ILTPYPGPRL
541 HHSQSPARSL NSTPPPPPAP APAPPPALAR PRWDRPRWDS CDSLNGLDPS EKEKFSQMLI
601 VNEELQARLA QGRSGPSRAV PGPRAPEPQL SPGSDASEVR AWLQAKGFSS GTVDALGVLT
661 GAQLFSLQRE ELRAVSPEEG ARVYSQVTVQ RSLLEDKEKV SELEAVMEKQ KKKVEGEVEM
721 EVI
C.核苷酸及氨基酸组合序列(SEQ ID NO:12)克隆号:PP10566
起始编码子:57 ATG 终止编码子:2226 TGA 蛋白质分子量:80305.65
1 GC AGA GCC TGA GCA GGC AGG GCA CCT CCA GGT GGG CAG GAG CTA CCA 47
48 CTC AGC ACC ATG AGC ACC ACC ACA GGC CCA GAA GCT GCC CCA AAG CCA 95
1 Met Ser Thr Thr Thr Gly Pro Glu Ala Ala Pro Lys Pro 13
96 AGC GCC AAG TCT ATC TAT GAG CAG AGG AAG CGT TAC TCC ACA GTT GTT 143
14 Ser Ala Lys Ser Ile Tyr Glu Gln Arg Lys Arg Tyr Ser Thr Val Val 29
144 ATG GCT GAT GTA TCC CAG TAC CCA GTC AAT CAC CTG GTG ACG TTC TGC 191
30 Met Ala Asp Val Ser Gln Tyr Pro Val Asn His Leu Val Thr Phe Cys 45
192 CTG GGT GAG GAC GAT GGC GTG CAT ACC GTG GAG GAT GCC TCC AGG AAG 239
46 Leu Gly Glu Asp Asp Gly Val His Thr Val Glu Asp Ala Ser Arg Lys 61
240 TTG GCC GTC ATG GAT AGC CAG GGC CGA GTC TGG GCA CAG GAG ATG CTG 287
62 Leu Ala Val Met Asp Ser Gln Gly Arg Val Trp Ala Gln Glu Met Leu 77
288 CTG CGA GTG TCT CCC GAC CAT GTC ACG CTG CTC GAC CCG GCC TCC AAG 335
78 Leu Arg Val Ser Pro Asp His Val Thr Leu Leu Asp Pro Ala Ser Lys 93
336 GAG GAG CTG GAG TCG TAC CCA CTG GGC GCC ATC GTG CGC TGT GAC GCG 383
94 Glu Glu Leu Glu Ser Tyr Pro Leu Gly Ala Ile Val Arg Cys Asp Ala 109
384 GTG ATG CCA CCC GGC AGG AGC CGC TCG TTG CTG CTG GTC GTG TGC CAG 431
110 Val Met Pro Pro Gly Arg Ser Arg Ser Leu Leu Leu Leu Val Cys Gln 125
432 GAA CCC GAG CGC GCG CAG CCC GAC GTG CAC TTC TTC CAG GGC CTG CGC 479
126 Glu Pro Glu Arg Ala Gln Pro Asp Val His Phe Phe Gln Gly Leu Arg 141
480 CTC GGG GCG GAG CTG ATC CGA GAG GAC ATC CAG GGG GCT CTG CAC AAT 527
142 Leu Gly Ala Glu Leu Ile Arg Glu Asp Ile Gln Gly Ala Leu His Asn 157
528 TAC CGC TCG GGC CGC GGG GAG CGC AGG GCG GCG GCG CTC AGG GCC ACG 575
158 Tyr Arg Ser Gly Arg Gly Glu Arg Arg Ala Ala Ala Leu Arg Ala Thr 173
576 CAG GAG GAG TTG CAG CGC GAC CGC TCG CCC GCC GCT GAG ACC CCG CCC 623
174 Gln Glu Glu Leu Gln Arg Asp Arg Ser Pro Ala Ala Glu Thr Pro Pro 189
624 CTG CAG CGC CGC CCG TCA GTC CGC GCA GTG ATC AGC ACC GTA GAG CGG 671
190 Leu Gln Arg Arg Pro Ser Val Arg Ala Val Ile Ser Thr Val Glu Arg 205
672 GGC GCG GGC CGC GGA CGA CCC CAG GCG AAG CCC ATT CCC GAG GCA GAG 719
206 Gly Ala Gly Arg Gly Arg Pro Gln Ala Lys Pro Ile Pro Glu Ala Glu 221
720 GAG GCG CAG AGG CCT GAG CCG GTG GGG ACC TCG AGC AAC GCT GAC TCG 767
222 Glu Ala Gln Arg Pro Glu Pro Val Gly Thr Ser Ser Asn Ala Asp Ser 237
768 GCC TCC CCG GAG CTG GGT CCC CGG GGT CCT GAC CTG GCG GTT CTG CAG 815
238 Ala Ser Pro Asp Leu Gly Pro Arg Gly Pro Asp Leu Ala Val Leu Gln 253
816 GCG GAG CGG GAA GTG GAC ATC CTG AAC CAC GTG TTC GAC GAC GTA GAG 863
254 Ala Glu Arg Glu Val Asp Ile Leu Asn His Va1 Phe Asp Asp Val Glu 269
864 AGC TTT GTA TCG AGG CTG CAG AAG TCG GCG GAG GCG GCC AGG GTG CTG 911
270 Ser Phe Val Ser Arg Leu Gln Lys Ser Ala Glu Ala Ala Arg Val Leu 285
912 GAG CAC CGG GAA CGC GGC CGC AGG AGC CGG CGC CGG GCG GCT GGG GAG 959
286 Glu His Arg Glu Arg Gly Arg Arg Ser Arg Arg Arg Ala Ala Gly Glu 301
960 GGC TTG CTG ACG CTG CGG GCC AAG CCG CCC TCG GAG GCC GAG TAC ACC 1007
302 Gly Leu Leu Thr Leu Arg Ala Lys Pro Pro Ser Glu Ala Glu Tyr Thr 317
1008 GAC GTG CTG CAG AAG ATC AAG TAC GCC TTC AGC CTG CTG GCC CGG CTG 1055
318 Asp Val Leu Gln Lys Ile Lys Tyr Ala Phe Ser Leu Leu Ala Arg Leu 333
1056 CGC GGC AAC ATC GCC GAC CCC TCC TCT CCG GAG CTG TTG CAC TTC CTT 1103
334 Arg Gly Asn Ile Ala Asp Pro Ser Ser Pro Glu Leu Leu His Phe Leu 349
1104 TTC GGG CCT CTG CAG ATG ATT GTG AAC ACG TCG GGG GGG CCG GAG TTC 1151
350 Phe Gly Pro Leu Gln Met Ile Val Asn Thr Ser Gly Gly Pro Glu Phe 365
1152 GCG AGC AGT GTG CGG CGG CCG CAT CTG ACA TCG GAT GCC GTG GCG CTG 1199
366 Ala Ser Ser Val Arg Arg Pro His Leu Thr Ser Asp Ala Val Ala Leu 381
1200 CTG CGG GAC AAC GTC ACT CCA CGT GAA AAC GAG CTC TGG ACC TCG CTG 1247
382 Leu Arg Asp Asn Val Thr Pro Arg Glu Asn Glu Leu Trp Thr Ser Leu 397
1248 GGG GAC TCG TGG ACC CGC CCC GGG CTG GAG CTG TCC CCG GAG GAG GGA 1295
398 Gly Asp Ser Trp Thr Arg Pro Gly Leu Glu Leu Ser Pro Glu Glu Gly 413
1296 CCC CCA TAC AGA CCC GAG TTC TTC AGC GGC TGG GAG CCG CCG GTC ACT 1343
414 Pro Pro Tyr Arg Pro G1u Phe Phe Ser Gly Trp Glu Pro Pro Val Thr 429
1344 GAC CCG CAG AGC CGC GCC TGG GAG GAC CCA GTT GAG AAA CAG CTA CAG 1391
430 Asp Pro Gln Ser Arg Ala Trp Glu Asp Pro Val Glu Lys Gln Leu Gln 445
1392 CAC GAG CGG AGG CGC CGG CAG CAA AGC GCC CCC GAG GTC GCT GTC AAT 1439
446 His Glu Arg Arg Arg Arg Gln Gln Ser Ala Pro Glu Val Ala Val Asn 461
1440 GGT CAC CGA GAC TTG GAG CCA GAA TCT GAG CCT CAG CTG GAG TCA GAG 1487
462 Gly His Arg Asp Leu Glu Pro Glu Ser Glu Pro Gln Leu Glu Ser Glu 477
1488 ACA GCA GGA AAA TGG GTC CTG TGT AAT TAT GAC TTC CAG GCC CGC AAC 1535
478 Thr Ala Gly Lys Trp Val Leu Cys Asn Tyr Asp Phe Gln Ala Arg Asn 493
1536 AGC AGT GAG CTG TCG GTC AAG CAG CGG GAC GTA CTG GAG GTC CTG GAT 1583
494 Ser Ser Glu Leu Ser Val Lys Gln Arg Asp Val Leu Glu Val Leu Asp 509
1584 GAC AGT CGT AAG TGG TGG AAG GTT CGG GAC CCA GCG GGG CAG GAG GGA 1631
510 Asp Ser Arg Lys Trp Trp Lys Val Arg Asp Pro Ala Gly Gln Glu Gly 525
1632 TAT GTG CCC TAC AAC ATC CTG ACA CCC TAC CCC GGA CCC CGG CTG CAC 1679
526 Tyr Val Pro Tyr Asn Ile Leu Thr Pro Tyr Pro Gly Pro Arg Leu His 541
1680 CAC AGC CAA AGC CCT GCC CGC AGC CTG AAC AGC ACT CCT CCT CCA CCA 1727
542 His Ser Gln Ser Pro Ala Arg Ser Leu Asn Ser Thr Pro Pro Pro Pro 557
1728 CCA GCC CCA GCC CCG GCC CCA CCT CCA GCT CTG GCT CGG CCC CGC TGG 1775
558 Pro Ala Pro Ala Pro Ala Pro Pro Pro Ala Leu Ala Arg Pro Arg Trp 573
1776 GAC AGG CCC CGC TGG GAC AGC TGC GAT AGC CTC AAC GGC TTG GAC CCC 1823
574 Asp Arg Pro Arg Trp Asp Ser Cys Asp Ser Leu Asn Gly Leu Asp Pro 589
1824 AGC GAG AAG GAG AAA TTC TCC CAG ATG CTC ATC GTC AAC GAG GAA CTG 1871
590 Ser Glu Lys Glu Lys Phe Ser Gln Met Leu Ile Val Asn Glu Glu Leu 605
1872 CAG GCG CGC CTG GCC CAG GGC CGC TCG GGA CCG AGC CGC GCA GTC CCA 1919
606 Gln Ala Arg Leu Ala Gln Gly Arg Ser Gly Pro Ser Arg Ala Val Pro 621
1920 GGG CCC CGC GCC CCG GAA CCG CAG CTC AGC CCG GGC TCG GAC GCC TCC 1967
622 Gly Pro Arg Ala Pro Glu Pro Gln Leu Ser Pro Gly Ser Asp Ala Ser 637
1968 GAG GTC CGC GCC TGG CTG CAG GCC AAG GGC TTT AGC TCC GGG ACC GTG 2015
638 Glu Val Arg Ala Trp Leu Gln Ala Lys Gly Phe Ser Ser Gly Thr Val 653
2016 GAC GCG CTG GGT GTG CTG ACC GGG GCG CAG CTT TTC TCG CTG CAG AGG 2063
654 Asp Ala Leu Gly Val Leu Thr Gly Ala Gln Leu Phe Ser Leu Gln Arg 669
2064 GAG GAG CTG CGG GCG GTG AGC CCC GAG GAG GGG GCA CGT GTG TAC AGC 2111
670 Glu Glu Leu Arg Ala Val Ser Pro Glu Glu Gly Ala Arg Val Tyr Ser 685
2112 CAG GTC ACC GTG CAG CGC TCG CTG CTG GAG GAC AAA GAG AAA GTG TCA 2159
686 Gln Val Thr Val Gln Arg Ser Leu Leu Glu Asp Lys Glu Lys Val Ser 701
2160 GAG CTG GAG GCA GTG ATG GAG AAG CAA AAG AAG AAG GTG GAA GGC GAG 2207
702 Glu Leu Glu Ala Val Met Glu Lys Gln Lys Lys Lys Val Glu Gly Glu 717
2208 GTG GAA ATG GAG GTC ATT TGA CCT GCC AGG CGC CCT TCG CAA AGA GTG 2255
718 Val Glu Met Glu Val Ile *** 724
2256 ACG AGG CCC CGT GGG AGA ACG GAC TCC TCA GAC TCT CCC CAA TAG CGG 2303
2304 AAG TCG ATC TTC TGA AGG ATG GCC AAT CTG CTC CGG CCC TGG TCT TCC 2351
2352 CCC ATC CCG GTG GAC AGA CTT AAC GAT CCT TGC TGC AGT CCC TCC GGA 2399
2400 GAG GAT CTG GAC TGG CTG GGA GTG GGG AGG GCG TGG AGA CAG TCT ACG 2447
2448 GAA AGC GCT AGC AGA CCC CCG AGA GGG TGC AGT GGA GCC CTG AGC ATT 2495
2496 GTA ATA TGC GGC CCA GCC TAT AAA CAG CCT CCG TGC TTA GCA AAA AAA 2543
2544 AAA AAA AAA AAA AAA A 2559
5.PP10631
A:核苷酸序列(SEQ ID NO:13)长度:3134个碱基
1 GGGCGAGCAG GACAGGACGA AGCCGGAGTG TAGGCGGCAG AGGATTCGCT CCCAGAGCAG
61 CTGCGGCCAG GTCGGAAAGA GGCCGGGGCG GCTGGGTATA TGAATGACCT AAAGGTACAA
121 ATAAAGACGG AGAGAGAACA GTGCCAACTG GGAGCAGGGC AAGAATGCCA ATTCCTCCTC
181 CCCCGCCACC CCCACCTGGT CCTCCTCCAC CTCCCACATT TCATCAGGCA AACACAGAGC
241 AGCCCAAGCT GAGTAGAGAT GAGCAGCGGG GTCGAGGCGC CCTCTTACAG GACATTTGCA
301 AAGGGACCAA GCTGAAGAAG GTGACCAACA TTAATGATCG GAGTGCTCCC ATCCTCGAGA
361 AGCCGAAAGG AAGCAGTGGT GGCTATGGCT CTGGAGGAGC TGCCCTGCAG CCCAAGGGAG
421 GTCTCTTCCA AGGAGGAGTG CTGAAGCTTC GACCTGTGGG AGCCAAGGAT GGTTCAGAGA
481 ACCTAGCTGG TAAGCCAGCC CTGCAAATCC CCAGTTCTCG AGCTGCTGCC CCAAGGCCTC
541 CAGTATCTGC CGCCAGCGGG CGTCCTCAGG ATGATACAGA CAGCAGCCGG GCCTCACTCC
601 CAGAACTGCC CCGGATGCAG AGACCCTCTT TACCGGACCT CTCTCGGCCT AATACCACCA
661 GCAGTACGGG CATGAAGCAC AGCTCCTCTG CCCCTCCCCC ACCACCCCCA GGGCGGCGTG
721 CCAACGCACC CCCCACACCT CTGCCTATGC ACAGCAGCAA AGCCCCCGCC TACAACAGAG
781 AGAAACCCTT GCCACCGACG CCTGGACAAA GGCTTCACCC TGGTCGAGAG GGACCTCCTG
841 CTCCACCCCC AGTCAAACCA CCTCCTTCCC CTGTGAATAT CAGAACAGGA CCAAGTGGCC
901 AGTCTCTGGC TCCTCCTCCT CCGCCTTACC GCCAGCCTCC TGGGGTCCCC AATGGACCCT
961 CTAGCCCCAC TAATGAGTCA GCCCCTGAGC TGCCACAGAG ACACAATTCT TTGCATAGGA
1021 AGACACCAGG GCCTGTCAGA GGCCTAGCAC CTCCTCCACC CACCTCGGCC TCCCCATCTT
1081 TACTGAGTAA TAGGCCACCT CCCCCAGCCC GAGACCCTCC CAGTCGGGGA GCAGCTCCTC
1141 CACCCCCACC ACCTGTGATC CGAAATGGTG CCAGGGATGC TCCCCCTCCC CCACCACCAT
1201 ACCGAATGCA TGGGTCAGAA CCCCCGAGCC GAGGAAAGCC CCCACCTCCA CCCTCAAGGA
1261 CGCCAGCTGG GCCACCCCCC TCCTCTTCCA CCGCCCCTGA GGAATGGCCA CAGAGATTCT
1321 ATCACCACTG TCCGGTCTTT CTTGGATGAT TTTGAGTCAA AGTATTCCTT CCATCCAGTA
1381 GAAGACTTTC CTGCTCCAGA AGAATATAAA CACTTTCAGA GGATATATCC CAGCAAAACA
1441 AACCGAGCTG CCCGTGGAGC CCCACCTCTG CCACCCATTC TCAGGTGAAG CCTGGCTTGG
1501 TCCCGTTCCT CAGGAAAAGG ATGGACCTTC TCTTCTTCTC AGATGGTCCC TTCCATTCCC
1561 CTGAAACCTG CATGAGAGCT CCTAACATGT TTCTCCAATG CAATCAAGCC CTAGACTCCA
1621 AATGTCCTCC CAGCTCACCT CCATCTATGC ATCTCATCTC TGGATTTGGT GATCAGACTC
1681 TATATTGACA GTAGGATCTC AAACCCTGCA TCCATCCTTC CTCCAGCAAG CCCTGCTAGC
1741 CACATGAGGA ACAAGTTTCC GTGTCTTCTG CCTTCCTCTT GGGGAAAGGT GCCTTGTTGT
1801 GATGAATTAA CTCACTGTTA GGGCAGGGTG GAGAATGGTA CTCCTTCCTT CTCCTGTCCA
1861 CTGTGGGGGA AGCTTGGCAG GTATATTATA TTTCATCATT TAGGAGGCTG GCATGACCAG
1921 GACTTATGGG TGGGAGGGGA GCATTTTTAG TGAAGCAAGA AAGGAGTTTG CCAAGAAGTG
1981 ATCTGTTTTA AAGGTCATAT TTGGAGAAAG GGCAAGGAAT TGGGTCTGCT TTATTTTTGG
2041 GGGTATTTTG TTTTTGTTCT CACCTGCTGC CCCCCCACCC CACCACCCCA GGGATAAATT
2101 GGATATAAAC ACTAAATACT AATCAGTTGA ACTTAACATT TAATAAAAAG AAAGGGTGAA
2161 ATAAACTGAA GACCATTTTA GAACTAGTCA GTTCTCTGCA GCAAAGGGAA CAGGAGCCAT
2221 TTGAACCCTC TGGGACCCCT CACCCCACTG CTTCAGGGTG CTAGGCTGAG GGATGTTTTT
2281 CCTCCCCCTT ACCGCCCATG CCCTTGAAAG AAAAGTCACT TTTTGTGGAG GGCATCATTC
2341 ATTCCTGATT CACAAACCCC AAAAACCTCT GGTGGGAGAT AGGAAGATAG GGCGTGGGCC
2401 TGGGCCTTAA CCTCAATCTT GTGTCTGCCT CAGTCTTTTC TGACTGGCCC TGAAGTTGTC
2461 AGTGGCTCTT TCTGTCCTTC AGCCCCTGGA AGGTGCTCCA GGATAACAAA GAAGGGCAGG
2521 TTGAAGCCCC TCATGGAAGG AGCTGGCTTT GTGGGGCTGC AAAGGACTTT TAAGTCCTGC
2581 CTGTACTGAA GTTCACAGCC CACCTGACTG AGCAGACTCT TCCTGTTCCT TTCTCTACCA
2641 CCCTTGCCTT CCCAGGACTG CACGGTTTAA CACAGCAGAG TACAGAAGGG TGAAGAAGTG
2701 AGCAGAGGCT TATGAAGATA TTCAGATACT CTTCTATGCC AGGAAGCACA AAGACTTTGT
2761 TGAGATTTGC CTCAGTTCAG TAGATCTTCC TTGGCAGCCA GCCATAGGTT GTTTCTTTGT
2821 CTTCCGGGTC CTAAAGAGCA CAGAGAAAAT GGAGGTCCCC AGTCTAGGTA GGAAGCTGAT
2881 TGGATGAGGA CTTCTTTTTT TCCGACAGCA GGATGGGGCT CTTGGGCTCC ACACACCAGA
2941 TGCTTTGGTT TTCTACAACT GTTGCTATGT GTAGAGGGTG CTCAGAGCGT GGCATGAGAG
3001 CAAGGAGACC ATGGCTACTC TTTGAAATGG ATGGGGAAAA TTAGCTTAAA AATTTAATCA
3061 CGAGATTGCG CCACTGCACT CCAGCCTGGG CGACAGAGCC AGACTCCGTC TCAAAAAAAA
3121 AAAAAAAAAA AAAA
B:核苷酸序列(SEQ ID NO:14)长度:394个氨基酸
1 MPIPPPPPPP PGPPPPPTFH QANTEQPKLS RDEQRGRGAL LQDICKGTKL KKVTNINDRS
61 APILEKPKGS SGGYGSGGAA LQPKGGLFQG GVLKLRPVGA KDGSENLAGK PALQIPSSRA
121 AAPRPPVSAA SGRPQDDTDS SRASLPELPR MQRPSLPDLS RPNTTSSTGM KHSSSAPPPP
181 PPGRRANAPP TPLPMHSSKA PAYNREKPLP PTPGQRLHPG REGPPAPPPV KPPPSPVNIR
241 TGPSGQSLAP PPPPYRQPPG VPNGPSSPTN ESAPELPQRH NSLHRKTPGP VRGLAPPPPT
301 SASPSLLSNR PPPPARDPPS RGAAPPPPPP VIRNGARDAP PPPPPYRMHG SEPPSRGKPP
361 PPPSRTPAGP PPSSSTAPEE WPQRFYHHCP VFLG
C.核苷酸及氨基酸组合序列(SEQ ID NO.15)克隆号:PP10631
起始编码子:165 ATG 终止编码子:1347 TGA 蛋白质分子量:41006.14
1 GG GCG AGC AGG ACA GGA CGA AGC CGG AGT GTA GGC GGC AGA GGA TTC 47
48 GCT CCC AGA GCA GCT GCG GCC AGG TCG GAA AGA GGC CGG GGC GGC TGG 95
96 GTA TAT GAA TGA CCT AAA GGT ACA AAT AAA GAC GGA GAG AGA ACA GTG 143
144 CCA ACT GGG AGC AGG GCA AGA ATG CCA ATT CCT CCT CCC CCG CCA CCC 191
1 Met Pro Ile Pro Pro Pro Pro Pro Pro 9
192 CCA CCT GGT CCT CCT CCA CCT CCC ACA TTT CAT CAG GCA AAC ACA GAG 239
10 Pro Pro Gly Pro Pro Pro Pro Pro Thr Phe His Gln Ala Asn Thr Glu 25
240 CAG CCC AAG CTG AGT AGA GAT GAG CAG CGG GGT CGA GGC GCC CTC TTA 287
26 Gln Pro Lys Leu Ser Arg Asp Glu Gln Arg Gly Arg Gly Ala Leu Leu 41
288 CAG GAC ATT TGC AAA GGG ACC AAG CTG AAG AAG GTG ACC AAC ATT AAT 335
42 Gln Asp Ile Cys Lys Gly Thr Lys Leu Lys Lys Val Thr Asn Ile Asn 57
336 GAT CGG AGT GCT CCC ATC CTC GAG AAG CCG AAA GGA AGC AGT GGT GGC 383
58 Asp Arg Ser Ala Pro Ile Leu Glu Lys Pro Lys Gly Ser Ser Gly Gly 73
384 TAT GGC TCT GGA GGA GCT GCC CTG CAG CCC AAG GGA GGT CTC TTC CAA 431
74 Tyr Gly Ser Gly Gly Ala Ala Leu Gln Pro Lys Gly Gly Leu Phe Gln 89
432 GGA GGA GTG CTG AAG CTT CGA CCT GTG GGA GCC AAG GAT GGT TCA GAG 479
90 Gly Gly Val Leu Lys Leu Arg Pro Val Gly Ala Lys Asp Gly Ser Glu 105
480 AAC CTA GCT GGT AAG CCA GCC CTG CAA ATC CCC AGT TCT CGA GCT GCT 527
106 Asn Leu Ala Gly Lys Pro Ala Leu Gln Ile Pro Ser Ser Arg Ala Ala 121
528 GCC CCA AGG CCT CCA GTA TCT GCC GCC AGC GGG CGT CCT CAG GAT GAT 575
122 Ala Pro Arg Pro Pro Val Ser Ala Ala Ser Gly Arg Pro Gln Asp Asp 137
576 ACA GAC AGC AGC CGG GCC TCA CTC CCA GAA CTG CCC CGG ATG CAG AGA 623
138 Thr Asp Ser Ser Arg Ala Ser Leu Pro Glu Leu Pro Arg Met Gln Arg 153
624 CCC TCT TTA CCG GAC CTC TCT CGG CCT AAT ACC ACC AGC AGT ACG GGC 671
154 Pro Ser Leu Pro Asp Leu Ser Arg Pro Asn Thr Thr Ser Ser Thr Gly 169
672 ATG AAG CAC AGC TCC TCT GCC CCT CCC CCA CCA CCC CCA GGG CGG CGT 719
170 Met Lys His Ser Ser Ser Ala Pro Pro Pro Pro Pro Pro Gly Arg Arg 185
720 GCC AAC GCA CCC CCC ACA CCT CTG CCT ATG CAC AGC AGC AAA GCC CCC 767
186 Ala Asn Ala Pro Pro Thr Pro Leu Pro Met His Ser Ser Lys Ala Pro 201
768 GCC TAC AAC AGA GAG AAA CCC TTG CCA CCG ACG CCT GGA CAA AGG CTT 815
202 Ala Tyr Asn Arg Glu Lys Pro Leu Pro Pro Thr Pro Gly Gln Arg Leu 217
816 CAC CCT GGT CGA GAG GGA CCT CCT GCT CCA CCC CCA GTC AAA CCA CCT 863
218 His Pro Gly Arg Glu Gly Pro Pro Ala Pro Pro Pro Val Lys Pro Pro 233
864 CCT TCC CCT GTG AAT ATC AGA ACA GGA CCA AGT GGC CAG TCT CTG GCT 911
234 Pro Ser Pro Val Asn Ile Arg Thr Gly Pro Ser Gly Gln Ser Leu Ala 249
912 CCT CCT CCT CCG CCT TAC CGC CAG CCT CCT GGG GTC CCC AAT GGA CCC 959
250 Pro Pro Pro Pro Pro Tyr Arg Gln Pro Pro Gly Val Pro Asn Gly Pro 265
960 TCT AGC CCC ACT AAT GAG TCA GCC CCT GAG CTG CCA CAG AGA CAC AAT 1007
266 Ser Ser Pro Thr Asn Glu Ser Ala Pro Glu Leu Pro Gln Arg His Asn 281
1008 TCT TTG CAT AGG AAG ACA CCA GGG CCT GTC AGA GGC CTA GCA CCT CCT 1055
282 Ser Leu His Arg Lys Thr Pro Gly Pro Val Arg Gly Leu Ala Pro Pro 297
1056 CCA CCC ACC TCG GCC TCC CCA TCT TTA CTG AGT AAT AGG CCA CCT CCC 1103
298 Pro Pro Thr Ser Ala Ser Pro Ser Leu Leu Ser Asn Arg Pro Pro Pro 313
1104 CCA GCC CGA GAC CCT CCC AGT CGG GGA GCA GCT CCT CCA CCC CCA CCA 1151
314 Pro Ala Arg Asp Pro Pro Ser Arg Gly Ala Ala Pro Pro Pro Pro Pro 329
1152 CCT GTG ATC CGA AAT GGT GCC AGG GAT GCT CCC CCT CCC CCA CCA CCA 1199
330 Pro Val Ile Arg Asn Gly Ala Arg Asp Ala Pro Pro Pro Pro Pro Pro 345
1200 TAC CGA ATG CAT GGG TCA GAA CCC CCG AGC CGA GGA AAG CCC CCA CCT 1247
346 Tyr Arg Met His Gly Ser Glu Pro Pro Ser Arg Gly Lys Pro Pro Pro 361
1248 CCA CCC TCA AGG ACG CCA GCT GGG CCA CCC CCC TCC TCT TCC ACC GCC 1295
362 Pro Pro Ser Arg Thr Pro Ala Gly Pro Pro Pro Ser Ser Ser Thr Ala 377
1296 CCT GAG GAA TGG CCA CAG AGA TTC TAT CAC CAC TGT CCG GTC TTT CTT 1343
378 Pro Glu Glu Trp Pro Gln Arg Phe Tyr His His Cys Pro Val Phe Leu 393
1344 GGA TGA TTT TGA GTC AAA GTA TTC CTT CCA TCC AGT AGA AGA CTT TCC 1391
394 Gly *** 395
1392 TGC TCC AGA AGA ATA TAA ACA CTT TCA GAG GAT ATA TCC CAG CAA AAC 1439
1440 AAA CCG AGC TGC CCG TGG AGC CCC ACC TCT GCC ACC CAT TCT CAG GTG 1487
1488 AAG CCT GGC TTG GTC CCG TTC CTC AGG AAA AGG ATG GAC CTT CTC TTC 1535
1536 TTC TCA GAT GGT CCC TTC CAT TCC CCT GAA ACC TGC ATG AGA GCT CCT 1583
1584 AAC ATG TTT CTC CAA TGC AAT CAA GCC CTA GAC TCC AAA TGT CCT CCC 1631
1632 AGC TCA CCT CCA TCT ATG CAT CTC ATC TCT GGA TTT GGT GAT CAG ACT 1679
1680 CTA TAT TGA CAG TAG GAT CTC AAA CCC TGC ATC CAT CCT TCC TCC AGC 1727
1728 AAG CCC TGC TAG CCA CAT GAG GAA CAA GTT TCC GTG TCT TCT GCC TTC 1775
1776 CTC TTG GGG AAA GGT GCC TTG TTG TGA TGA ATT AAC TCA CTG TTA GGG 1823
1824 CAG GGT GGA GAA TGG TAC TCC TTC CTT CTC CTG TCC ACT GTG GGG GAA 1871
1872 GCT TGG CAG GTA TAT TAT ATT TCA TCA TTT AGG AGG CTG GCA TGA CCA 1919
1920 GGA CTT ATG GGT GGG AGG GGA GCA TTT TTA GTG AAG CAA GAA AGG AGT 1967
1968 TTG CCA AGA AGT GAT CTG TTT TAA AGG TCA TAT TTG GAG AAA GGG CAA 2015
2016 GGA ATT GGG TCT GCT TTA TTT TTG GGG GTA TTT TGT TTT TGT TCT CAC 2063
2064 CTG CTG CCC CCC CAC CCC ACC ACC CCA GGG ATA AAT TGG ATA TAA ACA 2111
2112 CTA AAT ACT AAT CAG TTG AAC TTA ACA TTT AAT AAA AAG AAA GGG TGA 2159
2160 AAT AAA CTG AAG ACC ATT TTA GAA CTA GTC AGT TCT CTG CAG CAA AGG 2207
2208 GAA CAG GAG CCA TTT GAA CCC TCT GGG ACC CCT CAC CCC ACT GCT TCA 2255
2256 GGG TGC TAG GCT GAG GGA TGT TTT TCC TCC CCC TTA CCG CCC ATG CCC 2303
2304 TTG AAA GAA AAG TCA CTT TTT GTG GAG GGC ATC ATT CAT TCC TGA TTC 2351
2352 ACA AAC CCC AAA AAC CTC TGG TGG GAG ATA GGA AGA TAG GGC GTG GGC 2399
2400 CTG GGC CTT AAC CTC AAT CTT GTG TCT GCC TCA GTC TTT TCT GAC TGG 2447
2448 CCC TGA AGT TGT CAG TGG CTC TTT CTG TCC TTC AGC CCC TGG AAG GTG 2495
2496 CTC CAG GAT AAC AAA GAA GGG CAG GTT GAA GCC CCT CAT GGA AGG AGC 2543
2544 TGG CTT TGT GGG GCT GCA AAG GAC TTT TAA GTC CTG CCT GTA CTG AAG 2591
2592 TTC ACA GCC CAC CTG ACT GAG CAG ACT CTT CCT GTT CCT TTC TCT ACC 2639
2640 ACC CTT GCC TTC CCA GGA CTG CAC GGT TTA ACA CAG CAG AGT ACA GAA 2687
2688 GGG TGA AGA AGT GAG CAG AGG CTT ATG AAG ATA TTC AGA TAC TCT TCT 2735
2736 ATG CCA GGA AGC ACA AAG ACT TTG TTG AGA TTT GCC TCA GTT CAG TAG 2783
2784 ATC TTC CTT GGC AGC CAG CCA TAG GTT GTT TCT TTG TCT TCC GGG TCC 2831
2832 TAA AGA GCA CAG AGA AAA TGG AGG TCC CCA GTC TAG GTA GGA AGC TGA 2879
2880 TTG GAT GAG GAC TTC TTT TTT TCC GAC AGC AGG ATG GGG CTC TTG GGC 2927
2928 TCC ACA CAC CAG ATG CTT TGG TTT TCT ACA ACT GTT GCT ATG TGT AGA 2975
2976 GGG TGC TCA GAG CGT GGC ATG AGA GCA AGG AGA CCA TGG CTA CTC TTT 3023
3024 GAA ATG GAT GGG GAA AAT TAG CTT AAA AAT TTA ATC ACG AGA TTG CGC 3071
3072 CAC TGC ACT CCA GCC TGG GCG ACA GAG CCA GAC TCC GTC TCA AAA AAA 3119
3120 AAA AAA AAA AAA AAA 3134
6.PP10752
A:核苷酸序列(SEQ ID NO:16)长度:1528个碱基
1 GCAGGAGGGT AGCCTCCATG CGTAGCCACC CCACCTGGCA GTGGTGGTGC CAGTCGGGCA
61 TGGAGTCCCT CCACTCGCTG ACCTCCTCCT GCACGGCGCA TAGCTCCTGC TGCAAGAAGC
121 GCCACATGTT GGCCAGGTTG AAGCCATTGA CCCAGTTGTG GTTGATGGAG ATGGTGTCAT
181 CCTGGAAGGG GCACAGTGCA GGCAGGCCTG AGCCCATGGC AGGTGCCCCC TGACCAACCC
241 ACATCTCCTG CGCCAGGAAC CCACTGTGGG GTCCAGCCCT CTGCAGCCAA GAGGGCCCTC
301 CTGTCTCCCA GCAGGGCTTG CTCAGCAGGG AAGTGGGTGG CGGGCTCGGA CCACCTCAGG
361 CCACAGTGAA CCCAGAGCAA GTAGACCCAG GGACCGGCAG TGGGTGAAAC AGAGGCTAGG
421 CCTCAGCGAC ACCACCTTGT GAAGGGGTCA GCCTCACCCA TGAGCCACCC CATTCCAGCC
481 CAGCTCTGGC TGGGAGAGTG GGGAGGTGGT GCTGCCGTCT TCCTGCAGGA AGGCCCCTGA
541 TAGGGGGCAG GAGAAGCAGC ACATTACCAG GTTGTGCACC TGGTGGTGCC AGCCACTGGG
601 CACAAACACC ATCTCGCCCG CTTCCTGCGT GATCTCCAAG GGTGGGCCAG CAAGCTGGTT
661 CCGTGGGTGC AGGTGTGTGT CGCAGAGTGC TGGGGAGGTC ACGTCGTAGG GCAGGTTGCC
721 GTGGCGGTCC CGCAGCCTCT TCCTGCCCTG GGGGGAAGAG GAGCCACTTC TTCCTCCCAC
781 AGACATTGAC AGACCAGCTG AAGGAGCGGA AGATGTCAGC ATGGAACGGG GACCTGCGGC
841 ACAAGAGCGC CTGGTTCATG CCTGTAGGGG CTGGTATGGG CTTTGCTTGG CACCCCAGAG
901 GCCTGGTCCA ACTGAAGGAG GGGTGGCCCC TTGGTCTCAA GGGATGGCAC CCACTGTGAG
961 GCCTGTGCCA AGCAGCCCCC CTCCTGCCAC CCTGGGCCTC CCAGTCTGTT CTGTCACCAG
1021 GCCCCTTCGG TTCCACTCCC ACATCCGTGG CCTCACCAGC TGCCCGCAGG CCCCGCGTAG
1081 ACAAAGCGGT AGTCATCCAC ATCCAGTGCA TCCCAGAACT CATTCAGCCA GTCGGACGAG
1141 AAGTACACAG GCAGGGTGAA AACGTCCTCC ACCGGAAAGT CCCTGTGAGG AGGGCGCAAG
1201 GGCACCACCG ACAGCACGTG AGGCACGAGG AGACTAGGGC AGCACGAGTG GGGCAACTGA
1261 GACCAATCGG CTCCAGTGGA GCTTCCAGAT GGCTGCAGCC CCCAAAGAGC CCCAGACCCT
1321 CCTCTGAGCC AGACGCTGCT GGCGGGGGAG GGGGCGGGGC AGTCTGACTA CAATGGTTCT
1381 GCTTATTAGA AAGTACTGAT CATGCCTATA ATCCCAGTGC TTTGAGATGC TGAGGTGGAT
1441 GCATCACCTG AGCTCAGGAG TTCAAGACCA GCCTGGGCAA CATGGTGAAA CCTAGTCTCT
1501 TTAAAAAAAA AAAAAAAAAA AAAAAAAA
B:核苷酸序列(SEQ ID NO:17)长度:112个氨基酸
1 MERGPAAQER LVHACRGWYG LCLAPQRPGP TEGGVAPWSQ GMAPTVRPVP SSPPPATLGL
61 PVCSVTRPLR FHSHIRGLTS CPQAPRRQSG SHPHPVHPRT HSASRTRSTQ AG
C.核苷酸及氨基酸组合序列(SEQ ID NO:18)克隆号:PP10752
起始编码子:821 ATG 终止编码子:1157 TGA 蛋白质分子量:11974.04
1 G CAG GAG GGT AGC CTC CAT GCG TAG CCA CCC CAC CTG GCA GTG GTG 46
47 GTG CCA GTC GGG CAT GGA GTC CCT CCA CTC GCT GAC CTC CTC CTG CAC 94
95 GGC GCA TAG CTC CTG CTG CAA GAA GCG CCA CAT GTT GGC CAG GTT GAA 142
143 GCC ATT GAC CCA GTT GTG GTT GAT GGA GAT GGT GTC ATC CTG GAA GGG 190
191 GCA CAG TGC AGG GAG GCC TGA GCC CAT GGC AGG TGC CCC CTG ACC AAC 238
239 CCA CAT CTC CTG CGC CAG GAA CCC ACT GTG GGG TCC AGC CCT CTG CAG 286
287 CCA AGA GGG CCC TCC TGT CTC CCA GCA GGG CTT GCT CAG CAG GGA AGT 334
335 GGG TGG CGG GCT CGG ACC ACC TCA GGC CAC AGT GAA CCC AGA GCA AGT 382
383 AGA CCC AGG GAC CGG CAG TGG GTG AAA CAG AGG CTA GGC CTC AGC GAC 430
431 ACC ACC TTG TGA AGG GGT CAG CCT CAC CCA TGA GCC ACC CCA TTC CAG 478
479 CCC AGC TCT GGC TGG GAG AGT GGG GAG GTG GTG CTG CCG TCT TCC TGC 526
527 AGG AAG GCC CCT GAT AGG GGG CAG GAG AAG CAG CAC ATT ACC AGG TTG 574
575 TGC ACC TGG TGG TGC CAG CCA CTG GGC ACA AAC ACC ATC TCG CCC GCT 622
623 TCC TGC GTG ATC TCC AAG GGT GGG CCA GCA AGC TGG TTC CGT GGG TGC 670
671 AGG TGT GTG TCG CAG AGT GCT GGG GAG GTC ACG TCG TAG GGC AGG TTG 718
719 CCG TGG CGG TCC CGC AGC CTC TTC CTG CCC TGG GGG GAA GAG GAG CCA 766
767 CTT CTT CCT CCC ACA GAC ATT GAC AGA CCA GCT GAA GGA GCG GAA GAT 814
815 GTC AGC ATG GAA CGG GGA CCT GCG GCA CAA GAG CGC CTG GTT CAT GCC 862
1 Met Glu Arg Gly Pro Ala Ala Gln Glu Arg Leu Val His Ala 14
863 TGT AGG GGC TGG TAT GGG CTT TGC TTG GCA CCC CAG AGG CCT GGT CCA 910
15 Cys Arg Gly Trp Tyr Gly Leu Cys Leu Ala Pro Gln Arg Pro Gly Pro 30
911 ACT GAA GGA GGG GTG GCC CCT TGG TCT CAA GGG ATG GCA CCC ACT GTG 958
31 Thr Glu Gly Gly Val Ala Pro Trp Ser Gln Gly Met Ala Pro Thr Val 46
959 AGG CCT GTG CCA AGC AGC CCC CCT CCT GCC ACC CTG GGC CTC CCA GTC 1006
47 Arg Pro Val Pro Ser Ser Pro Pro Pro Ala Thr Leu Gly Leu Pro Val 62
1007 TGT TCT GTC ACC AGG CCC CTT CGG TTC CAC TCC CAC ATC CGT GGC CTC 1054
63 Cys Ser Val Thr Arg Pro Leu Arg Phe His Ser His Ile Arg Gly Leu 78
1055 ACC AGC TGC CCG CAG GCC CCG CGT AGA CAA AGC GGT AGT CAT CCA CAT 1102
79 Thr Ser Cys Pro Gln Ala Pro Arg Arg Gln Ser Gly Ser His Pro His 94
1103 CCA GTG CAT CCC AGA ACT CAT TCA GCC AGT CGG ACG AGA AGT ACA CAG 1150
95 Pro Val His Pro Arg Thr His Ser Ala Ser Arg Thr Arg Ser Thr Gln 110
1151 GCA GGG TGA AAA CGT CCT CCA CCG GAA AGT CCC TGT GAG GAG GGC GCA 1198
111 Ala Gly *** 113
1199 AGG GCA CCA CCG ACA GCA CGT GAG GCA CGA GGA GAC TAG GGC AGC ACG 1246
1247 AGT GGG GCA ACT GAG ACC AAT CGG CTC CAG TGG AGC TTC CAG ATG GCT 1294
1295 GCA GCC CCC AAA GAG CCC CAG ACC CTC CTC TGA GCC AGA CGC TGC TGG 1342
1343 CGG GGG AGG GGG CGG GGC AGT CTG ACT ACA ATG GTT CTG CTT ATT AGA 1390
1391 AAG TAC TGA TCA TGC CTA TAA TCC CAG TGC TTT GAG ATG CTG AGG TGG 1438
1439 ATG CAT CAC CTG AGC TCA GGA GTT CAA GAC CAG CCT GGG CAA CAT GGT 1486
1487 GAA ACC TAG TCT CTT TAA AAA AAA AAA AAA AAA AAA AAA AAA 1528
7.PPl0881
A:核苷酸序列(SEQ ID NO:19)长度:2100个碱基
1 GCCACTATGT CTGGCTGAGT ATGTCTCTTT TAGATTGTTT TATTTTGAGA ACTTCTGAAA
61 CCATGTCAGA GACTGCTGAT GCTGTAGATG ATACTATATT ATTCAAGTCT TGATTATCTG
121 CTGTGAGTTT TCATGAATAA TTCACCTTTT TCATGCACGA CACAGAACTT GTTGGTAACA
181 GCACTCCAGT GTCGAACATG TCATTAATTC ATGTGCTAAA TCTCTTTTGG TCCACCATGA
241 TACTGTTTCA AATTAACAAC CTATGTGAGC TGGGGAAGTT GCACAGATTC TCATTTAGCC
301 TGTTCTGACT GAAGGGAAAA CTAACAAGCT TTCTGCAGTA TAGTAGCTGA AGTTTTCCCT
361 GGTCAAACAT CATATCCTTC CCCAAAACAT ATTCAGGTAA TGTGGATGCA AGTACTTCCA
421 AGATTCATTC AAACATACTA ATTTTCATCC AAATTTTAAT TTAATCCTAT CAGCCATTTC
481 ATCCTCATAT CCTGTCTTTC TAGTTATTGC CTCTGCTAGG ATTTTACCAA TAGGTTTTGG
541 AATCAGAGGC ACTGAATTCT ATGTCAGGAA CCCCTGGAAG GTTTCTTTTT TACCTTCTAT
601 TGTACCTACA GGTGTGCATA TGGCCTTCAG TCCCTACTAG GAGATTAGTT AAAAGAAAGC
661 CCTGGTTCTG TGTCAGTCCT CATCCTGATT AATTTGGTAG CCCATCACCT CTGATGATTT
721 GAACTGAGGT TCTTCATTGT CATTTTTGCT TCCCAGCTTG GTGCATTCTT TGAAATTAGG
781 GTGCATAGAG TGTTTGTTTA GGGCCCTTCA GTGTTGGGGG ACTAAGAGGC GCTCCCATTG
841 GTAAACCTAA CTTCTGATAG TGCAGCATTA AGACCTTTGT GTTAACATCA GTGTCCATTT
901 TATTCATCCC ATCTCTTAGT AACCGTTTAA AACTTCATCC TGCTTGGGAC TTCGTTGACT
961 ATCTGTTTTG TGTTACCCAT TCACTTGTGA TTCAGTCTTA TTTTCTTAGC ATCTGTAAGA
1021 CCCATATTAA GAAGCTGAGA CAACAAATCT GACACATTTC TTGGACCATT GATAGATTTT
1081 GCAGCAGTTA TATCAGATGC CTGCCTAGCG GGGCCCCTTC AGTCACAGTA TTTACCATGA
1141 TTTAAAGGGC ATATTAAGGA TGAACAAACA TCCTGATGAC CATGAAGTTA ATCCAGCATG
1201 GTTTGCATAT GCAGCTTACC AGCTTTGTCA TCTATGGAGG AGTGCCACTT GGCATTTAAA
1261 GGAGGGGAAG GACCATTTCC CTTTTCAGGG TAAACAAATT TTACAGTGGC TTTTACCCAG
1321 TCCACCAGAC TAGCTGTCCC TTTAGGAACA ATCTATTGTG TGTTTGGATC ATGTACAACA
1381 ATCCATGATT GTTCAGTAAT AAGGTTCCTG CATCAACCCC AAGCAGACTT CTTCATTCTG
1441 CAACATTCAG AATCAAAGAT ACTGCTCCCA AGTTAGTCAC TCTCACAATC TATTTTCTTA
1501 AATGTTTTTC AGGAACCCGA TGAATACCAG TTCACAAGGC AAGATAACTC CTTCACACAT
1561 AACCCCTGCT TCCAGTACTG TCTTGGTTTT GTCACCCACC ATTTGGACAA TGTTCCTGGT
1621 GGTCAAAGGC CATAGATATA CTGTCTGTTT TTTTCAGCAT AATTTTCCAT TGGGTTTATC
1681 CTGGAGGCTA ACAGCCATAG CTCAAGCTAA CCAAAATCCA AGCTTTTTGA GCATCAGGAT
1741 TTCCTTAACA CTCTCTCTTA CTTTCATTTT AGCTGTTTTA AAATACAGCA GACTGGGCCA
1801 GGCGCAGTGG CTCACATTGG TAATCCCAGT ACGTTGGGAG GCCAAGTCGG GCAGATCACT
1861 TGAGGCCAGG AGTTTGAGAC CAGCCTGACC AACATGGTGA AACCCTGTCT CCACTAAAAA
1921 TACAAAAAAT TAGCTTGGCT TGGTGGCATG CGCCTGTAAT CCCAGCTACT TGAGGGGCTG
1981 AGGCAGGAGA ATCACTGGAA CCCAGGAGGC AGAGGTTGCA GTGATCTGAG ATCATGCCAC
2041 TGTACTCCAG CCTGGGAGAC ACAGCGAGAC TCCCTCTCAA AAAAAAAAAA AAAAAAAAAA
B:核苷酸序列(SEQ ID NO:20)长度:128个氨基酸
1 MFFRNPMNTS SQGKITPSHI TPASSTVLVL SPTIWTMFLV VKGHRYTVCF FQHNFPLGLS
61 WRLTAIAQAN QNPSFLSIRI SLTLSLTFIL AVLKYSRLGQ AQWLTLVIPV RWEAKSGRSL
121 EARSLRPA
C.核苷酸及氨基酸组合序列(SEQ ID NO:21)克隆号:PPl0881
起始编码子:1502 ATG 终止编码子:1886 TGA 蛋白质分子量:14432.15
1 G CCA CTA TGT CTG GCT GAG TAT GTC TCT TTT AGA TTG TTT TAT TTT 46
47 GAG AAC TTC TGA AAC CAT GTC AGA GAC TGC TGA TGC TGT AGA TGA TAC 94
95 TAT ATT ATT CAA GTC TTG ATT ATC TGC TGT GAG TTT TCA TGA ATA ATT 142
143 CAC CTT TTT CAT GCA CGA CAC AGA ACT TGT TGG TAA CAG CAC TCC AGT 190
191 GTC GAA CAT GTC ATT AAT TCA TGT GCT AAA TCT CTT TTG GTC CAC CAT 238
239 GAT ACT GTT TCA AAT TAA CAA CCT ATG TGA GCT GGG GAA GTT GCA CAG 286
287 ATT CTC ATT TAG CCT GTT CTG ACT GAA GGG AAA ACT AAC AAG CTT TCT 334
335 GCA GTA TAG TAG CTG AAG TTT TCC CTG GTC AAA CAT CAT ATC CTT CCC 382
383 CAA AAC ATA TTC AGG TAA TGT GGA TGC AAG TAC TTC CAA GAT TCA TTC 430
431 AAA CAT ACT AAT TTT CAT CCA AAT TTT AAT TTA ATC CTA TCA GCC ATT 478
479 TCA TCC TCA TAT CCT GTC TTT CTA GTT ATT GCC TCT GCT AGG ATT TTA 526
527 CCA ATA GGT TTT GGA ATC AGA GGC ACT GAA TTC TAT GTC AGG AAC CCC 574
575 TGG AAG GTT TCT TTT TTA CCT TCT ATT GTA CCT ACA GGT GTG CAT ATG 622
623 GCC TTC AGT CCC TAC TAG GAG ATT AGT TAA AAG AAA GCC CTG GTT CTG 670
671 TGT CAG TCC TCA TCC TGA TTA ATT TGG TAG CCC ATC ACC TCT GAT GAT 718
719 TTG AAC TGA GGT TCT TCA TTG TCA TTT TTG CTT CCC AGC TTG GTG CAT 766
767 TCT TTG AAA TTA GGG TGC ATA GAG TGT TTG TTT AGG GCC CTT CAG TGT 814
815 TGG GGG ACT AAG AGG CGC TCC CAT TGG TAA ACC TAA CTT CTG ATA GTG 862
863 CAG CAT TAA GAC CTT TGT GTT AAC ATC AGT GTC CAT TTT ATT CAT CCC 910
911 ATC TCT TAG TAA CCG TTT AAA ACT TCA TCC TGC TTG GGA CTT CGT TGA 958
959 CTA TCT GTT TTG TGT TAC CCA TTC ACT TGT GAT TCA GTC TTA TTT TCT 1006
1007 TAG CAT CTG TAA GAC CCA TAT TAA GAA GCT GAG ACA ACA AAT CTG ACA 1054
1055 CAT TTC TTG GAC CAT TGA TAG ATT TTG CAG CAG TTA TAT CAG ATG CCT 1102
1103 GCC TAG CGG GGC CCC TTC AGT CAC AGT ATT TAC CAT GAT TTA AAG GGC 1150
1151 ATA TTA AGG ATG AAC AAA CAT CCT GAT GAC CAT GAA GTT AAT CCA GCA 1198
1199 TGG TTT GCA TAT GCA GCT TAC CAG CTT TGT CAT CTA TGG AGG AGT GCC 1246
1247 ACT TGG CAT TTA AAG GAG GGG AAG GAC CAT TTC CCT TTT CAG GGT AAA 1294
1295 CAA ATT TTA CAG TGG CTT TTA CCC AGT CCA CCA GAC TAG CTG TCC CTT 1342
1343 TAG GAA CAA TCT ATT GTG TGT TTG GAT CAT GTA CAA CAA TCC ATG ATT 1390
1391 GTT CAG TAA TAA GGT TCC TGC ATC AAC CCC AAG CAG ACT TCT TCA TTC 1438
1439 TGC AAC ATT CAG AAT CAA AGA TAC TGC TCC CAA GTT AGT CAC TCT CAC 1486
1487 AAT CTA TTT TCT TAA ATG TTT TTC AGG AAC CCG ATG AAT ACC AGT TCA 1534
1 Met Phe Phe Arg Asn Pro Met Asn Thr Ser Ser 11
1535 CAA GGC AAG ATA ACT CCT TCA CAC ATA ACC CCT GCT TCC AGT ACT GTC 1582
12 Gln Gly Lys Ile Thr Pro Ser His Ile Thr Pro Ala Ser Ser Thr Val 27
1583 TTG GTT TTG TCA CCC ACC ATT TGG ACA ATG TTC CTG GTG GTC AAA GGC 1630
28 Leu Val Leu Ser Pro Thr Ile Trp Thr Met Phe Leu Val Val Lys Gly 43
1631 CAT AGA TAT ACT GTC TGT TTT TTT CAG CAT AAT TTT CCA TTG GGT TTA 1678
44 His Arg Tyr Thr Val Cys Phe Phe Gln His Asn Phe Pro Leu Gly Leu 59
1679 TCC TGG AGG CTA ACA GCC ATA GCT CAA GCT AAC CAA AAT CCA AGC TTT 1726
60 Ser Trp Arg Leu Thr Ala Ile Ala Gln Ala Asn Gln Asn Pro Ser Phe 75
1727 TTG AGC ATC AGG ATT TCC TTA ACA CTC TCT CTT ACT TTC ATT TTA GCT 1774
76 Leu Ser Ile Arg Ile Ser Leu Thr Leu Ser Leu Thr Phe Ile Leu Ala 91
1775 GTT TTA AAA TAC AGC AGA CTG GGC CAG GCG CAG TGG CTC ACA TTG GTA 1822
92 Val Leu Lys Tyr Ser Arg Leu Gly Gln Ala Gln Trp Leu Thr Leu Val 107
1823 ATC CCA GTA CGT TGG GAG GCC AAG TCG GGC AGA TCA CTT GAG GCC AGG 1870
108 Ile Pro Val Arg Trp Glu Ala Lys Ser Gly Arg Ser Leu Glu Ala Arg 123
1871 AGT TTG AGA CCA GCC TGA CCA ACA TGG TGA AAC CCT GTC TCC ACT AAA 1918
124 Ser Leu Arg Pro Ala *** 129
1919 AAT ACA AAA AAT TAG CTT GGC TTG GTG GCA TGC GCC TGT AAT CCC AGC 1966
1967 TAC TTG AGG GGC TGA GGC AGG AGA ATC ACT GGA ACC CAG GAG GCA GAG 2014
2015 GTT GCA GTG ATC TGA GAT CAT GCC ACT GTA CTC CAG CCT GGG AGA CAC 2062
2063 AGC GAG ACT CCC TCT CAA AAA AAA AAA AAA AAA AAA AA 2100
8. PP10897
A:核苷酸序列(SEQ ID NO:22)长度:2362个碱基
1 GCATGAATCA GGTAAGAAGC CAGACTGCTG AGGCAGAGTA GGGGGGAAGG AGGCACAAGG
61 GCCTTGCACT CCAGCAAAGA TGGTAGAGAT GGGGAAGCAT TCGGGCTGGA CAGGAGAGAC
121 CCAGGTTCCA GGCGCAGTGT GAAGCCTCAG CAGACCCCAG TTTCAGAGGT TTGAGGAAGG
181 AAAATCAACA GACACCCCGG GTATGAAGTA GGGGCCAGGT TGTGGGCTCT GCCTCTGGGG
241 ACAGGGCAGA TCCCTTCCTG CTTTATTTGT GAGCCACCTC AACAGGACCC AGGCCATCTG
301 CAGGTACTAG TGGCCTAGCT GGGTAGTCTT TCCTGAGGTC TCACCTCAGG CCTTTGTGCT
361 GCTGCTGTTG CTTCTGGCCT TGAGCCTGAG AGAGAGGTGA GAGGAAGGAT GCTTTCTCTA
421 ACTTGGGCTC CTCCAATCTC TGGTTGCAAA GCTGGGGTTG GGGGAGAGAG GACCACCCAA
481 CCTGCCCTGT ACAAGCATCA GTAAGACTCC AAGTTTCCCA GGGCCCGAAC ACTTGGGGGT
541 TGTCTCTCAA CACCCGGCTG GAAGACAAGT AGGTAACCAG GTTCAGCCCC ACCTGCCAAG
601 AACACTGTGT TTTGGGCCTG GCAGAGCTGC TACTCCCCCT CTCCCTCCTA AGAATGCCCA
661 GAGAATCACT TGCCAAGGCT ACTCCTGGAG CTCAGCTGTG GGATCAGGGT TTGGGCTGAG
721 GATCAGGTGC CTGTGTGCAC ACATGTGCAC ATTGTGTGTG CCAATGGGTG GTAGGGATTG
781 AGCCCGTTGT GAGAACATCC AGCCAGGTTG GAAGTGTGTA CAGGTATCTG AGGGTGTGCA
841 CGTGAGCAAG AGGGTGTGCA AGATGTGGGT GACTGTTGGG ACCACAGAGC TGAGGCCTGT
901 GGTCAGCTCA GGTCAGAACT GGGAGGTCTG TTTCCCTTGG GAGGACCTGT CTGCTCTGAG
961 GGGGACCCGG ACAAGTGCAC ATATGCATGT GTGTGTCTAC ACACACACAC ACACACACAC
1021 ACACACACAC ACACACATAT GCTTGCCTCC CTCTCCAAGG CAGACTTGCC TGGGAAGTAC
1081 CCCTCCTCAG CAGGAGCTCG AAGACCCCTG CCCAGTGCTG TTTTCAGTAG AGGGAGTGGA
1141 GCTGAGATGG GGAGACCGTA CTGAGCGGTC CAGGAGTAGG GAAACAGAGC TGCTTTGCAG
1201 CTTCTGTTCC AGAAGATGGG GGTTGGGGGG CGGGGTTGAG GGCCAGGGGT GGGAGCAGGA
1261 GCAGAACAGA AAGCCTCCCT GCTCACTGGC CTTTCCCCTT CCCTCACTGG CTGCCCATGG
1321 AGCCAGGATC AGCATGGGAA CAATCAAGGA GGCAGGGGCT TATCAGTACT ATGGACCCCT
1381 ACACTGCTCT GCCTGGTGGT TCTTCTCTTC GCATACCAAA GACAGAAATT AAGCCTCCAA
1441 GAGTGGTAAC TGACCTCGGT CACACTTGGT GGGTGTGGGA AAGGATTCAA ATGTAGGTCT
1501 GTTCTCTTCT TCATCTATCA TGGTCCCTGT CCTGGAGGCA AGTCGTCTGG GGCTCAGAAA
1561 ACACCCCTGT TGCCACTGAT TGGAATTCCA AGGGTCTGGG TGAAGTGGGG ATGGGCCTCC
1621 AGCTTGCCTC CAGCCTGAAA AAATAGTAGA GGGTGTTGAG GCTGGGAAGG GAGGTGGGGC
1681 TCATGTTGTA CAGGGCCTGA GCCAGGGAGC TTGGGCTTCA TTCTGAGTAC TGTGGCAGCC
1741 CTGGGAAGGT TTGTAGCACA GAGGGATATT GTCATTTTTG GAAAGATCCC TTTGGCTGCT
1801 TAGGTAGAGA AGGGCTTCAA GAGGGCAGGA AGGGACAGGA CTACAGAAGG GGCTGCTTCA
1861 GAGTCCAGAT TAAGGAAGGA GAGGCCTGGG CAGTCAGAAA GGAAGAGAAG CCGGATGTGG
1921 TGGCTTGTAT CTTCAATCCC AGCACTTTGA GAGGCCAAGG TGGGAGGATC ACTTGAGCCC
1981 AGGAGTTCAA AACCAGCTTG GGCAACATAG TGAGACTCCC ATCTCTCCAA AAAAATTTAA
2041 AAACCAGCCA GGTAGACTGG GCGCAGTGGC TCACGCCTGT AATCCCAGAA CTTTGGGAGG
2101 CCGAGGCAGG CAGATCACGA GGTCAAGAGT TAGAGACCAG CCTGACCAAC ATGGTGAAAC
2161 CCCGTCTCTA CTAAAAATAC AAAACTTAGC CAGGCCTGTG GTGATGCGCA CCTGTAGTCT
2221 CAGCTACTCA GGAGGCTGAG GCAGGAGAAT CGCTTGAACC CGGGAGGCAG AGGTTGCACT
2281 GAGCTGAGAT CACGCCACTG CACTCCAGCC TGGGCAACAG AGTGAGACTC CGTCTCAAAC
2341 AAAAAAAAAA AAAAAAAAAA AA
B:核苷酸序列(SEQ ID NO:23)长度:189个氨基酸
1 MWVTVGTTEL RPVVSSGQNW EVCFPWEDLS ALRGTRTSAH MHVCVYTHTH THTHTHTHIC
61 LPPSPRQTCL GSTPPQQELE DPCPVLFSVE GVELRWGDRT ERSRSRETEL LCSFCSRRWG
121 LGGGVEGQGW EQEQNRKPPC SLAFPLPSLA AHGARISMGT IKEAGAYQYY GPLHCSAWWF
181 FSSHTKDRN
C.核苷酸及氨基酸组合序列(SEQ ID NO:24)克隆号:PP10897
起始编码子:863 ATG 终止编码子:1430 TAA 蛋白质分子量:21317.91
1 G CAT GAA TCA GGT AAG AAG CCA GAC TGC TGA GGC AGA GTA GGG GGG 46
47 AAG GAG GCA CAA GGG CCT TGC ACT CCA GCA AAG ATG GTA GAG ATG GGG 94
95 AAG CAT TCG GGC TGG ACA GGA GAG ACC CAG GTT CCA GGC GCA GTG TGA 142
143 AGC CTC AGC AGA CCC CAG TTT CAG AGG TTT GAG GAA GGA AAA TCA ACA 190
191 GAC ACC CCG GGT ATG AAG TAG GGG CCA GGT TGT GGG CTC TGC CTC TGG 238
239 GGA CAG GGC AGA TCC CTT CCT GCT TTA TTT GTG AGC CAC CTC AAC AGG 286
287 ACC CAG GCC ATC TGC AGG TAC TAG TGG CCT AGC TGG GTA GTC TTT CCT 334
335 GAG GTC TCA CCT CAG GCC TTT GTG CTG CTG CTG TTG CTT CTG GCC TTG 382
383 AGC CTG AGA GAG AGG TGA GAG GAA GGA TGC TTT CTC TAA CTT GGG CTC 430
431 CTC CAA TCT CTG GTT GCA AAG CTG GGG TTG GGG GAG AGA GGA CCA CCC 478
479 AAC CTG CCC TGT ACA AGC ATC AGT AAG ACT CCA AGT TTC CCA GGG CCC 526
527 GAA CAC TTG GGG GTT GTC TCT CAA CAC CCG GCT GGA AGA CAA GTA GGT 574
575 AAC CAG GTT CAG CCC CAC CTG CCA AGA ACA CTG TGT TTT GGG CCT GGC 622
623 AGA GCT GCT ACT CCC CCT CTC CCT CCT AAG AAT GCC CAG AGA ATC ACT 670
671 TGC CAA GGC TAC TCC TGG AGC TCA GCT GTG GGA TCA GGG TTT GGG CTG 718
719 AGG ATC AGG TGC CTG TGT GCA CAC ATG TGC ACA TTG TGT GTG CCA ATG 766
767 GGT GGT AGG GAT TGA GCC CGT TGT GAG AAC ATC CAG CCA GGT TGG AAG 814
815 TGT GTA CAG GTA TCT GAG GGT GTG CAC GTG AGC AAG AGG GTG TGC AAG 862
863 ATG TGG GTG ACT GTT GGG ACC ACA GAG CTG AGG CCT GTG GTC AGC TCA 910
1 Met Trp Val Thr Val Gly Thr Thr Glu Leu Arg Pro Val Val Ser Ser 16
911 GGT CAG AAC TGG GAG GTC TGT TTC CCT TGG GAG GAC CTG TCT GCT CTG 958
17 Gly Gln Asn Trp Glu Val Cys Phe Pro Trp Glu Asp Leu Ser Ala Leu 32
959 AGG GGG ACC CGG ACA AGT GCA CAT ATG CAT GTG TGT GTC TAC ACA CAC 1006
33 Arg Gly Thr Arg Thr Ser Ala His Met His Val Cys Val Tyr Thr His 48
1007 ACA CAC ACA CAC ACA CAC ACA CAC ACA CAC ATA TGC TTG CCT CCC TCT 1054
49 Thr His Thr His Thr His Thr His Thr His Ile Cys Leu Pro Pro Ser 64
1055 CCA AGG CAG ACT TGC CTG GGA AGT ACC CCT CCT CAG CAG GAG CTC GAA 1102
65 Pro Arg Gln Thr Cys Leu Gly Ser Thr Pro Pro Gln Gln Glu Leu Glu 80
1103 GAC CCC TGC CCA GTG CTG TTT TCA GTA GAG GGA GTG GAG CTG AGA TGG 1150
81 Asp Pro Cys Pro Val Leu Phe Ser Val Glu Gly Val Glu Leu Arg Trp 96
1151 GGA GAC CGT ACT GAG CGG TCC AGG AGT AGG GAA ACA GAG CTG CTT TGC 1198
97 Gly Asp Arg Thr Glu Arg Ser Arg Ser Arg Glu Thr Glu Leu Leu Cys 112
1199 AGC TTC TGT TCC AGA AGA TGG GGG TTG GGG GGC GGG GTT GAG GGC CAG 1246
113 Ser Phe Cys Ser Arg Arg Trp Gly Leu Gly Gly Gly Val Glu Gly Gln 128
1247 GGG TGG GAG CAG GAG CAG AAC AGA AAG CCT CCC TGC TCA CTG GCC TTT 1294
129 Gly Trp Glu Gln Glu Gln Asn Arg Lys Pro Pro Cys Ser Leu Ala Phe 144
1295 CCC CTT CCC TCA CTG GCT GCC CAT GGA GCC AGG ATC AGC ATG GGA ACA 1342
145 Pro Leu Pro Ser Leu Ala Ala His Gly Ala Arg Ile Ser Met Gly Thr 160
1343 ATC AAG GAG GCA GGG GCT TAT CAG TAC TAT GGA CCC CTA CAC TGC TCT 1390
161 Ile Lys Glu Ala Gly Ala Tyr Gln Tyr Tyr Gly Pro Leu His Cys Ser 176
1391 GCC TGG TGG TTC TTC TCT TCG CAT ACC AAA GAC AGA AAT TAA GCC TCC 1438
177 Ala Trp Trp Phe Phe Ser Ser His Thr Lys Asp Arg Asn *** 190
1439 AAG AGT GGT AAC TGA CCT CGG TCA CAC TTG GTG GGT GTG GGA AAG GAT 1486
1487 TCA AAT GTA GGT CTG TTC TCT TCT TCA TCT ATC ATG GTC CCT GTC CTG 1534
1535 GAG GCA AGT CGT CTG GGG CTC AGA AAA CAC CCC TGT TGC CAC TGA TTG 1582
1583 GAA TTC CAA GGG TCT GGG TGA AGT GGG GAT GGG CCT CCA GCT TGC CTC 1630
1631 CAG CCT GAA AAA ATA GTA GAG GGT GTT GAG GCT GGG AAG GGA GGT GGG 1678
1679 GCT CAT GTT GTA CAG GGC CTG AGC CAG GGA GCT TGG GCT TCA TTC TGA 1726
1727 GTA CTG TGG CAG CCC TGG GAA GGT TTG TAG CAC AGA GGG ATA TTG TCA 1774
1775 TTT TTG GAA AGA TCC CTT TGG CTG CTT AGG TAG AGA AGG GCT TCA AGA 1822
1823 GGG CAG GAA GGG ACA GGA CTA CAG AAG GGG CTG CTT CAG AGT CCA GAT 1870
1871 TAA GGA AGG AGA GGC CTG GGC AGT CAG AAA GGA AGA GAA GCC GGA TGT 1918
1919 GGT GGC TTG TAT CTT CAA TCC CAG CAC TTT GAG AGG CCA AGG TGG GAG 1966
1967 GAT CAC TTG AGC CCA GGA GTT CAA AAC CAG CTT GGG CAA CAT AGT GAG 2014
2015 ACT CCC ATC TCT CCA AAA AAA TTT AAA AAC CAG CCA GGT AGA CTG GGC 2062
2063 GCA GTG GCT CAC GCC TGT AAT CCC AGA ACT TTG GGA GGC CGA GGC AGG 2110
2111 CAG ATC ACG AGG TCA AGA GTT AGA GAC CAG CCT GAC CAA CAT GGT GAA 2158
2159 ACC CCG TCT CTA CTA AAA ATA CAA AAC TTA GCC AGG CCT GTG GTG ATG 2206
2207 CGC ACC TGT AGT CTC AGC TAC TCA GGA GGC TGA GGC AGG AGA ATC GCT 2254
2255 TGA ACC CGG GAG GCA GAG GTT GCA CTG AGC TGA GAT CAC GCC ACT GCA 2302
2303 CTC CAG CCT GGG CAA CAG AGT GAG ACT CCG TCT CAA ACA AAA AAA AAA 2350
2351 AAA AAA AAA AAA 2362
9.PP10933
A:核苷酸序列(SEQ ID NO:25)长度:1680个碱基
1 GGGCGGGCGG AGCGCGGGCG CGGCGGGGGC GGGCGGCCAG GCTAGTCGGG CGGGTGCGCG
61 GGGCGCTCGG GGCCCGGGGC CAGAGCTGGA GCCGGAGCCG GGCGGGCGCC ATGGAGGGGC
121 TGCGGCGGGG GCTGTCGCGC TGGAAGCGCT ACCACATCAA GGTGCACCTG GCGGACGAGG
181 CGCTGCTGCT ACCGCTGACC GTGCGGCCGC GGGACACGCT CAGCGACCTG CGCGCCCAGC
241 TGGTGGGCCA GGGCGTGAGC TCCTGGAAGC GCGCCTTCTA CTACAACGCG CGGCGGCTGG
301 ACGACCACCA GACGGTGCGC GACGCGCGCC TGCAGGACGG CTCGGTGCTG CTGCTCGTCA
361 GCGACCCCAG GTAGTCTGGG TTGGAGGAGG CAGAGCCATG ACCAAGGGGA CCTGGGTACT
421 GGCTGAAGGA ATAGGCTGGG GTAGAGGGCA CTTTTGGAAG GCACTTCTCC TGCCTCCTGG
481 GAGCCTAGAT CTCACTCCAG GGTCTGGGCT CCCAGGTGGA CCATGAAACC CTGGCCTGAC
541 CAGCTGATGC ACACTGCTTC AGACACTCCT GCTGGAGCCC CAGTCCCTGA CAAGGACCTA
601 GGACATTTTT GCTCCTGCCC AGCCTATCGG GAGGGAGCCT TGAGCCTTTC AGCTCTGCTG
661 TGTGACTTTG AGGTTGTTGC TCCCCTCTTG GGGCCCTGGG TGCCCTGTCT TCAGTGGAAA
721 GCACTGTGCC ACCTTGGAAA GCTCCCATGG GCAGCCAGAG GGCATCGCAA GAAGAGAAGC
781 ACAGAAGGGG CAGGAGAGAC ACTCAGAGGC ACTTCCGCTC TTGCCCAGGA CATTCTCCCA
841 GCCACACCTT TGCCCAAGCC GTGCCCCCTG CCTGGAGCAC TTTTCAACCT CTTCTCTGCA
901 GCTCCAATAC ACCTGGGATT GCAGTCTCCT CCAGGAAGTC TTCTCAGATT CCCTCCTTCC
961 CAGCCAGAGA GCACCTAGCC TTCTTTGGGG CCCCCACAGG CCCTTTGTGC AGTGAACAGC
1021 CCTGGCTGGG GGTGCAGCCA GTCGTGTCCG AACTCTCCAA TGACTAAGCG GGGAGATGCG
1081 GACATCCTAG CTCCTTCTCA GGCCTCCAAC TGTGCCCCAT TTCCACCCCC AAATACCTCC
1141 CCAGGAGGCA CCTGTGCCCA CCCCCTGGGC TGTTTCCCCC TTCCCCTTAA ATCCGGATGC
1201 CTCGTCTTGC ATAGGGTCTT GGGGCAGCGG GGAAGGGGTT CTGAAGAACT CTGGCCAAGA
1261 GGACGAGGAT CTGGGGGTGG GGAACTGGGC CTAGCTGTGG GAGGTCATCG CGGGGCATTG
1321 CAGGGAGTGC GTTGTGGGAA TTCCGGGTGG AGACCCTCAG GGCAGTGTGC CGGGCCTCCG
1381 TTGCACCTCT GACCTGCAGC CACGTCATCG TTGCGCAGCC CCTGGGGAGG GTCTTTGGGG
1441 AGGGGGTGCC GAGGCTACGC ATGTCCTCGA GGGCCGTGTA CACTCTCCAG GCACCATGGG
1501 CGGAGGCGCC AGAGGCTGGG AAGAAATAAT GTTTTAGTTA AGAGTCCTGT TGGCTGCAGG
1561 ACTCAGAGCA TGGACAGGTG GATAGTAAAT CACCACCACG GGGAAAAAAA AAAAAAAAAA
1621 AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA
B:核苷酸序列(SEQ ID NO:26)长度:151个氨基酸
1 MKPWPDQLMH TASDTPAGAP VPDKDLGHFC SCPAYREGAL SLSALLCDFE VVAPLLGPWV
61 PCLQWKALCH LGKLPWAARG HRKKRSTEGA GETLRGTSAL AQDILPATPL PKPCPLPGAL
121 FNLFSAAPIH LGLQSPPGSL LRFPPSQPES T
C.核苷酸及氨基酸组合序列(SEQ ID NO:27)克隆号:PP10933
起始编码子:523 ATG 终止编码子:976 TAG 蛋白质分子量:16073.76
1 GGG CGG GCG GAG CGC GGG CGC GGC GGG GGC GGG CGG CCA GGC TAG TCG 48
49 GGC GGG TGC GCG GGG CGC TCG GGG CCC GGG GCC AGA GCT GGA GCC GGA 96
97 GCC GGG CGG GCG CCA TGG AGG GGC TGC GGC GGG GGC TGT CGC GCT GGA 144
145 AGC GCT ACC ACA TCA AGG TGC ACC TGG CGG ACG AGG CGC TGC TGC TAC 192
193 CGC TGA CCG TGC GGC CGC GGG ACA CGC TCA GCG ACC TGC GCG CCC AGC 240
241 TGG TGG GCC AGG GCG TGA GCT CCT GGA AGC GCG CCT TCT ACT ACA ACG 288
289 CGC GGC GGC TGG ACG ACC ACC AGA CGG TGC GCG ACG CGC GCC TGC AGG 336
337 ACG GCT CGG TGC TGC TGC TCG TCA GCG ACC CCA GGT AGT CTG GGT TGG 384
385 AGG AGG CAG AGC CAT GAC CAA GGG GAC CTG GGT ACT GGC TGA AGG AAT 432
433 AGG CTG GGG TAG AGG GCA CTT TTG GAA GGC ACT TCT CCT GCC TCC TGG 480
481 GAG CCT AGA TCT CAC TCC AGG GTC TGG GCT CCC AGG TGG ACC ATG AAA 528
1 Met Lys 2
529 CCC TGG CCT GAC CAG CTG ATG CAC ACT GCT TCA GAC ACT CCT GCT GGA 576
3 Pro Trp Pro Asp Gln Leu Met His Thr Ala Ser Asp Thr Pro Ala Gly 18
577 GCC CCA GTC CCT GAC AAG GAC CTA GGA CAT TTT TGC TCC TGC CCA GCC 624
19 Ala Pro Val Pro Asp Lys Asp Leu Gly His Phe Cys Ser Cys Pro Ala 34
625 TAT CGG GAG GGA GCC TTG AGC CTT TCA GCT CTG CTG TGT GAG TTT GAG 672
35 Tyr Arg Glu Gly Ala Leu Ser Leu Ser Ala Leu Leu Cys Asp Phe Glu 50
673 GTT GTT GCT CCC CTC TTG GGG CCC TGG GTG CCC TGT CTT CAG TGG AAA 720
51 Val Val Ala Pro Leu Leu Gly Pro Trp Val Pro Cys Leu Gln Trp Lys 66
721 GCA CTG TGC CAC CTT GGA AAG CTC CCA TGG GCA GCC AGA GGG CAT CGC 768
67 Ala Leu Cys His Leu Gly Lys Leu Pro Trp Ala Ala Arg Gly His Arg 82
769 AAG AAG AGA AGC ACA GAA GGG GCA GGA GAG ACA CTC AGA GGC ACT TCC 816
83 Lys Lys Arg Ser Thr Glu Gly Ala Gly Glu Thr Leu Arg Gly Thr Ser 98
817 GCT CTT GCC CAG GAC ATT CTC CCA GCC ACA CCT TTG CCC AAG CCG TGC 864
99 Ala Leu Ala Gln Asp Ile Leu Pro Ala Thr Pro Leu Pro Lys Pro Cys 114
865 CCC CTG CCT GGA GCA CTT TTC AAC CTC TTC TCT GCA GCT CCA ATA CAC 912
115 Pro Leu Pro Gly Ala Leu Phe Asn Leu Phe Ser Ala Ala Pro Ile His 130
913 CTG GGA TTG CAG TCT CCT CCA GGA AGT CTT CTC AGA TTC CCT CCT TCC 960
131 Leu Gly Leu Gln Ser Pro Pro Gly Ser Leu Leu Arg Phe Pro Pro Ser 146
961 CAG CCA GAG AGC ACC TAG CCT TCT TTG GGG CCC CCA CAG GCC CTT TGT 1008
147 Gln Pro Glu Ser Thr *** 152
1009 GCA GTG AAC AGC CCT GGC TGG GGG TGC AGC CAG TCG TGT CCG AAC TCT 1056
1057 CCA ATG ACT AAG CGG GGA GAT GCG GAC ATC CTA GCT CCT TCT CAG GCC 1104
1105 TCC AAC TGT GCC CCA TTT CCA CCC CCA AAT ACC TCC CCA GGA GGC ACC 1152
1153 TGT GCC CAC CCC CTG GGC TGT TTC CCC CTT CCC CTT AAA TCC GGA TGC 1200
1201 CTC GTC TTG CAT AGG GTC TTG GGG CAG CGG GGA AGG GGT TCT GAA GAA 1248
1249 CTC TGG CCA AGA GGA CGA GGA TCT GGG GGT GGG GAA CTG GGC CTA GCT 1296
1297 GTG GGA GGT CAT CGC GGG GCA TTG CAG GGA GTG CGT TGT GGG AAT TCC 1344
1345 GGG TGG AGA CCC TCA GGG CAG TGT GCC GGG CCT CCG TTG CAC CTC TGA 1392
1393 CCT GCA GCC ACG TCA TCG TTG CGC AGC CCC TGG GGA GGG TCT TTG GGG 1440
1441 AGG GGG TGC CGA GGC TAC GCA TGT CCT CGA GGG CCG TGT ACA CTC TCC 1488
1489 AGG CAC CAT GGG CGG AGG CGC CAG AGG CTG GGA AGA AAT AAT GTT TTA 1536
1537 GTT AAG AGT CCT GTT GGC TGC AGG ACT CAG AGC ATG GAC AGG TGG ATA 1584
1585 GTA AAT CAC CAC CAC GGG GAA AAA AAA AAA AAA AAA AAA AAA AAA AAA 1632
1633 AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA 1680
10. PP11246
A:核苷酸序列(SEQ ID NO:28)长度:2059个碱基
1 GAGCCTGAGG GACCCGGCGG CTGGTGAGCG CCCGCTGGAG GCTGGAGCTT CCGGGCCCTG
61 GAAAGGGGTC CCCGCGCGCC CCGGGTCGGA GGCAGACCCC TGGGTTTGGG GGACATGGGC
121 ATTTGGGGCG CCTGAACCCA AGACCTCTGG ATGGTAGGGA TGCCCGGGCG TCCTGGATAC
181 CCTGCGGGAC TCGGGGCTCC TGCGGGGAAG ATGGCACGTT TTACTGCCCA AGGAGTGGTC
241 AGGGGGGTGG AGAAGCGCTG CGGATACCCT CAGGAGGTCT GCGACAGAGG GGGCTAGCTG
301 CGCAGCCCAG GAGTGGTAGT GGCCCCCCTG GATGACAGGC CTGCCCGTAT CCTCCCCCAG
361 AGCTGCCCCG TTCAGACCAT GGATCCTGAG GTGACCTTGC TTGTGCAGTG CCCTGGCGGG
421 GGCCTGCCCC AGGAGCAGAT ACAGGCCGAG CTGAGCCCCG CCCATGACCG TCGCCCACTG
481 CCAGGTGGGG ACGAGGCCAT CACTGCCATC TGGGAGACCC GGCTAAAGGC CCAACCCTGG
541 CTCTTCGACG CCCCCAAGTT CCGCCTGCAC TCAGCCACCC TGGCGCCTAT TGGCTCTCGG
601 GGGCCACAGC TGCTCCTGCG CCTGGGCCTT ACTTCCTACC GAGACTTCCT GGGCACCAAC
661 TGGTCCAGCT CAGCTGCCTG GCTGCGACAG CAGGGTGCCA CCGACTGGGG TGACACGCAG
721 GCCTATCTGG CGGACCCACT GGGGGTGGGC GCTGCACTAG CCACAGCCGA TGACTTCCTT
781 GTCTTCCTGC GCCGCTCCCG GCAGGTGGCT GAGGCCCCTG GGCTGGTGGA CGTACCTGGT
841 GGGCACCCTG AGCCTCAGGT GAGATTCCAG GCTGGGCACA AAGACCCAGA CAGCTCAAGG
901 GAGCTGCAGC TCTCCACCCT CCCAATCCTC CCAGCTTTGG TTTCCCCATC CCTTAAAGGA
961 AAATTGGCCT GGTATTTCTC TGGAAGTTTG CTCAGGGCAG TCCACCTGCC TCCCCACTGA
1021 CCCCTGCCCC AGTCCTGTGA GAAACTAGAA AACACGGGAG GAAAGATTGG GCACAGGAAG
1081 AAGATGCCCT ACTCCACCCC TGCCCCCTGT GTATCTCCTT TGAAGCTGGA CCTCTGGTTG
1141 TCTGTCAGGG AAAGGACACC AGACTCAGGA TCACTAACTC TCTTACACTG TGCCACATCA
1201 GACCCTCAAG GCCAGCAGGT ATAGGCTTGC TGGTCCTGAG ATGGGGCAGG GGGAAGAGGT
1261 GGGGAGCAGG GGCTGAGCCT GACCTCTCAC AGGCCCTGTG CCCTGGTGGC AGCCCCCAGC
1321 ACCAGGACCT CGCTGGGCAG CTGGTGGTAC ATGAACTCTT TTCCAGTGTC CTTCAGGAGA
1381 TCTGTGATGA GGTGAGTGAG GTTGACCTGG ACAGGGTGGT AGACATGAAG GGAGGGGGTA
1441 GGACTTGCCA GAATTCTACA GGTCTGGGCT GGCAGGAGGC CTGCAGGCAT CTGGCCAGCA
1501 ATGAGGGAAG AAGTTGGCTT TGCAGCTATA CATACTTGGA GTGGAATTCT AGCCGTCAGT
1561 ACCCTCTGCC TTGGATTCTT CTTCTTTTCT TTTTTCTTTC TTTTTTTTTT TTTAGACAGA
1621 GTCTCGCTCT GTTGCCCAGG AGAATGGCGT GAACCCGGGA GGCGGAGGTT GCAGTGAGCC
1681 GAAATCGCGC CACTGCACTT CAGCCTGGGC GACAAAGCGA GACTCCGTCT CAAAAAAAAG
1741 AAAAAGGAGT AAGTGTGGCA GGGTGTGGTG GCTCACACCT GTAATCCCAG CACTTTGGGA
1801 GGCCAAGGGC CAGCGGATCA CCTGAGGTCA GGAGTTCGAG ACCAGCCTGG CCAACATGGA
1861 GAAACCCCAT CTCTACTAAA AATACAAAAA ATTAGCCAGG CGTTGTGGCG TGCACCTGTA
1921 ATCCCAGCTA CTCAGGAGGC TGAGGCAGGA GAATCACTTT AACCTGGGAG GCAGAGGTTG
1981 CAGTGAGCTG AGATCGTGCC ACTGTACTCC AGCCTGGGCG ACAGAGCGAG ACTCCATCTC
2041 AAAAAAAAAA AAAAAAAAA
B:核苷酸序列(SEQ ID NO:29) 长度:213个氨基酸
1 MDPEVTLLVQ CPGGGLPQEQ IQAELSPAHD RRPLPGGDEA ITAIWETRLK AQPWLFDAPK
61 FRLHSATLAP IGSRGPQLLL RLGLTSYRDF LGTNWSSSAA WLRQQGATDW GDTQAYLADP
121 LGVGAALATA DDFLVFLRRS RQVAEAPGLV DVPGGHPEPQ VRFQAGHKDP DSSRELQLST
181 LPILPALVSP SLKGKLAWYF SGSLLRAVHL PPH
C.核苷酸及氨基酸组合序列(SEQ ID NO:30)克隆号:PP11246
起始编码子:379 ATG 终止编码子:1018 TGA 蛋白质分子量:23100.94
1 GAG CCT GAG GGA CCC GGC GGC TGG TGA GCG CCC GCT GGA GGC TGG AGC 48
49 TTC CGG GCC CTG GAA AGG GGT CCC CGC GCG CCC CGG GTC GGA GGC AGA 96
97 CCC CTG GGT TTG GGG GAC ATG GGC ATT TGG GGC GCC TGA ACC CAA GAC 144
145 CTC TGG ATG GTA GGG ATG CCC GGG CGT CCT GGA TAC CCT GCG GGA CTC 192
193 GGG GCT CCT GCG GGG AAG ATG GCA CGT TTT ACT GCC CAA GGA GTG GTC 240
241 AGG GGG GTG GAG AAG CGC TGC GGA TAC CCT CAG GAG GTC TGC GAC AGA 288
289 GGG GGC TAG CTG CGC AGC CCA GGA GTG GTA GTG GCC CCC CTG GAT GAC 336
337 AGG CCT GCC CGT ATC CTC CCC CAG AGC TGC CCC GTT CAG ACC ATG GAT 384
1 Met Asp 2
385 CCT GAG GTG ACC TTG CTT GTG CAG TGC CCT GGC GGG GGC CTG CCC CAG 432
3 Pro Glu Val Thr Leu Leu Val Gln Cys Pro Gly Gly Gly Leu Pro Gln 18
433 GAG CAG ATA CAG GCC GAG CTG AGC CCC GCC CAT GAC CGT CGC CCA CTG 480
19 Glu Gln Ile Gln Ala Glu Leu Ser Pro Ala His Asp Arg Arg Pro Leu 34
481 CCA GGT GGG GAC GAG GCC ATC ACT GCC ATC TGG GAG ACC CGG CTA AAG 528
35 Pro Gly Gly Asp Glu Ala Ile Thr Ala Ile Trp Glu Thr Arg Leu Lys 50
529 GCC CAA CCC TGG CTC TTC GAC GCC CCC AAG TTC CGC CTG CAC TCA GCC 576
51 Ala Gln Pro Trp Leu Phe Asp Ala Pro Lys Phe Arg Leu His Ser Ala 66
577 ACC CTG GCG CCT ATT GGC TCT CGG GGG CCA CAG CTG CTC CTG CGC CTG 624
67 Thr Leu Ala Pro Ile Gly Ser Arg Gly Pro Gln Leu Leu Leu Arg Leu 82
625 GGC CTT ACT TCC TAC CGA GAC TTC CTG GGC ACC AAC TGG TCC AGC TCA 672
83 Gly Leu Thr Ser Tyr Arg Asp Phe Leu Gly Thr Asn Trp Ser Ser Ser 98
673 GCT GCC TGG CTG CGA CAG CAG GGT GCC ACC GAC TGG GGT GAC ACG CAG 720
99 Ala Ala Trp Leu Arg Gln Gln Gly Ala Thr Asp Trp Gly Asp Thr Gln 114
721 GCC TAT CTG GCG GAC CCA CTG GGG GTG GGC GCT GCA CTA GCC ACA GCC 768
115 Ala Tyr Leu Ala Asp Pro Leu Gly Val Gly Ala Ala Leu Ala Thr Ala 130
769 GAT GAC TTC CTT GTC TTC CTG CGC CGC TCC CGG CAG GTG GCT GAG GCC 816
131 Asp Asp Phe Leu Val Phe Leu Arg Arg Ser Arg Gln Val Ala Glu Ala 146
817 CCT GGG CTG GTG GAC GTA CCT GGT GGG CAC CCT GAG CCT CAG GTG AGA 864
147 Pro Gly Leu Val Asp Val Pro Gly Gly His Pro Glu Pro Gln Val Arg 162
865 TTC CAG GCT GGG CAC AAA GAC CCA GAC AGC TCA AGG GAG CTG CAG CTC 912
163 Phe Gln Ala Gly His Lys Asp Pro Asp Ser Ser Arg Glu Leu Gln Leu 178
913 TCC ACC CTC CCA ATC CTC CCA GCT TTG GTT TCC CCA TCC CTT AAA GGA 960
179 Ser Thr Leu Pro Ile Leu Pro Ala Leu Val Ser Pro Ser Leu Lys Gly 194
961 AAA TTG GCC TGG TAT TTC TCT GGA AGT TTG CTC AGG GCA GTC CAC CTG 1008
195 Lys Leu Ala Trp Tyr Phe Ser Gly Ser Leu Leu Arg Ala Val His Leu 210
1009 CCT CCC CAC TGA CCC CTG CCC CAG TCC TGT GAG AAA CTA GAA AAC ACG 1056
211 Pro Pro His *** 214
1057 GGA GGA AAG ATT GGG CAC AGG AAG AAG ATG CCC TAC TCC ACC CCT GCC 1104
1105 CCC TGT GTA TCT CCT TTG AAG CTG GAC CTC TGG TTG TCT GTC AGG GAA 1152
1153 AGG ACA CCA GAC TCA GGA TCA CTA ACT CTC TTA CAC TGT GCC ACA TCA 1200
1201 GAC CCT CAA GGC CAG CAG GTA TAG GCT TGC TGG TCC TGA GAT GGG GCA 1248
1249 GGG GGA AGA GGT GGG GAG CAG GGG CTG AGC CTG ACC TCT CAC AGG CCC 1296
1297 TGT GCC CTG GTG GCA GCC CCC AGC ACC AGG ACC TCG CTG GGC AGC TGG 1344
1345 TGG TAC ATG AAC TCT TTT CCA GTG TCC TTC AGG AGA TCT GTG ATG AGG 1392
1393 TGA GTG AGG TTG ACC TGG ACA GGG TGG TAG ACA TGA AGG GAG GGG GTA 1440
1441 GGA CTT GCC AGA ATT CTA CAG GTC TGG GCT GGC AGG AGG CCT GCA GGC 1488
1489 ATC TGG CCA GCA ATG AGG GAA GAA GTT GGC TTT GCA GCT ATA CAT ACT 1536
1537 TGG AGT GGA ATT CTA GCC GTC AGT ACC CTC TGC CTT GGA TTC TTC TTC 1584
1585 TTT TCT TTT TTC TTT CTT TTT TTT TTT TTA GAC AGA GTC TCG CTC TGT 1632
1633 TGC CCA GGA GAA TGG CGT GAA CCC GGG AGG CGG AGG TTG CAG TGA GCC 1680
1681 GAA ATC GCG CCA CTG CAC TTC AGC CTG GGC GAC AAA GCG AGA CTC CGT 1728
1729 CTC AAA AAA AAG AAA AAG GAG TAA GTG TGG CAG GGT GTG GTG GCT CAC 1776
1777 ACC TGT AAT CCC AGC ACT TTG GGA GGC CAA GGG CCA GCG GAT CAC CTG 1824
1825 AGG TCA GGA GTT CGA GAC CAG CCT GGC CAA CAT GGA GAA ACC CCA TCT 1872
1873 CTA CTA AAA ATA CAA AAA ATT AGC CAG GCG TTG TGG CGT GCA CCT GTA 1920
1921 ATC CCA GCT ACT CAG GAG GCT GAG GCA GGA GAA TCA CTT TAA CCT GGG 1968
1969 AGG CAG AGG TTG CAG TGA GCT GAG ATC GTG CCA CTG TAC TCC AGC CTG 2016
2017 GGC GAC AGA GCG AGA CTC CAT CTC AAA AAA AAA AAA AAA AAA A 2059
11.PP11347
A:核苷酸序列(SEQ ID NO:31)长度:2432个碱基
1 GAAACGTCTT GCATCCTTTT TGTCACTCAT CAACCAGAGG GACAGACCAG GCCCTGGGGT
61 TTGAGTGTAC TTTGAGAGCA GAGTGGGATG TCCCTGTGTT TCCCACCTGT TTGCAGAGAC
121 AGAATGGGAA AGGGTGAGTG TCCTAACTGC ATGCCCAACT CATCTCCTGC ACTCTGCATG
181 CCGAGGTGCC CCCCGAATGC CAGGAAGGCA TCTGTGGCTG GGCATGGTGG AGCCACCTTG
241 ACAGAGCGCA GAGAGCCGTT TCCACTAACG CCTCCCGGTG CTGTCCTGGT CGGCCTGCGA
301 TGGGGGTCCT GGCTGAGCCC AAGCAAGGGG AGGGAGCTCA GGGCTGACCC CTCTGCCAGA
361 GATCGGCTCT GTGCTTGGAA TATGGAACCC AAAGACCTTA ACACTGCCCT TCTCTCTGCC
421 TTCACCACTC CAGGAGCCCG GTGGGCACCT ACCACATCTC TAGTCTAGCC AGCACGCGAG
481 TCCCGAGGGT GGGCCTGAAT TCCTGAGCTT GCTCTCGCGT GCCTTTCAGG CGATGAGAAT
541 GATTTATTTG TTTGTGATGC ATGTTTGCTG AAAGATTAAT AAATCATTTC TGTGCCTTTA
601 GCAAACTTCC TGTGTTGCTC TTAAAAAGGG ATCATCCACC TTCCCGGACC ACAAGGTTAA
661 GGTAACCCCG CTAGGTAACC CTGATAGGCC TGCTGCGGGG CAGACCGACA GAGAGAGAGA
721 GAGTGAGGGC GAGGGTGAGG TAAGCAACGC CCCGGGAACC CCGGGGTCCC TGGCTCACAT
781 CTCCTCGCCA GCTCAGGCGC CTTCTGGGAA AATGAATCCT TGCATTTTTC TGTTCTCTAA
841 TATGGCTTTT GAGGTCTTAA ATTTGAGGAG CCGGAATCAT GCCTTCCTCC TAATCTGCAG
901 GGCCTCTTTG GAGCTGCCCC CGCCAGCAGT GAAGGGTGCT TGTCGGCCAG GGCGCCTCTC
961 CCCGGGCGCC TGGCTGGAGG TGGCTGGAGC TGGGACGGGC AGGGCCCTGG CTGGGGTGGT
1021 GGTTGGCAGC TCAGCTCTCC TCCCTTGGCT GCCCTTGCTG AACCCACCCC TGACCTTTGT
1081 GGGCAGCTGC AGTGTCAGGC GGGAGCTCGG GGCTCTTGCT CCAAGACTCT TGAGCTCCCA
1141 GGAAGACCTG CCACACCGGC ATCAGTGGCT GCTGCTGTGG CCACGTGAGG TGGGGCTGTG
1201 AGGGGAGGCG GCTGCTGTGG ATGATGCCAG GACCCTGGGG GCAGAGCCTC TGAGAAGGTG
1261 GGCTCCCTGG CTGCACAGTG TCAGGCAGAA CCCCTGGCTG CCTGCTGAAA GCCCCAAGGT
1321 CAGGGGCTGC CCAGCTCCCC GCGCTGCGGT CTGTGGTGGC CCCGTGCATG CACCGGGTGG
1381 CTGGCCCGCT GAGCTTCCCC GGCACCAGGT GCCCTGGACC TCGAGGTCCT GAGCCTGACC
1441 CAGGGCTGGT CTGACCGACT CTCTGCTTCT GGCTCCTGGG CACTTCTTCT CAGCTCAGGG
1501 CGTGCTCTGT CAAAACCAAG TCCTTTCTTG GCTCTGTGTC AGGCGGGGTG TTCAGCAGGG
1561 GTCACCTGGC TCTTCTGTCT TTGCAGGGCC CCCTCGTGCG CTGGCTCAAG GTGAACTTCA
1621 GTGAAGCCTT CATTGCCTGG ATCCACATCA AGGCCCTGAG AGTGTTTGTG GAGTCCGTGC
1681 TCAGGTGCGT GGCAGTGATG CCCCGGCTGG GACTGTCCTG AGGATGGGCA GGGTCTGGGG
1741 GAGCTATCGG GGCACCCCAG CTCCTGCCTT CTCTCCATCC TCCACCCGTC TCCTTTCTGA
1801 GACTGTGGCT GTTGGCAACA CGCTCAATTC CGAGTCAAGT ACACCCTCCC CTCAGCCCTG
1861 TGTCCCCTGC TGTCTGCTCC CTCCGTTCCT GCTACACTTG GGGCAAGTGT CACCTGGGTT
1921 CTCCCCAGCT GCCCTACCTG CATGCCCTTG TGGACCCTCT GGCTGGCTCC TGTCCCCACC
1981 CTCGTGAAGC CGCAGGGCCG AGTGGCTCCT GGAAGGCGCT CTCGGGCTGC CTCCGTCCTC
2041 AGCCTGGAAG CCGCACCCCT CAAGGCAGTC CAGAGAGAAA ACCAAAACCA CACCAACAAC
2101 AACAAAGCTT ATTTTGCCTT TTTTTTTTTT ATTTGAGATG GAGTTTCACT CTTGTCGCCC
2161 AGGCTAGAGT GCAATGGCAT GTTCCTGGCT CACTGAAACC TCCACCTCTC AGGTTCAGGA
2221 GATTCTCCTG TCTCAGCCCA CCTCTACTAA AAATACAGAA ATTAGCCGGG TGTGGTGGCA
2281 TGGGCCTGTA GTACTGGCTA CTTGGGAGGC TGAGGTGGGA GGATCACTTG AGCCTCGGAG
2341 CCGGAGGTTG CAGTGAGCCG AGATCGCGTC ACTGCACTCG AGCCTGGGCA ACAAGAGAAA
2401 CTCCGGCTAT AGAAAAAAAA AAAAAAAAAA AA
B:核苷酸序列(SEQ ID NO:32)长度:129个氨基酸
1 MNPCIFLFSN MAFEVLNLRS RNHAFLLICR ASLELPPPAV KGACRPGRLS PGAWLEVAGA
61 GTGRALAGVV VGSSALLPWL PLLNPPLTFV GSCSVRRELG ALAPRLLSSQ EDLPHRHQWL
121 LLWPREVGL
C.核苷酸及氨基酸组合序列(SEQ ID NO:33)克隆号:PP11347
起始编码子:812 ATG 终止编码子:1199 TGA 蛋白质分子量:13981.69
1 G AAA CGT CTT GCA TCC TTT TTG TCA CTC ATC AAC CAG AGG GAC AGA 46
47 CCA GGC CCT GGG GTT TGA GTG TAC TTT GAG AGC AGA GTG GGA TGT CCC 94
95 TGT GTT TCC CAC CTG TTT GCA GAG ACA GAA TGG GAA AGG GTG AGT GTC 142
143 CTA ACT GCA TGC CCA ACT CAT CTC CTG CAC TCT GCA TGC CGA GGT GCC 190
191 CCC CGA ATG CCA GGA AGG CAT CTG TGG CTG GGC ATG GTG GAG CCA CCT 238
239 TGA CAG AGC GCA GAG AGC CGT TTC CAC TAA CGC CTC CCG GTG CTG TCC 286
287 TGG TCG GCC TGC GAT GGG GGT CCT GGC TGA GCC CAA GCA AGG GGA GGG 334
335 AGC TCA GGG CTG ACC CCT CTG CCA GAG ATC GGC TCT GTG CTT GGA ATA 382
383 TGG AAC CCA AAG ACC TTA ACA CTG CCC TTC TCT CTG CCT TCA CCA CTC 430
431 CAG GAG CCC GGT GGG CAC CTA CCA CAT CTC TAG TCT AGC CAG CAC GCG 478
479 AGT CCC GAG GGT GGG CCT GAA TTC CTG AGC TTG CTC TCG CGT GCC TTT 526
527 CAG GCG ATG AGA ATG ATT TAT TTG TTT GTG ATG CAT GTT TGC TGA AAG 574
575 ATT AAT AAA TCA TTT CTG TGC CTT TAG CAA ACT TCC TGT GTT GCT CTT 622
623 AAA AAG GGA TCA TCC ACC TTC CCG GAC CAC AAG GTT AAG GTA ACC CCG 670
671 CTA GGT AAC CCT GAT AGG CCT GCT GCG GGG CAG ACC GAC AGA GAG AGA 718
719 GAG AGT GAG GGC GAG GGT GAG GTA AGC AAC GCC CCG GGA ACC CCG GGG 766
767 TCC CTG GCT CAC ATC TCC TCG CCA GCT CAG GCG CCT TCT GGG AAA ATG 814
1 Met 1
815 AAT CCT TGC ATT TTT CTG TTC TCT AAT ATG GCT TTT GAG GTC TTA AAT 862
2 Asn Pro Cys Ile Phe Leu Phe Ser Asn Met Ala Phe Glu Val Leu Asn 17
863 TTG AGG AGC CGG AAT CAT GCC TTC CTC CTA ATC TGC AGG GCC TCT TTG 910
18 Leu Arg Ser Arg Asn His Ala Phe Leu Leu Ile Cys Arg Ala Ser Leu 33
911 GAG CTG CCC CCG CCA GCA GTG AAG GGT GCT TGT CGG CCA GGG CGC CTC 958
34 Glu Leu Pro Pro Pro Ala Val Lys Gly Ala Cys Arg Pro Gly Arg Leu 49
959 TCC CCG GGC GCC TGG CTG GAG GTG GCT GGA GCT GGG ACG GGC AGG GCC 1006
50 Ser Pro Gly Ala Trp Leu Glu Val Ala Gly Ala Gly Thr Gly Arg Ala 65
1007 CTG GCT GGG GTG GTG GTT GGC AGC TCA GCT CTC CTC CCT TGG CTG CCC 1054
66 Leu Ala Gly Val Val Val Gly Ser Ser Ala Leu Leu Pro Trp Leu Pro 81
1055 TTG CTG AAC CCA CCC CTG ACC TTT GTG GGC AGC TGC AGT GTC AGG CGG 1102
82 Leu Leu Asn Pro Pro Leu Thr Phe Val Gly Ser Cys Ser Val Arg Arg 97
1103 GAG CTC GGG GCT CTT GCT CCA AGA CTC TTG AGC TCC CAG GAA GAC CTG 1150
98 Glu Leu Gly Ala Leu Ala Pro Arg Leu Leu Ser Ser Gln Glu Asp Leu 113
1151 CCA CAC CGG CAT CAG TGG CTG CTG CTG TGG CCA CGT GAG GTG GGG CTG 1198
114 Pro His Arg His Gln Trp Leu Leu Leu Trp Pro Arg Glu Val Gly Leu 129
1199 TGA GGG GAG GCG GCT GCT GTG GAT GAT GCC AGG ACC CTG GGG GCA GAG 1246
130 *** 130
1247 CCT CTG AGA AGG TGG GCT CCC TGG CTG CAC AGT GTC AGG CAG AAC CCC 1294
1295 TGG CTG CCT GCT GAA AGC CCC AAG GTC AGG GGC TGC CCA GCT CCC CGC 1342
1343 GCT GCG GTC TGT GGT GGC CCC GTG CAT GCA CCG GGT GGC TGG CCC GCT 1390
1391 GAG CTT CCC CGG CAC CAG GTG CCC TGG ACC TCG AGG TCC TGA GCC TGA 1438
1439 CCC AGG GCT GGT CTG ACC GAC TCT CTG CTT CTG GCT CCT GGG CAC TTC 1486
1487 TTC TCA GCT CAG GGC GTG CTC TGT CAA AAC CAA GTC CTT TCT TGG CTC 1534
1535 TGT GTC AGG CGG GGT GTT CAG CAG GGG TCA CCT GGC TCT TCT GTC TTT 1582
1583 GCA GGG CCC CCT CGT GCG CTG GCT CAA GGT GAA CTT CAG TGA AGC CTT 1630
1631 CAT TGC CTG GAT CCA CAT CAA GGC CCT GAG AGT GTT TGT GGA GTC CGT 1678
1679 GCT CAG GTG CGT GGC AGT GAT GCC CCG GCT GGG ACT GTC CTG AGG ATG 1726
1727 GGC AGG GTC TGG GGG AGC TAT CGG GGC ACC CCA GCT CCT GCC TTC TCT 1774
1775 CCA TCC TCC ACC CGT CTC CTT TCT GAG ACT GTG GCT GTT GGC AAC ACG 1822
1823 CTC AAT TCC GAG TCA AGT ACA CCC TCC CCT CAG CCC TGT GTC CCC TGC 1870
1871 TGT CTG CTC CCT CCG TTC CTG CTA CAC TTG GGG CAA GTG TCA CCT GGG 1918
1919 TTC TCC CCA GCT GCC CTA CCT GCA TGC CCT TGT GGA CCC TCT GGC TGG 1966
1967 CTC CTG TCC CCA CCC TCG TGA AGC CGC AGG GCC GAG TGG CTC CTG GAA 2014
2015 GGC GCT CTC GGG CTG CCT CCG TCC TCA GCC TGG AAG CCG CAC CCC TCA 2062
2063 AGG CAG TCC AGA GAG AAA ACC AAA ACC ACA CCA ACA ACA ACA AAG CTT 2110
2111 ATT TTG CCT TTT TTT TTT TTA TTT GAG ATG GAG TTT CAC TCT TGT CGC 2158
2159 CCA GGC TAG AGT GCA ATG GCA TGT TCC TGG CTC ACT GAA ACC TCC ACC 2206
2207 TCT CAG GTT CAG GAG ATT CTC CTG TCT CAG CCC ACC TCT ACT AAA AAT 2254
2255 ACA GAA ATT AGC CGG GTG TGG TGG CAT GGG CCT GTA GTA CTG GCT ACT 2302
2303 TGG GAG GCT GAG GTG GGA GGA TCA CTT GAG CCT CGG AGC CGG AGG TTG 2350
2351 CAG TGA GCC GAG ATC GCG TCA CTG CAC TCG AGC CTG GGC AAC AAG AGA 2398
2399 AAC TCC GGC TAT AGA AAA AAA AAA AAA AAA AAA A 2432
12.PP11517
A:核苷酸序列(SEQ ID NO:34)长度:2169个碱基
1 GCCAGTGGGA GCAGGCGCCC CGGCCAGCGC AGACCTGGAG GCGCACGGGC GCCGCACCGC
61 ACGATTCGGC TCGGGGTAGA GCGGAGCCGC AGCCCCACGC GCAGCCCAGG ACCCACTCGC
121 CACCGCCGCT TCCTCAGCAC CCATGGGGAC CAGGAGACTT TAAAGGAGTT TGGGGTTTCG
181 GGAGCAGGGA AATCACGGAT CCCCGCTCCT GGCCCTCGCC TCGCCACCTC ATTGATGGGC
241 AACCAACTGG ACCGCATCAC CCACCTCAAC TACAGCGAGT TGCCCACAGG GGACCCGTCG
301 GGGATTGAAA AGGACGAACT GCGGGTCGGG GTTGCCTACT TCTTCTCGGA TGATGAGGAA
361 GACCTGGACG AACGCGGGCA GCCCGACAAG TTTGGCGTGA AGGCCCCCCC GGTTGCACCC
421 CCTGCCCGGA GAGCCCCAGC CGCCACCACC ACCACCTGCT GCACCAGCTG GTCCTCAACG
481 AGACTCAGTT TTCCGCCTTT CGGGGCCAGG AATGCATCTT TTCCAAAGTG AGCGGTGGCC
541 CTCAGGGCGC CGACCTAAGC GTCTACGCGG TCACCGCGCT GCCAGCCGTC TGCGAACCCG
601 GCGACCTGCT GGAGCTGCTG TGGCTGCAGC CCGCGCCGGA GCCGCCCGCG CCCGCCCCGC
661 ACTGGGCCGT CTACGTGGGC GGCGGGCAGA TCATCCACCT GCACCAAGGC GAGATCCGCC
721 AGACAAGCCG GATGAGGCGG GCGCGGCCAA CGTGGGCCGG GTGGTGAATA GCTGGTACCG
781 CTACCGCCCG CTGGTGGCCG AGCTGGTGGT GCAGAACGCC TGCGGCCACC TGGGCCTCAA
841 GAGCGAGGAG ATCTGCTGGA CGAACTCGGA GAGCTTCGCC GCCTGGTGCC GCTTTGGCAA
901 GCGGGAGTTC AAGGCGGGAG GGGAGGTGCC GGCACGGCTA GCCCCCGCAG CAGCAGTACT
961 ATCTCAAGGT GCACCTGGGA GAGAACAAGG TCCACACCGC CAGTTTCACA GCCTGGAAGA
1021 CCTCATCCGC GAGAAGCGCC TGTATCGACG CCAGCGGCCG CCTGCGAGTG CTCCAGGAGC
1081 TCGCCGACCT CGTGGACGAC AAGGAGTAGC CGCCTAGGGG CTGCCGGCCC CTCTGCCTCC
1141 CCCGCACCTC GCTCCCTTCC CTTCCCCGCA CCCGGACTTC GCAGTCAGCG GTTCTAAACC
1201 TCTGCCCCGC CCCGCCACGC GCGTCCGCCG CCGGTGGCCC GGGCCCGGGC TTGCACCCCC
1261 GCATCCCCAA GCCAGCGGCA GGGAAGTCTC AGGAACTGCC CCAGGCCGAA AGGCGCCGCT
1321 GCGAGCGCCT GGCTGACAGC CACAGCGGTG GTGACGGTGC TGGGAGACCC CGCGTGCGCT
1381 TTCCCCTTGA GATGTAAACC GGGAACGGGG AAGGGGCTGA GGGGAGAAAG GACATGGCCT
1441 TCCCCGCGAG TCCATGGCCA GTGACTGTGG CCCGACTCGA AAACAACCCT CTTCTCAAAA
1501 GGGACCATCA CCGCCCCGAG CGTGCGCACA CAGACCGGTC GGAGGCGAGA ACTGGTCTCT
1561 ACAGGGCACA GTTCAGCTCC TCTGTGGATG CGTCCCCAGA TCGCAGGATT TCCAAGAAAT
1621 CGAGCCTGTC CCTTGTGCAC TTGGGAATAA TTCCCCAAGA CAGCACTTCG GGATTCCGGG
1681 TTATCCTGAG GCTGCCCGGG ACTTTTCCAG CTCTCCAGCC CCAGGTCTCC TGACATTGTG
1741 TTCCAGGCTG CGGGCTAAGC CAGACAGTGT TTGCCTCCGG TTCTTTCCAC CGTGGGAAGC
1801 GAACGCCACC CCCACCCGCC TTTGCCTGCG AGTCTCCCTC GCTGGCAGAA GGGAAGCCGG
1861 CCCGGTCCCG GGAGGAAGAT GGCCGCTGCG AATTCGGTGA GGACAGCCGG CCCCGCCCCC
1921 GACAAGGAGC TCGCTCGTTC ACCTGGTGTC TGGGAACTTG AATGTGTGAA GGGCGCTTAT
1981 TGTTCTGAAC CCTTGATTGC TCCCTCCTCG GGCTGCATTT CAAAAATAGT CATATTTTTA
2041 AAGGAGTTGG AGGAGAGGGA GGGGGAGGAC ATGGCACCAT TCCAGAAACC AGCATTGCTA
2101 CAACACCATA GCCAGTATAT TTAGCTTTGG CTTTTCCTAA CATAGAAATC TTCAAAGCTG
2161 GGGAAGTGG
B:核苷酸序列 (SEQ ID NO:35)长度:201个氨基酸
1 MHLFQSERWP SGRRPKRLRG HRAASRLRTR RPAGAAVAAA RAGAARARPA LGRLRGRRAD
61 HPPAPRRDPP DKPDEAGAAN VGRVVNSWYR YRPLVAELVV QNACGHLGLK SEEICWTNSE
121 SFAAWCRFGK REFKAGGEVP ARLAPAAAVL SQGAPGREQG PHRQFHSLED LIREKRLYRR
181 QRPPASAPGA RRPRGRQGVA A
C.核苷酸及氨基酸组合序列(SEQ ID NO:36)克隆号:PP11517
起始编码子:512 ATG 终止编码子:1115 TAG 蛋白质分子量:22212.07
1 G CCA GTG GGA GCA GGC GCC CCG GCC AGC GCA GAC CTG GAG GCG CAC 46
47 GGG CGC CGC ACC GCA CGA TTC GGC TCG GGG TAG AGC GGA GCC GCA GCC 94
95 CCA CGC GCA GCC CAG GAC CCA CTC GCC ACC GCC GCT TCC TCA GCA CCC 142
143 ATG GGG ACC AGG AGA CTT TAA AGG AGT TTG GGG TTT CGG GAG CAG GGA 190
191 AAT CAC GGA TCC CCG CTC CTG GCC CTC GCC TCG CCA CCT CAT TGA TGG 238
239 GCA ACC AAC TGG ACC GCA TCA CCC ACC TCA ACT ACA GCG AGT TGC CCA 286
287 CAG GGG ACC CGT CGG GGA TTG AAA AGG ACG AAC TGC GGG TCG GGG TTG 334
335 CCT ACT TCT TCT CGG ATG ATG AGG AAG ACC TGG ACG AAC GCG GGC AGC 382
383 CCG ACA AGT TTG GCG TGA AGG CCC CCC CGG TTG CAC CCC CTG CCC GGA 430
431 GAG CCC CAG CCG CCA CCA CCA CCA CCT GCT GCA CCA GCT GGT CCT CAA 478
479 CGA GAC TCA GTT TTC CGC CTT TCG GGG CCA GGA ATG CAT CTT TTC CAA 526
1 Met His Leu Phe Gln 5
527 AGT GAG CGG TGG CCC TCA GGG CGC CGA CCT AAG CGT CTA CGC GGT CAC 574
6 Ser Glu Arg Trp Pro Ser Gly Arg Arg Pro Lys Arg Leu Arg Gly His 21
575 CGC GCT GCC AGC CGT CTG CGA ACC CGG CGA CCT GCT GGA GCT GCT GTG 622
22 Arg Ala Ala Ser Arg Leu Arg Thr Arg Arg Pro Ala Gly Ala Ala Val 37
623 GCT GCA GCC CGC GCC GGA GCC GCC CGC GCC CGC CCC GCA CTG GGC CGT 670
38 Ala Ala Ala Arg Ala Gly Ala Ala Arg Ala Arg Pro Ala Leu Gly Arg 53
671 CTA CGT GGG CGG CGG GCA GAT CAT CCA CCT GCA CCA AGG CGA GAT CCG 718
54 Leu Arg Gly Arg Arg Ala Asp His Pro Pro Ala Pro Arg Arg Asp Pro 69
719 CCA GAC AAG CCG GAT GAG GCG GGC GCG GCC AAC GTG GGC CGG GTG GTG 766
70 Pro Asp Lys Pro Asp Glu Ala Gly Ala Ala Asn Val Gly Arg Val Val 85
767 AAT AGC TGG TAC CGC TAC CGC CCG CTG GTG GCC GAG CTG GTG GTG CAG 814
86 Asn Ser Trp Tyr Arg Tyr Arg Pro Leu Val Ala Glu Leu Val Val Gln 101
815 AAC GCC TGC GGC CAC CTG GGC CTC AAG AGC GAG GAG ATC TGC TGG ACG 862
102 Asn Ala Cys Gly His Leu Gly Leu Lys Ser Glu Glu Ile Cys Trp Thr 117
863 AAC TCG GAG AGC TTC GCC GCC TGG TGC CGC TTT GGC AAG CGG GAG TTC 910
118 Asn Ser Glu Ser Phe Ala Ala Trp Cys Arg Phe Gly Lys Arg Glu Phe 133
911 AAG GCG GGA GGG GAG GTG CCG GCA CGG CTA GCC CCC GCA GCA GCA GTA 958
134 Lys Ala Gly Gly Glu Val Pro Ala Arg Leu Ala Pro Ala Ala Ala Val 149
959 CTA TCT CAA GGT GCA CCT GGG AGA GAA CAA GGT CCA CAC CGC CAG TTT 1006
150 Leu Ser Gln Gly Ala Pro Gly Arg Glu Gln Gly Pro His Arg Gln Phe 165
1007 CAC AGC CTG GAA GAC CTC ATC CGC GAG AAG CGC CTG TAT CGA CGC CAG 1054
166 His Ser Leu Glu Asp Leu Ile Arg Glu Lys Arg Leu Tyr Arg Arg Gln 181
1055 CGG CCG CCT GCG AGT GCT CCA GGA GCT CGC CGA CCT CGT GGA CGA CAA 1102
182 Arg Pro Pro Ala Ser Ala Pro Gly Ala Arg Arg Pro Arg Gly Arg Gln 197
1103 GGA GTA GCC GCC TAG GGG CTG CCG GCC CCT CTG CCT CCC CCG CAC CTC 1150
198 Gly Val Ala Ala *** 202
1151 GCT CCC TTC CCT TCC CCG CAC CCG GAC TTC GCA GTC AGC GGT TCT AAA 1198
1199 CCT CTG CCC CGC CCC GCC ACG CGC GTC CGC CGC CGG TGG CCC GGG CCC 1246
1247 GGG CTT GCA CCC CCG CAT CCC CAA GCC AGC GGC AGG GAA GTC TCA GGA 1294
1295 ACT GCC CCA GGC CGA AAG GCG CCG CTG CGA GCG CCT GGC TGA CAG CCA 1342
1343 CAG CGG TGG TGA CGG TGC TGG GAG ACC CCG CGT GCG CTT TCC CCT TGA 1390
1391 GAT GTA AAC CGG GAA CGG GGA AGG GGC TGA GGG GAG AAA GGA CAT GGC 1438
1439 CTT CCC CGC GAG TCC ATG GCC AGT GAC TGT GGC CCG ACT CGA AAA CAA 1486
1487 CCC TCT TCT CAA AAG GGA CCA TCA CCG CCC CGA GCG TGC GCA CAC AGA 1534
1535 CCG GTC GGA GGC GAG AAC TGG TCT CTA CAG GGC ACA GTT CAG CTC CTC 1582
1583 TGT GGA TGC GTC CCC AGA TCG CAG GAT TTC CAA GAA ATC GAG CCT GTC 1630
1631 CCT TGT GCA CTT GGG AAT AAT TCC CCA AGA CAG CAC TTC GGG ATT CCG 1678
1679 GGT TAT CCT GAG GCT GCC CGG GAC TTT TCC AGC TCT CCA GCC CCA GGT 1726
1727 CTC CTG ACA TTG TGT TCC AGG CTG CGG GCT AAG CCA GAC AGT GTT TGC 1774
1775 CTC CGG TTC TTT CCA CCG TGG GAA GCG AAC GCC ACC CCC ACC CGC CTT 1822
1823 TGC CTG CGA GTC TCC CTC GCT GGC AGA AGG GAA GCC GGC CCG GTC CCG 1870
1871 GGA GGA AGA TGG CCG CTG CGA ATT CGG TGA GGA CAG CCG GCC CCG CCC 1918
1919 CCG ACA AGG AGC TCG CTC GTT CAC CTG GTG TCT GGG AAC TTG AAT GTG 1966
1967 TGA AGG GCG CTT ATT GTT CTG AAC CCT TGA TTG CTC CCT CCT CGG GCT 2014
2015 GCA TTT CAA AAA TAG TCA TAT TTT TAA AGG AGT TGG AGG AGA GGG AGG 2062
2063 GGG AGG ACA TGG CAC CAT TCC AGA AAC CAG CAT TGC TAC AAC ACC ATA 2110
2111 GCC AGT ATA TTT AGC TTT GGC TTT TCC TAA CAT AGA AAT CTT CAA AGC 2158
2159 TGG GGA AGT GG 2169