刺激神经和肾生长的RET配体(RETL).pdf

上传人:奻奴 文档编号:223433 上传时间:2018-02-04 格式:PDF 页数:105 大小:4.81MB
返回 下载 相关 举报
摘要
申请专利号:

CN200410062903.9

申请日:

1997.05.07

公开号:

CN1624126A

公开日:

2005.06.08

当前法律状态:

驳回

有效性:

无权

法律详情:

发明专利申请公布后的驳回|||实质审查的生效|||公开

IPC分类号:

C12N15/12; C12N15/63; C12P21/02; C07K14/47; C07K16/18; A61K38/17; A61K48/00; C12N5/10

主分类号:

C12N15/12; C12N15/63; C12P21/02; C07K14/47; C07K16/18; A61K38/17; A61K48/00; C12N5/10

申请人:

拜奥根有限公司;

发明人:

M·萨尼科拉-纳德尔; C·赫辛; R·L·卡特

地址:

美国马萨诸塞

优先权:

1996.05.08 US 60/017,427; 1996.06.07 US 60/019,300; 1996.07.16 US 60/021,859

专利代理机构:

中国国际贸易促进委员会专利商标事务所

代理人:

赵艳华

PDF下载: PDF下载
内容摘要

本发明涉及编码Ret配体(RetL9)的核苷酸序列以及通过用RetLDNA或蛋白处理细胞和哺乳动物受治疗者以刺激神经和肾的生长的方法。本发明提供了分离纯化的编码RetL的DNA分子,含有任何RetL的核苷酸序列,特别包括鼠retL1 cDNA(SEQ ID NO:1),人部分RetL1cDNA(SEQ ID NO:8),人全长retL1 cDNA(SEQ ID NO:10),人retL2cDNA(SEQ ID NO:12),鼠retL3 cDNA(SEQ ID NO:12)或人retL3cDNA(SEQ ID NO:16),人部分retL3 cDNA(SEQ ID NO:18)或人retL3 cDNA(SEQ ID NO:20)。本发明进一步提供了RetL蛋白,具有包括大鼠RetL1(SEQ ID NO:2),人部分RetL1(SEQ ID NO:9),人全长RetL(SEQ ID NO:11),人RetL2(SEQ ID NO:13),鼠RetL3(SEQ ID NO:17),人部分RetL3(SEQ ID NO:19)或人RetL3(SEQID NO:21)的氨基酸序列。

权利要求书

1: 编码c-Ret配体的核酸,该配体包含至少约400个氨基酸的多肽, 有疏水N端信号序列和含磷脂酰肌醇聚糖连接结构模式的疏水C端序 列。
2: 权利要求1的核酸,编码选自大鼠RetL1(SEQ ID No:2),人 RetL1(SEQ ID No:11),人RetL2(SEQ ID No:13),鼠RetL3(SEQ ID No:17),和人RetL3(SEQ ID No:21)的c-Ret配体。
3: 权利要求1的核酸,编码大鼠RetL1(SEQ ID No:2),人RetL1 (SEQ ID No:11),人RetL2(SEQ ID No:13),鼠RetL3(SEQ ID No:17),和人RetL3(SEQ ID No:21)的氨基酸置换变体。
4: 权利要求3的核酸,其中所述的置换变体与选自大鼠RetL1 (SEQ ID No:2),人RetL1(SEQ ID No:11),人RetL2(SEQ ID No:13),鼠RetL3(SEQ ID No:17),和人RetL3(SEQ ID No:21) 的c-Ret配体对比排列时,表现了与其40%的序列相似性,进一步地其 中所述的置换变体有至少80%半胱氨酸残基与所述c-Ret配体匹配。
5: 权利要求3的核酸,其中所述的置换变体与选自大鼠RetL1 (SEQ ID No:2),人RetL1(SEQ ID No:11),人RetL2(SEQ ID No:13),鼠RetL3(SEQ ID No:17),和人RetL3(SEQ ID No:21) 的c-Ret配体对比排列时,表现了与其80%的序列相似性。
6: 权利要求1的核酸,编码选自大鼠RetL1(SEQ ID No:2),人 RetL1(SEQ ID No:11),人RetL2(SEQ ID No:13),鼠RetL3(SEQ ID No:17),和人RetL3(SEQ ID No:21)的c-Ret配体的截短变体。
7: 权利要求4的核酸,其中截短变体缺少磷脂酰肌醇聚糖连接结构 模式。
8: 具有包含以下核苷酸序列的核酸: (a)选自大鼠retL1 cDNA(SEQ ID No:1),人部分retL1 cDNA(SEQ ID No:8),人retL1 cDNA(SEQ ID No:10),人retL2(SEQ ID No:12), 鼠retL3(SEQ ID No:16),人部分retL3(SEQ ID No:18),和人retL3(SEQ ID No:20)的序列;或 (b)选自大鼠retL1 cDNA(SEQ ID No:1),人部分retL1 cDNA(SEQ ID No:8),人retL1 cDNA(SEQ ID No:10),人retL2(SEQ ID No:12), 鼠retL3(SEQ ID No:16),人部分retL3(SEQ ID No:18),和人retL3(SEQ ID No:20)的序列的退化变体;或 (c)选自大鼠retL1 cDNA(SEQ ID No:1),人部分retL1 cDNA(SEQ ID No:8),人retL1 cDNA(SEQ ID No:10),人retL2(SEQ ID No:12), 鼠retL3(SEQ ID No:16),人部分retL3(SEQ ID No:18),和人retL3(SEQ ID No:20)的序列的多态的变体。
9: 含有权利要求1,2,3,6,7或8的核酸的载体,该核酸作 为其中的插入存在,该载体选择性地包含与所述插入适当连接的表达调控 序列。
10: 包含权利要求9的载体的宿主细胞。
11: 多肽合成方法,此方法包括以下步骤:在细胞培养液中培养权利 要求10的宿主细胞;并回收从所述宿主细胞中的载体插入表达的c-Ret 配体多肽。
12: 含至少约400个氨基酸,有疏水N端信号序列和含磷酸酰肌醇聚 糖连接结构模式的疏水C端的c-Ret配体多肽。
13: 含至少约400个氨基酸,有含磷脂酰肌醇聚糖连接结构模式的疏 水C端的c-Ret配体多肽,该多肽通过除去疏水N端信号序列加工而成。
14: 权利要求13的c-Ret配体多肽,该c-Ret配体多肽与c-Ret结合 时,激发二聚体形成或其自身磷酸化。
15: c-Ret配体选自以下蛋白: (a)大鼠RetL1(SEQ ID No:2),人部分RetL1(SEQ ID No:9),人 RetL1(SEQ ID No:11),人部分RetL2(SEQ ID No:13),鼠部分RetL3 (SEQ ID No:15),鼠RetL3(SEQ ID No:17),人部分RetL3(SEQ ID No:19),和人RetL3(SEQ ID No:21);或 (b)大鼠RetL1(SEQ ID No:2),人部分RetL1(SEQ ID No:9),人 RetL1(SEQ ID No:11),人部分RetL2(SEQ ID No:13),鼠部分RetL3 (SEQ ID No:15),鼠RetL3(SEQ ID No:17),人部分RetL3(SEQ ID No:19),和人RetL3(SEQ ID No:21)的氨基酸置换变体。
16: 含至少约400个氨基酸,有含磷脂酰肌醇聚糖连接结构模式的疏 水C端的可溶的,截短的c-Ret配体多肽,该多肽通过除去疏水N端信 号序列和通过除去上述磷脂酰肌醇聚糖连接结构模式加工而成。
17: 包含权利要求12,13,14,15或16的c-Ret配体多肽的融 合蛋白,该融合蛋白与免疫球蛋白多肽或毒素多肽融合。
18: 包含c-Ret多肽的融合蛋白,该融合蛋白与免疫球蛋白多肽或毒 素多肽融合。
19: 与权利要求12,13,14,15或16的c-Ret配体多肽特异结 合的抗体。
20: 阻断上述c-Ret配体多肽与上述c-Ret多肽结合的抗体。
21: 权利要求20的抗体,该抗体与c-Ret多肽特异结合。
22: 权利要求12,13,14,15或16的c-Ret配体多肽在治疗中 的应用。
23: 权利要求17或18的融合蛋白在治疗中的应用。
24: 权利要求19,20,或21的抗体在治疗中的应用。
25: 在受治疗者体内刺激c-Ret表达组织生长或限制对c-Ret表达组 织的损伤的方法,此方法包括给上述受治疗者施用治疗有效剂量的权利要 求12,13,14,15或16的c-Ret配体多肽,或权利要求17或18的 免疫球蛋白融合蛋白,或权利要求20或21的抗体这一步骤。
26: 权利要求25的方法,其中所述的c-Ret配体多肽与GDNF相关 多肽同时施用。
27: 权利要求25的方法,其中所述的c-Ret表达组织是肾组织或神经 组织。
28: 抑制表达c-Ret的肿瘤细胞生长的方法,此方法包括使上述细胞 与有效量的权利要求16的c-Ret配体多肽,权利要求17的融合蛋白或权 利要求20或21的抗体接触这一步骤。
29: 抑制表达c-Ret的肿瘤细胞生长的方法,此方法包括使上述细胞 与有效量的权利要求16的c-Ret配体多肽,权利要求18的融合蛋白,或 权利要求19或20的抗体接触这一步骤。
30: 调节表达c-Ret多肽或c-Ret配体多肽的细胞中的c-Ret信号传 导的方法,此方法包括使上述细胞与权利要求16的c-Ret配体多肽,权 利要求17或18的融合蛋白,或权利要求20的抗体接触这一步骤。
31: 将毒素,可成像化合物,或放射性核素导向表达c-Ret多肽或c- Ret配体多肽的细胞方法,包括使细胞与:偶联了上述毒素,可成像化合 物或放射性核素的权利要求16的c-Ret配体多肽,权利要求17或18的 融合蛋白;或偶联了上述毒素,可成像化合物或放射性核素的权利要求 20的抗体接触这一步骤。
32: 抑制表达c-Ret多肽或c-Ret配体多肽的肿瘤细胞生长的方法, 包括使上述蛋白与偶联了毒素或放射性核素的权利要求16的c-Ret配体 多肽;权利要求17或18的融合蛋白;或偶联了毒素或放射性核素的权利 要求20的抗体接触这一步骤。
33: 权利要求9的载体在治疗中的应用。
34: 治疗患c-Ret代谢紊乱的对象的方法,包括给上述受治疗者施用 权利要求9的载体这一步骤。
35: 在受治疗者体内刺激c-Ret表达组织生长或限制对c-Ret表达组织 的损伤的方法,包括给上述受治疗者施用权利要求9的载体这一步骤。
36: 权利要求35的方法,其中c-Ret表达组织是肾组织或神经组织。

说明书


刺激神经和肾生长的RET配体(RetL)

    本申请是1997年5月7日申请的中国专利申请97195466.6(题目为刺激神经和肾生长的RET配体(RetL))的分案申请。

    【发明领域】

    本发明涉及编码Ret配体(RetL)的核苷酸序列,以及通过用RetLDNA或蛋白处理细胞和哺乳动物材料以刺激神经和肾生长的方法。

    【发明背景】

    目前关于细胞信号传导和受体激活的研究的目的之一是使细胞生长和存活过程的治疗调节成为可能。这些过程决定多种医学情况,例如器官衰竭,胎儿发育,和肿瘤生长等等的结果。上述每种情况具有世界范围内的临床重要性,并且有效治疗方案有限。本发明的目的是提供促进损伤组织再生或存活和治疗涉及组织生长发育异常的失调的组合物和方法。

    组织遗失和最后阶段器官衰竭每年影响全世界几百万人口并且大量增加了医疗保健费用。器官或组织遗失通常通过移植损献者器官,通过外科手术重建或用机械装置来治疗。上述每种疗法都有缺点。移植受到捐献者缺乏的限制,外科手术重建会导致别的长期问题,机械装置不能完成一个器官的所有功能,因而不能防止进行性的退化。因此,存在真正的医疗需要以找到这些问题新的解决方案。

    影响细胞生长,分化和/或存活的蛋白因子可能对治疗含应答细胞地器官失调有用。在这方面,人们对能与受体蛋白酪氨酸激酶(RPTK)家族的受体相互作用的因子或配体尤其有兴趣。这些受体参与包括细胞生长和分化及瘤发生的多种细胞过程。因而,能与这些受体相互作用的因子或配体可能在治疗有组织损伤的某些器官失调中有用。另外,也可用于阻断这些因子与它们的受体相互作用,以阻止肿瘤生长。

    Ret原癌基因编码受体酪氨酸激酶。在包括外周和中枢神经系统及肾脏的各种组织的发育过程中表达。存在于Ret缺陷型小鼠中的各种异常现象表明Ret对于小肠神经元分布及迁移到后肠,以及肾发育过程中输尿管芽上皮的增殖和分枝具有关键作用(自然367,380-383,1994)。寻找Ret信号传导途径的关键组分,Ret配体,成为人们重点研究的领域。

    发明概述

    本发明提供编码RetL的分离纯化DNA分子,含任何RetL的核苷酸序列,但尤其包括大鼠retL1 cDNA(SEQ ID NO:1),人部分retL1cDNA(SEQ ID NO:8),人全长retL1 cDNA(SEQ ID NO:10),人retL2cDNA(SEQ ID NO:12),鼠retL3 cDNA(SEQ ID NO:16),人部分retL3cDNA(SEQ ID NO:18),或人retL3 cDNA(SEQ ID NO:20)。本发明进一步提供Ret L蛋白,具有包括大鼠RetL1(SEQ ID NO:2),人部分RetL1(SEQ ID NO:9),人全长Ret L1(SEQ ID NO:1),人RetL2(SEQID NO:13),鼠RetL3(SEQ ID NO:17),人部分RetL3(SEQ ID NO:19)或人RetL3(SEQ ID NO:21)的氨基酸序列。

    在另一个实施方案中,本发明包括DNA序列,该序列包含HRL20克隆,美国典型培养物保藏中心编号97 604(1996年6月7日保藏,分类命名为噬菌体λg10人Ret L20(phageλg 10 human Ret 120)),的插入DNA序列[人的部分retL1 cDNA(SEQ ID NO:8)],或#230-5A-86-17克隆,美国典型培养物保藏中心编号98047(1996年5月7日保藏,分类命名为带质粒RET L17的大肠杆菌K12 DH10B(Escherichia coli K12 DH10B with plasmid RETL17)),的插入DNA序列[大鼠的retL1 cDNA(SEQ ID NO:1)]。

    本发明的另一个实施方案中,在原核或真核宿主细胞中用分离纯化的DNA分子稳定表达的多肽产物具有至少部分RetL一级结构构象和生物活性;该DNA可以是a)包括大鼠retL1 cDNA,人的部分retL1 cDNA,人全长retL1 cDNA,人retL2 cDNA,鼠retL3 cDNA或人retL3 cDNA;或者大鼠retL1 cDNA,人的部分retL1 cDNA,人全长retL1 cDNA,人retL2cDNA,鼠retL3 cDNA或人retL3 cDNA的互补链的DNA分子;b)在严格条件下能与a)中所述DNA分子或其片段杂交的DNA分子;或c)因为遗传密码的简并性,能与a)、b)中所述DNA分子杂交的DNA分子。编码人RetL的多肽片段或变体的具有Ret生物活性的分离纯化DNA分子也在本发明之内。

    本发明任何重组DNA分子可以适当地与调控序列相连。

    包含了本说明书其它地方所述的DNA分子或构建体的载体和转化系统也包括在本发明之内。载体可以包含编码RetL或RetL变体的DNA分子。

    本发明包括用含编码天然RetL或RetL变体的DNA分子的载体稳定转化或转染的原核或真核宿主细胞。

    本发明特别包括基本不含其它人类蛋白的分离纯化的人RetL。本发明也包括生产具有部分或全部RetL一级结构构象和生物活性的多肽产物的方法。此方法可以包括在合适的培养条件下,以允许表达这样的多肽产物的方式培养用本发明任何DNA分子转化或转染的原核或真核宿主细胞,并回收RetL。本发明也包括在原核或真核宿主细胞中表达DNA的多肽产物。

    本发明还包括水溶性或膜结合的蛋白,蛋白片段,变体和衍生物。在所选的实施方案中该蛋白具有包括大鼠RetL1;人部分RetL1,人全长RetL1,人RetL2,鼠RetL3或人RetL3的氨基酸序列,或这些序列之一的变体。在其它实施方案中,该蛋白是融合蛋白,包括与另一种分子或分子片段,如免疫球蛋白,毒素蛋白,可成像化合物或放射性核素融合的Ret或RetL。本发明也包括含RetL的嵌合分子。

    本发明的其它实施方案包括对本发明的RetL特异的单克隆抗体。这种抗体可与毒素,可成像化合物或放射性核素结合。本发明还包括产生对Ret特异的抗体的杂交瘤细胞系,包括AA.FF9,AA.HE3,AF.E9,BA.B1,BB.B6,AA.GE7,CD.F11,AH.E3,CD.G4,AG.E7,BD.G6,BH.G8,和这些杂交瘤细胞的亚克隆,以及这些杂交瘤细胞或其亚克隆产生的抗体。

    本发明进一步包括促进新生组织生长,或促进受治疗者损伤组织存活的方法,包括给受治疗者施用有效治疗剂量的能与细胞的Ret相互作用的化合物,并由此诱导Ret的自身磷酸化,该化合物可以是RetL1,RetL2,或RetL3,全长RetL的片段,或可与Ret结合的抗体。该化合物应与有效治疗剂量的第二种化合物如GDNF,neurturin,或GDNF相关分子同时注射。虽然用于这些方法的组织可以包括任何组织,但优选的组织包括肾组织,神经组织,心脏,胃,小肠,脊柱或肺。在一个实施方案中,RetL是可溶的RetL。这些方法的受治疗者是人。

    本发明的另一方法中,表达RetL的第一个细胞和第二个细胞之间的信号传导通过用可溶性Ret蛋白或针对RetL的抗体与第一个细胞接触抑制。可溶性Ret蛋白可以是融合蛋白。

    本发明也包括将毒素,可成像化合物,或放射性核素导向表达Ret的细胞的方法,包括用与毒素,可成像化合物或放射性核素偶联的RetL融合蛋白或抗Ret抗体接触细胞。该RetL可以是RetL1,RetL2或RetL3。另一种方法中,其中一步是使肿瘤细胞与RetL和毒蛋白或放射性核素的融合蛋白或偶联了毒蛋白或放射性核素的Ret抗体接触,从而抑制表达Ret的肿瘤细胞的生长。该细胞可以在受治疗者体内,该蛋白和偶联的抗体被施用给受实验者。

    本发明还包括将毒蛋白,可成像化合物,或放射性核素导向表达RetL的细胞的方法,包括用Ret与毒素,可成像化合物,或放射性核素的融合蛋白或偶联了毒蛋白,可成像化合物,或放射性核素的RetL抗体与细胞接触。另一个实施方案是抑制表达RetL的肿瘤细胞生长的方法,包括用Ret与毒素或放射性核素的融合蛋白或偶联了毒蛋白,放射性核素的RetL抗体与肿瘤细胞接触;该细胞可位于受治疗者体内,蛋白施用给受治疗者。

    本发明中所有方法使用的RetL都可以是RetL1,RetL2或RetL3,或者RetL1,RetL2,RetL3的变体或片段。

    本发明还包括基因治疗方法。一个实施方案是治疗患Ret代谢紊乱的对象的方法,包括向受治疗者施用含编码RetL的DNA分子的载体,以及促进受治疗者新生组织生长的方法,包括施用这样的载体给受治疗者。另一个实施方案包括促进受治疗者体内损伤组织存活的方法,其中一步是向受治疗者施用有效治疗剂量的编码RetL的载体。

    附图简述

    图1是大鼠RetL的cDNA序列(SEQ ID NO:1)和推测的氨基酸序列(SEQ ID NO:2)。核苷酸序列从SEQ ID NO:1序列的第201位碱基对延伸到第1700位碱基对,包含整个开放阅读框架。

    图2A是人RetL1的部分cDNA序列(SEQ ID NO:8)和推测的氨基酸序列(SEQ ID NO:9)。该序列是HRL20克隆,以编号97604保存于美国典型培养物保藏中心,的插入片段。

    图2B是人RetL1的合成的全长DNA序列(SEQ ID NO:10)和推测的氨基酸序列(SEQ ID NO:11)。

    图3A是人RetL1的核苷酸序列(上行序列)与鼠RetL1序列(下行序列)的比较,核苷酸之间的垂直线表示在该位点上是相同的,点表示在该位点有间隙。

    图3B是人RetL的氨基酸序列(上行序列)与大鼠RetL1序列(下行序列)的比较。相应氨基酸之间的垂直线表示残基相同,点表示该残基保守性取代。

    图4A是在后肾间质细胞和输尿管芽细胞相互作用中Ret和RetL的可能作用的图示。

    图4B是从cDNA文库转染子中筛选表达RetL的克隆的方法图示。通过估计这些转染子与Ret/IgG融合蛋白或Ret/碱性磷酸酶融合蛋白的结合来检测转染子中是否有RetL表达。

    图5是表示构建用于表达大鼠Ret/IgG融合蛋白的质粒的图示。

    图6是表示构建用于表达人Ret/IgG融合蛋白的质粒的图示。

    图7是从DSW240克隆中得到的人retL2的cDNA序列(SEQ ID NO:12)和推测的氨基酸序列(SEQ ID NO:13)。含有位于25位到1416位核苷酸之间的蛋白阅读框架。

    图8是人RetL2的氨基酸序列(上行序列)与人RetL1序列(下行序列)的比较。氨基酸之间的垂直线表示该位置相同,点表示该位置留有间隙。

    图9是鼠RetL3的cDNA序列(SEQ ID NO:16)和推测的氨基酸序列(SEQ ID NO:17)。

    图10是人RetL3的cDNA序列(SEQ ID NO:20)和推测的氨基酸序列(SEQ ID NO:21)。

    发明详述

    序列登记号

    说明书中提及的核苷酸和氨基酸序列已被赋予以下序列登记号。

    SEQ ID NO:1-大鼠retL1 cDNA

    SEQ ID NO:2-大鼠RetL1氨基酸

    SEQ ID NO:3-寡聚体kid-13

    SEQ ID NO:4-寡聚体kid-14

    SEQ ID NO:5-寡聚体kid-15

    SEQ ID NO:6-大鼠胞外retL1 cDNA

    SEQ ID NO:7-大鼠胞外RetL1氨基酸

    SEQ ID NO:8-人部分retL1 cDNA

    SEQ ID NO:9-人部分RetL1氨基酸

    SEQ ID NO:10-人retL1 cDNA

    SEQ ID NO:11-人RetL1氨基酸

    SEQ ID NO:12-人retL2 cDNA

    SEQ ID NO:13-人RetL2氨基酸

    SEQ ID NO:14-鼠部分retL3 cDNA(EST AA 50083)

    SEQ ID NO:15-鼠的部分RetL3氨基酸

    SEQ ID NO:16-鼠retL3 cDNA

    SEQ ID NO:17-鼠RetL3氨基酸

    SEQ ID NO:18-人部分retL3 cDNA

    SEQ ID NO:19-人部分RetL3氨基酸

    SEQ ID NO:20-人retL3 cDNA

    SEQ ID NO:21-人RetL3氨基酸

    定义

    如本文所用的,术语“RetL”是指任何能与Ret受体蛋白特异性相互作用的蛋白,并且当它与Ret作用时可激发Ret形成二聚体和/或Ret酪氨酸激酶结构域发生自身磷酸化。编码RetL和Ret的DNA序列分别称为“retL”和“ret”。配体可以是可溶的或以与它要激发其自磷酸化的Ret分子位于同一细胞或不同细胞的膜结合分子存在。特定应用或在与Ret相互作用中,配体可能需要别的分子来激发自身磷酸化。本发明的配体包括辅助受体或附属的配体辅因子。本发明的配体进一步包括抗Ret的单克隆抗体,该抗体可作为Ret拮抗物,激发Ret二聚体化和自身磷酸酸化。配体也可用各种方法修饰,如掺入为融合蛋白的一部分,如与毒素或放射性核素结合。

    对于“序列匹配”,是指将一种核苷酸或氨基酸的序列与另一种放在一起,以比较两种序列的相关部分。此过程的一种方法的例子在Needleman等(分子生物学杂志48:443-453,1970)中给出。通过计算机程序如Align程序(DNAstar,Inc.)可方便地运用此方法。在本领域的技术人员可以理解同源或功能相同的序列包括保守半胱氨酸骨架中半胱氨酸残基功能相同的排列,包括虽然改变了这些半胱氨酸线性排列但没有实质地损害蛋白质折叠结构中半胱氨酸相互关系的氨基酸插入或缺失。因此,在计算所选的和引用的序列之间氨基酸序列的同源性或同一性水平时,忽略所选序列中的中间空隙和氨基酸插入。常用于建立蛋白质同源性的一个特征是一种蛋白与另一种蛋白之间半胱氨酸残基数目及位置的相似性。

    对于“克隆”,是指用体外重组技术将特定基因或其它DNA序列插入载体分子。为了成功地克隆所需的基因,必须采用获得DNA片段,连接片段到载体分子,将合成的DNA分子导入能在其中复制的宿主细胞,以及从受体宿主细胞中筛选含目的基因的克隆等的方法。

    对于“cDNA”,是指通过RNA依赖型DNA聚合酶(逆转录酶)的作用由RNA模板生成的互补或拷贝DNA。因此“cDNA克隆”就指在克隆载体中带有的与所需RNA分子互补的双链DNA序列。

    对于“cDNA文库”,是指含有cDNA片段插入的重组DNA分子的集合体,cDNA插入片段依赖RNA模板的来源包含了整个有机体或组织的mRNA分子的代表。这样的cDNA文库可以用技术人员已知的方法制备,举例来说,在Maniatis等,分子克隆:实验手册,同上中描述。一般地,首先从有机体细胞中分离RNA,其基因组中含有所要克隆的特定基因。对于本发明的目的,优选哺乳动物,特别是人的细胞系。另外,RNA也可以从来自动物肿瘤,优选地来自人肿瘤的肿瘤细胞中提取。因此,文库可以从,例如人肾上腺瘤制备,但任何肿瘤都可以使用。

    如此处所用的,术语“DNA多样性”是指在DNA的特定位点可以存在两个或多个不同的核苷酸序列的情况。

    “表达载体”包括能表达其中所含的DNA序列,即与能影响它们表达的其它序列适当连接的编码序列的载体。尽管没有每次明确指出,但含有这些表达载体必须能在宿主有机体中以附加体或染色体的整合部分复制的意思。有效表达载体的一个有用的但非必须的元件是标记编码序列,该序列编码使具有该蛋白的细胞有表型特征(例如四环素抗性)的蛋白,使得这些细胞可以容易地得到鉴别。总之,“表达载体”被赋予了功能性定义,当它用于特定序列时任何能影响特定的所含基因编码区表达的DNA序列都包括在此术语内。这些载体经常是以质粒的形式,因此“质粒”和“表达载体”经常通用。但是,本发明预期包括其它形式的表达载体,包括噬菌体,它可以起到同样的作用,并且会慢慢在本领域变得公知。

    同样,本发明中的任何一种蛋白的基因的“功能衍生物”是指基因的“片段”,“变体”和“类似物”,它们在核苷酸序列上“基本相似”,并且编码具有相同活性的分子。

    “GDNF相关分子”是指与GDNF或neurturin有至少40%同源性并且也能与RetL特异性结合的任何分子。

    术语“基因”是指编码多肽的多聚核苷酸序列。

    对于“同源的”,是指当提及多肽或DNA序列时,在所考虑的组合中基本上所有分子的一级分子结构(即氨基酸或核苷酸序列)是相同的。

    此处在提及探针,要检测的寡聚体片段,寡聚体对照,非标记封闭寡聚体和用于序列扩增的引物时所用的术语“寡聚核苷酸”被定义为包含多于三个脱氧核糖核苷酸或核糖核苷酸的分子。它的确切的大小依赖于许多因素,按顺序依赖最终的功能或寡核苷酸的用途。

    术语“探针”是指已知特性的能选择性结合目的抗配体的配体。用于核酸时,术语“探针”是指含有与靶链互补碱基序列的核酸链。

    “重组宿主细胞”是指用重组DNA技术构建的载体转化的细胞。如此处定义的,由于转化作用重组宿主细胞产生抗体或其修饰物而不是如未转化宿主那样产生很少的量,或更通常地,比可测量更少的量。

    如此处所用的,术语“限制性内切酶”和“限制性酶”是指每一种在或接近特定核苷酸序列处切割双链DNA的细菌酶类。

    如此处所用的,术语“限制性内切酶片段长度多态性”(“RFCP”)是指在个体之间特定的限制性内切酶片段长度不同。

    如果两个分子的氨基酸序列基本相同,并且具有相似的生物活性,其中一个分子被称为与另一个分子“基本相似”。因此,只要二个分子具有相似活性,就认为它们是如此处所用的术语变体,即使其中一个分子含有另一个分子中没有的额外氨基酸残基或者氨基酸残基序列不同。正如此处所用的,当一个分子含有另外的不是另一个分子正常的一部分的化学组分时,该分子称为另一分子的“化学衍生物”。这些组分可以提高分子的溶解度,吸收值,生物半衰期等。这些组分也可以选择地降低分子的毒性,去除或减轻分子任何不需要的副作用等。能介导这些效应的组分例如在Remington′s Pharmaceutical Sciences,第16版,Mack出版公司,Easton,Penn.(1980)中公开。

    “载体”是指DNA片段可以插入或克隆到其中的来自质粒或噬菌体的DNA分子。载体会包含一个或多个单酶切位点,能够在特定的宿主或载体有机体中自主复制从而克隆的序列是可复制的。

    “基本纯”是指本发明的任何蛋白或编码任何这样蛋白的基因,基本上不含其它蛋白或基因,相应地也不含任何一般可能在自然界中发现的其它污染物以及以自然界中未发现的形式存在的物质。

    本发明的化合物

    本发明包括编码RetL的cDNA,如大鼠retL1 cDNA,人部分retL1cDNA,人全长retL1 cDNA,人retL2 cDNA,鼠retL3 cDNA或人retL3cDNA。另外,本发明的化合物包括含有上述序列的序列或这些序列之一的衍生物。本发明也包括载体、脂质体和其它包含这些序列之一或这些序列之一的衍生物的载体工具。本发明也包括从大鼠retL1 cDNA,人部分retL1 cDNA,人全长retL1 cDNA,人retL2 cDNA,鼠retL3 cDNA或人retL3 cDNA转录翻译的蛋白,但不限于鼠RetL1,人部分Ret1,人全长Ret1,人RetL2,鼠RetL3,或人RetL3,和它们的衍生物和变体。

    本发明的一个实施方案包括RetL的可溶性变体。可溶性变体缺少至少天然RetL的跨膜区部分。在一些例子中,可溶性变体缺少天然RetL的磷脂酰肌醇糖苷键。可溶性变体包括含有缺少磷脂酰肌醇结构域的RetL衍生物的融合蛋白。

    变体可以在氨基酸序列或在不涉及序列的方面,或二个方面同时与天然存在的RetL不同。当一个或多个天然存在的RetL中的氨基酸被不同的天然氨基酸,氨基酸衍生物或非天然氨基酸取代时,产生氨基酸序列变体。特别优选的变体包括天然存在的RetL,或天然存在的RetL的生物活性片段,它们的序列由于一个或多个保守的氨基酸替换与野生型序列不同,这些不同一般地对蛋白质或肽的二级结构和疏水性影响很小。变体也可以具有由于一个或多个非保守的氨基酸替换,缺失或插入而不同的序列,并且不失去RetL生物活性。保守的氨基酸替换典型地包括一个氨基酸替换另一个具相似特征的氨基酸,如下面几组之间的取代:缬氨酸,甘氨酸;甘氨酸,丙氨酸;缬氨酸,异亮氨酸;天冬氨酸,谷氨酸;天冬酰氨,谷氨酰氨;丝氨酸,苏氨酸;赖氨酸,精氨酸;和苯丙氨酸,酪氨酸。非极性(疏水性)氨基酸包括丙氨酸,亮氨酸,异亮氨酸,缬氨酸,脯氨酸,苯丙氨酸,色氨酸和甲硫氨酸。极性中性氨基酸包括甘氨酸,丝氨酸,苏氨酸,半胱氨酸,酪氨酸,天冬酰胺和谷氨酰胺。带正电荷(碱性)氨基酸包括精氨酸,赖氨酸和组氨酸。带负电荷(酸性)氨基酸包括天冬氨酸和谷氨酸。

    其它的保守的氨基酸替换可从下表中看出。并且还有其它的由Dayhaff在蛋白序列和结构图表集中描述。

                                 表1保守的氨基酸替换被替换氨基酸 符号 用以下任一氨基酸替换  丙氨酸  A D-Ala,Gly,B-Ala,L-Lys,D-Cys  精氨酸  R D-Arg,Lys,高-Arg,D-高-Arg,Met,D-Met,Ile,D- Ile,鸟氨酸(Orn),D-Orn  天门酰胺  N D-Asn,Asp,D-Asp,Glu,D-Glu,Gln,D-Gln  天门氨酸  D D-Asp,D-Asn,Asn,Glu,D-Glu,Gln,D-Gln  半胱酸  C D-Cys,S-甲基-Cys,Met,D-Met,Thr,D-Thr  谷氨酰胺  Q D-Gln,Asn,D-Asn,Glu,D-Glu,Asp,D-Asp  谷氨酸  E D-Glu,D-Asp,Asp,Asn,D-Asn,Gln,D-Gln  甘氨酸  G Ala,D-Ala,Pro,D-Pro,β-Ala,Acp  异亮氨酸  I D-Ile,Val,D-Val,Leu,D-Leu,Met,D-Met  亮氨酸  L D-Leu,Val,D-Val,Met,D-Met  赖氨酸  K D-Lys,Arg,D-Arg,高-Arg,D-高-Arg,Met,D-Met, Ile,D-Ile,Orn,D-Orn  甲硫氨酸  M D-Met,S-甲基-Cys,Ile,D-Ile,Leu,D-Leu,Val,D- Val,正亮氨酸  苯丙氨酸  F D-Phe,tyr,D-Thr,L-Dopa,His,D-His,Trp,D-Trp 反式3,4或5-苯脯氨酸,顺式3,4或5苯脯氨酸  脯氨酸  P D-Pro,L-I-thioazolidine-4-羧酸,D-或L-1- Oxazolidine-4-羧酸  丝氨酸  S D-Ser,Thr,D-Thr,别-Thr,Met,D-Met,Met(O), D-Met(O),Val,D-Val  苏氨酸  T D-Thr,Ser,D-ser,别-Thr,Met,D-Met,Met(O),Val, D-Val  酪氨酸  Y D-Tyr,Phe,D-Phe,L-Dopa,His,D-His  缬氨酸  V D-Val,Leu,D-Leu,Ile,D-Ile,Met,D-Met

    本发明中的其它变体是具提高了肽稳定性的各种修饰的那些变体。这样的变体包括,例如,在肽序列中的一个或多个非肽键(替换肽键)。也包括:含不是天然存在的L-氨基酸残基的变体,如D-氨基酸或非天然存在的或合成的氨基酸,如β或γ氨基酸和环状变体。D-型代替L-型氨基酸掺入到多肽中可提高它对蛋白酶的抗性。见,例如美国专利5,219,990。

    本发明的肽也可以由诸如保守的或非保守的插入,缺失和替换的各种改变修饰,在它们的应用中这样的改变可能带来某些优点。剪接变体也特别地包括在本发明中。

    除了基本上地全长多肽外,本发明提供这些多肽的生物活性片段。如果RetL多肽或片段表现出天然存在的RetL的生物活性,那么它是具有生物活性的。这些生物活性包括特异性结合Ret的胞外区域的能力,其亲合力至少是天然存在的RetL对Ret胞外部分亲合力的50%,并优选地与之相同。另一种生物活性是具有与导向天然存在的RetL上的抗原决定基的抗体结合的能力。

    在其它的实施方案中,具有较低保守性的氨基酸替换的变体也可能导致所需的衍生物,例如通过引起电荷,构象和其它生物特性的改变。这些替换可以包括,例如亲水残基替换成疏水残基,半胱氨酸或脯氨酸残基替换成另一种残基,具小侧链的残基替换成具大侧链的残基,具净正电荷的残基替换成具净负电荷的残基。当不能肯定地推测给定的替换的结果时,根据此处公开的方法可以稳定地分析这些衍生物以确定所需特性的存在或缺少。

    一般地,期望引起Ret多肽功能特性改变的替换如下:(i)疏水性残基,例如,亮氨酸,异亮氨酸,苯丙氨酸或丙氨酸替换亲水性残基,例如,丝氨酸或苏氨酸。(ii)半胱氨酸残基被任何其它残基替换;(iii)具带正电侧链的残基,例如,赖氨酸,精氨酸或组氨酸被带负电的氨基酸,例如谷氨酸或天冬氨酸替换;或(iv)带大侧链的残基,例如苯丙氨酸被不带这样的侧链的残基,例如甘氨酸替换。

    在本发明范围内的变体包括在氨基酸序列上与大鼠RetL1(SEQ IDNO:2),人部分RetL1(SEQ ID NO:9),人全长RetL1(SEQ ID NO:11),人RetL2(SEQ ID NO:13),鼠RetL3(SEQ ID NO:17),人部分RetL3(SEQ ID NO:19)或人RetL3(SEQ ID NO:21)有至少60%同源性的蛋白质和肽。更优选地,序列同源性是至少80%,至少90%,或至少95%。为了确定同源性,比较的序列长度一般是至少8个氨基酸残基,通常至少20个氨基酸残基。本发明的化合物变体也包括任何1)具有与本发明的RetL蛋白有至少40%同源性的氨基酸序列,和2)在置于与Ret序列的最佳匹配(如图8中表示的Ret1和Ret2)之后,其半胱氨酸残基至少有80%与本发明的RetL蛋白的半胱氨酸匹配。

    正如可能置换支架的取代基一样,也可能用具有相似特性的基因替换结合在支架上的功能基团。这种修饰并不改变一级结构。这些初始会是保守的,即替换基团有与原始基因大致相同的大小,形状,疏水性和电荷。非序列修饰可能包括,例如,天然存在的RetL的一部分的体内或体外化学衍生物,以及乙酰化,甲基化,磷酸化,羧化或糖基化的改变。

    本发明也包括与本发明的蛋白或蛋白片段特异性结合的试剂。这些试剂包括Ig融合蛋白和抗体(包括单链,双链,Fab片段等,它们或者是天然的,人工的,原始的,或者是嵌合的)。这些试剂目录的附加描述在PCT申请95/16709中,此处引用其说明书作为参考。

    实验步骤

    总体策略

    图4A和4B显示了用来克隆RetL1的基本策略。我们的策略基于这样一个前提,至少一种RetL在发育的肾的后肾间充质中表达为膜蛋白(尽管该配体也可能以可溶性形式表达;图4A)。RetL与输尿管芽细胞上的Ret受体结合,激活酪氨酸激酶胞质结构域并向核内传递信号,从而按顺序激活参与输尿管芽生长和分枝的基因。因此,含与人免疫球蛋白G1(IgG1)的Fc部分或碱性磷酸酶(AP)融合的RET胞外区域的蛋白可用作克隆RetL策略的一部分(如图4B所示)。克隆RetL1用到的融合蛋白,表达文库和其它试剂在下面描述。

    我们首先分离出大鼠RetL1的cDNA,然后用它作为探针分离人RetL1的cDNA。随后分离RetL2和RetL3的cDNAs。

    直接表达RetL配体的克隆所需试剂的制备

    1.分离编码大鼠Ret胞外结构域cDNA

    为鉴定出RetL1,构建了与其它蛋白融合的含大鼠或人Ret胞外结构域的融合蛋白,在一个实施例中与人IgG1的Fc区融合,在另一个实施例中与碱性磷酸酶融合。如图4B所示两种融合配偶体都可很容易的用来检测表达配体的细胞。

    由于编码大鼠Ret的cDNA还没有公开,我们用逆转录-聚合酶链式反应(RT-PCR)的方法分离编码大鼠Ret受体胞外结构域的cDNA。我们比较了人(基因库收录号M5746和X15262)和鼠(基因库收录号X67812)ret的两个核苷酸序列并根据两个序列之间高度同源区域设计寡核苷酸引物。命名为kid-013的正向寡聚体(SEQ ID NO:3;包含基因库序列X15262的150-169位核苷酸)选自人ret cDNA 5′端序列,与ATG启始密码子重叠。为了克隆在其5′端含一个NotI内切酶位点。所选的命名为kid-014(SEQ ID NO:4;包含基因库序列M57464的1819-1839位核苷酸的互补序列)和kid-015(SEQ ID NO:5;包含基因库序列X67812的1894-1914位核苷酸的互补序列)的两个寡聚体分别选自对应于人和鼠的编码跨膜结构域序列的cDNA的5′端。为了克隆,寡聚体kid-014和kid-015在它们的5′端含有另外的核酸,编码一个SalI限制酶位点。

    从14天大鼠胚胎肾分离出总RNA,用寡聚脱氧胸腺嘧啶柱层析法纯化mRNA。用AMV反转录酶从mRNA合成cDNA,用寡聚体kid-013和kid-015在标准的聚合酶链式反应中使用Taq聚合酶将cDNA转变成双链cDNA并扩增。在1%琼脂糖凝胶中将PCR反应样品电泳以确定1942bp PCR产物的合成。剩余的PCR片段用NotI和SalI消化后克隆到事先用NotI和SalI消化过的pSAB132中。所得质粒命名为pJC011。包含在质粒pJC011的NotI和SalI位点之间的完整插入得到测序,证明为大鼠ret胞外区域cDNA,SEQ ID NO:6。翻译该序列揭示该大鼠Ret胞外域的肽序列(SEQ ID NO:7)。因为用于PCR的寡聚体选自人和小鼠的ret序列,所以可能所示为大鼠ret胞外域cDNA的核苷酸序列和所示为大鼠Ret的蛋白质序列在kid-013和kid-015区域可能与天然的大鼠ret核苷酸和Ret肽序列不同。随后从18天大鼠胚胎肾cDNA文库分离ret cDNA克隆并且观察在引物区域的一些核苷酸变化,结果是2个氨基酸改变。一个改变在信号序列中(5位的精氨酸变成苏氨酸),一个改变邻近胞外结构域的末端(633位的谷氨酸变成丙氨酸)。这两个变化应该不影响配体结合。

    2.Ret/IgG融合蛋白

    与人IgG1的Fc部分融合的含大鼠(氨基酸残基#1-637)或人(氨基酸残基#1-636)的Ret受体的胞外域的融合蛋白得到制备。

    用于表达大鼠Ret/IgG融合蛋白的质粒构建过程在图5中扼要描述。为构建编码大鼠Ret/IgG融合蛋白的基因,用SalI消化含大鼠Ret胞外域的质粒pJC011(如上所述),并把它与来自质粒2-4的700bp SalI片段连接以得到质粒pJC012。这个SalI片段含有来自质粒pSAB144的部分人IgG1 Fc结构域。质粒2-4事先经三方连接构建:经PCR获得含兔TGF-βII型受体的胞外结构域的NotI-SalI片段;来自pSAB144的含部分人IgG1 Fc结构域的693bp SalI-NotI片段;经NotI酶切的pSAB132。如图5所示,从2-4质粒中可释放出含Fc结构域的700bp SalI片段。用pJC102转染入COS细胞,48小时后用蛋白-A sepharose层析柱从培养物中纯化大鼠Ret/IgG融合蛋白。为了获得合成大鼠Ret/IgG蛋白的稳定细胞系,分离来自pJC012的含大鼠完整Ret/IgG融合蛋白的2612bp NotI片段并将其克隆入表达载体pMDR901的NotI位点。所得质粒命名为pJC022。质粒pJC022转染入CHO细胞以产生稳定细胞系。最高产量的细胞系适于悬浮培养。大鼠Ret/IgG CHO细胞系的典型产量为75mg/L。

    用于表达人Ret/IgG融合蛋白的质粒的构建在图6中扼要描述。为构建编码人Ret/IgG融合蛋白的基因,我们从M.Takahashi博士(病理学系,Nagoya大学,医学院,Nagoya,日本)处得到含编码人Ret受体的cDNA的质粒。用寡聚体kid-013和kid-014从该质粒上合成PCR片段。PCR片段经Klenow处理后用NotI消化以得到具NotI粘端和平端的PCR片段。载体pGEM 11zf(+)事先用EcoRI消化后用Klenow补平,再用NotI酶切以获得NotI粘端和平端,从而将上述PCR片段克隆入经上述步骤处理过的pGEM 11zf(+)中。所得质粒命名为pJC013。在pJC013用NotI完全酶解和SalI部分酶解后分离1916bp的NotI-SalI片段,并将该片段与含部分人IgG1 Fc结构域的来自pSAB144的693bp SalI-NotI片段连接;并与用NotI酶切的pSAB132表达质粒连接。所得质粒命名为pJC015。pJC013中的插入片段得到测序并发现含有一个核苷酸的不同改变了人Ret胞外结构域中一个氨基酸(基因库序列M57464在812有一个C,而pJC013在相应位置为T;这就导致了人Ret蛋白序列的氨基酸294位丙氨酸变成缬氨酸)。通过对质粒pJC013定点突变使这个核苷酸纠正为基因库序列M57464的特定的C残基,从而得到质粒pJC023。分离来自pJC023的含修复的核苷酸序列的585bp BstE2片段并将其克隆入质粒pJC015中,其中含变异核苷酸的585bp BstE2片段已从pJC015去除。新的质粒命名为pJC024。分离来自pJC024的含完整人Ret/IgG融合蛋白的2609bp NotI片段并将其克隆入表达载体pMDR901的NotI位点。所得质粒命名为pJC025。将质粒pJC025转染入CHO细胞以获得稳定细胞系。最高产量的细胞系适于悬浮培养。人Ret/IgG CHO细胞系的典型产量为6mg/L。

    关于本发明的方法中使用的载体的构建的细节在PCT申请94/01456和92/02056中给出,此处引用其说明书作为参考。

    3.Ret/IgG融合蛋白的生物活性

    为了确定我们制备的Ret/IgG融合蛋白是否具有生物活性并因此可作为RetL克隆良好的筛选试剂,我们做了几种器官培养的生物活性测定。器官培养分析包括在50ug/ml浓度的Ret/Ig融合蛋白存在时,在器官培养基中培养13-14天的大鼠胚胎肾。肾也在有IFA-3TIP/IgG或媒介缓冲液存在时培养。经一定时期培养后,用荧光标记的植物凝集素DolichosBiflorus凝集素(DB植物凝集素)对其中一些肾进行染色,DB植物凝集素对来自输尿管芽的上皮细胞集合管组织染色。既然Ret在输尿管芽和其上皮衍生物中表达,那么这些“DB”阳性细胞标记着Ret阳性细胞。这些提供了对胚胎肾生长和发育中Ret/IgG融合蛋白粗略的评估。在有LFA-3TIP时培养的肾和在有大鼠Ret/IgG融合蛋白时培养的肾之间集合管的形态和生长有显著的不同。Ret/IgG处理的肾的集合管分枝明显更少,并且典型地,总体更小。

    从其它肾制备石蜡切片用于组织学观察。用对照缓冲液或Ret/IgG处理胚胎肾,然后用苏木素和伊红染色。Ret/Ig处理的胚胎肾集合管比对照缓冲液处理的胚胎肾集合管的分枝更少。另外,Ret/IgG处理的肾有较少的集合小管。我们也观察到人Ret/IgG融合蛋白的这种效应。这些现象与融合蛋白阻断间充质与输尿管芽之间的诱导信号一致。因此我们认为该融合蛋白是克隆RetL的良好试剂。

    4.Ret/碱性磷酸酶融合蛋白

    受体/碱性磷酸酶(AP)融合蛋白已成功地用于鉴定和克隆c-kit的配体(细胞63:185,1990),孤独受体的eph家族成员配体(细胞79:157,1994),以及最近用于克隆ob基因的产物leptin受体(细胞83:1263,1995)。构建编码大鼠Ret/AP融合蛋白的质粒,在COS7细胞中于细胞培养瓶中合成大鼠Ret/AP蛋白。接着得到平均表达10mg/L融合蛋白的稳定NIH3T3细胞系。大鼠Ret/AP蛋白的SDS-PAGE分析表明它的大小与推测分子量一致,并且凝胶过滤分析表明它以二聚体形式合成。通过抗AP柱上亲和层析得到部分纯化。

    5.抗Ret抗体

    抗大鼠Ret/IgG融合蛋白的兔多克隆抗体得到制备。该抗体用于Western杂交,Ret阳性细胞系的PACS分析以及胚胎肾切片的免疫组织化学分析。

    一组抗大鼠Ret的仓鼠单克隆抗体得到制备。与蛋白A sepharose偶联的大鼠Ret/IgG融合蛋白用于免疫亚美尼亚仓鼠。融合后得到316个克隆并筛选它们在ELISA分析中与大鼠Ret融合蛋白和/或人IgG结合的能力。11个克隆产生只结合大鼠Ret/IgG(和大鼠Ret/AP),不结合人IgG的抗体。与人Ret的交叉反应性用FACS分析;4个克隆产生能与Ret阳性的人细胞系THP-1结合的抗体。下表概括了12个单克隆抗体的Ret结合特性。    克隆  ELISA(大鼠Ret/Ig)  FACS(人THP-1)    AA.FF9.5    +    -    AA.HE3.7    +    +    AF.E9.5    +    -    BA.B1.16    +    -    BB.B6    +    -    AA.GE7.3    +    -    CD.F11.2    +    -    AH.E3.11    +    +    CD.G4.2    +    +    AG.E7.9    +    -    BD.G6    +    +    BH.G8    -    -

    6.cDNA表达文库

    我们从大鼠胚胎肾制备cDNA文库,一个在CDM8载体中,利用SV40复制子扩增,另一个在修饰的InVitrogen载体pCEP4中,利用EBV复制子扩增。修饰的载体CH269已去除EBNA-1基因序列。EBNA-1蛋白与EBV复制子相互作用,但当使用稳定表达EBNA蛋白的细胞时,这个基因不需要在载体上。以CDM8为载体的文库包含1.5×106个平均插入大小为1.18kb的克隆,而以CH269为载体的文库包含大约1×106个平均插入大小为1.5kb的克隆。

    Ret配体RetL1的表达克隆

    A大鼠Ret配体RetL1的克隆

    1.Ret配体RetL1的表达克隆的最初尝试

    尝试了许多直接表达方法以克隆RetL1。所有这些方法都是基于图4B中描述的概念。cDNA文库中的cDNA导入哺乳动物细胞;有RetL1导入的细胞可以用Ret融合蛋白鉴定。尽管下述三种方法是不成功的,但获得了重要的知识和技巧,它们在后来的成功方法中使用.

    a.用Ret/IgG淘选法—利用淘选法[Aruffo和Seed,美国国家科学院院报84:8753-8757(1987)],通过直接表达克隆,用大鼠Ret/IgG融合蛋白来分离RetL1。淘选法利用18天的大鼠胚胎肾cDNA文库。利用DEAE-葡聚糖法将来自文库的cDNA组(每组5,000-10,000 cDNAs)转入COS细胞中。48小时后,细胞用EDTA从培养皿转出,与融合蛋白一起温育,接着在用抗人IgG1抗体覆盖的平板上淘选。从贴壁细胞提取DNA并再转化入大肠杆菌,接着分离DNA用于第2轮淘选。第三轮淘选后我们看不到任何细胞结合,并且在将Hirt DNA转化回大肠杆菌后,得到极少克隆。VCAM cDNA与抗VCAM单克隆抗体结合用于作为一个阳性对照,可以以1∶100比例稀释并仍可检测到;表明我们的库的大小可能太大。对第二轮淘选后获得的一些克隆的分析,表明这些克隆存在重排和缺失。

    b.使用Ret/IgG的制备FACS法—将来自18天大鼠胚胎,肾文库(CDM8载体)的80,000cDNA转入COS7细胞中并在使用大鼠Ret/IgG蛋白接着用荧光标记的二抗的制备FACS中使用。收集较高的0.5%和0.9%的发荧光细胞并且用Hirt裂解法提取质粒DNA。将DNA电击回大肠杆菌中:从0.5%的组中得到228个克隆,从0.9%的组中得到752个克隆。从细菌克隆提取DNA并进行第二轮制备FACS。分析从第二轮结束时的细菌克隆提取的质粒发现含有较多的缺失和重排。

    c.使用Ret/AP的比色检测法—用来自18天大鼠胚胎肾cDNA文库(CDM8载体)的400个cDNA克隆组转染COS细胞并用Ret/AP蛋白和碱性磷酸酶比色底物染色。在显微镜下观察转染细胞的阳性信号。在一次试验中,重新分析5个可能阳性的克隆,但均为阴性。

    作为Ret/AP蛋白的对照,通过将人VCAM的前两个结构域融合到胎盘AP的N端制备VCAM/AP蛋白(VCAM与integrin VLA4结合,VLA4包括α-4和β-1两条链)。瞬间转染的COS细胞产生足够的VCAM/AP蛋白用于对照实验。把VCAM/AP蛋白跟与AP直接偶联的VCAM/IgG及VCAM/IgG外加AP偶联的二抗作比较,以评估它们检测用α-4链cDNA转染的COS细胞上VLA4的能力(COS细胞已表达β-1链)。结果表明尽管VCAM/AP蛋白能检测到转染细胞上的VLA4,但最好的检测方法是通过将VCAM/IgG蛋白与AP偶联的二抗结合进行。

    d.方法学结论:

    从这些初始克隆尝试中可得到三个主要结论:

    1)当目的cDNA的丰度很低时,要求回收质粒DNA用于下一轮(即淘选和制备FACS的方法)不合适,因为在这些后续的循环中会出现重排和缺失。基于Ret的表达低,有很好的理由猜想RetL1的表达也低。优选的方法是以组转染并用一种能鉴定出阳性组的检测方法。然后原始组可以被折分,不需要从转染细胞中回收瞬间表达的DNA。

    2)当与第二种试剂偶联时,Ret/IgG蛋白表现了比Ret/AP蛋白更好的检测能力。

    3)使用VCAM/IgG对照蛋白(和AP偶联的二抗)和α-4 intergrincDNA(稀释入CDM8载体并转染COS细胞)的对照实验表明我们的检测能力仅是大约1/1000(即组的大小不能超过1000个克隆)。为得到较高水平的敏感性,我们从以SV40复制子为基础的载体(在COS细胞中表达)改变为以EBV复制子为基础的载体(在EBNA阳性细胞系中表达)。以EBV复制子为基础的载体以附加体形式存在并且扩增后不象以SV40复制子为基础的载体对细胞有毒性。有很多证据表明在这些载体中基因可以高水平表达并且cDNAs可以稀释得更稀得多(即高达1∶80,000)而仍可检测到。

    2.筛选来自以EBV复制子为基础的cDNA文库的组

    用大鼠Ret/IgG融合蛋白筛选来自18天大鼠胚胎肾cDNA文库(带有EBV复制子的CH269载体中)的克隆组。在一次实验中,从该文库产生256组,每组含5000个克隆。简要地,cDNA文库的等分样品经稀释,5000个细胞铺平板(256次)并使之生长过夜。将克隆刮到培养基中:一部分培养物用于该组的甘油保存(保存于-70℃)而一部分用于质粒制备。用脂质体转染法将来自256组的DNA分别转染293/EBNA细胞(8×105/60毫米平板)。48小时后,细胞用HBHA缓冲液(0.5mg/ml BSA,0.1%NaN3,20mM HEPES(pH7.0)〕洗两次,室温下与20μg/ml大鼠Ret/IgG(于Tris盐缓冲液中,另加1mM MgCl2和CaCl2)一起培养60-90分钟。温育后细胞用HBHA缓冲液洗四次,再用60%丙酮/3%甲醛/20mMHEPES(pH7.0)固定30秒。接着用HBS缓冲液[150mM NaCl,20mMHEPES(pH7.0)]洗两次后,细胞与AP偶联的二抗[羊抗人IgG Fc-γ-特异的F(ab′)2 ][Jackson免疫实验室;目录号109-056-098;1∶5000稀释度于Tris盐缓冲液,(另加1mM MgCl2和CaCl2)中稀释]一起在室温下温育60分钟。然后细胞用HBS缓冲液洗两次,并用含2X Pierce ImmunoPureR磷酸酶抑制剂(目录号35002)的AP底物缓冲液[100mM Tris-HCl(pH9.5),100mM NaCl,5mM MgCl2)。洗两次。最后一次洗放置15分钟。然后在向含Pierce AP抑制剂的AP底物缓冲液中加入AP底物NBT(0.33mg/ml)和BCIP(0.17mg/ml)并与细胞一起温育5-20分钟。然后平板用水洗两次。在解剖显微镜下观察平板上紫色着色细胞的出现。

    从256组的分析中,初次筛选鉴定出17个阳性组。将每个阳性组的DNA再转染入293/EBNA细胞中并与一些附加的对照实验一起重复以上程序,以确定观察到的着色是Ret/IgG特异的。17个阳性组中仅有10组表现用Ret/IgG融合蛋白时着色而用另一种IgG融合蛋白不着色。

    3.#230组的拆分

    作为一个例子,上述阳性组之一,命名为#230,拆分成更小的亚组以确定该组中介导与Ret/IgG融合蛋白结合的cDNA。来自#230组的甘油保存的600个细胞铺平板(10次)并培养过夜。将这些平板上的克隆刮入培养液中:十分之一的培养物用于甘油保存,剩余部分用于DNA提取。600个克隆的十个亚组命名为230-1A到230-5A和230-1B到230-5B。将这些亚组的DNA转染入293/EBNV细胞,并且重复上述Ret/IgG融合蛋白染色程序。一个亚组#230-5A为Ret/IgG染色阳性。

    #230-5A组进一步拆分以鉴定定该组中介导与Ret/IgG融合蛋白结合的cDNA。来自230-5A组甘油保存的细胞铺平板并培养过夜。将这些克隆挑到7个96-孔Bioblocks_中并培养过夜。从每一个96-孔Bioblocks_产生含20个克隆的4个组和含16个克隆的一个组。这样从七个Bioblocks_可得到35个组,命名为230-5A-71到230-5A-105。从每个这样的组中制备DNA并转染入293/EBNA细胞,如上所述用Ret/IgG融合蛋白再分析。#230-5A-86组为阳性。

    回到Bioblock再折分#230-5A-86组并鉴定混和在一起形成这组的20个克隆。从二十个克隆提取DNA并分别转染293/EBNA细胞,并如上所述对Ret/IgG再分析。#230-5A-86-17组为阳性。

    4.#230-5A-86-17号克隆的特征

    通过DNA测序进一步分析#230-5A-86-17号克隆(命名为retL-17或克隆17并以ATCC98047保存)。这个克隆的插入片段的全长核苷酸序列为SEQ ID NO:1(大鼠retL1 cDNA),图1显示了部分核苷酸序列。在这个核苷酸序列中,我们发现了编码468个氨基酸的蛋白(RetL1)的阅读框架。推测蛋白有信号肽序列,在24位氨基酸后有推测的切割位点[VonHeijne等,核酸研究,14:14683(1986)]。疏水C-末端表明该蛋白可能通过磷脂酰肌醇糖苷键与细胞相连。有三个推测的N-连接糖基化位点。这些性质与Ret配体的预期特性一致。

    通过在疏水C末端之前截断基因我们可以表达出大鼠RetL1蛋白的可溶性截短形式。例如,通过在435位赖氨酸(大鼠RetL1)之后截除该氨基酸的上游也应导致大鼠可溶性RetL1蛋白的表达。可溶性大鼠RetL1蛋白可以表达其自身,也可以作为它与人免疫球蛋白,组氨酸标记或被抗体识别的小抗原决定基的融合蛋白的一部分表达。

    B.人Ret配体RetL1的克隆

    在λgt10载体中的人胚胎肾cDNA文库购自Clontech(目录号HL5004A)。来自噬菌体贮液的100万个噬菌斑形成单位在10个NuncTM平板上铺板。在Schleicher和Schuell OptitranTM上重复进行噬菌斑浸提。

    用限制性内切酶Pvu II消化大鼠RetL1质粒,接着通过琼脂糖凝胶分离对应于大鼠RetL核苷酸序列(大鼠retL1 cDNA)的242-1582位核苷酸的1.34kb片段以得到探针。该编码区探针用随机引物进行32P标记(Feinberg和Vogelstein,Anal.Biochem.137:266-267,1984)。滤纸在300ml噬菌斑筛选PSB缓冲液(50mM Tris pH7.5,1M NaCl,0.1%焦磷酸钠,0.2%PVP,0.2%Ficoll)中55℃杂交过夜,杂交液含10%硫酸葡聚糖,100ug/mltRNA,和6.7×107CPM大鼠探针。用噬菌斑筛选缓冲液洗两次,再用2X SSC/1%SDS于55℃洗两次,并用增感屏于-70℃曝光显影。

    将两次阳性的克隆从主板挑到加明胶的SM(100mM NaCl,10mMSO4,50mM Tris,pH7.5)中。24个这样的阳性克隆经噬菌斑纯化。从纯化的候选噬菌斑小量提取λDNA,并用NotI酶切,在1%琼脂糖凝胶上电泳和Southern印迹。用大鼠RetL1编码区探针杂交Southern印迹。HRL20克隆含有最长的插入片段(4.4kb),与大鼠探针强烈杂交。从这个克隆已得到DNA序列(人部分retL1 cDNA;SEQ ID NO:8;图2A)和推测的多肽序列(人部分RetL1蛋白;SEQ ID NO:9;图2A),确定它是人的同源物。这个克隆编码包括编码区3′端的大部分编码区。

    为得到人cDNA的5′端,从Clontech购买人胎儿肾Marathon-ReadyTM cDNA试剂盒(目录号7423-1)。合成反义寡核苷酸kid-155,对应于SEQ ID NO:8(人部分retL1 cDNA)62-81位核苷酸的互补链和kid-154,对应于SEQ ID NO:8(人部分retL1 cDNA)17-43位核苷酸的互补链。用AdvantageTM cDNA PCR试剂盒(Clontech目录号8417-1)和MarathonTM cDNA试剂以及寡核苷酸kid-155或kid-154进行PCR。第一轮PCR如下准备:35.5ul水;5.0ul 10XklenTaq缓冲液;1.0ul 10mMdNTP混和物;1.0ul 50XAdvantageTM klenTaq聚合酶混和物。把这些试剂加在一起混匀。接着加入5.0ul Marathon-ReadyTM胎儿肾cDNA;1.0ul 10uM AP1引物和1.5ul 6.4uM kid-155(终体积为50ul)。在Perkin-Elmer Cetus DNA高温循环仪480上按以下循环条件进行PCR反应:94℃1分钟,1个循环;94℃30秒,55℃30秒,68℃4分钟,30个循环。用第一轮PCR反应的产物进行嵌套式PCR。首先,用TE将5ul PCR产物#1稀释50倍(终体积为250ul)。嵌套式PCR反应含有:35.5ul水;5.0ul 10XklenTaq缓冲液,1.0ul10mM dNTP混和物;1.0ul50X AdvantageTM klenTaq聚合酶混和物。把这些试剂如上混匀。再加入5.0ul稀释的PCR产物#1;1.0ul 10uM AP2引物和1.5ul 6.9uM的kid-154。循环条件同上。大约为700bp的所得产物在1%低熔点胶上纯化并用酚抽提。纯化的DNA克隆λpZErOTM的EcoR5位点(Invitrogen目录号K2510-01)。从大量分离物中获得序列信息,包括名为HRL7G6和HRL7G8的克隆。

    发现从HRL7G8克隆得到的序列与HRL20克隆(人部分retL1 cDNA)的序列重叠,并用于制备人RetL1全长序列(人全长retL1 cDNA),如图2B所示。从HRL7G8克隆得到的核苷酸序列代表人全长retL1 cDNA的1-502位核苷酸;来自HRL20克隆的核苷酸序列代表人全长retL1 cDNA的460-1682位核苷酸。用来自HRL7G6克隆的探针从人胚胎肾λgt10cDNA文库中分离出另一cDNA克隆(GJ102),通过对GJ102进行测序核实了来自HRL7G8克隆的核苷酸序列。118-1497位核苷酸包括人全长retL1 cDNA的蛋白阅读框架。

    图2B也表示了人RetL1全长氨基酸序列。如图3A所示通过BESTF1T分析,人retL1 cDNA与大鼠retL1 cDNA有88.2%的同源性。多肽比较(图3B)表明推测的人的肽序列与大鼠的有93.3%的同源性,97.2%的相似性。

    Ret配体RetL2的克隆

    A.人RetL2的克隆

    为了鉴定出相关蛋白(即同系物),利用BLAST程序,用大鼠RetL1的肽序列检索GenBank数据库。BLAST,或基本区域对比检索工具,利用Altschul等的方法(分子生物学杂志215:403-410,1990)来检索待查序列与数据库所有序列之间的相似性。待查序列与要检索的数据库可以是肽或核苷酸的任何组合。当用大鼠RetL1肽序列检索表达序列标记(EST)核苷酸数据库时,得到两个重要的匹配序列。一个具GenBank收录号R02249,来自人胎儿肝和脾混合cDNA文库的229bp EST;另一个具GenBank收录号H12981,来自人婴儿脑cDNA文库的521bp EST。这两个EST在重叠区有99%的同源性,表明它们来自同一个cDNA。源于H12981 EST的寡核苷酸:KID-228(GAA TGA CAA CTG CAA GAAGCT GCG CTC CTC;对应于38-67位核苷酸和SEQ ID NO:12的534-563位核苷酸),反义寡核苷酸KID-229(GTG TAC TCG CTG GGCACC CG;对应于156-175位核苷酸的互补序列和SEQ ID NO:12652-671位核苷酸的互补序列)。

    在OPTITRANTM滤纸上筛选来自clontech公司人胎儿肝5′突出(+)λgt10 cDNA文库(目录号HL5003a)的1×106噬菌斑形成单位。在400ml噬菌斑筛选缓冲液(50mM Tris pH7.5,1M NaCl,0.1%焦磷酸钠,0.2%聚乙烯吡咯烷酮和0.2%Ficoll)中滤纸与32P标记的KID-228和KID-32965℃杂交过夜,上述缓冲液含10%硫酸葡聚糖和100ug/ml tRNA及80pmole每种32P标记的寡核苷酸。用2X SSC/1%SDS洗两次,并用1XSSC/1%SDS洗两次后,曝光显影。11个重复阳性被纯化。来自每个这样的克隆的DNA用限制性酶消化,琼脂糖凝胶电泳和Southern杂交分析。滤膜与KID-228和KID-229杂交证实插入片段能与探针杂交。DSW240克隆的插入片段全部测序(人retL2 cDNA,SEQ ID NO:12),结果在图7中表示。

    人retL2 cDNA的蛋白阅读框架包含25-1416位核苷酸,它编码464个氨基酸的蛋白(人RetL2;SEQ ID NO:13),在图7中表示。如图8所示的,通过BESTFIT分析,人RetL2蛋白与人RetL1蛋白有49.1%的同源性和63.7%的相似性,与人RetL1一样有暗示了信号肽序列的疏水N端和暗示了磷脂酰肌醇聚糖连结结构域的疏水C端。另外,每个蛋白的31个半胱氨酸中有30个是保守的。

    B.证明RetL2是Ret的配体

    通过用含DSW240克隆的插入片段的表达质粒转染293/EBNA细胞并通过证明转染细胞可以结合可溶性Ret/IgG融合蛋白,表明RetL2是Ret的配体。

    用NotI切出DSW240的插入片段并克隆入表达质粒载体CH269,CH269含有EBV复制子并允许在EBNA阳性细胞系中高水平表达。进行限制性酶切以鉴定具有正确插入方向的克隆。从具正确插入方向的克隆中制备质粒DNA。

    用脂质体法将质粒DNAs(retL2表达质粒,retL1表达质粒作为阳性对照,含非相关蛋白的表达质粒作为阴性对照)转染293/EBNA细胞(在60mm平板上8×105细胞)。48小时后,细胞用HBHA缓冲液[0.5mg/mlBSA,0.1%NaN3,20mM HEPES(pH7.0)]洗两次并与20ug/ml大鼠Ret/IgG一起在含1mM MgCl2和CaCl2的Tris盐缓冲液中室温下温育60-90分钟。温育后,用HBHA缓冲液洗四次并用60%丙酮/3%甲醛/20mM HEPES(pH7.0)固定30秒。HBS缓冲液[150mM NaCl,20mMHEPES(pH7.0)]洗两次后,细胞与AP偶联的二抗[羊抗人IgG Fc-γ-特异的F(ab’)2](Jackson免疫研究实验室;目录号109-056-098;1∶5000倍稀释于含1mM MgCl2和CaCl2的Tris盐缓冲液中)一起室温下温育60分钟。然后用HBS缓冲液洗两次,并用含2X Pierce Immuno Pure_磷酸酶抑制剂(目录号35002)的AP底物缓冲液[100mM Tris-HCl(pH9.5),100mM NaCl,5mM MgCl2)洗两次。最后一次洗涤放置15分钟。将AP底物NBT(0.33mg/ml)和BCIP(0.17mg/ml)加入含Pierce AP抑制剂的AP底物缓冲液中,并与细胞一起保温5-20分钟。平板用水洗两次。解剖显微镜下观察平板上紫色着色细胞的存在。紫色着色细胞的存在表明Ret融合蛋白已结合到细胞上,并且RetL2蛋白是Ret的配体。用retL1表达载体转染后也可观察到紫色着色细胞,而用阴性对照载体时观察不到。

    Ret配体RetL3的克隆

    A.鼠RetL3

    用大鼠RetL1氨基酸序列检索EST数据库,发现两个鼠EST与Ret配体有同源性。两个EST为AA049894和AA050083(为鼠部分retL3cDNA,SEQ ID NO:14)。以细菌穿刺物形式从Genome Systems Ins.获得编码这两个EST的质粒(目录号#47591和#475497)。将穿刺物在LB氨苄抗性平板上划线,从单菌落制备质粒DNA。对这些质粒中的插入片段进行全长序列测定。比较这两个序列表明有1.4kb插入的AA049894包含在有1.9kb片段插入的AA050083中。来自AA050083的DNA序列的翻译表明,它有一个从250位核苷酸到1242核苷酸的连续开放阅读框架(鼠部分RetL3;SEQ ID NO:15)。这个开放阅读框架与大鼠retL1的开放阅读框架有37.5%的同源性,与大鼠retL2的开放阅读框架有40.2%的同源性。但是该开放阅读框架在5′端并不编码甲硫氨酸或信号肽序列。我们研究了这个区域上游的5′ORF,发现在翻译起始必须的kozak保守序列附近有甲硫氨酸和为了表面表达和分泌的信号肽序列。这个ORF与下游ORF不在同一个框架内,表明EST AA050083在它的5′端含有可能的突变,如插入,缺失,内含子或克隆假象。

    为获得正确的5′端,我们应用了Marathon RACE法。从Clontech购买小鼠11天胚胎Marathon-ReadyTM cDNA(目录号7458-1)和AdvantageTM试剂盒(目录号8417-1)。合成反义寡核苷酸kid-366,对应于SEQ ID NO:14的847-866位核苷酸的互补序列;和kid-365,对应于SEQ ID NO:14的589-615位核苷酸的互补序列。用AdvantageTMcDNA PCR试剂盒(Clontech目录号8417-1)结合MarathonTM cDNA试剂以及寡核苷酸kid-366进行PCR反应。第一次PCR反应如下制备:35.3ul H2O;5.0ul 10XklenTaq缓冲液;1.0ul 10mM dNTP混合物;1.0ul 50XAdvantageTM Klen Taq聚合酶混合物。把这些试剂加好混匀。然后加5.0ul Marathon-ReadyTM小鼠11天胚胎cDNA,1.0ul 10uM AP1引物和1.7ul 5.88uM Kid-366(终体积=50ul)。PCR在Perkin-ElmerCetus DNA热循环仪480中按以下循环条件进行:94℃1分钟,1个循环;94℃30秒,72℃4分钟,5个循环;94℃30秒,70℃4分钟,5个循环;94℃30秒,68℃4分钟,25个循环。用第一次PCR反应的产物进行嵌套式PCR。首先,5μl PCR产物#1用TE稀释50倍(终体积250ul)。嵌套式PCR反应含35.5ul水;5.0ul10XklenTaq缓冲液;1.0ul 10mM dNTP混合物;1.0ul 50XAdvantageTM KlenTaq聚合酶混合物。把这些试剂如上混匀。然后加入5.0μl PCR产物#1,1.0μl 10μm AP2引物和3.6μl 2.8μM Kid-365。循环条件同上。大约665bp的所得产物在1%低熔点琼脂糖凝胶上纯化并用Qiaex II(Qiagen目录号20021)抽提。用PRIME PCR CLONERTM克隆系统(5Prime->3Prime目录号1-725029)将纯化的DNA克隆入λpNoTA/T7TM。从多个分离物中得到序列信息,包括名为DSW252和DSW253的克隆。

    发现DSW252的序列与SEQ ID NO:14重叠,除了在SEQ IDNO:14序列的252位与253位核苷酸之间另外的T。在其它分离物DSW251和DSW253中也存在这个T。该附加碱基的插入纠正了ORF,从而得到一个编码397个氨基酸的1191bp的ORF(从第一个甲硫氨酸算起)。这个ORF在常规翻译起始保守序列(kozak)附近编码一个甲硫氨酸,并包含表面表达/分泌的信号肽序列。

    为得到能表达的全长小鼠克隆,纯化DSW252的NotI-BamHI 630bp片段和AA050083的1308bp BamHI-NotI片段并将它们连接入NotI酶切的表达质粒CH269。连接产物转化大肠杆菌XL1-Blue(Strategene目录号200236)。所得转化子用Qiawell Ultra小量制备法制备DNA。通过限制性酶酶切和凝胶电泳分析这些转化子的正确大小和方向。这个构建体命名为DSW254。将DSW254的插入全长测序(鼠retL3;SEQ ID NO:16),该ORF确定为编码含397个氨基酸的蛋白(鼠RetL3;SEQ IDNO:17)。这些序列也在图9中表示。RetL3的C末端为疏水性,并且暗含一个磷脂酰肌醇聚糖连接位点。

    B.人的RetL3

    为寻找适于克隆人RetL3的候选组织来源,我们用小鼠组织的Northern印迹方法来确定鼠RetL3的表达图谱。在所有实验组织中,RetL3在心脏组织中的表达最高。从Clontech公司购买在载体λgt10中的成人心脏cDNA文库(目录号HL3026a)。来自噬菌体贮液的一百万个噬菌斑形成单位在10个Nunc平板上铺板。在Schleicher和SchuellOptitranTM滤纸上重复噬菌斑浸取。

    通过用引物kid-366和kid-367进行PCR制备探针,相应于AA050083序列的397-420位核苷酸。PCR反应体系如下配制:10ul 10XPFU缓冲液,2.0ul 10mM dNTP混合物,72.1ul H2O,3.1ul 13.2uM kid-367,6.8ul5.88μM kid-366,5.0ul 0.1ug/ul AA050083 DNA和2.0ul 2.5单位/ul PFU(Strategene目录号600154)并混匀。在Perkin-Elmer Cetus DNA热循环仪480上进行PCR,条件如下:94℃1分钟,53℃1分钟,72℃4分钟,25个循环。PCR产物用酚,氯仿,异戊醇50∶49∶1抽提纯化,接着经过低熔点琼脂糖凝胶电泳并用Qiaex II纯化切下的片段。编码区探针通过随机引物延伸进行32P标记(Feinberg and Vogelstein)。滤膜在200ml含10%硫酸葡聚糖,100ug/ml tRNA和1.8×108CPM小鼠探针的噬菌斑缓冲液中65℃杂交过夜。用噬菌斑筛选缓冲液,2X SSC/1%SDS洗两次,再用1XSSC/1%SDS 65℃洗2次,-70℃用增感屏曝光显影。重复阳性克隆经噬菌斑纯化。从纯化的候选噬菌斑中小量提取的λDNA用EcoRI消化,在1%琼脂糖凝胶上电泳,并进行Southern印迹。用小鼠探针杂交Southern印迹。GJ128克隆含1.3kb插入,与小鼠编码区探针强烈杂交。从该克隆得到DNA序列(人部分retL3 cDNA;SEQ IDNO:18)和推测的肽序列(人部分RetL3;SEQ ID NO:19),证实它是人的同源物。这个克隆编码了大部分编码区,包括编码区的3′端。

    为获得含5′端的克隆,来自GJ128的1.3kb插入经纯化,32P标记,用于筛选Clontech成人心脏文库。在来自该文库的2×106个噬菌斑中没有得到含5′端的克隆。用相同的探针根据厂家提供的方法对成人组织mRNA印迹(Clontech目录号7760-1,7759-1和7767-1)进行Northern分析,表明人RetL3在成人脊髓,胃,心脏,胰脏,小肠,结肠,前列腺和睾丸中表达。用GJ128插入片段筛选Clontech成人脊髓cDNA文库(目录号5001a)。纯化3个独立克隆,对最长的克隆GJ135进行序列测定。GJ135的插入片段与GJ128插入片段重叠,可得到人全长retL3 cDNA(SEQ ID NO:20)的组合序列,从而可确定人全长RetL3(SEQ ID NO:21)。这些序列在图10中表示。人RetL3与人RetL1和RetL2的同源性分别为34.3%和34.9%。与鼠RetL3的同源性为76.8%。

    本发明的化合物的治疗用途

    天然的和变异的RetL,抗RetL抗体,抗Ret抗体,和Ret及RetL的融合蛋白在需要阻断或激活Ret信号途径,在细胞丢失或受损的患病的情况下可刺激肾和/或神经细胞生长或存活,或抑制生长或杀死非需要细胞如表达Ret或RetL的肿瘤细胞的情况下可以有治疗用途。

    通常,本发明的结合Ret,诱导Ret二聚体形成和/或Ret自身磷酸化的化合物,可用于刺激Ret表达组织生长或减少其损伤。本发明的化合物可用于刺激肾组织生长和/或存活,维护肾功能,最大限度减少各种损害后对肾组织的损伤。可用本发明的化合物有效治疗的特定情况包括急性肾衰竭,急性肾炎,慢性肾衰竭,肾病综合症,肾小管缺陷,肾移植,毒性损伤,缺氧损伤和创伤。肾小管缺陷包括遗传性的或获得性的,如多囊肾病,髓囊病和髓质海绵肾。不限于这里列出的,而可包括一些其它肾脏失调(见,例如Harrison’s Principles of Internal Medicine,第13版,1994,此处引用作为参考)。

    在其它的应用中,本发明的基因和蛋白可在需要神经生长和再生的情况下用于治疗。这包括任何涉及神经退化的情况,如阿尔茨海默病、帕金森病、亨廷顿舞蹈病、图雷综合症,肌萎缩晚期硬化,及运动神经元病,脱髓鞘病如多发硬化症,细菌病如脑膜炎,脓肿或积脓,病毒病如HIV伴随性脊髓病,朊病毒病包括克罗伊茨费尔特—雅各布病。也包括对神经组织造成损伤的紊乱,或者由肿瘤浸润,创伤,或者由脑血管事件如出血或气栓引起。颅神经和脊髓疾病,包括涉及创伤,炎症,充血或血管病因学的紊乱,以及影响自主神经系统的紊乱都特别地包括在内。也包括发育性神经紊乱,如智力迟钝,孤独症,胎儿酒精综合症,唐氏综合症和大脑麻痹症。本发明的化合物也可用于治疗涉及周围神经系统的综合症。这些失调包括上述任何因子引起的那些,并特别包括莱姆病,HIV伴随神经病,多肌炎,肌肉营养不良和重症肌无力。

    与大鼠RetL,人部分RetL1,人全长RetL1,人RetL2,鼠RetL3或人RetL3的蛋白,或这些蛋白的片段特异结合的本发明的抗RetL抗体和Ret融合蛋白在几种方法中有用。这些化合物可在治疗上用于抑制或阻断Ret受体信号,如用于阻断肿瘤生长,这些肿瘤生长依赖Ret信号传导的活化。这些试剂也可与可检测的标记融合,如荧光性或放射性不透明物质,施用给受治疗者可使表达RetL的组织成像。这些试剂也可与诸如辣根过氧化物酶的物质结合,其可用作免疫细胞化学染色以对组织切片上的Ret-阳性细胞区域进行观察。可以这种方法单独使用特定抗体,在特定抗体结合的位点可使用结合于可检测的标记上的抗免疫球蛋白抗体在夹心分析中观察到。任何RetL的特异抗体也在对给定抗体的特异的底物定量免疫分析中有用。RetL的特异抗体也可结合于固体支持物上,如玻璃珠或平板,并可用于从溶液中移出配体以纯化蛋白或从溶液中除去配体。每项这种技术对于免疫领域的技术人员来说都是常规操作。

    本发明的其它方法包括通过Ret与抗Ret单克隆抗体接触调节Ret-RetL信号传导。依赖每个特异单克隆抗体与Ret相互作用的特征,这种单克隆抗体-Ret接触的效应可以是阻断或刺激Ret信号传导途径的活化。某些单克隆抗体作为兴奋剂与Ret相互作用,兴奋剂单克隆抗体与Ret结合激发Ret二聚体形成和自身磷酸化。其它单克隆抗体作为Ret拮抗剂起作用。Ret与拮抗剂单克隆抗体相互作用阻止由其它RetL或由含RetL的复合物引起的Ret信号传导的活化。

    RetL和/或针对Ret或Ret融合蛋白的抗体可用于使表达Ret的组织成像,或对于抗RetL抗体,可在上述免疫组织化学或制备方法中应用。

    包含RetL和/或抗Ret抗体的融合蛋白可用来抵抗表达Ret的癌和肿瘤进行特异靶位点医疗。这样的肿瘤可包括与Ret突变相关的几种不同的肿瘤表型(N.Engl.J.Med.335:943-951,1996;自然367:319-320,1996;Trends Gen.12:138-144,1996)。抵抗表达RetL的肿瘤形成的治疗干扰利用整合了Ret和/或抗RetL抗体的融合蛋白。通过抗体依赖的和补体依赖的由Fc结构域介导的细胞溶解作用,抗Ret抗体或抗RetL抗体本身可以有效。通过将这种杂交配体和抗体作为抗肿瘤形成药物,毒素和杀细胞放射性核素如钇90的传送载体使用,可使它们更有效。使用异源偶联抗体可将细胞毒性效应细胞导向肿瘤细胞,即对肿瘤表达的Ret或RetL的特异的抗体可与针对细胞毒性效应细胞如NK细胞或CTL上的表面蛋白诱导的抗体共价偶联。

    抗Ret抗体或RetL治疗的一个例子是将蓖麻毒蛋白的毒性A链或修饰的蓖麻毒蛋白全长形式(其不再能结合细胞)与RetL或针对在恶性细胞表面表达的Ret多肽诱导的抗体偶联。在另一种实施方案中,毒素与Ret或抗RetL抗体偶联以选择性地定向并杀死RetL阳性细胞,如表达RetL的肿瘤。通过阻断蓖麻毒蛋白与针对大多数肿瘤形成细胞上表达的CD19抗原的单克隆抗体偶联证明这种方法是成功的(Grossbard等,血液79:576,1992)。如本领域的技术人员所知,其它毒素同样有用。这样的毒素包括但不限于假单孢外毒素,白喉毒素,和皂草素。与已知的抗CD-19抗原方法相比,利用RetL或抗Ret抗体的该法应该证明甚至更成功,因为Ret在非常有限的几个组织中表达。

    上述使用蓖麻毒素或其它毒素融合的方法同样适用于RetL或抗Ret抗体的有毒偶联物;它们可用于选择性地锚定和杀死Ret阳性细胞,如表达Ret的肿瘤细胞。

    这种医疗的另一种方法是用放射性同位素标记的RetL或抗Ret抗体。这种放射性标记的化合物优先将放射活性定位到表达Ret的细胞中的肿瘤位点,而正常组织中没有。根据所用的同位素,结合于肿瘤细胞的放射性标记的抗体发出的辐射也可能杀死邻近不表达Ret的恶性肿瘤细胞。一系列放射性核素可以使用。发射β粒子的同位素(如,131I)已成功地用于针对B-细胞淋巴瘤上CD20的单克隆抗体[Kaminski.等,N.Engl.J.Med.329:459(1993);Press等,N.Engl.J.MeCl.329:1219(1993)]。发射β粒子的放射性核素产生的放射性辐射,具有跨几个细胞直径距离的杀肿瘤活性,允许抗原阴性细胞的根除和减小肿瘤中抗体或配体的非同源沉积后果。

    发射α粒子的放射性核素也可使用。放射性核素标记的RetL或抗Ret抗体产生的低剂量照射可能比传统放射治疗中外部施加的瞬间照射更有效。低剂量照射可能诱导某些细胞系凋亡(程序性细胞死亡)[Macklis等,Radiat.Res.130:220(1992);Maklis等,Radiopharm.5:339(1992)]。

    本发明的化合物以治疗有效量用药,此意味着产生医疗满意结果或对治疗的特定情况产生影响的化合物量。

    此处使用的术语“受治疗者(subject)”是用来指任何接受Ret配体或基因的哺乳动物。预期用本发明的方法治疗的特定受治疗者包括人,以及非人灵长类,绵羊,马,牛,山羊,猪,狗,猫,兔,豚鼠,仓鼠,沙土鼠,大鼠和小鼠,以及来源于或来自这些宿主的器官,肿瘤和细胞。

    本发明的化合物在基因治疗中的应用

    将本发明的RetL基因导入受损组织,刺激转染细胞合成RetL,促进表达Ret的细胞生长和/或细胞存活。

    在基因治疗方法的特定实施方案中,可将RetL基因导入所选的肾或神经靶组织。RetL即可以稳定表达并刺激Ret受体阳性细胞生长,分裂,分化和/或促进细胞存活。另外,使用以病毒或非病毒为基础的策略的一系列众所周知的方法可将RetL基因导入靶细胞内。

    非病毒方法包括电穿孔法,用脂质体膜融合,用DNA包被的微粒高压轰击,与磷酸钙-DNA一起温育,DEAE-葡聚糖介导的转染和单细胞直接注射法。例如,RetL基因可通过磷酸钙共沉淀法[Pillicer等,科学,209:1414-1422(1980)];机械微注射和/或粒子加速[Anderson等,美国国家科学院院报,77:5399-5403(1980)];以脂质体为基础的DNA转染(例如LIPOFECTIN介导的转染,Fefgner等,美国国家科学院院报,84:471-477,1987;Gao and Huang,Biochem.Biophys.Res.Comm.,179:280-285,1991);DEAE葡聚糖介导的转染;电穿孔法(美国专利4,956,288);或以多聚赖氨酸为基础的方法(其中DNA被偶联以转运DNA优先地到肝脏的肝细胞中)(Wolff等,科学,247:465-468,1990;Curiel等,人类基因治疗3:147-154,1992)导入细胞。

    通过直接基因转移法可将本发明的基因转染目的细胞。见例如Wolff等,“直接基因转入驼鹿肌肉内”,科学247:1465-68,1990。在一些情况下,载体介导的转染受欢迎。本领域任何已知的将多聚核苷酸序列插入载体中的方法都可使用。见Sambrook等,分子克隆:实验手册,冷泉港实验室,冷泉港实验出版社,NY(1989)和Ausuabel等,分子生物学常规方法,J.Wiley & Sons,NY(1992),此处引用两者作为参考。启动子活化可以是组织特异性的或者受代谢产物或施用物质诱导的。这种启动子/增强子包括但不限于,天然RetL启动子,巨细胞病毒立即早期启动子/增强子[Karasuyama.等,J. Exp. Med.,169:13(1989)];人β-肌动蛋白启动子[Gunning等,美国国家科学院院报,84:4831(1987)];小鼠乳腺瘤病毒长末端重复序列(MMTV LTR)中的糖皮质激素诱导启动子[klessig等,Mol.Cell.Biol.,4:1354(1984)];Moloney鼠白血病病毒长末端重复序列(MuLV LTR)[Weiss等,RNA肿瘤病毒,冷泉港实验室,冷泉港实验室出版社,NY(1985)];劳氏肉瘤病毒(RSV)启动子[Yamamoto等,细胞,22:787(1980)];SV40早期启动子[Bernoist and Chambon,自然,290:304(1981)];单纯疱疹病毒(HSV)胸腺嘧啶激酶启动子[Wagner等,美国国家科学院院报,78:1441(1981)];腺病毒启动子[Yamada等,美国国家科学院院报,82:3567(1985)]。

    RetL基因也可通过特定的病毒载体导入细胞,这些载体在现已建立的基因转移系统中使用。见例如,Madzak等,J.Gen.Virol.,73:1533-36,1992(乳多空病毒SV40);Berkner等,Curr.Top.Microbiol.Immunol.,158:39-61,1992(腺病毒);Hofmann等,美国国家科学院院报92:10099-10103,1995(杆状病毒);Moss等,Curr.Top.Microbiol.Immunol.,158:25-38,1992(痘病毒);Muzyczka,Curr.Top.Microbiol.Immunol.,158:97-123,1992(腺病毒伴随病毒);Margulskee,Curr. Top.Microbiol.Immunol.,158:67-93,1992[单纯疱疹病毒(HSV)和Epstein-Barr病毒(HBV)];Miller,Curr. Top. Microbiol. Immunol.,158:1-24,1992(逆转录病毒);Brandyopadhyay等,Mol.Cell.Biol.,4:749-754,1984(逆转录病毒);Miller等,自然,357:455-450,1992(逆转录病毒);Anderson,科学,256:808-813,1992(逆转录病毒),分子生物常用方法:Section 9.10-9.14(Ausubel.等,编辑),Greene PublishingAssociates,1989,引用所有这些文献作为参考。

    优选的载体是DNA病毒,包括腺病毒(优选以Ad-2或Ad-5为基础的载体),杆状病毒,疱疹病毒(优选以单纯疱疹病毒为基础的载体),和细小病毒(优选以“缺陷型”或非自主型细小病毒为基础的载体,更优选以腺病毒伴随病毒为基础的载体,最优选以AAV-2为基础的载体)。见例如Ali等,基因治疗1:367-384,1994;美国专利4,797,368和5,399,346和以下讨论的。

    为转染,例如RetL序列,根据一系列因素选择特定的载体系统。一个重要因素是靶细胞群体的性质。尽管逆转录病毒载体已广泛地被研究并用于许多基因治疗应用,但它们一般并不适用于转染非分化细胞,而在癌症治疗中有用,因为它们只能在复制细胞中整合与表达。由于它们能稳定地整合到靶细胞基因组中,它们在体外方法中有用而且很有吸引力。

    腺病毒是真核DNA病毒,可被修饰以有效地将治疗或报告转化基因运载到一系列细胞类型中。能引起人类呼吸性疾病的普通腺病毒2型和5型(Ad2和Ad5),现已被发展用于假肥大性肌营养不良(DMD)和胆囊纤维化(CF)的基因治疗。Ad2和Ad5属于与人恶性肿瘤无关的一种腺病毒亚型。不管处于那个分裂时期,腺病毒载体能将非常高水平的转化基因运载到几乎所有细胞类型中。在293细胞中(腺病毒转化的互补人胚胎肾细胞系:ATCC CRL 1573)能很容易的获得高滴度(1013噬菌斑形成单位/ml)的重组病毒,并可冷冻贮存很长时间而无明显丢失。在各种失调的动物模型中已证实这种系统在体内转运补偿遗传性失衡的治疗性转化基因中的效力。见Y.Watanabe,Atherosclerosis,36:261-268(1986);K.Tanzawa等,REBS Letters,118(1):81-84(1980);J.L. Golasten等,New Engl.J.Med.,309(11983):288-296(1983);S.Ishibashi等,J.Clin.Invest.,92:883-893(1993);和S.Ishibashi等,J.Chin.Invest.,93:1889-1893(1994),引用所有这些文献作为参考。确实,编码胆囊纤维化跨膜调节子(CFTR)的重组复制缺损腺病毒已批准用于至少两例人CF临床试验。见例如J.Wilson自然,365:691-692(1993年8月21日)。人类中存活腺病毒疫苗的大量经验进一步支持了重组腺病毒用于基因治疗的安全性。

    人类腺病毒包含线性,约36kb的双链DNA基因组,该基因组可分成100个图谱单位(m.u.),每个图谱单位长360bp。在基因组的每个末端的DNA含有短的反向末端重复(ITR),是病毒DNA复制必须的。根据在病毒DNA合成起始前或后表达,这些基因产物排列为早期区(E1到E4)和晚期区(L1到L5)。参见Horwitz,病毒学,第二版,B.N.Fields编辑,Raven Press Ltd.,New York(1990)。

    第一代重组子,复制缺陷型腺病毒已发展用于DMD和含全长E1a和部分E1b区域缺失的其它遗传性失调的基因治疗。。复制缺陷型病毒可以在293细胞中生长,293细胞包含有功能的腺病毒E1a基因,可提供反式作用E1a蛋白。E1缺失病毒能在293细胞中复制和增殖侵染性的细胞,293提供E1a和E1b区基因产物互补。所得病毒侵染一些细胞类型,并表达导入的基因(假设它带有自己的启动子),但不能在不含E1区DNA的细胞中复制,除非以非常高的感染复数侵染细胞。腺病毒有下列优点:它们有广谱宿主范围,能侵染休眠或终级分化的细胞如神经元,表现出必需地非致癌性。腺病毒不整合到宿主基因组中。因为他们存在于染色体外,插入突变的危险大大降低。Ali等,同上,于273。重组腺病毒(rAdV)有很高的滴度,病毒粒子相当稳定,表达水平高,能侵染广谱的细胞。它们的天然宿主细胞是气道上皮细胞,因此他们在肺癌的治疗中有用。

    杆状病毒介导的转化有一些优点。杆状病毒基因转移可在复制和非复制细胞中进行,并可在肾细胞,及肝细胞,神经细胞,脾,皮肤和肌肉中进行。在哺乳动物细胞中杆状病毒是非复制和非致病性的。人缺少能阻断侵染的重组杆状病毒抗体。另外,杆状病毒能整合并转导大片段的DNA插入。

    腺病毒伴随病毒(AAV)也已用于体细胞基因治疗。AAV是小的,单链DNA病毒,有简单的基因组构成(4.9kb),使它成为基因工程的理想底物。两个开放阅读框编码一系列的rep和cap多肽。Rep多肽(rep78,rep68,rep62和rep40)参与AAV基因组的复制,装配和整合。Cap蛋白(VP1,VP2和VP3)形成病毒外壳。邻近rep和cap开放阅读框架的5′和3′区是145bp的反向末端重复(1TRs),前125bp能形成Y-型或T-型二级结构。为改进AAV载体,整个rep和cap结构域可以被切除并用治疗基因或报告基因代替。参见B.J.Carter,于细小病毒手册,P.Tijsser编辑,CRC出版社,155-168页(1990)。已表明ITRs代表了AAV基因组复制,装配,包装和整合必须的最小序列。

    ANV生活史是双相的,包括潜伏期和裂解期。在潜伏侵染期,AAV病毒粒子以包被的SSDNA进入细胞,之后立即传递入核并且在此AAVDNA稳定地整合入宿主染色体,不明显需要宿主细胞分裂。在没有辅助病毒时,整合的AAV基因组保持潜伏状态,但能被激活和装配。当含AAV原病毒的细胞经疱疹病毒或腺病毒第二次侵染激发时,生活史的裂解期开始,疱疹病毒或腺病毒编码辅助功能蛋白,能被AAV用于帮助它从宿主染色体的切割(B.J.Carter,同上)。侵染的亲本SSDNA以rep依赖方式形成双链复制形式(RF)DNAs。将装配的AAV基因组包装到预先形成的蛋白外壳中(直径约20nM的正二十面体对称结构),随着细胞裂解释放侵染性病毒粒子,病毒粒子中包装了+或-SSDNA。

    腺病毒伴随病毒(AAV)在基因治疗方面有重要潜力。病毒粒子很稳定并且重组AAV(rAAV)有“药物样”特征,其特征在于rAAV可通过沉淀或CsCl梯度条带纯化。它们是热稳定的并可冻干成粉末且可水化后恢复全部活性。它们的DNA稳定整合到宿主染色体中,因此表达是长期的。它们的宿主范围广并且AAV不引起任何可知的疾病,因此重组载体无毒性的。

    一旦目的序列导入靶细胞后,可用常规的方法鉴定有用序列,如用与载体插入基因序列同源/互补序列为探针的核酸杂交。在另一种方法是,可用由表达载体导入靶细胞引起“标记”基因功能(如胸腺嘧啶激酶活性,抗生素抗性等)的有无鉴定该序列。

    配方与给药

    本发明的化合物可以用医学上可接受的任何方法给药。可包括注射,经非肠胃途径如静脉内,血管内,动脉内,皮下,肌肉内,肿瘤内,会阴内,心室内,表皮内以及口部,鼻部,眼部,直肠或局部。通过贮积注射或可蚀性植入的持续释放用药也特别地包括在本发明中。特别考虑的是定向导入,通过用导管传递到一个或多个动脉中,如肾动脉或供应局部肿瘤的血管。

    术语“药学上可接受的载体”是指一个或多个有机的或无机的,天然的或合成的成分,突变的原癌基因或突变的癌蛋白与它们结合促进其施用。合适的载体包括无菌的生理盐水,尽管其它已知的药学上可接受的含水和不含水的等渗无菌溶液和无菌悬浮液已被本领域的一般熟练技术人员所熟知。在这方面,“载体”包括脂质体和HIV-1 tat蛋白(参见Chen等,Anal.Biochem.,227:168-175,1995)及任何质粒和病毒表达载体。“有效剂量”是指能减轻或延迟疾病过程,退化或损伤情况的量。有效剂量可在个体基础上确定,部分基于待治病症和想要达到的结果的考虑。有效剂量可由本领域的一般技术人员权衡这些因素和使用常规实验确定。

    脂质体系统可以是单层载体,多层载体或稳定极性层载体中的任一种,并可以根据本领域技术人员已知的方法制备和给药,例如根据美国专利5,169,637,4,762,915,5,000,958或5,185,154的说明。另外,为增加它们与脂质体的结合,需要表达本发明的新的多肽以及其它所选择的多肽如脂蛋白。例如用脂质体包被的RetL治疗人急性肾衰竭,可通过可利用脂质体将RetL导入需要这样治疗的细胞在体内进行。脂质体可通过导道运送到肾动脉。重组的RetL蛋白例如通过免疫亲和层析或其它常规方法从CHO细胞纯化,然后与脂质体混和并且高效掺到脂质体中。在体外可检测包被蛋白对刺激细胞生长的任何影响。

    本发明也考虑到,为提高它们的稳定性和/或免疫原性,通过脂质体传递系统将本发明的新的多肽施用给动物。因为在接受治疗的动物中脂质体可以通过吞噬细胞内化,所以通过脂质体来运载新的多肽有特别的优点。这些细胞在消化掉脂质体膜后,将与引发强烈免疫反应所必须的其它分子偶联的多肽提呈到免疫系统。

    本发明的任何一种新的RetL多肽可以以药学上可接受的盐的形式使用。能与本发明的多肽形成盐的合适酸或碱已为本领域技术人员所熟知,包括无机和有机酸和碱。

    尽管上述发明已通过说明和实施例的方式详细描述,以便于理解清晰,但对一个本领域的技术人员来说,在本发明范围内,如仅由附录权利要求的范围限定的,很明显可以进行一些改变和修饰。

                              序列表

    (1)基本信息

        (i)申请人:Biogen,Inc.

        (ii)发明名称:刺激神经和肾生长的Ret配体(RetL)

        (iii)序列数目:21

        (iv)联系地址:

            (A)地址:Biogen,Inc.

            (B)街道:14 Cambrige Center

            (C)城市:Cambrige

            (D)州名:MA

            (E)国家:USA

            (F)邮政编码:02142

        (v)计算机可读形式

            (A)介质类型:软盘

            (B)计算机:IBM PC兼容机

            (C)操作系统:PC-DOS/MS-DOS

            (D)软件:PatentIn Release#1.0,版本#1.30

        (vi)目前申请资料:

            (A)申请号:

            (B)递交日:1997年5月7日

            (C)分类:

        (vii)在先申请资料

            (A)申请号:US 08/999,999

            (B)递交日:1996年1月1日

        (viii)律师/代理人信息:

            (A)名称:levine,leslie M

            (B)登记号:35,245

            (C)文件/著录号:A008 PCT CIP

        (ix)电信信息:

            (A)电话:617-679-2400

            (B)传真:617-679-2838

    (2)关于SEQ ID NO:1的信息

        (i)序列特征

            (A)长度:3616个碱基对

            (B)类型:核酸

            (C)链型:双链

            (D)拓扑结构:线型

        (ii)分子类型:cDNA

        (iii)假拟:否

        (iv)反义:否

        (ix)特征:

            (A)名称/关键:CDS

            (B)位置:257..1660

        (xi)序列描述:SEQ ID NO:1:

          GCGGCCGCAG GTTGGGTCGG AACTGAACCC CTGAAAGCGG GTCCGCCTCC CGCCCTCGCG

    60

          CCCGCCCGGA TCTGAGTCGC TGGCGGCGGT GGGCGGCAGA GCGACGGGGA GTCTGCTCTC

    120

          ACCCTGGATG GAGCTGAACT TTGAGTGGCC AGAGGAGCGC AGTCGCCCGG GGATCGCTGC

    180

          ACGCTGAGCT CTCTCCCCGA GACCGGGCGG CGGCTTTGGA TTTTGGGGGG GCGGGGACCA

    240

          GCTGCGCGGC GGCACC ATG TTC CTA GCC ACT CTG TAC TTC GCG CTG CCA

    289

                            Met Phe Leu Ala Thr Leu Tyr Phe Ala Leu Pro

                              1               5                  10

          CTC CTG GAT TTG CTG ATG TCC GCC GAG GTG AGT GGT GGA GAC CGT CTG

    337

          Leu Leu Asp Leu Leu Met Ser Ala Glu Val Ser Gly Gly Asp Arg Leu

                       15                  20                  25

          GAC TGT GTG AAA GCC AGC GAT CAG TGC CTG AAG GAA CAG AGC TGC AGC

    385

          Asp Cys Val Lys Ala Ser Asp Gln Cys Leu Lys Glu Gln Ser Cys Ser

                   30                  35                  40

          ACC AAG TAC CGC ACA CTA AGG CAG TGC GTG GCG GGC AAG GAA ACC AAC

    433

          Thr Lys Tyr Arg Thr Leu Arg Gln Cys Val Ala Gly Lys Glu Thr Asn

               45                  50                  55

          TTC AGC CTG ACA TCC GGC CTT GAG GCC AAG GAT GAG TGC CGT AGC GCC

    481

          Phe Ser Leu Thr Ser Gly Leu Glu Ala Lys Asp Glu Cys Arg Ser Ala

           60                  65                  70                  75

          ATG GAG GCC TTG AAG CAG AAG TCT CTG TAC AAC TGC CGC TGC AAG CGG

    529

          Met Glu Ala Leu Lys Gln Lys Ser Leu Tyr Asn Cys Arg Cys Lys Arg

                           80                  85                  90

          GGC ATG AAG AAA GAG AAG AAT TGT CTG CGT ATC TAC TGG AGC ATG TAC

    577

          Gly Met Lys Lys Glu Lys Asn Cys Leu Arg Ile Tyr Trp Ser Met Tyr

                       95                 100                 105

          CAG AGC CTG CAG GGA AAT GAC CTC CTG GAA GAT TCC CCG TAT GAG CCG

    625

          Gln Ser Leu Gln Gly Asn Asp Leu Leu Glu Asp Ser Pro Tyr Glu Pro

                  110                 115                 120

          GTT AAC AGC AGG TTG TCA GAT ATA TTC CGG GCA GTC CCG TTC ATA TCA

    673

          Val Asn Ser Arg Leu Ser Asp Ile Phe Arg Ala Val Pro Phe Ile Ser

              125                 130                 135

          GAT GTT TTC CAG CAA GTG GAA CAC ATT TCC AAA GGG AAC AAC TGC CTG

    721

          Asp Val Phe Gln Gln Val Glu His Ile Ser Lys Gly Asn Asn Cys Leu

          140                 145                 150                 155

          GAC GCA GCC AAG GCC TGC AAC CTG GAC GAC ACC TGT AAG AAG TAC AGG

    769

          Asp Ala Ala Lys Ala Cys Asn Leu Asp Asp Thr Cys Lys Lys Tyr Arg

                          160                 165                 170

          TCG GCC TAC ATC ACC CCC TGC ACC ACC AGC ATG TCC AAC GAG GTC TGC

    817

          Ser Ala Tyr Ile Thr Pro Cys Thr Thr Ser Met Ser Asn Glu Val Cys

                      175                 180                 185

          AAC CGC CGT AAG TGC CAC AAG GCC CTC AGG CAG TTC TTC GAC AAG GTT

    865

          Asn Arg Arg Lys Cys His Lys Ala Leu Arg Gln Phe Phe Asp Lys Val

                  190                 195                 200

          CCG GCC AAG CAC AGC TAC GGG ATG CTC TTC TGC TCC TGC CGG GAC ATC

    913

          Pro Ala Lys His Ser Tyr Gly Met Leu Phe Cys Ser Cys Arg Asp Ile

              205                 210                 215

          GCC TGC ACC GAG CGG CGG CGA CAG ACT ATC GTC CCC GTG TGC TCC TAT

    961

          Ala Cys Thr Glu Arg Arg Arg Gln Thr Ile Val Pro Val Cys Ser Tyr

          220                 225                 230                 235

          GAA GAA CGA GAG AGG CCC AAC TGC CTG AGT CTG CAA GAC TCC TGC AAG

    1009

          Glu Glu Arg Glu Arg Pro Asn Cys Leu Ser Leu Gln Asp Ser Cys Lys

                          240                 245                 250

          ACC AAT TAC ATC TGC AGA TCT CGC CTT GCA GAT TTT TTT ACC AAC TGC

    1057

          Thr Asn Tyr Ile Cys Arg Ser Arg Leu Ala Asp Phe Phe Thr Asn Cys

                      255                 260                 265

          CAG CCA GAG TCA AGG TCT GTC AGC AAC TGT CTT AAG GAG AAC TAC GCA

    1105

          Gln Pro Glu Ser Arg Ser Val Ser Asn Cys Leu Lys Glu Asn Tyr Ala

                  270                 275                 280

          GAC TGC CTC CTG GCC TAC TCG GGA CTG ATT GGC ACA GTC ATG ACT CCC

    1153

          Asp Cys Leu Leu Ala Tyr Ser Gly Leu Ile Gly Thr Val Met Thr Pro

              285                 290                 295

          AAC TAC GTA GAC TCC AGC AGC CTC AGC GTG GCA CCA TGG TGT GAC TGC

    1201

          Asn Tyr Val Asp Ser Ser Ser Leu Ser Val Ala Pro Trp Cys Asp Cys

          300                 305                 310                 315

          AGC AAC AGC GGC AAT GAC CTG GAA GAC TGC TTG AAA TTT CTG AAT TTT

    1249

          Ser Asn Ser Gly Asn Asp Leu Glu Asp Cys Leu Lys Phe Leu Asn Phe

                          320                 325                 330

          TTT AAG GAC AAT ACT TGT CTC AAA AAT GCA ATT CAA GCC TTT GGC AAT

    1297

          Phe Lys Asp Asn Thr Cys Leu Lys Asn Ala Ile Gln Ala Phe Gly Asn

                      335                 340                 345

          GGC TCA GAT GTG ACC ATG TGG CAG CCA GCC CCT CCA GTC CAG ACC ACC

    1345

          Gly Ser Asp Val Thr Met Trp Gln Pro Ala Pro Pro Val Gln Thr Thr

                  350                 355                 360

          ACT GCC ACC ACT ACC ACT GCC TTC CGG GTC AAG AAC AAG CCT CTG GGG

    1393

          Thr Ala Thr Thr Thr Thr Ala Phe Arg Val Lys Asn Lys Pro Leu Gly

              365                 370                 375

          CCA GCA GGG TCT GAG AAT GAG ATC CCC ACA CAC GTT TTA CCA CCC TGT

    1441

          Pro Ala Gly Ser Glu Asn Glu Ile Pro Thr His Val Leu Pro Pro Cys

          380                 385                 390                 395

          GCG AAT TTG CAG GCT CAG AAG CTG AAA TCC AAT GTG TCG GGT AGC ACA

    1489

          Ala Asn Leu Gln Ala Gln Lys Leu Lys Ser Asn Val Ser Gly Ser Thr

                          400                 405                 410

          CAC CTC TGT CTT TCT GAT AGT GAT TTC GGA AAG GAT GGT CTC GCT GGT

    1537

          His Leu Cys Leu Ser Asp Ser Asp Phe Gly Lys Asp Gly Leu Ala Gly

                      415                 420                 425

          GCC TCC AGC CAC ATA ACC ACA AAA TCA ATG GCT GCT CCT CCC AGC TGC

    1585

          Ala Ser Ser His Ile Thr Thr Lys Ser Met Ala Ala Pro Pro Ser Cys

                  430                 435                 440

          AGT CTG AGC TCA CTG CCG GTG CTG ATG CTC ACC GCC CTT GCT GCC CTG

    1633

          Ser Leu Ser Ser Leu Pro Val Leu Met Leu Thr Ala Leu Ala Ala Leu

              445                 450                 455

          TTA TCT GTA TCG TTG GCA GAA ACG TCG TAGCTGCATC CGGGAAAACA

    1680

          Leu Ser Val Ser Leu Ala Glu Thr Ser

          460                 465

          GTATGAAAAG ACAAAAGAGA ACCAAGTATT CTGTCCCTGT CCTCTTGTAT ATCTGAAAAT

    1740

          CCAGTTTTAA AAGCTCCGTT GAGAAGCAGT TTCACCCAAC TGGAACTCTT TCCTTGTTTT

    1800

          TAAGAAAGCT TGTGGCCCTC AGGGGCTTCT GTTGAAGAAC TGCTACAGGG CTAATTCCAA

    1860

          ACCCATAAGG CTCTGGGGCG TGGTGCGGCT TAAGGGGACC ATTTGCACCA TGTAAAGCAA

    1920

          GCTGGGCTTA TCATGTGTTT GATGGTGAGG ATGGTAGTGG TGATGATGAT GGTAATTTTA

    1980

          ACAGCTTGAA CCCTGTTCTC TCTACTGGTT AGGAACAGGA GATACTATTG ATAAAGATTC

    2040

          TTCCATGTCT TACTCAGCAG CATTGCCTTC TGAAGACAGG CCCGCAGCCT AGTGTGAATG

    2100

          ACAAGTGGAG GTTGGCCTCA AGAGTGGACT TGGCAGACTC TACCTTGTAG TAATGTTCAC

    2160

          CTTTCCGTGT ATGGTCTCCA CAGAGTGTTT ATGTATTTAC AGACTGTTCT GTGATCCCCC

    2220

          AACAACAACA ACCACAAATT CCTTGGTCAC CTCCAAATGT AACCGGTCCT TTAGCCCAGT

    2280

          AGAGGAGGGT GGGTGTGGCC CTGGCACAGC TCCCGGATTG TTGATGGGCA CTCTCCTGAG

    2340

          CTTTGCTTGA GTGAGAAGCT GAATGTAGCT GAAAATCAAC TCTTCTTACA CTTCTTACTG

    2400

          CTTCGTTCAC TTACGAGGTC ACATATAGAA CAAACATCAC CAACTATTAG CTTACCGTTA

    2460

          GCTTCCCAAC TATTAGCTTT CTATGTTTTG AAAGCAGTGT TGCTGACCCC ATGTTTTAAT

    2520

          GATGGTTTAA TACATGCAGC CCTTTCCTCT CATCGGTAAC ACTAGCTCCA ACATCAACTT

    2580

          CATGCATGTG GCTCTCAAAA GCAGGCCCCA AGAAGCCCAG TTCTTTAGGA GAAAGCTGCG

    2640

          TCCTGTTTCT GTGGACAGGC AGGAGGAAAC AGAGCAGCCT GCCCGTGGTG TCTTTATCTG

    2700

          TTTTGAAATC AAGGCTGCCT GTGTGTAAGG AATGGTTCAA TTCTTATAAA GGGTGCCACT

    2760

          GTTGATGCCA CAACTGGCAG TTGGTCTAGC TCCAGGACAC CGGTTTCCAT GTTGCCTGGC

    2820

          AGAGACAGCT TTGATTGGGA CTGGCTGGCC ACAAGGGATG GGATGAAGAT GTGCTGCCCT

    2880

          CTCTTTCAAA GTTGAGCCCT GCCAGGGCAC ATAGAAGCAT CTTTGCTCCT GACCACAACG

    2940

          TAGAACAGCT TGGATTCAAG GTCATCAAGC GTCTCCTGTA CATTGCTCTG TGACCTTCAT

    3000

          AACAGACTGT CCCGCACAAA AGGAACGGCA GTTTATGGAT CTAGAGTGGG AGCACAGGGT

    3060

          CTGGAAAGGT GAACCGATTG GCAAAATACA CAGAACAGGA GGGAGAGTCT CAAGCCGAGA

    3120

          CATCTTGCTT ACTAGCCACA CACCATCTCC TGGAGCCCTC CTCCTGACCT GGGCAGACCC

    3180

          TTAGGTGTAT ATCTAAAGAC CTCTTCAATG TTCAGGTTCA GAATCTGTAA ATGGTTGCGT

    3240

          CCTGGCACCC ATTCCTGAAA ACTGAACAAA GGAGAGGATA TCTTTCCTCC ATTGAGCCCT

    3300

          GAAAGTATGA CTGGCTTCTC ACCCTCCCAC AGAGCAGGGA GCCCTGGTGC ACACAGTCTC

    3360

          CTGATATCCT CCCTGCTCTT TGAGGTTTGC CTTGGGAGAA AATGATTCAC CTCGGGAGGG

    3420

          GACGCTTTGG TGTCTGAAGT ACGTTTATAT CGAAATGTTA ATGAATACCC ATGTAAAATA

    3480

          CTCAATAGCC ACCTTTCTTC CCTTCACAAT GTTTTCGAGG GGAATGCATC CAACATCCAA

    3540

          GTGTACCTGG TCAGTGGGAA GTTCCATGAA GACTCATACA TTGAATAAAC ATATTCGATG

    3600

          TGCCGAAAGC GGCCGC

    3616

    (2)关于SEQ ID NO:2的信息

        (i)序列特征

            (A)长度:468个氨基酸

            (B)类型:氨基酸

            (D)拓扑结构:线型

        (ii)分子类型:蛋白质

        (xi)序列描述:SEQ ID NO:2:

    Met Phe Leu Ala Thr Leu Tyr Phe Ala Leu Pro Leu Leu Asp Leu Leu

      1               5                  10                      15

    Met Ser Ala Glu Val Ser Gly Gly Asp Arg Leu Asp Cys Val Lys Ala

                 20                  25                      30

    Ser Asp Gln Cys Leu Lys Glu Gln Ser Cys Ser Thr Lys Tyr Arg Thr

             35                  40                      45

    Leu Arg Gln Cys Val Ala Gly Lys Glu Thr Asn Phe Ser Leu Thr Ser

         50                  55                  60

    Gly Leu Glu Ala Lys Asp Glu Cys Arg Ser Ala Met Glu Ala Leu Lys

     65                  70                  75                  80

    Gln Lys Ser Leu Tyr Asn Cys Arg Cys Lys Arg Gly Met Lys Lys Glu

                     85                  90                  95

    Lys Asn Cys Leu Arg Ile Tyr Trp Ser Met Tyr Gln Ser Leu Gln Gly

                100                 105                 110

    Asn Asp Leu Leu Glu Asp Ser Pro Tyr Glu Pro Val Asn Ser Arg Leu

            115                 120                 125

    Ser Asp Ile Phe Arg Ala Val Pro Phe Ile Ser Asp Val Phe Gln Gln

        130                 135                 140

    Val Glu His Ile Ser Lys Gly Asn Asn Cys Leu Asp Ala Ala Lys Ala

    145                 150                 155                 160

    Cys Asn Leu Asp Asp Thr Cys Lys Lys Tyr Arg Ser Ala Tyr Ile Thr

                    165                 170                 175

    Pro Cys Thr Thr Ser Met Ser Asn Glu Val Cys Asn Arg Arg Lys Cys

                180                 185                 190

    His Lys Ala Leu Arg Gln Phe Phe Asp Lys Val Pro Ala Lys His Ser

            195                 200                 205

    Tyr Gly Met Leu Phe Cys Ser Cys Arg Asp Ile Ala Cys Thr Glu Arg

        210                 215                 220

    Arg Arg Gln Thr Ile Val Pro Val Cys Ser Tyr Glu Glu Arg Glu Arg

    225                 230                 235                 240

    Pro Asn Cys Leu Ser Leu Gln Asp Ser Cys Lys Thr Asn Tyr Ile Cys

                    245                 250                 255

    Arg Ser Arg Leu Ala Asp Phe Phe Thr Asn Cys Gln Pro Glu Ser Arg

                260                 265                 270

    Ser Val Ser Asn Cys Leu Lys Glu Asn Tyr Ala Asp Cys Leu Leu Ala

            275                 280                 285

    Tyr Ser Gly Leu Ile Gly Thr Val Met Thr Pro Asn Tyr Val Asp Ser

        290                 295                 300

    Ser Ser Leu Ser Val Ala Pro Trp Cys Asp Cys Ser Asn Ser Gly Asn

    305                 310                 315                 320

    Asp Leu Glu Asp Cys Leu Lys Phe Leu Asn Phe Phe Lys Asp Asn Thr

                    325                 330                 335

    Cys Leu Lys Asn Ala Ile Gln Ala Phe Gly Asn Gly Ser Asp Val Thr

                340                 345                 350

    Met Trp Gln Pro Ala Pro Pro Val Gln Thr Thr Thr Ala Thr Thr Thr

            355                 360                 365

    Thr Ala Phe Arg Val Lys Asn Lys Pro Leu Gly Pro Ala Gly Ser Glu

        370                 375                 380

    Asn Glu Ile Pro Thr His Val Leu Pro Pro Cys Ala Asn Leu Gln Ala

    385                 390                 395                 400

    Gln Lys Leu Lys Ser Asn Val Ser Gly Ser Thr His Leu Cys Leu Ser

                    405                 410                 415

    Asp Ser Asp Phe Gly Lys Asp Gly Leu Ala Gly Ala Ser Ser His Ile

                420                 425                 430

    Thr Thr Lys Ser Met Ala Ala Pro Pro Ser Cys Ser Leu Ser Ser Leu

            435                 440                 445

    Pro Val Leu Met Leu Thr Ala Leu Ala Ala Leu Leu Ser Val Ser Leu

        450                 455                 460

    Ala Glu Thr Ser

    465

    (2)关于SEQ ID NO:3的信息

        (i)序列特征

            (A)长度:39个碱基对

            (B)类型:核酸

            (C)链型:单链

            (D)拓扑结构:线型

        (ii)分子类型:cDNA

        (xi)序列描述:SEQ ID NO:3:

        AAGGAAAAAA GCGGCCGCCA TGGCGAAGGC GACGTCCGG

    39

    (2)关于SEQ ID NO:4的信息

        (i)序列特征

            (A)长度:33个碱基对

            (B)类型:核酸

            (C)链型:单链

            (D)拓扑结构:线型

        (ii)分子类型:cDNA

        (xi)序列描述:SEQ ID NO:4:

        AGTTTTGTCG ACCGTGCGGC ACAGCTCGTC GCA

    33

    (2)关于SEQ ID NO:5的信息

        (i)序列特征

            (A)长度:33个碱基对

            (B)类型:核酸

            (C)链型:单链

            (D)拓扑结构:线型

        (ii)分子类型:cDNA

        (xi)序列描述:SEQ ID NO:5:

          AGTTTTGTCG ACCGTGCGGC ACAGCGCATC ACA

    33

    (2)关于SEQ ID NO:6的信息

        (i)序列特征

            (A)长度:1926个碱基对

            (B)类型:核酸

            (C)链型:单链

            (D)拓扑结构:线型

        (ii)分子类型:cDNA

        (ix)特征:

            (A)名称/关键:CDS

            (B)位置:10..1920

        (xi)序列描述:SEQ ID NO:6:

          GCGGCCGCC ATG GCG AAG GCG ACG TCC GGC GCC GCA GGG CTG GGG CTG

    48

                    Met Ala Lys Ala Thr Ser Gly Ala Ala Gly Leu Gly Leu

                        470                 475                 480

          AAG CTG TTT TTG CTG CTG CCG CTA CTG GGA GAA GCC CCG CTG GGT CTC

    96

          Lys Leu Phe Leu Leu Leu Pro Leu Leu Gly Glu Ala Pro Leu Gly Leu

                      485                 490                 495

          TAC TTC TCA AGG GAT GCT TAC TGG GAG AGG CTG TAT GTG GAC CAG CCA

    144

          Tyr Phe Ser Arg Asp Ala Tyr Trp Glu Arg Leu Tyr Val Asp Gln Pro

                  500                 505                 510

          GCT GGC ACA CCT CTG CTC TAT GTC CAT GCC CTA CGG GAT GCC CCT GGA

    192

          Ala Gly Thr Pro Leu Leu Tyr Val His Ala Leu Arg Asp Ala Pro Gly

              515                 520                 525

          GAA GTG CCC AGC TTC CGC CTG GGC CAG TAT CTC TAT GGC GTC TAC CGC

    240

          Glu Val Pro Ser Phe Arg Leu Gly Gln Tyr Leu Tyr Gly Val Tyr Arg

          530                 535                 540                 545

          ACG CGT CTG CAT GAG AAT GAC TGG ATC CAC ATC GAT GCG GGC ACT GGC

    288

          Thr Arg Leu His Glu Asn Asp Trp Ile His Ile Asp Ala Gly Thr Gly

                          550                 555                 560

          CTC CTC TAC CTC AAT CAG AGC CTG GAC CAT AGT TCC TGG GAG CAG CTC

    336

          Leu Leu Tyr Leu Asn Gln Ser Leu Asp His Ser Ser Trp Glu Gln Leu

                      565                 570                 575

          AGC ATC CGA AAT GGC GGC TTC CCC TTG CTC ACC GTC TTC CTC CAG GTC

    384

          Ser Ile Arg Asn Gly Gly Phe Pro Leu Leu Thr Val Phe Leu Gln Val

                  580                 585                 590

          TTC CTG GGG TCC ACA GCC CAG AGA GAG GGA GAG TGT CAT TGG CCA GGC

    432

          Phe Leu Gly Ser Thr Ala Gln Arg Glu Gly Glu Cys His Trp Pro Gly

              595                 600                 605

          TGT GCC CGT GTG TAC TTC TCC TTC ATC AAC GAC ACC TTC CCA AAT TGT

    480

          Cys Ala Arg Val Tyr Phe Ser Phe Ile Asn Asp Thr Phe Pro Asn Cys

          610                 615                 620                 625

          AGC TCC TTC AAA GCC CGG GAT CTC TGC ACC CCA GAG ACG GGT GTG TCC

    528

          Ser Ser Phe Lys Ala Arg Asp Leu Cys Thr Pro Glu Thr Gly Val Ser

                          630                 635                 640

          TTC CGC ATC AGG GAG AAC AGG CCC CCT GGC ACC TTC TAC CAG TTC CGC

    576

          Phe Arg Ile Arg Glu Asn Arg Pro Pro Gly Thr Phe Tyr Gln Phe Arg

                      645                 650                 655

          ATG CTA CCT GTG CAG TTC CTT TGT CCT AAC ATC AGT GTG AAG TAC AAA

    624

          Met Leu Pro Val Gln Phe Leu Cys Pro Asn Ile Ser Val Lys Tyr Lys

                  660                 665                 670

          CTC TTA GAA GGG GAC GGT CTG CCC TTC CGT TGT GAC CCC GAC TGT CTG

    672

          Leu Leu Glu Gly Asp Gly Leu Pro Phe Arg Cys Asp Pro Asp Cys Leu

              675                 680                 685

          GAG GTG AGC ACG CGG TGG GCA CTG GAT CGG GAG CTT CAG GAG AAG TAT

    720

          Glu Val Ser Thr Arg Trp Ala Leu Asp Arg Glu Leu Gln Glu Lys Tyr

          690                 695                 700                 705

          GTG CTG GAG GCT GAG TGC GCA GTG GCA GGC CCT GGA GCC AAC AAG GAG

    768

          Val Leu Glu Ala Glu Cys Ala Val Ala Gly Pro Gly Ala Asn Lys Glu

                          710                 715                 720

          AAG GTG GCC GTG TCC TTC CCG GTG ACG GTG TAT GAT GAA GAC GAC TCC

    816

          Lys Val Ala Val Ser Phe Pro Val Thr Val Tyr Asp Glu Asp Asp Ser

                      725                 730                 735

          CCG CCC ACC TTC TCC GGA GGT GTG GGC ACC GCC AGT GCT GTG GTG GAG

    864

          Pro Pro Thr Phe Ser Gly Gly Val Gly Thr Ala Ser Ala Val Val Glu

                  740                 745                 750

          TTT AAG CGG AAG GAG GGC ACT GTG GTA GCC ACT CTG CAG GTG TTT GAT

    912

          Phe Lys Arg Lys Glu Gly Thr Val Val Ala Thr Leu Gln Val Phe Asp

              755                 760                 765

          GCA GAT GTG GTG CCA GCA TCT GGG GAG CTG GTG AGG CGG TAC ACA AGC

    960

          Ala Asp Val Val Pro Ala Ser Gly Glu Leu Val Arg Arg Tyr Thr Ser

          770                 775                 780                 785

          ACA CTA CTC TCA GGG GAT TCC TGG GCC CAG CAG ACC TTC CGG GTG GAG

    1008

          Thr Leu Leu Ser Gly Asp Ser Trp Ala Gln Gln Thr Phe Arg Val Glu

                          790                 795                 800

          CAC ACA CCC AAC GAG ACC TTG GTC CAG TCC AAC AAC AAC TCC GTG CGG

    1056

          His Thr Pro Asn Glu Thr Leu Val Gln Ser Asn Asn Asn Ser Val Arg

                      805                 810                 815

          GCA ACC ATG CAC AAT TAC AAG CTG GTT CTC AAC AGG AGC CTG TCC ATC

    1104

          Ala Thr Met His Asn Tyr Lys Leu Val Leu Asn Arg Ser Leu Ser Ile

                  820                 825                 830

          TCA GAG AGC CGA GTC CTG CAG CTA GTA GTC CTG GTC AAT GAC TCA GAC

    1152

          Ser Glu Ser Arg Val Leu Gln Leu Val Val Leu Val Asn Asp Ser Asp

              835                 840                 845

          TTC CAG GGG CCT GGG TCA GGT GTT CTC TTC CTC CAT TTC AAC GTG TCT

    1200

          Phe Gln Gly Pro Gly Ser Gly Val Leu Phe Leu His Phe Asn Val Ser

          850                 855                 860                 865

          GTG CTG CCT GTC ACC CTG AAC CTA CCC ATG GCC TAC TCC TTC CCA GTG

    1248

          Val Leu Pro Val Thr Leu Asn Leu Pro Met Ala Tyr Ser Phe Pro Val

                          870                 875                 880

          AAT AGG AGA GCC CGC CGT TAT GCC CAG ATT GGG AAA GTT TGC GTG GAG

    1296

          Asn Arg Arg Ala Arg Arg Tyr Ala Gln Ile Gly Lys Val Cys Val Glu

                      885                 890                 895

          AAC TGC CAG GAG TTC AGC GGT GTC TCC ATC CAG TAC AAG CTG CAG CCC

    1344

          Asn Cys Gln Glu Phe Ser Gly Val Ser Ile Gln Tyr Lys Leu Gln Pro

                  900                 905                 910

          TCC AGC ACC AAC TGC AGT GCC CTA GGT GTG GTC ACC TCA ACA GAA GAC

    1392

          Ser Ser Thr Asn Cys Ser Ala Leu Gly Val Val Thr Ser Thr Glu Asp

              915                 920                 925

          ACC TCA GGG ACC CTA TAT GTA AAT GAC ACG GAG GCC CTG CGG CGA CCT

    1440

          Thr Ser Gly Thr Leu Tyr Val Asn Asp Thr Glu Ala Leu Arg Arg Pro

          930                 935                 940                 945

          GAG TGT ACC GAG CTT CAG TAC ACA GTG GTA GCC ACT GAC CGG CAG ACC

    1488

          Glu Cys Thr Glu Leu Gln Tyr Thr Val Val Ala Thr Asp Arg Gln Thr

                          950                 955                 960

          CGC AGG CAG ACC CAA GCT TCG TTA GTC GTC ACA GTG GAG GGG ACA TAC

    1536        

          Arg Arg Gln Thr Gln Ala Ser Leu Val Val Thr Val Glu Gly Thr Tyr

                      965                 970                 975

          ATT GCA GAA GAA GTG GGC TGC CCC AAG TCC TGT GCA GTA AAC AAG AGG

    1584

          Ile Ala Glu Glu Val Gly Cys Pro Lys Ser Cys Ala Val Asn Lys Arg

                  980                 985                 990

          CGA CCT GAG TGT GAG GAG TGT GGT GGC CTG GGT TCT CCA ACT GGC AGA

    1632

          Arg Pro Glu Cys Glu Glu Cys Gly Gly Leu Gly Ser Pro Thr Gly Arg

              995                 1000                1005

          TGT GAG TGG CGT CAG GGA GAT GGT AAA GGG ATC ACC AGG AAC TTC TCC

    1680

          Cys Glu Trp Arg Gln Gly Asp Gly Lys Gly Ile Thr Arg Asn Phe Ser

          1010                1015                1020                1025

          ACC TGT TCT CCT AGC ACC AGG ACC TGT CCT GAT GGC CAC TGT GAT GCT

    1728

          Thr Cys Ser Pro Ser Thr Arg Thr Cys Pro Asp Gly His Cys Asp Ala

                          1030                1035                1040

          CTG GAG AGC CGG GAT ATC AAC ATT TGC CCC CAG GAC TGT CTC CGT GGC

    1776

          Leu Glu Ser Arg Asp Ile Asn Ile Cys Pro Gln Asp Cys Leu Arg Gly

                      1045                1050                1055

          CCC ATT GTT GGC GGG CAT GAG CGA GGG GAG CGC CAG GGG ATT AAA GCC

    1824

          Pro Ile Val Gly Gly His Glu Arg Gly Glu Arg Gln Gly Ile Lys Ala

                  1060                1065                1070

          GGC TAT GGC ATC TGC AAC TGT TTC CCT GAT GAG AAG AAG TGC TTC TGC

    1872

          Gly Tyr Gly Ile Cys Asn Cys Phe Pro Asp Glu Lys Lys Cys Phe Cys

              1075                1080                1085

          GAG CCA GAG GAC AGC CAG GGC CCA TTG TGT GAT GCG CTG TGC CGC ACG

    1920

          Glu Pro Glu Asp Ser Gln Gly Pro Leu Cys Asp Ala Leu Cys Arg Thr

          1090                1095                1100                1105

          GTCGAC

    1926

    (2)关于SEQ ID NO:7的信息

        (i)序列特征

            (A)长度:637个氨基酸

            (B)类型:氨基酸

            (D)拓扑结构:线型

        (i)分子类型:蛋白质

        (xi)序列描述:SEQ ID NO:7:

    Met Ala Lys Ala Thr Ser Gly Ala Ala Gly Leu Gly Leu Lys Leu Phe

      1               5                  10                  15

    Leu Leu Leu Pro Leu Leu Gly Glu Ala Pro Leu Gly Leu Tyr Phe Ser

                 20                  25                  30

    Arg Asp Ala Tyr Trp Glu Arg Leu Tyr Val Asp Gln Pro Ala Gly Thr

             35                  40                  45

    Pro Leu Leu Tyr Val His Ala Leu Arg Asp Ala Pro Gly Glu Val Pro

         50                  55                  60

    Ser Phe Arg Leu Gly Gln Tyr Leu Tyr Gly Val Tyr Arg Thr Arg Leu

     65                  70                  75                  80

    His Glu Asn Asp Trp Ile His Ile Asp Ala Gly Thr Gly Leu Leu Tyr

                     85                  90                  95

    Leu Asn Gln Ser Leu Asp His Ser Ser Trp Glu Gln Leu Ser Ile Arg

                100                 105                 110

    Asn Gly Gly Phe Pro Leu Leu Thr Val Phe Leu Gln Val Phe Leu Gly

            115                 120                 125

    Ser Thr Ala Gln Arg Glu Gly Glu Cys His Trp Pro Gly Cys Ala Arg

        130                 135                 140

    Val Tyr Phe Ser Phe Ile Asn Asp Thr Phe Pro Asn Cys Ser Ser Phe

    145                 150                 155                 160

    Lys Ala Arg Asp Leu Cys Thr Pro Glu Thr Gly Val Ser Phe Arg Ile

                    165                 170                 175

    Arg Glu Asn Arg Pro Pro Gly Thr Phe Tyr Gln Phe Arg Met Leu Pro

                180                 185                 190

    Val Gln Phe Leu Cys Pro Asn Ile Ser Val Lys Tyr Lys Leu Leu Glu

            195                 200                 205

    Gly Asp Gly Leu Pro Phe Arg Cys Asp Pro Asp Cys Leu Glu Val Ser

        210                 215                 220

    Thr Arg Trp Ala Leu Asp Arg Glu Leu Gln Glu Lys Tyr Val Leu Glu

    225                 230                 235                 240

    Ala Glu Cys Ala Val Ala Gly Pro Gly Ala Asn Lys Glu Lys Val Ala

                    245                 250                 255

    Val Ser Phe Pro Val Thr Val Tyr Asp Glu Asp Asp Ser Pro Pro Thr

                260                 265                 270

    Phe Ser Gly Gly Val Gly Thr Ala Ser Ala Val Val Glu Phe Lys Arg

            275                 280                 285

    Lys Glu Gly Thr Val Val Ala Thr Leu Gln Val Phe Asp Ala Asp Val

        290                 295                 300

    Val Pro Ala Ser Gly Glu Leu Val Arg Arg Tyr Thr Ser Thr Leu Leu

    305                 310                 315                 320

    Ser Gly Asp Ser Trp Ala Gln Gln Thr Phe Arg Val Glu His Thr Pro

                    325                 330                 335

    Asn Glu Thr Leu Val Gln Ser Asn Asn Asn Ser Val Arg Ala Thr Met

                340                 345                 350

    His Asn Tyr Lys Leu Val Leu Asn Arg Ser Leu Ser Ile Ser Glu Ser

            355                 360                 365

    Arg Val Leu Gln Leu Val Val Leu Val Asn Asp Ser Asp Phe Gln Gly

        370                 375                 380

    Pro Gly Ser Gly Val Leu Phe Leu His Phe Asn Val Ser Val Leu Pro

    385                 390                 395                 400

    Val Thr Leu Asn Leu Pro Met Ala Tyr Ser Phe Pro Val Asn Arg Arg

                    405                 410                 415

    Ala Arg Arg Tyr Ala Gln Ile Gly Lys Val Cys Val Glu Asn Cys Gln

                420                 425                 430

    Glu Phe Ser Gly Val Ser Ile Gln Tyr Lys Leu Gln Pro Ser Ser Thr

            435                 440                 445

    Asn Cys Ser Ala Leu Gly Val Val Thr Ser Thr Glu Asp Thr Ser Gly

        450                 455                 460

    Thr Leu Tyr Val Asn Asp Thr Glu Ala Leu Arg Arg Pro Glu Cys Thr

    465                 470                 475                 480

    Glu Leu Gln Tyr Thr Val Val Ala Thr Asp Arg Gln Thr Arg Arg Gln

                    485                 490                 495

    Thr Gln Ala Ser Leu Val Val Thr Val Glu Gly Thr Tyr Ile Ala Glu

                500                 505                 510

    Glu Val Gly Cys Pro Lys Ser Cys Ala Val Asn Lys Arg Arg Pro Glu

            515                 520                 525

    Cys Glu Glu Cys Gly Gly Leu Gly Ser Pro Thr Gly Arg Cys Glu Trp

        530                 535                 540

    Arg Gln Gly Asp Gly Lys Gly Ile Thr Arg Asn Phe Ser Thr Cys Ser

    545                 550                 555                 560

    Pro Ser Thr Arg Thr Cys Pro Asp Gly His Cys Asp Ala Leu Glu Ser

                    565                 570                 575

    Arg Asp Ile Asn Ile Cys Pro Gln Asp Cys Leu Arg Gly Pro Ile Val

                580                 585                 590

    Gly Gly His Glu Arg Gly Glu Arg Gln Gly Ile Lys Ala Gly Tyr Gly

            595                 600                 605

    Ile Cys Asn Cys Phe Pro Asp Glu Lys Lys Cys Phe Cys Glu Pro Glu

        610                 615                 620

    Asp Ser Gln Gly Pro Leu Cys Asp Ala Leu Cys Arg Thr

    625                 630                 635

    (2)关于SEQ ID NO:8的信息

        (i)序列特征

            (A)长度:1223个碱基对

            (B)类型:核酸

            (C)链型:单链

            (D)拓扑结构:线型

        (ii)分子类型:cDNA

        (ix)特征:

            (A)名称/关键:CDS

            (B)位置:1..1038

        (xi)序列描述:SEQ ID NO:8:

          CTG CTG GAG GAT TCC CCA TAT GAA CCA GTT AAC AGC AGA TTG TCA GAT

    48

          Leu Leu Glu Asp Ser Pro Tyr Glu Pro Val Asn Ser Arg Leu Ser Asp

                  640                 645                 650

          ATA TTC CGG GTG GTC CCA TTC ATA TCA GTG GAG CAC ATT CCC AAA GGG

    96

          Ile Phe Arg Val Val Pro Phe Ile Ser Val Glu His Ile Pro Lys Gly

              655                 660                 665

          AAC AAC TGC CTG GAT GCA GCG AAG GCC TGC AAC CTC GAC GAC ATT TGC

    144

          Asn Asn Cys Leu Asp Ala Ala Lys Ala Cys Asn Leu Asp Asp Ile Cys

          670                 675                 680                 685

          AAG AAG TAC AGG TCG GCG TAC ATC ACC CCG TGC ACC ACC AGC GTG TCC

    192

          Lys Lys Tyr Arg Ser Ala Tyr Ile Thr Pro Cys Thr Thr Ser Val Ser

                          690                 695                 700

          AAC GAT GTC TGC AAC CGC CGC AAG TGC CAC AAG GCC CTC CGG CAG TTC

    240

          Asn Asp Val Cys Asn Arg Arg Lys Cys His Lys Ala Leu Arg Gln Phe

                      705                 710                 715

          TTT GAC AAG GTC CCG GCC AAG CAC AGC TAC GGA ATG CTC TTC TGC TCC

    288

          Phe Asp Lys Val Pro Ala Lys His Ser Tyr Gly Met Leu Phe Cys Ser

                  720                 725                 730

          TGC CGG GAC ATC GCC TGC ACA GAG CGG AGG CGA CAG ACC ATC GTG CCT

    336

          Cys Arg Asp Ile Ala Cys Thr Glu Arg Arg Arg Gln Thr Ile Val Pro

              735                 740                 745

          GTG TGC TCC TAT GAA GAG AGG GAG AAG CCC AAC TGT TTG AAT TTG CAG

    384

          Val Cys Ser Tyr Glu Glu Arg Glu Lys Pro Asn Cys Leu Asn Leu Gln

          750                 755                 760                 765

          GAC TCC TGC AAG ACG AAT TAC ATC TGC AGA TCT CGC CTT GCG GAT TTT

    432

          Asp Ser Cys Lys Thr Asn Tyr Ile Cys Arg Ser Arg Leu Ala Asp Phe

                          770                 775                 780

          TTT ACC AAC TGC CAG CCA GAG TCA AGG TCT GTC AGC AGC TGT CTA AAG

    480

          Phe Thr Asn Cys Gln Pro Glu Ser Arg Ser Val Ser Ser Cys Leu Lys

                      785                 790                 795

          GAA AAC TAC GCT GAC TGC CTC CTC GCC TAC TCG GGG CTT ATT GGC ACA

    528

          Glu Asn Tyr Ala Asp Cys Leu Leu Ala Tyr Ser Gly Leu Ile Gly Thr

                  800                 805                 810

          GTC ATG ACC CCC AAC TAC ATA GAC TCC AGT AGC CTC AGT GTG GCC CCA

    576

          Val Met Thr Pro Asn Tyr Ile Asp Ser Ser Ser Leu Ser Val Ala Pro

              815                 820                 825

          TGG TGT GAC TGC AGC AAC AGT GGG AAC GAC CTA GAA GAG TGC TTG AAA

    624

          Trp Cys Asp Cys Ser Asn Ser Gly Asn Asp Leu Glu Glu Cys Leu Lys

          830                 835                 840                 845

          TTT TTG AAT TTC TTC AAG GAC AAT ACA TGT CTT AAA AAT GCA ATT CAA

    672

          Phe Leu Asn Phe Phe Lys Asp Asn Thr Cys Leu Lys Asn Ala Ile Gln

                          850                 855                 860

          GCC TTT GGC AAT GGC TCC GAT GTG ACC GTG TGG CAG CCA GCC TTC CCA

    720

          Ala Phe Gly Asn Gly Ser Asp Val Thr Val Trp Gln Pro Ala Phe Pro

                      865                 870                 875

          GTA CAG ACC ACC ACT GCC ACT ACC ACC ACT GCC CTC CGG GTT AAG AAC

    768

          Val Gln Thr Thr Thr Ala Thr Thr Thr Thr Ala Leu Arg Val Lys Asn

                  880                 885                 890

          AAG CCC CTG GGG CCA GCA GGG TCT GAG AAT GAA ATT CCC ACT CAT GTT

    816

          Lys Pro Leu Gly Pro Ala Gly Ser Glu Asn Glu Ile Pro Thr His Val

              895                 900                 905

          TTG CCA CCG TGT GCA AAT TTA CAG GCA CAG AAG CTG AAA TCC AAT GTG

    864

          Leu Pro Pro Cys Ala Asn Leu Gln Ala Gln Lys Leu Lys Ser Asn Val

          910                 915                 920                 925

          TCG GGC AAT ACA CAC CTC TGT ATT TCC AAT GGT AAT TAT GAA AAA GAA

    912

          Ser Gly Asn Thr His Leu Cys Ile Ser Asn Gly Asn Tyr Glu Lys Glu

                          930                 935                 940

          GGT CTC GGT GCT TCC AGC CAC ATA ACC ACA AAA TCA ATG GCT GCT CCT

    960

          Gly Leu Gly Ala Ser Ser His Ile Thr Thr Lys Ser Met Ala Ala Pro

                      945                 950                 955

          CCA AGC TGT GGT CTG AGC CCA CTG CTG GTC CTG GTG GTA ACC GCT CTG

    1008

          Pro Ser Cys Gly Leu Ser Pro Leu Leu Val Leu Val Val Thr Ala Leu

                  960                 965                 970

          TCC ACC CTA TTA TCT TTA ACA GAA ACA TCA TAGCTGCATT AAAAAAATAC

    1058

          Ser Thr Leu Leu Ser Leu Thr Glu Thr Ser

              975                 980

          AATATGGACA TGTAAAAAGA CAAAAACCAA GTTATCTGTT TCCTGTTCTC TTGTATAGCT

    1118

          GAAATTCCAG TTTAGGAGCT CAGTTGAGAA ACAGTTCCAT TCAACTGGAA CATTTTTTTT

    1178

          TTTTCCTTTT AAGAAAGCTT CTTGTGATCC TTCGGGGCTT CTGTG

    1223

    (2)关于SEQ ID NO:9的信息

        (i)序列特征

            (A)长度:346个氨基酸

            (B)类型:氨基酸

            (D)拓扑结构:线型

        (ii)分子类型:蛋白质

        (xi)序列描述:SEQ ID NO:9:

    Leu Leu Glu Asp Ser Pro Tyr Glu Pro Val Asn Ser Arg Leu Ser Asp

      1               5                  10                  15

    Ile Phe Arg Val Val Pro Phe Ile Ser Val Glu His Ile Pro Lys Gly

                 20                  25                  30

    Asn Asn Cys Leu Asp Ala Ala Lys Ala Cys Asn Leu Asp Asp Ile Cys

             35                  40                  45

    Lys Lys Tyr Arg Ser Ala Tyr Ile Thr Pro Cys Thr Thr Ser Val Ser

         50                  55                  60

    Asn Asp Val Cys Asn Arg Arg Lys Cys His Lys Ala Leu Arg Gln Phe

     65                  70                  75                  80

    Phe Asp Lys Val Pro Ala Lys His Ser Tyr Gly Met Leu Phe Cys Ser

                     85                  90                  95

    Cys Arg Asp Ile Ala Cys Thr Glu Arg Arg Arg Gln Thr Ile Val Pro

                100                 105                 110

    Val Cys Ser Tyr Glu Glu Arg Glu Lys Pro Asn Cys Leu Asn Leu Gln

            115                 120                 125

    Asp Ser Cys Lys Thr Asn Tyr Ile Cys Arg Ser Arg Leu Ala Asp Phe

        130                 135                 140

    Phe Thr Asn Cys Gln Pro Glu Ser Arg Ser Val Ser Ser Cys Leu Lys

    145                 150                 155                 160

    Glu Asn Tyr Ala Asp Cys Leu Leu Ala Tyr Ser Gly Leu Ile Gly Thr

                    165                 170                 175

    Val Met Thr Pro Asn Tyr Ile Asp Ser Ser Ser Leu Ser Val Ala Pro

                180                 185                 190

    Trp Cys Asp Cys Ser Asn Ser Gly Asn Asp Leu Glu Glu Cys Leu Lys

            195                 200                 205

    Phe Leu Asn Phe Phe Lys Asp Asn Thr Cys Leu Lys Asn Ala Ile Gln

        210                 215                 220

    Ala Phe Gly Asn Gly Ser Asp Val Thr Val Trp Gln Pro Ala Phe Pro

    225                 230                 235                 240

    Val Gln Thr Thr Thr Ala Thr Thr Thr Thr Ala Leu Arg Val Lys Asn

                    245                 250                 255

    Lys Pro Leu Gly Pro Ala Gly Ser Glu Asn Glu Ile Pro Thr His Val

                260                 265                 270

    Leu Pro Pro Cys Ala Asn Leu Gln Ala Gln Lys Leu Lys Ser Asn Val

            275                 280                 285

    Ser Gly Asn Thr His Leu Cys Ile Ser Asn Gly Asn Tyr Glu Lys Glu

        290                 295                 300

    Gly Leu Gly Ala Ser Ser His Ile Thr Thr Lys Ser Met Ala Ala Pro

    305                 310                 315                 320

    Pro Ser Cys Gly Leu Ser Pro Leu Leu Val Leu Val Val Thr Ala Leu

                    325                 330                 335

    Ser Thr Leu Leu Ser Leu Thr Glu Thr Ser

                340                 345

    (2)关于SEQ ID NO:10的信息

        (i)序列特征

            (A)长度:1682个碱基对

            (B)类型:核酸

            (C)链型:单链

            (D)拓扑结构:线型

        (ii)分子类型:cDNA

        (ix)特征:

            (A)名称/关键:CDS

            (B)位置:118..1497

        (xi)序列描述:SEQ ID NO:10:

          GGGCGGCCAG AGCAGCACAG CTGTCCGGGG ATCGCTGCAT GCTGAGCTCC CTCGGCAAGA

    60

          CCCAGCGGCG GCTCGGGATT TTTTTGGGGG GGCGGGGACC AGCCCCGCGC CGGCACC

    117

          ATG TTC CTG GCG ACC CTG TAC TTC GCG CTG CCG CTC TTG GAC TTG CTC

    165

          Met Phe Leu Ala Thr Leu Tyr Phe Ala Leu Pro Leu Leu Asp Leu Leu

                      350                 355                 360

          CTG TCG GCC GAA GTG AGC GGC GGA GAC CGC CTG GAT TGC GTG AAA GCC

    213

          Leu Ser Ala Glu Val Ser Gly Gly Asp Arg Leu Asp Cys Val Lys Ala

                  365                 370                 375

          AGT GAT CAG TGC CTG AAG GAG CAG AGC TGC AGC ACC AAG TAC CGC ACG

    261

          Ser Asp Gln Cys Leu Lys Glu Gln Ser Cys Ser Thr Lys Tyr Arg Thr

              380                 385                 390

          CTA AGG CAG TGC GTG GCG GGC AAG GAG ACC AAC TTC AGC CTG GCA TCC

    309

          Leu Arg Gln Cys Val Ala Gly Lys Glu Thr Asn Phe Ser Leu Ala Ser

          395                 400                 405                 410

          GGC CTG GAG GCC AAG GAT GAG TGC CGC AGC GCC ATG GAG GCC CTG AAG

    357

          Gly Leu Glu Ala Lys Asp Glu Cys Arg Ser Ala Met Glu Ala Leu Lys

                          415                 420                 425

          CAG AAG TCG CTC TAC AAC TGC CGC TGC AAG CGG GGT ATG AAG AAG GAG

    405

          Gln Lys Ser Leu Tyr Asn Cys Arg Cys Lys Arg Gly Met Lys Lys Glu

                      430                 435                 440

          AAG AAC TGC CTG CGC ATT TAC TGG AGC ATG TAC CAG AGC CTG CAG GGA

    453

          Lys Asn Cys Leu Arg Ile Tyr Trp Ser Met Tyr Gln Ser Leu Gln Gly

                  445                 450                 455

          AAT GAT CTG CTG GAG GAT TCC CCA TAT GAA CCA GTT AAC AGC AGA TTG

    501

          Asn Asp Leu Leu Glu Asp Ser Pro Tyr Glu Pro Val Asn Ser Arg Leu

              460                 465                 470

          TCA GAT ATA TTC CGG GTG GTC CCA TTC ATA TCA GTG GAG CAC ATT CCC

    549

          Ser Asp Ile Phe Arg Val Val Pro Phe Ile Ser Val Glu His Ile Pro

          475                 480                 485                 490

          AAA GGG AAC AAC TGC CTG GAT GCA GCG AAG GCC TGC AAC CTC GAC GAC

    597

          Lys Gly Asn Asn Cys Leu Asp Ala Ala Lys Ala Cys Asn Leu Asp Asp

                          495                 500                 505

          ATT TGC AAG AAG TAC AGG TCG GCG TAC ATC ACC CCG TGC ACC ACC AGC

    645

          Ile Cys Lys Lys Tyr Arg Ser Ala Tyr Ile Thr Pro Cys Thr Thr Ser

                      510                 515                 520

          GTG TCC AAC GAT GTC TGC AAC CGC CGC AAG TGC CAC AAG GCC CTC CGG

    693

          Val Ser Asn Asp Val Cys Asn Arg Arg Lys Cys His Lys Ala Leu Arg

                  525                 530                 535

          CAG TTC TTT GAC AAG GTC CCG GCC AAG CAC AGC TAC GGA ATG CTC TTC

    741

          Gln Phe Phe Asp Lys Val Pro Ala Lys His Ser Tyr Gly Met Leu Phe

              540                 545                 550

          TGC TCC TGC CGG GAC ATC GCC TGC ACA GAG CGG AGG CGA CAG ACC ATC

    789

          Cys Ser Cys Arg Asp Ile Ala Cys Thr Glu Arg Arg Arg Gln Thr Ile

          555                 560                 565                 570

          GTG CCT GTG TGC TCC TAT GAA GAG AGG GAG AAG CCC AAC TGT TTG AAT

    837

          Val Pro Val Cys Ser Tyr Glu Glu Arg Glu Lys Pro Asn Cys Leu Asn

                          575                 580                 585

          TTG CAG GAC TCC TGC AAG ACG AAT TAC ATC TGC AGA TCT CGC CTT GCG

    885

          Leu Gln Asp Ser Cys Lys Thr Asn Tyr Ile Cys Arg Ser Arg Leu Ala

                      590                 595                 600

          GAT TTT TTT ACC AAC TGC CAG CCA GAG TCA AGG TCT GTC AGC AGC TGT

    933

          Asp Phe Phe Thr Asn Cys Gln Pro Glu Ser Arg Ser Val Ser Ser Cys

                  605                 610                 615

          CTA AAG GAA AAC TAC GCT GAC TGC CTC CTC GCC TAC TCG GGG CTT ATT

    981

          Leu Lys Glu Asn Tyr Ala Asp Cys Leu Leu Ala Tyr Ser Gly Leu Ile

              620                 625                 630

          GGC ACA GTC ATG ACC CCC AAC TAC ATA GAC TCC AGT AGC CTC AGT GTG

    1029

          Gly Thr Val Met Thr Pro Asn Tyr Ile Asp Ser Ser Ser Leu Ser Val

          635                 640                 645                 650

          GCC CCA TGG TGT GAC TGC AGC AAC AGT GGG AAC GAC CTA GAA GAG TGC

    1077

          Ala Pro Trp Cys Asp Cys Ser Asn Ser Gly Asn Asp Leu Glu Glu Cys

                          655                 660                 665

          TTG AAA TTT TTG AAT TTC TTC AAG GAC AAT ACA TGT CTT AAA AAT GCA

    1125

          Leu Lys Phe Leu Asn Phe Phe Lys Asp Asn Thr Cys Leu Lys Asn Ala

                      670                 675                 680

          ATT CAA GCC TTT GGC AAT GGC TCC GAT GTG ACC GTG TGG CAG CCA GCC

    1173

          Ile Gln Ala Phe Gly Asn Gly Ser Asp Val Thr Val Trp Gln Pro Ala

                  685                 690                 695

          TTC CCA GTA CAG ACC ACC ACT GCC ACT ACC ACC ACT GCC CTC CGG GTT

    1221

          Phe Pro Val Gln Thr Thr Thr Ala Thr Thr Thr Thr Ala Leu Arg Val

              700                 705                 710

          AAG AAC AAG CCC CTG GGG CCA GCA GGG TCT GAG AAT GAA ATT CCC ACT

    1269

          Lys Asn Lys Pro Leu Gly Pro Ala Gly Ser Glu Asn Glu Ile Pro Thr

          715                 720                 725                 730

          CAT GTT TTG CCA CCG TGT GCA AAT TTA CAG GCA CAG AAG CTG AAA TCC

    1317

          His Val Leu Pro Pro Cys Ala Asn Leu Gln Ala Gln Lys Leu Lys Ser

                          735                 740                 745

          AAT GTG TCG GGC AAT ACA CAC CTC TGT ATT TCC AAT GGT AAT TAT GAA

    1365

          Asn Val Ser Gly Asn Thr His Leu Cys Ile Ser Asn Gly Asn Tyr Glu

                      750                 755                 760

          AAA GAA GGT CTC GGT GCT TCC AGC CAC ATA ACC ACA AAA TCA ATG GCT

    1413

          Lys Glu Gly Leu Gly Ala Ser Ser His Ile Thr Thr Lys Ser Met Ala

                  765                 770                 775

          GCT CCT CCA AGC TGT GGT CTG AGC CCA CTG CTG GTC CTG GTG GTA ACC

    1461

          Ala Pro Pro Ser Cys Gly Leu Ser Pro Leu Leu Val Leu Val Val Thr

              780                 785                 790

          GCT CTG TCC ACC CTA TTA TCT TTA ACA GAA ACA TCA TAGCTGCATT

    1507

          Ala Leu Ser Thr Leu Leu Ser Leu Thr Glu Thr Ser

          795                 800                 805

          AAAAAAATAC AATATGGACA TGTAAAAAGA CAAAAACCAA GTTATCTGTT TCCTGTTCTC

    1567

          TTGTATAGCT GAAATTCCAG TTTAGGAGCT CAGTTGAGAA ACAGTTCCAT TCAACTGGAA

    1627

          CATTTTTTTT TTTTCCTTTT AAGAAAGCTT CTTGTGATCC TTCGGGGCTT CTGTG

    1682

    (2)关于SEQ ID NO:11的信息

        (i)序列特征

            (A)长度:460个氨基酸

            (B)类型:氨基酸

            (D)拓扑结构:线型

        (ii)分子类型:蛋白质

        (xi)序列描述:SEQ ID NO:11:

    Met Phe Leu Ala Thr Leu Tyr Phe Ala Leu Pro Leu Leu Asp Leu Leu

      1               5                  10                  15

    Leu Ser Ala Glu Val Ser Gly Gly Asp Arg Leu Asp Cys Val Lys Ala

                 20                  25                  30

    Ser Asp Gln Cys Leu Lys Glu Gln Ser Cys Ser Thr Lys Tyr Arg Thr

             35                  40                  45

    Leu Arg Gln Cys Val Ala Gly Lys Glu Thr Asn Phe Ser Leu Ala Ser

         50                  55                  60

    Gly Leu Glu Ala Lys Asp Glu Cys Arg Ser Ala Met Glu Ala Leu Lys

     65                  70                  75                  80

    Gln Lys Ser Leu Tyr Asn Cys Arg Cys Lys Arg Gly Met Lys Lys Glu

                     85                  90                  95

    Lys Asn Cys Leu Arg Ile Tyr Trp Ser Met Tyr Gln Ser Leu Gln Gly

                100                 105                 110

    Asn Asp Leu Leu Glu Asp Ser Pro Tyr Glu Pro Val Asn Ser Arg Leu

            115                 120                 125

    Ser Asp Ile Phe Arg Val Val Pro Phe Ile Ser Val Glu His Ile Pro

        130                 135                 140

    Lys Gly Asn Asn Cys Leu Asp Ala Ala Lys Ala Cys Asn Leu Asp Asp

    145                 150                 155                 160

    Ile Cys Lys Lys Tyr Arg Ser Ala Tyr Ile Thr Pro Cys Thr Thr Ser

                    165                 170                 175

    Val Ser Asn Asp Val Cys Asn Arg Arg Lys Cys His Lys Ala Leu Arg

                180                 185                 190

    Gln Phe Phe Asp Lys Val Pro Ala Lys His Ser Tyr Gly Met Leu Phe

            195                 200                 205

    Cys Ser Cys Arg Asp Ile Ala Cys Thr Glu Arg Arg Arg Gln Thr Ile

        210                 215                 220

    Val Pro Val Cys Ser Tyr Glu Glu Arg Glu Lys Pro Asn Cys Leu Asn

    225                 230                 235                 240

    Leu Gln Asp Ser Cys Lys Thr Asn Tyr Ile Cys Arg Ser Arg Leu Ala

                    245                 250                 255

    Asp Phe Phe Thr Asn Cys Gln Pro Glu Ser Arg Ser Val Ser Ser Cys

                260                 265                 270

    Leu Lys Glu Asn Tyr Ala Asp Cys Leu Leu Ala Tyr Ser Gly Leu Ile

            275                 280                 285

    Gly Thr Val Met Thr Pro Asn Tyr Ile Asp Ser Ser Ser Leu Ser Val

        290                 295                 300

    Ala Pro Trp Cys Asp Cys Ser Asn Ser Gly Asn Asp Leu Glu Glu Cys

    305                 310                 315                 320

    Leu Lys Phe Leu Asn Phe Phe Lys Asp Asn Thr Cys Leu Lys Asn Ala

                    325                 330                 335

    Ile Gln Ala Phe Gly Asn Gly Ser Asp Val Thr Val Trp Gln Pro Ala

                340                 345                 350

    Phe Pro Val Gln Thr Thr Thr Ala Thr Thr Thr Thr Ala Leu Arg Val

            355                 360                 365

    Lys Asn Lys Pro Leu Gly Pro Ala Gly Ser Glu Asn Glu Ile Pro Thr

        370                 375                 380

    His Val Leu Pro Pro Cys Ala Asn Leu Gln Ala Gln Lys Leu Lys Ser

    385                 390                 395                 400

    Asn Val Ser Gly Asn Thr His Leu Cys Ile Ser Asn Gly Asn Tyr Glu

                    405                 410                 415

    Lys Glu Gly Leu Gly Ala Ser Ser His Ile Thr Thr Lys Ser Met Ala

                420                 425                 430

    Ala Pro Pro Ser Cys Gly Leu Ser Pro Leu Leu Val Leu Val Val Thr

            435                 440                 445

    Ala Leu Ser Thr Leu Leu Ser Leu Thr Glu Thr Ser

        450                 455                 460

    (2)关于SEQ ID NO:12的信息

        (i)序列特征

            (A)长度:1888个碱基对

            (B)类型:核酸

            (C)链型:单链

            (D)拓扑结构:线型

        (ii)分子类型:cDNA

        (ix)特征:

            (A)名称/关键:CDS

            (B)位置:25..1416

        (xi)序列描述:SEQ ID NO:12:

        AAAAAACGGT GGGATTTATT TAAC ATG ATC TTG GCA AAC GTC TTC TGC CTC

    51  

                                   Met Ile Leu Ala Asn Val Phe Cys Leu

                                                   465

         TTC TTC TTT CTA GAC GAG ACC CTC CGC TCT TTG GCC AGC CCT TCC TCC

    99

         Phe Phe Phe Leu Asp Glu Thr Leu Arg Ser Leu Ala Ser Pro Ser Ser

         470                 475                 480                 485

         CTG CAG GGC CCC GAG CTC CAC GGC TGG CGC CCC CCA GTG GAC TGT GTC

    147

         Leu Gln Gly Pro Glu Leu His Gly Trp Arg Pro Pro Val Asp Cys Val

                         490                 495                 500

         CGG GCC AAT GAG CTG TGT GCC GCC GAA TCC AAC TGC AGC TCT CGC TAC

    195

          Arg Ala Asn Glu Leu Cys Ala Ala Glu Ser Asn Cys Ser Ser Arg Tyr

                      505                 510                 515

          CGC ACT CTG CGG CAG TGC CTG GCA GGC CGC GAC CGC AAC ACC ATG CTG

    243

          Arg Thr Leu Arg Gln Cys Leu Ala Gly Arg Asp Arg Asn Thr Met Leu

                  520                 525                 530

          GCC AAC AAG GAG TGC CAG GCG GCC TTG GAG GTC TTG CAG GAG AGC CCG

    291

          Ala Asn Lys Glu Cys Gln Ala Ala Leu Glu Val Leu Gln Glu Ser Pro

              535                 540                 545

          CTG TAC GAC TGC CGC TGC AAG CGG GGC ATG AAG AAG GAG CTG CAG TGT

    339

          Leu Tyr Asp Cys Arg Cys Lys Arg Gly Met Lys Lys Glu Leu Gln Cys

          550                 555                 560                 565

          CTG CAG ATC TAC TGG AGC ATC CAC CTG GGG CTG ACC GAG GGT GAG GAG

    387

          Leu Gln Ile Tyr Trp Ser Ile His Leu Gly Leu Thr Glu Gly Glu Glu

                          570                 575                 580

          TTC TAC GAA GCC TCC CCC TAT GAG CCG GTG ACC TCC CGC CTC TCG GAC

    435

          Phe Tyr Glu Ala Ser Pro Tyr Glu Pro Val Thr Ser Arg Leu Ser Asp

                      585                 590                 595

          ATC TTC AGG CTT GCT TCA ATC TTC TCA GGG ACA GGG GCA GAC CCG GTG

    483

          Ile Phe Arg Leu Ala Ser Ile Phe Ser Gly Thr Gly Ala Asp Pro Val

                  600                 605                 610

          GTC AGC GCC AAG AGC AAC CAT TGC CTG GAT GCT GCC AAG GCC TGC AAC

    531

          Val Ser Ala Lys Ser Asn His Cys Leu Asp Ala Ala Lys Ala Cys Asn

              615                 620                 625

          CTG AAT GAC AAC TGC AAG AAG CTG CGC TCC TCC TAC ATC TCC ATC TGC

    579

          Leu Asn Asp Asn Cys Lys Lys Leu Arg Ser Ser Tyr Ile Ser Ile Cys

          630                 635                 640                 645

          AAC CGC GAG ATC TCG CCC ACC GAG CGC TGC AAC CGC CGC AAG TGC CAC

    627

          Asn Arg Glu Ile Ser Pro Thr Glu Arg Cys Asn Arg Arg Lys Cys His

                          650                 655                 660

          AAG GCC CTG CGC CAG TTC TTC GAC CGG GTG CCC AGC GAG TAC ACC TAC

    675

          Lys Ala Leu Arg Gln Phe Phe Asp Arg Val Pro Ser Glu Tyr Thr Tyr

                      665                 670                 675

          CGC ATG CTC TTC TGC TCC TGC CAA GAC CAG GCG TGC GCT GAG CGC CGC

    723

          Arg Met Leu Phe Cys Ser Cys Gln Asp Gln Ala Cys Ala Glu Arg Arg

                  680                 685                 690

          CGG CAA ACC ATC CTG CCC AGC TGC TCC TAT GAG GAC AAG GAG AAG CCC

    771

          Arg Gln Thr Ile Leu Pro Ser Cys Ser Tyr Glu Asp Lys Glu Lys Pro

              695                 700                 705

          AAC TGC CTG GAC CTG CGT GGC GTG TGC CGG ACT GAC CAC CTG TGT CGG

    819

          Asn Cys Leu Asp Leu Arg Gly Val Cys Arg Thr Asp His Leu Cys Arg

          710                 715                 720                 725

          TCC CGG CTG GCC GAC TTC CAT GCC AAT TGT CGA GCC TCC TAC CAG ACG

    867

          Ser Arg Leu Ala Asp Phe His Ala Asn Cys Arg Ala Ser Tyr Gln Thr

                          730                 735                 740

          GTC ACC AGC TGC CCT GCG GAC AAT TAC CAG GCG TGT CTG GGC TCT TAT

    915

          Val Thr Ser Cys Pro Ala Asp Asn Tyr Gln Ala Cys Leu Gly Ser Tyr

                      745                 750                 755

          GCT GGC ATG ATT GGG TTT GAC ATG ACA CCT AAC TAT GTG GAC TCC AGC

    963

          Ala Gly Met Ile Gly Phe Asp Met Thr Pro Asn Tyr Val Asp Ser Ser

                  760                 765                 770

          CCC ACT GGC ATC GTG GTG TCC CCC TGG TGC AGC TGT CGT GGC AGC GGG

    1011

          Pro Thr Gly Ile Val Val Ser Pro Trp Cys Ser Cys Arg Gly Ser Gly

              775                 780                 785

          AAC ATG GAG GAG GAG TGT GAG AAG TTC CTC AGG GAC TTC ACC GAG AAC

    1059

          Asn Met Glu Glu Glu Cys Glu Lys Phe Leu Arg Asp Phe Thr Glu Asn

          790                 795                 800                 805

          CCA TGC CTC CGG AAC GCC ATC CAG GCC TTT GGC AAC GGC ACG GAC GTG

    1107

          Pro Cys Leu Arg Asn Ala Ile Gln Ala Phe Gly Asn Gly Thr Asp Val

                          810                 815                 820

          AAC GTG TCC CCA AAA GGC CCC TCG TTC CAG GCC ACC CAG GCC CCT CGG

    1155

          Asn Val Ser Pro Lys Gly Pro Ser Phe Gln Ala Thr Gln Ala Pro Arg

                      825                 830                 835

          GTG GAG AAG ACG CCT TCT TTG CCA GAT GAC CTC AGT GAC AGT ACC AGC

    1203

          Val Glu Lys Thr Pro Ser Leu Pro Asp Asp Leu Ser Asp Ser Thr Ser

                  840                 845                 850

          TTG GGG ACC AGT GTC ATC ACC ACC TGC ACG TCT GTC CAG GAG CAG GGG

    1251

          Leu Gly Thr Ser Val Ile Thr Thr Cys Thr Ser Val Gln Glu Gln Gly

              855                 860                 865

          CTG AAG GCC AAC AAC TCC AAA GAG TTA AGC ATG TGC TTC ACA GAG CTC

    1299

          Leu Lys Ala Asn Asn Ser Lys Glu Leu Ser Met Cys Phe Thr Glu Leu

          870                 875                 880                 885

          ACG ACA AAT ATC ATC CCA GGG AGT AAC AAG GTG ATC AAA CCT AAC TCA

    1347

          Thr Thr Asn Ile Ile Pro Gly Ser Asn Lys Val Ile Lys Pro Asn Ser

                          890                 895                 900

          GGC CCC AGC AGA GCC AGA CCG TCG GCT GCC TTG ACC GTG CTG TCT GTC

    1395

          Gly Pro Ser Arg Ala Arg Pro Ser Ala Ala Leu Thr Val Leu Ser Val

                      905                 910                 915

          CTG ATG CTG AAA CTG GCC TTG TAGGCTGTGG GAACCGAGTC AGAAGATTTT

    1446

          Leu Met Leu Lys Leu Ala Leu

                  920

          TGAAAGCTAC GCAGACAAGA ACAGCCGCCT GACGAAATGG AAACACACAC AGACACACAC

    1506

          ACACCTTGCA AAAAAAAAAT TGTTTTTCCC ACCTTGTCGC TGAACCTGTC TCCTCCCAGG

    1566

          TTTCTTCTCT GGAGAAGTTT TTGTAAACCA AACAGACAAG CAGGCAGGCA GCCTGAGAGC

    1626

          TGGCCCAGGG GTCCCCTGGC AGGGGAAACT CTGGTGCCGG GGAGGGCACG AGGCTCTAGA

    1686

          AATGCCCTTC ACTTTCTCCT GGTGTTTTTC TCTCTGGACC CTTCTGAAGC AGAGACCGGA

    1746

          CAAGAGCCTG CAGCGGAAGG GACTCTGGGC TGTGCCTGAG GCTGGCTGGG GGCAGGACAA

    1806

          CACAGCTGCT TCCCCAGGCT GCCCACTCTG GGGACCCGCT GGGGGCTGGC AGAGGGCATC

    1866

          GGTCAGCGGG GCAGCGGGGC TG

    1888

    (2)关于SEQ ID NO:13的信息

        (i)序列特征

            (A)长度:464个氨基酸

            (B)类型:氨基酸

            (D)拓扑结构:线型

        (ii)分子类型:蛋白质

        (xi)序列描述:SEQ ID NO:13:

    Met Ile Leu Ala Asn Val Phe Cys Leu Phe Phe Phe Leu Asp Glu Thr

      1               5                  10                  15

    Leu Arg Ser Leu Ala Ser Pro Ser Ser Leu Gln Gly Pro Glu Leu His

                 20                  25                  30

    Gly Trp Arg Pro Pro Val Asp Cys Val Arg Ala Asn Glu Leu Cys Ala

             35                  40                  45

    Ala Glu Ser Asn Cys Ser Ser Arg Tyr Arg Thr Leu Arg Gln Cys Leu

         50                  55                  60

    Ala Gly Arg Asp Arg Asn Thr Met Leu Ala Asn Lys Glu Cys Gln Ala

     65                  70                  75                  80

    Ala Leu Glu Val Leu Gln Glu Ser Pro Leu Tyr Asp Cys Arg Cys Lys

                     85                  90                  95

    Arg Gly Met Lys Lys Glu Leu Gln Cys Leu Gln Ile Tyr Trp Ser Ile

                100                 105                 110

    His Leu Gly Leu Thr Glu Gly Glu Glu Phe Tyr Glu Ala Ser Pro Tyr

            115                 120                 125

    Glu Pro Val Thr Ser Arg Leu Ser Asp Ile Phe Arg Leu Ala Ser Ile

        130                 135                 140

    Phe Ser Gly Thr Gly Ala Asp Pro Val Val Ser Ala Lys Ser Asn His

    145                 150                 155                 160

    Cys Leu Asp Ala Ala Lys Ala Cys Asn Leu Asn Asp Asn Cys Lys Lys

                    165                 170                 175

    Leu Arg Ser Ser Tyr Ile Ser Ile Cys Asn Arg Glu Ile Ser Pro Thr

                180                 185                 190

    Glu Arg Cys Asn Arg Arg Lys Cys His Lys Ala Leu Arg Gln Phe Phe

            195                 200                 205

    Asp Arg Val Pro Ser Glu Tyr Thr Tyr Arg Met Leu Phe Cys Ser Cys

        210                 215                 220

    Gln Asp Gln Ala Cys Ala Glu Arg Arg Arg Gln Thr Ile Leu Pro Ser

    225                 230                 235                 240

    Cys Ser Tyr Glu Asp Lys Glu Lys Pro Asn Cys Leu Asp Leu Arg Gly

                    245                 250                 255

    Val Cys Arg Thr Asp His Leu Cys Arg Ser Arg Leu Ala Asp Phe His

                260                 265                 270

    Ala Asn Cys Arg Ala Ser Tyr Gln Thr Val Thr Ser Cys Pro Ala Asp

            275                 280                 285

    Asn Tyr Gln Ala Cys Leu Gly Ser Tyr Ala Gly Met Ile Gly Phe Asp

        290                 295                 300

    Met Thr Pro Asn Tyr Val Asp Ser Ser Pro Thr Gly Ile Val Val Ser

    305                 310                 315                 320

    Pro Trp Cys Ser Cys Arg Gly Ser Gly Asn Met Glu Glu Glu Cys Glu

                    325                 330                 335

    Lys Phe Leu Arg Asp Phe Thr Glu Asn Pro Cys Leu Arg Asn Ala Ile

                340                 345                 350

    Gln Ala Phe Gly Asn Gly Thr Asp Val Asn Val Ser Pro Lys Gly Pro

            355                 360                 365

    Ser Phe Gln Ala Thr Gln Ala Pro Arg Val Glu Lys Thr Pro Ser Leu

        270                 375                 380

    Pro Asp Asp Leu Ser Asp Ser Thr Ser Leu Gly Thr Ser Val Ile Thr

    385                 390                 395                 400

    Thr Cys Thr Ser Val Gln Glu Gln Gly Leu Lys Ala Asn Asn Ser Lys

                    405                 410                 415

    Glu Leu Ser Met Cys Phe Thr Glu Leu Thr Thr Asn Ile Ile Pro Gly

                420                 425                 430

    Ser Asn Lys Val Ile Lys Pro Asn Ser Gly Pro Ser Arg Ala Arg Pro

            435                 440                 445

    Ser Ala Ala Leu Thr Val Leu Ser Val Leu Met Leu Lys Leu Ala Leu

        450                 455                 460

    (2)关于SEQ ID NO:14的信息

        (i)序列特征

            (A)长度:1878个碱基对

            (B)类型:核酸

            (C)链型:单链

            (D)拓扑结构:线型

        (ii)分子类型:cDNA

        (ix)特征:

            (A)名称/关键:CDS

            (B)位置:205..1242

        (xi)序列描述:SEQ ID NO:14:

          CGCGGCGCCC AGCGCAGGCA GAGCGCTGTC GCATCCCGGG CGTCCACCCG CCATGGGGCT

    60

          CTCCTGGAGC CCGCGACCTC CACTGCTGAT GATCCTGCTA CTGGTGCTGT CGTTGTGGCT

    120

          GCCACTTGGA GCAGGAAACT CCCTTGCCAC AGAGAACAGG TTTGTGAACA GCTGTACCCA

    180

          GGCCAGAAAG AAATGCGAGG CTAA TCC CGC TTG CAA GGC TGC CTA CCA GCA

    231

                                     Ser Arg Leu Gln Gly Cys Leu Pro Ala

                                     465                 470

          CCT GGG CTC CTG CAC CTC CAG TTA AGC AGG CCG CTG CCC TTA GAG GAG

    279

          Pro Gly Leu Leu His Leu Gln Leu Ser Arg Pro Leu Pro Leu Glu Glu

              475                 480                 485

          TCT GCC ATG TCT GCA GAC TGC CTA GAG GCA GCA GAA CAA CTC AGG AAC

    327

          Ser Ala Met Ser Ala Asp Cys Leu Glu Ala Ala Glu Gln Leu Arg Asn

          490                 495                 500                 505

          AGC TCT CTG ATA GAC TGC AGG TGC CAT CGG CGC ATG AAG CAC CAA GCT

    375

          Ser Ser Leu Ile Asp Cys Arg Cys His Arg Arg Met Lys His Gln Ala

                          510                 515                 520

          ACC TGT CTG GAC ATT TAT TGG ACC GTT CAC CCT GCC CGA AGC CTT GGT

    423

          Thr Cys Leu Asp Ile Tyr Trp Thr Val His Pro Ala Arg Ser Leu Gly

                      525                 530                 535

          GAC TAC GAG TTG GAT GTC TCA CCC TAT GAA GAC ACA GTG ACC AGC AAA

    471

          Asp Tyr Glu Leu Asp Val Ser Pro Tyr Glu Asp Thr Val Thr Ser Lys

                  540                 545                 550

          CCC TGG AAA ATG AAT CTT AGC AAG TTG AAC ATG CTC AAA CCA GAC TCG

    519

          Pro Trp Lys Met Asn Leu Ser Lys Leu Asn Met Leu Lys Pro Asp Ser

              555                 560                 565

          GAC CTC TGC CTC AAA TTT GCT ATG CTG TGT ACT CTT CAC GAC AAG TGT

    567

          Asp Leu Cys Leu Lys Phe Ala Met Leu Cys Thr Leu His Asp Lys Cys

          570                 575                 580                 585

          GAC CGC CTG CGC AAG GCC TAC GGG GAG GCA TGC TCA GGG ATC CGC TGC

    615

          Asp Arg Leu Arg Lys Ala Tyr Gly Glu Ala Cys Ser Gly Ile Arg Cys

                          590                 595                 600

          CAG CGC CAC CTC TGC CTA GCC CAG CTG CGC TCC TTC TTT GAG AAG GCA

    663

          Gln Arg His Leu Cys Leu Ala Gln Leu Arg Ser Phe Phe Glu Lys Ala

                      605                 610                 615

          GCA GAG TCC CAC GCT CAG GGT CTG CTG CTG TGT CCC TGT GCA CCA GAA

    711

          Ala Glu Ser His Ala Gln Gly Leu Leu Leu Cys Pro Cys Ala Pro Glu

                  620                 625                 630

          GAT GCG GGC TGT GGG GAG CGG CGG CGT AAC ACC ATC GCC CCC AGT TGC

    759

          Asp Ala Gly Cys Gly Glu Arg Arg Arg Asn Thr Ile Ala Pro Ser Cys

              635                 640                 645

          GCC CTG CCT TCT GTA ACC CCC AAT TGC CTG GAT CTG CGG AGC TTC TGC

    807

          Ala Leu Pro Ser Val Thr Pro Asn Cys Leu Asp Leu Arg Ser Phe Cys

          650                 655                 660                 665

          CGT GCG GAC CCT TTG TGC AGA TCA CGC CTG ATG GAC TTC CAG ACC CAC

    855

          Arg Ala Asp Pro Leu Cys Arg Ser Arg Leu Met Asp Phe Gln Thr His

                          670                 675                 680

          TGT CAT CCT ATG GAC ATC CTT GGG ACT TGT GCA ACT GAG CAG TCC AGA

    903

          Cys His Pro Met Asp Ile Leu Gly Thr Cys Ala Thr Glu Gln Ser Arg

                      685                 690                 695

          TGT CTG CGG GCA TAC CTG GGG CTG ATT GGG ACT GCC ATG ACC CCA AAC

    951

          Cys Leu Arg Ala Tyr Leu Gly Leu Ile Gly Thr Ala Met Thr Pro Asn

                  700                 705                 710

          TTC ATC AGC AAG GTC AAC ACT ACT GTT GCC TTA AGC TGC ACC TGC CGA

    999

          Phe Ile Ser Lys Val Asn Thr Thr Val Ala Leu Ser Cys Thr Cys Arg

              715                 720                 725

          GGC AGC GGC AAC CTA CAG GAC GAG TGT GAA CAG CTG GAA AGG TCC TTC

    1047

          Gly Ser Gly Asn Leu Gln Asp Glu Cys Glu Gln Leu Glu Arg Ser Phe

          730                 735                 740                 745

          TCC CAG AAC CCC TGC CTC GTG GAG GCC ATT GCA GCT AAG ATG CGT TTC

    1095

          Ser Gln Asn Pro Cys Leu Val Glu Ala Ile Ala Ala Lys Met Arg Phe

                          750                 755                 760

          CAC AGA CAG CTC TTC TCC CAG GAC TGG GCA GAC TCT ACT TTT TCA GTG

    1143

          His Arg Gln Leu Phe Ser Gln Asp Trp Ala Asp Ser Thr Phe Ser Val

                      765                 770                 775

          GTG CAG CAG CAG AAC AGC AAC CCT GCT CTG AGA CTG CAG CCC AGG CTA

    1191

          Val Gln Gln Gln Asn Ser Asn Pro Ala Leu Arg Leu Gln Pro Arg Leu

                  780                 785                 790

          CCC ATT CTT TCT TTC TCC ATC CTT CCC TTG ATT CTG CTG CAG ACC CTC

    1239

          Pro Ile Leu Ser Phe Ser Ile Leu Pro Leu Ile Leu Leu Gln Thr Leu

              795                 800                 805

          TGG TAGCTGGGCT TCCTCAGGGT CCTTTGTCCT CTCCACCACA CCCAGACTGA

    1292

          Trp

          810

          TTTGCAGCCT GTGGTGGGAG AGAACTCGCC AGCCTGTGGA AGAAGACGCA GCGTGCTACA

    1352

          CAGCAACCCG GAACCAACCA GGCATTCCGC AGCACATCCC GTCTGCTCCA GAAGAGGTCT

    1412

          TAGAAGTGAG GGCTGTGACC CTTCCGATCC TGAGCGGCTA GTTTTCAAAC CTCCCTTGCC

    1472

          CCTGCTTCCT TCTGGCTCAG GCTGCTCCTC CTTAGGACTT TGTGGGTCCA GTTTTGCCTT

    1532

          CTGTTCTGAT GGTGATTAGC GGCTCACCTC CAGCGCTTCT TCCTGTTTCC CAGGACCACC

    1592

          CAGAGGCTAA GGAATCAGTC ATTCCCTGTT GCCTTCTCCA GGAAGGCAGG CTAAGGGTTC

    1652

          TGAGGTGACT GAGAAAAATG TTTCCTTTGT GTGGAAGGCT GGTGCTCCAG CCTCCACGTC

    1712

          CCTCTGAATG GAAGATAAAA ACCTGCTGGT GTCTTGACTG CTCTGCCAGG CAATCCTGAA

    1772

          CATTTGGGCA TGAAGAGCTA AAGTCTTTGG GTCTTGTTTA ACTCCTATTA CTGTCCCCAA

    1832

          ATTCCCCTAG TCCCTTGGGT CATGATTAAA CATTTTGACT TAAAAA

    1878

    (2)关于SEQ ID NO:15的信息

        (i)序列特征

            (A)长度:346个氨基酸

            (B)类型:氨基酸

            (D)拓扑结构:线型

        (ii)分子类型:蛋白质

        (xi)序列描述:SEQ ID NO:15:

    Ser Arg Leu Gln Gly Cys Leu Pro Ala Pro Gly Leu Leu His Leu Gln

      1               5                  10                  15

    Leu Ser Arg Pro Leu Pro Leu Glu Glu Ser Ala Met Ser Ala Asp Cys

                 20                  25                  30

    Leu Glu Ala Ala Glu Gln Leu Arg Asn Ser Ser Leu Ile Asp Cys Arg

             35                  40                  45

    Cys His Arg Arg Met Lys His Gln Ala Thr Cys Leu Asp Ile Tyr Trp

         50                  55                  60

    Thr Val His Pro Ala Arg Ser Leu Gly Asp Tyr Glu Leu Asp Val Ser

     65                  70                  75                  80

    Pro Tyr Glu Asp Thr Val Thr Ser Lys Pro Trp Lys Met Asn Leu Ser

                     85                  90                  95

    Lys Leu Asn Met Leu Lys Pro Asp Ser Asp Leu Cys Leu Lys Phe Ala

                100                 105                 110

    Met Leu Cys Thr Leu His Asp Lys Cys Asp Arg Leu Arg Lys Ala Tyr

            115                 120                 125

    Gly Glu Ala Cys Ser Gly Ile Arg Cys Gln Arg His Leu Cys Leu Ala

        130                 135                 140

    Gln Leu Arg Ser Phe Phe Glu Lys Ala Ala Glu Ser His Ala Gln Gly

    145                 150                 155                 160

    Leu Leu Leu Cys Pro Cys Ala Pro Glu Asp Ala Gly Cys Gly Glu Arg

                    165                 170                 175

    Arg Arg Asn Thr Ile Ala Pro Ser Cys Ala Leu Pro Ser Val Thr Pro

                180                 185                 190

    Asn Cys Leu Asp Leu Arg Ser Phe Cys Arg Ala Asp Pro Leu Cys Arg

            195                 200                 205

    Ser Arg Leu Met Asp Phe Gln Thr His Cys His Pro Met Asp Ile Leu

        210                 215                 220

    Gly Thr Cys Ala Thr Glu Gln Ser Arg Cys Leu Arg Ala Tyr Leu Gly

    225                 230                 235                 240

    Leu Ile Gly Thr Ala Met Thr Pro Asn Phe Ile Ser Lys Val Asn Thr

                    245                 250                 255

    Thr Val Ala Leu Ser Cys Thr Cys Arg Gly Ser Gly Asn Leu Gln Asp

                260                 265                 270

    Glu Cys Glu Gln Leu Glu Arg Ser Phe Ser Gln Asn Pro Cys Leu Val

            275                 280                 285

    Glu Ala Ile Ala Ala Lys Met Arg Phe His Arg Gln Leu Phe Ser Gln

        290                 295                 300

    Asp Trp Ala Asp Ser Thr Phe Ser Val Val Gln Gln Gln Asn Ser Asn

    305                 310                 315                 320

    Pro Ala Leu Arg Leu Gln Pro Arg Leu Pro Ile Leu Ser Phe Ser Ile

                    325                 330                 335

    Leu Pro Leu Ile Leu Leu Gln Thr Leu Trp

                340                 345

    (2)关于SEQ ID NO:16的信息

        (i)序列特征

            (A)长度:1889个碱基对

            (B)类型:核酸

            (C)链型:单链

            (D)拓扑结构:线型

        (ii)分子类型:cDNA

        (ix)特征:

            (A)名称/关键:CDS

            (B)位置:41..1231

        (xi)序列描述:SEQ ID NO:16:

          CGCAGGCAGA GCGCTGTCGC ATCCCGGGCG TCCACCCGCC ATG GGG CTC TCC TGG

    55

                                                      Met Gly Leu Ser Trp

                                                                  350

          AGC CCG CGA CCT CCA CTG CTG ATG ATC CTG CTA CTG GTG CTG TCG TTG

    103

          Ser Pro Arg Pro Pro Leu Leu Met Ile Leu Leu Leu Val Leu Ser Leu

                      355                 360                 365

          TGG CTG CCA CTT GGA GCA GGA AAC TCC CTT GCC ACA GAG AAC AGG TTT

    151

          Trp Leu Pro Leu Gly Ala Gly Asn Ser Leu Ala Thr Glu Asn Arg Phe

                  370                 375                 380

          GTG AAC AGC TGT ACC CAG GCC AGA AAG AAA TGC GAG GCT AAT CCC GCT

    199

          Val Asn Ser Cys Thr Gln Ala Arg Lys Lys Cys Glu Ala Asn Pro Ala

              385                 390                 395

          TGC AAG GCT GCC TAC CAG CAC CTG GGC TCC TGC ACC TCC AGT TTA AGC

    247

          Cys Lys Ala Ala Tyr Gln His Leu Gly Ser Cys Thr Ser Ser Leu Ser

          400                 405                 410                 415

          AGG CCG CTG CCC TTA GAG GAG TCT GCC ATG TCT GCA GAC TGC CTA GAG

    295

          Arg Pro Leu Pro Leu Glu Glu Ser Ala Met Ser Ala Asp Cys Leu Glu

                          420                 425                 430

          GCA GCA GAA CAA CTC AGG AAC AGC TCT CTG ATA GAC TGC AGG TGC CAT

    343

          Ala Ala Glu Gln Leu Arg Asn Ser Ser Leu Ile Asp Cys Arg Cys His

                      435                 440                 445

          CGG CGC ATG AAG CAC CAA GCT ACC TGT CTG GAC ATT TAT TGG ACC GTT

    391

          Arg Arg Met Lys His Gln Ala Thr Cys Leu Asp Ile Tyr Trp Thr Val

                  450                 455                 460

          CAC CCT GCC CGA AGC CTT GGT GAC TAC GAG TTG GAT GTC TCA CCC TAT

    439

          His Pro Ala Arg Ser Leu Gly Asp Tyr Glu Leu Asp Val Ser Pro Tyr

              465                 470                 475

          GAA GAC ACA GTG ACC AGC AAA CCC TGG AAA ATG AAT CTT AGC AAG TTG

    487

          Glu Asp Thr Val Thr Ser Lys Pro Trp Lys Met Asn Leu Ser Lys Leu

          480                 485                 490                 495

          AAC ATG CTC AAA CCA GAC TCG GAC CTC TGC CTC AAA TTT GCT ATG CTG

    535

          Asn Met Leu Lys Pro Asp Ser Asp Leu Cys Leu Lys Phe Ala Met Leu

                          500                 505                 510

          TGT ACT CTT CAC GAC AAG TGT GAC CGC CTG CGC AAG GCC TAC GGG GAG

    583

          Cys Thr Leu His Asp Lys Cys Asp Arg Leu Arg Lys Ala Tyr Gly Glu

                      515                 520                 525

          GCA TGC TCA GGG ATC CGC TGC CAG CGC CAC CTC TGC CTA GCC CAG CTG

    631

          Ala Cys Ser Gly Ile Arg Cys Gln Arg His Leu Cys Leu Ala Gln Leu

                  530                 535                 540

          CGC TCC TTC TTT GAG AAG GCA GCA GAG TCC CAC GCT CAG GGT CTG CTG

    679

          Arg Ser Phe Phe Glu Lys Ala Ala Glu Ser His Ala Gln Gly Leu Leu

              545                 550                  555

          CTG TGT CCC TGT GCA CCA GAA GAT GCG GGC TGT GGG GAG CGG CGG CGT

    727

          Leu Cys Pro Cys Ala Pro Glu Asp Ala Gly Cys Gly Glu Arg Arg Arg

          560                 565                 570                 575

          AAC ACC ATC GCC CCC AGT TGC GCC CTG CCT TCT GTA ACC CCC AAT TGC

    775

          Asn Thr Ile Ala Pro Ser Cys Ala Leu Pro Ser Val Thr Pro Asn Cys

                          580                 585                 590

          CTG GAT CTG CGG AGC TTC TGC CGT GCG GAC CCT TTG TGC AGA TCA CGC

    823

          Leu Asp Leu Arg Ser Phe Cys Arg Ala Asp Pro Leu Cys Arg Ser Arg

                      595                 600                 605

          CTG ATG GAC TTC CAG ACC CAC TGT CAT CCT ATG GAC ATC CTT GGG ACT

    871

          Leu Met Asp Phe Gln Thr His Cys His Pro Met Asp Ile Leu Gly Thr

                  610                 615                 620

          TGT GCA ACT GAG CAG TCC AGA TGT CTG CGG GCA TAC CTG GGG CTG ATT

    919

          Cys Ala Thr Glu Gln Ser Arg Cys Leu Arg Ala Tyr Leu Gly Leu Ile

              625                 630                 635

          GGG ACT GCC ATG ACC CCA AAC TTC ATC AGC AAG GTC AAC ACT ACT GTT

    967

          Gly Thr Ala Met Thr Pro Asn Phe Ile Ser Lys Val Asn Thr Thr Val

          640                 645                 650                 655

          GCC TTA AGC TGC ACC TGC CGA GGC AGC GGC AAC CTA CAG GAC GAG TGT

    1015

          Ala Leu Ser Cys Thr Cys Arg Gly Ser Gly Asn Leu Gln Asp Glu Cys

                          660                 665                 670

          GAA CAG CTG GAA AGG TCC TTC TCC CAG AAC CCC TGC CTC GTG GAG GCC

    1063

          Glu Gln Leu Glu Arg Ser Phe Ser Gln Asn Pro Cys Leu Val Glu Ala

                      675                 680                 685

          ATT GCA GCT AAG ATG CGT TTC CAC AGA CAG CTC TTC TCC CAG GAC TGG

    1111

          Ile Ala Ala Lys Met Arg Phe His Arg Gln Leu Phe Ser Gln Asp Trp

                  690                 695                 700

          GCA GAC TCT ACT TTT TCA GTG GTG CAG CAG CAG AAC AGC AAC CCT GCT

    1159

          Ala Asp Ser Thr Phe Ser Val Val Gln Gln Gln Asn Ser Asn Pro Ala

              705                 710                 715

          CTG AGA CTG CAG CCC AGG CTA CCC ATT CTT TCT TTC TCC ATC CTT CCC

    1207

          Leu Arg Leu Gln Pro Arg Leu Pro Ile Leu Ser Phe Ser Ile Leu Pro

          720                 725                 730                 735

          TTG ATT CTG CTG CAG ACC CTC TGG TAGCTGGGCT TCCTCAGGGT CCTTTGTCCT

    1261

          Leu Ile Leu Leu Gln Thr Leu Trp

                          740

          CTCCACCACA CCCAGACTGA TTTGCAGCCT GTGGTGGGAG AGAACTCGCC AGCCTGTGGA

    1321

          AGAAGACGCA GCGTGCTACA CAGCAACCCG GAACCAACCA GGCATTCCGC AGCACATCCC

    1381

          GTCTGCTCCA GAAGAGGTCT TAGAAGTGAG GGCTGTGACC CTTCCGATCC TGAGCGGCTA

    1441

          GTTTTCAAAC CTCCCTTGCC CCTGCTTCCT TCTGGCTCAG GCTGCTCCTC CTTAGGACTT

    1501

          TGTGGGTCCA GTTTTGCCTT CTGTTCTGAT GGTGATTAGC GGCTCACCTC CAGCGCTTCT

    1561

          TCCTGTTTCC CAGGACCACC CAGAGGCTAA GGAATCAGTC ATTCCCTGTT GCCTTCTCCA

    1621

          GGAAGGCAGG CTAAGGGTTC TGAGGTGACT GAGAAAAATG TTTCCTTTGT GTGGAAGGCT

    1681

          GGTGCTCCAG CCTCCACGTC CCTCTGAATG GAAGATAAAA ACCTGCTGGT GTCTTGACTG

    1741

          CTCTGCCAGG CAATCCTGAA CATTTGGGCA TGAAGAGCTA AAGTCTTTGG GTCTTGTTTA

    1801

          ACTCCTATTA CTGTCCCCAA ATTCCCCTAG TCCCTTGGGT CATGATTAAA CATTTTGACT

    1861

          TAAAAAAAAA AAAAAAAAAA AAAAAAAA

    1889

    (2)关于SEQ ID NO:17的信息

        (i)序列特征

            (A)长度:397个氨基酸

            (B)类型:氨基酸

            (D)拓扑结构:线型

        (ii)分子类型:蛋白质

        (xi)序列描述:SEQ ID NO:17:

    Met Gly Leu Ser Trp Ser Pro Arg Pro Pro Leu Leu Met Ile Leu Leu

      1               5                  10                  15

    Leu Val Leu Ser Leu Trp Leu Pro Leu Gly Ala Gly Asn Ser Leu Ala

                 20                  25                  30

    Thr Glu Asn Arg Phe Val Asn Ser Cys Thr Gln Ala Arg Lys Lys Cys

             35                  40                  45

    Glu Ala Asn Pro Ala Cys Lys Ala Ala Tyr Gln His Leu Gly Ser Cys

         50                  55                  60

    Thr Ser Ser Leu Ser Arg Pro Leu Pro Leu Glu Glu Ser Ala Met Ser

     65                  70                  75                  80

    Ala Asp Cys Leu Glu Ala Ala Glu Gln Leu Arg Asn Ser Ser Leu Ile

                     85                  90                  95

    Asp Cys Arg Cys His Arg Arg Met Lys His Gln Ala Thr Cys Leu Asp

                100                 105                 110

    Ile Tyr Trp Thr Val His Pro Ala Arg Ser Leu Gly Asp Tyr Glu Leu

            115                 120                 125

    Asp Val Ser Pro Tyr Glu Asp Thr Val Thr Ser Lys Pro Trp Lys Met

        130                 135                 140

    Asn Leu Ser Lys Leu Asn Met Leu Lys Pro Asp Ser Asp Leu Cys Leu

    145                 150                 155                 160

    Lys Phe Ala Met Leu Cys Thr Leu His Asp Lys Cys Asp Arg Leu Arg

                    165                 170                 175

    Lys Ala Tyr Gly Glu Ala Cys Ser Gly Ile Arg Cys Gln Arg His Leu

                180                 185                 190

    Cys Leu Ala Gln Leu Arg Ser Phe Phe Glu Lys Ala Ala Glu Ser His

            195                 200                 205

    Ala Gln Gly Leu Leu Leu Cys Pro Cys Ala Pro Glu Asp Ala Gly Cys

        210                 215                 220

    Gly Glu Arg Arg Arg Asn Thr Ile Ala Pro Ser Cys Ala Leu Pro Ser

    225                 230                 235                 240

    Val Thr Pro Asn Cys Leu Asp Leu Arg Ser Phe Cys Arg Ala Asp Pro

                    245                 250                 255

    Leu Cys Arg Ser Arg Leu Met Asp Phe Gln Thr His Cys His Pro Met

                260                 265                 270

    Asp Ile Leu Gly Thr Cys Ala Thr Glu Gln Ser Arg Cys Leu Arg Ala

            275                 280                 285

    Tyr Leu Gly Leu Ile Gly Thr Ala Met Thr Pro Asn Phe Ile Ser Lys

        290                 295                 300

    Val Asn Thr Thr Val Ala Leu Ser Cys Thr Cys Arg Gly Ser Gly Asn

    305                 310                 315                 320

    Leu Gln Asp Glu Cys Glu Gln Leu Glu Arg Ser Phe Ser Gln Asn Pro

                    325                 330                 335

    Cys Leu Val Glu Ala Ile Ala Ala Lys Met Arg Phe His Arg Gln Leu

                340                 345                 350

    Phe Ser Gln Asp Trp Ala Asp Ser Thr Phe Ser Val Val Gln Gln Gln

            355                 360                 365

    Asn Ser Asn Pro Ala Leu Arg Leu Gln Pro Arg Leu Pro Ile Leu Ser

        370                 375                 380

    Phe Ser Ile Leu Pro Leu Ile Leu Leu Gln Thr Leu Trp

    385                 390                 395

    (2)关于SEQ ID NO:18的信息

        (i)序列特征

            (A)长度:1271个碱基对

            (B)类型:核酸

            (C)链型:单链

            (D)拓扑结构:线型

        (ii)分子类型:cDNA”

        (ix)特征:

            (A)名称/关键:CDS

            (B)位置:2..946

        (xi)序列描述:SEQ ID NO:18:

          C GGC TAC TGT GAA ACA CCT CAA CTC AGG AAC AGC TCT CTG ATA GGC

    46

            Gly Tyr Cys Glu Thr Pro Gln Leu Arg Asn Ser Ser Leu Ile Gly

                    400                 405                 410

          TGC ATG TGC CAC CGG CGC ATG AAG AAC CAG GTT GCC TGC TTG GAC ATC

    94

          Cys Met Cys His Arg Arg Met Lys Asn Gln Val Ala Cys Leu Asp Ile

                  415                 420                 425

          TAT TGG ACC GTT CAC CGT GCC CGC AGC CTT GGT AAC TAT GAG CTG GAT

    142

          Tyr Trp Thr Val His Arg Ala Arg Ser Leu Gly Asn Tyr Glu Leu Asp

              430                 435                 440

          GTC TCC CCC TAT GAA GAC ACA GTG ACC AGC AAA CCC TGG AAA ATG AAT

    190

          Val Ser Pro Tyr Glu Asp Thr Val Thr Ser Lys Pro Trp Lys Met Asn

          445                 450                 455                 460

          CTC AGC AAA CTG AAC ATG CTC AAA CCA GAC TCA GAC CTC TGC CTC AAG

    238

          Leu Ser Lys Leu Asn Met Leu Lys Pro Asp Ser Asp Leu Cys Leu Lys

                          465                 470                 475

          TTT GCC ATG CTG TGT ACT CTC AAT GAC AAG TGT GAC CGG CTG CGC AAG

    286

          Phe Ala Met Leu Cys Thr Leu Asn Asp Lys Cys Asp Arg Leu Arg Lys

                      480                 485                 490

          GCC TAC GGG GAG GCG TGC TCC GGG CCC CAC TGC CAG CGC CAC GTC TGC

    334

          Ala Tyr Gly Glu Ala Cys Ser Gly Pro His Cys Gln Arg His Val Cys

                  495                 500                 505

          CTC AGG CAG CTG CTC ACT TTC TTC GAG AAG GCC GCC GAG CCC CAC GCG

    382

          Leu Arg Gln Leu Leu Thr Phe Phe Glu Lys Ala Ala Glu Pro His Ala

              510                 515                 520

          CAG GGC CTG CTA CTG TGC CCA TGT GCC CCC AAC GAC CGG GGC TGC GGG

    430

          Gln Gly Leu Leu Leu Cys Pro Cys Ala Pro Asn Asp Arg Gly Cys Gly

          525                 530                 535                 540

          GAG CGC CGG CGC AAC ACC ATC GCC CCC AAC TGC GCG CTG CCG CCT GTG

    478

          Glu Arg Arg Arg Asn Thr Ile Ala Pro Asn Cys Ala Leu Pro Pro Val

                          545                 550                 555

          GCC CCC AAC TGC CTG GAG CTG CGG CGC CTC TGC TTC TCC GAC CCG CTT

    526

          Ala Pro Asn Cys Leu Glu Leu Arg Arg Leu Cys Phe Ser Asp Pro Leu

                      560                 565                 570

          TGC AGA TCA CGC CTG GTG GAT TTC CAG ACC CAC TGC CAT CCC ATG GAC

    574

          Cys Arg Ser Arg Leu Val Asp Phe Gln Thr His Cys His Pro Met Asp

                  575                 580                 585

          ATC CTA GGA ACT TGT GCA ACA GAG CAG TCC AGA TGT CTA CGA GCA TAC

    622

          Ile Leu Gly Thr Cys Ala Thr Glu Gln Ser Arg Cys Leu Arg Ala Tyr

              590                 595                 600

          CTG GGG CTG ATT GGG ACT GCC ATG ACC CCC AAC TTT GTC AGC AAT GTC

    670

          Leu Gly Leu Ile Gly Thr Ala Met Thr Pro Asn Phe Val Ser Asn Val

          605                 610                 615                 620

          AAC ACC AGT GTT GCC TTA AGC TGC ACC TGC CGA GGC AGT GGC AAC CTG

    718

          Asn Thr Ser Val Ala Leu Ser Cys Thr Cys Arg Gly Ser Gly Asn Leu

                          625                 630                 635

          CAG GAG GAG TGT GAA ATG CTG GAA GGG TTC TTC TCC CAC AAC CCC TGC

    766

          Gln Glu Glu Cys Glu Met Leu Glu Gly Phe Phe Ser His Asn Pro Cys

                      640                 645                 650

          CTC ACG GAG GCC ATT GCA GCT AAG ATG CGT TTT CAC AGC CAA CTC TTC

    814

          Leu Thr Glu Ala Ile Ala Ala Lys Met Arg Phe His Ser Gln Leu Phe

                  655                 660                 665

          TCC CAG GAC TGG CCA CAC CCT ACC TTT GCT GTG ATG GCA CAC CAG AAT

    862

          Ser Gln Asp Trp Pro His Pro Thr Phe Ala Val Met Ala His Gln Asn

              670                 675                 680

          GAA AAC CCT GCT GTG AGG CCA CAG CCC TGG GTG CCC TCT CTT TTC TCC

    910

          Glu Asn Pro Ala Val Arg Pro Gln Pro Trp Val Pro Ser Leu Phe Ser

          685                 690                 695                 700

          TGC ACG CTT CCC TTG ATT CTG CTC CTG AGC CTA TGG TAGCTGGACT

    956

          Cys Thr Leu Pro Leu Ile Leu Leu Leu Ser Leu Trp

                          705                 710

          TCCCCAGGGC CCTCTTCCCC TCCACCACAC CCAGGTGGAC TTGCAGCCCA CAAGGGGTGA

    1016

          GGAAAGGACA GCAGCAGGAA GGAGGTGCAG TGCGCAGATG AGGGCACAGG AGAAGCTAAG

    1076

          GGTTATGACC TCCAGATCCT TACTGGTCCA GTCCTCATTC CCTCCACCCC ATCTCCACTT

    1136

          CTGATTCATG CTGCCCCTCC TTGGTGGCCA CAATTTAGCC ATGTCATCTG GTGCCTGTGG

    1196

          GCCTTGCTTT ATTCCTATTA TTGTCCTAAA GTCTCTCTGG GCTCTTGGAT CATGATTAAA

    1256

          CCTTTGACTT AAAAA

    1271

    (2)关于SEQ ID NO:19的信息

        (i)序列特征

            (A)长度:315个氨基酸

            (B)类型:氨基酸

            (D)拓扑结构:线型

        (ii)分子类型:蛋白质

        (xi)序列描述:SEQ ID NO:19:

    Gly Tyr Cys Glu Thr Pro Gln Leu Arg Asn Ser Ser Leu Ile Gly Cys

      1               5                  10                  15

    Met Cys His Arg Arg Met Lys Asn Gln Val Ala Cys Leu Asp Ile Tyr

                 20                  25                  30

    Trp Thr Val His Arg Ala Arg Ser Leu Gly Asn Tyr Glu Leu Asp Val

             35                  40                  45

    Ser Pro Tyr Glu Asp Thr Val Thr Ser Lys Pro Trp Lys Met Asn Leu

         50                  55                  60

    Ser Lys Leu Asn Met Leu Lys Pro Asp Ser Asp Leu Cys Leu Lys Phe

     65                  70                  75                  80

    Ala Met Leu Cys Thr Leu Asn Asp Lys Cys Asp Arg Leu Arg Lys Ala

                     85                  90                  95

    Tyr Gly Glu Ala Cys Ser Gly Pro His Cys Gln Arg His Val Cys Leu

                100                 105                 110

    Arg Gln Leu Leu Thr Phe Phe Glu Lys Ala Ala Glu Pro His Ala Gln

            115                 120                 125

    Gly Leu Leu Leu Cys Pro Cys Ala Pro Asn Asp Arg Gly Cys Gly Glu

        130                 135                 140

    Arg Arg Arg Asn Thr Ile Ala Pro Asn Cys Ala Leu Pro Pro Val Ala

    145                 150                 155                 160

    Pro Asn Cys Leu Glu Leu Arg Arg Leu Cys Phe Ser Asp Pro Leu Cys

                    165                 170                 175

    Arg Ser Arg Leu Val Asp Phe Gln Thr His Cys His Pro Met Asp Ile

                180                 185                 190

    Leu Gly Thr Cys Ala Thr Glu Gln Ser Arg Cys Leu Arg Ala Tyr Leu

            195                 200                 205

    Gly Leu Ile Gly Thr Ala Met Thr Pro Asn Phe Val Ser Asn Val Asn

        210                 215                 220

    Thr Ser Val Ala Leu Ser Cys Thr Cys Arg Gly Ser Gly Asn Leu Gln

    225                 230                 235                 240

    Glu Glu Cys Glu Met Leu Glu Gly Phe Phe Ser His Asn Pro Cys Leu

                    245                 250                 255

    Thr Glu Ala Ile Ala Ala Lys Met Arg Phe His Ser Gln Leu Phe Ser

                260                 265                 270

    Gln Asp Trp Pro His Pro Thr Phe Ala Val Met Ala His Gln Asn Glu

            275                 280                 285

    Asn Pro Ala Val Arg Pro Gln Pro Trp Val Pro Ser Leu Phe Ser Cys

        290                 295                 300

    Thr Leu Pro Leu Ile Leu Leu Leu Ser Leu Trp

    305                 310                 315

    (2)关于SEQ ID NO:20的信息

        (i)序列特征

            (A)长度:1699个碱基对

            (B)类型:核酸

            (C)链型:单链

            (D)拓扑结构:线型

        (ii)分子类型:cDNA

        (ix)特征:

            (A)名称/关键:CDS

            (B)位置:175..1374

        (xi)序列描述:SEQ ID NO:20:

          TGTGGACGCG CGCTTCGGAG TTGGAGGGCG GCGCCCAGGA CCCTGGTGGG AGAGTGTGTG

    60

          CGTCGCGCTG GAGGGCGGGA GGCGGGGGCG GGAGGTGCCG GTCGAGGGAG CCCCGCTCTC

    120

          AGAGCTCCAG GGGAGGAGCG AGGGGAGCGC GGAGCCCGGC GCCTACAGCT CGCC ATG

    177

                                                                      Met

          GTG CGC CCC CTG AAC CCG CGA CCG CTG CCG CCC GTA GTC CTG ATG TTG

    225

          Val Arg Pro Leu Asn Pro Arg Pro Leu Pro Pro Val Val Leu Met Leu

                      320                 325                 330

          CTG CTG CTG CTG CCG CCG TCG CCG CTG CCT CTC GCA GCC GGA GAC CCC

    273

          Leu Leu Leu Leu Pro Pro Ser Pro Leu Pro Leu Ala Ala Gly Asp Pro

                  335                 340                 345

          CTT CCC ACA GAA AGC CGA CTC ATG AAC AGC TGT CTC CAG GCC AGG AGG

    321

          Leu Pro Thr Glu Ser Arg Leu Met Asn Ser Cys Leu Gln Ala Arg Arg

              350                 355                 360

          AAG TGC CAG GCT GAT CCC ACC TGC AGT GCT GCC TAC CAC CAC CTG GAT

    369

          Lys Cys Gln Ala Asp Pro Thr Cys Ser Ala Ala Tyr His His Leu Asp

          365                 370                 375                 380

          TCC TGC ACC TCT AGC ATA AGC ACC CCA CTG CCC TCA GAG GAG CCT TCG

    417

          Ser Cys Thr Ser Ser Ile Ser Thr Pro Leu Pro Ser Glu Glu Pro Ser

                          385                 390                 395

          GTC CCT GCT GAC TGC CTG GAG GCA GCA CAG CAA CTC AGG AAC AGC TCT

    465

          Val Pro Ala Asp Cys Leu Glu Ala Ala Gln Gln Leu Arg Asn Ser Ser

                      400                 405                 410

          CTG ATA GGC TGC ATG TGC CAC CGG CGC ATG AAG AAC CAG GTT GCC TGC

    513

          Leu Ile Gly Cys Met Cys His Arg Arg Met Lys Asn Gln Val Ala Cys

                  415                 420                 425

          TTG GAC ATC TAT TGG ACC GTT CAC CGT GCC CGC AGC CTT GGT AAC TAT

    561

          Leu Asp Ile Tyr Trp Thr Val His Arg Ala Arg Ser Leu Gly Asn Tyr

              430                 435                 440

          GAG CTG GAT GTC TCC CCC TAT GAA GAC ACA GTG ACC AGC AAA CCC TGG

    609

          Glu Leu Asp Val Ser Pro Tyr Glu Asp Thr Val Thr Ser Lys Pro Trp

          445                 450                 455                 460

          AAA ATG AAT CTC AGC AAA CTG AAC ATG CTC AAA CCA GAC TCA GAC CTC

    657

          Lys Met Asn Leu Ser Lys Leu Asn Met Leu Lys Pro Asp Ser Asp Leu

                          465                 470                 475

          TGC CTC AAG TTT GCC ATG CTG TGT ACT CTC AAT GAC AAG TGT GAC CGG

    705

          Cys Leu Lys Phe Ala Met Leu Cys Thr Leu Asn Asp Lys Cys Asp Arg

                      480                 485                 490

          CTG CGC AAG GCC TAC GGG GAG GCG TGC TCC GGG CCC CAC TGC CAG CGC

    753

          Leu Arg Lys Ala Tyr Gly Glu Ala Cys Ser Gly Pro His Cys Gln Arg

                  495                 500                 505

          CAC GTC TGC CTC AGG CAG CTG CTC ACT TTC TTC GAG AAG GCC GCC GAG

    801

          His Val Cys Leu Arg Gln Leu Leu Thr Phe Phe Glu Lys Ala Ala Glu

              510                 515                 520

          CCC CAC GCG CAG GGC CTG CTA CTG TGC CCA TGT GCC CCC AAC GAC CGG

    849

          Pro His Ala Gln Gly Leu Leu Leu Cys Pro Cys Ala Pro Asn Asp Arg

          525                 530                 535                 540

          GGC TGC GGG GAG CGC CCG CGC AAC ACC ATC GCC CCC AAC TGC GCG CTG

    897

          Gly Cys Gly Glu Arg Arg Arg Asn Thr Ile Ala Pro Asn Cys Ala Leu

                          545                 550                 555

          CCG CCT GTG GCC CCC AAC TGC CTG GAG CTG CGG CGC CTC TGC TTC TCC

    945

          Pro Pro Val Ala Pro Asn Cys Leu Glu Leu Arg Arg Leu Cys Phe Ser

                      560                 565                 570

          GAC CCG CTT TGC AGA TCA CGC CTG GTG GAT TTC CAG ACC CAC TGC CAT

    993

          Asp Pro Leu Cys Arg Ser Arg Leu Val Asp Phe Gln Thr His Cys His

                  575                 580                 585

          CCC ATG GAC ATC CTA GGA ACT TGT GCA ACA GAG CAG TCC AGA TGT CTA

    1041

          Pro Met Asp Ile Leu Gly Thr Cys Ala Thr Glu Gln Ser Arg Cys Leu

              590                 595                 600

          CGA GCA TAC CTG GGG CTG ATT GGG ACT GCC ATG ACC CCC AAC TTT GTC

    1089

          Arg Ala Tyr Leu Gly Leu Ile Gly Thr Ala Met Thr Pro Asn Phe Val

          605                 610                 615                 620

          AGC AAT GTC AAC ACC AGT GTT GCC TTA AGC TGC ACC TGC CGA GGC AGT

    1137

          Ser Asn Val Asn Thr Ser Val Ala Leu Ser Cys Thr Cys Arg Gly Ser

                          625                 630                 635

          GGC AAC CTG CAG GAG GAG TGT GAA ATG CTG GAA GGG TTC TTC TCC CAC

    1185

          Gly Asn Leu Gln Glu Glu Cys Glu Met Leu Glu Gly Phe Phe Ser His

                      640                 645                 650

          AAC CCC TGC CTC ACG GAG GCC ATT GCA GCT AAG ATG CGT TTT CAC AGC

    1233

          Asn Pro Cys Leu Thr Glu Ala Ile Ala Ala Lys Met Arg Phe His Ser

                  655                 660                 665

          CAA CTC TTC TCC CAG GAC TGG CCA CAC CCT ACC TTT GCT GTG ATG GCA

    1281

          Gln Leu Phe Ser Gln Asp Trp Pro His Pro Thr Phe Ala Val Met Ala

              670                 675                 680

          CAC CAG AAT GAA AAC CCT GCT GTG AGG CCA CAG CCC TGG GTG CCC TCT

    1329

          His Gln Asn Glu Asn Pro Ala Val Arg Pro Gln Pro Trp Val Pro Ser

          685                 690                 695                 700

          CTT TTC TCC TGC ACG CTT CCC TTG ATT CTG CTC CTG AGC CTA TGG

    1374

          Leu Phe Ser Cys Thr Leu Pro Leu Ile Leu Leu Leu Ser Leu Trp

                          705                 710                 715

          TAGCTGGACT TCCCCAGGGC CCTCTTCCCC TCCACCACAC CCAGGTGGAC TTGCAGCCCA

    1434

          CAAGGGGTGA GGAAAGGACA GCAGCAGGAA GGAGGTGCAG TGCGCAGATG AGGGCACAGG

    1494

          AGAAGCTAAG GGTTATGACC TCCAGATCCT TACTGGTCCA GTCCTCATTC CCTCCACCCC

    1554

          ATCTCCACTT CTGATTCATG CTGCCCCTCC TTGGTGGCCA CAATTTAGCC ATGTCATCTG

    1614

          GTGCCTGTGG GCCTTGCTTT ATTCCTATTA TTGTCCTAAA GTCTCTCTGG GCTCTTGGAT

    1674

          CATGATTAAA CCTTTGACTT AAAAA

    1699

    (2)关于SEQ ID NO:21的信息

        (i)序列特征

            (A)长度:400个氨基酸

            (B)类型:氨基酸

            (D)拓扑结构:线型

        (ii)分子类型:蛋白质

        (xi)序列描述:SEQ ID NO:21:

    Met Val Arg Pro Leu Asn Pro Arg Pro Leu Pro Pro Val Val Leu Met

      1               5                  10                  15

    Leu Leu Leu Leu Leu Pro Pro Ser Pro Leu Pro Leu Ala Ala Gly Asp

                 20                  25                  30

    Pro Leu Pro Thr Glu Ser Arg Leu Met Asn Ser Cys Leu Gln Ala Arg

             35                  40                  45

    Arg Lys Cys Gln Ala Asp Pro Thr Cys Ser Ala Ala Tyr His His Leu

         50                  55                  60

    Asp Ser Cys Thr Ser Ser Ile Ser Thr Pro Leu Pro Ser Glu Glu Pro

     65                  70                  75                  80

    Ser Val Pro Ala Asp Cys Leu Glu Ala Ala Gln Gln Leu Arg Asn Ser

                     85                  90                  95

    Ser Leu Ile Gly Cys Met Cys His Arg Arg Met Lys Asn Gln Val Ala

                100                 105                 110

    Cys Leu Asp Ile Tyr Trp Thr Val His Arg Ala Arg Ser Leu Gly Asn

            115                 120                 125

    Tyr Glu Leu Asp Val Ser Pro Tyr Glu Asp Thr Val Thr Ser Lys Pro

        130                 135                 140

    Trp Lys Met Asn Leu Ser Lys Leu Asn Met Leu Lys Pro Asp Ser Asp

    145                 150                 155                 160

    Leu Cys Leu Lys Phe Ala Met Leu Cys Thr Leu Asn Asp Lys Cys Asp

                    165                 170                 175

    Arg Leu Arg Lys Ala Tyr Gly Glu Ala Cys Ser Gly Pro His Cys Gln

                180                 185                 190

    Arg His Val Cys Leu Arg Gln Leu Leu Thr Phe Phe Glu Lys Ala Ala

            195                 200                 205

    Glu Pro His Ala Gln Gly Leu Leu Leu Cys Pro Cys Ala Pro Asn Asp

        210                 215                 220

    Arg Gly Cys Gly Glu Arg Arg Arg Asn Thr Ile Ala Pro Asn Cys Ala

    225                 230                 235                 240

    Leu Pro Pro Val Ala Pro Asn Cys Leu Glu Leu Arg Arg Leu Cys Phe

                    245                 250                 255

    Ser Asp Pro Leu Cys Arg Ser Arg Leu Val Asp Phe Gln Thr His Cys

                260                 265                 270

    His Pro Met Asp Ile Leu Gly Thr Cys Ala Thr Glu Gln Ser Arg Cys

            275                 280                 285

    Leu Arg Ala Tyr Leu Gly Leu Ile Gly Thr Ala Met Thr Pro Asn Phe

        290                 295                 300

    Val Ser Asn Val Asn Thr Ser Val Ala Leu Ser Cys Thr Cys Arg Gly

    305                 310                 315                 320

    Ser Gly Asn Leu Gln Glu Glu Cys Glu Met Leu Glu Gly Phe Phe Ser

                    325                 330                 335

    His Asn Pro Cys Leu Thr Glu Ala Ile Ala Ala Lys Met Arg Phe His

                340                 345                 350

    Ser Gln Leu Phe Ser Gln Asp Trp Pro His Pro Thr Phe Ala Val Met

            355                 360                 365

    Ala His Gln Asn Glu Asn Pro Ala Val Arg Pro Gln Pro Trp Val Pro

        370                 375                 380

    Ser Leu Phe Ser Cys Thr Leu Pro Leu Ile Leu Leu Leu Ser Leu Trp

    385                 390                 395                 400

刺激神经和肾生长的RET配体(RETL).pdf_第1页
第1页 / 共105页
刺激神经和肾生长的RET配体(RETL).pdf_第2页
第2页 / 共105页
刺激神经和肾生长的RET配体(RETL).pdf_第3页
第3页 / 共105页
点击查看更多>>
资源描述

《刺激神经和肾生长的RET配体(RETL).pdf》由会员分享,可在线阅读,更多相关《刺激神经和肾生长的RET配体(RETL).pdf(105页珍藏版)》请在专利查询网上搜索。

本发明涉及编码Ret配体(RetL9)的核苷酸序列以及通过用RetLDNA或蛋白处理细胞和哺乳动物受治疗者以刺激神经和肾的生长的方法。本发明提供了分离纯化的编码RetL的DNA分子,含有任何RetL的核苷酸序列,特别包括鼠retL1 cDNA(SEQ ID NO:1),人部分RetL1cDNA(SEQ ID NO:8),人全长retL1 cDNA(SEQ ID NO:10),人retL2cDNA(。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 化学;冶金 > 生物化学;啤酒;烈性酒;果汁酒;醋;微生物学;酶学;突变或遗传工程


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1