新的应激蛋白.pdf

摘要
申请专利号：	CN96123831.3	申请日：	1996.12.20
公开号：	CN1158896A	公开日：	1997.09.10
当前法律状态：	撤回	有效性：	无权
法律详情：	发明专利申请公布后的视为撤回\|\|\|\|\|\|公开
IPC分类号：	C12N15/12	主分类号：	C12N15/12
申请人：	株式会社HSP研究所;
发明人：	池田纯; 金田澄子; 柳秀树; 松本昌康; 由良隆
地址：	日本大阪府
优先权：	1995.12.20 JP 349661/95; 1996.07.23 JP 213181/96
专利代理机构：	中国专利代理(香港)有限公司	代理人：	姜建成
PDF下载：	PDF下载

内容摘要

通过在低氧状态下诱导即可得到的多肽，其具有的序列包含：(a)SEQ ID NO：1或3的氨基酸序列或其片段；(b)由SEQ ID NO：2或4的核苷酸序列编码的氨基酸序列或其片段；或(c)由SEQ ID NO：1或3的氨基酸序列中缺失、加入、插入或取代一个或多个氨基酸所得的氨基酸序列；对于通过生物工程技术生产上述多肽有用的编码上述多肽的多核苷酸或其片段；与上述多肽特异性结合的抗体或其片段。

权利要求书

1：通过在低氧状态下诱导即可得到的多肽，其具有的序列包含： (a)SEQ ID NO：1或3的氨基酸序列或其片段； (b)由SEQ ID NO：2或4的核苷酸序列编码的氨基酸序列或其片段；或 (c)由SEQ ID NO：1或3的氨基酸序列中缺失、加入、插入或取代一个或多个氨基酸所得的氨基酸序列。
2：含有权利要求1的多肽的多肽。
3：编码权利要求1多肽的多核苷酸。
4：具有SEQ ID NO：2或4的核苷酸序列的多核苷酸或其片段。
5：能与权利要求3或4的多核苷酸杂交并编码通过在低氧状态下诱导可得到之多肽的多核苷酸。
6：具有SEQ ID NO：12之核苷酸序列的多核苷酸或其片段。
7：权利要求6的多核苷酸，其中所说的多核苷酸具有启动子活性。
8：能与权利要求7的多核苷酸杂交并具有启动子活性的多核苷酸。
9：含有权利要求3至8中任一项之核苷酸序列的重组DNA。
10：含有权利要求9的重组DNA的表达载体。
11：与权利要求1或2之多肽特异性结合的抗体或其片段。

说明书

新的应激蛋白
    本发明涉及氧-调节蛋白150(ORP150)。具体地说，本发明涉及人ORP150的氨基酸序列、编码人ORP150的多核苷酸、人ORP150基因的启动子以及特异于人ORP150的抗体。

    自从脑缺血损伤中70KDa热激蛋白(HSP70)的表达被首次报道以来，以HSP70为代表的多种应激蛋白已被报道在心肌缺血和动脉粥样硬化损伤以及脑缺血损伤中有所表达。在缺血损伤中发现了HSP的诱导，即针对热应激的防御机制，这一事实暗示机体对缺血性低氧的应激反应是涉及蛋白质再生的主动现象。至于经培养的细胞，可导致体内缺血症的应激状态如低血糖和缺氧显示出可诱导一组非-HSP应激蛋白，如葡萄糖-调节蛋白(GRP)和氧-调节蛋白(ORP)。

    因此期望ORP可在诊断和治疗缺血性疾病中起作用。

    Hori等人最近报道将经培养的大鼠星形细胞暴露于低氧环境可诱导150、94、78、33和28KDa蛋白[J.Neurochem.、66。973-979(1996)]。将除150KDa蛋白以外地这些蛋白质分别鉴定为GRP94、GRP78、血加氧酶1和HSP28，而150KDa蛋白(大鼠ORP150)仍未被鉴定。另外，人ORP150蛋白仍未见有报道。

    因此，本发明的目的是提供人和大鼠的ORP150蛋白及其氨基酸序列以及编码所述蛋白质的核苷酸序列。

    本发明的另一目的是提供可用作人ORP150基因启动子的核苷酸序列。

    本发明的另一目的是提供抗人ORP150蛋白的抗体或其片段，它们可用于诊断和治疗缺血性疾病。

    在一个实施方案中，本发明涉及一种通过在低氧状况下诱导即可得到的多肽，其序列包含：

    (a)SEQ ID NO：1或3的氨基酸序列或其片段；

    (b)由SEQ ID NO：2或4的核苷酸序列编码的氨基酸序列或其片段；或

    (c)通过在SEQ ID NO：1或3的氨基酸序列中缺失、增加、插入或取代一个或多个氨基酸得到的氨基酸序列。

    在另一个实施方案中，本发明涉及编码上述实施方案之多肽的多核苷酸。

    在另一个实施方案中，本发明涉及能与上述多核苷酸或其片段杂交并具有启动子活性的多核苷酸。

    在另一个实施方案中，本发明涉及含有本发明之核苷酸序列的重组DNA。

    在另一个实施方案中，本发明涉及含有本发明之重组DNA的表达载体。

    在另一个实施方案中，本发明涉及与本发明之多肽特异性结合的抗体或其片段。

    图1表示人ORP基因外显子-内含子结构图，黑方块表示外显子。

    图2表示将人星形细胞瘤U373细胞暴露于多种类型的应激条件下之后，从中提取的ORP150 mRNA的Northern印迹的分析结果。

    图3表示成人组织的ORP150 mRNA的Northern印迹分析结果。

    本发明多肽的一个实施方案是含有序列表中SEQ ID NO：1所示氨基酸序列的多肽，该多肽构成了通过在低氧状态下诱导即可得到的人氧-调节蛋白ORP150。本发明多肽的另一个实施方案是含有序列表中SEQID NO：3所示氨基酸序列的多肽，该多肽组成了通过在低氧状态下诱导即可得到的大鼠氧-调节蛋白ORP150。本发明的多肽还包括各含有上述多肽之一部分的多肽，以及含有全部或部分上述多肽的多肽。众所周知突变会自然发生；ORP150蛋白的一些氨基酸可被替换或缺失，而其他氨基酸可被加入或插入。突变也可通过基因工程技术来诱导，因此应理解由这种一个或多个氨基酸残基的突变得到的基本上同源的多肽也包括在本发明的范围之内，只要它们通过在低氧状态下的诱导是可以得到的话。

    本发明多核苷酸的一个实施方案是编码上述多肽中任一个的多核苷酸。具体地说，所说多核苷酸的例子是含有序列表中SEQ ID NO：2所示核苷酸序列的多核苷酸，即，人ORP150 cDNA。含有序列表中SEQID NO：4所示核苷酸序列的多核苷酸也包括在本发明范围之内，此多核苷酸是大鼠ORP150 cDNA。含有这些多核苷酸的一部分的多核苷酸，以及含有这些多核苷酸之全部或部分的多核苷酸也包括在本发明的范围之内。如上文所提及，通过突变ORP150基因的一些碱基可以被替换、缺失、加入或插入，所得的具有部分不同之核苷酸序列的多核苷酸也包括在本发明的范围之内，只要它们是基本上同源的，并编码通过在低氧状态下诱导即可得到的多肽。

    本发明多核苷酸的另一个实施方案是包含或含有序列表中SEQ IDNO：12所示核苷酸序列的全部或部分的多核苷酸，它是含有人ORP150基因启动子区的多核苷酸。能与此多核苷酸在常规杂交条件(如在含有0.1％SDS的0.1×SSC中，65℃)下杂交并具有启动子活性的多核苷酸也包括在本发明的范围之内。所说启动子区的成功克隆会显著推动人ORP150基因的功能性分析，并促进其用于治疗缺血性疾病。

    本文所用术语“启动子”的定义为：含通过位于所需基因的上游或下游来激活或抑制所说基因转录的核苷酸序列的多核苷酸。

    本文所用术语“重组DNA”的定义为：含有上述多核苷酸的任何DNA。

    本文所用术语“表达载体”的定义为：含有本发明的重组DNA并通过导入适当宿主表达所需蛋白质的任何载体。

    本文所用术语“克隆”不仅仅指其中已导入所感兴趣的多核苷酸的细胞，也指所感兴趣的多核苷酸本身。

    本文所用术语“在低氧状态下诱导”是指通过将细胞暴露于氧-耗尽的大气中来增加蛋白质的合成。

    本发明的氨基酸序列和核苷酸序列例如可按下述方法被确定：首先，从暴露于低氧状态下的大鼠星形细胞中制备poly(A)+RNA，使用随机的六聚体引物由所说的poly(A)+RNA合成cDNA之后，使用pSPORT1载体(由Life Technology制备)或类似物制备cDNA文库。

    接着，使用根据上文用于制备cDNA文库的pSPORT1载体的核苷酸序列合成的寡核苷酸引物以及由纯化的大鼠ORP150的N-末端氨基酸序列推导出的简并核苷酸序列进行PCR，从而产生大量扩增的DNA片段。然后将这些DNA片段插入到PT7 Blue载体(由Novagen生产)或类似载体中用于克隆以得到其所具有的核苷酸序列可精确编码N-末端氨基酸序列的克隆。通过使用常规的蛋白质纯化法，如柱层析和电泳法及适当将其联合使用即可纯化ORP150。

    另外，通过使用上述克隆中的插入片段为探针进行集落杂交以筛选上述大鼠星形细胞cDNA文库，即可得到其所具有的插入片段据认为可编码大鼠ORP150的克隆。从此克隆的5’和3’末端使其分段缺失，使用从已测定的核苷酸序列制备的寡核苷酸引物来按序测定核苷酸序列。如果由此得到的克隆不编码大鼠全长ORP150，则可以插入片段5’或3’区域的核苷酸序列为基础合成寡核苷酸探针，然后筛选含有在5’或3’方向进一步延伸之核苷酸序列的克隆，例如可使用基于使用磁性小珠之杂交的GeneTrapper cDNA Positive SelectionSystem试剂盒(由Life Technology制备)。由此可得到大鼠ORP150基因的全长cDNA。

    单独进行下列步骤以得到大鼠ORP150 cDNA的人相应物。由暴露于低氧状态下的人星形细胞瘤U373制备Poly(A)+RNA，使用随机六聚体引物和一种寡(dT)引物由所说的Poly(A)+RNA合成了cDNA之后，将所说的cDNA插入pSPORT1载体的EcoRI位点以制备cDNA文库，然后使用Gene Trapper试剂盒得到人ORP150 cDNA，按与上述大鼠ORP150相同的方法测定其核苷酸序列。

    由此测定的人ORP150 cDNA的核苷酸序列示于序列表中的SEQ ID NO：2，根据此序列可测定人ORP150的氨基酸序列。

    使用例如Ogawa等人的方法[Ogawa、S.、Gerlach、H.、Esposito、C.、Mucaulay、A.P.、Brett、J.、and Stern、D.、J.Clin.Invest.、85、1090-1098(1990)]可将星形细胞暴露于低氧状态下。

    接着进行下列步骤以得到人ORP150基因组的DNA。使用购自Clontech的基因组文库(得自人体胎盘、Cat.#HL1067J])。通过使用得自大鼠cDNA克隆的由5′非翻译区的202bp和编码区的369bp组成的DNA片段以及得自人cDNA的含有终止密码子的1351bp DNA片段为探针的杂交进行筛选。分离含有ORP150基因的两个克隆，一个含有外显子1至24，另一个含有外显子16至26；完整的ORP150基因由这两个克隆联合组成。测定15851bP的人ORP150基因组DNA的核苷酸序列；从其5′末端至外显子2中的翻译起始密码子ATG之前的核苷酸序列示于序列表中的SEQ ID NO：12。

    如上文所提及，本发明包括含有全部或部分具有序列表中SEQ IDNO：1所示氨基酸序列之多肽(人ORP150)的多肽。本发明还包括具有序列表中SEQ ID NO：1所示氨基酸序列之多肽的全部或部分；例如，含有序列表中SEQ ID NO：2所示核苷酸序列的全部或部分的多核苷酸也包括在本发明的范围内。本发明还包括抗本发明这些多肽的特异性抗体及其片段。本发明的多肽、编码它们的多核苷酸、抗这些多肽的特异性抗体或其片段在诊断和治疗缺血性疾病中有用，可用于开发缺血性疾病的治疗药物。

    使用常规方法[Current Protocols inImmunology、Coligan、J.E.et al.eds.、2.4.1.-2.4.7、John Wiley & Sons.NewYork(1991)]可制备抗本发明多肽的抗体，所述多肽含有人或大鼠ORP150的全部或部分。具体地说，切下通过例如SDS-聚丙烯酰胺凝胶电泳分离的大鼠ORP150带，并施予家兔等用于免疫接种，然后从经免疫接种的动物中收集血液以得到抗血清。如有必要可通过使用固定化蛋白质A的亲和层析等技术得到IgG级分。与ORP150的部分氨基酸序列相同的肽可被化学合成为多抗原肽(MAP)[Tam.J.P、Proc.Natl.Acad.Sci.USA、85、5409-5413(1988)]，并可按与上相同的方法用于免疫接种。

    也可以通过常规方法[Cell和Tissue Culture；Laboratory Procedure(Doyle、A.etal.、eds.)25A：1-25C：4.John Wiley &Sons.New York(1994)]，使用含有人或大鼠ORP150之全部或部分的多肽为抗原制备单克隆抗体。具体地说，通过将经所说抗原免疫接种的小鼠脾细胞与骨髓瘤细胞系统相融合可制备杂交瘤，所得杂交瘤经培养或腹膜内移植到小鼠体内产生单克隆抗体。

    将经纯化的这些抗体通过蛋白酶消化得到的片段也可用作本发明的抗体。

    实施例

    下述实施例阐明了本发明，但不会以任何方式限制本发明。实施例1细胞培养和低氧状态的获得

    通过修改已述的方法[Maeda、Y.、Matsumoto、M.、Ohtsuki、T.、Kuwabara、K.、Ogawa、S.、Hori、O.、Shui、D.Y.、Kinoshita、T.、Kamada、T.、and Stern、D.、J.Exp.Med.、180、2297-2308(1994)]从新生大鼠体内得到大鼠原代星形细胞和小神经胶质细胞。简而言之，摘取出生后24小时之内的新生Sprague-Dawley大鼠的脑半球，小心除去脑膜，于37℃在经Joklik修改后含有Dispase II(3mg/ml；Boehringer-Mannheim、Germany)的最低必需培养基(MEM)(Gibco，Boston MA)中消化脑组织。离心后，在添加有胎牛血清(FCs；10％；Cell Grow、MA)的MEM中重悬并培养细胞沉淀物。

    10天后，加入阿拉伯呋喃糖胞苷(10μg/ml；WakoChemicals、Osaka、Japan)经48小时以防止成纤维细胞过量生长，将培养瓶置于振荡平台上振荡。然后吸出漂浮的细胞(此为小神经胶质细胞)，通过形态学观察标准和用抗-神经胶质纤维酸性蛋白质抗体的免疫组织化学染色来鉴定附着细胞群体。用于实验的培养物是基于这些技术的＞98％的呈形细胞。

    人星形细胞瘤细胞系U373得自美国典型培养物保藏中心(ATCC)，并在添加有10％FCS的Dulbecco氏改良的Eagle培养基(由Life Technology生产)中培养。

    细胞以约5×104细胞/cm2的密度在上述培养基中铺敷，当培养物铺满时，使用一个与低氧室器(Coy Laboratory Products.Arm Arbor MI)，相连的培养箱将细胞培养物暴露于低氧状态下所述低氧室中如前所述[Ogawa、S.、Gerlach、H.、Esposito、C.、Macaulay、A.P.、Brett、J.、and Stem、D.、J.Clin.Invest.、85、1090-1098(1990)]维持有低氧张力的潮湿空气。实施例2大鼠150KDa多肽的纯化和N-末端测序

    收获在低氧状态下已暴露48小时的大鼠原代星形细胞(约5×108细胞)，用PBS(PH7.0)将细胞洗三次，用含NP-40(1％)、PMSF(1mM)、和EDTA(5mM)的PBS抽提蛋白质。然后将提取物过滤(0.45μm硝酸纤维素膜)，或者流经还原性的SDS-PAGE(7.5％，约25μg)，或者用50ml含NP-40(0.05％)和EDTA(5mM)的PBS(PH7.0)稀释2-3mg蛋白质并用于FPLC Mono Q(床体积为5ml，PharmaciaSweden)。

    用0.2M NaCl洗柱，用上行盐梯度(0.2-1.8M NaCl)洗脱，每份级分(0.5ml)的10μl和分子量标记物(Biorad)一起被用于还原性的SDS-PAGE(7.5％)。通过银染，肉眼可见凝胶中的蛋白质。合并从FPLC Mono Q上洗脱的含有150KDa多肽的级分(#7-8)，通过超滤(Amicon)浓缩50倍，将约200μg蛋白质用于制备性的还原SDS-PAGE(7.5％)。电泳后，将凝胶中的蛋白质电泳转移(2A/cm2)到聚偏二氟乙烯(PVDF)纸(Millipore、Tokyo)上，将纸干燥，用考马斯亮蓝染色，切下对应于150KDa蛋白质(OPR150)的带以使用自动化肽测序系统(Applied Biosystems、Perkin-Elmer)进行N-末端测序，从而测定了N-末端的31个氨基酸序列(SEQ IDNO：5)。实施例3大鼠星形细胞cDNA文库的制备

    通过酸胍-苯酚-氯仿法[Chomczynski、P.andSacchi.N.、Anal.Biochem.、162、156-159(1987)]由大鼠原代呈形细胞(1.1×108细胞)制备总RNA，所述细胞中ORP150已在低氧状态下被诱导。使用所得的300μg总RNA，根据使用寡(dT)-磁性珠(由PerceptiveDiagnostics制备)的Poly(A)+RNA纯化方案进行两次纯化可产生poly(A)+RNA。然后根据SuperscriptChoiceSystem(由Life Technology制备)的方案，使用随机的六聚体引物合成双链cDNA，并插入pSPORT1载体的EcoRI位点以制备由5.4×105个独立克隆组成的cDNA文库。实施例4大鼠ORP150 cDNA的克隆

    按下述克隆大鼠的ORP150 cDNA：首先，为了得到集落杂交的探针，可使cDNA文库进行PCR，所述PCR使用一个20碱基的引物5′-AATACG ACTCACTATAGGGA-3′(SEQ IDNO：6)和20碱基的混合引物5′-AARCCIGGIGTNCCNATGGA-3′(SEQ ID NO：8)，前者相当于pSPORT1载体中T7启动子区的反义链，后者含有肌苷残基和简并的多核苷酸，并以由N-末端氨基酸序列(LAVMSVDLGSESMKVAIVKPGVPMEIVLNKE)(SEQ ID NO：5)内的部分序列(KPGVPME)(SEQ ID NO：7)推导出的寡核苷酸序列为基础制备；将所得的长约为480bp的PCR产物插入pT7 Blue质粒载体。使用自动化核苷酸测序仪(由Perkin-Elmer Applied Biosystems生产)测定含有预期大小(480bp)的相当于PCR产物之插入片段的克隆的核苷酸序列，由此得到一个克隆，它含有一39核苷酸序列，所述序列编码的肽与插入片段中大鼠ORP150-特异性氨基酸序列KPGVPMEIVLNKE(SEQ ID NO：9)相同。

    使用上述克隆中的插入片段作为探针，使得自经培养的大鼠呈形细胞的RNA进行Northern印迹；结果表明长度约为4kb的mRNA是经低氧处理诱导的。随即，通过使用α-[32P]dCTP的随机引物标记法(Ready TOGO.由Pharmacia制备)标记上述克隆中的插入片段以产生探针。使用此探针，通过集落杂交筛选cDNA文库的1.2×104个克隆以得到含有一个2800bp插入片段的克隆。通过使用千序列缺失试剂盒(由Takara Shuzo生产)制备缺失突变体以测定此克隆插入片段的核苷酸序列。

    由于此克隆不含ORP150编码序列的3′区，应以上述插入片段3′末端附近特异性核苷酸序列为基础制备下列两个20碱基的寡核苷酸以得到全长序列。

    5′-GCACCCTTGAGGAAAATGCT-3′

                     (SEQ ID NO：10)

    5′-CCCAGAAGCCCAATGAGAAG-3′

                     (SEQ ID NO：11)

    使用这两个寡核苷酸，根据Gene Trapper cDNAPositive Selection System(由LifeTechnology制备)的方案从大鼠呈形细胞cDN文库中选择含有完整编码区的克隆并测定其核苷酸序列。

    由此测定的大鼠ORP150 cDNA的核苷酸序列示于序列表中的SEQ ID NO：4。根据此核苷酸序列测定的大鼠ORP150的氨基酸序列示于序列表中的SEQ ID NO：3。实施例5人U373 cDNA文库的制备

    按与实施例3中所述相同的方法，从U373细胞(1×108细胞)中纯化poly(A)′RNA，所述细胞中ORP150已在低氧状态下被诱导。然后根据Super-script Choice System(由Life Technology制备)的方案，使用随机六聚体引物和寡(dT)引物的1∶1混合物合成双链cDNA。将此cDNA插入pSPORT1载体的EcoRI位点以制备由2×105个独立克隆组成的cDNA文库。

    具体地说，按下述制备文库：按实施例3中所述Ogawa等人的方法[Ogawa、S.、Gerlach、H.、Esposito、C.、Mucaulay、A.P.、Brett、J.、and Stern、D、J.Clin.Invest.、85、1090-1098(1990)]将培养于10个塑料培养皿(直径为150mm)中的人U373细胞(1×107细胞/皿)在低氧状态下处理48小时，然后通过酸胍-苯酚-氯仿法[Chomczynski、P.and Sacchi、N.、Anal.Biochem.、162、156-159(1987)]制备总RNA。使用所得的500μg总RNA，根据使用寡(dT)磁性珠(由Perceptive Diagnostics制备)的poly(A)′RNA纯化进行两次纯化可产生poly(A)′RNA。然后根据Superscript Choice System(由LifeTechnology制备)的方案，使用5μg poly(A)′RNA和随机六聚体引物与寡(dT)引物的1∶1混合物合成双链cDNA，并插入pSPORT1载体的EcoRI位点以制备由2×105个独立克隆组成的人U373 cDNA文库。实施例6人ORP150 cDNA的克隆

    使用根据上述大鼠ORP150 cDNA特异序列制备的两个引物(SEQ ID NO：10和SEQ ID NO：11)，根据GeneTrapper DNA Positive SelectionSystem(由Life Technology制备)的方案从人U373 cDNA文库中选择含有完整编码区的克隆并测定其核苷酸序列。由此测定的人ORP150 cDNA的核苷酸序列示于序列表中的SEQID NO：2。

    具体地说，根据Gene Trapper cDNA PositiveSelection System(由Life Technology制备)的方案扩增人U373 cDNA文库的2×104个克隆。用试剂盒中包括的Gene II和Exo III核酸酶处理纯化自扩增克隆的5微克质粒以得到单链DNA。将根据上述大鼠URP150 cDNA-特异性序列制备的寡核苷酸(SEQ ID NO：10)生物素酰基化，随后于37℃与上述单链DNA杂交1小时。通过使用链霉抗生物素蛋白-磁性珠可选择性地回收与衍生自大鼠ORP150 cDNA的寡核苷酸杂交的单链DNA，使用序列表中SEQ ID NO：10所示寡核苷酸为引物，用试剂盒中包括的修复酶处理上述单链DNA，从而产生双链质粒DNA。

    然后根据Gene Trapper cDNA PositiveSelection System的方案将双链质粒DNA导入Electro Max DH10B细胞(由Life Techology制备)，再根据相同方案，使用根据大鼠ORP150 cDMA-特异性序列制备的两个引物(SEQ ID NO：10和SEQ ID NO：11)进行集落PCR以选择可产生约为550bp PCR产物的克隆。这些克隆中最长插入片段的核苷酸序列，即相当于人ORP150 cDNA被测定为序列表中的SEQ ID NO：2。

    根据此核苷酸序列测定的人ORP150的氨基酸序列示于序列表中的SEQ ID NO：1。

    用纯化的大鼠ORP150得到的N-末端氨基酸序列(SEQ IDNO：5)相当于由人和大鼠cDNA推导出的氨基酸33-63，这表明最先的32个残基代表分泌的信号肽。C-末端的KNDEL序列与KDEL序列(保留ER中存在蛋白质的信号)[Pelham、H.R.B.、TrendsBiochem.Sci.15、483-486(1990)]类似，可行使ER-保留信号功能。N-末端信号肽和C-末端ER-保留信号一样序列的存在暗示ER中的ORP150残基与Kuwabara等人报道的免疫细胞化学分析结果一致[Kuwabara、K.、Matsumoto、M.、Ikeda、J.、Hori、O.、Ogawa、S.、Maeda、Y.、Kitagawa、K.、Imuta、N.、Kinoshita、T.、Stern、D.M.、Yanagi、H.、and Kamada、T.、J.Biol.Chem.271.5025-5032(1996)]。

    用BLAST程序分析蛋白质基本数据[Altschul、S.F.、Gish、W.、Miller、W.、Myers、E.W.、andLipman、D.J.、J.Mol.、Biol.215、403-410(1990)]表明ORP150N-末端的一半与许多HSP70家族序列的ATPase区县有中等程度的相似性。以配对的方式排列以进一步分析[Pearson、W.R.、and Lipman、D.J.、Proc.Natl.Acad.Sci.WSA 85、2444-2448(1988)]揭示出人ORP150的氨基酸33-426与可诱导的人HSP70.1[Hunt、C.、and Morimoto、R.I.、Proc.Natl.Acad.Sci.WSA 82、6455-6459(1985)]和组成型的牛HSC70[Deluca-Flaherty、C.、andMckay、D.B.、Nucleic Acids Res.18、5569(1990)]的氨基酸1-380有32％相同，人HSP70.1和牛HSC70是HSP70家族典型的成员。与属于大HSP70一样蛋白质新亚族的HSP70RY和仓鼠HSP110类似的际加区域[Lee-Yoon、D.、Easton、D.、Murawski、M.、Burd、R.、and Subjeck、J.R.、J.Biol.chem。270、15725-15733(1995)]进一步延伸？残基487。用PROSITE探查蛋白质序列基元[Bairoch、A.、and Bucher、P.、Nucleic Acids Res、22、3583-3589(1994)]表明ORP150含有3个HSP70蛋白质家族特征中的2个：FYDMGSGSTVCTIV(氨基酸230-243、SEQID NO：1)和VILVGGATRVPRVQE(氨基酸380-394、SEQ ID NO：1)，它们分别与HSP70特征2和3完全匹配，以及VDLG(氨基酸38-41，SEQ ID NO：1)，它与特征1的前4个氨基酸匹配。另外，ORP150的N-末端区含有推导的ATP-结合位点，该位点由相当于Bork等人特定描述[Bork、P.、Sander、C.、and Valencia、A.、Proc.Natl.Acad.Sci.USA 89、7290-7294(1992)]的5个基元的区域(氨基酸36-53、197-214、229-243、378-400和411-425、SEQ ID NO：1)组成。尽管HSP70家族的C-末端推导的肽结合区一般较不保守[Rippmann、F.、Taylor、W.R.、Rothbard、J.B.、andGreen、N.M.、EMBO J.10、1053-1059(1991)]、侧翼为氨基酸701和898的C-末端区(SEQ ID NO：1)与HSP110共有可估计剂的相似性(氨基酸595-793，SEQID NO：1；29％相同)。实施例7人ORP150基因组DNA的克隆

    使用购自Clontech的人基因组文库(得自人胎盘，Cat.#HL1067J.Lot #1221、2.5×106个独立的克隆)。由得自大鼠cDNA克隆的202bp的5′非翻译区、369bp的编码区以及出自人cDNA的含有终止密码子的1351bp DNA片段组成的DNA片段被用作噬斑杂交的探针。

    将已经被1×106pfu人基因组文库感染的大肠杆菌LE392涂布于10个直径为15cm的培养皿中以形成噬斑。将噬菌体DNA转移到尼龙膜(Hybond-N*、Amersham)上并用氢氧化钠变性，然后通过紫外光照射来固定。使用DNA标记试剂盒(Ready To Go、Pharmacia)标记大鼠cDNA探针，并与Rapidhyb缓冲液(Amersham)中的膜杂交。于65℃保温2小时之后，用0.2×SSC-0.1％SDS洗尼龙膜，在显像底片(Fuji PhotoFilm)上检测阳性克隆。由于分离出的克隆仅含外显子1至24，可用相同方法使用人cDNA探针再次筛选相同文库的1.5×106个克隆，最终分离出1个克隆。发现此克隆含有外显子16至26，它与上述克隆的3′区有重叠。通过联合这两个克隆从而克隆出ORP150基因的完整区域。

    用BamHI裂解这两个克隆并亚克隆到pBluescript IISK(Stratagene)中，随后测定完整的15851bp的人ORP150基因组DNA的核苷酸序列，从5′末端至外显子2中翻译起始密码子ATG之前的核苷酸序列示于序列表中的SEQ ID NO：12。

    另外，将15851bp的人ORP150基因组DNA的核苷酸序列与序列表中SEQ ID NO：2所示的人ORP150 cDNA的核苷酸序理相比较，结果表明外显子在以下所示的位置处存在。外显子位置的示意图示于1中。

                       (SEQ ID：2中的碱基位置)

    外显子1   1908-2002      (1-95)

    外显子2   2855-2952      (96-193)

    外显子3   3179-3272      (194-287)

    外显子4   3451-3529      (288-366)

    外显子5   3683-3837      (367-521)

    外显子6   3962-4038      (522-598)

    外显子7   4347-4528      (599-780)

    外显子8   4786-4901      (781-896)

    外显子9   6193-6385      (897-1089)

    外显子10  6593-6727      (1090-1224)

    外显子11  6850-6932      (1225-1307)

    外显子12  7071-7203      (1308-1440)

    外显子13  7397-7584      (1441-1628)

    外显子14  7849-7987      (1629-1767)

    外显子15  9176-9236      (1768-1828)

    外显子16  9378-9457      (1829-1908)

    外显子17  9810-9995      (1909-2094)

    外显子18  10127-10299    (2095-2267)

    外显子19  10450-10537    (2268-2355)

    外显子20  10643-10765    (2356-2478)

    外显子21  10933-11066    (2479-2612)

    外显子22  11195-11279    (2613-2697)

    外显子23  12211-12451    (2698-2938)

    外显子24  12546-12596    (2939-2989)

    外显子25  13181-13231    (2990-3040)

    外显子26  13358-14823    (3041-4503)实施例8Northern印迹分析

    通过使用DNA标记试剂盒(Pharmacia)用[α-32P]dCTP(3,000Ci/mmol；Amersham Corp.、Arlington Heights、IL)标记人ORP150 cDNA的4.5-Kb EcoRI片段以用作杂交探针。将20μg由暴露于不同应激条件下的U373细胞制备的总RNA电泳并转移到Hybond N+膜上(Amersham Corp.)。从Clontech购买MultipleTissue Northern Blot，其中每个泳道含有2μg得自所需成人组织的poly(A)′RNA。于65℃，在Rapid-hyb缓冲液(Amersham Corp.)中使滤膜与各自经[α-32P]dCTP标记的人ORP150、GRP78、Hsp70、甘油醛-3-磷酸脱氢酶(G3PDH)和β-肌动蛋白cDNA杂交，于65℃用含0.1％SDS的0.1×SSC洗涤，随后进行放射自显影。

    如图2所示，通过在低氧状态下暴露24-48小时可大大增强ORP150 mRNA的水平，在平行实验中，用2-脱氧葡萄糖(25mM、24小时)或霉素(5μg/ml，24小时)处理可将ORP150mRNA的水平增强到可与经低氧状态下诱导的水平相当。诱导水平也与典型的葡萄糖调节蛋白GRP78的mRNA水平相当。热激处理不能显著增强ORP150 mRNA。

    已发现ORP150 mRNA在肝脏和胰腺中高度表达，而在肾脏和脑中仅观察到很少的表达(图3)。另外，ORP150表达的组织特异性与GRP78的十分类似。在含有发育良好之ER并合成大量分泌型蛋白质的组织中观察到的较高水平的表达与ORP150位于ER中这一发现一致(Kuwabara、K.、Matsumoto、M.、Ikeda、J.、Hori、O.、Ogawa、S.、Maeda、Y.、Kitagawa、K.、Imuta、N.、Kinoshita、T.、Stern、D.M.、Yanagi、H.、and Kamada、T.、J.Biol.Chem.271、5025-5032(1996))。

    总之，特征性的一级蛋白质结构和已发现的与GRP78在应激诱导能力和组织特异性上的相似性暗示ORP150在蛋白质折叠和ER中的分泌起到重要作用，可能作为分子伴侣与其他GRP协同作用以处理环境中的应激刺激。

    本领域技术人员仅使用常规实现会认知或能确定本文特定描述的本发明特殊实施方案的很多等同方案，这种等同方案欲包括在下述权利要求的范围之内。

                                   序列表(1)一般资料：

    (iii)序列数：12(2)序列数SEQ ID NO：1：的资料

    (i)序列特征：

        (A)长度：999个氨基酸

        (B)类型：氨基酸

        (D)拓扑结构：线形

    (ii)分子类型：肽

    (xi)序列描述：SEQ ID NO：1：Met Ala Asp Lys Val Arg Arg Gln Arg Pro Arg Arg Arg Val Cys Trp

                  5                  10                  15Ala Leu Val Ala Val Leu Leu Ala Asp Leu Leu Ala Leu Ser Asp Thr

             20                  25                  30Leu Ala Val Met Ser Val Asp Leu Gly Ser Glu Ser Met Lys Val Ala

         35                  40                  45Ile Val Lys Pro Gly Val Pro Met Glu Ile Val Leu Asn Lys Glu Ser

     50                  55                  60Arg Arg Lys Thr Pro Val Ile Val Thr Leu Lys Glu Asn Glu Arg Phe 65                  70                  75                  80Phe Gly Asp Ser Ala Ala Ser Met Ala Ile Lys Asn Pro Lys Ala Thr

                 85                  90                  95Leu Arg Tyr Phe Gln His Leu Leu Gly Lys Gln Ala Asp Asn Pro His

            100                 105                 110Val Ala Leu Tyr Gln Ala Arg Phe Pro Glu His Glu Leu Thr Phe Asp

        115                 120                 125Pro Gln Arg Gln Thr Val His Phe Gln Ile Ser Ser Gln Leu Gln Phe

    130                 135                 140Ser Pro Glu Glu Val Leu Gly Met Val Leu Asn Tyr Ser Arg Ser Leu145                 150                 155                 160Ala Glu Asp Phe Ala Glu Gln Pro Ile Lys Asp Ala Val Ile Thr Val

                165                 170                 175Pro Val Phe Phe Asn Gln Ala Glu Arg Arg Ala Val Leu Gln Ala Ala

            180                 185                 190Arg Met Ala Gly Leu Lys Val Leu Gln Leu Ile Asn Asp Asn Thr Ala

        195                 200                 205Thr Ala Leu Ser Tyr Gly Val Phe Arg Arg Lys Asp Ile Asn Thr Thr

    210                 215                 220Ala Gln Asn Ile Met Phe Tyr Asp Met Gly Ser Gly Ser Thr Val Cys225                 230                 235                 240Thr Ile Val Thr Tyr Gln Met Val Lys Thr Lys Glu Ala Gly Met Gln

                245                 250                 255Pro Gln Leu Gln Ile Arg Gly Val Gly Phe Asp Arg Thr Leu Gly Gly

            260                 265                 270Leu Glu Met Glu Leu Arg Leu Arg Glu Arg Leu Ala Gly Leu Phe Asn

        275                 280                 285Glu Gln Arg Lys Gly Gln Arg Ala Lys Asp Val Arg Glu Asn Pro Arg

    290                 295                 300Ala Met Ala Lys Leu Leu Arg Glu Ala Asn Arg Leu Lys Thr Val Leu305                 310                 315                 320Ser Ala Asn Ala Asp His Met Ala Gln Ile Glu Gly Leu Met Asp Asp

                325                 330                 335Val Asp Phe Lys Ala Lys Val Thr Arg Val Glu Phe Glu Glu Leu Cys

            340                 345                 350Ala Asp Leu Phe Glu Arg Val Pro Gly Pro Val Gln Gln Ala Leu Gln

        355                 360                 365Ser Ala Glu Met Ser Leu Asp Glu Ile Glu Gln Val Ile Leu Val Gly

    370                 375                 380Gly Ala Thr Arg Val Pro Arg Val Gln Glu Val Leu Leu Lys Ala Val385                 390                 395                 400Gly Lys Glu Glu Leu Gly Lys Asn Ile Asn Ala Asp Glu Ala Ala Ala

                405                 410                 415Met Gly Ala Val Tyr Gln Ala Ala Ala Leu Ser Lys Ala Phe Lys Val

            420                 425                 430Lys Pro Phe Val Val Arg Asp Ala Val Val Tyr Pro Ile Leu Val Glu

        435                 440                 445Phe Thr Arg Glu Val Glu Glu Glu Pro Gly Ile His Ser Leu Lys His

    450                 455                 460Asn Lys Arg Val Leu Phe Ser Arg Met Gly Pro Tyr Pro Gln Arg Lys465                 470                 475                 480Val Ile Thr Phe Asn Arg Tyr Ser His Asp Phe Asn Phe His Ile Asn

                485                 490                 495Tyr Gly Asp Leu Gly Phe Leu Gly Pro Glu Asp Leu Arg Val Phe Gly

            500                 505                 510Ser Gln Asn Leu Thr Thr Val Lys Leu Lys Gly Val Gly Asp Ser Phe

        515                 520                 525Lys Lys Tyr Pro Asp Tyr Glu Ser Lys Gly Ile Lys Ala His Phe Asn

    530                 535                 540Leu Asp Glu Ser Gly Val Leu Ser Leu Asp Arg Val Glu Ser Val Phe545                 550                 555                 560Glu Thr Leu Val Glu Asp Ser Ala Glu Glu Glu Ser Thr Leu Thr Lys

                565                 570                 575Leu Gly Asn Thr Ile Ser Ser Leu Phe Gly Gly Gly Thr Thr Pro Asp

            580                 585                 590Ala Lys Glu Asn Gly Thr Asp Thr Val Gln Glu Glu Glu Glu Ser Pro

        595                 600                 605Ala Glu Gly Ser Lys Asp Glu Pro Gly Glu Gln Val Glu Leu Lys Glu

    610                 615                 620Glu Ala Glu Ala Pro Val Glu Asp Gly Ser Gln Pro Pro Pro Pro Glu625                 630                 635                 640Pro Lys Gly Asp Ala Thr Pro Glu Gly Glu Lys Ala Thr Glu Lys Glu

                645                 650                 655Asn Gly Asp Lys Ser Glu Ala Gln Lys Pro Ser Glu Lys Ala Glu Ala

            660                 665                 670Gly Pro Glu Gly Val Ala Pro Ala Pro Glu Gly Glu Lys Lys Gln Lys

        675                 680                 685Pro Ala Arg Lys Arg Arg Met Val Glu Glu Ile Gly Val Glu Leu Val

    690                 695                 700Val Leu Asp Leu Pro Asp Leu Pro Glu Asp Lys Leu Ala Gln Ser Val705                 710                 715                 720Gln Lys Leu Gln Asp Leu Thr Leu Arg Asp Leu Glu Lys Gln Glu Arg

                725                 730                 735Glu Lys Ala Ala Asn Ser Leu Glu Ala Phe Ile Phe Glu Thr Gln Asp

            740                 745                 750Lys Leu Tyr Gln Pro Glu Tyr Gln Glu Val Ser Thr Glu Glu Gln Arg

        755                 760                 765Glu Glu Ile Ser Gly Lys Leu Ser Ala Ala Ser Thr Trp Leu Glu Asp

    770                 775                 780Glu Gly Val Gly Ala Thr Thr Val Met Leu Lys Glu Lys Leu Ala Glu785                 790                 795                 800Leu Arg Lys Leu Cys Gln Gly Leu Phe Phe Arg Val Glu Glu Arg Lys

                805                 810                 815Lys Trp Pro Glu Arg Leu Ser Ala Leu Asp Asn Leu Leu Asn His Ser

            820                 825                 830Ser Met Phe Leu Lys Gly Ala Arg Leu Ile Pro Glu Met Asp Gln Ile

        835                 840                 845Phe Thr Glu Val Glu Met Thr Thr Leu Glu Lys Val Ile Asn Glu Thr

    850                 855                 860Trp Ala Trp Lys Asn Ala Thr Leu Ala Glu Gln Ala Lys Leu Pro Ala865                 870                 875                 880Thr Glu Lys Pro Val Leu Leu Ser Lys Asp Ile Glu Ala Lys Met Met

                885                 890                 895Ala Leu Asp Arg Glu Val Gln Tyr Leu Leu Asn Lys Ala Lys Phe Thr

            900                 905                 910Lys Pro Arg Pro Arg Pro Lys Asp Lys Asn Gly Thr Arg Ala Glu Pro

        915                 920                 925Pro Leu Asn Ala Ser Ala Ser Asp Gln Gly Glu Lys Val Ile Pro Pro

    930                 935                 940Ala Gly Gln Thr Glu Asp Ala Glu Pro Ile Ser Glu Pro Glu Lys Val945                 950                 955                 960Glu Thr Gly Ser Glu Pro Gly Asp Thr Glu Pro Leu Glu Leu Gly Gly

                965                 970                 975Pro Gly Ala Glu Pro Glu Gln Lys Glu Gln Ser Thr Gly Gln Lys Arg

            980                 985                 990Pro Leu Lys Asn Asp Glu Leu

        995(2)SEQ ID NO：2：的资料   (i)序列特征：

      (A)长度：4503个碱基对

      (B)类型：核酸

      (C)链型：双链

      (D)拓扑结构：线形   (ii)分子类型：cDNA   (ix)特征

      (A)名称/关键词：CDS

      (B)鉴定方法：E   (xi)序列描述：SEQ ID NO：2TTGTGAAGGG  CGCGGGTGGG  GGGCGCTGCC  GGCCTCGTGG  GTACGTTCGT  GCCGCGTCTG    60TCCCAGAGCT  GGGGCCGCAG  GAGCGGAGGC  AAGAGGGGCA  CTATGGCAGA  CAAAGTTAGG   120AGGCAGAGGC  CGAGGAGGCG  AGTCTGTTGG  GCCTTGGTGG  CTGTGCTCTT  GGCAGACCTG   180TTGGCACTGA  GTGATACACT  GGCAGTGATG  TCTGTGGACC  TGGGCAGTGA  GTCCATGAAG   240GTGGCCATTG  TCAAACCTGG  AGTGCCCATG  GAAATTGTCT  TGAATAAGGA  ATCTCGGAGG   300AAAACACCGG  TGATCGTGAC  CCTGAAAGAA  AATGAAAGAT  TCTTTGGAGA  CAGTGCAGCA   360AGCATGGCGA  TTAAGAATCC  AAAGGCTACG  CTACGTTACT  TCCAGCACCT  CCTGGGGAAG   420CAGGCAGATA  ACCCCCATGT  AGCTCTTTAC  CAGGCCCGCT  TCCCGGAGCA  CGAGCTGACT   480TTCGACCCAC  AGAGGCAGAC  TGTGCACTTT  CAGATCAGCT  CGCAGCTGCA  GTTCTCACCT   540GAGGAAGTGT  TGGGCATGGT  TCTCAATTAT  TCTCGTTCTC  TAGCTGAAGA  TTTTGCAGAG   600CAGCCCATCA  AGGATGCAGT  GATCACCGTG  CCAGTCTTCT  TCAACCAGGC  CGAGCGCCGA   660GCTGTGCTGC  AGGCTGCTCG  TATGGCTGGC  CTCAAAGTGC  TGCAGCTCAT  CAATGACAAC   720ACCGCCACTG  CCCTCAGCTA  TGGTGTCTTC  CGCCGGAAAG  ATATTAACAC  CACTGCCCAG   780AATATCATGT  TCTATGACAT  GGGCTCAGGC  AGCACCGTAT  GCACCATTGT  GACCTACCAG   840ATGGTGAAGA  CTAAGGAAGC  TGGGATGCAG  CCACAGCTGC  AGATCCGGGG  AGTAGGATTT   900GACCGTACCC  TGGGGGGCCT  GGAGATGGAG  CTCCGGCTTC  GAGAACGCCT  GGCTGGGCTT   960TTCAATGAGC  AGCGCAAGGG  TCAGAGAGCA  AAGGATGTGC  GGGAGAACCC  GCGTGCCATG  1020GCCAAGCTGC  TGCGTGAGGC  TAATCGGCTC  AAAACCGTCC  TCAGTGCCAA  CGCTGACCAC  1080ATGGCACAGA  TTGAAGGCCT  GATGGATGAT  GTGGACTTCA  AGGCAAAAGT  GACTCGTGTG  1140GAATTTGAGG  AGTTGTGTGC  AGACTTGTTT  GAGCGGGTGC  CTGGGCCTGT  ACAGCAGGCC  1200CTCCAGAGTG  CCGAAATGAG  TCTGGATGAG  ATTGAGCAGG  TGATCCTGGT  GGGTGGGGCC  1260ACTCGGGTCC  CCAGAGTTCA  GGAGGTGCTG  CTGAAGGCCG  TGGGCAAGGA  GGAGCTGGGG  1320AAGAACATCA  ATGCAGATGA  AGCAGCCGCC  ATGGGGGCAG  TGTACCAGGC  AGCTGCGCTC  1380AGCAAAGCCT  TTAAAGTGAA  GCCATTTGTC  GTCCGAGATG  CAGTGGTCTA  CCCCATCCTG  1440GTGGAGTTCA  CGAGGGAGGT  GGAGGAGGAG  CCTGGGATTC  ACAGCCTGAA  GCACAATAAA  1500CGGGTACTCT  TCTCTCGGAT  GGGGCCCTAC  CCTCAACGCA  AAGTCATCAC  CTTTAACCGC  1560TACAGCCATG  ATTTCAACTT  CCACATCAAC  TACGGCGACC  TGGGCTTCCT  GGGGCCTGAA  1620GATCTTCGGG  TATTTGGCTC  CCAGAATCTG  ACCACAGTGA  AGCTAAAAGG  GGTGGGTGAC  1680AGCTTCAAGA  AGTATCCTGA  CTACGAGTCC  AAGGGCATCA  AGGCTCACTT  CAACCTGGAT  1740GAGAGTGGCG  TGCTCAGTCT  AGACAGGGTG  GAGTCTGTAT  TTGAGACACT  GGTAGAGGAC  1800AGCGCAGAAG  AGGAATCTAC  TCTCACCAAA  CTTGGCAACA  CCATTTCCAG  CCTGTTTGGA  1860GGCGGTACCA  CACCAGATGC  CAAGGAGAAT  GGTACTGATA  CTGTCCAGGA  GGAAGAGGAG  1920AGCCCTGCAG  AGGGGAGCAA  GGACGAGCCT  GGGGAGCAGG  TGGAGCTCAA  GGAGGAAGCT  1980GAGGCCCCAG  TGGAGGATGG  CTCTCAGCCC  CCACCCCCTG  AACCTAAGGG  AGATGCAACC  2040CCTGAGGGAG  AAAAGGCCAC  AGAAAAAGAA  AATGGGGACA  AGTCTGAGGC  CCAGAAACCA  2100AGTGAGAAGG  CAGAGGCAGG  GCCTGAGGGC  GTCGCTCCAG  CCCCAGAGGG  AGAGAAGAAG  2160CAGAAGCCCG  CCAGGAAGCG  GCGAATGGTA  GAGGAGATCG  GGGTGGAGCT  GGTTGTTCTG  2220GACCTGCCTG  ACTTGCCAGA  GGATAAGCTG  GCTCAGTCGG  TGCAGAAACT  TCAGGACTTG  2280ACACTCCGAG  ACCTGGAGAA  GCAGGAACGG  GAAAAAGCTG  CCAACAGCTT  GGAAGCGTTC  2340ATATTTGAGA  CCCAGGACAA  GCTGTACCAG  CCCGAGTACC  AGGAAGTGTC  CACAGAGGAG  2400CAGCGTGAGG  AGATCTCTGG  GAAGCTCAGC  GCCGCATCCA  CCTGGCTGGA  GGATGAGGGT  2460GTTGGAGCCA  CCACAGTGAT  GTTGAAGGAG  AAGCTGGCTG  AGCTGAGGAA  GCTGTGCCAA  2520GGGCTGTTTT  TTCGGGTAGA  GGAGCGCAAG  AAGTGGCCCG  AACGGCTGTC  TGCCCTCGAT  2580AATCTCCTCA  ACCATTCCAG  CATGTTCCTC  AAGGGGGCCC  GGCTCATCCC  AGAGATGGAC  2640CAGATCTTCA  CTGAGGTGGA  GATGACAACG  TTAGAGAAAG  TCATCAATGA  GACCTGGGCC  2700TGGAAGAATG  CAACTCTGGC  CGAGCAGGCT  AAGCTGCCCG  CCACAGAGAA  GCCTGTGTTG  2760CTCTCAAAAG  ACATTGAAGC  TAAGATGATG  GCCCTGGACC  GAGAGGTGCA  GTATCTGCTC  2820AATAAGGCCA  AGTTTACCAA  GCCCCGGCCC  CGGCCTAAGG  ACAAGAATGG  GACCCGGGCA  2880GAGCCACCCC  TCAATGCCAG  TGCCAGTGAC  CAGGGGGAGA  AGGTCATCCC  TCCAGCAGGC  2940CAGACTGAAG  ATGCAGAGCC  CATTTCAGAA  CCTGAGAAAG  TAGAGACTGG  ATCCGAGCCA  3000GGAGACACTG  AGCCTTTGGA  GTTAGGAGGT  CCTGGAGCAG  AACCTGAACA  GAAAGAACAA  3060TCGACAGGAC  AGAAGCGGCC  TTTGAAGAAC  GACGAACTAT  AACCCCCACC  TCTGTTTTCC  3120CCATTCATCT  CCACCCCCTT  CCCCCACCAC  TTCTATTTAT  TTAACATCGA  GGGTTGGGGG  3180AGGGGTTGGT  CCTGCCCTCG  GCTGGAGTTC  CTTTCTCACC  CCTGTGATTT  GGAGGTGTGG  3240AGAAGGGGAA  GGGAGGGACA  GCTCACTGGT  TCCTTCTGCA  GTACCTCTGT  GGTTAAAAAT  3300GGAAACTGTT  CTCCTCCCCA  GCCCCACTCC  CTGTTCCCTA  CCCATATAGG  CCCTAAATTT  3360GGGAAAAATC  ACTATTAATT  TCTGAATCCT  TTGCCTGTGG  GTAGGAAGAG  AATGGCTGCC  3420AGTGGCTGAT  GGGTCCCGGT  GATGGGAAGG  GTATCAGGTT  GCTGGGGAGT  TTCCACTCTT  3480CTCTGGTGAT  TGTTCCTTCC  CTCCCTTCCT  CTCCCACCAT  GCGATGAGCA  TCCTTTCAGG  3540CCAGTGTCTG  CAGAGCCTCA  GTTACCAGGT  TTGGTTTCTG  AGTGCCTATC  TGTGCTCTTT  3600CCTCCCTCTG  CGGGCTTCTC  TTGCTCTGAG  CCTCCCTTCC  CCATTCCCAT  GCAGCTCCTT  3660TCCCCCTGGG  TTTCCTTGGC  TTCCTGCAGC  AAATTGGGCA  GTTCTCTGCC  CCTTGCCTAA  3720AAGCCTGTAC  CTCTGGATTG  GCGGAAGTAA  ATCTGGAAGG  ATTCTCACTC  GTATTTCCCA  3780CCCCTAGTGG  CCAGAGGAGG  GAGGGGCACA  GTGAAGAAGG  GAGCCCACCA  CCTCTCCGAA  3840GAGGAAAGCC  ACGTAGAGTG  GTTGGCATGG  GGTGCCAGCA  TCGTGCAAGC  TCTGTCATAA  3900TCTGCATCTT  CCCAGCAGCC  TGGTACCCCA  GGTTCCTGTA  ACTCCCTGCC  TCCTCCTCTC  3960TTCTGCTGTT  CTGCTCCTCC  CAGACAGAGC  CTTTCCCTCA  CCCCCTGACC  CCCTGGGCTG  4020ACCAAAATGT  GCTTTCTACT  GTGAGTCCCT  ATCCCAAGAT  CCTGGGGAAA  GGAGAGACCA  4080TGGTGTGAAT  GTAGAGATGC  CACCTCCCTC  TCTCTGAGGC  AGGCCTGTGG  ATGAAGGAGG  4140AGGGTCAGGG  CTGGCCTTCC  TCTGTGCATC  ACTCTGCTAG  GTTGGGGGCC  CCCGACCCAC  4200CATACCTACG  CCTAGGGAGC  CCGTCCTCCA  GTATTCCGTC  TGTAGCAGGA  GCTAGGGCTG  4260CTGCCTCAGC  TCCAAGACAA  GAATGAACCT  GGCTGTTGCA  GTCATTTTGT  CTTTTCCTTT  4320TTTTTTTTTT  GCCACATTGG  CAGAGATGGG  ACCTAAGGGT  CCCACCCCTC  ACCCCACCCC  4380CACCTCTTCT  GTATGTTTGA  ATTCTTTCAG  TAGCTGTTGA  TGCTGGTTGG  ACAGGTTTGA  4440GTCAAATTGT  ACTTTGCTCC  ATTGTTAATT  GAGAAACTGT  TTCAATAAAA  TATTCTTTTC  4500TAC                                                                     4503(2)SEQ ID NO：3：的资料   (i)序列特征：

      (A)长度：999个氨基酸

      (B)类型：氨基酸

      (D)拓扑结构：线形   (ii)分子类型：肽   (xi)序列描述：SEQ ID NO：3：Met Ala Ala Thr Val Arg Arg Gln Arg Pro Arg Arg Leu Leu Cys Trp

                  5                  10                  15Ala Leu Val Ala Val Leu Leu Ala Asp Leu Leu Ala Leu Ser Asp Thr

             20                  25                  30Leu Ala Val Met Ser Val Asp Leu Gly Ser Glu Ser Met Lys Val Ala

         35                  40                  45Ile Val Lys Pro Gly Val Pro Met Glu Ile Val Leu Asn Lys Glu Ser

     50                  55                  60Arg Arg Lys Thr Pro Val Thr Val Thr Leu Lys Glu Asn Glu Arg Phe 65                  70                  75                  80Leu Gly Asp Ser Ala Ala Gly Met Ala Ile Lys Asn Pro Lys Ala Thr

                 85                  90                  95Leu Arg Tyr Phe Gln His Leu Leu Gly Lys Gln Ala Asp Asn Pro His

            100                 105                 110Val Ala Leu Tyr Arg Ser Arg Phe Pro Glu His Glu Leu Asn Val Asp

        115                 120                 125Pro Gln Arg Gln Thr Val Arg Phe Gln Ile Ser Pro Gln Leu Gln Phe

    130                 135                 140Ser Pro Glu Glu Val Leu Gly Met Val Leu Asn Tyr Ser Arg Ser Leu145                 150                 155                 160Ala Glu Asp Phe Ala Glu Gln Pro Ile Lys Asp Ala Val Ile Thr Val

                165                 170                 175Pro Ala Phe Phe Asn Gln Ala Glu Arg Arg Ala Val Leu Gln Ala Ala

            180                 185                 190Arg Met Ala Gly Leu Lys Val Leu Gln Leu Ile Asn Asp Asn Thr Ala

        195                 200                 205Thr Ala Leu Ser Tyr Gly Val Phe Arg Arg Lys Asp Ile Asn Ser Thr

    210                 215                 220Ala Gln Asn Ile Met Phe Tyr Asp Met Gly Ser Gly Ser Thr Val Cys225                 230                 235                 240Thr Ile Val Thr Tyr Gln Thr Val Lys Thr Lys Glu Ala Gly Thr Gln

                245                 250                 255Pro Gln Leu Gln Ile Arg Gly Val Gly Phe Asp Arg Thr Leu Gly Gly

            260                 265                 270Leu Glu Met Glu Leu Arg Leu Arg Glu His Leu Ala Lys Leu Phe Asn

        275                 280                 285Glu Gln Arg Lys Gly Gln Lys Ala Lys Asp Val Arg Glu Asn Pro Arg

    290                 295                 300Ala Met Ala Lys Leu Leu Arg Glu Ala Asn Arg Leu Lys Thr Val Leu305                 310                 315                 320Ser Ala Asn Ala Asp His Met Ala Gln Ile Glu Gly Leu Met Asp Asp

                325                 330                 335Val Asp Phe Lys Ala Lys Val Thr Arg Val Glu Phe Glu Glu Leu Cys

            340                 345                 350Ala Asp Leu Phe Asp Arg Val Pro Gly Pro Val Gln Gln Ala Leu Gln

        355                 360                 365Ser Ala Glu Met Ser Leu Asp Gln Ile Glu Gln Val Ile Leu Val Gly

    370                 375                 380Gly Pro Thr Arg Val Pro Lys Val Gln Glu Val Leu Leu Lys Pro Val385                 390                 395                 400Gly Lys Glu Glu Leu Gly Lys Asn Ile Asn Ala Asp Glu Ala Ala Ala

                405                 410                 415Met Gly Ala Val Tyr Gln Ala Ala Ala Leu Ser Lys Ala Phe Lys Val

            420                 425                 430Lys Pro Phe Val Val Arg Asp Ala Val Ile Tyr Pro Ile Leu Val Glu

        435                 440                 445Phe Thr Arg Glu Val Glu Glu Glu Pro Gly Leu Arg Ser Leu Lys His

    450                 455                 460Asn Lys Arg Val Leu Phe Ser Arg Met Gly Pro Tyr Pro Gln Arg Lys465                 470                 475                 480Val Ile Thr Phe Asn Arg Tyr Ser His Asp Phe Asn Phe His Ile Asn

                485                 490                 495Tyr Gly Asp Leu Gly Phe Leu Gly Pro Glu Asp Leu Arg Val Phe Gly

            500                 505                 510Ser Gln Asn Leu Thr Thr Val Lys Leu Lys Gly Val Gly Glu Ser Phe

        515                 520                 525Lys Lys Tyr Pro Asp Tyr Glu Ser Lys Gly Ile Lys Ala His Phe Asn

    530                 535                 540Leu Asp Glu Ser Gly Val Leu Ser Leu Asp Arg Val Glu Ser Val Phe545                 550                 555                 560Glu Thr Leu Val Glu Asp Ser Pro Glu Glu Glu Ser Thr Leu Thr Lys

                565                 570                 575Leu Gly Asn Thr Ile Ser Ser Leu Phe Gly Gly Gly Thr Ser Ser Asp

            580                 585                 590Ala Lys Glu Asn Gly Thr Asp Ala Val Gln Glu Glu Glu Glu Ser Pro

        595                 600                 605Ala Glu Gly Ser Lys Asp Glu Pro Ala Glu Gln Gly Glu Leu Lys Glu

    610                  615                620Glu Ala Glu Ala Pro Met Glu Asp Thr Ser Gln Pro Pro Pro Ser Glu625                 630                 635                 640Pro Lys Gly Asp Ala Ala Arg Glu Gly Glu Thr Pro Asp Glu Lys Glu

                645                 650                 655Ser Gly Asp Lys Ser Glu Ala Gln Lys Pro Asn Glu Lys Gly Gln Ala

            660                 665                 670Gly Pro Glu Gly Val Pro Pro Ala Pro Glu Glu Glu Lys Lys Gln Lys

        675                 680                 685Pro Ala Arg Lys Gln Lys Met Val Glu Glu Ile Gly Val Glu Leu Ala

    690                 695                 700Val Leu Asp Leu Pro Asp Leu Pro Glu Asp Glu Leu Ala His Ser Val705                 710                 715                 720Gln Lys Leu Glu Asp Leu Thr Leu Arg Asp Leu Glu Lys Gln Glu Arg

                725                 730                 735Glu Lys Ala Ala Asn Ser Leu Glu Ala Phe Ile Phe Glu Thr Gln Asp

            740                 745                 750Lys Leu Tyr Gln Pro Glu Tyr Gln Glu Val Ser Thr Glu Glu Gln Arg

        755                 760                 765Glu Glu Ile Ser Gly Lys Leu Ser Ala Thr Ser Thr Trp Leu Glu Asp

    770                 775                 780Glu Gly Phe Gly Ala Thr Thr Val Met Leu Lys Asp Lys Leu Ala Glu785                 790                 795                 800Leu Arg Lys Leu Cys Gln Gly Leu Phe Phe Arg Val Glu Glu Arg Arg

                805                 810                 815Lys Trp Pro Glu Arg Leu Ser Ala Leu Asp Asn Leu Leu Asn His Ser

            820                 825                 830Ser Ile Phe Leu Lys Gly Ala Arg Leu Ile Pro Glu Met Asp Gln Ile

        835                 840                 845Phe Thr Asp Val Glu Met Thr Thr Leu Glu Lys Val Ile Asn Asp Thr

    850                 855                 860Trp Thr Trp Lys Asn Ala Thr Leu Ala Glu Gln Ala Lys Leu Pro Ala865                 870                 875                 880Thr Glu Lys Pro Val Leu Leu Ser Lys Asp Ile Glu Ala Lys Met Met

                885                 890                 895Ala Leu Asp Arg Glu Val Gln Tyr Leu Leu Asn Lys Ala Lys Phe Thr

            900                 905                 910Lys Pro Arg Pro Arg Pro Lys Asp Lys Asn Gly Thr Arg Thr Glu Pro

        915                 920                 925Pro Leu Asn Ala Ser Ala Gly Asp Gln Glu Glu Lys Val Ile Pro Pro

    930                 935                 940Thr Gly Gln Thr Glu Glu Ala Lys Ala Ile Leu Glu Pro Asp Lys Glu945                 950                 955                 960Gly Leu Gly Thr Glu Ala Ala Asp Ser Glu Pro Leu Glu Leu Gly Gly

                965                 970                 975Pro Gly Ala Glu Ser Glu Gln Ala Glu Gln Thr Ala Gly Gln Lys Arg

            980                 985                 990(2)SEQ ID NO：4：的资料   (i)序列特征：

      (A)长度：3252个碱基对

      (B)类型：核酸

      (C)链型：双链

      (D)拓扑结构：线形   (ii)分子类型：cDNA   (ix)特征：

      (A)名称/关键词：CDS

      (B)鉴定方法：E

                       (xi)序列描述：SEQ ID NO：4TGAGGATGGA  GCAGCGGTCG  GGCCGCGGCT  CCTAGGGGAG  GCAGCGTGCT  AGCTTCGGGG    60GCGGGCCAGT  AGCGGGAGCG  AGGGCCGTAC  GGACACCGGT  CCCTTCGGCC  TTGAAGTTCA   120GGCGCTGAGC  TGCCCCCTCG  CGCTCGGGGT  GGGCCGGAAT  CCATTTCTGG  GAGTGGGATC   180TTCCACCTTC  ATCAGGGTCA  CAATGGCAGC  TACAGTAAGG  AGGCAGAGGC  CAAGGAGGCT   240ACTCTGTTGG  GCCTTGGTGG  CTGTCCTCTT  GGCAGACCTG  TTGGCACTGA  GTGACACACT   300GGCTGTGATG  TCTGTGGACC  TGGGCAGTGA  ATCCATGAAG  GTGGCCATTG  TCAAGCCTGG   360AGTGCCCATG  GAGATTGTAT  TGAACAAGGA  ATCTCGGAGG  AAAACTCCGG  TGACTGTGAC   420CTTGAAGGAA  AACGAAAGGT  TTCTAGGTGA  CAGTGCAGCT  GGCATGGCCA  TCAAGAACCC   480AAAGGCTACG  CTCCGTTATT  TCCAGCACCT  CCTTGGAAAG  CAGGCAGATA  ACCCTCATGT   540GGCTCTTTAC  CGGTCCCGTT  TCCCAGAACA  TGAGCTCAAT  GTTGACCCAC  AGAGGCAGAC   600TGTGCGCTTC  CAGATCAGTC  CGCAGCTGCA  GTTCTCTCCC  GAGGAGGTGC  TGGGCATGGT   660TCTCAACTAC  TCCCGTTCCC  TGGCTGAAGA  TTTTGCAGAA  CAACCTATTA  AGGATGCAGT   720GATCACCGTG  CCAGCCTTTT  TCAACCAGGC  CGAGCGCCGA  GCTGTGCTGC  AGGCTGCTCG   780TATGGCTGGC  CTCAAGGTGC  TGCAGCTCAT  CAATGACAAC  ACTGCCACAG  CCCTCAGCTA   840TGGTGTCTTC  CGCCGGAAAG  ATATCAATTC  CACTGCACAG  AATATCATGT  TCTATGACAT   900GGGCTCGGGC  AGCACTGTGT  GTACCATCGT  GACCTACCAA  ACGGTGAAGA  CTAAGGAGGC   960TGGGACGCAG  CCACAGCTAC  AGATCCGGGG  CGTGGGATTT  GACCGCACCC  TGGGTGGCCT  1020GGAGATGGAG  CTTCGGCTGC  GAGAGCACCT  GGCTAAGCTC  TTCAATGAGC  AGCGCAAGGG  1080CCAGAAAGCC  AAGGATGTTC  GGGAAAACCC  CCGAGCCATG  GCCAAACTGC  TTCGGGAAGC  1140CAATCGGCTT  AAAACCGTCC  TGAGTGCCAA  TGCTGATCAC  ATGGCACAGA  TTGAAGGCTT  1200GATGGACGAT  GTGGACTTCA  AGGCAAAAGT  AACTCGAGTG  GAGTTTGAGG  AGCTGTGTGC  1260AGATTTGTTT  GATCGAGTGC  CTGGGCCTGT  ACAGCAGGCC  CTGCAGAGTG  CTGAGATGAG  1320CCTGGATCAA  ATTGAGCAGG  TGATCCTGGT  GGGTGGGCCC  ACTCGTGTTC  CCAAAGTTCA  1380AGAGGTGCTG  CTGAAGCCTG  TGGGCAAGGA  GGAACTAGGA  AAGAACATCA  ATGCCGATGA  1440AGCAGCTGCC  ATGGGGGCCG  TGTACCAGGC  AGCGGCACTG  AGCAAAGCCT  TCAAAGTGAA  1500GCCATTTGTT  GTGCGTGATG  CTGTTATTTA  CCCCATCCTG  GTGGAGTTCA  CAAGGGAGGT  1560GGAGGAGGAG  CCTGGGCTTC  GAAGCCTGAA  GCACAATAAA  CGTGTGCTCT  TCTCCCGAAT  1620GGGGCCCTAC  CCTCAGCGCA  AAGTCATCAC  CTTTAACCGA  TACAGCCATG  ATTTCAACTT  1680TCACATCAAC  TACGGTGACC  TGGGCTTCCT  GGGGCCTGAG  GATCTTCGGG  TATTTGGCTC  1740CCAGAATCTG  ACCACAGTGA  AACTAAAAGG  TGTGGGAGAG  AGCTTCAAGA  AATATCCTGA  1800CTATGAGTCC  AAAGGCATCA  AGGCCCACTT  TAACCTAGAC  GAGAGTGGAG  TGCTCAGTTT  1860AGACAGGGTG  GAGTCCGTAT  TCGAGACCCT  GGTGGAGGAC  AGCCCAGAGG  AAGAGTCTAC  1920TCTTACCAAA  CTTGGCAACA  CCATTTCCAG  CCTGTTTGGC  GGTGGTACCT  CATCAGATGC  1980CAAAGAGAAT  GGTACTGATG  CTGTACAGGA  GGAGGAGGAG  AGCCCTGCTG  AGGGGAGCAA  2040GGATGAGCCT  GCAGAACAGG  GGGAACTCAA  GGAGGAAGCT  GAAGCCCCAA  TGGAGGATAC  2100CTCCCAGCCT  CCACCCTCTG  AGCCTAAGGG  GGATGCAGCC  CGTGAGGGAG  AAACACCTGA  2160TGAAAAAGAA  AGTGGGGACA  AGTCTGAGGC  CCAGAAGCCC  AATGAGAAGG  GGCAGGCAGG  2220GCCTGAGGGT  GTCCCTCCAG  CTCCCGAGGA  AGAAAAAAAG  CAGAAACCTG  CCCGGAAGCA  2280GAAAATGGTG  GAGGAGATAG  GTGTGGAACT  GGCTGTCTTG  GACCTGCCAG  ACTTGCCAGA  2340GGATGAGCTG  GCCCATTCCG  TGCAGAAACT  TGAGGACTTG  ACCCTGCGAG  ACCTTGAAAA  2400GCAGGAGAGG  GAGAAAGCTG  CCAACAGCTT  AGAAGCTTTT  ATCTTTGAGA  CCCAGGACAA  2460ACTGTACCAA  CCTGAGTACC  AGGAAGTGTC  CACTGAGGAA  CAACGGGAGG  AGATCTCTGG  2520AAAACTCAGT  GCCACTTCTA  CCTGGCTGGA  GGATGAGGGA  TTTGGAGCCA  CCACTGTGAT  2580GTTGAAGGAC  AAGCTGGCTG  AGCTGAGAAA  GCTGTGCCAA  GGGCTGTTTT  TTCGGGTGGA  2640AGAGCGCAGG  AAATGGCCAG  AGCGGCTTTC  AGCTCTGGAT  AATCTCCTCA  ATCACTCCAG  2700CATTTTCCTC  AAGGGTGCCC  GACTCATCCC  AGAGATGGAC  CAGATCTTCA  CTGACGTGGA  2760GATGACAACG  TTGGAGAAAG  TCATCAATGA  CACCTGGACC  TGGAAGAATG  CAACCCTGGC  2820CGAGCAGGCC  AAGCTTCCTG  CCACAGAGAA  ACCCGTGCTG  CTTTCAAAAG  ACATCGAGGC  2880CAAAATGATG  GCCCTGGACC  GGGAGGTGCA  GTATCTACTC  AATAAGGCCA  AGTTTACTAA  2940ACCCCGGCCA  CGGCCCAAGG  ACAAGAATGG  CACCCGGACA  GAGCCTCCCC  TCAATGCCAG  3000TGCTGGTGAC  CAAGAGGAAA  AGGTCATTCC  ACCTACAGGC  CAGACTGAAG  AGGCGAAGGC  3060CATCTTAGAA  CCTGACAAAG  AAGGGCTTGG  TACAGAGGCA  GCAGACTCTG  AGCCTCTGGA  3120ATTAGGAGGT  CCTGGTGCAG  AATCTGAACA  GGCAGAGCAG  ACAGCAGGGC  AGAAGCGGCC  3180TTTGAAGAAT  GATGAGCTGT  GACCCCGCGC  CTCCGCTCCA  CTTGCCTCCA  GCCCCTTCTC  3240CTACCACCTC  TA                                                          3252(2)SEQ ID NO：5：的资料   (i)序列特征：

      (A)长度：31个碱基对

      (B)类型：氨基酸

      (D)拓扑结构：线形   (ii)分子类型：肽   (xi)序列描述：SEQ ID NO：5：Leu Ala Val Met Ser Val Asp Leu

                 5Gly Ser Glu Ser Met Lys Val Ala

    10                  15Ile Val Lys Pro Gly Val Pro Met

            20Glu Ile Val Leu Asn Lys Glu25                  30(2)SEQ ID NO：6：的资料   (i)序列特征：

      (A)长度：20个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线形   (ii)分子类型：其他核酸、合成的核酸   (xi)序列描述：SEQ ID NO：6：AATACGACTC ACTATAGGGA(2)SEQ ID NO：7：的资料   (i)序列特征：

      (A)长度：7个氨基酸

      (B)类型：氨基酸

      (D)拓扑结构：线形   (ii)分子类型：肽   (xi)序列描述：SEQ ID NO：7：Lys Pro Gly Val Pro Met Glu

                 5(2)SEQ ID NO：8：的资料

      (i)序列特征：

         (A)长度：20个碱基对

         (B)类型：核酸

         (C)链型：单链

         (D)拓扑结构：线形

      (ii)分子类型：其他核酸，合成的核酸

      (xi)序列描述：SEQ ID NO：8：AARCCiGGiG TNCCNATGGA   20

    (2)SEQ ID NO：9：的资料

       (i)序列特征：

          (A)长度：13个碱基对

          (B)类型：氨基酸

          (D)拓扑结构：线形

       (ii)分子类型：肽

       (xi)序列描述：SEQ ID NO：9：Lys Pro Gly Val Pro Met Glu Ile

                 5Val Leu Asn Lys Glu

    10

    (2)SEQ ID NO：10：的资料

       (i)序列特征：

          (A)长度：20个碱基对

          (B)类型：核酸

          (C)链型：单链

          (D)拓扑结构：线形

       (ii)分子类型：其他核酸，合成的核酸

       (xi)序列描述：SEQ ID NO：10：GCACCCTTGA GGAAAATGCT  20(2)SEQ ID NO：11：的资料

    (i)序列特征：

       (A)长度：20个碱基对

       (B)类型：核酸

       (C)链型：单链

        (D)拓扑结构：线形

    (ii)分子类型：其他核酸，合成的核酸

    (xi)序列描述：SEQ ID NO：11：CCCAGAAGCC CAATGAGAAG 20(2)SEQ ID NO：12：的资料

    (i)序列特征：

       (A)长度：2861个碱基对

       (B)类型：核酸

       (C)链型：双链

       (D)拓扑结构：线形

    (ii)分子类型：基因组DNA

    (xi)序列描述：SEQ ID NO：12：GAAAGAAGTA  GACATGGGAG  ACTTCATTTT  GTTCTGTACT  AAGAAAAATT  CTTCTGCCTT   60GGGATGCTGT  TGATCTATGA  CCTTACCCCC  AACCCTGTGC  TCTCTGAAAC  ATGTGCTGTG  120TCCACTCAGG  GTTAAATGGA  TTAAGGGCGG  TGCAAGATGT  GCTTTGTTAA  ACAGATGCTT  180GAAGGCAGCA  TGCTCGTTAG  GAGTCATCAC  CACTCCCTAA  TCTCAAGTAC  CCAGGGACAC  240AAACACTGCG  GAAGGCCACA  GGGTCCTCTG  CCTAGGAAAG  CCAGAGACCT  TTGTTCACTT  300GTTTATCTGC  TGACCTTCCC  TCCACTATTG  TCCTATGACC  CTGCCAAATC  CCCCTCTGCC  360AGAAACACCC  AAGAATGATC  AATAAAAAAA  AAAAAAAAAA  AAAAAGGAAG  AATAGACTCT  420CTCTGGGACT  GCCAATAATT  TTTCCTTCTA  AGCATAGACA  CCGGACCACT  CTCCACCTAA  480GCATCACGAA  AAATGTAGAG  AAAGGAAGAG  CTAAGAGCTC  CTTAAACAAG  TTCAGGCTTG  540ACACAACCCT  GGCCCTGACA  GCCAGGGTCT  TCAAGCGGGC  CTTTCTGTGA  AGGGTGGCCA  600GGCATCAACT  TAGTAGGAGA  GAAAACAGAT  GACTTATTTC  CATCCACACT  TAAGGAAAAT  660GCAGTCTCCA  AGGACTGCGT  ACATTTCTTT  TTCGAGAAGG  AGTCTCGCTG  TTGTCGCCCA  720GGCTGGAGTG  CAGTGGCGCA  GTCTGGGCTC  ACAGCAACCT  CTGCCTCCCG  GATTCAAGCA  780ATTCTCCTGC  CTCAGCCTCG  TGAGTAGCTG  GGATTACAGG  CACCCGCCAC  CACGCCTGGC  840TAATTTTTGT  AGTTTTGGTA  GAGACGGGGT  TTCACCATGT  TGGCCAGGCT  GGTCTCGAAC  900TCCTGACCTC  CAGTGATTCG  CCCGCCTTGG  CCTCCCAAAA  TGCTGGGATT  ACAGGCGTGA  960GCCACCGCGC  CCGGGCGACT  GCGCACATTT  CTATGGAGCT  GTAAGTTAAA  AGAGAAGGCA 1020GTGAGGTGCT  TCTGTCATTC  TATGACAGAA  ACAGCTAAAG  AGTAGAGAAA  TGTTCACAAG 1080ATTTAATAGA  ACAGAAATAG  GAGAAGGTGC  ACACAAGCTC  AACCAACTAT  AGCCTCACAA  1140ATAAAAGTGT  CTTTTGTGTG  TAGTACTTAA  GTTTGGAATA  TTCTTTCTTA  TACAAATGAG  1200TGGGGCTTAA  CCTAAGAAAT  CCTGGCCAGA  TTCTGCGACG  AATGCATCGG  TTATCTCTGA  1260CCCATCAGCA  AACATCTTTT  TCTGTGGCTT  CAGTTTCCTC  AGTAAAACAG  AGGGGGTTGC  1320GACGGACTCA  GTCCGAGGCA  CAGCCATTCT  CCAACGTCTA  TCCAAAGCCT  AGGGCACCTC  1380AATACTAACC  GGCAGGCCAG  CGCCCCCTCC  GCGGGGCTGC  GGACAGGACG  CCTGTTATTC  1440CATTCCTCGG  CCGGGCTCTA  CAGGTGACCG  GAAGAAGAGC  CCCGAGTGCG  GGACTGCAGT  1500GCGCCCGACC  TGCTCTAGGC  GCAGGTCACT  CCCGAACCCC  GGCAGCAAAG  CATCCAGCGC  1560CGGAAAAGGT  CCCGCGGTCG  CCCCGGGGCC  GGCGCTGGGG  AGGAAGGAGT  GGAGCGCGCT  1620GGCCCCGTGA  CGTGGTCCAA  TCCCAGGCCG  ACGCCGGCTG  CTTCTGCCCA  ACCGGTGGCT  1680GGTCCCCTCC  GCCGCCCCCA  TTACAAGGCT  GGCAAAGGGA  GGGGGCGGGG  CCTGGGACGT  1740GGTCCAATGA  GTACGCGCGC  CGGGGCGGCG  GGGGCGGGGC  CGGGCGCGCA  GCGCAGGGCC  1800GGGCGGCCGA  GGCTCCAATG  AGCGCCCGCC  GCGTCCGGGG  CCGGCTGGTG  CGCGAGACGC  1860CGCCGAGAGG  TTGGTGGCTA  ATGTAACAGT  TTGCAAACCG  AGAGGAGTTG  TGAAGGGCGC  1920GGGTGGGGGG  CGCTGCCGGC  CTCGTGGGTA  CGTTCGTGCC  GCGTCTGTCC  CAGAGCTGGG  1980GCCGCAGGAG  CGGAGGCAAG  AGGTAGCGGG  GGTGGATGGA  GGTGCGGGCC  GGCCACCCCT  2040CCTAGGGGAG  ACAGCGTGCG  AGCTCCGGGG  GCGGGTCGGG  AGCGCAAGGG  AGGGCCGCGC  2100GGACGCCGGG  CGCTCGGCCT  CGCACCGGGG  GGCACGCAGC  TCGGCCCCCG  GTCTGTCCCC  2160ACTTGCTGGG  GCGGGCCGGG  ATCCGTTTCC  GGGAGTGGGA  GCCGCCGCCT  TCGTCAGGTG  2220GGGTTTAGGT  GAACACCGGG  TAACGGCTAC  CCGCCGGGCG  GGGAACCTTA  CCGCCCCTGG  2280CACTGCGTCT  GTGGGCACAG  CGGGGCCGGG  GAGTGAGCTG  GGAAAGGGGA  GGGGGCGGGA  2340CAACCCGCAG  GGATGCCGAG  GAGGAGATAG  GCCTTTCCTT  CATCCTAGCT  ACCCCCAACG  2400TCATTACCTT  TCTCTTCCCG  TCCAGGCCCA  GCTGGCTTTC  CCCGTCAGCG  GGGGAGCTCC  2460AGGTGTGGGG  AGGTGGTTGA  GCCCTGGGCG  GGGATCCCTG  GCCGCACCCC  AGGTGTCTGA  2520CAACAGGCAC  AGTGCTGCGG  TGCGCCACTC  ACTGCCTGTG  TGGTGGACAA  AAGGCTCGGG  2580TCTCCTTTCT  CTTGTCCTGT  TAGCTTCTCT  GTTTAGGGAT  GTGGCAAAGC  CGAGGACCCA  2640TGCTCTTTCA  CTTGGGCCTT  TGTGTGGGCG  CTGCTGGGAT  GATTAGAGAA  TGGTTTGTAC  2700CCATCAGGAG  GGAGAAGGGG  AGAAGTAGGC  TGATCTGCCC  TGGGTAAGAA  TGAAGTAGAT  2760ATGAATCTTA  CAGCCTCTCC  GTTCTGGGAT  GTGATTCTGT  CTCCTTCACT  CCGGGTATCC  2820AGTTTTAAGT  GTTTTCTTTC  TTCGCCTCCC  CCAGGGGCAC  T                       2861