人类信息素LH－SEMAL和其它物种中相应的信息素.pdf

摘要
申请专利号：	CN98103356.3	申请日：	1998.07.09
公开号：	CN1209436A	公开日：	1999.03.03
当前法律状态：	撤回	有效性：	无权
法律详情：	发明专利申请公布后的视为撤回\|\|\|实质审查的生效申请日:1998.7.9\|\|\|公开
IPC分类号：	C07K14/46; C12N15/12; A61K39/395	主分类号：	C07K14/46; C12N15/12; A61K39/395
申请人：	德国赫彻斯特马里奥罗塞尔有限公司;
发明人：	B·弗莱肯斯汀; A·恩塞尔
地址：	联邦德国法兰克福
优先权：	1997.07.09 DE 19729211.9; 1998.02.11 DE 19805371.1
专利代理机构：	中国国际贸易促进委员会专利商标事务所	代理人：	陈文平
PDF下载：	PDF下载

内容摘要

本发明涉及由一特定的结构域结构所区别的新的信息素和其衍生物,并且涉及编码这些信息素的核酸(DNA,RNA,cDNA)和其衍生物,以及它们的用途。本发明涉及在免疫系统中具有生化功能并且具有迄今未公开和未预料到的结构域结构的信息素(免疫调节信息素)。这些新的信息素被认为是L型信息素(Sema－L)。它们包含一个N端信号肽、一个特征性Sema结构域。并且在蛋白质C端区含义一个免疫球蛋白样结构域和代表潜在跨膜结构域的疏水结构域。

权利要求书

1：一种包含一个特征性Sema结构域的信息素，其中该蛋白质具有一个N 端信号肽，并且在C端区具有一个免疫球蛋白样结构域以及一跨膜结构域。所说的信息素被认为是L型信息素(Sema-L)，以及L型信息素的衍生物。
2：如权利要求1中所要求的信息素，其中所说的蛋白质(人类L型信息素(H- SemaL))具有氨基酸序列SEQ ID NO.3。
3：如权利要求1和2中之一个或多个所要求的信息素，其中所说的蛋白质在 Sema结构域区域中与H-SemaL的Sema结构域具有至少40％的氨基酸等同性。
4：如权利要求1至2之一个或多个所要求的信息素，其中所说的蛋白质包含部分氨基酸序列SEQ ID NO.4(鼠信息素(M-SemaL))。
5：一种包含编码如权利要求1至4中之一个或多个所要求的L型信息素的核酸序列的核酸以及其衍生物。
6：如权利要求5所要求的核酸，其中所说的核酸序列是信息素L基因。
7：如权利要求5和6中之一个或多个所要求的核酸，其中所说的核酸序列包含H-SemaL的基因。
8：如权利要求5所要求的核酸，其中所说的核酸序列包含L型信息素的 cDNA。
9：如权利要求8所要求的核酸，其中所说的cDNA是H-SemaL的cDNA。
10：如权利要求8所要求的核酸，其中所说的cDNA是M-SemaL的cDNA。
11：一种制备如权利要求1至4中之一个或多个所要求的L型信息素的方法，该方法包括将编码L型信息素或者其衍生物的核酸序列克隆进表达载体并且表表达之。
12：如权利要求11所要求的方法，其中将真核细胞用于表达。
13： L型信息素或其衍生物或编码L型信息素的核酸序列或其衍生物在产生可以用于治疗或预防免疫疾病的药物中的用途。
14：如权利要求13所要求的核酸序列或其衍生物在基因治疗中的用途。
15： L型信息素或编码L型信息素核酸序列在鉴别免疫调节剂的方法中的用途。
16：一种鉴别免疫调节剂的方法，该方法包括在特定的条件下将L型信息素与待测药剂一起温育，在没有待测药剂但是其它方面相同的条件下进行第二批平行培养，然后确定待测药剂的抑制或激活作用。
17：一种鉴别免疫调节剂的方法，该方法包括在特定的条件下和在待测药剂存在下表达编码L型信息素的核酸序列，并且测定其表达程度。
18：一种制备编码L型信息素的核酸的方法，其中用特异性引物通过聚合酶链式反应扩增这种核酸。
19：一种信息素抗体，该抗体识别相应于SEQ ID NO.4中的179-378位氨基酸的H-SemaL的表位，或者识别相应于SEQ ID NO.4中的480-666位氨基酸的 H-SemaL的表位。
20：一种制备如权利要求19所要求的信息素抗体的方法，其中作为具有表位标记的融合蛋白表达所说的表位，通过这一表位标记纯化所说的表位，并且将纯化的融合蛋白用于免疫接种。

说明书

人类信息素L和其它物种中相应的信息素
    本发明涉及由一特定的结构域结构识别的新的信息素(semaphorin)和其衍生物，涉及编码这些信息素的核酸(DNA、RNA、cDNA)和其衍生物，以及它们的制备和用途。

    Kolodkin首次描述了信息素作为保守基因家族的成员{Kolodkin等(1993)细胞75:1389-1399}。

    现在已经克隆出(并且在某些情况下已经描绘出)其它信息素的基因或部分基因。到目前为止，已经公开了总共5种人类信息素(H-SemaⅢ,H-SemaⅤ,H-SemaⅣ,H-SemaB和H-SemaE){(Kolodkin等(1993)；Poche等(1996)癌基因12:1289-1297；Sekido等(1996)美国科学院院报93:4120-4125；Xiang等(1996)基因组32:39-48；Hall等(1996)美国科学院院报39:11780-11785；Yamada等(1997)(GenBank登记号AB000220)},8种鼠类信息素(小鼠基因；M-Sema A到M-Sema-H){(Püschel等(1995)神经元14:941-948；Messerschmidt等(1995)神经元14:949-959；Inigaki等(1995)FEBS通讯370:269-272；Adams等(1996)Mech.Dev57:33-45；Christensen等(1996)(GenBank登记号Z80941,Z93948)},5种鸡精蛋白(小鸡)脑衰蛋白-1到-5){Luo等(1993)；Luo等(1995)神经元14:1131-1140}，以及来自大鼠(R-Sema-Ⅲ){Giger等(1996)J.Comp.Neurol.375:378-392}，斑马鱼，昆虫毛(果蝇(果蝇D melanogaster:D-SemaⅠ和D-SemaⅡ)，甲虫Tribolium confusum:T-Sema-l)，蚱蜢(Schistocerca americana:G-Sema-l)){Kolodkin等(1993)}，以及线虫(C.elegans:Ce-Sema){Roy等(1994)(GemBank登记号U15667)}的基因。此外，两种痘病毒(牛痘(ORF-A39)和天花(ORFA39-同源物)){Kolodkin等(1993)}和alcelaphine疱疹病毒1型(AHV-1)(AHV-Sema){Ensser和Fleckenstein(1995)普通病毒学76:1063-1067}具有与信息素同源的基因。

    表-1总结了到目前为止在各种物种中鉴别的信息素。表1显示了信息素的名称(第1列)，所使用的同义词(第2列)，分离特定信息素的物种(第3列)；和其中已知的关于所说地编码蛋白质的结构域结构的数据和关于染色体位点的数据(表1的第4列)，存储在基因数据库(例如，EST(表达序列标记)数据库，EMBL(欧洲分子生物学实验室，Heidelberg)数据库或NCBI(国家生物技术信息中心，马里兰，美国)的基因序列的登记号，以及这些数据出版的参考信息(表1的第5列)。

    到目前为止，所有公开的信息素基因的基因产物(编码的信息素)都具有一个N端信号肽。它在C端具有大约450至500个氨基酸长度的特有Sema结构域。高度保守的氨基酸基元和一些高度保守的半胱氨酸残基被已在Sema结构域中找到。基因产物(信息素)在C端序列方面是不同的，这些序列跟随在Sema结构域之后，并且由一个或多个结构域组成。例如，在这些C端氨基酸序列中有跨膜结构域(TM)，免疫球蛋白样结构域(Ig)(免疫球蛋白恒定区)，胞质序列(CP)，加工信号(P)(例如有共有序列(RXR)，其中R是精氨酸，X是任何氨基酸)和/或亲水C端(HPC)。到目前为止所公开的信息素根据C端的结构域结构的不同可以划分为5个不同的子群(Ⅰ到Ⅴ)：Ⅰ     分泌性，没有其它结构域(例如ORF-A49)Ⅱ lg  分泌性(没有跨膜结构，例如AHV-Sema)Ⅲ lg, TM,CP具有胞质序列，膜锚着(例如CD100)Ⅳ lg, (P),HPC具有亲水性C端，分泌性(例如H-SemaⅢ,M-SemaD，脑衰蛋白-l)V  lg, TM,CP具有C端7血小板反应蛋白基元。膜锚着(例如M-SemaF和G)

    到此为止还没有描述过信息素受体或胞外配体。已经公开了与信息素-介导作用相关连的胞内杂合三聚体GTP结合性蛋白质复合物。在小鸡中已被鉴别的这些蛋白质复合物的一个组分称为CRMP(脑衰蛋白应答介导蛋白质)，并且被假定是信息素诱导的胞内信号级联的一个组分(Goshima等(1995)自然376:509-514)。例如，CRMP62与unc-33、线虫蛋白质(对轴突定向成长来说是十分重要的)都具有同源性。同样地，已知人类蛋白质98％的氨基酸与CRMP62具有等同性(Hamajima等(1996)基因180:157-163)。类似地描述了大鼠中的几个CRMP-相关基因(Wang等(1996)神经科学16:6197-6207)。

    所说的分泌性或跨膜信息素为增长的神经芽体传达排斥信号。在神经系统(CNS)的发育中，它们起着重要的作用，并且特别是在肌肉和神经组织中表达(Kolodkin等(1993)；Luo等(1993)细胞75:217-227)。

    与密切相关的M-SemaF相对比，M-SemaG的显著表达不仅在所说的CNS中而且在淋巴与造血系统的细胞中已经观察到(Furuyima等(1996)生物化学杂志271:33376-33381)。

    近来已经鉴别出两个其它的人类信息素，H-SemaⅣ和H-SemaⅤ(特别是染色体3p21.3区域)，其缺失与各种类型的支气管癌有关。H-SemaⅣ{(Roche等(1996),Xiang等(1996),Sekido等(1996)}与M-SemaE在氨基酸水平上大约有50％的等同性，而H-SemaⅤ{Sekido等(1996)}是M-SemaA的直接同系物(86％的氨基酸等同性)。因为在所切除的3p21.3基因座上进行DNA测序工程期间发现了这些基因(H-SemaⅣ和Ⅴ)，这两个基因复合物的内含子-外显子结构是已知的。两个基因都能在各种神经元和非神经元组织中表达。

    同样仅仅在前不久，细胞表面分子CD100(人)(在活化的T细胞上表达并诱导)已经鉴别为是一种信息素(表1中同样列出)。它通过CD40受体和相应配体CD40L帮助与B细胞相互作用。CD100是一个150kd(千道尔顿)的膜锚着糖蛋白二聚体。已经描述了CD100的外胞质C端与一迄今未知的激酶的结合{Hall等(1996)}。这就意味CD100是第一个并且是迄今为止仅有的已证明在免疫系统的细胞中表达的信息素。

    在“rhadinoviruses的转化基因”方案中，已经克隆和测序了alcelaphine疱疹病毒1型(AHV-1)的完全基因组{Ensser等(1995)}。AHV-1是恶性卡他发热、各种与淋巴增殖综合症有关的反刍动物疾病的诱发剂(并且通常是致命的)。经过分析，发现了一个开放读框，在病毒基因组的一端具有与痘苗病毒基因远程的但是显著的同源性(ORF-A39相应于Ensser等(1995)普通病毒学76:1063-1067的VAC-A39)，后者已经被归为信息素基因家族。而AHV-1信息素(AHV-Sema)具有非常保守的信息素结构，痘病毒基因(ORF-A39和ORF-A39-同源物，参见表1)具有C端截短。即其中仅仅非完全地存在保守Sema结构域。

    所发现的AHV-Sema与dbEST(EST(表达序列标志)数据库(db))的数据库比较提从人胎盘的2种独立cDNA克隆都提供了两种EST序列(登记号H02902,H03806(克隆151129)，登记号R33439和R33537(克隆135941))。与迄今为止所描述的神经元信息相比。这些明显地显示了与AHV-1的信息素更大的同源性。

    本发明涉及这样的信息素，它们具有新的迄今未公开的和未曾预料到的结构域结构，并且其具有在免疫系统中的生化功能(免疫调节信息素)。这些新的信息素被称为L型信息素(SemaL)。它们包含一个N端信号肽。一个特征性Sema结构域。并且在蛋白质的C端区包括一个免疫球蛋白样结构域和一个代表潜在跨膜结构域的疏水结构域。

    信号肽的氨基酸序列可以有少于70个氨基酸，优选地少于60个，而多于20个，更优选地多于30个氨基酸，并且特别优选的长度是约40到50个氨基酸，在本发明的特定实施方案中，所说的信号肽具有44个氨基酸长度，即信号肽酶的切割位点被定位在44到45个氨基酸之间。

    Sema结构域的长度可以是从300到700或更多个氨基酸，优选的是大约400到600个氨基酸，更优选的Sema结构域的长度是450至550个氨基酸，优选的是大约500个氨基酸，在本发明更优选的实施方案中，Sema结构域被加上信号肽，此时Sema结构域优选地达到545个氨基酸。

    免疫球蛋白样结构域的长度可以是大约30至110个或更多个氨基酸，以及优选的长度是在50与90个之间的，特别优选的是大约70个氨基酸。

    跨膜结构域的长度可以是大约10至35个氨基酸，优选的是大约15至30个，特别优选的是大约20至25个氨基酸。

    本发明涉及来自不同物种的L型信息素，特别是脊椎动物，例如鸟类和/或鱼类，优选是哺乳动物，例如灵长目动物，大鼠、兔、狗、猫、绵羊、山羊、母牛、马、猪、特别优选的是人和小鼠。本发明也涉及来自微生物的相应的信息素，尤其是病原微生物，例如细菌，酵母和/或病毒，例如反转录病毒，尤其是人-病原微生物。

    本发明的一个实施方案是相应的人类信息素(H-SemaL)，它具有信号肽，Sema结构域。免疫球蛋白样结构域和跨膜结构域。特定的实施方案是由表4中显示的氨基酸序列给出的信息素。

    本发明的另一个实施方案包含其它物种中相应的信息素，它们在Sema结构域区域中与H-SenaL的Sema结构域(表4中序列的45至545个氨基酸)相比具有超过40％，优选的是超过50％，特别优选的是超过60％的氨基酸等同性。。在密切相关物种(例如灵长目动物，小鼠)中相应的信息素可能很完美地具有超过70％，优选的是超过80％，特别优选的是超过90％的氨基酸等同性。例如可以利用GAP程序来确定或计算出百分同源性(GCG程序包。遗传计算机组(1991))。

    本发明这样的实施方案是相应的小鼠信息素(鼠信息素(M-SemaL))。例如，它含有在表5中所显示的部分氨基酸序列(鼠信息素(M-SemaL))。

    本发明也涉及这样的相应信息素，在较少相关的物种(系统发育上相互之间十分远的)中，它与表4中显示的H-SemaL完全氨基酸序列相比仅仅具有大约15至20％的氨基酸等同性(在蛋白质氨基酸序列的整个长度上考虑)，优选的是25至30％，特别优选的是35至40％，或是更高的等同性。

    编码L型信息素的基因具有外显子-内含子结构。例如，这些基因可能具有10到20个外显子，优选的是大约11至18个，特别优选的是12至16个外显子和相应的数量的内含子。然而，它们也可以具有与H-SemaL基因相同数量的外显子和内含子(13或15个外显子，优选的是14个外显子)。本发明的一个特定实施方案涉及H-SemaL基因。这一基因的长度优选的是8888至10,000或更多个核苷酸。人类信息素基因优选地包含素14所给出的核苷酸序列或在GenBank_数据库中储存的登记号AF030697的核苷酸序列。这些核苷酸序列含有至少13个内含子。此外，人类信息素基因在5＇端具有一个附加序列区域。合适时这一区域进一步含有编码和非编码序列，例如一或两个另外的内含子或外显子。

    试图将人类L型信息素定位在染色体上，这揭示了将相应的基因定在位置15q22.3-23。对于M-SemaL的基因，相应地定位在位置9A3.3-B。

    作为内含子-外显子复合结构的结果，信息素mRNA初级转录物的剪接可能发生变化。其结果将导致产生信息素的不同剪接变体。这些剪接变体所翻译的蛋白质是本发明信息素的衍生物。它们的氨基酸序列，实质上其结构域结构相应于本发明描述的L型信息素，但是与后者相比较适当地方却被截短了。例如，可以形成完全或部分缺失跨膜结构域的剪接变体。含有一个不完全(或没有)跨膜结构域但是含有信号肽的信息素衍生物可能是具有分泌性的，并且通过这种方式对细胞外部，局部或其它相对较远的距离起作用，例如对其它细胞起作用。例如，另一个剪接变体可以不再含有编码信号肽的序列，同时，在适当时也没有编码代表潜在跨膜结构域的疏水氨基酸序列的序列。一种结果将是其信息素衍生物不能掺入到膜内，也不能进行分泌(除非通过分泌泡)。这样的信息素衍生物可以进入胞内过程，例如信号转导过程。这样就可能以相同的基本分子(L型信息素)和其衍生物(例如剪接变体)控制和/或协调各种胞内和胞外的过程。

    本发明一个特定的实施方案涉及从本发明L型信息素产生的信息素衍生物，但是它含有一个不完全的(或没有)跨膜结构域。

    本发明的另一个实施方案涉及从本发明L型信息素产生的信息素衍生物，但是它不含有信号肽。

    信号肽也可以在翻译后切除。这导致以截短的结构域结构形成了膜结合性(TM结构域)或分泌性(没有TM结构域的剪接变体)信息素衍生物。现在一种以这种方式经过翻译后加工的信息素衍生物仅仅含有Sema结构域。1g结构域。同时在适当时具有跨膜结构域。信号肽切割位点可以正好定位在信号肽的末端，但也可以例如定位在距离氨基端40至50个氨基酸或更远。

    ＂截短的＂(即包含更少的结构域)信息素L衍生物可以与其它不衍生自L型信息素的信息素的区别是，在存在的结构域中与L型信息素具有很大(＞90％)的氨基酸等同性或具有同一氨基酸序列。

    根据本发明的信息素也可以用其它方法经过翻译后修饰。例如，它们可以通过一次，两次，三次，四次，五次，六次，七次，八次，九次，十次或更多次的糖基化(N-和/或O-糖基化)。于是，信息素的氨基酸序列可能具有相等数量或更多的潜在糖基化位点的共有序列，优选的有5个这样的位点。本发明的一个实施方案涉及这样的信息素，其中糖基化位点位于与H-SemaL氨基酸序列(表4)相一致的位置105,157,258,330和602。

    此外，所说的信息素可以是它们磷酸化衍生物的形式。信息素可以是不同激酶的底物，例如氨基酸序列可能有蛋白激酶C，酪氨酸激酶和/或肌酸激酶的共有序列。此外，信息素的氨基酸序列可能有潜在的肉豆蔻酰化位点的共有序列。相应的信息素衍生物在这些位点上可以用肉豆蔻酸进行酯化。

    本发明的L型信息素和它们的衍生物可以是单体，二聚体和/或多聚体的形式。例如两个或更多信息素或他们的衍生物可以用分子间的二硫键连接在一起。形成分子内的二硫键也是可能的。

    本发明信息素的其它衍生物是融合蛋白。这一类型的融合蛋白一方面含有L型信息素或其部分，同时，另外还含有其它的肽或蛋白质或它的一部分。例如，肽或蛋白质或其部分可能是表位标记(例如His标记(6X组氨酸)，Myc标记。流感标记)，因而可以利用它们，例如，用于纯化融合蛋白，或它们也可以用于标记融合蛋白，例如GFP(绿色荧光蛋白质)。例如，L型信息素衍生物的例子在实施例的构建体中已经说明。在表7至15中可以发现这些构建体序列，并在适当时考虑质粒的注释来解释。

    本发明进一步涉及编码本发明L型信息素和/或它们的衍生物的核酸序列，优选DNA和RNA序列，例如相应的基因，mRNA的不同剪接变体，与此相应的cDNA，以及其衍生物(例如DNA或RNA的盐)。本发明的衍生物是经过如分子生物学方法修饰并且适应特定需要的序列或序列片段，如截短的基因或基因片段(例如启动子序列，终止子序列)，cDNA或它的嵌合体，用于表达和克隆的构建体和其盐。

    一个实施方案涉及L型信息素的基因组序列(基因)。本发明涉及内含子和外显子序列，以及基因调控序列，例如启动子,增强子和沉默子序列。

    这个实施方案一方面涉及H-SemaL的或其衍生物的基因。本发明一方面涉及包含表14中给出的核苷酸序列的基因。本发明进一步涉及包含以登记号AF030697收藏在GenBank数据库的核苷酸序列的基因。

    这一实施方案进一步涉及M-SemaL的基因和它的衍生物。

    本发明进一步涉及H-SemaL的cDNA或它的衍生物(例如cDNA片段)。一个特定的实施方案是根据表2中的核苷酸序列H-SemaL的cDNA。本发明进一步涉及以登记号AF030698收藏在GenBank数据库的H-SemaL的cDNA。本发明也涉及相应于这些cDNA的mRNA或它的片段。

    本发明进一步涉及M-SemaL的cDNA或它的衍生物(例如cDNA片段)。一个特定的实施方案是在表3中所显示的M-SemaL的部分cDNA序列，以及包含这部分cDNA序列的cDNA序列。另一个本发明的实施方案涉及以登记号AF030699收藏在GenBank数据库的M-SemaL的cDNA。本发明也涉及相应于这些cDNA的mRNA或它的部分。

    本发明也包含了等位基因和/或与上述的信息素序列相比仅仅轻微不同并编码同一或仅仅轻微修饰之蛋白质(氨基酸序列的不同少于或等于10％)的基因/mRNA/cDNA的个体表达形式(衍生物的进一步例子)。在实施例中所表明的构建体提供了其衍生物的进一步例子。在表7至14表中描述了这些构建体的序列，可考虑质粒的注释来解释。

    本发明进一步涉及包含编码L型信息素或其衍生物之DNA的质粒。例如，这种类型的质粒可能是适合于例如在大肠杆菌中DNA扩增的具有高复制率的质粒。

    特定实施方案为具有信息素或其片段或其衍生物的可以在原核和/或真核表达系统中表达的表达质粒。组成型表达质粒和那些包含诱导型启动子的质粒都是合适的。

    本发明也涉及制备编码L型信息素或其衍生物的核酸的方法。这些核酸(例如DNA或RNA)可以是合成得来的，例如用化学手段。尤其是，对这些核酸(例如相应的基因或cDNA或它的片段)来说利用特异性扩增引物和合适的起始原料作为模板通过PCR进行扩増是可能的。(例如来自合适的组织或基因组DNA的cDNA)。制备信息素LcDNA和H-SemaL基因的特定方法在实施例中描述。

    本发明也涉及制备L型信息素的方法。例如，信息素L或它的衍生物可以通过克隆相应的编码L型信息素或其衍生物的核酸序列进入表达载体，并且利用后者重组载体来转化合适细胞来制备。例如，利用原核或真核细胞是可能的。L型信息素或其衍生物也可以在合适时用化学手段制备。

    此外，L型信息素和其衍生物可以作为与例如蛋白质或肽的融合蛋白表达，所说的蛋白质或肽使得表达的融合蛋白可以被检测，例如作为与GFP(绿色荧光蛋白质)的融合蛋白。信息素也能作为具有一个，两个，三个或更多个表位标记的融合蛋白进行表达，例如具有Myc和/或His(6×组氨酸)和/或流感标记。相应地利用或制备包含编码这些融合蛋白的DNA序列的质粒是可能的。例如，编码信息素的序列可以克隆进含有编码GFP和/或表位标记(例如Myc标记。His标记。流感标记)的DNA序列的质粒。其特定的例子在表中列出的例子和序列中给出，在适当时参考关于质粒的注释。

    本发明进一步涉及抗体，具体地说。这些抗体结合或认别L型信息素，它的衍生物或部分。其可能的例子是可以在如小鼠，兔，山羊，绵羊，小鸡等等中产生的多克隆或单克隆抗体。

    本发明这种主题的特定实施方案包含直接针对如下表位的抗体，所述表位相应于表4中显示的H-SemaL序列的179至378或480至666位的氨基酸序列。本发明也涉及用于制备特异性抗-信息素L抗体的方法该制备中使用包含所说的表位的抗原。

    本发明也涉及制备抗体的方法，为了这一目的，优选地利用包含特有信鼠素表位和可以用于重组融合蛋白随后纯化的表位标记的融合蛋白。纯化的融合蛋白可以用于随后的免疫。为了制备重组融合蛋白，应制备相应的重组表达载体，然后用来转化合适的细胞。可以从这种细胞中分离出重组融合蛋白。例如，该方法可以是如同在实施例8中所描述的那样。

    这些抗体可以用来纯化相应的信息素，例如H-SemaL和它的衍生物，例如在亲和柱上纯化，或用于蛋白质的免疫检测，例如利用ELISA，蛋白质印迹法和/或免疫组织化学。这些抗体也可以用于分析H-SemaL的表达，例如在不同的细胞类型或细胞系中。

    H-SemaL的cDNA的长度有2636个核苷酸(表2)。H-SemaLcDNA的基因产物的长度有大约666个氨基酸(表4)，并且显示了典型的L型信息素结构域结构。基因产物具有一个N端信号肽(第1至44个氨基酸)，一个Sema结构域(第45个氨基酸至大约第545个氨基酸)，以及一个Ig(免疫球蛋白)结构域(大约第550至620个氨基酸)；同时，在C端具有一个代表潜在的跨膜结构域的疏水氨基酸序列。这个结构域结构对于信息素以前从来没有描述过。它涉及可能定位在细胞表面并且属于一个新的亚组的膜结合糖蛋白。以这以前未知的结构域结构为基础，现在可以将信息素划分成Ⅵ个子群：

    Ⅰ    分泌性，没有其它结构域(例如ORF-A49)

    Ⅱ lg 分泌性，(没有跨膜结构域)(例如AHV-Sema)

    Ⅲ lg,TM,CP具有胞质序列，膜锚着(例如CD100)

    Ⅳ Ig,(P),HPC具有亲水C端，分泌性(例如H-Sema-Ⅲ,M-SemaD，脑衰蛋白-l)

    Ⅴ Ig,TM,CP具有C端7血小板反应蛋白基元，膜锚着(例如M-SemaF和G)

    Ⅵ Ig,TM膜锚着(例如H-SemaL,M-SemaL)

    一个H-SemaL的非糖基化未加工形式的计算分子量大约是74.8kd(74823道尔顿)(利用肽-分选程序(Peptide-Sort),GCG程序包计算)。计算的等电点是pH=7.56。一个可能的信号肽切割位点定位在44和45个氨基酸之间(表3；以SignalP计算(http.//www.cbs.dtu.dk/services/Signal.P)，用于分析信号序列的基于神经网络的一种程序{Niesen H.等(1997)蛋白质工程10:1-6})，这给出了加工的蛋白质(没有信号肽)的分子量(MW)是70.3kd(70323道尔顿)和等电点是pH=7.01。

    实际上也同样阐明了基因组的结构。H-SemaL基因有13或15或更多个外显子，优选地14个外显子，以及有12或14个内含子，优选地13个内含子。由于这种外显子-内含子复合结构，不同的剪接变体是可能的。在RNA印迹法中发现了所转录的H-SemaL基因的mRNA，特别是在胎盘，性腺，胸腺和脾中。在神经组织或肌肉组织中还没有发现任何mRNA。有证据显示在内皮细胞中的表异性调节性表达。

    变异剪接也可以导致具有牵涉到胞内信号转导的胞质内序列的H-SemaL形式(例如，类似于CD100)。同样地，变异剪接导致分泌性H-SemaL形式(类似于病毒AHV-Sema)将也是可能的。

    借助于GCG程序包(遗传学计算机小组(1991)GCG包的程序手册，版本7,575Science Drive，威斯康星，美国53711),FASTA(Pearson和Lipman(Proc.Natl.Acad.Sci.85,2444-2448)和BLAST程序(Gish和States(1993)Nat.Genet.3,266-272；Altschul等(1990)J.Mel.Biol.215,403-410)完成了核苷酸和氨基酸的序列分析。这些程序也与GenBank(版本102.0)和Swiss Prot(版本34.0)一起用于序列比较。

    如H-SemaL的糖基化和肉豆蔻酰化翻译后修饰也同样是可能的。借助于Prosite程序(GCG程序包)在H-SemaL的氨基酸序列的位置105,157,258,330和602发现了N-糖基化位点的共有序列(表4中显示)，而肉豆蔻酰化位点的共有序列在位置114,139,271,498,499,502和654发现了(共有序列：G～(E,D,R,K,H,P,F,Y,W)x(S,T,A,G,C,N)～(P))。此外，H-SemaL的氨基酸序列含有几个不同激酶的潜在的磷酸化的共有序列。因此，可以认为H-SemaL可以是不同激酶的底物，例如肌酸激酶2，蛋白激酶C和酪氨酸激酶的磷酸化位点。

    推定肌酸激酶2的磷酸化位点(共有序列Ck2:(S,T)x2(D,E))(Prosite,GCG)在氨基酸序列的位置119,131,173,338,419和481。推定蛋白激酶C的磷酸化位点(共有序列PkC:(S,T)x(R,K))(Prosite,GCG)在氨基酸序列的位置107,115,190,296,350,431,524和576。推定酪氨酸激酶的磷酸化位点(共有序列：(R,K)x{2,3}(D,E){2,3}Y)(Prosite,GCG)在氨基酸序列的位置205。

    以氨基酸的单字母代码表明了所说的共有序列。

    整联蛋白的特征性＂RGD″基元(精氨酸-甘氨酸-天冬氨酸)位于位置267。糖基化位点在病毒AHV-Sema,H-SemaL和(就目前所知的)M-SemaL之间是高度保守的。

    H-SemaL的二-或多聚化是可能的，并且对于其它信息素(如CD100)已经描述过{Hall等(1996)}。同样地，CD100分子是150kd的膜锚着糖蛋白二聚体。然而，CD100与本发明的人类信息素(H-SemaL)不是密切相关的。

    M-SemaL的部分cDNA序列的长度是1195个核苷酸。这种编码蛋白质的序列具有394个氨基酸。这394个氨基酸相当于H-SemaL的1至396个氨基酸。在M-SemaL中的信号肽为从1至44个氨基酸(恰如在H-SemaL中)。Sema结构域从第45个氨基酸开始，并且延伸到末端或有可能超出表4中所显示的序列末端。

    利用Clustal W程序(Thompson等(1994))进行多重序列对比。利用人工SEAVIEW(Galtier等(1996)Comput.Appl Biosci 12,543-548)进一步进行序列对比。利用Clustal W(Thompson等(1994))来确定系统发育距离。

    已知蛋白质序列和所说的新的信息素序列的比较以及这些序列的系统发育分析显示了根据它们的系统发育关系可以对基因进行分类。当然一般说来，相应的信息素亚型的C端结构域结构是牵涉到决定相同子群的信息素比不同子群的信息素在系统发育上更密切的原因的一个因素。分离出信息素的物种也有影响，即相应的物种在系统发育上相互之间是否存在密切的关系。

    利用CLUSTALW程序{ThompsonJ.D等(1994)核酸研究22:4673-4680}对已知信息素氨基酸序列(全序列和/或部分序列，利用在表4和5中所显示的H-SemaL和M-SemaL的氨基酸序列和所有其它以所述登记号入库的序列或从这些序列中衍生的所编码的氨基酸序列)进行系统发育分析(比较图3)，显示出H-SemaL和M-SemaL的氨基酸序列相互之间在系统发育上非常密切，并且形成一个独立的系统发育群。反过来H-SemaL和M-SemaL与AHV-Sema和Vac-A39在系统发育上最密切。与任何其它以前所公开的信息素相比，它们相互之间明显地是更加密切相关的。这种分析也显示了其它信息素相互之间在系统发育上也密切相关，并且形成具有信息素的独立群。例如，具有分泌性的信息素(例如H-SemaⅢ,-Ⅳ,-V和-E)属于一个系统发育群。它们在其它物种中的同系物也属于这个亚族，而人类(跨膜)CD100与相应的小鼠同系物(M-SemaG2)和脑衰蛋白4一起属于一个系统发育群。

    关于完全的氨基酸序列，关于十分密切相关基因(例如，H-和M-SemaE或-Ⅲ/D)在系统发育群之内所观察到的同源性是大约在90％和80％之间的氨基酸等同性，而在低相关信息素基因的情况下不到40％。在Sema结构域之内，所观察的氨基酸等同性百分比稍高一点，并且由于它对整个蛋白质的氨基酸序列的高贡献率(蛋白质的50-80％属于Sema结构域)，这一点显著影响整个等同性。

    对于完全蛋白质来计算，H-SemaL与AHV-Sema有46％的同一性，但是如果只考虑Sema结构域本身，那么氨基酸的等同性是53％。例如，这高于相关的M-Sema-B-和-C(完全蛋白质37％的等同性，Sema结构域43％的等同性)，类似于M-SemaA和-E(完全蛋白质43％,Sema结构域53％)。在Sema结构域区域中部分M-SemaL序列(表6)和H-SemaL(表5)之间的氨基酸等同性是93％，那么可以假定涉及了相应的同源小鼠基因。

    与H-SemaL相比，在其它物种中相应于H-SemaL和M-SemaL的信息素在超过40％的Sema结构域之内可以具有氨基酸等同性。在密切相关的脊椎动物(哺乳动物，鸟)中，发现氨基酸等同性高于70％。

    所说的信息素属于一个与病毒的AHV-Sema具有比与以前所公开的人和鼠的信息素更大的氨基酸等同性的新的亚族，并且具有一个以前对于人类信素未公开过的C端结构。由于它们的结构域结构，通过是否属于亚组Ⅳ和/或与H-SemaL和M-SemaL是同一系统发育群，和/或对于完全氨基酸序列而言，与H-SemaL具有至少30至40％的氨基酸等同性，优选的是50至60％，特别优选的是70至80％，或具有更大的等同性，和/或对于Sema结构域而言，与H-SemaL具有至少70％的氨基酸等同性，优选的是大于80％，特别优选的是大于90％来识别这些新的信息素(亚族成员)。

    L型信息素也有一种不同类型的生化功能。这些信息素的一种新的功能是调节免疫系统。

    与H-SemaL最密切相关的是病毒AHV信息素(AHV-Sema)。后者具有相似大小，但是，与H-SemaL相对比，它没有任何跨膜结构域。在天然的宿主(蓝wildeest)中，病毒感染细胞大概以分泌AHV-Sema来阻止H-SemaL的等同受体(蓝wildebeest中的L型信息素)，并且这样躲开了受到免疫系统的攻击。也可以想象的是，对于免疫系统细胞来说。它的一个功能是作为排斥剂(化学排斥物)。

    一般地，新的L型信息素和其衍生物的生化功能将被认为是具有免疫调节和/或炎症调节功能。一方面，它们能够

    A)作为抑制免疫应答的分子，它们可能显示它们作为化学排斥物和/或免疫抑制剂对细胞的作用，局部地或远距离起作用，例如在细胞表面上作为跨膜蛋白质，例如若由于加工(例如蛋白水解酶)或变异剪接引起它们分泌，例如通过组织扩散。例如，这些新的L型信息素的表达(如在脉管内皮细胞的表面)可以阻止白细胞的吸附和迁移通过容器壁。新的信息素在维持屏障作用方面可能起着重要的作用，例如在特别＂重要的＂或暴露的器官中阻止感染，例如保持血-脑屏障，胎盘循环和/或其它免疫特权位置(例如胰岛)和/或预防自身免疫疾病。此外，新的信息素和/或它们的衍生物也可以在各种组织的排斥信号中涉及，例如对于免疫系统细胞(例如白细胞)，阻止防卫机制非故意的活化。

    B)此外，新的信息素和/或其衍生物可能具有附件分子功能。例如，在细胞表面上表达，作为防卫机制活化的一部分它们可以参予与免疫系统细胞的相互作用，例如在病毒感染的情况下。

    这揭示了新的L型信息素和其衍生物，以及编码这些蛋白质的核酸的几个可能用法。

    功能A)：这包含免疫抑制和/或抗炎原理：在器官移植，烧伤治疗，免疫治疗和基因治疗领域中有许多利用的潜在可能性。

    例如，借助于信息素-编码DNA或其衍生物，可以产生非人类转基因动物。对这些动物的一种可能应用是在器官移植的转基因模型中抑制移植排斥。例如，能够产生抑制排斥的转基因动物器官用于异种移植。例如，与其它转基因(例如，如DAF或CD59一类的补体调节剂)一起应该也是可能的。另一应用是产生非人类“剔除”(knock-out)动物，例如“剔除”小鼠(＂基因导向的实验室手则＂，Torres和Kiihn(1997)牛津大学大学出版社，ISBN0-19-963677-X)：例如，通过剔除小鼠M-SemaL基因以发现该基因的其它功能是可能的。如果小鼠没有信息素基因可以生存，那么它们也阐明了对于炎症疾病的潜在模型系统。如果M-SemaL对免疫调节来说是重要的，那么将要期待大量的这样的小鼠。此外，可以产生非人类knock-in动物(例如小鼠)。例如，这使得能够以通常的/修饰的H-SemaL或修饰M-SemaL(例如组成型和/或诱导型启动子控制下的新的信息素亚型的整合)来代替M-SemaL。例如，为了进一步寻找新的信息素的功能(例如人基因或这些基因衍生物的功能)，可以利用这种类型的动物，或用于确定和鉴定免疫调节剂。

    例如，利用编码L型信息素或其衍生物的核酸来产生如重组免疫抑制剂，其它可溶性蛋白质或从L型信息素氨基酸序列(例如H-SemaL或相应的核酸，如基因)衍生出来的肽。以一种类似的方法可能产生具有结构相似性的激动剂。这些免疫抑制剂或激动剂也可以用于自身免疫疾病和炎症疾病和/或器官移植。

    利用L型信息素的基因治疗，例如用编码H-SemaL或其衍生物的核酸，例如利用病毒或非病毒的方法。用于自身免疫疾病和炎症疾病器官转移和移植前/间/后以阻止移植排斥。

    特别地，使用新的信息素和/或编码这些信息素的核酸，以及其衍在物(特别是H-SemaL，编码H-SemaL的DNA，以及其衍生物)，用于药剂筛选(特别是确定和鉴定免疫调节剂)是可能的。

    功能B)：H-SemaL是在细胞表面表达并牵涉到与细胞(例如免疫系统的细胞)的相互作用的附件分子，例如在信号途径活化中作为附件分子。例如，病毒基因或病毒基因产物或其它病原基因(例如起源于微生物的)可以充当该附件分子的竞争性抑制剂。具有这种功能的新的信息素同样地用于器官移植，炎症治序，免疫治疗和/或基因治疗领域。

    例如，新的信息素可以用于拮抗剂或抑制剂的筛选。以这种方法鉴别的药剂可以用于例如阻断信息素受体。可溶性和/或分泌性H-SemaL拮抗剂或抑制剂例如可以是化学物质或新的信息素或其衍生物本身(例如适合阻断相应受体的其部分/截短形式。如没有膜结构域或作为Ig融合蛋白或从后者衍生的肽)。以这种方法鉴别的特异性拮抗剂和/或抑制剂例如可能具有竞争性作用，并且用于抑制排斥(例如在器官移植的转基因模型中)，以及用于自身免疫疾病，炎症和器官移植。编码新的信息素的核酸(例如DNA)或其借助于分子生物学方法产生的衍生物例如可能用于产生非人类转基因动物。在这些转基因动物中，H-SemaL的超量表达能导致提高对自身免疫疾病和/或炎症的易感性。于是这样的转基因动物适合筛选新的特异性免疫调节剂。

    同样地，这样的核酸可以用于产生非人类“剔除”动物，例如“剔除”小鼠，其中失去了小鼠M-SemaL基因。利用这样的“剔除”动物可以找到基因的进一步生化功能。如果没有M-SemaL基因的小鼠能够生存，那么它们也为炎症提供了潜在的模型系统。

    这种DNA同样可以用来产生非人类knock-in动物，例如小鼠。这使得可以用修饰M-SemaL基因/cDNA或任选修饰的(例如变异)另一物种的L型信息素基因/cDNA(例如H-SemaL)来代替M-SemaL基因。这样的转基因动物用来寻找本发明信息素的进一步功能。

    本发明也涉及L型信息素及其衍生物以及编码这些蛋白质的核酸(例如基因/cDNA和其衍生物)和/或借助于这些信息素鉴别的药剂在生产药物中的应用。例如，生产可以用于基因治疗以及包含L型信息素(例如H-SemaL)表达的激动剂和/或拮抗剂的药物是可能的。为此目的例如也使用病毒的和/或非病毒方法。这些药物例如可以用于自身免疫疾病和炎症，在移植之后和/或期间和/或之前，来阻止器官移植排斥。

    编码新的信息素的核酸(例如基因，cDNA以及其衍生物)在分子生物学中也可以作为工具试剂。

    此外，新的信息素，尤其是H-SemaL以及核酸(例如其基因/cDNA)可以用于筛选新的药剂。例如，修饰蛋白质和/或从H-SemaL和/或M-SemaL衍生的肽在功能化验上可以用来寻找相应的受体和/或它的拮抗剂或激动剂，例如利用H-SemaL和同系物的表达构建体。

    本发明也涉及L型信息素或编码L型信息素的核酸序列在鉴别药剂(尤其是免疫调节剂)的方法中的应用。

    本发明也涉及使用L型信息素或其衍生物或编码L型信息素的核酸序列或其衍生物鉴别药剂的方法，以鉴别药理活性剂，例如免疫调节剂。例如，本发明涉及这样的方法，其中，在特定条件下L型信息素与待测药剂一起培养，平行地，第二批培养中没有待测药剂但是其它条件都相同，然后确定待测药剂的抑制或激活作用。

    例如，本发明也涉及这样的鉴别药剂的方法，其中，编码L型信息素或其衍生物的核酸序列在有待测药剂存在下在特定条件下表达，并测定其表达程度。适当时也可能在这种方法中在相同的平行条件下但是包含不同量的待测药剂下进行两批或多批试验。

    例如，待测药剂能够阻止或激活转录和/或翻译。

    如同它的病毒同系物一样，L型信息素可以结合到新近描述的受体分子VESPR(Comeau等，(1998)免疫，卷8,473-482)上，并且，在单核细胞中推定可以造成对细胞粘附分子(如ICAM-1)和细胞因子(诸如白介素-6和白介素-8)的诱导，这可以导致其活化和细胞聚集。VESPR受体的表达模式显示了某些令人感兴趣的与H-SemaL的相似性，例如，胎盘中的强烈表达和脾组织的显著表达。plexin家族迄今未知的其它受体或其它受体的相互作用是可能的。它也能与自身或其它信息素-样分子相互作用。L型信息素的相互作用可能特别通过Sema结构域的C端区保守结构域来发生。

    关于质粒的注释：

    pMeIBacA(Invitrogen,De Schelp,NL)中的pMeIBacA-H-SemaL(6622bp)(SEQ ID NO.42)。核苷酸96-98ATG为起始密码子，核苷酸96-168为蜂毒肽信号序列，核苷酸168-173为BamHⅠ切割位点(PCR/克隆)，核苷酸171-1998为读框SEMA-L氨基酸42-649(没有自的信号序列和跨膜序列)，核苷酸1993-1998为EcoRⅠ切割位点(PCR/克隆)和核苷酸1992-1994为终止密码子

    质粒pCDNA3.1-H-SemaL-MychisA(7475bp)(SEQ ID NO.35)：核苷酸954-959为BamHⅠ切割位点(克隆)，核苷酸968-970为ATG SEMAL，核苷酸968-2965为读框SEMAL，核苷酸2963-2968为PmlⅠ切割位点，核苷酸2969-2974为HindⅢ切割位点，核苷酸2981-3013为Myc标记。核苷酸3026-3033为6xHis标商，核苷酸3034-3036为终止密码子

    质粒pCDNA3.1-H-SemaL-EGF P-MychisA(8192bp)(SEQ ID NO.36)：核苷酸954-959为BamHⅠ切割位点(克隆)，核苷酸968-970为ATG SEMA-L，核苷酸968-2965为读框SEMA-L，核苷酸2963-2965为一半PmlⅠ切割位点，核苷酸2966-3682为读框EGFP(克隆在PmlⅠ处)，核苷酸3683-3685为一半PmlⅠ切割位点，核苷酸3685-3691为HindⅢ，核苷酸3698-3730为Myc标记。核苷酸3743-3760为6xHis标记，以及核苷酸3761-3763为终止密码子

    载体pIND(Invitrogen,De Schelp,NL)中的质粒pIND-H-SemaL-EA(7108bp)(SEQ ID NO.38)：核苷酸为533-538 BamHⅠ切割位点(克隆)，核苷酸为546-548ATG SEMA-L，核苷酸546-为读框SEMA-L，核苷酸为2542-2547 PmlⅠ切割位点，核苷酸2548-2553为HindⅢ切割位点和核苷酸2563-2565为终止密码子。

    载体pIND(Invitrogen,De Schelp,NL)中的质粒pIND-H-SemaL-EE(全长7102bp)(SEQ ID号37)：核苷酸533-538为BamHⅠ切割位点(克隆)，核苷酸546-548为ATG SEMA-L,核苷酸546-为读框SEMA-L，核苷酸2542-2547为PmlⅠ切割位点，核苷酸2548-2553为HindⅢ切割位点，核苷酸2560-2592为Myc标记，核苷酸2605-2622为6xHis标记和核苷酸2623-2625为终止密码子。

    相当于pQE30-H-SemaLBH的载体pQE31(Qiagen,Hilden)中的质粒pQE30-H-SemaL-179-378.seq(4019bp)(SEQ ID号39)：核苷酸115-117为ATG，核苷酸127-144为6xHis标记，核苷酸145-750为BamHⅠ-HindⅢPCP片段SEMA-L氨基酸(aa)179-378和核苷酸758-760为终止密码子。

    载体pQE31(Qiagen,Hilden)中的质粒pQE31-H-SemaL-(SH(3999bp)(SEQ ID号40)：核苷酸115-117为ATG，核苷酸127-144为6xHis标记，核苷酸147-152为BamHⅠ位点，核苷酸159-729为Sacl-HindⅢ片段SEMA-L(C端)aa480-666和核苷酸734-736为终止密码子。

    实施例

    用于实施例的实验条件：

    使用的PCR程序：

    Taq52-60(Ampli-TaqR聚合酶，Perkin Elmer,Weil der Stadt，德国)

    96℃/60s                     1个循环

    96℃/15s-52℃/20s-70℃/60s   40个循环

    70℃/60s                     1个循环

    Taq60-30

    96℃/60s                     1个循环

    96℃/15s-60℃/20s-70℃/30s   35个循环

    70℃/60s                      1个循环

    Taq60-60

    96℃/60s                      1个循环

    96℃/15s-60℃/20s-70℃/60s    35个循环

    70℃/60s                      1个循环

    Taq62-40

    96℃/60s                      1个循环

    96℃/15s-62℃/20s-70/40s      35个循环

    70℃/60s                      1个循环

    用Taq聚合酶的PCR反应条件：

    50μl反应混合物中具有100-200ng模板，200μM dNTP,0.2-0.4μM每一引物，2.5U Ampli-TaqR,5μl10x供给的反应缓冲液

    使用的程序：1．XL62-6(加长模板PCR SystemR,Boehringer Mannheim，德国)94℃/60s                         1个循环94℃/15s-62℃/30s-68℃/6min      10个循环94℃/15s-62℃/30s-68℃/(6min+15s/个循环)25个循环68℃/7min                         1个循环2．XL62-12(加长模板PCR SystemR,Boehringer Mannheim，德国)94℃/60s                          1个循环94℃/15s-62℃/30s-68℃/12min      10个循环94℃/15s-62℃/30s-68℃/(12min+5s/个循环)25个循环68℃/7min                         1个循环

    用加长模板PCR系统的PCR反应条件

    50μl反应混合物中具有100-200ng模板，500μM dNTP,0.2-0.4μM每一引物，0.75μl酶混合物，5μl10x供给的No.2反应缓冲液。

    实施例1：

    从AHV-Sema序列开始(Ensser和Fleckenstein(1995)，普通病毒学杂志76:1063-1067)，进行PCR和RACE-PCR。用于这里的起始材料是来自胎盘组织的人cDNA，为进行RACE扩增其上已连接了衔接子(MarathonTM-cDNA扩增试剂盒，Clontech Laboratories GmbH,Tullastraβe4,69126Heidelberg，德国)。最初特异性引物(No.121234+No.121236，表6)用于扩增长度约为800bp(碱基对)的PCR片段(PCR程序：(Taq60-60))。克隆与测序该片段(Taq染料标记脱氧终止子测序试剂盒，应用生物系统。Foster City,CA,USA/Brunnenweg 13,Weil der Stadt)。PCR产物的测序揭示了与AHV-Sema的DNA序列具有高度同源性的序列，与两个EST序列相同。

    使用引物对(No.121237+No.121239，表6)鉴别出600bp的PCR片段。这表明它们是来自相同基因的DNA序列的克隆。

    实施例2：

    对实施例1的800bp PCR片段进行放射性标记(通过{Feinberg(1983)Anal.Biochem 132:6-13}的方法利用32P-α-dCTP进行随机引导)，并且作为多组织Northem印迹法(人类多组织Northem印迹法Ⅱ,Clontech,Heidelberg，德国)的探针，这包括来自脾、胸腺、前列腺、睾丸、卵巢、小肠、大肠和白细胞(PBL)的mRNA样品。这清楚地显示了在脾和性腺(睾丸，卵巢)中长度约为3.3kb的mRNA的表达，并且在胸腺和肠道中较弱。主印迹法杂交(许多组织RNA的点印迹法(Human RNA Master BlotTM,Clontech))确认了这一结果，并且在胎盘组织中也显示出强的表达。

    在42℃严格条件(5xSSC,50mM磷酸钠pH6.8,50％甲酰胺，100μg/ml酵母RNA)下杂交16小时。对印迹严格地冲洗(65℃,0.2×SSC,0.1％SDS)并且对Fuji BAS2000 PhosphoimagerTM暴光。

    实施例3：

    用这种探针筛选在噬菌体λgt10(人脾5’STRETCHPLUScDNA,Clontech)中克隆的来自人脾的cDNA文库，同时鉴别到-个λ克隆。插入这个克隆的1.6kb长的cDNA利用载体特异性引物No.207608+No.207609(表6)(位于EcoRⅠ克隆位点的侧面)由PCR(ExpandTM长模板PCR系统，Boehringer Mannhein GmbH,Sandhofer Straβe116,68305Mannhein)扩增，同时对产生的PCR片段进行测序。这个克隆包含cDNA的5’端，并且在3’方向也扩展已知的cDNA序列。从新的cDNA部分序列开始，设计出RACE-PCR的新引物(No.232643,No.232644,No.233084，表6)。利用一种改进的热循环技术(MJ-Research,Biozym DiagnostikGmbH,31833 Hess的PTC-200.Oldendorf)，其具有明显更有效的运行参数(加热和冷却速率)，利用引物No.232644和No.232643和AP1扩增3’RACE-PCR产物，并且将它克隆到载体pCR2.1(Invitrogen,De Schelp12,9351NVLeek，荷兰)中。对3’RACE-PCR产物进行测序，用这种方法确定cDNA的3’端。在5’方向的RACE扩增(引物No.31990和No.233084和AP1)以几个核苷酸延伸过cDNA5’端，并且确认在鉴别的λ克隆中发现的H-SemaL的氨基端。

    实施例4：

    从一短的鼠EST(登记号260340)开始，以从中产生的引物No.260813(表6)和H-SemaL特异性引物No.121234(表6)进行PCR(条件：Taq52-60)扩增长约840bp的鼠cDNA的DNA片段，随后克隆至载体pCR2.1中。包含该DNA片段的基因称为M-SemaL。产生的M-SemaL DNA片段用于从小鼠脾(小鼠脾5’STRETCHcDNA,Clontech)调查cDNA库，鉴定几个克隆是可能的。

    从鼠内皮cDNA用引物No.260812和No.260813进行PCR(Taq60-30)提供了长为244碱基对的PCR片段。PCR结果表明在鼠内皮细胞中有明显基线表达，用细胞因子干扰素-γ和脂多糖刺激后则下降。

    实施例5：

    采用荧光原位杂交(FISH)来调查染色体的定位情况。为了这一目的，从人血液样品和小鼠细胞系BINE4.8开始分别制备人和鼠的中期染色体(Keyna等(1995)免疫学杂志155,5536-5542)(Kraus等(1994)遗传学23,272-274)。利用RNase和胃蛋白酶处理载玻片(Liehr等(1995)应用细胞遗传学21,185-188)。对于杂交，利用120mg人切口平移信息素样品和200mg相应的小鼠样品。每种情况下，杂交在37℃,20μgSTD以及4.0μgCOT1-DNA存在下在湿室中进行3天。

    用50％甲酰胺/2xSSC冲洗载玻片(45℃下3次，每次5min)，然后，用2xSSC冲洗(37℃下3次，每次5min)，以及用FITC-亲和素系统(Liehr等(1995))检测生物素化样品。利用荧光显微镜测评载玻片。每个实验以双份进行，测定了25个中期/样品。表明H-SemaL位于染色体15q23上。定位在邻近染色体是Bardet-Biedls综合症和Tay-Sachs疾病的基因座(氨基已糖苷酶)。

    实施例6：

    H-SemaL基因的基因组内含子-外显子结构的大部分已被阐明。

    基因组DNA片段扩增从已从PHA-刺激外周淋巴细胞(血液)分离出来的250mg人基因组DNA开始。较短的片段利用Ampli TaqR(Perkin Elmer)进行扩增，较长的片段利用加长模板PCR SystemR(Boehringer Mannheim)进行扩增。

    到目前为止，通过PCR扩增来克隆和鉴别H-SemaL的几乎完全的基因组座是可能的。现已可能鉴别总共超过8888bp的基因组序列，从而基本阐明该基因的内含子-外显子结构。

    实施例7：

    表达克隆：

    因为不能从lambda-gt10cDNA库分离出来信息素基因完全克隆，同时也不能经PCR获得完全克隆，所以使用N端DNA片段的引物No.240655和No.121339以及C端DNA片段的引物No.240656(含有HindⅢ和PmeⅠ切割位点)和No.121234通过PCR(XL62-6)在2个重叠亚片段上扩增出cDNA的编码区。产生的DNA片段(亚片段)克隆到载体pCR21中。对两个亚片段完全测序，最后通过插入0.6kb C端Sstl-HindⅢ限制片段到质粒(包含N端DNA片段，并且已经用限制酶SstⅠ与HindⅢ酶切)中来制备完全的H-SemaL cDNA。利用EcoRⅠ切割位点(在pCR2.1中)和HindⅡ切割位点(在表6的引物No.240656中)从质粒pCR2.1-H-SemaL(表7中显示的序列，SEQ ID NO.34)上切除完全基因，并且连接到相应切割的组成性表达载体pCDNA3.1(-)MycHisA(Invitrogen)上。EcoRⅠ-ApaⅠ片段(没有Myc-His标记)从所产生的重组质粒pCDNA3.1(-)H-SemaL-MycHisA(表8中显示的序列)中切下，并且连接到诱导型载体pIND(同样已用EcoRⅠ-ApaⅠ酶切)(蜕皮激素诱导型哺乳动物表达系统，Invitrogen)上。重组质粒称为pIND-H-SemaLEA(表11中显示的序列)。将pCDNA3.1(-)H-SemaL-Myc-HisA(表9中显示的序列)的EcoRⅠ-Pmel片段(具有Myc-His标记)插人到EcoRⅠ-EcoRⅤ-切割的载体pIND中。重组质粒称为pIND-H-SemaL-EE(表10中显示的序列)。

    通过连接PCR-扩增EGFP读框(来自载体pEGFP-Cl(Clontech)，利用引物No.243068+No.243069,Taq52-60)到pCDNA3.1(-)H-SemaL-MycHisA的Pmel切割位点上制备具有增强绿色荧光蛋白质(EGFP)的H-SemaL融合基因，形成质粒pCDNA3.1(-)H-SemaL-EGFP-MycHisA(表9中显示的序列)。

    在表7至13表中用小写字母标出了H-SemaL的序列，其部分片段或衍生物，同时用大写字母标出了质粒序列。

    实施例8：

    为了制备H-SemaL-特异性抗体，将H-SemaL的cDNA片段整合进原核表达载体，并且在大肠杆菌中表达，以及纯化信息素衍生物。信息素衍生物作为具有His标记的融合蛋白来表达。因此，利用包含His标记序列并允许信息素cDNA片段整合入读框的载体。例如，N端6x组氨酸标记使用镍螯合亲和性层析纯化成为可能(Qiagen GmbH,Max-Volmer Straβe4,40724Hilden)：

    1．利用引物No.150788和No.150789通过PCR扩增编码179-378位氨基酸的部分H-SemaLcDNA，并将这条DNA片段连接到载体pQE30(已用限制性酶BamHⅠ和HindⅢ切割)(Qiagen)上(构建体pQE30-H-SemaL-BH(表12中显示的序列))。

    2．从质粒pCR2.1上用限制性酶SstⅠ与HindⅢ切下编码C端480-666位氨基酸的H-SemaLcDNA部分，并且连接到载体pQE3l(已用SstⅠ和HindⅢ切割)(Qiagen)上(构建体pQE31-H-SemaL-SH(表13中显示的序列)。

    通过DNA测序检查序列在正确读框中的正确整合。通过Ni2+亲和性层析纯化由N端6x组氨酸标记和部分信息素H-SemaL组成的融合蛋白。纯化的融合蛋白用于对各种动物(兔，小鸡，小鼠)的免疫。

    实施例9：

    各种细胞类型的FACS分析(图4和5)

    在FACS缓冲液(含有5％胎牛血清(FCS)和0.1％Na叠氮化钠的磷酸缓冲盐水(PBS)中冲洗细胞(大约0.2-0.5×106)，然后在每种情况中与抗血清(在冰上)培养1小时。用于对照(上层小鸡预免疫前血清(1∶5))和特异性检测(特异性染色)的初级抗体为H-SemaL-特异性小鸡抗血清(1∶50)。用通过镍螯合亲和性层析(如实施例8所描述的)纯化的蛋白质免疫小鸡产生含有抗H-SemaL氨基酸(Aa)179-378(具有N端His标记)抗体的特异性抗血清。所使用的次级抗体是来自兔的FITC-标记抗小鸡F(ab’)抗体(Dianova Jackson实验室，Order No.303-095-006，汉堡，德国)(1mg/ml)。FITC-标记的兔抗小鼠IgG用于CD100染色。次级抗体每种情况下在FACS缓冲液中以1∶50进行稀释。

    然后冲洗细胞，在PBS中进行重悬浮，并且在FACS中分析。利用FACS-跟踪仪(Becton-Dickinson)进行FACS分析。原理：单细胞悬浮液穿过一个测量通道，其中以488nm的激光光线照射这些细胞，从而激发荧光染料(FITC)。测量散射正向光线(正向散射，FSC：与细胞大小相关)，和其侧向光线(侧向散射，SSC：与颗粒量相关：不同细胞类型有差异)以及通道1的荧光(FL1)(FITC发射范围的波长，530nm处最大值)。以这种方法每次测量10,000件(细胸)。

    点印迹(图4a-k)(左图)：SSC对FSC(大小对颗粒量/散射)，右边窗口中分析了(界线内)相似大小和颗粒含量的(均一)细胞群。。右边窗口显示了FL1的强度(X轴)对事件数(Y轴)，也就是说频度分布。

    在每个这样的图中，对照血清的结果(不光滑曲线)叠加在特异性染色(光滑曲线)的结果上面。与对照相比较特异性染色的曲线的右移相当于H-SemaL在相应细胞中的表达。一种移出越大意味着更强的表达。

    用于FACS分析的细胞系：a)U937细胞系

    美国典型培养物保藏中心ATCC；ATCC号CRL-1593

    名称U-937

    组织：淋巴瘤；组织细胞；单细胞样

    物种：人；

    保藏者：H.Korenb)THP-1细胞系

    ATCC保藏号：TIE-202

    组织：单核细胞；急性单核细胞白血病

    物种：人

    保藏者：S.Tsuchiyac)K-562细胞系

    ATCC保藏号：CCL-243

    组织：慢性骨髓性白血病

    物种：人；

    保藏者：H.T.Holdend)L-428细胞系

    DSMZ-德意志微生物保藏中心，DSMZ No:ACCl97

    细胞类型：人Hodgkin淋巴瘤e)Jurkat细胞系

    DSMZ-德意志微生物保藏中心，DSMZ No:ACC282

    细胞类型：人T细胞白血病

    f)Daudi细胞系

    ATCC保藏号CCL-213

    组织：Burkitt淋巴瘤；B淋巴母细胞；B细胞

    物种：人；

    保藏者：G.Klein

    g)LCL细胞系EBV-转化的淋巴母细胞样B-细胞系。h)Jiyoye(P-2003)细胞系

    ATCC保藏号CCL-87组织：Burkitt淋巴瘤；B细胞，B淋巴细胞物种：人保藏者：W.Henlei)CBL-Mix57

    用重组体H.Saimiri(没有缺失的野生型)转化的人T-细胞系(从血液中分离）j)CBL-Mix59用H.Saimiri(ORF71缺失)转化的人T-细胞系(从血液中分离)。

    实施例10：蛋白质凝胶和蛋白质印迹法

    将可分泌的人SEMA-L(表4的氨基酸42-649(没有信号肽和跨膜结构域))克隆到质粒pMelBac-A(Invitrogen De Schelp,Leck，荷兰，Cv1950-20)中，这样就产生了质粒pMeIBacA-H-SemaL(长度6622bp)(图8)。H-SemaL衍生物在杆状病毒系统中表达(Bac-N-Blue,Invitrogen)。在从昆虫卵细胞Sf9(来自Spodopterafrugiperda)和High FiveTM(来自粉纹夜蛾U.S.Pat.No.5,300,435，从Invitrogen购得)中通过具有重组体嗜斑纯化的杆状病毒的感染产生的细胞系中进行表达。

    根据制造商的说明进行表达。

    然后在凝胶中对蛋白质进行分级分离，并用蛋白质印迹法检测H-SemaL衍生物。用H-SemaL-特异性小鸡抗血清进行检测(比较实施例8和图7)(稀释液1∶100)。根据制造商的说明利用抗-IgY-HRP偶联物(稀释液：1∶3000，来自驴；Dianova Jackson实验室)检测特异性小鸡抗体。

    实施例11:pMeIBacA-H-SEMAL的制备

    通过克隆适当的编码H-SemaL的氨基酸42-649的DNA片段到载体pMeIBacA(4.8kbInvitrogen)中来制备重组载体(pMeIBacA-H-SEMAL,6622bp)(比较pMeIBacA-H-SEMAL的注释)。通过BamHⅠ和EcoRⅠ，克隆发生在载体中的信号序列(“蜜蜂蜂毒肽信号序列”)之后的读框中。利用引物对h-sema-l杆状病毒5’和第h-sema-l杆状病毒3’，扩增相应的H-SemaLDNA片段。

    扩增(TaKaRa ExTa9标记聚合酶)和克隆的引物：用于没有信号序列的扩增并引入BamHⅠ切割位点的＂h-sema-l杆状病毒5’＂5’-CCGGATCCGCCCAGGGCCACCTAAGGAGCGG-3’(SEQ ID NO.43)，用于没有跨膜结构域的扩增并引入EcoRⅠ切割位点的＂h-sema-l杆状病毒3’＂5’-CTGAATTCAGGAGCCAGGGCACAGGCATG-3’(SEQ ID NO.44)。附图：

    图1:H-Sema-L的组织特异性表达

    A)多组织RNA印迹(Clontech,Heidelberg，德国)。从左至右的载样：每泳道20μg来自脾，胸腺，前列腺，睾丸。卵巢，小肠，大肠粘膜，外周(血液)白细胞的Poly-A-RNA。标记大小标准。

    在严格条件下，印迹与800碱基对长的H-SemaL探针进行杂交。

    图2:H-SemaLcDNA的克隆和编码序列H-SemaL(H-SemaL基因)的基因组结构的图示。

    上：EST序列的定位(登记号；EST序列的定位以与AHV-Sema序列相关的形式显示。

    下：扩增的PCR和RACE产物和与在完全H-SemaLcDNA中相关cDNA克隆的定位以及编码蛋白质的开放读框(ORF)。

    底部：在H-SemaL基因中与基因组序列相关的外显子的相对定位。用箭头表明了寡核苷酸引物的位置。

    图3：系统发育树：从列出的信息素序列的多重对比获得。信息素的系统发育关系在系统树中可以从它们的组群中推出。

    图4：在各种细胞系和各种细胞类型中的H-SemaL表达的FACS分析(比较实施例8)。

    图5：CD100和H-SemaL表达的比较分析(比较实施例9)。

    图6：在HiFive和Sf9细胞中可分泌的SEMA-L(H-SemaL)的表达(比较实施例10)。

    在杆状病毒系统(Bac-N-Blue,Invitrogen)中的pMelBac-A(Invitrogen)的aa 42-649

    用特异性小鸡抗血清1(1∶100)和抗-IgY-HRP偶联物(1∶3000，来自兔。Jackson Lab.)的检测

    1,4,6未感染的HiFive细胞(无血清)

    2,3,5,7,8以重组体杆状病毒感染的HiFive细胞(无血清)

    MRainbow分子量标志(AmershamRPN756)

    9,10感染的Sf9细胞(包含血清的介质)。

    图7：抗血清的特异性

    泳道1-3：小鸡1；泳道4-6：小鸡2

    泳道1和泳道4：免疫前血清

    泳道2和5：免疫60天的血清

    泳道4和6：免疫105天的血清

    用H-SemaL的179-378位氨基酸(具有氨基端His标记)进行免疫(比较实施例8，部分1)。

    图8：对pMeIBacA-H-SEMAL的质粒图谱的描绘。

    如实施例11的描述制备重组质粒。

    表1来自不同物种的信息素的不同亚型    名称    别名   物种                 参考文献H-SemaⅢ(H-SemaD)人Sec.(Kolodkin等，1993)CD-100人TM,IC；与CD45相连，在T细胞中表达(Hall等，1996)H-SemaⅤ(H-SemaA)人Sec.；基因座3p21.3(Sekido等，1996；Roche等，1996)H-SemaⅣ(H-Sema3F)人Sec.；基因座3p21.3(Xiang等，1996；Sekido等，1996)H-SemaE人Sec.；不同于M-Sema-E的3’端(提高读框对比)AB000220(Yamada1997未发表)H-SemaKKIAA0311人Sec.；(Nagase等，1997)H-SemaLSEMAL人TM,无IC本申请M-SemaA小鼠Sec.(Püschel等，1995)M-SemaB小鼠TM,IC(Püschel等，1995)M-SemaC小鼠TM,IC(Püschel等，1995)M-SemaDM-SemaⅢ小鼠Sec.(Messersmith等，1995；Püschel等，1995M-SemaE小鼠Sec,；5＇部分序列(Püschel等，1995)M-SemaF1M-SemaF小鼠TM,IC(Inagaki等，1995)M-SemaG2M-SemaG小鼠TM,IC；在淋巴细胞中表达，CD100的小鼠同系物(Furuyama等，1996)M-SemaF2M-SemaF小鼠TM,IC；凝血调节蛋白基元(Adams等，1996)M-SemaG1M-SemaG小鼠TM,IC；凝血调节蛋白基元(Adams等，1996)M-SemaH小鼠Sec.(Christensen1996未发表)Z80941M-SemaⅥa小鼠TM,IC(Zhou等，1997)M-SemaLSemal小鼠部分序列本申请脑衰蛋白-1小鸡Sec.(Luo等，1993)脑衰蛋白-2小鸡Sec.(Luo等，1995)脑衰蛋白-3小鸡Sec.(Luo等，1995)脑衰蛋白-4小鸡部分序列(Luo等，1995)脑衰蛋白-5小鸡Sec.(Lou等，1995) R-SemaⅢ大鼠Sec.(Giger等，1996)T-SemaⅠTribolumoonfusumTM,IC(Kolodkin等，1993)Ce-SemaⅠC.elegansTM,ICU15667(Roy1994未出版)G-SemaⅠFasciclin-Ⅳ蚱蜢TM,IC(Kolodkin等，1993)D-SemaⅠ果蝇属TM,IC(Kolodkin等，1993)D-SemaⅡ果蝇属Sec.(Kolodkin等，1993)AHV-SemaAHV-1Sec.(Ensser和Fleckenstein,1995)ORF-A39牛痘Sec.(Kolodkin等，1993)ORF-A39同系物天花Sec.；(Kolodkin等，1993)

    TM：跨膜区Sec：分泌性IC：推定的胞内胞浆序列基元表2：H-SemaL的cDNA序列(2636个核苷酸)(SEQ ID NO.:1)

    1     cggggccacg ggatgacgcc tcctccgccc ggacgtgccg cccccagcgc

    51    accgcgcgcc cgcgtccctg gcccgccggc tcggttgggg cttccgctgc

    101   ggctgcggct gctgctgctg ctctgggcgg ccgccgcctc cgcccagggc

    151   cacctaagga gcggaccccg catcttcgcc gtctggaaag gccatgtagg

    201   gcaggaccgg gtggactttg gccagactga gccgcacacg gtgcttttcc

    251   acgagccagg cagctcctct gtgtgggtgg gaggacgtgg caaggtctac

    301   ctctttgact tccccgaggg caagaacgca tctgtgcgca cggtgaatat

    351   cggctccaca aaggggtcct gtctggataa gcgggactgc gagaactaca

    401   tcactctcct ggagaggcgg agtgaggggc tgctggcctg tggcaccaac

    451   gcccggcacc ccagctgctg gaacctggtg aatggcactg tggtgccact

    501   tggcgagatg agaggctacg cccccttcag cccggacgag aactccctgg

    551   ttctgtttga aggggacgag gtgtattcca ccatccggaa gcaggaatac

    601   aatgggaaga tccctcggtt ccgccgcatc cggggcgaga gtgagctgta

    651   caccagtgat actgtcatgc agaacccaca gttcatcaaa gccaccatcg

    701   tgcaccaaga ccaggcttac gatgacaaga tctactactt cttccgagag

    751   gacaatcctg acaagaatcc tgaggctcct ctcaatgtgt cccgtgtggc

    801   ccagttgtgc aggggggacc agggtgggga aagttcactg tcagtctcca

    851   agtggaacac ttttctgaaa gccatgctgg tatgcagtga tgctgccacc

    901   aacaagaact tcaacaggct gcaagacgtc ttcctgctcc ctgaccccag

    951   cggccagtgg agggacacca gggtctatgg tgttttctcc aacccctgga

    1001  actactcagc cgtctgtgtg tattccctcg gtgacattga caaggtcttc

    1051  cgtacctcct cactcaaggg ctaccactca agccttccca acccgcggcc

    1101  tggcaagtgc ctcccagacc agcagccgat acccacagag accttccagg

    1151  tggctgaccg tcacccagag gtggcgcaga gggtggagcc catggggcct

    1201  ctgaagacgc cattgttcca ctctaaatac cactaccaga aagtggccgt

    1251  tcaccgcatg caagccagcc acggggagac ctttcatgtg ctttacctaa

    1301  ctacagacag gggcactatc cacaaggtgg tggaaccggg ggagcaggag

    1351  cacagcttcg ccttcaacat catggagatc cagcccttcc gccgcgcggc

    1401  tgccatccag accatgtcgc tggatgctga gcggaggaag ctgtatgtga

    1451  gctcccagtg ggaggtgagc caggtgcccc tggacctgtg tgaggtctat

    1501  ggcgggggct gccacggttg cctcatgtcc cgagacccct actgcggctg

    1551  ggaccagggc cgctgcatct ccatctacag ctccgaacgg tcagtgctgc

    1601  aatccattaa tccagccgag ccacacaagg agtgtcccaa ccccaaacca

    1651  gacaaggccc cactgcagaa ggtttccctg gccccaaact ctcgctacta

    1701  cctgagctgc cccatggaat cccgccacgc cacctactca tggcgccaca

    1751  aggagaacgt ggagcagagc tgcgaacctg gtcaccagag ccccaactgc

    1801  atcctgttca tcgagaacct cacggcgcag cagtacggcc actacttctg

    1851  cgaggcccag gagggctcct acttccgcga ggctcagcac tggcagctgc

    1901  tgcccgagga cggcatcatg gccgagcacc tgctgggtca tgcctgtgcc

    1951  ctggctgcct ccctctggct gggggtgctg cccacactca ctcttggctt

    2001  gctggtccac tagggcctcc cgaggctggg catgcctcag gcttctgcag

    2051  cccagggcac tagaacgtct cacactcaga gccggctggc ccgggagctc

    2101  cttgcctgcc acttcttcca ggggacagaa taacccagtg gaggatgcca

    2151  ggcctggaga cgtccagccg caggcggctg ctgggcccca ggtggcgcac

    2201  ggatggtgag gggctgagaa tgagggcacc gactgtgaag ctggggcatc

    2251  gatgacccaa gactttatct tctggaaaat atttttcaga ctcctcaaac

    2301  ttgactaaat gcagcgatgc tcccagccca agagcccatg ggtcggggag

    2351  tgggtttgga taggagagct gggactccat ctcgaccctg gggctgaggc

    2401  ctgagtcctt ctggactctt ggtacccaca ttgcctcctt cccctccctc

    2451  tctcatggct gggtggctgg tgttcctgaa gacccagggc taccctctgt

    2501  ccagccctgt cctctgcagc tccctctctg gtcctgggtc ccacaggaca

    2551  gccgccttgc atgtttattg aaggatgttt gctttccgga cggaaggacg

    2601  gaaaaagctc tgaaaaaaaa aaaaaaaaaa aaaaaa表3：M-SemaL的cDNA的核苷酸序列(部分，1195个核苷酸)(SEQ IDNO.:2)

    1     cggggctgcg ggatgacgcc tcctcctccc ggacgtgccg cccccagcgc

    51    accgcgcgcc cgcgtcctca gcctgccggc tcggttcggg ctcccgctgc

    101   ggctgcggct tctgctggtg ttctgggtgg ccgccgcctc cgcccaaggc

    151   cactcgagga gcggaccccg catctccgcc gtctggaaag ggcaggacca

    201   tgtggacttt agccagcctg agccacacac cgtgcttttc catgagccgg

    251   gcagcttctc tgtctgggtg ggtggacgtg gcaaggtcta ccacttcaac

    301   ttccccgagg gcaagaatgc ctctgtgcgc acggtgaaca tcggctccac

    351   aaaggggtcc tgtcaggaca aacaggactg tgggaattac atcactcttc

    401   tagaaaggcg gggtaatggg ctgctggtct gtggcaccaa tgcccggaag

    451   cccagctgct ggaacttggt gaatgacagt gtggtgatgt cacttggtga

    501   gatgaaaggc tatgccccct tcagcccgga tgagaactcc ctggttctgt

    551   ttgaaggaga tgaagtgtac tctaccatcc ggaagcagga atacaacggg

    601   aagatccctc ggtttcgacg cattcggggc gagagtgaac tgtacacaag

    651   tgatacagtc atgcagaacc cacagttcat caaggccacc attgtgcacc

    701   aagaccaagc ctatgatgat aagatctact acttcttccg agaagacaac

    751   cctgacaaga accccgaggc tcctctcaat gtgtcccgag tagcccagtt

    801   gtgcaggggg gaccagggtg gtgagagttc gttgtctgtc tccaagtgga

    851   acaccttcct gaaagccatg ttggtctgca gc gatgcagc caccaacagg

    901   aacttcaatc ggctgcaaga tgtcttcctg ctccctgacc ccagtggcca

    951   gtggagagat accagggtct atggcgtttt ctccaacccc tggaactact

    1001  cagctgtctg cgtgtattcg cttggtgaca ttgacagagt cttccgtacc

    1051  tcatcgctca aaggctacca catgggcctt tccaaccctc gacctggcat

    1101  gtgcctccca aaaaagcagc ccatacccac agaaaccttc caggtagctg

    1151  atagtcaccc agaggtggct cagagggtgg aacctatggg gcccc表4：H-SemaL的氨基酸序列(666个氨基酸)(SEQ ID NO.:3)1      MTPPPPGRAA PSAPRARVPG PPARLGLPLR LRLLLLLWAA AASAQGHLRS51     GPRIFAVWKG HVGQDRVDFG QTEPHTVLFH EPGSSSVWVG GRGKVYLFDF101    PEGKNASVRT VNIGSTKGSC LDKRDCENYI TLLERRSEGL LACGTNARHP151    SCWNLVNGTV VPLGEMRGYA PFSPDENSLV LFEGDEVYST IRKQEYNGKI201    PRFRRIRGES ELYTSDTVMQ NPQFIKATIV HQDQAYDDKI YYFFREDNPD251    KNPEAPLNVS RVAQLCRGDQ GGESSLSVSK WNTFLKAMLV CSDAATNKNF301    NRLQDVFLLP DPSGQWRDTR VYGVFSNPWN YSAVCVYSLG DIDKVFRTSS351    LKGYHSSLPN PRPGKCLPDQ QPIPTETFQV ADRHPEVAQR VEPMGPLKTP401    LFHSKYHYQK VAVHRMQASH GETFHVLYLT TDRGTIHKVV EPGEQEHSFA451    FNIMEIQPFR RAAAIQTMSL DAERRKLYVS SQWEVSQVPL DLCEVYGGGC501    HGCLMSRDPY CGWDQGRCIS IYSSERSVLQ SINPAEPHKE CPNPKPDKAP551    LQKVSLAPNS RYYLSCPMES RHATYSWRHK ENVEQSCEPG HQSPNCILFI601    ENLTAQQYGH YFCEAQEGSY FREAQHWQLL PEDGIMAEHL LGHACALAAS651    LWLGVLPTLTLGLLVH表5：M-SemaL的(部分)氨基酸序列(394个氨基酸，相应于H-SemaL的1-396位)(SEQ ID NO.:4)

    1      MTPPPPGRAA PSAPRARVLS LPARFGLPLR LRLLLVFWVA AASAQGHSRS

    51     GPRISAVWKG QDHVDFSQPE PHTVLFHEPG SFSVWVGGRG KVYHFNFPEG

    101    KNASVRTVNI GSTKGSCQDK QDCGNYITLL ERRGNGLLVC GTNARKPSCW

    151    NLVNDSVVMS LGEMKGYAPF SPDENSLVLF EGDEVYSTIR KQEYNGKIPR

    201    FRRIRGESEL YTSDTVMQNP QFIKATIVHQ DQAYDDKIYY FFREDNPDKN

    251    PEAPLNVSRV AQLCRGDQGG ESSLSVSKWN TFLKAMLVCS DAATNRNFNR

    301    LQDVFLLPDP SGQWRDTRVY GVFSNPWNYS AVCVYSLGDI DRVFRTSSLK

    351    GYHMGLSNPR PGMCLPKKQP IPTETFQVAD SHPEVAQRVE PMGP表6：合成寡核苷酸(Eurogentec,Seraing，比利时)引物的编号/名称                          引物(合成寡核苷酸)的核苷酸序列

    91506/AP2     actcactatagggctcgagcggc              (SEQ ID NO.:5)

    121234        agccgcacacggtgcttttc                 (SEQ ID NO.:6)

    121235/Est2   gcacagatgcgttcttgccc                 (SEQ ID NO.:7)

    121236/Est3   accatagaccctggtgtccc                 (SEQ ID NO.:8)

    121237/Est4   gcagtgatgctgccaccaac                 (SEQ ID NO.:9)

    121238        ccagaccatgtcgctggatg                 (SEQ ID NO.:10)

    121239/Est6   acatgaggcaaccgtggcag                 (SEQ ID NO.:11)

    131989/AP1    ccatcctaatacgactcactatagggc          (SEQ ID NO.:12)

    131990/Est7   aggtagaccttgccacgtcc                 (SEQ ID NO.:13)

    131991        gaacttcaacaggctgcaagacg              (SEQ ID NO.:14)

    131992        atgctgagcggaggaagctg                 (SEQ ID NO.:15)

    131993        ccgccatacacctcacacag                 (SEQ ID NO.:16)

    150788        ctggaagctttctgtgggtatcggctgc         (SEQ ID NO.:17)

    150789        tttggatccctggttctgtttgaag            (SEQ ID NO.:18)

    167579/cDNA   ttctagaattcagcggccgcttttttttttttttttttttttttttttttvn合成引物(SEQ ID NO.:19)

    168421        ggggaaagttcactgtcagtctccaag          (SEQ ID NO.:20)

    168422        gggaatacacacagacggctgagtag           (SEQ ID NO.:21)

    207608/            agcaagttcagcctggttaagt          (SEQ ID NO.:22)λgt10插入物的扩增

    207609/             ttatgagtatttcttccaggg          (SEQ ID NO.:23)λgt10插入物的扩增

    232643/Est13  ccattaatccagccgagccacacaag           (SEQ ID NO.:24)

    232644/Est14  catctacagctccgaacggtcagtg            (SEQ ID NO.:25)

    233084        cagcggaagccccaaccgag                 (SEQ ID NO.:26)

    240655/hs5    gggatgacgcctcctccgcccgg              (SEQ ID NO.:27)

    240656/hs3    aagcttcacgtggaccagcaagccaagagtg      (SEQ ID NO.:28)

    240657/hs3c   aagctttttccgtccttccgtccgg            (SEQ ID NO.:29)

    243068      atggtgagcaagggcgaggagctg  (SEQ ID NO.:30)

    243069      cttgtacagctcgtccatgccgag  (SEQ ID NO.:31)

    280812      GGGTGGTGAGAGTTCGTTGTCTGTC (SEQ ID NO.:32)

    260813      GAGCGATGAGGTACGGAAGACTCTG (SEQ ID NO.:33)表7：重组质粒pCR2.1-H-SemaL的核苷酸序列(SEQ ID NO.:34)  1  AGCGCCCAAT ACGCAAACCG CCTCTCCCCG CGCGTTGGCC GATTCATTAA 51  TGCAGCTGGC ACGACAGGTT TCCCGACTGG AAAGCGGGCA GTGAGCGCAA101  CGCAATTAAT GTGAGTTAGC TCACTCATTA GGCACCCCAG GCTTTACACT151  TTATGCTTCC GGCTCGTATG TTGTGTGGAA TTGTGAGCGG ATAACAATTT201  CACACAGGAA ACAGCTATGA CCATGATTAC GCCaagcttc acgtggacca251  gcaagccaag agtgagtgtg ggcagcaccc ccagccagag ggaggcagcc301  agggcacagg catgacccag caggtgctcg gccatgatgc cgtcctcggg351  cagcagctgc cagtgctgag cctcgcggaa gtaggagccc tcctgggcct401  cgcagaagta gtggccgtac tgctgcgccg tgaggttctc gatgaacagg451  atgcagttgg ggctctggtg accaggttcg cagctctgct ccacgttctc501  cttgtggcgc catgagtagg tggcgtggcg ggattccatg gggcagctca551  ggtagtagcg agagtttggg gccagggaaa ccttctgcag tggggccttg601  tctggtttgg ggttgggaca ctccttgtgt ggctcggctg gattaatgga651  ttgcagcact gaccgttcgg agctgtagat ggagatgcag cggccctggt701  cccagccgca gtaggggtct cgggacatga ggcaaccgtg gcagcccccg751  ccatagacct cacacaggtc caggggcacc tggctcacct cccactggga801  gctcacatac agcttcctcc gctcagcatc cagcgacatg gtctggatgg851  cagccgcgcg gcggaagggc tggatctcca tgatgttgaa ggcgaagctg901  tgctcctgct cccccggttc caccaccttg tggatagtgc ccctgtctgt951  agttaggtaa agcacatgaa aggtctcccc gtggctggct tgcatgcggt1001 gaacggccac tttctggtag tggtatttag agtggaacaa tggcgtcttc1051 agaggcccca tgggctccac cctctgcgcc acctctgggt gacggtcagc1101 cacctggaag gtctctgtgg gtatcggctg ctggtctggg aggcacttgc1151 caggccgcgg gttgggaagg cttgagtggt agcccttgag tgaggaggta1201 cggaagacct tgtcaatgtc accgagggaa tacacacaga cggctgagta1251 gttccagggg ttggagaaaa caccatagac cctggtgtcc ctccactggc1301 cgctggggtc agggagcagg aagacgtctt gcagcctgtt gaagttcttg1351 ttggtggcag catcactgca taccagcatg gctttcagaa aagtgttcca1401 cttggagact gacagtgaac tttccccacc ctggtccccc ctgcacaact1451 gggccacacg ggacacattg agaggagcct caggattctt gtcaggattg1501 tcctctcgga agaagtagta gatcttgtca tcgtaagcct ggtcttggtg1551 cacgatggtg gctttgatga actgtgggtt ctgcatgaca gtatcactgg1601 tgtacagctc actctcgccc cggatgcggc ggaaccgagg gatcttccca1651 ttgtattcct gcttccggat ggtggaatac acctcgtccc cttcaaacag1701 aaccagggag ttctcgtccg ggctgaaggg ggcgtagcct ctcatctcgc1751 caagtggcac cacagtgcca ttcaccaggt tccagcagct ggggtgccgg1801 gcgttggtgc cacaggccag cagcccctca ctccgcctct ccaggagagt1851 gatgtagttc tcgcagtccc gcttatccag acaggacccc tttgtggagc1901 cgatattcac cgtgcgcaca gatgcgttct tgccctcggg gaagtcaaag1951 aggtagacct tgccacgtcc tcccacccac acagaggagc tgcctggctc2001 gtggaaaagc accgtgtgcg gctcagtctg gccaaagtcc acccggtcct2051 gccctacatg gcctttccag acggcgaaga tgcggggtcc gctccttagg2101 tggccctggg cggaggcggc ggccgcccag agcagcagca gcagccgcag2151 ccgcagcgga agccccaacc gagccggcgg gccagggacg cgggcgcgcg2201 gtgcgctggg ggcggcacgt ccgggcggag gaggcgtcat cccaagccga2251 attcTGCAGA TATCCATCAC ACTGGCGGCC GCTCGAGCAT GCATCTAGAG2301 GGCCCAATTC GCCCTATAGT GAGTCGTATT ACAATTCACT GGCCGTCGTT2351 TTACAACGTC GTGACTGGGA AAACCCTGGC GTTACCCAAC TTAATCGCCT2401 TGCAGCACAT CCCCCTTTCG CCAGCTGGCG TAATAGCGAA GAGGCCCGCA2451 CCGATCGCCC TTCCCAACAG TTGCGCAGCC TGAATGGCGA ATGGGACGCG2501 CCCTGTAGCG GCGCATTAAG CGCGGCGGGT GTGGTGGTTA CGCGCAGCGT2551 GACCGCTACA CTTGCCAGCG CCCTAGCGCC CGCTCCTTTC GCTTTCTTCC2601 CTTCCTTTCT CGCCACGTTC GCCGGCTTTC CCCGTCAAGC TCTAAATCGG2651 GGGCTCCCTT TAGGGTTCCG ATTTAGAGCT TTACGGCACC TCGACCGCAA2701 AAAACTTGAT TTGGGTGATG GTTCACGTAG TGGGCCATCG CCCTGATAGA2751 CGGTTTTTCG CCCTTTGACG TTGGAGTCCA CGTTCTTTAA TAGTGGACTC2801 TTGTTCCAAA CTGGAACAAC ACTCAACCCT ATCGCGGTCT ATTCTTTTGA2851 TTTATAAGGG ATTTTGCCGA TTTCGGCCTA TTGGTTAAAA AATGAGCTGA2901 TTTAACAAAT TCAGGGCGCA AGGGCTGCTA AAGGAACCGG AACACGTAGA2951 AAGCCAGTCC GCAGAAACGG TGCTGACCCC GGATGAATGT CAGCTACTGG3001 GCTATCTGGA CAAGGGAAAA CGCAAGCGCA AAGAGAAAGC AGGTAGCTTG3051 CAGTGGGCTT ACATGGCGAT AGCTAGACTG GGCGGTTTTA TGGACAGCAA3101 GCGAACCGGA ATTGCCAGCT GGGGCGCCCT CTGGTAAGGT TGGGAAGCCC3151 TGCAAAGTAA ACTGGATGGC TTTCTTGCCG CCAAGGATCT GATGGCGCAG3201 GGGATCAAGA TCTGATCAAG AGACAGGATG AGGATCGTTT CGCATGATTG3251 AACAAGATGG ATTGCACGCA GGTTCTCCGG CCGCTTGGGT GGAGAGGCTA3301 TTCGGCTATG ACTGGGCACA ACAGACAATC GGCTGCTCTG ATGCCGCCGT3351 GTTCCGGCTG TCAGCGCAGG GGCGCCCGGT TCTTTTTGTC AAGACCGACC3401 TGTCCGGTGC CCTGAATGAA CTGCAGGACG AGGCAGCGCG GCTATCGTGG3451 CTGGCCACGA CGGGCGTTCC TTGCGCAGCT GTGCTCGACG TTGTCACTGA3501 AGCGGGAAGG GACTGGCTGC TATTGGGCGA AGTGCCGGGG CAGGATCTCC3551 TGTCATCTCG CCTTGCTCCT GCCGAGAAAG TATCCATCAT GGCTGATGCA3601 ATGCGGCGGC TGCATACGCT TGATCCGGCT ACCTGCCCAT TCGACCACCA3651 AGCGAAACAT CGCATCGAGC GAGCACGTAC TCGGATGGAA GCCGGTCTTG3701 TCGATCAGGA TGATCTGGAC GAAGAGCATC AGGGGCTCGC GCCAGCCGAA3751 CTGTTCGCCA GGCTCAAGGC GCGCATGCCC GACGGCGAGG ATCTCGTCGT3801 GATCCATGGC GATGCCTGCT TGCCGAATAT CATGGTGGAA AATGGCCGCT3851 TTTCTGGATT CAACGACTGT GGCCGGCTGG GTGTGGCGGA CCGCTATCAG3901 GACATAGCGT TGGATACCCG TGATATTGCT GAAGAGCTTG GCGGCGAATG3951 GGCTGACCGC TTCCTCGTGC TTTACGGTAT CGCCGCTCCC GATTCGCAGC4001 GCATCGCCTT CTATCGCCTT CTTGACGAGT TCTTCTGAAT TGAAAAAGGA4051 AGAGTATGAG TATTCAACAT TTCCGTGTCG CCCTTATTCC CTTTTTTGCG4101 GCATTTTGCC TTCCTGTTTT TGCTCACCCA GAAACGCTGG TGAAAGTAAA4151 AGATGCTGAA GATCAGTTGG GTGCACGAGT GGGTTACATC GAACTGGATC4201 TCAACAGCGG TAAGATCCTT GAGAGTTTTC GCCCCGAAGA ACGTTTTCCA4251 ATGATGAGCA CTTTTAAAGT TCTGCTATGT CATACACTAT TATCCCGTAT4301 TGACGCCGGG CAAGAGCAAC TCGGTCGCCG GGCGCGGTAT TCTCAGAATG4351 ACTTGGTTGA GTACTCACCA GTCACAGAAA AGCATCTTAC GGATGGCATG4401 ACAGTAAGAG AATTATGCAG TGCTGCCATA ACCATGAGTG ATAACACTGC4451 GGCCAACTTA CTTCTGACAA CGATCGGAGG ACCGAAGGAG CTAACCGCTT4501 TTTTGCACAA CATGGGGGAT CATGTAACTC GCCTTGATCG TTGGGAACCG4551 GAGCTGAATG AAGCCATACC AAACGACGAG AGTGACACCA CGATGCCTGT4601 AGCAATGCCA ACAACGTTGC GCAAACTATT AACTGGCGAA CTACTTACTC4651 TAGCTTCCCG GCAACAATTA ATAGACTGGA TGGAGGCGGA TAAAGTTGCA4701 GGACCACTTC TGCGCTCGGC CCTTCCGGCT GGCTGGTTTA TTGCTGATAA4751 ATCTGGAGCC GGTGAGCGTG GGTCTCGCGG TATCATTGCA GCACTGGGGC4801 CAGATGGTAA GCCCTCCCGT ATCGTAGTTA TCTACACGAC GGGGAGTCAG4851 GCAACTATGG ATGAACGAAA TAGACAGATC GCTGAGATAG GTGCCTCACT4901 GATTAAGCAT TGGTAACTGT CAGACCAAGT TTACTCATAT ATACTTTAGA4951 TTGATTTAAA ACTTCATTTT TAATTTAAAA GGATCTAGGT GAAGATCCTT5001 TTTGATAATC TCATGACCAA AATCCCTTAA CGTGAGTTTT CGTTCCACTG5051 AGCGTCAGAC CCCGTAGAAA AGATCAAAGG ATCTTCTTGA GATCCTTTTT5101 TTCTGCGCGT AATCTGCTGC TTGCAAACAA AAAAACCACC GCTACCAGCG5151 GTGGTTTGTT TGCCGGATCA AGAGCTACCA ACTCTTTTTC CGAAGGTAAC5201 TGGCTTCAGC AGAGCGCAGA TACCAAATAC TGTCCTTCTA GTGTAGCCGT5251 AGTTAGGCCA CCACTTCAAG AACTCTGTAG CACCGCCTAC ATACCTCGCT5301   CTGCTAATCC TGTTACCAGT GGCTGCTGCC AGTGGCGATA AGTCGTGTCT5351   TACCGGGTTG GACTCAAGAC GATAGTTACC GGATAAGGCG CAGCGGTCGG5401   GCTGAACGGG GGGTTCGTGC ACACAGCCCA GCTTGGAGCG AACGACCTAC5451   ACCGAACTGA GATACCTACA GCGTGAGCAT TGAGAAAGCG CCACGCTTCC5501   CGAAGGGAGA AAGGCGGACA GGTATCCGGT AAGCGGCAGG GTCGGAACAG5551   GAGAGCGCAC GAGGGAGCTT CCAGGGGGAA ACGCCTGGTA TCTTTATAGT5601   CCTGTCGGGT TTCGCCACCT CTGACTTGAG CGTCGATTTT TGTGATGCTC5651   GTCAGGGGGG CGGAGCCTAT GGAAAAACGC CAGCAACGCG GCCTTTTTAC5701   GGTTCCTGGC CTTTTGCTGG CCTTTTGCTC ACATGTTCTT TCCTGCGTTA5751   TCCCCTGATT CTGTGGATAA CCGTATTACC GCCTTTGAGT GAGCTGATAC5801   CGCTCGCCGC AGCCGAACGA CCGAGCGCAG CGAGTCAGTG AGCGAGGAAG5851   CGGAAG表8：重组表达质粒pCDNA3.1(-)H-SemaL-MycHisA的核苷酸序列(SED IDNO.:35)

      1  GACGGATCGG GAGATCTCCC GATCCCCTAT GGTCGACTCT CAGTACAATC

     51  TGCTCTGATG CCGCATAGTT AAGCCAGTAT CTGCTCCCTG CTTGTGTGTT

    101  GGAGGTCGCT GAGTAGTGCG CGAGCAAAAT TTAAGCTACA ACAAGGCAAG

    151  GCTTGACCGA CAATTGCATG AAGAATCTGC TTAGGGTTAG GCGTTTTGCG

    201  CTGCTTCGCG ATGTACGGGC CAGATATACG CGTTGACATT GATTATTGAC

    251  TAGTTATTAA TAGTAATCAA TTACGGGGTC ATTAGTTCAT AGCCCATATA

    301  TGGAGTTCCG CGTTACATAA CTTACGGTAA ATGGCCCGCC TGGCTGACCG

    351  CCCAACGACC CCCGCCCATT GACGTCAATA ATGACGTATG TTCCCATAGT

    401  AACGCCAATA GGGACTTTCC ATTGACGTCA ATGGGTGGAC TATTTACGGT

    451  AAACTGCCCA CTTGGCAGTA CATCAAGTGT ATCATATGCC AAGTACGCCC

    501  CCTATTGACG TCAATGACGG TAAATGGCCC GCCTGGCATT ATGCCCAGTA

    551  CATGACCTTA TGGGACTTTC CTACTTGGCA GTACATCTAC GTATTAGTCA

    601  TCGCTATTAC CATGGTGATG CGGTTTTGGC AGTACATCAA TGGGCGTGGA

    651  TAGCGGTTTG ACTCACGGGG ATTTCCAAGT CTCCACCCCA TTGACGTCAA

    701  TGGGAGTTTG TTTTGGCACC AAAATCAACG GGACTTTCCA AAATGTCGTA

    751  ACAACTCCGC CCCATTGACG CAAATGGGCG GTAGGCGTGT ACGGTGGGAG

    801  GTCTATATAA GCAGAGCTCT CTGGCTAACT AGAGAACCCA CTGCTTACTG

    851  GCTTATCGAA ATTAATACGA CTCACTATAG GGAGACCCAA GCTGGCTAGC

    901  GTTTAAACGG GCCCTCTAGA CTCGAGCGGC CGCCACTGTG CTGGATATCT

    951  GCAgaattcg gcttgggatg acgcctcctc cgcccggacg tgccgccccc

    1001 agcgcaccgc gcgcccgcgt ccctggcccg ccggctcggt tggggcttcc1051 gctgcggctg cggctgctgc tgctgctctg ggcggccgcc gcctccgccc1101 agggccacct aaggagcgga ccccgcatct tcgccgtctg gaaaggccat115t gtagggcagg accgggtgga ctttggccag actgagccgc acacggtgct1201 tttccacgag ccaggcagct cctctgtgtg ggtgggagga cgtggcaagg1251 tctacctctt tgacttcccc gagggcaaga acgcatctgt gcgcacggtg1301 aatatcggct ccacaaaggg gtcctgtctg gataagcggg actgcgagaa1351 ctacatcact ctcctggaga ggcggagtga ggggctgctg gcctgtggca1401 ccaacgcccg gcaccccagc tgctggaacc tggtgaatgg cactgtggtg1451 ccacttggcg agatgagagg ctacgccccc ttcagcccgg acgagaactc1501 cctggttctg tttgaagggg acgaggtgta ttccaccatc cggaagcagg1551 aatacaatgg gaagatccct cggttccgcc gcatccgggg cgagagtgag1601 ctgtacacca gtgatactgt catgcagaac ccacagttca tcaaagccac1651 catcgtgcac caagaccagg cttacgatga caagatctac tacttcttcc1701 gagaggacaa tcctgacaag aatcctgagg ctcctctcaa tgtgtcccgt1751 gtggcccagt tgtgcagggg ggaccagggt ggggaaagtt cactgtcagt1801 ctccaagtgg aacacttttc tgaaagccat gctggtatgc agtgatgctg1851 ccaccaacaa gaacttcaac aggctgcaag acgtcttcct gctccctgac1901 cccagcggcc agtggaggga caccagggtc tatggtgttt tctccaaccc1951 ctggaactac tcagccgtct gtgtgtattc cctcggtgac attgacaagg2001 tcttccgtac ctcctcactc aagggctacc actcaagcct tcccaacccg2051 cggcctggca agtgcctccc agaccagcag ccgataccca cagagacctt2101 ccaggtggct gaccgtcacc cagaggtggc gcagagggtg gagcccatgg2151 ggcctctgaa gacgccattg ttccactcta aataccacta ccagaaagtg2201 gccgttcacc gcatgcaagc cagccacggg gagacctttc atgtgcttta2251 cctaactaca gacaggggca ctatccacaa ggtggtggaa ccgggggagc2301 aggagcacag cttcgccttc aacatcatgg agatccagcc cttccgccgc2351 gcggctgcca tccagaccat gtcgctggat gctgagcgga ggaagctgta2401 tgtgagctcc cagtgggagg tgagccaggt gcccctggac ctgtgtgagg2451 tctatggcgg gggctgccac ggttgcctca tgtcccgaga cccctactgc2501 ggctgggacc agggccgctg catctccatc tacagctccg aacggtcagt2551 gctgcaatcc attaatccag ccgagccaca caaggagtgt cccaacccca2601 aaccagacaa ggccccactg cagaaggttt ccctggcccc aaactctcgc2651 tactacctga gctgccccat ggaatcccgc cacgccacct actcatggcg2701 ccacaaggag aacgtggagc agagctgcga acctggtcac cagagcccca2751 actgcatcct gttcatcgag aacctcacgg cgcagcagta cggccactac2801 ttctgcgagg cccaggaggg ctcctacttc cgcgaggctc agcactggca2851 gctgctgccc gaggacggca tcatggccga gcacctgctg ggtcatgcct2901 gtgccctggc tgcctccctc tggctggggg tgctgcccac actcactctt2951 ggcttgctgg tccacgtgaa gcttGGGCCC GAACAAAAAC TCATCTCAGA3001 AGAGGATCTG AATAGCGCCG TCGACCATCA TCATCATCAT CATTGAGTTT3051 AAACCGCTGA TCAGCCTCGA CTGTGCCTTC TAGTTGCCAG CCATCTGTTG3101 TTTGCCCCTC CCCCGTGCCT TCCTTGACCC TGGAAGGTGC CACTCCCACT3151 GTCCTTTCCT AATAAAATGA GGAAATTGCA TCGCATTGTC TGAGTAGGTG3201 TCATTCTATT CTGGGGGGTG GGGTGGGGCA GGACAGCAAG GGGGAGGATT3251 GGGAAGACAA TAGCAGGCAT GCTGGGGATG CGGTGGGCTC TATGGCTTCT3301 GAGGCGGAAA GAACCAGCTG GGGCTCTAGG GGGTATCCCC ACGCGCCCTG3351 TAGCGGCGCA TTAAGCGCGG CGGGTGTGGT GGTTACGCGC AGCGTGACCG3401 CTACACTTGC CAGCGCCCTA GCGCCCGCTC CTTTCGCTTT CTTCCCTTCC3451 TTTCTCGCCA CGTTCGCCGG CTTTCCCCGT CAAGCTCTAA ATCGGGGCAT3501 CCCTTTAGGG TTCCGATTTA GTGCTTTACG GCACCTCGAC CCCAAAAAAC3551 TTGATTAGGG TGATGGTTCA CGTAGTGGGC CATCGCCCTG ATAGACGGTT3601 TTTCGCCCTT TGACGTTGGA GTCCACGTTC TTTAATAGTG GACTCTTGTT3651 CCAAACTGGA ACAACACTCA ACCCTATCTC GGTCTATTCT TTTGATTTAT3701 AAGGGATTTT GGGGATTTCG GCCTATTGGT TAAAAAATGA GCTGATTTAA3751 CAAAAATTTA ACGCGAATTA ATTCTGTGGA ATGTGTGTCA GTTAGGGTGT3801 GGAAAGTCCC CAGGCTCCCC AGGCAGGCAG AAGTATGCAA AGCATGCATC3851 TCAATTAGTC AGCAACCAGG TGTGGAAAGT CCCCAGGCTC CCCAGCAGGC3901 AGAAGTATGC AAAGCATGCA TCTCAATTAG TCAGCAACCA TAGTCCCGCC3951 CCTAACTCCG CCCATCCCGC CCCTAACTCC GCCCAGTTCC GCCCATTCTC4001 CGCCCCATGG CTGACTAATT TTTTTTATTT ATGCAGAGGC CGAGGCCGCC4051 TCTGCCTCTG AGCTATTCCA GAAGTAGTGA GGAGGCTTTT TTGGAGGCCT4101 AGGCTTTTGC AAAAAGCTCC CGGGAGCTTG TATATCCATT TTCGGATCTG4151 ATCAAGAGAC AGGATGAGGA TCGTTTCGCA TGATTGAACA AGATGGATTG4201 CACGCAGGTT CTCCGGCCGC TTGGGTGGAG AGGCTATTCG GCTATGACTG4251 GGCACAACAG ACAATCGGCT GCTCTGATGC CGCCGTGTTC CGGCTGTCAG4301 CGCAGGGGCG CCCGGTTCTT TTTGTCAAGA CCGACCTGTC CGGTGCCCTG4351 AATGAACTGC AGGACGAGGC AGCGCGGCTA TCGTGGCTGG CCACGACGGG4401 CGTTCCTTGC GCAGCTGTGC TCGACGTTGT CACTGAAGCG GGAAGGGACT4451 GGCTGCTATT GGGCGAAGTG CCGGGGCAGG ATCTCCTGTC ATCTCACCTT4501 GCTCCTGCCG AGAAAGTATC CATCATGGCT GATGCAATGC GGCGGCTGCA4551 TACGCTTGAT CCGGCTACCT GCCCATTCGA CCACCAAGCG AAACATCGCA4601 TCGAGCGAGC ACGTACTCGG ATGGAAGCCG GTCTTGTCGA TCAGGATGAT4651 CTGGACGAAG AGCATCAGGG GCTCGCGCCA GCCGAACTGT TCGCCAGGCT4701 CAAGGCGCGC ATGCCCGACG GCGAGGATCT CGTCGTGACC CATGGCGATG4751 CCTGCTTGCC GAATATCATG GTGGAAAATG GCCGCTTTTC TGGATTCATC4801 GACTGTGGCC GGCTGGGTGT GGCGGACCGC TATCAGGACA TAGCGTTGGC4851   TACCCGTGAT ATTGCTGAAG AGCTTGGCGG CGAATGGGCT GACCGCTTCC4901   TCGTGCTTTA CGGTATCGCC GCTCCCGATT CGCAGCGCAT CGCCTTCTAT4951   CGCCTTCTTG ACGAGTTCTT CTGAGCGGGA CTCTGGGGTT CGAAATGACC5001   GACCAAGCGA CGCCCAACCT GCCATCACGA GATTTCGATT CCACCGCCGC5051   CTTCTATGAA AGGTTGGGCT TCGGAATCGT TTTCCGGGAC GCCGGCTGGA5101   TGATCCTCCA GCGCGGGGAT CTCATGCTGG AGTTCTTCGC CCACCCCAAC5151   TTGTTTATTG CAGCTTATAA TGGTTACAAA TAAAGCAATA GCATCACAAA5201   TTTCACAAAT AAAGCATTTT TTTCACTGCA TTCTAGTTGT GGTTTGTCCA5251   AACTCATCAA TGTATCTTAT CATGTCTGTA TACCGTCGAC CTCTAGCTAG5301   AGCTTGGCGT AATCATGGTC ATAGCTGTTT CCTGTGTGAA ATTGTTATCC5351   GCTCACAATT CCACACAACA TACGAGCCGG AAGCATAAAG TGTAAAGCCT5401   GGGGTGCCTA ATGAGTGAGC TAACTCACAT TAATTGCGTT GCGCTCACTG5451   CCCGCTTTCC AGTCGGGAAA CCTGTCGTGC CAGCTGCATT AATGAATCGG5501   CCAACGCGCG GGGAGAGGCG GTTTGCGTAT TGGGCGCTCT TCCGCTTCCT5551   CGCTCACTGA CTCGCTGCGC TCGGTCGTTC GGCTGCGGCG AGCGGTATCA5601   GCTCACTCAA AGGCGGTAAT ACGGTTATCC ACAGAATCAG GGGATAACGC5651   AGGAAAGAAC ATGTGAGCAA AAGGCCAGCA AAAGGCCAGG AACCGTAAAA5701   AGGCCGCGTT GCTGGCGTTT TTCCATAGGC TCCGCCCCCC TGACGAGCAT5751   CACAAAAATC GACGCTCAAG TCAGAGGTGG CGAAACCCGA CAGGACTATA5801   AAGATACCAG GCGTTTCCCC CTGGAAGCTC CCTCGTGCGC TCTCCTGTTC5851   CGACCCTGCC GCTTACCGGA TACCTGTCCG CCTTTCTCCC TTCGGGAAGC5901   GTGGCGCTTT CTCAATGCTC ACGCTGTAGG TATCTCAGTT CGGTGTAGGT5951   CGTTCGCTCC AAGCTGGGCT GTGTGCACGA ACCCCCCGTT CAGCCCGACC6001   GCTGCGCCTT ATCCGGTAAC TATCGTCTTG AGTCCAACCC GGTAAGACAC6051   GACTTATCGC CACTGGCAGC AGCCACTGGT AACAGGATTA GCAGAGCGAG6101   GTATGTAGGC GGTGCTACAG AGTTCTTGAA GTGGTGGCCT AACTACGGCT6151   ACACTAGAAG GACAGTATTT GGTATCTGCG CTCTGCTGAA GCCAGTTAcc6201   TTCGGAAAAA GAGTTGGTAG CTCTTGATCC GGCAAACAAA CCACCGCTGG6251   TAGCGGTGGT TTTTTTGTTT GCAAGCAGCA GATTACGCGC AGAAAAAAAG6301   GATCTCAAGA AGATCCTTTG ATCTTTTCTA CGGGGTCTGA CGCTCAGTGG6351   AACGAAAACT CACGTTAAGG GATTTTGGTC ATGAGATTAT CAAAAAGGAT6401   CTTCACCTAG ATCCTTTTAA ATTAAAAATG AAGTTTTAAA TCAATCTAAA6451   GTATATATGA GTAAACTTGG TCTGACAGTT ACCAATGCTT AATCAGTGAG6501   GCACCTATCT CAGCGATCTG TCTATTTCGT TCATCCATAG TTGCCTGACT6551   CCCCGTCGTG TAGATAACTA CGATACGGGA GGGCTTACCA TCTGGCCCCA6601   GTGCTGCAAT GATACCGCGA GACCCACGCT CACCGGCTCC AGATTTATCA6651   GCAATAAACC AGCCAGCCGG AAGGGCCGAG CGCAGAAGTG GTCCTGCAAC6701   TTTATCCGCC TCCATCCAGT CTATTAATTG TTGCCGGGAA GCTAGAGTAA

    6751   GTAGTTCGCC AGTTAATAGT TTGCGCAACG TTGTTGCCAT TGCTACAGGC

    6801   ATCGTGGTGT CACGCTCGTC GTTTGGTATG GCTTCATTCA GCTCCGGTTC

    6851   CCAACGATCA AGGCGAGTTA CATGATCCCC CATGTTGTGC AAAAAAGCGG

    6901   TTAGCTCCTT CGGTCCTCCG ATCGTTGTCA GAAGTAAGTT GGCCGCAGTG

    6951   TTATCACTCA TGGTTATGGC AGCACTGCAT AATTCTCTTA CTGTCATGCC

    7001   ATCCGTAAGA TGCTTTTCTG TGACTGGTGA GTACTCAACC AAGTCATTCT

    7051   GAGAATAGTG TATGCGGCGA CCGAGTTGCT CTTGCCCGGC GTCAATACGG

    7101   GATAATACCG CGCCACATAG CAGAACTTTA AAAGTGCTCA TCATTGGAAA

    7151   ACGTTCTTCG GGGCGAAAAC TCTCAAGGAT CTTACCGCTG TTGAGATCCA

    7201   GTTCGATGTA ACCCACTCGT GCACCCAACT GATCTTCAGC ATCTTTTACT

    7251   TTCACCAGCG TTTCTGGGTG AGCAAAAACA GGAAGGCAAA ATGCCGCAAA

    7301   AAAGGGAATA AGGGCGACAC GGAAATGTTG AATACTCATA CTCTTCCTTT

    7351   TTCAATATTA TTGAAGCATT TATCAGGGTT ATTGTCTCAT GAGCGGATAC

    7401   ATATTTGAAT GTATTTAGAA AAATAAACAA ATAGGGGTTC CGCGCACATT

    7451   TCCCCGAAAA GTGCCACCTG ACGTC表9：重组质粒pcDA3.1-SemaL-EGFP-MychisA的核苷酸序列(SEQ IDNO.:36)

      1   GACGGATCGG GAGATCTCCC GATCCCCTAT GGTCGACTCT CAGTACAATC

     51   TGCTCTGATG CCGCATAGTT AAGCCAGTAT CTGCTCCCTG CTTGTGTGTT

    101   GGAGGTCGCT GAGTAGTGCG CGAGCAAAAT TTAAGCTACA ACAAGGCAAG

    151   GCTTGACCGA CAATTGCATG AAGAATCTGC TTAGGGTTAG GCGTTTTGCG

    201   CTGCTTCGCG ATGTACGGGC CAGATATACG CGTTGACATT GATTATTGAC

    251   TAGTTATTAA TAGTAATCAA TTACGGGGTC ATTAGTTCAT AGCCCATATA

    301   TGGAGTTCCG CGTTACATAA CTTACGGTAA ATGGCCCGCC TGGCTGACCG

    351   CCCAACGACC CCCGCCCATT GACGTCAATA ATGACGTATG TTCCCATAGT

    401   AACGCCAATA GGGACTTTCC ATTGACGTCA ATGGGTGGAC TATTTACGGT

    451   AAACTGCCCA CTTGGCAGTA CATCAAGTGT ATCATATGCC AAGTACGCCC

    501   CCTATTGACG TCAATGACGG TAAATGGCCC GCCTGGCATT ATGCCCAGTA

    551   CATGACCTTA TGGGACTTTC CTACTTGGCA GTACATCTAC GTATTAGTCA

    601   TCGCTATTAC CATGGTGATG CGGTTTTGGC AGTACATCAA TGGGCGTGGA

    651   TAGCGGTTTG ACTCACGGGG ATTTCCAAGT CTCCACCCCA TTGACGTCAA

    701   TGGGAGTTTG TTTTGGCACC AAAATCAACG GGACTTTCCA AAATGTCGTA

    751   ACAACTCCGC CCCATTGACG CAAATGGGCG GTAGGCGTGT ACGGTGGGAG

    801   GTCTATATAA GCAGAGCTCT CTGGCTAACT AGAGAACCCA CTGCTTACTG

    851   GCTTATCGAA ATTAATACGA CTCACTATAG GGAGACCCAA GCTGGCTAGC

    901   GTTTAAACGG GCCCTCTAGA CTCGAGCGGC CGCCACTGTG CTGGATATCT 951 GCAgaattcg gcttgggatg acgcctcctc cgcccggacg tgccgccccc1001 agcgcaccgc gcgcccgcgt ccctggcccg ccggctcggt tggggcttcc1051 gctgcggctg cggctgctgc tgctgctctg ggcggccgcc gcctccgccc1101 agggccacct aaggagcgga ccccgcatct tcgccgtctg gaaaggccat1151 gtagggcagg accgggtgga ctttggccag actgagccgc acacggtgct1201 tttccacgag ccaggcagct cctctgtgtg ggtgggagga cgtggcaagg1251 tctacctctt tgacttcccc gagggcaaga acgcatctgt gcgcacggtg1301 aatatcggct ccacaaaggg gtcctgtctg gataagcggg actgcgagaa1351 ctacatcact ctcctggaga ggcggagtga ggggctgctg gcctgtggca1401 ccaacgcccg gcaccccagc tgctggaacc tggtgaatgg cactgtggtg1451 ccacttggcg agatgagagg ctacgccccc ttcagcccgg acgagaactc1501 cctggttctg tttgaagggg acgaggtgta ttccaccatc cggaagcagg1551 aatacaatgg gaagatccct cggttccgcc gcatccgggg cgagagtgag1601 ctgtacacca gtgatactgt catgcagaac ccacagttca tcaaagccac1651 catcgtgcac caagaccagg cttacgatga caagatctac tacttcttcc1701 gagaggacaa tcctgacaag aatcctgagg ctcctctcaa tgtgtcccgt1751 gtggcccagt tgtgcagggg ggaccagggt ggggaaagtt cactgtcagt1801 ctccaagtgg aacacttttc tgaaagccat gctggtatgc agtgatgctg1851 ccaccaacaa gaacttcaac aggctgcaag acgtcttcct gctccctgac1901 cccagcggcc agtggaggga caccagggtc tatggtgttt tctccaaccc1951 ctggaactac tcagccgtct gtgtgtattc cctcggtgac attgacaagg2001 tcttccgtac ctcctcactc aagggctacc actcaagcct tcccaacccg2051 cggcctggca agtgcctccc agaccagcag ccgataccca cagagacctt2101 ccaggtggct gaccgtcacc cagaggtggc gcagagggtg gagcccatgg2151 ggcctctgaa gacgccattg ttccactcta aataccacta ccagaaagtg2201 gccgttcacc gcatgcaagc cagccacggg gagacctttc atgtgcttta2251 cctaactaca gacaggggca ctatccacaa ggtggtggaa ccgggggagc2301 aggagcacag cttcgccttc aacatcatgg agatccagcc cttccgccgc2351 gcggctgcca tccagaccat gtcgctggat gctgagcgga ggaagctgta2401 tgtgagctcc cagtgggagg tgagccaggt gcccctggac ctgtgtgagg2451 tctatggcgg gggctgccac ggttgcctca tgtcccgaga cccctactgc2501 ggctgggacc agggccgctg catctccatc tacagctccg aacggtcagt2551 gctgcaatcc attaatccag ccgagccaca caaggagtgt cccaacccca2601 aaccagacaa ggccccactg cagaaggttt ccctggcccc aaactctcgc2651 tactacctga gctgccccat ggaatcccgc cacgccacct actcatggcg2701 ccacaaggag aacgtggagc agagctgcga acctggtcac cagagcccca2751 actgcatcct gttcatcgag aacctcacgg cgcagcagta cggccactac2801 ttctgcgagg cccaggaggg ctcctacttc cgcgaggctc agcactggca2851 gctgctgccc gaggacggca tcatggccga gcacctgctg ggtcatgcct2901 gtgccctggc tgcctccctc tggctggggg tgctgcccac actcactctt2951 ggcttgctgg tccacATGGT GAGCAAGGGC GAGGAGCTGT TCACCGGGGT3001 GGTGCCCATC CTGGTCGAGC TGGACGGCGA CGTAAACGGC CACAAGTTCA3051 GCGTGTCCGG CGAGGGCGAG GGCGATGCCA CCTACGGCAA GCTGACCCTG3101 AAGTTCATCT GCACCACCGG CAAGCTGCCC GTGCCCTGGC CCACCCTCGT3151 GACCACCCTG ACCTACGGCG TGCAGTGCTT CAGCCGCTAC CCCGACCACA3201 TGAAGCAGCA CGACTTCTTC AAGTCCGCCA TGCCCGAAGG CTACGTCCAG3251 GAGCGCACCA TCTTCTTCAA GGACGACGGC AACTACAAGA CCCGCGCCGA3301 GGTGAAGTTC GAGGGCGACA CCCTGGTGAA CCGCATCGAG CTGAAGGGCA3351 TCGACTTCAA GGAGGACGGC AACATCCTGG GGCACAAGCT GGAGTACAAC3401 TACAACAGCC ACAACGTCTA TATCATGGCC GACAAGCAGA AGAACGGCAT3451 CAAGGTGAAC TTCAAGATCC GCCACAACAT CGAGGACGGC AGCGTGCAGC3501 TCGCCGACCA CTACCAGCAG AACACCCCCA TCGGCGACGG CCCCGTGCTG3551 CTGCCCGACA ACCACTACCT GAGCACCCAG TCCGCCCTGA GCAAAGACCC3601 CAACGAGAAG CGCGATCACA TGGTCCTGCT GGAGTTCGTG ACCGCCGCCG3651 GGATCACTCT CGGCATGGAC GAGCTGTACA Aggtgaagct tGGGCCCGAA3701 CAAAAACTCA TCTCAGAAGA GGATCTGAAT AGCGCCGTCG ACCATCATCA3751 TCATCATCAT TGAGTTTAAA CCGCTGATCA GCCTCGACTG TGCCTTCTAG3801 TTGCCAGCCA TCTGTTGTTT GCCCCTCCCC CGTGCCTTCC TTGACCCTGG3851 AAGGTGCCAC TCCCACTGTC CTTTCCTAAT AAAATGAGGA AATTGCATCG3901 CATTGTCTGA GTAGGTGTCA TTCTATTCTG GGGGGTGGGG TGGGGCAGGA3951 CAGCAAGGGG GAGGATTGGG AAGACAATAG CAGGCATGCT GGGGATGCGG4001 TGGGCTCTAT GGCTTCTGAG GCGGAAAGAA CCAGCTGGGG CTCTAGGGGG4051 TATCCCCACG CGCCCTGTAG CGGCGCATTA AGCGCGGCGG GTGTGGTGGT4101 TACGCGCAGC GTGACCGCTA CACTTGCCAG CGCCCTAGCG CCCGCTCCTT4151 TCGCTTTCTT CCCTTCCTTT CTCGCCACGT TCGCCGGCTT TCCCCGTCAA4201 GCTCTAAATC GGGGCATCCC TTTAGGGTTC CGATTTAGTG CTTTACGGCA4251 CCTCGACCCC AAAAAACTTG ATTAGGGTGA TGGTTCACGT AGTGGGCCAT4301 CGCCCTGATA GACGGTTTTT CGCCCTTTGA CGTTGGAGTC CACGTTCTTT4351 AATAGTGGAC TCTTGTTCCA AACTGGAACA ACACTCAACC CTATCTCGGT4401 CTATTCTTTT GATTTATAAG GGATTTTGGG GATTTCGGCC TATTGGTTAA4451 AAAATGAGCT GATTTAACAA AAATTTAACG CGAATTAATT CTGTGGAATG4501 TGTGTCAGTT AGGGTGTGGA AAGTCCCCAG GCTCCCCAGG CAGGCAGAAG4551 TATGCAAAGC ATGCATCTCA ATTAGTCAGC AACCAGGTGT GGAAAGTCCC4601 CAGGCTCCCC AGCAGGCAGA AGTATGCAAA GCATGCATCT CAATTAGTCA4651 GCAACCATAG TCCCGCCCCT AACTCCGCCC ATCCCGCCCC TAACTCCGCC4701 CAGTTCCGCC CATTCTCCGC CCCATGGCTG ACTAATTTTT TTTATTTATG4751   CAGAGGCCGA GGCCGCCTCT GCCTCTGAGC TATTCCAGAA GTAGTGAGGA4801   GGCTTTTTTG GAGGCCTAGG CTTTTGCAAA AAGCTCCCGG GAGCTTGTAT4851   ATCCATTTTC GGATCTGATC AAGAGACAGG ATGAGGATCG TTTCGCATGA4901   TTGAACAAGA TGGATTGCAC GCAGGTTCTC CGGCCGCTTG GGTGGAGAGG4951   CTATTCGGCT ATGACTGGGC ACAACAGACA ATCGGCTGCT CTGATGCCGC5001   CGTGTTCCGG CTGTCAGCGC AGGGGCGCCC GGTTCTTTTT GTCAAGACCG5051   ACCTGTCCGG TGCCCTGAAT GAACTGCAGG ACGAGGCAGC GCGGCTATCG5101   TGGCTGGCCA CGACGGGCGT TCCTTGCGCA GCTGTGCTCG ACGTTGTCAC5151   TGAAGCGGGA AGGGACTGGC TGCTATTGGG CGAAGTGCCG GGGCAGGATC5201   TCCTGTCATC TCACCTTGCT CCTGCCGAGA AAGTATCCAT CATGGCTGAT5251   GCAATGCGGC GGCTGCATAC GCTTGATCCG GCTACCTGCC CATTCGACCA5301   CCAAGCGAAA CATCGCATCG AGCGAGCACG TACTCGGATG GAAGCCGGTC5351   TTGTCGATCA GGATGATCTG GACGAAGAGC ATCAGGGGCT CGCGCCAGCC5401   GAACTGTTCG CCAGGCTCAA GGCGCGCATG CCCGACGGCG AGGATCTCGT5451   CGTGACCCAT GGCGATGCCT GCTTGCCGAA TATCATGGTG GAAAATGGCC5501   GCTTTTCTGG ATTCATCGAC TGTGGCCGGC TGGGTGTGGC GGACCGCTAT5551   CAGGACATAG CGTTGGCTAC CCGTGATATT GCTGAAGAGC TTGGCGGCGA5601   ATGGGCTGAC CGCTTCCTCG TGCTTTACGG TATCGCCGCT CCCGATTCGC5651   AGCGCATCGC CTTCTATCGC CTTCTTGACG AGTTCTTCTG AGCGGGACTC5701   TGGGGTTCGA AATGACCGAC CAAGCGACGC CCAACCTGCC ATCACGAGAT5751   TTCGATTCCA CCGCCGCCTT CTATGAAAGG TTGGGCTTCG GAATCGTTTT5801   CCGGGACGCC GGCTGGATGA TCCTCCAGCG CGGGGATCTC ATGCTGGAGT5851   TCTTCGCCCA CCCCAACTTG TTTATTGCAG CTTATAATGG TTACAAATAA5901   AGCAATAGCA TCACAAATTT CACAAATAAA GCATTTTTTT CACTGCATTC5951   TAGTTGTGGT TTGTCCAAAC TCATCAATGT ATCTTATCAT GTCTGTATAC6001   CGTCGACCTC TAGCTAGAGC TTGGCGTAAT CATGGTCATA GCTGTTTCCT6051   GTGTGAAATT GTTATCCGCT CACAATTCCA CACAACATAC GAGCCGGAAG6101   CATAAAGTGT AAAGCCTGGG GTGCCTAATG AGTGAGCTAA CTCACATTAA6151   TTGCGTTGCG CTCACTGCCC GCTTTCCAGT CGGGAAACCT GTCGTGCCAG6201   CTGCATTAAT GAATCGGCCA ACGCGCGGGG AGAGGCGGTT TGCGTATTGG6251   GCGCTCTTCC GCTTCCTCGC TCACTGACTC GCTGCGCTCG GTCGTTCGGC6301   TGCGGCGAGC GGTATCAGCT CACTCAAAGG CGGTAATACG GTTATCCACA6351   GAATCAGGGG ATAACGCAGG AAAGAACATG TGAGCAAAAG GCCAGCAAAA6401   GGCCAGGAAC CGTAAAAAGG CCGCGTTGCT GGCGTTTTTC CATAGGCTCC6451   GCCCCCCTGA CGAGCATCAC AAAAATCGAC GCTCAAGTCA GAGGTGGCGA6501   AACCCGACAG GACTATAAAG ATACCAGGCG TGTCCCCCTG GAAGCTCCCT6551   CGTGCGCTCT CCTGTTCCGA CCCTGCCGCT TACCGGATAC CTGTCCGCCT6601   TTCTCCCTTC GGGAAGCGTG GCGCTTTCTC AATGCTCACG CTGTAGGTAT6651   CTCAGTTCGG TGTAGGTCGT TCGCTCCAAG CTGGGCTGTG TGCACGAACC6701   CCCCGTTCAG CCCGACCGCG GCGCCTTATC CGGTAACTAT CGTCTTGAGT6751   CCAACCCGGT AAGACACGAC TTATCGCCAC TGGCAGCAGC CACTGGTAAC6801   AGGATTAGCA GAGCGAGGTA TGTAGGCGGT GCTACAGAGT TCTTGAAGTG6851   GTGGCCTAAC TACGGCTACA CTAGAAGGAC AGTATTTGGT ATCTGCGCTC6901   TGCTGAAGCC AGTTACCTTC GGAAAAAGAG TTGGTAGCTC TTGATCCGGC6951   AAACAAACCA CCGCTGGTAG CGGTGGTTTT TTTGTTTGCA AGCAGCAGAT7001   TACGCGCAGA AAAAAAGGAT CTCAAGAAGA TCCTTTGATC TTTTCTACGG7051   GGTCTGACGC TCAGTGGAAC GAAAACTCAC GTTAAGGGAT TTTGGTCATG7101   AGATTATCAA AAAGGATCTT CACCTAGATC CTTTTAAATT AAAAATGAAG7151   TTTTAAATCA ATCTAAAGTA TATATGAGTA AACTTGGTCT GACAGTTACC7201   AATGCTTAAT CAGTGAGGCA CCTATCTCAG CGATCTGTCT ATTTCGTTCA7251   TCCATAGTTG CCTGACTCCC CGTCGTGTAG ATAACTACGA TACGGGAGGG7301   CTTACCATCT GGCCCCAGTG CTGCAATGAT ACCGCGAGAC CCACGCTCAC7351   CGGCTCCAGA TTTATCAGCA ATAAACCAGC CAGCCGGAAG GGCCGAGCGC7401   AGAAGTGGTC CTGCAACTTT ATCCGCCTCC ATCCAGTCTA TTAATTGTTG7451   CCGGGAAGCT AGAGTAAGTA GTTCGCCAGT TAATAGTTTG CGCAACGTTG7501   TTGCCATTGC TACAGGCATC GTGGTGTCAC GCTCGTCGTT TGGTATGGCT7551   TCATTCAGCT CCGGTTCCCA ACGATCAAGG CGAGTTACAT GATCCCCCAT7601   GTTGTGCAAA AAAGCGGTTA GCTCCTTCGG TCCTCCGATC GTTGTCAGAA7651   GTAAGTTGGC CGCAGTGTTA TCACTCATGG TTATGGCAGC ACTGCATAAT7701   TCTCTTACTG TCATGCCATC CGTAAGATGC TTTTCTGTGA CTGGTGAGTA7751   CTCAACCAAG TCATTCTGAG AATAGTGTAT GCGGCGACCG AGTTGCTCTT7801   GCCCGGCGTC AATACGGGAT AATACCGCGC CACATAGCAG AACTTTAAAA7851   GTGCTCATCA TTGGAAAACG TTCTTCGGGG CGAAAACTCT CAAGGATCTT7901   ACCGCTGTTG AGATCCAGTT CGATGTAACC CACTCGTGCA CCCAACTGAT7951   CTTCAGCATC TTTTACTTTC ACCAGCGTTT CTGGGTGAGC AAAAACAGGA8001   AGGCAAAATG CCGCAAAAAA GGGAATAAGG GCGACACGGA AATGTTGAAT8051   ACTCATACTC TTCCTTTTTC AATATTATTG AAGCATTTAT CAGGGTTATT8101   GTCTCATGAG CGGATACATA TTTGAATGTA TTTAGAAAAA TAAACAAATA8151   GGGGTTCCGC GCACATTTCC CCGAAAAGTG CCACCTGACG TC表10：重组质粒pIND-H-SemaL-EE的核苷酸序列(SEQ ID NO.:37)  1  AGATCTCGGC CGCATATTAA GTGCATTGTT CTCGATACCG CTAAGTGCAT 51  TGTTCTCGTT AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC101  GATGGACAAG TGCATTGTTC TCTTGCTGAA AGCTCGATGG ACAAGTGCAT151  TGTTCTCTTG CTGAAAGCTC AGTACCCGGG AGTACCCTCG ACCGCCGGAG201  TATAAATAGA GGCGCTTCGT CTACGGAGCG ACAATTCAAT TCAAACAAGC251  AAAGTGAACA CGTCGCTAAG CGAAAGCTAA GCAAATAAAC AAGCGCAGCT301  GAACAAGCTA AACAATCTGC AGTAAAGTGC AAGTTAAAGT GAATCAATTA351  AAAGTAACCA GCAACCAAGT AAATCAACTG CAACTACTGA AATCTGCCAA401  GAAGTAATTA TTGAATACAA GAAGAGAACT CTGAATACTT TCAACAAGTT451  ACCGAGAAAG AAGAACTCAC ACACAGCTAG CGTTTAAACT TAAGCTTGGT501  ACCGAGCTCG GATCCACTAG TCCAGTGTGG TGgaattcgg cttgggatga551  cgcctcctcc gcccggacgt gccgccccca gcgcaccgcg cgcccgcgtc601  cctggcccgc cggctcggtt ggggcttccg ctgcggctgc ggctgctgct651  gctgctctgg gcggccgccg cctccgccca gggccaccta aggagcggac701  cccgcatctt cgccgtctgg aaaggccatg tagggcagga ccgggtggac751  tttggccaga ctgagccgca cacggtgctt ttccacgagc caggcagctc801  ctctgtgtgg gtgggaggac gtggcaaggt ctacctcttt gacttccccg851  agggcaagaa cgcatctgtg cgcacggtga atatcggctc cacaaagggg901  tcctgtctgg ataagcggga ctgcgagaac tacatcactc tcctggagag951  gcggagtgag gggctgctgg cctgtggcac caacgcccgg caccccagct1001 gctggaacct ggtgaatggc actgtggtgc cacttggcga gatgagaggc1051 tacgccccct tcagcccgga cgagaactcc ctggttctgt ttgaagggga1101 cgaggtgtat tccaccatcc ggaagcagga atacaatggg aagatccctc1151 ggttccgccg catccggggc gagagtgagc tgtacaccag tgatactgtc1201 atgcagaacc cacagttcat caaagccacc atcgtgcacc aagaccaggc1251 ttacgatgac aagatctact acttcttccg agaggacaat cctgacaaga1301 atcctgaggc tcctctcaat gtgtcccgtg tggcccagtt gtgcaggggg1351 gaccagggtg gggaaagttc actgtcagtc tccaagtgga acacttttct1401 gaaagccatg ctggtatgca gtgatgctgc caccaacaag aacttcaaca1451 ggctgcaaga cgtcttcctg ctccctgacc ccagcggcca gtggagggac1501 accagggtct atggtgtttt ctccaacccc tggaactact cagccgtctg1551 tgtgtattcc ctcggtgaca ttgacaaggt cttccgtacc tcctcactca1601 agggctacca ctcaagcctt cccaacccgc ggcctggcaa gtgcctccca1651 gaccagcagc cgatacccac agagaccttc caggtggctg accgtcaccc1701 agaggtggcg cagagggtgg agcccatggg gcctctgaag acgccattgt1751 tccactctaa ataccactac cagaaagtgg ccgttcaccg catgcaagcc1801 agccacgggg agacctttca tgtgctttac ctaactacag acaggggcac1851 tatccacaag gtggtggaac cgggggagca ggagcacagc ttcgccttca1901 acatcatgga gatccagccc ttccgccgcg cggctgccat ccagaccatg1951 tcgctggatg ctgagcggag gaagctgtat gtgagctccc agtgggaggt2001 gagccaggtg cccctggacc tgtgtgaggt ctatggcggg ggctgccacg2051 gttgcctcat gtcccgagac ccctactgcg gctgggacca gggccgctgc2101 atctccatct acagctccga acggtcagtg ctgcaatcca ttaatccagc2151 cgagccacac aaggagtgtc ccaaccccaa accagacaag gccccactgc2201 agaaggtttc cctggcccca aactctcgct actacctgag ctgccccatg2251 gaatcccgcc acgccaccta ctcatggcgc cacaaggaga acgtggagca2301 gagctgcgaa cctggtcacc agagccccaa ctgcatcctg ttcatcgaga2351 acctcacggc gcagcagtac ggccactact tctgcgaggc ccaggagggc2401 tcctacttcc gcgaggctca gcactggcag ctgctgcccg aggacggcat2451 catggccgag cacctgctgg gtcatgcctg tgccctggct gcctccctct2501 ggctgggggt gctgcccaca ctcactcttg gcttgctggt ccacgtgaag2551 cttGGGCCCG TTTAAACCCG CTGATCAGCC TCGACTGTGC CTTCTAGTTG2601 CCAGCCATCT GTTGTTTGCC CCTCCCCCGT GCCTTCCTTG ACCCTGGAAG2651 GTGCCACTCC CACTGTCCTT TCCTAATAAA ATGAGGAAAT TGCATCGCAT2701 TGTCTGAGTA GGTGTCATTC TATTCTGGGG GGTGGGGTGG GGCAGGACAG2751 CAAGGGGGAG GATTGGGAAG ACAATAGCAG GCATGCTGGG GATGCGGTGG2801 GCTCTATGGC TTCTGAGGCG GAAAGAACCA GCTGGGGCTC TAGGGGGTAT2851 CCCCACGCGC CCTGTAGCGG CGCATTAAGC GCGGCGGGTG TGGTGGTTAC2901 GCGCAGCGTG ACCGCTACAC TTGCCAGCGC CCTAGCGCCC GCTCCTTTCG2951 CTTTCTTCCC TTCCTTTCTC GCCACGTTCG CCGGCTTTCC CCGTCAAGCT3001 CTAAATCGGG GCATCCCTTT AGGGTTCCGA TTTAGTGCTT TACGGCACCT3051 CGACCCCAAA AAACTTGATT AGGGTGATGG TTCACGTAGT GGGCCATCGC3101 CCTGATAGAC GGTTTTTCGC CCTTTGACGT TGGAGTCCAC GTTCTTTAAT3151 AGTGGACTCT TGTTCCAAAC TGGAACAACA CTCAACCCTA TCTCGGTCTA3201 TTCTTTTGAT TTATAAGGGA TTTTGGGGAT TTCGGCCTAT TGGTTAAAAA3251 ATGAGCTGAT TTAACAAAAA TTTAACGCGA ATTAATTCTG TGGAATGTGT3301 GTCAGTTAGG GTGTGGAAAG TCCCCAGGCT CCCCAGGCAG GCAGAAGTAT3351 GCAAAGCATG CATCTCAATT AGTCAGCAAC CAGGTGTGGA AAGTCCCCAG3401 GCTCCCCAGC AGGCAGAAGT ATGCAAAGCA TGCATCTCAA TTAGTCAGCA3451 ACCATAGTCC CGCCCCTAAC TCCGCCCATC CCGCCCCTAA CTCCGCCCAG3501 TTCCGCCCAT TCTCCGCCCC ATGGCTGACT AATTTTTTTT ATTTATGCAG3551 AGGCCGAGGC CGCCTCTGCC TCTGAGCTAT TCCAGAAGTA GTGAGGAGGC3601 TTTTTTGGAG GCCTAGGCTT TTGCAAAAAG CTCCCGGGAG CTTGTATATC3651   CATTTTCGGA TCTGATCAAG AGACAGGATG AGGATCGTTT CGCATGATTG3701   AACAAGATGG ATTGCACGCA GGTTCTCCGG CCGCTTGGGT GGAGAGGCTA3751   TTCGGCTATG ACTGGGCACA ACAGACAATC GGCTGCTCTG ATGCCGCCGT3801   GTTCCGGCTG TCAGCGCAGG GGCGCCCGGT TCTTTTTGTC AAGACCGACC3851   TGTCCGGTGC CCTGAATGAA CTGCAGGACG AGGCAGCGCG GCTATCGTGG3901   CTGGCCACGA CGGGCGTTCC TTGCGCAGCT GTGCTCGACG TTGTCACTGA3951   AGCGGGAAGG GACTGGCTGC TATTGGGCGA AGTGCCGGGG CAGGATCTCC4001   TGTCATCTCA CCTTGCTCCT GCCGAGAAAG TATCCATCAT GGCTGATGCA4051   ATGCGGCGGC TGCATACGCT TGATCCGGCT ACCTGCCCAT TCGACCACCA4101   AGCGAAACAT CGCATCGAGC GAGCACGTAC TCGGATGGAA GCCGGTCTTG4151   TCGATCAGGA TGATCTGGAC GAAGAGCATC AGGGGCTCGC GCCAGCCGAA4201   CTGTTCGCCA GGCTCAAGGC GCGCATGCCC GACGGCGAGG ATCTCGTCGT4251   GACCCATGGC GATGCCTGCT TGCCGAATAT CATGGTGGAA AATGGCCGCT4301   TTTCTGGATT CATCGACTGT GGCCGGCTGG GTGTGGCGGA CCGCTATCAG4351   GACATAGCGT TGGCTACCCG TGATATTGCT GAAGAGCTTG GCGGCGAATG4401   GGCTGACCGC TTCCTCGTGC TTTACGGTAT CGCCGCTCCC GATTCGCAGC4451   GCATCGCCTT CTATCGCCTT CTTGACGAGT TCTTCTGAGC GGGACTCTGG4501   GGTTCGAAAT GACCGACCAA GCGACGCCCA ACCTGCCATC ACGAGATTTC4551   GATTCCACCG CCGCCTTCTA TGAAAGGTTG GGCTTCGGAA TCGTTTTCCG4601   GGACGCCGGC TGGATGATCC TCCAGCGCGG GGATCTCATG CTGGAGTTCT4651   TCGCCCACCC CAACTTGTTT ATTGCAGCTT ATAATGGTTA CAAATAAAGC4701   AATAGCATCA CAAATTTCAC AAATAAAGCA TTTTTTTCAC TGCATTCTAG4751   TTGTGGTTTG TCCAAACTCA TCAATGTATC TTATCATGTC TGTATACCGT4801   CGACCTCTAG CTAGAGCTTG GCGTAATCAT GGTCATAGCT GTTTCCTGTG4851   TGAAATTGTT ATCCGCTCAC AATTCCACAC AACATACGAG CCGGAAGCAT4901   AAAGTGTAAA GCCTGGGGTG CCTAATGAGT GAGCTAACTC ACATTAATTG4951   CGTTGCGCTC ACTGCCCGCT TTCCAGTCGG GAAACCTGTC GTGCCAGCTG5001   CATTAATGAA TCGGCCAACG CGCGGGGAGA GGCGGTTTGC GTATTGGGCG5051   CTCTTCCGCT TCCTCGCTCA CTGACTCGCT GCGCTCGGTC GTTCGGCTGC5101   GGCGAGCGGT ATCAGCTCAC TCAAAGGCGG TAATACGGTT ATCCACAGAA5151   TCAGGGGATA ACGCAGGAAA GAACATGTGA GCAAAAGGCC AGCAAAAGGC5201   CAGGAACCGT AAAAAGGCCG CGTTGCTGGC GTTTTTCCAT AGGCTCCGCC5251   CCCCTGACGA GCATCACAAA AATCGACGCT CAAGTCAGAG GTGGCGAAAC5301   CCGACAGGAC TATAAAGATA CCAGGCGTTT CCCCCTGGAA GCTCCCTCGT5351   GCGCTCTCCT GTTCCGACCC TGCCGCTTAC CGGATACCTG TCCGCCTTTC5401   TCCCTTCGGG AAGCGTGGCG CTTTCTCAAT GCTCACGCTG TAGGTATCTC5451   AGTTCGGTGT AGGTCGTTCG CTCCAAGCTG GGCTGTGTGC ACGAACCCCC5501   CGTTCAGCCC GACCGCTGCG CCTTATCCGG TAACTATCGT CTTGAGTCCA5551   ACCCGGTAAG ACACGACTTA TCGCCACTGG CAGCAGCCAC TGGTAACAGG5601   ATTAGCAGAG CGAGGTATGT AGGCGGTGCT ACAGAGTTCT TGAAGTGGTG5651   GCCTAACTAC GGCTACACTA GAAGGACAGT ATTTGGTATC TGCGCTCTGC5701   TGAAGCCAGT TACCTTCGGA AAAAGAGTTG GTAGCTCTTG ATCCGGCAAA5751   CAAACCACCG CTGGTAGCGG TGGTTTTTTT GTTTGCAAGC AGCAGATTAC5801   GCGCAGAAAA AAAGGATCTC AAGAAGATCC TTTGATCTTT TCTACGGGGT5851   CTGACGCTCA GTGGAACGAA AACTCACGTT AAGGGATTTT GGTCATGAGA5901   TTATCAAAAA GGATCTTCAC CTAGATCCTT TTAAATTAAA AATGAAGTTT5951   TAAATCAATC TAAAGTATAT ATGAGTAAAC TTGGTCTGAC AGTTACCAAT6001   GCTTAATCAG TGAGGCACCT ATCTCAGCGA TCTGTCTATT TCGTTCATCC6051   ATAGTTGCCT GACTCCCCGT CGTGTAGATA ACTACGATAC GGGAGGGCTT6101   ACCATCTGGC CCCAGTGCTG CAATGATACC GCGAGACCCA CGCTCACCGG6151   CTCCAGATTT ATCAGCAATA AACCAGCCAG CCGGAAGGGC CGAGCGCAGA6201   AGTGGTCCTG CAACTTTATC CGCCTCCATC CAGTCTATTA ATTGTTGCCG6251   GGAAGCTAGA GTAAGTAGTT CGCCAGTTAA TAGTTTGCGC AACGTTGTTG6301   CCATTGCTAC AGGCATCGTG GTGTCACGCT CGTCGTTTGG TATGGCTTCA6351   TTCAGCTCCG GTTCCCAACG ATCAAGGCGA GTTACATGAT CCCCCATGTT6401   GTGCAAAAAA GCGGTTAGCT CCTTCGGTCC TCCGATCGTT GTCAGAAGTA6451   AGTTGGCCGC AGTGTTATCA CTCATGGTTA TGGCAGCACT GCATAATTCT6501   CTTACTGTCA TGCCATCCGT AAGATGCTTT TCTGTGACTG GTGAGTACTC6551   AACCAAGTCA TTCTGAGAAT AGTGTATGCG GCGACCGAGT TGCTCTTGCC6601   CGGCGTCAAT ACGGGATAAT ACCGCGCCAC ATAGCAGAAC TTTAAAAGTG6651   CTCATCATTG GAAAACGTTC TTCGGGGCGA AAACTCTCAA GGATCTTACC6701   GCTGTTGAGA TCCAGTTCGA TGTAACCCAC TCGTGCACCC AACTGATCTT6751   CAGCATCTTT TACTTTCACC AGCGTTTCTG GGTGAGCAAA AACAGGAAGG6801   CAAAATGCCG CAAAAAAGGG AATAAGGGCG ACACGGAAAT GTTGAATACT6851   CATACTCTTC CTTTTTCAAT ATTATTGAAG CATTTATCAG GGTTATTGTC6901   TCATGAGCGG ATACATATTT GAATGTATTT AGAAAAATAA ACAAATAGGG6951   GTTCCGCGCA CATTTCCCCG AAAAGTGCCA CCTGACGTCG ACGGATCGGG表11：重组质粒pIND-H-SemaL-EA的核苷酸序列(SEQ ID NO.:38)  1   AGATCTCGGC CGCATATTAA GTGCATTGTT CTCGATACCG CTAAGTGCAT 51   TGTTCTCGTT AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC101   GATGGACAAG TGCATTGTTC TCTTGCTGAA AGCTCGATGG ACAAGTGCAT151   TGTTCTCTTG CTGAAAGCTC AGTACCCGGG AGTACCCTCG ACCGCCGGAG201  TATAAATAGA GGCGCTTCGT CTACGGAGCG ACAATTCAAT TCAAACAAGC251  AAAGTGAACA CGTCGCTAAG CGAAAGCTAA GCAAATAAAC AAGCGCAGCT301  GAACAAGCTA AACAATCTGC AGTAAAGTGC AAGTTAAAGT GAATCAATTA351  AAAGTAACCA GCAACCAAGT AAATCAACTG CAACTACTGA AATCTGCCAA401  GAAGTAATTA TTGAATACAA GAAGAGAACT CTGAATACTT TCAACAAGTT451  ACCGAGAAAG AAGAACTCAC ACACAGCTAG CGTTTAAACT TAAGCTTGGT501  ACCGAGCTCG GATCCACTAG TCCAGTGTGG TGgaattcgg cttgggatga551  cgcctcctcc gcccggacgt gccgccccca gcgcaccgcg cgcccgcgtc601  cctggcccgc cggctcggtt ggggcttccg ctgcggctgc ggctgctgct651  gctgctctgg gcggccgccg cctccgccca gggccaccta aggagcggac701  cccgcatctt cgccgtctgg aaaggccatg tagggcagga ccgggtggac751  tttggccaga ctgagccgca cacggtgctt ttccacgagc caggcagctc801  ctctgtgtgg gtgggaggac gtggcaaggt ctacctcttt gacttccccg851  agggcaagaa cgcatctgtg cgcacggtga atatcggctc cacaaagggg901  tcctgtctgg ataagcggga ctgcgagaac tacatcactc tcctggagag951  gcggagtgag gggctgctgg cctgtggcac caacgcccgg caccccagct1001 gctggaacct ggtgaatggc actgtggtgc cacttggcga gatgagaggc1051 tacgccccct tcagcccgga cgagaactcc ctggttctgt ttgaagggga1101 cgaggtgtat tccaccatcc ggaagcagga atacaatggg aagatccctc1151 ggttccgccg catccggggc gagagtgagc tgtacaccag tgatactgtc1201 atgcagaacc cacagttcat caaagccacc atcgtgcacc aagaccaggc1251 ttacgatgac aagatctact acttcttccg agaggacaat cctgacaaga1301 atcctgaggc tcctctcaat gtgtcccgtg tggcccagtt gtgcaggggg1351 gaccagggtg gggaaagttc actgtcagtc tccaagtgga acacttttct1401 gaaagccatg ctggtatgca gtgatgctgc caccaacaag aacttcaaca1451 ggctgcaaga cgtcttcctg ctccctgacc ccagcggcca gtggagggac1501 accagggtct atggtgtttt ctccaacccc tggaactact cagccgtctg1551 tgtgtattcc ctcggtgaca ttgacaaggt cttccgtacc tcctcactca1601 agggctacca ctcaagcctt cccaacccgc ggcctggcaa gtgcctccca1651 gaccagcagc cgatacccac agagaccttc caggtggctg accgtcaccc1701 agaggtggcg cagagggtgg agcccatggg gcctctgaag acgccattgt1751 tccactctaa ataccactac cagaaagtgg ccgttcaccg catgcaagcc1801 agccacgggg agacctttca tgtgctttac ctaactacag acaggggcac1851 tatccacaag gtggtggaac cgggggagca ggagcacagc ttcgccttca1901 acatcatgga gatccagccc ttccgccgcg cggctgccat ccagaccatg1951 tcgctggatg ctgagcggag gaagctgtat gtgagctccc agtgggaggt2001 gagccaggtg cccctggacc tgtgtgaggt ctatggcggg ggctgccacg2051 gttgcctcat gtcccgagac ccctactgcg gctgggacca gggccgctgc2101 atctccatct acagctccga acggtcagtg ctgcaatcca ttaatccagc2151 cgagccacac aaggagtgtc ccaaccccaa accagacaag gccccactgc2201 agaaggtttc cctggcccca aactctcgct actacctgag ctgccccatg2251 gaatcccgcc acgccaccta ctcatggcgc cacaaggaga acgtggagca2301 gagctgcgaa cctggtcacc agagccccaa ctgcatcctg ttcatcgaga2351 acctcacggc gcagcagtac ggccactact tctgcgaggc ccaggagggc2401 tcctacttcc gcgaggctca gcactggcag ctgctgcccg aggacggcat2451 catggccgag cacctgctgg gtcatgcctg tgccctggct gcctccctct2501 ggctgggggt gctgcccaca ctcactcttg gcttgctggt ccacgtgaag2551 cttGGGCCCG AACAAAAACT CATCTCAGAA GAGGATCTGA ATAGCGCCGT2601 CGACCATCAT CATCATCATC ATTGAGTTTA TCCAGCACAG TGGCGGCCGC2651 TCGAGTCTAG AGGGCCCGTT TAAACCCGCT GATCAGCCTC GACTGTGCCT2701 TCTAGTTGCC AGCCATCTGT TGTTTGCCCC TCCCCCGTGC CTTCCTTGAC2751 CCTGGAAGGT GCCACTCCCA CTGTCCTTTC CTAATAAAAT GAGGAAATTG2801 CATCGCATTG TCTGAGTAGG TGTCATTCTA TTCTGGGGGG TGGGGTGGGG2851 CAGGACAGCA AGGGGGAGGA TTGGGAAGAC AATAGCAGGC ATGCTGGGGA2901 TGCGGTGGGC TCTATGGCTT CTGAGGCGGA AAGAACCAGC TGGGGCTCTA2951 GGGGGTATCC CCACGCGCCC TGTAGCGGCG CATTAAGCGC GGCGGGTGTG3001 GTGGTTACGC GCAGCGTGAC CGCTACACTT GCCAGCGCCC TAGCGCCCGC3051 TCCTTTCGCT TTCTTCCCTT CCTTTCTCGC CACGTTCGCC GGCTTTCCCC3101 GTCAAGCTCT AAATCGGGGC ATCCCTTTAG GGTTCCGATT TAGTGCTTTA3151 CGGCACCTCG ACCCCAAAAA ACTTGATTAG GGTGATGGTT CACGTAGTGG3201 GCCATCGCCC TGATAGACGG TTTTTCGCCC TTTGACGTTG GAGTCCACGT3251 TCTTTAATAG TGGACTCTTG TTCCAAACTG GAACAACACT CAACCCTATC3301 TCGGTCTATT CTTTTGATTT ATAAGGGATT TTGGGGATTT CGGCCTATTG3351 GTTAAAAAAT GAGCTGATTT AACAAAAATT TAACGCGAAT TAATTCTGTG3401 GAATGTGTGT CAGTTAGGGT GTGGAAAGTC CCCAGGCTCC CCAGGCAGGC3451 AGAAGTATGC AAAGCATGCA TCTCAATTAG TCAGCAACCA GGTGTGGAAA3501 GTCCCCAGGC TCCCCAGCAG GCAGAAGTAT GCAAAGCATG CATCTCAATT3551 AGTCAGCAAC CATAGTCCCG CCCCTAACTC CGCCCATCCC GCCCCTAACT3601 CCGCCCAGTT CCGCCCATTC TCCGCCCCAT GGCTGACTAA TTTTTTTTAT3651 TTATGCAGAG GCCGAGGCCG CCTCTGCCTC TGAGCTATTC CAGAAGTAGT3701 GAGGAGGCTT TTTTGGAGGC CTAGGCTTTT GCAAAAAGCT CCCGGGAGCT3751 TGTATATCCA TTTTCGGATC TGATCAAGAG ACAGGATGAG GATCGTTTCG3801 CATGATTGAA CAAGATGGAT TGCACGCAGG TTCTCCGGCC GCTTGGGTGG3851 AGAGGCTATT CGGCTATGAC TGGGCACAAC AGACAATCGG CTGCTCTGAT3901 GCCGCCGTGT TCCGGCTGTC AGCGCAGGGG CGCCCGGTTC TTTTTGTCAA3951 GACCGACCTG TCCGGTGCCC TGAATGAACT GCAGGACGAG GCAGCGCGGC4001   TATCGTGGGT GGCCACGAGG GGCGTTCCTT GCGCAGCTGT GCTCGACGTT4051   GTCACTGAAG CGGGAAGGGA CTGGCTGCTA TTGGGCGAAG TGCCGGGGCA4101   GGATCTCCTG TCATCTCACC TTGCTCCTGC CGAGAAAGTA TCCATCATGG4151   CTGATGCAAT GCGGCGGCTG CATACGCTTG ATCCGGCTAC CTGCCCATTC4201   GACCACCAAG CGAAACATCG CATCGAGCGA GCACGTACTC GGATGGAAGC4251   CGGTCTTGTC GATCAGGATG ATCTGGACGA AGAGCATCAG GGGCTCGCGC4301   CAGCCGAACT GTTCGCCAGG CTCAAGGCGC GCATGCCCGA CGGCGAGGAT4351   CTCGTCGTGA CCCATGGCGA TGCCTGCTTG CCGAATATCA TGGTGGAAAA4401   TGGCCGCTTT TCTGGATTCA TCGACTGTGG CCGGCTGGGT GTGGCGGACC4451   GCTATCAGGA CATAGCGTTG GCTACCCGTG ATATTGCTGA AGAGCTTGGC4501   GGCGAATGGG CTGACCGCTT CCTCGTGCTT TACGGTATCG CCGCTCCCGA4551   TTCGCAGCGC ATCGCCTTCT ATCGCCTTCT TGACGAGTTC TTCTGAGCGG4601   GACTCTGGGG TTCGAAATGA CCGACCAAGC GACGCCCAAC CTGCCATCAC4651   GAGATTTCGA TTCCACCGCC GCCTTCTATG AAAGGTTGGG CTTCGGAATC4701   GTTTTCCGGG ACGCCGGCTG GATGATCCTC CAGCGCGGGG ATCTCATGCT4751   GGAGTTCTTC GCCCACCCCA ACTTGTTTAT TGCAGCTTAT AATGGTTACA4801   AATAAAGCAA TAGCATCACA AATTTCACAA ATAAAGCATT TTTTTCACTG4851   CATTCTAGTT GTGGTTTGTC CAAACTCATC AATGTATCTT ATCATGTCTG4901   TATACCGTCG ACCTCTAGCT AGAGCTTGGC GTAATCATGG TCATAGCTGT4951   TTCCTGTGTG AAATTGTTAT CCGCTCACAA TTCCACACAA CATACGAGCC5001   GGAAGCATAA AGTGTAAAGC CTGGGGTGCC TAATGAGTGA GCTAACTCAC5051   ATTAATTGCG TTGCGCTCAC TGCCCGCTTT CCAGTCGGGA AACCTGTCGT5101   GCCAGCTGCA TTAATGAATC GGCCAACGCG CGGGGAGAGG CGGTTTGCGT5151   ATTGGGCGCT CTTCCGCCTC CTCGCTCACT GACTCGCTGC GCTCGGTCGT5201   TCGGCTGCGG CGAGCGGTAT CAGCTCACTC AAAGGCGGTA ATACGGTTAT5251   CCACAGAATC AGGGGATAAC GCAGGAAAGA ACATGTGAGC AAAAGGCCAG5301   CAAAAGGCCA GGAACCGTAA AAAGGCCGCG TTGCTGGCGT TTTTCCATAG5351   GCTCCGCCCC CCTGACGAGC ATCACAAAAA TCGACGCTCA AGTCAGAGGT5401   GGCGAAACCC GACAGGACTA TAAAGATACC AGGCGTTTCC CCCTGGAAGC5451   TCCCTCGTGC GCTCTCCTGT TCCGACCCTG CCGCTTACCG GATACCTGTC5501   CGCCTTTCTC CCTTCGGGAA GCGTGGCGCT TTCTCAATGC TCACGCTGTA5551   GGTATCTCAG TTCGGTGTAG GTCGTTCGCT CCAAGCTGGG CTGTGTGCAC5601   GAACCCCCCG TTCAGCCCGA CCGCTGCGCC TTATCCGGTA ACTATCGTCT5651   TGAGTCCAAC CCGGTAAGAC ACGACTTATC GCCACTGGCA GCAGCCACTG5701   GTAACAGGAT TAGCAGAGCG AGGTATGTAG GCGGTGCTAC AGAGTTCTTG5751   AAGTGGTGGC CTAACTACGG CTACACTAGA AGGACAGTAT TTGGTATCTG5801   CGCTCTGCTG AAGCCAGTTA CCTTCGGAAA AAGAGTTGGT AGCTCTTGAT5851   CCGGCAAACA AACCACCGCT GGTAGCGGTG GTTTTTTTGT TTGCAAGCAG5901   CAGATTACGC GCAGAAAAAA AGGATCTCAA GAAGATCCTT TGATCTTTTC5951   TACGGGGTCT GACGCTCAGT GGAACGAAAA CTCACGTTAA GGGATTTTGG6001   TCATGAGATT ATCAAAAAGG ATCTTCACCT AGATCCTTTT AAATTAAAAA6051   TGAAGTTTTA AATCAATCTA AAGTATATAT GAGTAAACTT GGTCTGACAG6101   TTACCAATGC TTAATCAGTG AGGCACCTAT CTCAGCGATC TGTCTATTTC6151   GTTCATCCAT AGTTGCCTGA CTCCCCGTCG TGTAGATAAC TACGATACGG6201   GAGGGCTTAC CATCTGGCCC CAGTGCTGCA ATGATACCGC GAGACCCACG6251   CTCACCGGCT CCAGATTTAT CAGCAATAAA CCAGCCAGCC GGAAGGGCCG6301   AGCGCAGAAG TGGTCCTGCA ACTTTATCCG CCTCCATCCA GTCTATTAAT6351   TGTTGCCGGG AAGCTAGAGT AAGTAGTTCG CCAGTTAATA GTTTGCGCAA6401   CGTTGTTGCC ATTGCTACAG GCATCGTGGT GTCACGCTCG TCGTTTGGTA6451   TGGCTTCATT CAGCTCCGGT TCCCAACGAT CAAGGCGAGT TACATGATCC6501   CCCATGTTGT GCAAAAAAGC GGTTAGCTCC TTCGGTCCTC CGATCGTTGT6551   CAGAAGTAAG TTGGCCGCAG TGTTATCACT CATGGTTATG GCAGCACTGC6601   ATAATTCTCT TACTGTCATG CCATCCGTAA GATGCTTTTC TGTGACTGGT6651   GAGTACTCAA CCAAGTCATT CTGAGAATAG TGTATGCGGC GACCGAGTTG6701   CTCTTGCCCG GCGTCAATAC GGGATAATAC CGCGCCACAT AGCAGAACTT6751   TAAAAGTGCT CATCATTGGA AAACGTTCTT CGGGGCGAAA ACTCTCAAGG6801   ATCTTACCGC TGTTGAGATC CAGTTCGATG TAACCCACTC GTGCACCCAA6851   CTGATCTTCA GCATCTTTTA CTTTCACCAG CGTTTCTGGG TGAGCAAAAA6901   CAGGAAGGCA AAATGCCGCA AAAAAGGGAA TAAGGGCGAC ACGGAAATGT6951   TGAATACTCA TACTCTTCCT TTTTCAATAT TATTGAAGCA TTTATCAGGG7001   TTATTGTCTC ATGAGCGGAT ACATATTTGA ATGTATTTAG AAAAATAAAC7051   AAATAGGGGT TCCGCGCACA TTTCCCCGAA AAGTGCCACC TGACGTCGAC7101   GGATCGGG表12：重组质粒pQE30-H-SemaL-BH的序列(SEQ ID NO.:39)  1  CTCGAGAAAT CATAAAAAAT TTATTTGCTT TGTGAGCGGA TAACAATTAT 51  AATAGATTCA ATTGTGAGCG GATAACAATT TCACACAGAA TTCATTAAAG101  AGGAGAAATT AACTATGAGA GGATCGCATC ACCATCACCA TCACGGAtcc151  ctggttctgt ttgaagggga cgaggtgtat tccaccatcc ggaagcagga201  atacaatggg aagatccctc ggttccgccg catccggggc gagagtgagc251  tgtacaccag tgatactgtc atgcagaacc cacagttcat caaagccacc301  atcgtgcacc aagaccaggc ttacgatgac aagatctact acttcttccg351  agaggacaat cctgacaaga atcctgaggc tcctctcaat gtgtcccgtg401  tggcccagtt gtgcaggggg gaccagggtg gggaaagttc actgtcagtc451  tccaagtgga acacttttct gaaagccatg ctggtatgca gtgatgctgc501  caccaacaag aacttcaaca ggctgcaaga cgtcttcctg ctccctgacc551  ccagcggcca gtggagggac accagggtct atggtgtttt ctccaacccc601  tggaactact cagccgtctg tgtgtattcc ctcggtgaca ttgacaaggt651  cttccgtacc tcctcactca agggctacca ctcaagcctt cccaacccgc701  ggcctggcaa gtgcctccca gaccagcagc cgatacccac agaAAGCTTA751  ATTAGCTGAG CTTGGACTCC TGTTGATAGA TCCAGTAATG ACCTCAGAAC801  TCCATCTGGA TTTGTTCAGA ACGCTCGGTT GCCGCCGGGC GTTTTTTATT851  GGTGAGAATC CAAGCTAGCT TGGCGAGATT TTCAGGAGCT AAGGAAGCTA901  AAATGGAGAA AAAAATCACT GGATATACCA CCGTTGATAT ATCCCAATGG951  CATCGTAAAG AACATTTTGA GGCATTTCAG TCAGTTGCTC AATGTACCTA1001 TAACCAGACC GTTCAGCTGG ATATTACGGC CTTTTTAAAG ACCGTAAAGA1051 AAAATAAGCA CAAGTTTTAT CCGGCCTTTA TTCACATTCT TGCCCGCCTG1101 ATGAATGCTC ATCCGGAATT TCGTATGGCA ATGAAAGACG GTGAGCTGGT1151 GATATGGGAT AGTGTTCACC CTTGTTACAC CGTTTTCCAT GAGCAAACTG1201 AAACGTTTTC ATCGCTCTGG AGTGAATACC ACGACGATTT CCGGCAGTTT1251 CTACACATAT ATTCGCAAGA TGTGGCGTGT TACGGTGAAA ACCTGGCCTA1301 TTTCCCTAAA GGGTTTATTG AGAATATGTT TTTCGTCTCA GCCAATCCCT1351 GGGTGAGTTT CACCAGTTTT GATTTAAACG TGGCCAATAT GGACAACTTC1401 TTCGCCCCCG TTTTCACCAT GGGCAAATAT TATACGCAAG GCGACAAGGT1451 GCTGATGCCG CTGGCGATTC AGGTTCATCA TGCCGTCTGT GATGGCTTCC1501 ATGTCGGCAG AATGCTTAAT GAATTACAAC AGTACTGCGA TGAGTGGCAG1551 GGCGGGGCGT AATTTTTTTA AGGCAGTTAT TGGTGCCCTT AAACGCCTGG1601 GGTAATGACT CTCTAGCTTG AGGCATCAAA TAAAACGAAA GGCTCAGTCG1651 AAAGACTGGG CCTTTCGTTT TATCTGTTGT TTGTCGGTGA ACGCTCTCCT1701 GAGTAGGACA AATCCGCCGC TCTAGAGCTG CCTCGCGCGT TTCGGTGATG1751 ACGGTGAAAA CCTCTGACAC ATGCAGCTCC CGGAGACGGT CACAGCTTGT1801 CTGTAAGCGG ATGCCGGGAG CAGACAAGCC CGTCAGGGCG CGTCAGCGGG1851 TGTTGGCGGG TGTCGGGGCG CAGCCATGAC CCAGTCACGT AGCGATAGCG1901 GAGTGTATAC TGGCTTAACT ATGCGGCATC AGAGCAGATT GTACTGAGAG1951 TGCACCATAT GCGGTGTGAA ATACCGCACA GATGCGTAAG GAGAAAATAC2001 CGCATCAGGC GCTCTTCCGC TTCCTCGCTC ACTGACTCGC TGCGCTCGGT2051 CTGTCGGCTG CGGCGAGCGG TATCAGCTCA CTCAAAGGCG GTAATACGGT2101 TATCCACAGA ATCAGGGGAT AACGCAGGAA AGAACATGTG AGCAAAAGGC2151 CAGCAAAAGG CCAGGAACCG TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA2201 TAGGCTCCGC CCCCCTGACG AGCATCACAA AAATCGACGC TCAAGTCAGA2251 GGTGGCGAAA CCCGACAGGA CTATAAAGAT ACCAGGCGTT TCCCCCTGGA2301   AGCTCCCTCG TGCGCTCTCC TGTTCCGACC CTGCCGCTTA CCGGATACCT2351   GTCCGCCTTT CTCCCTTCGG GAAGCGTGGC GCTTTCTCAA TGCTCACGCT2401   GTAGGTATCT CAGTTCGGTG TAGGTCGTTC GCTCCAAGCT GGGCTGTGTG2451   CACGAACCCC CCGTTCAGCC CGACCGCTGC GCCTTATCCG GTAACTATCG2501   TCTTGAGTCC AACCCGGTAA GACACGACTT ATCGCCACTG GCAGCAGCCA2551   CTGGTAACAG GATTAGCAGA GCGAGGTATG TAGGCGGTGC TACAGAGTTC2601   TTGAAGTGGT GGCCTAACTA CGGCTACACT AGAAGGACAG TATTTGGTAT2651   CTGCGCTCTG CTGAAGCCAG TTACCTTCGG AAAAAGAGTT GGTAGCTCTT2701   GATCCGGCAA ACAAACCACC GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG2751   CAGCAGATTA CGCGCAGAAA AAAAGGATCT CAAGAAGATC CTTTGATCTT2801   TTCTACGGGG TCTGACGCTC AGTGGAACGA AAACTCACGT TAAGGGATTT2851   TGGTCATGAG ATTATCAAAA AGGATCTTCA CCTAGATCCT TTTAAATTAA2901   AAATGAAGTT TTAAATCAAT CTAAAGTATA TATGAGTAAA CTTGGTCTGA2951   CAGTTACCAA TGCTTAATCA GTGAGGCACC TATCTCAGCG ATCTGTCTAT3001   TTCGTTCATC CATAGCTGCC TGACTCCCCG TCGTGTAGAT AACTACGATA3051   CGGGAGGGCT TACCATCTGG CCCCAGTGCT GCAATGATAC CGCGAGACCC3101   ACGCTCACCG GCTCCAGATT TATCAGCAAT AAACCAGCCA GCCGGAAGGG3151   CCGAGCGCAG AAGTGGTCCT GCAACTTTAT CCGCCTCCAT CCAGTCTATT3201   AATTGTTGCC GGGAAGCTAG AGTAAGTAGT TCGCCAGTTA ATAGTTTGCG3251   CAACGTTGTT GCCATTGCTA CAGGCATCGT GGTGTCACGC TCGTCGTTTG3301   GTATGGCTTC ATTCAGCTCC GGTTCCCAAC GATCAAGGCG AGTTACATGA3351   TCCCCCATGT TGTGCAAAAA AGCGGTTAGC TCCTTCGGTC CTCCGATCGT3401   TGTCAGAAGT AAGTTGGCCG CAGTGTTATC ACTCATGGTT ATGGCAGCAC3451   TGCATAATTC TCTTACTGTC ATGCCATCCG TAAGATGCTT TTCTGTGACT3501   GGTGAGTACT CAACCAAGTC ATTCTGAGAA TAGTGTATGC GGCGACCGAG3551   TTGCTCTTGC CCGGCGTCAA TACGGGATAA TACCGCGCCA CATAGCAGAA3601   CTTTAAAAGT GCTCATCATT GGAAAACGTT CTTCGGGGCG AAAACTCTCA3651   AGGATCTTAC CGCTGTTGAG ATCCAGTTCG ATGTAACCCA CTCGTGCACC5701   CAACTGATCT TCAGCATCTT TTACTTTCAC CAGCGTTTCT GGGTGAGCAA3751   AAACAGGAAG GCAAAATGCC GCAAAAAAGG GAATAAGGGC GACACGGAAA3801   TGTTGAATAC TCATACTCTT CCTTTTTCAA TATTATTGAA GCATTTATCA3851   GGGTTATTGT CTCATGAGCG GATACATATT TGAATGTATT TAGAAAAATA3901   AACAAATAGG GGTTCCGCGC ACATTTCCCC GAAAAGTGCC ACCTGACGTC3951   TAAGAAACCA TTATTATCAT GACATTAACC TATAAAAATA GGCGTATCAC4001   GAGGCCCTTT CGTCTTCAC表13：重组质粒pQE31-H-SemaL-SH的序列(SEQ ID NO.:40)  1  CTCGAGAAAT CATAAAAAAT TTATTTGCTT TGTGAGCGGA TAACAATTAT 51  AATAGATTCA ATTGTGAGCG GATAACAATT TCACACAGAA TTCATTAAAG101  AGGAGAAATT AACTATGAGA GGATCGCATC ACCATCACCA TCACACGGAT151  CCGCATGCga gctcccagtg ggaggtgagc caggtgcccc tggacctgtg201  tgaggtctat ggcgggggct gccacggttg cctcatgtcc cgagacccct251  actgcggctg ggaccagggc cgctgcatct ccatctacag ctccgaacgg301  tcagtgctgc aatccattaa tccagccgag ccacacaagg agtgtcccaa351  ccccaaacca gacaaggccc cactgcagaa ggtttccctg gccccaaact401  ctcgctacta cctgagctgc cccatggaat cccgccacgc cacctactca451  tggcgccaca aggagaacgt ggagcagagc tgcgaacctg gtcaccagag501  ccccaactgc atcctgttca tcgagaacct cacggcgcag cagtacggcc551  actacttctg cgaggcccag gagggctcct acttccgcga ggctcagcac601  tggcagctgc tgcccgagga cggcatcatg gccgagcacc tgctgggtca651  tgcctgtgcc ctggctgcct ccctctggct gggggtgctg cccacactca701  ctcttggctt gctggtccac gtgaagcttA ATTAGCTGAG CTTGGACTCC751  TGTTGATAGA TCCAGTAATG ACCTCAGAAC TCCATCTGGA TTTGTTCAGA801  ACGCTCGGTT GCCGCCGGGC GTTTTTTATT GGTGAGAATC CAAGCTAGCT851  TGGCGAGATT TTCAGGAGCT AAGGAAGCTA AAATGGAGAA AAAAATCACT901  GGATATACCA CCGTTGATAT ATCCCAATGG CATCGTAAAG AACATTTTGA951  GGCATTTCAG TCAGTTGCTC AATGTACCTA TAACCAGACC GTTCAGCTGG1001 ATATTACGGC CTTTTTAAAG ACCGTAAAGA AAAATAAGCA CAAGTTTTAT1051 CCGGCCTTTA TTCACATTCT TGCCCGCCTG ATGAATGCTC ATCCGGAATT1101 TCGTATGGCA ATGAAAGACG GTGAGCTGGT GATATGGGAT AGTGTTCACC 1151 CTTGTTACAC CGTTTTCCAT GAGCAAACTG AAACGTTTTC ATCGCTCTGG1201 AGTGAATACC ACGACGATTT CCGGCAGTTT CTACACATAT ATTCGCAAGA1251 TGTGGCGTGT TACGGTGAAA ACCTGGCCTA TTTCCCTAAA GGGTTTATTG1301 AGAATATGTT TTTCGTCTCA GCCAATCCCT GGGTGAGTTT CACCAGTTTT1351 GATTTAAACG TGGCCAATAT GGACAACTTC TTCGCCCCCG TTTTCACCAT1401 GGGCAAATAT TATACGCAAG GCGACAAGGT GCTGATGCCG CTGGCGATTC1451 AGGTTCATCA TGCCGTCTGT GATGGCTTCC ATGTCGGCAG AATGCTTAAT1501 GAATTACAAC AGTACTGCGA TGAGTGGCAG GGCGGGGCGT AATTTTTTTA1551 AGGCAGTTAT TGGTGCCCTT AAACGCCTGG GGTAATGACT CTCTAGCTTG1601 AGGCATCAAA TAAAACGAAA GGCTCAGTCG AAAGACTGGG CCTTTCGTTT1651 TATCTGTTGT TTGTCGGTGA ACGCTCTCCT GAGTAGGACA AATCCGCCGC1701 TCTAGAGCTG CCTCGCGCGT TTCGGTGATG ACGGTGAAAA CCTCTGACAC1751   ATGCAGCTCC CGGAGACGGT CACAGCTTGT CTGTAAGCGG ATGCCGGGAG1801   CAGACAAGCC CGTCAGGGCG CGTGAGCGGG TGTTGGCGGG TGTCGGGGCG1851   CAGCCATGAC CCAGTCACGT AGCGATAGCG GAGTGTATAC TGGCTTAACT1901   ATGCGGCATC AGAGCAGATT GTACTGAGAG TGCACCATAT GCGGTGTGAA1951   ATACCGCACA GATGCGTAAG GAGAAAATAC CGCATCAGGC GCTCTTCCGC2001   TTCCTCGCTC ACTGACTCGC TGCGCTCGGT CTGTCGGCTG CGGCGAGCGG2051   TATCAGCTCA CTCAAAGGCG GTAATACGGT TATCCACAGA ATCAGGGGAT2101   AACGCAGGAA AGAACATGTG AGCAAAAGGC CAGCAAAAGG CCAGGAACCG2151   TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA TAGGCTCCGC CCCCCTGACG2201   AGCATCACAA AAATCGACGC TCAAGTCAGA GGTGGCGAAA CCCGACAGGA2251   CTATAAAGAT ACCAGGCGTT TCCCCCTGGA AGCTCCCTCG TGCGCTCTCC2301   TGTTCCGACC CTGCCGCTTA CCGGATACCT GTCCGCCTTT CTCCCTTCGG2351   GAAGCGTGGC GCTTTCTCAA TGCTCACGCT GTAGGTATCT CAGTTCGGTG2401   TAGGTCGTTC GCTCCAAGCT GGGCTGTGTG CACGAACCCC CCGTTCAGCC2451   CGACCGCTGC GCCTTATCCG GTAACTATGG TCTTGAGTCC AACCCGGTAA2501   GACACGACTT ATCGCCACTG GCAGCAGCCA CTGGTAACAG GATTAGCAGA2551   GCGAGGTATG TAGGCGGTGC TACAGAGTTC TTGAAGTGGT GGCCTAACTA2601   CGGCTACACT AGAAGGACAG TATTTGGTAT CTGCGCTCTG CTGAAGCCAG2651   TTACCTTCGG AAAAAGAGTT GGTAGCTCTT GATCCGGCAA ACAAACCACC2701   GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG CAGCAGATTA CGCGCAGAAA2751   AAAAGGATCT CAAGAAGATC CTTTGATCTT TTCTACGGGG TCTGACGCTC2801   AGTGGAACGA AAACTCACGT TAAGGGATTT TGGTCATGAG ATTATCAAAA2851   AGGATCTTCA CCTAGATCCT TTTAAATTAA AAATGAAGTT TTAAATCAAT2901   CTAAAGTATA TATGAGTAAA CTTGGTCTGA CAGTTACCAA TGCTTAATCA2951   GTGAGGCACC TATCTCAGCG ATCTGTCTAT TTCGTTCATC CATAGCTGCC3001   TGACTCCCCG TCGTGTAGAT AACTACGATA CGGGAGGGCT TACCATCTGG3051   CCCCAGTGCT GCAATGATAC CGCGAGACCC ACGCTCACCG GCTCCAGATT3101   TATCAGCAAT AAACCAGCCA GCCGGAAGGG CCGAGCGCAG AAGTGGTCCT3151   GCAACTTTAT CCGCCTCCAT CCAGTCTATT AATTGTTGCC GGGAAGCTAG3201   AGTAAGTAGT TCGCCAGTTA ATAGTTTGCG CAACGTTGTT GCCATTGCTA3251   CAGGCATCGT GGTGTCACGC TCGTCGTTTG GTATGGCTTC ATTCAGCTCC3301   GGTTCCCAAC GATCAAGGCG AGTTACATGA TCCCCCATGT TGTGCAAAAA3351   AGCGGTTAGC TCCTTCGGTC CTCCGATCGT TGTCAGAAGT AAGTTGGCCG3401   CAGTGTTATC ACTCATGGTT ATGGCAGCAC TGCATAATTC TCTTACTGTC3451   ATGCCATCCG TAAGATGCTT TTCTGTGACT GGTGAGTACT CAACCAAGTC3501   ATTCTGAGAA TAGTGTATGC GGCGACCGAG TTGCTCTTGC CCGGCGTCAA3551   TACGGGATAA TACCGCGCCA CATAGCAGAA CTTTAAAAGT GCTCATCATT3601   GGAAAACGTT CTTCGGGGCG AAAACTCTCA AGGATCTTAC CGCTGTTGAG3651   ATCCAGTTCG ATGTAACCCA CTCGTGCACC CAACTGATCT TCAGCATCTT3701   TTACTTTCAC CAGCGTTTCT GGGTGAGCAA AAACAGGAAG GCAAAATGCC3751   GCAAAAAAGG GAATAAGGGC GACACGGAAA TGTTGAATAC TCATACTCTT3801   CCTTTTTCAA TATTATTGAA GCATTTATCA GGGTTATTGT CTCATGAGCG3851   GATACATATT TGAATGTATT TAGAAAAATA AACAAATAGG GGTTCCGCGC3901   ACATTTCCCC GAAAAGTGCC ACCTGACGTC TAAGAAACCA TTATTATCAT3951   GACATTAACC TATAAAAATA GGCGTATCAC GAGGCCCTTT CGTCTTCAC表14：人信息素L基团的(部分)核苷酸序列(8888个核苷酸)(SEQ ID NO.:41)GAGCCGCACACGGTGCTTTTCCACGAGCCAGGCAGCTCCTCTGTGTGGGTGGGAGGACGTGGCAAGGTCTACCTCTTTGACTTCCCCGAGGGCAAGAACGCATCTGTGCGCACGGTGAGCCTCTCTCTTCCCCCAACACCCCCCCTACCCTCTTATCTCCCCTCTGGCCCTGCCAAGGGTCCTCAGGGAATCCGAGGGAGCTGGCTTCTCTTCCTAAACTGCCCCCACCTCCGTATCCTATAAATGGCTCCTGGGGGAGGCTCCCTAAAGGTAGTCCAGATTGGAGTGGGGAGCTGGGGCGGTGTGGAGAAAAACAGGAGCTAATGGGCCTGGCCAGCTGGGCAGCGCTGCTGCGGAAAGCCCAGGCTGGAAGCTGGGCCCCAGAGCCCATGCCTGGTCTTCTGAACCCTCTGGGCCTCAGCTCTGGATATGAGACCCTGTTTGACCTCAGGTAGATCACTCACCCTCTCAGAGCCCCAGTTGCTCATCTGTCAGATGAGAATAATGGTTGCTTCCTTTGGGGCTTATCCTGAGGCTGTGTGGAAAGCATTTCAGGGGTACCTCACCCCTGGCAGATTGAACTAATGCTTCTCCCCTTCCCCAGGTGAATATCGGCTCCACAAAGGGGTCCTGTCTGGATAAGCGGGTGAGCGGGGGAGGGATCTGGAGGGGTCTGAGCCACTTGGTAAAGGGAGAGGAGACCCTGAGGGTCTAAGGAAGGAAGCATGGCCCTGCCCCACGAGTCCCAGACTGATGGGGAGACGTGGTCCTCTGTGCTTAGGGGATGGCGTCAGCTGCACACACTCTGGGCTGTCCCGGGAGGCTGTCACCTATGCTAAGCCCTTCTGACACCTTCTTCCCTGATCCTGGGGGTCCTAGTGCTAGGCTTGCCAGGGCCTTCCAGCAACCAATTTCTCTCCTCCCTTCTCTCTTCCCCGGGCAGGACTGCGAGAACTACATCACTCTCCTGGAGAGGCGGAGTGAGGGGCTGCTGGCCTGTGGCACCAACGCCCGGCACCCCAGCTGCTGGAACCTGGTGAGAAGGCTGCTCCCCATGTGCCTGATCAGCTCACCTTCTACTGCGTGGGCTTCTGCCCCTCATGGTGGGAAGGAGATGGCGAGACTCCAATGCTGGCCTTGCCCTGGGAGGATGGGGCTCCTGGCCGAGAAACTGGCCGTCATGGGAGGCAGTGGCTGTGGGATTATGTGGCCATCCAACCCTCTGGATCTCCCACAGGTGAATGGCACTGTGGTGCCACTTGGCGAGATGAGAGGCTACGCCCCCTTCAGCCCGGACGAGAACTCCCTGGTTCTGTTTGAAGGTTGGGGCATGCTTCGGAACTGGGCTGGGAGCAGGATGGTCAGCTCTTTGTCCAGTGTCCGGAGGAGGGACTTCCAGGAGCTGCCTGCCCTTACTCATTTCTCCCTCCCACTGACCCCAGGGGACGAGGTGTATTCCACCATCCGGAAGCAGGAATACAATGGGAAGATCCCTCGGTTCCGCCGCATCCGGGGCGAGAGTGAGCTGTACACCAGTGATACTGTCATGCAGAGTGAGTCAGGCTCCGGCTGGGCTGAGGGTGGGCAAGGGGGTGTGAGCACTTAAGGTGGCAGATGGGATCCTGATGTTTCTGGGAGGGCTCCCTGAGGGCCGCTGGGGCCATGCAGGAAAGCAGGACCTTGGTATAGGCCTGAGAAGTTAGGGTTGGCTGGGAGCAGAGGAACAGACAAGGTATAGCAGTGGGATGGGCCCAGCCCTCTTCAGGAACACAAACAGAGGGAGCCCCAGACCCAGTGCAGGGTCCCCAGGAGCCAAAGTTTATCCTCTGCTGAGTTCACGTGGAGGCAGCCCCCCAACTCCCTCCTCATCAGGGCTCTGCCAATTGAGCAGAAGTGACATAGGGGCCCCCAGGGACCTTCCCCCACTCCCCAGGCATGAAGTCATTGCTCCTGGGCCGATGACATCTTTGTAGGAAGAGGGCAAAACAGGTGTGGGGTGGAGGTGCAGGGTCTAGGGCCCCTCGGGGAGTTGGACCTGATGTTATGAGTCCTATTCCAGATCTGATTTGCCATGGTTTGTGCAGACCCGAAGGAGGGAGGAGAGTGTGCAGGGTTGGAATGGTCTCCCGGGCAAGCTTCCCAGCCTTACGCCCATTCGCTTCTGTGCCCTGGCAGACCCACAGTTCATCAAAGCCACCATCGTGCACCAAGACCAGGCTTACGATGACAAGATCTACTACTTCTTCCGAGAGGACAATCCTGACAAGAATCCTGAGGCTCCTCTCAATGTGTCCCGTGTGGCCCAGTTGTGCAGGGTGAACACGGGCGTGAGGGCTGCTGGCTACGTGTCTGTGCATGAATAGGCCTGAGTGAGGGTGAGTTCTGTGTGTCCGTGTGCATGTAGAAGTTGTGTGGATGTATGAGTGGGTCTGTGTCAGGGACTGTGGGAGCAGCTGTGTGTGCATGGAGCATCATGTGTCTGTGTGTGGGTAAAGGTGGCTGAGCTCCTGTGCACGTATGATGGCGTGTGAGCGTGTGTATGATGGGGTGTGTGTGTGTGTGTGTGTGTGTGTTTTGCCTGTGTGAATGTGCTGTGCCACGTATGTGGGTGCGTGAGTCAGTAAATGTGTGTCTGAGTCCGTCTGCTCTGTGGGGACCTGGCACTCTCACCTGCCCTGACCCTGGGCACTGCTGGCCCTGGGCTCTGGATCAGCCAGGCCTGCTTGCAGGAGTCTCATCTGGAGACCTGCCCTGAGTCCTGGGGCACCCCCGGCAGGTCCTGGCCCCTCGCAGCCTGCCTTCCTCCTCTGGGCCCAGGTGTTGATATTGCTGGCAGTGGTTTCCTGGGGTGTGTGGGGAAGCCCGGGCAGGTGCTGAGGGGCCTCTTCTCCCCTCTACCCTTCCAGGGGGACCAGGGTGGGGAAAGTTCACTGTCAGTCTCCAAGTGGAACACTTTTCTGAAAGCCATGCTGGTATGCAGTGATGCTGCCACCAACAAGAACTTCAACAGGCTGCAAGACGTCTTCCTGCTCCCTGACCCCAGCGGCCAGTGGAGGGACACCAGGGTCTATGGTGTTTTCTCCAACCCCTGGTGAGTGGCCCTTGTCCTGGGGCCGGGGCTGGCATTGGTTCAGTGTCCAGTAGGGACAGGAGGCCTTGGGCCCTGCTGAGGGCCTCCCTGGTGTGGCAGGAGCAGGGGCTGCAGGCTCAAGAGGCTGGGCTGTTGCTGGGTGTGGGGTGGGGGGACAGCCAGTGCGATGTATGTACTGTTGTGTGAGTGAGTCTGCACTCATGGGTGTGTGTGCATGCCCTATATGCACACTCATGACTGCACTTGTGCCTGTGTGTCCCACCACCTGCTTGTGCCGAGAGTGGACACTGGGCCCAGGAGGAAGCTGCTGAAGCATCTCTCGGGGAGCTGGGTGCTATTACACCTGCTCAGGCACTGCCTGAGCCCGATAATTCACACTTCTTAATCACTCTCATTGATTGAACACACGGCAGGCGGAAGTGTTGGGTGTGTGTGGGGAGAGTTAGGGATAGAGTGGAGGAAGCCAAGACCCTGCTCTGTGGCTCCTGGGTGAGTGGGTCCCCCAGGCTGGGAAGGGGTTGGGGGTCTGGCCTCCTGGGGCATCAGCACCCCACAGCCTGTGCCCAGGGAGGGCTAGAGAACTGCTCAGCCTATGATGGGGTTCCTCCTGCCTTGGGGTTGGGTAGAGCAGATGGCCTCTAGACTCAGTGATTCTGTAACAGGATACAAGTTTGTGGTTTTAAATTGCAGCACAAAGAAATTAGGCTGAACTCCTCTCCTTCCTCCTCTCCATCCCTCCCCATTTTCAGTGGTGGTTGGCAACTCAGTGCCAGGCACAAGGCTGGCCTGGGTGAGTGGAGGTGGATGGGTGGGTTCTGGGCCCCCCATTGAGCTGGTCTCCATGTCACTGCAGGAACTACTCAGCCGTCTGTGTGTATTCCCTCGGTGACATTGACAAGGTCTTCCGTACCTCCTCACTCAAGGGCTACCACTCAAGCCTTCCCAACCCGCGGCCTGGCAAGGTGAGCGTGACACCAGCCGTGGCCCAGGCCCAGCCCTCCTTCTGCCTCACCTCCCACCACCCCACTGACCTGGGCCTGCTCTCCTTGCCCAGTGCCTCCCAGACCAGCAGCCGATACCCACAGAGACCTTCCAGGTGGCTGACCGTCACCCAGAGGTGGCGCAGAGGGTGGAGCCCATGGGGCCTCTGAAGACGCCATTGTTCCACTCTAAATACCACTACCAGAAAGTGGCCGTCCACCGCATGCAAGCCAGCCACGGGGAGACCTTTCATGTGCTTTACCTAACTACAGGTGAGAGGCTACCCCGGGACCCTCAGTTTGCTTTGTAAAAACGGGCATGAAAGGTGTAAGGAATAATGTAGTTAACATCTGGTTGGATCTTTACATGTGGAAGGAATAATTGAGTGACTGGAGTTGTCAGGGGTTAATGTGTGTGGGTGTGGAAGAGCCAGGCAGGGAGAGCTTCCTGGAGGAGGTAGGGGCAAGAGGGAAAGGGGGATGGGAGAAAAGCAAGCACTGGGATTTGGAGGCGGAAATCTGGAGAGTCTGAGCAAAGCCAGGTGCACCTTTGGTCCAGATGTCTGACTCAGGGAAGAAGATGGTAGGAAGAGACGTGGCAAATGAGGAGGAGGGGCCTGAACCACAGGGATACTGGCCTCTGCCAGGCAGAATGAGGGAGTCAGGCCCTGCGCCTGTCTTTGGGATTGTGCAGGTGAGAAGAAACATTTGAGGAGTTGATGGGGCACAAATTAGGTATGGGGAAGGAGTTCCAGGGGGCAGAACCTTTGCCATCTCACAGAGGACAGGGGCAGCTTCTCTTCTTCCCTGGAGTAGGCCCTGCTGGGGGAAGCTGGGTGGAATGCCGTGGGAGATGCTCCTGCTTTCTGGAAAGCCACAGGACACGGAGGAGCCAGTCCTGAGTTGGGTTTGTCGCAGCTTCCCATGCCAGCTGCCTTCCTTGAGACTGGAAAGGGCCTCTAGCACCCCTGGGGCCATTCAATTCAGGCCCAGGCGCCCAACCTCAGTTGTTCACATTCCCCATGTGATCTCCTGTTGCTGCTTCACCTTGGGACTGTCTCGGCTTTGGTGACCTTGTAGGAAACTGGAACCCCAGCACCATTGTTTGGCTCCTGGAAGCCTTGGGGAGAGGAATTTCCCACAGGGCAGGGCCTGGGTCCTGATTCCCTGCCTCTTTACTCCCTATTCATCCCGGCTACACCCTTGGGCCCCCATCCTTGCTTGGCTCCAGTACTGGCTGGCACAGCTGTTGTGGTCATCCAGGGATGGCAGGGCACTGGGGAACAGAAGAGAGAGGTCACACAGTGCGGAACTGGGAGCAGGAGCTAGGACAAGGAAGGCTGGACTTGGGCCATGGACTCCCTTCCTGCAGACTTGGGAAGTGAGCACACTTGAGTGATTAGAGAAGGTGTCTTCGTTCTAAGGGCAGTGGAGGAGGCACCATTTTGGAGCCTGCATCATTCGTATTTGGGCTAGATTGAAAAATAGAGCTTTCTAAGTCCTCTGCAGAGAATGGGAGGCTCTCACAACTGGGAGAAGTATTGGCTCTTTTCCTGAGAATTTTGCCAAGGGTATGCTGTTACTGGGGCTGGTTTGGAAGGAGTATAGGGCATTATGTCTGTGAAGGCAGTGGCTGGGGTGGGGCCTTATCAGGCCCAAGGAGCATCTGGCCACATCTCAGAGTCCACAGATGAGGATCACGGATGTGTAGAGGAAACATCCTAGGCAGGCAATCATCTGACTGCTTTTTTGGGGCAGGTGATGCCCTGGGAAATTGGGAGGGAGGGAGAGAGGGAGGTAGGCTATTCTAGAAACTGGGAGAGCAGGTGAGGTAGGATTGGGAGGACCAGGGGTCAGGGTCCCCATTGGTCCCTAATTGAGAACGGAGAGAGCATTGGTCTAGGAGGCAGGCAGCTCGGTTATAAGACCTTGGGAACTCTTGATTTAGAATCCAAGATCCTTTTTAGATCTAGGATTTTATAAAATTAAGATATCCCCTAAGATCAAATGCAACGTGGAGTCCTGAATTGGATCCTAGAACAGAAGAAGGACATTTGTGGAAAAACTAGTGAAATCCAAATAAAGTCTGTAGTTTTGTTAATAGTAATGCACCAATGTCAGTTGCCTAGTTGTGACAAATATACCGTGGTTATGTAAGATGGTAACATTAGGGGGAACTGGAGAAGGGTAGATTGGAGCTCTCTGTACTATCTTTGCAACTTTTCTGGGAATCTAAAATTACTCCAAAATAAAAAAAAAATGTATTTAAAGTAAATATATTCCCTAAGAGTCCAGGAGGCAGGGGAGTTGTAGAAGCAGCTGAGTGGTTGGGTTCTGACAGATTTGGTTCCAACTCGGTCTCTGCTGCTCACCAGCTGTGTGACCTTGAGCAAGTGGCTTAGCCTTTCTGAGCCTGATTTCCTTATCTGTGGAGTGGGGAAGATGACAGCCACCTCGCAGGGCTGTGGAGGGTTAAACGAGGTGATGCATGGACAGCAGCCGCACTGACCTTGCTGGTGTGGGGCTCCTGCTTCTGTTCTTCCCGTGCAGCCTTGGGAATGTTGGAGGCCGTATCCAGGGACCCCTGGGCCTCCTGGGATGGCCTCTCTGGATCAGCCTTGGAAGGTTCCAGGCTGCCCTTAGGCTCCCACATTCTTCCCCAGTCACGCTCTCCTCGCCCTGCCCACACCAGTCCTGTGACCCTTGCCTGAGTTGTGACTTCCCACCCCTCCCCGGCCTAGAGGAAAGCTGCCTGGCCCCTCAGTGGGACTCCCGCCCACTGACCCTCTGTCCACCATACACAGACAGGGGCACTATCCACAAGGTGGTGGAACCGGGGGAGCAGGAGCACAGCTTCGCCTTCAACATCATGGAGATCCAGCCCTTCCGCCGCGCGGCTGCCATCCAGACCATGTCGCTGGATGCTGAGCGGGTGAGCCTTCCCCCACTGCGTCCCATGGGCTATGCAGTGACTGCAGCTGAGGACAGGGCTCCTTTGCATGTGATTTGTGTGTTCTTTTAAGAGCTTCTAGGCCTTAGGGCCTGGACATTTAGGACTGAGTGTGGGGTGGGGCCCGGGCCTGACCCAATCCTGCTGTCCTTCCAGAGGAAGCTGTATGTGAGCTCCCAGTGGGAGGTGAGCCAGGTGCCCCTGGACCTGTGTGAGGTCTATGGCGGGGGCTGCCACGGTTGCCTCATGTCCCGAGACCCCTACTGCGGCTGGGACCAGGGCCGCTGCATCTCCATCTACAGCTCCGAACGGTACGTTGGCCGGGATCCCTCCGTCCCTGGGACAAGGTGGGCATGGGACAGGGGGAGGTGTTGTCGGGCTGGAAGAGGTGGCGGTACTGGGCCTTTCTTGTGGGACCTCCTCTCTACTGGAACTGCACTAGGGGTAAGGATATGAGGGTCAGGTCTGCAGCCTTGTATCTGCTGATCCTCTTTCGTCCTTCCCACTCCAGGTCAGTGCTGCAATCCATTAATCCAGCCGAGCCACACAAGGAGTGTCCCAACCCCAAACCAGGTACCTGATCTGGCCCTGCTGGCGGCTGTGGCCCAATGAGTGGGGTACTGCCCTGCCCTGATTGTCCTGGTCTGAGGGAAACATGGCCTTGTCCTGTGGGCCCCAGGTACATGGGGCAGGATACAGTCCTGCAGAGGGAGCCCTCTTGGTGGGATGAGCGAGACGGGAGAAAAAAGGAGGACGCTGAGGGCTGGGTTCCCCACGTTCATTCAGAAGCCTTGTCCTGGGATCCCAGTCGGTGGGGAGGACACATCCTCCCCTGGGAGCTCTTTGTCCCTCCTCACGGCTGCTTCCCCACTGCCTCCCCAGACAAGGCCCCACTGCAGAAGGTTTCCCTGGCCCCAAACTCTCGCTACTACCTGAGCTGCCCCATGGAATCCCGCCACGCCACCTACTCATGGCGCCACAAGGAGAACGTGGAGCAGAGCTGCGAACCTGGTCACCAGAGCCCCAACTGCATCCTGTTCATCGAGAACCTCACGGCGCAGCAGTACGGCCACTACTTCTGCGAGGCCCAGGAGGGCTCCTACTTCCGCGAGGCTCAGCACTGGCAGCTGCTGCCCGAGGACGGCATCATGGCCGAGCACCTGCTGGGTCATGCCTGTGCCCTGGCCGCCTCCCTCTGGCTGGGGGTGCTGCCCACACTCACTCTTGGCTTGCTGGTCCACTAGGGCCTCCCGAGGCTGGGCATGCCTCAGGCTTCTGCAGCCCAGGGCACTAGAACGTCTCACACTCAGAGCCGGCTGGCCCGGGAGCTCCTTGCCTGCCACTTCTTCCAGGGGACAGAATAACCCAGTGGAGGATGCCAGGCCTGGAGACGTCCAGCCGCAGGCGGCTGCTGGGCCCCAGGTGGCGCACGGATGGTGAGGGGCTGAGAATGAGGGCACCGACTGTGAAGCTGGGGCATCGATGACCCAAGACTTTATCTTCTGGAAAATATTTTTCAGACTCCTCAAACTTGACTAAATGCAGCGATGCTCCCAGCCCAAGAGCCCATGGGTCGGGGAGTGGGTTTGGATAGGAGAGCTGGGACTCCATCTCGACCCTGGGGCTGAGGCCTGAGTCCTTCTGGACTCTTGGTACCCACATTGCCTCCTTCCCCTCCCTCTCTCATGGCTGGGTGGCTGGTGTTCCTGAAGACCCAGGGCTACCCTCTGTCCAGCCCTGTCCTCTGCAGCTCCCTCTCTGGTCCTGGGTCCCACAGGACAGCCGCCTTGCATGTTTATTGAAGGATGTTTGCTTTCCGGACGGAAGGACGGAAAAAGCTCTGAAAAAAAAAAAAAAAAAAAAAAAA表15:pMelBacA-H-SEMAL的核苷酸序列(6622bp)(SEQ ID NO.:42)  1  GATATCATGG AGATAATTAA AATGATAACC ATCTCGCAAA TAAATAAGTA 51  TTTTACTGTT TTCGTAACAG TTTTGTAATA AAAAAACCTA TAAATATGAA101  ATTCTTAGTC AACGTTGCCC TTGTTTTTAT GGTCGTATAC ATTTCTTACA151  TCTATGCGGA TCGATGG                         gga  tccgcccagg gccacctaag gagcggaccc201  cgcatcttcg ccgtctggaa aggccatgta gggcaggacc gggtggactt251  tggccagact gagccgcaca cggtgctttt ccacgagcca ggcagctcct301  ctgtgtgggt gggaggacgt ggcaaggtct acctctttga cttccccgag351  ggcaagaacg catctgtgcg cacggtgaat atcggctcca caaaggggtc401  ctgtctggat aagcgggact gcgagaacta catcactctc ctggagaggc451  ggagtgaggg gctgctggcc tgtggcacca acgcccggca ccccagctgc501  tggaacctgg tgaatggcac tgtggtgcca cttggcgaga tgagaggcta551  tgcccccttc agcccggacg agaactccct ggttctgttt gaaggggacg601  aggtgtattc caccatccgg aagcaggaat acaatgggaa gatccctcgg651  ttccgccgca tccggggcga gagtgagctg tacaccagtg atactgtcat701  gcagaaccca cagttcatca aagccaccat cgtgcaccaa gaccaggctt751  acgatgacaa gatctactac ttcttccgag aggacaatcc tgacaagaat801  cctgaggctc ctctcaatgt gtcccgtgtg gcccagttgt gcagggggga851  ccagggtggg gaaagttcac tgtcagtctc caagtggaac acttttctga901  aagccatgct ggtatgcagt gatgctgcca ccaacaagaa cttcaacagg951  ctgcaagacg tcttcctgct ccctgacccc agcggccagt ggagggacac1001 cagggtctat ggtgttttct ccaacccctg gaactactca gccgtctgtg1051 tgtattccct cggtgacatt gacaaggtct tccgtacctc ctcactcaag1101 ggctaccact caagccttcc caacccgcgg cctggcaagt gcctcccaga1151 ccagcagccg atacccacag agaccttcca ggtggctgac cgtcacccag1201 aggtggcgca gagggtggag cccatggggc ctctgaagac gccattgttc1251 cactctaaat accactacca gaaagtggcc gttcaccgca tgcaagccag1301 ccacggggag acctttcatg tgctttacct aactacagac aggggcacta1351 tccacaaggt ggtggaaccg ggggagcagg agcacagctt cgccttcaac1401 atcatggaga tccagccctt ccgccgcgcg gctgccatcc agaccatgtc1451 gctggatgct gagcggagga agctgtatgt gagctcccag tgggaggtga1501 gccaggtgcc cctggacctg tgtgaggtct atggcggggg ctgccacggt1551 tgcctcatgt cccgagaccc ctactgcggc tgggaccagg gccgctgcat1601 ctccatctac agctccgaac ggtcagtgct gcaatccatt aatccagccg1651 agccacacaa ggagtgtccc aaccccaaac cagacaaggc cccactgcagt701 aaggtttccc tggccccaaa ctctcgctac tacctgagct gccccatgga1751 atcccgccac gccacctact catggcgcca caaggagaac gtggagcaga1801 gctgcgaacc tggtcaccag agccccaact gcatcctgtt catcgagaac1851 ctcacggcgc agcagtacgg ccactacttc tgcgaggccc aggagggctc1901 ctacttccgc gaggctcagc actggcagct gctgcccgag gacggcatca1951 tggccgagca cctgctgggt catgcctgtg ccctggctgc ctgaattc                                                          GA2001 AGCTTGGAGT CGACTCTGCT GAAGAGGAGG AAATTCTCCT TGAAGTTTCC2051 CTGGTGTTCA AAGTAAAGGA GTTTGCACCA GACGCACCTC TGTTCACTGG2101 TCCGGCGTAT TAAAACACGA TACATTGTTA TTAGTACATT TATTAAGCGC2151 TAGATTCTGT GCGTTGTTGA TTTACAGACA ATTGTTGTAC GTATTTTAAT2201 AATTCATTAA ATTTATAATC TTTAGGGTGG TATGTTAGAG CGAAAATCAA2251 ATGATTTTCA GCGTCTTTAT ATCTGAATTT AAATATTAAA TCCTCAATAG2301 ATTTGTAAAA TAGGTTTCGA TTAGTTTCAA ACAAGGGTTG TTTTTCCGAA2351 CCGATGGCTG GACTATCTAA TGGATTTTCG CTCAACGCCA CAAAACTTGC2401 CAAATCTTGT AGCAGCAATC TAGCTTTGTC GATATTCGTT TGTGTTTTGT2451 TTTGTAATAA AGGTTCGACG TCGTTCAAAA TATTATGCGC TTTTGTATTT2501   CTTTCATCAC TGTCGTTAGT GTACAATTGA CTCGACGTAA ACACGTTAAA2551   TAAAGCCTGG ACATATTTAA CATCGGGCGT GTTAGCTTTA TTAGGCCGAT2601   TATCGTCGTC GTCCCAACCC TCGTCGTTAG AAGTTGCTTC CGAAGACGAT2651   TTTGCCATAG CCACACGACG CCTATTAATT GTGTCGGCTA ACACGTCCGC2701   GATCAAATTT GTAGTTGAGC TTTTTGGAAT TATTTCTGAT TGCGGGCGTT2751   TTTGGGCGGG TTTCAATCTA ACTGTGCCCG ATTTTAATTC AGACAACACG2801   TTAGAAAGCG ATGGTGCAGG CGGTGGTAAC ATTTCAGACG GCAAATCTAC2851   TAATGGCGGC GGTGGTGGAG CTGATGATAA ATCTACCATC GTGGAGGCG2901   CAGGCGGGGC TGGCGGCGGA GGCGGAGGCG GAGGTGGTGG GGTGATGCA2951   GACGGCGGTT TAGGCTCAAA TTGTCTCTTT CAGGCAACAC AGTCGGCACC3001   TCAACTATTG TACTGGTTTC GGGCGTATGG TGCACTCTCA GTACAATCTG3051   CTCTGATGCC GCATAGTTAA GCCAGCCCCG ACACCCGCCA ACACCCGCTG3101   ACGCGCCCTG ACGGGCTTGT CTGCTCCCGG CATCCGCTTA CAGACAAGCT3151   GTGACCGTCT CCGGGAGCTG CATGTGTCAG AGGTTTTCAC CGTCATCACC3201   GAAACGCGCG AGACGAAAGG GCCTCGTGAT ACGCCTATTT TTATAGGTTA3251   ATGTCATGAT AATAATGGTT TCTTAGACGT CAGGTGGCAC TTTTCGGGGA3301   AATGTGCGCG GAACCCCTAT TTGTTTATTT TTCTAAATAC ATTCAAATAT3351   GTATCCGCTC ATGAGACAAT AACCCTGATA AATGCTTCAA TAATATTGAA3401   AAAGGAAGAG TATGAGTATT CAACATTTCC GTGTCGCCCT TATTCCCTTT3451   TTTGCGGCAT TTTGCCTTCC TGTTTTTGCT CACCCAGAAA CGCTGGTGAA3501   AGTAAAAGAT GCTGAAGATC AGTTGGGTGC ACGAGTGGGT TACATCGAAC3551   TGGATCTCAA CAGCGGTAAG ATCCTTGAGA GTTTTCGCCC CGAAGAACGT3601   TTTCCAATGA TGAGCACTTT TAAAGTTCTG CTATGTGGCG CGGTATTATC3651   CCGTATTGAC GCCGGGCAAG AGCAACTCGG TCGCCGCATA CACTATTCTC3701   AGAATGACTT GGTTGAGTAC TCACCAGTCA CAGAAAAGCA TCTTACGGAT3751   GGCATGACAG TAAGAGAATT ATGCAGTGCT GCCATAACCA TGAGTGATAA3801   CACTGCGGCC AACTTACTTC TGACAACGAT CGGAGGACCG AAGGAGCTAA3851   CCGCTTTTTT GCACAACATG GGGGATCATG TAACTCGCCT TGATCGTTGG3901   GAACCGGAGC TGAATGAAGC CATACCAAAC GACGAGCGTG ACACCACGAT3951   GCCTGTAGCA ATGGCAACAA CGTTGCGCAA ACTATTAACT GGCGAACTAC4001   TTACTCTAGC TTCCCGGCAA CAATTAATAG ACTGGATGGA GGCGGATAAA4051   GTTGCAGGAC CACTTCTGCG CTCGGCCCTT CCGGCTGGCT GGTTTATTGC4101   TGATAAATCT GGAGCCGGTG AGCGTGGGTC TCGCGGTATC ATTGCAGCAC4151   TGGGGCCAGA TGGTAAGCCC TCCCGTATCG TAGTTATCTA CACGACGGGG4201   AGTCAGGCAA CTATGGATGA ACGAAATAGA CAGATCGCTG AGATAGGTGC4251   CTCACTGATT AAGCATTGGT AACTGTCAGA CCAAGTTTAC TCATATATAC4301   TTTAGATTGA TTTAAAACTT CATTTTTAAT TTAAAAGGAT CTAGGTGAAG4351   ATCCTTTTTG ATAATCTCAT GACCAAAATC CCTTAACGTG AGTTTTCGTT4401   CCACTGAGCG TCAGACCCCG TAGAAAAGAT CAAAGGATCT TCTTGAGATC4451   CTTTTTTTCT GCGCGTAATC TGCTGCTTGC AAACAAAAAA ACCACCGCTA4501   CCAGCGGTGG TTTGTTTGCC GGATCAAGAG CTACCAACTC TTTTTCCGAA4551   GGTAACTGGC TTCAGCAGAG CGCAGATACC AAATACTGTT CTTCTAGTGT4601   AGCCGTAGTT AGGCCACCAC TTCAAGAACT CTGTAGCACC GCCTACATAC4651   CTCGCTCTGC TAATCCTGTT ACCAGTGGCT GCTGCCAGTG GCGATAAGTC4701   GTGTCTTACC GGGTTGGACT CAAGACGATA GTTACCGGAT AAGGCGCAGC4751   GGTCGGGCTG AACGGGGGGT TCGTGCACAC AGCCCAGCTT GGAGCGAACG4801   ACCTACACCG AACTGAGATA CCTACAGCGT GAGCTATGAG AAAGCGCCAC4851   GCTTCCCGAA GGGAGAAAGG CGGACAGGTA TCCGGTAAGC GGCAGGGTCG4901   GAACAGGAGA GCGCACGAGG GAGCTTCCAG GGGGAAACGC CTGGTATCTT4951   TATAGTCCTG TCGGGTTTCG CCACCTCTGA CTTGAGCGTC GATTTTTGTG5001   ATGCTCGTCA GGGGGGCGGA GCCTATGGAA AAACGCCAGC AACGCGGCCT5051   TTTTACGGTT CCTGGCCTTT TGCTGGCCTT TTGCTCACAT GTTCTTTCCT5101   GCGTTATCCC CTGATTCTGT GGATAACCGT ATTACCGCCT TTGAGTGAGC5151   TGATACCGCT CGCCGCAGCC GAACGACCGA GCGCAGCGAG TCAGTGAGCG5201   AGGAAGCATC CTGCACCATC GTCTGCTCAT CCATGACCTG ACCATGCAGA5251   GGATGATGCT CGTGACGGTT AACGCCTCGA ATCAGCAACG GCTTGCCGTT5301   CAGCAGCAGC AGACCATTTT CAATCCGCAC CTCGCGGAAA CCGACATCGC5351   AGGCTTCTGC TTCAATCAGC GTGCCGTCGG CGGTGTGCAG TTCAACCACC5401   GCACGATAGA GATTCGGGAT TTCGGCGCTC CACAGTTTCG GGTTTTCGAC5451   GTTCAGACGT AGTGTGACGC GATCGGTATA ACCACCACGC TCATCGATAA5501   TTTCACCGCC GAAAGGCGCG GTGCCGCTGG CGACCTGCGT TTCACCCTGC5551   CATAAAGAAA CTGTTACCCG TAGGTAGTCA CGCAACTCGC CGCACATCTG5601   AACTTCAGCC TCCAGTACAG CGCGGCTGAA ATCATCATTA AAGCGAGTGG5651   CAACATGGAA ATCGCTGATT TGTGTAGTCG GTTTATGCAG CAACGAGACG5701   TCACGGAAAA TGCCGCTCAT CCGCCACATA TCCTGATCTT CCAGATAACT5751   GCCGTCACTC CAACGCAGCA CCATCACCGC GAGGCGGTTT TCTCCGGCGC5801   GTAAAAATGC GCTCAGGTCA AATTCAGACG GCAAACGACT GTCCTGGCCG5851   TAACCGACCC AGCGCCCGTT GCACCACAGA TGAAACGCCG AGTTAACGCC5901   ATCAAAAATA ATTCGCGTCT GGCCTTCCTG TAGCCAGCTT TCATCAACAT5951   TAAATGTGAG CGAGTAACAA CCCGTCGGAT TCTCCGTGGG AACAAACGGC6001   GGATTGACCG TAATGGGATA GGTCACGTTG GTGTAGATGG GCGCATCGTA6051   ACCGTGCATC TGCCAGTTTG AGGGGACGAC GACAGTATCG GCCTCAGGAA6101   GATCGCACTC CAGCCAGCTT TCCGGCACCG CTTCTGGTGC CGGAAACCAG6151   GCAAAGCGCC ATTCGCCATT CAGGCTGCGC AACTGTTGGG AAGGGCGATC6201   GGTGCGGGCC TCTTCGCTAT TACGCCAGCT GGCGAAAGGG GGATGTGCTG6251   CAAGGCGATT AAGTTGGGTA ACGCCAGGGT TTTCCCAGTC ACGACGTTGT6301   AAAACGACGG GATCTATCAT TTTTAGCAGT GATTCTAATT GCAGCTGCTC6351   TTTGATACAA CTAATTTTAC GACGACGATG CGAGCTTTTA TTCAACCGAG6401   CGTGCATGTT TGCAATCGTG CAAGCGTTAT CAATTTTTCA TTATCGTATT6451   GTTGCACATC AACAGGCTGG ACACCACGTT GAACTCGCCG CAGTTTTGCG6501   GCAAGTTGGA CCCGCCGCGC ATCCAATGCA AACTTTCCGA CATTCTGTTG6551   CCTACGAACG ATTGATTCTT TGTCCATTGA TCGAAGCGAG TGCCTTCGAC6601   TTTTTCGTGT CCAGTGTGGC TT

                   序列表

    (1)一般信息：

     (ⅰ)申请人：

      (A)名称：Hoechst Marion Roussel Deutschland GmbH

      (B)街道：

      (C)城市：Frankfurt

      (D)州：

      (E)国家：德国

      (F)邮区代码(ZIP)：69926

      (G)电话：069-305-7072

      (H)传真：069-35-7175

      (I)电传：

     (ⅱ)发明名称：人类信息素L和其它物种中相应的信息素

     (ⅲ)序列数：44

     (ⅳ)计算机可读形式：

      (A)介质类型：软盘

      (B)计算机：IBMPC兼容机

      (C)操作系统：PC-DOS/MS-DOS

      (D)软件：PatentIn Release#1.0，版本#1.25(EPO)

    (2)SEQ ID NO:1的信息：

     (ⅰ)序列特征：

      (A)长度：2636个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..2636

     (ⅹⅰ)序列描述：SEQ ID NO:1:CGGGGCCACG GGATGACGCC TCCTCCGCCC GGACGTGCCG CCCCCAGCGC ACCGCGCGCC        60CGCGTCCCTG GCCCGCCGGC TCGGTTGGGG CTTCCGCTGC GGCTGCCGCT GCTGCTGCTG       120CTCTGGGCGG CCGCCGCCTC CGCCCAGGGC CACCTAAGGA GCGGACCCCG CATCTTCGCC       180GTCTGGAAAG GCCATGTAGG GCAGGACCGG GTGGACTTTG GCCAGACTGA GCCGCACACG       240GTGCTTTTCC ACGAGCCAGG CAGCTCCTCT GTGTGGGTGG GAGGACGTGG CAAGGTCTAC       300CTCTTTGACT TCCCCGAGGG CAAGAACGCA TCTGTGCGCA CGGTGAATAT CGGCTCCACA       360AAGGGGTCCT GTCTGGATAA GCGGGACTGC GAGAACTACA TCACTCTCCT GGAGAGGCGG       420AGTGAGGGGC TGCTGGCCTG TGGCACCAAC GCCCGGCACC CCAGCTGCTG GAACCTGGTG       480AATGGCACTG TGGTGCCACT TGGCGAGATG AGAGGCTACG CCCCCTTCAG CCCGGACGAG       540AACTCCCTGG TTCTGTTTGA AGGGGACGAG GTGTATTCCA CCATCCGGAA GCAGGAATAC       600AATGGGAAGA TCCCTCGGTT CCGCCGCATC CGGGGCGAGA GTGAGCTGTA CACCAGTGAT       660ACTGTCATGC AGAACCCACA GTTCATCAAA GCCACCATCG TGCACCAAGA CCAGGCTTAC       720GATGACAAGA TCTACTACTT CTTCCGAGAG GACAATCCTG ACAAGAATCC TGAGGCTCCT       780CTCAATGTGT CCCGTGTGGC CCAGTTGTGC AGGGGGGACC AGGGTGGGGA AAGTTCACTG       840TCAGTCTCCA AGTGGAACAC TTTTCTGAAA GCCATGCTGG TATGCAGTGA TGCTGCCACC       900AACAAGAACT TCAACAGGCT GCAAGACGTC TTCCTGCTCC CTGACCCCAG CGGCCAGTGG       960AGGGACACCA GGGTCTATGG TGTTTTCTCC AACCCCTGGA ACTACTCAGC CGTCTGTGTG      1020TATTCCCTCG GTGACATTGA CAAGGTCTTC CGTACCTCCT CACTCAAGGG CTACCACTCA      1080AGCCTTCCCA ACCCGCGGCC TGGCAAGTGC CTCCCAGACC AGCAGCCGAT ACCCACAGAG      1140ACCTTCCAGG TGGCTGACCG TCACCCAGAG GTGGCGCAGA GGGTGGAGCC CATGGGGCCT      1200CTGAAGACGC CATTGTTCCA CTCTAAATAC CACTACCAGA AAGTGGCCGT TCACCGCATG      1260CAAGCCAGCC ACGGGGAGAC CTTTCATGTG CTTTACCTAA CTACAGACAG GGGCACTATC      1320CACAAGGTGG TGGAACCGGG GGAGCAGGAG CACAGCTTCG CCTTCAACAT CATGGAGATC      1380CAGCCCTTCC GCCGCGCGGC TGCCATCCAG ACCATGTCGC TGGATGCTGA GCGGAGGAAG      1440CTGTATGTGA GCTCCCAGTG GGAGGTGAGC CAGGTGCCCC TGGACCTGTG TGAGGTCTAT      1500GGCGGGGGCT GCCACGGTTG CCTCATGTCC CGAGACCCCT ACTGCGGCTG GGACCAGGGC     1560CGCTGCATCT CCATCTACAG CTCCGAACGG TCAGTGCTGC AATCCATTAA TCCAGCCGAG     1620CCACACAAGG AGTGTCCCAA CCCCAAACCA GACAAGGCCC CACTGCAGAA GGTTTCCCTG     1680GCCCCAAACT CTCGCTACTA CCTGAGCTGC CCCATGGAAT CCCGCCACGC CACCTACTCA     1740TGGCGCCACA AGGAGAACGT GGAGCAGAGC TGCGAACCTG GTCACCAGAG CCCCAACTGC     1800ATCCTGTTCA TCGAGAACCT CACGGCGCAG CAGTACGGCC ACTACTTCTG CGAGGCCCAG     1860GAGGGCTCCT ACTTCCGCGA GGCTCAGCAC TGGCAGCTGC TGCCCGAGGA CGGCATCATG     1920GCCGAGCACC TGCTGGGTCA TGCCTGTGCC CTGGCTGCCT CCCTCTGGCT GGGGGTGCTG     1980CCCACACTCA CTCTTGGCTT GCTGGTCCAC TAGGGCCTCC CGAGGCTGGG CATGCCTCAG     2040GCTTCTGCAG CCCAGGGCAC TAGAACGTCT CACACTCAGA GCCGGCTGGC CCGGGAGCTC     2100CTTGCCTGCC ACTTCTTCCA GGGGACAGAA TAACCCAGTG GAGGATGCCA GGCCTGGAGA     2160CGTCCAGCCG CAGGCGGCTG CTGGGCCCCA GGTGGCGCAC GGATGGTGAG GGGCTGAGAA     2220TGAGGGCACC GACTGTGAAG CTGGGGCATC GATGACCCAA GACTTTATCT TCTGGAAAAT     2280ATTTTTCAGA CTCCTCAAAC TTGACTAAAT GCAGCGATGC TCCCAGCCCA AGAGCCCATG     2340GGTCGGGGAG TGGGTTTGGA TAGGAGAGCT GGGACTCCAT CTCGACCCTG GGGCTGAGGC     2400CTGAGTCCTT CTGGACTCTT GGTACCCACA TTGCCTCCTT CCCCTCCCTC TCTCATGGCT     2460GGGTGGCTGG TGTTCCTGAA GACCCAGGGC TACCCTCTGT CCAGCCCTGT CCTCTGCAGC     2520TCCCTCTCTG GTCCTGGGTC CCACAGGACA GCCGCCTTGC ATGTTTATTG AAGGATGTTT     2580GCTTTCCGGA CGGAAGGACG GAAAAAGCTC TGAAAAAAAA AAAAAAAAAA AAAAAA         2636

    (2)SEQ ID NO:2的信息：

     (ⅰ)序列特征：

      (A)长度：1195个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..1195

     (ⅹⅰ)序列描述：SEQ ID NO:2:CGGGGCTGCG GGATGACGCC TCCTCCTCCC GGACGTGCCG CCCCCAGCGC ACCGCGCGCC       60CGCGTCCTCA GCCTGCCGGC TCGGTTCGGG CTCCCGCTGC GGCTGCGGCT TCTGCTGGTG      120TTCTGGGTGG CCGCCGCCTC CGCCCAAGGC CACTCGAGGA GCGGACCCCG CATCTCCGCC      180GTCTGGAAAG GGCAGGACCA TGTGGACTTT AGCCAGCCTG AGCCACACAC CGTGCTTTTC      240CATGAGCCGG GCAGCTTCTC TGTCTGGGTG GGTGGACGTG GCAAGGTCTA CCACTTCAAC      300TTCCCCGAGG GCAAGAATGC CTCTGTGCGC ACGGTGAACA TCGGCTCCAC AAAGGGGTCC      360TGTCAGGACA AACAGGACTG TGGGAATTAC ATCACTCTTC TAGAAAGGCG GGGTAATGGG      420CTGCTGGTCT GTGGCACCAA TGCCCGGAAG CCCAGCTGCT GGAACTTGGT GAATGACAGT      480GTGGTGATGT CACTTGGTGA GATGAAAGGC TATGCCCCCT TCAGCCCGGA TGAGAACTCC      540CTGGTTCTGT TTGAAGGAGA TGAAGTGTAC TCTACCATCC GGAAGCAGGA ATACAACGGG      600AAGATCCCTC GGTTTCGACG CATTCGGGGC GAGAGTGAAC TGTACACAAG TGATACAGTC      660ATGCAGAACC CACAGTTCAT CAAGGCCACC ATTGTGCACC AAGACCAAGC CTATGATGAT      720AAGATCTACT ACTTCTTCCG AGAAGACAAC CCTGACAAGA ACCCCGAGGC TCCTCTCAAT      780GTGTCCCGAG TAGCCCAGTT GTGCAGGGGG GACCAGGGTG GTGAGAGTTC GTTGTCTGTC      840TCCAAGTGGA ACACCTTCCT GAAAGCCATG TTGGTCTGCA GCGATGCAGC CACCAACAGG      900AACTTCAATC GGCTGCAAGA TGTCTTCCTG CTCCCTGACC CCAGTGGCCA GTGGAGAGAT      960ACCAGGGTCT ATGGCGTTTT CTCCAACCCC TGGAACTACT CAGCTGTCTG CGTGTATTCG     1020CTTGGTGACA TTGACAGAGT CTTCCGTACC TCATCGCTCA AAGGCTACCA CATGGGCCTT     1080TCCAACCCTC GACCTGGCAT GTGCCTCCCA AAAAAGCAGC CCATACCCAC AGAAACCTTC     1140CAGGTAGCTG ATAGTCACCC AGAGGTGGCT CAGAGGGTGG AACCTATGGG GCCCC          1195

    (2)SEQ ID NO:3的信息：

     (ⅰ)序列特征：

      (A)长度：666个氨基酸

      (B)类型：氨基酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：蛋白质

     (ⅸ)特征：

      (A)名称/关键词：蛋白质

      (B)位置：1..666

     (ⅸ)特征：

      (A)名称/关键词：蛋白质

      (B)位置：1..666

     (ⅹⅰ)序列描述：SEQ ID NO:3:Met Thr Pro Pro Pro Pro Gly Arg Ala Ala Pro Ser Ala Pro Arg Ala1                5                   10                  15Arg Val Pro Gly Pro Pro Ala Arg Leu Gly Leu Pro Leu Arg Leu Arg

             20                  25                  30Leu Leu Leu Leu Leu Trp Ala Ala Ala Ala Ser Ala Gln Gly His Leu

         35                  40                  45Arg Ser Gly Pro Arg Ile Phe Ala Val Trp Lys Gly His Val Gly Gln

     50                  55                  60Asp Arg Val Asp Phe Gly Gln Thr Glu Pro His Thr Val Leu Phe His65                  70                  75                  80Glu Pro Gly Ser Ser Ser Val Trp Val Gly Gly Arg Gly Lys Val Tyr

                85                  90                  95Leu Phe Asp Phe Pro Glu Gly Lys Asn Ala Ser Val Arg Thr Val Asn

            100                 105                 110Ile Gly Ser Thr Lys Gly Ser Cys Leu Asp Lys Arg Asp Cys Glu Asn

        115                 120                 125Tyr Ile Thr Leu Leu Glu Arg Arg Ser Glu Gly Leu Leu Ala Cys Gly

    130                 135                 140Thr Asn Ala Arg His Pro Ser Cys Trp Asn Leu Val Asn Gly Thr Val145                 150                 155                 160Val Pro Leu Gly Glu Met Arg Gly Tyr Ala Pro Phe Ser Pro Asp Glu

            165                     170                 175Asn Ser Leu Val Leu Phe Glu Gly Asp Glu Val Tyr Ser Thr Ile Arg

            180                 185                 190Lys Gln Glu Tyr Asn Gly Lys Ile Pro Arg Phe Arg Arg Ile Arg Gly

        195                 200                 205Glu Ser Glu Leu Tyr Thr Ser Asp Thr Val Met Gln Asn Pro Gln Phe

    210                 215                 220Ile Lys Ala Thr Ile Val His Gln Asp Gln Ala Tyr Asp Asp Lys Ile225                 230                 235                 240Tyr Tyr Phe Phe Arg Glu Asp Asn Pro Asp Lys Asn Pro Glu Ala Pro

                245                 250                 255Leu Asn Val Ser Arg Val Ala Gln Leu Cys Arg Gly Asp Gln Gly Gly

            260                 265                 270Glu Ser Ser Leu Ser Val Ser Lys Trp Asn Thr Phe Leu Lys Ala Met

        275                 280                 285Leu Val Cys Ser Asp Ala Ala Thr Asn Lys Asn Phe Asn Arg Leu Gln

    290                 295                 300Asp Val Phe Leu Leu Pro Asp Pro Ser Gly Gln Trp Arg Asp Thr Arg305                 310                 315                 320Val Tyr Gly Val Phe Ser Asn Pro Trp Asn Tyr Ser Ala Val Cys Val

                325                 330                 335Tyr Ser Leu Gly Asp Ile Asp Lys Val Phe Arg Thr Ser Ser Leu Lys

            340                 345                 350Gly Tyr His Ser Ser Leu Pro Asn Pro Arg Pro Gly Lys Cys Leu Pro

        355                 360                 365Asp Gln Gln Pro Ile Pro Thr Glu Thr Phe Gln Val Ala Asp Arg His

    370                 375                 380Pro Glu Val Ala Gln Arg Val Glu Pro Mer Gly Pro Leu Lys Thr Pro385                 390                 395                 400Leu Phe His Ser Lys Tyr His Tyr Gln Lys Val Ala Val His Arg Met

                405                 410                 415Gln Ala Ser His Gly Glu Thr Phe His Va1 Leu Tyr Leu Thr Thr Asp

            420                 425                 430Arg Gly Thr Ile His Lys Val Val Glu Pro Gly Glu Gln Glu His Ser

        435                 440                 445Phe Ala Phe Asn Ile Met Glu Ile Gln Pro Phe Arg Arg Ala Ala Ala

    450                 455                 460Ile Gln Thr Met Ser Leu Asp Ala Glu Arg Arg Lys Leu Tyr Val Ser465                 470                 475                 480Ser Gln Trp Glu Val Ser Gln Val Pro Leu Asp Leu Cys Glu Val Tyr

                485                 490                 495Gly Gly Gly Cys His Gly Cys Leu Met Ser Arg Asp Pro Tyr Cys Gly

            500                 505                 510Trp Asp Gln G1y Arg Cys Ile Ser Ile Tyr Ser Ser Glu Arg Ser Val

        515                 520                 525Leu Gln Ser Ile Asn Pro Ala Glu Pro His Lys Glu Cys Pro Asn Pro

    530                 535                 540Lys Pro Asp Lys Ala Pro Leu Gln Lys Val Ser Leu Ala Pro Asn Ser545                 550                 555                 560Arg Tyr Tyr Leu Ser Cys Pro Met Glu Ser Arg His Ala Thr Tyr Ser

                565                570                 575Trp Arg His Lys Glu Asn Val Glu Gln Ser Cys Glu Pro Gly His Gln

            580                 585                 590Ser Pro Asn Cys Ile Leu Phe Ile Glu Asn Leu Thr Ala Gln Gln Tyr

        595                 600                 605Gly His Tyr Phe Cys Glu Ala Gln Glu Gly Ser Tyr Phe Arg Glu Ala

    610                 615                 620Gln His Trp Gln Leu Leu Pro Glu Asp Gly Ile Met Ala Glu His Leu625                 630                 635                 640Leu Gly His Ala Cys Ala Leu Ala Ala Ser Leu Trp Leu Gly Val Leu

                645                 650                 655Pro Thr Leu Thr Leu Gly Leu Leu Val His

            660                 665

    (2)SEQ ID NO:4的信息：

     (ⅰ)序列特征：

      (A)长度：394个氨基酸

      (B)类型：氨基酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：蛋白质

     (ⅸ)特征：

      (A)名称/关键词：蛋白质

      (B)位置：1..394

     (ⅹⅰ)序列描述：SEQ ID NO:4:Met Thr Pro Pro Pro Pro Gly Arg Ala Ala Pro Ser Ala Pro Arg Ala1               5                    10                  15Arg Val Leu Ser Leu Pro Ala Arg Phe Gly Leu Pro Leu Arg Leu Arg

            20                  25                  30Leu Leu Leu Val Phe Trp Val Ala Ala Ala Ser Ala Gln Gly His Ser

        35                  40                  45Arg Ser Gly Pro Arg Ile Ser Ala Va1 Trp Lys Gly Gln Asp His Val

    50                  55                  60Asp Phe Ser Gln Pro Glu Pro His Thr Val Leu Phe His Glu Pro Gly65                  70                  75                  80Ser Phe Ser Val Trp Val Gly Gly Arg Gly Lys Val Tyr Hia Phe Asn

                85                  90                  95Phe Pro Glu Gly Lys Asn Ala Ser Val Arg Thr Val Asn Ile Gly Ser

            100                 105                 110Thr Lys Gly Ser Cys Gln Asp Lys Gln Asp Cys Gly Asn Tyr Ile Thr

        115                 120                 125Leu Leu Glu Arg Arg Gly Asn Gly Leu Leu Val Cys Gly Thr Asn Ala

    130                 135                 140Arg Lys Pro Ser Cys Trp Asn Leu Val Asn Asp Ser Val Val Met Ser145                 150                 155                 160Leu Gly Glu Met Lys Gly Tyr Ala Pro Phe Ser Pro Asp Glu Asn Ser

                165                 170                 175Leu Val Leu Phe Glu Gly Asp Glu Val Tyr Ser Thr Ile Arg Lys Gln

            180                 185                 190Glu Tyr Asn Gly Lys Ile Pro Arg Phe Arg Arg Ile Arg Gly Glu Ser

        195                 200                 205Glu Leu Tyr Thr Ser Asp Thr Val Met Gln Asn Pro Gln Phe Ile Lys

    210                 215                 220Ala Thr Ile Val His Gln Asp Gln Ala Tyr Asp Asp Lys Ile Tyr Tyr225                 230                 235                 240Phe Phe Arg Glu Asp Asn Pro Asp Lys Asn Pro Glu Ala Pro Leu Asn

                245                 250                 255Val Ser Arg Val Ala Gln Leu Cys Arg Gly Asp Gln Gly Gly Glu Ser

            260                 265                 270Ser Leu Ser Val Ser Lys Trp Asn Thr Phe Leu Lys Ala Met Leu Val

        275                 280                 285Cys Ser Asp Ala Ala Thr Asn Arg Asn Phe Asn Arg Leu Gln Asp Val

    290                 295                 300Phe Leu Leu Pro Asp Pro Ser Gly Gln Trp Arg Asp Thr Arg Val Tyr305                 310                 315                 320Gly Val Phe Ser Asn Pro Trp Asn Tyr Ser Ala Val Cys Val Tyr Ser

                325                 330                 335Leu Gly Asp Ile Asp Arg Val Phe Arg Thr Ser Ser Leu Lys Gly Tyr

            340                 345                 350His Met Gly Leu Ser Asn Pro Arg Pro Gly Met Cys Leu Pro Lys Lys

        355                 360                 365Gln Pro Ile Pro Thr Glu Thr Phe Gln Val Ala Asp Ser His Pro Glu

    370                 375                 380Val Ala Gln Arg Val Glu Pro Met Gly Pro385                 390

    (2)SEQ ID NO:5的信息：

     (ⅰ)序列特征：

      (A)长度：23个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..23

     (ⅹⅰ)序列描述：SEQ ID NO:5:ACTCACTATAGGGCTCGAGCGGC    23

    (2)SEQ ID NO:6的信息：

     (ⅰ)序列特征：

      (A)长度：20个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..20

     (ⅹⅰ)序列描述：SEQ ID NO:6:AGCCGCACACGGTGCTTITC    20

    (2)SEQ ID NO:7的信息:

     (ⅰ)序列特征：

      (A)长度：20个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..20

     (ⅹⅰ)序列描述：SEQ ID NO:7:GCACAGATGCGITCITGCCC    20

    (2)SEQ ID NO:8的信息：

     (ⅰ)序列特征：

      (A)长度：20个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..20

     (ⅹⅰ)序列描述：SEQ ID NO:8:ACCATAGACCCTGGTGTCCC

    (2)SEQ ID NO:9的信息：

     (ⅰ)序列特征：

      (A)长度：20个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..20

     (ⅹⅰ)序列描述：SEQ ID NO:9:GCAGTGATGCTGCCACCAAC    20

    (2)SEQ ID NO:10的信息：

     (ⅰ)序列特征：

      (A)长度：20个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..20

     (ⅹⅰ)序列描述：SEQ ID NO:10:CCAGACCATGTCGCTGGATG    20

    (2)SEQ ID NO:11的信息：

     (ⅰ)序列特征：

      (A)长度：20个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..20

     (ⅹⅰ)序列描述：SEQ ID NO:11:ACATGAGGCAACCGTGGGCAG    20

    (2)SEQ ID NO:12的信息：

     (ⅰ)序列特征：

      (A)长度：27个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..27

     (ⅹⅰ)序列描述：SEQ ID NO:12:CCATCCTAATACGACTCACTATAGGGC    27

    (2)SEQ ID NO:13的信息：

     (ⅰ)序列特征：

      (A)长度：20个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..20

     (ⅹⅰ)序列描述：SEQ ID NO:13:AGGTAGACCTTGCCACGTCC    20

    (2)SEQ ID NO:14的信息：

     (ⅰ)序列特征：

      (A)长度：23个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..23

     (ⅹⅰ)序列描述：SEQ ID NO:14:GAACTTCAACAGGCTGCAAG ACG    23

    (2)SEQ ID NO:15的信息：

     (ⅰ)序列特征：

      (A)长度：20个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..20

     (ⅹⅰ)序列描述：SEQ ID NO:15:ATGCTGAGCGGAGGAACGCTG    20

    (2)SEQ ID NO:16的信息：

     (ⅰ)序列特征：

      (A)长度：20个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..20

     (ⅹⅰ)序列描述：SEQ ID NO:16:CCGCCATACACCTCACACAG    20

    (2)SEQ ID NO:17的信息：

     (ⅰ)序列特征：

      (A)长度：28个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..28

     (ⅹⅰ)序列描述：SEQ ID NO:17:CTGGAAGCTTTCTGTGGGTATCGGCTGC    28

    (2)SEQ ID NO:18的信息：

     (ⅰ)序列特征：

      (A)长度：25个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..25

     (ⅹⅰ)序列描述：SEQ ID NO:18:TTTGGATCCCTGGTTCTGTTTGAAG    25

    (2)SEQ ID NO:19的信息：

     (ⅰ)序列特征：

      (A)长度：50个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..50

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..50

     (ⅹⅰ)序列描述：SEQ ID NO:19:TTCTAGAATT CAGCGGCCGC TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT50

    (2)SEQ ID NO:20的信息：

     (ⅸ)序列特征：

      (A)长度：27个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..27

     (ⅹⅰ)序列描述：SEQ ID NO:20:GGGGAAAGTTCACTGTCAGTCTCCAAG    27

    (2)SEQ ID NO:21的信息：

     (ⅰ)序列特征：

      (A)长度：26个碱基对

      (8)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..26

     (ⅹⅰ)序列描述：SEQ ID NO:21:GGGAATACACACAGACGGCTGAGTAG    26

    (2)SEQ ID NO:22的信息：

     (ⅰ)序列特征：

      (A)长度：22个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..22

     (ⅹⅰ)序列描述：SEQ ID NO:22:AGCAAGTTCAGCCTGGTTAAGT    22

    (2)SEQ ID NO:23的信息：

     (ⅰ)序列特征：

      (A)长度：21个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..21

     (ⅹⅰ)序列描述：SEQ ID NO:23:TTATGAGTATTTCTTCCAGGG    21

    (2)SEQ ID NO:24的信息：

     (ⅰ)序列特征：

      (A)长度：26个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..26

     (ⅹⅰ)序列描述：SEQ ID NO:24:CCAITAATCCAGCCGAGCCACACAAG    26

    (2)SEQ ID NO:25的信息：

     (ⅰ)序列特征：

      (A)长度：25个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..25

     (ⅹⅰ)序列描述：SEQ ID NO:25:CATCTACAGCTCCGAACGGTCAGTG    25

    (2)SEQ ID NO:26的信息：

     (ⅰ)序列特征：

      (A)长度：20个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..20

     (ⅹⅰ)序列描述：SEQ ID NO:26:CAGCGGAAGCCCCAACCGAG    20

    (2)SEQ ID NO:27的信息：

     (ⅰ)序列特征：

      (A)长度：23个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..23

     (ⅹⅰ)序列描述：SEQ ID NO:27:GGGATGACGCCTCCTCCGCCCGG    23

    (2)SEQ ID NO:28的信息：

     (ⅰ)序列特征：

      (A)长度：31个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..31

     (ⅹⅰ)序列描述：SEQ ID NO：28:AAGCTTCACGTGGACCAGCAAGCCAAGAGTG    31

    (2)SEQ ID NO:29的信息:

     (ⅰ)序列特征：

      (A)长度：25个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..25

     (ⅹⅰ)序列描述：SEQ ID NO:29:AAGCTTTTTCCGTCCTTCCGTCCGG    25

    (2)SEQ ID NO:30的信息：

     (ⅰ)序列特征：

      (A)长度：24个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..24

     (ⅹⅰ)序列描述：SEQ ID NO:30:ATGGTGAGCAAGGGCGAGGAGCTG    24

    (2)SEQ ID NO:31的信息：

     (ⅰ)序列特征：

      (A)长度：24个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..24

     (ⅹⅰ)序列描述：SEQ ID NO:31:CITGTACAGCTCGTCCATGCCGAG    24

    (2)SEQ ID NO:32的信息：

     (ⅰ)序列特征：

      (A)长度：25个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..25

     (ⅹⅰ)序列描述：SEQ ID NO:32:GGGTGGTGAGAGTTCGTTGTCTGTC    25

    (2)SEQ ID NO::33的信息：

     (ⅰ)序列特征：    .

      (A)长度：25个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..25

     (ⅹⅰ)序列描述：SEQ ID NO:33:GAGCGATGAGGTACGGAAGACTCTG    25

    (2)SEQ ID NO:34的信息：

     (ⅰ)序列特征：

      (A)长度：5856个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..5856

     (ⅹⅰ)序列描述：SEQ ID NO:34:AGCGCCCAAT ACGCAAACCG CCTCTCCCCG CGCGTTGGCC GATTCATTAA TGCAGCTGGC      60ACGACAGGTT TCCCGACTGG AAAGCGGGCA GTGAGCGCAA CGCAATTAAT GTGAGTTAGC     120TCACTCATTA GGCACCCCAG GCTTTACACT TTATGCTTCC GGCTCGTATG TTGTGTGGAA     180TTGTGAGCGG ATAACAATTT CACACAGGAA ACAGCTATGA CCATGATTAC GCCAAGCTTC     240ACGTGGACCA GCAAGCCAAG AGTGAGTGTG GGCAGCACCC CCAGCCAGAG GGAGGCAGCC     300AGGGCACAGG CATGACCCAG CAGGTGCTCG GCCATGATGC CGTCCTCGGG CAGCAGCTGC     360CAGTGCTGAG CCTCGCGGAA GTAGGAGCCC TCCTGGGCCT CGCAGAAGTA GTGGCCGTAC     420TGCTGCGCCG TGAGGTTCTC GATGAACAGG ATGCAGTTGG GGCTCTGGTG ACCAGGTTCG     480CAGCTCTGCT CCACGTTCTC CTTGTGGCGC CATGAGTAGG TGGCGTGGCG GGATTCCATG     540GGGCAGCTCA GGTAGTAGCG AGAGTTTGGG GCCAGGGAAA CCTTCTGCAG TGGGGCCTTG     600TCTGGTTTGG GGTTGGGACA CTCCTTGTGT GGCTCGGCTG GATTAATGGA TTGCAGCACT     660GACCGTTCGG AGCTGTAGAT GGAGATGCAG CGGCCCTGGT CCCAGCCGCA GTAGGGGTCT     720CGGGACATGA GGCAACCGTG GCAGCCCCCG CCATAGACCT CACACAGGTC CAGGGGCACC     780TGGCTCACCT CCCACTGGGA GCTCACATAC AGCTTCCTCC GCTCAGCATC CAGCGACATG     840GTCTGGATGG CAGCCGCGCG GCGGAAGGGC TGGATCTCCA TGATGTTGAA GGCGAAGCTG     900TGCTCCTGCT CCCCCGGTTC CACCACCTTG TGGATAGTGC CCCTGTCTGT AGTTAGGTAA     960AGCACATGAA AGGTCTCCCC GTGGCTGGCT TGCATGCGGT GAACGGCCAC TTTCTGGTAG    1020TGGTATTTAG AGTGGAACAA TGGCGTCTTC AGAGGCCCCA TGGGCTCCAC CCTCTGCGCC    1080ACCTCTGGGT GACGGTCAGC CACCTGGAAG GTCTCTGTGG GTATCGGCTG CTGGTCTGGG    1140AGGCACTTGC CAGGCCGCGG GTTGGGAAGG CTTGAGTGGT AGCCCTTGAG TGAGGAGGTA    1200CGGAAGACCT TGTCAATGTC ACCGAGGGAA TACACACAGA CGGCTGAGTA GTTCCAGGGG    1260TTGGAGAAAA CACCATAGAC CCTGGTGTCC CTCCACTGGC CGCTGGGGTC AGGGAGCAGG    1320AAGACGTCTT GCAGCCTGTT GAAGTTCTTG TTGGTGGCAG CATCACTGCA TACCAGCATG    1380CCTTTCAGAA AAGTGTTCCA CTTGGAGACT GACAGTGAAC TTTCCCCACC CTGGTCCCCC    1440CTGCACAACT GGGCCACACG GGACACATTG AGAGGAGCCT CAGGATTCTT GTCAGGATTG    1500TCCTCTCGGA AGAAGTAGTA GATCTTGTCA TCGTAAGCCT GGTCTTGGTG CACGATGGTG    1560GCTTTGATGA ACTGTGGGTT CTGCATGACA GTATCACTGG TGTACAGCTC ACTCTCGCCC    1620CGGATGCGGC GGAACCGAGG GATGTTCCCA TTGTATTCCT GCTTCCGGAT GGTGGAATAC    1680ACCTCGTCCC CTTCAAACAG AACCAGGGAG TTCTCGTCCG GGCTGAAGGG GGCGTAGCCT    1740CTCATCTCGC CAAGTGGCAC CACAGTGCCA TTCACCAGGT TCCAGCAGCT GGGGTGCCGG    1800GCGTTGGTGC CACAGGCCAG CAGCCCCTCA CTCCGCCTCT CCAGGAGAGT GATGTAGTTC    1860TCGCAGTCCC GCTTATCCAG ACAGGACCCC TTTGTGGAGC CGATATTCAC CGTGCGCACA    1920GATGCGTTCT TGCCCTCGGG GAAGTCAAAG AGGTAGACCT TGCCACGTCG TCCCACCCAC    1980ACAGAGGAGC TGCCTGGCTC GTGGAAAAGC ACCGTGTGCG GCTCAGTCTG GCCAAAGTCC    2040ACCCGGTCCT GCCCTACATG GCCTTTCCAG ACGGCGAAGA TGCGGGGTCC GCTCCTTAGG    2100TGGCGCTGGG CGGAGGCGGC GGCCGCCCAG AGCAGCAGCA GCAGCCGCAG CCGCAGCGGA    2160AGCCCCAACC GAGCCGGCGG GCCAGGGACG CGGGCGCGCG GTGCGCTGGG GGCGGCACGT    2220CCGGGCGGAG GAGGCGTCAT CCCAAGCCGA ATTCTGCAGA TATCCATCAC ACTGGCGGCC    2280GCTCGAGCAT GCATCTAGAG GGCCCAATTC GCCCTATAGT GAGTCGTATT ACAATTCACT    2340GGCCGTCGTT TTACAACGTC GTGACTGGGA AAACCCTGGC GTTACCCAAC TAAATCGCCT    2400TGCAGCACAT CCCCCTTTCG CCAGCTGGCG TAATAGCGAA GAGGCCCGCA CCGATCGCCC    2460TTCCCAACAG TTGCGCAGCC TGAATGGCGA ATGGGACGCG CCCTGTAGCG GCGCATTAAG    2520CGCGGCGGGT GTGGTGGTTA CGCGCAGCGT GACCGCTACA CTTGCGAGCG CCGTAGCGCC    2580CGCTCCTTTC GCTTTCTTCC CTTCCTTTCT CGCCACGTTC GCCGGCTTTC CCCGTCAAGC    2640TCTAAATCGG GGGCTCCCTT TAGGGTTCCG ATTTAGAGCT TTACGGCACC TCGACCGCAA    2700AAAACTTGAT TTGGGTGATG GTTCACGTAG TGGGCCATCG CGCTGATAGA CGGTTTTTCG    2760CCCTTTGAGG TTGGAGTCCA CGTTCTTTAA TAGTGGACTC TTGTTCCAAA CTGGAACAAC    2820ACTCAACCCT ATCGCGGTCT ATTCTTTTGA TTTATAAGGG ATTTTGCCGA TTTCGGCCTA    2880TTGGTTAAAA AATGAGCTGA TTTAACAAAT TCAGGGGGCA AGGGCTGCTA AAGGAACCGG    2940AACACGTAGA AAGCCAGTCC GCAGAAACGG TGCTGAGCCC GGATGAATGT CAGCTACTGG    3000GCTATCTGGA CAAGGGAAAA CGCAAGCGCA AAGAGAAAGC AGGTAGCTTG CAGTGGGCTT    3060ACATGGCGAT AGCTAGACTG GGCGGTTTTA TGGACAGCAA GCGAACCGGA ATTGCCAGCT    3120GGGGCGCCCT CTGGTAAGGT TGGGAAGCCC TGCAAAGTAA ACTGGATGGC TTTCTTGCCG    3180CCAAGGATCT GATGGCGCAG GGGATCAAGA TCTGATCAAG AGACAGGATG AGGATCGTTT    3240CGCATGATTG   AACAAGATGG   ATTGCACGCA   GGTTCTCCGG   CCGCTTGGGT   GGAGAGGCTA     3300TTCGGCTATG   ACTGGGCACA   ACAGACAATC   GGCTGCTCTG   ATGCCGCCGT   GTTCCGGCTG     3360TCAGCGCAGG   GGCGCCCGGT   TCTTTTTGTC   AAGACCGACC   TGTCCGGTGC   CCTGAATGAA     3420CTGCAGGACG   AGGCAGCGCG   GCTATCGTGG   CTGGCCACGA   CGGGCGTTCC   TTGCGCAGCT     3480GTGCTCGACG   TTGTCACTGA   AGCGGGAAGG   GACTGGCTGC   TATTGGGCGA   AGTGCCGGGG     3540CAGGATCTCC   TGTCATCTCG   CCTTGCTCCT   GCCGAGAAAG   TATCCATCAT   GGCTGATGCA     3600ATGCGGCGGC   TGCATACGCT   TGATCCGGCT   ACCTGCCCAT   TCGACCACCA   AGCGAAACAT     3660CGCATCGAGC   GAGCACGTAC   TCGGATGGAA   GCCGGTCTTG   TCGATCAGGA   TGATCTGGAC     3720GAAGAGCATC   AGGGGCTCGC   GCCAGCCGAA   CTGTTCGCCA   GGCTCAAGGC   GCGCATGCCC     3780GACGGCGAGG   ATCTCGTCGT   GATCCATGGC   GATGCCTGCT   TGCCGAATAT   CATGGTGGAA     3840AATGGCCGCT   TTTCTGGATT   CAACGACTGT   GGCCGGCTGG   GTGTGGCGGA   CCGCTATCAG     3900GACATAGCGT   TGGATACCCG   TGATATTGCT   GAAGAGCTTG   GCGGCGAATG   GGCTGACCGC     3960TTCCTCGTGC   TTTAcGGTAT   CGCCGCTCCC   GATTCGCAGC   GCATCGCCTT   CTATCGCCTT     4020CTTGACGAGT   TCTTCTGAAT   TGAAAAAGGA   AGAGTATGAG   TATTCAACAT   TTCCGTGTCG     4080CCCTTATTCC   CTTTTTTGCG   GCATTTTGCC   TTCCTGTTTT   TGCTCACCCA   GAAACGCTGG     4140TGAAAGTAAA   AGATGCTGAA   GATCAGTTGG   GTGCACGAGT   GGGTTACATC   GAACTGGATC     4200TCAACAGCGG   TAAGATCCTT   GAGAGTTTTC   GCCCCGAAGA   ACGTTTTCCA   ATGATGAGCA     4260CTTTTAAAGT   TCTGCTATGT   CATACACTAT   TATCCCGTAT   TGACGCCGGG   CAAGAGCAAC     4320TCGGTCGCCG   GGCGCGGTAT   TCTCAGAATG   ACTTGGTTGA   GTACTCACCA   GTCACAGAAA     4380AGCATCTTAC   GGATGGCATG   ACAGTAAGAG   AATTATGCAG   TGCTGCCATA   ACCATGAGTG     4440ATAACACTGC   GGCCAACTTA   CTTCTGACAA   CGATCGGAGG   ACCGAAGGAG   CTAACCGCTT     4500TTTTGCACAA   CATGGGGGAT   CATGTAACTC   GCCTTGATCG   TTGGGAACCG   GAGCTGAATG     4560AAGCCATACC   AAACGACGAG   AGTGACACCA   CGATGCCTGT   AGCAATGCCA   ACAACGTTGC     4620GCAAACTATT   AACTGGCGAA   CTACTTACTC   TAGCTTCCCG   GCAACAATTA   ATAGACTGGA     4680TGGAGGCGGA   TAAAGTTGCA   GGACCACTTC   TGCGCTCGGC   CCTTCCGGCT   GGCTGGTTTA     4740TTGCTGATAA   ATCTGGAGCC   GGTGAGCGTG   GGTCTCGCGG   TATCATTGCA   GCACTGGGGC     4800CAGATGGTAA   GCCCTCCCGT   ATCGTAGTTA   TCTACACGAC   GGGGAGTCAG   GCAACTATGG     4860ATGAACGAAA   TAGACAGATC   GCTGAGATAG   GTGCCTCACT   GATTAAGCAT   TGGTAACTGT     4920CAGACCAAGT   TTACTCATAT   ATACTTTAGA   TTGATTTAAA   ACTTCATTTT   TAATTTAAAA     4980GGATCTAGGT   GAAGATCCTT   TTTGATAATC   TCATGACCAA   AATCCCTTAA   CGTGAGTTTT     5040CGTTCCACTG   AGCGTCAGAC   CCCGTAGAAA   AGATCAAAGG   ATCTTCTTGA   GATCCTTTTT     5100TTCTGCGCGT   AATCTGCTGC   TTGCAAACAA   AAAAACCACC   GCTACCAGCG   GTGGTTTGTT     5160TGCCGGATCA   AGAGCTACCA   ACTCTTTTTC   CGAAGGTAAC   TGGCTTCAGC   AGAGCGCAGA     5220TACCAAATAC   TGTCCTTCTA   GTGTAGCCGT   AGTTAGGCCA   CCACTTCAAG   AACTCTGTAG     5280CACCGCCTAC   ATACCTCGCT   CTGCTAATCC   TGTTACCAGT   GGCTGCTGCC   AGTGGCGATA     5340AGTCGTGTCT   TACCGGGTTG   GACTCAAGAC   GATAGTTACC   GGATAAGGCG   CAGCGGTCGG     5400GCTGAACGGG   GGGTTCGTGC   ACACAGCCCA   GCTTGGAGCG   AACGACCTAC   ACCGAACTGA     5460GATACCTACA   GCGTGAGCAT   TGAGAAAGCG   CCACGCTTCC   CGAAGGGAGA   AAGGCGGACA     5520GGTATCCGGT   AAGCGGCAGG   GTCGGAACAG   GAGAGCGCAC   GAGGGAGCTT   CCAGGGGGAA     5580ACGCCTGGTA   TCTTTATAGT   CCTGTCGGGT   TTCGCCACCT   CTGACTTGAG   CGTCGATTTT     5640TGTGATGCTC   GTCACGGGGG   CGGAGCCTAT   GGAAAAACGC   CAGCAACGCG   GCCTTTTTAC     5700GGTTCCTGGC   CTTTTGCTGG   CCTTTTGCTC   ACATGTTCTT   TCCTGCGTTA   TCCGCTGATT     5760CTGTGGATAA   CCGTATTACC   GCCTTTGAGT   GAGCTGATAC   CGCTCGCCGC   AGCCGAACGA     5820CCGAGCGCAG   CGAGTCAGTG   AGCGAGGAAG   CGGAAG                                   5856(2)SEQ ID NO:35的信息：

    (ⅰ)序列特征：

      (A)长度：7475个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

    (ⅱ)分子类型：DNA(基因组的)

    (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..7475

    (ⅹⅰ)序列描述：SEQ ID NO:35:GACGGATCGG GAGATCTCCC GATCCCCTAT GGTCGACTCT CAGTACAATC TGCTCTGATG      60CCGCATAGTT AAGCCAGTAT CTGCTCCCTG CTTGTGTGTT GGAGGTCGCT GAGTAGTGCG     120CGAGCAAAAT TTAAGCTACA ACAAGGCAAG GCTTGACCGA CAATTGCATG AAGAATCTGC     180TTAGGGTTAG GCGTTTTGCG CTGCTTCGCG ATGTACGGGC CAGATATACG CGTTGACATT     240GATTATTGAC   TAGTTATTAA   TAGTAATCAA   TTACGGGGTC   ATTAGTTCAT   AGCCCATATA      300TGGAGTTCCG   CGTTACATAA   CTTACGGTAA   ATGGCCCGCC   TGGCTGACCG   CCCAACGACC      360CCCGCCCATT   GACGTCAATA   ATGACGTATG   TTCCCATAGT   AACGCCAATA   GGGACTTTCC      420ATTGACGTCA   ATGGGTGGAC   TATTTACGGT   AAACTGCCCA   CTTGGCAGTA   CATCAAGTGT      480ATCATATGCC   AAGTACGCCC   CCTATTGACG   TCAATGACGG   TAAATGGCCC   GCCTGGCATT      540ATGCCCAGTA   CATGACCTTA   TGGGACTTTC   CTACTTGGCA   GTACATCTAC   GTATTAGTCA      600TCGCTATTAC   CATGGTGATG   CGGTTTTGGC   AGTACATCAA   TGGGCGTGGA   TAGCGGTTTG      660ACTCACGGGG   ATTTCCAAGT   CTCCACCCCA   TTGACGTCAA   TGGGAGTTTG   TTTTGGCACC      720AAAATCAACG   GGACTTTCCA   AAATGTCGTA   ACAACTCCGC   CCCATTGACG   CAAATGGGCG      780GTAGGCGTGT   ACGGTGGGAG   GTCTATATAA   GCAGAGCTCT   CTGGCTAACT   AGAGAACCCA      840CTGCTTACTG   GCTTATCGAA   ATTAATACGA   CTCACTATAG   GGAGACCCAA   GCTGGCTAGC      900GTTTAAACGG   GCCCTCTAGA   CTCGAGCGGC   CGCCACTGTG   CTGGATATCT   GCAGAATTCG      960GCTTGGGATG   ACGCCTCCTC   CGCCCGGACG   TGCCGCCCCC   AGCGCACCGC   GCGCCCGCGT     1020CCCTGGCCCG   CCGGCTCGGT   TGGGGCTTCC   GCTGCGGCTG   CGGCTGCTGC   TGCTGCTCTG     1080GGCGGCCGCC   GCCTCCGCCC   AGGGCCACCT   AAGGAGCGGA   CCCCGCATCT   TCGCCGTCTG     1140GAAAGGCCAT   GTAGGGCAGG   ACCGGGTGGA   CTTTGGCCAG   ACTGAGCCGC   ACACGGTGCT     1200TTTCCACGAG   CCAGGCAGCT   CCTCTGTGTG   GGTGGGAGGA   CGTGGCAAGG   TCTACCTCTT     1260TGACTTCCCC   GAGGGCAAGA   ACGCATCTGT   GCGCACGGTG   AATATCGGCT   CCACAAAGGG     1320GTCCTGTCTG   GATAAGCGGG   ACTGCGAGAA   CTACATCACT   CTCCTGGAGA   GGCGGAGTGA     1380GGGGCTGCTG   GCCTGTGGCA   CCAACGCCCG   GCACCCCAGC   TGCTGGAACC   TGGTGAATGG     1440CACTGTGGTG   CCACTTGGCG   AGATGAGAGG   CTACGCCCCC   TTCAGCCCGG   ACGAGAACTC     1500CCTGGTTCTG   TTTGAAGGGG   ACGAGGTGTA   TTCCACCATC   CGGAAGCAGG   AATACAATGG     1560GAAGATCCCT   CGGTTCCGCC   GCATCCGGGG   CGAGAGTGAG   CTGTACACCA   GTGATACTGT     1620CATGCAGAAC   CCACAGTTCA   TCAAAGCCAC   CATCGTGCAC   CAAGACCAGG   CTTACGATGA     1680CAAGATCTAC   TACTTCTTCC   GAGAGGACAA   TCCTGACAAG   AATCCTGAGG   CTCCTCTCAA     1740TGTGTCCCGT   GTGGCCCAGT   TGTGCAGGGG   GGACCAGGGT   GGGGAAAGTT   CACTGTCAGT     1800CTCCAAGTGG   AACACTTTTC   TGAAAGCCAT   GCTGGTATGC   AGTGATGCTG   CCACCAACAA     1860GAACTTCAAC   AGGCTGCAAG   ACGTCTTCCT   GCTCCCTGAC   CCCAGCGGCC   AGTGGAGGGA     1920CACCAGGGTC   TATGGTGTTT   TCTCCAACCC   CTGGAACTAC   TCAGCCGTCT   GTGTGTATTC     1980CCTCGGTGAC   ATTGACAAGG   TCTTCCGTAC   CTCCTCACTC   AAGGGCTACC   ACTCAAGCCT     2040TCCCAACCCG   CGGCCTGGCA   AGTGCCTCCC   AGACCAGCAG   CCGATACCCA   CAGAGACCTT     2100CCAGGTGGCT   GACCGTCACC   CAGAGGTGGC   GCAGAGGGTG   GAGCCCATGG   GGCCTCTGAA     2160GACGCCATTG   TTCCACTCTA   AATACCACTA   CCAGAAAGTG   GCCGTTCACC   GCATGCAAGC     2220CAGCCACGGG   GAGACCTTTC   ATGTGCTTTA   CCTAACTACA   GACAGGGGCA   CTATCCACAA     2280GGTGGTGGAA   CCGGGGGAGC   AGGAGCACAG   CTTCGCCTTC   AACATCATGG   AGATCCAGCC     2340CTTCCGCCGC   GCGGCTGCCA   TCCAGACCAT   GTCGCTGGAT   GCTGAGCGGA   GGAAGCTGTA     2400TGTGAGCTCC   CAGTGGGAGG   TGAGCCAGGT   GCCCCTGGAC   CTGTGTGAGG   TCTATGGCGG     2460GGGCTGCCAC   GGTTGCCTCA   TGTCCCGAGA   CCCCTACTGC   GGCTGGGACC   AGGGCCGCTG     2520CATCTCCATC   TACAGCTCCG   AACGGTCAGT   GCTGCAATCC   ATTAATCCAG   CCGAGCCACA     2580CAAGGAGTGT   CCCAACCCCA   AACCAGACAA   GGCCCCACTG   CAGAAGGTTT   CCCTGGCCCC     2640AAACTCTCGC   TACTACCTGA   GCTGCCCCAT   GGAATCCCGC   CACGCCACCT   ACTCATGGCG     2700CCACAAGGAG   AACGTGGAGC   AGAGCTGCGA   ACCTGGTCAC   CAGAGCCCCA   ACTGCATCCT     2760GTTCATCGAG   AACCTCACGG   CGCAGCAGTA   CGGCCACTAC   TTCTGCGAGG   CCCAGGAGGG     2820CTCCTACTTC   CGCGAGGCTC   AGCACTGGCA   GCTGCTGCCC   GAGGACGGCA   TCATGGCCGA     2880GCACCTGCTG   GGTCATGCCT   GTGCCCTGGC   TGCCTCCCTC   TGGCTGGGGG   TGCTGCCCAC     2940ACTCACTCTT   GGCTTGCTGG   TCCACGTGAA   GCTTGGGCCC   GAACAAAAAC   TCATCTCAGA     3000AGAGGATCTG   AATAGCGCCG   TCGACCATCA   TCATCATCAT   CATTGAGTTT   AAACCGCTGA     3060TCAGCCTCGA   CTGTGCCTTC   TAGTTGCCAG   CCATCTGTTG   TTTGCCCCTC   CCCCGTGCCT     3120TCCTTGACCC   TGGAAGGTGC   CACTCCCACT   GTCCTTTCCT   AATAAAATGA   GGAAATTGCA     3180TCGCATTGTC   TGAGTAGGTG   TCATTCTATT   CTGGGGGGTG   GGGTGGGGCA   GGACAGCAAG     3240GGGGAGGATT   GGGAAGACAA   TAGCAGGCAT   GCTGGGGATG   CGGTGGGCTC   TATGGCTTCT     3300GAGGCGGAAA   GAACCAGCTG   GGGCTCTAGG   GGGTATCCCC   ACGCGCCCTG   TAGCGGCGCA     3360TTAAGCGCGG   CGGGTGTGGT   GGTTACGCGC   AGCGTGACCG   CTACACTTGC   CAGCGCCCTA     3420GCGCCCGCTC   CTTTCGCTTT   CTTCCCTTCC   TTTCTCGCCA   CGTTCGCCGG   CTTTCCCCGT     3480CAAGCTCTAA   ATCGGGGCAT   CCCTTTAGGG   TTCCGATTTA   GTGCTTTACG   GCACCTCGAC     3540CCCAAAAAAC   TTGATTAGGG   TGATGGTTCA   CGTAGTGGGC   CATCGCCCTG   ATAGACGGTT     3600TTTCGCCCTT   TGACGTTGGA   GTCCACGTTC   TTTAATAGTG   GACTCTTGTT   CCAAACTGGA     3660ACAACACTCA   ACCCTATCTC   GGTCTATTCT   TTTGATTTAT   AAGGGATTTT   GGGGATTTCG     3720GCCTATTGGT   TAAAAAATGA   GCTGATTTAA   CAAAAATTTA   ACGCGAATTA   ATTCTGTGGA     3780ATGTGTGTCA   GTTAGGGTGT   GGAAAGTCCC   CAGGCTCCCC   AGGCAGGCAG   AAGTATGCAA     3840AGCATGCATC   TCAATTAGTC   AGCAACCAGG   TGTGGAAAGT   CCCCAGGCTC   CCCAGCACGC     3900AGAAGTATGC   AAAGCATGCA   TCTCAATTAG   TCAGCAACCA   TAGTCCCGCC   CCTAACTCCG     3960CCCATCCCGC   CCCTAACTCC   GCCCAGTTCC   GCCCATTCTC   CGCCCCATGG   CTGACTAATT     4020TTTTTTATTT   ATGCAGAGGC   CGAGGCCGCC   TCTGCCTCTG   AGCTATTCCA   GAAGTAGTGA     4080GGAGGCTTTT   TTGGAGGCCT   AGGCTTTTGC   AAAAAGCTCC   CGGGAGCTTG   TATATCCATT     4140TTCGGATCTG   ATCAAGAGAC   AGGATGAGGA   TCGTTTCGCA   TGATTGAACA   AGATGGATTG     4200CACGCAGGTT   CTCCGGCCGC   TTGGGTGGAG   AGGCTATTCG   GCTATGACTG   GGCACAACAG     4260ACAATCGGCT   GCTCTGATGC   CGCCGTGTTC   CGGCTGTCAG   CGCAGGGGCG   CCCGGTTCTT     4320TTTGTCAAGA   CCGACCTGTC   CGGTGCCCTG   AATGAACTGC   AGGACGAGGC   AGCGCGGCTA     4380TCGTGGCTGG   CCACGACGGG   CGTTCCTTGC   GCAGCTGTGC   TCGACGTTGT   CACTGAAGCG     4440GGAAGGGACT   GGCTGCTATT   GGGCGAAGTG   CCGGGGCAGG   ATCTCCTGTC   ATCTCACCTT     4500GCTCCTGCCG   AGAAAGTATC   CATCATGGCT   GATGCAATGC   GGCGGCTGCA   TACGCTTGAT     4560CCGGCTACCT   GCCCATTCGA   CCACCAAGCG   AAACATCGCA   TCGAGCGAGC   ACGTACTCGG     4620ATGGAAGCCG   GTCTTGTCGA   TCAGGATGAT   CTGGACGAAG   AGCATCAGGG   GCTCGCGCCA     4680GCCGAACTGT   TCGCCAGGCT   CAAGGCGCGC   ATGCCCGACG   GCGAGGATCT   CGTCGTGACC     4740CATGGCGATG   CCTGCTTGCC   GAATATCATG   GTGGAAAATG   GCCGCTTTTC   TGGATTCATC     4800GACTGTGGCC   GGCTGGGTGT   GGCGGACCGC   TATCAGGACA   TAGCGTTGGC   TACCCGTGAT     4860ATTGCTGAAG   AGCTTGGCGG   CGAATGGGCT   GACCGCTTCC   TCGTGCTTTA   CGGTATCGCC     4920GCTCCCGATT   CGCAGCGCAT   CGCCTTCTAT   CGCCTTCTTG   ACGAGTTCTT   CTGAGCGGGA     4980CTCTGGGGTT   CGAAATGACC   GACCAAGCGA   CGCCCAACCT   GCCATCACGA   GATTTCGATT     5040CCACCGCCGC   CTTCTATGAA   AGGTTGGGCT   TCGGAATCGT   TTTCCGGGAC   GCCGGCTGGA     5100TGATCCTCCA   GCGCGGGGAT   CTCATGCTGG   AGTTCTTCGC   CCACCCCAAC   TTGTTTATTG     5160CAGCTTATAA   TGGTTACAAA   TAAAGCAATA   GCATCACAAA   TTTCACAAAT   AAAGCATTTT     5220TTTCACTGCA   TTCTAGTTGT   GGTTTGTCCA   AACTCATCAA   TGTATCTTAT   CATGTCTGTA     5280TACCGTCGAC   CTCTAGCTAG   AGCTTGGCGT   AATCATGGTC   ATAGCTGTTT   CCTGTGTGAA     5340ATTGTTATCC   GCTCACAATT   CCACACAACA   TACGAGCCGG   AAGCATAAAG   TGTAAAGCCT     5400GGGGTGCCTA   ATGAGTGAGC   TAACTCACAT   TAATTGCGTT   GCGCTCACTG   CCCGCTTTCC      5460AGTCGGGAAA   CCTGTCGTGC   CAGCTGCATT   AATGAATCGG   CCAACGCGCG   GGGAGAGGCG      5520GTTTGCGTAT   TGGGCGCTCT   TCCGCTTCCT   CGCTCACTGA   CTCGCTGCGC   TCGGTCGTTC      5580GGCTGCGGCG   AGCGGTATCA   GCTCACTCAA   AGGCGGTAAT   ACGGTTATCC   ACAGAATCAG      5640GGGATAACGC   AGGAAAGAAC   ATGTGAGCAA   AAGGCCAGCA   AAAGGCCAGG   AACCGTAAAA      5700AGGCCGCGTT   GCTGGCGTTT   TTCCATAGGC   TCCGCCCCCC   TGACGAGCAT   CACAAAAATC      5760GACGCTCAAG   TCAGAGGTGG   CGAAACCCGA   CAGGACTATA   AAGATACCAG   GCGTTTCCCC      5820CTGGAAGCTC   CCTCGTGCGC   TCTCCTGTTC   CGACCCTGCC   GCTTACCGGA   TACCTGTCCG      5880CCTTTCTCCC   TTCGGGAAGC   GTGGCGCTTT   CTCAATGCTC   ACGCTGTAGG   TATCTCAGTT      5940CGGTGTAGGT   CGTTCGCTCC   AAGCTGGGCT   GTGTGCACGA   ACCCCCCGTT   CAGCCCGACC      6000GCTGCGCCTT   ATCCGGTAAC   TATCGTCTTG   AGTCCAACCC   GGTAAGACAC   GACTTATCGC      6060CACTGGCAGC   AGCCACTGGT   AACAGGATTA   GCAGAGCGAG   GTATGTAGGC   GGTGCTACAG      6120AGTTCTTGAA   GTGGTGGCCT   AACTACGGCT   ACACTAGAAG   GACAGTATTT   GGTATCTGCG      6180CTCTGCTGAA   GCCAGTTACC   TTCGGAAAAA   GAGTTGGTAG   CTCTTGATCC   GGCAAACAAA      6240CCACCGCTGG   TAGCGGTGGT   TTTTTTGTTT   GCAAGCAGCA   GATTACGCGC   AGAAAAAAAG      6300GATCTCAAGA   AGATCCTTTG   ATCTTTTCTA   CGGGGTCTGA   CGCTCAGTGG   AACGAAAACT      6360CACGTTAAGG   GATTTTGGTC   ATGAGATTAT   CAAAAAGGAT   CTTCACCTAG   ATCCTTTTAA      6420ATTAAAAATG   AAGTTTTAAA   TCAATCTAAA   GTATATATGA   GTAAACTTGG   TCTGACAGTT      6480ACCAATGCTT   AATCAGTGAG   GCACCTATCT   CAGCGATCTG   TCTATTTCGT   TCATCCATAG      6540TTGCCTGACT   CCCCGTCGTG   TAGATAACTA   CGATACGGGA   GGGCTTACCA   TCTGGCCCCA      6600GTGCTGCAAT   GATACCGCGA   GACCCACGCT   CACCGGCTCC   AGATTTATCA   GCAATAAACC      6660AGCCAGCCGG   AAGGGCCGAG   CGCAGAAGTG   GTCCTGCAAC   TTTATCCGCC   TCCATCCAGT      6720CTATTAATTG   TTGCCGGGAA   GCTAGAGTAA   GTAGTTCGCC   AGTTAATAGT   TTGCGCAACG      6780TTGTTGCCAT   TGCTACAGGC   ATCGTGGTGT   CACGCTCGTC   GTTTGGTATG   GCTTCATTCA      6840GCTCCGGTTC   CCAACGATCA   AGGCGAGTTA   CATGATCCCC   CATGTTGTGC   AAAAAAGCGG      6900TTAGCTCCTT   CGGTCCTCCG   ATCGTTGTCA   GAAGTAAGTT   GGCCGCAGTG   TTATCACTCA      6960TGGTTATGGC   AGCACTGCAT   AATTCTCTTA   CTGTCATGCC   ATCCGTAAGA   TGCTTTTCTG      7020TGACTGGTGA   GTACTCAACC   AAGTCATTCT   GAGAATAGTG   TATGCGGCGA   CCGAGTTGCT      7080CTTGCCCGGC   GTCAATACGG   GATAATACCG   CGCCACATAG   CAGAACTTTA   AAAGTGCTCA      7140TCATTGGAAA   ACGTTCTTCG   GGGCGAAAAC   TCTCAAGGAT   CTTACCGCTG   TTGAGATCCA      7200GTTCGATGTA   ACCCACTCGT   GCACCCAACT   GATCTTCAGC   ATCTTTTACT   TTCACCAGCG      7260TTTCTGGGTG   AGCAAAAACA   GGAAGGCAAA   ATGCCGCAAA   AAAGGGAATA   AGGGCGACAC      7320GGAAATGTTG   AATACTCATA   CTCTTCCTTT   TTCAATATTA   TTGAAGCATT   TATCAGGGTT      7380ATTGTCTCAT   GAGCGGATAC   ATATTTGAAT   GTATTTAGAA   AAATAAACAA   ATAGGGGTTC      7440CGCGCACATT   TCCCCGAAAA   GTGCCACCTG   ACGTC                                     7475

    (2)SEQ ID NO:36的信息：

     (ⅰ)序列特征：

      (A)长度：8192个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..8192

     (ⅹⅰ)序列描述：SEQ ID NO:36:GACGGATCGG   GAGATCTCCC   GATCCCCTAT   GGTCGACTCT   CAGTACAATC   TGCTCTGATG        60CCGCATAGTT   AAGCCAGTAT   CTGCTCCCTG   CTTGTGTGTT   GGAGGTCGCT   GAGTAGTGCG       120CGAGCAAAAT   TTAAGCTACA   ACAAGGCAAG   GCTTGACCGA   CAATTGCATG   AAGAATCTGC       180TTAGGGTTAG   GCGTTTTGCG   CTGCTTCGCG   ATGTACGGGC   CAGATATACG   CGTTGACATT       240GATTATTGAC   TAGTTATTAA   TAGTAATCAA   TTACGGGGTC   ATTAGTTCAT   AGCCCATATA       300TGGAGTTCCG   CGTTACATAA   CTTACGGTAA   ATGGCCCGCC   TGGCTGACCG   CCCAACGACC       360CCCGCCCATT   GACGTCAATA   ATGACGTATG   TTCCCATAGT   AACGCCAATA   GGGACTTTCC       420ATTGACGTCA   ATGGGTGGAC   TATTTACGGT   AAACTGCCCA   CTTGGCAGTA   CATCAAGTGT       480ATCATATGCC   AAGTACGCCC   CCTATTGACG   TCAATGACGG   TAAATGGCCC   GCCTGGCATT       540ATGCCCAGTA   CATGACCTTA   TGGGACTTTC   CTACTTGGCA   GTACATCTAC   GTATTAGTCA       600TCGCTATTAC   CATGGTGATG   CGGTTTTGGC   AGTACATCAA   TGGGCGTGGA   TAGCGGTTTG       660ACTCACGGGG   ATTTCCAAGT   CTCCACCCCA   TTGACGTCAA   TGGGAGTTTG   TTTTGGCACC       720AAAATCAACG   GGACTTTCCA   AAATGGTCGTA  ACAACTCCGC   CCCATTGACG   CAAATGGGCG       780GTAGGCGTGT   ACGGTGGGAG   GTCTATATAA   GCAGAGCTCT   CTGGCTAACT   AGAGAACCCA       840CTGCTTACTG   GCTTATCGAA   ATTAATACGA   CTCACTATAG   GGAGACCCAA   GCTGGCTAGC       900GTTTAAACGG   GCCCTCTAGA   CTCGAGCGGC   CGCCACTGTG   CTGGATATCT   GCAGAATTCG       960GCTTGGGATG   ACGCCTCCTC   CGCCCGGACG   TGCCGCCCCC   AGCGCACCGC   GCGCCCGCGT      1020CCCTGGCCCG   CCGGCTCGGT   TGGGGCTTCC   GCTGCGGCTG   CGGCTGCTGC   TGCTGCTCTG      1080GGCGGCCGCC   GCCTCCGCCC   AGGGCCACCT   AAGGAGCGGA   CCCCGCATCT   TCGCCGTCTG      1140GAAAGGCCAT   GTAGGGCAGG   ACCGGGTGGA   CTTTGGCCAG   ACTGAGCCGC   ACACGGTGCT      1200TTTCCACGAG   CCAGGCAGCT   CCTCTGTGTG   GGTGGGAGGA   CGTGGCAAGG   TCTACCTCTT      1260TGACTTCCCC   GAGGGCAAGA   ACGCATCTGT   GCGCACGGTG   AATATCGGCT   CCACAAAGGG      1320GTCCTGTCTG   GATAAGCGGG   ACTGCGAGAA   CTACATCACT   CTCCTGGAGA   GGCGGAGTGA      1380GGGGCTGCTG   GCCTGTGGCA   CCAACGCCCG   GCACCCCAGC   TGCTGGAACC   TGGTGAATGG      1440CACTGTGGTG   CCACTTGGCG   AGATGAGAGG   CTACGCCCCC   TTCAGCCCGG   ACGAGAACTC      1500CCTGGTTCTG   TTTGAAGGGG   ACGAGGTGTA   TTCCACCATC   CGGAAGCAGG   AATACAATGG      1560GAAGATCCCT   CGGTTCCGCC   GCATCCGGGG   CGAGAGTGAG   CTGTACACCA   GTGATACTGT      1620CATGCAGAAC   CCACAGTTCA   TCAAAGCCAC   CATCGTGCAC   CAAGACCAGG   CTTACGATGA      1680CAAGATCTAC   TACTTCTTCC   GAGAGGACAA   TCCTGACAAG   AATCCTGAGG   CTCCTCTCAA      1740TGTGTCCCGT   GTGGCCCAGT   TGTGCAGGGG   GGACCAGGGT   GGGGAAAGTT   CACTGTCAGT      1800CTCCAAGTGG   AACACTTTTC   TGAAAGCCAT   GCTGGTATGC   AGTGATGCTG   CCACCAACAA      1860GAACTTCAAC   AGGCTGCAAG   ACGTCTTCCT   GCTCCCTGAC   CCCAGCGGCC   AGTGGAGGGA      1920CACCAGGGTC   TATGGTGTTT   TCTCCAACCC   CTGGAACTAC   TCAGCCGTCT   GTGTGTATTC      1980CCTCGGTGAC   ATTGACAAGG   TCTTCCGTAC   CTCCTCACTC   AAGGGCTACC   ACTCAAGCCT      2040TCCCAACCCG   CGGCCTGGCA   AGTGCCTCCC   AGACCAGCAG   CCGATACCCA   CAGAGACCTT      2100CCAGGTGGCT   GACCGTCACC   CAGAGGTGGC   GCAGAGGGTG   GAGCCCATGG   GGCCTCTGAA      2160GACGCCATTG   TTCCACTCTA   AATACCACTA   CCAGAAAGTG   GCCGTTCACC   GCATGCAAGC      2220CAGCCACGGG   GAGACCTTTC   ATGTGCTTTA   CCTAACTACA   GACAGGGGCA   CTATCCACAA      2280GGTGGTGGAA   CCGGGGGAGC   AGGAGCACAG   CTTCGCCTTC   AACATCATGG   AGATCCAGCC      2340CTTCCGCCGC   GCGGCTGCCA   TCCAGACCAT   GTCGCTGGAT   GCTGAGCGGA   GGAAGCTGTA      2400TGTGAGCTCC   CAGTGGGAGG   TGAGCCAGGT   GCCCCTGGAC   CTGTGTGAGG   TCTATGGCGG      2460GGGCTGCCAC GGTTGCCTCA  TGTCCCGAGA   CCCCTACTGC   GGCTGGGACC   AGGGCCGCTG     2520CATCTCCATC TACAGCTCCG  AACGGTCAGT   GCTGCAATCC   ATTAATCCAG   CCGAGCCACA     2580CAAGGAGTGT CCCAACCCCA  AACCAGACAA   GGCCCCACTG   CAGAAGGTTT   CCCTGGCCCC     2640AAACTCTCGC TACTACCTGA  GCTGCCCCAT   GGAATCCCGC   CACGCCACCT   ACTCATGGCG     2700CCACAAGGAG AACGTGGAGC  AGAGCTGCGA   ACCTGGTCAC   CAGAGCCCCA   ACTGCATCCT     2760GTTCATCGAG AACCTCACGG  CGCAGCAGTA   CGGCCACTAC   TTCTGCGAGG   CCCAGGAGGG     2820CTCCTACTTC CGCGAGGCTC  AGCACTGGCA   GCTGCTGCCC   GAGGACGGCA   TCATGGCCGA     2880GCACCTGCTG GGTCATGCCT  GTGCCCTGGC   TGCCTCCCTC   TGGCTGGGGG   TGCTGCCCAC     2940ACTCACTCTT GGCTTGCTGG  TCCACATGGT   GAGCAAGGGC   GAGGAGCTGT   TCACCGGGGT     3000GGTGCCCATC CTGGTCGAGC  TGGACGGCGA   CGTAAACGGC   CACAAGTTCA   GCGTGTCCGG     3060CGAGGGCGAG GGCGATGCCA  CCTACGGCAA   GCTGACCCTG   AAGTTCATCT   GCACCACCGG     3120CAAGCTGCCC GTGCCCTGGC  CCACCCTCGT   GACCACCCTG   ACCTACGGCG   TGCAGTGCTT     3180CAGCCGCTAC CCCGACCACA  TGAAGCAGCA   CGACTTCTTC   AAGTCCGCCA   TGCCCGAAGG     3240CTACGTCCAG GAGCGCACCA  TCTTCTTCAA   GGACGACGGC   AACTACAAGA   CCCGCGCCGA     3300GGTGAAGTTC GAGGGCGACA  CCCTGGTGAA   CCGCATCGAG   CTGAAGGGCA   TCGACTTCAA     3360GGAGGACGGC AACATCCTGG  GGCACAAGCT   GGAGTACAAC   TACAACAGCC   ACAACGTCTA     3420TATCATGGCC GACAAGCAGA  AGAACGGCAT   CAAGGTGAAC   TTCAAGATCC   GCCACAACAT     3480CGAGGACGGC AGCGTGCAGC  TCGCCGACCA   CTACCAGCAG   AACACCCCCA   TCGGCGACGG     3540CCCCGTGCTG CTGCCCGACA  ACCACTACCT   GAGCACCCAG   TCCGCCCTGA   GCAAAGACCC     3600CAACGAGAAG CGCGATCACA  TGGTCCTGCT   GGAGTTCGTG   ACCGCCGCCG   GGATCACTCT     3660CGGCATGGAC GAGCTGTACA  AGGTGAAGCT   TGGGCCCGAA   CAAAAACTCA   TCTCAGAAGA     3720GGATCTGAAT AGCGCCGTCG  ACCATCATCA   TCATCATCAT   TGAGTTTAAA   CCGCTGATCA     3780GCCTCGACTG TGCCTTCTAG  TTGCCAGCCA   TCTGTTGTTT   GCCCCTCCCC   CGTGCCTTCC     3840TTGACCCTGG AAGGTGCCAC  TCCCACTGTC   CTTTCCTAAT   AAAATGAGGA   AATTGCATCG     3900CATTGTCTGA GTAGGTGTCA  TTCTATTCTG   GGGGGTGGGG   TGGGGCAGGA   CAGCAAGGGG     3960GAGGATTGGG AAGACAATAG  CAGGCATGCT   GGGGATGCGG   TGGGCTCTAT   GGCTTCTGAG     4020GCGGAAAGAA CCAGCTGGGG  CTCTAGGGGG   TATCCCCACG   CGCCCTGTAG   CGGCGCATTA     4080AGCGCGGCGG GTGTGGTGGT  TACGCGCAGC   GTGACCGCTA   CACTTGCCAG   CGCCCTAGCG     4140CCCGCTCCTT TCGCTTTCTT  CCCTTCCTTT   CTCGCCACGT   TCGCCGGCTT   TCCCCGTCAA     4200GCTCTAAATC   GGGGCATCCC   TTTAGGGTTC   CGATTTAGTG   CTTTACGGCA   CCTCGACCCC      4260AAAAAACTTG   ATTAGGGTGA   TGGTTCACGT   AGTGGGCCAT   CGCCCTGATA   GACGGTTTTT      4320CGCCCTTTGA   CGTTGGAGTC   CACGTTCTTT   AATAGTGGAC   TCTTGTTCCA   AACTGGAACA      4380ACACTCAACC   CTATCTCGGT   CTATTCTTTT   GATTTATAAG   GGATTTTGGG   GATTTCGGCC      4440TATTGGTTAA   AAAATGAGCT   GATTTAACAA   AAATTTAACG   CGAATTAATT   CTGTGGAATG      4500TGTGTCAGTT   AGGGTGTGGA   AAGTCCCCAG   GCTCCCCAGG   CAGGCAGAAG   TATGCAAAGC      4560ATGCATCTCA   ATTAGTCAGC   AACCAGGTGT   GGAAAGTCCC   CAGGCTCCCC   AGCAGGCAGA      4620AGTATGCAAA   GCATGCATCT   CAATTAGTCA   GCAACCATAG   TCCCGCCCCT   AACTCCGCCC      4680ATCCCGCCCC   TAACTCCGCC   CAGTTCCGCC   CATTCTCCGC   CCCATGGCTG   ACTAATTTTT      4740TTTATTTATG   CAGAGGCCGA   GGCCGCCTCT   GCCTCTGAGC   TATTCCAGAA   GTAGTGAGGA      4800GGCTTTTTTG   GAGGCCTAGG   CTTTTGCAAA   AAGCTCCCGG   GAGCTTGTAT   ATCCATTTTC      4860GGATCTGATC   AAGAGACAGG   ATGAGGATCG   TTTCGCATGA   TTGAACAAGA   TGGATTGCAC      4920GCAGGTTCTC   CGGCCGCTTG   GGTGGAGAGG   CTATTCGGCT   ATGACTGGGC   ACAACAGACA      4980ATCGGCTGCT   CTGATGCCGC   CGTGTTCCGG   CTGTCAGCGC   AGGGGCGCCC   GGTTCTTTTT      5040GTCAAGACCG   ACCTGTCCGG   TGCCCTGAAT   GAACTGCAGG   ACGAGGCAGC   GCGGCTATCG      5100TGGCTGGCCA   CGACGGGCGT   TCCTTGCGCA   GCTGTGCTCG   ACGTTGTCAC   TGAAGCGGGA      5160AGGGACTGGC   TGCTATTGGG   CGAAGTGCCG   GGGCAGGATC   TCCTGTCATC   TCACCTTGCT      5220CCTGCCGAGA   AAGTATCCAT   CATGGCTGAT   GCAATGCGGC   GGCTGCATAC   GCTTGATCCG      5280GCTACCTGCC   CATTCGACCA   CCAAGCGAAA   CATCGCATCG   AGCGAGCACG   TACTCGGATG      5340GAAGCCGGTC   TTGTCGATCA   GGATGATCTG   GACGAAGAGC   ATCAGGGGCT   CGCGCCAGCC      5400GAACTGTTCG   CCAGGCTCAA   GGCGCGCATG   CCCGACGGCG   AGGATCTCGT   CGTGACCCAT      5460GGCGATGCCT   GCTTGCCGAA   TATCATGGTG   GAAAATGGCC   GCTTTTCTGG   ATTCATCGAC      5520TGTGGCCGGC   TGGGTGTGGC   GGACCGCTAT   CAGGACATAG   CGTTGGCTAC   CCGTGATATT      5580GCTGAAGAGC   TTGGCGGCGA   ATGGGCTGAC   CGCTTCCTCG   TGCTTTACGG   TATCGCCGCT      5640CCCGATTCGC   AGCGCATCGC   CTTCTATCGC   CTTCTTGACG   AGTTCTTCTG   AGCGGGACTC      5700TGGGGTTCGA   AATGACCGAC   CAAGCGACGC   CCAACCTGCC   ATCACGAGAT   TTCGATTCCA      5760CCGCCGCCTT   CTATGAAAGG   TTGGGCTTCG   GAATCGTTTT   CCGGGACGCC   GGCTGGATGA      5820TCCTCCAGCG   CGGGGATCTC   ATGCTGGAGT   TCTTCGCCCA   CCCCAACTTG   TTTATTGCAG      5880CTTATAATGG   TTACAAATAA   AGCAATAGCA   TCACAAATTT   CACAAATAAA   GCATTTTTTT      5940CACTGCATTC   TAGTTGTGGT   TTGTCCAAAC   TCATCAATGT   ATCTTATCAT   GTCTGTATAC      6000CGTCGACCTC   TAGCTAGAGC   TTGGCGTAAT   CATGGTCATA   GCTGTTTCCT   GTGTGAAATT      6060GTTATCCGCT   CACAATTCCA   CACAACATAC   GAGCCGGAAG   CATAAAGTGT   AAAGCCTGGG      6120GTGCCTAATG   AGTGAGCTAA   CTCACATTAA   TTGCGTTGCG   CTCACTGCCC   GCTTTCCAGT      6180CGGGAAACCT   GTCGTGCCAG   CTGCATTAAT   GAATCGGCCA   ACGCGCGGGG   AGAGGCGGTT      6240TGCGTATTGG   GCGCTCTTCC   GCTTCCTCGC   TCACTGACTC   GCTGCGCTCG   GTCGTTCGGC      6300TGCGGCGAGC   GGTATCAGCT   CACTCAAAGG   CGGTAATACG   GTTATCCACA   GAATCAGGGG      6360ATAACGCAGG   AAAGAACATG   TGAGCAAAAG   GCCAGCAAAA   GGCCAGGAAC   CGTAAAAAGG      6420CCGCGTTGCT   GGCGTTTTTC   CATAGGCTCC   GCCCCCCTGA   CGAGCATCAC   AAAAATCGAC      6480GCTCAAGTCA   GAGGTGGCGA   AACCCGACAG   GACTATAAAG   ATACCAGGCG   TTTCCCCCTG      6540GAAGCTCCCT   CGTGCGCTCT   CCTGTTCCGA   CCCTGCCGCT   TACCGGATAC   CTGTCCGCCT      6600TTCTCCCTTC   GGGAAGCGTG   GCGCTTTCTC   AATGCTCACG   CTGTAGGTAT   CTCAGTTCGG      6660TGTAGGTCGT   TCGCTCCAAG   CTGGGCTGTG   TGCACGAACC   CCCCGTTCAG   CCCGACCGCT      6720GCGCCTTATC   CGGTAACTAT   CGTCTTGAGT   CCAACCCGGT   AAGACACGAC   TTATCGCCAC      6780TGGCAGCAGC   CACTGGTAAC   AGGATTAGCA   GAGCGAGGTA   TGTAGGCGGT   GCTACAGAGT      6840TCTTGAAGTG   GTGGCCTAAC   TACGGCTACA   CTAGAAGGAC   AGTATTTGGT   ATCTGCGCTC      6900TGCTGAAGCC   AGTTACCTTC   GGAAAAAGAG   TTGGTAGCTC   TTGATCCGGC   AAACAAACCA      6960CCGCTGGTAG   CGGTGGTTTT   TTTGTTTGCA   AGCAGCAGAT   TACGCGCAGA   AAAAAAGGAT      7020CTCAAGAAGA   TCCTTTGATC   TTTTCTACGG   GGTCTGACGC   TCAGTGGAAC   GAAAACTCAC      7080GTTAAGGGAT   TTTGGTCATG   AGATTATCAA   AAAGGATCTT   CACCTAGATC   CTTTTAAATT      7140AAAAATGAAG   TTTTAAATCA   ATCTAAAGTA   TATATGAGTA   AACTTGGTCT   GACAGTTACC      7200AATGCTTAAT   CAGTGAGGCA   CCTATCTCAG   CGATCTGTCT   ATTTCGTTCA   TCCATAGTTG      7260CCTGACTCCC   CGTCGTGTAG   ATAACTACGA   TACGGGAGGG   CTTACCATCT   GGCCCCAGTG      7320CTGCAATGAT   ACCGCGAGAC   CCACGCTCAC   CGGCTCCAGA   TTTATCAGCA   ATAAACCAGC      7380CAGCCGGAAG   GGCCGAGCGC   AGAAGTGGTC   CTGCAACTTT   ATCCGCCTCC   ATCCAGTCTA      7440TTAATTGTTG   CCGGGAAGCT   AGAGTAAGTA   GTTCGCCAGT   TAATAGTTTG   CGCAACGTTG      7500TTGCCATTGC   TACAGGCATC   GTGGTGTCAC   GCTCGTCGTT   TGGTATGGCT   TCATTCAGCT      7560CCGGTTCCCA   ACGATCAAGG   CGAGTTACAT   GATCCCCCAT   GTTGTGCAAA   AAAGCGGTTA      7620AGATCTCGGC   CGCATATTAA   GTGCATTGTT   CTCGATACCG   CTAAGTGCAT   TGTTCTCGTT        60AGCTCGATGG   ACAAGTGCAT   TGTTCTCTTG   CTGAAAGCTC   GATGGACAAG   TGCATTGTTC       120TCTTGCTGAA   AGCTCGATGG   ACAAGTGCAT   TGTTCTCTTG   CTGAAAGCTC   AGTACCCGGG       180AGTACCCTCG   ACCGCCGGAG   TATAAATAGA   GGCGCTTCGT   CTACGGAGCG   ACAATTCAAT       240TCAAACAAGC   AAAGTGAACA   CGTCGCTAAG   CGAAAGCTAA   GCAAATAAAC   AAGCGCAGCT       300GAACAAGCTA   AACAATCTGC   AGTAAAGTGC   AAGTTAAAGT   GAATCAATTA   AAAGTAACCA       360GCAACCAAGT   AAATCAACTG   CAACTACTGA   AATCTGCCAA   GAAGTAATTA   TTGAATACAA       420GAAGAGAACT   CTGAATACTT   TCAACAAGTT   ACCGAGAAAG   AAGAACTCAC   ACACAGCTAG       480CGTTTAAACT   TAAGCTTGGT   ACCGAGCTCG   GATCCACTAG   TCCAGTGTGG   TGGAATTCGG       540

    (2)SEQ ID NO:37的信息：

     (ⅰ)序列特征：

      (A)长度：7000个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..7000

     (ⅹⅰ)序列描述：SEQ ID NO:37:GCTCCTTCGG   TCCTCCGATC   GTTGTCAGAA   GTAAGTTGGC   CGCAGTGTTA   TCACTCATGG      7680TTATGGCAGC   ACTGCATAAT   TCTCTTACTG   TCATGCCATC   CGTAAGATGC   TTTTCTGTGA      7740CTGGTGAGTA   CTCAACCAAG   TCATTCTGAG   AATAGTGTAT   GCGGCGACCG   AGTTGCTCTT      7800GCCCGGCGTC   AATACGGGAT   AATACCGCGC   CACATAGCAG   AACTTTAAAA   GTGCTCATCA      7860TTGGAAAACG   TTCTTCGGGG   CGAAAACTCT   CAAGGATCTT   ACCGCTGTTG   AGATCCAGTT      7920CGATGTAACC   CACTCGTGCA   CCCAACTGAT   CTTCAGCATC   TTTTACTTTC   ACCAGCGTTT      7980CTGGGTGAGC   AAAAACAGGA   AGGCAAAATG   CCGCAAAAAA   GGGAATAAGG   GCGACACGGA      8040AATGTTGAAT   ACTCATACTC   TTCCTTTTTC   AATATTATTG   AAGCATTTAT   CAGGGTTATT      8100GTCTCATGAG   CGGATACATA   TTTGAATGTA   TTTAGAAAAA   TAAACAAATA   GGGGTTCCGC      8160GCACATTTCC   CCGAAAAGTG   CCACCTGACG   TC                                        8192CTTGGGATGA CGCCTCCTCC GCCCGGACGT GCCGCCCCCA GcGCAccGCG CGCCCGCGTC       600CCTGGCCCGC CGGCTCGGTT GGGGCTTCCG CTGCGGCTGC GGCTGCTGCT GCTGCTCTGG       660GCGGCCGCCG CCTCCGCCCA GGGCCACCTA AGGAGCGGAC CCCGCATCTT CGCCGTCTGG       720AAAGGCCATG TAGGGCAGGA CCGGGTGGAC TTTGGCCAGA CTGAGCCGCA CACGGTGCTT       780TTCCACGAGC CAGGCAGCTC CTCTGTGTGG GTGGGAGGAC GTGGCAAGGT CTACCTCTTT       840GACTTCCCCG AGGGCAAGAA CGCATCTGTG CGCACGGTGA ATATCGGCTC CACAAAGGGG       900TCCTGTCTGG ATAAGCGGGA CTGCGAGAAC TACATCACTC TCCTGGAGAG GCGGAGTGAG       960GGGCTGCTGG CCTGTGGCAC CAACGCCCGG CACCCCAGCT GCTGGAACCT GGTGAATGGC      1020ACTGTGGTGC CACTTGGCGA GATGAGAGGC TACGCCCCCT TCAGCCCGGA CGAGAACTCC      1080CTGGTTCTGT TTGAAGGGGA CGAGGTGTAT TCCACCATCC GGAAGCAGGA ATACAATGGG      1140AAGATCCCTC GGTTCCGCCG CATCCGGGGC GAGAGTGAGC TGTACACCAG TGATACTGTC      1200ATGCAGAACC CACAGTTCAT CAAAGCCACC ATCGTGCACC AAGACCAGGC TTACGATGAC      1260AAGATCTACT ACTTCTTCCG AGAGGACAAT CCTGACAAGA ATCCTGAGGC TCCTCTCAAT      1320GTGTCCCGTG TGGCCCAGTT GTGCAGGGGG GACCAGGGTG GGGAAAGTTC ACTGTCAGTC      1380TCCAAGTGGA ACACTTTTCT GAAAGCCATG CTGGTATGCA GTGATGCTGC CACCAACAAG      1440AACTTCAACA GGCTGCAAGA CGTCTTCCTG CTCCCTGACC CCAGCGGCCA GTGGAGGGAC      1500ACCAGGGTCT ATGGTGTTTT CTCCAACCCC TGGAACTACT CAGCCGTCTG TGTGTATTCC      1560CTCGGTGACA TTGACAAGGT CTTCCGTACC TCCTCACTCA AGGGCTACCA CTCAAGCCTT      1620CCCAACCCGC GGCCTGGCAA GTGCCTCCCA GACCAGCAGC CGATACCCAC AGAGACCTTC      1680CAGGTGGCTG ACCGTCACCC AGAGGTGGCG CAGAGGGTGG AGCCCATGGG GCCTCTGAAG      1740ACGCCATTGT TCCACTCTAA ATACCACTAC CAGAAAGTGG CCGTTCACCG CATGCAAGCC      1800AGCCACGGGG AGACCTTTCA TGTGCTTTAC CTAACTACAG ACAGGGGCAC TATCCACAAG      1860GTGGTGGAAC CGGGGGAGCA GGAGCACAGC TTCGCCTTCA ACATCATGGA GATCCAGCCC      1920TTCCGCCGCG CGGCTGCCAT CCAGACCATG TCGCTGGATG CTGAGCGGAG GAAGCTGTAT      1980GTGAGCTCCC AGTGGGAGGT GAGCCAGGTG CCCCTGGACC TGTGTGAGGT CTATGGCGGG      2040GGCTGCCACG GTTGCCTCAT GTCCCGAGAC CCCTACTGCG GCTGGGACCA GGGCCGCTGC      2100ATCTCCATCT ACAGCTCCGA ACGGTCAGTG CTGCAATCCA TTAATCCAGC CGAGCCACAC      2160AAGGAGTGTC CCAACCCCAA ACCAGACAAG GCCCCACTGC AGAAGGTTTC CCTGGCCCCA      2220AACTCTCGCT ACTACCTGAG CTGCCCCATG GAATCCCGCC ACGCCACCTA CTCATGGCGC      2280CACAAGGAGA   ACGTGGAGCA   GAGCTGCGAA   CCTGGTCACC   AGAGCCCCAA   CTGCATCCTG      2340TTCATCGAGA   ACCTCACGGC   GCAGCAGTAC   GGCCACTACT   TCTGCGAGGC   CCAGGAGGGC      2400TCCTACTTCC   GCGAGGCTCA   GCACTGGCAG   CTGCTGCCCG   AGGACGGCAT   CATGGCCGAG      2460CACCTGCTGG   GTCATGCCTG   TGCCCTGGCT   GCCTCCCTCT   GGCTGGGGGT   GCTGCCCACA      2520CTCACTCTTG   GCTTGCTGGT   CCACGTGAAG   CTTGGGCCCG   TTTAAACCCG   CTGATCAGCC      2580TCGACTGTGC   CTTCTAGTTG   CCAGCCATCT   GTTGTTTGCC   CCTCCCCCGT   GCCTTCCTTG      2640ACCCTGGAAG   GTGCCACTCC   CACTGTCCTT   TCCTAATAAA   ATGAGGAAAT   TGCATCGCAT      2700TGTCTGAGTA   GGTGTCATTC   TATTCTGGGG   GGTGGGGTGG   GGCAGGACAG   CAAGGGGGAG      2760GATTGGGAAG   ACAATAGCAG   GCATGCTGGG   GATGCGGTGG   GCTCTATGGC   TTCTGAGGCG      2820GAAAGAACCA   GCTGGGGCTC   TAGGGGGTAT   CCCCACGCGC   CCTGTAGCGG   CGCATTAAGC      2880GCGGCGGGTG   TGGTGGTTAC   GCGCAGCGTG   ACCGCTACAC   TTGCCAGCGC   CCTAGCGCCC      2940GCTCCTTTCG   CTTTCTTCCC   TTCCTTTCTC   GCCACGTTCG   CCGGCTTTCC   CCGTCAAGCT      3000CTAAATCGGG   GCATCCCTTT   AGGGTTCCGA   TTTAGTGCTT   TACGGCACCT   CGACCCCAAA      3060AAACTTGATT   AGGGTGATGG   TTCACGTAGT   GGGCCATCGC   CCTGATAGAC   GGTTTTTCGC      3120CCTTTGACGT   TGGAGTCCAC   GTTCTTTAAT   AGTGGACTCT   TGTTCCAAAC   TGGAACAACA      3180CTCAACCCTA   TCTCGGTCTA   TTCTTTTGAT   TTATAAGGGA   TTTTGGGGAT   TTCGGCCTAT      3240TGGTTAAAAA   ATGAGCTGAT   TTAACAAAAA   TTTAACGCGA   ATTAATTCTG   TGGAATGTGT      3300GTCAGTTAGG   GTGTGGAAAG   TCCCCAGGCT   CCCCAGGCAG   GCAGAAGTAT   GCAAAGCATG      3360CATCTCAATT   AGTCAGCAAC   CAGGTGTGGA   AAGTCCCCAG   GCTCCCCAGC   AGGCAGAAGT      3420ATGCAAAGCA   TGCATCTCAA   TTAGTCAGCA   ACCATAGTCC   CGCCCCTAAC   TCCGCCCATC      3480CCGCCCCTAA   CTCCGCCCAG   TTCCGCCCAT   TCTCCGCCCC   ATGGCTGACT   AATTTTTTTT      3540ATTTATGCAG   AGGCCGAGGC   CGCCTCTGCC   TCTGAGCTAT   TCCAGAAGTA   GTGAGGAGGC      3600TTTTTTGGAG   GCCTAGGCTT   TTGCAAAAAG   CTCCCGGGAG   CTTGTATATC   CATTTTCGGA      3660TCTGATCAAG   AGACAGGATG   AGGATCGTTT   CGCATGATTG   AACAAGATGG   ATTGCACGCA      3720GGTTCTCCGG   CCGCTTGGGT   GGAGAGGCTA   TTCGGCTATG   ACTGGGCACA   ACAGACAATC      3780GGCTGCTCTG   ATGCCGCCGT   GTTCCGGCTG   TCAGCGCAGG   GGCGCCCGGT   TCTTTTTGTC      3840AAGACCGACC   TGTCCGGTGC   CCTGAATGAA   CTGCAGGACG   AGGCAGCGCG   GCTATCGTGG      3900CTGGCCACGA   CGGGCGTTCC   TTGCGCAGCT   GTGCTCGACG   TTGTCACTGA   AGCGGGAAGG      3960GACTGGCTGC   TATTGGGCGA   AGTGCCGGGG   CAGGATCTCC   TGTCATCTCA   CCTTGCTCCT      4020GCCGAGAAAG   TATCCATCAT   GGCTGATGCA   ATGCGGCGGC   TGCATACGCT   TGATCCCGCT      4080ACCTGCCCAT   TCGACCACCA   AGCGAAACAT   CGCATCGAGC   GAGCACGTAC   TCGGATGGAA      4140GCCGGTCTTG   TCGATCAGGA   TGATCTGGAC   GAAGAGCATC   AGGGGCTCGC   GCCAGCCGAA      4200CTGTTCGCCA   GGCTCAAGGC   GCGCATGCCC   GACGGCGAGG   ATCTCGTCGT   GACCCATGGC      4260GATGCCTGCT   TGCCGAATAT   CATGGTGGAA   AATGGCCGCT   TTTCTGGATT   CATCGACTGT      4320GGCCGGCTGG   GTGTGGCGGA   CCGCTATCAG   GACATAGCGT   TGGCTACCCG   TGATATTGCT      4380GAAGAGCTTG   GCGGCGAATG   GGCTGACCGC   TTCCTCGTGC   TTTACGGTAT   CGCCGCTCCC      4440GATTCGCAGC   GCATCGCCTT   CTATCGCCTT   CTTGACGAGT   TCTTCTGAGC   GGGACTCTGG      4500GGTTCGAAAT   GACCGACCAA   GCGACGCCCA   ACCTGCCATC   ACGAGATTTC   GATTCCACCG      4560CCGCCTTCTA   TGAAAGGTTG   GGCTTCGGAA   TCGTTTTCCG   GGACGCCGGC   TGGATGATCC      4620TCCAGCGCGG   GGATCTCATG   CTGGAGTTCT   TCGCCCACCC   CAACTTGTTT   ATTGCAGCTT      4680ATAATGGTTA   CAAATAAAGC   AATAGCATCA   CAAATTTCAC   AAATAAAGCA   TTTTTTTCAC      4740TGCATTCTAG   TTGTGGTTTG   TCCAAACTCA   TCAATGTATC   TTATCATGTC   TGTATACCGT      4800CGACCTCTAG   CTAGAGCTTG   GCGTAATCAT   GGTCATAGCT   GTTTCCTGTG   TGAAATTGTT      4860ATCCGCTCAC   AATTCCACAC   AACATACGAG   CCGGAAGCAT   AAAGTGTAAA   GCCTGGGGTG      4920CCTAATGAGT   GAGCTAACTC   ACATTAATTG   CGTTGCGCTC   ACTGCCCGCT   TTCCAGTCGG      4980GAAACCTGTC   GTGCCAGCTG   CATTAATGAA   TCGGCCAACG   CGCGGGGAGA   GGCGGTTTGC      5040GTATTGGGCG   CTCTTCCGCT   TCCTCGCTCA   CTGACTCGCT   GCGCTCGGTC   GTTCGGCTGC      5100GGCGAGCGGT   ATCAGCTCAC   TCAAAGGCGG   TAATACGGTT   ATCCACAGAA   TCAGGGGATA      5160ACGCAGGAAA   GAACATGTGA   GCAAAAGGCC   AGCAAAAGGC   CAGGAACCGT   AAAAAGGCCG      5220CGTTGCTGGC   GTTTTTCCAT   AGGCTCCGCC   CCCCTGACGA   GCATCACAAA   AATCGACGCT      5280CAAGTCAGAG   GTGGCGAAAC   CCGACAGGAC   TATAAAGATA   CCAGGCGTTT   CCCCCTGGAA      5340GCTCCCTCGT   GCGCTCTCCT   GTTCCGACCC   TGCCGCTTAC   CGGATACCTG   TCCGCCTTTC      5400TCCCTTCGGG   AAGCGTGGCG   CTTTCTCAAT   GCTCACGCTG   TAGGTATCTC   AGTTCGGTGT      5460AGGTCGTTCG   CTCCAAGCTG   GGCTGTGTGC   ACGAACCCCC   CGTTCAGCCC   GACCGCTGCG      5520CCTTATCCGG   TAACTATCGT   CTTGAGTCCA   ACCCGGTAAG   ACACGACTTA   TCGCCACTGG      5580CAGCAGCCAC   TGGTAACAGG   ATTAGCAGAG   CGAGGTATGT   AGGCGGTGCT   ACAGAGTTCT      5640TGAAGTGGTG   GCCTAACTAC   GGCTACACTA   GAAGGACAGT   ATTTGGTATC   TGCGCTCTGC      5700TGAAGCCAGT   TACCTTCGGA   AAAAGAGTTG   GTAGCTCTTG   ATCCGGCAAA   CAAACCACCG            5760CTGGTAGCGG   TGGTTTTTTT   GTTTGCAAGC   AGCAGATTAC   GCGCAGAAAA   AAAGGATCTC            5820AAGAAGATCC   TTTGATCTTT   TCTACGGGGT   CTGACGCTCA   GTGGAACGAA   AACTCACGTT            5880AAGGGATTTT   GGTCATGAGA   TTATCAAAAA   GGATCTTCAC   CTAGATCCTT   TTAAATTAAA            5940AATGAAGTTT   TAAATCAATC   TAAAGTATAT   ATGAGTAAAC   TTGGTCTGAC   AGTTACCAAT            6000GCTTAATCAG   TGAGGCACCT   ATCTCAGCGA   TCTGTCTATT   TCGTTCATCC   ATAGTTGCCT            6060GACTCCCCGT   CGTGTAGATA   ACTACGATAC   GGGAGGGCTT   ACCATCTGGC   CCCAGTGCTG            6120CAATGATACC   GCGAGACCCA   CGCTCACCGG   CTCCAGATTT   ATCAGCAATA   AACCAGCCAG            6180CCGGAAGGGC   CGAGCGCAGA   AGTGGTCCTG   CAACTTTATC   CGCCTCCATC   CAGTCTATTA            6240ATTGTTGCCG   GGAAGCTAGA   GTAAGTAGTT   CGCCAGTTAA   TAGTTTGCGC   AACGTTGTTG            6300CCATTGCTAC   AGGCATCGTG   GTGTCACGCT   CGTCGTTTGG   TATGGCTTCA   TTCAGCTCCG            6360GTTCCCAACG   ATCAAGGCGA   GTTACATGAT   CCCCCATGTT   GTGCAAAAAA   GCGGTTAGCT            6420CCTTCGGTCC   TCCGATCGTT   GTCAGAAGTA   AGTTGGCCGC   AGTGTTATCA   CTCATGGTTA            6480TGGCAGCACT   GCATAATTCT   CTTACTGTCA   TGCCATCCGT   AAGATGCTTT   TCTGTGACTG            6540GTGAGTACTC   AACCAAGTCA   TTCTGAGAAT   AGTGTATGCG   GCGACCGAGT   TGCTCTTGCC            6600CGGCGTCAAT   ACGGGATAAT   ACCGCGCCAC   ATAGCAGAAC   TTTAAAAGTG   CTCATCATTG            6660GAAAACGTTC   TTCGGGGCGA   AAACTCTCAA   GGATCTTACC   GCTGTTGAGA   TCCAGTTCGA            6720TGTAACCCAC   TCGTGCACCC   AACTGATCTT   CAGCATCTTT   TACTTTCACC   AGCGTTTCTG            6780GGTGAGCAAA   AACAGGAAGG   CAAAATGCCG   CAAAAAAGGG   AATAAGGGCG   ACACGGAAAT            6840GTTGAATACT   CATACTCTTC   CTTTTTCAAT   ATTATTGAAG   CATTTATCAG   GGTTATTGTC            6900TCATGAGCGG   ATACATATTT   GAATGTATTT   AGAAAAATAA   ACAAATAGGG   GTTCCGCGCA            6960CATTTCCCCG   AAAAGTGCCA   CCTGACGTCG   ACGGATCGGG                                      7000(2)SEQ ID NO:38的信息：

    (ⅰ)序列特征：

      (A)长度：7108个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

    (ⅱ)分子类型：DNA(基因组的)

    (ⅹⅰ)序列描述：SEQ ID NO:38:AGATCTCGGC   CGCATATTAA   GTGCATTGTT   CTCGATACCG   CTAAGTGCAT   TGTTCTCGTT                60AGCTCGATGG   ACAAGTGCAT   TGTTCTCTTG   CTGAAAGCTC   GATGGACAAG   TGCATTGTTC               120TCTTGCTGAA   AGCTCGATGG   ACAAGTGCAT   TGTTCTCTTG   CTGAAAGCTC   AGTACCCGGG               180AGTACCCTCG   ACCGCCGGAG   TATAAATAGA   GGCGCTTCGT   CTACGGAGCG   ACAATTCAAT               240TCAAACAAGC   AAAGTGAACA   CGTCGCTAAG   CGAAAGCTAA   GCAAATAAAC   AAGCGCAGCT               300GAACAAGCTA   AACAATCTGC   AGTAAAGTGC   AAGTTAAAGT   GAATCAATTA   AAAGTAACCA               360GCAACCAAGT   AAATCAACTG   CAACTACTGA   AATCTGCCAA   GAAGTAATTA   TTGAATACAA               420GAAGAGAACT   CTGAATACTT   TCAACAAGTT   ACCGAGAAAG   AAGAACTCAC   ACACAGCTAG               480CGTTTAAACT   TAAGCTTGGT   ACCGAGCTCG   GATCCACTAG   TCCAGTGTGG   TGGAATTCGG               540CTTGGGATGA   CGCCTCCTCC   GCCCGGACGT   GCCGCCCCCA   GCGCACCGCG   CGCCCGCGTC               600CCTGGCCCGC   CGGCTCGGTT   GGGGCTTCCG   CTGCGGCTGC   GGCTGCTGCT   GCTGCTCTGG               660GCGGCCGCCG   CCTCCGCCCA   GGGCCACCTA   AGGAGCGGAC   CCCGCATCTT   CGCCGTCTGG               720AAAGGCCATG   TAGGGCAGGA   CCGGGTGGAC   TTTGGCCAGA   CTGAGCCGCA   CACGGTGCTT               780TTCCACGAGC   CAGGCAGCTC   CTCTGTGTGG   GTGGGAGGAC   GTGGCAAGGT   CTACCTCTTT               840GACTTCCCCG   AGGGCAAGAA   CGCATCTGTG   CGCACGGTGA   ATATCGGCTC   CACAAAGGGG               900TCCTGTCTGG   ATAAGCGGGA   CTGCGAGAAC   TACATCACTC   TCCTGGAGAG   GCGGAGTGAG               960GGGCTGCTGG   CCTGTGGCAC   CAACGCCCGG   CACCCCAGCT   GCTGGAACCT   GGTGAATGGC              1020ACTGTGGTGC   CACTTGGCGA   GATGAGAGGC   TACGCCCCCT   TCAGCCCGGA   CGAGAACTCC              1080CTGGTTCTGT   TTGAAGGGGA   CGAGGTGTAT   TCCACCATCC   GGAAGCAGGA   ATACAATGGG              1140AAGATCCCTC   GGTTCCGCCG   CATCCGGGGC   GAGAGTGAGC   TGTACACCAG   TGATACTGTC              1200ATGCAGAACc   CACAGTTCAT   CAAAGCCACC   ATCGTGCACC   AAGACCAGGC   TTACGATGAC              1260AAGATCTACT   ACTTCTTCCG   AGAGGACAAT   CCTGACAAGA   ATCCTGAGGC   TCCTCTCAAT              1320GTGTCCCGTG   TGGCCCAGTT   GTGCAGGGGG   GACCAGGGTG   GGGAAAGTTC   ACTGTCAGTC              1380TCCAAGTGGA   ACACTTTTCT   GAAAGCCATG   CTGGTATGCA   GTGATGCTGC   CACCAACAAG              1440AACTTCAACA   GGCTGCAAGA   CGTCTTCCTG   CTCCCTGACC   CCAGCGGCCA   GTGGAGGGAC              1500ACCAGGGTCT   ATGGTGTTTT   CTCCAACcCC   TGGAACTACT   CAGCCGTCTG   TGTGTATTCC              1560CTCGGTGACA   TTGACAAGGT   CTTCCGTACC   TCCTCACTCA   AGGGCTACCA   CTCAAGCCTT              1620CCCAACCCGC   GGCCTGGCAA   GTGCCTCCCA   GACCAGCAGC   CGATACCCAC   AGAGACCTTC              1680CAGGTGGCTG   ACCGTCACCC   AGAGGTGGCG   CAGAGGGTGG   AGCCCATGGG   GCCTCTGAAG           1740ACGCCATTGT   TCCACTCTAA   ATACCACTAC   CAGAAAGTGG   CCGTTCACCG   CATGCAAGCC           1800AGCCACGGGG   AGACCTTTCA   TGTGCTTTAC   CTAACTACAG   ACAGGGGCAC   TATCCACAAG           1860GTGGTGGAAC   CGGGGGAGCA   GGAGCACAGC   TTCGCCTTCA   ACATCATGGA   GATCCAGCCC           1920TTCCGCCGCG   CGGCTGCCAT   CCAGACCATG   TCGCTGGATG   CTGAGCGGAG   GAAGCTGTAT           1980GTGAGCTCCC   AGTGGGAGGT   GAGCCAGGTG   CCCCTGGACC   TGTGTGAGGT   CTATGGCGGG           2040GGCTGCCACG   GTTGCCTCAT   GTCCCGAGAC   CCCTACTGCG   GCTGGGACCA   GGGCCGCTGC           2100ATCTCCATCT   ACAGCTCCGA   ACGGTCAGTG   CTGCAATCCA   TTAATCCAGC   CGAGCCACAC           2160AAGGAGTGTC   CCAACCCCAA   ACCAGACAAG   GCCCCACTGC   AGAAGGTTTC   CCTGGCCCCA           2220AACTCTCGCT   ACTACCTGAG   CTGCCCCATG   GAATCCCGCC   ACGCCACCTA   CTCATGGCGC           2280CACAAGGAGA   ACGTGGAGCA   GAGCTGCGAA   CCTGGTCACC   AGAGCCCCAA   CTGCATCCTG           2340TTCATCGAGA   ACCTCACGGC   GCAGCAGTAC   GGCCACTACT   TCTGCGAGGC   CCAGGAGGGC           2400TCCTACTTCC   GCGAGGCTCA   GCACTGGCAG   CTGCTGCCCG   AGGACGGCAT   CATGGCCGAG           2460CACCTGCTGG   GTCATGCCTG   TGCCCTGGCT   GCCTCCCTCT   GGCTGGGGGT   GCTGCCCACA           2520CTCACTCTTG   GCTTGCTGGT   CCACGTGAAG   CTTGGGCCCG   AACAAAAACT   CATCTCAGAA           2580GAGGATCTGA   ATAGCGCCGT   CGACCATCAT   CATCATCATC   ATTGAGTTTA   TCCAGCACAG           2640TGGCGGCCGC   TCGAGTCTAG   AGGGCCCGTT   TAAACCCGCT   GATCAGCCTC   GACTGTGCCT           2700TCTAGTTGCC   AGCCATCTGT   TGTTTGCCCC   TCCCCCGTGC   CTTCCTTGAC   CCTGGAAGGT           2760GCCACTCCCA   CTGTCCTTTC   CTAATAAAAT   GAGGAAATTG   CATCGCATTG   TCTGAGTAGG           2820TGTCATTCTA   TTCTGGGGGG   TGGGGTGGGG   CAGGACAGCA   AGGGGGAGGA   TTGGGAAGAC           2880AATAGCAGGC   ATGCTGGGGA   TGCGGTGGGC   TCTATGGCTT   CTGAGGCGGA   AAGAACCAGC           2940TGGGGCTCTA   GGGGGTATCC   CCACGCGCCC   TGTAGCGGCG   CATTAAGCGC   GGCGGGTGTG           3000GTGGTTACGC   GCAGCGTGAC   CGCTACACTT   GCCAGCGCCC   TAGCGCCCGC   TCCTTTCGCT           3060TTCTTCCCTT   CCTTTCTCGC   CACGTTCGCC   GGCTTTCCCC   GTCAAGCTCT   AAATCGGGGC           3120ATCCCTTTAG   GGTTCCGATT   TAGTGCTTTA   CGGCACCTCG   ACCCCAAAAA   ACTTGATTAG           3180GGTGATGGTT   CACGTAGTGG   GCCATCGCCC   TGATAGACGG   TTTTTCGCCC   TTTGACGTTG           3240GAGTCCACGT   TCTTTAATAG   TGGACTCTTG   TTCCAAACTG   GAACAACACT   CAACCCTATC           3300TCGGTCTATT   CTTTTGATTT   ATAAGGGATT   TTGGGGATTT   CGGCCTATTG   GTTAAAAAAT           3360GAGCTGATTT   AACAAAAATT   TAACGCGAAT   TAATTCTGTG   GAATGTGTGT   CAGTTAGGGT            3420GTGGAAAGTC   CCCAGGCTCC   CCAGGCAGGC   AGAAGTATGC   AAAGCATGCA   TCTCAATTAG            3480TCAGCAACCA   GGTGTGGAAA   GTCCCCAGGC   TCCCCAGCAG   GCAGAAGTAT   GCAAAGCATG            3540CATCTCAATT   AGTCAGCAAC   CATAGTCCCG   CCCCTAACTC   CGCCCATCCC   GCCCCTAACT            3600CCGCCCAGTT   CCGCCCATTC   TCCGCCCCAT   GGCTGACTAA   TTTTTTTTAT   TTATGCAGAG            3660GCCGAGGCCG   CCTCTGCCTC   TGAGCTATTC   CAGAAGTAGT   GAGGAGGCTT   TTTTGGAGGC            3720CTAGGCTTTT   GCAAAAAGCT   CCCGGGAGCT   TGTATATCCA   TTTTCGGATC   TGATCAAGAG            3780ACAGGATGAG   GATCGTTTCG   CATGATTGAA   CAAGATGGAT   TGCACGCAGG   TTCTCCGGCC            3840GCTTGGGTGG   AGAGGCTATT   CGGCTATGAC   TGGGCACAAC   AGACAATCGG   CTGCTCTGAT            3900GCCGCCGTGT   TCCGGCTGTC   AGCGCAGGGG   CGCCCGGTTC   TTTTTGTCAA   GACCGACCTG            3960TCCGGTGCCC   TGAATGAACT   GCAGGACGAG   GCAGCGCGGC   TATCGTGGCT   GGCCACGACG            4020GGCGTTCCTT   GCGCAGCTGT   GCTCGACGTT   GTCACTGAAG   CGGGAAGGGA   CTGGCTGCTA            4080TTGGGCGAAG   TGCCGGGGCA   GGATCTCCTG   TCATCTCACC   TTGCTCCTGC   CGAGAAAGTA            4140TCCATCATGG   CTGATGCAAT   GCGGCGGCTG   CATACGCTTG   ATCCGGCTAC   CTGCCCATTC            4200GACCACCAAG   CGAAACATCG   CATCGAGCGA   GCACGTACTC   GGATGGAAGC   CGGTCTTGTC            4260GATCAGGATG   ATCTGGACGA   AGAGCATCAG   GGGCTCGCGC   CAGCCGAACT   GTTCGCCAGG            4320CTCAAGGCGC   GCATGCCCGA   CGGCGAGGAT   CTCGTCGTGA   CCCATGGCGA   TGCCTGCTTG            4380CCGAATATCA   TGGTGGAAAA   TGGCCGCTTT   TCTGGATTCA   TCGACTGTGG   CCGGCTGGGT            4440GTGGCGGACC   GCTATCAGGA   CATAGCGTTG   GCTACCCGTG   ATATTGCTGA   AGAGCTTGGC            4500GGCGAATGGG   CTGACCGCTT   CCTCGTGCTT   TACGGTATCG   CCGCTCCCGA   TTCGCAGCGC            4560ATCGCCTTCT   ATCGCCTTCT   TGACGAGTTC   TTCTGAGCGG   GACTCTGGGG   TTCGAAATGA            4620CCGACCAAGC   GACGCCCAAC   CTGCCATCAC   GAGATTTCGA   TTCCACCGCC   GCCTTCTATG            4680AAAGGTTGGG   CTTCGGAATC   GTTTTCCGGG   ACGCCGGCTG   GATGATCCTC   CAGCGCGGGG            4740ATCTCATGCT   GGAGTTCTTC   GCCCACCCCA   ACTTGTTTAT   TGCAGCTTAT   AATGGTTACA            4800AATAAAGCAA   TAGCATCACA   AATTTCACAA   ATAAAGCATT   TTTTTCACTG   CATTCTAGTT            4860GTGGTTTGTC   CAAACTCATC   AATGTATCTT   ATCATGTCTG   TATACCGTCG   ACCTCTAGCT            4920AGAGCTTGGC   GTAATCATGG   TCATAGCTGT   TTCCTGTGTG   AAATTGTTAT   CCGCTCACAA            4980TTCCACACAA   CATACGAGCC   GGAAGCATAA   AGTGTAAAGC   CTGGGGTGCC   TAATGAGTGA            5040GCTAACTCAC   ATTAATTGCG   TTGCGCTCAC   TGCCCGCTTT   CCAGTCGGGA   AACCTGTCGT            5100GCCAGCTGCA   TTAATGAATC   GGCCAACGCG   CGGGGAGAGG   CGGTTTGCGT   ATTGGGCGCT            5160CTTCCGCTTC   CTCGCTCACT   GACTCGCTGC   GCTCGGTCGT   TCGGCTGCGG   CGAGCGGTAT            5220CAGCTCACTC   AAAGGCGGTA   ATACGGTTAT   CCACAGAATC   AGGGGATAAC   GCAGGAAAGA            5280ACATGTGAGC   AAAAGGCCAG   CAAAAGGCCA   GGAACCGTAA   AAAGGCCGCG   TTGCTGGCGT            5340TTTTCCATAG   GCTCCGCCCC   CCTGACGAGC   ATCACAAAAA   TCGACGCTCA   AGTCAGAGGT            5400GGCGAAACCC   GACAGGACTA   TAAAGATACC   AGGCGTTTCC   CCCTGGAAGC   TCCCTCGTGC            5460GCTCTCCTGT   TCCGACCCTG   CCGCTTACCG   GATACCTGTC   CGCCTTTCTC   CCTTCGGGAA            5520GCGTGGCGCT   TTCTCAATGC   TCACGCTGTA   GGTATCTCAG   TTCGGTGTAG   GTCGTTCGCT            5580CCAAGCTGGG   CTGTGTGCAC   GAACCCCCCG   TTCAGCCCGA   CCGCTGCGCC   TTATCCGGTA            5640ACTATCGTCT   TGAGTCCAAC   CCGGTAAGAC   ACGACTTATC   GCCACTGGCA   GCAGCCACTG            5700GTAACAGGAT   TAGCAGAGCG   AGGTATGTAG   GCGGTGCTAC   AGAGTTCTTG   AAGTGGTGGC            5760CTAACTACGG   CTACACTAGA   AGGACAGTAT   TTGGTATCTG   CGCTCTGCTG   AAGCCAGTTA            5820CCTTCGGAAA   AAGAGTTGGT   AGCTCTTGAT   CCGGCAAACA   AACCACCGCT   GGTAGCGGTG            5880GTTTTTTTGT   TTGCAAGCAG   CAGATTACGC   GCAGAAAAAA   AGGATCTCAA   GAAGATCCTT            5940TGATCTTTTC   TACGGGGTCT   GACGCTCAGT   GGAACGAAAA   CTCACGTTAA   GGGATTTTGG            6000TCATGAGATT   ATCAAAAAGG   ATCTTCACCT   AGATCCTTTT   AAATTAAAAA   TGAAGTTTTA            6060AATCAATCTA   AAGTATATAT   GAGTAAACTT   GGTCTGACAG   TTACCAATGC   TTAATCAGTG            6120AGGCACCTAT   CTCAGCGATC   TGTCTATTTC   GTTCATCCAT   AGTTGCCTGA   CTCCCCGTCG            6180TGTAGATAAC   TACGATACGG   GAGGGCTTAC   CATCTGGCCC   CAGTGCTGCA   ATGATACCGC            6240GAGACCCACG   CTCACCGGCT   CCAGATTTAT   CAGCAATAAA   CCAGCCAGCC   GGAAGGGCCG            6300AGCGCAGAAG   TGGTCCTGCA   ACTTTATCCG   CCTCCATCCA   GTCTATTAAT   TGTTGCCGGG            6360AAGCTAGAGT   AAGTAGTTCG   CCAGTTAATA   GTTTGCGCAA   CGTTGTTGCC   ATTGCTACAG            6420GCATCGTGGT   GTCACGCTCG   TCGTTTGGTA   TGGCTTCATT   CAGCTCCGGT   TCCCAACGAT            6480CAAGGCGAGT   TACATGATCC   CCCATGTTGT   GCAAAAAAGC   GGTTAGCTCC   TTCGGTCCTC            6540CGATCGTTGT   CAGAAGTAAG   TTGGCCGCAG   TGTTATCACT   CATGGTTATG   GCAGCACTGC            6600ATAATTCTCT   TACTGTCATG   CCATCCGTAA   GATGCTTTTC   TGTGACTGGT   GAGTACTCAA            6660CCAAGTCATT   CTGAGAATAG   TGTATGCGGC   GACCGAGTTG   CTCTTGCCCG   GCGTCAATAC            6720GGGATAATAC   CGCGCCACAT   AGCAGAACTT   TAAAAGTGCT   CATCATTGGA   AAACGTTCTT            6780CGGGGCGAAA    ACTCTCAAGG   ATCTTACCGC   TGTTGAGATC   CAGTTCGATG   TAACCCACTC      6840GTGCACCCAA    CTGATCTTCA   GCATCTTTTA   CTTTCACCAG   CGTTTCTGGG   TGAGCAAAAA      6900CAGGAAGGCA    AAATGCCGCA   AAAAAGGGAA   TAAGGGCGAC   ACGGAAATGT   TGAATACTCA      6960TACTCTTCCT    TTTTCAATAT   TATTGAAGCA   TTTATCAGGG   TTATTGTCTC   ATGAGCGGAT      7020ACATATTTGA    ATGTATTTAG   AAAAATAAAC   AAATAGGGGT   TCCGCGCACA   TTTCCCCGAA      7080AAGTGCCACC    TGACGTCGAC   GGATCGGG                                               7108

    (2)SEQ ID NO:39的信息：

     (ⅰ)序列特征：

      (A)长度：4019个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..4019

     (ⅹⅰ)序列描述：SEQ ID NO:39:CTCGAGAAAT   CATAAAAAAT   TTATTTGCTT   TGTGAGCGGA   TAACAATTAT   AATAGATTCA        60ATTGTGAGCG   GATAACAATT   TCACACAGAA   TTCATTAAAG   AGGAGAAATT   AACTATGAGA       120GGATCGCATC   ACCATCACCA   TCACGGATCC   CTGGTTCTGT   TTGAAGGGGA   CGAGGTGTAT       180TCCACCATCC   GGAAGCAGGA   ATACAATGGG   AAGATCCCTC   GGTTCCGCCG   CATCCGGGGC       240GAGAGTGAGC   TGTACACCAG   TGATACTGTC   ATGCAGAACC   CACAGTTCAT   CAAAGCCACC       300ATCGTGCACC   AAGACCAGGC   TTACGATGAC   AAGATCTACT   ACTTCTTCCG   AGAGGACAAT       360CCTGACAAGA   ATCCTGAGGC   TCCTCTCAAT   GTGTCCCGTG   TGGCCCAGTT   GTGCAGGGGG       420GACCAGGGTG   GGGAAAGTTC   ACTGTCAGTC   TCCAAGTGGA   ACACTTTTCT   GAAAGCCATG       480CTGGTATGCA   GTGATGCTGC   CACCAACAAG   AACTTCAACA   GGCTGCAAGA   CGTCTTCCTG       540CTCCCTGACC   CCAGCGGCCA   GTGGAGGGAC   ACCAGGGTCT   ATGGTGTTTT   CTCCAACCCC       600TGGAACTACT   CAGCCGTCTG   TGTGTATTCC   CTCGGTGACA   TTGACAAGGT   CTTCCGTACC       660TCCTCACTCA   AGGGCTACCA   CTCAAGCCTT   CCCAACCCGC   GGCCTGGCAA   GTGCCTCCCA       720GACCAGCAGC   CGATACCCAC   AGAAAGCTTA   ATTAGCTGAG   CTTGGACTCC   TGTTGATAGA       780TCCAGTAATG   ACCTCAGAAC   TCCATCTGGA   TTTGTTCAGA   ACGCTCGGTT   GCCGCCGGGC             840GTTTTTTATT   GGTGAGAATC   CAAGCTAGCT   TGGCGAGATT   TTCAGGAGCT   AAGGAAGCTA             900AAATGGAGAA   AAAAATCACT   GGATATACCA   CCGTTGATAT   ATCCCAATGG   CATCGTAAAG             960AACATTTTGA   GGCATTTCAG   TCAGTTGCTC   AATGTACCTA   TAACCAGACC   GTTCAGCTGG            1020ATATTACGGC   CTTTTTAAAG   ACCGTAAAGA   AAAATAAGCA   CAAGTTTTAT   CCGGCCTTTA            1080TTCACATTCT   TGCCCGCCTG   ATGAATGCTC   ATCCGGAATT   TCGTATGGCA   ATGAAAGACG            1140GTGAGCTGGT   GATATGGGAT   AGTGTTCACC   CTTGTTACAC   CGTTTTCCAT   GAGCAAACTG            1200AAACGTTTTC   ATCGCTCTGG   AGTGAATACC   ACGACGATTT   CCGGCAGTTT   CTACACATAT            1260ATTCGCAAGA   TGTGGCGTGT   TACGGTGAAA   ACCTGGCCTA   TTTCCCTAAA   GGGTTTATTG            1320AGAATATGTT   TTTCGTCTCA   GCCAATCCCT   GGGTGAGTTT   CACCAGTTTT   GATTTAAACG            1380TGGCCAATAT   GGACAACTTC   TTCGCCCCCG   TTTTCACCAT   GGGCAAATAT   TATACGCAAG            1440GCGACAAGGT   GCTGATGCCG   CTGGCGATTC   AGGTTCATCA   TGCCGTCTGT   GATGGCTTCC            1500ATGTCGGCAG   AATGCTTAAT   GAATTACAAC   AGTACTGCGA   TGAGTGGCAG   GGCGGGGCGT            1560AATTTTTTTA   AGGCAGTTAT   TGGTGCCCTT   AAACGCCTGG   GGTAATGACT   CTCTAGCTTG            1620AGGCATCAAA   TAAAACGAAA   GGGTCAGTCG   AAAGACTGGG   CCTTTCGTTT   TATCTGTTGT            1680TTGTCGGTGA   ACGCTCTCCT   GAGTAGGACA   AATCCGCCGC   TCTAGAGCTG   CCTCGCGCGT            1740TTCGGTGATG   ACGGTGAAAA   CCTCTGACAC   ATGCAGCTCC   CGGAGACGGT   CACAGCTTGT            1800CTGTAAGCGG   ATGCCGGGAG   CAGACAAGCC   CGTCAGGGCG   CGTCAGCGGG   TGTTGGCGGG            1860TGTCGGGGCG   CAGCCATGAC   CCAGTCACGT   AGCGATAGCG   GAGTGTATAC   TGGCTTAACT            1920ATGCGGCATC   AGAGCAGATT   GTACTGAGAG   TGCACCATAT   GCGGTGTGAA   ATACCGCACA            1980GATGCGTAAG   GAGAAAATAC   CGCATCAGGC   GCTCTTCCGC   TTCCTCGCTC   ACTGACTCGC            2040TGCGCTCGGT   CTGTCGGCTG   CGGCGAGCGG   TATCAGCTCA   CTCAAAGGCG   GTAATACGGT            2100TATCCACAGA   ATCAGGGGAT   AACGCAGGAA   AGAACATGTG   AGCAAAAGGC   CAGCAAAAGG            2160CCAGGAACCG   TAAAAAGGCC   GCGTTGCTGG   CGTTTTTCCA   TAGGCTCCGC   CCCCCTGACG            2220AGCATCACAA   AAATCGACGC   TCAAGTCAGA   GGTGGCGAAA   CCCGACAGGA   CTATAAAGAT            2280ACCAGGCGTT   TCCCCCTGGA   AGCTCCCTCG   TGCGCTCTCC   TGTTCCGACC   CTGCCGCTTA            2340CCGGATACCT   GTCCGCCTTT   CTCCCTTCGG   GAAGCGTGGC   GCTTTCTCAA   TGCTCACGCT            2400GTAGGTATCT   CAGTTCGGTG   TAGGTCGTTC   GCTCCAAGCT   GGGCTGTGTG   CACGAACCCC            2460CCGTTCAGCC   CGACCGCTGC   GCCTTATCCG   GTAACTATCG   TCTTGAGTCC   AACCCGGTAA            2520GACACGACTT   ATCGCCACTG   GCAGCAGCCA   CTGGTAACAG   GATTAGCAGA   GCGAGGTATG            2580TAGGCGGTGC   TACAGAGTTC   TTGAAGTGGT   GGCCTAACTA   CGGCTACACT   AGAAGGACAG            2640TATTTGGTAT   CTGCGCTCTG   CTGAAGCCAG   TTACCTTCGG   AAAAAGAGTT   GGTAGCTCTT            2700GATCCGGCAA   ACAAACCACC   GCTGGTAGCG   GTGGTTTTTT   TGTTTGCAAG   CAGCAGATTA            2760CGCGCAGAAA   AAAAGGATCT   CAAGAAGATC   CTTTGATCTT   TTCTACGGGG   TCTGACGCTC            2820AGTGGAACGA   AAACTCACGT   TAAGGGATTT   TGGTCATGAG   ATTATCAAAA   AGGATCTTCA            2880CCTAGATCCT   TTTAAATTAA   AAATGAAGTT   TTAAATCAAT   CTAAAGTATA   TATGAGTAAA            2940CTTGGTCTGA   CAGTTACCAA   TGCTTAATCA   GTGAGGCACC   TATCTCAGCG   ATCTGTCTAT            3000TTCGTTCATC   CATAGCTGCC   TGACTCCCCG   TCGTGTAGAT   AACTACGATA   CGGGAGGGCT            3060TACCATCTGG   CCCCAGTGCT   GCAATGATAC   CGCGAGACCC   ACGCTCACCG   GCTCCAGATT            3120TATCAGCAAT   AAACCAGCCA   GCCGGAAGGG   CCGAGCGCAG   AAGTGGTCCT   GCAACTTTAT            3180CCGCCTCCAT   CCAGTCTATT   AATTGTTGCC   GGGAAGCTAG   AGTAAGTAGT   TCGCCAGTTA            3240ATAGTTTGCG   CAACGTTGTT   GCCATTGCTA   CAGGCATCGT   GGTGTCACGC   TCGTCGTTTG            3300GTATGGCTTC   ATTCAGCTCC   GGTTCCCAAC   GATCAAGGCG   AGTTACATGA   TCCCCCATGT            3360TGTGCAAAAA   AGCGGTTAGC   TCCTTCGGTC   CTCCGATCGT   TGTCAGAAGT   AAGTTGGCCG            3420CAGTGTTATC   ACTCATGGTT   ATGGCAGCAC   TGCATAATTC   TCTTACTGTC   ATGCCATCCG            3480TAAGATGCTT   TTCTGTGACT   GGTGAGTACT   CAACCAAGTC   ATTCTGAGAA   TAGTGTATGC            3540GGCGACCGAG   TTGCTCTTGC   CCGGCGTCAA   TACGGGATAA   TACCGCGCCA   CATAGCAGAA            3600CTTTAAAAGT   GCTCATCATT   GGAAAACGTT   CTTCGGGGCG   AAAACTCTCA   AGGATCTTAC            3660CGCTGTTGAG   ATCCAGTTCG   ATGTAACCCA   CTCGTGCACC   CAACTGATCT   TCAGCATCTT            3720TTACTTTCAC   CAGCGTTTCT   GGGTGAGCAA   AAACAGGAAG   GCAAAATGCC   GCAAAAAAGG            3780GAATAAGGGC   GACACGGAAA   TGTTGAATAC   TCATACTCTT   CCTTTTTCAA   TATTATTGAA            3840GCATTTATCA   GGGTTATTGT   CTCATGAGCG   GATACATATT   TGAATGTATT   TAGAAAAATA            3900AACAAATAGG   GGTTCCGCGC   ACATTTCCCC   GAAAAGTGCC   ACCTGACGTC   TAAGAAACCA            3960TTATTATCAT   GACATTAACC   TATAAAAATA   GGCGTATCAC   GAGGCCCTTT   CGTCTTCAC             4019

    (2)SEQ ID NO:40的信息：

     (ⅰ)序列特征：

      (A)长度：3999个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：DNA(基因组的)

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..3999

    (ⅹⅰ)序列描述：SEQ ID NO:40:CTCGAGAAAT   CATAAAAAAT   TTATTTGCTT   TGTGAGCGGA   TAACAATTAT   AATAGATTCA               60ATTGTGAGCG   GATAACAATT   TCACACAGAA   TTCATTAAAG   AGGAGAAATT   AACTATGAGA              120GGATCGCATC   ACCATCACCA   TCACACGGAT   CCGCATGCGA   GCTCCCAGTG   GGAGGTGAGC              180CAGGTGCCCC   TGGACCTGTG   TGAGGTCTAT   GGCGGGGGCT   GCCACGGTTG   CCTCATGTCC              240CGAGACCCCT   ACTGCGGCTG   GGACCAGGGC   CGCTGCATCT   CCATCTACAG   CTCCGAACGG              300TCAGTGCTGC   AATCCATTAA   TCCAGCCGAG   CCACACAAGG   AGTGTCCCAA   CCCCAAACCA              360GACAAGGCCC   CACTGCAGAA   GGTTTCCCTG   GCCCCAAACT   CTCGCTACTA   CCTGAGCTGC              420CCCATGGAAT   CCCGCCACGC   CACCTACTCA   TGGCGCCACA   AGGAGAACGT   GGAGCAGAGC              480TGCGAACCTG   GTCACCAGAG   CCCCAACTGC   ATCCTGTTCA   TCGAGAACCT   CACGGCGCAG              540CAGTACGGCC   ACTACTTCTG   CGAGGCCCAG   GAGGGCTCCT   ACTTCCGCGA   GGCTCAGCAC              600TGGCAGCTGC   TGCCCGAGGA   CGGCATCATG   GCCGAGCACC   TGCTGGGTCA   TGCCTGTGCC              660CTGGCTGCCT   CCCTCTGGCT   GGGGGTGCTG   CCCACACTCA   CTCTTGGCTT   GCTGGTCCAC              720GTGAAGCTTA   ATTAGCTGAG   CTTGGACTCC   TGTTGATAGA   TCCAGTAATG   ACCTCAGAAC              780TCCATCTGGA   TTTGTTCAGA   ACGCTCGGTT   GCCGCCGGGC   GTTTTTTATT   GGTGAGAATC              840CAAGCTAGCT   TGGCGAGATT   TTCAGGAGCT   AAGGAAGCTA   AAATGGAGAA   AAAAATCACT              900GGATATACCA   CCGTTGATAT   ATCCCAATGG   CATCGTAAAG   AACATTTTGA   GGCATTTCAG              960TCAGTTGCTC   AATGTACCTA   TAACCAGACC   GTTCAGCTGG   ATATTACGGC   CTTTTTAAAG             1020ACCGTAAAGA   AAAATAAGCA   CAAGTTTTAT   CCGGCCTTTA   TTCACATTCT   TGCCCGCCTG             1080 ATGAATGCTC   ATCCGGAATT   TCGTATGGCA   ATGAAAGACG   GTGAGCTGGT   GATATGGGAT             1140AGTGTTCACC   CTTGTTACAC   CGTTTTCCAT   GAGCAAACTG   AAACGTTTTC   ATCGCTCTGG             1200AGTGAATACC   ACGACGATTT   CCGGCAGTTT   CTACACATAT   ATTCGCAAGA   TGTGGCGTGT             1260TACGGTGAAA   ACCTGGCCTA   TTTCCCTAAA   GGGTTTATTG   AGAATATGTT   TTTCGTCTCA             1320GCCAATCCCT   GGGTGAGTTT   CACCAGTTTT   GATTTAAACG   TGGCCAATAT   GGACAACTTC             1380TTCGCCCCCG   TTTTCACCAT   GGGCAAATAT   TATACGCAAG   GCGACAAGGT   GCTGATGCCG            1440CTGGCGATTG   AGGTTCATCA   TGCCGTCTGT   GATGGCTTCC   ATGTCGGCAG   AATGCTTAAT            1500GAATTACAAC   AGTACTGCGA   TGAGTGGCAG   GGCGGGGCGT   AATTTTTTTA   AGGCAGTTAT            1560TGGTGCCCTT   AAACGCCTGG   GGTAATGACT   CTCTAGCTTG   AGGCATCAAA   TAAAACGAAA            1620GGCTCAGTCG   AAAGACTGGG   CCTTTCGTTT   TATCTGTTGT   TTGTCGGTGA   ACGCTCTCCT            1680GAGTAGGACA   AATCCGCCGC   TCTAGAGCTG   CCTCGCGCGT   TTCGGTGATG   ACGGTGAAAA            1740CCTCTGACAC   ATGCAGCTCC   CGGAGACGGT   CACAGCTTGT   CTGTAAGCGG   ATGCCGGGAG            1800CAGACAAGCC   CGTCAGGGCG   CGTCAGCGGG   TGTTGGCGGG   TGTCGGGGCG   CAGCCATGAC            1860CCAGTCACGT   AGCGATAGCG   GAGTGTATAC   TGGCTTAACT   ATGCGGCATC   AGAGCAGATT            1920GTACTGAGAG   TGCACCATAT   GCGGTGTGAA   ATACCGCACA   GATGCGTAAG   GAGAAAATAC            1980CGCATCAGGC   GCTCTTCCGC   TTCCTCGCTC   ACTGACTCGC   TGCGCTCGGT   CTGTCGGCTG            2040CGGCGAGCGG   TATCAGCTCA   CTCAAAGGCG   GTAATACGGT   TATCCACAGA   ATCAGGGGAT            2100AACGCAGGAA   AGAACATGTG   AGCAAAAGGC   CAGCAAAAGG   CCAGGAACCG   TAAAAAGGCC            2160GCGTTGCTGG   CGTTTTTCCA   TAGGCTCCGC   CCCCCTGACG   AGCATCACAA   AAATCGACGC            2220TCAAGTCAGA   GGTGGCGAAA   CCCGACAGGA   CTATAAAGAT   ACCAGGCGTT   TCCCCCTGGA            2280AGCTCCCTCG   TGCGCTCTCC   TGTTCCGACC   CTGCCGCTTA   CCGGATACCT   GTCCGCCTTT            2340CTCCCTTCGG   GAAGCGTGGC   GCTTTCTCAA   TGCTCACGCT   GTAGGTATCT   CAGTTCGGTG            2400TAGGTCGTTC   GCTCCAAGCT   GGGCTGTGTG   CACGAACCCC   CCGTTCAGCC   CGACCGCTGC            2460GCCTTATCCG   GTAACTATCG   TCTTGAGTCC   AACCCGGTAA   GACACGACTT   ATCGCCACTG            2520GCAGCAGCCA   CTGGTAACAG   GATTAGCAGA   GCGAGGTATG   TAGGCGGTGC   TACAGAGTTC            2580TTGAAGTGGT   GGCCTAACTA   CGGCTACACT   AGAAGGACAG   TATTTGGTAT   CTGCGCTCTG            2640CTGAAGCCAG   TTACCTTCGG   AAAAAGAGTT   GGTAGCTCTT   GATCCGGCAA   ACAAACCACC            2700GCTGGTAGCG   GTGGTTTTTT   TGTTTGCAAG   CAGCAGATTA   CGCGCAGAAA   AAAAGGATCT            2760CAAGAAGATC   CTTTGATCTT   TTCTACGGGG   TCTGACGCTC   AGTGGAACGA   AAACTCACGT            2820TAAGGGATTT   TGGTCATGAG   ATTATCAAAA   AGGATCTTCA   CCTAGATCCT   TTTAAATTAA            2880AAATGAAGTT   TTAAATCAAT   CTAAAGTATA   TATGAGTAAA   CTTGGTCTGA   CAGTTACCAA            2940TGCTTAATCA   GTGAGGCACC   TATCTCAGCG   ATCTGTCTAT   TTCGTTCATC   CATAGCTGCC            3000TGACTCCCCG   TCGTGTAGAT   AACTACGATA   CGGGAGGGCT   TACCATCTGG   CCCCAGTGCT            3060GCAATGATAC   CGCGAGACCC   ACGCTCACCG   GCTCCAGATT   TATCAGCAAT   AAACCAGCCA            3120GCCGGAAGGG   CCGAGCGCAG   AAGTGGTCCT   GCAACTTTAT   CCGCCTCCAT   CCAGTCTATT           3180AATTGTTGCC   GGGAAGCTAG   AGTAAGTAGT   TCGCCAGTTA   ATAGTTTGCG   CAACGTTGTT           3240GCCATTGCTA   CAGGCATCGT   GGTGTCACGC   TCGTCGTTTG   GTATGGCTTC   ATTCAGCTCC           3300GGTTCCCAAC   GATCAAGGCG   AGTTACATGA   TCCCCCATGT   TGTGCAAAAA   AGCGGTTAGC           3360TCCTTCGGTC   CTCCGATCGT   TGTCAGAAGT   AAGTTGGCCG   CAGTGTTATC   ACTCATGGTT           3420ATGGCAGCAC   TGCATAATTC   TCTTACTGTC   ATGCCATCCG   TAAGATGCTT   TTCTGTGACT           3480GGTGAGTACT   CAACCAAGTC   ATTCTGAGAA   TAGTGTATGC   GGCGACCGAG   TTGCTCTTGC           3540CCGGCGTCAA   TACGGGATAA   TACCGCGCCA   CATAGCAGAA   CTTTAAAAGT   GCTCATCATT           3600GGAAAACGTT   CTTCGGGGCG   AAAACTCTCA   AGGATCTTAC   CGCTGTTGAG   ATCCAGTTCG           3660ATGTAACCCA   CTCGTGCACC   CAACTGATCT   TCAGCATCTT   TTACTTTCAC   CAGCGTTTCT           3720GGGTGAGCAA   AAACAGGAAG   GCAAAATGCC   GCAAAAAAGG   GAATAAGGGC   GACACGGAAA           3780TGTTGAATAC   TCATACTCTT   CCTTTTTCAA   TATTATTGAA   GCATTTATCA   GGGTTATTGT           3840CTCATGAGCG   GATACATATT   TGAATGTATT   TAGAAAAATA   AACAAATAGG   GGTTCCGCGC           3900ACATTTCCCC   GAAAAGTGCC   ACCTGACGTC   TAAGAAACCA   TTATTATCAT   GACATTAACC           3960TATAAAAATA   GGCGTATCAC   GAGGCCCTTT   CGTCTTCAC                                      3999(2)SEQ ID NO:41的信息：

    (ⅰ)序列特征：

      (A)长度：8888个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

    (ⅱ)分子类型：DNA(基因组的)

    (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..8888

    (ⅹⅰ)序列描述：SEQ ID NO:41:GAGCCGCACA   CGGTGCTTTT   CCACGAGCCA  GGCAGCTCCT   CTGTGTGGGT   GGGAGGACGT        60GGCAAGGTCT   ACCTCTTTGA   CTTCCCCGAG   GGCAAGAACG  CATCTGTGCG   CACGGTGAGC       120CTCTCTCTTC   CCCCAACACC   CCCCCTACCC   TCTTATCTCC  CCTCTGGCCC   TGCCAAGGGT       180CCTCAGGGAA   TCCGACGGAG   CTGGCTTCTC   TTCCTAAACT   GCCCCCACCT   CCGTATCCTA              240TAAATGGCTC   CTGGGGGAGG   CTCCCTAAAG   GTAGTCCAGA   TTGGAGTGGG   GAGCTGCGGC              300GGTGTGGAGA   AAAACAGGAG   CTAATGGGCC   TGGCCAGCTG   GGCAGCGCTG   CTGCGGAAAG              360CCCAGGCTGG   AAGCTGGGCC   CCAGAGCCCA   TGCCTGGTCT   TCTGAACCCT   CTGGGCCTCA              420GCTCTGGATA   TGAGACCCTG   TTTGACCTCA   GGTAGATCAC   TCACCCTCTC   AGAGCCCCAG              480TTGCTCATCT   GTCAGATGAG   AATAATGGTT   GCTTCCTTTG   GGGCTTATCC   TGAGGCTGTG              540TGGAAAGCAT   TTCAGGGGTA   CCTCACCCCT   GGCAGATTGA   ACTAATGCTT   CTCCCCTTCC              600CCAGGTGAAT   ATCGGCTCCA   CAAAGGGGTC   CTGTCTGGAT   AAGCGGGTGA   GCGGGCGAGG              660GATCTGGAGG   GGTCTGAGCC   ACTTGGTAAA   GGGAGAGGAG   ACCCTGAGGG   TCTAAGGAAG              720GAAGCATGGC   CCTGCCCCAC   GAGTCCCAGA   CTGATGGGGA   GACGTGGTCC   TCTGTGCTTA              780GGGGATGGCG   TCAGCTGCAC   ACACTCTGGG   CTGTCCCGGG   AGGCTGTCAC   CTATGCTAAG              840CCCTTCTGAC   ACCTTCTTCC   CTGATCCTGG   GGGTCCTAGT   GCTAGGCTTG   CCAGGGCCTT              900CCAGCAACCA   ATTTCTCTCC   TCCCTTCTCT   CTTCCCCGGG   CAGGACTGCG   AGAACTACAT              960CACTCTCCTG   GAGAGGCGGA   GTGAGGGGCT   GCTGGCCTGT   GGCACCAACG   CCCGGCACCC             1020CAGCTGCTGG   AACCTGGTGA   GAAGGCTGCT   CCCCATGTGC   CTGATCAGCT   CACCTTCTAC             1080TGCGTGGGCT   TCTGCCCCTC   ATGGTGGGAA   GGAGATGGCG   AGACTCCAAT   GCTGGCCTTG             1140CCCTGGGAGG   ATGGGGCTCC   TGGCCGAGAA   ACTGGCCGTC   ATGGGAGGCA   GTGGCTGTGG             1200GATTATGTGG   CCATCCAACC   CTCTGGATCT   CCCACAGGTG   AATGGCACTG   TGGTGCCACT             1260TGGCGAGATG   AGAGGCTACG   CCCCCTTCAG   CCCGGACGAG   AACTCCCTGG   TTCTGTTTGA             1320AGGTTGGGGC   ATGCTTCGGA   ACTGGGCTGG   GAGCAGGATG   GTCAGCTCTT   TGTCCAGTGT             1380CCGGAGGAGG   GACTTCCAGG   AGCTGCCTGC   CCTTACTCAT   TTCTCCCTCC   CACTGACCCC             1440AGGGGACGAG   GTGTATTCCA   CCATCCGGAA   CCAGGAATAC   AATGGGAAGA   TCCCTCGGTT             1500CCGCCGCATC   CGGGGCGAGA   GTGAGCTGTA   CACCAGTGAT   ACTGTCATGC   AGAGTGAGTC             1560AGGCTCCGGC   TGGGCTGAGG   GTGGGCAAGG   GGGTGTGAGC   ACTTAAGGTG   GCAGATGGGA             1620TCCTGATGTT   TCTGGGAGGG   CTCCCTGAGG   GCCGCTGGGG   CCATGCAGGA   AAGCAGGACC             1680TTGGTATAGG   CCTGAGAAGT   TAGGGTTGGC   TGGGAGCAGA   GGAACAGACA   AGGTATAGCA             1740GTGGGATGGG   CCCAGCCCTC   TTCAGGAACA   CAAACAGAGG   GAGCCCCAGA   CCCAGTGCAG             1800GGTCCCCAGG   AGCCAAAGTT   TATCCTCTGC   TGAGTTCACG   TGGAGGCAGC   CCCCCAACTC             1860CCTCCTCATC   AGGGCTCTGC   CAATTGAGCA   GAAGTGACAT   AGGGGCCCCC   AGGGACCTTC             1920CCCCACTCCC   CAGGCATGAA   GTCATTGCTC   CTGGGCCGAT   GACATCTTTG   TAGGAAGAGG     1980GCAAAACAGG   TGTGGGGTGG   AGGTGCAGGG   TCTAGGGCCC   CTCGGGGAGT   TGGACCTGAT     2040GTTATGAGTC   CTATTCCAGA   TCTGATTTGC   CATGGTTTGT   GCAGACCCGA   AGGAGGGAGG     2100AGAGTGTGCA   GGGTTGGAAT   GGTCTCCCGG   GCAAGCTTCC   CAGCCTTACG   CCCATTCGCT     2160TCTGTGCCCT   GGCAGACCCA   CAGTTCATCA   AAGCCACCAT   CGTGCACCAA   GACCAGGCTT     2220ACGATGACAA   GATCTACTAC   TTCTTCCGAG   AGGACAATCC   TGACAAGAAT   CCTGAGGCTC     2280CTCTCAATGT   GTCCCGTGTG   GCCCAGTTGT   GCAGGGTGAA   CACGGGCGTG   AGGGCTGCTG     2340GCTACGTGTC   TGTGCATGAA   TAGGCCTGAG   TGAGGGTGAG   TTCTGTGTGT   CCGTGTGCAT     2400GTAGAAGTTG   TGTGGATGTA   TGAGTGGGTC   TGTGTCAGGG   ACTGTGGGAG   CAGCTGTGTG     2460TGCATGGAGC   ATCATGTGTC   TGTGTGTGGG   TAAAGGTGGC   TGAGCTCCTG   TGCACGTATG     2520ATGGCGTGTG   AGCGTGTGTA   TGATGGGGTG   TGTGTGTGTG   TGTGTGTGTG   TGTTTTGCCT     2580GTGTGAATGT   GCTGTGCCAC   GTATGTGGGT   GCGTGAGTCA   GTAAATGTGT   GTCTGAGTCC     2640GTCTGCTCTG   TGGGGACCTG   GCACTCTCAC   CTGCCCTGAC   CCTGGGCACT   GCTGGCCCTG     2700GGCTCTGGAT   CAGCCAGGCC   TGCTTGCAGG   AGTCTCATCT   GGAGACCTGC   CCTGAGTCCT     2760GGGGCACCCC   CGGCAGGTCC   TGGCCCCTCG   CAGCCTGCCT   TCCTCCTCTG   GGCCCAGGTG     2820TTGATATTGC   TGGCAGTGGT   TTCCTGGGGT   GTGTGGGGAA   GCCCGGGCAG   GTGCTGAGGG     2880GCCTCTTCTC   CCCTCTACCC   TTCCAGGGGG   ACCAGGGTGG   GGAAAGTTCA   CTGTCAGTCT     2940CCAAGTGGAA   CACTTTTCTG   AAAGCCATGC   TGGTATGCAG   TGATGCTGCC   ACCAACAAGA     3000ACTTCAACAG   GCTGCAAGAC   GTCTTCCTGC   TCCCTGACCC   CAGCGGCCAG   TGGAGGGACA     3060CCAGGGTCTA   TGGTGTTTTC   TCCAACCCCT   GGTGAGTGGC   CCTTGTCCTG   GGGCCGGGGC     3120TGGCATTGGT   TCAGTGTCCA   GTAGGGACAG   GAGGCCTTGG   GCCCTGCTGA   GGGCCTCCCT     3180GGTGTGGCAG   GAGCAGGGGC   TGCAGGCTCA   AGAGGCTGGG   CTGTTGCTGG   GTGTGGGGTG     3240GGGGGACAGC   CAGTGCGATG   TATGTACTGT   TGTGTGAGTG   AGTCTGCACT   CATGGGTGTG     3300TGTGCATGCC   CTATATGCAC   ACTCATGACT   GCACTTGTGC   CTGTGTGTCC   CACCACCTGC     3360TTGTGCCGAG   AGTGGACACT   GGGCCCAGGA   GGAAGCTGCT   GAAGCATCTC   TCGGGGAGCT     3420GGGTGCTATT   ACACCTGCTC   AGGCACTGCC   TGAGCCCGAT   AATTCACACT   TCTTAATCAC     3480TCTCATTGAT   TGAACACACG   GCAGGCGGAA   GTGTTGGGTG   TGTGTGGGGA   GAGTTAGGGA     3540TAGAGTGGAG   GAAGCCAAGA   CCCTGCTCTG   TGGCTCCTGG   GTGAGTGGGT   CCCCCAGGCT     3600GGGAAGGGGT   TGGGGGTCTG   GCCTCCTGGG   GCATCAGCAC   CCCACAGCCT   GTGCCCAGGG     3660AGGGCTAGAG   AACTGCTCAG   CCTATGATGG   GGTTCCTCCT   GCCTTGGGGT   TGGGTAGAGC     3720AGATGGCCTC   TAGACTCAGT   GATTCTGTAA   CAGGATACAA   GTTTGTGGTT   TTAAATTGCA     3780GCACAAAGAA   ATTAGGCTGA   ACTCCTCTCC   TTCCTCCTCT   CCATCCCTCC   CCATTTTCAG     3840TGGTGGTTGG   CAACTCAGTG   CCAGGCACAA   GGCTGGCCTG   GGTGAGTGGA   GGTGGATGGG     3900TGGGTTCTGG   GCCCCCCATT   GAGCTGGTCT   CCATGTCACT   GCAGGAACTA   CTCAGCCGTC     3960TGTGTGTATT   CCCTCGGTGA   CATTGACAAG   GTCTTCCGTA   CCTCCTCACT   CAAGGGCTAC     4020CACTCAAGCC   TTCCCAACCC   GCGGCCTGGC   AAGGTGAGCG   TGACACCAGC   CGTGGCCCAG     4080GCCCAGCCCT   CCTTCTGCCT   CACCTCCCAC   CACCCCACTG   ACCTGGGCCT   GCTCTCCTTG     4140CCCAGTGCCT   CCCAGACCAG   CAGCCGATAC   CCACAGAGAC   CTTCCAGGTG   GCTGACCGTC     4200ACCCAGAGGT   GGCGCAGAGG   GTGGAGCCCA   TGGGGCCTCT   GAAGACGCCA   TTGTTCCACT     4260CTAAATACCA   CTACCAGAAA   GTGGCCGTCC   ACCGCATGCA   AGCCAGCCAC   GGGGAGACCT     4320TTCATGTGCT   TTACCTAACT   ACAGGTGAGA   GGCTACCCCG   GGACCCTCAG   TTTGCTTTGT     4380AAAAACGGGC   ATGAAAGGTG   TAAGGAATAA   TGTAGTTAAC   ATCTGGTTGG   ATCTTTACAT     4440GTGGAAGGAA   TAATTGAGTG   ACTGGAGTTG   TCAGGGGTTA   ATGTGTGTGG   GTGTGGAAGA     4500GCCAGGCAGG   GAGAGCTTCC   TGGAGGAGGT   AGGGGCAAGA   GGGAAAGGGG   GATGGGAGAA     4560AAGCAAGCAC   TGGGATTTGG   AGGCGGAAAT   CTGGAGAGTC   TGAGCAAAGC   CAGGTGCACC     4620TTTGGTCCAG   ATGTCTGACT   CAGGGAAGAA   GATGGTAGGA   AGAGACGTGG   CAAATGAGGA     4680GGAGGGGCCT   GAACCACAGG   GATACTGGCC   TCTGCCAGGC   AGAATGAGGG   AGTCAGGCCC     4740TGCGCCTGTC   TTTGGGATTG   TGCAGGTGAG   AAGAAACATT   TGAGGAGTTG   ATGGGGCACA     4800AATTAGGTAT   GGGGAAGGAG   TTCCAGGGGG   CAGAACCTTT   GCCATCTCAC   AGAGGACAGG     4860GGCAGCTTCT   CTTCTTCCCT   GGAGTAGGCC   CTGCTGGGGG   AAGCTGGGTG   GAATGCCGTG     4920GGAGATGCTC   CTGCTTTCTG   GAAAGCCACA   GGACACGGAG   GAGCCAGTCC   TGAGTTGGGT     4980TTGTCGCAGC   TTCCCATGCC   AGCTGCCTTC   CTTGAGACTG   GAAAGGGCCT   CTAGCACCCC     5040TGGGGCCATT   CAATTCAGGC   CCAGGCGCCC   AACCTCAGTT   GTTCACATTC   CCCATGTGAT     5100CTCCTGTTGC   TGCTTCACCT   TGGGACTGTC   TCGGCTTTGG   TGACCTTGTA   GGAAACTGGA     5160ACCCCAGCAC   CATTGTTTGG   CTCCTGGAAG   CCTTGGGGAG   AGGAATTTCC   CACAGGGCAG     5220GGCCTGGGTC   CTGATTCCCT   GCCTCTTTAC   TCCCTATTCA   TCCCGGCTAC   ACCCTTGGGC     5280CCCCATCCTT   GCTTGGCTCC   AGTACTGGCT   GGCACAGCTG   TTGTGGTCAT   CCAGGGATGG     5340CAGGGCACTG   GGGAACAGAA   GAGAGAGGTC   ACACAGTGCG   GAACTGGGAG   CAGGAGCTAG      5400GACAAGGAAG   GCTGGACTTG   GGCCATGGAT   TCCCTTCCTG   CAGACTTGGG   AAGTGAGCAC      5460ACTTGAGTGA   TTAGAGAAGG   TGTCTTCGTT   CTAAGGGCAG   TGGAGGAGGC   ACCATTTTGG      5520AGCCTGCATC   ATTCGTATTT   GGGCTAGATT   GAAAAATAGA   GCTTTCTAAG   TCCTCTGCAG      5580AGAATGGGAG   GCTCTCACAA   CTGGGAGAAG   TATTGGCTCT   TTTCCTGAGA   ATTTTGCCAA      5640GGGTATGCTG   TTACTGGGGC   TGGTTTGGAA   GGAGTATAGG   GCATTATGTC   TGTGAAGGCA      5700GTGGCTGGGG   TGGGGCCTTA   TCAGGCCCAA   GGAGCATCTG   GCCACATCTC   AGAGTCCACA      5760GATGAGGATC   ACGGATGTGT   AGAGGAAACA   TCCTAGGCAG   GCAATCATCT   GACTGCTTTT      5820TTGGGGCAGG   TGATGCCCTG   GGAAATTGGG   AGGGAGGGAG   AGAGGGAGGT   AGGCTATTCT      5880AGAAACTGGG   AGAGCAGGTG   AGGTAGGATT   GGGAGGACCA   GGGGTCAGGG   TCCCCATTGG      5940TCCCTAATTG   AGAACGGAGA   GAGCATTGGT   CTAGGAGGCA   GGCAGCTCGG   TTATAAGACC      6000TTGGGAACTC   TTGATTTAGA   ATCCAAGATC   CTTTTTAGAT   CTAGGATTTT   ATAAAATTAA      6060GATATCCCCT   AAGATCAAAT   GCAACGTGGA   GTCCTGAATT   GGATCCTAGA   ACAGAAGAAG      6120GACATTTGTG   GAAAAACTAG   TGAAATCCAA   ATAAAGTCTG   TAGTTTTGTT   AATAGTAATG      6180CACCAATGTC   AGTTGCCTAG   TTGTGACAAA   TATACCGTGG   TTATGTAAGA   TGGTAACATT      6240AGGGGGAACT   GGAGAAGGGT   AGATTGGAGC   TCTCTGTACT   ATCTTTGCAA   CTTTTCTGGG      6300AATCTAAAAT   TACTCCAAAA   TAAAAAAAAA   ATGTATTTAA   AGTAAATATA   TTCCCTAAGA      6360GTCCAGGAGG   CAGGGGAGTT   GTAGAAGCAG   CTGAGTGGTT   GGGTTCTGAC   AGATTTGGTT      6420CCAACTCGGT   CTCTGCTGCT   CACCAGCTGT   GTGACCTTGA   GCAAGTGGCT   TAGCCTTTCT      6480GAGCCTGATT   TCCTTATCTG   TGGAGTGGGG   AAGATGACAG   CCACCTCGCA   GGGCTGTGGA      6540GGGTTAAACG   AGGTGATGCA   TGGACAGCAG   CCGCACTGAC   CTTGCTGGTG   TGGGGCTCCT      6600GCTTCTGTTC   TTCCCGTGCA   GCCTTGGGAA   TGTTGGAGGC   CGTATCCAGG   GACCCCTGGG      6660CCTCCTGGGA   TGGCCTCTCT   GGATCAGCCT   TGGAAGGTTC   CAGGCTGCCC   TTAGGCTCCC      6720ACATTCTTCC   CCAGTCACGC   TCTCCTCGCC   CTGCCCACAC   CAGTCCTGTG   ACCCTTGCCT      6780GAGTTGTGAC   TTCCCACCCC   TCCCCGGCCT   AGAGGAAAGC   TGCCTGGCCC   CTCAGTGGGA      6840CTCCCGCCCA   CTGACCCTCT   GTCCACCATA   CACAGACAGG   GGCACTATCC   ACAAGGTGGT      6900GGAACCGGGG   GAGCAGGAGC   ACAGCTTCGC   CTTCAACATC   ATGGAGATCC   AGCCCTTCCG      6960CCGCGCGGCT   GCCATCCAGA   CCATGTCGCT   GGATGCTGAG   CGGGTGAGCC   TTCCCCCACT      7020GCGTCCCATG GGCTATGCAG TGACTGCAGC TGAGGACAGG GCTCCTTTGC ATGTGATTTG      7080TGTGTTCTTT TAAGAGCTTC TAGGCCTTAG GGCCTGGACA TTTAGGACTG AGTGTGGGGT      7140GGGGCCCGGG CCTGACCCAA TCCTGCTGTC CTTCCAGAGG AAGCTGTATG TGAGCTCCCA      7200GTGGGAGGTG AGCCAGGTGC CCCTGGACCT GTGTGAGGTC TATGGCGGGG GCTGCCACGG      7260TTGCCTCATG TCCCGAGACC CCTACTGCGG CTGGGACCAG GGCCGCTGCA TCTCCATCTA      7320CAGCTCCGAA CGGTACGTTG GCCGGGATCC CTCCGTCCCT GGGACAAGGT GGGCATGGGA      7380CAGGGGGAGG TGTTGTCGGG CTGGAAGAGG TGGCGGTACT GGGCCTTTCT TGTGGGACCT      7440CCTCTCTACT GGAACTGCAC TAGGGGTAAG GATATGAGGG TCAGGTCTGC AGCCTTGTAT      7500CTGCTGATCC TCTTTCGTCC TTCCCACTCC AGGTCAGTGC TGCAATCCAT TAATCCAGCC      7560GAGCCACACA AGGAGTGTCC CAACCCCAAA CCAGGTACCT GATCTGGCCC TGCTGGCGGC      7620TGTGGCCCAA TGAGTGGGGT ACTGCCCTGC CCTGATTGTC CTGGTCTGAG GGAAACATGG      7680CCTTGTCCTG TGGGCCCCAG GTACATGGGG CAGGATACAG TCCTGCAGAG GGAGCCCTCT      7740TGGTGGGATG AGCGAGACGG GAGAAAAAAG GAGGACGCTG AGGGCTGGGT TCCCCACGTT     7800CATTCAGAAG CCTTGTCCTG GGATCCCAGT CGGTGGGGAG GACACATCCT CCCCTGGGAG     7860CTCTTTGTCC CTCCTCACGG CTGCTTCCCC ACTGCCTGCC CAGACAAGGC CCCACTGCAG     7920AAGGTTTCCC TGGCCCCAAA CTCTCGCTAC TACCTGAGCT GCCCCATGGA ATCCCGCCAC     7980GCCACCTACT CATGGCGCCA CAAGGAGAAC GTGGAGCAGA GCTGCGAACC TGGTCACCAG     8040AGCCCCAACT GCATCCTGTT CATCGAGAAC CTCACGGCGC AGCAGTACGG CCACTACTTC     8100TGCGAGGCCC AGGAGGGCTC CTACTTCCGC GAGGCTCAGC ACTGGCAGCT GCTGCCCGAG     8160GACGGCATCA TGGCCGAGCA CCTGCTGGGT CATGCCTGTG CCCTGGCCGC CTCCCTCTGG     8220CTGGGGGTGC TGCCCACACT CACTCTTGGC TTGCTGGTCC ACTAGGGCCT CCCGAGGCTG     8280GGCATGCCTC AGGCTTCTGC AGCCCAGGGC ACTAGAACGT CTCACACTCA GAGCCGGCTG     8340GCCCGGGAGC TCCTTGCCTG CCACTTCTTC CAGGGGACAG AATAACCCAG TGGAGGATGC     8400CAGGCCTGGA GACGTCCAGC CGCAGGCGGC TGCTGGGCCC CAGGTGGCGC ACGGATGGTG     8460AGGGGCTGAG AATGAGGGCA CCGACTGTGA AGCTGGGGCA TCGATGACCC AAGACTTTAT     8520CTTCTGGAAA ATATTTTTCA GACTCCTCAA ACTTGACTAA ATGCAGCGAT GCTCCCAGCC     8580CAAGAGCCCA TGGGTCGGGG AGTGGGTTTG GATAGGAGAG CTGGGACTCC ATCTCGACCC     8640TGGGGCTGAG GCCTGAGTCC TTCTGGACTC TTGGTACCCA CATTGCCTCC TTCCCCTCCC     8700TCTCTCATGG CTGGGTGGCT GGTGTTCCTG AAGACCCAGG GCTACCCTCT GTCCAGCCCT     8760GTCCTCTGCA GCTCCCTCTC TGGTCCTGGG TCCCACAGGA CAGCCGCCTT GCATGTTTAT     8820TGAAGGATGT TTGCTTTCCG GACGGAAGGA CGGAAAAAGC TCTGAAAAAA AAAAAAAAAA     8880AAAAAAAA                                                              8888

    (2)SEQ ID NO:42的信息：

     (ⅰ)序列特征：

      (A)长度：6622个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：基因组DNA

     (ⅸ)特征：

      (A)名称/关键词：外显子

      (B)位置：1..6622

    (ⅹⅰ)序列描述：SEQ ID NO:42:GATATCATGG   AGATAATTAA   AATGATAACC   ATCTCGCAAA   TAAATAAGTA   TTTTACTGTT               60TTCGTAACAG   TTTTGTAATA   AAAAAACCTA   TAAATATGAA   ATTCTTAGTC   AACGTTGCCC              120TTGTTTTTAT   GGTCGTATAC   ATTTCTTACA   TCTATGCGGA   TCGATGGGGA   TCCGCCCAGG              180GCCACCTAAG   GAGCGGACCC   CGCATCTTCG   CCGTCTGGAA   AGGCCATGTA   GGGCAGGACC              240GGGTGGACTT   TGGCCAGACT   GAGCCGCACA   CGGTGCTTTT   CCACGAGCCA   GGCAGCTCCT              300CTGTGTGGGT   GGGAGGACGT   GGCAAGGTCT   ACCTCTTTGA   CTTCCCCGAG   GGCAAGAACG              360CATCTGTGCG   CACGGTGAAT   ATCGGCTCCA   CAAAGGGGTC   CTGTCTGGAT   AAGCGGGACT              420GCGAGAACTA   CATCACTCTC   CTGGAGAGGC   GGAGTGAGGG   GCTGCTGGCC   TGTGGCACCA              480ACGCCCGGCA   CCCCAGCTGC   TGGAACCTGG   TGAATGGCAC   TGTGGTGCCA   CTTGGCGAGA              540TGAGAGGCTA   TGCCCCCTTC   AGCCCGGACG   AGAACTCCCT   GGTTCTGTTT   GAAGGGGACG              600AGGTGTATTC   CACCATCCGG   AAGCAGGAAT   ACAATGGGAA   GATCCCTCGG   TTCCGCCGCA              660TCCGGGGCGA   GAGTGAGCTG   TACACCAGTG   ATACTGTCAT   GCAGAACCCA   CAGTTCATCA              720AAGCCACCAT   CGTGCACCAA   GACCAGGCTT   ACGATGACAA   GATCTACTAC   TTCTTCCGAG              780AGGACAATCC   TGACAAGAAT   CCTGAGGCTC   CTCTCAATGT   GTCCCGTGTG   GCCCAGTTGT              840GCAGGGGGGA   CCAGGGTGGG   GAAAGTTCAC   TGTCAGTCTC   CAAGTGGAAC   ACTTTTCTGA              900AAGCCATGCT   GGTATGCAGT   GATGCTGCCA   CCAACAAGAA   CTTCAACAGG   CTGCAAGACG              960TCTTCCTGCT   CCCTGACCCC   AGCGGCCAGT   GGAGGGACAC   CAGGGTCTAT   GGTGTTTTCT             1020CCAACCCCTG   GAACTACTCA   GCCGTCTGTG   TGTATTCCCT   CGGTGACATT   GACAAGGTCT             1080TCCGTACCTC   CTCACTCAAG   GGCTACCACT   CAAGCCTTCC   CAACCCGCGG   CCTGGCAAGT             1140GCCTCCCAGA   CCAGCAGCCG   ATACCCACAG   AGACCTTCCA   GGTGGCTGAC   CGTCACCCAG             1200AGGTGGCGCA   GAGGGTGGAG   CCCATGGGGC   CTCTGAAGAC   GCCATTGTTC   CACTCTAAAT             1260ACCACTACCA   GAAAGTGGCC   GTTCACCGCA   TGCAAGCCAG   CCACGGGGAG   ACCTTTCATG             1320TGCTTTACCT   AACTACAGAC   AGGGGCACTA   TCCACAAGGT   GGTGGAACCG   GGGGAGCAGG             1380AGCACAGCTT   CGCCTTCAAC   ATCATGGAGA   TCCAGCCCTT   CCGCCGCGCG   GCTGCCATCC             1440AGACCATGTC   GCTGGATGCT   GAGCGGAGGA   AGCTGTATGT   GAGCTCCCAG   TGGGAGGTGA             1500GCCAGGTGCC   CCTGGACCTG   TGTGAGGTCT   ATGGCGGGGG   CTGCCACGGT   TGCCTCATGT             1560CCCGAGACCC   CTACTGCGGC   TGGGACCAGG   GCCGCTGCAT   CTCCATCTAC   AGCTCCGLAC             1620GGTCAGTGCT   GCAATCCATT   AATCCAGCCG   AGCCACACAA   GGAGTGTCCC   AACCCCAAAC             1680CAGACAAGGC   CCCACTGCAG   AAGGTTTCCC   TGGCCCCAAA   CTCTCGCTAC   TACCTGAGCT        1740GCCCCATGGA   ATCCCGCCAC   GCCACCTACT   CATGGCGCCA   CAAGGAGAAC   GTGGAGCAGA        1800GCTGCGAACC   TGGTCACCAG   AGCCCCAACT   GCATCCTGTT   CATCGAGAAC   CTCACGGCGC        1860AGCAGTACGG   CCACTACTTC   TGCGAGGCCC   AGGAGGGCTC   CTACTTCCGC   GAGGCTCAGC        1920ACTGGCAGCT   GCTGCCCGAG   GACGGCATCA   TGGCCGAGCA   CCTGCTGGGT   CATGCCTGTG        1980CCCTGGCTGC   CTGAATTCGA   AGCTTGGAGT   CGACTCTGCT   GAAGAGGAGG   AAATTCTCCT        2040TGAAGTTTCC   CTGGTGTTCA   AAGTAAAGGA   GTTTGCACCA   GACGCACCTC   TGTTCACTGG        2100TCCGGCGTAT   TAAAACACGA   TACATTGTTA   TTAGTACATT   TATTAAGCGC   TAGATTCTGT        2160GCGTTGTTGA   TTTACAGACA   ATTGTTGTAC   GTATTTTAAT   AATTCATTAA   ATTTATAATC        2220TTTAGGGTGG   TATGTTAGAG   CGAAAATCAA   ATGATTTTCA   GCGTCTTTAT   ATCTGAATTT        2280AAATATTAAA   TCCTCAATAG   ATTTGTAAAA   TAGGTTTCGA   TTAGTTTCAA   ACAAGGGTTG        2340TTTTTCCGAA   CCGATGGCTG   GACTATCTAA   TGGATTTTCG   CTCAACGCCA   CAAAACTTGC        2400CAAATCTTGT   AGCAGCAATC   TAGCTTTGTC   GATATTCGTT   TGTGTTTTGT   TTTGTAATAA        2460AGGTTCGACG   TCGTTCAAAA   TATTATGCGC   TTTTGTATTT   CTTTCATCAC   TGTCGTTAGT        2520GTACAATTGA   CTCGACGTAA   ACACGTTAAA   TAAAGCCTGG   ACATATTTAA   CATCGGGCGT        2580GTTAGCTTTA   TTAGGCCGAT   TATCGTCGTC   GTCCCAACCC   TCGTCGTTAG   AAGTTGCTTC        2640CGAAGACGAT   TTTGCCATAG   CCACACGACG   CCTATTAATT   GTGTCGGCTA   ACACGTCCGC        2700GATCAAATTT   GTAGTTGAGC   TTTTTGGAAT   TATTTCTGAT   TGCGGGCGTT   TTTGGGCGGG        2760TTTCAATCTA   ACTGTGCCCG   ATTTTAATTC   AGACAACACG   TTAGAAAGCG   ATGGTGCAGG        2820CGGTGGTAAC   ATTTCAGACG   GCAAATCTAC   TAATGGCGGC   GGTGGTGGAG   CTGATGATAA        2880ATCTACCATC   GGTGGAGGCG   CAGGCGGGGC   TGGCGGCGGA   GGCGGAGGCG   GAGGTGGTGG        2940CGGTGATGCA   GACGGCGGTT   TAGGCTCAAA   TTGTCTCTTT   CAGGCAACAC   AGTCGGCACC        3000TCAACTATTG   TACTGGTTTC   GGGCGTATGG   TGCACTCTCA   GTACAATCTG   CTCTGATGCC        3060GCATAGTTAA   GCCAGCCCCG   ACACCCGCCA   ACACCCGCTG   ACGCGCCCTG   ACGGGCTTGT        3120CTGCTCCCGG   CATCCGCTTA   CAGACAAGCT   GTGACCGTCT   CCGGGAGCTG   CATGTGTCAG        3180AGGTTTTCAC   CGTCATCACC   GAAACGCGCG   AGACGAAAGG   GCCTCGTGAT   ACGCCTATTT        3240TTATAGGTTA   ATGTCATGAT   AATAATGGTT   TCTTAGACGT   CAGGTGGCAC   TTTTCGGGGA        3300AATGTGCGCG   GAACCCCTAT   TTGTTTATTT   TTCTAAATAC   ATTCAAATAT   GTATCCGCTC        3360ATGAGACAAT   AACCCTGATA   AATGCTTCAA   TAATATTGAA   AAAGGAAGAG   TATGAGTATT        3420CAACATTTCC   GTGTCGCCCT   TATTCCCTTT   TTTGCGGCAT   TTTGCCTTCC   TGTTTTTGCT        3480CACCCAGAAA   CGCTGGTGAA   AGTAAAAGAT   GCTGAAGATC   AGTTGGGTGC   ACGAGTGGGT        3540TACATCGAAC   TGGATCTCAA   CAGCGGTAAG   ATCCTTGAGA   GTTTTCGCCC   CGAAGAACGT            3600TTTCCAATGA   TGAGCACTTT   TAAAGTTCTG   CTATGTGGCG   CGGTATTATC   CCGTATTGAC            3660GCCGGGCAAG   AGCAACTCGG   TCGCCGCATA   CACTATTCTC   AGAATGACTT   GGTTGAGTAC            3720TCACCAGTCA   CAGAAAAGCA   TCTTACGGAT   GGCATGACAG   TAAGAGAATT   ATGCAGTGCT            3780GCCATAACCA   TGAGTGATAA   CACTGCGGCC   AACTTACTTC   TGACAACGAT   CGGAGGACCG            3840AAGGAGCTAA   CCGCTTTTTT   GCACAACATG   GGGGATCATG   TAACTCGCCT   TGATCGTTGG            3900GAACCGGAGC   TGAATGAAGC   CATACCAAAC   GACGAGCGTG   ACACCACGAT   GCCTGTAGCA            3960ATGGCAACAA   CGTTGCGCAA   ACTATTAACT   GGCGAACTAC   TTACTCTAGC   TTCCCGGCAA            4020CAATTAATAG   ACTGGATGGA   GGCGGATAAA   GTTGCAGGAC   CACTTCTGCG   CTCGGCCCTT            4080CCGGCTGGCT   GGTTTATTGC   TGATAAATCT   GGAGCCGGGG   AGCGTGGGTC   TCGCGGTATC            4140ATTGCAGCAC   TGGGGCCAGA   TGGTAAGCCC   TCCCGTATCG   TAGTTATCTA   CACGACGGGG            4200AGTCAGGCAA   CTATGGATGA   ACGAAATAGA   CAGATCGCTG   AGATAGGTGC   CTCACTGATT            4260AAGCATTGGT   AACTGTCAGA   CCAAGTTTAC   TCATATATAC   TTTAGATTGA   TTTAAAACTT            4320CATTTTTAAT   TTAAAAGGAT   CTAGGTGAAG   ATCCTTTTTG   ATAATCTCAT   GACCAAAATC            4380CCTTAACGTG   AGTTTTCGTT   CCACTGAGCG   TCAGACCCCG   TAGAAAAGAT   CAAAGGATCT            4440TCTTGAGATC   CTTTTTTTCT   GCGCGTAATC   TGCTGCTTGC   AAACAAAAAA   ACCACCGCTA            4500CCAGCGGTGG   TTTGTTTGCC   GGATCAAGAG   CTACCAACTC   TTTTTCCGAA   GGTAACTGCC            4560TTCAGCAGAG   CGCAGATACC   AAATACTGTT   CTTCTAGTGT   AGCCGTAGTT   AGGCCACCAC            4620TTCAAGAACT   CTGTAGCACC   GCCTACATAC   CTCGCTCTGC   TAATCCTGTT   ACCAGTGGCT            4680GCTGCCAGTG   GCGATAAGTC   GTGTCTTACC   GGGTTGGACT   CAAGACGATA   GTTACCGGAT            4740AAGGCGCAGC   GGTCGGGCTG   AACGGGGGGT   TCGTGCACAC   AGCCCAGCTT   GGAGCGAACG            4800ACCTACACCG   AACTGAGATA   CCTACAGCGT   GAGCTATGAG   AAAGCGCCAC   GCTTCCCGAA            4860GGGAGAAAGG   CGGACAGGTA   TCCGGTAAGC   GGCAGGGTCG   GAACAGGAGA   GCGCACGAGG            4920GAGCTTCCAG   GGGGAAACGC   CTGGTATCTT   TATAGTCCTG   TCGGGTTTCG   CCACCTCTGA            4980CTTGAGCGTC   GATTTTTGTG   ATGCTCGTCA   GGGGGGCGGA   GCCTATGGAA   AAACGCCAGC            5040AACGCGGCCT   TTTTACGGTT   CCTGGCCTTT   TGCTGGCCTT   TTGCTCACAT   GTTCTTTCCT            5100GCGTTATCCC   CTGATTCTGT   GGATAACCGT   ATTACCGCCT   TTGAGTGAGC   TGATACCGCT            5160CGCCGCAGCC   GAACGACCGA   GCGCAGCGAG   TCAGTGAGCG   AGGAAGCATC   CTGCACCATC            5220GTCTGCTCAT   CCATGACCTG   ACCATGCAGA   GGATGATGCT   CGTGACGGTT   AACGCCTCGA            5280ATCAGCAACG   GCTTGCCGTT   CAGCAGCAGC   AGACCATTTT   CAATCCGCAC   CTCGCGGAAA            5340CCGACATCGC   AGGCTTCTGC   TTCAATCAGC   GTGCCGTCGG   CGGTGTGCAG   TTCAACCACC            5400GCACGATAGA   GATTCGGGAT   TTCGGCGCTC   CACAGTTTCG   GGTTTTCGAC   GTTCAGACGT            5460AGTGTGACGC   GATCGGTATA   ACCACCACGC   TCATCGATAA   TTTCACCGCC   GAAAGGCGCG           5520GTGCCGCTGG   CGACCTGCGT   TTCACCCTGC   CATAAAGAAA   CTGTTACCCG   TAGGTAGTCA           5580CGCAACTCGC   CGCACATCTG   AACTTCAGCC   TCCAGTACAG   CGCGGCTGAA   ATCATCATTA           5640AAGCGAGTGG   CAACATGGAA   ATCGCTGATT   TGTGTAGTCG   GTTTATGCAG   CAACGAGACG           5700TCACGGAAAA   TGCCGCTCAT   CCGCCACATA   TCCTGATCTT   CCAGATAACT   GCCGTCACTC           5760CAACGCAGCA   CCATCACCGC   GAGGCGGTTT   TCTCCGGCGC   GTAAAAATGC   GCTCAGGTCA           5820AATTCAGACG   GCAAACGACT   GTCCTGGCCG   TAACCGACCC   AGCGCCCGTT   GCACCACAGA           5880TGAAACGCCG   AGTTAACGCC   ATCAAAAATA   ATTCGCGTCT   GGCCTTCCTG   TAGCCAGCTT           5940TCATCAACAT   TAAATGTGAG   CGAGTAACAA   CCCGTCGGAT   TCTCCGTGGG   AACAAACGGC           6000GGATTGACCG   TAATGGGATA   GGTCACGTTG   GTGTAGATGG   GCGCATCGTA   ACCGTGCATC           6060TGCCAGTTTG   AGGGGACGAC   GACAGTATCG   GCCTCAGGAA   GATCGCACTC   CAGCCAGCTT           6120TCCGGCACCG   CTTCTGGTGC   CGGAAACCAG   GCAAAGCGCC   ATTCGCCATT   CAGGCTGCGC           6180AACTGTTGGG   AAGGGCGATC   GGTGCGGGCC   TCTTCGCTAT   TACGCCAGCT   GGCGAAAGGG           6240GGATGTGCTG   CAAGGCGATT   AAGTTGGGTA   ACGCCAGGGT   TTTCCCAGTC   ACGACGTTGT           6300AAAACGACGG   GATCTATCAT   TTTTAGCAGT   GATTCTAATT   GCAGCTGCTC   TTTGATACAA           6360CTAATTTTAC   GACGACGATG   CGAGCTTTTA   TTCAACCGAG   CGTGCATGTT   TGCAATCGTG           6420CAAGCGTTAT   CAATTTTTCA   TTATCGTATT   GTTGCACATC   AACAGGCTGG   ACACCACGTT           6480GAACTCGCCG   CAGTTTTGCG   GCAAGTTGGA   CCCGCCGCGC   ATCCAATGCA   AACTTTCCGA           6540CATTCTGTTG   CCTACGAACG   ATTGATTCTT   TGTCCATTGA   TCGAAGCGAG   TGCCTTCGAC           6600TTTTTCGTGT   CCAGTGTGGC   TT                                                          6622

    (2)SEQ ID NO:43的信息：

     (ⅰ)序列特征：

      (A)长度：31个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：基因组DNA

     (ⅸ)特征：

      (A)名称/关键词：外显子

    (B)位置：1..31

     (ⅹⅰ)序列描述：SEQ ID NO:43:

    (2)SEQ ID NO:44的信息：

     (ⅰ)序列特征：

      (A)长度：29个碱基对

      (B)类型：核酸

      (C)链型：单链

      (D)拓扑结构：线型

     (ⅱ)分子类型：基因组DNA

     (ⅹⅰ)序列描述：SEQ ID NO:44:CTGAATTCAGGAGCCAGGGCACAGGCATG       29