人类信息素L和其它物种中相应的信息素 本发明涉及由一特定的结构域结构识别的新的信息素(semaphorin)和其衍生物,涉及编码这些信息素的核酸(DNA、RNA、cDNA)和其衍生物,以及它们的制备和用途。
Kolodkin首次描述了信息素作为保守基因家族的成员{Kolodkin等(1993)细胞75:1389-1399}。
现在已经克隆出(并且在某些情况下已经描绘出)其它信息素的基因或部分基因。到目前为止,已经公开了总共5种人类信息素(H-SemaⅢ,H-SemaⅤ,H-SemaⅣ,H-SemaB和H-SemaE){(Kolodkin等(1993);Poche等(1996)癌基因12:1289-1297;Sekido等(1996)美国科学院院报93:4120-4125;Xiang等(1996)基因组32:39-48;Hall等(1996)美国科学院院报39:11780-11785;Yamada等(1997)(GenBank登记号AB000220)},8种鼠类信息素(小鼠基因;M-Sema A到M-Sema-H){(Püschel等(1995)神经元14:941-948;Messerschmidt等(1995)神经元14:949-959;Inigaki等(1995)FEBS通讯370:269-272;Adams等(1996)Mech.Dev57:33-45;Christensen等(1996)(GenBank登记号Z80941,Z93948)},5种鸡精蛋白(小鸡)脑衰蛋白-1到-5){Luo等(1993);Luo等(1995)神经元14:1131-1140},以及来自大鼠(R-Sema-Ⅲ){Giger等(1996)J.Comp.Neurol.375:378-392},斑马鱼,昆虫毛(果蝇(果蝇D melanogaster:D-SemaⅠ和D-SemaⅡ),甲虫Tribolium confusum:T-Sema-l),蚱蜢(Schistocerca americana:G-Sema-l)){Kolodkin等(1993)},以及线虫(C.elegans:Ce-Sema){Roy等(1994)(GemBank登记号U15667)}的基因。此外,两种痘病毒(牛痘(ORF-A39)和天花(ORFA39-同源物)){Kolodkin等(1993)}和alcelaphine疱疹病毒1型(AHV-1)(AHV-Sema){Ensser和Fleckenstein(1995)普通病毒学76:1063-1067}具有与信息素同源的基因。
表-1总结了到目前为止在各种物种中鉴别的信息素。表1显示了信息素的名称(第1列),所使用的同义词(第2列),分离特定信息素的物种(第3列);和其中已知的关于所说地编码蛋白质的结构域结构的数据和关于染色体位点的数据(表1的第4列),存储在基因数据库(例如,EST(表达序列标记)数据库,EMBL(欧洲分子生物学实验室,Heidelberg)数据库或NCBI(国家生物技术信息中心,马里兰,美国)的基因序列的登记号,以及这些数据出版的参考信息(表1的第5列)。
到目前为止,所有公开的信息素基因的基因产物(编码的信息素)都具有一个N端信号肽。它在C端具有大约450至500个氨基酸长度的特有Sema结构域。高度保守的氨基酸基元和一些高度保守的半胱氨酸残基被已在Sema结构域中找到。基因产物(信息素)在C端序列方面是不同的,这些序列跟随在Sema结构域之后,并且由一个或多个结构域组成。例如,在这些C端氨基酸序列中有跨膜结构域(TM),免疫球蛋白样结构域(Ig)(免疫球蛋白恒定区),胞质序列(CP),加工信号(P)(例如有共有序列(RXR),其中R是精氨酸,X是任何氨基酸)和/或亲水C端(HPC)。到目前为止所公开的信息素根据C端的结构域结构的不同可以划分为5个不同的子群(Ⅰ到Ⅴ):Ⅰ 分泌性,没有其它结构域(例如ORF-A49)Ⅱ lg 分泌性(没有跨膜结构,例如AHV-Sema)Ⅲ lg, TM,CP具有胞质序列,膜锚着(例如CD100)Ⅳ lg, (P),HPC具有亲水性C端,分泌性(例如H-SemaⅢ,M-SemaD,脑衰蛋白-l)V lg, TM,CP具有C端7血小板反应蛋白基元。膜锚着(例如M-SemaF和G)
到此为止还没有描述过信息素受体或胞外配体。已经公开了与信息素-介导作用相关连的胞内杂合三聚体GTP结合性蛋白质复合物。在小鸡中已被鉴别的这些蛋白质复合物的一个组分称为CRMP(脑衰蛋白应答介导蛋白质),并且被假定是信息素诱导的胞内信号级联的一个组分(Goshima等(1995)自然376:509-514)。例如,CRMP62与unc-33、线虫蛋白质(对轴突定向成长来说是十分重要的)都具有同源性。同样地,已知人类蛋白质98%的氨基酸与CRMP62具有等同性(Hamajima等(1996)基因180:157-163)。类似地描述了大鼠中的几个CRMP-相关基因(Wang等(1996)神经科学16:6197-6207)。
所说的分泌性或跨膜信息素为增长的神经芽体传达排斥信号。在神经系统(CNS)的发育中,它们起着重要的作用,并且特别是在肌肉和神经组织中表达(Kolodkin等(1993);Luo等(1993)细胞75:217-227)。
与密切相关的M-SemaF相对比,M-SemaG的显著表达不仅在所说的CNS中而且在淋巴与造血系统的细胞中已经观察到(Furuyima等(1996)生物化学杂志271:33376-33381)。
近来已经鉴别出两个其它的人类信息素,H-SemaⅣ和H-SemaⅤ(特别是染色体3p21.3区域),其缺失与各种类型的支气管癌有关。H-SemaⅣ{(Roche等(1996),Xiang等(1996),Sekido等(1996)}与M-SemaE在氨基酸水平上大约有50%的等同性,而H-SemaⅤ{Sekido等(1996)}是M-SemaA的直接同系物(86%的氨基酸等同性)。因为在所切除的3p21.3基因座上进行DNA测序工程期间发现了这些基因(H-SemaⅣ和Ⅴ),这两个基因复合物的内含子-外显子结构是已知的。两个基因都能在各种神经元和非神经元组织中表达。
同样仅仅在前不久,细胞表面分子CD100(人)(在活化的T细胞上表达并诱导)已经鉴别为是一种信息素(表1中同样列出)。它通过CD40受体和相应配体CD40L帮助与B细胞相互作用。CD100是一个150kd(千道尔顿)的膜锚着糖蛋白二聚体。已经描述了CD100的外胞质C端与一迄今未知的激酶的结合{Hall等(1996)}。这就意味CD100是第一个并且是迄今为止仅有的已证明在免疫系统的细胞中表达的信息素。
在“rhadinoviruses的转化基因”方案中,已经克隆和测序了alcelaphine疱疹病毒1型(AHV-1)的完全基因组{Ensser等(1995)}。AHV-1是恶性卡他发热、各种与淋巴增殖综合症有关的反刍动物疾病的诱发剂(并且通常是致命的)。经过分析,发现了一个开放读框,在病毒基因组的一端具有与痘苗病毒基因远程的但是显著的同源性(ORF-A39相应于Ensser等(1995)普通病毒学76:1063-1067的VAC-A39),后者已经被归为信息素基因家族。而AHV-1信息素(AHV-Sema)具有非常保守的信息素结构,痘病毒基因(ORF-A39和ORF-A39-同源物,参见表1)具有C端截短。即其中仅仅非完全地存在保守Sema结构域。
所发现的AHV-Sema与dbEST(EST(表达序列标志)数据库(db))的数据库比较提从人胎盘的2种独立cDNA克隆都提供了两种EST序列(登记号H02902,H03806(克隆151129),登记号R33439和R33537(克隆135941))。与迄今为止所描述的神经元信息相比。这些明显地显示了与AHV-1的信息素更大的同源性。
本发明涉及这样的信息素,它们具有新的迄今未公开的和未曾预料到的结构域结构,并且其具有在免疫系统中的生化功能(免疫调节信息素)。这些新的信息素被称为L型信息素(SemaL)。它们包含一个N端信号肽。一个特征性Sema结构域。并且在蛋白质的C端区包括一个免疫球蛋白样结构域和一个代表潜在跨膜结构域的疏水结构域。
信号肽的氨基酸序列可以有少于70个氨基酸,优选地少于60个,而多于20个,更优选地多于30个氨基酸,并且特别优选的长度是约40到50个氨基酸,在本发明的特定实施方案中,所说的信号肽具有44个氨基酸长度,即信号肽酶的切割位点被定位在44到45个氨基酸之间。
Sema结构域的长度可以是从300到700或更多个氨基酸,优选的是大约400到600个氨基酸,更优选的Sema结构域的长度是450至550个氨基酸,优选的是大约500个氨基酸,在本发明更优选的实施方案中,Sema结构域被加上信号肽,此时Sema结构域优选地达到545个氨基酸。
免疫球蛋白样结构域的长度可以是大约30至110个或更多个氨基酸,以及优选的长度是在50与90个之间的,特别优选的是大约70个氨基酸。
跨膜结构域的长度可以是大约10至35个氨基酸,优选的是大约15至30个,特别优选的是大约20至25个氨基酸。
本发明涉及来自不同物种的L型信息素,特别是脊椎动物,例如鸟类和/或鱼类,优选是哺乳动物,例如灵长目动物,大鼠、兔、狗、猫、绵羊、山羊、母牛、马、猪、特别优选的是人和小鼠。本发明也涉及来自微生物的相应的信息素,尤其是病原微生物,例如细菌,酵母和/或病毒,例如反转录病毒,尤其是人-病原微生物。
本发明的一个实施方案是相应的人类信息素(H-SemaL),它具有信号肽,Sema结构域。免疫球蛋白样结构域和跨膜结构域。特定的实施方案是由表4中显示的氨基酸序列给出的信息素。
本发明的另一个实施方案包含其它物种中相应的信息素,它们在Sema结构域区域中与H-SenaL的Sema结构域(表4中序列的45至545个氨基酸)相比具有超过40%,优选的是超过50%,特别优选的是超过60%的氨基酸等同性。。在密切相关物种(例如灵长目动物,小鼠)中相应的信息素可能很完美地具有超过70%,优选的是超过80%,特别优选的是超过90%的氨基酸等同性。例如可以利用GAP程序来确定或计算出百分同源性(GCG程序包。遗传计算机组(1991))。
本发明这样的实施方案是相应的小鼠信息素(鼠信息素(M-SemaL))。例如,它含有在表5中所显示的部分氨基酸序列(鼠信息素(M-SemaL))。
本发明也涉及这样的相应信息素,在较少相关的物种(系统发育上相互之间十分远的)中,它与表4中显示的H-SemaL完全氨基酸序列相比仅仅具有大约15至20%的氨基酸等同性(在蛋白质氨基酸序列的整个长度上考虑),优选的是25至30%,特别优选的是35至40%,或是更高的等同性。
编码L型信息素的基因具有外显子-内含子结构。例如,这些基因可能具有10到20个外显子,优选的是大约11至18个,特别优选的是12至16个外显子和相应的数量的内含子。然而,它们也可以具有与H-SemaL基因相同数量的外显子和内含子(13或15个外显子,优选的是14个外显子)。本发明的一个特定实施方案涉及H-SemaL基因。这一基因的长度优选的是8888至10,000或更多个核苷酸。人类信息素基因优选地包含素14所给出的核苷酸序列或在GenBank_数据库中储存的登记号AF030697的核苷酸序列。这些核苷酸序列含有至少13个内含子。此外,人类信息素基因在5'端具有一个附加序列区域。合适时这一区域进一步含有编码和非编码序列,例如一或两个另外的内含子或外显子。
试图将人类L型信息素定位在染色体上,这揭示了将相应的基因定在位置15q22.3-23。对于M-SemaL的基因,相应地定位在位置9A3.3-B。
作为内含子-外显子复合结构的结果,信息素mRNA初级转录物的剪接可能发生变化。其结果将导致产生信息素的不同剪接变体。这些剪接变体所翻译的蛋白质是本发明信息素的衍生物。它们的氨基酸序列,实质上其结构域结构相应于本发明描述的L型信息素,但是与后者相比较适当地方却被截短了。例如,可以形成完全或部分缺失跨膜结构域的剪接变体。含有一个不完全(或没有)跨膜结构域但是含有信号肽的信息素衍生物可能是具有分泌性的,并且通过这种方式对细胞外部,局部或其它相对较远的距离起作用,例如对其它细胞起作用。例如,另一个剪接变体可以不再含有编码信号肽的序列,同时,在适当时也没有编码代表潜在跨膜结构域的疏水氨基酸序列的序列。一种结果将是其信息素衍生物不能掺入到膜内,也不能进行分泌(除非通过分泌泡)。这样的信息素衍生物可以进入胞内过程,例如信号转导过程。这样就可能以相同的基本分子(L型信息素)和其衍生物(例如剪接变体)控制和/或协调各种胞内和胞外的过程。
本发明一个特定的实施方案涉及从本发明L型信息素产生的信息素衍生物,但是它含有一个不完全的(或没有)跨膜结构域。
本发明的另一个实施方案涉及从本发明L型信息素产生的信息素衍生物,但是它不含有信号肽。
信号肽也可以在翻译后切除。这导致以截短的结构域结构形成了膜结合性(TM结构域)或分泌性(没有TM结构域的剪接变体)信息素衍生物。现在一种以这种方式经过翻译后加工的信息素衍生物仅仅含有Sema结构域。1g结构域。同时在适当时具有跨膜结构域。信号肽切割位点可以正好定位在信号肽的末端,但也可以例如定位在距离氨基端40至50个氨基酸或更远。
"截短的"(即包含更少的结构域)信息素L衍生物可以与其它不衍生自L型信息素的信息素的区别是,在存在的结构域中与L型信息素具有很大(>90%)的氨基酸等同性或具有同一氨基酸序列。
根据本发明的信息素也可以用其它方法经过翻译后修饰。例如,它们可以通过一次,两次,三次,四次,五次,六次,七次,八次,九次,十次或更多次的糖基化(N-和/或O-糖基化)。于是,信息素的氨基酸序列可能具有相等数量或更多的潜在糖基化位点的共有序列,优选的有5个这样的位点。本发明的一个实施方案涉及这样的信息素,其中糖基化位点位于与H-SemaL氨基酸序列(表4)相一致的位置105,157,258,330和602。
此外,所说的信息素可以是它们磷酸化衍生物的形式。信息素可以是不同激酶的底物,例如氨基酸序列可能有蛋白激酶C,酪氨酸激酶和/或肌酸激酶的共有序列。此外,信息素的氨基酸序列可能有潜在的肉豆蔻酰化位点的共有序列。相应的信息素衍生物在这些位点上可以用肉豆蔻酸进行酯化。
本发明的L型信息素和它们的衍生物可以是单体,二聚体和/或多聚体的形式。例如两个或更多信息素或他们的衍生物可以用分子间的二硫键连接在一起。形成分子内的二硫键也是可能的。
本发明信息素的其它衍生物是融合蛋白。这一类型的融合蛋白一方面含有L型信息素或其部分,同时,另外还含有其它的肽或蛋白质或它的一部分。例如,肽或蛋白质或其部分可能是表位标记(例如His标记(6X组氨酸),Myc标记。流感标记),因而可以利用它们,例如,用于纯化融合蛋白,或它们也可以用于标记融合蛋白,例如GFP(绿色荧光蛋白质)。例如,L型信息素衍生物的例子在实施例的构建体中已经说明。在表7至15中可以发现这些构建体序列,并在适当时考虑质粒的注释来解释。
本发明进一步涉及编码本发明L型信息素和/或它们的衍生物的核酸序列,优选DNA和RNA序列,例如相应的基因,mRNA的不同剪接变体,与此相应的cDNA,以及其衍生物(例如DNA或RNA的盐)。本发明的衍生物是经过如分子生物学方法修饰并且适应特定需要的序列或序列片段,如截短的基因或基因片段(例如启动子序列,终止子序列),cDNA或它的嵌合体,用于表达和克隆的构建体和其盐。
一个实施方案涉及L型信息素的基因组序列(基因)。本发明涉及内含子和外显子序列,以及基因调控序列,例如启动子,增强子和沉默子序列。
这个实施方案一方面涉及H-SemaL的或其衍生物的基因。本发明一方面涉及包含表14中给出的核苷酸序列的基因。本发明进一步涉及包含以登记号AF030697收藏在GenBank数据库的核苷酸序列的基因。
这一实施方案进一步涉及M-SemaL的基因和它的衍生物。
本发明进一步涉及H-SemaL的cDNA或它的衍生物(例如cDNA片段)。一个特定的实施方案是根据表2中的核苷酸序列H-SemaL的cDNA。本发明进一步涉及以登记号AF030698收藏在GenBank数据库的H-SemaL的cDNA。本发明也涉及相应于这些cDNA的mRNA或它的片段。
本发明进一步涉及M-SemaL的cDNA或它的衍生物(例如cDNA片段)。一个特定的实施方案是在表3中所显示的M-SemaL的部分cDNA序列,以及包含这部分cDNA序列的cDNA序列。另一个本发明的实施方案涉及以登记号AF030699收藏在GenBank数据库的M-SemaL的cDNA。本发明也涉及相应于这些cDNA的mRNA或它的部分。
本发明也包含了等位基因和/或与上述的信息素序列相比仅仅轻微不同并编码同一或仅仅轻微修饰之蛋白质(氨基酸序列的不同少于或等于10%)的基因/mRNA/cDNA的个体表达形式(衍生物的进一步例子)。在实施例中所表明的构建体提供了其衍生物的进一步例子。在表7至14表中描述了这些构建体的序列,可考虑质粒的注释来解释。
本发明进一步涉及包含编码L型信息素或其衍生物之DNA的质粒。例如,这种类型的质粒可能是适合于例如在大肠杆菌中DNA扩增的具有高复制率的质粒。
特定实施方案为具有信息素或其片段或其衍生物的可以在原核和/或真核表达系统中表达的表达质粒。组成型表达质粒和那些包含诱导型启动子的质粒都是合适的。
本发明也涉及制备编码L型信息素或其衍生物的核酸的方法。这些核酸(例如DNA或RNA)可以是合成得来的,例如用化学手段。尤其是,对这些核酸(例如相应的基因或cDNA或它的片段)来说利用特异性扩增引物和合适的起始原料作为模板通过PCR进行扩増是可能的。(例如来自合适的组织或基因组DNA的cDNA)。制备信息素LcDNA和H-SemaL基因的特定方法在实施例中描述。
本发明也涉及制备L型信息素的方法。例如,信息素L或它的衍生物可以通过克隆相应的编码L型信息素或其衍生物的核酸序列进入表达载体,并且利用后者重组载体来转化合适细胞来制备。例如,利用原核或真核细胞是可能的。L型信息素或其衍生物也可以在合适时用化学手段制备。
此外,L型信息素和其衍生物可以作为与例如蛋白质或肽的融合蛋白表达,所说的蛋白质或肽使得表达的融合蛋白可以被检测,例如作为与GFP(绿色荧光蛋白质)的融合蛋白。信息素也能作为具有一个,两个,三个或更多个表位标记的融合蛋白进行表达,例如具有Myc和/或His(6×组氨酸)和/或流感标记。相应地利用或制备包含编码这些融合蛋白的DNA序列的质粒是可能的。例如,编码信息素的序列可以克隆进含有编码GFP和/或表位标记(例如Myc标记。His标记。流感标记)的DNA序列的质粒。其特定的例子在表中列出的例子和序列中给出,在适当时参考关于质粒的注释。
本发明进一步涉及抗体,具体地说。这些抗体结合或认别L型信息素,它的衍生物或部分。其可能的例子是可以在如小鼠,兔,山羊,绵羊,小鸡等等中产生的多克隆或单克隆抗体。
本发明这种主题的特定实施方案包含直接针对如下表位的抗体,所述表位相应于表4中显示的H-SemaL序列的179至378或480至666位的氨基酸序列。本发明也涉及用于制备特异性抗-信息素L抗体的方法该制备中使用包含所说的表位的抗原。
本发明也涉及制备抗体的方法,为了这一目的,优选地利用包含特有信鼠素表位和可以用于重组融合蛋白随后纯化的表位标记的融合蛋白。纯化的融合蛋白可以用于随后的免疫。为了制备重组融合蛋白,应制备相应的重组表达载体,然后用来转化合适的细胞。可以从这种细胞中分离出重组融合蛋白。例如,该方法可以是如同在实施例8中所描述的那样。
这些抗体可以用来纯化相应的信息素,例如H-SemaL和它的衍生物,例如在亲和柱上纯化,或用于蛋白质的免疫检测,例如利用ELISA,蛋白质印迹法和/或免疫组织化学。这些抗体也可以用于分析H-SemaL的表达,例如在不同的细胞类型或细胞系中。
H-SemaL的cDNA的长度有2636个核苷酸(表2)。H-SemaLcDNA的基因产物的长度有大约666个氨基酸(表4),并且显示了典型的L型信息素结构域结构。基因产物具有一个N端信号肽(第1至44个氨基酸),一个Sema结构域(第45个氨基酸至大约第545个氨基酸),以及一个Ig(免疫球蛋白)结构域(大约第550至620个氨基酸);同时,在C端具有一个代表潜在的跨膜结构域的疏水氨基酸序列。这个结构域结构对于信息素以前从来没有描述过。它涉及可能定位在细胞表面并且属于一个新的亚组的膜结合糖蛋白。以这以前未知的结构域结构为基础,现在可以将信息素划分成Ⅵ个子群:
Ⅰ 分泌性,没有其它结构域(例如ORF-A49)
Ⅱ lg 分泌性,(没有跨膜结构域)(例如AHV-Sema)
Ⅲ lg,TM,CP具有胞质序列,膜锚着(例如CD100)
Ⅳ Ig,(P),HPC具有亲水C端,分泌性(例如H-Sema-Ⅲ,M-SemaD,脑衰蛋白-l)
Ⅴ Ig,TM,CP具有C端7血小板反应蛋白基元,膜锚着(例如M-SemaF和G)
Ⅵ Ig,TM膜锚着(例如H-SemaL,M-SemaL)
一个H-SemaL的非糖基化未加工形式的计算分子量大约是74.8kd(74823道尔顿)(利用肽-分选程序(Peptide-Sort),GCG程序包计算)。计算的等电点是pH=7.56。一个可能的信号肽切割位点定位在44和45个氨基酸之间(表3;以SignalP计算(http.//www.cbs.dtu.dk/services/Signal.P),用于分析信号序列的基于神经网络的一种程序{Niesen H.等(1997)蛋白质工程10:1-6}),这给出了加工的蛋白质(没有信号肽)的分子量(MW)是70.3kd(70323道尔顿)和等电点是pH=7.01。
实际上也同样阐明了基因组的结构。H-SemaL基因有13或15或更多个外显子,优选地14个外显子,以及有12或14个内含子,优选地13个内含子。由于这种外显子-内含子复合结构,不同的剪接变体是可能的。在RNA印迹法中发现了所转录的H-SemaL基因的mRNA,特别是在胎盘,性腺,胸腺和脾中。在神经组织或肌肉组织中还没有发现任何mRNA。有证据显示在内皮细胞中的表异性调节性表达。
变异剪接也可以导致具有牵涉到胞内信号转导的胞质内序列的H-SemaL形式(例如,类似于CD100)。同样地,变异剪接导致分泌性H-SemaL形式(类似于病毒AHV-Sema)将也是可能的。
借助于GCG程序包(遗传学计算机小组(1991)GCG包的程序手册,版本7,575Science Drive,威斯康星,美国53711),FASTA(Pearson和Lipman(Proc.Natl.Acad.Sci.85,2444-2448)和BLAST程序(Gish和States(1993)Nat.Genet.3,266-272;Altschul等(1990)J.Mel.Biol.215,403-410)完成了核苷酸和氨基酸的序列分析。这些程序也与GenBank(版本102.0)和Swiss Prot(版本34.0)一起用于序列比较。
如H-SemaL的糖基化和肉豆蔻酰化翻译后修饰也同样是可能的。借助于Prosite程序(GCG程序包)在H-SemaL的氨基酸序列的位置105,157,258,330和602发现了N-糖基化位点的共有序列(表4中显示),而肉豆蔻酰化位点的共有序列在位置114,139,271,498,499,502和654发现了(共有序列:G~(E,D,R,K,H,P,F,Y,W)x(S,T,A,G,C,N)~(P))。此外,H-SemaL的氨基酸序列含有几个不同激酶的潜在的磷酸化的共有序列。因此,可以认为H-SemaL可以是不同激酶的底物,例如肌酸激酶2,蛋白激酶C和酪氨酸激酶的磷酸化位点。
推定肌酸激酶2的磷酸化位点(共有序列Ck2:(S,T)x2(D,E))(Prosite,GCG)在氨基酸序列的位置119,131,173,338,419和481。推定蛋白激酶C的磷酸化位点(共有序列PkC:(S,T)x(R,K))(Prosite,GCG)在氨基酸序列的位置107,115,190,296,350,431,524和576。推定酪氨酸激酶的磷酸化位点(共有序列:(R,K)x{2,3}(D,E){2,3}Y)(Prosite,GCG)在氨基酸序列的位置205。
以氨基酸的单字母代码表明了所说的共有序列。
整联蛋白的特征性"RGD″基元(精氨酸-甘氨酸-天冬氨酸)位于位置267。糖基化位点在病毒AHV-Sema,H-SemaL和(就目前所知的)M-SemaL之间是高度保守的。
H-SemaL的二-或多聚化是可能的,并且对于其它信息素(如CD100)已经描述过{Hall等(1996)}。同样地,CD100分子是150kd的膜锚着糖蛋白二聚体。然而,CD100与本发明的人类信息素(H-SemaL)不是密切相关的。
M-SemaL的部分cDNA序列的长度是1195个核苷酸。这种编码蛋白质的序列具有394个氨基酸。这394个氨基酸相当于H-SemaL的1至396个氨基酸。在M-SemaL中的信号肽为从1至44个氨基酸(恰如在H-SemaL中)。Sema结构域从第45个氨基酸开始,并且延伸到末端或有可能超出表4中所显示的序列末端。
利用Clustal W程序(Thompson等(1994))进行多重序列对比。利用人工SEAVIEW(Galtier等(1996)Comput.Appl Biosci 12,543-548)进一步进行序列对比。利用Clustal W(Thompson等(1994))来确定系统发育距离。
已知蛋白质序列和所说的新的信息素序列的比较以及这些序列的系统发育分析显示了根据它们的系统发育关系可以对基因进行分类。当然一般说来,相应的信息素亚型的C端结构域结构是牵涉到决定相同子群的信息素比不同子群的信息素在系统发育上更密切的原因的一个因素。分离出信息素的物种也有影响,即相应的物种在系统发育上相互之间是否存在密切的关系。
利用CLUSTALW程序{ThompsonJ.D等(1994)核酸研究22:4673-4680}对已知信息素氨基酸序列(全序列和/或部分序列,利用在表4和5中所显示的H-SemaL和M-SemaL的氨基酸序列和所有其它以所述登记号入库的序列或从这些序列中衍生的所编码的氨基酸序列)进行系统发育分析(比较图3),显示出H-SemaL和M-SemaL的氨基酸序列相互之间在系统发育上非常密切,并且形成一个独立的系统发育群。反过来H-SemaL和M-SemaL与AHV-Sema和Vac-A39在系统发育上最密切。与任何其它以前所公开的信息素相比,它们相互之间明显地是更加密切相关的。这种分析也显示了其它信息素相互之间在系统发育上也密切相关,并且形成具有信息素的独立群。例如,具有分泌性的信息素(例如H-SemaⅢ,-Ⅳ,-V和-E)属于一个系统发育群。它们在其它物种中的同系物也属于这个亚族,而人类(跨膜)CD100与相应的小鼠同系物(M-SemaG2)和脑衰蛋白4一起属于一个系统发育群。
关于完全的氨基酸序列,关于十分密切相关基因(例如,H-和M-SemaE或-Ⅲ/D)在系统发育群之内所观察到的同源性是大约在90%和80%之间的氨基酸等同性,而在低相关信息素基因的情况下不到40%。在Sema结构域之内,所观察的氨基酸等同性百分比稍高一点,并且由于它对整个蛋白质的氨基酸序列的高贡献率(蛋白质的50-80%属于Sema结构域),这一点显著影响整个等同性。
对于完全蛋白质来计算,H-SemaL与AHV-Sema有46%的同一性,但是如果只考虑Sema结构域本身,那么氨基酸的等同性是53%。例如,这高于相关的M-Sema-B-和-C(完全蛋白质37%的等同性,Sema结构域43%的等同性),类似于M-SemaA和-E(完全蛋白质43%,Sema结构域53%)。在Sema结构域区域中部分M-SemaL序列(表6)和H-SemaL(表5)之间的氨基酸等同性是93%,那么可以假定涉及了相应的同源小鼠基因。
与H-SemaL相比,在其它物种中相应于H-SemaL和M-SemaL的信息素在超过40%的Sema结构域之内可以具有氨基酸等同性。在密切相关的脊椎动物(哺乳动物,鸟)中,发现氨基酸等同性高于70%。
所说的信息素属于一个与病毒的AHV-Sema具有比与以前所公开的人和鼠的信息素更大的氨基酸等同性的新的亚族,并且具有一个以前对于人类信素未公开过的C端结构。由于它们的结构域结构,通过是否属于亚组Ⅳ和/或与H-SemaL和M-SemaL是同一系统发育群,和/或对于完全氨基酸序列而言,与H-SemaL具有至少30至40%的氨基酸等同性,优选的是50至60%,特别优选的是70至80%,或具有更大的等同性,和/或对于Sema结构域而言,与H-SemaL具有至少70%的氨基酸等同性,优选的是大于80%,特别优选的是大于90%来识别这些新的信息素(亚族成员)。
L型信息素也有一种不同类型的生化功能。这些信息素的一种新的功能是调节免疫系统。
与H-SemaL最密切相关的是病毒AHV信息素(AHV-Sema)。后者具有相似大小,但是,与H-SemaL相对比,它没有任何跨膜结构域。在天然的宿主(蓝wildeest)中,病毒感染细胞大概以分泌AHV-Sema来阻止H-SemaL的等同受体(蓝wildebeest中的L型信息素),并且这样躲开了受到免疫系统的攻击。也可以想象的是,对于免疫系统细胞来说。它的一个功能是作为排斥剂(化学排斥物)。
一般地,新的L型信息素和其衍生物的生化功能将被认为是具有免疫调节和/或炎症调节功能。一方面,它们能够
A)作为抑制免疫应答的分子,它们可能显示它们作为化学排斥物和/或免疫抑制剂对细胞的作用,局部地或远距离起作用,例如在细胞表面上作为跨膜蛋白质,例如若由于加工(例如蛋白水解酶)或变异剪接引起它们分泌,例如通过组织扩散。例如,这些新的L型信息素的表达(如在脉管内皮细胞的表面)可以阻止白细胞的吸附和迁移通过容器壁。新的信息素在维持屏障作用方面可能起着重要的作用,例如在特别"重要的"或暴露的器官中阻止感染,例如保持血-脑屏障,胎盘循环和/或其它免疫特权位置(例如胰岛)和/或预防自身免疫疾病。此外,新的信息素和/或它们的衍生物也可以在各种组织的排斥信号中涉及,例如对于免疫系统细胞(例如白细胞),阻止防卫机制非故意的活化。
B)此外,新的信息素和/或其衍生物可能具有附件分子功能。例如,在细胞表面上表达,作为防卫机制活化的一部分它们可以参予与免疫系统细胞的相互作用,例如在病毒感染的情况下。
这揭示了新的L型信息素和其衍生物,以及编码这些蛋白质的核酸的几个可能用法。
功能A):这包含免疫抑制和/或抗炎原理:在器官移植,烧伤治疗,免疫治疗和基因治疗领域中有许多利用的潜在可能性。
例如,借助于信息素-编码DNA或其衍生物,可以产生非人类转基因动物。对这些动物的一种可能应用是在器官移植的转基因模型中抑制移植排斥。例如,能够产生抑制排斥的转基因动物器官用于异种移植。例如,与其它转基因(例如,如DAF或CD59一类的补体调节剂)一起应该也是可能的。另一应用是产生非人类“剔除”(knock-out)动物,例如“剔除”小鼠("基因导向的实验室手则",Torres和Kiihn(1997)牛津大学大学出版社,ISBN0-19-963677-X):例如,通过剔除小鼠M-SemaL基因以发现该基因的其它功能是可能的。如果小鼠没有信息素基因可以生存,那么它们也阐明了对于炎症疾病的潜在模型系统。如果M-SemaL对免疫调节来说是重要的,那么将要期待大量的这样的小鼠。此外,可以产生非人类knock-in动物(例如小鼠)。例如,这使得能够以通常的/修饰的H-SemaL或修饰M-SemaL(例如组成型和/或诱导型启动子控制下的新的信息素亚型的整合)来代替M-SemaL。例如,为了进一步寻找新的信息素的功能(例如人基因或这些基因衍生物的功能),可以利用这种类型的动物,或用于确定和鉴定免疫调节剂。
例如,利用编码L型信息素或其衍生物的核酸来产生如重组免疫抑制剂,其它可溶性蛋白质或从L型信息素氨基酸序列(例如H-SemaL或相应的核酸,如基因)衍生出来的肽。以一种类似的方法可能产生具有结构相似性的激动剂。这些免疫抑制剂或激动剂也可以用于自身免疫疾病和炎症疾病和/或器官移植。
利用L型信息素的基因治疗,例如用编码H-SemaL或其衍生物的核酸,例如利用病毒或非病毒的方法。用于自身免疫疾病和炎症疾病器官转移和移植前/间/后以阻止移植排斥。
特别地,使用新的信息素和/或编码这些信息素的核酸,以及其衍在物(特别是H-SemaL,编码H-SemaL的DNA,以及其衍生物),用于药剂筛选(特别是确定和鉴定免疫调节剂)是可能的。
功能B):H-SemaL是在细胞表面表达并牵涉到与细胞(例如免疫系统的细胞)的相互作用的附件分子,例如在信号途径活化中作为附件分子。例如,病毒基因或病毒基因产物或其它病原基因(例如起源于微生物的)可以充当该附件分子的竞争性抑制剂。具有这种功能的新的信息素同样地用于器官移植,炎症治序,免疫治疗和/或基因治疗领域。
例如,新的信息素可以用于拮抗剂或抑制剂的筛选。以这种方法鉴别的药剂可以用于例如阻断信息素受体。可溶性和/或分泌性H-SemaL拮抗剂或抑制剂例如可以是化学物质或新的信息素或其衍生物本身(例如适合阻断相应受体的其部分/截短形式。如没有膜结构域或作为Ig融合蛋白或从后者衍生的肽)。以这种方法鉴别的特异性拮抗剂和/或抑制剂例如可能具有竞争性作用,并且用于抑制排斥(例如在器官移植的转基因模型中),以及用于自身免疫疾病,炎症和器官移植。编码新的信息素的核酸(例如DNA)或其借助于分子生物学方法产生的衍生物例如可能用于产生非人类转基因动物。在这些转基因动物中,H-SemaL的超量表达能导致提高对自身免疫疾病和/或炎症的易感性。于是这样的转基因动物适合筛选新的特异性免疫调节剂。
同样地,这样的核酸可以用于产生非人类“剔除”动物,例如“剔除”小鼠,其中失去了小鼠M-SemaL基因。利用这样的“剔除”动物可以找到基因的进一步生化功能。如果没有M-SemaL基因的小鼠能够生存,那么它们也为炎症提供了潜在的模型系统。
这种DNA同样可以用来产生非人类knock-in动物,例如小鼠。这使得可以用修饰M-SemaL基因/cDNA或任选修饰的(例如变异)另一物种的L型信息素基因/cDNA(例如H-SemaL)来代替M-SemaL基因。这样的转基因动物用来寻找本发明信息素的进一步功能。
本发明也涉及L型信息素及其衍生物以及编码这些蛋白质的核酸(例如基因/cDNA和其衍生物)和/或借助于这些信息素鉴别的药剂在生产药物中的应用。例如,生产可以用于基因治疗以及包含L型信息素(例如H-SemaL)表达的激动剂和/或拮抗剂的药物是可能的。为此目的例如也使用病毒的和/或非病毒方法。这些药物例如可以用于自身免疫疾病和炎症,在移植之后和/或期间和/或之前,来阻止器官移植排斥。
编码新的信息素的核酸(例如基因,cDNA以及其衍生物)在分子生物学中也可以作为工具试剂。
此外,新的信息素,尤其是H-SemaL以及核酸(例如其基因/cDNA)可以用于筛选新的药剂。例如,修饰蛋白质和/或从H-SemaL和/或M-SemaL衍生的肽在功能化验上可以用来寻找相应的受体和/或它的拮抗剂或激动剂,例如利用H-SemaL和同系物的表达构建体。
本发明也涉及L型信息素或编码L型信息素的核酸序列在鉴别药剂(尤其是免疫调节剂)的方法中的应用。
本发明也涉及使用L型信息素或其衍生物或编码L型信息素的核酸序列或其衍生物鉴别药剂的方法,以鉴别药理活性剂,例如免疫调节剂。例如,本发明涉及这样的方法,其中,在特定条件下L型信息素与待测药剂一起培养,平行地,第二批培养中没有待测药剂但是其它条件都相同,然后确定待测药剂的抑制或激活作用。
例如,本发明也涉及这样的鉴别药剂的方法,其中,编码L型信息素或其衍生物的核酸序列在有待测药剂存在下在特定条件下表达,并测定其表达程度。适当时也可能在这种方法中在相同的平行条件下但是包含不同量的待测药剂下进行两批或多批试验。
例如,待测药剂能够阻止或激活转录和/或翻译。
如同它的病毒同系物一样,L型信息素可以结合到新近描述的受体分子VESPR(Comeau等,(1998)免疫,卷8,473-482)上,并且,在单核细胞中推定可以造成对细胞粘附分子(如ICAM-1)和细胞因子(诸如白介素-6和白介素-8)的诱导,这可以导致其活化和细胞聚集。VESPR受体的表达模式显示了某些令人感兴趣的与H-SemaL的相似性,例如,胎盘中的强烈表达和脾组织的显著表达。plexin家族迄今未知的其它受体或其它受体的相互作用是可能的。它也能与自身或其它信息素-样分子相互作用。L型信息素的相互作用可能特别通过Sema结构域的C端区保守结构域来发生。
关于质粒的注释:
pMeIBacA(Invitrogen,De Schelp,NL)中的pMeIBacA-H-SemaL(6622bp)(SEQ ID NO.42)。核苷酸96-98ATG为起始密码子,核苷酸96-168为蜂毒肽信号序列,核苷酸168-173为BamHⅠ切割位点(PCR/克隆),核苷酸171-1998为读框SEMA-L氨基酸42-649(没有自的信号序列和跨膜序列),核苷酸1993-1998为EcoRⅠ切割位点(PCR/克隆)和核苷酸1992-1994为终止密码子
质粒pCDNA3.1-H-SemaL-MychisA(7475bp)(SEQ ID NO.35):核苷酸954-959为BamHⅠ切割位点(克隆),核苷酸968-970为ATG SEMAL,核苷酸968-2965为读框SEMAL,核苷酸2963-2968为PmlⅠ切割位点,核苷酸2969-2974为HindⅢ切割位点,核苷酸2981-3013为Myc标记。核苷酸3026-3033为6xHis标商,核苷酸3034-3036为终止密码子
质粒pCDNA3.1-H-SemaL-EGF P-MychisA(8192bp)(SEQ ID NO.36):核苷酸954-959为BamHⅠ切割位点(克隆),核苷酸968-970为ATG SEMA-L,核苷酸968-2965为读框SEMA-L,核苷酸2963-2965为一半PmlⅠ切割位点,核苷酸2966-3682为读框EGFP(克隆在PmlⅠ处),核苷酸3683-3685为一半PmlⅠ切割位点,核苷酸3685-3691为HindⅢ,核苷酸3698-3730为Myc标记。核苷酸3743-3760为6xHis标记,以及核苷酸3761-3763为终止密码子
载体pIND(Invitrogen,De Schelp,NL)中的质粒pIND-H-SemaL-EA(7108bp)(SEQ ID NO.38):核苷酸为533-538 BamHⅠ切割位点(克隆),核苷酸为546-548ATG SEMA-L,核苷酸546-为读框SEMA-L,核苷酸为2542-2547 PmlⅠ切割位点,核苷酸2548-2553为HindⅢ切割位点和核苷酸2563-2565为终止密码子。
载体pIND(Invitrogen,De Schelp,NL)中的质粒pIND-H-SemaL-EE(全长7102bp)(SEQ ID号37):核苷酸533-538为BamHⅠ切割位点(克隆),核苷酸546-548为ATG SEMA-L,核苷酸546-为读框SEMA-L,核苷酸2542-2547为PmlⅠ切割位点,核苷酸2548-2553为HindⅢ切割位点,核苷酸2560-2592为Myc标记,核苷酸2605-2622为6xHis标记和核苷酸2623-2625为终止密码子。
相当于pQE30-H-SemaLBH的载体pQE31(Qiagen,Hilden)中的质粒pQE30-H-SemaL-179-378.seq(4019bp)(SEQ ID号39):核苷酸115-117为ATG,核苷酸127-144为6xHis标记,核苷酸145-750为BamHⅠ-HindⅢPCP片段SEMA-L氨基酸(aa)179-378和核苷酸758-760为终止密码子。
载体pQE31(Qiagen,Hilden)中的质粒pQE31-H-SemaL-(SH(3999bp)(SEQ ID号40):核苷酸115-117为ATG,核苷酸127-144为6xHis标记,核苷酸147-152为BamHⅠ位点,核苷酸159-729为Sacl-HindⅢ片段SEMA-L(C端)aa480-666和核苷酸734-736为终止密码子。
实施例
用于实施例的实验条件:
使用的PCR程序:
Taq52-60(Ampli-TaqR聚合酶,Perkin Elmer,Weil der Stadt,德国)
96℃/60s 1个循环
96℃/15s-52℃/20s-70℃/60s 40个循环
70℃/60s 1个循环
Taq60-30
96℃/60s 1个循环
96℃/15s-60℃/20s-70℃/30s 35个循环
70℃/60s 1个循环
Taq60-60
96℃/60s 1个循环
96℃/15s-60℃/20s-70℃/60s 35个循环
70℃/60s 1个循环
Taq62-40
96℃/60s 1个循环
96℃/15s-62℃/20s-70/40s 35个循环
70℃/60s 1个循环
用Taq聚合酶的PCR反应条件:
50μl反应混合物中具有100-200ng模板,200μM dNTP,0.2-0.4μM每一引物,2.5U Ampli-TaqR,5μl10x供给的反应缓冲液
使用的程序:1.XL62-6(加长模板PCR SystemR,Boehringer Mannheim,德国)94℃/60s 1个循环94℃/15s-62℃/30s-68℃/6min 10个循环94℃/15s-62℃/30s-68℃/(6min+15s/个循环)25个循环68℃/7min 1个循环2.XL62-12(加长模板PCR SystemR,Boehringer Mannheim,德国)94℃/60s 1个循环94℃/15s-62℃/30s-68℃/12min 10个循环94℃/15s-62℃/30s-68℃/(12min+5s/个循环)25个循环68℃/7min 1个循环
用加长模板PCR系统的PCR反应条件
50μl反应混合物中具有100-200ng模板,500μM dNTP,0.2-0.4μM每一引物,0.75μl酶混合物,5μl10x供给的No.2反应缓冲液。
实施例1:
从AHV-Sema序列开始(Ensser和Fleckenstein(1995),普通病毒学杂志76:1063-1067),进行PCR和RACE-PCR。用于这里的起始材料是来自胎盘组织的人cDNA,为进行RACE扩增其上已连接了衔接子(MarathonTM-cDNA扩增试剂盒,Clontech Laboratories GmbH,Tullastraβe4,69126Heidelberg,德国)。最初特异性引物(No.121234+No.121236,表6)用于扩增长度约为800bp(碱基对)的PCR片段(PCR程序:(Taq60-60))。克隆与测序该片段(Taq染料标记脱氧终止子测序试剂盒,应用生物系统。Foster City,CA,USA/Brunnenweg 13,Weil der Stadt)。PCR产物的测序揭示了与AHV-Sema的DNA序列具有高度同源性的序列,与两个EST序列相同。
使用引物对(No.121237+No.121239,表6)鉴别出600bp的PCR片段。这表明它们是来自相同基因的DNA序列的克隆。
实施例2:
对实施例1的800bp PCR片段进行放射性标记(通过{Feinberg(1983)Anal.Biochem 132:6-13}的方法利用32P-α-dCTP进行随机引导),并且作为多组织Northem印迹法(人类多组织Northem印迹法Ⅱ,Clontech,Heidelberg,德国)的探针,这包括来自脾、胸腺、前列腺、睾丸、卵巢、小肠、大肠和白细胞(PBL)的mRNA样品。这清楚地显示了在脾和性腺(睾丸,卵巢)中长度约为3.3kb的mRNA的表达,并且在胸腺和肠道中较弱。主印迹法杂交(许多组织RNA的点印迹法(Human RNA Master BlotTM,Clontech))确认了这一结果,并且在胎盘组织中也显示出强的表达。
在42℃严格条件(5xSSC,50mM磷酸钠pH6.8,50%甲酰胺,100μg/ml酵母RNA)下杂交16小时。对印迹严格地冲洗(65℃,0.2×SSC,0.1%SDS)并且对Fuji BAS2000 PhosphoimagerTM暴光。
实施例3:
用这种探针筛选在噬菌体λgt10(人脾5’STRETCHPLUScDNA,Clontech)中克隆的来自人脾的cDNA文库,同时鉴别到-个λ克隆。插入这个克隆的1.6kb长的cDNA利用载体特异性引物No.207608+No.207609(表6)(位于EcoRⅠ克隆位点的侧面)由PCR(ExpandTM长模板PCR系统,Boehringer Mannhein GmbH,Sandhofer Straβe116,68305Mannhein)扩增,同时对产生的PCR片段进行测序。这个克隆包含cDNA的5’端,并且在3’方向也扩展已知的cDNA序列。从新的cDNA部分序列开始,设计出RACE-PCR的新引物(No.232643,No.232644,No.233084,表6)。利用一种改进的热循环技术(MJ-Research,Biozym DiagnostikGmbH,31833 Hess的PTC-200.Oldendorf),其具有明显更有效的运行参数(加热和冷却速率),利用引物No.232644和No.232643和AP1扩增3’RACE-PCR产物,并且将它克隆到载体pCR2.1(Invitrogen,De Schelp12,9351NVLeek,荷兰)中。对3’RACE-PCR产物进行测序,用这种方法确定cDNA的3’端。在5’方向的RACE扩增(引物No.31990和No.233084和AP1)以几个核苷酸延伸过cDNA5’端,并且确认在鉴别的λ克隆中发现的H-SemaL的氨基端。
实施例4:
从一短的鼠EST(登记号260340)开始,以从中产生的引物No.260813(表6)和H-SemaL特异性引物No.121234(表6)进行PCR(条件:Taq52-60)扩增长约840bp的鼠cDNA的DNA片段,随后克隆至载体pCR2.1中。包含该DNA片段的基因称为M-SemaL。产生的M-SemaL DNA片段用于从小鼠脾(小鼠脾5’STRETCHcDNA,Clontech)调查cDNA库,鉴定几个克隆是可能的。
从鼠内皮cDNA用引物No.260812和No.260813进行PCR(Taq60-30)提供了长为244碱基对的PCR片段。PCR结果表明在鼠内皮细胞中有明显基线表达,用细胞因子干扰素-γ和脂多糖刺激后则下降。
实施例5:
采用荧光原位杂交(FISH)来调查染色体的定位情况。为了这一目的,从人血液样品和小鼠细胞系BINE4.8开始分别制备人和鼠的中期染色体(Keyna等(1995)免疫学杂志155,5536-5542)(Kraus等(1994)遗传学23,272-274)。利用RNase和胃蛋白酶处理载玻片(Liehr等(1995)应用细胞遗传学21,185-188)。对于杂交,利用120mg人切口平移信息素样品和200mg相应的小鼠样品。每种情况下,杂交在37℃,20μgSTD以及4.0μgCOT1-DNA存在下在湿室中进行3天。
用50%甲酰胺/2xSSC冲洗载玻片(45℃下3次,每次5min),然后,用2xSSC冲洗(37℃下3次,每次5min),以及用FITC-亲和素系统(Liehr等(1995))检测生物素化样品。利用荧光显微镜测评载玻片。每个实验以双份进行,测定了25个中期/样品。表明H-SemaL位于染色体15q23上。定位在邻近染色体是Bardet-Biedls综合症和Tay-Sachs疾病的基因座(氨基已糖苷酶)。
实施例6:
H-SemaL基因的基因组内含子-外显子结构的大部分已被阐明。
基因组DNA片段扩增从已从PHA-刺激外周淋巴细胞(血液)分离出来的250mg人基因组DNA开始。较短的片段利用Ampli TaqR(Perkin Elmer)进行扩增,较长的片段利用加长模板PCR SystemR(Boehringer Mannheim)进行扩增。
到目前为止,通过PCR扩增来克隆和鉴别H-SemaL的几乎完全的基因组座是可能的。现已可能鉴别总共超过8888bp的基因组序列,从而基本阐明该基因的内含子-外显子结构。
实施例7:
表达克隆:
因为不能从lambda-gt10cDNA库分离出来信息素基因完全克隆,同时也不能经PCR获得完全克隆,所以使用N端DNA片段的引物No.240655和No.121339以及C端DNA片段的引物No.240656(含有HindⅢ和PmeⅠ切割位点)和No.121234通过PCR(XL62-6)在2个重叠亚片段上扩增出cDNA的编码区。产生的DNA片段(亚片段)克隆到载体pCR21中。对两个亚片段完全测序,最后通过插入0.6kb C端Sstl-HindⅢ限制片段到质粒(包含N端DNA片段,并且已经用限制酶SstⅠ与HindⅢ酶切)中来制备完全的H-SemaL cDNA。利用EcoRⅠ切割位点(在pCR2.1中)和HindⅡ切割位点(在表6的引物No.240656中)从质粒pCR2.1-H-SemaL(表7中显示的序列,SEQ ID NO.34)上切除完全基因,并且连接到相应切割的组成性表达载体pCDNA3.1(-)MycHisA(Invitrogen)上。EcoRⅠ-ApaⅠ片段(没有Myc-His标记)从所产生的重组质粒pCDNA3.1(-)H-SemaL-MycHisA(表8中显示的序列)中切下,并且连接到诱导型载体pIND(同样已用EcoRⅠ-ApaⅠ酶切)(蜕皮激素诱导型哺乳动物表达系统,Invitrogen)上。重组质粒称为pIND-H-SemaLEA(表11中显示的序列)。将pCDNA3.1(-)H-SemaL-Myc-HisA(表9中显示的序列)的EcoRⅠ-Pmel片段(具有Myc-His标记)插人到EcoRⅠ-EcoRⅤ-切割的载体pIND中。重组质粒称为pIND-H-SemaL-EE(表10中显示的序列)。
通过连接PCR-扩增EGFP读框(来自载体pEGFP-Cl(Clontech),利用引物No.243068+No.243069,Taq52-60)到pCDNA3.1(-)H-SemaL-MycHisA的Pmel切割位点上制备具有增强绿色荧光蛋白质(EGFP)的H-SemaL融合基因,形成质粒pCDNA3.1(-)H-SemaL-EGFP-MycHisA(表9中显示的序列)。
在表7至13表中用小写字母标出了H-SemaL的序列,其部分片段或衍生物,同时用大写字母标出了质粒序列。
实施例8:
为了制备H-SemaL-特异性抗体,将H-SemaL的cDNA片段整合进原核表达载体,并且在大肠杆菌中表达,以及纯化信息素衍生物。信息素衍生物作为具有His标记的融合蛋白来表达。因此,利用包含His标记序列并允许信息素cDNA片段整合入读框的载体。例如,N端6x组氨酸标记使用镍螯合亲和性层析纯化成为可能(Qiagen GmbH,Max-Volmer Straβe4,40724Hilden):
1.利用引物No.150788和No.150789通过PCR扩增编码179-378位氨基酸的部分H-SemaLcDNA,并将这条DNA片段连接到载体pQE30(已用限制性酶BamHⅠ和HindⅢ切割)(Qiagen)上(构建体pQE30-H-SemaL-BH(表12中显示的序列))。
2.从质粒pCR2.1上用限制性酶SstⅠ与HindⅢ切下编码C端480-666位氨基酸的H-SemaLcDNA部分,并且连接到载体pQE3l(已用SstⅠ和HindⅢ切割)(Qiagen)上(构建体pQE31-H-SemaL-SH(表13中显示的序列)。
通过DNA测序检查序列在正确读框中的正确整合。通过Ni2+亲和性层析纯化由N端6x组氨酸标记和部分信息素H-SemaL组成的融合蛋白。纯化的融合蛋白用于对各种动物(兔,小鸡,小鼠)的免疫。
实施例9:
各种细胞类型的FACS分析(图4和5)
在FACS缓冲液(含有5%胎牛血清(FCS)和0.1%Na叠氮化钠的磷酸缓冲盐水(PBS)中冲洗细胞(大约0.2-0.5×106),然后在每种情况中与抗血清(在冰上)培养1小时。用于对照(上层小鸡预免疫前血清(1∶5))和特异性检测(特异性染色)的初级抗体为H-SemaL-特异性小鸡抗血清(1∶50)。用通过镍螯合亲和性层析(如实施例8所描述的)纯化的蛋白质免疫小鸡产生含有抗H-SemaL氨基酸(Aa)179-378(具有N端His标记)抗体的特异性抗血清。所使用的次级抗体是来自兔的FITC-标记抗小鸡F(ab’)抗体(Dianova Jackson实验室,Order No.303-095-006,汉堡,德国)(1mg/ml)。FITC-标记的兔抗小鼠IgG用于CD100染色。次级抗体每种情况下在FACS缓冲液中以1∶50进行稀释。
然后冲洗细胞,在PBS中进行重悬浮,并且在FACS中分析。利用FACS-跟踪仪(Becton-Dickinson)进行FACS分析。原理:单细胞悬浮液穿过一个测量通道,其中以488nm的激光光线照射这些细胞,从而激发荧光染料(FITC)。测量散射正向光线(正向散射,FSC:与细胞大小相关),和其侧向光线(侧向散射,SSC:与颗粒量相关:不同细胞类型有差异)以及通道1的荧光(FL1)(FITC发射范围的波长,530nm处最大值)。以这种方法每次测量10,000件(细胸)。
点印迹(图4a-k)(左图):SSC对FSC(大小对颗粒量/散射),右边窗口中分析了(界线内)相似大小和颗粒含量的(均一)细胞群。。右边窗口显示了FL1的强度(X轴)对事件数(Y轴),也就是说频度分布。
在每个这样的图中,对照血清的结果(不光滑曲线)叠加在特异性染色(光滑曲线)的结果上面。与对照相比较特异性染色的曲线的右移相当于H-SemaL在相应细胞中的表达。一种移出越大意味着更强的表达。
用于FACS分析的细胞系:a)U937细胞系
美国典型培养物保藏中心ATCC;ATCC号CRL-1593
名称U-937
组织:淋巴瘤;组织细胞;单细胞样
物种:人;
保藏者:H.Korenb)THP-1细胞系
ATCC保藏号:TIE-202
组织:单核细胞;急性单核细胞白血病
物种:人
保藏者:S.Tsuchiyac)K-562细胞系
ATCC保藏号:CCL-243
组织:慢性骨髓性白血病
物种:人;
保藏者:H.T.Holdend)L-428细胞系
DSMZ-德意志微生物保藏中心,DSMZ No:ACCl97
细胞类型:人Hodgkin淋巴瘤e)Jurkat细胞系
DSMZ-德意志微生物保藏中心,DSMZ No:ACC282
细胞类型:人T细胞白血病
f)Daudi细胞系
ATCC保藏号CCL-213
组织:Burkitt淋巴瘤;B淋巴母细胞;B细胞
物种:人;
保藏者:G.Klein
g)LCL细胞系EBV-转化的淋巴母细胞样B-细胞系。h)Jiyoye(P-2003)细胞系
ATCC保藏号CCL-87组织:Burkitt淋巴瘤;B细胞,B淋巴细胞物种:人保藏者:W.Henlei)CBL-Mix57
用重组体H.Saimiri(没有缺失的野生型)转化的人T-细胞系(从血液中分离)j)CBL-Mix59用H.Saimiri(ORF71缺失)转化的人T-细胞系(从血液中分离)。
实施例10:蛋白质凝胶和蛋白质印迹法
将可分泌的人SEMA-L(表4的氨基酸42-649(没有信号肽和跨膜结构域))克隆到质粒pMelBac-A(Invitrogen De Schelp,Leck,荷兰,Cv1950-20)中,这样就产生了质粒pMeIBacA-H-SemaL(长度6622bp)(图8)。H-SemaL衍生物在杆状病毒系统中表达(Bac-N-Blue,Invitrogen)。在从昆虫卵细胞Sf9(来自Spodopterafrugiperda)和High FiveTM(来自粉纹夜蛾U.S.Pat.No.5,300,435,从Invitrogen购得)中通过具有重组体嗜斑纯化的杆状病毒的感染产生的细胞系中进行表达。
根据制造商的说明进行表达。
然后在凝胶中对蛋白质进行分级分离,并用蛋白质印迹法检测H-SemaL衍生物。用H-SemaL-特异性小鸡抗血清进行检测(比较实施例8和图7)(稀释液1∶100)。根据制造商的说明利用抗-IgY-HRP偶联物(稀释液:1∶3000,来自驴;Dianova Jackson实验室)检测特异性小鸡抗体。
实施例11:pMeIBacA-H-SEMAL的制备
通过克隆适当的编码H-SemaL的氨基酸42-649的DNA片段到载体pMeIBacA(4.8kbInvitrogen)中来制备重组载体(pMeIBacA-H-SEMAL,6622bp)(比较pMeIBacA-H-SEMAL的注释)。通过BamHⅠ和EcoRⅠ,克隆发生在载体中的信号序列(“蜜蜂蜂毒肽信号序列”)之后的读框中。利用引物对h-sema-l杆状病毒5’和第h-sema-l杆状病毒3’,扩增相应的H-SemaLDNA片段。
扩增(TaKaRa ExTa9标记聚合酶)和克隆的引物:用于没有信号序列的扩增并引入BamHⅠ切割位点的"h-sema-l杆状病毒5’"5’-CCGGATCCGCCCAGGGCCACCTAAGGAGCGG-3’(SEQ ID NO.43),用于没有跨膜结构域的扩增并引入EcoRⅠ切割位点的"h-sema-l杆状病毒3’"5’-CTGAATTCAGGAGCCAGGGCACAGGCATG-3’(SEQ ID NO.44)。附图:
图1:H-Sema-L的组织特异性表达
A)多组织RNA印迹(Clontech,Heidelberg,德国)。从左至右的载样:每泳道20μg来自脾,胸腺,前列腺,睾丸。卵巢,小肠,大肠粘膜,外周(血液)白细胞的Poly-A-RNA。标记大小标准。
在严格条件下,印迹与800碱基对长的H-SemaL探针进行杂交。
图2:H-SemaLcDNA的克隆和编码序列H-SemaL(H-SemaL基因)的基因组结构的图示。
上:EST序列的定位(登记号;EST序列的定位以与AHV-Sema序列相关的形式显示。
下:扩增的PCR和RACE产物和与在完全H-SemaLcDNA中相关cDNA克隆的定位以及编码蛋白质的开放读框(ORF)。
底部:在H-SemaL基因中与基因组序列相关的外显子的相对定位。用箭头表明了寡核苷酸引物的位置。
图3:系统发育树:从列出的信息素序列的多重对比获得。信息素的系统发育关系在系统树中可以从它们的组群中推出。
图4:在各种细胞系和各种细胞类型中的H-SemaL表达的FACS分析(比较实施例8)。
图5:CD100和H-SemaL表达的比较分析(比较实施例9)。
图6:在HiFive和Sf9细胞中可分泌的SEMA-L(H-SemaL)的表达(比较实施例10)。
在杆状病毒系统(Bac-N-Blue,Invitrogen)中的pMelBac-A(Invitrogen)的aa 42-649
用特异性小鸡抗血清1(1∶100)和抗-IgY-HRP偶联物(1∶3000,来自兔。Jackson Lab.)的检测
1,4,6未感染的HiFive细胞(无血清)
2,3,5,7,8以重组体杆状病毒感染的HiFive细胞(无血清)
MRainbow分子量标志(AmershamRPN756)
9,10感染的Sf9细胞(包含血清的介质)。
图7:抗血清的特异性
泳道1-3:小鸡1;泳道4-6:小鸡2
泳道1和泳道4:免疫前血清
泳道2和5:免疫60天的血清
泳道4和6:免疫105天的血清
用H-SemaL的179-378位氨基酸(具有氨基端His标记)进行免疫(比较实施例8,部分1)。
图8:对pMeIBacA-H-SEMAL的质粒图谱的描绘。
如实施例11的描述制备重组质粒。
表1来自不同物种的信息素的不同亚型 名称 别名 物种 参考文献H-SemaⅢ(H-SemaD)人Sec.(Kolodkin等,1993)CD-100人TM,IC;与CD45相连,在T细胞中表达(Hall等,1996)H-SemaⅤ(H-SemaA)人Sec.;基因座3p21.3(Sekido等,1996;Roche等,1996)H-SemaⅣ(H-Sema3F)人Sec.;基因座3p21.3(Xiang等,1996;Sekido等,1996)H-SemaE人Sec.;不同于M-Sema-E的3’端(提高读框对比)AB000220(Yamada1997未发表)H-SemaKKIAA0311人Sec.;(Nagase等,1997)H-SemaLSEMAL人TM,无IC本申请M-SemaA小鼠Sec.(Püschel等,1995)M-SemaB小鼠TM,IC(Püschel等,1995)M-SemaC小鼠TM,IC(Püschel等,1995)M-SemaDM-SemaⅢ小鼠Sec.(Messersmith等,1995;Püschel等,1995M-SemaE小鼠Sec,;5'部分序列(Püschel等,1995)M-SemaF1M-SemaF小鼠TM,IC(Inagaki等,1995)M-SemaG2M-SemaG小鼠TM,IC;在淋巴细胞中表达,CD100的小鼠同系物(Furuyama等,1996)M-SemaF2M-SemaF小鼠TM,IC;凝血调节蛋白基元(Adams等,1996)M-SemaG1M-SemaG小鼠TM,IC;凝血调节蛋白基元(Adams等,1996)M-SemaH小鼠Sec.(Christensen1996未发表)Z80941M-SemaⅥa小鼠TM,IC(Zhou等,1997)M-SemaLSemal小鼠部分序列本申请脑衰蛋白-1小鸡Sec.(Luo等,1993)脑衰蛋白-2小鸡Sec.(Luo等,1995)脑衰蛋白-3小鸡Sec.(Luo等,1995)脑衰蛋白-4小鸡部分序列(Luo等,1995)脑衰蛋白-5小鸡Sec.(Lou等,1995) R-SemaⅢ大鼠Sec.(Giger等,1996)T-SemaⅠTribolumoonfusumTM,IC(Kolodkin等,1993)Ce-SemaⅠC.elegansTM,ICU15667(Roy1994未出版)G-SemaⅠFasciclin-Ⅳ蚱蜢TM,IC(Kolodkin等,1993)D-SemaⅠ果蝇属TM,IC(Kolodkin等,1993)D-SemaⅡ果蝇属Sec.(Kolodkin等,1993)AHV-SemaAHV-1Sec.(Ensser和Fleckenstein,1995)ORF-A39牛痘Sec.(Kolodkin等,1993)ORF-A39同系物天花Sec.;(Kolodkin等,1993)
TM:跨膜区Sec:分泌性IC:推定的胞内胞浆序列基元表2:H-SemaL的cDNA序列(2636个核苷酸)(SEQ ID NO.:1)
1 cggggccacg ggatgacgcc tcctccgccc ggacgtgccg cccccagcgc
51 accgcgcgcc cgcgtccctg gcccgccggc tcggttgggg cttccgctgc
101 ggctgcggct gctgctgctg ctctgggcgg ccgccgcctc cgcccagggc
151 cacctaagga gcggaccccg catcttcgcc gtctggaaag gccatgtagg
201 gcaggaccgg gtggactttg gccagactga gccgcacacg gtgcttttcc
251 acgagccagg cagctcctct gtgtgggtgg gaggacgtgg caaggtctac
301 ctctttgact tccccgaggg caagaacgca tctgtgcgca cggtgaatat
351 cggctccaca aaggggtcct gtctggataa gcgggactgc gagaactaca
401 tcactctcct ggagaggcgg agtgaggggc tgctggcctg tggcaccaac
451 gcccggcacc ccagctgctg gaacctggtg aatggcactg tggtgccact
501 tggcgagatg agaggctacg cccccttcag cccggacgag aactccctgg
551 ttctgtttga aggggacgag gtgtattcca ccatccggaa gcaggaatac
601 aatgggaaga tccctcggtt ccgccgcatc cggggcgaga gtgagctgta
651 caccagtgat actgtcatgc agaacccaca gttcatcaaa gccaccatcg
701 tgcaccaaga ccaggcttac gatgacaaga tctactactt cttccgagag
751 gacaatcctg acaagaatcc tgaggctcct ctcaatgtgt cccgtgtggc
801 ccagttgtgc aggggggacc agggtgggga aagttcactg tcagtctcca
851 agtggaacac ttttctgaaa gccatgctgg tatgcagtga tgctgccacc
901 aacaagaact tcaacaggct gcaagacgtc ttcctgctcc ctgaccccag
951 cggccagtgg agggacacca gggtctatgg tgttttctcc aacccctgga
1001 actactcagc cgtctgtgtg tattccctcg gtgacattga caaggtcttc
1051 cgtacctcct cactcaaggg ctaccactca agccttccca acccgcggcc
1101 tggcaagtgc ctcccagacc agcagccgat acccacagag accttccagg
1151 tggctgaccg tcacccagag gtggcgcaga gggtggagcc catggggcct
1201 ctgaagacgc cattgttcca ctctaaatac cactaccaga aagtggccgt
1251 tcaccgcatg caagccagcc acggggagac ctttcatgtg ctttacctaa
1301 ctacagacag gggcactatc cacaaggtgg tggaaccggg ggagcaggag
1351 cacagcttcg ccttcaacat catggagatc cagcccttcc gccgcgcggc
1401 tgccatccag accatgtcgc tggatgctga gcggaggaag ctgtatgtga
1451 gctcccagtg ggaggtgagc caggtgcccc tggacctgtg tgaggtctat
1501 ggcgggggct gccacggttg cctcatgtcc cgagacccct actgcggctg
1551 ggaccagggc cgctgcatct ccatctacag ctccgaacgg tcagtgctgc
1601 aatccattaa tccagccgag ccacacaagg agtgtcccaa ccccaaacca
1651 gacaaggccc cactgcagaa ggtttccctg gccccaaact ctcgctacta
1701 cctgagctgc cccatggaat cccgccacgc cacctactca tggcgccaca
1751 aggagaacgt ggagcagagc tgcgaacctg gtcaccagag ccccaactgc
1801 atcctgttca tcgagaacct cacggcgcag cagtacggcc actacttctg
1851 cgaggcccag gagggctcct acttccgcga ggctcagcac tggcagctgc
1901 tgcccgagga cggcatcatg gccgagcacc tgctgggtca tgcctgtgcc
1951 ctggctgcct ccctctggct gggggtgctg cccacactca ctcttggctt
2001 gctggtccac tagggcctcc cgaggctggg catgcctcag gcttctgcag
2051 cccagggcac tagaacgtct cacactcaga gccggctggc ccgggagctc
2101 cttgcctgcc acttcttcca ggggacagaa taacccagtg gaggatgcca
2151 ggcctggaga cgtccagccg caggcggctg ctgggcccca ggtggcgcac
2201 ggatggtgag gggctgagaa tgagggcacc gactgtgaag ctggggcatc
2251 gatgacccaa gactttatct tctggaaaat atttttcaga ctcctcaaac
2301 ttgactaaat gcagcgatgc tcccagccca agagcccatg ggtcggggag
2351 tgggtttgga taggagagct gggactccat ctcgaccctg gggctgaggc
2401 ctgagtcctt ctggactctt ggtacccaca ttgcctcctt cccctccctc
2451 tctcatggct gggtggctgg tgttcctgaa gacccagggc taccctctgt
2501 ccagccctgt cctctgcagc tccctctctg gtcctgggtc ccacaggaca
2551 gccgccttgc atgtttattg aaggatgttt gctttccgga cggaaggacg
2601 gaaaaagctc tgaaaaaaaa aaaaaaaaaa aaaaaa表3:M-SemaL的cDNA的核苷酸序列(部分,1195个核苷酸)(SEQ IDNO.:2)
1 cggggctgcg ggatgacgcc tcctcctccc ggacgtgccg cccccagcgc
51 accgcgcgcc cgcgtcctca gcctgccggc tcggttcggg ctcccgctgc
101 ggctgcggct tctgctggtg ttctgggtgg ccgccgcctc cgcccaaggc
151 cactcgagga gcggaccccg catctccgcc gtctggaaag ggcaggacca
201 tgtggacttt agccagcctg agccacacac cgtgcttttc catgagccgg
251 gcagcttctc tgtctgggtg ggtggacgtg gcaaggtcta ccacttcaac
301 ttccccgagg gcaagaatgc ctctgtgcgc acggtgaaca tcggctccac
351 aaaggggtcc tgtcaggaca aacaggactg tgggaattac atcactcttc
401 tagaaaggcg gggtaatggg ctgctggtct gtggcaccaa tgcccggaag
451 cccagctgct ggaacttggt gaatgacagt gtggtgatgt cacttggtga
501 gatgaaaggc tatgccccct tcagcccgga tgagaactcc ctggttctgt
551 ttgaaggaga tgaagtgtac tctaccatcc ggaagcagga atacaacggg
601 aagatccctc ggtttcgacg cattcggggc gagagtgaac tgtacacaag
651 tgatacagtc atgcagaacc cacagttcat caaggccacc attgtgcacc
701 aagaccaagc ctatgatgat aagatctact acttcttccg agaagacaac
751 cctgacaaga accccgaggc tcctctcaat gtgtcccgag tagcccagtt
801 gtgcaggggg gaccagggtg gtgagagttc gttgtctgtc tccaagtgga
851 acaccttcct gaaagccatg ttggtctgca gc gatgcagc caccaacagg
901 aacttcaatc ggctgcaaga tgtcttcctg ctccctgacc ccagtggcca
951 gtggagagat accagggtct atggcgtttt ctccaacccc tggaactact
1001 cagctgtctg cgtgtattcg cttggtgaca ttgacagagt cttccgtacc
1051 tcatcgctca aaggctacca catgggcctt tccaaccctc gacctggcat
1101 gtgcctccca aaaaagcagc ccatacccac agaaaccttc caggtagctg
1151 atagtcaccc agaggtggct cagagggtgg aacctatggg gcccc表4:H-SemaL的氨基酸序列(666个氨基酸)(SEQ ID NO.:3)1 MTPPPPGRAA PSAPRARVPG PPARLGLPLR LRLLLLLWAA AASAQGHLRS51 GPRIFAVWKG HVGQDRVDFG QTEPHTVLFH EPGSSSVWVG GRGKVYLFDF101 PEGKNASVRT VNIGSTKGSC LDKRDCENYI TLLERRSEGL LACGTNARHP151 SCWNLVNGTV VPLGEMRGYA PFSPDENSLV LFEGDEVYST IRKQEYNGKI201 PRFRRIRGES ELYTSDTVMQ NPQFIKATIV HQDQAYDDKI YYFFREDNPD251 KNPEAPLNVS RVAQLCRGDQ GGESSLSVSK WNTFLKAMLV CSDAATNKNF301 NRLQDVFLLP DPSGQWRDTR VYGVFSNPWN YSAVCVYSLG DIDKVFRTSS351 LKGYHSSLPN PRPGKCLPDQ QPIPTETFQV ADRHPEVAQR VEPMGPLKTP401 LFHSKYHYQK VAVHRMQASH GETFHVLYLT TDRGTIHKVV EPGEQEHSFA451 FNIMEIQPFR RAAAIQTMSL DAERRKLYVS SQWEVSQVPL DLCEVYGGGC501 HGCLMSRDPY CGWDQGRCIS IYSSERSVLQ SINPAEPHKE CPNPKPDKAP551 LQKVSLAPNS RYYLSCPMES RHATYSWRHK ENVEQSCEPG HQSPNCILFI601 ENLTAQQYGH YFCEAQEGSY FREAQHWQLL PEDGIMAEHL LGHACALAAS651 LWLGVLPTLTLGLLVH表5:M-SemaL的(部分)氨基酸序列(394个氨基酸,相应于H-SemaL的1-396位)(SEQ ID NO.:4)
1 MTPPPPGRAA PSAPRARVLS LPARFGLPLR LRLLLVFWVA AASAQGHSRS
51 GPRISAVWKG QDHVDFSQPE PHTVLFHEPG SFSVWVGGRG KVYHFNFPEG
101 KNASVRTVNI GSTKGSCQDK QDCGNYITLL ERRGNGLLVC GTNARKPSCW
151 NLVNDSVVMS LGEMKGYAPF SPDENSLVLF EGDEVYSTIR KQEYNGKIPR
201 FRRIRGESEL YTSDTVMQNP QFIKATIVHQ DQAYDDKIYY FFREDNPDKN
251 PEAPLNVSRV AQLCRGDQGG ESSLSVSKWN TFLKAMLVCS DAATNRNFNR
301 LQDVFLLPDP SGQWRDTRVY GVFSNPWNYS AVCVYSLGDI DRVFRTSSLK
351 GYHMGLSNPR PGMCLPKKQP IPTETFQVAD SHPEVAQRVE PMGP表6:合成寡核苷酸(Eurogentec,Seraing,比利时)引物的编号/名称 引物(合成寡核苷酸)的核苷酸序列
91506/AP2 actcactatagggctcgagcggc (SEQ ID NO.:5)
121234 agccgcacacggtgcttttc (SEQ ID NO.:6)
121235/Est2 gcacagatgcgttcttgccc (SEQ ID NO.:7)
121236/Est3 accatagaccctggtgtccc (SEQ ID NO.:8)
121237/Est4 gcagtgatgctgccaccaac (SEQ ID NO.:9)
121238 ccagaccatgtcgctggatg (SEQ ID NO.:10)
121239/Est6 acatgaggcaaccgtggcag (SEQ ID NO.:11)
131989/AP1 ccatcctaatacgactcactatagggc (SEQ ID NO.:12)
131990/Est7 aggtagaccttgccacgtcc (SEQ ID NO.:13)
131991 gaacttcaacaggctgcaagacg (SEQ ID NO.:14)
131992 atgctgagcggaggaagctg (SEQ ID NO.:15)
131993 ccgccatacacctcacacag (SEQ ID NO.:16)
150788 ctggaagctttctgtgggtatcggctgc (SEQ ID NO.:17)
150789 tttggatccctggttctgtttgaag (SEQ ID NO.:18)
167579/cDNA ttctagaattcagcggccgcttttttttttttttttttttttttttttttvn合成引物(SEQ ID NO.:19)
168421 ggggaaagttcactgtcagtctccaag (SEQ ID NO.:20)
168422 gggaatacacacagacggctgagtag (SEQ ID NO.:21)
207608/ agcaagttcagcctggttaagt (SEQ ID NO.:22)λgt10插入物的扩增
207609/ ttatgagtatttcttccaggg (SEQ ID NO.:23)λgt10插入物的扩增
232643/Est13 ccattaatccagccgagccacacaag (SEQ ID NO.:24)
232644/Est14 catctacagctccgaacggtcagtg (SEQ ID NO.:25)
233084 cagcggaagccccaaccgag (SEQ ID NO.:26)
240655/hs5 gggatgacgcctcctccgcccgg (SEQ ID NO.:27)
240656/hs3 aagcttcacgtggaccagcaagccaagagtg (SEQ ID NO.:28)
240657/hs3c aagctttttccgtccttccgtccgg (SEQ ID NO.:29)
243068 atggtgagcaagggcgaggagctg (SEQ ID NO.:30)
243069 cttgtacagctcgtccatgccgag (SEQ ID NO.:31)
280812 GGGTGGTGAGAGTTCGTTGTCTGTC (SEQ ID NO.:32)
260813 GAGCGATGAGGTACGGAAGACTCTG (SEQ ID NO.:33)表7:重组质粒pCR2.1-H-SemaL的核苷酸序列(SEQ ID NO.:34) 1 AGCGCCCAAT ACGCAAACCG CCTCTCCCCG CGCGTTGGCC GATTCATTAA 51 TGCAGCTGGC ACGACAGGTT TCCCGACTGG AAAGCGGGCA GTGAGCGCAA101 CGCAATTAAT GTGAGTTAGC TCACTCATTA GGCACCCCAG GCTTTACACT151 TTATGCTTCC GGCTCGTATG TTGTGTGGAA TTGTGAGCGG ATAACAATTT201 CACACAGGAA ACAGCTATGA CCATGATTAC GCCaagcttc acgtggacca251 gcaagccaag agtgagtgtg ggcagcaccc ccagccagag ggaggcagcc301 agggcacagg catgacccag caggtgctcg gccatgatgc cgtcctcggg351 cagcagctgc cagtgctgag cctcgcggaa gtaggagccc tcctgggcct401 cgcagaagta gtggccgtac tgctgcgccg tgaggttctc gatgaacagg451 atgcagttgg ggctctggtg accaggttcg cagctctgct ccacgttctc501 cttgtggcgc catgagtagg tggcgtggcg ggattccatg gggcagctca551 ggtagtagcg agagtttggg gccagggaaa ccttctgcag tggggccttg601 tctggtttgg ggttgggaca ctccttgtgt ggctcggctg gattaatgga651 ttgcagcact gaccgttcgg agctgtagat ggagatgcag cggccctggt701 cccagccgca gtaggggtct cgggacatga ggcaaccgtg gcagcccccg751 ccatagacct cacacaggtc caggggcacc tggctcacct cccactggga801 gctcacatac agcttcctcc gctcagcatc cagcgacatg gtctggatgg851 cagccgcgcg gcggaagggc tggatctcca tgatgttgaa ggcgaagctg901 tgctcctgct cccccggttc caccaccttg tggatagtgc ccctgtctgt951 agttaggtaa agcacatgaa aggtctcccc gtggctggct tgcatgcggt1001 gaacggccac tttctggtag tggtatttag agtggaacaa tggcgtcttc1051 agaggcccca tgggctccac cctctgcgcc acctctgggt gacggtcagc1101 cacctggaag gtctctgtgg gtatcggctg ctggtctggg aggcacttgc1151 caggccgcgg gttgggaagg cttgagtggt agcccttgag tgaggaggta1201 cggaagacct tgtcaatgtc accgagggaa tacacacaga cggctgagta1251 gttccagggg ttggagaaaa caccatagac cctggtgtcc ctccactggc1301 cgctggggtc agggagcagg aagacgtctt gcagcctgtt gaagttcttg1351 ttggtggcag catcactgca taccagcatg gctttcagaa aagtgttcca1401 cttggagact gacagtgaac tttccccacc ctggtccccc ctgcacaact1451 gggccacacg ggacacattg agaggagcct caggattctt gtcaggattg1501 tcctctcgga agaagtagta gatcttgtca tcgtaagcct ggtcttggtg1551 cacgatggtg gctttgatga actgtgggtt ctgcatgaca gtatcactgg1601 tgtacagctc actctcgccc cggatgcggc ggaaccgagg gatcttccca1651 ttgtattcct gcttccggat ggtggaatac acctcgtccc cttcaaacag1701 aaccagggag ttctcgtccg ggctgaaggg ggcgtagcct ctcatctcgc1751 caagtggcac cacagtgcca ttcaccaggt tccagcagct ggggtgccgg1801 gcgttggtgc cacaggccag cagcccctca ctccgcctct ccaggagagt1851 gatgtagttc tcgcagtccc gcttatccag acaggacccc tttgtggagc1901 cgatattcac cgtgcgcaca gatgcgttct tgccctcggg gaagtcaaag1951 aggtagacct tgccacgtcc tcccacccac acagaggagc tgcctggctc2001 gtggaaaagc accgtgtgcg gctcagtctg gccaaagtcc acccggtcct2051 gccctacatg gcctttccag acggcgaaga tgcggggtcc gctccttagg2101 tggccctggg cggaggcggc ggccgcccag agcagcagca gcagccgcag2151 ccgcagcgga agccccaacc gagccggcgg gccagggacg cgggcgcgcg2201 gtgcgctggg ggcggcacgt ccgggcggag gaggcgtcat cccaagccga2251 attcTGCAGA TATCCATCAC ACTGGCGGCC GCTCGAGCAT GCATCTAGAG2301 GGCCCAATTC GCCCTATAGT GAGTCGTATT ACAATTCACT GGCCGTCGTT2351 TTACAACGTC GTGACTGGGA AAACCCTGGC GTTACCCAAC TTAATCGCCT2401 TGCAGCACAT CCCCCTTTCG CCAGCTGGCG TAATAGCGAA GAGGCCCGCA2451 CCGATCGCCC TTCCCAACAG TTGCGCAGCC TGAATGGCGA ATGGGACGCG2501 CCCTGTAGCG GCGCATTAAG CGCGGCGGGT GTGGTGGTTA CGCGCAGCGT2551 GACCGCTACA CTTGCCAGCG CCCTAGCGCC CGCTCCTTTC GCTTTCTTCC2601 CTTCCTTTCT CGCCACGTTC GCCGGCTTTC CCCGTCAAGC TCTAAATCGG2651 GGGCTCCCTT TAGGGTTCCG ATTTAGAGCT TTACGGCACC TCGACCGCAA2701 AAAACTTGAT TTGGGTGATG GTTCACGTAG TGGGCCATCG CCCTGATAGA2751 CGGTTTTTCG CCCTTTGACG TTGGAGTCCA CGTTCTTTAA TAGTGGACTC2801 TTGTTCCAAA CTGGAACAAC ACTCAACCCT ATCGCGGTCT ATTCTTTTGA2851 TTTATAAGGG ATTTTGCCGA TTTCGGCCTA TTGGTTAAAA AATGAGCTGA2901 TTTAACAAAT TCAGGGCGCA AGGGCTGCTA AAGGAACCGG AACACGTAGA2951 AAGCCAGTCC GCAGAAACGG TGCTGACCCC GGATGAATGT CAGCTACTGG3001 GCTATCTGGA CAAGGGAAAA CGCAAGCGCA AAGAGAAAGC AGGTAGCTTG3051 CAGTGGGCTT ACATGGCGAT AGCTAGACTG GGCGGTTTTA TGGACAGCAA3101 GCGAACCGGA ATTGCCAGCT GGGGCGCCCT CTGGTAAGGT TGGGAAGCCC3151 TGCAAAGTAA ACTGGATGGC TTTCTTGCCG CCAAGGATCT GATGGCGCAG3201 GGGATCAAGA TCTGATCAAG AGACAGGATG AGGATCGTTT CGCATGATTG3251 AACAAGATGG ATTGCACGCA GGTTCTCCGG CCGCTTGGGT GGAGAGGCTA3301 TTCGGCTATG ACTGGGCACA ACAGACAATC GGCTGCTCTG ATGCCGCCGT3351 GTTCCGGCTG TCAGCGCAGG GGCGCCCGGT TCTTTTTGTC AAGACCGACC3401 TGTCCGGTGC CCTGAATGAA CTGCAGGACG AGGCAGCGCG GCTATCGTGG3451 CTGGCCACGA CGGGCGTTCC TTGCGCAGCT GTGCTCGACG TTGTCACTGA3501 AGCGGGAAGG GACTGGCTGC TATTGGGCGA AGTGCCGGGG CAGGATCTCC3551 TGTCATCTCG CCTTGCTCCT GCCGAGAAAG TATCCATCAT GGCTGATGCA3601 ATGCGGCGGC TGCATACGCT TGATCCGGCT ACCTGCCCAT TCGACCACCA3651 AGCGAAACAT CGCATCGAGC GAGCACGTAC TCGGATGGAA GCCGGTCTTG3701 TCGATCAGGA TGATCTGGAC GAAGAGCATC AGGGGCTCGC GCCAGCCGAA3751 CTGTTCGCCA GGCTCAAGGC GCGCATGCCC GACGGCGAGG ATCTCGTCGT3801 GATCCATGGC GATGCCTGCT TGCCGAATAT CATGGTGGAA AATGGCCGCT3851 TTTCTGGATT CAACGACTGT GGCCGGCTGG GTGTGGCGGA CCGCTATCAG3901 GACATAGCGT TGGATACCCG TGATATTGCT GAAGAGCTTG GCGGCGAATG3951 GGCTGACCGC TTCCTCGTGC TTTACGGTAT CGCCGCTCCC GATTCGCAGC4001 GCATCGCCTT CTATCGCCTT CTTGACGAGT TCTTCTGAAT TGAAAAAGGA4051 AGAGTATGAG TATTCAACAT TTCCGTGTCG CCCTTATTCC CTTTTTTGCG4101 GCATTTTGCC TTCCTGTTTT TGCTCACCCA GAAACGCTGG TGAAAGTAAA4151 AGATGCTGAA GATCAGTTGG GTGCACGAGT GGGTTACATC GAACTGGATC4201 TCAACAGCGG TAAGATCCTT GAGAGTTTTC GCCCCGAAGA ACGTTTTCCA4251 ATGATGAGCA CTTTTAAAGT TCTGCTATGT CATACACTAT TATCCCGTAT4301 TGACGCCGGG CAAGAGCAAC TCGGTCGCCG GGCGCGGTAT TCTCAGAATG4351 ACTTGGTTGA GTACTCACCA GTCACAGAAA AGCATCTTAC GGATGGCATG4401 ACAGTAAGAG AATTATGCAG TGCTGCCATA ACCATGAGTG ATAACACTGC4451 GGCCAACTTA CTTCTGACAA CGATCGGAGG ACCGAAGGAG CTAACCGCTT4501 TTTTGCACAA CATGGGGGAT CATGTAACTC GCCTTGATCG TTGGGAACCG4551 GAGCTGAATG AAGCCATACC AAACGACGAG AGTGACACCA CGATGCCTGT4601 AGCAATGCCA ACAACGTTGC GCAAACTATT AACTGGCGAA CTACTTACTC4651 TAGCTTCCCG GCAACAATTA ATAGACTGGA TGGAGGCGGA TAAAGTTGCA4701 GGACCACTTC TGCGCTCGGC CCTTCCGGCT GGCTGGTTTA TTGCTGATAA4751 ATCTGGAGCC GGTGAGCGTG GGTCTCGCGG TATCATTGCA GCACTGGGGC4801 CAGATGGTAA GCCCTCCCGT ATCGTAGTTA TCTACACGAC GGGGAGTCAG4851 GCAACTATGG ATGAACGAAA TAGACAGATC GCTGAGATAG GTGCCTCACT4901 GATTAAGCAT TGGTAACTGT CAGACCAAGT TTACTCATAT ATACTTTAGA4951 TTGATTTAAA ACTTCATTTT TAATTTAAAA GGATCTAGGT GAAGATCCTT5001 TTTGATAATC TCATGACCAA AATCCCTTAA CGTGAGTTTT CGTTCCACTG5051 AGCGTCAGAC CCCGTAGAAA AGATCAAAGG ATCTTCTTGA GATCCTTTTT5101 TTCTGCGCGT AATCTGCTGC TTGCAAACAA AAAAACCACC GCTACCAGCG5151 GTGGTTTGTT TGCCGGATCA AGAGCTACCA ACTCTTTTTC CGAAGGTAAC5201 TGGCTTCAGC AGAGCGCAGA TACCAAATAC TGTCCTTCTA GTGTAGCCGT5251 AGTTAGGCCA CCACTTCAAG AACTCTGTAG CACCGCCTAC ATACCTCGCT5301 CTGCTAATCC TGTTACCAGT GGCTGCTGCC AGTGGCGATA AGTCGTGTCT5351 TACCGGGTTG GACTCAAGAC GATAGTTACC GGATAAGGCG CAGCGGTCGG5401 GCTGAACGGG GGGTTCGTGC ACACAGCCCA GCTTGGAGCG AACGACCTAC5451 ACCGAACTGA GATACCTACA GCGTGAGCAT TGAGAAAGCG CCACGCTTCC5501 CGAAGGGAGA AAGGCGGACA GGTATCCGGT AAGCGGCAGG GTCGGAACAG5551 GAGAGCGCAC GAGGGAGCTT CCAGGGGGAA ACGCCTGGTA TCTTTATAGT5601 CCTGTCGGGT TTCGCCACCT CTGACTTGAG CGTCGATTTT TGTGATGCTC5651 GTCAGGGGGG CGGAGCCTAT GGAAAAACGC CAGCAACGCG GCCTTTTTAC5701 GGTTCCTGGC CTTTTGCTGG CCTTTTGCTC ACATGTTCTT TCCTGCGTTA5751 TCCCCTGATT CTGTGGATAA CCGTATTACC GCCTTTGAGT GAGCTGATAC5801 CGCTCGCCGC AGCCGAACGA CCGAGCGCAG CGAGTCAGTG AGCGAGGAAG5851 CGGAAG表8:重组表达质粒pCDNA3.1(-)H-SemaL-MycHisA的核苷酸序列(SED IDNO.:35)
1 GACGGATCGG GAGATCTCCC GATCCCCTAT GGTCGACTCT CAGTACAATC
51 TGCTCTGATG CCGCATAGTT AAGCCAGTAT CTGCTCCCTG CTTGTGTGTT
101 GGAGGTCGCT GAGTAGTGCG CGAGCAAAAT TTAAGCTACA ACAAGGCAAG
151 GCTTGACCGA CAATTGCATG AAGAATCTGC TTAGGGTTAG GCGTTTTGCG
201 CTGCTTCGCG ATGTACGGGC CAGATATACG CGTTGACATT GATTATTGAC
251 TAGTTATTAA TAGTAATCAA TTACGGGGTC ATTAGTTCAT AGCCCATATA
301 TGGAGTTCCG CGTTACATAA CTTACGGTAA ATGGCCCGCC TGGCTGACCG
351 CCCAACGACC CCCGCCCATT GACGTCAATA ATGACGTATG TTCCCATAGT
401 AACGCCAATA GGGACTTTCC ATTGACGTCA ATGGGTGGAC TATTTACGGT
451 AAACTGCCCA CTTGGCAGTA CATCAAGTGT ATCATATGCC AAGTACGCCC
501 CCTATTGACG TCAATGACGG TAAATGGCCC GCCTGGCATT ATGCCCAGTA
551 CATGACCTTA TGGGACTTTC CTACTTGGCA GTACATCTAC GTATTAGTCA
601 TCGCTATTAC CATGGTGATG CGGTTTTGGC AGTACATCAA TGGGCGTGGA
651 TAGCGGTTTG ACTCACGGGG ATTTCCAAGT CTCCACCCCA TTGACGTCAA
701 TGGGAGTTTG TTTTGGCACC AAAATCAACG GGACTTTCCA AAATGTCGTA
751 ACAACTCCGC CCCATTGACG CAAATGGGCG GTAGGCGTGT ACGGTGGGAG
801 GTCTATATAA GCAGAGCTCT CTGGCTAACT AGAGAACCCA CTGCTTACTG
851 GCTTATCGAA ATTAATACGA CTCACTATAG GGAGACCCAA GCTGGCTAGC
901 GTTTAAACGG GCCCTCTAGA CTCGAGCGGC CGCCACTGTG CTGGATATCT
951 GCAgaattcg gcttgggatg acgcctcctc cgcccggacg tgccgccccc
1001 agcgcaccgc gcgcccgcgt ccctggcccg ccggctcggt tggggcttcc1051 gctgcggctg cggctgctgc tgctgctctg ggcggccgcc gcctccgccc1101 agggccacct aaggagcgga ccccgcatct tcgccgtctg gaaaggccat115t gtagggcagg accgggtgga ctttggccag actgagccgc acacggtgct1201 tttccacgag ccaggcagct cctctgtgtg ggtgggagga cgtggcaagg1251 tctacctctt tgacttcccc gagggcaaga acgcatctgt gcgcacggtg1301 aatatcggct ccacaaaggg gtcctgtctg gataagcggg actgcgagaa1351 ctacatcact ctcctggaga ggcggagtga ggggctgctg gcctgtggca1401 ccaacgcccg gcaccccagc tgctggaacc tggtgaatgg cactgtggtg1451 ccacttggcg agatgagagg ctacgccccc ttcagcccgg acgagaactc1501 cctggttctg tttgaagggg acgaggtgta ttccaccatc cggaagcagg1551 aatacaatgg gaagatccct cggttccgcc gcatccgggg cgagagtgag1601 ctgtacacca gtgatactgt catgcagaac ccacagttca tcaaagccac1651 catcgtgcac caagaccagg cttacgatga caagatctac tacttcttcc1701 gagaggacaa tcctgacaag aatcctgagg ctcctctcaa tgtgtcccgt1751 gtggcccagt tgtgcagggg ggaccagggt ggggaaagtt cactgtcagt1801 ctccaagtgg aacacttttc tgaaagccat gctggtatgc agtgatgctg1851 ccaccaacaa gaacttcaac aggctgcaag acgtcttcct gctccctgac1901 cccagcggcc agtggaggga caccagggtc tatggtgttt tctccaaccc1951 ctggaactac tcagccgtct gtgtgtattc cctcggtgac attgacaagg2001 tcttccgtac ctcctcactc aagggctacc actcaagcct tcccaacccg2051 cggcctggca agtgcctccc agaccagcag ccgataccca cagagacctt2101 ccaggtggct gaccgtcacc cagaggtggc gcagagggtg gagcccatgg2151 ggcctctgaa gacgccattg ttccactcta aataccacta ccagaaagtg2201 gccgttcacc gcatgcaagc cagccacggg gagacctttc atgtgcttta2251 cctaactaca gacaggggca ctatccacaa ggtggtggaa ccgggggagc2301 aggagcacag cttcgccttc aacatcatgg agatccagcc cttccgccgc2351 gcggctgcca tccagaccat gtcgctggat gctgagcgga ggaagctgta2401 tgtgagctcc cagtgggagg tgagccaggt gcccctggac ctgtgtgagg2451 tctatggcgg gggctgccac ggttgcctca tgtcccgaga cccctactgc2501 ggctgggacc agggccgctg catctccatc tacagctccg aacggtcagt2551 gctgcaatcc attaatccag ccgagccaca caaggagtgt cccaacccca2601 aaccagacaa ggccccactg cagaaggttt ccctggcccc aaactctcgc2651 tactacctga gctgccccat ggaatcccgc cacgccacct actcatggcg2701 ccacaaggag aacgtggagc agagctgcga acctggtcac cagagcccca2751 actgcatcct gttcatcgag aacctcacgg cgcagcagta cggccactac2801 ttctgcgagg cccaggaggg ctcctacttc cgcgaggctc agcactggca2851 gctgctgccc gaggacggca tcatggccga gcacctgctg ggtcatgcct2901 gtgccctggc tgcctccctc tggctggggg tgctgcccac actcactctt2951 ggcttgctgg tccacgtgaa gcttGGGCCC GAACAAAAAC TCATCTCAGA3001 AGAGGATCTG AATAGCGCCG TCGACCATCA TCATCATCAT CATTGAGTTT3051 AAACCGCTGA TCAGCCTCGA CTGTGCCTTC TAGTTGCCAG CCATCTGTTG3101 TTTGCCCCTC CCCCGTGCCT TCCTTGACCC TGGAAGGTGC CACTCCCACT3151 GTCCTTTCCT AATAAAATGA GGAAATTGCA TCGCATTGTC TGAGTAGGTG3201 TCATTCTATT CTGGGGGGTG GGGTGGGGCA GGACAGCAAG GGGGAGGATT3251 GGGAAGACAA TAGCAGGCAT GCTGGGGATG CGGTGGGCTC TATGGCTTCT3301 GAGGCGGAAA GAACCAGCTG GGGCTCTAGG GGGTATCCCC ACGCGCCCTG3351 TAGCGGCGCA TTAAGCGCGG CGGGTGTGGT GGTTACGCGC AGCGTGACCG3401 CTACACTTGC CAGCGCCCTA GCGCCCGCTC CTTTCGCTTT CTTCCCTTCC3451 TTTCTCGCCA CGTTCGCCGG CTTTCCCCGT CAAGCTCTAA ATCGGGGCAT3501 CCCTTTAGGG TTCCGATTTA GTGCTTTACG GCACCTCGAC CCCAAAAAAC3551 TTGATTAGGG TGATGGTTCA CGTAGTGGGC CATCGCCCTG ATAGACGGTT3601 TTTCGCCCTT TGACGTTGGA GTCCACGTTC TTTAATAGTG GACTCTTGTT3651 CCAAACTGGA ACAACACTCA ACCCTATCTC GGTCTATTCT TTTGATTTAT3701 AAGGGATTTT GGGGATTTCG GCCTATTGGT TAAAAAATGA GCTGATTTAA3751 CAAAAATTTA ACGCGAATTA ATTCTGTGGA ATGTGTGTCA GTTAGGGTGT3801 GGAAAGTCCC CAGGCTCCCC AGGCAGGCAG AAGTATGCAA AGCATGCATC3851 TCAATTAGTC AGCAACCAGG TGTGGAAAGT CCCCAGGCTC CCCAGCAGGC3901 AGAAGTATGC AAAGCATGCA TCTCAATTAG TCAGCAACCA TAGTCCCGCC3951 CCTAACTCCG CCCATCCCGC CCCTAACTCC GCCCAGTTCC GCCCATTCTC4001 CGCCCCATGG CTGACTAATT TTTTTTATTT ATGCAGAGGC CGAGGCCGCC4051 TCTGCCTCTG AGCTATTCCA GAAGTAGTGA GGAGGCTTTT TTGGAGGCCT4101 AGGCTTTTGC AAAAAGCTCC CGGGAGCTTG TATATCCATT TTCGGATCTG4151 ATCAAGAGAC AGGATGAGGA TCGTTTCGCA TGATTGAACA AGATGGATTG4201 CACGCAGGTT CTCCGGCCGC TTGGGTGGAG AGGCTATTCG GCTATGACTG4251 GGCACAACAG ACAATCGGCT GCTCTGATGC CGCCGTGTTC CGGCTGTCAG4301 CGCAGGGGCG CCCGGTTCTT TTTGTCAAGA CCGACCTGTC CGGTGCCCTG4351 AATGAACTGC AGGACGAGGC AGCGCGGCTA TCGTGGCTGG CCACGACGGG4401 CGTTCCTTGC GCAGCTGTGC TCGACGTTGT CACTGAAGCG GGAAGGGACT4451 GGCTGCTATT GGGCGAAGTG CCGGGGCAGG ATCTCCTGTC ATCTCACCTT4501 GCTCCTGCCG AGAAAGTATC CATCATGGCT GATGCAATGC GGCGGCTGCA4551 TACGCTTGAT CCGGCTACCT GCCCATTCGA CCACCAAGCG AAACATCGCA4601 TCGAGCGAGC ACGTACTCGG ATGGAAGCCG GTCTTGTCGA TCAGGATGAT4651 CTGGACGAAG AGCATCAGGG GCTCGCGCCA GCCGAACTGT TCGCCAGGCT4701 CAAGGCGCGC ATGCCCGACG GCGAGGATCT CGTCGTGACC CATGGCGATG4751 CCTGCTTGCC GAATATCATG GTGGAAAATG GCCGCTTTTC TGGATTCATC4801 GACTGTGGCC GGCTGGGTGT GGCGGACCGC TATCAGGACA TAGCGTTGGC4851 TACCCGTGAT ATTGCTGAAG AGCTTGGCGG CGAATGGGCT GACCGCTTCC4901 TCGTGCTTTA CGGTATCGCC GCTCCCGATT CGCAGCGCAT CGCCTTCTAT4951 CGCCTTCTTG ACGAGTTCTT CTGAGCGGGA CTCTGGGGTT CGAAATGACC5001 GACCAAGCGA CGCCCAACCT GCCATCACGA GATTTCGATT CCACCGCCGC5051 CTTCTATGAA AGGTTGGGCT TCGGAATCGT TTTCCGGGAC GCCGGCTGGA5101 TGATCCTCCA GCGCGGGGAT CTCATGCTGG AGTTCTTCGC CCACCCCAAC5151 TTGTTTATTG CAGCTTATAA TGGTTACAAA TAAAGCAATA GCATCACAAA5201 TTTCACAAAT AAAGCATTTT TTTCACTGCA TTCTAGTTGT GGTTTGTCCA5251 AACTCATCAA TGTATCTTAT CATGTCTGTA TACCGTCGAC CTCTAGCTAG5301 AGCTTGGCGT AATCATGGTC ATAGCTGTTT CCTGTGTGAA ATTGTTATCC5351 GCTCACAATT CCACACAACA TACGAGCCGG AAGCATAAAG TGTAAAGCCT5401 GGGGTGCCTA ATGAGTGAGC TAACTCACAT TAATTGCGTT GCGCTCACTG5451 CCCGCTTTCC AGTCGGGAAA CCTGTCGTGC CAGCTGCATT AATGAATCGG5501 CCAACGCGCG GGGAGAGGCG GTTTGCGTAT TGGGCGCTCT TCCGCTTCCT5551 CGCTCACTGA CTCGCTGCGC TCGGTCGTTC GGCTGCGGCG AGCGGTATCA5601 GCTCACTCAA AGGCGGTAAT ACGGTTATCC ACAGAATCAG GGGATAACGC5651 AGGAAAGAAC ATGTGAGCAA AAGGCCAGCA AAAGGCCAGG AACCGTAAAA5701 AGGCCGCGTT GCTGGCGTTT TTCCATAGGC TCCGCCCCCC TGACGAGCAT5751 CACAAAAATC GACGCTCAAG TCAGAGGTGG CGAAACCCGA CAGGACTATA5801 AAGATACCAG GCGTTTCCCC CTGGAAGCTC CCTCGTGCGC TCTCCTGTTC5851 CGACCCTGCC GCTTACCGGA TACCTGTCCG CCTTTCTCCC TTCGGGAAGC5901 GTGGCGCTTT CTCAATGCTC ACGCTGTAGG TATCTCAGTT CGGTGTAGGT5951 CGTTCGCTCC AAGCTGGGCT GTGTGCACGA ACCCCCCGTT CAGCCCGACC6001 GCTGCGCCTT ATCCGGTAAC TATCGTCTTG AGTCCAACCC GGTAAGACAC6051 GACTTATCGC CACTGGCAGC AGCCACTGGT AACAGGATTA GCAGAGCGAG6101 GTATGTAGGC GGTGCTACAG AGTTCTTGAA GTGGTGGCCT AACTACGGCT6151 ACACTAGAAG GACAGTATTT GGTATCTGCG CTCTGCTGAA GCCAGTTAcc6201 TTCGGAAAAA GAGTTGGTAG CTCTTGATCC GGCAAACAAA CCACCGCTGG6251 TAGCGGTGGT TTTTTTGTTT GCAAGCAGCA GATTACGCGC AGAAAAAAAG6301 GATCTCAAGA AGATCCTTTG ATCTTTTCTA CGGGGTCTGA CGCTCAGTGG6351 AACGAAAACT CACGTTAAGG GATTTTGGTC ATGAGATTAT CAAAAAGGAT6401 CTTCACCTAG ATCCTTTTAA ATTAAAAATG AAGTTTTAAA TCAATCTAAA6451 GTATATATGA GTAAACTTGG TCTGACAGTT ACCAATGCTT AATCAGTGAG6501 GCACCTATCT CAGCGATCTG TCTATTTCGT TCATCCATAG TTGCCTGACT6551 CCCCGTCGTG TAGATAACTA CGATACGGGA GGGCTTACCA TCTGGCCCCA6601 GTGCTGCAAT GATACCGCGA GACCCACGCT CACCGGCTCC AGATTTATCA6651 GCAATAAACC AGCCAGCCGG AAGGGCCGAG CGCAGAAGTG GTCCTGCAAC6701 TTTATCCGCC TCCATCCAGT CTATTAATTG TTGCCGGGAA GCTAGAGTAA
6751 GTAGTTCGCC AGTTAATAGT TTGCGCAACG TTGTTGCCAT TGCTACAGGC
6801 ATCGTGGTGT CACGCTCGTC GTTTGGTATG GCTTCATTCA GCTCCGGTTC
6851 CCAACGATCA AGGCGAGTTA CATGATCCCC CATGTTGTGC AAAAAAGCGG
6901 TTAGCTCCTT CGGTCCTCCG ATCGTTGTCA GAAGTAAGTT GGCCGCAGTG
6951 TTATCACTCA TGGTTATGGC AGCACTGCAT AATTCTCTTA CTGTCATGCC
7001 ATCCGTAAGA TGCTTTTCTG TGACTGGTGA GTACTCAACC AAGTCATTCT
7051 GAGAATAGTG TATGCGGCGA CCGAGTTGCT CTTGCCCGGC GTCAATACGG
7101 GATAATACCG CGCCACATAG CAGAACTTTA AAAGTGCTCA TCATTGGAAA
7151 ACGTTCTTCG GGGCGAAAAC TCTCAAGGAT CTTACCGCTG TTGAGATCCA
7201 GTTCGATGTA ACCCACTCGT GCACCCAACT GATCTTCAGC ATCTTTTACT
7251 TTCACCAGCG TTTCTGGGTG AGCAAAAACA GGAAGGCAAA ATGCCGCAAA
7301 AAAGGGAATA AGGGCGACAC GGAAATGTTG AATACTCATA CTCTTCCTTT
7351 TTCAATATTA TTGAAGCATT TATCAGGGTT ATTGTCTCAT GAGCGGATAC
7401 ATATTTGAAT GTATTTAGAA AAATAAACAA ATAGGGGTTC CGCGCACATT
7451 TCCCCGAAAA GTGCCACCTG ACGTC表9:重组质粒pcDA3.1-SemaL-EGFP-MychisA的核苷酸序列(SEQ IDNO.:36)
1 GACGGATCGG GAGATCTCCC GATCCCCTAT GGTCGACTCT CAGTACAATC
51 TGCTCTGATG CCGCATAGTT AAGCCAGTAT CTGCTCCCTG CTTGTGTGTT
101 GGAGGTCGCT GAGTAGTGCG CGAGCAAAAT TTAAGCTACA ACAAGGCAAG
151 GCTTGACCGA CAATTGCATG AAGAATCTGC TTAGGGTTAG GCGTTTTGCG
201 CTGCTTCGCG ATGTACGGGC CAGATATACG CGTTGACATT GATTATTGAC
251 TAGTTATTAA TAGTAATCAA TTACGGGGTC ATTAGTTCAT AGCCCATATA
301 TGGAGTTCCG CGTTACATAA CTTACGGTAA ATGGCCCGCC TGGCTGACCG
351 CCCAACGACC CCCGCCCATT GACGTCAATA ATGACGTATG TTCCCATAGT
401 AACGCCAATA GGGACTTTCC ATTGACGTCA ATGGGTGGAC TATTTACGGT
451 AAACTGCCCA CTTGGCAGTA CATCAAGTGT ATCATATGCC AAGTACGCCC
501 CCTATTGACG TCAATGACGG TAAATGGCCC GCCTGGCATT ATGCCCAGTA
551 CATGACCTTA TGGGACTTTC CTACTTGGCA GTACATCTAC GTATTAGTCA
601 TCGCTATTAC CATGGTGATG CGGTTTTGGC AGTACATCAA TGGGCGTGGA
651 TAGCGGTTTG ACTCACGGGG ATTTCCAAGT CTCCACCCCA TTGACGTCAA
701 TGGGAGTTTG TTTTGGCACC AAAATCAACG GGACTTTCCA AAATGTCGTA
751 ACAACTCCGC CCCATTGACG CAAATGGGCG GTAGGCGTGT ACGGTGGGAG
801 GTCTATATAA GCAGAGCTCT CTGGCTAACT AGAGAACCCA CTGCTTACTG
851 GCTTATCGAA ATTAATACGA CTCACTATAG GGAGACCCAA GCTGGCTAGC
901 GTTTAAACGG GCCCTCTAGA CTCGAGCGGC CGCCACTGTG CTGGATATCT 951 GCAgaattcg gcttgggatg acgcctcctc cgcccggacg tgccgccccc1001 agcgcaccgc gcgcccgcgt ccctggcccg ccggctcggt tggggcttcc1051 gctgcggctg cggctgctgc tgctgctctg ggcggccgcc gcctccgccc1101 agggccacct aaggagcgga ccccgcatct tcgccgtctg gaaaggccat1151 gtagggcagg accgggtgga ctttggccag actgagccgc acacggtgct1201 tttccacgag ccaggcagct cctctgtgtg ggtgggagga cgtggcaagg1251 tctacctctt tgacttcccc gagggcaaga acgcatctgt gcgcacggtg1301 aatatcggct ccacaaaggg gtcctgtctg gataagcggg actgcgagaa1351 ctacatcact ctcctggaga ggcggagtga ggggctgctg gcctgtggca1401 ccaacgcccg gcaccccagc tgctggaacc tggtgaatgg cactgtggtg1451 ccacttggcg agatgagagg ctacgccccc ttcagcccgg acgagaactc1501 cctggttctg tttgaagggg acgaggtgta ttccaccatc cggaagcagg1551 aatacaatgg gaagatccct cggttccgcc gcatccgggg cgagagtgag1601 ctgtacacca gtgatactgt catgcagaac ccacagttca tcaaagccac1651 catcgtgcac caagaccagg cttacgatga caagatctac tacttcttcc1701 gagaggacaa tcctgacaag aatcctgagg ctcctctcaa tgtgtcccgt1751 gtggcccagt tgtgcagggg ggaccagggt ggggaaagtt cactgtcagt1801 ctccaagtgg aacacttttc tgaaagccat gctggtatgc agtgatgctg1851 ccaccaacaa gaacttcaac aggctgcaag acgtcttcct gctccctgac1901 cccagcggcc agtggaggga caccagggtc tatggtgttt tctccaaccc1951 ctggaactac tcagccgtct gtgtgtattc cctcggtgac attgacaagg2001 tcttccgtac ctcctcactc aagggctacc actcaagcct tcccaacccg2051 cggcctggca agtgcctccc agaccagcag ccgataccca cagagacctt2101 ccaggtggct gaccgtcacc cagaggtggc gcagagggtg gagcccatgg2151 ggcctctgaa gacgccattg ttccactcta aataccacta ccagaaagtg2201 gccgttcacc gcatgcaagc cagccacggg gagacctttc atgtgcttta2251 cctaactaca gacaggggca ctatccacaa ggtggtggaa ccgggggagc2301 aggagcacag cttcgccttc aacatcatgg agatccagcc cttccgccgc2351 gcggctgcca tccagaccat gtcgctggat gctgagcgga ggaagctgta2401 tgtgagctcc cagtgggagg tgagccaggt gcccctggac ctgtgtgagg2451 tctatggcgg gggctgccac ggttgcctca tgtcccgaga cccctactgc2501 ggctgggacc agggccgctg catctccatc tacagctccg aacggtcagt2551 gctgcaatcc attaatccag ccgagccaca caaggagtgt cccaacccca2601 aaccagacaa ggccccactg cagaaggttt ccctggcccc aaactctcgc2651 tactacctga gctgccccat ggaatcccgc cacgccacct actcatggcg2701 ccacaaggag aacgtggagc agagctgcga acctggtcac cagagcccca2751 actgcatcct gttcatcgag aacctcacgg cgcagcagta cggccactac2801 ttctgcgagg cccaggaggg ctcctacttc cgcgaggctc agcactggca2851 gctgctgccc gaggacggca tcatggccga gcacctgctg ggtcatgcct2901 gtgccctggc tgcctccctc tggctggggg tgctgcccac actcactctt2951 ggcttgctgg tccacATGGT GAGCAAGGGC GAGGAGCTGT TCACCGGGGT3001 GGTGCCCATC CTGGTCGAGC TGGACGGCGA CGTAAACGGC CACAAGTTCA3051 GCGTGTCCGG CGAGGGCGAG GGCGATGCCA CCTACGGCAA GCTGACCCTG3101 AAGTTCATCT GCACCACCGG CAAGCTGCCC GTGCCCTGGC CCACCCTCGT3151 GACCACCCTG ACCTACGGCG TGCAGTGCTT CAGCCGCTAC CCCGACCACA3201 TGAAGCAGCA CGACTTCTTC AAGTCCGCCA TGCCCGAAGG CTACGTCCAG3251 GAGCGCACCA TCTTCTTCAA GGACGACGGC AACTACAAGA CCCGCGCCGA3301 GGTGAAGTTC GAGGGCGACA CCCTGGTGAA CCGCATCGAG CTGAAGGGCA3351 TCGACTTCAA GGAGGACGGC AACATCCTGG GGCACAAGCT GGAGTACAAC3401 TACAACAGCC ACAACGTCTA TATCATGGCC GACAAGCAGA AGAACGGCAT3451 CAAGGTGAAC TTCAAGATCC GCCACAACAT CGAGGACGGC AGCGTGCAGC3501 TCGCCGACCA CTACCAGCAG AACACCCCCA TCGGCGACGG CCCCGTGCTG3551 CTGCCCGACA ACCACTACCT GAGCACCCAG TCCGCCCTGA GCAAAGACCC3601 CAACGAGAAG CGCGATCACA TGGTCCTGCT GGAGTTCGTG ACCGCCGCCG3651 GGATCACTCT CGGCATGGAC GAGCTGTACA Aggtgaagct tGGGCCCGAA3701 CAAAAACTCA TCTCAGAAGA GGATCTGAAT AGCGCCGTCG ACCATCATCA3751 TCATCATCAT TGAGTTTAAA CCGCTGATCA GCCTCGACTG TGCCTTCTAG3801 TTGCCAGCCA TCTGTTGTTT GCCCCTCCCC CGTGCCTTCC TTGACCCTGG3851 AAGGTGCCAC TCCCACTGTC CTTTCCTAAT AAAATGAGGA AATTGCATCG3901 CATTGTCTGA GTAGGTGTCA TTCTATTCTG GGGGGTGGGG TGGGGCAGGA3951 CAGCAAGGGG GAGGATTGGG AAGACAATAG CAGGCATGCT GGGGATGCGG4001 TGGGCTCTAT GGCTTCTGAG GCGGAAAGAA CCAGCTGGGG CTCTAGGGGG4051 TATCCCCACG CGCCCTGTAG CGGCGCATTA AGCGCGGCGG GTGTGGTGGT4101 TACGCGCAGC GTGACCGCTA CACTTGCCAG CGCCCTAGCG CCCGCTCCTT4151 TCGCTTTCTT CCCTTCCTTT CTCGCCACGT TCGCCGGCTT TCCCCGTCAA4201 GCTCTAAATC GGGGCATCCC TTTAGGGTTC CGATTTAGTG CTTTACGGCA4251 CCTCGACCCC AAAAAACTTG ATTAGGGTGA TGGTTCACGT AGTGGGCCAT4301 CGCCCTGATA GACGGTTTTT CGCCCTTTGA CGTTGGAGTC CACGTTCTTT4351 AATAGTGGAC TCTTGTTCCA AACTGGAACA ACACTCAACC CTATCTCGGT4401 CTATTCTTTT GATTTATAAG GGATTTTGGG GATTTCGGCC TATTGGTTAA4451 AAAATGAGCT GATTTAACAA AAATTTAACG CGAATTAATT CTGTGGAATG4501 TGTGTCAGTT AGGGTGTGGA AAGTCCCCAG GCTCCCCAGG CAGGCAGAAG4551 TATGCAAAGC ATGCATCTCA ATTAGTCAGC AACCAGGTGT GGAAAGTCCC4601 CAGGCTCCCC AGCAGGCAGA AGTATGCAAA GCATGCATCT CAATTAGTCA4651 GCAACCATAG TCCCGCCCCT AACTCCGCCC ATCCCGCCCC TAACTCCGCC4701 CAGTTCCGCC CATTCTCCGC CCCATGGCTG ACTAATTTTT TTTATTTATG4751 CAGAGGCCGA GGCCGCCTCT GCCTCTGAGC TATTCCAGAA GTAGTGAGGA4801 GGCTTTTTTG GAGGCCTAGG CTTTTGCAAA AAGCTCCCGG GAGCTTGTAT4851 ATCCATTTTC GGATCTGATC AAGAGACAGG ATGAGGATCG TTTCGCATGA4901 TTGAACAAGA TGGATTGCAC GCAGGTTCTC CGGCCGCTTG GGTGGAGAGG4951 CTATTCGGCT ATGACTGGGC ACAACAGACA ATCGGCTGCT CTGATGCCGC5001 CGTGTTCCGG CTGTCAGCGC AGGGGCGCCC GGTTCTTTTT GTCAAGACCG5051 ACCTGTCCGG TGCCCTGAAT GAACTGCAGG ACGAGGCAGC GCGGCTATCG5101 TGGCTGGCCA CGACGGGCGT TCCTTGCGCA GCTGTGCTCG ACGTTGTCAC5151 TGAAGCGGGA AGGGACTGGC TGCTATTGGG CGAAGTGCCG GGGCAGGATC5201 TCCTGTCATC TCACCTTGCT CCTGCCGAGA AAGTATCCAT CATGGCTGAT5251 GCAATGCGGC GGCTGCATAC GCTTGATCCG GCTACCTGCC CATTCGACCA5301 CCAAGCGAAA CATCGCATCG AGCGAGCACG TACTCGGATG GAAGCCGGTC5351 TTGTCGATCA GGATGATCTG GACGAAGAGC ATCAGGGGCT CGCGCCAGCC5401 GAACTGTTCG CCAGGCTCAA GGCGCGCATG CCCGACGGCG AGGATCTCGT5451 CGTGACCCAT GGCGATGCCT GCTTGCCGAA TATCATGGTG GAAAATGGCC5501 GCTTTTCTGG ATTCATCGAC TGTGGCCGGC TGGGTGTGGC GGACCGCTAT5551 CAGGACATAG CGTTGGCTAC CCGTGATATT GCTGAAGAGC TTGGCGGCGA5601 ATGGGCTGAC CGCTTCCTCG TGCTTTACGG TATCGCCGCT CCCGATTCGC5651 AGCGCATCGC CTTCTATCGC CTTCTTGACG AGTTCTTCTG AGCGGGACTC5701 TGGGGTTCGA AATGACCGAC CAAGCGACGC CCAACCTGCC ATCACGAGAT5751 TTCGATTCCA CCGCCGCCTT CTATGAAAGG TTGGGCTTCG GAATCGTTTT5801 CCGGGACGCC GGCTGGATGA TCCTCCAGCG CGGGGATCTC ATGCTGGAGT5851 TCTTCGCCCA CCCCAACTTG TTTATTGCAG CTTATAATGG TTACAAATAA5901 AGCAATAGCA TCACAAATTT CACAAATAAA GCATTTTTTT CACTGCATTC5951 TAGTTGTGGT TTGTCCAAAC TCATCAATGT ATCTTATCAT GTCTGTATAC6001 CGTCGACCTC TAGCTAGAGC TTGGCGTAAT CATGGTCATA GCTGTTTCCT6051 GTGTGAAATT GTTATCCGCT CACAATTCCA CACAACATAC GAGCCGGAAG6101 CATAAAGTGT AAAGCCTGGG GTGCCTAATG AGTGAGCTAA CTCACATTAA6151 TTGCGTTGCG CTCACTGCCC GCTTTCCAGT CGGGAAACCT GTCGTGCCAG6201 CTGCATTAAT GAATCGGCCA ACGCGCGGGG AGAGGCGGTT TGCGTATTGG6251 GCGCTCTTCC GCTTCCTCGC TCACTGACTC GCTGCGCTCG GTCGTTCGGC6301 TGCGGCGAGC GGTATCAGCT CACTCAAAGG CGGTAATACG GTTATCCACA6351 GAATCAGGGG ATAACGCAGG AAAGAACATG TGAGCAAAAG GCCAGCAAAA6401 GGCCAGGAAC CGTAAAAAGG CCGCGTTGCT GGCGTTTTTC CATAGGCTCC6451 GCCCCCCTGA CGAGCATCAC AAAAATCGAC GCTCAAGTCA GAGGTGGCGA6501 AACCCGACAG GACTATAAAG ATACCAGGCG TGTCCCCCTG GAAGCTCCCT6551 CGTGCGCTCT CCTGTTCCGA CCCTGCCGCT TACCGGATAC CTGTCCGCCT6601 TTCTCCCTTC GGGAAGCGTG GCGCTTTCTC AATGCTCACG CTGTAGGTAT6651 CTCAGTTCGG TGTAGGTCGT TCGCTCCAAG CTGGGCTGTG TGCACGAACC6701 CCCCGTTCAG CCCGACCGCG GCGCCTTATC CGGTAACTAT CGTCTTGAGT6751 CCAACCCGGT AAGACACGAC TTATCGCCAC TGGCAGCAGC CACTGGTAAC6801 AGGATTAGCA GAGCGAGGTA TGTAGGCGGT GCTACAGAGT TCTTGAAGTG6851 GTGGCCTAAC TACGGCTACA CTAGAAGGAC AGTATTTGGT ATCTGCGCTC6901 TGCTGAAGCC AGTTACCTTC GGAAAAAGAG TTGGTAGCTC TTGATCCGGC6951 AAACAAACCA CCGCTGGTAG CGGTGGTTTT TTTGTTTGCA AGCAGCAGAT7001 TACGCGCAGA AAAAAAGGAT CTCAAGAAGA TCCTTTGATC TTTTCTACGG7051 GGTCTGACGC TCAGTGGAAC GAAAACTCAC GTTAAGGGAT TTTGGTCATG7101 AGATTATCAA AAAGGATCTT CACCTAGATC CTTTTAAATT AAAAATGAAG7151 TTTTAAATCA ATCTAAAGTA TATATGAGTA AACTTGGTCT GACAGTTACC7201 AATGCTTAAT CAGTGAGGCA CCTATCTCAG CGATCTGTCT ATTTCGTTCA7251 TCCATAGTTG CCTGACTCCC CGTCGTGTAG ATAACTACGA TACGGGAGGG7301 CTTACCATCT GGCCCCAGTG CTGCAATGAT ACCGCGAGAC CCACGCTCAC7351 CGGCTCCAGA TTTATCAGCA ATAAACCAGC CAGCCGGAAG GGCCGAGCGC7401 AGAAGTGGTC CTGCAACTTT ATCCGCCTCC ATCCAGTCTA TTAATTGTTG7451 CCGGGAAGCT AGAGTAAGTA GTTCGCCAGT TAATAGTTTG CGCAACGTTG7501 TTGCCATTGC TACAGGCATC GTGGTGTCAC GCTCGTCGTT TGGTATGGCT7551 TCATTCAGCT CCGGTTCCCA ACGATCAAGG CGAGTTACAT GATCCCCCAT7601 GTTGTGCAAA AAAGCGGTTA GCTCCTTCGG TCCTCCGATC GTTGTCAGAA7651 GTAAGTTGGC CGCAGTGTTA TCACTCATGG TTATGGCAGC ACTGCATAAT7701 TCTCTTACTG TCATGCCATC CGTAAGATGC TTTTCTGTGA CTGGTGAGTA7751 CTCAACCAAG TCATTCTGAG AATAGTGTAT GCGGCGACCG AGTTGCTCTT7801 GCCCGGCGTC AATACGGGAT AATACCGCGC CACATAGCAG AACTTTAAAA7851 GTGCTCATCA TTGGAAAACG TTCTTCGGGG CGAAAACTCT CAAGGATCTT7901 ACCGCTGTTG AGATCCAGTT CGATGTAACC CACTCGTGCA CCCAACTGAT7951 CTTCAGCATC TTTTACTTTC ACCAGCGTTT CTGGGTGAGC AAAAACAGGA8001 AGGCAAAATG CCGCAAAAAA GGGAATAAGG GCGACACGGA AATGTTGAAT8051 ACTCATACTC TTCCTTTTTC AATATTATTG AAGCATTTAT CAGGGTTATT8101 GTCTCATGAG CGGATACATA TTTGAATGTA TTTAGAAAAA TAAACAAATA8151 GGGGTTCCGC GCACATTTCC CCGAAAAGTG CCACCTGACG TC表10:重组质粒pIND-H-SemaL-EE的核苷酸序列(SEQ ID NO.:37) 1 AGATCTCGGC CGCATATTAA GTGCATTGTT CTCGATACCG CTAAGTGCAT 51 TGTTCTCGTT AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC101 GATGGACAAG TGCATTGTTC TCTTGCTGAA AGCTCGATGG ACAAGTGCAT151 TGTTCTCTTG CTGAAAGCTC AGTACCCGGG AGTACCCTCG ACCGCCGGAG201 TATAAATAGA GGCGCTTCGT CTACGGAGCG ACAATTCAAT TCAAACAAGC251 AAAGTGAACA CGTCGCTAAG CGAAAGCTAA GCAAATAAAC AAGCGCAGCT301 GAACAAGCTA AACAATCTGC AGTAAAGTGC AAGTTAAAGT GAATCAATTA351 AAAGTAACCA GCAACCAAGT AAATCAACTG CAACTACTGA AATCTGCCAA401 GAAGTAATTA TTGAATACAA GAAGAGAACT CTGAATACTT TCAACAAGTT451 ACCGAGAAAG AAGAACTCAC ACACAGCTAG CGTTTAAACT TAAGCTTGGT501 ACCGAGCTCG GATCCACTAG TCCAGTGTGG TGgaattcgg cttgggatga551 cgcctcctcc gcccggacgt gccgccccca gcgcaccgcg cgcccgcgtc601 cctggcccgc cggctcggtt ggggcttccg ctgcggctgc ggctgctgct651 gctgctctgg gcggccgccg cctccgccca gggccaccta aggagcggac701 cccgcatctt cgccgtctgg aaaggccatg tagggcagga ccgggtggac751 tttggccaga ctgagccgca cacggtgctt ttccacgagc caggcagctc801 ctctgtgtgg gtgggaggac gtggcaaggt ctacctcttt gacttccccg851 agggcaagaa cgcatctgtg cgcacggtga atatcggctc cacaaagggg901 tcctgtctgg ataagcggga ctgcgagaac tacatcactc tcctggagag951 gcggagtgag gggctgctgg cctgtggcac caacgcccgg caccccagct1001 gctggaacct ggtgaatggc actgtggtgc cacttggcga gatgagaggc1051 tacgccccct tcagcccgga cgagaactcc ctggttctgt ttgaagggga1101 cgaggtgtat tccaccatcc ggaagcagga atacaatggg aagatccctc1151 ggttccgccg catccggggc gagagtgagc tgtacaccag tgatactgtc1201 atgcagaacc cacagttcat caaagccacc atcgtgcacc aagaccaggc1251 ttacgatgac aagatctact acttcttccg agaggacaat cctgacaaga1301 atcctgaggc tcctctcaat gtgtcccgtg tggcccagtt gtgcaggggg1351 gaccagggtg gggaaagttc actgtcagtc tccaagtgga acacttttct1401 gaaagccatg ctggtatgca gtgatgctgc caccaacaag aacttcaaca1451 ggctgcaaga cgtcttcctg ctccctgacc ccagcggcca gtggagggac1501 accagggtct atggtgtttt ctccaacccc tggaactact cagccgtctg1551 tgtgtattcc ctcggtgaca ttgacaaggt cttccgtacc tcctcactca1601 agggctacca ctcaagcctt cccaacccgc ggcctggcaa gtgcctccca1651 gaccagcagc cgatacccac agagaccttc caggtggctg accgtcaccc1701 agaggtggcg cagagggtgg agcccatggg gcctctgaag acgccattgt1751 tccactctaa ataccactac cagaaagtgg ccgttcaccg catgcaagcc1801 agccacgggg agacctttca tgtgctttac ctaactacag acaggggcac1851 tatccacaag gtggtggaac cgggggagca ggagcacagc ttcgccttca1901 acatcatgga gatccagccc ttccgccgcg cggctgccat ccagaccatg1951 tcgctggatg ctgagcggag gaagctgtat gtgagctccc agtgggaggt2001 gagccaggtg cccctggacc tgtgtgaggt ctatggcggg ggctgccacg2051 gttgcctcat gtcccgagac ccctactgcg gctgggacca gggccgctgc2101 atctccatct acagctccga acggtcagtg ctgcaatcca ttaatccagc2151 cgagccacac aaggagtgtc ccaaccccaa accagacaag gccccactgc2201 agaaggtttc cctggcccca aactctcgct actacctgag ctgccccatg2251 gaatcccgcc acgccaccta ctcatggcgc cacaaggaga acgtggagca2301 gagctgcgaa cctggtcacc agagccccaa ctgcatcctg ttcatcgaga2351 acctcacggc gcagcagtac ggccactact tctgcgaggc ccaggagggc2401 tcctacttcc gcgaggctca gcactggcag ctgctgcccg aggacggcat2451 catggccgag cacctgctgg gtcatgcctg tgccctggct gcctccctct2501 ggctgggggt gctgcccaca ctcactcttg gcttgctggt ccacgtgaag2551 cttGGGCCCG TTTAAACCCG CTGATCAGCC TCGACTGTGC CTTCTAGTTG2601 CCAGCCATCT GTTGTTTGCC CCTCCCCCGT GCCTTCCTTG ACCCTGGAAG2651 GTGCCACTCC CACTGTCCTT TCCTAATAAA ATGAGGAAAT TGCATCGCAT2701 TGTCTGAGTA GGTGTCATTC TATTCTGGGG GGTGGGGTGG GGCAGGACAG2751 CAAGGGGGAG GATTGGGAAG ACAATAGCAG GCATGCTGGG GATGCGGTGG2801 GCTCTATGGC TTCTGAGGCG GAAAGAACCA GCTGGGGCTC TAGGGGGTAT2851 CCCCACGCGC CCTGTAGCGG CGCATTAAGC GCGGCGGGTG TGGTGGTTAC2901 GCGCAGCGTG ACCGCTACAC TTGCCAGCGC CCTAGCGCCC GCTCCTTTCG2951 CTTTCTTCCC TTCCTTTCTC GCCACGTTCG CCGGCTTTCC CCGTCAAGCT3001 CTAAATCGGG GCATCCCTTT AGGGTTCCGA TTTAGTGCTT TACGGCACCT3051 CGACCCCAAA AAACTTGATT AGGGTGATGG TTCACGTAGT GGGCCATCGC3101 CCTGATAGAC GGTTTTTCGC CCTTTGACGT TGGAGTCCAC GTTCTTTAAT3151 AGTGGACTCT TGTTCCAAAC TGGAACAACA CTCAACCCTA TCTCGGTCTA3201 TTCTTTTGAT TTATAAGGGA TTTTGGGGAT TTCGGCCTAT TGGTTAAAAA3251 ATGAGCTGAT TTAACAAAAA TTTAACGCGA ATTAATTCTG TGGAATGTGT3301 GTCAGTTAGG GTGTGGAAAG TCCCCAGGCT CCCCAGGCAG GCAGAAGTAT3351 GCAAAGCATG CATCTCAATT AGTCAGCAAC CAGGTGTGGA AAGTCCCCAG3401 GCTCCCCAGC AGGCAGAAGT ATGCAAAGCA TGCATCTCAA TTAGTCAGCA3451 ACCATAGTCC CGCCCCTAAC TCCGCCCATC CCGCCCCTAA CTCCGCCCAG3501 TTCCGCCCAT TCTCCGCCCC ATGGCTGACT AATTTTTTTT ATTTATGCAG3551 AGGCCGAGGC CGCCTCTGCC TCTGAGCTAT TCCAGAAGTA GTGAGGAGGC3601 TTTTTTGGAG GCCTAGGCTT TTGCAAAAAG CTCCCGGGAG CTTGTATATC3651 CATTTTCGGA TCTGATCAAG AGACAGGATG AGGATCGTTT CGCATGATTG3701 AACAAGATGG ATTGCACGCA GGTTCTCCGG CCGCTTGGGT GGAGAGGCTA3751 TTCGGCTATG ACTGGGCACA ACAGACAATC GGCTGCTCTG ATGCCGCCGT3801 GTTCCGGCTG TCAGCGCAGG GGCGCCCGGT TCTTTTTGTC AAGACCGACC3851 TGTCCGGTGC CCTGAATGAA CTGCAGGACG AGGCAGCGCG GCTATCGTGG3901 CTGGCCACGA CGGGCGTTCC TTGCGCAGCT GTGCTCGACG TTGTCACTGA3951 AGCGGGAAGG GACTGGCTGC TATTGGGCGA AGTGCCGGGG CAGGATCTCC4001 TGTCATCTCA CCTTGCTCCT GCCGAGAAAG TATCCATCAT GGCTGATGCA4051 ATGCGGCGGC TGCATACGCT TGATCCGGCT ACCTGCCCAT TCGACCACCA4101 AGCGAAACAT CGCATCGAGC GAGCACGTAC TCGGATGGAA GCCGGTCTTG4151 TCGATCAGGA TGATCTGGAC GAAGAGCATC AGGGGCTCGC GCCAGCCGAA4201 CTGTTCGCCA GGCTCAAGGC GCGCATGCCC GACGGCGAGG ATCTCGTCGT4251 GACCCATGGC GATGCCTGCT TGCCGAATAT CATGGTGGAA AATGGCCGCT4301 TTTCTGGATT CATCGACTGT GGCCGGCTGG GTGTGGCGGA CCGCTATCAG4351 GACATAGCGT TGGCTACCCG TGATATTGCT GAAGAGCTTG GCGGCGAATG4401 GGCTGACCGC TTCCTCGTGC TTTACGGTAT CGCCGCTCCC GATTCGCAGC4451 GCATCGCCTT CTATCGCCTT CTTGACGAGT TCTTCTGAGC GGGACTCTGG4501 GGTTCGAAAT GACCGACCAA GCGACGCCCA ACCTGCCATC ACGAGATTTC4551 GATTCCACCG CCGCCTTCTA TGAAAGGTTG GGCTTCGGAA TCGTTTTCCG4601 GGACGCCGGC TGGATGATCC TCCAGCGCGG GGATCTCATG CTGGAGTTCT4651 TCGCCCACCC CAACTTGTTT ATTGCAGCTT ATAATGGTTA CAAATAAAGC4701 AATAGCATCA CAAATTTCAC AAATAAAGCA TTTTTTTCAC TGCATTCTAG4751 TTGTGGTTTG TCCAAACTCA TCAATGTATC TTATCATGTC TGTATACCGT4801 CGACCTCTAG CTAGAGCTTG GCGTAATCAT GGTCATAGCT GTTTCCTGTG4851 TGAAATTGTT ATCCGCTCAC AATTCCACAC AACATACGAG CCGGAAGCAT4901 AAAGTGTAAA GCCTGGGGTG CCTAATGAGT GAGCTAACTC ACATTAATTG4951 CGTTGCGCTC ACTGCCCGCT TTCCAGTCGG GAAACCTGTC GTGCCAGCTG5001 CATTAATGAA TCGGCCAACG CGCGGGGAGA GGCGGTTTGC GTATTGGGCG5051 CTCTTCCGCT TCCTCGCTCA CTGACTCGCT GCGCTCGGTC GTTCGGCTGC5101 GGCGAGCGGT ATCAGCTCAC TCAAAGGCGG TAATACGGTT ATCCACAGAA5151 TCAGGGGATA ACGCAGGAAA GAACATGTGA GCAAAAGGCC AGCAAAAGGC5201 CAGGAACCGT AAAAAGGCCG CGTTGCTGGC GTTTTTCCAT AGGCTCCGCC5251 CCCCTGACGA GCATCACAAA AATCGACGCT CAAGTCAGAG GTGGCGAAAC5301 CCGACAGGAC TATAAAGATA CCAGGCGTTT CCCCCTGGAA GCTCCCTCGT5351 GCGCTCTCCT GTTCCGACCC TGCCGCTTAC CGGATACCTG TCCGCCTTTC5401 TCCCTTCGGG AAGCGTGGCG CTTTCTCAAT GCTCACGCTG TAGGTATCTC5451 AGTTCGGTGT AGGTCGTTCG CTCCAAGCTG GGCTGTGTGC ACGAACCCCC5501 CGTTCAGCCC GACCGCTGCG CCTTATCCGG TAACTATCGT CTTGAGTCCA5551 ACCCGGTAAG ACACGACTTA TCGCCACTGG CAGCAGCCAC TGGTAACAGG5601 ATTAGCAGAG CGAGGTATGT AGGCGGTGCT ACAGAGTTCT TGAAGTGGTG5651 GCCTAACTAC GGCTACACTA GAAGGACAGT ATTTGGTATC TGCGCTCTGC5701 TGAAGCCAGT TACCTTCGGA AAAAGAGTTG GTAGCTCTTG ATCCGGCAAA5751 CAAACCACCG CTGGTAGCGG TGGTTTTTTT GTTTGCAAGC AGCAGATTAC5801 GCGCAGAAAA AAAGGATCTC AAGAAGATCC TTTGATCTTT TCTACGGGGT5851 CTGACGCTCA GTGGAACGAA AACTCACGTT AAGGGATTTT GGTCATGAGA5901 TTATCAAAAA GGATCTTCAC CTAGATCCTT TTAAATTAAA AATGAAGTTT5951 TAAATCAATC TAAAGTATAT ATGAGTAAAC TTGGTCTGAC AGTTACCAAT6001 GCTTAATCAG TGAGGCACCT ATCTCAGCGA TCTGTCTATT TCGTTCATCC6051 ATAGTTGCCT GACTCCCCGT CGTGTAGATA ACTACGATAC GGGAGGGCTT6101 ACCATCTGGC CCCAGTGCTG CAATGATACC GCGAGACCCA CGCTCACCGG6151 CTCCAGATTT ATCAGCAATA AACCAGCCAG CCGGAAGGGC CGAGCGCAGA6201 AGTGGTCCTG CAACTTTATC CGCCTCCATC CAGTCTATTA ATTGTTGCCG6251 GGAAGCTAGA GTAAGTAGTT CGCCAGTTAA TAGTTTGCGC AACGTTGTTG6301 CCATTGCTAC AGGCATCGTG GTGTCACGCT CGTCGTTTGG TATGGCTTCA6351 TTCAGCTCCG GTTCCCAACG ATCAAGGCGA GTTACATGAT CCCCCATGTT6401 GTGCAAAAAA GCGGTTAGCT CCTTCGGTCC TCCGATCGTT GTCAGAAGTA6451 AGTTGGCCGC AGTGTTATCA CTCATGGTTA TGGCAGCACT GCATAATTCT6501 CTTACTGTCA TGCCATCCGT AAGATGCTTT TCTGTGACTG GTGAGTACTC6551 AACCAAGTCA TTCTGAGAAT AGTGTATGCG GCGACCGAGT TGCTCTTGCC6601 CGGCGTCAAT ACGGGATAAT ACCGCGCCAC ATAGCAGAAC TTTAAAAGTG6651 CTCATCATTG GAAAACGTTC TTCGGGGCGA AAACTCTCAA GGATCTTACC6701 GCTGTTGAGA TCCAGTTCGA TGTAACCCAC TCGTGCACCC AACTGATCTT6751 CAGCATCTTT TACTTTCACC AGCGTTTCTG GGTGAGCAAA AACAGGAAGG6801 CAAAATGCCG CAAAAAAGGG AATAAGGGCG ACACGGAAAT GTTGAATACT6851 CATACTCTTC CTTTTTCAAT ATTATTGAAG CATTTATCAG GGTTATTGTC6901 TCATGAGCGG ATACATATTT GAATGTATTT AGAAAAATAA ACAAATAGGG6951 GTTCCGCGCA CATTTCCCCG AAAAGTGCCA CCTGACGTCG ACGGATCGGG表11:重组质粒pIND-H-SemaL-EA的核苷酸序列(SEQ ID NO.:38) 1 AGATCTCGGC CGCATATTAA GTGCATTGTT CTCGATACCG CTAAGTGCAT 51 TGTTCTCGTT AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC101 GATGGACAAG TGCATTGTTC TCTTGCTGAA AGCTCGATGG ACAAGTGCAT151 TGTTCTCTTG CTGAAAGCTC AGTACCCGGG AGTACCCTCG ACCGCCGGAG201 TATAAATAGA GGCGCTTCGT CTACGGAGCG ACAATTCAAT TCAAACAAGC251 AAAGTGAACA CGTCGCTAAG CGAAAGCTAA GCAAATAAAC AAGCGCAGCT301 GAACAAGCTA AACAATCTGC AGTAAAGTGC AAGTTAAAGT GAATCAATTA351 AAAGTAACCA GCAACCAAGT AAATCAACTG CAACTACTGA AATCTGCCAA401 GAAGTAATTA TTGAATACAA GAAGAGAACT CTGAATACTT TCAACAAGTT451 ACCGAGAAAG AAGAACTCAC ACACAGCTAG CGTTTAAACT TAAGCTTGGT501 ACCGAGCTCG GATCCACTAG TCCAGTGTGG TGgaattcgg cttgggatga551 cgcctcctcc gcccggacgt gccgccccca gcgcaccgcg cgcccgcgtc601 cctggcccgc cggctcggtt ggggcttccg ctgcggctgc ggctgctgct651 gctgctctgg gcggccgccg cctccgccca gggccaccta aggagcggac701 cccgcatctt cgccgtctgg aaaggccatg tagggcagga ccgggtggac751 tttggccaga ctgagccgca cacggtgctt ttccacgagc caggcagctc801 ctctgtgtgg gtgggaggac gtggcaaggt ctacctcttt gacttccccg851 agggcaagaa cgcatctgtg cgcacggtga atatcggctc cacaaagggg901 tcctgtctgg ataagcggga ctgcgagaac tacatcactc tcctggagag951 gcggagtgag gggctgctgg cctgtggcac caacgcccgg caccccagct1001 gctggaacct ggtgaatggc actgtggtgc cacttggcga gatgagaggc1051 tacgccccct tcagcccgga cgagaactcc ctggttctgt ttgaagggga1101 cgaggtgtat tccaccatcc ggaagcagga atacaatggg aagatccctc1151 ggttccgccg catccggggc gagagtgagc tgtacaccag tgatactgtc1201 atgcagaacc cacagttcat caaagccacc atcgtgcacc aagaccaggc1251 ttacgatgac aagatctact acttcttccg agaggacaat cctgacaaga1301 atcctgaggc tcctctcaat gtgtcccgtg tggcccagtt gtgcaggggg1351 gaccagggtg gggaaagttc actgtcagtc tccaagtgga acacttttct1401 gaaagccatg ctggtatgca gtgatgctgc caccaacaag aacttcaaca1451 ggctgcaaga cgtcttcctg ctccctgacc ccagcggcca gtggagggac1501 accagggtct atggtgtttt ctccaacccc tggaactact cagccgtctg1551 tgtgtattcc ctcggtgaca ttgacaaggt cttccgtacc tcctcactca1601 agggctacca ctcaagcctt cccaacccgc ggcctggcaa gtgcctccca1651 gaccagcagc cgatacccac agagaccttc caggtggctg accgtcaccc1701 agaggtggcg cagagggtgg agcccatggg gcctctgaag acgccattgt1751 tccactctaa ataccactac cagaaagtgg ccgttcaccg catgcaagcc1801 agccacgggg agacctttca tgtgctttac ctaactacag acaggggcac1851 tatccacaag gtggtggaac cgggggagca ggagcacagc ttcgccttca1901 acatcatgga gatccagccc ttccgccgcg cggctgccat ccagaccatg1951 tcgctggatg ctgagcggag gaagctgtat gtgagctccc agtgggaggt2001 gagccaggtg cccctggacc tgtgtgaggt ctatggcggg ggctgccacg2051 gttgcctcat gtcccgagac ccctactgcg gctgggacca gggccgctgc2101 atctccatct acagctccga acggtcagtg ctgcaatcca ttaatccagc2151 cgagccacac aaggagtgtc ccaaccccaa accagacaag gccccactgc2201 agaaggtttc cctggcccca aactctcgct actacctgag ctgccccatg2251 gaatcccgcc acgccaccta ctcatggcgc cacaaggaga acgtggagca2301 gagctgcgaa cctggtcacc agagccccaa ctgcatcctg ttcatcgaga2351 acctcacggc gcagcagtac ggccactact tctgcgaggc ccaggagggc2401 tcctacttcc gcgaggctca gcactggcag ctgctgcccg aggacggcat2451 catggccgag cacctgctgg gtcatgcctg tgccctggct gcctccctct2501 ggctgggggt gctgcccaca ctcactcttg gcttgctggt ccacgtgaag2551 cttGGGCCCG AACAAAAACT CATCTCAGAA GAGGATCTGA ATAGCGCCGT2601 CGACCATCAT CATCATCATC ATTGAGTTTA TCCAGCACAG TGGCGGCCGC2651 TCGAGTCTAG AGGGCCCGTT TAAACCCGCT GATCAGCCTC GACTGTGCCT2701 TCTAGTTGCC AGCCATCTGT TGTTTGCCCC TCCCCCGTGC CTTCCTTGAC2751 CCTGGAAGGT GCCACTCCCA CTGTCCTTTC CTAATAAAAT GAGGAAATTG2801 CATCGCATTG TCTGAGTAGG TGTCATTCTA TTCTGGGGGG TGGGGTGGGG2851 CAGGACAGCA AGGGGGAGGA TTGGGAAGAC AATAGCAGGC ATGCTGGGGA2901 TGCGGTGGGC TCTATGGCTT CTGAGGCGGA AAGAACCAGC TGGGGCTCTA2951 GGGGGTATCC CCACGCGCCC TGTAGCGGCG CATTAAGCGC GGCGGGTGTG3001 GTGGTTACGC GCAGCGTGAC CGCTACACTT GCCAGCGCCC TAGCGCCCGC3051 TCCTTTCGCT TTCTTCCCTT CCTTTCTCGC CACGTTCGCC GGCTTTCCCC3101 GTCAAGCTCT AAATCGGGGC ATCCCTTTAG GGTTCCGATT TAGTGCTTTA3151 CGGCACCTCG ACCCCAAAAA ACTTGATTAG GGTGATGGTT CACGTAGTGG3201 GCCATCGCCC TGATAGACGG TTTTTCGCCC TTTGACGTTG GAGTCCACGT3251 TCTTTAATAG TGGACTCTTG TTCCAAACTG GAACAACACT CAACCCTATC3301 TCGGTCTATT CTTTTGATTT ATAAGGGATT TTGGGGATTT CGGCCTATTG3351 GTTAAAAAAT GAGCTGATTT AACAAAAATT TAACGCGAAT TAATTCTGTG3401 GAATGTGTGT CAGTTAGGGT GTGGAAAGTC CCCAGGCTCC CCAGGCAGGC3451 AGAAGTATGC AAAGCATGCA TCTCAATTAG TCAGCAACCA GGTGTGGAAA3501 GTCCCCAGGC TCCCCAGCAG GCAGAAGTAT GCAAAGCATG CATCTCAATT3551 AGTCAGCAAC CATAGTCCCG CCCCTAACTC CGCCCATCCC GCCCCTAACT3601 CCGCCCAGTT CCGCCCATTC TCCGCCCCAT GGCTGACTAA TTTTTTTTAT3651 TTATGCAGAG GCCGAGGCCG CCTCTGCCTC TGAGCTATTC CAGAAGTAGT3701 GAGGAGGCTT TTTTGGAGGC CTAGGCTTTT GCAAAAAGCT CCCGGGAGCT3751 TGTATATCCA TTTTCGGATC TGATCAAGAG ACAGGATGAG GATCGTTTCG3801 CATGATTGAA CAAGATGGAT TGCACGCAGG TTCTCCGGCC GCTTGGGTGG3851 AGAGGCTATT CGGCTATGAC TGGGCACAAC AGACAATCGG CTGCTCTGAT3901 GCCGCCGTGT TCCGGCTGTC AGCGCAGGGG CGCCCGGTTC TTTTTGTCAA3951 GACCGACCTG TCCGGTGCCC TGAATGAACT GCAGGACGAG GCAGCGCGGC4001 TATCGTGGGT GGCCACGAGG GGCGTTCCTT GCGCAGCTGT GCTCGACGTT4051 GTCACTGAAG CGGGAAGGGA CTGGCTGCTA TTGGGCGAAG TGCCGGGGCA4101 GGATCTCCTG TCATCTCACC TTGCTCCTGC CGAGAAAGTA TCCATCATGG4151 CTGATGCAAT GCGGCGGCTG CATACGCTTG ATCCGGCTAC CTGCCCATTC4201 GACCACCAAG CGAAACATCG CATCGAGCGA GCACGTACTC GGATGGAAGC4251 CGGTCTTGTC GATCAGGATG ATCTGGACGA AGAGCATCAG GGGCTCGCGC4301 CAGCCGAACT GTTCGCCAGG CTCAAGGCGC GCATGCCCGA CGGCGAGGAT4351 CTCGTCGTGA CCCATGGCGA TGCCTGCTTG CCGAATATCA TGGTGGAAAA4401 TGGCCGCTTT TCTGGATTCA TCGACTGTGG CCGGCTGGGT GTGGCGGACC4451 GCTATCAGGA CATAGCGTTG GCTACCCGTG ATATTGCTGA AGAGCTTGGC4501 GGCGAATGGG CTGACCGCTT CCTCGTGCTT TACGGTATCG CCGCTCCCGA4551 TTCGCAGCGC ATCGCCTTCT ATCGCCTTCT TGACGAGTTC TTCTGAGCGG4601 GACTCTGGGG TTCGAAATGA CCGACCAAGC GACGCCCAAC CTGCCATCAC4651 GAGATTTCGA TTCCACCGCC GCCTTCTATG AAAGGTTGGG CTTCGGAATC4701 GTTTTCCGGG ACGCCGGCTG GATGATCCTC CAGCGCGGGG ATCTCATGCT4751 GGAGTTCTTC GCCCACCCCA ACTTGTTTAT TGCAGCTTAT AATGGTTACA4801 AATAAAGCAA TAGCATCACA AATTTCACAA ATAAAGCATT TTTTTCACTG4851 CATTCTAGTT GTGGTTTGTC CAAACTCATC AATGTATCTT ATCATGTCTG4901 TATACCGTCG ACCTCTAGCT AGAGCTTGGC GTAATCATGG TCATAGCTGT4951 TTCCTGTGTG AAATTGTTAT CCGCTCACAA TTCCACACAA CATACGAGCC5001 GGAAGCATAA AGTGTAAAGC CTGGGGTGCC TAATGAGTGA GCTAACTCAC5051 ATTAATTGCG TTGCGCTCAC TGCCCGCTTT CCAGTCGGGA AACCTGTCGT5101 GCCAGCTGCA TTAATGAATC GGCCAACGCG CGGGGAGAGG CGGTTTGCGT5151 ATTGGGCGCT CTTCCGCCTC CTCGCTCACT GACTCGCTGC GCTCGGTCGT5201 TCGGCTGCGG CGAGCGGTAT CAGCTCACTC AAAGGCGGTA ATACGGTTAT5251 CCACAGAATC AGGGGATAAC GCAGGAAAGA ACATGTGAGC AAAAGGCCAG5301 CAAAAGGCCA GGAACCGTAA AAAGGCCGCG TTGCTGGCGT TTTTCCATAG5351 GCTCCGCCCC CCTGACGAGC ATCACAAAAA TCGACGCTCA AGTCAGAGGT5401 GGCGAAACCC GACAGGACTA TAAAGATACC AGGCGTTTCC CCCTGGAAGC5451 TCCCTCGTGC GCTCTCCTGT TCCGACCCTG CCGCTTACCG GATACCTGTC5501 CGCCTTTCTC CCTTCGGGAA GCGTGGCGCT TTCTCAATGC TCACGCTGTA5551 GGTATCTCAG TTCGGTGTAG GTCGTTCGCT CCAAGCTGGG CTGTGTGCAC5601 GAACCCCCCG TTCAGCCCGA CCGCTGCGCC TTATCCGGTA ACTATCGTCT5651 TGAGTCCAAC CCGGTAAGAC ACGACTTATC GCCACTGGCA GCAGCCACTG5701 GTAACAGGAT TAGCAGAGCG AGGTATGTAG GCGGTGCTAC AGAGTTCTTG5751 AAGTGGTGGC CTAACTACGG CTACACTAGA AGGACAGTAT TTGGTATCTG5801 CGCTCTGCTG AAGCCAGTTA CCTTCGGAAA AAGAGTTGGT AGCTCTTGAT5851 CCGGCAAACA AACCACCGCT GGTAGCGGTG GTTTTTTTGT TTGCAAGCAG5901 CAGATTACGC GCAGAAAAAA AGGATCTCAA GAAGATCCTT TGATCTTTTC5951 TACGGGGTCT GACGCTCAGT GGAACGAAAA CTCACGTTAA GGGATTTTGG6001 TCATGAGATT ATCAAAAAGG ATCTTCACCT AGATCCTTTT AAATTAAAAA6051 TGAAGTTTTA AATCAATCTA AAGTATATAT GAGTAAACTT GGTCTGACAG6101 TTACCAATGC TTAATCAGTG AGGCACCTAT CTCAGCGATC TGTCTATTTC6151 GTTCATCCAT AGTTGCCTGA CTCCCCGTCG TGTAGATAAC TACGATACGG6201 GAGGGCTTAC CATCTGGCCC CAGTGCTGCA ATGATACCGC GAGACCCACG6251 CTCACCGGCT CCAGATTTAT CAGCAATAAA CCAGCCAGCC GGAAGGGCCG6301 AGCGCAGAAG TGGTCCTGCA ACTTTATCCG CCTCCATCCA GTCTATTAAT6351 TGTTGCCGGG AAGCTAGAGT AAGTAGTTCG CCAGTTAATA GTTTGCGCAA6401 CGTTGTTGCC ATTGCTACAG GCATCGTGGT GTCACGCTCG TCGTTTGGTA6451 TGGCTTCATT CAGCTCCGGT TCCCAACGAT CAAGGCGAGT TACATGATCC6501 CCCATGTTGT GCAAAAAAGC GGTTAGCTCC TTCGGTCCTC CGATCGTTGT6551 CAGAAGTAAG TTGGCCGCAG TGTTATCACT CATGGTTATG GCAGCACTGC6601 ATAATTCTCT TACTGTCATG CCATCCGTAA GATGCTTTTC TGTGACTGGT6651 GAGTACTCAA CCAAGTCATT CTGAGAATAG TGTATGCGGC GACCGAGTTG6701 CTCTTGCCCG GCGTCAATAC GGGATAATAC CGCGCCACAT AGCAGAACTT6751 TAAAAGTGCT CATCATTGGA AAACGTTCTT CGGGGCGAAA ACTCTCAAGG6801 ATCTTACCGC TGTTGAGATC CAGTTCGATG TAACCCACTC GTGCACCCAA6851 CTGATCTTCA GCATCTTTTA CTTTCACCAG CGTTTCTGGG TGAGCAAAAA6901 CAGGAAGGCA AAATGCCGCA AAAAAGGGAA TAAGGGCGAC ACGGAAATGT6951 TGAATACTCA TACTCTTCCT TTTTCAATAT TATTGAAGCA TTTATCAGGG7001 TTATTGTCTC ATGAGCGGAT ACATATTTGA ATGTATTTAG AAAAATAAAC7051 AAATAGGGGT TCCGCGCACA TTTCCCCGAA AAGTGCCACC TGACGTCGAC7101 GGATCGGG表12:重组质粒pQE30-H-SemaL-BH的序列(SEQ ID NO.:39) 1 CTCGAGAAAT CATAAAAAAT TTATTTGCTT TGTGAGCGGA TAACAATTAT 51 AATAGATTCA ATTGTGAGCG GATAACAATT TCACACAGAA TTCATTAAAG101 AGGAGAAATT AACTATGAGA GGATCGCATC ACCATCACCA TCACGGAtcc151 ctggttctgt ttgaagggga cgaggtgtat tccaccatcc ggaagcagga201 atacaatggg aagatccctc ggttccgccg catccggggc gagagtgagc251 tgtacaccag tgatactgtc atgcagaacc cacagttcat caaagccacc301 atcgtgcacc aagaccaggc ttacgatgac aagatctact acttcttccg351 agaggacaat cctgacaaga atcctgaggc tcctctcaat gtgtcccgtg401 tggcccagtt gtgcaggggg gaccagggtg gggaaagttc actgtcagtc451 tccaagtgga acacttttct gaaagccatg ctggtatgca gtgatgctgc501 caccaacaag aacttcaaca ggctgcaaga cgtcttcctg ctccctgacc551 ccagcggcca gtggagggac accagggtct atggtgtttt ctccaacccc601 tggaactact cagccgtctg tgtgtattcc ctcggtgaca ttgacaaggt651 cttccgtacc tcctcactca agggctacca ctcaagcctt cccaacccgc701 ggcctggcaa gtgcctccca gaccagcagc cgatacccac agaAAGCTTA751 ATTAGCTGAG CTTGGACTCC TGTTGATAGA TCCAGTAATG ACCTCAGAAC801 TCCATCTGGA TTTGTTCAGA ACGCTCGGTT GCCGCCGGGC GTTTTTTATT851 GGTGAGAATC CAAGCTAGCT TGGCGAGATT TTCAGGAGCT AAGGAAGCTA901 AAATGGAGAA AAAAATCACT GGATATACCA CCGTTGATAT ATCCCAATGG951 CATCGTAAAG AACATTTTGA GGCATTTCAG TCAGTTGCTC AATGTACCTA1001 TAACCAGACC GTTCAGCTGG ATATTACGGC CTTTTTAAAG ACCGTAAAGA1051 AAAATAAGCA CAAGTTTTAT CCGGCCTTTA TTCACATTCT TGCCCGCCTG1101 ATGAATGCTC ATCCGGAATT TCGTATGGCA ATGAAAGACG GTGAGCTGGT1151 GATATGGGAT AGTGTTCACC CTTGTTACAC CGTTTTCCAT GAGCAAACTG1201 AAACGTTTTC ATCGCTCTGG AGTGAATACC ACGACGATTT CCGGCAGTTT1251 CTACACATAT ATTCGCAAGA TGTGGCGTGT TACGGTGAAA ACCTGGCCTA1301 TTTCCCTAAA GGGTTTATTG AGAATATGTT TTTCGTCTCA GCCAATCCCT1351 GGGTGAGTTT CACCAGTTTT GATTTAAACG TGGCCAATAT GGACAACTTC1401 TTCGCCCCCG TTTTCACCAT GGGCAAATAT TATACGCAAG GCGACAAGGT1451 GCTGATGCCG CTGGCGATTC AGGTTCATCA TGCCGTCTGT GATGGCTTCC1501 ATGTCGGCAG AATGCTTAAT GAATTACAAC AGTACTGCGA TGAGTGGCAG1551 GGCGGGGCGT AATTTTTTTA AGGCAGTTAT TGGTGCCCTT AAACGCCTGG1601 GGTAATGACT CTCTAGCTTG AGGCATCAAA TAAAACGAAA GGCTCAGTCG1651 AAAGACTGGG CCTTTCGTTT TATCTGTTGT TTGTCGGTGA ACGCTCTCCT1701 GAGTAGGACA AATCCGCCGC TCTAGAGCTG CCTCGCGCGT TTCGGTGATG1751 ACGGTGAAAA CCTCTGACAC ATGCAGCTCC CGGAGACGGT CACAGCTTGT1801 CTGTAAGCGG ATGCCGGGAG CAGACAAGCC CGTCAGGGCG CGTCAGCGGG1851 TGTTGGCGGG TGTCGGGGCG CAGCCATGAC CCAGTCACGT AGCGATAGCG1901 GAGTGTATAC TGGCTTAACT ATGCGGCATC AGAGCAGATT GTACTGAGAG1951 TGCACCATAT GCGGTGTGAA ATACCGCACA GATGCGTAAG GAGAAAATAC2001 CGCATCAGGC GCTCTTCCGC TTCCTCGCTC ACTGACTCGC TGCGCTCGGT2051 CTGTCGGCTG CGGCGAGCGG TATCAGCTCA CTCAAAGGCG GTAATACGGT2101 TATCCACAGA ATCAGGGGAT AACGCAGGAA AGAACATGTG AGCAAAAGGC2151 CAGCAAAAGG CCAGGAACCG TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA2201 TAGGCTCCGC CCCCCTGACG AGCATCACAA AAATCGACGC TCAAGTCAGA2251 GGTGGCGAAA CCCGACAGGA CTATAAAGAT ACCAGGCGTT TCCCCCTGGA2301 AGCTCCCTCG TGCGCTCTCC TGTTCCGACC CTGCCGCTTA CCGGATACCT2351 GTCCGCCTTT CTCCCTTCGG GAAGCGTGGC GCTTTCTCAA TGCTCACGCT2401 GTAGGTATCT CAGTTCGGTG TAGGTCGTTC GCTCCAAGCT GGGCTGTGTG2451 CACGAACCCC CCGTTCAGCC CGACCGCTGC GCCTTATCCG GTAACTATCG2501 TCTTGAGTCC AACCCGGTAA GACACGACTT ATCGCCACTG GCAGCAGCCA2551 CTGGTAACAG GATTAGCAGA GCGAGGTATG TAGGCGGTGC TACAGAGTTC2601 TTGAAGTGGT GGCCTAACTA CGGCTACACT AGAAGGACAG TATTTGGTAT2651 CTGCGCTCTG CTGAAGCCAG TTACCTTCGG AAAAAGAGTT GGTAGCTCTT2701 GATCCGGCAA ACAAACCACC GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG2751 CAGCAGATTA CGCGCAGAAA AAAAGGATCT CAAGAAGATC CTTTGATCTT2801 TTCTACGGGG TCTGACGCTC AGTGGAACGA AAACTCACGT TAAGGGATTT2851 TGGTCATGAG ATTATCAAAA AGGATCTTCA CCTAGATCCT TTTAAATTAA2901 AAATGAAGTT TTAAATCAAT CTAAAGTATA TATGAGTAAA CTTGGTCTGA2951 CAGTTACCAA TGCTTAATCA GTGAGGCACC TATCTCAGCG ATCTGTCTAT3001 TTCGTTCATC CATAGCTGCC TGACTCCCCG TCGTGTAGAT AACTACGATA3051 CGGGAGGGCT TACCATCTGG CCCCAGTGCT GCAATGATAC CGCGAGACCC3101 ACGCTCACCG GCTCCAGATT TATCAGCAAT AAACCAGCCA GCCGGAAGGG3151 CCGAGCGCAG AAGTGGTCCT GCAACTTTAT CCGCCTCCAT CCAGTCTATT3201 AATTGTTGCC GGGAAGCTAG AGTAAGTAGT TCGCCAGTTA ATAGTTTGCG3251 CAACGTTGTT GCCATTGCTA CAGGCATCGT GGTGTCACGC TCGTCGTTTG3301 GTATGGCTTC ATTCAGCTCC GGTTCCCAAC GATCAAGGCG AGTTACATGA3351 TCCCCCATGT TGTGCAAAAA AGCGGTTAGC TCCTTCGGTC CTCCGATCGT3401 TGTCAGAAGT AAGTTGGCCG CAGTGTTATC ACTCATGGTT ATGGCAGCAC3451 TGCATAATTC TCTTACTGTC ATGCCATCCG TAAGATGCTT TTCTGTGACT3501 GGTGAGTACT CAACCAAGTC ATTCTGAGAA TAGTGTATGC GGCGACCGAG3551 TTGCTCTTGC CCGGCGTCAA TACGGGATAA TACCGCGCCA CATAGCAGAA3601 CTTTAAAAGT GCTCATCATT GGAAAACGTT CTTCGGGGCG AAAACTCTCA3651 AGGATCTTAC CGCTGTTGAG ATCCAGTTCG ATGTAACCCA CTCGTGCACC5701 CAACTGATCT TCAGCATCTT TTACTTTCAC CAGCGTTTCT GGGTGAGCAA3751 AAACAGGAAG GCAAAATGCC GCAAAAAAGG GAATAAGGGC GACACGGAAA3801 TGTTGAATAC TCATACTCTT CCTTTTTCAA TATTATTGAA GCATTTATCA3851 GGGTTATTGT CTCATGAGCG GATACATATT TGAATGTATT TAGAAAAATA3901 AACAAATAGG GGTTCCGCGC ACATTTCCCC GAAAAGTGCC ACCTGACGTC3951 TAAGAAACCA TTATTATCAT GACATTAACC TATAAAAATA GGCGTATCAC4001 GAGGCCCTTT CGTCTTCAC表13:重组质粒pQE31-H-SemaL-SH的序列(SEQ ID NO.:40) 1 CTCGAGAAAT CATAAAAAAT TTATTTGCTT TGTGAGCGGA TAACAATTAT 51 AATAGATTCA ATTGTGAGCG GATAACAATT TCACACAGAA TTCATTAAAG101 AGGAGAAATT AACTATGAGA GGATCGCATC ACCATCACCA TCACACGGAT151 CCGCATGCga gctcccagtg ggaggtgagc caggtgcccc tggacctgtg201 tgaggtctat ggcgggggct gccacggttg cctcatgtcc cgagacccct251 actgcggctg ggaccagggc cgctgcatct ccatctacag ctccgaacgg301 tcagtgctgc aatccattaa tccagccgag ccacacaagg agtgtcccaa351 ccccaaacca gacaaggccc cactgcagaa ggtttccctg gccccaaact401 ctcgctacta cctgagctgc cccatggaat cccgccacgc cacctactca451 tggcgccaca aggagaacgt ggagcagagc tgcgaacctg gtcaccagag501 ccccaactgc atcctgttca tcgagaacct cacggcgcag cagtacggcc551 actacttctg cgaggcccag gagggctcct acttccgcga ggctcagcac601 tggcagctgc tgcccgagga cggcatcatg gccgagcacc tgctgggtca651 tgcctgtgcc ctggctgcct ccctctggct gggggtgctg cccacactca701 ctcttggctt gctggtccac gtgaagcttA ATTAGCTGAG CTTGGACTCC751 TGTTGATAGA TCCAGTAATG ACCTCAGAAC TCCATCTGGA TTTGTTCAGA801 ACGCTCGGTT GCCGCCGGGC GTTTTTTATT GGTGAGAATC CAAGCTAGCT851 TGGCGAGATT TTCAGGAGCT AAGGAAGCTA AAATGGAGAA AAAAATCACT901 GGATATACCA CCGTTGATAT ATCCCAATGG CATCGTAAAG AACATTTTGA951 GGCATTTCAG TCAGTTGCTC AATGTACCTA TAACCAGACC GTTCAGCTGG1001 ATATTACGGC CTTTTTAAAG ACCGTAAAGA AAAATAAGCA CAAGTTTTAT1051 CCGGCCTTTA TTCACATTCT TGCCCGCCTG ATGAATGCTC ATCCGGAATT1101 TCGTATGGCA ATGAAAGACG GTGAGCTGGT GATATGGGAT AGTGTTCACC 1151 CTTGTTACAC CGTTTTCCAT GAGCAAACTG AAACGTTTTC ATCGCTCTGG1201 AGTGAATACC ACGACGATTT CCGGCAGTTT CTACACATAT ATTCGCAAGA1251 TGTGGCGTGT TACGGTGAAA ACCTGGCCTA TTTCCCTAAA GGGTTTATTG1301 AGAATATGTT TTTCGTCTCA GCCAATCCCT GGGTGAGTTT CACCAGTTTT1351 GATTTAAACG TGGCCAATAT GGACAACTTC TTCGCCCCCG TTTTCACCAT1401 GGGCAAATAT TATACGCAAG GCGACAAGGT GCTGATGCCG CTGGCGATTC1451 AGGTTCATCA TGCCGTCTGT GATGGCTTCC ATGTCGGCAG AATGCTTAAT1501 GAATTACAAC AGTACTGCGA TGAGTGGCAG GGCGGGGCGT AATTTTTTTA1551 AGGCAGTTAT TGGTGCCCTT AAACGCCTGG GGTAATGACT CTCTAGCTTG1601 AGGCATCAAA TAAAACGAAA GGCTCAGTCG AAAGACTGGG CCTTTCGTTT1651 TATCTGTTGT TTGTCGGTGA ACGCTCTCCT GAGTAGGACA AATCCGCCGC1701 TCTAGAGCTG CCTCGCGCGT TTCGGTGATG ACGGTGAAAA CCTCTGACAC1751 ATGCAGCTCC CGGAGACGGT CACAGCTTGT CTGTAAGCGG ATGCCGGGAG1801 CAGACAAGCC CGTCAGGGCG CGTGAGCGGG TGTTGGCGGG TGTCGGGGCG1851 CAGCCATGAC CCAGTCACGT AGCGATAGCG GAGTGTATAC TGGCTTAACT1901 ATGCGGCATC AGAGCAGATT GTACTGAGAG TGCACCATAT GCGGTGTGAA1951 ATACCGCACA GATGCGTAAG GAGAAAATAC CGCATCAGGC GCTCTTCCGC2001 TTCCTCGCTC ACTGACTCGC TGCGCTCGGT CTGTCGGCTG CGGCGAGCGG2051 TATCAGCTCA CTCAAAGGCG GTAATACGGT TATCCACAGA ATCAGGGGAT2101 AACGCAGGAA AGAACATGTG AGCAAAAGGC CAGCAAAAGG CCAGGAACCG2151 TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA TAGGCTCCGC CCCCCTGACG2201 AGCATCACAA AAATCGACGC TCAAGTCAGA GGTGGCGAAA CCCGACAGGA2251 CTATAAAGAT ACCAGGCGTT TCCCCCTGGA AGCTCCCTCG TGCGCTCTCC2301 TGTTCCGACC CTGCCGCTTA CCGGATACCT GTCCGCCTTT CTCCCTTCGG2351 GAAGCGTGGC GCTTTCTCAA TGCTCACGCT GTAGGTATCT CAGTTCGGTG2401 TAGGTCGTTC GCTCCAAGCT GGGCTGTGTG CACGAACCCC CCGTTCAGCC2451 CGACCGCTGC GCCTTATCCG GTAACTATGG TCTTGAGTCC AACCCGGTAA2501 GACACGACTT ATCGCCACTG GCAGCAGCCA CTGGTAACAG GATTAGCAGA2551 GCGAGGTATG TAGGCGGTGC TACAGAGTTC TTGAAGTGGT GGCCTAACTA2601 CGGCTACACT AGAAGGACAG TATTTGGTAT CTGCGCTCTG CTGAAGCCAG2651 TTACCTTCGG AAAAAGAGTT GGTAGCTCTT GATCCGGCAA ACAAACCACC2701 GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG CAGCAGATTA CGCGCAGAAA2751 AAAAGGATCT CAAGAAGATC CTTTGATCTT TTCTACGGGG TCTGACGCTC2801 AGTGGAACGA AAACTCACGT TAAGGGATTT TGGTCATGAG ATTATCAAAA2851 AGGATCTTCA CCTAGATCCT TTTAAATTAA AAATGAAGTT TTAAATCAAT2901 CTAAAGTATA TATGAGTAAA CTTGGTCTGA CAGTTACCAA TGCTTAATCA2951 GTGAGGCACC TATCTCAGCG ATCTGTCTAT TTCGTTCATC CATAGCTGCC3001 TGACTCCCCG TCGTGTAGAT AACTACGATA CGGGAGGGCT TACCATCTGG3051 CCCCAGTGCT GCAATGATAC CGCGAGACCC ACGCTCACCG GCTCCAGATT3101 TATCAGCAAT AAACCAGCCA GCCGGAAGGG CCGAGCGCAG AAGTGGTCCT3151 GCAACTTTAT CCGCCTCCAT CCAGTCTATT AATTGTTGCC GGGAAGCTAG3201 AGTAAGTAGT TCGCCAGTTA ATAGTTTGCG CAACGTTGTT GCCATTGCTA3251 CAGGCATCGT GGTGTCACGC TCGTCGTTTG GTATGGCTTC ATTCAGCTCC3301 GGTTCCCAAC GATCAAGGCG AGTTACATGA TCCCCCATGT TGTGCAAAAA3351 AGCGGTTAGC TCCTTCGGTC CTCCGATCGT TGTCAGAAGT AAGTTGGCCG3401 CAGTGTTATC ACTCATGGTT ATGGCAGCAC TGCATAATTC TCTTACTGTC3451 ATGCCATCCG TAAGATGCTT TTCTGTGACT GGTGAGTACT CAACCAAGTC3501 ATTCTGAGAA TAGTGTATGC GGCGACCGAG TTGCTCTTGC CCGGCGTCAA3551 TACGGGATAA TACCGCGCCA CATAGCAGAA CTTTAAAAGT GCTCATCATT3601 GGAAAACGTT CTTCGGGGCG AAAACTCTCA AGGATCTTAC CGCTGTTGAG3651 ATCCAGTTCG ATGTAACCCA CTCGTGCACC CAACTGATCT TCAGCATCTT3701 TTACTTTCAC CAGCGTTTCT GGGTGAGCAA AAACAGGAAG GCAAAATGCC3751 GCAAAAAAGG GAATAAGGGC GACACGGAAA TGTTGAATAC TCATACTCTT3801 CCTTTTTCAA TATTATTGAA GCATTTATCA GGGTTATTGT CTCATGAGCG3851 GATACATATT TGAATGTATT TAGAAAAATA AACAAATAGG GGTTCCGCGC3901 ACATTTCCCC GAAAAGTGCC ACCTGACGTC TAAGAAACCA TTATTATCAT3951 GACATTAACC TATAAAAATA GGCGTATCAC GAGGCCCTTT CGTCTTCAC表14:人信息素L基团的(部分)核苷酸序列(8888个核苷酸)(SEQ ID NO.:41)GAGCCGCACACGGTGCTTTTCCACGAGCCAGGCAGCTCCTCTGTGTGGGTGGGAGGACGTGGCAAGGTCTACCTCTTTGACTTCCCCGAGGGCAAGAACGCATCTGTGCGCACGGTGAGCCTCTCTCTTCCCCCAACACCCCCCCTACCCTCTTATCTCCCCTCTGGCCCTGCCAAGGGTCCTCAGGGAATCCGAGGGAGCTGGCTTCTCTTCCTAAACTGCCCCCACCTCCGTATCCTATAAATGGCTCCTGGGGGAGGCTCCCTAAAGGTAGTCCAGATTGGAGTGGGGAGCTGGGGCGGTGTGGAGAAAAACAGGAGCTAATGGGCCTGGCCAGCTGGGCAGCGCTGCTGCGGAAAGCCCAGGCTGGAAGCTGGGCCCCAGAGCCCATGCCTGGTCTTCTGAACCCTCTGGGCCTCAGCTCTGGATATGAGACCCTGTTTGACCTCAGGTAGATCACTCACCCTCTCAGAGCCCCAGTTGCTCATCTGTCAGATGAGAATAATGGTTGCTTCCTTTGGGGCTTATCCTGAGGCTGTGTGGAAAGCATTTCAGGGGTACCTCACCCCTGGCAGATTGAACTAATGCTTCTCCCCTTCCCCAGGTGAATATCGGCTCCACAAAGGGGTCCTGTCTGGATAAGCGGGTGAGCGGGGGAGGGATCTGGAGGGGTCTGAGCCACTTGGTAAAGGGAGAGGAGACCCTGAGGGTCTAAGGAAGGAAGCATGGCCCTGCCCCACGAGTCCCAGACTGATGGGGAGACGTGGTCCTCTGTGCTTAGGGGATGGCGTCAGCTGCACACACTCTGGGCTGTCCCGGGAGGCTGTCACCTATGCTAAGCCCTTCTGACACCTTCTTCCCTGATCCTGGGGGTCCTAGTGCTAGGCTTGCCAGGGCCTTCCAGCAACCAATTTCTCTCCTCCCTTCTCTCTTCCCCGGGCAGGACTGCGAGAACTACATCACTCTCCTGGAGAGGCGGAGTGAGGGGCTGCTGGCCTGTGGCACCAACGCCCGGCACCCCAGCTGCTGGAACCTGGTGAGAAGGCTGCTCCCCATGTGCCTGATCAGCTCACCTTCTACTGCGTGGGCTTCTGCCCCTCATGGTGGGAAGGAGATGGCGAGACTCCAATGCTGGCCTTGCCCTGGGAGGATGGGGCTCCTGGCCGAGAAACTGGCCGTCATGGGAGGCAGTGGCTGTGGGATTATGTGGCCATCCAACCCTCTGGATCTCCCACAGGTGAATGGCACTGTGGTGCCACTTGGCGAGATGAGAGGCTACGCCCCCTTCAGCCCGGACGAGAACTCCCTGGTTCTGTTTGAAGGTTGGGGCATGCTTCGGAACTGGGCTGGGAGCAGGATGGTCAGCTCTTTGTCCAGTGTCCGGAGGAGGGACTTCCAGGAGCTGCCTGCCCTTACTCATTTCTCCCTCCCACTGACCCCAGGGGACGAGGTGTATTCCACCATCCGGAAGCAGGAATACAATGGGAAGATCCCTCGGTTCCGCCGCATCCGGGGCGAGAGTGAGCTGTACACCAGTGATACTGTCATGCAGAGTGAGTCAGGCTCCGGCTGGGCTGAGGGTGGGCAAGGGGGTGTGAGCACTTAAGGTGGCAGATGGGATCCTGATGTTTCTGGGAGGGCTCCCTGAGGGCCGCTGGGGCCATGCAGGAAAGCAGGACCTTGGTATAGGCCTGAGAAGTTAGGGTTGGCTGGGAGCAGAGGAACAGACAAGGTATAGCAGTGGGATGGGCCCAGCCCTCTTCAGGAACACAAACAGAGGGAGCCCCAGACCCAGTGCAGGGTCCCCAGGAGCCAAAGTTTATCCTCTGCTGAGTTCACGTGGAGGCAGCCCCCCAACTCCCTCCTCATCAGGGCTCTGCCAATTGAGCAGAAGTGACATAGGGGCCCCCAGGGACCTTCCCCCACTCCCCAGGCATGAAGTCATTGCTCCTGGGCCGATGACATCTTTGTAGGAAGAGGGCAAAACAGGTGTGGGGTGGAGGTGCAGGGTCTAGGGCCCCTCGGGGAGTTGGACCTGATGTTATGAGTCCTATTCCAGATCTGATTTGCCATGGTTTGTGCAGACCCGAAGGAGGGAGGAGAGTGTGCAGGGTTGGAATGGTCTCCCGGGCAAGCTTCCCAGCCTTACGCCCATTCGCTTCTGTGCCCTGGCAGACCCACAGTTCATCAAAGCCACCATCGTGCACCAAGACCAGGCTTACGATGACAAGATCTACTACTTCTTCCGAGAGGACAATCCTGACAAGAATCCTGAGGCTCCTCTCAATGTGTCCCGTGTGGCCCAGTTGTGCAGGGTGAACACGGGCGTGAGGGCTGCTGGCTACGTGTCTGTGCATGAATAGGCCTGAGTGAGGGTGAGTTCTGTGTGTCCGTGTGCATGTAGAAGTTGTGTGGATGTATGAGTGGGTCTGTGTCAGGGACTGTGGGAGCAGCTGTGTGTGCATGGAGCATCATGTGTCTGTGTGTGGGTAAAGGTGGCTGAGCTCCTGTGCACGTATGATGGCGTGTGAGCGTGTGTATGATGGGGTGTGTGTGTGTGTGTGTGTGTGTGTTTTGCCTGTGTGAATGTGCTGTGCCACGTATGTGGGTGCGTGAGTCAGTAAATGTGTGTCTGAGTCCGTCTGCTCTGTGGGGACCTGGCACTCTCACCTGCCCTGACCCTGGGCACTGCTGGCCCTGGGCTCTGGATCAGCCAGGCCTGCTTGCAGGAGTCTCATCTGGAGACCTGCCCTGAGTCCTGGGGCACCCCCGGCAGGTCCTGGCCCCTCGCAGCCTGCCTTCCTCCTCTGGGCCCAGGTGTTGATATTGCTGGCAGTGGTTTCCTGGGGTGTGTGGGGAAGCCCGGGCAGGTGCTGAGGGGCCTCTTCTCCCCTCTACCCTTCCAGGGGGACCAGGGTGGGGAAAGTTCACTGTCAGTCTCCAAGTGGAACACTTTTCTGAAAGCCATGCTGGTATGCAGTGATGCTGCCACCAACAAGAACTTCAACAGGCTGCAAGACGTCTTCCTGCTCCCTGACCCCAGCGGCCAGTGGAGGGACACCAGGGTCTATGGTGTTTTCTCCAACCCCTGGTGAGTGGCCCTTGTCCTGGGGCCGGGGCTGGCATTGGTTCAGTGTCCAGTAGGGACAGGAGGCCTTGGGCCCTGCTGAGGGCCTCCCTGGTGTGGCAGGAGCAGGGGCTGCAGGCTCAAGAGGCTGGGCTGTTGCTGGGTGTGGGGTGGGGGGACAGCCAGTGCGATGTATGTACTGTTGTGTGAGTGAGTCTGCACTCATGGGTGTGTGTGCATGCCCTATATGCACACTCATGACTGCACTTGTGCCTGTGTGTCCCACCACCTGCTTGTGCCGAGAGTGGACACTGGGCCCAGGAGGAAGCTGCTGAAGCATCTCTCGGGGAGCTGGGTGCTATTACACCTGCTCAGGCACTGCCTGAGCCCGATAATTCACACTTCTTAATCACTCTCATTGATTGAACACACGGCAGGCGGAAGTGTTGGGTGTGTGTGGGGAGAGTTAGGGATAGAGTGGAGGAAGCCAAGACCCTGCTCTGTGGCTCCTGGGTGAGTGGGTCCCCCAGGCTGGGAAGGGGTTGGGGGTCTGGCCTCCTGGGGCATCAGCACCCCACAGCCTGTGCCCAGGGAGGGCTAGAGAACTGCTCAGCCTATGATGGGGTTCCTCCTGCCTTGGGGTTGGGTAGAGCAGATGGCCTCTAGACTCAGTGATTCTGTAACAGGATACAAGTTTGTGGTTTTAAATTGCAGCACAAAGAAATTAGGCTGAACTCCTCTCCTTCCTCCTCTCCATCCCTCCCCATTTTCAGTGGTGGTTGGCAACTCAGTGCCAGGCACAAGGCTGGCCTGGGTGAGTGGAGGTGGATGGGTGGGTTCTGGGCCCCCCATTGAGCTGGTCTCCATGTCACTGCAGGAACTACTCAGCCGTCTGTGTGTATTCCCTCGGTGACATTGACAAGGTCTTCCGTACCTCCTCACTCAAGGGCTACCACTCAAGCCTTCCCAACCCGCGGCCTGGCAAGGTGAGCGTGACACCAGCCGTGGCCCAGGCCCAGCCCTCCTTCTGCCTCACCTCCCACCACCCCACTGACCTGGGCCTGCTCTCCTTGCCCAGTGCCTCCCAGACCAGCAGCCGATACCCACAGAGACCTTCCAGGTGGCTGACCGTCACCCAGAGGTGGCGCAGAGGGTGGAGCCCATGGGGCCTCTGAAGACGCCATTGTTCCACTCTAAATACCACTACCAGAAAGTGGCCGTCCACCGCATGCAAGCCAGCCACGGGGAGACCTTTCATGTGCTTTACCTAACTACAGGTGAGAGGCTACCCCGGGACCCTCAGTTTGCTTTGTAAAAACGGGCATGAAAGGTGTAAGGAATAATGTAGTTAACATCTGGTTGGATCTTTACATGTGGAAGGAATAATTGAGTGACTGGAGTTGTCAGGGGTTAATGTGTGTGGGTGTGGAAGAGCCAGGCAGGGAGAGCTTCCTGGAGGAGGTAGGGGCAAGAGGGAAAGGGGGATGGGAGAAAAGCAAGCACTGGGATTTGGAGGCGGAAATCTGGAGAGTCTGAGCAAAGCCAGGTGCACCTTTGGTCCAGATGTCTGACTCAGGGAAGAAGATGGTAGGAAGAGACGTGGCAAATGAGGAGGAGGGGCCTGAACCACAGGGATACTGGCCTCTGCCAGGCAGAATGAGGGAGTCAGGCCCTGCGCCTGTCTTTGGGATTGTGCAGGTGAGAAGAAACATTTGAGGAGTTGATGGGGCACAAATTAGGTATGGGGAAGGAGTTCCAGGGGGCAGAACCTTTGCCATCTCACAGAGGACAGGGGCAGCTTCTCTTCTTCCCTGGAGTAGGCCCTGCTGGGGGAAGCTGGGTGGAATGCCGTGGGAGATGCTCCTGCTTTCTGGAAAGCCACAGGACACGGAGGAGCCAGTCCTGAGTTGGGTTTGTCGCAGCTTCCCATGCCAGCTGCCTTCCTTGAGACTGGAAAGGGCCTCTAGCACCCCTGGGGCCATTCAATTCAGGCCCAGGCGCCCAACCTCAGTTGTTCACATTCCCCATGTGATCTCCTGTTGCTGCTTCACCTTGGGACTGTCTCGGCTTTGGTGACCTTGTAGGAAACTGGAACCCCAGCACCATTGTTTGGCTCCTGGAAGCCTTGGGGAGAGGAATTTCCCACAGGGCAGGGCCTGGGTCCTGATTCCCTGCCTCTTTACTCCCTATTCATCCCGGCTACACCCTTGGGCCCCCATCCTTGCTTGGCTCCAGTACTGGCTGGCACAGCTGTTGTGGTCATCCAGGGATGGCAGGGCACTGGGGAACAGAAGAGAGAGGTCACACAGTGCGGAACTGGGAGCAGGAGCTAGGACAAGGAAGGCTGGACTTGGGCCATGGACTCCCTTCCTGCAGACTTGGGAAGTGAGCACACTTGAGTGATTAGAGAAGGTGTCTTCGTTCTAAGGGCAGTGGAGGAGGCACCATTTTGGAGCCTGCATCATTCGTATTTGGGCTAGATTGAAAAATAGAGCTTTCTAAGTCCTCTGCAGAGAATGGGAGGCTCTCACAACTGGGAGAAGTATTGGCTCTTTTCCTGAGAATTTTGCCAAGGGTATGCTGTTACTGGGGCTGGTTTGGAAGGAGTATAGGGCATTATGTCTGTGAAGGCAGTGGCTGGGGTGGGGCCTTATCAGGCCCAAGGAGCATCTGGCCACATCTCAGAGTCCACAGATGAGGATCACGGATGTGTAGAGGAAACATCCTAGGCAGGCAATCATCTGACTGCTTTTTTGGGGCAGGTGATGCCCTGGGAAATTGGGAGGGAGGGAGAGAGGGAGGTAGGCTATTCTAGAAACTGGGAGAGCAGGTGAGGTAGGATTGGGAGGACCAGGGGTCAGGGTCCCCATTGGTCCCTAATTGAGAACGGAGAGAGCATTGGTCTAGGAGGCAGGCAGCTCGGTTATAAGACCTTGGGAACTCTTGATTTAGAATCCAAGATCCTTTTTAGATCTAGGATTTTATAAAATTAAGATATCCCCTAAGATCAAATGCAACGTGGAGTCCTGAATTGGATCCTAGAACAGAAGAAGGACATTTGTGGAAAAACTAGTGAAATCCAAATAAAGTCTGTAGTTTTGTTAATAGTAATGCACCAATGTCAGTTGCCTAGTTGTGACAAATATACCGTGGTTATGTAAGATGGTAACATTAGGGGGAACTGGAGAAGGGTAGATTGGAGCTCTCTGTACTATCTTTGCAACTTTTCTGGGAATCTAAAATTACTCCAAAATAAAAAAAAAATGTATTTAAAGTAAATATATTCCCTAAGAGTCCAGGAGGCAGGGGAGTTGTAGAAGCAGCTGAGTGGTTGGGTTCTGACAGATTTGGTTCCAACTCGGTCTCTGCTGCTCACCAGCTGTGTGACCTTGAGCAAGTGGCTTAGCCTTTCTGAGCCTGATTTCCTTATCTGTGGAGTGGGGAAGATGACAGCCACCTCGCAGGGCTGTGGAGGGTTAAACGAGGTGATGCATGGACAGCAGCCGCACTGACCTTGCTGGTGTGGGGCTCCTGCTTCTGTTCTTCCCGTGCAGCCTTGGGAATGTTGGAGGCCGTATCCAGGGACCCCTGGGCCTCCTGGGATGGCCTCTCTGGATCAGCCTTGGAAGGTTCCAGGCTGCCCTTAGGCTCCCACATTCTTCCCCAGTCACGCTCTCCTCGCCCTGCCCACACCAGTCCTGTGACCCTTGCCTGAGTTGTGACTTCCCACCCCTCCCCGGCCTAGAGGAAAGCTGCCTGGCCCCTCAGTGGGACTCCCGCCCACTGACCCTCTGTCCACCATACACAGACAGGGGCACTATCCACAAGGTGGTGGAACCGGGGGAGCAGGAGCACAGCTTCGCCTTCAACATCATGGAGATCCAGCCCTTCCGCCGCGCGGCTGCCATCCAGACCATGTCGCTGGATGCTGAGCGGGTGAGCCTTCCCCCACTGCGTCCCATGGGCTATGCAGTGACTGCAGCTGAGGACAGGGCTCCTTTGCATGTGATTTGTGTGTTCTTTTAAGAGCTTCTAGGCCTTAGGGCCTGGACATTTAGGACTGAGTGTGGGGTGGGGCCCGGGCCTGACCCAATCCTGCTGTCCTTCCAGAGGAAGCTGTATGTGAGCTCCCAGTGGGAGGTGAGCCAGGTGCCCCTGGACCTGTGTGAGGTCTATGGCGGGGGCTGCCACGGTTGCCTCATGTCCCGAGACCCCTACTGCGGCTGGGACCAGGGCCGCTGCATCTCCATCTACAGCTCCGAACGGTACGTTGGCCGGGATCCCTCCGTCCCTGGGACAAGGTGGGCATGGGACAGGGGGAGGTGTTGTCGGGCTGGAAGAGGTGGCGGTACTGGGCCTTTCTTGTGGGACCTCCTCTCTACTGGAACTGCACTAGGGGTAAGGATATGAGGGTCAGGTCTGCAGCCTTGTATCTGCTGATCCTCTTTCGTCCTTCCCACTCCAGGTCAGTGCTGCAATCCATTAATCCAGCCGAGCCACACAAGGAGTGTCCCAACCCCAAACCAGGTACCTGATCTGGCCCTGCTGGCGGCTGTGGCCCAATGAGTGGGGTACTGCCCTGCCCTGATTGTCCTGGTCTGAGGGAAACATGGCCTTGTCCTGTGGGCCCCAGGTACATGGGGCAGGATACAGTCCTGCAGAGGGAGCCCTCTTGGTGGGATGAGCGAGACGGGAGAAAAAAGGAGGACGCTGAGGGCTGGGTTCCCCACGTTCATTCAGAAGCCTTGTCCTGGGATCCCAGTCGGTGGGGAGGACACATCCTCCCCTGGGAGCTCTTTGTCCCTCCTCACGGCTGCTTCCCCACTGCCTCCCCAGACAAGGCCCCACTGCAGAAGGTTTCCCTGGCCCCAAACTCTCGCTACTACCTGAGCTGCCCCATGGAATCCCGCCACGCCACCTACTCATGGCGCCACAAGGAGAACGTGGAGCAGAGCTGCGAACCTGGTCACCAGAGCCCCAACTGCATCCTGTTCATCGAGAACCTCACGGCGCAGCAGTACGGCCACTACTTCTGCGAGGCCCAGGAGGGCTCCTACTTCCGCGAGGCTCAGCACTGGCAGCTGCTGCCCGAGGACGGCATCATGGCCGAGCACCTGCTGGGTCATGCCTGTGCCCTGGCCGCCTCCCTCTGGCTGGGGGTGCTGCCCACACTCACTCTTGGCTTGCTGGTCCACTAGGGCCTCCCGAGGCTGGGCATGCCTCAGGCTTCTGCAGCCCAGGGCACTAGAACGTCTCACACTCAGAGCCGGCTGGCCCGGGAGCTCCTTGCCTGCCACTTCTTCCAGGGGACAGAATAACCCAGTGGAGGATGCCAGGCCTGGAGACGTCCAGCCGCAGGCGGCTGCTGGGCCCCAGGTGGCGCACGGATGGTGAGGGGCTGAGAATGAGGGCACCGACTGTGAAGCTGGGGCATCGATGACCCAAGACTTTATCTTCTGGAAAATATTTTTCAGACTCCTCAAACTTGACTAAATGCAGCGATGCTCCCAGCCCAAGAGCCCATGGGTCGGGGAGTGGGTTTGGATAGGAGAGCTGGGACTCCATCTCGACCCTGGGGCTGAGGCCTGAGTCCTTCTGGACTCTTGGTACCCACATTGCCTCCTTCCCCTCCCTCTCTCATGGCTGGGTGGCTGGTGTTCCTGAAGACCCAGGGCTACCCTCTGTCCAGCCCTGTCCTCTGCAGCTCCCTCTCTGGTCCTGGGTCCCACAGGACAGCCGCCTTGCATGTTTATTGAAGGATGTTTGCTTTCCGGACGGAAGGACGGAAAAAGCTCTGAAAAAAAAAAAAAAAAAAAAAAAA表15:pMelBacA-H-SEMAL的核苷酸序列(6622bp)(SEQ ID NO.:42) 1 GATATCATGG AGATAATTAA AATGATAACC ATCTCGCAAA TAAATAAGTA 51 TTTTACTGTT TTCGTAACAG TTTTGTAATA AAAAAACCTA TAAATATGAA101 ATTCTTAGTC AACGTTGCCC TTGTTTTTAT GGTCGTATAC ATTTCTTACA151 TCTATGCGGA TCGATGG gga tccgcccagg gccacctaag gagcggaccc201 cgcatcttcg ccgtctggaa aggccatgta gggcaggacc gggtggactt251 tggccagact gagccgcaca cggtgctttt ccacgagcca ggcagctcct301 ctgtgtgggt gggaggacgt ggcaaggtct acctctttga cttccccgag351 ggcaagaacg catctgtgcg cacggtgaat atcggctcca caaaggggtc401 ctgtctggat aagcgggact gcgagaacta catcactctc ctggagaggc451 ggagtgaggg gctgctggcc tgtggcacca acgcccggca ccccagctgc501 tggaacctgg tgaatggcac tgtggtgcca cttggcgaga tgagaggcta551 tgcccccttc agcccggacg agaactccct ggttctgttt gaaggggacg601 aggtgtattc caccatccgg aagcaggaat acaatgggaa gatccctcgg651 ttccgccgca tccggggcga gagtgagctg tacaccagtg atactgtcat701 gcagaaccca cagttcatca aagccaccat cgtgcaccaa gaccaggctt751 acgatgacaa gatctactac ttcttccgag aggacaatcc tgacaagaat801 cctgaggctc ctctcaatgt gtcccgtgtg gcccagttgt gcagggggga851 ccagggtggg gaaagttcac tgtcagtctc caagtggaac acttttctga901 aagccatgct ggtatgcagt gatgctgcca ccaacaagaa cttcaacagg951 ctgcaagacg tcttcctgct ccctgacccc agcggccagt ggagggacac1001 cagggtctat ggtgttttct ccaacccctg gaactactca gccgtctgtg1051 tgtattccct cggtgacatt gacaaggtct tccgtacctc ctcactcaag1101 ggctaccact caagccttcc caacccgcgg cctggcaagt gcctcccaga1151 ccagcagccg atacccacag agaccttcca ggtggctgac cgtcacccag1201 aggtggcgca gagggtggag cccatggggc ctctgaagac gccattgttc1251 cactctaaat accactacca gaaagtggcc gttcaccgca tgcaagccag1301 ccacggggag acctttcatg tgctttacct aactacagac aggggcacta1351 tccacaaggt ggtggaaccg ggggagcagg agcacagctt cgccttcaac1401 atcatggaga tccagccctt ccgccgcgcg gctgccatcc agaccatgtc1451 gctggatgct gagcggagga agctgtatgt gagctcccag tgggaggtga1501 gccaggtgcc cctggacctg tgtgaggtct atggcggggg ctgccacggt1551 tgcctcatgt cccgagaccc ctactgcggc tgggaccagg gccgctgcat1601 ctccatctac agctccgaac ggtcagtgct gcaatccatt aatccagccg1651 agccacacaa ggagtgtccc aaccccaaac cagacaaggc cccactgcagt701 aaggtttccc tggccccaaa ctctcgctac tacctgagct gccccatgga1751 atcccgccac gccacctact catggcgcca caaggagaac gtggagcaga1801 gctgcgaacc tggtcaccag agccccaact gcatcctgtt catcgagaac1851 ctcacggcgc agcagtacgg ccactacttc tgcgaggccc aggagggctc1901 ctacttccgc gaggctcagc actggcagct gctgcccgag gacggcatca1951 tggccgagca cctgctgggt catgcctgtg ccctggctgc ctgaattc GA2001 AGCTTGGAGT CGACTCTGCT GAAGAGGAGG AAATTCTCCT TGAAGTTTCC2051 CTGGTGTTCA AAGTAAAGGA GTTTGCACCA GACGCACCTC TGTTCACTGG2101 TCCGGCGTAT TAAAACACGA TACATTGTTA TTAGTACATT TATTAAGCGC2151 TAGATTCTGT GCGTTGTTGA TTTACAGACA ATTGTTGTAC GTATTTTAAT2201 AATTCATTAA ATTTATAATC TTTAGGGTGG TATGTTAGAG CGAAAATCAA2251 ATGATTTTCA GCGTCTTTAT ATCTGAATTT AAATATTAAA TCCTCAATAG2301 ATTTGTAAAA TAGGTTTCGA TTAGTTTCAA ACAAGGGTTG TTTTTCCGAA2351 CCGATGGCTG GACTATCTAA TGGATTTTCG CTCAACGCCA CAAAACTTGC2401 CAAATCTTGT AGCAGCAATC TAGCTTTGTC GATATTCGTT TGTGTTTTGT2451 TTTGTAATAA AGGTTCGACG TCGTTCAAAA TATTATGCGC TTTTGTATTT2501 CTTTCATCAC TGTCGTTAGT GTACAATTGA CTCGACGTAA ACACGTTAAA2551 TAAAGCCTGG ACATATTTAA CATCGGGCGT GTTAGCTTTA TTAGGCCGAT2601 TATCGTCGTC GTCCCAACCC TCGTCGTTAG AAGTTGCTTC CGAAGACGAT2651 TTTGCCATAG CCACACGACG CCTATTAATT GTGTCGGCTA ACACGTCCGC2701 GATCAAATTT GTAGTTGAGC TTTTTGGAAT TATTTCTGAT TGCGGGCGTT2751 TTTGGGCGGG TTTCAATCTA ACTGTGCCCG ATTTTAATTC AGACAACACG2801 TTAGAAAGCG ATGGTGCAGG CGGTGGTAAC ATTTCAGACG GCAAATCTAC2851 TAATGGCGGC GGTGGTGGAG CTGATGATAA ATCTACCATC GTGGAGGCG2901 CAGGCGGGGC TGGCGGCGGA GGCGGAGGCG GAGGTGGTGG GGTGATGCA2951 GACGGCGGTT TAGGCTCAAA TTGTCTCTTT CAGGCAACAC AGTCGGCACC3001 TCAACTATTG TACTGGTTTC GGGCGTATGG TGCACTCTCA GTACAATCTG3051 CTCTGATGCC GCATAGTTAA GCCAGCCCCG ACACCCGCCA ACACCCGCTG3101 ACGCGCCCTG ACGGGCTTGT CTGCTCCCGG CATCCGCTTA CAGACAAGCT3151 GTGACCGTCT CCGGGAGCTG CATGTGTCAG AGGTTTTCAC CGTCATCACC3201 GAAACGCGCG AGACGAAAGG GCCTCGTGAT ACGCCTATTT TTATAGGTTA3251 ATGTCATGAT AATAATGGTT TCTTAGACGT CAGGTGGCAC TTTTCGGGGA3301 AATGTGCGCG GAACCCCTAT TTGTTTATTT TTCTAAATAC ATTCAAATAT3351 GTATCCGCTC ATGAGACAAT AACCCTGATA AATGCTTCAA TAATATTGAA3401 AAAGGAAGAG TATGAGTATT CAACATTTCC GTGTCGCCCT TATTCCCTTT3451 TTTGCGGCAT TTTGCCTTCC TGTTTTTGCT CACCCAGAAA CGCTGGTGAA3501 AGTAAAAGAT GCTGAAGATC AGTTGGGTGC ACGAGTGGGT TACATCGAAC3551 TGGATCTCAA CAGCGGTAAG ATCCTTGAGA GTTTTCGCCC CGAAGAACGT3601 TTTCCAATGA TGAGCACTTT TAAAGTTCTG CTATGTGGCG CGGTATTATC3651 CCGTATTGAC GCCGGGCAAG AGCAACTCGG TCGCCGCATA CACTATTCTC3701 AGAATGACTT GGTTGAGTAC TCACCAGTCA CAGAAAAGCA TCTTACGGAT3751 GGCATGACAG TAAGAGAATT ATGCAGTGCT GCCATAACCA TGAGTGATAA3801 CACTGCGGCC AACTTACTTC TGACAACGAT CGGAGGACCG AAGGAGCTAA3851 CCGCTTTTTT GCACAACATG GGGGATCATG TAACTCGCCT TGATCGTTGG3901 GAACCGGAGC TGAATGAAGC CATACCAAAC GACGAGCGTG ACACCACGAT3951 GCCTGTAGCA ATGGCAACAA CGTTGCGCAA ACTATTAACT GGCGAACTAC4001 TTACTCTAGC TTCCCGGCAA CAATTAATAG ACTGGATGGA GGCGGATAAA4051 GTTGCAGGAC CACTTCTGCG CTCGGCCCTT CCGGCTGGCT GGTTTATTGC4101 TGATAAATCT GGAGCCGGTG AGCGTGGGTC TCGCGGTATC ATTGCAGCAC4151 TGGGGCCAGA TGGTAAGCCC TCCCGTATCG TAGTTATCTA CACGACGGGG4201 AGTCAGGCAA CTATGGATGA ACGAAATAGA CAGATCGCTG AGATAGGTGC4251 CTCACTGATT AAGCATTGGT AACTGTCAGA CCAAGTTTAC TCATATATAC4301 TTTAGATTGA TTTAAAACTT CATTTTTAAT TTAAAAGGAT CTAGGTGAAG4351 ATCCTTTTTG ATAATCTCAT GACCAAAATC CCTTAACGTG AGTTTTCGTT4401 CCACTGAGCG TCAGACCCCG TAGAAAAGAT CAAAGGATCT TCTTGAGATC4451 CTTTTTTTCT GCGCGTAATC TGCTGCTTGC AAACAAAAAA ACCACCGCTA4501 CCAGCGGTGG TTTGTTTGCC GGATCAAGAG CTACCAACTC TTTTTCCGAA4551 GGTAACTGGC TTCAGCAGAG CGCAGATACC AAATACTGTT CTTCTAGTGT4601 AGCCGTAGTT AGGCCACCAC TTCAAGAACT CTGTAGCACC GCCTACATAC4651 CTCGCTCTGC TAATCCTGTT ACCAGTGGCT GCTGCCAGTG GCGATAAGTC4701 GTGTCTTACC GGGTTGGACT CAAGACGATA GTTACCGGAT AAGGCGCAGC4751 GGTCGGGCTG AACGGGGGGT TCGTGCACAC AGCCCAGCTT GGAGCGAACG4801 ACCTACACCG AACTGAGATA CCTACAGCGT GAGCTATGAG AAAGCGCCAC4851 GCTTCCCGAA GGGAGAAAGG CGGACAGGTA TCCGGTAAGC GGCAGGGTCG4901 GAACAGGAGA GCGCACGAGG GAGCTTCCAG GGGGAAACGC CTGGTATCTT4951 TATAGTCCTG TCGGGTTTCG CCACCTCTGA CTTGAGCGTC GATTTTTGTG5001 ATGCTCGTCA GGGGGGCGGA GCCTATGGAA AAACGCCAGC AACGCGGCCT5051 TTTTACGGTT CCTGGCCTTT TGCTGGCCTT TTGCTCACAT GTTCTTTCCT5101 GCGTTATCCC CTGATTCTGT GGATAACCGT ATTACCGCCT TTGAGTGAGC5151 TGATACCGCT CGCCGCAGCC GAACGACCGA GCGCAGCGAG TCAGTGAGCG5201 AGGAAGCATC CTGCACCATC GTCTGCTCAT CCATGACCTG ACCATGCAGA5251 GGATGATGCT CGTGACGGTT AACGCCTCGA ATCAGCAACG GCTTGCCGTT5301 CAGCAGCAGC AGACCATTTT CAATCCGCAC CTCGCGGAAA CCGACATCGC5351 AGGCTTCTGC TTCAATCAGC GTGCCGTCGG CGGTGTGCAG TTCAACCACC5401 GCACGATAGA GATTCGGGAT TTCGGCGCTC CACAGTTTCG GGTTTTCGAC5451 GTTCAGACGT AGTGTGACGC GATCGGTATA ACCACCACGC TCATCGATAA5501 TTTCACCGCC GAAAGGCGCG GTGCCGCTGG CGACCTGCGT TTCACCCTGC5551 CATAAAGAAA CTGTTACCCG TAGGTAGTCA CGCAACTCGC CGCACATCTG5601 AACTTCAGCC TCCAGTACAG CGCGGCTGAA ATCATCATTA AAGCGAGTGG5651 CAACATGGAA ATCGCTGATT TGTGTAGTCG GTTTATGCAG CAACGAGACG5701 TCACGGAAAA TGCCGCTCAT CCGCCACATA TCCTGATCTT CCAGATAACT5751 GCCGTCACTC CAACGCAGCA CCATCACCGC GAGGCGGTTT TCTCCGGCGC5801 GTAAAAATGC GCTCAGGTCA AATTCAGACG GCAAACGACT GTCCTGGCCG5851 TAACCGACCC AGCGCCCGTT GCACCACAGA TGAAACGCCG AGTTAACGCC5901 ATCAAAAATA ATTCGCGTCT GGCCTTCCTG TAGCCAGCTT TCATCAACAT5951 TAAATGTGAG CGAGTAACAA CCCGTCGGAT TCTCCGTGGG AACAAACGGC6001 GGATTGACCG TAATGGGATA GGTCACGTTG GTGTAGATGG GCGCATCGTA6051 ACCGTGCATC TGCCAGTTTG AGGGGACGAC GACAGTATCG GCCTCAGGAA6101 GATCGCACTC CAGCCAGCTT TCCGGCACCG CTTCTGGTGC CGGAAACCAG6151 GCAAAGCGCC ATTCGCCATT CAGGCTGCGC AACTGTTGGG AAGGGCGATC6201 GGTGCGGGCC TCTTCGCTAT TACGCCAGCT GGCGAAAGGG GGATGTGCTG6251 CAAGGCGATT AAGTTGGGTA ACGCCAGGGT TTTCCCAGTC ACGACGTTGT6301 AAAACGACGG GATCTATCAT TTTTAGCAGT GATTCTAATT GCAGCTGCTC6351 TTTGATACAA CTAATTTTAC GACGACGATG CGAGCTTTTA TTCAACCGAG6401 CGTGCATGTT TGCAATCGTG CAAGCGTTAT CAATTTTTCA TTATCGTATT6451 GTTGCACATC AACAGGCTGG ACACCACGTT GAACTCGCCG CAGTTTTGCG6501 GCAAGTTGGA CCCGCCGCGC ATCCAATGCA AACTTTCCGA CATTCTGTTG6551 CCTACGAACG ATTGATTCTT TGTCCATTGA TCGAAGCGAG TGCCTTCGAC6601 TTTTTCGTGT CCAGTGTGGC TT
序列表
(1)一般信息:
(ⅰ)申请人:
(A)名称:Hoechst Marion Roussel Deutschland GmbH
(B)街道:
(C)城市:Frankfurt
(D)州:
(E)国家:德国
(F)邮区代码(ZIP):69926
(G)电话:069-305-7072
(H)传真:069-35-7175
(I)电传:
(ⅱ)发明名称:人类信息素L和其它物种中相应的信息素
(ⅲ)序列数:44
(ⅳ)计算机可读形式:
(A)介质类型:软盘
(B)计算机:IBMPC兼容机
(C)操作系统:PC-DOS/MS-DOS
(D)软件:PatentIn Release#1.0,版本#1.25(EPO)
(2)SEQ ID NO:1的信息:
(ⅰ)序列特征:
(A)长度:2636个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..2636
(ⅹⅰ)序列描述:SEQ ID NO:1:CGGGGCCACG GGATGACGCC TCCTCCGCCC GGACGTGCCG CCCCCAGCGC ACCGCGCGCC 60CGCGTCCCTG GCCCGCCGGC TCGGTTGGGG CTTCCGCTGC GGCTGCCGCT GCTGCTGCTG 120CTCTGGGCGG CCGCCGCCTC CGCCCAGGGC CACCTAAGGA GCGGACCCCG CATCTTCGCC 180GTCTGGAAAG GCCATGTAGG GCAGGACCGG GTGGACTTTG GCCAGACTGA GCCGCACACG 240GTGCTTTTCC ACGAGCCAGG CAGCTCCTCT GTGTGGGTGG GAGGACGTGG CAAGGTCTAC 300CTCTTTGACT TCCCCGAGGG CAAGAACGCA TCTGTGCGCA CGGTGAATAT CGGCTCCACA 360AAGGGGTCCT GTCTGGATAA GCGGGACTGC GAGAACTACA TCACTCTCCT GGAGAGGCGG 420AGTGAGGGGC TGCTGGCCTG TGGCACCAAC GCCCGGCACC CCAGCTGCTG GAACCTGGTG 480AATGGCACTG TGGTGCCACT TGGCGAGATG AGAGGCTACG CCCCCTTCAG CCCGGACGAG 540AACTCCCTGG TTCTGTTTGA AGGGGACGAG GTGTATTCCA CCATCCGGAA GCAGGAATAC 600AATGGGAAGA TCCCTCGGTT CCGCCGCATC CGGGGCGAGA GTGAGCTGTA CACCAGTGAT 660ACTGTCATGC AGAACCCACA GTTCATCAAA GCCACCATCG TGCACCAAGA CCAGGCTTAC 720GATGACAAGA TCTACTACTT CTTCCGAGAG GACAATCCTG ACAAGAATCC TGAGGCTCCT 780CTCAATGTGT CCCGTGTGGC CCAGTTGTGC AGGGGGGACC AGGGTGGGGA AAGTTCACTG 840TCAGTCTCCA AGTGGAACAC TTTTCTGAAA GCCATGCTGG TATGCAGTGA TGCTGCCACC 900AACAAGAACT TCAACAGGCT GCAAGACGTC TTCCTGCTCC CTGACCCCAG CGGCCAGTGG 960AGGGACACCA GGGTCTATGG TGTTTTCTCC AACCCCTGGA ACTACTCAGC CGTCTGTGTG 1020TATTCCCTCG GTGACATTGA CAAGGTCTTC CGTACCTCCT CACTCAAGGG CTACCACTCA 1080AGCCTTCCCA ACCCGCGGCC TGGCAAGTGC CTCCCAGACC AGCAGCCGAT ACCCACAGAG 1140ACCTTCCAGG TGGCTGACCG TCACCCAGAG GTGGCGCAGA GGGTGGAGCC CATGGGGCCT 1200CTGAAGACGC CATTGTTCCA CTCTAAATAC CACTACCAGA AAGTGGCCGT TCACCGCATG 1260CAAGCCAGCC ACGGGGAGAC CTTTCATGTG CTTTACCTAA CTACAGACAG GGGCACTATC 1320CACAAGGTGG TGGAACCGGG GGAGCAGGAG CACAGCTTCG CCTTCAACAT CATGGAGATC 1380CAGCCCTTCC GCCGCGCGGC TGCCATCCAG ACCATGTCGC TGGATGCTGA GCGGAGGAAG 1440CTGTATGTGA GCTCCCAGTG GGAGGTGAGC CAGGTGCCCC TGGACCTGTG TGAGGTCTAT 1500GGCGGGGGCT GCCACGGTTG CCTCATGTCC CGAGACCCCT ACTGCGGCTG GGACCAGGGC 1560CGCTGCATCT CCATCTACAG CTCCGAACGG TCAGTGCTGC AATCCATTAA TCCAGCCGAG 1620CCACACAAGG AGTGTCCCAA CCCCAAACCA GACAAGGCCC CACTGCAGAA GGTTTCCCTG 1680GCCCCAAACT CTCGCTACTA CCTGAGCTGC CCCATGGAAT CCCGCCACGC CACCTACTCA 1740TGGCGCCACA AGGAGAACGT GGAGCAGAGC TGCGAACCTG GTCACCAGAG CCCCAACTGC 1800ATCCTGTTCA TCGAGAACCT CACGGCGCAG CAGTACGGCC ACTACTTCTG CGAGGCCCAG 1860GAGGGCTCCT ACTTCCGCGA GGCTCAGCAC TGGCAGCTGC TGCCCGAGGA CGGCATCATG 1920GCCGAGCACC TGCTGGGTCA TGCCTGTGCC CTGGCTGCCT CCCTCTGGCT GGGGGTGCTG 1980CCCACACTCA CTCTTGGCTT GCTGGTCCAC TAGGGCCTCC CGAGGCTGGG CATGCCTCAG 2040GCTTCTGCAG CCCAGGGCAC TAGAACGTCT CACACTCAGA GCCGGCTGGC CCGGGAGCTC 2100CTTGCCTGCC ACTTCTTCCA GGGGACAGAA TAACCCAGTG GAGGATGCCA GGCCTGGAGA 2160CGTCCAGCCG CAGGCGGCTG CTGGGCCCCA GGTGGCGCAC GGATGGTGAG GGGCTGAGAA 2220TGAGGGCACC GACTGTGAAG CTGGGGCATC GATGACCCAA GACTTTATCT TCTGGAAAAT 2280ATTTTTCAGA CTCCTCAAAC TTGACTAAAT GCAGCGATGC TCCCAGCCCA AGAGCCCATG 2340GGTCGGGGAG TGGGTTTGGA TAGGAGAGCT GGGACTCCAT CTCGACCCTG GGGCTGAGGC 2400CTGAGTCCTT CTGGACTCTT GGTACCCACA TTGCCTCCTT CCCCTCCCTC TCTCATGGCT 2460GGGTGGCTGG TGTTCCTGAA GACCCAGGGC TACCCTCTGT CCAGCCCTGT CCTCTGCAGC 2520TCCCTCTCTG GTCCTGGGTC CCACAGGACA GCCGCCTTGC ATGTTTATTG AAGGATGTTT 2580GCTTTCCGGA CGGAAGGACG GAAAAAGCTC TGAAAAAAAA AAAAAAAAAA AAAAAA 2636
(2)SEQ ID NO:2的信息:
(ⅰ)序列特征:
(A)长度:1195个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..1195
(ⅹⅰ)序列描述:SEQ ID NO:2:CGGGGCTGCG GGATGACGCC TCCTCCTCCC GGACGTGCCG CCCCCAGCGC ACCGCGCGCC 60CGCGTCCTCA GCCTGCCGGC TCGGTTCGGG CTCCCGCTGC GGCTGCGGCT TCTGCTGGTG 120TTCTGGGTGG CCGCCGCCTC CGCCCAAGGC CACTCGAGGA GCGGACCCCG CATCTCCGCC 180GTCTGGAAAG GGCAGGACCA TGTGGACTTT AGCCAGCCTG AGCCACACAC CGTGCTTTTC 240CATGAGCCGG GCAGCTTCTC TGTCTGGGTG GGTGGACGTG GCAAGGTCTA CCACTTCAAC 300TTCCCCGAGG GCAAGAATGC CTCTGTGCGC ACGGTGAACA TCGGCTCCAC AAAGGGGTCC 360TGTCAGGACA AACAGGACTG TGGGAATTAC ATCACTCTTC TAGAAAGGCG GGGTAATGGG 420CTGCTGGTCT GTGGCACCAA TGCCCGGAAG CCCAGCTGCT GGAACTTGGT GAATGACAGT 480GTGGTGATGT CACTTGGTGA GATGAAAGGC TATGCCCCCT TCAGCCCGGA TGAGAACTCC 540CTGGTTCTGT TTGAAGGAGA TGAAGTGTAC TCTACCATCC GGAAGCAGGA ATACAACGGG 600AAGATCCCTC GGTTTCGACG CATTCGGGGC GAGAGTGAAC TGTACACAAG TGATACAGTC 660ATGCAGAACC CACAGTTCAT CAAGGCCACC ATTGTGCACC AAGACCAAGC CTATGATGAT 720AAGATCTACT ACTTCTTCCG AGAAGACAAC CCTGACAAGA ACCCCGAGGC TCCTCTCAAT 780GTGTCCCGAG TAGCCCAGTT GTGCAGGGGG GACCAGGGTG GTGAGAGTTC GTTGTCTGTC 840TCCAAGTGGA ACACCTTCCT GAAAGCCATG TTGGTCTGCA GCGATGCAGC CACCAACAGG 900AACTTCAATC GGCTGCAAGA TGTCTTCCTG CTCCCTGACC CCAGTGGCCA GTGGAGAGAT 960ACCAGGGTCT ATGGCGTTTT CTCCAACCCC TGGAACTACT CAGCTGTCTG CGTGTATTCG 1020CTTGGTGACA TTGACAGAGT CTTCCGTACC TCATCGCTCA AAGGCTACCA CATGGGCCTT 1080TCCAACCCTC GACCTGGCAT GTGCCTCCCA AAAAAGCAGC CCATACCCAC AGAAACCTTC 1140CAGGTAGCTG ATAGTCACCC AGAGGTGGCT CAGAGGGTGG AACCTATGGG GCCCC 1195
(2)SEQ ID NO:3的信息:
(ⅰ)序列特征:
(A)长度:666个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:蛋白质
(ⅸ)特征:
(A)名称/关键词:蛋白质
(B)位置:1..666
(ⅸ)特征:
(A)名称/关键词:蛋白质
(B)位置:1..666
(ⅹⅰ)序列描述:SEQ ID NO:3:Met Thr Pro Pro Pro Pro Gly Arg Ala Ala Pro Ser Ala Pro Arg Ala1 5 10 15Arg Val Pro Gly Pro Pro Ala Arg Leu Gly Leu Pro Leu Arg Leu Arg
20 25 30Leu Leu Leu Leu Leu Trp Ala Ala Ala Ala Ser Ala Gln Gly His Leu
35 40 45Arg Ser Gly Pro Arg Ile Phe Ala Val Trp Lys Gly His Val Gly Gln
50 55 60Asp Arg Val Asp Phe Gly Gln Thr Glu Pro His Thr Val Leu Phe His65 70 75 80Glu Pro Gly Ser Ser Ser Val Trp Val Gly Gly Arg Gly Lys Val Tyr
85 90 95Leu Phe Asp Phe Pro Glu Gly Lys Asn Ala Ser Val Arg Thr Val Asn
100 105 110Ile Gly Ser Thr Lys Gly Ser Cys Leu Asp Lys Arg Asp Cys Glu Asn
115 120 125Tyr Ile Thr Leu Leu Glu Arg Arg Ser Glu Gly Leu Leu Ala Cys Gly
130 135 140Thr Asn Ala Arg His Pro Ser Cys Trp Asn Leu Val Asn Gly Thr Val145 150 155 160Val Pro Leu Gly Glu Met Arg Gly Tyr Ala Pro Phe Ser Pro Asp Glu
165 170 175Asn Ser Leu Val Leu Phe Glu Gly Asp Glu Val Tyr Ser Thr Ile Arg
180 185 190Lys Gln Glu Tyr Asn Gly Lys Ile Pro Arg Phe Arg Arg Ile Arg Gly
195 200 205Glu Ser Glu Leu Tyr Thr Ser Asp Thr Val Met Gln Asn Pro Gln Phe
210 215 220Ile Lys Ala Thr Ile Val His Gln Asp Gln Ala Tyr Asp Asp Lys Ile225 230 235 240Tyr Tyr Phe Phe Arg Glu Asp Asn Pro Asp Lys Asn Pro Glu Ala Pro
245 250 255Leu Asn Val Ser Arg Val Ala Gln Leu Cys Arg Gly Asp Gln Gly Gly
260 265 270Glu Ser Ser Leu Ser Val Ser Lys Trp Asn Thr Phe Leu Lys Ala Met
275 280 285Leu Val Cys Ser Asp Ala Ala Thr Asn Lys Asn Phe Asn Arg Leu Gln
290 295 300Asp Val Phe Leu Leu Pro Asp Pro Ser Gly Gln Trp Arg Asp Thr Arg305 310 315 320Val Tyr Gly Val Phe Ser Asn Pro Trp Asn Tyr Ser Ala Val Cys Val
325 330 335Tyr Ser Leu Gly Asp Ile Asp Lys Val Phe Arg Thr Ser Ser Leu Lys
340 345 350Gly Tyr His Ser Ser Leu Pro Asn Pro Arg Pro Gly Lys Cys Leu Pro
355 360 365Asp Gln Gln Pro Ile Pro Thr Glu Thr Phe Gln Val Ala Asp Arg His
370 375 380Pro Glu Val Ala Gln Arg Val Glu Pro Mer Gly Pro Leu Lys Thr Pro385 390 395 400Leu Phe His Ser Lys Tyr His Tyr Gln Lys Val Ala Val His Arg Met
405 410 415Gln Ala Ser His Gly Glu Thr Phe His Va1 Leu Tyr Leu Thr Thr Asp
420 425 430Arg Gly Thr Ile His Lys Val Val Glu Pro Gly Glu Gln Glu His Ser
435 440 445Phe Ala Phe Asn Ile Met Glu Ile Gln Pro Phe Arg Arg Ala Ala Ala
450 455 460Ile Gln Thr Met Ser Leu Asp Ala Glu Arg Arg Lys Leu Tyr Val Ser465 470 475 480Ser Gln Trp Glu Val Ser Gln Val Pro Leu Asp Leu Cys Glu Val Tyr
485 490 495Gly Gly Gly Cys His Gly Cys Leu Met Ser Arg Asp Pro Tyr Cys Gly
500 505 510Trp Asp Gln G1y Arg Cys Ile Ser Ile Tyr Ser Ser Glu Arg Ser Val
515 520 525Leu Gln Ser Ile Asn Pro Ala Glu Pro His Lys Glu Cys Pro Asn Pro
530 535 540Lys Pro Asp Lys Ala Pro Leu Gln Lys Val Ser Leu Ala Pro Asn Ser545 550 555 560Arg Tyr Tyr Leu Ser Cys Pro Met Glu Ser Arg His Ala Thr Tyr Ser
565 570 575Trp Arg His Lys Glu Asn Val Glu Gln Ser Cys Glu Pro Gly His Gln
580 585 590Ser Pro Asn Cys Ile Leu Phe Ile Glu Asn Leu Thr Ala Gln Gln Tyr
595 600 605Gly His Tyr Phe Cys Glu Ala Gln Glu Gly Ser Tyr Phe Arg Glu Ala
610 615 620Gln His Trp Gln Leu Leu Pro Glu Asp Gly Ile Met Ala Glu His Leu625 630 635 640Leu Gly His Ala Cys Ala Leu Ala Ala Ser Leu Trp Leu Gly Val Leu
645 650 655Pro Thr Leu Thr Leu Gly Leu Leu Val His
660 665
(2)SEQ ID NO:4的信息:
(ⅰ)序列特征:
(A)长度:394个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:蛋白质
(ⅸ)特征:
(A)名称/关键词:蛋白质
(B)位置:1..394
(ⅹⅰ)序列描述:SEQ ID NO:4:Met Thr Pro Pro Pro Pro Gly Arg Ala Ala Pro Ser Ala Pro Arg Ala1 5 10 15Arg Val Leu Ser Leu Pro Ala Arg Phe Gly Leu Pro Leu Arg Leu Arg
20 25 30Leu Leu Leu Val Phe Trp Val Ala Ala Ala Ser Ala Gln Gly His Ser
35 40 45Arg Ser Gly Pro Arg Ile Ser Ala Va1 Trp Lys Gly Gln Asp His Val
50 55 60Asp Phe Ser Gln Pro Glu Pro His Thr Val Leu Phe His Glu Pro Gly65 70 75 80Ser Phe Ser Val Trp Val Gly Gly Arg Gly Lys Val Tyr Hia Phe Asn
85 90 95Phe Pro Glu Gly Lys Asn Ala Ser Val Arg Thr Val Asn Ile Gly Ser
100 105 110Thr Lys Gly Ser Cys Gln Asp Lys Gln Asp Cys Gly Asn Tyr Ile Thr
115 120 125Leu Leu Glu Arg Arg Gly Asn Gly Leu Leu Val Cys Gly Thr Asn Ala
130 135 140Arg Lys Pro Ser Cys Trp Asn Leu Val Asn Asp Ser Val Val Met Ser145 150 155 160Leu Gly Glu Met Lys Gly Tyr Ala Pro Phe Ser Pro Asp Glu Asn Ser
165 170 175Leu Val Leu Phe Glu Gly Asp Glu Val Tyr Ser Thr Ile Arg Lys Gln
180 185 190Glu Tyr Asn Gly Lys Ile Pro Arg Phe Arg Arg Ile Arg Gly Glu Ser
195 200 205Glu Leu Tyr Thr Ser Asp Thr Val Met Gln Asn Pro Gln Phe Ile Lys
210 215 220Ala Thr Ile Val His Gln Asp Gln Ala Tyr Asp Asp Lys Ile Tyr Tyr225 230 235 240Phe Phe Arg Glu Asp Asn Pro Asp Lys Asn Pro Glu Ala Pro Leu Asn
245 250 255Val Ser Arg Val Ala Gln Leu Cys Arg Gly Asp Gln Gly Gly Glu Ser
260 265 270Ser Leu Ser Val Ser Lys Trp Asn Thr Phe Leu Lys Ala Met Leu Val
275 280 285Cys Ser Asp Ala Ala Thr Asn Arg Asn Phe Asn Arg Leu Gln Asp Val
290 295 300Phe Leu Leu Pro Asp Pro Ser Gly Gln Trp Arg Asp Thr Arg Val Tyr305 310 315 320Gly Val Phe Ser Asn Pro Trp Asn Tyr Ser Ala Val Cys Val Tyr Ser
325 330 335Leu Gly Asp Ile Asp Arg Val Phe Arg Thr Ser Ser Leu Lys Gly Tyr
340 345 350His Met Gly Leu Ser Asn Pro Arg Pro Gly Met Cys Leu Pro Lys Lys
355 360 365Gln Pro Ile Pro Thr Glu Thr Phe Gln Val Ala Asp Ser His Pro Glu
370 375 380Val Ala Gln Arg Val Glu Pro Met Gly Pro385 390
(2)SEQ ID NO:5的信息:
(ⅰ)序列特征:
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..23
(ⅹⅰ)序列描述:SEQ ID NO:5:ACTCACTATAGGGCTCGAGCGGC 23
(2)SEQ ID NO:6的信息:
(ⅰ)序列特征:
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..20
(ⅹⅰ)序列描述:SEQ ID NO:6:AGCCGCACACGGTGCTTITC 20
(2)SEQ ID NO:7的信息:
(ⅰ)序列特征:
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..20
(ⅹⅰ)序列描述:SEQ ID NO:7:GCACAGATGCGITCITGCCC 20
(2)SEQ ID NO:8的信息:
(ⅰ)序列特征:
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..20
(ⅹⅰ)序列描述:SEQ ID NO:8:ACCATAGACCCTGGTGTCCC
(2)SEQ ID NO:9的信息:
(ⅰ)序列特征:
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..20
(ⅹⅰ)序列描述:SEQ ID NO:9:GCAGTGATGCTGCCACCAAC 20
(2)SEQ ID NO:10的信息:
(ⅰ)序列特征:
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..20
(ⅹⅰ)序列描述:SEQ ID NO:10:CCAGACCATGTCGCTGGATG 20
(2)SEQ ID NO:11的信息:
(ⅰ)序列特征:
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..20
(ⅹⅰ)序列描述:SEQ ID NO:11:ACATGAGGCAACCGTGGGCAG 20
(2)SEQ ID NO:12的信息:
(ⅰ)序列特征:
(A)长度:27个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..27
(ⅹⅰ)序列描述:SEQ ID NO:12:CCATCCTAATACGACTCACTATAGGGC 27
(2)SEQ ID NO:13的信息:
(ⅰ)序列特征:
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..20
(ⅹⅰ)序列描述:SEQ ID NO:13:AGGTAGACCTTGCCACGTCC 20
(2)SEQ ID NO:14的信息:
(ⅰ)序列特征:
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..23
(ⅹⅰ)序列描述:SEQ ID NO:14:GAACTTCAACAGGCTGCAAG ACG 23
(2)SEQ ID NO:15的信息:
(ⅰ)序列特征:
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..20
(ⅹⅰ)序列描述:SEQ ID NO:15:ATGCTGAGCGGAGGAACGCTG 20
(2)SEQ ID NO:16的信息:
(ⅰ)序列特征:
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..20
(ⅹⅰ)序列描述:SEQ ID NO:16:CCGCCATACACCTCACACAG 20
(2)SEQ ID NO:17的信息:
(ⅰ)序列特征:
(A)长度:28个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..28
(ⅹⅰ)序列描述:SEQ ID NO:17:CTGGAAGCTTTCTGTGGGTATCGGCTGC 28
(2)SEQ ID NO:18的信息:
(ⅰ)序列特征:
(A)长度:25个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..25
(ⅹⅰ)序列描述:SEQ ID NO:18:TTTGGATCCCTGGTTCTGTTTGAAG 25
(2)SEQ ID NO:19的信息:
(ⅰ)序列特征:
(A)长度:50个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..50
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..50
(ⅹⅰ)序列描述:SEQ ID NO:19:TTCTAGAATT CAGCGGCCGC TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT50
(2)SEQ ID NO:20的信息:
(ⅸ)序列特征:
(A)长度:27个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..27
(ⅹⅰ)序列描述:SEQ ID NO:20:GGGGAAAGTTCACTGTCAGTCTCCAAG 27
(2)SEQ ID NO:21的信息:
(ⅰ)序列特征:
(A)长度:26个碱基对
(8)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..26
(ⅹⅰ)序列描述:SEQ ID NO:21:GGGAATACACACAGACGGCTGAGTAG 26
(2)SEQ ID NO:22的信息:
(ⅰ)序列特征:
(A)长度:22个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..22
(ⅹⅰ)序列描述:SEQ ID NO:22:AGCAAGTTCAGCCTGGTTAAGT 22
(2)SEQ ID NO:23的信息:
(ⅰ)序列特征:
(A)长度:21个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..21
(ⅹⅰ)序列描述:SEQ ID NO:23:TTATGAGTATTTCTTCCAGGG 21
(2)SEQ ID NO:24的信息:
(ⅰ)序列特征:
(A)长度:26个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..26
(ⅹⅰ)序列描述:SEQ ID NO:24:CCAITAATCCAGCCGAGCCACACAAG 26
(2)SEQ ID NO:25的信息:
(ⅰ)序列特征:
(A)长度:25个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..25
(ⅹⅰ)序列描述:SEQ ID NO:25:CATCTACAGCTCCGAACGGTCAGTG 25
(2)SEQ ID NO:26的信息:
(ⅰ)序列特征:
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..20
(ⅹⅰ)序列描述:SEQ ID NO:26:CAGCGGAAGCCCCAACCGAG 20
(2)SEQ ID NO:27的信息:
(ⅰ)序列特征:
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..23
(ⅹⅰ)序列描述:SEQ ID NO:27:GGGATGACGCCTCCTCCGCCCGG 23
(2)SEQ ID NO:28的信息:
(ⅰ)序列特征:
(A)长度:31个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..31
(ⅹⅰ)序列描述:SEQ ID NO:28:AAGCTTCACGTGGACCAGCAAGCCAAGAGTG 31
(2)SEQ ID NO:29的信息:
(ⅰ)序列特征:
(A)长度:25个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..25
(ⅹⅰ)序列描述:SEQ ID NO:29:AAGCTTTTTCCGTCCTTCCGTCCGG 25
(2)SEQ ID NO:30的信息:
(ⅰ)序列特征:
(A)长度:24个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..24
(ⅹⅰ)序列描述:SEQ ID NO:30:ATGGTGAGCAAGGGCGAGGAGCTG 24
(2)SEQ ID NO:31的信息:
(ⅰ)序列特征:
(A)长度:24个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..24
(ⅹⅰ)序列描述:SEQ ID NO:31:CITGTACAGCTCGTCCATGCCGAG 24
(2)SEQ ID NO:32的信息:
(ⅰ)序列特征:
(A)长度:25个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..25
(ⅹⅰ)序列描述:SEQ ID NO:32:GGGTGGTGAGAGTTCGTTGTCTGTC 25
(2)SEQ ID NO::33的信息:
(ⅰ)序列特征: .
(A)长度:25个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..25
(ⅹⅰ)序列描述:SEQ ID NO:33:GAGCGATGAGGTACGGAAGACTCTG 25
(2)SEQ ID NO:34的信息:
(ⅰ)序列特征:
(A)长度:5856个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..5856
(ⅹⅰ)序列描述:SEQ ID NO:34:AGCGCCCAAT ACGCAAACCG CCTCTCCCCG CGCGTTGGCC GATTCATTAA TGCAGCTGGC 60ACGACAGGTT TCCCGACTGG AAAGCGGGCA GTGAGCGCAA CGCAATTAAT GTGAGTTAGC 120TCACTCATTA GGCACCCCAG GCTTTACACT TTATGCTTCC GGCTCGTATG TTGTGTGGAA 180TTGTGAGCGG ATAACAATTT CACACAGGAA ACAGCTATGA CCATGATTAC GCCAAGCTTC 240ACGTGGACCA GCAAGCCAAG AGTGAGTGTG GGCAGCACCC CCAGCCAGAG GGAGGCAGCC 300AGGGCACAGG CATGACCCAG CAGGTGCTCG GCCATGATGC CGTCCTCGGG CAGCAGCTGC 360CAGTGCTGAG CCTCGCGGAA GTAGGAGCCC TCCTGGGCCT CGCAGAAGTA GTGGCCGTAC 420TGCTGCGCCG TGAGGTTCTC GATGAACAGG ATGCAGTTGG GGCTCTGGTG ACCAGGTTCG 480CAGCTCTGCT CCACGTTCTC CTTGTGGCGC CATGAGTAGG TGGCGTGGCG GGATTCCATG 540GGGCAGCTCA GGTAGTAGCG AGAGTTTGGG GCCAGGGAAA CCTTCTGCAG TGGGGCCTTG 600TCTGGTTTGG GGTTGGGACA CTCCTTGTGT GGCTCGGCTG GATTAATGGA TTGCAGCACT 660GACCGTTCGG AGCTGTAGAT GGAGATGCAG CGGCCCTGGT CCCAGCCGCA GTAGGGGTCT 720CGGGACATGA GGCAACCGTG GCAGCCCCCG CCATAGACCT CACACAGGTC CAGGGGCACC 780TGGCTCACCT CCCACTGGGA GCTCACATAC AGCTTCCTCC GCTCAGCATC CAGCGACATG 840GTCTGGATGG CAGCCGCGCG GCGGAAGGGC TGGATCTCCA TGATGTTGAA GGCGAAGCTG 900TGCTCCTGCT CCCCCGGTTC CACCACCTTG TGGATAGTGC CCCTGTCTGT AGTTAGGTAA 960AGCACATGAA AGGTCTCCCC GTGGCTGGCT TGCATGCGGT GAACGGCCAC TTTCTGGTAG 1020TGGTATTTAG AGTGGAACAA TGGCGTCTTC AGAGGCCCCA TGGGCTCCAC CCTCTGCGCC 1080ACCTCTGGGT GACGGTCAGC CACCTGGAAG GTCTCTGTGG GTATCGGCTG CTGGTCTGGG 1140AGGCACTTGC CAGGCCGCGG GTTGGGAAGG CTTGAGTGGT AGCCCTTGAG TGAGGAGGTA 1200CGGAAGACCT TGTCAATGTC ACCGAGGGAA TACACACAGA CGGCTGAGTA GTTCCAGGGG 1260TTGGAGAAAA CACCATAGAC CCTGGTGTCC CTCCACTGGC CGCTGGGGTC AGGGAGCAGG 1320AAGACGTCTT GCAGCCTGTT GAAGTTCTTG TTGGTGGCAG CATCACTGCA TACCAGCATG 1380CCTTTCAGAA AAGTGTTCCA CTTGGAGACT GACAGTGAAC TTTCCCCACC CTGGTCCCCC 1440CTGCACAACT GGGCCACACG GGACACATTG AGAGGAGCCT CAGGATTCTT GTCAGGATTG 1500TCCTCTCGGA AGAAGTAGTA GATCTTGTCA TCGTAAGCCT GGTCTTGGTG CACGATGGTG 1560GCTTTGATGA ACTGTGGGTT CTGCATGACA GTATCACTGG TGTACAGCTC ACTCTCGCCC 1620CGGATGCGGC GGAACCGAGG GATGTTCCCA TTGTATTCCT GCTTCCGGAT GGTGGAATAC 1680ACCTCGTCCC CTTCAAACAG AACCAGGGAG TTCTCGTCCG GGCTGAAGGG GGCGTAGCCT 1740CTCATCTCGC CAAGTGGCAC CACAGTGCCA TTCACCAGGT TCCAGCAGCT GGGGTGCCGG 1800GCGTTGGTGC CACAGGCCAG CAGCCCCTCA CTCCGCCTCT CCAGGAGAGT GATGTAGTTC 1860TCGCAGTCCC GCTTATCCAG ACAGGACCCC TTTGTGGAGC CGATATTCAC CGTGCGCACA 1920GATGCGTTCT TGCCCTCGGG GAAGTCAAAG AGGTAGACCT TGCCACGTCG TCCCACCCAC 1980ACAGAGGAGC TGCCTGGCTC GTGGAAAAGC ACCGTGTGCG GCTCAGTCTG GCCAAAGTCC 2040ACCCGGTCCT GCCCTACATG GCCTTTCCAG ACGGCGAAGA TGCGGGGTCC GCTCCTTAGG 2100TGGCGCTGGG CGGAGGCGGC GGCCGCCCAG AGCAGCAGCA GCAGCCGCAG CCGCAGCGGA 2160AGCCCCAACC GAGCCGGCGG GCCAGGGACG CGGGCGCGCG GTGCGCTGGG GGCGGCACGT 2220CCGGGCGGAG GAGGCGTCAT CCCAAGCCGA ATTCTGCAGA TATCCATCAC ACTGGCGGCC 2280GCTCGAGCAT GCATCTAGAG GGCCCAATTC GCCCTATAGT GAGTCGTATT ACAATTCACT 2340GGCCGTCGTT TTACAACGTC GTGACTGGGA AAACCCTGGC GTTACCCAAC TAAATCGCCT 2400TGCAGCACAT CCCCCTTTCG CCAGCTGGCG TAATAGCGAA GAGGCCCGCA CCGATCGCCC 2460TTCCCAACAG TTGCGCAGCC TGAATGGCGA ATGGGACGCG CCCTGTAGCG GCGCATTAAG 2520CGCGGCGGGT GTGGTGGTTA CGCGCAGCGT GACCGCTACA CTTGCGAGCG CCGTAGCGCC 2580CGCTCCTTTC GCTTTCTTCC CTTCCTTTCT CGCCACGTTC GCCGGCTTTC CCCGTCAAGC 2640TCTAAATCGG GGGCTCCCTT TAGGGTTCCG ATTTAGAGCT TTACGGCACC TCGACCGCAA 2700AAAACTTGAT TTGGGTGATG GTTCACGTAG TGGGCCATCG CGCTGATAGA CGGTTTTTCG 2760CCCTTTGAGG TTGGAGTCCA CGTTCTTTAA TAGTGGACTC TTGTTCCAAA CTGGAACAAC 2820ACTCAACCCT ATCGCGGTCT ATTCTTTTGA TTTATAAGGG ATTTTGCCGA TTTCGGCCTA 2880TTGGTTAAAA AATGAGCTGA TTTAACAAAT TCAGGGGGCA AGGGCTGCTA AAGGAACCGG 2940AACACGTAGA AAGCCAGTCC GCAGAAACGG TGCTGAGCCC GGATGAATGT CAGCTACTGG 3000GCTATCTGGA CAAGGGAAAA CGCAAGCGCA AAGAGAAAGC AGGTAGCTTG CAGTGGGCTT 3060ACATGGCGAT AGCTAGACTG GGCGGTTTTA TGGACAGCAA GCGAACCGGA ATTGCCAGCT 3120GGGGCGCCCT CTGGTAAGGT TGGGAAGCCC TGCAAAGTAA ACTGGATGGC TTTCTTGCCG 3180CCAAGGATCT GATGGCGCAG GGGATCAAGA TCTGATCAAG AGACAGGATG AGGATCGTTT 3240CGCATGATTG AACAAGATGG ATTGCACGCA GGTTCTCCGG CCGCTTGGGT GGAGAGGCTA 3300TTCGGCTATG ACTGGGCACA ACAGACAATC GGCTGCTCTG ATGCCGCCGT GTTCCGGCTG 3360TCAGCGCAGG GGCGCCCGGT TCTTTTTGTC AAGACCGACC TGTCCGGTGC CCTGAATGAA 3420CTGCAGGACG AGGCAGCGCG GCTATCGTGG CTGGCCACGA CGGGCGTTCC TTGCGCAGCT 3480GTGCTCGACG TTGTCACTGA AGCGGGAAGG GACTGGCTGC TATTGGGCGA AGTGCCGGGG 3540CAGGATCTCC TGTCATCTCG CCTTGCTCCT GCCGAGAAAG TATCCATCAT GGCTGATGCA 3600ATGCGGCGGC TGCATACGCT TGATCCGGCT ACCTGCCCAT TCGACCACCA AGCGAAACAT 3660CGCATCGAGC GAGCACGTAC TCGGATGGAA GCCGGTCTTG TCGATCAGGA TGATCTGGAC 3720GAAGAGCATC AGGGGCTCGC GCCAGCCGAA CTGTTCGCCA GGCTCAAGGC GCGCATGCCC 3780GACGGCGAGG ATCTCGTCGT GATCCATGGC GATGCCTGCT TGCCGAATAT CATGGTGGAA 3840AATGGCCGCT TTTCTGGATT CAACGACTGT GGCCGGCTGG GTGTGGCGGA CCGCTATCAG 3900GACATAGCGT TGGATACCCG TGATATTGCT GAAGAGCTTG GCGGCGAATG GGCTGACCGC 3960TTCCTCGTGC TTTAcGGTAT CGCCGCTCCC GATTCGCAGC GCATCGCCTT CTATCGCCTT 4020CTTGACGAGT TCTTCTGAAT TGAAAAAGGA AGAGTATGAG TATTCAACAT TTCCGTGTCG 4080CCCTTATTCC CTTTTTTGCG GCATTTTGCC TTCCTGTTTT TGCTCACCCA GAAACGCTGG 4140TGAAAGTAAA AGATGCTGAA GATCAGTTGG GTGCACGAGT GGGTTACATC GAACTGGATC 4200TCAACAGCGG TAAGATCCTT GAGAGTTTTC GCCCCGAAGA ACGTTTTCCA ATGATGAGCA 4260CTTTTAAAGT TCTGCTATGT CATACACTAT TATCCCGTAT TGACGCCGGG CAAGAGCAAC 4320TCGGTCGCCG GGCGCGGTAT TCTCAGAATG ACTTGGTTGA GTACTCACCA GTCACAGAAA 4380AGCATCTTAC GGATGGCATG ACAGTAAGAG AATTATGCAG TGCTGCCATA ACCATGAGTG 4440ATAACACTGC GGCCAACTTA CTTCTGACAA CGATCGGAGG ACCGAAGGAG CTAACCGCTT 4500TTTTGCACAA CATGGGGGAT CATGTAACTC GCCTTGATCG TTGGGAACCG GAGCTGAATG 4560AAGCCATACC AAACGACGAG AGTGACACCA CGATGCCTGT AGCAATGCCA ACAACGTTGC 4620GCAAACTATT AACTGGCGAA CTACTTACTC TAGCTTCCCG GCAACAATTA ATAGACTGGA 4680TGGAGGCGGA TAAAGTTGCA GGACCACTTC TGCGCTCGGC CCTTCCGGCT GGCTGGTTTA 4740TTGCTGATAA ATCTGGAGCC GGTGAGCGTG GGTCTCGCGG TATCATTGCA GCACTGGGGC 4800CAGATGGTAA GCCCTCCCGT ATCGTAGTTA TCTACACGAC GGGGAGTCAG GCAACTATGG 4860ATGAACGAAA TAGACAGATC GCTGAGATAG GTGCCTCACT GATTAAGCAT TGGTAACTGT 4920CAGACCAAGT TTACTCATAT ATACTTTAGA TTGATTTAAA ACTTCATTTT TAATTTAAAA 4980GGATCTAGGT GAAGATCCTT TTTGATAATC TCATGACCAA AATCCCTTAA CGTGAGTTTT 5040CGTTCCACTG AGCGTCAGAC CCCGTAGAAA AGATCAAAGG ATCTTCTTGA GATCCTTTTT 5100TTCTGCGCGT AATCTGCTGC TTGCAAACAA AAAAACCACC GCTACCAGCG GTGGTTTGTT 5160TGCCGGATCA AGAGCTACCA ACTCTTTTTC CGAAGGTAAC TGGCTTCAGC AGAGCGCAGA 5220TACCAAATAC TGTCCTTCTA GTGTAGCCGT AGTTAGGCCA CCACTTCAAG AACTCTGTAG 5280CACCGCCTAC ATACCTCGCT CTGCTAATCC TGTTACCAGT GGCTGCTGCC AGTGGCGATA 5340AGTCGTGTCT TACCGGGTTG GACTCAAGAC GATAGTTACC GGATAAGGCG CAGCGGTCGG 5400GCTGAACGGG GGGTTCGTGC ACACAGCCCA GCTTGGAGCG AACGACCTAC ACCGAACTGA 5460GATACCTACA GCGTGAGCAT TGAGAAAGCG CCACGCTTCC CGAAGGGAGA AAGGCGGACA 5520GGTATCCGGT AAGCGGCAGG GTCGGAACAG GAGAGCGCAC GAGGGAGCTT CCAGGGGGAA 5580ACGCCTGGTA TCTTTATAGT CCTGTCGGGT TTCGCCACCT CTGACTTGAG CGTCGATTTT 5640TGTGATGCTC GTCACGGGGG CGGAGCCTAT GGAAAAACGC CAGCAACGCG GCCTTTTTAC 5700GGTTCCTGGC CTTTTGCTGG CCTTTTGCTC ACATGTTCTT TCCTGCGTTA TCCGCTGATT 5760CTGTGGATAA CCGTATTACC GCCTTTGAGT GAGCTGATAC CGCTCGCCGC AGCCGAACGA 5820CCGAGCGCAG CGAGTCAGTG AGCGAGGAAG CGGAAG 5856(2)SEQ ID NO:35的信息:
(ⅰ)序列特征:
(A)长度:7475个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..7475
(ⅹⅰ)序列描述:SEQ ID NO:35:GACGGATCGG GAGATCTCCC GATCCCCTAT GGTCGACTCT CAGTACAATC TGCTCTGATG 60CCGCATAGTT AAGCCAGTAT CTGCTCCCTG CTTGTGTGTT GGAGGTCGCT GAGTAGTGCG 120CGAGCAAAAT TTAAGCTACA ACAAGGCAAG GCTTGACCGA CAATTGCATG AAGAATCTGC 180TTAGGGTTAG GCGTTTTGCG CTGCTTCGCG ATGTACGGGC CAGATATACG CGTTGACATT 240GATTATTGAC TAGTTATTAA TAGTAATCAA TTACGGGGTC ATTAGTTCAT AGCCCATATA 300TGGAGTTCCG CGTTACATAA CTTACGGTAA ATGGCCCGCC TGGCTGACCG CCCAACGACC 360CCCGCCCATT GACGTCAATA ATGACGTATG TTCCCATAGT AACGCCAATA GGGACTTTCC 420ATTGACGTCA ATGGGTGGAC TATTTACGGT AAACTGCCCA CTTGGCAGTA CATCAAGTGT 480ATCATATGCC AAGTACGCCC CCTATTGACG TCAATGACGG TAAATGGCCC GCCTGGCATT 540ATGCCCAGTA CATGACCTTA TGGGACTTTC CTACTTGGCA GTACATCTAC GTATTAGTCA 600TCGCTATTAC CATGGTGATG CGGTTTTGGC AGTACATCAA TGGGCGTGGA TAGCGGTTTG 660ACTCACGGGG ATTTCCAAGT CTCCACCCCA TTGACGTCAA TGGGAGTTTG TTTTGGCACC 720AAAATCAACG GGACTTTCCA AAATGTCGTA ACAACTCCGC CCCATTGACG CAAATGGGCG 780GTAGGCGTGT ACGGTGGGAG GTCTATATAA GCAGAGCTCT CTGGCTAACT AGAGAACCCA 840CTGCTTACTG GCTTATCGAA ATTAATACGA CTCACTATAG GGAGACCCAA GCTGGCTAGC 900GTTTAAACGG GCCCTCTAGA CTCGAGCGGC CGCCACTGTG CTGGATATCT GCAGAATTCG 960GCTTGGGATG ACGCCTCCTC CGCCCGGACG TGCCGCCCCC AGCGCACCGC GCGCCCGCGT 1020CCCTGGCCCG CCGGCTCGGT TGGGGCTTCC GCTGCGGCTG CGGCTGCTGC TGCTGCTCTG 1080GGCGGCCGCC GCCTCCGCCC AGGGCCACCT AAGGAGCGGA CCCCGCATCT TCGCCGTCTG 1140GAAAGGCCAT GTAGGGCAGG ACCGGGTGGA CTTTGGCCAG ACTGAGCCGC ACACGGTGCT 1200TTTCCACGAG CCAGGCAGCT CCTCTGTGTG GGTGGGAGGA CGTGGCAAGG TCTACCTCTT 1260TGACTTCCCC GAGGGCAAGA ACGCATCTGT GCGCACGGTG AATATCGGCT CCACAAAGGG 1320GTCCTGTCTG GATAAGCGGG ACTGCGAGAA CTACATCACT CTCCTGGAGA GGCGGAGTGA 1380GGGGCTGCTG GCCTGTGGCA CCAACGCCCG GCACCCCAGC TGCTGGAACC TGGTGAATGG 1440CACTGTGGTG CCACTTGGCG AGATGAGAGG CTACGCCCCC TTCAGCCCGG ACGAGAACTC 1500CCTGGTTCTG TTTGAAGGGG ACGAGGTGTA TTCCACCATC CGGAAGCAGG AATACAATGG 1560GAAGATCCCT CGGTTCCGCC GCATCCGGGG CGAGAGTGAG CTGTACACCA GTGATACTGT 1620CATGCAGAAC CCACAGTTCA TCAAAGCCAC CATCGTGCAC CAAGACCAGG CTTACGATGA 1680CAAGATCTAC TACTTCTTCC GAGAGGACAA TCCTGACAAG AATCCTGAGG CTCCTCTCAA 1740TGTGTCCCGT GTGGCCCAGT TGTGCAGGGG GGACCAGGGT GGGGAAAGTT CACTGTCAGT 1800CTCCAAGTGG AACACTTTTC TGAAAGCCAT GCTGGTATGC AGTGATGCTG CCACCAACAA 1860GAACTTCAAC AGGCTGCAAG ACGTCTTCCT GCTCCCTGAC CCCAGCGGCC AGTGGAGGGA 1920CACCAGGGTC TATGGTGTTT TCTCCAACCC CTGGAACTAC TCAGCCGTCT GTGTGTATTC 1980CCTCGGTGAC ATTGACAAGG TCTTCCGTAC CTCCTCACTC AAGGGCTACC ACTCAAGCCT 2040TCCCAACCCG CGGCCTGGCA AGTGCCTCCC AGACCAGCAG CCGATACCCA CAGAGACCTT 2100CCAGGTGGCT GACCGTCACC CAGAGGTGGC GCAGAGGGTG GAGCCCATGG GGCCTCTGAA 2160GACGCCATTG TTCCACTCTA AATACCACTA CCAGAAAGTG GCCGTTCACC GCATGCAAGC 2220CAGCCACGGG GAGACCTTTC ATGTGCTTTA CCTAACTACA GACAGGGGCA CTATCCACAA 2280GGTGGTGGAA CCGGGGGAGC AGGAGCACAG CTTCGCCTTC AACATCATGG AGATCCAGCC 2340CTTCCGCCGC GCGGCTGCCA TCCAGACCAT GTCGCTGGAT GCTGAGCGGA GGAAGCTGTA 2400TGTGAGCTCC CAGTGGGAGG TGAGCCAGGT GCCCCTGGAC CTGTGTGAGG TCTATGGCGG 2460GGGCTGCCAC GGTTGCCTCA TGTCCCGAGA CCCCTACTGC GGCTGGGACC AGGGCCGCTG 2520CATCTCCATC TACAGCTCCG AACGGTCAGT GCTGCAATCC ATTAATCCAG CCGAGCCACA 2580CAAGGAGTGT CCCAACCCCA AACCAGACAA GGCCCCACTG CAGAAGGTTT CCCTGGCCCC 2640AAACTCTCGC TACTACCTGA GCTGCCCCAT GGAATCCCGC CACGCCACCT ACTCATGGCG 2700CCACAAGGAG AACGTGGAGC AGAGCTGCGA ACCTGGTCAC CAGAGCCCCA ACTGCATCCT 2760GTTCATCGAG AACCTCACGG CGCAGCAGTA CGGCCACTAC TTCTGCGAGG CCCAGGAGGG 2820CTCCTACTTC CGCGAGGCTC AGCACTGGCA GCTGCTGCCC GAGGACGGCA TCATGGCCGA 2880GCACCTGCTG GGTCATGCCT GTGCCCTGGC TGCCTCCCTC TGGCTGGGGG TGCTGCCCAC 2940ACTCACTCTT GGCTTGCTGG TCCACGTGAA GCTTGGGCCC GAACAAAAAC TCATCTCAGA 3000AGAGGATCTG AATAGCGCCG TCGACCATCA TCATCATCAT CATTGAGTTT AAACCGCTGA 3060TCAGCCTCGA CTGTGCCTTC TAGTTGCCAG CCATCTGTTG TTTGCCCCTC CCCCGTGCCT 3120TCCTTGACCC TGGAAGGTGC CACTCCCACT GTCCTTTCCT AATAAAATGA GGAAATTGCA 3180TCGCATTGTC TGAGTAGGTG TCATTCTATT CTGGGGGGTG GGGTGGGGCA GGACAGCAAG 3240GGGGAGGATT GGGAAGACAA TAGCAGGCAT GCTGGGGATG CGGTGGGCTC TATGGCTTCT 3300GAGGCGGAAA GAACCAGCTG GGGCTCTAGG GGGTATCCCC ACGCGCCCTG TAGCGGCGCA 3360TTAAGCGCGG CGGGTGTGGT GGTTACGCGC AGCGTGACCG CTACACTTGC CAGCGCCCTA 3420GCGCCCGCTC CTTTCGCTTT CTTCCCTTCC TTTCTCGCCA CGTTCGCCGG CTTTCCCCGT 3480CAAGCTCTAA ATCGGGGCAT CCCTTTAGGG TTCCGATTTA GTGCTTTACG GCACCTCGAC 3540CCCAAAAAAC TTGATTAGGG TGATGGTTCA CGTAGTGGGC CATCGCCCTG ATAGACGGTT 3600TTTCGCCCTT TGACGTTGGA GTCCACGTTC TTTAATAGTG GACTCTTGTT CCAAACTGGA 3660ACAACACTCA ACCCTATCTC GGTCTATTCT TTTGATTTAT AAGGGATTTT GGGGATTTCG 3720GCCTATTGGT TAAAAAATGA GCTGATTTAA CAAAAATTTA ACGCGAATTA ATTCTGTGGA 3780ATGTGTGTCA GTTAGGGTGT GGAAAGTCCC CAGGCTCCCC AGGCAGGCAG AAGTATGCAA 3840AGCATGCATC TCAATTAGTC AGCAACCAGG TGTGGAAAGT CCCCAGGCTC CCCAGCACGC 3900AGAAGTATGC AAAGCATGCA TCTCAATTAG TCAGCAACCA TAGTCCCGCC CCTAACTCCG 3960CCCATCCCGC CCCTAACTCC GCCCAGTTCC GCCCATTCTC CGCCCCATGG CTGACTAATT 4020TTTTTTATTT ATGCAGAGGC CGAGGCCGCC TCTGCCTCTG AGCTATTCCA GAAGTAGTGA 4080GGAGGCTTTT TTGGAGGCCT AGGCTTTTGC AAAAAGCTCC CGGGAGCTTG TATATCCATT 4140TTCGGATCTG ATCAAGAGAC AGGATGAGGA TCGTTTCGCA TGATTGAACA AGATGGATTG 4200CACGCAGGTT CTCCGGCCGC TTGGGTGGAG AGGCTATTCG GCTATGACTG GGCACAACAG 4260ACAATCGGCT GCTCTGATGC CGCCGTGTTC CGGCTGTCAG CGCAGGGGCG CCCGGTTCTT 4320TTTGTCAAGA CCGACCTGTC CGGTGCCCTG AATGAACTGC AGGACGAGGC AGCGCGGCTA 4380TCGTGGCTGG CCACGACGGG CGTTCCTTGC GCAGCTGTGC TCGACGTTGT CACTGAAGCG 4440GGAAGGGACT GGCTGCTATT GGGCGAAGTG CCGGGGCAGG ATCTCCTGTC ATCTCACCTT 4500GCTCCTGCCG AGAAAGTATC CATCATGGCT GATGCAATGC GGCGGCTGCA TACGCTTGAT 4560CCGGCTACCT GCCCATTCGA CCACCAAGCG AAACATCGCA TCGAGCGAGC ACGTACTCGG 4620ATGGAAGCCG GTCTTGTCGA TCAGGATGAT CTGGACGAAG AGCATCAGGG GCTCGCGCCA 4680GCCGAACTGT TCGCCAGGCT CAAGGCGCGC ATGCCCGACG GCGAGGATCT CGTCGTGACC 4740CATGGCGATG CCTGCTTGCC GAATATCATG GTGGAAAATG GCCGCTTTTC TGGATTCATC 4800GACTGTGGCC GGCTGGGTGT GGCGGACCGC TATCAGGACA TAGCGTTGGC TACCCGTGAT 4860ATTGCTGAAG AGCTTGGCGG CGAATGGGCT GACCGCTTCC TCGTGCTTTA CGGTATCGCC 4920GCTCCCGATT CGCAGCGCAT CGCCTTCTAT CGCCTTCTTG ACGAGTTCTT CTGAGCGGGA 4980CTCTGGGGTT CGAAATGACC GACCAAGCGA CGCCCAACCT GCCATCACGA GATTTCGATT 5040CCACCGCCGC CTTCTATGAA AGGTTGGGCT TCGGAATCGT TTTCCGGGAC GCCGGCTGGA 5100TGATCCTCCA GCGCGGGGAT CTCATGCTGG AGTTCTTCGC CCACCCCAAC TTGTTTATTG 5160CAGCTTATAA TGGTTACAAA TAAAGCAATA GCATCACAAA TTTCACAAAT AAAGCATTTT 5220TTTCACTGCA TTCTAGTTGT GGTTTGTCCA AACTCATCAA TGTATCTTAT CATGTCTGTA 5280TACCGTCGAC CTCTAGCTAG AGCTTGGCGT AATCATGGTC ATAGCTGTTT CCTGTGTGAA 5340ATTGTTATCC GCTCACAATT CCACACAACA TACGAGCCGG AAGCATAAAG TGTAAAGCCT 5400GGGGTGCCTA ATGAGTGAGC TAACTCACAT TAATTGCGTT GCGCTCACTG CCCGCTTTCC 5460AGTCGGGAAA CCTGTCGTGC CAGCTGCATT AATGAATCGG CCAACGCGCG GGGAGAGGCG 5520GTTTGCGTAT TGGGCGCTCT TCCGCTTCCT CGCTCACTGA CTCGCTGCGC TCGGTCGTTC 5580GGCTGCGGCG AGCGGTATCA GCTCACTCAA AGGCGGTAAT ACGGTTATCC ACAGAATCAG 5640GGGATAACGC AGGAAAGAAC ATGTGAGCAA AAGGCCAGCA AAAGGCCAGG AACCGTAAAA 5700AGGCCGCGTT GCTGGCGTTT TTCCATAGGC TCCGCCCCCC TGACGAGCAT CACAAAAATC 5760GACGCTCAAG TCAGAGGTGG CGAAACCCGA CAGGACTATA AAGATACCAG GCGTTTCCCC 5820CTGGAAGCTC CCTCGTGCGC TCTCCTGTTC CGACCCTGCC GCTTACCGGA TACCTGTCCG 5880CCTTTCTCCC TTCGGGAAGC GTGGCGCTTT CTCAATGCTC ACGCTGTAGG TATCTCAGTT 5940CGGTGTAGGT CGTTCGCTCC AAGCTGGGCT GTGTGCACGA ACCCCCCGTT CAGCCCGACC 6000GCTGCGCCTT ATCCGGTAAC TATCGTCTTG AGTCCAACCC GGTAAGACAC GACTTATCGC 6060CACTGGCAGC AGCCACTGGT AACAGGATTA GCAGAGCGAG GTATGTAGGC GGTGCTACAG 6120AGTTCTTGAA GTGGTGGCCT AACTACGGCT ACACTAGAAG GACAGTATTT GGTATCTGCG 6180CTCTGCTGAA GCCAGTTACC TTCGGAAAAA GAGTTGGTAG CTCTTGATCC GGCAAACAAA 6240CCACCGCTGG TAGCGGTGGT TTTTTTGTTT GCAAGCAGCA GATTACGCGC AGAAAAAAAG 6300GATCTCAAGA AGATCCTTTG ATCTTTTCTA CGGGGTCTGA CGCTCAGTGG AACGAAAACT 6360CACGTTAAGG GATTTTGGTC ATGAGATTAT CAAAAAGGAT CTTCACCTAG ATCCTTTTAA 6420ATTAAAAATG AAGTTTTAAA TCAATCTAAA GTATATATGA GTAAACTTGG TCTGACAGTT 6480ACCAATGCTT AATCAGTGAG GCACCTATCT CAGCGATCTG TCTATTTCGT TCATCCATAG 6540TTGCCTGACT CCCCGTCGTG TAGATAACTA CGATACGGGA GGGCTTACCA TCTGGCCCCA 6600GTGCTGCAAT GATACCGCGA GACCCACGCT CACCGGCTCC AGATTTATCA GCAATAAACC 6660AGCCAGCCGG AAGGGCCGAG CGCAGAAGTG GTCCTGCAAC TTTATCCGCC TCCATCCAGT 6720CTATTAATTG TTGCCGGGAA GCTAGAGTAA GTAGTTCGCC AGTTAATAGT TTGCGCAACG 6780TTGTTGCCAT TGCTACAGGC ATCGTGGTGT CACGCTCGTC GTTTGGTATG GCTTCATTCA 6840GCTCCGGTTC CCAACGATCA AGGCGAGTTA CATGATCCCC CATGTTGTGC AAAAAAGCGG 6900TTAGCTCCTT CGGTCCTCCG ATCGTTGTCA GAAGTAAGTT GGCCGCAGTG TTATCACTCA 6960TGGTTATGGC AGCACTGCAT AATTCTCTTA CTGTCATGCC ATCCGTAAGA TGCTTTTCTG 7020TGACTGGTGA GTACTCAACC AAGTCATTCT GAGAATAGTG TATGCGGCGA CCGAGTTGCT 7080CTTGCCCGGC GTCAATACGG GATAATACCG CGCCACATAG CAGAACTTTA AAAGTGCTCA 7140TCATTGGAAA ACGTTCTTCG GGGCGAAAAC TCTCAAGGAT CTTACCGCTG TTGAGATCCA 7200GTTCGATGTA ACCCACTCGT GCACCCAACT GATCTTCAGC ATCTTTTACT TTCACCAGCG 7260TTTCTGGGTG AGCAAAAACA GGAAGGCAAA ATGCCGCAAA AAAGGGAATA AGGGCGACAC 7320GGAAATGTTG AATACTCATA CTCTTCCTTT TTCAATATTA TTGAAGCATT TATCAGGGTT 7380ATTGTCTCAT GAGCGGATAC ATATTTGAAT GTATTTAGAA AAATAAACAA ATAGGGGTTC 7440CGCGCACATT TCCCCGAAAA GTGCCACCTG ACGTC 7475
(2)SEQ ID NO:36的信息:
(ⅰ)序列特征:
(A)长度:8192个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..8192
(ⅹⅰ)序列描述:SEQ ID NO:36:GACGGATCGG GAGATCTCCC GATCCCCTAT GGTCGACTCT CAGTACAATC TGCTCTGATG 60CCGCATAGTT AAGCCAGTAT CTGCTCCCTG CTTGTGTGTT GGAGGTCGCT GAGTAGTGCG 120CGAGCAAAAT TTAAGCTACA ACAAGGCAAG GCTTGACCGA CAATTGCATG AAGAATCTGC 180TTAGGGTTAG GCGTTTTGCG CTGCTTCGCG ATGTACGGGC CAGATATACG CGTTGACATT 240GATTATTGAC TAGTTATTAA TAGTAATCAA TTACGGGGTC ATTAGTTCAT AGCCCATATA 300TGGAGTTCCG CGTTACATAA CTTACGGTAA ATGGCCCGCC TGGCTGACCG CCCAACGACC 360CCCGCCCATT GACGTCAATA ATGACGTATG TTCCCATAGT AACGCCAATA GGGACTTTCC 420ATTGACGTCA ATGGGTGGAC TATTTACGGT AAACTGCCCA CTTGGCAGTA CATCAAGTGT 480ATCATATGCC AAGTACGCCC CCTATTGACG TCAATGACGG TAAATGGCCC GCCTGGCATT 540ATGCCCAGTA CATGACCTTA TGGGACTTTC CTACTTGGCA GTACATCTAC GTATTAGTCA 600TCGCTATTAC CATGGTGATG CGGTTTTGGC AGTACATCAA TGGGCGTGGA TAGCGGTTTG 660ACTCACGGGG ATTTCCAAGT CTCCACCCCA TTGACGTCAA TGGGAGTTTG TTTTGGCACC 720AAAATCAACG GGACTTTCCA AAATGGTCGTA ACAACTCCGC CCCATTGACG CAAATGGGCG 780GTAGGCGTGT ACGGTGGGAG GTCTATATAA GCAGAGCTCT CTGGCTAACT AGAGAACCCA 840CTGCTTACTG GCTTATCGAA ATTAATACGA CTCACTATAG GGAGACCCAA GCTGGCTAGC 900GTTTAAACGG GCCCTCTAGA CTCGAGCGGC CGCCACTGTG CTGGATATCT GCAGAATTCG 960GCTTGGGATG ACGCCTCCTC CGCCCGGACG TGCCGCCCCC AGCGCACCGC GCGCCCGCGT 1020CCCTGGCCCG CCGGCTCGGT TGGGGCTTCC GCTGCGGCTG CGGCTGCTGC TGCTGCTCTG 1080GGCGGCCGCC GCCTCCGCCC AGGGCCACCT AAGGAGCGGA CCCCGCATCT TCGCCGTCTG 1140GAAAGGCCAT GTAGGGCAGG ACCGGGTGGA CTTTGGCCAG ACTGAGCCGC ACACGGTGCT 1200TTTCCACGAG CCAGGCAGCT CCTCTGTGTG GGTGGGAGGA CGTGGCAAGG TCTACCTCTT 1260TGACTTCCCC GAGGGCAAGA ACGCATCTGT GCGCACGGTG AATATCGGCT CCACAAAGGG 1320GTCCTGTCTG GATAAGCGGG ACTGCGAGAA CTACATCACT CTCCTGGAGA GGCGGAGTGA 1380GGGGCTGCTG GCCTGTGGCA CCAACGCCCG GCACCCCAGC TGCTGGAACC TGGTGAATGG 1440CACTGTGGTG CCACTTGGCG AGATGAGAGG CTACGCCCCC TTCAGCCCGG ACGAGAACTC 1500CCTGGTTCTG TTTGAAGGGG ACGAGGTGTA TTCCACCATC CGGAAGCAGG AATACAATGG 1560GAAGATCCCT CGGTTCCGCC GCATCCGGGG CGAGAGTGAG CTGTACACCA GTGATACTGT 1620CATGCAGAAC CCACAGTTCA TCAAAGCCAC CATCGTGCAC CAAGACCAGG CTTACGATGA 1680CAAGATCTAC TACTTCTTCC GAGAGGACAA TCCTGACAAG AATCCTGAGG CTCCTCTCAA 1740TGTGTCCCGT GTGGCCCAGT TGTGCAGGGG GGACCAGGGT GGGGAAAGTT CACTGTCAGT 1800CTCCAAGTGG AACACTTTTC TGAAAGCCAT GCTGGTATGC AGTGATGCTG CCACCAACAA 1860GAACTTCAAC AGGCTGCAAG ACGTCTTCCT GCTCCCTGAC CCCAGCGGCC AGTGGAGGGA 1920CACCAGGGTC TATGGTGTTT TCTCCAACCC CTGGAACTAC TCAGCCGTCT GTGTGTATTC 1980CCTCGGTGAC ATTGACAAGG TCTTCCGTAC CTCCTCACTC AAGGGCTACC ACTCAAGCCT 2040TCCCAACCCG CGGCCTGGCA AGTGCCTCCC AGACCAGCAG CCGATACCCA CAGAGACCTT 2100CCAGGTGGCT GACCGTCACC CAGAGGTGGC GCAGAGGGTG GAGCCCATGG GGCCTCTGAA 2160GACGCCATTG TTCCACTCTA AATACCACTA CCAGAAAGTG GCCGTTCACC GCATGCAAGC 2220CAGCCACGGG GAGACCTTTC ATGTGCTTTA CCTAACTACA GACAGGGGCA CTATCCACAA 2280GGTGGTGGAA CCGGGGGAGC AGGAGCACAG CTTCGCCTTC AACATCATGG AGATCCAGCC 2340CTTCCGCCGC GCGGCTGCCA TCCAGACCAT GTCGCTGGAT GCTGAGCGGA GGAAGCTGTA 2400TGTGAGCTCC CAGTGGGAGG TGAGCCAGGT GCCCCTGGAC CTGTGTGAGG TCTATGGCGG 2460GGGCTGCCAC GGTTGCCTCA TGTCCCGAGA CCCCTACTGC GGCTGGGACC AGGGCCGCTG 2520CATCTCCATC TACAGCTCCG AACGGTCAGT GCTGCAATCC ATTAATCCAG CCGAGCCACA 2580CAAGGAGTGT CCCAACCCCA AACCAGACAA GGCCCCACTG CAGAAGGTTT CCCTGGCCCC 2640AAACTCTCGC TACTACCTGA GCTGCCCCAT GGAATCCCGC CACGCCACCT ACTCATGGCG 2700CCACAAGGAG AACGTGGAGC AGAGCTGCGA ACCTGGTCAC CAGAGCCCCA ACTGCATCCT 2760GTTCATCGAG AACCTCACGG CGCAGCAGTA CGGCCACTAC TTCTGCGAGG CCCAGGAGGG 2820CTCCTACTTC CGCGAGGCTC AGCACTGGCA GCTGCTGCCC GAGGACGGCA TCATGGCCGA 2880GCACCTGCTG GGTCATGCCT GTGCCCTGGC TGCCTCCCTC TGGCTGGGGG TGCTGCCCAC 2940ACTCACTCTT GGCTTGCTGG TCCACATGGT GAGCAAGGGC GAGGAGCTGT TCACCGGGGT 3000GGTGCCCATC CTGGTCGAGC TGGACGGCGA CGTAAACGGC CACAAGTTCA GCGTGTCCGG 3060CGAGGGCGAG GGCGATGCCA CCTACGGCAA GCTGACCCTG AAGTTCATCT GCACCACCGG 3120CAAGCTGCCC GTGCCCTGGC CCACCCTCGT GACCACCCTG ACCTACGGCG TGCAGTGCTT 3180CAGCCGCTAC CCCGACCACA TGAAGCAGCA CGACTTCTTC AAGTCCGCCA TGCCCGAAGG 3240CTACGTCCAG GAGCGCACCA TCTTCTTCAA GGACGACGGC AACTACAAGA CCCGCGCCGA 3300GGTGAAGTTC GAGGGCGACA CCCTGGTGAA CCGCATCGAG CTGAAGGGCA TCGACTTCAA 3360GGAGGACGGC AACATCCTGG GGCACAAGCT GGAGTACAAC TACAACAGCC ACAACGTCTA 3420TATCATGGCC GACAAGCAGA AGAACGGCAT CAAGGTGAAC TTCAAGATCC GCCACAACAT 3480CGAGGACGGC AGCGTGCAGC TCGCCGACCA CTACCAGCAG AACACCCCCA TCGGCGACGG 3540CCCCGTGCTG CTGCCCGACA ACCACTACCT GAGCACCCAG TCCGCCCTGA GCAAAGACCC 3600CAACGAGAAG CGCGATCACA TGGTCCTGCT GGAGTTCGTG ACCGCCGCCG GGATCACTCT 3660CGGCATGGAC GAGCTGTACA AGGTGAAGCT TGGGCCCGAA CAAAAACTCA TCTCAGAAGA 3720GGATCTGAAT AGCGCCGTCG ACCATCATCA TCATCATCAT TGAGTTTAAA CCGCTGATCA 3780GCCTCGACTG TGCCTTCTAG TTGCCAGCCA TCTGTTGTTT GCCCCTCCCC CGTGCCTTCC 3840TTGACCCTGG AAGGTGCCAC TCCCACTGTC CTTTCCTAAT AAAATGAGGA AATTGCATCG 3900CATTGTCTGA GTAGGTGTCA TTCTATTCTG GGGGGTGGGG TGGGGCAGGA CAGCAAGGGG 3960GAGGATTGGG AAGACAATAG CAGGCATGCT GGGGATGCGG TGGGCTCTAT GGCTTCTGAG 4020GCGGAAAGAA CCAGCTGGGG CTCTAGGGGG TATCCCCACG CGCCCTGTAG CGGCGCATTA 4080AGCGCGGCGG GTGTGGTGGT TACGCGCAGC GTGACCGCTA CACTTGCCAG CGCCCTAGCG 4140CCCGCTCCTT TCGCTTTCTT CCCTTCCTTT CTCGCCACGT TCGCCGGCTT TCCCCGTCAA 4200GCTCTAAATC GGGGCATCCC TTTAGGGTTC CGATTTAGTG CTTTACGGCA CCTCGACCCC 4260AAAAAACTTG ATTAGGGTGA TGGTTCACGT AGTGGGCCAT CGCCCTGATA GACGGTTTTT 4320CGCCCTTTGA CGTTGGAGTC CACGTTCTTT AATAGTGGAC TCTTGTTCCA AACTGGAACA 4380ACACTCAACC CTATCTCGGT CTATTCTTTT GATTTATAAG GGATTTTGGG GATTTCGGCC 4440TATTGGTTAA AAAATGAGCT GATTTAACAA AAATTTAACG CGAATTAATT CTGTGGAATG 4500TGTGTCAGTT AGGGTGTGGA AAGTCCCCAG GCTCCCCAGG CAGGCAGAAG TATGCAAAGC 4560ATGCATCTCA ATTAGTCAGC AACCAGGTGT GGAAAGTCCC CAGGCTCCCC AGCAGGCAGA 4620AGTATGCAAA GCATGCATCT CAATTAGTCA GCAACCATAG TCCCGCCCCT AACTCCGCCC 4680ATCCCGCCCC TAACTCCGCC CAGTTCCGCC CATTCTCCGC CCCATGGCTG ACTAATTTTT 4740TTTATTTATG CAGAGGCCGA GGCCGCCTCT GCCTCTGAGC TATTCCAGAA GTAGTGAGGA 4800GGCTTTTTTG GAGGCCTAGG CTTTTGCAAA AAGCTCCCGG GAGCTTGTAT ATCCATTTTC 4860GGATCTGATC AAGAGACAGG ATGAGGATCG TTTCGCATGA TTGAACAAGA TGGATTGCAC 4920GCAGGTTCTC CGGCCGCTTG GGTGGAGAGG CTATTCGGCT ATGACTGGGC ACAACAGACA 4980ATCGGCTGCT CTGATGCCGC CGTGTTCCGG CTGTCAGCGC AGGGGCGCCC GGTTCTTTTT 5040GTCAAGACCG ACCTGTCCGG TGCCCTGAAT GAACTGCAGG ACGAGGCAGC GCGGCTATCG 5100TGGCTGGCCA CGACGGGCGT TCCTTGCGCA GCTGTGCTCG ACGTTGTCAC TGAAGCGGGA 5160AGGGACTGGC TGCTATTGGG CGAAGTGCCG GGGCAGGATC TCCTGTCATC TCACCTTGCT 5220CCTGCCGAGA AAGTATCCAT CATGGCTGAT GCAATGCGGC GGCTGCATAC GCTTGATCCG 5280GCTACCTGCC CATTCGACCA CCAAGCGAAA CATCGCATCG AGCGAGCACG TACTCGGATG 5340GAAGCCGGTC TTGTCGATCA GGATGATCTG GACGAAGAGC ATCAGGGGCT CGCGCCAGCC 5400GAACTGTTCG CCAGGCTCAA GGCGCGCATG CCCGACGGCG AGGATCTCGT CGTGACCCAT 5460GGCGATGCCT GCTTGCCGAA TATCATGGTG GAAAATGGCC GCTTTTCTGG ATTCATCGAC 5520TGTGGCCGGC TGGGTGTGGC GGACCGCTAT CAGGACATAG CGTTGGCTAC CCGTGATATT 5580GCTGAAGAGC TTGGCGGCGA ATGGGCTGAC CGCTTCCTCG TGCTTTACGG TATCGCCGCT 5640CCCGATTCGC AGCGCATCGC CTTCTATCGC CTTCTTGACG AGTTCTTCTG AGCGGGACTC 5700TGGGGTTCGA AATGACCGAC CAAGCGACGC CCAACCTGCC ATCACGAGAT TTCGATTCCA 5760CCGCCGCCTT CTATGAAAGG TTGGGCTTCG GAATCGTTTT CCGGGACGCC GGCTGGATGA 5820TCCTCCAGCG CGGGGATCTC ATGCTGGAGT TCTTCGCCCA CCCCAACTTG TTTATTGCAG 5880CTTATAATGG TTACAAATAA AGCAATAGCA TCACAAATTT CACAAATAAA GCATTTTTTT 5940CACTGCATTC TAGTTGTGGT TTGTCCAAAC TCATCAATGT ATCTTATCAT GTCTGTATAC 6000CGTCGACCTC TAGCTAGAGC TTGGCGTAAT CATGGTCATA GCTGTTTCCT GTGTGAAATT 6060GTTATCCGCT CACAATTCCA CACAACATAC GAGCCGGAAG CATAAAGTGT AAAGCCTGGG 6120GTGCCTAATG AGTGAGCTAA CTCACATTAA TTGCGTTGCG CTCACTGCCC GCTTTCCAGT 6180CGGGAAACCT GTCGTGCCAG CTGCATTAAT GAATCGGCCA ACGCGCGGGG AGAGGCGGTT 6240TGCGTATTGG GCGCTCTTCC GCTTCCTCGC TCACTGACTC GCTGCGCTCG GTCGTTCGGC 6300TGCGGCGAGC GGTATCAGCT CACTCAAAGG CGGTAATACG GTTATCCACA GAATCAGGGG 6360ATAACGCAGG AAAGAACATG TGAGCAAAAG GCCAGCAAAA GGCCAGGAAC CGTAAAAAGG 6420CCGCGTTGCT GGCGTTTTTC CATAGGCTCC GCCCCCCTGA CGAGCATCAC AAAAATCGAC 6480GCTCAAGTCA GAGGTGGCGA AACCCGACAG GACTATAAAG ATACCAGGCG TTTCCCCCTG 6540GAAGCTCCCT CGTGCGCTCT CCTGTTCCGA CCCTGCCGCT TACCGGATAC CTGTCCGCCT 6600TTCTCCCTTC GGGAAGCGTG GCGCTTTCTC AATGCTCACG CTGTAGGTAT CTCAGTTCGG 6660TGTAGGTCGT TCGCTCCAAG CTGGGCTGTG TGCACGAACC CCCCGTTCAG CCCGACCGCT 6720GCGCCTTATC CGGTAACTAT CGTCTTGAGT CCAACCCGGT AAGACACGAC TTATCGCCAC 6780TGGCAGCAGC CACTGGTAAC AGGATTAGCA GAGCGAGGTA TGTAGGCGGT GCTACAGAGT 6840TCTTGAAGTG GTGGCCTAAC TACGGCTACA CTAGAAGGAC AGTATTTGGT ATCTGCGCTC 6900TGCTGAAGCC AGTTACCTTC GGAAAAAGAG TTGGTAGCTC TTGATCCGGC AAACAAACCA 6960CCGCTGGTAG CGGTGGTTTT TTTGTTTGCA AGCAGCAGAT TACGCGCAGA AAAAAAGGAT 7020CTCAAGAAGA TCCTTTGATC TTTTCTACGG GGTCTGACGC TCAGTGGAAC GAAAACTCAC 7080GTTAAGGGAT TTTGGTCATG AGATTATCAA AAAGGATCTT CACCTAGATC CTTTTAAATT 7140AAAAATGAAG TTTTAAATCA ATCTAAAGTA TATATGAGTA AACTTGGTCT GACAGTTACC 7200AATGCTTAAT CAGTGAGGCA CCTATCTCAG CGATCTGTCT ATTTCGTTCA TCCATAGTTG 7260CCTGACTCCC CGTCGTGTAG ATAACTACGA TACGGGAGGG CTTACCATCT GGCCCCAGTG 7320CTGCAATGAT ACCGCGAGAC CCACGCTCAC CGGCTCCAGA TTTATCAGCA ATAAACCAGC 7380CAGCCGGAAG GGCCGAGCGC AGAAGTGGTC CTGCAACTTT ATCCGCCTCC ATCCAGTCTA 7440TTAATTGTTG CCGGGAAGCT AGAGTAAGTA GTTCGCCAGT TAATAGTTTG CGCAACGTTG 7500TTGCCATTGC TACAGGCATC GTGGTGTCAC GCTCGTCGTT TGGTATGGCT TCATTCAGCT 7560CCGGTTCCCA ACGATCAAGG CGAGTTACAT GATCCCCCAT GTTGTGCAAA AAAGCGGTTA 7620AGATCTCGGC CGCATATTAA GTGCATTGTT CTCGATACCG CTAAGTGCAT TGTTCTCGTT 60AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC GATGGACAAG TGCATTGTTC 120TCTTGCTGAA AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC AGTACCCGGG 180AGTACCCTCG ACCGCCGGAG TATAAATAGA GGCGCTTCGT CTACGGAGCG ACAATTCAAT 240TCAAACAAGC AAAGTGAACA CGTCGCTAAG CGAAAGCTAA GCAAATAAAC AAGCGCAGCT 300GAACAAGCTA AACAATCTGC AGTAAAGTGC AAGTTAAAGT GAATCAATTA AAAGTAACCA 360GCAACCAAGT AAATCAACTG CAACTACTGA AATCTGCCAA GAAGTAATTA TTGAATACAA 420GAAGAGAACT CTGAATACTT TCAACAAGTT ACCGAGAAAG AAGAACTCAC ACACAGCTAG 480CGTTTAAACT TAAGCTTGGT ACCGAGCTCG GATCCACTAG TCCAGTGTGG TGGAATTCGG 540
(2)SEQ ID NO:37的信息:
(ⅰ)序列特征:
(A)长度:7000个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..7000
(ⅹⅰ)序列描述:SEQ ID NO:37:GCTCCTTCGG TCCTCCGATC GTTGTCAGAA GTAAGTTGGC CGCAGTGTTA TCACTCATGG 7680TTATGGCAGC ACTGCATAAT TCTCTTACTG TCATGCCATC CGTAAGATGC TTTTCTGTGA 7740CTGGTGAGTA CTCAACCAAG TCATTCTGAG AATAGTGTAT GCGGCGACCG AGTTGCTCTT 7800GCCCGGCGTC AATACGGGAT AATACCGCGC CACATAGCAG AACTTTAAAA GTGCTCATCA 7860TTGGAAAACG TTCTTCGGGG CGAAAACTCT CAAGGATCTT ACCGCTGTTG AGATCCAGTT 7920CGATGTAACC CACTCGTGCA CCCAACTGAT CTTCAGCATC TTTTACTTTC ACCAGCGTTT 7980CTGGGTGAGC AAAAACAGGA AGGCAAAATG CCGCAAAAAA GGGAATAAGG GCGACACGGA 8040AATGTTGAAT ACTCATACTC TTCCTTTTTC AATATTATTG AAGCATTTAT CAGGGTTATT 8100GTCTCATGAG CGGATACATA TTTGAATGTA TTTAGAAAAA TAAACAAATA GGGGTTCCGC 8160GCACATTTCC CCGAAAAGTG CCACCTGACG TC 8192CTTGGGATGA CGCCTCCTCC GCCCGGACGT GCCGCCCCCA GcGCAccGCG CGCCCGCGTC 600CCTGGCCCGC CGGCTCGGTT GGGGCTTCCG CTGCGGCTGC GGCTGCTGCT GCTGCTCTGG 660GCGGCCGCCG CCTCCGCCCA GGGCCACCTA AGGAGCGGAC CCCGCATCTT CGCCGTCTGG 720AAAGGCCATG TAGGGCAGGA CCGGGTGGAC TTTGGCCAGA CTGAGCCGCA CACGGTGCTT 780TTCCACGAGC CAGGCAGCTC CTCTGTGTGG GTGGGAGGAC GTGGCAAGGT CTACCTCTTT 840GACTTCCCCG AGGGCAAGAA CGCATCTGTG CGCACGGTGA ATATCGGCTC CACAAAGGGG 900TCCTGTCTGG ATAAGCGGGA CTGCGAGAAC TACATCACTC TCCTGGAGAG GCGGAGTGAG 960GGGCTGCTGG CCTGTGGCAC CAACGCCCGG CACCCCAGCT GCTGGAACCT GGTGAATGGC 1020ACTGTGGTGC CACTTGGCGA GATGAGAGGC TACGCCCCCT TCAGCCCGGA CGAGAACTCC 1080CTGGTTCTGT TTGAAGGGGA CGAGGTGTAT TCCACCATCC GGAAGCAGGA ATACAATGGG 1140AAGATCCCTC GGTTCCGCCG CATCCGGGGC GAGAGTGAGC TGTACACCAG TGATACTGTC 1200ATGCAGAACC CACAGTTCAT CAAAGCCACC ATCGTGCACC AAGACCAGGC TTACGATGAC 1260AAGATCTACT ACTTCTTCCG AGAGGACAAT CCTGACAAGA ATCCTGAGGC TCCTCTCAAT 1320GTGTCCCGTG TGGCCCAGTT GTGCAGGGGG GACCAGGGTG GGGAAAGTTC ACTGTCAGTC 1380TCCAAGTGGA ACACTTTTCT GAAAGCCATG CTGGTATGCA GTGATGCTGC CACCAACAAG 1440AACTTCAACA GGCTGCAAGA CGTCTTCCTG CTCCCTGACC CCAGCGGCCA GTGGAGGGAC 1500ACCAGGGTCT ATGGTGTTTT CTCCAACCCC TGGAACTACT CAGCCGTCTG TGTGTATTCC 1560CTCGGTGACA TTGACAAGGT CTTCCGTACC TCCTCACTCA AGGGCTACCA CTCAAGCCTT 1620CCCAACCCGC GGCCTGGCAA GTGCCTCCCA GACCAGCAGC CGATACCCAC AGAGACCTTC 1680CAGGTGGCTG ACCGTCACCC AGAGGTGGCG CAGAGGGTGG AGCCCATGGG GCCTCTGAAG 1740ACGCCATTGT TCCACTCTAA ATACCACTAC CAGAAAGTGG CCGTTCACCG CATGCAAGCC 1800AGCCACGGGG AGACCTTTCA TGTGCTTTAC CTAACTACAG ACAGGGGCAC TATCCACAAG 1860GTGGTGGAAC CGGGGGAGCA GGAGCACAGC TTCGCCTTCA ACATCATGGA GATCCAGCCC 1920TTCCGCCGCG CGGCTGCCAT CCAGACCATG TCGCTGGATG CTGAGCGGAG GAAGCTGTAT 1980GTGAGCTCCC AGTGGGAGGT GAGCCAGGTG CCCCTGGACC TGTGTGAGGT CTATGGCGGG 2040GGCTGCCACG GTTGCCTCAT GTCCCGAGAC CCCTACTGCG GCTGGGACCA GGGCCGCTGC 2100ATCTCCATCT ACAGCTCCGA ACGGTCAGTG CTGCAATCCA TTAATCCAGC CGAGCCACAC 2160AAGGAGTGTC CCAACCCCAA ACCAGACAAG GCCCCACTGC AGAAGGTTTC CCTGGCCCCA 2220AACTCTCGCT ACTACCTGAG CTGCCCCATG GAATCCCGCC ACGCCACCTA CTCATGGCGC 2280CACAAGGAGA ACGTGGAGCA GAGCTGCGAA CCTGGTCACC AGAGCCCCAA CTGCATCCTG 2340TTCATCGAGA ACCTCACGGC GCAGCAGTAC GGCCACTACT TCTGCGAGGC CCAGGAGGGC 2400TCCTACTTCC GCGAGGCTCA GCACTGGCAG CTGCTGCCCG AGGACGGCAT CATGGCCGAG 2460CACCTGCTGG GTCATGCCTG TGCCCTGGCT GCCTCCCTCT GGCTGGGGGT GCTGCCCACA 2520CTCACTCTTG GCTTGCTGGT CCACGTGAAG CTTGGGCCCG TTTAAACCCG CTGATCAGCC 2580TCGACTGTGC CTTCTAGTTG CCAGCCATCT GTTGTTTGCC CCTCCCCCGT GCCTTCCTTG 2640ACCCTGGAAG GTGCCACTCC CACTGTCCTT TCCTAATAAA ATGAGGAAAT TGCATCGCAT 2700TGTCTGAGTA GGTGTCATTC TATTCTGGGG GGTGGGGTGG GGCAGGACAG CAAGGGGGAG 2760GATTGGGAAG ACAATAGCAG GCATGCTGGG GATGCGGTGG GCTCTATGGC TTCTGAGGCG 2820GAAAGAACCA GCTGGGGCTC TAGGGGGTAT CCCCACGCGC CCTGTAGCGG CGCATTAAGC 2880GCGGCGGGTG TGGTGGTTAC GCGCAGCGTG ACCGCTACAC TTGCCAGCGC CCTAGCGCCC 2940GCTCCTTTCG CTTTCTTCCC TTCCTTTCTC GCCACGTTCG CCGGCTTTCC CCGTCAAGCT 3000CTAAATCGGG GCATCCCTTT AGGGTTCCGA TTTAGTGCTT TACGGCACCT CGACCCCAAA 3060AAACTTGATT AGGGTGATGG TTCACGTAGT GGGCCATCGC CCTGATAGAC GGTTTTTCGC 3120CCTTTGACGT TGGAGTCCAC GTTCTTTAAT AGTGGACTCT TGTTCCAAAC TGGAACAACA 3180CTCAACCCTA TCTCGGTCTA TTCTTTTGAT TTATAAGGGA TTTTGGGGAT TTCGGCCTAT 3240TGGTTAAAAA ATGAGCTGAT TTAACAAAAA TTTAACGCGA ATTAATTCTG TGGAATGTGT 3300GTCAGTTAGG GTGTGGAAAG TCCCCAGGCT CCCCAGGCAG GCAGAAGTAT GCAAAGCATG 3360CATCTCAATT AGTCAGCAAC CAGGTGTGGA AAGTCCCCAG GCTCCCCAGC AGGCAGAAGT 3420ATGCAAAGCA TGCATCTCAA TTAGTCAGCA ACCATAGTCC CGCCCCTAAC TCCGCCCATC 3480CCGCCCCTAA CTCCGCCCAG TTCCGCCCAT TCTCCGCCCC ATGGCTGACT AATTTTTTTT 3540ATTTATGCAG AGGCCGAGGC CGCCTCTGCC TCTGAGCTAT TCCAGAAGTA GTGAGGAGGC 3600TTTTTTGGAG GCCTAGGCTT TTGCAAAAAG CTCCCGGGAG CTTGTATATC CATTTTCGGA 3660TCTGATCAAG AGACAGGATG AGGATCGTTT CGCATGATTG AACAAGATGG ATTGCACGCA 3720GGTTCTCCGG CCGCTTGGGT GGAGAGGCTA TTCGGCTATG ACTGGGCACA ACAGACAATC 3780GGCTGCTCTG ATGCCGCCGT GTTCCGGCTG TCAGCGCAGG GGCGCCCGGT TCTTTTTGTC 3840AAGACCGACC TGTCCGGTGC CCTGAATGAA CTGCAGGACG AGGCAGCGCG GCTATCGTGG 3900CTGGCCACGA CGGGCGTTCC TTGCGCAGCT GTGCTCGACG TTGTCACTGA AGCGGGAAGG 3960GACTGGCTGC TATTGGGCGA AGTGCCGGGG CAGGATCTCC TGTCATCTCA CCTTGCTCCT 4020GCCGAGAAAG TATCCATCAT GGCTGATGCA ATGCGGCGGC TGCATACGCT TGATCCCGCT 4080ACCTGCCCAT TCGACCACCA AGCGAAACAT CGCATCGAGC GAGCACGTAC TCGGATGGAA 4140GCCGGTCTTG TCGATCAGGA TGATCTGGAC GAAGAGCATC AGGGGCTCGC GCCAGCCGAA 4200CTGTTCGCCA GGCTCAAGGC GCGCATGCCC GACGGCGAGG ATCTCGTCGT GACCCATGGC 4260GATGCCTGCT TGCCGAATAT CATGGTGGAA AATGGCCGCT TTTCTGGATT CATCGACTGT 4320GGCCGGCTGG GTGTGGCGGA CCGCTATCAG GACATAGCGT TGGCTACCCG TGATATTGCT 4380GAAGAGCTTG GCGGCGAATG GGCTGACCGC TTCCTCGTGC TTTACGGTAT CGCCGCTCCC 4440GATTCGCAGC GCATCGCCTT CTATCGCCTT CTTGACGAGT TCTTCTGAGC GGGACTCTGG 4500GGTTCGAAAT GACCGACCAA GCGACGCCCA ACCTGCCATC ACGAGATTTC GATTCCACCG 4560CCGCCTTCTA TGAAAGGTTG GGCTTCGGAA TCGTTTTCCG GGACGCCGGC TGGATGATCC 4620TCCAGCGCGG GGATCTCATG CTGGAGTTCT TCGCCCACCC CAACTTGTTT ATTGCAGCTT 4680ATAATGGTTA CAAATAAAGC AATAGCATCA CAAATTTCAC AAATAAAGCA TTTTTTTCAC 4740TGCATTCTAG TTGTGGTTTG TCCAAACTCA TCAATGTATC TTATCATGTC TGTATACCGT 4800CGACCTCTAG CTAGAGCTTG GCGTAATCAT GGTCATAGCT GTTTCCTGTG TGAAATTGTT 4860ATCCGCTCAC AATTCCACAC AACATACGAG CCGGAAGCAT AAAGTGTAAA GCCTGGGGTG 4920CCTAATGAGT GAGCTAACTC ACATTAATTG CGTTGCGCTC ACTGCCCGCT TTCCAGTCGG 4980GAAACCTGTC GTGCCAGCTG CATTAATGAA TCGGCCAACG CGCGGGGAGA GGCGGTTTGC 5040GTATTGGGCG CTCTTCCGCT TCCTCGCTCA CTGACTCGCT GCGCTCGGTC GTTCGGCTGC 5100GGCGAGCGGT ATCAGCTCAC TCAAAGGCGG TAATACGGTT ATCCACAGAA TCAGGGGATA 5160ACGCAGGAAA GAACATGTGA GCAAAAGGCC AGCAAAAGGC CAGGAACCGT AAAAAGGCCG 5220CGTTGCTGGC GTTTTTCCAT AGGCTCCGCC CCCCTGACGA GCATCACAAA AATCGACGCT 5280CAAGTCAGAG GTGGCGAAAC CCGACAGGAC TATAAAGATA CCAGGCGTTT CCCCCTGGAA 5340GCTCCCTCGT GCGCTCTCCT GTTCCGACCC TGCCGCTTAC CGGATACCTG TCCGCCTTTC 5400TCCCTTCGGG AAGCGTGGCG CTTTCTCAAT GCTCACGCTG TAGGTATCTC AGTTCGGTGT 5460AGGTCGTTCG CTCCAAGCTG GGCTGTGTGC ACGAACCCCC CGTTCAGCCC GACCGCTGCG 5520CCTTATCCGG TAACTATCGT CTTGAGTCCA ACCCGGTAAG ACACGACTTA TCGCCACTGG 5580CAGCAGCCAC TGGTAACAGG ATTAGCAGAG CGAGGTATGT AGGCGGTGCT ACAGAGTTCT 5640TGAAGTGGTG GCCTAACTAC GGCTACACTA GAAGGACAGT ATTTGGTATC TGCGCTCTGC 5700TGAAGCCAGT TACCTTCGGA AAAAGAGTTG GTAGCTCTTG ATCCGGCAAA CAAACCACCG 5760CTGGTAGCGG TGGTTTTTTT GTTTGCAAGC AGCAGATTAC GCGCAGAAAA AAAGGATCTC 5820AAGAAGATCC TTTGATCTTT TCTACGGGGT CTGACGCTCA GTGGAACGAA AACTCACGTT 5880AAGGGATTTT GGTCATGAGA TTATCAAAAA GGATCTTCAC CTAGATCCTT TTAAATTAAA 5940AATGAAGTTT TAAATCAATC TAAAGTATAT ATGAGTAAAC TTGGTCTGAC AGTTACCAAT 6000GCTTAATCAG TGAGGCACCT ATCTCAGCGA TCTGTCTATT TCGTTCATCC ATAGTTGCCT 6060GACTCCCCGT CGTGTAGATA ACTACGATAC GGGAGGGCTT ACCATCTGGC CCCAGTGCTG 6120CAATGATACC GCGAGACCCA CGCTCACCGG CTCCAGATTT ATCAGCAATA AACCAGCCAG 6180CCGGAAGGGC CGAGCGCAGA AGTGGTCCTG CAACTTTATC CGCCTCCATC CAGTCTATTA 6240ATTGTTGCCG GGAAGCTAGA GTAAGTAGTT CGCCAGTTAA TAGTTTGCGC AACGTTGTTG 6300CCATTGCTAC AGGCATCGTG GTGTCACGCT CGTCGTTTGG TATGGCTTCA TTCAGCTCCG 6360GTTCCCAACG ATCAAGGCGA GTTACATGAT CCCCCATGTT GTGCAAAAAA GCGGTTAGCT 6420CCTTCGGTCC TCCGATCGTT GTCAGAAGTA AGTTGGCCGC AGTGTTATCA CTCATGGTTA 6480TGGCAGCACT GCATAATTCT CTTACTGTCA TGCCATCCGT AAGATGCTTT TCTGTGACTG 6540GTGAGTACTC AACCAAGTCA TTCTGAGAAT AGTGTATGCG GCGACCGAGT TGCTCTTGCC 6600CGGCGTCAAT ACGGGATAAT ACCGCGCCAC ATAGCAGAAC TTTAAAAGTG CTCATCATTG 6660GAAAACGTTC TTCGGGGCGA AAACTCTCAA GGATCTTACC GCTGTTGAGA TCCAGTTCGA 6720TGTAACCCAC TCGTGCACCC AACTGATCTT CAGCATCTTT TACTTTCACC AGCGTTTCTG 6780GGTGAGCAAA AACAGGAAGG CAAAATGCCG CAAAAAAGGG AATAAGGGCG ACACGGAAAT 6840GTTGAATACT CATACTCTTC CTTTTTCAAT ATTATTGAAG CATTTATCAG GGTTATTGTC 6900TCATGAGCGG ATACATATTT GAATGTATTT AGAAAAATAA ACAAATAGGG GTTCCGCGCA 6960CATTTCCCCG AAAAGTGCCA CCTGACGTCG ACGGATCGGG 7000(2)SEQ ID NO:38的信息:
(ⅰ)序列特征:
(A)长度:7108个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅹⅰ)序列描述:SEQ ID NO:38:AGATCTCGGC CGCATATTAA GTGCATTGTT CTCGATACCG CTAAGTGCAT TGTTCTCGTT 60AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC GATGGACAAG TGCATTGTTC 120TCTTGCTGAA AGCTCGATGG ACAAGTGCAT TGTTCTCTTG CTGAAAGCTC AGTACCCGGG 180AGTACCCTCG ACCGCCGGAG TATAAATAGA GGCGCTTCGT CTACGGAGCG ACAATTCAAT 240TCAAACAAGC AAAGTGAACA CGTCGCTAAG CGAAAGCTAA GCAAATAAAC AAGCGCAGCT 300GAACAAGCTA AACAATCTGC AGTAAAGTGC AAGTTAAAGT GAATCAATTA AAAGTAACCA 360GCAACCAAGT AAATCAACTG CAACTACTGA AATCTGCCAA GAAGTAATTA TTGAATACAA 420GAAGAGAACT CTGAATACTT TCAACAAGTT ACCGAGAAAG AAGAACTCAC ACACAGCTAG 480CGTTTAAACT TAAGCTTGGT ACCGAGCTCG GATCCACTAG TCCAGTGTGG TGGAATTCGG 540CTTGGGATGA CGCCTCCTCC GCCCGGACGT GCCGCCCCCA GCGCACCGCG CGCCCGCGTC 600CCTGGCCCGC CGGCTCGGTT GGGGCTTCCG CTGCGGCTGC GGCTGCTGCT GCTGCTCTGG 660GCGGCCGCCG CCTCCGCCCA GGGCCACCTA AGGAGCGGAC CCCGCATCTT CGCCGTCTGG 720AAAGGCCATG TAGGGCAGGA CCGGGTGGAC TTTGGCCAGA CTGAGCCGCA CACGGTGCTT 780TTCCACGAGC CAGGCAGCTC CTCTGTGTGG GTGGGAGGAC GTGGCAAGGT CTACCTCTTT 840GACTTCCCCG AGGGCAAGAA CGCATCTGTG CGCACGGTGA ATATCGGCTC CACAAAGGGG 900TCCTGTCTGG ATAAGCGGGA CTGCGAGAAC TACATCACTC TCCTGGAGAG GCGGAGTGAG 960GGGCTGCTGG CCTGTGGCAC CAACGCCCGG CACCCCAGCT GCTGGAACCT GGTGAATGGC 1020ACTGTGGTGC CACTTGGCGA GATGAGAGGC TACGCCCCCT TCAGCCCGGA CGAGAACTCC 1080CTGGTTCTGT TTGAAGGGGA CGAGGTGTAT TCCACCATCC GGAAGCAGGA ATACAATGGG 1140AAGATCCCTC GGTTCCGCCG CATCCGGGGC GAGAGTGAGC TGTACACCAG TGATACTGTC 1200ATGCAGAACc CACAGTTCAT CAAAGCCACC ATCGTGCACC AAGACCAGGC TTACGATGAC 1260AAGATCTACT ACTTCTTCCG AGAGGACAAT CCTGACAAGA ATCCTGAGGC TCCTCTCAAT 1320GTGTCCCGTG TGGCCCAGTT GTGCAGGGGG GACCAGGGTG GGGAAAGTTC ACTGTCAGTC 1380TCCAAGTGGA ACACTTTTCT GAAAGCCATG CTGGTATGCA GTGATGCTGC CACCAACAAG 1440AACTTCAACA GGCTGCAAGA CGTCTTCCTG CTCCCTGACC CCAGCGGCCA GTGGAGGGAC 1500ACCAGGGTCT ATGGTGTTTT CTCCAACcCC TGGAACTACT CAGCCGTCTG TGTGTATTCC 1560CTCGGTGACA TTGACAAGGT CTTCCGTACC TCCTCACTCA AGGGCTACCA CTCAAGCCTT 1620CCCAACCCGC GGCCTGGCAA GTGCCTCCCA GACCAGCAGC CGATACCCAC AGAGACCTTC 1680CAGGTGGCTG ACCGTCACCC AGAGGTGGCG CAGAGGGTGG AGCCCATGGG GCCTCTGAAG 1740ACGCCATTGT TCCACTCTAA ATACCACTAC CAGAAAGTGG CCGTTCACCG CATGCAAGCC 1800AGCCACGGGG AGACCTTTCA TGTGCTTTAC CTAACTACAG ACAGGGGCAC TATCCACAAG 1860GTGGTGGAAC CGGGGGAGCA GGAGCACAGC TTCGCCTTCA ACATCATGGA GATCCAGCCC 1920TTCCGCCGCG CGGCTGCCAT CCAGACCATG TCGCTGGATG CTGAGCGGAG GAAGCTGTAT 1980GTGAGCTCCC AGTGGGAGGT GAGCCAGGTG CCCCTGGACC TGTGTGAGGT CTATGGCGGG 2040GGCTGCCACG GTTGCCTCAT GTCCCGAGAC CCCTACTGCG GCTGGGACCA GGGCCGCTGC 2100ATCTCCATCT ACAGCTCCGA ACGGTCAGTG CTGCAATCCA TTAATCCAGC CGAGCCACAC 2160AAGGAGTGTC CCAACCCCAA ACCAGACAAG GCCCCACTGC AGAAGGTTTC CCTGGCCCCA 2220AACTCTCGCT ACTACCTGAG CTGCCCCATG GAATCCCGCC ACGCCACCTA CTCATGGCGC 2280CACAAGGAGA ACGTGGAGCA GAGCTGCGAA CCTGGTCACC AGAGCCCCAA CTGCATCCTG 2340TTCATCGAGA ACCTCACGGC GCAGCAGTAC GGCCACTACT TCTGCGAGGC CCAGGAGGGC 2400TCCTACTTCC GCGAGGCTCA GCACTGGCAG CTGCTGCCCG AGGACGGCAT CATGGCCGAG 2460CACCTGCTGG GTCATGCCTG TGCCCTGGCT GCCTCCCTCT GGCTGGGGGT GCTGCCCACA 2520CTCACTCTTG GCTTGCTGGT CCACGTGAAG CTTGGGCCCG AACAAAAACT CATCTCAGAA 2580GAGGATCTGA ATAGCGCCGT CGACCATCAT CATCATCATC ATTGAGTTTA TCCAGCACAG 2640TGGCGGCCGC TCGAGTCTAG AGGGCCCGTT TAAACCCGCT GATCAGCCTC GACTGTGCCT 2700TCTAGTTGCC AGCCATCTGT TGTTTGCCCC TCCCCCGTGC CTTCCTTGAC CCTGGAAGGT 2760GCCACTCCCA CTGTCCTTTC CTAATAAAAT GAGGAAATTG CATCGCATTG TCTGAGTAGG 2820TGTCATTCTA TTCTGGGGGG TGGGGTGGGG CAGGACAGCA AGGGGGAGGA TTGGGAAGAC 2880AATAGCAGGC ATGCTGGGGA TGCGGTGGGC TCTATGGCTT CTGAGGCGGA AAGAACCAGC 2940TGGGGCTCTA GGGGGTATCC CCACGCGCCC TGTAGCGGCG CATTAAGCGC GGCGGGTGTG 3000GTGGTTACGC GCAGCGTGAC CGCTACACTT GCCAGCGCCC TAGCGCCCGC TCCTTTCGCT 3060TTCTTCCCTT CCTTTCTCGC CACGTTCGCC GGCTTTCCCC GTCAAGCTCT AAATCGGGGC 3120ATCCCTTTAG GGTTCCGATT TAGTGCTTTA CGGCACCTCG ACCCCAAAAA ACTTGATTAG 3180GGTGATGGTT CACGTAGTGG GCCATCGCCC TGATAGACGG TTTTTCGCCC TTTGACGTTG 3240GAGTCCACGT TCTTTAATAG TGGACTCTTG TTCCAAACTG GAACAACACT CAACCCTATC 3300TCGGTCTATT CTTTTGATTT ATAAGGGATT TTGGGGATTT CGGCCTATTG GTTAAAAAAT 3360GAGCTGATTT AACAAAAATT TAACGCGAAT TAATTCTGTG GAATGTGTGT CAGTTAGGGT 3420GTGGAAAGTC CCCAGGCTCC CCAGGCAGGC AGAAGTATGC AAAGCATGCA TCTCAATTAG 3480TCAGCAACCA GGTGTGGAAA GTCCCCAGGC TCCCCAGCAG GCAGAAGTAT GCAAAGCATG 3540CATCTCAATT AGTCAGCAAC CATAGTCCCG CCCCTAACTC CGCCCATCCC GCCCCTAACT 3600CCGCCCAGTT CCGCCCATTC TCCGCCCCAT GGCTGACTAA TTTTTTTTAT TTATGCAGAG 3660GCCGAGGCCG CCTCTGCCTC TGAGCTATTC CAGAAGTAGT GAGGAGGCTT TTTTGGAGGC 3720CTAGGCTTTT GCAAAAAGCT CCCGGGAGCT TGTATATCCA TTTTCGGATC TGATCAAGAG 3780ACAGGATGAG GATCGTTTCG CATGATTGAA CAAGATGGAT TGCACGCAGG TTCTCCGGCC 3840GCTTGGGTGG AGAGGCTATT CGGCTATGAC TGGGCACAAC AGACAATCGG CTGCTCTGAT 3900GCCGCCGTGT TCCGGCTGTC AGCGCAGGGG CGCCCGGTTC TTTTTGTCAA GACCGACCTG 3960TCCGGTGCCC TGAATGAACT GCAGGACGAG GCAGCGCGGC TATCGTGGCT GGCCACGACG 4020GGCGTTCCTT GCGCAGCTGT GCTCGACGTT GTCACTGAAG CGGGAAGGGA CTGGCTGCTA 4080TTGGGCGAAG TGCCGGGGCA GGATCTCCTG TCATCTCACC TTGCTCCTGC CGAGAAAGTA 4140TCCATCATGG CTGATGCAAT GCGGCGGCTG CATACGCTTG ATCCGGCTAC CTGCCCATTC 4200GACCACCAAG CGAAACATCG CATCGAGCGA GCACGTACTC GGATGGAAGC CGGTCTTGTC 4260GATCAGGATG ATCTGGACGA AGAGCATCAG GGGCTCGCGC CAGCCGAACT GTTCGCCAGG 4320CTCAAGGCGC GCATGCCCGA CGGCGAGGAT CTCGTCGTGA CCCATGGCGA TGCCTGCTTG 4380CCGAATATCA TGGTGGAAAA TGGCCGCTTT TCTGGATTCA TCGACTGTGG CCGGCTGGGT 4440GTGGCGGACC GCTATCAGGA CATAGCGTTG GCTACCCGTG ATATTGCTGA AGAGCTTGGC 4500GGCGAATGGG CTGACCGCTT CCTCGTGCTT TACGGTATCG CCGCTCCCGA TTCGCAGCGC 4560ATCGCCTTCT ATCGCCTTCT TGACGAGTTC TTCTGAGCGG GACTCTGGGG TTCGAAATGA 4620CCGACCAAGC GACGCCCAAC CTGCCATCAC GAGATTTCGA TTCCACCGCC GCCTTCTATG 4680AAAGGTTGGG CTTCGGAATC GTTTTCCGGG ACGCCGGCTG GATGATCCTC CAGCGCGGGG 4740ATCTCATGCT GGAGTTCTTC GCCCACCCCA ACTTGTTTAT TGCAGCTTAT AATGGTTACA 4800AATAAAGCAA TAGCATCACA AATTTCACAA ATAAAGCATT TTTTTCACTG CATTCTAGTT 4860GTGGTTTGTC CAAACTCATC AATGTATCTT ATCATGTCTG TATACCGTCG ACCTCTAGCT 4920AGAGCTTGGC GTAATCATGG TCATAGCTGT TTCCTGTGTG AAATTGTTAT CCGCTCACAA 4980TTCCACACAA CATACGAGCC GGAAGCATAA AGTGTAAAGC CTGGGGTGCC TAATGAGTGA 5040GCTAACTCAC ATTAATTGCG TTGCGCTCAC TGCCCGCTTT CCAGTCGGGA AACCTGTCGT 5100GCCAGCTGCA TTAATGAATC GGCCAACGCG CGGGGAGAGG CGGTTTGCGT ATTGGGCGCT 5160CTTCCGCTTC CTCGCTCACT GACTCGCTGC GCTCGGTCGT TCGGCTGCGG CGAGCGGTAT 5220CAGCTCACTC AAAGGCGGTA ATACGGTTAT CCACAGAATC AGGGGATAAC GCAGGAAAGA 5280ACATGTGAGC AAAAGGCCAG CAAAAGGCCA GGAACCGTAA AAAGGCCGCG TTGCTGGCGT 5340TTTTCCATAG GCTCCGCCCC CCTGACGAGC ATCACAAAAA TCGACGCTCA AGTCAGAGGT 5400GGCGAAACCC GACAGGACTA TAAAGATACC AGGCGTTTCC CCCTGGAAGC TCCCTCGTGC 5460GCTCTCCTGT TCCGACCCTG CCGCTTACCG GATACCTGTC CGCCTTTCTC CCTTCGGGAA 5520GCGTGGCGCT TTCTCAATGC TCACGCTGTA GGTATCTCAG TTCGGTGTAG GTCGTTCGCT 5580CCAAGCTGGG CTGTGTGCAC GAACCCCCCG TTCAGCCCGA CCGCTGCGCC TTATCCGGTA 5640ACTATCGTCT TGAGTCCAAC CCGGTAAGAC ACGACTTATC GCCACTGGCA GCAGCCACTG 5700GTAACAGGAT TAGCAGAGCG AGGTATGTAG GCGGTGCTAC AGAGTTCTTG AAGTGGTGGC 5760CTAACTACGG CTACACTAGA AGGACAGTAT TTGGTATCTG CGCTCTGCTG AAGCCAGTTA 5820CCTTCGGAAA AAGAGTTGGT AGCTCTTGAT CCGGCAAACA AACCACCGCT GGTAGCGGTG 5880GTTTTTTTGT TTGCAAGCAG CAGATTACGC GCAGAAAAAA AGGATCTCAA GAAGATCCTT 5940TGATCTTTTC TACGGGGTCT GACGCTCAGT GGAACGAAAA CTCACGTTAA GGGATTTTGG 6000TCATGAGATT ATCAAAAAGG ATCTTCACCT AGATCCTTTT AAATTAAAAA TGAAGTTTTA 6060AATCAATCTA AAGTATATAT GAGTAAACTT GGTCTGACAG TTACCAATGC TTAATCAGTG 6120AGGCACCTAT CTCAGCGATC TGTCTATTTC GTTCATCCAT AGTTGCCTGA CTCCCCGTCG 6180TGTAGATAAC TACGATACGG GAGGGCTTAC CATCTGGCCC CAGTGCTGCA ATGATACCGC 6240GAGACCCACG CTCACCGGCT CCAGATTTAT CAGCAATAAA CCAGCCAGCC GGAAGGGCCG 6300AGCGCAGAAG TGGTCCTGCA ACTTTATCCG CCTCCATCCA GTCTATTAAT TGTTGCCGGG 6360AAGCTAGAGT AAGTAGTTCG CCAGTTAATA GTTTGCGCAA CGTTGTTGCC ATTGCTACAG 6420GCATCGTGGT GTCACGCTCG TCGTTTGGTA TGGCTTCATT CAGCTCCGGT TCCCAACGAT 6480CAAGGCGAGT TACATGATCC CCCATGTTGT GCAAAAAAGC GGTTAGCTCC TTCGGTCCTC 6540CGATCGTTGT CAGAAGTAAG TTGGCCGCAG TGTTATCACT CATGGTTATG GCAGCACTGC 6600ATAATTCTCT TACTGTCATG CCATCCGTAA GATGCTTTTC TGTGACTGGT GAGTACTCAA 6660CCAAGTCATT CTGAGAATAG TGTATGCGGC GACCGAGTTG CTCTTGCCCG GCGTCAATAC 6720GGGATAATAC CGCGCCACAT AGCAGAACTT TAAAAGTGCT CATCATTGGA AAACGTTCTT 6780CGGGGCGAAA ACTCTCAAGG ATCTTACCGC TGTTGAGATC CAGTTCGATG TAACCCACTC 6840GTGCACCCAA CTGATCTTCA GCATCTTTTA CTTTCACCAG CGTTTCTGGG TGAGCAAAAA 6900CAGGAAGGCA AAATGCCGCA AAAAAGGGAA TAAGGGCGAC ACGGAAATGT TGAATACTCA 6960TACTCTTCCT TTTTCAATAT TATTGAAGCA TTTATCAGGG TTATTGTCTC ATGAGCGGAT 7020ACATATTTGA ATGTATTTAG AAAAATAAAC AAATAGGGGT TCCGCGCACA TTTCCCCGAA 7080AAGTGCCACC TGACGTCGAC GGATCGGG 7108
(2)SEQ ID NO:39的信息:
(ⅰ)序列特征:
(A)长度:4019个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..4019
(ⅹⅰ)序列描述:SEQ ID NO:39:CTCGAGAAAT CATAAAAAAT TTATTTGCTT TGTGAGCGGA TAACAATTAT AATAGATTCA 60ATTGTGAGCG GATAACAATT TCACACAGAA TTCATTAAAG AGGAGAAATT AACTATGAGA 120GGATCGCATC ACCATCACCA TCACGGATCC CTGGTTCTGT TTGAAGGGGA CGAGGTGTAT 180TCCACCATCC GGAAGCAGGA ATACAATGGG AAGATCCCTC GGTTCCGCCG CATCCGGGGC 240GAGAGTGAGC TGTACACCAG TGATACTGTC ATGCAGAACC CACAGTTCAT CAAAGCCACC 300ATCGTGCACC AAGACCAGGC TTACGATGAC AAGATCTACT ACTTCTTCCG AGAGGACAAT 360CCTGACAAGA ATCCTGAGGC TCCTCTCAAT GTGTCCCGTG TGGCCCAGTT GTGCAGGGGG 420GACCAGGGTG GGGAAAGTTC ACTGTCAGTC TCCAAGTGGA ACACTTTTCT GAAAGCCATG 480CTGGTATGCA GTGATGCTGC CACCAACAAG AACTTCAACA GGCTGCAAGA CGTCTTCCTG 540CTCCCTGACC CCAGCGGCCA GTGGAGGGAC ACCAGGGTCT ATGGTGTTTT CTCCAACCCC 600TGGAACTACT CAGCCGTCTG TGTGTATTCC CTCGGTGACA TTGACAAGGT CTTCCGTACC 660TCCTCACTCA AGGGCTACCA CTCAAGCCTT CCCAACCCGC GGCCTGGCAA GTGCCTCCCA 720GACCAGCAGC CGATACCCAC AGAAAGCTTA ATTAGCTGAG CTTGGACTCC TGTTGATAGA 780TCCAGTAATG ACCTCAGAAC TCCATCTGGA TTTGTTCAGA ACGCTCGGTT GCCGCCGGGC 840GTTTTTTATT GGTGAGAATC CAAGCTAGCT TGGCGAGATT TTCAGGAGCT AAGGAAGCTA 900AAATGGAGAA AAAAATCACT GGATATACCA CCGTTGATAT ATCCCAATGG CATCGTAAAG 960AACATTTTGA GGCATTTCAG TCAGTTGCTC AATGTACCTA TAACCAGACC GTTCAGCTGG 1020ATATTACGGC CTTTTTAAAG ACCGTAAAGA AAAATAAGCA CAAGTTTTAT CCGGCCTTTA 1080TTCACATTCT TGCCCGCCTG ATGAATGCTC ATCCGGAATT TCGTATGGCA ATGAAAGACG 1140GTGAGCTGGT GATATGGGAT AGTGTTCACC CTTGTTACAC CGTTTTCCAT GAGCAAACTG 1200AAACGTTTTC ATCGCTCTGG AGTGAATACC ACGACGATTT CCGGCAGTTT CTACACATAT 1260ATTCGCAAGA TGTGGCGTGT TACGGTGAAA ACCTGGCCTA TTTCCCTAAA GGGTTTATTG 1320AGAATATGTT TTTCGTCTCA GCCAATCCCT GGGTGAGTTT CACCAGTTTT GATTTAAACG 1380TGGCCAATAT GGACAACTTC TTCGCCCCCG TTTTCACCAT GGGCAAATAT TATACGCAAG 1440GCGACAAGGT GCTGATGCCG CTGGCGATTC AGGTTCATCA TGCCGTCTGT GATGGCTTCC 1500ATGTCGGCAG AATGCTTAAT GAATTACAAC AGTACTGCGA TGAGTGGCAG GGCGGGGCGT 1560AATTTTTTTA AGGCAGTTAT TGGTGCCCTT AAACGCCTGG GGTAATGACT CTCTAGCTTG 1620AGGCATCAAA TAAAACGAAA GGGTCAGTCG AAAGACTGGG CCTTTCGTTT TATCTGTTGT 1680TTGTCGGTGA ACGCTCTCCT GAGTAGGACA AATCCGCCGC TCTAGAGCTG CCTCGCGCGT 1740TTCGGTGATG ACGGTGAAAA CCTCTGACAC ATGCAGCTCC CGGAGACGGT CACAGCTTGT 1800CTGTAAGCGG ATGCCGGGAG CAGACAAGCC CGTCAGGGCG CGTCAGCGGG TGTTGGCGGG 1860TGTCGGGGCG CAGCCATGAC CCAGTCACGT AGCGATAGCG GAGTGTATAC TGGCTTAACT 1920ATGCGGCATC AGAGCAGATT GTACTGAGAG TGCACCATAT GCGGTGTGAA ATACCGCACA 1980GATGCGTAAG GAGAAAATAC CGCATCAGGC GCTCTTCCGC TTCCTCGCTC ACTGACTCGC 2040TGCGCTCGGT CTGTCGGCTG CGGCGAGCGG TATCAGCTCA CTCAAAGGCG GTAATACGGT 2100TATCCACAGA ATCAGGGGAT AACGCAGGAA AGAACATGTG AGCAAAAGGC CAGCAAAAGG 2160CCAGGAACCG TAAAAAGGCC GCGTTGCTGG CGTTTTTCCA TAGGCTCCGC CCCCCTGACG 2220AGCATCACAA AAATCGACGC TCAAGTCAGA GGTGGCGAAA CCCGACAGGA CTATAAAGAT 2280ACCAGGCGTT TCCCCCTGGA AGCTCCCTCG TGCGCTCTCC TGTTCCGACC CTGCCGCTTA 2340CCGGATACCT GTCCGCCTTT CTCCCTTCGG GAAGCGTGGC GCTTTCTCAA TGCTCACGCT 2400GTAGGTATCT CAGTTCGGTG TAGGTCGTTC GCTCCAAGCT GGGCTGTGTG CACGAACCCC 2460CCGTTCAGCC CGACCGCTGC GCCTTATCCG GTAACTATCG TCTTGAGTCC AACCCGGTAA 2520GACACGACTT ATCGCCACTG GCAGCAGCCA CTGGTAACAG GATTAGCAGA GCGAGGTATG 2580TAGGCGGTGC TACAGAGTTC TTGAAGTGGT GGCCTAACTA CGGCTACACT AGAAGGACAG 2640TATTTGGTAT CTGCGCTCTG CTGAAGCCAG TTACCTTCGG AAAAAGAGTT GGTAGCTCTT 2700GATCCGGCAA ACAAACCACC GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG CAGCAGATTA 2760CGCGCAGAAA AAAAGGATCT CAAGAAGATC CTTTGATCTT TTCTACGGGG TCTGACGCTC 2820AGTGGAACGA AAACTCACGT TAAGGGATTT TGGTCATGAG ATTATCAAAA AGGATCTTCA 2880CCTAGATCCT TTTAAATTAA AAATGAAGTT TTAAATCAAT CTAAAGTATA TATGAGTAAA 2940CTTGGTCTGA CAGTTACCAA TGCTTAATCA GTGAGGCACC TATCTCAGCG ATCTGTCTAT 3000TTCGTTCATC CATAGCTGCC TGACTCCCCG TCGTGTAGAT AACTACGATA CGGGAGGGCT 3060TACCATCTGG CCCCAGTGCT GCAATGATAC CGCGAGACCC ACGCTCACCG GCTCCAGATT 3120TATCAGCAAT AAACCAGCCA GCCGGAAGGG CCGAGCGCAG AAGTGGTCCT GCAACTTTAT 3180CCGCCTCCAT CCAGTCTATT AATTGTTGCC GGGAAGCTAG AGTAAGTAGT TCGCCAGTTA 3240ATAGTTTGCG CAACGTTGTT GCCATTGCTA CAGGCATCGT GGTGTCACGC TCGTCGTTTG 3300GTATGGCTTC ATTCAGCTCC GGTTCCCAAC GATCAAGGCG AGTTACATGA TCCCCCATGT 3360TGTGCAAAAA AGCGGTTAGC TCCTTCGGTC CTCCGATCGT TGTCAGAAGT AAGTTGGCCG 3420CAGTGTTATC ACTCATGGTT ATGGCAGCAC TGCATAATTC TCTTACTGTC ATGCCATCCG 3480TAAGATGCTT TTCTGTGACT GGTGAGTACT CAACCAAGTC ATTCTGAGAA TAGTGTATGC 3540GGCGACCGAG TTGCTCTTGC CCGGCGTCAA TACGGGATAA TACCGCGCCA CATAGCAGAA 3600CTTTAAAAGT GCTCATCATT GGAAAACGTT CTTCGGGGCG AAAACTCTCA AGGATCTTAC 3660CGCTGTTGAG ATCCAGTTCG ATGTAACCCA CTCGTGCACC CAACTGATCT TCAGCATCTT 3720TTACTTTCAC CAGCGTTTCT GGGTGAGCAA AAACAGGAAG GCAAAATGCC GCAAAAAAGG 3780GAATAAGGGC GACACGGAAA TGTTGAATAC TCATACTCTT CCTTTTTCAA TATTATTGAA 3840GCATTTATCA GGGTTATTGT CTCATGAGCG GATACATATT TGAATGTATT TAGAAAAATA 3900AACAAATAGG GGTTCCGCGC ACATTTCCCC GAAAAGTGCC ACCTGACGTC TAAGAAACCA 3960TTATTATCAT GACATTAACC TATAAAAATA GGCGTATCAC GAGGCCCTTT CGTCTTCAC 4019
(2)SEQ ID NO:40的信息:
(ⅰ)序列特征:
(A)长度:3999个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..3999
(ⅹⅰ)序列描述:SEQ ID NO:40:CTCGAGAAAT CATAAAAAAT TTATTTGCTT TGTGAGCGGA TAACAATTAT AATAGATTCA 60ATTGTGAGCG GATAACAATT TCACACAGAA TTCATTAAAG AGGAGAAATT AACTATGAGA 120GGATCGCATC ACCATCACCA TCACACGGAT CCGCATGCGA GCTCCCAGTG GGAGGTGAGC 180CAGGTGCCCC TGGACCTGTG TGAGGTCTAT GGCGGGGGCT GCCACGGTTG CCTCATGTCC 240CGAGACCCCT ACTGCGGCTG GGACCAGGGC CGCTGCATCT CCATCTACAG CTCCGAACGG 300TCAGTGCTGC AATCCATTAA TCCAGCCGAG CCACACAAGG AGTGTCCCAA CCCCAAACCA 360GACAAGGCCC CACTGCAGAA GGTTTCCCTG GCCCCAAACT CTCGCTACTA CCTGAGCTGC 420CCCATGGAAT CCCGCCACGC CACCTACTCA TGGCGCCACA AGGAGAACGT GGAGCAGAGC 480TGCGAACCTG GTCACCAGAG CCCCAACTGC ATCCTGTTCA TCGAGAACCT CACGGCGCAG 540CAGTACGGCC ACTACTTCTG CGAGGCCCAG GAGGGCTCCT ACTTCCGCGA GGCTCAGCAC 600TGGCAGCTGC TGCCCGAGGA CGGCATCATG GCCGAGCACC TGCTGGGTCA TGCCTGTGCC 660CTGGCTGCCT CCCTCTGGCT GGGGGTGCTG CCCACACTCA CTCTTGGCTT GCTGGTCCAC 720GTGAAGCTTA ATTAGCTGAG CTTGGACTCC TGTTGATAGA TCCAGTAATG ACCTCAGAAC 780TCCATCTGGA TTTGTTCAGA ACGCTCGGTT GCCGCCGGGC GTTTTTTATT GGTGAGAATC 840CAAGCTAGCT TGGCGAGATT TTCAGGAGCT AAGGAAGCTA AAATGGAGAA AAAAATCACT 900GGATATACCA CCGTTGATAT ATCCCAATGG CATCGTAAAG AACATTTTGA GGCATTTCAG 960TCAGTTGCTC AATGTACCTA TAACCAGACC GTTCAGCTGG ATATTACGGC CTTTTTAAAG 1020ACCGTAAAGA AAAATAAGCA CAAGTTTTAT CCGGCCTTTA TTCACATTCT TGCCCGCCTG 1080 ATGAATGCTC ATCCGGAATT TCGTATGGCA ATGAAAGACG GTGAGCTGGT GATATGGGAT 1140AGTGTTCACC CTTGTTACAC CGTTTTCCAT GAGCAAACTG AAACGTTTTC ATCGCTCTGG 1200AGTGAATACC ACGACGATTT CCGGCAGTTT CTACACATAT ATTCGCAAGA TGTGGCGTGT 1260TACGGTGAAA ACCTGGCCTA TTTCCCTAAA GGGTTTATTG AGAATATGTT TTTCGTCTCA 1320GCCAATCCCT GGGTGAGTTT CACCAGTTTT GATTTAAACG TGGCCAATAT GGACAACTTC 1380TTCGCCCCCG TTTTCACCAT GGGCAAATAT TATACGCAAG GCGACAAGGT GCTGATGCCG 1440CTGGCGATTG AGGTTCATCA TGCCGTCTGT GATGGCTTCC ATGTCGGCAG AATGCTTAAT 1500GAATTACAAC AGTACTGCGA TGAGTGGCAG GGCGGGGCGT AATTTTTTTA AGGCAGTTAT 1560TGGTGCCCTT AAACGCCTGG GGTAATGACT CTCTAGCTTG AGGCATCAAA TAAAACGAAA 1620GGCTCAGTCG AAAGACTGGG CCTTTCGTTT TATCTGTTGT TTGTCGGTGA ACGCTCTCCT 1680GAGTAGGACA AATCCGCCGC TCTAGAGCTG CCTCGCGCGT TTCGGTGATG ACGGTGAAAA 1740CCTCTGACAC ATGCAGCTCC CGGAGACGGT CACAGCTTGT CTGTAAGCGG ATGCCGGGAG 1800CAGACAAGCC CGTCAGGGCG CGTCAGCGGG TGTTGGCGGG TGTCGGGGCG CAGCCATGAC 1860CCAGTCACGT AGCGATAGCG GAGTGTATAC TGGCTTAACT ATGCGGCATC AGAGCAGATT 1920GTACTGAGAG TGCACCATAT GCGGTGTGAA ATACCGCACA GATGCGTAAG GAGAAAATAC 1980CGCATCAGGC GCTCTTCCGC TTCCTCGCTC ACTGACTCGC TGCGCTCGGT CTGTCGGCTG 2040CGGCGAGCGG TATCAGCTCA CTCAAAGGCG GTAATACGGT TATCCACAGA ATCAGGGGAT 2100AACGCAGGAA AGAACATGTG AGCAAAAGGC CAGCAAAAGG CCAGGAACCG TAAAAAGGCC 2160GCGTTGCTGG CGTTTTTCCA TAGGCTCCGC CCCCCTGACG AGCATCACAA AAATCGACGC 2220TCAAGTCAGA GGTGGCGAAA CCCGACAGGA CTATAAAGAT ACCAGGCGTT TCCCCCTGGA 2280AGCTCCCTCG TGCGCTCTCC TGTTCCGACC CTGCCGCTTA CCGGATACCT GTCCGCCTTT 2340CTCCCTTCGG GAAGCGTGGC GCTTTCTCAA TGCTCACGCT GTAGGTATCT CAGTTCGGTG 2400TAGGTCGTTC GCTCCAAGCT GGGCTGTGTG CACGAACCCC CCGTTCAGCC CGACCGCTGC 2460GCCTTATCCG GTAACTATCG TCTTGAGTCC AACCCGGTAA GACACGACTT ATCGCCACTG 2520GCAGCAGCCA CTGGTAACAG GATTAGCAGA GCGAGGTATG TAGGCGGTGC TACAGAGTTC 2580TTGAAGTGGT GGCCTAACTA CGGCTACACT AGAAGGACAG TATTTGGTAT CTGCGCTCTG 2640CTGAAGCCAG TTACCTTCGG AAAAAGAGTT GGTAGCTCTT GATCCGGCAA ACAAACCACC 2700GCTGGTAGCG GTGGTTTTTT TGTTTGCAAG CAGCAGATTA CGCGCAGAAA AAAAGGATCT 2760CAAGAAGATC CTTTGATCTT TTCTACGGGG TCTGACGCTC AGTGGAACGA AAACTCACGT 2820TAAGGGATTT TGGTCATGAG ATTATCAAAA AGGATCTTCA CCTAGATCCT TTTAAATTAA 2880AAATGAAGTT TTAAATCAAT CTAAAGTATA TATGAGTAAA CTTGGTCTGA CAGTTACCAA 2940TGCTTAATCA GTGAGGCACC TATCTCAGCG ATCTGTCTAT TTCGTTCATC CATAGCTGCC 3000TGACTCCCCG TCGTGTAGAT AACTACGATA CGGGAGGGCT TACCATCTGG CCCCAGTGCT 3060GCAATGATAC CGCGAGACCC ACGCTCACCG GCTCCAGATT TATCAGCAAT AAACCAGCCA 3120GCCGGAAGGG CCGAGCGCAG AAGTGGTCCT GCAACTTTAT CCGCCTCCAT CCAGTCTATT 3180AATTGTTGCC GGGAAGCTAG AGTAAGTAGT TCGCCAGTTA ATAGTTTGCG CAACGTTGTT 3240GCCATTGCTA CAGGCATCGT GGTGTCACGC TCGTCGTTTG GTATGGCTTC ATTCAGCTCC 3300GGTTCCCAAC GATCAAGGCG AGTTACATGA TCCCCCATGT TGTGCAAAAA AGCGGTTAGC 3360TCCTTCGGTC CTCCGATCGT TGTCAGAAGT AAGTTGGCCG CAGTGTTATC ACTCATGGTT 3420ATGGCAGCAC TGCATAATTC TCTTACTGTC ATGCCATCCG TAAGATGCTT TTCTGTGACT 3480GGTGAGTACT CAACCAAGTC ATTCTGAGAA TAGTGTATGC GGCGACCGAG TTGCTCTTGC 3540CCGGCGTCAA TACGGGATAA TACCGCGCCA CATAGCAGAA CTTTAAAAGT GCTCATCATT 3600GGAAAACGTT CTTCGGGGCG AAAACTCTCA AGGATCTTAC CGCTGTTGAG ATCCAGTTCG 3660ATGTAACCCA CTCGTGCACC CAACTGATCT TCAGCATCTT TTACTTTCAC CAGCGTTTCT 3720GGGTGAGCAA AAACAGGAAG GCAAAATGCC GCAAAAAAGG GAATAAGGGC GACACGGAAA 3780TGTTGAATAC TCATACTCTT CCTTTTTCAA TATTATTGAA GCATTTATCA GGGTTATTGT 3840CTCATGAGCG GATACATATT TGAATGTATT TAGAAAAATA AACAAATAGG GGTTCCGCGC 3900ACATTTCCCC GAAAAGTGCC ACCTGACGTC TAAGAAACCA TTATTATCAT GACATTAACC 3960TATAAAAATA GGCGTATCAC GAGGCCCTTT CGTCTTCAC 3999(2)SEQ ID NO:41的信息:
(ⅰ)序列特征:
(A)长度:8888个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:DNA(基因组的)
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..8888
(ⅹⅰ)序列描述:SEQ ID NO:41:GAGCCGCACA CGGTGCTTTT CCACGAGCCA GGCAGCTCCT CTGTGTGGGT GGGAGGACGT 60GGCAAGGTCT ACCTCTTTGA CTTCCCCGAG GGCAAGAACG CATCTGTGCG CACGGTGAGC 120CTCTCTCTTC CCCCAACACC CCCCCTACCC TCTTATCTCC CCTCTGGCCC TGCCAAGGGT 180CCTCAGGGAA TCCGACGGAG CTGGCTTCTC TTCCTAAACT GCCCCCACCT CCGTATCCTA 240TAAATGGCTC CTGGGGGAGG CTCCCTAAAG GTAGTCCAGA TTGGAGTGGG GAGCTGCGGC 300GGTGTGGAGA AAAACAGGAG CTAATGGGCC TGGCCAGCTG GGCAGCGCTG CTGCGGAAAG 360CCCAGGCTGG AAGCTGGGCC CCAGAGCCCA TGCCTGGTCT TCTGAACCCT CTGGGCCTCA 420GCTCTGGATA TGAGACCCTG TTTGACCTCA GGTAGATCAC TCACCCTCTC AGAGCCCCAG 480TTGCTCATCT GTCAGATGAG AATAATGGTT GCTTCCTTTG GGGCTTATCC TGAGGCTGTG 540TGGAAAGCAT TTCAGGGGTA CCTCACCCCT GGCAGATTGA ACTAATGCTT CTCCCCTTCC 600CCAGGTGAAT ATCGGCTCCA CAAAGGGGTC CTGTCTGGAT AAGCGGGTGA GCGGGCGAGG 660GATCTGGAGG GGTCTGAGCC ACTTGGTAAA GGGAGAGGAG ACCCTGAGGG TCTAAGGAAG 720GAAGCATGGC CCTGCCCCAC GAGTCCCAGA CTGATGGGGA GACGTGGTCC TCTGTGCTTA 780GGGGATGGCG TCAGCTGCAC ACACTCTGGG CTGTCCCGGG AGGCTGTCAC CTATGCTAAG 840CCCTTCTGAC ACCTTCTTCC CTGATCCTGG GGGTCCTAGT GCTAGGCTTG CCAGGGCCTT 900CCAGCAACCA ATTTCTCTCC TCCCTTCTCT CTTCCCCGGG CAGGACTGCG AGAACTACAT 960CACTCTCCTG GAGAGGCGGA GTGAGGGGCT GCTGGCCTGT GGCACCAACG CCCGGCACCC 1020CAGCTGCTGG AACCTGGTGA GAAGGCTGCT CCCCATGTGC CTGATCAGCT CACCTTCTAC 1080TGCGTGGGCT TCTGCCCCTC ATGGTGGGAA GGAGATGGCG AGACTCCAAT GCTGGCCTTG 1140CCCTGGGAGG ATGGGGCTCC TGGCCGAGAA ACTGGCCGTC ATGGGAGGCA GTGGCTGTGG 1200GATTATGTGG CCATCCAACC CTCTGGATCT CCCACAGGTG AATGGCACTG TGGTGCCACT 1260TGGCGAGATG AGAGGCTACG CCCCCTTCAG CCCGGACGAG AACTCCCTGG TTCTGTTTGA 1320AGGTTGGGGC ATGCTTCGGA ACTGGGCTGG GAGCAGGATG GTCAGCTCTT TGTCCAGTGT 1380CCGGAGGAGG GACTTCCAGG AGCTGCCTGC CCTTACTCAT TTCTCCCTCC CACTGACCCC 1440AGGGGACGAG GTGTATTCCA CCATCCGGAA CCAGGAATAC AATGGGAAGA TCCCTCGGTT 1500CCGCCGCATC CGGGGCGAGA GTGAGCTGTA CACCAGTGAT ACTGTCATGC AGAGTGAGTC 1560AGGCTCCGGC TGGGCTGAGG GTGGGCAAGG GGGTGTGAGC ACTTAAGGTG GCAGATGGGA 1620TCCTGATGTT TCTGGGAGGG CTCCCTGAGG GCCGCTGGGG CCATGCAGGA AAGCAGGACC 1680TTGGTATAGG CCTGAGAAGT TAGGGTTGGC TGGGAGCAGA GGAACAGACA AGGTATAGCA 1740GTGGGATGGG CCCAGCCCTC TTCAGGAACA CAAACAGAGG GAGCCCCAGA CCCAGTGCAG 1800GGTCCCCAGG AGCCAAAGTT TATCCTCTGC TGAGTTCACG TGGAGGCAGC CCCCCAACTC 1860CCTCCTCATC AGGGCTCTGC CAATTGAGCA GAAGTGACAT AGGGGCCCCC AGGGACCTTC 1920CCCCACTCCC CAGGCATGAA GTCATTGCTC CTGGGCCGAT GACATCTTTG TAGGAAGAGG 1980GCAAAACAGG TGTGGGGTGG AGGTGCAGGG TCTAGGGCCC CTCGGGGAGT TGGACCTGAT 2040GTTATGAGTC CTATTCCAGA TCTGATTTGC CATGGTTTGT GCAGACCCGA AGGAGGGAGG 2100AGAGTGTGCA GGGTTGGAAT GGTCTCCCGG GCAAGCTTCC CAGCCTTACG CCCATTCGCT 2160TCTGTGCCCT GGCAGACCCA CAGTTCATCA AAGCCACCAT CGTGCACCAA GACCAGGCTT 2220ACGATGACAA GATCTACTAC TTCTTCCGAG AGGACAATCC TGACAAGAAT CCTGAGGCTC 2280CTCTCAATGT GTCCCGTGTG GCCCAGTTGT GCAGGGTGAA CACGGGCGTG AGGGCTGCTG 2340GCTACGTGTC TGTGCATGAA TAGGCCTGAG TGAGGGTGAG TTCTGTGTGT CCGTGTGCAT 2400GTAGAAGTTG TGTGGATGTA TGAGTGGGTC TGTGTCAGGG ACTGTGGGAG CAGCTGTGTG 2460TGCATGGAGC ATCATGTGTC TGTGTGTGGG TAAAGGTGGC TGAGCTCCTG TGCACGTATG 2520ATGGCGTGTG AGCGTGTGTA TGATGGGGTG TGTGTGTGTG TGTGTGTGTG TGTTTTGCCT 2580GTGTGAATGT GCTGTGCCAC GTATGTGGGT GCGTGAGTCA GTAAATGTGT GTCTGAGTCC 2640GTCTGCTCTG TGGGGACCTG GCACTCTCAC CTGCCCTGAC CCTGGGCACT GCTGGCCCTG 2700GGCTCTGGAT CAGCCAGGCC TGCTTGCAGG AGTCTCATCT GGAGACCTGC CCTGAGTCCT 2760GGGGCACCCC CGGCAGGTCC TGGCCCCTCG CAGCCTGCCT TCCTCCTCTG GGCCCAGGTG 2820TTGATATTGC TGGCAGTGGT TTCCTGGGGT GTGTGGGGAA GCCCGGGCAG GTGCTGAGGG 2880GCCTCTTCTC CCCTCTACCC TTCCAGGGGG ACCAGGGTGG GGAAAGTTCA CTGTCAGTCT 2940CCAAGTGGAA CACTTTTCTG AAAGCCATGC TGGTATGCAG TGATGCTGCC ACCAACAAGA 3000ACTTCAACAG GCTGCAAGAC GTCTTCCTGC TCCCTGACCC CAGCGGCCAG TGGAGGGACA 3060CCAGGGTCTA TGGTGTTTTC TCCAACCCCT GGTGAGTGGC CCTTGTCCTG GGGCCGGGGC 3120TGGCATTGGT TCAGTGTCCA GTAGGGACAG GAGGCCTTGG GCCCTGCTGA GGGCCTCCCT 3180GGTGTGGCAG GAGCAGGGGC TGCAGGCTCA AGAGGCTGGG CTGTTGCTGG GTGTGGGGTG 3240GGGGGACAGC CAGTGCGATG TATGTACTGT TGTGTGAGTG AGTCTGCACT CATGGGTGTG 3300TGTGCATGCC CTATATGCAC ACTCATGACT GCACTTGTGC CTGTGTGTCC CACCACCTGC 3360TTGTGCCGAG AGTGGACACT GGGCCCAGGA GGAAGCTGCT GAAGCATCTC TCGGGGAGCT 3420GGGTGCTATT ACACCTGCTC AGGCACTGCC TGAGCCCGAT AATTCACACT TCTTAATCAC 3480TCTCATTGAT TGAACACACG GCAGGCGGAA GTGTTGGGTG TGTGTGGGGA GAGTTAGGGA 3540TAGAGTGGAG GAAGCCAAGA CCCTGCTCTG TGGCTCCTGG GTGAGTGGGT CCCCCAGGCT 3600GGGAAGGGGT TGGGGGTCTG GCCTCCTGGG GCATCAGCAC CCCACAGCCT GTGCCCAGGG 3660AGGGCTAGAG AACTGCTCAG CCTATGATGG GGTTCCTCCT GCCTTGGGGT TGGGTAGAGC 3720AGATGGCCTC TAGACTCAGT GATTCTGTAA CAGGATACAA GTTTGTGGTT TTAAATTGCA 3780GCACAAAGAA ATTAGGCTGA ACTCCTCTCC TTCCTCCTCT CCATCCCTCC CCATTTTCAG 3840TGGTGGTTGG CAACTCAGTG CCAGGCACAA GGCTGGCCTG GGTGAGTGGA GGTGGATGGG 3900TGGGTTCTGG GCCCCCCATT GAGCTGGTCT CCATGTCACT GCAGGAACTA CTCAGCCGTC 3960TGTGTGTATT CCCTCGGTGA CATTGACAAG GTCTTCCGTA CCTCCTCACT CAAGGGCTAC 4020CACTCAAGCC TTCCCAACCC GCGGCCTGGC AAGGTGAGCG TGACACCAGC CGTGGCCCAG 4080GCCCAGCCCT CCTTCTGCCT CACCTCCCAC CACCCCACTG ACCTGGGCCT GCTCTCCTTG 4140CCCAGTGCCT CCCAGACCAG CAGCCGATAC CCACAGAGAC CTTCCAGGTG GCTGACCGTC 4200ACCCAGAGGT GGCGCAGAGG GTGGAGCCCA TGGGGCCTCT GAAGACGCCA TTGTTCCACT 4260CTAAATACCA CTACCAGAAA GTGGCCGTCC ACCGCATGCA AGCCAGCCAC GGGGAGACCT 4320TTCATGTGCT TTACCTAACT ACAGGTGAGA GGCTACCCCG GGACCCTCAG TTTGCTTTGT 4380AAAAACGGGC ATGAAAGGTG TAAGGAATAA TGTAGTTAAC ATCTGGTTGG ATCTTTACAT 4440GTGGAAGGAA TAATTGAGTG ACTGGAGTTG TCAGGGGTTA ATGTGTGTGG GTGTGGAAGA 4500GCCAGGCAGG GAGAGCTTCC TGGAGGAGGT AGGGGCAAGA GGGAAAGGGG GATGGGAGAA 4560AAGCAAGCAC TGGGATTTGG AGGCGGAAAT CTGGAGAGTC TGAGCAAAGC CAGGTGCACC 4620TTTGGTCCAG ATGTCTGACT CAGGGAAGAA GATGGTAGGA AGAGACGTGG CAAATGAGGA 4680GGAGGGGCCT GAACCACAGG GATACTGGCC TCTGCCAGGC AGAATGAGGG AGTCAGGCCC 4740TGCGCCTGTC TTTGGGATTG TGCAGGTGAG AAGAAACATT TGAGGAGTTG ATGGGGCACA 4800AATTAGGTAT GGGGAAGGAG TTCCAGGGGG CAGAACCTTT GCCATCTCAC AGAGGACAGG 4860GGCAGCTTCT CTTCTTCCCT GGAGTAGGCC CTGCTGGGGG AAGCTGGGTG GAATGCCGTG 4920GGAGATGCTC CTGCTTTCTG GAAAGCCACA GGACACGGAG GAGCCAGTCC TGAGTTGGGT 4980TTGTCGCAGC TTCCCATGCC AGCTGCCTTC CTTGAGACTG GAAAGGGCCT CTAGCACCCC 5040TGGGGCCATT CAATTCAGGC CCAGGCGCCC AACCTCAGTT GTTCACATTC CCCATGTGAT 5100CTCCTGTTGC TGCTTCACCT TGGGACTGTC TCGGCTTTGG TGACCTTGTA GGAAACTGGA 5160ACCCCAGCAC CATTGTTTGG CTCCTGGAAG CCTTGGGGAG AGGAATTTCC CACAGGGCAG 5220GGCCTGGGTC CTGATTCCCT GCCTCTTTAC TCCCTATTCA TCCCGGCTAC ACCCTTGGGC 5280CCCCATCCTT GCTTGGCTCC AGTACTGGCT GGCACAGCTG TTGTGGTCAT CCAGGGATGG 5340CAGGGCACTG GGGAACAGAA GAGAGAGGTC ACACAGTGCG GAACTGGGAG CAGGAGCTAG 5400GACAAGGAAG GCTGGACTTG GGCCATGGAT TCCCTTCCTG CAGACTTGGG AAGTGAGCAC 5460ACTTGAGTGA TTAGAGAAGG TGTCTTCGTT CTAAGGGCAG TGGAGGAGGC ACCATTTTGG 5520AGCCTGCATC ATTCGTATTT GGGCTAGATT GAAAAATAGA GCTTTCTAAG TCCTCTGCAG 5580AGAATGGGAG GCTCTCACAA CTGGGAGAAG TATTGGCTCT TTTCCTGAGA ATTTTGCCAA 5640GGGTATGCTG TTACTGGGGC TGGTTTGGAA GGAGTATAGG GCATTATGTC TGTGAAGGCA 5700GTGGCTGGGG TGGGGCCTTA TCAGGCCCAA GGAGCATCTG GCCACATCTC AGAGTCCACA 5760GATGAGGATC ACGGATGTGT AGAGGAAACA TCCTAGGCAG GCAATCATCT GACTGCTTTT 5820TTGGGGCAGG TGATGCCCTG GGAAATTGGG AGGGAGGGAG AGAGGGAGGT AGGCTATTCT 5880AGAAACTGGG AGAGCAGGTG AGGTAGGATT GGGAGGACCA GGGGTCAGGG TCCCCATTGG 5940TCCCTAATTG AGAACGGAGA GAGCATTGGT CTAGGAGGCA GGCAGCTCGG TTATAAGACC 6000TTGGGAACTC TTGATTTAGA ATCCAAGATC CTTTTTAGAT CTAGGATTTT ATAAAATTAA 6060GATATCCCCT AAGATCAAAT GCAACGTGGA GTCCTGAATT GGATCCTAGA ACAGAAGAAG 6120GACATTTGTG GAAAAACTAG TGAAATCCAA ATAAAGTCTG TAGTTTTGTT AATAGTAATG 6180CACCAATGTC AGTTGCCTAG TTGTGACAAA TATACCGTGG TTATGTAAGA TGGTAACATT 6240AGGGGGAACT GGAGAAGGGT AGATTGGAGC TCTCTGTACT ATCTTTGCAA CTTTTCTGGG 6300AATCTAAAAT TACTCCAAAA TAAAAAAAAA ATGTATTTAA AGTAAATATA TTCCCTAAGA 6360GTCCAGGAGG CAGGGGAGTT GTAGAAGCAG CTGAGTGGTT GGGTTCTGAC AGATTTGGTT 6420CCAACTCGGT CTCTGCTGCT CACCAGCTGT GTGACCTTGA GCAAGTGGCT TAGCCTTTCT 6480GAGCCTGATT TCCTTATCTG TGGAGTGGGG AAGATGACAG CCACCTCGCA GGGCTGTGGA 6540GGGTTAAACG AGGTGATGCA TGGACAGCAG CCGCACTGAC CTTGCTGGTG TGGGGCTCCT 6600GCTTCTGTTC TTCCCGTGCA GCCTTGGGAA TGTTGGAGGC CGTATCCAGG GACCCCTGGG 6660CCTCCTGGGA TGGCCTCTCT GGATCAGCCT TGGAAGGTTC CAGGCTGCCC TTAGGCTCCC 6720ACATTCTTCC CCAGTCACGC TCTCCTCGCC CTGCCCACAC CAGTCCTGTG ACCCTTGCCT 6780GAGTTGTGAC TTCCCACCCC TCCCCGGCCT AGAGGAAAGC TGCCTGGCCC CTCAGTGGGA 6840CTCCCGCCCA CTGACCCTCT GTCCACCATA CACAGACAGG GGCACTATCC ACAAGGTGGT 6900GGAACCGGGG GAGCAGGAGC ACAGCTTCGC CTTCAACATC ATGGAGATCC AGCCCTTCCG 6960CCGCGCGGCT GCCATCCAGA CCATGTCGCT GGATGCTGAG CGGGTGAGCC TTCCCCCACT 7020GCGTCCCATG GGCTATGCAG TGACTGCAGC TGAGGACAGG GCTCCTTTGC ATGTGATTTG 7080TGTGTTCTTT TAAGAGCTTC TAGGCCTTAG GGCCTGGACA TTTAGGACTG AGTGTGGGGT 7140GGGGCCCGGG CCTGACCCAA TCCTGCTGTC CTTCCAGAGG AAGCTGTATG TGAGCTCCCA 7200GTGGGAGGTG AGCCAGGTGC CCCTGGACCT GTGTGAGGTC TATGGCGGGG GCTGCCACGG 7260TTGCCTCATG TCCCGAGACC CCTACTGCGG CTGGGACCAG GGCCGCTGCA TCTCCATCTA 7320CAGCTCCGAA CGGTACGTTG GCCGGGATCC CTCCGTCCCT GGGACAAGGT GGGCATGGGA 7380CAGGGGGAGG TGTTGTCGGG CTGGAAGAGG TGGCGGTACT GGGCCTTTCT TGTGGGACCT 7440CCTCTCTACT GGAACTGCAC TAGGGGTAAG GATATGAGGG TCAGGTCTGC AGCCTTGTAT 7500CTGCTGATCC TCTTTCGTCC TTCCCACTCC AGGTCAGTGC TGCAATCCAT TAATCCAGCC 7560GAGCCACACA AGGAGTGTCC CAACCCCAAA CCAGGTACCT GATCTGGCCC TGCTGGCGGC 7620TGTGGCCCAA TGAGTGGGGT ACTGCCCTGC CCTGATTGTC CTGGTCTGAG GGAAACATGG 7680CCTTGTCCTG TGGGCCCCAG GTACATGGGG CAGGATACAG TCCTGCAGAG GGAGCCCTCT 7740TGGTGGGATG AGCGAGACGG GAGAAAAAAG GAGGACGCTG AGGGCTGGGT TCCCCACGTT 7800CATTCAGAAG CCTTGTCCTG GGATCCCAGT CGGTGGGGAG GACACATCCT CCCCTGGGAG 7860CTCTTTGTCC CTCCTCACGG CTGCTTCCCC ACTGCCTGCC CAGACAAGGC CCCACTGCAG 7920AAGGTTTCCC TGGCCCCAAA CTCTCGCTAC TACCTGAGCT GCCCCATGGA ATCCCGCCAC 7980GCCACCTACT CATGGCGCCA CAAGGAGAAC GTGGAGCAGA GCTGCGAACC TGGTCACCAG 8040AGCCCCAACT GCATCCTGTT CATCGAGAAC CTCACGGCGC AGCAGTACGG CCACTACTTC 8100TGCGAGGCCC AGGAGGGCTC CTACTTCCGC GAGGCTCAGC ACTGGCAGCT GCTGCCCGAG 8160GACGGCATCA TGGCCGAGCA CCTGCTGGGT CATGCCTGTG CCCTGGCCGC CTCCCTCTGG 8220CTGGGGGTGC TGCCCACACT CACTCTTGGC TTGCTGGTCC ACTAGGGCCT CCCGAGGCTG 8280GGCATGCCTC AGGCTTCTGC AGCCCAGGGC ACTAGAACGT CTCACACTCA GAGCCGGCTG 8340GCCCGGGAGC TCCTTGCCTG CCACTTCTTC CAGGGGACAG AATAACCCAG TGGAGGATGC 8400CAGGCCTGGA GACGTCCAGC CGCAGGCGGC TGCTGGGCCC CAGGTGGCGC ACGGATGGTG 8460AGGGGCTGAG AATGAGGGCA CCGACTGTGA AGCTGGGGCA TCGATGACCC AAGACTTTAT 8520CTTCTGGAAA ATATTTTTCA GACTCCTCAA ACTTGACTAA ATGCAGCGAT GCTCCCAGCC 8580CAAGAGCCCA TGGGTCGGGG AGTGGGTTTG GATAGGAGAG CTGGGACTCC ATCTCGACCC 8640TGGGGCTGAG GCCTGAGTCC TTCTGGACTC TTGGTACCCA CATTGCCTCC TTCCCCTCCC 8700TCTCTCATGG CTGGGTGGCT GGTGTTCCTG AAGACCCAGG GCTACCCTCT GTCCAGCCCT 8760GTCCTCTGCA GCTCCCTCTC TGGTCCTGGG TCCCACAGGA CAGCCGCCTT GCATGTTTAT 8820TGAAGGATGT TTGCTTTCCG GACGGAAGGA CGGAAAAAGC TCTGAAAAAA AAAAAAAAAA 8880AAAAAAAA 8888
(2)SEQ ID NO:42的信息:
(ⅰ)序列特征:
(A)长度:6622个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:基因组DNA
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..6622
(ⅹⅰ)序列描述:SEQ ID NO:42:GATATCATGG AGATAATTAA AATGATAACC ATCTCGCAAA TAAATAAGTA TTTTACTGTT 60TTCGTAACAG TTTTGTAATA AAAAAACCTA TAAATATGAA ATTCTTAGTC AACGTTGCCC 120TTGTTTTTAT GGTCGTATAC ATTTCTTACA TCTATGCGGA TCGATGGGGA TCCGCCCAGG 180GCCACCTAAG GAGCGGACCC CGCATCTTCG CCGTCTGGAA AGGCCATGTA GGGCAGGACC 240GGGTGGACTT TGGCCAGACT GAGCCGCACA CGGTGCTTTT CCACGAGCCA GGCAGCTCCT 300CTGTGTGGGT GGGAGGACGT GGCAAGGTCT ACCTCTTTGA CTTCCCCGAG GGCAAGAACG 360CATCTGTGCG CACGGTGAAT ATCGGCTCCA CAAAGGGGTC CTGTCTGGAT AAGCGGGACT 420GCGAGAACTA CATCACTCTC CTGGAGAGGC GGAGTGAGGG GCTGCTGGCC TGTGGCACCA 480ACGCCCGGCA CCCCAGCTGC TGGAACCTGG TGAATGGCAC TGTGGTGCCA CTTGGCGAGA 540TGAGAGGCTA TGCCCCCTTC AGCCCGGACG AGAACTCCCT GGTTCTGTTT GAAGGGGACG 600AGGTGTATTC CACCATCCGG AAGCAGGAAT ACAATGGGAA GATCCCTCGG TTCCGCCGCA 660TCCGGGGCGA GAGTGAGCTG TACACCAGTG ATACTGTCAT GCAGAACCCA CAGTTCATCA 720AAGCCACCAT CGTGCACCAA GACCAGGCTT ACGATGACAA GATCTACTAC TTCTTCCGAG 780AGGACAATCC TGACAAGAAT CCTGAGGCTC CTCTCAATGT GTCCCGTGTG GCCCAGTTGT 840GCAGGGGGGA CCAGGGTGGG GAAAGTTCAC TGTCAGTCTC CAAGTGGAAC ACTTTTCTGA 900AAGCCATGCT GGTATGCAGT GATGCTGCCA CCAACAAGAA CTTCAACAGG CTGCAAGACG 960TCTTCCTGCT CCCTGACCCC AGCGGCCAGT GGAGGGACAC CAGGGTCTAT GGTGTTTTCT 1020CCAACCCCTG GAACTACTCA GCCGTCTGTG TGTATTCCCT CGGTGACATT GACAAGGTCT 1080TCCGTACCTC CTCACTCAAG GGCTACCACT CAAGCCTTCC CAACCCGCGG CCTGGCAAGT 1140GCCTCCCAGA CCAGCAGCCG ATACCCACAG AGACCTTCCA GGTGGCTGAC CGTCACCCAG 1200AGGTGGCGCA GAGGGTGGAG CCCATGGGGC CTCTGAAGAC GCCATTGTTC CACTCTAAAT 1260ACCACTACCA GAAAGTGGCC GTTCACCGCA TGCAAGCCAG CCACGGGGAG ACCTTTCATG 1320TGCTTTACCT AACTACAGAC AGGGGCACTA TCCACAAGGT GGTGGAACCG GGGGAGCAGG 1380AGCACAGCTT CGCCTTCAAC ATCATGGAGA TCCAGCCCTT CCGCCGCGCG GCTGCCATCC 1440AGACCATGTC GCTGGATGCT GAGCGGAGGA AGCTGTATGT GAGCTCCCAG TGGGAGGTGA 1500GCCAGGTGCC CCTGGACCTG TGTGAGGTCT ATGGCGGGGG CTGCCACGGT TGCCTCATGT 1560CCCGAGACCC CTACTGCGGC TGGGACCAGG GCCGCTGCAT CTCCATCTAC AGCTCCGLAC 1620GGTCAGTGCT GCAATCCATT AATCCAGCCG AGCCACACAA GGAGTGTCCC AACCCCAAAC 1680CAGACAAGGC CCCACTGCAG AAGGTTTCCC TGGCCCCAAA CTCTCGCTAC TACCTGAGCT 1740GCCCCATGGA ATCCCGCCAC GCCACCTACT CATGGCGCCA CAAGGAGAAC GTGGAGCAGA 1800GCTGCGAACC TGGTCACCAG AGCCCCAACT GCATCCTGTT CATCGAGAAC CTCACGGCGC 1860AGCAGTACGG CCACTACTTC TGCGAGGCCC AGGAGGGCTC CTACTTCCGC GAGGCTCAGC 1920ACTGGCAGCT GCTGCCCGAG GACGGCATCA TGGCCGAGCA CCTGCTGGGT CATGCCTGTG 1980CCCTGGCTGC CTGAATTCGA AGCTTGGAGT CGACTCTGCT GAAGAGGAGG AAATTCTCCT 2040TGAAGTTTCC CTGGTGTTCA AAGTAAAGGA GTTTGCACCA GACGCACCTC TGTTCACTGG 2100TCCGGCGTAT TAAAACACGA TACATTGTTA TTAGTACATT TATTAAGCGC TAGATTCTGT 2160GCGTTGTTGA TTTACAGACA ATTGTTGTAC GTATTTTAAT AATTCATTAA ATTTATAATC 2220TTTAGGGTGG TATGTTAGAG CGAAAATCAA ATGATTTTCA GCGTCTTTAT ATCTGAATTT 2280AAATATTAAA TCCTCAATAG ATTTGTAAAA TAGGTTTCGA TTAGTTTCAA ACAAGGGTTG 2340TTTTTCCGAA CCGATGGCTG GACTATCTAA TGGATTTTCG CTCAACGCCA CAAAACTTGC 2400CAAATCTTGT AGCAGCAATC TAGCTTTGTC GATATTCGTT TGTGTTTTGT TTTGTAATAA 2460AGGTTCGACG TCGTTCAAAA TATTATGCGC TTTTGTATTT CTTTCATCAC TGTCGTTAGT 2520GTACAATTGA CTCGACGTAA ACACGTTAAA TAAAGCCTGG ACATATTTAA CATCGGGCGT 2580GTTAGCTTTA TTAGGCCGAT TATCGTCGTC GTCCCAACCC TCGTCGTTAG AAGTTGCTTC 2640CGAAGACGAT TTTGCCATAG CCACACGACG CCTATTAATT GTGTCGGCTA ACACGTCCGC 2700GATCAAATTT GTAGTTGAGC TTTTTGGAAT TATTTCTGAT TGCGGGCGTT TTTGGGCGGG 2760TTTCAATCTA ACTGTGCCCG ATTTTAATTC AGACAACACG TTAGAAAGCG ATGGTGCAGG 2820CGGTGGTAAC ATTTCAGACG GCAAATCTAC TAATGGCGGC GGTGGTGGAG CTGATGATAA 2880ATCTACCATC GGTGGAGGCG CAGGCGGGGC TGGCGGCGGA GGCGGAGGCG GAGGTGGTGG 2940CGGTGATGCA GACGGCGGTT TAGGCTCAAA TTGTCTCTTT CAGGCAACAC AGTCGGCACC 3000TCAACTATTG TACTGGTTTC GGGCGTATGG TGCACTCTCA GTACAATCTG CTCTGATGCC 3060GCATAGTTAA GCCAGCCCCG ACACCCGCCA ACACCCGCTG ACGCGCCCTG ACGGGCTTGT 3120CTGCTCCCGG CATCCGCTTA CAGACAAGCT GTGACCGTCT CCGGGAGCTG CATGTGTCAG 3180AGGTTTTCAC CGTCATCACC GAAACGCGCG AGACGAAAGG GCCTCGTGAT ACGCCTATTT 3240TTATAGGTTA ATGTCATGAT AATAATGGTT TCTTAGACGT CAGGTGGCAC TTTTCGGGGA 3300AATGTGCGCG GAACCCCTAT TTGTTTATTT TTCTAAATAC ATTCAAATAT GTATCCGCTC 3360ATGAGACAAT AACCCTGATA AATGCTTCAA TAATATTGAA AAAGGAAGAG TATGAGTATT 3420CAACATTTCC GTGTCGCCCT TATTCCCTTT TTTGCGGCAT TTTGCCTTCC TGTTTTTGCT 3480CACCCAGAAA CGCTGGTGAA AGTAAAAGAT GCTGAAGATC AGTTGGGTGC ACGAGTGGGT 3540TACATCGAAC TGGATCTCAA CAGCGGTAAG ATCCTTGAGA GTTTTCGCCC CGAAGAACGT 3600TTTCCAATGA TGAGCACTTT TAAAGTTCTG CTATGTGGCG CGGTATTATC CCGTATTGAC 3660GCCGGGCAAG AGCAACTCGG TCGCCGCATA CACTATTCTC AGAATGACTT GGTTGAGTAC 3720TCACCAGTCA CAGAAAAGCA TCTTACGGAT GGCATGACAG TAAGAGAATT ATGCAGTGCT 3780GCCATAACCA TGAGTGATAA CACTGCGGCC AACTTACTTC TGACAACGAT CGGAGGACCG 3840AAGGAGCTAA CCGCTTTTTT GCACAACATG GGGGATCATG TAACTCGCCT TGATCGTTGG 3900GAACCGGAGC TGAATGAAGC CATACCAAAC GACGAGCGTG ACACCACGAT GCCTGTAGCA 3960ATGGCAACAA CGTTGCGCAA ACTATTAACT GGCGAACTAC TTACTCTAGC TTCCCGGCAA 4020CAATTAATAG ACTGGATGGA GGCGGATAAA GTTGCAGGAC CACTTCTGCG CTCGGCCCTT 4080CCGGCTGGCT GGTTTATTGC TGATAAATCT GGAGCCGGGG AGCGTGGGTC TCGCGGTATC 4140ATTGCAGCAC TGGGGCCAGA TGGTAAGCCC TCCCGTATCG TAGTTATCTA CACGACGGGG 4200AGTCAGGCAA CTATGGATGA ACGAAATAGA CAGATCGCTG AGATAGGTGC CTCACTGATT 4260AAGCATTGGT AACTGTCAGA CCAAGTTTAC TCATATATAC TTTAGATTGA TTTAAAACTT 4320CATTTTTAAT TTAAAAGGAT CTAGGTGAAG ATCCTTTTTG ATAATCTCAT GACCAAAATC 4380CCTTAACGTG AGTTTTCGTT CCACTGAGCG TCAGACCCCG TAGAAAAGAT CAAAGGATCT 4440TCTTGAGATC CTTTTTTTCT GCGCGTAATC TGCTGCTTGC AAACAAAAAA ACCACCGCTA 4500CCAGCGGTGG TTTGTTTGCC GGATCAAGAG CTACCAACTC TTTTTCCGAA GGTAACTGCC 4560TTCAGCAGAG CGCAGATACC AAATACTGTT CTTCTAGTGT AGCCGTAGTT AGGCCACCAC 4620TTCAAGAACT CTGTAGCACC GCCTACATAC CTCGCTCTGC TAATCCTGTT ACCAGTGGCT 4680GCTGCCAGTG GCGATAAGTC GTGTCTTACC GGGTTGGACT CAAGACGATA GTTACCGGAT 4740AAGGCGCAGC GGTCGGGCTG AACGGGGGGT TCGTGCACAC AGCCCAGCTT GGAGCGAACG 4800ACCTACACCG AACTGAGATA CCTACAGCGT GAGCTATGAG AAAGCGCCAC GCTTCCCGAA 4860GGGAGAAAGG CGGACAGGTA TCCGGTAAGC GGCAGGGTCG GAACAGGAGA GCGCACGAGG 4920GAGCTTCCAG GGGGAAACGC CTGGTATCTT TATAGTCCTG TCGGGTTTCG CCACCTCTGA 4980CTTGAGCGTC GATTTTTGTG ATGCTCGTCA GGGGGGCGGA GCCTATGGAA AAACGCCAGC 5040AACGCGGCCT TTTTACGGTT CCTGGCCTTT TGCTGGCCTT TTGCTCACAT GTTCTTTCCT 5100GCGTTATCCC CTGATTCTGT GGATAACCGT ATTACCGCCT TTGAGTGAGC TGATACCGCT 5160CGCCGCAGCC GAACGACCGA GCGCAGCGAG TCAGTGAGCG AGGAAGCATC CTGCACCATC 5220GTCTGCTCAT CCATGACCTG ACCATGCAGA GGATGATGCT CGTGACGGTT AACGCCTCGA 5280ATCAGCAACG GCTTGCCGTT CAGCAGCAGC AGACCATTTT CAATCCGCAC CTCGCGGAAA 5340CCGACATCGC AGGCTTCTGC TTCAATCAGC GTGCCGTCGG CGGTGTGCAG TTCAACCACC 5400GCACGATAGA GATTCGGGAT TTCGGCGCTC CACAGTTTCG GGTTTTCGAC GTTCAGACGT 5460AGTGTGACGC GATCGGTATA ACCACCACGC TCATCGATAA TTTCACCGCC GAAAGGCGCG 5520GTGCCGCTGG CGACCTGCGT TTCACCCTGC CATAAAGAAA CTGTTACCCG TAGGTAGTCA 5580CGCAACTCGC CGCACATCTG AACTTCAGCC TCCAGTACAG CGCGGCTGAA ATCATCATTA 5640AAGCGAGTGG CAACATGGAA ATCGCTGATT TGTGTAGTCG GTTTATGCAG CAACGAGACG 5700TCACGGAAAA TGCCGCTCAT CCGCCACATA TCCTGATCTT CCAGATAACT GCCGTCACTC 5760CAACGCAGCA CCATCACCGC GAGGCGGTTT TCTCCGGCGC GTAAAAATGC GCTCAGGTCA 5820AATTCAGACG GCAAACGACT GTCCTGGCCG TAACCGACCC AGCGCCCGTT GCACCACAGA 5880TGAAACGCCG AGTTAACGCC ATCAAAAATA ATTCGCGTCT GGCCTTCCTG TAGCCAGCTT 5940TCATCAACAT TAAATGTGAG CGAGTAACAA CCCGTCGGAT TCTCCGTGGG AACAAACGGC 6000GGATTGACCG TAATGGGATA GGTCACGTTG GTGTAGATGG GCGCATCGTA ACCGTGCATC 6060TGCCAGTTTG AGGGGACGAC GACAGTATCG GCCTCAGGAA GATCGCACTC CAGCCAGCTT 6120TCCGGCACCG CTTCTGGTGC CGGAAACCAG GCAAAGCGCC ATTCGCCATT CAGGCTGCGC 6180AACTGTTGGG AAGGGCGATC GGTGCGGGCC TCTTCGCTAT TACGCCAGCT GGCGAAAGGG 6240GGATGTGCTG CAAGGCGATT AAGTTGGGTA ACGCCAGGGT TTTCCCAGTC ACGACGTTGT 6300AAAACGACGG GATCTATCAT TTTTAGCAGT GATTCTAATT GCAGCTGCTC TTTGATACAA 6360CTAATTTTAC GACGACGATG CGAGCTTTTA TTCAACCGAG CGTGCATGTT TGCAATCGTG 6420CAAGCGTTAT CAATTTTTCA TTATCGTATT GTTGCACATC AACAGGCTGG ACACCACGTT 6480GAACTCGCCG CAGTTTTGCG GCAAGTTGGA CCCGCCGCGC ATCCAATGCA AACTTTCCGA 6540CATTCTGTTG CCTACGAACG ATTGATTCTT TGTCCATTGA TCGAAGCGAG TGCCTTCGAC 6600TTTTTCGTGT CCAGTGTGGC TT 6622
(2)SEQ ID NO:43的信息:
(ⅰ)序列特征:
(A)长度:31个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:基因组DNA
(ⅸ)特征:
(A)名称/关键词:外显子
(B)位置:1..31
(ⅹⅰ)序列描述:SEQ ID NO:43:
(2)SEQ ID NO:44的信息:
(ⅰ)序列特征:
(A)长度:29个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ⅱ)分子类型:基因组DNA
(ⅹⅰ)序列描述:SEQ ID NO:44:CTGAATTCAGGAGCCAGGGCACAGGCATG 29