用HTRA启动子在减毒细菌中表达 异源蛋白 本发明涉及DNA构建物,含有该构建物的可复制表达载体,含有该构建物的减毒细菌和含有所述细菌的疫苗。
近年来出现了新一代的口服沙门氏活菌疫苗,这些疫苗是基于通过在细菌的芳香氨基酸生物合成途径的基因中引入不可逆突变而减毒的沙门氏菌株。这种菌株公开于例如EP-A-0322237中。前述口服沙门氏活菌疫苗正显示为人和动物沙门菌病的有希望的疫苗,它们还可有效地用作向免疫系统输送异源抗原的载体。重组沙门氏菌疫苗已被用于输送病毒、细菌和寄生虫抗原,激发对重组抗原的分泌、体液和细胞介导的免疫应答。作为单剂口服多疫苗输送系统,重组沙门氏菌疫苗显示出很大的潜力[C.Hormaeche等,FEMS Symposium No.63,Plenum,NewYork;pp71-83,1992]。
在重组沙门氏菌疫苗的开发中有些问题需要克服。主要的考虑是重组抗原在沙门氏疫苗中获得高水平的表达,以便足以引发免疫应答。但是外源抗原地失调高水平表达可以是毒性的并影响细胞的生存力[I.Charles and G.Dougan,TIBTECH8,pp117-21,1990],致使该疫苗无效或造成重组DNA的损失。已经描述了这一问题的几种可能的解决办法,例如从带有必需基因、“开-关”启动子的质粒中表达或将外源基因引入沙门氏菌基因组中。
克服上述问题的另一方法可能是利用一种在体内可诱导的启动子,一种这样的启动子是大肠杆菌亚硝酸盐还原酶启动子nirB,它在厌氧生活下被诱导。在我们早先的国际专利申请PCT/GB93/01617中描述了含有用带nirB启动子的构建物转化之细菌的疫苗组合物。
本发明涉及含不同的可诱导启动子DNA构建物的制备,该启动子为编码一种应激诱导蛋白的htrA基因的启动子。
对htrA基因的描述见于K.Tohnson等Mol.Microbiol.1991;5:401-7和其中所引的参考文献中,这是编码热激蛋白之基因的一个实例,在温度升至42℃以上时产生所述蛋白。
因此,本发明第一方面提供含有与编码一种或多种异源蛋白的DNA序列有效连接的htrA启动子序列的DNA构建物。
在一种实施方案中,本发明提供一种上述定义的DNA构建物,其中htrA启动子与编码两种或多种异源蛋白之融合蛋白的DNA序列有效地连接。
组成融合蛋白的蛋白间可借助一柔性绞链区连接。
另一方面,本发明提供一种含有与编码第一和第二异源蛋白的DNA序列有效连接的htrA启动子的DNA构建物,其中第一异源蛋白是一种含破伤风毒素片段C或其一个或多个表位的抗原序列。
另一方面,本发明提供一种含有如上定义的DNA构建物的适用于细菌的可复制表达因子。
另一方面,本发明提供一种融合蛋白,优选基本纯的融合蛋白,即由如上所定义的构建物所表达的融合蛋白。
另一方面,本发明提供一种制备减毒细菌的方法,包括用如上所定义的DNA构建物转化一种减毒细菌。
还有,本发明提供一种含有如上所定义DNA构建物的宿主细胞,如一种细菌细胞。DNA构建物可以染色体外形式存在,如质粒中,或可以按本身已知的方法整合在宿主(如细菌)染色体中。
本发明还提供一种含有如上所定义的减毒细菌或从中表达的融合蛋白以及药学上可接受载体的疫苗组合物。
第一和第二蛋白优选是异源蛋白,尤其是多肽免疫原;例如它们是源自病毒、细菌、真菌、酵母或寄生虫的抗原序列。具体讲,优选第一蛋白是一种含有破伤风毒素片段C或其表位的抗原序列。
第二蛋白优选是一种病原生物的抗原决定簇。例如,这种抗原决定簇可以是源自病毒、细菌、真菌、酵母或寄生虫的抗原序列。
作为第一和/或第二异源蛋白的病毒抗原序列的实例是源自以下的序列:一种类型的人免疫缺陷病毒(HIV)如HIV-1或HIV-2,HIV(如HIV-1或HIV-2)的CD4受体结合位点,甲、乙或丙型肝炎病毒,人鼻病毒如2型或14型,单纯疱疹病毒,2或3型脊髓灰质炎病毒,口蹄疫病毒(FMDV),狂犬病毒,轮状病毒,流感病毒,柯萨奇病毒,人乳头瘤病毒(HPV)如16型乳头瘤病毒、其E7蛋白及含有E7蛋白或其表位的片段;和猴免疫缺陷病毒(SIV)。
源自细菌的抗原实例是以下细菌的抗原:百日咳博德特氏菌(如P69蛋白和丝状血凝集素(FHA)抗原),霍乱弧菌,炭疽芽孢杆菌,和大肠杆菌抗原如大肠杆菌热不稳定毒素B亚单位(LT-B)、大肠杆菌K88抗原和肠毒性大肠杆菌抗原。其他抗原实例包括细胞表面抗原CD4、曼氏裂体吸虫P28谷胱甘肽S-转移酶抗原(P28抗原)和以下寄生虫的抗原:吸虫、菌质、线虫、绦虫、沙眼衣原虫和疟疾寄生虫,如疟原虫属或巴贝虫属的寄生虫,例如恶性疟原虫,以及编码上述抗原免疫原性表位的肽。
具体抗原包括全长曼氏裂体吸虫P28,免疫原性P28aa115-131肽(其含有B细胞和T细胞表位)的寡聚物(如2、4和8聚物),人乳头瘤病毒E7蛋白,单纯疱疹抗原,口蹄疫病毒抗原,猴免疫缺陷病毒抗原,和白喉毒素抗原,如白喉毒素神经节苷脂结合区。
本文所用术语“htrA启动子”指该启动子本身或其能够促进编码基因表达的部分或衍生物。含htrA启动子的优选序列是:AATTCTATTCCGGAACTTCGCGTTATAAAATGAATCTGACGTACACAGCAATTTA(SEQ.ID.NO.1)
在本发明的构建物中,DNA序列可以编码两种或多种蛋白的融合蛋白,其中相邻蛋白被一绞链区分隔开。绞链区是一种设计为通过在功能区之间提供空间和时间上的分离而促进第一和第二蛋白两者独立折叠的区域。
绞链区一般是编码高比例脯氨酸和/或甘氨酸的序列。绞链区可以完全由脯氨酸和/或甘氨酸组成,可以含有一个或多个甘氨酸-脯氨酸二肽单元。
例如,绞链区可含有最多约15个氨基酸,例如至少4个,优选6-14个氨基酸,氨基酸的数目应能在第一和第二蛋白之间提供柔性。
在一种实施方案中,绞链区基本相当于抗体免疫球蛋白的绞链区。具体讲,IgG抗体的绞链区富含脯氨酸[T.E.Michaelson等,J.Blol.Chem.252,883-9,1977],认为它在抗原结合区和尾区之间提供一个柔性关节。
虽不希望拘于任何理论,但认为脯氨酸形成绞链的刚性部分,因为该氨基酸的环结构特征阻碍围绕连接脯氨酸残基和相邻氨基酸的肽键的旋转。认为这一特征阻止了脯氨酸和相邻残基采取α螺旋或β链的有序结构。柔性被认为是由甘氨酸带来的,这是最简单的氨基酸,空间要求很有限。认为甘氨酸的功能是作为绞链的柔性弯头。其他氨基酸可以取代甘氨酸,尤其是那些没有大侧链的氨基酸,如丙氨酸、丝氨酸、天冬酰胺和苏氨酸。
在一优选实施方案中,绞链区是构成以下序列的四个或更多个氨基酸的链:
-[X]p-Pro-[Y]q-Pro-[Z]r-其中Pro是脯氨酸,X和Y各为甘氨酸或无大侧链的氨基酸;Z是任何氨基酸;p是正整数;q是1-10的正整数;r为零或大于零的正整数。
绞链区可以是与第一和第二蛋白两者都异源的分立区域,或由第一蛋白的羧基末端部分或第二蛋白的氨基末端部分构成。
在一最优选的方案中,本发明提供一种含有与编码由绞链区连接的第一和第二多肽免疫原的DNA序列有效连接的htrA启动子的DNA分子,其中第一多肽免疫原包含破伤风毒素片段C或其表位。
在本发明的另一优选方案中,提供一种适于细菌中使用的可复制表达载体,其含有htrA启动子和与之有效连接的编码由绞链区连接的第一和第二多肽免疫原的DNA序列,其中第一多肽免疫原包含破伤风毒素片段C或其表位。
另一方面,本发明提供一种含有htrA启动子和与之有效连接的编码第一蛋白的DNA和从其3′末端延伸的编码绞链区的DNA序列及其下游的一个或多个限制性内切酶位点的DNA构建物。
所述蛋白优选是如前文所定义的抗原蛋白,尤其是TetC片段或其表位。
由绞链区连接的第一和第二异源蛋白可在体内获得稳定表达。可以在减毒细菌中表达异源蛋白,这种细菌从而可用作疫苗。
减毒细菌可选自以下的属:沙门氏菌属、博德特氏菌属、弧菌属、嗜血菌属、奈瑟氏球菌属和耶尔森氏菌属。或者,减毒细菌可以是肠毒性大肠杆菌的减毒株。尤其可提及下列菌种:伤塞沙门氏菌-人伤寒的病因;鼠伤寒沙门氏菌-数种动物沙门菌病的病因;肠炎沙门氏菌-人食物中毒的病因;猪霍乱沙门氏菌-猪沙门菌病的病因;百日咳博德特氏菌-哮咳的病因;流感嗜血菌-脑膜炎的病因;淋病奈瑟氏球菌-淋病的病因;和耶尔森氏菌-食物中毒的病因。
细菌的减毒可归因于细菌芳香氨基酸生物合成途径基因中不可逆的突变。分支酸的合成中涉及至少10个基因,分支酸是芳香氨基酸生物合成途径中的分支点化合物。几种这样的图谱在细菌基因组上定位大不相同,例如aroA(5-烯醇丙酮酰莽草酸-3-磷酸合成酶)、aroC(分支酸合成酶)、aroD(3-二氢奎尼酸脱氢酶)和aroE(莽草酸脱氢酶)。因此可在aroA、aroC、aroD或aroE基因中发生突变。
但优选减毒细菌在其芳香氨基酸生物合成途径中两个独立基因中有不可逆突变,或在其芳香氨基酸生物合成途径中和在调节基因如htrA、OmpR或OsmC中都有不可逆突变。合适的减毒细菌实例公开于如EP-A-0322237和EP-A-0400958中。
含有本发明DNA构建物的减毒细菌可用作疫苗。由该细菌表达的融合蛋白(优选基本纯的形式)也可用于制备疫苗。例如,已发现纯化的TetC-P28融合蛋白本身为免疫原性的。因此本发明另一方面提供含有药学上可接受载体或稀释剂以及作为活性成分的如上所定义的减毒细菌或融合蛋白的疫苗组合物。
该疫苗可含有一种或多种适宜的佐剂。
该疫苗最好以冷冻干燥形式(例如胶囊形式)存在用于给患者口服给药。这种胶囊可以带有肠衣,包括如Eudragit“S”、Eudragit“L”、乙酸纤维素、乙酸邻苯二甲酸纤维素或羟丙基甲基纤维素。这些胶囊可以就此使用,或者在给药前将冻干物重新配制成如悬液。最好在适当pH的缓冲液中进行重配,以保证生物的存活。为了保持减毒细菌和疫苗不受胃酸性的破坏,在每次服用疫苗前最好服用碳酸氢钠制剂。或者,可制备疫苗使其适于胃肠外给药、鼻内给药或乳房内给药。
优选使该疫苗组合物适于粘膜输送,如通过口服给药、鼻内给药或支气管内给药。
含有本发明DNA构建物的减毒细菌可以用于宿主的预防或治疗,尤其是人,也可能是动物。因此可通过服用有效剂量的本发明减毒细菌可以防止由微生物(特别是病原体)引起的感染。服用后该细菌表达能够激发对所述微生物抗体的异源蛋白。所用剂量将取决于各种因素,包括宿主的大小和重量、所配疫苗的类型和异源蛋白的性质。
可通过用以上所定义的DNA构建物转化减毒细菌而制备本发明的减毒细菌。可以使用任何合适的转化技术,例如电穿孔。这样可获得能够表达与此细菌异源之蛋白的减毒细菌。该减毒细菌的培养物可在有氧条件下生长。这样制备足量的细菌用于配制成疫苗,而异源蛋白的表达很少。
表达载体带有适当的转录和翻译控制元件,除htrA启动子外包括,转录终止位点和翻译起始和终止密码子,还带有适当的核糖体结合位点。该载体一般包含复制起始区,及需要时还有选择性标志如抗生素抗性基因。例如该载体可以是质粒。
下面将参照实施例和附图说明本发明,但不限制本发明。
图1说明根据本发明的一个方面构建含htrA启动子的质粒pHTRA1;
图2说明如何构建含htrA启动子和编码与绞链区连接之破伤风毒素C片段的DNA的质粒pHTRA2;
图3说明质粒pTECH2的结构;
图4说明中间质粒pBD907的结构;
图5显示按图1所示方案所制质粒pHTRA1的结构;
图6显示按图2所示方案所制产物质粒pHTRA2的结构;
图7A和图7B说明温度变化对启动子nirB、groE和hrtA的影响;及
图8显示LacZ在巨噬细胞中从htrA、nirB和groE的表达。
实施例1htrA-TetC-绞链结构的制备
从图1可以看出,用于制备含htrA启动子和破伤风毒素C片编码基因的载体的起始物是质粒pTETnir15,其结构和制备公开于我们的早先申请PCT/GB93/01617(公开号WO94/03615)及其中所引文献如WO-A-92159689中。
pTETnir15质粒含有与破伤风毒素C片段(TetC)编码基因连接的nirB启动子。如图1中所示,pTETnir15用SacII和BamHI消化,用凝胶纯化生成的2.9kb和813bp的片段。将此2.9kb片段与来自百日咳博德特氏菌丝状血凝集素(FHA)基因的1.74kb片段连接,1.74kb片段的序列如SEQ.ID.No.7中所示。形成的质粒称为pBD907,其限制性图谱示于图5中。制备中间质粒pBD907的目的是除去TetC片段中EcoRI位点,以便nirB启动子序列能用htrA启动子序列取代。这是通过将质粒pBD907用EcoRI和BglII消化,生成的4535bp片段被凝胶纯化并与下述含htrA启动子的55bp寡核苷酸连接来完成的:Oligo-1
5′AATTCTATTCCGGAACTTCGCGTTATAAAATGAATGTGACGTACACAGCAATTTA(SEQ.ID.NO.2)Oligo-2
3′GATAAGGCCTTGAAGCGCAATATTTTACTTACACTGCATGTGTCGTTAAATCTAG(SEQ.ID.NO.3)
生成的中间质粒pINT中该启动子的存在已经DNA测序所证实。质粒pINT然后用SacII和BamHII消化,并与来自pTET15的813bp片段连接形成质粒pHTRA1。pHTRA1的DNA序列显示在SEQ.ID.No.4中;头55个碱基对确定的htrA区的序列如下:AATTCTATTCCGGAACTTCGCGTTATAAAATGAATCTGACGTACACAGCAATTTA(SEQ.ID.NO.1)
相对于SEQ.ID.NO.4,GAACTT是-35box,TCTGA是-10box。513和2235碱基对处分别为SacII和AlwN1限制酶位点。
质粒pHTRA1用于转化鼠伤寒沙门氏菌菌株BRD509(以保藏号NCTC…保藏),生成的菌株称为BRD935,按标准方法检查TetC片段的表达。BRD935菌株已保藏在英国Colindale的国家典型培养物保藏中心(National Collection of Type Caltures),保藏号为…。
如图2所示,质粒pHTRA1用于制备一种经修饰的构建物,其中“铰链”区存在于TetC片段的C末端。代表“绞链”区的核苷酸序列得自质粒pTECH2,后者具有SEQ.ID.No.5中所示DNA序列,并在533和2304位点分别具有SacII和AlwNI限制位点。该质粒的制备公开在我们早先的申请PCT/GB93/01617(公开号…)中。
pTECH2质粒含有nirB启动子区,其与破伤风毒素C片段连接,后者在其3′末端通过BamHI限制位点与一绞链区连接,该绞链区编码Gly-Pro-Gly-Pro重复基元并有多个限制酶位点,允许插入编码其他多肽的基因。通过用SacII和AlwNI消化并纯化,从pTECH2中取出编码该绞链区和破伤风毒素C片段区一部分的1.7kp片段。所得片段的DNA序列示于SEQ.ID.NO.6中。
编码htrA启动子和破伤风毒素C片段,但不包含绞链区的质粒pHTRA1,用SacII和AlwNI消化,生成的2kb片段用凝胶纯化。
将来自pTECH2的1.7kb片段(SEQ.ID.NO.6)和来自pHTRA1的2kb片段连接,形成质粒pHTRA2,它引入了与编码其3′末端有绞链区的破伤风毒素C片段的基因有效相连的htrA启动子。
用载体pHTRA2转化一株减毒鼠伤寒沙门氏菌,用标准方法筛选后分离到带有质粒pHTRA2的沙门氏菌BRD1062。
质粒pHTRA2用作制备编码由绞链区连接之融合蛋白的构建物的中间体。例如,按照我们早先申请No.PCT/GB93/01617中描述的技术,其他蛋白可被克隆在绞链区的限制性内切酶位点中。材料和方法菌株
在整个实验中使用大肠杆菌HB101和BRD509(一种减毒鼠伤寒沙门氏菌aroA aroD菌株(保藏号为…))。细菌生长在补有适当抗生素的Luria培养液(LB)中或用1.6%w/v琼脂固化的LB上。DNA操作
用碱裂解法纯化质粒DNA(R.Maniatis等,1982MolecularCloning-A Labaratory Manual,Cold Spring Harbor Labaratory,NewYork)。用Tautz和Rentz(1983,“An Optimised freeze-squeezemetnod for the recovery of DNA Fragments from agarosegels”.Analytical Biochem.,132,14-19)的方法,在琼脂糖凝胶上纯化DNA限制片段。限制酶由德国Boehringer Mannheim和美国Now EnglandBiolabs提供,并按制造商的说明使用。DNA测序
按Stephen等(1990,A Rapid Method for Isolating High QualityPlasmid DNA Suitable for DNA Sequencing,Nucleic AcidResearch,18,No.24,p7463)的方法分离用于双链测序的DNA。用Sequenase Version2试剂盒(USB)进行测序,按制造商的说明使用之。寡核苷酸
在SAM1寡核苷酸合成仪(Biolabs,UK)上合成。实施例2htrA-LacZ结构的制备
htrA启动子的特性与两种其他可诱导启动子(即nirB和groE启动子)比较。
nirB、htrA和groE启动子下游lacZ的亚克隆
用限制酶SalI和BamHI裂解质粒pMAC1871(Pharmacia)后,用低熔点琼脂糖技术从中纯化编码无启动子lacZ基因的DNA片段[14]。分别带有nirB和htrA启动子的质粒pTETnit-15[S.N.Chatfield等,Bio/Technology10,888-892]和pTEThtrA-1,用SalI和BamHI内切核酸酶消化,并将lacZ编码片段同框架克隆在启动子的下游。质粒pRZ-PES用于测量β-半乳糖苷酶(β-gal)在groE启动子下的表达。pRZ-PES含有位于groES和lacZ基因上游的大肠杆菌groE-操纵子启动子。它是通过将来自质粒pOF39[O.Fayet等,J.Bacteriol.171,1379-1385(1989)]带操纵子的2.1kb EcoRI-HindIII片段亚克隆到pUC19中而构建的。然后用定点诱变法在groES和groEL基因之间引入新的BglII位点。将含有groE启动子和groES基因的EcoRI-BglII片段克隆到EcoRI-BamHI切开的启动子-探针质粒pRF5255[P.F.Lambert等,J.Bacteriol.162,441-444(1985)]中得质粒pRZ-PES。用电穿孔法将鼠伤寒沙门氏菌LB5010(r-m+)[LR.Bullas等,J.Bacteriol.256,471-474(1983))中制备的质粒引入鼠伤寒沙门氏菌株BRD915(鼠伤寒沙门氏菌SL1344htrA)中[S.N.Chatfield等MicrobialPathog.12,145-151(1992))]。在含氨苄青霉素和X-gal的L琼脂板上筛选Lac阳性重组子。环境条件的变化对LacZ表达的影响
将带有重组质粒的细菌株于30℃振动下在LB中生长过夜。将培养物以1∶50稀释,继续在30℃生长3小时,直到OD600达到2.8-3.4。取每种培养物0.2m14°保存,用于测定β-gal活性的基线。然后将培养物其余部分转移到以下描述的不同生长条件下,在0、2、4、6和24小时取样,除非另有说明。测定每个时间点的OD600,在进行β-gal分析前细菌于4°保存。测定感染的HEp-2、Caco-2和THP1-巨噬细胞细胞系中的表达
将细胞以约105细胞/孔种入24孔板中,并在补有10%(体积/体积)脂牛血清和2mM谷氨酰胺的无酚红Dalbecco改良Eagles培养液(ICNFLOW)中于37℃、5%CO2气氛下生长过夜。将稀释的过夜培养物中108CFU细菌加入到组织培养细胞中并在30℃保温。在各个时间点取组织培养液样品,以测定细胞外细菌中的β-gal活性。通过活菌计数测定每个样品中的细菌数目,并用标准曲线确定相应的OD600。用磷酸盐缓冲盐水(PBS)洗涤感染细胞,在200mg/ml庆大霉素存在下再保温1小时以杀死细胞外细菌。然后用无菌蒸馏水和剧烈的吸移裂解细胞。测定每个细胞裂解液的β-gal活性。通过活菌计数测定每个裂解液中的细菌数目,并且标准曲线测定相应的OD600值。结果
在本研究所选的每个启动子下的表达都对环境条件的变化敏感。以前已证明nirB对无氧性的变化有反应。进行开始的几个实验是为了评估lacZ在每个启动子下的表达水平和相似多拷贝质粒在沙门氏菌疫苗株BRD915中的存在。温度变化对不同启动子的影响示于图7中。温度由30℃变至37℃(图7A)造成lacZ在nirB和htrA启动子下表达时β-gal酶单位提高。在groE启动子下没有检测到β-gal单位的显著升高。温度从30℃升至42℃造成所有三种启动子下升高数个β-gal单位。β-gal水平的升高速率在htrA和nirB下比groE下要快(图7B)。从37℃到42℃的温度变化造成对nirB和htrA启动子的诱导,在groE启动子下B-gal单位的升高较温和(图7C)。
还通过筛选已进入真核细胞的细菌试验了β-gal不同启动子下的表达。用108细菌感染HEp-2、Caco-2和THP-1巨噬细胞细胞系,并在30℃培养。感染HEp-2三小时后测得的β-gal单位数目表明:lacZ在htrA和nirB启动子下的表达显著提高(图2)。但lacZ在groE启动子下的表达没有可检测的升高。用感染的CaCo-2细胞获得了相似的结果(未显示)。相反,在巨噬细胞的细胞内环境中,所有三种启动子都被诱导(图8)。nirB启动子受影响最大,而groE启动子受影响最小(图8)。当测定任一细胞系细胞外培养液中的β-gal单位时,未见该酶活性有提高(未显示)。
因为发现巨噬细胞内的生长影响所有三种启动子下的表达,所以监测了它们对巨噬细胞吞噬体内常见的过氧化氢的敏感性。在100μM过氧化氢中30℃培养细菌,没有造成对groE和nirB启动子的显著影响。相反,在htrA启动子下β-gal水平升高,4小时达到了基本水平以上10U。然后到6小时迅速降至基线水平(未显示)。lacZ从质粒pLK[M.Szabo等,J.Bacteriol,174,7245-7252]的组成型表达不受任何环境条件的显著影响(未显示)。
在本研究中使用三种环境调节型启动子在不同生长条件下表达lacZ基因。这些启动子是三类可诱导细菌启动子的代表:无氧诱导的大肠杆菌nirB、σE依赖性htrA和σ32依赖性groE。在nirB启动子下的表达依赖于转录因子FNR,它结合在转录起始密码上游-52和-30位之间。有时FNR依赖性转录受第二转录因子NarL的共同调节。但本文所用质粒pTETnir-15仅含有FNR依赖性结合位点。
细菌通过对许多蛋白合成速率的快速改变来对环境应激条件作出反应。在许多情况下,短暂(transit)的诱导能将蛋白水平迅速调节至一个新的稳定水平。在本研究中我们试验了环境条件对β-gal水平的影响。我们发现温度变迁对htrA启动子的影响大于对groE的影响。这一结果与htrA启动子先于groE(σ32依赖性)和groE加σ32被含σERNA聚合酶所诱导[11,12]这一事实相一致。令人惊异的是温度升高nirB启动子也增强。虽然生长培养基中氧浓度在高温下可能减低,但从30℃到37℃的温度变迁致使在nirB启动子下表达的β-gal单位迅速增加这一事实提示:FNR像其他应激蛋白调制剂对许多环境刺激有反应。与此相似,htrA也在无氧生长条件下被诱导,因此看来该启动子要么受σE以外的因子调节,要么σE还在低氧张力下被激活。
鼠伤寒沙门氏菌要保持毒性则细菌必须能够在巨噬细胞内存活。这种存活取决于细菌对许多毒性杀伤机制(包括过氧化氢的产生)的耐受能力。与大肠杆菌htrA突变体不同,以前已发现鼠伤寒沙门氏菌htrA突变体在升高温度时不被杀死,但在显著水平过氧化氢下生存能力受损。有趣的是htraA启动子是在过氧化氢存在下表达增加的唯一试验启动子。
为了确定细胞内环境的影响,在带有试验质粒的沙门氏菌已进入几种不同的真核培养细胞系中后,监测在不同启动子下的表达水平。细菌在体外生长并用于在30℃感染真核细胞,因为温度从30℃变至37℃剧烈诱导htrA和nirB启动子。我们发现在nirB和htrA启动子下β-gal表达水平在所有试验细胞系中都提高,而groE启动子只在感染巨噬细胞中被诱导。
序列表(1)一般信息:
(i)申请人
(A)名称:MEDEVA HOLDING BV
(B)街道:CHURCHILL-LAAN223
(C)城市:AMSTERDAM
(E)国家:荷兰
(F)邮编(ZIP):1078ED
(ii)发明题目:疫苗
(iii)序列数:7
(iv)计算机可读形式:
(A)媒介类型:软盘
(B)计算机:IBM PC兼容机
(C)操作系统:PC-DOS/MS-DOS
(D)软件:PatentIn Release#1.0,Version#1.25(EPO)
(vi)在先申请:
(A)申请号:GB9401795.1
(B)申请日:31-JAN-1994(2)SEQ.ID.NO.1的信息:
(i)序列特征:
(A)长度:55碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ii)分子类型:DNA(基因组的)
(iii)假拟:否
(iv)反义:否
(vi)原始来源:
(A)生物:鼠伤寒沙门氏菌
(ix)特征:
(A)名称/关键词:启动子
(B)位置:1..55
(xi)序列描述:SEQ.ID.NO.1:
AATTCTATTC CGGAACTTCG CGTTATAAAA TGAATCTGAC GTACACAGCA ATTTA 55
(2)SEQ.ID.NO.2的信息:
(i)序列特征:
(A)长度:55碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ii)分子类型:DNA(基因组的)
(iii)假拟:否
(iv)反义:否
(xi)序列描述:SEQ.ID.NO.2:
AATTCTATTC CGGAACTTCG CGTTATAAAA TGAATGTGAC GTACACAGCA ATTTA 55
(2)SEQ.ID.NO.3的信息:
(i)序列特征:
(A)长度:55碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ii)分子类型:DNA(基因组的)
(iii)假拟:否
(iv)反义:否
(xi)序列描述:SEQ.ID.NO.3:
GATAAGGCCT TGAAGCGCAA TATTTTACTT ACACTGCATG TGTCGTTAAA TCTAG 55
(2)SEQ.ID.NO.4的信息:
(i)序列特征:
(A)长度:3712碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:环形
(ii)分子类型:DNA(基因组的)
(iii)假拟:否
(iv)反义:否
(ix)特征:
(A)名称/关键词:htrA启动子
(B)位置:1.55
(ix)特征:
(A)名称/关键词:SacII限制位点
(B)位置:513
(ix)特征:
(A)名称/关键词:AlwN1限制位点
(B)位置:2235
(xi)序列描述:SEQ.ID.NO.4AATTCTATTC CGGAACTTCG CGTTATAAAA TGAATCTGAC GTACACAGCA ATTTAGATCT 60TAATCATCCA CAGGAGACTT TCTGATGAAA AACCTTGATT GTTGGGTCGA CAACGAAGAA 120GACATCGATG TTATCCTGAA AAAGTCTACC ATTCTGAACT TGGACATCAA CAACGATATT 180ATCTCCGACA TCTCTGGTTT CAACTCCTCT GTTATCACAT ATCCAGATGC TCAATTGGTG 240CCGGGCATCA ACGGCAAAGC TATCCACCTG GTTAACAACG AATCTTCTGA AGTTATCGTG 300CACAAGGCCA TGGACATCGA ATACAACGAC ATGTTCAACA ACTTCACCGT TAGCTTCTGG 360CTGCGCGTTC CGAAAGTTTC TGCTTCCCAC CTGGAACAGT ACGGCACTAA CGAGTACTCC 420ATCATCAGCT CTATGAAGAA ACACTCCCTG TCCATCGGCT CTGGTTGGTC TGTTTCCCTG 480AAGGGTAACA ACCTGATCTG GACTCTGAAA GACTCCGCGG GCGAAGTTCG TCAGATCACT 540TTCCGCGACC TGCCGGACAA GTTCAACGCG TACCTGGCTA ACAAATGGGT TTTCATCACT 600ATCACTAACG ATCGTCTGTC TTCTGCTAAC CTGTACATCA ACGGCGTTCT GATGGGCTCC 660GCTGAAATCA CTGGTCTGGG CGCTATCCGT GAGGACAACA ACATCACTCT TAAGCTGGAC 720CGTTGCAACA ACAACAACCA GTACGTATCC ATCGACAAGT TCCGTATCTT CTGCAAAGCA 780CTGAACCCGA AAGAGATCGA AAAACTGTAT ACCAGCTACC TGTCTATCAC CTTCCTGCGT 840GACTTCTGGG GTAACCCGCT GCGTTACGAC ACCGAATATT ACCTGATCCC GGTAGCTTCT 900AGCTCTAAAG ACGTTCAGCT GAAAAACATC ACTGACTACA TGTACCTGAC CAACGCGCCG 960TCCTACACTA ACGGTAAACT GAACATCTAC TACCGACGTC TGTACAACGG CCTGAAATTC 1020ATCATCAAAC GCTACACTCC GAACAACGAA ATCGATTCTT TCGTTAAATC TGGTGACTTC 1080ATCAAACTGT ACGTTTCTTA CAACAACAAC GAACACATCG TTGGTTACCC GAAAGACGGT 1140AACGCTTTCA ACAACCTGGA CAGAATTCTG CGTGTTGGTT ACAACGCTCC GGGTATCCCG 1200CTGTACAAAA AAATGGAAGC TGTTAAACTG CGTGACCTGA AAACCTACTC TGTTCAGCTG 1260AAACTGTACG ACGACAAAAA CGCTTCTCTG GGTCTGGTTG GTACCCACAA CGGTCAGATC 1320GGTAACGACC CGAACCGTGA CATCCTGATC GCTTCTAACT GGTACTTCAA CCACCTGAAA 1380GACAAAATCC TGGGTTGCGA CTGGTACTTC GTTCCGACCG ATGAAGGTTG GACCAACGAC 1440TAAGGATCCG CTAGCCCGCC TAATGAGCGG GCTTTTTTTT CTCGGGCAGC GTTGGGTCCT 1500GGCCACGGGT GCGCATGATC GTGCTCCTGT CGTTGAGGAC CCGGCTAGGC TGGCGGGGTT 1560GCCTTACTGG TTAGCAGAAT GAATCACCGA TACGCGAGCG AACGTGAAGC GACTGCTGCT 1620GCAAAACGTC TGCGACCTGA GCAACAACAT GAATGGTCTT CGGTTTCCGT GTTTCGTAAA 1680GTCTGGAAAC GCGGAAGTCA GCGCTCTTCC GCTTCCTCGC TCACTGACTC GCTGCGCTCG 1740GTCGTTCGGC TGCGGCGAGC GGTATCAGCT CACTCAAAGG CGGTAATACG GTTATCCACA 1800GAATCAGGGG ATAACGCAGG AAAGAACATG TGAGCAAAAG GCCAGCAAAA GGCCAGGAAC 1860CGTAAAAAGG CCGCGTTGCT GGCGTTTTTC CATAGGCTCC GCCCCCCTGA CGAGCATCAC 1920AAAAATCGAC GCTCAAGTCA GAGGTGGCGA AACCCGACAG GACTATAAAG ATACCAGGCG 1980TTTCCCCCTG GAAGCTCCCT CGTGCGCTCT CCTGTTCCGA CCCTGCCGCT TACCGGATAC 2040CTGTCCGCCT TTCTCCCTTC GGGAAGCGTG GCGCTTTCTC AATGCTCACG CTGTAGGTAT 2100CTCAGTTCGG TGTAGGTCGT TCGCTCCAAG CTGGGCTGTG TGCACGAACC CCCCGTTCAG 2160CCCGACCGCT GCGCCTTATC CGGTAACTAT CGTCTTGAGT CCAACCCGGT AAGACACGAC 2220TTATCGCCAC TGGCAGCAGC CACTGGTAAC AGGATTAGCA GAGCGAGGTA TGTAGGCGGT 2280GCTACAGAGT TCTTGAAGTG GTGGCCTAAC TACGGCTACA CTAGAAGGAC AGTATTTGGT 2340ATCTGCGCTC TGCTGAAGCC AGTTACCTTC GGAAAAAGAG TTGGTAGCTC TTGATCCGGC 2400AAACAAACCA CCGCTGGTAG CGGTGGTTTT TTTGTTTGCA AGCAGCAGAT TACGCGCAGA 2460AAAAAAGGAT CTCAAGAAGA TCCTTTGATC TTTTCTACGG GGTCTGACGC TCAGTGGAAC 2520GAAAACTCAC GTTAAGGGAT TTTGGTCATG AGATTATCAA AAAGGATCTT CACCTAGATC 2580CTTTTAAATT AAAAATGAAG TTTTAAATCA ATCTAAAGTA TATATGAGTA AACTTGGTCT 2640GACAGTTACC AATGCTTAAT CAGTGAGGCA CCTATCTCAG CGATCTGTCT ATTTCGTTCA 2700TCCATAGTTG CCTGACTCCC CGTCGTGTAG ATAACTACGA TACGGGAGGG CTTACCATCT 2760GGCCCCAGTG CTGCAATGAT ACCGCGAGAC CCACGCTCAC CGGCTCCAGA TTTATCAGCA 2820ATAAACCAGC CAGCCGGAAG GGCCGAGCGC AGAAGTGGTC CTGCAACTTT ATCCGCCTCC 2880ATCCAGTCTA TTAATTGTTG CCGGGAAGCT AGAGTAAGTA GTTCGCCAGT TAATAGTTTG 2940CGCAACGTTG TTGCCATTGC TGCAGGCATC GTGGTGTCAC GCTCGTCGTT TGGTATGGCT 3000TCATTCAGCT CCGGTTCCCA ACGATCAAGG CGAGTTACAT GATCCCCCAT GTTGTGCAAA 3060AAAGCGGTTA GCTCCTTCGG TCCTCCGATC GTTGTCAGAA GTAAGTTGGC CGCAGTGTTA 3120TCACTCATGG TTATGGCAGC ACTGCATAAT TCTCTTACTG TCATGCCATC CGTAAGATGC 3180TTTTCTGTGA CTGGTGAGTA CTCAACCAAG TCATTCTGAG AATAGTGTAT GCGGCGACCG 3240AGTTGCTCTT GCCCGGCGTC AACACGGGAT AATACCGCGC CACATAGCAG AACTTTAAAA 3300GTGCTCATCA TTGGAAAACG TTCTTCGGGG CGAAAACTCT CAAGGATCTT ACCGCTGTTG 3360AGATCCAGTT CGATGTAACC CACTCGTGCA CCCAACTGAT CTTCAGCATC TTTTACTTTC 3420ACCAGCGTTT CTGGGTGAGC AAAAACAGGA AGGCAAAATG CCGCAAAAAA GGGAATAAGG 3480GCGACACGGA AATGTTGAAT ACTCATACTC TTCCTTTTTC AATATTATTG AAGCATTTAT 3540CAGGGTTATT GTCTCATGAG CGGATACATA TTTGAATGTA TTTAGAAAAA TAAACAAATA 3600GGGGTTCCGC GCACATTTCC CCGAAAAGTG CCACCTGACG TCTAAGAAAC CATTATTATC 3660ATGACATTAA CCTATAAAAA TAGGCGTATC ACGAGGCCCT TTCGTCTTCA AG 3712
(2)SEQ.ID.NO.5的信息:
(i)序列特征:
(A)长度:3769碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:环形
(ii)分子类型:DNA(基因组的)
(iii)假拟:否
(iv)反义:否
(xi)序列描述:SEQ.ID.NO.5TTCAGGTAAA TTTGATGTAC ATCAAATGGT ACCCCTTGCT GAATCGTTAA GGTAGGCGGT 60AGGGCCCAGA TCTTAATCAT CCACAGGAGA CTTTCTGATG AAAAACCTTG ATTGTTGGGT 120CGACAACGAA GAAGACATCG ATGTTATCCT GAAAAAGTCT ACCATTCTGA ACTTGGACAT 180CAACAACGAT ATTATCTCCG ACATCTCTGG TTTCAACTCC TCTGTTATCA CATATCCAGA 240TGCTCAATTG GTGCCGGGCA TCAACGGCAA AGCTATCCAC CTGGTTAACA ACGAATCTTC 300TGAAGTTATC GTGCACAAGG CCATGGACAT CGAATACAAC GACATGTTCA ACAACTTCAC 360CGTTAGCTTC TGGCTGCGCG TTCCGAAAGT TTCTGCTTCC CACCTGGAAC AGTACGGCAC 420TAACGAGTAC TCCATCATCA GCTCTATGAA GAAACACTCC CTGTCCATCG GCTCTGGTTG 480GTCTGTTTCC CTGAAGGGTA ACAACCTGAT CTGGACTCTG AAAGACTCCG CGGGCGAAGT 540TCGTCAGATC ACTTTCCGCG ACCTGCCGGA CAAGTTCAAC GCGTACCTGG CTAACAAATG 600GGTTTTCATC ACTATCACTA ACGATCGTCT GTCTTCTGCT AACCTGTACA TCAACGGCGT 660TCTGATGGGC TCCGCTGAAA TCACTGGTCT GGGCGCTATC CGTGAGGACA ACAACATCAC 720TCTTAAGCTG GACCGTTGCA ACAACAACAA CCAGTACGTA TCCATCGACA AGTTCCGTAT 780CTTCTGCAAA GCACTGAACC CGAAAGAGAT CGAAAAACTG TATACCAGCT ACCTGTCTAT 840CACCTTCCTG CGTGACTTCT GGGGTAACCC GCTGCGTTAC GACACCGAAT ATTACCTGAT 900CCCGGTAGCT TCTAGCTCTA AAGACGTTCA GCTGAAAAAC ATCACTGACT ACATGTACCT 960GACCAACGCG CCGTCCTACA CTAACGGTAA ACTGAACATC TACTACCGAC GTCTGTACAA 1020CGGCCTGAAA TTCATCATCA AACGCTACAC TCCGAACAAC GAAATCGATT CTTTCGTTAA 1080ATCTGGTGAC TTCATCAAAC TGTACGTTTC TTACAACAAC AACGAACACA TCGTTGGTTA 1140CCCGAAAGAC GGTAACGCTT TCAACAACCT GGACAGAATT CTGCGTGTTG GTTACAACGC 1200TCCGGGTATC CCGCTGTACA AAAAAATGGA AGCTGTTAAA CTGCGTGACC TGAAAACCTA 1260CTCTGTTCAG CTGAAACTGT ACGACGACAA AAACGCTTCT CTGGGTCTGG TTGGTACCCA 1320CAACGGTCAG ATCGGTAACG ACCCGAACCG TGACATCCTG ATCGCTTCTA ACTGGTACTT 1380CAACCACCTG AAAGACAAAA TCCTGGGTTG CGACTGGTAC TTCGTTCCGA CCGATGAAGG 1440TTGGACCAAC GACGGGCCGG GGCCCTCTAG AGGATCCGAT ATCAAGCTTA CTAGTTAATG 1500ATCCGCTAGC CCGCCTAATG AGCGGGCTTT TTTTTCTCGG GCAGCGTTGG GTCCTGGCCA 1560CGGGTGCGCA TGATCGTGCT CCTGTCGTTG AGGACCCGGC TAGGCTGGCG GGGTTGCCTT 1620ACTGGTTAGC AGAATGAATC ACCGATACGC GAGCGAACGT GAAGCGACTG CTGCTGCAAA 1680ACGTCTGCGA CCTGAGCAAC AACATGAATG GTCTTCGGTT TCCGTGTTTC GTAAAGTCTG 1740GAAACGCGGA AGTCAGCGCT CTTCCGCTTC CTCGCTCACT GACTCGCTGC GCTCGGTCGT 1800TCGGCTGCGG CGAGCGGTAT CAGCTCACTC AAAGGCGGTA ATACGGTTAT CCACAGAATC 1860AGGGGATAAC GCAGGAAAGA ACATGTGAGC AAAAGGCCAG CAAAAGGCCA GGAACCGTAA 1920AAAGGCCGCG TTGCTGGCGT TTTTCCATAG GCTCCGCCCC CCTGACGAGC ATCACAAAAA 1980TCGACGCTCA AGTCAGAGGT GGCGAAACCC GACAGGACTA TAAAGATACC AGGCGTTTCC 2040CCCTGGAAGC TCCCTCGTGC GCTCTCCTGT TCCGACCCTG CCGCTTACCG GATACCTGTC 2100CGCCTTTCTC CCTTCGGGAA GCGTGGCGCT TTCTCAATGC TCACGCTGTA GGTATCTCAG 2160TTCGGTGTAG GTCGTTCGCT CCAAGCTGGG CTGTGTGCAC GAACCCCCCG TTCAGCCCGA 2220CCGCTGCGCC TTATCCGGTA ACTATCGTCT TGAGTCCAAC CCGGTAAGAC ACGACTTATC 2280GCCACTGGCA GCAGCCACTG GTAACAGGAT TAGCAGAGCG AGGTATGTAG GCGGTGCTAC 2340AGAGTTCTTG AAGTGGTGGC CTAACTACGG CTACACTAGA AGGACAGTAT TTGGTATCTG 2400CGCTCTGCTG AAGCCAGTTA CCTTCGGAAA AAGAGTTGGT AGCTCTTGAT CCGGCAAACA 2460AACCACCGCT GGTAGCGGTG GTTTTTTTGT TTGCAAGCAG CAGATTACGC GCAGAAAAAA 2520AGGATCTCAA GAAGATCCTT TGATCTTTTC TACGGGGTCT GACGCTCAGT GGAACGAAAA 2580CTCACGTTAA GGGATTTTGG TCATGAGATT ATCAAAAAGG ATCTTCACCT AGATCCTTTT 2640AAATTAAAAA TGAAGTTTTA AATCAATCTA AAGTATATAT GAGTAAACTT GGTCTGACAG 2700TTACCAATGC TTAATCAGTG AGGCACCTAT CTCAGCGATC TGTCTATTTC GTTCATCCAT 2760AGTTGCCTGA CTCCCCGTCG TGTAGATAAC TACGATACGG GAGGGCTTAC CATCTGGCCC 2820CAGTGCTGCA ATGATACCGC GAGACCCACG CTCACCGGCT CCAGATTTAT CAGCAATAAA 2880CCAGCCAGCC GGAAGGGCCG AGCGCAGAAG TGGTCCTGCA ACTTTATCCG CCTCCATCCA 2940GTCTATTAAT TGTTGCCGGG AAGCTAGAGT AAGTAGTTCG CCAGTTAATA GTTTGCGCAA 3000CGTTGTTGCC ATTGCTGCAG GCATCGTGGT GTCACGCTCG TCGTTTGGTA TGGCTTCATT 3060CAGCTCCGGT TCCCAACGAT CAAGGCGAGT TACATGATCC CCCATGTTGT GCAAAAAAGC 3120GGTTAGCTCC TTCGGTCCTC CGATCGTTGT CAGAAGTAAG TTGGCCGCAG TGTTATCACT 3180CATGGTTATG GCAGCACTGC ATAATTCTCT TACTGTCATG CCATCCGTAA GATGCTTTTC 3240TGTGACTGGT GAGTACTCAA CCAAGTCATT CTGAGAATAG TGTATGCGGC GACCGAGTTG 3300CTCTTGCCCG GCGTCAACAC GGGATAATAC CGCGCCACAT AGCAGAACTT TAAAAGTGCT 3360CATCATTGGA AAACGTTCTT CGGGGCGAAA ACTCTCAAGG ATCTTACCGC TGTTGAGATC 3420CAGTTCGATG TAACCCACTC GTGCACCCAA CTGATCTTCA GCATCTTTTA CTTTCACCAG 3480CGTTTCTGGG TGAGCAAAAA CAGGAAGGCA AAATGCCGCA AAAAAGGGAA TAAGGGCGAC 3540ACGGAAATGT TGAATACTCA TACTCTTCCT TTTTCAATAT TATTGAAGCA TTTATCAGGG 3600TTATTGTCTC ATGAGCGGAT ACATATTTGA ATGTATTTAG AAAAATAAAC AAATAGGGGT 3660TCCGCGCACA TTTCCCCGAA AAGTGCCACC TGACGTCTAA GAAACCATTA TTATCATGAC 3720ATTAACCTAT AAAAATAGGC GTATCACGAG GCCCTTTCGT CTTCAAGAA 3769
(2)SEQ.ID.NO.6的信息:
(i)序列特征:
(A)长度:1766碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:线性
(ii)分子类型:DNA(基因组的)
(iii)假拟:否
(iv)反义:否
(v)片段类型:内部
(ix)特征:
(A)名称/关键词:绞链区
(B)位置:923..934
(xi)序列描述:SEQ.ID.NO.6GGGCGAAGTT CGTCAGATCA CTTTCCGCGA CCTGCCGGAC AAGTTCAACG CGTACCTGGC 60TAACAAATGG GTTTTCATCA CTATCACTAA CGATCGTCTG TCTTCTGCTA ACCTGTACAT 120CAACGGCGTT CTGATGGGCT CCGCTGAAAT CACTGGTCTG GGCGCTATCC GTGAGGACAA 180CAACATCACT CTTAAGCTGG ACCGTTGCAA CAACAACAAC CAGTACGTAT CCATCGACAA 240GTTCCGTATC TTCTGCAAAG CACTGAACCC GAAAGAGATC GAAAAACTGT ATACCAGCTA 300CCTGTCTATC ACCTTCCTGC GTGACTTCTG GGGTAACCCG CTGCGTTACG ACACCGAATA 360TTACCTGATC CCGGTAGCTT CTAGCTCTAA AGACGTTCAG CTGAAAAACA TCACTGACTA 420CATGTACCTG ACCAACGCGC CGTCCTACAC TAACGGTAAA CTGAACATCT ACTACCGACG 480TCTGTACAAC GGCCTGAAAT TCATCATCAA ACGCTACACT CCGAACAACG AAATCGATTC 540TTTCGTTAAA TCTGGTGACT TCATCAAACT GTACGTTTCT TACAACAACA ACGAACACAT 600CGTTGGTTAC CCGAAAGACG GTAACGCTTT CAACAACCTG GACAGAATTC TGCGTGTTGG 660TTACAACGCT CCGGGTATCC CGCTGTACAA AAAAATGGAA GCTGTTAAAC TGCGTGACCT 720GAAAACCTAC TCTGTTCAGC TGAAACTGTA CGACGACAAA AACGCTTCTC TGGGTCTGGT 780TGGTACCCAC AACGGTCAGA TCGGTAACGA CCCGAACCGT GACATCCTGA TCGCTTCTAA 840CTGGTACTTC AACCACCTGA AAGACAAAAT CCTGGGTTGC GACTGGTACT TCGTTCCGAC 900CGATGAAGGT TGGACCAACG ACGGGCCGGG GCCCTCTAGA GGATCCGATA TCAAGCTTAC 960TAGTTAATGA TCCGCTAGCC CGCCTAATGA GCGGGCTTTT TTTTCTCGGG CAGCGTTGGG 1020TCCTGGCCAC GGGTGCGCAT GATCGTGCTC CTGTCGTTGA GGACCCGGCT AGGCTGGCGG 1080GGTTGCCTTA CTGGTTAGCA GAATGAATCA CCGATACGCG AGCGAACGTG AAGCGACTGC 1140TGCTGCAAAA CGTCTGCGAC CTGAGCAACA ACATGAATGG TCTTCGGTTT CCGTGTTTCG 1200TAAAGTCTGG AAACGCGGAA GTCAGCGCTC TTCCGCTTCC TCGCTCACTG ACTCGCTGCG 1260CTCGGTCGTT CGGCTGCGGC GAGCGGTATC AGCTCACTCA AAGGCGGTAA TACGGTTATC 1320CACAGAATCA GGGGATAACG CAGGAAAGAA CATGTGAGCA AAAGGCCAGC AAAAGGCCAG 1380GAACCGTAAA AAGGCCGCGT TGCTGGCGTT TTTCCATAGG CTCCGCCCCC CTGACGAGCA 1440TCACAAAAAT CGACGCTCAA GTCAGAGGTG GCGAAACCCG ACAGGACTAT AAAGATACCA 1500GGCGTTTCCC CCTGGAAGCT CCCTCGTGCG CTCTCCTGTT CCGACCCTGC CGCTTACCGG 1560ATACCTGTCC GCCTTTCTCC CTTCGGGAAG CGTGGCGCTT TCTCAATGCT CACGCTGTAG 1620GTATCTCAGT TCGGTGTAGG TCGTTCGCTC CAAGCTGGGC TGTGTGCACG AACCCCCCGT 1680TCAGCCCGAC CGCTGCGCCT TATCCGGTAA CTATCGTCTT GAGTCCAACC CGGTAAGACA 1740CGACTTATCG CCACTGGCAG CAGCCA 1766
(2)SEQ.ID.NO.7的信息:
(i)序列特征:
(A)长度:1736碱基对
(B)类型:核酸
(D)拓扑结构:线性
(ii)分子类型:DNA(基因组的)
(v)片段类型:内部
(xi)序列描述:SEQ.ID.NO.7GGCGGCCTAC GCGATTGACG GCACGGCGGC GGGCGCCATG TACGGCAAGC ACATCACGCT 60GGTGTCCAGC GATTCAGGCC TGGGCGTGCG CCAGCTCGGC AGCCTGTCCT CGCCATCGGC 120CATCACCGTG TCGTCGCAGG GCGAAATCGC GCTGGGCGAC GCCACGGTCC AGCGCGGCCC 180GCTCAGCCTC AAGGGCGCGG GGGTCGTGTC GGCCGGCAAA CTGGCCTCCG GGGGGGGGGC 240GGTGAACGTC GCGGGCGGCG GGGCGGTGAA GATCGCGTCG GCCAGCAGCG TTGGAAACCT 300CGCGGTGCAA GGCGGCGGCA AGGTACAGGC CACGCTGTTG AATGCCGGGG GGACGTTGCT 360GGTGTCGGGC CGCCAGGCCG TCCAGCTTGG CGCGGCGAGC AGCCGTCAGG CGCTGTCCGT 420GAACGCGGGC GGCGCCCTCA AGGCGGACAA GCTGTCGGCG ACGCGACGGG TCGACGTGGA 480TGGCAAGCAG GCCGTCGCGC TGGGGTCGGC CAGCAGCAAT GCGCTGTCGG TGCGTGCCGG 540CGGCGCCCTC AAGGCGGGCA AGCTGTCGGC GACGGGGCGA CTGGACGTGG ACGGCAAGCA 600GGCCGTCACG CTGGGTTCGG TTGCGAGCGA CGGTGCGCTG TCGGTAAGCG CTGGCGGAAA 660CCTGCGGGCG AACGAATTGG TCTCCAGTGC CCAACTTGTG GTGCGTGGGC AGCGGGAGGT 720CGCGCTGGAT GACGCTTCGA GCGCACGCGG CATGACCGTG GTTGCCGCAG GAGCGCTGGC 780GGCCCGCAAC CTGCAGTCCA AGGGCGCCAT CGGCGTACAG GGTGGAGAGG CGGTCAGCGT 840GGCCAACGCG AACAGCGACG CGGAATTGCG CGTGCGCGGG CGCGGCCAGG TGGATCTGCA 900CGACCTGAGC GCAGCGCGCG GCGCGGATAT CTCCGGCGAG GGGCGCGTCA ATATCGGCCG 960TGCGCGCAGC GATAGCGATG TGAAGGTCTC CGGGCACGGC GCCTTGTCGA TCGATAGCAT 1020GACGGCCCTC GGTGCGATCG GCGTCCAGGC AGGCGGCAGC GTGTCGGCCA AGGATATGCG 1080CAGCCGTGGC GCCGTCACCG TCAGCGGCGG CGGCGCCGTC AACCTGGGCG ATGTCCAGTC 1140GGATGGGCAG GTCCGCGCCA CCAGCGCGGG CGCCATGACG GTGCGAGACG TCGCGGCTGC 1200CGCCGACCTT GCGCTGCAGG CGGGCGACGC GTTGCAGGCC GGGTTCCTGA AATCGGCCGG 1260TGCCATGACC GTGAACGGCC GCGATGCCGT GCGACTGGAT GGCGCGCACG CGGGCGGGCA 1320ATTGCGGGTT TCCAGCGACG GGCAGGCTGC GTTGGGCAGT CTCGCGGCCA AGGGCGAGCT 1380GACGGTATCG GCCGCGCGCG CGGCGACCGT GGCCGAGTTG AAGTCGCTGG ACAACATCTC 1440CGTGACGGGC GGCGAACGCG TGTCGGTTCA GAGCGTCAAC AGCGCGTCCA GGGTCGCCAT 1500TTCGGCGCAC GGCGCGCTGG ATGTAGGCAA GGTTTCCGCC AAGAGCGGTA TCGGGCTCGA 1560AGGCTGGGGC GCGGTCGGAG CGGACTCCCT CGGTTCCGAC GGCGCGATCA GCGTGTCCGG 1620GCGCGATGCG GTCAGGGTCG ATCAAGCCCG CAGTCTTGCC GACATTTCGC TGGGGGCGGA 1680AGGCGGCGCC ACGCTGGGCG CGGTGGAGGC CGCCGGTTCG ATCGACGTGC GCGGCG 1736