编码用于结核分枝杆菌细胞摄入的DNA分子及其应用.pdf

摘要
申请专利号：	CN96193436.0	申请日：	1996.02.20
公开号：	CN1182454A	公开日：	1998.05.20
当前法律状态：	终止	有效性：	无权
法律详情：	\|\|\|公开
IPC分类号：	C12N15/31; C12N1/21; C12N15/70; C07K14/35; C07K16/12; A61K39/04; A61K39/395; G01N33/569; C12Q1/68	主分类号：	C12N15/31; C12N1/21; C12N15/70; C07K14/35; C07K16/12; A61K39/04; A61K39/395; G01N33/569; C12Q1/68
申请人：	康乃尔研究基金会有限公司;
发明人：	L·W·里莱
地址：	美国纽约州
优先权：	1995.02.22 US 08/392,210
专利代理机构：	中国专利代理(香港)有限公司	代理人：	罗宏;谭明胜
PDF下载：	PDF下载

内容摘要

本发明涉及赋予结核分枝杆菌进入哺乳动物细胞并在巨噬细胞中存活之能力的DNA分子。由该基因片段编码的蛋白在防止结核分枝杆菌感染的疫苗中是有用的,而产生的抗该蛋白的抗体用于被动免疫那些已由该有机体感染的患者。这些蛋白和抗体均可用于检测组织或体液中结核分枝杆菌的诊断分析。本发明的蛋白可与各种其它治疗物质一起,用于施用于哺乳动物,尤其是人类,从而实现这类细胞对这些物质的摄入。

权利要求书

1：赋予结核分枝杆菌进入哺乳动物细胞和(/或〕巨噬细胞中存活能力的分离的DNA分子。
2：根据权利要求1的分离的DNA分子，其中所述的DNA分子包括相应于SEQ.ID.NO.1的核苷酸序列。
3：根据权利要求1的分离的DNA分子，其中所述的DNA编码具有约50-55千道尔顿分子量的多肽。
4：〔根据权利要求1的〕分离的DNA分子，〔其中所说的DNA 分子赋予〕赋予结核分枝杆菌进入哺乳动物细胞的能力。
5：根据权利要求4的分离的DNA分子，其中所述的DNA分子包括相应于SEQ.ID.NO.3的核苷酸序列。
6：根据权利要求4的分离的DNA分子，其中所述的DNA分子编码具有约22至28千道尔顿分子量的多肽。
7：〔根据权利要求1的〕分离的DNA分子，〔其中所述的DNA 分子赋予〕赋予结核分枝杆菌在巨噬细胞内存活的能力并包括相应于 SEQ.ID.NO.5的核苷酸序列。
8：由根据权利要求1的赋予结核分枝杆菌进入哺乳动物细胞和〔或〕在巨噬细胞内存活能力的DNA分子编码的分离的蛋白或多肽。
9：根据权利要求8的分离的蛋白或多肽，其中所述的DNA分子包括相应于SEQ.ID.NO.1的核苷酸序列。
10：根据权利要求8的分离的蛋白或多肽，其中的蛋白或多肽具有相应于SEQ.ID.NO.2的氨基酸序列。
11：根据权利要求8的分离的蛋白或多肽，其中所述的蛋白或多肽具有约50-55千道尔顿的分子量。
12：根据权利要求4的DNA分子编码〔8〕的分离的蛋白质或多肽，〔其中所述的DNA分子赋予〕赋予结核分枝杆菌进入哺乳动物细胞的能力。
13：根据权利要求12的分离的蛋白或多肽，其中所述的DNA分子包括相应于SEQ.ID.NO.3的核苷酸序列。
14：根据权利要求12的分离的蛋白或多肽，其中的蛋白或多肽具有相应于SEQ.ID.NO.4的氨基酸序列。
15：根据权利要求12的分离的蛋白或多肽，其中所述的蛋白或多肽具有约22至28千道尔顿的分子量。
16：根据权利要求12的分离的蛋白或多肽，其中所述的蛋白或多肽为重组型的。
17：根据权利要求12的分离的蛋白或多肽，其中所述的蛋白或多肽纯化的。
18：根据权利要求12的分离的蛋白或多肽，其中所述的蛋白或多肽具有一个或更多个赋予结核分枝杆菌进入哺乳动物细胞能力的抗原决定簇。
19：根据权利要求8的DNA分子编码的分离的蛋白质或多肽，〔其中所述的DNA分子赋予〕赋予结核分枝杆菌在巨噬细胞内存活的能力并具有相应于SEQ.ID.No.6的氨基酸序列。
20：接种哺乳动物防止结核分枝杆菌感染的方法，包括：给哺乳动物施用有效量的根据权利要求8的分离的蛋白或多肽。
21：根据权利要求20的方法，其中所述的施用为口腔、皮内、肌肉内、腹膜内、静脉内、皮下或鼻内施用。
22：一种重组DNA表达系统，包括其中插入有根据权利要求1的赋予结核分枝杆菌进入哺乳动物细胞和〔/或〕在巨噬细胞内存活的能力的异源DNA的表达载体。
23：根据权利要求22的重组DNA表达系统，其中所述的异源DNA 〔赋予结核分枝杆菌进入哺乳动物细胞的能力并〕在巨噬细胞内存活且包括相应于SEQ.ID.No.1的核苷酸序列。
24：〔根据权利要求22的〕重组DNA表达系统，它包括一种其中插入根据权利要求4的〔，其中所述的〕异源DNA的表达载体〔赋予〕，该异源DNA赋予结核分枝杆菌进入哺乳动物细胞的能力并〔包括〕包括相应于SEQ.ID.No.3的核苷酸序列。
25：〔根据权利要求22的〕重组DNA表达系统，根据权利要求7 的〔其中所述的〕异源DNA〔赋予结核分枝杆菌在巨噬细胞内存活的能力并且包括相应于SEQ.ID.No.5的核苷酸序列〕。
26：根据权利要求22的重组DNA表达系统，其中所述的异源DNA 以适当的方向和正确的阅读框插入到所述的载体。
27：参入有根据权利要求1的异源DNA的宿主细胞。
28：根据权利要求27的宿主细胞，其中所述的异源DNA〔赋予结核分枝杆菌进入哺乳动物细胞并在巨噬细胞内存活的能力且〕包括相应于SEQ.ID.No.1的核苷酸序列。
29：参入了根据权利要求5的异源DNA分子的〔27〕的宿主细胞〔，其中所述的异源DNA赋予结核分枝杆菌进入哺乳动物细胞的能力并包括相应于SEQ.ID.No.3的核苷酸序列〕。
30：参入了根据权利要求7的异源DNA分子的〔27〕的宿主细胞〔，其中所述的异源DNA赋予结核分枝杆菌在巨噬细胞内存活的能力并包括相应于SEQ.ID.No.5的核苷酸序列〕。
31：根据权利要求27的宿主细胞，其中所述的异源DNA插入到包括表达载体的重组DNA表达系统中。
32：一种防止由结核分枝杆菌所引起的哺乳动物感染和疾病的疫苗，包括：根据权利要求8的分离的蛋白或多肽；和可药用载体。
33：根据权利要求32的疫苗，其中所述的蛋白或多肽为纯化的。
34：接种哺乳动物防止结核分枝杆菌感染的方法，包括：给哺乳动物施用有效量的根据权利要求32的疫苗。
35：根据权利要求34的方法，其中所述的施用为口腔、皮内、肌肉内、腹膜内、静脉内、皮下或鼻内施用。
36：抗根据权利要求8的蛋白或多肽的分离的抗体或其结合部分。
37：根据权利要求36的分离的抗体或其结合部分，其中所述的抗体为单克隆或多克隆抗体。
38：根据权利要求36的分离的抗体或其结合部分，其中所述的抗体对由赋予结核分枝杆菌进入哺乳动物细胞并〔/或〕在巨噬细胞内存活的能力的基因片段编码的所述蛋白或多肽抗原决定簇具有特异性。
39：被动免疫感染有结核分枝杆菌的哺乳动物的方法，包括：给感染有结核分枝杆菌的哺乳动物施用有效量的根据权利要求36 的所述抗体或其结合部分。
40：根据权利要求39的方法，其中所述的施用为口腔、皮内、肌肉内、腹膜内、静脉内、皮下或鼻内施用。
41：用于被动免疫感染有结核分枝杆菌哺乳动物的组合物，包括：根据权利要求36的分离的抗体或其结合部分；和可药用载体。
42：根据权利要求41的组合物，其中所述的抗体为单克隆或多克隆抗体。
43：根据权利要求41的组合物，其中所述的抗体对由赋予结核分枝杆菌进入哺乳动物细胞和〔/或〕在巨噬细胞内存活的能力的基因片段编码的所述蛋白或多肽抗原决定簇具有特异性。
44：一种被动免疫感染有结核分枝杆菌的哺乳动物的方法，包括：给感染有结核分枝杆菌的哺乳动物施用有效量的根据权利要求41 的所述组合物。
45：根据权利要求44的方法，其中所述的施用为口腔、皮内、肌肉内、腹膜内、静脉内、皮下或鼻内施用。
46：检测组织或体液样品中结核分枝杆菌的方法，包括：提供根据权利要求8的蛋白或多肽作为抗原；样品与抗原接触；和用分析系统检测表明结核分枝杆菌在样品中存在的任何反应。
47：根据权利要求46的方法，其中的分析系统选自酶联免疫吸附分析、放免分析、凝胶扩散沉淀反应分析、免疫扩散分析，凝集分析、荧光免疫分析、蛋白A免疫分析、和免疫电泳分析。
48：检测组织或体液样品中结核分枝杆菌的方法，包括：提供根据权利要求36的抗体或其结合部分；样品与抗体或其结合部分接触；和用分析系统检测表明结核分枝杆菌在样品中存在的任何反应。
49：根据权利要求48的方法，其中的分析系统选自酶联免疫吸附分析、放免分析、凝胶扩散沉淀反应分析、免疫扩散分析、凝集分析、荧光免疫分析、蛋白A免疫分析、和免疫电泳分析。
50：检测组织或体液样品中结核分枝杆菌的方法，包括：提供根据权利要求1的DNA分子的核苷酸序列作为核酸杂交分析中的探针；样品与探针接触；和检测表明结核分枝杆菌在样品中存在的任何反应。
51：检测组织或体液样品中结核分枝杆菌的方法，包括：提供根据权利要求1的DNA分子的核苷酸序列作为基因扩增检测方法中的探针；样品与探针接触；和检测表明结核分枝杆菌在样品中存在的任何反应。
52：用于哺乳动物细胞摄入物质的产品，包括：用于哺乳动物细胞摄入的物质；和根据权利要求8的蛋白或多肽，其中所述的蛋白与所述的物质相连。
53：根据权利要求52的产品，其中所述的蛋白或多肽具有约50-55 千道尔顿的分子量。
54：根据权利要求53的产品，其中所述的蛋白或多肽具有相应于 SEQ.ID.No.2的氨基酸序列。
55：根据权利要求〔52〕68的产品，其中所述的蛋白或多肽具有 24-28千道尔顿的分子量。
56：根据权利要求55的产品，其中所述的蛋白或多肽具有相应于 SEQ.ID.No.4的氨基酸序列。
57：根据权利要求55的产品，其中所述的蛋白或多肽为纯化的。
58：根据权利要求55的产品，其中所述的物质选自抗生素、DNA 片段、抗癌剂、和其混合物。
59：一种细胞摄入方法，包括：用根据权利要求8的蛋白或多肽引导物质进入哺乳动物细胞。
60：根据权利要求59的方法，其中所述的蛋白或多肽为具有约 50-55千道尔顿的分子量。
61：根据权利要求60的方法，其中所述的蛋白或多肽具有相应于 SEQ.ID.No.2的氨基酸序列。
62：根据权利要求〔59〕69的方法，其中所述的蛋白或多肽具有 22-28千道尔顿的分子量。
63：根据权利要求62的方法，其中所述的蛋白或多肽具有相应于 SEQ.ID.No.4的氨基酸序列。
64：根据权利要求62的方法，其中所述的蛋白或多肽为纯化的。
65：根据权利要求62的方法，其中所述的物质选自抗生素、DNA 片段、抗癌剂、和其混合物。
66：根据权利要求62的方法，其中所述的哺乳动物细胞为巨噬细胞。
67：根据权利要求66的方法，其中所述的方法诱导细胞介导的免疫。
68：用于哺乳动物细胞摄入物质的产品，包括：用于哺乳动物细胞摄入的物质；和根据权利要求12的蛋白或多肽，其中所述的蛋白与所述的物质有关。
69：细胞摄入方法，包括：用根据权利要求12的蛋白或多肽引导物质进入哺乳动物细胞。

说明书

编码用于结核分枝杆菌细胞摄入的DNA分子及其应用
                      发明领域

    本发明涉及编码用于结核分枝杆菌摄入的DNA分子和其在药物、疫苗及诊断测试中的应用。

                      发明背景

    结核病是世界上主要的死亡原因，据估计每年有9百万新发病的结核病例且由该疾病引起290万人死亡。在美国，稳定下降的结核病发生率自从1985年起开始回升。该问题还由于日益增加的结核分枝杆菌的耐药性菌株的出现而复杂化。

    最近结核病的爆发包括大量HIV感染的病人集中居住的环境(如，医院的AIDS病房，改造所(correctional facilities)，和收容所)。在这些爆发中也发生结核病向健康护理人员的传播；18～50％的这样人员在其皮试中表现转化(conversion)。参见F.Laraque等.，“HIV感染病人中的结核病”，AIDS读者(9月/10月1992)、在此引入以供参考。

    结核分枝杆菌感染后有2种基本的临床表现。

    在大多数病例中，吸入的结核杆菌(通过吞噬性肺泡(alveolar)巨噬细胞而摄入)在称为结核节(tubercles)的局部病灶中或者被直接杀死或者在细胞内有一定限度地生长。偶尔在小孩和免疫妥协个体中，有早期的血源性传播，伴随有小粟疹(米粒样)病灶的形成或威胁生命的脑膜炎。更为普遍地是，在感染2～6周后，细胞介导地免疫产生，并且免疫淋巴细胞和激活的巨噬细胞向病灶的浸透导致杀死大多数杆菌和隔离该初步感染，经常在感染个体中观察不到症状。对结核菌素(tuberculin)纯化的蛋白衍生物(“PPD”)的皮试反应性和，在有些病例中，治愈的钙化病灶X-射线证据提供感染的唯一证据，然而，休眠但存活的结核杆菌病菌以一种未知程度存在着。

    第二个表现是感染恶化或爆发引起疾病发作。感染结核分枝杆菌的个体在一生中有10％的发病危险。在每一种情况下，该杆菌在肺中最初的感染位点经淋巴或血液传播到身体的其它部位。肺尖(apex of thelung)和局部淋巴结为优选的位点。胸膜(pleura)、淋巴管、骨骼、生殖-泌尿系统、脑膜、腹膜或皮肤的肺外结核约占结核病人的15％。虽然许多杆菌被杀死，但是一大部分浸润的吞噬细胞和肺实质细胞也死亡，产生特征性固态干酪样(乳酪样)坏死，在这里杆菌可以存活但不能大量繁殖。如果保护性免疫反应占上风，病灶可被遏制，尽管对肺或其它组织有一些残余的损伤。如果坏死反应延伸，发展进支气管，肺中产生孔洞，允许大量杆菌随咳嗽传播至体外。在最糟糕的情况下，固态的坏死也许是从炎症细胞释放水解酶的结果，可能会液态化，从而产生用于杆菌增殖的丰富培养基，或许达到每毫升109个。该病理性炎症过程产生特征性虚弱、发热、胸痛，咳嗽，并且，当血管遭腐蚀时出现血痰。

    对其致病力和发病机理的分子基础知道甚少。已表明关于无毒菌株分子证据的建立、推断的病原致病基因的鉴定和克隆、和证实致病性可通过这些基因传递给无毒菌株是必要的。尽管有无毒的结核分枝杆菌菌株存在，但突变的性质是未知的。在背景技术中还没有鉴定出涉及结核病发病机理的单一基因。侵入宿主细胞、细胞内存活、生长、传播、或组织趋向性也不知道。没有在分子水平鉴定现存药物的靶向，并且没有限定任何耐药机制；在近20年来没有鉴定过用于药物开发的新的分枝杆菌靶向。

    有很多用于结核病的医疗方案。由美国公众健康协会和美国胸科协会推荐的处方是异烟肼利福平和对二氮杂苯酰胺联合使用2个月接着再施用异烟肼和利福平4个月。在HIV感染的病人中，异烟肼和利福平的治疗要额外持续7个月。该治疗，称为短期化疗，对完成服药的病人产生90％以上的治愈率。用于多重耐药结核病的治疗需要在起始处方中添加ethambutol和/或链霉素，或二线药物，如卡那霉素、氨基羟丁基卡那霉素A(amikacin)曲霉素(capreomycin)、ethionamide，环丝氨酸、PAS、和氯苯吩嗪(clofazimin)。新的药物，如ciprofloxacin和ofloxacin也可使用。对于感染传统结核分枝杆菌并表现PPD阳性结果的个体，用异烟肼的化学预防在防止该病中约有90％的有效性。结核病和这些治疗在B.Bloom等“结核病：关于复发杀死剂的评述，”科学，257：1055-64(1992)；“美国结核病的控制，”美国胸科协会，146：1623-33(1992)；城市健康信息，11卷(1992)中有更为详尽的讨论，在此引用以供参考。

    虽然当前使用的对结核病的治疗具有相对较高的成功水平，提高治疗该病的成功率仍有必要。此外，就逐渐增加的抗传统治疗的结核分枝杆菌菌株水平而言，必须开发新型的治疗。在结核病高发区，无论在美国还是在国外，这种抗性菌株变得越来越多。

    发明概述

    本发明涉及赋予结核分枝杆菌进入哺乳动物细胞并且/或者在巨噬细胞中存活的能力的分离的DNA分子以及由这些分离的DNA分子编码的分离的蛋白或多肽。该分子可作为异源DNA而插入表达载体以形成用于生产该蛋白或肽的重组DNA表达系统。同样地，通常插入到表达载体以形成重组DNA表达系统的异源DNA可参入到细胞中以达到这个目的。

    本发明分离的蛋白或多肽可与可药用载体联合以形成疫苗或单独使用于给哺乳动物，尤其是人类用药，从而防止结核分枝杆菌的感染。作为选择，本发明的每个蛋白或多肽可用于产生抗体或其结合部分。该抗体或其结合部分可单独使用或与可药用载体联合使用以治疗已接触结核分枝杆菌的哺乳动物，尤其是人类，从而诱导被动免疫以防止疾病的发生。

    本发明的蛋白或多肽或者产生的抗它们的抗体或其结合部分也可用于对组织或体液样品中结核分枝杆菌的检测方法中。当该蛋白或多肽被使用时，它们作为抗原而被提供。任何与该抗原或抗体的反应用显示样品中结核分枝杆菌的存在的分析系统加以检测。作为选择，通过提供赋予结核分枝杆菌进入哺乳动物细胞和/或在巨噬细胞中存活能力的基因的核苷酸序列或其片段作为核酸杂交分析或基因扩增检测方法(如用聚合酶链式反应方法)中的探针、可在这样的样品中，检测结核分枝杆菌。检测与该探针的任何反应从而显示出样品中结核分枝杆菌的存在。

    本发明的蛋白或多肽也可用于与结核分枝杆菌治疗或检测无关的目的。更具体地说，这些蛋白或多肽赋予结核分枝杆菌进入哺乳动物细胞的能力的特性可用于允许这样的细胞摄入其它物质。这可用包括哺乳动物细胞要摄入的物质和与该物质相联的本发明蛋白或多肽的产物来实现。

    本发明DNA分子的分离构成了治疗和检测该细菌的显著进步。它也提供了用于预防结核分枝杆菌感染的疫苗和用于那些接触结核分枝杆菌的患者的被动免疫的药剂的基础。用于疫苗或产生药剂的蛋白可用重组DNA技术高水平地制备。

    在诊断应用中，本发明蛋白或多肽以及抗它们的抗体和其结合部分允许快速检测特定个体是否感染结核分枝杆菌。此外，这样的检测无须检查待测个体的抗体反应就可完成。

    除了开发治疗和诊断结核分枝杆菌的工具以外，本发明的赋予这样的有机体进入哺乳动物细胞的能力在需要将物质导入细胞，尤其是巨噬细胞的治疗中具有重要的用途。通过将本发明的蛋白或多肽与药剂联合，这样的药剂可迅速导入其所治疗的细胞中。增强的细胞对该产物的摄取可降低药物剂量，从而降低毒性和费用。例如，在传统的癌症治疗中，由于需要大剂量的用药、药物的毒性是一个主要的问题；本发明具有降低该高剂量水平而向细胞内运输等量或更高水平的药物的潜力。

    此外，结合本发明的蛋白或多肽至DNA片段可与基因治疗方案结合使用。特别地，本发明DNA分子编码产物增加巨噬细胞摄取的能力提供了特异性地运送基因至巨噬细胞的机会。这样的系统不仅可用于诱导体液免疫而且可诱导细胞-介导的免疫。

                      附图简述

    图1A、  1B、和1C为感染结核分枝杆菌菌株HeLa细胞的超薄切片电镜图谱，包括H37Ra(ATCC25177)(图1A)，和侵袭重组菌株大肠杆菌XL1-Blue(pZX7)(图1B和1C)。电子透明区环绕结核分枝杆菌有机体(图1A中箭头)。该细胞在图1A中与结核分枝杆菌菌株培养72小时且在图1B和1C中与XL1-Blue(pZX7)培养7.5小时。在图1C中可见复合有机体，表明细菌在吞噬体(phagosomes)中增殖。线段代表0.5μm。

    图2显示从原始载体pZX7构建单向缺失亚克隆(pZX7.3，pZX7.4，pZX7.5，和pZX7.6)和Bam HI-Pst I(pZX7.1)，Pst I-Hind DIII(pZX7.2)，和Bam HI-EcoRI(pZX7.7)亚克隆。黑杠代表结核分枝杆菌DNA序列，并且白杠代表pBluescript序列。亚克隆载体转入大肠杆菌XL1-Blue且然后将这些转化菌株与HeLa细胞单层培养物一起培养6小时。

    图3A、3B、和3C为与接触非病原性大肠杆菌XL1-Blue(pBluescript)24小时(图3C)相比接触侵袭性重组大肠杆菌克隆XL1-Blue(pZX7)3小时(图3A)和24小时(图B)的人类巨噬细胞的超薄切片电镜显微照片。细菌在巨噬细胞中被数层膜分隔并包围(图3B)。接触XL1-Blue(pBluescript)24小时后巨噬细胞的电镜显微照片未见细菌。线段代表1μm。

    图4显示丙酮沉淀的可溶性细菌细胞超声裂解液成分的SDS-聚丙烯酰胺凝胶电泳。在9％的凝胶中分析多肽(左侧)：分子量标准(1道)，带有在Bam HI-EcoRI pBluescript克隆位点之间含有无关的结核分枝杆菌DNA片段的载体(pZN7)的大肠杆菌XL1-Blue(2道)，和XL1-Blue(pZX7)(3道)。在8％的凝胶中分析(右侧)：含有在pZX7(1道)和XL1-Blue(pZX7)(2道)Bam HI克隆位点上游12个碱基处导入2个碱基移码的载体(pZX7.8)的XL1-Blue。分子大小在远端右侧表示。我们在XL1-Blue(pZX7)的可溶性蛋白部分中检测到一个52-KD的多肽(箭头)。一个约50KD的蛋白由含pZX7.8的XL1-Blue表达。52-KD蛋白的表达总是与Hela细胞与重组大肠杆菌克隆的相互作用相关联。

    图5显示重组大肠杆菌裂解液的SDS-PAGE分析，低分子量标记在1道，大肠杆菌BL21(DES)在2道，大肠杆菌BL21(DE3)(pET23c)在3道，未诱导的大肠杆菌BL21(DE3)(pET23c-ORF1)在4道，且诱导的大肠杆菌BL21(DE3)(pET23c-ORF1)在5道。

    图6A与B显示被结核分枝杆菌侵入相关性重组蛋白包裹的乳胶小珠与HeLa细胞相联的透视电镜研究。图6A显示重组蛋白包被小珠(箭头)。图6B显示对照大肠杆菌裂解液蛋白-包被小珠(箭头)。

                   本发明的详细描述

    本发明的一个方面涉及赋予结核分枝杆菌进入哺乳动物细胞并在巨噬细胞中存活之能力的分离的DNA分子。该DNA分子包括相应于如下所示的SEQ.ID.No.1的核苷酸序列，GGATCGAATT   GCTGGCCTTT   GGCGGGCGAT    TCGTGGAGAT    CGCCCGTAGA   AAGGTTCGCG                  60GACGCCAAGG   CCGCCGCAGA   CCGCCATAAA    CGTAGTTGAC    CAGGTGGTCT   TGACTGGGGC                 120CGGACACCGA   CGTGAACGAG   GCGACCCGAT    CCGCGTTACA    TCCACCTGAT   TCCGGCAAAT                 180GTGAACGCCG   ACATCAAGGC   GACCACGGTG    TTCGGCGGTA    AGTATGTGTC   GTTGACCACG                 240CCGAAAAACC   CGACAAAGAG   GCGGATAACG   CCAAAAGACG   TCATCGACGT   ACGGTCGGTG            300ACCACCGAGA   TCAACACGTT   GTTCCAGACG   CTCACCTCGA   TCGCCGAGAA   GGTGGATCCG            360GTCAAGCTGA   ACCTGACCCT   GAGCGCGGCC   GCGGAGGCGT   TGACCGGGCT   GGGCGATAAG            420TTCGGCGAGT   CGATCGTCAA   CGCCAACACC   GTTCTGGATG   ACCTCAATTC   GCGGATGCCG            480CAGTCGCGCC   ACGACATTCA   GCAATTGGCG   GCTCTGGGCG   ACGTCTACGC   CGACGCGGCG            540CCGGACCTGT   TCGACTTTCT   CGACAGTTCG   GTGACCACCG   CCCGCACCAT   CAATGCCCAG            600CAAGCGGAAC   TGGATTCGGC   GCTGTTGGCG   GCGGCCGGGT   TCGGCAACAC   CACAGCCGAT            660GTCTTCGACC   GCGGCGGGCC   GTATCTGCAG   CGGGGGGTCG   CCGACCTGGT   CCCCACCGCC            720ACCCTGCTCG   ACACTTATAG   CCCGGAACTG   TTCTGCACGA   TCCGCAACTT   CTACGATGCC            780GATCGACCTG   ACCGCGGGGC   TGCCGCATAG   GCCCGGAGTG   GTTCGCGATC   GGCGAGGCGC            840ACGTCAAAGT   GATTCGCGCC   CTTTTTCGCC   CACCTGCCCG   CCGCGGTGGA   TGTGTCCACC            900CGCCAGGCCG   CCGAAGCCGA   CCTGGCCGGC   AAAGCCGCTC   AATATCGTCC   CGACGAGCTG            960GCCCGCTACG   CCCAGCGGGT   CATGGACTGG   CTACACCCCG   ACGGCGACCT   CACCGACACC           1020GAACGCGCCC   GCAAACGCGG   CATCACCCTG   AGCAACCAGC   AATACGACGG   CATGTCACGG           1080CTAAGTGGCT   ACCTGACCCC   CCAAGCGCGG   GCCACCTTTG   AAGCCGTGCT   AGCCAAACTG           1140GCCGCCCCCG   GCGCGACCAA   CCCCGACGAC   CACACCCCGG   TCATCGACAC   CACCCCCGAT           1200GCGGCCGCCA   TCGACCGCGA   CACCCGCAGC   CAAGCCCAAC   GCAACCACGA   CGGGCTGCTG           1260GCCGGGCTGC   GCGCGCTGAT   CCGTCATCCT   GCCATCTCGG   CCCTCGGCGC   CGCCAACTCC           1320AGGTGCTGTG   CGGTCCACGC   CGAACGCATG   CACGCGATCT   CGAATTGGTT   GGCACCGTAT           1380TCGGGATGGA   ACTGCTCGAT   AGCGATGCCT   GCTGCCGTTG   CCGCGGCGTT   GACATCGCGG           1440ACGAACGCCT   CGTGCTCGAG   CACCCCGGCG   ACACCGTACT   GCGCCCACAG   CGTCGAAGGC           1500AGCCGCTGGC   CGTCCGCGTC   GACCAAGAGG   AATTC                                          1535上面的DNA分子编码具有约50至55千道尔顿分子量，优选52千道尔顿的多肽。从相应于SEQ.ID.No.1核苷酸序列推导的氨基酸序列代表一个高度亲水性蛋白，在其羧基末端具有一个疏水区。它可为一个分泌蛋白，细胞质蛋白，或以其羧基末端附着于有机体外膜的表面蛋白。据认为该蛋白或多肽具有相应于如下所示的SEQ.ID.No.2的推导的氨基酸序列：Gly Ser Asn Cys Trp Pro Leu Ala Gly Asp Ser Trp Arg Ser Pro Val1               5                   10                  15Glu Arg Phe Ala Asp Ala Lys Ala Ala Ala Asp Arg His Lys Arg Ser

            20                  25                  30Xaa Pro Gly Gly Leu Asp Trp Gly Arg Thr Pro Thr Xaa Thr Arg Arg

        35                   40                 45Pro Asp Pro Arg Tyr Ile His Leu Ile Pro Ala Asn Val Asn Ala Asp

    50                  55                  60Ile Lys Ala Thr Thr Val Phe Gly Gly Lys Tyr Val Ser Leu Thr Thr65                  70                  75                  80Pro Lys Asn Pro Thr Lys Arg Arg Ile Thr Pro Lys Asp Val Ile Asp

                85                  90                  95Val Arg Ser Val Thr Thr Glu Ile Asn Thr Leu Phe Gln Thr Leu Thr

            100                 105                 110Ser Ile Ala Glu Lys Val Asp Pro Val Lys Leu Asn Leu Thr Leu Ser

        115                 120                 125Ala Ala Ala Glu Ala Leu Thr Gly Leu Gly Asp Lys Phe Gly Glu Ser

    130                 135                 140Ile Val Asn Ala Asn Thr Val Leu Asp Asp Leu Asn Ser Arg Met Pro145                 150                 155                 160Gln Ser Arg His Asp Ile Gln Gln Leu Ala Ala Leu Gly Asp Val Tyr

                165                 170                 175Ala Asp Ala Ala Pro Asp Leu Phe Asp Phe Leu Asp Ser Ser Val Thr

            180                 185                 190Thr Ala Arg Thr Ile Asn Ala Gln Gln Ala Glu Leu Asp Ser Ala Leu

        195                 200                 205Leu Ala Ala Ala Gly Phe Gly Asn Thr Thr Ala Asp Val Phe Asp Arg

    210                 215                 220Gly Gly Pro Tyr Leu Gln Arg Gly Val Ala Asp Leu Val Pro Thr Ala225                 230                 235                 240Thr Leu Leu Asp Thr Tyr Ser Pro Glu Leu Phe Cys Thr Ile Arg Asn

                245                 250                 255Phe Tyr Asp Ala Asp Arg Pro Asp Arg Gly Ala Ala Ala Xaa Ala Arg

            260                 265                 270Ser Gly Ser Arg Ser Ala Arg Arg Thr Ser Lys Xaa Phe Ala Pro Phe

        275                 280                 285Phe Ala His Leu Pro Ala Ala Val Asp Val Ser Thr Arg Gln Ala Ala   290                  295                 300Glu Ala Asp Leu Ala Gly Lys Ala Ala Gln Tyr Arg Pro Asp Glu Leu305                 310                 315                 320Ala Arg Tyr Ala Gln Arg Val Met Asp Trp Leu His Pro Asp Gly Asp

                325                 330                 335Leu Thr Asp Thr Glu Arg Ala Arg Lys Arg Gly Ile Thr Leu Ser Asn

            340                345                  350Gln Gln Tyr Asp Gly Met Ser Arg Leu Ser Gly Tyr Leu Thr Pro Gln

        355                 360                 365Ala Arg Ala Thr Phe Glu Ala Val Leu Ala Lys Leu Ala Ala Pro Gly

    370                 375                 380Ala Thr Asn Pro Asp Asp His Thr Pro Val Ile Asp Thr Thr Pro Asp385                 390                 395                 400Ala Ala Ala Ile Asp Arg Asp Thr Arg Ser Gln Ala Gln Arg Asn His

                405                 410                 415Asp Gly Leu Leu Ala Gly Leu Arg Ala Leu Ile Arg His Pro Ala Ile

           420                  425                430Ser Ala Leu Gly Ala Ala Asn Ser Arg Cys Cys Ala Val His Ala Glu

        435                 440                 445Arg Met His Ala Ile Ser Asn Trp Leu Ala Pro Tyr Ser Gly Trp Asn

    450                 455                 460Cys Ser Ile Ala Met Pro Ala Ala Val Ala Ala Ala Leu Thr Ser Arg465                 470                 475                480Thr Asn Ala Ser Cys Ser Ser Thr Pro Ala Thr Pro Tyr Cys Ala His

                485                 490                 495Ser Val Glu Gly Ser Arg Trp Pro Ser Ala Ser Thr Lys Arg Asn

            500                 505                  510

    在紧接下去的序列中，Xaa表示终止密码子。该分离蛋白或多肽的生严优选用重组DNA技术完成。认为该蛋白或多肽具有一个或更多个赋予结核分枝杆菌进入哺乳动物细胞并在巨噬细胞中存活能力的抗原决定簇。

    正如上面SEQ.ID.Nos.1和2中存在终止密码子所示，这些序列构成或由几个开放阅读框编码。第1个开放阅读框由SEQ.ID.No.1中核苷酸序列的181位置延伸至807位置。该赋予进入哺乳动物细胞能力的序列具有下面的核苷酸序列(SEQ.ID.No.3)：GTGAACGCCG   ACATCAAGGC   GACCACGGTG   TTCGGCGGTA   AGTATGTGTC   GTTGACCACG             60CCGAAAAACC   CGACAAAGAG   GCGGATAACG   CCAAAAGACG   TCATCGACGT   ACGGTCGGTG            120ACCACCGAGA   TCAACACGTT   GTTCCAGACG   CTCACCTCGA   TCGCCGAGAA   GGTGGATCCG            180GTCAAGCTGA   ACCTGACCCT   GAGCGCGGCC   GCGGAGGCGT   TGACCGGGCT   GGGCGATAAG            240TTCGGCGAGT   CGATCGTCAA   CGCCAACACC   GTTCTGGATG   ACCTCAATTC   GCGGATGCCG            300CAGTCGCGCC   ACGACATTCA   GCAATTGGCG   GCTCTGGGCG   ACGTCTACGC   CGACGCGGCG            360CCGGACCTGT   TCGACTTTCT   CGACAGTTCG   GTGACCACCG   CCCGCACCAT   CAATGCCCAG            420CAAGCGGAAC   TGGATTCGGC   GCTGTTGGCG   GCGGCCGGGT   TCGGCAACAC   CACAGCCGAT            480GTCTTCGACC   GCGGCGGGCC   GTATCTGCAG   CGGGGGGTCG   CCGACCTGGT   CCCCACCGCC            540ACCCTGCTCG   ACACTTATAG   CCCGGAACTG   TTCTGCACGA   TCCGCAACTT   CTACGATGCC            600GATCGACCTG   ACCGCGGGGC   TGCCGCA                                                      627

    相应于SEQ.ID.No.3的核苷酸序列编码下面的氨基酸序列(SEQ.ID.No.4)：Val Asn Ala Asp Ile Lys Ala Thr Thr Val Phe Gly Gly Lys Tyr Val1               5                   10                  15Ser Leu Thr Thr Pro Lys Asn Pro Thr Lys Arg Arg Ile Thr Pro Lys

            20                  25                  30           Asp Val Ile Asp Val Arg Ser Val Thr Thr Glu Ile Asn Thr Leu Phe

        35                  40                  45Gln Thr Leu Thr Ser Ile Ala Glu Lys Val Asp Pro Val Lys Leu Asn

    50                  55                  60Leu Thr Leu Ser Ala Ala Ala Glu Ala Leu Thr Gly Leu Gly Asp Lys65                  70                   75                 80Phe Gly Glu Ser Ile Val Asn Ala Asn Thr Val Leu Asp Asp Leu Asn

                85                  90                  95Ser Arg Met Pro Gln Ser Arg His Asp Ile Gln Gln Leu Ala Ala Leu

            100                 105                 110Gly Asp Val Tyr Ala Asp Ala Ala Pro Asp Leu Phe Asp Phe Leu Asp

        115                 120                 125Ser Ser Val Thr Thr Ala Arg Thr Ile Asn Ala Gln Gln Ala Glu Leu

    130                 135                 140Asp Ser Ala Leu Leu Ala Ala Ala Gly Phe Gly Asn Thr Thr Ala Asp145                 150                 155                 160Val Phe Asp Arg Gly Gly Pro Tyr Leu Gln Arg Gly Val Ala AsP Leu

                165                 170                 175Val Pro Thr Ala Thr Leu Leu Asp Thr Tyr Ser Pro Glu Leu Phe Cys

           180                     185              190Thr Ile Arg Asn Phe Tyr Asp Ala Asp Arg Pro Asp Arg Gly Ala Ala

      195                   200                205Ala由该氨基酸序列编码的蛋白或多肽具有一个或更多个赋予结核分枝杆菌进入哺乳动物细胞能力的抗原决定簇。该蛋白或多肽具有22-28千道尔顿的分子量，优选为25千道尔顿。

    相应于SEQ.ID.Nos.1和2的序列含有一个额外的开放阅读框或由其所编码，它被认为赋予结核分枝杆菌在巨噬细胞内存活的能力。相应于该开放阅读框的核苷酸序列如下(SEQ.ID.No.5)：GTGGATGTGT CCACCCGCCA GGCCGCCGAA GCCGACCTGG CCGGCAAAGC CGCTCAATAT      60CGTCCCGACG AGCTGGCCCG CTACGCCCAG CGGGTCATGG ACTGGCTACA CCCCGACGGC      120GACCTCACCG ACACCGAACG CGCCCGCAAA CGCGGCATCA CCCTGAGCAA CCAGCAATAC      180GACGGCATGT CACGGCTAAG TGGCTACCTG ACCCCCCAAG CGCGGGCCAC CTTTGAAGCC      240GTGCTAGCCA AACTGGCCGC CCCCGGCGCG ACCAACCCCG ACGACCACAC CCCGGTCATC      300GACACCACCC CCGATGCGGC CGCCATCGAC CGCGACACCC GCAGCCAAGC CCAACGCAAC      360CACGACGGGC TGCTGGCCGG GCTGCGCGCG CTGATCCGTC ATCCTGCCAT CTCGGCCCTC      420GGCGCCGCCA ACTCCAGGTG CTGTGCGGTC CACGCCGAAC GCATGCACGC GATCTCGAAT      480TGGTTGGCAC CGTATTCGGG ATGGAACTGC TCGATAGCGA TGCCTGCTGC CGTTGCCGCG      540GCGTTGACAT CGCGGACGAA CGCCTCGTGC TCGAGCACCC CGGCGACACC GTACTGCGCC      600CACAGCGTCG AAGGCAGCCG CTGGCCGTCC GCGTCGACCA AGAGGAATTC                 650

    相应于SEQ.ID.No.5的核苷酸序列编码具有下面氨基酸序列的蛋白或多肽(SEQ.ID.No.6)：Val Asp Val Ser Thr Arg Gln Ala Ala Glu Ala Asp Leu Ala Gly Lys1                5                  10                  15Ala Ala Gln Tyr Arg Pro Asp Glu Leu Ala Arg Tyr Ala Gln Arg Val

            20                  25                   30Met Asp Trp Leu His Pro Asp Gly Asp Leu Thr Asp Thr Glu Arg Ala

        35                  40                  45Arg Lys Arg Gly Ile Thr Leu Ser Asn Gln Gln Tyr Asp Gly Met Ser   50                   55                  60Arg Leu Ser Gly Tyr Leu Thr Pro Gln Ala Arg Ala Thr Phe Glu Ala65                   70                 75                   80Val Leu Ala Lys Leu Ala Ala Pro Gly Ala Thr Asn Pro Asp Asp His                85                   90              95Thr Pro Val Ile Asp Thr Thr Pro Asp Ala Ala Ala Ile Asp Arg Asp

            100                 105                 110Thr Arg Ser Gln Ala Gln Arg Asn His Asp Gly Leu Leu Ala Gly Leu

        115                 120                  125Arg Ala Leu Ile Arg His Pro Ala Ile Ser Ala Leu Gly Ala Ala Asn

    130                 135                  140Ser Arg Cys Cys Ala Val His Ala Glu Arg Met His Ala Ile Ser Asn 145                150                 155                 160Trp Leu Ala Pro Tyr Ser Gly Trp Asn Cys Ser Ile Ala Met Pro Ala

               165                 170                 175Ala Val Ala Ala Ala Leu TAr Ser Arg Thr Asn Ala Ser Cys ser Ser

          180                 185                  190Thr Pro Ala Thr Pro Tyr Cys Ala His Ser Val Glu Gly Ser Arg Trp

       195                200                  205推断的赋予结核分枝杆菌在巨噬细胞内存活能力的蛋白或多肽具有预期的至少21千道尔顿的分子量。因为SEQ.ID.No.6为在末端没有终止密码子的DNA分子所编码，预期在自然状态下该蛋白或多肽具有大于SEQ.ID.No.6 216千道尔顿的分子量。参见SEQ.ID.No.5。因此，在自然状态，赋予在巨噬细胞中存活的蛋白或多肽被认为是更长。

    本发明的蛋白或多肽优选通过传统技术以纯化形式生产。例如，见下面的实施例5-6。为了分离该蛋白，繁殖带有重组质粒的大肠杆菌宿主细胞，匀浆、离心匀浆产物以去除细菌碎片。然后将上清进行随后的硫酸铵沉淀。含有本发明蛋白的部分在适当大小的萄聚糖或聚丙烯酰胺柱中进行凝胶过滤以分离该蛋白。如果必要，可进一步以HPLC纯化该蛋白馏分。

    任何一个赋予结核分枝杆菌进入哺乳动物细胞和/或在巨噬细胞中存活能力的DNA分子可用传统的重组DNA技术插入到细胞中。一般来说，该过程包括将选定的DNA分子插入到一个表达系统，该DNA分子量是异源的(即，正常情况下不存在)。该异源DNA分子以适当的方向和正确的阅读框插入到表达系统或载体中。载体含有用于插入蛋白-编码序列转录和翻译所必需的元件。

    美国专利No.4,237,224(Cohen和Boyer，在此引用仅供参考)描述了用限制酶切和DNA连接酶连接以重组质粒形式生产表达系统。这些重组质粒然后通过转化手段导入并在包括原核生物和生长培养物中的真核细胞的单细胞培养物中复制。

    重组基因也可导入病毒，如牛痘病毒。重组病毒可通过将质粒转染进入病毒感染的细胞而产生。

    合适的载体包括，但不限于，下面的病毒载体如λ载体系统gtll，gtWES.tB，Charon 4，和质粒载体如pBR322，pBR325，pACYC 177，pACYC184，pUC8，pUC9，pUC18，pUC19，pLG339，pR290，pKC37，pKC101，SV40，pBluecript II SK+/-或KS+/-(见Stratagene，La Jolla，Calif的“Stratagene克隆系统”Catalog(1993)，在此引用仅供参考)，pQE.pIH821，pGEX，pET系列(见F·W，Studier等.，“使用T7 RNA聚合酶指导克隆基因的表达，”基因表达技术185卷(1990)，在此引用仅供参考)及其任何衍生物。重组分子可通过转化，尤其是转导，接合，迁移或电穿孔而导入细胞。DNA序列用本领域标准的克隆程序克隆进入载体，如Maniatis等所述.，分子克隆：实验指南，冷泉港实验室，冷泉港，纽约(1982)，在此引用以供参考。

    可使用各种宿主-载体系统来表达蛋白-编码序列。首先，载体系统必须与所用的宿主细相容。宿主-载体系统包括但不限于如下：以噬菌体DNA，质粒DNA，或粘粒DNA转化的细菌；微生物如含有酵母载体的酵母；用病毒(如，牛痘病毒，腺病毒等)感染的哺乳动物细胞系统；用病毒感染的昆虫细胞系统(如，杆状病毒)。这些载体的表达元件强度和特异性各异。依据所用的宿主载体系统，可用许多合适转录和翻译元件中的任何一个。

    不同的遗传和信号和加工事件控制基因表达的许多水平(如，DNA转录和信使RNA(mRNA)的翻译)。

    DNA转录依赖于启动子的存在，它是引导RNA聚合酶结合的DNA序列并且因此启动mRNA合成。真核启动子DNA序列不同于原核启动子DNA序列。此外，真核启动子和伴随的遗传信号在原核系统中可能不被识别或不起作用，并且，此外，原核启动子在真核细胞中不被识别和不起作用。

    同样地，在原核细胞中mRNA的翻译依赖于不同于真核细胞信号的适当原核细胞信号的存在。在原核细胞中mRNA的有效翻译需要mRNA上称为Shine-Dalgarno(SD)的核糖体结合位点。该序列是mRNA的短的核苷酸序列，位于起始密码子，通常为AUG的前面，其编码蛋白氨基末端的甲硫氨酸。SD序列与16S rRNA(核糖体RNA)的3′-末端互补并且可能通过与rRNA形成双螺旋启动mRNA与核糖体的结合从而允许核糖体的正确定位。有关使基因表达最大化的综述，见Roberts和Lauer，酶学方法，68：473(1979)，在此引用以供参考。

    启动子的“强度”(即，它们启动转录的能力)各异。为达到表达克隆基因的目的，为了获得高水平基因转录和，因此达到的表达，使用强启动子是必要的。依据所用的宿主细胞系统，可用许多合适启动子中的任何一个。例如，当在大肠杆菌中克隆时，可使用其噬菌体，或质粒，启动子如T7噬菌体启动子，Lac启动子，trp启动子，recA启动子，核糖体RNA启动子，大肠杆菌噬菌体λ的PR和PL启动子及其它，包括但不限于，lacUV5，ompF，bla，lpp等指导相邻DNA片段的高水平转录。此外，可用通过重组DNA或其它合成DNA技术生产的杂合trp-lacUV5(tac)启动子或其它大肠杆菌启动子以提供用于插入基因的转录。

    可选择在如果没有特异诱导时抑制启动子作用的细菌宿主细胞菌株和表达载体。在某些操纵子中，添加特异的诱导物对插入DNA的有效转录是必须的。例如，lac操纵子通过添加乳糖或IPTG(异丙基硫代-β-D-半乳糖苷)而诱导。多种其它操纵子，如trp，pro，等，处于不同的控制下。

    在原核细胞中用于有效基因转录和翻译的特异起始信号也是需要的。通过分别定量基因特异性信使RNA和合成蛋白测得这些转录和翻译起始信号“强度”可以各不相同。含有启动子的DNA表达载体也可包含各种“强”转录和/或翻译起始信号的任何组合。例如，在大肠杆菌中的有效翻译需要距起始密码子(ATG)约7-9个碱基的5′的Shine-Dalgarno(SD)序列以提供核糖体结合位点。这样，可以使用任何可被宿主细胞核糖体利用的SD-ATG组合。此外，可使用通过重组DNA或其它包括插入合成核苷酸的技术制备的任何SD-ATG组合。

    一旦赋予结核分枝杆菌进入哺乳动物细胞和/或在巨噬细胞中存活能力的所需的分离DNA分子克隆进入表达系统，就容易将它插入宿主细胞。这样的插入可依据载体/宿主细胞系统，通过上述的各种形式的转化来完成。合适的宿主细胞包括但不限于细菌，病毒，酵母，哺乳动物细胞等。

    一般来说，人类免疫系统通过产生结合到细菌表面特异蛋白或碳水化合物上的抗体对病原细菌感染作出反应。抗体刺激结合到巨噬细胞，该细胞具有结合到抗体Fc区的受体。其它血清蛋白，称为补体，包被外源颗粒并通过结合到巨噬细胞特异的表面受体刺激它们的摄入。一旦该颗粒结合到巨噬细胞表面，通过部分质膜向颗粒表面连续的聚集便开始随后的摄入过程。膜上的表面受体然后与颗粒表面均匀分布的配体相互作用以将表面连接。巨噬细胞包被的颗粒然后运送至溶酶体，该颗粒在此被摄入。

    有些有机体被巨噬细胞摄入(即经历摄入)但不被杀死。结核分枝杆菌就是其中之一，结果，这样的有机体能够不确定地在巨噬细胞中存活并且，一旦逃离巨噬细胞时，导致激活的结核病。

    就本发明对赋予结核分枝杆菌进入哺乳动物细胞能力的核苷酸序列的测定而言，表明结核分枝杆菌摄入的分子基础。有了该信息和上述的重组DNA技术，可开发广泛的分别用于治疗和检测结核分枝杆菌的治疗和/或预防试剂和诊断程序。

    例如，有效量的本发明的蛋白或多肽可作为疫苗单独或与药用上可接受的载体联合施用于人类用于预防结核分枝杆菌的感染。作为选择，给接触结核分枝杆菌的个体施用有效量的抗这些蛋白或多肽的抗体或其结合部分作为被动免疫是可能的。这样的抗体或其结合部分单独施用或与药用上可接受的载体联合施用以实现对最近接触结核分枝杆菌的个体进行的短期治疗。

    适用于诱导被动免疫的抗体可为单克隆或多克隆抗体。

    单克隆抗体的制备可通过本领域众所周知的技术来完成。基本上，该过程包括首先从预先以感兴趣的抗原(即本发明蛋白或多肽)体内或体外免疫的哺乳动物(如，小鼠)脾脏中获得免疫细胞(淋巴细胞)。分泌抗体的淋巴细胞然后与能在细胞培养物无限繁殖的(小鼠)，骨髓瘤细胞或转化细胞融合，因而制备出永久的分泌免疫球蛋白的细胞系。培养得到的融合细胞或杂交瘤并且筛选得到的集落用于生产所需单克隆抗体。克隆产生这类抗体的集落，并在体内或体外培养以生产大量抗体。融合这类细胞的理论基础和实际方法学的描述在Kohler和Milstein，自然256：495(1975)中提出，在此引用仅供参考。

    哺乳动物淋巴细胞通过以本发明蛋白或多肽之一活体免疫动物(如小鼠)而被免疫。必需以几周的间隔重复这样的免疫以获得足够滴度的抗体。在适当的溶液或佐剂中带有病毒。在最后一次抗原加强后，杀死动物并取出脾脏细胞。

    与哺乳动物骨髓瘤细胞融合或其它能在细胞培养物中无限繁殖的融合方式通过标准的和众所周知的技术来完成，例如，通过用聚乙二醇(PEG)或其它融合试剂(见Milstein和Kohler，欧洲免疫学杂志。6：511(1976)，在此引用以供参考)。选择该永久的细胞系，优选的为鼠源性的，但也可源自其它哺乳动物种类的细胞，包括但不限于大鼠和人类，这些细胞系利用某些营养物的必需酶有缺陷，能够快速生长并具有良好的融合能力。许多这样的细胞系是本领域的技术人员已知的，并且其它被常规描述。

    产生多克隆抗体的方法也众所周知。通常，可通过给首先抽血以获得免疫前血清的新西兰白兔以产生这样的抗体。抗原可在6个不同的位点以每位点100μl的总量注射。每次注射的物质将包含人工表面活性剂佐剂普郎尼克多元醇(pluronic polyols)，或在SDS-聚丙烯酰胺凝胶电泳以后含有该蛋白或多肽的粉状丙烯酰胺凝胶。在第一次注射后2周在兔体中抽血并以相同的抗原以6周的间隔3次加强免疫。然后在每次加强后10天收集血清样品。然后用相应于捕获抗体的抗原通过亲和色谱从血清中回收多克隆抗体。最后，该兔以戊巴比妥150mg/kg IV麻醉。这与其它用于产生多克隆抗体的方法在E.Harlow等，编，抗体：实验手册(1988)中公开在此引用以供参考。例如，见下文实施例9。

    除了利用完整的抗体外，本发明方法包括该抗体结合部分的使用。这样的抗体片段可通过传统的方法制备，如蛋白水解片段化方法；，如在J.Goding，单克隆抗体：原理和实践，p8.98-118(纽约，学术出版社1983)中所述，在此引用仅供参考。

    本发明疫苗和被动免疫试剂可经口腔，肠外施用，例如，皮下，静脉内，肌肉内，腹膜腔内，通过鼻内灌注，或通过应用于粘膜，如，鼻，喉，和支气管的粘膜施用。它们可单独或与适当的药物载体联合施用，并且可以用固体或液体形式如，片剂，胶囊，粉末，溶液，悬液，或乳剂。

    固体单位剂量形式可为传统类型。该固体形式可为胶囊，如含有本发明蛋白或多肽或本发明抗体或其结合部分和载体，例如，润滑剂及惰性填充剂如，乳糖，蔗糖，或玉米淀粉的普通明胶类型。在另一实施方案中，这些化合物用传统的片剂基质如乳糖、蔗糖、或玉米淀粉与粘合剂如阿拉伯胶，玉米淀粉，或明胶，崩解剂如，玉米淀粉，土豆淀粉，或藻酸，和润滑剂硬脂酸或硬脂酸镁联合使用做成片剂。

    本发明的蛋白或多肽或本发明的抗体或其结合部分也可通过这些物质的溶液或悬液以生理上可接受的带有药物载体的稀释剂以可注射的剂量施用。这样的载体包括无菌液体如水和油类，其中添加或不添加表面活性剂和其它药用上可接受的佐剂。油类的例子有石油，动物，植物或人工来源的油，例如，花生油，大豆油，或矿物油。一般来说，水，盐水，水溶性葡萄糖和相关的糖溶液，以及乙二醇如丙烯乙二醇或聚乙二醇为优选的液体载体，尤其用于可注射的溶液。

    对于用作气雾剂，溶液中或悬液中本发明的蛋白或多肽或本发明的抗体或其结合部分可与适当的推进剂，例如，碳氢化合物推进剂如丙烷，丁烷，或异丁烷及传统的佐剂一起包装于一个加压的气雾剂容器中。本发明的物质也可用非加压的形式施用，如喷雾剂(nebulizer或atomizer)。

    在本发明另一个方面，本发明的蛋白或多肽可用作检测结核分枝杆菌体液诊断分析中的抗原。作为选择，该杆菌的检测可以采用抗该抗原的抗体或其结合部分的诊断分析加以完成。这种技术允许在以下组织或体液样品中对结核分枝杆菌的检测：血液，脊髓液，痰，胸积液(pleuralfluid)，尿，支气管肺泡灌洗液，淋巴结，骨髓，或其它活检材料。

    在一个实施方案中，该分析系统具有夹心或竞争性形式。合适分析的实施例包括酶联免疫吸附分析、放免分析，凝胶扩散沉淀反应分析，免疫扩散分析，凝集分析，荧光免疫分析，蛋白A免疫分析，或免疫电泳分析。

    在本发明其它诊断实施例中，本发明分离的DNA分子的核苷酸序列可用作检测各种病人体液中结核分枝杆菌的核酸杂交分析中的探针。本发明的核苷酸序列可用于本领域已知的任何核酸杂交分析系统，包括，但不限于，Southern杂交(Southern，分子生物学杂志，98：508(1975))；Northern杂交(Thomas等，美国科学院院报，77：520-05(1980))；菌落杂交(Gtunstein等.，美国科学院院报，72：3961-65(1975)，在此引用仅供参考)。作为选择，本发明分离的DNA分子可用于基因扩增检测方法中(如，聚合酶链式反应)。见H.A.Erlich等.，“聚合酶链式反应最新进展”，科学252：1643-51(1991)，在此引用仅供参考。

    更一般地说，用于结核分枝杆菌完成摄入现象的分子基础可用于导致其它物质摄入哺乳动物细胞。这通过利用导致细胞摄入的本发明蛋白或多肽(即相应于具有SEQ.ID.Nos.2和4氨基酸的那些蛋白或多肽)与用于哺乳动物细胞摄入的这类物质相联系来实现。该现象可用于导入多种物质进入这类细胞，包括抗生素，DNA片段，抗癌(anti-neoplastic)剂，及其混合物。

    用于抗生素直接进入细胞的可能性构成了实质性的进步，因为它们将能够杀死细胞内结核分枝杆菌。用于完成这种摄入的一个方法是通过以抗生素充满微球体(microspheres)并且然后为了完成这种摄入，以本发明的细胞摄入蛋白或多肽包被微球体。作为选择，代替利用微球体运送抗体，该治疗剂可化学交联于本发明的细胞摄入蛋白或多肽上。

    该技术可用于治疗由细胞内病原体导致的各种疾病。对于结核病的治疗，自身很难穿透细胞但在体外测试中具有高活性抗细胞外结核分枝杆菌的各种抗生素可与本发明的细胞摄入蛋白或多肽结合使用。在癌症治疗中，抗癌剂的细胞内运输通过将这种药物与本发明的细胞摄入蛋白或多肽连接可极大地增强。这将能够减少该药的剂量及其产生的毒性。

    本发明的另一个方面是利用本发明的细胞摄入蛋白或多肽于基因治疗或遗传疫苗中，在后者，几段治疗上或预防上有用的DNA以它们的胸腺嘧啶残基通过交联臂偶联于本发明的这些蛋白或多肽上。结果，遗传物质可导入细胞以校正遗传缺陷或产生所需特征或用作免疫原的产物。

                        实施例实施例1-HeLa细胞侵袭克隆的制备和筛选

    为了鉴定编码哺乳动物细胞进入的结核分枝杆菌DNA序列，按如下构建重组侵袭克隆：以限制酶Sau3 Al和EcoRI消化结核分枝杆菌H37Ra菌株(ATCC 25177)基因组，并将DNA片段连接到噬菌体质粒(phagemid)载体pBluescript II(Stratagene，La Jolla，(A)的Bam HI-EcoRI限制性位点。重组载体通过电穿孔导入大肠杆菌EL1-Blue(Stratagene)。我们通过与R.R.Isberg和S.Falkow在自然317，262(1987)(在此引用仅供参考)中描述方法类似的方法筛选出用于HeLa细胞侵袭克隆的重组菌株。

    通过筛选方法发现一带有在pBluescript载体的Bam HI-EcoRI限制酶位点含有1535-碱基插入子的质粒(pZX7)的大肠杆菌转化子XL1-Blue(pZX7)总是与HeLa细胞相关联。透视电镜证实该克隆进入HeLa细胞(图1)。图1A显示用结核分枝杆菌菌株H37Ra(ATCC 25177)感染的HeLa细胞，而侵袭性重组菌株大肠杆菌XL1-Blue(pZX7)显示于图1B和1C。在图1A中细胞与结核分枝杆菌菌株培养72小时，在图1B和图1C中与XL1-Blue(pZX7)培养7.5小时。该克隆被HeLa细胞的内吞化(Internalizationf)是时间依赖性的(图1B)，早在感染后3.5小时便见到细胞内的有机体。一些吞噬体含有多个有机体(图1C)，这表明该细菌在细胞内增殖。一些内吞化的杆菌被明显的ETZ包围，外表与HeLa细胞内环绕结核分枝杆菌的明亮带类似(图1A，箭头)。该带是代表常见环绕其它病原性细胞内分杆菌有机体的ETZ(见P.Draper和R.J.W.Rees，自然.228，860(1970)；N.Rastogi，微生物学研究141，217(1990)；T.Yamamoto，M.Nishimura，N.Harada，T.Imaeda，国际麻风病杂志(Int.J.Lepr).26，111(1958)，在此引用仅供参考)还是制备中的人为因素尚不清楚。

    含有载体pBluescript或另一pBluescript-衍生的重组载体(pZN7)的非病原性大肠杆菌XL1-Blue菌株在7.5小时后未表现出与HeLa细胞的关联。

    为了证实侵袭表型的确由克隆的结核分枝杆菌DNA片段编码，我们以pZX7转化了其它非病原性大肠杆菌菌株，特别是转化了HB101，DH5α和NM522。构建体HB101(pZX7)，DH5α(pZX7)，和NM522(pZX7)是HeLa细胞侵袭性的。在延长贮存的XL1-Blue(pZX7)中pZX7的自发丢失与侵袭表型丢失有关。

    pZX7的四个核酸外切酶III单向缺失亚克隆和亚克隆Ban HI-PstI(pZX7.1)，Pst-I-Hind III(pZX7.2)，和Bam HI-EcoRI(pZX7.7)用于HeLa细胞的相联。pZX7的单向缺失亚克隆用核酸外切酶III根据制造商的说明(Erase-a-Base System，Promega，Madison，WI)而产生。质粒pZX7在Bam HI-EcoRI DNA插入子EcoR I位点下游以Hind III和Kpn I限制酶双酶切以产生相邻于插入子的5′突出末端和相邻于插入子的4-碱基3′突出末端以及在互补链上的4-碱基3′突出从而保护其免受ExoIII的酶切。酶切的质粒在37℃与300U的ExoIII混合并且每30秒将2.5μl的ExoIII消化产物的等份试样转移至含有S1核酸酶的管中以去除残留的单链尾部。S1核酸酶通过中和和70℃加热10分钟而失活。加入Klenow DNA聚合酶以产生连接的平末端从而环化含有缺失的载体。然后用连接混合物通过电穿孔转化感受态的大肠杆菌XL1-Blue菌株。这些转化菌株与HeLa细胞单层一起孵育6小时。

    该程序的结果显示于图2。黑杠代表结核分枝杆菌DNA序列，并且白杠代表pBluescript序列。如图所示，带有pZX7.3，pZX7.4，或pZX7.5的大肠杆菌)XL1-Blue菌株以与大肠杆菌ZL1-Blue(pZX7)类似的方式与HeLa细胞相联，而其它的亚克隆则否。实施例2-人类巨噬细胞的感染

    用实施例1的大肠杆菌重组克隆感染的巨噬细胞单层在聚苯乙烯孔底部的盖玻片上形成。首先它们以每个巨噬细胞感染大约10个过夜生长的细菌感染1个或2个小时接着以磷酸盐缓冲液(pH7.4)洗涤并再孵育1个，6个或22个小时。培养在含有2％AB的热-灭活的含有庆大霉素(10μg/ml)的人类血清的RPMI-1640培养基(Gibco)中37℃进行。包括进庆大霉素是为了杀死细胞外细菌。再次洗涤巨噬细胞单层并且然后以无菌的蒸馏水裂解细胞。裂解液铺板于胰蛋白酶大豆琼脂培养基以获得菌落读数。用于显微镜，巨噬细胞单层以100％甲酰固定，以10％Giemsa染液染色，并且通过光学显微镜检查或处理以便进行电子显微镜检。

    仅感染1小时的单层在洗涤、固定和染色之后立即通过光学显微镜检查。巨噬细胞裂解物培养和光学显微镜结果显示于表1，见下文。感染巨噬细胞的百分比计数来自盖片单层上每100至200个巨噬细胞中感染巨噬细胞的数目。每个大肠杆菌菌株在每个时间点测试4至6次，并以大肠杆菌重组克隆和对照菌株XL1-Blue(pBluescript)及XL1-Blue(pZX7.3)感染细胞百分数的平均值通过学生T检验进行比较。

    图3显示接触侵袭性重组大肠杆菌克隆XL1-Blue(pZX7)3小时(图3A)和24小时(图3B)的人类巨噬细胞的超薄切片的电镜照片。在图32中，超薄切片的电镜照片是接触非病原性大肠杆菌XL1-Blue(pBluescript)24小时的人类巨噬细胞。24小时以后，细胞内杆菌更多，由认为是宿主来源的多层分隔，环绕(图3B)。以大肠杆菌(pBluescript)感染24小时后巨噬细胞内未见细菌(图3C)。

    表1显示获自感染以HeLa侵袭性大肠杆菌XL1-Blue(pZX7)，亚克隆XL1-Blue(pZX7.3)，和非侵袭性XL1-Blue(P.Bluescript)的人类巨噬细胞单层细胞光学显微镜检和培养研究的结果。测定每毫升细胞培养裂解液的菌落形成单位(CFU)。如表所示，感染1小时以后，重组克隆感染细胞的百分数(82±8％)是XL1-Blue(pBluescript)感染细胞百分数(15±6％，P＜0.001)的5倍多。

                           表1  裂解液接触    感染细胞的百分数      每毫升培养物CFU    时间        (平均值±SEM)             (平均值±SEM)   (小时) pBluescript  pZXF3     pZX7      pBluescript   pZX7     1       15±6     59±10** 82±8**** ND*****       ND

     3       9±4      ND        55±17     1800±500    3500±       1700

     8       4±2      ND        35±5      10±5         1600±

    400

    24       12±10    23±8*   60±13*** 3±1          1300±

    200

    *P＞0.05，与pBluescript克隆相比。0.001，与pBluescript或pZX7.3克隆相比。0.05与pZX7.3克隆相比。

    **P＜0.001，与pBluescript克隆相比。

    ***P＜0.001，与pBluescript或pZX7.3克隆相比。

    ****P＜0.001，与pBluescript克隆相比，P＜0.05，与pZX7.3克隆相比。

    *****ND平均值未测定。此观察结果表明克隆的结核分枝杆菌DNA序列以高于巨噬细胞背景吞噬细胞活性的数量增强细菌摄入。感染24小时以后，12％(±10％)的接触XL1-Blue(pBluescript)的巨噬细胞和60％(13±％)的接触XL1-Blue(pZX7)的细胞被感染(p＜0.001)。如表1中所示，感染24小时的巨噬细胞裂解液的培养显示细胞内的大肠杆菌XL1-Blue(pZX7)菌株是能够存活的。

    在表1中比较感染1小时时XL1-Blue(pZX7)，XL1-Blue(pBluescript)，和一个HeLa细胞-侵袭性缺失衍生物，大肠杆菌XL1-Blue(pZX7.3)感染巨噬细胞的能力，大肠杆菌XL1-Blue(PZX7.3)侵袭能力是XL1-Blue(pBluescript)侵袭力的4倍(P＜0.001)，但过24小时后差异不再明显。因此，与HeLa细胞侵袭有关的DNA序列负责巨噬细胞增加的摄入，并且赋予在巨噬细胞内存活的序列位于对哺乳动物细胞进行必需序列的下游。实施例3-同源性分析

    Bam HI-EcoRi DNA片段通过链终止方法测序，在F.Sanget，等，“以链终止抑制剂的DNA测序，”美国科学院院报.，74：5463-67中描述，在此引用仅供参考，并且发现具有1535个碱基对[欧洲分子生物学实验室(EMBL)许可证号X70901]。该序列与GenBank(R72.0)或EMBL(R31.0)数据库中的任何DNA序列未表现出同源性。未能发现明显的原核启动子连续序列。如果我们假定结核分枝杆菌使用通常的原核终止密码子序列，可鉴定出氨基酸序列的同源性。发现一个靠近可能的开放阅读框推断序列的NH2-末端的区域具有(i)与一种由Listeriamonocytogenes编码的与哺乳动物细胞进入有关的蛋白，内吞素(internalin)(A.B.Hartmam，M.Venkatesan E.V.Oaks，J.M.Buysse.细菌杂志，172，1905(1990)，在此引用仅供参考)的80残基NH2-末端区域有27％的相同性；(ii)Shigella侵袭质粒IpaH基因产物(B.E.Anderson，G.A.McDonald，D.C.Jones，R.L.Regnery，感染、免疫，58，2760(1990)，在此引用仅供参考)的145-残基区域具有20％的相同性；和(iii)与一种将网格蛋白连接到负责受体介导的内吞作用的有被小囊的受体上的质膜蛋白，人类β-衔接蛋白(S.Ponnambalam，M.S.Robinson，A.P.Jackson，L.Peiper，P.Parham，生物化学杂志，265，4814(1990)和J.L.Golkstein.M.S.Browm，R.G.W.Anderson，D.W.J.Schneider，细胞生物学每年综述(ammu.Rev.Cell.Biol)1，1(1985)，在此引用仅供参考)的176个残基区域具有18％的相同性。当与假结核菌(Yersinra psendotuberculosis)侵袭蛋白进行序列比较时，与细胞进入有关的区域和靠近侵袭COOH-末端(R.R.Isberg，D.L.Voorhis，S.FalkoW，细胞50，769(1987)，在此引用仅供参考)的100-残基区域有19％的相同性。这些序列比较的功能意义尚不清楚。实施例4-52kD多肽的功能分析

    通过SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE)分析的蛋白片段按如下制备：离心收获含氨苄青霉素(100μ/ml)的胰酶大豆液体培养基中5-ml细菌过夜培养物的等份试样(调至在550nm时的吸光率为光密度600)。我们然后在1.5ml含5mM MgCl2的10mM Tris-HCl缓冲液(pH8.0)中声处理细胞沉淀。在小离心机(Eppendorf model 5415C)中以12,000rpm在4℃离心声处理产物25分钟。向干净离心管中600μl的上清中加入丙酮(60％v/v)，并以14,000rpm在4℃离心混合物25分钟。以20μl蒸馏水和20μl Laemmli’s沸腾缓冲液重悬沉淀，加热至沸腾5分钟并用SDS-PAGE分析。第一次离心后含有外膜部分的细菌碎片重悬于100μl水和100μl含7.5mM MgCl2和3％(v/v)Triton X-100的15mM的tris-HCl缓冲液(pH8.0)中并以14,000rpm离心25分钟。沉淀重悬于25μl水和25μl沸腾缓冲液中并煮沸且用SDS-PAGE分析20-μl样品的等分试样。

    丙酮沉淀的细菌细胞声处理物的可溶性部分进行SDS-PAGE(即，SDS-聚丙烯酰胺凝胶电泳)。多肽在9％的凝胶中分析(左)：分子量标准(1道)，具有一个在Bam HI-EcoRI pBluescript克隆位点之间含有一个无关结核分枝杆菌DNA片段的载体(pZN)的大肠杆菌XL1-BBlue(2道)，和XL1-Blue(pZX7)(3道)。在8％的凝胶中分析(右)含有在pZX7(1道)和XL1-Blue(pZX7)(2道)Bam HI克隆位点上游12个碱基处导入2碱基移码载体(pZX7.8)的XL1-Blue。分子大小在远端右测表示。我们在XL1-Blue(pZX7)可溶性蛋白部分检测到52-KD的多肽(箭头)。一个约50KD的蛋白由含pZX7.8的XL1-Blue表达。52-KD蛋白的表达总是和HeLa细胞与重组大肠杆菌克隆的相互作用相关。

    从图4的SDS-PAGE结果，可以得出XL1-Blue(pZX7)的细菌细胞声处理物的可溶性部分含有一个52-KD的多肽，该多肽在具有含无关结核分枝杆菌DNA片段的pBluescript-衍生载体(pZN7)的XL1-Blue可溶性部分中没有检测到。在XbaI位点5′突出端以Klenow DNA聚合酶补平后通过平端连接而导入的位于pZX7中Bam HI克隆位点上游12碱基处的2碱基移码(通过测序证实)，导致HeLa细胞与含该质粒(pZX7.8)的大肠杆菌XL1-Blue相关的丧失。此克隆不表达52-KD蛋白，但在可溶性部分检测到一个新的低分子量的多肽。在长时间XL1-Blue(pZX7)保存后与HeLa细胞相关能力的自发丢失伴随着52-KD蛋白的丢失。因此，此52-KD蛋白很可能是克隆的结核分枝杆菌DNA片段的表达产物。在细菌外膜多肽部分没有可检测到的差异存在。实施例5-亚克隆编码介导结核分枝杆菌进入哺乳动物细胞的A蛋白的

        开放阅读框(ORF-1)

    相应于SEQ.ID.No.3(即，ORF-1)的核苷酸序列亚克隆进入pET载体(来自Novagen和pET23a，b，c)的EcoRI和HindlII核酸内切酶位点。这通过亚克隆PCR-扩增的ORF-1片段的产物而完成。用于扩增ORF-1的引物如下：EcoRI-引物：5′-GGGGAATTCATGTGAACGCCGACATCAA(SEQ.ID.No.7)；Hind III-引物：5′GGGAAGCTTATTGCGGCAGCCCCGGCGTC(SEQ.ID.No.8)。从结核分枝杆菌菌株H37Ra(ATCC 25177)中提取的DNA用下面的PCR条件扩增30个循环：94℃变性1分钟，引物于56℃退火2分钟，并且引物在72℃延伸1分钟。扩增的DNA通过1.8％的琼脂糖凝胶电泳分离，并且经紫外照射观察后，根据制造商的说明，用QIAEX从凝胶中分离扩增的DNA。然后在相同的消化缓冲液中以EcoRI和HinDIII消化DNA。

    pET载体也以EcoRI和HinDIII核酸内切酶消化，在1％琼脂糖中分离，并从凝胶中分离线性化的载体，并且与PCR-扩增的ORF-1 DNA片段的EcoRI/HinDIII消化产物混合用于连接反应。

    连接反应按如下完成：向含5μl消化的PCR扩增的DNA产物与3μl载体DNA消化产物的混合物中加入1μl 10×T4连接酶缓冲液(NewEngland BioLabs)和1μl T4连接酶(15U)。混合物在室温孵育4小时。将1.5μl的连接混合物电穿孔进入大肠杆菌菌株BL 21(DE3)，并且将大肠杆菌接种至含有氨苄青霉素(200μg/ml)的琼脂板用于37℃培养过夜。每种pET 23构建体(pET 23a-ORF1，pET 23 b-ORF1，pET23c-ORF1)的代表菌落按别处所述测试它们与HeLa细胞的相关性。用IPTG诱导及不诱导对菌株进行测试。实施例6-ORF-1表达蛋白的SDS-聚丙烯酰胺凝胶电泳分析

    为了表达由ORF-1编码的蛋白，pET23重组子BL21(DE3)大肠杆菌菌株首先在5ml含氨苄青霉素的胰酶大豆液体培养基(TSB)中培养过夜。第二天，沉淀500-μl样品并重悬于5ml合氨苄青霉素(200μg/ml)的TSB，培养3小时。然后，向培养物中加入50μlIPTG(40mM)并且再在37℃培养2小时。沉淀1ml细菌悬液(OD＝500，在Abs 600时)，并将沉淀重悬于50μl水和50μl Laemmli沸腾缓冲液并煮沸5分钟。15μl的沸腾样品的等份试样上样于12％的SDS-聚丙烯酰胺凝胶上，并且电泳分离。在这些实验中以同样方式处理含pET载体的BL21(DE3)作为对照。

    SDS-PAGE在约25-28 kDa的位置显示出一个由BL21(DE3)(pET23c-ORF1)表达的蛋白，其它任何pET23构建体或对照BL21(DE3)(pET23c)菌株均不表达该蛋白。甚至不同IPTG诱导，有些蛋白的表达是明显的(图5)。同样的重组菌株BL21(DE3)(pET23c-ORF1)也表现出与HeLa细胞的较强相关性。因此，显示出ORF1的表达产物是以赋予HeLa细胞的相关性。实施例7-重组ORF-1蛋白的N-末端分析

    IPTG-处理的BL21(DE3)(pET23c-ORF1)菌株按上述用于SDS-PAGE方法制备。8个泳道以相同的细菌裂解液上样，并且有一条泳道以对照大肠杆菌裂解液上样。电泳以后，分离的蛋白用电印迹仪(IDEA科学公司)转移至一张PVDF膜(Immobilon，Millipore)上。该膜以考马斯兰染色2分钟并且脱色至转移的蛋白带变得清晰可见为止。切下对照大肠杆菌电泳道中不存在的重组大肠杆菌电泳道中25-28kDa的蛋白部分并送至斯坦福大学蛋白和核苷酸实验室(Stanford University Protein andNucleotide Facility)进行N-末端的微量测序(microsequencing)。N-末端含有pET载体T7 tag氨基酸序列(位置1至15)，接着为Val，Asn，Ala，Asp，Ile，这证实了由ORF-1核苷酸序列推断的N-末端氨基酸序列。实施例8-以重组蛋白包被乳胶小珠从研究HeLa细胞与小珠的相联

    由ORF-1编码的25-28 kDa蛋白的粗制品按如下获自BL21(DE3)(pET23c-ORF1)：按上述通过IPTG诱导表达蛋白。诱导后，细菌悬液在含100mM NaCl和1mM EDTA的Tris缓冲液(pH8.0)中混合至终浓度为10％(Vol/vol)。向溶液中加入溶菌酶至终浓度1mg/ml，并将细胞在室温下培养20分钟。然后将细胞以5000g离心10分钟，并弃去上清液。沉淀转移至冰上，并且重悬于5ml含100mM NaCl，1mM EDTA和0.1％脱氧胆酸钠的冰冷50mM Tris缓冲液(pH8.0)中。加入MgCl2和DNAseI分别至终浓度为8mM和10μg/ml。冰浴直至粘性消失。以10,000g离心10分钟来取出悬液中包涵体形成的物质。通过重悬于5ml含1％NP-40，100mM NaCl，和1mM EDTA的50mM Tris缓冲液洗涤得到的沉淀，接着以不含NP-40的相同缓冲液洗涤。沉淀物质的等分试样通过SDS-PAGE检测重组蛋白的存在。

    剩余的沉淀溶解于位于25mMHEPES缓冲液(pH7.6)中的2ml 6M盐酸胍中(GuHCl)，该缓冲液含有100mM KCl，0.1mM EDTA，125mMMgCl2，10％甘油，和0.1％NP-40(HEMN缓冲液)以及蛋白酶抑制剂(1mM DTT，2μg/ml抑蛋白酶肽，1μg/ml亮抑蛋白酶肽，1μg/ml胃蛋白酶抑制剂，0.1mM PMSF，和0.1mM偏亚硫酸氢钠)。溶解的蛋白在缺少6M GuHCl的HEMGN缓冲液中于4℃透析2天。为了对照，以相同的方法处理大肠杆菌BL21(DE3)(pET23C)细胞。通过BCA方法测定蛋白的浓度。

    2μl 10％的0.3μM聚苯乙烯乳胶小珠(Sigma)水悬液样品加入到1ml PBS(pH7.5)中的100μg/ml蛋白溶液中。小珠与蛋白溶液在37℃恒速振荡孵育过夜，并作周期性简短的声处理以分散团块。然后将100μl小珠悬液加入到培养于24孔组织培养板中圆形玻璃盖片上MEM(含有10％胎牛血清)中的HeLa细胞单层上。对照包括仅与PBS孵育的小珠，在PBS中含有1％BSA，小珠用上述对照大肠杆菌菌株蛋白制品包被。在每孔2mlMEM中的HeLa细胞单层于37℃培养5小时，然后以PBS洗5次，并以100％的甲醇固定30分钟。细胞然后以10％Giemsa染色20分钟并通过光学显微镜检查。

    也制备用于透射电镜检查的HeLa细胞。经5小时培养后的Hela细胞单层以PBS中(pH7.5)2％的戊二醛固定3小时，然后刮下并重悬于相同的戊二醛缓冲液中。然后温和地沉淀细胞，并按标准方法切片制备用于透射电镜镜检的沉淀一个结果显示于图6。实施例9-产生抗重组蛋白的多克隆抗血清

    表达25-28 kDa蛋白的大肠杆菌BL21(CE3)(pET23c-ORF1)裂解液在多孔中通过12％SDS-PAGE分离，并从凝胶中切下蛋白质。含有该蛋白的丙烯酰胺凝胶碎片用杵臼研碎，并且重悬于2ml无菌PBS(pH7.5)中。通过BCA方法对蛋白浓度作粗略估计。以每位点约20μg的抗原悬液在7-8个位点皮下注射6月龄的NZW雌免。在第一次注射后的4周和6周以相同量的抗原加强免疫该兔。在最后一次加强注射2周后获得的血液中收集血清。其对重组蛋白的反应性通过Western印迹加以检测。以1∶10,000稀释的免疫抗血清能够检测到结合至硝酸纤维素膜上不到1μg的蛋白。实施例4中52千道尔顿的多肽和实施例7中23-28千道尔顿的多肽均被这些抗体所识别。实施例10-对IS 6110存在的分析

    以Sau3AI和EcoRI限制酶制备结核分枝杆菌菌株H37Ra(ATCC25177)基因组DNA的部分消化产物。因为H37Ra菌株含有多拷贝的由Grawford等的美国专利No.5,183,737所述的IS 6110，并且IS6110不具有EcoRI位点，所以消化产物将含有几个含IS 6110的DNA片段。将DNA片段连接到载体pBluescript II的BamHI-EcoRI限制性位点以制备重组文库。然后将重组载体电穿孔进入大肠杆菌XL1-Blue。然后通过本申请以外所述的方法筛选重组大肠杆菌菌株的侵袭克隆。

    经初始用HeLa细胞的筛选以后，得到15个大肠杆菌菌落。这些中仅一个稳定表现出与Hela细胞的相关性。这就是以前描述的菌株XL1-Blue(pZX7)。当测试几次时其它或表现出微弱的与HeLa细胞的相关性或没有表现出与HeLa细胞的相关性。这些其它菌株最近通过PCR-扩增的IS 6110中245-bp区域而产生的探针测试IS 6110的存在，该PCR用下面的引物INS1：5′-CGTGAGGGCATCGAGGTGGC(SEQ.ID.No.9)和INS2：5′-GCGTAGGCGTCGGTGACAAA(SEQ.ID.No.10)。

    没有一个含有IS6110序列。此外，其它克隆缺乏与HeLa细胞恒定且强烈的相关性表明包含在pZX7中的序列是其基因组文库DNA片段中唯一编码哺乳动物细胞进入的序列。

    虽然为了说明的目的详细描述了本发明，但应明白这些细节仅是用于说明的目的，并且本领域的技术人员可在不偏离由下面权利要求书限定的本发明的实质和范围的前提下对其作出变化。

                                   序列表(1)一般信息：  (i)  申请人：康奈尔研究基金公司  (ii)发明题目：编码用于结核分枝杆菌细胞摄入

                的DNA分子及其应用  (iii)序列数目：10  (iv)通迅地址：

      (A)地址：Nixon，Hargrave，Devans & Doyle LL？

      (B)街道：Clinton Square，P.O.Box 1051

      (C)城市：Rochester

      (D)州：New York

      (E)国家：U.S.A.

      (F)邮编：14603  (v)计算机可读形式：

      (A)介质类型：软盘

      (B)计算机：IBM PC兼容机

      (C)操作系统：PC-DOS/MS-DOS

      (D)软件：专利发布#1.0，#1.25版  (vi)目前申请数据：

      (A)申请号：

      (B)提交日期：

      (C)分类：  (viii)律师/代理信息

      (A)姓名：Goldman，Michael L.

      (B)登记号：30,727

      (C)参考/摘要号：19603/183(D-1485A)  (ix)电信信息：

      (A)电话：(716)263-1304

      (B)传真：(716)263-1600(2)SEQ ID NO：1的信息：  (i)序列特征：

      (A)长度：1535个碱基对

      (B)类型：核酸

      (C)链型：双链

      (D)拓扑学：未知  (ii)分子类型：DNA(基因组)  (xi)序列描述：SEQ ID NO：1：GGATCGAATT   GCTGGCCTTT   GGCGGGCGAT   TCGTGGAGAT   CGCCCGTAGA   AAGGTTCGCG            60GACGCCAAGG   CCGCCGCAGA   CCGCCATAAA   CGTAGTTGAC   CAGGTGGTCT   TGACTGGGGC            120CGGACACCGA   CGTGAACGAG   GCGACCCGAT   CCGCGTTACA   TCCACCTGAT   TCCGGCAAAT            180GTGAACGCCG   ACATCAAGGC   GACCACGGTG   TTCGGCGGTA   AGTATGTGTC   GTTGACCACG            240CCGAAAAACC   CGACAAAGAG   GCGGATAACG   CCAAAAGACG   TCATCGACGT   ACGGTCGGTG            300ACCACCGAGA   TCAACACGTT   GTTCCAGACG   CTCACCTCGA   TCGCCGAGAA   GGTGGATCCG            360GTCAAGCTGA   ACCTGACCCT   GAGCGCGGCC   GCGGAGGCGT   TGACCGGGCT   GGGCGATAAG            420TTCGGCGAGT   CGATCGTCAA   CGCCAACACC   GTTCTGGATG   ACCTCAATTC   GCGGATGCCG            480CAGTCGCGCC   ACGACATTCA   GCAATTGGCG   GCTCTGGGCG   ACGTCTACGC   CGACGCGGCG            540CCGGACCTGT   TCGACTTTCT   CGACAGTTCG   GTGACCACCG   CCCGCACCAT   CAATGCCCAG            600CAAGCGGAAC   TGGATTCGGC   GCTGTTGGCG   GCGGCCGGGT   TCGGCAACAC   CACAGCCGAT            660GTCTTCGACC   GCGGCGGGCC   GTATCTGCAG   CGGGGGGTCG   CCGACCTGGT   CCCCACCGCC            720ACCCTGCTCG   ACACTTATAG   CCCGGAACTG   TTCTGCACGA   TCCGCAACTT   CTACGATGCC            780GATCGACCTG   ACCGCGGGGC   TGCCGCATAG   GCCCGGAGTG   GTTCGCGATC   GGCGAGGCGC            840ACGTCAAAGT   GATTCGCGCC   CTTTTTCGCC   CACCTGCCCG   CCGCGGTGGA   TGTGTCCACC            900CGCCAGGCCG   CCGAAGCCGA   CCTGGCCGGC   AAAGCCGCTC   AATATCGTCC   CGACGAGCTG            960GCCCGCTACG   CCCAGCGGGT   CATGGACTGG   CTACACCCCG   ACGGCGACCT   CACCGACACC           1020GAACGCGCCC   GCAAACGCGG   CATCACCCTG   AGCAACCAGC   AATACGACGG   CATGTCACGG           1080CTAAGTGGCT   ACCTGACCCC   CCAAGCGCGG   GCCACCTTTG   AAGCCGTGCT   AGCCAAACTG           1140GCCGCCCCCG   GCGCGACCAA   CCCCGACGAC   CACACCCCGG   TCATCGACAC   CACCCCCGAT           1200GCGGCCGCCA   TCGACCGCGA   CACCCGCAGC   CAAGCCCAAC   GCAACCACGA   CGGGCTGCTG           1260GCCGGGCTGC   GCGCGCTGAT   CCGTCATCCT   GCCATCTCGG   CCCTCGGCGC   CGCCAACTCC           1320AGGTGCTGTG   CGGTCCACGC   CGAACGCATG   CACGCGATCT   CGAATTGGTT   GGCACCGTAT           1380TCGGGATGGA   ACTGCTCGAT   AGCGATGCCT   GCTGCCGTTG   CCGCGGCGTT   GACATCGCGG           1440ACGAACGCCT   CGTGCTCGAG   CACCCCGGCG   ACACCGTACT   GCGCCCACAG   CGTCGAAGGC           1500AGCCGCTGGC   CGTCCGCGTC   GACCAAGAGG   AATTC                                          1535(2)SEQ ID NO：2的信息：  (i)序列特征：

    (A)长度：511个氨基酸

    (B)类型：氨基酸

    (D)拓扑学：未知  (ii)分子类型：蛋白  (xi)序列描述：SEQ ID NO：2：Gly Ser Asn Cys Trp Pro Leu Ala Gly Asp Ser Trp Arg Ser Pro Val1                5                   10                  15Glu Arg Phe Ala Asp Ala Lys Ala Ala Ala Asp Arg His Lys Arg Ser

            20                      25               30Xaa Pro Gly Gly Leu Asp Trp Gly Arg Thr Pro Thr Xaa Thr Arg Arg

        35                  40                   45Pro Asp Pro Arg Tyr Ile His Leu Ile Pro Ala Asn Val Asn Ala Asp

    50                  55                          60Ile Lys Ala Thr Thr Val Phe Gly Gly Lys Tyr Val Ser Leu Thr Thr65                  70                  75                  80Pro Lys Asn Pro Thr Lys Arg Arg Ile Thr Pro Lys Asp Val Ile Asp

                85                  90                  95Val Arg Ser Val Thr Thr Glu Ile Asn Thr Leu Phe Gln Thr Leu Thr

           100                 105                  110Ser Ile Ala Glu Lys Val Asp Pro Val Lys Leu Asn Leu Thr Leu Ser

       115                  120                 125Ala Ala Ala Glu Ala Leu Thr Gly Leu Gly Asp Lys Phe Gly Glu Ser

    130                 135                 140Ile Val Asn Ala Asn Thr Val Leu Asp Asp Leu Asn Ser Arg Met Pro 145                150                 155                 160Gln Ser Arg His Asp Ile Gln Gln Leu Ala Ala Leu Gly Asp Val Tyr

                165                 170                 175Ala Asp Ala Ala Pro Asp Leu Phe Asp Phe Leu Asp Ser Ser Val Thr

           180                  185                 190Thr Ala Arg Thr Ile Asn Ala Gln Gln Ala Glu Leu Asp Ser Ala Leu

        195                200                  205Leu Ala Ala Ala Gly Phe Gly Asn Thr Thr Ala Asp Val Phe Asp Arg

    210                 215                 220Gly Gly Pro Tyr Leu Gln Arg Gly Val Ala Asp Leu Val Pro Thr Ala 225                230                  235                240Thr Leu Leu Asp Thr Tyr Ser Pro Glu Leu Phe Cys Thr Ile Arg Asn

                245                 250                 255Phe Tyr Asp Ala Asp Arg Pro Asp Arg Gly Ala Ala Ala Xaa Ala Arg

            260                 265                  270Ser Gly Ser Arg Ser Ala Arg Arg Thr Ser Lys Xaa Phe Ala Pro Phe

        275                 280                  285Phe Ala His Leu Pro Ala Ala Val Asp Val Ser Thr Arg Gln Ala Ala

    290                 295                 300Glu Ala Asp Leu Ala Gly Lys Ala Ala Gln Tyr Arg Pro Asp Glu Leu  305               310                 315                 320Ala Arg Tyr Ala Gln Arg Val Met Asp Trp Leu His Pro Asp Gly Asp

               325                 330                  335Leu Thr Asp Thr Glu Arg Ala Arg Lys Arg Gly Ile Thr Leu Ser Asn

            340                 345                  350Gln Gln Tyr Asp Gly Met Ser Arg Leu Ser Gly Tyr Leu Thr Pro Gln

        355                 360                 365Ala Arg Ala Thr Phe Glu Ala Val Leu Ala Lys Leu Ala Ala Pro Gly

    370                 375                 380Ala Thr Asn Pro Asp Asp His Thr Pro Val Ile Asp Thr Thr Pro Asp385                 390                 395                 400Ala Ala Ala Ile Asp Arg Asp Thr Arg Ser Gln Ala Gln Arg Asn His

                405                  410                415Asp Gly Leu Leu Ala Gly Leu Arg Ala Leu Ile Arg His Pro Ala Ile

           420                  425                 430Ser Ala Leu Gly Ala Ala Asn Ser Arg Cys Cys Ala Val His Ala Glu

        435                 440                 445Arg Met His Ala Ile Ser Asn Trp Leu Ala Pro Tyr Ser Gly Trp Asn

    450                 455                 460Cys Ser Ile Ala Met Pro Ala Ala Val Ala Ala Ala Leu Thr Ser Arg465                 470                 475                480Thr Asn Ala Ser Cys Ser Ser Thr Pro Ala Thr Pro Tyr Cys Ala His

                485                 490                 495Ser Val Glu Gly Ser Arg Trp Pro Ser Ala Ser Thr Lys Arg Asn

           500                  505                 510(2)SEQ ID NO：3的信息：  (i)序列特征：

    (A)长度：627个碱基对

    (B)类型：核酸

    (C)链型：双链

    (D)拓扑学：未知  (ii)分子类型：DNA(基因组)  (xi)序列描述：SEQ ID NO：3：GTGAACGCCG ACATCAAGGC GACCACGGTG TTCGGCGGTA AGTATGTGTC GTTGACCACG      60CCGAAAAACC CGACAAAGAG GCGGATAACG CCAAAAGACG TCATCGACGT ACGGTCGGTG      120ACCACCGAGA TCAACACGTT GTTCCAGACG CTCACCTCGA TCGCCGAGAA GGTGGATCCG      180GTCAAGCTGA ACCTGACCCT GAGCGCGGCC GCGGAGGCGT TGACCGGGCT GGGCGATAAG      240TTCGGCGAGT CGATCGTCAA CGCCAACACC GTTCTGGATG ACCTCAATTC GCGGATGCCG      300CAGTCGCGCC ACGACATTCA GCAATTGGCG GCTCTGGGCG ACGTCTACGC CGACGCGGCG      360CCGGACCTGT TCGACTTTCT CGACAGTTCG GTGACCACCG CCCGCACCAT CAATGCCCAG      420CAAGCGGAAC TGGATTCGGC GCTGTTGGCG GCGGCCGGGT TCGGCAACAC CACAGCCGAT      480GTCTTCGACC GCGGCGGGCC GTATCTGCAG CGGGGGGTCG CCGACCTGGT CCCCACCGCC     540ACCCTGCTCG ACACTTATAG CCCGGAACTG TTCTGCACGA TCCGCAACTT CTACGATGCC     600GATCGACCTG ACCGCGGGGC TGCCGCA                                         627(2)SEQ ID NO：4的信息：  (i)序列特征：

    (A)长度：209个氨基酸

    (B)类型：氨基酸

    (D)拓扑学：线性  (ii)分子类型：肽  (v)片段类型：未知  (xi)序列描述：SEQ ID NO：4：Val Asn Ala Asp Ile Lys Ala Thr Thr Val Phe Gly Gly Lys Tyr Val1               5                   10                   15Ser Leu Thr Thr Pro Lys Asn Pro Thr Lys Arg Arg Ile Thr Pro Lys

            20                  25                   30Asp Val Ile Asp Val Arg Ser Val Thr Thr Glu Ile Asn Thr Leu Phe

        35                   40                  45Gln Thr Leu Thr Ser Ile Ala Glu Lys Val Asp Pro Val Lys Leu Asn

    50                  55                  60Leu Thr Leu Ser Ala Ala Ala Glu Ala Leu Thr Gly Leu Gly Asp Lys65                  70                  75                  80Phe Gly Glu Ser Ile Val Asn Ala Asn Thr Val Leu Asp Asp Leu Asn

                85                  90                   95Ser Arg Met Pro Gln Ser Arg His Asp Ile Gln Gln Leu Ala Ala Leu

           100                  105                 110Gly Asp Val Tyr Ala Asp Ala Ala Pro Asp Leu Phe Asp Phe Leu Asp

        115                 120                 125Ser Ser Val Thr Thr Ala Arg Thr Ile Asn Ala Gln Gln Ala Glu Leu   130                  125                  140Asp Ser Ala Leu Leu Ala Ala Ala Gly Phe Gly Asn Thr Thr Ala Asp145                 150                 155                 160Val Phe Asp Arg Gly Gly Pro Tyr Leu Gln Arg Gly Val Ala Asp Leu

                165                 170                 175Val Pro Thr Ala Thr Leu Leu Asp Thr Tyr Ser Pro Glu Leu Phe Cys

           180                  185                 190Thr Ile Arg Asn Phe Tyr Asp Ala Asp Arg Pro Asp Arg Gly Ala Ala

        195                 200                 205Ala(2)SEQ ID NO：5的信息：  (i)序列特征：

    (A)长度：650个碱基对

    (B)类型：核酸

    (C)链型：双链

    (D)拓扑学：未知  (ii)分子类型：DNA(基因组)  (xi)序列描述：  SEQ ID NO：5：GTGGATGTGT   CCACCCGCCA   GGCCGCCGAA   GCCGACCTGG   CCGGCAAAGc   CGCTCAATAT            60CGTCCCGACG   AGCTGGCCCG   CTACGCCCAG   CGGGTCATGG   ACTGGCTACA   CCCCGACGGC            120GACCTCACCG   ACACCGAACG   CGCCCGCAAA   CGCGGCATCA   CCCTGAGCAA   CCAGCAATAC            180GACGGCATGT   CACGGCTAAG   TGGCTACCTG   ACCCCCCAAG   CGCGGGCCAC   CTTTGAAGCC            240GTGCTAGCCA   AACTGGCCGC   CCCCGGCGCG   ACCAACCCCG   ACGACCACAC   CCCGGTCATC            300GACACCACCC   CCGATGCGGC   CGCCATCGAC   CGCGACACCC   GCAGCCAAGC   CCAACGCAAc            360CACGACGGGC   TGCTGGCCGG   GCTGCGCGCG   CTGATCCGTC   ATCCTGCCAT   CTCGGCCCTC            420GGCGCCGCCA   ACTCCAGGTG   CTGTGCGGTC   CACGCCGAAC   GCATGCACGC   GATCTCGAAT            480TGGTTGGCAC   CGTATTCGGG   ATGGAACTGC   TCGATAGCGA   TGCCTGCTGC   CGTTGCCGCG            540GCGTTGACAT   CGCGGACGAA   CGCCTCGTGC   TCGAGCACCC   CGGCGACACC   GTACTGCGCC            600CACAGCGTCG   AAGGCAGCCG   CTGGCCGTCC   GCGTCGACCA   AGAGGAATTC                         650(2)SEQ ID NO：6的信息：  (i)序列特征：

    (A)长度：216个氨基酸

    (B)类型：氨基酸

    (D)拓扑学：未知  (ii)分子类型：肽  (xi)序列描述：SEQ ID NO：6：Val Asp Val Ser Thr Arg Gln Ala Gln Ala Glu Ala Asp Leu Ala Gly Lys1               5                       10                  15Ala Ala Gln Tyr Arg Pro Asp Glu Leu Ala Arg Tyr Ala Gln Arg Val

            20                  25                  30Met Asp Trp Leu His Pro Asp Gly Asp Leu Thr Asp Thr Glu Arg Ala

        35                   40                 45         Arg Lys Arg Gly Ile Thr Leu Ser Asn Gln Gln Tyr Asp Gly Met Ser

    50                  55                   60Arg Leu Ser Gly Tyr Leu Thr Pro Gln Ala Arg Ala Thr Phe Glu Ala65                   70                 75                   80Val Leu Ala Lys Leu Ala Ala Pro Gly Ala Thr Asn Pro Asp Asp His

                85                  90                  95Thr Pro Val Ile Asp Thr Thr Pro Asp Ala Ala Ala Ile Asp Arg Asp

           100                  105                  110Thr Arg Ser Gln Ala Gln Arg Asn His Asp Gly Leu Leu Ala Gly Leu

       115                  120                  125Arg Ala Leu Ile Arg His Pro Ala Ile Ser Ala Leu Gly Ala Ala Asn

    130                135                  140Ser Arg Cys Cys Ala Val His Ala Glu Arg Met His Ala Ile Ser Asn145                 150                 155                 160Trp Leu Ala Pro Tyr Ser Gly Trp Asn Cys Ser Ile Ala Met Pro Ala

                165                 170                 175Ala Val Ala Ala Ala Leu Thr Ser Arg Thr Asn Ala Ser Cys Ser Ser

            180                 185                 190Thr Pro Ala Thr Pro Tyr Cys Ala His Ser Val Glu Gly Ser Arg Trp

        195                 200                 205Pro Ser Ala Ser Thr Lys Arg Asn

    210                 215(2)SEQ ID NO：7的信息：  (i)序列特征：

    (A)长度：28个碱基对

    (B)类型：核酸

    (C)链型：单链

    (D)拓扑学：线性  (ii)分子类型：cDNA  (xi)序列描述：SEQ ID NO：7：GGGGAATTCA TGTGAACGCC GACATCAA                                   28(2)SEQ ID NO：8的信息：  (i)序列特征：

    (A)长度：29个碱基对

    (B)类型：核酸

    (C)链型：单链

    (D)拓扑学：线性  (ii)分子类型：cDNA  (xi)序列描述：SEQ ID NO：8：GGGAAGCTTA TTGCGGCAGC CCCGGCGTC                               29(2)SEQ ID NO：9的信息：  (i)序列特征：

    (A)长度：20个碱基对

    (B)类型：核酸

    (C)链型：单链

    (D)拓扑学：线性  (ii)分子类型：cDNA  (xi)序列描述：SEQ ID NO：9：CGTGAGGGCA TCGAGGTGGC                                              20(2)SEQ ID NO：10的信息：  (i)序列特征：

    (A)长度：20个碱基对

    (B)类型：核酸

    (C)链型：单链

    (D)拓扑学：线性  (ii)分子类型：  cDNA  (xi)序列描述：SEQ ID NO：10：  GCGTAGGCGT CGGTGACAAA                                            20