新的表达载体及其应用.pdf

摘要
申请专利号：	CN02813304.8	申请日：	2002.05.03
公开号：	CN1529758A	公开日：	2004.09.15
当前法律状态：	授权	有效性：	有权
法律详情：	授权\|\|\|实质审查的生效\|\|\|公开
IPC分类号：	C12N15/86; C12N15/63; C12N15/85; A61K48/00; A61P31/00	主分类号：	C12N15/86; C12N15/63; C12N15/85; A61K48/00; A61P31/00
申请人：	非特生物技术有限责任公司;
发明人：	K·克龙; V·布拉热维奇; M·塔蒂南; M·阿斯特弗; U·托茨; A·麦尼克; A·兰基; E·阿斯特弗
地址：	芬兰坦佩雷
优先权：	2001.05.03 FI 20010922; 2002.05.03 US 10/138,098
专利代理机构：	北京纪凯知识产权代理有限公司	代理人：	戈泊;程伟
PDF下载：	PDF下载

内容摘要

本发明涉及新的载体，含所述载体的DNA疫苗和基因疗法，制备载体和含所述载体的DNA疫苗和基因疗法的方法，以及所述载体的治疗应用。更特别地，本发明涉及新的载体，包括(a)核－锚定蛋白的表达基因盒，它含有(i)能够与特定DNA序列结合的DNA结合结构域和(ii)能够与核成分结合的结构域，和(b)形成锚定蛋白结合位点的多聚体化DNA序列，和可选择地(c)目的DNA序列的一个或多个表达盒。特别地，发明涉及缺少乳头状瘤病毒复制起始点的载体。核－锚定蛋白可以是1型牛乳头状瘤病毒的E2蛋白或EB病毒核抗原1。本发明还涉及缺少在哺乳动物细胞中起作用的复制起始点的载体。本发明进一步涉及在受试者中表达目的DNA序列的方法。

权利要求书

1：一个表达载体包括： (a)可操作地与异种启动子连接的编码核-锚定蛋白的DNA序列，所述核-锚定蛋白含有(i)与特定DNA序列结合的DNA结合结构域，和 (ii)与核成分结合的功能性结构域或其功能相等区；和 (b)形成核-锚定蛋白结合位点的多聚体化DNA序列，其中所述的载体缺少乳头状瘤病毒的复制起始点。
2：根据权利要求1所述的载体，其中所述的载体缺少在哺乳动物细胞中起作用的复制起始点。
3：根据权利要求1或2所述的载体，其中所述的核成分是有丝分裂的染色质、核基质、核结构域10(ND10)或核结构域POD。
4：根据权利要求1或2所述的载体，其中所述的核锚定-蛋白是染色质-锚定蛋白，所述的功能性结构域结合有丝分裂的染色质。
5：根据权利要求1或2所述的载体，其中所述的核锚定-蛋白含有铰链或连接子区。
6：根据权利要求1或2所述的载体，其中所述的核锚定-蛋白是真核生物、原核生物或病毒来源的天然蛋白。
7：根据权利要求6所述的载体，其中所述的天然蛋白是病毒来源的。
8：根据权利要求6所述的载体，其中所述的核-锚定蛋白是真核生物来源的天然蛋白。
9：根据权利要求1或2所述的载体，其中所述的核-锚定蛋白是乳头状瘤病毒或EB病毒的蛋白。
10：根据权利要求9所述的载体，其中所述的核-锚定蛋白是1型牛乳头状瘤病毒的E2蛋白或EB病毒核抗原1。
11：根据权利要求10所述的载体，其中所述的核-锚定蛋白是1型牛乳头状瘤病毒的E2蛋白。
12：根据权利要求1或2所述的载体，其中所述的核-锚定蛋白是高迁移率组蛋白。
13：根据权利要求1或2所述的载体，其中所述的核-锚定蛋白是非天然的蛋白。
14：根据权利要求13所述的载体，其中所述的核-锚定蛋白是重组体蛋白、融合蛋白或通过分子建模技术获得的蛋白。
15：根据权利要求14所述的载体，其中所述的重组体蛋白、融合蛋白或通过分子建模技术获得的蛋白含有任何组合的DNA结合结构域和功能性结构域，前者与所述的特定DNA序列结合，后者与核成分结合，其中所述的与核成分结合的功能性结构域是乳头状瘤病毒的、EB 病毒的或高迁移率组蛋白的结构域。
16：根据权利要求15所述的载体，其中所述的重组体蛋白、融合蛋白或通过分子建模技术获得的蛋白含有任何组合的DNA结合结构域和功能性结构域，前者与所述的特定DNA序列结合，后者与核成分结合，其中所述的与核成分结合的功能性结构域是1型乳头状瘤病毒的 E2蛋白的、EB病毒核抗原1的或高迁移率组蛋白的结构域。
17：根据权利要求1或2所述的载体，其中所述的载体进一步包括目的DNA序列的一个或多个表达基因盒。
18：根据权利要求17所述的载体，其中所述的目的DNA序列是感染性病原体的序列。
19：根据权利要求18所述的载体，其中所述的感染性病原体是病毒。
20：根据权利要求19所述的载体，其中所述的病毒选自人免疫缺陷病毒(HIV)、单纯疱疹病毒(HSV)、丙型肝炎病毒、流感病毒和肠道病毒。
21：根据权利要求18所述的载体，其中所述的目的DNA序列是细菌的。
22：根据权利要求21所述的载体，其中所述的细菌选自沙眼衣原体、结核分支杆菌和肺炎支原体。
23：根据权利要求21所述的载体，其中所述的细菌是沙门氏菌。
24：根据权利要求17所述的载体，其中所述的目的DNA序列是真菌性病原体的。
25：根据权利要求24所述的载体，其中所述的真菌性病原体是白色念珠菌。
26：根据权利要求20所述的载体，其中所述的目的DNA序列是 HIV来源的。
27：根据权利要求26所述的载体，其中所述的目的DNA序列编码 HIV非结构调控蛋白。
28：根据权利要求27所述的载体，其中所述的HIV的非结构调控蛋白是Nef、Tat或Rev。
29：根据权利要求28所述的载体，其中所述的HIV的非结构调控蛋白是Nef。
30：根据权利要求17所述的载体，其中所述的目的DNA序列编码 HIV的结构蛋白。
31：根据权利要求30所述的载体，其中所述的目的DNA序列是编码HIV gp120/gp160的基因。
32：根据权利要求17所述的载体，其中第一个所述的表达基因盒含有编码Nef、Tat或Rev的目的DNA序列，其中第二个所述的表达基因盒含有编码Nef、Tat或Rev的目的DNA序列。
33：根据权利要求17所述的载体，其中第一个所述的表达基因盒含有编码Nef、Tat或Rev的目的DNA序列，其中第二个所述的表达基因盒由编码HIV结构蛋白的目的DNA序列组成。
34：根据权利要求17所述的载体，其中的目的DNA序列编码与癌症相关的蛋白。
35：根据权利要求17所述的载体，其中的目的DNA序列编码与免疫成熟、免疫反应调节或自体免疫反应调节相关的蛋白。
36：根据权利要求35所述的载体，其中所述的蛋白是APECED。
37：根据权利要求17所述的载体，其中的目的DNA序列是Aire基因。
38：根据权利要求17所述的载体，其中的目的DNA序列编码在任何遗传性单基因病中缺陷的蛋白。
39：根据权利要求17所述的载体，其中的目的DNA序列编码大分子药物。
40：根据权利要求39所述的载体，其中的目的DNA序列编码细胞因子。
41：根据权利要求40所述的载体，其中所述的细胞因子是选自IL1、 IL2、IL4、IL6和IL12的白介素。
42：根据权利要求40所述的载体，其中的目的DNA序列编码干扰素。
43：根据权利要求17所述的载体，其中所述的目的DNA序列编码有生物学活性的RNA分子。
44：根据权利要求43所述的载体，其中所述的有生物学活性的 RNA分子选自抑制性反义和核酶分子。
45：根据权利要求44所述的载体，其中所述的抑制性反义RNA或核糖酶分子对抗致癌基因的作用。
46：权利要求17所述的载体被用作药剂。
47：权利要求17所述的载体被用作携带载体以携带一个或多个目的基因或一条或多条目的DNA序列，如编码感染原蛋白或肽、治疗剂、大分子药物或其任何组合的一个基因、多个基因，或一条或多条DNA 序列。
48：权利要求17所述的载体被用作药剂以治疗遗传的或获得的基因缺陷。
49：权利要求17所述的载体被用作抗感染原的治疗性DNA疫苗。
50：权利要求17所述的载体被用作治疗剂。
51：权利要求17所述的载体被用作在细胞或生物体中生产由所述目的DNA序列编码的蛋白。
52：权利要求17所述的载体被用作在体内生产治疗性大分子药物。
53：给受试者提供蛋白的方法，所述的方法包括给予受试者权利要求1或2所述的载体，其中所述的载体(i)进一步包括编码要提供给受试者的蛋白的第二条DNA序列，其第二条DNA序列可操作地与第二个启动子相连，和(ii)不编码牛乳头状瘤病毒蛋白E1，其中所述的受试者不表达牛乳头状瘤病毒蛋白E1。
54：在受试者中诱导对蛋白的免疫反应的方法，所述的方法包括给予受试者权利要求1或2所述的载体，其中所述的载体(i)进一步包括编码所述蛋白的第二个DNA序列，其第二个DNA序列可操作地与第二个启动子相连，和(ii)不编码牛乳头状瘤病毒蛋白E1，且其中所述的受试者不表达牛乳头状瘤病毒蛋白E1。
55：在需要所述治疗的受试者中治疗感染性疾病的方法，所述的方法包括给予所述受试者治疗有效量的权利要求17所述的载体，其中所述的目的DNA序列编码含有感染原的免疫原性抗原决定簇的蛋白。
56：在需要所述治疗的受试者中治疗遗传的或获得的基因缺陷的方法，所述的方法包括：给予所述受试者治疗有效量的权利要求17所述的载体，其中所述的目的DNA序列编码被所述遗传的或获得的基因缺陷影响的蛋白。
57：在受试者中表达DNA序列的方法，所述的方法包括给予所述受试者权利要求17所述的载体。
58：根据权利要求55、56或57中的方法，其中所述的载体不编码牛乳头状瘤病毒蛋白E1，其中所述的受试者不表达牛乳头状瘤病毒蛋白E1。
59：一种权利要求1或2中载体的制备方法，包括： (a)培养含所述载体的宿主细胞；和 (b)回收载体。
60：根据权利要求59中的方法，进一步包括在步骤(a)之前用所述载体转化所述宿主细胞的步骤。
61：根据权利要求59中的方法，其中所述的宿主细胞是原核细胞。
62：根据权利要求59中的方法，其中所述的宿主细胞是大肠杆菌。
63：一种宿主细胞，其特征在于含权利要求1或2所述的载体。
64：一种宿主细胞，其特征在于含权利要求17所述的载体。
65：根据权利要求63中的宿主细胞，其中所述的宿主细胞是细菌细胞。
66：根据权利要求63中的宿主细胞，其中所述的宿主细胞是哺乳动物细胞。
67：含权利要求1或2中载体的携带载体。
68：含权利要求17中载体的药学组合物和适合的药物赋形剂。
69：含权利要求17中载体的DNA疫苗。
70：含权利要求18中载体的DNA疫苗。
71：含权利要求19中载体的DNA疫苗。
72：含权利要求21中载体的DNA疫苗。
73：含权利要求24中载体的DNA疫苗。
74：含权利要求17中载体的基因治疗剂。
75：制备权利要求69中DNA疫苗的方法，所述的方法包括将权利要求17所述的载体与适合的药物赋形剂结合。
76：制备权利要求69中DNA疫苗的方法，所述的方法包括将权利要求18所述的载体与适合的药物赋形剂结合。
77：制备权利要求69中DNA疫苗的方法，所述的方法包括将权利要求19所述的载体与适合的药物赋形剂结合。
78：制备权利要求69中DNA疫苗的方法，所述的方法包括将权利要求21所述的载体与适合的药物赋形剂结合。
79：制备权利要求69中DNA疫苗的方法，所述的方法包括将权利要求24所述的载体与适合的药物赋形剂结合。
80：制备权利要求74中药剂的方法，所述的方法包括将权利要求 17所述的载体与适合的药物赋形剂结合。

说明书

新的表达载体及其应用
    1.发明的领域

    本发明涉及新的载体，含所述载体的DNA疫苗和基因疗法，制备载体和含所述载体的DNA疫苗和基因疗法的方法，以及所述载体的治疗应用。更特别地，本发明涉及新的载体，包括(a)核-锚定蛋白的表达基因盒，它含有(i)能够与特定DNA序列结合的DNA结合结构域和(ii)能够与核成分结合的结构域，和(b)形成核-锚定蛋白地锚定蛋白结合位点的多聚体化DNA序列，和可选择地(c)目的DNA序列的一个或多个表达盒。特别地，发明涉及缺少乳头状瘤病毒复制起始点的载体。发明还涉及缺少在哺乳动物细胞中起作用的复制起始点的载体。发明进一步涉及在受试者中表达目的DNA序列的方法。

    2.发明的背景

    用适合的载体将同源或异源的基因转移到动物或人体中正在成为具有巨大潜力的技术，以治疗具有遗传背景的疾病，或预防或治疗感染性疾病。已经开发了数种病毒和非病毒载体并在动物和人受试者中试验传递一个基因/多个基因，被传递的基因通过突变而有缺陷因而是无功能的。这种载体的实例包括腺病毒载体、疱疹病毒载体、逆转录酶病毒载体、慢病毒载体和腺相关的载体。

    已经证明接种疫苗是预防感染原所致疾病的高度有效和经济的方法。自从引种牛痘病毒作为抗天花病毒(天花)的减毒疫苗后，已经开发了抗许多人类病原体的疫苗并被常规使用。今天天花已通过接种疫苗被根除，预期不久脊髓灰质炎病毒也有相同的结果。数种儿童疾病如百日咳、白喉和破伤风可以通过接种疫苗被有效地预防。

    一般地，最成功的病毒疫苗是致病病毒的活的无毒突变种。此方法成功的关键是活病毒靶向相同的器官、相同类型和相似数量的细胞，因此通过在接受者中的繁殖引起长时间的免疫反应而不致病或仅导致轻微的疾病。实际上，活的减毒疫苗产生亚临床感染，这是自然特有的免疫方式。结果，可以诱导完全的免疫反应包括体液的、细胞的和先天的反应，得到了长时间的、有时是终身的抗病原体免疫防护。

    尽管活的减毒疫苗是最有效的，但它们可能引起有害的副作用。这样，减毒的病毒疫苗可能回复成有毒株，或在减毒病毒对成人不致病的情况下，仍可能在婴儿或伤残人中致病。就引起慢性感染的病毒如人免疫缺陷病毒1和2型来说确实如此。由病毒和细菌蛋白或免疫原肽组成的疫苗很少可能引起有害的副作用，但可能不如活疫苗有效力。特别是在抗致慢性感染的微生物疫苗的情况下，如某些病毒和细胞内细菌。

    但是，免疫反应的强度和类型还依赖于病毒蛋白如何被处理和它们如何通过抗原递呈细胞(APCs)如巨噬细胞和树突状细胞被递呈给免疫系统。蛋白和肽抗原通过APCs的内吞作用被摄取，经过核内体通路被处理成小的免疫原肽并由MHC(主要组织相容性复合体)II型抗原[在人类为HLA(人白细胞抗原)II型]递呈给T-淋巴细胞(T-细胞)。相反，在APCs或可能的靶细胞中为进行免疫反应而重新合成的蛋白将经胞浆通路被处理并由MHC I型抗原(在人类为HLA I型)递呈给T细胞。一般地，经II型通路的免疫原肽递呈会引起辅助/诱导T细胞活化，将依次引起B细胞活化并产生抗体反应。相反，经I型MHC的递呈促进能够识别和破坏被病毒感染的细胞的细胞毒T淋巴细胞(CTLs)的诱导。

    在1990年代早期，提出了模拟通常由活的减毒疫苗完成的抗原处理和递呈的方法[Ulmer，J.B.等人Science 259(1993)1745-1749]。据其显示，将真核生物表达载体以环形DNA的形式注射进肌肉，引起肌肉细胞(或许是其它细胞)摄取此DNA，能够诱导目的基因的表达并产生免疫反应，特别是针对由插入基因编码的蛋白的CTLs形式细胞免疫反应。从观察到此现象后，DNA免疫法已成为在实验动物中诱导对异源蛋白的免疫反应的标准方法，采用数种DNA疫苗的人类研究正在进行中。

    通常，在这些疫苗研究中使用的DNA载体含有：目的基因克隆位点；强病毒启动子如CMV病毒的极早期启动子以驱动目的基因的表达；聚腺苷酰作用区；和抗生素抗性基因；和DNA载体(质粒)在细菌细胞中传播的细菌复制起始点。

    用上面描述的载体，有可能在实验动物或人给予载体后获得可检测水平的目的基因表达，给予载体可采用颗粒轰击技术直接注射到肌肉或皮肤，或者通过在溶液中应用载体而直接用在黏膜上。但是，由这些载体获得的表达是暂时的：载体倾向于从转染的细胞中渐渐消失并不传递给分裂细胞群中的子细胞。目的基因的暂时表达和靶向细胞的有限数量大概是用上面描述的DNA载体免疫的受试者中仅观察到暂时的免疫反应的主要原因。因而，例如Boyer等人观察到，在用近似于上面描述的载体数次免疫的人类受试者中，仅有对HIV-1 Env和Rev蛋白的暂时免疫反应[Boyer，J.D.，J Infect Dis 181(2000)476-483]。

    开发用于基因治疗和DNA接种疫苗的新产品的兴趣不断增长。例如携带目的基因表达盒的乳头状瘤病毒载体已被建议用做候选者。

    到目前为止，已经鉴定了超过70个亚型的人乳头状瘤病毒(HPVs)和许多不同的动物乳头状瘤病毒[zur Hausen，H.和de Villiers E.，AnnuRev Microbiol 48(1994)427-447；Bernard，H.，等人，Curr Top MicrobiolImmunol 186(1994)33-54]。所有的乳头状瘤病毒具有相似的基因组构成，且所有翻译开放阅读框(ORFs)的位置是高度保守的。

    乳头状瘤病毒在不同的身体部位感染皮肤或黏膜的鳞状上皮细胞并导致形成良性肿瘤，在某些情况下可发展成恶性肿瘤。乳头状瘤病毒基因组作为多拷贝核质粒在感染的细胞中复制并保存。复制、游离基因保存、后期基因表达和病毒组装与上皮组织的分化密切相关：在分化的上皮细胞中，乳头状瘤病毒DNA游离基因复制发生于最初的扩增性复制、其次即复制休眠，和第三个过程，即无性复制中[Howley，P.M.；乳头状瘤病毒体：病毒及其复制。病毒学，Fields，B.C.，Knipe，D.M.，Howley，P.M.，主编，Lippincott-Raven Publishers，Philadelphia，USA，1996，第二版，2045-2076页]。

    两个由E1和E2开放阅读框编码的病毒因子已经显示对启动细胞中乳头状瘤病毒来源的DNA复制是必要的和充分的[Ustav，M.和Stenlund，A.，EMBO J 10(1991)449-57；Ustav，M.，等人，EMBO J 10(1991)4321-4329；Ustav，E.，等人，Proc Natl Acad Sci USA 90(1993)898-902]。

    启动DNA复制的结构域已被定义为BPV1[Ustav，M.，等人，EMBO J10(1991)4321-4329]、HPV1a[Gopalakrishnan，V.和Khan，S.，见前]、HPV11[Russell，J.，Botchan，M.，J Virol 69(1995)651-660]、HPV18[Sverdrup，F.和Khan，S.，J Virol 69(1995)1319-1323；Sverdrup，F.和Khan，S.，J Virol 68(1994)505-509]和许多其它者。特征性地，所有这些起始片段具有高A/T含量，并含有数个重叠的独立E1蛋白识别序列，它们一起构成E1结合位点[Ustav，M.，等人，EMBOJ 10(1991)4321-4329；Holt，S.，等人，J Virol 68(1994)1094-1102；Holt，S.和Wilson，V.，JVirol 69(1995)6525-3652；Sedman.T.，等人.J Virol 71(1997)2887-2996]。此外，这些功能性起始片段含有E2结合位点，大多数情况下它对于启动体内的DNA复制是必要的(Ustav，E.，等人，见前)。E2蛋白可促进E1识别起始点的第一个步骤。在单体E1与起始点开始结合后，E1的多聚化作用即被启动。它导致具有ori融合活性的复合物形成。E2已被认为对DNA复制启动后的步骤没有影响[Lusky，M.，等人，ProcNatl Acad Sci USA 91(1994)8895-8899]。

    BPV1 E2 ORF编码三个蛋白，源于选择性启动子使用和可选择的mRNA剪接[Lambert，P.，等人，Annu Rev Genet 22(1988)235-258]。所有这些蛋白可彼此形成同型-和杂二聚体并与12bp不对称的回文序列5′-ACCNNNNNNGGT-3′特异地结合[Androphy，E.，等人，Nature 325(1987)70-739]。

    在BPV1基因组中有17个E2结合位点，在HPV基因组中为4个位点，它们在启动病毒DNA复制(Ustav，E.，等人，见前)和调节病毒基因表达(Howley，P.M.，乳头状瘤病毒体：病毒及其复制，病毒学，Fields，B.C.，Knipe，D.M.，Howley，P.M.，主编，Philadelphia：Lippincott-Raven Publishers，1996.第二版，2045-2076页)中起决定性作用。结构和突变分析显示了在E2蛋白总长中有3个截然不同的结构域。N-末端部分(残基1至210)是转录和复制活化结构域。其后是松散的铰链区(残基211至324)和羧基末端结合DNA的二聚作用结构域(残基325至410)[Dostatni，N.，等人，EMBO J 7(1988)3807-3816；Haugen，T.，等人.EMBO J 7(1988)4245-4253；McBride，A.，等人，EMBO J 7(1988)533-539；McBride，A.，等人，Proc Natl Acad Sci USA 86(1989)510-514]。根据X线晶体照相术的数据，E2的结合DNA二聚作用结构域具有双对称的八链反平行β片层结构，由两个同样的″半片层″亚单位组成[Hegde，R.，等人，Nature 359(1992)505-512；Hegde，R.，J NuclMed 36(6 Suppl)(1995)25S-27S]。E2反式-活化结构域的功能元件具有非常高的结构完整性，如通过突变分析[Abroi，A.，等人，J Virol 70(1996)6169-6179；Brokaw，J.，等人，J Virol 71(1996)23-29；Grossel，M.，等人，J Virol 70(1996)7264-7269；Ferguson，M.和Botchan，M.，JVirol 70(1996)4193-4199]和X线晶体照相术[Harris，S.，和Botchan，M.R.，Science 284(1999)1673-1677和Antson，A.等人，Nature 403(2000)805-809]所证实的。此外，X线晶体照相术显示，E2蛋白的N-末端结构域形成二聚结构，其中Arg 37在二聚体形成中有重要的功能(Antson，A.，等人，见前)。

    如前面已经描述的，1型牛乳头状瘤病毒的反式E2蛋白和其顺式多结合位点对于游离基因的基因元件附着于染色质都是必需的和充分的。此现象被认为提供了在病毒感染分裂细胞的过程中分隔病毒基因组的机制[llves，I.，等人，J Virol.73(1999)4404-4412]。

    到目前为止，没有公开的乳头状瘤载体或其它载体满足提出的最佳疫苗的标准和必要条件，对DNA疫苗和常规疫苗也是如此。(应当注意到，这些必要条件是优选的但不是用作疫苗所必须的。)首先，最佳的疫苗必须产生保护性免疫并具有最小的不良反应。因此疫苗应该没有对接受者有毒和/或引起疾病症状的成分。其次，最佳的疫苗必须诱导病原体特异的免疫反应，即它必须引起对所需病原体的强烈和可测量的免疫反应而不引起对疫苗其它成分的免疫反应。这两个必要条件意味着要用作DNA疫苗的载体应当最理想地仅表达所需的基因并最理想地不在宿主中复制，或含有任何与接受者同源的序列，因为载体与宿主基因组间同源的核苷酸序列可影响载体整合进宿主基因组。第三，最佳的疫苗必须诱导正确类型的免疫反应；即它必须产生体液的和细胞的免疫反应以对细胞内和细胞外的病原体起作用。最后，最佳的疫苗必须是稳定的，即在储存和制备所用的各种苛刻的环境下，它必须在疫苗制剂中足够长时间地保持其在体内产生免疫反应的效力。此外，疫苗应当有合理的价格。更进一步地，接种的途径和方法也是优化DNA免疫法的重要考虑因素。

    在开发DNA疫苗时，所需基因的表达稳定性有时是主要的问题。于是，以前的技术关注于在受体细胞中保持功能或保存载体，但经常以安全性为代价。例如，Ohe，Y.，等人[Hum Gene Ther 6(3)(1995)325-333]公开了能够稳定的、高水平基因表达的乳头状瘤病毒载体，建议用于基因治疗。从所述载体中删除了转化早期基因E5、E6和E7，但仍然含有编码其它乳头状瘤病毒基因的核苷酸序列如E1和E2基因，它们与病毒复制有关。因此，载体产生几种其它的乳头状瘤蛋白，可能引起有害的免疫反应并导致载体整合进接受者的危险。另外，由于含有E1基因，载体是可复制的。此外，其体积较大因而在制备过程中接受细菌修饰。

    国际专利申请PCT/EE96/00004(WO 97/24451)公开了能够长期保存在宿主细胞中的载体，以及用这种载体在表达E1和E2的哺乳动物宿主细胞中获得长期生产目的基因产物的方法。这些载体含有乳头状瘤病毒的最小复制起始点(MO)、乳头状瘤病毒的微型染色体维持元件(MME)和编码该基因产物的基因，MO和MME由不同于天然乳头状瘤病毒序列的DNA序列组成，在一些实施例中是E1基因。此外，在一些实施例中公开了经常基本上由10个E2结合位点组成的含MME的载体。为了表达，这些载体需要在宿主或载体中有E1蛋白存在。这给载体赋予了复制功能。这些载体也表达除目的基因以外的E1蛋白和E2蛋白，并含有如兔β-球蛋白序列的序列，它与人类序列部分同源，引起整合到人基因组的严重危险，这样降低了这些载体作为DNA疫苗的效力。另外，由于其大小(接近15kb)，载体在细菌细胞内的制备阶段是不稳定的，细菌复制机器倾向于通过载体的随机拼接修饰载体，产生不合要求的表达产物，包括完全缺少目的基因的产物。

    国际专利申请PCT/EE96/00004(WO 97/24451)进一步公开了E1和E2是载体的游离基因长期复制所必需的唯一病毒蛋白。另外，BPV1基因组的功能保存与最小起始点(MO)的存在相关，据称对于载体在细胞中的长期保持或稳定保存尽管不是充分的，但是必需的。此外，据称顺式元件即BPV1的微型染色体维持元件对于BPV1的稳定复制是需要的。特别地，据称多聚E2结合位点(E2BS)对于载体的稳定保存是必需的。

    明确地需要改进可用作DNA疫苗的新载体。

    因此，本发明的一个目的是提供新的载体，它们能够在宿主体内大量和数量不断增加的不同细胞中长期保存，并因而能够提供所需抗原的稳定表达。

    本发明的另一个目的是提供新的载体，它们在最初接受载体的细胞中长期保存并在有丝分裂的细胞分裂后将载体传递给子细胞。

    而本发明的另一个目的是提供新的载体，它们除一条或多条目的基因以外，仅优选地表达在受体细胞中长期保存所必需的基因，从而没有对接受者有毒或引起疾病症状的成分。

    本发明进一步的目的是提供新的载体，它们模拟减毒的活病毒疫苗，特别是模拟其在体内繁殖的功能，而不引起任何大量的疾病迹象且不表达在注射DNA疫苗的宿主中引起不良反应的有害蛋白。

    本发明更进一步的目的是提供新的载体，它们不在接受者内复制。

    本发明还有另一个目的是提供新的载体，当它们被用作DNA疫苗时引起体液的和细胞的免疫反应。

    而本发明的另一个目的是提供新的载体，它们适合于在细菌细胞内的大规模生产。

    而本发明的另一个目的是提供新的载体，它们不是宿主特异的，因此能够在各种细菌细胞中生产。

    本发明另外的目的是提供新的载体，它们被用作一条或多条目的基因的携带载体。

    本发明进一步的目的是提供新的载体，它们被用于基因治疗，作为基因治疗剂，并用于在体内生产大分子药物。

    3.发明的概述

    本发明公开了新的载体，它满足一条或多条目的基因携带载体或最佳DNA接种疫苗载体的必要条件，且优选地没有以往载体的技术缺点和副作用。

    本发明基于惊人的发现，即载体(质粒)携带(i)编码核-锚定蛋白的DNA序列表达基因盒，和(ii)所述在增殖细胞中传播的核-锚定蛋白的高亲合性结合位点多拷贝。结果，即使载体不复制，携带载体的细胞数量也增加。当载体另外携带一条或多条目的基因时，表达一条或多条目的基因的这种细胞数量同样地增加而没有载体的复制。于是，发明的载体缺少乳头状瘤病毒复制起始点。在优选的实施例中，发明的载体缺少在哺乳动物细胞中起作用的复制起始点。

    因此，本发明公开了在DNA接种疫苗和基因治疗中以及作为基因治疗药的，被用作一条或多条目的基因携带载体的新载体。在特殊实施例中，所述载体能够传播，如果需要能够在不断增加数量的细胞中长时间的表达一条或多条目的基因。本发明载体优选地仅表达核-锚定蛋白，如果需要则表达一条或多条目的基因和任意的可选择标记物。但是，它们优选地缺少任何冗余的、致癌性转化的或潜在有毒性的序列，从而消除了以前公开的或建议用作DNA疫苗的载体的严重缺点，即抗其它病毒成分的超敏性反应。在发明的某实施例中，这是通过细胞中低水平表达的核-锚定蛋白来实现的。同时，本发明载体诱导体液的和细胞的免疫反应，其中一条或多条目的基因包括在载体中。

    本发明载体利于在体外(如，以生产水平)和体内(如，接种疫苗)使用。

    本发明涉及在附加权利要求中列出的发明主题。

    本发明涉及表达载体，包括：(a)可操作地与异种启动子连接的编码核-锚定蛋白的DNA序列，所述核-锚定蛋白含有(i)与特定DNA序列结合的DNA结合结构域，和(ii)与核成分结合的功能性结构域或其功能相等区；和(b)形成核-锚定蛋白结合位点的多聚体化DNA序列，其中所述载体缺少乳头状瘤病毒的复制起始点。在优选的实施例中，发明的载体缺少在哺乳动物细胞中起作用的复制起始点。

    在某些实施例中，核成分是有丝分裂的染色质、核基质、核结构域10(ND10)或核结构域POD。

    在某些特殊的实施例中，核锚定-蛋白是染色质-锚定蛋白，且所述的功能性结构域结合有丝分裂的染色质。

    在某些实施例中，核-锚定蛋白含有铰链或连接子区。

    在某些实施例中，核-锚定蛋白是真核生物、原核生物或病毒来源的天然蛋白。在某些特殊的实施例中，天然蛋白是病毒来源的。

    在某些实施例中，核-锚定蛋白是真核生物来源的天然蛋白。

    在某些实施例中，核-锚定蛋白是乳头状瘤病毒或EB病毒的蛋白。

    在特殊的实施例中，核-锚定蛋白是1型牛乳头状瘤病毒的E2蛋白或EB病毒核抗原1。

    在特殊的实施例中，核-锚定蛋白是1型牛乳头状瘤病毒的E2蛋白。

    在特殊的实施例中，核-锚定蛋白是高迁移率组蛋白。

    在某些实施例中，核-锚定蛋白是非天然的蛋白。

    在某些实施例中，核-锚定蛋白是重组体蛋白、融合蛋白或通过分子建模技术获得的蛋白。

    在特殊的实施例中，重组体蛋白、融合蛋白或通过分子建模技术获得的蛋白含有任何组合的DNA结合结构域和功能性结构域，前者与所述的特定DNA序列结合，后者与核成分结合，其中所述的与核成分结合的功能性结构域是乳头状瘤病毒的、EB病毒的或高迁移率组蛋白的。

    在某些特殊的实施例中，重组体蛋白、融合蛋白或通过分子建模技术获得的蛋白含有任何组合的DNA结合结构域和功能性结构域，前者与所述的特定DNA序列结合，后者与核成分结合，其中所述的与核成分结合的功能性结构域是1型乳头状瘤病毒的E2蛋白的、EB病毒核抗原1的或高迁移率组蛋白的。

    在某些实施例中，载体进一步包括目的DNA序列的一个或多个表达基因盒。

    在某些实施例中，目的DNA序列是感染性病原体的。在某些实施例中，感染性病原体是病毒。在某些特殊的实施例中，病毒选自人免疫缺陷病毒(HIV)、单纯疱疹病毒(HSV)、丙型肝炎病毒、流感病毒和肠道病毒。

    在某些实施例中，目的DNA序列是细菌的。在某些实施例中，细菌选自沙眼衣原体、结核分支杆菌和肺炎支原体。在特殊的实施例中，细菌是沙门氏菌。

    在某些实施例中，目的DNA序列是真菌性病原体的。在某些实施例中，真菌性病原体是白色念珠菌。

    在某些实施例中，目的DNA序列是HIV来源的。

    在特殊的实施例中，目的DNA序列编码HIV的非结构调控蛋白。在更特殊的实施例中，HIV的非结构调控蛋白是Nef、Tat和/或Rev。在特殊实施例中，HIV非结构调控蛋白是Nef。

    在某些实施例中，目的DNA序列编码HIV的结构蛋白。在特殊的实施例中，目的DNA序列是编码HIV gp120/gp160的基因。

    在某些实施例中，发明的载体包括由编码Nef、Tat和/或Rev的目的DNA序列组成的第一个表达基因盒，和由编码Nef、Tat和/或Rev的目的DNA序列组成的第二个表达基因盒。

    在某些实施例中，发明的载体包括由编码Nef、Tat和/或Rev的目的DNA序列组成的第一个表达基因盒，和由编码HIV结构蛋白的目的DNA序列组成的第二个表达基因盒。

    在某些实施例中，目的DNA序列编码与癌症相关的蛋白。

    在某些实施例中，目的DNA序列编码与免疫成熟、免疫反应调节或自体免疫反应调节相关的蛋白。在特殊的实施例中，该蛋白是APE-CED。

    在特殊实施例中，目的DNA序列是Aire基因。

    在某些实施例中，目的DNA序列编码在任何遗传性单基因疾病中缺陷的蛋白。

    在某些实施例中，目的DNA序列编码大分子药物。

    在某些实施例中，目的DNA序列编码细胞因子。在某些特殊的实施例中，细胞因子是选自IL1、IL2、IL4、IL6和IL12的白介素。在某些其它的特殊实施例中，目的DNA序列编码干扰素。

    在某些实施例中，目的DNA序列编码有生物学活性的RNA分子。在某些特殊的实施例中，有生物学活性的RNA分子包括抑制性反义RNA和核糖酶分子。在某些特殊的实施例中，抑制性反义RNA或核糖酶分子对抗致癌基因的作用。

    发明的载体适合用于在体内生产治疗性大分子物质。

    在某些实施例中，本发明提供了用作药剂的载体。

    在某些实施例中，本发明提供了用作携带载体的载体，以传递一条或多条目的基因或一条或多条目的DNA序列，如编码感染原蛋白或肽、治疗剂、大分子药物或其任何组合的基因、多个基因、或一条或多条DNA序列。

    在某些特殊的实施例中，发明提供了用作药剂的载体以治疗遗传的或获得的基因缺陷。

    在某些实施例中，本发明提供了用作抗感染原的治疗性DNA疫苗的载体。

    在某些实施例中，本发明提供了用作治疗剂的载体。

    本发明进一步涉及给受试者提供蛋白的方法，所述方法包括给予受试者发明的载体，其中所述的载体(i)进一步包括编码要提供给受试者的蛋白的第二条DNA序列，其第二条DNA序列可操作地与第二个启动子连接，和(ii)不编码牛乳头状瘤病毒蛋白E1，其中所述的受试者不表达牛乳头状瘤病毒蛋白E1。

    本发明进一步涉及在受试者中诱导对蛋白的免疫反应的方法，该方法包括给予受试者发明的载体，其中所述的载体(i)进一步包括编码所述蛋白的第二个DNA序列，其第二个DNA序列可操作地与第二个启动子连接，和(ii)不编码牛乳头状瘤病毒蛋白E1，其中所述的受试者不表达牛乳头状瘤病毒蛋白E1。

    本发明进一步涉及在需要所述治疗的患者中治疗感染性疾病的方法，所述方法包括给予所述患者治疗有效量的发明载体，其中目的DNA序列编码由感染原的免疫原性抗原决定簇组成的蛋白。

    本发明进一步涉及在需要所述治疗的患者中治疗遗传的或获得的基因缺陷的方法，该方法包括给予所述患者治疗有效量的发明载体，其中所述的目的DNA序列编码被所述遗传的或获得的基因缺陷影响的蛋白。

    本发明进一步涉及在受试者中表达DNA序列的方法，该方法包括给予所述受试者发明的载体。

    本发明进一步涉及在受试者中表达DNA序列、治疗遗传的或获得的基因缺陷、治疗感染性疾病、诱导对蛋白的免疫反应、和向受试者提供蛋白的方法，其中发明的载体不编码牛乳头状瘤病毒蛋白E1，其中所述的受试者不表达牛乳头状瘤病毒蛋白E1。

    在某些实施例中，发明的载体被用于在细胞或生物体内生产由所述目的DNA序列编码的蛋白。

    本发明进一步提供了制备权利要求1、2或17的载体的方法，包括：(a)培养含所述载体的宿主细胞和(b)回收载体。在特殊的实施例中，制备发明载体的方法进一步包括在步骤(a)之前用所述的载体转化所述宿主细胞的步骤。在某些特殊的实施例中，宿主细胞是原核细胞。在特殊的实施例中，宿主细胞是大肠杆菌。

    本发明进一步涉及以含发明载体为特征的宿主细胞。在某些实施例中，宿主细胞是细菌细胞。在某些其它实施例中，宿主细胞是哺乳动物细胞。

    本发明进一步涉及含发明载体的携带载体。

    本发明进一步涉及含发明载体的药学组合物和适合的制药赋形剂。

    本发明进一步涉及含发明载体的DNA疫苗。

    本发明进一步涉及含发明载体的基因治疗剂。

    本发明进一步涉及制备DNA疫苗的方法，所述方法包括将发明的载体与适合的制药赋形剂结合。

    本发明进一步涉及制备用于基因治疗的药剂的方法，所述方法包括将发明的载体与适合的药学赋形剂结合。

    4.图表的描述

    图1显示质粒super6的简图。

    图2显示质粒VI的简图。

    图3显示质粒II的简图。

    图4显示在Jurkat细胞中从载体super6、super6wt、VI、VIwt和II表达Nef和E2蛋白。

    图5显示质粒产物1的简图。

    图6A显示质粒NNV-1和NNV-2的简图和图6B显示质粒和NNV-2wt的简图。

    图7显示Jurkat细胞中从质粒NNV-1、NNV-2、NNV-1wt、NNV-2-wt、super6和super6wt表达Nef蛋白。

    图8显示Jurkat细胞中从质粒NNV-2-wt、NNV-2-wtFS和产物1表达Nef和E2蛋白。

    图9显示P815细胞中从质粒NNV-2-wt、NNV-2-wtFS和产物1表达Nef和E2蛋白。

    图10显示CHO细胞中从质粒NNV-2-wt、NNV-2-wtFS和产物1表达Nef和E2蛋白。

    图11显示RD细胞中从质粒NNV-2-wt、NNV-2-wtFS和产物1表达Nef蛋白。

    图12显示在CHO、Jurkat细胞和P815细胞中表达RNA分子。

    图13显示NNV-2wt在细菌细胞中的稳定性。

    图14显示作为CHO和Jurkat细胞系中的非复制游离基因成分的NNV-2wt的稳定性Southern印迹分析。

    图15显示载体NNV2wt、NNV2wtFS和产物1不能进行HPV-11复制因子依赖的复制。

    图16显示质粒2wtd1EGFP的简图。

    图17显示质粒gf10bse2的简图。

    图18显示质粒2wtd1EGFPFS的简图。

    图19显示质粒NNVd1EGFP的简图。

    图20显示用质粒2wtd1EGFP、2wtd1EGFPFS、NNVd1EGFP或仅用载体DNA转染的Jurkat细胞生长曲线。

    图21显示用质粒2wtd1EGFP、2wtd1EGFPFS、gf10bse2或仅用载体DNA转染的Jurkat细胞的生长曲线。

    图22显示在用载体2wtd1EGFP、2wtd1EGFPFS或NNVd1EGFP转染的Jurkat细胞群中d1 EGFP阳性细胞百分比的改变。

    图23显示在用载体2wtd1EGFP、2wtd1EGFPFS或gf10bse2转染的Jurkat细胞群中d1 EGFP阳性细胞百分比的改变。

    图24显示在用载体2wtd1EGFP、2wtd1EGFPFS或NNVd1EGFP转染的Jurkat细胞群中表达d1 EGFP的细胞数目的改变。

    图25显示在用载体2wtd1EGFP、2wtd1EGFPFS或gf10bse2转染的Jurkat细胞群中表达d1 EGFP的细胞数目的改变。

    图26.T细胞对重组体Nef蛋白(5毫克/孔)的反应，在用1毫克GTU-Nef免疫的5名患者中通过T细胞增殖检测。

    图27.T细胞对重组体Nef蛋白(5毫克/孔)的反应，在用20毫克GTU-Nef免疫的5名患者中通过T细胞增殖检测。

    图28.T细胞对重组体Nef蛋白(5毫克/孔)的反应，在用1毫克GTU-Nef免疫的#1患者中通过T细胞增殖检测。结果给出T细胞增殖试验的刺激指数(Nef S1)和分泌到上清的IFN-γ。

    图29.(A)质粒pEBO LPP；(B)质粒s6E2d1 EGFP；(C)质粒FRE2d1EGFP

    图30.质粒FREBNAd1EGFP

    图31.载体不干扰细胞增殖

    图32.载体以不同的动力学保存在细胞中

    图33.在转染的总细胞群中，表达d1EGFP的细胞数目随时间的改变

    图34.在转染的总细胞群中，表达d1EGFP的细胞数目随时间的改变。(A)人胚胎细胞系293；(B)小鼠细胞系3T6

    图35.Nef和E2抗体反应

    图36.Rev和Tat抗体反应

    图37.Gag和CTL反应

    图38.(A)GTU-1；(B)GTU-2Nef；(C)GTU-3Nef；(D)super6wtd1EGFP；(E)FREBNAd1EGFP；(F)E2BSEBNAd1EGFP；(G)NNV-Rev

    图39.(A)pNRT；(B)pTRN；(C)pRTN；(D)pTNR；(E)pRNT；(F)p2TRN；(G)p2RNT；(H)p3RNT；(I)pTRN-iE2-GMCSF；(J)pTRN-iMG-GMCSF

    图40.(A)pMVINTR；(B)pMV2NTR；(C)pMV1N11TR；(D)pMV2N11TR

    图41.(A)pCTL；(B)pdgag；(C)psynp17/24；(D)poptp17/24；(E)p2mCTL；(F)p2optp17/24；(G)p3mCTL；(H)p3optp17/24

    图42.(A)pTRN-CTL；(B)pRNT-CTL；(C)pTRN-dgag；(D)pTRN-CTL-dgag；(E)pRNT-CTL-dgag；(F)pTRN-dgag-CTL；(G)pRNT-dgag-CTL；(H)pTRN-optp-17/24-CTL；(I)pTRN-CTL-optp17/24；(J)pRNT-CTL-optp17/24；(K)p2TRN-optp17/24-CTL；(L)p2RNT-optp17/24-CTL；(M)p2TRN-CTL-optp17/24；(N)p2RNT-CTL-optp17/24；(O)p2TRN-CTL-optp17/24-iE2-mGMCSF；(P)p2RNT-CTL-optp17/24-iE2-mGMCSF；(Q)p3TRN-CTL-optp17/24；(R)p3RNT-CTL-optp17/24；(S)p3TRN-CTL-optp17/24-iE2-mGMCSF；(T)p3RNT-CTL-optp17/24-iE2-mGMCSF；(U)FREBNA-RNT-CTL-optp17/24；(V)super6wt-RNT-CTL-optp17/24；(W)E2BSEBNA-RNT-CTL-optp17/24；(X)pCMV-RNT-CTL-optp17/24

    图43.multireg抗原的表达分析。

    图44.由蛋白免疫显性部分组成的multireg抗原的表达分析。

    图45.通过免疫荧光检验分析multireg抗原的细胞内定位。

    图46.gag编码的结构蛋白和CTL多抗原决定簇的表达分析。

    图47.p17/24蛋白在RD细胞膜内的定位。

    图48.含dgag和CTL的多基因在Cos-7细胞中的表达分析。

    图49.在Jurkat细胞中表达的多HIV抗原的Western印迹分析。

    图50.TRN-CTL-optp17/24和RNT-CTL-optp-17/24抗原及E2蛋白从GTU-1、GTU-2和GTU-3载体的表达分析。

    图51.从不同载体表达的多HIV抗原的保存。

    图52.多HIV抗原在RD细胞中的细胞内定位。

    5.发明的详细描述

    5.1发明的载体

    本发明基于出乎意外的发现，即表达载体能够在增殖细胞群中传播，表达载体携带(A)核-锚定蛋白基因的表达基因盒，核-锚定蛋白结合(i)特定DNA序列和(ii)适合的核成分，和携带(B)所述核-锚定蛋白的多聚体化DNA结合序列。这种核-锚定蛋白包括但不限于染色质-锚定蛋白，如1型牛乳头状瘤病毒E2蛋白(BPV1 E2；SEQ ID NO：50)。DNA结合序列可以是，但不限于，多聚体化的E2结合位点。根据以前的技术，不能期望例如乳头状瘤病毒的隔离/分隔功能可以分别地被表达，给疫苗载体添加隔离/分隔功能可保证载体在增殖细胞群中的分布。另外，根据以前的技术，不能期望可以构建不依赖复制起始点而发挥作用的功能性载体。

    如本发明所用的术语“核-锚定蛋白”是指与特定DNA序列结合并能够给载体提供核区域化功能的蛋白，即，指能够将载体锚定或附着到特定的核区室的蛋白。

    在发明的某些实施例中，核-锚定蛋白是天然的蛋白。这些核区室的实例是有丝分裂的染色质或有丝分裂的染色体、核基质、核结构域如ND10和POD等。核-锚定蛋白的实例是1型牛乳头状瘤病毒(BPV1)E2蛋白、EBNA1(EB病毒核抗原1；SEQ ID NO：52)和高迁移率组(HMG)蛋白等。如本发明所用的术语“核-锚定蛋白的功能相等物”是指天然的或非天然来源的、具有核-锚定蛋白特性的蛋白或多肽。

    在本发明的某些其它实施例中，发明的核-锚定蛋白是重组体蛋白。在发明的某些特殊实施例中，核-锚定蛋白是融合蛋白、嵌合蛋白或通过分子建模获得的蛋白。与本发明有关的融合蛋白或通过分子建模获得的蛋白，其特征是能够与核成分结合并能够结合对DNA特异的序列。在发明优选的实施例中，这种融合蛋白是由发明的载体编码的，发明的载体也含有其上结合有融合/嵌合蛋白的特定DNA序列。核成分包括但不限于染色质、核基质、ND10结构域和POD。为减低干扰宿主细胞内源性基因表达的危险，DNA结合结构域和相应的DNA序列优选地为宿主细胞/宿主生物体非内源性的。这些结构域包括但不限于，1型牛乳头状瘤病毒(BPV1)E2蛋白(SEQ ID NO：50)的、EB病毒核抗原1(EBNA1；SEQ ID NO：52)的和高迁移率组(HMG)蛋白(HMG盒)的DNA结合结构域。

    发明的载体可进一步包含“目的DNA序列”，它编码如免疫原或治疗药的蛋白(包括肽或多肽)。在发明的某些实施例中，目的DNA序列编码有生物学活性的RNA分子如反义RNA分子或核糖酶。

    携带核-锚定蛋白基因表达基因盒和所述核-锚定蛋白多聚体化结合位点的发明表达载体在增殖细胞群中传播。这意味着高拷贝数量的载体或质粒被传递进靶细胞中，且应用核-锚定蛋白的隔离/分隔功能及其多聚体化结合位点保证了载体在细胞分裂期间分配到子细胞中。

    发明的载体缺少乳头状瘤病毒复制起始点。进一步，在优选的实施例中，发明的载体缺少在哺乳动物细胞中起作用的复制起始点。删除了乳头状瘤病毒复制起始点或哺乳动物复制起始点就形成了超过本领域以前载体的改进，有几个原因。(1)同本领域以前载体相比，复制起始点的删除减小了发明载体的大小。这种大小的减低增加了载体的稳定性并促进被宿主细胞摄取。(2)复制起始点的删除减少了与宿主细胞基因组重组的危险，从而降低了有害副作用的危险。(3)复制起始点的删除使得可以通过调节给予载体的量简单地控制剂量。相反，对于起作用的复制起始点，在确定所需剂量时必须考虑载体的复制。(4)如果载体不连续地给予宿主生物体，缺少复制起始点使宿主生物体从其体内清除载体，从而更好地控制要在宿主生物体内表达的DNA序列的水平。进一步，如果载体的存在仅在治疗过程中需要，而在健康个体中是不需要的，那么生物体从其体内清除载体的能力是有益的。

    用于本发明载体的核-锚定蛋白基因可以是任何适合的DNA序列，编码具有所需特性的天然或人造蛋白如重组体蛋白、融合蛋白或通过分子建模技术获得的蛋白。因此，天然核-锚定蛋白的基因可以是病毒蛋白基因如牛乳头状瘤病毒E2蛋白或EB病毒的EBNA1(EB病毒核抗原1)，真核生物蛋白基因如高迁移率组(HMG)蛋白或类似蛋白，或是原核蛋白基因，该基因含有能够结合特定DNA序列的DNA结合结构域和能够结合核成分的功能性结构域。可选择地，含有能够结合特定DNA序列的DNA结合结构域和能够结合核成分的功能性结构域的核-锚定蛋白基因也可以包括DNA序列，编码具有附着于适当核结构的能力的细胞蛋白结构域，核结构如有丝分裂的染色体、核基质或核结构域如ND10或POD。

    可选择地，可以使用编码非天然或人造蛋白如重组体蛋白或融合蛋白或通过分子建模获得的蛋白的DNA序列，这些蛋白含有能够结合如乳头状瘤病毒特定DNA序列的DNA结合结构域，如BPV1的E2蛋白DNA结合结构域，但其中核-锚定蛋白如E2蛋白的N-末端已经被任何具有相似能力的适合蛋白的结构域取代，例如，被EB病毒核抗原1序列N-末端结构域取代。相似地，可以使用编码重组体蛋白或融合蛋白的DNA序列，蛋白含有能够结合核成分的功能性结构域，如乳头状瘤病毒的N-末端结构域如BPV1的E2蛋白，但其中核-锚定蛋白C-末端结合DNA的二聚作用结构域，如E2蛋白C-末端，已经被充足DNA结合能力的任何蛋白结构域取代，如BPV-1 E2蛋白和EBNA-1的DNA结合结构域。

    在本发明优选的实施例中，核-锚定蛋白是染色质-锚定蛋白，它含有与特定DNA序列结合的DNA结合结构域和能够结合有丝分裂染色质的功能性结构域。本发明中使用的这种染色质-锚定蛋白及其多聚体化结合位点的优选实例是1型牛乳头状瘤病毒E2蛋白和E2蛋白多聚体化结合位点。就E2来说，传播功能的机制是由于E2蛋白的双重功能：E2蛋白经蛋白N-末端结构域附着到有丝分裂染色体上的能力，和E2蛋白C-末端结构域序列特异性结合的能力，它保证将含有多聚体化E2结合位点的载体接到有丝分裂的染色体上。从而给载体提供隔离/分隔功能。

    在发明的另一个优选的实施例中，染色质-锚定蛋白基因的表达基因盒包括细胞、病毒或重组体来源的任何适合蛋白的基因，所述蛋白具有与BPV1 E2类似的特性即，经一个结构域附着于有丝分裂染色质和经另一个结构域共同地将DNA结合到对此DNA结合结构域特异的多聚体化结合位点上的能力。

    在特殊实施例中，从BPV1获得的序列被用在本发明载体中，它们被大大地缩短长度以仅仅包括BPV1的两个元件。首先，它们包括E2蛋白编码序列，转录自异源真核生物启动子并在异源的聚腺苷酰作用位点上聚腺苷化。其次，它们包括以集簇形式掺入载体的E2蛋白多结合位点，其中的位点可以是头尾相接结构或可以通过间隔定位包含在载体中。这两个元件都是必需的且令人惊讶地足以发挥载体在增殖细胞中的传播功能。相似地，当本发明载体中使用其它适合来源的DNA序列时，应用相同的原理。

    根据本发明，含有能够结合特定DNA序列的DNA结合结构域和能够结合核成分的功能性结构域的核-锚定蛋白的基因表达盒，如像BPV1 E2的染色质-锚定蛋白基因表达盒，包括异源真核生物启动子，核-锚定蛋白编码序列，如染色质-锚定蛋白编码序列例如BPV1 E2蛋白编码序列，和polyA位点。可以使用控制核-锚定蛋白表达的不同异源真核生物启动子。这些异源真核生物启动子的核苷酸序列是本领域熟知的并容易得到。这些异源真核生物启动子具有不同的强度和组织特异性。在优选的实施例中，核锚定蛋白以低水平表达。

    如本发明文中所定义的，多聚体化DNA结合序列即含多聚结合位点的DNA序列，是结合DNA的二聚作用结构域结合的区域。本发明载体的多聚体化DNA结合序列可含有任何适合的DNA结合位点，假如它满足上面的必要条件。

    在优选的实施例中，本发明载体的多聚体化DNA结合序列可包含已知的17个不同亲合性E2结合位点中的任一个，以六聚物或更高寡聚物、八聚物或更高寡聚物、十聚物或更高寡聚物形式。也可应用含不同E2结合位点的寡聚物。本发明载体中使用的特别优选的E2结合位点是BPV1高亲合性位点9和10，亲合性位点9是最优选的。当涉及更高寡聚物时，其大小仅受构建条件的限制，可含有6至30个同样的结合位点。发明优选的载体前后依次含有10个BPV-1 E2结合位点9。当多聚体化DNA结合序列由不同的E2结合位点组成时，其大小和组成成分仅受构建操作方法的限制。因而它们可含有两个或多个不同的E2结合位点附着于一系列6至30个，最优选地10个E2结合位点上。1型牛乳头状瘤病毒基因组(SEQ ID NO：49)含有17个与E2亲合性不同的E2蛋白结合位点。E2结合位点被Li等人描述[Genes Dev 3(4)(1989)510-526]，在此整体合并为参考文献。

    可选择地，多聚体化DNA结合序列可由任何适合的多聚特定序列组成，这些序列能够共同地将蛋白结合到质粒上，如EBNA1或适合的HMG蛋白的序列。EBNA-1的21×30bp结合位点重复区位于EB病毒基因组(SEQ ID NO：51)的7421位核苷酸至8042位核苷酸区域内。这些EBNA-1结合位点在以下文献中被描述：Rawlins等人，Cell 42(3)(1985)859-868；Reisman等人，Mol Cell Biol 5(8)(1985)1822-1832；及Lupton和Levine，Mol Cell Biol 5(10)(1985)2533-2542，所有这三者均在此整体合并为参考文献。

    多聚体化DNA结合序列相对于结合DNA的二聚作用结构域表达盒的位置是不重要的，可以在质粒中的任何位置。因此，多聚体化DNA结合序列可以位于目的基因表达盒的下游或上游，接近于目的基因启动子的位置是优选的。

    适当时，发明的载体还含有，转录该基因或多个基因或目的DNA序列的适合启动子、附加调控序列、聚腺苷酰作用序列和内含子。优选地，载体还可包括细菌质粒复制起始点和一个或多个可选择标记物的基因以促进在细菌宿主中制备载体，及适合的启动子以表达抗生素选择基因。

    可选择的标记可以是在DNA疫苗中允许的任何适合的标记，像卡那霉素或新霉素以及其它的标记。此外，在适当的情况下，发明的载体中可以包括其它的阳性和阴性选择标记。

    本发明载体仅包括对长期保存必要和足够的DNA序列，例如BPV1 DNA序列。所有可能引起不良反应的多余序列，如致癌序列，已被删除。因此在优选的发明载体中，E2编码序列通过突变分析被修饰，使其仅表达E2蛋白，且重叠的E3、E4和E5序列已通过诱导突变被失活而不能翻译E3、E4和E5的开放阅读框。发明的载体不含有乳头状瘤病毒复制起始点。优选地，发明的载体进一步不含有在哺乳动物细胞或哺乳动物中起作用的复制起始点。

    更进一步，本发明载体不是宿主特异的，因为核-锚定蛋白如E2蛋白的表达是由非天然的或异源启动子控制的。根据选择的特殊启动子，这些启动子可在大范围的哺乳动物细胞中起作用，或者它们可以是细胞或组织特异的。本发明载体所用的核-锚定蛋白如E2蛋白的启动子实例是胸苷激酶启动子、人细胞巨化病毒极早期启动子、鲁斯氏肉瘤病毒LTR，等。为表达目的基因，优选的启动子是保证目的基因高水平表达的强启动子，这种启动子的一个实例是人细胞巨化病毒极早期启动子。

    5.2发明的载体作为表达目的DNA序列的媒介物

    要经发明载体表达的一个基因、多个基因或一条DNA序列或多条DNA序列可以是任何需要表达的目的DNA序列。因此，载体可含有感染性微生物病原体如病毒的一个基因或多个基因或一条DNA序列或多条DNA序列，不能够制备或使用针对它们的活的减毒疫苗或灭活疫苗。这些目的DNA序列包括以下来源的基因或DNA序列：病毒如人免疫缺陷病毒(HIV)、单纯疱疹病毒(HSV)、丙型肝炎病毒、流感病毒、肠道病毒等；细胞内细菌如沙眼衣原体、结核分支杆菌、肺炎支原体等；细胞外细菌如沙门氏菌；或真菌如白色念珠菌。

    在优选的发明实施例中，载体含有编码HIV早期调控蛋白的基因，即非结构调控蛋白Nef、Tat或Rev，优选为Nef。在发明的另一个优选的实施例中，发明的载体含有编码HIV结构蛋白的基因。在另一个优选的实施例中，本发明载体含有编码HIV早期调控蛋白和/或结构蛋白任何组合的两个或更多基因。举例说明性的这些组合的实例是，编码Nef蛋白的基因和编码Tat蛋白的DNA序列的组合，可能与编码HIV外壳糖蛋白gp120/gp160的DNA序列一起，或与并入人造重组体蛋白的病原体蛋白的任何免疫原性抗原决定簇组合在一起。

    可选择地，发明的载体可含有遗传或获得性基因缺陷的基因或DNA序列，如黑素瘤分化抗原的序列，像酪氨酸酶A编码序列或编码β-catenins的序列。

    在优选的发明实施例中，载体含有癌症或其它突变性疾病相关蛋白的编码基因如APECED基因，优选地，疾病涉及免疫成熟和自体和非自体免疫反应的调节。

    在发明的另一个优选的实施例中，载体含有任何DNA序列，编码在遗传性单基因遗传病中缺陷的蛋白。

    在发明的另一个优选的实施例中，载体含有任何DNA序列，编码要在体内传递和生产的大分子药物。

    制备发明载体的本发明方法包括以下步骤：(A)培养含发明载体的宿主细胞，和(B)回收该载体。在某些特殊的实施例中，步骤(A)前用发明的载体转化宿主细胞。

    发明的载体优选地在适合的细菌宿主细胞如大肠杆菌中扩增。发明的载体是稳定的并以高拷贝数在细菌细胞中复制。如果发明的载体要在细菌宿主细胞中扩增，发明的载体含有细菌复制起始点。细菌复制起始点的核苷酸序列是熟练的技术人员熟知的并可容易地获得。

    通过以高拷贝数转染进哺乳动物宿主，载体随细胞分裂传播，携带载体的细胞数增加而载体没有复制，每个细胞能够表达目的蛋白。

    发明的载体引起所需蛋白的高表达。例如，如实施例4、7-10所显示的：在许多不同的细胞系中可显示HIV Nef蛋白、绿荧光蛋白(EGFP)和AIRE蛋白的高表达，数据表明不仅阳性细胞数，而且由目的基因编码的蛋白的量均随时间升高。

    发明的载体还引起体液的和细胞的反应，如实施例9和10所显示的。结果表明本发明载体可有效地用作DNA疫苗。

    本发明的疫苗含有本发明的载体或所述载体在适合的药物赋形剂中的混合物。例如，疫苗可含有载体混合物，载体中含有HIV三个不同调控蛋白和/或HIV结构蛋白的基因。

    发明的疫苗采用标准的疫苗配方方法配制，以生产通过任何常规途径，即肌肉内、皮内等途径用药的疫苗。

    发明的载体可含有ISS刺激序列以激发机体的免疫反应。

    发明的疫苗能够以常规的预防性方式使用来防止个体感染，可选择地，发明的疫苗可被用作治疗性疫苗与常规药物一起使用，特别是在病毒感染情况下。

    如上提到的，具有在宿主细胞中传播机制的本发明载体发现有大量的应用，用作疫苗，在基因治疗中，在基因传递中以及作为治疗性免疫原。发明的载体可用来给基因缺陷的宿主传递正常的基因，从而实现基因病的治愈或治疗。更进一步，此载体可传递外源性免疫原性蛋白的基因，如微生物或自体肿瘤抗原的基因，以用来开发抗微生物或癌症的疫苗。更进一步，发明的载体可传递适合的标记物质的基因到核，被用来研究细胞功能或用于诊断学。最后，发明的载体可被用来特异地传递大分子药物基因到核，从而能够形成新的治疗原则来治疗和治愈疾病，其中重要的是药物表达在作用位点、细胞核。这些药物可以是化学的大分子如具有治疗或治愈效果的任何蛋白或多肽，它们干扰任何核机制，如复制或转录或输送物质出入核。

    特别地，为了调节生物体抗外源抗原的特异免疫反应(免疫治疗)，或促进免疫系统抗突变的自体抗原的活性，本发明载体可被用来表达特殊的细胞因子，像白介素类(1L1，IL2，IL4，IL6，IL12和其它)或干扰素。通过表达涉及多巴胺合成的基因如酪氨酸羟化酶以及其它可能具有相似作用的基因缺陷，本发明载体还被用于补充因丧失多巴胺能神经元而引起的不可逆神经变性的脑功能障碍，这是帕金森氏病的原因。本发明载体还用于表达调节脑活动的蛋白和肽，像多巴胺受体、CCK-A和CCK-B受体，以及神经营养因子如GDNF、BDNF和其它调节脑活动的蛋白。进一步，本发明载体被用于在肝细胞中长期表达因子IX和在肌肉细胞中表达α-抗胰岛素，以补充各自生物体的不足。

    5.3靶疾病和紊乱

    在某些实施例中，发明的载体被用作疫苗。在某些实施例中，发明的载体含有编码蛋白或肽的目的DNA序列。通过给予受试者这种载体，由目的DNA序列编码的蛋白或肽被表达并刺激对目的DNA序列编码的蛋白或肽特异的免疫反应。

    在特殊的实施例中，发明的载体被用来治疗和/或预防由感染原引起的感染性疾病和/或状态。这些疾病和状态包括但不限于，由细菌、病毒、真菌、原生动物、寄生虫等病原体引起的感染性疾病。在更特殊的本发明实施例中，感染性疾病是获得性免疫缺陷综合症。

    优选地，需要治疗或预防病毒性疾病时，使用编码含已知病毒抗原决定簇分子的DNA序列。例如，这种编码抗原性抗原决定簇的DNA序列可制备自病毒，包括但不限于甲型肝炎病毒、乙型肝炎病毒、丙型肝炎病毒、流感病毒、水痘病毒、腺病毒、I型单纯疱疹病毒(HSV-1)、II型单纯疱疹病毒(HSV-11)、牛瘟病毒、鼻病毒、ECHO病毒、轮状病毒、呼吸道合胞病毒、乳头状瘤病毒、乳多空病毒、细胞巨化病毒、棘皮病毒、虫媒病毒、huntavirus、柯萨奇病毒、腮腺炎病毒、麻疹病毒、风疹病毒、脊髓灰质炎病毒、I型人免疫缺陷病毒(HIV-1)和II型人免疫缺陷病毒(HIV-11)。

    优选地，在需要治疗或预防细菌性感染时，使用编码含已知细菌抗原决定簇分子的DNA序列。例如，这种编码抗原性抗原决定簇的DNA序列可制备自细菌，包括但不限于分支杆菌、立克次氏体、支原体、奈瑟氏菌属和军团菌属。

    优选地，在需要治疗或预防原生动物感染时，使用编码含已知原生动物抗原决定簇分子的DNA序列。例如，这种编码抗原性抗原决定簇的DNA序列可制备自原生动物，包括但不限于利什曼原虫、kokzidioa和锥体虫。

    优选地，在需要治疗或预防寄生虫感染时，使用编码含已知寄生虫抗原决定簇分子的DNA序列。例如，这种编码抗原性抗原决定簇的DNA序列可制备自寄生虫，包括但不限于衣原体和立克次氏体。

    在其它特殊的实施例中，发明的载体被用于在受试者中治疗和/或预防肿瘤疾病。在这些实施例中，目的DNA序列编码对肿瘤疾病特异或与其相关的蛋白或肽。作为非限制性实施例，新生物疾病可以是纤维肉瘤、粘液肉瘤、脂肪肉瘤、软骨肉瘤、骨源性肉瘤、脊索瘤、血管肉瘤、内皮肉瘤、淋巴血管肉瘤、淋巴血管内皮肉瘤、滑膜瘤、间皮瘤、尤文氏肉瘤、平滑肌肉瘤、横纹肌肉瘤、结肠癌、胰腺癌、乳腺癌、卵巢癌、前列腺癌、鳞状细胞癌、基底细胞癌、腺癌、汗腺癌、皮脂腺癌、乳头状癌、乳头状腺癌、囊腺癌、髓样癌、支气管癌、肾细胞癌、肝细胞癌、胆管癌、绒癌、精原细胞瘤、胚胎细胞癌、维尔姆斯瘤、子宫颈癌、睾丸肿瘤、肺癌、小细胞肺癌、膀胱癌、上皮癌、神经胶质瘤、星形细胞瘤、成神经管细胞瘤、颅咽管瘤、室管膜瘤、松果体瘤、成血管细胞瘤、听神经瘤、少突神经胶质瘤、脑脊膜瘤、黑素瘤、成神经细胞瘤、视网膜母细胞瘤；白血病如急性淋巴细胞性白血病和急性髓细胞性白血病(原粒细胞、早幼粒细胞、骨髓单核细胞、单核细胞和红细胞性白血病)；慢性白血病(慢性髓细胞性(粒细胞性)白血病和慢性淋巴细胞性白血病)；和脾大性红细胞增多、淋巴瘤(何杰金氏病和非何杰金氏病)、多发性骨髓瘤、瓦尔登斯特伦氏巨球蛋白血症和重链病，等。

    在本发明的某些其它实施例中，目的DNA序列编码因蛋白编码基因遗传性紊乱或获得性突变而无功能或功能障碍的蛋白。这种遗传病包括但不限于，代谢性疾病如动脉硬化症(受影响的基因：APOE)；癌症如家族性腺瘤样结肠息肉(受影响的基因：APC基因)；自体免疫疾病如自体免疫多内分泌病-念珠菌病-外胚层发育异常(受影响的基因：APECED)；肌肉病如杜兴氏肌营养不良(受影响的基因：DMD)；神经系统疾病如阿尔兹海姆病(受影响的基因：PS1和PS2)。

    还是在另一个实施例中，发明的载体被用来治疗和/或预防由病理性高活性的一种蛋白引起的疾病和紊乱。在发明的这些实施例中，目的DNA序列编码过度活化的蛋白的一种拮抗剂。这些拮抗剂包括但不限于，反义RNA分子，核糖酶，抗体和显性失活蛋白。在发明的特殊实施例中，目的DNA序列编码一种癌基因的抑制剂。

    在某些实施例中，目的DNA序列编码一种可拮抗肿瘤生长的分子。在发明的特殊实施例中，目的DNA序列编码一种肿瘤抑制剂，如，但不限于p53。在其他的特殊实施例中，目的DNA序列编码凋亡的一种激动剂，如但不限于，Caspase。

    发明提供了一些方法，其中目的DNA序列在受试者中表达。在某些实施例中，含有目的DNA序列的一个或多个表达基因盒的载体给予受试者，其中受试者不表达牛乳头状瘤病毒E1蛋白。

    5.4使用本发明的治疗方法

    5.4.1重组DNA

    在发明的各种实施例中，发明的载体包括含有目的DNA序列的一个或多个表达基因盒。目的DNA序列编码一种蛋白和/或生物学活性的RNA分子。在两种情况下，在基因治疗时，DNA序列均被插入至发明的载体中以在重组细胞或宿主的细胞中表达。

    如在此所使用的，一种表达基因盒是指与可使发明的蛋白在一个合适的宿主细胞中表达的一个或多个调控区或增强子/启动子序列可操作连接的目的DNA序列。“可操作地连接”是指一种结合方式，其中调控区和要被表达的DNA序列被连接，并以可允许转录，对于蛋白时允许翻译的方式被定位。

    目的DNA序列的转录所必需的调控区由发明的载体提供。在一个相容性宿主构建物系统中，细胞转录因子，如RNA聚合酶将与载体的调控区结合以影响目的DNA序列在宿主生物体中的转录。基因表达需要的调控区的准确性质可在宿主细胞之间有所不同。通常，需要一种启动子，它能够结合RNA聚合酶和促进可操作连接的DNA序列的转录。这种调控区包括参与启动转录和翻译的5’非编码序列，如TATA盒，加帽序列，CAAT序列，和类似序列。编码序列的3’非编码区含有转录终止调控序列，如终止子和聚腺苷酸化位点。

    结构性和诱导性调控区都可用来表达目的DNA序列。当宿主细胞的最佳生长条件和高水平表达目的DNA序列的条件不同时，需要使用诱导性启动子。可使用的调控区的实例在下面提供(章节5.4.4)。

    为了将有调节功能的DNA序列，如启动子附着于目的DNA序列或将目的DNA序列插入进载体中的克隆位点，提供了合适的相容性限制位点的连接子或接头，可采用本领域熟知的技术连接于cDNA的末端[Wu等人，Methods in Enzymol 152(1987)343-349)。使用限制性酶的切割作用跟随在建立钝端的修饰作用之后，所述的修饰是在连接作用之前通过在单链的DNA末端回退消化或填充而进行。可选择的是，应用PCR使用含有所需限制性酶位点的引物通过扩增DNA将限制性酶导入进DNA的片断中。

    含有可操作地连接于调控区(增强子/启动子序列)的目的DNA序列的载体被直接导入进合适的宿主细胞中以表达目的DNA序列而不需进一步克隆。

    为了在哺乳动物宿主细胞中表达目的DNA序列，可使用多种调控区，例如，SV40早期和晚期启动子，巨细胞病毒(CMV)极早期启动子，和鲁斯氏肉瘤病毒长末端重复区(RSV-LTR)启动子。可用于哺乳动物细胞的诱导性启动子包括但不限于与金属硫蛋白II基因，小鼠乳腺肿瘤病毒肾上腺皮质激素反应性长末端重复区(MMTV-LTR)，β-干扰素基因，和hsp70基因有关的启动子[Williams等人，Cancer Res.49(1989)2735-42；Taylor等人，Mol.Cell Biol.，10(1990)165-75]。使用热休克启动子或应激启动子驱动目的DNA序列在重组宿主细胞中表达是有益的。

    另外，表达载体含有可选择的或可筛选的标记物基因用于最初分离，鉴定或跟踪含有载体的宿主细胞。许多选择系统可用于哺乳动物细胞，包括但不限于单纯疱疹病毒胸苷激酶[Wigler等人，Cell 11(1977)223]，次黄嘌呤-鸟嘌呤磷酸核糖转移酶[Szybalski和Szybalski，Proc.Natl.Acad.Sci.USA48(1962)2026]，和腺嘌呤磷酸核糖转移酶[Lowy等人，Cell 22(1980)817]基因分别用于tk-，hgprt-或aprt-细胞。抗代谢物抗性也可用做选择二氢叶酸还原酶(dhfr)的基础，可赋予对氨甲喋呤的抗性[Wigler等人，Natl.Acad.Sci.USA 77(1980)3567；O′Hare等人，Proc.Natl.Acad.Sci.USA 78(1981)1527]；gpt，可赋予对霉酚酸的抗性[Mulligan & Berg，Proc.Natl.Acad.Sci.USA 78(1981)2072]；新霉素磷酸转移酶(neo)，可赋予对氨基糖苷G-418的抗性[Colberre-Garapin等人，J.Mol.Biol.150(1981)1]；和潮霉素磷酸转移酶(hyg)，可赋予对潮霉素的抗性[Santerre等人，1984，Gene 30(1984)147]。可使用其他可选择的标记物，如，但不限于组氨醇和Zeocin。

    5.4.2表达系统和宿主细胞

    为了应用发明的方法，宿主细胞和/或宿主生物体优选不表达牛乳头状瘤病毒E1蛋白。而且，优选发明的载体不表达牛乳头状瘤病毒E1蛋白。

    优选地哺乳动物宿主细胞包括但不限于来自下列来源的细胞：人，猴和啮齿类动物(见，例如，Kriegler M.在“基因传递和表达：实验室手册”，New York，Freeman & Co.1990)，如由SV40(COS-7，ATCC CRL1651)转化的猴肾细胞系；人胚胎肾细胞系(293，293-EBNA，或为悬浮培养生长亚克隆的293细胞，Graham等人，J.Gen.Virol.，36(1977)59；幼仓鼠肾细胞(BHK，ATCC CCL 10)；中国仓鼠卵巢细胞-DHFR[CHO，Urlaub和Chasin。Proc.Natl.Acad.Sci.77(1980)4216]；小鼠sertoli细胞[Mather，Biol.Reprod.23(1980)243-251]；小鼠成纤维细胞(NIH-3T3)，猴肾细胞(CVI ATCC CCL 70)；非洲青猴肾细胞(VERO-76，ATCC CRL-1587)；人子宫颈癌细胞(HELA，ATCC CCL 2)；犬肾细胞(MDCK，ATCC CCL 34)；buffalo大鼠肝细胞(BRL 3A，ATCC CRL1442)；人肺细胞(W138，ATCC CCL 75)；人肝细胞(Hep G2，HB 8065)；和小鼠乳腺肿瘤细胞(MMT 060562，ATCC CCL51)。

    发明的载体可被合成和从已知的DNA序列通过本领域熟知的技术组装而成。调控区和增强子元件可具有多种来源，天然的和合成的。一些宿主细胞可从商业渠道获得。

    含有目的DNA序列的发明载体可通过本领域已知的技术被导入至宿主细胞中，包括但不限于，对于原核细胞，细菌转化(Hanahan，1985，DNA克隆，实践方法，1：109-136)，对于真核细胞，磷酸钙介导的转染[Wigler等人，Cell 11(1977)223-232]，脂质体介导的转染[Schaefer-Ridder等人，Science 215(1982)166-168]，电穿孔[Wolff等人，Proc Natl Acad Sci 84(1987)3344]，和微注射[Cappechi，Cell 22(1980)479-4889]。

    在一个特殊的实施例中，表达发明DNA序列的细胞系可采用含有可选择标记物的载体来进行改造。通过实例而不是限制，在导入载体后，改造的细胞可在一种富集的培养基中生长1-2天，然后更换为选择性培养基。载体中的可选择标记物可赋予对选择作用的抗性，并最好仅允许含有具有可选择标记物的载体的细胞在培养中生长。

    5.4.3疫苗方法

    在某些实施例中，含有目的DNA序列的一个表达基因盒的发明载体给予一个受试者以诱导免疫反应。特殊地，目的DNA序列编码一种蛋白(例如，肽或多肽)，可在其表达过程中诱导特异免疫反应。这种蛋白的实例在章节5.3中进行描述。

    为了传递发明的载体作为疫苗，其方法可选自本领域已知的方法和/或在章节5.4.6中描述。

    5.4.4基因治疗方法

    在一个特殊的实施例中，含有目的DNA序列的表达基因盒的发明载体被给予以治疗或预防多种疾病。目的DNA序列编码一种蛋白和/或一种生物学活性的RNA分子。基因治疗是指通过给予受试者一种已表达的或可表达的DNA序列进行的治疗。在发明的这个实施例中，DNA序列产生它们编码的可介导治疗效应的蛋白或RNA分子。

    根据本发明可使用本领域中用于基因治疗的任何方法。实例的方法在下面描述。

    对于基因治疗方法的总体综述，见Goldspiel等人，ClinicalPharmacy 12(1993)488-505；Wu和Wu，Biotherapy 3(1991)87-95；Tolstoshev，Ann.Rev.Pharmacol.Toxicol.32(1993)573-596；Mulligan，Science 260(1993)926-932；Morgan和Anderson，Ann.Rev.Biochem.62(1993)191-217；May，TIBTECH 1，1(5)(1993)155-215。可使用的重组DNA技术领域中普遍已知的方法见Ausubel等人，(主编)，分子生物学现代方法，John Wiley & Sons，NY(1993)；和Kriegler，基因传递和表达，实验室手册，Stockton Press，NY(1990)中的描述。

    具有组织特异性，并已经在转基因动物中使用的下列动物调控区可在特殊的组织类型中用来表达目的DNA序列：在胰腺腺泡细胞中有活性的弹性蛋白酶1基因控制区[Swift等人，Cell 38(1984)639-646；Ornitz等人，Cold Spring Harbor Symp.Quant.Biol.50(1986)399-409；MacDonald，Hepatology 7(1987)425-515]；在胰腺β细胞中有活性的胰岛素基因控制区[Hanahan，Nature 315(1985)115-122]，在淋巴细胞中有活性的免疫球蛋白基因控制区[Grosschedl等人，Cell 38(1984)647-658；Adames等人，Nature 318(1985)533-538；Alexander等人，Mol.Cell.Biol.7(1987)1436-1444]，在睾丸，乳腺，淋巴和肥大细胞中有活性的小鼠乳腺肿瘤病毒控制区[Leder等人，Cell 45(1986)485-495]，在肝脏中有活性的白蛋白基因控制区[Pinkert等人，Genes andDevel.1(1987)268-276]，在肝脏中有活性的α-甲胎蛋白基因控制区[Krumlauf等人，Mol.Cell.Biol.5(1985)1639-1648；Hammer等人，Science 235(1987)53-58；在肝脏中有活性的α1-抗胰蛋白酶基因控制区[Kelsey等人，Genes and Devel.1(1987)161-171]，在髓样细胞中有活性的β-球蛋白基因控制区[Mogram等人，Nature 315(1985)338-340；Kollias等人，Cell 46(1986)89-94]；在脑中的少突胶质细胞中有活性的髓磷脂碱性蛋白基因控制区[Readhead等人，Cell 48(1987)703-712]；在骨骼肌中有活性的肌球蛋白轻链-2基因控制区[Sani，Nature 314(1985)283-286]，和在下丘脑中有活性的促性腺释放激素基因控制区[Mason等人，Science 234(1986)1372-1378]。

    传递fro的基因治疗手术的方法在本领域中是熟知的和/或在章节5.4.6中描述。

    5.4.5抑制性反义和核糖酶

    在发明的某些实施例中，发明的载体含有编码反义或核糖酶RNA分子的目的DNA序列。产生和使用这种分子的技术是本领域中的专业技术人员所熟知的。

    反义RNA分子通过与靶向的mRNA杂交和防止蛋白翻译来作用直接阻断mRNA翻译。反义方法涉及设计与靶基因mRNA互补的寡核苷酸。反义寡核苷酸将与互补的靶基因mRNA转录物结合并阻止翻译。尽管是优选的，但不需要绝对的互补性。

    与RNA的一部分“互补的”序列，如在此所提到的，其含义是指具有足够互补性，能与至少RNA的非聚合A部分杂交形成稳定双链体的序列；因此在双链反义核酸的情况下，检测双链体DNA的单链或检测形成的三联体。杂交的能力将根据互补性的程度和反义核酸的长度而变化。通常，杂交的核酸越长，与RNA不匹配的碱基越多，可含有并仍然形成稳定的双链体(或三联体，在情况可能时)。本领域的专业技术人员可使用标准的方法确定错配的可耐受程度以确定杂交复合体的熔点。

    反义核酸应该至少为6个核苷酸的长度，优选寡核苷酸的长度范围是从6至大约50个核苷酸。在特殊的方面，寡核苷酸至少为10个核苷酸，至少17个核苷酸，至少25个核苷酸或至少50个核苷酸。在发明的另一个实施例中，反义核酸为至少100，至少250，至少500，和至少1000个核苷酸的长度。

    无论何种靶序列的选择，优选体外研究首先定量反义寡核苷酸抑制基因表达的能力。优选这些研究使用可区分反义核酸抑制和寡核苷酸的非特异性生物学效应的对照。也优选这些研究比较靶RNA或蛋白与内参照RNA或蛋白的水平。可选择地，期望使用反义DNA序列获得的结果与使用对照DNA序列获得的结果进行比较。优选对照DNA序列与被检测的寡核苷酸大致具有相同的长度，寡核苷酸的DNA序列与反义序列的差异仅需要阻止与靶序列的特异杂交。

    当使用与靶基因编码区序列互补的反义DNA序列时，这些与转录的，未翻译区互补的序列是最优选的。

    为了从发明的载体中表达生物学活性的RNA，如反义RNA分子，编码生物学活性的RNA分子的DNA序列可操作地连接于一个强的polIII或pol II启动子。在患者中使用这样一种构建物转染靶细胞将导致产生足够转录量的单链RNA，它们将与内源靶基因转录物形成互补碱基对，并因此阻止靶基因mRNA的翻译。例如，发明的载体可被导入，例如，被细胞摄取，并引导反义RNA的转录。这样的载体可通过本领域中的标准重组DNA技术方法来构建。编码反义RNA的序列的表达可通过任何本领域已知的启动子来作用于哺乳动物，优选人的细胞。这些启动子可以是诱导性的或结构性的。这些启动子包括但不限于：SV40早期启动子区[Bernoist和Chambon，Nature 290(1981)304-310]，包含在罗斯肉瘤病毒的3个长末端重复区内的启动子[Yamamoto等人，Cell 22(1980)787-797]，疱疹胸苷激酶启动子[Wagner等人，Proc.Natl.Acad.Sci.U.S.A.78(1981)1441-1445]，金属硫蛋白基因的调控序列[Brinster等人，1982，Nature 296(1982)39-42]等。

    在发明的某些实施例中，发明的载体含有编码核糖酶的一条DNA序列。设计用来催化切割靶基因mRNA转录物的核糖酶分子也可用来防止靶基因mRNA的翻译，和因此产生的靶基因产物的表达[见，如PCT国际申请WO90/11364，公开于1990年10月4日；Sarver等人，Science 247(1990)1222-1225]。

    核糖酶是能够催化RNA特异断裂的酶性RNA分子。[综述见Rossi，Current Biology 4(1994)469-471]。核糖酶作用的机制涉及核糖酶分子与互补的靶RNA的序列特异性杂交，然后发生核苷酸内切的断裂。核糖酶分子的组合物必须包括与靶基因mRNA互补一条或多条序列，必须包括熟知的可引起mRNA断裂的催化序列。对于这条序列，见，如美国专利第5,093,246，它在此整体合并为参考文献。

    当在位点特异识别序列上断裂mRNA的核糖酶被用来破坏靶基因mRNA时，优选使用锤头形核糖酶。锤头形核糖酶可在与靶mRNA形成互补碱基对的侧向区指示的位置断裂mRNA。唯一需要的是靶mRNA具有以下的两个碱基的序列：5′-UG-3′。锤头形核糖酶的构建和生产是本领域中为人熟知的，并更详细地描述在Myers，1995，分子生物学和生物技术：综合Desk Reference，VCH Publishers，New York，(见，特别是图4，833页)和在Haseloff & Gerlach，Nature，334 1988)585-591，在此整体加入合并为参考文献。

    优选核糖酶被改造，以便断裂识别位点的位置靠近靶基因mRNA的5′末端，即增加效率，尽量减小非功能性mRNA转录物的细胞内累积。

    本发明的核糖酶也包括RNA核糖核酸内切酶(此后称为″Cech-型核糖酶″)如嗜热四膜虫中天然存在的酶(也称为IVS，或L-19 IVS RNA)和已经由Thomas Cech及其合作者广泛描述的[Zaug等人，Science，224(1984)574-578；Zaug和Cech，Science，231(1986)470-475；Zaug等人，Nature，324(1986)429-433；已公开的世界专利申请第WO 88/04300由大学专利公司申请；Been & Cech，Cell，47(1986)207-216]。Cech-型核糖酶具有8个碱基对的活性位点，可与靶RNA序列杂交，然后发生靶RNA的断裂。发明包括那些Cech型核糖酶，可靶向存在于靶基因中的8个碱基对活性位点。

    核糖酶的表达可在一个强结构性pol III或pol II启动子的控制下，这样转染的细胞将产生足够数量的核糖酶以破坏内源性靶基因信息和抑制翻译。因为核糖酶不象反义分子，它是催化性的，所以为了效率需要更低的细胞内浓度。

    在一些例子中，其中在此描述的反义和/或核糖酶分子用来抑制突变体基因表达，可能技术有效地减少或抑制正常靶基因等位基因产生的mRNA的翻译，就出现了这样的可能性，其中存在的正常靶基因产物的浓度低于正常基因表现型所需的浓度。在这种情况下，为了保证维持实质上正常水平的靶基因活性，所以编码和表达抑制正常靶基因活性的多肽的核酸分子，可通过基因治疗方法被导入至细胞中，如在下面5.4.4章节所描述的那些，不包括那些无论使用反义，核糖酶，或三链螺旋处理都敏感的序列。可选择地，在靶基因编码细胞外蛋白的例子中，优选共同给予正常的靶基因蛋白以维持靶基因活性必需的水平。

    给予核糖酶和反义RNA分子的方法在本领域中是熟知的和/或在章节5.4.6中描述。

    5.4.6药物制剂及其应用方式

    在一个优选的方面，发明的药剂包括发明的一种实质上纯化的载体(如，实质上不含有限制其效力或产生不需要的副作用的物质)。以发明的方法给予药剂的受试者优选是一种动物，包括但不限于以下的动物如奶牛，猪，马，鸡，猫，狗等，优选是一种哺乳动物，最优选的是人类。

    在某些实施例中，发明的载体直接在体内应用，其中目的DNA序列被表达产生其编码产物。这可以通过任何本领域已知的大量方法来完成。可使用发明的载体以便核酸序列成为细胞内的。发明载体的给予可通过直接注射裸DNA；使用微粒轰击(如，基因枪；Biolistic，Dupont)；用脂类或细胞表面受体或转染剂包被；包裹在微粒或微囊体中；与已知可进入细胞核的肽连接使用；与要进行受体介导的胞吞作用的配体连接使用[见，如Wu和Wu，J.Biol.Chem.262(1987)4429-4432](可用于特异地表达受体的靶细胞类型)；等。在一个特殊的实施例中，化合物或组合物可被递送在一个囊泡中，特别是脂质体中[见Langer，Science249(1990)1527-1533；Treat等人，1989，脂质体在感染性疾病和癌症的治疗中，Lopez-Berestein和Fidler(主编)，Liss，New York，353-365页；Lopez-Berestein，同上，317-327页]。

    在某些实施例中，发明的载体用脂类或细胞表面受体或转染剂包被，或连接于已知可进入细胞核的同源框样肽[见，如Joliot等人，Proc.Natl.Acad.Sci.USA 88(1991)1864-1868]，等。

    在某些其他的实施例中，形成核酸-配体复合体，其中配体含有一个fusogenic病毒肽以破坏内涵体，使核酸避免溶酶体的降解。

    还是在另一个实施例中，发明的载体通过靶向特异受体而在体内被靶向细胞的特异摄取和表达(见，如PCT申请WO92/06 180；WO92/22635；WO92/20316；WO93/14188，和WO93/20221)。

    用于发明的方法包括但不限于，皮内，肌肉内，腹膜内，静脉内，皮下，鼻内，硬膜下，和口服途径。用于发明的方法进一步包括通过任何方便的途径给药，例如通过输注或快速注射，通过穿过上皮或粘膜皮肤连接的吸收(如，口腔粘膜，直肠和肠粘膜等)。在一个特殊的实施例中，需要将发明的载体通过注射，通过导管，通过栓剂，或通过植入体来应用，所述的植入体由多孔的，无孔的或凝胶材料组成，包括膜，如sialastic膜，或纤维。注意必须使用载体不吸收的材料。给药可以是全身性的或局部的。

    在某些实施例中，发明的一种载体与其他的生物活性剂如化学治疗剂或增强免疫系统的药剂一起使用。

    还是在另一个实施例中，用于发明的方法包括经一种可控释放系统的递送。在一个实施例中，可使用一种泵[见Langer，见前；Sefton，CRC Crit.Ref.Biomed.Eng.14(1989)201；Buch-wald等人，Surgery 88(1980)507；Saudek等人，N.Engl.J.Med.321(1989)574]。在另一个实施例中，可使用聚合材料[见可控释放的医学应用，1974，Langer和Wise(主编)，CRC Pres.，Boca Raton，Florida；可控药物的生物利用度，药物产品设计和性能，1984，Smolen和Ball(主编)，Wiley，New York；Ranger和Peppas，Macromol.Sci.Rev.Macromol.Chem.23(1983)61；也见Levy等人，Science 228(1985)190；During等人，Ann.Neurol.25(1989)351；Howard等人，J.Neurosurg.71(1989)105]。

    其他可控释放系统的讨论见Langer的综述，Science 249(1990)1527-1533。

    发明的药物组合物含有治疗有效量的发明载体和一种合适的药物运载体。在一个特殊的实施例中，术语“合适的药物运载体”的含义是由联邦或州政府的管理机构批准的或列于美国药典或其他广泛被药典公认可用于动物，更特别用于人的物质。术语“运载体”是指稀释剂，佐剂，赋形剂或给予治疗药物的运载体。这种合适的药物运载体可以是无菌液体，如水和油，包括石油，动物，植物或合成来源的油，如花生油，豆油，矿物油，麻油和类似物。当药物组合物静脉给药时，水是优选的运载体。盐水溶液和葡萄糖溶液和甘油溶液也可用作液体运载体，特别是作为可注射的溶液。合适的药物赋形剂包括淀粉，葡萄糖，乳糖，蔗糖，明胶，麦芽，大米，面粉，白垩，硅胶，硬脂酸钠，甘油单硬脂酸酯，滑石，氯化钠，干燥的脱脂奶，甘油，丙烯，乙二醇，水，乙醇和类似物。如果需要，组合物也含有最小量的湿润剂或乳化剂，或pH缓冲剂。这些组合物可采取溶液，悬液，乳剂，片剂，丸剂，胶囊，散剂，持续释放剂型的形式和类似物。组合物被制成为栓剂，含有传统的粘合剂，以及如三甘油三酯的运载体。口服剂型可含有标准的运载体如药物级的D-甘露醇，乳糖，淀粉，硬脂酸镁，糖精钠，纤维素，碳酸镁等。合适的药物运载体的实例描述在E.W.Martin的“雷明顿药物科学”。这些组合物将含有治疗有效量的发明核酸，优选以纯化的形式，与合适量的载体一起为患者提供给药的恰当形式。制剂剂型应该符合给药的方式。

    在一个特殊的实施例中，发明的药物根据常规的步骤被制成为一种可适合静脉内给予人类的药物组合物。典型地，静脉给药的组合物是无菌等渗缓冲的水溶液。当需要时，发明的药物也包括一种溶解剂，和一种局部麻醉剂如利多卡因以缓解注射部位的疼痛。通常，各种成分可单独提供或以单位药剂的形式混合在一起，例如冻干的粉末或在密封容器中的无水浓缩物，如安瓿，或显示活性剂量的sachette。当发明的药剂通过输注给药时，它可用含有药物级水或盐水的输液瓶来配制。当发明的药物通过注射给药时，提供了一安瓿注射用水或盐水以便各种成分再给药前被混合在一起。

    为含服给药，组合物可采取以常规方法制成的片剂或锭剂形式。

    为吸入给药，根据本发明使用的化合物可方便地以喷雾剂形式从气溶胶包装或喷雾器中喷出而递送，使用合适的推进剂如二氯二氟甲烷、三氯氟甲烷、二氯四氟乙烷、二氧化碳或其他合适的气体。就加压气溶胶来说，可通过设置一个阀门来释放计量的剂量而确定用药单位。用在吸入器或吹入器中的例如明胶的胶囊和药筒可制成含有化合物和合适的粉末基质如乳糖或淀粉的混合粉末制剂。

    在治疗或预防适应症疾病中会有效的发明载体的量，可通过标准的临床技术来确定。另外，可选择性的使用体外实验来帮助确定最佳的剂量范围。要在制剂中应用的准确剂量也依赖于给药的途径，适应症疾病的程度，并应该根据临床医生的判断和每个患者的情况而定。有效的剂量可从体外或动物模型检测系统得到的剂量反应曲线中推导出来。

    本发明可能通过参考下列非限制性的实例而更好地被理解，它们被提供作为发明的范例。下面的实例是为了更充分地举例说明发明的优选实施例。但它们绝不能被解释为要限制本发明的广阔范围。

    6.实例

    6.1.实例1

    载体super6和super6wt的克隆和表达特性分析

    载体质粒super6(图1)和super6wt分别从前一代为基础的基因接种载体VI(图2)和VIwt制备。载体VI和VIwt主要是合成的细菌质粒，含有来自卡那霉素抗性标记物基因的一个转座子Tn903[Oka，A.等人，JMol Biol 147(1981)217-226]和需要在大肠杆菌细胞中繁殖的pMB1复制子的一种修饰形式[Yanisch-Perron，C.等人，Gene 33(1985)103-119]。载体VI和VIwt也含有与HSV1 TK引导序列和兔β-球蛋白基因序列组合在一起的巨细胞病毒极早期启动子，它们都来自质粒pCG[Tanaka，M.等人，60(1990)Cell 375-386]。后面的元件是从来自HIV-1菌株HAN2隔离群的nef编码序列中表达所需要的[Sauermann，U.，等人，AIDSResearch.Hum.Retrov.6(1990)813-823]。Nef表达载体携带成簇的十个高亲合性E2结合位点(来自质粒pUC1910BS，未公开)，正好在CMV启动子上游。

    母载体VI含有修饰的E2编码序列：E2铰链区(氨基酸192-311)被来自EB病毒EBNA1蛋白的四个甘氨酸-丙氨酸重复区置换[Baer，R.J.等人，Nature 310(1984)207-211]。由这条序列编码的蛋白命名为E2d192-311+4G。母载体VIwt含有具有点突变的1型牛乳头状瘤病毒野生型E2蛋白的一个表达基因盒，该点突变通过两个终止密码子被导入E3和E4 ORF中以消除这些开放阅读框(ORF)的编码能力。在载体中，E2编码序列被克隆在罗斯肉瘤病毒前病毒5′LTR[Long，E.O.等人，Hum.Immunol.31(1991)229-235]和牛生长激素聚腺苷酰区[Chesnut，J.D.，et al.，J Immunol Methods 193(1996)17-27]。

    质粒载体super6和super6wt的构建是通过从各自的母载体VI和VIwt中删除除兔β-球蛋白基因的第二个内含子以外的所有nef基因下游的β-球蛋白序列。β-球蛋白序列(特别是外显子片段)显示与人β-球蛋白基因中的序列具有一些同源性，而内含子却缺少与人基因组序列任何明显的同源性。内含子使用具有一些错配的寡核苷酸通过PCR从质粒pCG中扩增[Tanaka，M.等人，Cell 60(1990)375-386]以修饰内含子的剪接供体和受体位点与共有的基序完全匹配。来自pHook的1型单纯疱疹病毒胸苷激酶基因聚腺苷酰区[Chesnut，J.D.等人，J ImmunolMethods 193(1996)17-27]然后被克隆紧靠内含子3’末端，因为在母载体中可使用兔β-球蛋白聚腺苷酰信号。

    通过使用Nef和E2的单克隆抗体进行的Western印迹分析由质粒载体super6和super6wt表达的Nef和E2蛋白的表达特性，并与由VI和VIwt表达的Nef和E2蛋白的表达特性比较[Towbin等人，Proc NatlAcad Sci USA 76(1979)4350-4354]。首先，Jurkat细胞(一种人T细胞成淋巴细胞系)通过电穿孔使用1μg super6，super6WT或等克分子量的质粒VI，VIwt转染[Ustav等人，EMBO J 2(1991)449-457]。可使用等克分子量的载体II(图3)作为对照，它含有一个相同的Nef基因盒，但没有E2编码序列。运载体DNA可用作阴性对照。简言之，质粒和运载体DNA与细胞悬液在0.4cm电穿孔试管中被混合(BioRadLabo-ratories，Hercules，USA)，然后使用具有电容扩充器(BioRadLaboratories，Hercules，USA)的基因脉冲仪IITM进行电脉冲(200V；1mF)。

    转染后49小时，细胞用含有50mM Tris-HCl pH6.8；2％SDS，0.1％溴酚蓝，100mM二硫苏糖醇，和10％(v/v)甘油的标本缓冲液处理而被裂解。裂解物在10％或12.5％SDS-聚丙烯酰胺凝胶上泳动，随后转移至一张0.45μmPVDF硝化纤维膜(Millipore)上。膜首先用含有5％脱脂奶(无脂肪)，50mM Tris-HCl pH7.5中0.1％Tween 20；150mM NaCl的阻断溶液阻断过夜，然后与稀释的单克隆抗Nef抗血清(1∶100)或抗E2抗血清(1∶1000)在阻断溶液中孵育1小时。在每个孵育步骤后，通过用TBS-0.1％Tween-20冲洗条带3次去除未结合蛋白。最初免疫球蛋白结合的检测是通过将条带与辣根过氧化物酶交联的抗鼠IgG(Labas，Estonia)进行孵育，然后采用一种化学发光检测系统来显色(AmershamPharmacia Biotech，United Kingdom)。

    结果在图4中显示。Nef蛋白的表达在板A显示，E2蛋白的表达在板B上显示。箭头表示Nef和E2蛋白的正确分子大小。E2d192-311+4GA的表达水平非常低，因此在图4中显示的印迹中未见。

    从质粒super6，super6wt，VI和VIwt表达的Nef的量(图4A中1-4道)是相当相似的(图4，板A，1至4道)。从质粒II(5道)中产生更少的蛋白。Nef蛋白的表达水平高于含有wtE2的载体(参照，1道与2道比较，3道和4道比较)。这是根据来自这些质粒的E2和E2d192-311+4GA蛋白的表达水平(图4，板B)。

    6.2.实例2

    在系列产物1和NNV中克隆和分析质粒的表达特性

    为了增加大肠杆菌中载体super6和super6wt的拷贝数，在这些载体中进行了进一步修饰。Tn903卡那霉素抗性基因，pMB1复制子和十个E2结合位点通过HindIII/Nhe1消化被去除，然后用逆转录酶病毒载体pBabe Neo的HindIII/Nhe1片段置换[Morgenstern，J.P.和Land，H.，Nucteic Acids Research 18(1990)3587-3596]。这个片段含有修饰的pMB1复制子和Tn5卡那霉素抗性基因，可在细菌中对质粒进行不严格的高拷贝数复制。新的质粒分别命名为产物1(图5)，产物1wt。重新将十个E2结合位点插回至产物1的CMV启动子上游的钝端Nhe1位点中不成功的结果是分别产生了新的载体NNV，仅有两个结合位点被整合进质粒中。

    另外十个E2结合位点从质粒pUC1910BS中被插入至新的载体中，刚好在E2表达基因盒的下游。这些新的载体命名为NNV-1和NNV-2(图6A)。为了用wtE2置换E2d192-311+4GA(删除了E3和E4ORF)，含有Bsp1201片段的E2d192-311+4GA编码序列被含有来自super6wt的类似Bsp1201片段的wtE2置换。产生的质粒分别命名为NNV-1wt和NNV-2wt(图6B)。NNV系列的载体中数字1或2标记了相对E2表达基因盒的10个E2结合位点区域的方向。

    来自NNV质粒的Nef蛋白，即NNV-1，NNV-2，NNVwt和NNV-2wt的表达特性，在通过电穿孔在1ig质粒的浓度下转染Jurkat细胞后，进行分析，并通过Western印迹基本上与如实例1中所描述的与来自super6和super6wt的Nef蛋白的表达特性进行比较。用来转染的Super6和super6wt的量分别为0.95和1ig。结果在图7中显示。

    NNV-1和NNV-2载体与质粒super6相似的可能性在图8的泳道1和2与泳道5的比较中是很明显的。这个结果同样适用于载体NNV-1wt，NNV-2wt和super6wt(泳道3和4与图7中泳道6比较)。根据以前的结果，表达wtE2的质粒较E2d192-311+4GA载体产生更多的Nef蛋白(在图7中泳道1和泳道3，泳道2与泳道4比较)。由此可见，并因为来自NNV-2wt的Nef表达稍高于NNV-1wt，载体NNV-2wt可选择进行进一步的检测。

    6.3实例3

    NNV-2wt的表达特性分析

    为了分析NNV-2wt的表达特性，4种不同的细胞系即Jurkat(人T细胞淋巴母细胞)、P815(小鼠肥大细胞瘤细胞)、CHO(中国仓鼠卵巢细胞)系和RD(人胚胎横纹肌肉瘤细胞)，通过电穿孔被转染，并分析它们Nef和E2的表达。为了显示由E2蛋白和E2寡聚化结合位点介导的转录激活和维持特性，缺少E2结合位点(图5)的产物1wt被用作对照。另外的对照质粒是质粒NNV-2wtFS，它与NNV-2wt的不同是在E2编码序列中有导入的移码，因此它不表达功能性E2蛋白。

    每个细胞系基本上通过实例1中所述的电穿孔用不同量的载体DNA被转染。大约转染后2天和5天测定时间点。分析的结果在图8至10中显示。

    Jurkat细胞用0.5μg或2μg NNV-2wt(图8中泳道1，2，8，和9)，等量的质粒NNV-2wtFS(图8中泳道3，4，10，和11)和产物1wt(图8中泳道5，6，12，和13)或仅用运载体(图8中泳道7和14)转染。转染后44小时(泳道1-7)和114小时(泳道8-14)测定时间点：Nef和E2蛋白的表达基本上如实例1中所述的Western印迹来分析。

    P815细胞用0.5μg或2μg NNV-2wt(图9中泳道1，2，8，和9)，等量的质粒NNV-2wtFS(图9中泳道3，4，10，和11)和产物1wt(图9中泳道5，6，12，和13)或仅用运载体(图9中的泳道7和14)转染。转染后45小时(泳道1-7)和119小时(泳道8-14)测定时间点：Nef蛋白的表达基本上用实例1中所述的Western印迹来分析。转染后119小时使用抗E2抗体的印迹未显示，因为没有检测到特异的信号。通常，在这些细胞中与E2蛋白表达水平相关的Nef蛋白表达水平，证实了这样的事实，E2蛋白的功能是激活转录，辅助质粒在增殖的细胞中维持一段更长的时间。

    CHO细胞用0.5μg或2μgNNV-2wt(图10中的泳道1，2，8和9)和等量的质粒NNV-2wtFS(图10中的泳道3，4，10，和11)和产物1wt(图10中的泳道5，6，12和13)或仅用运载体(图10中的泳道7和14)转染。转染后48小时(泳道1-7)和114小时(泳道8-14)测定时间点。Nef和E2蛋白的表达基本上如实例1中所述的Western印迹分析。

    RD细胞用0.5μg或2μg NNV-2wt(图11中的泳道1，2，8和9)和等量的质粒NNV-2wtFS(图11中的泳道3，4，10和11)和产物1wt(图11中的泳道5，6，12和13)或仅用运载体(图11中的泳道7和14)转染。转染后39小时(泳道1-7)和110小时(泳道8-14)测定时间点。Nef的表达水平基本上如实例中所述的Western印迹来分析。

    在所有四种细胞系中，在NNV-2wt较早的时间点(图8-11中的泳道1-7)和较晚的时间点(图8-11中的泳道8-14)测定的Nef蛋白表达水平高于对照质粒。从图8中泳道8和泳道10和12的比较，也从图8，9和10中的泳道9与泳道11和13的比较中很显然，NNV-2wt的优势在更晚的时间点上更为明显。

    对于NNV-2wt载体，这些质粒的RNA表达模式也可采用Northern分析法来分析[Alwine，J.C，等人，Proc Natl Acad Sci USA 74(1977)5350-5354]。为此目的，Jurkat和CHO细胞用2μg NNV-2wt转染。为了转染P815细胞，使用10μg NNV-2wt。基本上如实例1中所述进行转染。转染后48小时，采用RNAeasy试剂盒(Qiagen)提取总RNA，含有21μg(P815)，15μg(CHO)或10μg(Jurkat)RNA的标本在变性条件(含有20mM MOPS pH7.0；2mM NaOAc；1mM EDTA pH8.0；2.2M甲醛的1.3％琼脂糖凝胶)下通过电泳进行分析。电泳缓冲液含有除甲醛以外的相同成分。样品载入含有甲酰胺和甲醛的缓冲液中。电泳后，分离的RNA点样至HybondN+膜(Amersham Pharmacia Biotech，UnitedKingtom)上，与放射标记的nef编码序列，E2编码序列或整个载体探针杂交。用运载体转染的细胞的RNA作为对照。Northern印迹分析的结果在图12中显示。

    结果表明，没有互补mRNA以外的其他RNA种类从载体中表达，因为与nef和E2特异杂交(图12中泳道1-12与泳道13-18相比)相比用整个载体探针检测没有其他的信号。

    6.4实例4

    分析NNV-2wt与有丝分裂染色体的附着

    CHO细胞中NNV-2wt与有丝分裂染色体的附着通过原位杂交荧光(FISH)来分析[Tucker J.D.等人，见：J.E.Celis(主编)，细胞生物学：实验室手册，2卷，450-458页。Academic Press，Inc.New York，NY.1994.]。

    在用1μg NNV-2wt或用等摩尔量的对照质粒NNV-2wtFS和产物1wt(基本上如实例1中所述进行)通过电穿孔转染后36小时，培养物用秋水仙素(Gibco)处理以阻滞处于有丝分裂中期的细胞。简言之，细胞与加入至培养基中终浓度为0.1μg/ml的秋水仙素接触1-4小时以阻断细胞周期于有丝分裂期。被阻断的细胞通过胰蛋白酶处理后被回收，悬浮在0.075M KCl溶液中，在室温下孵育15分钟，固定在冰冷的甲醇冰醋酸(3∶1，体积/体积)中。为了进行原位杂交分析，分裂中期展开的染色体和分裂间期的核通过将细胞悬液滴落在湿载玻片上而被制备。从一个培养物中制备几个载玻片。

    杂交探针通过缺口翻译产生，使用生物素-16-dUTP作为标记，质粒产物1wt作为模板。一个典型的缺口翻译反应混合物包含缺口翻译缓冲液，未标记的dNTP，生物素-16-dUTP，和大肠杆菌DNA聚合酶。

    染色体制剂在70℃ 70％甲酰胺(pH7.0-7.3)中变性5分钟，然后立即在一系列漂洗中脱水(70％，80％，和96％冰冷的乙醇漂洗，每次3分钟)，和风干。杂交混合物(18μl每个载玻片)由2×SSC中的50％甲酰胺(1×SSC为0.15M NaCl加0.015M枸橼酸钠)，10％糖酐酯，150ng生物素标记质粒探针DNA和10μg鲱精运载体DNA组成。在70℃变性5分钟后，探针DNA用于每个载玻片上，固定在一个盖玻片下，37℃在湿盒中杂交过夜。45℃漂洗载玻片，3次更换2×SSC，nd 2×SSC含有0.1％IGEPAL CA-630(Sigma Chemical Co.)。在免疫荧光检测前，载玻片在PNM(含有5％脱脂奶粉和0.02％叠氮化钠的缓冲液[PN缓冲液(1升水中有25.2g Na2HPO4□7H2O，0.83g NaH2PO4·_□H2O和0.6ml IGEPAL CA-630])中预孵育5分钟。

    之后，用异硫氰酸荧光素(FITC)结合的extravidin检测探针。信号用生物素标记的抗亲和素抗体和第二轮的extravidin-FITC处理来放大。在每个步骤之间，载玻片在含有0.05％IGEPAL CA-630的PN缓冲液中室温下漂洗2×5分钟。染色体用亚丙基复染，在p-苯二胺antifade封固剂中被封固。

    载玻片用安装有合适滤镜装置的Olympus VANOX-S荧光显微镜下进行分析。

    结果在表1中显示。

    表1.NNV-2wt的染色体附着    培养物染色体上具有游离基因信号的分裂中期被分析的分裂中期    ％0.5μg NNV-2wt    11    158    70.5μg NNV-2wtFS    0    100    00.48μg 产物1wt    0    100    0运载体    0    100    0

    数据清晰表明E2蛋白及其结合位点是染色体附着所需的，因为仅NNV-2wt有而其他两种载体没有这种能力。

    6.5实例5

    细菌细胞增殖过程中NNV-2wt的稳定性

    检测了在细菌细胞增殖过程中NNV-2wt的稳定性。质粒NNV-2wt与感受态大肠杆菌细胞DH5α菌株混合[如Inoue，H.等人，Gene 96(1990)23-28所述制备]，在冰上孵育30分钟。随后，细胞悬液37℃热休克3分钟，紧接着在冰上迅速冷却。1毫升LB培养基加入至标本中，混合物在37℃孵育45分钟并猛烈振摇。最后，一部分细胞接种在含有LB培养基和50μg/ml卡那霉素的培养皿中。第二天，来自单个集落中的细胞被转移至含有相同培养基的新培养皿中。重复这个步骤直至已经生长了四代细菌，分析来自每代集落的质粒DNA。

    每代的一个集落用来接种在含有50μg/ml的2ml LB培养基中，然后在37℃猛烈振摇孵育过夜。收获细胞，用典型地煮沸裂解从细胞中提取质粒DNA。[Sambrook，S.等人，分子克隆，实验室手册。第二版，Cold Spring Harbor Laboratory Press，Cold Spring Harbor，New York]。标本用限制性内切酶Xba1(Fermentas，Lithuania)消化，用琼脂糖凝胶电泳分析，育用来转化的原始DNA比较。结果在图13中显示。

    如在图13中所见，载体在大肠杆菌细胞传代过程中是稳定的：与用来转化的DNA相比，没有观察到发生重排的集落(泳道9)。

    6.6实例6

    NNV-2wt在真核细胞中的稳定性

    作为非复制的游离基因元件的质粒NNV-2wt的稳定性也在真核细胞中被分析。为此目的，CHO和Jurkat细胞用2μg NNV-2wt转染。细胞的总DNA在转染后24，72或96小时被提取。简言之，细胞在20mMTris-HCl pH8.0；10mM EDTA pH8.0；100mM NaCl；0.2％SDS中；在200μg/ml蛋白酶K(Fermentas，Lithuania)的存在下被裂解。下一步，标本依次用苯酚和氯仿提取，用乙醇沉淀。核酸重新悬浮在10mMTris-HCl pH8.0；1mM EDTA pH8.0；20μg/ml RNase A(Fermentas，Lithuania)中，在37℃孵育1小时。最后DNA用醋酸铵和乙醇再沉淀，用70％漂洗，重新悬浮在10mM Tris-HCl pH8.0；1mM EDTA pH8.0中。标本用不同的限制性内切酶消化：用在质粒上具有两个识别位点的Eco811(Fermentas，Lithuania)，用不能切断NNV-2wt DNA的Hind111(Fermentas，Lithuania)，和用仅能消化在大肠杆菌细胞中合成的DNA的Dpn1(New England Biolabs，USA)。限制性DNA在TAE琼脂糖电泳中被分离，使用一个载体特异的放射标记探针通过Southern印迹分析[Southern，E.M.J.Mol.Biol.98(1975)503-517]。结果在图14中图解。Eco811消化的片段大小(图14中的泳道1，2和7)分别和标记物泳道相比很明显，在测定中没有检测到载体的排列。在Hind III(图14中的泳道3，4和8)或Hind111/Dpn1(图14中的泳道5，6和9)消化的情况下，在不同于标记物泳道的位置上没有观察到信号，表明没有观察到整合和/或复制反应。

    6.7实例7

    在存在人乳头状瘤病毒复制因子的情况下分析NNV-2wt的复制

    以前已经证明乳头状瘤病毒蛋白能够启动来自其他许多人和动物乳头状瘤病毒的含异种ori质粒的复制[Chiang，C.M.等人，Proc NatlAcad Sci USA 89(1992)5799-5803]。尽管NNV-2wt不含有完整的复制起始点，但检测到在1型人乳头状瘤病毒E1和E2蛋白的存在下复制是如何启动的。CHO细胞用1mg载体NNV-2wt，NNV-2wtFS或产物1单独或与4.5μg HPV-11 E1表达载体pMT/E1 HPV11或与相同量的pMT/E1 HPV11和4.5μg HPV-11 E2蛋白表达载体pMT/E2 HPV11一起转染，如图15上部所示。转染基本上如实例1中所述进行。E1和E2表达载体在以前被描述过(Chiang，C.M.等人，见前)。含有质粒HPV110RI的等摩尔量的HPV-11复制起始点用相同的表达载体转染作为一个阳性对照。

    低分子量DNA通过改良的Hirt裂解在转染后67小时被提取[Ustav等人，EMBO J 2(1991)449-457]。简言之，用PBS漂洗的细胞在冰上以1∶2的比例向皿中加入碱性裂解液I(50mM葡萄糖；25mM Tris-HCl，pH8.0；10mM EDTA，pH8.0)和II(0.2M NaOH；1％SDS)裂解5分钟。裂解物用0.5体积溶液III(醋酸钾和醋酸的混合物，钾为3M，醋酸为5M)中和。离心后，上清液用异丙醇沉淀，重新悬浮和在55℃孵育在20mM Tris-HCl pH8.0；10mM EDTA pH8.0；100mM NaCl；0.2％SDS中；在200μg/ml蛋白酶K(Fermentas，Lithuania)的存在下。下一步，标本依次用苯酚和氯仿提取，然后用乙醇沉淀。核酸重新悬浮在10mMTris-HCl pH8.0；1mM EDTA pH8.0；20μg/ml RNase A(Fermentas，Lithuania)中，并在65℃孵育30分钟。标本用线性化核酸内切酶(对载体是Nde1(Fermentas，Lithuania)；或对HPV110R1是Hind111(Fermentas，Lithuania))和Dpn1(New England Biolabs，USA)消化(断裂非复制的DNA)，然后基本上如前面所述使用载体特异的放射标记探针进行Southern印迹分析。对于杂交的阳性对照，可使用线性化载体和HPV11OR1的合适标记物(图15中泳道标记为M)。如在图15中所示结果所见，在任何载体质粒的情况下未检测到复制信号。

    6.8实例8

    分析分裂细胞中E2及其结合位点依赖的载体隔离功能

    如在前面已经描述的，反式的牛乳头状瘤病毒1型E2蛋白和其顺式的多结合位点都是必需的，足以进行游离基因基因元件的染色质附着。这种现象被认为在分裂细胞中病毒感染的过程中提供了分隔病毒基因组的机制[IIves，I.等人，J Virol.73(1999)4404-4412]。因为两种功能元件也包含在我们的载体系统中，本研究的目的是分析在分裂细胞群中维持转录活性载体元件的E2蛋白和寡聚化结合位点的重要性。

    为此目的，载体NNV-2wt和superGwt的Nef编码序列被来自载体pd1 EGFP-N1(Clontech Laborato-ries)的绿荧光蛋白(d1 EGFP)的不稳定形式的编码序列置换。因为这种蛋白的半衰期很短，只有1小时，它不能在细胞中积累，通过流式细胞仪检测到的d1 EGFP表达与这些细胞中存在的转录活性载体有关。

    从NNV-2wt中nef编码序列被去除，来自pd1EGF-N1的Sma1-Not1片段被插入而替代它。新的载体命名为2wtd1EGFP(图16)。相似的置换发生在super6wt中，分别产生gf1Obse2(图17)。限制性核酸内切酶Spe1的识别序列被导入至正好在十个E2BS上游的super6wt中的EcoRI位点中。载体gf1 Obse2来自这个载体中，通过将含有Nde1-Bst11071片段的Nef编码序列置换为含有来自2wtd1EGFP的片段的d1 EGFP编码序列，用相同的酶切断。

    也制备缺乏功能性E2编码序列或其结合位点的阴性对照质粒。在2wtd1 EGFP中通过将含有Bsp1201-Bsp1201的E2编码序列用来自质粒NNV-2wtFS的相似片段置换，移码被导入进E2编码序列中。得到的载体命名为2wtd1EGFPFS(图18)。为了构建对照质粒NNVd1 EGFP(图19)，来自2wtd1 EGFP的整个E2表达盒(以及细菌复制子)通过Bst1107和Nhe1的消化被去除。复制子从质粒产物1中作为HindIII(填入)-Nhe1片段被再构建。

    Jurkat细胞如实例1所述通过电穿孔用1μg载体2wtd1EGFP或等克分子量的质粒2wtd1EGFPFS，NNVd1EGFP，gf1Obse2或仅用运载体DNA转染。在转染后不同的时间点，等分的细胞悬液被收集来分析，此后标本用新鲜的培养基稀释。在每个时间点，细胞的总数以及d1EGFP表达细胞的数量通过流式细胞(Becton-Dickinson FACSCaliburSystem)来计数。根据这些数据，使用仅用运载体转染细胞作为背景荧光的阴性对照，计算d1EGFP表达细胞的百分比，标本中细胞总数和d1EGFP表达细胞数目的变化。计算细胞数目要考虑所进行的稀释。最后，根据细胞计数仪关于流速波动的技术资料来计算误差值。

    进行两个独立的试验。首先，在转染后第8天分析从质粒2wtd1EGFP，2wtd1EGFPFS和NNVd1EGFP表达的d1EGFP的维持性。在第二个试验中，在转染后第13天分析来自质粒2wtd1EGFP，2wtd1EGFPFS和gf1Obse2表达的d1EGFP的维持性。

    如在图20和21中很明显地，用任何载体或仅用运载体转染的细胞的生长速度没有差异。这意味着d1EGFP表达维持性的差异并不是由被转染载体本身对细胞分裂的影响所引起的。也在检测过程中，检测到细胞的对数生长，除了直至图20中显示实验中第二个时间点的时间周期以外。生长的这个滞后时间可能是由于细胞的电穿孔休克引起的，因为第一个时间点是在转染后已经19小时采样的。

    如在图22和23中所图解的，表达绿荧光蛋白的百分比在用每种质粒转染的所有细胞群中均减少，因为载体在细胞中不能复制。但在图表中可见，如果与2wtd1EGFP或gf10bse2相比，在对照载体中阳性细胞的部分下降更迅速。如果互相比较，gf10bse2明显优于2wtd1EGFP(图23)。在对照质粒2wtFSd1EGFP和NNVd1EGFP之间的维持性也具有显著的差异(图22)。

    如果数据表示为细胞群中d1EGFP表达细胞数目的变化，载体的这些差异更为明显(图24和25)。在检测过程中对照质粒阳性细胞的数目没有明显地改变。相比，使用2wtd1EGFP时，表达d1EGFP细胞的数目在转染后第一周内增加，比对照标本大约高5至10倍(图24)。在此时间点后，数目开始降低(图25)。使用gf10bse2载体时维持性的差异是最强地。在分析的时间内阳性细胞的数目持续增加。两周后它较2wtd1 EGFP转染的标本高6倍，较移码突变体转染的细胞群高45倍(图25)。

    数据清晰的表明本发明的载体系统具有一种以核锚着蛋白为基础的隔离的活性机制，即可促进其在增殖的细胞群中维持的牛乳头状瘤病毒1型E2蛋白及其结合位点作为一个转录活性元件。

    6.9实例9

    克隆AIRE基因进入SUPER6WT并在上皮细胞系中表达

    编码AIRE(AIRE＝自体免疫调节剂)蛋白的AIRE基因在常染色体遗传综合征APECED(自体免疫性多内分泌腺疾病念珠菌病外胚层营养障碍)中是被突变的。AIRE表达在胸腺髓质的少量上皮细胞中，和外周血和外周淋巴器官的树突状细胞中。因此APECED的治疗可通过将未突变的AIRE基因体外转移至外周血树突状细胞中，然后将纠正的树突状细胞回输给患者。为了检测这种可能性，人AIRE基因和同源鼠AIRE基因转移至COS-1细胞。

    为了将AIRE基因克隆进Super6wt中，制备载体的maxi-制剂。首先根据生产厂商的方案Super6wt的转染在TOP10细胞(Invitrogen的化学感受态大肠杆菌)中完成。简言之，细胞在冰上孵育30分钟，之后在+42℃的水浴中30秒进行热休克。然后细胞直接转移至冰上2分钟，在250μl SOC培养基(2％胰蛋白胨，0.5％酵母提取物，10mM NaCl，2.5mM KCl，10mM MgCl2，10mM MgSO4，20mM葡萄糖)中生长，+37℃振摇1小时。

    平板接种在LB板上完成，使用卡那霉素(50μg/ml)选择。对于maxiprep，集落转移至含有卡那霉素(50μg/ml)的150ml LB溶液中，+37℃生长过夜并振摇。Maxiprep制剂使用Qiagen′s质粒Maxi试剂盒根据生产厂商的方案来完成。

    BamHI和Sa11制性酶的消化用来检查载体。反应混合物在10μl的总体积中含有500ng Super6w，5U BamHI，5U Sa11，2μl 2XTANGO缓冲液(限制性酶和缓冲液均来自Fermentas)和无菌水。消化在+37℃进行1小时。

    被消化的载体用1X TAE缓冲液中的1μg/ml溴乙啡啶在1％琼脂糖凝胶上检查。

    为了将PCR扩增的AIRE基因和Aire基因片段克隆进Super6wt中，4μg Super6wt用10U Not1限制性酶(MB1 Fermentas，在2μl酶缓冲液中，加入无菌水至终体积20μl)消化。消化在+37℃进行1.5小时，之后1U ZIP酶(碱性磷酸酶)加入至反应混合物中继续孵育30分钟。完成ZIP酶的处理通过防止载体自我连接，复原为环状形式，从而加速AIRE基因向载体中的插入作用。消化后载体用GFXTM PCR DNA和凝胶条带纯化试剂盒(Amersham Pharmacia Biotech)纯化，并溶解为0.2微克/微升的浓度。

    人和鼠AIRE基因PCR产物也用Not1限制性酶消化。26μl PCR产物，3μl合适的酶缓冲液和10U Not1限制性酶(缓冲液和酶来自MB1Fermentas)用于消化。消化在+37℃进行2小时，之后消化的PCR产物被纯化，溶解在无菌水中至10μl的体积。

    PCR扩增和消化的人和鼠AIRE基因通过T4 DNA连接酶(MBIFermentas)连接于Super6wt。取出消化的插入DNA(总体积为10μl)，加入1.5μl连接酶缓冲液(MBI Fermentas)，5U T4 DNA连接酶和无菌水至终体积15μl。连接反应在+17℃反应过夜。

    连接反应后，取出10μl连接反应混合物根据生产厂商的方案转染进TOP10细胞中。细胞在冰上孵育30分钟，之后在+42℃水浴30秒进行热休克。然后细胞直接转移至冰上2分钟，生长在250μl SOC培养基(2％胰蛋白胨，0.5％酵母提取物，10mM NaCl，2.5mM KCl，10mM MgCl2，10mM MgSO4，20mM葡萄糖)中，+37℃振摇1小时。

    转染的细菌细胞被接种至LB卡那霉素平板中，第二天挑选集落至2ml含有卡那霉素的LB培养基(1％胰蛋白胨，0.5％酵母提取物，170mM NaCl)中，+37℃生长过夜。

    来自选择集落的Miniprep DNA制剂用Qiagen′s质粒Mini试剂盒纯化，溶解在50μl体积的无菌水中。插入物的存在和大小用Not1和BamHI消化来检查。取出10μl miniprep DNA来消化，加入5U Not1和5UBamHI酶，2ml R+酶缓冲液和无菌水至终体积20μl。消化在+37℃进行1小时。

    插入的方向用BamHI限制性酶来分析。取出10μl minprep DNA，加入5U BamH1，2μl BamHI缓冲液(MBI Fermentas)和无菌水至终体积20μl。消化在+37℃进行1小时，产物用1XTAE中的EtBr在1％琼脂糖凝胶上检查。

    根据这些结果，含有鼠AIRE基因的质粒和含有人AIRE基因的质粒被挑选出来，制备maxipreps。简言之，含有目的质粒的0.5ml大肠杆菌细胞悬液或miniprep培养物加入至含有卡那霉素(50μg/ml)的150ml LB培养基中，在+37℃生长过夜。Maxiprep DNA采用Qiagen’s质粒Maxi试剂盒制备。

    含有鼠AIRE基因的质粒被指定为pS6wtmAIRE，含有人AIRE基因的质粒指定为pS6wthAIRE。

    产生的载体从两个末端测序大约500bp以确认插入物的法向和正确性。测序采用双脱氧法用PE Biosystem′s Big Dye Terminator RR-mix进行，它含有用不同荧光标记物标记的四个不同的连接双脱氧核苷酸三磷酸盐。

    含有AIRE基因和AIRE基因片段的质粒被插入至选择的细胞系中，转染后用Western印迹来检查蛋白的表达。

    Cos-1细胞用胰蛋白酶-EDTA(Bio Whittaker Europe)溶液收获，以10×106细胞/ml悬浮在Dulbecco′s MEM(LifeTechnotogies)培养基中，取出250μl细胞悬液进行转染。Cos-1细胞的转染采用电穿孔使用2.5×106细胞，50μg鲑精DNA作为运载体和5μg合适的载体来进行。转染用pS6wthAIRE，pS6wtmAIRE，Super6wt，pCAIRE，psiAIRE和pCAIRES1-4来进行。pCAIRE和psiAIRE是阳性的人AIRE对照，pCAIRE S1-4是阳性的鼠AIRE对照，Super6wt是阴性对照。

    电穿孔采用Biorad′s基因脉冲仪使用电容960μFd，240V和1次脉冲来完成。脉冲后，细胞在室温下保留10分钟，加入400μl培养基。细胞转移至5ml培养基中，在1000rpm离心5分钟。细胞被平板接种，在+37℃，5％CO2生长3天。

    细胞用胰蛋白酶-EDTA收获并离心。然后细胞用500ml 1XPBS(0.14mM NaCl，2.7mM KCl，7.9μM Na2HPO4，1.5μM KH2PO4)冲洗一次。加入50μl PBS和100μl SDS加样缓冲液(5％巯基乙醇，16μM溴酚蓝，20μM二甲苯蓝，1.6μM Fi-coll 400)，细胞在+95℃加热10分钟。

    为了进行western印迹分析，在SDS电泳缓冲液(25mM Tris，250mM glysin，0.1％SDS)中用10％分离和5％成层胶制备SDS-PAGE。细胞标本和生物素化分子量标记物加样在胶上，在150V进行电泳1小时50分钟。用转移缓冲液中的冷却器，100V室温下1.5小时，将蛋白转移到硝化纤维膜上。

    膜在5％奶的TBS(0.05M Tris-Cl，0.15M NaCl，pH7.5)液中室温阻断30分钟。一抗混合物，以1∶100的稀释度在5％奶的TBS液中的抗AIRE6.1(人)和抗AIRE8.1(鼠)抗体加至膜上，在+4℃孵育过夜。膜用0.1％Tween的TBS液5分钟冲洗两次，一次用TBS冲洗5分钟。二抗，以1∶500的稀释度在5％奶的TBS液中的生物素化抗鼠IgG室温孵育1小时。冲洗膜，加入以1∶1000的稀释度在5％奶的TBS液中的辣根过氧化物酶亲和素D。膜在室温下孵育1小时，并冲洗。过氧化物酶的底物用5ml氯萘酚，20ml TBS和10μl过氧化氢来制备，并加至膜上。显色后用TBS冲洗膜并干燥。

    人AIRE的检测抗体(抗anti-AIRE6.1)在用pS6wthAIRE，pCAIRE和psiAIRE转染的标本中检测到AIRE蛋白的表达。鼠AIRE检测抗体在用pS6wtmAIRE和pCA1RE S1-4转染的细胞中同样也检测到鼠AIRE。阴性对照(Super6wt)显示没有AIRE/aire蛋白。

    6.10实例10：在用NNV-NEF构建物免疫的小鼠中检测对HIV.1NEF的细胞和体液免疫反应

    DNA免疫法

    为了研究发明载体体液免疫的诱导作用，使用5-8周龄的雄性和雌性BALB/c(H-2d)小鼠。为了进行DNA免疫，小鼠用1.2mg戊巴比妥(腹腔内注射)，使用DNA包被的金颗粒在剃毛的腹部皮肤上接种DNA。用Helios基因枪(Bio-Rad)采用300psi的压力进行接种。金颗粒直径为1μm，～1μg DNA/盒。小鼠用0，4或8μg/鼠的DNA总量免疫小鼠两次(在0天和第7天)。对照小鼠用没有nef基因，即NNV-δnef的8μg普通载体免疫。

    最后一次免疫后两周从小鼠的尾部获取血标本。在最后一次免疫后4周处死小鼠，血标本(100μl)收集至含有10μl 0.5M blotting(++vs.+)的Eppendorf管中，在ELISA(更高的OD)中，较多更高剂量的小鼠超过EDTA截止点。从这些每只鼠的标本中计算血白细胞的绝对数/ml。收集血清进行抗体测定，储存在-20℃。无菌条件下去除脾脏，称重，然后混匀为单细胞悬液，用于T，B和NK细胞测定和染色。

    检测发明载体的体液免疫原性

    为了通过Western印迹检测Nef特异抗体，用发明的载体构建物免疫的小鼠的血清标本以1∶100稀释在5％奶的TBS液中，用于重组HIV-1 Nef蛋白制备的硝化纤维条上。为了制备硝化纤维条，纯化的重组蛋白在含有1％SDS和1％2-巯基乙醇的标本缓冲液中煮沸，然后在10或12.5％聚丙烯酰胺凝胶上电泳，随后转移至0.45μm硝化纤维纸上。条带首先用2％BSA在5％脱脂奶-TBS中被阻断，然后用稀释的血清(1∶100)孵育过夜。孵育后，未结合的蛋白通过用TBS-0.05％Tween-20冲洗条带3次，用水冲洗两次而去除。冲洗后，条带用1∶500稀释的生物素化抗鼠IgG(Vector Laboratories，USA)探测2小时。进一步冲洗后，加入1∶1000稀释的辣根过氧化物酶-亲和素(VectorLaboratories，USA)1小时，再次冲洗条带，用过氧化氢酶底物4-氯-1-萘酚(Sigma，USA)检测结合的抗体。

    血清也在ELISA中检测以确定由每种构建物诱导的准确的抗体效价。Nef抗体ELISA如以前所述(Thtinen等人，2001)进行。简言之，Nunc Maxi Sorp平板用50ng Nef(isolate HAN)包被，用磷酸盐缓冲盐水(PBS)中的2％BSA阻断，1∶100至1∶25000稀释度的血清加入至相似的孔中，孵育过夜。大量冲洗后，加入二抗，过氧化物酶结合的抗鼠IgG或IgM(DAKO)，平板孵育2小时，然后冲洗。磷酸盐-柠檬酸盐缓冲液中底物(2，2′-连氮基-双(3-乙基苯噻唑啉-6-磺酸，ABTS，Sigma)产生的颜色强度使用Labsys-tems Multiscan Plus ELISA-平板读数器在405nm测定。阳性抗体反应的光学密度截止值如下测定：

    截止值＝OD(x1 对照鼠血清)+3 SD.

    检测发明载体细胞免疫原性

    为了分析发明载体诱导细胞免疫的能力，进行T细胞和B细胞检测乙基细胞表面的染色。

    T细胞增殖测定。脾细胞被悬浮在终浓度1×106/ml添加了10％FCS(GibcoBRL)，1％青霉素-链霉素(GibcoBRL)和50μM β-巯基乙醇(Sigma)的RPMI-1640(GibcoBRL)中。细胞孵育在微量滴定板中，200μl/孔仅加入培养基或不同的刺激物。刺激物的终浓度为：刀豆凝集素A5μg/ml，HIV-Nef-蛋白，浓度为1和10μg/ml，和阴性对照抗原HIV-gag浓度为1和10μg/ml。所有反应进行四次。在孵育的第六天，每孔收集100μl上清液，储存在-80℃进行细胞因子测定。在收获前6小时，向每孔中加入1μCi3H-胸苷(Amersham Pharmacia Biotech)。收获细胞，在闪烁扫描计数器中测定掺入的放射活性(cpm)。如下计算刺激指数(S1)：

    S1＝平均测定cpm/平均培养基cpm.

    淋巴细胞活化。T和B细胞活化用抗CD3-FITC加抗CD69-PE(早期活化标记物)和抗CD19-FITC加抗CD69-PE抗体(所有来自Pharmingen)通过新鲜脾细胞的双重表面染色而检测。染色用流式细胞仪(FACScan，Becton Dickinson)分析。

    CTL测定。鼠脾细胞与固定的抗原递呈细胞(用MVA-HIV-nef或对照MVA-F6感染的P-815细胞)共培养5天，之后在标准的4小时51铬释放试验中测定[Hiserodt，J.等人，J Immunol 135(1995)53-59；Lagranderie，M.等人，J Vi-rol 71(1997)2303-2309)MVA-HIV-nef感染的或对照靶细胞。在CTL测定中特异性溶解10％或更多被认为是阳性的。

    细胞因子测定。为了分析是否小鼠发生了Th1型或Th2反应，从抗原刺激的细胞培养上清液中测定IFN-γ和IL-10。如上所述从抗原刺激的细胞中收集上清液。原炎性细胞因子TNF-α和IL-10在免疫的小鼠血清中被测定。用市售的ELISA试剂盒(Quantikine，R&D Systems)测定所有的细胞因子。

    自发的增殖。自发的脾细胞增殖通过在培养基中培养的细胞对3H-胸苷的摄取仅测定6天。

    抗双链(ds)DNA抗体。在免疫小鼠，阳性对照小鼠(mrl/lpr，Dr.GeneShearer惠赠，NIH，USA)和正常小鼠的血清中测定dsDNA抗体。抗体在多聚L-赖氨酸结合的λ噬菌体dsDNA上用ELISA检测。结果在表2和3中显示。

    表2显示了用HIV-Nef质粒DNA免疫的小鼠的全部免疫学结果。尽管用来体外T细胞刺激的HIV-1 Nef重组蛋白可在每个免疫组中诱导细胞的一些非HIV-特异性增殖。在用0.4μg质粒(均数SI＝72.2)免疫小鼠的均数SI与其他相比明显增加。而且，阴性对照蛋白HIV-gag不能诱导任何T细胞反应。仅有在具有nef特异性增殖的组中小鼠的T细胞也产生nef特异性的IFN-γ。没有免疫的小鼠有产生IL-10的细胞，显示在免疫小鼠中的T细胞反应是Th1型，不是Th2型。与T细胞反应相比，用较高浓度nef质粒DNA(8μg)免疫的小鼠与用0.4μg免疫的小鼠相比具有较强的B细胞反应：用更高剂量免疫的小鼠中的体液反应在最后一次免疫后3周已经可以检测到，但两者在Western印迹中检测到的反应都较强。检测到的抗体属于IgG类型，未检测到IgM反应。没有小鼠产生E2特异抗体。

    用0.4μg HIV-nef质粒DNA免疫的小鼠与其它组的免疫小鼠和正常小鼠(3.8×106/ml)相比外周血中白细胞的数目是增加的(6.38×106/ml)(表3)。与其它小鼠(9％和10％)相比，同样的小鼠具有两倍的活化T细胞(21％，CD3+CD69+)。这种结果与对HIV-Nef的阳性T细胞反应有关系(表2)，因为具有对Nef有阳性T细胞反应的小鼠在其脾脏中活化T细胞的数目也是增加的。表3的结果也显示与阳性对照血清(OD＝1,208)相比没有免疫小鼠形成抗dsDNA抗体，表明免疫没有副作用。

    表2

    小鼠        HIV-1  HIV-1  IFN-g  IL-10  HIV-1   E2

                nef    gag                  nef

                SI*   SI     Th1    Th2    Ab      Ab

    NNV-Nef8

    1           6      1      -      -      ++      -

    2           8      1      -      -      ++      -

    3           13     2      -      -      ++      -

    4           15     1      -      -      ++      -

    5           7      1      -      -      ++      -

    均数        9.8    1.2

    NNV-NEF0.4

    1           24     1      +      -      +       -

    2           112    1      +      -      +       -

    3           83     1      +      -      +       -

    4           73     1      +      -      +       -

    5           69     1      +      -      +

    均数        72.2   1

    NNV-ΔNef8

    1           6      1      -      -      -       -

    2           nt     nt     -      -      -       -

    3           11     1      -      -      -       -

    4           23     2      -      -      -       -

    5           12     1      -      -      -       -

    均数        13     1.25

    *SI＝刺激指数  nt＝未检测

    到

    -′，阴性

    +′，阳性

    +′+′，强阳性

    表3

    Mice   WBC        CD3   CD3+CD69+  CD19  CD19+CD69+  抗dsDNA

                      ％    ％         ％    ％          抗体

           ×106/ml  脾    脾         脾    脾          OD(1∶10稀释度)

    NM

    1                                                    0.355

    2                                                    0.255

    3                                                    0.231

    均数                                                 0.280

    NNV-Nef8

    1      5          nt    nt         nt    nt          0.387

    2      4.3        50    4          11    3           0.457

    3      4.9        57    4          15    4           0.514

    4      4.3        55    6          15    4           0.367

    5      5.1        54    5          7     0           0.478

    均数   4.72       54    4.75(9％)  12    2.75        0.441

    NNV-Nef0.4

    1      3.9        nt    nt         nt    nt          0.418

    2      8          41    9          18    5           0.263

    3      7.5        39    8          25    9           0.375

    4      5          46    9          16    6           0.285

    5      7.5        43    10         13    7           0.396

    均数   6.38       42.25 9(21％)    18    6.75        0.347

    NNV-ΔNef8

    1      4.5        61    4          9     2           0.413

    2      4.6        59    4          15    1           0.353

    3      3.8        50    6          17    5           0.382

    4      3.1        46    7          25    8           0.448

    5      3.5        nt    nt         nt    nt          0.501

    均数   3.9        54    5.25(10％) 16.5  4           0.419

    正常小鼠的平均WBC＝3.8×106/ml.

    nt，未检测到

    a-dsDNA阳性对照血清OD为1.208

    (1∶10稀释度)

    6.11.实例11：在HIV感染患者中原型HIV疫苗GTU-NEF的安全性和免疫原性

    NNV-2-Nef疫苗的生产(检查是否使用NNV-2或NNVwt-2)

    以生产许可号第LLDnro 756/30/2000(由Finnish National Agencyfor Medicines在21.12.2000公布)根据实例2制备研究性疫苗NNV-2-Nef。

    生产过程完全符合现行药品优良制造规范(cGMP)的要求，提供了适合用于临床I期和II期研究的质粒DNA制剂。生产过程包括四个步骤：

    a)建立母细胞库和工程细胞库

    b)发酵

    c)纯化

    d)无菌充填疫苗

    详细来说，NNV-2-Nef从大肠杆菌细菌中产生。根据特殊标准操作规范从纯培养和发布的研究细胞库中建立含有大肠杆菌DH5αT1噬菌体抵抗细胞株的母细胞库(MCBs)和工程细胞库(WCBs)。

    a)建立母细胞库和工程细胞库

    建立细胞库系统的示意步骤如下被图解说明：

    复苏一瓶用NNV-2-Nef质粒转化的研究细胞库[大肠杆菌DH5αT1噬菌体抵抗细胞株(Gibco RBL)。

    接种培养物在限制性Luria Bertani培养基-平板(含有25μg/ml卡那霉素)中

    37℃孵育过夜(14-16h)。

    从平板中选择单个集落，接种至50ml限制性Luria Bertani培养基(含有25μg/ml卡那霉素)中

    37℃孵育过夜(14-16h)

    测量细菌培养物的光密度(OD600＝2.0-6.0)

    向细菌培养物中添加甘油

    将培养物-甘油混合物分成等分

    标记和储存母细胞库

    在相同的图表之后，使用一瓶母细胞库作为起始物质建立工程细胞库。对MCB和WCB进行的常规检测为：微生物特性，没有污染，通过影印培养法评价质粒的稳定性和质粒的特性(限制性酶消化和测序)。

    b)发酵。在发酵中，用NNV-2-Nef(WCB)转化的DH5αT1噬菌体抵抗大肠杆菌株(Gibco RBL，UK)首先培养在平板上。在发酵反应器中实际发酵前，从平板中单个集落接种在100ml液体预培养中。在5L发酵罐(B.Braun Medical)中以批次进料系统为基础进行发酵，之后收获细胞。1升培养基组合物含有7g酵母提取物，8g来自大豆粉的蛋白胨，10g NaCl，800ml注射用水(WFI)，1N NaOH，pH7.0，卡那霉素50mg/ml(Sigma)，硅除泡剂(Merck)，1M K2PO4(Bio Whittaker)。

    在发酵运转的开始，通过采样管获取1ml标本，测定最初的细胞密度(OD600)。预培养用来接种发酵培养基。在发酵过程中，新鲜的培养基和1M钾磷酸盐缓冲液，pH6.5-7.3，被用泵加料进反应器中。培养基的添加可在被消耗前补充基本营养素，磷酸盐缓冲液可维持pH含量。当发酵过程持续大约5小时，在发酵作用结束(大约发酵10小时后)时，如上取出1ml标本，测定细胞密度。发酵后，培养基被离心(10,000rpm，30分钟，+4℃)，细菌团块(50-60g)被回收。

    c)纯化。用于纯化DNA的方法学根据QIAGEN加工规模技术(Qiagen质粒纯化手册11/98)。NN2-Nef采用下列的步骤纯化：

    将细菌团块再悬浮在重悬浮缓冲液(100-150ml，RT)中

    用裂解缓冲液(100-150ml，5分钟，RT)裂解

    用中和缓冲液(100-150ml，+4℃)中和

    孵育(30分钟，+4℃)

    离心(10,000rpm，30分钟，+4℃)

    过滤上清液(0.22微米)

    用内毒素清除缓冲液(60-90ml)去掉内毒素

    用平衡缓冲液(350ml，流速10ml/min)平衡超纯柱

    将裂解物装填至柱上(流速4-6ml/min)

    用冲洗缓冲液冲洗柱(3L，过夜，流速4-6ml/min)

    用洗脱缓冲液洗脱质粒DNA(400ml，流速3.1ml/min)

    过滤洗脱液(0.22微米)

    用异丙醇沉淀DNA

    离心(20000g，30分钟，4℃)

    纯化的质粒DNA

    用在纯化中的缓冲液如下。再悬浮缓冲液含有50mM Tris-Cl，pH8.0，加RNase A(50mg)；裂解缓冲液为200mM NaOH；中和缓冲液为3M醋酸钾，pH5.5；内毒素清除缓冲液含有750mM NaCl，10％Triton X-100；50mM MOPS，pH7.0；平衡缓冲液含有750mM NaCl，50mM MOPS，pH7.0；冲洗缓冲液含有1M NaCl，50mM MOPS，pH7.0，15％异丙醇；和洗脱缓冲液含有1.6M NaCl，50mM MOPS，pH7.0，15％异丙醇。

    d)无菌充填

    代表终料的纯化DNA溶解在0.9％无菌生理盐水中，终浓度为1mg/ml，当天无菌过滤(0.22微米)。纯化的料是人工充填(充填体积0.5ml)于使用蒸汽灭菌Finnpipette和无菌无内毒素管口的Schott 1+型玻璃瓶中。充填NN2-Nef疫苗的瓶子立即被封闭，标记，根据特殊标准操作规范(SOP)包装。

    2.给予患者检测的疫苗

    接受高活性抗逆转录酶病毒治疗(HAART)的十个HIV-1感染患者用表达HIV-1Nef基因(Clade B)的试验性DNA疫苗NN2-Nef免疫。为了免疫，隔两周给予臀肌两次肌内注射。剂量为1和20微克/次注射。血标本在-4，0，1，2，4，8和12周采集。分析标本的体液(ELISA，Western印迹)和细胞介导的免疫反应(T细胞亚群，T细胞增殖，ELISPOT，细胞因子表达，细胞内细胞因子)。

    对参与研究的每个患者进行临床检查。临床检查包括患者问诊(既往史)和测量体重。心肺功能通过听诊和叩诊来检查，记录血压和心率。淋巴结，肝和甲状腺的增大通过触诊确定。

    对每个访诊者进行评价疫苗安全性的实验室检查。这些检查包括：

    血液学：计算红血细胞计数，血红蛋白，白细胞总数和分类，血小板计数，凝血酶原时间和位于基线水平的活化的部分凝血酶原激酶时间；平均红细胞体积和血红蛋白含量。

    免疫学：核和ds-DNA抗体。

    血清化学：总胆红素，碱性磷酸酶，SGOT/SLT或SGPT/ALT，血清肌酐，蛋白电泳，总血清胆固醇，甘油三酸酯。葡萄糖(基线水平)，钠，钾和钙。

    尿分析：量标蛋白，葡萄糖，酮，潜血，胆色素，pH，比重和尿沉淀物的显微镜检查(RBC，WBC，上皮细胞，细菌，管型)，当量标检测显示有一种或多种异常值时。

    病毒负载：增加超过1个对数10值应该在2周后进行确定性病毒负载测定。

    没有患者对疫苗接种产生自觉或他觉的不良反应。在接种时期内重复进行的临床化学实验记录表(详见材料和方法)中未观察到不良的实验室异常。

    进行下列的免疫学研究：

    淋巴细胞增殖试验(LPA)

    外周血单核细胞(PBMC)通过Ficoll-Hypaque密度梯度(Pharmacia)离心从肝素化的静脉血中分离，在添加5％备用的热灭活AB+血清(Sigma)、抗生素(100U/ml青霉素和100μg/ml；链霉素；Gibco)和L-谷氨酰胺(完全培养基，CM)的RPMI 1640培养基(Gibco)中重悬浮为1×106细胞/ml。然后在瓶底微量滴定板中建立四重培养(1×105 PBMC/孔)，细胞在存在或缺少以下刺激物的情况下孵育6天：rNef(0.2，1和5μg/ml)，GST(0.2，1和5μg/ml)，结核菌素的纯化蛋白衍生物(PPD，12.5μg/ml；Statens Seruminstitut)，白色念珠菌抗原(20μg/ml；GreerLaboratories)和植物血球凝集素(PHA；5μg/ml；Life Technologies)。孵育期的最后6小时，向培养物中加入3H-胸苷(1μCi/孔；Amersham)，收获细胞至玻璃纤维滤膜上，在γ-计数仪上测量掺入的放射活性。结果表示为δcpm(抗原存在时的cpm-没有抗原时的cpm)或刺激指数(存在抗原时的cpm/没有抗原时的cpm)。

    结果显示于图26和27中。在疫苗接种前，没有一个疫苗接种者显示对待测抗原，HIV-1 Nef抗原显示明显的T细胞增殖反应。相对比，接受1微克剂量待测疫苗组5个疫苗接种者中的2个(患者1和3)(图26)和接受20微克待测疫苗组5个中的2个(患者9和10)(图27)显示在首次疫苗接种后发生很强的T细胞增殖反应。第二次接种后，1微克组中的1个疫苗接种者(患者2)发生反应。

    IFN-γ测定

    疫苗诱导免疫反应的类型(Th1/Th2)通过测定抗原(rNef，rGST，PPD)或有丝分裂原(PHA)刺激PBMC后6天陈旧的培养上清液中释放的γ-干扰素(IFN-γ)进行评价。为了进行测定，使用市售的ELISA试剂盒(R&DQuantikine)。测定使用定量夹心酶免疫测定技术，其中IFN-γ特异的单克隆抗体已经被包被在微量板上。标准品和标本被移至孔中，固定的抗体可结合任何存在的IFN-γ。在洗掉任何未结合的物质后，IFN-γ的酶联多克隆特异抗体加入至孔中。在冲洗去掉任何未结合的抗体-酶试剂后，底物溶液加入至孔中，根据最初步骤中结合的细胞因子的量成比例的显色。终止显色，测量颜色的密度。

    #1患者的IFN-γ反应数据显示于图28。如所见到的，对rNef抗原反应的疫苗接种者，其显著的IFN-γ反应与T细胞增殖有关，表明在接种者中见到的反应事实上是TH1型。

    HIV-1感染的特点是较低的或总体上缺少对所有HIV蛋白的细胞介导免疫反应。结果显示在这些患者中使用异常低剂量的DNA疫苗NN2-Nef可能诱导强烈的CMI。使用的剂量对通常DNA疫苗所需的剂量来说是最小的。因此，例如Merch宣称最近他们的试验性HIV疫苗获得了良好的结果，但需要的剂量从1000至5000微克(1AV1报道，2002)。

    6.12实例12：构建表达EB病毒(EBV)EBNA-1蛋白并含有EBNA-1(FR元件)20个结合位点的质粒

    为了构建表达EB病毒(EBV)EBNA-1蛋白和含有EBNA-1(FRelement)的20个结合位点的质粒，BPV-1 E2结合位点首先用EBVEBNA-1结合位点(oriP没有DS元件)置换。质粒FRE2d1EGFP(图29)的构建通过隔离pEBO LPP质粒(图29A)的Xmi(Acc1/Eco321(EcoRV)DNA片段(钝末端具有Klenow酶)(片段含有EBNA-1的20个结合位点)，通过钝末端连接作用将其插入进s6E2d1EGFP(图29B)(钝末端具有Klenow酶)Spe1/Nhe1位点中。在进一步的试验中构建的质粒FRE2d1EGFP(图29)被用作阴性对照。它含有EBNA-1蛋白的结合位点，代替了BPV1 E2 10结合位点，表达E2，但不表达EBNA-1。

    下一步，在FRE2d1EGFP质粒中编码BPV-1 E2蛋白的序列被如下编码EBV EBNA-1蛋白的序列置换。pEBO LPP质粒的Xmi(Acc1)/EcoRI片段被隔离，钝末端具有Klenow酶，被插入进FRE2d1EGFP质粒(钝端连接Klenow酶)的Xba1/Xba1位点中。载体FRE2d1EGFP以前生长在缺少Dam甲基化的大肠杆菌菌株DH5α中，因为一个Xba1位点对甲基化是敏感的。构建的质粒FREBNAd1EGFP(图30)表达EBNA-1蛋白，含有EBNA-1的20个结合位点。

    为了表达，Jurkat、人胚胎肾细胞系293(ATCC CRL 1573)和鼠成纤维细胞系3T6细胞(ATCC CCL 96)被维持生长在添加了10％胎牛血清(FCS)的Iscove′s限制性Dulbecco′s培养基(IMDM)中。4百万个细胞(Jurkat)，75％汇合的培养皿(293)或的75％汇合培养皿(3T6)用来进行每一次转染，转染如下通过电穿孔进行。细胞通过离心收获(1000rpm，5分钟，20℃，Jouan CR 422)，重新悬浮在含有5mM Na-BES缓冲液(pH7.5)的完全培养基中。250μl细胞悬液的细胞与50μg运载体DNA(鲑精DNA)和1μg(在Jurkat和3T6的情况下)或5μg(在293的情况下)质粒DNA混合，Jurkat细胞在200V和1000μF下电穿孔，293细胞在170V和950μF，3T6细胞在230V和975μF。转染的Jurkat细胞接种在6-cm皿中，其中含有5ml培养基；1/3转染的293和3T6细胞接种在6-cm皿中，其中含有5ml培养基；2/3的细胞接种在10-cm皿中，其中含有10ml培养基。

    转染的细胞被分析d1EGFP蛋白(修饰的增强绿荧光蛋白)的表达。所有构建的质粒表达d1EGFP蛋白，通过使用流式细胞仪测量荧光而进行检测。因为d1EGFP蛋白的半衰期很短，因此它不能积累，这种蛋白的表达反应了细胞中存在转录活性质粒。使用Becton-Dickinson FACSCalibur系统。Jurkat细胞悬液的体积在每个时间点前被测量(大约每24个小时后)，如果体积小于5ml，添加损失体积的培养基。根据细胞悬液的密度，取出适当体积进行测定(1或2ml)，添加相同量的培养基。以后当计算稀释度时要考虑这一点。

    对于第一个时间点，6cm皿的293细胞悬浮在5ml培养基中进行测定。在以后的每一个时间点中，从10cm皿中取出一半细胞，悬浮在5ml培养基中，然后进行测定。适当体积被加入至细胞悬液的剩余部分中。对于第一个时间点，6cm皿的3T6细胞悬浮在1ml胰蛋白酶中，然后用100μl FCS灭活。对于此后的每个时间点，10cm皿的细胞悬浮在2ml胰蛋白酶中。1ml这种悬液如前所述被处理。加入9ml培养基至悬液的剩余部分。在测定前被分析的细胞立即从孵箱中取出。在每个时间点前确定适当的流速(500-1000细胞/秒)，使用仅以运载体DNA转染的细胞作为对照。使用三个不同的参数来测定细胞的大小，表面结构和荧光。

    结果在图31中以图表显示。仅用运载体DNA转染的细胞用来测量细胞系的自发荧光。1％这种自发荧光被认为是背景荧光，此后从d1EGFP荧光中减去。接收到的数据采用Microsoft Excel程序分析。

    表达d1EGFP细胞的百分比的计算，是使用仅用运载体转染的细胞作为背景荧光的阴性对照。如在图33中所示，两个载体以不同的动力学被维持在细胞中。

    表达d1EGFP细胞的数目的计算，要考虑稀释度，使用仅用运载体转染的细胞作为背景荧光的阴性对照。如在图53中所示，表达EBNA-1和携带EBNA-1特异的多聚结合位点的质粒非常有效地被维持在被转染的细胞中。转染后第一天，大约8×104细胞表达EGFP。在第8天，在维持的载体(FREBNAd1EGFP)中，表达质粒阳性d1EGFP细胞的数目增加10倍至8×105。缺少EBNA-1表达(FRE2d1 EGFP)的质粒或没有EBNA-1结合位点，质粒阳性细胞的数目仍然可以保持，或在许多情况下减少。这个事实反映了隔离/分隔EB病毒的机制。如果EBNA-1被表达，质粒携带了EBNA-1的结合位点，EBNA1和EBNA-1结合位点产生的维持和隔离功能对质粒提供了维持的功能。相同的机制和相同的成分实际上为EB病毒在生活周期的隐藏期提供了隔离功能。

    相似的结果也在人胚胎细胞系293中和鼠细胞系3T6(图34)中获得。作为293和3T6细胞维持性的对照，分别使用s6HPV11和2wtFS。

    6.13实例13：GTU-多基因载体的免疫原性

    GTU-1-多基因载体的免疫原性

    在实例12中制备的6个不同的多基因疫苗构建物，即GTU-1-RNT，GTU-1-TRN，GTU-1-RNT-CTL，GTU-1-TRN-CTL，GTU-1-TRN-optgag-CTL，和GTU-1-TRN-CTL-optgag载体的免疫原性在小鼠中被检测。载体被转化进TOP10或DHSα细胞中，采用市售的Qiagen柱来制备MegaPreps。用Pierce内毒素清除凝胶去掉内毒素。

    根据生产厂商(Bio-Rad)的说明书稍加修改，将待测微粒包被在1μm金颗粒上。Balb/c小鼠用Helios基因枪使用400psi的压力和0.5mg金/盒的量被免疫。小鼠在周0，1和3被免疫3次。小鼠在最后一次免疫后两周被处死。

    小鼠被分为6个检测组(5只鼠/组)，如下接受3×1μg DNA：

    Group1.GTU-1-RNT

    Group2.GTU-1-TRN

    Group3.GTU-1-RNT-CTL

    Group4.GTU-1-TRN-CTL

    Group5.GTU-1-TRN-optgag-CTL

    Group6.GTU-1-TRN-CTL-optgag

    Group7.对照小鼠，用不装填DNA的空金颗粒免疫

    每只鼠的尾血标本进行体液反应。首次免疫前从麻醉鼠中取出首次免疫前的标本。在第三次免疫前从麻醉鼠中取出第二个标本。处死时，全血标本用来进行白细胞计数，收集血清进行体液免疫性测定。

    使用标准方法用ELISA检测血标本中的抗体。Nunc Maxi Sorp板用100ng Nef，Rev，Tat，Gag，CTL或E2蛋白包被，阻断，向相同的孔中加入稀释度为1∶100的血清过夜孵育。冲洗后，用稀释(1∶500)的二抗，过氧化物酶交联的抗鼠IgG(DAKO)孵育板2小时。从磷酸盐-柠檬酸盐缓冲液中的底物(2，2′-连氮基-双(3-乙基苯噻唑啉-6-磺酸)(ABTS)产生的颜色强度在405nm使用Lab systems ELISA-平板读数仪进行测量。

    所有在载体在所有小鼠中均诱导Nef抗体，而没有小鼠显示有E2，CTL或Rev抗体(图35，36和表4)。一些用GTU-1-RNT或GTU-1-RNT-CTL免疫的小鼠也产生Tat抗体(图36和表4)。而且，用含有optgag序列的载体免疫的小鼠也产生Gag抗体，但构建物GTU-1-TRN-optgag-CTL是较构建物GTU-1-TRN-CTL-optgag更好的一种抗体诱导剂(图37和表4)。抗体主要诱导IgG1类，表明是通常在采用基因枪免疫所见的一种Th2型反应。下面显示的抗体测定是当小鼠被处死时收集的血清中进行。

    结果显示多基因构建物，可表达几种HIV基因成为融合蛋白，能诱导对大多数基因产物的免疫反应。但基因在多基因和相应蛋白在融合蛋白中的方向和顺序可极大地影响结果。因此，仅当Tat基因被置于融合蛋白一侧(具有RNT基序的载体)时可见对Tat的反应，而不是当Tat为氨基末端蛋白(具有TRN基序的载体)时。对Gag蛋白的反应仅见于使用载体时，其中Gag置于含有Th分支和CTL抗原决定簇的CTL之前。

                                         表4免疫IIIA小鼠ELISA结果(5个小鼠的平均OD值)免疫原组数Nef(ownprot)TatRevGagCTLGTU-1-RNT12.1941.3910.310.1550.36GTU-1-TRN21.8490.1970.2520.3020.38GTU-1-RNT-CTL31.9220.5550.2950.1540.439GTU-1-TRN-CTL41.6770.2110.2980.140.425GTU-1-TRN-optgag-CTL51.7220.1820.240.6670.381GTU-1-TRN-CTL-optgag60.547 0.2250.3220.2280.43对照70.3160.2260.2820.160.405免疫原组Nef反应的百分比Tat反应Rev反应Gag反应CTL反应GTU-1-RNT110080000GTU-1-TRN210000200GTU-1-RNT-CTL310040000GTU-1-TRN-CTL41000000GTU-1-TRN-optgag-CTL58000600GTU-1-TRN-CTL-optgag610000200

    6.14.实例14：表达NEF、REV和TAT的杂合蛋白在不同组合物中的表达(多调控)

    为了产生HIV多基因载体，具有多克隆位点的GTU-1载体(图38A)用作主链。完整的Nef，Rev和Tat编码序列通过聚合酶链式反应(PCR)扩增，并相互以不同的顺序附着在多调控(multireg)抗原编码可读框(Nef-Tat-Rev，Tat-Rev-Nef，Rev-Tat-Nef，Tat-Nef-Rev和Rev-Nef-Tat；分别为序列Id.No.1至5)上。序列被克隆至GTU-1载体的Bsp1191和Not1位点上。

    相似地，表达GTU-2和GTU-3载体的Nef蛋白(图38B和38C；NNV-2wt也见图6B)也用作产生HIV多基因载体的主链。另外，表达增强的绿荧光蛋白或d1EGFP的载体super6wt(super6wt d1 EGFP；图17和图38D)和使用EBNA-1蛋白的质粒及其结合位点(FREBNAd1EGFP；图38E)用作基因传递单位(GTU)的平台。为了控制“非-GTU”载体，表达Rev的适当的巨细胞病毒(CMV)载体NNV-Rev和含有d1EGFP质粒的质粒EBNA-1和E2BS(分别为NNV-Rev和E2BSEBNAd1EGFP；图38G和F)用作主链。

    为了制备不同的GTU-2和GTU-3载体(pNRT，pTRN，pRTN，pTNR和pRNT；和p2TRN和p2RNT；和p3RNT，分别为图39A-E，39F-G和39H)，载体GTI-2Nef和GTU-3Nef中的Nef基因分别被多调控抗原使用Nde1和Pag1位点取代。字母N(ef)，R(ev)和T(at)的序列在名称上显示了各自蛋白编码序列在多基因中的位置。也制备两个载体，含有置入Salt位点的IRES元件，跟随在多抗原或E2编码序列后(分别为pTRN-iE2-GMCSF和pTRN-iMG-GMCSF；图391和J)。后面的序列，控制鼠粒细胞-巨噬细胞集落刺激因子(GM-CSF)编码序列的翻译，与IRES一起被克隆进单个BspTI位点中。

    另外，一组载体，其中仅有调控蛋白的免疫显性部分用来构成聚合蛋白，它们被克隆进GTU-1(pMVINTR，pMV2NTR，pMV-1NHTR和pMV2N11TR；图40A-D)的Bsp1191和Not1位点中。在pMV2构建物的情况下，可被细胞内蛋白酶消化的连接子可分隔来自不同调控蛋白的多抗原的区域。

    进一步制备GTU-1，GTU-2和GTU-3载体，它们表达由gag基因编码的结构蛋白或由前述CTL抗原决定簇组成的人工聚合蛋白。编码的序列如Bsp119I和Not1消化的PCR产物被克隆进GTU-1载体(pCTL＝BNmCTL，pdgag＝pBNdgag，psynp17/24＝pBNsynp17+24，poptp17/24＝pBNoptp17/24；Figures 41A-D)中，在Nde1-Pac1片段中被转移至GTU-2(p2mCTL和p2optp17/24；图41E和F)和GTU-3(p3mCTL和p3optp17/24；图41G和H)中。

    被称为CTL(序列Id.No.10)的编码片段含有来自涉及许多以前鉴定的CTL抗原决定簇的pol和env区的片段。优化密码子选择以便仅涉及在人细胞中频繁使用的密码子。这种编码序列也含有可用于效力检测的被详细定性的鼠CTL抗原决定簇，和一个被抗鼠CD43抗体识别的抗原决定簇。还包括显性优势的SIV p27抗原决定簇以用于猕猴的效力研究。

    dgag含有Han2隔离体gag区的截断p17(在13aa起始)+p24+p2+p7(p1和p6除外)(序列Id.No.11)。synp17/24(序列Id.NO.12)编码Han2 HIV-1的p17+p24多肽。在人细胞中密码子选择被修饰为最佳。以前鉴定的富含AU的RNA不稳定元件也通过这种方式被去除。optp17/24编码(序列Id.NO.13)区非常类似于synp17/24，例外的是在此造成的两个同义突变不改变蛋白组成，但去掉了一个潜在的剪接受体位点。

    进一步建立了一组多HIV载体，含有多调控抗原和结构性抗原如单个聚合蛋白：pTRN-CTL，pRNT-CTL，pTRN-dgag，pTRN-CTL-dgag，pRNT-CTL-dgag，pTRN-dgag-CTL，pRNT-dgag-CTL，pTRN-optp-17/24-CTL，pTRN-CTL-optp17/24，和pRNT-CTL-optp17/24；p2TRN-optp17/24-CTL，p2RNT-optp17/24-CTL，p2TRN-CTL-optp17/24，p2RNT-CTL-optp17/24，p2TRN-CTL-optp17/24-iE2-mGMCSF，和p2RNT-CTL-optp17/24-iE2-mGMCSF；和p3TRN-CTL-optp17/24，p3RNT-CTL-optp17/24，p3TRN-CTL-optp17/24-iE2-mGMCSF，和p3RNT-CTL-optp17/24-iE2-mGMCSF，图42A-T。

    为了克隆，作为第一个步骤，终止密码子从调控多抗原编码序列中去除。然后结构性抗原编码序列通过克隆加入至框末端的Not1位点中以重构Not1位点。如果CTL和gag都被加入，第一个抗原编码序列不含有终止密码子。通常，在GTU-1的情况下进行克隆，以便分别制备GTU-2(p2…)和GTU-3(p3…)载体，使用Nde1和PagI的位点质粒GTU-2Nef和GTU-2Nef中的Nef基因被置换。但RNT-optp17/24-CTL抗原被直接构建进GTU-2载体中。

    使用Eco-1051和Not1的位点(super6wt-RNT-CTL-optp17/24和FREBNA-RNT-CTL-optp17/24；分别见图43V和42U)，HIV多抗原被克隆进载体super6wtd1EGFP和FREBNAd1EGFP，而不是dtEGFP。如果指定，IRES和鼠mGM-CSF被克隆进GTU-2和GTU-3载体中，位于E2编码序列之后，进入来自pTRN-iE2-mGMCSF(使用相同的限制性酶切断)的位点Mph11031和Eco911中。

    最后，对于应用EBNA-1的系统(含有EBNA-1，具有E2结合位点的表达基因盒)，“非GTU”对照载体E2BSEBNA-RNT-CTL-optp17/24(图42W)用如FREBNA-RNT-CTL-optp-17/24相同的方式制备。常规的表达多HIV抗原(图42D)的CMV载体pCMV-RNT-CTL-optp17/24的制备通过使用Nde1和PagI的位点从各自的GTU-1载体中克隆多HIV编码片段。

    6.15.实例15：仅携带调控蛋白免疫显性区的多调控抗原的表达特性

    1.多调控抗原的细胞内定位

    由发明的载体所表示的多调控抗原的细胞内定位通过使用基本上如实例4中所述的Nef，Rev和Tat蛋白的单克隆抗体在RD细胞中的原位免疫荧光来研究。结果总结在表5中，在图45中进行图解。由完整的Nef，Rev和Tat蛋白组成的所有抗原显示在细胞浆中的唯一定位。最初设计的变体蛋白称为N(ef)T(at)R(ev)，在Rev序列前具有移码，显示仅有核定位。携带调控蛋白截断序列的多调控抗原定位在细胞浆中。在这种情况下，经常可观察到象“包涵体”的明显结构。这种情况也同样发生在携带从pMV2载体中表达的蛋白酶位点的抗原中。但在这些情况下也检测到核中的蛋白(图45)。

    表5.多调控抗原中的细胞内定位

    构建物      抗-Nef          抗-Rev              抗-Tat

    空          阴性            阴性                阴性

    GTU-1

    pTRN        胞浆内强染色    胞浆内较好的染色    胞浆内阳性染色

    pNTR        核中强染色      阴性染色            核中阳性染色

    pRNT        胞浆内强染色    胞浆内良好染色      胞浆内良好染色

    pNRT        强，胞浆        胞浆内良好染色      胞浆内良好染色

    pRTN        强，胞浆        胞浆内良好染色      胞浆内阳性染色

    pTNR        强，胞浆        胞浆内良好染色      胞浆内良好染色

    pMV1NTR     强胞浆内        细胞浆+包涵体       细胞浆+包涵体

    pMV1N11TR   强              细胞浆+包涵体       细胞浆+包涵体

    pMV2NTR     核中和胞浆中的包涵体    核中和胞浆中的包涵体  核中和胞浆中的包涵体

    pMV2N11TR   在核和胞浆中仅有包涵体  核和胞浆中仅有包涵体  核和胞浆中仅有包涵体

    dgag和p17+p24蛋白的细胞内定位也在RD细胞中通过免疫荧光用单克隆抗p24抗体进行分析。根据Jurkat细胞中的Western印迹结果，不能检测到-dgag。但p17/24蛋白显示定位在浆膜上(图45)。CTL蛋白的定位未显示，因为没有合适的抗体可用。

    6.2实例15：从POL分析编码重组GAG抗原和细胞毒性T细胞抗原决定簇(CTL)的载体

    6.2.1.表达

    通过Western印迹分析表达CTL cds的载体或来自gag区的蛋白的表。如在图46A和46B中所示，CTL和dgag表达很清晰的在Cos-7细胞中被证实为预测大小的蛋白(分别为25kD和47kD)。Nef，Rev和Tat的共转染明显增强了dgag蛋白的表达。我们将其解释为REV蛋白对GAG mRNA表达的作用结果。我们也试图在Jurkat细胞中从GTU-1载体中表达dgag蛋白，但我们没能检测到任何信号(图46C)。密码子选择的分析显示对于人细胞wt GAG序列没有最佳的密码子选择。当最优化密码子选择时(构建物psynp17/24和poptp17/24)，强的p17+p24(40kD)蛋白表达在Jurkat细胞中被检测到(图46C和46D)。

    6.2.2.细胞内定位

    对于dgag和p17+p24蛋白，也在RD细胞中通过免疫荧光使用抗p24Mab分析细胞内定位。类似在Jurkat细胞中的Western印迹结果，不能检测到dgag。Thep17/24蛋白显示定位在浆膜中(图47)。CTL蛋白的定位由于缺少合适的抗体未被分析。

    6.16实例16：多调控+结构性蛋白作为多HIV抗原表达

    作为下一步，分析了由常规的多基因和gag编码的蛋白和/或作为单个多肽的CTL多抗原决定簇组成的多HIV抗原。在图48上，Western印迹显示了几种转染进Cos-7细胞中的多HIV抗原表达载体的表达。很明显地发现所有调控性+结构性多抗原的表达水平明显低于RNT或TRN蛋白。所有检测到的多HIV抗原在凝胶上的迁移为显著的条带，靠近预测大小为(73kD的多调控+CTL位置附近；大小为95kD的多调控+dgag和120kD的多调控+CTL+dgag)。类似于RNT和TRN，RNT-CTL的迁移较TRN-CTL更慢。在TRN和RNT构建物的情况下，多调控-CTL-dgag的组合也都显示较多调控-dgag-CTL更高的表达水平。

    多HIV抗原的更详细的分析在Jurkat细胞中进行。出于此原因，大多数构建的多HIV抗原(多调控+结构性)，包括多调控+CTL+optp17/24(预测大小为113kD)使用抗原不同部分的抗体通过Western印迹进行分析。在图49中显示的结果基本上类似于前面章节Cos-7细胞中所报道的结果。如在前面试验中所见，含有多抗原的dgag在Jurkat细胞中表达的杂交蛋白水平非常低。载体pTRNdgag中的表达在所有印迹中未检测到。在用从含有其他dgag的抗原表达载体转染的细胞中获取的材料上样的泳道中，在预测分子量大小的位置上仅在Nef单抗杂交的印迹上检测到非常微弱的信号。相反，如果dgag部分用密码子优化的p17/24替换，可观察到表达水平的增加。因为最初选择TRN-CTL-optp17/24和RNT-optp17/24来进一步分析，所有从所有含有这些表达基因盒的GTU载体中分析抗原的表达。也分析来自这些质粒的E2蛋白表达。结果在图50中被图解。在载体之间多抗原和E2蛋白两者的表达水平没有大的差异。E2的表达水平受IRES元件的影响不明显，该元件在质粒中紧随鼠GM-CSF基因，如E2一样由相同的mRNA翻译而来。

    6.17.实例17：抗原表达的维持

    在分裂细胞的群体中质粒的维持性可通过绿荧光蛋白和Nef蛋白作为标记物来证明。也分析从不同的GTU或非GTU载体中产生的RNT-CTL-optp17/24抗原表达的维持性。特别是，GTU-1(pRNT-CTL-optp17/24)，GTU-2(p2 RNT-CTL-optp17/24)，GTU-3(p3RNT-CTL-optp17/24)，super6wt(super6wt-RNT-CTL-optp17/24)载体的每一种都使用E2蛋白及其结合位点来发挥质粒维持活性。在这个试验中，也包括使用GTU载体FREBNA-RNT-CTL-optp17/24的EBNA-1及其结合位点。作为阴性对照，也使用含有EBNA-1表达基因盒与E2结合位点(E2BSEBNA-RNT-CTL-optp17/24)的混合配对的“非GTU”质粒。也使用常规的CMV表达载体pCMV-RNT-CTL-optp17/24。

    Jurkat细胞用等克分子数量的质粒转染，在转染后2天和5天使用抗Nef单克隆抗体来研究抗原表达。仅用运载体DNA的转染用作阴性对照。结果列于图51。

    如从图51中所见，在第二个时间点仅从GTU载体中检测到表达。FREBNA-RNT-CTL-optp17/24中的抗原表达在两个时间点都低，因为不像E2，EBNA-1不具有转录活化能力。

    多调控+结构性聚合蛋白的细胞内定位也通过基本上如实例4中所述在RD细胞中通过原位免疫荧光分析来研究。结果在图52中显示。

    在所有的结果中，使用抗Nef或抗p24单克隆抗体仅在细胞浆中检测到定位。根据Western印迹数据，含有optp17/24的蛋白的表达水平大大高于含dgag片段的抗原。

    在此引用的所有参考文献在此整体合并为参考文献，所有都是为了同样的目的，就像每一篇出版物或专利或专利申请书都特别地和单独地表示为可为了所有目的以其整体合并为参考文献。

    可对本发明进行许多修饰和变化，并不背离此精神和范围，这将对于本领域专业技术人员是很明显的。在此所述的特殊实施例仅以实例的方式提供，发明仅受附录的权利要求书的条款以及这些权利要求所被授权的等效物的所有范围限制。

                                序列表

    <110>FIT生物技术公司

    <120>新的表达载体及其应用

    <130>11041-006-228(2010149)

    <140>To be assigned

    <141>2002-05-03

    <150>FI 20010922

    <151>2001-05-03

    <160>52

    <170>PatentIn version 3.1

    <210>1

    <211>1260

    <212>DNA

    <213>人工序列

    <220>

    <223>含有Nef-Tat-Rev的杂交蛋白(NTR)

    <400>1

    atggtgggca agtggtcaaa atgtagtgga tggcctactg taagggaaag aatgaaacaa     60

    gctgagcctg agccagcagc agatggggtg ggagcagcat ctcgagacct ggaaaaacat    120

    ggagcaatca caagtagcaa tacagcaact aataacgctg cttgtgcctg gctagaagca    180

    caagaggaag aggaagtggg ttttccagtc agacctcagg tacctttaag accaatgact    240

    tacaagggag ctttagatct tagccacttt ttaaaagaaa aggggggact ggaagggtta    300

    atttactccc caaaaagaca agagatcctt gatctgtggg tctaccacac acaaggctac    360

    ttccctgatt ggcagaacta cacaccaggg ccaggggtca gatatccact gacctttgga    420

    tggtgcttca agttagtacc agttgaacca gatgaagaag agaacagcag cctgttacac    480

    cctgcgagcc tgcatgggac agaggacacg gagagagaag tgttaaagtg gaagtttgac    540

    agccatctag catttcatca caaggcccga gagctgcatc cggagtacta caaagactgc    600

    actagtgcag gaagaagcgg agacagcgac gaagagctcc tcaagacagt cagactcatc    660

    aagtttctct accaaagcaa ccctcctccc agcaacgagg ggacccgaca ggcccgaaga    720

    aatcgaagaa gaaggtggag agagagacag aggcagatcc gttcgattag tgagcggatt    780

    cttagcactt ttctgggacg acctgcggag cctgtgcctc ttcagctacc gccgcttgag    840

    agacttactc ttgattgtag cgaagattgt ggaaactctg ggacgcaggg ggtgggaagt    900

    cctcaagtat tggtggaatc tcctgcagta ttggagccag gaactaaaga aaagcttgag    960

    ccagtagatc ctagactaga gccctggaag catccaggaa gtcagcctag gaccccttgt   1020

    accaattgct attgtaaaaa gtgttgcctt cattgccaag tttgtttcac aagaaaaggc   1080

    ttaggcatct cctatggcag gaagaagcgg agacagcgac gaagagctcc tcaagacagt   1140

    cagactcatc aagtttctct accaaagcaa ccctcctccc agcaacgagg ggacccgaca   1200

    ggcccgaaga aatcgaagaa gaaggtggag agagagacag aggcagatcc gttcgattag   1260

    <210>2

    <211>1260

    <212>DNA

    <213>人工序列

    <220>

    <223>杂交蛋白含有Tat-Rev-Nef(TRN)

    <400>2

    atggagccag tagatcctag actagagccc tggaagcatc caggaagtca gcctaggacc     60

    ccttgtacca attgctattg taaaaagtgt tgccttcatt gccaagtttg tttcacaaga    120

    aaaggcttag gcatctccta tggcaggaag aagcggagac agcgacgaag agctcctcaa    180

    gacagtcaga ctcatcaagt ttctctacca aagcaaccct cctcccagca acgaggggac    240

    ccgacaggcc cgaagaaatc gaagaagaag gtggagagag agacagaggc agatccgttc    300

    gatactagtg caggaagaag cggagacagc gacgaagagc tcctcaagac agtcagactc    360

    atcaagtttc tctaccaaag caaccctcct cccagcaacg aggggacccg acaggcccga    420

    agaaatcgaa gaagaaggtg gagagagaga cagaggcaga tccgttcgat tagtgagcgg    480

    attcttagca cttttctggg acgacctgcg gagcctgtgc ctcttcagct accgccgctt    540

    gagagactta ctcttgattg tagcgaagat tgtggaaact ctgggacgca gggggtggga    600

    agtcctcaag tattggtgga atctcctgca gtattggagc caggaactaa agaaaagctt    660

    gtgggcaagt ggtcaaaatg tagtggatgg cctactgtaa gggaaagaat gaaacaagct    720

    gagcctgagc cagcagcaga tggggtggga gcagcatctc gagacctgga aaaacatgga    780

    gcaatcacaa gtagcaatac agcaactaat aacgctgctt gtgcctggct agaagcacaa    840

    gaggaagagg aagtgggttt tccagtcaga cctcaggtac ctttaagacc aatgacttac    900

    aagggagctt tagatcttag ccacttttta aaagaaaagg ggggactgga agggttaatt    960

    tactccccaa aaagacaaga gatccttgat ctgtgggtct accacacaca aggctacttc   1020

    cctgattggc agaactacac accagggcca ggggtcagat atccactgac ctttggatgg   1080

    tgcttcaagt tagtaccagt tgaaccagat gaagaagaga acagcagcct gttacaccct   1140

    gcgagcctgc atgggacaga ggacacggag agagaagtgt taaagtggaa gtttgacagc   1200

    catctagcat ttcatcacaa ggcccgagag ctgcatccgg agtactacaa agactgctga   1260

    <210>3

    <211>1260

    <212>DNA

    <213>人工序列

    <220>

    <223>含有Rev-Tat-Nef的杂交蛋白(RTN)

    <400>3

    atggcaggaa gaagcggaga cagcgacgaa gagctcctca agacagtcag actcatcaag     60

    tttctctacc aaagcaaccc tcctcccagc aacgagggga cccgacaggc ccgaagaaat    120

    cgaagaagaa ggtggagaga gagacagagg cagatccgtt cgattagtga gcggattctt    180

    agcacttttc tgggacgacc tgcggagcct gtgcctcttc agctaccgcc gcttgagaga    240

    cttactcttg attgtagcga agattgtgga aactctggga cgcagggggt gggaagtcct    300

    caagtattgg tggaatctcc tgcagtattg gagccaggaa ctaaagaaac tagtgagcca    360

    gtagatccta gactagagcc ctggaagcat ccaggaagtc agcctaggac cccttgtacc    420

    aattgctatt gtaaaaagtg ttgccttcat tgccaagttt gtttcacaag aaaaggctta    480

    ggcatctcct atggcaggaa gaagcggaga cagcgacgaa gagctcctca agacagtcag    540

    actcatcaag tttctctacc aaagcaaccc tcctcccagc aacgagggga cccgacaggc    600

    ccgaagaaat cgaagaagaa ggtggagaga gagacagagg cagatccgtt cgataagctt    660

    gtgggcaagt ggtcaaaatg tagtggatgg cctactgtaa gggaaagaat gaaacaagct    720

    gagcctgagc cagcagcaga tggggtggga gcagcatctc gagacctgga aaaacatgga    780

    gcaatcacaa gtagcaatac agcaactaat aacgctgctt gtgcctggct agaagcacaa    840

    gaggaagagg aagtgggttt tccagtcaga cctcaggtac ctttaagacc aatgacttac    900

    aagggagctt tagatcttag ccacttttta aaagaaaagg ggggactgga agggttaatt    960

    tactccccaa aaagacaaga gatccttgat ctgtgggtct accacacaca aggctacttc   1020

    cctgattggc agaactacac accagggcca ggggtcagat atccactgac ctttggatgg   1080

    tgcttcaagt tagtaccagt tgaaccagat gaagaagaga acagcagcct gttacaccct   1140

    gcgagcctgc atgggacaga ggacacggag agagaagtgt taaagtggaa gtttgacagc   1200

    catctagcat ttcatcacaa ggcccgagag ctgcatccgg agtactacaa agactgctga   1260

    <210>4

    <211>1260

    <212>DNA

    <213>人工序列

    <220>

    <223>含有Tat-Nef-Rev的杂交蛋白(TNR)

    <400>4

    atggagccag tagatcctag actagagccc tggaagcatc caggaagtca gcctaggacc     60

    ccttgtacca attgctattg taaaaagtgt tgccttcatt gccaagtttg tttcacaaga    120

    aaaggcttag gcatctccta tggcaggaag aagcggagac agcgacgaag agctcctcaa    180

    gacagtcaga ctcatcaagt ttctctacca aagcaaccct cctcccagca acgaggggac    240

    ccgacaggcc cgaagaaatc gaagaagaag gtggagagag agacagaggc agatccgttc    300

    gatactagtg tgggcaagtg gtcaaaatgt agtggatggc ctactgtaag ggaaagaatg    360

    aaacaagctg agcctgagcc agcagcagat ggggtgggag cagcatctcg agacctggaa    420

    aaacatggag caatcacaag tagcaataca gcaactaata acgctgcttg tgcctggcta    480

    gaagcacaag aggaagagga agtgggtttt ccagtcagac ctcaggtacc tttaagacca    540

    atgacttaca agggagcttt agatcttagc cactttttaa aagaaaaggg gggactggaa    600

    gggttaattt actccccaaa aagacaagag atccttgatc tgtgggtcta ccacacacaa    660

    ggctacttcc ctgattggca gaactacaca ccagggccag gggtcagata tccactgacc    720

    tttggatggt gcttcaagtt agtaccagtt gaaccagatg aagaagagaa cagcagcctg    780

    ttacaccctg cgagcctgca tgggacagag gacacggaga gagaagtgtt aaagtggaag    840

    tttgacagcc atctagcatt tcatcacaag gcccgagagc tgcatccgga gtactacaaa    900

    gactgcaagc ttgcaggaag aagcggagac agcgacgaag agctcctcaa gacagtcaga    960

    ctcatcaagt ttctctacca aagcaaccct cctcccagca acgaggggac ccgacaggcc   1020

    cgaagaaatc gaagaagaag gtggagagag agacagaggc agatccgttc gattagtgag   1080

    cggattctta gcacttttct gggacgacct gcggagcctg tgcctcttca gctaccgccg   1140

    cttgagagac ttactcttga ttgtagcgaa gattgtggaa actctgggac gcagggggtg   1200

    ggaagtcctc aagtattggt ggaatctcct gcagtattgg agccaggaac taaagaatag   1260

    <210>5

    <211>1260

    <212>DNA

    <213>人工序列

    <220>

    <223>含有Rev-Nef-Tat的杂交蛋白(RNT)

    <400>5

    atggcaggaa gaagcggaga cagcgacgaa gagctcctca agacagtcag actcatcaag     60

    tttctctacc aaagcaaccc tcctcccagc aacgagggga cccgacaggc ccgaagaaat    120

    cgaagaagaa ggtggagaga gagacagagg cagatccgtt cgattagtga gcggattctt    180

    agcacttttc tgggacgacc tgcggagcct gtgcctcttc agctaccgcc gcttgagaga    240

    cttactcttg attgtagcga agattgtgga aactctggga cgcagggggt gggaagtcct    300

    caagtattgg tggaatctcc tgcagtattg gagccaggaa ctaaagaaac tagtgtgggc    360

    aagtggtcaa aatgtagtgg atggcctact gtaagggaaa gaatgaaaca agctgagcct    420

    gagccagcag cagatggggt gggagcagca tctcgagacc tggaaaaaca tggagcaatc    480

    acaagtagca atacagcaac taataacgct gcttgtgcct ggctagaagc acaagaggaa    540

    gaggaagtgg gttttccagt cagacctcag gtacctttaa gaccaatgac ttacaaggga    600

    gctttagatc ttagccactt tttaaaagaa aaggggggac tggaagggtt aatttactcc    660

    ccaaaaagac aagagatcct tgatctgtgg gtctaccaca cacaaggcta cttccctgat    720

    tggcagaact acacaccagg gccaggggtc agatatccac tgacctttgg atggtgcttc    780

    aagttagtac cagttgaacc agatgaagaa gagaacagca gcctgttaca ccctgcgagc    840

    ctgcatggga cagaggacac ggagagagaa gtgttaaagt ggaagtttga cagccatcta    900

    gcatttcatc acaaggcccg agagctgcat ccggagtact acaaagactg caagcttgag    960

    ccagtagatc ctagactaga gccctggaag catccaggaa gtcagcctag gaccccttgt   1020

    accaattgct attgtaaaaa gtgttgcctt cattgccaag tttgtttcac aagaaaaggc   1080

    ttaggcatct cctatggcag gaagaagcgg agacagcgac gaagagctcc tcaagacagt   1140

    cagactcatc aagtttctct accaaagcaa ccctcctccc agcaacgagg ggacccgaca   1200

    ggcccgaaga aatcgaagaa gaaggtggag agagagacag aggcagatcc gttcgattag   1260

    <210>6

    <211>1164

    <212>DNA

    <213>人工序列

    <220>

    <223>含有Nef-Tat-Rev的免疫显性部分的蛋白(NTR)

    <400>6

    atgggatggc ctactgtaag ggaaagaatg aaacaagctg agcctgagcc agcagcagat     60

    ggggtgggag cagcatctcg agacctggaa aaacatggag caatcacaag tagcaataca    120

    gcaactaata acgctgcttg tgcctggcta gaagcacaag aggaagagga agtgggtttt    180

    ccagtcagac ctcaggtacc tttaagacca atgacttaca agggagcttt agatcttagc    240

    cactttttaa aagaaaaggg gggactggaa gggttaattt actccccaaa aagacaagag    300

    atccttgatc tgtgggtcta ccacacacaa ggctacttcc ctgattggca gaactacaca    360

    ccagggccag gggtcagata tccactgacc tttggatggt gcttcaagtt agtaccagtt    420

    gaaccagatg aagaagagaa cagcagcctg ttacaccctg cgagcctgca tgggacagag    480

    gacacggaga gagaagtgtt aaagtggaag tttgacagcc atctagcatt tcatcacaag    540

    gcccgagagc tgcatccgga gtactacaaa gactgcgctc tggccgccgt tgagccagta    600

    gatcctagac tagagccctg gaagcatcca ggaagtcagc ctaggacccc ttgtaccaat    660

    tgctattgta aaaagtgttg ccttcattgc caagtttgtt tcacaagaaa aggcttaggc    720

    atctcctatg gcaggaagaa gcggagacag cgacgaagag ctcctcaaga cagtcagact    780

    catcaagttt ctctaccaaa gcaaccctcc tcccagcaac gaggggaccc gacaggcccg    840

    aagaaatccg gactggccat cctgctgagc gacgaagagc tcctcaagac agtcagactc    900

    atcaagtttc tctaccaaag caaccctcct cccagcaacg aggggacccg acaggcccga    960

    agaaatcgaa gaagaaggtg gagagagaga cagaggcaga tccgttcgat tagtgagcgg   1020

    attcttagca cttttctggg acgacctgcg gagcctgtgc ctcttcagct accgccgctt   1080

    gagagactta ctcttgattg tagcgaagat tgtggaaact ctgggacgca gggggtggga   1140

    agtcctcaag tattggtgga atga                                          1164

    <210>7

    <211>1173

    <212>DNA

    <213>人工序列

    <220>

    <223>含有Nef-Tat-Rev的免疫显性部分的蛋白

    由蛋白酶位点分离(NTR)

    <400>7

    atgggatggc ctactgtaag ggaaagaatg aaacaagctg agcctgagcc agcagcagat     60

    ggggtgggag cagcatctcg agacctggaa aaacatggag caatcacaag tagcaataca    120

    gcaactaata acgctgcttg tgcctggcta gaagcacaag aggaagagga agtgggtttt    180

    ccagtcagac ctcaggtacc tttaagacca atgacttaca agggagcttt agatcttagc    240

    cactttttaa aagaaaaggg gggactggaa gggttaattt actccccaaa aagacaagag    300

    atccttgatc tgtgggtcta ccacacacaa ggctacttcc ctgattggca gaactacaca    360

    ccagggccag gggtcagata tccactgacc tttggatggt gcttcaagtt agtaccagtt    420

    gaaccagatg aagaagagaa cagcagcctg ttacaccctg cgagcctgca tgggacagag    480

    gacacggaga gagaagtgtt aaagtggaag tttgacagcc atctagcatt tcatcacaag    540

    gcccgagagc tgcatccgga gtactacaaa gactgcgctc tggccttcaa gcgggttgag    600

    ccagtagatc ctagactaga gccctggaag catccaggaa gtcagcctag gaccccttgt    660

    accaattgct attgtaaaaa gtgttgcctt cattgccaag tttgtttcac aagaaaaggc    720

    ttaggcatct cctatggcag gaagaagcgg agacagcgac gaagagctcc tcaagacagt    780

    cagactcatc aagtttctct accaaagcaa ccctcctccc agcaacgagg ggacccgaca    840

    ggcccgaaga aatccgtacg ggagaagcgg ctgctgagcg acgaagagct cctcaagaca    900

    gtcagactca tcaagtttct ctaccaaagc aaccctcctc ccagcaacgaggggacccga     960

    caggcccgaa gaaatcgaag aagaaggtgg agagagagac agaggcagat ccgttcgatt   1020

    agtgagcgga ttcttagcac ttttctggga cgacctgcgg agcctgtgcc tcttcagcta   1080

    ccgccgcttg agagacttac tcttgattgt agcgaagatt gtggaaactc tgggacgcag   1140

    ggggtgggaa gtcctcaagt attggtggaa tga                                1173

    <210>8

    <211>1161

    <212>DNA

    <213>人工序列

    <220>

    <223>含有Nef-Tat-Rev调节蛋白的免疫显性部分的蛋白，从Nef的aal(N11TR)

    <400>8

    atgtggccta ctgtaaggga aagaatgaaa caagctgagc ctgagccagc agcagatggg     60

    gtgggagcag catctcgaga cctggaaaaa catggagcaa tcacaagtag caatacagca    120

    actaataacg ctgcttgtgc ctggctagaa gcacaagagg aagaggaagt gggttttcca    180

    gtcagacctc aggtaccttt aagaccaatg acttacaagg gagctttaga tcttagccac    240

    tttttaaaag aaaagggggg actggaaggg ttaatttact ccccaaaaag acaagagatc    300

    cttgatctgt gggtctacca cacacaaggc tacttccctg attggcagaa ctacacacca    360

    gggccagggg tcagatatcc actgaccttt ggatggtgct tcaagttagt accagttgaa    420

    ccagatgaag aagagaacag cagcctgtta caccctgcga gcctgcatgg gacagaggac    480

    acggagagag aagtgttaaa gtggaagttt gacagccatc tagcatttca tcacaaggcc    540

    cgagagctgc atccggagta ctacaaagac tgcgctctgg ccgccgttga gccagtagat    600

    cctagactag agccctggaa gcatccagga agtcagccta ggaccccttg taccaattgc    660

    tattgtaaaa agtgttgcct tcattgccaa gtttgtttca caagaaaagg cttaggcatc    720

    tcctatggca ggaagaagcg gagacagcga cgaagagctc ctcaagacag tcagactcat    780

    caagtttctc taccaaagca accctcctcc cagcaacgag gggacccgac aggcccgaag    840

    aaatccggac tggccatcct gctgagcgac gaagagctcc tcaagacagt cagactcatc    900

    aagtttctct accaaagcaa ccctcctccc agcaacgagg ggacccgaca ggcccgaaga    960

    aatcgaagaa gaaggtggag agagagacag aggcagatcc gttcgattag tgagcggatt   1020

    cttagcactt ttctgggacg acctgcggag cctgtgcctc ttcagctacc gccgcttgag   1080

    agacttactc ttgattgtag cgaagattgt ggaaactctg ggacgcaggg ggtgggaagt   1140

    cctcaagtat tggtggaatg a                                             1161

    <210>9

    <211>1170

    <212>DNA

    <213>人工序列

    <220>

    <223>由蛋白酶位点分离(N11TR)的含有调节蛋白Nef-Tat-Rev的免疫显性部分的蛋白Nef的aal

    <400>9

    atgtggccta ctgtaaggga aagaatgaaa caagctgagc ctgagccagc agcagatggg     60

    gtgggagcag catctcgaga cctggaaaaa catggagcaa tcacaagtag caatacagca    120

    actaataacg ctgcttgtgc ctggctagaa gcacaagagg aagaggaagt gggttttcca    180

    gtcagacctc aggtaccttt aagaccaatg acttacaagg gagctttaga tcttagccac    240

    tttttaaaag aaaagggggg actggaaggg ttaatttact ccccaaaaag acaagagatc    300

    cttgatctgt gggtctacca cacacaaggc tacttccctg attggcagaa ctacacacca    360

    gggccagggg tcagatatcc actgaccttt ggatggtgct tcaagttagt accagttgaa    420

    ccagatgaag aagagaacag cagcctgtta caccctgcga gcctgcatgg gacagaggac    480

    acggagagag aagtgttaaa gtggaagttt gacagccatc tagcatttca tcacaaggcc    540

    cgagagctgc atccggagta ctacaaagac tgcgctctgg ccttcaagcg ggttgagcca    600

    gtagatccta gactagagcc ctggaagcat ccaggaagtc agcctaggac cccttgtacc    660

    aattgctatt gtaaaaagtg ttgccttcat tgccaagttt gtttcacaag aaaaggctta    720

    ggcatctcct atggcaggaa gaagcggaga cagcgacgaa gagctcctca agacagtcag    780

    actcatcaag tttctctacc aaagcaaccc tcctcccagc aacgagggga cccgacaggc    840

    ccgaagaaat ccgtacggga gaagcggctg ctgagcgacg aagagctcct caagacagtc    900

    agactcatca agtttctcta ccaaagcaac cctcctccca gcaacgaggg gacccgacag    960

    gcccgaagaa atcgaagaag aaggtggaga gagagacaga ggcagatccg ttcgattagt   1020

    gagcggattc ttagcacttt tctgggacga cctgcggagc ctgtgcctct tcagctaccg   1080

    ccgcttgaga gacttactct tgattgtagc gaagattgtg gaaactctgg gacgcagggg   1140

    gtgggaagtc ctcaagtatt ggtggaatga                                    1170

    <210>10

    <211>663

    <212>DNA

    <213>人工序列

    <220>

    <223>含有细胞毒性T-细胞表位Pol和Env基因的蛋白(CTL)

    <400>10

    atgatcaccc tgtggcagcg ccccctggtg gccctgatcg agatctgcac cgagatggag     60

    aaggagggca agatcagcaa gatcggcccc gccggcctga agaagaagaa gagcgtgacc    120

    gtgctggacg tgggcgacgc ctacttcagc gtgcccctgg ataaggactt ccgcaagtac    180

    accgccttca ccatccccag catctggaag ggcagccccg ccatcttcca gagcagcatg    240

    accaagaagc agaaccccga catcgtgatc taccagtaca tggacgacct gtacgtgccc    300

    atcgtgctgc ccgagaagga cagctggctg gtgggcaagc tgaactgggc cagccagatc    360

    tacgccggca tcaaggtgaa gcagctgatc ctgaaggagc ccgtgcacgg cgtgtacgag    420

    cccatcgtgg gcgccgagac cttctacgtg gacggcgccg ccaaccgcgc cggcaacctg    480

    tgggtgaccg tgtactacgg cgtgcccgtg tggaaggagg ccaccaccac cctggtggag    540

    cgctacctgc gcgaccagca gctgctgggc atctggggct gcgcctgcac cccctacgac    600

    atcaaccaga tgctgcgcgg ccctggccgc gccttcgtga ccatccgcca gggcagcctg    660

    tag                                                                  663

    <210>11

    <211>1266

    <212>DNA

    <213>人工序列

    <220>

    <223>截短的Gag蛋白序列(dgag)

    <400>11

    atgttagaca aatgggaaaa aattcggtta aggccagggg gaaagaaaaa atatcaatta     60

    aaacatatag tatgggcaag cagggagcta gaacgattcg cagttaatcc tggcctgtta    120

    gaaacatcag aaggctgtag acagataatg ggacagctac aaccgtccct tcagacagga    180

    tcagaagaac ttagatcatt atataataca gtagcaaccc tctattgtgt gcatcaaaag    240

    atagaggtaa aagacaccaa ggaagcttta gacaaggtag aggaagagca aaacaacagt    300

    aagaaaaagg cacagcaaga agcagctgac gcaggaaaca gaaaccaggt cagccaaaat    360

    taccctatag tgcaaaacct acagggacaa atggtacatc aggccatatc acctagaact    420

    ttaaatgcat gggtaaaagt agtggaagag aaggctttca gcccagaagt aatacccatg    480

    ttttcagcat tatcagaagg agccacccca caagatttaa acaccatgct aaacacagtg    540

    gggggacatc aagcagccat gcaaatgtta aaagaaacca tcaatgagga agctgcagaa    600

    tgggatagat tgcacccagt gcatgcaggg cctattgcac caggccagat gagagaacca    660

    aggggaagtg acatagcagg aactactagt acccttcagg aacaaatagg atggatgaca    720

    aataatccac ctatcccagt aggagaaata tataagagat ggataatcct gggattaaat    780

    aaaatagtaa gaatgtatag ccctaccagc attctggata taaaacaagg accaaaagaa    840

    ccctttagag attatgtaga ccggttctat aaaaccctaa gagccgagca agctacacag    900

    gaagtaaaaa attggatgac agaaaccttg ttggtccaaa atgcgaatcc agattgtaag    960

    actattttaa aagcattagg accagcagct acactagaag aaatgatgac agcatgtcag   1020

    ggagtggggg gacccggcca taaagcaaga gttttggctg aagcaatgag ccaagtaaca   1080

    ggttcagctg ccataatgat gcagagaggc aattttagga accaaagaaa gactgttaag   1140

    tgtttcaatt gtggcaaaga agggcacata gccagaaatt gcagggcccc taggaaaaag   1200

    ggctgttgga aatgtggaaa ggaaggacat caaatgaagg attgcacaga aagacaggct   1260

    aattag                                                              1266

    <210>12

    <211>1092

    <212>DNA

    <213>人工序列

    <220>

    <223>Gag基因的p17/24蛋白的合成编码序列(syn 17/24)

    <400>12

    atgggcgcaa gagcctccgt gctgagcggc ggagagctgg acaagtggga gaagatccgc     60

    ctgcgccccg gcggcaagaa gaagtaccag ctgaagcaca tcgtgtgggc cagccgcgag    120

    ctggagcgct tcgccgtgaa ccccggcctg ctcgagacca gcgaaggctg ccgccagatc    180

    atgggccagc tccagcccag cctccagacc ggcagcgagg agctgcgcag cctgtacaac    240

    accgtggcca ccctgtactg cgtgcaccag aagatcgagg tgaaggacac caaggaggcc    300

    ctggacaagg tggaggagga gcagaacaac agcaagaaga aggcccagca ggaggccgcc    360

    gacgccggca accgcaacca ggtgagccag aactacccca tcgtgcagaa cctgcagggc    420

    cagatggtgc accaggccat cagcccccgc accctgaacg cctgggtgaa ggtggtggag    480

    gagaaggcct tcagccccga ggtgatcccc atgttcagcg ccctgagcga gggcgctacc    540

    ccccaggacc tgaacaccat gctgaacacc gtgggcggcc accaggccgc catgcagatg    600

    ctgaaggaga ccatcaacga ggaggccgcc gagtgggacc gcctgcaccc cgtgcacgcc    660

    gggcccatcg cccccggcca gatgcgcgag ccccgcggca gcgacatcgc cggcaccacc    720

    agcaccctcc aggagcagat cggctggatg accaacaacc cccccatccc cgtgggcgag    780

    atctacaagc gctggatcat cctgggcctg aacaagatcg tccgcatgta cagccccacc    840

    agcatcctgg acatcaagca gggccccaag gagcccttcc gcgactacgt ggaccgcttc    900

    tacaagaccc tgcgcgccga gcaggccacc caggaggtga agaactggat gaccgagacc    960

    ctgctggtgc agaacgccaa ccccgactgc aagaccatcc tcaaggccct gggacccgcc   1020

    gccaccctgg aggagatgat gaccgcctgc caaggcgtgg gcggccccgg ccacaaggcc   1080

    cgcgtgctgt ga                                                       1092

    <210>13

    <211>1092

    <212>DNA

    <213>人工序列

    <223>用于在真核细胞表达的最好的Gag基因的p17/24蛋白的合成编码序列(optp17/24)

    <400>13

    atgggcgcaa gagcctccgt gctgagcggc ggagagctgg acaagtggga gaagatccgc     60

    ctgcgccccg gcggcaagaa gaagtaccag ctgaagcaca tcgtgtgggc cagccgcgag    120

    ctggagcgct tcgccgtgaa ccccggcctg ctcgagacca gcgaaggctg ccgccagatc    180

    atgggccagc tccagcccag cctccagacc ggcagcgagg agctgcgcag cctgtacaac    240

    accgtggcca ccctgtactg cgtgcaccag aagatcgagg tgaaggacac caaggaggcc    300

    ctggacaagg tggaggagga gcagaacaac agcaagaaga aggcccagca ggaggccgcc    360

    gacgccggca accgcaacca agtcagccag aactacccca tcgtgcagaa cctgcagggc    420

    cagatggtgc accaggccat cagcccccgc accctgaacg cctgggtgaa ggtggtggag    480

    gagaaggcct tcagccccga ggtgatcccc atgttcagcg ccctgagcga gggcgctacc    540

    ccccaggacc tgaacaccat gctgaacacc gtgggcggcc accaggccgc catgcagatg    600

    ctgaaggaga ccatcaacga ggaggccgcc gagtgggacc gcctgcaccc cgtgcacgcc    660

    gggcccatcg cccccggcca gatgcgcgag ccccgcggca gcgacatcgc cggcaccacc    720

    agcaccctcc aggagcagat cggctggatg accaacaacc cccccatccc cgtgggcgag    780

    atctacaagc gctggatcat cctgggcctg aacaagatcg tccgcatgta cagccccacc    840

    agcatcctgg acatcaagca gggccccaag gagcccttcc gcgactacgt ggaccgcttc    900

    tacaagaccc tgcgcgccga gcaggccacc caggaggtga agaactggat gaccgagacc    960

    ctgctggtgc agaacgccaa ccccgactgc aagaccatcc tcaaggccct gggacccgcc   1020

    gccaccctgg aggagatgat gaccgcctgc caaggcgtgg gcggccccgg ccacaaggcc   1080

    cgcgtgctgt ga                                                       1092

    <210>14

    <211>1926

    <212>DNA

    <213>人工序列

    <220>

    <223>含有Tat-Rev-Nef和CTL(TRN-CTL)的杂交蛋白编码序列

    <400>14

    atggagccag tagatcctag actagagccc tggaagcatc caggaagtca gcctaggacc     60

    ccttgtacca attgctattg taaaaagtgt tgccttcatt gccaagtttg tttcacaaga    120

    aaaggcttag gcatctccta tggcaggaag aagcggagac agcgacgaag agctcctcaa    180

    gacagtcaga ctcatcaagt ttctctacca aagcaaccct cctcccagca acgaggggac    240

    ccgacaggcc cgaagaaatc gaagaagaag gtggagagag agacagaggc agatccgttc    300

    gatactagtg caggaagaag cggagacagc gacgaagagc tcctcaagac agtcagactc    360

    atcaagtttc tctaccaaag caaccctcct cccagcaacg aggggacccg acaggcccga    420

    agaaatcgaa gaagaaggtg gagagagaga cagaggcaga tccgttcgat tagtgagcgg    480

    attcttagca cttttctggg acgacctgcg gagcctgtgc ctcttcagct accgccgctt    540

    gagagactta ctcttgattg tagcgaagat tgtggaaact ctgggacgca gggggtggga    600

    agtcctcaag tattggtgga atctcctgca gtattggagc caggaactaa agaaaagctt    660

    gtgggcaagt ggtcaaaatg tagtggatgg cctactgtaa gggaaagaat gaaacaagct    720

    gagcctgagc cagcagcaga tggggtggga gcagcatctc gagacctgga aaaacatgga    780

    gcaatcacaa gtagcaatac agcaactaat aacgctgctt gtgcctggct agaagcacaa    840

    gaggaagagg aagtgggttt tccagtcaga cctcaggtac ctttaagacc aatgacttac    900

    aagggagctt tagatcttag ccacttttta aaagaaaagg ggggactgga agggttaatt    960

    tactccccaa aaagacaaga gatccttgat ctgtgggtct accacacaca aggctacttc   1020

    cctgattggc agaactacac accagggcca ggggtcagat atccactgac ctttggatgg   1080

    tgcttcaagt tagtaccagt tgaaccagat gaagaagaga acagcagcct gttacaccct   1140

    gcgagcctgc atgggacaga ggacacggag agagaagtgt taaagtggaa gtttgacagc   1200

    catctagcat ttcatcacaa ggcccgagag ctgcatccgg agtactacaa agactgcgcg   1260

    gccgtcatca ccctgtggca gcgccccctg gtggccctga tcgagatctg caccgagatg   1320

    gagaaggagg gcaagatcag caagatcggc cccgccggcc tgaagaagaa gaagagcgtg   1380

    accgtgctgg acgtgggcga cgcctacttc agcgtgcccc tggataagga cttccgcaag   1440

    tacaccgcct tcaccatccc cagcatctgg aagggcagcc ccgccatctt ccagagcagc   1500

    atgaccaaga agcagaaccc cgacatcgtg atctaccagt acatggacga cctgtacgtg   1560

    cccatcgtgc tgcccgagaa ggacagctgg ctggtgggca agctgaactg ggccagccag   1620

    atctacgccg gcatcaaggt gaagcagctg atcctgaagg agcccgtgca cggcgtgtac   1680

    gagcccatcg tgggcgccga gaccttctac gtggacggcg ccgccaaccg cgccggcaac   1740

    ctgtgggtga ccgtgtacta cggcgtgccc gtgtggaagg aggccaccac caccctggtg   1800

    gagcgctacc tgcgcgacca gcagctgctg ggcatctggg gctgcgcctg caccccctac   1860

    gacatcaacc agatgctgcg cggccctggc cgcgccttcg tgaccatccg ccagggcagc   1920

    ctgtag                                                              1926

    <210>15

    <211>1926

    <212>DNA

    <213>人工序列

    <220>

    <223>含有Rev-Nef-Tat和CTL(RNT-CTL)的杂交蛋白编码序列

    <400>15

    atggcaggaa gaagcggaga cagcgacgaa gagctcctca agacagtcag actcatcaag     60

    tttctctacc aaagcaaccc tcctcccagc aacgagggga cccgacaggc ccgaagaaat    120

    cgaagaagaa ggtggagaga gagacagagg cagatccgtt cgattagtga gcggattctt    180

    agcacttttc tgggacgacc tgcggagcct gtgcctcttc agctaccgcc gcttgagaga    240

    cttactcttg attgtagcga agattgtgga aactctggga cgcagggggt gggaagtcct    300

    caagtattgg tggaatctcc tgcagtattg gagccaggaa ctaaagaaac tagtgtgggc    360

    aagtggtcaa aatgtagtgg atggcctact gtaagggaaa gaatgaaaca agctgagcct    420

    gagccagcag cagatggggt gggagcagca tctcgagacc tggaaaaaca tggagcaatc    480

    acaagtagca atacagcaac taataacgct gcttgtgcct ggctagaagc acaagaggaa    540

    gaggaagtgg gttttccagt cagacctcag gtacctttaa gaccaatgac ttacaaggga    600

    gctttagatc ttagccactt tttaaaagaa aaggggggac tggaagggtt aatttactcc    660

    ccaaaaagac aagagatcct tgatctgtgg gtctaccaca cacaaggcta cttccctgat    720

    tggcagaact acacaccagg gccaggggtc agatatccac tgacctttgg atggtgcttc    780

    aagttagtac cagttgaacc agatgaagaa gagaacagca gcctgttaca ccctgcgagc    840

    ctgcatggga cagaggacac ggagagagaa gtgttaaagt ggaagtttga cagccatcta    900

    gcatttcatc acaaggcccg agagctgcat ccggagtact acaaagactg caagcttgag    960

    ccagtagatc ctagactaga gccctggaag catccaggaa gtcagcctag gaccccttgt   1020

    accaattgct attgtaaaaa gtgttgcctt cattgccaag tttgtttcac aagaaaaggc   1080

    ttaggcatct cctatggcag gaagaagcgg agacagcgac gaagagctcc tcaagacagt   1140

    cagactcatc aagtttctct accaaagcaa ccctcctccc agcaacgagg ggacccgaca   1200

    ggcccgaaga aatcgaagaa gaaggtggag agagagacag aggcagatcc gttcgatgcg   1260

    gccgtcatca ccctgtggca gcgccccctg gtggccctga tcgagatctg caccgagatg   1320

    gagaaggagg gcaagatcag caagatcggc cccgccggcc tgaagaagaa gaagagcgtg   1380

    accgtgctgg acgtgggcga cgcctacttc agcgtgcccc tggataagga cttccgcaag   1440

    tacaccgcct tcaccatccc cagcatctgg aagggcagcc ccgccatctt ccagagcagc   1500

    atgaccaaga agcagaaccc cgacatcgtg atctaccagt acatggacga cctgtacgtg   1560

    cccatcgtgc tgcccgagaa ggacagctgg ctggtgggca agctgaactg ggccagccag   1620

    atctacgccg gcatcaaggt gaagcagctg atcctgaagg agcccgtgca cggcgtgtac   1680

    gagcccatcg tgggcgccga gaccttctac gtggacggcg ccgccaaccg cgccggcaac   1740

    ctgtgggtga ccgtgtacta cggcgtgccc gtgtggaagg aggccaccac caccctggtg   1800

    gagcgctacc tgcgcgacca gcagctgctg ggcatctggg gctgcgcctg caccccctac   1860

    gacatcaacc agatgctgcg cggccctggc cgcgccttcg tgaccatccg ccagggcagc   1920

    ctgtag                                                              1926

    <210>16

    <211>2529

    <212>DNA

    <213>人工序列

    <220>

    <223>含有Tat-Rev-Nef和截短的蛋白(TRN-dgag)的杂交蛋白编码序列

    <400>16

    atggagccag tagatcctag actagagccc tggaagcatc caggaagtca gcctaggacc     60

    ccttgtacca attgctattg taaaaagtgt tgccttcatt gccaagtttg tttcacaaga    120

    aaaggcttag gcatctccta tggcaggaag aagcggagac agcgacgaag agctcctcaa    180

    gacagtcaga ctcatcaagt ttctctacca aagcaaccct cctcccagca acgaggggac    240

    ccgacaggcc cgaagaaatc gaagaagaag gtggagagag agacagaggc agatccgttc    300

    gatactagtg caggaagaag cggagacagc gacgaagagc tcctcaagac agtcagactc    360

    atcaagtttc tctaccaaag caaccctcct cccagcaacg aggggacccg acaggcccga    420

    agaaatcgaa gaagaaggtg gagagagaga cagaggcaga tccgttcgat tagtgagcgg    480

    attcttagca cttttctggg acgacctgcg gagcctgtgc ctcttcagct accgccgctt    540

    gagagactta ctcttgattg tagcgaagat tgtggaaact ctgggacgca gggggtggga    600

    agtcctcaag tattggtgga atctcctgca gtattggagc caggaactaa agaaaagctt    660

    gtgggcaagt ggtcaaaatg tagtggatgg cctactgtaa gggaaagaat gaaacaagct    720

    gagcctgagc cagcagcaga tggggtggga gcagcatctc gagacctgga aaaacatgga    780

    gcaatcacaa gtagcaatac agcaactaat aacgctgctt gtgcctggct agaagcacaa    840

    gaggaagagg aagtgggttt tccagtcaga cctcaggtac ctttaagacc aatgacttac    900

    aagggagctt tagatcttag ccacttttta aaagaaaagg ggggactgga agggttaatt    960

    tactccccaa aaagacaaga gatccttgat ctgtgggtct accacacaca aggctacttc   1020

    cctgattggc agaactacac accagggcca ggggtcagat atccactgac ctttggatgg   1080

    tgcttcaagt tagtaccagt tgaaccagat gaagaagaga acagcagcct gttacaccct   1140

    gcgagcctgc atgggacaga ggacacggag agagaagtgt taaagtggaa gtttgacagc   1200

    catctagcat ttcatcacaa ggcccgagag ctgcatccgg agtactacaa agactgcgcg   1260

    gccgtgttag acaaatggga aaaaattcgg ttaaggccag ggggaaagaa aaaatatcaa   1320

    ttaaaacata tagtatgggc aagcagggag ctagaacgat tcgcagttaa tcctggcctg   1380

    ttagaaacat cagaaggctg tagacagata atgggacagc tacaaccgtc ccttcagaca   1440

    ggatcagaag aacttagatc attatataat acagtagcaa ccctctattg tgtgcatcaa   1500

    aagatagagg taaaagacac caaggaagct ttagacaagg tagaggaaga gcaaaacaac   1560

    agtaagaaaa aggcacagca agaagcagct gacgcaggaa acagaaacca ggtcagccaa   1620

    aattacccta tagtgcaaaa cctacaggga caaatggtac atcaggccat atcacctaga   1680

    actttaaatg catgggtaaa agtagtggaa gagaaggctt tcagcccaga agtaataccc   1740

    atgttttcag cattatcaga aggagccacc ccacaagatt taaacaccat gctaaacaca   1800

    gtggggggac atcaagcagc catgcaaatg ttaaaagaaa ccatcaatga ggaagctgca   1860

    gaatgggata gattgcaccc agtgcatgca gggcctattg caccaggcca gatgagagaa   1920

    ccaaggggaa gtgacatagc aggaactact agtacccttc aggaacaaat aggatggatg   1980

    acaaataatc cacctatccc agtaggagaa atatataaga gatggataat cctgggatta   2040

    aataaaatag taagaatgta tagccctacc agcattctgg atataaaaca aggaccaaaa   2100

    gaacccttta gagattatgt agaccggttc tataaaaccc taagagccga gcaagctaca   2160

    caggaagtaa aaaattggat gacagaaacc ttgttggtcc aaaatgcgaa tccagattgt   2220

    aagactattt taaaagcatt aggaccagca gctacactag aagaaatgat gacagcatgt   2280

    cagggagtgg ggggacccgg ccataaagca agagttttgg ctgaagcaat gagccaagta   2340

    acaggttcag ctgccataat gatgcagaga ggcaatttta ggaaccaaag aaagactgtt   2400

    aagtgtttca attgtggcaa agaagggcac atagccagaa attgcagggc ccctaggaaa   2460

    aagggctgtt ggaaatgtgg aaaggaagga catcaaatga aggattgcac agaaagacag   2520

    gctaattag                                                           2529

    <210>17

    <211>3195

    <212>DNA

    <213>人工序列

    <220>

    <223>含有Tat-Rev-Nef CTL和截短的Gag蛋白(TRN-CTL-dgag)的杂交蛋白编码序列，

    <400>17

    atggagccag tagatcctag actagagccc tggaagcatc caggaagtca gcctaggacc     60

    ccttgtacca attgctattg taaaaagtgt tgccttcatt gccaagtttg tttcacaaga    120

    aaaggcttag gcatctccta tggcaggaag aagcggagac agcgacgaag agctcctcaa    180

    gacagtcaga ctcatcaagt ttctctacca aagcaaccct cctcccagca acgaggggac    240

    ccgacaggcc cgaagaaatc gaagaagaag gtggagagag agacagaggc agatccgttc    300

    gatactagtg caggaagaag cggagacagc gacgaagagc tcctcaagac agtcagactc    360

    atcaagtttc tctaccaaag caaccctcct cccagcaacg aggggacccg acaggcccga    420

    agaaatcgaa gaagaaggtg gagagagaga cagaggcaga tccgttcgat tagtgagcgg    480

    attcttagca cttttctggg acgacctgcg gagcctgtgc ctcttcagct accgccgctt    540

    gagagactta ctcttgattg tagcgaagat tgtggaaact ctgggacgca gggggtggga    600

    agtcctcaag tattggtgga atctcctgca gtattggagc caggaactaa agaaaagctt    660

    gtgggcaagt ggtcaaaatg tagtggatgg cctactgtaa gggaaagaat gaaacaagct    720

    gagcctgagc cagcagcaga tggggtggga gcagcatctc gagacctgga aaaacatgga    780

    gcaatcacaa gtagcaatac agcaactaat aacgctgctt gtgcctggct agaagcacaa    840

    gaggaagagg aagtgggttt tccagtcaga cctcaggtac ctttaagacc aatgacttac    900

    aagggagctt tagatcttag ccacttttta aaagaaaagg ggggactgga agggttaatt    960

    tactccccaa aaagacaaga gatccttgat ctgtgggtct accacacaca aggctacttc   1020

    cctgattggc agaactacac accagggcca ggggtcagat atccactgac ctttggatgg   1080

    tgcttcaagt tagtaccagt tgaaccagat gaagaagaga acagcagcct gttacaccct   1140

    gcgagcctgc atgggacaga ggacacggag agagaagtgt taaagtggaa gtttgacagc   1200

    catctagcat ttcatcacaa ggcccgagag ctgcatccgg agtactacaa agactgcgcg   1260

    gccgtcatca ccctgtggca gcgccccctg gtggccctga tcgagatctg caccgagatg   1320

    gagaaggagg gcaagatcag caagatcggc cccgccggcc tgaagaagaa gaagagcgtg   1380

    accgtgctgg acgtgggcga cgcctacttc agcgtgcccc tggataagga cttccgcaag   1440

    tacaccgcct tcaccatccc cagcatctgg aagggcagcc ccgccatctt ccagagcagc   1500

    atgaccaaga agcagaaccc cgacatcgtg atctaccagt acatggacga cctgtacgtg   1560

    cccatcgtgc tgcccgagaa ggacagctgg ctggtgggca agctgaactg ggccagccag   1620

    atctacgccg gcatcaaggt gaagcagctg atcctgaagg agcccgtgca cggcgtgtac   1680

    gagcccatcg tgggcgccga gaccttctac gtggacggcg ccgccaaccg cgccggcaac   1740

    ctgtgggtga ccgtgtacta cggcgtgccc gtgtggaagg aggccaccac caccctggtg   1800

    gagcgctacc tgcgcgacca gcagctgctg ggcatctggg gctgcgcctg caccccctac   1860

    gacatcaacc agatgctgcg cggccctggc cgcgccttcg tgaccatccg ccagggcagc   1920

    ctggcggccg tgttagacaa atgggaaaaa attcggttaa ggccaggggg aaagaaaaaa   1980

    tatcaattaa aacatatagt atgggcaagc agggagctag aacgattcgc agttaatcct   2040

    ggcctgttag aaacatcaga aggctgtaga cagataatgg gacagctaca accgtccctt   2100

    cagacaggat cagaagaact tagatcatta tataatacag tagcaaccct ctattgtgtg   2160

    catcaaaaga tagaggtaaa agacaccaag gaagctttag acaaggtaga ggaagagcaa   2220

    aacaacagta agaaaaaggc acagcaagaa gcagctgacg caggaaacag aaaccaggtc   2280

    agccaaaatt accctatagt gcaaaaccta cagggacaaa tggtacatca ggccatatca   2340

    cctagaactt taaatgcatg ggtaaaagta gtggaagaga aggctttcag cccagaagta   2400

    atacccatgt tttcagcatt atcagaagga gccaccccac aagatttaaa caccatgcta   2460

    aacacagtgg ggggacatca agcagccatg caaatgttaa aagaaaccat caatgaggaa   2520

    gctgcagaat gggatagatt gcacccagtg catgcagggc ctattgcacc aggccagatg   2580

    agagaaccaa ggggaagtga catagcagga actactagta cccttcagga acaaatagga   2640

    tggatgacaa ataatccacc tatcccagta ggagaaatat ataagagatg gataatcctg   2700

    ggattaaata aaatagtaag aatgtatagc cctaccagca ttctggatat aaaacaagga   2760

    ccaaaagaac cctttagaga ttatgtagac cggttctata aaaccctaag agccgagcaa   2820

    gctacacagg aagtaaaaaa ttggatgaca gaaaccttgt tggtccaaaa tgcgaatcca   2880

    gattgtaaga ctattttaaa agcattagga ccagcagcta cactagaaga aatgatgaca   2940

    gcatgtcagg gagtgggggg acccggccat aaagcaagag ttttggctga agcaatgagc   3000

    caagtaacag gttcagctgc cataatgatg cagagaggca attttaggaa ccaaagaaag   3060

    actgttaagt gtttcaattg tggcaaagaa gggcacatag ccagaaattg cagggcccct   3120

    aggaaaaagg gctgttggaa atgtggaaag gaaggacatc aaatgaagga ttgcacagaa   3180

    agacaggcta attag                                                    3195

    <210>18

    <211>3195

    <212>DNA

    <213>人工序列

    <220>

    <223>含有Rev-Nef-Tat，CTL和截短的Gag蛋白(RNT-CTL-dgag)的杂交蛋白编码序列

    <400>18

    atggcaggaa gaagcggaga cagcgacgaa gagctcctca agacagtcag actcatcaag     60

    tttctctacc aaagcaaccc tcctcccagc aacgagggga cccgacaggc ccgaagaaat    120

    cgaagaagaa ggtggagaga gagacagagg cagatccgtt cgattagtga gcggattctt    180

    agcacttttc tgggacgacc tgcggagcct gtgcctcttc agctaccgcc gcttgagaga    240

    cttactcttg attgtagcga agattgtgga aactctggga cgcagggggt gggaagtcct    300

    caagtattgg tggaatctcc tgcagtattg gagccaggaa ctaaagaaac tagtgtgggc    360

    aagtggtcaa aatgtagtgg atggcctact gtaagggaaa gaatgaaaca agctgagcct    420

    gagccagcag cagatggggt gggagcagca tctcgagacc tggaaaaaca tggagcaatc    480

    acaagtagca atacagcaac taataacgct gcttgtgcct ggctagaagc acaagaggaa    540

    gaggaagtgg gttttccagt cagacctcag gtacctttaa gaccaatgac ttacaaggga    600

    gctttagatc ttagccactt tttaaaagaa aaggggggac tggaagggtt aatttactcc    660

    ccaaaaagac aagagatcct tgatctgtgg gtctaccaca cacaaggcta cttccctgat    720

    tggcagaact acacaccagg gccaggggtc agatatccac tgacctttgg atggtgcttc    780

    aagttagtac cagttgaacc agatgaagaa gagaacagca gcctgttaca ccctgcgagc    840

    ctgcatggga cagaggacac ggagagagaa gtgttaaagt ggaagtttga cagccatcta    900

    gcatttcatc acaaggcccg agagctgcat ccggagtact acaaagactg caagcttgag    960

    ccagtagatc ctagactaga gccctggaag catccaggaa gtcagcctag gaccccttgt   1020

    accaattgct attgtaaaaa gtgttgcctt cattgccaag tttgtttcac aagaaaaggc   1080

    ttaggcatct cctatggcag gaagaagcgg agacagcgac gaagagctcc tcaagacagt   1140

    cagactcatc aagtttctct accaaagcaa ccctcctccc agcaacgagg ggacccgaca   1200

    ggcccgaaga aatcgaagaa gaaggtggag agagagacag aggcagatcc gttcgatgcg   1260

    gccgtcatca ccctgtggca gcgccccctg gtggccctga tcgagatctg caccgagatg   1320

    gagaaggagg gcaagatcag caagatcggc cccgccggcc tgaagaagaa gaagagcgtg   1380

    accgtgctgg acgtgggcga cgcctacttc agcgtgcccc tggataagga cttccgcaag   1440

    tacaccgcct tcaccatccc cagcatctgg aagggcagcc ccgccatctt ccagagcagc   1500

    atgaccaaga agcagaaccc cgacatcgtg atctaccagt acatggacga cctgtacgtg   1560

    cccatcgtgc tgcccgagaa ggacagctgg ctggtgggca agctgaactg ggccagccag   1620

    atctacgccg gcatcaaggt gaagcagctg atcctgaagg agcccgtgca cggcgtgtac   1680

    gagcccatcg tgggcgccga gaccttctac gtggacggcg ccgccaaccg cgccggcaac   1740

    ctgtgggtga ccgtgtacta cggcgtgccc gtgtggaagg aggccaccac caccctggtg   1800

    gagcgctacc tgcgcgacca gcagctgctg ggcatctggg gctgcgcctg caccccctac   1860

    gacatcaacc agatgctgcg cggccctggc cgcgccttcg tgaccatccg ccagggcagc   1920

    ctggcggccg tgttagacaa atgggaaaaa attcggttaa ggccaggggg aaagaaaaaa   1980

    tatcaattaa aacatatagt atgggcaagc agggagctag aacgattcgc agttaatcct   2040

    ggcctgttag aaacatcaga aggctgtaga cagataatgg gacagctaca accgtccctt   2100

    cagacaggat cagaagaact tagatcatta tataatacag tagcaaccct ctattgtgtg   2160

    catcaaaaga tagaggtaaa agacaccaag gaagctttag acaaggtaga ggaagagcaa   2220

    aacaacagta agaaaaaggc acagcaagaa gcagctgacg caggaaacag aaaccaggtc   2280

    agccaaaatt accctatagt gcaaaaccta cagggacaaa tggtacatca ggccatatca   2340

    cctagaactt taaatgcatg ggtaaaagta gtggaagaga aggctttcag cccagaagta   2400

    atacccatgt tttcagcatt atcagaagga gccaccccac aagatttaaa caccatgcta   2460

    aacacagtgg ggggacatca agcagccatg caaatgttaa aagaaaccat caatgaggaa   2520

    gctgcagaat gggatagatt gcacccagtg catgcagggc ctattgcacc aggccagatg   2580

    agagaaccaa ggggaagtga catagcagga actactagta cccttcagga acaaatagga   2640

    tggatgacaa ataatccacc tatcccagta ggagaaatat ataagagatg gataatcctg   2700

    ggattaaata aaatagtaag aatgtatagc cctaccagca ttctggatat aaaacaagga   2760

    ccaaaagaac cctttagaga ttatgtagac cggttctata aaaccctaag agccgagcaa   2820

    gctacacagg aagtaaaaaa ttggatgaca gaaaccttgt tggtccaaaa tgcgaatcca   2880

    gattgtaaga ctattttaaa agcattagga ccagcagcta cactagaaga aatgatgaca   2940

    gcatgtcagg gagtgggggg acccggccat aaagcaagag ttttggctga agcaatgagc   3000

    caagtaacag gttcagctgc cataatgatg cagagaggca attttaggaa ccaaagaaag   3060

    actgttaagt gtttcaattg tggcaaagaa gggcacatag ccagaaattg cagggcccct   3120

    aggaaaaagg gctgttggaa atgtggaaag gaaggacatc aaatgaagga ttgcacagaa   3180

    agacaggcta attag                                                    3195

    <210>19

    <211>3195

    <212>DNA

    <213>人工序列

    <220>

    <223>含有Tat-Rev-Nef、截短的Gag蛋白和CTL(TRN-dgag-CTL)的杂交蛋白

    <400>19

    atggagccag tagatcctag actagagccc tggaagcatc caggaagtca gcctaggacc     60

    ccttgtacca attgctattg taaaaagtgt tgccttcatt gccaagtttg tttcacaaga    120

    aaaggcttag gcatctccta tggcaggaag aagcggagac agcgacgaag agctcctcaa    180

    gacagtcaga ctcatcaagt ttctctacca aagcaaccct cctcccagca acgaggggac    240

    ccgacaggcc cgaagaaatc gaagaagaag gtggagagag agacagaggc agatccgttc    300

    gatactagtg caggaagaag cggagacagc gacgaagagc tcctcaagac agtcagactc    360

    atcaagtttc tctaccaaag caaccctcct cccagcaacg aggggacccg acaggcccga    420

    agaaatcgaa gaagaaggtg gagagagaga cagaggcaga tccgttcgat tagtgagcgg    480

    attcttagca cttttctggg acgacctgcg gagcctgtgc ctcttcagct accgccgctt    540

    gagagactta ctcttgattg tagcgaagat tgtggaaact ctgggacgca gggggtggga    600

    agtcctcaag tattggtgga atctcctgca gtattggagc caggaactaa agaaaagctt    660

    gtgggcaagt ggtcaaaatg tagtggatgg cctactgtaa gggaaagaat gaaacaagct    720

    gagcctgagc cagcagcaga tggggtggga gcagcatctc gagacctgga aaaacatgga    780

    gcaatcacaa gtagcaatac agcaactaat aacgctgctt gtgcctggct agaagcacaa    840

    gaggaagagg aagtgggttt tccagtcaga cctcaggtac ctttaagacc aatgacttac    900

    aagggagctt tagatcttag ccacttttta aaagaaaagg ggggactgga agggttaatt    960

    tactccccaa aaagacaaga gatccttgat ctgtgggtct accacacaca aggctacttc   1020

    cctgattggc agaactacac accagggcca ggggtcagat atccactgac ctttggatgg   1080

    tgcttcaagt tagtaccagt tgaaccagat gaagaagaga acagcagcct gttacaccct   1140

    gcgagcctgc atgggacaga ggacacggag agagaagtgt taaagtggaa gtttgacagc   1200

    catctagcat ttcatcacaa ggcccgagag ctgcatccgg agtactacaa agactgcgcg   1260

    gccgtgttag acaaatggga aaaaattcgg ttaaggccag ggggaaagaa aaaatatcaa   1320

    ttaaaacata tagtatgggc aagcagggag ctagaacgat tcgcagttaa tcctggcctg   1380

    ttagaaacat cagaaggctg tagacagata atgggacagc tacaaccgtc ccttcagaca   1440

    ggatcagaag aacttagatc attatataat acagtagcaa ccctctattg tgtgcatcaa   1500

    aagatagagg taaaagacac caaggaagct ttagacaagg tagaggaaga gcaaaacaac   1560

    agtaagaaaa aggcacagca agaagcagct gacgcaggaa acagaaacca ggtcagccaa   1620

    aattacccta tagtgcaaaa cctacaggga caaatggtac atcaggccat atcacctaga   1680

    actttaaatg catgggtaaa agtagtggaa gagaaggctt tcagcccaga agtaataccc   1740

    atgttttcag cattatcaga aggagccacc ccacaagatt taaacaccat gctaaacaca   1800

    gtggggggac atcaagcagc catgcaaatg ttaaaagaaa ccatcaatga ggaagctgca   1860

    gaatgggata gattgcaccc agtgcatgca gggcctattg caccaggcca gatgagagaa   1920

    ccaaggggaa gtgacatagc aggaactact agtacccttc aggaacaaat aggatggatg   1980

    acaaataatc cacctatccc agtaggagaa atatataaga gatggataat cctgggatta   2040

    aataaaatag taagaatgta tagccctacc agcattctgg atataaaaca aggaccaaaa   2100

    gaacccttta gagattatgt agaccggttc tataaaaccc taagagccga gcaagctaca   2160

    caggaagtaa aaaattggat gacagaaacc ttgttggtcc aaaatgcgaa tccagattgt   2220

    aagactattt taaaagcatt aggaccagca gctacactag aagaaatgat gacagcatgt   2280

    cagggagtgg ggggacccgg ccataaagca agagttttgg ctgaagcaat gagccaagta   2340

    acaggttcag ctgccataat gatgcagaga ggcaatttta ggaaccaaag aaagactgtt   2400

    aagtgtttca attgtggcaa agaagggcac atagccagaa attgcagggc ccctaggaaa   2460

    aagggctgtt ggaaatgtgg aaaggaagga catcaaatga aggattgcac agaaagacag   2520

    gctaatgcgg ccgtcatcac cctgtggcag cgccccctgg tggccctgat cgagatctgc   2580

    accgagatgg agaaggaggg caagatcagc aagatcggcc ccgccggcct gaagaagaag   2640

    aagagcgtga ccgtgctgga cgtgggcgac gcctacttca gcgtgcccct ggataaggac   2700

    ttccgcaagt acaccgcctt caccatcccc agcatctgga agggcagccc cgccatcttc   2760

    cagagcagca tgaccaagaa gcagaacccc gacatcgtga tctaccagta catggacgac   2820

    ctgtacgtgc ccatcgtgct gcccgagaag gacagctggc tggtgggcaa gctgaactgg   2880

    gccagccaga tctacgccgg catcaaggtg aagcagctga tcctgaagga gcccgtgcac   2940

    ggcgtgtacg agcccatcgt gggcgccgag accttctacg tggacggcgc cgccaaccgc   3000

    gccggcaacc tgtgggtgac cgtgtactac ggcgtgcccg tgtggaagga ggccaccacc   3060

    accctggtgg agcgctacct gcgcgaccag cagctgctgg gcatctgggg ctgcgcctgc   3120

    accccctacg acatcaacca gatgctgcgc ggccctggcc gcgccttcgt gaccatccgc   3180

    cagggcagcc tgtag                                                    3195

    <210>20

    <211>3195

    <212>DNA

    <213>人工序列

    <220>

    <223>含有Rev-Nef-Tat，截短的Gag蛋白和CTL(RNT-dgag-CTL)的杂交蛋白编码序列

    <400>20

    atggcaggaa gaagcggaga cagcgacgaa gagctcctca agacagtcag actcatcaag     60

    tttctctacc aaagcaaccc tcctcccagc aacgagggga cccgacaggc ccgaagaaat    120

    cgaagaagaa ggtggagaga gagacagagg cagatccgtt cgattagtga gcggattctt    180

    agcacttttc tgggacgacc tgcggagcct gtgcctcttc agctaccgcc gcttgagaga    240

    cttactcttg attgtagcga agattgtgga aactctggga cgcagggggt gggaagtcct    300

    caagtattgg tggaatctcc tgcagtattg gagccaggaa ctaaagaaac tagtgtgggc    360

    aagtggtcaa aatgtagtgg atggcctact gtaagggaaa gaatgaaaca agctgagcct    420

    gagccagcag cagatggggt gggagcagca tctcgagacc tggaaaaaca tggagcaatc    480

    acaagtagca atacagcaac taataacgct gcttgtgcct ggctagaagc acaagaggaa    540

    gaggaagtgg gttttccagt cagacctcag gtacctttaa gaccaatgac ttacaaggga    600

    gctttagatc ttagccactt tttaaaagaa aaggggggac tggaagggtt aatttactcc    660

    ccaaaaagac aagagatcct tgatctgtgg gtctaccaca cacaaggcta cttccctgat    720

    tggcagaact acacaccagg gccaggggtc agatatccac tgacctttgg atggtgcttc    780

    aagttagtac cagttgaacc agatgaagaa gagaacagca gcctgttaca ccctgcgagc    840

    ctgcatggga cagaggacac ggagagagaa gtgttaaagt ggaagtttga cagccatcta    900

    gcatttcatc acaaggcccg agagctgcat ccggagtact acaaagactg caagcttgag    960

    ccagtagatc ctagactaga gccctggaag catccaggaa gtcagcctag gaccccttgt   1020

    accaattgct attgtaaaaa gtgttgcctt cattgccaag tttgtttcac aagaaaaggc   1080

    ttaggcatct cctatggcag gaagaagcgg agacagcgac gaagagctcc tcaagacagt   1140

    cagactcatc aagtttctct accaaagcaa ccctcctccc agcaacgagg ggacccgaca   1200

    ggcccgaaga aatcgaagaa gaaggtggag agagagacag aggcagatcc gttcgatgcg   1260

    gccgtgttag acaaatggga aaaaattcgg ttaaggccag ggggaaagaa aaaatatcaa   1320

    ttaaaacata tagtatgggc aagcagggag ctagaacgat tcgcagttaa tcctggcctg   1380

    ttagaaacat cagaaggctg tagacagata atgggacagc tacaaccgtc ccttcagaca   1440

    ggatcagaag aacttagatc attatataat acagtagcaa ccctctattg tgtgcatcaa   1500

    aagatagagg taaaagacac caaggaagct ttagacaagg tagaggaaga gcaaaacaac   1560

    agtaagaaaa aggcacagca agaagcagct gacgcaggaa acagaaacca ggtcagccaa   1620

    aattacccta tagtgcaaaa cctacaggga caaatggtac atcaggccat atcacctaga   1680

    actttaaatg catgggtaaa agtagtggaa gagaaggctt tcagcccaga agtaataccc   1740

    atgttttcag cattatcaga aggagccacc ccacaagatt taaacaccat gctaaacaca   1800

    gtggggggac atcaagcagc catgcaaatg ttaaaagaaa ccatcaatga ggaagctgca   1860

    gaatgggata gattgcaccc agtgcatgca gggcctattg caccaggcca gatgagagaa   1920

    ccaaggggaa gtgacatagc aggaactact agtacccttc aggaacaaat aggatggatg   1980

    acaaataatc cacctatccc agtaggagaa atatataaga gatggataat cctgggatta   2040

    aataaaatag taagaatgta tagccctacc agcattctgg atataaaaca aggaccaaaa   2100

    gaacccttta gagattatgt agaccggttc tataaaaccc taagagccga gcaagctaca   2160

    caggaagtaa aaaattggat gacagaaacc ttgttggtcc aaaatgcgaa tccagattgt   2220

    aagactattt taaaagcatt aggaccagca gctacactag aagaaatgat gacagcatgt   2280

    cagggagtgg ggggacccgg ccataaagca agagttttgg ctgaagcaat gagccaagta   2340

    acaggttcag ctgccataat gatgcagaga ggcaatttta ggaaccaaag aaagactgtt   2400

    aagtgtttca attgtggcaa agaagggcac atagccagaa attgcagggc ccctaggaaa   2460

    aagggctgtt ggaaatgtgg aaaggaagga catcaaatga aggattgcac agaaagacag   2520

    gctaatgcgg ccgtcatcac cctgtggcag cgccccctgg tggccctgat cgagatctgc   2580

    accgagatgg agaaggaggg caagatcagc aagatcggcc ccgccggcct gaagaagaag   2640

    aagagcgtga ccgtgctgga cgtgggcgac gcctacttca gcgtgcccct ggataaggac   2700

    ttccgcaagt acaccgcctt caccatcccc agcatctgga agggcagccc cgccatcttc   2760

    cagagcagca tgaccaagaa gcagaacccc gacatcgtga tctaccagta catggacgac   2820

    ctgtacgtgc ccatcgtgct gcccgagaag gacagctggc tggtgggcaa gctgaactgg   2880

    gccagccaga tctacgccgg catcaaggtg aagcagctga tcctgaagga gcccgtgcac   2940

    ggcgtgtacg agcccatcgt gggcgccgag accttctacg tggacggcgc cgccaaccgc   3000

    gccggcaacc tgtgggtgac cgtgtactac ggcgtgcccg tgtggaagga ggccaccacc   3060

    accctggtgg agcgctacct gcgcgaccag cagctgctgg gcatctgggg ctgcgcctgc   3120

    accccctacg acatcaacca gatgctgcgc ggccctggcc gcgccttcgt gaccatccgc   3180

    cagggcagcc tgtag                                                    3195

    <210>21

    <211>3020

    <212>DNA

    <213>人工序列

    <220>

    <223>含有Tat-Rev-Nef，截短的Gag蛋白和CTL(TRN-optp17/24-CTL)的杂交蛋白编码序列

    <400>21

    atggagccag tagatcctag actagagccc tggaagcatc caggaagtca gcctaggacc     60

    ccttgtacca attgctattg taaaaagtgt tgccttcatt gccaagtttg tttcacaaga    120

    aaaggcttag gcatctccta tggcaggaag aagcggagac agcgacgaag agctcctcaa    180

    gacagtcaga ctcatcaagt ttctctacca aagcaaccct cctcccagca acgaggggac    240

    ccgacaggcc cgaagaaatc gaagaagaag gtggagagag agacagaggc agatccgttc    300

    gatactagtg caggaagaag cggagacagc gacgaagagc tcctcaagac agtcagactc    360

    atcaagtttc tctaccaaag caaccctcct cccagcaacg aggggacccg acaggcccga    420

    agaaatcgaa gaagaaggtg gagagagaga cagaggcaga tccgttcgat tagtgagcgg    480

    attcttagca cttttctggg acgacctgcg gagcctgtgc ctcttcagct accgccgctt    540

    gagagactta ctcttgattg tagcgaagat tgtggaaact ctgggacgca gggggtggga    600

    agtcctcaag tattggtgga atctcctgca gtattggagc caggaactaa agaaaagctt    660

    gttggcaagt ggtcaaaatg tagtggatgg cctactgtaa gggaaagaat gaaacaagct    720

    gagcctgagc cagcagcaga tggggtggga gcagcatctc gagacctgga aaaacatgga    780

    gcaatcacaa gtagcaatac agcaactaat aacgctgctt gtgcctggct agaagcacaa    840

    gaggaagagg aagtgggttt tccagtcaga cctcaggtac ctttaagacc aatgacttac    900

    aagggagctt tagatcttag ccacttttta aaagaaaagg ggggactgga agggttaatt    960

    tactccccaa aaagacaaga gatccttgat ctgtgggtct accacacaca aggctacttc   1020

    cctgattggc agaactacac accagggcca ggggtcagat atccactgac ctttggatgg   1080

    tgcttcaagt tagtaccagt tgaaccagat gaagaagaga acagcagcct gttacaccct   1140

    gcgagcctgc atgggacaga ggacacggag agagaagtgt taaagtggaa gtttgacagc   1200

    catctagcat ttcatcacaa ggcccgagag ctgcatccgg agtactacaa agactgcgcg   1260

    gccgtgggcg caagagcctc cgtgctgagc ggcggagagc tggacaagtg ggagaagatc   1320

    cgcctgcgcc ccggcggcaa gaagaagtac cagctgaagc acatcgtgtg ggccagccgc   1380

    gagctggagc gcttcgccgt gaaccccggc ctgctcgaga ccagcgaagg ctgccgccag   1440

    atcatgggcc agctccagcc cagcctccag accggcagcg aggagctgcg cagcctgtac   1500

    aacaccgtgg ccaccctgta ctgcgtgcac cagaagatcg aggtgaagga caccaaggag   1560

    gccctggaca aggtggagga ggagcagaac aacagcaaga agaaggccca gcaggaggcc   1620

    gccgacgccg gcaaccgcaa ccaagtcagc cagaactacc ccatcgtgca gaacctgcag   1680

    ggccagatgg tgcaccaggc catcagcccc cgcaccctga acgcctgggt gaaggtggtg   1740

    gaggagaagg ccttcagccc cgaggtgatc cccatgttca gcgccctaag cgagggcgct   1800

    accccccagg acctgaacac catgctgaac accgtgggcg gccaccaggc cgccatgcag   1860

    atgctgaagg agaccatcaa cgaggaggcc gccgagtggg accgcctgca ccccgtgcac   1920

    gccgggccca tcgcccccgg ccagatgcgc gagccccgcg gcagcgacat cgccggcacc   1980

    accagcaccc tccaggagca gatcggctgg atgaccaaca acccccccat ccccgtgggc   2040

    gagatctaca agcgctggat catcctgggc ctgaacaaga tcgtccgcat gtacagcccc   2100

    accagcatcc tggacatcaa gcagggcccc aaggagccct tccgcgacta cgtggaccgc   2160

    ttctacaaga ccctgcgcgc cgagcaggcc acccaggagg tgaagaactg gatgaccgag   2220

    accctgctgg tgcagaacgc caaccccgac tgcaagacca tcctcaaggc cctgggaccc   2280

    gccgccaccc tggaggagat gatgaccgcc tgccaaggcg tgggcggccc cggccacaag   2340

    gcccgcgtgc tggcggccgt catcaccctg tggcagcgcc ccctggtggc cctgatcgag   2400

    atctgcaccg agatggagaa ggagggcaag atcagcaaga tcggccccgc cggcctgaag   2460

    aagaagaaga gcgtgaccgt gctggacgtg ggcgacgcct acttcagcgt gcccctggat   2520

    aaggacttcc gcaagtacac cgccttcacc atccccagca tctggaaggg cagccccgcc   2580

    atcttccaga gcagcatgac caagaagcag aaccccgaca tcgtgatcta ccagtacatg   2640

    gacgacctgt acgtgcccat cgtgctgccc gagaaggaca gctggctggt gggcaagctg   2700

    aactgggcca gccagatcta cgccggcatc aaggtgaagc agctgatcct gaaggagccc   2760

    gtgcacggcg tgtacgagcc catcgtgggc gccgagacct tctacgtgga cggcgccgcc   2820

    aaccgcgccg gcaacctgtg ggtgaccgtg tactacggcg tgcccgtgtg gaaggaggcc   2880

    accaccaccc tggtggagcg ctacctgcgc gaccagcagc tgctgggcat ctggggctgc   2940

    gcctgcaccc cctacgacat caaccagatg ctgcgcggcc ctggccgcgc ctcgtgacca   3000

    tccgccaggg cagcctgtag                                               3020

    <210>22

    <211>3021

    <212>DNA

    <213>人工序列

    <220>

    <223>含有Tat-Rev-Nef，CTL和截短的Gag蛋白(TRN-CTL-optp17/24)杂交蛋白编码序列

    <400>22

    atggagccag tagatcctag actagagccc tggaagcatc caggaagtca gcctaggacc     60

    ccttgtacca attgctattg taaaaagtgt tgccttcatt gccaagtttg tttcacaaga    120

    aaaggcttag gcatctccta tggcaggaag aagcggagac agcgacgaag agctcctcaa    180

    gacagtcaga ctcatcaagt ttctctacca aagcaaccct cctcccagca acgaggggac    240

    ccgacaggcc cgaagaaatc gaagaagaag gtggagagag agacagaggc agatccgttc    300

    gatactagtg caggaagaag cggagacagc gacgaagagc tcctcaagac agtcagactc    360

    atcaagtttc tctaccaaag caaccctcct cccagcaacg aggggacccg acaggcccga    420

    agaaatcgaa gaagaaggtg gagagagaga cagaggcaga tccgttcgat tagtgagcgg    480

    attcttagca cttttctggg acgacctgcg gagcctgtgc ctcttcagct accgccgctt    540

    gagagactta ctcttgattg tagcgaagat tgtggaaact ctgggacgca gggggtggga    600

    agtcctcaag tattggtgga atctcctgca gtattggagc caggaactaa agaaaagctt    660

    gtgggcaagt ggtcaaaatg tagtggatgg cctactgtaa gggaaagaat gaaacaagct    720

    gagcctgagc cagcagcaga tggggtggga gcagcatctc gagacctgga aaaacatgga    780

    gcaatcacaa gtagcaatac agcaactaat aacgctgctt gtgcctggct agaagcacaa    840

    gaggaagagg aagtgggttt tccagtcaga cctcaggtac ctttaagacc aatgacttac    900

    aagggagctt tagatcttag ccacttttta aaagaaaagg ggggactgga agggttaatt    960

    tactccccaa aaagacaaga gatccttgat ctgtgggtct accacacaca aggctacttc   1020

    cctgattggc agaactacac accagggcca ggggtcagat atccactgac ctttggatgg   1080

    tgcttcaagt tagtaccagt tgaaccagat gaagaagaga acagcagcct gttacaccct   1140

    gcgagcctgc atgggacaga ggacacggag agagaagtgt taaagtggaa gtttgacagc   1200

    catctagcat ttcatcacaa ggcccgagag ctgcatccgg agtactacaa agactgcgcg   1260

    gccgtcatca ccctgtggca gcgccccctg gtggccctga tcgagatctg caccgagatg   1320

    gagaaggagg gcaagatcag caagatcggc cccgccggcc tgaagaagaa gaagagcgtg   1380

    accgtgctgg acgtgggcga cgcctacttc agcgtgcccc tggataagga cttccgcaag   1440

    tacaccgcct tcaccatccc cagcatctgg aagggcagcc ccgccatctt ccagagcagc   1500

    atgaccaaga agcagaaccc cgacatcgtg atctaccagt acatggacga cctgtacgtg   1560

    cccatcgtgc tgcccgagaa ggacagctgg ctggtgggca agctgaactg ggccagccag   1620

    atctacgccg gcatcaaggt gaagcagctg atcctgaagg agcccgtgca cggcgtgtac   1680

    gagcccatcg tgggcgccga gaccttctac gtggacggcg ccgccaaccg cgccggcaac   1740

    ctgtgggtga ccgtgtacta cggcgtgccc gtgtggaagg aggccaccac caccctggtg   1800

    gagcgctacc tgcgcgacca gcagctgctg ggcatctggg gctgcgcctg caccccctac   1860

    gacatcaacc agatgctgcg cggccctggc cgcgccttcg tgaccatccg ccagggcagc   1920

    ctggcggccg tgggcgcaag agcctccgtg ctgagcggcg gagagctgga caagtgggag   1980

    aagatccgcc tgcgccccgg cggcaagaag aagtaccagc tgaagcacat cgtgtgggcc   2040

    agccgcgagc tggagcgctt cgccgtgaac cccggcctgc tcgagaccag cgaaggctgc   2100

    cgccagatca tgggccagct ccagcccagc ctccagaccg gcagcgagga gctgcgcagc   2160

    ctgtacaaca ccgtggccac cctgtactgc gtgcaccaga agatcgaggt gaaggacacc   2220

    aaggaggccc tggacaaggt ggaggaggag cagaacaaca gcaagaagaa ggcccagcag   2280

    gaggccgccg acgccggcaa ccgcaaccaa gtcagccaga actaccccat cgtgcagaac   2340

    ctgcagggcc agatggtgca ccaggccatc agcccccgca ccctgaacgc ctgggtgaag   2400

    gtggtggagg agaaggcctt cagccccgag gtgatcccca tgttcagcgc cctgagcgag   2460

    ggcgctaccc cccaggacct gaacaccatg ctgaacaccg tgggcggcca ccaggccgcc   2520

    atgcagatgc tgaaggagac catcaacgag gaggccgccg agtgggaccg cctgcacccc   2580

    gtgcacgccg ggcccatcgc ccccggccag atgcgcgagc cccgcggcag cgacatcgcc   2640

    ggcaccacca gcaccctcca ggagcagatc ggctggatga ccaacaaccc ccccatcccc   2700

    gtgggcgaga tctacaagcg ctggatcatc ctgggcctga acaagatcgt ccgcatgtac   2760

    agccccacca gcatcctgga catcaagcag ggccccaagg agcccttccg cgactacgtg   2820

    gaccgcttct acaagaccct gcgcgccgag caggccaccc aggaggtgaa gaactggatg   2880

    accgagaccc tgctggtgca gaacgccaac cccgactgca agaccatcct caaggccctg   2940

    ggacccgccg ccaccctgga ggagatgatg accgcctgcc aaggcgtggg cggccccggc   3000

    cacaaggccc gcgtgctgtg a                                             3021

    <210>23

    <211>3021

    <212>DNA

    <213>人工序列

    <220>

    <223>含有Rev-Nef-Tat，CTL和截短的Gag蛋白(RNT-CTL-dgag)蛋白(RNT-CTL-optp17/24)的杂交蛋白编码序列

    <400>23

    atggcaggaa gaagcggaga cagcgacgaa gagctcctca agacagtcag actcatcaag     60

    tttctctacc aaagcaaccc tcctcccagc aacgagggga cccgacaggc ccgaagaaat    120

    cgaagaagaa ggtggagaga gagacagagg cagatccgtt cgattagtga gcggattctt    180

    agcacttttc tgggacgacc tgcggagcct gtgcctcttc agctaccgcc gcttgagaga    240

    cttactcttg attgtagcga agattgtgga aactctggga cgcagggggt gggaagtcct    300

    caagtattgg tggaatctcc tgcagtattg gagccaggaa ctaaagaaac tagtgtgggc    360

    aagtggtcaa aatgtagtgg atggcctact gtaagggaaa gaatgaaaca agctgagcct    420

    gagccagcag cagatggggt gggagcagca tctcgagacc tggaaaaaca tggagcaatc    480

    acaagtagca atacagcaac taataacgct gcttgtgcct ggctagaagc acaagaggaa    540

    gaggaagtgg gttttccagt cagacctcag gtacctttaa gaccaatgac ttacaaggga    600

    gctttagatc ttagccactt tttaaaagaa aaggggggac tggaagggtt aatttactcc    660

    ccaaaaagac aagagatcct tgatctgtgg gtctaccaca cacaaggcta cttccctgat    720

    tggcagaact acacaccagg gccaggggtc agatatccac tgacctttgg atggtgcttc    780

    aagttagtac cagttgaacc agatgaagaa gagaacagca gcctgttaca ccctgcgagc    840

    ctgcatggga cagaggacac ggagagagaa gtgttaaagt ggaagtttga cagccatcta    900

    gcatttcatc acaaggcccg agagctgcat ccggagtact acaaagactg caagcttgag    960

    ccagtagatc ctagactaga gccctggaag catccaggaa gtcagcctag gaccccttgt   1020

    accaattgct attgtaaaaa gtgttgcctt cattgccaag tttgtttcac aagaaaaggc   1080

    ttaggcatct cctatggcag gaagaagcgg agacagcgac gaagagctcc tcaagacagt   1140

    cagactcatc aagtttctct accaaagcaa ccctcctccc agcaacgagg ggacccgaca   1200

    ggcccgaaga aatcgaagaa gaaggtggag agagagacag aggcagatcc gttcgatgcg   1260

    gccgtcatca ccctgtggca gcgccccctg gtggccctga tcgagatctg caccgagatg   1320

    gagaaggagg gcaagatcag caagatcggc cccgccggcc tgaagaagaa gaagagcgtg   1380

    accgtgctgg acgtgggcga cgcctacttc agcgtgcccc tggataagga cttccgcaag   1440

    tacaccgcct tcaccatccc cagcatctgg aagggcagcc ccgccatctt ccagagcagc   1500

    atgaccaaga agcagaaccc cgacatcgtg atctaccagt acatggacga cctgtacgtg   1560

    cccatcgtgc tgcccgagaa ggacagctgg ctggtgggca agctgaactg ggccagccag   1620

    atctacgccg gcatcaaggt gaagcagctg atcctgaagg agcccgtgca cggcgtgtac   1680

    gagcccatcg tgggcgccga gaccttctac gtggacggcg ccgccaaccg cgccggcaac   1740

    ctgtgggtga ccgtgtacta cggcgtgccc gtgtggaagg aggccaccac caccctggtg   1800

    gagcgctacc tgcgcgacca gcagctgctg ggcatctggg gctgcgcctg caccccctac   1860

    gacatcaacc agatgctgcg cggccctggc cgcgccttcg tgaccatccg ccagggcagc   1920

    ctggcggccg tgggcgcaag agcctccgtg ctgagcggcg gagagctgga caagtgggag   1980

    aagatccgcc tgcgccccgg cggcaagaag aagtaccagc tgaagcacat cgtgtgggcc   2040

    agccgcgagc tggagcgctt cgccgtgaac cccggcctgc tcgagaccag cgaaggctgc   2100

    cgccagatca tgggccagct ccagcccagc ctccagaccg gcagcgagga gctgcgcagc   2160

    ctgtacaaca ccgtggccac cctgtactgc gtgcaccaga agatcgaggt gaaggacacc   2220

    aaggaggccc tggacaaggt ggaggaggag cagaacaaca gcaagaagaa ggcccagcag   2280

    gaggccgccg acgccggcaa ccgcaaccaa gtcagccaga actaccccat cgtgcagaac   2340

    ctgcagggcc agatggtgca ccaggccatc agcccccgca ccctgaacgc ctgggtgaag   2400

    gtggtggagg agaaggcctt cagccccgag gtgatcccca tgttcagcgc cctgagcgag   2460

    ggcgctaccc cccaggacct gaacaccatg ctgaacaccg tgggcggcca ccaggccgcc   2520

    atgcagatgc tgaaggagac catcaacgag gaggccgccg agtgggaccg cctgcacccc   2580

    gtgcacgccg ggcccatcgc ccccggccag atgcgcgagc cccgcggcag cgacatcgcc   2640

    ggcaccacca gcaccctcca ggagcagatc ggctggatga ccaacaaccc ccccatcccc   2700

    gtgggcgaga tctacaagcg ctggatcatc ctgggcctga acaagatcgt ccgcatgtac   2760

    agccccacca gcatcctgga catcaagcag ggccccaagg agcccttccg cgactacgtg   2820

    gaccgcttct acaagaccct gcgcgccgag caggccaccc aggaggtgaa gaactggatg   2880

    accgagaccc tgctggtgca gaacgccaac cccgactgca agaccatcct caaggccctg   2940

    ggacccgccg ccaccctgga ggagatgatg accgcctgcc aaggcgtggg cggccccggc   3000

    cacaaggccc gcgtgctgtg a                                             3021

    <210>24

    <211>3021

    <212>DNA

    <213>人工序列

    <220>

    <223>含有Rev-Nef-Tat，截短的Gag蛋白和CTL(RNT-optp17/24-CTL)的杂交蛋白编码序列

    <400>24

    atggcaggaa gaagcggaga cagcgacgaa gagctcctca agacagtcag actcatcaag     60

    tttctctacc aaagcaaccc tcctcccagc aacgagggga cccgacaggc ccgaagaaat    120

    cgaagaagaa ggtggagaga gagacagagg cagatccgtt cgattagtga gcggattctt    180

    agcacttttc tgggacgacc tgcggagcct gtgcctcttc agctaccgcc gcttgagaga    240

    cttactcttg attgtagcga agattgtgga aactctggga cgcagggggt gggaagtcct    300

    caagtattgg tggaatctcc tgcagtattg gagccaggaa ctaaagaaac tagtgtgggc    360

    aagtggtcaa aatgtagtgg atggcctact gtaagggaaa gaatgaaaca agctgagcct    420

    gagccagcag cagatggggt gggagcagca tctcgagacc tggaaaaaca tggagcaatc    480

    acaagtagca atacagcaac taataacgct gcttgtgcct ggctagaagc acaagaggaa    540

    gaggaagtgg gttttccagt cagacctcag gtacctttaa gaccaatgac ttacaaggga    600

    gctttagatc ttagccactt tttaaaagaa aaggggggac tggaagggtt aatttactcc    660

    ccaaaaagac aagagatcct tgatctgtgg gtctaccaca cacaaggcta cttccctgat    720

    tggcagaact acacaccagg gccaggggtc agatatccac tgacctttgg atggtgcttc    780

    aagttagtac cagttgaacc agatgaagaa gagaacagca gcctgttaca ccctgcgagc    840

    ctgcatggga cagaggacac ggagagagaa gtgttaaagt ggaagtttga cagccatcta    900

    gcatttcatc acaaggcccg agagctgcat ccggagtact acaaagactg caagcttgag    960

    ccagtagatc ctagactaga gccctggaag catccaggaa gtcagcctag gaccccttgt   1020

    accaattgct attgtaaaaa gtgttgcctt cattgccaag tttgtttcac aagaaaaggc   1080

    ttaggcatct cctatggcag gaagaagcgg agacagcgac gaagagctcc tcaagacagt   1140

    cagactcatc aagtttctct accaaagcaa ccctcctccc agcaacgagg ggacccgaca   1200

    ggcccgaaga aatcgaagaa gaaggtggag agagagacag aggcagatcc gttcgatgcg   1260

    gccgtgggcg caagagcctc cgtgctgagc ggcggagagc tggacaagtg ggagaagatc   1320

    cgcctgcgcc ccggcggcaa gaagaagtac cagctgaagc acatcgtgtg ggccagccgc   1380

    gagctggagc gcttcgccgt gaaccccggc ctgctcgaga ccagcgaagg ctgccgccag   1440

    atcatgggcc agctccagcc cagcctccag accggcagcg aggagctgcg cagcctgtac   1500

    aacaccgtgg ccaccctgta ctgcgtgcac cagaagatcg aggtgaagga caccaaggag   1560

    gccctggaca aggtggagga ggagcagaac aacagcaaga agaaggccca gcaggaggcc   1620

    gccgacgccg gcaaccgcaa ccaagtcagc cagaactacc ccatcgtgca gaacctgcag   1680

    ggccagatgg tgcaccaggc catcagcccc cgcaccctga acgcctgggt gaaggtggtg   1740

    gaggagaagg ccttcagccc cgaggtgatc cccatgttca gcgccctaag cgagggcgct   1800

    accccccagg acctgaacac catgctgaac accgtgggcg gccaccaggc cgccatgcag   1860

    atgctgaagg agaccatcaa cgaggaggcc gccgagtggg accgcctgca ccccgtgcac   1920

    gccgggccca tcgcccccgg ccagatgcgc gagccccgcg gcagcgacat cgccggcacc   1980

    accagcaccc tccaggagca gatcggctgg atgaccaaca acccccccat ccccgtgggc   2040

    gagatctaca agcgctggat catcctgggc ctgaacaaga tcgtccgcat gtacagcccc   2100

    accagcatcc tggacatcaa gcagggcccc aaggagccct tccgcgacta cgtggaccgc   2160

    ttctacaaga ccctgcgcgc cgagcaggcc acccaggagg tgaagaactg gatgaccgag   2220

    accctgctgg tgcagaacgc caaccccgac tgcaagacca tcctcaaggc cctgggaccc   2280

    gccgccaccc tggaggagat gatgaccgcc tgccaaggcg tgggcggccc cggccacaag   2340

    gcccgcgtgc tggcggccgt catcaccctg tggcagcgcc ccctggtggc cctgatcgag   2400

    atctgcaccg agatggagaa ggagggcaag atcagcaaga tcggccccgc cggcctgaag   2460

    aagaagaaga gcgtgaccgt gctggacgtg ggcgacgcct acttcagcgt gcccctggat   2520

    aaggacttcc gcaagtacac cgccttcacc atccccagca tctggaaggg cagccccgcc   2580

    atcttccaga gcagcatgac caagaagcag aaccccgaca tcgtgatcta ccagtacatg   2640

    gacgacctgt acgtgcccat cgtgctgccc gagaaggaca gctggctggt gggcaagctg   2700

    aactgggcca gccagatcta cgccggcatc aaggtgaagc agctgatcct gaaggagccc   2760

    gtgcacggcg tgtacgagcc catcgtgggc gccgagacct tctacgtgga cggcgccgcc   2820

    aaccgcgccg gcaacctgtg ggtgaccgtg tactacggcg tgcccgtgtg gaaggaggcc   2880

    accaccaccc tggtggagcg ctacctgcgc gaccagcagc tgctgggcat ctggggctgc   2940

    gcctgcaccc cctacgacat caaccagatg ctgcgcggcc ctggccgcgc cttcgtgacc   3000

    atccgccagg gcagcctgta g                                             3021

    <210>25

    <211>419

    <212>PRT

    <213>人工序列

    <220>

    <223>含有Nef-Tat-Rev的杂交蛋白(NTR)

    <400>25

    Met Val Gly Lys Trp Ser Lys Cys Ser Gly Trp Pro Thr Val Arg Glu

    1               5                   10                  15

    Arg Met Lys Gln Ala Glu Pro Glu Pro Ala Ala Asp Gly Val Gly Ala

                20                  25                  30

    Ala Ser Arg Asp Leu Glu Lys His Gly Ala Ile Thr Ser Ser Asn Thr

            35                  40                  45

    Ala Thr Asn Asn Ala Ala Cys Ala Trp Leu Glu Ala Gln Glu Glu Glu

        50                  55                  60

    Glu Val Gly Phe Pro Val Arg Pro Gln Val Pro Leu Arg Pro Met Thr

    65                  70                  75                  80

    Tyr Lys Gly Ala Leu Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly

                    85                  90                  95

    Leu Glu Gly Leu Ile Tyr Ser Pro Lys Arg Gln Glu Ile Leu Asp Leu

                100                 105                 110

    Trp Val Tyr His Thr Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr

            115                 120                 125

    Pro Gly Pro Gly Val Arg Tyr Pro Leu Thr Phe Gly Trp Cys Phe Lys

        130                 135                 140

    Leu Val Pro Val Glu Pro Asp Glu Glu Glu Asn Ser Ser Leu Leu His

    145                 150                 155                 160

    Pro Ala Ser Leu His Gly Thr Glu Asp Thr Glu Arg Glu Val Leu Lys

                    165                 170                 175

    Trp Lys Phe Asp Ser His Leu Ala Phe His His Lys Ala Arg Glu Leu

                180                 185                 190

    His Pro Glu Tyr Tyr Lys Asp Cys Thr Ser Ala Gly Arg Ser Gly Asp

            195                 200                 205

    Ser Asp Glu Glu Leu Leu Lys Thr Val Arg Leu Ile Lys Phe Leu Tyr

        210                 215                 220

    Gln Ser Asn Pro Pro Pro Ser Asn Glu Gly Thr Arg Gln Ala Arg Arg

    225                 230                 235                 240

    Asn Arg Arg Arg Arg Trp Arg Glu Arg Gln Arg Gln Ile Arg Ser Ile

                    245                 250                 255

    Ser Glu Arg Ile Leu Ser Thr Phe Leu Gly Arg Pro Ala Glu Pro Val

            260                 265                 270

    Pro Leu Gln Leu Pro Pro Leu Glu Arg Leu Thr Leu Asp Cys Ser Glu

            275                 280                 285

    Asp Cys Gly Asn Ser Gly Thr Gln Gly Val Gly Ser Pro Gln Val Leu

        290                 295                 300

    Val Glu Ser Pro Ala Val Leu Glu Pro Gly Thr Lys Glu Lys Leu Glu

    305                 310                 315                 320

    Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser Gln Pro

                    325                 330                 335

    Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu His Cys

                340                 345                 350

    Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly Arg Lys

            355                 360                 365

    Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr His Gln

        370                 375                 380

    Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp Pro Thr

    385                 390                 395                 400

    Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu Ala Asp

                   405                  410                 415

    Pro Phe Asp

    <210>26

    <211>419

    <212>PRT

    <213>人工序列

    <220>

    <223>含有Tat-Rev-Nef(TRN)的杂交蛋白

    <400>26

    Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser

    1               5                   10                  15

    Gln Pro Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu

                20                  25                  30

    His Cys Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly

            35                  40                  45

    Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr

        50                  55                  60

    His Gln Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp

    65                  70                  75                  80

    Pro Thr Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu

                    85                  90                  95

    Ala Asp Pro Phe Asp Thr Ser Ala Gly Arg Ser Gly Asp Ser Asp Glu

                100                 105                 110

    Glu Leu Leu Lys Thr Val Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn

        115                     120                 125

    Pro Pro Pro Ser Asn Glu Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg

        130                 135                 140

    Arg Arg Trp Arg Glu Arg Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg

    145                 150                 155                 160

    Ile Leu Ser Thr Phe Leu Gly Arg Pro Ala Glu Pro Val Pro Leu Gln

                    165                 170                 175

    Leu Pro Pro Leu Glu Arg Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly

                180                 185                 190

    Asn Ser Gly Thr Gln Gly Val Gly Ser Pro Gln Val Leu Val Glu Ser

            195                 200                 205

    Pro Ala Val Leu Glu Pro Gly Thr Lys Glu Lys Leu Val Gly Lys Trp

        210                 215                 220

    Ser Lys Cys Ser Gly Trp Pro Thr Val Arg Glu Arg Met Lys Gln Ala

    225                 230                 235                 240

    Glu Pro Glu Pro Ala Ala Asp Gly Val Gly Ala Ala Ser Arg Asp Leu

                    245                 250                 255

    Glu Lys His Gly Ala Ile Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala

                260                 265                 270

    Ala Cys Ala Trp Leu Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro

            275                 280                 285

    Val Arg Pro Gln Val Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu

        290                 295                 300

    Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile

    305                 310                 315                 320

    Tyr Ser Pro Lys Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr

                    325                 330                 335

    Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val

                340                 345                 350

    Arg Tyr Pro Leu Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Glu

            355                 360                 365

    Pro Asp Glu Glu Glu Asn Ser Ser Leu Leu His Pro Ala Ser Leu His

        370                 375                 380

    Gly Thr Glu Asp Thr Glu Arg Glu Val Leu Lys Trp Lys Phe Asp Ser

    385                 390                 395                 400

    His Leu Ala Phe His His Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr

                    405                 410                 415

    Lys Asp Cys

    <210>27

    <211>419

    <212>PRT

    <213>人工序列

    <220>

    <223>含有Rev-Tat-Nef的杂交蛋白(RTN)

    <400>27

    Met Ala Gly Arg Ser Gly Asp Ser Asp Glu Glu Leu Leu Lys Thr Val

    1               5                   10                  15

    Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn Pro Pro Pro Ser Asn Glu

                20                  25                  30

    Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg

            35                  40                  45

    Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg Ile Leu Ser Thr Phe Leu

        50                  55                  60

    Gly Arg Pro Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg

    65                  70                  75                  80

    Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly Asn Ser Gly Thr Gln Gly

                    85                  90                  95

    Val Gly Ser Pro Gln Val Leu Val Glu Ser Pro Ala Val Leu Glu Pro

                100                 105                 110

    Gly Thr Lys Glu Thr Ser Glu Pro Val Asp Pro Arg Leu Glu Pro Trp

            115                 120                 125

    Lys His Pro Gly Ser Gln Pro Arg Thr Pro Cys Thr Asn Cys Tyr Cys

        130                 135                 140

    Lys Lys Cys Cys Leu His Cys Gln Val Cys Phe Thr Arg Lys Gly Leu

    145                 150                 155                 160

    Gly Ile Ser Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala Pro

                    165                 170                 175

    Gln Asp Ser Gln Thr His Gln Val Ser Leu Pro Lys Gln Pro Ser Ser

                180                 185                 190

    Gln Gln Arg Gly Asp Pro Thr Gly Pro Lys Lys Ser Lys Lys Lys Val

            195                 200                 205

    Glu Arg Glu Thr Glu Ala Asp Pro Phe Asp Lys Leu Val Gly Lys Trp

        210                 215                 220

    Ser Lys Cys Ser Gly Trp Pro Thr Val Arg Glu Arg Met Lys Gln Ala

    225                 230                 235                 240

    Glu Pro Glu Pro Ala Ala Asp Gly Val Gly Ala Ala Ser Arg Asp Leu

                    245                 250                 255

    Glu Lys His Gly Ala Ile Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala

                260                 265                 270

    Ala Cys Ala Trp Leu Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro

            275                 280                 285

    Val Arg Pro Gln Val Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu

        290                 295                 300

    Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile

    305                 310                 315                 320

    Tyr Ser Pro Lys Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr

                    325                 330                 335

    Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val

                340                 345                 350

    Arg Tyr Pro Leu Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Glu

            355                 360                 365

    Pro Asp Glu Glu Glu Asn Ser Ser Leu Leu His Pro Ala Ser Leu His

        370                 375                 380

    Gly Thr Glu Asp Thr Glu Arg Glu Val Leu Lys Trp Lys Phe Asp Ser

    385                 390                 395                 400

    His Leu Ala Phe His His Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr

                    405                 410                 415

    Lys Asp Cys

    <210>28

    <211>419

    <212>PRT

    <213>人工序列

    <220>

    <223>含有Tat-Nef-Rev的杂交蛋白(TNR)

    <400>28

    Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser

    1               5                   10                  15

    Gln Pro Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu

                20                  25                  30

    His Cys Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly

            35                  40                  45

    Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr

        50                  55                  60

    His Gln Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp

    65                  70                  75                  80

    Pro Thr Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu

                    85                  90                  95

    Ala Asp Pro Phe Asp Thr Ser Val Gly Lys Trp Ser Lys Cys Ser Gly

                100                 105                 110

    Trp Pro Thr Val Arg Glu Arg Met Lys Gln Ala Glu Pro Glu Pro Ala

            115                 120                 125

    Ala Asp Gly Val Gly Ala Ala Ser Arg Asp Leu Glu Lys His Gly Ala

        130                 135                 140

    Ile Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala Ala Cys Ala Trp Leu

    145                 150                 155                 160

    Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln Val

                    165                 170                 175

    Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu Asp Leu Ser His Phe

                180                 185                 190

    Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Pro Lys Arg

            195                 200                 205

    Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr Phe Pro

        210                 215                 220

    Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val Arg Tyr Pro Leu Thr

    225                 230                 235                 240

    Phe Gly Trp Cys Phe Lys Leu Val Pro Val Glu Pro Asp Glu Glu Glu

                    245                 250                 255

    Asn Ser Ser Leu Leu His Pro Ala Ser Leu His Gly Thr Glu Asp Thr

                260                 265                 270

    Glu Arg Glu Val Leu Lys Trp Lys Phe Asp Ser His Leu Ala Phe His

            275                 280                 285

    His Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr Lys Asp Cys Lys Leu

        290                 295                 300

    Ala Gly Arg Ser Gly Asp Ser Asp Glu Glu Leu Leu Lys Thr Val Arg

    305                 310                 315                 320

    Leu Ile Lys Phe Leu Tyr Gln Ser Asn Pro Pro Pro Ser Asn Glu Gly

                    325                 330                 335

    Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg Gln

                340                 345                 350

    Arg Gln Ile Arg Ser Ile Ser Glu Arg Ile Leu Ser Thr Phe Leu Gly

            355                 360                 365

    Arg Pro Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg Leu

        370                 375                 380

    Thr Leu Asp Cys Ser Glu Asp Cys Gly Asn Ser Gly Thr Gln Gly Val

    385                 390                 395                 400

    Gly Ser Pro Gln Val Leu Val Glu Ser Pro Ala Val Leu Glu Pro Gly

                    405                 410                 415

    Thr Lys Glu

    <210>29

    <211>419

    <212>PRT

    <213>人工序列

    <220>

    <223>含有Rev-Nef-Tat的杂交蛋白(RNT)

    <400>29

    Met Ala Gly Arg Ser Gly Asp Ser Asp Glu Glu Leu Leu Lys Thr Val

    1               5                   10                  15

    Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn Pro Pro Pro Ser Asn Glu

                20                  25                  30

    Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg

            35                  40                  45

    Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg Ile Leu Ser Thr Phe Leu

        50                  55                  60

    Gly Arg Pro Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg

    65                  70                  75                  80

    Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly Asn Ser Gly Thr Gln Gly

                    85                  90                  95

    Val Gly Ser Pro Gln Val Leu Val Glu Ser Pro Ala Val Leu Glu Pro

                100                 105                 110

    Gly Thr Lys Glu Thr Ser Val Gly Lys Trp Ser Lys Cys Ser Gly Trp

            115                 120                 125

    Pro Thr Val Arg Glu Arg Met Lys Gln Ala Glu Pro Glu Pro Ala Ala

        130                 135                 140

    Asp Gly Val Gly Ala Ala Ser Arg Asp Leu Glu Lys His Gly Ala Ile

    145                 150                 155                 160

    Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala Ala Cys Ala Trp Leu Glu

                    165                 170                 175

    Ala Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln Val Pro

                180                 185                 190

    Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu Asp Leu Ser His Phe Leu

            195                 200                 205

    Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Pro Lys Arg Gln

        210                 215                 220

    Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr Phe Pro Asp

    225                 230                 235                 240

    Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val Arg Tyr Pro Leu Thr Phe

                    245                 250                 255

    Gly Trp Cys Phe Lys Leu Val Pro Val Glu Pro Asp Glu Glu Glu Asn

                260                 265                 270

    Ser Ser Leu Leu His Pro Ala Ser Leu His Gly Thr Glu Asp Thr Glu

            275                 280                 285

    Arg Glu Val Leu Lys Trp Lys Phe Asp Ser His Leu Ala Phe His His

        290                 295                 300

    Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr Lys Asp Cys Lys Leu Glu

    305                 310                 315                 320

    Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser Gln Pro

                    325                 330                 335

    Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu His Cys

                340                 345                 350

    Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly Arg Lys

            355                 360                 365

    Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr His Gln

        370                 375                 380

    Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp Pro Thr

    385                 390                 395                 400

    Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu Ala Asp

                    405                 410                 415

    Pro Phe Asp

    <210>30

    <211>387

    <212>PRT

    <213>人工序列

    <220>

    <223>含有Nef-Tat-Rev的免疫显性部分的蛋白(NTR)

    <400>30

    Met Gly Trp Pro Thr Val Arg Glu Arg Met Lys Gln Ala Glu Pro Glu

    1               5                   10                  15

    Pro Ala Ala Asp Gly Val Gly Ala Ala Ser Arg Asp Leu Glu Lys His

                20                  25                  30

    Gly Ala Ile Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala Ala Cys Ala

            35                  40                  45

    Trp Leu Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro

        50                  55                  60

    Gln Val Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu Asp Leu Ser

    65                  70                  75                  80

    His Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Pro

                    85                  90                  95

    Lys Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr

                100                 105                 110

    Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val Arg Tyr Pro

            115                 120                 125

    Leu Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Glu Pro Asp Glu

        130                 135                 140

    Glu Glu Asn Ser Ser Leu Leu His Pro Ala Ser Leu His Gly Thr Glu

    145                 150                 155                 160

    Asp Thr Glu Arg Glu Val Leu Lys Trp Lys Phe Asp Ser His Leu Ala

                    165                 170                 175

    Phe His His Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr Lys Asp Cys

                180                 185                 190

    Ala Leu Ala Ala Val Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys

            195                 200                 205

    His Pro Gly Ser Gln Pro Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys

        210                 215                 220

    Lys Cys Cys Leu His Cys Gln Val Cys Phe Thr Arg Lys Gly Leu Gly

    225                 230                 235                 240

    Ile Ser Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln

                    245                 250                 255

    Asp Ser Gln Thr His Gln Val Ser Leu Pro Lys Gln Pro Ser Ser Gln

                260                 265                 270

    Gln Arg Gly Asp Pro Thr Gly Pro Lys Lys Ser Gly Leu Ala Ile Leu

            275                 280                 285

    Leu Ser Asp Glu Glu Leu Leu Lys Thr Val Arg Leu Ile Lys Phe Leu

        290                 295                 300

    Tyr Gln Ser Asn Pro Pro Pro Ser Asn Glu Gly Thr Arg Gln Ala Arg

    305                 310                 315                 320

    Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg Gln Arg Gln Ile Arg Ser

                    325                 330                 335

    Ile Ser Glu Arg Ile Leu Ser Thr Phe Leu Gly Arg Pro Ala Glu Pro

                340                 345                 350

    Val Pro Leu Gln Leu Pro Pro Leu Glu Arg Leu Thr Leu Asp Cys Ser

            355                 360                 365

    Glu Asp Cys Gly Asn Ser Gly Thr Gln Gly Val Gly Ser Pro Gln Val

        370                 375                 380

    Leu Val Glu

    385

    <210>31

    <211>390

    <212>PRT

    <213>人工序列

    <220>

    <223>由蛋白酶位点分离(NTR)的含有Nef-Tat-Rev的免疫显性部分的蛋白

    <400>31

    Met Gly Trp Pro Thr Val Arg Glu Arg Met Lys Gln Ala Glu Pro Glu

    1               5                   10                  15

    Pro Ala Ala Asp Gly Val Gly Ala Ala Ser Arg Asp Leu Glu Lys His

                20                  25                  30

    Gly Ala Ile Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala Ala Cys Ala

            35                  40                  45

    Trp Leu Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro

        50                  55                  60

    Gln Val Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu Asp Leu Ser

    65                  70                  75                  80

    His Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Pro

                    85                  90                  95

    Lys Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr

                100                 105                 110

    Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val Arg Tyr Pro

            115                 120                 125

    Leu Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Glu Pro Asp Glu

        130                 135                 140

    Glu Glu Asn Ser Ser Leu Leu His Pro Ala Ser Leu His Gly Thr Glu

    145                 150                 155                 160

    Asp Thr Glu Arg Glu Val Leu Lys Trp Lys Phe Asp Ser His Leu Ala

                    165                 170                 175

    Phe His His Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr Lys Asp Cys

                180                 185                 190

    Ala Leu Ala Phe Lys Arg Val Glu Pro Val Asp Pro Arg Leu Glu Pro

            195                 200                 205

    Trp Lys His Pro Gly Ser Gln Pro Arg Thr Pro Cys Thr Asn Cys Tyr

        210                 215                 220

    Cys Lys Lys Cys Cys Leu His Cys Gln Val Cys Phe Thr Arg Lys Gly

    225                 230                 235                 240

    Leu Gly Ile Ser Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala

                    245                 250                 255

    Pro Gln Asp Ser Gln Thr His Gln Val Ser Leu Pro Lys Gln Pro Ser

                260                 265                 270

    Ser Gln Gln Arg Gly Asp Pro Thr Gly Pro Lys Lys Ser Val Arg Glu

            275                 280                 285

    Lys Arg Leu Leu Ser Asp Glu Glu Leu Leu Lys Thr Val Arg Leu Ile

        290                 295                 300

    Lys Phe Leu Tyr Gln Ser Asn Pro Pro Pro Ser Asn Glu Gly Thr Arg

    305                 310                 315                 320

    Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg Gln Arg Gln

                    325                 330                 335

    Ile Arg Ser Ile Ser Glu Arg Ile Leu Ser Thr Phe Leu Gly Arg Pro

                340                 345                 350

    Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg Leu Thr Leu

            355                 360                 365

    Asp Cys Ser Glu Asp Cys Gly Asn Ser Gly Thr Gln Gly Val Gly Ser

        370                 375                 380

    Pro Gln Val Leu Val Glu

    385                 390

    <210>32

    <211>386

    <212>PRT

    <213>人工序列

    <220>

    <223>含有调节蛋白Nef-Tat-Rev免疫部分的蛋白Nef的aal开始(N11TR)

    <400>32

    Met Trp Pro Thr Val Arg Glu Arg Met Lys Gln Ala Glu Pro Glu Pro

    1               5                   10                  15

    Ala Ala Asp Gly Val Gly Ala Ala Ser Arg Asp Leu Glu Lys His Gly

                20                  25                  30

    Ala Ile Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala Ala Cys Ala Trp

            35                  40                  45

    Leu Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln

        50                  55                  60

    Val Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu Asp Leu Ser His

    65                  70                  75                  80

    Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Pro Lys

                    85                  90                  95

    Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr Phe

                100                 105                 110

    Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val Arg Tyr Pro Leu

            115                 120                 125

    Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Glu Pro Asp Glu Glun

        130                 135                 140

    Glu Asn Ser Ser Leu Leu His Pro Ala Ser Leu His Gly Thr Glu Asp

    145                 150                 155                 160

    Thr Glu Arg Glu Val Leu Lys Trp Lys Phe Asp Ser His Leu Ala Phe

                    165                 170                 175

    His His Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr Lys Asp Cys Ala

                180                 185                 190

    Leu Ala Ala Val Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His

            195                 200                 205

    Pro Gly Ser Gln Pro Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys

        210                 215                 220

    Cys Cys Leu His Cys Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile

    225                 230                 235                 240

    Ser Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp

                    245                 250                 255

    Ser Gln Thr His Gln Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln

                260                 265                 270

    Arg Gly Asp Pro Thr Gly Pro Lys Lys Ser Gly Leu Ala Ile Leu Leu

            275                 280                 285

    Ser Asp Glu Glu Leu Leu Lys Thr Val Arg Leu Ile Lys Phe Leu Tyr

        290                 295                 300

    Gln Ser Asn Pro Pro Pro Ser Asn Glu Gly Thr Arg Gln Ala Arg Arg

    305                 310                 315                 320

    Asn Arg Arg Arg Arg Trp Arg Glu Arg Gln Arg Gln Ile Arg Ser Ile

                    325                 330                 335

    Ser Glu Arg Ile Leu Ser Thr Phe Leu Gly Arg Pro Ala Glu Pro Val

                340                 345                 350

    Pro Leu Gln Leu Pro Pro Leu Glu Arg Leu Thr Leu Asp Cys Ser Glu

            355                 360                 365

    Asp Cys Gly Asn Ser Gly Thr Gln Gly Val Gly Ser Pro Gln Val Leu

        370                 375                 380

    Val Glu

    385

    <210>33

    <211>389

    <212>PRT

    <213>人工序列

    <220>

    <223>由蛋白酶位点分离(N11TR)的含有调节蛋白Nef-Tat-Rev免疫显性部分的蛋白从Nef的aal起始

    <400>33

    Met Trp Pro Thr Val Arg Glu Arg Met Lys Gln Ala Glu Pro Glu Pro

    1                5                   10                  15

    Ala Ala Asp Gly Val Gly Ala Ala Ser Arg Asp Leu Glu Lys His Gly

                20                  25                  30

    Ala Ile Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala Ala Cys Ala Trp

            35                  40                  45

    Leu Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln

        50                  55                  60

    Val Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu Asp Leu Ser His

    65                  70                  75                  80

    Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Pro Lys

                    85                  90                  95

    Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr Phe

                100                 105                 110

    Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val Arg Tyr Pro Leu

            115                 120                 125

    Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Glu Pro Asp Glu Glu

        130                 135                 140

    Glu Asn Ser Ser Leu Leu His Pro Ala Ser Leu His Gly Thr Glu Asp

    145                 150                 155                 160

    Thr Glu Arg Glu Val Leu Lys Trp Lys Phe Asp Ser His Leu Ala Phe

                    165                 170                 175

    His His Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr Lys Asp Cys Ala

                180                 185                 190

    Leu Ala Phe Lys Arg Val Glu Pro Val Asp Pro Arg Leu Glu Pro Trp

            195                 200                 205

    Lys His Pro Gly Ser Gln Pro Arg Thr Pro Cys Thr Asn Cys Tyr Cys

        210                 215                 220

    Lys Lys Cys Cys Leu His Cys Gln Val Cys Phe Thr Arg Lys Gly Leu

    225                 230                 235                 240

    Gly Ile Ser Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala Pro

                    245                 250                 255

    Gln Asp Ser Gln Thr His Gln Val Ser Leu Pro Lys Gln Pro Ser Ser

                260                 265                 270

    Gln Gln Arg Gly Asp Pro Thr Gly Pro Lys Lys Ser Val Arg Glu Lys

            275                 280                 285

    Arg Leu Leu Ser Asp Glu Glu Leu Leu Lys Thr Val Arg Leu Ile Lys

        290                 295                 300

    Phe Leu Tyr Gln Ser Asn Pro Pro Pro Ser Asn Glu Gly Thr Arg Gln

    305                 310                 315                 320

    Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg Gln Arg Gln Ile

                    325                 330                 335

    Arg Ser Ile Ser Glu Arg Ile Leu Ser Thr Phe Leu Gly Arg Pro Ala

                340                 345                 350

    Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg Leu Thr Leu Asp

            355                 360                 365

    Cys Ser Glu Asp Cys Gly Asn Ser Gly Thr Gln Gly Val Gly Ser Pro

        370                 375                 380

    Gln Val Leu Val Glu

    385

    <210>34

    <211>220

    <212>PRT

    <213>人工序列

    <220>

    <223>含有毒性T-细胞表位Pol和Env基因(CTL)的蛋白

    <400>34

    Met Ile Thr Leu Trp Gln Arg Pro Leu Val Ala Leu Ile Glu Ile Cys

    1               5                   10                  15

    Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Lys Ile Gly Pro Ala Gly

                20                  25                  30

    Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp Val Gly Asp Ala Tyr

            35                  40                  45

    Phe Ser Val Pro Leu Asp Lys Asp Phe Arg Lys Tyr Thr Ala Phe Thr

        50                  55                  60

    Ile Pro Ser Ile Trp Lys Gly Ser Pro Ala Ile Phe Gln Ser Ser Met

    65                  70                  75                  80

    Thr Lys Lys Gln Asn Pro Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp

                    85                  90                  95

    Leu Tyr Val Pro Ile Val Leu Pro Glu Lys Asp Ser Trp Leu Val Gly

                100                 105                 110

    Lys Leu Asn Trp Ala Ser Gln Ile Tyr Ala Gly Ile Lys Val Lys Gln

            115                 120                 125

    Leu Ile Leu Lys Glu Pro Val His Gly Val Tyr Glu Pro Ile Val Gly

        130                 135                 140

    Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn Arg Ala Gly Asn Leu

    145                 150                 155                 160

    Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala Thr Thr

                    165                 170                 175

    Thr Leu Val Glu Arg Tyr Leu Arg Asp Gln Gln Leu Leu Gly Ile Trp

                180                 185                 190

    Gly Cys Ala Cys Thr Pro Tyr Asp Ile Asn Gln Met Leu Arg Gly Pro

            195                 200                 205

    Gly Arg Ala Phe Val Thr Ile Arg Gln Gly Ser Leu

        210                 215                 220

    <210>35

    <211>421

    <212>PRT

    <213>人工序列

    <220>

    <223>截短的Gag蛋白序列(dgag)

    <400>35

    Met Leu Asp Lys Trp Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys

    1               5                   10                  15

    Lys Tyr Gln Leu Lys His Ile Val Trp Ala Ser Arg Glu Leu Glu Arg

                20                  25                  30

    Phe Ala Val Asn Pro Gly Leu Leu Glu Thr Ser Glu Gly Cys Arg Gln

            35                  40                  45

    Ile Met Gly Gln Leu Gln Pro Ser Leu Gln Thr Gly Ser Glu Glu Leu

        50                  55                  60

    Arg Ser Leu Tyr Asn Thr Val Ala Thr Leu Tyr Cys Val His Gln Lys

    65                  70                  75                  80

    Ile Glu Val Lys Asp Thr Lys Glu Ala Leu Asp Lys Val Glu Glu Glu

                    85                  90                  95

    Gln Asn Asn Ser Lys Lys Lys Ala Gln Gln Glu Ala Ala Asp Ala Gly

                100                 105                 110

    Asn Arg Asn Gln Val Ser Gln Asn Tyr Pro Ile Val Gln Asn Leu Gln

            115                 120                 125

    Gly Gln Met Val His Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp

        130                 135                 140

    Val Lys Val Val Glu Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met

    145                 150                 155                 160

    Phe Ser Ala Leu Ser Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met

                    165                 170                 175

    Leu Asn Thr Val Gly Gly His Gln Ala Ala Met Gln Met Leu Lys Glu

                180                 185                 190

    Thr Ile Asn Glu Glu Ala Ala Glu Trp Asp Arg Leu His Pro Val His

            195                 200                 205

    Ala Gly Pro Ile Ala Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp

        210                 215                 220

    Ile Ala Gly Thr Thr Ser Thr Leu Gln Glu Gln Ile Gly Trp Met Thr

    225                 230                 235                 240

    Asn Asn Pro Pro Ile Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile

                    245                 250                 255

    Leu Gly Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu

                260                 265                 270

    Asp Ile Lys Gln Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg

            275                 280                 285

    Phe Tyr Lys Thr Leu Arg Ala Glu Gln Ala Thr Gln Glu Val Lys Asn

        290                 295                 300

    Trp Met Thr Glu Thr Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys

    305                 310                 315                 320

    Thr Ile Leu Lys Ala Leu Gly Pro Ala Ala Thr Leu Glu Glu Met Met

                    325                 330                 335

    Thr Ala Cys Gln Gly Val Gly Gly Pro Gly His Lys Ala Arg Val Leu

                340                 345                 350

    Ala Glu Ala Met Ser Gln Val Thr Gly Ser Ala Ala Ile Met Met Gln

            355                 360                 365

    Arg Gly Asn Phe Arg Asn Gln Arg Lys Thr Val Lys Cys Phe Asn Cys

        370                 375                 380

    Gly Lys Glu Gly His Ile Ala Arg Asn Cys Arg Ala Pro Arg Lys Lys

    385                 390                 395                 400

    Gly Cys Trp Lys Cys Gly Lys Glu Gly His Gln Met Lys Asp Cys Thr

                    405                 410                 415

    Glu Arg Gln Ala Asn

                420

    <210>36

    <211>363

    <212>PRT

    <213>人工序列

    <220>

    <223>Gag基因的p17/24蛋白(Syn 17/24)

    <400>36

    Met Gly Ala Arg Ala Ser Val Leu Ser Gly Gly Glu Leu Asp Lys Trp

    1               5                   10                  15

    Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys Lys Tyr Gln Leu Lys

                20                  25                  30

    His Ile Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Val Asn Pro

            35                  40                  45

    Gly Leu Leu Glu Thr Ser Glu Gly Cys Arg Gln Ile Met Gly Gln Leu

        50                  55                  60

    Gln Pro Ser Leu Gln Thr Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn

    65                  70                  75                  80

    Thr Val Ala Thr Leu Tyr Cys Val His Gln Lys Ile Glu Val Lys Asp

                    85                  90                  95

    Thr Lys Glu Ala Leu Asp Lys Val Glu Glu Glu Gln Asn Asn Ser Lys

                100                 105                 110

    Lys Lys Ala Gln Gln Glu Ala Ala Asp Ala Gly Asn Arg Asn Gln Val

            115                 120                 125

    Ser Gln Asn Tyr Pro Ile Val Gln Asn Leu Gln Gly Gln Met Val His

        130                 135                 140

    Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp Val Lys Val Val Glu

    145                 150                 155                 160

    Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met Phe Ser Ala Leu Ser

                    165                 170                 175

    Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met Leu Asn Thr Val Gly

                180                 185                 190

    Gly His Gln Ala Ala Met Gln Met Leu Lys Glu Thr Ile Asn Glu Glu

            195                 200                 205

    Ala Ala Glu Trp Asp Arg Leu His Pro Val His Ala Gly Pro Ile Ala

        210                 215                 220

    Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp Ile Ala Gly Thr Thr

    225                 230                 235                 240

    Ser Thr Leu Gln Glu Gln Ile Gly Trp Met Thr Asn Asn Pro Pro Ile

                    245                 250                 255

    Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu Gly Leu Asn Lys

                260                 265                 270

    Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu Asp Ile Lys Gln Gly

            275                 280                 285

    Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr Lys Thr Leu

        290                 295                 300

    Arg Ala Glu Gln Ala Thr Gln Glu Val Lys Asn Trp Met Thr Glu Thr

    305                 310                 315                 320

    Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Thr Ile Leu Lys Ala

                    325                 330                 335

    Leu Gly Pro Ala Ala Thr Leu Glu Glu Met Met Thr Ala Cys Gln Gly

                340                 345                 350

    Val Gly Gly Pro Gly His Lys Ala Arg Val Leu

            355                 360

    <210>37

    <211>363

    <212>PRT

    <213>人工序列

    <220>

    <223>用于在真核细胞表达的最优化的Gag基因的p17/24蛋白(optp 17/24)

    <400>37

    Met Gly Ala Arg Ala Ser Val Leu Ser Gly Gly Glu Leu Asp Lys Trp

    1               5                   10                  15

    Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys Lys Tyr Gln Leu Lys

                20                  25                  30

    His Ile Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Val Asn Pro

            35                  40                  45

    Gly Leu Leu Glu Thr Ser Glu Gly Cys Arg Gln Ile Met Gly Gln Leu

        50                  55                  60

    Gln Pro Ser Leu Gln Thr Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn

    65                  70                  75                  80

    Thr Val Ala Thr Leu Tyr Cys Val His Gln Lys Ile Glu Val Lys Asp

                    85                  90                  95

    Thr Lys Glu Ala Leu Asp Lys Val Glu Glu Glu Gln Asn Asn Ser Lys

                100                 105                 110

    Lys Lys Ala Gln Gln Glu Ala Ala Asp Ala Gly Asn Arg Asn Gln Val

            115                 120                 125

    Ser Gln Asn Tyr Pro Ile Val Gln Asn Leu Gln Gly Gln Met Val His

        130                 135                 140

    Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp Val Lys Val Val Glu

    145                 150                 155                 160

    Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met Phe Ser Ala Leu Ser

                    165                 170                 175

    Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met Leu Asn Thr Val Gly

                180                 185                 190

    Gly His Gln Ala Ala Met Gln Met Leu Lys Glu Thr Ile Asn Glu Glu

            195                 200                 205

    Ala Ala Glu Trp Asp Arg Leu His Pro Val His Ala Gly Pro Ile Ala

        210                 215                 220

    Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp Ile Ala Gly Thr Thr

    225                 230                 235                 240

    Ser Thr Leu Gln Glu Gln Ile Gly Trp Met Thr Asn Asn Pro Pro Ile

                    245                 250                 255

    Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu Gly Leu Asn Lys

                260                 265                 270

    Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu Asp Ile Lys Gln Gly

            275                 280                 285

    Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr Lys Thr Leu

        290                 295                 300

    Arg Ala Glu Gln Ala Thr Gln Glu Val Lys Asn Trp Met Thr Glu Thr

    305                 310                 315                 320

    Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Thr Ile Leu Lys Ala

                    325                 330                 335

    Leu Gly Pro Ala Ala Thr Leu Glu Glu Met Met Thr Ala Cys Gln Gly

                340                 345                 350

    Val Gly Gly Pro Gly His Lys Ala Arg Val Leu

            355                 360

    <210>38

    <211>641

    <212>PRT

    <213>人工序列

    <220>

    <223>含有Tat-Rev-Nef和CTL(TRN-CTL)的杂交蛋白

    <400>38

    Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser

    1               5                   10                  15

    Gln Pro Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu

                20                  25                  30

    His Cys Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly

            35                  40                  45

    Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr

        50                  55                  60

    His Gln Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp

    65                  70                  75                  80

    Pro Thr Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu

                    85                  90                  95

    Ala Asp Pro Phe Asp Thr Ser Ala Gly Arg Ser Gly Asp Ser Asp Glu

                100                 105                 110

    Glu Leu Leu Lys Thr Val Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn

            115                 120                 125

    Pro Pro Pro Ser Asn Glu Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg

        130                 135                 140

    Arg Arg Trp Arg Glu Arg Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg

    145                 150                 155                 160

    Ile Leu Ser Thr Phe Leu Gly Arg Pro Ala Glu Pro Val Pro Leu Gln

                    165                 170                 175

    Leu Pro Pro Leu Glu Arg Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly

                180                 185                 190

    Asn Ser Gly Thr Gln Gly Val Gly Ser Pro Gln Val Leu Val Glu Ser

            195                 200                 205

    Pro Ala Val Leu Glu Pro Gly Thr Lys Glu Lys Leu Val Gly Lys Trp

        210                 215                 220

    Ser Lys Cys Ser Gly Trp Pro Thr Val Arg Glu Arg Met Lys Gln Ala

    225                 230                 235                 240

    Glu Pro Glu Pro Ala Ala Asp Gly Val Gly Ala Ala Ser Arg Asp Leu

                    245                 250                 255

    Glu Lys His Gly Ala Ile Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala

                260                 265                 270

    Ala Cys Ala Trp Leu Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro

            275                 280                 285

    Val Arg Pro Gln Val Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu

        290                 295                 300

    Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile

    305                 310                 315                 320

    Tyr Ser Pro Lys Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr

                    325                 330                 335

    Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val

                340                 345                 350

    Arg Tyr Pro Leu Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Glu

            355                 360                 365

    Pro Asp Glu Glu Glu Asn Ser Ser Leu Leu His Pro Ala Ser Leu His

        370                 375                 380

    Gly Thr Glu Asp Thr Glu Arg Glu Val Leu Lys Trp Lys Phe Asp Ser

    385                 390                 395                 400

    His Leu Ala Phe His His Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr

                    405                 410                 415

    Lys Asp Cys Ala Ala Val Ile Thr Leu Trp Gln Arg Pro Leu Val Ala

                420                 425                 430

    Leu Ile Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Lys

            435                 440                 445

    Ile Gly Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp

        450                 455                 460

    Val Gly Asp Ala Tyr Phe Ser Val Pro Leu Asp Lys Asp Phe Arg Lys

    465                 470                 475                 480

    Tyr Thr Ala Phe Thr Ile Pro Ser Ile Trp Lys Gly Ser Pro Ala Ile

                    485                 490                 495

    Phe Gln Ser Ser Met Thr Lys Lys Gln Asn Pro Asp Ile Val Ile Tyr

                500                 505                 510

    Gln Tyr Met Asp Asp Leu Tyr Val Pro Ile Val Leu Pro Glu Lys Asp

            515                 520                 525

    Ser Trp Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Ala Gly

        530                 535                 540

    Ile Lys Val Lys Gln Leu Ile Leu Lys Glu Pro Val His Gly Val Tyr

    545                 550                 555                 560

    Glu Pro Ile Val Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn

                    565                 570                 575

    Arg Ala Gly Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp

                580                 585                 590

    Lys Glu Ala Thr Thr Thr Leu Val Glu Arg Tyr Leu Arg Asp Gln Gln

            595                 600                 605

    Leu Leu Gly Ile Trp Gly Cys Ala Cys Thr Pro Tyr Asp Ile Asn Gln

        610                 615                 620

    Met Leu Arg Gly Pro Gly Arg Ala Phe Val Thr Ile Arg Gln Gly Ser

    625                 630                 635                 640

    Leu

    <210>39

    <211>641

    <212>PRT

    <213>人工序列

    <220>

    <223>含有Rev-Nef-Tat和CTL的杂交蛋白(RNT-CTL)

    <400>39

    Met Ala Gly Arg Ser Gly Asp Ser Asp Glu Glu Leu Leu Lys Thr Val

    1               5                   10                  15

    Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn Pro Pro Pro Ser Asn Glu

                20                  25                  30

    Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg

            35                  40                  45

    Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg Ile Leu Ser Thr Phe Leu

        50                  55                  60

    Gly Arg Pro Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg

    65                  70                  75                  80

    Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly Asn Ser Gly Thr Gln Gly

                    85                  90                  95

    Val Gly Ser Pro Gln Val Leu Val Glu Ser Pro Ala Val Leu Glu Pro

                100                 105                 110

    Gly Thr Lys Glu Thr Ser Val Gly Lys Trp Ser Lys Cys Ser Gly Trp

            115                 120                 125

    Pro Thr Val Arg Glu Arg Met Lys Gln Ala Glu Pro Glu Pro Ala Ala

        130                 135                 140

    Asp Gly Val Gly Ala Ala Ser Arg Asp Leu Glu Lys His Gly Ala Ile

    145                 150                 155                 160

    Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala Ala Cys Ala Trp Leu Glu

                    165                 170                 175

    Ala Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln Val Pro

                180                 185                 190

    Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu Asp Leu Ser His Phe Leu

            195                 200                 205

    Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Pro Lys Arg Gln

        210                 215                 220

    Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr Phe Pro Asp

    225                 230                 235                 240

    Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val Arg Tyr Pro Leu Thr Phe

                    245                 250                 255

    Gly Trp Cys Phe Lys Leu Val Pro Val Glu Pro Asp Glu Glu Glu Asn

                260                 265                 270

    Ser Ser Leu Leu His Pro Ala Ser Leu His Gly Thr Glu Asp Thr Glu

            275                 280                 285

    Arg Glu Val Leu Lys Trp Lys Phe Asp Ser His Leu Ala Phe His His

        290                 295                 300

    Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr Lys Asp Cys Lys Leu Glu

    305                 310                 315                 320

    Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser Gln Pro

                    325                 330                 335

    Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu His Cys

                340                 345                 350

    Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly Arg Lys

            355                 360                 365

    Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr His Gln

        370                 375                 380

    Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp Pro Thr

    385                 390                 395                 400

    Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu Ala Asp

                    405                 410                 415

    Pro Phe Asp Ala Ala Val Ile Thr Leu Trp Gln Arg Pro Leu Val Ala

                420                 425                 430

    Leu Ile Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Lys

            435                 440                 445

    Ile Gly Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp

        450                 455                 460

    Val Gly Asp Ala Tyr Phe Ser Val Pro Leu Asp Lys Asp Phe Arg Lys

    465                 470                 475                 480

    Tyr Thr Ala Phe Thr Ile Pro Ser Ile Trp Lys Gly Ser Pro Ala Ile

                    485                 490                 495

    Phe Gln Ser Ser Met Thr Lys Lys Gln Asn Pro Asp Ile Val Ile Tyr

                500                 505                 510

    Gln Tyr Met Asp Asp Leu Tyr Val Pro Ile Val Leu Pro Glu Lys Asp

            515                 520                 525

    Ser Trp Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Ala Gly

        530                 535                 540

    Ile Lys Val Lys Gln Leu Ile Leu Lys Glu Pro Val His Gly Val Tyr

    545                 550                 555                 560

    Glu Pro Ile Val Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn

                    565                 570                 575

    Arg Ala Gly Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp

                580                 585                 590

    Lys Glu Ala Thr Thr Thr Leu Val Glu Arg Tyr Leu Arg Asp Gln Gln

            595                 600                 605

    Leu Leu Gly Ile Trp Gly Cys Ala Cys Thr Pro Tyr Asp Ile Asn Gln

        610                 615                 620

    Met Leu Arg Gly Pro Gly Arg Ala Phe Val Thr Ile Arg Gln Gly Ser

    625                 630                 635                 640

    Leu

    <210>40

    <211>842

    <212>PRT

    <213>人工序列

    <220>

    <223>含有Tat-Rev-Nef和截短的Gag蛋白(TRN-dgag)的杂交蛋白的编码序列

    <400>40

    Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser

    1               5                   10                  15

    Gln Pro Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu

                20                  25                  30

    His Cys Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly

            35                  40                  45

    Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr

        50                  55                  60

    His Gln Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp

    65                  70                  75                  80

    Pro Thr Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu

                    85                  90                  95

    Ala Asp Pro Phe Asp Thr Ser Ala Gly Arg Ser Gly Asp Ser Asp Glu

                100                 105                 110

    Glu Leu Leu Lys Thr Val Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn

            115                 120                 125

    Pro Pro Pro Ser Asn Glu Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg

        130                 135                 140

    Arg Arg Trp Arg Glu Arg Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg

    145                 150                 155                 160

    Ile Leu Ser Thr Phe Leu Gly Arg Pro Ala Glu Pro Val Pro Leu Gln

                    165                 170                 175

    Leu Pro Pro Leu Glu Arg Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly

                180                 185                 190

    Asn Ser Gly Thr Gln Gly Val Gly Ser Pro Gln Val Leu Val Glu Ser

            195                 200                 205

    Pro Ala Val Leu Glu Pro Gly Thr Lys Glu Lys Leu Val Gly Lys Trp

        210                 215                 220

    Ser Lys Cys Ser Gly Trp Pro Thr Val Arg Glu Arg Met Lys Gln Ala

    225                 230                 235                 240

    Glu Pro Glu Pro Ala Ala Asp Gly Val Gly Ala Ala Ser Arg Asp Leu

                    245                 250                 255

    Glu Lys His Gly Ala Ile Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala

                260                 265                 270

    Ala Cys Ala Trp Leu Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro

            275                 280                 285

    Val Arg Pro Gln Val Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu

        290                 295                 300

    Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile

    305                 310                 315                 320

    Tyr Ser Pro Lys Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr

                    325                 330                 335

    Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val

                340                 345                 350

    Arg Tyr Pro Leu Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Glu

            355                 360                 365

    Pro Asp Glu Glu Glu Asn Ser Ser Leu Leu His Pro Ala Ser Leu His

        370                 375                 380

    Gly Thr Glu Asp Thr Glu Arg Glu Val Leu Lys Trp Lys Phe Asp Ser

    385                 390                 395                 400

    His Leu Ala Phe His His Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr

                    405                 410                 415

    Lys Asp Cys Ala Ala Val Leu Asp Lys Trp Glu Lys Ile Arg Leu Arg

                420                 425                 430

    Pro Gly Gly Lys Lys Lys Tyr Gln Leu Lys His Ile Val Trp Ala Ser

            435                 440                 445

    Arg Glu Leu Glu Arg Phe Ala Val Asn Pro Gly Leu Leu Glu Thr Ser

        450                 455                 460

    Glu Gly Cys Arg Gln Ile Met Gly Gln Leu Gln Pro Ser Leu Gln Thr

    465                 470                 475                 480

    Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn Thr Val Ala Thr Leu Tyr

                    485                 490                 495

    Cys Val His Gln Lys Ile Glu Val Lys Asp Thr Lys Glu Ala Leu Asp

                500                 505                 510

    Lys Val Glu Glu Glu Gln Asn Asn Ser Lys Lys Lys Ala Gln Gln Glu

            515                 520                 525

    Ala Ala Asp Ala Gly Asn Arg Asn Gln Val Ser Gln Asn Tyr Pro Ile

        530                 535                 540

    Val Gln Asn Leu Gln Gly Gln Met Val His Gln Ala Ile Ser Pro Arg

    545                 550                 555                 560

    Thr Leu Asn Ala Trp Val Lys Val Val Glu Glu Lys Ala Phe Ser Pro

                    565                 570                 575

    Glu Val Ile Pro Met Phe Ser Ala Leu Ser Glu Gly Ala Thr Pro Gln

                580                 585                 590

    Asp Leu Asn Thr Met Leu Asn Thr Val Gly Gly His Gln Ala Ala Met

            595                 600                 605

    Gln Met Leu Lys Glu Thr Ile Asn Glu Glu Ala Ala Glu Trp Asp Arg

        610                 615                 620

    Leu His Pro Val His Ala Gly Pro Ile Ala Pro Gly Gln Met Arg Glu

    625                 630                 635                 640

    Pro Arg Gly Ser Asp Ile Ala Gly Thr Thr Ser Thr Leu Gln Glu Gln

                    645                 650                 655

    Ile Gly Trp Met Thr Asn Asn Pro Pro Ile Pro Val Gly Glu Ile Tyr

                660                 665                 670

    Lys Arg Trp Ile Ile Leu Gly Leu Asn Lys Ile Val Arg Met Tyr Ser

            675                 680                 685

    Pro Thr Ser Ile Leu Asp Ile Lys Gln Gly Pro Lys Glu Pro Phe Arg

        690                 695                 700

    Asp Tyr Val Asp Arg Phe Tyr Lys Thr Leu Arg Ala Glu Gln Ala Thr

    705                 710                 715                 720

    Gln Glu Val Lys Asn Trp Met Thr Glu Thr Leu Leu Val Gln Asn Ala

                    725                 730                 735

    Asn Pro Asp Cys Lys Thr Ile Leu Lys Ala Leu Gly Pro Ala Ala Thr

                740                 745                 750

    Leu Glu Glu Met Met Thr Ala Cys Gln Gly Val Gly Gly Pro Gly His

            755                 760                 765

    Lys Ala Arg Val Leu Ala Glu Ala Met Ser Gln Val Thr Gly Ser Ala

        770                 775                 780

    Ala Ile Met Met Gln Arg Gly Asn Phe Arg Asn Gln Arg Lys Thr Val

    785                 790                 795                 800

    Lys Cys Phe Asn Cys Gly Lys Glu Gly His Ile Ala Arg Asn Cys Arg

                    805                 810                 815

    Ala Pro Arg Lys Lys Gly Cys Trp Lys Cys Gly Lys Glu Gly His Gln

                820                 825                 830

    Met Lys Asp Cys Thr Glu Arg Gln Ala Asn

            835                 840

    <210>41

    <211>1064

    <212>PRT

    <213>人工序列

    <220>

    <223>含有Tat-Rev-Nef，CTL和截短的Gag蛋白(TRN-TCL-dgag)的杂交蛋白的编码序列

    <400>41

    Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser

    1               5                   10                  15

    Gln Pro Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu

                20                  25                  30

    His Cys Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly

            35                  40                  45

    Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr

        50                  55                  60

    His Gln Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp

    65                  70                  75                  80

    Pro Thr Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu

                    85                  90                  95

    Ala Asp Pro Phe Asp Thr Ser Ala Gly Arg Ser Gly Asp Ser Asp Glu

                100                 105                 110

    Glu Leu Leu Lys Thr Val Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn

            115                 120                 125

    Pro Pro Pro Ser Asn Glu Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg

        130                 135                 140

    Arg Arg Trp Arg Glu Arg Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg

    145                 150                 155                 160

    Ile Leu Ser Thr Phe Leu Gly Arg Pro Ala Glu Pro Val Pro Leu Gln

                    165                 170                 175

    Leu Pro Pro Leu Glu Arg Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly

                180                 185                 190

    Asn Ser Gly Thr Gln Gly Val Gly Ser Pro Gln Val Leu Val Glu Ser

            195                 200                 205

    Pro Ala Val Leu Glu Pro Gly Thr Lys Glu Lys Leu Val Gly Lys Trp

        210                 215                 220

    Ser Lys Cys Ser Gly Trp Pro Thr Val Arg Glu Arg Met Lys Gln Ala

    225                 230                 235                 240

    Glu Pro Glu Pro Ala Ala Asp Gly Val Gly Ala Ala Ser Arg Asp Leu

                    245                 250                 255

    Glu Lys His Gly Ala Ile Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala

                260                 265                 270

    Ala Cys Ala Trp Leu Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro

            275                 280                 285

    Val Arg Pro Gln Val Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu

        290                 295                 300

    Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly Leu Glu GIy Leu Ile

    305                 310                 315                 320

    Tyr Ser Pro Lys Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr

                    325                 330                 335

    Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val

                340                 345                 350

    Arg Tyr Pro Leu Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Glu

            355                 360                 365

    Pro Asp Glu Glu Glu Asn Ser Ser Leu Leu His Pro Ala Ser Leu His

        370                 375                 380

    Gly Thr Glu Asp Thr Glu Arg Glu Val Leu Lys Trp Lys Phe Asp Ser

    385                 390                 395                 400

    His Leu Ala Phe His His Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr

                    405                 410                 415

    Lys Asp Cys Ala Ala Val Ile Thr Leu Trp Gln Arg Pro Leu Val Ala

                420                 425                 430

    Leu Ile Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Lys

            435                 440                 445

    Ile Gly Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp

        450                 455                 460

    Val Gly Asp Ala Tyr Phe Ser Val Pro Leu Asp Lys Asp Phe Arg Lys

    465                 470                 475                 480

    Tyr Thr Ala Phe Thr Ile Pro Ser Ile Trp Lys Gly Ser Pro Ala Ile

                    485                 490                 495

    Phe Gln Ser Ser Met Thr Lys Lys Gln Asn Pro Asp Ile Val Ile Tyr

                500                 505                 510

    Gln Tyr Met Asp Asp Leu Tyr Val Pro Ile Val Leu Pro Glu Lys Asp

            515                 520                 525

    Ser Trp Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Ala Gly

        530                 535                 540

    Ile Lys Val Lys Gln Leu Ile Leu Lys Glu Pro Val His Gly Val Tyr

    545                 550                 555                 560

    Glu Pro Ile Val Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn

                    565                 570                 575

    Arg Ala Gly Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp

                580                 585                 590

    Lys Glu Ala Thr Thr Thr Leu Val Glu Arg Tyr Leu Arg Asp Gln Gln

            595                 600                 605

    Leu Leu Gly Ile Trp Gly Cys Ala Cys Thr Pro Tyr Asp Ile Asn Gln

        610                 615                 620

    Met Leu Arg Gly Pro Gly Arg Ala Phe Val Thr Ile Arg Gln Gly Ser

    625                 630                 635                 640

    Leu Ala Ala Val Leu Asp Lys Trp Glu Lys Ile Arg Leu Arg Pro Gly

                    645                 650                 655

    Gly Lys Lys Lys Tyr Gln Leu Lys His Ile Val Trp Ala Ser Arg Glu

                660                 665                 670

    Leu Glu Arg Phe Ala Val Asn Pro Gly Leu Leu Glu Thr Ser Glu Gly

            675                 680                 685

    Cys Arg Gln Ile Met Gly Gln Leu Gln Pro Ser Leu Gln Thr Gly Ser

        690                 695                 700

    Glu Glu Leu Arg Ser Leu Tyr Asn Thr Val Ala Thr Leu Tyr Cys Val

    705                 710                 715                 720

    His Gln Lys Ile Glu Val Lys Asp Thr Lys Glu Ala Leu Asp Lys Val

                    725                 730                 735

    Glu Glu Glu Gln Asn Asn Ser Lys Lys Lys Ala Gln Gln Glu Ala Ala

                740                 745                 750

    Asp Ala Gly Asn Arg Asn Gln Val Ser Gln Asn Tyr Pro Ile Val Gln

            755                 760                 765

    Asn Leu Gln Gly Gln Met Val His Gln Ala Ile Ser Pro Arg Thr Leu

        770                 775                 780

    Asn Ala Trp Val Lys Val Val Glu Glu Lys Ala Phe Ser Pro Glu Val

    785                 790                 795                 800

    Ile Pro Met Phe Ser Ala Leu Ser Glu Gly Ala Thr Pro Gln Asp Leu

                    805                 810                 815

    Asn Thr Met Leu Asn Thr Val Gly Gly His Gln Ala Ala Met Gln Met

                820                 825                 830

    Leu Lys Glu Thr Ile Asn Glu Glu Ala Ala Glu Trp Asp Arg Leu His

            835                 840                 845

    Pro Val His Ala Gly Pro Ile Ala Pro Gly Gln Met Arg Glu Pro Arg

        850                 855                 860

    Gly Ser Asp Ile Ala Gly Thr Thr Ser Thr Leu Gln Glu Gln Ile Gly

    865                 870                 875                 880

    Trp Met Thr Asn Asn Pro Pro Ile Pro Val Gly Glu Ile Tyr Lys Arg

                    885                 890                 895

    Trp Ile Ile Leu Gly Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Thr

                900                 905                 910

    Ser Ile Leu Asp Ile Lys Gln Gly Pro Lys Glu Pro Phe Arg Asp Tyr

            915                 920                 925

    Val Asp Arg Phe Tyr Lys Thr Leu Arg Ala Glu Gln Ala Thr Gln Glu

        930                 935                 940

    Val Lys Asn Trp Met Thr Glu Thr Leu Leu Val Gln Asn Ala Asn Pro

    945                 950                 955                 960

    Asp Cys Lys Thr Ile Leu Lys Ala Leu Gly Pro Ala Ala Thr Leu Glu

                    965                 970                 975

    Glu Met Met Thr Ala Cys Gln Gly Val Gly Gly Pro Gly His Lys Ala

                980                 985                 990

    Arg Val Leu Ala Glu Ala Met Ser Gln Val Thr Gly Ser Ala Ala Ile

            995                 1000                1005

    Met Met  Gln Arg Gly Asn Phe  Arg Asn Gln Arg Lys  Thr Val Lys

        1010                 1015                 1020

    Cys Phe  Asn Cys Gly Lys Glu  Gly His Ile Ala Arg  Asn Cys Arg

        1025                 1030                 1035

    Ala Pro  Arg Lys Lys Gly Cys  Trp Lys Cys Gly Lys  Glu Gly His

        1040                 1045                 1050

    Gln Met  Lys Asp Cys Thr Glu  Arg Gln Ala Asn

        1055                 1060

    <210>42

    <211>1064

    <212>PRT

    <213>人工序列

    <220>

    <223>含有Tat-Rev-Nef，CTL和截短的Gag蛋白(TRN-CTL-dgag)的杂交蛋白

    <400>42

    Met Ala Gly Arg Ser Gly Asp Ser Asp Glu Glu Leu Leu Lys Thr Val

    1               5                   10                  15

    Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn Pro Pro Pro Ser Asn Glu

                20                  25                  30

    Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg

            35                  40                  45

    Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg Ile Leu Ser Thr Phe Leu

        50                  55                  60

    Gly Arg Pro Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg

    65                  70                  75                  80

    Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly Asn Ser Gly Thr Gln Gly

                    85                  90                  95

    Val Gly Ser Pro Gln Val Leu Val Glu Ser Pro Ala Val Leu Glu Pro

                100                 105                 110

    Gly Thr Lys Glu Thr Ser Val Gly Lys Trp Ser Lys Cys Ser Gly Trp

            115                 120                 125

    Pro Thr Val Arg Glu Arg Met Lys Gln Ala Glu Pro Glu Pro Ala Ala

        130                 135                 140

    Asp Gly Val Gly Ala Ala Ser Arg Asp Leu Glu Lys His Gly Ala Ile

    145                 150                 155                 160

    Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala Ala Cys Ala Trp Leu Glu

                    165                 170                 175

    Ala Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln Val Pro

                180                 185                 190

    Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu Asp Leu Ser His Phe Leu

            195                 200                 205

    Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Pro Lys Arg Gln

        210                 215                 220

    Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr Phe Pro Asp

    225                 230                 235                 240

    Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val Arg Tyr Pro Leu Thr Phe

                    245                 250                 255

    Gly Trp Cys Phe Lys Leu Val Pro Val Glu Pro Asp Glu Glu Glu Asn

                260                 265                 270

    Ser Ser Leu Leu His Pro Ala Ser Leu His Gly Thr Glu Asp Thr Glu

            275                 280                 285

    Arg Glu Val Leu Lys Trp Lys Phe Asp Ser His Leu Ala Phe His His

        290                 295                 300

    Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr Lys Asp Cys Lys Leu Glu

    305                 310                 315                 320

    Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser Gln Pro

                    325                 330                 335

    Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu His Cys

                340                 345                 350

    Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly Arg Lys

            355                 360                 365

    Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr His Gln

        370                 375                 380

    Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp Pro Thr

    385                 390                 395                 400

    Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu Ala Asp

                    405                 410                 415

    Pro Phe Asp Ala Ala Val Ile Thr Leu Trp Gln Arg Pro Leu Val Ala

                420                 425                 430

    Leu Ile Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Lys

            435                 440                 445

    Ile Gly Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp

        450                 455                 460

    Val Gly Asp Ala Tyr Phe Ser Val Pro Leu Asp Lys Asp Phe Arg Lys

    465                 470                 475                 480

    Tyr Thr Ala Phe Thr Ile Pro Ser Ile Trp Lys Gly Ser Pro Ala Ile

                    485                 490                 495

    Phe Gln Ser Ser Met Thr Lys Lys Gln Asn Pro Asp Ile Val Ile Tyr

                500                 505                 510

    Gln Tyr Met Asp Asp Leu Tyr Val Pro Ile Val Leu Pro Glu Lys Asp

            515                 520                 525

    Ser Trp Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Ala Gly

        530                 535                 540

    Ile Lys Val Lys Gln Leu Ile Leu Lys Glu Pro Val His Gly Val Tyr

    545                 550                 555                 560

    Glu Pro Ile Val Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn

                    565                 570                 575

    Arg Ala Gly Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp

                580                 585                 590

    Lys Glu Ala Thr Thr Thr Leu Val Glu Arg Tyr Leu Arg Asp Gln Gln

            595                 600                 605

    Leu Leu Gly Ile Trp Gly Cys Ala Cys Thr Pro Tyr Asp Ile Asn Gln

        610                 615                 620

    Met Leu Arg Gly Pro Gly Arg Ala Phe Val Thr Ile Arg Gln Gly Ser

    625                 630                 635                 640

    Leu Ala Ala Val Leu Asp Lys Trp Glu Lys Ile Arg Leu Arg Pro Gly

                    645                 650                 655

    Gly Lys Lys Lys Tyr Gln Leu Lys His Ile Val Trp Ala Ser Arg Glu

                660                 665                 670

    Leu Glu Arg Phe Ala Val Asn Pro Gly Leu Leu Glu Thr Ser Glu Gly

            675                 680                 685

    Cys Arg Gln Ile Met Gly Gln Leu Gln Pro Ser Leu Gln Thr Gly Ser

        690                 695                 700

    Glu Glu Leu Arg Ser Leu Tyr Asn Thr Val Ala Thr Leu Tyr Cys Val

    705                 710                 715                 720

    His Gln Lys Ile Glu Val Lys Asp Thr Lys Glu Ala Leu Asp Lys Val

                    725                 730                 735

    Glu Glu Glu Gln Asn Asn Ser Lys Lys Lys Ala Gln Gln Glu Ala Ala

                740                 745                 750

    Asp Ala Gly Asn Arg Asn Gln Val Ser Gln Asn Tyr Pro Ile Val Gln

            755                 760                 765

    Asn Leu Gln Gly Gln Met Val His Gln Ala Ile Ser Pro Arg Thr Leu

        770                 775                 780

    Asn Ala Trp Val Lys Val Val Glu Glu Lys Ala Phe Ser Pro Glu Val

    785                 790                 795                 800

    Ile Pro Met Phe Ser Ala Leu Ser Glu Gly Ala Thr Pro Gln Asp Leu

                    805                 810                 815

    Asn Thr Met Leu Asn Thr Val Gly Gly His Gln Ala Ala Met Gln Met

                820                 825                 830

    Leu Lys Glu Thr Ile Asn Glu Glu Ala Ala Glu Trp Asp Arg Leu His

            835                 840                 845

    Pro Val His Ala Gly Pro Ile Ala Pro Gly Gln Met Arg Glu Pro Arg

        850                 855                 860

    Gly Ser Asp Ile Ala Gly Thr Thr Ser Thr Leu Gln Glu Gln Ile Gly

    865                 870                 875                 880

    Trp Met Thr Asn Asn Pro Pro Ile Pro Val Gly Glu Ile Tyr Lys Arg

                    885                 890                 895

    Trp Ile Ile Leu Gly Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Thr

                900                 905                 910

    Ser Ile Leu Asp Ile Lys Gln Gly Pro Lys Glu Pro Phe Arg Asp Tyr

            915                 920                 925

    Val Asp Arg Phe Tyr Lys Thr Leu Arg Ala Glu Gln Ala Thr Gln Glu

        930                 935                 940

    Val Lys Asn Trp Met Thr Glu Thr Leu Leu Val Gln Asn Ala Asn Pro

    945                 950                 955                 960

    Asp Cys Lys Thr Ile Leu Lys Ala Leu Gly Pro Ala Ala Thr Leu Glu

                    965                 970                 975

    Glu Met Met Thr Ala Cys Gln Gly Val Gly Gly Pro Gly His Lys Ala

                980                 985                 990

    Arg Val Leu Ala Glu Ala Met Ser  Gln Val Thr Gly Ser  Ala Ala Ile

            995                 1000                 1005

    Met Met  Gln Arg Gly Asn Phe  Arg Asn Gln Arg Lys  Thr Val Lys

        1010                 1015                 1020

    Cys Phe  Asn Cys Gly Lys Glu  Gly His Ile Ala Arg  Asn Cys Arg

        1025                 1030                 1035

    Ala Pro  Arg Lys Lys Gly Cys  Trp Lys Cys Gly Lys  Glu Gly His

        1040                 1045                 1050

    Gln Met  Lys Asp Cys Thr Glu  Arg Gln Ala Asn

        1055                 1060

    <210>43

    <211>1064

    <212>PRT

    <213>人工序列

    <220>

    <223>含有Tat-Rev-Nef，截短的Gag蛋白和CTL(TRN-dgag-CTL)的杂交蛋白

    <400>43

    Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser

     1              5                   10                  15

    Gln Pro Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu

                20                  25                  30

    His Cys Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly

            35                  40                  45

    Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr

        50                  55                  60

    His Gln Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp

    65                  70                  75                  80

    Pro Thr Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu

                    85                  90                  95

    Ala Asp Pro Phe Asp Thr Ser Ala Gly Arg Ser Gly Asp Ser Asp Glu

                100                 105                 110

    Glu Leu Leu Lys Thr Val Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn

            115                 120                 125

    Pro Pro Pro Ser Asn Glu Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg

        130                 135                 140

    Arg Arg Trp Arg Glu Arg Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg

    145                 150                 155                 160

    Ile Leu Ser Thr Phe Leu Gly Arg Pro Ala Glu Pro Val Pro Leu Gln

                    165                 170                 175

    Leu Pro Pro Leu Glu Arg Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly

                180                 185                 190

    Asn Ser Gly Thr Gln Gly Val Gly Ser Pro Gln Val Leu Val Glu Ser

            195                 200                 205

    Pro Ala Val Leu Glu Pro Gly Thr Lys Glu Lys Leu Val Gly Lys Trp

        210                 215                 220

    Ser Lys Cys Ser Gly Trp Pro Thr Val Arg Glu Arg Met Lys Gln Ala

    225                 230                 235                 240

    Glu Pro Glu Pro Ala Ala Asp Gly Val Gly Ala Ala Ser Arg Asp Leu

                    245                 250                 255

    Glu Lys His Gly Ala Ile Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala

                260                 265                 270

    Ala Cys Ala Trp Leu Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro

            275                 280                 285

    Val Arg Pro Gln Val Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu

        290                 295                 300

    Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile

    305                 310                 315                 320

    Tyr Ser Pro Lys Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr

                    325                 330                 335

    Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val

                340                 345                 350

    Arg Tyr Pro Leu Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Glu

            355                 360                 365

    Pro Asp Glu Glu Glu Asn Ser Ser Leu Leu His Pro Ala Ser Leu His

        370                 375                 380

    Gly Thr Glu Asp Thr Glu Arg Glu Val Leu Lys Trp Lys Phe Asp Ser

    385                 390                 395                 400

    His Leu Ala Phe His His Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr

                    405                 410                 415

    Lys Asp Cys Ala Ala Val Leu Asp Lys Trp Glu Lys Ile Arg Leu Arg

                420                 425                 430

    Pro Gly Gly Lys Lys Lys Tyr Gln Leu Lys His Ile Val Trp Ala Ser

            435                 440                 445

    Arg Glu Leu Glu Arg Phe Ala Val Asn Pro Gly Leu Leu Glu Thr Ser

        450                 455                 460

    Glu Gly Cys Arg Gln Ile Met Gly Gln Leu Gln Pro Ser Leu Gln Thr

    465                 470                 475                 480

    Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn Thr Val Ala Thr Leu Tyr

                    485                 490                 495

    Cys Val His Gln Lys Ile Glu Val Lys Asp Thr Lys Glu Ala Leu Asp

                500                 505                 510

    Lys Val Glu Glu Glu Gln Asn Asn Ser Lys Lys Lys Ala Gln Gln Glu

            515                 520                 525

    Ala Ala Asp Ala Gly Asn Arg Asn Gln Val Ser Gln Asn Tyr Pro Ile

        530                 535                 540

    Val Gln Asn Leu Gln Gly Gln Met Val His Gln Ala Ile Ser Pro Arg

    545                 550                 555                 560

    Thr Leu Asn Ala Trp Val Lys Val Val Glu Glu Lys Ala Phe Ser Pro

                    565                 570                 575

    Glu Val Ile Pro Met Phe Ser Ala Leu Ser Glu Gly Ala Thr Pro Gln

                580                 585                 590

    Asp Leu Asn Thr Met Leu Asn Thr Val Gly Gly His Gln Ala Ala Met

            595                 600                 605

    Gln Met Leu Lys Glu Thr Ile Asn Glu Glu Ala Ala Glu Trp Asp Arg

        610                 615                 620

    Leu His Pro Val His Ala Gly Pro Ile Ala Pro Gly Gln Met Arg Glu

    625                 630                 635                 640

    Pro Arg Gly Ser Asp Ile Ala Gly Thr Thr Ser Thr Leu Gln Glu Gln

                    645                 650                 655

    Ile Gly Trp Met Thr Asn Asn Pro Pro Ile Pro Val Gly Glu Ile Tyr

                660                 665                 670

    Lys Arg Trp Ile Ile Leu Gly Leu Asn Lys Ile Val Arg Met Tyr Ser

            675                 680                 685

    Pro Thr Ser Ile Leu Asp Ile Lys Gln Gly Pro Lys Glu Pro Phe Arg

        690                 695                 700

    Asp Tyr Val Asp Arg Phe Tyr Lys Thr Leu Arg Ala Glu Gln Ala Thr

    705                 710                 715                 720

    Gln Glu Val Lys Asn Trp Met Thr Glu Thr Leu Leu Val Gln Asn Ala

                    725                 730                 735

    Asn Pro Asp Cys Lys Thr Ile Leu Lys Ala Leu Gly Pro Ala Ala Thr

                740                 745                 750

    Leu Glu Glu Met Met Thr Ala Cys Gln Gly Val Gly Gly Pro Gly His

            755                 760                 765

    Lys Ala Arg Val Leu Ala Glu Ala Met Ser Gln Val Thr Gly Ser Ala

        770                 775                 780

    Ala Ile Met Met Gln Arg Gly Asn Phe Arg Asn Gln Arg Lys Thr Val

    785                 790                 795                 800

    Lys Cys Phe Asn Cys Gly Lys Glu Gly His Ile Ala Arg Asn Cys Arg

                    805                 810                 815

    Ala Pro Arg Lys Lys Gly Cys Trp Lys Cys Gly Lys Glu Gly His Gln

                820                 825                 830

    Met Lys Asp Cys Thr Glu Arg Gln Ala Asn Ala Ala Val Ile Thr Leu

            835                 840                 845

    Trp Gln Arg Pro Leu Val Ala Leu Ile Glu Ile Cys Thr Glu Met Glu

        850                 855                 860

    Lys Glu Gly Lys Ile Ser Lys Ile Gly Pro Ala Gly Leu Lys Lys Lys

    865                 870                 875                 880

    Lys Ser Val Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser Val Pro

                    885                 890                 895

    Leu Asp Lys Asp Phe Arg Lys Tyr Thr Ala Phe Thr Ile Pro Ser Ile

                900                 905                 910

    Trp Lys Gly Ser Pro Ala Ile Phe Gln Ser Ser Met Thr Lys Lys Gln

            915                 920                 925

    Asn Pro Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp Leu Tyr Val Pro

        930                 935                 940

    Ile Val Leu Pro Glu Lys Asp Ser Trp Leu Val Gly Lys Leu Asn Trp

    945                 950                 955                 960

    Ala Ser Gln Ile Tyr Ala Gly Ile Lys Val Lys Gln Leu Ile Leu Lys

                    965                 970                 975

    Glu Pro Val His Gly Val Tyr Glu Pro Ile Val Gly Ala Glu Thr Phe

                980                 985                 990

    Tyr Val Asp Gly Ala Ala Asn Arg  Ala Gly Asn Leu Trp  Val Thr Val

            995                 1000                 1005

    Tyr Tyr  Gly Val Pro Val Trp  Lys Glu Ala Thr Thr  Thr Leu Val

        1010                 1015                 1020

    Glu Arg  Tyr Leu Arg Asp Gln  Gln Leu Leu Gly Ile  Trp Gly Cys

        1025                 1030                 1035

    Ala Cys  Thr Pro Tyr Asp Ile  Asn Gln Met Leu Arg  Gly Pro Gly

        1040                 1045                 1050

    Arg Ala  Phe Val Thr Ile Arg  Gln Gly Ser Leu

        1055                 1060

    <210>44

    <211>1064

    <212>PRT

    <213>人工序列

    <220>

    <223>含有Rev-Nef-Tat，截短的Gag蛋白和CTL(RNT-dgag-CTL)的杂交蛋白

    <400>44

    Met Ala Gly Arg Ser Gly Asp Ser Asp Glu Glu Leu Leu Lys Thr Val

    1               5                   10                  15

    Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn Pro Pro Pro Ser Asn Glu

                20                  25                  30

    Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg

            35                  40                  45

    Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg Ile Leu Ser Thr Phe Leu

        50                  55                  60

    Gly Arg Pro Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg

    65                  70                  75                  80

    Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly Asn Ser Gly Thr Gln Gly

                    85                  90                  95

    Val Gly Ser Pro Gln Val Leu Val Glu Ser Pro Ala Val Leu Glu Pro

                100                 105                 110

    Gly Thr Lys Glu Thr Ser Val Gly Lys Trp Ser Lys Cys Ser Gly Trp

            115                 120                 125

    Pro Thr Val Arg Glu Arg Met Lys Gln Ala Glu Pro Glu Pro Ala Ala

        130                 135                 140

    Asp Gly Val Gly Ala Ala Ser Arg Asp Leu Glu Lys His Gly Ala Ile

    145                 150                 155                 160

    Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala Ala Cys Ala Trp Leu Glu

                    165                 170                 175

    Ala Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln Val Pro

                180                 185                 190

    Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu Asp Leu Ser His Phe Leu

            195                 200                 205

    Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Pro Lys Arg Gln

        210                 215                 220

    Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr Phe Pro Asp

    225                 230                 235                 240

    Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val Arg Tyr Pro Leu Thr Phe

                    245                 250                 255

    Gly Trp Cys Phe Lys Leu Val Pro Val Glu Pro Asp Glu Glu Glu Asn

                260                 265                 270

    Ser Ser Leu Leu His Pro Ala Ser Leu His Gly Thr Glu Asp Thr Glu

            275                 280                 285

    Arg Glu Val Leu Lys Trp Lys Phe Asp Ser His Leu Ala Phe His His

        290                 295                 300

    Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr Lys Asp Cys Lys Leu Glu

    305                 310                 315                 320

    Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser Gln Pro

                    325                 330                 335

    Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu His Cys

                340                 345                 350

    Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly Arg Lys

            355                 360                 365

    Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr His Gln

        370                 375                 380

    Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp Pro Thr

    385                 390                 395                 400

    Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu Ala Asp

                    405                 410                 415

    Pro Phe Asp Ala Ala Val Leu Asp Lys Trp Glu Lys Ile Arg Leu Arg

                420                 425                 430

    Pro Gly Gly Lys Lys Lys Tyr Gln Leu Lys His Ile Val Trp Ala Ser

            435                 440                 445

    Arg Glu Leu Glu Arg Phe Ala Val Asn Pro Gly Leu Leu Glu Thr Ser

        450                 455                 460

    Glu Gly Cys Arg Gln Ile Met Gly Gln Leu Gln Pro Ser Leu Gln Thr

    465                 470                 475                 480

    Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn Thr Val Ala Thr Leu Tyr

                    485                 490                 495

    Cys Val His Gln Lys Ile Glu Val Lys Asp Thr Lys Glu Ala Leu Asp

                500                 505                 510

    Lys Val Glu Glu Glu Gln Asn Asn Ser Lys Lys Lys Ala Gln Gln Glu

            515                 520                 525

    Ala Ala Asp Ala Gly Asn Arg Asn Gln Val Ser Gln Asn Tyr Pro Ile

        530                 535                 540

    Val Gln Asn Leu Gln Gly Gln Met Val His Gln Ala Ile Ser Pro Arg

    545                 550                 555                 560

    Thr Leu Asn Ala Trp Val Lys Val Val Glu Glu Lys Ala Phe Ser Pro

                    565                 570                 575

    Glu Val Ile Pro Met Phe Ser Ala Leu Ser Glu Gly Ala Thr Pro Gln

                580                 585                 590

    Asp Leu Asn Thr Met Leu Asn Thr Val Gly Gly His Gln Ala Ala Met

            595                 600                 605

    Gln Met Leu Lys Glu Thr Ile Asn Glu Glu Ala Ala Glu Trp Asp Arg

        610                 615                 620

    Leu His Pro Val His Ala Gly Pro Ile Ala Pro Gly Gln Met Arg Glu

    625                 630                 635                 640

    Pro Arg Gly Ser Asp Ile Ala Gly Thr Thr Ser Thr Leu Gln Glu Gln

                    645                 650                 655

    Ile Gly Trp Met Thr Asn Asn Pro Pro Ile Pro Val Gly Glu Ile Tyr

                660                 665                 670

    Lys Arg Trp Ile Ile Leu Gly Leu Asn Lys Ile Val Arg Met Tyr Ser

            675                 680                 685

    Pro Thr Ser Ile Leu Asp Ile Lys Gln Gly Pro Lys Glu Pro Phe Arg

        690                 695                 700

    Asp Tyr Val Asp Arg Phe Tyr Lys Thr Leu Arg Ala Glu Gln Ala Thr

    705                 710                 715                 720

    Gln Glu Val Lys Asn Trp Met Thr Glu Thr Leu Leu Val Gln Asn Ala

                    725                 730                 735

    Asn Pro Asp Cys Lys Thr Ile Leu Lys Ala Leu Gly Pro Ala Ala Thr

                740                 745                 750

    Leu Glu Glu Met Met Thr Ala Cys Gln Gly Val Gly Gly Pro Gly His

            755                 760                 765

    Lys Ala Arg Val Leu Ala Glu Ala Met Ser Gln Val Thr Gly Ser Ala

        770                 775                 780

    Ala Ile Met Met Gln Arg Gly Asn Phe Arg Asn Gln Arg Lys Thr Val

    785                 790                 795                 800

    Lys Cys Phe Asn Cys Gly Lys Glu Gly His Ile Ala Arg Asn Cys Arg

                    805                 810                 815

    Ala Pro Arg Lys Lys Gly Cys Trp Lys Cys Gly Lys Glu Gly His Gln

                820                 825                 830

    Met Lys Asp Cys Thr Glu Arg Gln Ala Asn Ala Ala Val Ile Thr Leu

            835                 840                 845

    Trp Gln Arg Pro Leu Val Ala Leu Ile Glu Ile Cys Thr Glu Met Glu

        850                 855                 860

    Lys Glu Gly Lys Ile Ser Lys Ile Gly Pro Ala Gly Leu Lys Lys Lys

    865                 870                 875                 880

    Lys Ser Val Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser Val Pro

                    885                 890                 895

    Leu Asp Lys Asp Phe Arg Lys Tyr Thr Ala Phe Thr Ile Pro Ser Ile

                900                 905                 910

    Trp Lys Gly Ser Pro Ala Ile Phe Gln Ser Ser Met Thr Lys Lys Gln

            915                 920                 925

    Asn Pro Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp Leu Tyr Val Pro

        930                 935                 940

    Ile Val Leu Pro Glu Lys Asp Ser Trp Leu Val Gly Lys Leu Asn Trp

    945                 950                 955                 960

    Ala Ser Gln Ile Tyr Ala Gly Ile Lys Val Lys Gln Leu Ile Leu Lys

                    965                 970                 975

    Glu Pro Val His Gly Val Tyr Glu Pro Ile Val Gly Ala Glu Thr Phe

                980                 985                 990

    Tyr Val Asp Gly Ala Ala Asn Arg  Ala Gly Asn Leu Trp  Val Thr Val

            995                  1000                1005

    Tyr Tyr  Gly Val Pro Val Trp  Lys Glu Ala Thr Thr  Thr Leu Val

        1010                 1015                 1020

    Glu Arg  Tyr Leu Arg Asp Gln  Gln Leu Leu Gly Ile  Trp Gly Cys

        1025                 1030                 1035

    Ala Cys  Thr Pro Tyr Asp Ile  Asn Gln Met Leu Arg  Gly Pro Gly

        1040                 1045                 1050

    Arg Ala  Phe Val Thr Ile Arg  Gln Gly Ser Leu

        1055                 1060

    <210>45

    <211>1006

    <212>PRT

    <213>人工序列

    <220>

    <223>含有Tat-Rev-Nef，截短的Gag蛋白和CTL(RNT-dgag-CTL)的杂交蛋白

    <400>45

    Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser

    1               5                   10                  15

    Gln Pro Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu

                20                  25                  30

    His Cys Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly

            35                  40                  45

    Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr

        50                  55                  60

    His Gln Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp

    55                  70                  75                  80

    Pro Thr Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu

                    85                  90                  95

    Ala Asp Pro Phe Asp Thr Ser Ala Gly Arg Ser Gly Asp Ser Asp Glu

                100                 105                 110

    Glu Leu Leu Lys Thr Val Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn

            115                 120                 125

    Pro Pro Pro Ser Asn Glu Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg

        130                 135                 140

    Arg Arg Trp Arg Glu Arg Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg

    145                 150                 155                 160

    Ile Leu Ser Thr Phe Leu Gly Arg Pro Ala Glu Pro Val Pro Leu Gln

                    165                 170                 175

    Leu Pro Pro Leu Glu Arg Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly

                180                 185                 190

    Asn Ser Gly Thr Gln Gly Val Gly Ser Pro Gln Val Leu Val Glu Ser

            195                 200                 205

    Pro Ala Val Leu Glu Pro Gly Thr Lys Glu Lys Leu Val Gly Lys Trp

        210                 215                 220

    Ser Lys Cys Ser Gly Trp Pro Thr Val Arg Glu Arg Met Lys Gln Ala

    225                 230                 235                 240

    Glu Pro Glu Pro Ala Ala Asp Gly Val Gly Ala Ala Ser Arg Asp Leu

                    245                 250                 255

    Glu Lys His Gly Ala Ile Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala

                260                 265                 270

    Ala Cys Ala Trp Leu Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro

            275                 280                 285

    Val Arg Pro Gln Val Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu

        290                 295                 300

    Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile

    305                 310                 315                 320

    Tyr Ser Pro Lys Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr

                    325                 330                 335

    Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val

                340                 345                 350

    Arg Tyr Pro Leu Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Glu

            355                 360                 365

    Pro Asp Glu Glu Glu Asn Ser Ser Leu Leu His Pro Ala Ser Leu His

        370                 375                 380

    Gly Thr Glu Asp Thr Glu Arg Glu Val Leu Lys Trp Lys Phe Asp Ser

    385                 390                 395                 400

    His Leu Ala Phe His His Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr

                    405                 410                 415

    Lys Asp Cys Ala Ala Val Gly Ala Arg Ala Ser Val Leu Ser Gly Gly

                420                 425                 430

    Glu Leu Asp Lys Trp Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys

            435                 440                 445

    Lys Tyr Gln Leu Lys His Ile Val Trp Ala Ser Arg Glu Leu Glu Arg

        450                 455                 460

    Phe Ala Val Asn Pro Gly Leu Leu Glu Thr Ser Glu Gly Cys Arg Gln

    465                 470                 475                 480

    Ile Met Gly Gln Leu Gln Pro Ser Leu Gln Thr Gly Ser Glu Glu Leu

                    485                 490                 495

    Arg Ser Leu Tyr Asn Thr Val Ala Thr Leu Tyr Cys Val His Gln Lys

                500                 505                 510

    Ile Glu Val Lys Asp Thr Lys Glu Ala Leu Asp Lys Val Glu Glu Glu

            515                 520                 525

    Gln Asn Asn Ser Lys Lys Lys Ala Gln Gln Glu Ala Ala Asp Ala Gly

        530                 535                 540

    Asn Arg Asn Gln Val Ser Gln Asn Tyr Pro Ile Val Gln Asn Leu Gln

    545                 550                 555                 560

    Gly Gln Met Val His Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp

                    565                 570                 575

    Val Lys Val Val Glu Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met

                580                 585                 590

    Phe Ser Ala Leu Ser Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met

            595                 600                 605

    Leu Asn Thr Val Gly Gly His Gln Ala Ala Met Gln Met Leu Lys Glu

        610                 615                 620

    Thr Ile Asn Glu Glu Ala Ala Glu Trp Asp Arg Leu His Pro Val His

    625                 630                 635                 640

    Ala Gly Pro Ile Ala Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp

                    645                 650                 655

    Ile Ala Gly Thr Thr Ser Thr Leu Gln Glu Gln Ile Gly Trp Met Thr

                660                 665                 670

    Asn Asn Pro Pro Ile Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile

            675                 680                 685

    Leu Gly Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu

        690                 695                 700

    Asp Ile Lys Gln Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg

    705                 710                 715                 720

    Phe Tyr Lys Thr Leu Arg Ala Glu Gln Ala Thr Gln Glu Val Lys Asn

                    725                 730                 735

    Trp Met Thr Glu Thr Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys

                740                 745                 750

    Thr Ile Leu Lys Ala Leu Gly Pro Ala Ala Thr Leu Glu Glu Met Met

            755                 760                 765

    Thr Ala Cys Gln Gly Val Gly Gly Pro Gly His Lys Ala Arg Val Leu

        770                 775                 780

    Ala Ala Val Ile Thr Leu Trp Gln Arg Pro Leu Val Ala Leu Ile Glu

    785                 790                 795                 800

    Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Lys Ile Gly Pro

                    805                 810                 815

    Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp Val Gly Asp

                820                 825                 830

    Ala Tyr Phe Ser Val Pro Leu Asp Lys Asp Phe Arg Lys Tyr Thr Ala

            835                 840                 845

    Phe Thr Ile Pro Ser Ile Trp Lys Gly Ser Pro Ala Ile Phe Gln Ser

        850                 855                 860

    Ser Met Thr Lys Lys Gln Asn Pro Asp Ile Val Ile Tyr Gln Tyr Met

    865                 870                 875                 880

    Asp Asp Leu Tyr Val Pro Ile Val Leu Pro Glu Lys Asp Ser Trp Leu

                    885                 890                 895

    Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Ala Gly Ile Lys Val

                900                 905                 910

    Lys Gln Leu Ile Leu Lys Glu Pro Val His Gly Val Tyr Glu Pro Ile

            915                 920                 925

    Val Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn Arg Ala Gly

        930                 935                 940

    Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala

    945                 950                 955                 960

    Thr Thr Thr Leu Val Glu Arg Tyr Leu Arg Asp Gln Gln Leu Leu Gly

                    965                 970                 975

    Ile Trp Gly Cys Ala Cys Thr Pro Tyr Asp Ile Asn Gln Met Leu Arg

                980                 985                 990

    Gly Pro Gly Arg Ala Phe Val Thr  Ile Arg Gln Gly Ser  Leu

            995                 1000                 1005

    <210>46

    <211>1006

    <212>PRT

    <213>人工序列

    <220>

    <223>含有Tat-Rev-Nef，CTL和截短的Gag蛋白(TRN-CTL-optp17/24)杂交蛋白的编码序列

    <400>46

    Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser

    1               5                   10                  15

    Gln Pro Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu

                20                  25                  30

    His Cys Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly

            35                  40                  45

    Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr

        50                  55                  60

    His Gln Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp

    65                  70                  75                  80

    Pro Thr Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu

                    85                  90                  95

    Ala Asp Pro Phe Asp Thr Ser Ala Gly Arg Ser Gly Asp Ser Asp Glu

                100                 105                 110

    Glu Leu Leu Lys Thr Val Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn

            115                 120                 125

    Pro Pro Pro Ser Asn Glu Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg

        130                 135                 140

    Arg Arg Trp Arg Glu Arg Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg

    145                 150                 155                 160

    Ile Leu Ser Thr Phe Leu Gly Arg Pro Ala Glu Pro Val Pro Leu Gln

                    165                 170                 175

    Leu Pro Pro Leu Glu Arg Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly

                180                 185                 190

    Asn Ser Gly Thr Gln Gly Val Gly Ser Pro Gln Val Leu Val Glu Ser

            195                 200                 205

    Pro Ala Val Leu Glu Pro Gly Thr Lys Glu Lys Leu Val Gly Lys Trp

        210                 215                 220

    Ser Lys Cys Ser Gly Trp Pro Thr Val Arg Glu Arg Met Lys Gln Ala

    225                 230                 235                 240

    Glu Pro Glu Pro Ala Ala Asp Gly Val Gly Ala Ala Ser Arg Asp Leu

                    245                 250                 255

    Glu Lys His Gly Ala Ile Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala

                260                 265                 270

    Ala Cys Ala Trp Leu Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro

            275                 280                 285

    Val Arg Pro Gln Val Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu

        290                 295                 300

    Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile

    305                 310                 315                 320

    Tyr Ser Pro Lys Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr

                    325                 330                 335

    Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val

                340                 345                 350

    Arg Tyr Pro Leu Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Glu

            355                 360                 365

    Pro Asp Glu Glu Glu Asn Ser Ser Leu Leu His Pro Ala Ser Leu His

        370                 375                 380

    Gly Thr Glu Asp Thr Glu Arg Glu Val Leu Lys Trp Lys Phe Asp Ser

    385                 390                 395                 400

    His Leu Ala Phe His His Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr

                    405                 410                 415

    Lys Asp Cys Ala Ala Val Ile Thr Leu Trp Gln Arg Pro Leu Val Ala

                420                 425                 430

    Leu Ile Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Lys

            435                 440                 445

    Ile Gly Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp

        450                 455                 460

    Val Gly Asp Ala Tyr Phe Ser Val Pro Leu Asp Lys Asp Phe Arg Lys

    465                 470                 475                 480

    Tyr Thr Ala Phe Thr Ile Pro Ser Ile Trp Lys Gly Ser Pro Ala Ile

                    485                 490                 495

    Phe Gln Ser Ser Met Thr Lys Lys Gln Asn Pro Asp Ile Val Ile Tyr

                500                 505                 510

    Gln Tyr Met Asp Asp Leu Tyr Val Pro Ile Val Leu Pro Glu Lys Asp

            515                 520                 525

    Ser Trp Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Ala Gly

        530                 535                 540

    Ile Lys Val Lys Gln Leu Ile Leu Lys Glu Pro Val His Gly Val Tyr

    545                 550                 555                 560

    Glu Pro Ile Val Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn

                    565                 570                 575

    Arg Ala Gly Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp

                580                 585                 590

    Lys Glu Ala Thr Thr Thr Leu Val Glu Arg Tyr Leu Arg Asp Gln Gln

            595                 600                 605

    Leu Leu Gly Ile Trp Gly Cys Ala Cys Thr Pro Tyr Asp Ile Asn Gln

        610                 615                 620

    Met Leu Arg Gly Pro Gly Arg Ala Phe Val Thr Ile Arg Gln Gly Ser

    625                 630                 635                 640

    Leu Ala Ala Val Gly Ala Arg Ala Ser Val Leu Ser Gly Gly Glu Leu

                    645                 650                 655

    Asp Lys Trp Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys Lys Tyr

                660                 665                 670

    Gln Leu Lys His Ile Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala

            675                 680                 685

    Val Asn Pro Gly Leu Leu Glu Thr Ser Glu Gly Cys Arg Gln Ile Met

        690                 695                 700

    Gly Gln Leu Gln Pro Ser Leu Gln Thr Gly Ser Glu Glu Leu Arg Ser

    705                 710                 715                 720

    Leu Tyr Asn Thr Val Ala Thr Leu Tyr Cys Val His Gln Lys Ile Glu

                    725                 730                 735

    Val Lys Asp Thr Lys Glu Ala Leu Asp Lys Val Glu Glu Glu Gln Asn

                740                 745                 750

    Asn Ser Lys Lys Lys Ala Gln Gln Glu Ala Ala Asp Ala Gly Asn Arg

            755                 760                 765

    Asn Gln Val Ser Gln Asn Tyr Pro Ile Val Gln Asn Leu Gln Gly Gln

        770                 775                 780

    Met Val His Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp Val Lys

    785                 790                 795                 800

    Val Val Glu Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met Phe Ser

                    805                 810                 815

    Ala Leu Ser Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met Leu Asn

                820                 825                 830

    Thr Val Gly Gly His Gln Ala Ala Met Gln Met Leu Lys Glu Thr Ile

            835                 840                 845

    Asn Glu Glu Ala Ala Glu Trp Asp Arg Leu His Pro Val His Ala Gly

        850                 855                 860

    Pro Ile Ala Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp Ile Ala

    865                 870                 875                 880

    Gly Thr Thr Ser Thr Leu Gln Glu Gln Ile Gly Trp Met Thr Asn Asn

                    885                 890                 895

    Pro Pro Ile Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu Gly

                900                 905                 910

    Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu Asp Ile

            915                 920                 925

    Lys Gln Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr

        930                 935                 940

    Lys Thr Leu Arg Ala Glu Gln Ala Thr Gln Glu Val Lys Asn Trp Met

    945                 950                 955                 960

    Thr Glu Thr Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Thr Ile

                    965                 970                 975

    Leu Lys Ala Leu Gly Pro Ala Ala Thr Leu Glu Glu Met Met Thr Ala

                980                 985                 990

    Cys Gln Gly Val Gly Gly Pro Gly  His Lys Ala Arg Val  Leu

            995                 1000                 1005

    <210>47

    <211>1006

    <212>PRT

    <213>人工序列

    <220>

    <223>含有Rev-Nef-Tat、CTL和截短的Gag蛋白(RNT-CTL-optp17/24)的杂交蛋白

    <400>47

    Met Ala Gly Arg Ser Gly Asp Ser Asp Glu Glu Leu Leu Lys Thr Val

    1               5                   10                  15

    Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn Pro Pro Pro Ser Asn Glu

                20                  25                  30

    Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg

            35                  40                  45

    Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg Ile Leu Ser Thr Phe Leu

        50                  55                  60

    Gly Arg Pro Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg

    65                  70                  75                  80

    Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly Asn Ser Gly Thr Gln Gly

                    85                  90                  95

    Val Gly Ser Pro Gln Val Leu Val Glu Ser Pro Ala Val Leu Glu Pro

                100                 105                 110

    Gly Thr Lys Glu Thr Ser Val Gly Lys Trp Ser Lys Cys Ser Gly Trp

            115                 120                 125

    Pro Thr Val Arg Glu Arg Met Lys Gln Ala Glu Pro Glu Pro Ala Ala

        130                 135                 140

    Asp Gly Val Gly Ala Ala Ser Arg Asp Leu Glu Lys His Gly Ala Ile

    145                 150                 155                 160

    Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala Ala Cys Ala Trp Leu Glu

                    165                 170                 175

    Ala Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln Val Pro

                180                 185                 190

    Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu Asp Leu Ser His Phe Leu

            195                 200                 205

    Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Pro Lys Arg Gln

        210                 215                 220

    Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr Phe Pro Asp

    225                 230                 235                 240

    Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val Arg Tyr Pro Leu Thr Phe

                    245                 250                 255

    Gly Trp Cys Phe Lys Leu Val Pro Val Glu Pro Asp Glu Glu Glu Asn

                260                 265                 270

    Ser Ser Leu Leu His Pro Ala Ser Leu His Gly Thr Glu Asp Thr Glu

            275                 280                 285

    Arg Glu Val Leu Lys Trp Lys Phe Asp Ser His Leu Ala Phe His His

        290                 295                 300

    Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr Lys Asp Cys Lys Leu Glu

    305                 310                 315                 320

    Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser Gln Pro

                    325                 330                 335

    Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu His Cys

                340                 345                 350

    Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly Arg Lys

            355                 360                 365

    Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr His Gln

        370                 375                 380

    Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp Pro Thr

    385                 390                 395                 400

    Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu Ala Asp

                    405                 410                 415

    Pro Phe Asp Ala Ala Val Ile Thr Leu Trp Gln Arg Pro Leu Val Ala

                420                 425                 430

    Leu Ile Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Lys

            435                 440                 445

    Ile Gly Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp

        450                 455                 460

    Val Gly Asp Ala Tyr Phe Ser Val Pro Leu Asp Lys Asp Phe Arg Lys

    465                 470                 475                 480

    Tyr Thr Ala Phe Thr Ile Pro Ser Ile Trp Lys Gly Ser Pro Ala Ile

                    485                 490                 495

    Phe Gln Ser Ser Met Thr Lys Lys Gln Asn Pro Asp Ile Val Ile Tyr

                500                 505                 510

    Gln Tyr Met Asp Asp Leu Tyr Val Pro Ile Val Leu Pro Glu Lys Asp

            515                 520                 525

    Ser Trp Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Ala Gly

        530                 535                 540

    Ile Lys Val Lys Gln Leu Ile Leu Lys Glu Pro Val His Gly Val Tyr

    545                 550                 555                 560

    Glu Pro Ile Val Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn

                    565                 570                 575

    Arg Ala Gly Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp

                580                 585                 590

    Lys Glu Ala Thr Thr Thr Leu Val Glu Arg Tyr Leu Arg Asp Gln Gln

            595                 600                 605

    Leu Leu Gly Ile Trp Gly Cys Ala Cys Thr Pro Tyr Asp Ile Asn Gln

        610                 615                 620

    Met Leu Arg Gly Pro Gly Arg Ala Phe Val Thr Ile Arg Gln Gly Ser

    625                 630                 635                 640

    Leu Ala Ala Val Gly Ala Arg Ala Ser Val Leu Ser Gly Gly Glu Leu

                    645                 650                 655

    Asp Lys Trp Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys Lys Tyr

                660                 665                 670

    Gln Leu Lys His Ile Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala

            675                 680                 685

    Val Asn Pro Gly Leu Leu Glu Thr Ser Glu Gly Cys Arg Gln Ile Met

        690                 695                 700

    Gly Gln Leu Gln Pro Ser Leu Gln Thr Gly Ser Glu Glu Leu Arg Ser

    705                 710                 715                 720

    Leu Tyr Asn Thr Val Ala Thr Leu Tyr Cys Val His Gln Lys Ile Glu

                    725                 730                 735

    Val Lys Asp Thr Lys Glu Ala Leu Asp Lys Val Glu Glu Glu Gln Asn

                740                 745                 750

    Asn Ser Lys Lys Lys Ala Gln Gln Glu Ala Ala Asp Ala Gly Asn Arg

            755                 760                 765

    Asn Gln Val Ser Gln Asn Tyr Pro Ile Val Gln Asn Leu Gln Gly Gln

        770                 775                 780

    Met Val His Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp Val Lys

    785                 790                 795                 800

    Val Val Glu Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met Phe Ser

                    805                 810                 815

    Ala Leu Ser Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met Leu Asn

                820                 825                 830

    Thr Val Gly Gly His Gln Ala Ala Met Gln Met Leu Lys Glu Thr Ile

            835                 840                 845

    Asn Glu Glu Ala Ala Glu Trp Asp Arg Leu His Pro Val His Ala Gly

        850                 855                 860

    Pro Ile Ala Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp Ile Ala

    865                 870                 875                 880

    Gly Thr Thr Ser Thr Leu Gln Glu Gln Ile Gly Trp Met Thr Asn Asn

                    885                 890                 895

    Pro Pro Ile Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu Gly

                900                 905                 910

    Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu Asp Ile

            915                 920                 925

    Lys Gln Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr

        930                 935                 940

    Lys Thr Leu Arg Ala Glu Gln Ala Thr Gln Glu Val Lys Asn Trp Met

    945                 950                 955                 960

    Thr Glu Thr Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Thr Ile

                    965                 970                 975

    Leu Lys Ala Leu Gly Pro Ala Ala Thr Leu Glu Glu Met Met Thr Ala

                980                 985                 990

    Cys Gln Gly Val Gly Gly Pro Gly  His Lys Ala Arg Val  Leu

            995                 1000                 1005

    <210>48

    <211>1006

    <212>PRT

    <213>人工序列

    <220>

    <223>含有Rev-Nef-Tat，截短的Gag蛋白和CTL(RNT-optpl7/24-CTL)的杂交蛋白

    <400>48

    Met Ala Gly Arg Ser Gly Asp Ser Asp Glu Glu Leu Leu Lys Thr Val

    1               5                   10                  15

    Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn Pro Pro Pro Ser Asn Glu

                20                  25                  30

    Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg

            35                  40                  45

    Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg Ile Leu Ser Thr Phe Leu

        50                  55                  60

    Gly Arg Pro Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg

    65                  70                  75                  80

    Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly Asn Ser Gly Thr Gln Gly

                    85                  90                  95

    Val Gly Ser Pro Gln Val Leu Val Glu Ser Pro Ala Val Leu Glu Pro

                100                 105                 110

    Gly Thr Lys Glu Thr Ser Val Gly Lys Trp Ser Lys Cys Ser Gly Trp

            115                 120                 125

    Pro Thr Val Arg Glu Arg Met Lys Gln Ala Glu Pro Glu Pro Ala Ala

        130                 135                 140

    Asp Gly Val Gly Ala Ala Ser Arg Asp Leu Glu Lys His Gly Ala Ile

    145                 150                 155                 160

    Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala Ala Cys Ala Trp Leu Glu

                    165                 170                 175

    Ala Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln Val Pro

                180                 185                 190

    Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu Asp Leu Ser His Phe Leu

            195                 200                 205

    Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Pro Lys Arg Gln

        210                 215                 220

    Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr Phe Pro Asp

    225                 230                 235                 240

    Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val Arg Tyr Pro Leu Thr Phe

                    245                 250                 255

    Gly Trp Cys Phe Lys Leu Val Pro Val Glu Pro Asp Glu Glu Glu Asn

                260                 265                 270

    Ser Ser Leu Leu His Pro Ala Ser Leu His Gly Thr Glu Asp Thr Glu

            275                 280                 285

    Arg Glu Val Leu Lys Trp Lys Phe Asp Ser His Leu Ala Phe His His

        290                 295                 300

    Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr Lys Asp Cys Lys Leu Glu

    305                 310                 315                 320

    Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser Gln Pro

                    325                 330                 335

    Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu His Cys

                340                 345                 350

    Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly Arg Lys

            355                 360                 365

    Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr His Gln

        370                 375                 380

    Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp Pro Thr

    385                 390                 395                 400

    Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu Ala Asp

                    405                 410                 415

    Pro Phe Asp Ala Ala Val Gly Ala Arg Ala Ser Val Leu Ser Gly Gly

                420                 425                 430

    Glu Leu Asp Lys Trp Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys

            435                 440                 445

    Lys Tyr Gln Leu Lys His Ile Val Trp Ala Ser Arg Glu Leu Glu Arg

        450                 455                 460

    Phe Ala Val Asn Pro Gly Leu Leu Glu Thr Ser Glu Gly Cys Arg Gln

    465                 470                 475                 480

    Ile Met Gly Gln Leu Gln Pro Ser Leu Gln Thr Gly Ser Glu Glu Leu

                    485                 490                 495

    Arg Ser Leu Tyr Asn Thr Val Ala Thr Leu Tyr Cys Val His Gln Lys

                500                 505                 510

    Ile Glu Val Lys Asp Thr Lys Glu Ala Leu Asp Lys Val Glu Glu Glu

            515                 520                 525

    Gln Asn Asn Ser Lys Lys Lys Ala Gln Gln Glu Ala Ala Asp Ala Gly

        530                 535                 540

    Asn Arg Asn Gln Val Ser Gln Asn Tyr Pro Ile Val Gln Asn Leu Gln

    545                 550                 555                 560

    Gly Gln Met Val His Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp

                    565                 570                 575

    Val Lys Val Val Glu Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met

                580                 585                 590

    Phe Ser Ala Leu Ser Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met

            595                 600                 605

    Leu Asn Thr Val Gly Gly His Gln Ala Ala Met Gln Met Leu Lys Glu

        610                 615                 620

    Thr Ile Asn Glu Glu Ala Ala Glu Trp Asp Arg Leu His Pro Val His

    625                 630                 635                 640

    Ala Gly Pro Ile Ala Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp

                    645                 650                 655

    Ile Ala Gly Thr Thr Ser Thr Leu Gln Glu Gln Ile Gly Trp Met Thr

                660                 665                 670

    Asn Asn Pro Pro Ile Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile

            675                 680                 685

    Leu Gly Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu

        690                 695                 700

    Asp Ile Lys Gln Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg

    705                 710                 715                 720

    Phe Tyr Lys Thr Leu Arg Ala Glu Gln Ala Thr Gln Glu Val Lys Asn

                    725                 730                 735

    Trp Met Thr Glu Thr Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys

                740                 745                 750

    Thr Ile Leu Lys Ala Leu Gly Pro Ala Ala Thr Leu Glu Glu Met Met

            755                 760                 765

    Thr Ala Cys Gln Gly Val Gly Gly Pro Gly His Lys Ala Arg Val Leu

        770                 775                 780

    Ala Ala Val Ile Thr Leu Trp Gln Arg Pro Leu Val Ala Leu Ile Glu

    785                 790                 795                 800

    Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Lys Ile Gly Pro

                    805                 810                 815

    Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp Val Gly Asp

                820                 825                 830

    Ala Tyr Phe Ser Val Pro Leu Asp Lys Asp Phe Arg Lys Tyr Thr Ala

            835                 840                 845

    Phe Thr Ile Pro Ser Ile Trp Lys Gly Ser Pro Ala Ile Phe Gln Ser

        850                 855                 860

    Ser Met Thr Lys Lys Gln Asn Pro Asp Ile Val Ile Tyr Gln Tyr Met

    865                 870                 875                 880

    Asp Asp Leu Tyr Val Pro Ile Val Leu Pro Glu Lys Asp Ser Trp Leu

                    885                 890                 895

    Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Ala Gly Ile Lys Val

                900                 905                 910

    Lys Gln Leu Ile Leu Lys Glu Pro Val His Gly Val Tyr Glu Pro Ile

            915                 920                 925

    Val Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn Arg Ala Gly

        930                 935                 940

    Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala

    945                 950                 955                 960

    Thr Thr Thr Leu Val Glu Arg Tyr Leu Arg Asp Gln Gln Leu Leu Gly

                    965                 970                 975

    Ile Trp Gly Cys Ala Cys Thr Pro Tyr Asp Ile Asn Gln Met Leu Arg

                980                 985                 990

    Gly Pro Gly Arg Ala Phe Val Thr  Ile Arg Gln Gly Ser  Leu

            995                 1000                 1005

    <210>49

    <211>7945

    <212>DNA

    <213>牛乳头状瘤病毒

    <220>

    <221>misc_feature

    <222>1205

    <223>n＝A，T，C or G

    <400>49

    gttaacaata atcacaccat caccgttttt tcaagcggga aaaaatagcc agctaactat    60

    aaaaagctgc tgacagaccc cggttttcac atggacctga aaccttttgc aagaaccaat    120

    ccattctcag ggttggattg tctgtggtgc agagagcctc ttacagaagt tgatgctttt    180

    aggtgcatgg tcaaagactt tcatgttgta attcgggaag gctgtagata tggtgcatgt    240

    accatttgtc ttgaaaactg tttagctact gaaagaagac tttggcaagg tgttccagta    300

    acaggtgagg aagctgaatt attgcatggc aaaacacttg ataggctttg cataagatgc    360

    tgctactgtg ggggcaaact aacaaaaaat gaaaaacatc ggcatgtgct ttttaatgag    420

    cctttctgca aaaccagagc taacataatt agaggacgct gctacgactg ctgcagacat    480

    ggttcaaggt ccaaataccc atagaaactt ggatgattca cctgcaggac cgttgctgat    540

    tttaagtcca tgtgcaggca cacctaccag gtctcctgca gcacctgatg cacctgattt    600

    cagacttccg tgccatttcg gccgtcctac taggaagcga ggtcccacta cccctccgct    660

    ttcctctccc ggaaaactgt gtgcaacagg gccacgtcga gtgtattctg tgactgtctg    720

    ctgtggaaac tgcggaaaag agctgacttt tgctgtgaag accagctcga cgtccctgct    780

    tggatttgaa caccttttaa actcagattt agacctcttg tgtccacgtt gtgaatctcg    840

    cgagcgtcat ggcaaacgat aaaggtagca attgggattc gggcttggga tgctcatatc    900

    tgctgactga ggcagaatgt gaaagtgaca aagagaatga ggaacccggg gcaggtgtag    960

    aactgtctgt ggaatctgat cggtatgata gccaggatga ggattttgtt gacaatgcat   1020

    cagtctttca gggaaatcac ctggaggtct tccaggcatt agagaaaaag gcgggtgagg   1080

    agcagatttt aaatttgaaa agaaaagtat tggggagttc gcaaaacagc agcggttccg   1140

    aagcatctga aactccagtt aaaagacgga aatcaggagc aaagcgaaga ttatttgctg   1200

    aaaangaagc taaccgtgtt cttacgcccc tccaggtaca gggggagggg gaggggaggc   1260

    aagaacttaa tgaggagcag gcaattagtc atctacatct gcagcttgtt aaatctaaaa   1320

    atgctacagt ttttaagctg gggctcttta aatctttgtt cctttgtagc ttccatgata   1380

    ttacgaggtt gtttaagaat gataagacca ctaatcagca atgggtgctg gctgtgtttg   1440

    gccttgcaga ggtgtttttt gaggcgagtt tcgaactcct aaagaagcag tgtagttttc   1500

    tgcagatgca aaaaagatct catgaaggag gaacttgtgc agtttactta atctgcttta   1560

    acacagctaa aagcagagaa acagtccgga atctgatggc aaacacgcta aatgtaagag   1620

    aagagtgttt gatgctgcag ccagctaaaa ttcgaggact cagcgcagct ctattctggt   1680

    ttaaaagtag tttgtcaccc gctacactta aacatggtgc tttacctgag tggatacggg   1740

    cgcaaactac tctgaacgag agcttgcaga ccgagaaatt cgacttcgga actatggtgc   1800

    aatgggccta tgatcacaaa tatgctgagg agtctaaaat agcctatgaa tatgctttgg   1860

    ctgcaggatc tgatagcaat gcacgggctt ttttagcaac taacagccaa gctaagcatg   1920

    tgaaggactg tgcaactatg gtaagacact atctaagagc tgaaacacaa gcattaagca   1980

    tgcctgcata tattaaagct aggtgcaagc tggcaactgg ggaaggaagc tggaagtcta   2040

    tcctaacttt ttttaactat cagaatattg aattaattac ctttattaat gctttaaagc   2100

    tctggctaaa aggaattcca aaaaaaaact gtttagcatt tattggccct ccaaacacag   2160

    gcaagtctat gctctgcaac tcattaattc attttttggg tggtagtgtt ttatcttttg   2220

    ccaaccataa aagtcacttt tggcttgctt ccctagcaga tactagagct gctttagtag   2280

    atgatgctac tcatgcttgc tggaggtact ttgacacata cctcagaaat gcattggatg   2340

    gctaccctgt cagtattgat agaaaacaca aagcagcggt tcaaattaaa gctccacccc   2400

    tcctggtaac cagtaatatt gatgtgcagg cagaggacag atatttgtac ttgcatagtc   2460

    gggtgcaaac ctttcgcttt gagcagccat gcacagatga atcgggtgag caacctttta   2520

    atattactga tgcagattgg aaatcttttt ttgtaaggtt atgggggcgt ttagacctga   2580

    ttgacgagga ggaggatagt gaagaggatg gagacagcat gcgaacgttt acatgtagcg   2640

    caagaaacac aaatgcagtt gattgagaaa agtagtgata agttgcaaga tcatatactg   2700

    tactggactg ctgttagaac tgagaacaca ctgctttatg ctgcaaggaa aaaaggggtg   2760

    actgtcctag gacactgcag agtaccacac tctgtagttt gtcaagagag agccaagcag   2820

    gccattgaaa tgcagttgtc tttgcaggag ttaagcaaaa ctgagtttgg ggatgaacca   2880

    tggtctttgc ttgacacaag ctgggaccga tatatgtcag aacctaaacg gtgctttaag   2940

    aaaggcgcca gggtggtaga ggtggagttt gatggaaatg caagcaatac aaactggtac   3000

    actgtctaca gcaatttgta catgcgcaca gaggacggct ggcagcttgc gaaggctggg   3060

    gctgacggaa ctgggctcta ctactgcacc atggccggtg ctggacgcat ttactattct   3120

    cgctttggtg acgaggcagc cagatttagt acaacagggc attactctgt aagagatcag   3180

    gacagagtgt atgctggtgt ctcatccacc tcttctgatt ttagagatcg cccagacgga   3240

    gtctgggtcg catccgaagg acctgaagga gaccctgcag gaaaagaagc cgagccagcc   3300

    cagcctgtct cttctttgct cggctccccc gcctgcggtc ccatcagagc aggcctcggt   3360

    tgggtacggg acggtcctcg ctcgcacccc tacaattttc ctgcaggctc ggggggctct   3420

    attctccgct cttcctccac cccgtgcagg gcacggtacc ggtggacttg gcatcaaggc   3480

    aggaagaaga ggagcagtcg cccgactcca cagaggaaga accagtgact ctcccaaggc   3540

    gcaccaccaa tgatggattc cacctgttaa aggcaggagg gtcatgcttt gctctaattt   3600

    caggaactgc taaccaggta aagtgctatc gctttcgggt gaaaaagaac catagacatc   3660

    gctacgagaa ctgcaccacc acctggttca cagttgctga caacggtgct gaaagacaag   3720

    gacaagcaca aatactgatc acctttggat cgccaagtca aaggcaagac tttctgaaac   3780

    atgtaccact acctcctgga atgaacattt ccggctttac agccagcttg gacttctgat   3840

    cactgccatt gccttttctt catctgactg gtgtactatg ccaaatctat ggtttctatt   3900

    gttcttggga ctagttgctg caatgcaact gctgctatta ctgttcttac tcttgttttt   3960

    tcttgtatac tgggatcatt ttgagtgctc ctgtacaggt ctgccctttt aatgccttta   4020

    catcactggc tattggctgt gtttttactg ttgtgtggat ttgatttgtt ttatatactg   4080

    tatgaagttt tttcatttgt gcttgtattg ctgtttgtaa gttttttact agagtttgta   4140

    ttccccctgc tcagatttta tatggtttaa gctgcagcaa taaaaatgag tgcacgaaaa   4200

    agagtaaaac gtgccagtgc ctatgacctg tacaggacat gcaagcaagc gggcacatgt   4260

    ccaccagatg tgataccaaa ggtagaagga gatactatag cagataaaat tttgaaattt   4320

    gggggtcttg caatctactt aggagggcta ggaataggaa catggtctac tggaagggtt   4380

    gctgcaggtg gatcaccaag gtacacacca ctccgaacag cagggtccac atcatcgctt   4440

    gcatcaatag gatccagagc tgtaacagca gggacccgcc ccagtatagg tgcgggcatt   4500

    cctttagaca cccttgaaac tcttggggcc ttgcgtccag gggtgtatga ggacactgtg   4560

    ctaccagagg cccctgcaat agtcactcct gatgctgttc ctgcagattc agggcttgat   4620

    gccctgtcca taggtacaga ctcgtccacg gagaccctca ttactctgct agagcctgag   4680

    ggtcccgagg acatagcggt tcttgagctg caacccctgg accgtccaac ttggcaagta   4740

    agcaatgctg ttcatcagtc ctctgcatac cacgcccctc tgcagctgca atcgtccatt   4800

    gcagaaacat ctggtttaga aaatattttt gtaggaggct cgggtttagg ggatacagga   4860

    ggagaaaaca ttgaactgac atacttcggg tccccacgaa caagcacgcc ccgcagtatt   4920

    gcctctaaat cacgtggcat tttaaactgg ttcagtaaac ggtactacac acaggtgccc   4980

    acggaagatc ctgaagtgtt ttcatcccaa acatttgcaa acccactgta tgaagcagaa   5040

    ccagctgtgc ttaagggacc tagtggacgt gttggactca gtcaggttta taaacctgat   5100

    acacttacaa cacgtagcgg gacagaggtg ggaccacagc tacatgtcag gtactcattg   5160

    agtactatac atgaagatgt agaagcaatc ccctacacag ttgatgaaaa tacacaggga   5220

    cttgcattcg tacccttgca tgaagagcaa gcaggttttg aggagataga attagatgat   5280

    tttagtgaga cacatagact gctacctcag aacacctctt ctacacctgt tggtagtggt   5340

    gtacgaagaa gcctcattcc aactcaggaa tttagtgcaa cacggcctac aggtgttgta   5400

    acctatggct cacctgacac ttactctgct agcccagtta ctgaccctga ttctacctct   5460

    cctagtctag ttatcgatga cactactact acaccaatca ttataattga tgggcacaca   5520

    gttgatttgt acagcagtaa ctacaccttg catccctcct tgttgaggaa acgaaaaaaa   5580

    cggaaacatg cctaattttt tttgcagatg gcgttgtggc aacaaggcca gaagctgtat   5640

    ctccctccaa cccctgtaag caaggtgctt tgcagtgaaa cctatgtgca aagaaaaagc   5700

    attttttatc atgcagaaac ggagcgcctg ctaactatag gacatccata ttacccagtg   5760

    tctatcgggg ccaaaactgt tcctaaggtc tctgcaaatc agtatagggt atttaaaata   5820

    caactacctg atcccaatca atttgcacta cctgacagga ctgttcacaa cccaagtaaa   5880

    gagcggctgg tgtgggcagt cataggtgtg caggtgtcca gagggcagcc tcttggaggt   5940

    actgtaactg ggcaccccac ttttaatgct ttgcttgatg cagaaaatgt gaatagaaaa   6000

    gtcaccaccc aaacaacaga tgacaggaaa caaacaggcc tagatgctaa gcaacaacag   6060

    attctgttgc taggctgtac ccctgctgaa ggggaatatt ggacaacagc ccgtccatgt   6120

    gttactgatc gtctagaaaa tggcgcctgc cctcctcttg aattaaaaaa caagcacata   6180

    gaagatgggg atatgatgga aattgggttt ggtgcagcca acttcaaaga aattaatgca   6240

    agtaaatcag atctacctct tgacattcaa aatgagatct gcttgtaccc agactacctc   6300

    aaaatggctg aggacgctgc tggtaatagc atgttctttt ttgcaaggaa agaacaggtg   6360

    tatgttagac acatctggac cagagggggc tcggagaaag aagcccctac cacagatttt   6420

    tatttaaaga ataataaagg ggatgccacc cttaaaatac ccagtgtgca ttttggtagt   6480

    cccagtggct cactagtctc aactgataat caaattttta atcggcccta ctggctattc   6540

    cgtgcccagg gcatgaacaa tggaattgca tggaataatt tattgttttt aacagtgggg   6600

    gacaatacac gtggtactaa tcttaccata agtgtagcct cagatggaac cccactaaca   6660

    gagtatgata gctcaaaatt caatgtatac catagacata tggaagaata taagctagcc   6720

    tttatattag agctatgctc tgtggaaatc acagctcaaa ctgtgtcaca tctgcaagga   6780

    cttatgccct ctgtgcttga aaattgggaa ataggtgtgc agcctcctac ctcatcgata   6840

    ttagaggaca cctatcgcta tatagagtct cctgcaacta aatgtgcaag caatgtaatt   6900

    cctgcaaaag aagaccctta tgcagggttt aagttttgga acatagatct taaagaaaag   6960

    ctttctttgg acttagatca atttcccttg ggaagaagat ttttagcaca gcaaggggca   7020

    ggatgttcaa ctgtgagaaa acgaagaatt agccaaaaaa cttccagtaa gcctgcaaaa   7080

    aaaaaaaaaa aataaaagct aagtttctat aaatgttctg taaatgtaaa acagaaggta   7140

    agtcaactgc acctaataaa aatcacttaa tagcaatgtg ctgtgtcagt tgtttattgg   7200

    aaccacaccc ggtacacatc ctgtccagca tttgcagtgc gtgcattgaa ttattgtgct   7260

    ggctagactt catggcgcct ggcaccgaat cctgccttct cagcgaaaat gaataattgc   7320

    tttgttggca agaaactaag catcaatggg acgcgtgcaa agcaccggcg gcggtagatg   7380

    cggggtaagt actgaatttt aattcgacct atcccggtaa agcgaaagcg acacgctttt   7440

    ttttcacaca tagcgggacc gaacacgtta taagtatcga ttaggtctat ttttgtctct   7500

    ctgtcggaac cagaactggt aaaagtttcc attgcgtctg ggcttgtcta tcattgcgtc   7560

    tctatggttt ttggaggatt agacggggcc accagtaatg gtgcatagcg gatgtctgta   7620

    ccgccatcgg tgcaccgata taggtttggg gctccccaag ggactgctgg gatgacagct   7680

    tcatattata ttgaatgggc gcataatcag cttaattggt gaggacaagc tacaagttgt   7740

    aacctgatct ccacaaagta cgttgccggt cggggtcaaa ccgtcttcgg tgctcgaaac   7800

    cgccttaaac tacagacagg tcccagccaa gtaggcggat caaaacctca aaaaggcggg   7860

    agccaatcaa aatgcagcat tatattttaa gctcaccgaa accggtaagt aaagactatg   7920

    tattttttcc cagtgaataa ttgtt                                          7945

    <210>50

    <211>306

    <212>PRT

    <213>1型牛乳头状瘤病毒

    <400>50

    Met Glu Thr Ala Cys Glu Arg Leu His Val Ala Gln Glu Thr Gln Met

    1               5                   10                  15

    Gln Leu Ile Glu Lys Ser Ser Asp Lys Leu Gln Asp His Ile Leu Tyr

                20                  25                  30

    Trp Thr Ala Val Arg Thr Glu Asn Thr Leu Leu Tyr Ala Ala Arg Lys

            35                  40                  45

    Lys Gly Val Thr Val Leu Gly His Cys Arg Val Pro His Ser Val Val

        50                  55                  60

    Cys Gln Glu Arg Ala Lys Gln Ala Ile Glu Met Gln Leu Ser Leu Gln

    65                  70                  75                  80

    Glu Leu Ser Lys Thr Glu Phe Gly Asp Glu Pro Trp Ser Leu Leu Asp

                    85                  90                  95

    Thr Ser Trp Asp Arg Tyr Met Ser Glu Pro Lys Arg Cys Phe Lys Lys

                100                 105                 110

    Gly Ala Arg Val Val Glu Val Glu Phe Asp Gly Asn Ala Ser Asn Thr

            115                 120                 125

    Asn Trp Tyr Thr Val Tyr Ser ASn Leu Tyr Met Arg Thr Glu Asp Gly

        130                 135                 140

    Trp Gln Leu Ala Lys Ala Gly Ala Asp Gly Thr Gly Leu Tyr Tyr Cys

    145                 150                 155                 160

    Thr Met Ala Gly Ala Gly Arg Ile Tyr Tyr Ser Arg Phe Gly Asp Glu

                    165                 170                 175

    Ala Ala Arg Phe Ser Thr Thr Gly His Tyr Ser Val Arg Asp Gln Asp

                180                 185                 190

    Arg Val Tyr Ala Gly Val Ser Ser Thr Ser Ser Asp Phe Arg Asp Arg

            195                 200                 205

    Pro Asp Gly Val Trp Val Ala Ser Glu Gly Pro Glu Gly Asp Pro Ala

        210                 215                 220

    Gly Lys Glu Ala Glu Pro Ala Gln Pro Val Ser Ser Leu Leu Gly Ser

    225                 230                 235                 240

    Pro Ala Cys Gly Pro Ile Arg Ala Gly Leu Gly Trp Val Arg Asp Gly

                    245                 250                 255

    Pro Arg Ser His Pro Tyr Asn Phe Pro Ala Gly Ser Gly Gly Ser Ile

                260                 265                 270

    Leu Arg Ser Ser Ser Thr Pro Cys Arg Ala Arg Tyr Arg Trp Thr Trp

            275                 280                 285

    His Gln Gly Arg Lys Lys Arg Ser Ser Arg Pro Thr Pro Gln Arg Lys

        290                 295                 300

    Asn Gln

    305

    <210>51

    <211>622

    <212>DNA

    <213>人疱疹病毒4

    <400>51

    gggtatcata tgctgactgt atatgcatga ggatagcata tgctacccgg atacagatta     60

    ggatagcata tactacccag atatagatta ggatagcata tgctacccag atatagatta    120

    ggatagccta tgctacccag atataaatta ggatagcata tactacccag atatagatta    180

    ggatagcata tgctacccag atatagatta ggatagccta tgctacccag atatagatta    240

    ggatagcata tgctacccag atatagatta ggatagcata tgctatccag atatttgggt    300

    agtatacgct acccagatat aaattaggat agcatatact accctaatct ctattaggat    360

    agcatatgct acccggatac agattaggat agcatatact acccagatat agattaggat    420

    agcatatgct acccagatat agattaggat agcctatgct acccagatat aaattaggat    480

    agcatatact acccagatat agattaggat agcatatgct acccagatat agattaggat    540

    agcctatgct acccagatat agattaggat agcatatgct atccagatat ttgggtagta    600

    tatgctaccc atggcaacat ta                                             622

    <210>52

    <211>641

    <212>PRT

    <213>人疱疹病毒4

    <400>52

    Met Ser Asp Glu Gly Pro Gly Thr Gly Pro Gly Asn Gly Leu Gly Glu

    1               5                   10                  15

    Lys Gly Asp Thr Ser Gly Pro Glu Gly Ser Gly Gly Ser Gly Pro Gln

                20                  25                  30

    Arg Arg Gly Gly Asp Asn His Gly Arg Gly Arg Gly Arg Gly Arg Gly

            35                  40                  45

    Arg Gly Gly Gly Arg Pro Gly Ala Pro Gly Gly Ser Gly Ser Gly Pro

        50                  55                  60

    Arg His Arg Asp Gly Val Arg Arg Pro Gln Lys Arg Pro Ser Cys Ile

    65                  70                  75                  80

    Gly Cys Lys Gly Thr His Gly Gly Thr Gly Ala Gly Ala Gly Ala Gly

                    85                  90                  95

    Gly Ala Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Ala Gly

                100                 105                 110

    Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly

            115                 120                 125

    Gly Ala Gly Ala Gly Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala

        130                 135                 140

    Gly Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Gly Ala Gly Ala Gly

    145                 150                 155                 160

    Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly

                    165                 170                 175

    Ala Gly Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Gly

                180                 185                 190

    Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Ala Gly Gly Ala Gly

            195                 200                 205

    Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala

        210                 215                 220

    Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala

    225                 230                 235                 240

    Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly

                    245                 250                 255

    Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly

                260                 265                 270

    Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Gly Ala Gly

            275                 280                 285

    Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Gly Ala Gly

        290                 295                 300

    Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Ala Gly

    305                 310                 315                 320

    Gly Ala Gly Ala Gly Gly Gly Gly Arg Gly Arg Gly Gly Ser Gly Gly

                    325                 330                 335

    Arg Gly Arg Gly Gly Ser Gly Gly Arg Gly Arg Gly Gly Ser Gly Gly

                340                 345                 350

    Arg Arg Gly Arg Gly Arg Glu Arg Ala Arg Gly Gly Ser Arg Glu Arg

            355                 360                 365

    Ala Arg Gly Arg Gly Arg Gly Arg Gly Glu Lys Arg Pro Arg Ser Pro

        370                 375                 380

    Ser Ser Gln Ser Ser Ser Ser Gly Ser Pro Pro Arg Arg Pro Pro Pro

    385                 390                 395                 400

    Gly Arg Arg Pro Phe Phe His Pro Val Gly Glu Ala Asp Tyr Phe Glu

                    405                 410                 415

    Tyr His Gln Glu Gly Gly Pro Asp Gly Glu Pro Asp Val Pro Pro Gly

                420                 425                 430

    Ala Ile Glu Gln Gly Pro Ala Asp Asp Pro Gly Glu Gly Pro Ser Thr

            435                 440                 445

    Gly Pro Arg Gly Gln Gly Asp Gly Gly Arg Arg Lys Lys Gly Gly Trp

        450                 455                 460

    Phe Gly Lys His Arg Gly Gln Gly Gly Ser Asn Pro Lys Phe Glu Asn

    465                 470                 475                 480

    Ile Ala Glu Gly Leu Arg Ala Leu Leu Ala Arg Ser His Val Glu Arg

                    485                 490                 495

    Thr Thr Asp Glu Gly Thr Trp Val Ala Gly Val Phe Val Tyr Gly Gly

                500                 505                 510

    Ser Lys Thr Ser Leu Tyr Asn Leu Arg Arg Gly Thr Ala Leu Ala Ile

            515                 520                 525

    Pro Gln Cys Arg Leu Thr Pro Leu Ser Arg Leu Pro Phe Gly Met Ala

        530                 535                 540

    Pro Gly Pro Gly Pro Gln Pro Gly Pro Leu Arg Glu Ser Ile Val Cys

    545                 550                 555                 560

    Tyr Phe Met Val Phe Leu Gln Thr His Ile Phe Ala Glu Val Leu Lys

                    565                 570                 575

    Asp Ala Ile Lys Asp Leu Val Met Thr Lys Pro Ala Pro Thr Cys Asn

                580                 585                 590

    Ile Arg Val Thr Val Cys Ser Phe Asp Asp Gly Val Asp Leu Pro Pro

            595                 600                 605

    Trp Phe Pro Pro Met Val Glu Gly Ala Ala Ala Glu Gly Asp Asp Gly

        610                 615                 620

    Asp Asp Gly Asp Glu Gly Gly Asp Gly Asp Glu Gly Glu Glu Gly Gln

    625                 630                 635                 640

    Glu