新的表达载体及其应用 1.发明的领域
本发明涉及新的载体,含所述载体的DNA疫苗和基因疗法,制备载体和含所述载体的DNA疫苗和基因疗法的方法,以及所述载体的治疗应用。更特别地,本发明涉及新的载体,包括(a)核-锚定蛋白的表达基因盒,它含有(i)能够与特定DNA序列结合的DNA结合结构域和(ii)能够与核成分结合的结构域,和(b)形成核-锚定蛋白地锚定蛋白结合位点的多聚体化DNA序列,和可选择地(c)目的DNA序列的一个或多个表达盒。特别地,发明涉及缺少乳头状瘤病毒复制起始点的载体。发明还涉及缺少在哺乳动物细胞中起作用的复制起始点的载体。发明进一步涉及在受试者中表达目的DNA序列的方法。
2.发明的背景
用适合的载体将同源或异源的基因转移到动物或人体中正在成为具有巨大潜力的技术,以治疗具有遗传背景的疾病,或预防或治疗感染性疾病。已经开发了数种病毒和非病毒载体并在动物和人受试者中试验传递一个基因/多个基因,被传递的基因通过突变而有缺陷因而是无功能的。这种载体的实例包括腺病毒载体、疱疹病毒载体、逆转录酶病毒载体、慢病毒载体和腺相关的载体。
已经证明接种疫苗是预防感染原所致疾病的高度有效和经济的方法。自从引种牛痘病毒作为抗天花病毒(天花)的减毒疫苗后,已经开发了抗许多人类病原体的疫苗并被常规使用。今天天花已通过接种疫苗被根除,预期不久脊髓灰质炎病毒也有相同的结果。数种儿童疾病如百日咳、白喉和破伤风可以通过接种疫苗被有效地预防。
一般地,最成功的病毒疫苗是致病病毒的活的无毒突变种。此方法成功的关键是活病毒靶向相同的器官、相同类型和相似数量的细胞,因此通过在接受者中的繁殖引起长时间的免疫反应而不致病或仅导致轻微的疾病。实际上,活的减毒疫苗产生亚临床感染,这是自然特有的免疫方式。结果,可以诱导完全的免疫反应包括体液的、细胞的和先天的反应,得到了长时间的、有时是终身的抗病原体免疫防护。
尽管活的减毒疫苗是最有效的,但它们可能引起有害的副作用。这样,减毒的病毒疫苗可能回复成有毒株,或在减毒病毒对成人不致病的情况下,仍可能在婴儿或伤残人中致病。就引起慢性感染的病毒如人免疫缺陷病毒1和2型来说确实如此。由病毒和细菌蛋白或免疫原肽组成的疫苗很少可能引起有害的副作用,但可能不如活疫苗有效力。特别是在抗致慢性感染的微生物疫苗的情况下,如某些病毒和细胞内细菌。
但是,免疫反应的强度和类型还依赖于病毒蛋白如何被处理和它们如何通过抗原递呈细胞(APCs)如巨噬细胞和树突状细胞被递呈给免疫系统。蛋白和肽抗原通过APCs的内吞作用被摄取,经过核内体通路被处理成小的免疫原肽并由MHC(主要组织相容性复合体)II型抗原[在人类为HLA(人白细胞抗原)II型]递呈给T-淋巴细胞(T-细胞)。相反,在APCs或可能的靶细胞中为进行免疫反应而重新合成的蛋白将经胞浆通路被处理并由MHC I型抗原(在人类为HLA I型)递呈给T细胞。一般地,经II型通路的免疫原肽递呈会引起辅助/诱导T细胞活化,将依次引起B细胞活化并产生抗体反应。相反,经I型MHC的递呈促进能够识别和破坏被病毒感染的细胞的细胞毒T淋巴细胞(CTLs)的诱导。
在1990年代早期,提出了模拟通常由活的减毒疫苗完成的抗原处理和递呈的方法[Ulmer,J.B.等人Science 259(1993)1745-1749]。据其显示,将真核生物表达载体以环形DNA的形式注射进肌肉,引起肌肉细胞(或许是其它细胞)摄取此DNA,能够诱导目的基因的表达并产生免疫反应,特别是针对由插入基因编码的蛋白的CTLs形式细胞免疫反应。从观察到此现象后,DNA免疫法已成为在实验动物中诱导对异源蛋白的免疫反应的标准方法,采用数种DNA疫苗的人类研究正在进行中。
通常,在这些疫苗研究中使用的DNA载体含有:目的基因克隆位点;强病毒启动子如CMV病毒的极早期启动子以驱动目的基因的表达;聚腺苷酰作用区;和抗生素抗性基因;和DNA载体(质粒)在细菌细胞中传播的细菌复制起始点。
用上面描述的载体,有可能在实验动物或人给予载体后获得可检测水平的目的基因表达,给予载体可采用颗粒轰击技术直接注射到肌肉或皮肤,或者通过在溶液中应用载体而直接用在黏膜上。但是,由这些载体获得的表达是暂时的:载体倾向于从转染的细胞中渐渐消失并不传递给分裂细胞群中的子细胞。目的基因的暂时表达和靶向细胞的有限数量大概是用上面描述的DNA载体免疫的受试者中仅观察到暂时的免疫反应的主要原因。因而,例如Boyer等人观察到,在用近似于上面描述的载体数次免疫的人类受试者中,仅有对HIV-1 Env和Rev蛋白的暂时免疫反应[Boyer,J.D.,J Infect Dis 181(2000)476-483]。
开发用于基因治疗和DNA接种疫苗的新产品的兴趣不断增长。例如携带目的基因表达盒的乳头状瘤病毒载体已被建议用做候选者。
到目前为止,已经鉴定了超过70个亚型的人乳头状瘤病毒(HPVs)和许多不同的动物乳头状瘤病毒[zur Hausen,H.和de Villiers E.,AnnuRev Microbiol 48(1994)427-447;Bernard,H.,等人,Curr Top MicrobiolImmunol 186(1994)33-54]。所有的乳头状瘤病毒具有相似的基因组构成,且所有翻译开放阅读框(ORFs)的位置是高度保守的。
乳头状瘤病毒在不同的身体部位感染皮肤或黏膜的鳞状上皮细胞并导致形成良性肿瘤,在某些情况下可发展成恶性肿瘤。乳头状瘤病毒基因组作为多拷贝核质粒在感染的细胞中复制并保存。复制、游离基因保存、后期基因表达和病毒组装与上皮组织的分化密切相关:在分化的上皮细胞中,乳头状瘤病毒DNA游离基因复制发生于最初的扩增性复制、其次即复制休眠,和第三个过程,即无性复制中[Howley,P.M.;乳头状瘤病毒体:病毒及其复制。病毒学,Fields,B.C.,Knipe,D.M.,Howley,P.M.,主编,Lippincott-Raven Publishers,Philadelphia,USA,1996,第二版,2045-2076页]。
两个由E1和E2开放阅读框编码的病毒因子已经显示对启动细胞中乳头状瘤病毒来源的DNA复制是必要的和充分的[Ustav,M.和Stenlund,A.,EMBO J 10(1991)449-57;Ustav,M.,等人,EMBO J 10(1991)4321-4329;Ustav,E.,等人,Proc Natl Acad Sci USA 90(1993)898-902]。
启动DNA复制的结构域已被定义为BPV1[Ustav,M.,等人,EMBO J10(1991)4321-4329]、HPV1a[Gopalakrishnan,V.和Khan,S.,见前]、HPV11[Russell,J.,Botchan,M.,J Virol 69(1995)651-660]、HPV18[Sverdrup,F.和Khan,S.,J Virol 69(1995)1319-1323;Sverdrup,F.和Khan,S.,J Virol 68(1994)505-509]和许多其它者。特征性地,所有这些起始片段具有高A/T含量,并含有数个重叠的独立E1蛋白识别序列,它们一起构成E1结合位点[Ustav,M.,等人,EMBOJ 10(1991)4321-4329;Holt,S.,等人,J Virol 68(1994)1094-1102;Holt,S.和Wilson,V.,JVirol 69(1995)6525-3652;Sedman.T.,等人.J Virol 71(1997)2887-2996]。此外,这些功能性起始片段含有E2结合位点,大多数情况下它对于启动体内的DNA复制是必要的(Ustav,E.,等人,见前)。E2蛋白可促进E1识别起始点的第一个步骤。在单体E1与起始点开始结合后,E1的多聚化作用即被启动。它导致具有ori融合活性的复合物形成。E2已被认为对DNA复制启动后的步骤没有影响[Lusky,M.,等人,ProcNatl Acad Sci USA 91(1994)8895-8899]。
BPV1 E2 ORF编码三个蛋白,源于选择性启动子使用和可选择的mRNA剪接[Lambert,P.,等人,Annu Rev Genet 22(1988)235-258]。所有这些蛋白可彼此形成同型-和杂二聚体并与12bp不对称的回文序列5′-ACCNNNNNNGGT-3′特异地结合[Androphy,E.,等人,Nature 325(1987)70-739]。
在BPV1基因组中有17个E2结合位点,在HPV基因组中为4个位点,它们在启动病毒DNA复制(Ustav,E.,等人,见前)和调节病毒基因表达(Howley,P.M.,乳头状瘤病毒体:病毒及其复制,病毒学,Fields,B.C.,Knipe,D.M.,Howley,P.M.,主编,Philadelphia:Lippincott-Raven Publishers,1996.第二版,2045-2076页)中起决定性作用。结构和突变分析显示了在E2蛋白总长中有3个截然不同的结构域。N-末端部分(残基1至210)是转录和复制活化结构域。其后是松散的铰链区(残基211至324)和羧基末端结合DNA的二聚作用结构域(残基325至410)[Dostatni,N.,等人,EMBO J 7(1988)3807-3816;Haugen,T.,等人.EMBO J 7(1988)4245-4253;McBride,A.,等人,EMBO J 7(1988)533-539;McBride,A.,等人,Proc Natl Acad Sci USA 86(1989)510-514]。根据X线晶体照相术的数据,E2的结合DNA二聚作用结构域具有双对称的八链反平行β片层结构,由两个同样的″半片层″亚单位组成[Hegde,R.,等人,Nature 359(1992)505-512;Hegde,R.,J NuclMed 36(6 Suppl)(1995)25S-27S]。E2反式-活化结构域的功能元件具有非常高的结构完整性,如通过突变分析[Abroi,A.,等人,J Virol 70(1996)6169-6179;Brokaw,J.,等人,J Virol 71(1996)23-29;Grossel,M.,等人,J Virol 70(1996)7264-7269;Ferguson,M.和Botchan,M.,JVirol 70(1996)4193-4199]和X线晶体照相术[Harris,S.,和Botchan,M.R.,Science 284(1999)1673-1677和Antson,A.等人,Nature 403(2000)805-809]所证实的。此外,X线晶体照相术显示,E2蛋白的N-末端结构域形成二聚结构,其中Arg 37在二聚体形成中有重要的功能(Antson,A.,等人,见前)。
如前面已经描述的,1型牛乳头状瘤病毒的反式E2蛋白和其顺式多结合位点对于游离基因的基因元件附着于染色质都是必需的和充分的。此现象被认为提供了在病毒感染分裂细胞的过程中分隔病毒基因组的机制[llves,I.,等人,J Virol.73(1999)4404-4412]。
到目前为止,没有公开的乳头状瘤载体或其它载体满足提出的最佳疫苗的标准和必要条件,对DNA疫苗和常规疫苗也是如此。(应当注意到,这些必要条件是优选的但不是用作疫苗所必须的。)首先,最佳的疫苗必须产生保护性免疫并具有最小的不良反应。因此疫苗应该没有对接受者有毒和/或引起疾病症状的成分。其次,最佳的疫苗必须诱导病原体特异的免疫反应,即它必须引起对所需病原体的强烈和可测量的免疫反应而不引起对疫苗其它成分的免疫反应。这两个必要条件意味着要用作DNA疫苗的载体应当最理想地仅表达所需的基因并最理想地不在宿主中复制,或含有任何与接受者同源的序列,因为载体与宿主基因组间同源的核苷酸序列可影响载体整合进宿主基因组。第三,最佳的疫苗必须诱导正确类型的免疫反应;即它必须产生体液的和细胞的免疫反应以对细胞内和细胞外的病原体起作用。最后,最佳的疫苗必须是稳定的,即在储存和制备所用的各种苛刻的环境下,它必须在疫苗制剂中足够长时间地保持其在体内产生免疫反应的效力。此外,疫苗应当有合理的价格。更进一步地,接种的途径和方法也是优化DNA免疫法的重要考虑因素。
在开发DNA疫苗时,所需基因的表达稳定性有时是主要的问题。于是,以前的技术关注于在受体细胞中保持功能或保存载体,但经常以安全性为代价。例如,Ohe,Y.,等人[Hum Gene Ther 6(3)(1995)325-333]公开了能够稳定的、高水平基因表达的乳头状瘤病毒载体,建议用于基因治疗。从所述载体中删除了转化早期基因E5、E6和E7,但仍然含有编码其它乳头状瘤病毒基因的核苷酸序列如E1和E2基因,它们与病毒复制有关。因此,载体产生几种其它的乳头状瘤蛋白,可能引起有害的免疫反应并导致载体整合进接受者的危险。另外,由于含有E1基因,载体是可复制的。此外,其体积较大因而在制备过程中接受细菌修饰。
国际专利申请PCT/EE96/00004(WO 97/24451)公开了能够长期保存在宿主细胞中的载体,以及用这种载体在表达E1和E2的哺乳动物宿主细胞中获得长期生产目的基因产物的方法。这些载体含有乳头状瘤病毒的最小复制起始点(MO)、乳头状瘤病毒的微型染色体维持元件(MME)和编码该基因产物的基因,MO和MME由不同于天然乳头状瘤病毒序列的DNA序列组成,在一些实施例中是E1基因。此外,在一些实施例中公开了经常基本上由10个E2结合位点组成的含MME的载体。为了表达,这些载体需要在宿主或载体中有E1蛋白存在。这给载体赋予了复制功能。这些载体也表达除目的基因以外的E1蛋白和E2蛋白,并含有如兔β-球蛋白序列的序列,它与人类序列部分同源,引起整合到人基因组的严重危险,这样降低了这些载体作为DNA疫苗的效力。另外,由于其大小(接近15kb),载体在细菌细胞内的制备阶段是不稳定的,细菌复制机器倾向于通过载体的随机拼接修饰载体,产生不合要求的表达产物,包括完全缺少目的基因的产物。
国际专利申请PCT/EE96/00004(WO 97/24451)进一步公开了E1和E2是载体的游离基因长期复制所必需的唯一病毒蛋白。另外,BPV1基因组的功能保存与最小起始点(MO)的存在相关,据称对于载体在细胞中的长期保持或稳定保存尽管不是充分的,但是必需的。此外,据称顺式元件即BPV1的微型染色体维持元件对于BPV1的稳定复制是需要的。特别地,据称多聚E2结合位点(E2BS)对于载体的稳定保存是必需的。
明确地需要改进可用作DNA疫苗的新载体。
因此,本发明的一个目的是提供新的载体,它们能够在宿主体内大量和数量不断增加的不同细胞中长期保存,并因而能够提供所需抗原的稳定表达。
本发明的另一个目的是提供新的载体,它们在最初接受载体的细胞中长期保存并在有丝分裂的细胞分裂后将载体传递给子细胞。
而本发明的另一个目的是提供新的载体,它们除一条或多条目的基因以外,仅优选地表达在受体细胞中长期保存所必需的基因,从而没有对接受者有毒或引起疾病症状的成分。
本发明进一步的目的是提供新的载体,它们模拟减毒的活病毒疫苗,特别是模拟其在体内繁殖的功能,而不引起任何大量的疾病迹象且不表达在注射DNA疫苗的宿主中引起不良反应的有害蛋白。
本发明更进一步的目的是提供新的载体,它们不在接受者内复制。
本发明还有另一个目的是提供新的载体,当它们被用作DNA疫苗时引起体液的和细胞的免疫反应。
而本发明的另一个目的是提供新的载体,它们适合于在细菌细胞内的大规模生产。
而本发明的另一个目的是提供新的载体,它们不是宿主特异的,因此能够在各种细菌细胞中生产。
本发明另外的目的是提供新的载体,它们被用作一条或多条目的基因的携带载体。
本发明进一步的目的是提供新的载体,它们被用于基因治疗,作为基因治疗剂,并用于在体内生产大分子药物。
3.发明的概述
本发明公开了新的载体,它满足一条或多条目的基因携带载体或最佳DNA接种疫苗载体的必要条件,且优选地没有以往载体的技术缺点和副作用。
本发明基于惊人的发现,即载体(质粒)携带(i)编码核-锚定蛋白的DNA序列表达基因盒,和(ii)所述在增殖细胞中传播的核-锚定蛋白的高亲合性结合位点多拷贝。结果,即使载体不复制,携带载体的细胞数量也增加。当载体另外携带一条或多条目的基因时,表达一条或多条目的基因的这种细胞数量同样地增加而没有载体的复制。于是,发明的载体缺少乳头状瘤病毒复制起始点。在优选的实施例中,发明的载体缺少在哺乳动物细胞中起作用的复制起始点。
因此,本发明公开了在DNA接种疫苗和基因治疗中以及作为基因治疗药的,被用作一条或多条目的基因携带载体的新载体。在特殊实施例中,所述载体能够传播,如果需要能够在不断增加数量的细胞中长时间的表达一条或多条目的基因。本发明载体优选地仅表达核-锚定蛋白,如果需要则表达一条或多条目的基因和任意的可选择标记物。但是,它们优选地缺少任何冗余的、致癌性转化的或潜在有毒性的序列,从而消除了以前公开的或建议用作DNA疫苗的载体的严重缺点,即抗其它病毒成分的超敏性反应。在发明的某实施例中,这是通过细胞中低水平表达的核-锚定蛋白来实现的。同时,本发明载体诱导体液的和细胞的免疫反应,其中一条或多条目的基因包括在载体中。
本发明载体利于在体外(如,以生产水平)和体内(如,接种疫苗)使用。
本发明涉及在附加权利要求中列出的发明主题。
本发明涉及表达载体,包括:(a)可操作地与异种启动子连接的编码核-锚定蛋白的DNA序列,所述核-锚定蛋白含有(i)与特定DNA序列结合的DNA结合结构域,和(ii)与核成分结合的功能性结构域或其功能相等区;和(b)形成核-锚定蛋白结合位点的多聚体化DNA序列,其中所述载体缺少乳头状瘤病毒的复制起始点。在优选的实施例中,发明的载体缺少在哺乳动物细胞中起作用的复制起始点。
在某些实施例中,核成分是有丝分裂的染色质、核基质、核结构域10(ND10)或核结构域POD。
在某些特殊的实施例中,核锚定-蛋白是染色质-锚定蛋白,且所述的功能性结构域结合有丝分裂的染色质。
在某些实施例中,核-锚定蛋白含有铰链或连接子区。
在某些实施例中,核-锚定蛋白是真核生物、原核生物或病毒来源的天然蛋白。在某些特殊的实施例中,天然蛋白是病毒来源的。
在某些实施例中,核-锚定蛋白是真核生物来源的天然蛋白。
在某些实施例中,核-锚定蛋白是乳头状瘤病毒或EB病毒的蛋白。
在特殊的实施例中,核-锚定蛋白是1型牛乳头状瘤病毒的E2蛋白或EB病毒核抗原1。
在特殊的实施例中,核-锚定蛋白是1型牛乳头状瘤病毒的E2蛋白。
在特殊的实施例中,核-锚定蛋白是高迁移率组蛋白。
在某些实施例中,核-锚定蛋白是非天然的蛋白。
在某些实施例中,核-锚定蛋白是重组体蛋白、融合蛋白或通过分子建模技术获得的蛋白。
在特殊的实施例中,重组体蛋白、融合蛋白或通过分子建模技术获得的蛋白含有任何组合的DNA结合结构域和功能性结构域,前者与所述的特定DNA序列结合,后者与核成分结合,其中所述的与核成分结合的功能性结构域是乳头状瘤病毒的、EB病毒的或高迁移率组蛋白的。
在某些特殊的实施例中,重组体蛋白、融合蛋白或通过分子建模技术获得的蛋白含有任何组合的DNA结合结构域和功能性结构域,前者与所述的特定DNA序列结合,后者与核成分结合,其中所述的与核成分结合的功能性结构域是1型乳头状瘤病毒的E2蛋白的、EB病毒核抗原1的或高迁移率组蛋白的。
在某些实施例中,载体进一步包括目的DNA序列的一个或多个表达基因盒。
在某些实施例中,目的DNA序列是感染性病原体的。在某些实施例中,感染性病原体是病毒。在某些特殊的实施例中,病毒选自人免疫缺陷病毒(HIV)、单纯疱疹病毒(HSV)、丙型肝炎病毒、流感病毒和肠道病毒。
在某些实施例中,目的DNA序列是细菌的。在某些实施例中,细菌选自沙眼衣原体、结核分支杆菌和肺炎支原体。在特殊的实施例中,细菌是沙门氏菌。
在某些实施例中,目的DNA序列是真菌性病原体的。在某些实施例中,真菌性病原体是白色念珠菌。
在某些实施例中,目的DNA序列是HIV来源的。
在特殊的实施例中,目的DNA序列编码HIV的非结构调控蛋白。在更特殊的实施例中,HIV的非结构调控蛋白是Nef、Tat和/或Rev。在特殊实施例中,HIV非结构调控蛋白是Nef。
在某些实施例中,目的DNA序列编码HIV的结构蛋白。在特殊的实施例中,目的DNA序列是编码HIV gp120/gp160的基因。
在某些实施例中,发明的载体包括由编码Nef、Tat和/或Rev的目的DNA序列组成的第一个表达基因盒,和由编码Nef、Tat和/或Rev的目的DNA序列组成的第二个表达基因盒。
在某些实施例中,发明的载体包括由编码Nef、Tat和/或Rev的目的DNA序列组成的第一个表达基因盒,和由编码HIV结构蛋白的目的DNA序列组成的第二个表达基因盒。
在某些实施例中,目的DNA序列编码与癌症相关的蛋白。
在某些实施例中,目的DNA序列编码与免疫成熟、免疫反应调节或自体免疫反应调节相关的蛋白。在特殊的实施例中,该蛋白是APE-CED。
在特殊实施例中,目的DNA序列是Aire基因。
在某些实施例中,目的DNA序列编码在任何遗传性单基因疾病中缺陷的蛋白。
在某些实施例中,目的DNA序列编码大分子药物。
在某些实施例中,目的DNA序列编码细胞因子。在某些特殊的实施例中,细胞因子是选自IL1、IL2、IL4、IL6和IL12的白介素。在某些其它的特殊实施例中,目的DNA序列编码干扰素。
在某些实施例中,目的DNA序列编码有生物学活性的RNA分子。在某些特殊的实施例中,有生物学活性的RNA分子包括抑制性反义RNA和核糖酶分子。在某些特殊的实施例中,抑制性反义RNA或核糖酶分子对抗致癌基因的作用。
发明的载体适合用于在体内生产治疗性大分子物质。
在某些实施例中,本发明提供了用作药剂的载体。
在某些实施例中,本发明提供了用作携带载体的载体,以传递一条或多条目的基因或一条或多条目的DNA序列,如编码感染原蛋白或肽、治疗剂、大分子药物或其任何组合的基因、多个基因、或一条或多条DNA序列。
在某些特殊的实施例中,发明提供了用作药剂的载体以治疗遗传的或获得的基因缺陷。
在某些实施例中,本发明提供了用作抗感染原的治疗性DNA疫苗的载体。
在某些实施例中,本发明提供了用作治疗剂的载体。
本发明进一步涉及给受试者提供蛋白的方法,所述方法包括给予受试者发明的载体,其中所述的载体(i)进一步包括编码要提供给受试者的蛋白的第二条DNA序列,其第二条DNA序列可操作地与第二个启动子连接,和(ii)不编码牛乳头状瘤病毒蛋白E1,其中所述的受试者不表达牛乳头状瘤病毒蛋白E1。
本发明进一步涉及在受试者中诱导对蛋白的免疫反应的方法,该方法包括给予受试者发明的载体,其中所述的载体(i)进一步包括编码所述蛋白的第二个DNA序列,其第二个DNA序列可操作地与第二个启动子连接,和(ii)不编码牛乳头状瘤病毒蛋白E1,其中所述的受试者不表达牛乳头状瘤病毒蛋白E1。
本发明进一步涉及在需要所述治疗的患者中治疗感染性疾病的方法,所述方法包括给予所述患者治疗有效量的发明载体,其中目的DNA序列编码由感染原的免疫原性抗原决定簇组成的蛋白。
本发明进一步涉及在需要所述治疗的患者中治疗遗传的或获得的基因缺陷的方法,该方法包括给予所述患者治疗有效量的发明载体,其中所述的目的DNA序列编码被所述遗传的或获得的基因缺陷影响的蛋白。
本发明进一步涉及在受试者中表达DNA序列的方法,该方法包括给予所述受试者发明的载体。
本发明进一步涉及在受试者中表达DNA序列、治疗遗传的或获得的基因缺陷、治疗感染性疾病、诱导对蛋白的免疫反应、和向受试者提供蛋白的方法,其中发明的载体不编码牛乳头状瘤病毒蛋白E1,其中所述的受试者不表达牛乳头状瘤病毒蛋白E1。
在某些实施例中,发明的载体被用于在细胞或生物体内生产由所述目的DNA序列编码的蛋白。
本发明进一步提供了制备权利要求1、2或17的载体的方法,包括:(a)培养含所述载体的宿主细胞和(b)回收载体。在特殊的实施例中,制备发明载体的方法进一步包括在步骤(a)之前用所述的载体转化所述宿主细胞的步骤。在某些特殊的实施例中,宿主细胞是原核细胞。在特殊的实施例中,宿主细胞是大肠杆菌。
本发明进一步涉及以含发明载体为特征的宿主细胞。在某些实施例中,宿主细胞是细菌细胞。在某些其它实施例中,宿主细胞是哺乳动物细胞。
本发明进一步涉及含发明载体的携带载体。
本发明进一步涉及含发明载体的药学组合物和适合的制药赋形剂。
本发明进一步涉及含发明载体的DNA疫苗。
本发明进一步涉及含发明载体的基因治疗剂。
本发明进一步涉及制备DNA疫苗的方法,所述方法包括将发明的载体与适合的制药赋形剂结合。
本发明进一步涉及制备用于基因治疗的药剂的方法,所述方法包括将发明的载体与适合的药学赋形剂结合。
4.图表的描述
图1显示质粒super6的简图。
图2显示质粒VI的简图。
图3显示质粒II的简图。
图4显示在Jurkat细胞中从载体super6、super6wt、VI、VIwt和II表达Nef和E2蛋白。
图5显示质粒产物1的简图。
图6A显示质粒NNV-1和NNV-2的简图和图6B显示质粒和NNV-2wt的简图。
图7显示Jurkat细胞中从质粒NNV-1、NNV-2、NNV-1wt、NNV-2-wt、super6和super6wt表达Nef蛋白。
图8显示Jurkat细胞中从质粒NNV-2-wt、NNV-2-wtFS和产物1表达Nef和E2蛋白。
图9显示P815细胞中从质粒NNV-2-wt、NNV-2-wtFS和产物1表达Nef和E2蛋白。
图10显示CHO细胞中从质粒NNV-2-wt、NNV-2-wtFS和产物1表达Nef和E2蛋白。
图11显示RD细胞中从质粒NNV-2-wt、NNV-2-wtFS和产物1表达Nef蛋白。
图12显示在CHO、Jurkat细胞和P815细胞中表达RNA分子。
图13显示NNV-2wt在细菌细胞中的稳定性。
图14显示作为CHO和Jurkat细胞系中的非复制游离基因成分的NNV-2wt的稳定性Southern印迹分析。
图15显示载体NNV2wt、NNV2wtFS和产物1不能进行HPV-11复制因子依赖的复制。
图16显示质粒2wtd1EGFP的简图。
图17显示质粒gf10bse2的简图。
图18显示质粒2wtd1EGFPFS的简图。
图19显示质粒NNVd1EGFP的简图。
图20显示用质粒2wtd1EGFP、2wtd1EGFPFS、NNVd1EGFP或仅用载体DNA转染的Jurkat细胞生长曲线。
图21显示用质粒2wtd1EGFP、2wtd1EGFPFS、gf10bse2或仅用载体DNA转染的Jurkat细胞的生长曲线。
图22显示在用载体2wtd1EGFP、2wtd1EGFPFS或NNVd1EGFP转染的Jurkat细胞群中d1 EGFP阳性细胞百分比的改变。
图23显示在用载体2wtd1EGFP、2wtd1EGFPFS或gf10bse2转染的Jurkat细胞群中d1 EGFP阳性细胞百分比的改变。
图24显示在用载体2wtd1EGFP、2wtd1EGFPFS或NNVd1EGFP转染的Jurkat细胞群中表达d1 EGFP的细胞数目的改变。
图25显示在用载体2wtd1EGFP、2wtd1EGFPFS或gf10bse2转染的Jurkat细胞群中表达d1 EGFP的细胞数目的改变。
图26.T细胞对重组体Nef蛋白(5毫克/孔)的反应,在用1毫克GTU-Nef免疫的5名患者中通过T细胞增殖检测。
图27.T细胞对重组体Nef蛋白(5毫克/孔)的反应,在用20毫克GTU-Nef免疫的5名患者中通过T细胞增殖检测。
图28.T细胞对重组体Nef蛋白(5毫克/孔)的反应,在用1毫克GTU-Nef免疫的#1患者中通过T细胞增殖检测。结果给出T细胞增殖试验的刺激指数(Nef S1)和分泌到上清的IFN-γ。
图29.(A)质粒pEBO LPP;(B)质粒s6E2d1 EGFP;(C)质粒FRE2d1EGFP
图30.质粒FREBNAd1EGFP
图31.载体不干扰细胞增殖
图32.载体以不同的动力学保存在细胞中
图33.在转染的总细胞群中,表达d1EGFP的细胞数目随时间的改变
图34.在转染的总细胞群中,表达d1EGFP的细胞数目随时间的改变。(A)人胚胎细胞系293;(B)小鼠细胞系3T6
图35.Nef和E2抗体反应
图36.Rev和Tat抗体反应
图37.Gag和CTL反应
图38.(A)GTU-1;(B)GTU-2Nef;(C)GTU-3Nef;(D)super6wtd1EGFP;(E)FREBNAd1EGFP;(F)E2BSEBNAd1EGFP;(G)NNV-Rev
图39.(A)pNRT;(B)pTRN;(C)pRTN;(D)pTNR;(E)pRNT;(F)p2TRN;(G)p2RNT;(H)p3RNT;(I)pTRN-iE2-GMCSF;(J)pTRN-iMG-GMCSF
图40.(A)pMVINTR;(B)pMV2NTR;(C)pMV1N11TR;(D)pMV2N11TR
图41.(A)pCTL;(B)pdgag;(C)psynp17/24;(D)poptp17/24;(E)p2mCTL;(F)p2optp17/24;(G)p3mCTL;(H)p3optp17/24
图42.(A)pTRN-CTL;(B)pRNT-CTL;(C)pTRN-dgag;(D)pTRN-CTL-dgag;(E)pRNT-CTL-dgag;(F)pTRN-dgag-CTL;(G)pRNT-dgag-CTL;(H)pTRN-optp-17/24-CTL;(I)pTRN-CTL-optp17/24;(J)pRNT-CTL-optp17/24;(K)p2TRN-optp17/24-CTL;(L)p2RNT-optp17/24-CTL;(M)p2TRN-CTL-optp17/24;(N)p2RNT-CTL-optp17/24;(O)p2TRN-CTL-optp17/24-iE2-mGMCSF;(P)p2RNT-CTL-optp17/24-iE2-mGMCSF;(Q)p3TRN-CTL-optp17/24;(R)p3RNT-CTL-optp17/24;(S)p3TRN-CTL-optp17/24-iE2-mGMCSF;(T)p3RNT-CTL-optp17/24-iE2-mGMCSF;(U)FREBNA-RNT-CTL-optp17/24;(V)super6wt-RNT-CTL-optp17/24;(W)E2BSEBNA-RNT-CTL-optp17/24;(X)pCMV-RNT-CTL-optp17/24
图43.multireg抗原的表达分析。
图44.由蛋白免疫显性部分组成的multireg抗原的表达分析。
图45.通过免疫荧光检验分析multireg抗原的细胞内定位。
图46.gag编码的结构蛋白和CTL多抗原决定簇的表达分析。
图47.p17/24蛋白在RD细胞膜内的定位。
图48.含dgag和CTL的多基因在Cos-7细胞中的表达分析。
图49.在Jurkat细胞中表达的多HIV抗原的Western印迹分析。
图50.TRN-CTL-optp17/24和RNT-CTL-optp-17/24抗原及E2蛋白从GTU-1、GTU-2和GTU-3载体的表达分析。
图51.从不同载体表达的多HIV抗原的保存。
图52.多HIV抗原在RD细胞中的细胞内定位。
5.发明的详细描述
5.1发明的载体
本发明基于出乎意外的发现,即表达载体能够在增殖细胞群中传播,表达载体携带(A)核-锚定蛋白基因的表达基因盒,核-锚定蛋白结合(i)特定DNA序列和(ii)适合的核成分,和携带(B)所述核-锚定蛋白的多聚体化DNA结合序列。这种核-锚定蛋白包括但不限于染色质-锚定蛋白,如1型牛乳头状瘤病毒E2蛋白(BPV1 E2;SEQ ID NO:50)。DNA结合序列可以是,但不限于,多聚体化的E2结合位点。根据以前的技术,不能期望例如乳头状瘤病毒的隔离/分隔功能可以分别地被表达,给疫苗载体添加隔离/分隔功能可保证载体在增殖细胞群中的分布。另外,根据以前的技术,不能期望可以构建不依赖复制起始点而发挥作用的功能性载体。
如本发明所用的术语“核-锚定蛋白”是指与特定DNA序列结合并能够给载体提供核区域化功能的蛋白,即,指能够将载体锚定或附着到特定的核区室的蛋白。
在发明的某些实施例中,核-锚定蛋白是天然的蛋白。这些核区室的实例是有丝分裂的染色质或有丝分裂的染色体、核基质、核结构域如ND10和POD等。核-锚定蛋白的实例是1型牛乳头状瘤病毒(BPV1)E2蛋白、EBNA1(EB病毒核抗原1;SEQ ID NO:52)和高迁移率组(HMG)蛋白等。如本发明所用的术语“核-锚定蛋白的功能相等物”是指天然的或非天然来源的、具有核-锚定蛋白特性的蛋白或多肽。
在本发明的某些其它实施例中,发明的核-锚定蛋白是重组体蛋白。在发明的某些特殊实施例中,核-锚定蛋白是融合蛋白、嵌合蛋白或通过分子建模获得的蛋白。与本发明有关的融合蛋白或通过分子建模获得的蛋白,其特征是能够与核成分结合并能够结合对DNA特异的序列。在发明优选的实施例中,这种融合蛋白是由发明的载体编码的,发明的载体也含有其上结合有融合/嵌合蛋白的特定DNA序列。核成分包括但不限于染色质、核基质、ND10结构域和POD。为减低干扰宿主细胞内源性基因表达的危险,DNA结合结构域和相应的DNA序列优选地为宿主细胞/宿主生物体非内源性的。这些结构域包括但不限于,1型牛乳头状瘤病毒(BPV1)E2蛋白(SEQ ID NO:50)的、EB病毒核抗原1(EBNA1;SEQ ID NO:52)的和高迁移率组(HMG)蛋白(HMG盒)的DNA结合结构域。
发明的载体可进一步包含“目的DNA序列”,它编码如免疫原或治疗药的蛋白(包括肽或多肽)。在发明的某些实施例中,目的DNA序列编码有生物学活性的RNA分子如反义RNA分子或核糖酶。
携带核-锚定蛋白基因表达基因盒和所述核-锚定蛋白多聚体化结合位点的发明表达载体在增殖细胞群中传播。这意味着高拷贝数量的载体或质粒被传递进靶细胞中,且应用核-锚定蛋白的隔离/分隔功能及其多聚体化结合位点保证了载体在细胞分裂期间分配到子细胞中。
发明的载体缺少乳头状瘤病毒复制起始点。进一步,在优选的实施例中,发明的载体缺少在哺乳动物细胞中起作用的复制起始点。删除了乳头状瘤病毒复制起始点或哺乳动物复制起始点就形成了超过本领域以前载体的改进,有几个原因。(1)同本领域以前载体相比,复制起始点的删除减小了发明载体的大小。这种大小的减低增加了载体的稳定性并促进被宿主细胞摄取。(2)复制起始点的删除减少了与宿主细胞基因组重组的危险,从而降低了有害副作用的危险。(3)复制起始点的删除使得可以通过调节给予载体的量简单地控制剂量。相反,对于起作用的复制起始点,在确定所需剂量时必须考虑载体的复制。(4)如果载体不连续地给予宿主生物体,缺少复制起始点使宿主生物体从其体内清除载体,从而更好地控制要在宿主生物体内表达的DNA序列的水平。进一步,如果载体的存在仅在治疗过程中需要,而在健康个体中是不需要的,那么生物体从其体内清除载体的能力是有益的。
用于本发明载体的核-锚定蛋白基因可以是任何适合的DNA序列,编码具有所需特性的天然或人造蛋白如重组体蛋白、融合蛋白或通过分子建模技术获得的蛋白。因此,天然核-锚定蛋白的基因可以是病毒蛋白基因如牛乳头状瘤病毒E2蛋白或EB病毒的EBNA1(EB病毒核抗原1),真核生物蛋白基因如高迁移率组(HMG)蛋白或类似蛋白,或是原核蛋白基因,该基因含有能够结合特定DNA序列的DNA结合结构域和能够结合核成分的功能性结构域。可选择地,含有能够结合特定DNA序列的DNA结合结构域和能够结合核成分的功能性结构域的核-锚定蛋白基因也可以包括DNA序列,编码具有附着于适当核结构的能力的细胞蛋白结构域,核结构如有丝分裂的染色体、核基质或核结构域如ND10或POD。
可选择地,可以使用编码非天然或人造蛋白如重组体蛋白或融合蛋白或通过分子建模获得的蛋白的DNA序列,这些蛋白含有能够结合如乳头状瘤病毒特定DNA序列的DNA结合结构域,如BPV1的E2蛋白DNA结合结构域,但其中核-锚定蛋白如E2蛋白的N-末端已经被任何具有相似能力的适合蛋白的结构域取代,例如,被EB病毒核抗原1序列N-末端结构域取代。相似地,可以使用编码重组体蛋白或融合蛋白的DNA序列,蛋白含有能够结合核成分的功能性结构域,如乳头状瘤病毒的N-末端结构域如BPV1的E2蛋白,但其中核-锚定蛋白C-末端结合DNA的二聚作用结构域,如E2蛋白C-末端,已经被充足DNA结合能力的任何蛋白结构域取代,如BPV-1 E2蛋白和EBNA-1的DNA结合结构域。
在本发明优选的实施例中,核-锚定蛋白是染色质-锚定蛋白,它含有与特定DNA序列结合的DNA结合结构域和能够结合有丝分裂染色质的功能性结构域。本发明中使用的这种染色质-锚定蛋白及其多聚体化结合位点的优选实例是1型牛乳头状瘤病毒E2蛋白和E2蛋白多聚体化结合位点。就E2来说,传播功能的机制是由于E2蛋白的双重功能:E2蛋白经蛋白N-末端结构域附着到有丝分裂染色体上的能力,和E2蛋白C-末端结构域序列特异性结合的能力,它保证将含有多聚体化E2结合位点的载体接到有丝分裂的染色体上。从而给载体提供隔离/分隔功能。
在发明的另一个优选的实施例中,染色质-锚定蛋白基因的表达基因盒包括细胞、病毒或重组体来源的任何适合蛋白的基因,所述蛋白具有与BPV1 E2类似的特性即,经一个结构域附着于有丝分裂染色质和经另一个结构域共同地将DNA结合到对此DNA结合结构域特异的多聚体化结合位点上的能力。
在特殊实施例中,从BPV1获得的序列被用在本发明载体中,它们被大大地缩短长度以仅仅包括BPV1的两个元件。首先,它们包括E2蛋白编码序列,转录自异源真核生物启动子并在异源的聚腺苷酰作用位点上聚腺苷化。其次,它们包括以集簇形式掺入载体的E2蛋白多结合位点,其中的位点可以是头尾相接结构或可以通过间隔定位包含在载体中。这两个元件都是必需的且令人惊讶地足以发挥载体在增殖细胞中的传播功能。相似地,当本发明载体中使用其它适合来源的DNA序列时,应用相同的原理。
根据本发明,含有能够结合特定DNA序列的DNA结合结构域和能够结合核成分的功能性结构域的核-锚定蛋白的基因表达盒,如像BPV1 E2的染色质-锚定蛋白基因表达盒,包括异源真核生物启动子,核-锚定蛋白编码序列,如染色质-锚定蛋白编码序列例如BPV1 E2蛋白编码序列,和polyA位点。可以使用控制核-锚定蛋白表达的不同异源真核生物启动子。这些异源真核生物启动子的核苷酸序列是本领域熟知的并容易得到。这些异源真核生物启动子具有不同的强度和组织特异性。在优选的实施例中,核锚定蛋白以低水平表达。
如本发明文中所定义的,多聚体化DNA结合序列即含多聚结合位点的DNA序列,是结合DNA的二聚作用结构域结合的区域。本发明载体的多聚体化DNA结合序列可含有任何适合的DNA结合位点,假如它满足上面的必要条件。
在优选的实施例中,本发明载体的多聚体化DNA结合序列可包含已知的17个不同亲合性E2结合位点中的任一个,以六聚物或更高寡聚物、八聚物或更高寡聚物、十聚物或更高寡聚物形式。也可应用含不同E2结合位点的寡聚物。本发明载体中使用的特别优选的E2结合位点是BPV1高亲合性位点9和10,亲合性位点9是最优选的。当涉及更高寡聚物时,其大小仅受构建条件的限制,可含有6至30个同样的结合位点。发明优选的载体前后依次含有10个BPV-1 E2结合位点9。当多聚体化DNA结合序列由不同的E2结合位点组成时,其大小和组成成分仅受构建操作方法的限制。因而它们可含有两个或多个不同的E2结合位点附着于一系列6至30个,最优选地10个E2结合位点上。1型牛乳头状瘤病毒基因组(SEQ ID NO:49)含有17个与E2亲合性不同的E2蛋白结合位点。E2结合位点被Li等人描述[Genes Dev 3(4)(1989)510-526],在此整体合并为参考文献。
可选择地,多聚体化DNA结合序列可由任何适合的多聚特定序列组成,这些序列能够共同地将蛋白结合到质粒上,如EBNA1或适合的HMG蛋白的序列。EBNA-1的21×30bp结合位点重复区位于EB病毒基因组(SEQ ID NO:51)的7421位核苷酸至8042位核苷酸区域内。这些EBNA-1结合位点在以下文献中被描述:Rawlins等人,Cell 42(3)(1985)859-868;Reisman等人,Mol Cell Biol 5(8)(1985)1822-1832;及Lupton和Levine,Mol Cell Biol 5(10)(1985)2533-2542,所有这三者均在此整体合并为参考文献。
多聚体化DNA结合序列相对于结合DNA的二聚作用结构域表达盒的位置是不重要的,可以在质粒中的任何位置。因此,多聚体化DNA结合序列可以位于目的基因表达盒的下游或上游,接近于目的基因启动子的位置是优选的。
适当时,发明的载体还含有,转录该基因或多个基因或目的DNA序列的适合启动子、附加调控序列、聚腺苷酰作用序列和内含子。优选地,载体还可包括细菌质粒复制起始点和一个或多个可选择标记物的基因以促进在细菌宿主中制备载体,及适合的启动子以表达抗生素选择基因。
可选择的标记可以是在DNA疫苗中允许的任何适合的标记,像卡那霉素或新霉素以及其它的标记。此外,在适当的情况下,发明的载体中可以包括其它的阳性和阴性选择标记。
本发明载体仅包括对长期保存必要和足够的DNA序列,例如BPV1 DNA序列。所有可能引起不良反应的多余序列,如致癌序列,已被删除。因此在优选的发明载体中,E2编码序列通过突变分析被修饰,使其仅表达E2蛋白,且重叠的E3、E4和E5序列已通过诱导突变被失活而不能翻译E3、E4和E5的开放阅读框。发明的载体不含有乳头状瘤病毒复制起始点。优选地,发明的载体进一步不含有在哺乳动物细胞或哺乳动物中起作用的复制起始点。
更进一步,本发明载体不是宿主特异的,因为核-锚定蛋白如E2蛋白的表达是由非天然的或异源启动子控制的。根据选择的特殊启动子,这些启动子可在大范围的哺乳动物细胞中起作用,或者它们可以是细胞或组织特异的。本发明载体所用的核-锚定蛋白如E2蛋白的启动子实例是胸苷激酶启动子、人细胞巨化病毒极早期启动子、鲁斯氏肉瘤病毒LTR,等。为表达目的基因,优选的启动子是保证目的基因高水平表达的强启动子,这种启动子的一个实例是人细胞巨化病毒极早期启动子。
5.2发明的载体作为表达目的DNA序列的媒介物
要经发明载体表达的一个基因、多个基因或一条DNA序列或多条DNA序列可以是任何需要表达的目的DNA序列。因此,载体可含有感染性微生物病原体如病毒的一个基因或多个基因或一条DNA序列或多条DNA序列,不能够制备或使用针对它们的活的减毒疫苗或灭活疫苗。这些目的DNA序列包括以下来源的基因或DNA序列:病毒如人免疫缺陷病毒(HIV)、单纯疱疹病毒(HSV)、丙型肝炎病毒、流感病毒、肠道病毒等;细胞内细菌如沙眼衣原体、结核分支杆菌、肺炎支原体等;细胞外细菌如沙门氏菌;或真菌如白色念珠菌。
在优选的发明实施例中,载体含有编码HIV早期调控蛋白的基因,即非结构调控蛋白Nef、Tat或Rev,优选为Nef。在发明的另一个优选的实施例中,发明的载体含有编码HIV结构蛋白的基因。在另一个优选的实施例中,本发明载体含有编码HIV早期调控蛋白和/或结构蛋白任何组合的两个或更多基因。举例说明性的这些组合的实例是,编码Nef蛋白的基因和编码Tat蛋白的DNA序列的组合,可能与编码HIV外壳糖蛋白gp120/gp160的DNA序列一起,或与并入人造重组体蛋白的病原体蛋白的任何免疫原性抗原决定簇组合在一起。
可选择地,发明的载体可含有遗传或获得性基因缺陷的基因或DNA序列,如黑素瘤分化抗原的序列,像酪氨酸酶A编码序列或编码β-catenins的序列。
在优选的发明实施例中,载体含有癌症或其它突变性疾病相关蛋白的编码基因如APECED基因,优选地,疾病涉及免疫成熟和自体和非自体免疫反应的调节。
在发明的另一个优选的实施例中,载体含有任何DNA序列,编码在遗传性单基因遗传病中缺陷的蛋白。
在发明的另一个优选的实施例中,载体含有任何DNA序列,编码要在体内传递和生产的大分子药物。
制备发明载体的本发明方法包括以下步骤:(A)培养含发明载体的宿主细胞,和(B)回收该载体。在某些特殊的实施例中,步骤(A)前用发明的载体转化宿主细胞。
发明的载体优选地在适合的细菌宿主细胞如大肠杆菌中扩增。发明的载体是稳定的并以高拷贝数在细菌细胞中复制。如果发明的载体要在细菌宿主细胞中扩增,发明的载体含有细菌复制起始点。细菌复制起始点的核苷酸序列是熟练的技术人员熟知的并可容易地获得。
通过以高拷贝数转染进哺乳动物宿主,载体随细胞分裂传播,携带载体的细胞数增加而载体没有复制,每个细胞能够表达目的蛋白。
发明的载体引起所需蛋白的高表达。例如,如实施例4、7-10所显示的:在许多不同的细胞系中可显示HIV Nef蛋白、绿荧光蛋白(EGFP)和AIRE蛋白的高表达,数据表明不仅阳性细胞数,而且由目的基因编码的蛋白的量均随时间升高。
发明的载体还引起体液的和细胞的反应,如实施例9和10所显示的。结果表明本发明载体可有效地用作DNA疫苗。
本发明的疫苗含有本发明的载体或所述载体在适合的药物赋形剂中的混合物。例如,疫苗可含有载体混合物,载体中含有HIV三个不同调控蛋白和/或HIV结构蛋白的基因。
发明的疫苗采用标准的疫苗配方方法配制,以生产通过任何常规途径,即肌肉内、皮内等途径用药的疫苗。
发明的载体可含有ISS刺激序列以激发机体的免疫反应。
发明的疫苗能够以常规的预防性方式使用来防止个体感染,可选择地,发明的疫苗可被用作治疗性疫苗与常规药物一起使用,特别是在病毒感染情况下。
如上提到的,具有在宿主细胞中传播机制的本发明载体发现有大量的应用,用作疫苗,在基因治疗中,在基因传递中以及作为治疗性免疫原。发明的载体可用来给基因缺陷的宿主传递正常的基因,从而实现基因病的治愈或治疗。更进一步,此载体可传递外源性免疫原性蛋白的基因,如微生物或自体肿瘤抗原的基因,以用来开发抗微生物或癌症的疫苗。更进一步,发明的载体可传递适合的标记物质的基因到核,被用来研究细胞功能或用于诊断学。最后,发明的载体可被用来特异地传递大分子药物基因到核,从而能够形成新的治疗原则来治疗和治愈疾病,其中重要的是药物表达在作用位点、细胞核。这些药物可以是化学的大分子如具有治疗或治愈效果的任何蛋白或多肽,它们干扰任何核机制,如复制或转录或输送物质出入核。
特别地,为了调节生物体抗外源抗原的特异免疫反应(免疫治疗),或促进免疫系统抗突变的自体抗原的活性,本发明载体可被用来表达特殊的细胞因子,像白介素类(1L1,IL2,IL4,IL6,IL12和其它)或干扰素。通过表达涉及多巴胺合成的基因如酪氨酸羟化酶以及其它可能具有相似作用的基因缺陷,本发明载体还被用于补充因丧失多巴胺能神经元而引起的不可逆神经变性的脑功能障碍,这是帕金森氏病的原因。本发明载体还用于表达调节脑活动的蛋白和肽,像多巴胺受体、CCK-A和CCK-B受体,以及神经营养因子如GDNF、BDNF和其它调节脑活动的蛋白。进一步,本发明载体被用于在肝细胞中长期表达因子IX和在肌肉细胞中表达α-抗胰岛素,以补充各自生物体的不足。
5.3靶疾病和紊乱
在某些实施例中,发明的载体被用作疫苗。在某些实施例中,发明的载体含有编码蛋白或肽的目的DNA序列。通过给予受试者这种载体,由目的DNA序列编码的蛋白或肽被表达并刺激对目的DNA序列编码的蛋白或肽特异的免疫反应。
在特殊的实施例中,发明的载体被用来治疗和/或预防由感染原引起的感染性疾病和/或状态。这些疾病和状态包括但不限于,由细菌、病毒、真菌、原生动物、寄生虫等病原体引起的感染性疾病。在更特殊的本发明实施例中,感染性疾病是获得性免疫缺陷综合症。
优选地,需要治疗或预防病毒性疾病时,使用编码含已知病毒抗原决定簇分子的DNA序列。例如,这种编码抗原性抗原决定簇的DNA序列可制备自病毒,包括但不限于甲型肝炎病毒、乙型肝炎病毒、丙型肝炎病毒、流感病毒、水痘病毒、腺病毒、I型单纯疱疹病毒(HSV-1)、II型单纯疱疹病毒(HSV-11)、牛瘟病毒、鼻病毒、ECHO病毒、轮状病毒、呼吸道合胞病毒、乳头状瘤病毒、乳多空病毒、细胞巨化病毒、棘皮病毒、虫媒病毒、huntavirus、柯萨奇病毒、腮腺炎病毒、麻疹病毒、风疹病毒、脊髓灰质炎病毒、I型人免疫缺陷病毒(HIV-1)和II型人免疫缺陷病毒(HIV-11)。
优选地,在需要治疗或预防细菌性感染时,使用编码含已知细菌抗原决定簇分子的DNA序列。例如,这种编码抗原性抗原决定簇的DNA序列可制备自细菌,包括但不限于分支杆菌、立克次氏体、支原体、奈瑟氏菌属和军团菌属。
优选地,在需要治疗或预防原生动物感染时,使用编码含已知原生动物抗原决定簇分子的DNA序列。例如,这种编码抗原性抗原决定簇的DNA序列可制备自原生动物,包括但不限于利什曼原虫、kokzidioa和锥体虫。
优选地,在需要治疗或预防寄生虫感染时,使用编码含已知寄生虫抗原决定簇分子的DNA序列。例如,这种编码抗原性抗原决定簇的DNA序列可制备自寄生虫,包括但不限于衣原体和立克次氏体。
在其它特殊的实施例中,发明的载体被用于在受试者中治疗和/或预防肿瘤疾病。在这些实施例中,目的DNA序列编码对肿瘤疾病特异或与其相关的蛋白或肽。作为非限制性实施例,新生物疾病可以是纤维肉瘤、粘液肉瘤、脂肪肉瘤、软骨肉瘤、骨源性肉瘤、脊索瘤、血管肉瘤、内皮肉瘤、淋巴血管肉瘤、淋巴血管内皮肉瘤、滑膜瘤、间皮瘤、尤文氏肉瘤、平滑肌肉瘤、横纹肌肉瘤、结肠癌、胰腺癌、乳腺癌、卵巢癌、前列腺癌、鳞状细胞癌、基底细胞癌、腺癌、汗腺癌、皮脂腺癌、乳头状癌、乳头状腺癌、囊腺癌、髓样癌、支气管癌、肾细胞癌、肝细胞癌、胆管癌、绒癌、精原细胞瘤、胚胎细胞癌、维尔姆斯瘤、子宫颈癌、睾丸肿瘤、肺癌、小细胞肺癌、膀胱癌、上皮癌、神经胶质瘤、星形细胞瘤、成神经管细胞瘤、颅咽管瘤、室管膜瘤、松果体瘤、成血管细胞瘤、听神经瘤、少突神经胶质瘤、脑脊膜瘤、黑素瘤、成神经细胞瘤、视网膜母细胞瘤;白血病如急性淋巴细胞性白血病和急性髓细胞性白血病(原粒细胞、早幼粒细胞、骨髓单核细胞、单核细胞和红细胞性白血病);慢性白血病(慢性髓细胞性(粒细胞性)白血病和慢性淋巴细胞性白血病);和脾大性红细胞增多、淋巴瘤(何杰金氏病和非何杰金氏病)、多发性骨髓瘤、瓦尔登斯特伦氏巨球蛋白血症和重链病,等。
在本发明的某些其它实施例中,目的DNA序列编码因蛋白编码基因遗传性紊乱或获得性突变而无功能或功能障碍的蛋白。这种遗传病包括但不限于,代谢性疾病如动脉硬化症(受影响的基因:APOE);癌症如家族性腺瘤样结肠息肉(受影响的基因:APC基因);自体免疫疾病如自体免疫多内分泌病-念珠菌病-外胚层发育异常(受影响的基因:APECED);肌肉病如杜兴氏肌营养不良(受影响的基因:DMD);神经系统疾病如阿尔兹海姆病(受影响的基因:PS1和PS2)。
还是在另一个实施例中,发明的载体被用来治疗和/或预防由病理性高活性的一种蛋白引起的疾病和紊乱。在发明的这些实施例中,目的DNA序列编码过度活化的蛋白的一种拮抗剂。这些拮抗剂包括但不限于,反义RNA分子,核糖酶,抗体和显性失活蛋白。在发明的特殊实施例中,目的DNA序列编码一种癌基因的抑制剂。
在某些实施例中,目的DNA序列编码一种可拮抗肿瘤生长的分子。在发明的特殊实施例中,目的DNA序列编码一种肿瘤抑制剂,如,但不限于p53。在其他的特殊实施例中,目的DNA序列编码凋亡的一种激动剂,如但不限于,Caspase。
发明提供了一些方法,其中目的DNA序列在受试者中表达。在某些实施例中,含有目的DNA序列的一个或多个表达基因盒的载体给予受试者,其中受试者不表达牛乳头状瘤病毒E1蛋白。
5.4使用本发明的治疗方法
5.4.1重组DNA
在发明的各种实施例中,发明的载体包括含有目的DNA序列的一个或多个表达基因盒。目的DNA序列编码一种蛋白和/或生物学活性的RNA分子。在两种情况下,在基因治疗时,DNA序列均被插入至发明的载体中以在重组细胞或宿主的细胞中表达。
如在此所使用的,一种表达基因盒是指与可使发明的蛋白在一个合适的宿主细胞中表达的一个或多个调控区或增强子/启动子序列可操作连接的目的DNA序列。“可操作地连接”是指一种结合方式,其中调控区和要被表达的DNA序列被连接,并以可允许转录,对于蛋白时允许翻译的方式被定位。
目的DNA序列的转录所必需的调控区由发明的载体提供。在一个相容性宿主构建物系统中,细胞转录因子,如RNA聚合酶将与载体的调控区结合以影响目的DNA序列在宿主生物体中的转录。基因表达需要的调控区的准确性质可在宿主细胞之间有所不同。通常,需要一种启动子,它能够结合RNA聚合酶和促进可操作连接的DNA序列的转录。这种调控区包括参与启动转录和翻译的5’非编码序列,如TATA盒,加帽序列,CAAT序列,和类似序列。编码序列的3’非编码区含有转录终止调控序列,如终止子和聚腺苷酸化位点。
结构性和诱导性调控区都可用来表达目的DNA序列。当宿主细胞的最佳生长条件和高水平表达目的DNA序列的条件不同时,需要使用诱导性启动子。可使用的调控区的实例在下面提供(章节5.4.4)。
为了将有调节功能的DNA序列,如启动子附着于目的DNA序列或将目的DNA序列插入进载体中的克隆位点,提供了合适的相容性限制位点的连接子或接头,可采用本领域熟知的技术连接于cDNA的末端[Wu等人,Methods in Enzymol 152(1987)343-349)。使用限制性酶的切割作用跟随在建立钝端的修饰作用之后,所述的修饰是在连接作用之前通过在单链的DNA末端回退消化或填充而进行。可选择的是,应用PCR使用含有所需限制性酶位点的引物通过扩增DNA将限制性酶导入进DNA的片断中。
含有可操作地连接于调控区(增强子/启动子序列)的目的DNA序列的载体被直接导入进合适的宿主细胞中以表达目的DNA序列而不需进一步克隆。
为了在哺乳动物宿主细胞中表达目的DNA序列,可使用多种调控区,例如,SV40早期和晚期启动子,巨细胞病毒(CMV)极早期启动子,和鲁斯氏肉瘤病毒长末端重复区(RSV-LTR)启动子。可用于哺乳动物细胞的诱导性启动子包括但不限于与金属硫蛋白II基因,小鼠乳腺肿瘤病毒肾上腺皮质激素反应性长末端重复区(MMTV-LTR),β-干扰素基因,和hsp70基因有关的启动子[Williams等人,Cancer Res.49(1989)2735-42;Taylor等人,Mol.Cell Biol.,10(1990)165-75]。使用热休克启动子或应激启动子驱动目的DNA序列在重组宿主细胞中表达是有益的。
另外,表达载体含有可选择的或可筛选的标记物基因用于最初分离,鉴定或跟踪含有载体的宿主细胞。许多选择系统可用于哺乳动物细胞,包括但不限于单纯疱疹病毒胸苷激酶[Wigler等人,Cell 11(1977)223],次黄嘌呤-鸟嘌呤磷酸核糖转移酶[Szybalski和Szybalski,Proc.Natl.Acad.Sci.USA48(1962)2026],和腺嘌呤磷酸核糖转移酶[Lowy等人,Cell 22(1980)817]基因分别用于tk-,hgprt-或aprt-细胞。抗代谢物抗性也可用做选择二氢叶酸还原酶(dhfr)的基础,可赋予对氨甲喋呤的抗性[Wigler等人,Natl.Acad.Sci.USA 77(1980)3567;O′Hare等人,Proc.Natl.Acad.Sci.USA 78(1981)1527];gpt,可赋予对霉酚酸的抗性[Mulligan & Berg,Proc.Natl.Acad.Sci.USA 78(1981)2072];新霉素磷酸转移酶(neo),可赋予对氨基糖苷G-418的抗性[Colberre-Garapin等人,J.Mol.Biol.150(1981)1];和潮霉素磷酸转移酶(hyg),可赋予对潮霉素的抗性[Santerre等人,1984,Gene 30(1984)147]。可使用其他可选择的标记物,如,但不限于组氨醇和Zeocin。
5.4.2表达系统和宿主细胞
为了应用发明的方法,宿主细胞和/或宿主生物体优选不表达牛乳头状瘤病毒E1蛋白。而且,优选发明的载体不表达牛乳头状瘤病毒E1蛋白。
优选地哺乳动物宿主细胞包括但不限于来自下列来源的细胞:人,猴和啮齿类动物(见,例如,Kriegler M.在“基因传递和表达:实验室手册”,New York,Freeman & Co.1990),如由SV40(COS-7,ATCC CRL1651)转化的猴肾细胞系;人胚胎肾细胞系(293,293-EBNA,或为悬浮培养生长亚克隆的293细胞,Graham等人,J.Gen.Virol.,36(1977)59;幼仓鼠肾细胞(BHK,ATCC CCL 10);中国仓鼠卵巢细胞-DHFR[CHO,Urlaub和Chasin。Proc.Natl.Acad.Sci.77(1980)4216];小鼠sertoli细胞[Mather,Biol.Reprod.23(1980)243-251];小鼠成纤维细胞(NIH-3T3),猴肾细胞(CVI ATCC CCL 70);非洲青猴肾细胞(VERO-76,ATCC CRL-1587);人子宫颈癌细胞(HELA,ATCC CCL 2);犬肾细胞(MDCK,ATCC CCL 34);buffalo大鼠肝细胞(BRL 3A,ATCC CRL1442);人肺细胞(W138,ATCC CCL 75);人肝细胞(Hep G2,HB 8065);和小鼠乳腺肿瘤细胞(MMT 060562,ATCC CCL51)。
发明的载体可被合成和从已知的DNA序列通过本领域熟知的技术组装而成。调控区和增强子元件可具有多种来源,天然的和合成的。一些宿主细胞可从商业渠道获得。
含有目的DNA序列的发明载体可通过本领域已知的技术被导入至宿主细胞中,包括但不限于,对于原核细胞,细菌转化(Hanahan,1985,DNA克隆,实践方法,1:109-136),对于真核细胞,磷酸钙介导的转染[Wigler等人,Cell 11(1977)223-232],脂质体介导的转染[Schaefer-Ridder等人,Science 215(1982)166-168],电穿孔[Wolff等人,Proc Natl Acad Sci 84(1987)3344],和微注射[Cappechi,Cell 22(1980)479-4889]。
在一个特殊的实施例中,表达发明DNA序列的细胞系可采用含有可选择标记物的载体来进行改造。通过实例而不是限制,在导入载体后,改造的细胞可在一种富集的培养基中生长1-2天,然后更换为选择性培养基。载体中的可选择标记物可赋予对选择作用的抗性,并最好仅允许含有具有可选择标记物的载体的细胞在培养中生长。
5.4.3疫苗方法
在某些实施例中,含有目的DNA序列的一个表达基因盒的发明载体给予一个受试者以诱导免疫反应。特殊地,目的DNA序列编码一种蛋白(例如,肽或多肽),可在其表达过程中诱导特异免疫反应。这种蛋白的实例在章节5.3中进行描述。
为了传递发明的载体作为疫苗,其方法可选自本领域已知的方法和/或在章节5.4.6中描述。
5.4.4基因治疗方法
在一个特殊的实施例中,含有目的DNA序列的表达基因盒的发明载体被给予以治疗或预防多种疾病。目的DNA序列编码一种蛋白和/或一种生物学活性的RNA分子。基因治疗是指通过给予受试者一种已表达的或可表达的DNA序列进行的治疗。在发明的这个实施例中,DNA序列产生它们编码的可介导治疗效应的蛋白或RNA分子。
根据本发明可使用本领域中用于基因治疗的任何方法。实例的方法在下面描述。
对于基因治疗方法的总体综述,见Goldspiel等人,ClinicalPharmacy 12(1993)488-505;Wu和Wu,Biotherapy 3(1991)87-95;Tolstoshev,Ann.Rev.Pharmacol.Toxicol.32(1993)573-596;Mulligan,Science 260(1993)926-932;Morgan和Anderson,Ann.Rev.Biochem.62(1993)191-217;May,TIBTECH 1,1(5)(1993)155-215。可使用的重组DNA技术领域中普遍已知的方法见Ausubel等人,(主编),分子生物学现代方法,John Wiley & Sons,NY(1993);和Kriegler,基因传递和表达,实验室手册,Stockton Press,NY(1990)中的描述。
具有组织特异性,并已经在转基因动物中使用的下列动物调控区可在特殊的组织类型中用来表达目的DNA序列:在胰腺腺泡细胞中有活性的弹性蛋白酶1基因控制区[Swift等人,Cell 38(1984)639-646;Ornitz等人,Cold Spring Harbor Symp.Quant.Biol.50(1986)399-409;MacDonald,Hepatology 7(1987)425-515];在胰腺β细胞中有活性的胰岛素基因控制区[Hanahan,Nature 315(1985)115-122],在淋巴细胞中有活性的免疫球蛋白基因控制区[Grosschedl等人,Cell 38(1984)647-658;Adames等人,Nature 318(1985)533-538;Alexander等人,Mol.Cell.Biol.7(1987)1436-1444],在睾丸,乳腺,淋巴和肥大细胞中有活性的小鼠乳腺肿瘤病毒控制区[Leder等人,Cell 45(1986)485-495],在肝脏中有活性的白蛋白基因控制区[Pinkert等人,Genes andDevel.1(1987)268-276],在肝脏中有活性的α-甲胎蛋白基因控制区[Krumlauf等人,Mol.Cell.Biol.5(1985)1639-1648;Hammer等人,Science 235(1987)53-58;在肝脏中有活性的α1-抗胰蛋白酶基因控制区[Kelsey等人,Genes and Devel.1(1987)161-171],在髓样细胞中有活性的β-球蛋白基因控制区[Mogram等人,Nature 315(1985)338-340;Kollias等人,Cell 46(1986)89-94];在脑中的少突胶质细胞中有活性的髓磷脂碱性蛋白基因控制区[Readhead等人,Cell 48(1987)703-712];在骨骼肌中有活性的肌球蛋白轻链-2基因控制区[Sani,Nature 314(1985)283-286],和在下丘脑中有活性的促性腺释放激素基因控制区[Mason等人,Science 234(1986)1372-1378]。
传递fro的基因治疗手术的方法在本领域中是熟知的和/或在章节5.4.6中描述。
5.4.5抑制性反义和核糖酶
在发明的某些实施例中,发明的载体含有编码反义或核糖酶RNA分子的目的DNA序列。产生和使用这种分子的技术是本领域中的专业技术人员所熟知的。
反义RNA分子通过与靶向的mRNA杂交和防止蛋白翻译来作用直接阻断mRNA翻译。反义方法涉及设计与靶基因mRNA互补的寡核苷酸。反义寡核苷酸将与互补的靶基因mRNA转录物结合并阻止翻译。尽管是优选的,但不需要绝对的互补性。
与RNA的一部分“互补的”序列,如在此所提到的,其含义是指具有足够互补性,能与至少RNA的非聚合A部分杂交形成稳定双链体的序列;因此在双链反义核酸的情况下,检测双链体DNA的单链或检测形成的三联体。杂交的能力将根据互补性的程度和反义核酸的长度而变化。通常,杂交的核酸越长,与RNA不匹配的碱基越多,可含有并仍然形成稳定的双链体(或三联体,在情况可能时)。本领域的专业技术人员可使用标准的方法确定错配的可耐受程度以确定杂交复合体的熔点。
反义核酸应该至少为6个核苷酸的长度,优选寡核苷酸的长度范围是从6至大约50个核苷酸。在特殊的方面,寡核苷酸至少为10个核苷酸,至少17个核苷酸,至少25个核苷酸或至少50个核苷酸。在发明的另一个实施例中,反义核酸为至少100,至少250,至少500,和至少1000个核苷酸的长度。
无论何种靶序列的选择,优选体外研究首先定量反义寡核苷酸抑制基因表达的能力。优选这些研究使用可区分反义核酸抑制和寡核苷酸的非特异性生物学效应的对照。也优选这些研究比较靶RNA或蛋白与内参照RNA或蛋白的水平。可选择地,期望使用反义DNA序列获得的结果与使用对照DNA序列获得的结果进行比较。优选对照DNA序列与被检测的寡核苷酸大致具有相同的长度,寡核苷酸的DNA序列与反义序列的差异仅需要阻止与靶序列的特异杂交。
当使用与靶基因编码区序列互补的反义DNA序列时,这些与转录的,未翻译区互补的序列是最优选的。
为了从发明的载体中表达生物学活性的RNA,如反义RNA分子,编码生物学活性的RNA分子的DNA序列可操作地连接于一个强的polIII或pol II启动子。在患者中使用这样一种构建物转染靶细胞将导致产生足够转录量的单链RNA,它们将与内源靶基因转录物形成互补碱基对,并因此阻止靶基因mRNA的翻译。例如,发明的载体可被导入,例如,被细胞摄取,并引导反义RNA的转录。这样的载体可通过本领域中的标准重组DNA技术方法来构建。编码反义RNA的序列的表达可通过任何本领域已知的启动子来作用于哺乳动物,优选人的细胞。这些启动子可以是诱导性的或结构性的。这些启动子包括但不限于:SV40早期启动子区[Bernoist和Chambon,Nature 290(1981)304-310],包含在罗斯肉瘤病毒的3个长末端重复区内的启动子[Yamamoto等人,Cell 22(1980)787-797],疱疹胸苷激酶启动子[Wagner等人,Proc.Natl.Acad.Sci.U.S.A.78(1981)1441-1445],金属硫蛋白基因的调控序列[Brinster等人,1982,Nature 296(1982)39-42]等。
在发明的某些实施例中,发明的载体含有编码核糖酶的一条DNA序列。设计用来催化切割靶基因mRNA转录物的核糖酶分子也可用来防止靶基因mRNA的翻译,和因此产生的靶基因产物的表达[见,如PCT国际申请WO90/11364,公开于1990年10月4日;Sarver等人,Science 247(1990)1222-1225]。
核糖酶是能够催化RNA特异断裂的酶性RNA分子。[综述见Rossi,Current Biology 4(1994)469-471]。核糖酶作用的机制涉及核糖酶分子与互补的靶RNA的序列特异性杂交,然后发生核苷酸内切的断裂。核糖酶分子的组合物必须包括与靶基因mRNA互补一条或多条序列,必须包括熟知的可引起mRNA断裂的催化序列。对于这条序列,见,如美国专利第5,093,246,它在此整体合并为参考文献。
当在位点特异识别序列上断裂mRNA的核糖酶被用来破坏靶基因mRNA时,优选使用锤头形核糖酶。锤头形核糖酶可在与靶mRNA形成互补碱基对的侧向区指示的位置断裂mRNA。唯一需要的是靶mRNA具有以下的两个碱基的序列:5′-UG-3′。锤头形核糖酶的构建和生产是本领域中为人熟知的,并更详细地描述在Myers,1995,分子生物学和生物技术:综合Desk Reference,VCH Publishers,New York,(见,特别是图4,833页)和在Haseloff & Gerlach,Nature,334 1988)585-591,在此整体加入合并为参考文献。
优选核糖酶被改造,以便断裂识别位点的位置靠近靶基因mRNA的5′末端,即增加效率,尽量减小非功能性mRNA转录物的细胞内累积。
本发明的核糖酶也包括RNA核糖核酸内切酶(此后称为″Cech-型核糖酶″)如嗜热四膜虫中天然存在的酶(也称为IVS,或L-19 IVS RNA)和已经由Thomas Cech及其合作者广泛描述的[Zaug等人,Science,224(1984)574-578;Zaug和Cech,Science,231(1986)470-475;Zaug等人,Nature,324(1986)429-433;已公开的世界专利申请第WO 88/04300由大学专利公司申请;Been & Cech,Cell,47(1986)207-216]。Cech-型核糖酶具有8个碱基对的活性位点,可与靶RNA序列杂交,然后发生靶RNA的断裂。发明包括那些Cech型核糖酶,可靶向存在于靶基因中的8个碱基对活性位点。
核糖酶的表达可在一个强结构性pol III或pol II启动子的控制下,这样转染的细胞将产生足够数量的核糖酶以破坏内源性靶基因信息和抑制翻译。因为核糖酶不象反义分子,它是催化性的,所以为了效率需要更低的细胞内浓度。
在一些例子中,其中在此描述的反义和/或核糖酶分子用来抑制突变体基因表达,可能技术有效地减少或抑制正常靶基因等位基因产生的mRNA的翻译,就出现了这样的可能性,其中存在的正常靶基因产物的浓度低于正常基因表现型所需的浓度。在这种情况下,为了保证维持实质上正常水平的靶基因活性,所以编码和表达抑制正常靶基因活性的多肽的核酸分子,可通过基因治疗方法被导入至细胞中,如在下面5.4.4章节所描述的那些,不包括那些无论使用反义,核糖酶,或三链螺旋处理都敏感的序列。可选择地,在靶基因编码细胞外蛋白的例子中,优选共同给予正常的靶基因蛋白以维持靶基因活性必需的水平。
给予核糖酶和反义RNA分子的方法在本领域中是熟知的和/或在章节5.4.6中描述。
5.4.6药物制剂及其应用方式
在一个优选的方面,发明的药剂包括发明的一种实质上纯化的载体(如,实质上不含有限制其效力或产生不需要的副作用的物质)。以发明的方法给予药剂的受试者优选是一种动物,包括但不限于以下的动物如奶牛,猪,马,鸡,猫,狗等,优选是一种哺乳动物,最优选的是人类。
在某些实施例中,发明的载体直接在体内应用,其中目的DNA序列被表达产生其编码产物。这可以通过任何本领域已知的大量方法来完成。可使用发明的载体以便核酸序列成为细胞内的。发明载体的给予可通过直接注射裸DNA;使用微粒轰击(如,基因枪;Biolistic,Dupont);用脂类或细胞表面受体或转染剂包被;包裹在微粒或微囊体中;与已知可进入细胞核的肽连接使用;与要进行受体介导的胞吞作用的配体连接使用[见,如Wu和Wu,J.Biol.Chem.262(1987)4429-4432](可用于特异地表达受体的靶细胞类型);等。在一个特殊的实施例中,化合物或组合物可被递送在一个囊泡中,特别是脂质体中[见Langer,Science249(1990)1527-1533;Treat等人,1989,脂质体在感染性疾病和癌症的治疗中,Lopez-Berestein和Fidler(主编),Liss,New York,353-365页;Lopez-Berestein,同上,317-327页]。
在某些实施例中,发明的载体用脂类或细胞表面受体或转染剂包被,或连接于已知可进入细胞核的同源框样肽[见,如Joliot等人,Proc.Natl.Acad.Sci.USA 88(1991)1864-1868],等。
在某些其他的实施例中,形成核酸-配体复合体,其中配体含有一个fusogenic病毒肽以破坏内涵体,使核酸避免溶酶体的降解。
还是在另一个实施例中,发明的载体通过靶向特异受体而在体内被靶向细胞的特异摄取和表达(见,如PCT申请WO92/06 180;WO92/22635;WO92/20316;WO93/14188,和WO93/20221)。
用于发明的方法包括但不限于,皮内,肌肉内,腹膜内,静脉内,皮下,鼻内,硬膜下,和口服途径。用于发明的方法进一步包括通过任何方便的途径给药,例如通过输注或快速注射,通过穿过上皮或粘膜皮肤连接的吸收(如,口腔粘膜,直肠和肠粘膜等)。在一个特殊的实施例中,需要将发明的载体通过注射,通过导管,通过栓剂,或通过植入体来应用,所述的植入体由多孔的,无孔的或凝胶材料组成,包括膜,如sialastic膜,或纤维。注意必须使用载体不吸收的材料。给药可以是全身性的或局部的。
在某些实施例中,发明的一种载体与其他的生物活性剂如化学治疗剂或增强免疫系统的药剂一起使用。
还是在另一个实施例中,用于发明的方法包括经一种可控释放系统的递送。在一个实施例中,可使用一种泵[见Langer,见前;Sefton,CRC Crit.Ref.Biomed.Eng.14(1989)201;Buch-wald等人,Surgery 88(1980)507;Saudek等人,N.Engl.J.Med.321(1989)574]。在另一个实施例中,可使用聚合材料[见可控释放的医学应用,1974,Langer和Wise(主编),CRC Pres.,Boca Raton,Florida;可控药物的生物利用度,药物产品设计和性能,1984,Smolen和Ball(主编),Wiley,New York;Ranger和Peppas,Macromol.Sci.Rev.Macromol.Chem.23(1983)61;也见Levy等人,Science 228(1985)190;During等人,Ann.Neurol.25(1989)351;Howard等人,J.Neurosurg.71(1989)105]。
其他可控释放系统的讨论见Langer的综述,Science 249(1990)1527-1533。
发明的药物组合物含有治疗有效量的发明载体和一种合适的药物运载体。在一个特殊的实施例中,术语“合适的药物运载体”的含义是由联邦或州政府的管理机构批准的或列于美国药典或其他广泛被药典公认可用于动物,更特别用于人的物质。术语“运载体”是指稀释剂,佐剂,赋形剂或给予治疗药物的运载体。这种合适的药物运载体可以是无菌液体,如水和油,包括石油,动物,植物或合成来源的油,如花生油,豆油,矿物油,麻油和类似物。当药物组合物静脉给药时,水是优选的运载体。盐水溶液和葡萄糖溶液和甘油溶液也可用作液体运载体,特别是作为可注射的溶液。合适的药物赋形剂包括淀粉,葡萄糖,乳糖,蔗糖,明胶,麦芽,大米,面粉,白垩,硅胶,硬脂酸钠,甘油单硬脂酸酯,滑石,氯化钠,干燥的脱脂奶,甘油,丙烯,乙二醇,水,乙醇和类似物。如果需要,组合物也含有最小量的湿润剂或乳化剂,或pH缓冲剂。这些组合物可采取溶液,悬液,乳剂,片剂,丸剂,胶囊,散剂,持续释放剂型的形式和类似物。组合物被制成为栓剂,含有传统的粘合剂,以及如三甘油三酯的运载体。口服剂型可含有标准的运载体如药物级的D-甘露醇,乳糖,淀粉,硬脂酸镁,糖精钠,纤维素,碳酸镁等。合适的药物运载体的实例描述在E.W.Martin的“雷明顿药物科学”。这些组合物将含有治疗有效量的发明核酸,优选以纯化的形式,与合适量的载体一起为患者提供给药的恰当形式。制剂剂型应该符合给药的方式。
在一个特殊的实施例中,发明的药物根据常规的步骤被制成为一种可适合静脉内给予人类的药物组合物。典型地,静脉给药的组合物是无菌等渗缓冲的水溶液。当需要时,发明的药物也包括一种溶解剂,和一种局部麻醉剂如利多卡因以缓解注射部位的疼痛。通常,各种成分可单独提供或以单位药剂的形式混合在一起,例如冻干的粉末或在密封容器中的无水浓缩物,如安瓿,或显示活性剂量的sachette。当发明的药剂通过输注给药时,它可用含有药物级水或盐水的输液瓶来配制。当发明的药物通过注射给药时,提供了一安瓿注射用水或盐水以便各种成分再给药前被混合在一起。
为含服给药,组合物可采取以常规方法制成的片剂或锭剂形式。
为吸入给药,根据本发明使用的化合物可方便地以喷雾剂形式从气溶胶包装或喷雾器中喷出而递送,使用合适的推进剂如二氯二氟甲烷、三氯氟甲烷、二氯四氟乙烷、二氧化碳或其他合适的气体。就加压气溶胶来说,可通过设置一个阀门来释放计量的剂量而确定用药单位。用在吸入器或吹入器中的例如明胶的胶囊和药筒可制成含有化合物和合适的粉末基质如乳糖或淀粉的混合粉末制剂。
在治疗或预防适应症疾病中会有效的发明载体的量,可通过标准的临床技术来确定。另外,可选择性的使用体外实验来帮助确定最佳的剂量范围。要在制剂中应用的准确剂量也依赖于给药的途径,适应症疾病的程度,并应该根据临床医生的判断和每个患者的情况而定。有效的剂量可从体外或动物模型检测系统得到的剂量反应曲线中推导出来。
本发明可能通过参考下列非限制性的实例而更好地被理解,它们被提供作为发明的范例。下面的实例是为了更充分地举例说明发明的优选实施例。但它们绝不能被解释为要限制本发明的广阔范围。
6.实例
6.1.实例1
载体super6和super6wt的克隆和表达特性分析
载体质粒super6(图1)和super6wt分别从前一代为基础的基因接种载体VI(图2)和VIwt制备。载体VI和VIwt主要是合成的细菌质粒,含有来自卡那霉素抗性标记物基因的一个转座子Tn903[Oka,A.等人,JMol Biol 147(1981)217-226]和需要在大肠杆菌细胞中繁殖的pMB1复制子的一种修饰形式[Yanisch-Perron,C.等人,Gene 33(1985)103-119]。载体VI和VIwt也含有与HSV1 TK引导序列和兔β-球蛋白基因序列组合在一起的巨细胞病毒极早期启动子,它们都来自质粒pCG[Tanaka,M.等人,60(1990)Cell 375-386]。后面的元件是从来自HIV-1菌株HAN2隔离群的nef编码序列中表达所需要的[Sauermann,U.,等人,AIDSResearch.Hum.Retrov.6(1990)813-823]。Nef表达载体携带成簇的十个高亲合性E2结合位点(来自质粒pUC1910BS,未公开),正好在CMV启动子上游。
母载体VI含有修饰的E2编码序列:E2铰链区(氨基酸192-311)被来自EB病毒EBNA1蛋白的四个甘氨酸-丙氨酸重复区置换[Baer,R.J.等人,Nature 310(1984)207-211]。由这条序列编码的蛋白命名为E2d192-311+4G。母载体VIwt含有具有点突变的1型牛乳头状瘤病毒野生型E2蛋白的一个表达基因盒,该点突变通过两个终止密码子被导入E3和E4 ORF中以消除这些开放阅读框(ORF)的编码能力。在载体中,E2编码序列被克隆在罗斯肉瘤病毒前病毒5′LTR[Long,E.O.等人,Hum.Immunol.31(1991)229-235]和牛生长激素聚腺苷酰区[Chesnut,J.D.,et al.,J Immunol Methods 193(1996)17-27]。
质粒载体super6和super6wt的构建是通过从各自的母载体VI和VIwt中删除除兔β-球蛋白基因的第二个内含子以外的所有nef基因下游的β-球蛋白序列。β-球蛋白序列(特别是外显子片段)显示与人β-球蛋白基因中的序列具有一些同源性,而内含子却缺少与人基因组序列任何明显的同源性。内含子使用具有一些错配的寡核苷酸通过PCR从质粒pCG中扩增[Tanaka,M.等人,Cell 60(1990)375-386]以修饰内含子的剪接供体和受体位点与共有的基序完全匹配。来自pHook的1型单纯疱疹病毒胸苷激酶基因聚腺苷酰区[Chesnut,J.D.等人,J ImmunolMethods 193(1996)17-27]然后被克隆紧靠内含子3’末端,因为在母载体中可使用兔β-球蛋白聚腺苷酰信号。
通过使用Nef和E2的单克隆抗体进行的Western印迹分析由质粒载体super6和super6wt表达的Nef和E2蛋白的表达特性,并与由VI和VIwt表达的Nef和E2蛋白的表达特性比较[Towbin等人,Proc NatlAcad Sci USA 76(1979)4350-4354]。首先,Jurkat细胞(一种人T细胞成淋巴细胞系)通过电穿孔使用1μg super6,super6WT或等克分子量的质粒VI,VIwt转染[Ustav等人,EMBO J 2(1991)449-457]。可使用等克分子量的载体II(图3)作为对照,它含有一个相同的Nef基因盒,但没有E2编码序列。运载体DNA可用作阴性对照。简言之,质粒和运载体DNA与细胞悬液在0.4cm电穿孔试管中被混合(BioRadLabo-ratories,Hercules,USA),然后使用具有电容扩充器(BioRadLaboratories,Hercules,USA)的基因脉冲仪IITM进行电脉冲(200V;1mF)。
转染后49小时,细胞用含有50mM Tris-HCl pH6.8;2%SDS,0.1%溴酚蓝,100mM二硫苏糖醇,和10%(v/v)甘油的标本缓冲液处理而被裂解。裂解物在10%或12.5%SDS-聚丙烯酰胺凝胶上泳动,随后转移至一张0.45μmPVDF硝化纤维膜(Millipore)上。膜首先用含有5%脱脂奶(无脂肪),50mM Tris-HCl pH7.5中0.1%Tween 20;150mM NaCl的阻断溶液阻断过夜,然后与稀释的单克隆抗Nef抗血清(1∶100)或抗E2抗血清(1∶1000)在阻断溶液中孵育1小时。在每个孵育步骤后,通过用TBS-0.1%Tween-20冲洗条带3次去除未结合蛋白。最初免疫球蛋白结合的检测是通过将条带与辣根过氧化物酶交联的抗鼠IgG(Labas,Estonia)进行孵育,然后采用一种化学发光检测系统来显色(AmershamPharmacia Biotech,United Kingdom)。
结果在图4中显示。Nef蛋白的表达在板A显示,E2蛋白的表达在板B上显示。箭头表示Nef和E2蛋白的正确分子大小。E2d192-311+4GA的表达水平非常低,因此在图4中显示的印迹中未见。
从质粒super6,super6wt,VI和VIwt表达的Nef的量(图4A中1-4道)是相当相似的(图4,板A,1至4道)。从质粒II(5道)中产生更少的蛋白。Nef蛋白的表达水平高于含有wtE2的载体(参照,1道与2道比较,3道和4道比较)。这是根据来自这些质粒的E2和E2d192-311+4GA蛋白的表达水平(图4,板B)。
6.2.实例2
在系列产物1和NNV中克隆和分析质粒的表达特性
为了增加大肠杆菌中载体super6和super6wt的拷贝数,在这些载体中进行了进一步修饰。Tn903卡那霉素抗性基因,pMB1复制子和十个E2结合位点通过HindIII/Nhe1消化被去除,然后用逆转录酶病毒载体pBabe Neo的HindIII/Nhe1片段置换[Morgenstern,J.P.和Land,H.,Nucteic Acids Research 18(1990)3587-3596]。这个片段含有修饰的pMB1复制子和Tn5卡那霉素抗性基因,可在细菌中对质粒进行不严格的高拷贝数复制。新的质粒分别命名为产物1(图5),产物1wt。重新将十个E2结合位点插回至产物1的CMV启动子上游的钝端Nhe1位点中不成功的结果是分别产生了新的载体NNV,仅有两个结合位点被整合进质粒中。
另外十个E2结合位点从质粒pUC1910BS中被插入至新的载体中,刚好在E2表达基因盒的下游。这些新的载体命名为NNV-1和NNV-2(图6A)。为了用wtE2置换E2d192-311+4GA(删除了E3和E4ORF),含有Bsp1201片段的E2d192-311+4GA编码序列被含有来自super6wt的类似Bsp1201片段的wtE2置换。产生的质粒分别命名为NNV-1wt和NNV-2wt(图6B)。NNV系列的载体中数字1或2标记了相对E2表达基因盒的10个E2结合位点区域的方向。
来自NNV质粒的Nef蛋白,即NNV-1,NNV-2,NNVwt和NNV-2wt的表达特性,在通过电穿孔在1ig质粒的浓度下转染Jurkat细胞后,进行分析,并通过Western印迹基本上与如实例1中所描述的与来自super6和super6wt的Nef蛋白的表达特性进行比较。用来转染的Super6和super6wt的量分别为0.95和1ig。结果在图7中显示。
NNV-1和NNV-2载体与质粒super6相似的可能性在图8的泳道1和2与泳道5的比较中是很明显的。这个结果同样适用于载体NNV-1wt,NNV-2wt和super6wt(泳道3和4与图7中泳道6比较)。根据以前的结果,表达wtE2的质粒较E2d192-311+4GA载体产生更多的Nef蛋白(在图7中泳道1和泳道3,泳道2与泳道4比较)。由此可见,并因为来自NNV-2wt的Nef表达稍高于NNV-1wt,载体NNV-2wt可选择进行进一步的检测。
6.3实例3
NNV-2wt的表达特性分析
为了分析NNV-2wt的表达特性,4种不同的细胞系即Jurkat(人T细胞淋巴母细胞)、P815(小鼠肥大细胞瘤细胞)、CHO(中国仓鼠卵巢细胞)系和RD(人胚胎横纹肌肉瘤细胞),通过电穿孔被转染,并分析它们Nef和E2的表达。为了显示由E2蛋白和E2寡聚化结合位点介导的转录激活和维持特性,缺少E2结合位点(图5)的产物1wt被用作对照。另外的对照质粒是质粒NNV-2wtFS,它与NNV-2wt的不同是在E2编码序列中有导入的移码,因此它不表达功能性E2蛋白。
每个细胞系基本上通过实例1中所述的电穿孔用不同量的载体DNA被转染。大约转染后2天和5天测定时间点。分析的结果在图8至10中显示。
Jurkat细胞用0.5μg或2μg NNV-2wt(图8中泳道1,2,8,和9),等量的质粒NNV-2wtFS(图8中泳道3,4,10,和11)和产物1wt(图8中泳道5,6,12,和13)或仅用运载体(图8中泳道7和14)转染。转染后44小时(泳道1-7)和114小时(泳道8-14)测定时间点:Nef和E2蛋白的表达基本上如实例1中所述的Western印迹来分析。
P815细胞用0.5μg或2μg NNV-2wt(图9中泳道1,2,8,和9),等量的质粒NNV-2wtFS(图9中泳道3,4,10,和11)和产物1wt(图9中泳道5,6,12,和13)或仅用运载体(图9中的泳道7和14)转染。转染后45小时(泳道1-7)和119小时(泳道8-14)测定时间点:Nef蛋白的表达基本上用实例1中所述的Western印迹来分析。转染后119小时使用抗E2抗体的印迹未显示,因为没有检测到特异的信号。通常,在这些细胞中与E2蛋白表达水平相关的Nef蛋白表达水平,证实了这样的事实,E2蛋白的功能是激活转录,辅助质粒在增殖的细胞中维持一段更长的时间。
CHO细胞用0.5μg或2μgNNV-2wt(图10中的泳道1,2,8和9)和等量的质粒NNV-2wtFS(图10中的泳道3,4,10,和11)和产物1wt(图10中的泳道5,6,12和13)或仅用运载体(图10中的泳道7和14)转染。转染后48小时(泳道1-7)和114小时(泳道8-14)测定时间点。Nef和E2蛋白的表达基本上如实例1中所述的Western印迹分析。
RD细胞用0.5μg或2μg NNV-2wt(图11中的泳道1,2,8和9)和等量的质粒NNV-2wtFS(图11中的泳道3,4,10和11)和产物1wt(图11中的泳道5,6,12和13)或仅用运载体(图11中的泳道7和14)转染。转染后39小时(泳道1-7)和110小时(泳道8-14)测定时间点。Nef的表达水平基本上如实例中所述的Western印迹来分析。
在所有四种细胞系中,在NNV-2wt较早的时间点(图8-11中的泳道1-7)和较晚的时间点(图8-11中的泳道8-14)测定的Nef蛋白表达水平高于对照质粒。从图8中泳道8和泳道10和12的比较,也从图8,9和10中的泳道9与泳道11和13的比较中很显然,NNV-2wt的优势在更晚的时间点上更为明显。
对于NNV-2wt载体,这些质粒的RNA表达模式也可采用Northern分析法来分析[Alwine,J.C,等人,Proc Natl Acad Sci USA 74(1977)5350-5354]。为此目的,Jurkat和CHO细胞用2μg NNV-2wt转染。为了转染P815细胞,使用10μg NNV-2wt。基本上如实例1中所述进行转染。转染后48小时,采用RNAeasy试剂盒(Qiagen)提取总RNA,含有21μg(P815),15μg(CHO)或10μg(Jurkat)RNA的标本在变性条件(含有20mM MOPS pH7.0;2mM NaOAc;1mM EDTA pH8.0;2.2M甲醛的1.3%琼脂糖凝胶)下通过电泳进行分析。电泳缓冲液含有除甲醛以外的相同成分。样品载入含有甲酰胺和甲醛的缓冲液中。电泳后,分离的RNA点样至HybondN+膜(Amersham Pharmacia Biotech,UnitedKingtom)上,与放射标记的nef编码序列,E2编码序列或整个载体探针杂交。用运载体转染的细胞的RNA作为对照。Northern印迹分析的结果在图12中显示。
结果表明,没有互补mRNA以外的其他RNA种类从载体中表达,因为与nef和E2特异杂交(图12中泳道1-12与泳道13-18相比)相比用整个载体探针检测没有其他的信号。
6.4实例4
分析NNV-2wt与有丝分裂染色体的附着
CHO细胞中NNV-2wt与有丝分裂染色体的附着通过原位杂交荧光(FISH)来分析[Tucker J.D.等人,见:J.E.Celis(主编),细胞生物学:实验室手册,2卷,450-458页。Academic Press,Inc.New York,NY.1994.]。
在用1μg NNV-2wt或用等摩尔量的对照质粒NNV-2wtFS和产物1wt(基本上如实例1中所述进行)通过电穿孔转染后36小时,培养物用秋水仙素(Gibco)处理以阻滞处于有丝分裂中期的细胞。简言之,细胞与加入至培养基中终浓度为0.1μg/ml的秋水仙素接触1-4小时以阻断细胞周期于有丝分裂期。被阻断的细胞通过胰蛋白酶处理后被回收,悬浮在0.075M KCl溶液中,在室温下孵育15分钟,固定在冰冷的甲醇冰醋酸(3∶1,体积/体积)中。为了进行原位杂交分析,分裂中期展开的染色体和分裂间期的核通过将细胞悬液滴落在湿载玻片上而被制备。从一个培养物中制备几个载玻片。
杂交探针通过缺口翻译产生,使用生物素-16-dUTP作为标记,质粒产物1wt作为模板。一个典型的缺口翻译反应混合物包含缺口翻译缓冲液,未标记的dNTP,生物素-16-dUTP,和大肠杆菌DNA聚合酶。
染色体制剂在70℃ 70%甲酰胺(pH7.0-7.3)中变性5分钟,然后立即在一系列漂洗中脱水(70%,80%,和96%冰冷的乙醇漂洗,每次3分钟),和风干。杂交混合物(18μl每个载玻片)由2×SSC中的50%甲酰胺(1×SSC为0.15M NaCl加0.015M枸橼酸钠),10%糖酐酯,150ng生物素标记质粒探针DNA和10μg鲱精运载体DNA组成。在70℃变性5分钟后,探针DNA用于每个载玻片上,固定在一个盖玻片下,37℃在湿盒中杂交过夜。45℃漂洗载玻片,3次更换2×SSC,nd 2×SSC含有0.1%IGEPAL CA-630(Sigma Chemical Co.)。在免疫荧光检测前,载玻片在PNM(含有5%脱脂奶粉和0.02%叠氮化钠的缓冲液[PN缓冲液(1升水中有25.2g Na2HPO4□7H2O,0.83g NaH2PO4·_□H2O和0.6ml IGEPAL CA-630])中预孵育5分钟。
之后,用异硫氰酸荧光素(FITC)结合的extravidin检测探针。信号用生物素标记的抗亲和素抗体和第二轮的extravidin-FITC处理来放大。在每个步骤之间,载玻片在含有0.05%IGEPAL CA-630的PN缓冲液中室温下漂洗2×5分钟。染色体用亚丙基复染,在p-苯二胺antifade封固剂中被封固。
载玻片用安装有合适滤镜装置的Olympus VANOX-S荧光显微镜下进行分析。
结果在表1中显示。
表1.NNV-2wt的染色体附着 培养物染色体上具有游离基因信号的分裂中期被分析的分裂中期 %0.5μg NNV-2wt 11 158 70.5μg NNV-2wtFS 0 100 00.48μg 产物1wt 0 100 0运载体 0 100 0
数据清晰表明E2蛋白及其结合位点是染色体附着所需的,因为仅NNV-2wt有而其他两种载体没有这种能力。
6.5实例5
细菌细胞增殖过程中NNV-2wt的稳定性
检测了在细菌细胞增殖过程中NNV-2wt的稳定性。质粒NNV-2wt与感受态大肠杆菌细胞DH5α菌株混合[如Inoue,H.等人,Gene 96(1990)23-28所述制备],在冰上孵育30分钟。随后,细胞悬液37℃热休克3分钟,紧接着在冰上迅速冷却。1毫升LB培养基加入至标本中,混合物在37℃孵育45分钟并猛烈振摇。最后,一部分细胞接种在含有LB培养基和50μg/ml卡那霉素的培养皿中。第二天,来自单个集落中的细胞被转移至含有相同培养基的新培养皿中。重复这个步骤直至已经生长了四代细菌,分析来自每代集落的质粒DNA。
每代的一个集落用来接种在含有50μg/ml的2ml LB培养基中,然后在37℃猛烈振摇孵育过夜。收获细胞,用典型地煮沸裂解从细胞中提取质粒DNA。[Sambrook,S.等人,分子克隆,实验室手册。第二版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,New York]。标本用限制性内切酶Xba1(Fermentas,Lithuania)消化,用琼脂糖凝胶电泳分析,育用来转化的原始DNA比较。结果在图13中显示。
如在图13中所见,载体在大肠杆菌细胞传代过程中是稳定的:与用来转化的DNA相比,没有观察到发生重排的集落(泳道9)。
6.6实例6
NNV-2wt在真核细胞中的稳定性
作为非复制的游离基因元件的质粒NNV-2wt的稳定性也在真核细胞中被分析。为此目的,CHO和Jurkat细胞用2μg NNV-2wt转染。细胞的总DNA在转染后24,72或96小时被提取。简言之,细胞在20mMTris-HCl pH8.0;10mM EDTA pH8.0;100mM NaCl;0.2%SDS中;在200μg/ml蛋白酶K(Fermentas,Lithuania)的存在下被裂解。下一步,标本依次用苯酚和氯仿提取,用乙醇沉淀。核酸重新悬浮在10mMTris-HCl pH8.0;1mM EDTA pH8.0;20μg/ml RNase A(Fermentas,Lithuania)中,在37℃孵育1小时。最后DNA用醋酸铵和乙醇再沉淀,用70%漂洗,重新悬浮在10mM Tris-HCl pH8.0;1mM EDTA pH8.0中。标本用不同的限制性内切酶消化:用在质粒上具有两个识别位点的Eco811(Fermentas,Lithuania),用不能切断NNV-2wt DNA的Hind111(Fermentas,Lithuania),和用仅能消化在大肠杆菌细胞中合成的DNA的Dpn1(New England Biolabs,USA)。限制性DNA在TAE琼脂糖电泳中被分离,使用一个载体特异的放射标记探针通过Southern印迹分析[Southern,E.M.J.Mol.Biol.98(1975)503-517]。结果在图14中图解。Eco811消化的片段大小(图14中的泳道1,2和7)分别和标记物泳道相比很明显,在测定中没有检测到载体的排列。在Hind III(图14中的泳道3,4和8)或Hind111/Dpn1(图14中的泳道5,6和9)消化的情况下,在不同于标记物泳道的位置上没有观察到信号,表明没有观察到整合和/或复制反应。
6.7实例7
在存在人乳头状瘤病毒复制因子的情况下分析NNV-2wt的复制
以前已经证明乳头状瘤病毒蛋白能够启动来自其他许多人和动物乳头状瘤病毒的含异种ori质粒的复制[Chiang,C.M.等人,Proc NatlAcad Sci USA 89(1992)5799-5803]。尽管NNV-2wt不含有完整的复制起始点,但检测到在1型人乳头状瘤病毒E1和E2蛋白的存在下复制是如何启动的。CHO细胞用1mg载体NNV-2wt,NNV-2wtFS或产物1单独或与4.5μg HPV-11 E1表达载体pMT/E1 HPV11或与相同量的pMT/E1 HPV11和4.5μg HPV-11 E2蛋白表达载体pMT/E2 HPV11一起转染,如图15上部所示。转染基本上如实例1中所述进行。E1和E2表达载体在以前被描述过(Chiang,C.M.等人,见前)。含有质粒HPV110RI的等摩尔量的HPV-11复制起始点用相同的表达载体转染作为一个阳性对照。
低分子量DNA通过改良的Hirt裂解在转染后67小时被提取[Ustav等人,EMBO J 2(1991)449-457]。简言之,用PBS漂洗的细胞在冰上以1∶2的比例向皿中加入碱性裂解液I(50mM葡萄糖;25mM Tris-HCl,pH8.0;10mM EDTA,pH8.0)和II(0.2M NaOH;1%SDS)裂解5分钟。裂解物用0.5体积溶液III(醋酸钾和醋酸的混合物,钾为3M,醋酸为5M)中和。离心后,上清液用异丙醇沉淀,重新悬浮和在55℃孵育在20mM Tris-HCl pH8.0;10mM EDTA pH8.0;100mM NaCl;0.2%SDS中;在200μg/ml蛋白酶K(Fermentas,Lithuania)的存在下。下一步,标本依次用苯酚和氯仿提取,然后用乙醇沉淀。核酸重新悬浮在10mMTris-HCl pH8.0;1mM EDTA pH8.0;20μg/ml RNase A(Fermentas,Lithuania)中,并在65℃孵育30分钟。标本用线性化核酸内切酶(对载体是Nde1(Fermentas,Lithuania);或对HPV110R1是Hind111(Fermentas,Lithuania))和Dpn1(New England Biolabs,USA)消化(断裂非复制的DNA),然后基本上如前面所述使用载体特异的放射标记探针进行Southern印迹分析。对于杂交的阳性对照,可使用线性化载体和HPV11OR1的合适标记物(图15中泳道标记为M)。如在图15中所示结果所见,在任何载体质粒的情况下未检测到复制信号。
6.8实例8
分析分裂细胞中E2及其结合位点依赖的载体隔离功能
如在前面已经描述的,反式的牛乳头状瘤病毒1型E2蛋白和其顺式的多结合位点都是必需的,足以进行游离基因基因元件的染色质附着。这种现象被认为在分裂细胞中病毒感染的过程中提供了分隔病毒基因组的机制[IIves,I.等人,J Virol.73(1999)4404-4412]。因为两种功能元件也包含在我们的载体系统中,本研究的目的是分析在分裂细胞群中维持转录活性载体元件的E2蛋白和寡聚化结合位点的重要性。
为此目的,载体NNV-2wt和superGwt的Nef编码序列被来自载体pd1 EGFP-N1(Clontech Laborato-ries)的绿荧光蛋白(d1 EGFP)的不稳定形式的编码序列置换。因为这种蛋白的半衰期很短,只有1小时,它不能在细胞中积累,通过流式细胞仪检测到的d1 EGFP表达与这些细胞中存在的转录活性载体有关。
从NNV-2wt中nef编码序列被去除,来自pd1EGF-N1的Sma1-Not1片段被插入而替代它。新的载体命名为2wtd1EGFP(图16)。相似的置换发生在super6wt中,分别产生gf1Obse2(图17)。限制性核酸内切酶Spe1的识别序列被导入至正好在十个E2BS上游的super6wt中的EcoRI位点中。载体gf1 Obse2来自这个载体中,通过将含有Nde1-Bst11071片段的Nef编码序列置换为含有来自2wtd1EGFP的片段的d1 EGFP编码序列,用相同的酶切断。
也制备缺乏功能性E2编码序列或其结合位点的阴性对照质粒。在2wtd1 EGFP中通过将含有Bsp1201-Bsp1201的E2编码序列用来自质粒NNV-2wtFS的相似片段置换,移码被导入进E2编码序列中。得到的载体命名为2wtd1EGFPFS(图18)。为了构建对照质粒NNVd1 EGFP(图19),来自2wtd1 EGFP的整个E2表达盒(以及细菌复制子)通过Bst1107和Nhe1的消化被去除。复制子从质粒产物1中作为HindIII(填入)-Nhe1片段被再构建。
Jurkat细胞如实例1所述通过电穿孔用1μg载体2wtd1EGFP或等克分子量的质粒2wtd1EGFPFS,NNVd1EGFP,gf1Obse2或仅用运载体DNA转染。在转染后不同的时间点,等分的细胞悬液被收集来分析,此后标本用新鲜的培养基稀释。在每个时间点,细胞的总数以及d1EGFP表达细胞的数量通过流式细胞(Becton-Dickinson FACSCaliburSystem)来计数。根据这些数据,使用仅用运载体转染细胞作为背景荧光的阴性对照,计算d1EGFP表达细胞的百分比,标本中细胞总数和d1EGFP表达细胞数目的变化。计算细胞数目要考虑所进行的稀释。最后,根据细胞计数仪关于流速波动的技术资料来计算误差值。
进行两个独立的试验。首先,在转染后第8天分析从质粒2wtd1EGFP,2wtd1EGFPFS和NNVd1EGFP表达的d1EGFP的维持性。在第二个试验中,在转染后第13天分析来自质粒2wtd1EGFP,2wtd1EGFPFS和gf1Obse2表达的d1EGFP的维持性。
如在图20和21中很明显地,用任何载体或仅用运载体转染的细胞的生长速度没有差异。这意味着d1EGFP表达维持性的差异并不是由被转染载体本身对细胞分裂的影响所引起的。也在检测过程中,检测到细胞的对数生长,除了直至图20中显示实验中第二个时间点的时间周期以外。生长的这个滞后时间可能是由于细胞的电穿孔休克引起的,因为第一个时间点是在转染后已经19小时采样的。
如在图22和23中所图解的,表达绿荧光蛋白的百分比在用每种质粒转染的所有细胞群中均减少,因为载体在细胞中不能复制。但在图表中可见,如果与2wtd1EGFP或gf10bse2相比,在对照载体中阳性细胞的部分下降更迅速。如果互相比较,gf10bse2明显优于2wtd1EGFP(图23)。在对照质粒2wtFSd1EGFP和NNVd1EGFP之间的维持性也具有显著的差异(图22)。
如果数据表示为细胞群中d1EGFP表达细胞数目的变化,载体的这些差异更为明显(图24和25)。在检测过程中对照质粒阳性细胞的数目没有明显地改变。相比,使用2wtd1EGFP时,表达d1EGFP细胞的数目在转染后第一周内增加,比对照标本大约高5至10倍(图24)。在此时间点后,数目开始降低(图25)。使用gf10bse2载体时维持性的差异是最强地。在分析的时间内阳性细胞的数目持续增加。两周后它较2wtd1 EGFP转染的标本高6倍,较移码突变体转染的细胞群高45倍(图25)。
数据清晰的表明本发明的载体系统具有一种以核锚着蛋白为基础的隔离的活性机制,即可促进其在增殖的细胞群中维持的牛乳头状瘤病毒1型E2蛋白及其结合位点作为一个转录活性元件。
6.9实例9
克隆AIRE基因进入SUPER6WT并在上皮细胞系中表达
编码AIRE(AIRE=自体免疫调节剂)蛋白的AIRE基因在常染色体遗传综合征APECED(自体免疫性多内分泌腺疾病念珠菌病外胚层营养障碍)中是被突变的。AIRE表达在胸腺髓质的少量上皮细胞中,和外周血和外周淋巴器官的树突状细胞中。因此APECED的治疗可通过将未突变的AIRE基因体外转移至外周血树突状细胞中,然后将纠正的树突状细胞回输给患者。为了检测这种可能性,人AIRE基因和同源鼠AIRE基因转移至COS-1细胞。
为了将AIRE基因克隆进Super6wt中,制备载体的maxi-制剂。首先根据生产厂商的方案Super6wt的转染在TOP10细胞(Invitrogen的化学感受态大肠杆菌)中完成。简言之,细胞在冰上孵育30分钟,之后在+42℃的水浴中30秒进行热休克。然后细胞直接转移至冰上2分钟,在250μl SOC培养基(2%胰蛋白胨,0.5%酵母提取物,10mM NaCl,2.5mM KCl,10mM MgCl2,10mM MgSO4,20mM葡萄糖)中生长,+37℃振摇1小时。
平板接种在LB板上完成,使用卡那霉素(50μg/ml)选择。对于maxiprep,集落转移至含有卡那霉素(50μg/ml)的150ml LB溶液中,+37℃生长过夜并振摇。Maxiprep制剂使用Qiagen′s质粒Maxi试剂盒根据生产厂商的方案来完成。
BamHI和Sa11制性酶的消化用来检查载体。反应混合物在10μl的总体积中含有500ng Super6w,5U BamHI,5U Sa11,2μl 2XTANGO缓冲液(限制性酶和缓冲液均来自Fermentas)和无菌水。消化在+37℃进行1小时。
被消化的载体用1X TAE缓冲液中的1μg/ml溴乙啡啶在1%琼脂糖凝胶上检查。
为了将PCR扩增的AIRE基因和Aire基因片段克隆进Super6wt中,4μg Super6wt用10U Not1限制性酶(MB1 Fermentas,在2μl酶缓冲液中,加入无菌水至终体积20μl)消化。消化在+37℃进行1.5小时,之后1U ZIP酶(碱性磷酸酶)加入至反应混合物中继续孵育30分钟。完成ZIP酶的处理通过防止载体自我连接,复原为环状形式,从而加速AIRE基因向载体中的插入作用。消化后载体用GFXTM PCR DNA和凝胶条带纯化试剂盒(Amersham Pharmacia Biotech)纯化,并溶解为0.2微克/微升的浓度。
人和鼠AIRE基因PCR产物也用Not1限制性酶消化。26μl PCR产物,3μl合适的酶缓冲液和10U Not1限制性酶(缓冲液和酶来自MB1Fermentas)用于消化。消化在+37℃进行2小时,之后消化的PCR产物被纯化,溶解在无菌水中至10μl的体积。
PCR扩增和消化的人和鼠AIRE基因通过T4 DNA连接酶(MBIFermentas)连接于Super6wt。取出消化的插入DNA(总体积为10μl),加入1.5μl连接酶缓冲液(MBI Fermentas),5U T4 DNA连接酶和无菌水至终体积15μl。连接反应在+17℃反应过夜。
连接反应后,取出10μl连接反应混合物根据生产厂商的方案转染进TOP10细胞中。细胞在冰上孵育30分钟,之后在+42℃水浴30秒进行热休克。然后细胞直接转移至冰上2分钟,生长在250μl SOC培养基(2%胰蛋白胨,0.5%酵母提取物,10mM NaCl,2.5mM KCl,10mM MgCl2,10mM MgSO4,20mM葡萄糖)中,+37℃振摇1小时。
转染的细菌细胞被接种至LB卡那霉素平板中,第二天挑选集落至2ml含有卡那霉素的LB培养基(1%胰蛋白胨,0.5%酵母提取物,170mM NaCl)中,+37℃生长过夜。
来自选择集落的Miniprep DNA制剂用Qiagen′s质粒Mini试剂盒纯化,溶解在50μl体积的无菌水中。插入物的存在和大小用Not1和BamHI消化来检查。取出10μl miniprep DNA来消化,加入5U Not1和5UBamHI酶,2ml R+酶缓冲液和无菌水至终体积20μl。消化在+37℃进行1小时。
插入的方向用BamHI限制性酶来分析。取出10μl minprep DNA,加入5U BamH1,2μl BamHI缓冲液(MBI Fermentas)和无菌水至终体积20μl。消化在+37℃进行1小时,产物用1XTAE中的EtBr在1%琼脂糖凝胶上检查。
根据这些结果,含有鼠AIRE基因的质粒和含有人AIRE基因的质粒被挑选出来,制备maxipreps。简言之,含有目的质粒的0.5ml大肠杆菌细胞悬液或miniprep培养物加入至含有卡那霉素(50μg/ml)的150ml LB培养基中,在+37℃生长过夜。Maxiprep DNA采用Qiagen’s质粒Maxi试剂盒制备。
含有鼠AIRE基因的质粒被指定为pS6wtmAIRE,含有人AIRE基因的质粒指定为pS6wthAIRE。
产生的载体从两个末端测序大约500bp以确认插入物的法向和正确性。测序采用双脱氧法用PE Biosystem′s Big Dye Terminator RR-mix进行,它含有用不同荧光标记物标记的四个不同的连接双脱氧核苷酸三磷酸盐。
含有AIRE基因和AIRE基因片段的质粒被插入至选择的细胞系中,转染后用Western印迹来检查蛋白的表达。
Cos-1细胞用胰蛋白酶-EDTA(Bio Whittaker Europe)溶液收获,以10×106细胞/ml悬浮在Dulbecco′s MEM(LifeTechnotogies)培养基中,取出250μl细胞悬液进行转染。Cos-1细胞的转染采用电穿孔使用2.5×106细胞,50μg鲑精DNA作为运载体和5μg合适的载体来进行。转染用pS6wthAIRE,pS6wtmAIRE,Super6wt,pCAIRE,psiAIRE和pCAIRES1-4来进行。pCAIRE和psiAIRE是阳性的人AIRE对照,pCAIRE S1-4是阳性的鼠AIRE对照,Super6wt是阴性对照。
电穿孔采用Biorad′s基因脉冲仪使用电容960μFd,240V和1次脉冲来完成。脉冲后,细胞在室温下保留10分钟,加入400μl培养基。细胞转移至5ml培养基中,在1000rpm离心5分钟。细胞被平板接种,在+37℃,5%CO2生长3天。
细胞用胰蛋白酶-EDTA收获并离心。然后细胞用500ml 1XPBS(0.14mM NaCl,2.7mM KCl,7.9μM Na2HPO4,1.5μM KH2PO4)冲洗一次。加入50μl PBS和100μl SDS加样缓冲液(5%巯基乙醇,16μM溴酚蓝,20μM二甲苯蓝,1.6μM Fi-coll 400),细胞在+95℃加热10分钟。
为了进行western印迹分析,在SDS电泳缓冲液(25mM Tris,250mM glysin,0.1%SDS)中用10%分离和5%成层胶制备SDS-PAGE。细胞标本和生物素化分子量标记物加样在胶上,在150V进行电泳1小时50分钟。用转移缓冲液中的冷却器,100V室温下1.5小时,将蛋白转移到硝化纤维膜上。
膜在5%奶的TBS(0.05M Tris-Cl,0.15M NaCl,pH7.5)液中室温阻断30分钟。一抗混合物,以1∶100的稀释度在5%奶的TBS液中的抗AIRE6.1(人)和抗AIRE8.1(鼠)抗体加至膜上,在+4℃孵育过夜。膜用0.1%Tween的TBS液5分钟冲洗两次,一次用TBS冲洗5分钟。二抗,以1∶500的稀释度在5%奶的TBS液中的生物素化抗鼠IgG室温孵育1小时。冲洗膜,加入以1∶1000的稀释度在5%奶的TBS液中的辣根过氧化物酶亲和素D。膜在室温下孵育1小时,并冲洗。过氧化物酶的底物用5ml氯萘酚,20ml TBS和10μl过氧化氢来制备,并加至膜上。显色后用TBS冲洗膜并干燥。
人AIRE的检测抗体(抗anti-AIRE6.1)在用pS6wthAIRE,pCAIRE和psiAIRE转染的标本中检测到AIRE蛋白的表达。鼠AIRE检测抗体在用pS6wtmAIRE和pCA1RE S1-4转染的细胞中同样也检测到鼠AIRE。阴性对照(Super6wt)显示没有AIRE/aire蛋白。
6.10实例10:在用NNV-NEF构建物免疫的小鼠中检测对HIV.1NEF的细胞和体液免疫反应
DNA免疫法
为了研究发明载体体液免疫的诱导作用,使用5-8周龄的雄性和雌性BALB/c(H-2d)小鼠。为了进行DNA免疫,小鼠用1.2mg戊巴比妥(腹腔内注射),使用DNA包被的金颗粒在剃毛的腹部皮肤上接种DNA。用Helios基因枪(Bio-Rad)采用300psi的压力进行接种。金颗粒直径为1μm,~1μg DNA/盒。小鼠用0,4或8μg/鼠的DNA总量免疫小鼠两次(在0天和第7天)。对照小鼠用没有nef基因,即NNV-δnef的8μg普通载体免疫。
最后一次免疫后两周从小鼠的尾部获取血标本。在最后一次免疫后4周处死小鼠,血标本(100μl)收集至含有10μl 0.5M blotting(++vs.+)的Eppendorf管中,在ELISA(更高的OD)中,较多更高剂量的小鼠超过EDTA截止点。从这些每只鼠的标本中计算血白细胞的绝对数/ml。收集血清进行抗体测定,储存在-20℃。无菌条件下去除脾脏,称重,然后混匀为单细胞悬液,用于T,B和NK细胞测定和染色。
检测发明载体的体液免疫原性
为了通过Western印迹检测Nef特异抗体,用发明的载体构建物免疫的小鼠的血清标本以1∶100稀释在5%奶的TBS液中,用于重组HIV-1 Nef蛋白制备的硝化纤维条上。为了制备硝化纤维条,纯化的重组蛋白在含有1%SDS和1%2-巯基乙醇的标本缓冲液中煮沸,然后在10或12.5%聚丙烯酰胺凝胶上电泳,随后转移至0.45μm硝化纤维纸上。条带首先用2%BSA在5%脱脂奶-TBS中被阻断,然后用稀释的血清(1∶100)孵育过夜。孵育后,未结合的蛋白通过用TBS-0.05%Tween-20冲洗条带3次,用水冲洗两次而去除。冲洗后,条带用1∶500稀释的生物素化抗鼠IgG(Vector Laboratories,USA)探测2小时。进一步冲洗后,加入1∶1000稀释的辣根过氧化物酶-亲和素(VectorLaboratories,USA)1小时,再次冲洗条带,用过氧化氢酶底物4-氯-1-萘酚(Sigma,USA)检测结合的抗体。
血清也在ELISA中检测以确定由每种构建物诱导的准确的抗体效价。Nef抗体ELISA如以前所述(Thtinen等人,2001)进行。简言之,Nunc Maxi Sorp平板用50ng Nef(isolate HAN)包被,用磷酸盐缓冲盐水(PBS)中的2%BSA阻断,1∶100至1∶25000稀释度的血清加入至相似的孔中,孵育过夜。大量冲洗后,加入二抗,过氧化物酶结合的抗鼠IgG或IgM(DAKO),平板孵育2小时,然后冲洗。磷酸盐-柠檬酸盐缓冲液中底物(2,2′-连氮基-双(3-乙基苯噻唑啉-6-磺酸,ABTS,Sigma)产生的颜色强度使用Labsys-tems Multiscan Plus ELISA-平板读数器在405nm测定。阳性抗体反应的光学密度截止值如下测定:
截止值=OD(x1 对照鼠血清)+3 SD.
检测发明载体细胞免疫原性
为了分析发明载体诱导细胞免疫的能力,进行T细胞和B细胞检测乙基细胞表面的染色。
T细胞增殖测定。脾细胞被悬浮在终浓度1×106/ml添加了10%FCS(GibcoBRL),1%青霉素-链霉素(GibcoBRL)和50μM β-巯基乙醇(Sigma)的RPMI-1640(GibcoBRL)中。细胞孵育在微量滴定板中,200μl/孔仅加入培养基或不同的刺激物。刺激物的终浓度为:刀豆凝集素A5μg/ml,HIV-Nef-蛋白,浓度为1和10μg/ml,和阴性对照抗原HIV-gag浓度为1和10μg/ml。所有反应进行四次。在孵育的第六天,每孔收集100μl上清液,储存在-80℃进行细胞因子测定。在收获前6小时,向每孔中加入1μCi3H-胸苷(Amersham Pharmacia Biotech)。收获细胞,在闪烁扫描计数器中测定掺入的放射活性(cpm)。如下计算刺激指数(S1):
S1=平均测定cpm/平均培养基cpm.
淋巴细胞活化。T和B细胞活化用抗CD3-FITC加抗CD69-PE(早期活化标记物)和抗CD19-FITC加抗CD69-PE抗体(所有来自Pharmingen)通过新鲜脾细胞的双重表面染色而检测。染色用流式细胞仪(FACScan,Becton Dickinson)分析。
CTL测定。鼠脾细胞与固定的抗原递呈细胞(用MVA-HIV-nef或对照MVA-F6感染的P-815细胞)共培养5天,之后在标准的4小时51铬释放试验中测定[Hiserodt,J.等人,J Immunol 135(1995)53-59;Lagranderie,M.等人,J Vi-rol 71(1997)2303-2309)MVA-HIV-nef感染的或对照靶细胞。在CTL测定中特异性溶解10%或更多被认为是阳性的。
细胞因子测定。为了分析是否小鼠发生了Th1型或Th2反应,从抗原刺激的细胞培养上清液中测定IFN-γ和IL-10。如上所述从抗原刺激的细胞中收集上清液。原炎性细胞因子TNF-α和IL-10在免疫的小鼠血清中被测定。用市售的ELISA试剂盒(Quantikine,R&D Systems)测定所有的细胞因子。
自发的增殖。自发的脾细胞增殖通过在培养基中培养的细胞对3H-胸苷的摄取仅测定6天。
抗双链(ds)DNA抗体。在免疫小鼠,阳性对照小鼠(mrl/lpr,Dr.GeneShearer惠赠,NIH,USA)和正常小鼠的血清中测定dsDNA抗体。抗体在多聚L-赖氨酸结合的λ噬菌体dsDNA上用ELISA检测。结果在表2和3中显示。
表2显示了用HIV-Nef质粒DNA免疫的小鼠的全部免疫学结果。尽管用来体外T细胞刺激的HIV-1 Nef重组蛋白可在每个免疫组中诱导细胞的一些非HIV-特异性增殖。在用0.4μg质粒(均数SI=72.2)免疫小鼠的均数SI与其他相比明显增加。而且,阴性对照蛋白HIV-gag不能诱导任何T细胞反应。仅有在具有nef特异性增殖的组中小鼠的T细胞也产生nef特异性的IFN-γ。没有免疫的小鼠有产生IL-10的细胞,显示在免疫小鼠中的T细胞反应是Th1型,不是Th2型。与T细胞反应相比,用较高浓度nef质粒DNA(8μg)免疫的小鼠与用0.4μg免疫的小鼠相比具有较强的B细胞反应:用更高剂量免疫的小鼠中的体液反应在最后一次免疫后3周已经可以检测到,但两者在Western印迹中检测到的反应都较强。检测到的抗体属于IgG类型,未检测到IgM反应。没有小鼠产生E2特异抗体。
用0.4μg HIV-nef质粒DNA免疫的小鼠与其它组的免疫小鼠和正常小鼠(3.8×106/ml)相比外周血中白细胞的数目是增加的(6.38×106/ml)(表3)。与其它小鼠(9%和10%)相比,同样的小鼠具有两倍的活化T细胞(21%,CD3+CD69+)。这种结果与对HIV-Nef的阳性T细胞反应有关系(表2),因为具有对Nef有阳性T细胞反应的小鼠在其脾脏中活化T细胞的数目也是增加的。表3的结果也显示与阳性对照血清(OD=1,208)相比没有免疫小鼠形成抗dsDNA抗体,表明免疫没有副作用。
表2
小鼠 HIV-1 HIV-1 IFN-g IL-10 HIV-1 E2
nef gag nef
SI* SI Th1 Th2 Ab Ab
NNV-Nef8
1 6 1 - - ++ -
2 8 1 - - ++ -
3 13 2 - - ++ -
4 15 1 - - ++ -
5 7 1 - - ++ -
均数 9.8 1.2
NNV-NEF0.4
1 24 1 + - + -
2 112 1 + - + -
3 83 1 + - + -
4 73 1 + - + -
5 69 1 + - +
均数 72.2 1
NNV-ΔNef8
1 6 1 - - - -
2 nt nt - - - -
3 11 1 - - - -
4 23 2 - - - -
5 12 1 - - - -
均数 13 1.25
*SI=刺激指数 nt=未检测
到
-′,阴性
+′,阳性
+′+′,强阳性
表3
Mice WBC CD3 CD3+CD69+ CD19 CD19+CD69+ 抗dsDNA
% % % % 抗体
×106/ml 脾 脾 脾 脾 OD(1∶10稀释度)
NM
1 0.355
2 0.255
3 0.231
均数 0.280
NNV-Nef8
1 5 nt nt nt nt 0.387
2 4.3 50 4 11 3 0.457
3 4.9 57 4 15 4 0.514
4 4.3 55 6 15 4 0.367
5 5.1 54 5 7 0 0.478
均数 4.72 54 4.75(9%) 12 2.75 0.441
NNV-Nef0.4
1 3.9 nt nt nt nt 0.418
2 8 41 9 18 5 0.263
3 7.5 39 8 25 9 0.375
4 5 46 9 16 6 0.285
5 7.5 43 10 13 7 0.396
均数 6.38 42.25 9(21%) 18 6.75 0.347
NNV-ΔNef8
1 4.5 61 4 9 2 0.413
2 4.6 59 4 15 1 0.353
3 3.8 50 6 17 5 0.382
4 3.1 46 7 25 8 0.448
5 3.5 nt nt nt nt 0.501
均数 3.9 54 5.25(10%) 16.5 4 0.419
正常小鼠的平均WBC=3.8×106/ml.
nt,未检测到
a-dsDNA阳性对照血清OD为1.208
(1∶10稀释度)
6.11.实例11:在HIV感染患者中原型HIV疫苗GTU-NEF的安全性和免疫原性
NNV-2-Nef疫苗的生产(检查是否使用NNV-2或NNVwt-2)
以生产许可号第LLDnro 756/30/2000(由Finnish National Agencyfor Medicines在21.12.2000公布)根据实例2制备研究性疫苗NNV-2-Nef。
生产过程完全符合现行药品优良制造规范(cGMP)的要求,提供了适合用于临床I期和II期研究的质粒DNA制剂。生产过程包括四个步骤:
a)建立母细胞库和工程细胞库
b)发酵
c)纯化
d)无菌充填疫苗
详细来说,NNV-2-Nef从大肠杆菌细菌中产生。根据特殊标准操作规范从纯培养和发布的研究细胞库中建立含有大肠杆菌DH5αT1噬菌体抵抗细胞株的母细胞库(MCBs)和工程细胞库(WCBs)。
a)建立母细胞库和工程细胞库
建立细胞库系统的示意步骤如下被图解说明:
复苏一瓶用NNV-2-Nef质粒转化的研究细胞库[大肠杆菌DH5αT1噬菌体抵抗细胞株(Gibco RBL)。
接种培养物在限制性Luria Bertani培养基-平板(含有25μg/ml卡那霉素)中
37℃孵育过夜(14-16h)。
从平板中选择单个集落,接种至50ml限制性Luria Bertani培养基(含有25μg/ml卡那霉素)中
37℃孵育过夜(14-16h)
测量细菌培养物的光密度(OD600=2.0-6.0)
向细菌培养物中添加甘油
将培养物-甘油混合物分成等分
标记和储存母细胞库
在相同的图表之后,使用一瓶母细胞库作为起始物质建立工程细胞库。对MCB和WCB进行的常规检测为:微生物特性,没有污染,通过影印培养法评价质粒的稳定性和质粒的特性(限制性酶消化和测序)。
b)发酵。在发酵中,用NNV-2-Nef(WCB)转化的DH5αT1噬菌体抵抗大肠杆菌株(Gibco RBL,UK)首先培养在平板上。在发酵反应器中实际发酵前,从平板中单个集落接种在100ml液体预培养中。在5L发酵罐(B.Braun Medical)中以批次进料系统为基础进行发酵,之后收获细胞。1升培养基组合物含有7g酵母提取物,8g来自大豆粉的蛋白胨,10g NaCl,800ml注射用水(WFI),1N NaOH,pH7.0,卡那霉素50mg/ml(Sigma),硅除泡剂(Merck),1M K2PO4(Bio Whittaker)。
在发酵运转的开始,通过采样管获取1ml标本,测定最初的细胞密度(OD600)。预培养用来接种发酵培养基。在发酵过程中,新鲜的培养基和1M钾磷酸盐缓冲液,pH6.5-7.3,被用泵加料进反应器中。培养基的添加可在被消耗前补充基本营养素,磷酸盐缓冲液可维持pH含量。当发酵过程持续大约5小时,在发酵作用结束(大约发酵10小时后)时,如上取出1ml标本,测定细胞密度。发酵后,培养基被离心(10,000rpm,30分钟,+4℃),细菌团块(50-60g)被回收。
c)纯化。用于纯化DNA的方法学根据QIAGEN加工规模技术(Qiagen质粒纯化手册11/98)。NN2-Nef采用下列的步骤纯化:
将细菌团块再悬浮在重悬浮缓冲液(100-150ml,RT)中
用裂解缓冲液(100-150ml,5分钟,RT)裂解
用中和缓冲液(100-150ml,+4℃)中和
孵育(30分钟,+4℃)
离心(10,000rpm,30分钟,+4℃)
过滤上清液(0.22微米)
用内毒素清除缓冲液(60-90ml)去掉内毒素
用平衡缓冲液(350ml,流速10ml/min)平衡超纯柱
将裂解物装填至柱上(流速4-6ml/min)
用冲洗缓冲液冲洗柱(3L,过夜,流速4-6ml/min)
用洗脱缓冲液洗脱质粒DNA(400ml,流速3.1ml/min)
过滤洗脱液(0.22微米)
用异丙醇沉淀DNA
离心(20000g,30分钟,4℃)
纯化的质粒DNA
用在纯化中的缓冲液如下。再悬浮缓冲液含有50mM Tris-Cl,pH8.0,加RNase A(50mg);裂解缓冲液为200mM NaOH;中和缓冲液为3M醋酸钾,pH5.5;内毒素清除缓冲液含有750mM NaCl,10%Triton X-100;50mM MOPS,pH7.0;平衡缓冲液含有750mM NaCl,50mM MOPS,pH7.0;冲洗缓冲液含有1M NaCl,50mM MOPS,pH7.0,15%异丙醇;和洗脱缓冲液含有1.6M NaCl,50mM MOPS,pH7.0,15%异丙醇。
d)无菌充填
代表终料的纯化DNA溶解在0.9%无菌生理盐水中,终浓度为1mg/ml,当天无菌过滤(0.22微米)。纯化的料是人工充填(充填体积0.5ml)于使用蒸汽灭菌Finnpipette和无菌无内毒素管口的Schott 1+型玻璃瓶中。充填NN2-Nef疫苗的瓶子立即被封闭,标记,根据特殊标准操作规范(SOP)包装。
2.给予患者检测的疫苗
接受高活性抗逆转录酶病毒治疗(HAART)的十个HIV-1感染患者用表达HIV-1Nef基因(Clade B)的试验性DNA疫苗NN2-Nef免疫。为了免疫,隔两周给予臀肌两次肌内注射。剂量为1和20微克/次注射。血标本在-4,0,1,2,4,8和12周采集。分析标本的体液(ELISA,Western印迹)和细胞介导的免疫反应(T细胞亚群,T细胞增殖,ELISPOT,细胞因子表达,细胞内细胞因子)。
对参与研究的每个患者进行临床检查。临床检查包括患者问诊(既往史)和测量体重。心肺功能通过听诊和叩诊来检查,记录血压和心率。淋巴结,肝和甲状腺的增大通过触诊确定。
对每个访诊者进行评价疫苗安全性的实验室检查。这些检查包括:
血液学:计算红血细胞计数,血红蛋白,白细胞总数和分类,血小板计数,凝血酶原时间和位于基线水平的活化的部分凝血酶原激酶时间;平均红细胞体积和血红蛋白含量。
免疫学:核和ds-DNA抗体。
血清化学:总胆红素,碱性磷酸酶,SGOT/SLT或SGPT/ALT,血清肌酐,蛋白电泳,总血清胆固醇,甘油三酸酯。葡萄糖(基线水平),钠,钾和钙。
尿分析:量标蛋白,葡萄糖,酮,潜血,胆色素,pH,比重和尿沉淀物的显微镜检查(RBC,WBC,上皮细胞,细菌,管型),当量标检测显示有一种或多种异常值时。
病毒负载:增加超过1个对数10值应该在2周后进行确定性病毒负载测定。
没有患者对疫苗接种产生自觉或他觉的不良反应。在接种时期内重复进行的临床化学实验记录表(详见材料和方法)中未观察到不良的实验室异常。
进行下列的免疫学研究:
淋巴细胞增殖试验(LPA)
外周血单核细胞(PBMC)通过Ficoll-Hypaque密度梯度(Pharmacia)离心从肝素化的静脉血中分离,在添加5%备用的热灭活AB+血清(Sigma)、抗生素(100U/ml青霉素和100μg/ml;链霉素;Gibco)和L-谷氨酰胺(完全培养基,CM)的RPMI 1640培养基(Gibco)中重悬浮为1×106细胞/ml。然后在瓶底微量滴定板中建立四重培养(1×105 PBMC/孔),细胞在存在或缺少以下刺激物的情况下孵育6天:rNef(0.2,1和5μg/ml),GST(0.2,1和5μg/ml),结核菌素的纯化蛋白衍生物(PPD,12.5μg/ml;Statens Seruminstitut),白色念珠菌抗原(20μg/ml;GreerLaboratories)和植物血球凝集素(PHA;5μg/ml;Life Technologies)。孵育期的最后6小时,向培养物中加入3H-胸苷(1μCi/孔;Amersham),收获细胞至玻璃纤维滤膜上,在γ-计数仪上测量掺入的放射活性。结果表示为δcpm(抗原存在时的cpm-没有抗原时的cpm)或刺激指数(存在抗原时的cpm/没有抗原时的cpm)。
结果显示于图26和27中。在疫苗接种前,没有一个疫苗接种者显示对待测抗原,HIV-1 Nef抗原显示明显的T细胞增殖反应。相对比,接受1微克剂量待测疫苗组5个疫苗接种者中的2个(患者1和3)(图26)和接受20微克待测疫苗组5个中的2个(患者9和10)(图27)显示在首次疫苗接种后发生很强的T细胞增殖反应。第二次接种后,1微克组中的1个疫苗接种者(患者2)发生反应。
IFN-γ测定
疫苗诱导免疫反应的类型(Th1/Th2)通过测定抗原(rNef,rGST,PPD)或有丝分裂原(PHA)刺激PBMC后6天陈旧的培养上清液中释放的γ-干扰素(IFN-γ)进行评价。为了进行测定,使用市售的ELISA试剂盒(R&DQuantikine)。测定使用定量夹心酶免疫测定技术,其中IFN-γ特异的单克隆抗体已经被包被在微量板上。标准品和标本被移至孔中,固定的抗体可结合任何存在的IFN-γ。在洗掉任何未结合的物质后,IFN-γ的酶联多克隆特异抗体加入至孔中。在冲洗去掉任何未结合的抗体-酶试剂后,底物溶液加入至孔中,根据最初步骤中结合的细胞因子的量成比例的显色。终止显色,测量颜色的密度。
#1患者的IFN-γ反应数据显示于图28。如所见到的,对rNef抗原反应的疫苗接种者,其显著的IFN-γ反应与T细胞增殖有关,表明在接种者中见到的反应事实上是TH1型。
HIV-1感染的特点是较低的或总体上缺少对所有HIV蛋白的细胞介导免疫反应。结果显示在这些患者中使用异常低剂量的DNA疫苗NN2-Nef可能诱导强烈的CMI。使用的剂量对通常DNA疫苗所需的剂量来说是最小的。因此,例如Merch宣称最近他们的试验性HIV疫苗获得了良好的结果,但需要的剂量从1000至5000微克(1AV1报道,2002)。
6.12实例12:构建表达EB病毒(EBV)EBNA-1蛋白并含有EBNA-1(FR元件)20个结合位点的质粒
为了构建表达EB病毒(EBV)EBNA-1蛋白和含有EBNA-1(FRelement)的20个结合位点的质粒,BPV-1 E2结合位点首先用EBVEBNA-1结合位点(oriP没有DS元件)置换。质粒FRE2d1EGFP(图29)的构建通过隔离pEBO LPP质粒(图29A)的Xmi(Acc1/Eco321(EcoRV)DNA片段(钝末端具有Klenow酶)(片段含有EBNA-1的20个结合位点),通过钝末端连接作用将其插入进s6E2d1EGFP(图29B)(钝末端具有Klenow酶)Spe1/Nhe1位点中。在进一步的试验中构建的质粒FRE2d1EGFP(图29)被用作阴性对照。它含有EBNA-1蛋白的结合位点,代替了BPV1 E2 10结合位点,表达E2,但不表达EBNA-1。
下一步,在FRE2d1EGFP质粒中编码BPV-1 E2蛋白的序列被如下编码EBV EBNA-1蛋白的序列置换。pEBO LPP质粒的Xmi(Acc1)/EcoRI片段被隔离,钝末端具有Klenow酶,被插入进FRE2d1EGFP质粒(钝端连接Klenow酶)的Xba1/Xba1位点中。载体FRE2d1EGFP以前生长在缺少Dam甲基化的大肠杆菌菌株DH5α中,因为一个Xba1位点对甲基化是敏感的。构建的质粒FREBNAd1EGFP(图30)表达EBNA-1蛋白,含有EBNA-1的20个结合位点。
为了表达,Jurkat、人胚胎肾细胞系293(ATCC CRL 1573)和鼠成纤维细胞系3T6细胞(ATCC CCL 96)被维持生长在添加了10%胎牛血清(FCS)的Iscove′s限制性Dulbecco′s培养基(IMDM)中。4百万个细胞(Jurkat),75%汇合的培养皿(293)或的75%汇合培养皿(3T6)用来进行每一次转染,转染如下通过电穿孔进行。细胞通过离心收获(1000rpm,5分钟,20℃,Jouan CR 422),重新悬浮在含有5mM Na-BES缓冲液(pH7.5)的完全培养基中。250μl细胞悬液的细胞与50μg运载体DNA(鲑精DNA)和1μg(在Jurkat和3T6的情况下)或5μg(在293的情况下)质粒DNA混合,Jurkat细胞在200V和1000μF下电穿孔,293细胞在170V和950μF,3T6细胞在230V和975μF。转染的Jurkat细胞接种在6-cm皿中,其中含有5ml培养基;1/3转染的293和3T6细胞接种在6-cm皿中,其中含有5ml培养基;2/3的细胞接种在10-cm皿中,其中含有10ml培养基。
转染的细胞被分析d1EGFP蛋白(修饰的增强绿荧光蛋白)的表达。所有构建的质粒表达d1EGFP蛋白,通过使用流式细胞仪测量荧光而进行检测。因为d1EGFP蛋白的半衰期很短,因此它不能积累,这种蛋白的表达反应了细胞中存在转录活性质粒。使用Becton-Dickinson FACSCalibur系统。Jurkat细胞悬液的体积在每个时间点前被测量(大约每24个小时后),如果体积小于5ml,添加损失体积的培养基。根据细胞悬液的密度,取出适当体积进行测定(1或2ml),添加相同量的培养基。以后当计算稀释度时要考虑这一点。
对于第一个时间点,6cm皿的293细胞悬浮在5ml培养基中进行测定。在以后的每一个时间点中,从10cm皿中取出一半细胞,悬浮在5ml培养基中,然后进行测定。适当体积被加入至细胞悬液的剩余部分中。对于第一个时间点,6cm皿的3T6细胞悬浮在1ml胰蛋白酶中,然后用100μl FCS灭活。对于此后的每个时间点,10cm皿的细胞悬浮在2ml胰蛋白酶中。1ml这种悬液如前所述被处理。加入9ml培养基至悬液的剩余部分。在测定前被分析的细胞立即从孵箱中取出。在每个时间点前确定适当的流速(500-1000细胞/秒),使用仅以运载体DNA转染的细胞作为对照。使用三个不同的参数来测定细胞的大小,表面结构和荧光。
结果在图31中以图表显示。仅用运载体DNA转染的细胞用来测量细胞系的自发荧光。1%这种自发荧光被认为是背景荧光,此后从d1EGFP荧光中减去。接收到的数据采用Microsoft Excel程序分析。
表达d1EGFP细胞的百分比的计算,是使用仅用运载体转染的细胞作为背景荧光的阴性对照。如在图33中所示,两个载体以不同的动力学被维持在细胞中。
表达d1EGFP细胞的数目的计算,要考虑稀释度,使用仅用运载体转染的细胞作为背景荧光的阴性对照。如在图53中所示,表达EBNA-1和携带EBNA-1特异的多聚结合位点的质粒非常有效地被维持在被转染的细胞中。转染后第一天,大约8×104细胞表达EGFP。在第8天,在维持的载体(FREBNAd1EGFP)中,表达质粒阳性d1EGFP细胞的数目增加10倍至8×105。缺少EBNA-1表达(FRE2d1 EGFP)的质粒或没有EBNA-1结合位点,质粒阳性细胞的数目仍然可以保持,或在许多情况下减少。这个事实反映了隔离/分隔EB病毒的机制。如果EBNA-1被表达,质粒携带了EBNA-1的结合位点,EBNA1和EBNA-1结合位点产生的维持和隔离功能对质粒提供了维持的功能。相同的机制和相同的成分实际上为EB病毒在生活周期的隐藏期提供了隔离功能。
相似的结果也在人胚胎细胞系293中和鼠细胞系3T6(图34)中获得。作为293和3T6细胞维持性的对照,分别使用s6HPV11和2wtFS。
6.13实例13:GTU-多基因载体的免疫原性
GTU-1-多基因载体的免疫原性
在实例12中制备的6个不同的多基因疫苗构建物,即GTU-1-RNT,GTU-1-TRN,GTU-1-RNT-CTL,GTU-1-TRN-CTL,GTU-1-TRN-optgag-CTL,和GTU-1-TRN-CTL-optgag载体的免疫原性在小鼠中被检测。载体被转化进TOP10或DHSα细胞中,采用市售的Qiagen柱来制备MegaPreps。用Pierce内毒素清除凝胶去掉内毒素。
根据生产厂商(Bio-Rad)的说明书稍加修改,将待测微粒包被在1μm金颗粒上。Balb/c小鼠用Helios基因枪使用400psi的压力和0.5mg金/盒的量被免疫。小鼠在周0,1和3被免疫3次。小鼠在最后一次免疫后两周被处死。
小鼠被分为6个检测组(5只鼠/组),如下接受3×1μg DNA:
Group1.GTU-1-RNT
Group2.GTU-1-TRN
Group3.GTU-1-RNT-CTL
Group4.GTU-1-TRN-CTL
Group5.GTU-1-TRN-optgag-CTL
Group6.GTU-1-TRN-CTL-optgag
Group7.对照小鼠,用不装填DNA的空金颗粒免疫
每只鼠的尾血标本进行体液反应。首次免疫前从麻醉鼠中取出首次免疫前的标本。在第三次免疫前从麻醉鼠中取出第二个标本。处死时,全血标本用来进行白细胞计数,收集血清进行体液免疫性测定。
使用标准方法用ELISA检测血标本中的抗体。Nunc Maxi Sorp板用100ng Nef,Rev,Tat,Gag,CTL或E2蛋白包被,阻断,向相同的孔中加入稀释度为1∶100的血清过夜孵育。冲洗后,用稀释(1∶500)的二抗,过氧化物酶交联的抗鼠IgG(DAKO)孵育板2小时。从磷酸盐-柠檬酸盐缓冲液中的底物(2,2′-连氮基-双(3-乙基苯噻唑啉-6-磺酸)(ABTS)产生的颜色强度在405nm使用Lab systems ELISA-平板读数仪进行测量。
所有在载体在所有小鼠中均诱导Nef抗体,而没有小鼠显示有E2,CTL或Rev抗体(图35,36和表4)。一些用GTU-1-RNT或GTU-1-RNT-CTL免疫的小鼠也产生Tat抗体(图36和表4)。而且,用含有optgag序列的载体免疫的小鼠也产生Gag抗体,但构建物GTU-1-TRN-optgag-CTL是较构建物GTU-1-TRN-CTL-optgag更好的一种抗体诱导剂(图37和表4)。抗体主要诱导IgG1类,表明是通常在采用基因枪免疫所见的一种Th2型反应。下面显示的抗体测定是当小鼠被处死时收集的血清中进行。
结果显示多基因构建物,可表达几种HIV基因成为融合蛋白,能诱导对大多数基因产物的免疫反应。但基因在多基因和相应蛋白在融合蛋白中的方向和顺序可极大地影响结果。因此,仅当Tat基因被置于融合蛋白一侧(具有RNT基序的载体)时可见对Tat的反应,而不是当Tat为氨基末端蛋白(具有TRN基序的载体)时。对Gag蛋白的反应仅见于使用载体时,其中Gag置于含有Th分支和CTL抗原决定簇的CTL之前。
表4免疫IIIA小鼠ELISA结果(5个小鼠的平均OD值)免疫原组数Nef(ownprot)TatRevGagCTLGTU-1-RNT12.1941.3910.310.1550.36GTU-1-TRN21.8490.1970.2520.3020.38GTU-1-RNT-CTL31.9220.5550.2950.1540.439GTU-1-TRN-CTL41.6770.2110.2980.140.425GTU-1-TRN-optgag-CTL51.7220.1820.240.6670.381GTU-1-TRN-CTL-optgag60.547 0.2250.3220.2280.43对照70.3160.2260.2820.160.405免疫原组Nef反应的百分比Tat反应Rev反应Gag反应CTL反应GTU-1-RNT110080000GTU-1-TRN210000200GTU-1-RNT-CTL310040000GTU-1-TRN-CTL41000000GTU-1-TRN-optgag-CTL58000600GTU-1-TRN-CTL-optgag610000200
6.14.实例14:表达NEF、REV和TAT的杂合蛋白在不同组合物中的表达(多调控)
为了产生HIV多基因载体,具有多克隆位点的GTU-1载体(图38A)用作主链。完整的Nef,Rev和Tat编码序列通过聚合酶链式反应(PCR)扩增,并相互以不同的顺序附着在多调控(multireg)抗原编码可读框(Nef-Tat-Rev,Tat-Rev-Nef,Rev-Tat-Nef,Tat-Nef-Rev和Rev-Nef-Tat;分别为序列Id.No.1至5)上。序列被克隆至GTU-1载体的Bsp1191和Not1位点上。
相似地,表达GTU-2和GTU-3载体的Nef蛋白(图38B和38C;NNV-2wt也见图6B)也用作产生HIV多基因载体的主链。另外,表达增强的绿荧光蛋白或d1EGFP的载体super6wt(super6wt d1 EGFP;图17和图38D)和使用EBNA-1蛋白的质粒及其结合位点(FREBNAd1EGFP;图38E)用作基因传递单位(GTU)的平台。为了控制“非-GTU”载体,表达Rev的适当的巨细胞病毒(CMV)载体NNV-Rev和含有d1EGFP质粒的质粒EBNA-1和E2BS(分别为NNV-Rev和E2BSEBNAd1EGFP;图38G和F)用作主链。
为了制备不同的GTU-2和GTU-3载体(pNRT,pTRN,pRTN,pTNR和pRNT;和p2TRN和p2RNT;和p3RNT,分别为图39A-E,39F-G和39H),载体GTI-2Nef和GTU-3Nef中的Nef基因分别被多调控抗原使用Nde1和Pag1位点取代。字母N(ef),R(ev)和T(at)的序列在名称上显示了各自蛋白编码序列在多基因中的位置。也制备两个载体,含有置入Salt位点的IRES元件,跟随在多抗原或E2编码序列后(分别为pTRN-iE2-GMCSF和pTRN-iMG-GMCSF;图391和J)。后面的序列,控制鼠粒细胞-巨噬细胞集落刺激因子(GM-CSF)编码序列的翻译,与IRES一起被克隆进单个BspTI位点中。
另外,一组载体,其中仅有调控蛋白的免疫显性部分用来构成聚合蛋白,它们被克隆进GTU-1(pMVINTR,pMV2NTR,pMV-1NHTR和pMV2N11TR;图40A-D)的Bsp1191和Not1位点中。在pMV2构建物的情况下,可被细胞内蛋白酶消化的连接子可分隔来自不同调控蛋白的多抗原的区域。
进一步制备GTU-1,GTU-2和GTU-3载体,它们表达由gag基因编码的结构蛋白或由前述CTL抗原决定簇组成的人工聚合蛋白。编码的序列如Bsp119I和Not1消化的PCR产物被克隆进GTU-1载体(pCTL=BNmCTL,pdgag=pBNdgag,psynp17/24=pBNsynp17+24,poptp17/24=pBNoptp17/24;Figures 41A-D)中,在Nde1-Pac1片段中被转移至GTU-2(p2mCTL和p2optp17/24;图41E和F)和GTU-3(p3mCTL和p3optp17/24;图41G和H)中。
被称为CTL(序列Id.No.10)的编码片段含有来自涉及许多以前鉴定的CTL抗原决定簇的pol和env区的片段。优化密码子选择以便仅涉及在人细胞中频繁使用的密码子。这种编码序列也含有可用于效力检测的被详细定性的鼠CTL抗原决定簇,和一个被抗鼠CD43抗体识别的抗原决定簇。还包括显性优势的SIV p27抗原决定簇以用于猕猴的效力研究。
dgag含有Han2隔离体gag区的截断p17(在13aa起始)+p24+p2+p7(p1和p6除外)(序列Id.No.11)。synp17/24(序列Id.NO.12)编码Han2 HIV-1的p17+p24多肽。在人细胞中密码子选择被修饰为最佳。以前鉴定的富含AU的RNA不稳定元件也通过这种方式被去除。optp17/24编码(序列Id.NO.13)区非常类似于synp17/24,例外的是在此造成的两个同义突变不改变蛋白组成,但去掉了一个潜在的剪接受体位点。
进一步建立了一组多HIV载体,含有多调控抗原和结构性抗原如单个聚合蛋白:pTRN-CTL,pRNT-CTL,pTRN-dgag,pTRN-CTL-dgag,pRNT-CTL-dgag,pTRN-dgag-CTL,pRNT-dgag-CTL,pTRN-optp-17/24-CTL,pTRN-CTL-optp17/24,和pRNT-CTL-optp17/24;p2TRN-optp17/24-CTL,p2RNT-optp17/24-CTL,p2TRN-CTL-optp17/24,p2RNT-CTL-optp17/24,p2TRN-CTL-optp17/24-iE2-mGMCSF,和p2RNT-CTL-optp17/24-iE2-mGMCSF;和p3TRN-CTL-optp17/24,p3RNT-CTL-optp17/24,p3TRN-CTL-optp17/24-iE2-mGMCSF,和p3RNT-CTL-optp17/24-iE2-mGMCSF,图42A-T。
为了克隆,作为第一个步骤,终止密码子从调控多抗原编码序列中去除。然后结构性抗原编码序列通过克隆加入至框末端的Not1位点中以重构Not1位点。如果CTL和gag都被加入,第一个抗原编码序列不含有终止密码子。通常,在GTU-1的情况下进行克隆,以便分别制备GTU-2(p2…)和GTU-3(p3…)载体,使用Nde1和PagI的位点质粒GTU-2Nef和GTU-2Nef中的Nef基因被置换。但RNT-optp17/24-CTL抗原被直接构建进GTU-2载体中。
使用Eco-1051和Not1的位点(super6wt-RNT-CTL-optp17/24和FREBNA-RNT-CTL-optp17/24;分别见图43V和42U),HIV多抗原被克隆进载体super6wtd1EGFP和FREBNAd1EGFP,而不是dtEGFP。如果指定,IRES和鼠mGM-CSF被克隆进GTU-2和GTU-3载体中,位于E2编码序列之后,进入来自pTRN-iE2-mGMCSF(使用相同的限制性酶切断)的位点Mph11031和Eco911中。
最后,对于应用EBNA-1的系统(含有EBNA-1,具有E2结合位点的表达基因盒),“非GTU”对照载体E2BSEBNA-RNT-CTL-optp17/24(图42W)用如FREBNA-RNT-CTL-optp-17/24相同的方式制备。常规的表达多HIV抗原(图42D)的CMV载体pCMV-RNT-CTL-optp17/24的制备通过使用Nde1和PagI的位点从各自的GTU-1载体中克隆多HIV编码片段。
6.15.实例15:仅携带调控蛋白免疫显性区的多调控抗原的表达特性
1.多调控抗原的细胞内定位
由发明的载体所表示的多调控抗原的细胞内定位通过使用基本上如实例4中所述的Nef,Rev和Tat蛋白的单克隆抗体在RD细胞中的原位免疫荧光来研究。结果总结在表5中,在图45中进行图解。由完整的Nef,Rev和Tat蛋白组成的所有抗原显示在细胞浆中的唯一定位。最初设计的变体蛋白称为N(ef)T(at)R(ev),在Rev序列前具有移码,显示仅有核定位。携带调控蛋白截断序列的多调控抗原定位在细胞浆中。在这种情况下,经常可观察到象“包涵体”的明显结构。这种情况也同样发生在携带从pMV2载体中表达的蛋白酶位点的抗原中。但在这些情况下也检测到核中的蛋白(图45)。
表5.多调控抗原中的细胞内定位
构建物 抗-Nef 抗-Rev 抗-Tat
空 阴性 阴性 阴性
GTU-1
pTRN 胞浆内强染色 胞浆内较好的染色 胞浆内阳性染色
pNTR 核中强染色 阴性染色 核中阳性染色
pRNT 胞浆内强染色 胞浆内良好染色 胞浆内良好染色
pNRT 强,胞浆 胞浆内良好染色 胞浆内良好染色
pRTN 强,胞浆 胞浆内良好染色 胞浆内阳性染色
pTNR 强,胞浆 胞浆内良好染色 胞浆内良好染色
pMV1NTR 强胞浆内 细胞浆+包涵体 细胞浆+包涵体
pMV1N11TR 强 细胞浆+包涵体 细胞浆+包涵体
pMV2NTR 核中和胞浆中的包涵体 核中和胞浆中的包涵体 核中和胞浆中的包涵体
pMV2N11TR 在核和胞浆中仅有包涵体 核和胞浆中仅有包涵体 核和胞浆中仅有包涵体
dgag和p17+p24蛋白的细胞内定位也在RD细胞中通过免疫荧光用单克隆抗p24抗体进行分析。根据Jurkat细胞中的Western印迹结果,不能检测到-dgag。但p17/24蛋白显示定位在浆膜上(图45)。CTL蛋白的定位未显示,因为没有合适的抗体可用。
6.2实例15:从POL分析编码重组GAG抗原和细胞毒性T细胞抗原决定簇(CTL)的载体
6.2.1.表达
通过Western印迹分析表达CTL cds的载体或来自gag区的蛋白的表。如在图46A和46B中所示,CTL和dgag表达很清晰的在Cos-7细胞中被证实为预测大小的蛋白(分别为25kD和47kD)。Nef,Rev和Tat的共转染明显增强了dgag蛋白的表达。我们将其解释为REV蛋白对GAG mRNA表达的作用结果。我们也试图在Jurkat细胞中从GTU-1载体中表达dgag蛋白,但我们没能检测到任何信号(图46C)。密码子选择的分析显示对于人细胞wt GAG序列没有最佳的密码子选择。当最优化密码子选择时(构建物psynp17/24和poptp17/24),强的p17+p24(40kD)蛋白表达在Jurkat细胞中被检测到(图46C和46D)。
6.2.2.细胞内定位
对于dgag和p17+p24蛋白,也在RD细胞中通过免疫荧光使用抗p24Mab分析细胞内定位。类似在Jurkat细胞中的Western印迹结果,不能检测到dgag。Thep17/24蛋白显示定位在浆膜中(图47)。CTL蛋白的定位由于缺少合适的抗体未被分析。
6.16实例16:多调控+结构性蛋白作为多HIV抗原表达
作为下一步,分析了由常规的多基因和gag编码的蛋白和/或作为单个多肽的CTL多抗原决定簇组成的多HIV抗原。在图48上,Western印迹显示了几种转染进Cos-7细胞中的多HIV抗原表达载体的表达。很明显地发现所有调控性+结构性多抗原的表达水平明显低于RNT或TRN蛋白。所有检测到的多HIV抗原在凝胶上的迁移为显著的条带,靠近预测大小为(73kD的多调控+CTL位置附近;大小为95kD的多调控+dgag和120kD的多调控+CTL+dgag)。类似于RNT和TRN,RNT-CTL的迁移较TRN-CTL更慢。在TRN和RNT构建物的情况下,多调控-CTL-dgag的组合也都显示较多调控-dgag-CTL更高的表达水平。
多HIV抗原的更详细的分析在Jurkat细胞中进行。出于此原因,大多数构建的多HIV抗原(多调控+结构性),包括多调控+CTL+optp17/24(预测大小为113kD)使用抗原不同部分的抗体通过Western印迹进行分析。在图49中显示的结果基本上类似于前面章节Cos-7细胞中所报道的结果。如在前面试验中所见,含有多抗原的dgag在Jurkat细胞中表达的杂交蛋白水平非常低。载体pTRNdgag中的表达在所有印迹中未检测到。在用从含有其他dgag的抗原表达载体转染的细胞中获取的材料上样的泳道中,在预测分子量大小的位置上仅在Nef单抗杂交的印迹上检测到非常微弱的信号。相反,如果dgag部分用密码子优化的p17/24替换,可观察到表达水平的增加。因为最初选择TRN-CTL-optp17/24和RNT-optp17/24来进一步分析,所有从所有含有这些表达基因盒的GTU载体中分析抗原的表达。也分析来自这些质粒的E2蛋白表达。结果在图50中被图解。在载体之间多抗原和E2蛋白两者的表达水平没有大的差异。E2的表达水平受IRES元件的影响不明显,该元件在质粒中紧随鼠GM-CSF基因,如E2一样由相同的mRNA翻译而来。
6.17.实例17:抗原表达的维持
在分裂细胞的群体中质粒的维持性可通过绿荧光蛋白和Nef蛋白作为标记物来证明。也分析从不同的GTU或非GTU载体中产生的RNT-CTL-optp17/24抗原表达的维持性。特别是,GTU-1(pRNT-CTL-optp17/24),GTU-2(p2 RNT-CTL-optp17/24),GTU-3(p3RNT-CTL-optp17/24),super6wt(super6wt-RNT-CTL-optp17/24)载体的每一种都使用E2蛋白及其结合位点来发挥质粒维持活性。在这个试验中,也包括使用GTU载体FREBNA-RNT-CTL-optp17/24的EBNA-1及其结合位点。作为阴性对照,也使用含有EBNA-1表达基因盒与E2结合位点(E2BSEBNA-RNT-CTL-optp17/24)的混合配对的“非GTU”质粒。也使用常规的CMV表达载体pCMV-RNT-CTL-optp17/24。
Jurkat细胞用等克分子数量的质粒转染,在转染后2天和5天使用抗Nef单克隆抗体来研究抗原表达。仅用运载体DNA的转染用作阴性对照。结果列于图51。
如从图51中所见,在第二个时间点仅从GTU载体中检测到表达。FREBNA-RNT-CTL-optp17/24中的抗原表达在两个时间点都低,因为不像E2,EBNA-1不具有转录活化能力。
多调控+结构性聚合蛋白的细胞内定位也通过基本上如实例4中所述在RD细胞中通过原位免疫荧光分析来研究。结果在图52中显示。
在所有的结果中,使用抗Nef或抗p24单克隆抗体仅在细胞浆中检测到定位。根据Western印迹数据,含有optp17/24的蛋白的表达水平大大高于含dgag片段的抗原。
在此引用的所有参考文献在此整体合并为参考文献,所有都是为了同样的目的,就像每一篇出版物或专利或专利申请书都特别地和单独地表示为可为了所有目的以其整体合并为参考文献。
可对本发明进行许多修饰和变化,并不背离此精神和范围,这将对于本领域专业技术人员是很明显的。在此所述的特殊实施例仅以实例的方式提供,发明仅受附录的权利要求书的条款以及这些权利要求所被授权的等效物的所有范围限制。
序列表
<110>FIT生物技术公司
<120>新的表达载体及其应用
<130>11041-006-228(2010149)
<140>To be assigned
<141>2002-05-03
<150>FI 20010922
<151>2001-05-03
<160>52
<170>PatentIn version 3.1
<210>1
<211>1260
<212>DNA
<213>人工序列
<220>
<223>含有Nef-Tat-Rev的杂交蛋白(NTR)
<400>1
atggtgggca agtggtcaaa atgtagtgga tggcctactg taagggaaag aatgaaacaa 60
gctgagcctg agccagcagc agatggggtg ggagcagcat ctcgagacct ggaaaaacat 120
ggagcaatca caagtagcaa tacagcaact aataacgctg cttgtgcctg gctagaagca 180
caagaggaag aggaagtggg ttttccagtc agacctcagg tacctttaag accaatgact 240
tacaagggag ctttagatct tagccacttt ttaaaagaaa aggggggact ggaagggtta 300
atttactccc caaaaagaca agagatcctt gatctgtggg tctaccacac acaaggctac 360
ttccctgatt ggcagaacta cacaccaggg ccaggggtca gatatccact gacctttgga 420
tggtgcttca agttagtacc agttgaacca gatgaagaag agaacagcag cctgttacac 480
cctgcgagcc tgcatgggac agaggacacg gagagagaag tgttaaagtg gaagtttgac 540
agccatctag catttcatca caaggcccga gagctgcatc cggagtacta caaagactgc 600
actagtgcag gaagaagcgg agacagcgac gaagagctcc tcaagacagt cagactcatc 660
aagtttctct accaaagcaa ccctcctccc agcaacgagg ggacccgaca ggcccgaaga 720
aatcgaagaa gaaggtggag agagagacag aggcagatcc gttcgattag tgagcggatt 780
cttagcactt ttctgggacg acctgcggag cctgtgcctc ttcagctacc gccgcttgag 840
agacttactc ttgattgtag cgaagattgt ggaaactctg ggacgcaggg ggtgggaagt 900
cctcaagtat tggtggaatc tcctgcagta ttggagccag gaactaaaga aaagcttgag 960
ccagtagatc ctagactaga gccctggaag catccaggaa gtcagcctag gaccccttgt 1020
accaattgct attgtaaaaa gtgttgcctt cattgccaag tttgtttcac aagaaaaggc 1080
ttaggcatct cctatggcag gaagaagcgg agacagcgac gaagagctcc tcaagacagt 1140
cagactcatc aagtttctct accaaagcaa ccctcctccc agcaacgagg ggacccgaca 1200
ggcccgaaga aatcgaagaa gaaggtggag agagagacag aggcagatcc gttcgattag 1260
<210>2
<211>1260
<212>DNA
<213>人工序列
<220>
<223>杂交蛋白含有Tat-Rev-Nef(TRN)
<400>2
atggagccag tagatcctag actagagccc tggaagcatc caggaagtca gcctaggacc 60
ccttgtacca attgctattg taaaaagtgt tgccttcatt gccaagtttg tttcacaaga 120
aaaggcttag gcatctccta tggcaggaag aagcggagac agcgacgaag agctcctcaa 180
gacagtcaga ctcatcaagt ttctctacca aagcaaccct cctcccagca acgaggggac 240
ccgacaggcc cgaagaaatc gaagaagaag gtggagagag agacagaggc agatccgttc 300
gatactagtg caggaagaag cggagacagc gacgaagagc tcctcaagac agtcagactc 360
atcaagtttc tctaccaaag caaccctcct cccagcaacg aggggacccg acaggcccga 420
agaaatcgaa gaagaaggtg gagagagaga cagaggcaga tccgttcgat tagtgagcgg 480
attcttagca cttttctggg acgacctgcg gagcctgtgc ctcttcagct accgccgctt 540
gagagactta ctcttgattg tagcgaagat tgtggaaact ctgggacgca gggggtggga 600
agtcctcaag tattggtgga atctcctgca gtattggagc caggaactaa agaaaagctt 660
gtgggcaagt ggtcaaaatg tagtggatgg cctactgtaa gggaaagaat gaaacaagct 720
gagcctgagc cagcagcaga tggggtggga gcagcatctc gagacctgga aaaacatgga 780
gcaatcacaa gtagcaatac agcaactaat aacgctgctt gtgcctggct agaagcacaa 840
gaggaagagg aagtgggttt tccagtcaga cctcaggtac ctttaagacc aatgacttac 900
aagggagctt tagatcttag ccacttttta aaagaaaagg ggggactgga agggttaatt 960
tactccccaa aaagacaaga gatccttgat ctgtgggtct accacacaca aggctacttc 1020
cctgattggc agaactacac accagggcca ggggtcagat atccactgac ctttggatgg 1080
tgcttcaagt tagtaccagt tgaaccagat gaagaagaga acagcagcct gttacaccct 1140
gcgagcctgc atgggacaga ggacacggag agagaagtgt taaagtggaa gtttgacagc 1200
catctagcat ttcatcacaa ggcccgagag ctgcatccgg agtactacaa agactgctga 1260
<210>3
<211>1260
<212>DNA
<213>人工序列
<220>
<223>含有Rev-Tat-Nef的杂交蛋白(RTN)
<400>3
atggcaggaa gaagcggaga cagcgacgaa gagctcctca agacagtcag actcatcaag 60
tttctctacc aaagcaaccc tcctcccagc aacgagggga cccgacaggc ccgaagaaat 120
cgaagaagaa ggtggagaga gagacagagg cagatccgtt cgattagtga gcggattctt 180
agcacttttc tgggacgacc tgcggagcct gtgcctcttc agctaccgcc gcttgagaga 240
cttactcttg attgtagcga agattgtgga aactctggga cgcagggggt gggaagtcct 300
caagtattgg tggaatctcc tgcagtattg gagccaggaa ctaaagaaac tagtgagcca 360
gtagatccta gactagagcc ctggaagcat ccaggaagtc agcctaggac cccttgtacc 420
aattgctatt gtaaaaagtg ttgccttcat tgccaagttt gtttcacaag aaaaggctta 480
ggcatctcct atggcaggaa gaagcggaga cagcgacgaa gagctcctca agacagtcag 540
actcatcaag tttctctacc aaagcaaccc tcctcccagc aacgagggga cccgacaggc 600
ccgaagaaat cgaagaagaa ggtggagaga gagacagagg cagatccgtt cgataagctt 660
gtgggcaagt ggtcaaaatg tagtggatgg cctactgtaa gggaaagaat gaaacaagct 720
gagcctgagc cagcagcaga tggggtggga gcagcatctc gagacctgga aaaacatgga 780
gcaatcacaa gtagcaatac agcaactaat aacgctgctt gtgcctggct agaagcacaa 840
gaggaagagg aagtgggttt tccagtcaga cctcaggtac ctttaagacc aatgacttac 900
aagggagctt tagatcttag ccacttttta aaagaaaagg ggggactgga agggttaatt 960
tactccccaa aaagacaaga gatccttgat ctgtgggtct accacacaca aggctacttc 1020
cctgattggc agaactacac accagggcca ggggtcagat atccactgac ctttggatgg 1080
tgcttcaagt tagtaccagt tgaaccagat gaagaagaga acagcagcct gttacaccct 1140
gcgagcctgc atgggacaga ggacacggag agagaagtgt taaagtggaa gtttgacagc 1200
catctagcat ttcatcacaa ggcccgagag ctgcatccgg agtactacaa agactgctga 1260
<210>4
<211>1260
<212>DNA
<213>人工序列
<220>
<223>含有Tat-Nef-Rev的杂交蛋白(TNR)
<400>4
atggagccag tagatcctag actagagccc tggaagcatc caggaagtca gcctaggacc 60
ccttgtacca attgctattg taaaaagtgt tgccttcatt gccaagtttg tttcacaaga 120
aaaggcttag gcatctccta tggcaggaag aagcggagac agcgacgaag agctcctcaa 180
gacagtcaga ctcatcaagt ttctctacca aagcaaccct cctcccagca acgaggggac 240
ccgacaggcc cgaagaaatc gaagaagaag gtggagagag agacagaggc agatccgttc 300
gatactagtg tgggcaagtg gtcaaaatgt agtggatggc ctactgtaag ggaaagaatg 360
aaacaagctg agcctgagcc agcagcagat ggggtgggag cagcatctcg agacctggaa 420
aaacatggag caatcacaag tagcaataca gcaactaata acgctgcttg tgcctggcta 480
gaagcacaag aggaagagga agtgggtttt ccagtcagac ctcaggtacc tttaagacca 540
atgacttaca agggagcttt agatcttagc cactttttaa aagaaaaggg gggactggaa 600
gggttaattt actccccaaa aagacaagag atccttgatc tgtgggtcta ccacacacaa 660
ggctacttcc ctgattggca gaactacaca ccagggccag gggtcagata tccactgacc 720
tttggatggt gcttcaagtt agtaccagtt gaaccagatg aagaagagaa cagcagcctg 780
ttacaccctg cgagcctgca tgggacagag gacacggaga gagaagtgtt aaagtggaag 840
tttgacagcc atctagcatt tcatcacaag gcccgagagc tgcatccgga gtactacaaa 900
gactgcaagc ttgcaggaag aagcggagac agcgacgaag agctcctcaa gacagtcaga 960
ctcatcaagt ttctctacca aagcaaccct cctcccagca acgaggggac ccgacaggcc 1020
cgaagaaatc gaagaagaag gtggagagag agacagaggc agatccgttc gattagtgag 1080
cggattctta gcacttttct gggacgacct gcggagcctg tgcctcttca gctaccgccg 1140
cttgagagac ttactcttga ttgtagcgaa gattgtggaa actctgggac gcagggggtg 1200
ggaagtcctc aagtattggt ggaatctcct gcagtattgg agccaggaac taaagaatag 1260
<210>5
<211>1260
<212>DNA
<213>人工序列
<220>
<223>含有Rev-Nef-Tat的杂交蛋白(RNT)
<400>5
atggcaggaa gaagcggaga cagcgacgaa gagctcctca agacagtcag actcatcaag 60
tttctctacc aaagcaaccc tcctcccagc aacgagggga cccgacaggc ccgaagaaat 120
cgaagaagaa ggtggagaga gagacagagg cagatccgtt cgattagtga gcggattctt 180
agcacttttc tgggacgacc tgcggagcct gtgcctcttc agctaccgcc gcttgagaga 240
cttactcttg attgtagcga agattgtgga aactctggga cgcagggggt gggaagtcct 300
caagtattgg tggaatctcc tgcagtattg gagccaggaa ctaaagaaac tagtgtgggc 360
aagtggtcaa aatgtagtgg atggcctact gtaagggaaa gaatgaaaca agctgagcct 420
gagccagcag cagatggggt gggagcagca tctcgagacc tggaaaaaca tggagcaatc 480
acaagtagca atacagcaac taataacgct gcttgtgcct ggctagaagc acaagaggaa 540
gaggaagtgg gttttccagt cagacctcag gtacctttaa gaccaatgac ttacaaggga 600
gctttagatc ttagccactt tttaaaagaa aaggggggac tggaagggtt aatttactcc 660
ccaaaaagac aagagatcct tgatctgtgg gtctaccaca cacaaggcta cttccctgat 720
tggcagaact acacaccagg gccaggggtc agatatccac tgacctttgg atggtgcttc 780
aagttagtac cagttgaacc agatgaagaa gagaacagca gcctgttaca ccctgcgagc 840
ctgcatggga cagaggacac ggagagagaa gtgttaaagt ggaagtttga cagccatcta 900
gcatttcatc acaaggcccg agagctgcat ccggagtact acaaagactg caagcttgag 960
ccagtagatc ctagactaga gccctggaag catccaggaa gtcagcctag gaccccttgt 1020
accaattgct attgtaaaaa gtgttgcctt cattgccaag tttgtttcac aagaaaaggc 1080
ttaggcatct cctatggcag gaagaagcgg agacagcgac gaagagctcc tcaagacagt 1140
cagactcatc aagtttctct accaaagcaa ccctcctccc agcaacgagg ggacccgaca 1200
ggcccgaaga aatcgaagaa gaaggtggag agagagacag aggcagatcc gttcgattag 1260
<210>6
<211>1164
<212>DNA
<213>人工序列
<220>
<223>含有Nef-Tat-Rev的免疫显性部分的蛋白(NTR)
<400>6
atgggatggc ctactgtaag ggaaagaatg aaacaagctg agcctgagcc agcagcagat 60
ggggtgggag cagcatctcg agacctggaa aaacatggag caatcacaag tagcaataca 120
gcaactaata acgctgcttg tgcctggcta gaagcacaag aggaagagga agtgggtttt 180
ccagtcagac ctcaggtacc tttaagacca atgacttaca agggagcttt agatcttagc 240
cactttttaa aagaaaaggg gggactggaa gggttaattt actccccaaa aagacaagag 300
atccttgatc tgtgggtcta ccacacacaa ggctacttcc ctgattggca gaactacaca 360
ccagggccag gggtcagata tccactgacc tttggatggt gcttcaagtt agtaccagtt 420
gaaccagatg aagaagagaa cagcagcctg ttacaccctg cgagcctgca tgggacagag 480
gacacggaga gagaagtgtt aaagtggaag tttgacagcc atctagcatt tcatcacaag 540
gcccgagagc tgcatccgga gtactacaaa gactgcgctc tggccgccgt tgagccagta 600
gatcctagac tagagccctg gaagcatcca ggaagtcagc ctaggacccc ttgtaccaat 660
tgctattgta aaaagtgttg ccttcattgc caagtttgtt tcacaagaaa aggcttaggc 720
atctcctatg gcaggaagaa gcggagacag cgacgaagag ctcctcaaga cagtcagact 780
catcaagttt ctctaccaaa gcaaccctcc tcccagcaac gaggggaccc gacaggcccg 840
aagaaatccg gactggccat cctgctgagc gacgaagagc tcctcaagac agtcagactc 900
atcaagtttc tctaccaaag caaccctcct cccagcaacg aggggacccg acaggcccga 960
agaaatcgaa gaagaaggtg gagagagaga cagaggcaga tccgttcgat tagtgagcgg 1020
attcttagca cttttctggg acgacctgcg gagcctgtgc ctcttcagct accgccgctt 1080
gagagactta ctcttgattg tagcgaagat tgtggaaact ctgggacgca gggggtggga 1140
agtcctcaag tattggtgga atga 1164
<210>7
<211>1173
<212>DNA
<213>人工序列
<220>
<223>含有Nef-Tat-Rev的免疫显性部分的蛋白
由蛋白酶位点分离(NTR)
<400>7
atgggatggc ctactgtaag ggaaagaatg aaacaagctg agcctgagcc agcagcagat 60
ggggtgggag cagcatctcg agacctggaa aaacatggag caatcacaag tagcaataca 120
gcaactaata acgctgcttg tgcctggcta gaagcacaag aggaagagga agtgggtttt 180
ccagtcagac ctcaggtacc tttaagacca atgacttaca agggagcttt agatcttagc 240
cactttttaa aagaaaaggg gggactggaa gggttaattt actccccaaa aagacaagag 300
atccttgatc tgtgggtcta ccacacacaa ggctacttcc ctgattggca gaactacaca 360
ccagggccag gggtcagata tccactgacc tttggatggt gcttcaagtt agtaccagtt 420
gaaccagatg aagaagagaa cagcagcctg ttacaccctg cgagcctgca tgggacagag 480
gacacggaga gagaagtgtt aaagtggaag tttgacagcc atctagcatt tcatcacaag 540
gcccgagagc tgcatccgga gtactacaaa gactgcgctc tggccttcaa gcgggttgag 600
ccagtagatc ctagactaga gccctggaag catccaggaa gtcagcctag gaccccttgt 660
accaattgct attgtaaaaa gtgttgcctt cattgccaag tttgtttcac aagaaaaggc 720
ttaggcatct cctatggcag gaagaagcgg agacagcgac gaagagctcc tcaagacagt 780
cagactcatc aagtttctct accaaagcaa ccctcctccc agcaacgagg ggacccgaca 840
ggcccgaaga aatccgtacg ggagaagcgg ctgctgagcg acgaagagct cctcaagaca 900
gtcagactca tcaagtttct ctaccaaagc aaccctcctc ccagcaacgaggggacccga 960
caggcccgaa gaaatcgaag aagaaggtgg agagagagac agaggcagat ccgttcgatt 1020
agtgagcgga ttcttagcac ttttctggga cgacctgcgg agcctgtgcc tcttcagcta 1080
ccgccgcttg agagacttac tcttgattgt agcgaagatt gtggaaactc tgggacgcag 1140
ggggtgggaa gtcctcaagt attggtggaa tga 1173
<210>8
<211>1161
<212>DNA
<213>人工序列
<220>
<223>含有Nef-Tat-Rev调节蛋白的免疫显性部分的蛋白,从Nef的aal(N11TR)
<400>8
atgtggccta ctgtaaggga aagaatgaaa caagctgagc ctgagccagc agcagatggg 60
gtgggagcag catctcgaga cctggaaaaa catggagcaa tcacaagtag caatacagca 120
actaataacg ctgcttgtgc ctggctagaa gcacaagagg aagaggaagt gggttttcca 180
gtcagacctc aggtaccttt aagaccaatg acttacaagg gagctttaga tcttagccac 240
tttttaaaag aaaagggggg actggaaggg ttaatttact ccccaaaaag acaagagatc 300
cttgatctgt gggtctacca cacacaaggc tacttccctg attggcagaa ctacacacca 360
gggccagggg tcagatatcc actgaccttt ggatggtgct tcaagttagt accagttgaa 420
ccagatgaag aagagaacag cagcctgtta caccctgcga gcctgcatgg gacagaggac 480
acggagagag aagtgttaaa gtggaagttt gacagccatc tagcatttca tcacaaggcc 540
cgagagctgc atccggagta ctacaaagac tgcgctctgg ccgccgttga gccagtagat 600
cctagactag agccctggaa gcatccagga agtcagccta ggaccccttg taccaattgc 660
tattgtaaaa agtgttgcct tcattgccaa gtttgtttca caagaaaagg cttaggcatc 720
tcctatggca ggaagaagcg gagacagcga cgaagagctc ctcaagacag tcagactcat 780
caagtttctc taccaaagca accctcctcc cagcaacgag gggacccgac aggcccgaag 840
aaatccggac tggccatcct gctgagcgac gaagagctcc tcaagacagt cagactcatc 900
aagtttctct accaaagcaa ccctcctccc agcaacgagg ggacccgaca ggcccgaaga 960
aatcgaagaa gaaggtggag agagagacag aggcagatcc gttcgattag tgagcggatt 1020
cttagcactt ttctgggacg acctgcggag cctgtgcctc ttcagctacc gccgcttgag 1080
agacttactc ttgattgtag cgaagattgt ggaaactctg ggacgcaggg ggtgggaagt 1140
cctcaagtat tggtggaatg a 1161
<210>9
<211>1170
<212>DNA
<213>人工序列
<220>
<223>由蛋白酶位点分离(N11TR)的含有调节蛋白Nef-Tat-Rev的免疫显性部分的蛋白Nef的aal
<400>9
atgtggccta ctgtaaggga aagaatgaaa caagctgagc ctgagccagc agcagatggg 60
gtgggagcag catctcgaga cctggaaaaa catggagcaa tcacaagtag caatacagca 120
actaataacg ctgcttgtgc ctggctagaa gcacaagagg aagaggaagt gggttttcca 180
gtcagacctc aggtaccttt aagaccaatg acttacaagg gagctttaga tcttagccac 240
tttttaaaag aaaagggggg actggaaggg ttaatttact ccccaaaaag acaagagatc 300
cttgatctgt gggtctacca cacacaaggc tacttccctg attggcagaa ctacacacca 360
gggccagggg tcagatatcc actgaccttt ggatggtgct tcaagttagt accagttgaa 420
ccagatgaag aagagaacag cagcctgtta caccctgcga gcctgcatgg gacagaggac 480
acggagagag aagtgttaaa gtggaagttt gacagccatc tagcatttca tcacaaggcc 540
cgagagctgc atccggagta ctacaaagac tgcgctctgg ccttcaagcg ggttgagcca 600
gtagatccta gactagagcc ctggaagcat ccaggaagtc agcctaggac cccttgtacc 660
aattgctatt gtaaaaagtg ttgccttcat tgccaagttt gtttcacaag aaaaggctta 720
ggcatctcct atggcaggaa gaagcggaga cagcgacgaa gagctcctca agacagtcag 780
actcatcaag tttctctacc aaagcaaccc tcctcccagc aacgagggga cccgacaggc 840
ccgaagaaat ccgtacggga gaagcggctg ctgagcgacg aagagctcct caagacagtc 900
agactcatca agtttctcta ccaaagcaac cctcctccca gcaacgaggg gacccgacag 960
gcccgaagaa atcgaagaag aaggtggaga gagagacaga ggcagatccg ttcgattagt 1020
gagcggattc ttagcacttt tctgggacga cctgcggagc ctgtgcctct tcagctaccg 1080
ccgcttgaga gacttactct tgattgtagc gaagattgtg gaaactctgg gacgcagggg 1140
gtgggaagtc ctcaagtatt ggtggaatga 1170
<210>10
<211>663
<212>DNA
<213>人工序列
<220>
<223>含有细胞毒性T-细胞表位Pol和Env基因的蛋白(CTL)
<400>10
atgatcaccc tgtggcagcg ccccctggtg gccctgatcg agatctgcac cgagatggag 60
aaggagggca agatcagcaa gatcggcccc gccggcctga agaagaagaa gagcgtgacc 120
gtgctggacg tgggcgacgc ctacttcagc gtgcccctgg ataaggactt ccgcaagtac 180
accgccttca ccatccccag catctggaag ggcagccccg ccatcttcca gagcagcatg 240
accaagaagc agaaccccga catcgtgatc taccagtaca tggacgacct gtacgtgccc 300
atcgtgctgc ccgagaagga cagctggctg gtgggcaagc tgaactgggc cagccagatc 360
tacgccggca tcaaggtgaa gcagctgatc ctgaaggagc ccgtgcacgg cgtgtacgag 420
cccatcgtgg gcgccgagac cttctacgtg gacggcgccg ccaaccgcgc cggcaacctg 480
tgggtgaccg tgtactacgg cgtgcccgtg tggaaggagg ccaccaccac cctggtggag 540
cgctacctgc gcgaccagca gctgctgggc atctggggct gcgcctgcac cccctacgac 600
atcaaccaga tgctgcgcgg ccctggccgc gccttcgtga ccatccgcca gggcagcctg 660
tag 663
<210>11
<211>1266
<212>DNA
<213>人工序列
<220>
<223>截短的Gag蛋白序列(dgag)
<400>11
atgttagaca aatgggaaaa aattcggtta aggccagggg gaaagaaaaa atatcaatta 60
aaacatatag tatgggcaag cagggagcta gaacgattcg cagttaatcc tggcctgtta 120
gaaacatcag aaggctgtag acagataatg ggacagctac aaccgtccct tcagacagga 180
tcagaagaac ttagatcatt atataataca gtagcaaccc tctattgtgt gcatcaaaag 240
atagaggtaa aagacaccaa ggaagcttta gacaaggtag aggaagagca aaacaacagt 300
aagaaaaagg cacagcaaga agcagctgac gcaggaaaca gaaaccaggt cagccaaaat 360
taccctatag tgcaaaacct acagggacaa atggtacatc aggccatatc acctagaact 420
ttaaatgcat gggtaaaagt agtggaagag aaggctttca gcccagaagt aatacccatg 480
ttttcagcat tatcagaagg agccacccca caagatttaa acaccatgct aaacacagtg 540
gggggacatc aagcagccat gcaaatgtta aaagaaacca tcaatgagga agctgcagaa 600
tgggatagat tgcacccagt gcatgcaggg cctattgcac caggccagat gagagaacca 660
aggggaagtg acatagcagg aactactagt acccttcagg aacaaatagg atggatgaca 720
aataatccac ctatcccagt aggagaaata tataagagat ggataatcct gggattaaat 780
aaaatagtaa gaatgtatag ccctaccagc attctggata taaaacaagg accaaaagaa 840
ccctttagag attatgtaga ccggttctat aaaaccctaa gagccgagca agctacacag 900
gaagtaaaaa attggatgac agaaaccttg ttggtccaaa atgcgaatcc agattgtaag 960
actattttaa aagcattagg accagcagct acactagaag aaatgatgac agcatgtcag 1020
ggagtggggg gacccggcca taaagcaaga gttttggctg aagcaatgag ccaagtaaca 1080
ggttcagctg ccataatgat gcagagaggc aattttagga accaaagaaa gactgttaag 1140
tgtttcaatt gtggcaaaga agggcacata gccagaaatt gcagggcccc taggaaaaag 1200
ggctgttgga aatgtggaaa ggaaggacat caaatgaagg attgcacaga aagacaggct 1260
aattag 1266
<210>12
<211>1092
<212>DNA
<213>人工序列
<220>
<223>Gag基因的p17/24蛋白的合成编码序列(syn 17/24)
<400>12
atgggcgcaa gagcctccgt gctgagcggc ggagagctgg acaagtggga gaagatccgc 60
ctgcgccccg gcggcaagaa gaagtaccag ctgaagcaca tcgtgtgggc cagccgcgag 120
ctggagcgct tcgccgtgaa ccccggcctg ctcgagacca gcgaaggctg ccgccagatc 180
atgggccagc tccagcccag cctccagacc ggcagcgagg agctgcgcag cctgtacaac 240
accgtggcca ccctgtactg cgtgcaccag aagatcgagg tgaaggacac caaggaggcc 300
ctggacaagg tggaggagga gcagaacaac agcaagaaga aggcccagca ggaggccgcc 360
gacgccggca accgcaacca ggtgagccag aactacccca tcgtgcagaa cctgcagggc 420
cagatggtgc accaggccat cagcccccgc accctgaacg cctgggtgaa ggtggtggag 480
gagaaggcct tcagccccga ggtgatcccc atgttcagcg ccctgagcga gggcgctacc 540
ccccaggacc tgaacaccat gctgaacacc gtgggcggcc accaggccgc catgcagatg 600
ctgaaggaga ccatcaacga ggaggccgcc gagtgggacc gcctgcaccc cgtgcacgcc 660
gggcccatcg cccccggcca gatgcgcgag ccccgcggca gcgacatcgc cggcaccacc 720
agcaccctcc aggagcagat cggctggatg accaacaacc cccccatccc cgtgggcgag 780
atctacaagc gctggatcat cctgggcctg aacaagatcg tccgcatgta cagccccacc 840
agcatcctgg acatcaagca gggccccaag gagcccttcc gcgactacgt ggaccgcttc 900
tacaagaccc tgcgcgccga gcaggccacc caggaggtga agaactggat gaccgagacc 960
ctgctggtgc agaacgccaa ccccgactgc aagaccatcc tcaaggccct gggacccgcc 1020
gccaccctgg aggagatgat gaccgcctgc caaggcgtgg gcggccccgg ccacaaggcc 1080
cgcgtgctgt ga 1092
<210>13
<211>1092
<212>DNA
<213>人工序列
<223>用于在真核细胞表达的最好的Gag基因的p17/24蛋白的合成编码序列(optp17/24)
<400>13
atgggcgcaa gagcctccgt gctgagcggc ggagagctgg acaagtggga gaagatccgc 60
ctgcgccccg gcggcaagaa gaagtaccag ctgaagcaca tcgtgtgggc cagccgcgag 120
ctggagcgct tcgccgtgaa ccccggcctg ctcgagacca gcgaaggctg ccgccagatc 180
atgggccagc tccagcccag cctccagacc ggcagcgagg agctgcgcag cctgtacaac 240
accgtggcca ccctgtactg cgtgcaccag aagatcgagg tgaaggacac caaggaggcc 300
ctggacaagg tggaggagga gcagaacaac agcaagaaga aggcccagca ggaggccgcc 360
gacgccggca accgcaacca agtcagccag aactacccca tcgtgcagaa cctgcagggc 420
cagatggtgc accaggccat cagcccccgc accctgaacg cctgggtgaa ggtggtggag 480
gagaaggcct tcagccccga ggtgatcccc atgttcagcg ccctgagcga gggcgctacc 540
ccccaggacc tgaacaccat gctgaacacc gtgggcggcc accaggccgc catgcagatg 600
ctgaaggaga ccatcaacga ggaggccgcc gagtgggacc gcctgcaccc cgtgcacgcc 660
gggcccatcg cccccggcca gatgcgcgag ccccgcggca gcgacatcgc cggcaccacc 720
agcaccctcc aggagcagat cggctggatg accaacaacc cccccatccc cgtgggcgag 780
atctacaagc gctggatcat cctgggcctg aacaagatcg tccgcatgta cagccccacc 840
agcatcctgg acatcaagca gggccccaag gagcccttcc gcgactacgt ggaccgcttc 900
tacaagaccc tgcgcgccga gcaggccacc caggaggtga agaactggat gaccgagacc 960
ctgctggtgc agaacgccaa ccccgactgc aagaccatcc tcaaggccct gggacccgcc 1020
gccaccctgg aggagatgat gaccgcctgc caaggcgtgg gcggccccgg ccacaaggcc 1080
cgcgtgctgt ga 1092
<210>14
<211>1926
<212>DNA
<213>人工序列
<220>
<223>含有Tat-Rev-Nef和CTL(TRN-CTL)的杂交蛋白编码序列
<400>14
atggagccag tagatcctag actagagccc tggaagcatc caggaagtca gcctaggacc 60
ccttgtacca attgctattg taaaaagtgt tgccttcatt gccaagtttg tttcacaaga 120
aaaggcttag gcatctccta tggcaggaag aagcggagac agcgacgaag agctcctcaa 180
gacagtcaga ctcatcaagt ttctctacca aagcaaccct cctcccagca acgaggggac 240
ccgacaggcc cgaagaaatc gaagaagaag gtggagagag agacagaggc agatccgttc 300
gatactagtg caggaagaag cggagacagc gacgaagagc tcctcaagac agtcagactc 360
atcaagtttc tctaccaaag caaccctcct cccagcaacg aggggacccg acaggcccga 420
agaaatcgaa gaagaaggtg gagagagaga cagaggcaga tccgttcgat tagtgagcgg 480
attcttagca cttttctggg acgacctgcg gagcctgtgc ctcttcagct accgccgctt 540
gagagactta ctcttgattg tagcgaagat tgtggaaact ctgggacgca gggggtggga 600
agtcctcaag tattggtgga atctcctgca gtattggagc caggaactaa agaaaagctt 660
gtgggcaagt ggtcaaaatg tagtggatgg cctactgtaa gggaaagaat gaaacaagct 720
gagcctgagc cagcagcaga tggggtggga gcagcatctc gagacctgga aaaacatgga 780
gcaatcacaa gtagcaatac agcaactaat aacgctgctt gtgcctggct agaagcacaa 840
gaggaagagg aagtgggttt tccagtcaga cctcaggtac ctttaagacc aatgacttac 900
aagggagctt tagatcttag ccacttttta aaagaaaagg ggggactgga agggttaatt 960
tactccccaa aaagacaaga gatccttgat ctgtgggtct accacacaca aggctacttc 1020
cctgattggc agaactacac accagggcca ggggtcagat atccactgac ctttggatgg 1080
tgcttcaagt tagtaccagt tgaaccagat gaagaagaga acagcagcct gttacaccct 1140
gcgagcctgc atgggacaga ggacacggag agagaagtgt taaagtggaa gtttgacagc 1200
catctagcat ttcatcacaa ggcccgagag ctgcatccgg agtactacaa agactgcgcg 1260
gccgtcatca ccctgtggca gcgccccctg gtggccctga tcgagatctg caccgagatg 1320
gagaaggagg gcaagatcag caagatcggc cccgccggcc tgaagaagaa gaagagcgtg 1380
accgtgctgg acgtgggcga cgcctacttc agcgtgcccc tggataagga cttccgcaag 1440
tacaccgcct tcaccatccc cagcatctgg aagggcagcc ccgccatctt ccagagcagc 1500
atgaccaaga agcagaaccc cgacatcgtg atctaccagt acatggacga cctgtacgtg 1560
cccatcgtgc tgcccgagaa ggacagctgg ctggtgggca agctgaactg ggccagccag 1620
atctacgccg gcatcaaggt gaagcagctg atcctgaagg agcccgtgca cggcgtgtac 1680
gagcccatcg tgggcgccga gaccttctac gtggacggcg ccgccaaccg cgccggcaac 1740
ctgtgggtga ccgtgtacta cggcgtgccc gtgtggaagg aggccaccac caccctggtg 1800
gagcgctacc tgcgcgacca gcagctgctg ggcatctggg gctgcgcctg caccccctac 1860
gacatcaacc agatgctgcg cggccctggc cgcgccttcg tgaccatccg ccagggcagc 1920
ctgtag 1926
<210>15
<211>1926
<212>DNA
<213>人工序列
<220>
<223>含有Rev-Nef-Tat和CTL(RNT-CTL)的杂交蛋白编码序列
<400>15
atggcaggaa gaagcggaga cagcgacgaa gagctcctca agacagtcag actcatcaag 60
tttctctacc aaagcaaccc tcctcccagc aacgagggga cccgacaggc ccgaagaaat 120
cgaagaagaa ggtggagaga gagacagagg cagatccgtt cgattagtga gcggattctt 180
agcacttttc tgggacgacc tgcggagcct gtgcctcttc agctaccgcc gcttgagaga 240
cttactcttg attgtagcga agattgtgga aactctggga cgcagggggt gggaagtcct 300
caagtattgg tggaatctcc tgcagtattg gagccaggaa ctaaagaaac tagtgtgggc 360
aagtggtcaa aatgtagtgg atggcctact gtaagggaaa gaatgaaaca agctgagcct 420
gagccagcag cagatggggt gggagcagca tctcgagacc tggaaaaaca tggagcaatc 480
acaagtagca atacagcaac taataacgct gcttgtgcct ggctagaagc acaagaggaa 540
gaggaagtgg gttttccagt cagacctcag gtacctttaa gaccaatgac ttacaaggga 600
gctttagatc ttagccactt tttaaaagaa aaggggggac tggaagggtt aatttactcc 660
ccaaaaagac aagagatcct tgatctgtgg gtctaccaca cacaaggcta cttccctgat 720
tggcagaact acacaccagg gccaggggtc agatatccac tgacctttgg atggtgcttc 780
aagttagtac cagttgaacc agatgaagaa gagaacagca gcctgttaca ccctgcgagc 840
ctgcatggga cagaggacac ggagagagaa gtgttaaagt ggaagtttga cagccatcta 900
gcatttcatc acaaggcccg agagctgcat ccggagtact acaaagactg caagcttgag 960
ccagtagatc ctagactaga gccctggaag catccaggaa gtcagcctag gaccccttgt 1020
accaattgct attgtaaaaa gtgttgcctt cattgccaag tttgtttcac aagaaaaggc 1080
ttaggcatct cctatggcag gaagaagcgg agacagcgac gaagagctcc tcaagacagt 1140
cagactcatc aagtttctct accaaagcaa ccctcctccc agcaacgagg ggacccgaca 1200
ggcccgaaga aatcgaagaa gaaggtggag agagagacag aggcagatcc gttcgatgcg 1260
gccgtcatca ccctgtggca gcgccccctg gtggccctga tcgagatctg caccgagatg 1320
gagaaggagg gcaagatcag caagatcggc cccgccggcc tgaagaagaa gaagagcgtg 1380
accgtgctgg acgtgggcga cgcctacttc agcgtgcccc tggataagga cttccgcaag 1440
tacaccgcct tcaccatccc cagcatctgg aagggcagcc ccgccatctt ccagagcagc 1500
atgaccaaga agcagaaccc cgacatcgtg atctaccagt acatggacga cctgtacgtg 1560
cccatcgtgc tgcccgagaa ggacagctgg ctggtgggca agctgaactg ggccagccag 1620
atctacgccg gcatcaaggt gaagcagctg atcctgaagg agcccgtgca cggcgtgtac 1680
gagcccatcg tgggcgccga gaccttctac gtggacggcg ccgccaaccg cgccggcaac 1740
ctgtgggtga ccgtgtacta cggcgtgccc gtgtggaagg aggccaccac caccctggtg 1800
gagcgctacc tgcgcgacca gcagctgctg ggcatctggg gctgcgcctg caccccctac 1860
gacatcaacc agatgctgcg cggccctggc cgcgccttcg tgaccatccg ccagggcagc 1920
ctgtag 1926
<210>16
<211>2529
<212>DNA
<213>人工序列
<220>
<223>含有Tat-Rev-Nef和截短的蛋白(TRN-dgag)的杂交蛋白编码序列
<400>16
atggagccag tagatcctag actagagccc tggaagcatc caggaagtca gcctaggacc 60
ccttgtacca attgctattg taaaaagtgt tgccttcatt gccaagtttg tttcacaaga 120
aaaggcttag gcatctccta tggcaggaag aagcggagac agcgacgaag agctcctcaa 180
gacagtcaga ctcatcaagt ttctctacca aagcaaccct cctcccagca acgaggggac 240
ccgacaggcc cgaagaaatc gaagaagaag gtggagagag agacagaggc agatccgttc 300
gatactagtg caggaagaag cggagacagc gacgaagagc tcctcaagac agtcagactc 360
atcaagtttc tctaccaaag caaccctcct cccagcaacg aggggacccg acaggcccga 420
agaaatcgaa gaagaaggtg gagagagaga cagaggcaga tccgttcgat tagtgagcgg 480
attcttagca cttttctggg acgacctgcg gagcctgtgc ctcttcagct accgccgctt 540
gagagactta ctcttgattg tagcgaagat tgtggaaact ctgggacgca gggggtggga 600
agtcctcaag tattggtgga atctcctgca gtattggagc caggaactaa agaaaagctt 660
gtgggcaagt ggtcaaaatg tagtggatgg cctactgtaa gggaaagaat gaaacaagct 720
gagcctgagc cagcagcaga tggggtggga gcagcatctc gagacctgga aaaacatgga 780
gcaatcacaa gtagcaatac agcaactaat aacgctgctt gtgcctggct agaagcacaa 840
gaggaagagg aagtgggttt tccagtcaga cctcaggtac ctttaagacc aatgacttac 900
aagggagctt tagatcttag ccacttttta aaagaaaagg ggggactgga agggttaatt 960
tactccccaa aaagacaaga gatccttgat ctgtgggtct accacacaca aggctacttc 1020
cctgattggc agaactacac accagggcca ggggtcagat atccactgac ctttggatgg 1080
tgcttcaagt tagtaccagt tgaaccagat gaagaagaga acagcagcct gttacaccct 1140
gcgagcctgc atgggacaga ggacacggag agagaagtgt taaagtggaa gtttgacagc 1200
catctagcat ttcatcacaa ggcccgagag ctgcatccgg agtactacaa agactgcgcg 1260
gccgtgttag acaaatggga aaaaattcgg ttaaggccag ggggaaagaa aaaatatcaa 1320
ttaaaacata tagtatgggc aagcagggag ctagaacgat tcgcagttaa tcctggcctg 1380
ttagaaacat cagaaggctg tagacagata atgggacagc tacaaccgtc ccttcagaca 1440
ggatcagaag aacttagatc attatataat acagtagcaa ccctctattg tgtgcatcaa 1500
aagatagagg taaaagacac caaggaagct ttagacaagg tagaggaaga gcaaaacaac 1560
agtaagaaaa aggcacagca agaagcagct gacgcaggaa acagaaacca ggtcagccaa 1620
aattacccta tagtgcaaaa cctacaggga caaatggtac atcaggccat atcacctaga 1680
actttaaatg catgggtaaa agtagtggaa gagaaggctt tcagcccaga agtaataccc 1740
atgttttcag cattatcaga aggagccacc ccacaagatt taaacaccat gctaaacaca 1800
gtggggggac atcaagcagc catgcaaatg ttaaaagaaa ccatcaatga ggaagctgca 1860
gaatgggata gattgcaccc agtgcatgca gggcctattg caccaggcca gatgagagaa 1920
ccaaggggaa gtgacatagc aggaactact agtacccttc aggaacaaat aggatggatg 1980
acaaataatc cacctatccc agtaggagaa atatataaga gatggataat cctgggatta 2040
aataaaatag taagaatgta tagccctacc agcattctgg atataaaaca aggaccaaaa 2100
gaacccttta gagattatgt agaccggttc tataaaaccc taagagccga gcaagctaca 2160
caggaagtaa aaaattggat gacagaaacc ttgttggtcc aaaatgcgaa tccagattgt 2220
aagactattt taaaagcatt aggaccagca gctacactag aagaaatgat gacagcatgt 2280
cagggagtgg ggggacccgg ccataaagca agagttttgg ctgaagcaat gagccaagta 2340
acaggttcag ctgccataat gatgcagaga ggcaatttta ggaaccaaag aaagactgtt 2400
aagtgtttca attgtggcaa agaagggcac atagccagaa attgcagggc ccctaggaaa 2460
aagggctgtt ggaaatgtgg aaaggaagga catcaaatga aggattgcac agaaagacag 2520
gctaattag 2529
<210>17
<211>3195
<212>DNA
<213>人工序列
<220>
<223>含有Tat-Rev-Nef CTL和截短的Gag蛋白(TRN-CTL-dgag)的杂交蛋白编码序列,
<400>17
atggagccag tagatcctag actagagccc tggaagcatc caggaagtca gcctaggacc 60
ccttgtacca attgctattg taaaaagtgt tgccttcatt gccaagtttg tttcacaaga 120
aaaggcttag gcatctccta tggcaggaag aagcggagac agcgacgaag agctcctcaa 180
gacagtcaga ctcatcaagt ttctctacca aagcaaccct cctcccagca acgaggggac 240
ccgacaggcc cgaagaaatc gaagaagaag gtggagagag agacagaggc agatccgttc 300
gatactagtg caggaagaag cggagacagc gacgaagagc tcctcaagac agtcagactc 360
atcaagtttc tctaccaaag caaccctcct cccagcaacg aggggacccg acaggcccga 420
agaaatcgaa gaagaaggtg gagagagaga cagaggcaga tccgttcgat tagtgagcgg 480
attcttagca cttttctggg acgacctgcg gagcctgtgc ctcttcagct accgccgctt 540
gagagactta ctcttgattg tagcgaagat tgtggaaact ctgggacgca gggggtggga 600
agtcctcaag tattggtgga atctcctgca gtattggagc caggaactaa agaaaagctt 660
gtgggcaagt ggtcaaaatg tagtggatgg cctactgtaa gggaaagaat gaaacaagct 720
gagcctgagc cagcagcaga tggggtggga gcagcatctc gagacctgga aaaacatgga 780
gcaatcacaa gtagcaatac agcaactaat aacgctgctt gtgcctggct agaagcacaa 840
gaggaagagg aagtgggttt tccagtcaga cctcaggtac ctttaagacc aatgacttac 900
aagggagctt tagatcttag ccacttttta aaagaaaagg ggggactgga agggttaatt 960
tactccccaa aaagacaaga gatccttgat ctgtgggtct accacacaca aggctacttc 1020
cctgattggc agaactacac accagggcca ggggtcagat atccactgac ctttggatgg 1080
tgcttcaagt tagtaccagt tgaaccagat gaagaagaga acagcagcct gttacaccct 1140
gcgagcctgc atgggacaga ggacacggag agagaagtgt taaagtggaa gtttgacagc 1200
catctagcat ttcatcacaa ggcccgagag ctgcatccgg agtactacaa agactgcgcg 1260
gccgtcatca ccctgtggca gcgccccctg gtggccctga tcgagatctg caccgagatg 1320
gagaaggagg gcaagatcag caagatcggc cccgccggcc tgaagaagaa gaagagcgtg 1380
accgtgctgg acgtgggcga cgcctacttc agcgtgcccc tggataagga cttccgcaag 1440
tacaccgcct tcaccatccc cagcatctgg aagggcagcc ccgccatctt ccagagcagc 1500
atgaccaaga agcagaaccc cgacatcgtg atctaccagt acatggacga cctgtacgtg 1560
cccatcgtgc tgcccgagaa ggacagctgg ctggtgggca agctgaactg ggccagccag 1620
atctacgccg gcatcaaggt gaagcagctg atcctgaagg agcccgtgca cggcgtgtac 1680
gagcccatcg tgggcgccga gaccttctac gtggacggcg ccgccaaccg cgccggcaac 1740
ctgtgggtga ccgtgtacta cggcgtgccc gtgtggaagg aggccaccac caccctggtg 1800
gagcgctacc tgcgcgacca gcagctgctg ggcatctggg gctgcgcctg caccccctac 1860
gacatcaacc agatgctgcg cggccctggc cgcgccttcg tgaccatccg ccagggcagc 1920
ctggcggccg tgttagacaa atgggaaaaa attcggttaa ggccaggggg aaagaaaaaa 1980
tatcaattaa aacatatagt atgggcaagc agggagctag aacgattcgc agttaatcct 2040
ggcctgttag aaacatcaga aggctgtaga cagataatgg gacagctaca accgtccctt 2100
cagacaggat cagaagaact tagatcatta tataatacag tagcaaccct ctattgtgtg 2160
catcaaaaga tagaggtaaa agacaccaag gaagctttag acaaggtaga ggaagagcaa 2220
aacaacagta agaaaaaggc acagcaagaa gcagctgacg caggaaacag aaaccaggtc 2280
agccaaaatt accctatagt gcaaaaccta cagggacaaa tggtacatca ggccatatca 2340
cctagaactt taaatgcatg ggtaaaagta gtggaagaga aggctttcag cccagaagta 2400
atacccatgt tttcagcatt atcagaagga gccaccccac aagatttaaa caccatgcta 2460
aacacagtgg ggggacatca agcagccatg caaatgttaa aagaaaccat caatgaggaa 2520
gctgcagaat gggatagatt gcacccagtg catgcagggc ctattgcacc aggccagatg 2580
agagaaccaa ggggaagtga catagcagga actactagta cccttcagga acaaatagga 2640
tggatgacaa ataatccacc tatcccagta ggagaaatat ataagagatg gataatcctg 2700
ggattaaata aaatagtaag aatgtatagc cctaccagca ttctggatat aaaacaagga 2760
ccaaaagaac cctttagaga ttatgtagac cggttctata aaaccctaag agccgagcaa 2820
gctacacagg aagtaaaaaa ttggatgaca gaaaccttgt tggtccaaaa tgcgaatcca 2880
gattgtaaga ctattttaaa agcattagga ccagcagcta cactagaaga aatgatgaca 2940
gcatgtcagg gagtgggggg acccggccat aaagcaagag ttttggctga agcaatgagc 3000
caagtaacag gttcagctgc cataatgatg cagagaggca attttaggaa ccaaagaaag 3060
actgttaagt gtttcaattg tggcaaagaa gggcacatag ccagaaattg cagggcccct 3120
aggaaaaagg gctgttggaa atgtggaaag gaaggacatc aaatgaagga ttgcacagaa 3180
agacaggcta attag 3195
<210>18
<211>3195
<212>DNA
<213>人工序列
<220>
<223>含有Rev-Nef-Tat,CTL和截短的Gag蛋白(RNT-CTL-dgag)的杂交蛋白编码序列
<400>18
atggcaggaa gaagcggaga cagcgacgaa gagctcctca agacagtcag actcatcaag 60
tttctctacc aaagcaaccc tcctcccagc aacgagggga cccgacaggc ccgaagaaat 120
cgaagaagaa ggtggagaga gagacagagg cagatccgtt cgattagtga gcggattctt 180
agcacttttc tgggacgacc tgcggagcct gtgcctcttc agctaccgcc gcttgagaga 240
cttactcttg attgtagcga agattgtgga aactctggga cgcagggggt gggaagtcct 300
caagtattgg tggaatctcc tgcagtattg gagccaggaa ctaaagaaac tagtgtgggc 360
aagtggtcaa aatgtagtgg atggcctact gtaagggaaa gaatgaaaca agctgagcct 420
gagccagcag cagatggggt gggagcagca tctcgagacc tggaaaaaca tggagcaatc 480
acaagtagca atacagcaac taataacgct gcttgtgcct ggctagaagc acaagaggaa 540
gaggaagtgg gttttccagt cagacctcag gtacctttaa gaccaatgac ttacaaggga 600
gctttagatc ttagccactt tttaaaagaa aaggggggac tggaagggtt aatttactcc 660
ccaaaaagac aagagatcct tgatctgtgg gtctaccaca cacaaggcta cttccctgat 720
tggcagaact acacaccagg gccaggggtc agatatccac tgacctttgg atggtgcttc 780
aagttagtac cagttgaacc agatgaagaa gagaacagca gcctgttaca ccctgcgagc 840
ctgcatggga cagaggacac ggagagagaa gtgttaaagt ggaagtttga cagccatcta 900
gcatttcatc acaaggcccg agagctgcat ccggagtact acaaagactg caagcttgag 960
ccagtagatc ctagactaga gccctggaag catccaggaa gtcagcctag gaccccttgt 1020
accaattgct attgtaaaaa gtgttgcctt cattgccaag tttgtttcac aagaaaaggc 1080
ttaggcatct cctatggcag gaagaagcgg agacagcgac gaagagctcc tcaagacagt 1140
cagactcatc aagtttctct accaaagcaa ccctcctccc agcaacgagg ggacccgaca 1200
ggcccgaaga aatcgaagaa gaaggtggag agagagacag aggcagatcc gttcgatgcg 1260
gccgtcatca ccctgtggca gcgccccctg gtggccctga tcgagatctg caccgagatg 1320
gagaaggagg gcaagatcag caagatcggc cccgccggcc tgaagaagaa gaagagcgtg 1380
accgtgctgg acgtgggcga cgcctacttc agcgtgcccc tggataagga cttccgcaag 1440
tacaccgcct tcaccatccc cagcatctgg aagggcagcc ccgccatctt ccagagcagc 1500
atgaccaaga agcagaaccc cgacatcgtg atctaccagt acatggacga cctgtacgtg 1560
cccatcgtgc tgcccgagaa ggacagctgg ctggtgggca agctgaactg ggccagccag 1620
atctacgccg gcatcaaggt gaagcagctg atcctgaagg agcccgtgca cggcgtgtac 1680
gagcccatcg tgggcgccga gaccttctac gtggacggcg ccgccaaccg cgccggcaac 1740
ctgtgggtga ccgtgtacta cggcgtgccc gtgtggaagg aggccaccac caccctggtg 1800
gagcgctacc tgcgcgacca gcagctgctg ggcatctggg gctgcgcctg caccccctac 1860
gacatcaacc agatgctgcg cggccctggc cgcgccttcg tgaccatccg ccagggcagc 1920
ctggcggccg tgttagacaa atgggaaaaa attcggttaa ggccaggggg aaagaaaaaa 1980
tatcaattaa aacatatagt atgggcaagc agggagctag aacgattcgc agttaatcct 2040
ggcctgttag aaacatcaga aggctgtaga cagataatgg gacagctaca accgtccctt 2100
cagacaggat cagaagaact tagatcatta tataatacag tagcaaccct ctattgtgtg 2160
catcaaaaga tagaggtaaa agacaccaag gaagctttag acaaggtaga ggaagagcaa 2220
aacaacagta agaaaaaggc acagcaagaa gcagctgacg caggaaacag aaaccaggtc 2280
agccaaaatt accctatagt gcaaaaccta cagggacaaa tggtacatca ggccatatca 2340
cctagaactt taaatgcatg ggtaaaagta gtggaagaga aggctttcag cccagaagta 2400
atacccatgt tttcagcatt atcagaagga gccaccccac aagatttaaa caccatgcta 2460
aacacagtgg ggggacatca agcagccatg caaatgttaa aagaaaccat caatgaggaa 2520
gctgcagaat gggatagatt gcacccagtg catgcagggc ctattgcacc aggccagatg 2580
agagaaccaa ggggaagtga catagcagga actactagta cccttcagga acaaatagga 2640
tggatgacaa ataatccacc tatcccagta ggagaaatat ataagagatg gataatcctg 2700
ggattaaata aaatagtaag aatgtatagc cctaccagca ttctggatat aaaacaagga 2760
ccaaaagaac cctttagaga ttatgtagac cggttctata aaaccctaag agccgagcaa 2820
gctacacagg aagtaaaaaa ttggatgaca gaaaccttgt tggtccaaaa tgcgaatcca 2880
gattgtaaga ctattttaaa agcattagga ccagcagcta cactagaaga aatgatgaca 2940
gcatgtcagg gagtgggggg acccggccat aaagcaagag ttttggctga agcaatgagc 3000
caagtaacag gttcagctgc cataatgatg cagagaggca attttaggaa ccaaagaaag 3060
actgttaagt gtttcaattg tggcaaagaa gggcacatag ccagaaattg cagggcccct 3120
aggaaaaagg gctgttggaa atgtggaaag gaaggacatc aaatgaagga ttgcacagaa 3180
agacaggcta attag 3195
<210>19
<211>3195
<212>DNA
<213>人工序列
<220>
<223>含有Tat-Rev-Nef、截短的Gag蛋白和CTL(TRN-dgag-CTL)的杂交蛋白
<400>19
atggagccag tagatcctag actagagccc tggaagcatc caggaagtca gcctaggacc 60
ccttgtacca attgctattg taaaaagtgt tgccttcatt gccaagtttg tttcacaaga 120
aaaggcttag gcatctccta tggcaggaag aagcggagac agcgacgaag agctcctcaa 180
gacagtcaga ctcatcaagt ttctctacca aagcaaccct cctcccagca acgaggggac 240
ccgacaggcc cgaagaaatc gaagaagaag gtggagagag agacagaggc agatccgttc 300
gatactagtg caggaagaag cggagacagc gacgaagagc tcctcaagac agtcagactc 360
atcaagtttc tctaccaaag caaccctcct cccagcaacg aggggacccg acaggcccga 420
agaaatcgaa gaagaaggtg gagagagaga cagaggcaga tccgttcgat tagtgagcgg 480
attcttagca cttttctggg acgacctgcg gagcctgtgc ctcttcagct accgccgctt 540
gagagactta ctcttgattg tagcgaagat tgtggaaact ctgggacgca gggggtggga 600
agtcctcaag tattggtgga atctcctgca gtattggagc caggaactaa agaaaagctt 660
gtgggcaagt ggtcaaaatg tagtggatgg cctactgtaa gggaaagaat gaaacaagct 720
gagcctgagc cagcagcaga tggggtggga gcagcatctc gagacctgga aaaacatgga 780
gcaatcacaa gtagcaatac agcaactaat aacgctgctt gtgcctggct agaagcacaa 840
gaggaagagg aagtgggttt tccagtcaga cctcaggtac ctttaagacc aatgacttac 900
aagggagctt tagatcttag ccacttttta aaagaaaagg ggggactgga agggttaatt 960
tactccccaa aaagacaaga gatccttgat ctgtgggtct accacacaca aggctacttc 1020
cctgattggc agaactacac accagggcca ggggtcagat atccactgac ctttggatgg 1080
tgcttcaagt tagtaccagt tgaaccagat gaagaagaga acagcagcct gttacaccct 1140
gcgagcctgc atgggacaga ggacacggag agagaagtgt taaagtggaa gtttgacagc 1200
catctagcat ttcatcacaa ggcccgagag ctgcatccgg agtactacaa agactgcgcg 1260
gccgtgttag acaaatggga aaaaattcgg ttaaggccag ggggaaagaa aaaatatcaa 1320
ttaaaacata tagtatgggc aagcagggag ctagaacgat tcgcagttaa tcctggcctg 1380
ttagaaacat cagaaggctg tagacagata atgggacagc tacaaccgtc ccttcagaca 1440
ggatcagaag aacttagatc attatataat acagtagcaa ccctctattg tgtgcatcaa 1500
aagatagagg taaaagacac caaggaagct ttagacaagg tagaggaaga gcaaaacaac 1560
agtaagaaaa aggcacagca agaagcagct gacgcaggaa acagaaacca ggtcagccaa 1620
aattacccta tagtgcaaaa cctacaggga caaatggtac atcaggccat atcacctaga 1680
actttaaatg catgggtaaa agtagtggaa gagaaggctt tcagcccaga agtaataccc 1740
atgttttcag cattatcaga aggagccacc ccacaagatt taaacaccat gctaaacaca 1800
gtggggggac atcaagcagc catgcaaatg ttaaaagaaa ccatcaatga ggaagctgca 1860
gaatgggata gattgcaccc agtgcatgca gggcctattg caccaggcca gatgagagaa 1920
ccaaggggaa gtgacatagc aggaactact agtacccttc aggaacaaat aggatggatg 1980
acaaataatc cacctatccc agtaggagaa atatataaga gatggataat cctgggatta 2040
aataaaatag taagaatgta tagccctacc agcattctgg atataaaaca aggaccaaaa 2100
gaacccttta gagattatgt agaccggttc tataaaaccc taagagccga gcaagctaca 2160
caggaagtaa aaaattggat gacagaaacc ttgttggtcc aaaatgcgaa tccagattgt 2220
aagactattt taaaagcatt aggaccagca gctacactag aagaaatgat gacagcatgt 2280
cagggagtgg ggggacccgg ccataaagca agagttttgg ctgaagcaat gagccaagta 2340
acaggttcag ctgccataat gatgcagaga ggcaatttta ggaaccaaag aaagactgtt 2400
aagtgtttca attgtggcaa agaagggcac atagccagaa attgcagggc ccctaggaaa 2460
aagggctgtt ggaaatgtgg aaaggaagga catcaaatga aggattgcac agaaagacag 2520
gctaatgcgg ccgtcatcac cctgtggcag cgccccctgg tggccctgat cgagatctgc 2580
accgagatgg agaaggaggg caagatcagc aagatcggcc ccgccggcct gaagaagaag 2640
aagagcgtga ccgtgctgga cgtgggcgac gcctacttca gcgtgcccct ggataaggac 2700
ttccgcaagt acaccgcctt caccatcccc agcatctgga agggcagccc cgccatcttc 2760
cagagcagca tgaccaagaa gcagaacccc gacatcgtga tctaccagta catggacgac 2820
ctgtacgtgc ccatcgtgct gcccgagaag gacagctggc tggtgggcaa gctgaactgg 2880
gccagccaga tctacgccgg catcaaggtg aagcagctga tcctgaagga gcccgtgcac 2940
ggcgtgtacg agcccatcgt gggcgccgag accttctacg tggacggcgc cgccaaccgc 3000
gccggcaacc tgtgggtgac cgtgtactac ggcgtgcccg tgtggaagga ggccaccacc 3060
accctggtgg agcgctacct gcgcgaccag cagctgctgg gcatctgggg ctgcgcctgc 3120
accccctacg acatcaacca gatgctgcgc ggccctggcc gcgccttcgt gaccatccgc 3180
cagggcagcc tgtag 3195
<210>20
<211>3195
<212>DNA
<213>人工序列
<220>
<223>含有Rev-Nef-Tat,截短的Gag蛋白和CTL(RNT-dgag-CTL)的杂交蛋白编码序列
<400>20
atggcaggaa gaagcggaga cagcgacgaa gagctcctca agacagtcag actcatcaag 60
tttctctacc aaagcaaccc tcctcccagc aacgagggga cccgacaggc ccgaagaaat 120
cgaagaagaa ggtggagaga gagacagagg cagatccgtt cgattagtga gcggattctt 180
agcacttttc tgggacgacc tgcggagcct gtgcctcttc agctaccgcc gcttgagaga 240
cttactcttg attgtagcga agattgtgga aactctggga cgcagggggt gggaagtcct 300
caagtattgg tggaatctcc tgcagtattg gagccaggaa ctaaagaaac tagtgtgggc 360
aagtggtcaa aatgtagtgg atggcctact gtaagggaaa gaatgaaaca agctgagcct 420
gagccagcag cagatggggt gggagcagca tctcgagacc tggaaaaaca tggagcaatc 480
acaagtagca atacagcaac taataacgct gcttgtgcct ggctagaagc acaagaggaa 540
gaggaagtgg gttttccagt cagacctcag gtacctttaa gaccaatgac ttacaaggga 600
gctttagatc ttagccactt tttaaaagaa aaggggggac tggaagggtt aatttactcc 660
ccaaaaagac aagagatcct tgatctgtgg gtctaccaca cacaaggcta cttccctgat 720
tggcagaact acacaccagg gccaggggtc agatatccac tgacctttgg atggtgcttc 780
aagttagtac cagttgaacc agatgaagaa gagaacagca gcctgttaca ccctgcgagc 840
ctgcatggga cagaggacac ggagagagaa gtgttaaagt ggaagtttga cagccatcta 900
gcatttcatc acaaggcccg agagctgcat ccggagtact acaaagactg caagcttgag 960
ccagtagatc ctagactaga gccctggaag catccaggaa gtcagcctag gaccccttgt 1020
accaattgct attgtaaaaa gtgttgcctt cattgccaag tttgtttcac aagaaaaggc 1080
ttaggcatct cctatggcag gaagaagcgg agacagcgac gaagagctcc tcaagacagt 1140
cagactcatc aagtttctct accaaagcaa ccctcctccc agcaacgagg ggacccgaca 1200
ggcccgaaga aatcgaagaa gaaggtggag agagagacag aggcagatcc gttcgatgcg 1260
gccgtgttag acaaatggga aaaaattcgg ttaaggccag ggggaaagaa aaaatatcaa 1320
ttaaaacata tagtatgggc aagcagggag ctagaacgat tcgcagttaa tcctggcctg 1380
ttagaaacat cagaaggctg tagacagata atgggacagc tacaaccgtc ccttcagaca 1440
ggatcagaag aacttagatc attatataat acagtagcaa ccctctattg tgtgcatcaa 1500
aagatagagg taaaagacac caaggaagct ttagacaagg tagaggaaga gcaaaacaac 1560
agtaagaaaa aggcacagca agaagcagct gacgcaggaa acagaaacca ggtcagccaa 1620
aattacccta tagtgcaaaa cctacaggga caaatggtac atcaggccat atcacctaga 1680
actttaaatg catgggtaaa agtagtggaa gagaaggctt tcagcccaga agtaataccc 1740
atgttttcag cattatcaga aggagccacc ccacaagatt taaacaccat gctaaacaca 1800
gtggggggac atcaagcagc catgcaaatg ttaaaagaaa ccatcaatga ggaagctgca 1860
gaatgggata gattgcaccc agtgcatgca gggcctattg caccaggcca gatgagagaa 1920
ccaaggggaa gtgacatagc aggaactact agtacccttc aggaacaaat aggatggatg 1980
acaaataatc cacctatccc agtaggagaa atatataaga gatggataat cctgggatta 2040
aataaaatag taagaatgta tagccctacc agcattctgg atataaaaca aggaccaaaa 2100
gaacccttta gagattatgt agaccggttc tataaaaccc taagagccga gcaagctaca 2160
caggaagtaa aaaattggat gacagaaacc ttgttggtcc aaaatgcgaa tccagattgt 2220
aagactattt taaaagcatt aggaccagca gctacactag aagaaatgat gacagcatgt 2280
cagggagtgg ggggacccgg ccataaagca agagttttgg ctgaagcaat gagccaagta 2340
acaggttcag ctgccataat gatgcagaga ggcaatttta ggaaccaaag aaagactgtt 2400
aagtgtttca attgtggcaa agaagggcac atagccagaa attgcagggc ccctaggaaa 2460
aagggctgtt ggaaatgtgg aaaggaagga catcaaatga aggattgcac agaaagacag 2520
gctaatgcgg ccgtcatcac cctgtggcag cgccccctgg tggccctgat cgagatctgc 2580
accgagatgg agaaggaggg caagatcagc aagatcggcc ccgccggcct gaagaagaag 2640
aagagcgtga ccgtgctgga cgtgggcgac gcctacttca gcgtgcccct ggataaggac 2700
ttccgcaagt acaccgcctt caccatcccc agcatctgga agggcagccc cgccatcttc 2760
cagagcagca tgaccaagaa gcagaacccc gacatcgtga tctaccagta catggacgac 2820
ctgtacgtgc ccatcgtgct gcccgagaag gacagctggc tggtgggcaa gctgaactgg 2880
gccagccaga tctacgccgg catcaaggtg aagcagctga tcctgaagga gcccgtgcac 2940
ggcgtgtacg agcccatcgt gggcgccgag accttctacg tggacggcgc cgccaaccgc 3000
gccggcaacc tgtgggtgac cgtgtactac ggcgtgcccg tgtggaagga ggccaccacc 3060
accctggtgg agcgctacct gcgcgaccag cagctgctgg gcatctgggg ctgcgcctgc 3120
accccctacg acatcaacca gatgctgcgc ggccctggcc gcgccttcgt gaccatccgc 3180
cagggcagcc tgtag 3195
<210>21
<211>3020
<212>DNA
<213>人工序列
<220>
<223>含有Tat-Rev-Nef,截短的Gag蛋白和CTL(TRN-optp17/24-CTL)的杂交蛋白编码序列
<400>21
atggagccag tagatcctag actagagccc tggaagcatc caggaagtca gcctaggacc 60
ccttgtacca attgctattg taaaaagtgt tgccttcatt gccaagtttg tttcacaaga 120
aaaggcttag gcatctccta tggcaggaag aagcggagac agcgacgaag agctcctcaa 180
gacagtcaga ctcatcaagt ttctctacca aagcaaccct cctcccagca acgaggggac 240
ccgacaggcc cgaagaaatc gaagaagaag gtggagagag agacagaggc agatccgttc 300
gatactagtg caggaagaag cggagacagc gacgaagagc tcctcaagac agtcagactc 360
atcaagtttc tctaccaaag caaccctcct cccagcaacg aggggacccg acaggcccga 420
agaaatcgaa gaagaaggtg gagagagaga cagaggcaga tccgttcgat tagtgagcgg 480
attcttagca cttttctggg acgacctgcg gagcctgtgc ctcttcagct accgccgctt 540
gagagactta ctcttgattg tagcgaagat tgtggaaact ctgggacgca gggggtggga 600
agtcctcaag tattggtgga atctcctgca gtattggagc caggaactaa agaaaagctt 660
gttggcaagt ggtcaaaatg tagtggatgg cctactgtaa gggaaagaat gaaacaagct 720
gagcctgagc cagcagcaga tggggtggga gcagcatctc gagacctgga aaaacatgga 780
gcaatcacaa gtagcaatac agcaactaat aacgctgctt gtgcctggct agaagcacaa 840
gaggaagagg aagtgggttt tccagtcaga cctcaggtac ctttaagacc aatgacttac 900
aagggagctt tagatcttag ccacttttta aaagaaaagg ggggactgga agggttaatt 960
tactccccaa aaagacaaga gatccttgat ctgtgggtct accacacaca aggctacttc 1020
cctgattggc agaactacac accagggcca ggggtcagat atccactgac ctttggatgg 1080
tgcttcaagt tagtaccagt tgaaccagat gaagaagaga acagcagcct gttacaccct 1140
gcgagcctgc atgggacaga ggacacggag agagaagtgt taaagtggaa gtttgacagc 1200
catctagcat ttcatcacaa ggcccgagag ctgcatccgg agtactacaa agactgcgcg 1260
gccgtgggcg caagagcctc cgtgctgagc ggcggagagc tggacaagtg ggagaagatc 1320
cgcctgcgcc ccggcggcaa gaagaagtac cagctgaagc acatcgtgtg ggccagccgc 1380
gagctggagc gcttcgccgt gaaccccggc ctgctcgaga ccagcgaagg ctgccgccag 1440
atcatgggcc agctccagcc cagcctccag accggcagcg aggagctgcg cagcctgtac 1500
aacaccgtgg ccaccctgta ctgcgtgcac cagaagatcg aggtgaagga caccaaggag 1560
gccctggaca aggtggagga ggagcagaac aacagcaaga agaaggccca gcaggaggcc 1620
gccgacgccg gcaaccgcaa ccaagtcagc cagaactacc ccatcgtgca gaacctgcag 1680
ggccagatgg tgcaccaggc catcagcccc cgcaccctga acgcctgggt gaaggtggtg 1740
gaggagaagg ccttcagccc cgaggtgatc cccatgttca gcgccctaag cgagggcgct 1800
accccccagg acctgaacac catgctgaac accgtgggcg gccaccaggc cgccatgcag 1860
atgctgaagg agaccatcaa cgaggaggcc gccgagtggg accgcctgca ccccgtgcac 1920
gccgggccca tcgcccccgg ccagatgcgc gagccccgcg gcagcgacat cgccggcacc 1980
accagcaccc tccaggagca gatcggctgg atgaccaaca acccccccat ccccgtgggc 2040
gagatctaca agcgctggat catcctgggc ctgaacaaga tcgtccgcat gtacagcccc 2100
accagcatcc tggacatcaa gcagggcccc aaggagccct tccgcgacta cgtggaccgc 2160
ttctacaaga ccctgcgcgc cgagcaggcc acccaggagg tgaagaactg gatgaccgag 2220
accctgctgg tgcagaacgc caaccccgac tgcaagacca tcctcaaggc cctgggaccc 2280
gccgccaccc tggaggagat gatgaccgcc tgccaaggcg tgggcggccc cggccacaag 2340
gcccgcgtgc tggcggccgt catcaccctg tggcagcgcc ccctggtggc cctgatcgag 2400
atctgcaccg agatggagaa ggagggcaag atcagcaaga tcggccccgc cggcctgaag 2460
aagaagaaga gcgtgaccgt gctggacgtg ggcgacgcct acttcagcgt gcccctggat 2520
aaggacttcc gcaagtacac cgccttcacc atccccagca tctggaaggg cagccccgcc 2580
atcttccaga gcagcatgac caagaagcag aaccccgaca tcgtgatcta ccagtacatg 2640
gacgacctgt acgtgcccat cgtgctgccc gagaaggaca gctggctggt gggcaagctg 2700
aactgggcca gccagatcta cgccggcatc aaggtgaagc agctgatcct gaaggagccc 2760
gtgcacggcg tgtacgagcc catcgtgggc gccgagacct tctacgtgga cggcgccgcc 2820
aaccgcgccg gcaacctgtg ggtgaccgtg tactacggcg tgcccgtgtg gaaggaggcc 2880
accaccaccc tggtggagcg ctacctgcgc gaccagcagc tgctgggcat ctggggctgc 2940
gcctgcaccc cctacgacat caaccagatg ctgcgcggcc ctggccgcgc ctcgtgacca 3000
tccgccaggg cagcctgtag 3020
<210>22
<211>3021
<212>DNA
<213>人工序列
<220>
<223>含有Tat-Rev-Nef,CTL和截短的Gag蛋白(TRN-CTL-optp17/24)杂交蛋白编码序列
<400>22
atggagccag tagatcctag actagagccc tggaagcatc caggaagtca gcctaggacc 60
ccttgtacca attgctattg taaaaagtgt tgccttcatt gccaagtttg tttcacaaga 120
aaaggcttag gcatctccta tggcaggaag aagcggagac agcgacgaag agctcctcaa 180
gacagtcaga ctcatcaagt ttctctacca aagcaaccct cctcccagca acgaggggac 240
ccgacaggcc cgaagaaatc gaagaagaag gtggagagag agacagaggc agatccgttc 300
gatactagtg caggaagaag cggagacagc gacgaagagc tcctcaagac agtcagactc 360
atcaagtttc tctaccaaag caaccctcct cccagcaacg aggggacccg acaggcccga 420
agaaatcgaa gaagaaggtg gagagagaga cagaggcaga tccgttcgat tagtgagcgg 480
attcttagca cttttctggg acgacctgcg gagcctgtgc ctcttcagct accgccgctt 540
gagagactta ctcttgattg tagcgaagat tgtggaaact ctgggacgca gggggtggga 600
agtcctcaag tattggtgga atctcctgca gtattggagc caggaactaa agaaaagctt 660
gtgggcaagt ggtcaaaatg tagtggatgg cctactgtaa gggaaagaat gaaacaagct 720
gagcctgagc cagcagcaga tggggtggga gcagcatctc gagacctgga aaaacatgga 780
gcaatcacaa gtagcaatac agcaactaat aacgctgctt gtgcctggct agaagcacaa 840
gaggaagagg aagtgggttt tccagtcaga cctcaggtac ctttaagacc aatgacttac 900
aagggagctt tagatcttag ccacttttta aaagaaaagg ggggactgga agggttaatt 960
tactccccaa aaagacaaga gatccttgat ctgtgggtct accacacaca aggctacttc 1020
cctgattggc agaactacac accagggcca ggggtcagat atccactgac ctttggatgg 1080
tgcttcaagt tagtaccagt tgaaccagat gaagaagaga acagcagcct gttacaccct 1140
gcgagcctgc atgggacaga ggacacggag agagaagtgt taaagtggaa gtttgacagc 1200
catctagcat ttcatcacaa ggcccgagag ctgcatccgg agtactacaa agactgcgcg 1260
gccgtcatca ccctgtggca gcgccccctg gtggccctga tcgagatctg caccgagatg 1320
gagaaggagg gcaagatcag caagatcggc cccgccggcc tgaagaagaa gaagagcgtg 1380
accgtgctgg acgtgggcga cgcctacttc agcgtgcccc tggataagga cttccgcaag 1440
tacaccgcct tcaccatccc cagcatctgg aagggcagcc ccgccatctt ccagagcagc 1500
atgaccaaga agcagaaccc cgacatcgtg atctaccagt acatggacga cctgtacgtg 1560
cccatcgtgc tgcccgagaa ggacagctgg ctggtgggca agctgaactg ggccagccag 1620
atctacgccg gcatcaaggt gaagcagctg atcctgaagg agcccgtgca cggcgtgtac 1680
gagcccatcg tgggcgccga gaccttctac gtggacggcg ccgccaaccg cgccggcaac 1740
ctgtgggtga ccgtgtacta cggcgtgccc gtgtggaagg aggccaccac caccctggtg 1800
gagcgctacc tgcgcgacca gcagctgctg ggcatctggg gctgcgcctg caccccctac 1860
gacatcaacc agatgctgcg cggccctggc cgcgccttcg tgaccatccg ccagggcagc 1920
ctggcggccg tgggcgcaag agcctccgtg ctgagcggcg gagagctgga caagtgggag 1980
aagatccgcc tgcgccccgg cggcaagaag aagtaccagc tgaagcacat cgtgtgggcc 2040
agccgcgagc tggagcgctt cgccgtgaac cccggcctgc tcgagaccag cgaaggctgc 2100
cgccagatca tgggccagct ccagcccagc ctccagaccg gcagcgagga gctgcgcagc 2160
ctgtacaaca ccgtggccac cctgtactgc gtgcaccaga agatcgaggt gaaggacacc 2220
aaggaggccc tggacaaggt ggaggaggag cagaacaaca gcaagaagaa ggcccagcag 2280
gaggccgccg acgccggcaa ccgcaaccaa gtcagccaga actaccccat cgtgcagaac 2340
ctgcagggcc agatggtgca ccaggccatc agcccccgca ccctgaacgc ctgggtgaag 2400
gtggtggagg agaaggcctt cagccccgag gtgatcccca tgttcagcgc cctgagcgag 2460
ggcgctaccc cccaggacct gaacaccatg ctgaacaccg tgggcggcca ccaggccgcc 2520
atgcagatgc tgaaggagac catcaacgag gaggccgccg agtgggaccg cctgcacccc 2580
gtgcacgccg ggcccatcgc ccccggccag atgcgcgagc cccgcggcag cgacatcgcc 2640
ggcaccacca gcaccctcca ggagcagatc ggctggatga ccaacaaccc ccccatcccc 2700
gtgggcgaga tctacaagcg ctggatcatc ctgggcctga acaagatcgt ccgcatgtac 2760
agccccacca gcatcctgga catcaagcag ggccccaagg agcccttccg cgactacgtg 2820
gaccgcttct acaagaccct gcgcgccgag caggccaccc aggaggtgaa gaactggatg 2880
accgagaccc tgctggtgca gaacgccaac cccgactgca agaccatcct caaggccctg 2940
ggacccgccg ccaccctgga ggagatgatg accgcctgcc aaggcgtggg cggccccggc 3000
cacaaggccc gcgtgctgtg a 3021
<210>23
<211>3021
<212>DNA
<213>人工序列
<220>
<223>含有Rev-Nef-Tat,CTL和截短的Gag蛋白(RNT-CTL-dgag)蛋白(RNT-CTL-optp17/24)的杂交蛋白编码序列
<400>23
atggcaggaa gaagcggaga cagcgacgaa gagctcctca agacagtcag actcatcaag 60
tttctctacc aaagcaaccc tcctcccagc aacgagggga cccgacaggc ccgaagaaat 120
cgaagaagaa ggtggagaga gagacagagg cagatccgtt cgattagtga gcggattctt 180
agcacttttc tgggacgacc tgcggagcct gtgcctcttc agctaccgcc gcttgagaga 240
cttactcttg attgtagcga agattgtgga aactctggga cgcagggggt gggaagtcct 300
caagtattgg tggaatctcc tgcagtattg gagccaggaa ctaaagaaac tagtgtgggc 360
aagtggtcaa aatgtagtgg atggcctact gtaagggaaa gaatgaaaca agctgagcct 420
gagccagcag cagatggggt gggagcagca tctcgagacc tggaaaaaca tggagcaatc 480
acaagtagca atacagcaac taataacgct gcttgtgcct ggctagaagc acaagaggaa 540
gaggaagtgg gttttccagt cagacctcag gtacctttaa gaccaatgac ttacaaggga 600
gctttagatc ttagccactt tttaaaagaa aaggggggac tggaagggtt aatttactcc 660
ccaaaaagac aagagatcct tgatctgtgg gtctaccaca cacaaggcta cttccctgat 720
tggcagaact acacaccagg gccaggggtc agatatccac tgacctttgg atggtgcttc 780
aagttagtac cagttgaacc agatgaagaa gagaacagca gcctgttaca ccctgcgagc 840
ctgcatggga cagaggacac ggagagagaa gtgttaaagt ggaagtttga cagccatcta 900
gcatttcatc acaaggcccg agagctgcat ccggagtact acaaagactg caagcttgag 960
ccagtagatc ctagactaga gccctggaag catccaggaa gtcagcctag gaccccttgt 1020
accaattgct attgtaaaaa gtgttgcctt cattgccaag tttgtttcac aagaaaaggc 1080
ttaggcatct cctatggcag gaagaagcgg agacagcgac gaagagctcc tcaagacagt 1140
cagactcatc aagtttctct accaaagcaa ccctcctccc agcaacgagg ggacccgaca 1200
ggcccgaaga aatcgaagaa gaaggtggag agagagacag aggcagatcc gttcgatgcg 1260
gccgtcatca ccctgtggca gcgccccctg gtggccctga tcgagatctg caccgagatg 1320
gagaaggagg gcaagatcag caagatcggc cccgccggcc tgaagaagaa gaagagcgtg 1380
accgtgctgg acgtgggcga cgcctacttc agcgtgcccc tggataagga cttccgcaag 1440
tacaccgcct tcaccatccc cagcatctgg aagggcagcc ccgccatctt ccagagcagc 1500
atgaccaaga agcagaaccc cgacatcgtg atctaccagt acatggacga cctgtacgtg 1560
cccatcgtgc tgcccgagaa ggacagctgg ctggtgggca agctgaactg ggccagccag 1620
atctacgccg gcatcaaggt gaagcagctg atcctgaagg agcccgtgca cggcgtgtac 1680
gagcccatcg tgggcgccga gaccttctac gtggacggcg ccgccaaccg cgccggcaac 1740
ctgtgggtga ccgtgtacta cggcgtgccc gtgtggaagg aggccaccac caccctggtg 1800
gagcgctacc tgcgcgacca gcagctgctg ggcatctggg gctgcgcctg caccccctac 1860
gacatcaacc agatgctgcg cggccctggc cgcgccttcg tgaccatccg ccagggcagc 1920
ctggcggccg tgggcgcaag agcctccgtg ctgagcggcg gagagctgga caagtgggag 1980
aagatccgcc tgcgccccgg cggcaagaag aagtaccagc tgaagcacat cgtgtgggcc 2040
agccgcgagc tggagcgctt cgccgtgaac cccggcctgc tcgagaccag cgaaggctgc 2100
cgccagatca tgggccagct ccagcccagc ctccagaccg gcagcgagga gctgcgcagc 2160
ctgtacaaca ccgtggccac cctgtactgc gtgcaccaga agatcgaggt gaaggacacc 2220
aaggaggccc tggacaaggt ggaggaggag cagaacaaca gcaagaagaa ggcccagcag 2280
gaggccgccg acgccggcaa ccgcaaccaa gtcagccaga actaccccat cgtgcagaac 2340
ctgcagggcc agatggtgca ccaggccatc agcccccgca ccctgaacgc ctgggtgaag 2400
gtggtggagg agaaggcctt cagccccgag gtgatcccca tgttcagcgc cctgagcgag 2460
ggcgctaccc cccaggacct gaacaccatg ctgaacaccg tgggcggcca ccaggccgcc 2520
atgcagatgc tgaaggagac catcaacgag gaggccgccg agtgggaccg cctgcacccc 2580
gtgcacgccg ggcccatcgc ccccggccag atgcgcgagc cccgcggcag cgacatcgcc 2640
ggcaccacca gcaccctcca ggagcagatc ggctggatga ccaacaaccc ccccatcccc 2700
gtgggcgaga tctacaagcg ctggatcatc ctgggcctga acaagatcgt ccgcatgtac 2760
agccccacca gcatcctgga catcaagcag ggccccaagg agcccttccg cgactacgtg 2820
gaccgcttct acaagaccct gcgcgccgag caggccaccc aggaggtgaa gaactggatg 2880
accgagaccc tgctggtgca gaacgccaac cccgactgca agaccatcct caaggccctg 2940
ggacccgccg ccaccctgga ggagatgatg accgcctgcc aaggcgtggg cggccccggc 3000
cacaaggccc gcgtgctgtg a 3021
<210>24
<211>3021
<212>DNA
<213>人工序列
<220>
<223>含有Rev-Nef-Tat,截短的Gag蛋白和CTL(RNT-optp17/24-CTL)的杂交蛋白编码序列
<400>24
atggcaggaa gaagcggaga cagcgacgaa gagctcctca agacagtcag actcatcaag 60
tttctctacc aaagcaaccc tcctcccagc aacgagggga cccgacaggc ccgaagaaat 120
cgaagaagaa ggtggagaga gagacagagg cagatccgtt cgattagtga gcggattctt 180
agcacttttc tgggacgacc tgcggagcct gtgcctcttc agctaccgcc gcttgagaga 240
cttactcttg attgtagcga agattgtgga aactctggga cgcagggggt gggaagtcct 300
caagtattgg tggaatctcc tgcagtattg gagccaggaa ctaaagaaac tagtgtgggc 360
aagtggtcaa aatgtagtgg atggcctact gtaagggaaa gaatgaaaca agctgagcct 420
gagccagcag cagatggggt gggagcagca tctcgagacc tggaaaaaca tggagcaatc 480
acaagtagca atacagcaac taataacgct gcttgtgcct ggctagaagc acaagaggaa 540
gaggaagtgg gttttccagt cagacctcag gtacctttaa gaccaatgac ttacaaggga 600
gctttagatc ttagccactt tttaaaagaa aaggggggac tggaagggtt aatttactcc 660
ccaaaaagac aagagatcct tgatctgtgg gtctaccaca cacaaggcta cttccctgat 720
tggcagaact acacaccagg gccaggggtc agatatccac tgacctttgg atggtgcttc 780
aagttagtac cagttgaacc agatgaagaa gagaacagca gcctgttaca ccctgcgagc 840
ctgcatggga cagaggacac ggagagagaa gtgttaaagt ggaagtttga cagccatcta 900
gcatttcatc acaaggcccg agagctgcat ccggagtact acaaagactg caagcttgag 960
ccagtagatc ctagactaga gccctggaag catccaggaa gtcagcctag gaccccttgt 1020
accaattgct attgtaaaaa gtgttgcctt cattgccaag tttgtttcac aagaaaaggc 1080
ttaggcatct cctatggcag gaagaagcgg agacagcgac gaagagctcc tcaagacagt 1140
cagactcatc aagtttctct accaaagcaa ccctcctccc agcaacgagg ggacccgaca 1200
ggcccgaaga aatcgaagaa gaaggtggag agagagacag aggcagatcc gttcgatgcg 1260
gccgtgggcg caagagcctc cgtgctgagc ggcggagagc tggacaagtg ggagaagatc 1320
cgcctgcgcc ccggcggcaa gaagaagtac cagctgaagc acatcgtgtg ggccagccgc 1380
gagctggagc gcttcgccgt gaaccccggc ctgctcgaga ccagcgaagg ctgccgccag 1440
atcatgggcc agctccagcc cagcctccag accggcagcg aggagctgcg cagcctgtac 1500
aacaccgtgg ccaccctgta ctgcgtgcac cagaagatcg aggtgaagga caccaaggag 1560
gccctggaca aggtggagga ggagcagaac aacagcaaga agaaggccca gcaggaggcc 1620
gccgacgccg gcaaccgcaa ccaagtcagc cagaactacc ccatcgtgca gaacctgcag 1680
ggccagatgg tgcaccaggc catcagcccc cgcaccctga acgcctgggt gaaggtggtg 1740
gaggagaagg ccttcagccc cgaggtgatc cccatgttca gcgccctaag cgagggcgct 1800
accccccagg acctgaacac catgctgaac accgtgggcg gccaccaggc cgccatgcag 1860
atgctgaagg agaccatcaa cgaggaggcc gccgagtggg accgcctgca ccccgtgcac 1920
gccgggccca tcgcccccgg ccagatgcgc gagccccgcg gcagcgacat cgccggcacc 1980
accagcaccc tccaggagca gatcggctgg atgaccaaca acccccccat ccccgtgggc 2040
gagatctaca agcgctggat catcctgggc ctgaacaaga tcgtccgcat gtacagcccc 2100
accagcatcc tggacatcaa gcagggcccc aaggagccct tccgcgacta cgtggaccgc 2160
ttctacaaga ccctgcgcgc cgagcaggcc acccaggagg tgaagaactg gatgaccgag 2220
accctgctgg tgcagaacgc caaccccgac tgcaagacca tcctcaaggc cctgggaccc 2280
gccgccaccc tggaggagat gatgaccgcc tgccaaggcg tgggcggccc cggccacaag 2340
gcccgcgtgc tggcggccgt catcaccctg tggcagcgcc ccctggtggc cctgatcgag 2400
atctgcaccg agatggagaa ggagggcaag atcagcaaga tcggccccgc cggcctgaag 2460
aagaagaaga gcgtgaccgt gctggacgtg ggcgacgcct acttcagcgt gcccctggat 2520
aaggacttcc gcaagtacac cgccttcacc atccccagca tctggaaggg cagccccgcc 2580
atcttccaga gcagcatgac caagaagcag aaccccgaca tcgtgatcta ccagtacatg 2640
gacgacctgt acgtgcccat cgtgctgccc gagaaggaca gctggctggt gggcaagctg 2700
aactgggcca gccagatcta cgccggcatc aaggtgaagc agctgatcct gaaggagccc 2760
gtgcacggcg tgtacgagcc catcgtgggc gccgagacct tctacgtgga cggcgccgcc 2820
aaccgcgccg gcaacctgtg ggtgaccgtg tactacggcg tgcccgtgtg gaaggaggcc 2880
accaccaccc tggtggagcg ctacctgcgc gaccagcagc tgctgggcat ctggggctgc 2940
gcctgcaccc cctacgacat caaccagatg ctgcgcggcc ctggccgcgc cttcgtgacc 3000
atccgccagg gcagcctgta g 3021
<210>25
<211>419
<212>PRT
<213>人工序列
<220>
<223>含有Nef-Tat-Rev的杂交蛋白(NTR)
<400>25
Met Val Gly Lys Trp Ser Lys Cys Ser Gly Trp Pro Thr Val Arg Glu
1 5 10 15
Arg Met Lys Gln Ala Glu Pro Glu Pro Ala Ala Asp Gly Val Gly Ala
20 25 30
Ala Ser Arg Asp Leu Glu Lys His Gly Ala Ile Thr Ser Ser Asn Thr
35 40 45
Ala Thr Asn Asn Ala Ala Cys Ala Trp Leu Glu Ala Gln Glu Glu Glu
50 55 60
Glu Val Gly Phe Pro Val Arg Pro Gln Val Pro Leu Arg Pro Met Thr
65 70 75 80
Tyr Lys Gly Ala Leu Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly
85 90 95
Leu Glu Gly Leu Ile Tyr Ser Pro Lys Arg Gln Glu Ile Leu Asp Leu
100 105 110
Trp Val Tyr His Thr Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr
115 120 125
Pro Gly Pro Gly Val Arg Tyr Pro Leu Thr Phe Gly Trp Cys Phe Lys
130 135 140
Leu Val Pro Val Glu Pro Asp Glu Glu Glu Asn Ser Ser Leu Leu His
145 150 155 160
Pro Ala Ser Leu His Gly Thr Glu Asp Thr Glu Arg Glu Val Leu Lys
165 170 175
Trp Lys Phe Asp Ser His Leu Ala Phe His His Lys Ala Arg Glu Leu
180 185 190
His Pro Glu Tyr Tyr Lys Asp Cys Thr Ser Ala Gly Arg Ser Gly Asp
195 200 205
Ser Asp Glu Glu Leu Leu Lys Thr Val Arg Leu Ile Lys Phe Leu Tyr
210 215 220
Gln Ser Asn Pro Pro Pro Ser Asn Glu Gly Thr Arg Gln Ala Arg Arg
225 230 235 240
Asn Arg Arg Arg Arg Trp Arg Glu Arg Gln Arg Gln Ile Arg Ser Ile
245 250 255
Ser Glu Arg Ile Leu Ser Thr Phe Leu Gly Arg Pro Ala Glu Pro Val
260 265 270
Pro Leu Gln Leu Pro Pro Leu Glu Arg Leu Thr Leu Asp Cys Ser Glu
275 280 285
Asp Cys Gly Asn Ser Gly Thr Gln Gly Val Gly Ser Pro Gln Val Leu
290 295 300
Val Glu Ser Pro Ala Val Leu Glu Pro Gly Thr Lys Glu Lys Leu Glu
305 310 315 320
Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser Gln Pro
325 330 335
Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu His Cys
340 345 350
Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly Arg Lys
355 360 365
Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr His Gln
370 375 380
Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp Pro Thr
385 390 395 400
Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu Ala Asp
405 410 415
Pro Phe Asp
<210>26
<211>419
<212>PRT
<213>人工序列
<220>
<223>含有Tat-Rev-Nef(TRN)的杂交蛋白
<400>26
Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser
1 5 10 15
Gln Pro Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu
20 25 30
His Cys Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly
35 40 45
Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr
50 55 60
His Gln Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp
65 70 75 80
Pro Thr Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu
85 90 95
Ala Asp Pro Phe Asp Thr Ser Ala Gly Arg Ser Gly Asp Ser Asp Glu
100 105 110
Glu Leu Leu Lys Thr Val Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn
115 120 125
Pro Pro Pro Ser Asn Glu Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg
130 135 140
Arg Arg Trp Arg Glu Arg Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg
145 150 155 160
Ile Leu Ser Thr Phe Leu Gly Arg Pro Ala Glu Pro Val Pro Leu Gln
165 170 175
Leu Pro Pro Leu Glu Arg Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly
180 185 190
Asn Ser Gly Thr Gln Gly Val Gly Ser Pro Gln Val Leu Val Glu Ser
195 200 205
Pro Ala Val Leu Glu Pro Gly Thr Lys Glu Lys Leu Val Gly Lys Trp
210 215 220
Ser Lys Cys Ser Gly Trp Pro Thr Val Arg Glu Arg Met Lys Gln Ala
225 230 235 240
Glu Pro Glu Pro Ala Ala Asp Gly Val Gly Ala Ala Ser Arg Asp Leu
245 250 255
Glu Lys His Gly Ala Ile Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala
260 265 270
Ala Cys Ala Trp Leu Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro
275 280 285
Val Arg Pro Gln Val Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu
290 295 300
Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile
305 310 315 320
Tyr Ser Pro Lys Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr
325 330 335
Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val
340 345 350
Arg Tyr Pro Leu Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Glu
355 360 365
Pro Asp Glu Glu Glu Asn Ser Ser Leu Leu His Pro Ala Ser Leu His
370 375 380
Gly Thr Glu Asp Thr Glu Arg Glu Val Leu Lys Trp Lys Phe Asp Ser
385 390 395 400
His Leu Ala Phe His His Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr
405 410 415
Lys Asp Cys
<210>27
<211>419
<212>PRT
<213>人工序列
<220>
<223>含有Rev-Tat-Nef的杂交蛋白(RTN)
<400>27
Met Ala Gly Arg Ser Gly Asp Ser Asp Glu Glu Leu Leu Lys Thr Val
1 5 10 15
Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn Pro Pro Pro Ser Asn Glu
20 25 30
Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg
35 40 45
Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg Ile Leu Ser Thr Phe Leu
50 55 60
Gly Arg Pro Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg
65 70 75 80
Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly Asn Ser Gly Thr Gln Gly
85 90 95
Val Gly Ser Pro Gln Val Leu Val Glu Ser Pro Ala Val Leu Glu Pro
100 105 110
Gly Thr Lys Glu Thr Ser Glu Pro Val Asp Pro Arg Leu Glu Pro Trp
115 120 125
Lys His Pro Gly Ser Gln Pro Arg Thr Pro Cys Thr Asn Cys Tyr Cys
130 135 140
Lys Lys Cys Cys Leu His Cys Gln Val Cys Phe Thr Arg Lys Gly Leu
145 150 155 160
Gly Ile Ser Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala Pro
165 170 175
Gln Asp Ser Gln Thr His Gln Val Ser Leu Pro Lys Gln Pro Ser Ser
180 185 190
Gln Gln Arg Gly Asp Pro Thr Gly Pro Lys Lys Ser Lys Lys Lys Val
195 200 205
Glu Arg Glu Thr Glu Ala Asp Pro Phe Asp Lys Leu Val Gly Lys Trp
210 215 220
Ser Lys Cys Ser Gly Trp Pro Thr Val Arg Glu Arg Met Lys Gln Ala
225 230 235 240
Glu Pro Glu Pro Ala Ala Asp Gly Val Gly Ala Ala Ser Arg Asp Leu
245 250 255
Glu Lys His Gly Ala Ile Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala
260 265 270
Ala Cys Ala Trp Leu Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro
275 280 285
Val Arg Pro Gln Val Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu
290 295 300
Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile
305 310 315 320
Tyr Ser Pro Lys Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr
325 330 335
Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val
340 345 350
Arg Tyr Pro Leu Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Glu
355 360 365
Pro Asp Glu Glu Glu Asn Ser Ser Leu Leu His Pro Ala Ser Leu His
370 375 380
Gly Thr Glu Asp Thr Glu Arg Glu Val Leu Lys Trp Lys Phe Asp Ser
385 390 395 400
His Leu Ala Phe His His Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr
405 410 415
Lys Asp Cys
<210>28
<211>419
<212>PRT
<213>人工序列
<220>
<223>含有Tat-Nef-Rev的杂交蛋白(TNR)
<400>28
Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser
1 5 10 15
Gln Pro Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu
20 25 30
His Cys Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly
35 40 45
Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr
50 55 60
His Gln Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp
65 70 75 80
Pro Thr Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu
85 90 95
Ala Asp Pro Phe Asp Thr Ser Val Gly Lys Trp Ser Lys Cys Ser Gly
100 105 110
Trp Pro Thr Val Arg Glu Arg Met Lys Gln Ala Glu Pro Glu Pro Ala
115 120 125
Ala Asp Gly Val Gly Ala Ala Ser Arg Asp Leu Glu Lys His Gly Ala
130 135 140
Ile Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala Ala Cys Ala Trp Leu
145 150 155 160
Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln Val
165 170 175
Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu Asp Leu Ser His Phe
180 185 190
Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Pro Lys Arg
195 200 205
Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr Phe Pro
210 215 220
Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val Arg Tyr Pro Leu Thr
225 230 235 240
Phe Gly Trp Cys Phe Lys Leu Val Pro Val Glu Pro Asp Glu Glu Glu
245 250 255
Asn Ser Ser Leu Leu His Pro Ala Ser Leu His Gly Thr Glu Asp Thr
260 265 270
Glu Arg Glu Val Leu Lys Trp Lys Phe Asp Ser His Leu Ala Phe His
275 280 285
His Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr Lys Asp Cys Lys Leu
290 295 300
Ala Gly Arg Ser Gly Asp Ser Asp Glu Glu Leu Leu Lys Thr Val Arg
305 310 315 320
Leu Ile Lys Phe Leu Tyr Gln Ser Asn Pro Pro Pro Ser Asn Glu Gly
325 330 335
Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg Gln
340 345 350
Arg Gln Ile Arg Ser Ile Ser Glu Arg Ile Leu Ser Thr Phe Leu Gly
355 360 365
Arg Pro Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg Leu
370 375 380
Thr Leu Asp Cys Ser Glu Asp Cys Gly Asn Ser Gly Thr Gln Gly Val
385 390 395 400
Gly Ser Pro Gln Val Leu Val Glu Ser Pro Ala Val Leu Glu Pro Gly
405 410 415
Thr Lys Glu
<210>29
<211>419
<212>PRT
<213>人工序列
<220>
<223>含有Rev-Nef-Tat的杂交蛋白(RNT)
<400>29
Met Ala Gly Arg Ser Gly Asp Ser Asp Glu Glu Leu Leu Lys Thr Val
1 5 10 15
Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn Pro Pro Pro Ser Asn Glu
20 25 30
Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg
35 40 45
Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg Ile Leu Ser Thr Phe Leu
50 55 60
Gly Arg Pro Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg
65 70 75 80
Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly Asn Ser Gly Thr Gln Gly
85 90 95
Val Gly Ser Pro Gln Val Leu Val Glu Ser Pro Ala Val Leu Glu Pro
100 105 110
Gly Thr Lys Glu Thr Ser Val Gly Lys Trp Ser Lys Cys Ser Gly Trp
115 120 125
Pro Thr Val Arg Glu Arg Met Lys Gln Ala Glu Pro Glu Pro Ala Ala
130 135 140
Asp Gly Val Gly Ala Ala Ser Arg Asp Leu Glu Lys His Gly Ala Ile
145 150 155 160
Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala Ala Cys Ala Trp Leu Glu
165 170 175
Ala Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln Val Pro
180 185 190
Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu Asp Leu Ser His Phe Leu
195 200 205
Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Pro Lys Arg Gln
210 215 220
Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr Phe Pro Asp
225 230 235 240
Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val Arg Tyr Pro Leu Thr Phe
245 250 255
Gly Trp Cys Phe Lys Leu Val Pro Val Glu Pro Asp Glu Glu Glu Asn
260 265 270
Ser Ser Leu Leu His Pro Ala Ser Leu His Gly Thr Glu Asp Thr Glu
275 280 285
Arg Glu Val Leu Lys Trp Lys Phe Asp Ser His Leu Ala Phe His His
290 295 300
Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr Lys Asp Cys Lys Leu Glu
305 310 315 320
Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser Gln Pro
325 330 335
Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu His Cys
340 345 350
Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly Arg Lys
355 360 365
Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr His Gln
370 375 380
Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp Pro Thr
385 390 395 400
Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu Ala Asp
405 410 415
Pro Phe Asp
<210>30
<211>387
<212>PRT
<213>人工序列
<220>
<223>含有Nef-Tat-Rev的免疫显性部分的蛋白(NTR)
<400>30
Met Gly Trp Pro Thr Val Arg Glu Arg Met Lys Gln Ala Glu Pro Glu
1 5 10 15
Pro Ala Ala Asp Gly Val Gly Ala Ala Ser Arg Asp Leu Glu Lys His
20 25 30
Gly Ala Ile Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala Ala Cys Ala
35 40 45
Trp Leu Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro
50 55 60
Gln Val Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu Asp Leu Ser
65 70 75 80
His Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Pro
85 90 95
Lys Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr
100 105 110
Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val Arg Tyr Pro
115 120 125
Leu Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Glu Pro Asp Glu
130 135 140
Glu Glu Asn Ser Ser Leu Leu His Pro Ala Ser Leu His Gly Thr Glu
145 150 155 160
Asp Thr Glu Arg Glu Val Leu Lys Trp Lys Phe Asp Ser His Leu Ala
165 170 175
Phe His His Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr Lys Asp Cys
180 185 190
Ala Leu Ala Ala Val Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys
195 200 205
His Pro Gly Ser Gln Pro Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys
210 215 220
Lys Cys Cys Leu His Cys Gln Val Cys Phe Thr Arg Lys Gly Leu Gly
225 230 235 240
Ile Ser Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln
245 250 255
Asp Ser Gln Thr His Gln Val Ser Leu Pro Lys Gln Pro Ser Ser Gln
260 265 270
Gln Arg Gly Asp Pro Thr Gly Pro Lys Lys Ser Gly Leu Ala Ile Leu
275 280 285
Leu Ser Asp Glu Glu Leu Leu Lys Thr Val Arg Leu Ile Lys Phe Leu
290 295 300
Tyr Gln Ser Asn Pro Pro Pro Ser Asn Glu Gly Thr Arg Gln Ala Arg
305 310 315 320
Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg Gln Arg Gln Ile Arg Ser
325 330 335
Ile Ser Glu Arg Ile Leu Ser Thr Phe Leu Gly Arg Pro Ala Glu Pro
340 345 350
Val Pro Leu Gln Leu Pro Pro Leu Glu Arg Leu Thr Leu Asp Cys Ser
355 360 365
Glu Asp Cys Gly Asn Ser Gly Thr Gln Gly Val Gly Ser Pro Gln Val
370 375 380
Leu Val Glu
385
<210>31
<211>390
<212>PRT
<213>人工序列
<220>
<223>由蛋白酶位点分离(NTR)的含有Nef-Tat-Rev的免疫显性部分的蛋白
<400>31
Met Gly Trp Pro Thr Val Arg Glu Arg Met Lys Gln Ala Glu Pro Glu
1 5 10 15
Pro Ala Ala Asp Gly Val Gly Ala Ala Ser Arg Asp Leu Glu Lys His
20 25 30
Gly Ala Ile Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala Ala Cys Ala
35 40 45
Trp Leu Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro
50 55 60
Gln Val Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu Asp Leu Ser
65 70 75 80
His Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Pro
85 90 95
Lys Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr
100 105 110
Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val Arg Tyr Pro
115 120 125
Leu Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Glu Pro Asp Glu
130 135 140
Glu Glu Asn Ser Ser Leu Leu His Pro Ala Ser Leu His Gly Thr Glu
145 150 155 160
Asp Thr Glu Arg Glu Val Leu Lys Trp Lys Phe Asp Ser His Leu Ala
165 170 175
Phe His His Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr Lys Asp Cys
180 185 190
Ala Leu Ala Phe Lys Arg Val Glu Pro Val Asp Pro Arg Leu Glu Pro
195 200 205
Trp Lys His Pro Gly Ser Gln Pro Arg Thr Pro Cys Thr Asn Cys Tyr
210 215 220
Cys Lys Lys Cys Cys Leu His Cys Gln Val Cys Phe Thr Arg Lys Gly
225 230 235 240
Leu Gly Ile Ser Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala
245 250 255
Pro Gln Asp Ser Gln Thr His Gln Val Ser Leu Pro Lys Gln Pro Ser
260 265 270
Ser Gln Gln Arg Gly Asp Pro Thr Gly Pro Lys Lys Ser Val Arg Glu
275 280 285
Lys Arg Leu Leu Ser Asp Glu Glu Leu Leu Lys Thr Val Arg Leu Ile
290 295 300
Lys Phe Leu Tyr Gln Ser Asn Pro Pro Pro Ser Asn Glu Gly Thr Arg
305 310 315 320
Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg Gln Arg Gln
325 330 335
Ile Arg Ser Ile Ser Glu Arg Ile Leu Ser Thr Phe Leu Gly Arg Pro
340 345 350
Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg Leu Thr Leu
355 360 365
Asp Cys Ser Glu Asp Cys Gly Asn Ser Gly Thr Gln Gly Val Gly Ser
370 375 380
Pro Gln Val Leu Val Glu
385 390
<210>32
<211>386
<212>PRT
<213>人工序列
<220>
<223>含有调节蛋白Nef-Tat-Rev免疫部分的蛋白Nef的aal开始(N11TR)
<400>32
Met Trp Pro Thr Val Arg Glu Arg Met Lys Gln Ala Glu Pro Glu Pro
1 5 10 15
Ala Ala Asp Gly Val Gly Ala Ala Ser Arg Asp Leu Glu Lys His Gly
20 25 30
Ala Ile Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala Ala Cys Ala Trp
35 40 45
Leu Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln
50 55 60
Val Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu Asp Leu Ser His
65 70 75 80
Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Pro Lys
85 90 95
Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr Phe
100 105 110
Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val Arg Tyr Pro Leu
115 120 125
Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Glu Pro Asp Glu Glun
130 135 140
Glu Asn Ser Ser Leu Leu His Pro Ala Ser Leu His Gly Thr Glu Asp
145 150 155 160
Thr Glu Arg Glu Val Leu Lys Trp Lys Phe Asp Ser His Leu Ala Phe
165 170 175
His His Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr Lys Asp Cys Ala
180 185 190
Leu Ala Ala Val Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His
195 200 205
Pro Gly Ser Gln Pro Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys
210 215 220
Cys Cys Leu His Cys Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile
225 230 235 240
Ser Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp
245 250 255
Ser Gln Thr His Gln Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln
260 265 270
Arg Gly Asp Pro Thr Gly Pro Lys Lys Ser Gly Leu Ala Ile Leu Leu
275 280 285
Ser Asp Glu Glu Leu Leu Lys Thr Val Arg Leu Ile Lys Phe Leu Tyr
290 295 300
Gln Ser Asn Pro Pro Pro Ser Asn Glu Gly Thr Arg Gln Ala Arg Arg
305 310 315 320
Asn Arg Arg Arg Arg Trp Arg Glu Arg Gln Arg Gln Ile Arg Ser Ile
325 330 335
Ser Glu Arg Ile Leu Ser Thr Phe Leu Gly Arg Pro Ala Glu Pro Val
340 345 350
Pro Leu Gln Leu Pro Pro Leu Glu Arg Leu Thr Leu Asp Cys Ser Glu
355 360 365
Asp Cys Gly Asn Ser Gly Thr Gln Gly Val Gly Ser Pro Gln Val Leu
370 375 380
Val Glu
385
<210>33
<211>389
<212>PRT
<213>人工序列
<220>
<223>由蛋白酶位点分离(N11TR)的含有调节蛋白Nef-Tat-Rev免疫显性部分的蛋白从Nef的aal起始
<400>33
Met Trp Pro Thr Val Arg Glu Arg Met Lys Gln Ala Glu Pro Glu Pro
1 5 10 15
Ala Ala Asp Gly Val Gly Ala Ala Ser Arg Asp Leu Glu Lys His Gly
20 25 30
Ala Ile Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala Ala Cys Ala Trp
35 40 45
Leu Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln
50 55 60
Val Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu Asp Leu Ser His
65 70 75 80
Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Pro Lys
85 90 95
Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr Phe
100 105 110
Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val Arg Tyr Pro Leu
115 120 125
Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Glu Pro Asp Glu Glu
130 135 140
Glu Asn Ser Ser Leu Leu His Pro Ala Ser Leu His Gly Thr Glu Asp
145 150 155 160
Thr Glu Arg Glu Val Leu Lys Trp Lys Phe Asp Ser His Leu Ala Phe
165 170 175
His His Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr Lys Asp Cys Ala
180 185 190
Leu Ala Phe Lys Arg Val Glu Pro Val Asp Pro Arg Leu Glu Pro Trp
195 200 205
Lys His Pro Gly Ser Gln Pro Arg Thr Pro Cys Thr Asn Cys Tyr Cys
210 215 220
Lys Lys Cys Cys Leu His Cys Gln Val Cys Phe Thr Arg Lys Gly Leu
225 230 235 240
Gly Ile Ser Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala Pro
245 250 255
Gln Asp Ser Gln Thr His Gln Val Ser Leu Pro Lys Gln Pro Ser Ser
260 265 270
Gln Gln Arg Gly Asp Pro Thr Gly Pro Lys Lys Ser Val Arg Glu Lys
275 280 285
Arg Leu Leu Ser Asp Glu Glu Leu Leu Lys Thr Val Arg Leu Ile Lys
290 295 300
Phe Leu Tyr Gln Ser Asn Pro Pro Pro Ser Asn Glu Gly Thr Arg Gln
305 310 315 320
Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg Gln Arg Gln Ile
325 330 335
Arg Ser Ile Ser Glu Arg Ile Leu Ser Thr Phe Leu Gly Arg Pro Ala
340 345 350
Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg Leu Thr Leu Asp
355 360 365
Cys Ser Glu Asp Cys Gly Asn Ser Gly Thr Gln Gly Val Gly Ser Pro
370 375 380
Gln Val Leu Val Glu
385
<210>34
<211>220
<212>PRT
<213>人工序列
<220>
<223>含有毒性T-细胞表位Pol和Env基因(CTL)的蛋白
<400>34
Met Ile Thr Leu Trp Gln Arg Pro Leu Val Ala Leu Ile Glu Ile Cys
1 5 10 15
Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Lys Ile Gly Pro Ala Gly
20 25 30
Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp Val Gly Asp Ala Tyr
35 40 45
Phe Ser Val Pro Leu Asp Lys Asp Phe Arg Lys Tyr Thr Ala Phe Thr
50 55 60
Ile Pro Ser Ile Trp Lys Gly Ser Pro Ala Ile Phe Gln Ser Ser Met
65 70 75 80
Thr Lys Lys Gln Asn Pro Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp
85 90 95
Leu Tyr Val Pro Ile Val Leu Pro Glu Lys Asp Ser Trp Leu Val Gly
100 105 110
Lys Leu Asn Trp Ala Ser Gln Ile Tyr Ala Gly Ile Lys Val Lys Gln
115 120 125
Leu Ile Leu Lys Glu Pro Val His Gly Val Tyr Glu Pro Ile Val Gly
130 135 140
Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn Arg Ala Gly Asn Leu
145 150 155 160
Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala Thr Thr
165 170 175
Thr Leu Val Glu Arg Tyr Leu Arg Asp Gln Gln Leu Leu Gly Ile Trp
180 185 190
Gly Cys Ala Cys Thr Pro Tyr Asp Ile Asn Gln Met Leu Arg Gly Pro
195 200 205
Gly Arg Ala Phe Val Thr Ile Arg Gln Gly Ser Leu
210 215 220
<210>35
<211>421
<212>PRT
<213>人工序列
<220>
<223>截短的Gag蛋白序列(dgag)
<400>35
Met Leu Asp Lys Trp Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys
1 5 10 15
Lys Tyr Gln Leu Lys His Ile Val Trp Ala Ser Arg Glu Leu Glu Arg
20 25 30
Phe Ala Val Asn Pro Gly Leu Leu Glu Thr Ser Glu Gly Cys Arg Gln
35 40 45
Ile Met Gly Gln Leu Gln Pro Ser Leu Gln Thr Gly Ser Glu Glu Leu
50 55 60
Arg Ser Leu Tyr Asn Thr Val Ala Thr Leu Tyr Cys Val His Gln Lys
65 70 75 80
Ile Glu Val Lys Asp Thr Lys Glu Ala Leu Asp Lys Val Glu Glu Glu
85 90 95
Gln Asn Asn Ser Lys Lys Lys Ala Gln Gln Glu Ala Ala Asp Ala Gly
100 105 110
Asn Arg Asn Gln Val Ser Gln Asn Tyr Pro Ile Val Gln Asn Leu Gln
115 120 125
Gly Gln Met Val His Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp
130 135 140
Val Lys Val Val Glu Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met
145 150 155 160
Phe Ser Ala Leu Ser Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met
165 170 175
Leu Asn Thr Val Gly Gly His Gln Ala Ala Met Gln Met Leu Lys Glu
180 185 190
Thr Ile Asn Glu Glu Ala Ala Glu Trp Asp Arg Leu His Pro Val His
195 200 205
Ala Gly Pro Ile Ala Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp
210 215 220
Ile Ala Gly Thr Thr Ser Thr Leu Gln Glu Gln Ile Gly Trp Met Thr
225 230 235 240
Asn Asn Pro Pro Ile Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile
245 250 255
Leu Gly Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu
260 265 270
Asp Ile Lys Gln Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg
275 280 285
Phe Tyr Lys Thr Leu Arg Ala Glu Gln Ala Thr Gln Glu Val Lys Asn
290 295 300
Trp Met Thr Glu Thr Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys
305 310 315 320
Thr Ile Leu Lys Ala Leu Gly Pro Ala Ala Thr Leu Glu Glu Met Met
325 330 335
Thr Ala Cys Gln Gly Val Gly Gly Pro Gly His Lys Ala Arg Val Leu
340 345 350
Ala Glu Ala Met Ser Gln Val Thr Gly Ser Ala Ala Ile Met Met Gln
355 360 365
Arg Gly Asn Phe Arg Asn Gln Arg Lys Thr Val Lys Cys Phe Asn Cys
370 375 380
Gly Lys Glu Gly His Ile Ala Arg Asn Cys Arg Ala Pro Arg Lys Lys
385 390 395 400
Gly Cys Trp Lys Cys Gly Lys Glu Gly His Gln Met Lys Asp Cys Thr
405 410 415
Glu Arg Gln Ala Asn
420
<210>36
<211>363
<212>PRT
<213>人工序列
<220>
<223>Gag基因的p17/24蛋白(Syn 17/24)
<400>36
Met Gly Ala Arg Ala Ser Val Leu Ser Gly Gly Glu Leu Asp Lys Trp
1 5 10 15
Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys Lys Tyr Gln Leu Lys
20 25 30
His Ile Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Val Asn Pro
35 40 45
Gly Leu Leu Glu Thr Ser Glu Gly Cys Arg Gln Ile Met Gly Gln Leu
50 55 60
Gln Pro Ser Leu Gln Thr Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn
65 70 75 80
Thr Val Ala Thr Leu Tyr Cys Val His Gln Lys Ile Glu Val Lys Asp
85 90 95
Thr Lys Glu Ala Leu Asp Lys Val Glu Glu Glu Gln Asn Asn Ser Lys
100 105 110
Lys Lys Ala Gln Gln Glu Ala Ala Asp Ala Gly Asn Arg Asn Gln Val
115 120 125
Ser Gln Asn Tyr Pro Ile Val Gln Asn Leu Gln Gly Gln Met Val His
130 135 140
Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp Val Lys Val Val Glu
145 150 155 160
Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met Phe Ser Ala Leu Ser
165 170 175
Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met Leu Asn Thr Val Gly
180 185 190
Gly His Gln Ala Ala Met Gln Met Leu Lys Glu Thr Ile Asn Glu Glu
195 200 205
Ala Ala Glu Trp Asp Arg Leu His Pro Val His Ala Gly Pro Ile Ala
210 215 220
Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp Ile Ala Gly Thr Thr
225 230 235 240
Ser Thr Leu Gln Glu Gln Ile Gly Trp Met Thr Asn Asn Pro Pro Ile
245 250 255
Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu Gly Leu Asn Lys
260 265 270
Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu Asp Ile Lys Gln Gly
275 280 285
Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr Lys Thr Leu
290 295 300
Arg Ala Glu Gln Ala Thr Gln Glu Val Lys Asn Trp Met Thr Glu Thr
305 310 315 320
Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Thr Ile Leu Lys Ala
325 330 335
Leu Gly Pro Ala Ala Thr Leu Glu Glu Met Met Thr Ala Cys Gln Gly
340 345 350
Val Gly Gly Pro Gly His Lys Ala Arg Val Leu
355 360
<210>37
<211>363
<212>PRT
<213>人工序列
<220>
<223>用于在真核细胞表达的最优化的Gag基因的p17/24蛋白(optp 17/24)
<400>37
Met Gly Ala Arg Ala Ser Val Leu Ser Gly Gly Glu Leu Asp Lys Trp
1 5 10 15
Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys Lys Tyr Gln Leu Lys
20 25 30
His Ile Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Val Asn Pro
35 40 45
Gly Leu Leu Glu Thr Ser Glu Gly Cys Arg Gln Ile Met Gly Gln Leu
50 55 60
Gln Pro Ser Leu Gln Thr Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn
65 70 75 80
Thr Val Ala Thr Leu Tyr Cys Val His Gln Lys Ile Glu Val Lys Asp
85 90 95
Thr Lys Glu Ala Leu Asp Lys Val Glu Glu Glu Gln Asn Asn Ser Lys
100 105 110
Lys Lys Ala Gln Gln Glu Ala Ala Asp Ala Gly Asn Arg Asn Gln Val
115 120 125
Ser Gln Asn Tyr Pro Ile Val Gln Asn Leu Gln Gly Gln Met Val His
130 135 140
Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp Val Lys Val Val Glu
145 150 155 160
Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met Phe Ser Ala Leu Ser
165 170 175
Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met Leu Asn Thr Val Gly
180 185 190
Gly His Gln Ala Ala Met Gln Met Leu Lys Glu Thr Ile Asn Glu Glu
195 200 205
Ala Ala Glu Trp Asp Arg Leu His Pro Val His Ala Gly Pro Ile Ala
210 215 220
Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp Ile Ala Gly Thr Thr
225 230 235 240
Ser Thr Leu Gln Glu Gln Ile Gly Trp Met Thr Asn Asn Pro Pro Ile
245 250 255
Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu Gly Leu Asn Lys
260 265 270
Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu Asp Ile Lys Gln Gly
275 280 285
Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr Lys Thr Leu
290 295 300
Arg Ala Glu Gln Ala Thr Gln Glu Val Lys Asn Trp Met Thr Glu Thr
305 310 315 320
Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Thr Ile Leu Lys Ala
325 330 335
Leu Gly Pro Ala Ala Thr Leu Glu Glu Met Met Thr Ala Cys Gln Gly
340 345 350
Val Gly Gly Pro Gly His Lys Ala Arg Val Leu
355 360
<210>38
<211>641
<212>PRT
<213>人工序列
<220>
<223>含有Tat-Rev-Nef和CTL(TRN-CTL)的杂交蛋白
<400>38
Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser
1 5 10 15
Gln Pro Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu
20 25 30
His Cys Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly
35 40 45
Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr
50 55 60
His Gln Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp
65 70 75 80
Pro Thr Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu
85 90 95
Ala Asp Pro Phe Asp Thr Ser Ala Gly Arg Ser Gly Asp Ser Asp Glu
100 105 110
Glu Leu Leu Lys Thr Val Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn
115 120 125
Pro Pro Pro Ser Asn Glu Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg
130 135 140
Arg Arg Trp Arg Glu Arg Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg
145 150 155 160
Ile Leu Ser Thr Phe Leu Gly Arg Pro Ala Glu Pro Val Pro Leu Gln
165 170 175
Leu Pro Pro Leu Glu Arg Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly
180 185 190
Asn Ser Gly Thr Gln Gly Val Gly Ser Pro Gln Val Leu Val Glu Ser
195 200 205
Pro Ala Val Leu Glu Pro Gly Thr Lys Glu Lys Leu Val Gly Lys Trp
210 215 220
Ser Lys Cys Ser Gly Trp Pro Thr Val Arg Glu Arg Met Lys Gln Ala
225 230 235 240
Glu Pro Glu Pro Ala Ala Asp Gly Val Gly Ala Ala Ser Arg Asp Leu
245 250 255
Glu Lys His Gly Ala Ile Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala
260 265 270
Ala Cys Ala Trp Leu Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro
275 280 285
Val Arg Pro Gln Val Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu
290 295 300
Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile
305 310 315 320
Tyr Ser Pro Lys Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr
325 330 335
Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val
340 345 350
Arg Tyr Pro Leu Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Glu
355 360 365
Pro Asp Glu Glu Glu Asn Ser Ser Leu Leu His Pro Ala Ser Leu His
370 375 380
Gly Thr Glu Asp Thr Glu Arg Glu Val Leu Lys Trp Lys Phe Asp Ser
385 390 395 400
His Leu Ala Phe His His Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr
405 410 415
Lys Asp Cys Ala Ala Val Ile Thr Leu Trp Gln Arg Pro Leu Val Ala
420 425 430
Leu Ile Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Lys
435 440 445
Ile Gly Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp
450 455 460
Val Gly Asp Ala Tyr Phe Ser Val Pro Leu Asp Lys Asp Phe Arg Lys
465 470 475 480
Tyr Thr Ala Phe Thr Ile Pro Ser Ile Trp Lys Gly Ser Pro Ala Ile
485 490 495
Phe Gln Ser Ser Met Thr Lys Lys Gln Asn Pro Asp Ile Val Ile Tyr
500 505 510
Gln Tyr Met Asp Asp Leu Tyr Val Pro Ile Val Leu Pro Glu Lys Asp
515 520 525
Ser Trp Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Ala Gly
530 535 540
Ile Lys Val Lys Gln Leu Ile Leu Lys Glu Pro Val His Gly Val Tyr
545 550 555 560
Glu Pro Ile Val Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn
565 570 575
Arg Ala Gly Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp
580 585 590
Lys Glu Ala Thr Thr Thr Leu Val Glu Arg Tyr Leu Arg Asp Gln Gln
595 600 605
Leu Leu Gly Ile Trp Gly Cys Ala Cys Thr Pro Tyr Asp Ile Asn Gln
610 615 620
Met Leu Arg Gly Pro Gly Arg Ala Phe Val Thr Ile Arg Gln Gly Ser
625 630 635 640
Leu
<210>39
<211>641
<212>PRT
<213>人工序列
<220>
<223>含有Rev-Nef-Tat和CTL的杂交蛋白(RNT-CTL)
<400>39
Met Ala Gly Arg Ser Gly Asp Ser Asp Glu Glu Leu Leu Lys Thr Val
1 5 10 15
Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn Pro Pro Pro Ser Asn Glu
20 25 30
Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg
35 40 45
Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg Ile Leu Ser Thr Phe Leu
50 55 60
Gly Arg Pro Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg
65 70 75 80
Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly Asn Ser Gly Thr Gln Gly
85 90 95
Val Gly Ser Pro Gln Val Leu Val Glu Ser Pro Ala Val Leu Glu Pro
100 105 110
Gly Thr Lys Glu Thr Ser Val Gly Lys Trp Ser Lys Cys Ser Gly Trp
115 120 125
Pro Thr Val Arg Glu Arg Met Lys Gln Ala Glu Pro Glu Pro Ala Ala
130 135 140
Asp Gly Val Gly Ala Ala Ser Arg Asp Leu Glu Lys His Gly Ala Ile
145 150 155 160
Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala Ala Cys Ala Trp Leu Glu
165 170 175
Ala Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln Val Pro
180 185 190
Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu Asp Leu Ser His Phe Leu
195 200 205
Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Pro Lys Arg Gln
210 215 220
Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr Phe Pro Asp
225 230 235 240
Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val Arg Tyr Pro Leu Thr Phe
245 250 255
Gly Trp Cys Phe Lys Leu Val Pro Val Glu Pro Asp Glu Glu Glu Asn
260 265 270
Ser Ser Leu Leu His Pro Ala Ser Leu His Gly Thr Glu Asp Thr Glu
275 280 285
Arg Glu Val Leu Lys Trp Lys Phe Asp Ser His Leu Ala Phe His His
290 295 300
Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr Lys Asp Cys Lys Leu Glu
305 310 315 320
Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser Gln Pro
325 330 335
Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu His Cys
340 345 350
Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly Arg Lys
355 360 365
Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr His Gln
370 375 380
Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp Pro Thr
385 390 395 400
Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu Ala Asp
405 410 415
Pro Phe Asp Ala Ala Val Ile Thr Leu Trp Gln Arg Pro Leu Val Ala
420 425 430
Leu Ile Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Lys
435 440 445
Ile Gly Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp
450 455 460
Val Gly Asp Ala Tyr Phe Ser Val Pro Leu Asp Lys Asp Phe Arg Lys
465 470 475 480
Tyr Thr Ala Phe Thr Ile Pro Ser Ile Trp Lys Gly Ser Pro Ala Ile
485 490 495
Phe Gln Ser Ser Met Thr Lys Lys Gln Asn Pro Asp Ile Val Ile Tyr
500 505 510
Gln Tyr Met Asp Asp Leu Tyr Val Pro Ile Val Leu Pro Glu Lys Asp
515 520 525
Ser Trp Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Ala Gly
530 535 540
Ile Lys Val Lys Gln Leu Ile Leu Lys Glu Pro Val His Gly Val Tyr
545 550 555 560
Glu Pro Ile Val Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn
565 570 575
Arg Ala Gly Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp
580 585 590
Lys Glu Ala Thr Thr Thr Leu Val Glu Arg Tyr Leu Arg Asp Gln Gln
595 600 605
Leu Leu Gly Ile Trp Gly Cys Ala Cys Thr Pro Tyr Asp Ile Asn Gln
610 615 620
Met Leu Arg Gly Pro Gly Arg Ala Phe Val Thr Ile Arg Gln Gly Ser
625 630 635 640
Leu
<210>40
<211>842
<212>PRT
<213>人工序列
<220>
<223>含有Tat-Rev-Nef和截短的Gag蛋白(TRN-dgag)的杂交蛋白的编码序列
<400>40
Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser
1 5 10 15
Gln Pro Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu
20 25 30
His Cys Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly
35 40 45
Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr
50 55 60
His Gln Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp
65 70 75 80
Pro Thr Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu
85 90 95
Ala Asp Pro Phe Asp Thr Ser Ala Gly Arg Ser Gly Asp Ser Asp Glu
100 105 110
Glu Leu Leu Lys Thr Val Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn
115 120 125
Pro Pro Pro Ser Asn Glu Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg
130 135 140
Arg Arg Trp Arg Glu Arg Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg
145 150 155 160
Ile Leu Ser Thr Phe Leu Gly Arg Pro Ala Glu Pro Val Pro Leu Gln
165 170 175
Leu Pro Pro Leu Glu Arg Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly
180 185 190
Asn Ser Gly Thr Gln Gly Val Gly Ser Pro Gln Val Leu Val Glu Ser
195 200 205
Pro Ala Val Leu Glu Pro Gly Thr Lys Glu Lys Leu Val Gly Lys Trp
210 215 220
Ser Lys Cys Ser Gly Trp Pro Thr Val Arg Glu Arg Met Lys Gln Ala
225 230 235 240
Glu Pro Glu Pro Ala Ala Asp Gly Val Gly Ala Ala Ser Arg Asp Leu
245 250 255
Glu Lys His Gly Ala Ile Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala
260 265 270
Ala Cys Ala Trp Leu Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro
275 280 285
Val Arg Pro Gln Val Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu
290 295 300
Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile
305 310 315 320
Tyr Ser Pro Lys Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr
325 330 335
Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val
340 345 350
Arg Tyr Pro Leu Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Glu
355 360 365
Pro Asp Glu Glu Glu Asn Ser Ser Leu Leu His Pro Ala Ser Leu His
370 375 380
Gly Thr Glu Asp Thr Glu Arg Glu Val Leu Lys Trp Lys Phe Asp Ser
385 390 395 400
His Leu Ala Phe His His Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr
405 410 415
Lys Asp Cys Ala Ala Val Leu Asp Lys Trp Glu Lys Ile Arg Leu Arg
420 425 430
Pro Gly Gly Lys Lys Lys Tyr Gln Leu Lys His Ile Val Trp Ala Ser
435 440 445
Arg Glu Leu Glu Arg Phe Ala Val Asn Pro Gly Leu Leu Glu Thr Ser
450 455 460
Glu Gly Cys Arg Gln Ile Met Gly Gln Leu Gln Pro Ser Leu Gln Thr
465 470 475 480
Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn Thr Val Ala Thr Leu Tyr
485 490 495
Cys Val His Gln Lys Ile Glu Val Lys Asp Thr Lys Glu Ala Leu Asp
500 505 510
Lys Val Glu Glu Glu Gln Asn Asn Ser Lys Lys Lys Ala Gln Gln Glu
515 520 525
Ala Ala Asp Ala Gly Asn Arg Asn Gln Val Ser Gln Asn Tyr Pro Ile
530 535 540
Val Gln Asn Leu Gln Gly Gln Met Val His Gln Ala Ile Ser Pro Arg
545 550 555 560
Thr Leu Asn Ala Trp Val Lys Val Val Glu Glu Lys Ala Phe Ser Pro
565 570 575
Glu Val Ile Pro Met Phe Ser Ala Leu Ser Glu Gly Ala Thr Pro Gln
580 585 590
Asp Leu Asn Thr Met Leu Asn Thr Val Gly Gly His Gln Ala Ala Met
595 600 605
Gln Met Leu Lys Glu Thr Ile Asn Glu Glu Ala Ala Glu Trp Asp Arg
610 615 620
Leu His Pro Val His Ala Gly Pro Ile Ala Pro Gly Gln Met Arg Glu
625 630 635 640
Pro Arg Gly Ser Asp Ile Ala Gly Thr Thr Ser Thr Leu Gln Glu Gln
645 650 655
Ile Gly Trp Met Thr Asn Asn Pro Pro Ile Pro Val Gly Glu Ile Tyr
660 665 670
Lys Arg Trp Ile Ile Leu Gly Leu Asn Lys Ile Val Arg Met Tyr Ser
675 680 685
Pro Thr Ser Ile Leu Asp Ile Lys Gln Gly Pro Lys Glu Pro Phe Arg
690 695 700
Asp Tyr Val Asp Arg Phe Tyr Lys Thr Leu Arg Ala Glu Gln Ala Thr
705 710 715 720
Gln Glu Val Lys Asn Trp Met Thr Glu Thr Leu Leu Val Gln Asn Ala
725 730 735
Asn Pro Asp Cys Lys Thr Ile Leu Lys Ala Leu Gly Pro Ala Ala Thr
740 745 750
Leu Glu Glu Met Met Thr Ala Cys Gln Gly Val Gly Gly Pro Gly His
755 760 765
Lys Ala Arg Val Leu Ala Glu Ala Met Ser Gln Val Thr Gly Ser Ala
770 775 780
Ala Ile Met Met Gln Arg Gly Asn Phe Arg Asn Gln Arg Lys Thr Val
785 790 795 800
Lys Cys Phe Asn Cys Gly Lys Glu Gly His Ile Ala Arg Asn Cys Arg
805 810 815
Ala Pro Arg Lys Lys Gly Cys Trp Lys Cys Gly Lys Glu Gly His Gln
820 825 830
Met Lys Asp Cys Thr Glu Arg Gln Ala Asn
835 840
<210>41
<211>1064
<212>PRT
<213>人工序列
<220>
<223>含有Tat-Rev-Nef,CTL和截短的Gag蛋白(TRN-TCL-dgag)的杂交蛋白的编码序列
<400>41
Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser
1 5 10 15
Gln Pro Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu
20 25 30
His Cys Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly
35 40 45
Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr
50 55 60
His Gln Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp
65 70 75 80
Pro Thr Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu
85 90 95
Ala Asp Pro Phe Asp Thr Ser Ala Gly Arg Ser Gly Asp Ser Asp Glu
100 105 110
Glu Leu Leu Lys Thr Val Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn
115 120 125
Pro Pro Pro Ser Asn Glu Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg
130 135 140
Arg Arg Trp Arg Glu Arg Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg
145 150 155 160
Ile Leu Ser Thr Phe Leu Gly Arg Pro Ala Glu Pro Val Pro Leu Gln
165 170 175
Leu Pro Pro Leu Glu Arg Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly
180 185 190
Asn Ser Gly Thr Gln Gly Val Gly Ser Pro Gln Val Leu Val Glu Ser
195 200 205
Pro Ala Val Leu Glu Pro Gly Thr Lys Glu Lys Leu Val Gly Lys Trp
210 215 220
Ser Lys Cys Ser Gly Trp Pro Thr Val Arg Glu Arg Met Lys Gln Ala
225 230 235 240
Glu Pro Glu Pro Ala Ala Asp Gly Val Gly Ala Ala Ser Arg Asp Leu
245 250 255
Glu Lys His Gly Ala Ile Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala
260 265 270
Ala Cys Ala Trp Leu Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro
275 280 285
Val Arg Pro Gln Val Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu
290 295 300
Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly Leu Glu GIy Leu Ile
305 310 315 320
Tyr Ser Pro Lys Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr
325 330 335
Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val
340 345 350
Arg Tyr Pro Leu Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Glu
355 360 365
Pro Asp Glu Glu Glu Asn Ser Ser Leu Leu His Pro Ala Ser Leu His
370 375 380
Gly Thr Glu Asp Thr Glu Arg Glu Val Leu Lys Trp Lys Phe Asp Ser
385 390 395 400
His Leu Ala Phe His His Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr
405 410 415
Lys Asp Cys Ala Ala Val Ile Thr Leu Trp Gln Arg Pro Leu Val Ala
420 425 430
Leu Ile Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Lys
435 440 445
Ile Gly Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp
450 455 460
Val Gly Asp Ala Tyr Phe Ser Val Pro Leu Asp Lys Asp Phe Arg Lys
465 470 475 480
Tyr Thr Ala Phe Thr Ile Pro Ser Ile Trp Lys Gly Ser Pro Ala Ile
485 490 495
Phe Gln Ser Ser Met Thr Lys Lys Gln Asn Pro Asp Ile Val Ile Tyr
500 505 510
Gln Tyr Met Asp Asp Leu Tyr Val Pro Ile Val Leu Pro Glu Lys Asp
515 520 525
Ser Trp Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Ala Gly
530 535 540
Ile Lys Val Lys Gln Leu Ile Leu Lys Glu Pro Val His Gly Val Tyr
545 550 555 560
Glu Pro Ile Val Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn
565 570 575
Arg Ala Gly Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp
580 585 590
Lys Glu Ala Thr Thr Thr Leu Val Glu Arg Tyr Leu Arg Asp Gln Gln
595 600 605
Leu Leu Gly Ile Trp Gly Cys Ala Cys Thr Pro Tyr Asp Ile Asn Gln
610 615 620
Met Leu Arg Gly Pro Gly Arg Ala Phe Val Thr Ile Arg Gln Gly Ser
625 630 635 640
Leu Ala Ala Val Leu Asp Lys Trp Glu Lys Ile Arg Leu Arg Pro Gly
645 650 655
Gly Lys Lys Lys Tyr Gln Leu Lys His Ile Val Trp Ala Ser Arg Glu
660 665 670
Leu Glu Arg Phe Ala Val Asn Pro Gly Leu Leu Glu Thr Ser Glu Gly
675 680 685
Cys Arg Gln Ile Met Gly Gln Leu Gln Pro Ser Leu Gln Thr Gly Ser
690 695 700
Glu Glu Leu Arg Ser Leu Tyr Asn Thr Val Ala Thr Leu Tyr Cys Val
705 710 715 720
His Gln Lys Ile Glu Val Lys Asp Thr Lys Glu Ala Leu Asp Lys Val
725 730 735
Glu Glu Glu Gln Asn Asn Ser Lys Lys Lys Ala Gln Gln Glu Ala Ala
740 745 750
Asp Ala Gly Asn Arg Asn Gln Val Ser Gln Asn Tyr Pro Ile Val Gln
755 760 765
Asn Leu Gln Gly Gln Met Val His Gln Ala Ile Ser Pro Arg Thr Leu
770 775 780
Asn Ala Trp Val Lys Val Val Glu Glu Lys Ala Phe Ser Pro Glu Val
785 790 795 800
Ile Pro Met Phe Ser Ala Leu Ser Glu Gly Ala Thr Pro Gln Asp Leu
805 810 815
Asn Thr Met Leu Asn Thr Val Gly Gly His Gln Ala Ala Met Gln Met
820 825 830
Leu Lys Glu Thr Ile Asn Glu Glu Ala Ala Glu Trp Asp Arg Leu His
835 840 845
Pro Val His Ala Gly Pro Ile Ala Pro Gly Gln Met Arg Glu Pro Arg
850 855 860
Gly Ser Asp Ile Ala Gly Thr Thr Ser Thr Leu Gln Glu Gln Ile Gly
865 870 875 880
Trp Met Thr Asn Asn Pro Pro Ile Pro Val Gly Glu Ile Tyr Lys Arg
885 890 895
Trp Ile Ile Leu Gly Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Thr
900 905 910
Ser Ile Leu Asp Ile Lys Gln Gly Pro Lys Glu Pro Phe Arg Asp Tyr
915 920 925
Val Asp Arg Phe Tyr Lys Thr Leu Arg Ala Glu Gln Ala Thr Gln Glu
930 935 940
Val Lys Asn Trp Met Thr Glu Thr Leu Leu Val Gln Asn Ala Asn Pro
945 950 955 960
Asp Cys Lys Thr Ile Leu Lys Ala Leu Gly Pro Ala Ala Thr Leu Glu
965 970 975
Glu Met Met Thr Ala Cys Gln Gly Val Gly Gly Pro Gly His Lys Ala
980 985 990
Arg Val Leu Ala Glu Ala Met Ser Gln Val Thr Gly Ser Ala Ala Ile
995 1000 1005
Met Met Gln Arg Gly Asn Phe Arg Asn Gln Arg Lys Thr Val Lys
1010 1015 1020
Cys Phe Asn Cys Gly Lys Glu Gly His Ile Ala Arg Asn Cys Arg
1025 1030 1035
Ala Pro Arg Lys Lys Gly Cys Trp Lys Cys Gly Lys Glu Gly His
1040 1045 1050
Gln Met Lys Asp Cys Thr Glu Arg Gln Ala Asn
1055 1060
<210>42
<211>1064
<212>PRT
<213>人工序列
<220>
<223>含有Tat-Rev-Nef,CTL和截短的Gag蛋白(TRN-CTL-dgag)的杂交蛋白
<400>42
Met Ala Gly Arg Ser Gly Asp Ser Asp Glu Glu Leu Leu Lys Thr Val
1 5 10 15
Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn Pro Pro Pro Ser Asn Glu
20 25 30
Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg
35 40 45
Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg Ile Leu Ser Thr Phe Leu
50 55 60
Gly Arg Pro Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg
65 70 75 80
Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly Asn Ser Gly Thr Gln Gly
85 90 95
Val Gly Ser Pro Gln Val Leu Val Glu Ser Pro Ala Val Leu Glu Pro
100 105 110
Gly Thr Lys Glu Thr Ser Val Gly Lys Trp Ser Lys Cys Ser Gly Trp
115 120 125
Pro Thr Val Arg Glu Arg Met Lys Gln Ala Glu Pro Glu Pro Ala Ala
130 135 140
Asp Gly Val Gly Ala Ala Ser Arg Asp Leu Glu Lys His Gly Ala Ile
145 150 155 160
Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala Ala Cys Ala Trp Leu Glu
165 170 175
Ala Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln Val Pro
180 185 190
Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu Asp Leu Ser His Phe Leu
195 200 205
Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Pro Lys Arg Gln
210 215 220
Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr Phe Pro Asp
225 230 235 240
Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val Arg Tyr Pro Leu Thr Phe
245 250 255
Gly Trp Cys Phe Lys Leu Val Pro Val Glu Pro Asp Glu Glu Glu Asn
260 265 270
Ser Ser Leu Leu His Pro Ala Ser Leu His Gly Thr Glu Asp Thr Glu
275 280 285
Arg Glu Val Leu Lys Trp Lys Phe Asp Ser His Leu Ala Phe His His
290 295 300
Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr Lys Asp Cys Lys Leu Glu
305 310 315 320
Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser Gln Pro
325 330 335
Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu His Cys
340 345 350
Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly Arg Lys
355 360 365
Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr His Gln
370 375 380
Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp Pro Thr
385 390 395 400
Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu Ala Asp
405 410 415
Pro Phe Asp Ala Ala Val Ile Thr Leu Trp Gln Arg Pro Leu Val Ala
420 425 430
Leu Ile Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Lys
435 440 445
Ile Gly Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp
450 455 460
Val Gly Asp Ala Tyr Phe Ser Val Pro Leu Asp Lys Asp Phe Arg Lys
465 470 475 480
Tyr Thr Ala Phe Thr Ile Pro Ser Ile Trp Lys Gly Ser Pro Ala Ile
485 490 495
Phe Gln Ser Ser Met Thr Lys Lys Gln Asn Pro Asp Ile Val Ile Tyr
500 505 510
Gln Tyr Met Asp Asp Leu Tyr Val Pro Ile Val Leu Pro Glu Lys Asp
515 520 525
Ser Trp Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Ala Gly
530 535 540
Ile Lys Val Lys Gln Leu Ile Leu Lys Glu Pro Val His Gly Val Tyr
545 550 555 560
Glu Pro Ile Val Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn
565 570 575
Arg Ala Gly Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp
580 585 590
Lys Glu Ala Thr Thr Thr Leu Val Glu Arg Tyr Leu Arg Asp Gln Gln
595 600 605
Leu Leu Gly Ile Trp Gly Cys Ala Cys Thr Pro Tyr Asp Ile Asn Gln
610 615 620
Met Leu Arg Gly Pro Gly Arg Ala Phe Val Thr Ile Arg Gln Gly Ser
625 630 635 640
Leu Ala Ala Val Leu Asp Lys Trp Glu Lys Ile Arg Leu Arg Pro Gly
645 650 655
Gly Lys Lys Lys Tyr Gln Leu Lys His Ile Val Trp Ala Ser Arg Glu
660 665 670
Leu Glu Arg Phe Ala Val Asn Pro Gly Leu Leu Glu Thr Ser Glu Gly
675 680 685
Cys Arg Gln Ile Met Gly Gln Leu Gln Pro Ser Leu Gln Thr Gly Ser
690 695 700
Glu Glu Leu Arg Ser Leu Tyr Asn Thr Val Ala Thr Leu Tyr Cys Val
705 710 715 720
His Gln Lys Ile Glu Val Lys Asp Thr Lys Glu Ala Leu Asp Lys Val
725 730 735
Glu Glu Glu Gln Asn Asn Ser Lys Lys Lys Ala Gln Gln Glu Ala Ala
740 745 750
Asp Ala Gly Asn Arg Asn Gln Val Ser Gln Asn Tyr Pro Ile Val Gln
755 760 765
Asn Leu Gln Gly Gln Met Val His Gln Ala Ile Ser Pro Arg Thr Leu
770 775 780
Asn Ala Trp Val Lys Val Val Glu Glu Lys Ala Phe Ser Pro Glu Val
785 790 795 800
Ile Pro Met Phe Ser Ala Leu Ser Glu Gly Ala Thr Pro Gln Asp Leu
805 810 815
Asn Thr Met Leu Asn Thr Val Gly Gly His Gln Ala Ala Met Gln Met
820 825 830
Leu Lys Glu Thr Ile Asn Glu Glu Ala Ala Glu Trp Asp Arg Leu His
835 840 845
Pro Val His Ala Gly Pro Ile Ala Pro Gly Gln Met Arg Glu Pro Arg
850 855 860
Gly Ser Asp Ile Ala Gly Thr Thr Ser Thr Leu Gln Glu Gln Ile Gly
865 870 875 880
Trp Met Thr Asn Asn Pro Pro Ile Pro Val Gly Glu Ile Tyr Lys Arg
885 890 895
Trp Ile Ile Leu Gly Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Thr
900 905 910
Ser Ile Leu Asp Ile Lys Gln Gly Pro Lys Glu Pro Phe Arg Asp Tyr
915 920 925
Val Asp Arg Phe Tyr Lys Thr Leu Arg Ala Glu Gln Ala Thr Gln Glu
930 935 940
Val Lys Asn Trp Met Thr Glu Thr Leu Leu Val Gln Asn Ala Asn Pro
945 950 955 960
Asp Cys Lys Thr Ile Leu Lys Ala Leu Gly Pro Ala Ala Thr Leu Glu
965 970 975
Glu Met Met Thr Ala Cys Gln Gly Val Gly Gly Pro Gly His Lys Ala
980 985 990
Arg Val Leu Ala Glu Ala Met Ser Gln Val Thr Gly Ser Ala Ala Ile
995 1000 1005
Met Met Gln Arg Gly Asn Phe Arg Asn Gln Arg Lys Thr Val Lys
1010 1015 1020
Cys Phe Asn Cys Gly Lys Glu Gly His Ile Ala Arg Asn Cys Arg
1025 1030 1035
Ala Pro Arg Lys Lys Gly Cys Trp Lys Cys Gly Lys Glu Gly His
1040 1045 1050
Gln Met Lys Asp Cys Thr Glu Arg Gln Ala Asn
1055 1060
<210>43
<211>1064
<212>PRT
<213>人工序列
<220>
<223>含有Tat-Rev-Nef,截短的Gag蛋白和CTL(TRN-dgag-CTL)的杂交蛋白
<400>43
Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser
1 5 10 15
Gln Pro Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu
20 25 30
His Cys Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly
35 40 45
Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr
50 55 60
His Gln Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp
65 70 75 80
Pro Thr Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu
85 90 95
Ala Asp Pro Phe Asp Thr Ser Ala Gly Arg Ser Gly Asp Ser Asp Glu
100 105 110
Glu Leu Leu Lys Thr Val Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn
115 120 125
Pro Pro Pro Ser Asn Glu Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg
130 135 140
Arg Arg Trp Arg Glu Arg Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg
145 150 155 160
Ile Leu Ser Thr Phe Leu Gly Arg Pro Ala Glu Pro Val Pro Leu Gln
165 170 175
Leu Pro Pro Leu Glu Arg Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly
180 185 190
Asn Ser Gly Thr Gln Gly Val Gly Ser Pro Gln Val Leu Val Glu Ser
195 200 205
Pro Ala Val Leu Glu Pro Gly Thr Lys Glu Lys Leu Val Gly Lys Trp
210 215 220
Ser Lys Cys Ser Gly Trp Pro Thr Val Arg Glu Arg Met Lys Gln Ala
225 230 235 240
Glu Pro Glu Pro Ala Ala Asp Gly Val Gly Ala Ala Ser Arg Asp Leu
245 250 255
Glu Lys His Gly Ala Ile Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala
260 265 270
Ala Cys Ala Trp Leu Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro
275 280 285
Val Arg Pro Gln Val Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu
290 295 300
Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile
305 310 315 320
Tyr Ser Pro Lys Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr
325 330 335
Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val
340 345 350
Arg Tyr Pro Leu Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Glu
355 360 365
Pro Asp Glu Glu Glu Asn Ser Ser Leu Leu His Pro Ala Ser Leu His
370 375 380
Gly Thr Glu Asp Thr Glu Arg Glu Val Leu Lys Trp Lys Phe Asp Ser
385 390 395 400
His Leu Ala Phe His His Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr
405 410 415
Lys Asp Cys Ala Ala Val Leu Asp Lys Trp Glu Lys Ile Arg Leu Arg
420 425 430
Pro Gly Gly Lys Lys Lys Tyr Gln Leu Lys His Ile Val Trp Ala Ser
435 440 445
Arg Glu Leu Glu Arg Phe Ala Val Asn Pro Gly Leu Leu Glu Thr Ser
450 455 460
Glu Gly Cys Arg Gln Ile Met Gly Gln Leu Gln Pro Ser Leu Gln Thr
465 470 475 480
Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn Thr Val Ala Thr Leu Tyr
485 490 495
Cys Val His Gln Lys Ile Glu Val Lys Asp Thr Lys Glu Ala Leu Asp
500 505 510
Lys Val Glu Glu Glu Gln Asn Asn Ser Lys Lys Lys Ala Gln Gln Glu
515 520 525
Ala Ala Asp Ala Gly Asn Arg Asn Gln Val Ser Gln Asn Tyr Pro Ile
530 535 540
Val Gln Asn Leu Gln Gly Gln Met Val His Gln Ala Ile Ser Pro Arg
545 550 555 560
Thr Leu Asn Ala Trp Val Lys Val Val Glu Glu Lys Ala Phe Ser Pro
565 570 575
Glu Val Ile Pro Met Phe Ser Ala Leu Ser Glu Gly Ala Thr Pro Gln
580 585 590
Asp Leu Asn Thr Met Leu Asn Thr Val Gly Gly His Gln Ala Ala Met
595 600 605
Gln Met Leu Lys Glu Thr Ile Asn Glu Glu Ala Ala Glu Trp Asp Arg
610 615 620
Leu His Pro Val His Ala Gly Pro Ile Ala Pro Gly Gln Met Arg Glu
625 630 635 640
Pro Arg Gly Ser Asp Ile Ala Gly Thr Thr Ser Thr Leu Gln Glu Gln
645 650 655
Ile Gly Trp Met Thr Asn Asn Pro Pro Ile Pro Val Gly Glu Ile Tyr
660 665 670
Lys Arg Trp Ile Ile Leu Gly Leu Asn Lys Ile Val Arg Met Tyr Ser
675 680 685
Pro Thr Ser Ile Leu Asp Ile Lys Gln Gly Pro Lys Glu Pro Phe Arg
690 695 700
Asp Tyr Val Asp Arg Phe Tyr Lys Thr Leu Arg Ala Glu Gln Ala Thr
705 710 715 720
Gln Glu Val Lys Asn Trp Met Thr Glu Thr Leu Leu Val Gln Asn Ala
725 730 735
Asn Pro Asp Cys Lys Thr Ile Leu Lys Ala Leu Gly Pro Ala Ala Thr
740 745 750
Leu Glu Glu Met Met Thr Ala Cys Gln Gly Val Gly Gly Pro Gly His
755 760 765
Lys Ala Arg Val Leu Ala Glu Ala Met Ser Gln Val Thr Gly Ser Ala
770 775 780
Ala Ile Met Met Gln Arg Gly Asn Phe Arg Asn Gln Arg Lys Thr Val
785 790 795 800
Lys Cys Phe Asn Cys Gly Lys Glu Gly His Ile Ala Arg Asn Cys Arg
805 810 815
Ala Pro Arg Lys Lys Gly Cys Trp Lys Cys Gly Lys Glu Gly His Gln
820 825 830
Met Lys Asp Cys Thr Glu Arg Gln Ala Asn Ala Ala Val Ile Thr Leu
835 840 845
Trp Gln Arg Pro Leu Val Ala Leu Ile Glu Ile Cys Thr Glu Met Glu
850 855 860
Lys Glu Gly Lys Ile Ser Lys Ile Gly Pro Ala Gly Leu Lys Lys Lys
865 870 875 880
Lys Ser Val Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser Val Pro
885 890 895
Leu Asp Lys Asp Phe Arg Lys Tyr Thr Ala Phe Thr Ile Pro Ser Ile
900 905 910
Trp Lys Gly Ser Pro Ala Ile Phe Gln Ser Ser Met Thr Lys Lys Gln
915 920 925
Asn Pro Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp Leu Tyr Val Pro
930 935 940
Ile Val Leu Pro Glu Lys Asp Ser Trp Leu Val Gly Lys Leu Asn Trp
945 950 955 960
Ala Ser Gln Ile Tyr Ala Gly Ile Lys Val Lys Gln Leu Ile Leu Lys
965 970 975
Glu Pro Val His Gly Val Tyr Glu Pro Ile Val Gly Ala Glu Thr Phe
980 985 990
Tyr Val Asp Gly Ala Ala Asn Arg Ala Gly Asn Leu Trp Val Thr Val
995 1000 1005
Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala Thr Thr Thr Leu Val
1010 1015 1020
Glu Arg Tyr Leu Arg Asp Gln Gln Leu Leu Gly Ile Trp Gly Cys
1025 1030 1035
Ala Cys Thr Pro Tyr Asp Ile Asn Gln Met Leu Arg Gly Pro Gly
1040 1045 1050
Arg Ala Phe Val Thr Ile Arg Gln Gly Ser Leu
1055 1060
<210>44
<211>1064
<212>PRT
<213>人工序列
<220>
<223>含有Rev-Nef-Tat,截短的Gag蛋白和CTL(RNT-dgag-CTL)的杂交蛋白
<400>44
Met Ala Gly Arg Ser Gly Asp Ser Asp Glu Glu Leu Leu Lys Thr Val
1 5 10 15
Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn Pro Pro Pro Ser Asn Glu
20 25 30
Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg
35 40 45
Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg Ile Leu Ser Thr Phe Leu
50 55 60
Gly Arg Pro Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg
65 70 75 80
Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly Asn Ser Gly Thr Gln Gly
85 90 95
Val Gly Ser Pro Gln Val Leu Val Glu Ser Pro Ala Val Leu Glu Pro
100 105 110
Gly Thr Lys Glu Thr Ser Val Gly Lys Trp Ser Lys Cys Ser Gly Trp
115 120 125
Pro Thr Val Arg Glu Arg Met Lys Gln Ala Glu Pro Glu Pro Ala Ala
130 135 140
Asp Gly Val Gly Ala Ala Ser Arg Asp Leu Glu Lys His Gly Ala Ile
145 150 155 160
Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala Ala Cys Ala Trp Leu Glu
165 170 175
Ala Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln Val Pro
180 185 190
Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu Asp Leu Ser His Phe Leu
195 200 205
Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Pro Lys Arg Gln
210 215 220
Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr Phe Pro Asp
225 230 235 240
Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val Arg Tyr Pro Leu Thr Phe
245 250 255
Gly Trp Cys Phe Lys Leu Val Pro Val Glu Pro Asp Glu Glu Glu Asn
260 265 270
Ser Ser Leu Leu His Pro Ala Ser Leu His Gly Thr Glu Asp Thr Glu
275 280 285
Arg Glu Val Leu Lys Trp Lys Phe Asp Ser His Leu Ala Phe His His
290 295 300
Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr Lys Asp Cys Lys Leu Glu
305 310 315 320
Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser Gln Pro
325 330 335
Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu His Cys
340 345 350
Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly Arg Lys
355 360 365
Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr His Gln
370 375 380
Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp Pro Thr
385 390 395 400
Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu Ala Asp
405 410 415
Pro Phe Asp Ala Ala Val Leu Asp Lys Trp Glu Lys Ile Arg Leu Arg
420 425 430
Pro Gly Gly Lys Lys Lys Tyr Gln Leu Lys His Ile Val Trp Ala Ser
435 440 445
Arg Glu Leu Glu Arg Phe Ala Val Asn Pro Gly Leu Leu Glu Thr Ser
450 455 460
Glu Gly Cys Arg Gln Ile Met Gly Gln Leu Gln Pro Ser Leu Gln Thr
465 470 475 480
Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn Thr Val Ala Thr Leu Tyr
485 490 495
Cys Val His Gln Lys Ile Glu Val Lys Asp Thr Lys Glu Ala Leu Asp
500 505 510
Lys Val Glu Glu Glu Gln Asn Asn Ser Lys Lys Lys Ala Gln Gln Glu
515 520 525
Ala Ala Asp Ala Gly Asn Arg Asn Gln Val Ser Gln Asn Tyr Pro Ile
530 535 540
Val Gln Asn Leu Gln Gly Gln Met Val His Gln Ala Ile Ser Pro Arg
545 550 555 560
Thr Leu Asn Ala Trp Val Lys Val Val Glu Glu Lys Ala Phe Ser Pro
565 570 575
Glu Val Ile Pro Met Phe Ser Ala Leu Ser Glu Gly Ala Thr Pro Gln
580 585 590
Asp Leu Asn Thr Met Leu Asn Thr Val Gly Gly His Gln Ala Ala Met
595 600 605
Gln Met Leu Lys Glu Thr Ile Asn Glu Glu Ala Ala Glu Trp Asp Arg
610 615 620
Leu His Pro Val His Ala Gly Pro Ile Ala Pro Gly Gln Met Arg Glu
625 630 635 640
Pro Arg Gly Ser Asp Ile Ala Gly Thr Thr Ser Thr Leu Gln Glu Gln
645 650 655
Ile Gly Trp Met Thr Asn Asn Pro Pro Ile Pro Val Gly Glu Ile Tyr
660 665 670
Lys Arg Trp Ile Ile Leu Gly Leu Asn Lys Ile Val Arg Met Tyr Ser
675 680 685
Pro Thr Ser Ile Leu Asp Ile Lys Gln Gly Pro Lys Glu Pro Phe Arg
690 695 700
Asp Tyr Val Asp Arg Phe Tyr Lys Thr Leu Arg Ala Glu Gln Ala Thr
705 710 715 720
Gln Glu Val Lys Asn Trp Met Thr Glu Thr Leu Leu Val Gln Asn Ala
725 730 735
Asn Pro Asp Cys Lys Thr Ile Leu Lys Ala Leu Gly Pro Ala Ala Thr
740 745 750
Leu Glu Glu Met Met Thr Ala Cys Gln Gly Val Gly Gly Pro Gly His
755 760 765
Lys Ala Arg Val Leu Ala Glu Ala Met Ser Gln Val Thr Gly Ser Ala
770 775 780
Ala Ile Met Met Gln Arg Gly Asn Phe Arg Asn Gln Arg Lys Thr Val
785 790 795 800
Lys Cys Phe Asn Cys Gly Lys Glu Gly His Ile Ala Arg Asn Cys Arg
805 810 815
Ala Pro Arg Lys Lys Gly Cys Trp Lys Cys Gly Lys Glu Gly His Gln
820 825 830
Met Lys Asp Cys Thr Glu Arg Gln Ala Asn Ala Ala Val Ile Thr Leu
835 840 845
Trp Gln Arg Pro Leu Val Ala Leu Ile Glu Ile Cys Thr Glu Met Glu
850 855 860
Lys Glu Gly Lys Ile Ser Lys Ile Gly Pro Ala Gly Leu Lys Lys Lys
865 870 875 880
Lys Ser Val Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser Val Pro
885 890 895
Leu Asp Lys Asp Phe Arg Lys Tyr Thr Ala Phe Thr Ile Pro Ser Ile
900 905 910
Trp Lys Gly Ser Pro Ala Ile Phe Gln Ser Ser Met Thr Lys Lys Gln
915 920 925
Asn Pro Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp Leu Tyr Val Pro
930 935 940
Ile Val Leu Pro Glu Lys Asp Ser Trp Leu Val Gly Lys Leu Asn Trp
945 950 955 960
Ala Ser Gln Ile Tyr Ala Gly Ile Lys Val Lys Gln Leu Ile Leu Lys
965 970 975
Glu Pro Val His Gly Val Tyr Glu Pro Ile Val Gly Ala Glu Thr Phe
980 985 990
Tyr Val Asp Gly Ala Ala Asn Arg Ala Gly Asn Leu Trp Val Thr Val
995 1000 1005
Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala Thr Thr Thr Leu Val
1010 1015 1020
Glu Arg Tyr Leu Arg Asp Gln Gln Leu Leu Gly Ile Trp Gly Cys
1025 1030 1035
Ala Cys Thr Pro Tyr Asp Ile Asn Gln Met Leu Arg Gly Pro Gly
1040 1045 1050
Arg Ala Phe Val Thr Ile Arg Gln Gly Ser Leu
1055 1060
<210>45
<211>1006
<212>PRT
<213>人工序列
<220>
<223>含有Tat-Rev-Nef,截短的Gag蛋白和CTL(RNT-dgag-CTL)的杂交蛋白
<400>45
Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser
1 5 10 15
Gln Pro Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu
20 25 30
His Cys Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly
35 40 45
Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr
50 55 60
His Gln Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp
55 70 75 80
Pro Thr Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu
85 90 95
Ala Asp Pro Phe Asp Thr Ser Ala Gly Arg Ser Gly Asp Ser Asp Glu
100 105 110
Glu Leu Leu Lys Thr Val Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn
115 120 125
Pro Pro Pro Ser Asn Glu Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg
130 135 140
Arg Arg Trp Arg Glu Arg Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg
145 150 155 160
Ile Leu Ser Thr Phe Leu Gly Arg Pro Ala Glu Pro Val Pro Leu Gln
165 170 175
Leu Pro Pro Leu Glu Arg Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly
180 185 190
Asn Ser Gly Thr Gln Gly Val Gly Ser Pro Gln Val Leu Val Glu Ser
195 200 205
Pro Ala Val Leu Glu Pro Gly Thr Lys Glu Lys Leu Val Gly Lys Trp
210 215 220
Ser Lys Cys Ser Gly Trp Pro Thr Val Arg Glu Arg Met Lys Gln Ala
225 230 235 240
Glu Pro Glu Pro Ala Ala Asp Gly Val Gly Ala Ala Ser Arg Asp Leu
245 250 255
Glu Lys His Gly Ala Ile Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala
260 265 270
Ala Cys Ala Trp Leu Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro
275 280 285
Val Arg Pro Gln Val Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu
290 295 300
Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile
305 310 315 320
Tyr Ser Pro Lys Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr
325 330 335
Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val
340 345 350
Arg Tyr Pro Leu Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Glu
355 360 365
Pro Asp Glu Glu Glu Asn Ser Ser Leu Leu His Pro Ala Ser Leu His
370 375 380
Gly Thr Glu Asp Thr Glu Arg Glu Val Leu Lys Trp Lys Phe Asp Ser
385 390 395 400
His Leu Ala Phe His His Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr
405 410 415
Lys Asp Cys Ala Ala Val Gly Ala Arg Ala Ser Val Leu Ser Gly Gly
420 425 430
Glu Leu Asp Lys Trp Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys
435 440 445
Lys Tyr Gln Leu Lys His Ile Val Trp Ala Ser Arg Glu Leu Glu Arg
450 455 460
Phe Ala Val Asn Pro Gly Leu Leu Glu Thr Ser Glu Gly Cys Arg Gln
465 470 475 480
Ile Met Gly Gln Leu Gln Pro Ser Leu Gln Thr Gly Ser Glu Glu Leu
485 490 495
Arg Ser Leu Tyr Asn Thr Val Ala Thr Leu Tyr Cys Val His Gln Lys
500 505 510
Ile Glu Val Lys Asp Thr Lys Glu Ala Leu Asp Lys Val Glu Glu Glu
515 520 525
Gln Asn Asn Ser Lys Lys Lys Ala Gln Gln Glu Ala Ala Asp Ala Gly
530 535 540
Asn Arg Asn Gln Val Ser Gln Asn Tyr Pro Ile Val Gln Asn Leu Gln
545 550 555 560
Gly Gln Met Val His Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp
565 570 575
Val Lys Val Val Glu Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met
580 585 590
Phe Ser Ala Leu Ser Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met
595 600 605
Leu Asn Thr Val Gly Gly His Gln Ala Ala Met Gln Met Leu Lys Glu
610 615 620
Thr Ile Asn Glu Glu Ala Ala Glu Trp Asp Arg Leu His Pro Val His
625 630 635 640
Ala Gly Pro Ile Ala Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp
645 650 655
Ile Ala Gly Thr Thr Ser Thr Leu Gln Glu Gln Ile Gly Trp Met Thr
660 665 670
Asn Asn Pro Pro Ile Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile
675 680 685
Leu Gly Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu
690 695 700
Asp Ile Lys Gln Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg
705 710 715 720
Phe Tyr Lys Thr Leu Arg Ala Glu Gln Ala Thr Gln Glu Val Lys Asn
725 730 735
Trp Met Thr Glu Thr Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys
740 745 750
Thr Ile Leu Lys Ala Leu Gly Pro Ala Ala Thr Leu Glu Glu Met Met
755 760 765
Thr Ala Cys Gln Gly Val Gly Gly Pro Gly His Lys Ala Arg Val Leu
770 775 780
Ala Ala Val Ile Thr Leu Trp Gln Arg Pro Leu Val Ala Leu Ile Glu
785 790 795 800
Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Lys Ile Gly Pro
805 810 815
Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp Val Gly Asp
820 825 830
Ala Tyr Phe Ser Val Pro Leu Asp Lys Asp Phe Arg Lys Tyr Thr Ala
835 840 845
Phe Thr Ile Pro Ser Ile Trp Lys Gly Ser Pro Ala Ile Phe Gln Ser
850 855 860
Ser Met Thr Lys Lys Gln Asn Pro Asp Ile Val Ile Tyr Gln Tyr Met
865 870 875 880
Asp Asp Leu Tyr Val Pro Ile Val Leu Pro Glu Lys Asp Ser Trp Leu
885 890 895
Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Ala Gly Ile Lys Val
900 905 910
Lys Gln Leu Ile Leu Lys Glu Pro Val His Gly Val Tyr Glu Pro Ile
915 920 925
Val Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn Arg Ala Gly
930 935 940
Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala
945 950 955 960
Thr Thr Thr Leu Val Glu Arg Tyr Leu Arg Asp Gln Gln Leu Leu Gly
965 970 975
Ile Trp Gly Cys Ala Cys Thr Pro Tyr Asp Ile Asn Gln Met Leu Arg
980 985 990
Gly Pro Gly Arg Ala Phe Val Thr Ile Arg Gln Gly Ser Leu
995 1000 1005
<210>46
<211>1006
<212>PRT
<213>人工序列
<220>
<223>含有Tat-Rev-Nef,CTL和截短的Gag蛋白(TRN-CTL-optp17/24)杂交蛋白的编码序列
<400>46
Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser
1 5 10 15
Gln Pro Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu
20 25 30
His Cys Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly
35 40 45
Arg Lys Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr
50 55 60
His Gln Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp
65 70 75 80
Pro Thr Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu
85 90 95
Ala Asp Pro Phe Asp Thr Ser Ala Gly Arg Ser Gly Asp Ser Asp Glu
100 105 110
Glu Leu Leu Lys Thr Val Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn
115 120 125
Pro Pro Pro Ser Asn Glu Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg
130 135 140
Arg Arg Trp Arg Glu Arg Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg
145 150 155 160
Ile Leu Ser Thr Phe Leu Gly Arg Pro Ala Glu Pro Val Pro Leu Gln
165 170 175
Leu Pro Pro Leu Glu Arg Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly
180 185 190
Asn Ser Gly Thr Gln Gly Val Gly Ser Pro Gln Val Leu Val Glu Ser
195 200 205
Pro Ala Val Leu Glu Pro Gly Thr Lys Glu Lys Leu Val Gly Lys Trp
210 215 220
Ser Lys Cys Ser Gly Trp Pro Thr Val Arg Glu Arg Met Lys Gln Ala
225 230 235 240
Glu Pro Glu Pro Ala Ala Asp Gly Val Gly Ala Ala Ser Arg Asp Leu
245 250 255
Glu Lys His Gly Ala Ile Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala
260 265 270
Ala Cys Ala Trp Leu Glu Ala Gln Glu Glu Glu Glu Val Gly Phe Pro
275 280 285
Val Arg Pro Gln Val Pro Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu
290 295 300
Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile
305 310 315 320
Tyr Ser Pro Lys Arg Gln Glu Ile Leu Asp Leu Trp Val Tyr His Thr
325 330 335
Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val
340 345 350
Arg Tyr Pro Leu Thr Phe Gly Trp Cys Phe Lys Leu Val Pro Val Glu
355 360 365
Pro Asp Glu Glu Glu Asn Ser Ser Leu Leu His Pro Ala Ser Leu His
370 375 380
Gly Thr Glu Asp Thr Glu Arg Glu Val Leu Lys Trp Lys Phe Asp Ser
385 390 395 400
His Leu Ala Phe His His Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr
405 410 415
Lys Asp Cys Ala Ala Val Ile Thr Leu Trp Gln Arg Pro Leu Val Ala
420 425 430
Leu Ile Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Lys
435 440 445
Ile Gly Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp
450 455 460
Val Gly Asp Ala Tyr Phe Ser Val Pro Leu Asp Lys Asp Phe Arg Lys
465 470 475 480
Tyr Thr Ala Phe Thr Ile Pro Ser Ile Trp Lys Gly Ser Pro Ala Ile
485 490 495
Phe Gln Ser Ser Met Thr Lys Lys Gln Asn Pro Asp Ile Val Ile Tyr
500 505 510
Gln Tyr Met Asp Asp Leu Tyr Val Pro Ile Val Leu Pro Glu Lys Asp
515 520 525
Ser Trp Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Ala Gly
530 535 540
Ile Lys Val Lys Gln Leu Ile Leu Lys Glu Pro Val His Gly Val Tyr
545 550 555 560
Glu Pro Ile Val Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn
565 570 575
Arg Ala Gly Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp
580 585 590
Lys Glu Ala Thr Thr Thr Leu Val Glu Arg Tyr Leu Arg Asp Gln Gln
595 600 605
Leu Leu Gly Ile Trp Gly Cys Ala Cys Thr Pro Tyr Asp Ile Asn Gln
610 615 620
Met Leu Arg Gly Pro Gly Arg Ala Phe Val Thr Ile Arg Gln Gly Ser
625 630 635 640
Leu Ala Ala Val Gly Ala Arg Ala Ser Val Leu Ser Gly Gly Glu Leu
645 650 655
Asp Lys Trp Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys Lys Tyr
660 665 670
Gln Leu Lys His Ile Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala
675 680 685
Val Asn Pro Gly Leu Leu Glu Thr Ser Glu Gly Cys Arg Gln Ile Met
690 695 700
Gly Gln Leu Gln Pro Ser Leu Gln Thr Gly Ser Glu Glu Leu Arg Ser
705 710 715 720
Leu Tyr Asn Thr Val Ala Thr Leu Tyr Cys Val His Gln Lys Ile Glu
725 730 735
Val Lys Asp Thr Lys Glu Ala Leu Asp Lys Val Glu Glu Glu Gln Asn
740 745 750
Asn Ser Lys Lys Lys Ala Gln Gln Glu Ala Ala Asp Ala Gly Asn Arg
755 760 765
Asn Gln Val Ser Gln Asn Tyr Pro Ile Val Gln Asn Leu Gln Gly Gln
770 775 780
Met Val His Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp Val Lys
785 790 795 800
Val Val Glu Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met Phe Ser
805 810 815
Ala Leu Ser Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met Leu Asn
820 825 830
Thr Val Gly Gly His Gln Ala Ala Met Gln Met Leu Lys Glu Thr Ile
835 840 845
Asn Glu Glu Ala Ala Glu Trp Asp Arg Leu His Pro Val His Ala Gly
850 855 860
Pro Ile Ala Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp Ile Ala
865 870 875 880
Gly Thr Thr Ser Thr Leu Gln Glu Gln Ile Gly Trp Met Thr Asn Asn
885 890 895
Pro Pro Ile Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu Gly
900 905 910
Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu Asp Ile
915 920 925
Lys Gln Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr
930 935 940
Lys Thr Leu Arg Ala Glu Gln Ala Thr Gln Glu Val Lys Asn Trp Met
945 950 955 960
Thr Glu Thr Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Thr Ile
965 970 975
Leu Lys Ala Leu Gly Pro Ala Ala Thr Leu Glu Glu Met Met Thr Ala
980 985 990
Cys Gln Gly Val Gly Gly Pro Gly His Lys Ala Arg Val Leu
995 1000 1005
<210>47
<211>1006
<212>PRT
<213>人工序列
<220>
<223>含有Rev-Nef-Tat、CTL和截短的Gag蛋白(RNT-CTL-optp17/24)的杂交蛋白
<400>47
Met Ala Gly Arg Ser Gly Asp Ser Asp Glu Glu Leu Leu Lys Thr Val
1 5 10 15
Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn Pro Pro Pro Ser Asn Glu
20 25 30
Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg
35 40 45
Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg Ile Leu Ser Thr Phe Leu
50 55 60
Gly Arg Pro Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg
65 70 75 80
Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly Asn Ser Gly Thr Gln Gly
85 90 95
Val Gly Ser Pro Gln Val Leu Val Glu Ser Pro Ala Val Leu Glu Pro
100 105 110
Gly Thr Lys Glu Thr Ser Val Gly Lys Trp Ser Lys Cys Ser Gly Trp
115 120 125
Pro Thr Val Arg Glu Arg Met Lys Gln Ala Glu Pro Glu Pro Ala Ala
130 135 140
Asp Gly Val Gly Ala Ala Ser Arg Asp Leu Glu Lys His Gly Ala Ile
145 150 155 160
Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala Ala Cys Ala Trp Leu Glu
165 170 175
Ala Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln Val Pro
180 185 190
Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu Asp Leu Ser His Phe Leu
195 200 205
Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Pro Lys Arg Gln
210 215 220
Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr Phe Pro Asp
225 230 235 240
Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val Arg Tyr Pro Leu Thr Phe
245 250 255
Gly Trp Cys Phe Lys Leu Val Pro Val Glu Pro Asp Glu Glu Glu Asn
260 265 270
Ser Ser Leu Leu His Pro Ala Ser Leu His Gly Thr Glu Asp Thr Glu
275 280 285
Arg Glu Val Leu Lys Trp Lys Phe Asp Ser His Leu Ala Phe His His
290 295 300
Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr Lys Asp Cys Lys Leu Glu
305 310 315 320
Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser Gln Pro
325 330 335
Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu His Cys
340 345 350
Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly Arg Lys
355 360 365
Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr His Gln
370 375 380
Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp Pro Thr
385 390 395 400
Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu Ala Asp
405 410 415
Pro Phe Asp Ala Ala Val Ile Thr Leu Trp Gln Arg Pro Leu Val Ala
420 425 430
Leu Ile Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Lys
435 440 445
Ile Gly Pro Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp
450 455 460
Val Gly Asp Ala Tyr Phe Ser Val Pro Leu Asp Lys Asp Phe Arg Lys
465 470 475 480
Tyr Thr Ala Phe Thr Ile Pro Ser Ile Trp Lys Gly Ser Pro Ala Ile
485 490 495
Phe Gln Ser Ser Met Thr Lys Lys Gln Asn Pro Asp Ile Val Ile Tyr
500 505 510
Gln Tyr Met Asp Asp Leu Tyr Val Pro Ile Val Leu Pro Glu Lys Asp
515 520 525
Ser Trp Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Ala Gly
530 535 540
Ile Lys Val Lys Gln Leu Ile Leu Lys Glu Pro Val His Gly Val Tyr
545 550 555 560
Glu Pro Ile Val Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn
565 570 575
Arg Ala Gly Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp
580 585 590
Lys Glu Ala Thr Thr Thr Leu Val Glu Arg Tyr Leu Arg Asp Gln Gln
595 600 605
Leu Leu Gly Ile Trp Gly Cys Ala Cys Thr Pro Tyr Asp Ile Asn Gln
610 615 620
Met Leu Arg Gly Pro Gly Arg Ala Phe Val Thr Ile Arg Gln Gly Ser
625 630 635 640
Leu Ala Ala Val Gly Ala Arg Ala Ser Val Leu Ser Gly Gly Glu Leu
645 650 655
Asp Lys Trp Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys Lys Tyr
660 665 670
Gln Leu Lys His Ile Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala
675 680 685
Val Asn Pro Gly Leu Leu Glu Thr Ser Glu Gly Cys Arg Gln Ile Met
690 695 700
Gly Gln Leu Gln Pro Ser Leu Gln Thr Gly Ser Glu Glu Leu Arg Ser
705 710 715 720
Leu Tyr Asn Thr Val Ala Thr Leu Tyr Cys Val His Gln Lys Ile Glu
725 730 735
Val Lys Asp Thr Lys Glu Ala Leu Asp Lys Val Glu Glu Glu Gln Asn
740 745 750
Asn Ser Lys Lys Lys Ala Gln Gln Glu Ala Ala Asp Ala Gly Asn Arg
755 760 765
Asn Gln Val Ser Gln Asn Tyr Pro Ile Val Gln Asn Leu Gln Gly Gln
770 775 780
Met Val His Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp Val Lys
785 790 795 800
Val Val Glu Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met Phe Ser
805 810 815
Ala Leu Ser Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met Leu Asn
820 825 830
Thr Val Gly Gly His Gln Ala Ala Met Gln Met Leu Lys Glu Thr Ile
835 840 845
Asn Glu Glu Ala Ala Glu Trp Asp Arg Leu His Pro Val His Ala Gly
850 855 860
Pro Ile Ala Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp Ile Ala
865 870 875 880
Gly Thr Thr Ser Thr Leu Gln Glu Gln Ile Gly Trp Met Thr Asn Asn
885 890 895
Pro Pro Ile Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu Gly
900 905 910
Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu Asp Ile
915 920 925
Lys Gln Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr
930 935 940
Lys Thr Leu Arg Ala Glu Gln Ala Thr Gln Glu Val Lys Asn Trp Met
945 950 955 960
Thr Glu Thr Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Thr Ile
965 970 975
Leu Lys Ala Leu Gly Pro Ala Ala Thr Leu Glu Glu Met Met Thr Ala
980 985 990
Cys Gln Gly Val Gly Gly Pro Gly His Lys Ala Arg Val Leu
995 1000 1005
<210>48
<211>1006
<212>PRT
<213>人工序列
<220>
<223>含有Rev-Nef-Tat,截短的Gag蛋白和CTL(RNT-optpl7/24-CTL)的杂交蛋白
<400>48
Met Ala Gly Arg Ser Gly Asp Ser Asp Glu Glu Leu Leu Lys Thr Val
1 5 10 15
Arg Leu Ile Lys Phe Leu Tyr Gln Ser Asn Pro Pro Pro Ser Asn Glu
20 25 30
Gly Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Glu Arg
35 40 45
Gln Arg Gln Ile Arg Ser Ile Ser Glu Arg Ile Leu Ser Thr Phe Leu
50 55 60
Gly Arg Pro Ala Glu Pro Val Pro Leu Gln Leu Pro Pro Leu Glu Arg
65 70 75 80
Leu Thr Leu Asp Cys Ser Glu Asp Cys Gly Asn Ser Gly Thr Gln Gly
85 90 95
Val Gly Ser Pro Gln Val Leu Val Glu Ser Pro Ala Val Leu Glu Pro
100 105 110
Gly Thr Lys Glu Thr Ser Val Gly Lys Trp Ser Lys Cys Ser Gly Trp
115 120 125
Pro Thr Val Arg Glu Arg Met Lys Gln Ala Glu Pro Glu Pro Ala Ala
130 135 140
Asp Gly Val Gly Ala Ala Ser Arg Asp Leu Glu Lys His Gly Ala Ile
145 150 155 160
Thr Ser Ser Asn Thr Ala Thr Asn Asn Ala Ala Cys Ala Trp Leu Glu
165 170 175
Ala Gln Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln Val Pro
180 185 190
Leu Arg Pro Met Thr Tyr Lys Gly Ala Leu Asp Leu Ser His Phe Leu
195 200 205
Lys Glu Lys Gly Gly Leu Glu Gly Leu Ile Tyr Ser Pro Lys Arg Gln
210 215 220
Glu Ile Leu Asp Leu Trp Val Tyr His Thr Gln Gly Tyr Phe Pro Asp
225 230 235 240
Trp Gln Asn Tyr Thr Pro Gly Pro Gly Val Arg Tyr Pro Leu Thr Phe
245 250 255
Gly Trp Cys Phe Lys Leu Val Pro Val Glu Pro Asp Glu Glu Glu Asn
260 265 270
Ser Ser Leu Leu His Pro Ala Ser Leu His Gly Thr Glu Asp Thr Glu
275 280 285
Arg Glu Val Leu Lys Trp Lys Phe Asp Ser His Leu Ala Phe His His
290 295 300
Lys Ala Arg Glu Leu His Pro Glu Tyr Tyr Lys Asp Cys Lys Leu Glu
305 310 315 320
Pro Val Asp Pro Arg Leu Glu Pro Trp Lys His Pro Gly Ser Gln Pro
325 330 335
Arg Thr Pro Cys Thr Asn Cys Tyr Cys Lys Lys Cys Cys Leu His Cys
340 345 350
Gln Val Cys Phe Thr Arg Lys Gly Leu Gly Ile Ser Tyr Gly Arg Lys
355 360 365
Lys Arg Arg Gln Arg Arg Arg Ala Pro Gln Asp Ser Gln Thr His Gln
370 375 380
Val Ser Leu Pro Lys Gln Pro Ser Ser Gln Gln Arg Gly Asp Pro Thr
385 390 395 400
Gly Pro Lys Lys Ser Lys Lys Lys Val Glu Arg Glu Thr Glu Ala Asp
405 410 415
Pro Phe Asp Ala Ala Val Gly Ala Arg Ala Ser Val Leu Ser Gly Gly
420 425 430
Glu Leu Asp Lys Trp Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys
435 440 445
Lys Tyr Gln Leu Lys His Ile Val Trp Ala Ser Arg Glu Leu Glu Arg
450 455 460
Phe Ala Val Asn Pro Gly Leu Leu Glu Thr Ser Glu Gly Cys Arg Gln
465 470 475 480
Ile Met Gly Gln Leu Gln Pro Ser Leu Gln Thr Gly Ser Glu Glu Leu
485 490 495
Arg Ser Leu Tyr Asn Thr Val Ala Thr Leu Tyr Cys Val His Gln Lys
500 505 510
Ile Glu Val Lys Asp Thr Lys Glu Ala Leu Asp Lys Val Glu Glu Glu
515 520 525
Gln Asn Asn Ser Lys Lys Lys Ala Gln Gln Glu Ala Ala Asp Ala Gly
530 535 540
Asn Arg Asn Gln Val Ser Gln Asn Tyr Pro Ile Val Gln Asn Leu Gln
545 550 555 560
Gly Gln Met Val His Gln Ala Ile Ser Pro Arg Thr Leu Asn Ala Trp
565 570 575
Val Lys Val Val Glu Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met
580 585 590
Phe Ser Ala Leu Ser Glu Gly Ala Thr Pro Gln Asp Leu Asn Thr Met
595 600 605
Leu Asn Thr Val Gly Gly His Gln Ala Ala Met Gln Met Leu Lys Glu
610 615 620
Thr Ile Asn Glu Glu Ala Ala Glu Trp Asp Arg Leu His Pro Val His
625 630 635 640
Ala Gly Pro Ile Ala Pro Gly Gln Met Arg Glu Pro Arg Gly Ser Asp
645 650 655
Ile Ala Gly Thr Thr Ser Thr Leu Gln Glu Gln Ile Gly Trp Met Thr
660 665 670
Asn Asn Pro Pro Ile Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile
675 680 685
Leu Gly Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu
690 695 700
Asp Ile Lys Gln Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg
705 710 715 720
Phe Tyr Lys Thr Leu Arg Ala Glu Gln Ala Thr Gln Glu Val Lys Asn
725 730 735
Trp Met Thr Glu Thr Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys
740 745 750
Thr Ile Leu Lys Ala Leu Gly Pro Ala Ala Thr Leu Glu Glu Met Met
755 760 765
Thr Ala Cys Gln Gly Val Gly Gly Pro Gly His Lys Ala Arg Val Leu
770 775 780
Ala Ala Val Ile Thr Leu Trp Gln Arg Pro Leu Val Ala Leu Ile Glu
785 790 795 800
Ile Cys Thr Glu Met Glu Lys Glu Gly Lys Ile Ser Lys Ile Gly Pro
805 810 815
Ala Gly Leu Lys Lys Lys Lys Ser Val Thr Val Leu Asp Val Gly Asp
820 825 830
Ala Tyr Phe Ser Val Pro Leu Asp Lys Asp Phe Arg Lys Tyr Thr Ala
835 840 845
Phe Thr Ile Pro Ser Ile Trp Lys Gly Ser Pro Ala Ile Phe Gln Ser
850 855 860
Ser Met Thr Lys Lys Gln Asn Pro Asp Ile Val Ile Tyr Gln Tyr Met
865 870 875 880
Asp Asp Leu Tyr Val Pro Ile Val Leu Pro Glu Lys Asp Ser Trp Leu
885 890 895
Val Gly Lys Leu Asn Trp Ala Ser Gln Ile Tyr Ala Gly Ile Lys Val
900 905 910
Lys Gln Leu Ile Leu Lys Glu Pro Val His Gly Val Tyr Glu Pro Ile
915 920 925
Val Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala Asn Arg Ala Gly
930 935 940
Asn Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala
945 950 955 960
Thr Thr Thr Leu Val Glu Arg Tyr Leu Arg Asp Gln Gln Leu Leu Gly
965 970 975
Ile Trp Gly Cys Ala Cys Thr Pro Tyr Asp Ile Asn Gln Met Leu Arg
980 985 990
Gly Pro Gly Arg Ala Phe Val Thr Ile Arg Gln Gly Ser Leu
995 1000 1005
<210>49
<211>7945
<212>DNA
<213>牛乳头状瘤病毒
<220>
<221>misc_feature
<222>1205
<223>n=A,T,C or G
<400>49
gttaacaata atcacaccat caccgttttt tcaagcggga aaaaatagcc agctaactat 60
aaaaagctgc tgacagaccc cggttttcac atggacctga aaccttttgc aagaaccaat 120
ccattctcag ggttggattg tctgtggtgc agagagcctc ttacagaagt tgatgctttt 180
aggtgcatgg tcaaagactt tcatgttgta attcgggaag gctgtagata tggtgcatgt 240
accatttgtc ttgaaaactg tttagctact gaaagaagac tttggcaagg tgttccagta 300
acaggtgagg aagctgaatt attgcatggc aaaacacttg ataggctttg cataagatgc 360
tgctactgtg ggggcaaact aacaaaaaat gaaaaacatc ggcatgtgct ttttaatgag 420
cctttctgca aaaccagagc taacataatt agaggacgct gctacgactg ctgcagacat 480
ggttcaaggt ccaaataccc atagaaactt ggatgattca cctgcaggac cgttgctgat 540
tttaagtcca tgtgcaggca cacctaccag gtctcctgca gcacctgatg cacctgattt 600
cagacttccg tgccatttcg gccgtcctac taggaagcga ggtcccacta cccctccgct 660
ttcctctccc ggaaaactgt gtgcaacagg gccacgtcga gtgtattctg tgactgtctg 720
ctgtggaaac tgcggaaaag agctgacttt tgctgtgaag accagctcga cgtccctgct 780
tggatttgaa caccttttaa actcagattt agacctcttg tgtccacgtt gtgaatctcg 840
cgagcgtcat ggcaaacgat aaaggtagca attgggattc gggcttggga tgctcatatc 900
tgctgactga ggcagaatgt gaaagtgaca aagagaatga ggaacccggg gcaggtgtag 960
aactgtctgt ggaatctgat cggtatgata gccaggatga ggattttgtt gacaatgcat 1020
cagtctttca gggaaatcac ctggaggtct tccaggcatt agagaaaaag gcgggtgagg 1080
agcagatttt aaatttgaaa agaaaagtat tggggagttc gcaaaacagc agcggttccg 1140
aagcatctga aactccagtt aaaagacgga aatcaggagc aaagcgaaga ttatttgctg 1200
aaaangaagc taaccgtgtt cttacgcccc tccaggtaca gggggagggg gaggggaggc 1260
aagaacttaa tgaggagcag gcaattagtc atctacatct gcagcttgtt aaatctaaaa 1320
atgctacagt ttttaagctg gggctcttta aatctttgtt cctttgtagc ttccatgata 1380
ttacgaggtt gtttaagaat gataagacca ctaatcagca atgggtgctg gctgtgtttg 1440
gccttgcaga ggtgtttttt gaggcgagtt tcgaactcct aaagaagcag tgtagttttc 1500
tgcagatgca aaaaagatct catgaaggag gaacttgtgc agtttactta atctgcttta 1560
acacagctaa aagcagagaa acagtccgga atctgatggc aaacacgcta aatgtaagag 1620
aagagtgttt gatgctgcag ccagctaaaa ttcgaggact cagcgcagct ctattctggt 1680
ttaaaagtag tttgtcaccc gctacactta aacatggtgc tttacctgag tggatacggg 1740
cgcaaactac tctgaacgag agcttgcaga ccgagaaatt cgacttcgga actatggtgc 1800
aatgggccta tgatcacaaa tatgctgagg agtctaaaat agcctatgaa tatgctttgg 1860
ctgcaggatc tgatagcaat gcacgggctt ttttagcaac taacagccaa gctaagcatg 1920
tgaaggactg tgcaactatg gtaagacact atctaagagc tgaaacacaa gcattaagca 1980
tgcctgcata tattaaagct aggtgcaagc tggcaactgg ggaaggaagc tggaagtcta 2040
tcctaacttt ttttaactat cagaatattg aattaattac ctttattaat gctttaaagc 2100
tctggctaaa aggaattcca aaaaaaaact gtttagcatt tattggccct ccaaacacag 2160
gcaagtctat gctctgcaac tcattaattc attttttggg tggtagtgtt ttatcttttg 2220
ccaaccataa aagtcacttt tggcttgctt ccctagcaga tactagagct gctttagtag 2280
atgatgctac tcatgcttgc tggaggtact ttgacacata cctcagaaat gcattggatg 2340
gctaccctgt cagtattgat agaaaacaca aagcagcggt tcaaattaaa gctccacccc 2400
tcctggtaac cagtaatatt gatgtgcagg cagaggacag atatttgtac ttgcatagtc 2460
gggtgcaaac ctttcgcttt gagcagccat gcacagatga atcgggtgag caacctttta 2520
atattactga tgcagattgg aaatcttttt ttgtaaggtt atgggggcgt ttagacctga 2580
ttgacgagga ggaggatagt gaagaggatg gagacagcat gcgaacgttt acatgtagcg 2640
caagaaacac aaatgcagtt gattgagaaa agtagtgata agttgcaaga tcatatactg 2700
tactggactg ctgttagaac tgagaacaca ctgctttatg ctgcaaggaa aaaaggggtg 2760
actgtcctag gacactgcag agtaccacac tctgtagttt gtcaagagag agccaagcag 2820
gccattgaaa tgcagttgtc tttgcaggag ttaagcaaaa ctgagtttgg ggatgaacca 2880
tggtctttgc ttgacacaag ctgggaccga tatatgtcag aacctaaacg gtgctttaag 2940
aaaggcgcca gggtggtaga ggtggagttt gatggaaatg caagcaatac aaactggtac 3000
actgtctaca gcaatttgta catgcgcaca gaggacggct ggcagcttgc gaaggctggg 3060
gctgacggaa ctgggctcta ctactgcacc atggccggtg ctggacgcat ttactattct 3120
cgctttggtg acgaggcagc cagatttagt acaacagggc attactctgt aagagatcag 3180
gacagagtgt atgctggtgt ctcatccacc tcttctgatt ttagagatcg cccagacgga 3240
gtctgggtcg catccgaagg acctgaagga gaccctgcag gaaaagaagc cgagccagcc 3300
cagcctgtct cttctttgct cggctccccc gcctgcggtc ccatcagagc aggcctcggt 3360
tgggtacggg acggtcctcg ctcgcacccc tacaattttc ctgcaggctc ggggggctct 3420
attctccgct cttcctccac cccgtgcagg gcacggtacc ggtggacttg gcatcaaggc 3480
aggaagaaga ggagcagtcg cccgactcca cagaggaaga accagtgact ctcccaaggc 3540
gcaccaccaa tgatggattc cacctgttaa aggcaggagg gtcatgcttt gctctaattt 3600
caggaactgc taaccaggta aagtgctatc gctttcgggt gaaaaagaac catagacatc 3660
gctacgagaa ctgcaccacc acctggttca cagttgctga caacggtgct gaaagacaag 3720
gacaagcaca aatactgatc acctttggat cgccaagtca aaggcaagac tttctgaaac 3780
atgtaccact acctcctgga atgaacattt ccggctttac agccagcttg gacttctgat 3840
cactgccatt gccttttctt catctgactg gtgtactatg ccaaatctat ggtttctatt 3900
gttcttggga ctagttgctg caatgcaact gctgctatta ctgttcttac tcttgttttt 3960
tcttgtatac tgggatcatt ttgagtgctc ctgtacaggt ctgccctttt aatgccttta 4020
catcactggc tattggctgt gtttttactg ttgtgtggat ttgatttgtt ttatatactg 4080
tatgaagttt tttcatttgt gcttgtattg ctgtttgtaa gttttttact agagtttgta 4140
ttccccctgc tcagatttta tatggtttaa gctgcagcaa taaaaatgag tgcacgaaaa 4200
agagtaaaac gtgccagtgc ctatgacctg tacaggacat gcaagcaagc gggcacatgt 4260
ccaccagatg tgataccaaa ggtagaagga gatactatag cagataaaat tttgaaattt 4320
gggggtcttg caatctactt aggagggcta ggaataggaa catggtctac tggaagggtt 4380
gctgcaggtg gatcaccaag gtacacacca ctccgaacag cagggtccac atcatcgctt 4440
gcatcaatag gatccagagc tgtaacagca gggacccgcc ccagtatagg tgcgggcatt 4500
cctttagaca cccttgaaac tcttggggcc ttgcgtccag gggtgtatga ggacactgtg 4560
ctaccagagg cccctgcaat agtcactcct gatgctgttc ctgcagattc agggcttgat 4620
gccctgtcca taggtacaga ctcgtccacg gagaccctca ttactctgct agagcctgag 4680
ggtcccgagg acatagcggt tcttgagctg caacccctgg accgtccaac ttggcaagta 4740
agcaatgctg ttcatcagtc ctctgcatac cacgcccctc tgcagctgca atcgtccatt 4800
gcagaaacat ctggtttaga aaatattttt gtaggaggct cgggtttagg ggatacagga 4860
ggagaaaaca ttgaactgac atacttcggg tccccacgaa caagcacgcc ccgcagtatt 4920
gcctctaaat cacgtggcat tttaaactgg ttcagtaaac ggtactacac acaggtgccc 4980
acggaagatc ctgaagtgtt ttcatcccaa acatttgcaa acccactgta tgaagcagaa 5040
ccagctgtgc ttaagggacc tagtggacgt gttggactca gtcaggttta taaacctgat 5100
acacttacaa cacgtagcgg gacagaggtg ggaccacagc tacatgtcag gtactcattg 5160
agtactatac atgaagatgt agaagcaatc ccctacacag ttgatgaaaa tacacaggga 5220
cttgcattcg tacccttgca tgaagagcaa gcaggttttg aggagataga attagatgat 5280
tttagtgaga cacatagact gctacctcag aacacctctt ctacacctgt tggtagtggt 5340
gtacgaagaa gcctcattcc aactcaggaa tttagtgcaa cacggcctac aggtgttgta 5400
acctatggct cacctgacac ttactctgct agcccagtta ctgaccctga ttctacctct 5460
cctagtctag ttatcgatga cactactact acaccaatca ttataattga tgggcacaca 5520
gttgatttgt acagcagtaa ctacaccttg catccctcct tgttgaggaa acgaaaaaaa 5580
cggaaacatg cctaattttt tttgcagatg gcgttgtggc aacaaggcca gaagctgtat 5640
ctccctccaa cccctgtaag caaggtgctt tgcagtgaaa cctatgtgca aagaaaaagc 5700
attttttatc atgcagaaac ggagcgcctg ctaactatag gacatccata ttacccagtg 5760
tctatcgggg ccaaaactgt tcctaaggtc tctgcaaatc agtatagggt atttaaaata 5820
caactacctg atcccaatca atttgcacta cctgacagga ctgttcacaa cccaagtaaa 5880
gagcggctgg tgtgggcagt cataggtgtg caggtgtcca gagggcagcc tcttggaggt 5940
actgtaactg ggcaccccac ttttaatgct ttgcttgatg cagaaaatgt gaatagaaaa 6000
gtcaccaccc aaacaacaga tgacaggaaa caaacaggcc tagatgctaa gcaacaacag 6060
attctgttgc taggctgtac ccctgctgaa ggggaatatt ggacaacagc ccgtccatgt 6120
gttactgatc gtctagaaaa tggcgcctgc cctcctcttg aattaaaaaa caagcacata 6180
gaagatgggg atatgatgga aattgggttt ggtgcagcca acttcaaaga aattaatgca 6240
agtaaatcag atctacctct tgacattcaa aatgagatct gcttgtaccc agactacctc 6300
aaaatggctg aggacgctgc tggtaatagc atgttctttt ttgcaaggaa agaacaggtg 6360
tatgttagac acatctggac cagagggggc tcggagaaag aagcccctac cacagatttt 6420
tatttaaaga ataataaagg ggatgccacc cttaaaatac ccagtgtgca ttttggtagt 6480
cccagtggct cactagtctc aactgataat caaattttta atcggcccta ctggctattc 6540
cgtgcccagg gcatgaacaa tggaattgca tggaataatt tattgttttt aacagtgggg 6600
gacaatacac gtggtactaa tcttaccata agtgtagcct cagatggaac cccactaaca 6660
gagtatgata gctcaaaatt caatgtatac catagacata tggaagaata taagctagcc 6720
tttatattag agctatgctc tgtggaaatc acagctcaaa ctgtgtcaca tctgcaagga 6780
cttatgccct ctgtgcttga aaattgggaa ataggtgtgc agcctcctac ctcatcgata 6840
ttagaggaca cctatcgcta tatagagtct cctgcaacta aatgtgcaag caatgtaatt 6900
cctgcaaaag aagaccctta tgcagggttt aagttttgga acatagatct taaagaaaag 6960
ctttctttgg acttagatca atttcccttg ggaagaagat ttttagcaca gcaaggggca 7020
ggatgttcaa ctgtgagaaa acgaagaatt agccaaaaaa cttccagtaa gcctgcaaaa 7080
aaaaaaaaaa aataaaagct aagtttctat aaatgttctg taaatgtaaa acagaaggta 7140
agtcaactgc acctaataaa aatcacttaa tagcaatgtg ctgtgtcagt tgtttattgg 7200
aaccacaccc ggtacacatc ctgtccagca tttgcagtgc gtgcattgaa ttattgtgct 7260
ggctagactt catggcgcct ggcaccgaat cctgccttct cagcgaaaat gaataattgc 7320
tttgttggca agaaactaag catcaatggg acgcgtgcaa agcaccggcg gcggtagatg 7380
cggggtaagt actgaatttt aattcgacct atcccggtaa agcgaaagcg acacgctttt 7440
ttttcacaca tagcgggacc gaacacgtta taagtatcga ttaggtctat ttttgtctct 7500
ctgtcggaac cagaactggt aaaagtttcc attgcgtctg ggcttgtcta tcattgcgtc 7560
tctatggttt ttggaggatt agacggggcc accagtaatg gtgcatagcg gatgtctgta 7620
ccgccatcgg tgcaccgata taggtttggg gctccccaag ggactgctgg gatgacagct 7680
tcatattata ttgaatgggc gcataatcag cttaattggt gaggacaagc tacaagttgt 7740
aacctgatct ccacaaagta cgttgccggt cggggtcaaa ccgtcttcgg tgctcgaaac 7800
cgccttaaac tacagacagg tcccagccaa gtaggcggat caaaacctca aaaaggcggg 7860
agccaatcaa aatgcagcat tatattttaa gctcaccgaa accggtaagt aaagactatg 7920
tattttttcc cagtgaataa ttgtt 7945
<210>50
<211>306
<212>PRT
<213>1型牛乳头状瘤病毒
<400>50
Met Glu Thr Ala Cys Glu Arg Leu His Val Ala Gln Glu Thr Gln Met
1 5 10 15
Gln Leu Ile Glu Lys Ser Ser Asp Lys Leu Gln Asp His Ile Leu Tyr
20 25 30
Trp Thr Ala Val Arg Thr Glu Asn Thr Leu Leu Tyr Ala Ala Arg Lys
35 40 45
Lys Gly Val Thr Val Leu Gly His Cys Arg Val Pro His Ser Val Val
50 55 60
Cys Gln Glu Arg Ala Lys Gln Ala Ile Glu Met Gln Leu Ser Leu Gln
65 70 75 80
Glu Leu Ser Lys Thr Glu Phe Gly Asp Glu Pro Trp Ser Leu Leu Asp
85 90 95
Thr Ser Trp Asp Arg Tyr Met Ser Glu Pro Lys Arg Cys Phe Lys Lys
100 105 110
Gly Ala Arg Val Val Glu Val Glu Phe Asp Gly Asn Ala Ser Asn Thr
115 120 125
Asn Trp Tyr Thr Val Tyr Ser ASn Leu Tyr Met Arg Thr Glu Asp Gly
130 135 140
Trp Gln Leu Ala Lys Ala Gly Ala Asp Gly Thr Gly Leu Tyr Tyr Cys
145 150 155 160
Thr Met Ala Gly Ala Gly Arg Ile Tyr Tyr Ser Arg Phe Gly Asp Glu
165 170 175
Ala Ala Arg Phe Ser Thr Thr Gly His Tyr Ser Val Arg Asp Gln Asp
180 185 190
Arg Val Tyr Ala Gly Val Ser Ser Thr Ser Ser Asp Phe Arg Asp Arg
195 200 205
Pro Asp Gly Val Trp Val Ala Ser Glu Gly Pro Glu Gly Asp Pro Ala
210 215 220
Gly Lys Glu Ala Glu Pro Ala Gln Pro Val Ser Ser Leu Leu Gly Ser
225 230 235 240
Pro Ala Cys Gly Pro Ile Arg Ala Gly Leu Gly Trp Val Arg Asp Gly
245 250 255
Pro Arg Ser His Pro Tyr Asn Phe Pro Ala Gly Ser Gly Gly Ser Ile
260 265 270
Leu Arg Ser Ser Ser Thr Pro Cys Arg Ala Arg Tyr Arg Trp Thr Trp
275 280 285
His Gln Gly Arg Lys Lys Arg Ser Ser Arg Pro Thr Pro Gln Arg Lys
290 295 300
Asn Gln
305
<210>51
<211>622
<212>DNA
<213>人疱疹病毒4
<400>51
gggtatcata tgctgactgt atatgcatga ggatagcata tgctacccgg atacagatta 60
ggatagcata tactacccag atatagatta ggatagcata tgctacccag atatagatta 120
ggatagccta tgctacccag atataaatta ggatagcata tactacccag atatagatta 180
ggatagcata tgctacccag atatagatta ggatagccta tgctacccag atatagatta 240
ggatagcata tgctacccag atatagatta ggatagcata tgctatccag atatttgggt 300
agtatacgct acccagatat aaattaggat agcatatact accctaatct ctattaggat 360
agcatatgct acccggatac agattaggat agcatatact acccagatat agattaggat 420
agcatatgct acccagatat agattaggat agcctatgct acccagatat aaattaggat 480
agcatatact acccagatat agattaggat agcatatgct acccagatat agattaggat 540
agcctatgct acccagatat agattaggat agcatatgct atccagatat ttgggtagta 600
tatgctaccc atggcaacat ta 622
<210>52
<211>641
<212>PRT
<213>人疱疹病毒4
<400>52
Met Ser Asp Glu Gly Pro Gly Thr Gly Pro Gly Asn Gly Leu Gly Glu
1 5 10 15
Lys Gly Asp Thr Ser Gly Pro Glu Gly Ser Gly Gly Ser Gly Pro Gln
20 25 30
Arg Arg Gly Gly Asp Asn His Gly Arg Gly Arg Gly Arg Gly Arg Gly
35 40 45
Arg Gly Gly Gly Arg Pro Gly Ala Pro Gly Gly Ser Gly Ser Gly Pro
50 55 60
Arg His Arg Asp Gly Val Arg Arg Pro Gln Lys Arg Pro Ser Cys Ile
65 70 75 80
Gly Cys Lys Gly Thr His Gly Gly Thr Gly Ala Gly Ala Gly Ala Gly
85 90 95
Gly Ala Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Ala Gly
100 105 110
Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly
115 120 125
Gly Ala Gly Ala Gly Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala
130 135 140
Gly Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Gly Ala Gly Ala Gly
145 150 155 160
Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly
165 170 175
Ala Gly Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Gly
180 185 190
Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Ala Gly Gly Ala Gly
195 200 205
Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala
210 215 220
Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala
225 230 235 240
Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly
245 250 255
Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly
260 265 270
Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Gly Ala Gly
275 280 285
Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Ala Gly Gly Ala Gly
290 295 300
Ala Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Ala Gly
305 310 315 320
Gly Ala Gly Ala Gly Gly Gly Gly Arg Gly Arg Gly Gly Ser Gly Gly
325 330 335
Arg Gly Arg Gly Gly Ser Gly Gly Arg Gly Arg Gly Gly Ser Gly Gly
340 345 350
Arg Arg Gly Arg Gly Arg Glu Arg Ala Arg Gly Gly Ser Arg Glu Arg
355 360 365
Ala Arg Gly Arg Gly Arg Gly Arg Gly Glu Lys Arg Pro Arg Ser Pro
370 375 380
Ser Ser Gln Ser Ser Ser Ser Gly Ser Pro Pro Arg Arg Pro Pro Pro
385 390 395 400
Gly Arg Arg Pro Phe Phe His Pro Val Gly Glu Ala Asp Tyr Phe Glu
405 410 415
Tyr His Gln Glu Gly Gly Pro Asp Gly Glu Pro Asp Val Pro Pro Gly
420 425 430
Ala Ile Glu Gln Gly Pro Ala Asp Asp Pro Gly Glu Gly Pro Ser Thr
435 440 445
Gly Pro Arg Gly Gln Gly Asp Gly Gly Arg Arg Lys Lys Gly Gly Trp
450 455 460
Phe Gly Lys His Arg Gly Gln Gly Gly Ser Asn Pro Lys Phe Glu Asn
465 470 475 480
Ile Ala Glu Gly Leu Arg Ala Leu Leu Ala Arg Ser His Val Glu Arg
485 490 495
Thr Thr Asp Glu Gly Thr Trp Val Ala Gly Val Phe Val Tyr Gly Gly
500 505 510
Ser Lys Thr Ser Leu Tyr Asn Leu Arg Arg Gly Thr Ala Leu Ala Ile
515 520 525
Pro Gln Cys Arg Leu Thr Pro Leu Ser Arg Leu Pro Phe Gly Met Ala
530 535 540
Pro Gly Pro Gly Pro Gln Pro Gly Pro Leu Arg Glu Ser Ile Val Cys
545 550 555 560
Tyr Phe Met Val Phe Leu Gln Thr His Ile Phe Ala Glu Val Leu Lys
565 570 575
Asp Ala Ile Lys Asp Leu Val Met Thr Lys Pro Ala Pro Thr Cys Asn
580 585 590
Ile Arg Val Thr Val Cys Ser Phe Asp Asp Gly Val Asp Leu Pro Pro
595 600 605
Trp Phe Pro Pro Met Val Glu Gly Ala Ala Ala Glu Gly Asp Asp Gly
610 615 620
Asp Asp Gly Asp Glu Gly Gly Asp Gly Asp Glu Gly Glu Glu Gly Gln
625 630 635 640
Glu