多价疫苗.pdf

上传人:宁*** 文档编号:8814688 上传时间:2021-01-05 格式:PDF 页数:139 大小:9.31MB
返回 下载 相关 举报
摘要
申请专利号:

CN200980140421.1

申请日:

20090814

公开号:

CN102177175A

公开日:

20110907

当前法律状态:

有效性:

失效

法律详情:

IPC分类号:

C07K14/155,C12N15/49,A61K39/21

主分类号:

C07K14/155,C12N15/49,A61K39/21

申请人:

洛斯阿拉莫斯国家安全股份有限公司,贝斯以色列女执事医疗中心,杜克大学,UAB研究基金会

发明人:

贝特·T·科贝尔,威廉·费舍尔,诺曼·莱文,廖华新,巴顿·F·海恩斯,比阿特里斯·H·哈恩

地址:

美国新墨西哥州

优先权:

12/192,015

专利代理机构:

中国商标专利事务所有限公司

代理人:

万学堂

PDF下载: PDF下载
内容摘要

本发明总体而言涉及一种免疫原性组合物(例如疫苗),具体而言涉及一种多价免疫原性组合物,例如多价HIV疫苗,并且涉及使用它的方法。本发明还涉及使用遗传算法以创建适于用例如疫苗接种策略的多价抗原组的方法。

权利要求书

1.一种多肽或蛋白,其包含至少一条图21或图22所示的氨基酸的序列。 2.一种核酸,其编码权利要求1的多肽或蛋白。 3.一种核酸,其包含至少一条图22所示的核苷酸的序列。 4.一种载体,其包含权利要求2或3的核酸。 5.权利要求3的载体,其中所述载体为病毒载体。 6.一种组合物,其包含至少一种权利要求1的多肽或蛋白以及载体。 7.一种组合物,其包含至少一种权利要求2或3的核酸以及载体。 8.一种在哺乳动物中诱导免疫应答的方法,包括给所述哺乳动物施用足以产生所述诱导的量的至少一种权利要求1的多肽或蛋白。 9.一种在哺乳动物中诱导免疫应答的方法,包括给所述哺乳动物施用足以产生所述诱导的量的至少一种权利要求2或3的核酸。

说明书



本申请是提交于2008年2月8日的美国第11/990,222号申请的部分继续申请,后者是提交于2006年8月23日的第PCT/US2006/032907号国际申请的美国国家阶段,其指定了美国并且要求了提交于2005年8月23日的美国第60/710,154号临时申请和提交于2005年11月25日的美国第60/739,413号临时申请的优先权,这些申请的全部内容以参照的方式并入于此。

技术领域

本发明总体而言涉及一种免疫原性组合物(例如疫苗),具体而言涉及一种多价免疫原性组合物,例如多价HIV疫苗,并且涉及使用它的方法。本发明还涉及使用遗传算法以创建适于用例如疫苗接种策略的多价抗原组的方法。

背景技术

设计一种有效的HIV疫苗是多面性的挑战。该疫苗优选引起免疫应答,该免疫应答要么能预防感染,要么至少也能在发生感染时控制病毒的复制,尽管对自然感染的免疫应答已失效,从而消除病毒(Nabel,Vaccine 20:1945-1947(2002))或者免受重复感染(Altfeld et al,Nature 420:434-439(2002))。需要一种强力疫苗,其具有优化的载体、免疫学流程和佐剂(Nabel,Vaccine 20:1945-1947(2002)),并结合有能针对多种谱系的流行病毒来激发交互反应性应答的抗原(Gaschen et al,Science 296:2354-2360(2002),Korber et al,Br.Med.Bull.58:19-42(2001))。困扰了流感疫苗学家数十年的问题突显了由HIV-1造成的挑战:遭受抗原漂移的人流感病毒株每年在相互之间偏移约1~2%,而疫苗抗原通常年复一年地不能引起交互反应性B细胞应答,这就需要对同期的病毒株进行持续监测,并每隔几年就要对疫苗进行更新(Korber et al,Br.Med.Bull.58:19-42(2001))。相比之下,共流行的个体HIV-1病毒株彼此之间的差异在相对保守的蛋白质中达20%或更多,而在包膜蛋白中高达35%(Gaschen et al,Science 296:2354-2360(2002),Korber et al,Br.Med.Bull.58:19-42(2001))。

在地区性HIV-1流行病中病毒多样性的不同程度为疫苗设计策略提供了潜在有用的层次。某些地域再现了全球多样性,在这些地域中,大部分的已知HIV-1亚型或进化枝共流行(例如刚果民主共和国(Mokili & Korber,J.Neurovirol 11(Suppl.1):66-75(2005)),其余地域主要为两种亚型和它们的重组体(例如乌干达(Barugahare et al,J.Virol.79:4132-4139(2005)),剩下的为单一亚型(例如南非(Williamson et al,AIDS Res.Hum.Retroviruses 19:133-144(2003))。即使是单一亚型流行病占主导地位的地区,也必须注意大范围的进化枝内多样性(Williamson et al,AIDS Res.Hum.Retroviruses 19:133-44(2003)),但是,由于可期待国际旅行能进一步使地理性差异模糊化,所有的国家都可受益于一种全球性疫苗。

于此提出了多价疫苗抗原集合的设计,其注重于T淋巴细胞应答,并且为通常的B亚型和C亚型而优化,或是为在全球流行的所有HIV-1变体[HIV-1主(M)组]而优化。细胞毒T淋巴细胞(CTL)直接杀死受感染的产生病毒的宿主细胞,其利用人白细胞抗原(HLA)分子通过存在于受感染细胞表面的病毒蛋白片段(抗原表位)来识别它们。辅助性T细胞的应答通过细胞因子的释放来控制免疫应答的各个方面。二者对于HIV-1疫苗来说可能都是至关重要的:早已指出CTL应答与减缓疾病进展有关(Oxenius et al,J.Infect.Dis.189:1199-208(2004));非人灵长类动物中由疫苗引发的细胞免疫应答有助于控制病原性SIV或SHIV,降低免疫激发(challenge)后生病的可能性(Barouch et al,Science 290:486-92(2000));并且CD8+T细胞的实验性耗尽导致感染SIV的恒河猴体内病毒血症的增长(Schmitz et al,Science 283:857-60(1999))。此外,CTL逃逸突变与疾病进展有关(Barouch et al,J.Virol.77:7367-75(2003)),所以阻塞潜在逃逸路径的由疫苗刺激的记忆应答可能是有价值的。

高可变性包膜蛋白是用于针对HIV来中和抗体的首要目标;由于免疫防护有可能同时要求B细胞和T细胞应答(Moore and Burton,Nat.Med.10:769-71(2004)),同样需要对包膜疫苗抗原进行单独优化以引起抗体应答。相比之下,由T细胞引导的疫苗成分可定位于更加保守的蛋白质,但即使是最保守的HIV-1蛋白也是非常多样化的,这样变异就成为了一个问题。人工中央序列疫苗法(例如共有序列——其中每种氨基酸可见于多条序列,或者是祖先序列的最大可能重构物(Gaschen et al,Science 296:2354-60(2002),Gao et al,J.Virol.79:1 154-63(2005),Doria-Rose et al,J.Virol.79:1 1214-24(2005),Weaver et al,J.Virol.,印刷中))是有前景的;尽管如此,即使是中央化的病毒株也只能提供HIV-1变体的有限覆盖,而基于共有序列的试剂无法检测出多种自体T细胞应答(Altfeld et al,J.Virol.77:7330-40(2003))。

单个氨基酸的改变会让表位从T细胞的监视下逃逸;由于在各种HIV-1病毒株之间很多T细胞表位在一个或多个位置处不同,对任意单种疫苗抗原的潜在应答是有限的。某一特定突变是否导致逃逸取决于特定表位/T细胞的组合,尽管某些改变会宽泛地影响亚型之间的交互反应性(Norris et al,AIDS Res.Hum.Retroviruses 20:315-25(2004))。在多价疫苗中包括多个变体能对更广范围的流行变体进行应答,还能使免疫系统针对通常的逃逸突变做好准备(Jones et al,J.Exp.Med.200:1243-56(2004))。从一个T细胞受体中逃逸会创建出易受他者影响的一个变体(Allen et al,J.Virol.79:12952-60(2005),Feeney et al,J.Immunol.174:7524-30(2005)),所以激发针对表位变体的多克隆应答可能是有益的(Killian et al,Aids 19:887-96(2005))。抑制操作(Milicic et al,J.Immunol.175:4618-26(2005))或HLA结合(Ammaranond et al,AIDS Res.Hum.Retroviruses 21:395-7(2005))的逃逸突变无法由具有不同特异性的T细胞来直接对抗,但是针对重叠区表位的应答可至少阻塞这些逃逸途径的其中一些。

本发明涉及一种多价疫苗,其包含几个“镶嵌”蛋白(或编码这些蛋白的基因)。候选疫苗抗原可以是k种复合蛋白的混合物(k为混合物中序列变体的数目),其经优化以在一组输入的病毒蛋白中包括最大数目的潜在T细胞表位。镶嵌体由天然序列产生:它们类似于天然蛋白,并包括潜在表位的最常见形态。由于CD8+表位是毗连的,并且通常为9个氨基酸那么长,所以镶嵌体组可由天然序列中九聚物(九聚体)的“覆盖率”来打分(相似长度的片段都能良好地得到表示)。至少三次未被发现的九聚体可被排除。这种策略使得多样性覆盖率的水平由非常多价的多联肽疫苗实现,但其具有重要的优势:其使得疫苗能像完整的蛋白质或基因那样递送,排除了与流行病毒株无关的低频率或非天然的表位,并且其完整的蛋白抗原更加可能像是在自然感染中那样进行处理。

发明内容

总体而言,本发明涉及一种免疫原性组合物。更具体而言,本发明涉及一种多价免疫原性组合物(例如HIV疫苗),并且涉及使用它的方法。本发明还涉及使用遗传算法以设计适于作为疫苗使用的多价抗原组的方法。

本发明的目的和优点通过后述的描述将会更加清晰。

附图说明

图1A~图1F:HIV-1M组的潜在表位覆盖率的上限。示出了针对增加变体数目的九聚体的群体覆盖率的上限,k=1~8个变体。长度为9的移动窗口放在比对序列上,逐次下移一个位置。不同颜色表示不同数目序列的结果。在每个窗口中,针对Gag(图1A和图1B)、Nef(图1C和图1D)和Env gp120(图1E和图1F),以k个最常见的9聚物给出的覆盖率制图。为维持比对而插入的间隙被视作字符。加入更多变体时,返回结果会明显减少,这是因为当k增大时,愈加稀有的形式也会增加。在图1A、图1C和图1E中,每条连续九聚体的得分都按照它们的天然顺序作图,以示出多样性在不同蛋白区域中是如何变化的;Gag中心的p24和Nef的中心区域的保守程度都特别高。在图1B、图1D和图1F中,每条九聚体的得分都按覆盖率重新排列(图4中同样使用的一种策略),以提供对给定蛋白的整个群体覆盖率的判断。gp120的覆盖率即使采用8种变异九聚体也是特别差的(图1E和图1F)。

图2A~图2C:镶嵌体的初始化、打分和优化。图2A):通过天然序列的随机两点重组产生一组k个群体(1~6个具有50~500条序列的群体,每个群体均经过测试)。从每一群体中选择一条序列(最初是随机的)用于该镶嵌体混合物,其随后被优化。通过计算覆盖率(定义为包括在该混合物中的天然序列九聚体的平均分数,有输入数据组中的所有天然序列平均而得到)来对该混合物序列打分。覆盖更多表位的任何新序列都会提高整个混合物的得分。图2B):任何个体序列的适合度得分为含有该序列以及来自其他群体的当前代表的混合物的覆盖率。图2C):优化:1)选择两个“亲代”:随机选择的一对重组序列的较高得分者,以及要么是(50%可能性)随机的第二对中的较高得分序列,要么是随机选择的天然序列。2)使用两个亲代之间的两点重组以产生“子代”序列。如果该子代包含非天然的或稀有的九聚体,则立即将其剔除,相反则对其打分(Gaschen et al,Science 296:2354-2360(2002))。如果该得分高于四个随机选择的群体成员中任一者的得分,则将该子代插入到该群体中,以取代这四个中的最弱者,由此进化出改良的群体;4)如果其得分为最高得分,则用该新的子代取代群体中的当前混合物成员。依次对于每一群体重复进行十次循环的子代生成,重复进行该过程直至改进停止。

图3:所有HIV蛋白的镶嵌株覆盖率。示出了由每种HIV蛋白的四个镶嵌蛋白组获得的九聚体覆盖率的水平,其中使用用M组或C亚型优化的镶嵌体。对C亚型进行优化(进化枝内优化)的镶嵌体所覆盖的C亚型序列九聚体的部分以灰色示出。由C亚型优化的镶嵌体在非C亚型M组序列中得到的九聚体覆盖率(进化枝间覆盖率)以白色示出。由M组优化的镶嵌体得到的C亚型序列的覆盖率以黑色示出。B进化枝的比较得到了类似结果(数据未示出)。

图4A~图4F:不同候选疫苗的M组序列覆盖率,每个九聚体逐个进行。每幅图由单个三价候选疫苗得到的M组天然序列比对的逐个位点的覆盖率(即,对于每一个九聚体)。沿x轴的竖条代表对于给定比对位置,与候选疫苗匹配的序列的比例:9/9匹配(红色),8/9匹配(黄色),7/9匹配(蓝色)。比对的九聚体沿x轴按完全匹配的覆盖率值分类。656个位置包括完整的Gag以及Nef的中心区域。对于每一个比对位置,最大可能的匹配值(即,在该九聚体中没有间隙的比对序列的比例)以灰色示出。图4A):从在疫苗研究中使用的病毒株中选出的非最优天然序列(Kong et al,J.Virol.77:12764-72(2003)),包括个体进化枝A、B和C的病毒序列(Gag:GenBank编号AF004885、K03455和U52953;Nef核心序列:AF069670、K02083和U52953)。图4B):通过选择具有最大覆盖率的单条序列而选定的天然序列[分离序列US2(B亚型,USA),70177(C亚型,印度)和99TH。R2399(CRF15_01B亚型,泰国);编号AY173953、AF533131和_AF530576]的最优组,随后是在与针对M组覆盖率所选择的第一序列(即,最佳互补序列)等结合时具有最佳覆盖率的序列。图4C):共有序列混合物(M组、B亚型和C亚型)。图4D):三条镶嵌序列,图4E):四条镶嵌序列,图4F):六条镶嵌序列。图4D~图4F均针对M组覆盖率进行了优化。

图5A和图5B:候选疫苗的总体覆盖率:C进化枝序列中的九聚体的覆盖率,其使用针对镶嵌体优化的不同输入数据组,提供不同数目的抗原,并与不同的候选疫苗进行比较。对于如下四种测试情况:进化枝内(对C进化枝覆盖率打分的C进化枝优化的候选序列)、进化枝之间(对C进化枝覆盖率打分的B进化枝优化的候选序列)、全球性抗单一亚型(对C进化枝覆盖率打分的M组优化的候选序列)、全球性抗全球性(对全球性覆盖率打分的M组优化的候选序列),针对Gag(图5A)和Nef(核心序列)(图5B)的单价和多价候选疫苗计算完全匹配(蓝色)、8/9匹配(一个不匹配,红色)和7/9匹配(两个不匹配,黄色)的覆盖率。在每组结果中,候选疫苗按照混合物中的序列数目(1~6)进行分组;镶嵌序列用较深颜色绘制。“非优化序列(Non-opt)”指的是一组进入疫苗实验的序列(Kong et al,J.Virol.77:12764-72(2003));“镶嵌体(mosaic)”表示由遗传算法产生的序列;“优化的天然序列(opt.natural)”表示根据最大九聚体覆盖率而选择的完整天然序列;“MBC共有序列(MBC consensus)”表示M组、B亚型和C亚型的三条共有序列的混合物。为便于比较,用虚线标出M组镶嵌体的四序列组的覆盖率(73.7~75.6%)。测试了镶嵌体数目、病毒亚群、蛋白区域以及优化和测试组的超过150种组合。在该图中描绘的C进化枝/B进化枝/M组的比较通常是进化枝内、进化枝之间以及M组覆盖率的代表。具体而言,B进化枝和C进化枝的镶嵌体覆盖率水平非常接近,尽管在Gag集合中有更多的C进化枝序列,而在Nef集合中有更多的B进化枝序列(见图6的对B进化枝和C进化枝的完整比较)。在比对中A进化枝和G进化枝的序列相对较少(24Gag,75Nef),而M组优化的镶嵌体的九聚体覆盖率不如B进化枝和C进化枝的亚型高(A亚型和G亚型的四镶嵌体覆盖率对于Gag为63%,对于Nef为74%),这比非优化的混合物要好得多(对于Gag为52%,对于Nef为52%)。

图6A和图6B:候选疫苗的总体覆盖率:B进化枝、C进化枝和M组序列中的九聚体的覆盖率,其使用针对镶嵌体优化的不同输入数据组,提供不同数目的抗原,并与不同的候选疫苗进行比较。对于如下七种测试情况:进化枝内(B进化枝或C进化枝优化的候选序列,对同一进化枝打分)、进化枝之间(B进化枝或C进化枝优化的候选序列,对另一进化枝打分)、全球性疫苗抗单一亚型(对B进化枝或C进化枝打分的M组优化的候选序列)、全球性疫苗抗全球性病毒(对所有M组序列打分的M组优化的候选序列),针对Gag(图6A)和Nef(核心序列)(图6B)的单价和多价候选疫苗计算完全匹配(蓝色)、8/9匹配(一个不匹配,红色)和7/9匹配(两个不匹配,黄色)的覆盖率。在每组结果中,候选疫苗按照混合物中的序列数目(1~6)进行分组;镶嵌序列用较深颜色绘制。“非优化序列”指的是先前提出用于疫苗的一组特定天然序列(Kong,W.P.et al.J Virol 77,12764-72(2003));“镶嵌体”表示由遗传算法产生的序列;“优化的天然序列”表示根据最大九聚体覆盖率而选择的完整天然序列;“MBC共有序列”表示M组、B亚型和C亚型的三条共有序列的混合物。对于针对M组优化的四价镶嵌体组的完全匹配M组覆盖率的水平标以虚线。

图7A和图7B:在天然序列、共有序列和镶嵌序列中九聚体的出现频率的分布。对于由几种方法制备的疫苗混合物,不同九聚体的频率为x轴,发生次数为y轴。图7A:0~60%的频率(九聚体频率>60%时,所有方法的分布是相当的)。图7B:低频率九聚体的详细情况。天然序列具有大量的稀有或分离方式独特(unique-to-isolate)的九聚体(图7A和图7B的下右部分);它们不大可能引发有用的疫苗应答。选择最优的天然序列确实是在选择那些更加常见的九聚体,但仍然会包括稀有和独特的九聚体(图7A和图7B的上右部分)。与之相比,共有序列混合物不能代表并非常见的九聚体,特别是频率低于20%(图7A和图7B的下左部分)。对于镶嵌序列来说,较低频率的九聚体的数目随着序列的数目而单调增加(每幅图的上左部分),但分离方式独特的九聚体完全排除在外(右图的上左部分:*标示出缺少频率<0.005的九聚体)。

图8A~图8D:候选疫苗的HLA结合潜能。图8A和图8B):HLA结合基序计数。图8C和图8D):不理想的氨基酸的数目。在所有图中:天然序列标示为黑色圆形(●),共有序列标示为蓝色三角形(▲),推断的祖先序列标示为绿色正方形(■),而镶嵌序列标示为红色菱形(◆)。左侧的图(图8A和8C)显示了对于个体序列计算出的HLA结合基序计数(图8A)以及不理想的氨基酸的计数(图8C);右侧的图(图8B和8D)显示了对于序列混合物计算出的HLA结合基序计数(图8B)以及不理想的氨基酸的计数(图8D)。每一幅图的顶部(箱线图)显示了基于M组序列的比对(对于个体序列,图8A和图8C)或基于100种随机组成的三序列(A亚型、B亚型和C亚型各一)的混合物(对于序列混合物,图8B和图8D)的各自计数(基序计数或不理想的氨基酸的计数)的分布。该比对下载自Los Alamos HIV数据库。箱部从25百分点延伸至75百分点,线段位于中值处。延伸到箱部之外的线部显示了最高值和最低值。作为C端锚定残基而非常罕见的氨基酸为G、S、T、P、N、Q、D、E和H,并且倾向于很小、有极性或带负电荷(Yusim et al,J.Virol.76:8757-8768(2002))。显示了Gag的结果,但同样的定性结果也适用于Nef核心序列和完整Nef。对超型基序进行了同样的过程,其结果就定性而言与HLA结合基序(数据未示出)的结果类似。

图9:限制为4条序列(k=4)的镶嵌蛋白组,跨过Gag以及Nef的中心区域,针对B亚型、C亚型和M组进行了优化。

图10:Env和Pol的镶嵌体组。

图11:该图不依赖于比对,其基于将所有M组的蛋白(数据库和CHAVI,每人一条序列)分解为所有可能的九聚体,其关注它们的频率,然后寻找每一疫苗抗原或混合物与数据库的匹配和接近匹配的情况。

图12:另外的覆盖率概览。

图13:九聚体覆盖率相对于位置的图(Mos.3疫苗混合物)。

图14A~图14D:与提议使用的每种疫苗匹配的九聚体频率的图。

图15A~图15D:标示出全部数据库比对中的每条序列中每一氨基酸的图。

图16:3个镶嵌体,M组优化。

图17:HIV数据库连同CHAVI序列(N=2020)的覆盖率。

图18:急性感染患者的序列与患者共有序列相比的差异。

图19:在Env M组覆盖率对亚型特异性设计方面的折中和益处。

图20:所提议的Gag和Env的疫苗镶嵌体的覆盖率。

图21:Gag、Nef和Env序列。

图22:镶嵌体的gag和nef基因,以及M共有序列的gag和nef基因。

具体实施方式

本发明源自于以下认识,即含有合成病毒蛋白的多价抗原组能构成良好的候选疫苗,所述合成病毒蛋白的序列提供了对流行病毒序列的非稀有短链的最大覆盖率。本发明提供了“遗传算法”策略以建立作为天然蛋白序列的不确定组的片段的镶嵌体混合物的多价抗原组,所述天然蛋白序列作为输入序列而提供。对于HIV的情形,蛋白Gag和Nef是这种抗原的理想候选序列。为扩大覆盖率,还可使用Pol和/或Env。本发明还提供了这些蛋白的优化组。

本发明的遗传算法策略利用来自普通群体的未经比对的蛋白序列作为输入数据组,从而具有“不依赖比对”的优点。其建立了类似于自然界所发现的蛋白的人造镶嵌蛋白,在小型动物模型中共有抗原的成功证明了这是有效的。九聚体是此处描述的研究重点,但根据预期的目标,也可选择不同长度的肽。根据本发明的方法,可以将在自然界中不存在或者非常稀有的九聚体(举例)排除在外,相对于共有序列和天然病毒株而言,这是一种进步,因为共有序列可包含在自然界中未发现的某些九聚体(举例),而天然病毒株几乎总是含有对于该病毒株而言是独一无二的某些九聚体(举例)。用于所述遗传算法的适合度的定义为:最“适合”的多价混合物是镶嵌病毒株的组合,该组合能提供群体中所有九聚体的最大覆盖率(完全匹配的最高分数),并且还受九聚体在所述群体中不缺失或者不稀有的限制。

本发明的镶嵌蛋白组能根据不同的输入数据组进行优化,使得可采用目前的数据从T细胞的角度评估亚型或者区域特异性疫苗的优点。举例来说,经过比较的可选方案包括:

1)基于M组、B进化枝和C进化枝的最优多价镶嵌体组。所存在的疑问是,进化枝内覆盖率与进化枝之间覆盖率或者全球性覆盖率相比能好多少。

2)不同数目的抗原:1、3、4、6。

3)目前用于疫苗程序的天然病毒株仅例示了“典型”病毒株(Merck,VRC)。

4)经选择能在群体中获得九聚体最佳覆盖率的天然病毒株。

5)共有序列组:A+B+C。

6)经优化的混合物,其包括多价抗原中的一个“指定”病毒株,一个祖先序列+3个镶嵌病毒株,一条共有序列+3个镶嵌病毒株。

7)完全匹配的九聚体覆盖率与匹配度为8/9、7/9和6/9或更少的九聚体覆盖率比较。

这是一个计算难题,因为覆盖一个九聚体的最佳组不一定是覆盖重叠型九聚体的最佳组。

通过阅读本公开内容应当理解,描述于此的方法能用于设计肽试剂以测试HIV免疫应答,还可用于其他易变病原体。例如,本方法可适用于高度可变的丙型肝炎。

采用本领域公知的技术,可将本发明的蛋白/多肽/肽(“免疫原”)与药用载体和/或佐剂配制成组合物。适宜的施药途径包括全身(例如肌肉内或皮下)、口服、阴道内、直肠内和鼻内施药。

本发明的免疫原能采用本领域技术人员公知的方法进行化学合成并纯化。该免疫原也可通过公知的重组DNA技术合成。

编码本发明免疫原的核酸可用作例如DNA疫苗的组分,在该疫苗中该编码序列以裸露DNA方式施用,或者,例如编码该免疫原的小基因可存在于病毒载体中。该编码序列例如可在分枝杆菌、重组的嵌合型腺病毒或重组的减毒型水泡性口炎病毒中表达。该编码序列还可存在于例如复制型或者非复制型腺病毒载体、腺相关病毒载体、减毒型结核分枝杆菌载体、卡介苗(BCG)载体、牛痘载体或修饰的安卡拉痘苗(MVA)载体、其他痘病毒载体、重组脊髓灰质炎病毒载体和其他肠病毒载体、沙门氏菌载体、志贺氏菌载体、委内瑞拉马脑炎病毒(VEE)载体、塞姆利基森林病毒载体或烟草花叶病毒载体。该编码序列也可作为具有例如活性启动子如CMV启动子的DNA质粒来表达。还可用其他活载体来表达本发明的序列。通过将编码本发明免疫原的核酸导入患者自身细胞中,可以在这些细胞中诱导该免疫原的表达,所述表达优选使用在人类细胞中优化表达的密码子和启动子。制造和使用DNA疫苗的方法的例子公开于美国第5,580,859号、第5,589,466号和第5,703,055号专利。密码子优化的方法的例子描述于Haas et al,Current Biology 6:315-324(1996)和Andre et al,J.Virol.72(2):1497-1503(1998)。

应当理解,在本发明的组合物中可包含佐剂(或者另行施用以增强免疫原效果)。合适的佐剂的例子包括TRL-9激动剂、TRL-4激动剂、以及TRL-7、8和9激动剂的组合(以及明矾)。佐剂可采用油和水乳液的形式。也可使用角鲨烯佐剂。

本发明的组合物在药用输送体系中含有免疫有效量的本发明免疫原,或编码该免疫原的核酸序列。该组合物可用于预防和/或治疗病毒感染(例如HIV感染)。如上所述,可使用佐剂、乳化剂、药用载体或其他在疫苗组合物中常提供的组分来配制本发明的组合物。本领域技术人员可容易地设计最优化的制剂,该制剂可包括用于立即释放的制剂和/或用于缓释的制剂,以及用于诱导全身免疫和/或诱导局部粘膜免疫的制剂(例如该制剂可设计为鼻内、阴道内或直肠内施用)。如上所述,本发明的组合物可通过任何便捷的途径,包括皮下、鼻内、口服、肌肉内或其他肠胃外或肠道途径施用。该免疫原可以单剂量或多剂量施用。最优免疫方案可容易地由本领域技术人员确定并根据患者、组合物以及所寻求的效果不同而改变。

本发明设想了直接使用本发明免疫原和/或编码它的核酸和/或如上所述进行表达的免疫原。例如,编码该免疫原的小基因可用于初免和/或加强免疫。

本发明包括公开于此的任何和所有的氨基酸序列,以及编码该氨基酸序列的核酸序列(以及与该编码序列互补的核酸)。

具体公开于此的是针对以区域性流行病为目标的单一B亚型或C亚型以及全球流行的所有HIV-1变体[所述HIV-1主(M)组]进行优化的疫苗抗原组。在随后的实施例1中描述的研究中,重点在于设计特别针对T细胞应答的多价疫苗。对于HIV-1特异性疫苗应答而言,HIV-1特异性T细胞似乎至关重要:CTL应答与人类疾病进程的减缓相关(Oxenius et al,J.Infect.Dis.189:1199-1208(2004)),并且CTL应答在非人灵长类动物疫苗接种模型中的重要性也已非常明确。疫苗引发的细胞免疫应答有助于控制致病性SIV或SHIV,并降低用致病性病毒免疫激发后发病的可能性(Barouch et al,Science 290:486-492(2000))。CD8+T细胞的暂时缺失导致感染SIV的恒河猴体内病毒血症的增加(Schmitz et al,Science 283:857-860(1999))。此外,逃逸突变的进化与疾病进程相关,表明CTL应答有助于抑制体内病毒的复制(Barouch et al,J.Virol.77:7367-7375(2003)),因此能阻断潜在逃逸途径的由疫苗激发的记忆应答可能具有价值。虽然高度可变的包膜(Env)是抗HIV中和抗体的首要标靶,并且疫苗抗原也需要定制成引发这些抗体应答(Moore & Burton,Nat.Med.10:769-771(2004)),但是T细胞疫苗组分能靶向更保守的蛋白以触发更容易交叉反应的应答。但是,即使是最保守的HIV-1蛋白也具有足够的多样性,因此变异将是个问题。人造中心序列疫苗法、共有序列和祖先序列(Gaschen et al,Science 296:2354-2360(2002),Gao et al,J.Virol.79:1154-1163(2005),Doria-Rose et al,J.Virol.79:11214-11224(2005))——它们基本上在病毒株之间“折中”——显示出前景,其刺激出与天然病毒株疫苗相比具有更强的交叉反应性的应答(Gao et al,J.Virol.79:1154-1163(2005))(Liao et al.and Weaver et al.,已交稿)。然而,即使是中心病毒株也只能覆盖范围非常有限的HIV多样性谱,而基于共有序列的肽试剂也不能检测许多自体CD8+T细胞应答(Altfeld et al,J.Virol.77:7330-7340(2003))。

单一氨基酸取代能介导T细胞逃逸,并且由于HIV-1病毒株之间许多T细胞表位有一个或多个氨基酸差异,因此对任何一种疫苗抗原的应答的潜在有效性是有限的。特定的突变是否减小T细胞交叉反应性是表位特异性的并且是T细胞特异性的,尽管某些变化能广泛地影响进化枝之间的交叉反应性(Norris et al,AIDS Res.Hum.Retroviruses 20:315-325(2004))。在多价疫苗中包括更多变体能对更广泛的流行变体产生应答。其也可以使免疫系统对普通逃逸变体产生初免(Jones et al,J.Exp.Med.200:1243-1256(2004));从一个T细胞受体中逃逸会产生易受另一个影响的变体(Lee et al,J.Exp.Med.200:1455-1466(2004)),因此对表位变体的多克隆应答进行刺激是有益处的(Killian et al,AIDS 19:887-896(2005))。涉及抑制加工(Milicic et al,J.Immunol.175:4618-4626(2005))或HLA结合(Ammaranond et al,AIDS Res.Hum.Retroviruses 21:395-397(2005))的途径的免疫逃逸能防止表位呈递,并且在这种情况下,逃逸变体不会受到具有不同特异性的T细胞的抵抗。然而,存在这样的可能,即,能识别重叠型表位的T细胞的存在在一些情况下会阻断这些逃逸途径。

在以下非限制性实施例中将对本发明的某些方面进行更详细的描述。

实施例1

实验详述

HlV-1序列数据。采用来自2005HIV序列数据库(http://hiv.lanl.gov)的参考比对,其中包含每人一条序列,并另外补充有最近可以获得的来自南非德班的C亚型Gag和Nef序列(GenBank编号AY856956-AY857186)(Kiepiela et al,Nature 432:769-75(2004))。该组含有来自全球的551条Gag和1,131条NefM组序列;还包括重组序列以及用来考察M组多样性的纯亚型序列。这些含有18个A亚型、102个B亚型、228个C亚型和6个G亚型(Gag)以及62个A亚型、454个B亚型、284个C亚型和13个G亚型序列(Nef)序列的比对亚群用于单进化枝内以及单进化枝间的优化和比较。

遗传算法。GA是用于寻找解决难以通过分析来解决的问题的解决方案的生物过程(进化、群体、选择、重组)的计算模拟(Holland,Adaptation in Natural and Artificial Systems:An Introductory Analysis with Applicatins to Biology,Control,and Artificial Intelligence,(M.I.T.Press,Cambridge,MA(1992)))。给定输入的解决方案是根据“适合度”(最优)标准通过随机修饰和选择的过程而“进化”的。GA有许多特性(flavor);执行“稳态共进化多群体”。“稳态”是指一次产生一个新的候选方案,而不是一次产生一整个群体;而“共进化”是指同时进化到数个不同的群体,该群体共同工作,形成一个完整的解决方案。所述输入是未比对的天然序列组;候选方案是k个假天然“镶嵌”序列的集合,其中每一条序列由各段天然序列串联形成。适合度标准为群体覆盖率,其定义为所有9氨基酸序列片段(潜在表位)在混合物中发现的输入序列中的比例。

为了初始化GA(图2),通过随机选择的天然序列间的两点重组而生成k个具有n条初始候选序列的群体。因为所输入的天然序列并未经过比对,所以采用“同源”基因转换(crossover):每条序列里的基因转换点是通过搜索两条序列里的短匹配串来选择的;当典型的表位长度为c=9时使用c-1=8的串。这确保了重组序列类似于天然蛋白:衍生自不同病毒株的序列段之间的边界是无缝的,跨越该边界的局部序列在自然界中总能找到,并且防止镶嵌体出现氨基酸的大插入/缺失或者非天然组合。作为镶嵌体构建的结果,镶嵌序列长度落在天然序列长度的分布范围之内:重组仅仅允许在相同的区域进行,并通过显式软件加强以防止过长的长度,从而防止重复区域的再复制(再复制的表位的这种“框架内”插入能提供提高覆盖率的另一途径而不生成非天然的九聚体,但其插入将产生“非天然”蛋白)。起初,混合物含有一个随机选自每个群体的“胜者”。在群体中任一条个体序列的适合度得分是由该序列与其他群体的当前胜者构成的混合物的覆盖率值。因此,在群体中任何序列的个体适合度动态地取决于在其他群体中找到的最佳序列。

一次对一个群体进行优化。对于每次迭代,选择两条“亲代”序列。采用“两人淘汰赛”选择来选定第一条亲代:从当前群体中随机挑出两条序列,打分,然后选择较好的一条。这样选择的亲代,其概率与该亲代在群体内的适合度等级成反比,实际上不需要计算所有个体的适合度。第二条亲代按照相同方法(50%的时间)进行选择,或者从天然序列组中随机选择。然后采用亲代之间的两点同源基因转换以产生“子代”序列。任何含有在天然群体中非常稀有(发现少于三次)的九聚体的子代立即放弃。相反,则对新序列进行打分,并将其适合度与四条从同一群体中随机选择的序列的适合度进行比较。如果四条随机选择的序列中的任一条的得分低于该新序列的得分,则在该群体中该序列将被那条新序列所替换。只要遇到比当前群体的“胜者”获得更高的分数的序列,则该序列将成为当前群体的胜者,并随后用于混合物以评价其他群体中的序列。依次对每个群体进行数次这样的优化循环(通常为10次),对所有群体持续进行该过程循环直至进化停止(即,对于确定数目的代数不再有改进)。此时,采用新生成的随机起始群体重新开始整个过程,并持续进行该重新开始直至不再发现有进一步的改进。对n=50或500的每个数据组运行GA;每次运行在2GHz的奔腾处理器上持续运行12~24小时,直至不再发生进一步的改进。产生了k=1、3、4或6条镶嵌序列的混合物。

GA还能在混合物中非强制性地包括一条或多条令人感兴趣的固定序列(例如,共有序列),并进化出混合物的其他要素,以最优地补充该固定病毒株。由于这些方法是次优的,所以它们并未包括于此。附加程序从输入文件中选择能以组合形式提供最佳群体覆盖率的k个最佳天然病毒株。

与其他多价候选疫苗的比较。针对其他潜在的单价或多价疫苗,计算群体覆盖率得分,以与镶嵌序列疫苗进行直接比较,从而跟踪与群体九聚体的同一性以及与8/9和7/9氨基酸的相似性。基于天然病毒株的潜在候选疫苗包括单一病毒株(例如,用于南非的疫苗的单一C病毒株(Williamson et al,AIDS Res.Hum.Retroviruses 19:133-44(2003)))或者天然病毒株的组合(例如,分别来自A亚型、B亚型和C亚型中的一种(Kong et al,J.Virol.77:12764-72(2003)))。时至今日,还未系统性地选择天然病毒株候选疫苗以使潜在的T细胞表位覆盖率最大化;从文献中挑选出候选疫苗来代表可由未选择的候选疫苗预期到的疫苗。覆盖率的上限也仅仅采用完整的天然病毒株来确定:通过选择具有数据组中最佳覆盖率的单条序列来生成最优的天然序列混合物,然后依次加入最佳互补序列直至指定的k。所述比较包括各种大小的最佳天然序列混合物以及共有序列(单独或组合形式)(Gaschen et al,Science 296:2354-60(2002)),以代表中心合成疫苗的概念。最后,在GA中使用固定序列方案,在对比中采用共有序列+镶嵌序列的组合;这些得分基本等于对于指定k而包括在内的所有镶嵌组合的得分(数据未示出)。用于进行这些分析的代码可得自:ftp://ftp-t10/pub/btk/mosaics。

结果

蛋白变异。在保守的HIV-1蛋白中,大多数位置基本上是不变的,最可变的位置仅仅有两至三个以可察觉的频率出现的氨基酸,并且可变的位置通常很好地分散在保守位置之间。因此,在CD8+T细胞表位(8~12个氨基酸,通常为九个)的范围之内,非常少的几种变体即能覆盖绝大多数的群体多样性。图1显示了九聚体(九个相邻氨基酸的串)的群体覆盖率的上限,针对增加的变体数目对Gag、Nef和Env进行了比较,并依次加入有能提供最佳覆盖率的变体。在保守区域中,用2~4种变体能实现高度群体覆盖率。与之相比,在可变区域如Env,即使利用八种变体也只能得到有限的群体覆盖率。由于每次新加入的变体都更加稀有,每次加入的相对益处随着变体数目的增加而减少。

疫苗设计优化策略。图1显示了九聚体覆盖率的理想化水平。实际上,高频率的九聚体经常会有冲突:由于局部共变异的缘故,一个九聚体的最优氨基酸可能不同于重叠型九聚体。为了设计优化了群体覆盖率的镶嵌蛋白,每种氨基酸的相对益处必须结合附近的变体进行评价。例如,丙氨酸(Ala)和谷氨酸(Glu)各自会经常出现在相邻的位置上,但如果Ala-Glu组合在自然界中从未观察到,则应将其从疫苗中排除。已考察了几种优化策略:贪婪算法、半自动相容九聚体装配策略、基于比对的遗传算法(GA)和与比对无关的GA。

该与比对无关的GA生成具有最佳群体覆盖率的镶嵌体。该GA从一组未比对的蛋白序列中生成用户指定数目的镶嵌序列,其中明确地排除了能诱导非保护性疫苗-抗原特异性应答的稀有或非天然的表位长度片段(可能在重组断点引入)。这些候选疫苗序列类似于天然蛋白,但由数据库序列的在同源断点重组的频率加权片段装配而成(图2);它们接近于输入群体的九聚体的最大覆盖率。

选择用于初始镶嵌疫苗的HIV蛋白区域。初始设计着重于符合以下具体标准的蛋白区域:i)相对较低的变异性,ii)自然感染中的高水平识别,iii)高密度的已知表位,和iv)对感染的早期应答或者与感染患者中的良好结果相关的CD8+T细胞应答。首先,通过不同HIV蛋白的镶嵌序列实现的九聚体覆盖率水平进行评估(图3)。对于每种蛋白,采用M组或者单独采用B亚型和C亚型生成四镶嵌体组;对C亚型的覆盖率进行打分。有几项结果值得注意:i)亚型内优化提供了最好的亚型内覆盖率,但亚型间覆盖率明显较差——然而,B亚型优化的镶嵌体提供了比单一的天然B亚型蛋白更好的C亚型覆盖率(Kong et al,J.Virol.77:12764-72(2003));ii)Pol和Gag最具引起广泛交叉反应性应答的潜力,然而,Rev、Tat和Vpu具有甚至比高度可变的Env蛋白更少的保守九聚体,iii)M组优化的镶嵌体组的亚型内覆盖率接近于亚型内优化组的覆盖率,尤其是对于更保守的蛋白而言。

Gag以及Nef的中心区域满足以上所列的四条标准。Nef是T细胞最经常识别到的HIV蛋白(Frahm et al,J.Virol.78:2187-200(2004))并且是在自然感染中最早应答的标靶(Lichterfeld et al,Aids 18:1383-92(2004))。虽然总体而言它是可变的(图3),但其中心区域如同Gag一样保守(图1)。还不清楚哪一种优化蛋白将包含在疫苗中,而且镶嵌体能被设计为使潜在覆盖率最大,即使是最可变的蛋白的潜在覆盖率也是如此(图3),但对于保守蛋白而言,全球性覆盖率的前景更佳。通过向含有Gag、Pol和Env的疫苗中加入Rev、Tat和Nef,证明可在猕猴中改善免疫保护(Hel et al,J.Immunol.176:85-96(2006)),但这是对于同源免疫激发的情形而言,其中变异性并不是问题。在流行病毒群体中调节蛋白的极端变异性可排除交叉反应性应答;就保守性而言,Pol、Gag(尤其是p24)和Nef的中心区域(HXB2的65~149位)是具有前途的潜在免疫原(图1、图3)。然而,Pol在自然感染中被识别的频率较小(Frahm et al,J.Virol.78:2187-200(2004)),所以它没有包括在初始免疫原的设计中。被包括在其中的Nef保守部分含有HIV-1中最常被高度识别的肽(Frahm et al,J.Virol.78:2187-200(2004)),但作为蛋白片段,则不允许Nef的免疫抑制功能(例如HLA第I类的向下调节(Blagoveshchenskaya,Cell 111:853-66(2002)))。Gag和Nef均紧密地包装有重叠型的得到充分表征的CD8+和CD4+T细胞表位,该表位由许多不同的HLA分子所呈递(http://www.hiv.lanl.gov//content/immunology/maps/maps.html),而Gag特异性CD8+(Masemola et al,J.Virol.78:3233-43(2004))和CD4+(Oxenius et al,J.Infect.Dis.189:1199-208(2004))T细胞应答则与受感染的个体中的低病毒组点相关(Masemola et al,J.Virol.78:3233-43(2004))。

为测试地理变化和输入样品大小的潜在影响,使用已公开的C亚型序列进行有限的测试。将该C亚型Gag数据分为大小相当的三组——两个南非组(Kiepiela et al,Nature 432:769-75(2004))和一个非南非C亚型组。就每一组对镶嵌序列进行独立优化,然后针对所有三组测试所得的镶嵌体。对于相同的培养测试组,九聚体的覆盖率更好一点(77%~79%的9/9覆盖率),但当该培养测试组是两个不同的南非数据组(73%~75%),或者该南非组中的任意一组和非南非C亚型序列(74%~76%)时,九聚体的覆盖率基本相当。因此,国家间和国家内覆盖率近似于进化枝内覆盖率,并且在此情形中,未发现国家特异性C亚型镶嵌体设计具有优势。

Gag和Nef的镶嵌体设计以及疫苗策略的比较。为评估不同疫苗设计策略的亚型内和亚型间的交叉反应性,对它们提供的用于天然M组序列的覆盖率进行计算。计算了天然序列中与疫苗抗原的九聚体完全匹配的所有九聚体的分数,以及那些具有8/9或7/9匹配氨基酸的九聚体的分数,这是由于表位内的单取代(有时为双取代)会保留有交叉反应性。图4显示了在由各种策略设计得到的混合物的Gag和Nef的中心区域中每个九聚体的M组覆盖率:a)用作疫苗抗原的来自A亚型、B亚型、C亚型的三条非最优天然病毒株(Kong et al,J.Virol.77:12764-72(2003));b)经计算选择以得到最佳M组覆盖率的三个天然病毒株;c)M组、B亚型和C亚型共有序列;以及d)、e)、f)三、四和六镶嵌蛋白。对于多病毒株的混合物,即k=3、k=4和k=6的组,镶嵌体明显具有最佳表现,而覆盖率接近k病毒株的上限。它们之后是经优化选择的自然病毒株、共有蛋白混合物以及最后的非最优的天然病毒株。允许更多的抗原可以提供更高的覆盖率,但随着k增加,每次加入的增益减小(图1和图4)。

图5概括了不同疫苗设计策略的总体覆盖率,从单蛋白至镶嵌蛋白的组合,并对比了亚型内优化和M组优化。单镶嵌体的表现与最好的单天然蛋白病毒株或共有序列相当。虽然单共有序列的表现要超过单个最好的天然病毒株,但经优化的天然序列混合物确实比共有序列混合物更好:相对于天然病毒株而言,所述共有序列相互之间更加类似,因此有点冗余。然而,即使仅仅包含两种镶嵌变体,覆盖率也得到显著提高,而四镶嵌蛋白和六镶嵌蛋白得到渐次地比天然或者共有病毒株的多价混合物更好的覆盖率。亚型内优化的镶嵌体表现最好——四镶嵌抗原有80%~85%的九聚体完全地匹配——但这些组的亚型间的覆盖率急剧下降至50%~60%。与之相比,利用完整M组进行优化的镶嵌蛋白对于个体亚型得到大约75%~80%的覆盖率,这与M组作为整体的覆盖率相当(图5和图6)。如果允许有非完全的8/9匹配,M组优化和亚型内优化的镶嵌体均接近90%的覆盖率。

由于通过逐渐加入更稀有的九聚体可增加覆盖率,并且稀有表位可能会导致问题(例如通过诱导疫苗特异性免疫显性应答),因此对在疫苗构建体中九聚体相对于用以产生该疫苗构建体的天然序列的频率分布进行考察。与k=4的混合物相比,在k=6的混合物中,大部分额外表位的频率低(<0.1,图7)。尽管提高了覆盖率,但是这些表位相对稀有,因此它们诱发的应答会脱离针对更普通因而更有用的表位的疫苗应答。天然序列混合物实际上比镶嵌体具有更少的适度低频率表位事件,随着覆盖率的优化,这也产生了一些频率较低的九聚体。另一方面,镶嵌体排除了独特的或者非常稀有的九聚体,而天然病毒株通常含有不存在于其他序列中的九聚体。例如,天然M组Gag序列的每条序列平均具有35个(0~148的范围)独特的九聚体。还探讨了HLA锚定基序的保留,发现锚定基序频率在四镶嵌体和三个天然病毒株之间是相当的。天然抗原每抗原的基序数目的确显示为增加,这可能是因为包含病毒株特异性基序的缘故(图8)。

随着k增加,更稀有的表位也增加,并且担心疫苗点稀释和试剂开发成本,导致镶嵌蛋白组的初始制造会限于4序列(k=4),其跨过Gag和Nef中心区域,针对B亚型、C亚型和M组优化过(这些序列包含在图9中,Env和Pol的镶嵌组如图10所示)。各种四序列Gag-Nef镶嵌体的合成以及初始抗原性研究正在进行中。在初始镶嵌疫苗中,靶向的仅为Gag和Nef蛋白的中心,它们保守到足以提供优异的全球群体覆盖率,并且就天然应答而言,具有上述所需要的性质(Bansal et al,Aids 19:241-50(2005))。此外,在Elispot肽混合物中包括B亚型p24变体以检测对感染的天然CTL应答明显提高了所检测到的应答的数目和强度,这支持了以下观点,即包括即使是最保守的蛋白的变体也是有用的。最后,给恒河猴施用的多价HIV-1疫苗中的蛋白混合物不会影响对每种抗原的强烈应答的形成(Seaman et al,J.Virol.79:2956-63(2005)),并且抗原混合物在鼠类模型中没有产生拮抗性应答(Singh et al,J.Immunol.169:6779-86(2002)),这表明抗原混合物适用于T细胞疫苗。

即使是镶嵌体,可变蛋白如Env仍只具有有限的九聚体覆盖率,尽管相对于天然病毒株而言,镶嵌体提高了覆盖率。例如三种M组天然蛋白(A进化枝、B进化枝和C进化枝各选出一种,而且当前正在进行疫苗设计研究)(Seaman et al,J.Virol.79:2956-63(2005))在M组蛋白质中九聚体完全匹配的仅有39%,65%具有至少8/9的匹配。与之相比,三个M组Env镶嵌体与47%的九聚体完全匹配,70%具有至少8/9的匹配。为设计多价镶嵌抗原而编写的代码是可以得到的,并且可方便地用于任何可变蛋白的输入组,并可针对任何所需数量的抗原进行优化。该代码允许对k个天然病毒株的最优组合进行选择,从而可以对用于多价疫苗的天然抗原进行合理选择。表1中所包括的是对于当前数据库比对的Gag和Nef群体覆盖率而言为最佳的天然病毒株。

表1对于不同基因、亚型组和序列数目而言具有最佳的可获得的九聚体覆盖率的天然序列混合物

总而言之,上述研究着眼于在感染时用以抵抗HIV多样性、阻断病毒逃逸途径并因此使感染个体中的疾病进程最慢的T细胞疫苗组分的设计。此处研发的用于HIV-1疫苗设计的多价镶嵌蛋白策略可用于任何可变蛋白、其他病原体以及其他免疫学问题。例如,将最小数目的肽变体引入T细胞应答分析可显著提高灵敏度而不需过多的成本:一组k个镶嵌蛋白提供了最大可能的对于k个抗原的覆盖率。

之前已提出采用中心化(共有或始祖)基因和蛋白策略来解决HIV多样性问题(Gaschen et al,Science 296:2354-2360(2002))。通过M组共有免疫原诱导T细胞和B细胞对野生型HIV-1病毒株作出应答展示了人造基因作为免疫原的用途的概念验证(Gaschen et al,Science 296:2354-2360(2002),Gao et al,J.Virol.79:1154-63(2005),Doria-Rose et al,J.Virol.79:11214-24(2005),Weaver et al,J.Virol.,印刷中))。通过对多克隆疫苗试剂进行共优化,排除稀有CD8+T细胞表位,并根据该表位在群体水平的频率,导入可能参与逃逸途径的变体,使镶嵌蛋白设计对共有或天然免疫原设计作出改进。

该镶嵌抗原使以小实际数目存在的疫苗抗原中的具有表位长度的变体的数目最多。决定采用多种类似于天然蛋白的抗原而不是在多表位假蛋白中将串联的表位组连接(Hanke et al,Vaccine 16:426-35(1998)),原因在于,类天然疫苗抗原的体内加工更接近地类似于自然感染中的加工,而且还能够扩展重叠型表位的覆盖率。在强的多价免疫应答的情形中,最适宜采用的是T细胞镶嵌抗原;在疫苗设计的其他领域中的改进以及最佳策略的组合——其引入镶嵌抗原来覆盖多样性——可最终获得有效的由交叉反应性疫苗诱导的抗HIV-1免疫应答。

实施例2

在一个四研究项(4arm)免疫原性临床试验中,M组共有包膜和三价镶嵌包膜(二者均通过计算机模拟建模而设计,并被预测为比野生型包膜优越)将与单价野生型包膜和三价野生型传播包膜进行比较。该镶嵌抗原已基于当前的Los Alamos数据库设计出,该数据库为包括很多全长包膜的集合,所述包膜采样自全世界范围的超过2000个个体,并具有很大一组主要来源于CHAVI数据库的传播病毒的序列。

待用于比较的天然病毒株的选择基于如下标准:对于单价天然抗原,将采用单种传播病毒,从为全球性数据库提供潜在T细胞表位覆盖率的方面来说,该病毒是最佳选择。该数据库偏向B进化枝包膜,这样,单条最佳急性Env即为B进化枝的代表。建议将一条A亚型、一条B亚型和一条C亚型传播病毒序列包括在该三价组中,以对全球序列集合中固有的采样偏向进行补偿,并更好地反映流行性大规模流感病毒株。A天然序列和C天然序列是那些能最优地互补于最佳B进化枝序列以为数据库提供潜在表位覆盖率的序列。疫苗抗原已从可得的SGA测序的急性样本中选出,每一样本代表一种传播病毒。因此,本研究尽管主要为T细胞研究,其仍将提供关于传播包膜疫苗引发中和抗体的重要附加数据。

对于镶嵌/共有序列人体试验,提议如下的四研究项试验,每组20人,并有阴性对照:

1)Con S(各进化枝的共有序列中已充分研究的共有序列,基于2002数据库;Con S已在动物模型中广泛测试了,并且理论覆盖率大致与单条镶嵌体相当。)

2)一个3镶嵌体M组抗原组,其设计用来以组合方式在数据库中提供9氨基酸长段的最优全球覆盖率。这种九聚体代表数据库的潜在表位覆盖率。将非天然九聚体从镶嵌体中排除,并且使稀有变体最少。

3)最优的单条最佳天然蛋白选自从急性感染患者采样的序列,其SGA序列是可得的;这些序列应相应于可变的传递序列。如(2)中所述,将选择能提供数据库的最优九聚体覆盖率的序列作为该序列。B进化枝现主导了对序列数据库的采样,这样,具有最佳数据库覆盖率的序列将成为一条B进化枝序列。

4)来自急性感染SGA序列的最佳天然病毒株以组合方式提供最佳的全球覆盖率(注:B和C主导M组采样,所以该代码很自然地从各自中选择一个作为两个最佳。因此,第三条互补序列强制性地选自急性SGA的A进化枝组,从而抵消该偏差并更好地反映全球性流行病)。

5)阴性对照缓冲液/盐水

HIV数据库中的当前M组比对与所有较新的CHAVI序列组合,后者包括总共2020条序列:

728条B进化枝

599条C进化枝

693条全为其他进化枝,流行重组体形式,并且是独特的重组体。其用于M组疫苗设计。

该采样明显偏向B进化枝和C进化枝。如后所示,其他进化枝中“潜在表位”(九聚体)的覆盖率仍是优异的。

序列

M共有序列

>ConS

MRVRGIQRNCQHLWRWGTLILGMLMICSAAENLWVTVYYGVPVWKEANTTLFCASDAKAYDTEVHNVWATHACVPTDPNPQEIVLENVTENFNMWKNNMV EQMHEDIISLWDQSLKPCVKLTPLCVTLNCTNVNVTNTTNNTEEKGEIKNCSFNITTEIRDKKQKVYALFYRLDVVPIDDNNNNSSNYRLINCNTSAIT Q ACPKVSFEPIPIHYCAPAGFAILKCNDKKFNGTGPCKNVSTVQCTHGIKPVVSTQLLLNGSLAEEEIIIRSENITNNAKTIIVQLNESVEINCTRPNN NT RKSIRIGPGQAFYATGDIIGDIRQAHCNISGTKWNKTLQQVAKKLREHFNNKTIIFKPSSGGDLEITTHSFNCRGEFFYCNTSGLFNSTWIGNGTKN NNN TNDTITLPCRIKQIINMWQGVGQAMYAPPIEGKITCKSNITGLLLTRDGGNNNTNETEIFRPGGGDMRDNWRSELYKYKVVKIEPLGVAPTKAKRR VVER EKRAVGIGAVFLGFLGAAGSTMGAASITLTVQARQLLSGIVQQQSNLLRAIEAQQHLLQLTVWGIKQLQARVLAVERYLKDQQLLGIWGCSGKLI CTTTV PWNSSWSNKSQDEIWDNMTWMEWEREINNYTDIIYSLIEESQNQQEKNEQELLALDKWASLWNWFDITNWLWYIKIFIMIVGGLIGLRIVFAVL SIVNRV RQGYSPLSFQTLIPNPRGPDRPEGIEEEGGEQDRDRSIRLVNGFLALAWDDLRSLCLFSYHRLRDFILIAARTVELLGRKGLRRGWEALKYLW

3镶嵌体

>M_mos_3_1

MRVKGIRKNYQHLWRWGTMLLGMLMICSAAEQLWVTVYYGVPVWRDAETTLFCASDAKAYEREVHNVWATHACVPTDPNPQEIVLENVTEEFNMWKNNMVDQMHEDIISLWDESLKPCVKLTPLCVTLNCTDVNVTKTNSTSWGMMEKGEIKNCSFNMTTELRDKKQKVYALFYKLDIVPLEENDTISNSTYRLINCNTSAITQACPKVTFEPIPIHYCTPAGFAILKCNDKKFNGTGPCKNVSTVQCTHGIRPVVTTQLLLNGSLAEEEIIIRSENLTNNAKTIIVQLNESVVINCTRPNNNTRKSIRIGPGQTFYATGDIIGNIRQAHCNISREKWINTTRDVRKKLQEHFNKTIIFNSSSGGDLEITTHSFNCRGEFFYCNTSKLFNSVWGNSSNVTKVNGTKVKETITLPCKIKQIINMWQEVGRAMYAPPIAGNITCKSNITGLLLVRDGGNVTNNTEIFRPGGGNMKDNWRSELYKYKVVEIKPLGIAPTKAKRRVVEREKRAVGLGAVFLGFLGAAGSTMGAASMTLTVQARQLLSGIVQQQSNLLRAIEAQQHMLQLTVWGIKQLQARILAVERYLRDQQLLGIWGCSGKLICTTNVPWNSSWSNKSLDEIWNNMTWMQWEKEIDNYTSLIYTLIEESQNQQEKNEQDLLALDKWANLWNWFDISNWLWYIRIFIMIVGGLIGLRIVFAVLSIVNRVRKGYSPLSFQTLTPNPRGPDRLGRIEEEGGEQDKDRSIRLVNGFLALAWDDLRNLCLFSYHRLRDLLLIVTRIVELLGRRGWEALKYLWNLLQYWIQELKNSAVSLLNATAIAVAEGTDRVIEVVQRACRAILHIPRRIRQGLERALL

>M_mos_3_2

MRVKETQMNWPNLWKWGTLILGLVIICSASDNLWVTVYYGVPVWKEATTTLFCASDAKAYDTEVHNVWATYACVPTDPNPQEVVLGNVTENFNMWKNNMVEQMHEDIISLWDQSLKPCVRLTPLCVTLNCSNANTTNTNSTEEIKNCSFNITTSIRDKVQKEYALFYKLDVVPIDNDNTSYRLISCNTSVITQACPKVSFEPIPIHYCAPAGFAILKCKDKKFNGTGPCTNVSTVQCTHGIRPVVSTQLLLNGSLAEEEVVIRSENFTNNAKTIIVHLNKSVEINCTRPNNNTRKSIHIGPGRAFYATGEIIGDIRQAHCNISRAKWNNTLKQIVKKLKEQFNKTIIFNQSSGGDPEITTHSFNCGGEFFYCNTSGLFNSTWNSTATQESNNTELNGNITLPCRIKQIVNMWQEVGKAMYAPPIRGQIRCSSNITGLILTRDGGNNNSTNETFRPGGGDMRDNWRSELYKYKVVKIEPLGVAPTKAKRRVVQREKRAVGTIGAMFLGFLGAAGSTMGAASLTLTVQARLLLSGIVQQQNNLLRAIEAQQHLLQLTVWGIKQLQARVLAVERYLKDQQLLGIWGCSGKLICTTTVPWNTSWSNKSLNEIWDNMTWMEWEREIDNYTGLIYTLLEESQNQQEKNEQELLELDKWASLWNWFDITKWLWYIKIFIMIVGGLVGLRIVFTVLSIVNRVRQGYSPLSFQTHLPAPRGPDRPEGIEEEGGERDRDRSGRLVDGFLAIIWVDLRSLCLFSYHQLRDFILIAARTVELLGHSSLKGLRRGWEALKYWWNLLQYWSQELKNSAISLLNTTAIVVAEGTDRIIEVLQRAGRAILHIPTRIRQGLERLLL

>M_mos_3_3

MRVRGIQRNWPQWWIWGILGFWMLMICNVVGNLWVTVYYGVPVWKEAKTTLFCASDAKAYEKEVHNVWATHACVPTDPSPQEVVLENVTENFNMWKNDMVDQMHEDVISLWDQSLKPCVKLTHLCVTLNCTNATNTNYNNSTNVTSSMIGEMKNCSFNITTEIRDKSRKEYALFYRLDIVPLNEQNSSEYRLINCNTSTITQACPKVSFDPIPIHYCAPAGYAILKCNNKTFNGTGPCNNVSTVQCTHGIKPVVSTQLLLNGSLAEGEIIIRSENLTDNAKTIIVHLNESVEIVCTRPNNNTRKSVRIGPGQAFYATGDIIGDIRQAHCNLSRTQWNNTLKQIVTKLREQFGNKTIVFNQSSGGDPEIVMHSFNCGGEFFYCNTTQLFNSTWENSNITQPLTLNRTKGPNDTITLPCRIKQIINMWQGVGRAMYAPPIEGLIKCSSNITGLLLTRDGGNNSETKTTETFRPGGGNMRDNWRNELYKYKVVQIEPLGVAPTRAKRRVVEREKRAVGIGAVFLGFLGTAGSTMGAASITLTVQARQVLSGIVQQQSNLLKAIEAQQHLLKLTVWGIKQLQTRVLAIERYLKDQQLLGLWGCSGKLICTTAVPWNSSWSNKSQTDIWDNMTWMQWDREISNYTDTIYRLLEDSQNQQEKNEKDLLALDSWKNLWNWFDITNWLWYIKIFIIIVGGLIGLRIIFAVLSIVNRCRQGYSPLSLQTLIPNPRGPDRLGGIEEEGGEQDRDRSIRLVSGFLALAWDDLRSLCLFSYHRLRDFILIVARAVELLGRSSLRGLQRGWEALKYLGSLVQYWGLELKKSAISLLDTIAIAVAEGTDRIIEVIQRICRAIRNIPRRIRQGFEAALL

选自可得的急性SGA序列的单条最优天然序列:

>B.acute.Con.1059

MRVTEIRKNYLWRWGIMLLGMLMIC SAAEQLWVTVYYGVPVWKEATTTLFCASDAKAYTAEAHNVWATHACVPTDPNPQEVVLENVTENFNMWKNNMVEQMHEDIISLWDQSLKPCVKLTPLCVTLNCTDLANNTNLANNTNSSISSWEKMEKGEIKNCSFNITTVIKDKIQKNYALFNRLDIVPIDDDDTNVTNNASYRLISCNTSVITQACPKISFEPIPIHYCAPAGFAILKCNDKKFNGTGPCTNVSTVQCTHGIKPVVSTQLLLNGSLAEEEVVIRSENFTDNVKTIIVQLNESVIINCTRPNNNTRKSITFGPGRAFYTTGDIIGDIRKAYCNISSTQWNNTLRQIARRLREQFKDKTIVFNSSSGGDPEIVMHSFNCGGEFFYCNTTQLFNSTWNGNDTGEFNNTGKNITYITLPCRIKQIINMWQEVGKAMYAPPIAGQIRCSSNITGILLTRDGGNSSEDKEIFRPEGGNMRDNWRSELYKYKVVKIEPLGVAPTKAKRRVVQREKRAVGIGAVFLGFLGAAGSTMGAASMTLTVQARLLLSGIVQQQNNLLRAIEAQQHLLQLTVWGIKQLQARVLAVERYLKDQQLLGIWGCSGKLICTTAVPWNASWSNRSLDNIWNNMTWMEWDREINNYTNLIYNLIEESQNQQEKNEQELLELDKWASLWNWFDITKWLWYIKIFIMIVGGLVGLRIVFVILSIVNRVRQGYSPLSFQTHLPTPRGLDRHEGTEEEGGERDRDRSGRLVDGFLTLIWIDLRSLCLFSYHRLRDLLLIVTRIVELLGRRGWEILKYWWNLLQYWSQELKNSAVSLLNATAIAVAEGTDRIIEIVQRIFRAILHIPTRIRQGLERALL

选自可得的急性样本的3条最优天然序列,SGA序列:

>B.acute.Con.1059

MRVTEIRKNYLWRWGIMLLGMLMICSAAEQLWVTVYYGVPVWKEATTTLFCASDAKAYTAEAHNVWATHACVPTDPNPQEVVLENVTENFNMWKNNMVEQMHEDIISLWDQSLKPCVKLTPLCVTLNCTDLANNTNLANNTNSSISSWEKMEKGEIKNCSFNITTVIKDKIQKNYALFNRLDIVPIDDDDTNVTNNASYRLISCNTSVITQACPKISFEPIPIHYCAPAGFAILKCNDKKFNGTGPCTNVSTVQCTHGIKPVVSTQLLLNGSLAEEEVVIRSENFTDNVKTIIVQLNESVIINCTRPNNNTRKSITFGPGRAFYTTGDIIGDIRKAYCNISSTQWNNTLRQIARRLREQFKDKTIVFNSSSGGDPEIVMHSFNCGGEFFYCNTTQLFNSTWNGNDTGEFNNTGKNITYITLPCRIKQIINMWQEVGKAMYAPPIAGQIRCSSNITGILLTRDGGNSSEDKEIFRPEGGNMRDNWRSELYKYKVVKIEPLGVAPTKAKRRVVQREKRAVGIGAVFLGFLGAAGSTMGAASMTLTVQARLLLSGIVQQQNNLLRAIEAQQHLLQLTVWGIKQLQARVLAVERYLKDQQLLGIWGCSGKLICTTAVPWNASWSNRSLDNIWNNMTWMEWDREINNYTNLIYNLIEESQNQQEKNEQELLELDKWASLWNWFDITKWLWYIKIFIMIVGGLVGLRIVFVILSIVNRVRQGYSPLSFQTHLPTPRGLDRHEGTEEEGGERDRDRSGRLVDGFLTLIWIDLRSLCLFSYHRLRDLLLIVTRIVELLGRRGWEILKYWWNLLQYWSQELKNSAVSLLNATAIAVAEGTDRIIEIVQRIFRAILHIPTRIRQGLERALL

>C.acute.Con.0393

MRVRGILRNYQQWWIWGILGFWMLMICSVGGNLWVTVYYGVPVWREAKTTLFCASDAKAYEREVHNVWATHACVPTDPNPQELFLENVTENFNMWKNDMVDQMHEDIISLWDQSLKPCVKLTPLCVTLNCSNANITRNSTDGNTTRNSTATPSDTINGEIKNCSFNITTELKDKKKKEYALFYRLDIVPLNEENSNFNEYRLINCNTSAVTQACPKVSFDPIPIHYCAPAGYAILKCNNKTFNGTGPCNNVSTVQCTHGIKPVVSTQLLLNGSLAEEEIIIRSENLTNNAKTIIVHLKEPVEIVCTRPNNNTRKSMRIGPGQTFYATDIIGDIRQASCNIDEKTWNNTLNKVGEKLQEHFPNKTLNFAPSSGGDLEITTHSFNCRGEFFYCNTSKLFYKTEFNSTTNSTITLQCRIKQIINMWQGVGRAMYAPPIEGNITCKSNITGLLLTRDGGTNDSMTETFRPGGGDMRDNWRSELYKYKVVEIKPLGVAPTEAKRRVVEREKRALTLGALFLGFLGTAGSTMGAASITLTVQARQLLSGIVQQQSNLLKAIEAQQHLLQLTVWGIKQLQTRVLAIERYLQDQQLLGLWGCSGKLICTTAVPWNSSWSNKSQGEIWGNMTWMQWDREISNYTNTIYRLLEDSQIQQEKNEKDLLALDSWKNLWSWFSITNWLWYIKIFIMIVGGLIGLRIIFAVLSIVNRVRQGYSPLPFQTLIPNPRGPDRLGRIEEEGGEQDRDRSIRLVNGFLAIAWDDLRSLCLFSYHRLRDFILIAARAAELLGRSSLRGLQRGWEALKYLGSLVQYWGLELKKSAISLLDTVAITVAEGTDRIIEVVQRICRAICNIPRRIRQGFEAALQ

四种疫苗抗原的覆盖率比较

镶嵌体和天然序列针对每一种疫苗左侧的第一个红色条进行优化(总计)。“总计”表示所有的序列,即数据库+CHAVI。“B”为B进化枝的子集,“C”为C进化枝的子集,而“N”为其余的既不是B也不是C的M组序列(其他所有进化枝和重组体)。由于B是最普通的,单条最佳天然序列理所当然是B,由此B具有针对Nat.1的最佳覆盖率。如所预期的那样,Con S对于所有的进化枝提供了更加平均的覆盖率,并且对于除B进化枝之外的所有组提供了更好的覆盖率(注:在Con S猕猴研究中,天然B并未选择最佳者,而Con S具有比已使用的B疫苗病毒株更好的覆盖率(即使在B进化枝内);这反映在所检测到的对异种B的应答数目。这里的一个区别在于,天然B选择了提供最优覆盖率的来自急性感染的天然B进化枝序列)。Nat.3给出了较广的覆盖率,Mos.3更好。(参见图11)

镶嵌体会尽可能减少稀有九聚体,但在Env中它们无法排除,或者说不可能跨越某些真正可变区域以得到完整蛋白。对于所测试的其他所有HIV蛋白来说,有可能排除发现3次或更少次的九聚体。但是,与3条Env镶嵌体相比,3条最佳的天然Env含有超过两倍数量的稀有九聚体变体。

图12包括另外的覆盖率概览;如所能预测的那样,ConS gp160含有相当多的保守九聚体,后者未见于gp140DCFI。ConS提供了比单条镶嵌体略少的覆盖率,但早已知道ConS在猕猴体内能很好地起作用,所以能作为良好的阳性对照。1条、2条和3条镶嵌体给出越来越好的覆盖率,而Nat.3不像Mos.3那么好。

图13依赖于比对,并基于数据库比对(之前的两图是不依赖于比对的)。每个位置代表九聚体,当移动到蛋白另一端时,九聚体就初始化。上边界(黑色点划线标出)是起始于每个位置的三个最常见九聚体的频率之和;其代表针对三种蛋白覆盖率所能获得的最大限值,但其在实践中不完全能获得,因为对于重叠九聚体的给定位置处会有冲突,尽管三镶嵌体的组合几乎能获得该值。用灰色表示的“全部九聚体”变化的原因在于比对中的插入和缺失。

仅有Mos.3疫苗混合物示于图13。然而,根据覆盖率重新整理的所有四种疫苗示于图14,其中,起始于被疫苗最佳覆盖的九聚体的那些位置移到了左边。在所有四个图中,精确匹配线位于左边作为参考点。不仅仅是Mos.3(红色)达到了最大值,具有交互反应性潜能的橙色和黄色接近匹配在本疫苗混合物中与其他的相比也得到了改善。

图15中所示各图对应于全数据库比对中每条序列的每一个氨基酸。一排像素为一条序列,一列为对比位置。白色斑点为用于维持比对的插入点。所有包含氨基酸的九聚体都考虑到了。如果跨越氨基酸的每条九聚体在疫苗混合物中都具有完美的匹配,则像素为黄色,所以黄色是好的。如果有一个不匹配,则为浅橙色,两个不匹配,则为深橙色,……一直到由黑色表示的无跨越的九聚体匹配情况。注意:相对于其他疫苗而言,很多黄色为3镶嵌体。对于Nat.1中的B进化枝,有一个最深黄色的大斑点,这是因为单条最佳天然序列为B进化枝。注意所有黑色的小块:在这些区域中,数据库中的序列与疫苗中的任何九聚体都不同,所以交互反应性会受到不同的限制。

使用九聚体的优化

选择九聚体是因为这是最优CD8+T细胞表位的最常见的大小。它们的范围为8~12,而最优CD4+T细胞表位可以更大或更小。结果是,当针对九聚体进行优化时,九聚体覆盖率是最佳的,但对不同大小者进行优化时,九聚体覆盖率的降低非常小。对于所有的长度8~12结果均如此,对于所选择的大小,产生峰值覆盖率,但对于其他大小,覆盖率也是优异的,这是由于解决方案是相关的。图16示出了九聚体与12聚体的比较,12是能合理考虑的最大极限值。对于长度为9或12的经优化的九聚体,或者对于长度为9或12的经优化的12聚体,它们的覆盖率几乎相等,对于经选择进行优化的长度,覆盖率高1%~2%。当然,12聚体的同一性通常比九聚体更低,因为它们更长,所以找到完美的匹配更难。对于HIV蛋白,进行更加复杂的研究,其表明,当12聚体对于9的长度进行优化时,其损耗始终很大,反之则不然,其还表明,在其他蛋白中,该差别可高达4%~5%。因此,对于Env来说,九聚体的选择并不怎么成问题。考虑到上述所有情况,选择了九聚体,因为这是最常见的最优CTL表位长度,还因为九聚体的覆盖率提供了其他长度的接近最优的覆盖率。

3条最佳天然病毒者的选择:急性传播病例,SGA序列

首先探索了将所有的数据库序列用作用于疫苗混合物的天然病毒株的来源,然后将其与从正好为急性SGA序列的限定群组(主要为传播病毒)中的选择进行比较。通过限定为急性感染序列,可获得该全数据库的实质上可相比的覆盖率。由于这些具有其他明显有点,它们还将用于天然序列。

首先,对覆盖率的探索将该全数据库作为天然混合物的来源使用。如上所述,当前的M组Env“每人一条序列”的数据组受B进化枝(紧跟着是C进化枝)感染的支配。因此,通过疫苗设计程序选择的用于涵盖(数据库+CHAVI)数据组中九聚体的单条最佳最优天然序列为B。如果从该数据库中挑选任一条序列,那么YU-2成为最佳单条序列。为得到其他进化枝的更好的代表,该最佳的B固定不变,然后添加次佳序列以补充YU-2,其(理论上)为C进化枝序列DU467。接着,这两条序列固定不变,然后选择抗原的第三条补充序列。(如果前两条序列不固定,并且程序允许选择第三条,那么理论上会出现B/C重组体,这样将不得不强制选择A。据信强制选择ABC组可改善全球覆盖率,并且会部分抵消序列中B和C进化枝采样的偏向。)

来自该数据库的最优天然序列倾向于回到较早的序列,这并不令人奇怪,因为较早的序列在系统树中倾向于更接近中央,从而更接近于其他流行病毒株。然而,对于本项研究来说,最好使用更加同期的、在急性感染期间采样的并使用SGA测序的包膜蛋白,因为这些序列精确地反映了所传递的病毒。考虑到这种约束,仍然希望针对九聚体覆盖率进行优化,这样,天然序列的混合物在与镶嵌体的比较当中就有最大的胜出几率。这一步完成后的结果是,当将从急性SGA序列中选出的三价混合物与从整个数据库中选出的三价抗原相比(各自均针对全数据库的覆盖率进行优化)时,覆盖率的损失是极低的。因此,通过将抗原混合物限定为传播病毒,覆盖率不会降低。这种替代方案具有多个优点。最重要的是,其使得能够相对于共有序列或镶嵌体来确定从用于天然混合物的急性感染病毒产生的抗体的交互反应性潜能,以作为感兴趣的第二端点,而不会危及第一端点,后者关注T细胞应答覆盖率宽度的比较。从CHAVI研究中测序得到的一大组B进化枝(113)和C进化枝(40)急性样本是现成的,其提供了很大的数据组,从该数据组中可选出最优组合。对于来自A进化枝的互补序列的选择来说,在三价疫苗中补充B和C。一些急性序列是现成的。

gp160的分析已着手进行,其包括8条A亚型的gp160,并且还用V1-V4中的全部15条进行了亚区分析,以作为是否还需要更多次测序的指标。幸运的是,现成的全长序列之一完美地与B和C急性序列互补,实质上与其他中任一者几乎一样好。本次比较表明,此时没有特别的需要去进行更多次测序。相信这是合适的,因为使用这样一种有限制的A基线来选择,由于A序列仅需与B和C进化枝病毒株的选择互补,所以从中可得到很多种B和C用来选择。如下为得到Nat.3混合物的患者中的两个。Nat.1为第一个。

B患者1059

患者性别=M

危险度=PPD

样本国家=USA

样本城市=Long Beach,CA

患者队列=CA-UCSF

患者健康状况=急性

病毒量=2,800,000

感染国家=USA

样本日期=03/26/98

C患者0393

Fiebig阶段=4

感染国家=Malawi

样本日期=2003年7月17日

病毒量=12,048,485

患者性别=F

CD4计数=618(序列采样后13天后测得)

患者年龄=23

STD=GUD,PID

图17和图18描绘了在从急性SGA序列中选择时的最低覆盖率损失,以及三个患者的env序列中每一条的高亮图,其显示出每一患者的共有序列与最常见的病毒株等同,因此极好地评估了实际传播的病毒。

为什么是M组以及非进化枝特异性覆盖率?

由于很多国家存在多进化枝流行病并且由于人员流动,相信使用探索性的方法(例如本发明的这些方法)为全球性HIV疫苗而努力(如果可能的话)是很重要的。由于进化枝内覆盖率必然能通过进化枝内优化的疫苗而获得,所以这种策略的结果会是进化枝间覆盖率的明显损失。希望在于,多价镶嵌体能提供足够的广泛性以对抗实质上任何进化枝或重组体的病毒。图19示出了Env M组与亚型特异性设计相比在覆盖率方面的折中和益处。

为什么是Env?

这种概念研究的证据已得到很好的阐述以发现使用Env作为测试抗原的应答广泛性的差异。其部分原因是描述于此的理论思考(与最佳天然病毒株相比,ENV在镶嵌体中具有两倍的保守九聚体,而仅有一半的稀有变体),部分原因是现有的动物研究。使用共有序列与猕猴体内天然序列进行对比的Env研究显示出应答广泛性的高度明显增长:每一Env蛋白均识别出了3~4倍的表位(Santra et al,in press,PNAS)。Env镶嵌体已在小鼠研究中显示出更加深远的优点(高达天然抗原可比数量的10倍,与VRC合作的准备中的手稿)。基于这项现有技术研究,从一项小型人体试验开始测试对Env的应答广泛性是有意义的。最终,希望在于将通过Env获得的概念证据应用于更加保守的蛋白,例如Gag,对于这种蛋白有可能赋予最广的保护。Gag得到了全部M组的优异的覆盖率。Gag和Nef的测试是在猕猴体内进行的,其以使用四种镶嵌体疫苗的混合物的方式进行(见实施例3)。图20是猕猴的4镶嵌体Gag疫苗和提议的人Env 3镶嵌体疫苗与现有数据库的覆盖率对比。对于使用Gag疫苗的交互反应性,理论潜能很高,但迄今在动物模型中使用Env获得了更多进展,所以Env具有最好的基础用以证明前进的正确性。以上描述的三条镶嵌体Env序列以及实施例3中使用的序列示于图21。

DNA

待使用的DNA将为全长gp160Env的形式。该gp160应在PCMVR质粒中(Gary Nabel),并且应与在所有VRC DNA免疫接种试验中使用的质粒相同。剂量预测为4mg。使用如下的DNA构建体:

●DNA传播的最优野生型Env/创始env(WT Env)

●DNA M组共有Env(ConS Env)

●DNA传播的三价最优野生型Env/创始Env(WT Tri Env)

●DNA三价镶嵌体Env

NYVAC

NYVAC(vP866)是一种重组痘病毒载体,与野生型病毒相比,其有18个基因的缺失。该NYVAC载体将由Sanofi-Pasteur获得许可,由第三方承包商制造,并且将在CEF细胞基底上繁殖。在NYVAC中表达的Env构建体将为gp140C(整条Env,跨膜和胞浆区缺失,并且gp41/gp120切割位点变异)或为完整gp160。构建体设计的选择取决于生成具有gp160形式而不是gp140形式的NYVAC的能力。预测NYVAC的剂量为~1x10^7TCID50。将使用如下的NYVAC构建体:

●NYVAC WT Env

●NYVAC ConS Env

●NYVAC三价本地Env

●NYVAC三价镶嵌体Env

疫苗接种将通过肌肉内注射进行。

表:标准模式

参与者:

18~50岁的健康、未感染HIV-1的志愿者:

80个接种者

16个对照组接受者

总共96个参与者

设计:

随机的、以安慰剂做对照的双盲试验

每个参与者的持续时间:

大约12个月

预计的总研究时间:

大约18个月

实施例3

质粒DNA疫苗和重组牛痘(rVV)的构建。通过使用最优基因表达策略,将Gag和Nef、M组共有Gag和Nef CON-S的氨基酸序列转化为核苷酸序列而生成镶嵌体gag和nef基因、M组共有gag和nef基因。为作为DNA疫苗使用,将镶嵌体gag和nef基因、M组共有gag和nef基因亚克隆到WLV0001-AM DNA疫苗载体中。无内毒素的质粒DNA制剂由Puresyn,Inc.(Malvern,PA)制造,用于恒河猴的免疫接种。为了促进重组牛痘,生成了表达个体镶嵌体gag和nef基因、M组共有gag和nef基因的病毒。所使用的方法如此前所描述的(Liao et al,Virology 353:268-282(2006);Earl,BioTechniques 23:1094-1097(1997))。

实验组别和疫苗接种安排。使用10mg的空DNA载体质粒(第1组,6只猴)、或各5mg的M组gag和nef质粒DNA(第2组,12只猴)或各1.25mg的4镶嵌体gag和4nef质粒DNA(第3组,12只猴),在第0日和第30日通过肌肉内注射对三组恒河猴进行免疫。在用第2轮DNA免疫接种后5个月,使用表达初始免疫原(10^9pfu/只猴)的相应rVV对猴子增加剂量。

Gag和Nef的豆蔻酰化具有对免疫应答的潜在下调效果,因此Gag和Nef的豆蔻酰化已经在本研究中使用的序列中变异。

***

以上列举的所有文献和其他信息来源的全部内容以参照的方式并入于此。

多价疫苗.pdf_第1页
第1页 / 共139页
多价疫苗.pdf_第2页
第2页 / 共139页
多价疫苗.pdf_第3页
第3页 / 共139页
点击查看更多>>
资源描述

《多价疫苗.pdf》由会员分享,可在线阅读,更多相关《多价疫苗.pdf(139页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 CN 102177175 A (43)申请公布日 2011.09.07 CN 102177175 A *CN102177175A* (21)申请号 200980140421.1 (22)申请日 2009.08.14 12/192,015 2008.08.14 US C07K 14/155(2006.01) C12N 15/49(2006.01) A61K 39/21(2006.01) (71)申请人 洛斯阿拉莫斯国家安全股份有限公 司 地址 美国新墨西哥州 申请人 贝斯以色列女执事医疗中心 杜克大学 UAB 研究基金会 (72)发明人 贝特T科贝尔 威廉费舍尔 诺曼莱文 廖。

2、华新 巴顿F海恩斯 比阿特里斯H哈恩 (74)专利代理机构 中国商标专利事务所有限公 司 11234 代理人 万学堂 (54) 发明名称 多价疫苗 (57) 摘要 本发明总体而言涉及一种免疫原性组合物 ( 例如疫苗 ), 具体而言涉及一种多价免疫原性 组合物, 例如多价 HIV 疫苗, 并且涉及使用它的方 法。本发明还涉及使用遗传算法以创建适于用例 如疫苗接种策略的多价抗原组的方法。 (30)优先权数据 (85)PCT申请进入国家阶段日 2011.04.11 (86)PCT申请的申请数据 PCT/US2009/004664 2009.08.14 (87)PCT申请的公布数据 WO2010/01。

3、9262 EN 2010.02.18 (51)Int.Cl. (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 1 页 说明书 27 页 附图 110 页 CN 102177179 A1/1 页 2 1. 一种多肽或蛋白, 其包含至少一条图 21 或图 22 所示的氨基酸的序列。 2. 一种核酸, 其编码权利要求 1 的多肽或蛋白。 3. 一种核酸, 其包含至少一条图 22 所示的核苷酸的序列。 4. 一种载体, 其包含权利要求 2 或 3 的核酸。 5. 权利要求 3 的载体, 其中所述载体为病毒载体。 6. 一种组合物, 其包含至少一种权利要求 1 的多肽或蛋白以及载。

4、体。 7. 一种组合物, 其包含至少一种权利要求 2 或 3 的核酸以及载体。 8. 一种在哺乳动物中诱导免疫应答的方法, 包括给所述哺乳动物施用足以产生所述诱 导的量的至少一种权利要求 1 的多肽或蛋白。 9. 一种在哺乳动物中诱导免疫应答的方法, 包括给所述哺乳动物施用足以产生所述诱 导的量的至少一种权利要求 2 或 3 的核酸。 权 利 要 求 书 CN 102177175 A CN 102177179 A1/27 页 3 多价疫苗 0001 本申请是提交于 2008 年 2 月 8 日的美国第 11/990,222 号申请的部分继续申请, 后者是提交于 2006 年 8 月 23 日的。

5、第 PCT/US2006/032907 号国际申请的美国国家阶段, 其 指定了美国并且要求了提交于 2005 年 8 月 23 日的美国第 60/710,154 号临时申请和提交 于 2005 年 11 月 25 日的美国第 60/739,413 号临时申请的优先权, 这些申请的全部内容以 参照的方式并入于此。 技术领域 0002 本发明总体而言涉及一种免疫原性组合物 ( 例如疫苗 ), 具体而言涉及一种多价 免疫原性组合物, 例如多价 HIV 疫苗, 并且涉及使用它的方法。本发明还涉及使用遗传算法 以创建适于用例如疫苗接种策略的多价抗原组的方法。 背景技术 0003 设计一种有效的 HIV 。

6、疫苗是多面性的挑战。该疫苗优选引起免疫应答, 该免疫 应答要么能预防感染, 要么至少也能在发生感染时控制病毒的复制, 尽管对自然感染的免 疫应答已失效, 从而消除病毒 (Nabel, Vaccine 20 : 1945-1947(2002) 或者免受重复感染 (Altfeld et al, Nature 420 : 434-439(2002)。需要一种强力疫苗, 其具有优化的载体、 免疫学流程和佐剂 (Nabel, Vaccine 20 : 1945-1947(2002), 并结合有能针对多种谱系的 流行病毒来激发交互反应性应答的抗原(Gaschen et al, Science 296 : 。

7、2354-2360(2002), Korber et al, Br.Med.Bull.58 : 19-42(2001)。 困扰了流感疫苗学家数十年的问题突显了 由 HIV-1 造成的挑战 : 遭受抗原漂移的人流感病毒株每年在相互之间偏移约 1 2, 而疫 苗抗原通常年复一年地不能引起交互反应性 B 细胞应答, 这就需要对同期的病毒株进行持 续监测, 并每隔几年就要对疫苗进行更新(Korber et al, Br.Med.Bull.58 : 19-42(2001)。 相比之下, 共流行的个体 HIV-1 病毒株彼此之间的差异在相对保守的蛋白质中达 20或更 多, 而在包膜蛋白中高达35(Gasc。

8、hen et al, Science 296 : 2354-2360(2002), Korber et al, Br.Med.Bull.58 : 19-42(2001)。 0004 在地区性 HIV-1 流行病中病毒多样性的不同程度为疫苗设计策略提供了潜在 有用的层次。某些地域再现了全球多样性, 在这些地域中, 大部分的已知 HIV-1 亚型或 进化枝共流行 ( 例如刚果民主共和国 (Mokili & Korber, J.Neurovirol 11(Suppl.1) : 66-75(2005), 其余地域主要为两种亚型和它们的重组体 ( 例如乌干达 (Barugahare et al, J.V。

9、irol.79 : 4132-4139(2005), 剩下的为单一亚型 ( 例如南非 (Williamson et al, AIDS Res.Hum.Retroviruses 19 : 133-144(2003)。即使是单一亚型流行病占主导地 位的地区, 也必须注意大范围的进化枝内多样性 (Williamson et al, AIDS Res.Hum. Retroviruses 19 : 133-44(2003), 但是, 由于可期待国际旅行能进一步使地理性差异模糊 化, 所有的国家都可受益于一种全球性疫苗。 0005 于此提出了多价疫苗抗原集合的设计, 其注重于 T 淋巴细胞应答, 并且为通。

10、常的 B 亚型和 C 亚型而优化, 或是为在全球流行的所有 HIV-1 变体 HIV-1 主 (M) 组 而优化。细 说 明 书 CN 102177175 A CN 102177179 A2/27 页 4 胞毒T淋巴细胞(CTL)直接杀死受感染的产生病毒的宿主细胞, 其利用人白细胞抗原(HLA) 分子通过存在于受感染细胞表面的病毒蛋白片段 ( 抗原表位 ) 来识别它们。辅助性 T 细 胞的应答通过细胞因子的释放来控制免疫应答的各个方面。二者对于 HIV-1 疫苗来说可 能都是至关重要的 : 早已指出 CTL 应答与减缓疾病进展有关 (Oxenius et al, J.Infect. Dis.1。

11、89 : 1199-208(2004) ; 非人灵长类动物中由疫苗引发的细胞免疫应答有助于控制病 原性 SIV 或 SHIV, 降低免疫激发 (challenge) 后生病的可能性 (Barouch et al, Science 290 : 486-92(2000) ; 并且 CD8+T 细胞的实验性耗尽导致感染 SIV 的恒河猴体内病毒血症 的增长 (Schmitz et al, Science 283 : 857-60(1999)。此外, CTL 逃逸突变与疾病进展有 关(Barouch et al, J.Virol.77 : 7367-75(2003), 所以阻塞潜在逃逸路径的由疫苗刺激。

12、的 记忆应答可能是有价值的。 0006 高可变性包膜蛋白是用于针对 HIV 来中和抗体的首要目标 ; 由于免疫防护有可能 同时要求 B 细胞和 T 细胞应答 (Moore and Burton, Nat.Med.10 : 769-71(2004), 同样需 要对包膜疫苗抗原进行单独优化以引起抗体应答。相比之下, 由 T 细胞引导的疫苗成分可 定位于更加保守的蛋白质, 但即使是最保守的 HIV-1 蛋白也是非常多样化的, 这样变异就 成为了一个问题。人工中央序列疫苗法 ( 例如共有序列其中每种氨基酸可见于多条序 列, 或者是祖先序列的最大可能重构物(Gaschen et al, Science 。

13、296 : 2354-60(2002), Gao et al, J.Virol.79 : 1 154-63(2005), Doria-Rose et al, J.Virol.79 : 1 1214-24(2005), Weaver et al, J.Virol., 印刷中 ) 是有前景的 ; 尽管如此, 即使是中央化的病毒株也只 能提供 HIV-1 变体的有限覆盖, 而基于共有序列的试剂无法检测出多种自体 T 细胞应答 (Altfeld et al, J.Virol.77 : 7330-40(2003)。 0007 单个氨基酸的改变会让表位从 T 细胞的监视下逃逸 ; 由于在各种 HIV-1 。

14、病毒 株之间很多 T 细胞表位在一个或多个位置处不同, 对任意单种疫苗抗原的潜在应答是 有限的。某一特定突变是否导致逃逸取决于特定表位 /T 细胞的组合, 尽管某些改变会 宽泛地影响亚型之间的交互反应性 (Norris et al, AIDS Res.Hum.Retroviruses 20 : 315-25(2004)。在多价疫苗中包括多个变体能对更广范围的流行变体进行应答, 还能使 免疫系统针对通常的逃逸突变做好准备 (Jones et al, J.Exp.Med.200 : 1243-56(2004)。 从一个 T 细胞受体中逃逸会创建出易受他者影响的一个变体 (Allen et al, 。

15、J.Virol.79 : 12952-60(2005), Feeney et al, J.Immunol.174 : 7524-30(2005), 所以激发针对表位变体 的多克隆应答可能是有益的(Killian et al, Aids 19 : 887-96(2005)。 抑制操作(Milicic et al, J.Immunol.175 : 4618-26(2005) 或 HLA 结合 (Ammaranond et al, AIDS Res.Hum. Retroviruses 21 : 395-7(2005) 的逃逸突变无法由具有不同特异性的 T 细胞来直接对抗, 但是针对重叠区表位的应答可。

16、至少阻塞这些逃逸途径的其中一些。 0008 本发明涉及一种多价疫苗, 其包含几个 “镶嵌” 蛋白 ( 或编码这些蛋白的基因 )。 候选疫苗抗原可以是 k 种复合蛋白的混合物 (k 为混合物中序列变体的数目 ), 其经优化以 在一组输入的病毒蛋白中包括最大数目的潜在 T 细胞表位。镶嵌体由天然序列产生 : 它们 类似于天然蛋白, 并包括潜在表位的最常见形态。由于 CD8+ 表位是毗连的, 并且通常为 9 个氨基酸那么长, 所以镶嵌体组可由天然序列中九聚物 ( 九聚体 ) 的 “覆盖率” 来打分 ( 相 似长度的片段都能良好地得到表示 )。至少三次未被发现的九聚体可被排除。这种策略使 得多样性覆盖。

17、率的水平由非常多价的多联肽疫苗实现, 但其具有重要的优势 : 其使得疫苗 说 明 书 CN 102177175 A CN 102177179 A3/27 页 5 能像完整的蛋白质或基因那样递送, 排除了与流行病毒株无关的低频率或非天然的表位, 并且其完整的蛋白抗原更加可能像是在自然感染中那样进行处理。 发明内容 0009 总体而言, 本发明涉及一种免疫原性组合物。 更具体而言, 本发明涉及一种多价免 疫原性组合物(例如HIV疫苗), 并且涉及使用它的方法。 本发明还涉及使用遗传算法以设 计适于作为疫苗使用的多价抗原组的方法。 0010 本发明的目的和优点通过后述的描述将会更加清晰。 附图说明 。

18、0011 图 1A 图 1F : HIV-1M 组的潜在表位覆盖率的上限。示出了针对增加变体数目的 九聚体的群体覆盖率的上限, k 1 8 个变体。长度为 9 的移动窗口放在比对序列上, 逐 次下移一个位置。不同颜色表示不同数目序列的结果。在每个窗口中, 针对 Gag( 图 1A 和 图 1B)、 Nef( 图 1C 和图 1D) 和 Env gp120( 图 1E 和图 1F), 以 k 个最常见的 9 聚物给出的覆 盖率制图。为维持比对而插入的间隙被视作字符。加入更多变体时, 返回结果会明显减少, 这是因为当 k 增大时, 愈加稀有的形式也会增加。在图 1A、 图 1C 和图 1E 中, 。

19、每条连续九聚 体的得分都按照它们的天然顺序作图, 以示出多样性在不同蛋白区域中是如何变化的 ; Gag 中心的 p24 和 Nef 的中心区域的保守程度都特别高。在图 1B、 图 1D 和图 1F 中, 每条九聚体 的得分都按覆盖率重新排列(图4中同样使用的一种策略), 以提供对给定蛋白的整个群体 覆盖率的判断。gp120 的覆盖率即使采用 8 种变异九聚体也是特别差的 ( 图 1E 和图 1F)。 0012 图2A图2C : 镶嵌体的初始化、 打分和优化。 图2A) : 通过天然序列的随机两点重 组产生一组 k 个群体 (1 6 个具有 50 500 条序列的群体, 每个群体均经过测试 )。。

20、从 每一群体中选择一条序列 ( 最初是随机的 ) 用于该镶嵌体混合物, 其随后被优化。通过计 算覆盖率 ( 定义为包括在该混合物中的天然序列九聚体的平均分数, 有输入数据组中的所 有天然序列平均而得到 ) 来对该混合物序列打分。覆盖更多表位的任何新序列都会提高整 个混合物的得分。图 2B) : 任何个体序列的适合度得分为含有该序列以及来自其他群体的 当前代表的混合物的覆盖率。图 2C) : 优化 : 1) 选择两个 “亲代” : 随机选择的一对重组序列 的较高得分者, 以及要么是 (50可能性 ) 随机的第二对中的较高得分序列, 要么是随机选 择的天然序列。2) 使用两个亲代之间的两点重组以产。

21、生 “子代” 序列。如果该子代包含非 天然的或稀有的九聚体, 则立即将其剔除, 相反则对其打分 (Gaschen et al, Science 296 : 2354-2360(2002)。如果该得分高于四个随机选择的群体成员中任一者的得分, 则将该子 代插入到该群体中, 以取代这四个中的最弱者, 由此进化出改良的群体 ; 4) 如果其得分为 最高得分, 则用该新的子代取代群体中的当前混合物成员。依次对于每一群体重复进行十 次循环的子代生成, 重复进行该过程直至改进停止。 0013 图 3 : 所有 HIV 蛋白的镶嵌株覆盖率。示出了由每种 HIV 蛋白的四个镶嵌蛋白组 获得的九聚体覆盖率的水平。

22、, 其中使用用 M 组或 C 亚型优化的镶嵌体。对 C 亚型进行优化 ( 进化枝内优化 ) 的镶嵌体所覆盖的 C 亚型序列九聚体的部分以灰色示出。由 C 亚型优化 的镶嵌体在非 C 亚型 M 组序列中得到的九聚体覆盖率 ( 进化枝间覆盖率 ) 以白色示出。由 M 组优化的镶嵌体得到的 C 亚型序列的覆盖率以黑色示出。B 进化枝的比较得到了类似结 说 明 书 CN 102177175 A CN 102177179 A4/27 页 6 果 ( 数据未示出 )。 0014 图 4A 图 4F : 不同候选疫苗的 M 组序列覆盖率, 每个九聚体逐个进行。每幅图 由单个三价候选疫苗得到的 M 组天然序列。

23、比对的逐个位点的覆盖率 ( 即, 对于每一个九聚 体 )。沿 x 轴的竖条代表对于给定比对位置, 与候选疫苗匹配的序列的比例 : 9/9 匹配 ( 红 色 ), 8/9 匹配 ( 黄色 ), 7/9 匹配 ( 蓝色 )。比对的九聚体沿 x 轴按完全匹配的覆盖率值分 类。656 个位置包括完整的 Gag 以及 Nef 的中心区域。对于每一个比对位置, 最大可能的匹 配值 ( 即, 在该九聚体中没有间隙的比对序列的比例 ) 以灰色示出。图 4A) : 从在疫苗研究 中使用的病毒株中选出的非最优天然序列(Kong et al, J.Virol.77 : 12764-72(2003), 包 括个体进化。

24、枝A、 B和C的病毒序列(Gag : GenBank编号AF004885、 K03455和U52953 ; Nef核 心序列 : AF069670、 K02083和U52953)。 图4B) : 通过选择具有最大覆盖率的单条序列而选定 的天然序列 分离序列 US2(B 亚型, USA), 70177(C 亚型, 印度 ) 和 99TH。R2399(CRF15_01B 亚型, 泰国 ) ; 编号 AY173953、 AF533131 和 _AF530576 的最优组, 随后是在与针对 M 组覆盖 率所选择的第一序列 ( 即, 最佳互补序列 ) 等结合时具有最佳覆盖率的序列。图 4C) : 共有 。

25、序列混合物(M组、 B亚型和C亚型)。 图4D) : 三条镶嵌序列, 图4E) : 四条镶嵌序列, 图4F) : 六条镶嵌序列。图 4D 图 4F 均针对 M 组覆盖率进行了优化。 0015 图 5A 和图 5B : 候选疫苗的总体覆盖率 : C 进化枝序列中的九聚体的覆盖率, 其使 用针对镶嵌体优化的不同输入数据组, 提供不同数目的抗原, 并与不同的候选疫苗进行比 较。对于如下四种测试情况 : 进化枝内 ( 对 C 进化枝覆盖率打分的 C 进化枝优化的候选序 列 )、 进化枝之间 ( 对 C 进化枝覆盖率打分的 B 进化枝优化的候选序列 )、 全球性抗单一亚 型(对C进化枝覆盖率打分的M组优。

26、化的候选序列)、 全球性抗全球性(对全球性覆盖率打 分的 M 组优化的候选序列 ), 针对 Gag( 图 5A) 和 Nef( 核心序列 )( 图 5B) 的单价和多价候 选疫苗计算完全匹配 ( 蓝色 )、 8/9 匹配 ( 一个不匹配, 红色 ) 和 7/9 匹配 ( 两个不匹配, 黄 色 ) 的覆盖率。在每组结果中, 候选疫苗按照混合物中的序列数目 (1 6) 进行分组 ; 镶嵌 序列用较深颜色绘制。 “非优化序列 (Non-opt)” 指的是一组进入疫苗实验的序列 (Kong et al, J.Virol.77 : 12764-72(2003) ;“镶嵌体 (mosaic)” 表示由遗传。

27、算法产生的序列 ;“优化 的天然序列 (opt.natural)” 表示根据最大九聚体覆盖率而选择的完整天然序列 ;“MBC 共 有序列 (MBC consensus)” 表示 M 组、 B 亚型和 C 亚型的三条共有序列的混合物。为便于比 较, 用虚线标出 M 组镶嵌体的四序列组的覆盖率 (73.7 75.6 )。测试了镶嵌体数目、 病 毒亚群、 蛋白区域以及优化和测试组的超过 150 种组合。在该图中描绘的 C 进化枝 /B 进化 枝 /M 组的比较通常是进化枝内、 进化枝之间以及 M 组覆盖率的代表。具体而言, B 进化枝 和 C 进化枝的镶嵌体覆盖率水平非常接近, 尽管在 Gag 集合。

28、中有更多的 C 进化枝序列, 而在 Nef 集合中有更多的 B 进化枝序列 ( 见图 6 的对 B 进化枝和 C 进化枝的完整比较 )。在比对 中A进化枝和G进化枝的序列相对较少(24Gag, 75Nef), 而M组优化的镶嵌体的九聚体覆盖 率不如 B 进化枝和 C 进化枝的亚型高 (A 亚型和 G 亚型的四镶嵌体覆盖率对于 Gag 为 63, 对于 Nef 为 74 ), 这比非优化的混合物要好得多 ( 对于 Gag 为 52, 对于 Nef 为 52 )。 0016 图 6A 和图 6B : 候选疫苗的总体覆盖率 : B 进化枝、 C 进化枝和 M 组序列中的九聚体 的覆盖率, 其使用针对。

29、镶嵌体优化的不同输入数据组, 提供不同数目的抗原, 并与不同的候 选疫苗进行比较。对于如下七种测试情况 : 进化枝内 (B 进化枝或 C 进化枝优化的候选序 列, 对同一进化枝打分 )、 进化枝之间 (B 进化枝或 C 进化枝优化的候选序列, 对另一进化枝 说 明 书 CN 102177175 A CN 102177179 A5/27 页 7 打分 )、 全球性疫苗抗单一亚型 ( 对 B 进化枝或 C 进化枝打分的 M 组优化的候选序列 )、 全 球性疫苗抗全球性病毒 ( 对所有 M 组序列打分的 M 组优化的候选序列 ), 针对 Gag( 图 6A) 和 Nef( 核心序列 )( 图 6B)。

30、 的单价和多价候选疫苗计算完全匹配 ( 蓝色 )、 8/9 匹配 ( 一个 不匹配, 红色 ) 和 7/9 匹配 ( 两个不匹配, 黄色 ) 的覆盖率。在每组结果中, 候选疫苗按照 混合物中的序列数目 (1 6) 进行分组 ; 镶嵌序列用较深颜色绘制。 “非优化序列” 指的是 先前提出用于疫苗的一组特定天然序列 (Kong, W.P.et al.J Virol 77, 12764-72(2003) ; “镶嵌体” 表示由遗传算法产生的序列 ;“优化的天然序列” 表示根据最大九聚体覆盖率而选 择的完整天然序列 ;“MBC 共有序列” 表示 M 组、 B 亚型和 C 亚型的三条共有序列的混合物。 。

31、对于针对 M 组优化的四价镶嵌体组的完全匹配 M 组覆盖率的水平标以虚线。 0017 图 7A 和图 7B : 在天然序列、 共有序列和镶嵌序列中九聚体的出现频率的分布。对 于由几种方法制备的疫苗混合物, 不同九聚体的频率为 x 轴, 发生次数为 y 轴。图 7A : 0 60的频率 ( 九聚体频率 60时, 所有方法的分布是相当的 )。图 7B : 低频率九聚体的 详细情况。天然序列具有大量的稀有或分离方式独特 (unique-to-isolate) 的九聚体 ( 图 7A 和图 7B 的下右部分 ) ; 它们不大可能引发有用的疫苗应答。选择最优的天然序列确实是 在选择那些更加常见的九聚体,。

32、 但仍然会包括稀有和独特的九聚体 ( 图 7A 和图 7B 的上右 部分 )。与之相比, 共有序列混合物不能代表并非常见的九聚体, 特别是频率低于 20 ( 图 7A 和图 7B 的下左部分 )。对于镶嵌序列来说, 较低频率的九聚体的数目随着序列的数目而 单调增加 ( 每幅图的上左部分 ), 但分离方式独特的九聚体完全排除在外 ( 右图的上左部 分 : * 标示出缺少频率 0.005 的九聚体 )。 0018 图 8A 图 8D : 候选疫苗的 HLA 结合潜能。图 8A 和图 8B) : HLA 结合基序计数。图 8C和图8D) : 不理想的氨基酸的数目。 在所有图中 : 天然序列标示为黑色。

33、圆形(), 共有序 列标示为蓝色三角形 ( ), 推断的祖先序列标示为绿色正方形 ( ), 而镶嵌序列标示为 红色菱形 ( )。左侧的图 ( 图 8A 和 8C) 显示了对于个体序列计算出的 HLA 结合基序计数 (图8A)以及不理想的氨基酸的计数(图8C) ; 右侧的图(图8B和8D)显示了对于序列混合 物计算出的 HLA 结合基序计数 ( 图 8B) 以及不理想的氨基酸的计数 ( 图 8D)。每一幅图的 顶部 ( 箱线图 ) 显示了基于 M 组序列的比对 ( 对于个体序列, 图 8A 和图 8C) 或基于 100 种 随机组成的三序列 (A 亚型、 B 亚型和 C 亚型各一 ) 的混合物 。

34、( 对于序列混合物, 图 8B 和图 8D) 的各自计数 ( 基序计数或不理想的氨基酸的计数 ) 的分布。该比对下载自 Los Alamos HIV 数据库。箱部从 25 百分点延伸至 75 百分点, 线段位于中值处。延伸到箱部之外的线部 显示了最高值和最低值。作为 C 端锚定残基而非常罕见的氨基酸为 G、 S、 T、 P、 N、 Q、 D、 E 和 H, 并且倾向于很小、 有极性或带负电荷 (Yusim et al, J.Virol.76 : 8757-8768(2002)。显 示了Gag的结果, 但同样的定性结果也适用于Nef核心序列和完整Nef。 对超型基序进行了 同样的过程, 其结果就。

35、定性而言与 HLA 结合基序 ( 数据未示出 ) 的结果类似。 0019 图 9 : 限制为 4 条序列 (k 4) 的镶嵌蛋白组, 跨过 Gag 以及 Nef 的中心区域, 针 对 B 亚型、 C 亚型和 M 组进行了优化。 0020 图 10 : Env 和 Pol 的镶嵌体组。 0021 图 11 : 该图不依赖于比对, 其基于将所有 M 组的蛋白 ( 数据库和 CHAVI, 每人一条 序列 ) 分解为所有可能的九聚体, 其关注它们的频率, 然后寻找每一疫苗抗原或混合物与 数据库的匹配和接近匹配的情况。 说 明 书 CN 102177175 A CN 102177179 A6/27 页 。

36、8 0022 图 12 : 另外的覆盖率概览。 0023 图 13 : 九聚体覆盖率相对于位置的图 (Mos.3 疫苗混合物 )。 0024 图 14A 图 14D : 与提议使用的每种疫苗匹配的九聚体频率的图。 0025 图 15A 图 15D : 标示出全部数据库比对中的每条序列中每一氨基酸的图。 0026 图 16 : 3 个镶嵌体, M 组优化。 0027 图 17 : HIV 数据库连同 CHAVI 序列 (N 2020) 的覆盖率。 0028 图 18 : 急性感染患者的序列与患者共有序列相比的差异。 0029 图 19 : 在 Env M 组覆盖率对亚型特异性设计方面的折中和益处。

37、。 0030 图 20 : 所提议的 Gag 和 Env 的疫苗镶嵌体的覆盖率。 0031 图 21 : Gag、 Nef 和 Env 序列。 0032 图 22 : 镶嵌体的 gag 和 nef 基因, 以及 M 共有序列的 gag 和 nef 基因。 具体实施方式 0033 本发明源自于以下认识, 即含有合成病毒蛋白的多价抗原组能构成良好的候选疫 苗, 所述合成病毒蛋白的序列提供了对流行病毒序列的非稀有短链的最大覆盖率。本发明 提供了 “遗传算法” 策略以建立作为天然蛋白序列的不确定组的片段的镶嵌体混合物的多 价抗原组, 所述天然蛋白序列作为输入序列而提供。对于 HIV 的情形, 蛋白 G。

38、ag 和 Nef 是这 种抗原的理想候选序列。为扩大覆盖率, 还可使用 Pol 和 / 或 Env。本发明还提供了这些蛋 白的优化组。 0034 本发明的遗传算法策略利用来自普通群体的未经比对的蛋白序列作为输入数据 组, 从而具有 “不依赖比对” 的优点。其建立了类似于自然界所发现的蛋白的人造镶嵌蛋 白, 在小型动物模型中共有抗原的成功证明了这是有效的。 九聚体是此处描述的研究重点, 但根据预期的目标, 也可选择不同长度的肽。 根据本发明的方法, 可以将在自然界中不存在 或者非常稀有的九聚体(举例)排除在外, 相对于共有序列和天然病毒株而言, 这是一种进 步, 因为共有序列可包含在自然界中未发。

39、现的某些九聚体 ( 举例 ), 而天然病毒株几乎总是 含有对于该病毒株而言是独一无二的某些九聚体 ( 举例 )。用于所述遗传算法的适合度的 定义为 : 最 “适合” 的多价混合物是镶嵌病毒株的组合, 该组合能提供群体中所有九聚体的 最大覆盖率 ( 完全匹配的最高分数 ), 并且还受九聚体在所述群体中不缺失或者不稀有的 限制。 0035 本发明的镶嵌蛋白组能根据不同的输入数据组进行优化, 使得可采用目前的数据 从 T 细胞的角度评估亚型或者区域特异性疫苗的优点。举例来说, 经过比较的可选方案包 括 : 0036 1) 基于 M 组、 B 进化枝和 C 进化枝的最优多价镶嵌体组。所存在的疑问是, 。

40、进化枝 内覆盖率与进化枝之间覆盖率或者全球性覆盖率相比能好多少。 0037 2) 不同数目的抗原 : 1、 3、 4、 6。 0038 3) 目前用于疫苗程序的天然病毒株仅例示了 “典型” 病毒株 (Merck, VRC)。 0039 4) 经选择能在群体中获得九聚体最佳覆盖率的天然病毒株。 0040 5) 共有序列组 : A+B+C。 0041 6) 经优化的混合物, 其包括多价抗原中的一个 “指定” 病毒株, 一个祖先序列 +3 个 说 明 书 CN 102177175 A CN 102177179 A7/27 页 9 镶嵌病毒株, 一条共有序列 +3 个镶嵌病毒株。 0042 7)完全匹。

41、配的九聚体覆盖率与匹配度为8/9、 7/9和6/9或更少的九聚体覆盖率比 较。 0043 这是一个计算难题, 因为覆盖一个九聚体的最佳组不一定是覆盖重叠型九聚体的 最佳组。 0044 通过阅读本公开内容应当理解, 描述于此的方法能用于设计肽试剂以测试 HIV 免 疫应答, 还可用于其他易变病原体。例如, 本方法可适用于高度可变的丙型肝炎。 0045 采用本领域公知的技术, 可将本发明的蛋白 / 多肽 / 肽 (“免疫原” ) 与药用载体 和/或佐剂配制成组合物。 适宜的施药途径包括全身(例如肌肉内或皮下)、 口服、 阴道内、 直肠内和鼻内施药。 0046 本发明的免疫原能采用本领域技术人员公知。

42、的方法进行化学合成并纯化。 该免疫 原也可通过公知的重组 DNA 技术合成。 0047 编码本发明免疫原的核酸可用作例如 DNA 疫苗的组分, 在该疫苗中该编码序列以 裸露 DNA 方式施用, 或者, 例如编码该免疫原的小基因可存在于病毒载体中。该编码序列例 如可在分枝杆菌、 重组的嵌合型腺病毒或重组的减毒型水泡性口炎病毒中表达。该编码序 列还可存在于例如复制型或者非复制型腺病毒载体、 腺相关病毒载体、 减毒型结核分枝杆 菌载体、 卡介苗(BCG)载体、 牛痘载体或修饰的安卡拉痘苗(MVA)载体、 其他痘病毒载体、 重 组脊髓灰质炎病毒载体和其他肠病毒载体、 沙门氏菌载体、 志贺氏菌载体、 委。

43、内瑞拉马脑炎 病毒 (VEE) 载体、 塞姆利基森林病毒载体或烟草花叶病毒载体。该编码序列也可作为具有 例如活性启动子如CMV启动子的DNA质粒来表达。 还可用其他活载体来表达本发明的序列。 通过将编码本发明免疫原的核酸导入患者自身细胞中, 可以在这些细胞中诱导该免疫原的 表达, 所述表达优选使用在人类细胞中优化表达的密码子和启动子。制造和使用 DNA 疫苗 的方法的例子公开于美国第 5,580,859 号、 第 5,589,466 号和第 5,703,055 号专利。密码 子优化的方法的例子描述于 Haas et al, Current Biology 6 : 315-324(1996) 和。

44、 Andre et al, J.Virol.72(2) : 1497-1503(1998)。 0048 应当理解, 在本发明的组合物中可包含佐剂 ( 或者另行施用以增强免疫原效果 )。 合适的佐剂的例子包括 TRL-9 激动剂、 TRL-4 激动剂、 以及 TRL-7、 8 和 9 激动剂的组合 ( 以 及明矾 )。佐剂可采用油和水乳液的形式。也可使用角鲨烯佐剂。 0049 本发明的组合物在药用输送体系中含有免疫有效量的本发明免疫原, 或编码该免 疫原的核酸序列。该组合物可用于预防和 / 或治疗病毒感染 ( 例如 HIV 感染 )。如上所述, 可使用佐剂、 乳化剂、 药用载体或其他在疫苗组合物。

45、中常提供的组分来配制本发明的组合 物。本领域技术人员可容易地设计最优化的制剂, 该制剂可包括用于立即释放的制剂和 / 或用于缓释的制剂, 以及用于诱导全身免疫和 / 或诱导局部粘膜免疫的制剂 ( 例如该制剂 可设计为鼻内、 阴道内或直肠内施用)。 如上所述, 本发明的组合物可通过任何便捷的途径, 包括皮下、 鼻内、 口服、 肌肉内或其他肠胃外或肠道途径施用。该免疫原可以单剂量或多剂 量施用。最优免疫方案可容易地由本领域技术人员确定并根据患者、 组合物以及所寻求的 效果不同而改变。 0050 本发明设想了直接使用本发明免疫原和/或编码它的核酸和/或如上所述进行表 达的免疫原。例如, 编码该免疫原。

46、的小基因可用于初免和 / 或加强免疫。 说 明 书 CN 102177175 A CN 102177179 A8/27 页 10 0051 本发明包括公开于此的任何和所有的氨基酸序列, 以及编码该氨基酸序列的核酸 序列 ( 以及与该编码序列互补的核酸 )。 0052 具体公开于此的是针对以区域性流行病为目标的单一 B 亚型或 C 亚型以及全球 流行的所有 HIV-1 变体 所述 HIV-1 主 (M) 组 进行优化的疫苗抗原组。在随后的实 施例 1 中描述的研究中, 重点在于设计特别针对 T 细胞应答的多价疫苗。对于 HIV-1 特 异性疫苗应答而言, HIV-1 特异性 T 细胞似乎至关重要。

47、 : CTL 应答与人类疾病进程的减缓 相关 (Oxenius et al, J.Infect.Dis.189 : 1199-1208(2004), 并且 CTL 应答在非人灵 长类动物疫苗接种模型中的重要性也已非常明确。疫苗引发的细胞免疫应答有助于控 制致病性 SIV 或 SHIV, 并降低用致病性病毒免疫激发后发病的可能性 (Barouch et al, Science 290 : 486-492(2000)。CD8+T 细胞的暂时缺失导致感染 SIV 的恒河猴体内病毒 血症的增加 (Schmitz et al, Science 283 : 857-860(1999)。此外, 逃逸突变的进。

48、化与 疾病进程相关, 表明 CTL 应答有助于抑制体内病毒的复制 (Barouch et al, J.Virol.77 : 7367-7375(2003), 因此能阻断潜在逃逸途径的由疫苗激发的记忆应答可能具有价值。虽 然高度可变的包膜 (Env) 是抗 HIV 中和抗体的首要标靶, 并且疫苗抗原也需要定制成引发 这些抗体应答 (Moore & Burton, Nat.Med.10 : 769-771(2004), 但是 T 细胞疫苗组分能靶 向更保守的蛋白以触发更容易交叉反应的应答。但是, 即使是最保守的 HIV-1 蛋白也具有 足够的多样性, 因此变异将是个问题。 人造中心序列疫苗法、 共。

49、有序列和祖先序列(Gaschen et al, Science 296 : 2354-2360(2002), Gao et al, J.Virol.79 : 1154-1163(2005), Doria-Rose et al, J.Virol.79 : 11214-11224(2005)它们基本上在病毒株之间 “折 中”显示出前景, 其刺激出与天然病毒株疫苗相比具有更强的交叉反应性的应答 (Gao et al, J.Virol.79 : 1154-1163(2005)(Liao et al.and Weaver et al., 已交稿 )。然而, 即使是中心病毒株也只能覆盖范围非常有限的 HIV 多样性谱, 而基于共有序列的肽试剂也 不能检测许多自体 CD8+T 细胞应答 (Altfeld et al, J.Virol.77 : 7330-7340(2003)。 0053 单一氨基酸取代能介导 T 细胞逃逸, 并且由于 HIV-1 病毒株之间许多 T 细胞表位 有一个或多个氨基酸差异, 因此对任何一种疫苗抗原的应答的潜在有效性是有限的。特定 的突变是否减小 T 细胞交叉反应性是表位特异性的并且是 T 细胞特异性的, 尽管某些变化 能广泛地影响进化。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 >


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1