应用腺病毒载体诱导免疫应答的方法.pdf

上传人:刘** 文档编号:8580077 上传时间:2020-09-04 格式:PDF 页数:100 大小:1,005.92KB
返回 下载 相关 举报
摘要
申请专利号:

CN200580019211.9

申请日:

20050412

公开号:

CN1972958B

公开日:

20130123

当前法律状态:

有效性:

失效

法律详情:

IPC分类号:

C07K14/16,C12N15/861,A61K39/21

主分类号:

C07K14/16,C12N15/861,A61K39/21

申请人:

美国政府卫生与公共服务部,杰韦克公司

发明人:

G·J·内伯尔,成程,江咏培,J·G·D·贾森,C·R·金

地址:

美国马里兰

优先权:

60/561,341

专利代理机构:

中科专利商标代理有限责任公司

代理人:

王旭

PDF下载: PDF下载
内容摘要

本发明提供在哺乳动物中诱导针对人免疫缺陷病毒(HIV)的免疫应答的方法。本方法包括给哺乳动物施用腺病毒载体组合物,所述腺病毒载体组合物包括编码两种或多种不同HIV抗原的一种或多种腺病毒载体,所述抗原的产生在所述哺乳动物中诱导针对HIV的免疫应答。本发明还提供包括4种腺病毒载体的腺病毒载体组合物,所述4种腺病毒载体分别编码HIV分化体A?Env蛋白,HIV分化体B?Env蛋白,HIV分化体C?Env蛋白,和包括HIV分化体B?Gag蛋白和Pol蛋白的融合蛋白。

权利要求书

1.腺病毒载体组合物用于制备在哺乳动物中诱导针对人免疫缺陷病毒(HIV)的免疫应答的药物的应用,其中所述腺病毒载体组合物包括(a)包括编码融合蛋白的核酸的复制缺陷型腺病毒载体,所述融合蛋白包括HIV分化体B Gag蛋白和Pol蛋白,(b)包括编码HIV分化体A Env蛋白的核酸的复制缺陷型腺病毒载体,(c)包括编码HIV分化体B Env蛋白的核酸的复制缺陷型腺病毒载体,和(d)包括编码HIV分化体C Env蛋白的核酸的复制缺陷型腺病毒载体,其中所述(a),(b),(c),和(d)的腺病毒载体独立地是血清型26,血清型28,或血清型35,由此在所述哺乳动物中产生所述HIV蛋白并且诱导针对HIV的免疫应答。 2.权利要求1的应用,其还包括给所述哺乳动物施用引发组合物,其包括一种或多种核酸序列,所述核酸序列编码与由所述腺病毒载体组合物中的腺病毒载体所编码的HIV蛋白相同的至少一种HIV蛋白,其中所述引发组合物的施用在所述腺病毒载体组合物施用前至少1周施行。 3.权利要求2的应用,其中所述引发组合物包括一种或多种核酸序列,其编码两种或多种HIV蛋白,所述HIV蛋白与由所述腺病毒载体组合物的一种或多种腺病毒载体所编码的HIV蛋白相同。 4.权利要求2的应用,其中所述引发组合物的施用在所述腺病毒载体组合物施用前6个月到9个月施行。 5.权利要求2的应用,其中所述引发组合物包括一种或多种质粒,裸DNA分子,或包括所述一种或多种核酸序列的病毒载体。 6.权利要求5的应用,其中所述腺病毒载体缺失所述腺病毒基因组E1区域的一种或多种必需的基因功能。 7.权利要求5的应用,其中所述腺病毒载体缺失所述腺病毒基因组E4区域的一种或多种必需的基因功能。 8.权利要求1的应用,其中所述腺病毒载体缺失所述腺病毒基因组E3区域的一种或多种基因功能。 9.权利要求1的应用,其中至少一种Env蛋白为gp140或gp140dv12蛋白。 10.权利要求1的应用,其中所述腺病毒载体组合物作为包括药用载体的药物组合物的部分施用。 11.权利要求10的应用,其中所述药物组合物以两剂或更多剂量施用。 12.权利要求10的应用,其中所述药物组合物以包括1×10-1×10个颗粒单位的腺病毒载体的剂量施用。 13.权利要求12的应用,其中所述药物组合物以包括1×10-1×10颗粒单位的腺病毒载体的剂量施用。 14.权利要求12的应用,其中所述药物组合物以包括1×10-1×10颗粒单位的腺病毒载体的剂量施用。 15.权利要求12的应用,其中所述药物组合物以包括1×10-1×10颗粒单位的腺病毒载体的剂量施用。 16.权利要求1的应用,其中包括HIV分化体B Gag蛋白和Pol蛋白的所述融合蛋白由核酸序列编码,所述核酸序列还编码HIV蛋白酶、反转录酶、和整合酶蛋白,并且其中所述核酸分子包括一种或多种点突变,其中的点突变使得蛋白酶,反转录酶和整合酶蛋白没有功能。 17.一种用于在哺乳动物中诱导针对人免疫缺陷病毒(HIV)的免疫应答的腺病毒载体组合物,其包括(a)包括编码融合蛋白的核酸的复制缺陷型腺病毒载体,所述融合蛋白包括HIV分化体B Gag蛋白和Pol蛋白,(b)包括编码HIV分化体AEnv蛋白的核酸的复制缺陷型腺病毒载体,(c)包括编码HIV分化体B Env蛋白的核酸的复制缺陷型腺病毒载体,和(d)包括编码HIV分化体C Env蛋白的核酸的复制缺陷型腺病毒载体,其中所述(a),(b),(c)和(d)的腺病毒载体独立地是血清型26,血清型28或血清型35。 18.权利要求17的腺病毒载体组合物,其中包括HIV分化体B Gag蛋白和Pol蛋白的所述融合蛋白由核酸序列编码,所述核酸序列还编码HIV蛋白酶、反转录酶、和整合酶蛋白,并且其中所述核酸分子包括一种或多种点突变,其中的点突变使得蛋白酶,反转录酶和整合酶蛋白没有功能。 19.权利要求17的腺病毒载体组合物,其中所述Env蛋白为gp 140或gp 140dv12。 20.权利要求17的腺病毒载体组合物,其中所述腺病毒载体是复制缺陷型。 21.权利要求20的腺病毒载体组合物,其中所述腺病毒载体缺失所述腺病毒基因组E1区域的一种或多种必需的基因功能。 22.权利要求20的腺病毒载体组合物,其中所述腺病毒载体缺失所述腺病毒基因组E4区域的一种或多种必需的基因功能。 23.权利要求17的腺病毒载体组合物,其中所述腺病毒载体缺失所述腺病毒基因组E3区域的一种或多种的基因功能。 24.权利要求17的腺病毒载体组合物,其中(a),(b),(c),和(d)的腺病毒载体以3∶1∶1∶1重量比例存在于所述组合物中。 25.一种用于在哺乳动物中诱导针对人免疫缺陷病毒(HIV)的免疫应答的药物组合物,其包括权利要求17的腺病毒载体组合物和药用载体。 26.权利要求25的药物组合物,其包括1×10-1×10个颗粒单位的腺病毒载体。 27.权利要求26的药物组合物,其包括1×10-1×10颗粒单位的腺病毒载体。 28.权利要求26的药物组合物,其包括1×10-1×10颗粒单位的腺病毒载体。 29.权利要求26的药物组合物,其包括1×10-1×10颗粒单位的腺病毒载体。

说明书

相关申请的交叉参考

本专利申请要求2004年4月12日提交的美国临时专利申请号 60/561,341的利益。

关于联邦政府资助的研究和研发的陈述

在由Gen Vec,Inc.和代表敏感和传染病国家机构(National Institute of Allergy and Infectious Diseases)的美国公共卫生局之间签署的合作研究和 研发协议(Coorperative Reasearch and Development Agreement,CRADA)号 AI-1034及其修改下,本发明部分由政府支持完成。在本发明中政府可以 拥有某些权利。

发明背景

疾病控制和预防中心(CDC)估计,在美国,850,000-950,000人正承受 着HIV感染,并且大约25%的人没有觉察到他们的感染(CDC,Morb. Mortal.Wkly.Rep.,52(47),1145-8(2003))。在全世界,HIV新感染率以难 以接受的高水平持续增长。尽管由于高度活性的抗反转录病毒治疗 (HAART)的出现,在发达国家,新的AIDS诊断和死亡已经显著下降,但 是在发展中国家,HIV/AIDS流行性继续加剧。所述流行病的全球性影响 是相当大的。按照关于HIV/AIDS的联合国计划(Joint United Nations Programme on HIV/AIDS)和世界卫生组织,到2002年底时,估计有 4000-4200万人正承受HIV/AIDS,其中全世界总人数的95%居住在发展 中国家(WHO,Treating 3 Million by 2005:The WHO Strategy,Geneva, Switzerland.第1-53页(2003),和UNAIDS,AIDS Epidemic Update December 2003)。2003年,全世界估计有250-350万例由HIV/AIDS导致 的死亡(UNAIDS,AIDS Epidemic Update December 2003),并且自从这种流 行病的开始,已经有多达3000万例由HIV感染导致的死亡(WHO,Treating 3 Million by 2005:The WHO Strategy,Geneva,Switzerland.第1-53页 (2003))。除了HIV/AIDS的人类灾难,所述流行病的代价对许多国家的经 济增长和政治稳定造成显著的阻碍。在发展中国家以及在美国人口的部分 地区中,抗HIV治疗经常超出财政范围。因此,迫切地需要用于HIV预 防的有效的、低成本的工具,诸如疫苗,以使得HIV流行病得到控制。

几十年来,以生物相应量运送蛋白作为疗法或者用于诱导免疫应答已 成为药物和疫苗开发的障碍。已经证明为传统抗原运送途径的成功备选的 一种解决方案是运送外源核酸序列用于在体内产生抗原分子。理想地,基 因转移载体进入广泛种类的细胞类型,具有接纳巨大的核酸序列的能力, 是安全的,并且可以以治疗患者需要的量生产。病毒载体具有这些有利特 征,并且被用于治疗或预防生物疾病的许多方法中。

除了它们的有利特征,病毒基因转移载体的广泛应用受到一些因素的 阻碍。在这方面,某些细胞不易接受通过目前可用的病毒载体运送基因。 例如,摄入腺病毒时,淋巴细胞被损害(Silver等.,Virology 165,377-387 (1988);Horvath等.,J.Virology,62(1),341-345(1988))。

病毒基因转移载体的应用还受到病毒载体免疫原性的阻碍。大多数的 美国人口已经暴露于目前处于作为基因转移载体的研发中的许多病毒(例 如,腺病毒)的野生形式。因此,许多美国人口已发展了针对某些基于病 毒的基因转移载体的现有的免疫性。这样的载体被迅速地从血流中清除, 因此降低了所述载体在运送生物相应量的基因产物中的功效。并且,某些 病毒载体的免疫原性防止有效的重复给药,其可以有利“增强”针对病 原体的免疫系统,并且导致只有少部分剂量的病毒载体将其有效负荷运送 到宿主细胞。

另外,设计作为HIV疫苗的病毒载体中的主要挑战是识别和靶向病 毒结构,所述病毒结构是多样性的最广泛的可能范围内的保护性体液和细 胞免疫应答的关键决定簇。多价疫苗的应用,其包含来自许多流行HIV 亚型的免疫原的明确的混合物,可能是获得广泛保护性HIV疫苗的可行 途径。

因此,存在对于改进的方法和用于诱导针对HIV的免疫应答的组合 物的需要。本发明提供这样的方法和组合物。本发明的这些和其它优点, 以及附加的发明特征,将通过本文提供的发明详述而显而易见。

发明简述

本发明提供在哺乳动物中诱导针对人类免疫缺陷病毒(HIV)的免疫应 答的方法。所述方法包括给所述哺乳动物施用腺病毒载体组合物,其中所 述腺病毒载体组合物包括编码两种或多种不同的HIV抗原的一种或多种 腺病毒载体,因此在哺乳动物中产生所述HIV抗原,并且诱导针对HIV 的免疫应答。

本发明还提供腺病毒载体组合物,其包括(a)包括编码HIV分化体A Env蛋白的核酸的腺病毒载体,(b)包括编码HIV分化体B Env蛋白的核 酸的腺病毒载体,(c)包括编码HIV分化体C Env蛋白的核酸的腺病毒载 体,和(d)包括编码融合蛋白的核酸的腺病毒载体,所述融合蛋白包括HIV 分化体B Gag蛋白和Pol蛋白。

发明详述

本发明提供在哺乳动物中诱导针对人类免疫缺陷病毒(HIV)的免疫应 答的方法。所述方法包括给所述哺乳动物施用腺病毒载体组合物,其中所 述腺病毒载体组合物包括编码两种或多种不同的HIV抗原的一种或多种 腺病毒载体。

本发明还提供腺病毒载体组合物。所述腺病毒载体组合物包括(a)包 括编码HIV分化体A Env蛋白的核酸的腺病毒载体,(b)包括编码HIV 分化体B Env蛋白的核酸的腺病毒载体,(c)包括编码HIV分化体C Env 蛋白的核酸的腺病毒载体,和(d)包括编码融合蛋白的核酸的腺病毒载 体,所述融合蛋白包括HIV分化体B Gag蛋白和Pol蛋白。

“抗原”是在哺乳动物中引发免疫应答的分子。“免疫应答”可以承 担(entail),例如,抗体产生和/或免疫效应细胞的激活。在本发明上下文 中,HIV抗原可以包括在哺乳动物中激发免疫应答的任何蛋白质HIV分 子或者其部分。“HIV分子”是这样一种分子,即,其为人类免疫缺陷病 毒的一部分,由人类免疫缺陷病毒的核酸序列编码,或者衍生于或合成地 基于任何这样的分子。按照本发明激发免疫应答的HIV抗原的施用优选 地导致针对HIV的保护性免疫。在这方面,针对HIV的“免疫应答”是 针对任何一种或多种HIV抗原的免疫应答。

适合的HIV抗原的实例包括全部或部分的HIV Gag,Env,Pol,Tat,反 转录酶(RT),Vif,Vpr,Vpu,Vpo,整合酶,或Nef蛋白。优选地,所述两种 或多种HIV抗原的每一种包括全部或部分的HIV Gag,Env,和/或Pol蛋 白。适合的Env蛋白在本领域内已知,并且包括,例如,gp160,gp120,gp41, gp145和gp140。另外,HIV抗原可以为在体内展现出增强的免疫原性的 修饰的Env蛋白。例如,所述抗原可以为在Env蛋白的切割位点、融合 肽、或者螺旋间卷曲的卷曲结构域包括突变的Env蛋白(△CFI Env蛋白) (参见,例如,Cao等.,J.Virol.,71,9808-9812(1997),和Yang等.,J.Virol., 78,4029-4036(2004))。

HIV的任何分化体适用于抗原选择,其包括HIV分化体A,B,C,D,E, MN等。因此,应该理解下述HIV抗原可以用于本发明的方法:HIV分 化体A gp140,Gag,Env,和/或Pol;HIV分化体B gp140,Gag,Env,和/或 Pol蛋白;HIV分化体C gp140,Gag,Env,和/或Pol蛋白;以及HIV分化 体MNgp140,Gag,Env,和/或Pol蛋白。尽管优选地所述抗原为Gag,Env, 和/或Pol蛋白,能够在哺乳动物中诱导免疫应答的任何HIV蛋白或者其 片段可以与本发明的方法联合应用。来自不同HIV分化体(例如,HIV分 化体A,B,C,MN,等)的HIV Gag,Env和Pol蛋白,以及编码这些蛋白的核 酸序列,和用于将所述核酸序列操作和插入载体的方法,是已知的(参见, 例如,HIV Sequence Compendium,Division of AIDS,National Institute of Allergy and Infectious Diseases(2003),HIV Sequence Database (http://hiv-web.lanl.gov/content/hiv-db/mainpage.html),Sambrook等., Molecular Cloning,a Laboratory Manual,第二版,Cold Spring Harbor Press, Cold Spring Harbor,N.Y.(1989),和Ausubel等.,Current Protocols in Molecular Biology,Greene Publishing Associates and John Wiley & Sons, New York,N.Y.(1994))。

应该理解产生免疫应答不需要全部的、完好无缺的HIV蛋白。事实 上,HIV蛋白的大部分抗原表位大小相对较小。因此,HIV蛋白,诸如本 文所描述的任何HIV蛋白的片段(例如,表位或其它抗原片段),可以被用 作HIV抗原。HIV Gag,Env,和Pol蛋白的抗原片段和表位,以及编码这 些抗原片段和表位的核酸序列是已知的(参见,例如,HIV Immunology and HIV/SIV Vaccine Databases,卷1,Division of AIDS,National Institute of Allergy and Infectious Diseases(2003))。

HIV抗原还包括融合蛋白和多蛋白(ployproteins)。融合蛋白可以包 括融合到另外一种,或者融合到全部或部分的不同HIV蛋白或其它多肽 上的一种或多种抗原性HIV蛋白片段(例如,表位)。所述融合的蛋白可以 包括本文所描述的任何HIV抗原的全部或部分。例如,全部或部分的HIV Env蛋白(例如,gp120或gp160),可以融合到全部或部分的HIV Pol蛋白 上,或者全部或部分的HIV Gag蛋白可以融合到全部或部分的HIV Pol 蛋白上。这样的融合蛋白有效地提供本发明的上下文中的多种HIV抗原, 并且与由单一HIV抗原产生的免疫应答相比,所述融合蛋白可以用于产 生针对给出的HIV病原体的更加完整的免疫应答。相似地,多蛋白也可 以提供多种HIV抗原。与本发明联合应用的多蛋白包括提供两种或多种 HIV抗原,诸如本文所描述的两种或多种任何HIV抗原的那些蛋白。应 用单独的核酸序列,通过腺病毒载体将融合蛋白或多蛋白运送到哺乳动 物,允许将免疫系统暴露于多种抗原,并且因此,便利地允许单一组合物 提供针对多种HIV抗原或单一抗原的多种表位的免疫性。可以通过已知 的方法制备编码HIV抗原的融合蛋白和多蛋白的核酸序列,并将其插入 载体中(参见,例如,美国专利5,130,247和5,130,248,Sambrook等.,如上 文所述,和Ausubel等.,如上文所述)。

所述腺病毒载体组合物包括编码两种或多种不同HIV抗原的一种或 多种腺病毒载体。应该明白腺病毒载体通过已被插入所述腺病毒载体的核 酸序列的方式“编码”抗原。如果它们包括不同的抗原性氨基酸序列,那 么HIV抗原是“不同的”。所述两种或多种不同HIV抗原可以是任何HIV 抗原,诸如本文所描述的两种或多种HIV抗原。优选地,所述腺病毒载 体组合物包括一种或多种腺病毒载体,其编码三种或多种,或者甚至四种 或更多种不同的HIV抗原。应该理解将哺乳动物的免疫系统暴露于不同 的HIV抗原“混合物”,可以引起比将所述免疫系统仅暴露于单一的HIV 抗原更广泛的和更有效的免疫应答。

所述两种或多种不同的HIV抗原可以由来自不同的HIV蛋白(例如, HIV Gag,Env,Pol,等)或不同的HIV分化体(例如,HIV分化体A,B,C,D,E, MN,等)的两种或多种抗原提供。例如,HIV Gap蛋白和Pol蛋白为不同的 抗原。类似地,HIV分化体A Env蛋白和HIV分化体B Env蛋白为不同 的HIV抗原。优选地,所述两种或多种不同的HIV抗原包括来自两种或 多种不同的HIV分化体的HIV抗原。更优选地,所述腺病毒载体组合物 包括腺病毒载体,其编码来自三种或多种不同的HIV分化体的三种或多 种不同的HIV抗原,或者甚至是来自四种或多种不同的HIV分化体的四 种或多种不同的HIV抗原。备选地,所述两种或多种HIV抗原的至少一 种可以为嵌合抗原,其包括衍生于从两种或多种不同的HIV分化体获得 的相同抗原的氨基酸序列。例如,嵌合Env蛋白可以包括从分化体A HIV 获得的Env氨基酸序列的一部分,和从分化体B HIV获得的Env氨基酸 序列的一部分。

例如,所述腺病毒载体组合物可以由下述组合物提供,即,包括一种 或多种腺病毒载体(例如,单一的腺病毒载体)的组合物,其中每一种腺 病毒载体编码两种或多种不同的HIV抗原,或者包括两种或多种腺病毒 载体(例如,多腺病毒载体)的组合物,其中每一种腺病毒载体编码一种或 多种不同的HIV抗原,并且因此,共同编码两种或多种不同的HIV抗原。 当所述腺病毒载体组合物包括每一种编码两种或多种HIV抗原的一种或 多种腺病毒载体(例如,单一腺病毒载体)时,每一种腺病毒载体可以包 括(i)编码两种或多种不同HIV抗原(例如,多蛋白或融合蛋白)的核酸序 列,或者(ii)两种或多种核酸序列,其中每一种编码不同的HIV抗原。与 构型(i)一致,应用包括编码多于两种不同的HIV抗原(例如,三种或更 多种,四种或更多种,或者甚至是五种或更多种不同的HIV抗原)或者 编码同一抗原的多个拷贝的核酸序列的腺病毒在本发明的范围内,条件是 其编码至少两种或多种不同的HIV抗原。同样地,与构型(ii)一致,应用 包括每一种编码不同的HIV抗原或同一抗原的多个拷贝的一些核酸序列 (例如,三种或更多种,四种或更多种,或者甚至是五种或更多种不同的 核酸序列)的腺病毒载体在本发明的范围内,条件是所述腺病毒载体编码 至少两种不同的HIV抗原。不论通过构型(i)或(ii),所述腺病毒载体组合 物优选地包括编码三种或更多种,或者甚至是四种或更多种不同的HIV 抗原的一种或多种腺病毒载体(例如,其中所述的每一种载体包括编码三 种或更多种,或者四种或更多种不同的HIV抗原的核酸序列,或者其中 所述的每一种载体包括三种或更多种,或者四种或更多种核酸序列,并且 每种核酸序列编码不同的HIV抗原)。理想地,所述两种或更多种,三种 或更多种,或者四种或更多种不同的HIV抗原来自两种或更多种,三种 或更多种,或者四种或更多种不同的HIV分化体。

优选地,所述腺病毒载体组合物包括编码两种或多种不同的HIV抗 原的两种或多种腺病毒载体,并且每一种腺病毒载体包括编码所述两种或 多种不同的HIV抗原的至少一种的核酸序列。尽管所述腺病毒载体组合 物包括编码两种或多种不同HIV抗原的两种或多种腺病毒载体,对于所 应用的腺病毒载体的数目,或者由此编码的不同HIV抗原的数目,没有 上限。优选地,所述腺病毒载体组合物包括编码三种或多种不同HIV抗 原的三种或多种腺病毒载体,并且每一种腺病毒载体包括编码所述三种或 多种不同HIV抗原的至少一种的核酸序列。最优选地,所述腺病毒载体 组合物包括编码四种或多种不同HIV抗原的四种或多种腺病毒载体,并 且每一种腺病毒载体包括编码所述四种或多种不同HIV抗原的至少一种 的核酸序列。理想地,所述两种或更多种,三种或更多种,或者四种或更 多种不同HIV抗原是来自两种或更多种,三种或更多种,或者四种或更 多种不同的HIV分化体。

当然,可以应用上述腺病毒载体构型的组合,而并不背离本发明的精 神和范围。例如,按照本发明所应用的腺病毒载体组合物可以包括第一种 腺病毒载体,其编码单一的HIV抗原,和第二种腺病毒载体,其编码不 同于第一种腺病毒载体所编码的HIV抗原的两种或多种HIV抗原。其它 类似的本文所公开的腺病毒载体构型的组合和排列是显而易见的,并且可 以按照本发明应用。

当所述腺病毒载体组合物包括两种或多种腺病毒载体时,包含在所述 组合物中的两种或多种腺病毒载体中的每一种的相对量将取决于许多因 素,其包括与其它HIV抗原相比的具体的HIV抗原的免疫原性。所述腺 病毒载体组合物可以包括等量的所述两种或多种腺病毒载体的每一种。备 选地,所述腺病毒载体组合物可以包括不同量的所述两种或多种腺病毒载 体的每一种。

在本发明特别优选的实施方案中,所述腺病毒载体组合物包括4种腺 病毒载体,其中每一种分别包括编码分化体B Gag-Pol融合蛋白,分化体 A gp140,分化体B gp140和分化体C gp140的核酸序列。最优选地,所 述腺病毒载体组合物包括具有核酸序列SEQ ID NO:4,SEQ ID NO:5, SEQ ID NO:6和SEQ ID NO:7的4种腺病毒载体。SEQ ID NO:4是编码 分化体B Gag-Pol融合蛋白的E1/E4-缺失腺病毒载体的核酸序列。SEQ ID NO:5是编码分化体A gp140蛋白的E1/E4-缺失腺病毒载体的核酸序列。 SEQ ID NO:6是编码分化体B gp140蛋白的E1/E4-缺失腺病毒载体的核 酸序列。SEQ ID NO:7是分化体C gp140蛋白的核酸序列。理想地,所述 腺病毒载体组合物以3:1:1:1的重量比例包括下述腺病毒载体,分别为: 包括编码分化体B Gag-Pol融合蛋白的核酸序列的腺病毒载体,包括编码 分化体A gp140的核酸序列的腺病毒载体,包括编码分化体B gp140的核 酸序列的腺病毒载体,和包括编码分化体C gp140的核酸序列的腺病毒载 体。

典型地,所述腺病毒载体包括编码一种或多种HIV抗原的核酸作为 表达盒的一部分,即,拥有有助于核酸序列的亚克隆和回收(例如,一个 或多个限制性酶切位点)或核酸序列的表达(例如,多聚腺苷化作用或剪 接位点)功能的具体核苷酸序列。所述核酸优选地位于腺病毒基因组的 E1区(例如,完全或部分地置换E1区)或E4区。例如,E1区可以由包 括编码抗原的核酸的可用启动子表达盒置换。所述表达盒任选地可以以 3′-5′方向插入,例如,以所述表达盒的转录方向与周围临近的腺病毒基因 组的方向相反这样的方向导向。然而,对于所述表达盒,以与周围基因组 的转录方向相关的5′-3′方向插入也是适当的。除了包括编码抗原的核酸的 表达盒,所述腺病毒载体包括包含其它外源核酸的其它表达盒,所述表达 盒可以置换腺病毒基因组的任何删除的区域。将表达盒插入所述腺病毒基 因组(例如,插入基因组的E1区)可以通过已知方法实现,例如,通过 在腺病毒基因组的给出位置引入独特的限制性酶切位点。如上文所提出 的,优选地所述腺病毒载体的全部或部分E3区也被删除。

优选地,将所述编码抗原的核酸可操作地连接到(即,在其转录控制 下)一种或多种启动子和/或增强子元件上,例如,作为可用启动子表达 盒的一部分。在本领域,用于有效地将序列连接到一起的技术是公知的。 “启动子”是指导RNA聚合酶的结合并且由此启动RNA合成的DNA序 列。将核酸序列“可操作地连接”到启动子上,此时所述启动子能够指导 核酸序列的转录。对于可操作连接的核酸序列的启动子可以是天然的或非 天然的。

任何启动子(即,不管是从天然分离的还是通过重组DNA或合成技 术产生的)可以与本发明结合应用以提供核酸序列的转录。所述启动子优 选地能够在真核(理想地哺乳动物)细胞中指导转录。所述启动子的功能 可以被在载体上存在的一种或多种增强子和/或沉默基因而改变。“增强 子”为激活或抑制相邻基因的转录的DNA的顺式作用元件。抑制转录的 增强子也叫做“沉默基因”。增强子与用于只在启动子中发现的序列特异 性DNA结合蛋白的DNA结合位点不同(其也叫做“启动子元件”),原 因在于增强子可以以任何方向,并且在多达几千碱基对(kb)的距离,甚至 从转录区的下游位置起作用。

启动子区可以在长度和序列上不同,并且还可以包括用于序列特异性 DNA结合蛋白的一种或多种DNA结合位点和/或增强子或沉默基因。增 强子和/或沉默基因可以类似地存在于本质上在启动子外的核酸序列上。 理想地,细胞或病毒增强子,诸如巨细胞病毒(CMV)早期增强子,位于接 近启动子的地方,以增强启动子活性。另外,核酸序列上可以存在剪接受 体和供体位点,以增强转录。

在本发明的上下文中任何适当的启动子或增强子序列都可以应用。在 这方面,编码抗原的核酸序列可以可操作地连接到病毒启动子上。适当的 病毒启动子包括,例如,巨细胞病毒(CMV)启动子,诸如CMV早期启动 子(例如,在美国专利5,168,062和5,385,839中所描述),衍生于人类免疫 缺陷病毒(HIV)的启动子,诸如HIV长末端重复启动子,劳斯肉瘤病毒 (RSV)启动子,诸如RSV长末端重复,小鼠乳癌病毒(MMTV)启动子,HSV 启动子,诸如Lap2启动子或疱疹胸苷激酶启动子(Wagner等.,Proc.Natl. Acad.Sci.,78,144-145(1981)),衍生于SV40或埃巴病毒的启动子,腺伴随 病毒启动子,诸如p5启动子,等等。

备选地,本发明应用细胞启动子,即,促进细胞蛋白表达的启动子。 优选地用于本发明的细胞启动子将取决于产生抗原的理想的表达模式。一 方面,所述细胞启动子优选地为在多种细胞类型,诸如本文所述的免疫细 胞中作用的组成型启动子。适当的组成型启动子可以促进编码转录因子的 基因,持家基因,或者真核细胞常见的结构基因的表达。例如,Ying Yang 1(YY1)转录因子(也叫做NMP-1,NF-E1和UCRBP)是一种普遍存在的 核转录因子,其为核基质的固有组分(Guo等.,PNAS,92,10526-10530 (1995))。尽管认为本文所描述的启动子是组成型启动子,在本领域应该明 白组成型启动子可以被上调节。启动子分析表明,相对于从启动子的转录 起始位点,基础转录的关键元件位于YY1基因的-277到+475,并且包括 TATA和CCAAT盒。JEM-1(也叫做HGMW和BLZF-1)也是在正常和肿 瘤组织中鉴别出的普遍存在的核转录因子(Tong等.,Leukemia,12(11), 1733-1740(1998),和Tong等.,Genomics,69(3),380-390(2000))。JEM-1 参与细胞生长控制和成熟,并且可以通过视黄酸上调节。相对所述启动子 的转录起始位点,负责JEM-1启动子最大活性的序列位于JEM-1基因的 -432到+101。与YY1启动子不同,JEM-1启动子不包括TATA盒。遍在 蛋白启动子(ubiquitin promoter),特别地UbC,是在一些物种中有作用的 强组成型活性启动子。在Marinovic等.,J.Biol.Chem.,277 (19),16673-16681(2002)中进一步特征性描述UbC启动子。

许多上文所述的启动子为组成型启动子。除了为组成型启动子,所述 启动子可以为可调节启动子,即,应答适当的信号上调和/或下调的启动 子。可调节启动子或表达控制序列的应用特别适用于作为抗原蛋白的 DNA疫苗开发,所述抗原蛋白包括病毒和寄生虫抗原,通常对互补细胞 系是毒性的。在一个实施方案中,可操作地连接到编码抗原的核酸序列的 调节序列包括四环素表达系统组分,例如,tet操纵子位点。例如,将编 码抗原的核酸序列可操作地连接到启动子上,所述启动子可操作地连接一 种或多种tet操纵子位点。包括这样的表达盒的腺病毒载体可以在互补细 胞系中繁殖,诸如例如在美国专利5,994,106和国际专利申请公布WO 95/34671中描述的293-ORF6,其包括编码tet阻抑蛋白的核酸序列。通过 在所述互补细胞系中产生tet阻抑蛋白,抑制抗原产生,并且获得繁殖, 而没有任何抗原介导相关的毒性。适当的可调节启动子系统还包括,但不 限于,IL-8启动子;金属硫蛋白可诱导的启动子系统,细菌lacZYA表达 系统,和T7聚合酶系统。此外,可以应用在不同发育阶段选择性地激活 的启动子(例如,在胚胎和成人中,球蛋白基因从球蛋白相关的启动子差 异转录)。所述启动子序列可以含有应答外源试剂的调节的至少一种调节 序列。所述调节序列优选地应答外源试剂,诸如,但不限于,药物,激素, 放射,或其它基因产物。

启动子可以为组织特异性启动子,即,优先在给定的组织中激活并且 在所激活的组织中引起基因产物表达的启动子。基于目标组织或细胞型, 适用于本发明的组织特异性启动子可以由普通技术人员选择。用于本发明 方法的优选的组织特异性启动子是对免疫细胞特异的,诸如在Morita等., Gene Ther.,8,1729-37(2001)中所描述的树突状细胞特异性Dectin-2启动 子。

在另一个实施方案中,所述启动子可以为嵌合启动子。启动子是“嵌 合的”,原因在于其包括至少两种核酸序列片段,所述核酸序列片段获得 于,衍生于,或基于至少两种不同的来源(例如,生物体基因组的两个不 同区域,两种不同的生物体,或者与合成序列组合的生物体)。优选地, 所述两种不同的核酸序列片段表现出对于彼此少于约40%,更优选地少 于约25%,并且更加优选地少于约10%的核酸序列同一性(其可以通过 本文别处所描述的方法确定)。任何适当的嵌合启动子可以用于本发明的 方法。

通过将其活性的具体模式与抗原表达的理想模式和水平相匹配,可以 选择用于本发明的启动子。例如,在其中腺病毒载体包括编码不同抗原的 两种或多种核酸序列的实施方案中,每种核酸序列可以可操作地连接到展 示不同的表达模式的不同的启动子上。例如,选择第一种启动子来调控抗 原产生的初始峰值,由此引发针对所编码的抗原的免疫系统。选择第二种 启动子以促进相同的或不同的抗原的产生,以便在所述第一种启动子表达 达到峰值后几天第二种启动子的表达到达最高点,由此“增强”针对所述 抗原的免疫系统。备选地,可以构建组合多种启动子的理想特征(aspect) 的嵌合启动子。例如,CMV-RSV杂合启动子,其组合了CMV启动子的 初始活性急增(rush)和RSV启动子的活性高度维持水平,其特别优选 用于本发明方法的许多实施方案中。由于抗原可能对真核细胞有毒性,在 用于增殖所述腺病毒载体的互补细胞系中,修饰所述启动子可以有利地减 少活性。

为了最优化蛋白生产,优选地所述编码抗原的核酸序列还包括多聚腺 苷化位点,其紧接着所述编码抗原的核酸序列的编码序列。可以应用任何 适当的多聚腺苷化序列,包括合成的最优化的序列,以及BGH(牛生长 素)、多瘤病毒、TK(胸苷激酶)、EBV(埃巴病毒)、和乳头瘤病毒(包括 人乳头瘤病毒和BPV(牛乳头瘤病毒))的多聚腺苷化序列。优选的多聚腺 苷化序列为SV40(人肉瘤病毒-40)多聚腺苷化序列。并且,优选地,正 确地排列所有正确转录信号(和翻译信号,在适当的情形),以便所述核 酸序列在其被引入的细胞中正确地表达。如果有必要,所述核酸序列还可 以结合剪接位点(即,剪接受体和剪接供体位点),以促进mRNA产生。

如果编码抗原的核酸序列编码已加工或分泌的蛋白或肽,或者在细胞 内作用的蛋白,那么优选地所述编码抗原的核酸序列还包括用于加工、分 泌、细胞内定位等的适当的序列。可以将所述编码抗原的核酸序列可操作 地连接到信号序列上,所述信号序列将蛋白靶向用于分泌的细胞器。适当 的信号序列包括,但不限于,免疫球蛋白重链和细胞因子的前导序列,(参 见,例如,Ladunga,Current Opinions in Biotechnology,11,13-18(2000))。 从宿主细胞分泌蛋白可能需要其它蛋白修饰,其可以用常规实验室技术确 定。例如,在美国专利6,500,641中进一步描述制备编码抗原和信号序列 的表达构建体。分泌非分泌蛋白的方法,例如,在美国专利6,472,176和 国际专利申请公布WO 02/48377中进一步描述。

还可以修饰由所述腺病毒载体的核酸序列编码的抗原蛋白,以将所述 抗原附着或结合到宿主细胞表面。在这方面,所述抗原可以包括用于缀合 到细胞表面的膜锚着点,诸如gpi-锚着点。可以将跨膜结构域融合到所述 抗原上,以将抗原蛋白的末端结合到细胞膜上。用于在细胞表面陈列肽的 其它方法在本领域内已知,并且适当的用于本发明的上下文中。

按照本发明,所述腺病毒载体组合物施用给动物,优选地为哺乳动物 (例如,人),其中表达编码抗原的每种核酸序列,以诱导针对所述抗原 的免疫应答。免疫应答可以是体液免疫应答,细胞介导的免疫应答,或者, 理想地,体液和细胞介导的免疫的组合。理想地,用包括抗原的感染试剂 后发激活时所述免疫应答提供保护。然而,本发明的上下文中并不要求保 护性免疫。本发明的方法还可以用于抗体生产和收获。

为了增强针对HIV抗原产生的免疫应答,所述腺病毒载体组合物还 可以包括编码免疫刺激物,诸如细胞因子、趋化因子或蛋白伴侣的核酸序 列。细胞因子包括,例如,巨噬细胞集落刺激因子(例如,GM-CSF),干 扰素α(IFN-α),干扰素β(IFN-β)干扰素γ(IFN-γ),白介素(IL-1,IL-2,IL-4, IL-5,IL-6,IL-8,IL-10,IL-12,IL-13,IL-15,IL-16和IL-18),TNF家族蛋白, 细胞间黏附分子-1(ICAM-1),淋巴细胞功能相关抗原-3(LFA-3),B7-1, B7-2,FMS-相关的酪氨酸激酶3配体,(Flt3L),血管活性肠肽(VIP),和 CD40配体。趋化因子包括,例如,吸引B细胞的趋化因子-1(BCA-1), CXXXC趋化分子,促黑素瘤生长活性蛋白(MGSA),血过滤CC趋化因子 1(HCC-1),白介素8(IL8),促干扰素T细胞α化学引诱物 (Interferon-stimulated T-cell alpha chemoattractant,I-TAC),淋巴肌动蛋白, 单核细胞趋化性蛋白1(MCP-1),单核细胞趋化性蛋白3(MCP-3),单核 细胞趋化性蛋白4(MCP-4),巨噬细胞衍生的趋化因子(MDC),巨噬细胞 炎性蛋白(MIP),血小板因子4(PF4),RANTES,BRAK,eotaxin,exodus 1-3,等等。蛋白伴侣包括,例如,热激蛋白Hsp170,Hsc70和Hsp40。细 胞因子和趋化因子一般在本领域内描述,包括Invivogen目录(2002),San Diego,CA。

施用腺病毒载体组合物可以是在哺乳动物中诱导针对HIV的免疫应 答的多步方案中的一个组成。在这方面,本发明的方法还包括给哺乳动物 施用引发组合物(primer composition),所述引发组合物包括编码至少一 种HIV抗原的一种或多种核酸序列,所述HIV抗原与腺病毒载体组合物 的腺病毒载体编码的HIV抗原相同,其中所述引发组合物的施用在施用 腺病毒载体组合物前至少1周进行。因此,本发明的这一实施方案代表一 组致敏(prime)并且增强的免疫方案,其中免疫应答通过施用引发组合 物而“致敏”,并且通过施用所述腺病毒载体组合物而“增强”。所述引发 组合物的一种或多种核酸序列可以作为基因转移载体的一部分或者作为 裸DNA而施用。在所述引发组合物中,可以应用任何基因转移载体,包 括病毒和非病毒基因转移载体。适当的病毒基因转移载体的实例包括,但 不限于,反转录病毒载体,腺伴随病毒载体,牛痘病毒载体,疱疹病毒载 体,或腺病毒载体。适当的非病毒载体的实例包括,但不限于,质粒,脂 质体,和分子缀合物(例如,运铁蛋白)。理想地,所述基因转移载体为 质粒或腺病毒载体。备选地,免疫应答可以通过施用抗原本身例如,抗原 性蛋白,灭活的病原体,等等而致敏或增强。

尽管由所述引发组合物的一种或多种核酸序列编码的抗原优选地与 由所述腺病毒载体组合物的腺病毒载体编码的HIV抗原相同,但是,在 一些实施方案中,可以适当地应用包括编码与所述腺病毒载体组合物编码 的抗原不同的HIV抗原的一种或多种核酸序列的引发组合物。优选地, 所述引发组合物包括一种或多种核酸序列,其编码与由腺病毒载体组合物 的一种或多种腺病毒载体编码的HIV抗原相同的两种或多种HIV抗原。 更加优选地,所述引发组合物包括一种或多种核酸序列,其编码由所述腺 病毒载体组合物的一种或多种腺病毒载体所编码的所有HIV抗原。

将所述引发组合物施用给哺乳动物,以引发针对HIV的免疫应答。 多于一剂量的引发组合物可以以任何适当的时限提供(例如,在增强之前 至少大约1周,2周,4周,8周,12周,16周,或者更久)。优选地, 所述引发组合物在施用腺病毒载体组合物之前至少3个月(例如,3,6, 9,12,或更多个月)施用给哺乳动物。最优选地,所述引发组合物在施 用腺病毒载体组合物前至少大约6个月-大约9个月施用给哺乳动物。将 所述腺病毒载体组合物施用给哺乳动物,以增强针对HIV的免疫应答。 为了维持免疫性,多于一剂量的腺病毒载体组合物可以以任何适当的时限 提供。

所述腺病毒载体组合物和/或所述引发组合物理想地以药用(例如, 生理学可接受)组合物施用,所述药用组合物包括载体,优选地生理学上 (例如,制药学上)可接受的载体,和腺病毒载体组合物。任何适当的载 体可以用在本发明上下文内,并且在本领域内这样的载体是公知的。载体 的选择将部分取决于所述组合物施用的具体位点和用来施用所述组合物 的具体方法。理想地,在腺病毒载体的环境(context)中,所述药物组合 物优选地没有复制型腺病毒。所述药物组合物可以任选地为无菌的,或者 除了一种或多种腺病毒载体外为无菌的。

用于药物组合物的适当的制剂包括水性和非水性溶液,等渗无菌溶 液,其可以含有抗氧化剂、缓冲剂和抑菌剂,和水性和非水性无菌混悬液, 其可以包括混悬剂,增溶剂,增稠剂,稳定剂和防腐剂。所述制剂可以以 单位剂量或多剂量密封容器,诸如安瓿和小瓶的形式存在,并且可以以冷 冻干燥(冻干)条件保存,在使用前仅需要立即加入无菌液体载体,例如, 水。临时的溶液和混悬液可以从无菌粉剂、粒剂和片剂制备。优选地,所 述载体为缓冲盐溶液。更加优选地,配制用于本发明方法的所述药物组合 物,以保护所述腺病毒载体在施用前免受损坏。例如,可以配制所述药用 组合物,以减少腺病毒在用来制备、存储、或施用所述表达载体的装置, 诸如玻璃器皿、注射器或针头上的损失。可以配制所述药物组合物,以减 少腺病毒载体的光敏感性和/或温度敏感性。为了这一目的,所述药物组 合物优选地包括药用液体载体,诸如,例如,上文所描述的那些,和选自 由下列物质组成的组的稳定剂:聚山梨酸酯80,L-精氨酸,聚乙烯吡咯 烷酮,海藻糖,和它们的组合物。这样的组合物的应用将延长所述载体的 保存寿命,帮助施用,并且增加本发明方法的功效。例如,对于含有腺病 毒载体的组合物的制剂,在美国专利6,225,289,6,514,943,美国专利申 请公布号2003/0153065A1,和国际专利申请公布WO00/34444中进一步 描述。还可以配制药物组合物,以增强所述腺病毒载体的转导效率。另外, 本领域的一名普通技术人员应该理解,所述药物组合物可以包括其它治疗 性或生物活性药剂。例如,控制炎症的因子,诸如布洛芬或甾族化合物 (steroids),可以是所述药物组合物的部分,以减少与所述腺病毒载体的体 内施用相关的肿胀和炎症。如本文所讨论的,可以施用免疫系统刺激剂, 以增强针对抗原的任何免疫应答。可以存在抗生素,即,杀微生物剂和杀 真菌剂,以治疗现存的感染和/或减少将来感染,诸如与基因转移流程相 关的感染的风险。

可以应用任何施用途径来将所述药物组合物运送给哺乳动物。实际 上,尽管可以应用多于一种途径来施用所述药物组合物,一种独特的途径 可以比其它途径提供更直接的和更有效的反应。优选地,所述药物组合物 通过肌内注射施用。所述药用组合物还可以应用或灌输到体腔内,通过皮 肤吸收(例如,通过透皮贴片),吸入,摄取,局部应用到组织,或者通 过,例如,静脉内、腹膜、或动脉内施用进行肠胃外施用。

所述药物组合物可以在允许可控制的或者持续释放的装置之内或之 上进行施用,所述装置诸如海绵,生物相容的网筛,机械储存库,或机械 植入物。植入物(参见,例如,美国专利5,443,505),装置(参见,例如, 美国专利4,863,457),诸如可移植的装置,例如,包括聚合组合物的机械 储存库或植入物或装置,对于所述药物组合物的施用特别有效。所述药物 组合物还可以以持续释放的制剂形式施用(参见,例如,美国专利 5,378,475),所述制剂包括,例如,凝胶泡沫,透明质酸,明胶,硫酸软 骨素,聚磷酸酯,诸如双-2-羟乙基-对苯二酸酯(BHET),和/或聚乳酸-乙 二酸。

给哺乳动物施用的药物组合物的剂量将取决于许多因素,包括目标组 织的大小,任何副作用的程度,施用的具体途径等。所述剂量理想地包括 “有效量的”腺病毒载体组合物和/或引发组合物,即,一剂的腺病毒载 体组合物和/或引发组合物,其在哺乳动物中激发需要的免疫应答。所述 需要的免疫应答可以承受抗体产生,在后发刺激时的保护,免疫耐受性, 免疫细胞活化,等等。在其中所述腺病毒载体组合物包括两种或多种腺病 毒载体的实施方案中,应该理解,本发明方法的所述药物组合物包括一剂 的腺病毒载体,其为其中所包含的两种或多种腺病毒载体的每一种的组合 剂量。

理想地,所述腺病毒载体组合物包括单一剂量的腺病毒载体,其包括 至少大约1×105个颗粒(其还叫做颗粒单位)的腺病毒载体。所述剂量 优选地为至少大约1×106个颗粒(例如,大约1×106-1×1012个颗粒), 更加优选地至少大约1×107个颗粒,更加优选地至少大约1×108个颗粒 (例如,大约1×108-1×1011个颗粒或大约1×108-1×1012个颗粒),并且 最优选地至少大约1×109个颗粒(例如,大约1×109-1×1010个颗粒或大 约1×109-1×1012个颗粒),或者甚至至少大约1×1010个颗粒(例如,大 约1×1010-1×1012个颗粒)的腺病毒载体。备选地,所述剂量包括不多于 大约1×1014个颗粒,优选地不多于大约1×1013个颗粒,甚至更加优选地 不多于大约1×1012个颗粒,甚至更加优选地不多于大约1×1011个颗粒, 和最优选地不多于大约1×1010个颗粒(例如,不多于大约1×109个颗粒)。 换句话说,所述腺病毒载体组合物可以包括单一剂量的腺病毒载体,其包 括,例如,大约1×106个颗粒单位(pu),2×106pu,4×106pu,1×107pu, 2×107pu,4×107pu,1×108pu,2×108pu,4×108pu,1×109pu,2 ×109pu,4×109pu,1×1010pu,2×1010pu,4×1010pu,1×1011pu,2 ×1011pu,4×1011pu,1×1012pu,2×1012pu或4×1012pu的腺病毒载体。

所述引发组合物理想地包括至少大约1mg的核酸,典型地和优选地 为DNA。所述引发组合物优选地包括1mg或更多的核酸(例如,大约1 mg,2mg,3mg,4mg,5mg或更多)。在优选的实施方案中,所述引发组合 物包括约2mg-约5mg核酸(例如,约3mg或4mg),更加优选地约3mg- 约5mg核酸(例如,约3.5mg),并且最优选地约4mg-约5mg核酸(例 如,约4.5mg)。

已证明修饰的病毒是用于研究性和治疗性基因转移应用的便利的载 体系统,并且腺病毒载体系统存在对于这些应用的一些优点。在人类中, 腺病毒通常与良性病理相关,并且已经充分研究了36千对碱基(kb)的腺 病毒基因组。腺病毒载体可以以高滴度(例如,大约1013个颗粒形成单位 (pfu))产生,并且这样的载体可以将遗传物质转移到非复制,以及复制的 细胞中;例如,和反转录病毒形成对比,所述反转录病毒仅将遗传物质转 移到复制细胞中。可以处理所述腺病毒基因组,以携带大量的外源DNA (多达约8kb),并且腺病毒壳体能够加强甚至更长的序列的转移(Curiel 等.,Hum.Gene Ther.,3,147-154(1992))。并且,腺病毒通常不结合到宿主 细胞染色体上,而是维持为线性附加体,因此将重组腺病毒干扰正常细胞 功能的可能性最小化。除了作为用于将遗传物质转移到广泛种类的细胞类 型的优良运载工具,腺病毒载体代表对于基因转移的安全选择,这是对于 治疗应用的特别关注。

来自各种起源,亚型,或亚型混合物的腺病毒可以用作用于腺病毒载 体的病毒基因组的来源。尽管非人类腺病毒(例如,猿,禽类,犬类,绵 羊或牛腺病毒)可以用来产生腺病毒载体,但是优选将人类腺病毒用作用 于本发明方法的腺病毒载体的病毒基因组的来源。腺病毒可以是各种亚组 或血清型。例如,腺病毒可以是亚组A(例如,血清型12,18和31), 亚组B(例如,血清型3,7,11,14,16,21,34,35和50),亚组C(例如, 血清型1,2,5和6),亚组D(例如,血清型8,9,10,13,15,17,19,20,22-30, 32,33,36-39和42-48),亚组E(例如,血清型4),亚组F(例如,血清 型40和41),未分类的血清组(例如,血清型49和51),或任何其它腺 病毒血清型。腺病毒血清型1-51可以从美国典型培养物保藏中心 (American Type Culture Collection,ATCC,Manassas,VA)获得。优选地,在 本发明方法的内容中,所述腺病毒载体为人亚组C,特别是血清型2或者 甚至更加理想地是血清型5。然而,非组C腺病毒可以用来制备腺病毒基 因转移载体,以将基因产物运送到宿主细胞。用于构建非组C腺病毒基 因转移载体的优选腺病毒包括Ad12(组A),Ad7和Ad35(组B),Ad30和 Ad36(组D),Ad4(组E),和Ad41(组F)。非组C腺病毒载体,生产非组C 腺病毒载体的方法,和应用非组C腺病毒载体的方法,例如,在美国专 利5,801,030,5,837,511和5,849,561,以及国际专利申请WO97/12986和 WO98/53087中公开。

所述腺病毒载体可以包括亚型的混合物,并且因而成为“嵌合”腺病 毒载体。嵌合腺病毒载体可以包括衍生于两种或多种(例如,2,3,4等) 不同的腺病毒血清型的腺病毒基因组。在本发明的内容中,嵌合腺病毒载 体可以包括大约等量的所述两种或多种不同腺病毒血清型的每一种的基 因组。当所述嵌合的腺病毒载体基因组包括两种不同的腺病毒血清型的基 因组时,所述嵌合的腺病毒载体基因组优选地包括一种腺病毒血清型的不 多于约70%(例如,不多于约65%,约50%,或约40%)的基因组,其 余的嵌合腺病毒基因组衍生于另一种腺病毒血清型的基因组。在一个实施 方案中,所述嵌合腺病毒载体可以含有包括一部分血清型2基因组和一部 分血清型5基因组的腺病毒基因组。例如,腺病毒血清型5基因组的5’ 区域(即,所述基因组5’区域到腺病毒E1区域)可以用腺病毒血清型2 基因组的相应区域置换(例如,Ad5基因组5’区域到腺病毒基因组E1区 域用Ad2基因组的核苷酸1-456置换)。

本发明的腺病毒载体可以是复制型的。例如,所述腺病毒载体可以在 腺病毒基因组中具有不抑制病毒在宿主细胞中复制的突变(例如,缺失, 插入,或置换)。本发明的腺病毒载体还可以是条件性复制型的。然而, 优选地,所述腺病毒载体在宿主细胞中是复制缺陷型的。

“复制缺陷型”意为所述腺病毒载体需要互补于复制所需要的腺病毒 基因组的一个或多个区域,这是由例如,至少一种复制必需基因功能的缺 陷引起(即,以致所述腺病毒载体不能在典型的宿主细胞,特别是在本发 明方法疗程中可能受到所述腺病毒载体感染的人类患者的那些细胞中复 制)。在基因,基因功能,或基因组区域的缺陷,如本文所用,定义为删 除所述病毒基因组的足够的遗传物质,以删除或消弱所述基因的功能(例 如,以致所述基因产物的功能减少至少约2倍,5倍,10倍,20倍,30 倍,或50倍),其核酸序列全部或部分被删除。对于中断复制必需的基因 功能,通常不需要删除整个基因区域。然而,对于在所述腺病毒基因组中 为一种或多种转基因提供足够的空间的目的,移除大多数的基因区域可能 是需要的。尽管优选删除遗传物质,但是通过添加或置换突变遗传物质也 适用于中断基因功能。复制必需的基因功能是那些复制所需要(例如,增 殖)的基因功能,并且,例如,由腺病毒早期区域(例如,E1,E2和E4 区域),晚期区域(例如,L1-L5区域),参与病毒包装的基因(例如,IVa2 基因)和病毒相关的RNAs(例如,VA-RNA1和/或VA-RNA-2)编码。

所述复制缺陷型腺病毒载体理想地需要互补所述腺病毒基因组的一 个或多个区域的至少一种复制必需基因功能。优选地,所述腺病毒载体需 要互补于对于病毒复制所需要的腺病毒基因组的E1A区域,E1B区域或 E4区域的至少一种基因功能(表示为E1-缺陷型或E4-缺陷型腺病毒载 体)。除了在E1区域的缺陷型,所述重组腺病毒还可以在主要晚期启动子 (MLP)中具有突变,如在国际专利申请公布WO00/00628中所讨论的 那样。最优选地,所述腺病毒载体缺失E1区域的至少一种复制必需基因 功能(理想地所有复制必需的基因功能),和非必需的E3区域的至少一种 基因功能(例如,E3区域的Xba I缺失)(表示为E1/E3-缺陷型腺病毒载 体)。关于E1区域,所述腺病毒载体可以缺失部分或全部的E1A区域和/ 或部分或全部的E1B区域,例如,缺失E1A和E1B区域每一区域的至少 一种复制必需的基因功能,因此对于复制,需要互补于所述腺病毒基因组 的E1A区域和E1B区域。对于复制,所述腺病毒载体还可以需要互补于 所述腺病毒基因组的E4区域,诸如通过缺失E4区域的一种或多种复制 必需的基因功能。

当所述腺病毒载体为E1缺陷型时,所述腺病毒载体基因组可以包括 起始于核苷酸335-375之间的任何核苷酸(例如核苷酸356),并且终止于 核苷酸3,310-3,350之间的任何核苷酸(例如,核苷酸3,329),或者甚至 终止于3,490和3,530之间的任何核苷酸(例如,核苷酸3,510)的缺失(基 于腺病毒血清型5基因组)。

当为E2A-缺陷型时,所述腺病毒载体基因组可以包括起始于核苷酸 22,425-22,465之间的任何核苷酸(例如,核苷酸22,443),并且终止于核 苷酸24,010-24,050之间的任何核苷酸(例如,核苷酸24,032)的缺失(基 于腺病毒血清型5基因组)。当为E3-缺陷型时,所述腺病毒载体基因组 可以包括起始于核苷酸28,575-29,615之间的任何核苷酸(例如核苷酸 28,593),并且终止于核苷酸30,450-30,490之间的任何核苷酸(例如,核 苷酸30,470)的缺失(基于腺病毒血清型5基因组)。

当所述腺病毒载体缺失所述腺病毒基因组的一个区域的至少一种复 制必需基因功能时(例如,E1-或E1/E3-缺陷型腺病毒载体),所述腺病毒 载体被称为“单一复制缺陷型”。特别优选的单一复制缺陷型腺病毒载体 为,例如,为了增殖所述腺病毒载体(例如,为了形成腺病毒载体颗粒), 至多需要互补于腺病毒基因组的E1区域的复制缺陷型腺病毒载体。

本发明的所述腺病毒载体可以为“多复制缺陷型”,意为所述腺病毒 载体在腺病毒基因组的两个或多个区域的每一区域缺失一种或多种复制 必需的基因功能,并且复制需要互补于这些功能。例如,前述E1-缺陷型 或E1/E3-缺陷型腺病毒载体还可以缺失E4区域的至少一种复制必需的基 因功能(表示为E1/E4-或E1/E3/E4-缺陷型腺病毒载体),和/或E2区域的 至少一种复制必需的基因功能(表示为E1/E2-或E1/E2/E3-缺陷型腺病毒 载体),优选地E2A区域的至少一种复制必需的基因功能(表示为E1/E2A- 或E1/E2A/E3-缺陷型腺病毒载体)。缺失整个E4区域的腺病毒载体可以引 发更低的宿主免疫应答。当为E4-缺陷型时,所述腺病毒载体基因组可以 包括,起始于,例如,核苷酸32,805-32,845之间的任何核苷酸(例如, 核苷酸32,826),并且终止于,例如,核苷酸35,540-35,580之间的任何核 苷酸(例如,核苷酸35,561)的缺失(基于腺病毒血清型5基因组),任 选地除了在E1区域的缺失(例如,核苷酸356-3,329或核苷酸356-3,510) (基于腺病毒血清型5基因组),和/或在E3区域的缺失(例如,核苷酸 28,594-30,469或核苷酸28,593-30,470)(基于腺病毒血清型5基因组)。 定义所缺失的核苷酸片段的端点可能很难精确地确定,并且典型地不会显 著地影响所述腺病毒载体的性质,即,每种前述核苷酸数目可以是+/-1,2, 3,4,5或者甚至10或20个核苷酸。

如果本发明所述腺病毒载体缺失E2A区域的复制必需基因功能,所 述载体优选地不包括E2A区域的完全缺失,其缺失在长度上优选地少于 约230个碱基对。一般地,腺病毒的E2A区域编码DBP(DNA结合蛋白), 一种DNA复制所必需的多肽。DBP由473-529个氨基酸组成,其取决于 病毒血清型。据信,DBP是一种不对称蛋白,其作为由具有延长的Nt结 构域的球状Ct组成的扁长的椭圆体而存在。研究表明,所述Ct结构域负 责DBP结合核酸、结合锌、和在DNA链延长水平上的DNA合成中起作 用的能力。然而,据信所述Nt结构域在转录和转录后水平的晚期基因表 达中起作用,负责蛋白有效的核定位,并且还可以参与增加其自身的表达。 在Nt结构域氨基酸2-38之间的缺失已表明,这一区域对于DBP功能是 重要的(Brough等.,Virology,196,269-281(1993))。尽管在编码DBP的 Ct区域的E2A区域缺失对病毒复制没有作用,但是在编码DBP的Nt结 构域的氨基酸2-38的E2A区域的缺失消弱病毒复制。优选地,任何多复 制缺陷型腺病毒载体含有腺病毒基因组的E2A区域的这一片段。特别地, 例如,要保留的E2A区域的理想的片段为这样的腺病毒基因组的E2A区 域的片段,即,其由E2A区域的5’端定义,具体地是血清型Ad5腺病毒 基因组E2A区域的位置Ad5(23816)-Ad5(24032)。为了提供需要水平的 病毒增殖,腺病毒基因组的这一片段理想地被包含在所述腺病毒载体中, 原因在于其在当前的E2A细胞系中不互补。

尽管上文所描述的缺失是关于腺病毒血清型5基因组的,但是本领域 的一名普通技术人员,基于在各种腺病毒血清型,特别是腺病毒血清型2 和5的基因组之间的相似性,无需多余的实验,可以确定其它腺病毒血清 型,诸如腺病毒血清型2基因组的同一区域的核苷酸坐标(coordinate)。

在本发明方法的一个实施方案中,所述腺病毒载体可以包括缺失E1 和E4区域每一区域的一种或多种复制必需基因功能的腺病毒基因组(即, 所述腺病毒载体为E1/E4-缺陷型腺病毒载体),优选地E4区域的整个编 码区域已从所述腺病毒基因组上删除。换句话说,已经移除E4区域的所 有开放阅读框(ORFS)。最优选地,通过删除全部E1区域和通过删除E4 区域的部分区域而赋予所述腺病毒载体以复制缺陷型的性质。所述腺病毒 载体的E4区域可以保留天然E4启动子、多聚腺苷化序列、和/或右端 (right-side)反向末端重复(ITR)。

应该理解,所述腺病毒载体不同区域的缺失可以改变哺乳动物的免疫 应答。特别地,不同区域的缺失可以减少由所述腺病毒载体产生的炎性反 应。并且,所述腺病毒载体的外壳蛋白可以被修饰,以便降低腺病毒载体 被针对野生型外壳蛋白的中和抗体识别的能力或无能力,如在国际专利申 请WO98/40509中所描述的那样。这样的修饰对于顽固眼睛疾病的长期 治疗是有效的。

所述腺病毒载体,当为多复制缺陷型,特别是缺失E1和E4区域的 复制必需基因功能时,可以包括间隔序列,以在互补细胞系中提供病毒生 长,其生长与由单一复制缺陷型腺病毒载体,特别是E1-缺陷型腺病毒载 体所获得的生长相似。在本发明优选的E4-缺陷型腺病毒载体中,其中保 留L5尾丝区域,所述间隔区理想地位于L5尾丝区域和右端ITR之间。 更加优选地,在这样的腺病毒载体中,E4多聚腺苷化序列单独地,或者 最优选地,与另一序列组合,存在于L5尾丝区域和右端ITR之间,以便 充分地分离所保留的L5尾丝区域和右侧ITR,以致这样的载体的病毒生 产接近于单一复制缺陷型腺病毒载体,特别是单一复制缺陷E1缺陷型腺 病毒载体的生产。

所述间隔区序列可以含有任何一种或多种需要的长度的核苷酸序列, 诸如长度上至少约15个碱基对的序列(例如,约15个碱基对和约12,000 个碱基对之间),优选地约100个碱基对-约10,000个碱基对,更加优选地, 约500个碱基对-约8,000个碱基对,甚至更加优选地,约1,500个碱基对 -约6,000个碱基对,并且最优选地,约2,000个碱基对-约3,000个碱基对。 关于所述腺病毒基因组,所述间隔区序列可以是编码或非编码的和天然的 或非天然的,但是没有恢复所述缺陷区域的复制必需功能。所述间隔区还 可以含有可用启动子表达盒。更加优选地,所述间隔区包括附加的多聚腺 苷化序列和/或过客基因(passenger gene)。优选地,在间隔区被插入E4 缺陷型区域的情形中,腺病毒基因组的E4多聚腺苷化序列和E4启动子 或任何其它(细胞的或病毒的)启动子保留在载体中。所述间隔区位于 E4多聚腺苷化位点和E4启动子之间,或者,如果载体中不存在E4启动 子,所述间隔区最接近右端ITR。所述间隔区可以包括任何适当的多聚腺 苷化序列。适当的多聚腺苷化序列的实例包括合成最优化的序列,BGH (牛生长素),多瘤病毒,TK(胸苷激酶),EBV(埃巴病毒)和乳头瘤病 毒,其包括人乳头瘤病毒和BPV(牛乳头瘤病毒)。优选地,特别是在E4 缺陷区域,所述间隔区包括SV40多聚腺苷化序列。SV40多聚腺苷化序 列允许多复制缺陷型腺病毒载体的更高的病毒生产水平。在不存在间隔区 时,与单一复制缺陷型腺病毒载体相比,所述多复制缺陷型腺病毒载体的 尾丝蛋白的生产和/或病毒生长减少了。然而,在至少一个缺陷腺病毒区 域,优选E4区域包括所述间隔区,可以抵消在尾丝蛋白生产和病毒生长 中的这种减少。理想地,所述间隔区包括葡糖醛酸糖苷酶基因。间隔区在 腺病毒载体中的应用,例如,在美国专利5,851,806和国际专利申请WO 97/21826中进一步描述。

已经观察到,一种至少E4缺陷型的腺病毒载体在有限量的时间内在 体内以高水平表达转基因,并且转基因在一种至少E4缺陷型的腺病毒载 体中的持续表达可以通过反式作用因子的作用调整,所述反式作用因子诸 如HSV ICPO,Ad pTP,CMV-IE2,CMV-IE86,HIV tat,HTLV-tax,HBV-X, AAV Rep78,来自U205骨肉瘤细胞系作用类似HSV ICPO的细胞因子, 或者在PC12细胞中由神经生长因子诱导的细胞因子,其中,例如,如在 美国专利6,225,113,6,649,373和6,660,521,和国际专利申请公布WO 00/34496中所描述的那样。考虑到上述内容,多缺陷型腺病毒载体(例如, 至少E4-缺陷型腺病毒载体)或第二个表达载体可以包括编码反式作用因 子的核酸序列,所述反式作用因子调节所述核酸序列表达的持续。当产生 免疫耐受性时,抗原DNA的持续表达是理想的。

理想地,对于复制(即,增殖),所述腺病毒载体需要,至多,互补 腺病毒基因组E1,E2A和/或E4区域的复制必需基因功能。然而,可以 将腺病毒基因组修饰,以中断一种或多种复制必需基因功能,如实践者想 要的那样,只要所述腺病毒载体保持缺陷,并且可以应用,例如,互补细 胞和/或编码所中断的复制必需基因功能的外源DNA(例如,辅助腺病毒) 进行增殖。在这方面,所述腺病毒载体可以仅仅缺失腺病毒基因组早期区 域的复制必需基因功能,仅仅缺失腺病毒基因组晚期区域的复制必需基因 功能,和缺失腺病毒基因组的早期和晚期区域的复制必需基因功能。腺病 毒载体也可以基本上使得整个腺病毒基因组被移除,在这种情形中,优选 地,至少病毒反向末端重复(ITRs)和一种或多种启动子,或者病毒ITRs 和包装信号保持完整无缺(即,腺病毒扩增子)。适当的复制缺陷型腺病 毒载体,包括多复制缺陷型腺病毒载体,在美国专利5,837,511;5,851,806; 5,994,106;6,127,175;和6,482,616;美国专利申请公布2001/0043922 A1, 2002/0004040 A1,2002/0031831 A1,2002/0110545 A1,和2004/0161848 A1, 和国际专利申请公布WO 94/28152,WO 95/02697,WO 95/16772,WO 95/34671,WO 96/22378,WO 97/12986,WO 97/21826,和WO 03/022311中 公开。

理想地,施用给哺乳动物的所述腺病毒载体是以腺病毒载体组合物, 特别是药物组合物的形式存在,其实质上没有可复制的腺病毒(RCA)污染 (例如,所述组合物包括少于约1%的RCA污染)。最理想地,所述组合 物是没有RCA的。没有RCA的腺病毒载体组合物和原液在美国专利 5,944,106和6,482,616,美国公布的专利申请2002/0110545 A1和国际专 利申请WO 95/34671中描述。

例如,通过移除腺病毒基因组全部或部分的E1,E3和E4区域,由此 获得的腺病毒载体能够接受外源核酸序列的插入片段,同时保留包装成腺 病毒壳体的能力。所述核酸序列可以位于腺病毒基因组的E1区域,E3区 域,或E4区域。实际上,所述核酸序列可以插入腺病毒基因组的任何地 方,只要所述位置不防止所述核酸序列的表达或者干扰腺病毒载体的包 装。

如果所述腺病毒载体不是复制缺陷型的,理想地,调节腺病毒载体, 以将所述载体的复制限制在目标组织内。所述腺病毒载体可以是条件型复 制腺病毒载体,其被设计成在由实践者预先确定的条件下复制。例如,复 制必需基因功能,例如,由腺病毒早期区域编码的基因功能,可以可操作 地连接到可诱导的、可抑制的或组织特异性转录控制序列上,例如,启动 子上。在这一实施方案中,复制需要存在或不存在与转录控制序列相互作 用的特殊因子。在自体免疫疾病的治疗中,可以有利地控制腺病毒载体在, 例如,淋巴结中复制,以获得持续的抗原产生并且控制免疫细胞产生。条 件型复制腺病毒载体在美国专利5,998,205中进一步描述。

除了修饰(例如,缺失,突变或置换)编码复制必需的基因功能的腺 病毒序列,所述腺病毒基因组可以含有良性或非致死性修饰,即,即使这 样的修饰在另外包含复制必需的基因功能的腺病毒基因组区域内,所述修 饰也不赋予所述腺病毒复制缺陷,或者,理想地,没有不利地影响病毒机 能和/或病毒蛋白的生产。这样的修饰通常由DNA处理产生,或者适合辅 助表达载体构建。例如,可以有利地在腺病毒基因组中移除或引入限制性 酶切位点。这样的良性突变通常不具有关于病毒机能的可检测到的副作 用。例如,所述腺病毒载体可以包括核苷酸10,594和10,595的缺失(基 于腺病毒血清型5基因组),其与VA-RNA-1转录相关,但是其缺失没有 妨碍VA-RNA-1的生产。

类似地,可以调节腺病毒载体的外壳蛋白,以改变腺病毒对于潜在宿 主细胞上的病毒受体的结合特性或识别。对于腺病毒,这样的处理可以包 括缺失尾丝区、五邻体或六邻体区域,将各种天然的或非天然的配体插入 到外壳蛋白部分,等等。外壳蛋白的处理可以扩大受腺病毒载体感染的细 胞范围,或者能够使得腺病毒载体靶向特定的细胞型。

例如,在一个实施方案中,所述腺病毒载体包括嵌合外壳蛋白(例如, 尾丝蛋白,六邻体pIX,pIIIa,或五邻体蛋白),其通过优选地在或者接 近羧基端引入非天然的氨基酸序列而与野生型(即,天然的)外壳蛋白不 同。优选地,将所述非天然的氨基酸序列插入到或者置换内在外壳蛋白序 列。本领域的一名普通技术人员应该理解,所述非天然氨基酸序列可以插 入到内在外壳蛋白序列之内,或者在内在外壳蛋白序列末端。由此获得的 嵌合病毒外壳蛋白能够指导包括所述外壳蛋白的腺病毒载体进入细胞,其 比除了包括野生型腺病毒外壳蛋白而不是嵌合腺病毒外壳蛋白之外相同 的载体进入细胞更加有效率。优选地,所述嵌合腺病毒外壳蛋白结合在细 胞表面存在的新的内源结合位点,所述位点不被,或者很难被包括野生型 外壳蛋白的载体识别。这种增加的进入效率的一个直接的效果是,所述腺 病毒可以结合并且进入包括野生型外壳蛋白的腺病毒典型地不能进入或 者只能以低效率进入的许多细胞类型。

在本发明的另一个实施方案中,所述腺病毒载体包括不选择具体类型 的真核细胞的嵌合病毒外壳蛋白。所述嵌合外壳蛋白通过将非天然氨基酸 序列插入到或者置换内在外壳蛋白序列而与野生型外壳蛋白不同。在这一 实施方案中,所述嵌合腺病毒外壳蛋白有效地结合比野生型腺病毒外壳更 宽范围的真核细胞,诸如在国际专利申请WO 97/20051中所描述的那样。

腺病毒与所给细胞的结合特性也可以通过应用包括短杆状 (short-shafted)腺病毒尾丝基因的腺病毒进行调节,如在美国专利 5,962,311中所讨论的那样。应用包括短杆状腺病毒尾丝基因的腺病毒减 少腺病毒尾丝结合于其细胞表面受体的水平或效率,并且增加结合于其细 胞表面受体的腺病毒五邻体基底(penton base),由此增加所述腺病毒对所 给细胞的结合特性。备选地,应用包括短杆状尾丝的腺病毒能够通过将非 天然的氨基酸序列引入到五邻体基底或尾丝节(fiber knob)使得所述腺病 毒靶向需要的细胞表面受体。

在另一实施方案中,编码与天然底物结合相关的氨基酸残基的核酸残 基可以被改变,补加或缺失(参见,例如,国际专利申请公布WO00/15823; Einfeld等.,J.Virol.,75(23),11284-11291(2001);和van Beusechem等.,J. Virol.,76(6),2753-2762(2002)),以致结合突变核酸残基(或者具有由此编 码的尾丝蛋白)的所述腺病毒载体更不能与其天然底物结合。例如,血清 型5或血清型2腺病毒载体的天然CAR和整联蛋白结合位点,诸如腺病 毒尾丝蛋白的结(knob)结构域和位于腺病毒五邻体基底的Arg-Gly-Asp (RGD)序列,分别可以被移除或分解。调控或辅助结和CAR之间的相互 作用的尾丝蛋白的任何适当的氨基酸残基可以被突变或移除,只要所述尾 丝蛋白能够三聚体化。类似地,可以将氨基酸添加到尾丝结上,只要所述 尾丝蛋白保留三聚体化的能力。适当的残基包括尾丝蛋白暴露的环内的氨 基酸,诸如,例如,血清型5尾丝结结构域的AB环,DE环,和FG环, 其在,例如,Roelvink等.,Science,286,1568-1571(1999),和美国专利 6,455,314中进一步描述。调控或辅助五邻体基底和整联蛋白之间的相互 作用的五邻体基底蛋白的任何适当的氨基酸残基可以被突变或移除。适当 的残基包括,例如,位于Ad5五邻体基底蛋白高变区的5种RGD氨基酸 序列基序的一种或多种(例如,如美国专利5,731,190所描述的那样)。通 过修饰编码天然RGD基序的核酸序列,以致天然RGD氨基酸序列在构 象上难以接近结合αv整联蛋白受体,诸如通过将DNA序列插入到或接 近编码腺病毒五邻体基底蛋白的核酸序列,也可以破坏在五邻体基底蛋白 上的天然整联蛋白结合位点。优选地,所述腺病毒载体包括分别不与CAR 和整联蛋白结合的尾丝蛋白和五邻体基底蛋白。备选地,所述腺病毒载体 包括分别结合CAR和整联蛋白的尾丝蛋白和五邻体基底蛋白,但是所述 蛋白比相应的野生型外壳蛋白具有更小的亲和力。如果修饰的腺病毒尾丝 蛋白和五邻体基底蛋白分别结合CAR和整联蛋白,那么所述腺病毒载体 表现出减少的与CAR和整联蛋白的结合,以比同一血清型未修饰的腺病 毒尾丝蛋白和五邻体底基蛋白少于至少约5倍,10倍,20倍,30倍,50 倍或100倍的亲和力结合。

尽管优选,但是不必消除腺病毒与宿主细胞的天然结合。在一些实例 中,诸如应用腺病毒载体将抗原编码序列运送到宿主细胞,广泛的腺病毒 宿主范围可能是有利的。

腺病毒载体还可以包括嵌合外壳蛋白,所述嵌合外壳蛋白包含结合底 物的非天然氨基酸序列(即,配体)。所述嵌合腺病毒外壳蛋白的非天然 氨基酸序列,允许包括所述嵌合外壳蛋白的腺病毒载体结合,并且理想地, 感染不会被没有非天然氨基酸序列的相应的腺病毒天然感染的宿主细胞 (即,不被相应的野生型腺病毒感染的宿主细胞),以比没有所述非天然 氨基酸序列的相应的腺病毒更大的亲和力结合于受相应的腺病毒天然感 染的宿主细胞,或者以比非靶点细胞更大的亲和力结合于具体的靶点细 胞。“非天然”氨基酸序列可以包括在腺病毒外壳蛋白中不是天然存在的 氨基酸序列,或者在腺病毒外壳中发现但是位于壳体内的非天然位置的氨 基酸序列。“优先结合”意为非天然氨基酸序列结合受体,诸如,例如,αvβ3 整联蛋白,其以比非天然配体结合不同的受体,诸如,例如,αvβ1整联 蛋白至少约3倍更大的亲和力(例如,至少约5倍,10倍,15倍,20倍, 25倍,35倍,45倍或50倍更大的亲和力)结合。

所述非天然氨基酸序列可以缀合到任何腺病毒外壳蛋白,以形成嵌合 外壳蛋白。因此,例如,所述非天然氨基酸序列可以缀合,插入,或者附 着到尾丝蛋白,五邻体基底蛋白,六邻体蛋白,蛋白IX,VI或IIIa等。这 样的蛋白的序列,以及在重组蛋白中应用其的方法在本领域内是公知的 (参见,例如,美国专利5,543,328;5,559,099;5,712,136;5,731,190; 5,756,086;5,770,442;5,846,782;5,962,311;5,965,541;5,846,782;6,057,155; 6,127,525;6,153,435;6,329,190;6,455,314;6,465,253;和6,576,456;美国专 利申请公布2001/0047081和2003/0099619;和国际专利申请WO96/07734, WO 96/26281,WO 97/20051,WO 98/07877,WO 98/07865,WO 98/40509, WO 98/54346,WO 00/15823,WO 01/58940和WO 01/92549)。所述嵌合外 壳蛋白的外壳蛋白部分可以是附加配体结构域的全长腺病毒外壳蛋白,或 者其可以被剪截,例如,在内部或者在C-和/或N-端剪截。对于腺病毒载 体,所述外壳蛋白部分本身不必是天然的。例如,外壳蛋白可以是结合到 腺病毒血清型5载体的腺病毒血清型4(Ad4)尾丝蛋白,其中优选地消除 Ad4尾丝的天然CAR结合基序。然而,修饰后(包括非天然氨基酸的存 在),所述嵌合外壳蛋白优选地能够如其天然负体外壳蛋白一样结合到腺 病毒壳体。一旦确定所给出的非天然氨基酸序列,它可以结合到能够与底 物相互作用的病毒的任何位置(即,病毒表面)。例如,所述配体可以结 合到尾丝,五邻体基底,六邻体,蛋白IX,VI或IIIa,或其它适当的位置。 在所述配体附着到尾丝蛋白的情形,优选地它不妨碍病毒蛋白或者尾丝单 体之间的相互作用。因此,所述非天然氨基酸优选地本身不是寡聚化结构 域,原因在于这样可能与腺病毒尾丝的三聚体化结构域不利地相互作用。 优选地,所述配体被添加到病毒体蛋白上,并且其以这样的方式结合,以 便易于暴露于底物(例如,在蛋白的N-或C-端,附着到面向底物的残基, 位于肽间隔区上,以与底物接触,等等),从而最大化地将非天然氨基酸 序列展现给底物。理想地,所述非天然氨基酸序列在尾丝蛋白C-端结合 到腺病毒尾丝蛋白上(并且通过间隔区附着),或者结合尾丝的暴露的环 (例如,HI环),以产生嵌合外壳蛋白。在所述非天然氨基酸序列附着到 或者置换五邻体基底片段的情形,优选地,它在高变区之内以确保它与底 物接触。在所述非天然氨基酸序列附着到六邻体的情形,优选地它在高变 区之内(Miksza等.,J.Virol.,70(3),1836-44(1996))。由于所述非天然氨 基酸序列可以更加可用于结合受体,并且降低了非天然氨基酸序列和腺病 毒尾丝单体之间的任何空间相互作用,所以应用将非天然氨基酸序列从腺 病毒颗粒表面延伸的间隔区序列是有利的。

所述非天然氨基酸序列可以结合在狭窄种类的细胞类型(例如,肿瘤 细胞,心肌,骨骼肌,平滑肌,等等)或者包括一些细胞类型的更宽的组 上存在的特别细胞受体。在其它实施方案中(例如,在特别加工的细胞 类型中帮助纯化或增殖),除了细胞表面蛋白,非天然氨基酸(例如,配 体)可以结合化合物。因此,所述配体可以结合血源性和/或淋巴源性蛋 白(例如,白蛋白),合成的肽序列,诸如多聚氨基酸(例如多聚赖氨酸, 多聚组氨酸,等等),人工肽序列(例如,FLAG),和RGD肽片段(Pasqualini 等.,J.Cell.Biol.,130,1189(1995))。

适当的非天然氨基酸序列及其底物的实例包括,但不限于,整联蛋白 识别的氨基酸的短的(例如,6个氨基酸或者更少)线性片段,以及多聚 氨基酸序列,诸如多聚赖氨酸,多聚精氨酸,等等。插入多个赖氨酸和/ 或精氨酸提供对肝素和DNA的识别。用于产生嵌合腺病毒外壳蛋白的适 当的非天然氨基酸序列在美国专利6,455,314和国际专利申请WO 01/92549中进一步描述。

优选地,所述腺病毒外壳蛋白包括结合αvβ3,αvβ5或αvβ6整联蛋 白的非天然氨基酸序列。显示对αvβ3整联蛋白特异性配体,诸如RGD 基序的腺病毒载体,与没有表达所述整联蛋白到这样的程度的细胞相比 较,其感染在细胞表面具有更多数目的αvβ3整联蛋白部分的细胞,由此 将所述载体靶向目的特异性细胞。

在本发明的另一个实施方案中,所述腺病毒载体可以包括嵌合尾丝蛋 白,其包括包含RGD基序的氨基酸序列(例如,非天然氨基酸序列),所 述基序包括,但不限于,CRGDC(SEQ ID NO:1),CXCRGDCXC(SEQ ID NO:2),其中X代表任何氨基酸,以及CDCRGDCFC(SEQ ID NO:3)。 RGD基序可以插入腺病毒尾丝结区域,优选地插入腺病毒结的暴露的环, 诸如HI环。RGD氨基酸序列可以置换HI环的区域,或者可以插入到HI 环中而并不移除天然氨基酸。RGD基序还可以附加到腺病毒尾丝蛋白的 C端,任选地通过间隔区序列附加。所述间隔区序列优选地包括1-200个 氨基酸,并且可以(但不需要)具有想要的功能。在一个实施方案中,所 述嵌合的尾丝蛋白识别柯萨奇病毒和腺病毒受体(CAR)。理想地,尾丝蛋 白的天然CAR结合不受尾丝蛋白的突变或修饰的影响。另外,所述腺病 毒载体可以包括腺病毒外壳,其中五邻体基底蛋白保留其结合整联蛋白的 能力。然而,如本文所讨论的,如果需要,可以消除通过腺病毒外壳蛋白 五邻体基底蛋白的天然结合。在另一个实施方案中,RGD基序优选地侧 接一组或两组半胱氨酸残基。

腺病毒载体可以包括不选择具体类型的真核细胞的嵌合病毒外壳蛋 白。所述嵌合外壳蛋白与野生型外壳蛋白不同,其通过将非天然氨基酸序 列插入或者置换内在外壳蛋白序列,或者将非天然氨基酸序列附着到外壳 蛋白的N或C端而实现所述不同。例如,将包括大约5个-大约9个赖氨 酸残基(优选地7个赖氨酸残基)的配体通过非编码间隔区序列附着到腺 病毒尾丝蛋白的C端。在这一实施方案中,所述嵌合病毒外壳蛋白与野 生型病毒外壳相比有效地结合更宽范围的真核细胞,诸如在国际专利申请 WO 97/20051中所描述的那样。

当然,可以调节腺病毒载体识别潜在的宿主细胞的能力,无需外壳蛋 白的遗传处理。例如,将腺病毒与包括结合五邻体基底结构域和选择性地 结合具体的细胞表面结合位点的结构域的双特异性分子复合,能够使得本 领域的普通技术人员将所述载体靶向具体的细胞类型。

复制缺陷型腺病毒载体典型地在这样的互补细胞系中产生,即,为了 产生高滴度的病毒载体储备物,所述细胞系以适当的水平提供复制缺陷型 腺病毒载体中不存在的,但是为病毒增殖所需要的基因功能。理想地,所 述互补细胞系包括,结合到细胞基因组,编码腺病毒增殖所需要的基因功 能的腺病毒核酸序列。优选的细胞系与在复制缺陷型腺病毒中不存在的至 少一种并且优选地全部复制必需的基因功能互补。所述互补细胞系可以互 补于由早期区域,晚期区域,病毒包装区域,病毒相关RNA区域,或者 其组合编码的至少一种复制必需的基因功能的缺陷,包括所有的腺病毒功 能(例如,以使得腺病毒扩增子能够增殖)。最优选地,所述互补细胞系 互补于腺病毒基因组E1区域的至少一种复制必需的基因功能(例如,两 种或多种复制必需的基因功能)的缺陷,特别地互补于E1A和E1B区域 每一个的复制必需的基因功能的缺陷。另外,所述互补细胞系可以互补于 腺病毒基因组E2(特别地当涉及到腺病毒DNA聚合酶和末端蛋白时)和 /或E4区域的至少一种复制必需的基因功能的缺陷。理想地,互补于E4 区域缺陷的细胞包括E4-ORF6基因序列并且产生E4-ORF6蛋白。这样的 细胞理想地包括至少ORF6并且没有腺病毒基因组E4区域的其它ORF。 优选地,所述细胞系进一步特征在于,它以非重叠的方式包含与腺病毒载 体互补的基因,其最小化,并且实际上消除载体基因组与细胞DNA重组 的可能性。因此,如果不在载体储备物中避免的话,可复制腺病毒(RCA) 的存在将被减到最少,因此,其适用于特定的治疗目的,特别是接种目的。 在载体储备物中缺少RCA避免了所述腺病毒载体在非互补细胞中的复 制。这样的互补细胞系的构建包括标准的分子生物学和细胞培养技术,诸 如由Sambrook等(如前所述)和Ausubel等(如前所述)所描述的那些。

用于产生腺病毒载体的互补细胞系包括,但不限于,293细胞(例如, 在Graham等.,J.Gen.Virol.,36,59-72(1977)中所述),PER.C6细胞(例 如,在国际专利申请公布WO97/00326,和美国专利5,994,128和6,033,908 中所述),和293-ORF6细胞(例如,在国际专利申请公布WO95/34671 和Brough等.,J.Virol.,71,9206-9213(1997)中所述)。例如,在美国专利 6,677,156和6,682,929,和国际专利申请公布WO 03/20879中描述了其它 的互补细胞。在一些实例中,细胞基因组不需要包括这样的核酸序列,即, 其基因产物互补于复制缺陷型腺病毒载体的全部缺陷。复制缺陷型腺病毒 载体中缺乏的一种或多种复制必需的基因功能可以由辅助病毒提供,例 如,以反式提供对于需要的腺病毒载体复制所需要的一种或多种必需的基 因功能的腺病毒载体。通常将辅助病毒加工以防止感染性的辅助病毒的包 装。例如,腺病毒基因组E1区域的一种或多种复制必需的基因功能由互 补细胞提供,然而,腺病毒基因组E4区域的一种或多种复制必需的基因 功能由辅助病毒提供。

在美国专利5,543,328;5,559,099;5,712,136;5,731,190;5,756,086; 5,770,442;5,846,782;5,871,727;5,885,808;5,922,315;5,962,311;5,965,541; 6,057,155;6,127,525;6,153,435;6,329,190;6,455,314;6,465,253;6,576,456; 6,649,407;6,740,525,和国际专利申请WO 95/02697,WO 95/16772,WO 95/34671,WO 96/07734,WO 96/22378,WO 96/26281,WO 97/20051,WO 98/07865,WO98/07877,WO98/40509,WO98/54346,WO00/15823,WO 01/58940和WO 01/92549中描述了对腺病毒载体的适当的修饰。类似地, 应该理解,许多腺病毒载体可以商购。在本领域,腺病毒载体的构建被充 分理解。应用本领域已知的方法(例如,应用互补细胞系,诸如293细胞 系,Per.C6细胞系,或293-ORF6细胞系)和例如,在美国专利5,965,358; 5,994,128;6,033,908;6,168,941;6,329,200;6,383,795;6,440,728;6,447,995; 和6,475,757;美国专利申请公布2002/0034735A1,和国际专利申请WO 98/53087,WO 98/56937,WO 99/15686,WO 99/54441,WO 00/12765,WO 01/77304和WO 02/29388中,以及本文所确定的其它参考文献中提出的 方法,可以构建和/或纯化腺病毒载体。

下述实施例进一步举例说明本发明,但是,当然,不应该以任何方式 将其解释为限制其范围。

实施例1

本实施例证明生产包括4种腺病毒载体的组合物,其中每种腺病毒载 体编码不同的HIV抗原。

应用快速载体构建系统(AdFASTTM,GenVec,Inc.)构建腺病毒载体。 AdFASTTM用来产生4种腺病毒载体,其中每种载体表达4种HIV抗原的 一种:gp140(分化体A),gp140(分化体B)dv12,gp140(分化体C),和GagPol (分化体B)。抗原的表达由巨细胞病毒(CMV)即时早期启动子驱动。选择 GV11腺病毒骨架来减少在临床生产期间产生可复制腺病毒(RCA)的风 险。GV11骨架含有必需的E1和E4区域的缺失,以及部分E3缺失,所 述缺失赋予腺病毒载体复制缺陷。

AdtGagPol(B).11D质粒

应用从HIV-1分化体B产生的Gap和Pol蛋白的序列,产生Gag/Pol 基因的合成的多蛋白编码译本,其应用在人体细胞中表达最优化的密码 子。所述合成的Gag基因(GenBank登记号K03455)来自HIV-1分化体B 毒株HXB2,和合成的Pol基因(Pol/h)(GenBank登记号M19921)来自HIV-1 分化体B NL4-3。Pol基因是没有功能的,原因在于它以融合蛋白形式存 在,所述融合蛋白包括逆转录酶,蛋白酶和整合酶蛋白。在编码所述质粒 的蛋白酶和逆转录酶基因的核酸序列中引入点突变。蛋白酶修饰防止对 Pol基因产物的加工处理,并且减少了功能性蛋白酶、逆转录酶和整合酶 酶促活性的潜能。没有对Gap蛋白进行任何修饰。应用标准重组DNA技 术,将编码Gag/Pol融合多蛋白的核酸序列亚克隆到E1-穿梭质粒中的表 达盒中,以用于插入腺病毒载体。

Adgp140(A).11D质粒

应用来自HIV-1分化体A毒株92rw020的包膜多蛋白(gp160)的蛋白 序列(嗜CCR5,GenBank登记号U08794),产生HIV-1分化体A基因gp 140delCFI的合成译本,其应用为了在人体细胞中表达而改变的密码子。 在这点上,表达HIV-1基因的质粒用设计成破坏病毒RNA结构的序列合 成制备,所述序列通过应用典型地在人体细胞中发现的密码子限制蛋白表 达。应用标准重组DNA技术,将编码分化体A gp140delCFI基因的核酸 序列亚克隆到E1-穿梭质粒中的表达盒中,以用于插入腺病毒载体。

Adtgp140dv12(B).11D质粒

应用来自HIV-1分化体B毒株HXB2的包膜多蛋白(gp160)的蛋白序 列(嗜X4,GenBank登记号K03455),产生HIV-1分化体B基因X4gp160/h 的合成译本,其应用在人体细胞中表达最优化的密码子。为了产生包膜蛋 白R5gp160/h的嗜CCR5译本,将编码来自HIV-1毒株X4gp160/h的HIV-1 包膜多蛋白氨基酸275-361的区域用来自HIV-1BaL毒株的相应的区域 (GenBank登记号M68893)置换。将来自pR5gp160/h的包膜蛋白基因的 全长嗜CCR5译本在第680个氨基酸密码子后终止。所述截短的Env糖蛋 白(gp140)含有完整的表面蛋白和包括融合结构域在内的gp41的胞外结构 域,和对于形成低聚体,特别是两个螺旋状卷曲螺旋基序重要的区域。缺 失Env V1和V2环,以提高所述载体在生产细胞系中的稳定性和产量。 由于限制性酶切位点的产生,在缺失后,立即结合2个附加的氨基酸。应 用标准重组DNA技术,将编码gp140dv12基因的核酸序列亚克隆到E1- 穿梭质粒中的表达盒中,以用于插入腺病毒载体。

Adgp140(C).11D质粒

应用来自HIV-1毒株97ZA012包膜多蛋白gp140delCFI的蛋白序列 (嗜CCR5,GenBank登记号AF286227),产生HIV-1分化体C基因 gp140delCFI的合成译本,其应用在人体细胞中表达最优化的密码子。应 用标准重组DNA技术,将编码合成的gp140delCFI基因的核酸序列亚克 隆到E1-穿梭质粒中的表达盒中,以用于插入腺病毒载体。

腺病毒载体

在大肠杆菌(E.coli)BjDE3细菌中,将4种E1-穿梭质粒, AdtGagPol(B).11D,Adgp140(A).11D,Adtgp140dv12(B).11D,和 Adgp140(C).11D,与基于GV11腺载体的AdFASTTM质粒 pAdE1(BN)E3(10)E4(TIS1)重组,以产生所述腺病毒载体质粒。然后,通 过将所述腺病毒载体质粒引入包装细胞系,293-ORF6中,产生复制缺陷 型腺病毒载体AdtGagPol(B).11D,Adgp140(A).11D,Adtgp140dv12(B).11D, 和Adgp140(C).11D。

腺病毒载体组合物

将4种腺病毒载体构建体纯化并且透析到在Bio Whittaker(Frederick, MD)定制加工的最终配制缓冲液(FFB;10mM Tris pH7.8,75mM NaCl, 5%海藻糖,25ppm聚山梨酸酯80,1mM MgCl2)中。所述腺病毒载体组合 物,称为VRC-HIVADV014-00-VP,制备于4种腺病毒载体的每一个,分 别地,AdtGagPol(B).11D,Adgp140(A).11D,Adtgp140dv12(B).11D, Adgp140(C).11D以3:1:1:1重量比的混合物。

实施例2

本实施例例证施用给哺乳动物的腺病毒载体组合物的生物分布。

应用由针头和注射器运送的肌内注射,在新西兰白兔(New Zealand White rabbits)上进行单一剂量的生物分布研究,以评估腺病毒载体组合 物VRC-HIVADV014-00-VP的分布。将所述载体组合物以单一剂量施用给 兔(0.95×1011pu),并且在施用载体后第9,61和91天检测组织中腺病毒 载体的存在。

应用GLP验证的TaqmanTM聚合酶链式反应(PCR),检测组织中腺病 毒载体的存在,所述PCR反应被研发并且能够在VRC-HIVADV014-00-VP 的4种不同的腺病毒载体的每一种中检测具体的目标序列。所述测定法从 每种腺病毒载体中检测扩增子。5′-PCR引物,3′-PCR引物,和荧光标记 的探针跨越包含插入体,多聚接头和启动子的区域。对于这种测定法,检 测的下限是10个拷贝的VRC-HIVADV014-00-VP DNA,并且对于这种测 定法,定量的下限是50个拷贝的VRC-HIVADV014-00-VP DNA。

来自3个时间点的PCR数据表明,在施用后第9和61天,在注射位 点(皮下组织和肌肉)和肝脏,以及在所有的时间点在脾脏中,存在 VRC-HIVADV014-00-VP DNA。对于具有阳性发现的组织在研究天数(SD) 第9天和SD61之间,对于肝脏和注射位点在SD61和SD91之间,拷贝 数目和阳性组织数目相当可观地下降。没有观察到毒性或总体损伤的临床 迹象。

实施例3

本实施例例证施用给哺乳动物的腺病毒载体组合物的免疫原性。

将腺病毒载体组合物VRC-HIVADV014-00-VP以单一剂量(1×1011pu) 施用给小鼠,和以两倍剂量施用给兔。在小鼠施用后4周,和兔施用后 36天,分析组织的免疫原性。

通过干扰素γ(IFN-γ)ELISPOT测定和基于流式细胞术的细胞内细胞 因子染色(ICS)测定,检测细胞免疫应答。IFN-γELISPOT定量地测定由免 疫的动物外周血单核细胞(PBMC)产生的IFN-γ。将所述细胞在体外暴露于 HIV-1抗原(即,跨越在腺病毒载体中表达的蛋白长度的一系列短的、重 叠的肽)。由抗原激活的T淋巴细胞产生的IFN-γ分子结合于包被检测平 板的抗体,并且可以通过应用碱性磷酸酶缀合的读取系统作为斑点形成细 胞(SFC)进行比色计数。类似地,ICS测定法应用基于流式细胞术的系统 来测定由抗原激活的细胞所产生的IFN-γ(有时和附加的细胞因子)。在这 一系统中,激活的细胞进一步的特征在于表型淋巴细胞标记,其允许应答 于疫苗抗原的细胞类型(例如,CD4+或CD8+T-淋巴细胞)的精确定量。 应用ELISA测定法或修饰的测定法测定体液免疫应答,在所述测定法中, 应用凝集素捕获系统,将腺病毒载体表达的抗原结合于检测平板上。

用VRC-HIVADV014-00-VP免疫在小鼠中激发了体液和细胞免疫应 答,并且在兔中激发了体液免疫应答。

实施例4

本实施例例证施用给哺乳动物的腺病毒载体组合物的生物分布。

雄性和雌性新西兰白兔,约15周龄,分成两个处理组。组1由每种 性别的3只组成,组2由每种性别的15只组成,总共36只兔。在研究日 (″SD″)第1天,应用针头和注射器,组1的动物接受最终配制缓冲液(FFB) 的一次肌内注射(右大腿肌肉)(0.5mL/动物)。组2的动物接受1.0×1011pu剂量的VRC-HIVADV014-00-VP的一次肌内注射(右大腿肌肉)。

对动物至少每天观察两次,观察濒死率和死亡率以及毒性临床迹象 (笼边(cageside))。在笼边观察的场所,当称重动物时进行详细的检查(预 先处理,此后每周一次,在尸体剖检时)。评估的临床迹象包括,但是不 限于,皮肤和毛皮特征,眼睛和黏膜,呼吸,循环,自主的和中枢的神经 系统,以及身体运动(somatomotor)和行为模式。

在研究日第9,61和91天,将来自测试组(组2)的每种性别的5 只动物,和来自赋形剂对照组(组1)的每种性别的1只动物处死。在麻 醉前,通过穿刺中耳廓动脉收集0.6mL血到无菌的乙二胺四乙酸(EDTA) 管中。将每只动物通过注射戊巴比妥钠施以安乐死并放血。从每只动物收 集下述器官,每种收集的器官应用一套洁净的器具:血,性腺,心,肺, 肝,肾,淋巴结,脾,胸腺,皮下组织和大腿肌肉(在注射位点),骨髓 (来自注射侧的腿骨)和脑。将所述组织立即放入无菌小瓶中,在液氮中 骤然冷冻,并且保存在-75±10℃。

在每种组织样品中,应用腺病毒载体特异性PCR测定法(TaqmanTM聚合酶链式反应)来检测4种腺病毒载体的存在。本测定法检测的下限为 10拷贝靶目标/μg DNA,定量的下限为50拷贝靶目标/μg DNA。将超出 检测下限但低于定量下限的样品称为不可定量的(NQ)。对在研究日第9, 61和91天收集的样品进行PCR评估。显示阳性生物分布结果的组织概述 在表1中列出。

没有观察到在死亡率,毒性临床迹象,体重,或者体重变化中的与处 理相关的变化。在接受VRC-HIVADV014-00-VP的雄性组中,食物消耗在 注射后24小时期间减少了,但是在这段时间后恢复正常。

表1

 骨髓肝脾皮下组织肌肉第9天#阳性1/109/1010/105/104/10平均拷贝#23945193480882751第61天#阳性0/102/106/102/100/10平均拷贝#N/A118113232N/A第91天#阳性0/100/105/100/100/10平均拷贝#N/AN/A124N/AN/A

本实施例的结果证明,包括多腺病毒载体的所述组合物转导各种组 织,同时表现出最小的毒性。

实施例5

本实施例例证施用给哺乳动物的腺病毒组合物的免疫原性。

将两组雌性BALB/c小鼠用在生理盐水中稀释的空腺病毒载体或 VRC-HIVADV014-00-VP腺病毒载体组合物免疫。具体地,5只小鼠接受 1×1010pu/动物的空腺病毒载体的肌内注射,和10只小鼠接受1×1010pu/ 动物的VRC-HIVADV014-00-VP的肌内注射。每只小鼠注射的总体积为 200μL。注射后10天,对小鼠进行采血,并且收集血清并在4℃保存直到 检测。将脾脏无菌地移除,温和地匀浆成为单细胞混悬液,洗涤,并且重 悬成106个细胞/mL的终浓度。

将96孔ELISA平板用100μL/孔的凝集素-Galanthaus Nivalis(Sigma) 包被,并且在4℃温育过夜。移除凝集素,并且将每个孔用200μL含有 10%胎牛血清(FBS)的PBS在室温封闭2小时。将所述平板用含有0.2% 吐温-20的PBS(PBS-T)洗涤两次,并且将来自293细胞的50μL 1:4稀释 的蛋白上层清液(~1μg/mL)添加到每个孔中。所述上层清液从转染了 作为腺病毒载体构建体的表达相同的HIV-1分化体A,B和C包膜抗原的 DNA质粒的293细胞制备。来自转染了空p2000载体的293细胞提取物 的总蛋白用作阴性对照。

将所述平板在室温温育1小时,并且用PBS-T洗涤4次。将50μL 对照血清(来自用对照质粒p2000免疫的小鼠)或者来自测试质粒接种的 小鼠的血清以4倍系列稀释物形式添加到每个孔中,从1:100稀释开始。 将平板在室温温育1小时,洗涤,并且将50μL辣根过氧化物酶缀合的山 羊抗鼠IgG添加到每个孔中。将平板在室温温育1小时,洗涤,并且将 50μL底物(Fast邻苯二胺二氢氯化物,Sigma)添加到每个孔中。然后, 将平板在室温温育30分钟。通过添加50μL1(N)H2SO4终止反应,并且 在450nm读取光学密度。

将收集的脾细胞(106个细胞/肽库)刺激6小时。刺激的最后5小时 在10μg/mL布雷菲德菌素A(Sigma)和具有同腺病毒载体表达的那些肽相 同的氨基酸序列的肽库存在下发生。应用的所有的肽为15-mers,由跨越 所检测的基因全部序列的11个氨基酸重叠。将细胞进行透化处理,固定 并用单克隆抗体(大鼠抗小鼠细胞表面抗原CD3,CD4和CD8 (Pharmingen))染色,接着进行多参量流式细胞术以在CD4+或CD8+T- 细胞群中检测IFN-γ和TNF-α阳性细胞。应用Prism3.0软件(San Diego, CA),通过Mann-Whitney检测,在对照质粒接种和检测物接种的小鼠之 间所观察到的CD4+和CD8+应答中进行统计学分析。

接种小鼠中的HIV-1特异性细胞免疫应答通过细胞内流式细胞术证 明。假定大于0.1%细胞因子生产细胞的频率代表阳性结果,那么在3/10 (Gag),7/10(Pol),8/10(Env-A),10/10(Env-B)和9/10(Env-C)小鼠中观察到 CD4+应答。在9/10(Gag),10/10(Pol),6/10(Env-A),6/10(Env-B),和 7/10(Env-C)小鼠中观察到CD8+应答。在用VRC-HIVADV014-00-VP免疫 后,所有的小鼠具有可证明的针对HIV-1蛋白的抗体滴度(通过ELISA 测定)。

这些结果证明所述腺病毒载体组合物在小鼠中激发了免疫应答。

实施例6

本实施例例证施用给哺乳动物的腺病毒载体组合物的免疫原性。

通过针头和注射器将VRC-HIVADV014-00-VP(1×1011pu)肌肉内施 用给20只兔的一组(组2),并且大小相同的安慰剂组用作对照(组1)。 给第三组兔(组3)施用引发组合物(VRC-HIVDNA009-00-VP)(4mg),所 述引发组合物包括6种质粒,每种分别编码分化体B Gag,分化体B Pol, 分化体B nef,和来自分化体A、B和C的Env gp145。分化体B Pol质粒 还编码包括逆转录酶,蛋白酶和整合酶蛋白的融合蛋白。在所述质粒的编 码蛋白酶和逆转录酶基因的核酸序列中引入点突变,其使得逆转录酶,蛋 白酶,和整合酶蛋白没有功能。在施用引发组合物后,给组3的兔子施用 一剂量的VRC-HIVADV014-00-VP(1×1011pu)。将组3动物于大小相同的 安慰剂组(组4)进行比较。

免疫后,通过ELISA测定法评估体液免疫应答。具体地,将在全国 健康研究所疫苗研究中心(Vaccine Research Center,National Institutes of Health(Bethesda,MD))(VRC)生产的质粒(即,质粒号5304,2801和5308), 其分别编码HIV-EnvA、B和C,在293细胞中表达,并且纯化主要的蛋 白产物。将最优化浓度的重组抗原在微量滴定板上包被,并且在4℃放置 过夜。洗涤微量滴定板,并且用20%FBS/1%BSA缓冲的溶液封闭和温 育。对兔血清的两个孔的连续稀释物进行温育,接着加入生物素标记的山 羊和兔,链霉抗生物素蛋白-HRPO和TMB底物。终止显色,并且在30 分钟内将平板在450nm读数,所报告的结果基于两个孔的平均值。

来自组1兔的全部血清样品,和对于组2的预先采血,全部都表现出 低的处于自然状态的光学密度(OD),在1:100和1:1000稀释时,具有 0.159±0.105的平均OD±标准偏差(n=480)。来自组2兔的全部样品在施 用后第24天在1:1000的血清稀释物表现出抗体产生的迹象。具体地,对 于所有抗原的处于自然状态的光学密度大于0.21,平均OD±标准偏差为 2.71±1.07(n=160)。组2中所有的兔子都表现出对于HIV-ENV-A,ENV-B, ENV-C和GAG可检测的抗体浓度。

来自组3的兔子的全部样品,和组4动物的预先采血,都表现出低的 处于自然状态光学密度(OD),平均预接种OD±标准偏差为0.099±0.065(组 3,n=160个样品),和0.129±0.138(组4,n=160个样品)。另外,对于组4 的兔子接种后的所有抗原,存在非常高的OD值。尽管组4中的一些兔子 表现出更高的预接种OD值,在第108天观察到升高的OD值(OD =3.529±0.812),其为诱导的免疫应答的指示。

本实施例证明本发明方法在哺乳动物中诱导针对HIV的免疫应答的 能力。

实施例7

本实施例例证单独或者作为DNA致敏/腺病毒增强方案的一部分施 用的腺病毒载体组合物在哺乳动物中的免疫原性。

将杂交繁殖的成年恒河猴(Macaca mulatta)肌内注射编码 SIVmac239Gag/Pol和HIV-1Env蛋白(单一的或多分化体)(1×1012pu 或3.3×1011pu)(VRC/NIH,Bethesda,MD)的腺病毒载体,其为单独地,或 者与研究级的SIVmac239Gag/Pol-nef质粒和单一的或多分化体HIV-1 Env质粒(VRC/NIH,Bethesda,MD)的混合物组合。在每种情形中,将疫苗 物质在无菌盐水中混合到一起,并且应用3号Biojector注射器(Bioject)作 为两次0.5mL注射运送到四头肌肌肉。对于腺病毒载体单独使用而言, 在第0,8和26周免疫动物。对于DNA/腺病毒载体致敏-增强方案,对猴 子在第0,4,8周施用质粒,在第26周施用腺病毒载体。对猴子,在免 疫后90周每隔2-4周采血。

应用ELISPOT测定法来检测针对多病毒抗原的疫苗激发的T细胞免 疫应答的出现。应用重叠跨越SIV Gag蛋白的11个氨基酸的15个氨基酸 肽的库,重叠跨越HIV-1Env89.6P蛋白(异源分化体B Env)的10个氨 基酸的20个氨基酸肽的库,和Mamu-A*01限制性CTL表位肽p11c,p41a 和p68a,对每只动物进行单独测定。将96孔多筛选平板用100μL/孔的在 没有内毒素的Dulbecco′s PBS(D-PBS)中的5μg/mL抗人IFN-γ(B27;BD Pharmingen)包被过夜。然后,将平板用含有0.25%吐温-20的D-PBS (D-PBS/吐温)洗涤3次,在37℃用含有5%FBS的D-PBS封闭2小时,用 D-PBS/吐温洗涤3次,用含有10%FBS的RPMI1640漂洗,以去除吐温 -20,并且与肽库和2×105PBMC以100μL反应体积三次实验进行温育。 在37℃温育18小时后,接着将平板用D-PBS/吐温洗涤9次,并用蒸馏水 洗涤1次。然后,将平板与2μg/mL生物素酰化的兔抗人IFN-γ(Biosource) 在室温温育2小时,用Coulter Wash(Beckman-Coulter)洗涤6次,并且用 1:500的链霉抗生物素蛋白-AP(Southem Biotechnology)稀释物温育2.5小 时。用Coulter Wash洗涤5次和用PBS洗涤1次后,接着将平板用 NBT/BCIP色素原(Pierce)显色,通过用自来水洗涤而终止,空气干燥,并 且应用ELISPOT读取仪(Hitech Instruments)读取。计算每106PBMC的斑 点形成细胞(SFC)。介质背景一直表现出每106PBMC少于15个斑点形成 细胞。

在单一腺病毒载体免疫后,接着在两种猴子中检测针对Gag和Env 肽库的应答。免疫后4周,对于猴子Aw13和AV83,每106PBMC的斑 点形成细胞(SFC)总数分别为2,560和2,160。尽管在第8周第二次腺病毒 载体免疫后,猴子AV83产生增强的Gag和Env特异性细胞免疫应答,在 猴子Aw13的应答中没有观察到变化。在第26周,没有猴子表现出针对 第三次腺病毒载体免疫的增强的应答。在猴子Aw13和AV83中,从免疫 后第52周,针对这些编码抗原的疫苗的细胞应答保持持久的。

在用DNA致敏/腺病毒载体增强方案免疫后,还通过合并的(pooled) 肽ELISPOT测定法分析针对编码抗原的Gag和Env载体的细胞免疫应答。 在第26周腺病毒载体增强之后,与只用DNA接种相比,在猴子Aw2P 和Aw28中,针对Gag和Env肽库的细胞免疫应答增强了5-6倍更高。在 第30周,即,免疫后4周,对于猴子Aw2P和Aw28,每106PBMCs的 SFC总数分别为7010和7805。在猴子Aw2P和Aw28中,从免疫后第58 周,针对这些编码抗原的载体的细胞应答保持持久,测定每106PBMC有 4265和3000个SFC。

为了评估抗原特异性CD4+和CD8+T淋巴细胞在由所述腺病毒载体 构建体激发的细胞免疫中的作用,在第28周,最后一次腺病毒载体免疫 之后2周,应用未分化和耗尽CD8+T淋巴细胞的PBL进行肽ELISPOT 检测。尽管应用全部的PBL测定针对Gag和Env肽库的有效的细胞免疫 应答,但是,当CD8+T淋巴细胞被从PBL群体中去除时,这些应答基本 上减少了,这证明用腺病毒载体免疫激发主要由CD8+T淋巴细胞介导的 有效的细胞免疫应答。

应用直接的酶联免疫吸附测定(ELISA)来测定抗gp120(HIV-MN)和 抗p27SIVmac239抗体的血浆滴度(参见,例如,VanCott等.,J Virol.,73(6), 4640-50(1999))。在腺病毒载体免疫后,两种猴子具有可证明的针对gp140 89.6包膜蛋白的抗体滴度(通过ELISA测定)。在所有4种免疫的动物中 还测定强同源性中和抗体滴度,但是在DNA致敏/腺病毒增强的动物中的 应答的数量级比只用腺病毒载体接种后观察到的应答数量级高出几倍。

应用基于中和检测的流程来测定血浆介导的病毒中和。将血浆样品热 灭活,以耗尽互补蛋白,并且在1:5稀释时检测。通过与第0周免疫前血 浆比较,计算第28周和第32周介导的中和百分比(参见,例如,Mascola 等.,J.Virol.,76(10),4810-21(2002))。也证明了针对HIV-189.8包膜抗原的 中和抗体。在DNA致敏/腺病毒载体增强接种的动物中的中和抗体应答的 数量级更高于在腺病毒载体接种的动物中的数量级。

这些结果表明,当单独施用时,所述腺病毒载体组合物可以在哺乳动 物中激发免疫应答,并且证明,当腺病毒载体组合物用作哺乳动物中DNA 致敏/腺病毒增强方案的一部分时,所述免疫应答可以被增强。

实施例8

本实施例例证本发明方法诱导针对在腺病毒载体组合物或引发组合 物中不存在的HIV抗原的保护性的免疫的应用。

将24只杂交的成年印度源性恒河猴(Macaca mulatta)肌内注射表达 SIVmac239Gag/Pol DNA,HIV-189.6P Env DNA(VRC/NIH,Bethesda, MD),或HXB2/Bal Env DNA的DNA构建体,接着增强施用重组腺病毒 载体。由于不稳定性,研究等级的腺病毒载体被构建成不具有Nef(参见 Letvin等.,Journal of Virology,印刷中)。

在每种情形中,将疫苗构建体在无菌盐水中混合在一起,并且应用3 号Biojector注射器(Bioject),以两次0.5mL注射运送到四头肌肌肉。对 于DNA/腺病毒载体致敏-增强方案,在第0,4,8周发生DNA免疫,和 在第26周发生腺病毒载体免疫(1×1012pu)。从免疫后第90周,每隔2-4 周对猴子采血。对下列4个实验组进行检测:(1)对照,(2)不具有Env 的Gag/Pol/Nef DNA和Gag/Pol腺病毒载体(mock),(3)具有SHIV-89.6P Env的Gag/Pol/Nef DNA和Gag/Pol腺病毒载体,或(4)具有HXB2/Bal Env的Gag/Pol/NefDNA和Gag/Pol腺病毒载体。

在第38周,即,腺病毒载体增强后12周,将所有的猴子用猴子感染 剂量50(MID50)SHIV-89.6P静脉内攻击。在免疫和攻击后每隔2-4周对 猴子进行采血。

在体外暴露于跨越SIVmac Gag/Pol/Nef和HIV-1Env蛋白的肽库后, 对于针对干扰素γELISPOT应答,对新鲜分离的外周血单核细胞(PBMC) 进行评估。应用与Env免疫原相匹配的肽,评估所有Env-特异性应答。 检测系统在Letvin等,如前所述中描述。

来自所有接受实验性免疫原的猴子的PBMCs的ELISPOT应答是强 烈的。在所有组的接种猴子中,产生了针对SIV Gag,Pol和Nef的细胞 免疫,以及在接受这些各自的免疫原的猴子中产生了针对HIV-189.6P和 HXB2/Bal Env的细胞免疫。在不匹配的Env组中,在最后一次质粒DNA 接种后2周,针对所有的病毒蛋白的平均总的疫苗激发的ELISPOT应答 为1,588±554平均标准误差(SEM)个斑点形成细胞(SFC)。用重组腺病 毒载体增强后2周,存在比仅由DNA致敏激发的细胞免疫高出>2.5倍的 增强。

在第38周,用猴子感染剂量50(MID50)SHIV-89.6P攻击后,在所有 的对照中观察到极度的CD4+T淋巴细胞损失,尽管在所有接种动物中观 察到所述CD4+T淋巴细胞损耗的本质上的减弱。在除SIV Gag/Pol-Nef 外接受HIV-1Env的猴子中,这种减弱是最显著的,这证明针对CD4+T 淋巴细胞损失的统计学显著保护由在疫苗中包含Env补体(component)提 供。重要地,接受不匹配Env免疫原的猴子表现出与那些注射了匹配免疫 原的猴子相当的保护。接受SIV Gag/Pol/Nef+不匹配Env免疫原的猴子组 还证明病毒的更好的防范,由减少的病毒负荷所指示。

这些结果表明,所述腺病毒载体组合物可以用于在哺乳动物中激发针 对HIV的免疫应答。

实施例9

本实施例例证由作为DNA致敏/重组腺病毒增强方案的一部分施用 的腺病毒载体组合物在哺乳动物中激发细胞免疫应答。

将杂交成年恒河猴(Macaca mulatta)肌内注射编码SIV Gag/Pol/Nef 蛋白和多分化体A,B和C HIV-1Env蛋白的GLP等级质粒DNA载体的 混合物,其包含在称为VRC-HIVDNA009-00-VP的组合物中。编码SIVmac 239Gag/Pol的腺病毒载体和编码HIV-1分化体A,B和C Env的腺病毒载 体用来增强。

在每种情形中,将质粒或腺病毒载体在无菌盐水中混合在一起,并且 应用3号Biojector注射器(Bioject),以两次0.5mL注射运送到四头肌肌 肉。在第0,4和8周,用质粒DNA免疫动物,并且在第26周,用腺病 毒载体免疫。从第42周,每隔2-4周对动物进行采血。具体的致敏和增 强免疫分别在表2和3中列出。

表2

 组动物数目SIV Gag/Pol/Nef质粒HIV-1Env质粒Sham质粒164.5mg4.5mg(分化体B)-264.5mg4.5mg(分化体C)-3 6 4.5mg 1.5mg(分化体A) 1.5mg(分化体B) 1.5mg(分化体C)- 464.5mg1.5mg(分化体B)3.0mg56--9.0mg

表3

 组 动物 数目SIV Gag/Pol腺病毒 载体(pu)HIV-1Env腺病毒载体 (pu)Sham腺病 毒载体161.0×10121.0×1012(分化体B)-261.0×10121.0×1012(分化体C)-3 6 1.0×10123.3×1011(分化体A) 3.3×1011(分化体B) 3.3×1011(分化体C)- 461.0×10123.3×1011(分化体B)6.6×1011562.0×1012

应用ELISPOT测定法来监测针对多病毒抗原的疫苗激发的T细胞免 疫应答的出现。应用重叠跨越SIV Gag,SIV Pol,SIV Nef,HIV-1Env分 化体A,HIV-1Env分化体B,和HIV-1Env分化体C蛋白的11个氨基酸 的15个氨基酸肽的库,所述肽库与由腺病毒载体编码的免疫原序列相匹 配,对每只动物进行单独的检测。还应用重叠跨越HIV-1Env89.6P的10 个氨基酸的20个氨基酸肽的库,其为与所述腺病毒载体编码的免疫原异 源的分化体B Env序列,进行检测。将96孔多筛选平板用100μL/孔的在 没有内毒素的Dulbecco′s PBS(D-PBS)中的5μg/mL抗人IFN-γ(B27;BD Pharmingen)包被过夜。然后,将平板用含有0.25%吐温-20的D-PBS (D-PBS/吐温)洗涤3次,在37℃用含有5%FBS的D-PBS封闭2小时,用 D-PBS/吐温洗涤3次,用含有10%FBS的RPMI1640漂洗,以去除吐温 -20,并且与肽库和2×105PBMC以100μL反应体积三次实验进行温育。 在37℃温育18小时后,接着将平板用D-PBS/吐温洗涤9次,并用蒸馏水 洗涤1次。

然后,将平板与2g/mL生物素酰化的兔抗人IFN-γ(Biosource)在室温 温育2小时,用Coulter Wash(Beckman-Coulter)洗涤6次,并且用1:500 的链霉抗生物素蛋白-AP(Southem Biotechnology)稀释物温育2.5小时。用 Coulter Wash洗涤5次和用PBS洗涤1次后,接着将平板用NBT/BCIP色 素原(Pierce)显色,通过用自来水洗涤而终止,空气干燥,并且应用 ELISPOT读取仪(Hitech Instruments)读取。计算每106PBMC的斑点形成 细胞(SFC)。介质背景一直少于每106PBMC15个斑点形成细胞。

由单一分化体Env免疫激发的细胞免疫应答的交叉分化体反应性的 程度通过评估组1(高分化体B Env)和组2(高分化体C Env)中的应答 进行研究。对于DNA致敏免疫,猴子接受4.5mg Gag/Pol/Nef质粒和4.5 mg来自分化体B(组1)或分化体C(组2)的Env质粒。应用来自Env 分化体A,Env分化体B,Env分化体C,和Env89.6P(异源分化体B Env) 的肽库,通过合并的肽ELISPOT检测,对Env特异性细胞免疫应答检测 PBMCs。组1中接受Env分化体B质粒的猴子产生针对所有Env肽库的 应答,这证明交叉分化体反应性的程度。然而,分化体B肽应答更高于 分化体A或分化体C应答。在用1.0×1012pu Gag/Pol和1.0×1012pu分 化体B Env腺病毒载体增强免疫后,组1中猴子的DNA致敏的细胞免疫 应答被显著地增强。尽管在腺病毒载体增强免疫之后,从这些猴子中观察 到针对所有的Env肽库的应答,所有6只动物证明针对分化体B Env最高 的应答。

相似地,组2中接受Env质粒和来自分化体C的腺病毒载体的猴子 产生针对所有Env肽库的应答。在DNA致敏免疫和腺病毒载体增强之后, 在所有6只动物中,分化体C应答更高于分化体A或分化体B应答。这 些数据证明DNA致敏/腺病毒载体增强免疫同单一分化体Env免疫原一起 激发具有部分交叉分化体反应性的Env特异性细胞免疫应答,但是最高的 应答一般是针对与所述免疫原相匹配的Env分化体。

组4中猴子的Env-特异性免疫应答(低分化体B Env)与组1中猴子 的应答(高分化体B Env)相当。组4中猴子接受4.5mg Gag/Pol/Nef质 粒与1.5mg来自分化体B的Env质粒,以用于DNA致敏免疫,以及1.0 ×1012pu Gag/Pol腺病毒载体与3.3×1011PU分化体B Env腺病毒载体, 以用于增强免疫。这些观察表明,将单一Env质粒或腺病毒载体的剂量降 低3倍不会导致免疫原性的主要减少。在仅接受假(sham)质粒和腺病毒 载体的组5中的猴子中观察到最低的背景应答。

通过评估组3(分化体A+B+C Env)的应答,对由多分化体Env免 疫激发的细胞免疫应答的幅度和数量级进行研究。对于DNA致敏免疫, 这些猴子接受4.5mg Gag/Pol/Nef质粒与1.5mg的来自分化体A,B和C 的每种Env质粒(总共4.5mg Env质粒)。观察到针对Env分化体A,B 和C的相似数量级和宽度的细胞免疫应答。这些数据证明,在组3中,3 种Env质粒的混合物导致增强的幅度,而没有失去应答的数量级,尽管在 组3中每种Env质粒成分以1.5mg的剂量给予,而不是4.5mg的剂量的 事实。在用1.0×1012pu Gag/Pol腺病毒载体和3.3×1011pu的每种分化体 A,B和C的Env腺病毒载体增强免疫之后,所有的六只猴子表现出针对 分化体A,B和C Env肽库相似数量级的应答。这些数据证明,在组3中 每个个体分化体特异性应答的数量级与在组1和2中激发的最佳分化体特 异性应答相当。

在紧接着DNA免疫和紧接着腺病毒载体增强后,在所有接种的猴子 中观察到针对SIV Gag和Pol的细胞免疫应答。接受4种成分多分化体疫 苗产物的猴子(组3)激发与在接受单一分化体Env免疫原的猴子中所观 察到的相似数量级的针对SIV Gag和SIV Pol的细胞免疫应答。因此,当 与单一分化体疫苗(组1,2和4)相比较时,所述4种成分多分化体疫 苗(组3)导致针对所有疫苗编码的抗原更广泛的应答,而不失去免疫原 性。而且,在DNA致敏和腺病毒载体增强免疫之后,发现针对这些抗原 的细胞免疫应答是持久的。

在紧接着腺病毒载体增强免疫之后,通过评估猴子的Env-特异性抗 体滴度,对由单一分化体和多分化体Env免疫激发的体液免疫应答进行研 究。检测血浆样品Env分化体A,分化体B,或分化体C特异性抗体结 合活性,如通过ELISA测定。

对于第10周(DNA后)和第40周(腺病毒载体后),确定终点滴度 作为最后的稀释,预先免疫校正的光学密度(OD)大于0.2。将孔用37.5ng 纯化的Env抗原在4℃包被过夜。洗涤平板,并且在37℃封闭 (20%FBS/1%BSA缓冲溶液)1小时。将两个相同的孔的连续稀释的血 清在37℃温育2小时后,用生物素标记的山羊抗猴(1小时37℃),链霉 抗生物素-HRPO(30分钟,室温(RT)),和TMB底物(30分钟,RT)温 育。颜色反应通过添加硫酸而终止,并且在30分钟内在450nm对平板进 行读数,基于两个相同的孔的平均值报告结果。

组1(高分化体B Env)中的猴子产生能够结合所有3种Env抗原的 抗体应答,这证明交叉分化体反应的程度。尽管测量到针对分化体B和C Env抗原的强有力的应答,但是检测到针对同源分化体B Env的最高的抗 体滴度。组4(低分化体B Env)中的猴子展现出Env-特异性抗体滴度, 其在幅度和数量级上与在组1中猴子测定的那些相似,这证明将Env免疫 原的剂量减少3倍不会导致减少的免疫原性。类似地,组2(高分化体C Env)中的猴子激发能够识别所有3种Env抗原的抗体应答,但是检测到 针对同源分化体C Env的最高滴度。然而,用分化体A,分化体B,和分 化体C Env抗原的混合物免疫的猴子(组3)表现出针对所有3种Env抗 原的高数量级抗体滴度。

这些数据表明,当与单一分化体Env免疫激发的应答相比较时,多分 化体Env免疫导致增强幅度的体液免疫应答,而没有损失免疫原性。

实施例10

本实施例例证,在哺乳动物中由作为DNA致敏/重组腺病毒增强方案 的部分施用的腺病毒载体组合物激发的细胞和体液免疫应答。

将杂交的成年猕猴(Cynomolgus macaques)肌内注射疫苗质粒或腺 病 毒 载 体 构 建 体 的 混 合 物。具 体 地,包 含 在 组 合 物 VRC-HIVDNA009-00-VP(实施例8)中的表达Gag/Pol/Nef蛋白和多分化 体A,B和C HIV-1Env蛋白的GLP质粒DNA被用为致敏免疫。将GMP 等级的VRC-HIVADV014-00-VP(实施例1)用作腺病毒载体增强。

为了在动物研究中获得对于3次预定的注射所需要的体积,制备了3 批配制的物质。将3个批次在50mL圆锥管中组合。在将所述管倒置几次 混合之后,将15.6-15.7mL的混合物等分到3个50mL圆锥管中的每一个。 将管子标记,并且在-20℃保存直至分发。

在第0,4和8周,通过Biojector肌内(i.m.)运送8mg DNA组合物, 并且在第38周,通过针头和注射器i.m.运送1011pu完全腺病毒载体疫苗 构建体。从第42周,每2-4周对动物进行采血。

应用ELISPOT测定来监测疫苗激发的针对多病毒抗原的T细胞免疫 应答的出现,如在实施例8中所描述的那样。应用直接的ELISA来测定 Env分化体A,分化体B和分化体C抗体的血浆滴度,如在实施例8中 所描述的那样。

在DNA致敏免疫后和腺病毒载体增强后,在所有6只动物中,接受 DNA质粒疫苗致敏和腺病毒载体增强的猴子产生针对分化体A,B和C Env肽库的应答。6只动物中有5只发展了针对所有3种包膜抗原(分化 体A,B和C)的抗体应答。一只动物发展了只针对分化体A和C包膜 的体液免疫应答。在腺病毒增强后,所有6只猴子都具有强Env抗体应答。

这些数据证明,所述临床DNA致敏/腺病毒载体产物是免疫原性的, 并且诱导针对分化体A,B,C Env以及Gag和Pol的细胞免疫应答,和针 对分化体A,B和C Env以及Gag的抗体应答。腺病毒载体增强将免疫应 答增加了几倍。

实施例11

本实施例例证,在猕猴(Cynomolgus monkeys)中由重组腺病毒增强 免疫激发的细胞免疫应答。将6只猕猴(cynomolgus macaques,毛里求斯 起源)用1×1011pu剂量的腺病毒载体组合物VRC-HIVADV014-00-VP(实 施例1)肌内免疫一次。应用针头和注射器,将所述组合物作为两次0.5mL 注射运送到四头肌。从免疫后第4周,每2-4周对猴子进行采血。应用 ELISPOT检测来监测疫苗激发的针对多病毒抗原的T细胞免疫应答的出 现,如在实施例8中所描述的那样。

在所有6只动物中,接受腺病毒载体的猴子产生针对分化体A,B和 C Env肽库的应答。这些数据证明,所述临床腺病毒载体产物是免疫原性 的,并且诱导针对分化体A,B,C Env以及Gag和Pol的细胞免疫应答。

在预免疫(第-1周),第0周(第1次免疫),和第1,2,3,4,5和8 周时间点,在通过盐酸氯胺酮化学麻醉后,由实验室动物医学(Laboratory Animal Medicine)认证的兽医临床评估所述动物。在第-1,3和5周确定 血清化学和全血计数。发现受试动物在所有评估的时间点是健康的并且处 于极好的状态。身体检查包括听诊、触诊以及体温、脉搏和呼吸的确定。 体温、脉搏和呼吸在正常界限之内。在第1和第5周,分别在两只猴子(CO 7422和CO7414)中检测到豌豆大小的腹股沟淋巴结,位于接种的身体同 侧。对于所有的动物,白细胞计数和血细胞比容值一般在正常界限之内, 并且在免疫之前和之后时间点具有最小的变化。血清电解质,血尿氮和肌 酸酐也在正常界限之内。

在预先免疫的血清中以及在免疫时,所有的动物具有正常界限的天冬 氨酸转氨酶/谷草转氨酶(AST/GOT),碱性磷酸酶,和完全的bilbubin水平。 动物CO7412具有97U/L(正常范围0-138U/L)的预免疫丙氨酸转氨酶 /谷丙转氨酶(ALT/GPT)。在免疫后,ALT稍微上升(在3周时177U/L, 在5周时166U/L),但是在免疫后8周处于正常界限之内(136U/L)。在动 物CO7423和CO7420中,在第5周,酶肌酸酐激酶和乳酸脱氢酶最低 限度地增加,其最可能代表氯胺酮诱导的肌肉损伤。在第8周,所述值恢 复正常。

这些数据证明,本发明的方法在猕猴(cynomolgus macaques)中激发 针对所有病毒抗原的有力的和广泛的细胞免疫应答。

实施例12

本实施例例证施用给哺乳动物的腺病毒载体组合物的安全性。

将雌性和雄性新西兰白兔通过肌内注射施用DNA致敏构建体 (VRC-HIVDNA009-00-VP)和腺病毒载体构建体VRC-HIVADV014-00-VP 作 为 增 强,或 者 单 独 施 用 VRC-HIVADV014-00-VP。 VRC-HIVADV014-00-VP如在实施例1中所描述那样生产。

对于DNA致敏/腺病毒增强方法,使用Biojector 2000 Needle-Free Injection Management SystemTM(Bioject),将4mg VRC-HIVDNA009-00-VP或PBS对照(第1,22研究日)通过每天两次 肌内注射给药至大腿肌肉(0.5mL/注射位点;对于每次注射的剂量体积 不因体重调节)(两次注射间隔大约1英寸)。对于每个时间点在交替侧实 施注射。在剃毛/标记位点施行每次注射。为了显现注射位点,将所述位 点按照需要重新剃毛和重新标记。

对于DNA致敏/腺病毒增强研究和仅包括所述腺病毒载体的研究,用 针头和注射器,每天进行两次0.5mL注射将VRC-HIVADV014-00-VP(1 ×1011pu)或者稀释液对照(VRC-DILUENT013-DIL-VP)注射至后大腿肌 肉。每次注射在剃毛/标记位点施行。为了显现注射位点,将所述位点按 照需要重新剃毛和重新标记。

将动物随机地分成处理组。处理期间为22天,并且研究持续时间为 36天。对于每个时间点,在交替侧施行注射。对于DNA和腺病毒载体剂 量和它们各自的对照,不论体重,施用1.0mL。

在第一剂量施用前,将血样(大约2mL)从所有的动物分离。将所 述样品进行血液学、化学、凝固和免疫学分析。分离血清并且在-75℃± 10℃保存,以用于在干冰上转移。对这些样品的一些或全部进行抗体产生 分析,作为暴露于所测试的物品的指示。

终期血液收集之后,将所有的动物通过戊巴比妥钠或者等价物注射无 痛处死并且放血。将动物尽可能接近处死时刻进行尸体剖检。在兽医病理 学者的监督下,进行预定的尸体剖检。

对所有要求的动物进行完全的总尸体剖检,其包括检验身体的外表 面,注射/处理位点,所有的孔,以及头颅的、胸的、和腹腔及其内容物。 从每只动物的胸骨制备2张骨髓涂片。将载波片空气干燥,在甲醇中固定, 并且存档,以用于可能的将来评估。在预定的尸体剖检时,尽可能迅速地 将来自所有要求动物的下述器官(性别适当的)称重:肾上腺,心脏,肺, 脑,脾,肾,肝(带有排干的胆囊),睾丸/卵巢,垂体,胸腺,子宫,和 甲状腺/甲状旁腺。成对的器官一起称重。

将来自每只尸体剖检的动物的所有组织保存在10%中性缓冲福尔马 林(NBF)中。将所述组织包埋在石蜡中,切片,用苏木精和伊红染色, 由委员会认证的兽医病理学者进行显微镜检验。分析来自每只动物和来自 总损伤(来自所有的组)的组织。

应用用于常态的Kolmogorov-Smimov检验,用于相同变量的Levene 中值检验(Levene Median test),以及通过一步变量分析(Analysis of Variance,ANOVA),分析定量结果。如果所述常态或相同变量检验失败 了,那么所述分析应用关于排列变换数据的非参量Kruskal-Wallis ANOVA 进行。对于参量数据,如果ANOVA显示出在实验组之间的统计学显著性, 那么应用Dunnett′s t-检验来描绘哪组(如果有一些的话)与对照不同。对 于非参量数据,如果ANOVA显示出在实验组之间的统计学显著性,那么 应用Dunn′s检验来描绘哪组(如果有一些的话)与对照不同。对于所有 的检验,将小于0.05(双尾,two-tailed)的概率值用作显著性的临界水平。 统计学分析应用SigmaStatTM统计学软件(SigmaStatTMStatistical Software, Jandel Scientific,San Rafael,CA)。

对于包括仅施用VRC-HIVADV014-00-VP的免疫方法,所有的动物存 活到预定的界限,并且在下述参量中没有注意到与处理相关的作用:死亡 率,临床和笼边观察,Draiz观察,体重,眼科学,临床病理学,和器官 重量(除了增加的脾重,其可能是暴露于免疫刺激剂的预期结果)或器官 重量比例。在第一次注射后24小时,在处理的动物中存在上升的体温。 在每次注射后24-48小时期间,在处理的动物中还存在下降的食物消耗。 在处理的动物中,在注射位点观察到暂时的炎症,所述炎症是在坐骨神经 和临近淋巴和毛细血管周围的结缔组织中的可康复的、慢性炎症。在SD3 时胆固醇和三酰甘油水平的暂时增加与临床症状或病理不相关,并且在 SD24时CPK的暂时增加可能与肌肉炎症相关。

对于DNA致敏/腺病毒载体增强方法,观察到在注射位点(由Draize 得分和组织病理学观察到)和坐骨神经周围的围神经组织(仅由组织病理 学观察到)的可康复的炎症。另外,在紧随起始后24小时在免疫的兔子 中和在紧随第二腺病毒载体增强后3小时在免疫的雌兔中注意到发热。在 每次接种之后的24-48小时食物消耗也减少了,尽管这解决了并且没有影 响体重或者在雄性中的体重增加。然而,与对照雌性相比较,处理的雌性 没有减少的体重和体重增加,所述对照雌性在SD71后(体重)和在初始 腺病毒载体增强后(体重增加)变得统计学显著,但是这早在SD36(在 DNA致敏系列期间)开始观察到。

本实施例证明本发明的方法在兔子中诱导最小限度的毒性。

实施例13

本实施例例证将腺病毒载体组合物施用给人。

在以1×109pu,1×1010pu,或1×1011pu的剂量单一注射 VRC-HIVADV014-00-VP之后,开始随机化的、安慰剂对照的、双盲的、 剂量增加的研究,以检验在人体中的安全性,耐受性和免疫应答。每个治 疗组包括12名受试者(10名疫苗;2名安慰剂)。本研究起始于2004年 7月19日,并且本研究于2004年11月10日完成36名受试者的登记。 NIAID内部数据和安全性监测委员会(NIAID Intramural Data and Safety Monitoring Board(DSMB))从每次剂量增加之前的14天随访检查了初步 的安全性数据。所述初步的数据表明,VRC-HIVADV014-00-VP对于健康 的受试者在所评估的3剂量水平上似乎是安全的。与1×1011pu剂量水平 相比,1×109pu和1×1010pu剂量水平与更少的反应原性相关。在1×109pu和1×1010pu剂量组中,记录在5日日志卡片上的局部和全身性症状在 严重性上是从无到轻微,并且没有受试者经历过发热。在1×1011pu剂量 组中,4名受试者在第1天报告了发热(在严重性上3名轻微和1名中度)。 在第1天,发热的4名受试者每一名还报告了中度头痛,并且这些受试者 的3名还报告了至少一项其它的中度全身性参量(例如,不适,肌痛,和 寒战)。2名没有发热的受试者报告了至少一项中度全身性症状(例如, 不适,肌痛,和恶心)。1×1011pu剂量组中的一名受试者报告了中度注射 位点疼痛;否则,注射位点反应原性没有或者是轻微的。

到2005年1月31日,存在一个4级(潜在地威胁生命)事件。存在 三个可能与接种相关的2级(中度的)不利事件。本研究关于疫苗对安慰 剂注射分配都是不知情的。4级不利事件是在1×1011pu剂量组中的健康 受试者中研究注射后64天发生的一次发作,所述健康受试者在参与研究 前3年有过一次发作的历史。假定在先发作历史和在研究注射后大于2个 月的事件时间选择,看起来所述发作不可能与研究药剂相关。2级不利事 件可能与研究药剂相关,其包括:(1)无症状的嗜中性白细胞减少,其在 已知在参与之前有时具有无症状的低嗜中性粒细胞计数的受试者中,在研 究注射后21天注意到,(2)腹泻(持续1天),在研究注射后第三天,在 不同的受试者中发生,和(3)脂肪肝炎(steatohepatitis,脂肪肝(fatty liver)), 其在对鉴定在临床上无症状的受试者中研究接种后25天开始注意到的持 久的1级ALT(丙氨酸转氨酶)上升的起因的广泛评估后诊断出。肝脏学 顾问医生报告一种印象,即,所述病症可能在参与研究之前就存在。对持 久的1级ALT起作用的因素可能是乙醇消耗和最近的体重增加。一般认 为脂肪肝炎的诊断是2级病症,但是到2005年1月31日,肝功能检验在 严重性上不超过1级。

尽管使用1×1011pu剂量观察到更多的反应原性,它似乎为良好耐受 的剂量,并且为了减轻短期症状,可以自行施用止痛剂/退热剂非处方药 物。正在进行一种流程特异性临时免疫原性分析(protocol-specified interim immunogenicity analysis),以比较安慰剂和3种剂量组。不知情的免疫原 性数据表明在更高剂量具有增强的免疫应答的剂量作用。在每组(研究分 配是不知情的)12名受试者(2名安慰剂和10名疫苗接受者)中,在通 过商购HIV-抗体测定的第12个研究周,具有疫苗诱导的ELISA的受试者 的数目从1×109pu组的3名增加到1×1010pu组的6名,和1×1011pu 组的9名。所述反应原性数据总结在下述表4中。

表4

 反应原性 109pu或安慰剂 (N=12)1010pu或安慰剂 (N=12)1011pu或安慰剂 (N=12)局部症状无9(75%)3(25%)2(16.7%)轻微3(25%)9(75%)9(75.0%)中度001(8.3%)严重000

 全身性症状无10(83.3%)4(33.3%)3(25%)轻微2(16.7%)8(66.7%)3(25%)中度006(50%)严重000

这些结果表明,本发明的方法在人体中是良好耐受的。

实施例14

本实施例例证将VRC-HIVADV014-00-VP施用给人。

在 未 感 染 的 成 年 受 试 者 中 腺 病 毒 载 体 组 合 物 VRC-HIVADV014-00-VP作为单一药剂第二次I期研究目前正在进行中。 这种不知情的、剂量增加研究设计成招募2组24名具有低Ad5抗体滴度 (<1:12)的受试者,其将以5:1的比例随机化接受VRC-HIVADV014-00-VP 或安慰剂。疫苗的第一组将接受1×1010pu VRC-HIVADV014-00-VP,和 第二组将接受1×1011pu VRC-HIVADV014-00-VP。

实施例15

本实施例例证将VRC-HIVADV014-00-VP作为在用DNA分子免疫后 的增强剂施用给人。

已经开始I期、不知情的、安慰剂对照的研究,其给完成 VRC-HIVDNA009-00-VP DNA注射方案的参与者提供1×1010pu VRC-HIVADV014-00-VP的单一腺病毒载体增强(或安慰剂)。所述腺病 毒载体疫苗增强将在用VRC-HIVDNA009-00-VP(或安慰剂注射)初始 DNA接种后6-9个月的时间间隔给予。第一名参与者在2004年11月22 日参与。到2004年12月21日,11名参与者已经接受了他们的增强注射。 这些参与者中,6名经受了在注射位点的轻微疼痛和/或触痛。不存在局部 反应原性事件的其它报告。5名参与者报告了轻微或中度全身性症状,包 括头痛,不适和恶心。不存在发热报告,没有3级事件,并且没有严重的 不利事件。

这些结果表明,本发明的方法在人体中是良好耐受的。

本文所引用的所有的参考文献,包括出版物、专利申请、和专利, 通过相同程度的参考结合于此,好像任一参考文献单独地并且具体地表明 通过参考结合于此,并且在本文中完全阐明。

术语“一种(a,an)”和“所述(the)”和相似的指示物在描述本发明的 上下文中(特别是在下述权利要求的内上下文中)的应用解释为包括单数 和复数,除非本文另外指出或者通过上下文清楚地相互抵触。术语“包括 (comprising),”“具有(having),”“包含(including),”和“含有(containing)” 解释为开放末端术语(即,意为“包含,但不限于,”),除非另外注明。 本文数值的范围的叙述仅仅意欲作为个别提及每一个单独的落入本范围 的数值的简略方法,除非本文另外指出,并且每一个单独的数值结合在说 明书中,好像其在本文中单独叙述一样。本文所描述的所有方法可以以任 何适当的顺序实行,除非本文另外指出或者通过上下文清楚地相互抵触。 本文所提供的任一和全部实例,或者示例性语言(例如,“诸如”)的应用, 仅仅意欲更好地举例说明本发明,除非另外要求,并不形成本发明范围的 局限。说明书中没有语言应该解释为指示实践本发明的必需的任何非要求 的要素。

本文描述了本发明的优选实施方案,其包括发明人已知的对于实行本 发明的最好方式。对于本领域的那些普通技术人员,当阅读前述描述后, 这些优选实施方案的变化可以变得显而易见。本发明人期望熟练的技术人 员适当地应用这样的变化,并且,除了按照本文具体描述的那样,本发明 人打算将本发明用于实践。因此,本发明包括在本文附属的权利要求中叙 述的主题内容的按照适用的法律允许的改进和等价物。并且,本发明包括 上述要素在其所有可能的变化中的任何组合,除非本文另外指出或者另外 通过上下文清楚地相互抵触。

序列表

<110>美国政府卫生与公共服务部

     杰韦克公司

     G·J·内伯尔

     成程

     江咏培

     J·G·D·贾森

     C·R·金

 

<120>应用腺病毒载体诱导免疫应答的方法

 

<130>234892

 

<150>60/561,341

<151>2004-04-12

 

<160>7

 

<170>PatentIn version 3.3

 

<210>1

<211>5

<212>PRT

<213>人工的

 

<220>

<223>合成的

 

<400>1

 

Cys Arg Gly Asp Cys

1               5

 

<210>2

<211>9

<212>PRT

<213>人工的

 

<220>

<223>合成的

 

<220>

<221>MISC_FEATURE

<222>(2)..(2)

<223>Xaa可以是任何氨基酸

 

<220>

<221>MISC_FEATURE

<222>(8)..(8)

<223>Xaa可以是任何氨基酸

 

<400>2

 

Cys Xaa Cys Arg Gly Asp Cys Xaa Cys

1               5

 

<210>3

<211>9

<212>PRT

<213>人工的

 

<220>

<223>合成的

 

<400>3

 

Cys Asp Cys Arg Gly Asp Cys Phe Cys

1               5

 

<210>4

<211>36066

<212>DNA

<213>人工的

 

<220>

<223>合成的

 

<400>4

catcatcaat aatatacctt attttggatt gaagccaata tgataatgag ggggtggagt           60

ttgtgacgtg gcgcggggcg tgggaacggg gcgggtgacg tagtagtgtg gcggaagtgt          120

gatgttgcaa gtgtggcgga acacatgtaa gcgacggatg tggcaaaagt gacgtttttg          180

gtgtgcgccg gtgtacacag gaagtgacaa ttttcgcgcg gttttaggcg gatgttgtag          240

taaatttggg cgtaaccgag taagatttgg ccattttcgc gggaaaactg aataagagga          300

agtgaaatct gaataatttt gtgttactca tagcgcgtaa tatttgtcta gggcccggga          360

tcggtgatca ccgatccaga catgataaga tacattgatg agtttggaca aaccacaact          420

agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta          480

accattataa gctgcaataa acaagttccc ggatctttct agctagtcta gaattcctag          540

tcctcgtcct ggcggctggc cacgcagtcg tcgccggcca tctgcttgcc gtagtcgcgg          600

atgatcttgg ccttgcggcg gggcaccacc ttgatgtcgc tgttgtcctg gatcaccacg          660

gcgccctcgc ccttccacag cagcttggcg gggcccttcc acacggggtc gcggctgtcg          720

cggtagtaca cgcggaagtt ctggatcttg gtgatctgct tctgcagctc cttggtctgg          780

atgtcggtgg cgatgatgtc cacgatgcgc tcgccggcgc tgtagccgcc gatgccgccc          840

ttgcgcttga agttgtggat gaacacggcc atctgcacgg cggtcttcag gtgctcggcc          900

tggtcgcgca cctggccgat gatcttcttc agctccttgt tcatgctctc gatcacgccc          960

tggctctggg ggttgtaggg gatgccgaac tcctgcttga tgccggccca ccagcaggcg         1020

gccttcacgg tggtgctggt gaagttgctg ccgttgtcgg tgtgcacggt cttcacgggc         1080

cagcggccgg ccagcttcag caggaagtag gcggtctcct ggccggtctc ggcggggatc         1140

acctcggcct cgatgtagcc gctggccacg tgcacggcca ccaggatcac cttgccctcc         1200

aggtgggtgc agtccagctg ccagatgccg gggctgcagt ccacctggcc gtgcatggcc         1260

tcgcccttca gctggcactt gtcgcagctg gccacgatct ccttggccac cacggggggc          1320

aggttgaagt cgctggccat ggcgcgccag ttgctgtggt acttctcgtg ctcctcctgg          1380

gccttgtcga tgccgtccag gaacagcacc ttgcggatgc cggcgctcac caggccgtcc          1440

acctgctcgt tgccgccgat gcccttgtgg gcgggcaccc aggccaggta caccttctcc          1500

ttcttgatca gctgctcgat gatctggctc accagctcgc tctcgctctt gtcgggctgg          1560

gcctggatga tgcccagggc gtactggctg tcggtcacga tgttcacctc caggccgctg          1620

tcctgcaggg ccaggtggat ggcctgcagc tcggtcttct ggttggtggt gtcggtcagg          1680

ggcaccacct tctggcggcc gcggtcggtc acgtagccgg ccttgcccag cttggtctcg          1740

cggttggcgg cgccgtccac gtagaaggtc tcggcgccga tgatgggctc cttctccagc          1800

tggtaccaca gcttcaccag ggggggggtg ttcacgaact cccactcggg gatccaggtg          1860

gcctgccagt actcggtcca ccaggcctcc caggtctcct tctggatggg cagcttgaac          1920

ttgggggtct tgccccagat cacgatgctc tcggtggcga tcttctgcac ggcctcggtc          1980

agctgcttca cgtcgttggt gtgggcgccc ttcatgcggg cgtacttgcc ggtcttcagg          2040

ttcttgaagg gctcctggta gatctggtag gtccactggc cctggccctg cttctggatc          2100

tcggcgatca ggtccttgct ggggtcgtag tacacgccgt gcacgggctc cttcaggatc          2160

tcgcggttct cggccagctc cagctcggcc tcctcggtca ggggcaccac ctcggtcagg          2220

gccttggtgc cgcgcagcag cttgcacagc tggcgcacct tgatgccggc gtagatctgg          2280

ctggcccagt tcagcttgcc caccagcttc tggatgtcgt tcacggtcca gctgtccttc          2340

tcgggcagca cgatgggctg cacggtccac ttgtcggggt gcagctcgta gcccatccac          2400

aggaaggggg gctccttctg gtgcttcttg tcgggggtgg tgaagcccca gcgcagcagg          2460

tgctggcgca gctcctcgat cttggtgcgg tgctggccga tctccaggtc gctgcccacg          2520

tacaggtggt ccatgtactg gtagatcacg atgtcggggt tctgcttgcg gaagggctcc          2580

aggatcttgg tcatgctgca ctggaagatg gcggggctgc ccttccagcc ctggggcagc          2640

acgttgtact ggtagcggat gccgggggtc tcgttgttga tgctggggat ggtgaaggcg          2700

gtgtacttgc ggaagtcctt gtccaggggc acgctgaagt aggcgtcgcc cacgtccagc          2760

acggtcacgc tcttcttctg cttcaggccg gcggggtggg ggatgcccag ctgcacctcc          2820

cagaagtcct gggtgcgctt gttcagctcg cggaagtcca ccagcttgcg ccacttggtg          2880

ctgtccttct tcttgatggc gaacacgggg gtgttgtagg ggttctcggg gccgatcttg          2940

ctgatcttgc cctccttctc catctcggtg cagatctcca ccagggcctt gatcttctcc          3000

tcggtcaggg gccactgctt caccttgggg ccgtccatgc cgggcttcag cttcacgggc          3060

acggtctcga tggggctgat ggggaagttc agggtgcagc cgatctgggt cagcaggttg          3120

cggccgatga tgttcacggg ggtggggccc accagcacgg tgccgatggc cttgtggccg          3180

cagatctcga tcaggatctg gtcgtactgg cccaccttga tgaagccgcc gatgccgccg          3240

atcatcttgg gcttccagcg gccgggcagg ttcatctcct ccagcacggt gtcgtcggcg          3300

ccggtgtcta gaagggcctc cttcagctgg ccccctatct ttattgtgac gaggggtcgc          3360

tgccaaagag tgatctgagg gaagctaaag gatacagttc cttgtctatc ggctcctgct          3420

tctgagaggg agttgttgtc tcttccccaa acctgaagct ctcttctggt ggggctgttg          3480

gctctggtct gctctgaaga aaattccctg gccttccctt gtgggaaggc cagatcttcc          3540

ctattagcct gtcgctcggt gcagtccttc atctggtggc cctccttgcc gcacttccag          3600

cagcccttct tgcggggggc gcggcagttg cgggcggtgt ggccctcctt gccgcagttg          3660

aagcacttca cgatcttgcg ctggttgcgg aagttgccgc gctgcatcat gatggtggcg          3720

ctgttggtca cctggctcat ggcctcggcc agcacgcggg ccttgtggcc ggggccgccc          3780

acgccctggc aggcggtcat catctcctcc agggtggcgg cggggcccag ggccttcagg          3840

atggtcttgc agtcggggtt ggcgttctgc accagcaggg tctcggtcat ccagttcttc          3900

acctcctggc tggcctgctc ggcgcgcagg gtcttgtaga agcggtccac gtagtcgcgg          3960

aagggctcct tggggccctg gcggatgtcc aggatgctgg tggggctgta catgcgcacg          4020

atcttgttca ggcccaggat gatccagcgc ttgtagatct cgcccacggg gatggggggg          4080

ttgttggtca tccagccgat ctgctcctgc agggtgctgg tggtgccggc gatgtcgctg          4140

ccgcggggct cgcgcatctg gccgggggcg atggggccgg cgtgcacggg gtgcacgcgg          4200

tcccactcgg cggcctcctc gttgatggtc tccttcagca tctgcatggc ggcctggtgg          4260

ccgcccacgg tgttcagcat ggtgttcagg tcctgggggg tggcgccctc gctcagggcg          4320

ctgaacatgg ggatcacctc ggggctgaag gccttctcct ccaccacctt cacccaggcg          4380

ttcagggtgc gggggctgat ggcctggtgc accatctggc cctggatgtt ctgcacgatg          4440

gggtagttct ggctcacctg gttgctgtgg ccggtgtcgg cggcggcctg ctgggccttc          4500

ttcttgctct tgttctgctc ctcctcgatc ttgtccaggg cctccttggt gtccttgatc          4560

tcgatgcgct ggtgcacgca gtacagggtg gccacggtgt tgtacaggct gcgcagctcc          4620

tcgctgccgg tctgcaggct gggctgcagc tggcccagga tctggcggca gccctcgctg          4680

gtctccagca ggccggggtt cacggcgaag cgctccagct cgcggctggc ccacacgatg          4740

tgcttcagct tgtacttctt cttgccgccg gggcgcaggc ggatcttctc ccagcggtcc          4800

agctcgccgc cgctcagcac gctggcgcgg gcgcccatgt cgaatcgaat tctgcagtga          4860

tcagggatcc gtatagtgag tcgtattagg taccggctgc agttggacct gggagtggac          4920

acctgtggag agaaaggcaa agtggatgtc attgtcactc aagtgtatgg ccagatctca          4980

agcctgccac acctcaagtg aagccaaggg ggtgggccta tagactctat aggcggtact          5040

tacgtcactc ttggcacggg gaatccgcgt tccaatgcac cgttcccggc cgcggaggct          5100

ggatcggtcc cggtgtcttc tatggaggtc aaaacagcgt ggatggcgtc tccaggcgat          5160

ctgacggttc actaaacgag ctcgtcgacg atctctatca ctgataggga gatctctatc          5220

actgataggg agagctctgc ttatatagac ctcccaccgt acacgcctac cgcccatttg          5280

cgtcaatggg gcggagttgt tacgacattt tggaaagtcc cgttgatttt ggtgccaaaa          5340

caaactccca ttgacgtcaa tggggtggag acttggaaat ccccgtgagt caaaccgcta          5400

tccacgccca ttgatgtact gccaaaaccg catcaccatg gtaatagcga tgactaatac          5460

gtagatgtac tgccaagtag gaaagtccca taaggtcatg tactgggcat aatgccaggc          5520

gggccattta ccgtcattga cgtcaatagg gggcgtactt ggcatatgat acacttgatg          5580

tactgccaag tgggcagttt accgtaaata ctccacccat tgacgtcaat ggaaagtccc          5640

tattggcgtt actatgggaa catacgtcat tattgacgtc aatgggcggg ggtcgttggg          5700

cggtcagcca ggcgggccat ttaccgtaag ttatgtaacg cggaactcca tatatgggct          5760

atgaactaat gaccccgtaa ttgattacta ttaataacta gtactgaaat gtgtgggcgt          5820

ggcttaaggg tgggaaagaa tatataaggt gggggtctta tgtagttttg tatctgtttt          5880

gcagcagccg ccgccgccat gagcaccaac tcgtttgatg gaagcattgt gagctcatat          5940

ttgacaacgc gcatgccccc atgggccggg gtgcgtcaga atgtgatggg ctccagcatt          6000

gatggtcgcc ccgtcctgcc cgcaaactct actaccttga cctacgagac cgtgtctgga          6060

acgccgttgg agactgcagc ctccgccgcc gcttcagccg ctgcagccac cgcccgcggg          6120

attgtgactg actttgcttt cctgagcccg cttgcaagca gtgcagcttc ccgttcatcc          6180

gcccgcgatg acaagttgac ggctcttttg gcacaattgg attctttgac ccgggaactt          6240

aatgtcgttt ctcagcagct gttggatctg cgccagcagg tttctgccct gaaggcttcc          6300

tcccctccca atgcggttta aaacataaat aaaaaaccag actctgtttg gatttggatc          6360

aagcaagtgt cttgctgtct ttatttaggg gttttgcgcg cgcggtaggc ccgggaccag          6420

cggtctcggt cgttgagggt cctgtgtatt ttttccagga cgtggtaaag gtgactctgg          6480

atgttcagat acatgggcat aagcccgtct ctggggtgga ggtagcacca ctgcagagct          6540

tcatgctgcg gggtggtgtt gtagatgatc cagtcgtagc aggagcgctg ggcgtggtgc          6600

ctaaaaatgt ctttcagtag caagctgatt gccaggggca ggcccttggt gtaagtgttt          6660

acaaagcggt taagctggga tgggtgcata cgtggggata tgagatgcat cttggactgt          6720

atttttaggt tggctatgtt cccagccata tccctccggg gattcatgtt gtgcagaacc          6780

accagcacag tgtatccggt gcacttggga aatttgtcat gtagcttaga aggaaatgcg          6840

tggaagaact tggagacgcc cttgtgacct ccaagatttt ccatgcattc gtccataatg          6900

atggcaatgg gcccacgggc ggcggcctgg gcgaagatat ttctgggatc actaacgtca         6960

tagttgtgtt ccaggatgag atcgtcatag gccattttta caaagcgcgg gcggagggtg         7020

ccagactgcg gtataatggt tccatccggc ccaggggcgt agttaccctc acagatttgc         7080

atttcccacg ctttgagttc agatgggggg atcatgtcta cctgcggggc gatgaagaaa         7140

acggtttccg gggtagggga gatcagctgg gaagaaagca ggttcctgag cagctgcgac         7200

ttaccgcagc cggtgggccc gtaaatcaca cctattaccg ggtgcaactg gtagttaaga         7260

gagctgcagc tgccgtcatc cctgagcagg ggggccactt cgttaagcat gtccctgact         7320

cgcatgtttt ccctgaccaa atccgccaga aggcgctcgc cgcccagcga tagcagttct         7380

tgcaaggaag caaagttttt caacggtttg agaccgtccg ccgtaggcat gcttttgagc         7440

gtttgaccaa gcagttccag gcggtcccac agctcggtca cctgctctac ggcatctcga         7500

tccagcatat ctcctcgttt cgcgggttgg ggcggctttc gctgtacggc agtagtcggt         7560

gctcgtccag acgggccagg gtcatgtctt tccacgggcg cagggtcctc gtcagcgtag         7620

tctgggtcac ggtgaagggg tgcgctccgg gctgcgcgct ggccagggtg cgcttgaggc         7680

tggtcctgct ggtgctgaag cgctgccggt cttcgccctg cgcgtcggcc aggtagcatt         7740

tgaccatggt gtcatagtcc agcccctccg cggcgtggcc cttggcgcgc agcttgccct         7800

tggaggaggc gccgcacgag gggcagtgca gacttttgag ggcgtagagc ttgggcgcga         7860

gaaataccga ttccggggag taggcatccg cgccgcaggc cccgcagacg gtctcgcatt         7920

ccacgagcca ggtgagctct ggccgttcgg ggtcaaaaac caggtttccc ccatgctttt         7980

tgatgcgttt cttacctctg gtttccatga gccggtgtcc acgctcggtg acgaaaaggc         8040

tgtccgtgtc cccgtataca gacttgagag gcctgtcctc gagcggtgtt ccgcggtcct         8100

cctcgtatag aaactcggac cactctgaga caaaggctcg cgtccaggcc agcacgaagg         8160

aggctaagtg ggaggggtag cggtcgttgt ccactagggg gtccactcgc tccagggtgt         8220

gaagacacat gtcgccctct tcggcatcaa ggaaggtgat tggtttgtag gtgtaggcca         8280

cgtgaccggg tgttcctgaa ggggggctat aaaagggggt gggggcgcgt tcgtcctcac         8340

tctcttccgc atcgctgtct gcgagggcca gctgttgggg tgagtactcc ctctgaaaag         8400

cgggcatgac ttctgcgcta agattgtcag tttccaaaaa cgaggaggat ttgatattca         8460

cctggcccgc ggtgatgcct ttgagggtgg ccgcatccat ctggtcagaa aagacaatct         8520

ttttgttgtc aagcttggtg gcaaacgacc cgtagagggc gttggacagc aacttggcga         8580

tggagcgcag ggtttggttt ttgtcgcgat cggcgcgctc cttggccgcg atgtttagct         8640

gcacgtattc gcgcgcaacg caccgccatt cgggaaagac ggtggtgcgc tcgtcgggca         8700

ccaggtgcac gcgccaaccg cggttgtgca gggtgacaag gtcaacgctg gtggctacct         8760

ctccgcgtag gcgctcgttg gtccagcaga ggcggccgcc cttgcgcgag cagaatggcg         8820

gtagggggtc tagctgcgtc tcgtccgggg ggtctgcgtc cacggtaaag accccgggca         8880

gcaggcgcgc gtcgaagtag tctatcttgc atccttgcaa gtctagcgcc tgctgccatg         8940

cgcgggcggc aagcgcgcgc tcgtatgggt tgagtggggg accccatggc atggggtggg         9000

tgagcgcgga ggcgtacatg ccgcaaatgt cgtaaacgta gaggggctct ctgagtattc         9060

caagatatgt agggtagcat cttccaccgc ggatgctggc gcgcacgtaa tcgtatagtt         9120

cgtgcgaggg agcgaggagg tcgggaccga ggttgctacg ggcgggctgc tctgctcgga         9180

agactatctg cctgaagatg gcatgtgagt tggatgatat ggttggacgc tggaagacgt         9240

tgaagctggc gtctgtgaga cctaccgcgt cacgcacgaa ggaggcgtag gagtcgcgca         9300

gcttgttgac cagctcggcg gtgacctgca cgtctagggc gcagtagtcc agggtttcct         9360

tgatgatgtc atacttatcc tgtccctttt ttttccacag ctcgcggttg aggacaaact         9420

cttcgcggtc tttccagtac tcttggatcg gaaacccgtc ggcctccgaa cggtaagagc         9480

ctagcatgta gaactggttg acggcctggt aggcgcagca tcccttttct acgggtagcg         9540

cgtatgcctg cgcggccttc cggagcgagg tgtgggtgag cgcaaaggtg tccctgacca         9600

tgactttgag gtactggtat ttgaagtcag tgtcgtcgca tccgccctgc tcccagagca         9660

aaaagtccgt gcgctttttg gaacgcggat ttggcagggc gaaggtgaca tcgttgaaga         9720

gtatctttcc cgcgcgaggc ataaagttgc gtgtgatgcg gaagggtccc ggcacctcgg         9780

aacggttgtt aattacctgg gcggcgagca cgatctcgtc aaagccgttg atgttgtggc         9840

ccacaatgta aagttccaag aagcgcggga tgcccttgat ggaaggcaat tttttaagtt         9900

cctcgtaggt gagctcttca ggggagctga gcccgtgctc tgaaagggcc cagtctgcaa         9960

gatgagggtt ggaagcgacg aatgagctcc acaggtcacg ggccattagc atttgcaggt        10020

ggtcgcgaaa ggtcctaaac tggcgaccta tggccatttt ttctggggtg atgcagtaga        10080

aggtaagcgg gtcttgttcc cagcggtccc atccaaggtt cgcggctagg tctcgcgcgg        10140

cagtcactag aggctcatct ccgccgaact tcatgaccag catgaagggc acgagctgct        10200

tcccaaaggc ccccatccaa gtataggtct ctacatcgta ggtgacaaag agacgctcgg        10260

tgcgaggatg cgagccgatc gggaagaact ggatctcccg ccaccaattg gaggagtggc        10320

tattgatgtg gtgaaagtag aagtccctgc gacgggccga acactcgtgc tggcttttgt        10380

aaaaacgtgc gcagtactgg cagcggtgca cgggctgtac atcctgcacg aggttgacct        10440

gacgaccgcg cacaaggaag cagagtggga atttgagccc ctcgcctggc gggtttggct        10500

ggtggtcttc tacttcggct gcttgtcctt gaccgtctgg ctgctcgagg ggagttacgg        10560

tggatcggac caccacgccg cgcgagccca aagtccagat gtccgcgcgc ggcggtcgga        10620

gcttgatgac aacatcgcgc agatgggagc tgtccatggt ctggagctcc cgcggcgtca        10680

ggtcaggcgg gagctcctgc aggtttacct cgcatagacg ggtcagggcg cgggctagat       10740

ccaggtgata cctaatttcc aggggctggt tggtggcggc gtcgatggct tgcaagaggc       10800

cgcatccccg cggcgcgact acggtaccgc gcggcgggcg gtgggccgcg ggggtgtcct       10860

tggatgatgc atctaaaagc ggtgacgcgg gcgagccccc ggaggtaggg ggggctccgg       10920

acccgccggg agagggggca ggggcacgtc ggcgccgcgc gcgggcagga gctggtgctg       10980

cgcgcgtagg ttgctggcga acgcgacgac gcggcggttg atctcctgaa tctggcgcct       11040

ctgcgtgaag acgacgggcc cggtgagctt gaacctgaaa gagagttcga cagaatcaat       11100

ttcggtgtcg ttgacggcgg cctggcgcaa aatctcctgc acgtctcctg agttgtcttg       11160

ataggcgatc tcggccatga actgctcgat ctcttcctcc tggagatctc cgcgtccggc       11220

tcgctccacg gtggcggcga ggtcgttgga aatgcgggcc atgagctgcg agaaggcgtt       11280

gaggcctccc tcgttccaga cgcggctgta gaccacgccc ccttcggcat cgcgggcgcg       11340

catgaccacc tgcgcgagat tgagctccac gtgccgggcg aagacggcgt agtttcgcag       11400

gcgctgaaag aggtagttga gggtggtggc ggtgtgttct gccacgaaga agtacataac       11460

ccagcgtcgc aacgtggatt cgttgatatc ccccaaggcc tcaaggcgct ccatggcctc       11520

gtagaagtcc acggcgaagt tgaaaaactg ggagttgcgc gccgacacgg ttaactcctc       11580

ctccagaaga cggatgagct cggcgacagt gtcgcgcacc tcgcgctcaa aggctacagg       11640

ggcctcttct tcttcttcaa tctcctcttc cataagggcc tccccttctt cttcttctgg       11700

cggcggtggg ggagggggga cacggcggcg acgacggcgc accgggaggc ggtcgacaaa       11760

gcgctcgatc atctccccgc ggcgacggcg catggtctcg gtgacggcgc ggccgttctc       11820

gcgggggcgc agttggaaga cgccgcccgt catgtcccgg ttatgggttg gcggggggct       11880

gccatgcggc agggatacgg cgctaacgat gcatctcaac aattgttgtg taggtactcc       11940

gccgccgagg gacctgagcg agtccgcatc gaccggatcg gaaaacctct cgagaaaggc       12000

gtctaaccag tcacagtcgc aaggtaggct gagcaccgtg gcgggcggca gcgggcggcg       12060

gtcggggttg tttctggcgg aggtgctgct gatgatgtaa ttaaagtagg cggtcttgag       12120

acggcggatg gtcgacagaa gcaccatgtc cttgggtccg gcctgctgaa tgcgcaggcg       12180

gtcggccatg ccccaggctt cgttttgaca tcggcgcagg tctttgtagt agtcttgcat       12240

gagcctttct accggcactt cttcttctcc ttcctcttgt cctgcatctc ttgcatctat       12300

cgctgcggcg gcggcggagt ttggccgtag gtggcgccct cttcctccca tgcgtgtgac       12360

cccgaagccc ctcatcggct gaagcagggc taggtcggcg acaacgcgct cggctaatat       12420

ggcctgctgc acctgcgtga gggtagactg gaagtcatcc atgtccacaa agcggtggta       12480

tgcgcccgtg ttgatggtgt aagtgcagtt ggccataacg gaccagttaa cggtctggtg       12540

acccggctgc gagagctcgg tgtacctgag acgcgagtaa gccctcgagt caaatacgta       12600

gtcgttgcaa gtccgcacca ggtactggta tcccaccaaa aagtgcggcg gcggctggcg       12660

gtagaggggc cagcgtaggg tggccggggc tccgggggcg agatcttcca acataaggcg       12720

atgatatccg tagatgtacc tggacatcca ggtgatgccg gcggcggtgg tggaggcgcg       12780

cggaaagtcg cggacgcggt tccagatgtt gcgcagcggc aaaaagtgct ccatggtcgg       12840

gacgctctgg ccggtcaggc gcgcgcaatc gttgacgctc tagcgtgcaa aaggagagcc       12900

tgtaagcggg cactcttccg tggtctggtg gataaattcg caagggtatc atggcggacg       12960

accggggttc gagccccgta tccggccgtc cgccgtgatc catgcggtta ccgcccgcgt       13020

gtcgaaccca ggtgtgcgac gtcagacaac gggggagtgc tccttttggc ttccttccag       13080

gcgcggcggc tgctgcgcta gcttttttgg ccactggccg cgcgcagcgt aagcggttag       13140

gctggaaagc gaaagcatta agtggctcgc tccctgtagc cggagggtta ttttccaagg       13200

gttgagtcgc gggacccccg gttcgagtct cggaccggcc ggactgcggc gaacgggggt       13260

ttgcctcccc gtcatgcaag accccgcttg caaattcctc cggaaacagg gacgagcccc       13320

ttttttgctt ttcccagatg catccggtgc tgcggcagat gcgcccccct cctcagcagc       13380

ggcaagagca agagcagcgg cagacatgca gggcaccctc ccctcctcct accgcgtcag       13440

gaggggcgac atccgcggtt gacgcggcag cagatggtga ttacgaaccc ccgcggcgcc       13500

gggcccggca ctacctggac ttggaggagg gcgagggcct ggcgcggcta ggagcgccct       13560

ctcctgagcg gcacccaagg gtgcagctga agcgtgatac gcgtgaggcg tacgtgccgc       13620

ggcagaacct gtttcgcgac cgcgagggag aggagcccga ggagatgcgg gatcgaaagt       13680

tccacgcagg gcgcgagctg cggcatggcc tgaatcgcga gcggttgctg cgcgaggagg       13740

actttgagcc cgacgcgcga accgggatta gtcccgcgcg cgcacacgtg gcggccgccg       13800

acctggtaac cgcatacgag cagacggtga accaggagat taactttcaa aaaagcttta       13860

acaaccacgt gcgtacgctt gtggcgcgcg aggaggtggc tataggactg atgcatctgt       13920

gggactttgt aagcgcgctg gagcaaaacc caaatagcaa gccgctcatg gcgcagctgt       13980

tccttatagt gcagcacagc agggacaacg aggcattcag ggatgcgctg ctaaacatag       14040

tagagcccga gggccgctgg ctgctcgatt tgataaacat cctgcagagc atagtggtgc       14100

aggagcgcag cttgagcctg gctgacaagg tggccgccat caactattcc atgcttagcc       14160

tgggcaagtt ttacgcccgc aagatatacc atacccctta cgttcccata gacaaggagg       14220

taaagatcga ggggttctac atgcgcatgg cgctgaaggt gcttaccttg agcgacgacc       14280

tgggcgttta tcgcaacgag cgcatccaca aggccgtgag cgtgagccgg cggcgcgagc       14340

tcagcgaccg cgagctgatg cacagcctgc aaagggccct ggctggcacg ggcagcggcg       14400

atagagaggc cgagtcctac tttgacgcgg gcgctgacct gcgctgggcc ccaagccgac       14460

gcgccctgga ggcagctggg gccggacctg ggctggcggt ggcacccgcg cgcgctggca         14520

acgtcggcgg cgtggaggaa tatgacgagg acgatgagta cgagccagag gacggcgagt         14580

actaagcggt gatgtttctg atcagatgat gcaagacgca acggacccgg cggtgcgggc         14640

ggcgctgcag agccagccgt ccggccttaa ctccacggac gactggcgcc aggtcatgga         14700

ccgcatcatg tcgctgactg cgcgcaatcc tgacgcgttc cggcagcagc cgcaggccaa         14760

ccggctctcc gcaattctgg aagcggtggt cccggcgcgc gcaaacccca cgcacgagaa         14820

ggtgctggcg atcgtaaacg cgctggccga aaacagggcc atccggcccg acgaggccgg         14880

cctggtctac gacgcgctgc ttcagcgcgt ggctcgttac aacagcggca acgtgcagac         14940

caacctggac cggctggtgg gggatgtgcg cgaggccgtg gcgcagcgtg agcgcgcgca         15000

gcagcagggc aacctgggct ccatggttgc actaaacgcc ttcctgagta cacagcccgc         15060

caacgtgccg cggggacagg aggactacac caactttgtg agcgcactgc ggctaatggt         15120

gactgagaca ccgcaaagtg aggtgtacca gtctgggcca gactattttt tccagaccag         15180

tagacaaggc ctgcagaccg taaacctgag ccaggctttc aaaaacttgc aggggctgtg         15240

gggggtgcgg gctcccacag gcgaccgcgc gaccgtgtct agcttgctga cgcccaactc         15300

gcgcctgttg ctgctgctaa tagcgccctt cacggacagt ggcagcgtgt cccgggacac         15360

atacctaggt cacttgctga cactgtaccg cgaggccata ggtcaggcgc atgtggacga         15420

gcatactttc caggagatta caagtgtcag ccgcgcgctg gggcaggagg acacgggcag         15480

cctggaggca accctaaact acctgctgac caaccggcgg cagaagatcc cctcgttgca         15540

cagtttaaac agcgaggagg agcgcatttt gcgctacgtg cagcagagcg tgagccttaa         15600

cctgatgcgc gacggggtaa cgcccagcgt ggcgctggac atgaccgcgc gcaacatgga         15660

accgggcatg tatgcctcaa accggccgtt tatcaaccgc ctaatggact acttgcatcg         15720

cgcggccgcc gtgaaccccg agtatttcac caatgccatc ttgaacccgc actggctacc         15780

gccccctggt ttctacaccg ggggattcga ggtgcccgag ggtaacgatg gattcctctg         15840

ggacgacata gacgacagcg tgttttcccc gcaaccgcag accctgctag agttgcaaca         15900

gcgcgagcag gcagaggcgg cgctgcgaaa ggaaagcttc cgcaggccaa gcagcttgtc         15960

cgatctaggc gctgcggccc cgcggtcaga tgctagtagc ccatttccaa gcttgatagg         16020

gtctcttacc agcactcgca ccacccgccc gcgcctgctg ggcgaggagg agtacctaaa         16080

caactcgctg ctgcagccgc agcgcgaaaa aaacctgcct ccggcatttc ccaacaacgg         16140

gatagagagc ctagtggaca agatgagtag atggaagacg tacgcgcagg agcacaggga         16200

cgtgccaggc ccgcgcccgc ccacccgtcg tcaaaggcac gaccgtcagc ggggtctggt         16260

gtgggaggac gatgactcgg cagacgacag cagcgtcctg gatttgggag ggagtggcaa         16320

cccgtttgcg caccttcgcc ccaggctggg gagaatgttt taaaaaaaaa aaaagcatga         16380

tgcaaaataa aaaactcacc aaggccatgg caccgagcgt tggttttctt gtattcccct       16440

tagtatgcgg cgcgcggcga tgtatgagga aggtcctcct ccctcctacg agagtgtggt       16500

gagcgcggcg ccagtggcgg cggcgctggg ttctcccttc gatgctcccc tggacccgcc       16560

gtttgtgcct ccgcggtacc tgcggcctac cggggggaga aacagcatcc gttactctga       16620

gttggcaccc ctattcgaca ccacccgtgt gtacctggtg gacaacaagt caacggatgt       16680

ggcatccctg aactaccaga acgaccacag caactttctg accacggtca ttcaaaacaa       16740

tgactacagc ccgggggagg caagcacaca gaccatcaat cttgacgacc ggtcgcactg       16800

gggcggcgac ctgaaaacca tcctgcatac caacatgcca aatgtgaacg agttcatgtt       16860

taccaataag tttaaggcgc gggtgatggt gtcgcgcttg cctactaagg acaatcaggt       16920

ggagctgaaa tacgagtggg tggagttcac gctgcccgag ggcaactact ccgagaccat       16980

gaccatagac cttatgaaca acgcgatcgt ggagcactac ttgaaagtgg gcagacagaa       17040

cggggttctg gaaagcgaca tcggggtaaa gtttgacacc cgcaacttca gactggggtt       17100

tgaccccgtc actggtcttg tcatgcctgg ggtatataca aacgaagcct tccatccaga       17160

catcattttg ctgccaggat gcggggtgga cttcacccac agccgcctga gcaacttgtt       17220

gggcatccgc aagcggcaac ccttccagga gggctttagg atcacctacg atgatctgga       17280

gggtggtaac attcccgcac tgttggatgt ggacgcctac caggcgagct tgaaagatga       17340

caccgaacag ggcgggggtg gcgcaggcgg cagcaacagc agtggcagcg gcgcggaaga       17400

gaactccaac gcggcagccg cggcaatgca gccggtggag gacatgaacg atcatgccat       17460

tcgcggcgac acctttgcca cacgggctga ggagaagcgc gctgaggccg aagcagcggc       17520

cgaagctgcc gcccccgctg cgcaacccga ggtcgagaag cctcagaaga aaccggtgat       17580

caaacccctg acagaggaca gcaagaaacg cagttacaac ctaataagca atgacagcac       17640

cttcacccag taccgcagct ggtaccttgc atacaactac ggcgaccctc agaccggaat       17700

ccgctcatgg accctgcttt gcactcctga cgtaacctgc ggctcggagc aggtctactg       17760

gtcgttgcca gacatgatgc aagaccccgt gaccttccgc tccacgcgcc agatcagcaa       17820

ctttccggtg gtgggcgccg agctgttgcc cgtgcactcc aagagcttct acaacgacca       17880

ggccgtctac tcccaactca tccgccagtt tacctctctg acccacgtgt tcaatcgctt       17940

tcccgagaac cagattttgg cgcgcccgcc agcccccacc atcaccaccg tcagtgaaaa       18000

cgttcctgct ctcacagatc acgggacgct accgctgcgc aacagcatcg gaggagtcca       18060

gcgagtgacc attactgacg ccagacgccg cacctgcccc tacgtttaca aggccctggg       18120

catagtctcg ccgcgcgtcc tatcgagccg cactttttga gcaagcatgt ccatccttat       18180

atcgcccagc aataacacag gctggggcct gcgcttccca agcaagatgt ttggcggggc       18240

caagaagcgc tccgaccaac acccagtgcg cgtgcgcggg cactaccgcg cgccctgggg    18300

cgcgcacaaa cgcggccgca ctgggcgcac caccgtcgat gacgccatcg acgcggtggt    18360

ggaggaggcg cgcaactaca cgcccacgcc gccaccagtg tccacagtgg acgcggccat    18420

tcagaccgtg gtgcgcggag cccggcgcta tgctaaaatg aagagacggc ggaggcgcgt    18480

agcacgtcgc caccgccgcc gacccggcac tgccgcccaa cgcgcggcgg cggccctgct    18540

taaccgcgca cgtcgcaccg gccgacgggc ggccatgcgg gccgctcgaa ggctggccgc    18600

gggtattgtc actgtgcccc ccaggtccag gcgacgagcg gccgccgcag cagccgcggc    18660

cattagtgct atgactcagg gtcgcagggg caacgtgtat tgggtgcgcg actcggttag    18720

cggcctgcgc gtgcccgtgc gcacccgccc cccgcgcaac tagattgcaa gaaaaaacta    18780

cttagactcg tactgttgta tgtatccagc ggcggcggcg cgcaacgaag ctatgtccaa    18840

gcgcaaaatc aaagaagaga tgctccaggt catcgcgccg gagatctatg gccccccgaa    18900

gaaggaagag caggattaca agccccgaaa gctaaagcgg gtcaaaaaga aaaagaaaga    18960

tgatgatgat gaacttgacg acgaggtgga actgctgcac gctaccgcgc ccaggcgacg    19020

ggtacagtgg aaaggtcgac gcgtaaaacg tgttttgcga cccggcacca ccgtagtctt    19080

tacgcccggt gagcgctcca cccgcaccta caagcgcgtg tatgatgagg tgtacggcga    19140

cgaggacctg cttgagcagg ccaacgagcg cctcggggag tttgcctacg gaaagcggca    19200

taaggacatg ctggcgttgc cgctggacga gggcaaccca acacctagcc taaagcccgt    19260

aacactgcag caggtgctgc ccgcgcttgc accgtccgaa gaaaagcgcg gcctaaagcg    19320

cgagtctggt gacttggcac ccaccgtgca gctgatggta cccaagcgcc agcgactgga    19380

agatgtcttg gaaaaaatga ccgtggaacc tgggctggag cccgaggtcc gcgtgcggcc    19440

aatcaagcag gtggcgccgg gactgggcgt gcagaccgtg gacgttcaga tacccactac    19500

cagtagcacc agtattgcca ccgccacaga gggcatggag acacaaacgt ccccggttgc    19560

ctcagcggtg gcggatgccg cggtgcaggc ggtcgctgcg gccgcgtcca agacctctac    19620

ggaggtgcaa acggacccgt ggatgtttcg cgtttcagcc ccccggcgcc cgcgccgttc    19680

gaggaagtac ggcgccgcca gcgcgctact gcccgaatat gccctacatc cttccattgc    19740

gcctaccccc ggctatcgtg gctacaccta ccgccccaga agacgagcaa ctacccgacg    19800

ccgaaccacc actggaaccc gccgccgccg tcgccgtcgc cagcccgtgc tggccccgat    19860

ttccgtgcgc agggtggctc gcgaaggagg caggaccctg gtgctgccaa cagcgcgcta    19920

ccaccccagc atcgtttaaa agccggtctt tgtggttctt gcagatatgg ccctcacctg    19980

ccgcctccgt ttcccggtgc cgggattccg aggaagaatg caccgtagga ggggcatggc    20040

cggccacggc ctgacgggcg gcatgcgtcg tgcgcaccac cggcggcggc gcgcgtcgca    20100

ccgtcgcatg cgcggcggta tcctgcccct ccttattcca ctgatcgccg cggcgattgg    20160

cgccgtgccc ggaattgcat ccgtggcctt gcaggcgcag agacactgat taaaaacaag    20220

ttgcatgtgg aaaaatcaaa ataaaaagtc tggactctca cgctcgcttg gtcctgtaac    20280

tattttgtag aatggaagac atcaactttg cgtctctggc cccgcgacac ggctcgcgcc    20340

cgttcatggg aaactggcaa gatatcggca ccagcaatat gagcggtggc gccttcagct    20400

ggggctcgct gtggagcggc attaaaaatt tcggttccac cgttaagaac tatggcagca    20460

aggcctggaa cagcagcaca ggccagatgc tgagggataa gttgaaagag caaaatttcc    20520

aacaaaaggt ggtagatggc ctggcctctg gcattagcgg ggtggtggac ctggccaacc    20580

aggcagtgca aaataagatt aacagtaagc ttgatccccg ccctcccgta gaggagcctc    20640

caccggccgt ggagacagtg tctccagagg ggcgtggcga aaagcgtccg cgccccgaca    20700

gggaagaaac tctggtgacg caaatagacg agcctccctc gtacgaggag gcactaaagc    20760

aaggcctgcc caccacccgt cccatcgcgc ccatggctac cggagtgctg ggccagcaca    20820

cacccgtaac gctggacctg cctccccccg ccgacaccca gcagaaacct gtgctgccag    20880

gcccgaccgc cgttgttgta acccgtccta gccgcgcgtc cctgcgccgc gccgccagcg    20940

gtccgcgatc gttgcggccc gtagccagtg gcaactggca aagcacactg aacagcatcg    21000

tgggtctggg ggtgcaatcc ctgaagcgcc gacgatgctt ctgatagcta acgtgtcgta    21060

tgtgtgtcat gtatgcgtcc atgtcgccgc cagaggagct gctgagccgc cgcgcgcccg    21120

ctttccaaga tggctacccc ttcgatgatg ccgcagtggt cttacatgca catctcgggc    21180

caggacgcct cggagtacct gagccccggg ctggtgcagt ttgcccgcgc caccgagacg    21240

tacttcagcc tgaataacaa gtttagaaac cccacggtgg cgcctacgca cgacgtgacc    21300

acagaccggt cccagcgttt gacgctgcgg ttcatccctg tggaccgtga ggatactgcg    21360

tactcgtaca aggcgcggtt caccctagct gtgggtgata accgtgtgct ggacatggct    21420

tccacgtact ttgacatccg cggcgtgctg gacaggggcc ctacttttaa gccctactct    21480

ggcactgcct acaacgccct ggctcccaag ggtgccccaa atccttgcga atgggatgaa    21540

gctgctactg ctcttgaaat aaacctagaa gaagaggacg atgacaacga agacgaagta    21600

gacgagcaag ctgagcagca aaaaactcac gtatttgggc aggcgcctta ttctggtata    21660

aatattacaa aggagggtat tcaaataggt gtcgaaggtc aaacacctaa atatgccgat    21720

aaaacatttc aacctgaacc tcaaatagga gaatctcagt ggtacgaaac agaaattaat    21780

catgcagctg ggagagtcct aaaaaagact accccaatga aaccatgtta cggttcatat    21840

gcaaaaccca caaatgaaaa tggagggcaa ggcattcttg taaagcaaca aaatggaaag    21900

ctagaaagtc aagtggaaat gcaatttttc tcaactactg aggcagccgc aggcaatggt    21960

gataacttga ctcctaaagt ggtattgtac agtgaagatg tagatataga aaccccagac    22020

actcatattt cttacatgcc cactattaag gaaggtaact cacgagaact aatgggccaa    22080

caatctatgc ccaacaggcc taattacatt gcttttaggg acaattttat tggtctaatg    22140

tattacaaca gcacgggtaa tatgggtgtt ctggcgggcc aagcatcgca gttgaatgct    22200

gttgtagatt tgcaagacag aaacacagag ctttcatacc agcttttgct tgattccatt    22260

ggtgatagaa ccaggtactt ttctatgtgg aatcaggctg ttgacagcta tgatccagat    22320

gttagaatta ttgaaaatca tggaactgaa gatgaacttc caaattactg ctttccactg    22380

ggaggtgtga ttaatacaga gactcttacc aaggtaaaac ctaaaacagg tcaggaaaat    22440

ggatgggaaa aagatgctac agaattttca gataaaaatg aaataagagt tggaaataat    22500

tttgccatgg aaatcaatct aaatgccaac ctgtggagaa atttcctgta ctccaacata    22560

gcgctgtatt tgcccgacaa gctaaagtac agtccttcca acgtaaaaat ttctgataac    22620

ccaaacacct acgactacat gaacaagcga gtggtggctc ccgggctagt ggactgctac    22680

attaaccttg gagcacgctg gtcccttgac tatatggaca acgtcaaccc atttaaccac    22740

caccgcaatg ctggcctgcg ctaccgctca atgttgctgg gcaatggtcg ctatgtgccc    22800

ttccacatcc aggtgcctca gaagttcttt gccattaaaa acctccttct cctgccgggc    22860

tcatacacct acgagtggaa cttcaggaag gatgttaaca tggttctgca gagctcccta    22920

ggaaatgacc taagggttga cggagccagc attaagtttg atagcatttg cctttacgcc    22980

accttcttcc ccatggccca caacaccgcc tccacgcttg aggccatgct tagaaacgac    23040

accaacgacc agtcctttaa cgactatctc tccgccgcca acatgctcta ccctataccc    23100

gccaacgcta ccaacgtgcc catatccatc ccctcccgca actgggcggc tttccgcggc    23160

tgggccttca cgcgccttaa gactaaggaa accccatcac tgggctcggg ctacgaccct    23220

tattacacct actctggctc tataccctac ctagatggaa ccttttacct caaccacacc    23280

tttaagaagg tggccattac ctttgactct tctgtcagct ggcctggcaa tgaccgcctg    23340

cttaccccca acgagtttga aattaagcgc tcagttgacg gggagggtta caacgttgcc    23400

cagtgtaaca tgaccaaaga ctggttcctg gtacaaatgc tagctaacta taacattggc    23460

taccagggct tctatatccc agagagctac aaggaccgca tgtactcctt ctttagaaac    23520

ttccagccca tgagccgtca ggtggtggat gatactaaat acaaggacta ccaacaggtg    23580

ggcatcctac accaacacaa caactctgga tttgttggct accttgcccc caccatgcgc    23640

gaaggacagg cctaccctgc taacttcccc tatccgctta taggcaagac cgcagttgac    23700

agcattaccc agaaaaagtt tctttgcgat cgcacccttt ggcgcatccc attctccagt    23760

aactttatgt ccatgggcgc actcacagac ctgggccaaa accttctcta cgccaactcc    23820

gcccacgcgc tagacatgac ttttgaggtg gatcccatgg acgagcccac ccttctttat    23880

gttttgtttg aagtctttga cgtggtccgt gtgcaccagc cgcaccgcgg cgtcatcgaa    23940

accgtgtacc tgcgcacgcc cttctcggcc ggcaacgcca caacataaag aagcaagcaa       24000

catcaacaac agctgccgcc atgggctcca gtgagcagga actgaaagcc attgtcaaag       24060

atcttggttg tgggccatat tttttgggca cctatgacaa gcgctttcca ggctttgttt       24120

ctccacacaa gctcgcctgc gccatagtca atacggccgg tcgcgagact gggggcgtac       24180

actggatggc ctttgcctgg aacccgcact caaaaacatg ctacctcttt gagccctttg       24240

gcttttctga ccagcgactc aagcaggttt accagtttga gtacgagtca ctcctgcgcc       24300

gtagcgccat tgcttcttcc cccgaccgct gtataacgct ggaaaagtcc acccaaagcg       24360

tacaggggcc caactcggcc gcctgtggac tattctgctg catgtttctc cacgcctttg       24420

ccaactggcc ccaaactccc atggatcaca accccaccat gaaccttatt accggggtac       24480

ccaactccat gctcaacagt ccccaggtac agcccaccct gcgtcgcaac caggaacagc       24540

tctacagctt cctggagcgc cactcgccct acttccgcag ccacagtgcg cagattagga       24600

gcgccacttc tttttgtcac ttgaaaaaca tgtaaaaata atgtactaga gacactttca       24660

ataaaggcaa atgcttttat ttgtacactc tcgggtgatt atttaccccc acccttgccg       24720

tctgcgccgt ttaaaaatca aaggggttct gccgcgcatc gctatgcgcc actggcaggg       24780

acacgttgcg atactggtgt ttagtgctcc acttaaactc aggcacaacc atccgcggca       24840

gctcggtgaa gttttcactc cacaggctgc gcaccatcac caacgcgttt agcaggtcgg       24900

gcgccgatat cttgaagtcg cagttggggc ctccgccctg cgcgcgcgag ttgcgataca       24960

cagggttgca gcactggaac actatcagcg ccgggtggtg cacgctggcc agcacgctct       25020

tgtcggagat cagatccgcg tccaggtcct ccgcgttgct cagggcgaac ggagtcaact       25080

ttggtagctg ccttcccaaa aagggcgcgt gcccaggctt tgagttgcac tcgcaccgta       25140

gtggcatcaa aaggtgaccg tgcccggtct gggcgttagg atacagcgcc tgcataaaag       25200

ccttgatctg cttaaaagcc acctgagcct ttgcgccttc agagaagaac atgccgcaag       25260

acttgccgga aaactgattg gccggacagg ccgcgtcgtg cacgcagcac cttgcgtcgg       25320

tgttggagat ctgcaccaca tttcggcccc accggttctt cacgatcttg gccttgctag       25380

actgctcctt cagcgcgcgc tgcccgtttt cgctcgtcac atccatttca atcacgtgct       25440

ccttatttat cataatgctt ccgtgtagac acttaagctc gccttcgatc tcagcgcagc       25500

ggtgcagcca caacgcgcag cccgtgggct cgtgatgctt gtaggtcacc tctgcaaacg       25560

actgcaggta cgcctgcagg aatcgcccca tcatcgtcac aaaggtcttg ttgctggtga       25620

aggtcagctg caacccgcgg tgctcctcgt tcagccaggt cttgcatacg gccgccagag       25680

cttccacttg gtcaggcagt agtttgaagt tcgcctttag atcgttatcc acgtggtact       25740

tgtccatcag cgcgcgcgca gcctccatgc ccttctccca cgcagacacg atcggcacac       25800

tcagcgggtt catcaccgta atttcacttt ccgcttcgct gggctcttcc tcttcctctt     25860

gcgtccgcat accacgcgcc actgggtcgt cttcattcag ccgccgcact gtgcgcttac     25920

ctcctttgcc atgcttgatt agcaccggtg ggttgctgaa acccaccatt tgtagcgcca     25980

catcttctct ttcttcctcg ctgtccacga ttacctctgg tgatggcggg cgctcgggct     26040

tgggagaagg gcgcttcttt ttcttcttgg gcgcaatggc caaatccgcc gccgaggtcg     26100

atggccgcgg gctgggtgtg cgcggcacca gcgcgtcttg tgatgagtct tcctcgtcct     26160

cggactcgat acgccgcctc atccgctttt ttgggggcgc ccggggaggc ggcggcgacg     26220

gggacgggga cgacacgtcc tccatggttg ggggacgtcg cgccgcaccg cgtccgcgct     26280

cgggggtggt ttcgcgctgc tcctcttccc gactggccat ttccttctcc tataggcaga     26340

aaaagatcat ggagtcagtc gagaagaagg acagcctaac cgccccctct gagttcgcca     26400

ccaccgcctc caccgatgcc gccaacgcgc ctaccacctt ccccgtcgag gcacccccgc     26460

ttgaggagga ggaagtgatt atcgagcagg acccaggttt tgtaagcgaa gacgacgagg     26520

accgctcagt accaacagag gataaaaagc aagaccagga caacgcagag gcaaacgagg     26580

aacaagtcgg gcggggggac gaaaggcatg gcgactacct agatgtggga gacgacgtgc     26640

tgttgaagca tctgcagcgc cagtgcgcca ttatctgcga cgcgttgcaa gagcgcagcg     26700

atgtgcccct cgccatagcg gatgtcagcc ttgcctacga acgccaccta ttctcaccgc     26760

gcgtaccccc caaacgccaa gaaaacggca catgcgagcc caacccgcgc ctcaacttct     26820

accccgtatt tgccgtgcca gaggtgcttg ccacctatca catctttttc caaaactgca     26880

agatacccct atcctgccgt gccaaccgca gccgagcgga caagcagctg gccttgcggc     26940

agggcgctgt catacctgat atcgcctcgc tcaacgaagt gccaaaaatc tttgagggtc     27000

ttggacgcga cgagaagcgc gcggcaaacg ctctgcaaca ggaaaacagc gaaaatgaaa     27060

gtcactctgg agtgttggtg gaactcgagg gtgacaacgc gcgcctagcc gtactaaaac     27120

gcagcatcga ggtcacccac tttgcctacc cggcacttaa cctacccccc aaggtcatga     27180

gcacagtcat gagtgagctg atcgtgcgcc gtgcgcagcc cctggagagg gatgcaaatt     27240

tgcaagaaca aacagaggag ggcctacccg cagttggcga cgagcagcta gcgcgctggc     27300

ttcaaacgcg cgagcctgcc gacttggagg agcgacgcaa actaatgatg gccgcagtgc     27360

tcgttaccgt ggagcttgag tgcatgcagc ggttctttgc tgacccggag atgcagcgca     27420

agctagagga aacattgcac tacacctttc gacagggcta cgtacgccag gcctgcaaga     27480

tctccaacgt ggagctctgc aacctggtct cctaccttgg aattttgcac gaaaaccgcc     27540

ttgggcaaaa cgtgcttcat tccacgctca agggcgaggc gcgccgcgac tacgtccgcg     27600

actgcgttta cttatttcta tgctacacct ggcagacggc catgggcgtt tggcagcagt     27660

gcttggagga gtgcaacctc aaggagctgc agaaactgct aaagcaaaac ttgaaggacc     27720

tatggacggc cttcaacgag cgctccgtgg ccgcgcacct ggcggacatc attttccccg     27780

aacgcctgct taaaaccctg caacagggtc tgccagactt caccagtcaa agcatgttgc     27840

agaactttag gaactttatc ctagagcgct caggaatctt gcccgccacc tgctgtgcac     27900

ttcctagcga ctttgtgccc attaagtacc gcgaatgccc tccgccgctt tggggccact     27960

gctaccttct gcagctagcc aactaccttg cctaccactc tgacataatg gaagacgtga     28020

gcggtgacgg tctactggag tgtcactgtc gctgcaacct atgcaccccg caccgctccc     28080

tggtttgcaa ttcgcagctg cttaacgaaa gtcaaattat cggtaccttt gagctgcagg     28140

gtccctcgcc tgacgaaaag tccgcggctc cggggttgaa actcactccg gggctgtgga     28200

cgtcggctta ccttcgcaaa tttgtacctg aggactacca cgcccacgag attaggttct     28260

acgaagacca atcccgcccg cctaatgcgg agcttaccgc ctgcgtcatt acccagggcc     28320

acattcttgg ccaattgcaa gccatcaaca aagcccgcca agagtttctg ctacgaaagg     28380

gacggggggt ttacttggac ccccagtccg gcgaggagct caacccaatc cccccgccgc     28440

cgcagcccta tcagcagcag ccgcgggccc ttgcttccca ggatggcacc caaaaagaag     28500

ctgcagctgc cgccgccacc cacggacgag gaggaatact gggacagtca ggcagaggag     28560

gttttggacg aggaggagga ggacatgatg gaagactggg agagcctaga cgaggaagct     28620

tccgaggtcg aagaggtgtc agacgaaaca ccgtcaccct cggtcgcatt cccctcgccg     28680

gcgccccaga aatcggcaac cggttccagc atggctacaa cctccgctcc tcaggcgccg     28740

ccggcactgc ccgttcgccg acccaaccgt agatgggaca ccactggaac cagggccggt     28800

aagtccaagc agccgccgcc gttagcccaa gagcaacaac agcgccaagg ctaccgctca     28860

tggcgcgggc acaagaacgc catagttgct tgcttgcaag actgtggggg caacatctcc     28920

ttcgcccgcc gctttcttct ctaccatcac ggcgtggcct tcccccgtaa catcctgcat     28980

tactaccgtc atctctacag cccatactgc accggcggca gcggcagcaa cagcagcggc     29040

cacacagaag caaaggcgac cggatagcaa gactctgaca aagcccaaga aatccacagc     29100

ggcggcagca gcaggaggag gagcgctgcg tctggcgccc aacgaacccg tatcgacccg     29160

cgagcttaga aacaggattt ttcccactct gtatgctata tttcaacaga gcaggggcca     29220

agaacaagag ctgaaaataa aaaacaggtc tctgcgatcc ctcacccgca gctgcctgta     29280

tcacaaaagc gaagatcagc ttcggcgcac gctggaagac gcggaggctc tcttcagtaa     29340

atactgcgcg ctgactctta aggactagtt tcgcgccctt tctcaaattt aagcgcgaaa     29400

actacgtcat ctccagcggc cacacccggc gccagcacct gttgtcagcg ccattatgag     29460

caaggaaatt cccacgccct acatgtggag ttaccagcca caaatgggac ttgcggctgg     29520

agctgcccaa gactactcaa cccgaataaa ctacatgagc gcgggacccc acatgatatc     29580

ccgggtcaac ggaatacgcg cccaccgaaa ccgaattctc ctggaacagg cggctattac    29640

caccacacct cgtaataacc ttaatccccg tagttggccc gctgccctgg tgtaccagga    29700

aagtcccgct cccaccactg tggtacttcc cagagacgcc caggccgaag ttcagatgac    29760

taactcaggg gcgcagcttg cgggcggctt tcgtcacagg gtgcggtcgc ccgggcaggg    29820

tataactcac ctgacaatca gagggcgagg tattcagctc aacgacgagt cggtgagctc    29880

ctcgcttggt ctccgtccgg acgggacatt tcagatcggc ggcgccggcc gctcttcatt    29940

cacgcctcgt caggcaatcc taactctgca gacctcgtcc tctgagccgc gctctggagg    30000

cattggaact ctgcaattta ttgaggagtt tgtgccatcg gtctacttta accccttctc    30060

gggacctccc ggccactatc cggatcaatt tattcctaac tttgacgcgg taaaggactc    30120

ggcggacggc tacgactgaa tgttaagtgg agaggcagag caactgcgcc tgaaacacct    30180

ggtccactgt cgccgccaca agtgctttgc ccgcgactcc ggtgagtttt gctactttga    30240

attgcccgag gatcatatcg agggcccggc gcacggcgtc cggcttaccg cccagggaga    30300

gcttgcccgt agcctgattc gggagtttac ccagcgcccc ctgctagttg agcgggacag    30360

gggaccctgt gttctcactg tgatttgcaa ctgtcctaac cctggattac atcaagatct    30420

ttgttgccat ctctgtgctg agtataataa atacagaaat taaaatatac tggggctcct    30480

atcgccatcc tgtaaacgcc accgtcttca cccgcccaag caaaccaagg cgaaccttac    30540

ctggtacttt taacatctct ccctctgtga tttacaacag tttcaaccca gacggagtga    30600

gtctacgaga gaacctctcc gagctcagct actccatcag aaaaaacacc accctcctta    30660

cctgccggga acgtacgagt gcgtcaccgg ccgctgcacc acacctaccg cctgaccgta    30720

aaccagactt tttccggaca gacctcaata actctgttta ccagaacagg aggtgagctt    30780

agaaaaccct tagggtatta ggccaaaggc gcagctactg tggggtttat gaacaattca    30840

agcaactcta cgggctattc taattcaggt ttctctagaa atggacggaa ttattacaga    30900

gcagcgcctg ctagaaagac gcagggcagc ggccgagcaa cagcgcatga atcaagagct    30960

ccaagacatg gttaacttgc accagtgcaa aaggggtatc ttttgtctgg taaagcaggc    31020

caaagtcacc tacgacagta ataccaccgg acaccgcctt agctacaagt tgccaaccaa    31080

gcgtcagaaa ttggtggtca tggtgggaga aaagcccatt accataactc agcactcggt    31140

agaaaccgaa ggctgcattc actcaccttg tcaaggacct gaggatctct gcacccttat    31200

taagaccctg tgcggtctca aagatcttat tccctttaac taataaaaaa aaataataaa    31260

gcatcactta cttaaaatca gttagcaaat ttctgtccag tttattcagc agcacctcct    31320

tgccctcctc ccagctctgg tattgcagct tcctcctggc tgcaaacttt ctccacaatc    31380

taaatggaat gtcagtttcc tcctgttcct gtccatccgc acccactatc ttcatgttgt    31440

tgcagatgaa gcgcgcaaga ccgtctgaag ataccttcaa ccccgtgtat ccatatgaca    31500

cggaaaccgg tcctccaact gtgccttttc ttactcctcc ctttgtatcc cccaatgggt    31560

ttcaagagag tccccctggg gtactctctt tgcgcctatc cgaacctcta gttacctcca    31620

atggcatgct tgcgctcaaa atgggcaacg gcctctctct ggacgaggcc ggcaacctta    31680

cctcccaaaa tgtaaccact gtgagcccac ctctcaaaaa aaccaagtca aacataaacc    31740

tggaaatatc tgcacccctc acagttacct cagaagccct aactgtggct gccgccgcac    31800

ctctaatggt cgcgggcaac acactcacca tgcaatcaca ggccccgcta accgtgcacg    31860

actccaaact tagcattgcc acccaaggac ccctcacagt gtcagaagga aagctagccc    31920

tgcaaacatc aggccccctc accaccaccg atagcagtac ccttactatc actgcctcac    31980

cccctctaac tactgccact ggtagcttgg gcattgactt gaaagagccc atttatacac    32040

aaaatggaaa actaggacta aagtacgggg ctcctttgca tgtaacagac gacctaaaca    32100

ctttgaccgt agcaactggt ccaggtgtga ctattaataa tacttccttg caaactaaag    32160

ttactggagc cttgggtttt gattcacaag gcaatatgca acttaatgta gcaggaggac    32220

taaggattga ttctcaaaac agacgcctta tacttgatgt tagttatccg tttgatgctc    32280

aaaaccaact aaatctaaga ctaggacagg gccctctttt tataaactca gcccacaact    32340

tggatattaa ctacaacaaa ggcctttact tgtttacagc ttcaaacaat tccaaaaagc    32400

ttgaggttaa cctaagcact gccaaggggt tgatgtttga cgctacagcc atagccatta    32460

atgcaggaga tgggcttgaa tttggttcac ctaatgcacc aaacacaaat cccctcaaaa    32520

caaaaattgg ccatggccta gaatttgatt caaacaaggc tatggttcct aaactaggaa    32580

ctggccttag ttttgacagc acaggtgcca ttacagtagg aaacaaaaat aatgataagc    32640

taactttgtg gaccacacca gctccatctc ctaactgtag actaaatgca gagaaagatg    32700

ctaaactcac tttggtctta acaaaatgtg gcagtcaaat acttgctaca gtttcagttt    32760

tggctgttaa aggcagtttg gctccaatat ctggaacagt tcaaagtgct catcttatta    32820

taagatttga cgaaaatgga gtgctactaa acaattcctt cctggaccca gaatattgga    32880

actttagaaa tggagatctt actgaaggca cagcctatac aaacgctgtt ggatttatgc    32940

ctaacctatc agcttatcca aaatctcacg gtaaaactgc caaaagtaac attgtcagtc    33000

aagtttactt aaacggagac aaaactaaac ctgtaacact aaccattaca ctaaacggta    33060

cacaggaaac aggagacaca actccaagtg catactctat gtcattttca tgggactggt    33120

ctggccacaa ctacattaat gaaatatttg ccacatcctc ttacactttt tcatacattg    33180

cccaagaata aagaatcgtt tgtgttatgt ttcaacgtgt ttatttttca attgcccggg    33240

atcggtgatc accgatccag acatgataag atacattgat gagtttggac aaaccacaac    33300

tagaatgcag tgaaaaaaat gctttatttg tgaaatttgt gatgctattg ctttatttgt    33360

aaccattata agctgcaata aacaagttcc cggatcgcga tccggcccga ggctgtagcc    33420

gacgatggtg cgccaggaga gttgttgatt cattgtttgc ctccctgctg cggtttttca    33480

ccgaagttca tgccagtcca gcgtttttgc agcagaaaag ccgccgactt cggtttgcgg    33540

tcgcgagtga agatcccttt cttgttaccg ccaacgcgca atatgccttg cgaggtcgca    33600

aaatcggcga aattccatac ctgttcaccg acgacggcgc tgacgcgatc aaagacgcgg    33660

tgatacatat ccagccatgc acactgatac tcttcactcc acatgtcggt gtacattgag    33720

tgcagcccgg ctaacgtatc cacgccgtat tcggtgatga taatcggctg atgcagtttc    33780

tcctgccagg ccagaagttc tttttccagt accttctctg ccgtttccaa atcgccgctt    33840

tggacatacc atccgtaata acggttcagg cacagcacat caaagagatc gctgatggta    33900

tcggtgtgag cgtcgcagaa cattacattg acgcaggtga tcggacgcgt cgggtcgagt    33960

ttacgcgttg cttccgccag tggcgcgaaa tattcccgtg caccttgcgg acgggtatcc    34020

ggttcgttgg caatactcca catcaccacg cttgggtggt ttttgtcacg cgctatcagc    34080

tctttaatcg cctgtaagtg cgcttgctga gtttccccgt tgactgcctc ttcgctgtac    34140

agttctttcg gcttgttgcc cgcttcgaaa ccaatgccta aagagaggtt aaagccgaca    34200

gcagcagttt catcaatcac cacgatgcca tgttcatctg cccagtcgag catctcttca    34260

gcgtaagggt aatgcgaggt acggtaggag ttggccccaa tccagtccat taatgcgtgg    34320

tcgtgcacca tcagcacgtt atcgaatcct ttgccacgca agtccgcatc ttcatgacga    34380

ccaaagccag taaagtagaa cggtttgtgg ttaatcagga actgttcgcc cttcactgcc    34440

actgaccgga tgccgacgcg aagcgggtag atatcacact ctgtctggct tttggctgtg    34500

acgcacagtt catagagata accttcaccc ggttgccaga ggtgcggatt caccacttgc    34560

aaagtcccgc tagtgccttg tccagttgca accacctgtt gatccgcatc acgcagttca    34620

acgctgacat caccattggc caccacctgc cagtcaacag acgcgtggtt acagtcttgc    34680

gcgacatgcg tcaccacggt gatatcgtcc acccaggtgt tcggcgtggt gtagagcatt    34740

acgctgcgat ggattccggc atagttaaag aaatcatgga agtaagactg ctttttcttg    34800

ccgttttcgt cggtaatcac cattcccggc gggatagtct gccagttcag ttcgttgttc    34860

acacaaacgg tgatacgtac acttttcccg gcaataacat acggcgtgac atcggcttca    34920

aatggcgtat agccgccctg atgctccatc acttcctgat tattgaccca cactttgccg    34980

taatgagtga ccgcatcgaa acgcagcacg atacgctggc ctgcccaacc tttcggtata    35040

aagacttcgc gctgatacca gacgttgccc gcataattac gaatatctgc atcggcgaac    35100

tgatcgttaa aactgcctgg cacagcaatt gcccggcttt cttgtaacgc gctttcccac    35160

caacgctgat caattccaca gttttcgcga tccagactga atgcccacag gccgtcgagt    35220

tttttgattt cacgggttgg ggtttctaca ggacggacca tgcgttcgac ctttctcttc    35280

ttttttgggc ccatgatggc agatccgtat agtgagtcgt attagctggt tctttccgcc    35340

tcagaagcca tagagcccac cgcatcccca gcatgcctgc tattgtcttc ccaatcctcc    35400

cccttgctgt cctgccccac cccacccccc agaatagaat gacacctact cagacaatgc    35460

gatgcaattt cctcatttta ttaggaaagg acagtgggag tggcaccttc cagggtcaag    35520

gaaggcacgg gggaggggca aacaacagat ggctggcaac tagaaggcac agtcgaggct    35580

gatcagcgag ctctagatgc atgctcgagc ggccgccagt gtgatggata tctgcagaat    35640

tccagcacac tggcggccgt tactagtgga tccgagctcg gtacccggcc gttataacac    35700

cactcgacac ggcaccagct caatcagtca cagtgtaaaa aagggccaag tgcagagcga    35760

gtatatatag gactaaaaaa tgacgtaacg gttaaagtcc acaaaaaaca cccagaaaac    35820

cgcacgcgaa cctacgccca gaaacgaaag ccaaaaaacc cacaacttcc tcaaatcgtc    35880

acttccgttt tcccacgtta cgtcacttcc cattttaaga aaactacaat tcccaacaca    35940

tacaagttac tccgccctaa aacctacgtc acccgccccg ttcccacgcc ccgcgccacg    36000

tcacaaactc caccccctca ttatcatatt ggcttcaatc caaaataagg tatattattg    36060

atgatg                                                               36066

 

<210>5

<211>33583

<212>DNA

<213>人工的

 

<220>

<223>合成的

 

<400>5

catcatcaat aatatacctt attttggatt gaagccaata tgataatgag ggggtggagt       60

ttgtgacgtg gcgcggggcg tgggaacggg gcgggtgacg tagtagtgtg gcggaagtgt      120

gatgttgcaa gtgtggcgga acacatgtaa gcgacggatg tggcaaaagt gacgtttttg      180

gtgtgcgccg gtgtacacag gaagtgacaa ttttcgcgcg gttttaggcg gatgttgtag      240

taaatttggg cgtaaccgag taagatttgg ccattttcgc gggaaaactg aataagagga      300

agtgaaatct gaataatttt gtgttactca tagcgcgtaa tatttgtcta gggcccggga      360

tcggtgatca ccgatccaga catgataaga tacattgatg agtttggaca aaccacaact      420

agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta      480

accattataa gctgcaataa acaagttccc ggatctttct agctagtcta gactagctag      540

actcgagagc ggccgcaatc gataagcttg atgatcccac gtgttcacca cagccagcgg      600

ctgatgtcga accagttcca caggctggcc cacttgtcca gggccagcag gtcctgctcg      660

ttcttctcct gctggttctg gctctcctcg atcaggttgt agatgatctg ggtgtagttg      720

ctgatctcct tgtcccactg cagccaggtc atgttgtccc agatctcgag ctgctggtcc     780

ttcaggtagc gctccacggc cagcacgcgg gcctgcagct gcttgatgcc ccacacggtc     840

agcttcagca tgtgctgctg ggcctcgatg gcgcgcagca ggttgctctg ctgctgcacg     900

atgccgctca gcagctggcg ggcctgggcg gtaagcttgg cgcggctggg ggccacgccc     960

aggggctcga tcttcaccac cttgtacttg tacagctcgc tgcgccagtt gtcgcgcatg    1020

ttgccgccgc cggggcggaa gatctcgttg gtgctgttgt tgccgccgtc gcgggtcagc    1080

agcaggccgg tgatgttgct ctcgcagcgg atcacgccct ggatgggggg ggggtacatg    1140

gcctggccca ccttctgcca catgttgatg atctgcttga tgcggcaggt cagggtgatg    1200

gtgtcgttgc tggtggtgtt gttgctctcg gtgctgttgc tctcccaggt gctgttgaac    1260

aggccgctgg tgttgcagta gaagaactcg ccgccgcaga tgaagctgtg ggtggtgatc    1320

tcgatgtcgc cgccgctgct cttctcgaag atgatggtct tgttcttgaa gtgctcgcgc    1380

agcttcttgg ccacgccgcg cagggtgtcg ttccacttgg cgcggctcac gtggcagtgg    1440

gcctggcgga tgtcgccgat gatgccgccg gtggcgtaga aggcctggcc ggggccgatg    1500

cgcacgccct tgcgggtgtt gttgttgggg cgggtgcagt tgatcttcac ggccttatcc    1560

agctgcacga tgatggtctt ggcgttgttg gtgatgttct cgctgcggat ctggatgccc    1620

tcctcggcca ggctgccgtt cagcagcagc tgggtgctga tcaccggtcg gatgccgtgg    1680

gtgcactgca cggtgctcac gttcttgcag gggccggtac cgttgaactc ggtgtccttg    1740

cacttcagga tggcgaagcc ggcgggggcg cagtagtgga tggggatggg ctcgaagctc    1800

accttggggc aggcctgggt gatggcgctg gtgttgcagt tgatcaggcg gtacttgtcg    1860

gtctcgttct tctcgttgat ctgcaccacg tccagcttgt agaacaggct gtacacctgc    1920

tgcttcttgt ccttcagctc ggtggtgatg ttgaagctac agttgcgcat ctcgttggtc    1980

acgttgctgg cggtggcgtt gcagtccagg gtcacgcaca ggggggtcag cttcacgcag    2040

ggcttcaggc tctggtccca caggctgatg atgtcggtgt gcatctgctc caccatgttg    2100

ttgcgccaca tgttgaagtc ctcggtcacg ttctccaggt ggatctcctg ggggttgggg    2160

tcggtgggca cgcaggcgtg ggtctcccac acgttgtgca cctcggtgtc gtaggccttg    2220

gcgtcgctgg cgcagaacag ggtggtctcg gcgtccttcc acacgggcac gccgtagtac    2280

acggccaccc acaggttctc ggcggcgctg tagatcacca gcatgcccag gatcatggtg    2340

ccccagcgcc acaggttctg ccagctggtc tggatgccgc gcacgcgcat ggtggcgata    2400

tctctagatc gaattctgca gtgatcaggg atcccagatc cgtatagtga gtcgtattag    2460

gtaccggctg cagttggacc tgggagtgga cacctgtgga gagaaaggca aagtggatgt    2520

cattgtcact caagtgtatg gccagatctc aagcctgcca cacctcaagt gaagccaagg    2580

gggtgggcct atagactcta taggcggtac ttacgtcact cttggcacgg ggaatccgcg    2640

ttccaatgca ccgttcccgg ccgcggaggc tggatcggtc ccggtgtctt ctatggaggt       2700

caaaacagcg tggatggcgt ctccaggcga tctgacggtt cactaaacga gctctgctta       2760

tatagacctc ccaccgtaca cgcctaccgc ccatttgcgt caatggggcg gagttgttac       2820

gacattttgg aaagtcccgt tgattttggt gccaaaacaa actcccattg acgtcaatgg       2880

ggtggagact tggaaatccc cgtgagtcaa accgctatcc acgcccattg atgtactgcc       2940

aaaaccgcat caccatggta atagcgatga ctaatacgta gatgtactgc caagtaggaa       3000

agtcccataa ggtcatgtac tgggcataat gccaggcggg ccatttaccg tcattgacgt       3060

caataggggg cgtacttggc atatgataca cttgatgtac tgccaagtgg gcagtttacc       3120

gtaaatactc cacccattga cgtcaatgga aagtccctat tggcgttact atgggaacat       3180

acgtcattat tgacgtcaat gggcgggggt cgttgggcgg tcagccaggc gggccattta       3240

ccgtaagtta tgtaacgcgg aactccatat atgggctatg aactaatgac cccgtaattg       3300

attactatta ataactagta ctgaaatgtg tgggcgtggc ttaagggtgg gaaagaatat       3360

ataaggtggg ggtcttatgt agttttgtat ctgttttgca gcagccgccg ccgccatgag       3420

caccaactcg tttgatggaa gcattgtgag ctcatatttg acaacgcgca tgcccccatg       3480

ggccggggtg cgtcagaatg tgatgggctc cagcattgat ggtcgccccg tcctgcccgc       3540

aaactctact accttgacct acgagaccgt gtctggaacg ccgttggaga ctgcagcctc       3600

cgccgccgct tcagccgctg cagccaccgc ccgcgggatt gtgactgact ttgctttcct       3660

gagcccgctt gcaagcagtg cagcttcccg ttcatccgcc cgcgatgaca agttgacggc       3720

tcttttggca caattggatt ctttgacccg ggaacttaat gtcgtttctc agcagctgtt       3780

ggatctgcgc cagcaggttt ctgccctgaa ggcttcctcc cctcccaatg cggtttaaaa       3840

cataaataaa aaaccagact ctgtttggat ttggatcaag caagtgtctt gctgtcttta       3900

tttaggggtt ttgcgcgcgc ggtaggcccg ggaccagcgg tctcggtcgt tgagggtcct       3960

gtgtattttt tccaggacgt ggtaaaggtg actctggatg ttcagataca tgggcataag       4020

cccgtctctg gggtggaggt agcaccactg cagagcttca tgctgcgggg tggtgttgta       4080

gatgatccag tcgtagcagg agcgctgggc gtggtgccta aaaatgtctt tcagtagcaa       4140

gctgattgcc aggggcaggc ccttggtgta agtgtttaca aagcggttaa gctgggatgg       4200

gtgcatacgt ggggatatga gatgcatctt ggactgtatt tttaggttgg ctatgttccc       4260

agccatatcc ctccggggat tcatgttgtg cagaaccacc agcacagtgt atccggtgca       4320

cttgggaaat ttgtcatgta gcttagaagg aaatgcgtgg aagaacttgg agacgccctt       4380

gtgacctcca agattttcca tgcattcgtc cataatgatg gcaatgggcc cacgggcggc       4440

ggcctgggcg aagatatttc tgggatcact aacgtcatag ttgtgttcca ggatgagatc       4500

gtcataggcc atttttacaa agcgcgggcg gagggtgcca gactgcggta taatggttcc       4560

atccggccca ggggcgtagt taccctcaca gatttgcatt tcccacgctt tgagttcaga       4620

tggggggatc atgtctacct gcggggcgat gaagaaaacg gtttccgggg taggggagat       4680

cagctgggaa gaaagcaggt tcctgagcag ctgcgactta ccgcagccgg tgggcccgta       4740

aatcacacct attaccggct gcaactggta gttaagagag ctgcagctgc cgtcatccct       4800

gagcaggggg gccacttcgt taagcatgtc cctgactcgc atgttttccc tgaccaaatc       4860

cgccagaagg cgctcgccgc ccagcgatag cagttcttgc aaggaagcaa agtttttcaa       4920

cggtttgaga ccgtccgccg taggcatgct tttgagcgtt tgaccaagca gttccaggcg       4980

gtcccacagc tcggtcacct gctctacggc atctcgatcc agcatatctc ctcgtttcgc       5040

gggttggggc ggctttcgct gtacggcagt agtcggtgct cgtccagacg ggccagggtc       5100

atgtctttcc acgggcgcag ggtcctcgtc agcgtagtct gggtcacggt gaaggggtgc       5160

gctccgggct gcgcgctggc cagggtgcgc ttgaggctgg tcctgctggt gctgaagcgc       5220

tgccggtctt cgccctgcgc gtcggccagg tagcatttga ccatggtgtc atagtccagc       5280

ccctccgcgg cgtggccctt ggcgcgcagc ttgcccttgg aggaggcgcc gcacgagggg       5340

cagtgcagac ttttgagggc gtagagcttg ggcgcgagaa ataccgattc cggggagtag       5400

gcatccgcgc cgcaggcccc gcagacggtc tcgcattcca cgagccaggt gagctctggc       5460

cgttcggggt caaaaaccag gtttccccca tgctttttga tgcgtttctt acctctggtt       5520

tccatgagcc ggtgtccacg ctcggtgacg aaaaggctgt ccgtgtcccc gtatacagac       5580

ttgagaggcc tgtcctcgag cggtgttccg cggtcctcct cgtatagaaa ctcggaccac       5640

tctgagacaa aggctcgcgt ccaggccagc acgaaggagg ctaagtggga ggggtagcgg       5700

tcgttgtcca ctagggggtc cactcgctcc agggtgtgaa gacacatgtc gccctcttcg       5760

gcatcaagga aggtgattgg tttgtaggtg taggccacgt gaccgggtgt tcctgaaggg       5820

gggctataaa agggggtggg ggcgcgttcg tcctcactct cttccgcatc gctgtctgcg       5880

agggccagct gttggggtga gtactccctc tgaaaagcgg gcatgacttc tgcgctaaga       5940

ttgtcagttt ccaaaaacga ggaggatttg atattcacct ggcccgcggt gatgcctttg       6000

agggtggccg catccatctg gtcagaaaag acaatctttt tgttgtcaag cttggtggca       6060

aacgacccgt agagggcgtt ggacagcaac ttggcgatgg agcgcagggt ttggtttttg       6120

tcgcgatcgg cgcgctcctt ggccgcgatg tttagctgca cgtattcgcg cgcaacgcac       6180

cgccattcgg gaaagacggt ggtgcgctcg tcgggcacca ggtgcacgcg ccaaccgcgg       6240

ttgtgcaggg tgacaaggtc aacgctggtg gctacctctc cgcgtaggcg ctcgttggtc       6300

cagcagaggc ggccgccctt gcgcgagcag aatggcggta gggggtctag ctgcgtctcg       6360

tccggggggt ctgcgtccac ggtaaagacc ccgggcagca ggcgcgcgtc gaagtagtct       6420

atcttgcatc cttgcaagtc tagcgcctgc tgccatgcgc gggcggcaag cgcgcgctcg       6480

tatgggttga gtgggggacc ccatggcatg gggtgggtga gcgcggaggc gtacatgccg       6540

caaatgtcgt aaacgtagag gggctctctg agtattccaa gatatgtagg gtagcatctt       6600

ccaccgcgga tgctggcgcg cacgtaatcg tatagttcgt gcgagggagc gaggaggtcg       6660

ggaccgaggt tgctacgggc gggctgctct gctcggaaga ctatctgcct gaagatggca       6720

tgtgagttgg atgatatggt tggacgctgg aagacgttga agctggcgtc tgtgagacct       6780

accgcgtcac gcacgaagga ggcgtaggag tcgcgcagct tgttgaccag ctcggcggtg       6840

acctgcacgt ctagggcgca gtagtccagg gtttccttga tgatgtcata cttatcctgt       6900

cccttttttt tccacagctc gcggttgagg acaaactctt cgcggtcttt ccagtactct       6960

tggatcggaa acccgtcggc ctccgaacgg taagagccta gcatgtagaa ctggttgacg       7020

gcctggtagg cgcagcatcc cttttctacg ggtagcgcgt atgcctgcgc ggccttccgg       7080

agcgaggtgt gggtgagcgc aaaggtgtcc ctgaccatga ctttgaggta ctggtatttg       7140

aagtcagtgt cgtcgcatcc gccctgctcc cagagcaaaa agtccgtgcg ctttttggaa       7200

cgcggatttg gcagggcgaa ggtgacatcg ttgaagagta tctttcccgc gcgaggcata       7260

aagttgcgtg tgatgcggaa gggtcccggc acctcggaac ggttgttaat tacctgggcg       7320

gcgagcacga tctcgtcaaa gccgttgatg ttgtggccca caatgtaaag ttccaagaag       7380

cgcgggatgc ccttgatgga aggcaatttt ttaagttcct cgtaggtgag ctcttcaggg       7440

gagctgagcc cgtgctctga aagggcccag tctgcaagat gagggttgga agcgacgaat       7500

gagctccaca ggtcacgggc cattagcatt tgcaggtggt cgcgaaaggt cctaaactgg       7560

cgacctatgg ccattttttc tggggtgatg cagtagaagg taagcgggtc ttgttcccag       7620

cggtcccatc caaggttcgc ggctaggtct cgcgcggcag tcactagagg ctcatctccg       7680

ccgaacttca tgaccagcat gaagggcacg agctgcttcc caaaggcccc catccaagta       7740

taggtctcta catcgtaggt gacaaagaga cgctcggtgc gaggatgcga gccgatcggg       7800

aagaactgga tctcccgcca ccaattggag gagtggctat tgatgtggtg aaagtagaag       7860

tccctgcgac gggccgaaca ctcgtgctgg cttttgtaaa aacgtgcgca gtactggcag       7920

cggtgcacgg gctgtacatc ctgcacgagg ttgacctgac gaccgcgcac aaggaagcag       7980

agtgggaatt tgagcccctc gcctggcggg tttggctggt ggtcttctac ttcggctgct       8040

tgtccttgac cgtctggctg ctcgagggga gttacggtgg atcggaccac cacgccgcgc       8100

gagcccaaag tccagatgtc cgcgcgcggc ggtcggagct tgatgacaac atcgcgcaga       8160

tgggagctgt ccatggtctg gagctcccgc ggcgtcaggt caggcgggag ctcctgcagg       8220

tttacctcgc atagacgggt cagggcgcgg gctagatcca ggtgatacct aatttccagg       8280

ggctggttgg tggcggcgtc gatggcttgc aagaggccgc atccccgcgg cgcgactacg       8340

gtaccgcgcg gcgggcggtg ggccgcgggg gtgtccttgg atgatgcatc taaaagcggt       8400

gacgcgggcg agcccccgga ggtagggggg gctccggacc cgccgggaga gggggcaggg       8460

gcacgtcggc gccgcgcgcg ggcaggagct ggtgctgcgc gcgtaggttg ctggcgaacg       8520

cgacgacgcg gcggttgatc tcctgaatct ggcgcctctg cgtgaagacg acgggcccgg       8580

tgagcttgaa cctgaaagag agttcgacag aatcaatttc ggtgtcgttg acggcggcct       8640

ggcgcaaaat ctcctgcacg tctcctgagt tgtcttgata ggcgatctcg gccatgaact       8700

gctcgatctc ttcctcctgg agatctccgc gtccggctcg ctccacggtg gcggcgaggt       8760

cgttggaaat gcgggccatg agctgcgaga aggcgttgag gcctccctcg ttccagacgc       8820

ggctgtagac cacgccccct tcggcatcgc gggcgcgcat gaccacctgc gcgagattga       8880

gctccacgtg ccgggcgaag acggcgtagt ttcgcaggcg ctgaaagagg tagttgaggg       8940

tggtggcggt gtgttctgcc acgaagaagt acataaccca gcgtcgcaac gtggattcgt       9000

tgatatcccc caaggcctca aggcgctcca tggcctcgta gaagtccacg gcgaagttga       9060

aaaactggga gttgcgcgcc gacacggtta actcctcctc cagaagacgg atgagctcgg       9120

cgacagtgtc gcgcacctcg cgctcaaagg ctacaggggc ctcttcttct tcttcaatct       9180

cctcttccat aagggcctcc ccttcttctt cttctggcgg cggtggggga ggggggacac       9240

ggcggcgacg acggcgcacc gggaggcggt cgacaaagcg ctcgatcatc tccccgcggc       9300

gacggcgcat ggtctcggtg acggcgcggc cgttctcgcg ggggcgcagt tggaagacgc       9360

cgcccgtcat gtcccggtta tgggttggcg gggggctgcc atgcggcagg gatacggcgc       9420

taacgatgca tctcaacaat tgttgtgtag gtactccgcc gccgagggac ctgagcgagt       9480

ccgcatcgac cggatcggaa aacctctcga gaaaggcgtc taaccagtca cagtcgcaag       9540

gtaggctgag caccgtggcg ggcggcagcg ggcggcggtc ggggttgttt ctggcggagg       9600

tgctgctgat gatgtaatta aagtaggcgg tcttgagacg gcggatggtc gacagaagca       9660

ccatgtcctt gggtccggcc tgctgaatgc gcaggcggtc ggccatgccc caggcttcgt       9720

tttgacatcg gcgcaggtct ttgtagtagt cttgcatgag cctttctacc ggcacttctt       9780

cttctccttc ctcttgtcct gcatctcttg catctatcgc tgcggcggcg gcggagtttg       9840

gccgtaggtg gcgccctctt cctcccatgc gtgtgacccc gaagcccctc atcggctgaa       9900

gcagggctag gtcggcgaca acgcgctcgg ctaatatggc ctgctgcacc tgcgtgaggg       9960

tagactggaa gtcatccatg tccacaaagc ggtggtatgc gcccgtgttg atggtgtaag      10020

tgcagttggc cataacggac cagttaacgg tctggtgacc cggctgcgag agctcggtgt      10080

acctgagacg cgagtaagcc ctcgagtcaa atacgtagtc gttgcaagtc cgcaccaggt      10140

actggtatcc caccaaaaag tgcggcggcg gctggcggta gaggggccag cgtagggtgg      10200

ccggggctcc gggggcgaga tcttccaaca taaggcgatg atatccgtag atgtacctgg     10260

acatccaggt gatgccggcg gcggtggtgg aggcgcgcgg aaagtcgcgg acgcggttcc     10320

agatgttgcg cagcggcaaa aagtgctcca tggtcgggac gctctggccg gtcaggcgcg     10380

cgcaatcgtt gacgctctag cgtgcaaaag gagagcctgt aagcgggcac tcttccgtgg     10440

tctggtggat aaattcgcaa gggtatcatg gcggacgacc ggggttcgag ccccgtatcc     10500

ggccgtccgc cgtgatccat gcggttaccg cccgcgtgtc gaacccaggt gtgcgacgtc     10560

agacaacggg ggagtgctcc ttttggcttc cttccaggcg cggcggctgc tgcgctagct     10620

tttttggcca ctggccgcgc gcagcgtaag cggttaggct ggaaagcgaa agcattaagt     10680

ggctcgctcc ctgtagccgg agggttattt tccaagggtt gagtcgcggg acccccggtt     10740

cgagtctcgg accggccgga ctgcggcgaa cgggggtttg cctccccgtc atgcaagacc     10800

ccgcttgcaa attcctccgg aaacagggac gagccccttt tttgcttttc ccagatgcat     10860

ccggtgctgc ggcagatgcg cccccctcct cagcagcggc aagagcaaga gcagcggcag     10920

acatgcaggg caccctcccc tcctcctacc gcgtcaggag gggcgacatc cgcggttgac     10980

gcggcagcag atggtgatta cgaacccccg cggcgccggg cccggcacta cctggacttg     11040

gaggagggcg agggcctggc gcggctagga gcgccctctc ctgagcggca cccaagggtg     11100

cagctgaagc gtgatacgcg tgaggcgtac gtgccgcggc agaacctgtt tcgcgaccgc     11160

gagggagagg agcccgagga gatgcgggat cgaaagttcc acgcagggcg cgagctgcgg     11220

catggcctga atcgcgagcg gttgctgcgc gaggaggact ttgagcccga cgcgcgaacc     11280

gggattagtc ccgcgcgcgc acacgtggcg gccgccgacc tggtaaccgc atacgagcag     11340

acggtgaacc aggagattaa ctttcaaaaa agctttaaca accacgtgcg tacgcttgtg     11400

gcgcgcgagg aggtggctat aggactgatg catctgtggg actttgtaag cgcgctggag     11460

caaaacccaa atagcaagcc gctcatggcg cagctgttcc ttatagtgca gcacagcagg     11520

gacaacgagg cattcaggga tgcgctgcta aacatagtag agcccgaggg ccgctggctg     11580

ctcgatttga taaacatcct gcagagcata gtggtgcagg agcgcagctt gagcctggct     11640

gacaaggtgg ccgccatcaa ctattccatg cttagcctgg gcaagtttta cgcccgcaag     11700

atataccata ccccttacgt tcccatagac aaggaggtaa agatcgaggg gttctacatg     11760

cgcatggcgc tgaaggtgct taccttgagc gacgacctgg gcgtttatcg caacgagcgc     11820

atccacaagg ccgtgagcgt gagccggcgg cgcgagctca gcgaccgcga gctgatgcac     11880

agcctgcaaa gggccctggc tggcacgggc agcggcgata gagaggccga gtcctacttt     11940

gacgcgggcg ctgacctgcg ctgggcccca agccgacgcg ccctggaggc agctggggcc     12000

ggacctgggc tggcggtggc acccgcgcgc gctggcaacg tcggcggcgt ggaggaatat     12060

gacgaggacg atgagtacga gccagaggac ggcgagtact aagcggtgat gtttctgatc     12120

agatgatgca agacgcaacg gacccggcgg tgcgggcggc gctgcagagc cagccgtccg     12180

gccttaactc cacggacgac tggcgccagg tcatggaccg catcatgtcg ctgactgcgc     12240

gcaatcctga cgcgttccgg cagcagccgc aggccaaccg gctctccgca attctggaag     12300

cggtggtccc ggcgcgcgca aaccccacgc acgagaaggt gctggcgatc gtaaacgcgc     12360

tggccgaaaa cagggccatc cggcccgacg aggccggcct ggtctacgac gcgctgcttc     12420

agcgcgtggc tcgttacaac agcggcaacg tgcagaccaa cctggaccgg ctggtggggg     12480

atgtgcgcga ggccgtggcg cagcgtgagc gcgcgcagca gcagggcaac ctgggctcca     12540

tggttgcact aaacgccttc ctgagtacac agcccgccaa cgtgccgcgg ggacaggagg     12600

actacaccaa ctttgtgagc gcactgcggc taatggtgac tgagacaccg caaagtgagg     12660

tgtaccagtc tgggccagac tattttttcc agaccagtag acaaggcctg cagaccgtaa     12720

acctgagcca ggctttcaaa aacttgcagg ggctgtgggg ggtgcgggct cccacaggcg     12780

accgcgcgac cgtgtctagc ttgctgacgc ccaactcgcg cctgttgctg ctgctaatag     12840

cgcccttcac ggacagtggc agcgtgtccc gggacacata cctaggtcac ttgctgacac     12900

tgtaccgcga ggccataggt caggcgcatg tggacgagca tactttccag gagattacaa     12960

gtgtcagccg cgcgctgggg caggaggaca cgggcagcct ggaggcaacc ctaaactacc     13020

tgctgaccaa ccggcggcag aagatcccct cgttgcacag tttaaacagc gaggaggagc     13080

gcattttgcg ctacgtgcag cagagcgtga gccttaacct gatgcgcgac ggggtaacgc     13140

ccagcgtggc gctggacatg accgcgcgca acatggaacc gggcatgtat gcctcaaacc     13200

ggccgtttat caaccgccta atggactact tgcatcgcgc ggccgccgtg aaccccgagt     13260

atttcaccaa tgccatcttg aacccgcact ggctaccgcc ccctggtttc tacaccgggg     13320

gattcgaggt gcccgagggt aacgatggat tcctctggga cgacatagac gacagcgtgt     13380

tttccccgca accgcagacc ctgctagagt tgcaacagcg cgagcaggca gaggcggcgc     13440

tgcgaaagga aagcttccgc aggccaagca gcttgtccga tctaggcgct gcggccccgc     13500

ggtcagatgc tagtagccca tttccaagct tgatagggtc tcttaccagc actcgcacca     13560

cccgcccgcg cctgctgggc gaggaggagt acctaaacaa ctcgctgctg cagccgcagc     13620

gcgaaaaaaa cctgcctccg gcatttccca acaacgggat agagagccta gtggacaaga     13680

tgagtagatg gaagacgtac gcgcaggagc acagggacgt gccaggcccg cgcccgccca     13740

cccgtcgtca aaggcacgac cgtcagcggg gtctggtgtg ggaggacgat gactcggcag     13800

acgacagcag cgtcctggat ttgggaggga gtggcaaccc gtttgcgcac cttcgcccca     13860

ggctggggag aatgttttaa aaaaaaaaaa agcatgatgc aaaataaaaa actcaccaag     13920

gccatggcac cgagcgttgg ttttcttgta ttccccttag tatgcggcgc gcggcgatgt     13980

atgaggaagg tcctcctccc tcctacgaga gtgtggtgag cgcggcgcca gtggcggcgg     14040

cgctgggttc tcccttcgat gctcccctgg acccgccgtt tgtgcctccg cggtacctgc     14100

ggcctaccgg ggggagaaac agcatccgtt actctgagtt ggcaccccta ttcgacacca     14160

cccgtgtgta cctggtggac aacaagtcaa cggatgtggc atccctgaac taccagaacg     14220

accacagcaa ctttctgacc acggtcattc aaaacaatga ctacagcccg ggggaggcaa     14280

gcacacagac catcaatctt gacgaccggt cgcactgggg cggcgacctg aaaaccatcc     14340

tgcataccaa catgccaaat gtgaacgagt tcatgtttac caataagttt aaggcgcggg     14400

tgatggtgtc gcgcttgcct actaaggaca atcaggtgga gctgaaatac gagtgggtgg     14460

agttcacgct gcccgagggc aactactccg agaccatgac catagacctt atgaacaacg     14520

cgatcgtgga gcactacttg aaagtgggca gacagaacgg ggttctggaa agcgacatcg     14580

gggtaaagtt tgacacccgc aacttcagac tggggtttga ccccgtcact ggtcttgtca     14640

tgcctggggt atatacaaac gaagccttcc atccagacat cattttgctg ccaggatgcg     14700

gggtggactt cacccacagc cgcctgagca acttgttggg catccgcaag cggcaaccct     14760

tccaggaggg ctttaggatc acctacgatg atctggaggg tggtaacatt cccgcactgt     14820

tggatgtgga cgcctaccag gcgagcttga aagatgacac cgaacagggc gggggtggcg     14880

caggcggcag caacagcagt ggcagcggcg cggaagagaa ctccaacgcg gcagccgcgg     14940

caatgcagcc ggtggaggac atgaacgatc atgccattcg cggcgacacc tttgccacac     15000

gggctgagga gaagcgcgct gaggccgaag cagcggccga agctgccgcc cccgctgcgc     15060

aacccgaggt cgagaagcct cagaagaaac cggtgatcaa acccctgaca gaggacagca     15120

agaaacgcag ttacaaccta ataagcaatg acagcacctt cacccagtac cgcagctggt     15180

accttgcata caactacggc gaccctcaga ccggaatccg ctcatggacc ctgctttgca     15240

ctcctgacgt aacctgcggc tcggagcagg tctactggtc gttgccagac atgatgcaag     15300

accccgtgac cttccgctcc acgcgccaga tcagcaactt tccggtggtg ggcgccgagc     15360

tgttgcccgt gcactccaag agcttctaca acgaccaggc cgtctactcc caactcatcc     15420

gccagtttac ctctctgacc cacgtgttca atcgctttcc cgagaaccag attttggcgc     15480

gcccgccagc ccccaccatc accaccgtca gtgaaaacgt tcctgctctc acagatcacg     15540

ggacgctacc gctgcgcaac agcatcggag gagtccagcg agtgaccatt actgacgcca     15600

gacgccgcac ctgcccctac gtttacaagg ccctgggcat agtctcgccg cgcgtcctat     15660

cgagccgcac tttttgagca agcatgtcca tccttatatc gcccagcaat aacacaggct     15720

ggggcctgcg cttcccaagc aagatgtttg gcggggccaa gaagcgctcc gaccaacacc     15780

cagtgcgcgt gcgcgggcac taccgcgcgc cctggggcgc gcacaaacgc ggccgcactg     15840

ggcgcaccac cgtcgatgac gccatcgacg cggtggtgga ggaggcgcgc aactacacgc     15900

ccacgccgcc accagtgtcc acagtggacg cggccattca gaccgtggtg cgcggagccc     15960

ggcgctatgc taaaatgaag agacggcgga ggcgcgtagc acgtcgccac cgccgccgac     16020

ccggcactgc cgcccaacgc gcggcggcgg ccctgcttaa ccgcgcacgt cgcaccggcc     16080

gacgggcggc catgcgggcc gctcgaaggc tggccgcggg tattgtcact gtgcccccca     16140

ggtccaggcg acgagcggcc gccgcagcag ccgcggccat tagtgctatg actcagggtc     16200

gcaggggcaa cgtgtattgg gtgcgcgact cggttagcgg cctgcgcgtg cccgtgcgca     16260

cccgcccccc gcgcaactag attgcaagaa aaaactactt agactcgtac tgttgtatgt     16320

atccagcggc ggcggcgcgc aacgaagcta tgtccaagcg caaaatcaaa gaagagatgc     16380

tccaggtcat cgcgccggag atctatggcc ccccgaagaa ggaagagcag gattacaagc     16440

cccgaaagct aaagcgggtc aaaaagaaaa agaaagatga tgatgatgaa cttgacgacg     16500

aggtggaact gctgcacgct accgcgccca ggcgacgggt acagtggaaa ggtcgacgcg     16560

taaaacgtgt tttgcgaccc ggcaccaccg tagtctttac gcccggtgag cgctccaccc     16620

gcacctacaa gcgcgtgtat gatgaggtgt acggcgacga ggacctgctt gagcaggcca     16680

acgagcgcct cggggagttt gcctacggaa agcggcataa ggacatgctg gcgttgccgc     16740

tggacgaggg caacccaaca cctagcctaa agcccgtaac actgcagcag gtgctgcccg     16800

cgcttgcacc gtccgaagaa aagcgcggcc taaagcgcga gtctggtgac ttggcaccca     16860

ccgtgcagct gatggtaccc aagcgccagc gactggaaga tgtcttggaa aaaatgaccg     16920

tggaacctgg gctggagccc gaggtccgcg tgcggccaat caagcaggtg gcgccgggac     16980

tgggcgtgca gaccgtggac gttcagatac ccactaccag tagcaccagt attgccaccg     17040

ccacagaggg catggagaca caaacgtccc cggttgcctc agcggtggcg gatgccgcgg     17100

tgcaggcggt cgctgcggcc gcgtccaaga cctctacgga ggtgcaaacg gacccgtgga     17160

tgtttcgcgt ttcagccccc cggcgcccgc gccgttcgag gaagtacggc gccgccagcg     17220

cgctactgcc cgaatatgcc ctacatcctt ccattgcgcc tacccccggc tatcgtggct     17280

acacctaccg ccccagaaga cgagcaacta cccgacgccg aaccaccact ggaacccgcc     17340

gccgccgtcg ccgtcgccag cccgtgctgg ccccgatttc cgtgcgcagg gtggctcgcg     17400

aaggaggcag gaccctggtg ctgccaacag cgcgctacca ccccagcatc gtttaaaagc     17460

cggtctttgt ggttcttgca gatatggccc tcacctgccg cctccgtttc ccggtgccgg     17520

gattccgagg aagaatgcac cgtaggaggg gcatggccgg ccacggcctg acgggcggca     17580

tgcgtcgtgc gcaccaccgg cggcggcgcg cgtcgcaccg tcgcatgcgc ggcggtatcc     17640

tgcccctcct tattccactg atcgccgcgg cgattggcgc cgtgcccgga attgcatccg     17700

tggccttgca ggcgcagaga cactgattaa aaacaagttg catgtggaaa aatcaaaata     17760

aaaagtctgg actctcacgc tcgcttggtc ctgtaactat tttgtagaat ggaagacatc    17820

aactttgcgt ctctggcccc gcgacacggc tcgcgcccgt tcatgggaaa ctggcaagat    17880

atcggcacca gcaatatgag cggtggcgcc ttcagctggg gctcgctgtg gagcggcatt    17940

aaaaatttcg gttccaccgt taagaactat ggcagcaagg cctggaacag cagcacaggc    18000

cagatgctga gggataagtt gaaagagcaa aatttccaac aaaaggtggt agatggcctg    18060

gcctctggca ttagcggggt ggtggacctg gccaaccagg cagtgcaaaa taagattaac    18120

agtaagcttg atccccgccc tcccgtagag gagcctccac cggccgtgga gacagtgtct    18180

ccagaggggc gtggcgaaaa gcgtccgcgc cccgacaggg aagaaactct ggtgacgcaa    18240

atagacgagc ctccctcgta cgaggaggca ctaaagcaag gcctgcccac cacccgtccc    18300

atcgcgccca tggctaccgg agtgctgggc cagcacacac ccgtaacgct ggacctgcct    18360

ccccccgccg acacccagca gaaacctgtg ctgccaggcc cgaccgccgt tgttgtaacc    18420

cgtcctagcc gcgcgtccct gcgccgcgcc gccagcggtc cgcgatcgtt gcggcccgta    18480

gccagtggca actggcaaag cacactgaac agcatcgtgg gtctgggggt gcaatccctg    18540

aagcgccgac gatgcttctg atagctaacg tgtcgtatgt gtgtcatgta tgcgtccatg    18600

tcgccgccag aggagctgct gagccgccgc gcgcccgctt tccaagatgg ctaccccttc    18660

gatgatgccg cagtggtctt acatgcacat ctcgggccag gacgcctcgg agtacctgag    18720

ccccgggctg gtgcagtttg cccgcgccac cgagacgtac ttcagcctga ataacaagtt    18780

tagaaacccc acggtggcgc ctacgcacga cgtgaccaca gaccggtccc agcgtttgac    18840

gctgcggttc atccctgtgg accgtgagga tactgcgtac tcgtacaagg cgcggttcac    18900

cctagctgtg ggtgataacc gtgtgctgga catggcttcc acgtactttg acatccgcgg    18960

cgtgctggac aggggcccta cttttaagcc ctactctggc actgcctaca acgccctggc    19020

tcccaagggt gccccaaatc cttgcgaatg ggatgaagct gctactgctc ttgaaataaa    19080

cctagaagaa gaggacgatg acaacgaaga cgaagtagac gagcaagctg agcagcaaaa    19140

aactcacgta tttgggcagg cgccttattc tggtataaat attacaaagg agggtattca    19200

aataggtgtc gaaggtcaaa cacctaaata tgccgataaa acatttcaac ctgaacctca    19260

aataggagaa tctcagtggt acgaaacaga aattaatcat gcagctggga gagtcctaaa    19320

aaagactacc ccaatgaaac catgttacgg ttcatatgca aaacccacaa atgaaaatgg    19380

agggcaaggc attcttgtaa agcaacaaaa tggaaagcta gaaagtcaag tggaaatgca    19440

atttttctca actactgagg cagccgcagg caatggtgat aacttgactc ctaaagtggt    19500

attgtacagt gaagatgtag atatagaaac cccagacact catatttctt acatgcccac    19560

tattaaggaa ggtaactcac gagaactaat gggccaacaa tctatgccca acaggcctaa    19620

ttacattgct tttagggaca attttattgg tctaatgtat tacaacagca cgggtaatat    19680

gggtgttctg gcgggccaag catcgcagtt gaatgctgtt gtagatttgc aagacagaaa    19740

cacagagctt tcataccagc ttttgcttga ttccattggt gatagaacca ggtacttttc    19800

tatgtggaat caggctgttg acagctatga tccagatgtt agaattattg aaaatcatgg    19860

aactgaagat gaacttccaa attactgctt tccactggga ggtgtgatta atacagagac    19920

tcttaccaag gtaaaaccta aaacaggtca ggaaaatgga tgggaaaaag atgctacaga    19980

attttcagat aaaaatgaaa taagagttgg aaataatttt gccatggaaa tcaatctaaa    20040

tgccaacctg tggagaaatt tcctgtactc caacatagcg ctgtatttgc ccgacaagct    20100

aaagtacagt ccttccaacg taaaaatttc tgataaccca aacacctacg actacatgaa    20160

caagcgagtg gtggctcccg ggctagtgga ctgctacatt aaccttggag cacgctggtc    20220

ccttgactat atggacaacg tcaacccatt taaccaccac cgcaatgctg gcctgcgcta    20280

ccgctcaatg ttgctgggca atggtcgcta tgtgcccttc cacatccagg tgcctcagaa    20340

gttctttgcc attaaaaacc tccttctcct gccgggctca tacacctacg agtggaactt    20400

caggaaggat gttaacatgg ttctgcagag ctccctagga aatgacctaa gggttgacgg    20460

agccagcatt aagtttgata gcatttgcct ttacgccacc ttcttcccca tggcccacaa    20520

caccgcctcc acgcttgagg ccatgcttag aaacgacacc aacgaccagt cctttaacga    20580

ctatctctcc gccgccaaca tgctctaccc tatacccgcc aacgctacca acgtgcccat    20640

atccatcccc tcccgcaact gggcggcttt ccgcggctgg gccttcacgc gccttaagac    20700

taaggaaacc ccatcactgg gctcgggcta cgacccttat tacacctact ctggctctat    20760

accctaccta gatggaacct tttacctcaa ccacaccttt aagaaggtgg ccattacctt    20820

tgactcttct gtcagctggc ctggcaatga ccgcctgctt acccccaacg agtttgaaat    20880

taagcgctca gttgacgggg agggttacaa cgttgcccag tgtaacatga ccaaagactg    20940

gttcctggta caaatgctag ctaactataa cattggctac cagggcttct atatcccaga    21000

gagctacaag gaccgcatgt actccttctt tagaaacttc cagcccatga gccgtcaggt    21060

ggtggatgat actaaataca aggactacca acaggtgggc atcctacacc aacacaacaa    21120

ctctggattt gttggctacc ttgcccccac catgcgcgaa ggacaggcct accctgctaa    21180

cttcccctat ccgcttatag gcaagaccgc agttgacagc attacccaga aaaagtttct    21240

ttgcgatcgc accctttggc gcatcccatt ctccagtaac tttatgtcca tgggcgcact    21300

cacagacctg ggccaaaacc ttctctacgc caactccgcc cacgcgctag acatgacttt    21360

tgaggtggat cccatggacg agcccaccct tctttatgtt ttgtttgaag tctttgacgt    21420

ggtccgtgtg caccagccgc accgcggcgt catcgaaacc gtgtacctgc gcacgccctt    21480

ctcggccggc aacgccacaa cataaagaag caagcaacat caacaacagc tgccgccatg    21540

ggctccagtg agcaggaact gaaagccatt gtcaaagatc ttggttgtgg gccatatttt    21600

ttgggcacct atgacaagcg ctttccaggc tttgtttctc cacacaagct cgcctgcgcc    21660

atagtcaata cggccggtcg cgagactggg ggcgtacact ggatggcctt tgcctggaac    21720

ccgcactcaa aaacatgcta cctctttgag ccctttggct tttctgacca gcgactcaag    21780

caggtttacc agtttgagta cgagtcactc ctgcgccgta gcgccattgc ttcttccccc    21840

gaccgctgta taacgctgga aaagtccacc caaagcgtac aggggcccaa ctcggccgcc    21900

tgtggactat tctgctgcat gtttctccac gcctttgcca actggcccca aactcccatg    21960

gatcacaacc ccaccatgaa ccttattacc ggggtaccca actccatgct caacagtccc    22020

caggtacagc ccaccctgcg tcgcaaccag gaacagctct acagcttcct ggagcgccac    22080

tcgccctact tccgcagcca cagtgcgcag attaggagcg ccacttcttt ttgtcacttg    22140

aaaaacatgt aaaaataatg tactagagac actttcaata aaggcaaatg cttttatttg    22200

tacactctcg ggtgattatt tacccccacc cttgccgtct gcgccgttta aaaatcaaag    22260

gggttctgcc gcgcatcgct atgcgccact ggcagggaca cgttgcgata ctggtgttta    22320

gtgctccact taaactcagg cacaaccatc cgcggcagct cggtgaagtt ttcactccac    22380

aggctgcgca ccatcaccaa cgcgtttagc aggtcgggcg ccgatatctt gaagtcgcag    22440

ttggggcctc cgccctgcgc gcgcgagttg cgatacacag ggttgcagca ctggaacact    22500

atcagcgccg ggtggtgcac gctggccagc acgctcttgt cggagatcag atccgcgtcc    22560

aggtcctccg cgttgctcag ggcgaacgga gtcaactttg gtagctgcct tcccaaaaag    22620

ggcgcgtgcc caggctttga gttgcactcg caccgtagtg gcatcaaaag gtgaccgtgc    22680

ccggtctggg cgttaggata cagcgcctgc ataaaagcct tgatctgctt aaaagccacc    22740

tgagcctttg cgccttcaga gaagaacatg ccgcaagact tgccggaaaa ctgattggcc    22800

ggacaggccg cgtcgtgcac gcagcacctt gcgtcggtgt tggagatctg caccacattt    22860

cggccccacc ggttcttcac gatcttggcc ttgctagact gctccttcag cgcgcgctgc    22920

ccgttttcgc tcgtcacatc catttcaatc acgtgctcct tatttatcat aatgcttccg    22980

tgtagacact taagctcgcc ttcgatctca gcgcagcggt gcagccacaa cgcgcagccc    23040

gtgggctcgt gatgcttgta ggtcacctct gcaaacgact gcaggtacgc ctgcaggaat    23100

cgccccatca tcgtcacaaa ggtcttgttg ctggtgaagg tcagctgcaa cccgcggtgc    23160

tcctcgttca gccaggtctt gcatacggcc gccagagctt ccacttggtc aggcagtagt    23220

ttgaagttcg cctttagatc gttatccacg tggtacttgt ccatcagcgc gcgcgcagcc    23280

tccatgccct tctcccacgc agacacgatc ggcacactca gcgggttcat caccgtaatt    23340

tcactttccg cttcgctggg ctcttcctct tcctcttgcg tccgcatacc acgcgccact    23400

gggtcgtctt cattcagccg ccgcactgtg cgcttacctc ctttgccatg cttgattagc    23460

accggtgggt tgctgaaacc caccatttgt agcgccacat cttctctttc ttcctcgctg    23520

tccacgatta cctctggtga tggcgggcgc tcgggcttgg gagaagggcg cttctttttc    23580

ttcttgggcg caatggccaa atccgccgcc gaggtcgatg gccgcgggct gggtgtgcgc    23640

ggcaccagcg cgtcttgtga tgagtcttcc tcgtcctcgg actcgatacg ccgcctcatc    23700

cgcttttttg ggggcgcccg gggaggcggc ggcgacgggg acggggacga cacgtcctcc    23760

atggttgggg gacgtcgcgc cgcaccgcgt ccgcgctcgg gggtggtttc gcgctgctcc    23820

tcttcccgac tggccatttc cttctcctat aggcagaaaa agatcatgga gtcagtcgag    23880

aagaaggaca gcctaaccgc cccctctgag ttcgccacca ccgcctccac cgatgccgcc    23940

aacgcgccta ccaccttccc cgtcgaggca cccccgcttg aggaggagga agtgattatc    24000

gagcaggacc caggttttgt aagcgaagac gacgaggacc gctcagtacc aacagaggat    24060

aaaaagcaag accaggacaa cgcagaggca aacgaggaac aagtcgggcg gggggacgaa    24120

aggcatggcg actacctaga tgtgggagac gacgtgctgt tgaagcatct gcagcgccag    24180

tgcgccatta tctgcgacgc gttgcaagag cgcagcgatg tgcccctcgc catagcggat    24240

gtcagccttg cctacgaacg ccacctattc tcaccgcgcg taccccccaa acgccaagaa    24300

aacggcacat gcgagcccaa cccgcgcctc aacttctacc ccgtatttgc cgtgccagag    24360

gtgcttgcca cctatcacat ctttttccaa aactgcaaga tacccctatc ctgccgtgcc    24420

aaccgcagcc gagcggacaa gcagctggcc ttgcggcagg gcgctgtcat acctgatatc    24480

gcctcgctca acgaagtgcc aaaaatcttt gagggtcttg gacgcgacga gaagcgcgcg    24540

gcaaacgctc tgcaacagga aaacagcgaa aatgaaagtc actctggagt gttggtggaa    24600

ctcgagggtg acaacgcgcg cctagccgta ctaaaacgca gcatcgaggt cacccacttt    24660

gcctacccgg cacttaacct accccccaag gtcatgagca cagtcatgag tgagctgatc    24720

gtgcgccgtg cgcagcccct ggagagggat gcaaatttgc aagaacaaac agaggagggc    24780

ctacccgcag ttggcgacga gcagctagcg cgctggcttc aaacgcgcga gcctgccgac    24840

ttggaggagc gacgcaaact aatgatggcc gcagtgctcg ttaccgtgga gcttgagtgc    24900

atgcagcggt tctttgctga cccggagatg cagcgcaagc tagaggaaac attgcactac    24960

acctttcgac agggctacgt acgccaggcc tgcaagatct ccaacgtgga gctctgcaac    25020

ctggtctcct accttggaat tttgcacgaa aaccgccttg ggcaaaacgt gcttcattcc    25080

acgctcaagg gcgaggcgcg ccgcgactac gtccgcgact gcgtttactt atttctatgc    25140

tacacctggc agacggccat gggcgtttgg cagcagtgct tggaggagtg caacctcaag    25200

gagctgcaga aactgctaaa gcaaaacttg aaggacctat ggacggcctt caacgagcgc    25260

tccgtggccg cgcacctggc ggacatcatt ttccccgaac gcctgcttaa aaccctgcaa    25320

cagggtctgc cagacttcac cagtcaaagc atgttgcaga actttaggaa ctttatccta    25380

gagcgctcag gaatcttgcc cgccacctgc tgtgcacttc ctagcgactt tgtgcccatt    25440

aagtaccgcg aatgccctcc gccgctttgg ggccactgct accttctgca gctagccaac    25500

taccttgcct accactctga cataatggaa gacgtgagcg gtgacggtct actggagtgt    25560

cactgtcgct gcaacctatg caccccgcac cgctccctgg tttgcaattc gcagctgctt    25620

aacgaaagtc aaattatcgg tacctttgag ctgcagggtc cctcgcctga cgaaaagtcc    25680

gcggctccgg ggttgaaact cactccgggg ctgtggacgt cggcttacct tcgcaaattt    25740

gtacctgagg actaccacgc ccacgagatt aggttctacg aagaccaatc ccgcccgcct    25800

aatgcggagc ttaccgcctg cgtcattacc cagggccaca ttcttggcca attgcaagcc    25860

atcaacaaag cccgccaaga gtttctgcta cgaaagggac ggggggttta cttggacccc    25920

cagtccggcg aggagctcaa cccaatcccc ccgccgccgc agccctatca gcagcagccg    25980

cgggcccttg cttcccagga tggcacccaa aaagaagctg cagctgccgc cgccacccac    26040

ggacgaggag gaatactggg acagtcaggc agaggaggtt ttggacgagg aggaggagga    26100

catgatggaa gactgggaga gcctagacga ggaagcttcc gaggtcgaag aggtgtcaga    26160

cgaaacaccg tcaccctcgg tcgcattccc ctcgccggcg ccccagaaat cggcaaccgg    26220

ttccagcatg gctacaacct ccgctcctca ggcgccgccg gcactgcccg ttcgccgacc    26280

caaccgtaga tgggacacca ctggaaccag ggccggtaag tccaagcagc cgccgccgtt    26340

agcccaagag caacaacagc gccaaggcta ccgctcatgg cgcgggcaca agaacgccat    26400

agttgcttgc ttgcaagact gtgggggcaa catctccttc gcccgccgct ttcttctcta    26460

ccatcacggc gtggccttcc cccgtaacat cctgcattac taccgtcatc tctacagccc    26520

atactgcacc ggcggcagcg gcagcaacag cagcggccac acagaagcaa aggcgaccgg    26580

atagcaagac tctgacaaag cccaagaaat ccacagcggc ggcagcagca ggaggaggag    26640

cgctgcgtct ggcgcccaac gaacccgtat cgacccgcga gcttagaaac aggatttttc    26700

ccactctgta tgctatattt caacagagca ggggccaaga acaagagctg aaaataaaaa    26760

acaggtctct gcgatccctc acccgcagct gcctgtatca caaaagcgaa gatcagcttc    26820

ggcgcacgct ggaagacgcg gaggctctct tcagtaaata ctgcgcgctg actcttaagg    26880

actagtttcg cgccctttct caaatttaag cgcgaaaact acgtcatctc cagcggccac    26940

acccggcgcc agcacctgtt gtcagcgcca ttatgagcaa ggaaattccc acgccctaca    27000

tgtggagtta ccagccacaa atgggacttg cggctggagc tgcccaagac tactcaaccc    27060

gaataaacta catgagcgcg ggaccccaca tgatatcccg ggtcaacgga atacgcgccc    27120

accgaaaccg aattctcctg gaacaggcgg ctattaccac cacacctcgt aataacctta    27180

atccccgtag ttggcccgct gccctggtgt accaggaaag tcccgctccc accactgtgg    27240

tacttcccag agacgcccag gccgaagttc agatgactaa ctcaggggcg cagcttgcgg    27300

gcggctttcg tcacagggtg cggtcgcccg ggcagggtat aactcacctg acaatcagag    27360

ggcgaggtat tcagctcaac gacgagtcgg tgagctcctc gcttggtctc cgtccggacg    27420

ggacatttca gatcggcggc gccggccgct cttcattcac gcctcgtcag gcaatcctaa    27480

ctctgcagac ctcgtcctct gagccgcgct ctggaggcat tggaactctg caatttattg    27540

aggagtttgt gccatcggtc tactttaacc ccttctcggg acctcccggc cactatccgg    27600

atcaatttat tcctaacttt gacgcggtaa aggactcggc ggacggctac gactgaatgt    27660

taagtggaga ggcagagcaa ctgcgcctga aacacctggt ccactgtcgc cgccacaagt    27720

gctttgcccg cgactccggt gagttttgct actttgaatt gcccgaggat catatcgagg    27780

gcccggcgca cggcgtccgg cttaccgccc agggagagct tgcccgtagc ctgattcggg    27840

agtttaccca gcgccccctg ctagttgagc gggacagggg accctgtgtt ctcactgtga    27900

tttgcaactg tcctaaccct ggattacatc aagatctttg ttgccatctc tgtgctgagt    27960

ataataaata cagaaattaa aatatactgg ggctcctatc gccatcctgt aaacgccacc    28020

gtcttcaccc gcccaagcaa accaaggcga accttacctg gtacttttaa catctctccc    28080

tctgtgattt acaacagttt caacccagac ggagtgagtc tacgagagaa cctctccgag    28140

ctcagctact ccatcagaaa aaacaccacc ctccttacct gccgggaacg tacgagtgcg    28200

tcaccggccg ctgcaccaca cctaccgcct gaccgtaaac cagacttttt ccggacagac    28260

ctcaataact ctgtttacca gaacaggagg tgagcttaga aaacccttag ggtattaggc    28320

caaaggcgca gctactgtgg ggtttatgaa caattcaagc aactctacgg gctattctaa    28380

ttcaggtttc tctagaaatg gacggaatta ttacagagca gcgcctgcta gaaagacgca    28440

gggcagcggc cgagcaacag cgcatgaatc aagagctcca agacatggtt aacttgcacc    28500

agtgcaaaag gggtatcttt tgtctggtaa agcaggccaa agtcacctac gacagtaata    28560

ccaccggaca ccgccttagc tacaagttgc caaccaagcg tcagaaattg gtggtcatgg    28620

tgggagaaaa gcccattacc ataactcagc actcggtaga aaccgaaggc tgcattcact    28680

caccttgtca aggacctgag gatctctgca cccttattaa gaccctgtgc ggtctcaaag    28740

atcttattcc ctttaactaa taaaaaaaaa taataaagca tcacttactt aaaatcagtt    28800

agcaaatttc tgtccagttt attcagcagc acctccttgc cctcctccca gctctggtat    28860

tgcagcttcc tcctggctgc aaactttctc cacaatctaa atggaatgtc agtttcctcc    28920

tgttcctgtc catccgcacc cactatcttc atgttgttgc agatgaagcg cgcaagaccg    28980

tctgaagata ccttcaaccc cgtgtatcca tatgacacgg aaaccggtcc tccaactgtg    29040

ccttttctta ctcctccctt tgtatccccc aatgggtttc aagagagtcc ccctggggta    29100

ctctctttgc gcctatccga acctctagtt acctccaatg gcatgcttgc gctcaaaatg    29160

ggcaacggcc tctctctgga cgaggccggc aaccttacct cccaaaatgt aaccactgtg    29220

agcccacctc tcaaaaaaac caagtcaaac ataaacctgg aaatatctgc acccctcaca    29280

gttacctcag aagccctaac tgtggctgcc gccgcacctc taatggtcgc gggcaacaca    29340

ctcaccatgc aatcacaggc cccgctaacc gtgcacgact ccaaacttag cattgccacc    29400

caaggacccc tcacagtgtc agaaggaaag ctagccctgc aaacatcagg ccccctcacc    29460

accaccgata gcagtaccct tactatcact gcctcacccc ctctaactac tgccactggt    29520

agcttgggca ttgacttgaa agagcccatt tatacacaaa atggaaaact aggactaaag    29580

tacggggctc ctttgcatgt aacagacgac ctaaacactt tgaccgtagc aactggtcca    29640

ggtgtgacta ttaataatac ttccttgcaa actaaagtta ctggagcctt gggttttgat    29700

tcacaaggca atatgcaact taatgtagca ggaggactaa ggattgattc tcaaaacaga    29760

cgccttatac ttgatgttag ttatccgttt gatgctcaaa accaactaaa tctaagacta    29820

ggacagggcc ctctttttat aaactcagcc cacaacttgg atattaacta caacaaaggc    29880

ctttacttgt ttacagcttc aaacaattcc aaaaagcttg aggttaacct aagcactgcc    29940

aaggggttga tgtttgacgc tacagccata gccattaatg caggagatgg gcttgaattt    30000

ggttcaccta atgcaccaaa cacaaatccc ctcaaaacaa aaattggcca tggcctagaa    30060

tttgattcaa acaaggctat ggttcctaaa ctaggaactg gccttagttt tgacagcaca    30120

ggtgccatta cagtaggaaa caaaaataat gataagctaa ctttgtggac cacaccagct    30180

ccatctccta actgtagact aaatgcagag aaagatgcta aactcacttt ggtcttaaca    30240

aaatgtggca gtcaaatact tgctacagtt tcagttttgg ctgttaaagg cagtttggct    30300

ccaatatctg gaacagttca aagtgctcat cttattataa gatttgacga aaatggagtg    30360

ctactaaaca attccttcct ggacccagaa tattggaact ttagaaatgg agatcttact    30420

gaaggcacag cctatacaaa cgctgttgga tttatgccta acctatcagc ttatccaaaa    30480

tctcacggta aaactgccaa aagtaacatt gtcagtcaag tttacttaaa cggagacaaa    30540

actaaacctg taacactaac cattacacta aacggtacac aggaaacagg agacacaact    30600

ccaagtgcat actctatgtc attttcatgg gactggtctg gccacaacta cattaatgaa    30660

atatttgcca catcctctta cactttttca tacattgccc aagaataaag aatcgtttgt    30720

gttatgtttc aacgtgttta tttttcaatt gcccgggatc ggtgatcacc gatccagaca    30780

tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga aaaaaatgct    30840

ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc tgcaataaac    30900

aagttcccgg atcgcgatcc ggcccgaggc tgtagccgac gatggtgcgc caggagagtt    30960

gttgattcat tgtttgcctc cctgctgcgg tttttcaccg aagttcatgc cagtccagcg    31020

tttttgcagc agaaaagccg ccgacttcgg tttgcggtcg cgagtgaaga tccctttctt    31080

gttaccgcca acgcgcaata tgccttgcga ggtcgcaaaa tcggcgaaat tccatacctg    31140

ttcaccgacg acggcgctga cgcgatcaaa gacgcggtga tacatatcca gccatgcaca    31200

ctgatactct tcactccaca tgtcggtgta cattgagtgc agcccggcta acgtatccac    32260

gccgtattcg gtgatgataa tcggctgatg cagtttctcc tgccaggcca gaagttcttt    31320

ttccagtacc ttctctgccg tttccaaatc gccgctttgg acataccatc cgtaataacg    31380

gttcaggcac agcacatcaa agagatcgct gatggtatcg gtgtgagcgt cgcagaacat    31440

tacattgacg caggtgatcg gacgcgtcgg gtcgagttta cgcgttgctt ccgccagtgg    31500

cgcgaaatat tcccgtgcac cttgcggacg ggtatccggt tcgttggcaa tactccacat    31560

caccacgctt gggtggtttt tgtcacgcgc tatcagctct ttaatcgcct gtaagtgcgc    31620

ttgctgagtt tccccgttga ctgcctcttc gctgtacagt tctttcggct tgttgcccgc    31680

ttcgaaacca atgcctaaag agaggttaaa gccgacagca gcagtttcat caatcaccac    31740

gatgccatgt tcatctgccc agtcgagcat ctcttcagcg taagggtaat gcgaggtacg    31800

gtaggagttg gccccaatcc agtccattaa tgcgtggtcg tgcaccatca gcacgttatc    31860

gaatcctttg ccacgcaagt ccgcatcttc atgacgacca aagccagtaa agtagaacgg    31920

tttgtggtta atcaggaact gttcgccctt cactgccact gaccggatgc cgacgcgaag    31980

cgggtagata tcacactctg tctggctttt ggctgtgacg cacagttcat agagataacc    32040

ttcacccggt tgccagaggt gcggattcac cacttgcaaa gtcccgctag tgccttgtcc    32100

agttgcaacc acctgttgat ccgcatcacg cagttcaacg ctgacatcac cattggccac    32160

cacctgccag tcaacagacg cgtggttaca gtcttgcgcg acatgcgtca ccacggtgat    32220

atcgtccacc caggtgttcg gcgtggtgta gagcattacg ctgcgatgga ttccggcata    32280

gttaaagaaa tcatggaagt aagactgctt tttcttgccg ttttcgtcgg taatcaccat    32340

tcccggcggg atagtctgcc agttcagttc gttgttcaca caaacggtga tacgtacact    32400

tttcccggca ataacatacg gcgtgacatc ggcttcaaat ggcgtatagc cgccctgatg    32460

ctccatcact tcctgattat tgacccacac tttgccgtaa tgagtgaccg catcgaaacg    32520

cagcacgata cgctggcctg cccaaccttt cggtataaag acttcgcgct gataccagac    32580

gttgcccgca taattacgaa tatctgcatc ggcgaactga tcgttaaaac tgcctggcac    32640

agcaattgcc cggctttctt gtaacgcgct ttcccaccaa cgctgatcaa ttccacagtt    32700

ttcgcgatcc agactgaatg cccacaggcc gtcgagtttt ttgatttcac gggttggggt    32760

ttctacagga cggaccatgc gttcgacctt tctcttcttt tttgggccca tgatggcaga    32820

tccgtatagt gagtcgtatt agctggttct ttccgcctca gaagccatag agcccaccgc    32880

atccccagca tgcctgctat tgtcttccca atcctccccc ttgctgtcct gccccacccc    32940

accccccaga atagaatgac acctactcag acaatgcgat gcaatttcct cattttatta    33000

ggaaaggaca gtgggagtgg caccttccag ggtcaaggaa ggcacggggg aggggcaaac    33060

aacagatggc tggcaactag aaggcacagt cgaggctgat cagcgagctc tagatgcatg    33120

ctcgagcggc cgccagtgtg atggatatct gcagaattcc agcacactgg cggccgttac    33180

tagtggatcc gagctcggta cccggccgtt ataacaccac tcgacacggc accagctcaa    33240

tcagtcacag tgtaaaaaag ggccaagtgc agagcgagta tatataggac taaaaaatga    33300

cgtaacggtt aaagtccaca aaaaacaccc agaaaaccgc acgcgaacct acgcccagaa    33360

acgaaagcca aaaaacccac aacttcctca aatcgtcact tccgttttcc cacgttacgt    33420

cacttcccat tttaagaaaa ctacaattcc caacacatac aagttactcc gccctaaaac    33480

ctacgtcacc cgccccgttc ccacgccccg cgccacgtca caaactccac cccctcatta    33540

tcatattggc ttcaatccaa aataaggtat attattgatg atg                      33583

 

<210>6

<211>33476

<212>DNA

<213>人工的

 

<220>

<223>合成的

 

<400>6

catcatcaat aatatacctt attttggatt gaagccaata tgataatgag ggggtggagt       60

ttgtgacgtg gcgcggggcg tgggaacggg gcgggtgacg tagtagtgtg gcggaagtgt      120

gatgttgcaa gtgtggcgga acacatgtaa gcgacggatg tggcaaaagt gacgtttttg      180

gtgtgcgccg gtgtacacag gaagtgacaa ttttcgcgcg gttttaggcg gatgttgtag      240

taaatttggg cgtaaccgag taagatttgg ccattttcgc gggaaaactg aataagagga      300

agtgaaatct gaataatttt gtgttactca tagcgcgtaa tatttgtcta gggcccggga      360

tcggtgatca ccgatccaga catgataaga tacattgatg agtttggaca aaccacaact      420

agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta      480

accattataa gctgcaataa acaagttccc ggatctttct agctagtcta gactagctag      540

actcgagagc ggccgcaatc gataagcttg atatcgaatt ctgcagtgat cagggatcct      600

caccacagcc agttggtgat gttgaaccag ttccacaggc tggcccactt gtccagctcc      660

agcagctcct gctcgttctt ctcgtgctgg ttctggctct cctcgatcag gctgtggatc      720

aggctggtgt agttgttgat ctcgcggtcc cactccatcc aggtggtgtg gttccagatc      780

tgctcgagca gctgctggtc cttcaggtag cgctccacgg ccagggtgcg ggcctgcagc      840

tgcttgatgc cccacacggt cagctgcagc aggtgctgct gggcctcgat ggcgcgcagc     900

aggttgttct gctgctgcac gatgccgctc agcagctggc gggcctggac ggtaagcttg     960

gccttggtgg gggccacgcc caggggctcg atcttcacca ccttgtactt gtacagctcg    1020

ctgcgccagt tgtcgcgcat gtcgccgccg cccaggcgga agatctcgct ctcgttgttg    1080

ctgttgccgc cgtcgcgggt cagcagcagg ccggtgatgt tgctgctgca gcggatctgg    1140

ccgctgatgg ggggggcgta catggccttg cccaccttct gccacatgtt gatgatctgc    1200

ttgatgcggc agggcagggt gatggtgtcg ctgccctcgg tgttgttgct gccctcggtg    1260

ctccaggtgc tgttgaacca ggtgctgttg aacagctggg tgctgttgca gtagaagaac    1320

tcgccgccgc agttgaagct gtgggtcacg atctcggggt cgccgccgct gctgtgcttg    1380

aacacgatgg tcttgttgcc gaactgctcg cgcagcttga tcacgatctt gttcagggtg    1440

tcgttccact tggcgcggct caggttgcag tgggcctggc ggatgtcgcc gatgatctcg    1500

ccggtggtgt agaaggcgcg gccggggccg atgtggatgc tcttgcgggt gttgttgttg    1560

gggcgggtgc agttgatctc cacgctctcg ttcagctgca cgatgatcac cttggcgttg    1620

tcggcgaagt tagcgctgcg gatcaccacc tcctcctcgg ccaggttacc cgtaaccagc    1680

agctgggtgc tcaccacggg gcggatgccg tgggtgcact gcacggtgct cacgttggtg    1740

caggggccct tgccgttgaa cttcttgtcc ttgcacttca ggatggcgaa gccggcgggg    1800

gcgcagtagt ggttggggat gggctcgaag ctcaccttgg ggcaggcctg ggtgatcacg    1860

ctggtgttgc agctggtgct agcgtcggtg cacttcaggc tcacgcacag gggggtcagc    1920

ttcacgcagg gcttcaggct ctggtcccac aggctgatga tgtcctcgtg catctgctcc    1980

accatgtcgt tcttccacat gtcgaagttc tcggtcacgt tcaccagcac cacctcctgg    2040

gggttggggt cggtgggcac gcaggcgtgg gtggcccaca cgttgtgcac ctcggtgtcg    2100

taggccttgg cgtcgctggc gcagagcagg gtggtggtgg cctccttcca cacgggcacg    2160

ccgtagtaca cggtcaccca cagcttctcg gtggcgctgc agatcatcag catgcccagc    2220

agcatggtgc cccagcgcca gccccagcgc cacaggtgct ggtacttctc cttcacgcgc    2280

atggtgtcta gagcggccgc gatcggctgc agttggacct gggagtggac acctgtggag    2340

agaaaggcaa agtggatgtc attgtcactc aagtgtatgg ccagatctca agcctgccac    240O

acctcaagtg aagccaaggg ggtgggccta tagactctat aggcggtact tacgtcactc    2460

ttggcacggg gaatccgcgt tccaatgcac cgttcccggc cgcggaggct ggatcggtcc    2520

cggtgtcttc tatggaggtc aaaacagcgt ggatggcgtc tccaggcgat ctgacggttc    2580

actaaacgag ctcgtcgacg atctctatca ctgataggga gatctctatc actgataggg    2640

agagctctgc ttatatagac ctcccaccgt acacgcctac cgcccatttg cgtcaatggg    2700

gcggagttgt tacgacattt tggaaagtcc cgttgatttt ggtgccaaaa caaactccca    2760

ttgacgtcaa tggggtggag acttggaaat ccccgtgagt caaaccgcta tccacgccca    2820

ttgatgtact gccaaaaccg catcaccatg gtaatagcga tgactaatac gtagatgtac    2880

tgccaagtag gaaagtccca taaggtcatg tactgggcat aatgccaggc gggccattta    2940

ccgtcattga cgtcaatagg gggcgtactt ggcatatgat acacttgatg tactgccaag    3000

tgggcagttt accgtaaata ctccacccat tgacgtcaat ggaaagtccc tattggcgtt    3060

actatgggaa catacgtcat tattgacgtc aatgggcggg ggtcgttggg cggtcagcca    3120

ggcgggccat ttaccgtaag ttatgtaacg cggaactcca tatatgggct atgaactaat    3180

gaccccgtaa ttgattacta ttaataacta gtactgaaat gtgtgggcgt ggcttaaggg    3240

tgggaaagaa tatataaggt gggggtctta tgtagttttg tatctgtttt gcagcagccg    3300

ccgccgccat gagcaccaac tcgtttgatg gaagcattgt gagctcatat ttgacaacgc    3360

gcatgccccc atgggccggg gtgcgtcaga atgtgatggg ctccagcatt gatggtcgcc    3420

ccgtcctgcc cgcaaactct actaccttga cctacgagac cgtgtctgga acgccgttgg    3480

agactgcagc ctccgccgcc gcttcagccg ctgcagccac cgcccgcggg attgtgactg    3540

actttgcttt cctgagcccg cttgcaagca gtgcagcttc ccgttcatcc gcccgcgatg    3600

acaagttgac ggctcttttg gcacaattgg attctttgac ccgggaactt aatgtcgttt    3660

ctcagcagct gttggatctg cgccagcagg tttctgccct gaaggcttcc tcccctccca    3720

atgcggttta aaacataaat aaaaaaccag actctgtttg gatttggatc aagcaagtgt    3780

cttgctgtct ttatttaggg gttttgcgcg cgcggtaggc ccgggaccag cggtctcggt    3840

cgttgagggt cctgtgtatt ttttccagga cgtggtaaag gtgactctgg atgttcagat    3900

acatgggcat aagcccgtct ctggggtgga ggtagcacca ctgcagagct tcatgctgcg    3960

gggtggtgtt gtagatgatc cagtcgtagc aggagcgctg ggcgtggtgc ctaaaaatgt    4020

ctttcagtag caagctgatt gccaggggca ggcccttggt gtaagtgttt acaaagcggt    4080

taagctggga tgggtgcata cgtggggata tgagatgcat cttggactgt atttttaggt    4140

tggctatgtt cccagccata tccctccggg gattcatgtt gtgcagaacc accagcacag    4200

tgtatccggt gcacttggga aatttgtcat gtagcttaga aggaaatgcg tggaagaact    4260

tggagacgcc cttgtgacct ccaagatttt ccatgcattc gtccataatg atggcaatgg    4320

gcccacgggc ggcggcctgg gcgaagatat ttctgggatc actaacgtca tagttgtgtt    4380

ccaggatgag atcgtcatag gccattttta caaagcgcgg gcggagggtg ccagactgcg    4440

gtataatggt tccatccggc ccaggggcgt agttaccctc acagatttgc atttcccacg    4500

ctttgagttc agatgggggg atcatgtcta cctgcggggc gatgaagaaa acggtttccg    4560

gggtagggga gatcagctgg gaagaaagca ggttcctgag cagctgcgac ttaccgcagc    4620

cggtgggccc gtaaatcaca cctattaccg gctgcaactg gtagttaaga gagctgcagc    4680

tgccgtcatc cctgagcagg ggggccactt cgttaagcat gtccctgact cgcatgtttt    4740

ccctgaccaa atccgccaga aggcgctcgc cgcccagcga tagcagttct tgcaaggaag    4800

caaagttttt caacggtttg agaccgtccg ccgtaggcat gcttttgagc gtttgaccaa    4860

gcagttccag gcggtcccac agctcggtca cctgctctac ggcatctcga tccagcatat    4920

ctcctcgttt cgcgggttgg ggcggctttc gctgtacggc agtagtcggt gctcgtccag    4980

acgggccagg gtcatgtctt tccacgggcg cagggtcctc gtcagcgtag tctgggtcac    5040

ggtgaagggg tgcgctccgg gctgcgcgct ggccagggtg cgcttgaggc tggtcctgct    5100

ggtgctgaag cgctgccggt cttcgccctg cgcgtcggcc aggtagcatt tgaccatggt    5160

gtcatagtcc agcccctccg cggcgtggcc cttggcgcgc agcttgccct tggaggaggc    5220

gccgcacgag gggcagtgca gacttttgag ggcgtagagc ttgggcgcga gaaataccga    5280

ttccggggag taggcatccg cgccgcaggc cccgcagacg gtctcgcatt ccacgagcca    5340

ggtgagctct ggccgttcgg ggtcaaaaac caggtttccc ccatgctttt tgatgcgttt    5400

cttacctctg gtttccatga gccggtgtcc acgctcggtg acgaaaaggc tgtccgtgtc    5460

cccgtataca gacttgagag gcctgtcctc gagcggtgtt ccgcggtcct cctcgtatag    5520

aaactcggac cactctgaga caaaggctcg cgtccaggcc agcacgaagg aggctaagtg    5580

ggaggggtag cggtcgttgt ccactagggg gtccactcgc tccagggtgt gaagacacat    5640

gtcgccctct tcggcatcaa ggaaggtgat tggtttgtag gtgtaggcca cgtgaccggg    5700

tgttcctgaa ggggggctat aaaagggggt gggggcgcgt tcgtcctcac tctcttccgc    5760

atcgctgtct gcgagggcca gctgttgggg tgagtactcc ctctgaaaag cgggcatgac    5820

ttctgcgcta agattgtcag tttccaaaaa cgaggaggat ttgatattca cctggcccgc    5880

ggtgatgcct ttgagggtgg ccgcatccat ctggtcagaa aagacaatct ttttgttgtc    5940

aagcttggtg gcaaacgacc cgtagagggc gttggacagc aacttggcga tggagcgcag    6000

ggtttggttt ttgtcgcgat cggcgcgctc cttggccgcg atgtttagct gcacgtattc    6060

gcgcgcaacg caccgccatt cgggaaagac ggtggtgcgc tcgtcgggca ccaggtgcac    6120

gcgccaaccg cggttgtgca gggtgacaag gtcaacgctg gtggctacct ctccgcgtag    6180

gcgctcgttg gtccagcaga ggcggccgcc cttgcgcgag cagaatggcg gtagggggtc    6240

tagctgcgtc tcgtccgggg ggtctgcgtc cacggtaaag accccgggca gcaggcgcgc    6300

gtcgaagtag tctatcttgc atccttgcaa gtctagcgcc tgctgccatg cgcgggcggc    6360

aagcgcgcgc tcgtatgggt tgagtggggg accccatggc atggggtggg tgagcgcgga    6420

ggcgtacatg ccgcaaatgt cgtaaacgta gaggggctct ctgagtattc caagatatgt    6480

agggtagcat cttccaccgc ggatgctggc gcgcacgtaa tcgtatagtt cgtgcgaggg    6540

agcgaggagg tcgggaccga ggttgctacg ggcgggctgc tctgctcgga agactatctg    6600

cctgaagatg gcatgtgagt tggatgatat ggttggacgc tggaagacgt tgaagctggc    6660

gtctgtgaga cctaccgcgt cacgcacgaa ggaggcgtag gagtcgcgca gcttgttgac    6720

cagctcggcg gtgacctgca cgtctagggc gcagtagtcc agggtttcct tgatgatgtc    6780

atacttatcc tgtccctttt ttttccacag ctcgcggttg aggacaaact cttcgcggtc    6840

tttccagtac tcttggatcg gaaacccgtc ggcctccgaa cggtaagagc ctagcatgta    6900

gaactggttg acggcctggt aggcgcagca tcccttttct acgggtagcg cgtatgcctg    6960

cgcggccttc cggagcgagg tgtgggtgag cgcaaaggtg tccctgacca tgactttgag    7020

gtactggtat ttgaagtcag tgtcgtcgca tccgccctgc tcccagagca aaaagtccgt    7080

gcgctttttg gaacgcggat ttggcagggc gaaggtgaca tcgttgaaga gtatctttcc    7140

cgcgcgaggc ataaagttgc gtgtgatgcg gaagggtccc ggcacctcgg aacggttgtt    7200

aattacctgg gcggcgagca cgatctcgtc aaagccgttg atgttgtggc ccacaatgta    7260

aagttccaag aagcgcggga tgcccttgat ggaaggcaat tttttaagtt cctcgtaggt    7320

gagctcttca ggggagctga gcccgtgctc tgaaagggcc cagtctgcaa gatgagggtt    7380

ggaagcgacg aatgagctcc acaggtcacg ggccattagc atttgcaggt ggtcgcgaaa    7440

ggtcctaaac tggcgaccta tggccatttt ttctggggtg atgcagtaga aggtaagcgg    7500

gtcttgttcc cagcggtccc atccaaggtt cgcggctagg tctcgcgcgg cagtcactag    7560

aggctcatct ccgccgaact tcatgaccag catgaagggc acgagctgct tcccaaaggc    7620

ccccatccaa gtataggtct ctacatcgta ggtgacaaag agacgctcgg tgcgaggatg    7680

cgagccgatc gggaagaact ggatctcccg ccaccaattg gaggagtggc tattgatgtg    7740

gtgaaagtag aagtccctgc gacgggccga acactcgtgc tggcttttgt aaaaacgtgc    7800

gcagtactgg cagcggtgca cgggctgtac atcctgcacg aggttgacct gacgaccgcg    7860

cacaaggaag cagagtggga atttgagccc ctcgcctggc gggtttggct ggtggtcttc    7920

tacttcggct gcttgtcctt gaccgtctgg ctgctcgagg ggagttacgg tggatcggac    7980

caccacgccg cgcgagccca aagtccagat gtccgcgcgc ggcggtcgga gcttgatgac    8040

aacatcgcgc agatgggagc tgtccatggt ctggagctcc cgcggcgtca ggtcaggcgg    8100

gagctcctgc aggtttacct cgcatagacg ggtcagggcg cgggctagat ccaggtgata    8160

cctaatttcc aggggctggt tggtggcggc gtcgatggct tgcaagaggc cgcatccccg    8220

cggcgcgact acggtaccgc gcggcgggcg gtgggccgcg ggggtgtcct tggatgatgc    8280

atctaaaagc ggtgacgcgg gcgagccccc ggaggtaggg ggggctccgg acccgccggg    8340

agagggggca ggggcacgtc ggcgccgcgc gcgggcagga gctggtgctg cgcgcgtagg    8400

ttgctggcga acgcgacgac gcggcggttg atctcctgaa tctggcgcct ctgcgtgaag    8460

acgacgggcc cggtgagctt gaacctgaaa gagagttcga cagaatcaat ttcggtgtcg    8520

ttgacggcgg cctggcgcaa aatctcctgc acgtctcctg agttgtcttg ataggcgatc    8580

tcggccatga actgctcgat ctcttcctcc tggagatctc cgcgtccggc tcgctccacg    8640

gtggcggcga ggtcgttgga aatgcgggcc atgagctgcg agaaggcgtt gaggcctccc    8700

tcgttccaga cgcggctgta gaccacgccc ccttcggcat cgcgggcgcg catgaccacc    8760

tgcgcgagat tgagctccac gtgccgggcg aagacggcgt agtttcgcag gcgctgaaag    8820

aggtagttga gggtggtggc ggtgtgttct gccacgaaga agtacataac ccagcgtcgc    8880

aacgtggatt cgttgatatc ccccaaggcc tcaaggcgct ccatggcctc gtagaagtcc    8940

acggcgaagt tgaaaaactg ggagttgcgc gccgacacgg ttaactcctc ctccagaaga    9000

cggatgagct cggcgacagt gtcgcgcacc tcgcgctcaa aggctacagg ggcctcttct    9060

tcttcttcaa tctcctcttc cataagggcc tccccttctt cttcttctgg cggcggtggg    9120

ggagggggga cacggcggcg acgacggcgc accgggaggc ggtcgacaaa gcgctcgatc    9180

atctccccgc ggcgacggcg catggtctcg gtgacggcgc ggccgttctc gcgggggcgc    9240

agttggaaga cgccgcccgt catgtcccgg ttatgggttg gcggggggct gccatgcggc    9300

agggatacgg cgctaacgat gcatctcaac aattgttgtg taggtactcc gccgccgagg    9360

gacctgagcg agtccgcatc gaccggatcg gaaaacctct cgagaaaggc gtctaaccag    9420

tcacagtcgc aaggtaggct gagcaccgtg gcgggcggca gcgggcggcg gtcggggttg    9480

tttctggcgg aggtgctgct gatgatgtaa ttaaagtagg cggtcttgag acggcggatg    9540

gtcgacagaa gcaccatgtc cttgggtccg gcctgctgaa tgcgcaggcg gtcggccatg    9600

ccccaggctt cgttttgaca tcggcgcagg tctttgtagt agtcttgcat gagcctttct    9660

accggcactt cttcttctcc ttcctcttgt cctgcatctc ttgcatctat cgctgcggcg    9720

gcggcggagt ttggccgtag gtggcgccct cttcctccca tgcgtgtgac cccgaagccc    9780

ctcatcggct gaagcagggc taggtcggcg acaacgcgct cggctaatat ggcctgctgc    9840

acctgcgtga gggtagactg gaagtcatcc atgtccacaa agcggtggta tgcgcccgtg    9900

ttgatggtgt aagtgcagtt ggccataacg gaccagttaa cggtctggtg acccggctgc    9960

gagagctcgg tgtacctgag acgcgagtaa gccctcgagt caaatacgta gtcgttgcaa   10020

gtccgcacca ggtactggta tcccaccaaa aagtgcggcg gcggctggcg gtagaggggc   10080

cagcgtaggg tggccggggc tccgggggcg agatcttcca acataaggcg atgatatccg   10140

tagatgtacc tggacatcca ggtgatgccg gcggcggtgg tggaggcgcg cggaaagtcg   10200

cggacgcggt tccagatgtt gcgcagcggc aaaaagtgct ccatggtcgg gacgctctgg   10260

ccggtcaggc gcgcgcaatc gttgacgctc tagcgtgcaa aaggagagcc tgtaagcggg   10320

cactcttccg tggtctggtg gataaattcg caagggtatc atggcggacg accggggttc    10380

gagccccgta tccggccgtc cgccgtgatc catgcggtta ccgcccgcgt gtcgaaccca    10440

ggtgtgcgac gtcagacaac gggggagtgc tccttttggc ttccttccag gcgcggcggc    10500

tgctgcgcta gcttttttgg ccactggccg cgcgcagcgt aagcggttag gctggaaagc    10560

gaaagcatta agtggctcgc tccctgtagc cggagggtta ttttccaagg gttgagtcgc    10620

gggacccccg gttcgagtct cggaccggcc ggactgcggc gaacgggggt ttgcctcccc    10680

gtcatgcaag accccgcttg caaattcctc cggaaacagg gacgagcccc ttttttgctt    10740

ttcccagatg catccggtgc tgcggcagat gcgcccccct cctcagcagc ggcaagagca    10800

agagcagcgg cagacatgca gggcaccctc ccctcctcct accgcgtcag gaggggcgac    10860

atccgcggtt gacgcggcag cagatggtga ttacgaaccc ccgcggcgcc gggcccggca    10920

ctacctggac ttggaggagg gcgagggcct ggcgcggcta ggagcgccct ctcctgagcg    10980

gcacccaagg gtgcagctga agcgtgatac gcgtgaggcg tacgtgccgc ggcagaacct    11040

gtttcgcgac cgcgagggag aggagcccga ggagatgcgg gatcgaaagt tccacgcagg    11100

gcgcgagctg cggcatggcc tgaatcgcga gcggttgctg cgcgaggagg actttgagcc    11160

cgacgcgcga accgggatta gtcccgcgcg cgcacacgtg gcggccgccg acctggtaac    11220

cgcatacgag cagacggtga accaggagat taactttcaa aaaagcttta acaaccacgt    11280

gcgtacgctt gtggcgcgcg aggaggtggc tataggactg atgcatctgt gggactttgt    11340

aagcgcgctg gagcaaaacc caaatagcaa gccgctcatg gcgcagctgt tccttatagt    11400

gcagcacagc agggacaacg aggcattcag ggatgcgctg ctaaacatag tagagcccga    11460

gggccgctgg ctgctcgatt tgataaacat cctgcagagc atagtggtgc aggagcgcag    11520

cttgagcctg gctgacaagg tggccgccat caactattcc atgcttagcc tgggcaagtt    11580

ttacgcccgc aagatatacc atacccctta cgttcccata gacaaggagg taaagatcga    11640

ggggttctac atgcgcatgg cgctgaaggt gcttaccttg agcgacgacc tgggcgttta    11700

tcgcaacgag cgcatccaca aggccgtgag cgtgagccgg cggcgcgagc tcagcgaccg    11760

cgagctgatg cacagcctgc aaagggccct ggctggcacg ggcagcggcg atagagaggc    11820

cgagtcctac tttgacgcgg gcgctgacct gcgctgggcc ccaagccgac gcgccctgga    11880

ggcagctggg gccggacctg ggctggcggt ggcacccgcg cgcgctggca acgtcggcgg    11940

cgtggaggaa tatgacgagg acgatgagta cgagccagag gacggcgagt actaagcggt    12000

gatgtttctg atcagatgat gcaagacgca acggacccgg cggtgcgggc ggcgctgcag    12060

agccagccgt ccggccttaa ctccacggac gactggcgcc aggtcatgga ccgcatcatg    12120

tcgctgactg cgcgcaatcc tgacgcgttc cggcagcagc cgcaggccaa ccggctctcc    12180

gcaattctgg aagcggtggt cccggcgcgc gcaaacccca cgcacgagaa ggtgctggcg    12240

atcgtaaacg cgctggccga aaacagggcc atccggcccg acgaggccgg cctggtctac    12300

gacgcgctgc ttcagcgcgt ggctcgttac aacagcggca acgtgcagac caacctggac    12360

cggctggtgg gggatgtgcg cgaggccgtg gcgcagcgtg agcgcgcgca gcagcagggc    12420

aacctgggct ccatggttgc actaaacgcc ttcctgagta cacagcccgc caacgtgccg    12480

cggggacagg aggactacac caactttgtg agcgcactgc ggctaatggt gactgagaca    12540

ccgcaaagtg aggtgtacca gtctgggcca gactattttt tccagaccag tagacaaggc    12600

ctgcagaccg taaacctgag ccaggctttc aaaaacttgc aggggctgtg gggggtgcgg    12660

gctcccacag gcgaccgcgc gaccgtgtct agcttgctga cgcccaactc gcgcctgttg    12720

ctgctgctaa tagcgccctt cacggacagt ggcagcgtgt cccgggacac atacctaggt    12780

cacttgctga cactgtaccg cgaggccata ggtcaggcgc atgtggacga gcatactttc    12840

caggagatta caagtgtcag ccgcgcgctg gggcaggagg acacgggcag cctggaggca    12900

accctaaact acctgctgac caaccggcgg cagaagatcc cctcgttgca cagtttaaac    12960

agcgaggagg agcgcatttt gcgctacgtg cagcagagcg tgagccttaa cctgatgcgc    13020

gacggggtaa cgcccagcgt ggcgctggac atgaccgcgc gcaacatgga accgggcatg    13080

tatgcctcaa accggccgtt tatcaaccgc ctaatggact acttgcatcg cgcggccgcc    13140

gtgaaccccg agtatttcac caatgccatc ttgaacccgc actggctacc gccccctggt    13200

ttctacaccg ggggattcga ggtgcccgag ggtaacgatg gattcctctg ggacgacata    13260

gacgacagcg tgttttcccc gcaaccgcag accctgctag agttgcaaca gcgcgagcag    13320

gcagaggcgg cgctgcgaaa ggaaagcttc cgcaggccaa gcagcttgtc cgatctaggc    13380

gctgcggccc cgcggtcaga tgctagtagc ccatttccaa gcttgatagg gtctcttacc    13440

agcactcgca ccacccgccc gcgcctgctg ggcgaggagg agtacctaaa caactcgctg    13500

ctgcagccgc agcgcgaaaa aaacctgcct ccggcatttc ccaacaacgg gatagagagc    13560

ctagtggaca agatgagtag atggaagacg tacgcgcagg agcacaggga cgtgccaggc    13620

ccgcgcccgc ccacccgtcg tcaaaggcac gaccgtcagc ggggtctggt gtgggaggac    13680

gatgactcgg cagacgacag cagcgtcctg gatttgggag ggagtggcaa cccgtttgcg    13740

caccttcgcc ccaggctggg gagaatgttt taaaaaaaaa aaaagcatga tgcaaaataa    13800

aaaactcacc aaggccatgg caccgagcgt tggttttctt gtattcccct tagtatgcgg    13860

cgcgcggcga tgtatgagga aggtcctcct ccctcctacg agagtgtggt gagcgcggcg    13920

ccagtggcgg cggcgctggg ttctcccttc gatgctcccc tggacccgcc gtttgtgcct    13980

ccgcggtacc tgcggcctac cggggggaga aacagcatcc gttactctga gttggcaccc    14040

ctattcgaca ccacccgtgt gtacctggtg gacaacaagt caacggatgt ggcatccctg    14100

aactaccaga acgaccacag caactttctg accacggtca ttcaaaacaa tgactacagc    14160

ccgggggagg caagcacaca gaccatcaat cttgacgacc ggtcgcactg gggcggcgac    14220

ctgaaaacca tcctgcatac caacatgcca aatgtgaacg agttcatgtt taccaataag    14280

tttaaggcgc gggtgatggt gtcgcgcttg cctactaagg acaatcaggt ggagctgaaa    14340

tacgagtggg tggagttcac gctgcccgag ggcaactact ccgagaccat gaccatagac    14400

cttatgaaca acgcgatcgt ggagcactac ttgaaagtgg gcagacagaa cggggttctg    14460

gaaagcgaca tcggggtaaa gtttgacacc cgcaacttca gactggggtt tgaccccgtc    14520

actggtcttg tcatgcctgg ggtatataca aacgaagcct tccatccaga catcattttg    14580

ctgccaggat gcggggtgga cttcacccac agccgcctga gcaacttgtt gggcatccgc    14640

aagcggcaac ccttccagga gggctttagg atcacctacg atgatctgga gggtggtaac    14700

attcccgcac tgttggatgt ggacgcctac caggcgagct tgaaagatga caccgaacag    14760

ggcgggggtg gcgcaggcgg cagcaacagc agtggcagcg gcgcggaaga gaactccaac    14820

gcggcagccg cggcaatgca gccggtggag gacatgaacg atcatgccat tcgcggcgac    14880

acctttgcca cacgggctga ggagaagcgc gctgaggccg aagcagcggc cgaagctgcc    14940

gcccccgctg cgcaacccga ggtcgagaag cctcagaaga aaccggtgat caaacccctg    15000

acagaggaca gcaagaaacg cagttacaac ctaataagca atgacagcac cttcacccag    15060

taccgcagct ggtaccttgc atacaactac ggcgaccctc agaccggaat ccgctcatgg    15120

accctgcttt gcactcctga cgtaacctgc ggctcggagc aggtctactg gtcgttgcca    15180

gacatgatgc aagaccccgt gaccttccgc tccacgcgcc agatcagcaa ctttccggtg    15240

gtgggcgccg agctgttgcc cgtgcactcc aagagcttct acaacgacca ggccgtctac    15300

tcccaactca tccgccagtt tacctctctg acccacgtgt tcaatcgctt tcccgagaac    15360

cagattttgg cgcgcccgcc agcccccacc atcaccaccg tcagtgaaaa cgttcctgct    15420

ctcacagatc acgggacgct accgctgcgc aacagcatcg gaggagtcca gcgagtgacc    15480

attactgacg ccagacgccg cacctgcccc tacgtttaca aggccctggg catagtctcg    15540

ccgcgcgtcc tatcgagccg cactttttga gcaagcatgt ccatccttat atcgcccagc    15600

aataacacag gctggggcct gcgcttccca agcaagatgt ttggcggggc caagaagcgc    15660

tccgaccaac acccagtgcg cgtgcgcggg cactaccgcg cgccctgggg cgcgcacaaa    15720

cgcggccgca ctgggcgcac caccgtcgat gacgccatcg acgcggtggt ggaggaggcg    15780

cgcaactaca cgcccacgcc gccaccagtg tccacagtgg acgcggccat tcagaccgtg    15840

gtgcgcggag cccggcgcta tgctaaaatg aagagacggc ggaggcgcgt agcacgtcgc    15900

caccgccgcc gacccggcac tgccgcccaa cgcgcggcgg cggccctgct taaccgcgca    15960

cgtcgcaccg gccgacgggc ggccatgcgg gccgctcgaa ggctggccgc gggtattgtc    16020

actgtgcccc ccaggtccag gcgacgagcg gccgccgcag cagccgcggc cattagtgct    16080

atgactcagg gtcgcagggg caacgtgtat tgggtgcgcg actcggttag cggcctgcgc    16140

gtgcccgtgc gcacccgccc cccgcgcaac tagattgcaa gaaaaaacta cttagactcg    16200

tactgttgta tgtatccagc ggcggcggcg cgcaacgaag ctatgtccaa gcgcaaaatc    16260

aaagaagaga tgctccaggt catcgcgccg gagatctatg gccccccgaa gaaggaagag    16320

caggattaca agccccgaaa gctaaagcgg gtcaaaaaga aaaagaaaga tgatgatgat    16380

gaacttgacg acgaggtgga actgctgcac gctaccgcgc ccaggcgacg ggtacagtgg    16440

aaaggtcgac gcgtaaaacg tgttttgcga cccggcacca ccgtagtctt tacgcccggt    16500

gagcgctcca cccgcaccta caagcgcgtg tatgatgagg tgtacggcga cgaggacctg    16560

cttgagcagg ccaacgagcg cctcggggag tttgcctacg gaaagcggca taaggacatg    16620

ctggcgttgc cgctggacga gggcaaccca acacctagcc taaagcccgt aacactgcag    16680

caggtgctgc ccgcgcttgc accgtccgaa gaaaagcgcg gcctaaagcg cgagtctggt    16740

gacttggcac ccaccgtgca gctgatggta cccaagcgcc agcgactgga agatgtcttg    16800

gaaaaaatga ccgtggaacc tgggctggag cccgaggtcc gcgtgcggcc aatcaagcag    16860

gtggcgccgg gactgggcgt gcagaccgtg gacgttcaga tacccactac cagtagcacc    16920

agtattgcca ccgccacaga gggcatggag acacaaacgt ccccggttgc ctcagcggtg    16980

gcggatgccg cggtgcaggc ggtcgctgcg gccgcgtcca agacctctac ggaggtgcaa    17040

acggacccgt ggatgtttcg cgtttcagcc ccccggcgcc cgcgccgttc gaggaagtac    17100

ggcgccgcca gcgcgctact gcccgaatat gccctacatc cttccattgc gcctaccccc    17160

ggctatcgtg gctacaccta ccgccccaga agacgagcaa ctacccgacg ccgaaccacc    17220

actggaaccc gccgccgccg tcgccgtcgc cagcccgtgc tggccccgat ttccgtgcgc    17280

agggtggctc gcgaaggagg caggaccctg gtgctgccaa cagcgcgcta ccaccccagc    17340

atcgtttaaa agccggtctt tgtggttctt gcagatatgg ccctcacctg ccgcctccgt    17400

ttcccggtgc cgggattccg aggaagaatg caccgtagga ggggcatggc cggccacggc    17460

ctgacgggcg gcatgcgtcg tgcgcaccac cggcggcggc gcgcgtcgca ccgtcgcatg    17520

cgcggcggta tcctgcccct ccttattcca ctgatcgccg cggcgattgg cgccgtgccc    17580

ggaattgcat ccgtggcctt gcaggcgcag agacactgat taaaaacaag ttgcatgtgg    17640

aaaaatcaaa ataaaaagtc tggactctca cgctcgcttg gtcctgtaac tattttgtag    17700

aatggaagac atcaactttg cgtctctggc cccgcgacac ggctcgcgcc cgttcatggg    17760

aaactggcaa gatatcggca ccagcaatat gagcggtggc gccttcagct ggggctcgct    17820

gtggagcggc attaaaaatt tcggttccac cgttaagaac tatggcagca aggcctggaa    17880

cagcagcaca ggccagatgc tgagggataa gttgaaagag caaaatttcc aacaaaaggt    17940

ggtagatggc ctggcctctg gcattagcgg ggtggtggac ctggccaacc aggcagtgca    18000

aaataagatt aacagtaagc ttgatccccg ccctcccgta gaggagcctc caccggccgt    18060

ggagacagtg tctccagagg ggcgtggcga aaagcgtccg cgccccgaca gggaagaaac    18120

tctggtgacg caaatagacg agcctccctc gtacgaggag gcactaaagc aaggcctgcc    18180

caccacccgt cccatcgcgc ccatggctac cggagtgctg ggccagcaca cacccgtaac    18240

gctggacctg cctccccccg ccgacaccca gcagaaacct gtgctgccag gcccgaccgc    18300

cgttgttgta acccgtccta gccgcgcgtc cctgcgccgc gccgccagcg gtccgcgatc    18360

gttgcggccc gtagccagtg gcaactggca aagcacactg aacagcatcg tgggtctggg    18420

ggtgcaatcc ctgaagcgcc gacgatgctt ctgatagcta acgtgtcgta tgtgtgtcat    18480

gtatgcgtcc atgtcgccgc cagaggagct gctgagccgc cgcgcgcccg ctttccaaga    18540

tggctacccc ttcgatgatg ccgcagtggt cttacatgca catctcgggc caggacgcct    18600

cggagtacct gagccccggg ctggtgcagt ttgcccgcgc caccgagacg tacttcagcc    18660

tgaataacaa gtttagaaac cccacggtgg cgcctacgca cgacgtgacc acagaccggt    18720

cccagcgttt gacgctgcgg ttcatccctg tggaccgtga ggatactgcg tactcgtaca    18780

aggcgcggtt caccctagct gtgggtgata accgtgtgct ggacatggct tccacgtact    18840

ttgacatccg cggcgtgctg gacaggggcc ctacttttaa gccctactct ggcactgcct    18900

acaacgccct ggctcccaag ggtgccccaa atccttgcga atgggatgaa gctgctactg    18960

ctcttgaaat aaacctagaa gaagaggacg atgacaacga agacgaagta gacgagcaag    19020

ctgagcagca aaaaactcac gtatttgggc aggcgcctta ttctggtata aatattacaa    19080

aggagggtat tcaaataggt gtcgaaggtc aaacacctaa atatgccgat aaaacatttc    19140

aacctgaacc tcaaatagga gaatctcagt ggtacgaaac agaaattaat catgcagctg    19200

ggagagtcct aaaaaagact accccaatga aaccatgtta cggttcatat gcaaaaccca    19260

caaatgaaaa tggagggcaa ggcattcttg taaagcaaca aaatggaaag ctagaaagtc    19320

aagtggaaat gcaatttttc tcaactactg aggcagccgc aggcaatggt gataacttga    19380

ctcctaaagt ggtattgtac agtgaagatg tagatataga aaccccagac actcatattt    19440

cttacatgcc cactattaag gaaggtaact cacgagaact aatgggccaa caatctatgc    19500

ccaacaggcc taattacatt gcttttaggg acaattttat tggtctaatg tattacaaca    19560

gcacgggtaa tatgggtgtt ctggcgggcc aagcatcgca gttgaatgct gttgtagatt    19620

tgcaagacag aaacacagag ctttcatacc agcttttgct tgattccatt ggtgatagaa    19680

ccaggtactt ttctatgtgg aatcaggctg ttgacagcta tgatccagat gttagaatta    19740

ttgaaaatca tggaactgaa gatgaacttc caaattactg ctttccactg ggaggtgtga    19800

ttaatacaga gactcttacc aaggtaaaac ctaaaacagg tcaggaaaat ggatgggaaa    19860

aagatgctac agaattttca gataaaaatg aaataagagt tggaaataat tttgccatgg    19920

aaatcaatct aaatgccaac ctgtggagaa atttcctgta ctccaacata gcgctgtatt    19980

tgcccgacaa gctaaagtac agtccttcca acgtaaaaat ttctgataac ccaaacacct    20040

acgactacat gaacaagcga gtggtggctc ccgggctagt ggactgctac attaaccttg    20100

gagcacgctg gtcccttgac tatatggaca acgtcaaccc atttaaccac caccgcaatg    20160

ctggcctgcg ctaccgctca atgttgctgg gcaatggtcg ctatgtgccc ttccacatcc    20220

aggtgcctca gaagttcttt gccattaaaa acctccttct cctgccgggc tcatacacct    20280

acgagtggaa cttcaggaag gatgttaaca tggttctgca gagctcccta ggaaatgacc    20340

taagggttga cggagccagc attaagtttg atagcatttg cctttacgcc accttcttcc    20400

ccatggccca caacaccgcc tccacgcttg aggccatgct tagaaacgac accaacgacc    20460

agtcctttaa cgactatctc tccgccgcca acatgctcta ccctataccc gccaacgcta    20520

ccaacgtgcc catatccatc ccctcccgca actgggcggc tttccgcggc tgggccttca    20580

cgcgccttaa gactaaggaa accccatcac tgggctcggg ctacgaccct tattacacct    20640

actctggctc tataccctac ctagatggaa ccttttacct caaccacacc tttaagaagg    20700

tggccattac ctttgactct tctgtcagct ggcctggcaa tgaccgcctg cttaccccca    20760

acgagtttga aattaagcgc tcagttgacg gggagggtta caacgttgcc cagtgtaaca    20820

tgaccaaaga ctggttcctg gtacaaatgc tagctaacta taacattggc taccagggct    20880

tctatatccc agagagctac aaggaccgca tgtactcctt ctttagaaac ttccagccca    20940

tgagccgtca ggtggtggat gatactaaat acaaggacta ccaacaggtg ggcatcctac    21000

accaacacaa caactctgga tttgttggct accttgcccc caccatgcgc gaaggacagg    21060

cctaccctgc taacttcccc tatccgctta taggcaagac cgcagttgac agcattaccc    21120

agaaaaagtt tctttgcgat cgcacccttt ggcgcatccc attctccagt aactttatgt    21180

ccatgggcgc actcacagac ctgggccaaa accttctcta cgccaactcc gcccacgcgc    21240

tagacatgac ttttgaggtg gatcccatgg acgagcccac ccttctttat gttttgtttg    21300

aagtctttga cgtggtccgt gtgcaccagc cgcaccgcgg cgtcatcgaa accgtgtacc    21360

tgcgcacgcc cttctcggcc ggcaacgcca caacataaag aagcaagcaa catcaacaac    21420

agctgccgcc atgggctcca gtgagcagga actgaaagcc attgtcaaag atcttggttg    21480

tgggccatat tttttgggca cctatgacaa gcgctttcca ggctttgttt ctccacacaa    21540

gctcgcctgc gccatagtca atacggccgg tcgcgagact gggggcgtac actggatggc    21600

ctttgcctgg aacccgcact caaaaacatg ctacctcttt gagccctttg gcttttctga    21660

ccagcgactc aagcaggttt accagtttga gtacgagtca ctcctgcgcc gtagcgccat    21720

tgcttcttcc cccgaccgct gtataacgct ggaaaagtcc acccaaagcg tacaggggcc    21780

caactcggcc gcctgtggac tattctgctg catgtttctc cacgcctttg ccaactggcc    21840

ccaaactccc atggatcaca accccaccat gaaccttatt accggggtac ccaactccat    21900

gctcaacagt ccccaggtac agcccaccct gcgtcgcaac caggaacagc tctacagctt    21960

cctggagcgc cactcgccct acttccgcag ccacagtgcg cagattagga gcgccacttc    22020

tttttgtcac ttgaaaaaca tgtaaaaata atgtactaga gacactttca ataaaggcaa    22080

atgcttttat ttgtacactc tcgggtgatt atttaccccc acccttgccg tctgcgccgt    22140

ttaaaaatca aaggggttct gccgcgcatc gctatgcgcc actggcaggg acacgttgcg    22200

atactggtgt ttagtgctcc acttaaactc aggcacaacc atccgcggca gctcggtgaa    22260

gttttcactc cacaggctgc gcaccatcac caacgcgttt agcaggtcgg gcgccgatat    22320

cttgaagtcg cagttggggc ctccgccctg cgcgcgcgag ttgcgataca cagggttgca    22380

gcactggaac actatcagcg ccgggtggtg cacgctggcc agcacgctct tgtcggagat    22440

cagatccgcg tccaggtcct ccgcgttgct cagggcgaac ggagtcaact ttggtagctg    22500

ccttcccaaa aagggcgcgt gcccaggctt tgagttgcac tcgcaccgta gtggcatcaa    22560

aaggtgaccg tgcccggtct gggcgttagg atacagcgcc tgcataaaag ccttgatctg    22620

cttaaaagcc acctgagcct ttgcgccttc agagaagaac atgccgcaag acttgccgga    22680

aaactgattg gccggacagg ccgcgtcgtg cacgcagcac cttgcgtcgg tgttggagat    22740

ctgcaccaca tttcggcccc accggttctt cacgatcttg gccttgctag actgctcctt    22800

cagcgcgcgc tgcccgtttt cgctcgtcac atccatttca atcacgtgct ccttatttat    22860

cataatgctt ccgtgtagac acttaagctc gccttcgatc tcagcgcagc ggtgcagcca    22920

caacgcgcag cccgtgggct cgtgatgctt gtaggtcacc tctgcaaacg actgcaggta    22980

cgcctgcagg aatcgcccca tcatcgtcac aaaggtcttg ttgctggtga aggtcagctg    23040

caacccgcgg tgctcctcgt tcagccaggt cttgcatacg gccgccagag cttccacttg    23100

gtcaggcagt agtttgaagt tcgcctttag atcgttatcc acgtggtact tgtccatcag    23160

cgcgcgcgca gcctccatgc ccttctccca cgcagacacg atcggcacac tcagcgggtt    23220

catcaccgta atttcacttt ccgcttcgct gggctcttcc tcttcctctt gcgtccgcat    23280

accacgcgcc actgggtcgt cttcattcag ccgccgcact gtgcgcttac ctcctttgcc    23340

atgcttgatt agcaccggtg ggttgctgaa acccaccatt tgtagcgcca catcttctct    23400

ttcttcctcg ctgtccacga ttacctctgg tgatggcggg cgctcgggct tgggagaagg    23460

gcgcttcttt ttcttcttgg gcgcaatggc caaatccgcc gccgaggtcg atggccgcgg    23520

gctgggtgtg cgcggcacca gcgcgtcttg tgatgagtct tcctcgtcct cggactcgat    23580

acgccgcctc atccgctttt ttgggggcgc ccggggaggc ggcggcgacg gggacgggga    23640

cgacacgtcc tccatggttg ggggacgtcg cgccgcaccg cgtccgcgct cgggggtggt    23700

ttcgcgctgc tcctcttccc gactggccat ttccttctcc tataggcaga aaaagatcat    23760

ggagtcagtc gagaagaagg acagcctaac cgccccctct gagttcgcca ccaccgcctc    23820

caccgatgcc gccaacgcgc ctaccacctt ccccgtcgag gcacccccgc ttgaggagga    23880

ggaagtgatt atcgagcagg acccaggttt tgtaagcgaa gacgacgagg accgctcagt    23940

accaacagag gataaaaagc aagaccagga caacgcagag gcaaacgagg aacaagtcgg    24000

gcggggggac gaaaggcatg gcgactacct agatgtggga gacgacgtgc tgttgaagca    24060

tctgcagcgc cagtgcgcca ttatctgcga cgcgttgcaa gagcgcagcg atgtgcccct    24120

cgccatagcg gatgtcagcc ttgcctacga acgccaccta ttctcaccgc gcgtaccccc    24180

caaacgccaa gaaaacggca catgcgagcc caacccgcgc ctcaacttct accccgtatt    24240

tgccgtgcca gaggtgcttg ccacctatca catctttttc caaaactgca agatacccct    24300

atcctgccgt gccaaccgca gccgagcgga caagcagctg gccttgcggc agggcgctgt    24360

catacctgat atcgcctcgc tcaacgaagt gccaaaaatc tttgagggtc ttggacgcga    24420

cgagaagcgc gcggcaaacg ctctgcaaca ggaaaacagc gaaaatgaaa gtcactctgg    24480

agtgttggtg gaactcgagg gtgacaacgc gcgcctagcc gtactaaaac gcagcatcga    24540

ggtcacccac tttgcctacc cggcacttaa cctacccccc aaggtcatga gcacagtcat    24600

gagtgagctg atcgtgcgcc gtgcgcagcc cctggagagg gatgcaaatt tgcaagaaca    24660

aacagaggag ggcctacccg cagttggcga cgagcagcta gcgcgctggc ttcaaacgcg    24720

cgagcctgcc gacttggagg agcgacgcaa actaatgatg gccgcagtgc tcgttaccgt    24780

ggagcttgag tgcatgcagc ggttctttgc tgacccggag atgcagcgca agctagagga    24840

aacattgcac tacacctttc gacagggcta cgtacgccag gcctgcaaga tctccaacgt    24900

ggagctctgc aacctggtct cctaccttgg aattttgcac gaaaaccgcc ttgggcaaaa    24960

cgtgcttcat tccacgctca agggcgaggc gcgccgcgac tacgtccgcg actgcgttta    25020

cttatttcta tgctacacct ggcagacggc catgggcgtt tggcagcagt gcttggagga    25080

gtgcaacctc aaggagctgc agaaactgct aaagcaaaac ttgaaggacc tatggacggc    25140

cttcaacgag cgctccgtgg ccgcgcacct ggcggacatc attttccccg aacgcctgct    25200

taaaaccctg caacagggtc tgccagactt caccagtcaa agcatgttgc agaactttag    25260

gaactttatc ctagagcgct caggaatctt gcccgccacc tgctgtgcac ttcctagcga    25320

ctttgtgccc attaagtacc gcgaatgccc tccgccgctt tggggccact gctaccttct    25380

gcagctagcc aactaccttg cctaccactc tgacataatg gaagacgtga gcggtgacgg    25440

tctactggag tgtcactgtc gctgcaacct atgcaccccg caccgctccc tggtttgcaa    25500

ttcgcagctg cttaacgaaa gtcaaattat cggtaccttt gagctgcagg gtccctcgcc    25560

tgacgaaaag tccgcggctc cggggttgaa actcactccg gggctgtgga cgtcggctta    25620

ccttcgcaaa tttgtacctg aggactacca cgcccacgag attaggttct acgaagacca    25680

atcccgcccg cctaatgcgg agcttaccgc ctgcgtcatt acccagggcc acattcttgg    25740

ccaattgcaa gccatcaaca aagcccgcca agagtttctg ctacgaaagg gacggggggt    25800

ttacttggac ccccagtccg gcgaggagct caacccaatc cccccgccgc cgcagcccta    25860

tcagcagcag ccgcgggccc ttgcttccca ggatggcacc caaaaagaag ctgcagctgc    25920

cgccgccacc cacggacgag gaggaatact gggacagtca ggcagaggag gttttggacg    25980

aggaggagga ggacatgatg gaagactggg agagcctaga cgaggaagct tccgaggtcg    26040

aagaggtgtc agacgaaaca ccgtcaccct cggtcgcatt cccctcgccg gcgccccaga    26100

aatcggcaac cggttccagc atggctacaa cctccgctcc tcaggcgccg ccggcactgc    26160

ccgttcgccg acccaaccgt agatgggaca ccactggaac cagggccggt aagtccaagc    26220

agccgccgcc gttagcccaa gagcaacaac agcgccaagg ctaccgctca tggcgcgggc    26280

acaagaacgc catagttgct tgcttgcaag actgtggggg caacatctcc ttcgcccgcc    26340

gctttcttct ctaccatcac ggcgtggcct tcccccgtaa catcctgcat tactaccgtc    26400

atctctacag cccatactgc accggcggca gcggcagcaa cagcagcggc cacacagaag    26460

caaaggcgac cggatagcaa gactctgaca aagcccaaga aatccacagc ggcggcagca    26520

gcaggaggag gagcgctgcg tctggcgccc aacgaacccg tatcgacccg cgagcttaga    26580

aacaggattt ttcccactct gtatgctata tttcaacaga gcaggggcca agaacaagag    26640

ctgaaaataa aaaacaggtc tctgcgatcc ctcacccgca gctgcctgta tcacaaaagc    26700

gaagatcagc ttcggcgcac gctggaagac gcggaggctc tcttcagtaa atactgcgcg    26760

ctgactctta aggactagtt tcgcgccctt tctcaaattt aagcgcgaaa actacgtcat    26820

ctccagcggc cacacccggc gccagcacct gttgtcagcg ccattatgag caaggaaatt    26880

cccacgccct acatgtggag ttaccagcca caaatgggac ttgcggctgg agctgcccaa    26940

gactactcaa cccgaataaa ctacatgagc gcgggacccc acatgatatc ccgggtcaac    27000

ggaatacgcg cccaccgaaa ccgaattctc ctggaacagg cggctattac caccacacct    27060

cgtaataacc ttaatccccg tagttggccc gctgccctgg tgtaccagga aagtcccgct    27120

cccaccactg tggtacttcc cagagacgcc caggccgaag ttcagatgac taactcaggg    27180

gcgcagcttg cgggcggctt tcgtcacagg gtgcggtcgc ccgggcaggg tataactcac    27240

ctgacaatca gagggcgagg tattcagctc aacgacgagt cggtgagctc ctcgcttggt    27300

234892.seguence.ST25

ctccgtccgg acgggacatt tcagatcggc ggcgccggcc gctcttcatt cacgcctcgt     27360

caggcaatcc taactctgca gacctcgtcc tctgagccgc gctctggagg cattggaact     27420

ctgcaattta ttgaggagtt tgtgccatcg gtctacttta accccttctc gggacctccc     27480

ggccactatc cggatcaatt tattcctaac tttgacgcgg taaaggactc ggcggacggc     27540

tacgactgaa tgttaagtgg agaggcagag caactgcgcc tgaaacacct ggtccactgt     27600

cgccgccaca agtgctttgc ccgcgactcc ggtgagtttt gctactttga attgcccgag     27660

gatcatatcg agggcccggc gcacggcgtc cggcttaccg cccagggaga gcttgcccgt     27720

agcctgattc gggagtttac ccagcgcccc ctgctagttg agcgggacag gggaccctgt     27780

gttctcactg tgatttgcaa ctgtcctaac cctggattac atcaagatct ttgttgccat     27840

ctctgtgctg agtataataa atacagaaat taaaatatac tggggctcct atcgccatcc     27900

tgtaaacgcc accgtcttca cccgcccaag caaaccaagg cgaaccttac ctggtacttt     27960

taacatctct ccctctgtga tttacaacag tttcaaccca gacggagtga gtctacgaga     28020

gaacctctcc gagctcagct actccatcag aaaaaacacc accctcctta cctgccggga     28080

acgtacgagt gcgtcaccgg ccgctgcacc acacctaccg cctgaccgta aaccagactt     28140

tttccggaca gacctcaata actctgttta ccagaacagg aggtgagctt agaaaaccct     28200

tagggtatta ggccaaaggc gcagctactg tggggtttat gaacaattca agcaactcta     28260

cgggctattc taattcaggt ttctctagaa atggacggaa ttattacaga gcagcgcctg     28320

ctagaaagac gcagggcagc ggccgagcaa cagcgcatga atcaagagct ccaagacatg     28380

gttaacttgc accagtgcaa aaggggtatc ttttgtctgg taaagcaggc caaagtcacc     28440

tacgacagta ataccaccgg acaccgcctt agctacaagt tgccaaccaa gcgtcagaaa     28500

ttggtggtca tggtgggaga aaagcccatt accataactc agcactcggt agaaaccgaa     28560

ggctgcattc actcaccttg tcaaggacct gaggatctct gcacccttat taagaccctg     28620

tgcggtctca aagatcttat tccctttaac taataaaaaa aaataataaa gcatcactta     28680

cttaaaatca gttagcaaat ttctgtccag tttattcagc agcacctcct tgccctcctc     28740

ccagctctgg tattgcagct tcctcctggc tgcaaacttt ctccacaatc taaatggaat     28800

gtcagtttcc tcctgttcct gtccatccgc acccactatc ttcatgttgt tgcagatgaa     28860

gcgcgcaaga ccgtctgaag ataccttcaa ccccgtgtat ccatatgaca cggaaaccgg     28920

tcctccaact gtgccttttc ttactcctcc ctttgtatcc cccaatgggt ttcaagagag     28980

tccccctggg gtactctctt tgcgcctatc cgaacctcta gttacctcca atggcatgct     29040

tgcgctcaaa atgggcaacg gcctctctct ggacgaggcc ggcaacctta cctcccaaaa     29100

tgtaaccact gtgagcccac ctctcaaaaa aaccaagtca aacataaacc tggaaatatc     29160

tgcacccctc acagttacct cagaagccct aactgtggct gccgccgcac ctctaatggt     29220

cgcgggcaac acactcacca tgcaatcaca ggccccgcta accgtgcacg actccaaact    29280

tagcattgcc acccaaggac ccctcacagt gtcagaagga aagctagccc tgcaaacatc    29340

aggccccctc accaccaccg atagcagtac ccttactatc actgcctcac cccctctaac    29400

tactgccact ggtagcttgg gcattgactt gaaagagccc atttatacac aaaatggaaa    29460

actaggacta aagtacgggg ctcctttgca tgtaacagac gacctaaaca ctttgaccgt    29520

agcaactggt ccaggtgtga ctattaataa tacttccttg caaactaaag ttactggagc    29580

cttgggtttt gattcacaag gcaatatgca acttaatgta gcaggaggac taaggattga    29640

ttctcaaaac agacgcctta tacttgatgt tagttatccg tttgatgctc aaaaccaact    29700

aaatctaaga ctaggacagg gccctctttt tataaactca gcccacaact tggatattaa    29760

ctacaacaaa ggcctttact tgtttacagc ttcaaacaat tccaaaaagc ttgaggttaa    29820

cctaagcact gccaaggggt tgatgtttga cgctacagcc atagccatta atgcaggaga    29880

tgggcttgaa tttggttcac ctaatgcacc aaacacaaat cccctcaaaa caaaaattgg    29940

ccatggccta gaatttgatt caaacaaggc tatggttcct aaactaggaa ctggccttag    30000

ttttgacagc acaggtgcca ttacagtagg aaacaaaaat aatgataagc taactttgtg    30060

gaccacacca gctccatctc ctaactgtag actaaatgca gagaaagatg ctaaactcac    30120

tttggtctta acaaaatgtg gcagtcaaat acttgctaca gtttcagttt tggctgttaa    30180

aggcagtttg gctccaatat ctggaacagt tcaaagtgct catcttatta taagatttga    30240

cgaaaatgga gtgctactaa acaattcctt cctggaccca gaatattgga actttagaaa    30300

tggagatctt actgaaggca cagcctatac aaacgctgtt ggatttatgc ctaacctatc    30360

agcttatcca aaatctcacg gtaaaactgc caaaagtaac attgtcagtc aagtttactt    30420

aaacggagac aaaactaaac ctgtaacact aaccattaca ctaaacggta cacaggaaac    30480

aggagacaca actccaagtg catactctat gtcattttca tgggactggt ctggccacaa    30540

ctacattaat gaaatatttg ccacatcctc ttacactttt tcatacattg cccaagaata    30600

aagaatcgtt tgtgttatgt ttcaacgtgt ttatttttca attgcccggg atcggtgatc    30660

accgatccag acatgataag atacattgat gagtttggac aaaccacaac tagaatgcag    30720

tgaaaaaaat gctttatttg tgaaatttgt gatgctattg ctttatttgt aaccattata    30780

agctgcaata aacaagttcc cggatcgcga tccggcccga ggctgtagcc gacgatggtg    30840

cgccaggaga gttgttgatt cattgtttgc ctccctgctg cggtttttca ccgaagttca    30900

tgccagtcca gcgtttttgc agcagaaaag ccgccgactt cggtttgcgg tcgcgagtga    30960

agatcccttt cttgttaccg ccaacgcgca atatgccttg cgaggtcgca aaatcggcga    31020

aattccatac ctgttcaccg acgacggcgc tgacgcgatc aaagacgcgg tgatacatat    31080

ccagccatgc acactgatac tcttcactcc acatgtcggt gtacattgag tgcagcccgg    31140

ctaacgtatc cacgccgtat tcggtgatga taatcggctg atgcagtttc tcctgccagg    31200

ccagaagttc tttttccagt accttctctg ccgtttccaa atcgccgctt tggacatacc    31260

atccgtaata acggttcagg cacagcacat caaagagatc gctgatggta tcggtgtgag    31320

cgtcgcagaa cattacattg acgcaggtga tcggacgcgt cgggtcgagt ttacgcgttg    31380

cttccgccag tggcgcgaaa tattcccgtg caccttgcgg acgggtatcc ggttcgttgg    31440

caatactcca catcaccacg cttgggtggt ttttgtcacg cgctatcagc tctttaatcg    31500

cctgtaagtg cgcttgctga gtttccccgt tgactgcctc ttcgctgtac agttctttcg    31560

gcttgttgcc cgcttcgaaa ccaatgccta aagagaggtt aaagccgaca gcagcagttt    31620

catcaatcac cacgatgcca tgttcatctg cccagtcgag catctcttca gcgtaagggt    31680

aatgcgaggt acggtaggag ttggccccaa tccagtccat taatgcgtgg tcgtgcacca    31740

tcagcacgtt atcgaatcct ttgccacgca agtccgcatc ttcatgacga ccaaagccag    31800

taaagtagaa cggtttgtgg ttaatcagga actgttcgcc cttcactgcc actgaccgga    31860

tgccgacgcg aagcgggtag atatcacact ctgtctggct tttggctgtg acgcacagtt    31920

catagagata accttcaccc ggttgccaga ggtgcggatt caccacttgc aaagtcccgc    31980

tagtgccttg tccagttgca accacctgtt gatccgcatc acgcagttca acgctgacat    32040

caccattggc caccacctgc cagtcaacag acgcgtggtt acagtcttgc gcgacatgcg    32100

tcaccacggt gatatcgtcc acccaggtgt tcggcgtggt gtagagcatt acgctgcgat    32160

ggattccggc atagttaaag aaatcatgga agtaagactg ctttttcttg ccgttttcgt    32220

cggtaatcac cattcccggc gggatagtct gccagttcag ttcgttgttc acacaaacgg    32280

tgatacgtac acttttcccg gcaataacat acggcgtgac atcggcttca aatggcgtat    32340

agccgccctg atgctccatc acttcctgat tattgaccca cactttgccg taatgagtga    32400

ccgcatcgaa acgcagcacg atacgctggc ctgcccaacc tttcggtata aagacttcgc    32460

gctgatacca gacgttgccc gcataattac gaatatctgc atcggcgaac tgatcgttaa    32520

aactgcctgg cacagcaatt gcccggcttt cttgtaacgc gctttcccac caacgctgat    32580

caattccaca gttttcgcga tccagactga atgcccacag gccgtcgagt tttttgattt    32640

cacgggttgg ggtttctaca ggacggacca tgcgttcgac ctttctcttc ttttttgggc    32700

ccatgatggc agatccgtat agtgagtcgt attagctggt tctttccgcc tcagaagcca    32760

tagagcccac cgcatcccca gcatgcctgc tattgtcttc ccaatcctcc cccttgctgt    32820

cctgccccac cccacccccc agaatagaat gacacctact cagacaatgc gatgcaattt    32880

cctcatttta ttaggaaagg acagtgggag tggcaccttc cagggtcaag gaaggcacgg    32940

gggaggggca aacaacagat ggctggcaac tagaaggcac agtcgaggct gatcagcgag    33000

ctctagatgc atgctcgagc ggccgccagt gtgatggata tctgcagaat tccagcacac    33060

tggcggccgt tactagtgga tccgagctcg gtacccggcc gttataacac cactcgacac    33120

ggcaccagct caatcagtca cagtgtaaaa aagggccaag tgcagagcga gtatatatag    33180

gactaaaaaa tgacgtaacg gttaaagtcc acaaaaaaca cccagaaaac cgcacgcgaa    33240

cctacgccca gaaacgaaag ccaaaaaacc cacaacttcc tcaaatcgtc acttccgttt    33300

tcccacgtta cgtcacttcc cattttaaga aaactacaat tcccaacaca tacaagttac    33360

tccgccctaa aacctacgtc acccgccccg ttcccacgcc ccgcgccacg tcacaaactc    33420

caccccctca ttatcatatt ggcttcaatc caaaataagg tatattattg atgatg        33476

 

<210>7

<211>33589

<212>DNA

<213>人工的

 

<220>

<223>合成的

 

<400>7

catcatcaat aatatacctt attttggatt gaagccaata tgataatgag ggggtggagt     60

ttgtgacgtg gcgcggggcg tgggaacggg gcgggtgacg tagtagtgtg gcggaagtgt    120

gatgttgcaa gtgtggcgga acacatgtaa gcgacggatg tggcaaaagt gacgtttttg    180

gtgtgcgccg gtgtacacag gaagtgacaa ttttcgcgcg gttttaggcg gatgttgtag    240

taaatttggg cgtaaccgag taagatttgg ccattttcgc gggaaaactg aataagagga    300

agtgaaatct gaataatttt gtgttactca tagcgcgtaa tatttgtcta gggcccggga    360

tcggtgatca ccgatccaga catgataaga tacattgatg agtttggaca aaccacaact    420

agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta    480

accattataa gctgcaataa acaagttccc ggatctttct agctagtcta gactagctag    540

actcgagagc ggccgcaatc gataagcttg atctagagat gatcctcacc acagccagtt    600

ggagatgtcg aaccaggacc acaggttttt ccaggagtcc agagccagca ggtctttttc    660

gtttttttcc tgctgggtct gggagtcttc cagcagacgg tagatggtgt cggtgtagtt    720

ggagatttca cggtcccatt ccatccaggt catgttgttc cagatctcga gctgctggtc    780

tttcaggtaa cgttcgatag ccagaacacg ggtctgcagc tgtttgatac cccaaacggt    840

cagctgcagc atgtgctgct gagcttcgat agcacgcagc aggttggact gctgctgaac    900

gatggaggac agcagctgac gagcctgaac ggtaagctta gcaccggtcg gagcgatacc    960

cagcggtttc agttcgataa ctttgtattt gtacagttcg gaacgccagt tgtctttcat   1020

gttaccacca cccggacgga agatttcttc ggttttgttg tcttcaccac cgtcacgaac   1080

cagcagcaga ccggtgatgt tggatttgca ggtgatgtta ccagcgatcg gcggagcgta    1140

catagcacga ccaacaccct gccacatgtt gatgatctgt ttgatacggc acggcagggt    1200

gatggtttcg tcttcggtag cgttgttgtt gaacagacgg gtggtgttgc agtagaagaa    1260

ttcaccacgg cagttgaagg agtgggtggt gatttccagg tcaccaccgg aggacggagc    1320

gaatttgatg gttttgttgt tgttgtagtt ttcctgcagt ttttctttaa cacgtttcag    1380

ggtttcgttc catttggaac cggagatgtt gcagtaagcc tgacggatgt caccgatgat    1440

gtcaccggta gcgtagaagg tctgacccgg accgatacgc atggatttac gggtgttgtt    1500

gttcggacgg gtgcaaacga tttcaacgga tttgttcagg tgaacgatga tggttttaac    1560

gttgtcggtc aggttttcgg aacggatgat gatttctttt tcagccaggg aaccgttcag    1620

cagcagctgg gtggaaacaa ccggtttgat accatgggtg cactgaacgg tggaaacgtt    1680

gttgcacgga cctttaccgg agaaggtttt gttgttgcat ttcaggatag cgtaaccagc    1740

cggagcgcag tagtggatcg ggatcgggtc gaagttaact ttcgggcaag cctgggtgat    1800

ggtggaagcg ttgcagttga tcaggatgta ttcggagttg ttggagttgt tacggttttc    1860

tttcagcaga acgatgtccg gacggtagaa cagagcgtaa ccctgctgtt ttttgtcacg    1920

gatttcggtg gtggtgttga aggagcagtt acggatttct ttgttcatgt cgttggtaac    1980

gttgtttttg aaggtagcgt tggtgcagtg cagggtaacg cacagcgggg tcagtttaac    2040

gcacggtttc agggactggt cccacaggga gatgatgtct tcgtgcatct ggtcaaccat    2100

gtcgtttttc cacatgttga agttttcggt aacgttttcc agaacgattt cctgcgggtt    2160

cgggtcggtc ggaacgcaag cgtgggtagc ccaaacgttg tgaacttcac ggtcgtaggc    2220

tttggtgtcg gaagcgcaga acagggtggt tttagcgtcg gtccaaaccg gaacaccgta    2280

gtaaacggta acccacatgt taccaacaac acggcagatg atgatcatcc agaaacccag    2340

gataccccac atccaccact gcggccagtt acgcgggata ccacgaacac gcatggtggc    2400

gatatctcta gtcatcgaat tctgcagtga tcagggatcc cagatccgta tagtgagtcg    2460

tattaggtac cggctgcagt tggacctggg agtggacacc tgtggagaga aaggcaaagt    2520

ggatgtcatt gtcactcaag tgtatggcca gatctcaagc ctgccacacc tcaagtgaag    2580

ccaagggggt gggcctatag actctatagg cggtacttac gtcactcttg gcacggggaa    2640

tccgcgttcc aatgcaccgt tcccggccgc ggaggctgga tcggtcccgg tgtcttctat    2700

ggaggtcaaa acagcgtgga tggcgtctcc aggcgatctg acggttcact aaacgagctc    2760

tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt    2820

tgttacgaca ttttggaaag tcccgttgat tttggtgcca aaacaaactc ccattgacgt    2880

caatggggtg gagacttgga aatccccgtg agtcaaaccg ctatccacgc ccattgatgt    2940

actgccaaaa ccgcatcacc atggtaatag cgatgactaa tacgtagatg tactgccaag    3000

taggaaagtc ccataaggtc atgtactggg cataatgcca ggcgggccat ttaccgtcat    3060

tgacgtcaat agggggcgta cttggcatat gatacacttg atgtactgcc aagtgggcag    3120

tttaccgtaa atactccacc cattgacgtc aatggaaagt ccctattggc gttactatgg    3180

gaacatacgt cattattgac gtcaatgggc gggggtcgtt gggcggtcag ccaggcgggc    3240

catttaccgt aagttatgta acgcggaact ccatatatgg gctatgaact aatgaccccg    3300

taattgatta ctattaataa ctagtactga aatgtgtggg cgtggcttaa gggtgggaaa    3360

gaatatataa ggtgggggtc ttatgtagtt ttgtatctgt tttgcagcag ccgccgccgc    3420

catgagcacc aactcgtttg atggaagcat tgtgagctca tatttgacaa cgcgcatgcc    3480

cccatgggcc ggggtgcgtc agaatgtgat gggctccagc attgatggtc gccccgtcct    3540

gcccgcaaac tctactacct tgacctacga gaccgtgtct ggaacgccgt tggagactgc    3600

agcctccgcc gccgcttcag ccgctgcagc caccgcccgc gggattgtga ctgactttgc    3660

tttcctgagc ccgcttgcaa gcagtgcagc ttcccgttca tccgcccgcg atgacaagtt    3720

gacggctctt ttggcacaat tggattcttt gacccgggaa cttaatgtcg tttctcagca    3780

gctgttggat ctgcgccagc aggtttctgc cctgaaggct tcctcccctc ccaatgcggt    3840

ttaaaacata aataaaaaac cagactctgt ttggatttgg atcaagcaag tgtcttgctg    3900

tctttattta ggggttttgc gcgcgcggta ggcccgggac cagcggtctc ggtcgttgag    3960

ggtcctgtgt attttttcca ggacgtggta aaggtgactc tggatgttca gatacatggg    4020

cataagcccg tctctggggt ggaggtagca ccactgcaga gcttcatgct gcggggtggt    4080

gttgtagatg atccagtcgt agcaggagcg ctgggcgtgg tgcctaaaaa tgtctttcag    4140

tagcaagctg attgccaggg gcaggccctt ggtgtaagtg tttacaaagc ggttaagctg    4200

ggatgggtgc atacgtgggg atatgagatg catcttggac tgtattttta ggttggctat    4260

gttcccagcc atatccctcc ggggattcat gttgtgcaga accaccagca cagtgtatcc    4320

ggtgcacttg ggaaatttgt catgtagctt agaaggaaat gcgtggaaga acttggagac    4380

gcccttgtga cctccaagat tttccatgca ttcgtccata atgatggcaa tgggcccacg    4440

ggcggcggcc tgggcgaaga tatttctggg atcactaacg tcatagttgt gttccaggat    4500

gagatcgtca taggccattt ttacaaagcg cgggcggagg gtgccagact gcggtataat    4560

ggttccatcc ggcccagggg cgtagttacc ctcacagatt tgcatttccc acgctttgag    4620

ttcagatggg gggatcatgt ctacctgcgg ggcgatgaag aaaacggttt ccggggtagg    4680

ggagatcagc tgggaagaaa gcaggttcct gagcagctgc gacttaccgc agccggtggg    4740

cccgtaaatc acacctatta ccggctgcaa ctggtagtta agagagctgc agctgccgtc    4800

atccctgagc aggggggcca cttcgttaag catgtccctg actcgcatgt tttccctgac    4860

caaatccgcc agaaggcgct cgccgcccag cgatagcagt tcttgcaagg aagcaaagtt    4920

tttcaacggt ttgagaccgt ccgccgtagg catgcttttg agcgtttgac caagcagttc    4980

caggcggtcc cacagctcgg tcacctgctc tacggcatct cgatccagca tatctcctcg    5040

tttcgcgggt tggggcggct ttcgctgtac ggcagtagtc ggtgctcgtc cagacgggcc    5100

agggtcatgt ctttccacgg gcgcagggtc ctcgtcagcg tagtctgggt cacggtgaag    5160

gggtgcgctc cgggctgcgc gctggccagg gtgcgcttga ggctggtcct gctggtgctg    5220

aagcgctgcc ggtcttcgcc ctgcgcgtcg gccaggtagc atttgaccat ggtgtcatag    5280

tccagcccct ccgcggcgtg gcccttggcg cgcagcttgc ccttggagga ggcgccgcac    5340

gaggggcagt gcagactttt gagggcgtag agcttgggcg cgagaaatac cgattccggg    5400

gagtaggcat ccgcgccgca ggccccgcag acggtctcgc attccacgag ccaggtgagc    5460

tctggccgtt cggggtcaaa aaccaggttt cccccatgct ttttgatgcg tttcttacct    5520

ctggtttcca tgagccggtg tccacgctcg gtgacgaaaa ggctgtccgt gtccccgtat    5580

acagacttga gaggcctgtc ctcgagcggt gttccgcggt cctcctcgta tagaaactcg    5640

gaccactctg agacaaaggc tcgcgtccag gccagcacga aggaggctaa gtgggagggg    5700

tagcggtcgt tgtccactag ggggtccact cgctccaggg tgtgaagaca catgtcgccc    5760

tcttcggcat caaggaaggt gattggtttg taggtgtagg ccacgtgacc gggtgttcct    5820

gaaggggggc tataaaaggg ggtgggggcg cgttcgtcct cactctcttc cgcatcgctg    5880

tctgcgaggg ccagctgttg gggtgagtac tccctctgaa aagcgggcat gacttctgcg    5940

ctaagattgt cagtttccaa aaacgaggag gatttgatat tcacctggcc cgcggtgatg    6000

cctttgaggg tggccgcatc catctggtca gaaaagacaa tctttttgtt gtcaagcttg    6060

gtggcaaacg acccgtagag ggcgttggac agcaacttgg cgatggagcg cagggtttgg    6120

tttttgtcgc gatcggcgcg ctccttggcc gcgatgttta gctgcacgta ttcgcgcgca    6180

acgcaccgcc attcgggaaa gacggtggtg cgctcgtcgg gcaccaggtg cacgcgccaa    6240

ccgcggttgt gcagggtgac aaggtcaacg ctggtggcta cctctccgcg taggcgctcg    6300

ttggtccagc agaggcggcc gcccttgcgc gagcagaatg gcggtagggg gtctagctgc    6360

gtctcgtccg gggggtctgc gtccacggta aagaccccgg gcagcaggcg cgcgtcgaag    6420

tagtctatct tgcatccttg caagtctagc gcctgctgcc atgcgcgggc ggcaagcgcg    6480

cgctcgtatg ggttgagtgg gggaccccat ggcatggggt gggtgagcgc ggaggcgtac    6540

atgccgcaaa tgtcgtaaac gtagaggggc tctctgagta ttccaagata tgtagggtag    6600

catcttccac cgcggatgct ggcgcgcacg taatcgtata gttcgtgcga gggagcgagg    6660

aggtcgggac cgaggttgct acgggcgggc tgctctgctc ggaagactat ctgcctgaag    6720

atggcatgtg agttggatga tatggttgga cgctggaaga cgttgaagct ggcgtctgtg    6780

agacctaccg cgtcacgcac gaaggaggcg taggagtcgc gcagcttgtt gaccagctcg    6840

gcggtgacct gcacgtctag ggcgcagtag tccagggttt ccttgatgat gtcatactta    6900

tcctgtccct tttttttcca cagctcgcgg ttgaggacaa actcttcgcg gtctttccag    6960

tactcttgga tcggaaaccc gtcggcctcc gaacggtaag agcctagcat gtagaactgg    7020

ttgacggcct ggtaggcgca gcatcccttt tctacgggta gcgcgtatgc ctgcgcggcc    7080

ttccggagcg aggtgtgggt gagcgcaaag gtgtccctga ccatgacttt gaggtactgg    7140

tatttgaagt cagtgtcgtc gcatccgccc tgctcccaga gcaaaaagtc cgtgcgcttt    7200

ttggaacgcg gatttggcag ggcgaaggtg acatcgttga agagtatctt tcccgcgcga    7260

ggcataaagt tgcgtgtgat gcggaagggt cccggcacct cggaacggtt gttaattacc    7320

tgggcggcga gcacgatctc gtcaaagccg ttgatgttgt ggcccacaat gtaaagttcc    7380

aagaagcgcg ggatgccctt gatggaaggc aattttttaa gttcctcgta ggtgagctct    7440

tcaggggagc tgagcccgtg ctctgaaagg gcccagtctg caagatgagg gttggaagcg    7500

acgaatgagc tccacaggtc acgggccatt agcatttgca ggtggtcgcg aaaggtccta    7560

aactggcgac ctatggccat tttttctggg gtgatgcagt agaaggtaag cgggtcttgt    7620

tcccagcggt cccatccaag gttcgcggct aggtctcgcg cggcagtcac tagaggctca    7680

tctccgccga acttcatgac cagcatgaag ggcacgagct gcttcccaaa ggcccccatc    7740

caagtatagg tctctacatc gtaggtgaca aagagacgct cggtgcgagg atgcgagccg    7800

atcgggaaga actggatctc ccgccaccaa ttggaggagt ggctattgat gtggtgaaag    7860

tagaagtccc tgcgacgggc cgaacactcg tgctggcttt tgtaaaaacg tgcgcagtac    7920

tggcagcggt gcacgggctg tacatcctgc acgaggttga cctgacgacc gcgcacaagg    7980

aagcagagtg ggaatttgag cccctcgcct ggcgggtttg gctggtggtc ttctacttcg    8040

gctgcttgtc cttgaccgtc tggctgctcg aggggagtta cggtggatcg gaccaccacg    8100

ccgcgcgagc ccaaagtcca gatgtccgcg cgcggcggtc ggagcttgat gacaacatcg    8160

cgcagatggg agctgtccat ggtctggagc tcccgcggcg tcaggtcagg cgggagctcc    8220

tgcaggttta cctcgcatag acgggtcagg gcgcgggcta gatccaggtg atacctaatt    8280

tccaggggct ggttggtggc ggcgtcgatg gcttgcaaga ggccgcatcc ccgcggcgcg    8340

actacggtac cgcgcggcgg gcggtgggcc gcgggggtgt ccttggatga tgcatctaaa    8400

agcggtgacg cgggcgagcc cccggaggta gggggggctc cggacccgcc gggagagggg    8460

gcaggggcac gtcggcgccg cgcgcgggca ggagctggtg ctgcgcgcgt aggttgctgg    8520

cgaacgcgac gacgcggcgg ttgatctcct gaatctggcg cctctgcgtg aagacgacgg    8580

gcccggtgag cttgaacctg aaagagagtt cgacagaatc aatttcggtg tcgttgacgg    8640

cggcctggcg caaaatctcc tgcacgtctc ctgagttgtc ttgataggcg atctcggcca    8700

tgaactgctc gatctcttcc tcctggagat ctccgcgtcc ggctcgctcc acggtggcgg    8760

cgaggtcgtt ggaaatgcgg gccatgagct gcgagaaggc gttgaggcct ccctcgttcc    8820

agacgcggct gtagaccacg cccccttcgg catcgcgggc gcgcatgacc acctgcgcga    8880

gattgagctc cacgtgccgg gcgaagacgg cgtagtttcg caggcgctga aagaggtagt    8940

tgagggtggt ggcggtgtgt tctgccacga agaagtacat aacccagcgt cgcaacgtgg    9000

attcgttgat atcccccaag gcctcaaggc gctccatggc ctcgtagaag tccacggcga    9060

agttgaaaaa ctgggagttg cgcgccgaca cggttaactc ctcctccaga agacggatga    9120

gctcggcgac agtgtcgcgc acctcgcgct caaaggctac aggggcctct tcttcttctt    9180

caatctcctc ttccataagg gcctcccctt cttcttcttc tggcggcggt gggggagggg    9240

ggacacggcg gcgacgacgg cgcaccggga ggcggtcgac aaagcgctcg atcatctccc    9300

cgcggcgacg gcgcatggtc tcggtgacgg cgcggccgtt ctcgcggggg cgcagttgga    9360

agacgccgcc cgtcatgtcc cggttatggg ttggcggggg gctgccatgc ggcagggata    9420

cggcgctaac gatgcatctc aacaattgtt gtgtaggtac tccgccgccg agggacctga    9480

gcgagtccgc atcgaccgga tcggaaaacc tctcgagaaa ggcgtctaac cagtcacagt    9540

cgcaaggtag gctgagcacc gtggcgggcg gcagcgggcg gcggtcgggg ttgtttctgg    9600

cggaggtgct gctgatgatg taattaaagt aggcggtctt gagacggcgg atggtcgaca    9660

gaagcaccat gtccttgggt ccggcctgct gaatgcgcag gcggtcggcc atgccccagg    9720

cttcgttttg acatcggcgc aggtctttgt agtagtcttg catgagcctt tctaccggca    9780

cttcttcttc tccttcctct tgtcctgcat ctcttgcatc tatcgctgcg gcggcggcgg    9840

agtttggccg taggtggcgc cctcttcctc ccatgcgtgt gaccccgaag cccctcatcg    9900

gctgaagcag ggctaggtcg gcgacaacgc gctcggctaa tatggcctgc tgcacctgcg    9960

tgagggtaga ctggaagtca tccatgtcca caaagcggtg gtatgcgccc gtgttgatgg   10020

tgtaagtgca gttggccata acggaccagt taacggtctg gtgacccggc tgcgagagct   10080

cggtgtacct gagacgcgag taagccctcg agtcaaatac gtagtcgttg caagtccgca   10140

ccaggtactg gtatcccacc aaaaagtgcg gcggcggctg gcggtagagg ggccagcgta   10200

gggtggccgg ggctccgggg gcgagatctt ccaacataag gcgatgatat ccgtagatgt   10260

acctggacat ccaggtgatg ccggcggcgg tggtggaggc gcgcggaaag tcgcggacgc   10320

ggttccagat gttgcgcagc ggcaaaaagt gctccatggt cgggacgctc tggccggtca   10380

ggcgcgcgca atcgttgacg ctctagcgtg caaaaggaga gcctgtaagc gggcactctt   10440

ccgtggtctg gtggataaat tcgcaagggt atcatggcgg acgaccgggg ttcgagcccc   10500

gtatccggcc gtccgccgtg atccatgcgg ttaccgcccg cgtgtcgaac ccaggtgtgc   10560

gacgtcagac aacgggggag tgctcctttt ggcttccttc caggcgcggc ggctgctgcg    10620

ctagcttttt tggccactgg ccgcgcgcag cgtaagcggt taggctggaa agcgaaagca    10680

ttaagtggct cgctccctgt agccggaggg ttattttcca agggttgagt cgcgggaccc    10740

ccggttcgag tctcggaccg gccggactgc ggcgaacggg ggtttgcctc cccgtcatgc    10800

aagaccccgc ttgcaaattc ctccggaaac agggacgagc cccttttttg cttttcccag    10860

atgcatccgg tgctgcggca gatgcgcccc cctcctcagc agcggcaaga gcaagagcag    10920

cggcagacat gcagggcacc ctcccctcct cctaccgcgt caggaggggc gacatccgcg    10980

gttgacgcgg cagcagatgg tgattacgaa cccccgcggc gccgggcccg gcactacctg    11040

gacttggagg agggcgaggg cctggcgcgg ctaggagcgc cctctcctga gcggcaccca    11100

agggtgcagc tgaagcgtga tacgcgtgag gcgtacgtgc cgcggcagaa cctgtttcgc    11160

gaccgcgagg gagaggagcc cgaggagatg cgggatcgaa agttccacgc agggcgcgag    11220

ctgcggcatg gcctgaatcg cgagcggttg ctgcgcgagg aggactttga gcccgacgcg    11280

cgaaccggga ttagtcccgc gcgcgcacac gtggcggccg ccgacctggt aaccgcatac    11340

gagcagacgg tgaaccagga gattaacttt caaaaaagct ttaacaacca cgtgcgtacg    11400

cttgtggcgc gcgaggaggt ggctatagga ctgatgcatc tgtgggactt tgtaagcgcg    11460

ctggagcaaa acccaaatag caagccgctc atggcgcagc tgttccttat agtgcagcac    11520

agcagggaca acgaggcatt cagggatgcg ctgctaaaca tagtagagcc cgagggccgc    11580

tggctgctcg atttgataaa catcctgcag agcatagtgg tgcaggagcg cagcttgagc    11640

ctggctgaca aggtggccgc catcaactat tccatgctta gcctgggcaa gttttacgcc    11700

cgcaagatat accatacccc ttacgttccc atagacaagg aggtaaagat cgaggggttc    11760

tacatgcgca tggcgctgaa ggtgcttacc ttgagcgacg acctgggcgt ttatcgcaac    11820

gagcgcatcc acaaggccgt gagcgtgagc cggcggcgcg agctcagcga ccgcgagctg    11880

atgcacagcc tgcaaagggc cctggctggc acgggcagcg gcgatagaga ggccgagtcc    11940

tactttgacg cgggcgctga cctgcgctgg gccccaagcc gacgcgccct ggaggcagct    12000

ggggccggac ctgggctggc ggtggcaccc gcgcgcgctg gcaacgtcgg cggcgtggag    12060

gaatatgacg aggacgatga gtacgagcca gaggacggcg agtactaagc ggtgatgttt    12120

ctgatcagat gatgcaagac gcaacggacc cggcggtgcg ggcggcgctg cagagccagc    12180

cgtccggcct taactccacg gacgactggc gccaggtcat ggaccgcatc atgtcgctga    12240

ctgcgcgcaa tcctgacgcg ttccggcagc agccgcaggc caaccggctc tccgcaattc    12300

tggaagcggt ggtcccggcg cgcgcaaacc ccacgcacga gaaggtgctg gcgatcgtaa    12360

acgcgctggc cgaaaacagg gccatccggc ccgacgaggc cggcctggtc tacgacgcgc    12420

tgcttcagcg cgtggctcgt tacaacagcg gcaacgtgca gaccaacctg gaccggctgg    12480

tgggggatgt gcgcgaggcc gtggcgcagc gtgagcgcgc gcagcagcag ggcaacctgg    12540

gctccatggt tgcactaaac gccttcctga gtacacagcc cgccaacgtg ccgcggggac    12600

aggaggacta caccaacttt gtgagcgcac tgcggctaat ggtgactgag acaccgcaaa    12660

gtgaggtgta ccagtctggg ccagactatt ttttccagac cagtagacaa ggcctgcaga    12720

ccgtaaacct gagccaggct ttcaaaaact tgcaggggct gtggggggtg cgggctccca    12780

caggcgaccg cgcgaccgtg tctagcttgc tgacgcccaa ctcgcgcctg ttgctgctgc    12840

taatagcgcc cttcacggac agtggcagcg tgtcccggga cacataccta ggtcacttgc    12900

tgacactgta ccgcgaggcc ataggtcagg cgcatgtgga cgagcatact ttccaggaga    12960

ttacaagtgt cagccgcgcg ctggggcagg aggacacggg cagcctggag gcaaccctaa    13020

actacctgct gaccaaccgg cggcagaaga tcccctcgtt gcacagttta aacagcgagg    13080

aggagcgcat tttgcgctac gtgcagcaga gcgtgagcct taacctgatg cgcgacgggg    13140

taacgcccag cgtggcgctg gacatgaccg cgcgcaacat ggaaccgggc atgtatgcct    13200

caaaccggcc gtttatcaac cgcctaatgg actacttgca tcgcgcggcc gccgtgaacc    13260

ccgagtattt caccaatgcc atcttgaacc cgcactggct accgccccct ggtttctaca    13320

ccgggggatt cgaggtgccc gagggtaacg atggattcct ctgggacgac atagacgaca    13380

gcgtgttttc cccgcaaccg cagaccctgc tagagttgca acagcgcgag caggcagagg    13440

cggcgctgcg aaaggaaagc ttccgcaggc caagcagctt gtccgatcta ggcgctgcgg    13500

ccccgcggtc agatgctagt agcccatttc caagcttgat agggtctctt accagcactc    13560

gcaccacccg cccgcgcctg ctgggcgagg aggagtacct aaacaactcg ctgctgcagc    13620

cgcagcgcga aaaaaacctg cctccggcat ttcccaacaa cgggatagag agcctagtgg    13680

acaagatgag tagatggaag acgtacgcgc aggagcacag ggacgtgcca ggcccgcgcc    13740

cgcccacccg tcgtcaaagg cacgaccgtc agcggggtct ggtgtgggag gacgatgact    13800

cggcagacga cagcagcgtc ctggatttgg gagggagtgg caacccgttt gcgcaccttc    13860

gccccaggct ggggagaatg ttttaaaaaa aaaaaaagca tgatgcaaaa taaaaaactc    13920

accaaggcca tggcaccgag cgttggtttt cttgtattcc ccttagtatg cggcgcgcgg    13980

cgatgtatga ggaaggtcct cctccctcct acgagagtgt ggtgagcgcg gcgccagtgg    14040

cggcggcgct gggttctccc ttcgatgctc ccctggaccc gccgtttgtg cctccgcggt    14100

acctgcggcc taccgggggg agaaacagca tccgttactc tgagttggca cccctattcg    14160

acaccacccg tgtgtacctg gtggacaaca agtcaacgga tgtggcatcc ctgaactacc    14220

agaacgacca cagcaacttt ctgaccacgg tcattcaaaa caatgactac agcccggggg    14280

aggcaagcac acagaccatc aatcttgacg accggtcgca ctggggcggc gacctgaaaa    14340

ccatcctgca taccaacatg ccaaatgtga acgagttcat gtttaccaat aagtttaagg    14400

cgcgggtgat ggtgtcgcgc ttgcctacta aggacaatca ggtggagctg aaatacgagt    14460

gggtggagtt cacgctgccc gagggcaact actccgagac catgaccata gaccttatga    14520

acaacgcgat cgtggagcac tacttgaaag tgggcagaca gaacggggtt ctggaaagcg    14580

acatcggggt aaagtttgac acccgcaact tcagactggg gtttgacccc gtcactggtc    14640

ttgtcatgcc tggggtatat acaaacgaag ccttccatcc agacatcatt ttgctgccag    14700

gatgcggggt ggacttcacc cacagccgcc tgagcaactt gttgggcatc cgcaagcggc    14760

aacccttcca ggagggcttt aggatcacct acgatgatct ggagggtggt aacattcccg    14820

cactgttgga tgtggacgcc taccaggcga gcttgaaaga tgacaccgaa cagggcgggg    14880

gtggcgcagg cggcagcaac agcagtggca gcggcgcgga agagaactcc aacgcggcag    14940

ccgcggcaat gcagccggtg gaggacatga acgatcatgc cattcgcggc gacacctttg    15000

ccacacgggc tgaggagaag cgcgctgagg ccgaagcagc ggccgaagct gccgcccccg    15060

ctgcgcaacc cgaggtcgag aagcctcaga agaaaccggt gatcaaaccc ctgacagagg    15120

acagcaagaa acgcagttac aacctaataa gcaatgacag caccttcacc cagtaccgca    15180

gctggtacct tgcatacaac tacggcgacc ctcagaccgg aatccgctca tggaccctgc    15240

tttgcactcc tgacgtaacc tgcggctcgg agcaggtcta ctggtcgttg ccagacatga    15300

tgcaagaccc cgtgaccttc cgctccacgc gccagatcag caactttccg gtggtgggcg    15360

ccgagctgtt gcccgtgcac tccaagagct tctacaacga ccaggccgtc tactcccaac    15420

tcatccgcca gtttacctct ctgacccacg tgttcaatcg ctttcccgag aaccagattt    15480

tggcgcgccc gccagccccc accatcacca ccgtcagtga aaacgttcct gctctcacag    15540

atcacgggac gctaccgctg cgcaacagca tcggaggagt ccagcgagtg accattactg    15600

acgccagacg ccgcacctgc ccctacgttt acaaggccct gggcatagtc tcgccgcgcg    15660

tcctatcgag ccgcactttt tgagcaagca tgtccatcct tatatcgccc agcaataaca    15720

caggctgggg cctgcgcttc ccaagcaaga tgtttggcgg ggccaagaag cgctccgacc    15780

aacacccagt gcgcgtgcgc gggcactacc gcgcgccctg gggcgcgcac aaacgcggcc    15840

gcactgggcg caccaccgtc gatgacgcca tcgacgcggt ggtggaggag gcgcgcaact    15900

acacgcccac gccgccacca gtgtccacag tggacgcggc cattcagacc gtggtgcgcg    15960

gagcccggcg ctatgctaaa atgaagagac ggcggaggcg cgtagcacgt cgccaccgcc    16020

gccgacccgg cactgccgcc caacgcgcgg cggcggccct gcttaaccgc gcacgtcgca    16080

ccggccgacg ggcggccatg cgggccgctc gaaggctggc cgcgggtatt gtcactgtgc    16140

cccccaggtc caggcgacga gcggccgccg cagcagccgc ggccattagt gctatgactc    16200

agggtcgcag gggcaacgtg tattgggtgc gcgactcggt tagcggcctg cgcgtgcccg    16260

tgcgcacccg ccccccgcgc aactagattg caagaaaaaa ctacttagac tcgtactgtt    16320

gtatgtatcc agcggcggcg gcgcgcaacg aagctatgtc caagcgcaaa atcaaagaag    16380

agatgctcca ggtcatcgcg ccggagatct atggcccccc gaagaaggaa gagcaggatt    16440

acaagccccg aaagctaaag cgggtcaaaa agaaaaagaa agatgatgat gatgaacttg    16500

acgacgaggt ggaactgctg cacgctaccg cgcccaggcg acgggtacag tggaaaggtc    16560

gacgcgtaaa acgtgttttg cgacccggca ccaccgtagt ctttacgccc ggtgagcgct    16620

ccacccgcac ctacaagcgc gtgtatgatg aggtgtacgg cgacgaggac ctgcttgagc    16680

aggccaacga gcgcctcggg gagtttgcct acggaaagcg gcataaggac atgctggcgt    16740

tgccgctgga cgagggcaac ccaacaccta gcctaaagcc cgtaacactg cagcaggtgc    16800

tgcccgcgct tgcaccgtcc gaagaaaagc gcggcctaaa gcgcgagtct ggtgacttgg    16860

cacccaccgt gcagctgatg gtacccaagc gccagcgact ggaagatgtc ttggaaaaaa    16920

tgaccgtgga acctgggctg gagcccgagg tccgcgtgcg gccaatcaag caggtggcgc    16980

cgggactggg cgtgcagacc gtggacgttc agatacccac taccagtagc accagtattg    17040

ccaccgccac agagggcatg gagacacaaa cgtccccggt tgcctcagcg gtggcggatg    17100

ccgcggtgca ggcggtcgct gcggccgcgt ccaagacctc tacggaggtg caaacggacc    17160

cgtggatgtt tcgcgtttca gccccccggc gcccgcgccg ttcgaggaag tacggcgccg    17220

ccagcgcgct actgcccgaa tatgccctac atccttccat tgcgcctacc cccggctatc    17280

gtggctacac ctaccgcccc agaagacgag caactacccg acgccgaacc accactggaa    17340

cccgccgccg ccgtcgccgt cgccagcccg tgctggcccc gatttccgtg cgcagggtgg    17400

ctcgcgaagg aggcaggacc ctggtgctgc caacagcgcg ctaccacccc agcatcgttt    17460

aaaagccggt ctttgtggtt cttgcagata tggccctcac ctgccgcctc cgtttcccgg    17520

tgccgggatt ccgaggaaga atgcaccgta ggaggggcat ggccggccac ggcctgacgg    17580

gcggcatgcg tcgtgcgcac caccggcggc ggcgcgcgtc gcaccgtcgc atgcgcggcg    17640

gtatcctgcc cctccttatt ccactgatcg ccgcggcgat tggcgccgtg cccggaattg    17700

catccgtggc cttgcaggcg cagagacact gattaaaaac aagttgcatg tggaaaaatc    17760

aaaataaaaa gtctggactc tcacgctcgc ttggtcctgt aactattttg tagaatggaa    17820

gacatcaact ttgcgtctct ggccccgcga cacggctcgc gcccgttcat gggaaactgg    17880

caagatatcg gcaccagcaa tatgagcggt ggcgccttca gctggggctc gctgtggagc    17940

ggcattaaaa atttcggttc caccgttaag aactatggca gcaaggcctg gaacagcagc    18000

acaggccaga tgctgaggga taagttgaaa gagcaaaatt tccaacaaaa ggtggtagat    18060

ggcctggcct ctggcattag cggggtggtg gacctggcca accaggcagt gcaaaataag    18120

attaacagta agcttgatcc ccgccctccc gtagaggagc ctccaccggc cgtggagaca    18180

gtgtctccag aggggcgtgg cgaaaagcgt ccgcgccccg acagggaaga aactctggtg    18240

acgcaaatag acgagcctcc ctcgtacgag gaggcactaa agcaaggcct gcccaccacc    18300

cgtcccatcg cgcccatggc taccggagtg ctgggccagc acacacccgt aacgctggac    18360

ctgcctcccc ccgccgacac ccagcagaaa cctgtgctgc caggcccgac cgccgttgtt    18420

gtaacccgtc ctagccgcgc gtccctgcgc cgcgccgcca gcggtccgcg atcgttgcgg    18480

cccgtagcca gtggcaactg gcaaagcaca ctgaacagca tcgtgggtct gggggtgcaa    18540

tccctgaagc gccgacgatg cttctgatag ctaacgtgtc gtatgtgtgt catgtatgcg    18600

tccatgtcgc cgccagagga gctgctgagc cgccgcgcgc ccgctttcca agatggctac    18660

cccttcgatg atgccgcagt ggtcttacat gcacatctcg ggccaggacg cctcggagta    18720

cctgagcccc gggctggtgc agtttgcccg cgccaccgag acgtacttca gcctgaataa    18780

caagtttaga aaccccacgg tggcgcctac gcacgacgtg accacagacc ggtcccagcg    18840

tttgacgctg cggttcatcc ctgtggaccg tgaggatact gcgtactcgt acaaggcgcg    18900

gttcacccta gctgtgggtg ataaccgtgt gctggacatg gcttccacgt actttgacat    18960

ccgcggcgtg ctggacaggg gccctacttt taagccctac tctggcactg cctacaacgc    19020

cctggctccc aagggtgccc caaatccttg cgaatgggat gaagctgcta ctgctcttga    19080

aataaaccta gaagaagagg acgatgacaa cgaagacgaa gtagacgagc aagctgagca    19140

gcaaaaaact cacgtatttg ggcaggcgcc ttattctggt ataaatatta caaaggaggg    19200

tattcaaata ggtgtcgaag gtcaaacacc taaatatgcc gataaaacat ttcaacctga    19260

acctcaaata ggagaatctc agtggtacga aacagaaatt aatcatgcag ctgggagagt    19320

cctaaaaaag actaccccaa tgaaaccatg ttacggttca tatgcaaaac ccacaaatga    19380

aaatggaggg caaggcattc ttgtaaagca acaaaatgga aagctagaaa gtcaagtgga    19440

aatgcaattt ttctcaacta ctgaggcagc cgcaggcaat ggtgataact tgactcctaa    19500

agtggtattg tacagtgaag atgtagatat agaaacccca gacactcata tttcttacat    19560

gcccactatt aaggaaggta actcacgaga actaatgggc caacaatcta tgcccaacag    19620

gcctaattac attgctttta gggacaattt tattggtcta atgtattaca acagcacggg    19680

taatatgggt gttctggcgg gccaagcatc gcagttgaat gctgttgtag atttgcaaga    19740

cagaaacaca gagctttcat accagctttt gcttgattcc attggtgata gaaccaggta    19800

cttttctatg tggaatcagg ctgttgacag ctatgatcca gatgttagaa ttattgaaaa    19860

tcatggaact gaagatgaac ttccaaatta ctgctttcca ctgggaggtg tgattaatac    19920

agagactctt accaaggtaa aacctaaaac aggtcaggaa aatggatggg aaaaagatgc    19980

tacagaattt tcagataaaa atgaaataag agttggaaat aattttgcca tggaaatcaa    20040

tctaaatgcc aacctgtgga gaaatttcct gtactccaac atagcgctgt atttgcccga    20100

caagctaaag tacagtcctt ccaacgtaaa aatttctgat aacccaaaca cctacgacta    20160

catgaacaag cgagtggtgg ctcccgggct agtggactgc tacattaacc ttggagcacg    20220

ctggtccctt gactatatgg acaacgtcaa cccatttaac caccaccgca atgctggcct    20280

gcgctaccgc tcaatgttgc tgggcaatgg tcgctatgtg cccttccaca tccaggtgcc    20340

tcagaagttc tttgccatta aaaacctcct tctcctgccg ggctcataca cctacgagtg    20400

gaacttcagg aaggatgtta acatggttct gcagagctcc ctaggaaatg acctaagggt    20460

tgacggagcc agcattaagt ttgatagcat ttgcctttac gccaccttct tccccatggc    20520

ccacaacacc gcctccacgc ttgaggccat gcttagaaac gacaccaacg accagtcctt    20580

taacgactat ctctccgccg ccaacatgct ctaccctata cccgccaacg ctaccaacgt    20640

gcccatatcc atcccctccc gcaactgggc ggctttccgc ggctgggcct tcacgcgcct    20700

taagactaag gaaaccccat cactgggctc gggctacgac ccttattaca cctactctgg    20760

ctctataccc tacctagatg gaacctttta cctcaaccac acctttaaga aggtggccat    20820

tacctttgac tcttctgtca gctggcctgg caatgaccgc ctgcttaccc ccaacgagtt    20880

tgaaattaag cgctcagttg acggggaggg ttacaacgtt gcccagtgta acatgaccaa    20940

agactggttc ctggtacaaa tgctagctaa ctataacatt ggctaccagg gcttctatat    21000

cccagagagc tacaaggacc gcatgtactc cttctttaga aacttccagc ccatgagccg    21060

tcaggtggtg gatgatacta aatacaagga ctaccaacag gtgggcatcc tacaccaaca    21120

caacaactct ggatttgttg gctaccttgc ccccaccatg cgcgaaggac aggcctaccc    21180

tgctaacttc ccctatccgc ttataggcaa gaccgcagtt gacagcatta cccagaaaaa    21240

gtttctttgc gatcgcaccc tttggcgcat cccattctcc agtaacttta tgtccatggg    21300

cgcactcaca gacctgggcc aaaaccttct ctacgccaac tccgcccacg cgctagacat    21360

gacttttgag gtggatccca tggacgagcc cacccttctt tatgttttgt ttgaagtctt    21420

tgacgtggtc cgtgtgcacc agccgcaccg cggcgtcatc gaaaccgtgt acctgcgcac    21480

gcccttctcg gccggcaacg ccacaacata aagaagcaag caacatcaac aacagctgcc    21540

gccatgggct ccagtgagca ggaactgaaa gccattgtca aagatcttgg ttgtgggcca    21600

tattttttgg gcacctatga caagcgcttt ccaggctttg tttctccaca caagctcgcc    21660

tgcgccatag tcaatacggc cggtcgcgag actgggggcg tacactggat ggcctttgcc    21720

tggaacccgc actcaaaaac atgctacctc tttgagccct ttggcttttc tgaccagcga    21780

ctcaagcagg tttaccagtt tgagtacgag tcactcctgc gccgtagcgc cattgcttct    21840

tcccccgacc gctgtataac gctggaaaag tccacccaaa gcgtacaggg gcccaactcg    21900

gccgcctgtg gactattctg ctgcatgttt ctccacgcct ttgccaactg gccccaaact    21960

cccatggatc acaaccccac catgaacctt attaccgggg tacccaactc catgctcaac    22020

agtccccagg tacagcccac cctgcgtcgc aaccaggaac agctctacag cttcctggag    22080

cgccactcgc cctacttccg cagccacagt gcgcagatta ggagcgccac ttctttttgt    22140

cacttgaaaa acatgtaaaa ataatgtact agagacactt tcaataaagg caaatgcttt    22200

tatttgtaca ctctcgggtg attatttacc cccacccttg ccgtctgcgc cgtttaaaaa    22260

tcaaaggggt tctgccgcgc atcgctatgc gccactggca gggacacgtt gcgatactgg    22320

tgtttagtgc tccacttaaa ctcaggcaca accatccgcg gcagctcggt gaagttttca    22380

ctccacaggc tgcgcaccat caccaacgcg tttagcaggt cgggcgccga tatcttgaag    22440

tcgcagttgg ggcctccgcc ctgcgcgcgc gagttgcgat acacagggtt gcagcactgg    22500

aacactatca gcgccgggtg gtgcacgctg gccagcacgc tcttgtcgga gatcagatcc    22560

gcgtccaggt cctccgcgtt gctcagggcg aacggagtca actttggtag ctgccttccc    22620

aaaaagggcg cgtgcccagg ctttgagttg cactcgcacc gtagtggcat caaaaggtga    22680

ccgtgcccgg tctgggcgtt aggatacagc gcctgcataa aagccttgat ctgcttaaaa    22740

gccacctgag cctttgcgcc ttcagagaag aacatgccgc aagacttgcc ggaaaactga    22800

ttggccggac aggccgcgtc gtgcacgcag caccttgcgt cggtgttgga gatctgcacc    22860

acatttcggc cccaccggtt cttcacgatc ttggccttgc tagactgctc cttcagcgcg    22920

cgctgcccgt tttcgctcgt cacatccatt tcaatcacgt gctccttatt tatcataatg    22980

cttccgtgta gacacttaag ctcgccttcg atctcagcgc agcggtgcag ccacaacgcg    23040

cagcccgtgg gctcgtgatg cttgtaggtc acctctgcaa acgactgcag gtacgcctgc    23100

aggaatcgcc ccatcatcgt cacaaaggtc ttgttgctgg tgaaggtcag ctgcaacccg    23160

cggtgctcct cgttcagcca ggtcttgcat acggccgcca gagcttccac ttggtcaggc    23220

agtagtttga agttcgcctt tagatcgtta tccacgtggt acttgtccat cagcgcgcgc    23280

gcagcctcca tgcccttctc ccacgcagac acgatcggca cactcagcgg gttcatcacc    23340

gtaatttcac tttccgcttc gctgggctct tcctcttcct cttgcgtccg cataccacgc    23400

gccactgggt cgtcttcatt cagccgccgc actgtgcgct tacctccttt gccatgcttg    23460

attagcaccg gtgggttgct gaaacccacc atttgtagcg ccacatcttc tctttcttcc    23520

tcgctgtcca cgattacctc tggtgatggc gggcgctcgg gcttgggaga agggcgcttc    23580

tttttcttct tgggcgcaat ggccaaatcc gccgccgagg tcgatggccg cgggctgggt    23640

gtgcgcggca ccagcgcgtc ttgtgatgag tcttcctcgt cctcggactc gatacgccgc    23700

ctcatccgct tttttggggg cgcccgggga ggcggcggcg acggggacgg ggacgacacg    23760

tcctccatgg ttgggggacg tcgcgccgca ccgcgtccgc gctcgggggt ggtttcgcgc    23820

tgctcctctt cccgactggc catttccttc tcctataggc agaaaaagat catggagtca    23880

gtcgagaaga aggacagcct aaccgccccc tctgagttcg ccaccaccgc ctccaccgat    23940

gccgccaacg cgcctaccac cttccccgtc gaggcacccc cgcttgagga ggaggaagtg    24000

attatcgagc aggacccagg ttttgtaagc gaagacgacg aggaccgctc agtaccaaca    24060

gaggataaaa agcaagacca ggacaacgca gaggcaaacg aggaacaagt cgggcggggg    24120

gacgaaaggc atggcgacta cctagatgtg ggagacgacg tgctgttgaa gcatctgcag    24180

cgccagtgcg ccattatctg cgacgcgttg caagagcgca gcgatgtgcc cctcgccata    24240

gcggatgtca gccttgccta cgaacgccac ctattctcac cgcgcgtacc ccccaaacgc    24300

caagaaaacg gcacatgcga gcccaacccg cgcctcaact tctaccccgt atttgccgtg    24360

ccagaggtgc ttgccaccta tcacatcttt ttccaaaact gcaagatacc cctatcctgc    24420

cgtgccaacc gcagccgagc ggacaagcag ctggccttgc ggcagggcgc tgtcatacct    24480

gatatcgcct cgctcaacga agtgccaaaa atctttgagg gtcttggacg cgacgagaag    24540

cgcgcggcaa acgctctgca acaggaaaac agcgaaaatg aaagtcactc tggagtgttg    24600

gtggaactcg agggtgacaa cgcgcgccta gccgtactaa aacgcagcat cgaggtcacc    24660

cactttgcct acccggcact taacctaccc cccaaggtca tgagcacagt catgagtgag    24720

ctgatcgtgc gccgtgcgca gcccctggag agggatgcaa atttgcaaga acaaacagag    24780

gagggcctac ccgcagttgg cgacgagcag ctagcgcgct ggcttcaaac gcgcgagcct    24840

gccgacttgg aggagcgacg caaactaatg atggccgcag tgctcgttac cgtggagctt    24900

gagtgcatgc agcggttctt tgctgacccg gagatgcagc gcaagctaga ggaaacattg    24960

cactacacct ttcgacaggg ctacgtacgc caggcctgca agatctccaa cgtggagctc    25020

tgcaacctgg tctcctacct tggaattttg cacgaaaacc gccttgggca aaacgtgctt    25080

cattccacgc tcaagggcga ggcgcgccgc gactacgtcc gcgactgcgt ttacttattt    25140

ctatgctaca cctggcagac ggccatgggc gtttggcagc agtgcttgga ggagtgcaac    25200

ctcaaggagc tgcagaaact gctaaagcaa aacttgaagg acctatggac ggccttcaac    25260

gagcgctccg tggccgcgca cctggcggac atcattttcc ccgaacgcct gcttaaaacc    25320

ctgcaacagg gtctgccaga cttcaccagt caaagcatgt tgcagaactt taggaacttt    25380

atcctagagc gctcaggaat cttgcccgcc acctgctgtg cacttcctag cgactttgtg    25440

cccattaagt accgcgaatg ccctccgccg ctttggggcc actgctacct tctgcagcta    25500

gccaactacc ttgcctacca ctctgacata atggaagacg tgagcggtga cggtctactg    25560

gagtgtcact gtcgctgcaa cctatgcacc ccgcaccgct ccctggtttg caattcgcag    25620

ctgcttaacg aaagtcaaat tatcggtacc tttgagctgc agggtccctc gcctgacgaa    25680

aagtccgcgg ctccggggtt gaaactcact ccggggctgt ggacgtcggc ttaccttcgc    25740

aaatttgtac ctgaggacta ccacgcccac gagattaggt tctacgaaga ccaatcccgc    25800

ccgcctaatg cggagcttac cgcctgcgtc attacccagg gccacattct tggccaattg    25860

caagccatca acaaagcccg ccaagagttt ctgctacgaa agggacgggg ggtttacttg    25920

gacccccagt ccggcgagga gctcaaccca atccccccgc cgccgcagcc ctatcagcag    25980

cagccgcggg cccttgcttc ccaggatggc acccaaaaag aagctgcagc tgccgccgcc    26040

acccacggac gaggaggaat actgggacag tcaggcagag gaggttttgg acgaggagga    26100

ggaggacatg atggaagact gggagagcct agacgaggaa gcttccgagg tcgaagaggt    26160

gtcagacgaa acaccgtcac cctcggtcgc attcccctcg ccggcgcccc agaaatcggc    26220

aaccggttcc agcatggcta caacctccgc tcctcaggcg ccgccggcac tgcccgttcg    26280

ccgacccaac cgtagatggg acaccactgg aaccagggcc ggtaagtcca agcagccgcc    26340

gccgttagcc caagagcaac aacagcgcca aggctaccgc tcatggcgcg ggcacaagaa    26400

cgccatagtt gcttgcttgc aagactgtgg gggcaacatc tccttcgccc gccgctttct    26460

tctctaccat cacggcgtgg ccttcccccg taacatcctg cattactacc gtcatctcta    26520

cagcccatac tgcaccggcg gcagcggcag caacagcagc ggccacacag aagcaaaggc    26580

gaccggatag caagactctg acaaagccca agaaatccac agcggcggca gcagcaggag    26640

gaggagcgct gcgtctggcg cccaacgaac ccgtatcgac ccgcgagctt agaaacagga    26700

tttttcccac tctgtatgct atatttcaac agagcagggg ccaagaacaa gagctgaaaa    26760

taaaaaacag gtctctgcga tccctcaccc gcagctgcct gtatcacaaa agcgaagatc    26820

agcttcggcg cacgctggaa gacgcggagg ctctcttcag taaatactgc gcgctgactc    26880

ttaaggacta gtttcgcgcc ctttctcaaa tttaagcgcg aaaactacgt catctccagc    26940

ggccacaccc ggcgccagca cctgttgtca gcgccattat gagcaaggaa attcccacgc    27000

cctacatgtg gagttaccag ccacaaatgg gacttgcggc tggagctgcc caagactact    27060

caacccgaat aaactacatg agcgcgggac cccacatgat atcccgggtc aacggaatac    27120

gcgcccaccg aaaccgaatt ctcctggaac aggcggctat taccaccaca cctcgtaata    27180

accttaatcc ccgtagttgg cccgctgccc tggtgtacca ggaaagtccc gctcccacca    27240

ctgtggtact tcccagagac gcccaggccg aagttcagat gactaactca ggggcgcagc    27300

ttgcgggcgg ctttcgtcac agggtgcggt cgcccgggca gggtataact cacctgacaa    27360

tcagagggcg aggtattcag ctcaacgacg agtcggtgag ctcctcgctt ggtctccgtc    27420

cggacgggac atttcagatc ggcggcgccg gccgctcttc attcacgcct cgtcaggcaa    27480

tcctaactct gcagacctcg tcctctgagc cgcgctctgg aggcattgga actctgcaat    27540

ttattgagga gtttgtgcca tcggtctact ttaacccctt ctcgggacct cccggccact    27600

atccggatca atttattcct aactttgacg cggtaaagga ctcggcggac ggctacgact    27660

gaatgttaag tggagaggca gagcaactgc gcctgaaaca cctggtccac tgtcgccgcc    27720

acaagtgctt tgcccgcgac tccggtgagt tttgctactt tgaattgccc gaggatcata    27780

tcgagggccc ggcgcacggc gtccggctta ccgcccaggg agagcttgcc cgtagcctga    27840

ttcgggagtt tacccagcgc cccctgctag ttgagcggga caggggaccc tgtgttctca    27900

ctgtgatttg caactgtcct aaccctggat tacatcaaga tctttgttgc catctctgtg    27960

ctgagtataa taaatacaga aattaaaata tactggggct cctatcgcca tcctgtaaac    28020

gccaccgtct tcacccgccc aagcaaacca aggcgaacct tacctggtac ttttaacatc    28080

tctccctctg tgatttacaa cagtttcaac ccagacggag tgagtctacg agagaacctc    28140

tccgagctca gctactccat cagaaaaaac accaccctcc ttacctgccg ggaacgtacg    28200

agtgcgtcac cggccgctgc accacaccta ccgcctgacc gtaaaccaga ctttttccgg    28260

acagacctca ataactctgt ttaccagaac aggaggtgag cttagaaaac ccttagggta    28320

ttaggccaaa ggcgcagcta ctgtggggtt tatgaacaat tcaagcaact ctacgggcta    28380

ttctaattca ggtttctcta gaaatggacg gaattattac agagcagcgc ctgctagaaa    28440

gacgcagggc agcggccgag caacagcgca tgaatcaaga gctccaagac atggttaact    28500

tgcaccagtg caaaaggggt atcttttgtc tggtaaagca ggccaaagtc acctacgaca    28560

gtaataccac cggacaccgc cttagctaca agttgccaac caagcgtcag aaattggtgg    28620

tcatggtggg agaaaagccc attaccataa ctcagcactc ggtagaaacc gaaggctgca    28680

ttcactcacc ttgtcaagga cctgaggatc tctgcaccct tattaagacc ctgtgcggtc    28740

tcaaagatct tattcccttt aactaataaa aaaaaataat aaagcatcac ttacttaaaa    28800

tcagttagca aatttctgtc cagtttattc agcagcacct ccttgccctc ctcccagctc    28860

tggtattgca gcttcctcct ggctgcaaac tttctccaca atctaaatgg aatgtcagtt    28920

tcctcctgtt cctgtccatc cgcacccact atcttcatgt tgttgcagat gaagcgcgca    28980

agaccgtctg aagatacctt caaccccgtg tatccatatg acacggaaac cggtcctcca    29040

actgtgcctt ttcttactcc tccctttgta tcccccaatg ggtttcaaga gagtccccct    29100

ggggtactct ctttgcgcct atccgaacct ctagttacct ccaatggcat gcttgcgctc    29160

aaaatgggca acggcctctc tctggacgag gccggcaacc ttacctccca aaatgtaacc    29220

actgtgagcc cacctctcaa aaaaaccaag tcaaacataa acctggaaat atctgcaccc    29280

ctcacagtta cctcagaagc cctaactgtg gctgccgccg cacctctaat ggtcgcgggc    29340

aacacactca ccatgcaatc acaggccccg ctaaccgtgc acgactccaa acttagcatt    29400

gccacccaag gacccctcac agtgtcagaa ggaaagctag ccctgcaaac atcaggcccc    29460

ctcaccacca ccgatagcag tacccttact atcactgcct caccccctct aactactgcc    29520

actggtagct tgggcattga cttgaaagag cccatttata cacaaaatgg aaaactagga    29580

ctaaagtacg gggctccttt gcatgtaaca gacgacctaa acactttgac cgtagcaact    29640

ggtccaggtg tgactattaa taatacttcc ttgcaaacta aagttactgg agccttgggt    29700

tttgattcac aaggcaatat gcaacttaat gtagcaggag gactaaggat tgattctcaa    29760

aacagacgcc ttatacttga tgttagttat ccgtttgatg ctcaaaacca actaaatcta    29820

agactaggac agggccctct ttttataaac tcagcccaca acttggatat taactacaac    29880

aaaggccttt acttgtttac agcttcaaac aattccaaaa agcttgaggt taacctaagc    29940

actgccaagg ggttgatgtt tgacgctaca gccatagcca ttaatgcagg agatgggctt    30000

gaatttggtt cacctaatgc accaaacaca aatcccctca aaacaaaaat tggccatggc    30060

ctagaatttg attcaaacaa ggctatggtt cctaaactag gaactggcct tagttttgac    30120

agcacaggtg ccattacagt aggaaacaaa aataatgata agctaacttt gtggaccaca    30180

ccagctccat ctcctaactg tagactaaat gcagagaaag atgctaaact cactttggtc    30240

ttaacaaaat gtggcagtca aatacttgct acagtttcag ttttggctgt taaaggcagt    30300

ttggctccaa tatctggaac agttcaaagt gctcatctta ttataagatt tgacgaaaat    30360

ggagtgctac taaacaattc cttcctggac ccagaatatt ggaactttag aaatggagat    30420

cttactgaag gcacagccta tacaaacgct gttggattta tgcctaacct atcagcttat    30480

ccaaaatctc acggtaaaac tgccaaaagt aacattgtca gtcaagttta cttaaacgga    30540

gacaaaacta aacctgtaac actaaccatt acactaaacg gtacacagga aacaggagac    30600

acaactccaa gtgcatactc tatgtcattt tcatgggact ggtctggcca caactacatt    30660

aatgaaatat ttgccacatc ctcttacact ttttcataca ttgcccaaga ataaagaatc    30720

gtttgtgtta tgtttcaacg tgtttatttt tcaattgccc gggatcggtg atcaccgatc    30780

cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa    30840

aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca    30900

ataaacaagt tcccggatcg cgatccggcc cgaggctgta gccgacgatg gtgcgccagg    30960

agagttgttg attcattgtt tgcctccctg ctgcggtttt tcaccgaagt tcatgccagt    31020

ccagcgtttt tgcagcagaa aagccgccga cttcggtttg cggtcgcgag tgaagatccc    31080

tttcttgtta ccgccaacgc gcaatatgcc ttgcgaggtc gcaaaatcgg cgaaattcca    31140

tacctgttca ccgacgacgg cgctgacgcg atcaaagacg cggtgataca tatccagcca    31200

tgcacactga tactcttcac tccacatgtc ggtgtacatt gagtgcagcc cggctaacgt    31260

atccacgccg tattcggtga tgataatcgg ctgatgcagt ttctcctgcc aggccagaag    31320

ttctttttcc agtaccttct ctgccgtttc caaatcgccg ctttggacat accatccgta    31380

ataacggttc aggcacagca catcaaagag atcgctgatg gtatcggtgt gagcgtcgca    31440

gaacattaca ttgacgcagg tgatcggacg cgtcgggtcg agtttacgcg ttgcttccgc    31500

cagtggcgcg aaatattccc gtgcaccttg cggacgggta tccggttcgt tggcaatact    31560

ccacatcacc acgcttgggt ggtttttgtc acgcgctatc agctctttaa tcgcctgtaa    31620

gtgcgcttgc tgagtttccc cgttgactgc ctcttcgctg tacagttctt tcggcttgtt    31680

gcccgcttcg aaaccaatgc ctaaagagag gttaaagccg acagcagcag tttcatcaat    31740

caccacgatg ccatgttcat ctgcccagtc gagcatctct tcagcgtaag ggtaatgcga    31800

ggtacggtag gagttggccc caatccagtc cattaatgcg tggtcgtgca ccatcagcac    31860

gttatcgaat cctttgccac gcaagtccgc atcttcatga cgaccaaagc cagtaaagta    31920

gaacggtttg tggttaatca ggaactgttc gcccttcact gccactgacc ggatgccgac    31980

gcgaagcggg tagatatcac actctgtctg gcttttggct gtgacgcaca gttcatagag    32040

ataaccttca cccggttgcc agaggtgcgg attcaccact tgcaaagtcc cgctagtgcc    32100

ttgtccagtt gcaaccacct gttgatccgc atcacgcagt tcaacgctga catcaccatt    32160

ggccaccacc tgccagtcaa cagacgcgtg gttacagtct tgcgcgacat gcgtcaccac    32220

ggtgatatcg tccacccagg tgttcggcgt ggtgtagagc attacgctgc gatggattcc    32280

ggcatagtta aagaaatcat ggaagtaaga ctgctttttc ttgccgtttt cgtcggtaat    32340

caccattccc ggcgggatag tctgccagtt cagttcgttg ttcacacaaa cggtgatacg    32400

tacacttttc ccggcaataa catacggcgt gacatcggct tcaaatggcg tatagccgcc    32460

ctgatgctcc atcacttcct gattattgac ccacactttg ccgtaatgag tgaccgcatc    32520

gaaacgcagc acgatacgct ggcctgccca acctttcggt ataaagactt cgcgctgata    32580

ccagacgttg cccgcataat tacgaatatc tgcatcggcg aactgatcgt taaaactgcc    32640

tggcacagca attgcccggc tttcttgtaa cgcgctttcc caccaacgct gatcaattcc    32700

acagttttcg cgatccagac tgaatgccca caggccgtcg agttttttga tttcacgggt    32760

tggggtttct acaggacgga ccatgcgttc gacctttctc ttcttttttg ggcccatgat    32820

ggcagatccg tatagtgagt cgtattagct ggttctttcc gcctcagaag ccatagagcc    32880

caccgcatcc ccagcatgcc tgctattgtc ttcccaatcc tcccccttgc tgtcctgccc    32940

caccccaccc cccagaatag aatgacacct actcagacaa tgcgatgcaa tttcctcatt    33000

ttattaggaa aggacagtgg gagtggcacc ttccagggtc aaggaaggca cgggggaggg    33060

gcaaacaaca gatggctggc aactagaagg cacagtcgag gctgatcagc gagctctaga    33120

tgcatgctcg agcggccgcc agtgtgatgg atatctgcag aattccagca cactggcggc    33180

cgttactagt ggatccgagc tcggtacccg gccgttataa caccactcga cacggcacca    33240

gctcaatcag tcacagtgta aaaaagggcc aagtgcagag cgagtatata taggactaaa    33300

aaatgacgta acggttaaag tccacaaaaa acacccagaa aaccgcacgc gaacctacgc    33360

ccagaaacga aagccaaaaa acccacaact tcctcaaatc gtcacttccg ttttcccacg    33420

ttacgtcact tcccatttta agaaaactac aattcccaac acatacaagt tactccgccc    33480

taaaacctac gtcacccgcc ccgttcccac gccccgcgcc acgtcacaaa ctccaccccc    33540

tcattatcat attggcttca atccaaaata aggtatatta ttgatgatg                33589

应用腺病毒载体诱导免疫应答的方法.pdf_第1页
第1页 / 共100页
应用腺病毒载体诱导免疫应答的方法.pdf_第2页
第2页 / 共100页
应用腺病毒载体诱导免疫应答的方法.pdf_第3页
第3页 / 共100页
点击查看更多>>
资源描述

《应用腺病毒载体诱导免疫应答的方法.pdf》由会员分享,可在线阅读,更多相关《应用腺病毒载体诱导免疫应答的方法.pdf(100页珍藏版)》请在专利查询网上搜索。

1、(10)授权公告号 CN 1972958 B (45)授权公告日 2013.01.23 CN 1972958 B *CN1972958B* (21)申请号 200580019211.9 (22)申请日 2005.04.12 60/561,341 2004.04.12 US C07K 14/16(2006.01) C12N 15/861(2006.01) A61K 39/21(2006.01) (73)专利权人 美国政府卫生与公共服务部 地址 美国马里兰 专利权人 杰韦克公司 (72)发明人 GJ内伯尔 成程 江咏培 JGD贾森 CR金 (74)专利代理机构 中科专利商标代理有限责任 公司 11。

2、021 代理人 王旭 Franck Lemiale et al.Enhanced Mucosal Immunoglobulin A Response of Intranasal Adenoviral Vector Human Immunodeficiency Virus Vaccine and Localization in the Central Nervous System.JOURNAL OF VIROLOGY .2003,77(18),10078-10087. (54) 发明名称 应用腺病毒载体诱导免疫应答的方法 (57) 摘要 本发明提供在哺乳动物中诱导针对人免疫缺 陷病毒 (HIV。

3、) 的免疫应答的方法。本方法包括给 哺乳动物施用腺病毒载体组合物, 所述腺病毒载 体组合物包括编码两种或多种不同 HIV 抗原的一 种或多种腺病毒载体, 所述抗原的产生在所述哺 乳动物中诱导针对 HIV 的免疫应答。本发明还提 供包括 4 种腺病毒载体的腺病毒载体组合物, 所 述 4 种腺病毒载体分别编码 HIV 分化体 A Env 蛋 白, HIV 分化体 B Env 蛋白, HIV 分化体 C Env 蛋 白, 和包括HIV分化体B Gag蛋白和Pol蛋白的融 合蛋白。 (30)优先权数据 (85)PCT申请进入国家阶段日 2006.12.11 (86)PCT申请的申请数据 PCT/US2。

4、005/012291 2005.04.12 (87)PCT申请的公布数据 WO2005/110492 EN 2005.11.24 (51)Int.Cl. (56)对比文件 审查员 张彬 权利要求书 2 页 说明书 35 页 序列表 62 页 (19)中华人民共和国国家知识产权局 (12)发明专利 权利要求书 2 页 说明书 35 页 序列表 62 页 1/2 页 2 1. 腺病毒载体组合物用于制备在哺乳动物中诱导针对人免疫缺陷病毒 (HIV) 的免疫 应答的药物的应用, 其中所述腺病毒载体组合物包括 (a) 包括编码融合蛋白的核酸的复制 缺陷型腺病毒载体, 所述融合蛋白包括HIV分化体B Ga。

5、g蛋白和Pol蛋白, (b)包括编码HIV 分化体 A Env 蛋白的核酸的复制缺陷型腺病毒载体, (c) 包括编码 HIV 分化体 B Env 蛋白 的核酸的复制缺陷型腺病毒载体, 和 (d) 包括编码 HIV 分化体 C Env 蛋白的核酸的复制缺 陷型腺病毒载体, 其中所述 (a), (b), (c), 和 (d) 的腺病毒载体独立地是血清型 26, 血清型 28, 或血清型 35, 由此在所述哺乳动物中产生所述 HIV 蛋白并且诱导针对 HIV 的免疫应答。 2. 权利要求 1 的应用, 其还包括给所述哺乳动物施用引发组合物, 其包括一种或多种 核酸序列, 所述核酸序列编码与由所述腺病。

6、毒载体组合物中的腺病毒载体所编码的 HIV 蛋 白相同的至少一种 HIV 蛋白, 其中所述引发组合物的施用在所述腺病毒载体组合物施用前 至少 1 周施行。 3. 权利要求 2 的应用, 其中所述引发组合物包括一种或多种核酸序列, 其编码两种或 多种 HIV 蛋白, 所述 HIV 蛋白与由所述腺病毒载体组合物的一种或多种腺病毒载体所编码 的 HIV 蛋白相同。 4. 权利要求 2 的应用, 其中所述引发组合物的施用在所述腺病毒载体组合物施用前 6 个月到 9 个月施行。 5. 权利要求 2 的应用, 其中所述引发组合物包括一种或多种质粒, 裸 DNA 分子, 或包括 所述一种或多种核酸序列的病毒。

7、载体。 6.权利要求5的应用, 其中所述腺病毒载体缺失所述腺病毒基因组E1区域的一种或多 种必需的基因功能。 7.权利要求5的应用, 其中所述腺病毒载体缺失所述腺病毒基因组E4区域的一种或多 种必需的基因功能。 8.权利要求1的应用, 其中所述腺病毒载体缺失所述腺病毒基因组E3区域的一种或多 种基因功能。 9. 权利要求 1 的应用, 其中至少一种 Env 蛋白为 gp140 或 gp140dv12 蛋白。 10. 权利要求 1 的应用, 其中所述腺病毒载体组合物作为包括药用载体的药物组合物 的部分施用。 11. 权利要求 10 的应用, 其中所述药物组合物以两剂或更多剂量施用。 12. 权利。

8、要求 10 的应用, 其中所述药物组合物以包括 1108-11012个颗粒单位的腺 病毒载体的剂量施用。 13. 权利要求 12 的应用, 其中所述药物组合物以包括 1108-11010颗粒单位的腺病 毒载体的剂量施用。 14. 权利要求 12 的应用, 其中所述药物组合物以包括 1109-11011颗粒单位的腺病 毒载体的剂量施用。 15. 权利要求 12 的应用, 其中所述药物组合物以包括 11010-11012颗粒单位的腺病 毒载体的剂量施用。 16.权利要求1的应用, 其中包括HIV分化体B Gag蛋白和Pol蛋白的所述融合蛋白由 核酸序列编码, 所述核酸序列还编码 HIV 蛋白酶、 。

9、反转录酶、 和整合酶蛋白, 并且其中所述 核酸分子包括一种或多种点突变, 其中的点突变使得蛋白酶, 反转录酶和整合酶蛋白没有 权 利 要 求 书 CN 1972958 B 2 2/2 页 3 功能。 17. 一种用于在哺乳动物中诱导针对人免疫缺陷病毒 (HIV) 的免疫应答的腺病毒载体 组合物, 其包括 (a) 包括编码融合蛋白的核酸的复制缺陷型腺病毒载体, 所述融合蛋白包 括 HIV 分化体 B Gag 蛋白和 Pol 蛋白, (b) 包括编码 HIV 分化体 AEnv 蛋白的核酸的复制缺 陷型腺病毒载体, (c) 包括编码 HIV 分化体 B Env 蛋白的核酸的复制缺陷型腺病毒载体, 和。

10、 (d) 包括编码 HIV 分化体 C Env 蛋白的核酸的复制缺陷型腺病毒载体, 其中所述 (a), (b), (c) 和 (d) 的腺病毒载体独立地是血清型 26, 血清型 28 或血清型 35。 18. 权利要求 17 的腺病毒载体组合物, 其中包括 HIV 分化体 B Gag 蛋白和 Pol 蛋白 的所述融合蛋白由核酸序列编码, 所述核酸序列还编码 HIV 蛋白酶、 反转录酶、 和整合酶蛋 白, 并且其中所述核酸分子包括一种或多种点突变, 其中的点突变使得蛋白酶, 反转录酶和 整合酶蛋白没有功能。 19. 权利要求 17 的腺病毒载体组合物, 其中所述 Env 蛋白为 gp 140 或。

11、 gp 140dv12。 20. 权利要求 17 的腺病毒载体组合物, 其中所述腺病毒载体是复制缺陷型。 21.权利要求20的腺病毒载体组合物, 其中所述腺病毒载体缺失所述腺病毒基因组E1 区域的一种或多种必需的基因功能。 22.权利要求20的腺病毒载体组合物, 其中所述腺病毒载体缺失所述腺病毒基因组E4 区域的一种或多种必需的基因功能。 23.权利要求17的腺病毒载体组合物, 其中所述腺病毒载体缺失所述腺病毒基因组E3 区域的一种或多种的基因功能。 24. 权利要求 17 的腺病毒载体组合物, 其中 (a), (b), (c), 和 (d) 的腺病毒载体以 3 1 1 1 重量比例存在于所述。

12、组合物中。 25. 一种用于在哺乳动物中诱导针对人免疫缺陷病毒 (HIV) 的免疫应答的药物组合 物, 其包括权利要求 17 的腺病毒载体组合物和药用载体。 26. 权利要求 25 的药物组合物, 其包括 1108-11012个颗粒单位的腺病毒载体。 27. 权利要求 26 的药物组合物, 其包括 1108-11010颗粒单位的腺病毒载体。 28. 权利要求 26 的药物组合物, 其包括 1109-11011颗粒单位的腺病毒载体。 29. 权利要求 26 的药物组合物, 其包括 11010-11012颗粒单位的腺病毒载体。 权 利 要 求 书 CN 1972958 B 3 1/35 页 4 应。

13、用腺病毒载体诱导免疫应答的方法 0001 相关申请的交叉参考 0002 本专利申请要求 2004 年 4 月 12 日提交的美国临时专利申请号 60/561,341 的利 益。 0003 关于联邦政府资助的研究和研发的陈述 0004 在 由 Gen Vec, Inc. 和 代 表 敏 感 和 传 染 病 国 家 机 构 (National Institute ofAllergy and Infectious Diseases) 的美国公共卫生局之间签署的合作研究和研发协 议 (Coorperative Reasearch and Development Agreement, CRADA) 号 。

14、AI-1034 及其修改 下, 本发明部分由政府支持完成。在本发明中政府可以拥有某些权利。 0005 发明背景 0006 疾病控制和预防中心 (CDC) 估计, 在美国, 850,000-950,000 人正承受着 HIV 感 染, 并且大约 25的人没有觉察到他们的感染 (CDC, Morb.Mortal.Wkly.Rep., 52(47), 1145-8(2003)。在全世界, HIV 新感染率以难以接受的高水平持续增长。尽管由于高度活 性的抗反转录病毒治疗(HAART)的出现, 在发达国家, 新的AIDS诊断和死亡已经显著下降, 但是在发展中国家, HIV/AIDS 流行性继续加剧。所述。

15、流行病的全球性影响是相当大的。按 照关于 HIV/AIDS 的联合国计划 (Joint United NationsProgramme on HIV/AIDS) 和世界 卫生组织, 到 2002 年底时, 估计有 4000-4200 万人正承受 HIV/AIDS, 其中全世界总人数的 95居住在发展中国家 (WHO, Treating 3 Million by 2005 : The WHO Strategy, Geneva, Switzerland.第1-53页(2003), 和UNAIDS, AIDS Epidemic UpdateDecember 2003)。 2003 年, 全世界估计有。

16、 250-350 万例由 HIV/AIDS 导致的死亡 (UNAIDS, AIDS Epidemic Update December 2003), 并且自从这种流行病的开始, 已经有多达 3000 万例由 HIV 感染导致的死 亡 (WHO, Treating3 Million by 2005 : The WHO Strategy, Geneva, Switzerland. 第 1-53 页 (2003)。除了 HIV/AIDS 的人类灾难, 所述流行病的代价对许多国家的经济增长和政治 稳定造成显著的阻碍。在发展中国家以及在美国人口的部分地区中, 抗 HIV 治疗经常超出 财政范围。因此, 迫。

17、切地需要用于 HIV 预防的有效的、 低成本的工具, 诸如疫苗, 以使得 HIV 流行病得到控制。 0007 几十年来, 以生物相应量运送蛋白作为疗法或者用于诱导免疫应答已成为药物和 疫苗开发的障碍。 已经证明为传统抗原运送途径的成功备选的一种解决方案是运送外源核 酸序列用于在体内产生抗原分子。 理想地, 基因转移载体进入广泛种类的细胞类型, 具有接 纳巨大的核酸序列的能力, 是安全的, 并且可以以治疗患者需要的量生产。 病毒载体具有这 些有利特征, 并且被用于治疗或预防生物疾病的许多方法中。 0008 除了它们的有利特征, 病毒基因转移载体的广泛应用受到一些因素的阻碍。在这 方面, 某些细胞。

18、不易接受通过目前可用的病毒载体运送基因。例如, 摄入腺病毒时, 淋巴细 胞被损害 (Silver 等 ., Virology 165, 377-387(1988) ; Horvath 等 ., J.Virology, 62(1), 341-345(1988)。 0009 病毒基因转移载体的应用还受到病毒载体免疫原性的阻碍。 大多数的美国人口已 经暴露于目前处于作为基因转移载体的研发中的许多病毒(例如, 腺病毒)的野生形式。 因 说 明 书 CN 1972958 B 4 2/35 页 5 此, 许多美国人口已发展了针对某些基于病毒的基因转移载体的现有的免疫性。这样的载 体被迅速地从血流中清除, 。

19、因此降低了所述载体在运送生物相应量的基因产物中的功效。 并且, 某些病毒载体的免疫原性防止有效的重复给药, 其可以有利 “增强” 针对病原体的免 疫系统, 并且导致只有少部分剂量的病毒载体将其有效负荷运送到宿主细胞。 0010 另外, 设计作为 HIV 疫苗的病毒载体中的主要挑战是识别和靶向病毒结构, 所述 病毒结构是多样性的最广泛的可能范围内的保护性体液和细胞免疫应答的关键决定簇。 多 价疫苗的应用, 其包含来自许多流行 HIV 亚型的免疫原的明确的混合物, 可能是获得广泛 保护性 HIV 疫苗的可行途径。 0011 因此, 存在对于改进的方法和用于诱导针对 HIV 的免疫应答的组合物的需要。

20、。本 发明提供这样的方法和组合物。 本发明的这些和其它优点, 以及附加的发明特征, 将通过本 文提供的发明详述而显而易见。 0012 发明简述 0013 本发明提供在哺乳动物中诱导针对人类免疫缺陷病毒 (HIV) 的免疫应答的方法。 所述方法包括给所述哺乳动物施用腺病毒载体组合物, 其中所述腺病毒载体组合物包括编 码两种或多种不同的 HIV 抗原的一种或多种腺病毒载体, 因此在哺乳动物中产生所述 HIV 抗原, 并且诱导针对 HIV 的免疫应答。 0014 本发明还提供腺病毒载体组合物, 其包括 (a) 包括编码 HIV 分化体 AEnv 蛋白的核 酸的腺病毒载体, (b) 包括编码 HIV 。

21、分化体 B Env 蛋白的核酸的腺病毒载体, (c) 包括编码 HIV 分化体 C Env 蛋白的核酸的腺病毒载体, 和 (d) 包括编码融合蛋白的核酸的腺病毒载 体, 所述融合蛋白包括 HIV 分化体 B Gag 蛋白和 Pol 蛋白。 0015 发明详述 0016 本发明提供在哺乳动物中诱导针对人类免疫缺陷病毒 (HIV) 的免疫应答的方法。 所述方法包括给所述哺乳动物施用腺病毒载体组合物, 其中所述腺病毒载体组合物包括编 码两种或多种不同的 HIV 抗原的一种或多种腺病毒载体。 0017 本发明还提供腺病毒载体组合物。所述腺病毒载体组合物包括 (a) 包括编码 HIV 分化体 A Env。

22、 蛋白的核酸的腺病毒载体, (b) 包括编码 HIV 分化体 B Env 蛋白的核酸的腺 病毒载体, (c) 包括编码 HIV 分化体 C Env 蛋白的核酸的腺病毒载体, 和 (d) 包括编码融合 蛋白的核酸的腺病毒载体, 所述融合蛋白包括 HIV 分化体 B Gag 蛋白和 Pol 蛋白。 0018 “抗原” 是在哺乳动物中引发免疫应答的分子。 “免疫应答” 可以承担 (entail), 例 如, 抗体产生和 / 或免疫效应细胞的激活。在本发明上下文中, HIV 抗原可以包括在哺乳动 物中激发免疫应答的任何蛋白质 HIV 分子或者其部分。 “HIV 分子” 是这样一种分子, 即, 其 为人。

23、类免疫缺陷病毒的一部分, 由人类免疫缺陷病毒的核酸序列编码, 或者衍生于或合成 地基于任何这样的分子。按照本发明激发免疫应答的 HIV 抗原的施用优选地导致针对 HIV 的保护性免疫。在这方面, 针对 HIV 的 “免疫应答” 是针对任何一种或多种 HIV 抗原的免疫 应答。 0019 适合的HIV抗原的实例包括全部或部分的HIV Gag, Env, Pol, Tat, 反转录酶(RT), Vif, Vpr, Vpu, Vpo, 整合酶, 或 Nef 蛋白。优选地, 所述两种或多种 HIV 抗原的每一种包括 全部或部分的 HIV Gag, Env, 和 / 或 Pol 蛋白。适合的 Env 蛋。

24、白在本领域内已知, 并且包 括, 例如, gp160, gp120, gp41, gp145 和 gp140。另外, HIV 抗原可以为在体内展现出增强的 说 明 书 CN 1972958 B 5 3/35 页 6 免疫原性的修饰的 Env 蛋白。例如, 所述抗原可以为在 Env 蛋白的切割位点、 融合肽、 或者 螺旋间卷曲的卷曲结构域包括突变的 Env 蛋白 ( CFI Env 蛋白 )( 参见, 例如, Cao 等 ., J.Virol., 71, 9808-9812(1997), 和 Yang 等 ., J.Virol., 78, 4029-4036(2004)。 0020 HIV 的任。

25、何分化体适用于抗原选择, 其包括 HIV 分化体 A, B, C, D, E, MN 等。因 此, 应该理解下述 HIV 抗原可以用于本发明的方法 : HIV 分化体 A gp140, Gag, Env, 和 / 或 Pol ; HIV 分化体 B gp140, Gag, Env, 和 / 或 Pol 蛋白 ; HIV 分化体 C gp140, Gag, Env, 和 / 或 Pol 蛋白 ; 以及 HIV 分化体 MNgp140, Gag, Env, 和 / 或 Pol 蛋白。尽管优选地所述抗原 为 Gag, Env, 和 / 或 Pol 蛋白, 能够在哺乳动物中诱导免疫应答的任何 HIV 。

26、蛋白或者其片 段可以与本发明的方法联合应用。来自不同 HIV 分化体 ( 例如, HIV 分化体 A, B, C, MN, 等 ) 的 HIV Gag, Env 和 Pol 蛋白, 以及编码这些蛋白的核酸序列, 和用于将所述核酸序列 操作和插入载体的方法, 是已知的 ( 参见, 例如, HIV Sequence Compendium, Division of AIDS, National Institute ofAllergy and Infectious Diseases(2003), HIV Sequence Database(http:/hiv-web.lanl.gov/content/。

27、hiv-db/mainpage.html), Sambrook 等 ., Molecular Cloning, a Laboratory Manual, 第二版, Cold Spring Harbor Press, Cold Spring Harbor, N.Y.(1989), 和 Ausubel 等 ., Current Protocols inMolecular Biology, Greene Publishing Associates and John Wiley & Sons, New York, N.Y.(1994)。 0021 应该理解产生免疫应答不需要全部的、 完好无缺的 HIV。

28、 蛋白。事实上, HIV 蛋白的 大部分抗原表位大小相对较小。因此, HIV 蛋白, 诸如本文所描述的任何 HIV 蛋白的片段 (例如, 表位或其它抗原片段), 可以被用作HIV抗原。 HIV Gag, Env, 和Pol蛋白的抗原片段 和表位, 以及编码这些抗原片段和表位的核酸序列是已知的 ( 参见, 例如, HIV Immunology andHIV/SIV Vaccine Databases, 卷1, Division of AIDS, National Institute ofAllergy and Infectious Diseases(2003)。 0022 HIV 抗原还包括融合。

29、蛋白和多蛋白 (ployproteins)。融合蛋白可以包括融合到另 外一种, 或者融合到全部或部分的不同 HIV 蛋白或其它多肽上的一种或多种抗原性 HIV 蛋 白片段 ( 例如, 表位 )。所述融合的蛋白可以包括本文所描述的任何 HIV 抗原的全部或部 分。例如, 全部或部分的 HIVEnv 蛋白 ( 例如, gp120 或 gp160), 可以融合到全部或部分的 HIV Pol 蛋白上, 或者全部或部分的 HIV Gag 蛋白可以融合到全部或部分的 HIV Pol 蛋白 上。 这样的融合蛋白有效地提供本发明的上下文中的多种HIV抗原, 并且与由单一HIV抗原 产生的免疫应答相比, 所述融。

30、合蛋白可以用于产生针对给出的 HIV 病原体的更加完整的免 疫应答。相似地, 多蛋白也可以提供多种 HIV 抗原。与本发明联合应用的多蛋白包括提供 两种或多种 HIV 抗原, 诸如本文所描述的两种或多种任何 HIV 抗原的那些蛋白。应用单独 的核酸序列, 通过腺病毒载体将融合蛋白或多蛋白运送到哺乳动物, 允许将免疫系统暴露 于多种抗原, 并且因此, 便利地允许单一组合物提供针对多种 HIV 抗原或单一抗原的多种 表位的免疫性。可以通过已知的方法制备编码 HIV 抗原的融合蛋白和多蛋白的核酸序列, 并将其插入载体中 ( 参见, 例如, 美国专利 5,130,247 和 5,130,248, Sa。

31、mbrook 等 ., 如上文 所述, 和 Ausubel 等 ., 如上文所述 )。 0023 所述腺病毒载体组合物包括编码两种或多种不同 HIV 抗原的一种或多种腺病毒 载体。应该明白腺病毒载体通过已被插入所述腺病毒载体的核酸序列的方式 “编码” 抗原。 如果它们包括不同的抗原性氨基酸序列, 那么 HIV 抗原是 “不同的” 。所述两种或多种不同 说 明 书 CN 1972958 B 6 4/35 页 7 HIV 抗原可以是任何 HIV 抗原, 诸如本文所描述的两种或多种 HIV 抗原。优选地, 所述腺病 毒载体组合物包括一种或多种腺病毒载体, 其编码三种或多种, 或者甚至四种或更多种不 。

32、同的 HIV 抗原。应该理解将哺乳动物的免疫系统暴露于不同的 HIV 抗原 “混合物” , 可以引 起比将所述免疫系统仅暴露于单一的 HIV 抗原更广泛的和更有效的免疫应答。 0024 所述两种或多种不同的HIV抗原可以由来自不同的HIV蛋白(例如, HIV Gag, Env, Pol, 等 ) 或不同的 HIV 分化体 ( 例如, HIV 分化体 A, B, C, D, E, MN, 等 ) 的两种或多种抗原 提供。例如, HIV Gap 蛋白和 Pol 蛋白为不同的抗原。类似地, HIV 分化体 A Env 蛋白和 HIV 分化体 B Env 蛋白为不同的 HIV 抗原。优选地, 所述两种。

33、或多种不同的 HIV 抗原包括来自 两种或多种不同的 HIV 分化体的 HIV 抗原。更优选地, 所述腺病毒载体组合物包括腺病毒 载体, 其编码来自三种或多种不同的HIV分化体的三种或多种不同的HIV抗原, 或者甚至是 来自四种或多种不同的 HIV 分化体的四种或多种不同的 HIV 抗原。备选地, 所述两种或多 种 HIV 抗原的至少一种可以为嵌合抗原, 其包括衍生于从两种或多种不同的 HIV 分化体获 得的相同抗原的氨基酸序列。例如, 嵌合 Env 蛋白可以包括从分化体 A HIV 获得的 Env 氨 基酸序列的一部分, 和从分化体 B HIV 获得的 Env 氨基酸序列的一部分。 0025。

34、 例如, 所述腺病毒载体组合物可以由下述组合物提供, 即, 包括一种或多种腺病毒 载体(例如, 单一的腺病毒载体)的组合物, 其中每一种腺病毒载体编码两种或多种不同的 HIV 抗原, 或者包括两种或多种腺病毒载体 ( 例如, 多腺病毒载体 ) 的组合物, 其中每一种 腺病毒载体编码一种或多种不同的HIV抗原, 并且因此, 共同编码两种或多种不同的HIV抗 原。当所述腺病毒载体组合物包括每一种编码两种或多种 HIV 抗原的一种或多种腺病毒载 体 ( 例如, 单一腺病毒载体 ) 时, 每一种腺病毒载体可以包括 (i) 编码两种或多种不同 HIV 抗原 ( 例如, 多蛋白或融合蛋白 ) 的核酸序列,。

35、 或者 (ii) 两种或多种核酸序列, 其中每一种 编码不同的 HIV 抗原。与构型 (i) 一致, 应用包括编码多于两种不同的 HIV 抗原 ( 例如, 三 种或更多种, 四种或更多种, 或者甚至是五种或更多种不同的 HIV 抗原 ) 或者编码同一抗 原的多个拷贝的核酸序列的腺病毒在本发明的范围内, 条件是其编码至少两种或多种不同 的 HIV 抗原。同样地, 与构型 (ii) 一致, 应用包括每一种编码不同的 HIV 抗原或同一抗原 的多个拷贝的一些核酸序列 ( 例如, 三种或更多种, 四种或更多种, 或者甚至是五种或更多 种不同的核酸序列 ) 的腺病毒载体在本发明的范围内, 条件是所述腺病。

36、毒载体编码至少两 种不同的 HIV 抗原。不论通过构型 (i) 或 (ii), 所述腺病毒载体组合物优选地包括编码三 种或更多种, 或者甚至是四种或更多种不同的HIV抗原的一种或多种腺病毒载体(例如, 其 中所述的每一种载体包括编码三种或更多种, 或者四种或更多种不同的 HIV 抗原的核酸序 列, 或者其中所述的每一种载体包括三种或更多种, 或者四种或更多种核酸序列, 并且每种 核酸序列编码不同的HIV抗原)。 理想地, 所述两种或更多种, 三种或更多种, 或者四种或更 多种不同的HIV抗原来自两种或更多种, 三种或更多种, 或者四种或更多种不同的HIV分化 体。 0026 优选地, 所述腺病。

37、毒载体组合物包括编码两种或多种不同的 HIV 抗原的两种或多 种腺病毒载体, 并且每一种腺病毒载体包括编码所述两种或多种不同的 HIV 抗原的至少一 种的核酸序列。尽管所述腺病毒载体组合物包括编码两种或多种不同 HIV 抗原的两种或多 种腺病毒载体, 对于所应用的腺病毒载体的数目, 或者由此编码的不同 HIV 抗原的数目, 没 有上限。优选地, 所述腺病毒载体组合物包括编码三种或多种不同 HIV 抗原的三种或多种 说 明 书 CN 1972958 B 7 5/35 页 8 腺病毒载体, 并且每一种腺病毒载体包括编码所述三种或多种不同 HIV 抗原的至少一种的 核酸序列。最优选地, 所述腺病毒载。

38、体组合物包括编码四种或多种不同 HIV 抗原的四种或 多种腺病毒载体, 并且每一种腺病毒载体包括编码所述四种或多种不同 HIV 抗原的至少一 种的核酸序列。理想地, 所述两种或更多种, 三种或更多种, 或者四种或更多种不同 HIV 抗 原是来自两种或更多种, 三种或更多种, 或者四种或更多种不同的 HIV 分化体。 0027 当然, 可以应用上述腺病毒载体构型的组合, 而并不背离本发明的精神和范围。 例 如, 按照本发明所应用的腺病毒载体组合物可以包括第一种腺病毒载体, 其编码单一的 HIV 抗原, 和第二种腺病毒载体, 其编码不同于第一种腺病毒载体所编码的 HIV 抗原的两种或 多种 HIV。

39、 抗原。其它类似的本文所公开的腺病毒载体构型的组合和排列是显而易见的, 并 且可以按照本发明应用。 0028 当所述腺病毒载体组合物包括两种或多种腺病毒载体时, 包含在所述组合物中的 两种或多种腺病毒载体中的每一种的相对量将取决于许多因素, 其包括与其它 HIV 抗原相 比的具体的 HIV 抗原的免疫原性。所述腺病毒载体组合物可以包括等量的所述两种或多种 腺病毒载体的每一种。备选地, 所述腺病毒载体组合物可以包括不同量的所述两种或多种 腺病毒载体的每一种。 0029 在本发明特别优选的实施方案中, 所述腺病毒载体组合物包括 4 种腺病毒载体, 其中每一种分别包括编码分化体 B Gag-Pol 。

40、融合蛋白, 分化体 A gp140, 分化体 B gp140 和 分化体 C gp140 的核酸序列。最优选地, 所述腺病毒载体组合物包括具有核酸序列 SEQ ID NO : 4, SEQ ID NO : 5, SEQ ID NO : 6 和 SEQ ID NO : 7 的 4 种腺病毒载体。SEQ ID NO : 4 是编 码分化体 B Gag-Pol 融合蛋白的 E1/E4- 缺失腺病毒载体的核酸序列。SEQ IDNO : 5 是编码 分化体 A gp140 蛋白的 E1/E4- 缺失腺病毒载体的核酸序列。SEQ ID NO : 6 是编码分化体 B gp140 蛋白的 E1/E4- 缺失。

41、腺病毒载体的核酸序列。SEQ ID NO : 7 是分化体 C gp140 蛋白 的核酸序列。理想地, 所述腺病毒载体组合物以 3:1:1:1 的重量比例包括下述腺病毒载体, 分别为 : 包括编码分化体 B Gag-Pol 融合蛋白的核酸序列的腺病毒载体, 包括编码分化体 A gp140 的核酸序列的腺病毒载体, 包括编码分化体 B gp140 的核酸序列的腺病毒载体, 和包 括编码分化体 C gp140 的核酸序列的腺病毒载体。 0030 典型地, 所述腺病毒载体包括编码一种或多种 HIV 抗原的核酸作为表达盒的一部 分, 即, 拥有有助于核酸序列的亚克隆和回收 ( 例如, 一个或多个限制性。

42、酶切位点 ) 或核酸 序列的表达 ( 例如, 多聚腺苷化作用或剪接位点 ) 功能的具体核苷酸序列。所述核酸优选 地位于腺病毒基因组的 E1 区 ( 例如, 完全或部分地置换 E1 区 ) 或 E4 区。例如, E1 区可以 由包括编码抗原的核酸的可用启动子表达盒置换。所述表达盒任选地可以以 3 -5方向 插入, 例如, 以所述表达盒的转录方向与周围临近的腺病毒基因组的方向相反这样的方向 导向。然而, 对于所述表达盒, 以与周围基因组的转录方向相关的 5 -3方向插入也是适 当的。除了包括编码抗原的核酸的表达盒, 所述腺病毒载体包括包含其它外源核酸的其它 表达盒, 所述表达盒可以置换腺病毒基因组。

43、的任何删除的区域。将表达盒插入所述腺病毒 基因组 ( 例如, 插入基因组的 E1 区 ) 可以通过已知方法实现, 例如, 通过在腺病毒基因组的 给出位置引入独特的限制性酶切位点。如上文所提出的, 优选地所述腺病毒载体的全部或 部分 E3 区也被删除。 0031 优选地, 将所述编码抗原的核酸可操作地连接到(即, 在其转录控制下)一种或多 说 明 书 CN 1972958 B 8 6/35 页 9 种启动子和 / 或增强子元件上, 例如, 作为可用启动子表达盒的一部分。在本领域, 用于有 效地将序列连接到一起的技术是公知的。 “启动子” 是指导 RNA 聚合酶的结合并且由此启动 RNA 合成的 。

44、DNA 序列。将核酸序列 “可操作地连接” 到启动子上, 此时所述启动子能够指导 核酸序列的转录。对于可操作连接的核酸序列的启动子可以是天然的或非天然的。 0032 任何启动子 ( 即, 不管是从天然分离的还是通过重组 DNA 或合成技术产生的 ) 可 以与本发明结合应用以提供核酸序列的转录。所述启动子优选地能够在真核 ( 理想地哺乳 动物 ) 细胞中指导转录。所述启动子的功能可以被在载体上存在的一种或多种增强子和 / 或沉默基因而改变。 “增强子” 为激活或抑制相邻基因的转录的 DNA 的顺式作用元件。抑制 转录的增强子也叫做 “沉默基因” 。增强子与用于只在启动子中发现的序列特异性 DNA。

45、 结合 蛋白的 DNA 结合位点不同 ( 其也叫做 “启动子元件” ), 原因在于增强子可以以任何方向, 并 且在多达几千碱基对 (kb) 的距离, 甚至从转录区的下游位置起作用。 0033 启动子区可以在长度和序列上不同, 并且还可以包括用于序列特异性 DNA 结合蛋 白的一种或多种 DNA 结合位点和 / 或增强子或沉默基因。增强子和 / 或沉默基因可以类似 地存在于本质上在启动子外的核酸序列上。理想地, 细胞或病毒增强子, 诸如巨细胞病毒 (CMV)早期增强子, 位于接近启动子的地方, 以增强启动子活性。 另外, 核酸序列上可以存在 剪接受体和供体位点, 以增强转录。 0034 在本发明。

46、的上下文中任何适当的启动子或增强子序列都可以应用。在这方面, 编 码抗原的核酸序列可以可操作地连接到病毒启动子上。适当的病毒启动子包括, 例如, 巨 细胞病毒 (CMV) 启动子, 诸如 CMV 早期启动子 ( 例如, 在美国专利 5,168,062 和 5,385,839 中所描述 ), 衍生于人类免疫缺陷病毒 (HIV) 的启动子, 诸如 HIV 长末端重复启动子, 劳 斯肉瘤病毒 (RSV) 启动子, 诸如 RSV 长末端重复, 小鼠乳癌病毒 (MMTV) 启动子, HSV 启动 子, 诸如 Lap2 启动子或疱疹胸苷激酶启动子 (Wagner 等 ., Proc.Natl.Acad.S。

47、ci., 78, 144-145(1981), 衍生于SV40或埃巴病毒的启动子, 腺伴随病毒启动子, 诸如p5启动子, 等 等。 0035 备选地, 本发明应用细胞启动子, 即, 促进细胞蛋白表达的启动子。优选地用于本 发明的细胞启动子将取决于产生抗原的理想的表达模式。一方面, 所述细胞启动子优选地 为在多种细胞类型, 诸如本文所述的免疫细胞中作用的组成型启动子。适当的组成型启动 子可以促进编码转录因子的基因, 持家基因, 或者真核细胞常见的结构基因的表达。例如, Ying Yang1(YY1) 转录因子 ( 也叫做 NMP-1, NF-E1 和 UCRBP) 是一种普遍存在的核转录因 子,。

48、 其为核基质的固有组分 (Guo 等 ., PNAS, 92, 10526-10530(1995)。尽管认为本文所描 述的启动子是组成型启动子, 在本领域应该明白组成型启动子可以被上调节。启动子分析 表明, 相对于从启动子的转录起始位点, 基础转录的关键元件位于YY1基因的-277到+475, 并且包括 TATA 和 CCAAT 盒。JEM-1( 也叫做 HGMW 和 BLZF-1) 也是在正常和肿瘤组织中鉴别 出的普遍存在的核转录因子 (Tong 等 ., Leukemia, 12(11), 1733-1740(1998), 和 Tong 等 ., Genomics, 69(3), 380-。

49、390(2000)。JEM-1 参与细胞生长控制和成熟, 并且可以通过视黄酸 上调节。相对所述启动子的转录起始位点, 负责 JEM-1 启动子最大活性的序列位于 JEM-1 基因的 -432 到 +101。与 YY1 启动子不同, JEM-1 启动子不包括 TATA 盒。遍在蛋白启动子 (ubiquitin promoter), 特别地 UbC, 是在一些物种中有作用的强组成型活性启动子。在 Marinovic 等 ., J.Biol.Chem., 277(19), 16673-16681(2002) 中进一步特征性描述 UbC 启 说 明 书 CN 1972958 B 9 7/35 页 10 动子。 0036 许多上文所述的启动子为组成型启动子。除了为组成型启动子, 所述启动子可以 为可调节启动子, 即, 应答适当的信号上调和 / 或下调的启动子。可调节启动子或表达控制 序列的应用特别适用于作为抗原蛋白的 DNA 疫苗开发, 所述抗原蛋白包括病毒和寄生虫抗 原, 通常对互补细胞系是毒性的。 在一个实施方案中, 可操作地连接到编码抗原的核酸序列 的调节序列包括四环素表达系统组分, 例如, tet 操纵子位点。例如, 将编码抗原的核酸序 列可操作地连接到启动子上, 所述启动子可操作地连接一种或多种 tet 操纵子位点。包括 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 >


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1