对HIV-1基因组(HIV-1CpG1)按本文所述方法进行修饰,仅
示出了其一条链的核苷酸序列,从左至右为5’→3’方向。本文中所给出
的核苷酸和氨基酸是以IUPAC-IUB生化命名协会(Biochemical
Nomenclature Commission)推荐的方法书写的,见37 CFR § 1.822
和已确立的用法,或以3字母密码形式出现(用于氨基酸)。例如,参
见Patent In User Manual,99-102(1990年11月)(美国专利商标局)。
在核苷酸序列中,核苷酸间的磷酸键有时用“p”表示,其位于表示核
苷酸的标准单个大写字母之间,如“CpG”表示5’-CG-3’。
1.病毒
本发明病毒一般是表达缺陷型病毒。就是说为了生产这种病毒,可
将该病毒基因组或编码该病毒基因组的DNA引入一种宿主细胞,该宿主
细胞不会充分将所述病毒DNA甲基化以使其失活。因此,该病毒基因组
可以在这样的宿主细胞中转录成RNA,该RNA又被翻译成病毒蛋白,
并产生包壳的病毒基因组(病毒颗粒)。为了在动物或人的受试对象上
产生免疫反应,靶细胞在这种情况下对病毒基因组进行甲基化,以便抑
制该病毒基因组的甲基化敏感过程,如转录。因此,本发明可用任何病
毒进行,包括DNA病毒、RNA病毒和逆转录病毒,其中,所用病毒的
基因组在服用了该病毒的受治对象的细胞内被甲基化。特别推荐逆转录
病毒。在图1中示出了一种逆转录病毒的生活周期的示意图,并说明CpG
插入的逆转录病毒基因组是如何中断其生活周期的。如图1所示,由粗
线表示的生活周期的各个时期在CpG插入的逆转录病毒中中断。
可用于实现本发明的逆转录病毒包括动物和人的逆转录病毒。这组
逆转录病毒既包括简单逆转录病毒,也包括复合逆转录病毒。简单逆转
录病毒包括B型逆转录病毒、C型逆转录病毒和D型逆转录病毒的亚
组。B型逆转录病毒的例子之一是小鼠乳腺瘤病毒(MMTV)。C型
逆转录病毒包括亚组C型组A(包括Rous肉瘤病毒(RSV)、禽白血
病病毒(ALV)和禽成髓细胞性白血病病毒(AMV)和C型组B(包
括小鼠白血病病毒(MLV)、猫白血病病毒(FeLV)、小鼠肉瘤病毒
(MSV)、长臂猿白血病病毒(GALV)、脾坏死病毒(SNV)、网
状内皮组织增殖病毒(RV)和猴肉瘤病毒(SSV))。D型逆转录病
毒包括Mason-Pfizer猴病毒(MPMV)和l型猴逆转录病毒(SRV-
1)。复合逆转录病毒包括慢病毒(lentiviruses)、T细胞白血病病毒
和起泡病毒(foamy viruses)的亚组。慢病毒包括HIV-1,还包括
HIV-2、SIV、绵羊髓鞘脱落病毒、猫免疫缺损病毒(FIV)和马传
染性贫血病毒(EIAV)。T细胞白血病病毒包括HTLV-1、HTLV
-II、猴T细胞白血病病毒(STLV),和牛白血病病毒(BLV)。
起泡病毒包括人起泡病毒(HFV)、猴起泡病毒(SFV)和牛起泡病
毒(BFV)。上述病毒是说明性的,其目的并非是要限定可用于实现本
发明的逆转录病毒。
可用于实现本发明的其它RNA病毒的例子包括,但不限于以下成
员:呼肠病毒科的成员,包括正呼肠病毒属(哺乳动物和禽逆转录病毒
的多种血清型)、环状病毒属(蓝舌病毒、Eugenangee病毒、Kemerovo
病毒、非洲马病病毒、和科罗拉多蜱热病毒)、轮状病毒属(人轮状病
毒、内布拉斯加牛腹泻病毒、鼠轮状病毒、猿轮状病毒、牛或羊轮状病
毒、禽轮状病毒);微小RNA病毒科的成员,包括肠病毒属(脊髓灰质
炎病毒、Coxsackie病毒A和B、人肠道致细胞孤(ECHO)病毒、甲
型肝炎病毒、猴肠病毒、鼠脑炎髓炎(ME)病毒、鼠脊髓灰质炎病毒、
牛肠病毒、猪肠病毒)、心脏病毒属(脑心肌炎病毒(EMC)、门果病
毒)、鼻病毒属(人鼻病毒-至少有113个亚型;其它鼻病毒)、Apthovirus
属(口碲疫病毒(FMDV));钙化病毒科(Calciviridae),包括猪
泡囊疹病病毒、San Miguel海狮病毒、猫微小RNA病毒和Norwalk病
毒;披膜病毒科,包括α病毒属(东方马脑炎病毒、Semliki森林病毒、
Sindbis病毒、Chikungunya病毒、O’Nyong-Nyong病毒、Ross河病
毒、Venezuelan马脑炎病毒、西方马脑炎病毒)、黄病毒属(蚊传黄热
病毒、Dengue病毒、日本脑炎病毒、圣路易斯脑炎病毒、Murray Valley
脑炎病毒、West Nile病毒、Kunjin病毒、中欧蜱传病毒、远东蜱传病
毒、Kyasanur森林病毒、Louping III病毒、Powassan病毒、Omsk
出血热病毒)、风疹病毒属(风疹病毒)、瘟疫病毒属(粘膜病毒、猪
瘟病毒、Border病病毒);布尼亚病毒科,包括布尼病毒属(布尼奥罗
病毒及相关病毒、加利福里亚脑炎组病毒)、Phlebovirus属(白蛉热西
西里亚病毒、Rift Valley热病毒)、Nairovirus属(Crimean-Congo
出血热病毒、内罗比绵羊病病毒)和Uukuvirus属(Uukuniemi及相关
病毒);正粘液病毒科,包括流感病毒属(甲型流感病毒(很多种人的
亚型);猪流感病毒,和禽及马流感病毒;和丙型流感病毒(可能为另
一属);副粘液病毒科,包括副粘液病毒属(1型副流感病毒、Sendai
病毒、血吸病毒、2-5型副流感病毒、新城病病毒、流行性腮腺炎病
毒)、麻疹病毒属(麻疹病毒、亚急性硬化性全脑炎病毒、瘟热病毒、
牛瘟病毒、肺病毒属(呼吸道合胞病毒(RSV)、牛呼吸道合胞病毒和
小鼠肺炎病毒);棒状病毒科,包括囊炎病毒(VSV)属、Chandipura
病毒、Flanders-Hart Park病毒)、狂犬病毒属(狂犬病毒)、鱼棒状
病毒的两个属、和两种可能的棒状病毒(Marburg病毒和Ebola病毒);
沙粒病毒科,包括淋巴细胞性脉络丛脑膜炎病毒(LMC)病毒、
Tacaribe病毒复合体,和拉沙病毒;冠状病毒科,包括传染性支气管炎
病毒(IBV)、小鼠肝炎病毒、人肠冠状病毒和猫传染性腹膜炎病毒(猪
冠状病毒)。
可用于实现本发明的DNA病毒的例子包括,但不限于以下成员:
痘病毒科,包括正痘病毒属(重型天花、轻型天花、猴牛痘、牛痘、水
牛痘、兔痘、缺肢畸形)、Leporipoxvirus属(粘液瘤、纤维瘤)、禽
痘病毒属(鸟痘、其它禽痘)、羊痘病毒属(绵羊痘、山羊痘)、Suipoxvirus
属(猪痘)、类痘病毒属(接触型继发皮炎病毒、假牛痘、牛丘疹口炎
病毒);虹彩病毒科(非洲猪热病毒、蛙病毒2和3、鱼淋巴囊肿病毒);
疱疹病毒科,包括α疱疹病毒(1型和2型单纯疱疹病毒、水痘-带状
疱疹病毒、马流产病毒、马疱疹病毒2和3、假狂犬病毒、传染性牛角
膜结膜炎病毒、传染性牛鼻气管炎病毒、猫鼻气管炎病毒、传染性喉气
管炎病毒);β疱疹病毒(人巨细胞病毒和猪、猴及啮齿动物巨细胞病
毒);γ疱疹病毒(EB病毒、Marek’s病病毒、Herpes Saimiri、
Herpesvirus ateles、Herpesvirus sylvilagus、豚鼠疱疹病毒、Lucke
肿瘤病毒);腺病毒科,包括乳腺病毒属(人的A、B、C、D、E
亚组及未分组的乳腺病毒);猴腺病毒(至少23个血清型),传染性犬
肝炎,和牛、猪、绵羊、蛙和其它种的腺病毒、禽腺病毒属(禽腺病毒);
和不可培养的腺病毒;乳多空病毒科,包括乳头瘤病毒属(多种亚型的
人乳头瘤病毒、牛乳头瘤病毒、Shope兔乳头瘤病毒、和其它种的各种
病原性乳头瘤病毒)、多瘤病毒属(多瘤病毒、猴病毒40(SV-40)、
兔空泡形成剂(RKV)、K病毒、BK病毒、JC病毒,及其它灵长类
多瘤病毒,如亲淋巴性乳头瘤病毒;细小病毒科,包括腺病毒相关病毒
属,细小病毒属(猫Panleukopenia病毒、牛细小病毒、犬细小病毒、
Aleutian水貂病病毒等)。最后,DNA病毒还可以包括不属于上述各科
的病毒:Kuru,克雅氏病病毒和慢性传染性神经病病毒(CHINA病毒)。
2.引入减毒突变
本文所说的“减毒病毒”是指受该病毒感染的易感宿主发病的可能
性降低(丧失毒力),符合本领域标准命名法。例如,参见B.Davis,R.
Dulbecco,H.Eisen,和H.Ginsberg,Microbiology,132(第3版,
1980)。减毒突变是指使一种病毒成为不再能致病的减毒病毒的突变。
本发明病毒是减毒病毒,在易感宿主中该病毒的生活周期在逆转录病毒
和DNA病毒的转录水平上受到抑制。对非逆转录病毒的RNA病毒来说,
病毒的生活周期被认为是因RNA基因组功能的丧失而受到抑制的,
RNA基因组功能的丧失是因CpG甲基化所致。
额外甲基化位点是通过上述病毒基因组的突变而引入的,这种突变
能产生本发明的改性病毒,额外甲基化位点的数目取决于突变的位点、
病毒的性质、有或无其它减毒突变(例如,逆转录病毒nef基因的缺失)
等,可以较少(如1,2,或3个),或至少为10个、50个、100个
或500个或更多。通常,将足够数量的甲基化位点引入病毒基因组,以
使该基因组内实测的与预期的CpG二核苷酸的比例(CpGo/e)比野生型
病毒高出1、2、3、4、5、6、7或8倍或更高,不过,当采用很少、
但具有特别强的减毒突变效果的甲基化位点时,CpGo/e不必提高这么
多。
通常,本发明的改性病毒是包括病毒衣壳的病毒颗粒,衣壳中含有
包括病毒基因组的核酸材料(DNA或RNA),所述病毒颗粒与服用了
该病毒的受治对象体内的靶细胞结合,并将其基因组导入所述细胞。因
此,所述改性病毒至少含有2个或3个减毒突变(通过上述方法引入甲
基化位点或通过其它机理),以降低所述病毒自发恢复毒力的可能性。
可以用任何合适的方法将本发明的减毒CpG突变引入编码病毒的
cDNA,如直接合成,PCR诱变或定点诱变(例如,可参见Kunkel的
美国专利US 4,873,192)(申请人特别申明,本文所引用的所有专利文
献的公开内容都作为本发明的参考)。
本发明的减毒病毒直接在一台DNA合成仪上生产,这种仪器的应
用在本领域广为人知。具体地讲,靶病毒(如HIV-1)的核酸序列是
经过选择的。然后,对不含CpG的密码子进行扫描,可将这种密码子改
变成含CpG的密码子,同时又不含改变翻译后的氨基酸序列。这样,用
CpG二核苷酸置换了不会CpG的密码子。例如,编码脯氨酸的CCT、
CCC或CCA被转换为CCG。或者,改变相邻的密码子,以使在其相邻
区域含有CpG。例如,可将相邻的密码子GCA GTG(丙氨酸-缬氨酸)
改变为GCC GTG,它仍然编码丙氨酸-缬氨酸,但现已含有可被甲基
化的CpG(第一个密码子的最后一个C和第二个密码子的第一个G)。
当然,某些密码子的种特异性优于其它密码子的。理想的是,通过
筛选可用的最佳密码子的方式产生改变了的基因组(即:生产病毒的宿
主细胞培养系统的优选密码子,和服用该病毒以便产生免疫反应的受治
对象的优选密码子)。
如上所述,本发明的病毒除了包括本文所述的沉默CpG突变之外,
还可包括其它减毒方法。例如,如果必要的话可以包括常见的置换突变,
这种突变可以在其所编码的蛋白质内产生减毒性的氨基酸置换。作为应
用HIV-1的另一种例子,nef基因和其它基因或这些基因的一部分可
以缺失,以产生其减毒突变。
对于诸如HIV-1之类的逆转录病毒来说,该病毒有很多种株,通
过CpG插入对多种HIV-1株进行改性是理想的,同时使用这些改性
的株生产有效的疫苗。
下文披露一种用无义的或“沉默的”CpGs过度取代的新型HIV-
1基因组。“无义的”是指向该基因组中增加CpGs后不会改变所得蛋白
质的氨基酸序列。CpGs的过度取代,使得这种新的合成基因组成为宿
主细胞甲基化酶的目标。因此,尽管由该基因组所编码的病毒能够感染
宿主细胞,但该原病毒基因组易因为甲基化而失活,并永久保持休眠状
态。就是说,达到该基因组能被宿主细胞甲基化的程度,仍保持转录沉
默。
尽管本发明的目的主要在于使用所谓“活”病毒疫苗,但也可以使
用灭活病毒疫苗,包括甲醛和加热灭活的病毒疫苗。本发明可用于这种
疫苗的制备,因为活病毒偶然逃脱灭活处理并能导致感染。因此,本发
明可结合任何其它减毒方法一起使用,以提供进一步的减毒作用。
3.在细胞培养物中生产病毒
表达载体是一种可复制的DNA结构,其中,编码一种或几种蛋白
质的DNA序列可操作地同合适的调节序列连接,该调节序列能控制所述
DNA在合适宿主中的表达。可将一种复制载体用于在无须表达所述DNA
时产生额外的DNA。针对特定载体的宿主细胞选择取决于如下因子:如
是否需要表达或复制。
转化的宿主细胞是指用通过重组DNA技术构建的载体转化或转染
过的细胞。转化的宿主细胞通常能表达DNA,但是为克隆或扩增靶蛋白
目的而转化的宿主细胞不需要表达这种蛋白质。
合适的宿主细胞通常包括原核细胞、酵母细胞或高等真核细胞,如
哺乳动物细胞和昆虫细胞。来自多细胞生物的细胞特别适于作为重组甲
基化病毒的宿主,而昆虫细胞特别理想。这种细胞在细胞培养中的繁殖
已成为一种常规方法(Tissue Culture,Academic Press,Kruse和
Patterson著,1973)。有用的宿主细胞系的例子有CD4+T淋巴细胞,
如MOLT4,VERO和HeLa细胞,中国仓鼠卵巢(CHO)细胞系,
和WI138、BHK、COS-7、CV、和MDCK细胞系。用于这些细
胞的表达载体通常包括(必要的话)一个复制起点,一个启动子(位于
编码待表达的甲基化病毒的DNA上游并与其可操作地连接),以及一个
核糖体结合位点,一个RNA剪接位点(如果使用含有内含子的基因组
DNA的话),一个聚腺苷酸化位点,和一段转录终止序列。
当宿主细胞带有以其它方式将病毒基因组甲基化的甲基化系统时,
该甲基化系统必须失活到足于在其中产生病毒的程度。这种失活可用任
何合适方法实现,如使细胞培养基中含有一种脱甲基化剂或甲基化酶抑
制剂,如5-氮胞苷或5-氮脱氧胞苷,其用量足于抑制该甲基化系统
(如1~10μM);以足于使该甲基化系统失活的量将一种反义寡核
苷酸加入所述培养基中;或通过遗传工程技术使所述细胞表达一种能使
所述甲基化系统失活的反义剂。当通过遗传工程方法将所述反义系统引
入该细胞时,最好使用一种可诱导的表达载体,例如,将该反义寡核苷
酸插在一个启动子如小鼠金属硫蛋白启动子的下游,向组织培养基中添
加一种金属(如镉),该启动子即可启动寡核苷酸的表达。有众多的可
诱导表达系统为本领域技术人员所熟知。
在一种杆状病毒表达系统中表达型活病毒是特别可行的,该系统用
昆虫细胞作为宿主细胞,并使用昆虫所固有的病毒载体(参见授予Smith
等人的美国专利US4,745,051和4,879,236)。杆状病毒是杆状病毒科、
杆状病毒属的成员。该属包括3个亚组的病毒:核型多角体病毒
(NPV)、颗粒体病毒(GV)、和无包含体病毒。NPVs包括苜蓿银
纹夜蛾(Autographica californica)NPV(AcNPV)、棉铃虫
(Heliothis zea)NPV(HzNPV)和家蚕(Bombyx mori)NPV
(BmNPV)。将重组杆状病毒载体用于在昆虫细胞培养物或幼虫中表
达外源蛋白的应用是已知的。例如,见Luckow & Summers,
Bio/Technology,6,47(1988);Tomalski & Miller,Nature,352,82
(1991)。将杆状病毒用于本发明中特别有用,因为昆虫宿主细胞(如培养
的草地夜蛾细胞)不具有DNA甲基化酶,因此,不能在转录水平上使病
毒的原病毒DNA失活。一般,杆状病毒表达载体包括一个杆状病毒基因
组,其带有待表达的DNA,该DNA被插入多角体蛋白基因中,位于能
受杆状病毒多角体蛋白启动子的转录控制的位置。
用上述组织培养技术产生的改性病毒,可用诸如超滤之类的技术视
需要进行提纯和/或纯化,然后再与其它成分混合,以形成包含于可以药
用的载体中的改性病毒。
4.药物配方
这里披露一种组合物,其含有由本发明的细胞系所产生的减毒病毒
颗粒。该组合物可以包含任何可以药用的载体(如灭菌的无热原生理盐
水溶液,或灭菌的无热原磷酸缓冲盐溶液)。一般,该组合物是通过将
以上所生产的病毒颗粒与一种可以药用的载体接触并混合而制成的。视
最终用途,该组合物的病毒颗粒可以采用活的、灭活的、固定的或冻干
的形式中最适用的一种。该组合物中含有免疫剂量的病毒颗粒,这一剂
量视用途而定。特定数量本发明病毒的免疫活性,可以用本领域多种公
知方法中的任一种测定。服用后,抗一种特定病毒抗原的抗体效价的增
加可以作为免疫活性的指标。
可以服用本发明所披露的活的减毒病毒和配方的对象包括人体对象
和动物对象(例如,用于灵长目,如枭猴(owl monkey)、绒猴和黑猩
猩的兽医治疗,和用于其它哺乳动物种,如狗、猫、猪和马,及非哺乳
动物种,如鸟类(鸡、火鸡等)的治疗)。
本发明的药用组合物包含有免疫剂量的、在本发明中所披露的活的
减毒病毒,该病毒与一种可以药用的载体结合在一起。“免疫剂量”是
指足以激发服用对象的免疫反应的所述减毒病毒的量。所用的具体剂量
并不重要,它取决于对象的类型和状态、服用途径等。
对于本领域技术人员来说,确定本发明病毒颗粒的具体免疫剂量的
技术是显而易见的。例如,所述活性剂(病毒颗粒或其制剂)的用量可
以为0.01~100μg/kg体重(例如0.5或1.0μg/kg)。
可以用任何合适方法服用本文所披露的活的减毒病毒,包括肠胃外
注射(如腹膜内注射、皮下注射、或肌内注射)、口服、和用表面使用
的方式将该病毒(通常含于药用配方中)用于气道表面。将病毒用于气
道表面的表面使用方法是通过鼻内使用法(例如,用贮有鼻内使用的药
物的滴管、药签或吸入器)实现的。将病毒用于气道表面的表面使用方
法还可以通过吸入法实现,如通过制备含有病毒的可吸入的药物颗粒(包
括固定颗粒和液体颗粒)作为气溶胶悬浮液,然后让对象吸入这种可吸入
的颗粒。用于服用可吸入的药物颗粒的方法和装置众所周知,而且任何
常见技术均可使用。例如,见授予D.Leith的美国专利US5,304,
125;授予C.Davis和R.Snyder的美国专利US 5,299,566;授予R.Fisher
和W.Metzger的美国专利US 5,290,550;以及授予R.Boucher的美国
专利US 5,292,498。
可以通过已知方法用能产生活病毒的细胞培养物制备口服疫苗,所
述病毒含有想要的减毒突变。可给对象服用所述培养物本身;可有选择
地过滤和/或澄清该培养物;可将蔗糖、MgCl2等之类的稳定剂加入培养
基中。可用于口服的药用载体可以是糖浆、酏剂、锭剂等。可按照已知
技术制备所述疫苗配方,如由R.Purcell等所述的方法(Vaccine Against
Hepatitis A Virus,US 4,894,228)。
尽管上文中对本发明病毒、方法和配方的说明是结合通过服用疫苗
配方以产生保护性免疫的形式进行的,但也可以用于使动物免疫,仅仅
使动物产生抗体,然后收集抗体,用于按照常规诊断技术检测和/或诊断
各种病毒感染或生物样品中病毒颗粒的存在。一般参见E.Maggio,
Enzyme Immunoassay(1980);同样参见US 4,659,678,US4,376,110,
US4,275,149,US4,233,402和US 4,230,767。
5.寡核苷酸探针
本发明的一个优点是,可用于检测野生型病毒的感染,即使在已接
种之后也行。例如,使用了一种完整或接近完整病毒的疫苗可以产生对
该病毒的免疫反应,从而不能用标准的免疫或核酸检测方法检测随后的
感染。本发明的结构由于代表了在DNA水平上的全新创造,因此,可用
分子探测法方便地加以区分。因此,可以制备对野生型病毒有专一性但
不会与本发明的病毒杂交的探针,而且可以制备特异地结合本发明的病
毒但不能与野生型病毒结合的探针。
因此,本发明的另一方面是一种寡核苷酸探针,可将其用于区分(i)
一种自然界所没有的减毒病毒,与相应的野生型病毒相比,其基因组中
含有至少一个额外的甲基化位点,和(ii)相应的野生型病毒。所述寡核苷
酸探针选自:(a)在相同的杂交条件下,能选择性地与上述(i)的减
毒病毒的核酸杂交,但不能与上述(ii)的野生型病毒的核酸杂交的寡
核苷酸探针;和(b)在相同的杂交条件下,能选择性地与上述(ii)
的野生型病毒的核酸杂交,但不能与上述(i)的减毒病毒的核酸杂交的
寡核苷酸探针。所述探针可以为任何合适的长度,只要具有想要的结合
特异性就行。所述探针的长度通常至少为8~12个核苷酸,也可以高达
20~40个核苷酸或更多。所述探针可以是任何合适的核酸,包括DNA
和RNA。可以通过各种技术,包括直接共价键用一种可检测到的基团(例
如,诸如32P、125I、131I、3H、14C或35S之类的放射性同位素;诸如
辣根过氧化物酶或碱性磷酸酶之类的酶)标记或缀合所述探针。所述探
针可以是一个探针或是一对探针中的一员,可用于核酸扩增方法,如聚
合酶链式反应(PCR)、连接酶链式反应(LCR)、或链置换扩增
(SDA)。使用这种探针的技术为本领域技术人员所熟知。例如,参见
授予Falkow和Mosley的美国专利US4,358,535;授予Wahl和Stark的
美国专利US 4,302,204;授予Stavrianopoulos的美国专利US 4,994,373;
授予Walker等的美国专利US,5,270,184;而对于PCR,参见US
4,683,195,US 4,683,202,US4,800,159和US 4,965,188。
下面的非限定性实施例将对本发明做更详细的说明。
例1
在HIV-1基因组中引入CpG位点
HIV-1菌株HIVHXB2CG(见F.Wong-Staal等,Nature,
313,277-284,(1985))的基因组序列获自GENBANK(保藏号K03445)。
确定该序列上可以加入沉默置换突变,以便将额外的CpG片段引入该基
因组的位点,并按以下方法合成一种编码所述HIV-1基因组的非天然
衍生物的新DNA。
通过亚磷酰胺化学法在一台Applied Biosystems Model 394
DNA/RNA合成仪(Applied Biosystem公司,850 Lincoln Centre Drive.
Foster City,加利福里亚,94404,美国)上合成长度为75个碱基的单
链DNA片段。在55℃温度下对每个75bp的双链DNA片段进行脱保护
12小时,并进行干燥,以除去氢氧化铵。在脱保护步骤中保留了三苯甲
游基。然后通过NENSORBTM层析将完整长度的75bp片段同制剂中较
短的“残缺”片段分开。这样可以起到避免将较短的残缺片段加在较长
的片段上。
制备互补片段,并一起退火,使重叠末端有4个碱基,以产生长度
为75个碱基的双链DNA片段。接着,将每个新的75bp的双链DNA片
段与先前的片段连接,以组成延长的双链DNA片段,其最终成为序列1
所示的完整的修饰HIV-1基因组(HIV-1CpG-1)。
用常规技术将合适的剪接片段加在所述完整基因组的每个末端,并
将该基因组插入一种表达载体。
比较例A
比较HIV-1菌株HIVHXB2CG和
菌株HIV-1CpG1中的CpG位点
HIVHXB2CG基因组中的CpG含量在图2中以曲线形式表示。为
清楚起见,将HIV的基因结构也示于该曲线图中。
HIV-1CpG1基因组的CpG含量由图3中的曲线表示。可以看出,
与图2所示的野生型基因组相比,其CpG含量显著提高。与HIVHXB2CG
相比,HIV-1CpG1有948个新的CpG位点(表明其CpG片段增加了
10倍以上:HIVHXB2CG中有97个;HIV-1CpG1中有1045个)。
实测的与预期的CpG二核苷酸的比例(CpGo/e)由HIVHXB2CG的
CpGo/e值0.22,提高到HIV-1CpG-1的CpGo/e值1.68。这表明CpGo/e
提高了大约8倍。在极端情况下(例如,有几百个新的CpG甲基化位点
被插入病毒基因组,如实施例中改性的基因组HIV-1CpG-1),这将导
致GC/CT之比高于野生型病毒中的GC/CT比。因此,HIV-1CpG-1的
GC/AT比为1.05,而野生型基因组HIVHXB2CG中这一比例为0.74。
HIV-1CpG-1与HIVHXB2CG的碱基数的比较如下:
HIVHXB2CG
HIV-1CpG-1
腺嘌呤
3411
2796
胞嘧啶
1773
2197
鸟嘌呤
2370
2772
胸腺嘧啶
2164
1953
可以看出,与HIVHXB2CG相比,HIV-1CpG-1少了615个腺嘌呤和
211个胸腺嘧啶,但多了424个胞嘧啶和402个鸟嘌呤。在改性的基因组
中,GC/AT之比无显著增加,在这些改性的基因组中仅需插入少量
(如,少于10个)的CpGs以中断其病毒生活周期。HIVHXB2CG的
GC/AT比为0.74;而HIV-1CpG-1的GC/AT比为1.05。
例2
HIV-1基因组在昆虫细胞中的表达
从Clontech公司(其在美国的电话号码是:415-424-8222)
获取BACKPACKTM杆状病毒表达系统。将上述例1中的基因组DNA片
段连接在pBacPAK8TM(或PBacPAK9TM)的多克隆位点上,形成一种
重组载体,使该基因组DNA的表达受载体上的强AcMNPV多角体蛋白
启动子的控制。用上述重组载体转化培养的草地夜蛾细胞,并按生产商
的说明在培养的细胞中生产本发明的病毒。
以上实施例是用于说明本发明的,并不构成对本发明的限定。本发
明由以下的权利要求进行限定,与这些权利要求相当的内容也落入本发
明的保护范围。
序列表
(1)一般信息:
(i)申请人:Nyce,Jonathan W.
(ii)发明名称:减毒病毒及其制备方法
(iii)序列数:1
(iv)相关地址:
(A)收件人:Kenneth D.Sibley
(B)街道:邮政信箱34009
(C)市:Charlotte
(D)州:North Carolina
(E)国家:美国
(F)邮编:28234
(v)计算机可读形式:
(A)介质类型:软盘
(B)计算机:IBM PC兼容机
(C)操作系统:PC-DOS/MS-DOS
(D)软件:PatentIn Release#1.0 Version#1.30
(vi)本申请资料:
(A)申请号:US 08/319,974
(B)申请日:07-10-1994
(C)分类号:
(viii)律师/代理人信息:
(A)姓名:Sibley,Kenneth D.
(B)注册号:31,665
(C)文件/档案号:5218-27
(ix)电信信息:
(A)电话:919-881-3140
(B)传真:919-881-3175
(C)电传:575102
(2)序列1的信息:
(i)序列特征:
(A)长度:9718bp
(B)类型:核酸
(C)链型:单
(D)拓扑结构:线性
(ii)分子类型:cDNA
(xi)序列表达:序列1:
TGGAAGGGCT AATTCACTCC CAACGAAGAC AAGATATCCT TGATCTGTGG ATCTACCACA 60
CACAAGGCTA CTTCCCTGAT TAGCAGAACT ACACACCAGG GCCAGGGATC AGATATCCAC 120
TGACCTTTGG ATGGTGCTAC AAGCTAGTAC CAGTTGAGCC AGAGAAGTTA GAAGAAGCCA 180
ACAAAGGAGA GAACACCAGC TTGTTACACC CTGTGAGCCT GCATGGAATG GATGACCCGG 240
AGAGAGAAGT GTTAGAGTGG AGGTTTGACA GCCGCCTAGC ATTTCATCAC ATGGCCCGAG 300
AGCTGCATCC GGAGTACTTC AAGAACTGCT GACATCGAGC TTGCTACAAG GGACTTTCCG 360
CTGGGGACTT TCCAGGGAGG CGTGGCCTGG GCGGGACTGG GGAGTGGCGA GCCCTCAGAT 420
CCTGCATATA AGCAGCTGCT TTTTGCCTGT ACTGGGTCTC TCTGGTTAGA CCAGATCTGA 480
GCCTGGGAGC TCTCTGGCTA ACTAGGGAAC CCACTGCTTA AGCCTCAATA AAGCTTGCCT 540
TGAGTGCTTC AAGTAGTGTG TGCCCGTCTG TTGTGTGACT CTGGTAACTA GAGATCCCTC 600
AGACCCTTTT AGTCAGTGTG GAAAATCTCT AGCAGTGGCG CCCGAACAGG GACCTGAAAG 660
CGAAAGGGAA ACCAGAGCTC TCTCGACGCA GGACTCGGCT TGCTGAAGCG CCCGCACGGC 720
AAGAGGCGAG GGGCGGCGAC TGGTGAGTAC GCCAAAAATT TTGACTAGCG GAGGCTAGAA 780
GGAGAGAGAT GGGCGCGCGC GCGTCGGTAT TATCGGGCGG CGAATTAGAT CGATGGGAAA 840
AAATTCGGTT ACGGCCGGGC GGAAAGAAAA AATATAAATT AAAACATATC GTATGGGCGT 900
CGCGCGAGCT CGAACGATTC GCGGTTAATC CGGGCCTGTT AGAAACGTCG GAAGGCTGTC 960
GACAAATACT CGGACAGCTA CAACCGTCGC TTCAGACGGG ATCGGAAGAA CTTCGATCGT 1020
TATATAATAC GGTCGCGACG CTCTATTGCG TCCATCAACG GATCGAGATA AAAGACACGA 1080
AGGAAGCGTT AGACAAGATC GAGGAAGAGC AAAACAAATC GAAGAAAAAA GCGCAGCAAG 1140
CGGCGGCGGA CACGGGACAC TCGAATCAGG TCTCGCAAAA TTACCCGATC GTGCAGAACA 1200
TCCAGGGGCA AATGGTACAT CAGGCGATAT CGCCGCGAAC GTTAAACGCG TGGGTAAAAG 1260
TCGTCGAAGA GAAGGCGTTC TCGCCGGAAG TGATACCGAT GTTTTCGGCG TTATCGGAAG 1320
GAGCGACGCC GCAAGATTTA AACACGATGC TAAACACGGT CGGCGGACAT CAAGCGGCGA 1380
TGCAAATGTT AAAAGAGACG ATCAACGAGG AAGCGGCGGA ATGGGATCGC GTGCATCCGG 1440
TGCACGCGGG GCCGATCGCG CCGGGCCAGA TGCGCGAACC GCGCGGATCG GACATCGCGG 1500
GAACGACGTC GACGCTTCAG GAACAAATCG GATGGATGAC GAATAATCCG CCGATCCCGG 1560
TCGGCGAAAT TTATAAACGA TGGATAATCC TCGGATTAAA TAAAATCGTA CGAATGTATT 1620
CGCCGACGTC GATTCTCGAC ATACGACAAG GACCGAAGGA ACCGTTTCGC GACTACGTCG 1680
ACCGGTTCTA TAAAACGCTA CGCGCGGAGC AAGCGTCGCA GGAGGTAAAA AATTGGATGA 1740
CGGAAACGTT GTTGGTCCAA AACGCGAACC CGGATTGTAA GACGATTTTA AAAGCGTTGG 1800
GACCGGCGGC GACGCTCGAA GAAATGATGA CGGCGTGTCA GGGCGTCGGC GGACCGGGCC 1860
ATAAGGCGCG CGTTTTGGCG GAAGCGATGT CGCAAGTAAC GAATTCGGCG ACGATAATGA 1920
TGCAGCGCGG CAATTTTCGG AACCAACGAA AGATCGTTAA GTGTTTCAAT TGCGGCAAAG 1980
AAGGGCACAC GGCGCGAAAT TGCCGCGCGC CGCGGAAAAA GGGCTGTTGG AAATGCGGAA 2040
AGGAAGGACA CCAAATGAAA GATTGTACGG AGCGACAGGC GAATTTTCTC GGGAAGATCT 2100
GGCCGTCGTA CAAGGGACGG CCGGGGAATT TTCTTCAGTC GCGACCGGAG CCGACGGCGC 2160
CGCCGGAAGA GTCGTTCCGG TCGGGCGTCG AGACGACGAC GCCGCCGCAG AAGCAGGAGC 2220
CGATAGACAA GGAACTGTAT CCGTTAACGT CGCTCCGGTC GCTCTTCGGC AACGACCCGT 2280
CGTCGCAATA AAGATAGGGG GGCAACTAAA GGAAGCTCTA TTAGATACAG GAGCAGATGA 2340
TACAGTATTA GAAGAAATGT CGTTGCCGGG ACGATGGAAA CCGAAAATGA TCGGCGGAAT 2400
CGGCGGTTTT ATCAAAGTAC GACAGTACGA TCAGATACTC ATCGAAATCT GCGGACATAA 2460
AGCGATCGGT ACCGTACTCG TCGGACCGAC GCCGGTCAAC ATAATCGGAC GAAATCTGTT 2520
GACGCAGATC GGTTGCACGT TAAATTTTCC GATTTCGCCG ATCGAGACGG TACCGGTAAA 2580
ATTAAAGCCG GGAATGGACG GCCCGAAAGT TAAACAATGG CCGTTGACCG AAGAAAAAAT 2640
AAAAGCGCTC GTCGAAATTT GTACGGAGAT GGAAAAGGAA GGGAAAATTT CGAAAATCGG 2700
GCCGGAAAAT CCGTACAATA CGCCGGTATT CGCGATAAAG AAAAAAGACT CGACGAAATG 2760
GCGAAAACTC GTCGATTTCC GCGAACTTAA TAAGCGAACG CAAGACTTCT GGGAAGTTCA 2820
ACTCGGAATA CCGCATCCGG CGGGGTTAAA AAAGAAAAAA TCGGTAACGG TACTCGATGT 2880
CGGCGACGCG TATTTTTCGG TTCCGCTCGA CGAAGACTTC CGGAAGTATA CGGCGTTTAC 2940
GATACCGTCG ATAAACAACG AGACGCCGGG GATTCGATAT CAGTACAACG TGCTTCCGCA 3000
GGGATGGAAA GGATCGCCGG CGATATTCCA ATCGTCGATG ACGAAAATCC TCGAGCCGTT 3060
TCGAAAACAA AATCCGGACA TCGTTATCTA TCAATACATG GACGATTTGT ACGTCGGATC 3120
GGACCTCGAA ATCGGGCAGC ATCGAACGAA AATCGAGGAG CTGCGACAAC ATCTGTTGCG 3180
GTGGGGACTT ACGACGCCGG ACAAAAAACA TCAGAAAGAA CCGCCGTTCC TTTGGATGGG 3240
TTACGAACTC CATCCGGATA AATGGACGGT ACAGCCGATC GTGCTGCCGG AAAAAGACTC 3300
GTGGACGGTC AACGACATAC AGAAGCTCGT CGGGAAATTG AATTGGGCGT CGCAGATTTA 3360
CCCGGGGATT AAAGTACGGC AATTATGTAA ACTCCTTCGC GGAACGAAAG CGCTAACGGA 3420
AGTAATACCG CTAACGGAAG AAGCGGAGCT CGAACTCGCG GAAAACCGCG AGATTCTAAA 3480
AGAACCGGTA CACGGCGTGT ATTACGACCC GTCGAAAGAC TTAATCGCGG AAATACAGAA 3540
GCAGGGGCAA GGCCAATGGA CGTATCAAAT TTATCAAGAG CCGTTTAAAA ATCTGAAAAC 3600
GGGAAAATAC GCGCGCATGC GGGGCGCGCA CACGAACGAC GTAAAACAAT TAACGGAGGC 3660
GGTGCAAAAA ATAACGACGG AATCGATCGT AATATGGGGA AAGACGCCGA AATTTAAACT 3720
GCCGATACAA AAGGAAACGT GGGAAACGTG GTGGACGGAG TATTGGCAAG CGACGTGGAT 3780
TCCGGAGTGG GAGTTCGTTA ATACGCCGCC GCTCGTGAAA TTATGGTACC AGCTCGAGAA 3840
AGAACCGATC GTCGGCGCGG AAACGTTCTA CGTCGACGGC GCGGCGAACC GCGAGACGAA 3900
ACTCGGAAAA GCGGGATACG TTACGAATCG CGGACGCCAA AAAGTCGTCA CGCTAACGGA 3960
CACGACGAAT CAGAAGACGG AGTTACAAGC GATTTATCTC GCGTTGCAGG ATTCGGGACT 4020
CGAAGTAAAC ATCGTAACGG ACTCGCAATA CGCGTTAGGA ATCATTCAAG CGCAACCGGA 4080
TCAATCGGAA TCGGAGTTAG TCAATCAAAT AATCGAGCAG TTAATAAAAA AGGAAAAGGT 4140
CTATCTCGCG TGGGTACCGG CGCACAAAGG AATCGGCGGA AACGAACAAG TCGATAAATT 4200
AGTCTCGGCG GGAATCCGGA AAGTACTATT TTTAGACGGA ATCGATAAGG CGCAAGACGA 4260
ACACGAGAAA TATCACTCGA ATTGGCGCGC GATGGCGTCG GATTTTAACC TGCCGCCGGT 4320
CGTCGCGAAA GAAATCGTCG CGTCGTGCGA TAAATGTCAG CTAAAAGGCG AAGCGATGCA 4380
CGGACAAGTC GACTGTTCGC CGGGAATATG GCAACTCGAT TGTACGCATT TAGAAGGAAA 4440
AGTTATCCTC GTCGCGGTTC ACGTCGCGTC GGGATATATC GAAGCGGAAG TTATTCCGGC 4500
GGAAACGGGG CAGGAAACGG CGTATTTTCT TTTAAAATTA GCGGGACGAT GGCCCGTAAA 4560
AACGATACAT ACGGACAATG GCTCGAATTT CACCGGCGCG ACGGTTCGCG CGGCGTGTTG 4620
GTGGGCGGGA ATCAAGCAGG AATTCGGAAT TCCGTACAAT CCGCAATCGC AAGGCGTCGT 4680
CGAATCGATG AATAAAGAAT TAAAGAAAAT TATCGGACAG GTACGCGATC AGGCGGAACA 4740
TCTTAAGACG GCGGTACAAA TGGCGGTATT CATCCACAAT TTTAAACGAA AAGGCGGGAT 4800
TGGCGGGTAC TCGGCGGGCG AACGAATCGT CGACATAATC GCGACGGACA TACAAACGAA 4860
AGAATTACAA AAACAAATTA CGAAAATTCA AAATTTTCGC GTTTATTACC GCGACTCGCG 4920
AAATTCGCTT TGGAAAGGAC CGGCGAAGCT CCTCTGGAAA GGCGAAGGCG CGGTCGTAAT 4980
ACAAGATAAT TCGGACATAA AAGTCGTGCC GCGACGAAAA GCGAAGATCA TTCGCGATTA 5040
TGGAAAACAG ATGGCAGGTG ATGATTGTGT GGCAAGTAGA CAGGATGAGG ATTCGCACGT 5100
GGAAATCGCT CGTAAAACAC CATATGTACG TTTCGGGGAA AGCGCGCGGA TGGTTTTATC 5160
GCCATCACTA CGAATCGCCG CATCCGCGCA TATCGTCGGA AGTACACATC CCGCTCGGGG 5220
ATGCGCGCCT CGTAATAACG ACGTATTGGG GTCTGCATAC GGGCGAACGC GACTGGCATC 5280
TCGGTCAGGG CGTCTCGATC GAATGGCGCA AAAAGCGCTA TTCGACGCAA GTCGACCCGG 5340
AACTCGCGGA CCAACTAATT CATCTGTATT ACTTCGACTG TTTTTCGGAC TCGGCGATAC 5400
GCAAGGCGTT ACTCGGACAC ATCGTTTCGC CGCGCTGCGA ATATCAAGCG GGACATAACA 5460
AGGTCGGATC GCTACAATAC CTCGCGCTCG CGGCGTTAAT AACGCCGAAA AAGATAAAGC 5520
CGCCGTTGCC GTCGGTTACG AAACTGACGG AGGATCGATG GAACAAGCCC CAGAAGACCA 5580
AGGGCCACAG AGGGAGCCAC ACAATGAATG GACACTAGAG CTTTTAGAGG AGCTTAAGAA 5640
CGAAGCGGTT CGCCATTTTC CGCGCATTTG GCTCCACGGC TTAGGGCAAC ATATCTACGA 5700
AACGTATGGG GATACGTGGG CGGGCGTCGA AGCGATAATA AGAATTCTGC AACAACTGCT 5760
GTTTATCCAT TTTCAGAATT GGGTGTCGAC GTAGCAGAAT AGGCGTTACT CGACAGAGGA 5820
GAGCAAGAAA TGGAGCCAGT AGATCCTAGA CTAGAGCCCT GGAAGCATCC AGGAAGTCAG 5880
CCTAAAACTG CTTGTACCAA TTGCTATTGT AAAAAGTGTT GCTTTCATTG CCAAGTTTGT 5940
TTCATAACAA AAGCCTTAGG CATCTCCTAT GGCAGGAAGA AGCGGAGACA GCGACGAAGA 6000
GCTCATCAGA ACAGTCAGAC TCATCAAGCT TCTCTATCAA AGCAGTAAGT AGTACATGTA 6060
ACGCAACCTA TACCAATAGT AGCAATAGTA GCATTAGTAG TAGCAATAAT AATAGCAATA 6120
GTTGTGTGGT CCATAGTAAT CATAGAATAT AGGAAAATAT TAAGACAAAG AAAAATAGAC 6180
AGGTTAATTG ATAGACTAAT AGAAAGAGCA GAAGACAGTG GCAATGCGAG TGAAGGAGAA 6240
ATATCAGCAC TTGTGGCGAT GGGGGTGGCG ATGGGGCACG ATGCTCCTCG GGATGTTGAT 6300
GATCTGTTCG GCTACGGAAA AATTGTGGGT CACGGTCTAT TACGGCGTAC CGGTGTGGAA 6360
GGAAGCGACG ACGACGCTAT TTTGCGCGTC GGACGCGAAA GCGTACGATA CGGAGGTACA 6420
TAACGTTTGG GCGACGCATG CGTGCGTACC GACGGACCCG AACCCGCAAG AAGTCGTACT 6480
CGTAAACGTG ACGGAAAATT TCGACATGTG GAAAAACGAC ATGGTCGAAC AGATGCATGA 6540
GGATATAATC TCGTTATGGG ATCAATCGCT AAAGCCGTGC GTAAAATTAA CGCCGCTCTG 6600
CGTTTCGTTA AAGTGCACGG ATTTGAAGAA TGATACGAAT ACGAATTCGT CGTCGGGGCG 6660
AATGATAATG GAGAAAGGCG AGATAAAAAA CTGCTCGTTC AATATCTCGA CGTCGATACG 6720
CGGTAAGGTG CAGAAAGAAT ACGCGTTTTT TTATAAACTC GATATAATAC CGATCGATAA 6780
CGATACGACG TCGTATTCGT TGACGTCGTG TAACACGTCG GTCATTACGC AGGCGTGTCC 6840
GAAGGTATCG TTCGAGCCGA TTCCGATACA TTATTGTGCG CCGGCGGGTT TCGCGATTCT 6900
AAAATGTAAT AATAAGACGT TCAACGGAAC GGGACCGTGT ACGAACGTCT CGACGGTACA 6960
ATGTACGCAC GGAATTCGGC CGGTCGTATC GACGCAACTG CTGTTAAACG GCTCGCTCGC 7020
GGAAGAAGAG GTCGTAATTC GATCGGTCAA TTTCACGGAC AACGCGAAAA CGATAATCGT 7080
ACAGCTGAAC ACGTCGGTCG AAATTAATTG TACGCGACCG AACAACAATA CGCGAAAACG 7140
AATCCGTATC CAGCGCGGAC CGGGGCGCGC ATTCGTTACG ATCGGAAAAA TCGGAAATAT 7200
GCGACAAGCG CATTGTAACA TTTCGCGCGC GAAATGGAAT AACACGTTAA AACAGATCGA 7260
TTCGAAATTA CGCGAACAAT TCGGAAATAA TAAAACGATA ATCTTTAAGC AATCGTCGGG 7320
CGGCGACCCG GAAATCGTAA CGCACTCGTT TAATTGTGGC GGCGAATTTT TCTACTGTAA 7380
TTCGACGCAA CTGTTTAATT CGACGTGGTT TAATTCGACG TGGTCGACGG AAGGGTCGAA 7440
TAACACGGAA GGATCGGACA CGATCACGCT CCCGTGCCGA ATAAAACAAA TTATAAACAT 7500
GTGGCAGAAA GTCGGAAAAG CGATGTACGC GCCGCCGATC TCGGGACAAA TTCGATGTTC 7560
GTCGAATATT ACGGGGCTGC TATTAACGCG CGACGGCGGT AATTCGAACA ACGAGTCCGA 7620
GATCTTCCGA CTCGGCGGCG GCGATATGCG CGACAATTGG CGATCGGAAT TATATAAATA 7680
TAAAGTCGTA AAAATCGAAC CGCTCGGCGT CGCGCCGACG AAGGCGAAGC GACGCGTCGT 7740
GCAGCGCGAA AAACGCGCGG TCGGAATCGG CGCGTTGTTC CTCGGGTTCC TCGGCGCGGC 7800
CGGATCGACG ATGGGCGCGG CGTCGATGAC GCTGACGGTA CAGGCGCGAC AATTATTGTC 7860
GGGTATCGTG CAGCAGCAGA ACAATTTGCT GCGCGCTATC GAGGCGCAAC AGCATCTGTT 7920
GCAACTCACG GTCTGGGGCA TCAAGCAGCT CCAAGCGCGA ATCCTCGCGG TCGAACGATA 7980
CCTAAAGGAT CAACAGCTCC TCGGGATTTG GGGTTGCTCG GGAAAACTCA TTTGCACGAC 8040
GGCGGTGCCG TGGAATGCGT CGTGGTCGAA TAAATCGCTC GAACAGATCT GGAATCACAC 8100
GACGTGGATG GAGTGGGACC GCGAAATTAA CAATTACACG TCGTTAATAC ACTCGTTAAT 8160
TGAAGAATCG CAAAACCAGC AAGAAAAGAA TGAACAAGAA TTACTCGAAC TCGATAAATG 8220
GGCGTCGTTG TGGAATTGGT TTAACATAAC GAATTGGCTG TGGTATATAA AATTATTCAT 8280
AATGATCGTC GGCGGCCTCG TCGGTTTACG AATCGTTTTC GCGGTACTTT CGATCGTGAA 8340
TCGCGTTCGG CAGGGATATT CGCCGTTATC GTTTCAGACC CACCTCCCAA TCCCGAGGGG 8400
ACCCGACAGG CCCGAAGGAA TAGAAGAAGA AGGTGGAGAG AGAGACAGAG ACAGATCCAT 8460
TCGATTAGTG AACGGATCCT TGGCACTTAT CTGGGACGAT CTGCGGAGCC TGTGCCTCTT 8520
CAGCTACCAC CGCTTGAGAG ACTTACTCTT GATTGTAACG AGGATTGTGG AACTTCTGGG 8580
ACGCAGGGGG TGGGAAGCCC TCAAATATTG GTGGAATCTC CTACAGTATT GGAGTCAGGA 8640
ACTAAAGAAT AGTGCTGTTA GCTTGCTCAA TGCCACAGCC ATAGCAGTAG CTGAGGGGAC 8700
AGATAGGGTT ATAGAAGTAG TACAAGGAGC TTGTAGAGCT ATTCGCCACA TACCTAGAAG 8760
AATAAGACAG GGCTTGGAAA GGATTTTGCT ATAAGATGGG CGGCAAGTGG TCGAAATCGT 8820
CGGTGATTGG ATGGCTTACG GTACGCGAAC GCATGCGCCG CGCCGAGCCG GCGGCGGACG 8880
GCGTCGGCGC CGCGTCGCGC GACCTGGAAA AACACGGCGC GATCACGTCG TCGAACACGG 8940
CGGCGACGAA CGCGGCGTGC GCGTGGCTCG AAGCGCAAGA GGAGGAGGAG GTCGGTTTTC 9000
CGGTCACGCC GCAGGTACCG TTACGCCCGA TGACGTACAA GGCGGCGGTC GATCTTTCGC 9060
ACTTTTTAAA AGAAAAGGGC GGACTCGAAG GGCTAATTCA CTCGCAACGC CGCCAAGATA 9120
TCCTCGATCT GTGGATCTAC CACACGCAAG GCTACTTCCC GGATTGACAG AACTACACAC 9180
CAGGGCCAGG GGTCAGATAT CCACTGACCT TTGGATGGTG CTACAAGCTA GTACCAGTTG 9240
AGCCAGATAA GATAGAAGAG GCCAATAAAG GAGAGAACAC CAGCTTGTTA CACCCTGTGA 9300
GCCTGCATGG GATGGATGAC CCGGAGAGAG AAGTGTTAGA GTGGAGGTTT GACAGCCGCC 9360
TAGCATTTCA TCACGTGGCC CGAGAGCTGC ATCCGGAGTA CTTCAAGAAC TGCTGACATC 9420
GAGCTTGCTA CAAGGGACTT TCCGCTGGGG ACTTTCCAGG GAGGCGTGGC CTGGGCGGGA 9480
CTGGGGAGTG GCGAGCCCTC AGATCCTGCA TATAAGCAGC TGCTTTTTGC CTGTACTGGG 9540
TCTCTCTGGT TAGACCAGAT CTGAGCCTGG GAGCTCTCTG GCTAACTAGG GAACCCACTG 9600
CTTAAGCCTC AATAAAGCTT GCCTTGAGTG CTTCAAGTAG TGTGTGCCCG TCTGTTGTGT 9660
GACTCTGGTA ACTAGAGATC CCTCAGACCC TTTTAGTCAG TGTGGAAAAT CTCTAGCA 9718