减毒病毒及其制备方法.pdf

摘要
申请专利号：	CN95196131.4	申请日：	1995.10.05
公开号：	CN1169161A	公开日：	1997.12.31
当前法律状态：	驳回	有效性：	无权
法律详情：	发明专利申请公布后的驳回\|\|\|\|\|\|公开
IPC分类号：	C12N15/86; A61K39/21; A61K35/76; C12N7/04; C12Q1/70; C12N5/10	主分类号：	C12N15/86; A61K39/21; A61K35/76; C12N7/04; C12Q1/70; C12N5/10
申请人：	东卡罗来纳大学;
发明人：	J·W·尼瑟
地址：	美国北卡罗来纳
优先权：	1994.10.07 US 08/319,974
专利代理机构：	中国国际贸易促进委员会专利商标事务所	代理人：	张闽
PDF下载：	PDF下载

内容摘要

披露了自然界所没有的减毒病毒，与相应的野生型病毒相比，在这种病毒的基因组中含有一个或几个额外的甲基化位点。最好是通过沉默突变的方式将一个额外的CG片段引入所述病毒的基因组，从而将甲基化位点加入该基因组中。所述减毒病毒可用于产生免疫反应，包括在动物体内产生用于诊断的抗体，和在受治对象体内诱发保护性免疫。还披露了制备所述减毒病毒的药物配方和方法。

权利要求书

1.一种自然界所没有的减毒病毒，与相应的野生型病毒相比，该病
毒的基因组中至少含有一个额外的甲基化位点。
2.如权利要求1的减毒病毒，所述病毒包括一个含有所述基因组的
病毒衣壳。
3.如权利要求1的减毒病毒，与相应的野生型病毒相比，其含有至
少10个额外的甲基化位点。
4.如权利要求1的减毒病毒，与相应的野生型病毒相比，其含有至
少100个额外的甲基化位点。
5.如权利要求1的减毒病毒，其中所述甲基化位点是CG片段。
6.如权利要求1的减毒病毒，其中所述病毒是DNA病毒。
7.如权利要求1的减毒病毒，其中所述病毒是逆转录病毒。
8.如权利要求1的减毒病毒，其中所述病毒选自以下逆转录病毒：
B型逆转录病毒、C型逆转录病毒、D型逆转录病毒、慢病毒、T细胞
白血病病毒和起泡病毒(foamy virus)。
9.如权利要求1的减毒病毒，其中所述病毒是HIV-1。
10.如权利要求1的减毒病毒，其中所述病毒是SIV。
11.如权利要求1的减毒病毒，其中所述病毒是HTLV-1。
12.如权利要求1的减毒病毒，其中所述病毒是逆转录病毒，其中
包括一个减毒的缺失突变。
13.一种编码权利要求1的病毒的DNA。
14.一种含有权利要求13的DNA的表达载体。
15.如权利要求14的表达载体，其中该表达载体是杆状病毒。
16.一种宿主细胞，它含有权利要求13的DNA并能够表达所编码的
病毒，该宿主细胞不会将所述DNA甲基化到足以使其所编码的病毒基因
组的表达失活的程度。
17.如权利要求16的宿主细胞，用一种甲基化抑制剂处理该宿主细
胞可以使其失去将DNA甲基化的能力。
18.如权利要求17的宿主细胞，其中所述甲基化抑制剂是5-氮脱
氧胞苷或5-氮胞苷。
19.一种药物配方，包括权利要求1的病毒及一种可以药用的载体。
20.如权利要求19的配方，其中该配方是口服配方。
21.如权利要求19的配方，其中该配方是肠胃外注射用疫苗配方。
22.如权利要求19的配方，其中该配方是吸入配方。
23.一种在受治对象体内产生免疫反应的方法，包括给所述对象服用
权利要求1的病毒，其用量为能在所述对象体内有效产生免疫反应。
24.如权利要求23的方法，其中所述服用步骤是通过给所述对象口
服所述病毒而实现的。
25.如权利要求23的方法，其中所述服用步骤是通过给所述对象肠
胃外注射所述病毒而实现的。
26.如权利要求23的方法，其中所述对象是动物。
27.如权利要求23的方法，其中所述对象是人。
28.一种制备自然界所没有的减毒病毒的方法，与相应的野生型病毒
相比，该病毒基因组中含有至少一个额外的甲基化位点；所述方法包括
以下步骤：
提供一种含有一种表达载体的宿主细胞，所述表达载体含有编码所
述减毒病毒的DNA，所述宿主细胞不能将所述DNA甲基化到足以使其
所编码的病毒基因组的表达失活的程度；以及
在所述宿主细胞中表达所述减毒病毒。
29.如权利要求28的方法，所述病毒基因组与相应的野生型病毒相
比含有至少10个额外的甲基化位点。
30.如权利要求28的方法，其中所述病毒是DNA病毒。
31.如权利要求28的方法，其中所述病毒是一种逆转录病毒。
32.如权利要求28的方法，其中所述表达载体是杆状病毒。
33.如权利要求28的方法，其中所述宿主细胞是昆虫细胞。
34.如权利要求28的方法，其中所述宿主细胞是哺乳动物细胞。
35.一种用于区别(i)一种自然界所没有的减毒病毒，与相应的野
生型病毒相比，它含有至少一个额外的甲基化位点；和(ii)所述相应
的野生型病毒的寡核苷酸探针，该寡核苷酸探针选自：
(a)在相同的杂交条件下，能选择性地与上述(i)的减毒病毒
的核酸杂交，但不能与上述(ii)的野生型病毒的核酸杂交的寡核苷酸
探针；和
(b)在相同的杂交条件下，能选择性地与上述(ii)的野生型病
毒的核酸杂交，但不能与上述(i)的减毒病毒的核酸杂交的寡核苷酸探
针。
36.如权利要求35的寡核苷酸探针，与一种可检测到的基团缀合。
37.如权利要求35的寡核苷酸探针，其中所述探针是一种PCR延
伸引物。

说明书

减毒病毒及其制备方法

本发明的完成获得了政府的支持，从国立癌症研究所(National
Cancer Institute)取得了授权号为R01 CA47217的政府基金。政府拥
有本发明的某些权利。

本申请涉及可用作疫苗的单重或多重减毒的病毒，其中，所使用的
减毒方法是：在特定病毒的基因组中形成额外的DNA甲基化位点，这些
额外位点(1)不影响该病毒的氨基酸序列，(2)使宿主细胞对该病
毒基因组表达的控制得到改善。

目前，尚没有能有效抗人逆转录病毒感染的疫苗，仅有的一种只能
用于动物(猫白血病病毒)。现在正对各种方法进行研究，以期开发出
能有效抗病毒的疫苗，包括亚单位疫苗和完整或部分病毒疫苗，所述病
毒如人免疫缺损病毒(HIV)和猴免疫缺损病毒(SIV)。潜在HIV
-1疫苗的临床试验几乎全部失败；用肽疫苗(HIV-1蛋白的小片段，
通常为糖蛋白包壳)或灭活的变性病毒在很多受试对象上所做的试验也
均告失败。

对人以外的灵长目动物所做的研究表明，从SIV上除去nef基因后
可用于对猴进行免疫，免疫以后可以抗SIV的二次攻击。一个自然实验
似乎表明，除去nef基因可以生成用于人体的有效的活的减毒疫苗。有一
类人已被确诊感染HIV长达10年以上，但仍未出现发展成AIDS的迹
象。提取感染这些人的病毒并进行序列分析，结果发现这种特殊的HIV
菌株在nef基因座位上发生了自发突变；就是说，nef基因发生了自发缺
失。我们在本文中披露了一种对用于疫苗中的病毒进行减毒的方法，所
述病毒的基因组是宿主细胞DNA甲基化的目标。

本发明基于以下发现：与其它二核苷酸相比，在HIV-1进化过程
中DNA甲基化位点优先丢失，其丢失速度远高于宿主基因的丢失速度。
在DNA病毒和某些RNA病毒中也会出现甲基化位点的丢失。DNA甲基
化的过程是这样的：DNA上特定胞嘧啶上的5位碳原子被甲基化，生成
5-甲基胞嘧啶。在动物细胞中，大部分甲基化作用发生在CpG二核苷
酸上，即紧邻鸟嘌呤5’端的胞嘧啶上。一般，基因在被甲基化以后，其
在转录时就保持“沉默”-无信使RNA，因此，不能由其产生蛋白质。
本发明以活性形式将沉默突变(即：不影响氨基酸序列的突变)引入病
毒基因组，这种突变可产生正常状态下并不存在的甲基化位点，这种甲
基化作用能够阻止病毒的作用。

因此，本发明的第一方面是一种自然界所没有的减毒病毒(或“改
性病毒”)，与相应的野生型病毒相比其带有至少一个额外的甲基化位
点，该位点是通过突变引入所述病毒的基因组的。

本发明的第二方面是一种编码上述病毒的DNA(例如，编码一种
病毒的cDNA)，以及带有该DNA的一种载体(如一种表达载体)。

本发明的第三方面是一种药物配方，包括一种如上文所述的病毒及
一种可以药用的载体。该配方既可用于在动物体内产生能与所述病毒特
异结合的抗体，又可用于在人和动物上检测所述病毒的诊断分析和其它
方法；该配方还可用作疫苗配方，用于在动物或人的受治对象上产生抗
该病毒的保护性免疫。

本发明的第四个方面是一种在受治对象上产生免疫反应(例如，产
生抗体和/或产生保护性免疫)的方法。该方法包括给受治对象服用如上
所述的病毒，服用量能在受治对象体内有效产生免疫反应。

本发明的第五个方面是将上述病毒用于制备一种药品的用途，该药
品可用于在受治对象体内产生免疫反应，如上文所述。

本发明的第六个方面是一种制备如上所述的减毒病毒的方法。该方
法包括提供一种含有一种表达载体的宿主细胞，该表达载体含有编码所
述减毒病毒的DNA，该宿主细胞不能充分把所述DNA甲基化，以阻止
该病毒DNA的表达；还包括在所述宿主细胞中表达所述减毒病毒。一般，
所提供的所述宿主细胞是在合适的培养基中，表达以后再从培养基中收
集病毒(必要时裂解宿主细胞)，要么将所述培养基直接用于在受治对
象上产生免疫反应，要么将从培养基中收集和/或纯化的病毒与其它成分
混合后制成药物配方。

在以下说明中将对本发明的以上及其它目的和方面作详细说明。

图1表示CpG插入的逆转录病毒基因组生活周期的中断。

图2表示HIV-1菌株HIVHX2CG的CpG含量(F.Wong-Staal
等，Nature 313，277-284(1985))。

图3表示本发明的菌株HIV-1^CpG1的HIV-1基因组(序列1)
的CpG含量。

对HIV-1基因组(HIV-1^CpG1)按本文所述方法进行修饰，仅
示出了其一条链的核苷酸序列，从左至右为5’→3’方向。本文中所给出
的核苷酸和氨基酸是以IUPAC-IUB生化命名协会(Biochemical
Nomenclature Commission)推荐的方法书写的，见37 CFR § 1.822
和已确立的用法，或以3字母密码形式出现(用于氨基酸)。例如，参
见Patent In User Manual，99-102(1990年11月)(美国专利商标局)。
在核苷酸序列中，核苷酸间的磷酸键有时用“p”表示，其位于表示核
苷酸的标准单个大写字母之间，如“CpG”表示5’-CG-3’。
1.病毒

本发明病毒一般是表达缺陷型病毒。就是说为了生产这种病毒，可
将该病毒基因组或编码该病毒基因组的DNA引入一种宿主细胞，该宿主
细胞不会充分将所述病毒DNA甲基化以使其失活。因此，该病毒基因组
可以在这样的宿主细胞中转录成RNA，该RNA又被翻译成病毒蛋白，
并产生包壳的病毒基因组(病毒颗粒)。为了在动物或人的受试对象上
产生免疫反应，靶细胞在这种情况下对病毒基因组进行甲基化，以便抑
制该病毒基因组的甲基化敏感过程，如转录。因此，本发明可用任何病
毒进行，包括DNA病毒、RNA病毒和逆转录病毒，其中，所用病毒的
基因组在服用了该病毒的受治对象的细胞内被甲基化。特别推荐逆转录
病毒。在图1中示出了一种逆转录病毒的生活周期的示意图，并说明CpG
插入的逆转录病毒基因组是如何中断其生活周期的。如图1所示，由粗
线表示的生活周期的各个时期在CpG插入的逆转录病毒中中断。

可用于实现本发明的逆转录病毒包括动物和人的逆转录病毒。这组
逆转录病毒既包括简单逆转录病毒，也包括复合逆转录病毒。简单逆转
录病毒包括B型逆转录病毒、C型逆转录病毒和D型逆转录病毒的亚
组。B型逆转录病毒的例子之一是小鼠乳腺瘤病毒(MMTV)。C型
逆转录病毒包括亚组C型组A(包括Rous肉瘤病毒(RSV)、禽白血
病病毒(ALV)和禽成髓细胞性白血病病毒(AMV)和C型组B(包
括小鼠白血病病毒(MLV)、猫白血病病毒(FeLV)、小鼠肉瘤病毒
(MSV)、长臂猿白血病病毒(GALV)、脾坏死病毒(SNV)、网
状内皮组织增殖病毒(RV)和猴肉瘤病毒(SSV))。D型逆转录病
毒包括Mason-Pfizer猴病毒(MPMV)和l型猴逆转录病毒(SRV-
1)。复合逆转录病毒包括慢病毒(lentiviruses)、T细胞白血病病毒
和起泡病毒(foamy viruses)的亚组。慢病毒包括HIV-1，还包括
HIV-2、SIV、绵羊髓鞘脱落病毒、猫免疫缺损病毒(FIV)和马传
染性贫血病毒(EIAV)。T细胞白血病病毒包括HTLV-1、HTLV
-II、猴T细胞白血病病毒(STLV)，和牛白血病病毒(BLV)。
起泡病毒包括人起泡病毒(HFV)、猴起泡病毒(SFV)和牛起泡病
毒(BFV)。上述病毒是说明性的，其目的并非是要限定可用于实现本
发明的逆转录病毒。

可用于实现本发明的其它RNA病毒的例子包括，但不限于以下成
员：呼肠病毒科的成员，包括正呼肠病毒属(哺乳动物和禽逆转录病毒
的多种血清型)、环状病毒属(蓝舌病毒、Eugenangee病毒、Kemerovo
病毒、非洲马病病毒、和科罗拉多蜱热病毒)、轮状病毒属(人轮状病
毒、内布拉斯加牛腹泻病毒、鼠轮状病毒、猿轮状病毒、牛或羊轮状病
毒、禽轮状病毒)；微小RNA病毒科的成员，包括肠病毒属(脊髓灰质
炎病毒、Coxsackie病毒A和B、人肠道致细胞孤(ECHO)病毒、甲
型肝炎病毒、猴肠病毒、鼠脑炎髓炎(ME)病毒、鼠脊髓灰质炎病毒、
牛肠病毒、猪肠病毒)、心脏病毒属(脑心肌炎病毒(EMC)、门果病
毒)、鼻病毒属(人鼻病毒-至少有113个亚型；其它鼻病毒)、Apthovirus
属(口碲疫病毒(FMDV))；钙化病毒科(Calciviridae)，包括猪
泡囊疹病病毒、San Miguel海狮病毒、猫微小RNA病毒和Norwalk病
毒；披膜病毒科，包括α病毒属(东方马脑炎病毒、Semliki森林病毒、
Sindbis病毒、Chikungunya病毒、O’Nyong-Nyong病毒、Ross河病
毒、Venezuelan马脑炎病毒、西方马脑炎病毒)、黄病毒属(蚊传黄热
病毒、Dengue病毒、日本脑炎病毒、圣路易斯脑炎病毒、Murray Valley
脑炎病毒、West Nile病毒、Kunjin病毒、中欧蜱传病毒、远东蜱传病
毒、Kyasanur森林病毒、Louping III病毒、Powassan病毒、Omsk
出血热病毒)、风疹病毒属(风疹病毒)、瘟疫病毒属(粘膜病毒、猪
瘟病毒、Border病病毒)；布尼亚病毒科，包括布尼病毒属(布尼奥罗
病毒及相关病毒、加利福里亚脑炎组病毒)、Phlebovirus属(白蛉热西
西里亚病毒、Rift Valley热病毒)、Nairovirus属(Crimean-Congo
出血热病毒、内罗比绵羊病病毒)和Uukuvirus属(Uukuniemi及相关
病毒)；正粘液病毒科，包括流感病毒属(甲型流感病毒(很多种人的
亚型)；猪流感病毒，和禽及马流感病毒；和丙型流感病毒(可能为另
一属)；副粘液病毒科，包括副粘液病毒属(1型副流感病毒、Sendai
病毒、血吸病毒、2-5型副流感病毒、新城病病毒、流行性腮腺炎病
毒)、麻疹病毒属(麻疹病毒、亚急性硬化性全脑炎病毒、瘟热病毒、
牛瘟病毒、肺病毒属(呼吸道合胞病毒(RSV)、牛呼吸道合胞病毒和
小鼠肺炎病毒)；棒状病毒科，包括囊炎病毒(VSV)属、Chandipura
病毒、Flanders-Hart Park病毒)、狂犬病毒属(狂犬病毒)、鱼棒状
病毒的两个属、和两种可能的棒状病毒(Marburg病毒和Ebola病毒)；
沙粒病毒科，包括淋巴细胞性脉络丛脑膜炎病毒(LMC)病毒、
Tacaribe病毒复合体，和拉沙病毒；冠状病毒科，包括传染性支气管炎
病毒(IBV)、小鼠肝炎病毒、人肠冠状病毒和猫传染性腹膜炎病毒(猪
冠状病毒)。

可用于实现本发明的DNA病毒的例子包括，但不限于以下成员：
痘病毒科，包括正痘病毒属(重型天花、轻型天花、猴牛痘、牛痘、水
牛痘、兔痘、缺肢畸形)、Leporipoxvirus属(粘液瘤、纤维瘤)、禽
痘病毒属(鸟痘、其它禽痘)、羊痘病毒属(绵羊痘、山羊痘)、Suipoxvirus
属(猪痘)、类痘病毒属(接触型继发皮炎病毒、假牛痘、牛丘疹口炎
病毒)；虹彩病毒科(非洲猪热病毒、蛙病毒2和3、鱼淋巴囊肿病毒)；
疱疹病毒科，包括α疱疹病毒(1型和2型单纯疱疹病毒、水痘-带状
疱疹病毒、马流产病毒、马疱疹病毒2和3、假狂犬病毒、传染性牛角
膜结膜炎病毒、传染性牛鼻气管炎病毒、猫鼻气管炎病毒、传染性喉气
管炎病毒)；β疱疹病毒(人巨细胞病毒和猪、猴及啮齿动物巨细胞病
毒)；γ疱疹病毒(EB病毒、Marek’s病病毒、Herpes Saimiri、
Herpesvirus ateles、Herpesvirus sylvilagus、豚鼠疱疹病毒、Lucke
肿瘤病毒)；腺病毒科，包括乳腺病毒属(人的A、B、C、D、E
亚组及未分组的乳腺病毒)；猴腺病毒(至少23个血清型)，传染性犬
肝炎，和牛、猪、绵羊、蛙和其它种的腺病毒、禽腺病毒属(禽腺病毒)；
和不可培养的腺病毒；乳多空病毒科，包括乳头瘤病毒属(多种亚型的
人乳头瘤病毒、牛乳头瘤病毒、Shope兔乳头瘤病毒、和其它种的各种
病原性乳头瘤病毒)、多瘤病毒属(多瘤病毒、猴病毒40(SV-40)、
兔空泡形成剂(RKV)、K病毒、BK病毒、JC病毒，及其它灵长类
多瘤病毒，如亲淋巴性乳头瘤病毒；细小病毒科，包括腺病毒相关病毒
属，细小病毒属(猫Panleukopenia病毒、牛细小病毒、犬细小病毒、
Aleutian水貂病病毒等)。最后，DNA病毒还可以包括不属于上述各科
的病毒：Kuru，克雅氏病病毒和慢性传染性神经病病毒(CHINA病毒)。
2.引入减毒突变

本文所说的“减毒病毒”是指受该病毒感染的易感宿主发病的可能
性降低(丧失毒力)，符合本领域标准命名法。例如，参见B.Davis，R.
Dulbecco，H.Eisen，和H.Ginsberg，Microbiology，132(第3版，
1980)。减毒突变是指使一种病毒成为不再能致病的减毒病毒的突变。
本发明病毒是减毒病毒，在易感宿主中该病毒的生活周期在逆转录病毒
和DNA病毒的转录水平上受到抑制。对非逆转录病毒的RNA病毒来说，
病毒的生活周期被认为是因RNA基因组功能的丧失而受到抑制的，
RNA基因组功能的丧失是因CpG甲基化所致。

额外甲基化位点是通过上述病毒基因组的突变而引入的，这种突变
能产生本发明的改性病毒，额外甲基化位点的数目取决于突变的位点、
病毒的性质、有或无其它减毒突变(例如，逆转录病毒nef基因的缺失)
等，可以较少(如1，2，或3个)，或至少为10个、50个、100个
或500个或更多。通常，将足够数量的甲基化位点引入病毒基因组，以
使该基因组内实测的与预期的CpG二核苷酸的比例(CpG^o/e)比野生型
病毒高出1、2、3、4、5、6、7或8倍或更高，不过，当采用很少、
但具有特别强的减毒突变效果的甲基化位点时，CpG^o/e不必提高这么
多。

通常，本发明的改性病毒是包括病毒衣壳的病毒颗粒，衣壳中含有
包括病毒基因组的核酸材料(DNA或RNA)，所述病毒颗粒与服用了
该病毒的受治对象体内的靶细胞结合，并将其基因组导入所述细胞。因
此，所述改性病毒至少含有2个或3个减毒突变(通过上述方法引入甲
基化位点或通过其它机理)，以降低所述病毒自发恢复毒力的可能性。

可以用任何合适的方法将本发明的减毒CpG突变引入编码病毒的
cDNA，如直接合成，PCR诱变或定点诱变(例如，可参见Kunkel的
美国专利US 4,873,192)(申请人特别申明，本文所引用的所有专利文
献的公开内容都作为本发明的参考)。

本发明的减毒病毒直接在一台DNA合成仪上生产，这种仪器的应
用在本领域广为人知。具体地讲，靶病毒(如HIV-1)的核酸序列是
经过选择的。然后，对不含CpG的密码子进行扫描，可将这种密码子改
变成含CpG的密码子，同时又不含改变翻译后的氨基酸序列。这样，用
CpG二核苷酸置换了不会CpG的密码子。例如，编码脯氨酸的CCT、
CCC或CCA被转换为CCG。或者，改变相邻的密码子，以使在其相邻
区域含有CpG。例如，可将相邻的密码子GCA GTG(丙氨酸-缬氨酸)
改变为GCC GTG，它仍然编码丙氨酸-缬氨酸，但现已含有可被甲基
化的CpG(第一个密码子的最后一个C和第二个密码子的第一个G)。

当然，某些密码子的种特异性优于其它密码子的。理想的是，通过
筛选可用的最佳密码子的方式产生改变了的基因组(即：生产病毒的宿
主细胞培养系统的优选密码子，和服用该病毒以便产生免疫反应的受治
对象的优选密码子)。

如上所述，本发明的病毒除了包括本文所述的沉默CpG突变之外，
还可包括其它减毒方法。例如，如果必要的话可以包括常见的置换突变，
这种突变可以在其所编码的蛋白质内产生减毒性的氨基酸置换。作为应
用HIV-1的另一种例子，nef基因和其它基因或这些基因的一部分可
以缺失，以产生其减毒突变。

对于诸如HIV-1之类的逆转录病毒来说，该病毒有很多种株，通
过CpG插入对多种HIV-1株进行改性是理想的，同时使用这些改性
的株生产有效的疫苗。

下文披露一种用无义的或“沉默的”CpGs过度取代的新型HIV-
1基因组。“无义的”是指向该基因组中增加CpGs后不会改变所得蛋白
质的氨基酸序列。CpGs的过度取代，使得这种新的合成基因组成为宿
主细胞甲基化酶的目标。因此，尽管由该基因组所编码的病毒能够感染
宿主细胞，但该原病毒基因组易因为甲基化而失活，并永久保持休眠状
态。就是说，达到该基因组能被宿主细胞甲基化的程度，仍保持转录沉
默。

尽管本发明的目的主要在于使用所谓“活”病毒疫苗，但也可以使
用灭活病毒疫苗，包括甲醛和加热灭活的病毒疫苗。本发明可用于这种
疫苗的制备，因为活病毒偶然逃脱灭活处理并能导致感染。因此，本发
明可结合任何其它减毒方法一起使用，以提供进一步的减毒作用。
3.在细胞培养物中生产病毒

表达载体是一种可复制的DNA结构，其中，编码一种或几种蛋白
质的DNA序列可操作地同合适的调节序列连接，该调节序列能控制所述
DNA在合适宿主中的表达。可将一种复制载体用于在无须表达所述DNA
时产生额外的DNA。针对特定载体的宿主细胞选择取决于如下因子：如
是否需要表达或复制。

转化的宿主细胞是指用通过重组DNA技术构建的载体转化或转染
过的细胞。转化的宿主细胞通常能表达DNA，但是为克隆或扩增靶蛋白
目的而转化的宿主细胞不需要表达这种蛋白质。

合适的宿主细胞通常包括原核细胞、酵母细胞或高等真核细胞，如
哺乳动物细胞和昆虫细胞。来自多细胞生物的细胞特别适于作为重组甲
基化病毒的宿主，而昆虫细胞特别理想。这种细胞在细胞培养中的繁殖
已成为一种常规方法(Tissue Culture，Academic Press，Kruse和
Patterson著，1973)。有用的宿主细胞系的例子有CD4+T淋巴细胞，
如MOLT4，VERO和HeLa细胞，中国仓鼠卵巢(CHO)细胞系，
和WI138、BHK、COS-7、CV、和MDCK细胞系。用于这些细
胞的表达载体通常包括(必要的话)一个复制起点，一个启动子(位于
编码待表达的甲基化病毒的DNA上游并与其可操作地连接)，以及一个
核糖体结合位点，一个RNA剪接位点(如果使用含有内含子的基因组
DNA的话)，一个聚腺苷酸化位点，和一段转录终止序列。

当宿主细胞带有以其它方式将病毒基因组甲基化的甲基化系统时，
该甲基化系统必须失活到足于在其中产生病毒的程度。这种失活可用任
何合适方法实现，如使细胞培养基中含有一种脱甲基化剂或甲基化酶抑
制剂，如5-氮胞苷或5-氮脱氧胞苷，其用量足于抑制该甲基化系统
(如1～10μM)；以足于使该甲基化系统失活的量将一种反义寡核
苷酸加入所述培养基中；或通过遗传工程技术使所述细胞表达一种能使
所述甲基化系统失活的反义剂。当通过遗传工程方法将所述反义系统引
入该细胞时，最好使用一种可诱导的表达载体，例如，将该反义寡核苷
酸插在一个启动子如小鼠金属硫蛋白启动子的下游，向组织培养基中添
加一种金属(如镉)，该启动子即可启动寡核苷酸的表达。有众多的可
诱导表达系统为本领域技术人员所熟知。

在一种杆状病毒表达系统中表达型活病毒是特别可行的，该系统用
昆虫细胞作为宿主细胞，并使用昆虫所固有的病毒载体(参见授予Smith
等人的美国专利US4,745,051和4,879,236)。杆状病毒是杆状病毒科、
杆状病毒属的成员。该属包括3个亚组的病毒：核型多角体病毒
(NPV)、颗粒体病毒(GV)、和无包含体病毒。NPVs包括苜蓿银
纹夜蛾(Autographica californica)NPV(AcNPV)、棉铃虫
(Heliothis zea)NPV(HzNPV)和家蚕(Bombyx mori)NPV
(BmNPV)。将重组杆状病毒载体用于在昆虫细胞培养物或幼虫中表
达外源蛋白的应用是已知的。例如，见Luckow & Summers，
Bio/Technology，6，47(1988)；Tomalski & Miller，Nature，352，82
(1991)。将杆状病毒用于本发明中特别有用，因为昆虫宿主细胞(如培养
的草地夜蛾细胞)不具有DNA甲基化酶，因此，不能在转录水平上使病
毒的原病毒DNA失活。一般，杆状病毒表达载体包括一个杆状病毒基因
组，其带有待表达的DNA，该DNA被插入多角体蛋白基因中，位于能
受杆状病毒多角体蛋白启动子的转录控制的位置。

用上述组织培养技术产生的改性病毒，可用诸如超滤之类的技术视
需要进行提纯和/或纯化，然后再与其它成分混合，以形成包含于可以药
用的载体中的改性病毒。
4.药物配方

这里披露一种组合物，其含有由本发明的细胞系所产生的减毒病毒
颗粒。该组合物可以包含任何可以药用的载体(如灭菌的无热原生理盐
水溶液，或灭菌的无热原磷酸缓冲盐溶液)。一般，该组合物是通过将
以上所生产的病毒颗粒与一种可以药用的载体接触并混合而制成的。视
最终用途，该组合物的病毒颗粒可以采用活的、灭活的、固定的或冻干
的形式中最适用的一种。该组合物中含有免疫剂量的病毒颗粒，这一剂
量视用途而定。特定数量本发明病毒的免疫活性，可以用本领域多种公
知方法中的任一种测定。服用后，抗一种特定病毒抗原的抗体效价的增
加可以作为免疫活性的指标。

可以服用本发明所披露的活的减毒病毒和配方的对象包括人体对象
和动物对象(例如，用于灵长目，如枭猴(owl monkey)、绒猴和黑猩
猩的兽医治疗，和用于其它哺乳动物种，如狗、猫、猪和马，及非哺乳
动物种，如鸟类(鸡、火鸡等)的治疗)。

本发明的药用组合物包含有免疫剂量的、在本发明中所披露的活的
减毒病毒，该病毒与一种可以药用的载体结合在一起。“免疫剂量”是
指足以激发服用对象的免疫反应的所述减毒病毒的量。所用的具体剂量
并不重要，它取决于对象的类型和状态、服用途径等。

对于本领域技术人员来说，确定本发明病毒颗粒的具体免疫剂量的
技术是显而易见的。例如，所述活性剂(病毒颗粒或其制剂)的用量可
以为0.01～100μg/kg体重(例如0.5或1.0μg/kg)。

可以用任何合适方法服用本文所披露的活的减毒病毒，包括肠胃外
注射(如腹膜内注射、皮下注射、或肌内注射)、口服、和用表面使用
的方式将该病毒(通常含于药用配方中)用于气道表面。将病毒用于气
道表面的表面使用方法是通过鼻内使用法(例如，用贮有鼻内使用的药
物的滴管、药签或吸入器)实现的。将病毒用于气道表面的表面使用方
法还可以通过吸入法实现，如通过制备含有病毒的可吸入的药物颗粒(包
括固定颗粒和液体颗粒)作为气溶胶悬浮液，然后让对象吸入这种可吸入
的颗粒。用于服用可吸入的药物颗粒的方法和装置众所周知，而且任何
常见技术均可使用。例如，见授予D.Leith的美国专利US5,304,
125；授予C.Davis和R.Snyder的美国专利US 5,299,566；授予R.Fisher
和W.Metzger的美国专利US 5,290,550；以及授予R.Boucher的美国
专利US 5,292,498。

可以通过已知方法用能产生活病毒的细胞培养物制备口服疫苗，所
述病毒含有想要的减毒突变。可给对象服用所述培养物本身；可有选择
地过滤和/或澄清该培养物；可将蔗糖、MgCl₂等之类的稳定剂加入培养
基中。可用于口服的药用载体可以是糖浆、酏剂、锭剂等。可按照已知
技术制备所述疫苗配方，如由R.Purcell等所述的方法(Vaccine Against
Hepatitis A Virus，US 4,894,228)。

尽管上文中对本发明病毒、方法和配方的说明是结合通过服用疫苗
配方以产生保护性免疫的形式进行的，但也可以用于使动物免疫，仅仅
使动物产生抗体，然后收集抗体，用于按照常规诊断技术检测和/或诊断
各种病毒感染或生物样品中病毒颗粒的存在。一般参见E.Maggio，
Enzyme Immunoassay(1980)；同样参见US 4,659,678,US4,376,110,
US4,275,149，US4,233,402和US 4,230,767。
5.寡核苷酸探针

本发明的一个优点是，可用于检测野生型病毒的感染，即使在已接
种之后也行。例如，使用了一种完整或接近完整病毒的疫苗可以产生对
该病毒的免疫反应，从而不能用标准的免疫或核酸检测方法检测随后的
感染。本发明的结构由于代表了在DNA水平上的全新创造，因此，可用
分子探测法方便地加以区分。因此，可以制备对野生型病毒有专一性但
不会与本发明的病毒杂交的探针，而且可以制备特异地结合本发明的病
毒但不能与野生型病毒结合的探针。

因此，本发明的另一方面是一种寡核苷酸探针，可将其用于区分(i)
一种自然界所没有的减毒病毒，与相应的野生型病毒相比，其基因组中
含有至少一个额外的甲基化位点，和(ii)相应的野生型病毒。所述寡核苷
酸探针选自：(a)在相同的杂交条件下，能选择性地与上述(i)的减
毒病毒的核酸杂交，但不能与上述(ii)的野生型病毒的核酸杂交的寡
核苷酸探针；和(b)在相同的杂交条件下，能选择性地与上述(ii)
的野生型病毒的核酸杂交，但不能与上述(i)的减毒病毒的核酸杂交的
寡核苷酸探针。所述探针可以为任何合适的长度，只要具有想要的结合
特异性就行。所述探针的长度通常至少为8～12个核苷酸，也可以高达
20～40个核苷酸或更多。所述探针可以是任何合适的核酸，包括DNA
和RNA。可以通过各种技术，包括直接共价键用一种可检测到的基团(例
如，诸如³²P、¹²⁵I、¹³¹I、³H、¹⁴C或³⁵S之类的放射性同位素；诸如
辣根过氧化物酶或碱性磷酸酶之类的酶)标记或缀合所述探针。所述探
针可以是一个探针或是一对探针中的一员，可用于核酸扩增方法，如聚
合酶链式反应(PCR)、连接酶链式反应(LCR)、或链置换扩增
(SDA)。使用这种探针的技术为本领域技术人员所熟知。例如，参见
授予Falkow和Mosley的美国专利US4,358,535；授予Wahl和Stark的
美国专利US 4,302,204；授予Stavrianopoulos的美国专利US 4,994,373；
授予Walker等的美国专利US,5,270,184；而对于PCR，参见US
4,683,195,US 4,683,202,US4,800,159和US 4,965,188。

下面的非限定性实施例将对本发明做更详细的说明。

例1

在HIV-1基因组中引入CpG位点

HIV-1菌株HIVHXB2CG(见F.Wong-Staal等，Nature，
313，277-284，(1985))的基因组序列获自GENBANK(保藏号K03445)。
确定该序列上可以加入沉默置换突变，以便将额外的CpG片段引入该基
因组的位点，并按以下方法合成一种编码所述HIV-1基因组的非天然
衍生物的新DNA。

通过亚磷酰胺化学法在一台Applied Biosystems Model 394
DNA/RNA合成仪(Applied Biosystem公司，850 Lincoln Centre Drive.
Foster City，加利福里亚，94404，美国)上合成长度为75个碱基的单
链DNA片段。在55℃温度下对每个75bp的双链DNA片段进行脱保护
12小时，并进行干燥，以除去氢氧化铵。在脱保护步骤中保留了三苯甲
游基。然后通过NENSORB^TM层析将完整长度的75bp片段同制剂中较
短的“残缺”片段分开。这样可以起到避免将较短的残缺片段加在较长
的片段上。

制备互补片段，并一起退火，使重叠末端有4个碱基，以产生长度
为75个碱基的双链DNA片段。接着，将每个新的75bp的双链DNA片
段与先前的片段连接，以组成延长的双链DNA片段，其最终成为序列1
所示的完整的修饰HIV-1基因组(HIV-1^CpG-1)。

用常规技术将合适的剪接片段加在所述完整基因组的每个末端，并
将该基因组插入一种表达载体。

比较例A

比较HIV-1菌株HIVHXB2CG和

菌株HIV-1^CpG1中的CpG位点

HIVHXB2CG基因组中的CpG含量在图2中以曲线形式表示。为
清楚起见，将HIV的基因结构也示于该曲线图中。

HIV-1^CpG1基因组的CpG含量由图3中的曲线表示。可以看出，
与图2所示的野生型基因组相比，其CpG含量显著提高。与HIVHXB2CG
相比，HIV-1^CpG1有948个新的CpG位点(表明其CpG片段增加了
10倍以上：HIVHXB2CG中有97个；HIV-1^CpG1中有1045个)。
实测的与预期的CpG二核苷酸的比例(CpG^o/e)由HIVHXB2CG的
CpG^o/e值0.22，提高到HIV-1^CpG-1的CpG^o/e值1.68。这表明CpG^o/e
提高了大约8倍。在极端情况下(例如，有几百个新的CpG甲基化位点
被插入病毒基因组，如实施例中改性的基因组HIV-1^CpG-1)，这将导
致GC/CT之比高于野生型病毒中的GC/CT比。因此，HIV-1^CpG-1的
GC/AT比为1.05，而野生型基因组HIVHXB2CG中这一比例为0.74。
HIV-1^CpG-1与HIVHXB2CG的碱基数的比较如下：

    HIVHXB2CG
    HIV-1^CpG-1
  腺嘌呤
    3411
    2796
  胞嘧啶
    1773
    2197
  鸟嘌呤
    2370
    2772
  胸腺嘧啶
    2164
    1953

可以看出，与HIVHXB2CG相比，HIV-1^CpG-1少了615个腺嘌呤和
211个胸腺嘧啶，但多了424个胞嘧啶和402个鸟嘌呤。在改性的基因组
中，GC/AT之比无显著增加，在这些改性的基因组中仅需插入少量
(如，少于10个)的CpGs以中断其病毒生活周期。HIVHXB2CG的
GC/AT比为0.74；而HIV-1^CpG-1的GC/AT比为1.05。

例2

HIV-1基因组在昆虫细胞中的表达

从Clontech公司(其在美国的电话号码是：415-424-8222)
获取BACKPACK^TM杆状病毒表达系统。将上述例1中的基因组DNA片
段连接在pBacPAK8^TM(或PBacPAK9^TM)的多克隆位点上，形成一种
重组载体，使该基因组DNA的表达受载体上的强AcMNPV多角体蛋白
启动子的控制。用上述重组载体转化培养的草地夜蛾细胞，并按生产商
的说明在培养的细胞中生产本发明的病毒。

以上实施例是用于说明本发明的，并不构成对本发明的限定。本发
明由以下的权利要求进行限定，与这些权利要求相当的内容也落入本发
明的保护范围。

            序列表
(1)一般信息：
(i)申请人：Nyce，Jonathan W.
(ii)发明名称：减毒病毒及其制备方法
(iii)序列数：1
(iv)相关地址：
(A)收件人：Kenneth D.Sibley
(B)街道：邮政信箱34009
(C)市：Charlotte
(D)州：North Carolina
(E)国家：美国
(F)邮编：28234
(v)计算机可读形式：
(A)介质类型：软盘
(B)计算机：IBM PC兼容机
(C)操作系统：PC-DOS/MS-DOS
(D)软件：PatentIn Release#1.0 Version#1.30
(vi)本申请资料：
(A)申请号：US 08/319，974
(B)申请日：07-10-1994
(C)分类号：
(viii)律师/代理人信息：
(A)姓名：Sibley，Kenneth D.
(B)注册号：31,665
(C)文件/档案号：5218-27
(ix)电信信息：
(A)电话：919-881-3140
(B)传真：919-881-3175
(C)电传：575102
(2)序列1的信息：
(i)序列特征：
(A)长度：9718bp
(B)类型：核酸
(C)链型：单
(D)拓扑结构：线性
(ii)分子类型：cDNA
(xi)序列表达：序列1：
TGGAAGGGCT  AATTCACTCC  CAACGAAGAC  AAGATATCCT  TGATCTGTGG  ATCTACCACA          60
CACAAGGCTA  CTTCCCTGAT  TAGCAGAACT  ACACACCAGG  GCCAGGGATC  AGATATCCAC         120
TGACCTTTGG  ATGGTGCTAC  AAGCTAGTAC  CAGTTGAGCC  AGAGAAGTTA  GAAGAAGCCA         180
ACAAAGGAGA  GAACACCAGC  TTGTTACACC  CTGTGAGCCT  GCATGGAATG  GATGACCCGG         240
AGAGAGAAGT  GTTAGAGTGG  AGGTTTGACA  GCCGCCTAGC  ATTTCATCAC  ATGGCCCGAG         300
AGCTGCATCC  GGAGTACTTC  AAGAACTGCT  GACATCGAGC  TTGCTACAAG  GGACTTTCCG         360
CTGGGGACTT  TCCAGGGAGG  CGTGGCCTGG  GCGGGACTGG  GGAGTGGCGA  GCCCTCAGAT         420
CCTGCATATA  AGCAGCTGCT  TTTTGCCTGT  ACTGGGTCTC  TCTGGTTAGA  CCAGATCTGA         480
GCCTGGGAGC  TCTCTGGCTA  ACTAGGGAAC  CCACTGCTTA  AGCCTCAATA  AAGCTTGCCT         540
TGAGTGCTTC  AAGTAGTGTG  TGCCCGTCTG  TTGTGTGACT  CTGGTAACTA  GAGATCCCTC         600
AGACCCTTTT  AGTCAGTGTG  GAAAATCTCT  AGCAGTGGCG  CCCGAACAGG  GACCTGAAAG         660
CGAAAGGGAA  ACCAGAGCTC  TCTCGACGCA  GGACTCGGCT  TGCTGAAGCG  CCCGCACGGC         720
AAGAGGCGAG  GGGCGGCGAC  TGGTGAGTAC  GCCAAAAATT  TTGACTAGCG  GAGGCTAGAA         780
GGAGAGAGAT  GGGCGCGCGC  GCGTCGGTAT  TATCGGGCGG  CGAATTAGAT  CGATGGGAAA         840
AAATTCGGTT  ACGGCCGGGC  GGAAAGAAAA  AATATAAATT  AAAACATATC  GTATGGGCGT         900
CGCGCGAGCT  CGAACGATTC  GCGGTTAATC  CGGGCCTGTT  AGAAACGTCG  GAAGGCTGTC         960
GACAAATACT  CGGACAGCTA  CAACCGTCGC  TTCAGACGGG  ATCGGAAGAA  CTTCGATCGT        1020
TATATAATAC  GGTCGCGACG  CTCTATTGCG  TCCATCAACG  GATCGAGATA  AAAGACACGA        1080
AGGAAGCGTT  AGACAAGATC  GAGGAAGAGC  AAAACAAATC  GAAGAAAAAA  GCGCAGCAAG        1140
CGGCGGCGGA  CACGGGACAC  TCGAATCAGG  TCTCGCAAAA  TTACCCGATC  GTGCAGAACA        1200
TCCAGGGGCA  AATGGTACAT  CAGGCGATAT  CGCCGCGAAC  GTTAAACGCG  TGGGTAAAAG        1260
TCGTCGAAGA  GAAGGCGTTC  TCGCCGGAAG  TGATACCGAT  GTTTTCGGCG  TTATCGGAAG        1320
GAGCGACGCC  GCAAGATTTA  AACACGATGC  TAAACACGGT  CGGCGGACAT  CAAGCGGCGA        1380
TGCAAATGTT  AAAAGAGACG  ATCAACGAGG  AAGCGGCGGA  ATGGGATCGC  GTGCATCCGG        1440
TGCACGCGGG  GCCGATCGCG  CCGGGCCAGA  TGCGCGAACC  GCGCGGATCG  GACATCGCGG        1500
GAACGACGTC  GACGCTTCAG  GAACAAATCG  GATGGATGAC  GAATAATCCG  CCGATCCCGG        1560
TCGGCGAAAT  TTATAAACGA  TGGATAATCC  TCGGATTAAA  TAAAATCGTA  CGAATGTATT        1620
CGCCGACGTC  GATTCTCGAC  ATACGACAAG  GACCGAAGGA  ACCGTTTCGC  GACTACGTCG        1680
ACCGGTTCTA  TAAAACGCTA  CGCGCGGAGC  AAGCGTCGCA  GGAGGTAAAA  AATTGGATGA        1740
CGGAAACGTT  GTTGGTCCAA  AACGCGAACC  CGGATTGTAA  GACGATTTTA  AAAGCGTTGG        1800
GACCGGCGGC  GACGCTCGAA  GAAATGATGA  CGGCGTGTCA  GGGCGTCGGC  GGACCGGGCC        1860
ATAAGGCGCG  CGTTTTGGCG  GAAGCGATGT  CGCAAGTAAC  GAATTCGGCG  ACGATAATGA        1920
TGCAGCGCGG  CAATTTTCGG  AACCAACGAA  AGATCGTTAA  GTGTTTCAAT  TGCGGCAAAG        1980
AAGGGCACAC  GGCGCGAAAT  TGCCGCGCGC  CGCGGAAAAA  GGGCTGTTGG  AAATGCGGAA        2040
AGGAAGGACA  CCAAATGAAA  GATTGTACGG  AGCGACAGGC  GAATTTTCTC  GGGAAGATCT        2100
GGCCGTCGTA  CAAGGGACGG  CCGGGGAATT  TTCTTCAGTC  GCGACCGGAG  CCGACGGCGC        2160
CGCCGGAAGA  GTCGTTCCGG  TCGGGCGTCG  AGACGACGAC  GCCGCCGCAG  AAGCAGGAGC        2220
CGATAGACAA  GGAACTGTAT  CCGTTAACGT  CGCTCCGGTC  GCTCTTCGGC  AACGACCCGT        2280
CGTCGCAATA  AAGATAGGGG  GGCAACTAAA  GGAAGCTCTA  TTAGATACAG  GAGCAGATGA        2340
TACAGTATTA  GAAGAAATGT  CGTTGCCGGG  ACGATGGAAA  CCGAAAATGA  TCGGCGGAAT        2400
CGGCGGTTTT  ATCAAAGTAC  GACAGTACGA  TCAGATACTC  ATCGAAATCT  GCGGACATAA        2460
AGCGATCGGT  ACCGTACTCG  TCGGACCGAC  GCCGGTCAAC  ATAATCGGAC  GAAATCTGTT        2520
GACGCAGATC  GGTTGCACGT  TAAATTTTCC  GATTTCGCCG  ATCGAGACGG  TACCGGTAAA        2580
ATTAAAGCCG  GGAATGGACG  GCCCGAAAGT  TAAACAATGG  CCGTTGACCG  AAGAAAAAAT        2640
AAAAGCGCTC  GTCGAAATTT  GTACGGAGAT  GGAAAAGGAA  GGGAAAATTT  CGAAAATCGG        2700
GCCGGAAAAT  CCGTACAATA  CGCCGGTATT  CGCGATAAAG  AAAAAAGACT  CGACGAAATG        2760
GCGAAAACTC  GTCGATTTCC  GCGAACTTAA  TAAGCGAACG  CAAGACTTCT  GGGAAGTTCA        2820
ACTCGGAATA  CCGCATCCGG  CGGGGTTAAA  AAAGAAAAAA  TCGGTAACGG  TACTCGATGT        2880
CGGCGACGCG  TATTTTTCGG  TTCCGCTCGA  CGAAGACTTC  CGGAAGTATA  CGGCGTTTAC        2940
GATACCGTCG  ATAAACAACG  AGACGCCGGG  GATTCGATAT  CAGTACAACG  TGCTTCCGCA        3000
GGGATGGAAA  GGATCGCCGG  CGATATTCCA  ATCGTCGATG  ACGAAAATCC  TCGAGCCGTT        3060
TCGAAAACAA  AATCCGGACA  TCGTTATCTA  TCAATACATG  GACGATTTGT  ACGTCGGATC        3120
GGACCTCGAA  ATCGGGCAGC  ATCGAACGAA  AATCGAGGAG  CTGCGACAAC  ATCTGTTGCG        3180
GTGGGGACTT  ACGACGCCGG  ACAAAAAACA  TCAGAAAGAA  CCGCCGTTCC  TTTGGATGGG        3240
TTACGAACTC  CATCCGGATA  AATGGACGGT  ACAGCCGATC  GTGCTGCCGG  AAAAAGACTC        3300
GTGGACGGTC  AACGACATAC  AGAAGCTCGT  CGGGAAATTG  AATTGGGCGT  CGCAGATTTA        3360
CCCGGGGATT  AAAGTACGGC  AATTATGTAA  ACTCCTTCGC  GGAACGAAAG  CGCTAACGGA        3420
AGTAATACCG  CTAACGGAAG  AAGCGGAGCT  CGAACTCGCG  GAAAACCGCG  AGATTCTAAA        3480
AGAACCGGTA  CACGGCGTGT  ATTACGACCC  GTCGAAAGAC  TTAATCGCGG  AAATACAGAA        3540
GCAGGGGCAA  GGCCAATGGA  CGTATCAAAT  TTATCAAGAG  CCGTTTAAAA  ATCTGAAAAC        3600
GGGAAAATAC  GCGCGCATGC  GGGGCGCGCA  CACGAACGAC  GTAAAACAAT  TAACGGAGGC        3660
GGTGCAAAAA  ATAACGACGG  AATCGATCGT  AATATGGGGA  AAGACGCCGA  AATTTAAACT        3720
GCCGATACAA  AAGGAAACGT  GGGAAACGTG  GTGGACGGAG  TATTGGCAAG  CGACGTGGAT        3780
TCCGGAGTGG  GAGTTCGTTA  ATACGCCGCC  GCTCGTGAAA  TTATGGTACC  AGCTCGAGAA        3840
AGAACCGATC  GTCGGCGCGG  AAACGTTCTA  CGTCGACGGC  GCGGCGAACC  GCGAGACGAA        3900
ACTCGGAAAA  GCGGGATACG  TTACGAATCG  CGGACGCCAA  AAAGTCGTCA  CGCTAACGGA        3960
CACGACGAAT  CAGAAGACGG  AGTTACAAGC  GATTTATCTC  GCGTTGCAGG  ATTCGGGACT        4020
CGAAGTAAAC  ATCGTAACGG  ACTCGCAATA  CGCGTTAGGA  ATCATTCAAG  CGCAACCGGA        4080
TCAATCGGAA  TCGGAGTTAG  TCAATCAAAT  AATCGAGCAG  TTAATAAAAA  AGGAAAAGGT        4140
CTATCTCGCG  TGGGTACCGG  CGCACAAAGG  AATCGGCGGA  AACGAACAAG  TCGATAAATT        4200
AGTCTCGGCG  GGAATCCGGA  AAGTACTATT  TTTAGACGGA  ATCGATAAGG  CGCAAGACGA        4260
ACACGAGAAA  TATCACTCGA  ATTGGCGCGC  GATGGCGTCG  GATTTTAACC  TGCCGCCGGT        4320
CGTCGCGAAA  GAAATCGTCG  CGTCGTGCGA  TAAATGTCAG  CTAAAAGGCG  AAGCGATGCA        4380
CGGACAAGTC  GACTGTTCGC  CGGGAATATG  GCAACTCGAT  TGTACGCATT  TAGAAGGAAA        4440
AGTTATCCTC  GTCGCGGTTC  ACGTCGCGTC  GGGATATATC  GAAGCGGAAG  TTATTCCGGC        4500
GGAAACGGGG  CAGGAAACGG  CGTATTTTCT  TTTAAAATTA  GCGGGACGAT  GGCCCGTAAA        4560
AACGATACAT  ACGGACAATG  GCTCGAATTT  CACCGGCGCG  ACGGTTCGCG  CGGCGTGTTG        4620
GTGGGCGGGA  ATCAAGCAGG  AATTCGGAAT  TCCGTACAAT  CCGCAATCGC  AAGGCGTCGT        4680
CGAATCGATG  AATAAAGAAT  TAAAGAAAAT  TATCGGACAG  GTACGCGATC  AGGCGGAACA        4740
TCTTAAGACG  GCGGTACAAA  TGGCGGTATT  CATCCACAAT  TTTAAACGAA  AAGGCGGGAT        4800
TGGCGGGTAC  TCGGCGGGCG  AACGAATCGT  CGACATAATC  GCGACGGACA  TACAAACGAA        4860
AGAATTACAA  AAACAAATTA  CGAAAATTCA  AAATTTTCGC  GTTTATTACC  GCGACTCGCG        4920
AAATTCGCTT  TGGAAAGGAC  CGGCGAAGCT  CCTCTGGAAA  GGCGAAGGCG  CGGTCGTAAT        4980
ACAAGATAAT  TCGGACATAA  AAGTCGTGCC  GCGACGAAAA  GCGAAGATCA  TTCGCGATTA        5040
TGGAAAACAG  ATGGCAGGTG  ATGATTGTGT  GGCAAGTAGA  CAGGATGAGG  ATTCGCACGT        5100
GGAAATCGCT  CGTAAAACAC  CATATGTACG  TTTCGGGGAA  AGCGCGCGGA  TGGTTTTATC        5160
GCCATCACTA  CGAATCGCCG  CATCCGCGCA  TATCGTCGGA  AGTACACATC  CCGCTCGGGG        5220
ATGCGCGCCT  CGTAATAACG  ACGTATTGGG  GTCTGCATAC  GGGCGAACGC  GACTGGCATC        5280
TCGGTCAGGG  CGTCTCGATC  GAATGGCGCA  AAAAGCGCTA  TTCGACGCAA  GTCGACCCGG        5340
AACTCGCGGA  CCAACTAATT  CATCTGTATT  ACTTCGACTG  TTTTTCGGAC  TCGGCGATAC        5400
GCAAGGCGTT  ACTCGGACAC  ATCGTTTCGC  CGCGCTGCGA  ATATCAAGCG  GGACATAACA        5460
AGGTCGGATC  GCTACAATAC  CTCGCGCTCG  CGGCGTTAAT  AACGCCGAAA  AAGATAAAGC        5520
CGCCGTTGCC  GTCGGTTACG  AAACTGACGG  AGGATCGATG  GAACAAGCCC  CAGAAGACCA        5580
AGGGCCACAG  AGGGAGCCAC  ACAATGAATG  GACACTAGAG  CTTTTAGAGG  AGCTTAAGAA        5640
CGAAGCGGTT  CGCCATTTTC  CGCGCATTTG  GCTCCACGGC  TTAGGGCAAC  ATATCTACGA        5700
AACGTATGGG  GATACGTGGG  CGGGCGTCGA  AGCGATAATA  AGAATTCTGC  AACAACTGCT        5760
GTTTATCCAT  TTTCAGAATT  GGGTGTCGAC  GTAGCAGAAT  AGGCGTTACT  CGACAGAGGA        5820
GAGCAAGAAA  TGGAGCCAGT  AGATCCTAGA  CTAGAGCCCT  GGAAGCATCC  AGGAAGTCAG        5880
CCTAAAACTG  CTTGTACCAA  TTGCTATTGT  AAAAAGTGTT  GCTTTCATTG  CCAAGTTTGT        5940
TTCATAACAA  AAGCCTTAGG  CATCTCCTAT  GGCAGGAAGA  AGCGGAGACA  GCGACGAAGA        6000
GCTCATCAGA  ACAGTCAGAC  TCATCAAGCT  TCTCTATCAA  AGCAGTAAGT  AGTACATGTA        6060
ACGCAACCTA  TACCAATAGT  AGCAATAGTA  GCATTAGTAG  TAGCAATAAT  AATAGCAATA        6120
GTTGTGTGGT  CCATAGTAAT  CATAGAATAT  AGGAAAATAT  TAAGACAAAG  AAAAATAGAC        6180
AGGTTAATTG  ATAGACTAAT  AGAAAGAGCA  GAAGACAGTG  GCAATGCGAG  TGAAGGAGAA        6240
ATATCAGCAC  TTGTGGCGAT  GGGGGTGGCG  ATGGGGCACG  ATGCTCCTCG  GGATGTTGAT        6300
GATCTGTTCG  GCTACGGAAA  AATTGTGGGT  CACGGTCTAT  TACGGCGTAC  CGGTGTGGAA        6360
GGAAGCGACG  ACGACGCTAT  TTTGCGCGTC  GGACGCGAAA  GCGTACGATA  CGGAGGTACA        6420
TAACGTTTGG  GCGACGCATG  CGTGCGTACC  GACGGACCCG  AACCCGCAAG  AAGTCGTACT        6480
CGTAAACGTG  ACGGAAAATT  TCGACATGTG  GAAAAACGAC  ATGGTCGAAC  AGATGCATGA        6540
GGATATAATC  TCGTTATGGG  ATCAATCGCT  AAAGCCGTGC  GTAAAATTAA  CGCCGCTCTG        6600
CGTTTCGTTA  AAGTGCACGG  ATTTGAAGAA  TGATACGAAT  ACGAATTCGT  CGTCGGGGCG        6660
AATGATAATG  GAGAAAGGCG  AGATAAAAAA  CTGCTCGTTC  AATATCTCGA  CGTCGATACG        6720
CGGTAAGGTG  CAGAAAGAAT  ACGCGTTTTT  TTATAAACTC  GATATAATAC  CGATCGATAA        6780
CGATACGACG  TCGTATTCGT  TGACGTCGTG  TAACACGTCG  GTCATTACGC  AGGCGTGTCC        6840
GAAGGTATCG  TTCGAGCCGA  TTCCGATACA  TTATTGTGCG  CCGGCGGGTT  TCGCGATTCT        6900
AAAATGTAAT  AATAAGACGT  TCAACGGAAC  GGGACCGTGT  ACGAACGTCT  CGACGGTACA        6960
ATGTACGCAC  GGAATTCGGC  CGGTCGTATC  GACGCAACTG  CTGTTAAACG  GCTCGCTCGC        7020
GGAAGAAGAG  GTCGTAATTC  GATCGGTCAA  TTTCACGGAC  AACGCGAAAA  CGATAATCGT        7080
ACAGCTGAAC  ACGTCGGTCG  AAATTAATTG  TACGCGACCG  AACAACAATA  CGCGAAAACG        7140
AATCCGTATC  CAGCGCGGAC  CGGGGCGCGC  ATTCGTTACG  ATCGGAAAAA  TCGGAAATAT        7200
GCGACAAGCG  CATTGTAACA  TTTCGCGCGC  GAAATGGAAT  AACACGTTAA  AACAGATCGA        7260
TTCGAAATTA  CGCGAACAAT  TCGGAAATAA  TAAAACGATA  ATCTTTAAGC  AATCGTCGGG        7320
CGGCGACCCG  GAAATCGTAA  CGCACTCGTT  TAATTGTGGC  GGCGAATTTT  TCTACTGTAA        7380
TTCGACGCAA  CTGTTTAATT  CGACGTGGTT  TAATTCGACG  TGGTCGACGG  AAGGGTCGAA        7440
TAACACGGAA  GGATCGGACA  CGATCACGCT  CCCGTGCCGA  ATAAAACAAA  TTATAAACAT        7500
GTGGCAGAAA  GTCGGAAAAG  CGATGTACGC  GCCGCCGATC  TCGGGACAAA  TTCGATGTTC        7560
GTCGAATATT  ACGGGGCTGC  TATTAACGCG  CGACGGCGGT  AATTCGAACA  ACGAGTCCGA        7620
GATCTTCCGA  CTCGGCGGCG  GCGATATGCG  CGACAATTGG  CGATCGGAAT  TATATAAATA        7680
TAAAGTCGTA  AAAATCGAAC  CGCTCGGCGT  CGCGCCGACG  AAGGCGAAGC  GACGCGTCGT        7740
GCAGCGCGAA  AAACGCGCGG  TCGGAATCGG  CGCGTTGTTC  CTCGGGTTCC  TCGGCGCGGC        7800
CGGATCGACG  ATGGGCGCGG  CGTCGATGAC  GCTGACGGTA  CAGGCGCGAC  AATTATTGTC        7860
GGGTATCGTG  CAGCAGCAGA  ACAATTTGCT  GCGCGCTATC  GAGGCGCAAC  AGCATCTGTT        7920
GCAACTCACG  GTCTGGGGCA  TCAAGCAGCT  CCAAGCGCGA  ATCCTCGCGG  TCGAACGATA        7980
CCTAAAGGAT  CAACAGCTCC  TCGGGATTTG  GGGTTGCTCG  GGAAAACTCA  TTTGCACGAC        8040
GGCGGTGCCG  TGGAATGCGT  CGTGGTCGAA  TAAATCGCTC  GAACAGATCT  GGAATCACAC        8100
GACGTGGATG  GAGTGGGACC  GCGAAATTAA  CAATTACACG  TCGTTAATAC  ACTCGTTAAT        8160
TGAAGAATCG  CAAAACCAGC  AAGAAAAGAA  TGAACAAGAA  TTACTCGAAC  TCGATAAATG        8220
GGCGTCGTTG  TGGAATTGGT  TTAACATAAC  GAATTGGCTG  TGGTATATAA  AATTATTCAT        8280
AATGATCGTC  GGCGGCCTCG  TCGGTTTACG  AATCGTTTTC  GCGGTACTTT  CGATCGTGAA        8340
TCGCGTTCGG  CAGGGATATT  CGCCGTTATC  GTTTCAGACC  CACCTCCCAA  TCCCGAGGGG        8400
ACCCGACAGG  CCCGAAGGAA  TAGAAGAAGA  AGGTGGAGAG  AGAGACAGAG  ACAGATCCAT        8460
TCGATTAGTG  AACGGATCCT  TGGCACTTAT  CTGGGACGAT  CTGCGGAGCC  TGTGCCTCTT        8520
CAGCTACCAC  CGCTTGAGAG  ACTTACTCTT  GATTGTAACG  AGGATTGTGG  AACTTCTGGG        8580
ACGCAGGGGG  TGGGAAGCCC  TCAAATATTG  GTGGAATCTC  CTACAGTATT  GGAGTCAGGA        8640
ACTAAAGAAT  AGTGCTGTTA  GCTTGCTCAA  TGCCACAGCC  ATAGCAGTAG  CTGAGGGGAC        8700
AGATAGGGTT  ATAGAAGTAG  TACAAGGAGC  TTGTAGAGCT  ATTCGCCACA  TACCTAGAAG        8760
AATAAGACAG  GGCTTGGAAA  GGATTTTGCT  ATAAGATGGG  CGGCAAGTGG  TCGAAATCGT        8820
CGGTGATTGG  ATGGCTTACG  GTACGCGAAC  GCATGCGCCG  CGCCGAGCCG  GCGGCGGACG        8880
GCGTCGGCGC  CGCGTCGCGC  GACCTGGAAA  AACACGGCGC  GATCACGTCG  TCGAACACGG        8940
CGGCGACGAA  CGCGGCGTGC  GCGTGGCTCG  AAGCGCAAGA  GGAGGAGGAG  GTCGGTTTTC        9000
CGGTCACGCC  GCAGGTACCG  TTACGCCCGA  TGACGTACAA  GGCGGCGGTC  GATCTTTCGC        9060
ACTTTTTAAA  AGAAAAGGGC  GGACTCGAAG  GGCTAATTCA  CTCGCAACGC  CGCCAAGATA        9120
TCCTCGATCT  GTGGATCTAC  CACACGCAAG  GCTACTTCCC  GGATTGACAG  AACTACACAC        9180
CAGGGCCAGG  GGTCAGATAT  CCACTGACCT  TTGGATGGTG  CTACAAGCTA  GTACCAGTTG        9240
AGCCAGATAA  GATAGAAGAG  GCCAATAAAG  GAGAGAACAC  CAGCTTGTTA  CACCCTGTGA        9300
GCCTGCATGG  GATGGATGAC  CCGGAGAGAG  AAGTGTTAGA  GTGGAGGTTT  GACAGCCGCC        9360
TAGCATTTCA  TCACGTGGCC  CGAGAGCTGC  ATCCGGAGTA  CTTCAAGAAC  TGCTGACATC        9420
GAGCTTGCTA  CAAGGGACTT  TCCGCTGGGG  ACTTTCCAGG  GAGGCGTGGC  CTGGGCGGGA        9480
CTGGGGAGTG  GCGAGCCCTC  AGATCCTGCA  TATAAGCAGC  TGCTTTTTGC  CTGTACTGGG        9540
TCTCTCTGGT  TAGACCAGAT  CTGAGCCTGG  GAGCTCTCTG  GCTAACTAGG  GAACCCACTG        9600
CTTAAGCCTC  AATAAAGCTT  GCCTTGAGTG  CTTCAAGTAG  TGTGTGCCCG  TCTGTTGTGT        9660
GACTCTGGTA  ACTAGAGATC  CCTCAGACCC  TTTTAGTCAG  TGTGGAAAAT  CTCTAGCA          9718