本发明涉及非甲、非乙型肝炎病毒(NANBV)的中国分离种群的分离肽,蛋白质和核酸分子。具体说来,本发明涉及到NANBV的中国和朝鲜分离种群特有的分离肽、蛋白质和核酸分子。本发明也描述含上述分离分子的用于诊断方法和疫苗的组合物。 已确信非甲、非乙型肝炎(NANBV)是由既称之为丙型肝炎病毒(HCV)也称之为非甲、非乙型肝炎病毒(NANBV)的传染性病毒引起的。虽然在多年以前就发现了该传染性疾病,但有关病原体的完整特征仍待研究。
人们已经描述过大量的NANBV分离种群并命名为HCV-1,HCV-H,HCV-J1,HCV-J4,HCV-JH,HCV-J和HCV-BK。已经分离出这些NANBV种群,并对各种种群的部分或全部病毒基因组进行过分子克隆以及测序(Choo et al,Science,244:359-362(1989);Choo et al,Proc.Natl.Acad.Sci.USA,88:2451-2455(1991);Takamizawa et al.,J.Virol.,65:1105-1113(1991);Kato et al.,Proc.Natl.Acad.Sci.USA,87:9524-9528(1990);和Takeuchi et al.,Nucl.Acids Res.,18:4626(1990))。
NANBV基因组是核糖核酸(RNA)。不同NANBV种群之间核苷酸碱基序列的相似性说明它们是相关病毒家族中的一员(Okamoto et al.,Japan J.Exp.Med.,60:163-177(1990);和Ogata et al.,Proc.Natl.Acad.Sci.USA,88:3392-3396(1991))。NANBV基因组的性质说明NANBV可能是黄色病毒(flavivirus)家族的远亲。但是,在结构蛋白大小和水疗法方面的相似性说明NANBV病毒也可能是与鼠疫病毒(Pestivirus)家族有远缘关系(Miller et al.,Proc.Natl.Acad.Sci.,87:2057-2061(1990);和Okamoto et al.,Japan J.Exp.Med.,60:163-177(1990))。
从分类学上很难描述NANBV种群的特征并且缺乏有关由NANBV基因组编码的蛋白质的资料,因此,很难鉴定可用于诊断标记物和生产NANBV疫苗的相关基因产物。
NANBV基因组包含编码和非编码(NC)区。进一步描述编码区特征为含有包括衣壳(C)区,包膜(E)区和非结构(NS)区的推测区。
E区含有两个不同的称为E1和E2的推测区。E区进一步含有称为V0,V1和V2的可变(V)区。NS区含有5个称为NS1,NS2,NS3,NS4和NS5的推测区。进一步在推测的NS5亚区鉴定出称作V3地可变区。
已经证明V3和部分E1区特别适于分类各种NANBV分离种群。比较基因组和从基因组这些区域衍生出的氨基酸残基序列表明存在两种原始的分离种群:美国类似型(第Ⅰ组)和日本类似型(第Ⅱ组)。美国类似型分离种群包括HCV-1和HCV-H,而日本类似型分离种群包括HCV-J和HCV-BK。
在V3区有高度的分离种群内同源性但低度的分离种群间同源性。因此,在该区域中,美国类似型分离种群(HCV-1和HCV-H)相互之间有87%的同源性,日本类似型分离种群间彼此有87%的同源性,但在美国和日本类似型分离种群间的同源性仅为12.5%(参见,如,Okamoto et al.,Japan J.Exp.Med.,60:163-177,1990(HC-J1,HC-J4);Takeuchi et al.,Nucleic Acids Res.,18:4626,1990(HCV-JH);Choo et al.,Proc.Natl.Acad.Sci.USA,88:2451-2455,1991,(HCV-1);Kato et al.,Proc.Natl.Acad.Sci.USA,87:9524-9528,1990(HCV-J);Takamizawa et al.,J.Virol.,65:1105-1113,1991(HCV-BK);Takahashi et al.的美国专利申请No.5,032,511;Ogata et al.,Proc.Natl.Acad.Sci.USA,88:3392-3396,1991(HCV-Hh);和国际申请No.PCT/US88/04125)。
NANBV基因组含有一个编码单一多蛋白的正链RNA分子。认为NANBV的基因产物既包括结构(C和E)也包括非结构(NS)蛋白质,基于表征过的,相关病毒的同源性。从这些同原性,可以预测,NANBV表达一个来自完整病毒基团组的单个多蛋白基因产物,然后,该多蛋白被切割成功能不同的结构和非结构蛋白质。
这种类型的病毒形态形成,阻碍了在个体成熟病毒蛋白被物理分离和表征之前作出可靠的鉴定。由于还没有供NANBV用的体外繁殖病毒培养系统,因此,还没有从生物样品或NANBV-感染细胞中分离出NANBV结构或非结构基因产物。因此,NANBV蛋白质的鉴定,它们在病毒生命循环中的作用,以及引起疾病的作用还有待于测定。尤其是,对NANBV-诱导疾病的抗原标记物仍有待全面表征。
从部分NS3和NS4基因组区得到一个称为C100-3抗原的一种NANBV基因产物,表达为一种融合蛋白,并将其用于检测带各种形式NANB肝炎的患者的抗-C100-3-抗体(参见如,Kuo et al.,Science,244:362-364(1989);和国际申请No.PCT/US88/04125)。由Ortho Diagnostics,Inc.(Raritan,NJ)生产,可从市场上买到以C100-3抗原为基础的诊断检测。
这种C100-3检测目前代表本领域在检测NANBV感染方面的状况。然而,已经报道C100-3抗原为基础的免疫检测仅仅能从慢性感染患者的血清中较好地检测抗体。因为,肝炎发病后,一般4到6个月才发生C100-3血清转换,因此,C100-3检测不能检测急性NANBV感染。另外,C100-3检测包括范围过分宽。其中用C100-3-为基础的免疫检测测定带自体免疫慢性活性肝炎或由因子而不是NANBV引起的其它肝病的患者体内的抗体时,报道过假阳性结果(参见如,Alter et al.,New Eng.J.Med.,321:1538-39(1989);Alter et al.,New Eng.J.Med.,321:1494-1500(1989);Weiner et al.,Lancet,335:1-3(1990);McFarlane et al.,Lancet,335:754-757(1990);和Greyet al.,Lancet,335:609-610(1990))。
一方面,本发明提供一种NANBV中国和朝鲜分离种群特定的分离肽(即,在日本或美国NANBV分离种群中没有),将该分离肽称作HCV-PRC-Korean特有肽并且其氨基酸残基序列为:
Gly-Gly-Ala-Ala-Xaa-Arg(SEQ ID NO:17)其中Xaa是Gly或Ala;或
Thr-Ala-Thr-Ala-Pro-Pro(SEQ ID NO:64)。
本发明也提供一种含HCV-PRC-Korean特有肽的约25个氨基酸残基的分离肽,该分离肽选自一组由SEQ ID NO:2的从残基约385到残基约410,SEQ ID NO:6,SEQ ID NO:8和SEQ ID NO:10组成的氨基酸残基序列。
本发明另外提供一种包括SEQ ID NO:17氨基酸残基序列的从6到约511氨基酸残基的分离肽,该分离肽的其余氨基酸残基定义一个NANBV结构蛋白或多蛋白。较好地是,结构蛋白质是HCV-PRC E2蛋白,该蛋白含有SEQ ID NO:2从约381到约511残基的氨基酸残基序列。而多蛋白是HCV-PRC多蛋白,该蛋白含有SEQ ID NO:2从残基1到残基511的氨基酸残基序列。
另一方面,本发明提供一种融合蛋白,该融合蛋白包含将第一肽部分人工连接到第二肽部分;所述的第一肽部分定义非-HCV-PRC-Korean特有肽或键合于第二肽部份的蛋白肽的氨基酸残基序列;所述的第二肽部分含有包括SEQ ID NO:17氨基酸残基序列在内的从6到约511氨基酸残基,且其其余残基定义一个NANBV结构蛋白或多蛋白。
优选第二肽部分是选自一组由SEQ ID NO:17,约385到约410残基的SEQ ID NO:2,从约381到约511残基的SEQ ID NO:2,从1到约511残基的SEQID NO:2,SEQ ID NO:6,SEQ ID NO:8和SEQ ID NO:10组成的氨基酸残基序列。
优选第一肽部分定义为一种切割的HCV-PRC E1结构蛋白并且有从约191到327残基的SEQ ID NO:2的氨基酸残基序列。
另一方面,本发明提供与NANBV的HCV-PRC和Korean分离种群发生免疫反应而不与NANBV分离种群HCV-1,HCV-J,HCV-J1,HCV-J4,HCV-BK,HCV-JH或HCV-Hh反应的抗体分子。优选抗体分子是一种抗(ⅰ)一种分离肽,或(ⅱ)一种融合蛋白的单克隆抗体,所述的一种分离肽含有包含SEQ ID NO:17的氨基酸残基序列的从6到约511氨基酸残基,并且其其余残基定义NANBV的结构蛋白或多蛋白,所述的融合蛋白包括SEQ ID NO:17的氨基酸残基序列。
另外本发明提供一种含有免疫有效量的前述肽或融合蛋白的接种物,所述的肽或融合蛋白或者单独地或者与一种抗原载体连接并分散在药物学可接受的赋形剂中。
本发明另外提供一种在哺乳动物中诱导抗体生产的方法,所述的抗体与NANBV的HCV-PRC或Korean分离种群发生免疫反应但不与NANBV分离种群HCV-1,HCV-J,HCV-J1,HCV-J4,HCV-BK,HCV-JH或HCV-Hh发生免疫反应,该方法包括步骤:
(a)给哺乳动物施用上述的接种物;且
(b)在哺乳动物体内保持足够的时间以便产生免疫应答并产生NANBV抗体的抗-HCV-PRC或抗-Korean分离种群。
另外,本发明以药盒形式提供一种检测体液样品中抗体存在的诊断系统,所述的抗体与NANBV的HCV-PRC或Korean分离种群发生免疫反应但不与NANBV分离种群HCV-1,HCV-J,HCV-J1,HCV-J4,HCV-BK,HCV-JH或HCV-Hh发生免疫反应,该系统含有上述的足够量的分离肽或融合蛋白,所述的足够量是指至少完成一个检测的量。
本发明也提供一种检测身体样品中抗体存在的方法,所述的抗体与NANBV的HCV-PRC或Korean分离种群发生免疫反应但不与NANBV分离种群HCV-1,HCV-BK,HCV-J,HCV-J1,HCV-J4,HCV-JH或HCV-Hh反应,该方法包括:
(a)通过将身体样品与(ⅰ)一种分离肽,或(ⅱ)一种融合蛋白混合形成一种含水免疫反应混合物,所述的(ⅰ)一种分离肽含有包含SEQ ID NO:17的氨基酸残基序列的从6到约511氨基酸残基,并且其其余残基限定NANBV结构蛋白或多蛋白,所述(ⅱ)融合蛋白包括SEQ ID NO:17的氨基酸残基序列;
(b)将含水的免疫反应混合物保持一段足够长的时间以便存在的任何抗体均能与肽或融合蛋白发生免疫反应以形成免疫反应产物;和
(c)检测是否存在任何形成的免疫产物并由此检测抗体的存在。
本发明以药盒形式也提供一种检测体液样品中是否存在NANBV HCV-PRC或Korean分离种群的诊断系统,该系统含有足够量完成一种检测的与NANBV HCV-PRC或Korean分离种群发生免疫反应,但不与NANBV分离种群HCV-1,HCV-BK,HCV-J,HCV-J1,HCV-J4,HCV-JH,或HCV-Hh发生免疫反应的抗体分子,比较适宜的是,抗体分子是一种抗本发明分离肽或融合蛋白的单克隆抗体。
另外本发明提供一种包含约18到1665核苷酸碱基对的分离DNA分子,该DNA分子编码包括HCV-PRC-Korean独特肽的HCV-PRC的氨基酸残基序列。比较好的是,该分离的DNA分子有SEQ ID NO:65,从约1266碱基位到1343碱基位的SEQ ID NO:1,从约1254碱基位约1646碱基位的SEQ ID NO:1,从约114碱基位到约1646碱基位的SEQ ID NO:1,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13和SEQ ID NO:15的核苷酸碱基序列。
本发明也提供一种检测身体样品存在HCV-PRC-Korean独特核酸分子(即,在NANBV中国和朝鲜分离种群中存在,但在NANBV日本或美国分离种群中不存在的核酸分子)的方法,该方法包括:
(a)通过将上述的本发明分离DNA分子与身体样品混合形成一种含水的杂交混合物;
(b)将该含水杂交混合液在杂交条件下保持一段足够长的时间以便存在的任何HCV-PRC-Korean独特核酸分子均能与DNA分子杂交形成杂交产物;和
(c)检测任何形成的杂交产物的存在并由此检测HCV-PRC-Korean独特核酸分子的存在。
另外本发明还提供SEQ ID NO:62的分离RNA分子。
在作为说明书一部分的附图中:
图1是HCV基因组和称作A到E的HCV-PRC1克隆cDNA片段的定位的图解。带有HCV-编码多蛋白推测区的这些片段表现呈直线,A,B,C,D和E片段的大小分别是617碱基对(bp),366bp,309bp,540bp和652bp。
图2是一个条形图,它比较四种中国分离种群(HCV-PRC1,HCV-PRC3,HCV-PRC4和HCV-PRC11)的V3区和NANBV美国(HCV-1和HCV-J)日本(HCV-BK)分离种群的V3区之间氨基酸残基序列同源程度。
A:定义
氨基酸:本文鉴定的所有氨基酸残基均是自然界中的L-异构构型。为了与标准多肽命名法(J.Biol.Chem.,243:3557-59,(1969))一致,在下列表中列出了氨基酸残基的缩写:
附加表
1个字母代号 3个字母代号 氨基酸
Y Tyr L-酪氨酸
G Gly L-甘氨酸
F Phe L-苯丙氨酸
M Met L-蛋氨酸
A Ala L-丙氨酸
S Ser L-丝氨酸
I Ile L-异亮氨酸
L Leu L-亮氨酸
T Thr L-苏氨酸
V Val L-缬氨酸
P Pro L-脯氨酸
K Lys L-赖氨酸
H His L-组氨酸
Q Gln L-谷氨酰胺
E Glu L-谷氨酸
Z Glx 谷氨酰胺或谷氨酸
W Trp L-色氨酸
R Arg L-精氨酸
D Asp L-天冬氨酸
N Asn L-天冬酰胺
B Asx 天冬氨酸或天冬酰胺
C Cys L-半胱氨酸
X Xaa 未知或其他
应该说明的是本文中一般作为“残基序列”提到的所有氨基酸残基序列在本文中通过结构式表示,该序列从左到右的取向是氨基末端到羧基末端的标准方向。
抗原:一种能与抗体特异性结合(与其免疫反应)并形成一种免疫反应产物(免疫复合体)的多肽或蛋白质。抗原与抗体结合的位点叫作抗原决定基或表位。
核苷酸:由一个糖部分(戊糖),一个磷酸基团,和一个含氮杂环碱基组成的DNA或RNA的单体单元。经配糖碳(戊糖的1′碳)碱基与糖部分连接,而碱基与糖结合便是核苷。当核苷包含一个与戊糖的3′或5′位结合的磷酸基团时,就叫做核苷酸。由核苷酸人工连接成的序列本文中一般称作“碱基序列”,并且在本文中由结构式表示,该结构式从左到右的取向是5′-末端到3′-末端的标准方向。
双链DNA:一种含有两个本质上互补的多核苷酸链的双链核酸分子,以两个链的碱基成对存在的互补核苷酸之间通过形成氢键而杂交在一起。由于形成碱基对的核苷酸可以是核糖核苷酸碱基或脱氧核糖核苷酸碱基,因此,术语“双链DNA”是指两个DNA链(ds DNA)的DNA-DNA双链,或者是指含一个DNA和一个RNA链的RNA-DNA双链。
碱基对(bp):在双链DNA分子中,腺嘌呤(A)与胸腺嘧啶(T)配对,或胞嘧啶(C)与鸟嘌呤(G)配对。在RNA中,尿嘧啶(U)取代胸腺嘧啶。
互补核苷酸序列:在单链DNA或RNA分子中的核苷酸序列足以与另一单链互补,通过随后形成的氢键特异性地(非随机地)杂交在一起。
杂交:互补核苷酸序列(核酸链)成对,通过在互补碱基对之间/中间形成氢键,而形成双链,杂双链或包含多于两个单链核酸的复合体。它是一种可以竞争性地被抑制的互补多核苷酸之间/中间的特异性(即非随机)的相互作用。
杂交产物:当多核苷酸与单链或双链核酸杂交时形成杂交产物。当多核苷酸与双链核酸杂交时,形成的杂交产物称作三螺旋或三链核酸分子(Moser et al.,Science,238:645-50(1987))。
核苷酸类似物:结构上与A,T,G,C或U不同,但具有足够的相似性可取代核酸分子中的正常核苷酸的嘌呤或嘧啶核苷酸。次黄嘌呤(Ⅰ)是一种能与其他任何核苷酸A,T,G,C或U形成氢键的核苷酸。另外,已经知道甲基化的碱基在核酸杂交中也能使用。
多蛋白质:在多顺反子RNA上,通过两个或多个相邻基因的非间断转译生产的蛋白质:通过多蛋白的后转译或共转译裂解分离单独的基因产物。
本发明提供有关NANBV中国分离种群的组合物和方法,本文中将该分离种群称为HCV-PRC。具体说来,本发明提供分离的HCV-PRC核酸、蛋白质和肽分子,含上述分子的组合物以及在诊断和治疗HCV感染中使用上述分子的方法。
关于本文所用的核酸,蛋白质和肽分子,术语“分离的”是指上述分子基本上不含其它类似分子,所述的类似分子不包含本文中特定的特定核苷酸或氨基酸残基序列,不论这些特定序列是以颗粒制剂,组合物还是溶液-悬浮液形式存在。所用的短语“基本上没有”是指特定的分离分子是以大于类似分子总重量50%且最好是大于90%的量存在。
本文中所用的术语“HCV-PRC”一般指NANBV中国分离种群。术语“HCV-PRC1,HCV-PRC3,HCV-PRC4和HCV-PRC11”指HCV-PRC的个别例子(参见下文的实施例1)。
表示编码HCV-PRC基因组(HCV-PRC1)结构区的分离的DNA分子是SEQ ID NO:1从1位到1665位碱基。由SEQ ID NO:1的DNA分子编码的RNA分子表示在SEQ ID NO:62中。SEQ ID NO:2从氨基酸残基1到氨基酸残基511表示由DNA分子编码的多蛋白。
SEQ ID NO:2的多蛋白含有三个称作衣壳、包膜-1(E1)和包膜-2(E2)蛋白的结构蛋白。衣壳蛋白有SEQ ID NO:2的从1到约190残基氨基酸残基序列。E1蛋白含有SEQ ID NO:2从约191到约380残基的氨基酸残基序列。E2蛋白含有SEQ ID NO:2从约381到511残基的氨基酸残基序列。
本发明的分离核酸、蛋白和肽分子总的特征为对中国和朝鲜分离种群是特有的(即存在于NANBV的HCV-PRC和朝鲜分离种群,而不存在于NANBV的日本和美国分离种群)、对NANBV的中国和日本分离种群是特有的(不存在于NANBV的美国分离种群)或对HCV是特有的(即存在于NANBV,但不存在于甲型肝炎或乙型肝炎病毒分离种群中)。
1.中国和朝鲜分离种群独特性
a.分离的肽
在一个实施方案中,本发明提供只有NANBV HCV-PRC和朝鲜分离种群才有的并用于将NANBV中国和朝鲜种群与NANBV美国和日本分离种群相区别的分离核酸,蛋白质和肽分子。本文将这些分子称作“HCV-PRC-Korean特有”。
由HCV-PRC基因组结构区的VO区编码一种上述的HCV-PRC-Korean特有肽并且其氨基酸残基序列为
Gly-Gly-Ala-Ala-Xaa-Arg(SEQ ID NO:17)其中,Xaa是Ala或Gly。在HCV-PRC1(SEQ ID NO:2的388到393残基),HCV-PRC3(SEQ ID NO:6的3到8残基),HCV-PRC4(SEQ ID NO:8的残基4到9),HCV-PRC11(SEQ ID NO:10的残基4到9)以及NANBV朝鲜分离种群中发现上述氨基酸残基序列,但在NANBV美国和日本分离种群中没有发现(参见本文实施例2)。
另一个只有NANBV HCV-PRC和朝鲜分离种群才有的肽是由部分V3区编码的,且其氨基酸残基序列为:
Thr-Ala-Thr-Ala-Pro-Pro(SEQ ID NO:64)。在HCV-PRC1(SEQ ID NO:4的残基9到14),HCV-PRC3(SEQ ID NO:12的残基9到14),HCV-PRC4(SEQ ID NO:14的残基9到14),HCV-PRC11(SEQ ID NO:16的9到14)和NANBV朝鲜分离种群中发现上述氨基酸残基序列,但在NANBV非中国非朝鲜分离种群中没发现上述氨基酸残基序列。
因此,本发明提供一种有SEQ ID NO:17或SEQ ID NO:64氨基酸残基序列的分离HCV-PRC-Korean特有肽。
本发明也提供一种约25个氨基酸残基的分离肽,该肽包括一个只有NANBV的HCV-PRC和Korean分离种群才有的氨基酸残基序列。优选肽是由HCV-PRC基因组的V0区编码的并且选自由SEQ ID NO:2的残基385到410,SEQ ID NO:6,SEQ ID NO:8和SEQ ID NO:10组成的一组序列。
本发明也提供一种从6到约511氨基酸残基的分离肽,该肽包括SEQ ID NO:17的氨基酸残基序列并且其其余的氨基酸残基定义NANBV结构蛋白或多蛋白。
在一个优选的实施方案中,上述一种分离肽有HCV-PRC包膜蛋白的氨基酸残基序列。在SEQ ID NO:2的从残基约381到约511中表示HCV-PRC包膜蛋白E2的氨基酸残基序列。
在另一实施方案中,上述一种分离的肽有如在SEQ ID NO:2的从残基1到残基511所示的HCV-PRC多蛋白的氨基酸残基序列。
一种分离的HCV-PRC-Korean特有肽可以是融合蛋白的一部分。短语“融合蛋白”涉及一种通过肽键将第一肽部分与第二肽部分人工连接形成的蛋白质,该蛋白质定义一种如上文公开的HCV-PRC-Korean特有肽。
第一肽部分为非-HCV-PRC-Korean特有氨基酸残基序列。一种优选的第一肽部分其氨基酸残基序列相当于一种免疫学上惰性的非-HCV蛋白质的全部或部分氨基酸序列。一种优选的免疫学上惰性的非HCV蛋白质是蛋白质谷胱甘肽-S-转移酶(GST),在SEQ ID NO:63中表示了它的氨基酸残基序列。
换言之,第一肽部分有一种不包括HCV-PRC-Korean特有肽的HCV-PRC的氨基酸序列。一种优选的上述第一肽部分定义为全部或部分的HCV-PRC E1结构蛋白。一种特别优选的上述第一肽部分定义为一种没有膜结合区的平头HCV-PRC E1蛋白。在SEQ ID NO:12的从残基约191到约327显示一种优选的平头E1蛋白质的氨基酸残基序列。
在融合蛋白中定义HCV-PRC-Korean特有肽的优选第二肽部分包括SEQ ID NO:17的氨基酸残基序列。
在一个实施方案,一种融合蛋白可以包含一个以上定义HCV-PRC-Korean特有肽的肽部分。
b.分离的核酸分子
在另一个实施方案中,本发明提供一种分离核酸分子,该核酸分子的核苷酸序列是只有NANBV的HCV-PRC和Korean分离种群才有的(即,一种HCV-PRC-Korean特有的核酸)。最好是,上述核酸分子编码一个前面所述的HCV-PRC-Korean特有肽。
优选编码有SEQ ID NO:17或SEQ ID NO:64氨基酸残基序列的肽的分离核酸。
一种优选的编码SEQ ID NO:17肽的核酸分子是一种有下列核苷酸碱基序列的分离DNA分子:
GGGGGGGCGGCRGSCCGC(SEQ ID NO:65)
其中R是A或G,S是C或G。在HCV-PRC1(SEQ ID NO:1的1275到1292位碱基),HCV-PRC3(SEQ ID NO:5的25到42位碱基),HCV-PRC4(SEQ ID NO:7的56到73位碱基),和HCV-PRC11(SEQ ID NO:9的25到42位碱基)中发现上述核苷酸碱基序列。
一种编码SEQ ID NO:65的肽的优选核酸分子是一种有下列核苷酸碱基序列的分离DNA分子:
ATCGTCRGCCGYCGACAG(SEQ ID NO:66)
其中R是G或A,Y是C或T。在HCV-PRC1(SEQ ID NO:3的25到42位碱基),HCV-PRC3(SEQ ID NO:11的25到42位碱基),HCV-PRC4(SEQ ID NO:13的25到42位碱基)和HCV-PRC11(SEQ ID NO:15的25到42位碱基)中发现上述核苷酸碱基序列。
本发明也提供一种包括SEQ ID NO:65的核苷酸碱基序列的,从约75到约300核苷酸碱基对的分离DNA分子。这种典型核苷酸序列编码HCV-PRC基因组的V0区并且包括SEQ ID NO:1的从约1269碱基到约1343位碱基,SEQ ID NO:3,SEQ ID NO:5和SEQ ID NO:7核苷酸碱基序列。
在另一实施方案中,本发明提供一种从约18到约1665碱基对的分离核酸分子,该核酸分子包括SEQ ID NO:65的核苷酸碱基序列并且其其余的碱基编码NANBV基因组序列。一种优选的分离的核酸分子编码一个HCV-PRC E2结构蛋白或HCV-PRC多蛋白。在SEQ ID NO:1中从1254位碱基到约1646位碱基显示编码HCV-PRC E2蛋白的核苷酸碱基序列。在SEQ ID NO:1中从约114位碱基到约1646位碱基显示编码HCV-PRC多蛋白的核苷酸碱基序列。
c.制备分离分子的方法
可以用本领域专业人员已知的标准方法制备分离HCV-PRC-Korean特有肽,融合蛋白和核酸分子。从分离的病毒能够很容易地制备本发明的分离核酸分子如DNA,所述的分离病毒是从中国分离种群NANBV-感染个体的(如下文所述,参见实施例1)血液中得到的,或可以通过化学方法重头合成本发明的分离核酸分子。
例如可以利用自然产生的限制酶位点的有利条件,从SEQ ID NO:1的DNA序列得到编码某种HCV-PRC肽的DNA分子。用XcaⅠ和StuⅠ消化SEQ ID NO:1 DNA分子产生可用于适当表达载体的有843碱基对平头末端的DNA片段,可以得到编码一种肽的核酸序列,所述的肽有SEQ ID NO:1 201残基以上的整个残基的氨基酸残基序列。
当在所需的位置没有用于表达特定肽的自然产生的限制酶位点时,通过体外诱变技术,将上述限制酶位点引入到已知序列的DNA分子。根据上述方法,合成一个含所需限制位点序列和已知序列的寡核苷酸。用足够长的侧序列构建含新的限制酶位点的寡核苷酸以便达到与已知的靶天然序列充分杂交,而完成随后的步骤。
与含非突变、野生型序列的单链模板杂交后,用T4DNA聚合酶延伸寡核苷酸引物以便形成带1个或多个碱基错配的杂双链分子。通过将杂双链分子转染到适当的E.coli细胞中,固定由寡核苷酸引入突变的结果造成的上述错配。通过上述过程破坏了模板链,而保留了含引入突变的互补链。因此,“固定”了突变并可分离含所需突变的质粒并定序证实存在适当的序列。
可在Ausubel et al.Current Protocols in Molecular Biology,John Wiley and Sons,New York 1989一书中找到完整的体外诱变方法和合成寡核苷酸的方法。
由于编码序列将保留在表达多肽的框架中,所以引入平头末端产生的限制位点使其大大容易克隆到表达载体中。因此,大多数被引入的限制位点是与平头末端产生的限制酶相对应的。
通过实施例,为了在ID NO:1的约676位碱基到约681位碱基引入一个有用的限制酶位点,在上述的体外诱变方法中使用下列的寡核苷酸序列:
Tyr Ala Tyr Glu (SEQ ID NO:71)
ACC CCA GTA TAC GCT TAT GAA (SEQ ID NO:72)
Xca I
用粗黑体字表示的核苷酸说明相对于天然序列(SEQ ID NO:1的669位碱基到692位碱基)有变化的碱基。突变结果,在表达的突变肽中的第一个氨基酸是酪氨酸,而在未突变的序列中,起始位置则编码丝氨酸。趋于保守的这种氨基酸的取代作用并不影响形成肽的免疫反应活性。
可以在SEQ ID NO:1的3′末端附近引入另一个限制位点以便产生编码一种肽的DNA分子,所述的肽有SEQ ID NO:2从约190到约511残基的氨基酸残基序列。例如使用下列诱变寡核苷酸在SEQ ID NO:1的1644-1649位碱基引入StuⅠ位点:
Thr Pro Arg
ACC CCA AGG CCT GTTGTG (SEQ ID NO:73)
Stu I
用黑体字表示的核苷酸是变换的碱基。在该肽序列中的最后一个氨基酸(SEQ ID NO:2的511残基)从丝氨酸变精氨酸。用XcaⅠ和StuⅠ处理所得的DNA,得到一个编码氨基酸191到511的序列。将因此产生的平头末端片段克隆到一个适当的平头末端表达载体中。可以通过限制酶分析或测序所得构建体验证插入序列的取向。
根据上述同样的方法,用适当设计的诱变寡核苷酸,可以将限制位点插入到SEQ ID NO:1的DNA分子的其它位点。例如,用下列诱变寡核苷酸可以将NaeⅠ位点引入到SEQ ID NO:1的约1247位碱基到约1256位碱基:
Ala Gly Val
CTC TTT GCC GGC GTT (SEQ ID NO:74)
Nae I
核苷酸序列中的这种变换可将SEQ ID NO:2的380位氨基酸残基从甘氨酸变成丙氨酸。
用下列诱变寡核苷酸可以在SEQ ID NO:1的约1266位碱基到1271位碱基插入NspBⅡ限制位点:
Arg Val Gly
GAT GGG ACA CCG CGC GTA GGG (SEQ ID NO:75)
NspB II
通过上述变化不改变SEQ ID NO:2的386位氨基酸残基。用下列诱变寡核苷酸可以在SEQ ID NO:1的约1344位碱基到约1349位碱基插入PvuⅡ位点:
Asn Ile Gln
AAC ATC CAG CTG GTG AAC (SEQ ID NO:76)
Pvu II
通过这种方法不改变SEQ ID NO:2的第411位氨基酸残基。可使用NspBⅡ和PvuⅡ遗传工程位点从SEQ ID NO:1制备的DNA分子用于生产一种重组肽,该肽有SEQ ID NO:2从约386位残基到411位残基的氨基酸残基序列。
用下列诱变寡聚核苷酸,通过在SEQ ID NO:1的约1274位碱基到约1279位碱基引入SmaⅠ限制位点并在SEQ ID NO:1的约1288位碱基到约1293位碱基引入NarⅠ位点,可以得到编码SEQ ID NO:17的氨基酸残基序列的DNA分子:
Gly Ala
ACA ACC CGC CCC GGG GCG (SEQ ID NO:77)
Sma I
Ala Arg
GCG GCC CGG CGC CCC AGC (SEQ ID NO:78)
Nar I
该变换也未改变形成的肽的氨基酸残基序列。用NarⅠ处理得到一个末端带5′悬重2碱基的DNA片段。根据标准方法可以用S1核酸酶处理DNA除去上述悬重末端。可以将此54碱基对的序列与其它有用序列相连以产生新的融合蛋白。
通过其它实施例,可以用下列诱变寡聚核苷酸在SEQ ID NO:1的约1092位碱基到约1097位碱基插入一个NruⅠ限制位点:
Asn Trp Ser
AAC TGG TCG CGA ACA ACG GCC (SEQ ID NO:79)
Nru I
当进一步加工有该NruⅠ位点的构建体使具有上述的XcaⅠ位点时,产生一个编码切成平头的HCV-PRC E1结构蛋白的DNA分子,该结构蛋白有SEQ ID NO:2从约191残基到约327残基的氨基酸残基序列。用XcaⅠ和NruⅠ切割所得的构建体产生一个约414碱基对的DNA片段。然后根据标准方法,将上述54碱基对片段(用NarⅠ和SmaⅠ制备的)与该414碱基对片段平头末端连接,并将所得的约468碱基对片段插入到平头末端的表达载体中。所得的构建体包含框架中的全部编码区以产生一个融合蛋白,该融合蛋白包含在框架中融合190-327氨基酸残基于SEQ ID NO:2的388到393氨基酸残基。可以通过限制酶分析或DNA定序验证各个DNA片段的取向。
上述公开的内容假设所选择的表达载体包含所需DNA片段可以克隆进去的平头末端限制酶位点。但是,如果得不到上述位点,则可以加入将限制酶位点加到末端的接头来进一步修饰欲克隆的DNA末端。商业上可从,如New England Biolabs买到这些接头。检查所选择的被表达序列和表达载体以便确定哪个位点最适于克隆。一旦选定位点,随后进行操作以便保持用于所得构建体的适当读码。用这种方法,所得的肽的序列是正确的。
使用任何适当的方法,如磷酸三酯或磷酸三酯法都可以完成DNA分子的从头化学合成(参见Narang et al.,Meth.Enzymol.68:90(1979);美国专利No:4,356,270;Itakura et al.,Ann.Rev.Biochem.,53:323-56(1989);Brown et al.,Meth.Enzymol.,68:109,(1979);和Matteucci et al.,J.Am.Chem.Soc.,103:3185(1981),本文引述的现有技术均引入本文作为参考)。通过化学合成结构基因部分,通过用适当的碱基取代那些编码天然氨基酸残基的碱基,可以很简单地完成所需的修饰。通过首先合成相当于部分DNA分子的寡聚核苷酸,然后通过杂交和连结将该寡核苷酸装配在一起形成一个完整的DNA分子来制备DNA分子。上述方法也是本领域专业人员已知的,参见如:Paterson et al.,Cell 48:441-452(1987);和Lindley et al.,Proc.Natl.Acad.Sci.,85:9199-9203(1988),其中介绍在大肠杆菌中表达化学合成的基因来生产重组肽,中性白细胞活性因子。
可以用多肽领域专业技术人员已知的任何技术合成本发明的分离肽或融合蛋白。由于纯度,抗原特异性,没有副产物,容易生产及类似的原因,如固相Merrifield-型合成法这类合成化学技术是优选的,可以按照Merrifield et al.,在J.Am.Chem.Soc.,85:2149-2154(1963)和Houghten et al.,Int.J.Pept.Prot.Res.,16:311-320(1980)中描述的方法来完成。可以从J.M.Steward和J.D.Young的“Solid Phase Peptide Synthesis”,W.H.Freeman Co.,San Francisco,1969;M.Bodanszky et al.的“Peptide Sythesis”,John Wiley & Sons,Second Edition,1976和J.Meienhofer的“Hormonal Proteins and Peptides”,Vol.2,P.46Academic Press(NY),1983这些书中找到有关固相肽合成,以及从E.Schroder和K.Kubke,“The peptides”,Vol.1,Academic Press(New York)(1965)一书中找到有关经典的溶液合成的许多适用技术的优秀概括,上述每篇文献均引入本文作为参考。
在上述书中和J.F.W.McOmie的“Protective Groups in Organic Chemistry”,Plenum Press,New York.1973(该文献引入本文作为参考)中描述了在上述合成中可以使用的适当的保护基团。
另外可以以重组形式制备本发明的分离肽和融合蛋白。
由本发明提供的制备上述重组肽或融合蛋白的方法包括首先从培养包含宿主细胞(优选大肠杆菌细胞)的营养培养基开始,用表达HCV-PRC-Korean独特肽或融合蛋白的重组DNA分子转化所述的宿主细胞。将培养物保持一段足够长的时间以便被转化的细胞能够表达HCV-PRC-Korean独特肽或融合蛋白。
上述方法中所用的重组DNA(rDNA)分子包括人工连接到一载体上的本发明的DNA分子。优选本发明的rDNA在相容的宿主中直接表达本发明的HCV-PRC-Korean特有肽。在rDNA分子中所用的,优选的DNA分子是上文中描述的那些DNA分子。然后从培养物中回收被表达的肽或融合蛋白。
HCV-PRC包膜蛋白含有可将这些蛋白固着于细胞膜(如,内质网)上的粘连区并且使得很难回收被表达的包膜蛋白。HCV-PRC E1蛋白的粘连区在E1蛋白的羧基末端(SEQ ID NO:2的从约328残基到380残基)。HCV-PRC E2蛋白的粘连区定位于SEQ ID NO:2的从511残基朝向羧基末端的地方。
为了利于回收重组包膜蛋白,因此,优选缺失上述粘连区的重组包膜蛋白。一种制成切成平头的E1肽优选含有SEQ ID NO:2的从约191残基到约327残基的氨基酸残基序列。一种切成平头的E2肽优选含有SEQ ID NO:2的从约381残基到约511残基的氨基酸残基。
在SEQ ID NO:1中从约684位碱基到约1094位碱基显示编码切成平头的E1肽的核酸分子。在SEQ ID NO:1中从约1254位碱基到约1646位碱基显示编码切成平头的(无粘连区)E2肽的核酸分子。
“直接表达”的意思是只通过转译形成蛋白质的成熟多肽链,这与从较大的转译前体蛋白上蛋白水解裂解两个或多个末端氨基酸残基不同。
用本领域专业人员已知的标准方法,通过将载体与本发明的DNA分子人工连接在一起生产本发明的重组DNA分子。
本文所用的术语“载体”是指在细胞中能够自我复制的DNA分子,并能将其与另一DNA分子人工连接以便能够带动复制连接分子。典型的载体是质粒、噬菌体和类似物。能够直接表达分离肽或融合蛋白的载体本文称为“表达载体”。因此,重组DNA分子(rDNA)是一种含有天然情况下一般不在一起的至少两种核苷酸序列的杂交DNA分子。
与本发明的DNA片段人工相连的载体的选择直接取决于(如本领域专业人员已知的)所需的功能特性,如蛋白表达,被转化的宿主细胞这些现有技术中构建重组DNA分子的固有限制条件。然而,本发明提供的载体至少能够直接复制,并且最好也能表达包括在载体所人工连接的DNA片段中的重组肽结构基因。
在优选的实施方案中,本发明提供的载体包括一种原核复制子(ori),即在以此转化的原核宿主细胞,如细菌宿主细胞中,DNA序列有染色体外直接自我复制并维持重组DNA分子的能力。上述复制是现有技术中已知的。另外,这些包含原核复制子的实施方案一般也包括表达后可使用来转化的细菌宿主细胞具有药物抗性的一种基因。在这些载体中一般所用的细菌药物抗性基因是具有氨苄青霉素和四环素抗性的基因。典型的上述载体质粒是从Biorad Laboratories(Richmond CA)可得到的pUC8,pUC9,pBR322和pBR329。
包括原核复制子的那些载体也可以包括用以转化的细菌宿主细胞,如大肠杆菌中能够直接表达(转录和转译)编码中国分离种群NANBV肽基因的原核启动子。启动子是由可以结合RNA多聚酶并随后开始进行转录的DNA序列形成的一种表达控制元素。在包含能方便插入本发明DNA片段的限制位点的质粒载体中,一般提供与细菌宿主相容的启动子序列,插入本发明的DNA片段是方便的。从Pharmacia(Piscataway,NJ)可得到一种典型的载体pPL-λ。
具有用IPTG可诱导的细菌启动子的载体质粒是从Amersham(Arlington Heights,IL)得到的pTTQ质粒和从Pharmacia得到的pKK223-3质粒。其它的在原核细胞中用于生产克隆基因产物的表达载体是已知的并且是市场上可得到的。
从培养物中回收表达蛋白质的方法是现有技术已知的,并且包括用已知的生物化学技术如凝胶过滤,凝胶层析,超过滤,电泳,离子交换,亲和层析等等方法分离培养物中含蛋白质的部分。另外,也可使用免疫化学法,如免疫亲和,免疫吸附等方法。
按照上述的方法也可以以重组形式制备本发明的融合蛋白。
虽然可以用其它功能等同表达载体,但用上法中的优选表达载体pGEX-3X和pGEX-2T优选生产本文描述的融合蛋白。功能等同的表达载体包含一个可由IPTG诱导的用于在大肠杆菌中表达融合蛋白的表达启动子和一种这样的适宜构型,以便一旦将DNA片段插入载体中时,便能生产融合蛋白。市场上可得到的与本文所用的载体pGEX-3X和pGEX-2T功能等同的载体包括来自Promega(Madison,WI)的pGEMEX-1质粒载体(该载体能供T7基因10蛋白的氨基末端部分与被克隆的插入基因间产生融合),来自NewEnglemd Biolabs(Beverly,MA)的pMAL质粒载体(该载体可产生同由mal E基因编码的麦芽糖结合蛋白(MBP)的融合),以及由Pharmacia提供的产生与酶谷胱甘肽-S-转移酶(GST)融合的pGEX-3X和pGEX-2T质粒。
已经由Smith et al.在Gene 67:31-40(1988)中描述过pGEX-3X和pGEX-2T载体的构建和使用,该文献引入本文作为参考。
在一个特别优选的实施方案中,一种融合蛋白包含一种当附加的功能区人工连接到本发明的HCV-PRC-Korean特有肽上时的肽部分衍生GST。任何可启动载体如上文描述的载体pTTQ,pKK223-3,pGEX-3X,或pGEX-2T和类似的载体的可诱导启动子均可用于表达本发明的融合蛋白。因此,虽然pGEX-3X和pGEX-2T载体是被作为实例描述,但构建本发明的DNA分子并不限于上述载体,因为在一个实施方案中,本发明直接针对用于与GST融合的具有HCV-PRC-Korean特有肽的蛋白表达的rDNA而不侧重载体本身。
已经发展了各种经互补粘性末端人工连接DNA片段与载体的方法。例如,可以将互补同聚物系加到准备插入的DNA片段和载体DNA上。然后通过互补同聚物尾之间的氢键,载体与DNA片段便连接在一起形成重组DNA分子。
含一个或多个限制位点的合成接头提供了另一种连接DNA片段与载体的方法。一般,用噬菌体T4DNA聚合酶或大肠杆菌DNA聚合酶I(利用其3′-5′核外溶解(exonucleolytic)活性除去突起3′单链末端和用其聚合活性填平3′末端缺口的酶)处理由核酸内切酶限制消化产生的DNA片段。
因此这些活性结合产生了平头末端DNA片段。然后在催化平头末端DNA分子连接的酶,如噬菌体T4DNA连接酶存在的情况下,将平头末端片段与大量过量的接头分子一起培养。因此,反应的产物是在其末端带聚合接头序列的DNA片段。然后用适当的限制酶裂解这些DNA片段并将其与用能产生与这些DNA片段末端相容的末端的酶裂解的表达载体连接。
可以从包括International Biotechnologies,Inc.New.Haven,CN的许多商业上来源得到含各种限制性核酸内切酶位点的合成接头。
本发明也提供一种用本发明的重组DNA分子转化的原核宿主细胞。在转化宿主细胞中所用的优选的rDNA分子是本文前面所述的那些rDNA分子,并且优选能表达重组体或融合蛋白的rDNA。一种优选的转化细胞包含具有本文前述的优选DNA分子之一的rDNA分子。
优选的原核宿主细胞是细菌细胞,一般是大肠杆菌菌株,如可从Bethesda Research Laboratories,Inc.,Bethesda,MD得到的大肠杆菌菌株DH5。通过一般取决于所用载体类型的已知方法来完成用本发明的重组DNA分子转化适当的宿主细胞。关于原核宿主细胞的转化,参见,如Cohen et al.,Proc.Natl.Acad.Sci.USA,69:2110(1972);和Maniatis et al.,Molecular Cloning,A Laboratory Manual,2nd.Ed.Cold Spring Harbor Laboratory Cold Spring Harbor,NY(1989)。
可以通过已知的技术鉴定被成功地转化的细胞,即含有本发明的重组DNA分子的细胞。例如,可以分离作为单个菌落的由导入本发明的rDNA产生的细胞。可以收集,溶解来自这些菌落的细胞。并用Southern,J.Mol.Biol.,98:503(1975)或Berent et al.,Biotech,3:208(1985)描述的方法检测其DNA中rDNA的存在。
除可直接检测rDNA的存在外,当rDNA能够直接表达HCV-PRC-Korean特有肽或融合蛋白时,可以通过已知的免疫学方法鉴别用适当的rDNA转化的细胞。例如,用本发明的表达载体成功地转化的细胞产生表现出HCV-PRC和朝鲜分离种群抗原性的肽。收集估计被转化过的细胞样品并使用对该抗原特异的抗体检测HCV-PRC-Korean特有肽的存在,将在下文进一步描述所述的抗体。
因此,除了被转化的宿主细胞本身外,本发明也提供一种在营养培养基中的这些细胞的培养物,优选单克隆(均质克隆)培养物,或从单克隆培养物衍生的培养物。最好是,该培养物也包含表现出HCV-PRC抗原性的肽或蛋白质。
用于培养被转化宿主细胞的营养培养基是现有技术已知的并可从几种商业来源得到。
本发明的分离HCV-PRC-Korean特有核酸,肽和融合蛋白分子作诊断和治疗剂使用。
d.核酸探针
可以将前面所述的HCV-PRC-Korean特有核酸分子用作检测HCV-PRC和Korean NANBV分离种群核酸分子存在的杂交探针。
本文所用的术语“探针”是一种从核酸限制消化纯化的或合成生产的核苷酸碱基序列(即,聚核苷酸),优选长约18到200个核苷酸,它有一个与在所研究基因中存在的预定特异性核酸序列(即靶核酸)基本上互补的核苷酸碱基序列。
聚核苷酸探针必须足够长以便能够在杂交条件下与在所需基因组中存在的特异核酸序列杂交。聚核苷酸探针的准确长度取决于包括杂交温度和所探测的核苷酸序列在内的许多因素。例如,取决于靶序列的复杂性,虽然聚核苷酸探针可含较少的核苷酸,但它一般含15到25或更多的核苷酸(Studier et al.,Proc.Natl.Acad.Sci.USA.86:6917-21(1989))。通常短的聚核苷酸探针需要较低的温度以便与靶序列形成足够稳定的复合体。
在一个优选实施方案中,聚核苷酸探针有约18个核苷酸的长度。
“基本互补”和其语法等同物是指在主体聚核苷酸探针和所研究基因中存在的特异核酸序列之间有足够的核苷酸碱基序列相似性,在杂交条件下,所述的探针与所述的特异的核酸序列杂交并形成由探针和特异序列组成的双链。
因此,虽然聚核苷酸探针序列不一定反映靶序列的精确序列,但它与靶序列有足够的互补性以便区别靶序列和非靶序列。为了与来自NANBV的HCV-PRC核酸分子和朝鲜分离种群的核酸杂交而不与来自其它NANBV分离种群的核酸杂交,最好是探针与SEQ ID NO:65或SEQ ID NO:66的核苷酸碱基序列至少是90%互补。例如,可以把一个非互补聚核苷酸连接到探针的一端,而探针序列的其余部分基本上与靶序列互补。上述的非一互补聚核苷酸可以编码核酸内切酶限制位点或蛋白质结合位点。
另外,可以将非互补碱基或较长的序列分散到探针中,提供与靶链序列有足够互补性的探针序列以便在杂交条件下能用其进行非随机杂交并形成杂交产物。
为了达到最大效率以单链形式提供聚核苷酸探针,但另外也可是双链的。如果是双链的,在用于杂交制备杂交产物前,先处理聚核苷酸探针以便分开它的链。优选探针是聚脱氧核糖核酸。
本发明的聚核苷酸探针用在杂交方法中以检测身体样品中HCV-PRC-Korean特有核酸的存在。该方法通常包括a)将身体样品与本发明的聚核苷酸探针混合形成含水的杂交混合物;b)将水杂交混合物在杂交条件下保持一段足够长的时间,身体样品中的任何HCV-PRC-Korean特有核酸能够与混合的聚核苷酸探针杂交以形成杂交产物;和c)检测形成的任何杂交产物的存在,并由此检测出身体样品中HCV-PRC-Korean特有核酸分子的存在。
只要样品处于与核酸杂交反应相容的有关纯度和浓度形式,被检测的HCV-PRC-Korean特有核酸序列(即靶核酸序列)可以存在于任何含核酸的样品中。将核酸分离到适于杂交的程度一般是已知的并可通过各种方法完成。例如,可以从包括身体组织如皮肤,肌肉,头发等和体液如血液、血浆、尿、羊水、脑脊髓液等各种含核酸的样品中分离出核酸(参见如,Maniatis et al.,Molecular Cloning:A Laboratory Manual,Cold Epring Harbor Laboratory(1982);和Ausubel et al.,Current Protocols in Molecules Biology,John Wiley和Sons(1987))。
在所用的方法中,将杂交反应混合物在反应条件下保持一段足够长的时间,使聚核苷酸探针与样品中的互补核酸序列杂交形成杂交产物,即含探针和靶核酸的复合体。
当与保持时间一起用时,短语“杂交条件”和它的语法等同物表示使杂交反应混合物(在上下文中指混合物中的反应和伴随试剂的浓度)经受的时间、温度和pH值条件,要足以使聚核苷酸探针与靶序列退火,一般形成核酸双链。上述完成杂交所需的时间、温度和PH条件是现有技术已知的并取决于用于杂交的聚核苷酸探针长度,聚核苷酸探针和靶序列之间的互补程度,聚核苷酸中的鸟嘌呤和胞嘧啶的含量,所需杂交的严紧度,以及影响杂交反应动力学的杂交反应混合物中存在的盐或其它试剂。为给定的杂交反应混合物选择最佳杂交条件的方法是现有技术中已知的(参见,Maniatis et al.,Molecular Cloning,Cold Spring Harbor Laboratory,Cold Spring Harbor,N.Y.(1982),p388)。
用相似的序列长度,那么缓冲盐浓度和温度则提供适用的变量以此通过杂交技术来评估序列相同性(同源性)。例如,如果有至少90%的同源性,则是在68℃,用20xssc稀释的6xscc这样的缓冲盐(Maniatis et al.,上文的p447)条件下完成杂交的。最后Southern印迹洗涤所用的缓冲盐可在低浓度,如0.1xssc使用,并在相对温度较高如68℃,在这种条件下两个序列形成杂双链(杂交)。上述杂交和洗涤条件一起使用叫作高严紧度条件或高严紧条件。
在杂交两个享有至少约80%同源性的序列时,可以适度地使用高严紧度条件。这里指在约50-55℃温度,用6xssc完成杂交。最后的洗涤盐浓度为约1-3xssc,而温度为约60-68℃。将这些杂交和洗涤条件称为适度的高严紧度条件。
可用低严紧度条件杂交两个享有至少40%同源性的序列。这里指在40-50℃温度,用6xssc杂交,在40-60℃温度,最后的洗涤缓冲盐浓度为6xssc。将这些杂交和洗涤条件称作低严紧度条件。
优选的用于检测HCV-PRC-Korean特有核酸的本发明的杂交方法使用高严紧度条件。
正如已知的,可以用均质或异质模式完成杂交。均质杂交反应完全发生在溶液中,其中,聚核苷酸探针和欲杂交的核酸序列(靶序列)都以可溶的形式存在于溶液中。异质反应涉及使用一种基质,或者聚核苷酸探针,或者靶核酸与之结合,该基质在反应介质中不溶解。例如,可以将被检测的身体样品接到固体基质上并进行原位杂交。
一般在以组织切片形式的身体样品上进行原位杂交,所述组织切片的厚度在约1微米到约100微米的范围,优选约1微米到25微米,更优选约1微米到约10微米。可以用市场上可得到的恒冷切片机制备上述样品。
另外,在Southern印迹方法中广泛使用异质模式,其中在限制酶消化后将基因组DNA电泳,接着首先将电泳的DNA片段变性,然后转移到不可溶的基质上。在该印迹方法中,然后聚核苷酸探针与含互补核酸(靶)序列的固定的基因组核酸杂交。
还有,可以在基因文库的筛选过程中广泛使用异质模式,其中,将许多菌落,通常为含质粒的细菌或含λ噬菌体的细菌放在平板上,培养及在不溶基质上形成克隆的核酸文库的印迹。然后将印迹文库与聚核苷酸探针杂交以鉴定含所需核酸片段的细菌菌落。
典型的异质杂交反应包括用玻璃片,硝化纤维纸和类似的物质作为固定含靶核酸片段的固体基质。
对于如将分离的mRNA反转录形成cDNA,双脱氧定序以及其他的第一步是聚核苷酸杂交的使用引物延伸反应的方法来说,均质杂交反应也是优选的。在经多聚酶链反应(PCR)扩增特异核酸序列中,均质杂交反应是特别优选的。
当含靶序列的核酸是双链(ds)形式时,在进行杂交反应前,最好首先将dsDNA变性,如通过加热或碱处理。在与准备杂交的聚核苷酸混合前或在聚核苷酸与dsDNA混合后完成dsDNA的变性。如果聚核苷酸本身是双链分子时,它也可以在杂交反应混合物混合前变性或可以与靶序列的dsDNA同时变性。
首先进行上述的杂交反应以形成杂交产物,然后检测形成的杂交产物的存在,由此检测出含核酸的样品中特定核酸序列的存在来完成特定靶核酸序列的检测方法。
含核酸的样品可以是身体组织或体液,可按杂交反应混合物前面描写的方法制备。
可通过各种方法检测在杂交反应中形成的杂交产物。虽然本文公开了有关杂交产物检测的优选的实施方案,但应理解对于本领域专业人员来说显而易见的其它已知检测方法也适用于本发明的方法和有关诊断系统。
在检测特定核酸序列存在的方法中,聚核苷酸探针包括一个标记或指示基团,这样就使得有探针存在于其中的杂交产物成为可检测之物。一般上述标记包括放射性原子,化学修饰的核苷酸碱基,和类似物。
将放射性元素人工连接到聚核苷酸探针上或作为聚核苷酸探针的一部分为便于杂交产物的检测提供有用的方法。典型的放射性元素是产生β射线的元素。产生β射线的元素,如3H,14C,32P,和35S代表一类产生β射线辐射的放射性元素标记物。用DNA多聚酶通过将带放射标记的核苷酸,通过酶促掺到核酸中,然后将被标记的核酸变性以形成放射性标记的聚核苷酸探针,这样就完成了制备放射性聚核苷酸探针。
其它的放射标记的聚核苷酸探针是化学修饰的含金属复合剂,含生物素基团,荧光化合物等等。
一种有用的金属复合剂是由镧和芳族β-二酮形成的镧螯合物,经螯合形成的化合物如EDTA类似物将镧结合到核酸或聚核苷酸上,以便形成荧光镧复合物(参见美国专利No.4,374,120和No.4,569,790和公开的专利申请No.EP0139675和No.WO87/02708)。
已有人描述过生物素或吖啶酯标记的寡聚核苷酸和其在聚核苷酸中的应用(参见美国专利No.4,707,404,公开的专利申请EP0212951和欧洲专利No.0087636)。有用的荧光标记化合物包括荧光素,若丹明,Texas Red,NBD等。
在杂交产物中若有标记核苷酸存在则杂交产物本身便被标记,因此可以将其与被检测样品的其它核酸区别开。检测杂交产物中标记物的存在并由此检测到杂交产物的存在,一般涉及从没有与杂交产物杂交的聚核苷酸探针中分离杂交产物。
从杂交产物中分离单链聚核苷酸如非杂交标记聚核苷酸探针的技术是已知的,一般涉及根据其化学性质从非单链核酸中分离出单链核酸。使用异质杂交模式涉及的分离技术更常见的是通过洗涤将非杂交探针与结合到固体基质上的杂交产物分离开来。如Southern印迹技术,其中固体基质是硝化纤维素纸,标记物是32P(Southern J.Mol.Biol.98:503(1975))。
在另一实施方案中,杂交产物检测步骤包括检测扩增的核酸产物。被扩增的核酸产物是现有技术中已知的扩增过程的产物,该扩增过程被称为多聚酶链反应(PCR)。
Mullis et al.的美国专利No.4,683,195和No.4,683,202;和PCR Technology,Erlich,ed.,Stockton Press(1989);Faloona et al.,Methods in Enzymol.,155:335-50(1987);和Polymerase Chain Reaction,Erlich et al.,eds.cold Spring Harbor Laboratories Press(1989)等文献中描述了有关扩增特定核酸序列的方法和系统。
e.接种物,疫苗和抗体
可以将本发明的分离HCV-PRC-Korean特有肽和融合蛋白用作制备抗体的免疫原,所述的抗体与NANBV的HCV-PRC和朝鲜分离种群发生免疫反应而不与NANBV分离种群HCV-1,HCV-J,HCV-J1,HCV-J4,HCV-BK,HCV-JH或HCV-Hh发生免疫反应。
一般用含本发明的HCV-PRC-Korean特有肽的接种物免疫接种哺乳动物来产生本发明的抗体,所述特定肽是(ⅰ)一种有从6到约511氨基酸残基的含SEQ ID NO:17氨基酸残基序列的分离肽,其其余残基限定NANBV结构蛋白或多蛋白,或(ⅱ)一种包括SEQ ID NO:17的氨基酸残基序列的融合蛋白,并由此在哺乳动物中诱发对HCV-PRC和朝鲜分离种群抗原有免疫特异性的抗体分子。然后从哺乳动物体中收集该抗体分子并通过已知技术如DEAESephadex将抗体分子分离到所需的程度以得到IgG组份。
本文所用的以各种语法形出现的词“接种物”是描述一种含本发明HCV-PRC-Korean特有肽的作为活性组份的组合物,用于制备与HCV-PRC和朝鲜分离种群抗原具免疫活性的抗体。
制备并使用接种物以生产本发明的抗体的方法在很大程度上类似于本文对疫苗的描述,就疫苗来说也是用来诱导产生抗体的,是制备并使用接种物的例子。正如已知道的,其主要的不同在于接种物是用于动物而不是人类。
为了增强抗体的特异性,可以用固相粘合的免疫接种中国分离种群NANBV结构蛋白(即衣壳或包膜蛋白),通过免疫亲和层析法纯化抗体。将抗体与固相粘合的中国分离种群NANBV结构蛋白接触一段时间,使中国分离种群NANBV结构蛋白足以与抗体分子发生免疫反应以形成固相粘合的免疫复合体。通过标准技术从复合体中分离被结合的抗体。
为了生产一种不与C-100-3抗原或非中国非朝鲜NANBV分离种群发生免疫反应的抗体分子,可用免疫吸附法除去不需要的免疫特异性物质。免疫吸附法除去免疫特性一般是已知的,涉及首先将抗体分子与其上粘合有一种或多种非中国,非朝鲜NANBV分离种群抗原的固相相接触以形成一种免疫吸附混合物。比较好的是,在免疫吸附混合物中,按不希望的免疫特异性组合物所占抗体的比例来说,固相中拥有过量的HCV-PRC或朝鲜分离种群抗原。
然后在免疫反应条件下将免疫吸附混合物保持一段时间,使其足以在固相中形成免疫复合体。然后将液相和固相分开,保持液相,不需要的抗体分子被吸附到固相上。
特别优选的是一种含中国分离种群特异抗血清的抗体分子,该抗体分子是用中国分离种群,或最好用本发明的HCV-PRC-Korean特有肽免疫接种形成的,本发明的HCV-PRC-Korean特有肽如本文所定义的,具只有NANBV中国和朝鲜分离种群才有的氨基酸序列。然后正如本文所述,免疫吸附所生产的抗体分子除去了对中国和朝鲜分离种群以外的NANBV分离种群具免疫活性的抗体。
优选的抗体分子与在HCV-PRC上的HCV-PRC-Korean特有的抗原决定基发生免疫反应。优选的HCV-PRC-Korean特有的抗原决定基是一种HCV-PRC-Korean特有肽如SEQ ID NO:17的氨基酸残基序列。
尤其在本发明的诊断方法和系统中可以使用这样生产的抗体以便如下文所述检测在身体样品中存在的NANBV的HCV-PRC或朝鲜分离种群。
优选的抗体是单克隆抗体其使用方法可以用本文所公开的用于本发明抗体的同样方法。
一般单克隆抗体是由称作杂交瘤的单个细胞克隆生产的抗体组成的,该杂交瘤仅分泌(产生)一种抗体分子。杂交瘤细胞是通过将一种生产抗体的细胞与骨髓瘤或其它自我永存的细胞系融合形成的。首先由Kohler和Milstein,在Nature 256:497(1975)中描述过制备上述抗体的方法,该文献引入本文作为参考。可以将这样制备的杂交瘤上悬物加以筛选,择出对HCV-PRC或朝鲜分离种群抗原具免疫反应活性者,例如HCV-PRC-Korean特定肽用于接种诱导产生抗体细胞。生产单克隆抗体、杂交瘤细胞和杂交瘤细胞培养物的其它方法也是已知的。
本发明也提供生产本发明的单克隆抗体的杂交瘤细胞,和含杂交瘤细胞的培养物。
可以用本发明的分离HCV-PRC-Korean特有肽进一步制备抗HCV-PRC或朝鲜分离种群NANBV感染的疫苗。
本文以各种语法形式出现的词“疫苗”,它描述一种含一种或多种本发明的HCV-PRC-Korean特有肽作为活性成份及药物学上适用的赋形剂的接种物,以诱导产生对NANBV HCV-PRC和朝鲜分离种群具免疫反应活性的抗体,且最好在哺乳动物宿主中诱导抗HCV-PRC或Korean分离种群的活性免疫性。
因为一般将接种物用来诱导特异的抗体,所以最好一种接种物含一种仅含HCV-PRC-Korean特有肽而没有其它肽的HCV-PRC-Korean特有肽(正如融合蛋白中所述)。因此,优选的接种物包含一种本发明的HCV-PRC-Korean特有肽,该肽包括含在SEQ ID NO:17或SEQ ID NO:64中的氨基酸残基序列。
一种接种物可以含一种或多种本发明的HCV-PRC-Korean特有肽作为活性成份。由于可以将该肽用来定义一种小的且特有的HCV-PRC或Korean分离种群多蛋白的抗原决定基,所以上述接种物特别用于生产一种与NANBV HCV-PRC和朝鲜分离种群有免疫反应活性的抗体。上述抗体是如本文所定义的HCV-PRC-特异的。
另外,还提供多价接种物,它含有一个以上HCV-PRC-Korean特定肽的融合蛋白,并用于诱导对不同抗原特异性的抗体类型。即本文所述的第一种HCV-PRC-Korean特有肽,或来自HCV的不同菌株的相应区域和在不同病原体上存在的另外的抗原。优选的另外的抗原是一般从NANBV-感染的患者中同时发现的病原体中衍生的,即乙型肝炎病毒,人类免疫缺陷病毒(HIV)等。
相关实施方案提供两种致免疫的HCV-PRC-Korean特有的肽,这两种肽分别来自不同的HCV-PRC区域以便单个接种物便能诱导对编码多肽的HCV-PRC或朝鲜分离种群两个区域特异的抗体。
制备一种包含肽作为活性成份的接种物是现有技术已知的。一般将上述接种物制备成可注射的液体溶液或悬浮液。可以在注射前将适用于溶液或悬浮液的固体形式配制成液体。也可将制剂乳化。
将活性致免疫成份溶解,分散或混合在药物学上可接受的且与活性组份相容的赋形剂中是已知技术。短语“适用于人的”和“药物学上可接受的”(生理学相容的)指当给人施用时,分子实体和组合物一般不产生过敏性的或相似的不适反应,如胃不适,头晕等。适宜的赋形剂随试图采用的应用形式而变化很大,可以是如含盐、磷酸缓冲盐(PBS),右旋糖,甘油,乙醇等或其结合物的含水溶液。另外,如果需要,接种物可含少量的可增强接种物效果的辅助物质如润湿剂或乳化剂,PH缓冲剂,矿物油,载体或辅助剂。一个优选的实施方案包含至少约0.01%到约99%的作为活性成份的HCV-PRC-Korean特有肽或融合蛋白,一般每毫升(ml)赋形剂含约10到200μg的活性成份。
为了便于在被免疫的哺乳动物中产生免疫应答,接种物可含有与载体,或抗原载体相连的本发明的HCV-PRC-Korean特有肽。
可将一种或多种附加的氨基酸残基加到特有肽的氨基-或羧基-末端以便有助于将该肽与载体相连(如果它在肽上不存在)。在肽的氨基-或羧基-末端加半胱氨酸特别有助于经二硫键形成多聚物。然而,也可以使用现有技术中已知的制备共轭物的其它方法。另外的连接方法的例子包括用Michael加成反应产物,二醛类如戊二醛[Klipstein et al.,J.Infect Dis.,147:318-326(1983)]等,或用碳化二亚胺技术,如用水溶的碳化二亚胺形成与载体相连的酰胺。
有用的载体是现有技术中已知的,并且一般是蛋白质本身。此类载体的例子是键孔(Keyhole)域形血兰蛋白(KLH),麻仁球蛋白,甲状腺球蛋白,白蛋白如牛血清白蛋白(BSA)或人血清白蛋白(HSA),红血细胞如羊红血细胞(SRBC),破伤风类毒素,霍乱类毒素以及聚氨基酸如聚(D-赖氨酸:D-谷氨酸)等等。
如现有技术中已知的,通常通过中间体(连接基团),将HCV-PRC-Korean特有肽与其载体结合是很有利的。如上文指出的,戊二醛就是这样一种连接基团。然而,当用半胱氨酸时,中间的连接基团最好是间-马来酰亚胺苯氧基N-羟基琥珀酰亚胺(MBS)。
另外,通过酯-胺交换反应,可将MBS首先加到载体中,此后,通过加进嵌入巯基如硫羟乙酸(CH3COSH)交联马来酰亚胺双键而加成。酰基嵌入基团裂解后,在被解封的连接基团硫醇和蛋白质半胱氨酸残基的硫醇间便形成二硫键。
可以用抗原载体增强或促进免疫应答(免疫加强),或通过使用与载体结合的接种物控制免疫应答类型(参见如,美国专利Nos.4,599,231;4,599,230和4,683,136和Milich et al.的说明,和美国专利Nos.4,818,527和4,882,145中Thornton et al.的说明)。
免疫增强作用的其它方法包括使用脂质体和免疫刺激复合物(ISCOM)颗粒。脂质体的特有多样性取决于它们大小的可调性,表面特征,脂类组合物和它们可以接纳抗原的方法。形成脂质体的方法是现有技术中已知的(参见,如,Prescott,Ed.,Methods in Cell Biology,Vol.XIV,Academic Press,NY(1976)P.33et seq.)。在ISCOM颗粒中,笼形基质包括Quil A,从一种南美树的树皮中提取的。通过与基质表面疏水相互作用而相连的抗原蛋白或肽,激发出强烈的免疫应答。
载体的选择更多地取决于免疫原的最终使用,而不是免疫原的抗原决定基部分,并且是根据不特别包括在本发明中的标准。例如,如果将一种接种物用于动物,则应选择特别对动物不产生不适反应的载体。
应当理解除上文中所述的载体成份外,药物学上可接受的配方可包括适当的一种或多种其它载体成份如稀释剂,缓冲液,粘合剂,表面活性剂,增稠剂,润滑剂,防腐剂(包括抗氧化剂)等物质。以及为了提供与预定受体的血液等渗的配方所包括的物质。一般即使在接种物的制造中使用了无菌技术,也要加入防腐剂如硫柳汞(以1∶5000稀释1%溶液)以防止微生物污染的危险。
习惯上,接种物是胃肠外给药的,通过注射,如皮下或肌肉内注射。适用于其它给药模式的其它制剂包括栓剂,在某些情况下可为口服制剂。对于栓剂来说,可包括传统的粘合剂和载体,如聚二醇或甘油三酯;以含0.5%到10%,最好1-2%的活性成份的混合物来制备上述栓剂。口服配方包括下面通常使用的赋形剂,如甘露糖醇,乳糖,淀粉,硬脂酸镁,糖精钠,纤维素,碳酸镁等。组合物采取溶液,悬浮液,片剂,丸剂,胶囊,持续释放制剂或粉剂的形式,并含10%-95%,最好25-70%的活性成份。
可将HCV-PRC-Korean肽按中性或盐形式配制接种物。药物可接受的盐包括酸加成盐(用蛋白质或抗原的游离氨基形成的),可与无机酸如盐酸或磷酸形成,或者与有机酸如乙酸,草酸、酒石酸、扁挑酸等形成。也可以用无机碱如氢氧化钠,氢氧化钾,氢氧化铵,氢氧化钙,或氢氧化铁,或有机碱,如异丙胺,三甲胺、组氨酸、普鲁卡因等与游离羧基形成盐。
以与剂量配方相容的方式施用接种物,并以能致免疫和能有效诱导免疫应答的量给药。当作为疫苗使用时,为了达到所需的完全保护免疫,施用的接种物量取决于被免疫的主体,主体的免疫系统合成抗体或诱导细胞介导的应答的能力。所需服用的精确的活性组分量取决于专业人员的判断并随个体的不同而异。但一般限定一个适用于大多数人的量。适宜的剂量范围是对每个成年人来说,每单个免疫接种量,从约10微克(μg)到数毫克(mg),优选约10-500微克更优选约100微克活性成分这样一个数量级。开始给药和加强注射的适宜方式是可变的,典型方式是第一次给药后间隔2-6周接着再注射一次,或以其它方式给药。
接种物也可以包括作为赋形剂一部分的辅助剂。在实验室哺乳动物中所用的辅助剂如完全Freund′s辅剂(CFA),非完全Freund′s辅剂是现有技术中已知的。也可以使用药物学上可接受的辅剂如明矾。作为实例的一种接种物含有1ml磷酸缓冲盐水(PBS),该磷酸缓冲盐包含约50到200μg吸附在约0.5mg到约2.5mg明矾,或0.1%到1%Al(OH)3上的HCV-PRC-Korean特有肽。一种优选的接种物含有1ml包含100μg吸附在2.5mg明矾载体上的HCV-PRC-Korean特有肽的PBS。
施用接种物后,使接受接种物的哺乳动物或人持续一段时间,足以使哺乳动物的免疫系统通过产生对免疫原具免疫活性的抗体而产生免疫应答,正如已知的,这段时间一般为2到8星期。
可以将本发明的分离HCV-PRC-Korean特有肽,抗-HCV-PRC抗体和抗-Korean分离种群抗体用于检测HCV-PRC和Korean分离种群NANBV感染的诊断系统和诊断方法。
f.诊断系统
药剂盒形式的诊断系统包括:足够用于上述至少一种检测方法的一定量的本发明HCV-PRC-Korean特有肽或融合蛋白,或本发明的抗-HCV-PRC或抗-Korean分离抗体组合物,这种试剂是独立包装的。一般还包括这种试剂的使用说明。
“使用说明”一般包括具体的描述内容,要描述试剂的使用浓度或至少一种检测方法参数,如试剂的相对用量,所要混合的样本,试剂/样本混合保持的时间长短,温度、缓冲条件等等。
在优选方案中,本发明的诊断系统还包括一种标记物,或一种能够指示含有HCV-PRC或Korean分离抗原、重组蛋白、抗-HCV-PRC或Korean分离抗体的复合物形成的指示物质。
如本文所述,术语“标记物”和“指示物质”不管以什么不同语法形式使用,都是指涉及到直接或间接产生一种可检测的信号以表示复合物存在的单个元素或分子。任何标记物或指示物质都可以连接到或掺入到一种试剂中,如抗体或单克隆抗体,或者是单独使用,而且这些元素或分子可以单独使用或与其他试剂联合使用。这些标记物本身在临床诊断化学中是公知的,只有与新蛋白、方法和/或系统一起使用时才构成本发明的一部分。
标记物可以是一种荧光标记试剂,它可通过化学方法结合到抗体或抗原上,而不使其变性,以形成一种可用作免疫荧光示踪剂的荧光染料。合适的荧光标记试剂是荧光染料如荧光素异氰酸盐(FIC),荧光素异硫兰晶石(FITC),5-二甲胺-1-萘磺酰氯(DANSC),四甲基若丹明异硫氰酸盐(TRITC),丽丝胺,若丹明8200磺酰氯(RB200SC),一种螯合镧素元素键合物(如,铕,铽,钐)等。对免疫荧光分析技术的描述见Deluca,“Immunofluorescence Analysis”,in Antibody As a Tool,Marchalonis,et al.,eds.,John Wiley and Sons,Ltd.,pp.189-231(1982),列入本文作为参考。
优选方案中,标记物是酶,如辣根过氧化物酶(HRP),葡萄糖氧化酶,碱性磷酸酶等。在这种主要标记物是酶的情况下,例如是HRP或葡萄糖氧化酶,还需要其他的试剂以便看到抗体-抗原复合物(免疫反应剂)的存在。用于HRP的其他试剂包括过氧化氢和一种氧化染料前体如二氨基联苯胺。可与HRP一起使用的其他试剂是2,2′-连氮基-二-(3-乙基-苯噻唑啉-6-磺酸)(ABTS)。
放射性元素也可以用作标记试剂,本文对它们的使用进行了描述。有代表性的放射性标记试剂是可产生γ射线的放射性元素。本身可以释放γ射线的元素,如124I,125I,128I,131I,和51Cr代表了一类可产生γ射线的放射性元素族。特别优选的是125I。另一组有用的标记物是本身可释放正电子的元素如11C,18F,15O和13N。释放的正电子在遇到动物体内存在的电子时可产γ射线。另一种有用的物质是β放射性物质如111In,3H,35S,14C,或32P。
现有技术中还描述了其他的标记物,它们都适用于本发明的诊断学。例如,可以利用分子对之间存在的特异亲和性,一个分子可作为标记物亲和到特异性结合剂上,另一个分子做为工具检测存在的物质。有代表性的分子对是生物素:抗生物素蛋白,其中生物素是标记物,而过氧化物酶:抗过氧化物酶(PAP)这一对中,则过氧化物酶是标记物。
标记物的联结,也即多肽和蛋白质的标记在本领域中是公知的。例如,可以通过代谢掺合含放射性同位素的氨基酸,使其在培养基中作为一种成份,来标记由杂交瘤产生的抗体分子。例如,参见Galfre et al.,Meth.Enzymol.,73:3-46(1981)。通过活化功能团使蛋白连接或偶合的技术尤其适用。例如,见,Aurameas,et al.,Scand.J.Immunol.,Vol.8 Suppl.7:7-23(1978),Rodwell et al.,Biotech.,3:889-894(1984),和美国专利号4,493,795。
诊断系统还可以包括(最好是分别包装)一种特异性结合试剂。“一种特异性试剂”是指一种选择性结合某种试剂的分子实体,随后可以和本发明的产物发生反应,但它本身并不是本发明的蛋白表达产物。有代表性的特异性结合试剂是抗体分子如抗人体IgG或抗人体IgM,补体蛋白或其片段,蛋白质A等等。优选的特异性结合试剂能够结合欲检测的抗-HCV-PRC或抗-Korean分离抗体,此时这种抗体做为免疫复合物的一部分存在。
在一个优选方案中,标记特异性结合试剂。不过,如果诊断系统包括一种特异性试剂未被标记,一般这种试剂被用作放大物质或反应物。在这些方案中,当放大物质被结合到含有一种反应物的复合物上时,标记的特异性结合试剂能特异性地与放大物质结合。
本发明的诊断药盒可以“ELISA”的形式使用,以检测体液样本如血清、血浆和唾液中抗体的存在及含量。“ELISA”是指酶联免疫吸附试验,它利用被结合到一种固相载体上的抗体或抗原以及酶-抗原或酶-抗体结合物来检测和定量样本中存在的抗原或抗体含量。对ELISA技术的描述见《基础和临床免疫学》的第4版第22章,1982年Lange Medical Publications of Los Altos,CA出版,作者D.P.Sites et al.,并参见美国专利号3,654,090;No.3,850,752,和No.4,016,043,所有的上述文献引入本文作为参考。
因此,在优选方案中,可将本发明的HCV-PRC-Korean特异性肽、融合蛋白、抗-HCV-PRC抗体或抗-Korean分离抗体亲合到一种固相基质上形成一种固相载体,将其分别包装进本主题诊断系统中。
一般是从水培养基中通过吸附把反应物亲合到固相基质上,当然也可以使用本领域熟练技术人员公知的其他亲合方式。
可用的固相基质在现有技术中是公知的。这些物质包括以SEPHADEX商标从Pharmacia Fine Chemicals公司(Piscataway,NJ)可买到的交联葡聚糖;琼脂糖,可从Abbott实验室(North Chicago,IL)得到的直径大约1微米至5毫米的聚苯乙烯珠;聚氯乙烯,聚苯乙烯,交联聚丙烯酰胺,硝基纤维素或尼龙基质编织物,如薄片,条或棒;或管、平板或微升平板的孔,例如用聚苯乙烯或聚氯乙烯制作的。
本发明还包括一种用于检测身体样本中HCV-PRC或Korean分离核酸存在的诊断系统,方法是根据本发明所述的方法用本发明的多核苷酸与HCV-PRC-Korean特定核酸杂交。
用于检测中国或朝鲜分离NANBV核酸存在的试剂盒形式的诊断系统包括足够用于至少一次检测的本发明分离的HCV-PRC-Korean特定核酸分子,做为一种单独包装的反应物。一般还包括这种包装的反应物的使用说明。
在优选方案中,该方案的诊断系统还包括一种标记物或能够表示含有中国分离NANBV核酸的杂交复合物形成的指示剂。
本发明所述任何诊断系统的HCV-PRC-Korean特定肽,融合蛋白、抗-HCV-PRC抗体,抗-Korean分离抗体,标记的特异性结合试剂或放大反应物可以是溶液,如一种分散液或是一种基本干燥的粉末,如冻干粉末。假如指示剂是一种酶,系统中还可以分开包装提供该酶的底物。在这种诊断系统中还可以包括一种固相载体如前面所述的微升平板和一种或多种缓冲液,这些成份都要分开包装。
本发明诊断系统相关的所述包装物是诊断系统中惯用的。这些包装物包括玻璃、塑料(如聚乙烯、聚丙烯和聚碳酸酯)瓶,小药瓶、塑料和衬底的塑料薄膜口袋和类似物。
g.诊断方法
本发明的诊断方法是指检测躯体样本中的抗-HCV-PRC抗体,抗Korean分离抗体,HCV-PRC结构抗原,或Korean分离NANBV结构抗原。本发明方法使用本发明的一种HCV-PRC-Korean特定肽、融合蛋白、抗-HCV-PRC抗体或抗-Korean分离抗体作为一种免疫化学反应物,形成一种免疫反应产物,这种产物的生成量与样本中所要检测的物质含量直接或间接相关。本领域中的熟练技术人员可以看出,有很多公知的临床诊断化学方法中可以使用本发明的一种免疫化学反应物形成一种与躯体样本中特定抗体或抗原含量相关量的免疫反应产物。
可以使用各种异源或同源方案,具竞争性或不具竞争性的,来完成本发明的检测方法。因此,尽管本文描述了有代表性的方法,但本发明并不受此限制。
为了检测病人抗-HCV-PRC或抗-Korean分离抗体的存在,将体内样本特别是体液样本如病人的血液、血浆、血清、尿液或唾液在生物检测条件下与本发明的一种HCV-PRC-Korean特定肽或融合蛋白混合接触,所说的肽或融合蛋白是:(ⅰ)一种具有6至大约511个氨基酸残基的分离肽,这些氨基酸含有SEQ ID NO:17氨基酸残基序列,其余的残基定义NANBV结构性蛋白或多蛋白,或(ⅱ)一种包括SEQ ID NO:17的氨基酸残基序列的融合蛋白,形成一种免疫反应混合物。然后将混合物置于生物检测条件下一段时间以足够形成HCV-PRC或Korean分离NANBV抗原分子-抗体分子免疫反应产物(免疫复合物)。按照本发明所述检测该免疫反应产物的存在,最好也测定含量。免疫反应产物的存在表明样本中存在有抗-HCV-PRC或抗-Korean分离抗体。
在一个优选方案中,按照本文所述用一种特异性结合反应物检测HCV-PRC-Korean特定肽与病人抗体之间形成的免疫反应产物的存在。例如,首先将免疫反应产物与一种标记的特异性结合试剂混合形成一种标记混合物。标记的特异性结合试剂包括一种特异性结合试剂和一种本文所述的标记物。然后将标记混合物在适合于特异性结合的条件下保持一段时间,足以使存在的任何免疫反应产物与标记的特异性结合试剂结合,形成一种标记产物。测定有形成的标记产物存在(最好测定含量),以表明免疫反应产物的存在及含量。
在一个优选方案中,本发明诊断方法的实施方式是,形成免疫反应产物,并在固相中进行检测,方法如本发明的诊断系统所述。
因此,在一种优选诊断方法中,将HCV-PRC-Korean特定肽亲合到一种固相基质上形成固相。优选该特异性结合试剂是蛋白质A,或一种抗人体Ig,如IgG,或IgM,它可以与在固相中与HCV-PRC-Korean特定肽结构蛋白已进行免疫复合的抗-HCV-PRC或抗Korean分离抗体复合。最优选使用一种标记的特异性结合试剂,其中标记物是放射性同位素,一种酶,生物素或一种荧光标记物如诊断系统已描述过的镧系元素,下面的参考文献将详细描述。
要这种固相方案中,特别优选使用一种重组蛋白,前面叙述的有关融合蛋白中已具体体现出。
在另一种优选诊断方法中,按上述方法将本发明的HCV-PRC-Korean特定肽或融合蛋白亲和到固相基质上,并使生物样本的稀释液与固相表面接触使生物学样本稀释液进行免疫复合步骤,并去除未结合的物质。由于感染个体的生物学样本中所存在抗体的多价性(IgG是二价的,IgM是五价的),随后加入的标记HCV-PRC-Korean特定肽或融合蛋白则通过样本抗体作为固相HCV-PRC-Korean特定肽或融合蛋白与可溶性的标记过的分子之间的桥,而将其连接到固相上。固相中标记物的存在表明了样本中特异性抗体的存在(最好还表示出其含量)。本领域中的熟练技术人员可以确定稀释液的范围,从中可确定固相中标记抗原的浓度。
可以在把生物学样本与固样结合之前或同时,将生物学样本与本发明标记的HCV-PRC-Korean特定肽或融合蛋白混合,通过利用两价或多价特异性抗体的桥特性使固相上形成三分子复合物。作为特别适用的标记物,本发明的生物素化HCV-PRC-Korean特定肽是标记的抗原,以便通过加入酶-抗生蛋白链菌素或酶-抗生物素蛋白复合物,接着再加入合适的底物进行检测。这些酶如辣根过氧化酶,碱性磷酸酶,β-半乳糖苷酶或脲酶是常用的酶,这些和其他的酶以及几种合适的底物都是可从商业上买到的。优选的标记物,它包括使用放射性同位素,如,碘,或镧系元素的螯合剂如铕。
在另一个方案中,将样本(如血液、血浆、血清、尿液或唾液)在生物学测定条件下与本发明的抗-HCV-PRC或抗-Korean分离抗体混合接触形成一种免疫反应混合物。然后将该混合物在生物学测定条件下保持一段时间,足以能够形成一种抗原抗体免疫反应产物,该产物含有与本发明抗体复合的HCV-PRC-Korean特定肽抗原。从而测定复合物的存在(最好是测出含量),由此表明体液样本中抗原的存在。
在一个优选方案中,抗体存在于固相中。最好是通过竞争性免疫测定方法测定所形成的免疫复合物的量,该方法是使病人体液样本中的抗原与本发明的标记的重组抗原相竞争结合到固相抗体上。该方法包括将体液与下面成份混合(1)已经亲和上一种本发明抗体的固相载体和(2)一种本发明的标记的HCV-PRC-Korean特定肽或融合蛋白,它与固相抗体进行免疫反应形成一种既有液相又有固相的竞争性免疫反应混合物。然后将该混合物保持一段时间,以足以在固相中形成一种含有标记的HCV-PRC-Korean特定肽的免疫反应产物。之后,测定固相中存在的标记物的含量,从而表明了体液样本中HCV-PRC或Korean分离NANBV抗原的含量。
酶免疫检测技术,不管是直接的还是利用同源或异源检测形式的竞争性测定,在现有技术中已广泛的描述过。有代表性的方法见Maggio,Enzyme Immunoassay,CRC Press,Cleveland,OH(1981);和Jijssen,“Practice and Theory of Enzyme Immunoassays”,Elsevier,Amsterdam(1988)。
生物学测定条件是指能保持免疫反应混合物中HCV-PRC-Korean特定肽或融合蛋白以及抗HCV-PRC或抗-Korean分离抗体的免疫反应活性的条件。这些条件包括大约4°-45℃的温度范围,优选37℃,大约5至9的PH值范围,优选7,和从蒸馏水至1摩尔氯化钠之间的离子强度的不同值,优选生理盐水的离子强度。达到这些最佳条件的方法在本领域中是已知的。
本发明还包括一种在不使用标记物情况下能够检测免疫反应产物形成的免疫学测定方法。这种方法使用了一种“检测方法”,这种检测方法意味着在临床诊断化学中其本身是公知的,只有在与新的多肽、方法和系统一起使用时才构成本发明的一部分。有代表性的检测方法包括被称作生物传感器的方法和包括生物传感法,该方法的依据是检测表面反射活性(表面细胞质基因组共振)的变化,光学纤维对消失波吸收的变化或表面声波传播的变化。
另一种方案是利用时间解析荧光测定术(TR-FIA)检测免疫反应产物,其中所使用的标记物能够产生可被TR-FIA检测到的信号。适用于TR-FIA的典型标记物是金属配合试剂如由镧系元素和一种芳香族β-二酮形成的镧系元素螯合物,镧系元素通过一种EDTA类似物被结合到抗原或抗体上,从而形成一种荧光镧系元素复合物。
时间解析荧光测定术的方法见Soini et al,Clin.Chem.25:353-361(1979),并且已被广泛应用于免疫测定中。例如,见Halonen et al.,Current Topics in Microbiology and Immunology,104:133-146(1985);Suonpaa et al.,Clinica Chimica Acta,145:341-348(1985);Lovgren et al.,Talanta,31:909-916(1984);美国专利号4,374,120和4,569,790;以及公开的国际专利申请号EPO 139675和WO 87/01708。用于TR-FIA的优选镧系元素是铕。
用于实施TR-FIA方法的试剂及系统可从市场上买到(Pharmacia Diagnostics,Uppsala,Sweden)。
特别优选的是固相免疫测定方法,操作过程可以说是一种典型的“Western印迹分析”。
本诊断方法的实施可以与其他的用于检测感染有NANBV的HCV-PRC或Korean分离种群中物种抗-HCV-PRC或抗-Korean分离种群抗体出现的独立方法联合使用。例如,可以在检测方法中将本发明的一种组合物与商业上获得的C100-3抗原(Ortho Diagnostics,Inc.,Raritan,N.J.)一起使用,以测定抗体种类与两种抗原免疫反应活性之一种或二种存在。
2.中国和日本特定分离种群
本发明的另一方面还涉及到与NANBV的中国、朝鲜和日本分离种群相同但不同于NANBV美国分离种群的分离核酸、肽和蛋白分子。本发明将这些核酸、肽、和蛋白分子称之为“HCV-PRC-Japanese”特定分子。
已发现由HCV-PRC基因组的V3区编码的肽存在于NANBV的中国和日本分离种群中,但不存在于美国的分离种群中。该肽具有下面的氨基酸残基序列:
Xaa1-Ser-Ser-Ala-Val-Asp-Ser-Xaa2-Thr-Ala-Thr-Ala-Pro-Pro-Xaa3-Xaa4-Xaa5-Ser-Asp-Xaa6-Xaa7-Asp-Lys-Gly(SEQ ID NO:67);
其中Xaa1是Gly,Glu或Arg;
Xaa2是Ala或Gly;
Xaa3是Asp或Glu;
Xaa4是Gln或Glu;
Xaa5是Ala或Thr;
Xaa6是Asp或Gly;和
Xaa7是Asp或Gly。
这种肽存在于HCV-PRC1(SEQ ID NO:4),HCV-PRC3(SEQ ID NO:12),HCV-PRC4(SEQ ID NO:14)和HCV-PRC11(SEQ ID NO:16),HCV-J(SEQ ID NO:60)和HCV-BK(SEQ ID NO:61)中。
由HCV-PRC基因组的V3区编码的氨基酸残基序列与由NANBV的日本分离种群基因组的相同V3区编码的氨基酸残基序列有大约80-90%的同源性,但是与由NANBV的美国分离种群基因组的V3区编码的氨基酸残基序列的同源性不到12%(见后面的实施例2)。
本发明还提供了大约具有24个氨基酸残基的HCV-PRC-Japanese特定肽,它与SEQ ID NO:67具有至少75%,最好至少90%的同源性。
在一个优选方案中,本发明提供了一种包含于SEQ ID NO:67的HCV-PRC-Japanese特定肽,这种肽具有下面的氨基酸残基序列:
Ser-Ser-Ala-Val-Asp-Ser(SEQ ID NO:68)
用本发明的HCV-PRC-Japanese特定肽可用以产生直接抗这种肽以及抗NANBV的HCV-PRC或Japanese分离种群的抗体。根据上述的方法产生并筛选能与NANBV的中国和日本分离种群但不与美国分离种群发生免疫反应的抗体。
而且,根据前面所述的方法可用本发明的HCV-PRC-Japanese特定肽制备接种物和疫苗。
本发明还提供了用于检测NANBV的HCV-PRC和Japanese分离种群的诊断系统和方法。这些诊断系统和方法与前面叙述过的用于HCV-PRC-Korean特定肽和抗体的诊断系统和方法相同,不同的只是用HCV-PRC-Japanese特定肽和抗体替代了HCV-PRC-Korean特定肽和抗体。
本发明还提供了HCV-PRC-Japanese特定的核酸分子。其中一种HCV-PRC-Japanese特定核酸分子编码本发明的SEQ ID NO:67的HCV-PRC-Japanese特定肽。
该HCV-PRC-Japanese特定核酸分子的核苷酸碱基序列如下:
RRATCGTCRG CCGYCGACAG CGSSACGGCG
ACYGCCCCYC CTGAHSAGRC CTCCGACGRC
GRCGACAAAG GA (SEQ ID NO:69)
其中R是A或G,Y是C或T,S是C或G和H是A,C或T。
由于在V3区NANBV的中国和日本分离种群之间存在着高度的同源性以及V3区NANBV的中国和美国分离种群之间的同源程度较低(见后面的实施例2),本发明还提供了一种含有与SEQ ID NO:69至少有50%同源性的大约72个碱基对的核苷酸碱基序列的分离DNA分子。
本发明还提供了包括SEQ ID NO:69的核苷酸碱基序列的大约110个碱基对的分离DNA分子。这种分离DNA分子的代表是SEQ ID NO:3,SEQ ID NO:11,SEQ ID NO:13和SEQ ID NO:15的核苷酸碱基序列,这些序列编码HCV-PRC基因组的V3区。
可以将本发明的HCV-PRC-Japanese特定核酸分子作为杂交探针,根据前面所述的杂交系统和方法将它用于该系统和方法中检测HCV-PRC和日本分离种群NANBV核酸的存在。
如果杂交方法中使用SEQ ID NO:69的HCV-PRC-Japanese特定核酸分子作为探针,该方法要求很严格的杂交条件。如果杂交方法中用含HCV-PRC基因组V3区的核酸分子作为探针,该方法所要求的杂交条件较低。这种低要求的条件可使核酸探针与HCV-PRC和日本分离NANBV杂交,但不与美国分离NANBV靶序列杂交。
3.NANBV(HCV)特定种群
HCV-PRC基因组的区域,编码这些区域的DNA分子和由这些区编码的某些肽与其他已知NANBV分离种群的编码肽和类似区表现出相当高的同源性。与所有的NANBV(HCV)已知分离种群相同的核酸、肽和蛋白分子,本发明称之为HCV特定种群。
例如,由HCV-PRC基因组的衣壳,和包膜-E1和E2区编码的肽与来源于其他NANBV分离种群的类似肽具有大约70%至97%的氨基酸残基序列同源性(见下面的实施例2)。
因此在其中一个实施方案中,本发明提供了含有大约200个残基的氨基酸残基序列的HCV特定种群肽,它与由HCV-PRC编码的壳蛋白具有大于90%,优选大于95%的同源性。该壳蛋白的氨基酸残基序列表示于SEQ ID NO:2中从残基1至残基190。
在另一个实施方案中,本发明提供了含有200个残基的氨基酸残基序列的HCV特定种群肽,它与HCV-PRC基因组编码的E1蛋白的氨基酸残基序列具有大于70%的同源性。该E1蛋白的氨基酸残基序列表示于SEQ ID NO:2中从残基191至残基380。
在另一个实施方案中,本发明提供了含有大约320个残基的氨基酸残基序列的HCV特定种群肽,它与由HCV-PRC基因组的包膜E编码的氨基酸残基序列具有大约70%的同源性。由E区编码的氨基酸残基序列表示于SEQ ID NO:2中从残基191至残基511。
在另一个实施方案中,本发明提供了具有下列氨基酸残基序列的HCV特定肽:
Arg-Arg-His-Xaa1-Asp-Leu-Leu-Val-Gly-Xaa2-Ala-Thr-Xaa3-Cys-Ser-Ala-Xaa4(SEQ ID NO:70)
其中Xaa1是Ile或Val;
Xaa2是Ala,Ser或Thr;
Xaa3是Phe或Leu;和
Xaa4是Met或Leu。
这种HCV特定种群肽存在于由下述序列的V1区域编码的肽中:HCV-PRC1(SEQ ID NO:2由残基259至残基275),HCV1(SEQ ID NO:45由残基14至残基30),HCV-V1(SEQ ID NO:46从残基14至残基30),HCV-J(SEQ ID NO:47从残基14至残基30),HCV-BK(SEQ ID NO:48从残基14至残基30),HCV-J4(SEQ ID NO:50从残基14至残基30),HCV-Hh-h77(SEQ ID NO:51从残基14至残基30)和HCV-Hh-H90(SEQ ID NO:52从残基14至残基30)(见下述实施例2)。
本发明的HCV特定种群肽可以以融合蛋白的形式存在。
可用该HCV特定种群肽和蛋白质制备能够与NANBV的中国、朝鲜、日本和美国分离种群发生免疫反应的抗HCV抗体。
用HCV特定种群肽或蛋白作为免疫原或接种物根据前面所述的方法制备这种HCV特定种群抗体。
本发明的HCV特定种群肽、蛋白和抗体可用于检测HCV感染的诊断系统和方法中。
本发明的另一方面还提供了与NANBV的中国、朝鲜、日本和美国分离种群相同的分离核酸分子(也就是HCV核酸)。
例如,编码HCV-PRC基因组壳区的DNA分子与编码HCV-1,HCV-J1,HCV-J4,HCV-JH,HCV-J和HCV-BK的壳区的DNA分子具有大于90%的同源性。而且,编码壳包膜E1区的DNA分子与编码其他NANBV分离种群中相同区域的DNA分子具有大约大于65%的同源性(见下面的实施例2)。
因此,在一个实施方案中,本发明提供了一种大约570个核苷酸碱基对的分离DNA分子,它与编码HCV-PRC基因组的壳区的DNA分子具有大于90%的同源性。编码HCV-PRC基因组壳区的DNA分子在SEQ ID NO:1中表示了它的114位碱基至683位碱基。
在另一个实施方案中,本发明提供了大约570个碱基对的分离DNA分子,它与编码HCV-PRC基因组的E1区的DNA分子具有大于65%的同源性。
编码E1区的DNA分子在SEQ ID NO:1中表示了从684位左右的碱基。
优选本发明的HCV特定种群核酸编码HCV-PRC特定肽。更优选HCV特定核酸包含有一个有51个核苷酸碱基对的分离DNA分子,它编码SEQ ID NO:71的氨基酸残基序列。
编码SEQ ID NO:70的氨基酸残基序列的分离DNA分子,在SEQ ID NO:1中表示了其从888位至938位的碱基。
根据前面所描述的方法,可将本发明的HCV特定核酸分子用作杂交探针检测HCV核酸。
实施例
1.生产重组DNA分子
A.分离HCV-PRC克隆并进行序列分析
(1)分离中国分离种群NANBV RNA
从中国北京国家药物和生物制品控制中心获得11个表现有肝炎相关症状的诊断为非甲非乙型肝炎的病人血清,作为NANB病毒粒子源。用从市场上买到的含有C100-3抗原的筛选药盒(Ortho Diagnostics,Inc.,Raritan,NJ)和壳抗原按照Nasoff et al所述,Proc.Natl.Acad.Sci.USA,88:5462-5466(1991)对血清样本进行测试。结果见下表1。
表1
对中国非甲非乙型肝炎病人HCV标记物的筛选
ELISA HCV-RNA (PCR)
病人
Anti-C100-3 Anti-Cap 5'NC C
1 + + + +
2 + + - -
3 + + + +
4 + + + +
5 - - - -
6 + + - -
7 - + - -
8 + + + -
9 - - - -
10 - + + +
11 + + + +
11份血清样本中有7份含有抗-C100-3抗体,而11份中有9份含有抗壳抗体。另外,用下面所述的PCR基础检测方法检测所有11份血清样本中HCV RNA的存在。9份抗壳阳性血清中有六份,包括1份样本是抗-C100-3阴性,含有病毒RNA。有两份血清所含的病毒RNA滴度等于或大于104CID50/ml。从这些表现最高滴度的病人中选择4份血清作为克隆中国相关序列的HCV-PRC病毒粒子源。采集来源于病人1,3,4和11的血清样本,从每份样本中纯化病毒粒子,从其中得到的序列分别命名为HCV-PRC1,HCV-PRC3,HCV-PRC4和HCV-PRC11。
通过对蛋白提取样本进行异丙醇沉淀从分离的血浆样本中纯化HCV-PRC1,3,4和11RNA。方法大致如下,用一种冰冷的含有4.2M异硫氰酸鈲,0.5%Sarkosyl和0.025MTris-HCl(盐酸三[羟甲基]氨基甲烷),PH8.0的缓冲液,将50微升(μl)血浆稀释。然后把稀释的血浆与含有100mM Tris-HCl,PH8.0,10mM EDTA(乙二胺四乙酸)和1%十二烷基硫酸钠(SDS)的50μl提取缓冲液混合,形成一种提取混合物。
将混合物涡流振荡,在65℃下保温5分钟开始提取。然后用酚/氯仿于65℃下提取,再单独用氯仿提取一次,从混合物中去除血清蛋白。加入两体积的冰冷却异丙醇和1/10体积3M乙酸钠并将混合物在-20℃下过夜保存,从不含蛋白的混合物中沉淀出HBV-PRC1,3,4和11RNA。在Eppendorff离心机中以1400rpm转速于4℃离心30分钟使之沉淀,用70%乙醇洗涤HCV RNA一次,真空干燥,然后再悬浮于9升无RNA酶的水中。按照下述方法进行cDNA合成之前于65℃加热纯化的HBV-PRC1,HCV-PRC3,HCV-PRC4,和HCV-PRC11 RNA样本5分钟。
(2)合成用于克隆HCV的构件区的寡聚核苷酸
(a)HCV-PRC1
选择与丙型肝炎构件区相应的寡聚核苷酸,假定它编码HCV构件壳和包膜蛋白(HCJ1序列:Okamoto et al.,Jap.J.Exp.Med.,60:167-177,1990)。在Applied Biosystem 391DNA合成仪上根据厂家的说明合成选择的寡聚核苷酸,并通过聚丙烯酰胺凝胶电泳进行纯化。所合成的寡聚核苷酸具有下面表2所示的核苷酸碱基序列和命名的SEQ ID NO′s(号),与Okamoto等人所述的相同(Japan.J.Exp.Med.,60:167-177(1990))。
表2
用于从HCV-PRC1分离物进行构件区域PCR放大的合成寡聚核苷酸引物
SEQ ID 引物 核苷酸序列 极性
NO
18 15 TAAGGTCATCGATACCCT (+)
19 16 GGACCAGTTCATCATCATAT (-)
20 14 TGGGTAAGGTCATCGATAC (+)
21 17 CAGTTCATCATCATATCCCAT (-)
22 23 TTCCGAGCGGTCGCAACCTCGAGGT (+)
23 24 AGGGTATCGATGACCTTACCCA (-)
24 693 CGAGGAAGACTTCCGAGC (+)
25 691 ACCCAAATTGCGCGACCTA (-)
26 LK4 GGGCAGTCCTGTTGATGTGCC (-)
27 LK5 CAACTGCTCAATCTATCCCGGCC (+)
28 LK6 CAGCGCGGCAAGGAACCCAG (-)
29 LK7 GGCACATCAACAGGACTGCCC (+)
30 LK9 CCAACGGCAGCTGGCACATC (+)
31 LK10 GAAACGATCGGTCGTCCCCA (-)
32 LK12 TTCTCCCCCCAGCTATACGTAG (-)
33 LK11 CCCGCTCAATGCCTGGAGA (+)
34 LK16 TGCCAAGGCCCTGGCAGCGC (-)
35 LK13 TGGGCGCGCCCCCGCAAGAC (+)
36 LK14 GGCGCCGACGAGCGGAATAT (-)
1每个单一寡聚核苷酸的极性表示为(+)和(-),这表示该序列分别与HCV的有意义和反意义编码链相对应。所有的序列是从5′端向3′端方向排列的。
(b)克隆HCV-PRC1 cDNA
用5至10μg的按照实施例1A(1)方法制备的血浆衍生HBV RNA作为引物扩展反应的模板,以制备HCV-PRC1 cDNA。用来源于HCV基因组构件区的不同区域的特异性寡聚核苷酸引物(表2)起始该反应。该反应引物含有选择的反意义寡聚核苷酸引物,dNTPs和反转录酶以形成第一股cDNAs。引物扩展反应是对Gubler等人,Gene,25:263-269(1983)所述的cDNA合成方法的修改。
主要步骤是,在94℃下将5-10μg的模板RNA加热5分钟变性之后,用浓度为100μg/ml的引物在20μl的反应液中合成第一股cDNAs。在65℃下使引物退火5分钟成为变性模板。接着,将混合物调节为1.5mM dATP,dcTP,dGTP和dTTP,40mMTris-HCl,PH8.0,8mM MgCl2,50mM Nacl和2mM亚精胺。加入26单位的丙二酰-鼠白血病病毒反转录酶(Stratagem,La Jolla,CA),形成一种cDNA合成混合物。然后使该混合物在37℃下保温1小时,合成第一股cDNA。
用得到的第一股cDNAs作为模板在含有DNA聚合酶I和RNA酶H的反应混合物中合成第二股cDNAs,形成双股(ds)cDNAs(Sambrook et al.,Molecular Cloning:A Laboratory Manual,Sambrook et al.,eds.Second Edition,Cold Spring Harbor Laboratory Press,NY(1989))。用一种不对称合成引物-连接体系放大合成的ds cDNAs,其中的有意义和反意义引物互相退火,并在平整末端条件下用Tc连接酶连接到双股HCV cDNAs的末端上,形成cDNA-连接体分子。然后用得到的放大HCV cDNA序列作为模板,在分开的PCR反应中按照下述方法用特异性HCV寡聚核苷酸引物进行进一步的放大。
(c)HCV-PRC1 cDNA的PCR放大
把实施例1A(3)中制备的20μl引物连接的放大cDNA序列与0.25μg的表2中的合成寡聚核苷酸对混合,进行PCR放大。所得到的PCR反应混合物含有引物连接的放大cDNA模板,特异性配对的寡聚核苷酸,200mM的上述dNTPs混合物,10mM KCl,2mM MgCl2,10mM Tris-HCl,PH8.3,和2单位的Thermus aquaticus(TAQ)DNA聚合酶(Promega Biotec.Madison,WI)。
用矿物油覆盖反应混合物,在DNA热循环仪中(Perkin-Elmer Cetus,CT)进行PCR的两个回合,形成放大的HCV-PRC1 cDNAs。PCR的每个回合包括,先在95℃下变性5分钟,接着再进行35次循环反应,每次循环分别是95℃下1分半钟,55℃下两分钟和72℃下3分钟,之后在72℃下进行7分钟的扩展步骤。为了保证所有的cDNA转录都达到双股,向放大的cDNA混合物中加入1μg的引物,在72℃下再进行扩展20分钟完成最后一轮循环操作。
通过混合下列的寡聚核苷酸引物(表2)的结合物,进行第一个回合的放大反应,以引发HCV-PRC1构件基因组不同区域的放大反应:A区-引物对14和16;B区-引物对693和24;C区-引物对LK5和LK6;D区-引物对LK9和LK12;E区-引物对LK11和LK16;F区-引物对LK5和LK12。使用下列联合的寡聚核苷酸引物(表2)在相同条件下对来自上述第一个回合放大反应的等分样本进行再次放大:A区-引物对15和17;B区-引物对23和691;C区-引物对LK5和LK4;D区-LK7和LK10;E区-LK13和LK14;和F区-LK5和LK10。
从上述用特异性寡聚核苷酸引物进行的PCR放大反应回合中获得了6种不同的PCR产物。放大的HCV-PRC cDNA的大小范围是309至652个核苷酸,并且分别对应于A、B、C、D和E区。图1表示了5个片段的排列以及它们在HCV基因组上的定位图。来源于cDNA克隆A至E的核苷酸序列包括了绝大部分的构件区(C、E和E2)以及部分5′非编码(NC)区。接着分离放大的序列,使之平头末端化,并用实施例1A(5)所述的标准方法插入到pUC或pBluescript(Stratagene)克隆载体中。
(d)制备含有PCR放大dsHCV-PRC1 DNA的载体
将来源于上述第二个回合的PCR放大反应制备的等份样分别在5%丙烯酰胺凝胶上进行电泳。分离PCR反应产物之后,将含有对应于上述所需放大产物A区至E区的DNA片段的凝胶各分离的区域切下,并按标准的电洗脱技术(Sambrook et al.,如前所述)进行纯化。将纯化的片段分别激酶化,并克隆到pBluescript质粒克隆载体(Stratagene)的SmaⅠ多聚接头位点,形成一种含有被人工连接到pBluescript上的DNA片段A至E的质粒。
分别将得到的含有pBluescript载体和对应于A至E区的DNA片段的混合物转化到大肠杆菌菌株DH5α中。含有插入物的质粒在含有青霉素的Xgal培养基上被识别为lac-(白)菌落。通过限制酶分析和在琼脂糖凝胶上进行电泳对含有对应于A至E区的克隆DNA片段的质粒进行鉴定,并命名为pBluescript-HCV-PRC1-A,B,C,D和E重组DNA分子。
(e)对编码构件区域的HCV-PRC1克隆测序
为了获得来源于上述制备的放大rDNA分子的HCV-PRC1的序列,从pBluescript载体中分离三个独立的菌落,该载体具有与包括完整构件区的A区至E区相对应的每一种DNA片段。按照标准方法(Sambrook et al.,如前所述)通过CsCl密度梯度离心从18个选择出的克隆的每一个中制备质粒DNA。利用35S双脱氧链末端法,在Dupont自动测序仪上,用pBluescript衍生引物,KS和SK,以及实施例1A(4)中所述的起始放大反应方法中所用的引物和其他内部引物,对质粒进行测序。分别对三种质粒的DNA双链进行测序,以准确地测定该序列。
所得到的一致序列信息汇编在一起代表了完整的HCV-PRC1构件区,并以SEQ ID NO:1表示,其中列举了核苷酸序列和编码的氨基酸序列。这种HCV-PRC1序列已寄存在基因库(Genbank)中,寄存日期是1991年8月5日,入藏号是_。来源于cDNA克隆A区至E区的序列包括了绝大部分的构件区(C,E1和E2,如SEQ ID NO:1所示,从114位至1646位碱基)。
如SEQ ID NO:1所示,编码构件区的衣壳区的核苷酸区起始于第114位核苷酸碱基,终止于第683位核苷酸碱基。编码包膜1(E1)和E2蛋白的核苷酸序列分别起始于684和1254位核苷酸,终止于1253和1646位核苷酸(SEQ ID NO:1)。9个假定的糖基化位点位于196,233,250,305,325,416,429和447位氨基酸残基(SEQ ID NO:2)。
(3)制备cDNA克隆以获得与HCV高度可区V0和HCV非构件区V3一致的序列
从来源于实施例1A(1)和1A(2)所述的病人1,3,4和11的高度可变区V0获得一致序列。所得到的核苷酸序列分别列举于SEQ ID NO:1,从1269位碱基至1343位碱基,和SEQ ID NO′s:5、7、和9。也可以从来源于四个相同病人定义HCV基因组的非构件区V3得到一致序列。所得到的HCV-PRC1,3,4和11的V3区核苷酸序列分别列于SEQ ID NO′s:3,19,13和15中。下面对这些序列与来源于不同地理区域HCV基因组的相应序列进行了比较。
2.HCV-PRC构件区和非构件区的表征
A.限定构件区的HCV-PRC1与异源HCV分离种群的核苷酸和多肽序列比较。
将HCV-PRC1分离种群的C、E1和E2区的序列与各种报道的HCV序列,主要是来源于美国和日本种群的序列进行比较,以确定基因组异源性的程度,从而确定中国种群序列的独特性。推断的核苷酸与氨基酸残基序列的同源性(一致性)的百分比见下面表3。HCV-PRC1与四种主要的原型HCV-1,HCV-J和HCV-BK之间的总同源性性是:核苷酸水平的同源性分别为79.8%,90.1%和89.0%,予见的氨基酸水平的同源性分别为82.6%,88.2%和81.5%。当将表3中的全部6种分离种群比较时,从蛋白水平上来说,衣壳区同源性大于95%,这证实了衣壳区是高度保守的。
相比而言,包括E1或E2蛋白的区表现出了更多的不同性,分别为66.3%和80.4%的氨基酸同源性。见Weiner等人,Virol.,180:8842-8848(1991)。
不一致性最显著的是位于V0区,从SEQ ID NO:1的1269位的核苷酸碱基至1343位核苷酸碱基。在这个区域中,氨基酸水平的同源性(45.8-62.5%)低于核苷酸水平的同源性(53.6-71.4%),反映了这种变化主要发生在第1和/或第2位。HCV-PRC1和HCV-JH之间E2/NS1区的比较只是部分的,因为后者序列不能扩展到足够的长度。总之,这些数据表明在中国型和日本型HCV之间存在着较为密切的关系。这个区域中的高度不一致性证实了这个区域是处于显著的免疫学压力之下。
当与其他分离种群相比较时,HCV-PRC1序列的一个非常见特征是V0区的一排(一个氨基酸)中缺失了三个核苷酸,在下面的表4V0区一栏中以虚线表示。对6个独立分离的克隆进行测序后证实了这一发现。这是在HCV基因组的V0区发现氨基酸缺失的第一个例子。对6个不同HCV分离种群(美国和意大利)及七个(日本)菌株进行V0区序列比较。见Weiner et al.,如前所述Jijikata et al.,Biochem.Biophys.Res.Chron.,175:220-228(1991)。各种研究中都没有发现缺失。而且,在对自然感染十三年过程中HCV的H菌株基因组核苷酸突变率的最近分析中,Ogata等人报道没有发现V0区有缺失和插入(研究分析发现也不存在于任何其他基因组区),见Proc.Natl.Acad.Sci.USA,88:3392-3396(1991)。
这些数据进一步证实了丙型肝炎病毒包膜E2区的高度可变性特征。由于HCV的潜在中和决定基可定位于其包膜区,在开发疫苗时应考虑到V0区存在氨基酸缺失(或插入)这一因素。
表41
SEQ
分离种群2ID NOV0区
HCV-PRC1 1 -RVGGAAARTTSSFASLLTHGPSQNI
HCV-PRC3 6 YVS...SI.G.T..F.P.A..K.
HCV-PRC4 8 YAS...G.A.YGIT..FAP.A...
HCV-PRCll 10 YAS...G...HG.T..FST.AR...
HCV-l 37 HVT..S.GH.V.G.V...AP.AK..V
HCV-Jl 38 HVT..Q...AM.GLV..F.P.AK...
HCV-J 39 HVT..RV.SS.Q.LV.W.SQ...K
HCV-BK 40 HVT...Q.KT.NRLV.MFAS...K
HCV-J4 41 YTS...SHT..TL...FSP.A.R..
HCV-JH 42 HVT..VQGHV..TLT..FRP.A..K.
HCV-Hh-H77 43 HVT..S.G...AGLVG...P.AK...
HCV-Hh-H90 44 HVT..S.G.SVLGI..F..R..K...
V1区
HCV-PRCl 1 LAARNASIPTTQLRRHIDLLVGAATFCSAM
HCV-1 45 V.T.DGKL.A...S..L...L
HCV-Jl 46 V.T.DGKL.A...S..L...L
HCV-J 47 ..A..S...TI...V...L...
HCV-BK 48 ..A..VT....TI...V...
HCV-J4 49 ..A...V...TI...V...
HCV-JH 50 ..A...V...T...V...T
HCV-Hh-H77 51 V.T.DGKL...S..L...
HCV-Hh-H90 52 V.T.DGKL...S..L...
V2区
HCV-PRCl 1 MASCRSLDKFDQGWGPITYDDSGGKDQ
HCV-1 53 L...P.TD...S.ANGS.P..
HCV-Jl 54 L...R.TD...SHANGS.P..
HCV-J 55 ...PI.E.A...H.MPESS..
HCV-BK 56 ..Q..TI...AE.SRS..
HCV-J4 57 ...PIQW.A...TEPDSP..
HCV-Hh-H77 58 L...R.TD.A...S.ANGS.L.E
HCV-Hh-H90 59 L...R.TD...S.ANGS.P.E
V3 区
HCV-PRCl 4 GSSAVDSATATAPPEQASDDDDKG
HCV-PRC3 12 R...G...DE...GG...
HCV-PRC4 14 ...DE...G...
HCV-PRCll 16 E...G...D.T...G...
HCV-J 60 ...G...G..D...G...
HCV-BK 61 E...G...L.D...G...
1HCV-PRC1与其他美国、日本和中国分离种群的V0、V1、V2和V3区的推断氨基酸残基序列的排列。
2 分离种群:
HCV-1-美国种群;Choo et al.,Proc.Natl.Acad.Sci.,USA,88:2451-2455(1991);基因库(Gen Bank)入藏号M62321;
HCV-1-5′端-Han et al.,Pro.Natl.Acad.Sci.USA,88:1711-1715(1991);基因库入藏号M58407;
HCV-1-3′端-Han et al.,如前所述,基因库(Gene Bank)入藏号M58406;
HC-J1-美国种群;OKamoto et al.,Japan.J.Exp.Med.,60:167-177(1990);
HCV-J-日本种群;Kato et al.,Pro.Natl.Acad.Sci.,USA,87:9524-9528(1990);
HCV-BK-日本种群;Takamizawa et al.,J.Virol.65:1105-1113(1991);
HC-J4-日本种群;OKamoto et al.,如前所述;
HCV-JH-日本;Takeuchi et al.,Nuel.Acids Res.,18:4626(1990);
HCV-Hh-H77和H90;American/人;Ogata et al.,Proc.Natl.Acad.Sci.,USA,88:3392-3396(1991)。
在这种比较分析中发现的最明显的区别就是编码HCV-PRC1 V0区中一个氨基酸残基的完整密码子的缺失。这种缺失是中国NANBV序列的独有特征。高度可变区V0中一个氨基酸的缺失意义重大,因为在该处抗原决定基会发生病毒中和反应。由于氨基酸残基缺失所产生的三维改变对美国菌株有抗体活性则可能不会中和中国菌株。HCV-PRC1的这种特征,以及与美国或美国类似分离种群(HCV和HCV-J1)或与日本分离种群(HCV-J4,HCV-JH,HCV-BK和HCV-J)在包括E1和E2的完整包膜区内的总同源性,如下面的表5所示在73.7%和84.3%之间,这一事实表明,中国HCV分离种群属于HCV病毒族中的第三特定组。
为确定前面发现的缺失是否是中国HCV分离种群的特征,将来自三个其他病人(病人3、4和11)的包括V0区的cDNAs克隆。所获得的三个一致序列菌株HCV-PRC3,HCV-PRC4和HCV-PRC11与PRC1菌株的V0区所作的比较见表4。如表中所示,在这三个序列的任何一种中都没有检测出缺失。因此,HCV-PRC1中的缺失看来不是中国分离种群特有的,而是HCV-PRC1菌株的一个独特基因组特征。
尽管,即使在中国分离种群中,这个区域中会发现非常高度的变异性,当两个与两个进行比较时,氨基酸同源性在50.0%与76.9%之间变化。但是,哪怕有这么大的变化性,在这四个菌株中保留有一个6氨基酸链,Gly-Gly-Ala-Ala-Xaa-Arg(SEQ ID NO:17)。与来源于表4所示的处不同地理位置HCV菌株的其他公开V0区的序列相比,这个一致序列是中国分离种群所特有的,V3区无同一类似的部位。
建议将簇生在包膜E1区中的氨基酸进行组特异性分离,这看来有益于将HCV种群按两个主要组(组Ⅰ和Ⅱ)分类的建议。见Houghton et al.,Hepatology,14:381-388(1991)。在该方案中,对于PRC1菌株来说,三十个氨基酸中有22个是组Ⅱ特异性的(类似日本的)。这一发现与上述发现相结合说明中国和日本分离种群之间有密切的同源性。考虑到只有在中国组的分离种群中发现有特定保守部位(SEQ ID NO:17)的存在,HCV中国菌株可以代表组中的一个特定亚型。
B.将定义V3区的HCV-PRC1分离种菌与异源HCV分离种菌的核苷酸及多肽序列进行比较。
V3表现为HCV分离种群基因组分类的非常好的标记,并且被鉴定为在推断的HCV基因组NS5区域中。在这个区中,发现了HCV分离种群的两个主要组,也即美国和日本之间的不同。尽管在两个美国原型HCV-1上和HCV-H之间该区是相同的,并且在日本原型HCV-BK和HCV-J之间发现有87%的氨基酸残基序列同源性,当这两个组进行比较时发现只有12%的蛋白同源性。
为了进一步对中国HCV分离种群基因组类型进行表征,克隆来源于四个中国病人1、3、4、11的包括V3区的cDNA片段,并按实施例1的所述进行序列测定。将该一致序列与来源于4个原型HCV-1,HCV-H,HCV-BK和HCV-J的序列进行比较的结果如图2所示。
在中国与日本分离种群之间发现有高度的同源性(79.2-87.5%),而中国和美国分离种群之间的同源性是非常有限的(8.3-16.7%)。当互相一起比较时,四个中国分离种群表现出78.3%至87.5%的同源性,表明是一个相当同源的病毒组。
针对涉及来源于HCV基因组非构件区的不同区域基因组分型,进行比较序列分析。见Kato et al.,Proc.Natl.Acad.Sci.,USA,87:9524-9528(1990)。将19个日本分离种群的位于病毒基因组NS5区的离V3区下游的1千碱基处的一个区进行比较(核苷酸对核酸),结果表明这个区域在全部分离种群中尤其保守(89.0-97.5%的氨基酸同源性)。来源于台湾分离种群的病毒基因组NS3区的序列(4377位核苷酸至4929位核苷酸)表现出与日本分离种群的97.3%氨基酸同源性。见Chen et al.,Hepatology,14:73-78(1991)。从中国携带者的收集血清中获得的HCV基因组NS3区(4347核苷酸至4929核苷酸)的cDNA片段序列与来源于日本分离种群HCV-J1的同源序列有95.2%的同源性。见Cong et al.,中国病毒学杂志7:1-3(1991)。汇总在一起,这些数据有力地说明了中国和日本菌株之间的密切关系。得出的结论是中国型HCV分离种群与日本型的分离种群来源相同祖先。
上述的描述及实施例只是为了说明,但不起限制作用。还可以在本发明的范围和精神内进行其他的变动,而本领域中的熟练技术人员可容易地实现。其他的方案包括在下述的权利要求中。
序列目录
1.一般资料:
(ⅰ)申请人:Prince,Alfred
Ke,Liu
Inchauspe,Genevieve
(ⅱ)发明题目:非甲非乙肝炎病毒的中国分离种群:组合物和方法
(ⅲ)序列数目:79
(ⅳ)相关的地址:
(A)收信人:Dressler,Goldsmith,Shore,
Sutker & Milnamow
(B)街道:180N.Stetson st.
(C)城市:芝加哥
(D)州:IL
(E)国家:USA
(F)邮政编码:60601
(ⅴ)计算机可读形式:
(A)介质类型:Floppy盘
(B)计算机:IBM PC兼容的
(C)操作系统:PC-DOS/MS-DOS
(D)软件:PatentIn Release #1.0,Version #1.25
(ⅵ)目前的申请资料:
(A)申请号:
(B)申请日:
(C)分类号:
(ⅷ)代理人/代理资料:
(A)名字:Northrup,Thomas E
(B)注册号:33,268
(C)查询/备审案件号:nybooolp
(ⅸ)通讯资料:
(A)电话:13126165400
(B)电传:13126165460
(2)SEQ ID NO:1的资料
(ⅰ)序列特征
(A)长度:1665个碱基对
(B)类型:核酸
(2)SEQ ID NO:17的资料:
(ⅰ)序列特征:
(A)长度:6个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:肽
(ⅸ)特殊表征:
(A)名称/关键词:Xaa
(B)位置:5
(C)鉴别方法:Xaa=Ala或Gly
(xi)序列描述:SEQ ID NO:17:
Gly Gly Ala Ala Xaa Arg
1 5
(2)SEQ ID NO:18的资料:
(ⅰ)序列特征:
(A)长度:18个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:18:
TAAGGTCATC GATACCCT
(2)SEQ ID NO:19的资料:
(ⅰ)序列特征:
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:19:
GGACCAGTTC ATCATCATAT
(2)SEQ ID NO:20的资料:
(ⅰ)序列特征:
(A)长度:19个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:20:
TGGGTAAGGT CATCGATAC
(2)SEQ ID NO:21的资料:
(ⅰ)序列特征:
(A)长度:21个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:21:
CAGTTCATCA TCATATCCCA T
(2)SEQ ID NO:22的资料:
(ⅰ)序列特征:
(A)长度:25个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:22:
TTCCGAGCGG TCGCAACCTC GAGGT
(2)SEQ ID NO:23的资料:
(ⅰ)序列特征:
(A)长度:22个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:23:
AGGGTATCGA TGACCTTACC CA
(2)SEQ ID NO:24的资料:
(ⅰ)序列特征:
(A)长度:18个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:24:
CGAGGAAGAC TTCCGAGC
(2)SEQ ID NO:25的资料:
(ⅰ)序列特征:
(A)长度:19个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:25:
ACCCAAATTG CGCGACCTA
(2)SEQ ID NO:26的资料:
(ⅰ)序列特征:
(A)长度:21个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:26:
GGGCAGTCCT GTTGATGTGC C
(2)SEQ ID NO:27的资料:
(ⅰ)序列特征:
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:27:
CAACTGCTCA ATCTATCCCG GCC
(2)SEQ ID NO:28的资料:
(ⅰ)序列特征:
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:28:
CAGCGCGGCA AGGAACCCAG
(2)SEQ ID NO:29的资料:
(ⅰ)序列特征:
(A)长度:21个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:29:
GGCACATCAA CAGGACTGCC C
(2)SEQ ID NO:30的资料:
(ⅰ)序列特征:
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:30:
CCAACGGCAG CTGGCACATC
(2)SEQ ID NO:31的资料:
(ⅰ)序列特征:
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:31:
GAAACGATCG GTCGTCCCCA
(2)SEQ ID NO:32的资料:
(ⅰ)序列特征:
(A)长度:22个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:32:
TTCTCCCCCC AGCTATACGT AG
(2)SEQ ID NO:33的资料:
(ⅰ)序列特征:
(A)长度:19个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:33:
CCCGCTCAAT GCCTGGAGA
(2)SEQ ID NO:34的资料:
(ⅰ)序列特征:
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:34:
TGCCAAGGCC CTGGCAGCGC
(2)SEQ ID NO:35的资料:
(ⅰ)序列特征:
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:35:
TGGGCGCGCC CCCGCAAGAC
(2)SEQ ID NO:36的资料:
(ⅰ)序列特征:
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:36:
GGCGCCGACG AGCGGAATAT
(2)SEQ ID NO:64的资料:
(ⅰ)序列特征:
(A)长度:6个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:肽
(xi)序列描述:SEQ ID NO:64:
(2)SEQ ID NO:65的资料:
(ⅰ)序列特征:
(A)长度:21个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(Ⅸ)特征表征:
(A)名字/关键词:被修饰的碱基
(B)位置:14
(D)其它资料:/标记=R/注释=“R是A或G”
(Ⅸ)特征表征:
(A)名字/关键词:被修饰的碱基
(B)位置:16
(D)其它资料:/标记=S/注释=“S是C或G”
(xi)序列描述:SEQ ID NO:65:
GGGGGGGCGG CGGCRGSCCG C
(2)SEQ ID NO:66的资料:
(ⅰ)序列特征:
(A)长度:18个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(Ⅸ)特殊表征:
(A)名字/关键词:被修饰的碱基
(B)位置:7
(D)其它资料:/标记=R/注释=“R是A或G”
(Ⅸ)特征表征:
(A)名字/关键词:被修饰的碱基
(B)位置:12
(D)其它资料:/标记=Y/注释=“Y是C或T”
(xi)序列描述:SEQ ID NO:66:
ATCGTCRGCC GYCGACAG
(2)SEQ ID NO:67的资料:
(ⅰ)序列特征:
(A)长度:24个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:肽
(Ⅸ)特殊表征:
(A)名字/关键词:被修饰的位点
(B)位置:1
(D)其它资料:/标记=Xaa/注释=“Xaa是Gly,Glu或Arg”
(Ⅸ)特殊表征:
(A)名字/关键词:被修饰的位点
(B)位置:8
(D)其它资料:/标记=Xaa/注释=“Xaa是Ala或Gly”
(Ⅸ)特殊表征:
(A)名字/关键词:被修饰的位点
(B)位置:15
(D)其它资料:/标记=Xaa/注释=“Xaa是Asp或Glu”
(Ⅸ)特殊表征:
(A)名字/关键词:被修饰的位点
(B)位置:16
(D)其它资料:/标记=Xaa/注释=“Xaa是Gln或Glu”
(Ⅸ)特殊表征:
(A)名字/关键词:被修饰的位点
(B)位置:17
(D)其它资料:/标记=Xaa/注释=“Xaa是Ala或Thr”
(Ⅸ)特殊表征:
(A)名字/关键词:被修饰的位点
(B)位置:20
(D)其它资料:/标记=Xaa/注释=“Xaa是Asp或Gly”
(Ⅸ)特殊表征:
(A)名字/关键词:被修饰的位点
(B)位置:21
(D)其它资料:/标记=Xaa/注释=“Xaa是Asp或Gly”
(xi)序列描述:SEQ ID NO:67:
(2)SEQ ID NO:69的资料:
(ⅰ)序列特征:
(A)长度:72个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(Ⅸ)特殊表征:
(A)名字/关键词:被修饰的碱基
(B)位置:1
(D)其它资料:/标记=R/注释=“R是A或G”
(Ⅸ)特殊表征:
(A)名字/关键词:被修饰的碱基
(B)位置:2
(D)其它资料:/标记=R/注释=“R是A或G”
(Ⅸ)特殊表征:
(A)名字/关键词:被修饰的碱基
(B)位置:9
(D)其它资料:/标记=R/注释=“R是A或G”
(Ⅸ)特殊表征:
(A)名字/关键词:被修饰的碱基
(B)位置:23
(D)其它资料:/标记=S/注释=“S是C或G”
(Ⅸ)特殊表征:
(A)名字/关键词:被修饰的碱基
(B)位置:24
(D)其它资料:/标记=S/注释=“S是C或G”
(Ⅸ)特殊表征:
(A)名字/关键词:被修饰的碱基
(B)位置:33
(D)其它资料:/标记=Y/注释=“Y是C或T”
(Ⅸ)特殊表征:
(A)名字/关键词:被修饰的碱基
(B)位置:39
(D)其它资料:/标记=Y/注释=“Y是C或T”
(Ⅸ)特殊表征:
(A)名字/关键词:被修饰的碱基
(B)位置:45
(D)其它资料:/标记=H/注释=“H是A,C或T”
(Ⅸ)特殊表征:
(A)名字/关键词:被修饰的碱基
(B)位置:46
(D)其它资料:/标记=S/注释=“S是C或G”
(Ⅸ)特殊表征:
(A)名字/关键词:被修饰的碱基
(B)位置:49
(D)其它资料:/标记=R/注释=“R是A或G”
(Ⅸ)特殊表征:
(2)SEQ ID NO:70的资料:
(ⅰ)序列特征:
(A)长度:17个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:肽
(Ⅸ)特殊表征:
(A)名字/关键词:被修饰的位点
(B)位置:1
(D)其它资料:/标记=Xaa/注释=“Xaa是Ile或Val”
(Ⅸ)特殊表征:
(A)名字/关键词:被修饰的位点
(B)位置:10
(D)其它资料:/标记=Xaa/注释=“Xaa是Ala Ser或Thr”
(Ⅸ)特殊表征:
(A)名字/关键词:被修饰的位点
(B)位置:13
(D)其它资料:/标记=Xaa/注释=“Xaa是Phe或Leu”
(Ⅸ)特殊表征:
(A)名字/关键词:被修饰的位点
(B)位置:17
(D)其它资料:/标记=Xaa/注释=“Xaa是Met或Leu”
(2)SEQ ID NO:72的资料:
(ⅰ)序列特征:
(A)长度:24个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:72:
ACCACCCCAG TATACGCTTA TGAA
(2)SEQ ID NO:73的资料:
(ⅰ)序列特征:
(A)长度:18个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:73:
ACCCCAAGGC CTGTTGTG
(2)SEQ ID NO:74的资料:
(ⅰ)序列特征:
(A)长度:15个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:74:
CTCTTTGCCG GCGTT
(2)SEQ ID NO:75的资料:
(ⅰ)序列特征:
(A)长度:21个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:75:
GATGGGACAC CGCGCGTAGG G
(2)SEQ ID NO:76的资料:
(ⅰ)序列特征:
(A)长度:18个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:76:
AACATCCAGC TGGTGAAC
(2)SEQ ID NO:77的资料:
(ⅰ)序列特征:
(A)长度:21个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:77:
ACAACCCGCC CCGGGGGGGC G
(2)SEQ ID NO:78的资料:
(ⅰ)序列特征:
(A)长度:21个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:78:
GCGGCCCGGC GCCCCAGCAG C
(2)SEQ ID NO:79的资料:
(ⅰ)序列特征:
(A)长度:21个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线性
(ⅱ)分子类型:DNA(基因组的)
(xi)序列描述:SEQ ID NO:79:
AACTGGTCGC GAACAACGGC C