优化的SARS冠状病毒刺突蛋白基因.pdf

上传人:1*** 文档编号:156658 上传时间:2018-01-30 格式:PDF 页数:14 大小:675.07KB
返回 下载 相关 举报
摘要
申请专利号:

CN03141619.5

申请日:

2003.07.16

公开号:

CN1570115A

公开日:

2005.01.26

当前法律状态:

撤回

有效性:

无权

法律详情:

发明专利申请公布后的视为撤回|||实质审查的生效|||公开

IPC分类号:

C12N15/50; C12N7/01; C12N15/63; C12N15/86; C07K14/165; A61K39/215

主分类号:

C12N15/50; C12N7/01; C12N15/63; C12N15/86; C07K14/165; A61K39/215

申请人:

陈克勤; 陈凌

发明人:

陈凌; 陈克勤

地址:

201615上海市奥林匹克花园45-402,涞亭北路99号

优先权:

专利代理机构:

上海专利商标事务所

代理人:

徐迅

PDF下载: PDF下载
内容摘要

本发明公开了优化的SARS冠状病毒刺突蛋白基因,它编码SARS冠状病毒的S蛋白或免疫原性片段,且其与天然的SARS冠状病毒的S蛋白编码序列的相同性为77±3%(如SEQ ID NO:1)。还提供了含有优化的S蛋白编码序列的载体、宿主细胞和疫苗组合物。经优化的S蛋白编码序列在哺乳动物细胞中的表达效率更高,因此生产S蛋白的效率更高,也能更有效地激发哺乳动物产生抗SARS的免疫应答。

权利要求书

1: 一种分离的核酸分子,其特征在于,它编码SARS冠状病毒的S蛋白或免 疫原性片段,且其与天然的SARS冠状病毒的S蛋白编码序列的相同性为77±3%。
2: 如权利要求1所述的核酸分子,其特征在于,它编码SEQ ID NO:2所示的 SARS冠状病毒S蛋白。
3: 如权利要求1所述的核酸分子,其特征在于,它含有SEQ ID NO:1所示的核 苷酸序列。
4: 如权利要求1所述的核酸分子,其特征在于,它选自下组: (a)SEQ ID NO:1所示的核苷酸序列; (b)与SEQ ID NO:1所示的核苷酸序列相同性大于95%,且编码相同氨基酸序 列的核苷酸序列。
5: 如权利要求1所述的核酸分子,其特征在于,与天然的SARS病毒的S蛋白 编码序列相比,在哺乳动物细胞中,所述核酸分子编码的S蛋白的表达量提高至 少100%。
6: 一种载体,其特征在于,它含有权利要求1所述的核酸分子。
7: 如权利要求6所述的载体,其特征在于,它是质粒。
8: 如权利要求6所述的载体,其特征在于,它是病毒载体。
9: 一种宿主细胞,其特征在于,它含有权利要求6所述的载体。
10: 一种组合物,其特征在于,它含有权利要求6所述的载体和药学上可接 受的赋型剂或稀释剂。

说明书


优化的SARS冠状病毒刺突蛋白基因

    【技术领域】

    本发明涉及病毒学、基因工程学及疫苗学,更具体地涉及优化的SARS冠状病毒刺突蛋白基因。此基因可运用于在哺乳类动物尤其是人类细胞环境中高效表达产生刺突蛋白。本发明还涉及含有该基因的载体及疫苗。

    背景技术

    非典型肺炎,简称非典,又称严重急性呼吸综合症(SARS)已蔓延到全球三十多个国家和地区,尤为严重的包括中国、中国香港、新加坡、加拿大、越南、中国台湾和美国,短期内已导致严重的生命财产损失。最近的流行病学研究估计在60岁以上患者,死亡率可高达近半数。

    一种新的SARS冠状病毒(SARS Coronavirus)已经被确认为是非典的致病诱因,该病毒的基因组已被测序并公布。SARS冠状病毒为ssRNA(+)病毒,复制不经过DNA中间体,使用标准密码子。在电镜下,病毒颗粒呈不规则形,直径约为60-220nm,其表面有梅花形的膜粒,状如皇冠。颗粒中心在负染电镜下呈不定形态,核壳体呈疏松状态。包膜上有两种糖蛋白:S蛋白和M蛋白。S蛋白为刺突糖蛋白,是主要的抗原,与受体结合,使细胞融合。M蛋白为跨膜蛋白,参与包膜形成。此外,N蛋白也具有免疫原性。

    发展疫苗为预防病毒感染的最有效的方法,并被证实已成功地运用于多种致命的病毒感染,如天花、脊髓灰质炎、麻疹、腮腺炎、甲型肝炎、乙型肝炎。为了有效地控制和预防SARS,人们正在开发各种SARS疫苗,其中主要有五种类型:灭活疫苗、减毒活疫苗、重组亚单位疫苗、DNA疫苗和减毒病毒载体疫苗。

    然而,迄今为止尚没有真正有效的SARS疫苗问世。因此,本领域迫切需要开发有效地SARS疫苗,尤其是能够在宿主体内大量引入或产生免疫原性SARS多肽的疫苗。

    【发明内容】

    本发明的目的就是提供一种能够在宿主体内大量产生免疫原性SARS多肽的优化的SARS冠状病毒刺突蛋白基因,含有该基因的载体及疫苗。

    在本发明的第一方面,提供了一种分离的核酸分子,它编码SARS冠状病毒的S蛋白或免疫原性片段,且其与天然的SARS冠状病毒的S蛋白编码序列的相同性为77±3%。

    在另一优选例中,所述的核酸分子编码SEQ ID NO:2所示的SARS冠状病毒S蛋白。

    在另一优选例中,所述的核酸分子含有SEQ ID NO:1所示的核苷酸序列。

    在另一优选例中,所述的核酸分子选自下组:

    (a)SEQ ID NO:1所示的核苷酸序列;

    (b)与SEQ ID NO:1所示的核苷酸序列相同性大于95%,且编码相同氨基酸序列的核苷酸序列。

    在另一优选例中,与天然的SARS病毒的S蛋白编码序列相比,在哺乳动物细胞中,所述核酸分子编码的S蛋白的表达量提高至少100%。

    在本发明的第二方面,提供了一种载体,它含有本发明上述的核酸分子。

    在另一优选例中,所述的载体是质粒或病毒载体,更佳地所述的病毒载体是腺病毒。

    在本发明的第三方面,提供了一种宿主细胞,它含有本发明上述的载体,或者被本发明上述的核酸分子所转化。

    在本发明的第四方面,提供了了一种组合物,它含有本发明上述的载体或核酸分子以及药学上可接受的赋型剂或稀释剂。

    【具体实施方式】

    本发明人经过深入而广泛的研究,对SARS冠状病毒的刺突蛋白的编码序列进行了一系列优化。优化后的编码序列更适合于在哺乳动物例如人类以及其他哺乳类动物的细胞或组织环境中表达,从而不仅更适合在哺乳动物细胞系统大规模高效表达生产刺突蛋白,而且也更适合作为DNA疫苗。

    本发明一种优化的核苷酸序列如SEQ ID NO:1所示,含3768bp,编码与原始冠状病毒刺突蛋白相同的氨基酸序列以保持其免疫抗原性质。然而,此优化合成的基因只与原始冠状病毒刺突蛋白基因有77.6%相同性(或22.4%不同)。其1256个密码子中的795个密码子(或63%密码子)已被改变,但保留了与原刺突蛋白相相同的氨基酸序列以优化在哺乳类细胞中的表达,以及用于疫苗的用途。

    SEQ ID NO:1所示的核苷酸序列被称为“COSO”,意为优化的冠状病毒刺突蛋白基因(Coronavirus Spike protein optimized gene)。

    应理解,由于SARS病毒也会象其他病毒一样发生变异,因此,对于氨基酸序列不同于SEQ ID NO:2的变异的S蛋白,可以在SEQ ID NO:1的基础上,在相应位置用相应的哺乳动物细胞优选的密码子替换相应的SARS病毒的密码子,从而获得优化的、编码突变S蛋白的核苷酸序列。

    如本文所用,术语“优化的S蛋白编码序列”是指SEQ ID NO:1所示的核苷酸序列,以及与SEQ ID NO:1相同性大于95%,较佳地大于96%,更佳地大于98%的核苷酸序列。与原SARS病毒的S蛋白核苷酸序列相比,在哺乳动物细胞(如CHO细胞等)中,优化的S蛋白编码序列的表达量提高至少100%,更佳地提高至少200%或更高。

    此外,本发明除了包括全长的优化的S蛋白编码序列之外,还包括其片段,例如基于SEQ ID NO:1所示序列且编码免疫原性S蛋白片段的核苷酸序列。

    本发明优化的S蛋白编码序列,可通过DNA重组技术导入脊椎类动物,尤其是哺乳动物例如人类以及其他哺乳类动物的细胞或组织环境中,从而高效地表达刺突蛋白、免疫原性片段或其衍生产物。

    本发明还提供了含有全部或部分优化的S蛋白编码序列的质粒或病毒载体,以及因被所述质粒转入或病毒载体转染入从而含有本发明优选的S蛋白编码序列的哺乳动物宿主细胞。

    一种优选的病毒载体是腺病毒载体,例如目前已用于临床疫苗试验的复制缺陷腺病毒载体,包括E1区域缺失型、E3区域或缺失或保留的5型或2型或其他亚型腺病毒。在某些情况下,腺病毒载体也可包括E1区域,但在其他区域被缺失。其他腺病毒载体可包括多区域缺失的载体,例如助手依赖型或全缺失型腺病毒载体。

    在腺病毒基因组的E1区域或者E3区域或其他合适区域,可插入一个SARS病毒的S蛋白表达盒。该表达盒从5′→3′依次含有:1)表达启动子(promoter);2)与所述启动子操作性相连的优化的冠状病毒S蛋白编码序列(包括其变异体或衍生片段);3)与该优化的编码序列相连的多腺苷酸化信号序列。

    除了腺病毒载体之外,其他的其他病毒载体包括但不局限于:腺病毒相关病毒(AAV,adem-assocated virus)、痘病毒(vaccinia virus)等。

    另一种优选的载体是质粒载体。在该质粒载体中同样插入SARS病毒的S蛋白表达盒。

    通过培养导入本发明优化的S蛋白编码序列的哺乳动物细胞,可以大规模高效率地生产S蛋白,然后用常规的分离和纯化方法获得纯化的S蛋白。纯化的S蛋白可用于生产抗体、SARS诊断试剂盒、和其他用途。

    疫苗组合物

    本发明还提供了一种疫苗组合物,它包括携带全部或部分优化的S蛋白编码序列的质粒或病毒载体,以及药学上可接受的载体。当本发明的疫苗组合物被施用于哺乳动物(如人)时,这些质粒或病毒载体会在体内高效表达刺突蛋白、免疫原性片段或其衍生产物,从而诱导机体产生体液免疫及细胞免疫以防治SARS冠状病毒的感染。

    可将药用组合物制备成各种剂型,如粒剂、片剂、胶囊、悬浮液、喷雾、栓剂、透皮药物(如贴片等)、油膏、洗剂等。

    另外,本发明的疫苗组合物的配制还可含有其它成分,包括如佐剂、稳定剂、pH调节剂、防腐剂等。这些成分是疫苗领域技术人员所熟知的。

    给药途径和剂量

    当用作疫苗时,可用已知的方法将本发明的重组病毒载体施用于个体。通常采用与常规疫苗相同的施用途径和/或模拟病原体感染路径施用这些疫苗。给药的常规和药学上可接受的途径包括:鼻内、肌内、气管内、皮下、皮内、肺内、静脉内、经鼻、经口服或其它肠胃外给药途径。如果需要可以组合给药途径,或按抗原肽或疾病情况进行调节。

    疫苗组合物可以单剂量或多剂量给予,且可以包括给予加强剂量以引发和/或维持免疫力。

    应以“免疫有效量”给予本发明的疫苗,即重组病毒载体的量在所选用的给药路径中足以引发免疫应答,能有效地促使保护宿主抵抗SARS病毒感染或SARS症状。

    在各疫苗剂份中所选用的病毒载体的量,是按可引发免疫保护性应答而无明显的副作用的量而定。通常,在感染宿主细胞后,各剂份的疫苗足以产生约1-1000μg,较佳地为1-200μg,更佳地10-100μg蛋白质。以病毒载体核酸为基础计算的疫苗有效剂量,通常包括给予约1ug-100mg核酸。另外,病毒载体疫苗的有效剂量的一般范围为约102-107,103-106或104-105空斑形成单位(PFU)。对于以腺病毒载体为例的非致病病毒疫苗载体,通常引入106-1012个腺病毒颗粒/每人,较佳地107-1011个腺病毒颗粒/每人。可用包括观察对象中的抗体滴定度和其它反应的标准研究方法来确定具体疫苗的最佳用量。可通过监控疫苗提供的免疫力水平来确定是否需要增强剂量。在评估了血清中的抗体滴定度后,可能需要选用增强剂量免疫接种。施用佐剂和/或免疫刺激剂可提高对SARS病毒的免疫应答。

    通过引介106至1012基因拷贝的非致病病毒疫苗载体腺病毒颗粒以携带此多核苷酸进入脊椎类动物尤以哺乳动物例如人类以及其他哺乳类动物的体内以诱导抗SARS冠状病毒的免疫反应。

    本发明的主要优点在于:

    (1)优化的S蛋白编码序列在哺乳动物中的表达效率更高,因此生产S蛋白的效率高。

    (2)优化的S蛋白编码序列在哺乳动物中的表达效率更高,因此在接种的哺乳动物体内可产生更多的免疫原性S蛋白,从而有效地激发机体的免疫应答。

    下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold SpringHarbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。

    实施例1

    优化的S蛋白编码序列的合成

    在本实施例中,根据公布的SARS冠状病毒S蛋白的氨基酸序列SEQ ID NO:2,以及哺乳动物的优选密码子,并根据以下原则对编码序列进行优化,:

    (a)在不同物种之间密码子的选用有偏好性;

    (b)密码子选用的差异与翻译速度相关;

    (c)密码子的上下文(context)及某一特定密码子在某一特定位置的存在可严重影响翻译速度;

    尤其是对某些特别影响翻译速度的密码子进行了替换,设计出SEQ ID NO:1所示序列。

    然后用DNA合成仪(Mclab公司),通过常规方法,即先获得寡核苷酸片段,然后将各片段退火,并PCR延伸,从而合成得到SEQ ID NO:1的DNA序列。

    SEQ ID NO:1所示的优化合成的基因只与原始冠状病毒刺突蛋白基因有77.6%相同性(或22.4%不同)。其1256个密码子中的795个密码子(或63%密码子)已被改变,但编码与原刺突蛋白相相同的氨基酸序列以优化在哺乳类细胞中的表达。

    在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

                                     序列表

    <110>陈,凌

         陈,克勤

    <120>优化的SARS冠状病毒刺突蛋白基因

    <130>033945

    <160>2

    <170>PatentIn version 3.1

    <210>1

    <211>3768

    <212>DNA

    <213>人工序列

    <220>

    <22 1>misc_feature

    <222>(1)..(3768)

    <223>优化的SARS冠状病毒S蛋白编码序列

    <400>1

    atgttcatct tcctgctgtt cctgaccctg acctctggct ctgacctgga caggtgcacc   60

    acctttgatg atgtgcaggc ccccaactac acccagcaca cctcctccat gaggggcgtc   120

    tactaccctg atgagatctt caggtctgac accctgtacc tgacccagga cctgttcctg   180

    ccattctact ccaatgtgac aggcttccac accatcaacc acacctttgg caaccctgtg   240

    atcccattca aggatggcat ctactttgct gccacagaga agtccaatgt ggtgaggggc   300

    tgggtctttg gctccaccat gaacaacaag tcccagtctg tgatcatcat caacaactcc   360

    accaatgtgg tgatcagggc ctgcaacttt gagctgtgtg acaacccatt ctttgctgtc   420

    tccaagccca tgggcaccca gacccacacc atgatctttg acaatgcctt caactgcacc   480

    tttgagtaca tctctgatgc cttctccctg gatgtctctg agaagtctgg caacttcaag   540

    catctgaggg agtttgtctt caagaacaag gatggcttcc tgtatgtcta caagggctac   600

    cagcccattg atgtggtgag ggacctgcca tctggcttca acaccctgaa gcccatcttc   660

    aagctgcccc tgggcatcaa catcaccaac ttcagggcca tcctgacagc cttctcccct   720

    gcccaggaca tctggggcac ctctgctgct gcctactttg tgggctacct gaagcccacc   780

    accttcatgc tgaagtatga tgagaatggc accatcacag atgctgtgga ctgctcccag   840

    aaccccctgg ctgagctgaa gtgctctgtg aagtcctttg agattgacaa gggcatctac   900

    cagacctcca acttcagggt ggtgccctct ggcgatgtgg tgaggttccc caacatcacc   960

    aacctgtgcc catttggcga ggtcttcaat gccaccaagt tcccatctgt ctatgcctgg   1020

    gagaggaaga agatctccaa ctgtgtggct gactactctg tgctgtacaa ctccaccttc   1080

    ttctccacct tcaagtgcta tggcgtctct gccaccaagc tgaatgacct gtgcttctcc   1140

    aatgtctatg ctgactcctt tgtggtgaag ggcgatgatg tgaggcagat tgcccctggc   1200

    cagacaggcg tgattgctga ctacaactac aagctgcctg atgacttcat gggctgtgtg   1260

    ctggcctgga acaccaggaa cattgatgcc acctccacag gcaactacaa ctacaagtac   1320

    aggtacctga ggcatggcaa gctgaggcca tttgagaggg acatctccaa tgtgccattc   1380

    tcccctgatg gcaagccatg caccccccct gccctgaact gctactggcc cctgaatgac   1440

    tatggcttct acaccaccac aggcattggc taccagccat acagggtggt ggtgctgtcc   1500

    tttgagctgc tgaatgcccc tgccacagtc tgtggcccca agctgtccac agacctgatc   1560

    aagaaccagt gtgtgaactt caacttcaat ggcctgacag gcacaggcgt gctgacccca   1620

    tcctccaaga ggttccagcc attccagcag tttggcaggg atgtctctga cttcacagac   1680

    tctgtgaggg accccaagac ctctgagatc ctggacatct ccccatgtgc ctttggcggc   1740

    gtctctgtga tcacccctgg caccaatgcc tcctctgagg tggctgtgct gtaccaggat   1800

    gtgaactgca cagatgtctc cacagccatc catgctgacc agctgacccc tgcctggagg   1860

    atctactcca caggcaacaa tgtcttccag acacaggctg gctgcctgat tggcgctgag   1920

    catgtggaca cctcctatga gtgtgacatc cccattggcg ctggcatctg tgcctcctac   1980

    cacacagtct ccctgctgag gtccacctcc cagaagtcca ttgtggccta caccatgtcc   2040

    ctgggcgctg actcctccat tgcctactcc aacaacacca ttgccatc1c caccaacttc   2100

    tccatctcca tcaccacaga ggtgatgcct gtctccatgg ccaagacctc tgtggactgc   2160

    aacatgtaca tctgtggcga ctccacagag tgtgccaacc tgctgctgca gtatggctcc   2220

    ttctgcaccc agctgaacag ggccctgtct ggcattgctg ctgagcagga taggaacacc   2280

    agggaggtct ttgcccaggt gaagcagatg tacaagaccc ccaccctgaa gtactttggc   2340

    ggcttcaact tctcccagat cctgcctgac cccctgaagc ccaccaagag gtccttcatt   2400

    gaggacctgc tgttcaacaa ggtgaccctg gctgatgctg gcttcatgaa gcagtatggc   2460

    gagtgcctgg gcgacatcaa tgccagggac ctgatctgtg cccagaagtt caatggcctg   2520

    acagtgctgc cccccctgct gacagatgac atgattgctg cctacacagc tgccctggtc   2580

    tctggcacag ccacagctgg ctggaccttt ggcgctggcg ctgccctgca gatcccattt   2640

    gccatgcaga tggcctacag gttcaatggc attggcgtga cccagaatgt gctgtatgag   2700

    aaccagaagc agattgccaa ccagttcaac aaggccatct cccagatcca ggagtccctg   2760

    accaccacct ccacagccct gggcaagctg caggatgtgg tgaaccagaa tgcccaggcc   2820

    ctgaacaccc tggtgaagca gctgtcctcc aactttggcg ccatctcctc tgtgctgaat   2880

    gacatcctgt ccaggctgga caaggtggag gctgaggtgc agattgacag gctgatcaca   2940

    ggcaggctgc agtccctgca gacctatgtg acccagcagc tgatcagggc tgctgagatc   3000

    agggcctctg ccaacctggc tgccaccaag atgtctgagt gtgtgctggg ccagtccaag   3060

    agggtggact tctgtggcaa gggctaccat ctgatgtcct tcccccaggc tgccccccat   3120

    ggcgtggtct tcctgcatgt gacctatgtg ccatcccagg agaggaactt caccacagcc   3180

    cctgccatct gccatgaggg caaggcctac ttccccaggg agggcgtctt tgtcttcaat   3240

    ggcacctcct ggttcatcac ccagaggaac ttcttctccc cccagatcat caccacagac   3300

    aacacctttg tctctggcaa ctgtgatgtg gtgattggca tcatcaacaa cacagtctat   3360

    gaccccctgc agcctgagct ggactccttc aaggaggagc tggacaagta cttcaagaac   3420

    cacacctccc ctgatgtgga cctgggcgac atctctggca tcaatgcctc tgtggtgaac   3480

    atccagaagg agattgacag gctgaatgag gtggccaaga acctgaatga gtccctgatt   3540

    gacctgcagg agctgggcaa gtatgagcag tacatcaagt ggccatggta tgtctggctg   3600

    ggcttcattg ctggcctgat tgccattgtg atggtgacca tcctgctgtg ctgcatgacc   3660

    tcctgctgct cctgcctgaa gggcgcctgc tcctgtggct cctgctgcaa gtttgatgag   3720

    gatgactctg agcctgtgct gaagggcgtg aagctgcact acacctaa                3768

    <210>2

    <211>1255

    <212>PRT

    <213>SARS冠状病毒(SARS Coronavirus)

    <400>2

    Met Phe Ile Phe Leu Leu Phe Leu Thr Leu Thr Ser Gly Ser Asp Leu

    1               5                   10                  15

    Asp Arg Cys Thr Thr Phe Asp Asp Val Gln Ala Pro Asn Tyr Thr Gln

                20                  25                  30

    His Thr Ser Ser Met Arg Gly Val Tyr Tyr Pro Asp Glu Ile Phe Arg

            35                  40                  45

    Ser Asp Thr Leu Tyr Leu Thr Gln Asp Leu Phe Leu Pro Phe Tyr Ser

        50                  55                  60

    Asn Val Thr Gly Phe His Thr Ile Asn His Thr Phe Gly Asn Pro Val

    65                  70                  75                  80

    Ile Pro Phe Lys Asp Gly Ile Tyr Phe Ala Ala Thr Glu Lys Ser Asn

                    85                  90                  95

    Val Val Arg Gly Trp Val Phe Gly Ser Thr Met Asn Asn Lys Ser Gln

                100                 105                 110

    Ser Val Ile Ile Ile Asn Asn Ser Thr Asn Val Val Ile Arg Ala Cys

            115                 120                 125

    Asn Phe Glu Leu Cys Asp Asn Pro Phe Phe Ala Val Ser Lys Pro Met

        130                 135                 140

    Gly Thr Gln Thr His Thr Met Ile Phe Asp Asn Ala Phe Asn Cys Thr

    145                 150                 155                 160

    Phe Glu Tyr Ile Ser Asp Ala Phe Ser Leu Asp Val Ser Glu Lys Ser

                    165                 170                 175

    Gly Asn Phe Lys His Leu Arg Glu Phe Val Phe Lys Asn Lys Asp Gly

                180                 185                 190

    Phe Leu Tyr Val Tyr Lys Gly Tyr Gln Pro Ile Asp Val Val Arg Asp

            195                 200                 205

    Leu Pro Ser Gly Phe Asn Thr Leu Lys Pro Ile Phe Lys Leu Pro Leu

        210                 215                 220

    Gly Ile Asn Ile Thr Asn Phe Arg Ala Ile Leu Thr Ala Phe Ser Pro

    225                 230                 235                 240

    Ala Gln Asp Ile Trp Gly Thr Ser Ala Ala Ala Tyr Phe Val Gly Tyr

                    245                 250                 255

    Leu Lys Pro Thr Thr Phe Met Leu Lys Tyr Asp Glu Asn Gly Thr Ile

                260                 265                 270

    Thr Asp Ala Val Asp Cys Ser Gln Asn Pro Leu Ala Glu Leu Lys Cys

            275                 280                 285

    Ser Val Lys Ser Phe Glu Ile Asp Lys Gly Ile Tyr Gln Thr Ser Asn

        290                 295                 300

    Phe Arg Val Val Pro Ser Gly Asp Val Val Arg Phe Pro Asn Ile Thr

    305                 310                 315                 320

    Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Lys Phe Pro Ser

                    325                 330                 335

    Val Tyr Ala Trp Glu Arg Lys Lys Ile Ser Asn Cys Val Ala Asp Tyr

                340                 345                 350

    Ser Val Leu Tyr Asn Ser Thr Phe Phe Ser Thr Phe Lys Cys Tyr Gly

            355                 360                 365

    Val Ser Ala Thr Lys Leu Asn Asp Leu Cys Phe Ser Asn Val Tyr Ala

        370                 375                 380

    Asp Ser Phe Val Val Lys Gly Asp Asp Val Arg Gln Ile Ala Pro Gly

    385                 390                 395                 400

    Gln Thr Gly Val Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe

                    405                 410                 415

    Met Gly Cys Val Leu Ala Trp Asn Thr Arg Asn Ile Asp Ala Thr Ser

                420                 425                 430

    Thr Gly Asn Tyr Asn Tyr Lys Tyr Arg Tyr Leu Arg His Gly Lys Leu

            435                 440                 445

    Arg Pro Phe Glu Arg Asp Ile Ser Asn Val Pro Phe Ser Pro Asp Gly

        450                 455                 460

    Lys Pro Cys Thr Pro Pro Ala Leu Asn Cys Tyr Trp Pro Leu Asn Asp

    465                 470                 475                 480

    Tyr Gly Phe Tyr Thr Thr Thr Gly Ile Gly Tyr Gln Pro Tyr Arg Val

                    485                 490                 495

    Val Val Leu Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly

                500                 505                 510

    Pro Lys Leu Ser Thr Asp Leu Ile Lys Asn Gln Cys Val Asn Phe Asn

            515                 520                 525

    Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Pro Ser Ser Lys Arg

        530                 535                 540

    Phe Gln Pro Phe Gln Gln Phe Gly Arg Asp Val Ser Asp Phe Thr Asp

    545                 550                 555                 560

    Ser Val Arg Asp Pro Lys Thr Ser Glu Ile Leu Asp Ile Ser Pro Cys

                    565                 570                 575

    Ala Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Ala Ser Ser

                580                 585                 590

    Glu Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Asp Val Ser Thr

            595                 600                 605

    Ala Ile His Ala Asp Gln Leu Thr Pro Ala Trp Arg Ile Tyr Ser Thr

        610                 615                 620

    Gly Asn Asn Val Phe Gln Thr Gln Ala Gly Cys Leu Ile Gly Ala Glu

    625                 630                 635                 640

    His Val Asp Thr Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile

                    645                 650                 655

    Cys Ala Ser Tyr His Thr Val Ser Leu Leu Arg Ser Thr Ser Gln Lys

                660                 665                 670

    Ser Ile Val Ala Tyr Thr Met Ser Leu Gly Ala Asp Ser Ser Ile Ala

            675                 680                 685

    Tyr Ser Asn Asn Thr Ile Ala Ile Pro Thr Asn Phe Ser Ile Ser Ile

        690                 695                 700

    Thr Thr Glu Val Met Pro Val Ser Met Ala Lys Thr Ser Val Asp Cys

    705                 710                 715                 720

    Asn Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ala Asn Leu Leu Leu

                    725                 730                 735

    Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Ser Gly Ile

                740                 745                 750

    Ala Ala Glu Gln Asp Arg Asn Thr Arg Glu Val Phe Ala Gln Val Lys

            755                 760                 765

    Gln Met Tyr Lys Thr Pro Thr Leu Lys Tyr Phe Gly Gly Phe Asn Phe

        770                 775                 780

    Ser Gln Ile Leu Pro Asp Pro Leu Lys Pro Thr Lys Arg Ser Phe Ile

    785                 790                 795                 800

    Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Met

                    805                 810                 815

    Lys Gln Tyr Gly Glu Cys Leu Gly Asp Ile Asn Ala Arg Asp Leu Ile

                820                 825                 830

    Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr

            835                 840                 845

    Asp Asp Met Ile Ala Ala Tyr Thr Ala Ala Leu Val Ser Gly Thr Ala

        850                 855                 860

    Thr Ala Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe

    865                 870                 875                 880

    Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn

                    885                 890                 895

    Val Leu Tyr Glu Asn Gln Lys Gln Ile Ala Asn Gln Phe Asn Lys Ala

                900                 905                 910

    Ile Ser Gln Ile Gln Glu Ser Leu Thr Thr Thr Ser Thr Ala Leu Gly

            915                 920                 925

    Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu

        930                 935                 940

    Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn

    945                 950                 955                 960

    Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp

                    965                 970                 975

    Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln

                980                 985                 990

    Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala

            995                 1000                1005

    Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp

        1010                1015                1020

    Phe Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ala Ala

        1025                1030                1035

    Pro His Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ser Gln

        1040                1045                1050

    Glu Arg Asn Phe Thr Thr Ala Pro Ala Ile Cys His Glu Gly Lys

        1055                1060                1065

    Ala Tyr Phe Pro Arg Glu Gly Val Phe Val Phe Asn Gly Thr Ser

        1070                1075                1080

    Trp Phe Ile Thr Gln Arg Asn Phe Phe Ser Pro Gln Ile Ile Thr

        1085                1090                1095

    Thr Asp Asn Thr Phe Val Ser Gly Asn Cys Asp Val Val Ile Gly

        1100                1105                1110

    Ile Ile Asn Asn Thr Val Tyr Asp Pro Leu Gln Pro Glu Leu Asp

        1115                1120                1125

    Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn His Thr Ser

        1130                1135                1140

    Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala Ser Val

        1145                1150                1155

    Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala Lys

        1160                1165                1170

    Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr

        1175                1180                1185

    Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Val Trp Leu Gly Phe Ile

        1190                1195                1200

    Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Leu Leu Cys Cys

        1205                1210                1215

    Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Ala Cys Ser Cys Gly

        1220                1225                1230

    Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys

        1235                1240                1245

    Gly Val Lys Leu His Tyr Thr

        1250                1255

优化的SARS冠状病毒刺突蛋白基因.pdf_第1页
第1页 / 共14页
优化的SARS冠状病毒刺突蛋白基因.pdf_第2页
第2页 / 共14页
优化的SARS冠状病毒刺突蛋白基因.pdf_第3页
第3页 / 共14页
点击查看更多>>
资源描述

《优化的SARS冠状病毒刺突蛋白基因.pdf》由会员分享,可在线阅读,更多相关《优化的SARS冠状病毒刺突蛋白基因.pdf(14页珍藏版)》请在专利查询网上搜索。

本发明公开了优化的SARS冠状病毒刺突蛋白基因,它编码SARS冠状病毒的S蛋白或免疫原性片段,且其与天然的SARS冠状病毒的S蛋白编码序列的相同性为773(如SEQ ID NO:1)。还提供了含有优化的S蛋白编码序列的载体、宿主细胞和疫苗组合物。经优化的S蛋白编码序列在哺乳动物细胞中的表达效率更高,因此生产S蛋白的效率更高,也能更有效地激发哺乳动物产生抗SARS的免疫应答。。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 化学;冶金 > 生物化学;啤酒;烈性酒;果汁酒;醋;微生物学;酶学;突变或遗传工程


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1