用于预防艾滋病的疫苗组合物.pdf

摘要
申请专利号：	CN200410011251.6	申请日：	2004.11.24
公开号：	CN1634581A	公开日：	2005.07.06
当前法律状态：	驳回	有效性：	无权
法律详情：	发明专利申请公布后的驳回\|\|\|实质审查的生效\|\|\|公开
IPC分类号：	A61K39/12; A61K39/21; C12N15/49; A61P31/18	主分类号：	A61K39/12; A61K39/21; C12N15/49; A61P31/18
申请人：	长春百克药业有限责任公司;
发明人：	孔维; 于晓方; 田春娟
地址：	130012吉林省长春市火炬路1260号
优先权：
专利代理机构：	吉林长春新纪元专利代理有限责任公司	代理人：	魏征骥
PDF下载：	PDF下载

内容摘要

本发明涉及一种用于预防艾滋病的疫苗组合物，属于核酸疫苗和重组非复制型痘病毒载体疫苗的组合物。包括抗人类免疫缺陷病毒－1(HIV－1)的核酸疫苗和重组非复制型痘病毒载体疫苗。本发明的优点在于：提高疫苗的免疫效果。

权利要求书

1：一种用于预防艾滋病的疫苗组合物，包括抗人类免疫缺陷病毒-1(HIV-1)的核酸疫苗和重组非复制型痘病毒载体疫苗，其核酸疫苗为一种含有转录单位的人工合成的脱氧核糖核酸序列，所述转录单位编码人类免疫缺陷病毒-1(HIV-1)结构蛋白序列，该人类免疫缺陷病毒-1(HIV-1)结构蛋白序列是具有免疫原性的人类免疫缺陷病毒-1(HIV-1)抗原，其中转录单位指导该抗原的合成，其中编码人类免疫缺陷病毒-1(HIV-1)结构蛋白Gag、Pol和Env的核苷酸序列来源于经过人工修饰的编码野生型中国流行株人类免疫缺陷病毒-1(HIV-1)B/C重组型的结构蛋白的核苷酸序列；其重组非复制型痘病毒载体疫苗为一种含有转录单位的经过重组的痘病毒，所述转录单位编码人类免疫缺陷病毒-1(HIV-1)结构蛋白序列，该人类免疫缺陷病毒-1(HIV-1) 结构蛋白序列是具有免疫原性的人类免疫缺陷病毒-1(HIV-1)抗原，其中转录单位指导抗原的合成，采用的痘病毒是经过修饰的痘病毒安卡拉株(Modified Vaccinia Virus Ankara，MVA)，其转录单位所编码的结构蛋白包括人类免疫缺陷病毒-1(HIV-1)的完整核心蛋白Gag、编码酶类蛋白的Pol和外膜蛋白Env；核酸疫苗和重组非复制型痘病毒载体疫苗的比例为：6mg～18mg∶10 6 pfu～10 8 pfu。
2：如权利要求1所述的组合物，编码人类免疫缺陷病毒-1(HIV-1)结构蛋白Gag、 Pol和Env的核苷酸序列来源于经过人工修饰的编码野生型中国流行株人类免疫缺陷病毒 -1(HIV-1)B/C重组型的结构蛋白的核苷酸序列，其核苷酸序列分别如SEQ ID NO：2、 SEQ ID NO：3所述；
3：如权利要求1所述的组合物，编码人类免疫缺陷病毒-1(HIV-1)结构蛋白Gag、 Pol和Env的序列所表达的蛋白质Gag、Pol和Env氨基酸序列分别如SEQ ID NO：
4： SEQ ID NO：
5： SEQ ID NO：6所述。 4、如权利要求1所述的组合物，其核酸疫苗为一种含有转录单位的人工合成的脱氧核糖核酸序列，其核苷酸序列如SEQ ID NO：1所述。

说明书

用于预防艾滋病的疫苗组合物
    【技术领域】

    本发明涉及核酸疫苗和重组非复制型痘病毒载体疫苗的组合物。

    背景技术

    艾滋病被认为是世界上直接威胁人类健康的第一大传染病，根据联合国卫生组织的流行病学调查结果，截至2001年全世界共有四千万艾滋病携带者，其中五百万人为新感染者。仅2001年一年，就有三百万人死于艾滋病。我国艾滋病流行情况也不容乐观，据联合国艾滋病专家估计，我国大约有超过100万艾滋病携带者。虽然近几年抗艾滋病药物的“鸡尾酒”疗法在发达国家有效地控制了HIV的蔓延，但是昂贵的价格(在我国该药物价格大约为3000～10000元人民币/人/月)，耐药病毒株的产生，长期用药的副作用以及最终无法彻底清除患者体内病毒等方面的不利因素显示，只有艾滋病疫苗才能真正有效地预防和控制艾滋病。所以艾滋病疫苗研制势在必行。

    用HIV-1疫苗防治AIDS被国际上认为是目前最行之有效的方法，已成为世界上许多科研机构研究的热点。目前，关于艾滋病疫苗的生产国际上尚属空白。而HIV-1疫苗的研制工作在国外已有多家大型科研机构、制药公司正开展进行。

    自八十年代发现艾滋病以来，人们就开始进行艾滋病疫苗的研究。一般来说，减毒活疫苗和灭活疫苗能产生较好免疫保护性反应，但安全性较差，不适用于作为艾滋病疫苗。随着人类对艾滋病认识的不断提高，九十年代初人们意识到CTL(Cytotoxic T Lymphocytes细胞毒性T细胞，即细胞免疫应答)的重要性，越来越多的证据显示阳性CD8介导的CTL在控制艾滋病毒感染中起举足轻重的作用。因此人们开始研究用重组病毒载体疫苗来诱导CTL，然后用胞膜蛋白亚单位疫苗增强免疫来诱导中和抗体，力图从体液免疫和细胞免疫两方面来诱导人体对艾滋病毒的保护反应。但由于免疫强度有限，而用重组载体疫苗又难以进行多次增强免疫，所以在动物模型和人体试验结果都显示了较低的对HIV地免疫保护反应。

    痘病毒作为天花的有效疫苗被在世界范围内广泛应用，为人类最后在全世界范围内灭绝天花做出了决定性的贡献。由于痘苗病毒的副作用，人们在六、七十年代就开始了痘苗病毒的致弱工作。1960年至1974年期间，德国教授Anton Mayr领导的研究小组通过将痘病毒在鸡胚成纤维细胞中传代的方法，成功地将从Ankara地区分离得到的痘病毒CVA株致弱。当传到516代时，这株致弱毒株被命名为MVA(Modified Vaccinia Ankara)。MVA不但继承了CVA的免疫原性好，对天花的保护性高的特点，同时由于在哺乳细胞不能繁殖，所以MVA还具有对人和动物毒副作用小的特点。

    1980年，随着世界卫生组织宣布天花在地球上的灭绝，痘苗病毒本身作为疫苗的历史结束了。然而在同一年，基因重组技术在痘苗病毒上的应用，为痘病毒作为病毒载体用于开发研制新疫苗拓开了崭新，广泛的应用前景。

    MVA目前被广泛用于人类基因治疗和疫苗的研究，英国的Oxford Bio Medica和法国Strasbourg的TransGene，在分别以MVA为载体进行癌症基因治疗的人体临床试验，同时英国MRC和肯尼亚正在合作进行以MVA为载体的HIV疫苗的临床试验。

    DNA疫苗像减毒活疫苗那样即诱导体液免疫又诱导细胞免疫，但是又不似后者那样具有很大的潜在危机。DNA疫苗在艾滋病研究方面也同样令人振奋。Wang及其同事报道，以HIV/Z6 gp160和Rev为抗原所构建的DNA疫苗在小鼠和猴子体内产生了良好的细胞免疫和体液免疫。这是由于DNA疫苗有抗原纯，可多次重复免疫以及能诱导高效价记忆性CTL的特点。

    目前人们采用多次DNA疫苗免疫后，再用高效表达靶抗原的病毒载体疫苗来增强病疫的方案，以期诱导更强的免疫反应，达到使人体产生对HIV有效的免疫保护的效果。美国、法国、意大利、澳大利亚等多个研究小组已经在肯尼亚、乌干达、美国、法国、意大利、澳大利亚等多个国家和地区开展了数项艾滋病疫苗的临床研究。

    国内研究艾滋病疫苗的队伍主要有中国预防医学科学院、卫生部艾滋病预防与控制中心和病毒学研究所、清华大学、中国科学院微生物所及一些部队院校等。

    【发明内容】

    本发明提供一种用于预防艾滋病的疫苗组合物，目的是提高疫苗的免疫效果。

    包括抗人类免疫缺陷病毒-1(HIV-1)的核酸疫苗和重组非复制型痘病毒载体疫苗。

    其核酸疫苗为一种含有转录单位的人工合成的脱氧核糖核酸序列，所述转录单位编码人类免疫缺陷病毒-1(HIV-1)结构蛋白序列，该人类免疫缺陷病毒-1(HIV-1)结构蛋白序列是具有免疫原性的人类免疫缺陷病毒-1(HIV-1)抗原，其中转录单位指导该抗原的合成，其中编码人类免疫缺陷病毒-1(HIV-1)结构蛋白Gag、Pol和Env的核苷酸序列来源于经过人工修饰的编码野生型中国流行株人类免疫缺陷病毒-1(HIV-1)B/C重组型的结构蛋白的核苷酸序列；

    其重组非复制型痘病毒载体疫苗为一种含有转录单位的经过重组的痘病毒，所述转录单位编码人类免疫缺陷病毒-1(HIV-1)结构蛋白序列，该人类免疫病毒病毒-1(HIV-1)结构蛋白序列是具有免疫原性的人类免疫缺陷病毒-1(HIV-1)抗原，其中转录单位指导抗原的合成，采用的痘病毒是经过修饰的痘病毒安卡拉株(Modified Vaccinia VirusAnkara，MVA)。其转录单位所编码的结构蛋白包括人类免疫病毒病毒-1(HIV-1)的完整核心蛋白Gag、编码酶类蛋白的Pol和外膜蛋白Env。

    核酸疫苗和重组非复制型痘病毒载体疫苗的比例为；12mg～18mg：106pfu～1010pfu。

    本发明的一个重要方面：

    编码人类免疫缺陷病毒-1(HIV-1)结构蛋白Gag、Pol和Env的核苷酸序列来源于经过人工修饰的编码野生型中国流行株人类免疫缺陷病毒-1(HIV-1)B/C重组型的结构蛋白的核苷酸序列，其核苷酸序列分别如SEQ ID NO：2、SEQ ID NO：3所述；

    本发明的另一个重要方面，

    编码人类免疫缺陷病毒-1(HIV-1)结构蛋Gag、Pol和Env的序列所表达的蛋白质Gag、Pol和Env氨基酸序列分别如SEQ ID NO：4、SEQ ID NO：5、SEQ ID NO：6所述。

    本发明的另一个重要方面，其核酸疫苗为一种含有转录单位的人工合成的脱氧核糖核酸序列，其核苷酸序列如SEQ ID NO：1所述。

    本发明的优点在于：提高疫苗的免疫效果。

    【附图说明】

    图1、HIV-1基因组示意图。其中gag，pol和env是最主要的结构基因。

    图2、D-GPEi核酸疫苗质粒构建过程示意图。

    图3、穿梭质粒pSC11-GPE示意图。该质粒共含有14958bp，包括两个方向相反的启动子P11和P7.5分别驱动LacZ和HIV-1抗原基因的转录，FL-1-TK和FL-2-TK是两段与MVA病毒载体上TK基因的同源序列，正是由于这两段同源序列的存在，使该重组穿梭质粒和MVA在细胞内能发生同源重组，把包括LacZ和HIV-1抗原基因的表达盒重组到MVA病毒载体中，从而构建了重组MVA病毒载体疫苗M-GPE。

    图4、M-GPE示意图。HIV-1结构基因表达框架重组到MVA的TK基因中，基因表达的启动子采用P7.5。

    图5、比较核酸疫苗D-GPEi在用M-GPE增强免疫前后在小白鼠(BALB/C)的体液免疫反应。5个一组小白鼠在0周，2周和4周分别被不同核酸疫苗免疫(100μg/小白鼠/次)，第6周用M-GPE增强免疫(5×107pfu/小白鼠)。在不同时间收集每组小白鼠血清，检测对HIV-1中国流行株抗原的抗体免疫反应(抗原来自于中国广西HIV-1高发区病毒样品)。

    LANE1：空白；

    LANE2：D-GPEi三次免疫小鼠后第六周血清；

    LANE3：修饰型gagpol+修饰型env两种质粒共注射三次免疫小鼠后第六周血清；

    LANE4：空白；

    LANE5：D-GPEi三次免疫小鼠，第六周用M-GPE增强免疫，增强免疫5天后血清；

    LANE6：修饰型gagpol+修饰型env两种质粒共注射，第六周用M-GPE增强免疫，增强免疫5天后血清；

    LANE7：空白；

    LANE8：D-GPEi三次免疫小鼠，第六周用M-GPE增强免疫，增强免疫14天后血清

    LANE9：修饰型gagpol+修饰型env两种质粒共注射，第六周用M-GPE增强免疫，增强免疫14天后血清。

    图6、检测联合疫苗在小白鼠(BALB/C)的细胞免疫反应。

    5只一组小白鼠在0周、2周和4周分别被不同核酸疫苗免疫(100μg/小白鼠/次)，第6周用M-GPE增强免疫(5×107pfu/小鼠)。免疫5天后解剖小鼠，取出脾脏，用ELISPOT测定在用小肽刺激后100万脾细胞中分泌INF-γ的细胞的数量。

    图7、检测联合疫苗在小白鼠(BALB/C)的细胞免疫反应。

    5只一组小白鼠在0周，2周和4周分别被不同核酸疫苗免疫(100μg/小白鼠/次)，完成免疫5天后解剖小鼠，取出脾脏，用ICC测定在用小肽刺激后脾细胞中分泌γ-INF的细胞百分比。

    A空白(没有肽刺激)；B野生型D-GPE(没有肽刺激)；C修饰型D-GPEi(没有肽刺激)；D空白+肽刺激；E野生型D-GPE+肽刺激；F修饰型D-GPEi+肽刺激；

    图8、检测联合疫苗在小白鼠(BALB/C)的细胞免疫反应。

    5个一组小白鼠在0周、2周和4周分别被不同核酸疫苗免疫(100μg/小白鼠/次)，第6周用M-GPE增强免疫(5×107pfu/小鼠)。完成免疫5天后解剖小鼠，取出脾脏，分离淋巴细胞，测定其对靶细胞(上述肽包被的小鼠淋巴细胞株P815)的CTL活性。

    A修饰型D-GPEi；B野生型D-GPE；C空白。

    图9、猴子在0天、15天和30天分别被不同核酸疫苗免疫(2mg/猴子/次)，第6周用M-GPE增强免疫(109pfu/猴子)。分别在增强免疫后15天、90天和180天静脉取血，分离淋巴细胞，用ELISPOT测定在用小肽刺激后100万淋巴细胞中能分泌INF-γ的细胞的数量，C亚型HIV-1 Gag蛋白肽库被用于上述测定。

    【具体实施方式】

    实施例1：核酸疫苗的目标抗原基因gagpol和env基因的修饰

    1、目的基因的选择

    目前中国主要的HIV-1流行株为B/C重组型HIV-1。

    选择的HIV-1中国流行株gagpol基因序列如SEQ ID NO：7。

    选择的HIV-1中国流行株env基因序列如SEQ ID NO：8。

    我们这里用于构建艾滋病疫苗的HIV-1目的基因就是根据上述B/C重组亚型的基因序列为基础，然后进行了全序列人工合成，该合成的基因所表达的氨基酸序列与HTV-1中国流行株gagpol和env基因表达的氨基酸序列一致，但基因表达效率则大大提高。

    以上述gagpol和env基因作为目标抗原的基因，它们的表达产物组成了HIV-1最主要的结构蛋白(如图1)，因此它们是抗原基因的最佳选择。

    2、抗原的修饰

    2.1方法：根据我们以前研究的结果发现，HIV-1 gag，pol和env基因内存在许多抑制因子。这些抑制因子是以A和T为主组成，造成HIV-1 mRNA不稳定，不能从细胞核转制到细胞浆，从而影响蛋白表达。去除抑制因子的办法就是在不影响氨基酸编码的前提下，将Codon第三位的A或T尽量改为C或G。

    2.2过程：GPCINS、ENVCINS分别代表合成的全新的gagpol和env基因

    GPCINS基因序列合成引物：

    F1：GACGTGGGCGACGCCTACTTCAGCGTGCCCCTGGATAAGGACTTCCGGAAGTACACCGCCTTCACCATCCCCAGCGTGAACAATGAGACC

    R1：CTGCACTGGAAGATGGCGGGGCTGCCCTTCCAGCCCTGGGGCAGCACGTTGTACTGGTACCGGATGCCGGGGGTCTCATTGTTCACGCTG

    F2：CCAGGACTTCTGGGAGGTGCAGCTGGGCATCCCCCACCCCGCCGGCCTGAAGAAAAAGAAAAGCGTGACCGTGCTGGACGTGGGCGACGC

    R2：CAGATCGTCCATGTACTGGTAGATCACGATGTCGGGGTTCTGCTTCCGGAAGGGCTCCAGGATCTTGGTCATGCTGCACTGGAAGATGGC

    F3：CATCTTCGCCATCCGGAAGAAAGACAGCTCCAAGTGGCGGAAGCTGGTGGACTTCCGGGAGCTGAACAAGCGGACCCAGGACTTCTGGGA

    R3：TTCAGGAGGTGCTCCCGCAGTTCCTCGATCTTGGTCCGGTGCTGGCCGATCTCCAGGTCGCTGCTGCCCACGTACAGATCGTCCATGTACTGG

    F4：GACCGCCATCTGCGACGAGATGGAAAAGGAGGGCAAGATCACCAAGATCGGCCCCGACAACCCCTACAACACCCCCATCTTCGCCATCCG

    R4：GGTGCAGCTCGTAGCCCATCCACAGGAAGGGAGGCTCCTTCTGGTGTTTCTTGTCGGGTGTGGTGAAGCCCCACTTCAGGAGGTGCTCCC

    F5：CCGTGAAGCTGAAGCCCGGCATGGACGGCCCCAAGGTGAAGCAGTGGCCCCTGACCGAGGAAAAGATCAAGGCCCTGACCGCCATCTGCG

    R5：CAGCTTCTGGATGTCGTTCACGGTCCAGCTGTCCTTCTCGGGCAGCTGGATGGGCTGCACGGTCCACTTGTCGGGGTGCAGCTCGTAGCC

    F6：CATCATTGGCCGGAACATGCTGACCCAGCTGGGCTGCACCCTGAACTTCCCCATCAGCCCCATCGAGACCGTGCCCGTGAAGCTGAAGCC

    R6：CCGCAGGAGCTTGCACAGCTGCCGCACCTTGATGCCGGGGTAGATCTGGCTGGCCCAGTTCAGCTTGCCCACCAGCTTCTGGATGTCGTT

    F7：TACGAGCAGATCCCCATTGAGATCTGCGGCAAGAAAGCCATCGGCACCGTGCTGGTGGGCCCCACCCCCGTGAACATCATTGGCCGGAAC

    R7：GGATCTCCCGGTTCTCGGCCAGTTCCAGCTCGGCTTCCTCGGTCAGGGGCACGATGTCGGTCAGGGCCTTGGCGCCCCGCAGGAGCTTGC

    F8：GGAAGTGAACCTGCCCGGCAAGTGGAAGCCCAAGATGATCGGCGGGATCGGAGGCTTCATCAAGGTGCGGCAGTACGAGCAGATCCCCAT

    R8：TTGGCCCTGCTTCTGGATCTCGGCGATCAGCTCCTTGCTGGGGTCATAGTAGGCGCCGTGCACGGGCTCCTTCAGGATCTCCCGGTTCTC

    F9：CTTGTCTCAATAAAAGTAGGGGGCCAGATAAAAGAGGCTCTCCTGGACACCGGCGCCGATGACACCGTGCTGGAGGAAGTGAACCTGCCC

    R9：GGTCCGCATCTTGGCGTACTTGCCGGTCTTCAGGTTCTTGAAGGGCTCCTGGTAGATCTGGTAGGTCCACTGGTCTTGGCCCTGCTTCTG

    F10：AGCTCCGAAGCAGGAACCGAAAGACAGGGAACCCTTAACTTCCCTCAGATCACTCTTTGGCAGCGACCCCTTGTCTCAATAAAAGTAGGG

    R10：GCCCCAAATCACGATGCTCTCCATGGCGATCTTCTGCACGGCCTCGGTCAGCTGCTTCACGTCGTTGGTGTGGGCGGTCCGCATCTTGGC

    F11：GGGAATTTTCTCCAGAGCAGACCAGAGCCAACAGCCCCACCAGCAGAGAGCTTCAGGTTCGAGGAGACAACCCCAGCTCCGAAGCAGGAA

    R11：GTGGCCTGCCAGTAGTCGGTCCACCAGGTCTCCCAGGTCTCCTTCTGGATGGGCAGCCGGAACTTGGGGATCTTGCCCCAAATCACGATG

    F12：CAAATGAAAGACTGTACTGAAAGGCAGGCGAATTTTTTAGGGAAATTTTGGCCTTCCCACAAGGGGAGGCCAGGGAATTTTCTCCAGAGC

    R12：GGGGTCCTTCTCCAGCTGGTACCACAGCTTCACCAGGGGAGGGGTGTTCACGAACTCCCACTCGGGGATCCAGGTGGCCTGCCAGTAGTC

    F13：GCCACATCGCCAAGAACTGCAGGGCCCCTAGGAAAAAAGGCTGTTGGAAATGTGGAAAGGAAGGACACCAAATGAAAGACTGTACTGAAA

    R13：ACGTAGCCGGCCTTGCCGATCTTGGTCTCCCGGTTAGCGGCGCCGTCCACGTAGAAGGTCTCCACGCCGGCGATGGGGTCCTTCTCCAGC

    F14：ACACCATCCTGATGCAGCGGAGCAACTTCAAGGGCAGCAAACGGATCGTGAAGTGCTTCAACTGTGGCAAGGAGGGCCACATCGCCAAGA

    R14：TAGATGGCCTGCAGCTCGGTCTTCTGGTTGGTTGTGTCGGTCAGGCTCACGATTTTCTTCCGGCCTCTGTCGGTCACGTAGCCGGCCTTG

    F15：ACCGCCTGCCAGGGCGTGGGAGGCCCCAGCCACAAGGCCCGGGTGCTGGCTGAGGCCATGAGCCAGACCTCCAACACCATCCTGATGCAG

    R15：CTGAATGATGCCCAGGGCGTACTGGCTGTCGGTCACGATGTTCACCTCGCTGCCGCTGTCCTGCAGGGCGATGTAGATGGCCTGCAGCTC

    F16：TCGTGCAGAATGCCAACCCCGACTGCAAGACCATCCTGCGGGCCCTGGGCAGCGGCGCCTCCCTGGAAGAGATGATGACCGCCTGCCAGG

    R16：TACACCCGCTCTTTCTTGATCAGCTGCTCAATGATCTGGTTCACCAGCTCGCTCTCGCTCTTGTCGGGCTGGGCCTGAATGATGCCCAGG

    F17：GGATAGATTCTTTAAGACCCTGCGGGCCGAGCAGGCCACCCAGGACGTGAAGAACTGGATGACCGACACCCTGCTCGTGCAGAATGCCAA

    R17：ATGCCGTTGCTCACCAGCTTGTCCACCTGCTCGTTGCCCCCGATGCCCTTGTGGGCGGGCACCCAGCTCAGGTACACCCGCTCTTTCTTG

    F18：GCGGATGTACAGCCCCACCTCCATCCTGGACATCAAGCAGGGCCCTAAGGAGCCCTTCCGGGACTACGTGGATAGATTCTTTAAGACCCT

    R18：GCCCGCCAGTTGCTGTGGTACTTCTCGTGTTCCTCCTGGGCCTTGTCGATGCCGTCCAGGAACAGCACCTTCCGGATGCCGTTGCTCACC

    F19：GATGACCAACAATCCTCCCATCCCAGTGGGCGAGATCTACAAGCGGTGGATTATCCTGGGCCTGAACAAGATCGTGCGGATGTACAGCCC

    R19：CTTCAGCTGACACTGGTCGCAGCTGGCCACGATCTCCTTGGCCACGATGGGAGGCAGGTTGAAGTCGCTGGCCATGGCCCGCCAGTTGCT

    F20：TGGCCAGATGCGGGAGCCCAGAGGCAGCGACATCGCCGGCACCACATCCAGCCTGCAGGAGCAGATCGGCTGGATGACCAACAATCCTCC

    R20：CCCTCCAGGTGGGTGCAGTCCAGCTGCCAGATGCCGGGGCTGCAGTCCACCTGGCCGTGCATGGCCTCGCCCTTCAGCTGACACTGGTCG

    F21：TGCTGAAGGACACCATCAACGAGGAAGCCGCTGAGTGGGACCGGCTGCACCCCGTGCACGCCGGCCCCGTGGCCCCTGGCCAGATGCGGG

    R21：TGGCCGGTCTCGGCGGGGATCACCTCGGCCTCGATGTAGCCGCTGGCCACGTGGACGGCCACCAGAATGATCTTGCCCTCCAGGTGGGTG

    F22：AGCGAGGGCGCCACCCCCCAGGACCTGAACACCATGCTGAACACCGTGGGCGGGCACCAGGCTGCCATGCAGATGCTGAAGGACACCATC

    R22：AGTTGCTGCCGTTGTCGGTGTGGATCACCTTCACGGGCCACCGGCCGGCCAGCTTCAGGATGAAGTAGGCGGTCTCCTGGCCGGTCTCGG

    23：CGGACCCTGAACGCCTGGGTGAAGGTCGTGGAGGAAAAGGCCTTCAGCCCCGAGGTGATCCCTATGTTCACCGCCCTGAGCGAGGGCGCC

    R23：GGGGTTGTAGGGGATGCCGAACTCTTGCTGGATGCCGGCCCACCAGCAGGCTGCCTTCACAGCGGCGCTGGTGAAGTTGCTGCCGTTGTC

    F24：CGACGAGAAGGTGAGCCAGAACTACCCCATCGTGCAGAACCCCCAGGGCCAGATGGTGCACCAGCCTCTGAGCCCCCGGACCCTGAACGC

    R24：TCGGCCTGGTCCCGCACCTGGCCGATCAGCTTTTTCAGCTCCTTGTTCATGCTCTCCACCACGCCCTGGCTCTGGGGGTTGTAGGGGATG

    F25：ACCAAGGAGGCCCTGGACAAGATCGAGGAAGAGCAGAACAAGATCCAGCAAAAGACCCAGCAGGCCAAGAAAGCCGACGAGAAGGTGAGC

    R25：CGCTGTAGCCTCCGATCCCGCCCTTCCGCTTGAAGTTGTGGATGAACACGGCCATCTGCACGGCGGTCTTCAGGTGCTCGGCCTGGTCCC

    F26：ACCGAGGAACTGCGGAGCCTGTTCAACACCGTGGCCACCCTGTACTGCGTGCACGAGGAAATCGAGGTGCGGGACACCAAGGAGGCCCTG

    R26：GGATCTTAATGATCTGCTTCTGCAGCTCCCGGGTCTGGATGTCGGTGGCGATAATGTCCACGATCCGCTCGCCGGCGCTGTAGCCTCCGA

    F27：AACCCCGGCCTCCTGGAGACCAGCGAAGGCTGCAAGCAGATCATTAAGCAGCTGCAACCCGCCCTGCAGACCGGCACCGAGGAACTGCGG

    R27：TTCCAGAGCAGCTTGGCGGGGCCCTTCCAGATGGGGTCCCGGCTGTCTCTATAGTACACCCGGAAGTTCTGGATCTTAATGATCTGCTTC

    F28：TGAGACCCGGAGGCAAGAAACACTACATGCTGAAGCACCTGGTGTGGGCCAGCCGGGAGCTGGAAAGATTCGCCCTGAACCCCGGCCTCC

    R28：TGATAATCTTGGCCTTCCGTCTGGGCACGACCTTGATGTCGCTGTTGTCCTGGATCACGACGGCGCCCTCGCCCTTCCAGAGCAGCTTGG

    F29：ATGGGCGCCCGGGCCAGCATCCTGCGGGGAGGCAAGCTGGACAAATGGGAGAAGATCCGGCTGAGACCCGGAGGCA

    R29：TCAGTCCTCATCCTGCCGGCCGGCCACGCAGTCGGCGCCGGCCATCTGCTTGCCGTAGTCCTTGATAATCTTGGCCTTCC

    ENVCINS基因序列合成引物：

    F1：GCTCCAGCATCATTACCATCCCCTGTCGGATCAAGCAGATTATCAACATGTGGCAGGAAGTGGGACGGGCCATGTACGCTCCACCCATCG

    R1：CGTTGCTCTCTGTTCTTCCGCCGTCCCGCACCAGGAGCAGGCCGGTGATGTTGGACTTGCAGGTGATGTTGCCCTCGATGGGTGGAGCGT

    F2：TGCCGGGGCGAGTTCTTTTACTGCAACACCAGCGGACTGTTCAACGGCACCTACAACGGCACCAAGGACAACAGCTCCAGCATCATTACC

    R2：CCTTGTACTTGTACAGCTCGTTCCGCCAATTGTTCCGCATGTCGCCTCCGCCGGTCTGAAGATTTCGGTGTCGTTGCTCTCTGTTCTTC

    F3：GAGCACTTCCCCAACAAGACCATCAAGTTTGCCAGCTCTTCCGGCGGAGACCTGGAGATCACCACACACAGCTTCAACTGCCGGGGCGAG

    R3：CGCTTCTCCCTCTCGACCACCCGTCTCTTGGCAGCTGTAGGGGCCACTCCCAGGGGTTTGATCTCGACCACCTTGTACTTGTACAGCTCG

    F4：CAGACAGGCTCATTGCAACATCAGCAAGGACAAGTGGGACGAGACACTGCAGCGGGTGAGCAAGAAACTGGCCGAGCACTTCCCCAACAA

    R4：TGATGCTGGCAGCGCCCATGGTGCTCCCGGCAGCTCCCAGGAAGCCCAGGAACACAGCTCCCAGGCCCACGGCCCGCTTCTCCCTCTCGA

    F5：ATAACACCAGGAAGAGCATCAGAATTGGGCCCGGCCAGACCTTCTATGCTACCGGCGACATCATTGGCGACATCAGACAGGCTCATTGCA

    R5：GCTTCGATGGCTCTGAGCAGGTTGCTCTGTTGCTGCACGATGCCGCTCAGGAGCTGTCTGGCTTGCACGGTCAGGGTGATGCTGGCAGCG

    F6：GACCAATAACGTGAAGACCATCATTGTGCACCTGAACAAGAGCGTGGAGATCGTGTGCACCCGGCCCAACAATAACACCAGGAAGAGCAT

    R6：CCGTTCGATGGCGAGCACCCGGGTCTGGAGTTGCTTGATGCCCCACACGGTCAGCTGGAGCATGTGCTGTTGGGCTTCGATGGCTCTGAG

    F7：GTCGTGTCCACCCAGCTGCTCCTGAATGGAAGCCTGGCCGAGAGAGAGATCATTATCCGGAGCGAGAACCTGACCAATAACGTGAAGACC

    R7：TCCAGGGCACGGCGGTTGTGCAGATCAGCTTTCCGGAACAGCCCCAGATGCCGAGCAGCTGCTGGTCCTTCAGGTACCGTTCGATGGCGA

    F8：ACGACAAAATCTTCAACGGCACCGGACAGTGTCACAACGTGTCCACCGTGCAGTGCACCCATGGCATCAAGCCCGTCGTGTCCACCCAGC

    R8：GCTGATCTCCTTGTCCCACTGCATCCAGGTCATGTTGTCCCAGATTTCCTGTTGGCTCTTGTTAGACCAGCTGGAGTTCCAGGGCACGGC

    F9：GCCCCAAGGTGACCTTCGACCCTATTCCCATCCACTACTGCACCCCCGCCGGCTACGCCATCCTGAAGTGCAACGACAAAATCTTCAACG

    R9：GCAGGTCCTTCTCATTCCGCTCCTGTTGGTTCTGGCTGTCCTCGAGCAGTCTGTAGATGGTGTTGGTGTAGTTGCTGATCTCCTTGTCCC

    F10：ACGAGAACAGCGGCAAGAACTCCAGCGAGTACTATCGGCTGATCAACTGCAACACCAGCGCCATCACCCAGGCCTGCCCCAAGGTGACCT

    R10：AGATTTTAATGTACCACAGCCAGTTAGTGATGTCAAACCAGCTCCACAGGTTCTTCCAGCTGTCCAGGGCGAGCAGGTCCTTCTCATTCC

    F11：CCACCACACTGCTCAGAGACCGGAAGAAAACCGTGTACGCCCTGTTCTACAGACTGGACATTGCTCCCCTGAACGACGAGAACAGCGGCA

    R11：ACTCTGTTCACGATGCTCAGCACGGCGAAGATAATCCTGCTTCCGATCAGCCCGCCCACGATCATAATGAAGATTTTAATGTACCACAGC

    F12：TCCAACGGCAACGGCACACGGAACGAGACCTACAACGAGAGCGTGAAGGAGGTGAAGAACTGCAGCTTCAACGCCACCACACTGCTCAGA

    R12：TGCCCAGTCTGCCAGGTCCGCCGGGGTTAGGGGTGGGGATCTGGAAGCTCAGTGGGGAGTAGCCCTGCCGCACTCTGTTCACGATGCTCA

    F13：CCTGTGGGACCAGAGCCTGAAGCCCTGCGTGAAGCTGACCCCCCTGTGCGTGACCCTGGAATGTCGGAACGTGAGCTCCAACGGCAACGG

    R13：AGGCCAGGGCCAGGAAGCCGTTCACCAGCCTGATGCTCCGGGTCTTGTCCTGTTCGCCTCCCTCTTCCTCGATTCTGCCCAGTCTGCCAG

    F14：ATGGAGAACGTGACCGAGAATTTCAACATGTGGAATAACGACATGGTGAACCAGATGCACGAGGACGTGATCAGCCTGTGGGACCAGAGC

    R14：ACTCCCCTAGCAGTCAGGAGGATGAAGTCGCTCAGTCTGTGGTAGCTGAACAGGCACAGGTTCCGCAGATCGTCCCAGGCCAGGGCCAGG

    F15：CGAGACCGAGGTGCACAACGTCTGGGCCACCCATGCCTGCGTGCCAACCGACCCTAACCCACAGGAGATCGTGATGGAGAACGTGACCGA

    R15：AGGTTGCCCAGGTACTTCAGAGCTTCCCATCCCCGCTGCAGGCCCCTCAGAGAGTTTCTCCCGAGCAGCTCCACTCCCCTAGCAGTCAGG

    F16：ACCGTCTACTATGGCGTGCCCGTCTGGAAGGAGGCCAAGACCACACTGTTCTGTGCCAGCGACGCTAAGGCCTACGAGACCGAGGTGCAC

    R16：GCGACCACGATGGCGATGGTGTCCACCAGGGAGATTGTGCTTTTCTTCAGCTCCAGGCCCCAGTACTGCACCAGGTTGCCCAGGTACTTC

    F17：CAGTGGTGGATCTGGGGCGTGCTGGGCTTCTGGATGCTGATGATCTGCAACGTGGAGGGCAACCTGTGGGTGACCGTCTACTATGGCGTG

    R17：TCTGATCCTTCTAGGCACGTTGTGGATGGCCCGGCAAATTCCCTGCACGATGTTAATGATTCTATCGGTGCCCTCGGCGACCACGATGGC

    F18：ATGAGAGTGAGGGGCACCAGACGGAACTACCAACAGTGGTGGATCTGGGG

    R18：TCACTGCAGAGCGGCCTCCAGTCCCTGTCTGATCCTTCTAGGCACG

    1.F代表正向引物，R代表反向引物；

    2.下划线＿＿部分为引物与模板互补部分；

    3.部分为引入的新限制性核酸内切酶(RE)位点Xba I，为引入的新RE位点BamH I；

    4.基因合成的原理及过程：

    本合成HIV基因采用聚合酶链式反应法，即PCR法。PCR法是用一对与模板DNA互补的单链寡聚DNA作为引物，通过“加温变性-退火-延伸”这一周期的多次循环，使与引物互补的模板DNA引物之间的区段得到扩增。扩增的产物应该包括引物序列，如果在引物的末端含有一段非互补的序列，它们也能够被包含在扩增的产物序列中。因此，可以利用这种原理在一段DNA的两端按照合成引物的序列延长该DNA片段，经过多轮PCR即可达到合成HIV基因之目的。

    第一轮PCR的目的是合成该基因中间的一段DNA序列，所以设计合成一对引物F1和R1，F1为正向引物，R1为反向引物，F1与所要合成的基因的中间部分的有义链序列一致，R1与所要合成的基因的中间部分的反义链序列一致，且它们的3’端互补(见引物序列的下划线处)，因此，第一轮PCR不需要加入模板，只需要加入Taq酶缓冲液、4种dNTP、引物F1、引物R1、Taq酶，补加水至一定体积，按照PCR的“加温变性-退火-延伸”的程序进行多次循环。

    第二轮PCR以第一轮PCR产物为模板，引物为F2和R2，F2将使扩增产物向5’端延长，R2将使扩增产物向3’端延长，该轮PCR产物为F2与R2之间的区段。

    第三轮PCR以第二轮PCR产物为模板，引物为F3和R3，其余操作过程与第二轮PCR相同。以后与此类同，经过29轮PCR可合成GPCINS基因；经过18轮PCR可合成ENVINS基因。

    2.3抗原修饰的结果

    合成的全新gagpol(GPCINS)和env(ENVINS)基因序列如下：

    GPCINS基因序列如SEQ ID NO：2

    ENVCINS基因序列如SEQ ID NO：3

    我们对gagpol修饰前后的核苷酸序列进行了比较，为了增加gagpol抗原的表达水平，修饰前后核苷酸序列变化较大，但核苷酸长度没有变化，为4280bp。合成后我们用FseI限制性内切酶切去了整合酶3’端531个碱基对，新的gagpol核苷酸长度为3730bp，从1至3730个碱基对中修饰后碱基变化个数为994，突变率为26.6％。

    同时，我们对env修饰前后的核苷酸序列进行了比较，为了增加env抗原的表达水平，修饰前后核苷酸序列变化较大，但核苷酸长度没有变化，为2577bp，修饰后碱基变化数量为692个，突变率为26.9％，env读码框架没有改变。

    基因修饰前后Gag、Env氨基酸序列与野生型完全一致。

    我们对pol基因中的protease蛋白酶活性中心进行了失活突变(Pol第336位天门冬氨酸突变为组氨酸)，目的是使protease失去活性，从而也消除了逆转录酶保持活性的可能性。另外，由于我们用FseI限制性内切酶切去了整合酶3’端531个碱基对，从而使整合酶完全失去活性，同时，由于修饰后整合酶基因所表达的蛋白与HIV-1病毒整合酶基因所表达的蛋白有较大的区别，这一点也可以用来区分该疫苗在人体内引起的免疫反应与HIV-1病毒感染引起的免疫反应的不同。

    实施例2核酸疫苗的构建

    1、表达载体的选择

    1.1概述。

    本DNA疫苗D-GPEi的载体(VR)的构建借鉴了Vical公司开发的VR1012载体的多克隆位点(包括XbaI和BamHI等)以及CMV启动子、卡那霉素抗性基因、原核细胞高拷贝因子、内含子A和BGH PolyA翻译终止信号等常规部件。VR1012是美国FDA正式批准的可以用于人体基因疫苗临床试验的载体，已经完成的临床试验表明其在人体的应用是安全的。

    本DNA疫苗的构建思路是：以VR1012为模板，复制了包括CMV启动子、IntronA和BGH polyA信号，然后利用合适的酶切位点把此表达框架再克隆回VR1012。因此，新质粒由两个CMV启动子，一个卡那霉素抗性基因，一个原核细胞高拷贝因子，两个IntronA和两个BGH polyA信号等部件组成。新质粒所有部件均符合美国FDA有关人体临床试验的安全标准，并具有稳定和高效表达外源基因等特点。

    2、质粒D-GPEi的构建

    2.1质粒构建的主要材料和方法如下：

    2.1.1试剂：限制性内切酶购于NEW ENGLAND BIOLABS，INC.32 TozerRoad，Beveerly，MA 01915-5599 USA；

    琼脂糖Invitrogen Life Technologies公司1600 Faraday Avenue，PO Box 6482，Carlsbed，California 92008，USA；

    TAE电泳缓冲液：0.04mol/L Tris-乙酸Invitrogen Life Technologies公司

                   0.001mol/L EDTA，pH8.0 Invitrogen Life Technologies公司

                   EB染料 Invitrogen Life Technologies公司

    T4 DNA连接酶和限制性内切酶购于NEW ENGLAND BIOLABS INC；

    QIAquick胶回收试剂盒购于QIAGEN Inc.，28159 Avenue Stanford，Valencia，CA91355，USA；

    LB液体培养基：

    细菌培养用胰化蛋白胨    10g    Invitrogen Life Technologies公司

    细菌培养用酵母提取物    5g     Invitrogen Life Technologies公司

    NaCl                    5g     Invitrogen Life Technologies公司

    加水至1升，调pH值至7.0，高压灭菌。

    LB固体培养基.

    细菌培养用胰化蛋白胨    10g    Invitrogen Life Technologies公司

    细菌培养用酵母提取物    5g     Invitrogen Life Technologies公司

    NaCl                    5g     Invitrogen Life Technologies公司

    琼脂                    15g    Invitrogen Life Technologies公司

    加水至1升，调pH值至7.0，高压灭菌，加入适当抗生素，铺平板。

    0.1M CaCl2溶液高压灭菌         Invitrogen Life Technologies公司

    抗生素                         Invitrogen Life Technologies公司

    E.coli DH5α                   Invitrogen Life Technologies公司

    质粒提取：QIAGEN Plasmid Maxi kit               QIAGEN Inc.公司

    2.1.2方法：

    ①酶切实验按下述方法设立酶切反应体系，即将1μg DNA加入到无菌微量离心管中，加入10×限制性内切酶缓冲液5μl，加入限制性内切酶10units，加水至50ul，按酶切反应温度反应1小时，然后琼脂糖电泳检查酶切反应结果。

    ②连接实验用适当的限制性内切酶消化质粒和外源DNA，利用QIAGEN的QIAquick胶回收试剂盒回收载体和外源DNA片断，测定其DNA含量，建立连接反应体系，将50ng载体DNA加入到无菌微量离心管中，加入4倍摩尔量的外源DNA片断，加入10×T4 DNA连接酶缓冲液2μl，加入400units T4 DNA连接酶，补水至20μl，16℃反应3小时。

    ③细菌转化实验挑取一个单菌落接种于50ml LB液体培养基中，37℃下以250rpm震荡过夜培养。取4ml过夜培养物接种于400ml LB液体培养基中，37℃以250rpm震荡培养至OD590为0.375。将培养基分装到8个50ml预冷的无菌聚丙烯离心筒中，冰浴10分钟，4℃下1600g离心7分钟沉淀菌体，弃去上清，用10ml预冷CaCl2溶液重悬菌体沉淀，4℃下1100g离心5分钟沉淀菌体，弃去上清，用10ml预冷CaCl2溶液重悬菌体沉淀，冰浴30分钟，4℃下1100g离心5分钟沉淀菌体。用2ml预冷CaCl2溶液重悬菌体沉淀，分装成每管100ul菌体溶液，即为感受态细胞。在感受态细胞中加入一定量DNA，混匀，冰浴10分钟，然后将感受态细胞于42℃水浴加热45秒，冰浴2分钟，加入900ulLB培养基，37℃震荡培养1小时。将菌液均匀涂布于抗性LB平板上，37℃培养12至16小时。

    ④菌种扩增将菌体平板划线于LB固体培养基上，37℃培养，挑取单克隆菌落，加LB培养基振荡培养过夜，第二天在新的培养基中加入1％体积的过夜培养菌液，继续培养至适当菌体浓度即可。

    ⑤质粒提取方法参照试剂盒中说明书。将500ml培养物到入离心筒中，于4℃以6000g离心15分钟，弃去培养基，将沉淀菌体重悬于10ml BufferP1中，加入10ml BufferP2，温和颠倒离心管5次，彻底混合溶液，室温放置5分钟。加入10ml预冷的Buffer P3，立即温和颠倒离心管5次，彻底混合溶液，冰浴20分钟。4℃下20000g离心30分钟，取上清重新离心15分钟。在QIAGEN-tip 500柱加10ml Buffer QBT，放置滤过溶液，平衡膜。将上清转移至柱中，放置滤过溶液，加入30ml Buffer QC，放置滤过溶液，重复用30mlBuffer QC洗膜。加入15ml Buffer QF，静置，滤液即为所提DNA溶液。滤液加入10.5ml异丙醇，混匀。4℃下15000g离心30分钟，弃去上清，用5ml 70％乙醇洗涤沉淀，15000g离心10分钟，在空气中干燥沉淀10分钟，DNA沉淀溶解于适当体积水中。

    ⑥琼脂糖电泳分析根据所要电泳的DNA分子量大小配制相应浓度的琼脂糖凝胶，在TAE电泳缓冲液中加入适量的琼脂糖，加热至琼脂糖溶解，使溶液冷却至60℃，加入EB至终浓度为0.5μg/ml，充分混匀，将溶液倒入胶模中，待凝胶完全凝固后，小心移去梳子，将凝胶放入电泳槽中，加入足量的电泳缓冲液。DNA样品与加样缓冲液混匀后，加入样品槽中，盖上电泳槽并通电，使DNA向阳极移动，采用5V/cm的电压降，电泳至溴酚蓝迁移至适当距离，切断电流，在紫外灯下检查凝胶中的DNA条带，并根据DNA分子量标准判断其大小。

    2.2构建步骤

    见图2，首先利用VR载体上XbaI和BamHI位点把合成的gagpol基因(GPCINS)克隆到上述载体上，形成VR-GPCINS；利用VR载体上BamHI位点把合成的env基因(ENVCINS)克隆到上述载体上，形成VR-ENVCINS。

    用VR载体作为模板利用PCR扩增BGH翻译终止信号片段，并使该片段5`端带有BglII位点，3`端依次带有MluI和BamHI(上游引物为：5`-AGATCTCACGTGGAATTCGCTGTGCCTTCTAGTTGCCAG-3`；下游引物为：5`-GGATCCACGCGTGCTAGCGGCCGCCATAGAGCCCACCGCATCC-3`)。由于BglII和BamHI含有相同的粘性末端，因此可利用VR-GPCINS的BamHI位点把BGH翻译终止信号片段克隆到VR-GPCINS上形成VR-GPCINS-BGH-BGH质粒，在两个BGH片段之间带有MluI位点。

    以VR-ENVCINS为模板利用PCR扩增env基因(ENVCINS)表达框架，该片段包括CMV启动子、intronA和env基因(ENVCINS)，该PCR产物5`端和3`端都带有AscI位点(上游引物5`-GGCGCGCCGTTGACATTGATTATTGACT-3`；下游引物5`-GGCGCGCCTCACTGCAGAGCGGCCTC-3`)。

    由于AscI和MluI有相同的粘性末端，因此可利用VR-GPCINS-BGH-BGH质粒上的MluI位点把env基因(ENVCINS)表达框架克隆到VR-GPCINS-BGH-BGH质粒上形成D-GPEi。

    2.3构建结果

    我们构建的艾滋病核酸疫苗D-GPEi能在人细胞中高效表达HIV-1核心结构蛋白Gag、GagPol和外壳蛋白Env，全长13KB。D-GPEi质粒的骨架主要含有三部分：(1)真核细胞表达单位，包括CMV启动子，多酶切位点和BGH转录终止信号；(2)原核启动子驱动的抗卡那霉素基因(在真核细胞内没有功能)；(3)大肠杆菌复制子，此用于扩增DNA质粒所用，在哺乳动物中不表达。

    D-GPEi含有的抗原基因是经过修饰的HIV-1中国流行株的gagpol和env，该DNA质粒转录2个RNA产物用于表达HIV-1的结构蛋白Gag，GagPol和Env。

    我们已经对D-GPEi进行了全序列测定，其含有13113bp，碱基组成份为adenines：24.81％；thymidines：20.15％；guanines：27.19％；cytosines：27.85％。该DNA可溶解在生理盐水中，浓度可达2mg/ml。

    2.4 D-GPEi基因序列与人基因组基因序列同源性分析

    在人基因组数据库中，用D-GPEi基因序列(共13113bp)与人基因组(共2826392627bp)进行了同源序列比较，没有发现有相似性。比较结果如下。这一结果从理论上消除了D-GPEi与人基因组发生高几率重组的可能性。

    3、质粒D-GPEi质粒的全序列测定。

    以3700DNA序列自动分析仪对D-GPEi进行全序列测定，测序结果SEQ ID NO：1

    我们采用DNA序列分析软件VectorNTI对上述序列进行分析，结果表明，测定序列与理论序列一致。抗原基因Gag、Pol和Env读码框架如下所示，氨基酸序列完全正确。

    Gag氨基酸序列如下：SEQ ID NO：4

    Pol氨基酸序列如下：SEQ ID NO：5

    Env氨基酸序列如下：SEQ ID NO：6

    根据以上测序结果及氨基酸分析，证实了插入基因和表达框架的正确性。

    实施例3重组痘苗M-GPE的构建

    1.1说明

    用于构建重组痘苗所用的gagpol基因与构建核酸疫苗的gagpol基因来源和序列完全相同，为修饰过的gagpol基因。另外，在购建重组痘苗工程病毒过程中，我们也对穿梭质粒pSC11-GPE的插入序列进行了全序列测定，结果表明用于构建重组痘苗所用的gagpol基因与构建核酸疫苗的gagpol基因来源和序列完全相同，因此，其编码抗原蛋白的氨基酸序列也完全相同。

    用于构建重组痘苗所用的的env基因与构建核酸疫苗的env基因在基因序列上不同。构建核酸疫苗的env基因为修饰过的基因，构建重组痘苗M-GPE的env基因为野生型env基因，其来源为HIV-1中国流行株，B/C重组亚型，在购建重组痘苗工程病毒过程中，我们对穿梭质粒pSC11-GPE的插入序列进行了全序列测定，其中包括野生型env基因序列，我们对env基因修饰前后所编码蛋白的氨基酸序列进行了比较，氨基酸序列没有发生任何变化，其作为抗原的免疫原性也应完全一致，

    1.2 MVA的来源和历史

    修饰的痘病毒Ankara株(Modified Vaccinia Virus Ankara，MVA)为人体内复制缺陷型痘病毒。它是德国Mayr研究小组于1975年为改进常规天花疫苗，使其减少常规天花疫苗的副作用而专门研制的一种新型天花疫苗。

    1.3重组痘苗M-GPE的构建

    上述HIV-1中国流行株(区域性)的gagpol和env基因被克隆到中间质粒pSC11中，构成pSC11-GPE。如图3所示：pSC11-GPE质粒中，位于同源臂TK-R和TK-L中，分别有两个阅读框架：启动子P11引导的Lac Z基因和启动子P7.5引导的HIV-1-GagPol和Env。

    重组穿梭质粒PSC11-GPE全序列如SEQ ID NO：9

    在构建M-GPE时，首先以滴度0.05pfu/cell的MVA感染CEF细胞。感染2小时后，利用Lipofection2000(INVITROGEN产品)的方法将pSC11-GPE转化到感染了MVA细胞的CEF细胞中。MVA在CEF细胞内复制的过程中，由于pSC11-GPE具有与MVA的TK基因同源的TK-R和TK-L，所以有一定比例的MVA病毒基因组与pSC11-GPE发生重组，结果HIV-1-Gag-Pol-Env和Lac Z阅读框架被重组到MVA病毒基因组中。形成如图4所示的M-GPE重组病毒。

    以上被感染细胞培养三天后，收集细胞，裂解细胞，离心除细胞残渣，超声波处理，离心保留上清。取一定量上清，作为种毒，在96孔板中对病毒以有限稀释法进行克隆。培养三天后，将培养液换成含X-gal的不含酚红的培养液。培养24小时后，显微镜下观察Lac Z染色情况。挑取稀释度高，Lac Z染色好的克隆进行下一代克隆。如此进行6次以上克隆。最后直至得到只含重组病毒M-GPE的克隆株。

    我们比较Gag、Pol和Env氨基酸序列的测定序列与理论序列，没有发现任何突变或插入基因，表达框架正确，没有出现错位。

    实施例4、核酸疫苗和重组痘苗联合使用的免疫原性研究

    免疫原性研究采用了ELISPOT、ICC和CTL等试验，具体试验方法如下：

    1、免疫小鼠：给5只一组的Balb/c小鼠分别在0，2，4周肌肉注射(100μg/小鼠/次)核酸疫苗或空白对照，然后在第六周用M-GPE(5×107pfu/小鼠，腹腔注射)进行增强免疫。增强免疫5天后，取出小鼠脾脏，分离脾细胞，然后把每组内的5只小鼠的脾细胞混合，分别用于ELISPOT，ICC和CTL检测。

    2 INF-γELISPOT检测：

    2.1实验目的：检测被HIV-1的核酸疫苗和重组痘苗联合免疫后的Balb/c小鼠在体内产生的与CD8阳性T淋巴细胞相关的，对HIV-1 P24抗原的特异性细胞免疫反应强度。

    2.2实验原理：Balb/c小鼠被含有HIV-1 P24抗原的核酸疫苗和重组痘苗联合免疫后，如果疫苗免疫成功，将使小鼠淋巴细胞产生对HIV-1相关抗原(如P24)的记忆。用P24中MHC class-I抗原决定簇小肽(AMQMLKETI，对Balb/c小鼠具有特异性)刺激被免疫小鼠脾细胞，应使其分泌细胞因子(如INF-γ)，从而反应出疫苗诱导的与CD8阳性T淋巴细胞相关的，对HIV-1 P24抗原的特异性细胞免疫反应。因此通过测定被免疫小鼠100万个脾细胞中能分泌INF-γ的淋巴细胞的数量，可以用于表示特异性细胞免疫反应强度。

    2.3实验仪器、材料：96孔板(96well filtration plate，Millipore产品)，抗鼠INF-γ抗体(Pharmingen)，RPMI1640细胞培养液，小牛血清，PBS，生物素标记的抗鼠INF-γ抗体(Pharmingen)，avidin标记碱性磷酸酶(Sigma)，BCIP-nitroblue tetrazolium溶液(Sigma)，实体显微镜，P24中MHC class-I抗原决定簇小肽(AMQMLKETI，对Balb/c小鼠具有特异性)，二氧化碳培养箱。

    2.4实验步骤：

    ①96孔板包被：在96孔板中每孔加入浓度为10μg/ml的抗鼠INF-γ抗体PBS溶液，4℃过夜，弃去抗体溶液，用含有10％小牛血清的RPMI1640细胞培养液在37℃下封闭2小时，然后用PBS冲洗五次以上，备用。

    ②计数每组试验小鼠的脾细胞。

    ③把每组小鼠的脾细胞进行稀释，即把细胞浓度为1000万小鼠脾细胞/ml的细胞溶液分别进行3倍系列稀释，制成每毫升细胞培养液中分别含有1/3、1/9、1/27×1000万小鼠脾细胞的细胞溶液。在上述包被好的96孔板中，每孔加入各组不同稀释度的小鼠脾细胞溶液100μl，每个稀释度的样品分别加入到2个孔中，作为实验组和对照组。实验组样品中再加入100μl P24 MHC class-I抗原决定簇小肽溶液(2μg/ml细胞培养液)，对照组加入100μl细胞培养液，混匀后放入37℃二氧化碳培养箱保温24小时。

    ④取出96孔板，用含有0.025％Tween-20的PBS溶液洗五次。

    ⑤每孔中加入50μl生物素标记的抗鼠INF-γ抗体(5μg抗体/ml PBS)，室温下放置2小时。

    ⑥用含有0.025％Tween-20的PBS溶液洗五次96孔板。

    ⑦每孔中加入50μl avidin标记碱性磷酸酶(1.25μg酶联抗体/ml PBS)，室温下放置2小时。

    ⑧用含有0.025％Tween-20的PBS溶液洗五次96孔板，最后用PBS洗一次。

    ⑨每孔中加入碱性磷酸酶底物显色剂BCIP-nitroblue tetrazolium溶液，并在显微镜下观察斑点并计数。

    ⑩根据统计的斑点数计算出100万个被免疫小鼠的脾细胞中能特异性分泌INF-γ的淋巴细胞的比例。

    3 ICC检测(Intracellular cytokine staining and flow cytometry analysis)

    3.1实验目的：检测被HIV-1的核酸疫苗和重组痘苗联合免疫后的Balb/c小鼠在体内产生的与CD8阳性T淋巴细胞相关的，对HIV-1 P24抗原的特异性细胞免疫反应强度。

    3.2实验原理：Balb/c小鼠被含有HIV-1 P24抗原的核酸疫苗和重组痘苗联合免疫后，如果疫苗免疫成功，将使小鼠淋巴细胞产生对HIV-1相关抗原(如P24)的记忆。用P24中MHC class-I抗原决定簇小肽(AMQMLKETI，对Balb/c小鼠具有特异性)刺激被免疫小鼠脾细胞，应使其分泌细胞因子(如INF-γ)，从而反应出疫苗诱导的与CD8阳性T淋巴细胞相关的，对HIV-1 P24抗原的特异性细胞免疫反应。这里用抗CD8抗体和抗INF-γ抗体分别对各组小鼠脾细胞进行免疫染色，然后用流式细胞仪分析INF-γ阳性细胞占CD8阳性淋巴细胞的比例，来表示特异性细胞免疫反应强度。

    3.3实验仪器、材料：流式细胞仪(Becton Dickinson)、Cyotofix/Cytoperm with Golgistop(Pharmingen)、藻红蛋白(phycoerythrin)偶联抗鼠CD8抗体(Pharmingen)、FITC偶联抗INF-γ抗体(Pharmingen)、P24中MHC class-I抗原决定簇小肽(AMQMLKETI，对Balb/c小鼠具有特异性)、Perm/Wash Buffer(Pharmingen)、染色缓冲液(SB：1％小牛血清PBS溶液)

    3.4实验方法：

    ①把上述制备好的各组实验小鼠脾细胞分别加入24孔板中，使每孔细胞数量为2×106细胞/100μl，每个实验组小鼠的脾细胞加入2个孔中，分别作为对照组和实验组。

    ②在实验组脾细胞内每孔分别加入892.4μl RPMI1640(10％小牛血清)细胞培养液，6.6μl Golgistop溶液(1/10稀释)，1μl P24中MHC class-I抗原决定簇小肽(1μg/μl)，使最终体积达到1ml。

    ③在对照组脾细胞内每孔分别加入893.4μl RPMI1640(10％小牛血清)细胞培养液，6.6μl Golgistop溶液(1/10稀释)，使最终体积达到1ml。

    ④混匀，37℃二氧化碳培养箱保温过夜。

    ⑤把保温过夜的细胞转移到不同的1.5ml Eppendorf管中，注意尽可能转移所有细胞，1200转4℃离心5分钟，除去上清。用染色缓冲液洗两次，进行下面的免疫染色实验。

    ⑥按Cyotofix/Cytoperm with Golgistop Kit说明进行免疫染色，并设置合适的空白对照。即在所有实验管中加入100μl藻红蛋白(phycoerythrin)偶联抗鼠CD8抗体(用染色缓冲液1000倍稀释)，4℃下暗处保温30分钟。

    ⑦用染色缓冲液4℃下洗两次，然后在细胞中加入250μl Cyotofix/Cytoperm 4℃下保温20分钟。

    ⑧用1×Perm/Wash缓冲液洗两次细胞，在所有实验管中加入50μl FITC偶联抗INF-γ抗体(用Perm/Wash缓冲液50倍稀释)，4℃下保温30分钟。

    ⑨用1×Perm/Wash缓冲液洗两次细胞，用250μl染色缓冲液悬浮细胞，把细胞溶液转移到5ml polystyrene圆底样品管中，注意尽量转移所有细胞。

    ⑩用流式细胞仪对样品进行测试和分析。

    4 CTL检测

    4.1实验目的：检测被HIV-1的核酸疫苗和重组痘苗联合免疫后的Balb/c小鼠在体内产生的与CD8阳性T淋巴细胞相关的特异性CTL反应。

    4.2实验原理：Balb/c小鼠被含有HIV-1 P24抗原的核酸疫苗和重组痘苗联合免疫后，如果疫苗免疫成功，小鼠CD8阳性T淋巴细胞将对表面带有HIV-1抗原决定簇小肽的靶细胞具有细胞毒杀伤作用。这里我们分离被免疫小鼠的脾细胞，并用P24抗原肽标记的小鼠细胞株P815作为靶细胞，按一定比例混合上述脾细胞和靶细胞，测定靶细胞P815被裂解的比例，用来表征该疫苗在小鼠体内诱导的特异性CTL反应强度。

    4.3实验仪器、材料：RPMI1640细胞培养液，phenol red-free RPMI1640细胞培养液、小牛血清，PBS，淋巴细胞分离液Ficoll-Hypaque(Pharmacia)、红细胞裂解液、P24 MHCclass-I抗原决定簇小肽(AMQMLKETI，对Balb/c小鼠具有特异性)、P815细胞株、Cytotox96 assay kit(Promega)、圆底96孔板、离心机、酶标仪

    4.4实验步骤：

    (1)靶细胞P815的制备：在含有15％小牛血清的DMEM细胞培养液中培养细胞P815细胞，使细胞浓度为107细胞/ml。在该P815细胞溶液中加入P24 MHC class-I抗原决定簇小肽，使其浓度为10μg/ml，37℃保温1小时。然后用3％小牛血清的RPMI1640细胞培养液(phenol red-free)洗3次细胞，并用相同的培养液悬浮细胞，使细胞浓度在105细胞/ml。

    (2)从被免疫的小鼠(重组痘苗免疫五天后)脾细胞中，用淋巴细胞分离液Ficoll-Hypaque分离淋巴细胞，并计数。

    (3)在含有3％小牛血清的RPMI1640细胞培养液(phenol red-free)中悬浮淋巴细胞，使细胞浓度在107细胞/ml。

    (4)按Cytotox 96LDH Kit说明书进行CTL检测，并设置合适的空白对照和阳性对照。即在圆底96孔板中分别加入不同稀释度的各组实验小鼠淋巴细胞(106，3.3×105，1×105，3.3×104/100μl)，每个稀释度样品加入六个孔中，其中三个孔(三个平行样)为实验组，三个孔为淋巴细胞自裂解对照组。

    (5)在实验组中加入上述100μl P815靶细胞，在对照组中加入100μl 3％小牛血清的RPMI1640细胞培养液(phenol red-free)。

    (6)其他各种对照包括：

    1)靶细胞自裂解对照：在每个孔中加入100μl靶细胞和100μl 3％小牛血清的RPMI1640细胞培养液(phenol red-free)，做六个平行样。

    2)靶细胞最大裂解对照：在每个孔中加入100μl靶细胞和100μl 3％小牛血清的RPMI1640细胞培养液(phenol red-free)，做六个平行样(以后将加入细胞裂解液)。

    3)体积校正对照：加入200μl 3％小牛血清的RPMI1640细胞培养液(phenol red-free)，做六个平行样。

    4)细胞培养液背景对照：加入200μl 3％小牛血清的RPMI1640细胞培养液(phenolred-free)，做六个平行样。

    (7)把上述加好样品及对照的96孔板放入37℃二氧化碳培养箱保温5小时。在保温至4小时15分钟时，分别在靶细胞最大裂解对照组和体积校正对照组中加入10μl细胞裂解液(Cytotox 96LDH Kit提供)。

    (8)保温5小时后，250g离心96孔板4分钟。在每孔中取出50μl上清按顺序转入新的平底96孔板中，用于下一步显色实验。

    (9)按Cytotox 96LDH Kit配制LDH显色液：在每孔中加入50μl上述配制好的底物显色液，室温暗处放置30分钟。然后加入50μl终止缓冲液(Cytotox 96LDH Kit提供)。

    (10)用酶标仪在490nm波长下读板。

    (11)根据公式计算各淋巴细胞稀释度的靶细胞特异性裂解百分比：

    靶细胞特异性裂解百分比＝(实验组—淋巴细胞自裂解组—靶细胞自裂解组)/(靶细胞最大裂解—靶细胞自裂解)

    (12)绘制靶细胞特异性裂解百分比～淋巴细胞稀释度的曲线，该曲线将反映出艾滋病疫苗在小鼠体内诱导的对HIV-1特异性CTL的情况。

    5核酸疫苗D-GPEi和重组痘苗M-GPE免疫原性分析

    为了调查该D-GPEi核酸疫苗和重组痘苗在小鼠体内的免疫反应，我们用不同的DNA质粒作为核酸疫苗分三次通过后腿肌肉注射来免疫小鼠，每次免疫时间间隔为2周，每次注射剂量为100μg/只，最后一次注射核酸疫苗2周后，再用M-GPE来增强免疫，5×107pfu/只，然后检测小鼠的体液免疫和细胞免疫反应。

    图5是小鼠被免疫后的体液免疫反应。从图中可以看出(1)修饰型的gagpo核酸疫苗可在小鼠体内引起较强的体液免疫反应，而野生型的gagpol的核酸疫苗所引起的抗体反应非常弱；(2)虽然env基因被修饰后可在细胞内高效表达，但只含修饰的env基因(gpl60)的核酸疫苗难以在动物体内引起免疫反应；(3)同时含有修饰型的gagpol和修饰型env基因的核酸疫苗在小鼠体内产生了较强的对Gag和Env的抗体反应，而野生型的env基因即使与gagpol共表达也难以在小鼠体内产生对Env的抗体反应；(4)特别在M-GPE增强免疫后，抗体反应大大提高。

    ELISPOT，CTL和ICC被用于检测联合疫苗在BALB/C小鼠诱导的细胞免疫反应。HIV-1P24上的肽AMQMLKETI被用于上述测定。在小鼠被M-GPE增强免疫后第5天，解剖小鼠，取出脾脏，分离脾细胞用于ELISPOT和ICC测定；从脾细胞中进一步分离淋巴细胞用于CTL测定。这里我们选用第1组(空白)，第3组(野生型gagpol)和第5组(D-GPEi)小鼠作为实验对象，分别测定了这三组小鼠对小肽AMQMLKETI特定的细胞免疫反应。

    图6，图7用不同的实验，从不同的方面检测了被联合疫苗免疫的小鼠对HIV-1抗原(这里只包括小肽AMQMLKETI)的特异性细胞免疫反应。(1)实验动物被核酸疫苗D-GPEi初次免疫和M-GPE增强免疫后，再用ELISPOT或ICC测定其细胞免疫强度时，只有用小肽AMQMLKETI刺激淋巴细胞后细胞因子才大量分泌，这说明其诱导的细胞免疫反应具有针对HIV-1抗原的特异性；(2)图8显示了CD8淋巴细胞对包被有HIV-1抗原肽的靶细胞具有特异性的杀伤作用，这一结果最直接地反映了该疫苗在实验动物上的功效；(3)这里我们用了三组实验小鼠：空白，野生型gagpol表达质粒和修饰型D-GPEi，即使用同一种抗原(M-GPE)进行增强免疫，其产生的二次细胞免疫反应的强度大大不同，这说明只有修饰型D-GPEi核酸疫苗才能很好地刺激实验动物的免疫系统产生初次免疫，而这种初次免疫对利用增强免疫来提高总体免疫效果至关重要。

    从上述结果得出结论：我们构建的艾滋病核酸疫苗与重组痘苗联合使用在小鼠模型中能产生对HIV-1中国流行株较强的体液和细胞免疫反应。

    实施例5、核酸疫苗和重组痘苗联合使用在非人灵掌类动物中的免疫原性研究

    为进一步研究核酸疫苗在非人灵掌类动物中的免疫原性，这里我们以猴子作为动物模型(中国广西壮族自治区疾病预防与控制中心提供，恒河猴)，10只猴子分为3组，具体分组见下边的“猴子分组表”(第一组：A、B空白对照；第二组C、D、E、F野生型gagpol质粒；第三组G、H、I、J修饰型D-GPEi质粒)，各组猴子分别在0天、15天和30天注射生理盐水2ml或不同种类核酸疫苗(2mg/猴子/次)，第6周用生理盐水(空白对照)或M-GPE增强免疫(109pfu/猴子)。分别在增强免疫后15天、90天和180天静脉取血，分离淋巴细胞，用ELISPOT测定在用小肽刺激后100万淋巴细胞中能分泌INF-γ的细胞的数量，C亚型HIV-1 Gag蛋白肽库被用于上述测定。

    图9用ELISPOT检测了被上述疫苗免疫的猴子对HIV-1抗原的特异性细胞免疫反应。实验结果表明：(1)修饰型的gagpol疫苗可在猴子体内引起较强的细胞免疫反应，而野生型的GagPol的疫苗所引起的细胞免疫反应较弱；(2)100％的实验动物都产生了对HIV-1抗原的特异性细胞免疫反应，其中75％的实验动物细胞免疫反应较强；(3)动物被核酸疫苗D-GPEi初次免疫和M-GPE增强免疫后，只有用小肽刺激淋巴细胞后细胞因子才大量分泌，这说明其诱导的细胞免疫反应具有针对HIV-1抗原的特异性；(4)M-GPE增强免疫3个月内，细胞免疫反应强度没有下降，6个月后有一定幅度下降。

    从上述结果得出结论：我们构建的艾滋病核酸疫苗与重组痘苗在非人灵掌类动物模型中能产生对HIV-1中国流行株较强的体液和细胞免疫反应。

    实施例6药物组合物

    核酸疫苗：质粒D-GPEi与生理盐水的重量体积比为：1mg/ml，每次注射2ml，注射3次，痘病毒载体疫苗：M-GPE与生理盐水的滴度体积比为：1011pfu/ml，每次注射0.1ml，注射1次。分别于0、1、2、3月注射核酸疫苗、核酸疫苗、核酸疫苗、痘病毒载体疫苗。

    实施例7药物组合物

    核酸疫苗：质粒D-GPEi与生理盐水的重量体积比为：2mg/ml，每次注射2ml，注射3次，痘病毒载体疫苗：M-GPE与生理盐水的滴度体积比为：109pfu/ml，每次注射0.1ml，注射1次。分别于0、1、2、3月注射核酸疫苗、核酸疫苗、核酸疫苗、痘病毒载体疫苗。

    实施例7药物组合物

    核酸疫苗：质粒D-GPEi与生理盐水的重量体积比为：3mg/ml，每次注射2ml，注射3次，痘病毒载体疫苗：M-GPE与生理盐水的滴度体积比为：107pfu/ml，每次注射0.1ml，注射1次。分别于0、1、2、3月注射核酸疫苗、核酸疫苗、核酸疫苗、痘病毒载体疫苗。

                                  猴子分组表    猴子编号  注射疫苗种类    淋巴细胞编号    取血时间    (最后一次免疫后天数)    A    空白  生理盐水    1    15    2    90    3    180    B    空白  生理盐水    4    15    5    90    6    180    C    野生型  野生型GagPol    7    15    8    90    9    180    D    野生型  野生型GagPol    10    15    11    90    12    180    E    野生型  野生型GagPol    13    15    14    90    15    180    F    野生型  野生型GagPol    16    15    17    90    18    180    G    修饰型  D-GPEi    19    15    20    90    21    180    H    修饰型  D-GPEi    22    15    23    90    24    180    I    修饰型  D-GPEi    25    15    26    90    27    180    J    修饰型  D-GPEi    28    15    29    90    30    180

                          序列表

    SEQ ID NO：1

    TCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCG

    GAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCG

    TCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATG

    CGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATA

    CCGCACAGATGCGTAAGGAGAAAATACCGCATCAGATTGGCTATTGGCCA

    TTGCATACGTTGTATCCATATCATAATATGTACATTTATATTGGCTCATG

    TCCAACATTACCGCCATGTTGACATTGATTATTGACTAGTTATTAATAGT

    AATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTT

    ACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCG

    CCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGA

    CTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTG

    GCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAA

    TGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGG

    ACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATG

    GTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTC

    ACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTT

    GGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCA

    TTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAG

    AGCTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTT

    TTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCGCGGCCGGGAA

    CGGTGCATTGGAACGCGGATTCCCCGTGCCAAGAGTGACGTAAGTACCGC

    CTATAGACTCTATAGGCACACCCCTTTGGCTCTTATGCATGCTATACTGT

    TTTTGGCTTGGGGCCTATACACCCCCGCTTCCTTATGCTATAGGTGATGG

    TATAGCTTAGCCTATAGGTGTGGGTTATTGACCATTATTGACCACTCCCC

    TATTGGTGACGATACTTTCCATTACTAATCCATAACATGGCTCTTTGCCA

    CAACTATCTCTATTGGCTATATGCCAATACTCTGTCCTTCAGAGACTGAC

    ACGGACTCTGTATTTTTACAGGATGGGGTCCCATTTATTATTTACAAATT

    CACATATACAACAACGCCGTCCCCCGTGCCCGCAGTTTTTATTAAACATA

    GCGTGGGATCTCCACGCGAATCTCGGGTACGTGTTCCGGACATGGGCTCT

    TCTCCGGTAGCGGCGGAGCTTCCACATCCGAGCCCTGGTCCCATGCCTCC

    AGCGGCTCATGGTCGCTCGGCAGCTCCTTGCTCCTAACAGTGGAGGCCAG

    ACTTAGGCACAGCACAATGCCCACCACCACCAGTGTGCCGCACAAGGCCG

    TGGCGGTAGGGTATGTGTCTGAAAATGAGCGTGGAGATTGGGCTCGCACG

    GCTGACGCAGATGGAAGACTTAAGGCAGCGGCAGAAGAAGATGCAGGCAG

    CTGAGTTGTTGTATTCTGATAAGAGTCAGAGGTAACTCCCGTTGCGGTGC

    TGTTAACGGTGGAGGGCAGTGTAGTCTGAGCAGTACTCGTTGCTGCCGCG

    CGCGCCACCAGACATAATAGCTGACAGACTAACAGACTGTTCCTTTCCAT

    GGGTCTTTTCTGCAGTCACCGTCGTCGACACGTGTGATCAGATATCGCGG

    CCGCTCTAGAATGGGCGCCCGGGCCAGCATCCTGCGGGGAGGCAAGCTGG

    ACAAATGGGAGAAGATCCGGCTGAGACCCGGAGGCAAGAAACACTACATG

    CTGAAGCACCTGGTGTGGGCCAGCCGGGAGCTGGAAAGATTCGCCCTGAA

    CCCCGGCCTCCTGGAGACCAGCGAAGGCTGCAAGCAGATCATTAAGCAGC

    TGCAACCCGCCCTGCAGACCGGCACCGAGGAACTGCGGAGCCTGTTCAAC

    ACCGTGGCCACCCTGTACTGCGTGCACGAGGAAATCGAGGTGCGGGACAC

    CAAGGAGGCCCTGGACAAGATCGAGGAAGAGCAGAACAAGATCCAGCAAA

    AGACCCAGCAGGCCAAGAAAGCCGACGAGAAGGTGAGCCAGAACTACCCC

    ATCGTGCAGAACCCCCAGGGCCAGATGGTGCACCAGCCTCTGAGCCCCCG

    GACCCTGAACGCCTGGGTGAAGGTCGTGGAGGAAAAGGCCTTCAGCCCCG

    AGGTGATCCCTATGTTCACCGCCCTGAGCGAGGGCGCCACCCCCCAGGAC

    CTGAACACCATGCTGAACACCGTGGGCGGGCACCAGGCTGCCATGCAGAT

    GCTGAAGGACACCATCAACGAGGAAGCCGCTGAGTGGGACCGGCTGCACC

    CCGTGCACGCCGGCCCCGTGGCCCCTGGCCAGATGCGGGAGCCCAGAGGC

    AGCGACATCGCCGGCACCACATCCAGCCTGCAGGAGCAGATCGGCTGGAT

    GACCAACAATCCTCCCATCCCAGTGGGCGAGATCTACAAGCGGTGGATTA

    TCCTGGGCCTGAACAAGATCGTGCGGATGTACAGCCCCACCTCCATCCTG

    GACATCAAGCAGGGCCCTAAGGAGCCCTTCCGGGACTACGTGGATAGATT

    CTTTAAGACCCTGCGGGCCGAGCAGGCCACCCAGGACGTGAAGAACTGGA

    TGACCGACACCCTGCTCGTGCAGAATGCCAACCCCGACTGCAAGACCATC

    CTGCGGGCCCTGGGCAGCGGCGCCTCCCTGGAAGAGATGATGACCGCCTG

    CCAGGGCGTGGGAGGCCCCAGCCACAAGGCCCGGGTGCTGGCTGAGGCCA

    TGAGCCAGACCTCCAACACCATCCTGATGCAGCGGAGCAACTTCAAGGGC

    AGCAAACGGATCGTGAAGTGCTTCAACTGTGGCAAGGAGGGCCACATCGC

    CAAGAACTGCAGGGCCCCTAGGAAAAAAGGCTGTTGGAAATGTGGAAAGG

    AAGGACACCAAATGAAAGACTGTACTGAAAGGCAGGCGAATTTTTTAGGG

    AAATTTTGGCCTTCCCACAAGGGGAGGCCAGGGAATTTTCTCCAGAGCAG

    ACCAGAGCCAACAGCCCCACCAGCAGAGAGCTTCAGGTTCGAGGAGACAA

    CCCCAGCTCCGAAGCAGGAACCGAAAGACAGGGAACCCTTAACTTCCCTC

    AGATCACTCTTTGGCAGCGACCCCTTGTCTCAATAAAAGTAGGGGGCCAG

    ATAAAAGAGGCTCTCTTGGCCACCGGCGCCGATGACACCGTGCTGGAGGA

    AGTGAACCTGCCCGGCAAGTGGAAGCCCAAGATGATCGGCGGGATCGGAG

    GCTTCATCAAGGTGCGGCAGTACGAGCAGATCCCCATTGAGATCTGCGGC

    AAGAAAGCCATCGGCACCGTGCTGGTGGGCCCCACCCCCGTGAACATCAT

    TGGCCGGAACATGCTGACCCAGCTGGGCTGCACCCTGAACTTCCCCATCA

    GCCCCATCGAGACCGTGCCCGTGAAGCTGAAGCCCGGCATGGACGGCCCC

    AAGGTGAAGCAGTGGCCCCTGACCGAGGAAAAGATCAAGGCCCTGACCGC

    CATCTGCGACGAGATGGAAAAGGAGGGCAAGATCACCAAGATCGGCCCCG

    ACAACCCCTACAACACCCCCATCTTCGCCATCCGGAAGAAAGACAGCTCC

    AAGTGGCGGAAGCTGGTGGACTTCCGGGAGCTGAACAAGCGGACCCAGGA

    CTTCTGGGAGGTGCAGCTGGGCATCCCCCACCCCGCCGGCCTGAAGAAAA

    AGAAAAGCGTGACCGTGCTGGACGTGGGCGACGCCTACTTCAGCGTGCCC

    CTGGATAAGGACTTCCGGAAGTACACCGCCTTCACCATCCCCAGCGTGAA

    CAATGAGACCCCCGGCATCCGGTACCAGTACAACGTGCTGCCCCAGGGCT

    GGAAGGGCAGCCCCGCCATCTTCCAGTGCAGCATGACCAAGATCCTGGAG

    CCCTTCCGGAAGCAGAACCCCGACATCGTGATCTACCAGTACATGCATGA

    TCTGTACGTGGGCAGCGACCTGGAGATCGGCCAGCACCGGACCAAGATCG

    AGGAACTGCGGGAGCACCTCCTGAAGTGGGGCTTCACCACACCCGACAAG

    AAACACCAGAAGGAGCCTCCCTTCCTGTGGATGGGCTACGAGCTGCACCC

    CGACAAGTGGACCGTGCAGCCCATCCAGCTGCCCGAGAAGGACAGCTGGA

    CCGTGAACGACATCCAGAAGCTGGTGGGCAAGCTGAACTGGGCCAGCCAG

    ATCTACCCCGGCATCAAGGTGCGGCAGCTGTGCAAGCTCCTGCGGGGCGC

    CAAGGCCCTGACCGACATCGTGCCCCTGACCGAGGAAGCCGAGCTGGAAC

    TGGCCGAGAACCGGGAGATCCTGAAGGAGCCCGTGCACGGCGCCTACTAT

    GACCCCAGCAAGGAGCTGATCGCCGAGATCCAGAAGCAGGGCCAAGACCA

    GTGGACCTACCAGATCTACCAGGAGCCCTTCAAGAACCTGAAGACCGGCA

    AGTACGCCAAGATGCGGACCGCCCACACCAACGACGTGAAGCAGCTGACC

    GAGGCCGTGCAGAAGATCGCCATGGAGAGCATCGTGATTTGGGGCAAGAT

    CCCCAAGTTCCGGCTGCCCATCCAGAAGGAGACCTGGGAGACCTGGTGGA

    CCGACTACTGGCAGGCCACCTGGATCCCCGAGTGGGAGTTCGTGAACACC

    CCTCCCCTGGTGAAGCTGTGGTACCAGCTGGAGAAGGACCCCATCGCCGG

    CGTGGAGACCTTCTACGTGGACGGCGCCGCTAACCGGGAGACCAAGATCG

    GCAAGGCCGGCTACGTGACCGACAGAGGCCGGAAGAAAATCGTGAGCCTG

    ACCGACACAACCAACCAGAAGACCGAGCTGCAGGCCATCTACATCGCCCT

    GCAGGACAGCGGCAGCGAGGTGAACATCGTGACCGACAGCCAGTACGCCC

    TGGGCATCATTCAGGCCCAGCCCGACAAGAGCGAGAGCGAGCTGGTGAAC

    CAGATCATTGAGCAGCTGATCAAGAAAGAGCGGGTGTACCTGAGCTGGGT

    GCCCGCCCACAAGGGCATCGGGGGCAACGAGCAGGTGGACAAGCTGGTGA

    GCAACGGCATCCGGAAGGTGCTGTTCCTGGACGGCATCGACAAGGCCCAG

    GAGGAACACGAGAAGTACCACAGCAACTGGCGGGCCATGGCCAGCGACTT

    CAACCTGCCTCCCATCGTGGCCAAGGAGATCGTGGCCAGCTGCGACCAGT

    GTCAGCTGAAGGGCGAGGCCATGCACGGCCAGGTGGACTGCAGCCCCGGC

    ATCTGGCAGCTGGACTGCACCCACCTGGAGGGCAAGATCATTCTGGTGGC

    CGTCCACGTGGCCAGCGGCTACATCGAGGCCGAGGTGATCCCCGCCGAGA

    CCGGCCAGGAGACCGCCTACTTCATCCTGAAGCTGGCCGGCCGGCAGGAT

    GAGGACTGAGGATCTCACGTGGAATTCGCTGTGCCTTCTAGTTGCCAGCC

    ATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCA

    CTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTG

    AGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGCACAGCAAGGG

    GGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTA

    TGGCGGCCGCTAGCACGCGCCGTTGACATTGATTATTGACTAGTTATTAA

    TAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCG

    CGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACC

    CCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATA

    GGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCA

    CTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACG

    TCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTA

    TGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTAC

    CATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTG

    ACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTG

    TTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGC

    CCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAA

    GCAGAGCTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGC

    TGTTTTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCGCGGCCG

    GGAACGGTGCATTGGAACGCGGATTCCCCGTGCCAAGAGTGACGTAAGTA

    CCGCCTATAGACTCTATAGGCACACCCCTTTGGCTCTTATGCATGCTATA

    CTGTTTTTGGCTTGGGGCCTATACACCCCCGCTTCCTTATGCTATAGGTG

    ATGGTATAGCTTAGCCTATAGGTGTGGGTTATTGACCATTATTGACCACT

    CCCCTATTGGTGACGATACTTTCCATTACTAATCCATAACATGGCTCTTT

    GCCACAACTATCTCTATTGGCTATATGCCAATACTCTGTCCTTCAGAGAC

    TGACACGGACTCTGTATTTTTACAGGATGGGGTCCCATTTATTATTTACA

    AATTCACATATACAACAACGCCGTCCCCCGTGCCCGCAGTTTTTATTAAA

    CATAGCGTGGGATCTCCACGCGAATCTCGGGTACGTGTTCCGGACATGGG

    CTCTTCTCCGGTAGCGGCGGAGCTTCCACATCCGAGCCCTGGTCCCATGC

    CTCCAGCGGCTCATGGTCGCTCGGCAGCTCCTTGCTCCTAACAGTGGAGG

    CCAGACTTAGGCACAGCACAATGCCCACCACCACCAGTGTGCCGCACAAG

    GCCGTGGCGGTAGGGTATGTGTCTGAAAATGAGCGTGGAGATTGGGCTCG

    CACGGCTGACGCAGATGGAAGACTTAAGGCAGCGGCAGAAGAAGATGCAG

    GCAGCTGAGTTGTTGTATTCTGATAAGAGTCAGAGGTAACTCCCGTTGCG

    GTGCTGTTAACGGTGGAGGGCAGTGTAGTCTGAGCAGTACTCGTTGCTGC

    CGCGCGCGCCACCAGACATAATAGCTGACAGACTAACAGACTGTTCCTTT

    CCATGGGTCTTTTCTGCAGTCACCGTCGTCGACACGTGTGATCAGATATC

    GCGGCCGCTCTAGACCAGGCGCCTGGATCCGCCCAGATCTACCATGAGAG

    TGAGGGGCACCAGACGGAACTACCAACAGTGGTGGATCTGGGGCGTGCTG

    GGCTTCTGGATGCTGATGATCTGCAACGTGGAGGGCAACCTGTGGGTGAC

    CGTCTACTATGGCGTGCCCGTCTGGAAGGAGGCCAAGACCACACTGTTCT

    GTGCCAGCGACGCTAAGGCCTACGAGACCGAGGTGCACAACGTCTGGGCC

    ACCCATGCCTGCGTGCCAACCGACCCTAACCCACAGGAGATCGTGATGGA

    GAACGTGACCGAGAATTTCAACATGTGGAATAACGACATGGTGAACCAGA

    TGCACGAGGACGTGATCAGCCTGTGGGACCAGAGCCTGAAGCCCTGCGTG

    AAGCTGACCCCCCTGTGCGTGACCCTGGAATGTCGGAACGTGAGCTCCAA

    CGGCAACGGCACACGGAACGAGACCTACAACGAGAGCGTGAAGGAGGTGA

    AGAACTGCAGCTTCAACGCCACCACACTGCTCAGAGACCGGAAGAAAACC

    GTGTACGCCCTGTTCTACAGACTGGACATTGCTCCCCTGAACGACGAGAA

    CAGCGGCAAGAACTCCAGCGAGTACTATCGGCTGATCAACTGCAACACCA

    GCGCCATCACCCAGGCCTGCCCCAAGGTGACCTTCGACCCTATTCCCATC

    CACTACTGCACCCCCGCCGGCTACGCCATCCTGAAGTGCAACGACAAAAT

    CTTCAACGGCACCGGACAGTGTCACAACGTGTCCACCGTGCAGTGCACCC

    ATGGCATCAAGCCCGTCGTGTCCACCCAGCTGCTCCTGAATGGAAGCCTG

    GCCGAGAGAGAGATCATTATCCGGAGCGAGAACCTGACCAATAACGTGAA

    GACCATCATTGTGCACCTGAACAAGAGCGTGGAGATCGTGTGCACCCGGC

    CCAACAATAACACCAGGAAGAGCATCAGAATTGGGCCCGGCCAGACCTTC

    TATGCTACCGGCGACATCATTGGCGACATCAGACAGGCTCATTGCAACAT

    CAGCAAGGACAAGTGGGACGAGACACTGCAGCGGGTGAGCAAGAAACTGG

    CCGAGCACTTCCCCAACAAGACCATCAAGTTTGCCAGCTCTTCCGGCGGA

    GACCTGGAGATCACCACACACAGCTTCAACTGCCGGGGCGAGTTCTTTTA

    CTGCAACACCAGCGGACTGTTCAACGGCACCTACAACGGCACCAAGGACA

    ACAGCTCCAGCATCATTACCATCCCCTGTCGGATCAAGCAGATTATCAAC

    ATGTGGCAGGAAGTGGGACGGGCCATGTACGCTCCACCCATCGAGGGCAA

    CATCACCTGCAAGTCCAACATCACCGGCCTGCTCCTGGTGCGGGACGGCG

    GAAGAACAGAGAGCAACGACACCGAAATCTTCAGACCCGGCGGAGGCGAC

    ATGCGGAACAATTGGCGGAACGAGCTGTACAAGTACAAGGTGGTCGAGAT

    CAAACCCCTGGGAGTGGCCCCTACAGCTGCCAAGAGACGGGTGGTCGAGA

    GGGAGAAGCGGGCCGTGGGCCTGGGAGCTGTGTTCCTGGGCTTCCTGGGA

    GCTGCCGGGAGCACCATGGGCGCTGCCAGCATCACCCTGACCGTGCAAGC

    CAGACAGCTCCTGAGCGGCATCGTGCAGCAACAGAGCAACCTGCTCAGAG

    CCATCGAAGCCCAACAGCACATGCTCCAGCTGACCGTGTGGGGCATCAAG

    CAACTCCAGACCCGGGTGCTCGCCATCGAACGGTACCTGAAGGACCAGCA

    GCTGCTCGGCATCTGGGGCTGTTCCGGAAAGCTGATCTGCACAACCGCCG

    TGCCCTGGAACTCCAGCTGGTCTAACAAGAGCCAACAGGAAATCTGGGAC

    AACATGACCTGGATGCAGTGGGACAAGGAGATCAGCAACTACACCAACAC

    CATCTACAGACTGCTCGAGGACAGCCAGAACCAACAGGAGCGGAATGAGA

    AGGACCTGCTCGCCCTGGACAGCTGGAAGAACCTGTGGAGCTGGTTTGAC

    ATCACTAACTGGCTGTGGTACATTAAAATCTTCATTATGATCGTGGGCGG

    GCTGATCGGAAGCAGGATTATCTTCGCCGTGCTGAGCATCGTGAACAGAG

    TGCGGCAGGGCTACTCCCCACTGAGCTTCCAGATCCCCACCCCTAACCCC

    GGCGGACCTGGCAGACTGGGCAGAATCGAGGAAGAGGGAGGCGAACAGGA

    CAAGACCCGGAGCATCAGGCTGGTGAACGGCTTCCTGGCCCTGGCCTGGG

    ACGATCTGCGGAACCTGTGCCTGTTCAGCTACCACAGACTGAGCGACTTC

    ATCCTCCTGACTGCTAGGGGAGTGGAGCTGCTCGGGAGAAACTCTCTGAG

    GGGCCTGCAGCGGGGATGGGAAGCTCTGAAGTACCTGGGCAACCTGGTGC

    AGTACTGGGGCCTGGAGCTGAAGAAAAGCACAATCTCCCTGGTGGACACC

    ATCGCCATCGTGGTCGCCGAGGGCACCGATAGAATCATTAACATCGTGCA

    GGGAATTTGCCGGGCCATCCACAACGTGCCTAGAAGGATCAGACAGGGAC

    TGGAGGCCGCTCTGCAGTGAGGATCCAGATCTGCTGTGCCTTCTAGTTGC

    CAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGG

    TGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATT

    GTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGCACAGC

    AAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGG

    CTCTATGGGTACCCAGGTGCTGAAGAATTGACCCGGTTCCTCCTGGGCCA

    GAAAGAAGCAGGCACATCCCCTTCTCTGTGACACACCCTGTCCACGCCCC

    TGGTTCTTAGTTCCAGCCCCACTCATAGGACACTCATAGCTCAGGAGGGC

    TCCGCCTTCAATCCCACCCGCTAAAGTACTTGGAGCGGTCTCTCCCTCCC

    TCATCAGCCCACCAAACCAAACCTAGCCTCCAAGAGTGGGAAGAAATTAA

    AGCAAGATAGGCTATTAAGTGCAGAGGGAGAGAAAATGCCTCCAACATGT

    GAGGAAGTAATGAGAGAAATCATAGAATTTCTTCCGCTTCCTCGCTCACT

    GACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTC

    AAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGA

    ACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCG

    TTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAA

    TCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACC

    AGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTG

    CCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCT

    TTCTCAATGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCT

    CCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCC

    TTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATC

    GCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAG

    GCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGA

    AGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAA

    AAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTG

    GTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAA

    GAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAA

    CTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCT

    AGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATAT

    GAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTAT

    CTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCGGGGGG

    GGGGGGCGCTGAGGTCTGCCTCGTGAAGAAGGTGTTGCTGACTCATACCA

    GGCCTGAATCGCCCCATCATCCAGCCAGAAAGTGAGGGAGCCACGGTTGA

    TGAGAGCTTTGTTGTAGGTGGACCAGTTGGTGATTTTGAACTTTTGCTTT

    GCCACGGAACGGTCTGCGTTGTCGGGAAGATGCGTGATCTGATCCTTCAA

    CTCAGCAAAAGTTCGATTTATTCAACAAAGCCGCCGTCCCGTCAAGTCAG

    CGTAATGCTCTGCCAGTGTTACAACCAATTAACCAATTCTGATTAGAAAA

    ACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCA

    ATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACC

    GAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGGTCTGCGATTCCGA

    CTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGG

    TTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGG

    CAAAAGCTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTAC

    GCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGAT

    TGCGCCTGAGCGAGACGAAATACGCGATCGCTGTTAAAAGGACAATTACA

    AACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAA

    TATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTC

    CCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAA

    ATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGA

    CCATCTCATCTGTAACATCATTGGCAACGCTACCTTTGCCATGTTTCAGA

    AACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACC

    TGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCAT

    CCATGTTGGAATTTAATCGCGGCCTCGAGCAAGACGTTTCCCGTTGAATA

    TGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAGTTTTAT

    TGTTCATGATGATATATTTTTATCTTGTGCAATGTAACATCAGAGATTTT

    GAGACACAACGTGGCTTTCCCCCCCCCCCCATTATTGAAGCATTTATCAG

    GGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAA

    ACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCT

    AAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACG

    AGGCCCTTTCGTC

    GPCINS基因序列如SEQ ID NO：2

    ATGGGCGCCCGGGCCAGCATCCTGCGGGGAGGCAAGCTGGACAAATGGGA

    GAAGATCCGGCTGAGACCCGGAGGCAAGAAACACTACATGCTGAAGCACC

    TGGTGTGGGCCAGCCGGGAGCTGGAAAGATTCGCCCTGAACCCCGGCCTC

    CTGGAGACCAGCGAAGGCTGCAAGCAGATCATTAAGCAGCTGCAACCCGC

    CCTGCAGACCGGCACCGAGGAACTGCGGAGCCTGTTCAACACCGTGGCCA

    CCCTGTACTGCGTGCACGAGGAAATCGAGGTGCGGGACACCAAGGAGGCC

    CTGGACAAGATCGAGGAAGAGCAGAACAAGATCCAGCAAAAGACCCAGCA

    GGCCAAGAAAGCCGACGAGAAGGTGAGCCAGAACTACCCCATCGTGCAGA

    ACCCCCAGGGCCAGATGGTGCACCAGCCTCTGAGCCCCCGGACCCTGAAC

    GCCTGGGTGAAGGTCGTGGAGGAAAAGGCCTTCAGCCCCGAGGTGATCCC

    TATGTTCACCGCCCTGAGCGAGGGCGCCACCCCCCAGGACCTGAACACCA

    TGCTGAACACCGTGGGCGGGCACCAGGCTGCCATGCAGATGCTGAAGGAC

    ACCATCAACGAGGAAGCCGCTGAGTGGGACCGGCTGCACCCCGTGCACGC

    CGGCCCCGTGGCCCCTGGCCAGATGCGGGAGCCCAGAGGCAGCGACATCG

    CCGGCACCACATCCAGCCTGCAGGAGCAGATCGGCTGGATGACCAACAAT

    CCTCCCATCCCAGTGGGCGAGATCTACAAGCGGTGGATTATCCTGGGCCT

    GAACAAGATCGTGCGGATGTACAGCCCCACCTCCATCCTGGACATCAAGC

    AGGGCCCTAAGGAGCCCTTCCGGGACTACGTGGATAGATTCTTTAAGACC

    CTGCGGGCCGAGCAGGCCACCCAGGACGTGAAGAACTGGATGACCGACAC

    CCTGCTCGTGCAGAATGCCAACCCCGACTGCAAGACCATCCTGCGGGCCC

    TGGGCAGCGGCGCCTCCCTGGAAGAGATGATGACCGCCTGCCAGGGCGTG

    GGAGGCCCCAGCCACAAGGCCCGGGTGCTGGCTGAGGCCATGAGCCAGAC

    CTCCAACACCATCCTGATGCAGCGGAGCAACTTCAAGGGCAGCAAACGGA

    TCGTGAAGTGCTTCAACTGTGGCAAGGAGGGCCACATCGCCAAGAACTGC

    AGGGCCCCTAGGAAAAAAGGCTGTTGGAAATGTGGAAAGGAAGGACACCA

    AATGAAAGACTGTACTGAAAGGCAGGCGAATTTTTTAGGGAAATTTTGGC

    CTTCCCACAAGGGGAGGCCAGGGAATTTTCTCCAGAGCAGACCAGAGCCA

    ACAGCCCCACCAGCAGAGAGCTTCAGGTTCGAGGAGACAACCCCAGCTCC

    GAAGCAGGAACCGAAAGACAGGGAACCCTTAACTTCCCTCAGATCACTCT

    TTGGCAGCGACCCCTTGTCTCAATAAAAGTAGGGGGCCAGATAAAAGAGG

    CTCTCCTGGACACCGGCGCCGATGACACCGTGCTGGAGGAAGTGAACCTG

    CCCGGCAAGTGGAAGCCCAAGATGATCGGCGGGATCGGAGGCTTCATCAA

    GGTGCGGCAGTACGAGCAGATCCCCATTGAGATCTGCGGCAAGAAAGCCA

    TCGGCACCGTGCTGGTGGGCCCCACCCCCGTGAACATCATTGGCCGGAAC

    ATGCTGACCCAGCTGGGCTGCACCCTGAACTTCCCCATCAGCCCCATCGA

    GACCGTGCCCGTGAAGCTGAAGCCCGGCATGGACGGCCCCAAGGTGAAGC

    AGTGGCCCCTGACCGAGGAAAAGATCAAGGCCCTGACCGCCATCTGCGAC

    GAGATGGAAAAGGAGGGCAAGATCACCAAGATCGGCCCCGACAACCCCTA

    CAACACCCCCATCTTCGCCATCCGGAAGAAAGACAGCTCCAAGTGGCGGA

    AGCTGGTGGACTTCCGGGAGCTGAACAAGCGGACCCAGGACTTCTGGGAG

    GTGCAGCTGGGCATCCCCCACCCCGCCGGCCTGAAGAAAAAGAAAAGCGT

    GACCGTGCTGGACGTGGGCGACGCCTACTTCAGCGTGCCCCTGGATAAGG

    ACTTCCGGAAGTACACCGCCTTCACCATCCCCAGCGTGAACAATGAGACC

    CCCGGCATCCGGTACCAGTACAACGTGCTGCCCCAGGGCTGGAAGGGCAG

    CCCCGCCATCTTCCAGTGCAGCATGACCAAGATCCTGGAGCCCTTCCGGA

    AGCAGAACCCCGACATCGTGATCTACCAGTACATGGACGATCTGTACGTG

    GGCAGCGACCTGGAGATCGGCCAGCACCGGACCAAGATCGAGGAACTGCG

    GGAGCACCTCCTGAAGTGGGGCTTCACCACACCCGACAAGAAACACCAGA

    AGGAGCCTCCCTTCCTGTGGATGGGCTACGAGCTGCACCCCGACAAGTGG

    ACCGTGCAGCCCATCCAGCTGCCCGAGAAGGACAGCTGGACCGTGAACGA

    CATCCAGAAGCTGGTGGGCAAGCTGAACTGGGCCAGCCAGATCTACCCCG

    GCATCAAGGTGCGGCAGCTGTGCAAGCTCCTGCGGGGCGCCAAGGCCCTG

    ACCGACATCGTGCCCCTGACCGAGGAAGCCGAGCTGGAACTGGCCGAGAA

    CCGGGAGATCCTGAAGGAGCCCGTGCACGGCGCCTACTATGACCCCAGCA

    AGGAGCTGATCGCCGAGATCCAGAAGCAGGGCCAAGACCAGTGGACCTAC

    CAGATCTACCAGGAGCCCTTCAAGAACCTGAAGACCGGCAAGTACGCCAA

    GATGCGGACCGCCCACACCAACGACGTGAAGCAGCTGACCGAGGCCGTGC

    AGAAGATCGCCATGGAGAGCATCGTGATTTGGGGCAAGATCCCCAAGTTC

    CGGCTGCCCATCCAGAAGGAGACCTGGGAGACCTGGTGGACCGACTACTG

    GCAGGCCACCTGGATCCCCGAGTGGGAGTTCGTGAACACCCCTCCCCTGG

    TGAAGCTGTGGTACCAGCTGGAGAAGGACCCCATCGCCGGCGTGGAGACC

    TTCTACGTGGACGGCGCCGCTAACCGGGAGACCAAGATCGGCAAGGCCGG

    CTACGTGACCGACAGAGGCCGGAAGAAAATCGTGAGCCTGACCGACACAA

    CCAACCAGAAGACCGAGCTGCAGGCCATCTACATCGCCCTGCAGGACAGC

    GGCAGCGAGGTGAACATCGTGACCGACAGCCAGTACGCCCTGGGCATCAT

    TCAGGCCCAGCCCGACAAGAGCGAGAGCGAGCTGGTGAACCAGATCATTG

    AGCAGCTGATCAAGAAAGAGCGGGTGTACCTGAGCTGGGTGCCCGCCCAC

    AAGGGCATCGGGGGCAACGAGCAGGTGGACAAGCTGGTGAGCAACGGCAT

    CCGGAAGGTGCTGTTCCTGGACGGCATCGACAAGGCCCAGGAGGAACACG

    AGAAGTACCACAGCAACTGGCGGGCCATGGCCAGCGACTTCAACCTGCCT

    CCCATCGTGGCCAAGGAGATCGTGGCCAGCTGCGACCAGTGTCAGCTGAA

    GGGCGAGGCCATGCACGGCCAGGTGGACTGCAGCCCCGGCATCTGGCAGC

    TGGACTGCACCCACCTGGAGGGCAAGATCATTCTGGTGGCCGTCCACGTG

    GCCAGCGGCTACATCGAGGCCGAGGTGATCCCCGCCGAGACCGGCCAGGA

    GACCGCCTACTTCATCCTGAAGCTGGCCGGCCGGTGGCCCGTGAAGGTGA

    TCCACACCGACAACGGCAGCAACTTCACCAGCGCCGCTGTGAAGGCAGCC

    TGCTGGTGGGCCGGCATCCAGCAAGAGTTCGGCATCCCCTACAACCCCCA

    GAGCCAGGGCGTGGTGGAGAGCATGAACAAGGAGCTGAAAAAGCTGATCG

    GCCAGGTGCGGGACCAGGCCGAGCACCTGAAGACCGCCGTGCAGATGGCC

    GTGTTCATCCACAACTTCAAGCGGAAGGGCGGGATCGGAGGCTACAGCGC

    CGGCGAGCGGATCGTGGACATTATCGCCACCGACATCCAGACCCGGGAGC

    TGCAGAAGCAGATCATTAAGATCCAGAACTTCCGGGTGTACTATAGAGAC

    AGCCGGGACCCCATCTGGAAGGGCCCCGCCAAGCTGCTCTGGAAGGGCGA

    GGGCGCCGTCGTGATCCAGGACAACAGCGACATCAAGGTCGTGCCCAGAC

    GGAAGGCCAAGATTATCAAGGACTACGGCAAGCAGATGGCCGGCGCCGAC

    TGCGTGGCCGGCCGGCAGGATGAGGACTGA

    ENVCINS基因序列如SEQ ID NO：3

             ATGAGAGTGAGGGGCACCAGACGGAACTACCAACAGTGGTG

    GATCTGGGGCGTGCTGGGCTTCTGGATGCTGATGATCTGCAACGTGGAGG

    GCAACCTGTGGGTGACCGTCTACTATGGCGTGCCCGTCTGGAAGGAGGCC

    AAGACCACACTGTTCTGTGCCAGCGACGCTAAGGCCTACGAGACCGAGGT

    GCACAACGTCTGGGCCACCCATGCCTGCGTGCCAACCGACCCTAACCCAC

    AGGAGATCGTGATGGAGAACGTGACCGAGAATTTCAACATGTGGAATAAC

    GACATGGTGAACCAGATGCACGAGGACGTGATCAGCCTGTGGGACCAGAG

    CCTGAAGCCCTGCGTGAAGCTGACCCCCCTGTGCGTGACCCTGGAATGTC

    GGAACGTGAGCTCCAACGGCAACGGCACACGGAACGAGACCTACAACGAG

    AGCGTGAAGGAGGTGAAGAACTGCAGCTTCAACGCCACCACACTGCTCAG

    AGACCGGAAGAAAACCGTGTACGCCCTGTTCTACAGACTGGACATTGCTC

    CCCTGAACGACGAGAACAGCGGCAAGAACTCCAGCGAGTACTATCGGCTG

    ATCAACTGCAACACCAGCGCCATCACCCAGGCCTGCCCCAAGGTGACCTT

    CGACCCTATTCCCATCCACTACTGCACCCCCGCCGGCTACGCCATCCTGA

    AGTGCAACGACAAAATCTTCAACGGCACCGGACAGTGTCACAACGTGTCC

    ACCGTGCAGTGCACCCATGGCATCAAGCCCGTCGTGTCCACCCAGCTGCT

    CCTGAATGGAAGCCTGGCCGAGAGAGAGATCATTATCCGGAGCGAGAACC

    TGACCAATAACGTGAAGACCATCATTGTGCACCTGAACAAGAGCGTGGAG

    ATCGTGTGCACCCGGCCCAACAATAACACCAGGAAGAGCATCAGAATTGG

    GCCCGGCCAGACCTTCTATGCTACCGGCGACATCATTGGCGACATCAGAC

    AGGCTCATTGCAACATCAGCAAGGACAAGTGGGACGAGACACTGCAGCGG

    GTGAGCAAGAAACTGGCCGAGCACTTCCCCAACAAGACCATCAAGTTTGC

    CAGCTCTTCCGGCGGAGACCTGGAGATCACCACACACAGCTTCAACTGCC

    GGGGCGAGTTCTTTTACTGCAACACCAGCGGACTGTTCAACGGCACCTAC

    AACGGCACCAAGGACAACAGCTCCAGCATCATTACCATCCCCTGTCGGAT

    CAAGCAGATTATCAACATGTGGCAGGAAGTGGGACGGGCCATGTACGCTC

    CACCCATCGAGGGCAACATCACCTGCAAGTCCAACATCACCGGCCTGCTC

    CTGGTGCGGGACGGCGGAAGAACAGAGAGCAACGACACCGAAATCTTCAG

    ACCCGGCGGAGGCGACATGCGGAACAATTGGCGGAACGAGCTGTACAAGT

    ACAAGGTGGTCGAGATCAAACCCCTGGGAGTGGCCCCTACAGCTGCCAAG

    AGACGGGTGGTCGAGAGGGAGAAGCGGGCCGTGGGCCTGGGAGCTGTGTT

    CCTGGGCTTCCTGGGAGCTGCCGGGAGCACCATGGGCGCTGCCAGCATCA

    CCCTGACCGTGCAAGCCAGACAGCTCCTGAGCGGCATCGTGCAGCAACAG

    AGCAACCTGCTCAGAGCCATCGAAGCCCAACAGCACATGCTCCAGCTGAC

    CGTGTGGGGCATCAAGCAACTCCAGACCCGGGTGCTCGCCATCGAACGGT

    ACCTGAAGGACCAGCAGCTGCTCGGCATCTGGGGCTGTTCCGGAAAGCTG

    ATCTGCACAACCGCCGTGCCCTGGAACTCCAGCTGGTCTAACAAGAGCCA

    ACAGGAAATCTGGGACAACATGACCTGGATGCAGTGGGACAAGGAGATCA

    GCAACTACACCAACACCATCTACAGACTGCTCGAGGACAGCCAGAACCAA

    CAGGAGCGGAATGAGAAGGACCTGCTCGCCCTGGACAGCTGGAAGAACCT

    GTGGAGCTGGTTTGACATCACTAACTGGCTGTGGTACATTAAAATCTTCA

    TTATGATCGTGGGCGGGCTGATCGGAAGCAGGATTATCTTCGCCGTGCTG

    AGCATCGTGAACAGAGTGCGGCAGGGCTACTCCCCACTGAGCTTCCAGAT

    CCCCACCCCTAACCCCGGCGGACCTGGCAGACTGGGCAGAATCGAGGAAG

    AGGGAGGCGAACAGGACAAGACCCGGAGCATCAGGCTGGTGAACGGCTTC

    CTGGCCCTGGCCTGGGACGATCTGCGGAACCTGTGCCTGTTCAGCTACCA

    CAGACTGAGCGACTTCATCCTCCTGACTGCTAGGGGAGTGGAGCTGCTCG

    GGAGAAACTCTCTGAGGGGCCTGCAGCGGGGATGGGAAGCTCTGAAGTAC

    CTGGGCAACCTGGTGCAGTACTGGGGCCTGGAGCTGAAGAAAAGCACAAT

    CTCCCTGGTGGACACCATCGCCATCGTGGTCGCCGAGGGCACCGATAGAA

    TCATTAACATCGTGCAGGGAATTTGCCGGGCCATCCACAACGTGCCTAGA

    AGGATCAGACAGGGACTGGAGGCCGCTCTGCAGTGA

        Gag氨基酸序列如下：SEQ ID NO：4

    Met Gly Ala Arg Ala Ser Ile Leu Arg Gly Gly Lys Leu Asp Lys Trp

    Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys His Tyr Met Leu Lys

    His Leu Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Leu Asn Pro

    Gly Leu Leu Glu Thr Ser Glu Gly Cys Lys Gln Ile Ile Lys Gln Leu

    Gln Pro Ala Leu Gln Thr Gly Thr Glu Glu Leu Arg Ser Leu Phe Asn

    Thr Val Ala Thr Leu Tyr Cys Val His Glu Glu Ile Glu Val Arg Asp

    Thr Lys Glu Ala Leu Asp Lys Ile Glu Glu Glu Gln Asn Lys Ile Gln

    Gln Lys Thr Gln Gln Ala Lys Lys Ala Asp Glu Lys Val Ser Gln Asn

    Tyr Pro Ile Val Gln Asn Pro Gln Gly Gln Met Val His Gln Pro Leu

    Ser Pro Arg Thr Leu Asn Ala Trp Val Lys Val Val Glu Glu Lys Ala

    Phe Ser Pro Glu Val Ile Pro Met Phe Thr Ala Leu Ser Glu Gly Ala

    Thr Pro Gln Asp Leu Asn Thr Met Leu Asn Thr Val Gly Gly His Gln

    Ala Ala Met Gln Met Leu Lys Asp Thr Ile Asn Glu Glu Ala Ala Glu

    Trp Asp Arg Leu His Pro Val His Ala Gly Pro Val Ala Pro Gly Gln

    Met Arg Glu Pro Arg Gly Ser Asp Ile Ala Gly Thr Thr Ser Ser Leu

    Gln Glu Gln Ile Gly Trp Met Thr Asn Asn Pro Pro Ile Pro Val Gly

    Glu Ile Tyr Lys Arg Trp Ile Ile Leu Gly Leu Asn Lys Ile Val Arg

    Met Tyr Ser Pro Thr Ser Ile Leu Asp Ile Lys Gln Gly Pro Lys Glu

    Pro Phe Arg Asp Tyr Val Asp Arg Phe Phe Lys Thr Leu Arg Ala Glu

    Gln Ala Thr Gln Asp Val Lys Asn Trp Met Thr Asp Thr Leu Leu Val

    Gln Asn Ala Asn Pro Asp Cys Lys Thr Ile Leu Arg Ala Leu Gly Ser

    Gly Ala Ser Leu Glu Glu Met Met Thr Ala Cys Gln Gly Val Gly Gly

    Pro Ser His Lys Ala Arg Val Leu Ala Glu Ala Met Ser Gln Thr Ser

    Asn Thr Ile Leu Met Gln Arg Ser Asn Phe Lys Gly Ser Lys Arg Ile

    Val Lys Cys Phe Asn Cys Gly Lys Glu Gly His Ile Ala Lys Asn Cys

    Arg Ala Pro Arg Lys Lys Gly Cys Trp Lys Cys Gly Lys Glu Gly His

    Gln Met Lys Asp Cys Thr Glu Arg Gln Ala Asn Phe Leu Gly Lys Phe

    Trp Pro Ser His Lys Gly Arg Pro Gly Asn Phe Leu Gln Ser Arg Pro

    Glu Pro Thr Ala Pro Pro Ala Glu Ser Phe Arg Phe Glu Glu Thr Thr

    Pro Ala Pro Lys Gln Glu Pro Lys Asp Arg Glu Pro Leu Thr Ser Leu

    Arg Ser Leu Phe Gly Ser Asp Pro Leu Ser Gln

         Pol氨基酸序列如下：SEQ ID NO：5

    Phe Phe Arg Glu Ile Leu Ala Phe Pro Gln Gly Glu Ala Arg Glu Phe

    Ser Pro Glu Gln Thr Arg Ala Asn Ser Pro Thr Ser Arg Glu Leu Gln

    Val Arg Gly Asp Asn Pro Ser Ser Glu Ala Gly Thr Glu Arg Gln Gly

    Thr Leu Asn Phe Pro Gln Ile Thr Leu Trp Gln Arg Pro Leu Val Ser

    Ile Lys Val Gly Gly Gln Ile Lys Glu Ala Leu Leu Asp Thr Gly Ala

    Asp Asp Thr Val Leu Glu Glu Val Asn Leu Pro Gly Lys Trp Lys Pro

    Lys Met Ile Gly Gly Ile Gly Gly Phe Ile Lys Val Arg Gln Tyr Glu

    Gln Ile Pro Ile Glu Ile Cys Gly Lys Lys Ala Ile Gly Thr Val Leu

    Val Gly Pro Thr Pro Val Asn Ile Ile Gly Arg Asn Met Leu Thr Gln

    Leu Gly Cys Thr Leu Asn Phe Pro Ile Ser Pro Ile Glu Thr Val Pro

    Val Lys Leu Lys Pro Gly Met Asp Gly Pro Lys Val Lys Gln Trp Pro

    Leu Thr Glu Glu Lys Ile Lys Ala Leu Thr Ala Ile Cys Asp Glu Met

    Glu Lys Glu Gly Lys Ile Thr Lys Ile Gly Pro Asp Asn Pro Tyr Asn

    Thr Pro Ile Phe Ala Ile Arg Lys Lys Asp Ser Ser Lys Trp Arg Lys

    Leu Val Asp Phe Arg Glu Leu Asn Lys Arg Thr Gln Asp Phe Trp Glu

    Val Gln Leu Gly Ile Pro His Pro Ala Gly Leu Lys Lys Lys Lys Ser

    Val Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser Val Pro Leu Asp

    Lys Asp Phe Arg Lys Tyr Thr Ala Phe Thr Ile Pro Ser Val Asn Asn

    Glu Thr Pro Gly Ile Arg Tyr Gln Tyr Asn Val Leu Pro Gln Gly Trp

    Lys Gly Ser Pro Ala Ile Phe Gln Cys Ser Met Thr Lys Ile Leu Glu

    Pro Phe Arg Lys Gln Asn Pro Asp Ile Val Ile Tyr Gln Tyr Met Asp

    Asp Leu Tyr Val Gly Ser Asp Leu Glu Ile Gly Gln His Arg Thr Lys

    Ile Glu Glu Leu Arg Glu His Leu Leu Lys Trp Gly Phe Thr Thr Pro

    Asp Lys Lys His Gln Lys Glu Pro Pro Phe Leu Trp Met Gly Tyr Glu

    Leu His Pro Asp Lys Trp Thr Val Gln Pro Ile Gln Leu Pro Glu Lys

    Asp Ser Trp Thr Val Asn Asp Ile Gln Lys Leu Val Gly Lys Leu Asn

    Trp Ala Ser Gln Ile Tyr Pro Gly Ile Lys Val Arg Gln Leu Cys Lys

    Leu Leu Arg Gly Ala Lys Ala Leu Thr Asp Ile Val Pro Leu Thr Glu

    Glu Ala Glu Leu Glu Leu Ala Glu Asn Arg Glu Ile Leu Lys Glu Pro

    Val His Gly Ala Tyr Tyr Asp Pro Ser Lys Glu Leu Ile Ala Glu Ile

    Gln Lys Gln Gly Gln Asp Gln Trp Thr Tyr Gln Ile Tyr Gln Glu Pro

    Phe Lys Asn Leu Lys Thr Gly Lys Tyr Ala Lys Met Arg Thr Ala His

    Thr Asn Asp Val Lys Gln Leu Thr Glu Ala Val Gln Lys Ile Ala Met

    Glu Ser Ile Val Ile Trp Gly Lys Ile Pro Lys Phe Arg Leu Pro Ile

    Gln Lys Glu Thr Trp Glu Thr Trp Trp Thr Asp Tyr Trp Gln Ala Thr

    Trp Ile Pro Glu Trp Glu Phe Val Asn Thr Pro Pro Leu Val Lys Leu

    Trp Tyr Gln Leu Glu Lys Asp Pro Ile Ala Gly Val Glu Thr Phe Tyr

    Val Asp Gly Ala Ala Asn Arg Glu Thr Lys Ile Gly Lys Ala Gly Tyr

    Val Thr Asp Arg Gly Arg Lys Lys Ile Val Ser Leu Thr Asp Thr Thr

    Asn Gln Lys Thr Glu Leu Gln Ala Ile Tyr Ile Ala Leu Gln Asp Ser

    Gly Ser Glu Val Asn Ile Val Thr Asp Ser Gln Tyr Ala Leu Gly Ile

    Ile Gln Ala Gln Pro Asp Lys Ser Glu Ser Glu Leu Val Asn Gln Ile

    Ile Glu Gln Leu Ile Lys Lys Glu Arg Val Tyr Leu Ser Trp Val Pro

    Ala His Lys Gly Ile Gly Gly Asn Glu Gln Val Asp Lys Leu Val Ser

    Asn Gly Ile Arg Lys Val Leu Phe Leu Asp Gly Ile Asp Lys Ala Gln

    Glu Glu His Glu Lys Tyr His Ser Asn Trp Arg Ala Met Ala Ser Asp

    Phe Asn Leu Pro Pro Ile Val Ala Lys Glu Ile Val Ala Ser Cys Asp

    Gln Cys Gln Leu Lys Gly Glu Ala Met His Gly Gln Val Asp Cys Ser

    Pro Gly Ile Trp Gln Leu Asp Cys Thr His Leu Glu Gly Lys Ile Ile

    Leu Val Ala Val His Val Ala Ser Gly Tyr Ile Glu Ala Glu Val Ile

    Pro Ala Glu Thr Gly Gln Glu Thr Ala Tyr Phe Ile Leu Lys Leu Ala

    Gly Arg Trp Pro Val Lys Val Ile His Thr Asp Asn Gly Ser Asn Phe

    Thr Ser Ala Ala Val Lys Ala Ala Cys Trp Trp Ala Gly Ile Gln Gln

    Glu Phe Gly Ile Pro Tyr Asn Pro Gln Ser Gln Gly Val Val Glu Ser

    Met Asn Lys Glu Leu Lys Lys Leu Ile Gly Gln Val Arg Asp Gln Ala

    Glu His Leu Lys Thr Ala Val Gln Met Ala Val Phe Ile His Asn Phe

    Lys Arg Lys Gly Gly Ile Gly Gly Tyr Ser Ala Gly Glu Arg Ile Val

    Asp Ile Ile Ala Thr Asp Ile Gln Thr Arg Glu Leu Gln Lys Gln Ile

    Ile Lys Ile Gln Asn Phe Arg Val Tyr Tyr Arg Asp Ser Arg Asp Pro

    Ile Trp Lys Gly Pro Ala Lys Leu Leu Trp Lys Gly Glu Gly Ala Val

    Val Ile Gln Asp Asn Ser Asp Ile Lys Val Val Pro Arg Arg Lys Ala

    Lys Ile Ile Lys Asp Tyr Gly Lys Gln Met Ala Gly Ala Asp Cys Val

    Ala Gly Arg Gln Asp Glu Asp

            Env氨基酸序列如下：SEQ ID NO：6

    Met Arg Val Arg Gly Thr Arg Arg Asn Tyr Gln Gln Trp Trp Ile Trp

    Gly Val Leu Gly Phe Trp Met Leu Met Ile Cys Asn Val Glu Gly Asn

    Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala Lys

    Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu Thr Glu Val

    His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn Pro

    Gln Glu Ile Val Met Glu Asn Val Thr Glu ASn Phe Asn Met Trp Asn

    Asn Asp Met Val Asn Gln Met His Glu Asp Val Ile Ser Leu Trp Asp

    Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr Leu

    Glu Cys Arg Asn Val Ser Ser Asn Gly Asn Gly Thr Arg Asn Glu Thr

    Tyr Asn Glu Ser Val Lys Glu Val Lys Asn Cys Ser Phe Asn Ala Thr

    Thr Leu Leu Arg Asp Arg Lys Lys Thr Val Tyr Ala Leu Phe Tyr Arg

    Leu Asp Ile Ala Pro Leu Asn Asp Glu Asn Ser Gly Lys Asn Ser Ser

    Glu Tyr Tyr Arg Leu Ile Asn Cys Asn Thr Ser Ala Ile Thr Gln Ala

    Cys Pro Lys Val Thr Phe Asp Pro Ile Pro Ile His Tyr Cys Thr Pro

    Ala Gly Tyr Ala Ile Leu Lys Cys Ash Asp Lys Ile Phe Asn Gly Thr

    Gly Gln Cys His Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Lys

    Pro Val Val Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Arg

    Glu Ile Ile Ile Arg Ser Glu Asn Leu Thr Asn Asn Val Lys Thr Ile

    Ile Val His Leu Asn Lys Ser Val Glu Ile Val Cys Thr Arg Pro Asn

    Asn Asn Thr Arg Lys Ser Ile Arg Ile Gly Pro Gly Gln Thr Phe Tyr

    Ala Thr Gly Asp Ile Ile Gly Asp Ile Arg Gln Ala His Cys Asn Ile

    Ser Lys Asp Lys Trp Asp Glu Thr Leu Gln Arg Val Ser Lys Lys Leu

    Ala Glu His Phe Pro Asn Lys Thr Ile Lys Phe Ala Ser Ser Ser Gly

    Gly Asp Leu Glu Ile Thr Thr His Ser Phe Asn Cys Arg Gly Glu Phe

    Phe Tyr Cys Asn Thr Ser Gly Leu Phe Asn Gly Thr Tyr Asn Gly Thr

    Lys Asp Asn Ser Ser Ser Ile Ile Thr Ile Pro Cys Arg Ile Lys Gln

    Ile Ile Asn Met Trp Gln Glu Val Gly Arg Ala Met Tyr Ala Pro Pro

    Ile Glu Gly Asn Ile Thr Cys Lys Ser Asn Ile Thr Gly Leu Leu Leu

    Val Arg Asp Gly Gly Arg Thr Glu Ser Asn Asp Thr Glu Ile Phe Arg

    Pro Gly Gly Gly Asp Met Arg Asn Asn Trp Arg Asn Glu Leu Tyr Lys

    Tyr Lys Val Val Glu Ile Lys Pro Leu Gly Val Ala Pro Thr Ala Ala

    Lys Arg Arg Val Val Glu Arg Glu Lys Arg Ala Val Gly Leu Gly Ala

    Val Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr Met Gly Ala Ala

    Ser Ile Thr Leu Thr Val Gln Ala Arg Gln Leu Leu Ser Gly Ile Val

    Gln Gln Gln Ser Asn Leu Leu Arg Ala Ile Glu Ala Gln Gln His Met

    Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu Gln Thr Arg Val Leu

    Ala Ile Glu Arg Tyr Leu Lys Asp Gln Gln Leu Leu Gly Ile Trp Gly

    Cys Ser Gly Lys Leu Ile Cys Thr Thr Ala Val Pro Trp Asn Ser Ser

    Trp Ser Asn Lys Ser Gln Gln Glu Ile Trp Asp Asn Met Thr Trp Met

    Gln Trp Asp Lys Glu Ile Ser Asn Tyr Thr Asn Thr Ile Tyr Arg Leu

    Leu Glu Asp Ser Gln Asn Gln Gln Glu Arg Asn Glu Lys Asp Leu Leu

    Ala Leu Asp Ser Trp Lys Asn Leu Trp Ser Trp Phe Asp Ile Thr Asn

    Trp Leu Trp Tyr Ile Lys Ile Phe Ile Met Ile Val Gly Gly Leu Ile

    Gly Ser Arg Ile Ile Phe Ala Val Leu Ser Ile Val Asn Arg Val Arg

    Gln Gly Tyr Ser Pro Leu Ser Phe Gln Ile Pro Thr Pro Asn Pro Gly

    Gly Pro Gly Arg Leu Gly Arg Ile Glu Glu Glu Gly Gly Glu Gln Asp

    Lys Thr Arg Ser Ile Arg Leu Val Asn Gly Phe Leu Ala Leu Ala Trp

    Asp Asp Leu Arg Asn Leu Cys Leu Phe Ser Tyr His Arg Leu Ser Asp

    Phe Ile Leu Leu Thr Ala Arg Gly Val Glu Leu Leu Gly Arg Asn Ser

    Leu Arg Gly Leu Gln Arg Gly Trp Glu Ala Leu Lys Tyr Leu Gly Asn

    Leu Val Gln Tyr Trp Gly Leu Glu Leu Lys Lys Ser Thr Ile Ser Leu

    Val Asp Thr Ile Ala Ile Val Val Ala Glu Gly Thr Asp Arg Ile Ile

    Asn Ile Val Gln Gly Ile Cys Arg Ala Ile His Asn Val Pro Arg Arg

    Ile Arg Gln Gly Leu Glu Ala Ala Leu Gln

    选择的HIV-1中国流行株gagpol基因序列如SEQ ID NO：7

    ATGGGTGCGAGAGCGTCAATATTAAGAGGGGGAAAATTAGATAAATGGGA

    AAAAATTAGGTTAAGGCCAGGGGGAAAAAAACACTATATGCTAAAACACC

    TAGTATGGGCAAGCAGGGAGCTGGAAAGATTTGCACTTAACCCTGGCCTT

    TTAGAGACATCAGAAGGCTGTAAGCAAATAATAAAACAGCTACAACCAGC

    TCTTCAGACAGGAACAGAGGAACTTAGATCATTATTCAACACAGTAGCAA

    CTCTCTATTGTGTACATGAAGAGATAGAAGTACGAGACACCAAAGAAGCC

    TTAGACAAGATAGAGGAAGAACAAAATAAAATTCAGCAAAAAACACAGCA

    GGCAAAAAAAGCTGACGAGAAGGTCAGTCAAAATTATCCTATAGTGCAGA

    ATCCCCAAGGGCAAATGGTACATCAGCCCCTATCACCTAGAACTTTAAAT

    GCATGGGTAAAAGTAGTGGAAGAGAAGGCTTTTAGCCCAGAAGTAATACC

    CATGTTCACAGCATTATCAGAAGGAGCCACCCCACAAGATTTAAACACCA

    TGTTAAATACAGTAGGGGGACATCAAGCAGCCATGCAAATGTTAAAAGAT

    ACCATCAATGAAGAGGCTGCAGAATGGGATAGATTGCATCCAGTGCATGC

    AGGGCCAGTGGCACCAGGCCAGATGAGAGAACCAAGGGGAAGTGACATAG

    CAGGAACTACTAGTAGTCTTCAGGAGCAAATAGGATGGATGACAAATAAT

    CCACCTATCCCAGTAGGAGAAATCTATAAAAGATGGATAATCCTGGGATT

    AAATAAAATAGTAAGAATGTATAGCCCTACCAGCATTCTGGACATAAAAC

    AAGGGCCAAAGGAACCCTTTAGAGACTATGTAGACCGGTTCTTTAAAACT

    TTAAGAGCTGAACAAGCTACACAAGATGTAAAAAATTGGATGACAGACAC

    CTTGTTAGTCCAAAATGCGAACCCAGATTGTAAGACCATTTTAAGAGCAT

    TAGGATCAGGGGCTTCATTAGAAGAAATGATGACAGCATGTCAGGGAGTA

    GGAGGACCTAGCCACAAAGCAAGAGTGTTGGCTGAGGCAATGAGCCAAAC

    AAGCAATACCATACTGATGCAGAGAAGCAATTTTAAAGGCTCTAAAAGAA

    TTGTTAAATGTTTCAACTGTGGCAAGGAAGGGCACATAGCCAAAAATTGC

    AGGGCCCCTAGGAAAAAAGGCTGTTGGAAATGTGGAAAGGAAGGACACCA

    AATGAAAGACTGTACTGAAAGGCAGGCGAATTTTTTAGGGAAATTTTGGC

    CTTCCCACAAGGGGAGGCCAGGGAATTTTCTCCAGAGCAGACCAGAGCCA

    ACAGCCCCACCAGCAGAGAGCTTCAGGTTCGAGGAGACAACCCCAGCTCC

    GAAGCAGGAACCGAAAGACAGGGAACCCTTAACTTCCCTCAGATCACTCT

    TTGGCAGCGACCCCTTGTCTCAATAAAAGTAGGGGGCCAGATAAAAGAGG

    CTCTCTTAGACACCGGAGCAGATGATACAGTATTAGAAGAAGTAAATTTG

    CCAGGAAAATGGAAACCAAAAATGATAGGAGGAATTGGAGGTTTTATCAA

    AGTAAGACAATATGAGCAAATACCTATAGAAATTTGTGGAAAAAAGGCTA

    TAGGTACAGTATTAGTGGGACCCACACCTGTCAACATAATAGGAAGAAAT

    ATGTTGACCCAGCTTGGATGCACACTAAATTTTCCAATCAGTCCCATTGA

    AACTGTACCAGTAAAATTAAAGCCAGGAATGGATGGCCCAAAGGTTAAAC

    AATGGCCATTGACAGAAGAAAAAATAAAAGCATTAACAGCAATTTGTGAT

    GAAATGGAGAAGGAAGGAAAAATTACAAAAATTGGGCCTGACAATCCATA

    TAACACTCCAATATTTGCCATAAGAAAGAAGGACAGTAGTAAGTGGAGAA

    AATTAGTAGATTTCAGGGAACTCAATAAAAGAACTCAAGATTTTTGGGAA

    GTTCAATTAGGAATACCACACCCAGCAGGGTTAAAAAAGAAAAAATCAGT

    AACAGTCCTGGATGTGGGTGATGCATATTTCTCAGTTCCTTTAGATAAAG

    ACTTCAGGAAGTATACTGCATTTACCATACCTAGTGTAAACAATGAGACA

    CCAGGGATTAGATATCAGTACAATGTGCTTCCACAGGGATGGAAAGGATC

    ACCAGCAATATTCCAATGTAGCATGACAAAAATCTTAGAGCCTTTTAGAA

    AACAAAATCCAGACATAGTTATCTATCAATACATGGATGACTTGTATGTA

    GGATCTGACTTAGAAATAGGGCAGCATAGAACAAAAATAGAGGAACTGAG

    AGAACATCTGTTAAAGTGGGGATTTACCACACCAGACAAGAAACATCAGA

    AAGAACCTCCATTTCTTTGGATGGGGTATGAACTCCATCCTGACAAATGG

    ACAGTACAGCCTATACAGCTGCCAGAAAAGGATAGCTGGACTGTCAATGA

    TATACAGAAGTTAGTGGGAAAATTAAACTGGGCAAGTCAGATTTACCCAG

    GAATTAAAGTAAGGCAACTTTGTAAACTCCTTAGGGGGGCCAAAGCACTA

    ACAGACATAGTACCACTAACTGAAGAAGCAGAATTAGAATTAGCGGAAAA

    CAGGGAAATTTTAAAAGAACCAGTACATGGAGCATATTATGACCCATCAA

    AAGAATTGATAGCTGAAATACAGAAACAGGGGCAGGACCAATGGACATAT

    CAAATTTACCAAGAACCATTCAAAAATCTGAAAACAGGGAAGTATGCAAA

    AATGAGGACTGCCCACACTAATGATGTAAAACAGTTAACAGAGGCTGTGC

    AGAAAATAGCCATGGAAAGCATAGTAATATGGGGAAAGATTCCTAAATTT

    AGATTACCAATCCAAAAAGAAACATGGGAGACATGGTGGACAGACTATTG

    GCAAGCCACCTGGATTCCTGAGTGGGAATTTGTTAATACCCCTCCCTTAG

    TAAAATTATGGTACCAACTGGAGAAAGATCCCATAGCAGGAGTAGAAACT

    TTCTATGTAGATGGAGCAGCTAATAGGGAGACTAAAATAGGGAAAGCAGG

    GTATGTTACTGACAGAGGAAGGAAGAAAATTGTTTCCCTAACTGACACAA

    CAAATCAGAAGACTGAATTGCAAGCAATTTATATAGCTTTGCAAGATTCA

    GGATCAGAAGTAAACATAGTAACAGATTCACAGTATGCATTAGGGATCAT

    TCAAGCACAACCAGATAAGAGTGAATCAGAGTTAGTTAACCAAATAATAG

    AACAATTAATAAAAAAGGAAAGGGTCTACCTGTCATGGGTACCAGCACAT

    AAAGGAATTGGAGGAAATGAACAAGTAGATAAATTAGTAAGTAATGGAAT

    CAGGAAAGTGCTATTTCTAGATGGAATAGATAAAGCTCAAGAAGAGCATG

    AAAAGTATCACAGCAATTGGAGAGCAATGGCTAGTGACTTTAATCTGCCA

    CCCATAGTAGCAAAAGAAATAGTAGCTAGCTGTGATCAATGTCAGCTAAA

    AGGAGAAGCCATGCATGGACAAGTAGACTGTAGTCCAGGGATATGGCAAT

    TAGATTGTACACATTTAGAAGGAAAAATCATTCTGGTAGCAGTCCATGTA

    GCCAGTGGCTACATAGAAGCAGAGGTTATCCCAGCAGAAACAGGACAAGA

    AACAGCATACTTTATACTAAAATTAGCAGGAAGATGGCCAGTCAAAGTAA

    TACATACAGACAATGGTAGTAATTTCACCAGTGCTGCAGTTAAGGCAGCC

    TGTTGGTGGGCAGGTATCCAACAGGAATTTGGAATTCCCTACAATCCCCA

    AAGTCAGGGAGTAGTAGAATCCATGAATAAGGAATTAAAGAAACTTATAG

    GGCAGGTAAGAGATCAAGCTGAGCACCTTAAGACAGCAGTACAAATGGCA

    GTATTCATTCACAATTTTAAAAGAAAAGGGGGGATTGGGGGGTACAGTGC

    AGGGGAAAGAATAGTAGACATAATAGCAACAGACATACAAACTAGAGAAT

    TACAAAAACAAATTATAAAAATTCAAAATTTTCGGGTTTATTACAGAGAC

    AGCAGAGACCCCATTTGGAAAGGACCAGCCAAACTACTCTGGAAAGGTGA

    AGGGGCAGTAGTAATACAAGATAATAGTGACATAAAGGTAGTACCAAGGA

    GGAAAGCAAAAATCATTAAGGACTATGGAAAACAGATGGCAGGTGCTGAT

    TGTGTGGCAGGTAGACAGGATGAAGATTAG

    选择的HIV-1中国流行株env基因序列如SEQ ID NO：8

    ATGAGAGTGAGGGGGACACGGAGGAATTATCAACAATGGTGGATATGGGG

    CGTCTTGGGCTTTTGGATGTTAATGATTTGTAATGTGGAAGGAAACTTGT

    GGGTCACAGTCTATTATGGGGTACCTGTGTGGAAAGAAGCAAAAACTACT

    CTATTCTGTGCGTCAGATGCTAAAGCATATGAGACAGAAGTGCATAATGT

    CTGGGCTACACATGCCTGTGTACCCACAGACCCCAACCCACAAGAAATAG

    TTATGGAAAATGTAACAGAAAATTTTAACATGTGGAACAATGATATGGTG

    AATCAGATGCATGAGGATGTAATCAGTTTATGGGATCAAAGCCTAAAGCC

    ATGTGTAAAGTTGACCCCACTCTGTGTCACTTTAGAATGTAGAAATGTTA

    GCAGTAATGGTAATGGTACCCGCAATGAGACCTACAATGAGAGCGTGAAG

    GAGGTAAAAAATTGCTCTTTCAATGCAACCACATTATTAAGAGATAGGAA

    GAAGACAGTGTATGCCCTTTTTTATAGACTTGATATAGCACCCCTTAATG

    ATGAGAACTCTGGTAAGAACTCTAGTGAGTATTATAGATTAATAAATTGT

    AATACCTCAGCCATAACACAAGCCTGTCCAAAGGTCACTTTTGATCCAAT

    TCCTATACACTATTGCACTCCAGCTGGTTATGCGATTCTAAAGTGTAATG

    ATAAGATATTCAATGGGACAGGACAATGCCATAATGTTAGCACGGTACAA

    TGTACACATGGAATTAAGCCAGTGGTATCAACTCAACTACTGTTAAATGG

    TAGCCTAGCAGAAAGAGAGATAATAATTAGATCTGAAAATCTGACAAACA

    ATGTCAAAACAATAATAGTACATCTTAATAAATCTGTAGAAATTGTATGT

    ACAAGACCCAACAATAATACAAGAAAAAGTATAAGGATAGGACCAGGACA

    AACATTCTATGCAACAGGAGACATCATAGGAGACATAAGACAAGCACATT

    GTAACATTAGTAAAGATAAATGGGATGAAACTTTACAGAGGGTAAGTAAA

    AAATTAGCAGAACACTTCCCTAATAAAACAATAAAATTTGCATCATCCTC

    AGGAGGGGACCTAGAAATTACAACACATAGCTTTAATTGTAGAGGAGAAT

    TTTTCTATTGTAATACATCAGGCCTGTTTAATGGTACATACAATGGTACA

    AAAGATAATTCAAGCTCAATCATCACAATCCCATGCAGAATAAAGCAAAT

    TATAAACATGTGGCAGGAGGTAGGACGAGCAATGTATGCCCCTCCCATTG

    AAGGAAACATAACATGTAAATCAAATATCACAGGACTACTATTGGTACGT

    GATGGAGGAAGAACAGAGTCAAATGATACAGAGATATTCAGACCTGGTGG

    AGGAGATATGAGAAACAATTGGAGAAATGAATTATATAAATATAAAGTGG

    TAGAAATTAAGCCATTGGGAGTAGCACCCACTGCAGCAAAAAGGAGAGTG

    GTGGAGAGAGAAAAAAGAGCAGTGGGACTAGGAGCTGTGTTCCTTGGGTT

    CTTGGGAGCAGCAGGAAGCACTATGGGCGCGGCGTCAATAACGCTGACGG

    TACAGGCCAGACAATTGTTGTCTGGTATAGTGCAACAGCAAAGCAATTTG

    CTGAGAGCTATAGAGGCGCAACAGCATATGTTGCAACTCACGGTCTGGGG

    CATTAAGCAGCTACAGACAAGAGTCCTGGCTATAGAAAGATACCTAAAGG

    ATCAACAGCTCCTAGGGATTTGGGGCTGCTCTGGAAAACTTATCTGCACT

    ACTGCTGTACCTTGGAACTCCAGTTGGAGTAACAAATCTCAACAAGAGAT

    TTGGGATAACATGACCTGGATGCAGTGGGATAAGGAAATTAGTAATTACA

    CAAACACAATATACAGGTTGCTTGAAGACTCGCAAAACCAGCAGGAAAGA

    AATGAAAAAGATTTATTAGCATTGGACAGTTGGAAAAATCTATGGAGTTG

    GTTTGACATAACAAATTGGCTGTGGTATATAAAAATATTCATAATGATAG

    TAGGAGGCTTGATAGGTTCAAGAATAATTTTTGCTGTGCTTTCTATAGTG

    AATAGAGTTAGGCAGGGATACTCACCTTTGTCGTTTCAGATCCCTACCCC

    GAACCCAGGGGGACCAGGCAGGCTCGGAAGAATCGAAGAAGAAGGTGGAG

    AGCAAGACAAAACCAGATCCATTCGATTAGTGAACGGGTTCTTAGCACTT

    GCCTGGGACGACCTACGGAACCTGTGCCTCTTCAGTTACCACCGCTTGAG

    TGACTTCATATTACTGACAGCGAGAGGGGTGGAACTTCTGGGACGCAACA

    GCCTCAGGGGACTACAGAGGGGGTGGGAAGCCCTTAAATATCTGGGAAAT

    CTTGTGCAGTATTGGGGTCTGGAGCTAAAAAAGAGTACTATTAGTCTGGT

    TGATACCATAGCAATAGTAGTAGCTGAAGGAACAGATAGGATTATAAACA

    TAGTACAAGGAATTTGTAGAGCTATCCACAACGTACCTAGAAGAATAAGA

    CAGGGCCTTGAAGCAGCTTTGCAATAA

    重组穿梭质粒pSC11-GPE全序列SEQ ID NO：9

    TTCTTGAAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTT

    TCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAA

    TACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAG

    GAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCT

    GTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGT

    GGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTT

    TTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCA

    AGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAG

    AAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATA

    ACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCAC

    AACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAA

    CGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCG

    AACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGA

    CCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGT

    GGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTAC

    ACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACT

    GATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATT

    TTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGA

    GTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTT

    TCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGG

    ATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACT

    GTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTC

    GCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGAC

    TCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGC

    CCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCATTGAGAAAGCGC

    CACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGA

    GCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACC

    TCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGC

    AACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTAT

    CCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAA

    CGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAGAGCGCCCAATACGCAAACCGCCTC

    TCCCCGCGCGTTGGCCGATTCATTAATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGC

    AGTGAGCGCAACGCAATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTATG

    CTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGCTATGAC

    CATGATTACGCCAAGCTTTTGCGATCAATAAATGGATCACAACCAGTATCTCTTAACGATGTTCTTC

    GCAGATGATGATTCATTTTTTAAGTATTTGGCTAGTCAAGATGATGAAATCTTCATTATCTGATATAT

    TGCAAATCACTCAATATCTAGACTTTCTGTTATTATTATTGATCCAATCAAAAAATAAATTAGAAGCC

    GTGGGTCATTGTTATGAATCTCTTTCAGAGGAATACAGACAATTGACAAAATTCACAGACTTTCAA

    GATTTTAAAAAACTGTTTAACAAGGTCCCTATTGTTACAGATGGAAGGGTCAAACTTAATAAAGGA

    TATTTGTTCGACTTTGTGATTAGTTTGATGCGATTCAAAAAAGAATCCTCTCTAGCTACCACCGCAA

    TAGATCCTGTTAGATACATAGATCCTCGTCGCAATATCGCATTTTCTAACGTGATGGATATATTAAAG

    TCGAATAAAGTGAACAATAATTAATTCTTTATTGTCATCATGAACGGCGGACATATTCAGTTGATAA

    TCGGCCCCATGTTTTCAGGTAAAAGTACAGAATTAATTAGACGAGTTAGACGTTATCAAATAGCTC

    AATATAAATGCGTGACTATAAAATATTCTAACGATAATAGATACGGAACGGGACTATGGACGCATGA

    TAAGAATAATTTTGAAGCATTGGAAGCAACTAAACTATGTGATCTCTTGGAATCAATTACAGATTTC

    TCCGTGATAGGTATCGATGAAGGACAGTTCTTTCCAGACATTGTTGAATTCCGAGCTTGGCTGCAG

    GTCGGGGATCCCCCCTGCCCGGTTATTATTATTTTTGACACCAGACCAACTGGTAATGGTAGCGAC

    CGGCGCTCAGCTGAATTCCGCCGATACTGACGGGCTCCAGGAGTCGTCGCCACCAATCCCCATAT

    GGAAACCGTCGATATTCAGCCATGTGCCTTCTTCCGCGTGCAGCAGATGGCGATGGCTGGTTTCCA

    TCAGTTGCTGTTGACTGTAGCGGCTGATGTTGAACTGGAAGTCGCCGCGCCACTGGTGTGGGCCA

    TAATTCAATTCGCGCGTCCCGCAGCGCAGACCGTTTTCGCTCGGGAAGACGTACGGGGTATACATG

    TCTGACAATGGCAGATCCCAGCGGTCAAAACAGGCGGCAGTAAGGCGGTCGGGATAGTTTTCTTG

    CGGCCCTAATCCGAGCCAGTTTACCCGCTCTGCTACCTGCGCCAGCTGGCAGTTCAGGCCAATCC

    GCGCCGGATGCGGTGTATCGCTCGCCACTTCAACATCAACGGTAATCGCCATTTGACCACTACCAT

    CAATCCGGTAGGTTTTCCGGCTGATAAATAAGGTTTTCCCCTGATGCTGCCACGCGTGAGCGGTCG

    TAATCAGCACCGCATCAGCAAGTGTATCTGCCGTGCACTGCAACAACGCTGCTTCGGCCTGGTAAT

    GGCCCGCCGCCTTCCAGCGTTCGACCCAGGCGTTAGGGTCAATGCGGGTCGCTTCACTTACGCCA

    ATGTCGTTATCCAGCGGTGCACGGGTGAACTGATCGCGCAGCGGCGTCAGCAGTTGTITTTTATCG

    CCAATCCACATCTGTGAAAGAAAGCCTGACTGGCGGTTAAATTGCCAACGCTTATTACCCAGCTCG

    ATGCAAAAATCCATTTCGCTGGTGGTCAGATGCGGGATGGCGTGGGACGCGGCGGGGAGCGTCA

    CACTGAGGTTTTCCGCCAGACGCCACTGCTGCCAGGCGCTGATGTGCCCGGCTTCTGACCATGCG

    GTCGCGTTCGGTTGCACTACGCGTACTGTGAGCCAGAGTTGCCCGGCGCTCTCCGGCTGCGGTAG

    TTCAGGCAGTTCAATCAACTGTTTACCTTGTGGAGCGACATCCAGAGGCACTTCACCGCTTGCCA

    GCGGCTTACCATCCAGCGCCACCATCCAGTGCAGGAGCTCGTTATCGCTATGACGGAACAGGTATT

    CGCTGGTCACTTCGATGGTTTGCCCGGATAAACGGAACTGGAAAAACTGCTGCTGGTGTTTTGCT

    TCCGTCAGCGCTGGATGCGGCGTGCGGTCGGCAAAGACCAGACCGTTCATACAGAACTGGCGATC

    GTTCGGCGTATCGCCAAAATCACCGCCGTAAGCCGACCACGGGTTGCCGTTTTCATCATATTTAAT

    CAGCGACTGATCCACCCAGTCCCAGACGAAGCCGCCCTGTAAACGGGGATACTGACGAAACGCC

    TGCCAGTATTTAGCGAAACCGCCAAGACTGTTACCCATCGCGTGGGCGTATTCGCAAAGGATCAG

    CGGGCGCGTCTCTCCAGGTAGCGAAAGCCATTTTTTGATGGACCATTTCGGCACAGCCGGGAAGG

    GCTGGTCTTCATCCACGCGCGCGTACATCGGGCAAATAATATCGGTGGCCGTGGTGTCGGCTCCGC

    CGCCTTCATACTGCACCGGGCGGGAAGGATCGACAGATTTGATCCAGCGATACAGCGCGTCGTGA

    TTAGCGCCGTGGCCTGATTCATTCCCCAGCGACCAGATGATCACACTCGGGTGATTACGATCGCGC

    TGCACCATTCGCGTTACGCGTTCGCTCATCGCCGGTAGCCAGCGCGGATCATCGGTCAGACGATTC

    ATTGGCACCATGCCGTGGGTTTCAATATTGGCTTCATCCACCACATACAGGCCGTAGCGGTCGCAC

    AGCGTGTACCACAGCGGATGGTTCGGATAATGCGAACAGCGCACGGCGTTAAAGTTGTTCTGCTT

    CATCAGCAGGATATCCTGCACCATCGTCTGCTCATCCATGACCTGACCATGCAGAGGATGATGCTC

    GTGACGGTTAACGCCTCGAATCAGCAACGGCTTGCCGTTCAGCAGCAGCAGACCATTTTCAATCC

    GCACCTCGCGGAAACCGACATCGCAGGCTTCTGCTTCAATCAGCGTGCCGTCGGCGGTGTGCAGT

    TCAACCACCGCACGATAGAGATTCGGGATTTCGGCGCTCCACAGTTTCGGGTTTTCGACGTTGAG

    ACGTAGTGTGACGCGATCGGCATAACCACCACGCTCATCGATAATTTCACCGCCGAAAGGCGCGG

    TGCCGCTGGCGACCTGCGTTTCACCCTGCCATAAAGAAACTGTTACCCGTAGGTAGTCACGCAAC

    TCGCCGCACATCTGAACTTCAGCCTCCAGTACAGCGCGGCTGAAATCATCATTAAAGCGAGTGGC

    AACATGGAAATCGCTGATTTGTGTAGTCGGTTTATGCAGCAACGAGACGTCACGGAAAATGCCGC

    TCATCCGCCACATATCCTGATCTTCCAGATAACTGCCGTCACTCCAACGCAGCACCATCACCGCGA

    GGCGGTTTTCTCCGGCGCGTAAAAATGCGCTCAGGTCAAATTCAGACGGCAAACGACTGTCCTGG

    CCGTAACCGACCCAGCGCCCGTTGCACCACAGATGAAACGCCGAGTTAACGCCATCAAAAATAAT

    TCGCGTCTGGCCTTCCTGTAGCCAGCTTTCATCAACATTAAATGTGAGCGAGTAACAACCCGTCGG

    ATTCTCCGTGGGAACAAACGGCGGATTGACCGTAATGGGATAGGTTACGTTGGTGTAGATGGGCG

    CATCGTAACCGTGCATCTGCCAGTTTGAGGGGACGACGACAGTATCGGCCTCAGGAAGATCGCAC

    TCCAGCCAGCTTTCCGGCACCGCTTCTGGTGCCGGAAACCAGGCAAAGCGCCATTCGCCATTCAG

    GCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAG

    GGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTCACGACGTTGTAAA

    ACGACGGGATCCCTCGAGGAATTCATTTATAGCATAGAAAAAAACAAAATGAAATTCTACTATATT

    TTTACATACATATATTCTAAATATGAAAGTGGTGATTGTGACTAGCGTAGCATCGCTTCTAGACATAT

    ACTATATAGTAATACCAATACTCAAGACTACGAAACTGATACAATCTCTTATCATGTGGGTAATGTTC

    TCGATGTCGAATAGCCATATGCCGGTAGTTGCGATATACATAAACTGATCACTAATTCCAAACCCAC

    CCGCTTTTTATAGTAAGTTTTTCACCCATAAATAATAAATACAATAATTAATTTCTCGTAAAAGTAGA

    AAATATATTCTAATTTATTGCACGGTAAGGAAGTAGAATCATAAAGAACAGTGACGGATCCCGTCG

    ACACCCGGGCCCAACTAGAATGGGCGCCCGGGCCAGCATCCTGCGGGGAGGCAAGCTGGACAAA

    TGGGAGAAGATCCGGCTGAGACCCGGAGGCAAGAAACACTACATGCTGAAGCACCTGGTGTGGG

    CCAGCCGGGAGCTGGAAAGATTCGCCCTGAACCCCGGCCTCCTGGAGACCAGCGAAGGCTGCAA

    GCAGATCATTAAGCAGCTGCAACCCGCCCTGCAGACCGGCACCGAGGAACTGCGGAGCCTGTTC

    AACACCGTGGCCACCCTGTACTGCGTGCACGAGGAAATCGAGGTGCGGGACACCAAGGAGGCCC

    TGGACAAGATCGAGGAAGAGCAGAACAAGATCCAGCAAAAGACCCAGCAGGCCAAGAAAGCCG

    ACGAGAAGGTGAGCCAGAACTACCCCATCGTGCAGAACCCCCAGGGCCAGATGGTGCACCAGCC

    TCTGAGCCCCCGGACCCTGAACGCCTGGGTGAAGGTCGTGGAGGAAAAGGCCTTCAGCCCCGAG

    GTGATCCCTATGTTCACCGCCCTGAGCGAGGGCGCCACCCCCCAGGACCTGAACACCATGCTGAA

    CACCGTGGGCGGGCACCAGGCTGCCATGCAGATGCTGAAGGACACCATCAACGAGGAAGCCGCT

    GAGTGGGACCGGCTGCACCCCGTGCACGCCGGCCCCGTGGCCCCTGGCCAGATGCGGGAGCCCA

    GAGGCAGCGACATCGCCGGCACCACATCCAGCCTGCAGGAGCAGATCGGCTGGATGACCAACAA

    TCCTCCCATCCCAGTGGGCGAGATCTACAAGCGGTGGATTATCCTGGGCCTGAACAAGATCGTGC

    GGATGTACAGCCCCACCTCCATCCTGGACATCAAGCAGGGCCCTAAGGAGCCCTTCCGGGACTAC

    GTGGATAGATTCTTTAAGACCCTGCGGGCCGAGCAGGCCACCCAGGACGTGAAGAACTGGATGA

    CCGACACCCTGCTCGTGCAGAATGCCAACCCCGACTGCAAGACCATCCTGCGGGCCCTGGGCAG

    CGGCGCCTCCCTGGAAGAGATGATGACCGCCTGCCAGGGCGTGGGAGGCCCCAGCCACAAGGCC

    CGGGTGCTGGCTGAGGCCATGAGCCAGACCTCCAACACCATCCTGATGCAGCGGAGCAACTTCA

    AGGGCAGCAAACGGATCGTGAAGTGCTTCAACTGTGGCAAGGAGGGCCACATCGCCAAGAACTG

    CAGGGCCCCTAGGAAAAAAGGCTGTTGGAAATGTGGAAAGGAAGGACACCAAATGAAAGACTG

    TACTGAAAGGCAGGCGAATTTTTTAGGGAAATTTTGGCCTTCCCACAAGGGGAGGCCAGGGAATT

    TTCTCCAGAGCAGACCAGAGCCAACAGCCCCACCAGCAGAGAGCTTCAGGTTCGAGGAGACAA

    CCCCAGCTCCGAAGCAGGAACCGAAAGACAGGGAACCCTTAACTTCCCTCAGATCACTCTTTGGC

    AGCGACCCCTTGTCTCAATAAAAGTAGGGGGCCAGATAAAAGAGGCTCTCTTGGCCACCGGCGCC

    GATGACACCGTGCTGGAGGAAGTGAACCTGCCCGGCAAGTGGAAGCCCAAGATGATCGGCGGGA

    TCGGAGGCTTCATCAAGGTGCGGCAGTACGAGCAGATCCCCATTGAGATCTGCGGCAAGAAAGCC

    ATCGGCACCGTGCTGGTGGGCCCCACCCCCGTGAACATCATTGGCCGGAACATGCTGACCCAGCT

    GGGCTGCACCCTGAACTTCCCCATCAGCCCCATCGAGACCGTGCCCGTGAAGCTGAAGCCCGGCA

    TGGACGGCCCCAAGGTGAAGCAGTGGCCCCTGACCGAGGAAAAGATCAAGGCCCTGACCGCCAT

    CTGCGACGAGATGGAAAAGGAGGGCAAGATCACCAAGATCGGCCCCGACAACCCCTACAACACC

    CCCATCTTCGCCATCCGGAAGAAAGACAGCTCCAAGTGGCGGAAGCTGGTGGACTTCCGGGAGC

    TGAACAAGCGGACCCAGGACTTCTGGGAGGTGCAGCTGGGCATCCCCCACCCCGCCGGCCTGAA

    GAAAAAGAAAAGCGTGACCGTGCTGGACGTGGGCGACGCCTACTTCAGCGTGCCCCTGGATAAG

    GACTTCCGGAAGTACACCGCCTTCACCATCCCCAGCGTGAACAATGAGACCCCCGGCATCCGGTA

    CCAGTACAACGTGCTGCCCCAGGGCTGGAAGGGCAGCCCCGCCATCTTCCAGTGCAGCATGACC

    AAGATCCTGGAGCCCTTCCGGAAGCAGAACCCCGACATCGTGATCTACCAGTACATGCATGATCT

    GTACGTGGGCAGCGACCTGGAGATCGGCCAGCACCGGACCAAGATCGAGGAACTGCGGGAGCAC

    CTCCTGAAGTGGGGCTTCACCACACCCGACAAGAAACACCAGAAGGAGCCTCCCTTCCTGTGGA

    TGGGCTACGAGCTGCACCCCGACAAGTGGACCGTGCAGCCCATCCAGCTGCCCGAGAAGGACAG

    CTGGACCGTGAACGACATCCAGAAGCTGGTGGGCAAGCTGAACTGGGCCAGCCAGATCTACCCC

    GGCATCAAGGTGCGGCAGCTGTGCAAGCTCCTGCGGGGCGCCAAGGCCCTGACCGACATCGTGC

    CCCTGACCGAGGAAGCCGAGCTGGAACTGGCCGAGAACCGGGAGATCCTGAAGGAGCCCGTGC

    ACGGCGCCTACTATGACCCCAGCAAGGAGCTGATCGCCGAGATCCAGAAGCAGGGCCAAGACCA

    GTGGACCTACCAGATCTACCAGGAGCCCTTCAAGAACCTGAAGACCGGCAAGTACGCCAAGATG

    CGGACCGCCCACACCAACGACGTGAAGCAGCTGACCGAGGCCGTGCAGAAGATCGCCATGGAG

    AGCATCGTGATTTGGGGCAAGATCCCCAAGTTCCGGCTGCCCATCCAGAAGGAGACCTGGGAGA

    CCTGGTGGACCGACTACTGGCAGGCCACCTGGATTCCCGAGTGGGAGTTCGTGAACACCCCTCCC

    CTGGTGAAGCTGTGGTACCAGCTGGAGAAGGACCCCATCGCCGGCGTGGAGACCTTCTACGTGG

    ACGGCGCCGCTAACCGGGAGACCAAGATCGGCAAGGCCGGCTACGTGACCGACAGAGGCCGGA

    AGAAAATCGTGAGCCTGACCGACACAACCAACCAGAAGACCGAGCTGCAGGCCATCTACATCGC

    CCTGCAGGACAGCGGCAGCGAGGTGAACATCGTGACCGACAGCCAGTACGCCCTGGGCATCATT

    CAGGCCCAGCCCGACAAGAGCGAGAGCGAGCTGGTGAACCAGATCATTGAGCAGCTGATCAAGA

    AAGAGCGGGTGTACCTGAGCTGGGTGCCCGCCCACAAGGGCATCGGGGGCAACGAGCAGGTGG

    ACAAGCTGGTGAGCAACGGCATCCGGAAGGTGCTGTTCCTGGACGGCATCGACAAGGCCCAGGA

    GGAACACGAGAAGTACCACAGCAACTGGCGGGCCATGGCCAGCGACTTCAACCTGCCTCCCATC

    GTGGCCAAGGAGATCGTGGCCAGCTGCGACCAGTGTCAGCTGAAGGGCGAGGCCATGCACGGCC

    AGGTGGACTGCAGCCCCGGCATCTGGCAGCTGGACTGCACCCACCTGGAGGGCAAGATCATTCT

    GGTGGCCGTCCACGTGGCCAGCGGCTACATCGAGGCCGAGGTGATCCCCGCCGAGACCGGCCAG

    GAGACCGCCTACTTCATCCTGAAGCTGGCCGGCCGGCAGGATGAGGACTGAGGATCTCAGAGTAA

    TGACATGGTTCCTTCCATCCTCCAAAGGTGACCAATAATAGTTTGTAAGTATCATTATGAACTAATG

    AATTTTCAACATATTTGATATATTTCAATCCATTGCCATCATTGTTCTTATCGATATTTGAGTTGGCTC

    ACTTTGCCAGTAAGAGTCTATTCAAATTGGCTTCTGAGTCCATTTGACACAACACCTTTGATCTTT

    GACAGTTTCCTTGGTTTTAGGTGCTAGATGATTTCTCAGGCTCACCTTAGACATTTCCTGCCACAG

    ACTTAGAATCAGCCATTTCTCTAAGGACCCTGATTCCATTTCATGAGAAATGATAGAGACCACAAT

    CAAAACAAGTCATGAATTTATACTGATATTTTCAATTCAAATTAAAGATGAGGTTTTTGCTAAATTT

    TTTTGAGTTTATATTTGTATGTCTTATGCTGAAAAATCTTGTTTCCTAATTAGTAACATAATTATTCAT

    TTGATGGGTAAATATTTTAGGGCCGATTCTTTGGTTTTATAGCCAAGATACCCTGTTGATAAAGTCTT

    GTGGGAGCAATTATAAGACTGGCTTATTTTGAAGCTTTTTAAAAAAGACATCCTTACCTGTTTTAAC

    TGTAGATTATATTAACTTAAATAGGTACAGCCCACGCTTGATGGGATCCATGAGAGTGAGGGGGAC

    ACGGAGGAATTATCAACAATGGTGGATATGGGGCGTCTTGGGCTTTTGGATGTTAATGATTTGTAAT

    GTGGAAGGAAACTTGTGGGTCACAGTCTATTATGGGGTACCTGTGTGGAAAGAAGCAAAAACTAC

    TCTATTCTGTGCGTCAGATGCTAAAGCATATGAGACAGAAGTGCATAATGTCTGGGCTACACATGC

    CTGTGTACCCACAGACCCCAACCCACAAGAAATAGTTATGGAAAATGTAACAGAAAATTTTAACA

    TGTGGAACAATGATATGGTGAATCAGATGCATGAGGATGTAATCAGTTTATGGGATCAAAGCCTAA

    AGCCATGTGTAAAGTTGACCCCACTCTGTGTCACTTTAGAATGTAGAAATGTTAGCAGTAATGGTA

    ATGGTACCCGCAATGAGACCTACAATGAGAGCGTGAAGGAGGTAAAAAATTGCTCTTTCAATGCA

    ACCACATTATTAAGAGATAGGAAGAAGACAGTGTATGCCCTTTTTTATAGACTTGATATAGCACCCC

    TTAATGATGAGAACTCTGGTAAGAACTCTAGTGAGTATTATAGATTAATAAATTGTAATACCTCAGC

    CATAACACAAGCCTGTCCAAAGGTCACTTTTGATCCAATTCCTATACACTATTGCACTCCAGCTGG

    TTATGCGATTCTAAAGTGTAATGATAAGATATTCAATGGGACAGGACAATGCCATAATGTTAGCACG

    GTACAATGTACACATGGAATTAAGCCAGTGGTATCAACTCAACTACTGTTAAATGGTAGCCTAGCA

    GAAAGAGAGATAATAATTAGATCTGAAAATCTGACAAACAATGTCAAAACAATAATAGTACATCTT

    AATAAATCTGTAGAAATTGTATGTACAAGACCCAACAATAATACAAGAAAAAGTATAAGGATAGGA

    CCAGGACAAACATTCTATGCAACAGGAGACATCATAGGAGACATAAGACAAGCACATTGTAACAT

    TAGTAAAGATAAATGGGATGAAACTTTACAGAGGGTAAGTAAAAAATTAGCAGAACACTTCCCTA

    ATAAAACAATAAAATTTGCATCATCCTCAGGAGGGGACCTAGAAATTACAACACATAGCTTTAATT

    GTAGAGGAGAATTTTTCTATTGTAATACATCAGGCCTGTTTAATGGTACATACAATGGTACAAAAGA

    TAATTCAAGCTCAATCATCACAATCCCATGCAGAATAAAGCAAATTATAAACATGTGGCAGGAGGT

    AGGACGAGCAATGTATGCCCCTCCCATTGAAGGAAACATAACATGTAAATCAAATATCACAGGACT

    ACTATTGGTACGTGATGGAGGAAGAACAGAGTCAAATGATACAGAGATATTCAGACCTGGTGGAG

    GAGATATGAGAAACAATTGGAGAAATGAATTATATAAATATAAAGTGGTAGAAATTAAGCCATTGG

    GAGTAGCACCCACTGCAGCAAAAAGGAGAGTGGTGGAGAGAGAAAAAAGAGCAGTGGGACTAG

    GAGCTGTGTTCCTTGGGTTCTTGGGAGCAGCAGGAAGCACTATGGGCGCGGCGTCAATAACGCTG

    ACGGTACAGGCCAGACAATTGTTGTCTGGTATAGTGCAACAGCAAAGCAATTTGCTGAGAGCTAT

    AGAGGCGCAACAGCATATGTTGCAACTCACGGTCTGGGGCATTAAGCAGCTACAGACAAGAGTCC

    TGGCTATAGAAAGATACCTAAAGGATCAACAGCTCCTAGGGATTTGGGGCTGCTCTGGAAAACTTA

    TCTGCACTACTGCTGTACCTTGGAACTCCAGTTGGAGTAACAAATCTCAACAAGAGATTTGGGATA

    ACATGACCTGGATGCAGTGGGATAAGGAAATTAGTAATTACACAAACACAATATACAGGTTGCTTG

    AAGACTCGCAAAACCAGCAGGAAAGAAATGAAAAAGATTTATTAGCATTGGACAGTTGGAAAAA

    TCTATGGAGTTGGTTTGACATAACAAATTGGCTGTGGTATATAAAAATATTCATAATGATAGTAGGA

    GGCTTGATAGGTTCAAGAATAATTTTTGCTGTGCTTTCTATAGTGAATAGAGTTAGGCAGGGATACT

    CACCTTTGTCGTTTCAGATCCCTACCCCGAACCCAGGGGGACCAGGCAGGCTCGGAAGAATCGAA

    GAAGAAGGTGGAGAGCAAGACAAAACCAGATCCATTCGATTAGTGAACGGGTTCTTAGCACTTG

    CCTGGGACGACCTACGGAACCTGTGCCTCTTCAGTTACCACCGCTTGAGTGACTTCATATTACTGA

    CAGCGAGAGGGGTGGAACTTCTGGGACGCAACAGCCTCAGGGGACTACAGAGGGGGTGGGAAG

    CCCTTAAATATCTGGGAAATCTTGTGCAGTATTGGGGTCTGGAGCTAAAAAAGAGTACTATTAGTC

    TGGTTGATACCATAGCAATAGTAGTAGCTGAAGGAACAGATAGGATTATAAACATAGTACAAGGAA

    TTTGTAGAGCTATCCACAACGTACCTAGAAGAATAAGACAGGGCCTTGAAGCAGCTTTGCAATAAT

    CTAGTACCATGGTACCTTAAGCTAGCATGCAGCGGCCGCGGATCGACAGGCCTAATTAATTAAGGG

    AATTCTGTGAGCGTATGGCAAACGAAGGAAAAATTAGTTATAGTAGCCGCACTCGATGGGACATTT

    CAACGTAAACCGTTTAATAATATTTTGAATCTTATTCCATTATCTGAAATGGTGGTAAAACTAACTG

    CTGTGTGTATGAAATGCTTTAAGGAGGCTTCCTTTTCTAAACGATTGGGTGAGGAAACCGAGATAG

    AAATAATAGGAGGTAATGATATGTATCAATCGGTGTGTAGAAAGTGTTACATCGACTCATAATATTAT

    ATTTTTTATCTAAAAAACTAAAAATAAACATTGATTAAATTTTAATATAATACTTAAAAATGGATGTT

    GTGTCGTTAGATAAACCGTTTATGTATTTTGAGGAAATTGATAATGAGTTAGATTACGAACCAGAAA

    GTGCAAATGAGGTCGCAAAAAAACTGCCGTATCAAGGACAGTTAAAACTATTACTAGGAGAATTA

    TTTTTTCTTAGTAAGTTACAGCGACACGGTATATTAGATGGTGCCACCGTAGTGTATATAGGATCTG

    CTCCCGGTACACATATACGTTATTTGAGAGATCATTTCTATAATTTAGGAGTGATCATCAAATGGATG

    CTAATTGACGGCCGCCATCATGATCCTATTTTAAATGGATTGCGTGATGTGACTCTAGTGACTCGGT

    TCGTTGATGAGGAATATCTACGATCCATCAAAAAACAACTGCATCCTTCTAAGATTATTTTAATTTC

    TGATGTGAGATCCAAACGAGGAGGAAATGAACCTAGTACGGCGGATTTACTAAGTAATTACGCTCT

    ACAAAATGTCATGATTAGTATTTTAAACCCCGTGGCGTCTAGTCTTAAATGGAGATGCCCGTTTCCA

    GATCAATGGATCAAGGACTTTTATATCCCACACGGTAATAAAATGTTACAACCTTTTGCTCCTTCAT

    ATTCAGGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCT

    TGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCCCTTCCC

    AACAGTTGCGCAGCCTGAATGGCGAATGGCGCCTGATGCGGTATTTTCTCTTTACGCATCTGTGCG

    GTATTTCACACCGCATATGGTGCACTCTCAGTACCATCTGCTCTGATGCCGCATAGTTAAGCCAGTA

    CACTCCGCTATCGCTACGTGACTGGGTCATGGCTGCGCCCCGACACCCGCCAACACCCGCTGACG

    CGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGC

    TGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCG