用于预防艾滋病的疫苗组合物 【技术领域】
本发明涉及核酸疫苗和重组非复制型痘病毒载体疫苗的组合物。
背景技术
艾滋病被认为是世界上直接威胁人类健康的第一大传染病,根据联合国卫生组织的流行病学调查结果,截至2001年全世界共有四千万艾滋病携带者,其中五百万人为新感染者。仅2001年一年,就有三百万人死于艾滋病。我国艾滋病流行情况也不容乐观,据联合国艾滋病专家估计,我国大约有超过100万艾滋病携带者。虽然近几年抗艾滋病药物的“鸡尾酒”疗法在发达国家有效地控制了HIV的蔓延,但是昂贵的价格(在我国该药物价格大约为3000~10000元人民币/人/月),耐药病毒株的产生,长期用药的副作用以及最终无法彻底清除患者体内病毒等方面的不利因素显示,只有艾滋病疫苗才能真正有效地预防和控制艾滋病。所以艾滋病疫苗研制势在必行。
用HIV-1疫苗防治AIDS被国际上认为是目前最行之有效的方法,已成为世界上许多科研机构研究的热点。目前,关于艾滋病疫苗的生产国际上尚属空白。而HIV-1疫苗的研制工作在国外已有多家大型科研机构、制药公司正开展进行。
自八十年代发现艾滋病以来,人们就开始进行艾滋病疫苗的研究。一般来说,减毒活疫苗和灭活疫苗能产生较好免疫保护性反应,但安全性较差,不适用于作为艾滋病疫苗。随着人类对艾滋病认识的不断提高,九十年代初人们意识到CTL(Cytotoxic T Lymphocytes细胞毒性T细胞,即细胞免疫应答)的重要性,越来越多的证据显示阳性CD8介导的CTL在控制艾滋病毒感染中起举足轻重的作用。因此人们开始研究用重组病毒载体疫苗来诱导CTL,然后用胞膜蛋白亚单位疫苗增强免疫来诱导中和抗体,力图从体液免疫和细胞免疫两方面来诱导人体对艾滋病毒的保护反应。但由于免疫强度有限,而用重组载体疫苗又难以进行多次增强免疫,所以在动物模型和人体试验结果都显示了较低的对HIV地免疫保护反应。
痘病毒作为天花的有效疫苗被在世界范围内广泛应用,为人类最后在全世界范围内灭绝天花做出了决定性的贡献。由于痘苗病毒的副作用,人们在六、七十年代就开始了痘苗病毒的致弱工作。1960年至1974年期间,德国教授Anton Mayr领导的研究小组通过将痘病毒在鸡胚成纤维细胞中传代的方法,成功地将从Ankara地区分离得到的痘病毒CVA株致弱。当传到516代时,这株致弱毒株被命名为MVA(Modified Vaccinia Ankara)。MVA不但继承了CVA的免疫原性好,对天花的保护性高的特点,同时由于在哺乳细胞不能繁殖,所以MVA还具有对人和动物毒副作用小的特点。
1980年,随着世界卫生组织宣布天花在地球上的灭绝,痘苗病毒本身作为疫苗的历史结束了。然而在同一年,基因重组技术在痘苗病毒上的应用,为痘病毒作为病毒载体用于开发研制新疫苗拓开了崭新,广泛的应用前景。
MVA目前被广泛用于人类基因治疗和疫苗的研究,英国的Oxford Bio Medica和法国Strasbourg的TransGene,在分别以MVA为载体进行癌症基因治疗的人体临床试验,同时英国MRC和肯尼亚正在合作进行以MVA为载体的HIV疫苗的临床试验。
DNA疫苗像减毒活疫苗那样即诱导体液免疫又诱导细胞免疫,但是又不似后者那样具有很大的潜在危机。DNA疫苗在艾滋病研究方面也同样令人振奋。Wang及其同事报道,以HIV/Z6 gp160和Rev为抗原所构建的DNA疫苗在小鼠和猴子体内产生了良好的细胞免疫和体液免疫。这是由于DNA疫苗有抗原纯,可多次重复免疫以及能诱导高效价记忆性CTL的特点。
目前人们采用多次DNA疫苗免疫后,再用高效表达靶抗原的病毒载体疫苗来增强病疫的方案,以期诱导更强的免疫反应,达到使人体产生对HIV有效的免疫保护的效果。美国、法国、意大利、澳大利亚等多个研究小组已经在肯尼亚、乌干达、美国、法国、意大利、澳大利亚等多个国家和地区开展了数项艾滋病疫苗的临床研究。
国内研究艾滋病疫苗的队伍主要有中国预防医学科学院、卫生部艾滋病预防与控制中心和病毒学研究所、清华大学、中国科学院微生物所及一些部队院校等。
【发明内容】
本发明提供一种用于预防艾滋病的疫苗组合物,目的是提高疫苗的免疫效果。
包括抗人类免疫缺陷病毒-1(HIV-1)的核酸疫苗和重组非复制型痘病毒载体疫苗。
其核酸疫苗为一种含有转录单位的人工合成的脱氧核糖核酸序列,所述转录单位编码人类免疫缺陷病毒-1(HIV-1)结构蛋白序列,该人类免疫缺陷病毒-1(HIV-1)结构蛋白序列是具有免疫原性的人类免疫缺陷病毒-1(HIV-1)抗原,其中转录单位指导该抗原的合成,其中编码人类免疫缺陷病毒-1(HIV-1)结构蛋白Gag、Pol和Env的核苷酸序列来源于经过人工修饰的编码野生型中国流行株人类免疫缺陷病毒-1(HIV-1)B/C重组型的结构蛋白的核苷酸序列;
其重组非复制型痘病毒载体疫苗为一种含有转录单位的经过重组的痘病毒,所述转录单位编码人类免疫缺陷病毒-1(HIV-1)结构蛋白序列,该人类免疫病毒病毒-1(HIV-1)结构蛋白序列是具有免疫原性的人类免疫缺陷病毒-1(HIV-1)抗原,其中转录单位指导抗原的合成,采用的痘病毒是经过修饰的痘病毒安卡拉株(Modified Vaccinia VirusAnkara,MVA)。其转录单位所编码的结构蛋白包括人类免疫病毒病毒-1(HIV-1)的完整核心蛋白Gag、编码酶类蛋白的Pol和外膜蛋白Env。
核酸疫苗和重组非复制型痘病毒载体疫苗的比例为;12mg~18mg:106pfu~1010pfu。
本发明的一个重要方面:
编码人类免疫缺陷病毒-1(HIV-1)结构蛋白Gag、Pol和Env的核苷酸序列来源于经过人工修饰的编码野生型中国流行株人类免疫缺陷病毒-1(HIV-1)B/C重组型的结构蛋白的核苷酸序列,其核苷酸序列分别如SEQ ID NO:2、SEQ ID NO:3所述;
本发明的另一个重要方面,
编码人类免疫缺陷病毒-1(HIV-1)结构蛋Gag、Pol和Env的序列所表达的蛋白质Gag、Pol和Env氨基酸序列分别如SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6所述。
本发明的另一个重要方面,其核酸疫苗为一种含有转录单位的人工合成的脱氧核糖核酸序列,其核苷酸序列如SEQ ID NO:1所述。
本发明的优点在于:提高疫苗的免疫效果。
【附图说明】
图1、HIV-1基因组示意图。其中gag,pol和env是最主要的结构基因。
图2、D-GPEi核酸疫苗质粒构建过程示意图。
图3、穿梭质粒pSC11-GPE示意图。该质粒共含有14958bp,包括两个方向相反的启动子P11和P7.5分别驱动LacZ和HIV-1抗原基因的转录,FL-1-TK和FL-2-TK是两段与MVA病毒载体上TK基因的同源序列,正是由于这两段同源序列的存在,使该重组穿梭质粒和MVA在细胞内能发生同源重组,把包括LacZ和HIV-1抗原基因的表达盒重组到MVA病毒载体中,从而构建了重组MVA病毒载体疫苗M-GPE。
图4、M-GPE示意图。HIV-1结构基因表达框架重组到MVA的TK基因中,基因表达的启动子采用P7.5。
图5、比较核酸疫苗D-GPEi在用M-GPE增强免疫前后在小白鼠(BALB/C)的体液免疫反应。5个一组小白鼠在0周,2周和4周分别被不同核酸疫苗免疫(100μg/小白鼠/次),第6周用M-GPE增强免疫(5×107pfu/小白鼠)。在不同时间收集每组小白鼠血清,检测对HIV-1中国流行株抗原的抗体免疫反应(抗原来自于中国广西HIV-1高发区病毒样品)。
LANE1:空白;
LANE2:D-GPEi三次免疫小鼠后第六周血清;
LANE3:修饰型gagpol+修饰型env两种质粒共注射三次免疫小鼠后第六周血清;
LANE4:空白;
LANE5:D-GPEi三次免疫小鼠,第六周用M-GPE增强免疫,增强免疫5天后血清;
LANE6:修饰型gagpol+修饰型env两种质粒共注射,第六周用M-GPE增强免疫,增强免疫5天后血清;
LANE7:空白;
LANE8:D-GPEi三次免疫小鼠,第六周用M-GPE增强免疫,增强免疫14天后血清
LANE9:修饰型gagpol+修饰型env两种质粒共注射,第六周用M-GPE增强免疫,增强免疫14天后血清。
图6、检测联合疫苗在小白鼠(BALB/C)的细胞免疫反应。
5只一组小白鼠在0周、2周和4周分别被不同核酸疫苗免疫(100μg/小白鼠/次),第6周用M-GPE增强免疫(5×107pfu/小鼠)。免疫5天后解剖小鼠,取出脾脏,用ELISPOT测定在用小肽刺激后100万脾细胞中分泌INF-γ的细胞的数量。
图7、检测联合疫苗在小白鼠(BALB/C)的细胞免疫反应。
5只一组小白鼠在0周,2周和4周分别被不同核酸疫苗免疫(100μg/小白鼠/次),完成免疫5天后解剖小鼠,取出脾脏,用ICC测定在用小肽刺激后脾细胞中分泌γ-INF的细胞百分比。
A空白(没有肽刺激);B野生型D-GPE(没有肽刺激);C修饰型D-GPEi(没有肽刺激);D空白+肽刺激;E野生型D-GPE+肽刺激;F修饰型D-GPEi+肽刺激;
图8、检测联合疫苗在小白鼠(BALB/C)的细胞免疫反应。
5个一组小白鼠在0周、2周和4周分别被不同核酸疫苗免疫(100μg/小白鼠/次),第6周用M-GPE增强免疫(5×107pfu/小鼠)。完成免疫5天后解剖小鼠,取出脾脏,分离淋巴细胞,测定其对靶细胞(上述肽包被的小鼠淋巴细胞株P815)的CTL活性。
A修饰型D-GPEi;B野生型D-GPE;C空白。
图9、猴子在0天、15天和30天分别被不同核酸疫苗免疫(2mg/猴子/次),第6周用M-GPE增强免疫(109pfu/猴子)。分别在增强免疫后15天、90天和180天静脉取血,分离淋巴细胞,用ELISPOT测定在用小肽刺激后100万淋巴细胞中能分泌INF-γ的细胞的数量,C亚型HIV-1 Gag蛋白肽库被用于上述测定。
【具体实施方式】
实施例1:核酸疫苗的目标抗原基因gagpol和env基因的修饰
1、目的基因的选择
目前中国主要的HIV-1流行株为B/C重组型HIV-1。
选择的HIV-1中国流行株gagpol基因序列如SEQ ID NO:7。
选择的HIV-1中国流行株env基因序列如SEQ ID NO:8。
我们这里用于构建艾滋病疫苗的HIV-1目的基因就是根据上述B/C重组亚型的基因序列为基础,然后进行了全序列人工合成,该合成的基因所表达的氨基酸序列与HTV-1中国流行株gagpol和env基因表达的氨基酸序列一致,但基因表达效率则大大提高。
以上述gagpol和env基因作为目标抗原的基因,它们的表达产物组成了HIV-1最主要的结构蛋白(如图1),因此它们是抗原基因的最佳选择。
2、抗原的修饰
2.1方法:根据我们以前研究的结果发现,HIV-1 gag,pol和env基因内存在许多抑制因子。这些抑制因子是以A和T为主组成,造成HIV-1 mRNA不稳定,不能从细胞核转制到细胞浆,从而影响蛋白表达。去除抑制因子的办法就是在不影响氨基酸编码的前提下,将Codon第三位的A或T尽量改为C或G。
2.2过程:GPCINS、ENVCINS分别代表合成的全新的gagpol和env基因
GPCINS基因序列合成引物:
F1:GACGTGGGCGACGCCTACTTCAGCGTGCCCCTGGATAAGGACTTCCGGAAGTACACCGCCTTCACCATCCCCAGCGTGAACAATGAGACC
R1:CTGCACTGGAAGATGGCGGGGCTGCCCTTCCAGCCCTGGGGCAGCACGTTGTACTGGTACCGGATGCCGGGGGTCTCATTGTTCACGCTG
F2:CCAGGACTTCTGGGAGGTGCAGCTGGGCATCCCCCACCCCGCCGGCCTGAAGAAAAAGAAAAGCGTGACCGTGCTGGACGTGGGCGACGC
R2:CAGATCGTCCATGTACTGGTAGATCACGATGTCGGGGTTCTGCTTCCGGAAGGGCTCCAGGATCTTGGTCATGCTGCACTGGAAGATGGC
F3:CATCTTCGCCATCCGGAAGAAAGACAGCTCCAAGTGGCGGAAGCTGGTGGACTTCCGGGAGCTGAACAAGCGGACCCAGGACTTCTGGGA
R3:TTCAGGAGGTGCTCCCGCAGTTCCTCGATCTTGGTCCGGTGCTGGCCGATCTCCAGGTCGCTGCTGCCCACGTACAGATCGTCCATGTACTGG
F4:GACCGCCATCTGCGACGAGATGGAAAAGGAGGGCAAGATCACCAAGATCGGCCCCGACAACCCCTACAACACCCCCATCTTCGCCATCCG
R4:GGTGCAGCTCGTAGCCCATCCACAGGAAGGGAGGCTCCTTCTGGTGTTTCTTGTCGGGTGTGGTGAAGCCCCACTTCAGGAGGTGCTCCC
F5:CCGTGAAGCTGAAGCCCGGCATGGACGGCCCCAAGGTGAAGCAGTGGCCCCTGACCGAGGAAAAGATCAAGGCCCTGACCGCCATCTGCG
R5:CAGCTTCTGGATGTCGTTCACGGTCCAGCTGTCCTTCTCGGGCAGCTGGATGGGCTGCACGGTCCACTTGTCGGGGTGCAGCTCGTAGCC
F6:CATCATTGGCCGGAACATGCTGACCCAGCTGGGCTGCACCCTGAACTTCCCCATCAGCCCCATCGAGACCGTGCCCGTGAAGCTGAAGCC
R6:CCGCAGGAGCTTGCACAGCTGCCGCACCTTGATGCCGGGGTAGATCTGGCTGGCCCAGTTCAGCTTGCCCACCAGCTTCTGGATGTCGTT
F7:TACGAGCAGATCCCCATTGAGATCTGCGGCAAGAAAGCCATCGGCACCGTGCTGGTGGGCCCCACCCCCGTGAACATCATTGGCCGGAAC
R7:GGATCTCCCGGTTCTCGGCCAGTTCCAGCTCGGCTTCCTCGGTCAGGGGCACGATGTCGGTCAGGGCCTTGGCGCCCCGCAGGAGCTTGC
F8:GGAAGTGAACCTGCCCGGCAAGTGGAAGCCCAAGATGATCGGCGGGATCGGAGGCTTCATCAAGGTGCGGCAGTACGAGCAGATCCCCAT
R8:TTGGCCCTGCTTCTGGATCTCGGCGATCAGCTCCTTGCTGGGGTCATAGTAGGCGCCGTGCACGGGCTCCTTCAGGATCTCCCGGTTCTC
F9:CTTGTCTCAATAAAAGTAGGGGGCCAGATAAAAGAGGCTCTCCTGGACACCGGCGCCGATGACACCGTGCTGGAGGAAGTGAACCTGCCC
R9:GGTCCGCATCTTGGCGTACTTGCCGGTCTTCAGGTTCTTGAAGGGCTCCTGGTAGATCTGGTAGGTCCACTGGTCTTGGCCCTGCTTCTG
F10:AGCTCCGAAGCAGGAACCGAAAGACAGGGAACCCTTAACTTCCCTCAGATCACTCTTTGGCAGCGACCCCTTGTCTCAATAAAAGTAGGG
R10:GCCCCAAATCACGATGCTCTCCATGGCGATCTTCTGCACGGCCTCGGTCAGCTGCTTCACGTCGTTGGTGTGGGCGGTCCGCATCTTGGC
F11:GGGAATTTTCTCCAGAGCAGACCAGAGCCAACAGCCCCACCAGCAGAGAGCTTCAGGTTCGAGGAGACAACCCCAGCTCCGAAGCAGGAA
R11:GTGGCCTGCCAGTAGTCGGTCCACCAGGTCTCCCAGGTCTCCTTCTGGATGGGCAGCCGGAACTTGGGGATCTTGCCCCAAATCACGATG
F12:CAAATGAAAGACTGTACTGAAAGGCAGGCGAATTTTTTAGGGAAATTTTGGCCTTCCCACAAGGGGAGGCCAGGGAATTTTCTCCAGAGC
R12:GGGGTCCTTCTCCAGCTGGTACCACAGCTTCACCAGGGGAGGGGTGTTCACGAACTCCCACTCGGGGATCCAGGTGGCCTGCCAGTAGTC
F13:GCCACATCGCCAAGAACTGCAGGGCCCCTAGGAAAAAAGGCTGTTGGAAATGTGGAAAGGAAGGACACCAAATGAAAGACTGTACTGAAA
R13:ACGTAGCCGGCCTTGCCGATCTTGGTCTCCCGGTTAGCGGCGCCGTCCACGTAGAAGGTCTCCACGCCGGCGATGGGGTCCTTCTCCAGC
F14:ACACCATCCTGATGCAGCGGAGCAACTTCAAGGGCAGCAAACGGATCGTGAAGTGCTTCAACTGTGGCAAGGAGGGCCACATCGCCAAGA
R14:TAGATGGCCTGCAGCTCGGTCTTCTGGTTGGTTGTGTCGGTCAGGCTCACGATTTTCTTCCGGCCTCTGTCGGTCACGTAGCCGGCCTTG
F15:ACCGCCTGCCAGGGCGTGGGAGGCCCCAGCCACAAGGCCCGGGTGCTGGCTGAGGCCATGAGCCAGACCTCCAACACCATCCTGATGCAG
R15:CTGAATGATGCCCAGGGCGTACTGGCTGTCGGTCACGATGTTCACCTCGCTGCCGCTGTCCTGCAGGGCGATGTAGATGGCCTGCAGCTC
F16:TCGTGCAGAATGCCAACCCCGACTGCAAGACCATCCTGCGGGCCCTGGGCAGCGGCGCCTCCCTGGAAGAGATGATGACCGCCTGCCAGG
R16:TACACCCGCTCTTTCTTGATCAGCTGCTCAATGATCTGGTTCACCAGCTCGCTCTCGCTCTTGTCGGGCTGGGCCTGAATGATGCCCAGG
F17:GGATAGATTCTTTAAGACCCTGCGGGCCGAGCAGGCCACCCAGGACGTGAAGAACTGGATGACCGACACCCTGCTCGTGCAGAATGCCAA
R17:ATGCCGTTGCTCACCAGCTTGTCCACCTGCTCGTTGCCCCCGATGCCCTTGTGGGCGGGCACCCAGCTCAGGTACACCCGCTCTTTCTTG
F18:GCGGATGTACAGCCCCACCTCCATCCTGGACATCAAGCAGGGCCCTAAGGAGCCCTTCCGGGACTACGTGGATAGATTCTTTAAGACCCT
R18:GCCCGCCAGTTGCTGTGGTACTTCTCGTGTTCCTCCTGGGCCTTGTCGATGCCGTCCAGGAACAGCACCTTCCGGATGCCGTTGCTCACC
F19:GATGACCAACAATCCTCCCATCCCAGTGGGCGAGATCTACAAGCGGTGGATTATCCTGGGCCTGAACAAGATCGTGCGGATGTACAGCCC
R19:CTTCAGCTGACACTGGTCGCAGCTGGCCACGATCTCCTTGGCCACGATGGGAGGCAGGTTGAAGTCGCTGGCCATGGCCCGCCAGTTGCT
F20:TGGCCAGATGCGGGAGCCCAGAGGCAGCGACATCGCCGGCACCACATCCAGCCTGCAGGAGCAGATCGGCTGGATGACCAACAATCCTCC
R20:CCCTCCAGGTGGGTGCAGTCCAGCTGCCAGATGCCGGGGCTGCAGTCCACCTGGCCGTGCATGGCCTCGCCCTTCAGCTGACACTGGTCG
F21:TGCTGAAGGACACCATCAACGAGGAAGCCGCTGAGTGGGACCGGCTGCACCCCGTGCACGCCGGCCCCGTGGCCCCTGGCCAGATGCGGG
R21:TGGCCGGTCTCGGCGGGGATCACCTCGGCCTCGATGTAGCCGCTGGCCACGTGGACGGCCACCAGAATGATCTTGCCCTCCAGGTGGGTG
F22:AGCGAGGGCGCCACCCCCCAGGACCTGAACACCATGCTGAACACCGTGGGCGGGCACCAGGCTGCCATGCAGATGCTGAAGGACACCATC
R22:AGTTGCTGCCGTTGTCGGTGTGGATCACCTTCACGGGCCACCGGCCGGCCAGCTTCAGGATGAAGTAGGCGGTCTCCTGGCCGGTCTCGG
23:CGGACCCTGAACGCCTGGGTGAAGGTCGTGGAGGAAAAGGCCTTCAGCCCCGAGGTGATCCCTATGTTCACCGCCCTGAGCGAGGGCGCC
R23:GGGGTTGTAGGGGATGCCGAACTCTTGCTGGATGCCGGCCCACCAGCAGGCTGCCTTCACAGCGGCGCTGGTGAAGTTGCTGCCGTTGTC
F24:CGACGAGAAGGTGAGCCAGAACTACCCCATCGTGCAGAACCCCCAGGGCCAGATGGTGCACCAGCCTCTGAGCCCCCGGACCCTGAACGC
R24:TCGGCCTGGTCCCGCACCTGGCCGATCAGCTTTTTCAGCTCCTTGTTCATGCTCTCCACCACGCCCTGGCTCTGGGGGTTGTAGGGGATG
F25:ACCAAGGAGGCCCTGGACAAGATCGAGGAAGAGCAGAACAAGATCCAGCAAAAGACCCAGCAGGCCAAGAAAGCCGACGAGAAGGTGAGC
R25:CGCTGTAGCCTCCGATCCCGCCCTTCCGCTTGAAGTTGTGGATGAACACGGCCATCTGCACGGCGGTCTTCAGGTGCTCGGCCTGGTCCC
F26:ACCGAGGAACTGCGGAGCCTGTTCAACACCGTGGCCACCCTGTACTGCGTGCACGAGGAAATCGAGGTGCGGGACACCAAGGAGGCCCTG
R26:GGATCTTAATGATCTGCTTCTGCAGCTCCCGGGTCTGGATGTCGGTGGCGATAATGTCCACGATCCGCTCGCCGGCGCTGTAGCCTCCGA
F27:AACCCCGGCCTCCTGGAGACCAGCGAAGGCTGCAAGCAGATCATTAAGCAGCTGCAACCCGCCCTGCAGACCGGCACCGAGGAACTGCGG
R27:TTCCAGAGCAGCTTGGCGGGGCCCTTCCAGATGGGGTCCCGGCTGTCTCTATAGTACACCCGGAAGTTCTGGATCTTAATGATCTGCTTC
F28:TGAGACCCGGAGGCAAGAAACACTACATGCTGAAGCACCTGGTGTGGGCCAGCCGGGAGCTGGAAAGATTCGCCCTGAACCCCGGCCTCC
R28:TGATAATCTTGGCCTTCCGTCTGGGCACGACCTTGATGTCGCTGTTGTCCTGGATCACGACGGCGCCCTCGCCCTTCCAGAGCAGCTTGG
F29:ATGGGCGCCCGGGCCAGCATCCTGCGGGGAGGCAAGCTGGACAAATGGGAGAAGATCCGGCTGAGACCCGGAGGCA
R29:TCAGTCCTCATCCTGCCGGCCGGCCACGCAGTCGGCGCCGGCCATCTGCTTGCCGTAGTCCTTGATAATCTTGGCCTTCC
ENVCINS基因序列合成引物:
F1:GCTCCAGCATCATTACCATCCCCTGTCGGATCAAGCAGATTATCAACATGTGGCAGGAAGTGGGACGGGCCATGTACGCTCCACCCATCG
R1:CGTTGCTCTCTGTTCTTCCGCCGTCCCGCACCAGGAGCAGGCCGGTGATGTTGGACTTGCAGGTGATGTTGCCCTCGATGGGTGGAGCGT
F2:TGCCGGGGCGAGTTCTTTTACTGCAACACCAGCGGACTGTTCAACGGCACCTACAACGGCACCAAGGACAACAGCTCCAGCATCATTACC
R2:CCTTGTACTTGTACAGCTCGTTCCGCCAATTGTTCCGCATGTCGCCTCCGCCGGTCTGAAGATTTCGGTGTCGTTGCTCTCTGTTCTTC
F3:GAGCACTTCCCCAACAAGACCATCAAGTTTGCCAGCTCTTCCGGCGGAGACCTGGAGATCACCACACACAGCTTCAACTGCCGGGGCGAG
R3:CGCTTCTCCCTCTCGACCACCCGTCTCTTGGCAGCTGTAGGGGCCACTCCCAGGGGTTTGATCTCGACCACCTTGTACTTGTACAGCTCG
F4:CAGACAGGCTCATTGCAACATCAGCAAGGACAAGTGGGACGAGACACTGCAGCGGGTGAGCAAGAAACTGGCCGAGCACTTCCCCAACAA
R4:TGATGCTGGCAGCGCCCATGGTGCTCCCGGCAGCTCCCAGGAAGCCCAGGAACACAGCTCCCAGGCCCACGGCCCGCTTCTCCCTCTCGA
F5:ATAACACCAGGAAGAGCATCAGAATTGGGCCCGGCCAGACCTTCTATGCTACCGGCGACATCATTGGCGACATCAGACAGGCTCATTGCA
R5:GCTTCGATGGCTCTGAGCAGGTTGCTCTGTTGCTGCACGATGCCGCTCAGGAGCTGTCTGGCTTGCACGGTCAGGGTGATGCTGGCAGCG
F6:GACCAATAACGTGAAGACCATCATTGTGCACCTGAACAAGAGCGTGGAGATCGTGTGCACCCGGCCCAACAATAACACCAGGAAGAGCAT
R6:CCGTTCGATGGCGAGCACCCGGGTCTGGAGTTGCTTGATGCCCCACACGGTCAGCTGGAGCATGTGCTGTTGGGCTTCGATGGCTCTGAG
F7:GTCGTGTCCACCCAGCTGCTCCTGAATGGAAGCCTGGCCGAGAGAGAGATCATTATCCGGAGCGAGAACCTGACCAATAACGTGAAGACC
R7:TCCAGGGCACGGCGGTTGTGCAGATCAGCTTTCCGGAACAGCCCCAGATGCCGAGCAGCTGCTGGTCCTTCAGGTACCGTTCGATGGCGA
F8:ACGACAAAATCTTCAACGGCACCGGACAGTGTCACAACGTGTCCACCGTGCAGTGCACCCATGGCATCAAGCCCGTCGTGTCCACCCAGC
R8:GCTGATCTCCTTGTCCCACTGCATCCAGGTCATGTTGTCCCAGATTTCCTGTTGGCTCTTGTTAGACCAGCTGGAGTTCCAGGGCACGGC
F9:GCCCCAAGGTGACCTTCGACCCTATTCCCATCCACTACTGCACCCCCGCCGGCTACGCCATCCTGAAGTGCAACGACAAAATCTTCAACG
R9:GCAGGTCCTTCTCATTCCGCTCCTGTTGGTTCTGGCTGTCCTCGAGCAGTCTGTAGATGGTGTTGGTGTAGTTGCTGATCTCCTTGTCCC
F10:ACGAGAACAGCGGCAAGAACTCCAGCGAGTACTATCGGCTGATCAACTGCAACACCAGCGCCATCACCCAGGCCTGCCCCAAGGTGACCT
R10:AGATTTTAATGTACCACAGCCAGTTAGTGATGTCAAACCAGCTCCACAGGTTCTTCCAGCTGTCCAGGGCGAGCAGGTCCTTCTCATTCC
F11:CCACCACACTGCTCAGAGACCGGAAGAAAACCGTGTACGCCCTGTTCTACAGACTGGACATTGCTCCCCTGAACGACGAGAACAGCGGCA
R11:ACTCTGTTCACGATGCTCAGCACGGCGAAGATAATCCTGCTTCCGATCAGCCCGCCCACGATCATAATGAAGATTTTAATGTACCACAGC
F12:TCCAACGGCAACGGCACACGGAACGAGACCTACAACGAGAGCGTGAAGGAGGTGAAGAACTGCAGCTTCAACGCCACCACACTGCTCAGA
R12:TGCCCAGTCTGCCAGGTCCGCCGGGGTTAGGGGTGGGGATCTGGAAGCTCAGTGGGGAGTAGCCCTGCCGCACTCTGTTCACGATGCTCA
F13:CCTGTGGGACCAGAGCCTGAAGCCCTGCGTGAAGCTGACCCCCCTGTGCGTGACCCTGGAATGTCGGAACGTGAGCTCCAACGGCAACGG
R13:AGGCCAGGGCCAGGAAGCCGTTCACCAGCCTGATGCTCCGGGTCTTGTCCTGTTCGCCTCCCTCTTCCTCGATTCTGCCCAGTCTGCCAG
F14:ATGGAGAACGTGACCGAGAATTTCAACATGTGGAATAACGACATGGTGAACCAGATGCACGAGGACGTGATCAGCCTGTGGGACCAGAGC
R14:ACTCCCCTAGCAGTCAGGAGGATGAAGTCGCTCAGTCTGTGGTAGCTGAACAGGCACAGGTTCCGCAGATCGTCCCAGGCCAGGGCCAGG
F15:CGAGACCGAGGTGCACAACGTCTGGGCCACCCATGCCTGCGTGCCAACCGACCCTAACCCACAGGAGATCGTGATGGAGAACGTGACCGA
R15:AGGTTGCCCAGGTACTTCAGAGCTTCCCATCCCCGCTGCAGGCCCCTCAGAGAGTTTCTCCCGAGCAGCTCCACTCCCCTAGCAGTCAGG
F16:ACCGTCTACTATGGCGTGCCCGTCTGGAAGGAGGCCAAGACCACACTGTTCTGTGCCAGCGACGCTAAGGCCTACGAGACCGAGGTGCAC
R16:GCGACCACGATGGCGATGGTGTCCACCAGGGAGATTGTGCTTTTCTTCAGCTCCAGGCCCCAGTACTGCACCAGGTTGCCCAGGTACTTC
F17:CAGTGGTGGATCTGGGGCGTGCTGGGCTTCTGGATGCTGATGATCTGCAACGTGGAGGGCAACCTGTGGGTGACCGTCTACTATGGCGTG
R17:TCTGATCCTTCTAGGCACGTTGTGGATGGCCCGGCAAATTCCCTGCACGATGTTAATGATTCTATCGGTGCCCTCGGCGACCACGATGGC
F18:ATGAGAGTGAGGGGCACCAGACGGAACTACCAACAGTGGTGGATCTGGGG
R18:TCACTGCAGAGCGGCCTCCAGTCCCTGTCTGATCCTTCTAGGCACG
1.F代表正向引物,R代表反向引物;
2.下划线__部分为引物与模板互补部分;
3.部分为引入的新限制性核酸内切酶(RE)位点Xba I,为引入的新RE位点BamH I;
4.基因合成的原理及过程:
本合成HIV基因采用聚合酶链式反应法,即PCR法。PCR法是用一对与模板DNA互补的单链寡聚DNA作为引物,通过“加温变性-退火-延伸”这一周期的多次循环,使与引物互补的模板DNA引物之间的区段得到扩增。扩增的产物应该包括引物序列,如果在引物的末端含有一段非互补的序列,它们也能够被包含在扩增的产物序列中。因此,可以利用这种原理在一段DNA的两端按照合成引物的序列延长该DNA片段,经过多轮PCR即可达到合成HIV基因之目的。
第一轮PCR的目的是合成该基因中间的一段DNA序列,所以设计合成一对引物F1和R1,F1为正向引物,R1为反向引物,F1与所要合成的基因的中间部分的有义链序列一致,R1与所要合成的基因的中间部分的反义链序列一致,且它们的3’端互补(见引物序列的下划线处),因此,第一轮PCR不需要加入模板,只需要加入Taq酶缓冲液、4种dNTP、引物F1、引物R1、Taq酶,补加水至一定体积,按照PCR的“加温变性-退火-延伸”的程序进行多次循环。
第二轮PCR以第一轮PCR产物为模板,引物为F2和R2,F2将使扩增产物向5’端延长,R2将使扩增产物向3’端延长,该轮PCR产物为F2与R2之间的区段。
第三轮PCR以第二轮PCR产物为模板,引物为F3和R3,其余操作过程与第二轮PCR相同。以后与此类同,经过29轮PCR可合成GPCINS基因;经过18轮PCR可合成ENVINS基因。
2.3抗原修饰的结果
合成的全新gagpol(GPCINS)和env(ENVINS)基因序列如下:
GPCINS基因序列如SEQ ID NO:2
ENVCINS基因序列如SEQ ID NO:3
我们对gagpol修饰前后的核苷酸序列进行了比较,为了增加gagpol抗原的表达水平,修饰前后核苷酸序列变化较大,但核苷酸长度没有变化,为4280bp。合成后我们用FseI限制性内切酶切去了整合酶3’端531个碱基对,新的gagpol核苷酸长度为3730bp,从1至3730个碱基对中修饰后碱基变化个数为994,突变率为26.6%。
同时,我们对env修饰前后的核苷酸序列进行了比较,为了增加env抗原的表达水平,修饰前后核苷酸序列变化较大,但核苷酸长度没有变化,为2577bp,修饰后碱基变化数量为692个,突变率为26.9%,env读码框架没有改变。
基因修饰前后Gag、Env氨基酸序列与野生型完全一致。
我们对pol基因中的protease蛋白酶活性中心进行了失活突变(Pol第336位天门冬氨酸突变为组氨酸),目的是使protease失去活性,从而也消除了逆转录酶保持活性的可能性。另外,由于我们用FseI限制性内切酶切去了整合酶3’端531个碱基对,从而使整合酶完全失去活性,同时,由于修饰后整合酶基因所表达的蛋白与HIV-1病毒整合酶基因所表达的蛋白有较大的区别,这一点也可以用来区分该疫苗在人体内引起的免疫反应与HIV-1病毒感染引起的免疫反应的不同。
实施例2核酸疫苗的构建
1、表达载体的选择
1.1概述。
本DNA疫苗D-GPEi的载体(VR)的构建借鉴了Vical公司开发的VR1012载体的多克隆位点(包括XbaI和BamHI等)以及CMV启动子、卡那霉素抗性基因、原核细胞高拷贝因子、内含子A和BGH PolyA翻译终止信号等常规部件。VR1012是美国FDA正式批准的可以用于人体基因疫苗临床试验的载体,已经完成的临床试验表明其在人体的应用是安全的。
本DNA疫苗的构建思路是:以VR1012为模板,复制了包括CMV启动子、IntronA和BGH polyA信号,然后利用合适的酶切位点把此表达框架再克隆回VR1012。因此,新质粒由两个CMV启动子,一个卡那霉素抗性基因,一个原核细胞高拷贝因子,两个IntronA和两个BGH polyA信号等部件组成。新质粒所有部件均符合美国FDA有关人体临床试验的安全标准,并具有稳定和高效表达外源基因等特点。
2、质粒D-GPEi的构建
2.1质粒构建的主要材料和方法如下:
2.1.1试剂:限制性内切酶购于NEW ENGLAND BIOLABS,INC.32 TozerRoad,Beveerly,MA 01915-5599 USA;
琼脂糖Invitrogen Life Technologies公司1600 Faraday Avenue,PO Box 6482,Carlsbed,California 92008,USA;
TAE电泳缓冲液:0.04mol/L Tris-乙酸Invitrogen Life Technologies公司
0.001mol/L EDTA,pH8.0 Invitrogen Life Technologies公司
EB染料 Invitrogen Life Technologies公司
T4 DNA连接酶和限制性内切酶购于NEW ENGLAND BIOLABS INC;
QIAquick胶回收试剂盒购于QIAGEN Inc.,28159 Avenue Stanford,Valencia,CA91355,USA;
LB液体培养基:
细菌培养用胰化蛋白胨 10g Invitrogen Life Technologies公司
细菌培养用酵母提取物 5g Invitrogen Life Technologies公司
NaCl 5g Invitrogen Life Technologies公司
加水至1升,调pH值至7.0,高压灭菌。
LB固体培养基.
细菌培养用胰化蛋白胨 10g Invitrogen Life Technologies公司
细菌培养用酵母提取物 5g Invitrogen Life Technologies公司
NaCl 5g Invitrogen Life Technologies公司
琼脂 15g Invitrogen Life Technologies公司
加水至1升,调pH值至7.0,高压灭菌,加入适当抗生素,铺平板。
0.1M CaCl2溶液高压灭菌 Invitrogen Life Technologies公司
抗生素 Invitrogen Life Technologies公司
E.coli DH5α Invitrogen Life Technologies公司
质粒提取:QIAGEN Plasmid Maxi kit QIAGEN Inc.公司
2.1.2方法:
①酶切实验按下述方法设立酶切反应体系,即将1μg DNA加入到无菌微量离心管中,加入10×限制性内切酶缓冲液5μl,加入限制性内切酶10units,加水至50ul,按酶切反应温度反应1小时,然后琼脂糖电泳检查酶切反应结果。
②连接实验用适当的限制性内切酶消化质粒和外源DNA,利用QIAGEN的QIAquick胶回收试剂盒回收载体和外源DNA片断,测定其DNA含量,建立连接反应体系,将50ng载体DNA加入到无菌微量离心管中,加入4倍摩尔量的外源DNA片断,加入10×T4 DNA连接酶缓冲液2μl,加入400units T4 DNA连接酶,补水至20μl,16℃反应3小时。
③细菌转化实验挑取一个单菌落接种于50ml LB液体培养基中,37℃下以250rpm震荡过夜培养。取4ml过夜培养物接种于400ml LB液体培养基中,37℃以250rpm震荡培养至OD590为0.375。将培养基分装到8个50ml预冷的无菌聚丙烯离心筒中,冰浴10分钟,4℃下1600g离心7分钟沉淀菌体,弃去上清,用10ml预冷CaCl2溶液重悬菌体沉淀,4℃下1100g离心5分钟沉淀菌体,弃去上清,用10ml预冷CaCl2溶液重悬菌体沉淀,冰浴30分钟,4℃下1100g离心5分钟沉淀菌体。用2ml预冷CaCl2溶液重悬菌体沉淀,分装成每管100ul菌体溶液,即为感受态细胞。在感受态细胞中加入一定量DNA,混匀,冰浴10分钟,然后将感受态细胞于42℃水浴加热45秒,冰浴2分钟,加入900ulLB培养基,37℃震荡培养1小时。将菌液均匀涂布于抗性LB平板上,37℃培养12至16小时。
④菌种扩增将菌体平板划线于LB固体培养基上,37℃培养,挑取单克隆菌落,加LB培养基振荡培养过夜,第二天在新的培养基中加入1%体积的过夜培养菌液,继续培养至适当菌体浓度即可。
⑤质粒提取方法参照试剂盒中说明书。将500ml培养物到入离心筒中,于4℃以6000g离心15分钟,弃去培养基,将沉淀菌体重悬于10ml BufferP1中,加入10ml BufferP2,温和颠倒离心管5次,彻底混合溶液,室温放置5分钟。加入10ml预冷的Buffer P3,立即温和颠倒离心管5次,彻底混合溶液,冰浴20分钟。4℃下20000g离心30分钟,取上清重新离心15分钟。在QIAGEN-tip 500柱加10ml Buffer QBT,放置滤过溶液,平衡膜。将上清转移至柱中,放置滤过溶液,加入30ml Buffer QC,放置滤过溶液,重复用30mlBuffer QC洗膜。加入15ml Buffer QF,静置,滤液即为所提DNA溶液。滤液加入10.5ml异丙醇,混匀。4℃下15000g离心30分钟,弃去上清,用5ml 70%乙醇洗涤沉淀,15000g离心10分钟,在空气中干燥沉淀10分钟,DNA沉淀溶解于适当体积水中。
⑥琼脂糖电泳分析根据所要电泳的DNA分子量大小配制相应浓度的琼脂糖凝胶,在TAE电泳缓冲液中加入适量的琼脂糖,加热至琼脂糖溶解,使溶液冷却至60℃,加入EB至终浓度为0.5μg/ml,充分混匀,将溶液倒入胶模中,待凝胶完全凝固后,小心移去梳子,将凝胶放入电泳槽中,加入足量的电泳缓冲液。DNA样品与加样缓冲液混匀后,加入样品槽中,盖上电泳槽并通电,使DNA向阳极移动,采用5V/cm的电压降,电泳至溴酚蓝迁移至适当距离,切断电流,在紫外灯下检查凝胶中的DNA条带,并根据DNA分子量标准判断其大小。
2.2构建步骤
见图2,首先利用VR载体上XbaI和BamHI位点把合成的gagpol基因(GPCINS)克隆到上述载体上,形成VR-GPCINS;利用VR载体上BamHI位点把合成的env基因(ENVCINS)克隆到上述载体上,形成VR-ENVCINS。
用VR载体作为模板利用PCR扩增BGH翻译终止信号片段,并使该片段5`端带有BglII位点,3`端依次带有MluI和BamHI(上游引物为:5`-AGATCTCACGTGGAATTCGCTGTGCCTTCTAGTTGCCAG-3`;下游引物为:5`-GGATCCACGCGTGCTAGCGGCCGCCATAGAGCCCACCGCATCC-3`)。由于BglII和BamHI含有相同的粘性末端,因此可利用VR-GPCINS的BamHI位点把BGH翻译终止信号片段克隆到VR-GPCINS上形成VR-GPCINS-BGH-BGH质粒,在两个BGH片段之间带有MluI位点。
以VR-ENVCINS为模板利用PCR扩增env基因(ENVCINS)表达框架,该片段包括CMV启动子、intronA和env基因(ENVCINS),该PCR产物5`端和3`端都带有AscI位点(上游引物5`-GGCGCGCCGTTGACATTGATTATTGACT-3`;下游引物5`-GGCGCGCCTCACTGCAGAGCGGCCTC-3`)。
由于AscI和MluI有相同的粘性末端,因此可利用VR-GPCINS-BGH-BGH质粒上的MluI位点把env基因(ENVCINS)表达框架克隆到VR-GPCINS-BGH-BGH质粒上形成D-GPEi。
2.3构建结果
我们构建的艾滋病核酸疫苗D-GPEi能在人细胞中高效表达HIV-1核心结构蛋白Gag、GagPol和外壳蛋白Env,全长13KB。D-GPEi质粒的骨架主要含有三部分:(1)真核细胞表达单位,包括CMV启动子,多酶切位点和BGH转录终止信号;(2)原核启动子驱动的抗卡那霉素基因(在真核细胞内没有功能);(3)大肠杆菌复制子,此用于扩增DNA质粒所用,在哺乳动物中不表达。
D-GPEi含有的抗原基因是经过修饰的HIV-1中国流行株的gagpol和env,该DNA质粒转录2个RNA产物用于表达HIV-1的结构蛋白Gag,GagPol和Env。
我们已经对D-GPEi进行了全序列测定,其含有13113bp,碱基组成份为adenines:24.81%;thymidines:20.15%;guanines:27.19%;cytosines:27.85%。该DNA可溶解在生理盐水中,浓度可达2mg/ml。
2.4 D-GPEi基因序列与人基因组基因序列同源性分析
在人基因组数据库中,用D-GPEi基因序列(共13113bp)与人基因组(共2826392627bp)进行了同源序列比较,没有发现有相似性。比较结果如下。这一结果从理论上消除了D-GPEi与人基因组发生高几率重组的可能性。
3、质粒D-GPEi质粒的全序列测定。
以3700DNA序列自动分析仪对D-GPEi进行全序列测定,测序结果SEQ ID NO:1
我们采用DNA序列分析软件VectorNTI对上述序列进行分析,结果表明,测定序列与理论序列一致。抗原基因Gag、Pol和Env读码框架如下所示,氨基酸序列完全正确。
Gag氨基酸序列如下:SEQ ID NO:4
Pol氨基酸序列如下:SEQ ID NO:5
Env氨基酸序列如下:SEQ ID NO:6
根据以上测序结果及氨基酸分析,证实了插入基因和表达框架的正确性。
实施例3重组痘苗M-GPE的构建
1.1说明
用于构建重组痘苗所用的gagpol基因与构建核酸疫苗的gagpol基因来源和序列完全相同,为修饰过的gagpol基因。另外,在购建重组痘苗工程病毒过程中,我们也对穿梭质粒pSC11-GPE的插入序列进行了全序列测定,结果表明用于构建重组痘苗所用的gagpol基因与构建核酸疫苗的gagpol基因来源和序列完全相同,因此,其编码抗原蛋白的氨基酸序列也完全相同。
用于构建重组痘苗所用的的env基因与构建核酸疫苗的env基因在基因序列上不同。构建核酸疫苗的env基因为修饰过的基因,构建重组痘苗M-GPE的env基因为野生型env基因,其来源为HIV-1中国流行株,B/C重组亚型,在购建重组痘苗工程病毒过程中,我们对穿梭质粒pSC11-GPE的插入序列进行了全序列测定,其中包括野生型env基因序列,我们对env基因修饰前后所编码蛋白的氨基酸序列进行了比较,氨基酸序列没有发生任何变化,其作为抗原的免疫原性也应完全一致,
1.2 MVA的来源和历史
修饰的痘病毒Ankara株(Modified Vaccinia Virus Ankara,MVA)为人体内复制缺陷型痘病毒。它是德国Mayr研究小组于1975年为改进常规天花疫苗,使其减少常规天花疫苗的副作用而专门研制的一种新型天花疫苗。
1.3重组痘苗M-GPE的构建
上述HIV-1中国流行株(区域性)的gagpol和env基因被克隆到中间质粒pSC11中,构成pSC11-GPE。如图3所示:pSC11-GPE质粒中,位于同源臂TK-R和TK-L中,分别有两个阅读框架:启动子P11引导的Lac Z基因和启动子P7.5引导的HIV-1-GagPol和Env。
重组穿梭质粒PSC11-GPE全序列如SEQ ID NO:9
在构建M-GPE时,首先以滴度0.05pfu/cell的MVA感染CEF细胞。感染2小时后,利用Lipofection2000(INVITROGEN产品)的方法将pSC11-GPE转化到感染了MVA细胞的CEF细胞中。MVA在CEF细胞内复制的过程中,由于pSC11-GPE具有与MVA的TK基因同源的TK-R和TK-L,所以有一定比例的MVA病毒基因组与pSC11-GPE发生重组,结果HIV-1-Gag-Pol-Env和Lac Z阅读框架被重组到MVA病毒基因组中。形成如图4所示的M-GPE重组病毒。
以上被感染细胞培养三天后,收集细胞,裂解细胞,离心除细胞残渣,超声波处理,离心保留上清。取一定量上清,作为种毒,在96孔板中对病毒以有限稀释法进行克隆。培养三天后,将培养液换成含X-gal的不含酚红的培养液。培养24小时后,显微镜下观察Lac Z染色情况。挑取稀释度高,Lac Z染色好的克隆进行下一代克隆。如此进行6次以上克隆。最后直至得到只含重组病毒M-GPE的克隆株。
我们比较Gag、Pol和Env氨基酸序列的测定序列与理论序列,没有发现任何突变或插入基因,表达框架正确,没有出现错位。
实施例4、核酸疫苗和重组痘苗联合使用的免疫原性研究
免疫原性研究采用了ELISPOT、ICC和CTL等试验,具体试验方法如下:
1、免疫小鼠:给5只一组的Balb/c小鼠分别在0,2,4周肌肉注射(100μg/小鼠/次)核酸疫苗或空白对照,然后在第六周用M-GPE(5×107pfu/小鼠,腹腔注射)进行增强免疫。增强免疫5天后,取出小鼠脾脏,分离脾细胞,然后把每组内的5只小鼠的脾细胞混合,分别用于ELISPOT,ICC和CTL检测。
2 INF-γELISPOT检测:
2.1实验目的:检测被HIV-1的核酸疫苗和重组痘苗联合免疫后的Balb/c小鼠在体内产生的与CD8阳性T淋巴细胞相关的,对HIV-1 P24抗原的特异性细胞免疫反应强度。
2.2实验原理:Balb/c小鼠被含有HIV-1 P24抗原的核酸疫苗和重组痘苗联合免疫后,如果疫苗免疫成功,将使小鼠淋巴细胞产生对HIV-1相关抗原(如P24)的记忆。用P24中MHC class-I抗原决定簇小肽(AMQMLKETI,对Balb/c小鼠具有特异性)刺激被免疫小鼠脾细胞,应使其分泌细胞因子(如INF-γ),从而反应出疫苗诱导的与CD8阳性T淋巴细胞相关的,对HIV-1 P24抗原的特异性细胞免疫反应。因此通过测定被免疫小鼠100万个脾细胞中能分泌INF-γ的淋巴细胞的数量,可以用于表示特异性细胞免疫反应强度。
2.3实验仪器、材料:96孔板(96well filtration plate,Millipore产品),抗鼠INF-γ抗体(Pharmingen),RPMI1640细胞培养液,小牛血清,PBS,生物素标记的抗鼠INF-γ抗体(Pharmingen),avidin标记碱性磷酸酶(Sigma),BCIP-nitroblue tetrazolium溶液(Sigma),实体显微镜,P24中MHC class-I抗原决定簇小肽(AMQMLKETI,对Balb/c小鼠具有特异性),二氧化碳培养箱。
2.4实验步骤:
①96孔板包被:在96孔板中每孔加入浓度为10μg/ml的抗鼠INF-γ抗体PBS溶液,4℃过夜,弃去抗体溶液,用含有10%小牛血清的RPMI1640细胞培养液在37℃下封闭2小时,然后用PBS冲洗五次以上,备用。
②计数每组试验小鼠的脾细胞。
③把每组小鼠的脾细胞进行稀释,即把细胞浓度为1000万小鼠脾细胞/ml的细胞溶液分别进行3倍系列稀释,制成每毫升细胞培养液中分别含有1/3、1/9、1/27×1000万小鼠脾细胞的细胞溶液。在上述包被好的96孔板中,每孔加入各组不同稀释度的小鼠脾细胞溶液100μl,每个稀释度的样品分别加入到2个孔中,作为实验组和对照组。实验组样品中再加入100μl P24 MHC class-I抗原决定簇小肽溶液(2μg/ml细胞培养液),对照组加入100μl细胞培养液,混匀后放入37℃二氧化碳培养箱保温24小时。
④取出96孔板,用含有0.025%Tween-20的PBS溶液洗五次。
⑤每孔中加入50μl生物素标记的抗鼠INF-γ抗体(5μg抗体/ml PBS),室温下放置2小时。
⑥用含有0.025%Tween-20的PBS溶液洗五次96孔板。
⑦每孔中加入50μl avidin标记碱性磷酸酶(1.25μg酶联抗体/ml PBS),室温下放置2小时。
⑧用含有0.025%Tween-20的PBS溶液洗五次96孔板,最后用PBS洗一次。
⑨每孔中加入碱性磷酸酶底物显色剂BCIP-nitroblue tetrazolium溶液,并在显微镜下观察斑点并计数。
⑩根据统计的斑点数计算出100万个被免疫小鼠的脾细胞中能特异性分泌INF-γ的淋巴细胞的比例。
3 ICC检测(Intracellular cytokine staining and flow cytometry analysis)
3.1实验目的:检测被HIV-1的核酸疫苗和重组痘苗联合免疫后的Balb/c小鼠在体内产生的与CD8阳性T淋巴细胞相关的,对HIV-1 P24抗原的特异性细胞免疫反应强度。
3.2实验原理:Balb/c小鼠被含有HIV-1 P24抗原的核酸疫苗和重组痘苗联合免疫后,如果疫苗免疫成功,将使小鼠淋巴细胞产生对HIV-1相关抗原(如P24)的记忆。用P24中MHC class-I抗原决定簇小肽(AMQMLKETI,对Balb/c小鼠具有特异性)刺激被免疫小鼠脾细胞,应使其分泌细胞因子(如INF-γ),从而反应出疫苗诱导的与CD8阳性T淋巴细胞相关的,对HIV-1 P24抗原的特异性细胞免疫反应。这里用抗CD8抗体和抗INF-γ抗体分别对各组小鼠脾细胞进行免疫染色,然后用流式细胞仪分析INF-γ阳性细胞占CD8阳性淋巴细胞的比例,来表示特异性细胞免疫反应强度。
3.3实验仪器、材料:流式细胞仪(Becton Dickinson)、Cyotofix/Cytoperm with Golgistop(Pharmingen)、藻红蛋白(phycoerythrin)偶联抗鼠CD8抗体(Pharmingen)、FITC偶联抗INF-γ抗体(Pharmingen)、P24中MHC class-I抗原决定簇小肽(AMQMLKETI,对Balb/c小鼠具有特异性)、Perm/Wash Buffer(Pharmingen)、染色缓冲液(SB:1%小牛血清PBS溶液)
3.4实验方法:
①把上述制备好的各组实验小鼠脾细胞分别加入24孔板中,使每孔细胞数量为2×106细胞/100μl,每个实验组小鼠的脾细胞加入2个孔中,分别作为对照组和实验组。
②在实验组脾细胞内每孔分别加入892.4μl RPMI1640(10%小牛血清)细胞培养液,6.6μl Golgistop溶液(1/10稀释),1μl P24中MHC class-I抗原决定簇小肽(1μg/μl),使最终体积达到1ml。
③在对照组脾细胞内每孔分别加入893.4μl RPMI1640(10%小牛血清)细胞培养液,6.6μl Golgistop溶液(1/10稀释),使最终体积达到1ml。
④混匀,37℃二氧化碳培养箱保温过夜。
⑤把保温过夜的细胞转移到不同的1.5ml Eppendorf管中,注意尽可能转移所有细胞,1200转4℃离心5分钟,除去上清。用染色缓冲液洗两次,进行下面的免疫染色实验。
⑥按Cyotofix/Cytoperm with Golgistop Kit说明进行免疫染色,并设置合适的空白对照。即在所有实验管中加入100μl藻红蛋白(phycoerythrin)偶联抗鼠CD8抗体(用染色缓冲液1000倍稀释),4℃下暗处保温30分钟。
⑦用染色缓冲液4℃下洗两次,然后在细胞中加入250μl Cyotofix/Cytoperm 4℃下保温20分钟。
⑧用1×Perm/Wash缓冲液洗两次细胞,在所有实验管中加入50μl FITC偶联抗INF-γ抗体(用Perm/Wash缓冲液50倍稀释),4℃下保温30分钟。
⑨用1×Perm/Wash缓冲液洗两次细胞,用250μl染色缓冲液悬浮细胞,把细胞溶液转移到5ml polystyrene圆底样品管中,注意尽量转移所有细胞。
⑩用流式细胞仪对样品进行测试和分析。
4 CTL检测
4.1实验目的:检测被HIV-1的核酸疫苗和重组痘苗联合免疫后的Balb/c小鼠在体内产生的与CD8阳性T淋巴细胞相关的特异性CTL反应。
4.2实验原理:Balb/c小鼠被含有HIV-1 P24抗原的核酸疫苗和重组痘苗联合免疫后,如果疫苗免疫成功,小鼠CD8阳性T淋巴细胞将对表面带有HIV-1抗原决定簇小肽的靶细胞具有细胞毒杀伤作用。这里我们分离被免疫小鼠的脾细胞,并用P24抗原肽标记的小鼠细胞株P815作为靶细胞,按一定比例混合上述脾细胞和靶细胞,测定靶细胞P815被裂解的比例,用来表征该疫苗在小鼠体内诱导的特异性CTL反应强度。
4.3实验仪器、材料:RPMI1640细胞培养液,phenol red-free RPMI1640细胞培养液、小牛血清,PBS,淋巴细胞分离液Ficoll-Hypaque(Pharmacia)、红细胞裂解液、P24 MHCclass-I抗原决定簇小肽(AMQMLKETI,对Balb/c小鼠具有特异性)、P815细胞株、Cytotox96 assay kit(Promega)、圆底96孔板、离心机、酶标仪
4.4实验步骤:
(1)靶细胞P815的制备:在含有15%小牛血清的DMEM细胞培养液中培养细胞P815细胞,使细胞浓度为107细胞/ml。在该P815细胞溶液中加入P24 MHC class-I抗原决定簇小肽,使其浓度为10μg/ml,37℃保温1小时。然后用3%小牛血清的RPMI1640细胞培养液(phenol red-free)洗3次细胞,并用相同的培养液悬浮细胞,使细胞浓度在105细胞/ml。
(2)从被免疫的小鼠(重组痘苗免疫五天后)脾细胞中,用淋巴细胞分离液Ficoll-Hypaque分离淋巴细胞,并计数。
(3)在含有3%小牛血清的RPMI1640细胞培养液(phenol red-free)中悬浮淋巴细胞,使细胞浓度在107细胞/ml。
(4)按Cytotox 96LDH Kit说明书进行CTL检测,并设置合适的空白对照和阳性对照。即在圆底96孔板中分别加入不同稀释度的各组实验小鼠淋巴细胞(106,3.3×105,1×105,3.3×104/100μl),每个稀释度样品加入六个孔中,其中三个孔(三个平行样)为实验组,三个孔为淋巴细胞自裂解对照组。
(5)在实验组中加入上述100μl P815靶细胞,在对照组中加入100μl 3%小牛血清的RPMI1640细胞培养液(phenol red-free)。
(6)其他各种对照包括:
1)靶细胞自裂解对照:在每个孔中加入100μl靶细胞和100μl 3%小牛血清的RPMI1640细胞培养液(phenol red-free),做六个平行样。
2)靶细胞最大裂解对照:在每个孔中加入100μl靶细胞和100μl 3%小牛血清的RPMI1640细胞培养液(phenol red-free),做六个平行样(以后将加入细胞裂解液)。
3)体积校正对照:加入200μl 3%小牛血清的RPMI1640细胞培养液(phenol red-free),做六个平行样。
4)细胞培养液背景对照:加入200μl 3%小牛血清的RPMI1640细胞培养液(phenolred-free),做六个平行样。
(7)把上述加好样品及对照的96孔板放入37℃二氧化碳培养箱保温5小时。在保温至4小时15分钟时,分别在靶细胞最大裂解对照组和体积校正对照组中加入10μl细胞裂解液(Cytotox 96LDH Kit提供)。
(8)保温5小时后,250g离心96孔板4分钟。在每孔中取出50μl上清按顺序转入新的平底96孔板中,用于下一步显色实验。
(9)按Cytotox 96LDH Kit配制LDH显色液:在每孔中加入50μl上述配制好的底物显色液,室温暗处放置30分钟。然后加入50μl终止缓冲液(Cytotox 96LDH Kit提供)。
(10)用酶标仪在490nm波长下读板。
(11)根据公式计算各淋巴细胞稀释度的靶细胞特异性裂解百分比:
靶细胞特异性裂解百分比=(实验组—淋巴细胞自裂解组—靶细胞自裂解组)/(靶细胞最大裂解—靶细胞自裂解)
(12)绘制靶细胞特异性裂解百分比~淋巴细胞稀释度的曲线,该曲线将反映出艾滋病疫苗在小鼠体内诱导的对HIV-1特异性CTL的情况。
5核酸疫苗D-GPEi和重组痘苗M-GPE免疫原性分析
为了调查该D-GPEi核酸疫苗和重组痘苗在小鼠体内的免疫反应,我们用不同的DNA质粒作为核酸疫苗分三次通过后腿肌肉注射来免疫小鼠,每次免疫时间间隔为2周,每次注射剂量为100μg/只,最后一次注射核酸疫苗2周后,再用M-GPE来增强免疫,5×107pfu/只,然后检测小鼠的体液免疫和细胞免疫反应。
图5是小鼠被免疫后的体液免疫反应。从图中可以看出(1)修饰型的gagpo核酸疫苗可在小鼠体内引起较强的体液免疫反应,而野生型的gagpol的核酸疫苗所引起的抗体反应非常弱;(2)虽然env基因被修饰后可在细胞内高效表达,但只含修饰的env基因(gpl60)的核酸疫苗难以在动物体内引起免疫反应;(3)同时含有修饰型的gagpol和修饰型env基因的核酸疫苗在小鼠体内产生了较强的对Gag和Env的抗体反应,而野生型的env基因即使与gagpol共表达也难以在小鼠体内产生对Env的抗体反应;(4)特别在M-GPE增强免疫后,抗体反应大大提高。
ELISPOT,CTL和ICC被用于检测联合疫苗在BALB/C小鼠诱导的细胞免疫反应。HIV-1P24上的肽AMQMLKETI被用于上述测定。在小鼠被M-GPE增强免疫后第5天,解剖小鼠,取出脾脏,分离脾细胞用于ELISPOT和ICC测定;从脾细胞中进一步分离淋巴细胞用于CTL测定。这里我们选用第1组(空白),第3组(野生型gagpol)和第5组(D-GPEi)小鼠作为实验对象,分别测定了这三组小鼠对小肽AMQMLKETI特定的细胞免疫反应。
图6,图7用不同的实验,从不同的方面检测了被联合疫苗免疫的小鼠对HIV-1抗原(这里只包括小肽AMQMLKETI)的特异性细胞免疫反应。(1)实验动物被核酸疫苗D-GPEi初次免疫和M-GPE增强免疫后,再用ELISPOT或ICC测定其细胞免疫强度时,只有用小肽AMQMLKETI刺激淋巴细胞后细胞因子才大量分泌,这说明其诱导的细胞免疫反应具有针对HIV-1抗原的特异性;(2)图8显示了CD8淋巴细胞对包被有HIV-1抗原肽的靶细胞具有特异性的杀伤作用,这一结果最直接地反映了该疫苗在实验动物上的功效;(3)这里我们用了三组实验小鼠:空白,野生型gagpol表达质粒和修饰型D-GPEi,即使用同一种抗原(M-GPE)进行增强免疫,其产生的二次细胞免疫反应的强度大大不同,这说明只有修饰型D-GPEi核酸疫苗才能很好地刺激实验动物的免疫系统产生初次免疫,而这种初次免疫对利用增强免疫来提高总体免疫效果至关重要。
从上述结果得出结论:我们构建的艾滋病核酸疫苗与重组痘苗联合使用在小鼠模型中能产生对HIV-1中国流行株较强的体液和细胞免疫反应。
实施例5、核酸疫苗和重组痘苗联合使用在非人灵掌类动物中的免疫原性研究
为进一步研究核酸疫苗在非人灵掌类动物中的免疫原性,这里我们以猴子作为动物模型(中国广西壮族自治区疾病预防与控制中心提供,恒河猴),10只猴子分为3组,具体分组见下边的“猴子分组表”(第一组:A、B空白对照;第二组C、D、E、F野生型gagpol质粒;第三组G、H、I、J修饰型D-GPEi质粒),各组猴子分别在0天、15天和30天注射生理盐水2ml或不同种类核酸疫苗(2mg/猴子/次),第6周用生理盐水(空白对照)或M-GPE增强免疫(109pfu/猴子)。分别在增强免疫后15天、90天和180天静脉取血,分离淋巴细胞,用ELISPOT测定在用小肽刺激后100万淋巴细胞中能分泌INF-γ的细胞的数量,C亚型HIV-1 Gag蛋白肽库被用于上述测定。
图9用ELISPOT检测了被上述疫苗免疫的猴子对HIV-1抗原的特异性细胞免疫反应。实验结果表明:(1)修饰型的gagpol疫苗可在猴子体内引起较强的细胞免疫反应,而野生型的GagPol的疫苗所引起的细胞免疫反应较弱;(2)100%的实验动物都产生了对HIV-1抗原的特异性细胞免疫反应,其中75%的实验动物细胞免疫反应较强;(3)动物被核酸疫苗D-GPEi初次免疫和M-GPE增强免疫后,只有用小肽刺激淋巴细胞后细胞因子才大量分泌,这说明其诱导的细胞免疫反应具有针对HIV-1抗原的特异性;(4)M-GPE增强免疫3个月内,细胞免疫反应强度没有下降,6个月后有一定幅度下降。
从上述结果得出结论:我们构建的艾滋病核酸疫苗与重组痘苗在非人灵掌类动物模型中能产生对HIV-1中国流行株较强的体液和细胞免疫反应。
实施例6药物组合物
核酸疫苗:质粒D-GPEi与生理盐水的重量体积比为:1mg/ml,每次注射2ml,注射3次,痘病毒载体疫苗:M-GPE与生理盐水的滴度体积比为:1011pfu/ml,每次注射0.1ml,注射1次。分别于0、1、2、3月注射核酸疫苗、核酸疫苗、核酸疫苗、痘病毒载体疫苗。
实施例7药物组合物
核酸疫苗:质粒D-GPEi与生理盐水的重量体积比为:2mg/ml,每次注射2ml,注射3次,痘病毒载体疫苗:M-GPE与生理盐水的滴度体积比为:109pfu/ml,每次注射0.1ml,注射1次。分别于0、1、2、3月注射核酸疫苗、核酸疫苗、核酸疫苗、痘病毒载体疫苗。
实施例7药物组合物
核酸疫苗:质粒D-GPEi与生理盐水的重量体积比为:3mg/ml,每次注射2ml,注射3次,痘病毒载体疫苗:M-GPE与生理盐水的滴度体积比为:107pfu/ml,每次注射0.1ml,注射1次。分别于0、1、2、3月注射核酸疫苗、核酸疫苗、核酸疫苗、痘病毒载体疫苗。
猴子分组表 猴子编号 注射疫苗种类 淋巴细胞编号 取血时间 (最后一次免疫后天数) A 空白 生理盐水 1 15 2 90 3 180 B 空白 生理盐水 4 15 5 90 6 180 C 野生型 野生型GagPol 7 15 8 90 9 180 D 野生型 野生型GagPol 10 15 11 90 12 180 E 野生型 野生型GagPol 13 15 14 90 15 180 F 野生型 野生型GagPol 16 15 17 90 18 180 G 修饰型 D-GPEi 19 15 20 90 21 180 H 修饰型 D-GPEi 22 15 23 90 24 180 I 修饰型 D-GPEi 25 15 26 90 27 180 J 修饰型 D-GPEi 28 15 29 90 30 180
序列表
SEQ ID NO:1
TCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCG
GAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCG
TCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATG
CGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATA
CCGCACAGATGCGTAAGGAGAAAATACCGCATCAGATTGGCTATTGGCCA
TTGCATACGTTGTATCCATATCATAATATGTACATTTATATTGGCTCATG
TCCAACATTACCGCCATGTTGACATTGATTATTGACTAGTTATTAATAGT
AATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTT
ACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCG
CCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGA
CTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTG
GCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAA
TGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGG
ACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATG
GTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTC
ACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTT
GGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCA
TTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAG
AGCTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTT
TTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCGCGGCCGGGAA
CGGTGCATTGGAACGCGGATTCCCCGTGCCAAGAGTGACGTAAGTACCGC
CTATAGACTCTATAGGCACACCCCTTTGGCTCTTATGCATGCTATACTGT
TTTTGGCTTGGGGCCTATACACCCCCGCTTCCTTATGCTATAGGTGATGG
TATAGCTTAGCCTATAGGTGTGGGTTATTGACCATTATTGACCACTCCCC
TATTGGTGACGATACTTTCCATTACTAATCCATAACATGGCTCTTTGCCA
CAACTATCTCTATTGGCTATATGCCAATACTCTGTCCTTCAGAGACTGAC
ACGGACTCTGTATTTTTACAGGATGGGGTCCCATTTATTATTTACAAATT
CACATATACAACAACGCCGTCCCCCGTGCCCGCAGTTTTTATTAAACATA
GCGTGGGATCTCCACGCGAATCTCGGGTACGTGTTCCGGACATGGGCTCT
TCTCCGGTAGCGGCGGAGCTTCCACATCCGAGCCCTGGTCCCATGCCTCC
AGCGGCTCATGGTCGCTCGGCAGCTCCTTGCTCCTAACAGTGGAGGCCAG
ACTTAGGCACAGCACAATGCCCACCACCACCAGTGTGCCGCACAAGGCCG
TGGCGGTAGGGTATGTGTCTGAAAATGAGCGTGGAGATTGGGCTCGCACG
GCTGACGCAGATGGAAGACTTAAGGCAGCGGCAGAAGAAGATGCAGGCAG
CTGAGTTGTTGTATTCTGATAAGAGTCAGAGGTAACTCCCGTTGCGGTGC
TGTTAACGGTGGAGGGCAGTGTAGTCTGAGCAGTACTCGTTGCTGCCGCG
CGCGCCACCAGACATAATAGCTGACAGACTAACAGACTGTTCCTTTCCAT
GGGTCTTTTCTGCAGTCACCGTCGTCGACACGTGTGATCAGATATCGCGG
CCGCTCTAGAATGGGCGCCCGGGCCAGCATCCTGCGGGGAGGCAAGCTGG
ACAAATGGGAGAAGATCCGGCTGAGACCCGGAGGCAAGAAACACTACATG
CTGAAGCACCTGGTGTGGGCCAGCCGGGAGCTGGAAAGATTCGCCCTGAA
CCCCGGCCTCCTGGAGACCAGCGAAGGCTGCAAGCAGATCATTAAGCAGC
TGCAACCCGCCCTGCAGACCGGCACCGAGGAACTGCGGAGCCTGTTCAAC
ACCGTGGCCACCCTGTACTGCGTGCACGAGGAAATCGAGGTGCGGGACAC
CAAGGAGGCCCTGGACAAGATCGAGGAAGAGCAGAACAAGATCCAGCAAA
AGACCCAGCAGGCCAAGAAAGCCGACGAGAAGGTGAGCCAGAACTACCCC
ATCGTGCAGAACCCCCAGGGCCAGATGGTGCACCAGCCTCTGAGCCCCCG
GACCCTGAACGCCTGGGTGAAGGTCGTGGAGGAAAAGGCCTTCAGCCCCG
AGGTGATCCCTATGTTCACCGCCCTGAGCGAGGGCGCCACCCCCCAGGAC
CTGAACACCATGCTGAACACCGTGGGCGGGCACCAGGCTGCCATGCAGAT
GCTGAAGGACACCATCAACGAGGAAGCCGCTGAGTGGGACCGGCTGCACC
CCGTGCACGCCGGCCCCGTGGCCCCTGGCCAGATGCGGGAGCCCAGAGGC
AGCGACATCGCCGGCACCACATCCAGCCTGCAGGAGCAGATCGGCTGGAT
GACCAACAATCCTCCCATCCCAGTGGGCGAGATCTACAAGCGGTGGATTA
TCCTGGGCCTGAACAAGATCGTGCGGATGTACAGCCCCACCTCCATCCTG
GACATCAAGCAGGGCCCTAAGGAGCCCTTCCGGGACTACGTGGATAGATT
CTTTAAGACCCTGCGGGCCGAGCAGGCCACCCAGGACGTGAAGAACTGGA
TGACCGACACCCTGCTCGTGCAGAATGCCAACCCCGACTGCAAGACCATC
CTGCGGGCCCTGGGCAGCGGCGCCTCCCTGGAAGAGATGATGACCGCCTG
CCAGGGCGTGGGAGGCCCCAGCCACAAGGCCCGGGTGCTGGCTGAGGCCA
TGAGCCAGACCTCCAACACCATCCTGATGCAGCGGAGCAACTTCAAGGGC
AGCAAACGGATCGTGAAGTGCTTCAACTGTGGCAAGGAGGGCCACATCGC
CAAGAACTGCAGGGCCCCTAGGAAAAAAGGCTGTTGGAAATGTGGAAAGG
AAGGACACCAAATGAAAGACTGTACTGAAAGGCAGGCGAATTTTTTAGGG
AAATTTTGGCCTTCCCACAAGGGGAGGCCAGGGAATTTTCTCCAGAGCAG
ACCAGAGCCAACAGCCCCACCAGCAGAGAGCTTCAGGTTCGAGGAGACAA
CCCCAGCTCCGAAGCAGGAACCGAAAGACAGGGAACCCTTAACTTCCCTC
AGATCACTCTTTGGCAGCGACCCCTTGTCTCAATAAAAGTAGGGGGCCAG
ATAAAAGAGGCTCTCTTGGCCACCGGCGCCGATGACACCGTGCTGGAGGA
AGTGAACCTGCCCGGCAAGTGGAAGCCCAAGATGATCGGCGGGATCGGAG
GCTTCATCAAGGTGCGGCAGTACGAGCAGATCCCCATTGAGATCTGCGGC
AAGAAAGCCATCGGCACCGTGCTGGTGGGCCCCACCCCCGTGAACATCAT
TGGCCGGAACATGCTGACCCAGCTGGGCTGCACCCTGAACTTCCCCATCA
GCCCCATCGAGACCGTGCCCGTGAAGCTGAAGCCCGGCATGGACGGCCCC
AAGGTGAAGCAGTGGCCCCTGACCGAGGAAAAGATCAAGGCCCTGACCGC
CATCTGCGACGAGATGGAAAAGGAGGGCAAGATCACCAAGATCGGCCCCG
ACAACCCCTACAACACCCCCATCTTCGCCATCCGGAAGAAAGACAGCTCC
AAGTGGCGGAAGCTGGTGGACTTCCGGGAGCTGAACAAGCGGACCCAGGA
CTTCTGGGAGGTGCAGCTGGGCATCCCCCACCCCGCCGGCCTGAAGAAAA
AGAAAAGCGTGACCGTGCTGGACGTGGGCGACGCCTACTTCAGCGTGCCC
CTGGATAAGGACTTCCGGAAGTACACCGCCTTCACCATCCCCAGCGTGAA
CAATGAGACCCCCGGCATCCGGTACCAGTACAACGTGCTGCCCCAGGGCT
GGAAGGGCAGCCCCGCCATCTTCCAGTGCAGCATGACCAAGATCCTGGAG
CCCTTCCGGAAGCAGAACCCCGACATCGTGATCTACCAGTACATGCATGA
TCTGTACGTGGGCAGCGACCTGGAGATCGGCCAGCACCGGACCAAGATCG
AGGAACTGCGGGAGCACCTCCTGAAGTGGGGCTTCACCACACCCGACAAG
AAACACCAGAAGGAGCCTCCCTTCCTGTGGATGGGCTACGAGCTGCACCC
CGACAAGTGGACCGTGCAGCCCATCCAGCTGCCCGAGAAGGACAGCTGGA
CCGTGAACGACATCCAGAAGCTGGTGGGCAAGCTGAACTGGGCCAGCCAG
ATCTACCCCGGCATCAAGGTGCGGCAGCTGTGCAAGCTCCTGCGGGGCGC
CAAGGCCCTGACCGACATCGTGCCCCTGACCGAGGAAGCCGAGCTGGAAC
TGGCCGAGAACCGGGAGATCCTGAAGGAGCCCGTGCACGGCGCCTACTAT
GACCCCAGCAAGGAGCTGATCGCCGAGATCCAGAAGCAGGGCCAAGACCA
GTGGACCTACCAGATCTACCAGGAGCCCTTCAAGAACCTGAAGACCGGCA
AGTACGCCAAGATGCGGACCGCCCACACCAACGACGTGAAGCAGCTGACC
GAGGCCGTGCAGAAGATCGCCATGGAGAGCATCGTGATTTGGGGCAAGAT
CCCCAAGTTCCGGCTGCCCATCCAGAAGGAGACCTGGGAGACCTGGTGGA
CCGACTACTGGCAGGCCACCTGGATCCCCGAGTGGGAGTTCGTGAACACC
CCTCCCCTGGTGAAGCTGTGGTACCAGCTGGAGAAGGACCCCATCGCCGG
CGTGGAGACCTTCTACGTGGACGGCGCCGCTAACCGGGAGACCAAGATCG
GCAAGGCCGGCTACGTGACCGACAGAGGCCGGAAGAAAATCGTGAGCCTG
ACCGACACAACCAACCAGAAGACCGAGCTGCAGGCCATCTACATCGCCCT
GCAGGACAGCGGCAGCGAGGTGAACATCGTGACCGACAGCCAGTACGCCC
TGGGCATCATTCAGGCCCAGCCCGACAAGAGCGAGAGCGAGCTGGTGAAC
CAGATCATTGAGCAGCTGATCAAGAAAGAGCGGGTGTACCTGAGCTGGGT
GCCCGCCCACAAGGGCATCGGGGGCAACGAGCAGGTGGACAAGCTGGTGA
GCAACGGCATCCGGAAGGTGCTGTTCCTGGACGGCATCGACAAGGCCCAG
GAGGAACACGAGAAGTACCACAGCAACTGGCGGGCCATGGCCAGCGACTT
CAACCTGCCTCCCATCGTGGCCAAGGAGATCGTGGCCAGCTGCGACCAGT
GTCAGCTGAAGGGCGAGGCCATGCACGGCCAGGTGGACTGCAGCCCCGGC
ATCTGGCAGCTGGACTGCACCCACCTGGAGGGCAAGATCATTCTGGTGGC
CGTCCACGTGGCCAGCGGCTACATCGAGGCCGAGGTGATCCCCGCCGAGA
CCGGCCAGGAGACCGCCTACTTCATCCTGAAGCTGGCCGGCCGGCAGGAT
GAGGACTGAGGATCTCACGTGGAATTCGCTGTGCCTTCTAGTTGCCAGCC
ATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCA
CTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTG
AGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGCACAGCAAGGG
GGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTA
TGGCGGCCGCTAGCACGCGCCGTTGACATTGATTATTGACTAGTTATTAA
TAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCG
CGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACC
CCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATA
GGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCA
CTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACG
TCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTA
TGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTAC
CATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTG
ACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTG
TTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGC
CCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAA
GCAGAGCTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGC
TGTTTTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCGCGGCCG
GGAACGGTGCATTGGAACGCGGATTCCCCGTGCCAAGAGTGACGTAAGTA
CCGCCTATAGACTCTATAGGCACACCCCTTTGGCTCTTATGCATGCTATA
CTGTTTTTGGCTTGGGGCCTATACACCCCCGCTTCCTTATGCTATAGGTG
ATGGTATAGCTTAGCCTATAGGTGTGGGTTATTGACCATTATTGACCACT
CCCCTATTGGTGACGATACTTTCCATTACTAATCCATAACATGGCTCTTT
GCCACAACTATCTCTATTGGCTATATGCCAATACTCTGTCCTTCAGAGAC
TGACACGGACTCTGTATTTTTACAGGATGGGGTCCCATTTATTATTTACA
AATTCACATATACAACAACGCCGTCCCCCGTGCCCGCAGTTTTTATTAAA
CATAGCGTGGGATCTCCACGCGAATCTCGGGTACGTGTTCCGGACATGGG
CTCTTCTCCGGTAGCGGCGGAGCTTCCACATCCGAGCCCTGGTCCCATGC
CTCCAGCGGCTCATGGTCGCTCGGCAGCTCCTTGCTCCTAACAGTGGAGG
CCAGACTTAGGCACAGCACAATGCCCACCACCACCAGTGTGCCGCACAAG
GCCGTGGCGGTAGGGTATGTGTCTGAAAATGAGCGTGGAGATTGGGCTCG
CACGGCTGACGCAGATGGAAGACTTAAGGCAGCGGCAGAAGAAGATGCAG
GCAGCTGAGTTGTTGTATTCTGATAAGAGTCAGAGGTAACTCCCGTTGCG
GTGCTGTTAACGGTGGAGGGCAGTGTAGTCTGAGCAGTACTCGTTGCTGC
CGCGCGCGCCACCAGACATAATAGCTGACAGACTAACAGACTGTTCCTTT
CCATGGGTCTTTTCTGCAGTCACCGTCGTCGACACGTGTGATCAGATATC
GCGGCCGCTCTAGACCAGGCGCCTGGATCCGCCCAGATCTACCATGAGAG
TGAGGGGCACCAGACGGAACTACCAACAGTGGTGGATCTGGGGCGTGCTG
GGCTTCTGGATGCTGATGATCTGCAACGTGGAGGGCAACCTGTGGGTGAC
CGTCTACTATGGCGTGCCCGTCTGGAAGGAGGCCAAGACCACACTGTTCT
GTGCCAGCGACGCTAAGGCCTACGAGACCGAGGTGCACAACGTCTGGGCC
ACCCATGCCTGCGTGCCAACCGACCCTAACCCACAGGAGATCGTGATGGA
GAACGTGACCGAGAATTTCAACATGTGGAATAACGACATGGTGAACCAGA
TGCACGAGGACGTGATCAGCCTGTGGGACCAGAGCCTGAAGCCCTGCGTG
AAGCTGACCCCCCTGTGCGTGACCCTGGAATGTCGGAACGTGAGCTCCAA
CGGCAACGGCACACGGAACGAGACCTACAACGAGAGCGTGAAGGAGGTGA
AGAACTGCAGCTTCAACGCCACCACACTGCTCAGAGACCGGAAGAAAACC
GTGTACGCCCTGTTCTACAGACTGGACATTGCTCCCCTGAACGACGAGAA
CAGCGGCAAGAACTCCAGCGAGTACTATCGGCTGATCAACTGCAACACCA
GCGCCATCACCCAGGCCTGCCCCAAGGTGACCTTCGACCCTATTCCCATC
CACTACTGCACCCCCGCCGGCTACGCCATCCTGAAGTGCAACGACAAAAT
CTTCAACGGCACCGGACAGTGTCACAACGTGTCCACCGTGCAGTGCACCC
ATGGCATCAAGCCCGTCGTGTCCACCCAGCTGCTCCTGAATGGAAGCCTG
GCCGAGAGAGAGATCATTATCCGGAGCGAGAACCTGACCAATAACGTGAA
GACCATCATTGTGCACCTGAACAAGAGCGTGGAGATCGTGTGCACCCGGC
CCAACAATAACACCAGGAAGAGCATCAGAATTGGGCCCGGCCAGACCTTC
TATGCTACCGGCGACATCATTGGCGACATCAGACAGGCTCATTGCAACAT
CAGCAAGGACAAGTGGGACGAGACACTGCAGCGGGTGAGCAAGAAACTGG
CCGAGCACTTCCCCAACAAGACCATCAAGTTTGCCAGCTCTTCCGGCGGA
GACCTGGAGATCACCACACACAGCTTCAACTGCCGGGGCGAGTTCTTTTA
CTGCAACACCAGCGGACTGTTCAACGGCACCTACAACGGCACCAAGGACA
ACAGCTCCAGCATCATTACCATCCCCTGTCGGATCAAGCAGATTATCAAC
ATGTGGCAGGAAGTGGGACGGGCCATGTACGCTCCACCCATCGAGGGCAA
CATCACCTGCAAGTCCAACATCACCGGCCTGCTCCTGGTGCGGGACGGCG
GAAGAACAGAGAGCAACGACACCGAAATCTTCAGACCCGGCGGAGGCGAC
ATGCGGAACAATTGGCGGAACGAGCTGTACAAGTACAAGGTGGTCGAGAT
CAAACCCCTGGGAGTGGCCCCTACAGCTGCCAAGAGACGGGTGGTCGAGA
GGGAGAAGCGGGCCGTGGGCCTGGGAGCTGTGTTCCTGGGCTTCCTGGGA
GCTGCCGGGAGCACCATGGGCGCTGCCAGCATCACCCTGACCGTGCAAGC
CAGACAGCTCCTGAGCGGCATCGTGCAGCAACAGAGCAACCTGCTCAGAG
CCATCGAAGCCCAACAGCACATGCTCCAGCTGACCGTGTGGGGCATCAAG
CAACTCCAGACCCGGGTGCTCGCCATCGAACGGTACCTGAAGGACCAGCA
GCTGCTCGGCATCTGGGGCTGTTCCGGAAAGCTGATCTGCACAACCGCCG
TGCCCTGGAACTCCAGCTGGTCTAACAAGAGCCAACAGGAAATCTGGGAC
AACATGACCTGGATGCAGTGGGACAAGGAGATCAGCAACTACACCAACAC
CATCTACAGACTGCTCGAGGACAGCCAGAACCAACAGGAGCGGAATGAGA
AGGACCTGCTCGCCCTGGACAGCTGGAAGAACCTGTGGAGCTGGTTTGAC
ATCACTAACTGGCTGTGGTACATTAAAATCTTCATTATGATCGTGGGCGG
GCTGATCGGAAGCAGGATTATCTTCGCCGTGCTGAGCATCGTGAACAGAG
TGCGGCAGGGCTACTCCCCACTGAGCTTCCAGATCCCCACCCCTAACCCC
GGCGGACCTGGCAGACTGGGCAGAATCGAGGAAGAGGGAGGCGAACAGGA
CAAGACCCGGAGCATCAGGCTGGTGAACGGCTTCCTGGCCCTGGCCTGGG
ACGATCTGCGGAACCTGTGCCTGTTCAGCTACCACAGACTGAGCGACTTC
ATCCTCCTGACTGCTAGGGGAGTGGAGCTGCTCGGGAGAAACTCTCTGAG
GGGCCTGCAGCGGGGATGGGAAGCTCTGAAGTACCTGGGCAACCTGGTGC
AGTACTGGGGCCTGGAGCTGAAGAAAAGCACAATCTCCCTGGTGGACACC
ATCGCCATCGTGGTCGCCGAGGGCACCGATAGAATCATTAACATCGTGCA
GGGAATTTGCCGGGCCATCCACAACGTGCCTAGAAGGATCAGACAGGGAC
TGGAGGCCGCTCTGCAGTGAGGATCCAGATCTGCTGTGCCTTCTAGTTGC
CAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGG
TGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATT
GTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGCACAGC
AAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGG
CTCTATGGGTACCCAGGTGCTGAAGAATTGACCCGGTTCCTCCTGGGCCA
GAAAGAAGCAGGCACATCCCCTTCTCTGTGACACACCCTGTCCACGCCCC
TGGTTCTTAGTTCCAGCCCCACTCATAGGACACTCATAGCTCAGGAGGGC
TCCGCCTTCAATCCCACCCGCTAAAGTACTTGGAGCGGTCTCTCCCTCCC
TCATCAGCCCACCAAACCAAACCTAGCCTCCAAGAGTGGGAAGAAATTAA
AGCAAGATAGGCTATTAAGTGCAGAGGGAGAGAAAATGCCTCCAACATGT
GAGGAAGTAATGAGAGAAATCATAGAATTTCTTCCGCTTCCTCGCTCACT
GACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTC
AAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGA
ACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCG
TTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAA
TCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACC
AGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTG
CCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCT
TTCTCAATGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCT
CCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCC
TTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATC
GCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAG
GCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGA
AGGACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAA
AAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTG
GTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAA
GAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAA
CTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCT
AGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATAT
GAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTAT
CTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCGGGGGG
GGGGGGCGCTGAGGTCTGCCTCGTGAAGAAGGTGTTGCTGACTCATACCA
GGCCTGAATCGCCCCATCATCCAGCCAGAAAGTGAGGGAGCCACGGTTGA
TGAGAGCTTTGTTGTAGGTGGACCAGTTGGTGATTTTGAACTTTTGCTTT
GCCACGGAACGGTCTGCGTTGTCGGGAAGATGCGTGATCTGATCCTTCAA
CTCAGCAAAAGTTCGATTTATTCAACAAAGCCGCCGTCCCGTCAAGTCAG
CGTAATGCTCTGCCAGTGTTACAACCAATTAACCAATTCTGATTAGAAAA
ACTCATCGAGCATCAAATGAAACTGCAATTTATTCATATCAGGATTATCA
ATACCATATTTTTGAAAAAGCCGTTTCTGTAATGAAGGAGAAAACTCACC
GAGGCAGTTCCATAGGATGGCAAGATCCTGGTATCGGTCTGCGATTCCGA
CTCGTCCAACATCAATACAACCTATTAATTTCCCCTCGTCAAAAATAAGG
TTATCAAGTGAGAAATCACCATGAGTGACGACTGAATCCGGTGAGAATGG
CAAAAGCTTATGCATTTCTTTCCAGACTTGTTCAACAGGCCAGCCATTAC
GCTCGTCATCAAAATCACTCGCATCAACCAAACCGTTATTCATTCGTGAT
TGCGCCTGAGCGAGACGAAATACGCGATCGCTGTTAAAAGGACAATTACA
AACAGGAATCGAATGCAACCGGCGCAGGAACACTGCCAGCGCATCAACAA
TATTTTCACCTGAATCAGGATATTCTTCTAATACCTGGAATGCTGTTTTC
CCGGGGATCGCAGTGGTGAGTAACCATGCATCATCAGGAGTACGGATAAA
ATGCTTGATGGTCGGAAGAGGCATAAATTCCGTCAGCCAGTTTAGTCTGA
CCATCTCATCTGTAACATCATTGGCAACGCTACCTTTGCCATGTTTCAGA
AACAACTCTGGCGCATCGGGCTTCCCATACAATCGATAGATTGTCGCACC
TGATTGCCCGACATTATCGCGAGCCCATTTATACCCATATAAATCAGCAT
CCATGTTGGAATTTAATCGCGGCCTCGAGCAAGACGTTTCCCGTTGAATA
TGGCTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAGTTTTAT
TGTTCATGATGATATATTTTTATCTTGTGCAATGTAACATCAGAGATTTT
GAGACACAACGTGGCTTTCCCCCCCCCCCCATTATTGAAGCATTTATCAG
GGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAA
ACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCT
AAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACG
AGGCCCTTTCGTC
GPCINS基因序列如SEQ ID NO:2
ATGGGCGCCCGGGCCAGCATCCTGCGGGGAGGCAAGCTGGACAAATGGGA
GAAGATCCGGCTGAGACCCGGAGGCAAGAAACACTACATGCTGAAGCACC
TGGTGTGGGCCAGCCGGGAGCTGGAAAGATTCGCCCTGAACCCCGGCCTC
CTGGAGACCAGCGAAGGCTGCAAGCAGATCATTAAGCAGCTGCAACCCGC
CCTGCAGACCGGCACCGAGGAACTGCGGAGCCTGTTCAACACCGTGGCCA
CCCTGTACTGCGTGCACGAGGAAATCGAGGTGCGGGACACCAAGGAGGCC
CTGGACAAGATCGAGGAAGAGCAGAACAAGATCCAGCAAAAGACCCAGCA
GGCCAAGAAAGCCGACGAGAAGGTGAGCCAGAACTACCCCATCGTGCAGA
ACCCCCAGGGCCAGATGGTGCACCAGCCTCTGAGCCCCCGGACCCTGAAC
GCCTGGGTGAAGGTCGTGGAGGAAAAGGCCTTCAGCCCCGAGGTGATCCC
TATGTTCACCGCCCTGAGCGAGGGCGCCACCCCCCAGGACCTGAACACCA
TGCTGAACACCGTGGGCGGGCACCAGGCTGCCATGCAGATGCTGAAGGAC
ACCATCAACGAGGAAGCCGCTGAGTGGGACCGGCTGCACCCCGTGCACGC
CGGCCCCGTGGCCCCTGGCCAGATGCGGGAGCCCAGAGGCAGCGACATCG
CCGGCACCACATCCAGCCTGCAGGAGCAGATCGGCTGGATGACCAACAAT
CCTCCCATCCCAGTGGGCGAGATCTACAAGCGGTGGATTATCCTGGGCCT
GAACAAGATCGTGCGGATGTACAGCCCCACCTCCATCCTGGACATCAAGC
AGGGCCCTAAGGAGCCCTTCCGGGACTACGTGGATAGATTCTTTAAGACC
CTGCGGGCCGAGCAGGCCACCCAGGACGTGAAGAACTGGATGACCGACAC
CCTGCTCGTGCAGAATGCCAACCCCGACTGCAAGACCATCCTGCGGGCCC
TGGGCAGCGGCGCCTCCCTGGAAGAGATGATGACCGCCTGCCAGGGCGTG
GGAGGCCCCAGCCACAAGGCCCGGGTGCTGGCTGAGGCCATGAGCCAGAC
CTCCAACACCATCCTGATGCAGCGGAGCAACTTCAAGGGCAGCAAACGGA
TCGTGAAGTGCTTCAACTGTGGCAAGGAGGGCCACATCGCCAAGAACTGC
AGGGCCCCTAGGAAAAAAGGCTGTTGGAAATGTGGAAAGGAAGGACACCA
AATGAAAGACTGTACTGAAAGGCAGGCGAATTTTTTAGGGAAATTTTGGC
CTTCCCACAAGGGGAGGCCAGGGAATTTTCTCCAGAGCAGACCAGAGCCA
ACAGCCCCACCAGCAGAGAGCTTCAGGTTCGAGGAGACAACCCCAGCTCC
GAAGCAGGAACCGAAAGACAGGGAACCCTTAACTTCCCTCAGATCACTCT
TTGGCAGCGACCCCTTGTCTCAATAAAAGTAGGGGGCCAGATAAAAGAGG
CTCTCCTGGACACCGGCGCCGATGACACCGTGCTGGAGGAAGTGAACCTG
CCCGGCAAGTGGAAGCCCAAGATGATCGGCGGGATCGGAGGCTTCATCAA
GGTGCGGCAGTACGAGCAGATCCCCATTGAGATCTGCGGCAAGAAAGCCA
TCGGCACCGTGCTGGTGGGCCCCACCCCCGTGAACATCATTGGCCGGAAC
ATGCTGACCCAGCTGGGCTGCACCCTGAACTTCCCCATCAGCCCCATCGA
GACCGTGCCCGTGAAGCTGAAGCCCGGCATGGACGGCCCCAAGGTGAAGC
AGTGGCCCCTGACCGAGGAAAAGATCAAGGCCCTGACCGCCATCTGCGAC
GAGATGGAAAAGGAGGGCAAGATCACCAAGATCGGCCCCGACAACCCCTA
CAACACCCCCATCTTCGCCATCCGGAAGAAAGACAGCTCCAAGTGGCGGA
AGCTGGTGGACTTCCGGGAGCTGAACAAGCGGACCCAGGACTTCTGGGAG
GTGCAGCTGGGCATCCCCCACCCCGCCGGCCTGAAGAAAAAGAAAAGCGT
GACCGTGCTGGACGTGGGCGACGCCTACTTCAGCGTGCCCCTGGATAAGG
ACTTCCGGAAGTACACCGCCTTCACCATCCCCAGCGTGAACAATGAGACC
CCCGGCATCCGGTACCAGTACAACGTGCTGCCCCAGGGCTGGAAGGGCAG
CCCCGCCATCTTCCAGTGCAGCATGACCAAGATCCTGGAGCCCTTCCGGA
AGCAGAACCCCGACATCGTGATCTACCAGTACATGGACGATCTGTACGTG
GGCAGCGACCTGGAGATCGGCCAGCACCGGACCAAGATCGAGGAACTGCG
GGAGCACCTCCTGAAGTGGGGCTTCACCACACCCGACAAGAAACACCAGA
AGGAGCCTCCCTTCCTGTGGATGGGCTACGAGCTGCACCCCGACAAGTGG
ACCGTGCAGCCCATCCAGCTGCCCGAGAAGGACAGCTGGACCGTGAACGA
CATCCAGAAGCTGGTGGGCAAGCTGAACTGGGCCAGCCAGATCTACCCCG
GCATCAAGGTGCGGCAGCTGTGCAAGCTCCTGCGGGGCGCCAAGGCCCTG
ACCGACATCGTGCCCCTGACCGAGGAAGCCGAGCTGGAACTGGCCGAGAA
CCGGGAGATCCTGAAGGAGCCCGTGCACGGCGCCTACTATGACCCCAGCA
AGGAGCTGATCGCCGAGATCCAGAAGCAGGGCCAAGACCAGTGGACCTAC
CAGATCTACCAGGAGCCCTTCAAGAACCTGAAGACCGGCAAGTACGCCAA
GATGCGGACCGCCCACACCAACGACGTGAAGCAGCTGACCGAGGCCGTGC
AGAAGATCGCCATGGAGAGCATCGTGATTTGGGGCAAGATCCCCAAGTTC
CGGCTGCCCATCCAGAAGGAGACCTGGGAGACCTGGTGGACCGACTACTG
GCAGGCCACCTGGATCCCCGAGTGGGAGTTCGTGAACACCCCTCCCCTGG
TGAAGCTGTGGTACCAGCTGGAGAAGGACCCCATCGCCGGCGTGGAGACC
TTCTACGTGGACGGCGCCGCTAACCGGGAGACCAAGATCGGCAAGGCCGG
CTACGTGACCGACAGAGGCCGGAAGAAAATCGTGAGCCTGACCGACACAA
CCAACCAGAAGACCGAGCTGCAGGCCATCTACATCGCCCTGCAGGACAGC
GGCAGCGAGGTGAACATCGTGACCGACAGCCAGTACGCCCTGGGCATCAT
TCAGGCCCAGCCCGACAAGAGCGAGAGCGAGCTGGTGAACCAGATCATTG
AGCAGCTGATCAAGAAAGAGCGGGTGTACCTGAGCTGGGTGCCCGCCCAC
AAGGGCATCGGGGGCAACGAGCAGGTGGACAAGCTGGTGAGCAACGGCAT
CCGGAAGGTGCTGTTCCTGGACGGCATCGACAAGGCCCAGGAGGAACACG
AGAAGTACCACAGCAACTGGCGGGCCATGGCCAGCGACTTCAACCTGCCT
CCCATCGTGGCCAAGGAGATCGTGGCCAGCTGCGACCAGTGTCAGCTGAA
GGGCGAGGCCATGCACGGCCAGGTGGACTGCAGCCCCGGCATCTGGCAGC
TGGACTGCACCCACCTGGAGGGCAAGATCATTCTGGTGGCCGTCCACGTG
GCCAGCGGCTACATCGAGGCCGAGGTGATCCCCGCCGAGACCGGCCAGGA
GACCGCCTACTTCATCCTGAAGCTGGCCGGCCGGTGGCCCGTGAAGGTGA
TCCACACCGACAACGGCAGCAACTTCACCAGCGCCGCTGTGAAGGCAGCC
TGCTGGTGGGCCGGCATCCAGCAAGAGTTCGGCATCCCCTACAACCCCCA
GAGCCAGGGCGTGGTGGAGAGCATGAACAAGGAGCTGAAAAAGCTGATCG
GCCAGGTGCGGGACCAGGCCGAGCACCTGAAGACCGCCGTGCAGATGGCC
GTGTTCATCCACAACTTCAAGCGGAAGGGCGGGATCGGAGGCTACAGCGC
CGGCGAGCGGATCGTGGACATTATCGCCACCGACATCCAGACCCGGGAGC
TGCAGAAGCAGATCATTAAGATCCAGAACTTCCGGGTGTACTATAGAGAC
AGCCGGGACCCCATCTGGAAGGGCCCCGCCAAGCTGCTCTGGAAGGGCGA
GGGCGCCGTCGTGATCCAGGACAACAGCGACATCAAGGTCGTGCCCAGAC
GGAAGGCCAAGATTATCAAGGACTACGGCAAGCAGATGGCCGGCGCCGAC
TGCGTGGCCGGCCGGCAGGATGAGGACTGA
ENVCINS基因序列如SEQ ID NO:3
ATGAGAGTGAGGGGCACCAGACGGAACTACCAACAGTGGTG
GATCTGGGGCGTGCTGGGCTTCTGGATGCTGATGATCTGCAACGTGGAGG
GCAACCTGTGGGTGACCGTCTACTATGGCGTGCCCGTCTGGAAGGAGGCC
AAGACCACACTGTTCTGTGCCAGCGACGCTAAGGCCTACGAGACCGAGGT
GCACAACGTCTGGGCCACCCATGCCTGCGTGCCAACCGACCCTAACCCAC
AGGAGATCGTGATGGAGAACGTGACCGAGAATTTCAACATGTGGAATAAC
GACATGGTGAACCAGATGCACGAGGACGTGATCAGCCTGTGGGACCAGAG
CCTGAAGCCCTGCGTGAAGCTGACCCCCCTGTGCGTGACCCTGGAATGTC
GGAACGTGAGCTCCAACGGCAACGGCACACGGAACGAGACCTACAACGAG
AGCGTGAAGGAGGTGAAGAACTGCAGCTTCAACGCCACCACACTGCTCAG
AGACCGGAAGAAAACCGTGTACGCCCTGTTCTACAGACTGGACATTGCTC
CCCTGAACGACGAGAACAGCGGCAAGAACTCCAGCGAGTACTATCGGCTG
ATCAACTGCAACACCAGCGCCATCACCCAGGCCTGCCCCAAGGTGACCTT
CGACCCTATTCCCATCCACTACTGCACCCCCGCCGGCTACGCCATCCTGA
AGTGCAACGACAAAATCTTCAACGGCACCGGACAGTGTCACAACGTGTCC
ACCGTGCAGTGCACCCATGGCATCAAGCCCGTCGTGTCCACCCAGCTGCT
CCTGAATGGAAGCCTGGCCGAGAGAGAGATCATTATCCGGAGCGAGAACC
TGACCAATAACGTGAAGACCATCATTGTGCACCTGAACAAGAGCGTGGAG
ATCGTGTGCACCCGGCCCAACAATAACACCAGGAAGAGCATCAGAATTGG
GCCCGGCCAGACCTTCTATGCTACCGGCGACATCATTGGCGACATCAGAC
AGGCTCATTGCAACATCAGCAAGGACAAGTGGGACGAGACACTGCAGCGG
GTGAGCAAGAAACTGGCCGAGCACTTCCCCAACAAGACCATCAAGTTTGC
CAGCTCTTCCGGCGGAGACCTGGAGATCACCACACACAGCTTCAACTGCC
GGGGCGAGTTCTTTTACTGCAACACCAGCGGACTGTTCAACGGCACCTAC
AACGGCACCAAGGACAACAGCTCCAGCATCATTACCATCCCCTGTCGGAT
CAAGCAGATTATCAACATGTGGCAGGAAGTGGGACGGGCCATGTACGCTC
CACCCATCGAGGGCAACATCACCTGCAAGTCCAACATCACCGGCCTGCTC
CTGGTGCGGGACGGCGGAAGAACAGAGAGCAACGACACCGAAATCTTCAG
ACCCGGCGGAGGCGACATGCGGAACAATTGGCGGAACGAGCTGTACAAGT
ACAAGGTGGTCGAGATCAAACCCCTGGGAGTGGCCCCTACAGCTGCCAAG
AGACGGGTGGTCGAGAGGGAGAAGCGGGCCGTGGGCCTGGGAGCTGTGTT
CCTGGGCTTCCTGGGAGCTGCCGGGAGCACCATGGGCGCTGCCAGCATCA
CCCTGACCGTGCAAGCCAGACAGCTCCTGAGCGGCATCGTGCAGCAACAG
AGCAACCTGCTCAGAGCCATCGAAGCCCAACAGCACATGCTCCAGCTGAC
CGTGTGGGGCATCAAGCAACTCCAGACCCGGGTGCTCGCCATCGAACGGT
ACCTGAAGGACCAGCAGCTGCTCGGCATCTGGGGCTGTTCCGGAAAGCTG
ATCTGCACAACCGCCGTGCCCTGGAACTCCAGCTGGTCTAACAAGAGCCA
ACAGGAAATCTGGGACAACATGACCTGGATGCAGTGGGACAAGGAGATCA
GCAACTACACCAACACCATCTACAGACTGCTCGAGGACAGCCAGAACCAA
CAGGAGCGGAATGAGAAGGACCTGCTCGCCCTGGACAGCTGGAAGAACCT
GTGGAGCTGGTTTGACATCACTAACTGGCTGTGGTACATTAAAATCTTCA
TTATGATCGTGGGCGGGCTGATCGGAAGCAGGATTATCTTCGCCGTGCTG
AGCATCGTGAACAGAGTGCGGCAGGGCTACTCCCCACTGAGCTTCCAGAT
CCCCACCCCTAACCCCGGCGGACCTGGCAGACTGGGCAGAATCGAGGAAG
AGGGAGGCGAACAGGACAAGACCCGGAGCATCAGGCTGGTGAACGGCTTC
CTGGCCCTGGCCTGGGACGATCTGCGGAACCTGTGCCTGTTCAGCTACCA
CAGACTGAGCGACTTCATCCTCCTGACTGCTAGGGGAGTGGAGCTGCTCG
GGAGAAACTCTCTGAGGGGCCTGCAGCGGGGATGGGAAGCTCTGAAGTAC
CTGGGCAACCTGGTGCAGTACTGGGGCCTGGAGCTGAAGAAAAGCACAAT
CTCCCTGGTGGACACCATCGCCATCGTGGTCGCCGAGGGCACCGATAGAA
TCATTAACATCGTGCAGGGAATTTGCCGGGCCATCCACAACGTGCCTAGA
AGGATCAGACAGGGACTGGAGGCCGCTCTGCAGTGA
Gag氨基酸序列如下:SEQ ID NO:4
Met Gly Ala Arg Ala Ser Ile Leu Arg Gly Gly Lys Leu Asp Lys Trp
Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys His Tyr Met Leu Lys
His Leu Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Leu Asn Pro
Gly Leu Leu Glu Thr Ser Glu Gly Cys Lys Gln Ile Ile Lys Gln Leu
Gln Pro Ala Leu Gln Thr Gly Thr Glu Glu Leu Arg Ser Leu Phe Asn
Thr Val Ala Thr Leu Tyr Cys Val His Glu Glu Ile Glu Val Arg Asp
Thr Lys Glu Ala Leu Asp Lys Ile Glu Glu Glu Gln Asn Lys Ile Gln
Gln Lys Thr Gln Gln Ala Lys Lys Ala Asp Glu Lys Val Ser Gln Asn
Tyr Pro Ile Val Gln Asn Pro Gln Gly Gln Met Val His Gln Pro Leu
Ser Pro Arg Thr Leu Asn Ala Trp Val Lys Val Val Glu Glu Lys Ala
Phe Ser Pro Glu Val Ile Pro Met Phe Thr Ala Leu Ser Glu Gly Ala
Thr Pro Gln Asp Leu Asn Thr Met Leu Asn Thr Val Gly Gly His Gln
Ala Ala Met Gln Met Leu Lys Asp Thr Ile Asn Glu Glu Ala Ala Glu
Trp Asp Arg Leu His Pro Val His Ala Gly Pro Val Ala Pro Gly Gln
Met Arg Glu Pro Arg Gly Ser Asp Ile Ala Gly Thr Thr Ser Ser Leu
Gln Glu Gln Ile Gly Trp Met Thr Asn Asn Pro Pro Ile Pro Val Gly
Glu Ile Tyr Lys Arg Trp Ile Ile Leu Gly Leu Asn Lys Ile Val Arg
Met Tyr Ser Pro Thr Ser Ile Leu Asp Ile Lys Gln Gly Pro Lys Glu
Pro Phe Arg Asp Tyr Val Asp Arg Phe Phe Lys Thr Leu Arg Ala Glu
Gln Ala Thr Gln Asp Val Lys Asn Trp Met Thr Asp Thr Leu Leu Val
Gln Asn Ala Asn Pro Asp Cys Lys Thr Ile Leu Arg Ala Leu Gly Ser
Gly Ala Ser Leu Glu Glu Met Met Thr Ala Cys Gln Gly Val Gly Gly
Pro Ser His Lys Ala Arg Val Leu Ala Glu Ala Met Ser Gln Thr Ser
Asn Thr Ile Leu Met Gln Arg Ser Asn Phe Lys Gly Ser Lys Arg Ile
Val Lys Cys Phe Asn Cys Gly Lys Glu Gly His Ile Ala Lys Asn Cys
Arg Ala Pro Arg Lys Lys Gly Cys Trp Lys Cys Gly Lys Glu Gly His
Gln Met Lys Asp Cys Thr Glu Arg Gln Ala Asn Phe Leu Gly Lys Phe
Trp Pro Ser His Lys Gly Arg Pro Gly Asn Phe Leu Gln Ser Arg Pro
Glu Pro Thr Ala Pro Pro Ala Glu Ser Phe Arg Phe Glu Glu Thr Thr
Pro Ala Pro Lys Gln Glu Pro Lys Asp Arg Glu Pro Leu Thr Ser Leu
Arg Ser Leu Phe Gly Ser Asp Pro Leu Ser Gln
Pol氨基酸序列如下:SEQ ID NO:5
Phe Phe Arg Glu Ile Leu Ala Phe Pro Gln Gly Glu Ala Arg Glu Phe
Ser Pro Glu Gln Thr Arg Ala Asn Ser Pro Thr Ser Arg Glu Leu Gln
Val Arg Gly Asp Asn Pro Ser Ser Glu Ala Gly Thr Glu Arg Gln Gly
Thr Leu Asn Phe Pro Gln Ile Thr Leu Trp Gln Arg Pro Leu Val Ser
Ile Lys Val Gly Gly Gln Ile Lys Glu Ala Leu Leu Asp Thr Gly Ala
Asp Asp Thr Val Leu Glu Glu Val Asn Leu Pro Gly Lys Trp Lys Pro
Lys Met Ile Gly Gly Ile Gly Gly Phe Ile Lys Val Arg Gln Tyr Glu
Gln Ile Pro Ile Glu Ile Cys Gly Lys Lys Ala Ile Gly Thr Val Leu
Val Gly Pro Thr Pro Val Asn Ile Ile Gly Arg Asn Met Leu Thr Gln
Leu Gly Cys Thr Leu Asn Phe Pro Ile Ser Pro Ile Glu Thr Val Pro
Val Lys Leu Lys Pro Gly Met Asp Gly Pro Lys Val Lys Gln Trp Pro
Leu Thr Glu Glu Lys Ile Lys Ala Leu Thr Ala Ile Cys Asp Glu Met
Glu Lys Glu Gly Lys Ile Thr Lys Ile Gly Pro Asp Asn Pro Tyr Asn
Thr Pro Ile Phe Ala Ile Arg Lys Lys Asp Ser Ser Lys Trp Arg Lys
Leu Val Asp Phe Arg Glu Leu Asn Lys Arg Thr Gln Asp Phe Trp Glu
Val Gln Leu Gly Ile Pro His Pro Ala Gly Leu Lys Lys Lys Lys Ser
Val Thr Val Leu Asp Val Gly Asp Ala Tyr Phe Ser Val Pro Leu Asp
Lys Asp Phe Arg Lys Tyr Thr Ala Phe Thr Ile Pro Ser Val Asn Asn
Glu Thr Pro Gly Ile Arg Tyr Gln Tyr Asn Val Leu Pro Gln Gly Trp
Lys Gly Ser Pro Ala Ile Phe Gln Cys Ser Met Thr Lys Ile Leu Glu
Pro Phe Arg Lys Gln Asn Pro Asp Ile Val Ile Tyr Gln Tyr Met Asp
Asp Leu Tyr Val Gly Ser Asp Leu Glu Ile Gly Gln His Arg Thr Lys
Ile Glu Glu Leu Arg Glu His Leu Leu Lys Trp Gly Phe Thr Thr Pro
Asp Lys Lys His Gln Lys Glu Pro Pro Phe Leu Trp Met Gly Tyr Glu
Leu His Pro Asp Lys Trp Thr Val Gln Pro Ile Gln Leu Pro Glu Lys
Asp Ser Trp Thr Val Asn Asp Ile Gln Lys Leu Val Gly Lys Leu Asn
Trp Ala Ser Gln Ile Tyr Pro Gly Ile Lys Val Arg Gln Leu Cys Lys
Leu Leu Arg Gly Ala Lys Ala Leu Thr Asp Ile Val Pro Leu Thr Glu
Glu Ala Glu Leu Glu Leu Ala Glu Asn Arg Glu Ile Leu Lys Glu Pro
Val His Gly Ala Tyr Tyr Asp Pro Ser Lys Glu Leu Ile Ala Glu Ile
Gln Lys Gln Gly Gln Asp Gln Trp Thr Tyr Gln Ile Tyr Gln Glu Pro
Phe Lys Asn Leu Lys Thr Gly Lys Tyr Ala Lys Met Arg Thr Ala His
Thr Asn Asp Val Lys Gln Leu Thr Glu Ala Val Gln Lys Ile Ala Met
Glu Ser Ile Val Ile Trp Gly Lys Ile Pro Lys Phe Arg Leu Pro Ile
Gln Lys Glu Thr Trp Glu Thr Trp Trp Thr Asp Tyr Trp Gln Ala Thr
Trp Ile Pro Glu Trp Glu Phe Val Asn Thr Pro Pro Leu Val Lys Leu
Trp Tyr Gln Leu Glu Lys Asp Pro Ile Ala Gly Val Glu Thr Phe Tyr
Val Asp Gly Ala Ala Asn Arg Glu Thr Lys Ile Gly Lys Ala Gly Tyr
Val Thr Asp Arg Gly Arg Lys Lys Ile Val Ser Leu Thr Asp Thr Thr
Asn Gln Lys Thr Glu Leu Gln Ala Ile Tyr Ile Ala Leu Gln Asp Ser
Gly Ser Glu Val Asn Ile Val Thr Asp Ser Gln Tyr Ala Leu Gly Ile
Ile Gln Ala Gln Pro Asp Lys Ser Glu Ser Glu Leu Val Asn Gln Ile
Ile Glu Gln Leu Ile Lys Lys Glu Arg Val Tyr Leu Ser Trp Val Pro
Ala His Lys Gly Ile Gly Gly Asn Glu Gln Val Asp Lys Leu Val Ser
Asn Gly Ile Arg Lys Val Leu Phe Leu Asp Gly Ile Asp Lys Ala Gln
Glu Glu His Glu Lys Tyr His Ser Asn Trp Arg Ala Met Ala Ser Asp
Phe Asn Leu Pro Pro Ile Val Ala Lys Glu Ile Val Ala Ser Cys Asp
Gln Cys Gln Leu Lys Gly Glu Ala Met His Gly Gln Val Asp Cys Ser
Pro Gly Ile Trp Gln Leu Asp Cys Thr His Leu Glu Gly Lys Ile Ile
Leu Val Ala Val His Val Ala Ser Gly Tyr Ile Glu Ala Glu Val Ile
Pro Ala Glu Thr Gly Gln Glu Thr Ala Tyr Phe Ile Leu Lys Leu Ala
Gly Arg Trp Pro Val Lys Val Ile His Thr Asp Asn Gly Ser Asn Phe
Thr Ser Ala Ala Val Lys Ala Ala Cys Trp Trp Ala Gly Ile Gln Gln
Glu Phe Gly Ile Pro Tyr Asn Pro Gln Ser Gln Gly Val Val Glu Ser
Met Asn Lys Glu Leu Lys Lys Leu Ile Gly Gln Val Arg Asp Gln Ala
Glu His Leu Lys Thr Ala Val Gln Met Ala Val Phe Ile His Asn Phe
Lys Arg Lys Gly Gly Ile Gly Gly Tyr Ser Ala Gly Glu Arg Ile Val
Asp Ile Ile Ala Thr Asp Ile Gln Thr Arg Glu Leu Gln Lys Gln Ile
Ile Lys Ile Gln Asn Phe Arg Val Tyr Tyr Arg Asp Ser Arg Asp Pro
Ile Trp Lys Gly Pro Ala Lys Leu Leu Trp Lys Gly Glu Gly Ala Val
Val Ile Gln Asp Asn Ser Asp Ile Lys Val Val Pro Arg Arg Lys Ala
Lys Ile Ile Lys Asp Tyr Gly Lys Gln Met Ala Gly Ala Asp Cys Val
Ala Gly Arg Gln Asp Glu Asp
Env氨基酸序列如下:SEQ ID NO:6
Met Arg Val Arg Gly Thr Arg Arg Asn Tyr Gln Gln Trp Trp Ile Trp
Gly Val Leu Gly Phe Trp Met Leu Met Ile Cys Asn Val Glu Gly Asn
Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala Lys
Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Glu Thr Glu Val
His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn Pro
Gln Glu Ile Val Met Glu Asn Val Thr Glu ASn Phe Asn Met Trp Asn
Asn Asp Met Val Asn Gln Met His Glu Asp Val Ile Ser Leu Trp Asp
Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Thr Leu
Glu Cys Arg Asn Val Ser Ser Asn Gly Asn Gly Thr Arg Asn Glu Thr
Tyr Asn Glu Ser Val Lys Glu Val Lys Asn Cys Ser Phe Asn Ala Thr
Thr Leu Leu Arg Asp Arg Lys Lys Thr Val Tyr Ala Leu Phe Tyr Arg
Leu Asp Ile Ala Pro Leu Asn Asp Glu Asn Ser Gly Lys Asn Ser Ser
Glu Tyr Tyr Arg Leu Ile Asn Cys Asn Thr Ser Ala Ile Thr Gln Ala
Cys Pro Lys Val Thr Phe Asp Pro Ile Pro Ile His Tyr Cys Thr Pro
Ala Gly Tyr Ala Ile Leu Lys Cys Ash Asp Lys Ile Phe Asn Gly Thr
Gly Gln Cys His Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Lys
Pro Val Val Ser Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Arg
Glu Ile Ile Ile Arg Ser Glu Asn Leu Thr Asn Asn Val Lys Thr Ile
Ile Val His Leu Asn Lys Ser Val Glu Ile Val Cys Thr Arg Pro Asn
Asn Asn Thr Arg Lys Ser Ile Arg Ile Gly Pro Gly Gln Thr Phe Tyr
Ala Thr Gly Asp Ile Ile Gly Asp Ile Arg Gln Ala His Cys Asn Ile
Ser Lys Asp Lys Trp Asp Glu Thr Leu Gln Arg Val Ser Lys Lys Leu
Ala Glu His Phe Pro Asn Lys Thr Ile Lys Phe Ala Ser Ser Ser Gly
Gly Asp Leu Glu Ile Thr Thr His Ser Phe Asn Cys Arg Gly Glu Phe
Phe Tyr Cys Asn Thr Ser Gly Leu Phe Asn Gly Thr Tyr Asn Gly Thr
Lys Asp Asn Ser Ser Ser Ile Ile Thr Ile Pro Cys Arg Ile Lys Gln
Ile Ile Asn Met Trp Gln Glu Val Gly Arg Ala Met Tyr Ala Pro Pro
Ile Glu Gly Asn Ile Thr Cys Lys Ser Asn Ile Thr Gly Leu Leu Leu
Val Arg Asp Gly Gly Arg Thr Glu Ser Asn Asp Thr Glu Ile Phe Arg
Pro Gly Gly Gly Asp Met Arg Asn Asn Trp Arg Asn Glu Leu Tyr Lys
Tyr Lys Val Val Glu Ile Lys Pro Leu Gly Val Ala Pro Thr Ala Ala
Lys Arg Arg Val Val Glu Arg Glu Lys Arg Ala Val Gly Leu Gly Ala
Val Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr Met Gly Ala Ala
Ser Ile Thr Leu Thr Val Gln Ala Arg Gln Leu Leu Ser Gly Ile Val
Gln Gln Gln Ser Asn Leu Leu Arg Ala Ile Glu Ala Gln Gln His Met
Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu Gln Thr Arg Val Leu
Ala Ile Glu Arg Tyr Leu Lys Asp Gln Gln Leu Leu Gly Ile Trp Gly
Cys Ser Gly Lys Leu Ile Cys Thr Thr Ala Val Pro Trp Asn Ser Ser
Trp Ser Asn Lys Ser Gln Gln Glu Ile Trp Asp Asn Met Thr Trp Met
Gln Trp Asp Lys Glu Ile Ser Asn Tyr Thr Asn Thr Ile Tyr Arg Leu
Leu Glu Asp Ser Gln Asn Gln Gln Glu Arg Asn Glu Lys Asp Leu Leu
Ala Leu Asp Ser Trp Lys Asn Leu Trp Ser Trp Phe Asp Ile Thr Asn
Trp Leu Trp Tyr Ile Lys Ile Phe Ile Met Ile Val Gly Gly Leu Ile
Gly Ser Arg Ile Ile Phe Ala Val Leu Ser Ile Val Asn Arg Val Arg
Gln Gly Tyr Ser Pro Leu Ser Phe Gln Ile Pro Thr Pro Asn Pro Gly
Gly Pro Gly Arg Leu Gly Arg Ile Glu Glu Glu Gly Gly Glu Gln Asp
Lys Thr Arg Ser Ile Arg Leu Val Asn Gly Phe Leu Ala Leu Ala Trp
Asp Asp Leu Arg Asn Leu Cys Leu Phe Ser Tyr His Arg Leu Ser Asp
Phe Ile Leu Leu Thr Ala Arg Gly Val Glu Leu Leu Gly Arg Asn Ser
Leu Arg Gly Leu Gln Arg Gly Trp Glu Ala Leu Lys Tyr Leu Gly Asn
Leu Val Gln Tyr Trp Gly Leu Glu Leu Lys Lys Ser Thr Ile Ser Leu
Val Asp Thr Ile Ala Ile Val Val Ala Glu Gly Thr Asp Arg Ile Ile
Asn Ile Val Gln Gly Ile Cys Arg Ala Ile His Asn Val Pro Arg Arg
Ile Arg Gln Gly Leu Glu Ala Ala Leu Gln
选择的HIV-1中国流行株gagpol基因序列如SEQ ID NO:7
ATGGGTGCGAGAGCGTCAATATTAAGAGGGGGAAAATTAGATAAATGGGA
AAAAATTAGGTTAAGGCCAGGGGGAAAAAAACACTATATGCTAAAACACC
TAGTATGGGCAAGCAGGGAGCTGGAAAGATTTGCACTTAACCCTGGCCTT
TTAGAGACATCAGAAGGCTGTAAGCAAATAATAAAACAGCTACAACCAGC
TCTTCAGACAGGAACAGAGGAACTTAGATCATTATTCAACACAGTAGCAA
CTCTCTATTGTGTACATGAAGAGATAGAAGTACGAGACACCAAAGAAGCC
TTAGACAAGATAGAGGAAGAACAAAATAAAATTCAGCAAAAAACACAGCA
GGCAAAAAAAGCTGACGAGAAGGTCAGTCAAAATTATCCTATAGTGCAGA
ATCCCCAAGGGCAAATGGTACATCAGCCCCTATCACCTAGAACTTTAAAT
GCATGGGTAAAAGTAGTGGAAGAGAAGGCTTTTAGCCCAGAAGTAATACC
CATGTTCACAGCATTATCAGAAGGAGCCACCCCACAAGATTTAAACACCA
TGTTAAATACAGTAGGGGGACATCAAGCAGCCATGCAAATGTTAAAAGAT
ACCATCAATGAAGAGGCTGCAGAATGGGATAGATTGCATCCAGTGCATGC
AGGGCCAGTGGCACCAGGCCAGATGAGAGAACCAAGGGGAAGTGACATAG
CAGGAACTACTAGTAGTCTTCAGGAGCAAATAGGATGGATGACAAATAAT
CCACCTATCCCAGTAGGAGAAATCTATAAAAGATGGATAATCCTGGGATT
AAATAAAATAGTAAGAATGTATAGCCCTACCAGCATTCTGGACATAAAAC
AAGGGCCAAAGGAACCCTTTAGAGACTATGTAGACCGGTTCTTTAAAACT
TTAAGAGCTGAACAAGCTACACAAGATGTAAAAAATTGGATGACAGACAC
CTTGTTAGTCCAAAATGCGAACCCAGATTGTAAGACCATTTTAAGAGCAT
TAGGATCAGGGGCTTCATTAGAAGAAATGATGACAGCATGTCAGGGAGTA
GGAGGACCTAGCCACAAAGCAAGAGTGTTGGCTGAGGCAATGAGCCAAAC
AAGCAATACCATACTGATGCAGAGAAGCAATTTTAAAGGCTCTAAAAGAA
TTGTTAAATGTTTCAACTGTGGCAAGGAAGGGCACATAGCCAAAAATTGC
AGGGCCCCTAGGAAAAAAGGCTGTTGGAAATGTGGAAAGGAAGGACACCA
AATGAAAGACTGTACTGAAAGGCAGGCGAATTTTTTAGGGAAATTTTGGC
CTTCCCACAAGGGGAGGCCAGGGAATTTTCTCCAGAGCAGACCAGAGCCA
ACAGCCCCACCAGCAGAGAGCTTCAGGTTCGAGGAGACAACCCCAGCTCC
GAAGCAGGAACCGAAAGACAGGGAACCCTTAACTTCCCTCAGATCACTCT
TTGGCAGCGACCCCTTGTCTCAATAAAAGTAGGGGGCCAGATAAAAGAGG
CTCTCTTAGACACCGGAGCAGATGATACAGTATTAGAAGAAGTAAATTTG
CCAGGAAAATGGAAACCAAAAATGATAGGAGGAATTGGAGGTTTTATCAA
AGTAAGACAATATGAGCAAATACCTATAGAAATTTGTGGAAAAAAGGCTA
TAGGTACAGTATTAGTGGGACCCACACCTGTCAACATAATAGGAAGAAAT
ATGTTGACCCAGCTTGGATGCACACTAAATTTTCCAATCAGTCCCATTGA
AACTGTACCAGTAAAATTAAAGCCAGGAATGGATGGCCCAAAGGTTAAAC
AATGGCCATTGACAGAAGAAAAAATAAAAGCATTAACAGCAATTTGTGAT
GAAATGGAGAAGGAAGGAAAAATTACAAAAATTGGGCCTGACAATCCATA
TAACACTCCAATATTTGCCATAAGAAAGAAGGACAGTAGTAAGTGGAGAA
AATTAGTAGATTTCAGGGAACTCAATAAAAGAACTCAAGATTTTTGGGAA
GTTCAATTAGGAATACCACACCCAGCAGGGTTAAAAAAGAAAAAATCAGT
AACAGTCCTGGATGTGGGTGATGCATATTTCTCAGTTCCTTTAGATAAAG
ACTTCAGGAAGTATACTGCATTTACCATACCTAGTGTAAACAATGAGACA
CCAGGGATTAGATATCAGTACAATGTGCTTCCACAGGGATGGAAAGGATC
ACCAGCAATATTCCAATGTAGCATGACAAAAATCTTAGAGCCTTTTAGAA
AACAAAATCCAGACATAGTTATCTATCAATACATGGATGACTTGTATGTA
GGATCTGACTTAGAAATAGGGCAGCATAGAACAAAAATAGAGGAACTGAG
AGAACATCTGTTAAAGTGGGGATTTACCACACCAGACAAGAAACATCAGA
AAGAACCTCCATTTCTTTGGATGGGGTATGAACTCCATCCTGACAAATGG
ACAGTACAGCCTATACAGCTGCCAGAAAAGGATAGCTGGACTGTCAATGA
TATACAGAAGTTAGTGGGAAAATTAAACTGGGCAAGTCAGATTTACCCAG
GAATTAAAGTAAGGCAACTTTGTAAACTCCTTAGGGGGGCCAAAGCACTA
ACAGACATAGTACCACTAACTGAAGAAGCAGAATTAGAATTAGCGGAAAA
CAGGGAAATTTTAAAAGAACCAGTACATGGAGCATATTATGACCCATCAA
AAGAATTGATAGCTGAAATACAGAAACAGGGGCAGGACCAATGGACATAT
CAAATTTACCAAGAACCATTCAAAAATCTGAAAACAGGGAAGTATGCAAA
AATGAGGACTGCCCACACTAATGATGTAAAACAGTTAACAGAGGCTGTGC
AGAAAATAGCCATGGAAAGCATAGTAATATGGGGAAAGATTCCTAAATTT
AGATTACCAATCCAAAAAGAAACATGGGAGACATGGTGGACAGACTATTG
GCAAGCCACCTGGATTCCTGAGTGGGAATTTGTTAATACCCCTCCCTTAG
TAAAATTATGGTACCAACTGGAGAAAGATCCCATAGCAGGAGTAGAAACT
TTCTATGTAGATGGAGCAGCTAATAGGGAGACTAAAATAGGGAAAGCAGG
GTATGTTACTGACAGAGGAAGGAAGAAAATTGTTTCCCTAACTGACACAA
CAAATCAGAAGACTGAATTGCAAGCAATTTATATAGCTTTGCAAGATTCA
GGATCAGAAGTAAACATAGTAACAGATTCACAGTATGCATTAGGGATCAT
TCAAGCACAACCAGATAAGAGTGAATCAGAGTTAGTTAACCAAATAATAG
AACAATTAATAAAAAAGGAAAGGGTCTACCTGTCATGGGTACCAGCACAT
AAAGGAATTGGAGGAAATGAACAAGTAGATAAATTAGTAAGTAATGGAAT
CAGGAAAGTGCTATTTCTAGATGGAATAGATAAAGCTCAAGAAGAGCATG
AAAAGTATCACAGCAATTGGAGAGCAATGGCTAGTGACTTTAATCTGCCA
CCCATAGTAGCAAAAGAAATAGTAGCTAGCTGTGATCAATGTCAGCTAAA
AGGAGAAGCCATGCATGGACAAGTAGACTGTAGTCCAGGGATATGGCAAT
TAGATTGTACACATTTAGAAGGAAAAATCATTCTGGTAGCAGTCCATGTA
GCCAGTGGCTACATAGAAGCAGAGGTTATCCCAGCAGAAACAGGACAAGA
AACAGCATACTTTATACTAAAATTAGCAGGAAGATGGCCAGTCAAAGTAA
TACATACAGACAATGGTAGTAATTTCACCAGTGCTGCAGTTAAGGCAGCC
TGTTGGTGGGCAGGTATCCAACAGGAATTTGGAATTCCCTACAATCCCCA
AAGTCAGGGAGTAGTAGAATCCATGAATAAGGAATTAAAGAAACTTATAG
GGCAGGTAAGAGATCAAGCTGAGCACCTTAAGACAGCAGTACAAATGGCA
GTATTCATTCACAATTTTAAAAGAAAAGGGGGGATTGGGGGGTACAGTGC
AGGGGAAAGAATAGTAGACATAATAGCAACAGACATACAAACTAGAGAAT
TACAAAAACAAATTATAAAAATTCAAAATTTTCGGGTTTATTACAGAGAC
AGCAGAGACCCCATTTGGAAAGGACCAGCCAAACTACTCTGGAAAGGTGA
AGGGGCAGTAGTAATACAAGATAATAGTGACATAAAGGTAGTACCAAGGA
GGAAAGCAAAAATCATTAAGGACTATGGAAAACAGATGGCAGGTGCTGAT
TGTGTGGCAGGTAGACAGGATGAAGATTAG
选择的HIV-1中国流行株env基因序列如SEQ ID NO:8
ATGAGAGTGAGGGGGACACGGAGGAATTATCAACAATGGTGGATATGGGG
CGTCTTGGGCTTTTGGATGTTAATGATTTGTAATGTGGAAGGAAACTTGT
GGGTCACAGTCTATTATGGGGTACCTGTGTGGAAAGAAGCAAAAACTACT
CTATTCTGTGCGTCAGATGCTAAAGCATATGAGACAGAAGTGCATAATGT
CTGGGCTACACATGCCTGTGTACCCACAGACCCCAACCCACAAGAAATAG
TTATGGAAAATGTAACAGAAAATTTTAACATGTGGAACAATGATATGGTG
AATCAGATGCATGAGGATGTAATCAGTTTATGGGATCAAAGCCTAAAGCC
ATGTGTAAAGTTGACCCCACTCTGTGTCACTTTAGAATGTAGAAATGTTA
GCAGTAATGGTAATGGTACCCGCAATGAGACCTACAATGAGAGCGTGAAG
GAGGTAAAAAATTGCTCTTTCAATGCAACCACATTATTAAGAGATAGGAA
GAAGACAGTGTATGCCCTTTTTTATAGACTTGATATAGCACCCCTTAATG
ATGAGAACTCTGGTAAGAACTCTAGTGAGTATTATAGATTAATAAATTGT
AATACCTCAGCCATAACACAAGCCTGTCCAAAGGTCACTTTTGATCCAAT
TCCTATACACTATTGCACTCCAGCTGGTTATGCGATTCTAAAGTGTAATG
ATAAGATATTCAATGGGACAGGACAATGCCATAATGTTAGCACGGTACAA
TGTACACATGGAATTAAGCCAGTGGTATCAACTCAACTACTGTTAAATGG
TAGCCTAGCAGAAAGAGAGATAATAATTAGATCTGAAAATCTGACAAACA
ATGTCAAAACAATAATAGTACATCTTAATAAATCTGTAGAAATTGTATGT
ACAAGACCCAACAATAATACAAGAAAAAGTATAAGGATAGGACCAGGACA
AACATTCTATGCAACAGGAGACATCATAGGAGACATAAGACAAGCACATT
GTAACATTAGTAAAGATAAATGGGATGAAACTTTACAGAGGGTAAGTAAA
AAATTAGCAGAACACTTCCCTAATAAAACAATAAAATTTGCATCATCCTC
AGGAGGGGACCTAGAAATTACAACACATAGCTTTAATTGTAGAGGAGAAT
TTTTCTATTGTAATACATCAGGCCTGTTTAATGGTACATACAATGGTACA
AAAGATAATTCAAGCTCAATCATCACAATCCCATGCAGAATAAAGCAAAT
TATAAACATGTGGCAGGAGGTAGGACGAGCAATGTATGCCCCTCCCATTG
AAGGAAACATAACATGTAAATCAAATATCACAGGACTACTATTGGTACGT
GATGGAGGAAGAACAGAGTCAAATGATACAGAGATATTCAGACCTGGTGG
AGGAGATATGAGAAACAATTGGAGAAATGAATTATATAAATATAAAGTGG
TAGAAATTAAGCCATTGGGAGTAGCACCCACTGCAGCAAAAAGGAGAGTG
GTGGAGAGAGAAAAAAGAGCAGTGGGACTAGGAGCTGTGTTCCTTGGGTT
CTTGGGAGCAGCAGGAAGCACTATGGGCGCGGCGTCAATAACGCTGACGG
TACAGGCCAGACAATTGTTGTCTGGTATAGTGCAACAGCAAAGCAATTTG
CTGAGAGCTATAGAGGCGCAACAGCATATGTTGCAACTCACGGTCTGGGG
CATTAAGCAGCTACAGACAAGAGTCCTGGCTATAGAAAGATACCTAAAGG
ATCAACAGCTCCTAGGGATTTGGGGCTGCTCTGGAAAACTTATCTGCACT
ACTGCTGTACCTTGGAACTCCAGTTGGAGTAACAAATCTCAACAAGAGAT
TTGGGATAACATGACCTGGATGCAGTGGGATAAGGAAATTAGTAATTACA
CAAACACAATATACAGGTTGCTTGAAGACTCGCAAAACCAGCAGGAAAGA
AATGAAAAAGATTTATTAGCATTGGACAGTTGGAAAAATCTATGGAGTTG
GTTTGACATAACAAATTGGCTGTGGTATATAAAAATATTCATAATGATAG
TAGGAGGCTTGATAGGTTCAAGAATAATTTTTGCTGTGCTTTCTATAGTG
AATAGAGTTAGGCAGGGATACTCACCTTTGTCGTTTCAGATCCCTACCCC
GAACCCAGGGGGACCAGGCAGGCTCGGAAGAATCGAAGAAGAAGGTGGAG
AGCAAGACAAAACCAGATCCATTCGATTAGTGAACGGGTTCTTAGCACTT
GCCTGGGACGACCTACGGAACCTGTGCCTCTTCAGTTACCACCGCTTGAG
TGACTTCATATTACTGACAGCGAGAGGGGTGGAACTTCTGGGACGCAACA
GCCTCAGGGGACTACAGAGGGGGTGGGAAGCCCTTAAATATCTGGGAAAT
CTTGTGCAGTATTGGGGTCTGGAGCTAAAAAAGAGTACTATTAGTCTGGT
TGATACCATAGCAATAGTAGTAGCTGAAGGAACAGATAGGATTATAAACA
TAGTACAAGGAATTTGTAGAGCTATCCACAACGTACCTAGAAGAATAAGA
CAGGGCCTTGAAGCAGCTTTGCAATAA
重组穿梭质粒pSC11-GPE全序列SEQ ID NO:9
TTCTTGAAGACGAAAGGGCCTCGTGATACGCCTATTTTTATAGGTTAATGTCATGATAATAATGGTT
TCTTAGACGTCAGGTGGCACTTTTCGGGGAAATGTGCGCGGAACCCCTATTTGTTTATTTTTCTAAA
TACATTCAAATATGTATCCGCTCATGAGACAATAACCCTGATAAATGCTTCAATAATATTGAAAAAG
GAAGAGTATGAGTATTCAACATTTCCGTGTCGCCCTTATTCCCTTTTTTGCGGCATTTTGCCTTCCT
GTTTTTGCTCACCCAGAAACGCTGGTGAAAGTAAAAGATGCTGAAGATCAGTTGGGTGCACGAGT
GGGTTACATCGAACTGGATCTCAACAGCGGTAAGATCCTTGAGAGTTTTCGCCCCGAAGAACGTT
TTCCAATGATGAGCACTTTTAAAGTTCTGCTATGTGGCGCGGTATTATCCCGTATTGACGCCGGGCA
AGAGCAACTCGGTCGCCGCATACACTATTCTCAGAATGACTTGGTTGAGTACTCACCAGTCACAG
AAAAGCATCTTACGGATGGCATGACAGTAAGAGAATTATGCAGTGCTGCCATAACCATGAGTGATA
ACACTGCGGCCAACTTACTTCTGACAACGATCGGAGGACCGAAGGAGCTAACCGCTTTTTTGCAC
AACATGGGGGATCATGTAACTCGCCTTGATCGTTGGGAACCGGAGCTGAATGAAGCCATACCAAA
CGACGAGCGTGACACCACGATGCCTGTAGCAATGGCAACAACGTTGCGCAAACTATTAACTGGCG
AACTACTTACTCTAGCTTCCCGGCAACAATTAATAGACTGGATGGAGGCGGATAAAGTTGCAGGA
CCACTTCTGCGCTCGGCCCTTCCGGCTGGCTGGTTTATTGCTGATAAATCTGGAGCCGGTGAGCGT
GGGTCTCGCGGTATCATTGCAGCACTGGGGCCAGATGGTAAGCCCTCCCGTATCGTAGTTATCTAC
ACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACT
GATTAAGCATTGGTAACTGTCAGACCAAGTTTACTCATATATACTTTAGATTGATTTAAAACTTCATT
TTTAATTTAAAAGGATCTAGGTGAAGATCCTTTTTGATAATCTCATGACCAAAATCCCTTAACGTGA
GTTTTCGTTCCACTGAGCGTCAGACCCCGTAGAAAAGATCAAAGGATCTTCTTGAGATCCTTTTTT
TCTGCGCGTAATCTGCTGCTTGCAAACAAAAAAACCACCGCTACCAGCGGTGGTTTGTTTGCCGG
ATCAAGAGCTACCAACTCTTTTTCCGAAGGTAACTGGCTTCAGCAGAGCGCAGATACCAAATACT
GTCCTTCTAGTGTAGCCGTAGTTAGGCCACCACTTCAAGAACTCTGTAGCACCGCCTACATACCTC
GCTCTGCTAATCCTGTTACCAGTGGCTGCTGCCAGTGGCGATAAGTCGTGTCTTACCGGGTTGGAC
TCAAGACGATAGTTACCGGATAAGGCGCAGCGGTCGGGCTGAACGGGGGGTTCGTGCACACAGC
CCAGCTTGGAGCGAACGACCTACACCGAACTGAGATACCTACAGCGTGAGCATTGAGAAAGCGC
CACGCTTCCCGAAGGGAGAAAGGCGGACAGGTATCCGGTAAGCGGCAGGGTCGGAACAGGAGA
GCGCACGAGGGAGCTTCCAGGGGGAAACGCCTGGTATCTTTATAGTCCTGTCGGGTTTCGCCACC
TCTGACTTGAGCGTCGATTTTTGTGATGCTCGTCAGGGGGGCGGAGCCTATGGAAAAACGCCAGC
AACGCGGCCTTTTTACGGTTCCTGGCCTTTTGCTGGCCTTTTGCTCACATGTTCTTTCCTGCGTTAT
CCCCTGATTCTGTGGATAACCGTATTACCGCCTTTGAGTGAGCTGATACCGCTCGCCGCAGCCGAA
CGACCGAGCGCAGCGAGTCAGTGAGCGAGGAAGCGGAAGAGCGCCCAATACGCAAACCGCCTC
TCCCCGCGCGTTGGCCGATTCATTAATGCAGCTGGCACGACAGGTTTCCCGACTGGAAAGCGGGC
AGTGAGCGCAACGCAATTAATGTGAGTTAGCTCACTCATTAGGCACCCCAGGCTTTACACTTTATG
CTTCCGGCTCGTATGTTGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGCTATGAC
CATGATTACGCCAAGCTTTTGCGATCAATAAATGGATCACAACCAGTATCTCTTAACGATGTTCTTC
GCAGATGATGATTCATTTTTTAAGTATTTGGCTAGTCAAGATGATGAAATCTTCATTATCTGATATAT
TGCAAATCACTCAATATCTAGACTTTCTGTTATTATTATTGATCCAATCAAAAAATAAATTAGAAGCC
GTGGGTCATTGTTATGAATCTCTTTCAGAGGAATACAGACAATTGACAAAATTCACAGACTTTCAA
GATTTTAAAAAACTGTTTAACAAGGTCCCTATTGTTACAGATGGAAGGGTCAAACTTAATAAAGGA
TATTTGTTCGACTTTGTGATTAGTTTGATGCGATTCAAAAAAGAATCCTCTCTAGCTACCACCGCAA
TAGATCCTGTTAGATACATAGATCCTCGTCGCAATATCGCATTTTCTAACGTGATGGATATATTAAAG
TCGAATAAAGTGAACAATAATTAATTCTTTATTGTCATCATGAACGGCGGACATATTCAGTTGATAA
TCGGCCCCATGTTTTCAGGTAAAAGTACAGAATTAATTAGACGAGTTAGACGTTATCAAATAGCTC
AATATAAATGCGTGACTATAAAATATTCTAACGATAATAGATACGGAACGGGACTATGGACGCATGA
TAAGAATAATTTTGAAGCATTGGAAGCAACTAAACTATGTGATCTCTTGGAATCAATTACAGATTTC
TCCGTGATAGGTATCGATGAAGGACAGTTCTTTCCAGACATTGTTGAATTCCGAGCTTGGCTGCAG
GTCGGGGATCCCCCCTGCCCGGTTATTATTATTTTTGACACCAGACCAACTGGTAATGGTAGCGAC
CGGCGCTCAGCTGAATTCCGCCGATACTGACGGGCTCCAGGAGTCGTCGCCACCAATCCCCATAT
GGAAACCGTCGATATTCAGCCATGTGCCTTCTTCCGCGTGCAGCAGATGGCGATGGCTGGTTTCCA
TCAGTTGCTGTTGACTGTAGCGGCTGATGTTGAACTGGAAGTCGCCGCGCCACTGGTGTGGGCCA
TAATTCAATTCGCGCGTCCCGCAGCGCAGACCGTTTTCGCTCGGGAAGACGTACGGGGTATACATG
TCTGACAATGGCAGATCCCAGCGGTCAAAACAGGCGGCAGTAAGGCGGTCGGGATAGTTTTCTTG
CGGCCCTAATCCGAGCCAGTTTACCCGCTCTGCTACCTGCGCCAGCTGGCAGTTCAGGCCAATCC
GCGCCGGATGCGGTGTATCGCTCGCCACTTCAACATCAACGGTAATCGCCATTTGACCACTACCAT
CAATCCGGTAGGTTTTCCGGCTGATAAATAAGGTTTTCCCCTGATGCTGCCACGCGTGAGCGGTCG
TAATCAGCACCGCATCAGCAAGTGTATCTGCCGTGCACTGCAACAACGCTGCTTCGGCCTGGTAAT
GGCCCGCCGCCTTCCAGCGTTCGACCCAGGCGTTAGGGTCAATGCGGGTCGCTTCACTTACGCCA
ATGTCGTTATCCAGCGGTGCACGGGTGAACTGATCGCGCAGCGGCGTCAGCAGTTGTITTTTATCG
CCAATCCACATCTGTGAAAGAAAGCCTGACTGGCGGTTAAATTGCCAACGCTTATTACCCAGCTCG
ATGCAAAAATCCATTTCGCTGGTGGTCAGATGCGGGATGGCGTGGGACGCGGCGGGGAGCGTCA
CACTGAGGTTTTCCGCCAGACGCCACTGCTGCCAGGCGCTGATGTGCCCGGCTTCTGACCATGCG
GTCGCGTTCGGTTGCACTACGCGTACTGTGAGCCAGAGTTGCCCGGCGCTCTCCGGCTGCGGTAG
TTCAGGCAGTTCAATCAACTGTTTACCTTGTGGAGCGACATCCAGAGGCACTTCACCGCTTGCCA
GCGGCTTACCATCCAGCGCCACCATCCAGTGCAGGAGCTCGTTATCGCTATGACGGAACAGGTATT
CGCTGGTCACTTCGATGGTTTGCCCGGATAAACGGAACTGGAAAAACTGCTGCTGGTGTTTTGCT
TCCGTCAGCGCTGGATGCGGCGTGCGGTCGGCAAAGACCAGACCGTTCATACAGAACTGGCGATC
GTTCGGCGTATCGCCAAAATCACCGCCGTAAGCCGACCACGGGTTGCCGTTTTCATCATATTTAAT
CAGCGACTGATCCACCCAGTCCCAGACGAAGCCGCCCTGTAAACGGGGATACTGACGAAACGCC
TGCCAGTATTTAGCGAAACCGCCAAGACTGTTACCCATCGCGTGGGCGTATTCGCAAAGGATCAG
CGGGCGCGTCTCTCCAGGTAGCGAAAGCCATTTTTTGATGGACCATTTCGGCACAGCCGGGAAGG
GCTGGTCTTCATCCACGCGCGCGTACATCGGGCAAATAATATCGGTGGCCGTGGTGTCGGCTCCGC
CGCCTTCATACTGCACCGGGCGGGAAGGATCGACAGATTTGATCCAGCGATACAGCGCGTCGTGA
TTAGCGCCGTGGCCTGATTCATTCCCCAGCGACCAGATGATCACACTCGGGTGATTACGATCGCGC
TGCACCATTCGCGTTACGCGTTCGCTCATCGCCGGTAGCCAGCGCGGATCATCGGTCAGACGATTC
ATTGGCACCATGCCGTGGGTTTCAATATTGGCTTCATCCACCACATACAGGCCGTAGCGGTCGCAC
AGCGTGTACCACAGCGGATGGTTCGGATAATGCGAACAGCGCACGGCGTTAAAGTTGTTCTGCTT
CATCAGCAGGATATCCTGCACCATCGTCTGCTCATCCATGACCTGACCATGCAGAGGATGATGCTC
GTGACGGTTAACGCCTCGAATCAGCAACGGCTTGCCGTTCAGCAGCAGCAGACCATTTTCAATCC
GCACCTCGCGGAAACCGACATCGCAGGCTTCTGCTTCAATCAGCGTGCCGTCGGCGGTGTGCAGT
TCAACCACCGCACGATAGAGATTCGGGATTTCGGCGCTCCACAGTTTCGGGTTTTCGACGTTGAG
ACGTAGTGTGACGCGATCGGCATAACCACCACGCTCATCGATAATTTCACCGCCGAAAGGCGCGG
TGCCGCTGGCGACCTGCGTTTCACCCTGCCATAAAGAAACTGTTACCCGTAGGTAGTCACGCAAC
TCGCCGCACATCTGAACTTCAGCCTCCAGTACAGCGCGGCTGAAATCATCATTAAAGCGAGTGGC
AACATGGAAATCGCTGATTTGTGTAGTCGGTTTATGCAGCAACGAGACGTCACGGAAAATGCCGC
TCATCCGCCACATATCCTGATCTTCCAGATAACTGCCGTCACTCCAACGCAGCACCATCACCGCGA
GGCGGTTTTCTCCGGCGCGTAAAAATGCGCTCAGGTCAAATTCAGACGGCAAACGACTGTCCTGG
CCGTAACCGACCCAGCGCCCGTTGCACCACAGATGAAACGCCGAGTTAACGCCATCAAAAATAAT
TCGCGTCTGGCCTTCCTGTAGCCAGCTTTCATCAACATTAAATGTGAGCGAGTAACAACCCGTCGG
ATTCTCCGTGGGAACAAACGGCGGATTGACCGTAATGGGATAGGTTACGTTGGTGTAGATGGGCG
CATCGTAACCGTGCATCTGCCAGTTTGAGGGGACGACGACAGTATCGGCCTCAGGAAGATCGCAC
TCCAGCCAGCTTTCCGGCACCGCTTCTGGTGCCGGAAACCAGGCAAAGCGCCATTCGCCATTCAG
GCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAG
GGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTCACGACGTTGTAAA
ACGACGGGATCCCTCGAGGAATTCATTTATAGCATAGAAAAAAACAAAATGAAATTCTACTATATT
TTTACATACATATATTCTAAATATGAAAGTGGTGATTGTGACTAGCGTAGCATCGCTTCTAGACATAT
ACTATATAGTAATACCAATACTCAAGACTACGAAACTGATACAATCTCTTATCATGTGGGTAATGTTC
TCGATGTCGAATAGCCATATGCCGGTAGTTGCGATATACATAAACTGATCACTAATTCCAAACCCAC
CCGCTTTTTATAGTAAGTTTTTCACCCATAAATAATAAATACAATAATTAATTTCTCGTAAAAGTAGA
AAATATATTCTAATTTATTGCACGGTAAGGAAGTAGAATCATAAAGAACAGTGACGGATCCCGTCG
ACACCCGGGCCCAACTAGAATGGGCGCCCGGGCCAGCATCCTGCGGGGAGGCAAGCTGGACAAA
TGGGAGAAGATCCGGCTGAGACCCGGAGGCAAGAAACACTACATGCTGAAGCACCTGGTGTGGG
CCAGCCGGGAGCTGGAAAGATTCGCCCTGAACCCCGGCCTCCTGGAGACCAGCGAAGGCTGCAA
GCAGATCATTAAGCAGCTGCAACCCGCCCTGCAGACCGGCACCGAGGAACTGCGGAGCCTGTTC
AACACCGTGGCCACCCTGTACTGCGTGCACGAGGAAATCGAGGTGCGGGACACCAAGGAGGCCC
TGGACAAGATCGAGGAAGAGCAGAACAAGATCCAGCAAAAGACCCAGCAGGCCAAGAAAGCCG
ACGAGAAGGTGAGCCAGAACTACCCCATCGTGCAGAACCCCCAGGGCCAGATGGTGCACCAGCC
TCTGAGCCCCCGGACCCTGAACGCCTGGGTGAAGGTCGTGGAGGAAAAGGCCTTCAGCCCCGAG
GTGATCCCTATGTTCACCGCCCTGAGCGAGGGCGCCACCCCCCAGGACCTGAACACCATGCTGAA
CACCGTGGGCGGGCACCAGGCTGCCATGCAGATGCTGAAGGACACCATCAACGAGGAAGCCGCT
GAGTGGGACCGGCTGCACCCCGTGCACGCCGGCCCCGTGGCCCCTGGCCAGATGCGGGAGCCCA
GAGGCAGCGACATCGCCGGCACCACATCCAGCCTGCAGGAGCAGATCGGCTGGATGACCAACAA
TCCTCCCATCCCAGTGGGCGAGATCTACAAGCGGTGGATTATCCTGGGCCTGAACAAGATCGTGC
GGATGTACAGCCCCACCTCCATCCTGGACATCAAGCAGGGCCCTAAGGAGCCCTTCCGGGACTAC
GTGGATAGATTCTTTAAGACCCTGCGGGCCGAGCAGGCCACCCAGGACGTGAAGAACTGGATGA
CCGACACCCTGCTCGTGCAGAATGCCAACCCCGACTGCAAGACCATCCTGCGGGCCCTGGGCAG
CGGCGCCTCCCTGGAAGAGATGATGACCGCCTGCCAGGGCGTGGGAGGCCCCAGCCACAAGGCC
CGGGTGCTGGCTGAGGCCATGAGCCAGACCTCCAACACCATCCTGATGCAGCGGAGCAACTTCA
AGGGCAGCAAACGGATCGTGAAGTGCTTCAACTGTGGCAAGGAGGGCCACATCGCCAAGAACTG
CAGGGCCCCTAGGAAAAAAGGCTGTTGGAAATGTGGAAAGGAAGGACACCAAATGAAAGACTG
TACTGAAAGGCAGGCGAATTTTTTAGGGAAATTTTGGCCTTCCCACAAGGGGAGGCCAGGGAATT
TTCTCCAGAGCAGACCAGAGCCAACAGCCCCACCAGCAGAGAGCTTCAGGTTCGAGGAGACAA
CCCCAGCTCCGAAGCAGGAACCGAAAGACAGGGAACCCTTAACTTCCCTCAGATCACTCTTTGGC
AGCGACCCCTTGTCTCAATAAAAGTAGGGGGCCAGATAAAAGAGGCTCTCTTGGCCACCGGCGCC
GATGACACCGTGCTGGAGGAAGTGAACCTGCCCGGCAAGTGGAAGCCCAAGATGATCGGCGGGA
TCGGAGGCTTCATCAAGGTGCGGCAGTACGAGCAGATCCCCATTGAGATCTGCGGCAAGAAAGCC
ATCGGCACCGTGCTGGTGGGCCCCACCCCCGTGAACATCATTGGCCGGAACATGCTGACCCAGCT
GGGCTGCACCCTGAACTTCCCCATCAGCCCCATCGAGACCGTGCCCGTGAAGCTGAAGCCCGGCA
TGGACGGCCCCAAGGTGAAGCAGTGGCCCCTGACCGAGGAAAAGATCAAGGCCCTGACCGCCAT
CTGCGACGAGATGGAAAAGGAGGGCAAGATCACCAAGATCGGCCCCGACAACCCCTACAACACC
CCCATCTTCGCCATCCGGAAGAAAGACAGCTCCAAGTGGCGGAAGCTGGTGGACTTCCGGGAGC
TGAACAAGCGGACCCAGGACTTCTGGGAGGTGCAGCTGGGCATCCCCCACCCCGCCGGCCTGAA
GAAAAAGAAAAGCGTGACCGTGCTGGACGTGGGCGACGCCTACTTCAGCGTGCCCCTGGATAAG
GACTTCCGGAAGTACACCGCCTTCACCATCCCCAGCGTGAACAATGAGACCCCCGGCATCCGGTA
CCAGTACAACGTGCTGCCCCAGGGCTGGAAGGGCAGCCCCGCCATCTTCCAGTGCAGCATGACC
AAGATCCTGGAGCCCTTCCGGAAGCAGAACCCCGACATCGTGATCTACCAGTACATGCATGATCT
GTACGTGGGCAGCGACCTGGAGATCGGCCAGCACCGGACCAAGATCGAGGAACTGCGGGAGCAC
CTCCTGAAGTGGGGCTTCACCACACCCGACAAGAAACACCAGAAGGAGCCTCCCTTCCTGTGGA
TGGGCTACGAGCTGCACCCCGACAAGTGGACCGTGCAGCCCATCCAGCTGCCCGAGAAGGACAG
CTGGACCGTGAACGACATCCAGAAGCTGGTGGGCAAGCTGAACTGGGCCAGCCAGATCTACCCC
GGCATCAAGGTGCGGCAGCTGTGCAAGCTCCTGCGGGGCGCCAAGGCCCTGACCGACATCGTGC
CCCTGACCGAGGAAGCCGAGCTGGAACTGGCCGAGAACCGGGAGATCCTGAAGGAGCCCGTGC
ACGGCGCCTACTATGACCCCAGCAAGGAGCTGATCGCCGAGATCCAGAAGCAGGGCCAAGACCA
GTGGACCTACCAGATCTACCAGGAGCCCTTCAAGAACCTGAAGACCGGCAAGTACGCCAAGATG
CGGACCGCCCACACCAACGACGTGAAGCAGCTGACCGAGGCCGTGCAGAAGATCGCCATGGAG
AGCATCGTGATTTGGGGCAAGATCCCCAAGTTCCGGCTGCCCATCCAGAAGGAGACCTGGGAGA
CCTGGTGGACCGACTACTGGCAGGCCACCTGGATTCCCGAGTGGGAGTTCGTGAACACCCCTCCC
CTGGTGAAGCTGTGGTACCAGCTGGAGAAGGACCCCATCGCCGGCGTGGAGACCTTCTACGTGG
ACGGCGCCGCTAACCGGGAGACCAAGATCGGCAAGGCCGGCTACGTGACCGACAGAGGCCGGA
AGAAAATCGTGAGCCTGACCGACACAACCAACCAGAAGACCGAGCTGCAGGCCATCTACATCGC
CCTGCAGGACAGCGGCAGCGAGGTGAACATCGTGACCGACAGCCAGTACGCCCTGGGCATCATT
CAGGCCCAGCCCGACAAGAGCGAGAGCGAGCTGGTGAACCAGATCATTGAGCAGCTGATCAAGA
AAGAGCGGGTGTACCTGAGCTGGGTGCCCGCCCACAAGGGCATCGGGGGCAACGAGCAGGTGG
ACAAGCTGGTGAGCAACGGCATCCGGAAGGTGCTGTTCCTGGACGGCATCGACAAGGCCCAGGA
GGAACACGAGAAGTACCACAGCAACTGGCGGGCCATGGCCAGCGACTTCAACCTGCCTCCCATC
GTGGCCAAGGAGATCGTGGCCAGCTGCGACCAGTGTCAGCTGAAGGGCGAGGCCATGCACGGCC
AGGTGGACTGCAGCCCCGGCATCTGGCAGCTGGACTGCACCCACCTGGAGGGCAAGATCATTCT
GGTGGCCGTCCACGTGGCCAGCGGCTACATCGAGGCCGAGGTGATCCCCGCCGAGACCGGCCAG
GAGACCGCCTACTTCATCCTGAAGCTGGCCGGCCGGCAGGATGAGGACTGAGGATCTCAGAGTAA
TGACATGGTTCCTTCCATCCTCCAAAGGTGACCAATAATAGTTTGTAAGTATCATTATGAACTAATG
AATTTTCAACATATTTGATATATTTCAATCCATTGCCATCATTGTTCTTATCGATATTTGAGTTGGCTC
ACTTTGCCAGTAAGAGTCTATTCAAATTGGCTTCTGAGTCCATTTGACACAACACCTTTGATCTTT
GACAGTTTCCTTGGTTTTAGGTGCTAGATGATTTCTCAGGCTCACCTTAGACATTTCCTGCCACAG
ACTTAGAATCAGCCATTTCTCTAAGGACCCTGATTCCATTTCATGAGAAATGATAGAGACCACAAT
CAAAACAAGTCATGAATTTATACTGATATTTTCAATTCAAATTAAAGATGAGGTTTTTGCTAAATTT
TTTTGAGTTTATATTTGTATGTCTTATGCTGAAAAATCTTGTTTCCTAATTAGTAACATAATTATTCAT
TTGATGGGTAAATATTTTAGGGCCGATTCTTTGGTTTTATAGCCAAGATACCCTGTTGATAAAGTCTT
GTGGGAGCAATTATAAGACTGGCTTATTTTGAAGCTTTTTAAAAAAGACATCCTTACCTGTTTTAAC
TGTAGATTATATTAACTTAAATAGGTACAGCCCACGCTTGATGGGATCCATGAGAGTGAGGGGGAC
ACGGAGGAATTATCAACAATGGTGGATATGGGGCGTCTTGGGCTTTTGGATGTTAATGATTTGTAAT
GTGGAAGGAAACTTGTGGGTCACAGTCTATTATGGGGTACCTGTGTGGAAAGAAGCAAAAACTAC
TCTATTCTGTGCGTCAGATGCTAAAGCATATGAGACAGAAGTGCATAATGTCTGGGCTACACATGC
CTGTGTACCCACAGACCCCAACCCACAAGAAATAGTTATGGAAAATGTAACAGAAAATTTTAACA
TGTGGAACAATGATATGGTGAATCAGATGCATGAGGATGTAATCAGTTTATGGGATCAAAGCCTAA
AGCCATGTGTAAAGTTGACCCCACTCTGTGTCACTTTAGAATGTAGAAATGTTAGCAGTAATGGTA
ATGGTACCCGCAATGAGACCTACAATGAGAGCGTGAAGGAGGTAAAAAATTGCTCTTTCAATGCA
ACCACATTATTAAGAGATAGGAAGAAGACAGTGTATGCCCTTTTTTATAGACTTGATATAGCACCCC
TTAATGATGAGAACTCTGGTAAGAACTCTAGTGAGTATTATAGATTAATAAATTGTAATACCTCAGC
CATAACACAAGCCTGTCCAAAGGTCACTTTTGATCCAATTCCTATACACTATTGCACTCCAGCTGG
TTATGCGATTCTAAAGTGTAATGATAAGATATTCAATGGGACAGGACAATGCCATAATGTTAGCACG
GTACAATGTACACATGGAATTAAGCCAGTGGTATCAACTCAACTACTGTTAAATGGTAGCCTAGCA
GAAAGAGAGATAATAATTAGATCTGAAAATCTGACAAACAATGTCAAAACAATAATAGTACATCTT
AATAAATCTGTAGAAATTGTATGTACAAGACCCAACAATAATACAAGAAAAAGTATAAGGATAGGA
CCAGGACAAACATTCTATGCAACAGGAGACATCATAGGAGACATAAGACAAGCACATTGTAACAT
TAGTAAAGATAAATGGGATGAAACTTTACAGAGGGTAAGTAAAAAATTAGCAGAACACTTCCCTA
ATAAAACAATAAAATTTGCATCATCCTCAGGAGGGGACCTAGAAATTACAACACATAGCTTTAATT
GTAGAGGAGAATTTTTCTATTGTAATACATCAGGCCTGTTTAATGGTACATACAATGGTACAAAAGA
TAATTCAAGCTCAATCATCACAATCCCATGCAGAATAAAGCAAATTATAAACATGTGGCAGGAGGT
AGGACGAGCAATGTATGCCCCTCCCATTGAAGGAAACATAACATGTAAATCAAATATCACAGGACT
ACTATTGGTACGTGATGGAGGAAGAACAGAGTCAAATGATACAGAGATATTCAGACCTGGTGGAG
GAGATATGAGAAACAATTGGAGAAATGAATTATATAAATATAAAGTGGTAGAAATTAAGCCATTGG
GAGTAGCACCCACTGCAGCAAAAAGGAGAGTGGTGGAGAGAGAAAAAAGAGCAGTGGGACTAG
GAGCTGTGTTCCTTGGGTTCTTGGGAGCAGCAGGAAGCACTATGGGCGCGGCGTCAATAACGCTG
ACGGTACAGGCCAGACAATTGTTGTCTGGTATAGTGCAACAGCAAAGCAATTTGCTGAGAGCTAT
AGAGGCGCAACAGCATATGTTGCAACTCACGGTCTGGGGCATTAAGCAGCTACAGACAAGAGTCC
TGGCTATAGAAAGATACCTAAAGGATCAACAGCTCCTAGGGATTTGGGGCTGCTCTGGAAAACTTA
TCTGCACTACTGCTGTACCTTGGAACTCCAGTTGGAGTAACAAATCTCAACAAGAGATTTGGGATA
ACATGACCTGGATGCAGTGGGATAAGGAAATTAGTAATTACACAAACACAATATACAGGTTGCTTG
AAGACTCGCAAAACCAGCAGGAAAGAAATGAAAAAGATTTATTAGCATTGGACAGTTGGAAAAA
TCTATGGAGTTGGTTTGACATAACAAATTGGCTGTGGTATATAAAAATATTCATAATGATAGTAGGA
GGCTTGATAGGTTCAAGAATAATTTTTGCTGTGCTTTCTATAGTGAATAGAGTTAGGCAGGGATACT
CACCTTTGTCGTTTCAGATCCCTACCCCGAACCCAGGGGGACCAGGCAGGCTCGGAAGAATCGAA
GAAGAAGGTGGAGAGCAAGACAAAACCAGATCCATTCGATTAGTGAACGGGTTCTTAGCACTTG
CCTGGGACGACCTACGGAACCTGTGCCTCTTCAGTTACCACCGCTTGAGTGACTTCATATTACTGA
CAGCGAGAGGGGTGGAACTTCTGGGACGCAACAGCCTCAGGGGACTACAGAGGGGGTGGGAAG
CCCTTAAATATCTGGGAAATCTTGTGCAGTATTGGGGTCTGGAGCTAAAAAAGAGTACTATTAGTC
TGGTTGATACCATAGCAATAGTAGTAGCTGAAGGAACAGATAGGATTATAAACATAGTACAAGGAA
TTTGTAGAGCTATCCACAACGTACCTAGAAGAATAAGACAGGGCCTTGAAGCAGCTTTGCAATAAT
CTAGTACCATGGTACCTTAAGCTAGCATGCAGCGGCCGCGGATCGACAGGCCTAATTAATTAAGGG
AATTCTGTGAGCGTATGGCAAACGAAGGAAAAATTAGTTATAGTAGCCGCACTCGATGGGACATTT
CAACGTAAACCGTTTAATAATATTTTGAATCTTATTCCATTATCTGAAATGGTGGTAAAACTAACTG
CTGTGTGTATGAAATGCTTTAAGGAGGCTTCCTTTTCTAAACGATTGGGTGAGGAAACCGAGATAG
AAATAATAGGAGGTAATGATATGTATCAATCGGTGTGTAGAAAGTGTTACATCGACTCATAATATTAT
ATTTTTTATCTAAAAAACTAAAAATAAACATTGATTAAATTTTAATATAATACTTAAAAATGGATGTT
GTGTCGTTAGATAAACCGTTTATGTATTTTGAGGAAATTGATAATGAGTTAGATTACGAACCAGAAA
GTGCAAATGAGGTCGCAAAAAAACTGCCGTATCAAGGACAGTTAAAACTATTACTAGGAGAATTA
TTTTTTCTTAGTAAGTTACAGCGACACGGTATATTAGATGGTGCCACCGTAGTGTATATAGGATCTG
CTCCCGGTACACATATACGTTATTTGAGAGATCATTTCTATAATTTAGGAGTGATCATCAAATGGATG
CTAATTGACGGCCGCCATCATGATCCTATTTTAAATGGATTGCGTGATGTGACTCTAGTGACTCGGT
TCGTTGATGAGGAATATCTACGATCCATCAAAAAACAACTGCATCCTTCTAAGATTATTTTAATTTC
TGATGTGAGATCCAAACGAGGAGGAAATGAACCTAGTACGGCGGATTTACTAAGTAATTACGCTCT
ACAAAATGTCATGATTAGTATTTTAAACCCCGTGGCGTCTAGTCTTAAATGGAGATGCCCGTTTCCA
GATCAATGGATCAAGGACTTTTATATCCCACACGGTAATAAAATGTTACAACCTTTTGCTCCTTCAT
ATTCAGGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTACCCAACTTAATCGCCT
TGCAGCACATCCCCCTTTCGCCAGCTGGCGTAATAGCGAAGAGGCCCGCACCGATCGCCCTTCCC
AACAGTTGCGCAGCCTGAATGGCGAATGGCGCCTGATGCGGTATTTTCTCTTTACGCATCTGTGCG
GTATTTCACACCGCATATGGTGCACTCTCAGTACCATCTGCTCTGATGCCGCATAGTTAAGCCAGTA
CACTCCGCTATCGCTACGTGACTGGGTCATGGCTGCGCCCCGACACCCGCCAACACCCGCTGACG
CGCCCTGACGGGCTTGTCTGCTCCCGGCATCCGCTTACAGACAAGCTGTGACCGTCTCCGGGAGC
TGCATGTGTCAGAGGTTTTCACCGTCATCACCGAAACGCGCG