包括SORF构建体的多基因表达和使用多蛋白、前体蛋白和蛋白酶解的方法
相关申请的交叉参考
本申请要求2005年7月21日申请的U.S.临时申请No.60/701855的权益,在此以其整体引入作为参考。
联邦政府资助研究或研发的声明
不适用
参照序列表,表格或计算机程序列表光盘附件不适用(提供了序列表,但不是作为光盘附件)。
发明背景
本发明的领域是分子生物学,尤其总地涉及重组蛋白表达领域,特别是重组多蛋白(polyprotein)或前体蛋白(pre-protein)的表达和加工,包括翻译后加工。
近些年来发现抗体作为诊断工具和治疗形态的使用日益增加。第一个FDA批准的单克隆抗体,OKT 3(Johnson and Johnson)批准用于治疗患有肾脏移植排斥的患者。在1998年批准了Herceptin(GenentechInc.的商标,South San Francisco,CA),一种人源化的单克隆抗体,用于治疗患有转移性乳癌的患者。各种基于抗体的治疗正显示出在临床研发的各个阶段中的希望。抗体技术广泛临床应用的一个限制是通常需要大量抗体用于治疗功效并且与充足生产相关的成本是相当大的。中国仓鼠卵巢(CHO)细胞和NS0黑素瘤细胞是最常用的哺乳动物细胞系,用于商业规模生产糖基化人蛋白,如抗体和其他生物治疗剂(Humphreys和Glover 2001.Curr.Opln.Drug Discov.Devel.4:172-85)。哺乳动物细胞系生产通常在分批发酵罐中5-7天培养产生50-250mg/L,或在流加发酵罐中7-12天产生300-600mg/L。可以在酵母或大肠杆菌中成功地生产非糖基化的免疫球蛋白(参见,例如,Humphreys DP等,2000,Protein Expr purify.20(2):252-64),然而,细菌表达系统中的大多数成功是抗体片段(Humphreys,D.P.2003.Curr.Opin.Drug Discov.Devel.20036:188-96)。
表达多个基因片段或基因领域中的重要发展是蛋白内含子的发现(参见,例如,Hirata,R等,1990,J.Biol.Chem.265:6726-6733;Kane,PM等,1990,Science 250:651-657;Xu,M-Q和Perler,FB,1996,EMBO Journal 15(19):5146-5153)。认为蛋白内含子是基因内含子的蛋白等价物并促进蛋白剪接。如Snell K的US7026526中所述的,蛋白剪接是切除前体蛋白(蛋白内含子)的内部片段并连接蛋白(蛋白外显子)的两侧片段形成成熟蛋白的过程。已经在来自原核生物和真核生物的多种蛋白质中观察到该过程(Perler,F.B.,Xu,M.Q.,Paulus,H.Current Opinion in Chemical Biology 1997,1,292-299;Perler,F.B.Nucleic Acids Research 1999,27,346-347)。蛋白内含子单位含有催化蛋白质剪接需要的必需成分并通常含有参与蛋白内含子活动性的核酸内切酶结构域(Perler,F.B.Nucleic Acids Research 1994,22,1127-1127)。
尽管基于蛋白内含子系统的主要焦点在于纯化技术的产生和来自表达基因片段的新融合蛋白,US7026526报道了具有修饰蛋白内含子的DNA构建体,用于表达作为分开蛋白质的多个基因产物来获得植物中的大量性状。然而,仍然缺乏的是那些系统可以成功地用于分开蛋白质表达的显示,所述分开的蛋白装配成功能性多亚基(multimeric)蛋白,胞外分泌的蛋白质,哺乳动物蛋白,或者真核宿主细胞中产生的蛋白。值得注意的是免疫球蛋白落入所有这些类别中。
增加将US7026526的修饰蛋白内含子方法延伸至其他基因或目的的困难是与涉及的蛋白内含子系统相关的所需蛋白外显子基因片段引起的潜在重要性的认识。Paulus报道“实际上,蛋白质剪接,即使完全通过蛋白内含子来催化,可以受到蛋白质外显子序列的显著影响。这种影响通过嵌合蛋白剪接系统表达的事实显现出来,其中将蛋白内含子序列框内插入外源编码序列之间,通常导致实质性的副反应,如剪接连接的上游或下游处的裂解(Xu M-Q等,1993,Cell 75:1371-77;和Shingledecker K等,1998,Gene 207:187-95)。这表明了蛋白内含子呈现蛋白剪接最佳化结构的能力,而在特定蛋白外显子的范围内没有产生副反应。”参见Paulus H,2000,Protein splicing and related formsof protein autoprocessing(蛋白质剪接和相关形式的蛋白质自体加工),Annu.Rev.Biochem.69:447-96。另一名评论员声称:“尽管可能使用合理的设计将所需的特征和活性引入蛋白质中,使工程化的产物有效而可行需要的微妙改变通常仍是超越我们的预测能力(Shao,Z.和Arnold,F.H.1996,Curr.Opin.Struct.Biol.6,513-518)。无论如何,已经发现就在蛋白内含子两侧的片段影响剪接的效率(Chong,S.等,1998,Nucleic Acids Res.26,5109-5115;Southwrth,M.W.等,199,Biotechniques 27,110-114)和一些蛋白宿主可能与蛋白内含子活性不相容。尽管高表达和产物纯度是重要的考虑因素,如果最终产物没有活性,那么它们是没有实际意义的。”参见,Amitai G和Pietrokovski,1999,Nature Biotechnology 17:854-855。
因此,在其中优选结果是裂解而没有再连接的修饰蛋白内含子系统中,相对于给定蛋白内含子序列的外源蛋白外显子的存在影响实践上有效的精确裂解的组合,再连接的不存在和副反应的不存在。清楚修饰蛋白内含子方法适用于保留功能活性的特定蛋白质作为终产物例如免疫球蛋白和其他生物治疗剂的重组生产表示了对创新的实质性挑战。
在本发明中,已经接受了该挑战,不仅用于基于蛋白内含子的系统,而且以先锋的意义研发用于关于hedgehog结构域的应用中。Hedgehog家族中的蛋白质是脊椎动物胚胎模式化必需的胞内信号分子。参见,Mann,R.K.和Beachy,P.A.(2000)Biochim.Biophys.Acta.1529,188-202;Beachy,PA,(1997)Cold Spring Harb Symp Quant Biol62:191-204。天然hedgehog前体蛋白通过与蛋白剪接相似的自体加工反应裂解成C-端(Hh-C)和N-端片段(Hh-N)。对于包括适于多个分开的蛋白片段表达的修饰形式的系统的创造性研发,Hedgehog系统呈现出未经试验的机会。
之前使用单个载体通过重组DNA技术表达全长抗体/免疫球蛋白分子的尝试取得了有限的成功,通常导致抗体/免疫球蛋白分子的重链和轻链显著不同水平的表达,更特别地,对于第二种基因较低水平的表达。其他因素需要与另一条链相比较的一条链相对更高的表达水平,用于适当装配的多亚基抗体或其功能性片段的最佳化生产。因此,一个问题是形成全面低产量的装配的多亚基抗体的细胞内重链和轻链表达的次优化学计算法。Fang等指出为了从单个载体表达高水平的全部生物功能性抗体,需要重链和轻链的等摩尔表达(参见Fang等,2005,Nature Biotechnology 23:584-590;US专利公开2004/0265955A1)。此外,依赖于独立表达多个多肽的载体系统的常规表达系统受到这些因素如启动子相互作用(例如,启动子干扰)的显著影响。这些相互作用可能损害基因的有效表达和/或所表达的链的装配,或需要使用多于一个的载体(参见,例如,US专利6331415,Cabilly等)。由于除了通常需要其他操作以外的潜在复杂化,失去一个或多个单独的载体,需要多个载体是不利的。
限制从单个载体表达两个或多个编码序列能力的其他因素包括载体自身的包装能力。例如,在考虑合适的载体/编码序列中,待考虑的因素包括载体的包装能力(例如,对于腺相关病毒,AAV,大约4,500bp);重组蛋白通过载体转化的细胞或器官体外/体内表达的持续时间(例如,对于腺病毒载体的短期表达);如果使用病毒载体,支持载体有效感染的细胞类型;和所需的基因产物表达水平。两个或多个基因产物的受控表达和病毒载体如腺病毒和AAV的包装限制的需求限制了对于载体构建和用于特定基因如免疫球蛋白或其片段表达的系统的选择。
从单个载体表达两个或多个蛋白质或多肽序列的更多方法中,在目标编码序列之间使用两个或多个启动子或单个启动子和内部核糖体进入位点(IRES)序列来驱动单个编码序列的表达。由于启动子干扰,单个载体内使用两个启动子导致低蛋白表达。当两个编码序列由IRES序列隔开时,第二个编码序列的翻译表达通常显著弱于第一个的(Furler等,2001,Gene Therapy 8:864-873)。US专利公开2004/0241821描述了一种黄病毒,其中将异种编码序列掺入病毒多蛋白编码序列的下游,并通过IRES与其隔开。US专利公开2005/0026137中描述了用于重组基因表达的核锚定载体策略,包括其中片段通过蛋白酶识别位点隔开的融合蛋白。
单个开放阅读框(sORF)中多蛋白形式的蛋白连接是在许多天然病毒包括小核糖核酸病毒科的复制中观察到的策略。翻译时,病毒编码的蛋白酶介导多蛋白的快速分子内(cis)裂解来产生分开的成熟蛋白质产物。口蹄疫病毒(FMDV)是小核糖核酸病毒科内的一组,表达编码大约225kD多蛋白的单个长开放阅读框。全长翻译产物在衣壳蛋白前体(P1-2A)和多蛋白2BC和P3的复制结构域之间产生的2A片段的C-端处经历快速分子内(cis)裂解,并且该裂解是通过核糖体stutter机理由2A片段自身介导的(Ryan等,1991,J.Gen.Virol.72:2727-2732);Vakharia等,198887,J.Virol.61:3199-3207)。已经鉴定出通过FMDV 2A片段表达裂解活性必需的氨基酸残基。还已经从aphthoviridae和小核糖核酸病毒科的cardioviridae表征了2A和相似的结构域(Donnelly等,1997,J.Gen.Virol.78:13-21)。
仍然在使用蛋白酶解处理技术的其他尝试中,重组胰岛素生产的早期描述包括,例如,EP055945(Genentech);和EP037723(The Regentsof the University of California)。然而,这是一个巨大的飞跃,能够在研发更大且更复杂的功能性蛋白如免疫球蛋白的重组表达中应用这些成果。功能性抗体分子的实例可以涉及需要四个或多个链装配的杂多聚体(例如,两个免疫球蛋白重链和两个轻链)。
仍然存在需要可替换的和/或改进的表达系统,用于产生重组蛋白质。在全长免疫球蛋白及其抗原结合片段的有效和/或正确表达的领域中反映出特定的需要,其相对于目前可用的技术提供了优势。本发明通过提供单个构建体解决了这些需要,各自使用各种策略如蛋白内含子,hedgehog自体加工片段,自体催化病毒蛋白酶及其变化来提供单个构建体。独立地,通过调节亚基(例如,其片段的重链和轻链)的化学计算关系解决了有效多亚基(例如,免疫球蛋白)装配的需要。在实施方案中,sORF中的构建体编码自我加工的肽成分,用于表达工业上和生物上的功能性多肽,如酶,免疫球蛋白,细胞因子,趋化因子,受体,激素,两个杂交系统的成分,或其他目标多亚基蛋白。
发明概述
本发明提供了表达盒,载体,重组宿主细胞和用于重组多蛋白和前体蛋白的重组表达和加工的方法,包括翻译后加工。
在一个实施方案中,本发明提供了用于产生一个或多个重组蛋白质产物的包括sORF插入片段的表达载体;所述sORF插入片段包括编码第一个多肽的第一个核酸序列,编码第一个蛋白裂解位点的干扰核酸序列和编码第二个多肽的第二个核酸序列;其中编码所述第一个蛋白裂解位点的所述干扰核酸序列可操纵地位于所述第一个核酸序列和所述第二个核酸序列之间;和其中所述表达载体能够表达在所述第一个蛋白裂解位点可裂解的sORF多肽。在一个实施方案中,第一个裂解位点包括自我加工裂解位点。在一个实施方案中,自我加工裂解位点包括蛋白内含子片段或修饰的蛋白内含子片段,其中修饰的(或未修饰的)蛋白内含子片段允许所表达的第一个多肽和所表达的第二个多肽的裂解但不允许所表达的第一个多肽和所表达的第二个多肽的完全连接。在一个实施方案,自我加工裂解位点包括hedgehog片段或修饰的hedgehog片段,其中修饰的(或未修饰的)hedgehog片段允许所表达的第一个多肽和所表达的第二个多肽的裂解。在一个实施方案中,表达多个分开的蛋白质(例如,第一个多肽,第二个多肽,第三个多肽等)。在一个实施方案中,第一个多肽和第二个多肽能够多亚基装配。在一个实施方案中,所述第一个多肽和第二个多肽中的至少一个是哺乳动物来源的。在一个实施方案中,提供了产生装配的抗体的载体和方法。
在实施方案中,本发明提供了用于多个分开的蛋白质重组表达的构建体和方法。在特别的实施方案中,蛋白质能够胞外分泌。在特定的实施方案中,蛋白质是哺乳动物来源的。在特别的实施方案中,蛋白质能够多亚基装配。在特别的实施方案中,蛋白质是免疫球蛋白。
在一个实施方案中,引入蛋白酶识别位点,可裂解的信号肽或自体加工多肽序列(包括来自果蝇,小鼠,人和其他物种的蛋白内含子,hedgehog的C-端自体加工结构域(Dassa等,Trends in Genetics,Vol.20No.11 Nov,2004,538-542;Ibrahim等,Biochimica et Biophysics Acta1760(2006)347-355)。我们注意到在一些情况中,自体加工多肽序列可以称为与蛋白酶解处理有关的蛋白酶解位点。使用疣猪,土拨鼠的C-端自体加工结构域,和来自线虫如秀丽隐杆线虫(Caenorhabditiselegans)的其他含hog基因(Snell EA等,Proc.R.Soc.B(2006)273,401-407;Aspock等,Genome Reseach,1999,9:909-923);和来自领鞭毛虫(choanoflagellate)的Hoglet-C自体加工结构域(Aspock等,Genome Research,1999,9:909-923)。A-型细菌蛋白内含子样(BIL)结构域如来自细菌如热纤梭菌(Clostridium thermocellum)的那些,和来自细菌如球形红细菌(Rhodobacter sphaeroides)的B-型BIL结构域(Dassa等,Journal of Biological Chemistry,Vol.279,No.31,July 30,32001-32007),野生型,平截的,或其他修饰形式)进入重组前体蛋白序列中允许前体蛋白的有效表达和裂解,使得生物活性蛋白释放或使得多蛋白内表达的所需蛋白释放。该实施方案消除了前体蛋白的天然蛋白酶解处理酶的共表达的需要。或者,与特定识别位点同源的蛋白酶可以与前体蛋白序列共生(coextensively)表达,在蛋白酶识别位点之间,使得可以通过蛋白酶解作用释放蛋白酶,然后通过随后的蛋白酶解裂解释放前体蛋白的前体部分,使得释放前体蛋白的活性部分。再一个实施方案中,可以将2A自体蛋白酶解处理肽序列工程化至成熟(生物活性)部分和前体蛋白之间的前体蛋白中,使得表达后工程化的重组蛋白自我加工。
在本发明的另一个实施方案中,本发明通过重组表达包括至少一个重链片段和至少一个轻链片段的多蛋白,提供了用于有效表达重组免疫球蛋白分子的方法,其中通过一个或多个介导多肽,hedgehog序列,其他蛋白内含子样或hedgehog样自体加工序列或其变化的裂解但不连接的蛋白酶识别位点,信号肽,蛋白内含子序列,或通过序列如在翻译过程中隔开两侧肽的2A肽隔开所述片段。再一实施方案中,可以作为多蛋白的一部分表达蛋白酶,通过蛋白酶识别位点从多蛋白的剩余物中分离出来,并且其中每个蛋白酶识别位点与伴随表达的蛋白酶同源。然后,蛋白酶解或信号肽酶作用从初级翻译产物释放蛋白酶和其他单个蛋白质。上述用于隔开多蛋白中蛋白亚基的方法也可以结合使用来获得所需的裂解和蛋白质表达结果。
在免疫球蛋白表达实施方案的情况中,轻链编码片段的复制允许提高的装配和/或完整免疫球蛋白分子的表达,超过其中表达盒中存在轻链编码片段和/或表达载体与重链编码片段1∶1比例的情况。在本发明的范围中,重链和轻链蛋白可以是天然产生的重链和轻链的功能性片段(功能性片段保持结合其对应抗体链的能力,并且还保持结合同源抗原的能力,如本领域公知的)。因此,本发明提供了构建体和方法,其中轻链组分与重链组分的编码片段比例为1∶1或高于1∶1。例如,在一个实施方案中,L:H比例是2∶1或高于2∶1;在其他实施方案中,比例为3∶1、3∶2、4∶1或高于4∶1。
在本发明的优选方面中,轻链免疫球蛋白编码序列或其组成片段在多蛋白编码序列内复制,并且重链和轻链免疫球蛋白编码序列以约2个轻链比约一个重链的摩尔比存在,并以高于1∶1轻链:重链的比例表达。轻链和重链在多蛋白中通过蛋白酶裂解位点,信号(或前导)肽,蛋白内含子或自我加工位点连接。
用于在多蛋白翻译产物及其识别序列内隔开生物活性蛋白组分的蛋白酶(内蛋白酶)和信号肽酶及其识别位点的氨基酸序列包括,但不限于,弗林蛋白酶(furin),RXR/K-R(SEQ ID NO:1);IPNV的VP4,S/TXA-S/AG(SEQ ID NO:2);烟草蚀刻病毒(Tobacco etch virus)(TEV)蛋白酶,EXXYXQ-G(SEQ ID NO:3);鼻病毒的3C蛋白酶,LEVLFQ-GP(SEQ ID NO:4);PC5/6蛋白酶;PACE蛋白酶,LPC/PC7蛋白酶;肠激酶,DDDDK-X(SEQ ID NO:5);因子Xa蛋白酶,IE/DGR-X(SEQ ID NO:6);凝血酶,LVPR-GS(SEQ ID NO:7);genenase I,PGAAH-Y(SEQ ID NO:8);和MMP蛋白酶;芜菁花叶病毒(turnipmosaic potyvirus)的核内含体蛋白a(Nla);4型登革热(DEN4)黄病毒的NS2B/NS3,黄热病毒(YFV)的NS3蛋白酶;花椰菜花叶病毒(cauliflower mosaic virus)的ORF V;和KEX2蛋白酶,MYKR-EAD(SEQ ID)。另一种内部裂解位点选择是CB2。用连字符显示识别序列内发生裂解的位置。
在一个实施方案中,所用的信号序列是野生型的,突变的或随机突变的并通过使用本领域已知技术的筛选来选择。
上述本发明范围内还有表达盒,其中特定的多蛋白或前体蛋白(前体蛋白,多蛋白)编码序列可操纵地连接转录调控序列,表达载体和含有表达载体或表达盒的重组宿主细胞。
本发明提供了用于表达全长免疫球蛋白或其片段的系统,基于在单个启动子的转录控制下重链和轻链编码序列的表达,其中通过蛋白内含子或修饰的蛋白内含子(其裂解但不连接释放的蛋白分子,或可以修饰抗体或其他侧翼蛋白序列,使得防止蛋白的连接),或通过来自果蝇,小鼠,人和其他物种的hedgehog的C-端自体加工结构域,或通过来自疣猪,土拨鼠的C-端自体加工结构域和线虫如秀丽隐杆线虫的含hog基因介导的重链和轻链的隔开。Hoglet-C自体加工结构域来自领鞭毛虫,或通过A-型细菌蛋白内含子样(BIL)结构域如来自细菌如热纤梭菌的那些,和来自细菌如球形红细菌的B-型BIL结构域。用于本发明中的蛋白内含子包括,但不限于酿酒酵母(Saccharomycescerevisiae)VMA,古菌(Pyrococcus),集胞藻(Synechocystis)和其他本领域已知的蛋白内含子。还可以通过自我加工裂解位点,例如,2A或2A样序列来介导重链和轻链的隔开。
在一个方面中,本发明提供了用于表达重组免疫球蛋白的载体,其包括可操纵地连接用于免疫球蛋白分子第一链或其片段的编码序列,编码自我加工裂解位点的序列和用于免疫球蛋白分子第二链或其片段的编码序列的启动子,其中将编码自我加工裂解位点的序列插入用于免疫球蛋白分子第一链的编码序列和用于免疫球蛋白分子第二链的编码序列之间。免疫球蛋白分子的第一或第二链中的任一个可以是重链或轻链,并且编码重组免疫球蛋白的序列可以是全长编码序列或其片段。对应于轻链的第二个片段通过蛋白酶识别位点,信号肽或自我加工位点如2A位点与邻近的片段隔开。存在两个轻链序列的拷贝和H链序列的一个拷贝(或各自的多个拷贝),附带条件是每个抗体链成分具有合适的加工位点或与其相关的序列,只要产生正确加工的抗体链。
载体可以是任何能够表达全长多肽例如免疫球蛋白分子或其片段的重组载体,例如,质粒载体,尤其是适用于哺乳动物细胞中基因表达的载体,用于在昆虫细胞中表达的杆状病毒载体,腺相关病毒(AAV)载体,慢病毒载体,逆转录病毒载体,可复制型腺病毒载体,复制缺陷型腺病毒载体和gutless腺病毒载体,肝炎病毒载体或非病毒载体(质粒)。
自我加工裂解位点包括2A肽序列,例如,源自口蹄疫病毒(FMDV)的2A序列。再一优选的方面中,载体包括编码位于免疫球蛋白分子第一链或其片段的编码序列和免疫球蛋白分子第二链或其片段的编码序列之间(即,邻接自我加工裂解位点如2A裂解位点的序列)并且还邻接第二个轻链序列的其他蛋白裂解位点的序列。在一个示例性的方法中,其他的蛋白酶解裂解位点是具有一致序列RXK/R-R(SEQ ID NO:1)的弗林蛋白酶裂解位点。使用自我加工肽的重组免疫球蛋白的载体包括任一种启动子,其中启动子是组成型的,可调控或可诱导的,细胞类型特异性的,组织特异性的或物种特异性的。载体可以进一步包括编码免疫球蛋白链,前体蛋白等的一个或多个编码序列的信号序列的序列。
本发明进一步提供了用载体感染的宿主细胞或宿主细胞的稳定克隆,该载体包括编码免疫球蛋白(即抗体)重链和轻链的序列;编码自我加工裂解位点的序列;并可以进一步包括编码其他蛋白酶解位点的序列,和任选通过自我加工位点或蛋白酶识别位点将蛋白酶编码片段与剩余的编码序列相似地隔开。本发明范围内还包括这样的细胞或克隆在产生全长重组免疫球蛋白或其片段的用途。合适的宿主细胞包括,但不限于,昆虫培养的细胞,如草地贪夜蛾(Spodoptera frugiperda)细胞,微生物,包括细菌,酵母细胞,如酿酒酵母或甲醇酵母(Pichiapastoris),真菌如里氏木霉(Trichoderma reesei),曲霉属(Aspergillus),Aureobasidum和青霉属种,以及哺乳动物细胞如中国仓鼠卵巢(例如,CHO-K1,ATCC CCL 61;CHO DG44;Chasin等,1986,Som.Cell.Molec.Genet.12:555),幼仓鼠肾脏(BHK-21,BHK-570,ATCC CRL 8544,ATCC CRL 10314),COS,小鼠胚胎(NIH-3T3,ATCC CRL 1658),Vero细胞(非洲绿猴肾脏,以ATCC CRL 1587获得),犬肾脏细胞(例如,MDCK,ATCC CCL 34),大鼠垂体细胞(GH1,ATCC CCL 34),特定的人细胞系,包括人胚胎肾脏细胞(例如,HEK293,ATCC CRL1573),也可以使用各种转基因动物系统,包括但不限于,猪,小鼠,大鼠,绵羊,奶牛。用于在蛋清中表达的小鸡系统和用于在奶中表达的转基因绵羊,山羊和奶牛系统是已知的。植物细胞也适于用作宿主细胞。
在相关的方面中,本发明提供了通过这样的细胞或克隆产生的重组免疫球蛋白分子或其片段及其生产方法,其中免疫球蛋白包括源自自我加工裂解位点,信号肽,蛋白内含子,含hog C-端自体加工基因,细菌蛋白内含子样(BIL)结构域或蛋白酶识别序列的氨基酸。在使用蛋白内含子的情况中,优选修饰的蛋白内含子,使得两个抗体链没有剪接在一起形成单个多肽链或抗体多肽的末端,使得它们不能通过蛋白内含子剪接在一起。将蛋白内含子作为框内融合体置于N-蛋白外显子和C-蛋白外显子之间,例如,在免疫球蛋白重链和免疫球蛋白轻链之间,附带条件是蛋白内含子和/或多蛋白初级翻译产物的连接最接近的氨基酸序列导致裂解来释放蛋白外显子,但是没有产生这些蛋白外显子蛋白的连接。
本发明进一步提供了使用位于第一个表达的蛋白部分和第二个蛋白部分之间的hedgehog蛋白加工结构域的翻译后蛋白加工策略。任选可以将hedgehog蛋白加工结构域(Hh-C)截断来删除胆固醇转移部分,使得只发生蛋白裂解。在没有发生Hh-C完全切除的情况中,在第二个蛋白部分的N-端包括信号肽结构域可以允许成熟的第二个蛋白与Hh-C/第一个蛋白部分的蛋白酶解隔开。非天然产生的重组DNA分子也包括在本发明这个方面的范围内,该分子包括编码多蛋白的序列,该多蛋白包括置于第一个表达的蛋白部分编码序列和第二个蛋白部分编码序列之间的hedgehog蛋白加工结构域,使得通过从单个信号翻译来产生多蛋白。
本发明另外一个发面是修饰的弗林蛋白酶,其特征在于将靶向新合成的弗林蛋白酶蛋白的肽片段添加至内质网的内腔。还包括蛋白内含子或修饰的蛋白内含子策略,如在此所列的。
本发明的另一个方面是将多蛋白/自我加工,蛋白内含子加工,信号肽裂解或蛋白酶解裂解方法应用至双杂交和三杂交(和变体)技术。第一个和第二个或第一个,第二个和第三个蛋白在合适的宿主细胞中作为多蛋白从单个转录产物表达,并且通过自我加工位点(例如,2A),蛋白内含子,信号肽或通过蛋白酶识别位点隔开这些蛋白的编码序列。该策略消除了与多于一个载体共转染或通过表达单个转录产物的每个蛋白的需要,因为可以方便地进行,使用本发明的结果是存在提高的经济,有效性和蛋白表达,以及可能的结合在相互的近端内,认为这提高了相互相关的结合伴侣的可能性。在特定的实施方案中,多蛋白包括诱饵蛋白,和自我加工,蛋白内含子,信号肽或蛋白酶识别序列和插入的cDNA片段,其表示一个或多个与目标诱饵蛋白相互作用的潜在猎物蛋白。图8和9中以图解显示了这种克隆和表达策略。
在一个实施方案中,本发明提供了用于在细胞中表达多个基因产物的DNA构建体,包括在构建体5’端的单个启动子,包括两个或多个编码隔开蛋白的蛋白外显子序列的含蛋白内含子单体,和一个或多个与每个蛋白外显子序列的羧基端编码部分融合的蛋白内含子序列,除了最后一个待表达的蛋白外显子序列;和3’端序列,包括最后一个蛋白外显子蛋白编码序列后的多腺苷酸化信号;其中作为前体蛋白表达含蛋白内含子的单体,该前体蛋白含有至少一个两侧为蛋白外显子编码的蛋白的蛋白内含子;其中至少一个蛋白内含子可以催化蛋白外显子的切除;并优选,含蛋白内含子单体中其中至少一个氨基酸残基得到置换,或将至少一个氨基酸残基添加至含蛋白内含子单体,使得切除的蛋白外显子没有通过蛋白内含子连接。在特定的实施方案中,构造构建体,其中至少两个蛋白外显子序列,作为蛋白质表达时,能够以多亚基装配相连。在一个实施方案中,至少两个蛋白外显子序列能够编码免疫球蛋白或其他抗原识别分子。在一个实施方案中,至少一个蛋白外显子序列,作为蛋白质表达时,能够胞外分泌。在一个实施方案中,至少一个蛋白外显子序列是哺乳动物基因。
在实施方案中,本发明提供了使用修饰或非修饰的蛋白内含子表达免疫球蛋白的构建体和方法,其中表达的免疫球蛋白片段没有再连接/融合,因此允许从多个亚基产生装配的抗体。在特定的实施方案中,修饰的蛋白内含子包括位于C-蛋白外显子第一个位置的氨基酸残基的改变。在特定的实施方案中,在蛋白内含子片段内的第二个至最后一个氨基酸存在改变。
在实施方案中,本发明提供了用于任何基因或基因组合表达的构建体和方法。在特定的实施方案中,C-蛋白外显子是修饰的。再一特定的实施方案中,C-蛋白外显子是使用信号序列修饰的。另一特定实施方案中,存在末端C-蛋白外显子组分的缺失。
在实施方案中,本发明提供了用于抗体基因表达的构建体和方法,使用用于免疫球蛋白第二个链(重链或轻链)的修饰信号肽,并且如果使用第三个,将其置于蛋白内含子或hedgehog自体加工结构域后。在一个实施方案中,片段的次序如下:第一个链-第一个蛋白内含子或hedgehog-第一个修饰的信号肽-第二个链-第二个修饰的信号肽-第三个链(在两个链的情况中,例如,省略第三个链或“第二个修饰的信号肽-第三个链”片段)。在另一个实施方案中,在第二个链之后包括第二个蛋白内含子或hedgehog片段。在特定的实施方案中,使用这样的修饰信号肽产生提高的抗体分泌。在一个实施方案中,修饰所用的信号肽来降低疏水性。在一个实施方案中,信号肽是未修饰的。
在实施方案中,提供sORF载体用于瞬时表达。在其他实施方案中,在稳定的表达系统中提供sORF载体。在一个实施方案中,按照本领域已知的,例如,通过转染和其他技术,生产稳定的宿主细胞。
尽管在此特意公开了许多示例构建体用于肿瘤坏死因子α(alpha)特异性抗体的表达,应当理解可以使用相同的策略容易地制备构建体,使用编码其他蛋白的序列的置换。特定实施例包括其他免疫球蛋白和生物治疗分子。更多特定的实施例包括E/L选择素、白细胞介素-12、白细胞介素-18或促红细胞生成素特异性的抗体,或本领域可用氨基酸序列和/或编码序列所需特异性的任何其他抗体。
在一个实施方案中,本发明提供了用于产生一个或多个重组蛋白产物的包括sORF插入片段的表达载体;所述sORF插入片段包括编码第一个多肽的第一个核酸序列,编码第一个蛋白裂解位点的第一个插入核酸序列,和编码第二个多肽的第二个核酸序列;其中将编码所述第一个蛋白裂解位点的所述插入核酸序列可操纵地置于所述第一个核酸序列和所述第一个核酸序列之间;并且其中所述表达载体能够表达在所述第一个蛋白裂解位点可裂解的sORF多肽。在一个实施方案中,所述第一个蛋白裂解位点包括自我加工裂解位点。
在一个实施方案中,自我加工裂解位点包括蛋白内含子片段或修饰的蛋白内含子片段,其中修饰的蛋白内含子片段允许所述第一个多肽和所述第二个多肽的裂解但不容许所述第一个多肽和所述第二个多肽的完全连接。在一个实施方案,自我加工裂解位点包括hedgehog片段或修饰的hedgehog片段,其中修饰的hedgehog片段允许所述第一个多肽和所述第二个多肽的裂解。在一个实施方案中,第一个多肽和第二个多肽能够多亚基装配。在一个实施方案中,所述第一个多肽和第二个多肽中的至少一个能够胞外分泌。在一个实施方案中,所述第一个多肽和第二个多肽中的至少一个是哺乳动物来源的。
在一个实施方案中,所述第一个多肽和第二个多肽中的至少一个包括免疫球蛋白重链或其功能片段。在一个实施方案中,所述第一个多肽和第二个多肽中的至少一个包括免疫球蛋白轻链及其功能片段。在一个实施方案中,所述第一个多肽包括免疫球蛋白重链或其功能片段和所述第一个多肽包括免疫球蛋白轻链或其功能片段;并且其中所述第一个和第二个多肽合在一起能够以多亚基装配结合来形成功能性抗体或其他抗原识别分子。
在一个实施方案中,所述第一个多肽是所述第二个多肽的上游。在一个实施方案中,所述第二个多肽是所述第一个多肽的上游。
在一个实施方案中,表达载体进一步包括编码第三个多肽的第三个核酸序列,其中将所述第三个核酸序列可操纵地置于所述第二个核酸序列之后;并且其中所述第三个序列可以独立地与所述第一个或第二个核酸序列中的任一个相同或不同。在一个实施方案中,所述第一个,第二个和第三个多肽中的至少两个合在一起能够以多亚基装配结合。
在一个实施方案中,表达载体进一步包括编码第二个蛋白裂解位点的第二个插入核酸序列,其中将所述第二个插入核酸序列可操纵地置于所述第一个和所述第二个核酸序列之后;并且其中所述第二个干预序列可以与所述第二个插入核酸序列相同或不同。在一个实施方案中,表达载体进一步包括编码第三个多肽的第三个核酸序列,和编码第二个多肽裂解位点的第二个插入核酸序列;其中将第二个插入核酸序列和第三个核酸序列以该次序可操纵地置于所述第二个核酸序列之后。在一个实施方案中,所述第三个核酸序列编码免疫球蛋白重链,轻链或其代表性的功能片段。在一个实施方案中,所述第三个核酸序列编码免疫球蛋白或其功能片段。在一个实施方案中,所述第三个核酸序列编码免疫球蛋白或其功能片段。
在表达载体的一个实施方案中,所述编码第一个蛋白裂解位点的所述第一个插入核酸序列包括编码信号肽裂解位点或修饰的信号肽裂解位点序列的信号肽核酸。在一个实施方案中,表达载体进一步包括编码信号肽裂解位点的信号肽核酸序列,可操纵地置于所述第一个核酸序列或所述第二个核酸序列之前。
在一个实施方案中,表达载体进一步包括两个信号肽核酸序列,每个独立地编码信号肽裂解位点,其中将一个信号肽核酸序列可操纵地置于编码所述第一个多肽的所述第一个核酸之前,并将连一个信号肽核酸序列可操纵地置于编码所述第二个多肽的所述第二个核酸之前。在实施方案中,两个信号肽序列是相同或不同的。
在一个实施方案中,信号肽核酸序列编码免疫球蛋白轻链信号肽裂解位点或修饰的免疫球蛋白轻链信号肽裂解位点。在一个实施方案中,信号肽核酸序列编码修饰的或未修饰的免疫球蛋白轻链信号肽裂解位点,并且其中所述修饰的位点能够实现裂解并提高所述第一个多肽,所述第二个多肽和所述第一个和第二个多肽的装配分子中至少一个的分泌;并且其中在所述信号肽位点存在下的分泌水平比所述信号肽位点不存在下的分泌水平高约10%至高约100倍。
在一个实施方案中,编码第一个蛋白裂解位点的插入核酸序列包括蛋白内含子或修饰的蛋白内含子序列选自:极端嗜热古菌(Pyrococcus horikoshii)Pho Pol I序列,酿酒酵母(saccharomycescerevisiae)VMA序列,集胞藻(Synechocystis)株PCC6803DnaE序列,蟾蜍分枝杆菌(Mycobacterium xenopi)GyrA序列,古菌(Pyrococcus)种GB-D DNA聚合酶,A型细菌蛋白内含子样(BIL)结构域和B-型BIL。
在一个实施方案中,编码第一个蛋白裂解位点的插入核酸序列包括hedgehog家族成员的C-端自体加工结构域,其中hedgehog家族成员来自果蝇,小鼠,人或其他昆虫或动物物种。在一个实施方案中,编码第一个蛋白裂解位点的插入核酸序列包括来自疣猪,土拨鼠的C-端自体加工结构域,或来自线虫的其他含hog基因,或来自领鞭毛虫的Hoglet结构域。
在一个实施方案中,第一个和所述第二个多肽包括功能性抗体或其他抗原识别分子;抗原特异性指导结合选自以下的抗原:肿瘤坏死因子-α,促红细胞生成素受体,RSV,EL/选择素,白细胞介素-1,白细胞介素-12,白细胞介素-13,白细胞介素-18,白细胞介素-23,CXCL-13,GLP-1R和淀粉状蛋白β。在一个实施方案中,第一个和第二个多肽包括一对来自D2E7,ABT-007,ABT-325,EL246或ABT-874抗体的免疫球蛋白链。在一个实施方案中,第一个和第二个多肽各自独立地选自来自D2E7,ABT-007,ABT-325,EL246,ABT-874或其他抗体的类似片段的免疫球蛋白重链或免疫球蛋白轻链。
在一个实施方案中,载体进一步包括用于所述sORF插入片段的启动子调控元件。在一个实施方案中,所述启动子调控元件是诱导型或组成型的。在一个实施方案中,所述启动子调控元件是组织特异性的。在一个实施方案中,所述启动子包括限病毒主要晚期启动子。
在一个实施方案中,载体进一步包括编码能够裂解所述第一个蛋白裂解位点的蛋白酶的核酸。在一个实施方案中,将编码蛋白酶的所述核酸可操纵地置于所述sORF插入片段内;所述表达载体进一步包括编码位于编码蛋白酶的所述核酸与所述第一个核酸和所述第二个核酸中至少一个之间的第二个裂解位点的其他核酸。
在一个实施方案中,本发明提供了包括在此所述载体的宿主细胞。在一个实施方案中,宿主细胞是原核细胞。在一个实施方案中,所述宿主细胞是大肠杆菌。在一个实施方案中,所述宿主细胞是真核细胞。在一个实施方案中,所述真核细胞选自原生动物细胞,动物细胞,植物细胞和真菌细胞。在一个实施方案中,所述真核细胞是选自哺乳动物细胞,鸟类细胞和昆虫细胞的动物细胞。在优选的实施方案中,所述宿主细胞是CHO细胞或二氢叶酸还原酶缺陷CHO细胞。在一个实施方案中,所述宿主细胞是COS细胞。在一个实施方案中,所述宿主细胞是酵母细胞。在一个实施方案中,所述酵母细胞是酿酒酵母。在一个实施方案中,所述宿主细胞是昆虫草地贪夜蛾Sf9细胞。在一个实施方案中,所述宿主细胞是人胚胎肾脏细胞。
在一个实施方案中,本发明提供了用于生产重组多蛋白或多个蛋白的方法,包括在足以使载体蛋白表达的条件下在培养基中培养宿主细胞。在一个实施方案中,该方法进一步包括收集和/或纯化所述载体蛋白。在一个实施方案中,所述多个蛋白能够多亚基装配。在一个实施方案中,重组多蛋白或多个蛋白在生物上是功能性的和/或治疗性的。
在一个实施方案中,本发明提供了生产免疫球蛋白或其功能片段,装配的抗体或其他抗原识别分子的方法,包括在足以产生免疫蛋白或其功能片段,装配的抗体,或其他抗原识别分子的条件下在培养基中培养根据权利要求38的宿主细胞。
在一个实施方案中,本发明提供了根据在此的方法产生的蛋白或多蛋白。在一个实施方案中,本发明提供了根据在此的方法产生的装配的免疫球蛋白;装配的其他抗原识别分子;或单个免疫球蛋白链或其功能片段。在一个实施方案中,免疫球蛋白;其他抗原识别分子;或单个免疫球蛋白链或其功能片段具有实现或促进特定的抗原结合肿瘤坏死因子-α,促红细胞生成素受体,白细胞介素-18,EL/选择素或白细胞介素-12的能力。在一个实施方案中,免疫球蛋白是D2E7或其中功能片段是D2E7的片段。
在一个实施方案中,本发明提供了包括蛋白质和药物学上可接受载体的药物组合物或药物。按照本领域公知的选择用于药物制剂的赋形剂和载体。
在一个实施方案中,本发明提供了表达载体,其中第一个蛋白裂解位点包括细胞蛋白酶裂解位点或病毒蛋白酶裂解位点。在一个实施方案中,所述第一个蛋白裂解位点包括由以下蛋白酶识别的位点:弗林蛋白酶;IPNV的VP4;烟草蚀刻病毒(TEV)蛋白酶;鼻病毒的3C蛋白酶;PC5/6蛋白酶;PACE蛋白酶,LPC/PC7蛋白酶;肠激酶;因子Xa蛋白酶;凝血酶;genenase I;MMP蛋白酶;芜菁花叶病毒的核内含体蛋白a(Nla);4型登革热黄病毒的NS2B/NS3,黄热病毒的NS3蛋白酶;花椰菜花叶病毒的ORF V;KEX2蛋白酶;CB2;或2A。在一个实施方案中,所述第一个蛋白裂解位点是病毒内部可裂解信号肽裂解位点。在一个实施方案中,所述病毒内部可裂解信号肽裂解位点包括来自C型流感病毒,丙肝病毒,汉坦病毒,黄病毒或风疹病毒的位点。
在一个实施方案中,本发明提供了用于双杂交系统蛋白表达的方法,其中所述双杂交系统包括诱饵蛋白和候选猎物蛋白,所述方法包括以下步骤:提供其中已经引入编码多蛋白的表达载体的宿主细胞,该多蛋白包括诱饵蛋白部分和候选猎物蛋白部分,通过自我加工裂解序列,信号肽序列或蛋白酶裂解序列来隔开所述部分;在允许多肽和多肽的自我加工或蛋白酶裂解表达的条件下培养宿主细胞。在一个实施方案中,多蛋白进一步包括三杂交系统的可裂解组分。
在一个实施方案中,表达载体不含有2A序列。在一个实施方案中,提供了表达载体,其中所述第一个蛋白裂解位点包括FMDV 2A序列;来自其他小核糖核酸病毒科,昆虫病毒,C型轮状病毒,锥体虫或海栖热袍菌(thermatoga maritima)的2A样结构域。
在一个实施方案中,本发明提供了用于表达重组蛋白的表达载体,包括多蛋白的编码序列,其中多蛋白包括至少第一个和第二个蛋白片段,其中通过蛋白裂解位点隔开所述蛋白片段,其中蛋白裂解位点包括自我加工肽裂解序列,信号肽裂解序列或蛋白酶裂解序列;并且其中所述编码序列在宿主细胞中是可表达的并且在宿主细胞内得到裂解。
在一个实施方案中,本发明提供了表达载体,其中插入核酸序列另外编码标记物。
结合附图时,将从本发明以下为公开目的而提供的描述中清楚本发明的其他方面,特征和优势。
通常,在此所用的术语和短语具有本领域已知的意思,可以通过参考本领域技术人员已知的标准教科书,杂志参考和内容来找到。在此提供的定义用来明确它们在本发明范围内的特定用途。
不希望受到任何特定理论的束缚,在此存在与本发明相关的基础原理或机理的看法或理解的讨论。认识到与任何解释或假设的最终正确性无关,无论如何,本发明的实施方案是可操作的和有用的。
附图简述
图1说明了优选的稳定sORF表达载体构建体。
图2说明了优选的稳定sORF表达载体构建体,进一步包括编码第二个蛋白裂解位点(其可以是自体加工位点)的另外的(第二个)干预核酸和编码第三个多肽的第三个核酸。这样的载体能够表达多于两个多肽。
图3说明了优选的瞬时sORF表达载体构建体,(例如,pTT3-HC-Ssp-GA-int-LC-0aa)。
图4说明了含有用于双杂交系统的2A片段的表达载体。将表达载体结构化来作为GAL4::诱饵::2A肽融合体翻译第一个诱饵蛋白,其在2A肽翻译后自我加工。
图5是图4质粒(带有2A裂解的2-杂交系统)表达片段的扩大的线性图。
图6说明了用于免疫球蛋白表达的基于蛋白内含子的sORF载体。
图7说明了用于装配多亚基分子如抗体表达的具有选定点突变的几个sORF构建体。
图8说明了具有改变的信号肽的sORF构建体,例如,修饰的免疫球蛋白轻链信号肽。
图9说明了使用hedgehog自我加工结构域的sORF构建体。
发明详述
可以通过以下的描述和非限制性实施例来进一步理解本发明。
本发明提供了用于表达结构或生物活性蛋白如酶,激素(例如,胰岛素),细胞因子,趋化因子,受体,抗体或其他分子的系统,例如,构建体和方法。优选,蛋白质是免疫调节蛋白,如白细胞介素,全长免疫球蛋白,其片段,其他抗原识别分子,如本领域所知的,或其他生物治疗分子。这样系统的综述是基于单个启动子转录控制下的重链和轻链编码序列的表达,其中单个翻译产物(多肽)转化成分开的重链和轻链是通过翻译过程中核糖体处的蛋白内含子,含-hog自我加工结构域,隔开侧翼肽的2A或2A-样序列来介导的或是位于成熟生物活性蛋白的两条链之间的一个或多个蛋白酶识别序列处的蛋白酶解加工的结果。
干预位点(不管是与蛋白内含子片段,hog结构域,2A或2A-样相关,还是与蛋白酶识别位点相关,以及各自的变化)可以称为裂解位点。在表达三个或多个蛋白片段的情况中,这样的裂解位点可以位于多个片段的至少任意两个之间,或裂解位点可以位于每个片段之后,任选并优选不在最后一个片段之后。如果使用多个裂解位点,每一个可以与另一个相同或与另一个无关。
在一个方面中,本发明提供了用于表达重组免疫球蛋白的载体,其包括启动子,该启动子可操纵地连接用于免疫球蛋白分子第一链或其片段的编码序列,编码自我加工或其他蛋白酶解裂解位点的序列和用于免疫球蛋白分子第二链或其片段的编码序列,其中将编码自我加工或其他蛋白酶解裂解位点的序列插入免疫球蛋白分子第一链的编码序列和免疫球蛋白分子第二链的编码序列之间,和第三个片段,编码免疫球蛋白轻链,也通过自我加工或其他蛋白酶解裂解位点与剩余的多蛋白隔开。
在一个实施方案中,免疫球蛋白分子的第一或第二链可以是重链或轻链。编码重组免疫球蛋白片段的序列可以是全长编码序列或其片段。在特定的实施方案中,第二个轻链编码序列必须是编码本发明实践中加工的多蛋白的序列的一部分;即,合在一起存在三个片段,包括两个轻链和一个重链,以任何次序。在特定的实施方案,用这些组分并且以这种次序构造构建体:a)IgH-IgL;b)IgL-IgH;c)IgH-IgL-IgL;d)IgL-IgH-IgL;e)IgL-IgL-IgH;f)IgH-IgH-IgL;g)IgH-IgL-IgH;和/或h)IgL-IgH-IgH。在一个实施方案中,连字符表示其中安置裂解位点序列的位置。
或者,免疫球蛋白重链和轻链编码序列与其中存在的蛋白内含子编码序列框内融合,蛋白内含子是修饰的,使得缺乏剪接活性或设计重链和轻链的末端使得优选不发生剪接或使得发生效率差的剪接,使得主要为未剪接的抗体分子。此外,修饰的蛋白内含子可以进一步修饰,仍然进一步使得不存在核酸内切酶片段(其中之前已经将核酸内切酶片段切除),附带条件是保留位点特异性蛋白酶解裂解活性,使得轻链和重链抗体多肽与初级翻译产物的干预蛋白内含子部分分离开来。轻链或重链抗体多肽中任一个可以是N-蛋白外显子,并且任一个可以是C-蛋白外显子。
载体可以是能够表达全长多蛋白的任何重组载体,例如,腺相关病毒(AAV)载体,慢病毒载体,逆转录病毒载体,可复制型腺病毒载体,复制缺陷型腺病毒载体和gutless腺病毒载体,肝炎病毒载体或非病毒载体(质粒)或任何其他本领域已知的载体,选择适用于其中表达免疫球蛋白或其他蛋白的宿主细胞的载体。杆状病毒载体可用于在昆虫细胞中表达基因。各种载体是本领域已知的,并且许多是可购得的或另外本领域易于获得的。
裂解位点
优选的自我加工裂解位点包括蛋白内含子序列;修饰的蛋白内含子;hedgehog序列;其他hog家族序列;2A序列,例如,源自口蹄疫病毒(FMDV)的2A序列;和各自的变化。
其识别序列可以由2A序列替代的蛋白酶包括,但不限于,弗林蛋白酶,靶向内质网而不是反式Golgi网的修饰弗林蛋白酶,IPNV的VP4,TEV蛋白酶,核定位信号缺陷TEV蛋白酶(TVE Nls-),鼻病毒的3C蛋白酶,PC5/6蛋白酶,PACE蛋白酶,LPC/PC7蛋白酶,肠激酶,Xa蛋白酶,凝血酶,genenase I,MMP蛋白酶,如上所讨论的。用于本发明实践中的其他内蛋白酶是包括但不限于以下的蛋白酶,芜菁花叶病毒的核内含体蛋白a(Nla)(Kim等,1996,Virology 221:245-249);4型登革热(DEN4)黄病毒的NS2B/NS3(Falgout等,1993,J.Virol.67:2034-2042;Lai等,1994,Arch.Virol.Suppl.9:359-368),黄热病毒(YFV)的NS3蛋白酶(Chambers等,1991,J.Virol.65:6042-6050);花椰菜花叶病毒的ORF V(Torruella等,1989,EMBO Journal 8:2819-2825);蛋白内含子,其实例是Psp-GBD Pol蛋白内含子(Xu,M.Q.1996,EMBO 15:5146-5153);内部可裂解信号肽,其实例是C型流感病毒的内部可裂解信号肽(Pekosz A,1992,Proc.Natl.Acad.Sci.USA 95:3233-13238);和KEX2蛋白酶,MYKR-EAD(SEQ ID NO:9);KEX2和靶向ER的修饰KEX2(参见,Chaudhuri等,1992,Eur.J.Biochem.210:811-822)。唯一针对ER的修饰KEX2具有各自如表7A和7B中给出的编码序列和氨基酸序列;将其称为KEX2-sol-KDEL。已经将来自酿酒酵母的KEX2初级氨基酸序列进行修饰,在蛋白的C端除去膜相关结构域和添加ER靶向序列KDEL。用于裂解含有合适裂解识别位点的多蛋白的其他人蛋白酶包括US专利公开2005/0112565中列出的那些。来自黑腹果蝇(Drosophila melanogaster)的sonichedgehog蛋白,尤其是来自其的加工结构域,也可用来从多蛋白初级翻译产物分离蛋白。
在本发明范围内的是修饰的弗林蛋白酶,其瞄准内质网(ER)而不是反式Golgi网(TGN),因为这是天然产生的弗林蛋白酶。Vorhees等,1995,EMBO Journal 14:4961-4975,描述了弗林蛋白酶(氨基酸775-778)的EEDE(SEQ ID NO:10)部分,如涉及蛋白酶瞄准TGN(Nakayama等,1997,Biochem.Journal 327:625-635)。Zerangue等,2001,Proc.Natl.Acad.Sci.USA 98:2431-2436报道了ER运输信号,包括蛋白C端的KKXX。因此,研发修饰的弗林蛋白酶并用来将弗林蛋白酶裂解活性瞄准替代TGN或添加至TGN的ER间隔并在间隔之后。
再一方面中,载体包括编码位于免疫球蛋白分子第一链或其片段的编码序列和免疫球蛋白第二和/或第三链(例如,第一或第二链的复本)或其片段的编码序列之间(即,邻接裂解位点序列,其可以是2A裂解位点)的序列。在一个示例性的方法中,另外的蛋白酶解裂解位点是具有一致序列RXK(R)R(SEQ ID NO:1)的弗林蛋白酶裂解位点。
包括启动子的调控序列;宿主细胞
用于重组免疫球蛋白或其他蛋白表达的载体包括本领域已知的多种启动子中的任一种,其中启动子是组成型的,可调控或可诱导的,细胞类型特异性的,组织特异性的,或物种特异性的。更多特定的实施例包括,例如,四环素-应答性启动子(Gossen M,Bujard H,Proc NatlAcad Sci USA.1992,15;89(12):5547-51)。载体是适于其中表达嵌合基因的宿主细胞的复制子,并且理想地其还包括在细菌细胞中功能性的复制子,有利地,细菌细胞是大肠杆菌,这是用于分子生物学操作的常规细胞。
用于基因表达的宿主细胞是,但不限于,动物细胞,尤其是哺乳动物细胞,或可以是微生物细胞(细菌,酵母,真菌,但优选真核的)或植物细胞。特别合适的宿主细胞包括昆虫培养的细胞,如草地贪夜蛾细胞,酵母细胞,如酿酒酵母或甲醇酵母,真菌,如里氏木霉(Trichoderma reesei),曲霉属(Aspergillus),Aureobasidum和青霉属种,以及哺乳动物细胞如CHO(中国仓鼠卵巢),BHK(幼仓鼠肾脏),COS,293,3T3(小鼠),Vero(非洲绿猴)细胞,也可以使用各种转基因动物系统,包括但不限于,猪,小鼠,大鼠,绵羊,山羊,奶牛。用于在蛋清中表达的小鸡系统和用于在奶中表达的转基因绵羊,山羊和奶牛系统是已知的。杆状病毒尤其是AcNPV载体可以用于本发明的单ORF抗体表达和裂解,例如,在昆虫细胞系中在多hedrin启动子或其他强启动子的调控控制下的表达;这样的载体和细胞系是本领域公知的并可购得。哺乳动物细胞中所用的启动子可以是组成型的(肝炎病毒TK启动子,McKnight,Cell 31:355,1982;SV40早期启动子,Benoist等,Nature 290:304,1981;巨细胞病毒启动子,Foeking等,Gene 45:101,1980;小鼠乳癌病毒启动子,总地参见Etcheverry inProtein Engineering:Principles and Practice,Cleland等编辑,pp.162-181,Wiley & Sons,1996)或调控型的(例如,亲金属蛋白启动子,Hamer等,J.Molec.Appl.Genet.1:273,1982)。载体可以是基于感染特定哺乳动物细胞的病毒,尤其是逆转录病毒,牛痘和腺病毒及其本领域已知并可购得的衍生物。启动子包括,但不限于,巨细胞病毒,后期腺病毒和牛痘7.5K启动子。酵母和真菌载体(参见,例如,Van den Handel,C等(1991)In:Bennett,J.W.和Lasure,L.L.(编辑),More Gene Manipulations in Fungi(真菌中的更多基因操作),Academy Press,Inc.,New York,397-428)和启动子也是公知的并可广泛获得。烯醇酶是公知的组成型酵母启动子,并且乙醇脱氢酶是公知的调控型启动子。
特定启动子,转录终止序列和其他任选序列如编码组织特异性序列的序列的选择,很大程度上由其中需要表达的细胞类型所决定的。可以是细菌,酵母,真菌,哺乳动物,昆虫,小鸡或其他动物细胞。
信号序列
将其引入载体中的待裂解的,蛋白酶解加工或自我加工的蛋白的编码序列,可以进一步包括一个或多个编码一个或多个信号序列的序列。这些编码的信号序列与多蛋白内一个或多个成熟片段相关。例如,编码免疫球蛋白重链前导序列的序列可以在重链编码序列之前,可操纵地在框内连接剩余的多蛋白编码序列。相似地,轻链前导肽编码序列或其他前导肽编码序列可以框内连接一个或两个免疫球蛋白轻链编码序列,前导序列链由来自自我加工位点(如2A)的邻接链或由编码蛋白酶识别序列的序列隔开,保持合适的阅读框。
免疫球蛋白重链和轻链的化学计算
在此的许多实施方案中,免疫球蛋白/抗体轻链(IgL)和重链(IgH)在宿主细胞内以约1∶1比例(IgL∶IgH)以载体水平或表达的胞内水平存在。而在此和别处的重组方法依赖于重链和轻链的等摩尔表达(参见,例如,US专利公开2005/0003482A1或国际公开WO2004/113493),在其他实施方案中,本发明提供了具有2∶1比例轻链和重链编码序列的方法和表达盒和载体,当初级翻译产物是多蛋白时,并与链的自我加工或蛋白酶解加工共表达。在实施方案中,比例高于1∶1,如约2∶1或高于2∶1。在特定的实施方案中,以高于1∶1的比例使用轻链编码序列(IgL∶IgH)。在特定的实施方案中,IgL∶IgH的比例是2∶1。
本发明进一步提供了用载体转化或感染的宿主细胞或宿主细胞的稳定克隆,该载体包括编码免疫球蛋白(即,抗体)的重链和任一个或至少两个轻链的序列;编码其中的裂解位点,如自我加工,蛋白酶识别位点或信号肽的序列;并可以进一步包括编码其他蛋白酶解裂解位点的序列。本发明的范围内还包括该细胞或克隆在产生全长重组免疫球蛋白或其片段或其他由多个亚基构成的生物活性蛋白中的用途(例如,双链或多链分子或作为前体蛋白天然产生并裂解或加工来释放前体衍生的蛋白和活性部分的那些)。非限制实例包括胰岛素,白细胞介素-18,白细胞介素-1,骨形态发生蛋白4,骨形态发生蛋白2,任何其他双链骨形态发生蛋白,神经生长因子,肾素,凝乳蛋白酶,转化生长因子β和白细胞介素1β。
在相关的方面中,本发明提供了通过这样的细胞或克隆产生的重组免疫球蛋白,分子或其片段或其他蛋白,其中免疫球蛋白包括源自自我加工裂解位点(如蛋白内含子或hedgehog结构域),裂解位点或信号肽裂解的氨基酸,并提供了用于生产这些的方法,载体和宿主细胞。在实施方案中,本发明提供了含有一个或多个在此所述的构建体的宿主细胞。
本发明提供了用于表达免疫球蛋白分子或其片段的单个载体构建体和用于体外或体内使用的方法。载体在第一个和第二个之间以及在第二个和第三个免疫球蛋白编码序列之间具有自我加工或其他蛋白酶识别序列,允许功能性抗体分子的表达,使用单个启动子和转录产物。示例性载体构建体包括开放阅读框之间编码自我加工裂解位点的序列,并可以进一步包括与自我加工裂解位点邻接的其他蛋白酶解裂解位点,用于在裂解后除去包括自我加工裂解位点的氨基酸。载体构建体发现在一些方法中的实用性,这些方法关于全长生物活性免疫球蛋白或其片段在体外和体内提高的生产。尽管理解不需要链的编码序列相对于其他链的编码序列以高于1的比例存在,可以使用相同的策略制得具有至少两个不同链的其他生物活性蛋白。
尽管在此具体举例说明了特定的组成和方法,理解许多可替换组成和方法中的任一个是合适的并且适用于实践本发明。还理解可以使用本领域中的标准方法进行本发明的多蛋白表达盒和载体,宿主细胞和方法的评价。本发明的实践将使用,除非另外指出,细胞生物学,分子生物学(包括重组技术),微生物学,生物化学和免疫学的常规技术,这些在本领域技术人员的范围内。这样的技术在文献中得到全面地解释,如,Molecular Cloing:A Laboratory Manual,第二版,(Sambrook等,1989);Oligonucleotide Synthesis(M.J.Gait编辑,1984);AnimalCell Culture(R.I.Freshney编辑,1987);Methods in Enzymology(Academic Press,Inc.);Handbook of Experimental Immunology(D.M.Weir & C.C.Blackwell编辑);Gene Transfer Vectors for MammalianCells(J.M.Miller & M.P.Calos编辑,1987);Current Protocols inMolecular Biology(F.M.Ausubel等,编辑,1993);PCR:The PolymeraseChain Reaction,(Mullis等,编辑,1994);和Current Protcols inImmunology(J.E.Coligan等,编辑,1991),在此将每篇特意引入作为参考。
除非另外指出,在此所用的所有术语具有本领域技术人员所知的相同意思,并且本发明的实践将使用微生物学的常规技术和重组DNA技术,这些在本领域技术人员的知识范围内。
在此通常所用的术语“修饰的”在蛋白质的范围内指的是其中参照分子内至少一个氨基酸残基被置换,删除或添加的片段。相似地,在核酸范围内,术语指的是其中参照分子内至少一个核酸残基被置换,删除或添加的片段。
如在此所用的术语“蛋白内含子”通常指的是促进其自身去除并实现称为蛋白外显子的侧翼片段连接的蛋白质的内部片段。在多种类型的生物体中认识到蛋白内含子的许多实例,在一些情况中,具有共有的结构和/或功能特征。本发明宽泛地能够使用蛋白内含子,或其变体,如现在已知的或进一步认识或发现的。参见,例如,Gogarten JP等,2002,Annu Rev Microbiol.2002;56:263-87;Perler,F.B.(2002),InBase,the Intein Database.Nucleic Acids Res.30,383-384(还通过互联网在New England Biolabs,Inc.,Ipswich,MA的网址http://www.neb.com/neb/intein.html;Amitai G等,Mol Microbiol.2003,47(1):61-73;Gorbalenya AE,Nucleic Acids Res.1998;26(7):1741-1748。非典型蛋白内含子)。在蛋白质中,含有蛋白内含子单位或蛋白内含子剪接单位可以理解为包括两翼蛋白外显子的部分,其中结构方面可以促进裂解,连接等的反应。术语还可以理解为关于基于蛋白内含子系统的一个类别,该系统具有“修饰的蛋白内含子”组分。
如在此所用的术语“修饰的蛋白内含子”可以指和成的蛋白内含子或天然蛋白内含子,其中蛋白内含子剪接单位中至少一个氨基酸残基被置换,删除,或添加,使得裂解的或切除的蛋白外显子没有通过蛋白内含子完全连接。
如在此所用的术语“hedgehog”指的是基因家族(和相应的蛋白片段),成员具有影响自体蛋白酶解功能的结构。家族成员包括,例如,来自果蝇,小鼠,人和其他物种的类似物。此外,术语“hedgehog片段”不仅用来包括这样的家族成员,而且宽泛地涉及疣猪,土拨鼠的自体加工结构域和来自线虫如秀丽隐杆线虫的其它含hog-基因,和来自领鞭毛虫的Hoglet-C自体加工结构域。参见,例如,Perler FB.Proteinsplicing of inteins and hedgehog autoproteolysis:structure,function,andevolution(蛋白内含子和hedgehog自体蛋白酶解的蛋白质剪接:结构,功能和评价),Cell.1998,92(1):1-4;Koonin,EV等,(1995)A Proteinsplice-junction motif in hedgehog family proteins.(hedgehog家族蛋白中蛋白剪接-连接基序)Trends Biochem Sci.20(4):141-28;Hall TM等,(1997)Crystal structure of a Hedgehog autoprocessing domain:homology between Hedgehog and self-splicing proteins.(Hedgehog自体加工结构域的晶体结构:Hedgehog和自我剪接蛋白之间的同源性)Cell91(1):85-97;Snell EA等,Proc.R.Soc.B(2006)273,401-407;Aspock等,Genome Research,1999,9:909-923。Hedgehog片段的特定实例是来自黑腹果蝇的sonic hedgehog蛋白。术语还可以理解为关于基于hedgehog系统的一个类别,该系统具有“修饰的hedgehog”组分。
术语“修饰的hedgehog”片段可以指和成的hedgehog片段或天然hedgehog片段,其中hedgehog剪接单位中的至少一个氨基酸残基被置换,删除或添加,使得裂解的蛋白没有完全连接。
如在此所用的术语“载体”指的是DNA或RNA分子,如质粒,病毒或其他载体,其含有一个或多个异种或重组DNA序列并设计用于不同宿主细胞之间的转移。术语“表达载体”和“基因治疗载体”指的是将异种DNA片段有效引入细胞中并表达的任何载体。克隆或表达载体可以包括其他元件,例如,表达载体可以具有两个复制系统,因此允许其在两个有机体中得到维持,例如,在用于表达的人细胞中和用于克隆和扩增的原核宿主中。可以使用任何合适的载体,该载体将核酸有效引入细胞中,使得蛋白或多肽表达,例如,病毒载体或非病毒载体。用于表达的任何有效细胞,例如,昆虫细胞和真核细胞,如酵母或哺乳动物细胞可用于本发明实践中。
术语“异种DNA”和“异种RNA”指的是不是细胞内源(天然)的核酸或其中存在它们的基因组或载体的一部分。通常,通过转导,感染,转染,转化,电穿孔,基因枪转化等将异种DNA或RNA加入细胞中。这样的核苷酸通常包括至少一个编码序列,但是编码序列不需要得到表达。术语“异种DNA”可以指“异种编码序列”或“转基因”。
如在此所用的,术语“蛋白质”和“多肽”可以交替使用,并通常指的是使用本发明的含自我加工裂解位点的载体表达的目标“蛋白质”和“多肽”。这样的“蛋白质”和“多肽”可以是用于研究,诊断或治疗目的的任何蛋白质或多肽,如以下进一步所述的。如在此所用的,多蛋白是设计用于加工产生两个或多个多肽产物的蛋白质。
如在此所用的,术语“多聚体”指的是由两个或多个多肽链(有时候称为“亚基”)构成的蛋白质,其装配形成功能蛋白。多聚体可以由两个(二聚体),三个(三聚体),四个(四聚体)或更多(例如,五聚体等)肽链构成。多聚体可以由自我装配而得,或者需要成分,如催化剂来帮助装配。多聚体可以只由相同的肽链构成(同型-多聚体),或两个或多个不同的肽链构成(异型多聚体)。这样的多聚体可以在结构上或化学上是功能性的。许多多聚体是本领域已知并使用的,包括但不限于酶,激素,抗体,细胞因子,趋化因子和受体。同样,多聚体可以具有生物(例如药物)和工业(例如,生物加工/生物生产)用途。
如在此所用的,术语“标记物”指的是肽,可以将其引入表达载体中,其可以用来允许一个或多个载体插入片段的表达产物的删除和/或纯化。这样的标记物是本领域公知的并包括放射性标记的氨基酸或连接可以通过标记的抗生物素蛋白(例如,含有可以通过光学或比色方法检测的荧光标记或酶活性的抗生蛋白链菌素)检测的生物素部分的多肽。亲和性标记物如FLAG,谷胱甘肽-S-转移酶,麦芽糖结合蛋白,纤维素结合结构域,硫氧还蛋白,NusA,mistin,几丁质结合结构域,角质酶,AGT,GFP和广泛使用的其它标记物,如蛋白表达和纯化系统中所用的。用于多肽的更多非限制性实例包括,但不限于以下的:组氨酸标记物,放射性同位素或放射性核素(利如,3H,14C,35S,90Y,99Tc,111In,125I,177Lu,166Ho或153Sm);荧光标记物(例如,FITC,若丹明,镧系磷),酶标记物(例如,辣根过氧化物酶,莹光素酶,碱性磷酸酶);化学发光标记物;生物素基团;由第二报告子识别的悬垂多肽抗原决定部位(例如,亮氨酸拉链对序列,用于二抗的结合位点,金属结合结构域,抗原决定部位标记物);和磁性试剂,如钆螯合物。
如在此所用的关于本发明病毒基因治疗载体的术语“复制缺陷”意思是病毒载体不能能够独立地进一步复制和包装其基因组。例如,用rAAV病毒粒子感染患者的细胞时,在感染的细胞中表达异种基因,然而,由于感染的细胞缺乏AAV rep和cap基因以及辅助功能基因的事实,rAAV不能复制。
如在此所用的,“逆转录转移载体”指的是包括编码转基因的核苷酸序列并进一步包括载体包装必需的核苷酸序列的表达载体。优选,逆转录转移载体还可以包括在细胞中表达转基因的必需序列。
如在此所用的,“包装系统”指的是一套包括编码病毒蛋白的基因的构建体,该病毒蛋白涉及重组病毒的包装。通常,最终将包装系统的构建体引入包装细胞中。
如在此所用的,“第二代”慢病毒载体系统指的是缺乏功能性辅助基因的慢病毒包装系统,如已经从其删除或灭活辅助基因,vif,vpr,vpu和nef的一种。参见,例如,Zufferey等,1997,Nat.Biotechnol.15:871-875。
如在此所用的,“第三代”慢病毒载体指的是居有第二代载体系统的特征并进一步缺乏功能性tat基因的慢病毒包装系统,如已经从其删除或灭活tat基因的一种。参见,例如,Dull等,1998,J.Virol.72:8463-8471。
如在此关于病毒或病毒载体所用的,“假模的”指的是天然病毒包膜蛋白由异种或功能上修饰的病毒包膜蛋白的替代。
如在此关于重组DNA构建体或载体所用的术语“可操纵地连接”意思是重组构建体或载体的核苷酸成分通常相互共价连接。通常,“可操纵地连接”DNA序列是邻接的,并且在分泌前导的情况中,是邻接的并且在相同阅读框内。然而,增强子不必须与表达得到上调的序列邻接。术语与可操纵地安置相一致。
增强子序列影响启动子依赖性基因表达并可以位于天然基因的5’或3’片段中。“增强子”是刺激或抑制邻接基因转录的顺式作用元件。已知转录的增强子也称为“沉默子”。增强子可以以任一方向,离开编码序列和离开转录片段的下游位置高达几千碱基对(kb)的距离起作用(即,可以与编码序列相关)。此外,绝缘子和染色质开放序列,如基质连接片段(Chung,Cell,1993,Aug,13:74(3):505-14,Frisch等,Genome Research,2001,12:349-354,Kim等,J.Biotch 107,2004,95-105)可以用来提高稳定整合的基因盒的转录。
如在此所用的,术语“基因”或“编码序列”意思是可操纵地连接合适的调控序列时,在体外或体内转录(DNA)和翻译(mRNA)成多肽的核酸序列。基因可以包括或不包括编码序列之前和之后的片段,例如,5’未翻译的(5’UTR)或“前导”序列和3’UTR或“尾巴”序列,以及单个编码片段(外显子)之间的干预序列(内含子)。
“启动子”是指导RNA聚合酶的结合并因此促进RNA合成的DNA序列,即,足以指导转录的最小序列。启动子和相应的蛋白质或多肽表达可以是细胞特异性的,组织特异性的或物种特异性的。本发明的核酸构建体或载体中还包括的是增强子序列,其可以与启动子序列邻接或不邻接。
如在此宽泛使用的“转录调控序列”或表达控制序列包括启动子序列和物理上相连的序列,其调节或调控相连编码序列的转录,通常应答营养或环境信号。那些相连的序列可以决定组织或细胞特异性表达,应答环境信号,提高或降低转录的蛋白的结合等。“调控型启动子”是任何其活性受顺或反作用因子(例如,诱导型启动子,其通过外部信号或试剂激活)影响的启动子。
“组成型启动子”是指导许多或全部组织/细胞类型在大部分时间的RNA产生的任何启动子,例如,人CMV即时早期增强子/启动子片段,其促进哺乳动物细胞中克隆的DNA插入片段的组成型表达。
术语“转录调控蛋白”,“转录调控因子”和“转录因子”在此可交替使用,并指的是结合DNA应答元件并因此在转录上调控相关基因表达的核蛋白。转录调控蛋白通常直接结合DNA应答元件,然而,在一些情况中,与DNA的结合可以是间接的,通过结合另一个蛋白,该蛋白随后结合或被结合DNA应答元件。
如在此所用的,“内部核糖体进入位点”或“IRES”指的是促进指导内部核糖体进入顺反子(蛋白质编码片段)的启动密码子如ATG的元件,因此导致基因的cap自主翻译。参见,例如,Jackson R.J.等,1990,Trends Biochem Sci 15:477-83)和Jackson R.J.和Kaminski,A.1995,RNA 1:985-1000。在此所述的实施例与任何IRES元件的使用相关,IRES元件能够促进指导内部核糖体进入顺反子的启动密码子。如在此所用的“在IRES的翻译控制下”意思是翻译与IRES相关并以cap-自主方式进行。例如,可以通过隔开单个编码序列的IRES翻译重链和两个轻链编码序列,不需要蛋白酶解或自我加工来将两个链相互隔开。
将“自我加工裂解位点”或“自我加工裂解序列”在此定义为翻译后或共翻译加工裂解位点序列。如“自我加工裂解”位点或序列指的是DNA或氨基酸序列,在此通过2A位点,序列或结构域或2A样位点,序列或结构域来举例说明。如在此所用的,将“自我加工肽”在此定义为编码自我加工裂解位点或序列的DNA序列的肽表达产物,其在翻译时,介导包括自我加工裂解位点的蛋白或多肽的快速分子内(cis)裂解,来产生分开的成熟蛋白或多肽产物。
如在此所用的,术语“其他的蛋白酶解裂解位点”指的是一种序列,将该序列引入本发明表达载体的邻接自我加工裂解位点,如2A或2A样序列,并且该序列提供了除去由自我加工裂解序列裂解后保留的其他氨基酸的方式。在此描述了示例性“其他的蛋白酶解裂解位点”并包括但不限于,具有一致序列RXK/R-R的弗林蛋白酶裂解位点。可以通过内源枯草杆菌蛋白酶样蛋白酶裂解这样的弗林蛋白酶裂解位点,如蛋白分泌途径内的弗林蛋白酶和其他丝氨酸蛋白酶。
如在此所用的,术语“免疫球蛋白”和“抗体”指的是完整的蛋白质及其片段,如Fa,F(ab’)2和Fv,其能够结合目标抗原性决定因子。这样的“免疫球蛋白”和“抗体”由两个分子量大约23,000的相同多肽轻链和两个分子量53,000-70,000的相同重链构成。通过二硫键以“Y”构造连接四条链。将重链分类为γ(IgG),μ(IgM),α(IgA),δ(IgD)或ε(IgE)并且是免疫球蛋白分类命名的基础,其决定了给定抗体的效应物功能。将轻链分类为κ和λ。在此参照“免疫球蛋白或其片段”时,将理解这样的“其片段”是免疫上功能性的免疫球蛋白片段,尤其是结合其同源配体的一种,具有完整免疫球蛋白至少10%的结合亲和性。
抗体的Fab片段是抗体分子的单价抗原结合片段。Fv片段通常是工程化的片段,含有表达为两个链的轻链可变区和重链可变区。
术语“人源化抗体”指的是其中已经替代了非抗原结合片段中一个或多个氨基酸的抗体分子,以便更接近地象人抗体,同时仍然保持抗体最初的结合活性。参见,例如,U.S.专利No.6,602,503。
如在此所用的术语“抗原决定因子”指的是接触特定抗体的分子的片段(即,抗原决定部位)。蛋白或肽或蛋白或糖蛋白的糖肽的各种片段可以诱导特异性结合蛋白的给定片段或三维结构的抗体的产生。将这些片段或结构称为抗原决定因子或抗原决定部位。抗原决定因子可以与完整的抗原(即,用于引发免疫应答的免疫原)竞争与抗体的结合。
当涉及本发明的重组蛋白或多肽时,术语“片段”意思是具有与相应的全长蛋白或多肽的氨基酸序列部分但不是全部相同的氨基酸序列的肽或多肽,其保留相应的全长蛋白或多肽的至少一种功能或活性。片段优选包括全长蛋白或多肽的至少20-100个邻接氨基酸残基。
如在此所用的术语“给予”或“引入”意思是通过本领域已知的途径将蛋白质(包括免疫球蛋白)传送至需要的人或动物。药物载体和制剂或组合物也是本领域公知的。给予途径包括静脉内,肌内,皮内,皮下,经皮,粘膜,腔内或粘膜。或者,这些术语可以指用于重组蛋白表达的载体至细胞或至培养物中的细胞和或至患者的细胞或器官的传送。这样的给予或引入可以发生在体内,体外或离体(ex vivo)。可以通过转染,感染或转导将用于重组蛋白或多肽表达的载体引入细胞中,转染通常意思是通过物理方式(例如,磷酸钙转染,电穿孔,微注射或脂质转染)将异种DNA插入细胞中;感染,通常意思是通过感染剂即病毒的引入;转导,通常意思是用病毒稳定感染细胞或将来自一个微生物的基因组材料通过病毒剂(即,噬菌体)转移至另一个微生物。
“转化”通常用来涉及包括异种DNA的细菌或表达致癌基因并已经转化成连续生长模式的细胞,例如,肿瘤细胞。用来“转化”细胞的载体可以是质粒,病毒或其他载体。
通常,根据用于异种DNA(即,载体)的给予,引入或插入细胞中的方式,将细胞称为“转导的”,“感染的”,“转染的”或“转化的”。术语“转导的”,“转染的”和“转化的”在此可交替使用,与异种DNA的引入方式无关。
如在此所用的,术语“稳定转化的”,“稳定转染的”和“转基因”指的是具有整合至基因组的非天然(异种)核酸序列的细胞。通过由子细胞群构成的细胞系或克隆的建立来证明稳定的转染,该子细胞含有通过整合至它们的基因组或作为游离序列稳定复制的转染DNA。在一些情况中,“转染”不是稳定的,即,是瞬时的。在瞬时转染的情况中,表达内源或异种DNA,然而,引入的细胞没有整合至基因组中或宿主细胞不能复制。
如在此所用的,“离体(ex vivo)给予”指的是其中从患者获取初级细胞,将载体给予细胞来产生转导的,感染的或转染的重组细胞并将重组细胞再次给予相同或不同患者的过程。
“多顺反子转录产物”指的是含有多于一个蛋白质编码片段或顺反子的mRNA分子。包括两个编码片段的mRNA称为“双顺反子转录产物”。“5’-近端”编码片段或顺反子是其翻译启动密码子(通常是AUG)最接近多顺反子mRNA分子的5’端编码片段。“5’远端”编码片段或顺反子是其翻译启动密码子(通常是AUG)不是最接近mRNA5’端编码片段启动密码子的编码片段或顺反子。
术语“5’-远端”和“下游”涉及不邻接mRNA分子的5’端的编码片段时可同义使用。
如在此所用的,“共转染”意思是两个(或多个)开放阅读框或编码片段或多核苷酸在信号转录控制或包括启动子的调控序列的转录控制下。
如在此所用的术语“宿主细胞”指的是已经用载体转导,感染,转染或转化的细胞。载体可以是质粒,病毒颗粒,噬菌体等。培养条件,如温度,pH等,是之前用于选定的用于表达的宿主细胞的那些,并且是本领域技术人员清楚的。将认识到术语“宿主细胞”指的是最初转导的,感染的,转染的或转化的细胞及其子代。
如在此所用的,术语“生物活性”和“生物上活性的”指的是归因于培养物中细胞系中或无细胞系统中的特定蛋白质的活性,如ELISA平板中的配体-受体测试。“免疫球蛋白”,“抗体”或其片段的“生物活性”指的是结合抗原决定因子并因此促进免疫功能的能力。激素或白细胞介素的“生物活性”是本领域已知的。
如在此所用的,术语“肿瘤”和“癌症”指的是在正常生长和/或发育中呈现出至少部分失去控制的细胞。例如,常见的肿瘤或癌细胞通常已经失去了接触抑制并可能是入侵性的和/或具有转移的能力。
抗体是免疫球蛋白,其是重链和轻链的杂二聚体。典型的抗体是具有连在一起的两个重链和两个轻链(或其功能片段)的多聚体。抗体可以具有更多的多聚结构次序,二聚体,三聚体,四聚体,五聚体等,通常取决于同型(isotype)。非常难以证明它们在哺乳动物培养物表达系统中从单个载体或从两个载体表达全长形式。几种方法目前用于生产抗体:动物的体内免疫来产生“多克隆”抗体,B细胞杂交瘤的体外细胞培养来产生单克隆抗体(Kohler等,1988,Eur.J.Immunol.6:511;Antibodies:A Laboratory Manual,Cold Spring Harbor Laboratory,1988;在此引入作为参考)和重组DNA技术(例如,描述于Cabilly等,US专利No.6331415,在此引入作为参考)。
公知免疫球蛋白多肽的基础分子结构包括两个分子量大约23,000道尔顿的相同轻链和两个分子量53,000-70,000的相同重链,其中四条链以“Y”构型通过二硫键连接。氨基酸序列从Y顶端的N-端至每条链底部的C-端。在N-端是可变区(大约100个氨基酸长),其提供了抗原结合的特异性。
本发明涉及用于生产所有类型的免疫球蛋白的改良方法,包括但不限于,具有天然序列(即,应答抗原刺激产生的序列)的全长抗体和抗体片段,合并单个稳定折叠多肽链中重链和轻链的抗原结合可变区的单链抗体;单价抗体(其包括结合第二个重链的Fc片段的重链/轻链二聚体);“Fab片段”,其包括免疫球蛋白分子的全部“Y”片段,即,“Y”的分支,单独的轻链或重链,或其部分(即,一个重链和一个轻链的组合体,通常称为Fab’);“杂交免疫球蛋白”,其具有两个或多个不同抗原的特异性(例如,quadromas或双特异性抗体,如US专利No.6,623,940中所述的);“合成的免疫球蛋白”,其中重链和轻链模拟来自不同物种或特征的那些;和“嵌合抗体”,其中重链和轻链氨基酸序列的每个部分源自多于一个物种(即,可变区源自一个来源,如鼠抗体,而不变区源自另一个来源,如人抗体)。
在免疫球蛋白或其片段的生产中发现本发明的组合物和方法的实用性,其中重链和轻链是“哺乳动物”,“嵌合”或修饰的方式来提高其功效。修饰的抗体包括保持未修饰形式的相同生物活性的氨基酸和核酸序列和已经修饰使得活性改变的那些,即,不变区的改变提高了补体结合,与膜的相互作用,和其他效应物功能,或可变区的改变提高了抗原结合特性。本发明的组合物和方法可以进一步包括催化免疫球蛋白或其片段。
“变体”免疫球蛋白编码多核苷酸序列可以编码“变体”免疫球蛋白氨基酸序列,其通过参照多肽序列的一个或多个氨基酸得到改变。以下该相同的讨论适用于其他目标生物活性蛋白序列(及其编码序列)。变体多核苷酸序列可以编码变体氨基酸序列,其含有“保守性”取代,其中取代的氨基酸具有与其取代的氨基酸相似的结构或化学特征。理解目标蛋白的变体可以由天然产生的序列的氨基酸序列基本上相同的(至少约80至99%相同,以及其中所有的整数)氨基酸序列制得,并且其形成功能上等价的三维结构和保留天然产生蛋白的生物活性。生物领域公知可以在蛋白质序列中形成特定的氨基酸置换而没有影响蛋白质的功能。通常,定制保守氨基酸置换或相似氨基酸的置换而没有相应蛋白质功能。相似的氨基酸可以是大小和/或电荷特征相似的那些,例如,天冬酰胺和谷氨酰胺,异亮氨酸和缬氨酸是两对相似的氨基酸。除非故意,当没有破坏天然二级和三级结构形成时,允许相互的置换。在本领域中以各种方式测定了氨基酸对之间的相似性。例如,Dayhoff等,在Atlas of Protein Sequence and Structure,1978,Volumn 5,增补3,22章,345-352页,在此将其引入作为参考,提供了氨基端置换的频率表,其可以用作氨基酸相似性的测量。Dayhoff等的频率表是基于来自各种进化不同来源的具有相同功能的蛋白质的氨基酸序列的比较。
可以通过本领域公知的方法容易地制备所公开核苷酸(和氨基酸)序列的置换突变,插入和删除变体。这些变体可以以特意举例说明的序列相同的方式使用,只要变体具有与本发明特意举例说明的序列基本的序列同一性并保持所需的功能性。
如在此所用的,基本序列同一性指的是足以使变体多核苷酸或蛋白以与产生变体的多核苷酸或蛋白相同的能力作用的同源性(或同一性)。优选,该序列同一性高于70%或80%,更优选,该同一性高于85%,或该同一性高于90%,和或,这高于95%,以及70和100%之间的所有整数。本领域技术人员公知制备功能等价的置换突变,插入和删除突变或设计来提高序列的功能或另外提供方法优势。确定没有可以根据任何天然产生的蛋白质或根据具有资格的现有技术条目理解的实施方案/变体在所要求的本发明范围内。本领域公知本发明的多核苷酸序列可以截断和/或另外突变,使得所得到的特定片段和/或最初的全长序列的突变体可以保留所需的全长序列的特征。适用于从较大的核酸分子产生片段的各种限制酶是公知的。此外,公知Bal31内切核酸酶可以方便地用于DNA控时的有限消化。参见,例如,Maniatis等,1982,Molecular Cloning :A Laboratory Manual,Cold Spring HarborLaboratory,New York,135-139页,在此引入作为参考。还可以参见Wel等,1983,J.Biol.Chem.258:13006-13512。通过使用Bal31内切核酸酶(通常称为“erase-a-base”方法),本领域技术人员可以从主体核酸的任一个或两个末端除去核苷酸来产生宽谱的片段,其在功能上等价于主体核苷酸序列。本领域技术人员可以以这种方式从沿着最初编码序列的所有位置产生数百个受控的不同长度的片段。本领域技术人员可以常规地测试或筛选产生的片段的特征并按照在此教导的测定片段的实用性。还公知的是可以用定点突变容易地产生全长序列或其片段的突变序列。参见,例如,Larionov,O.A.和Nikiforov,V.G.1982,Genetika 18:349-59;Shortle等,(1981)Annu.Rev.Genet.15:265-94;在此将两篇都引入作为参考。本领域技术人员可以常规地生产删除-,插入-或置换-型突变并鉴定含有所需全长野生型序列或其片段特征的那些所得到的突变体,例如,保持激素,细胞因子,抗原结合或其他生物活性的那些。
此外,或可替换地,变体多核苷酸序列可以编码含有“非保守”置换的变体氨基酸序列,其中置换的氨基酸具有与置换的氨基酸不同的结构或化学特征。变体免疫球蛋白编码序列还可以编码含有氨基酸插入或删除或两者的变体氨基酸序列。此外,变体免疫球蛋白编码序列可以编码与参照多肽序列相同的多肽,但是由于遗传密码的简并,具有参照多核苷酸序列一个或多个碱基改变的多核苷酸序列。
当涉及本发明的重组免疫球蛋白时,术语“片段”意思是具有与相应的全长免疫球蛋白的部分但不是全部的氨基酸序列相同的氨基酸序列的多肽,其基本上保留与相应的全长蛋白相同的生物功能或活性,或保留相应全长蛋白的至少一种功能或活性。片段优选包括全长免疫球蛋白的至少20-100个邻接氨基酸残基,并优选,保留与全长抗体结合相同抗原的能力。
如在此所用的,术语“序列同一性”意思是使用序列比对程序比对时,两个或多个比对的序列相同的核酸或氨基酸序列。在此的术语“%同源性”和在此的术语“%同一性”交替使用并指的是使用序列比对程序比对时,两个或多个比对序列之间的核酸或氨基酸序列同一性的水平。例如,如在此所用的,80%同源性意思是通过限定的算法测定相同的物质为80%序列同一性,并因此给定序列的同系物在给定序列的长度具有高于80%的序列同一性。
可以进行用于比较的最佳序列比对,例如,通过Smith和Waterman的局部同源性算法,Adv.Appl.Math.2:482,通过Needleman和Wunsch的同源性比对算法,1970,J.Mol.Biol.48:443,通过Pearson和Lipman的相似性方法的探寻,1988,Proc.Natl.Acad.Sci.USA 85:244,通过这些算法的计算机化执行(Wisconsin Genetics软件包中的GAP,BESTFIT,FASTA和TFASTA,Genetics Computer Group,Madison,Wis.),通过BLAST算法,Altschul等,1990,J Mol.Biol.215:403-410,软件通过生物信息网址的国家中心公众可以获得(参见nlm.nih.gov/),或通过视觉观察(总地参见,Ausubel等,下文)。为了本发明的目的,最优选通过Smith和Waterman的局部同源性算法来进行用于比较的最佳序列比对,1981,Adv.Appl.Math.2:482。还可以参见Altschul等,1990和Altschul等,1997。
在两个或多个核酸或蛋白序列范围内的术语“相同的”或百分比“同一性”指的是为最大相应性比较和比对时,两个或多个相同的或具有特定百分比的相同氨基酸残基或核苷酸的序列或子序列,如使用在此所述的一种序列比较算法如Smith-Waterman算法,本领域已知的其他算法,例如,BLAST,或通过视觉观察所测量的。
根据本发明,还包括的是序列变体,其编码自我加工裂解多肽和多肽本身,具有与天然序列80%、85%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%(以及80和100之间的所有整数)或更多的序列同一性。还包括的是表示至少5个,至少10个或至少15个单体连续链的多肽的氨基酸片段;以及根据所述的同一性条件与其同源的片段;和表示至少15个,至少30个或至少45个单体的连续链的核酸序列的片段。
如果两个序列在中等至高严谨杂交和洗涤条件下相互特异性杂交,认为核酸序列与参照核酸序列“选择性杂交”。杂交条件是基于核酸结合复合物或探针的熔化温度(Tm)。例如,“最大严谨”通常发生在Tm-5℃(比探针的Tm低5℃);“高严谨”在低于Tm约5-10℃;“中等严谨”在低于探针的Tm约10-20℃;和“低严谨”在低于Tm约20-25℃。在功能上,最大严谨条件可以用来鉴定与杂交探针具有严格同一性或接近严格同一性的序列;而高严谨条件用来鉴定与探针具有约80%或更高序列同一性的序列。
中等和高严谨杂交条件是本领域公知的(参见,例如,Sambrook等,1989,第9和11章,和Ausubel,F.M.等,1993)。高严谨条件的一个实例包括在50%甲酰胺,5×SSC,5×Denhardt’s溶液,0.5%SDS和100μg/ml变性载体DNA中在约42℃杂交,接着在2×SSC和0.5%SDS中在室温洗涤两次,在0.1×SSC和0.5%SDS中在42℃再洗涤两次。认为编码具有与天然产生的目标蛋白相同生物活性的多肽并在高严谨杂交条件下杂交的2A序列在本发明的范围内。
作为遗传密码子简并性的结果,可以产生编码相同2A或2A样多肽序列或其他蛋白酶或信号肽酶裂解序列的多个编码序列。例如,三联体CGT编码氨基酸精氨酸。可替换地,通过CGA,CGC,CGG,AGA和AGG来编码精氨酸。因此,认识到编码片段中这样的同义密码子置换落入本发明涵盖的序列变体内。
进一步认识到这样的序列变体在高严谨条件下与亲本序列可以杂交或不可以杂交。例如,当序列变体包括亲本核苷酸编码的每个氨基酸的不同密码子时,这是可能的。无论如何,特意考虑并由本发明包括这样的变体。
抗体作为治疗形式的潜能受到目前技术的生产能力和经费的普遍限制。用于免疫球蛋白(或其他蛋白)生产的改进病毒或非病毒单个表达载体促进两个或多个编码序列的表达和传送,即,具有来自单个载体的双-或多-特异性的免疫球蛋白或其他蛋白。本发明解决了这些局限并适用于任何免疫球蛋白(即,抗体)或其片段,或其他多部分蛋白或结合蛋白对,如在此进一步详述的,包括工程化的抗体,如单链抗体,全长抗体或抗体片段,双链激素,双链细胞因子,双链趋化因子,双链受体等。
IRES
首先在piconavirusm RNA中发现了内部核糖体进入位点(IRES)(Jackson等,1990,Trends Biochem.Sci.15:477-83,和Jackson和Kaminski,1995,RNA 1:985-1000)。本领域技术人员通常使用的IRES实例包括表1中涉及的那些,以及US专利No.6,692,736中所述的那些。本领域已知的“IRES”实例包括,但不限于从小核糖核酸病毒获得的IRES(Jackson等,1990)和从病毒或细胞mRNA来源获得的IRES,如,免疫球蛋白重链结合蛋白(BiP),血管内皮生长因子(VEGF)(Huez等,1998,Mol.Cell.Biol.18:6178-6190),成纤维细胞生长因子2(FGF-2),和胰岛素样生长因子(IGFII),翻译启动因子elF4G和酵母转录因子TFIID和HAP4,从Novagen购得的脑心肌炎病毒(EMCV)(Duke等,1992,J.Virol.66:1602-9)和VEGF IRES(Huez等,1998,Mol.Cell.Biol.18:6178-90)。已经在不同的病毒中报道了IRES,如心病毒(cardiovirus),鼻病毒,口疮病毒(aphthovirus),HCV,Friend鼠白血病病毒(FrMLV)和莫洛尼氏鼠白血病病毒(MoMLV)。如在此所用的,“IRES”包括IRES序列的功能性变化,至少变化能够促进指导内部核糖体进入顺反子的启动子密码子中。IRES可以是哺乳动物,病毒或原生动物的。
IRES促进指导内部核糖体进入下游顺反子的启动密码子中,导致cap-自主翻译。因此,可以从双顺反子(或多顺反子)mRNA表达下游顺反子的产物,而不需要多蛋白的裂解或单顺反子mRNA的产生。内部核糖体进入位点大约450个核苷酸长,并且特征在于初级序列的中等保守和二级结构的强烈保守。IRES最显著的初级序列特征是富嘧啶位点,其起始点大约位于IRES 3’端上游25个核苷酸。参见Jackson等(1990)。
已经鉴定并表征了三个主要类别的小核糖核酸病毒IRES:心病毒和口疮病毒类别(例如,脑心肌炎病毒,Jang等,1990,Gene Dev 4:1560-1572);肠道病毒和鼻病毒类别(例如,脊髓灰质炎病毒,Borman等,1994,EMBO J.13:3149-3157);和甲肝病毒(HAV)类别,Glass等,1993,Virol.193:842-852)。对于头两个类别,使用两个一般的原则。首先,大部分IRES的450-核苷酸序列用来维持有助于核糖体结合和翻译启动的特定二级和三级结构。其次,核糖体进入位点是位于IRES 3’端的AUG三联体,保守寡嘧啶区域下游的大约25个核苷酸。翻译启动可以发生在核糖体进入位点(心病毒)或下一个下游AUG(肠道病毒/鼻病毒类别)。在口疮病毒中,在两个位点发生启动。HCV和pestivirus如牛病毒腹泻病毒(BVDV)或传统猪瘟病毒(CSFV)各自具有341nt和370nt长5’-UTR。这些5’-UTR片段形成相似的RNA二级结构并可以具有适度有效的IRES功能(Tsuklyama-Kohara等,1992,J.Virol.66:1476-1483;Frolov等,1998,RNA 4:1418-1435)。最近的研究表明Friend-鼠白血病病毒(MLV)5’-UTR和大鼠逆转录转座子病毒样30S(VL30)序列含有逆转录病毒来源的IRES结构(Torrent等,1996,Hum.Gene Ther 7:603-612)。
在真核细胞中,通常通过从加帽mRNA 5’端的核糖体扫描启动翻译,在启动因子的控制下。然而,已经发现几个细胞mRNA具有IRES结构来介导cap-自主翻译(van der Velde等,1999,Int J Biochem CellBiol.31:87-106)。IRES序列的实例包括,但不限于,免疫球蛋白重链结合蛋白(BiP)(Macejak等,1991,Nature 353:90-94),果蝇的antennapedia mRNA(Oh等,1992,Gene and Dev 6:1643-1653),成纤维细胞生长因子-2(FGF-2)(Vagner等,1995,Mol.Cell.Biol.15:35-44),血小板产生的生长因子B(PDGF-B)(Bernstein等,1997,J.Biol.Chem.272:9356-9362),胰岛素样生长因子II(Teerink等,(1995)Biochim.Biophys.Acta 1264:403-408),和翻译启动因子elF4G(Gan等,1996,J.Biol.Chem.271:623-626)。最近,还发现血管内皮生长因子(VEGF)具有IRES序列(Stein等,1998,Mol.Cell.Biol.18:3112-3119;Huez等,1998,Mol.Cell.Biol.18:6178-6190)。IRES序列的更多实例包括小核糖核酸病毒HAV(Glass等,1993,Virology 193:842-852);EMCV(Jang和Wimmer,1990,Gene Dev.4:1560-1572);脊髓灰质炎病毒(Borman等,1994,EMBO J.13:3149-3157);HCV(Tsukiyama-Kohara等,1992,J.Virol.66:1476-1483);pestivirus BVDV(Frolov等,1998,RNA.4:1418-1435);Leishmania LRV-1(Maga等,1995,Mol.Cell.Biol.15:4884-4889);逆转录病毒:MoMLV(Torrent等,1996,Hum.Gene Ther.7:603-612)。VL30,Harvey鼠肉瘤病毒,REV(Lopez-Lastra等,1997,Hum.Gene Ther.8:1855-1865)。可以使用本领域已知的标准重组和合成方法制备IRES。为了克隆方便,可以将限制位点工程化至待使用的IRES片段末端之中。
为了从病毒或非病毒载体决定的单个转录产物表达两个或多个蛋白,内部核糖体进入位点(IRES)序列通常用来驱动第二,第三,第四个编码序列等的表达。当通过IRES连接两个编码序列时,第二个编码序列的翻译表达水平通常显著降低(Furler等,2001,Gene Therapy 8:864-873)。实际上,使用IRES来控制可操纵地连接相同启动子的两个或多个编码序列的转录导致第二个,第三个等的编码序列相对于邻接启动子的编码序列较低的表达水平。此外,IRES序列可以足够长来影响完成载体的包装,例如,eCMV IRES具有507个碱基对长。
多蛋白(作为初级翻译产物)形式的蛋白表达是适用于许多病毒复制的策略,包括但不限于,小核糖核酸病毒科。在翻译时,病毒编码的自我加工肽介导多蛋白的快速分子内(cis)裂解来产生分开的(成熟)蛋白产物。本发明提供了优于使用IRES的优势,因为提供了用于重组蛋白或多肽表达的载体,该载体包括自我加工肽序列(在此通过2A肽序列举例说明)或其它蛋白酶裂解位点,其促进了使用单个启动子的两个或多个蛋白或多肽编码序列的表达,其中两个或多个蛋白或多肽以有利的摩尔比表达。对于免疫球蛋白,通过用于一个重链的编码序列和用于一个或两个轻链的编码序列来编码多蛋白,每个其中含有编码的自我加工位点或蛋白酶识别位点。
在含有蛋白内含子的构建体中,只存在各自一个重链和轻链片段,以框内容和多蛋白表达,在两个免疫球蛋白链之间具有蛋白内含子,具有合适的特征以能够在蛋白内含子-免疫球蛋白链连接处裂解但两个免疫球蛋白不再连接。在另一个含有蛋白内含子的构建体中,存在一个或多个其它的免疫球蛋白片段,任选通过裂解位点与第一个和/或第二个片段隔开。例如,使用蛋白内含子方法来表达一个重链片段和一个轻链片段或表达一个重链和两个轻链等。
如上定义的“自我加工裂解位点”或“自我加工裂解序列”指的是DNA编码序列或氨基酸序列,其中翻译时,包括自我加工裂解位点的多肽发生快速分子内(cis)裂解来产生分开的成熟蛋白产物。这样的“自我加工裂解位点”也可以称为共翻译或翻译后加工裂解位点,在此通过2A位点,序列或结构域或蛋白内含子来举例说明。2A位点,序列或结构域证明了翻译效果,通过改变核糖体促进酯键水解的能力,因此以允许分开的下游翻译产物进行合成的方式从翻译复合物中释放多肽(Donnelly,2001)。或者,2A位点或结构域证明了“自我蛋白酶解”或“裂解”,通过以cis裂解其自身的C-端来产生初级裂解产物(Furler和Palmnberg,1990,Ann.Rev.Microbiol.44:603-623)。其它蛋白酶识别序列,包括信号肽酶裂解位点可以取代自我加工位点。蛋白内含子在多蛋白中也是有用的。
蛋白内含子
如在此所用的,蛋白内含子是表达的蛋白内的片段,通过N-蛋白外显子结合初级表达产物的N-端,通过C-蛋白外显子结合初级表达产物的C-端。天然产生的蛋白内含子介导蛋白内含子的切除以及N-和C-蛋白外显子的再连接(蛋白连接)。然而,在本发明表达产物的范围内,蛋白内含子的初级序列或侧翼蛋白外显子氨基酸序列使得在蛋白外显子的连接不存在或降低或最小量的蛋白外显子连接下发生蛋白主链的裂解,使得蛋白外显子蛋白从初级翻译产物(多蛋白)中释放出来而没有连接形成融合蛋白。初级表达产物的蛋白内含子部分(通过mRNA合成的蛋白,在任何蛋白酶解裂解之前)介导N-蛋白外显子/蛋白内含子处的蛋白酶解裂解和蛋白内含子/C-蛋白内含子连接。通常,天然产生的蛋白内含子还介导N-蛋白外显子和C-蛋白外显子的剪接在一起(通过形成肽键的连接)。然而,在本发明中,因为应用于表达两个多肽的目标(如通过抗体分子的重链和轻链特意举例说明的),优选没有发生蛋白连接。这可以通过引入蛋白内含子来实现,该蛋白内含子天然或通过突变而不具有连接活性。或者,通过突变来改变剪接位点处或邻近的氨基酸来防止释放蛋白的连接,因此防止剪接。参见,Xu和Perler,1996,EMBO J.15:5146-5153;通常在C-蛋白外显子的起点处产生Ser、Thr或Cys。
蛋白内含子是一类蛋白质,只在其它蛋白的基因内发现它们的基因。与称为蛋白外显子的侧翼宿主基因一起,将蛋白内含子转录为单个mRNA,并作为单个多肽翻译。在翻译后,蛋白内含子启动自体催化事件来除去自身并使用新的多肽键连接侧翼宿主蛋白片段。该反应只通过蛋白内含子来催化,不需要其它细胞蛋白,辅因子或ATP。在各种单细胞生物体中发现蛋白内含子,并且它们具有不同的大小。许多蛋白内含子含有核酸内切酶结构域,其引起它们在基因组内的移动性。
蛋白内含子介导的反应已经用于生物技术中,尤其用于体外情况中,如用于纯化和用于蛋白质芯片构建,和用于植株改良中(Perler,F.B.2005,IUBMB Life 57(7):469-76)。已经将突变引入天然蛋白内含子核苷酸序列中,并且报道了这些突变中的一些具有改变的特征(Xu和Perler,1996,EMBO J.15(9),5146-5153)。除了蛋白内含子,还已知细菌蛋白内含子样(BIL)结构域和hedgehog(Hog)自体加工结构域,Hog/蛋白内含子(HINT)超家族的其它2成员催化通过相似机理的翻译后自我加工(Dassa等,2004,J.Biol.Chem.279(31):32001-32007)。
蛋白内含子作为特定宿主蛋白中的框内插入产生。在自我剪接反应中,蛋白内含子从前体蛋白切除它们自身,同时侧翼片段,蛋白外显子,变成连接的来恢复宿主基因功能。这些序列还含有核酸内切酶功能,引起它们在基因组内的移动性。蛋白内含子以各种大小(134至1650个氨基酸)产生,并且已经在真细菌,真核生物和archaea中得到鉴定。使用模式剪接/报告系统的实验已经表明可以将核酸内切酶,蛋白裂解和蛋白剪接功能分开(Xu和Perler,1996,EMBO J.15:5146-5153)。以下描述的实施例使用了来自嗜热极端古菌(Pyrococcushorikoshii)Pho Pol I,酿酒酵母VMA和集胞藻的蛋白内含子,与来自抗体重链和轻链的序列形成融合蛋白。设计蛋白内含子的突变来删除蛋白内含子的剪接能力,导致单个多肽经受自我裂解来正确产生编码的抗体重链和轻链。可以将这种策略相似地用于其它多链蛋白,激素或细胞因子的表达中,并且还适用于前体蛋白(前蛋白)加工成成熟的生物活性形式。尽管在此特意举例说明使用极端嗜热古菌Pho Pol I,酿酒酵母VMA和集胞藻的蛋白内含子,本领域已知的其他蛋白内含子也可用于本发明的多蛋白表达载体和方法中。
除了极端嗜热古菌Pho Pol I,酿酒酵母VMA和集胞藻蛋白内含子以外的许多其它蛋白内含子是本领域已知的(参见,例如,Perler,F.B.2002,InBase,the Intein Database,Nucl.Acids.Res.30(1):383-384和the Intein Database and Registry,通过New England Biolabs网址可获得,例如,http://tools.neb.com/inbase/)。已经在各种生物体如酵母,分枝杆菌和极端嗜热古细菌中鉴定出蛋白内含子。特定的蛋白内含子具有核酸内切酶活性以及位点特异性蛋白切割和剪接活性。核酸内切酶活性对于本发明的实践不是必需的;可以删除核酸内切酶编码片段,只要保留蛋白裂解活性。
已经很详细地研究了蛋白剪接过程的机理(Chong等,1996,J.Biol.Chem.271:22159-22168;Xu和Perler,1996,EMBO J 15:5146-5153)并且已经在蛋白内含子和蛋白外显子剪接点处发现了保守的氨基酸(Xu等,1994,EMBO J 13:5517-5522)。在此所述的构建体含有与第一个编码序列的5’-端融合的蛋白内含子序列,第二个编码序列在框内融合蛋白内含子的C-端。可以从任何一种已知的蛋白选择合适的蛋白内含子序列来含有蛋白剪接序列。含有所有已知蛋白内含子的数据库可以在环球网上找到(Perler,F.B.1999,Nucl.Acads Res.27:346-347)。将蛋白内含子编码序列在3’端融合(框内)第二个编码序列的5’端。为了将该蛋白靶向特定细胞器,可以将合适的肽信号融合蛋白的编码序列。
在第二个蛋白外显子编码序列后,可以重复蛋白内含子编码序列-蛋白外显子编码序列,重复数量为用于在相同细胞中多个蛋白表达所需的那样多。对于含有多个蛋白内含子构建体,可以使用来自不同来源的蛋白内含子序列。在最后一个待表达基因的序列之后,理想地插入转录终止序列,并有利地包括多腺苷酸序列。多腺苷酸化序列和终止序列的次序可以按照本领域技术人员所知的。在一个实施方案中,多腺苷酸化序列可以在终止序列之前。
已经设计了修饰的蛋白内含子剪接单体,使得修饰的目标蛋白内含子可以催化从蛋白内含子切除蛋白外显子但不能催化蛋白外显子的连接(例如,参见,US专利7026526和US专利公开20020129400)。Pyrococcus物种GB-D DNA聚合酶中C-端蛋白外显子连接的突变产生改变的剪接序列,该序列包括蛋白外显子和蛋白外显子的裂解但防止蛋白外显子随后的连接(Xu和Perler,1996,EMBO J 15:5146-5153)。丝氨酸538突变成丙氨酸或甘氨酸(Ser至Ala或Gly)诱导了裂解但防止了连接。在这样的位置,Ser至Met或Ser至Thr还用来获得多蛋白的表达,该多蛋白裂解成分开的片段和至少部分不再连接。由于C-端蛋白外显子连接处氨基酸与蛋白内含子的相对保守,其它蛋白内含子剪接单体中等价残基的突变还可以防止蛋白外显子片段的连接。在低保守/同源性的情况中,例如,C-端蛋白外显子的头几个,例如,约五个残基和/或蛋白内含子片段的最后几个残基有系统地改变,并筛选给定蛋白外显子片段支持裂解但不剪接的能力,特别是在此公开的和本领域已知的蛋白外显子片段。存在不含有核酸内切酶结构域的蛋白内含子;这些包括集胞藻dnaE蛋白内含子和蟾蜍分枝杆菌GyrA蛋白(Magnasco等,Biochemistry,2004,43,10265-10276;Telenti等,1997,J.Bacteriol.179:6378-6382)。其它已经在自然中发现或已经通过从编码含核酸内切酶的蛋白内含子的序列除去核酸内切酶编码结构域人工形成(Chong等,1997,J.Biol.Chem.272:15587-15590)。在理想的情况中,最初选择素内含子使得其由执行剪接功能需要的最小数量氨基酸构成,如来自蟾蜍分枝杆菌GyrA蛋白的蛋白内含子(Telenti等,1997,上文)。在可替换的实施方案中,选择没有核酸内切酶的蛋白内含子,如来自蟾蜍分枝杆菌GyrA蛋白或酿酒酵母VMA蛋白内含子的已经修饰除去核酸内切酶结构域的蛋白内含子(Chong等,1997,上文)。
蛋白内含子剪接单体的进一步修饰可以改变裂解反应的反应速率,使得通过简单修饰剪接单体的基因序列来控制蛋白含量。
在一个实施方案中,将C-端蛋白外显子的第一个残基工程化来含有甘氨酸或丙氨酸,显示出该修饰防止使用古菌种GB-D DNA聚合酶的蛋白外显子连接(Xu和Perler,1996,EMBO J 15:5146-5153)。在该实施方案中,优选的C-端蛋白外显子蛋白在天然氨基酸序列中的N-甲硫氨酸之后天然含有甘氨酸或丙氨酸残基。蛋白外显子的甘氨酸或丙氨酸与蛋白内含子C-端的融合在多蛋白加工后提供了天然的氨基酸序列。在另一个实施方案中,通过改变天然序列或通过将另外的氨基酸残基天价之天然序列的N-端上,将人造甘氨酸或丙氨酸置于C-端蛋白外显子中。在该实施方案中,在多蛋白加工后,蛋白的天然氨基酸序列将改变一个氨基酸。在进一步的实施方案中,用于本发明中的其它修饰描述于US7026526中。
古菌种GB-D DNA聚合酶蛋白内含子的DNA序列是US专利No.7,026,526的SEQ ID NO:1。N-端蛋白外显子连接点是“aac”序列(SEQ ID NO:1的核苷酸1-3)并编码天冬酰胺残基。天然GB-D DNA聚合酶前体蛋白的剪接为点之后为SEQ ID NO:1中的核苷酸3和核苷酸1614。C-端蛋白外显子连接点是“agc”序列(SEQ ID NO:1的核苷酸1615-1617),其编码丝氨酸残基。C-端蛋白外显子丝氨酸突变成丙氨酸或甘氨酸形成修饰的蛋白内含子剪接序列,该序列能够促进多蛋白的切除但不促进蛋白外显子单体的连接。
蟾蜍分枝杆菌GyrA最小蛋白内含子的DNA序列是US专利7,026,526的SEQ ID NO:2。N-端蛋白外显子连接点是“tac”序列(SEQID NO:2的核苷酸1-3)并编码酪氨酸残基。前体蛋白中剪接位点后为SEQ ID NO:2的核苷酸3和核苷酸597。C-端蛋白内含子连接点是“acc”序列(SEQ ID NO:2的核苷酸598-600)并编码苏氨酸残基。C-端蛋白内含子苏氨酸土变成丙氨酸或甘氨酸形成修饰的蛋白内含子剪接序列,该序列促进多蛋白的切除但不促进蛋白外显子单体的连接。
2A系统
现在转向本发明的2A蛋白酶加工实施方案,2A的活性涉及密码子之间的核糖体跳跃,其防止了肽键的形成(de Felipe等,2000,HumanGene Therpy 11:1921-1931;Donnelly等,2001,J.Gen.Virol.82:1013-1025),尽管已经认为结构域作用更象自溶酶(Ryan等,1989,Virology 173:35-45)。已经建立了其中将口蹄疫病毒(FMDV)2A编码片段克隆至表达载体并转染至靶细胞中的研究,人造报告多蛋白的FMDV 2A裂解在多种异种表达系统中是有效的(麦芽溶菌产物和转基因烟草植物(Halpin等,U.S.专利No.5846767(1998)和Halpin等,1999,The Plant Journal 17:453-459);Hs 683人神经胶质瘤细胞系(deFelipe等,1999,Gene Therapy 6:198-208;此后称为“de Felipe II”);兔子网织红细胞溶菌产物和人HTK-143细胞(Ryan等,1994,EMBOJ.13:928-933);和昆虫细胞(Roosien等,1990,J.Gen.Virol.71:1703-1711)。已经表明对于生物相关分子的异种多蛋白的FMDV 2A介导的裂解为IL-12(p40/p35杂二聚体;Chaplin等,1999,J.InterferonCytokine Res.19:235-241)。在转染的COS-7细胞中,FMDV 2A介导了p40-2A-p35多蛋白裂解成具有IL-12相关活性的生物功能性p40和p35亚基。
已经将FMDV 2A序列引入表达载体中,单独或结合不同IRES序列,来构建双顺反子,三顺反子和四顺反子载体。Furler(2001)证明了动物中2A介导的基因表达的效率,使用编码α-突触核蛋白和EGFP或Cu/Zn超氧化物歧化酶(SOD-1)的重组腺相关病毒(AAV)载体并通过FMDV 2A序列连接EGFP。EGFP和α-突触核蛋白以相对于相应的基于IRES的载体显著更高的水平从包括2A序列的载体表达,而SOD-1以相当或略高的水平得到表达。
通过源自小核糖核酸病毒的病毒序列来举例说明编码自我加工裂解位点的DNA序列,包括但不限于肠道病毒,心病毒,口疮病毒或口蹄疫病毒(FMDV)。在优选的实施方案中,自我加工裂解位点编码序列源自FMDV。自我加工裂解位点包括但不限于2A和2A样结构域(Donnelly等,2001,J.Gen.Virol.82:1027-1041,在此以其整体引入作为参考)。
或者,蛋白酶识别位点可以替代自我加工位点。合适的蛋白酶和同源识别位点包括,但不限于,弗林蛋白酶,RXR/K-R(SEQ ID NO:1);IPNV的VP4,S/TXA-S/AG(SEQ ID NO:2);烟草蚀刻病毒(TEV)蛋白酶,EXXYXQ-G(SEQ ID NO:3);鼻病毒的3C蛋白酶,LEVLFQ-GP(SEQ ID NO:4);PC5/6蛋白酶;PACE蛋白酶,LPC/PC7蛋白酶;肠激酶,DDDDK-X(SEQ ID NO:5);因子Xa蛋白酶,IE/DGR-X(SEQ ID NO:6);凝血酶,LVPR-GS(SEQ ID NO:7);genenase I,PGAAH-Y(SEQ ID NO:8);和MMP蛋白酶;内部可裂解信号肽,其实例是C型流感病毒的内部可裂解信号肽(Pekosz A.1998,Proc.Natl.Acad.Sci.USA 95:I13222-13238)(MGRMAMKWLVVIICFSITSQPASA,SEQ ID NO:11)。可以作为多蛋白的一部分以反式或顺式提供蛋白酶,使得在相同转录内得到编码并与剩余的初级翻译产物分离,例如,通过自我加工位点或蛋白酶识别位点。
随着越来越多的抗体治疗剂批准用于临床应用,在过去20年中制造这些治疗蛋白的方法中存在稳定的提高(Wurm,FM,2004,“Production of recombinant protein therapeutics in cultivated mammaliancells”(在培养的哺乳动物中重组蛋白治疗剂的生产)Nat.Biotechnol.22(11):1393)。然而,工业上仍然希望更有效和可靠的生产方法。一些所需的特征包括更高水平的抗体分泌至培养基中,生产细胞系提高的遗传稳定性和细胞系更高的传代速度。
在我们对更有效生产治疗性抗体方法的研究中,我们已经研发了从单个开放阅读框表达抗体重链和轻链的方法。在一个这样的方法中,将蛋白内含子编码序列用来隔开单个开放阅读框(sORF)内的抗体重链和轻链。通过这样的sORF抗体表达技术给予的优势包括操纵用于重链和轻链的基因用量比例的能力,用于ER中多亚基装配的重链和轻链多肽的接近性和高效蛋白分泌的潜能。
其它用于在哺乳动物细胞中表达单克降抗体的技术涉及引入两个分开的ORF中的重链和轻链基因,每个ORF具有自己的启动子和调控序列。启动子干扰是与此方法相关的关注问题。将抗体重链和轻链序列引入表达细胞系中的可替换方法是使用内部核糖体进入位点(IRES)来隔开抗体重链和轻链编码序列。由于在翻译IRES序列的编码序列下游中降低的效率,该方法还没有广泛使用。最近,已经描述了使用编码口蹄疫病毒肽(2A肽)的序列来隔开抗体重链和轻链编码序列的方法(Fang等,2005,Nat.Biotechnol.23(5):584-90)。在该方法中,抗体重链和轻链以及2A肽作为单个mRNA转录。然而,在它们进入内质网(ER)之前裂解抗体重链和轻链。此外,在重链和轻链裂解/分开后在重链的C-端留下两个非天然氨基酸。本发明的蛋白内含子表达系统在根本上是不同的。其不同于2A方法,因为翻译重链和轻链多肽并作为单个多蛋白带至ER中。有利地,不需要将非天然氨基酸包括在成熟抗体分子中。
以下的描述是在抗体生产载体的所有内容中,载体包括如下的表达盒:启动子-分泌信号-重链-wt蛋白内含子,如极端嗜热古菌Pol I蛋白内含子-分泌信号-轻链-polyA;启动子-分泌信号-重链-修饰的蛋白内含子如极端嗜热古菌Pol I蛋白内含子-轻链-polyA;启动子-分泌信号-重链-Pol修饰的蛋白内含子如极端嗜热古菌Pol I蛋白内含子-分泌信号-轻链-Pol修饰的蛋白内含子如极端嗜热古菌Pol I蛋白内含子-分泌信号-轻链-polyA;启动子-分泌信号-重链-wt或修饰的蛋白内含子如p.horikoshii Pol I蛋白内含子-修饰的分泌信号-轻链-polyA;启动子-分泌信号-轻链-wt或修饰的蛋白内含子如极端嗜热古菌Pol I蛋白内含子-修饰的分泌信号-重链-polyA;启动子-分泌信号-重链-wt或修饰的蛋白内含子如极端嗜热古菌Pol I蛋白内含子-修饰的分泌信号-轻链-polyA;启动子-分泌信号-重链-弗林蛋白酶裂解位点-修饰的蛋白内含子如极端嗜热古菌Pol I蛋白内含子-弗林蛋白酶裂解位点-修饰的蛋白内含子如极端嗜热古菌Pol I蛋白内含子-弗林蛋白酶裂解位点-轻链-弗林蛋白酶裂解位点-修饰的蛋白内含子如极端嗜热古菌Pol I蛋白内含子-弗林蛋白酶裂解位点-轻链-polyA。在更多的构建体中,使用修饰的Psp-GBDPol蛋白内含子。
在此所述的特异举例说明的多蛋白使用在框内与各自在其之前和之后的D2E7重链和轻链融合的极端嗜热古菌Pol I蛋白内含子。在-1位的氨基酸是赖氨酸,在+1位的氨基酸是甲硫氨酸,轻链信号肽的第一个氨基酸。在+1位使用甲硫氨酸允许消除剪接,重链和轻链的连接,如我们在之后的部分中所证明的,理解在+1位需要亲核氨基酸残基如丝氨酸,半胱氨酸或苏氨酸来允许剪接。除了wt蛋白内含子,改变最后一个氨基酸天冬酰胺和第二个至最后一个组氨酸的突变可以用作这些通常消除剪接并防止在N-端剪接连接处裂解的突变(Mills,2004;Xu,1996,Chong,1997)。或者,还可以使用改变蛋白内含子第一个氨基酸的突变,这样的突变通常消除剪接,防止C-端剪接连接处的裂解,并且消除或防止N-端剪接连接处减弱的裂解(Nichols,2004;Evans,1999,和Xu,1996)。例如,这已经证明了“完全阻断剪接并抑制分支中间产物的形成,导致在两个剪接连接处的裂解”(Xu,M.Q.,EMBOvol.15:5146-5153)。
在可替换形式的多肽中,弗林蛋白酶裂解位点的包括允许连接序列的改变,随后在分泌过程中通过弗林蛋白酶裂解切除。表9中给出了蛋白内含子的野生型序列。在古菌GB-D的DNA聚合酶中,裂解/剪接连接是RQRAIKILAN/S(SEQ ID NO:138)(N-端)和HN/SYYGYYGYAK(SEQ ID NO:139)(C端)。理想地,通过HindIII裂解切除核酸内切酶编码片段。裂解,剪接和核酸内切酶功能相互分开,并且该核酸内切酶片段可以由小的连接物取代来形成仍然能够裂解和剪接的迷你-蛋白内含子(Telenti等,1997,J.Bacteriol.179:6378-6382)。还注意到至少一个酵母蛋白内含子在哺乳动物细胞中起作用(Mootz等,2003,J.Am.Chem.Soc.125:10561-10569)。参见用于D2E7(免疫球蛋白)蛋白内含子构建体的编码序列和氨基酸序列的表8A和8B;表8C提供了D2E7蛋白内含子构建体表达载体的完整核苷酸序列。描述了编码D2E7(Humira-阿达木单抗(adalimumab)的注册商标)重链的融合构建,该重链融合修饰的Psp Pol1蛋白内含子,该内含子自身融合D2E7轻链的编码片段。可以扩增轻链序列,蛋白内含子,信号肽或蛋白酶裂解位点将其与剩余的多蛋白隔开。在该实施方案中,成熟重链之前为重链分泌信号。已经按照上述的将蛋白内含子改变,将丝氨酸1改变成苏氨酸,切除内部Hind III片段来除去核酸内切酶活性。将蛋白内含子框内融合成熟D2E7轻链片段。可替换的实施方案将包括成熟轻链的轻链分泌信号5’。参见图10和11用于D2E7蛋白内含子构建体和表达载体的图示,表8A-8C用于表达构建体和完整表达载体的核苷酸序列以及D2E7蛋白内含子构建体的氨基酸序列。
信号肽和信号肽酶
信号假设,其中蛋白在其氨基酸序列内含有用于蛋白靶向膜的信息,已经知道三十多年了。Milstein和同事发现来自骨髓瘤细胞的IgG的轻链以较高的分子量形式合成并将内质网泡囊(微粒体)加入翻译系统时转化成成熟形式,并提出基于这些结果的模型,其中微粒体含有蛋白酶,该蛋白酶通过除去氨基-端延伸肽将前体蛋白形式转化成成熟形式。信号假设很快得到扩充来包括定位于不同胞内膜如线粒体和叶绿体的蛋白质内的不同靶向序列。后来发现这些不同的靶向序列通过特定的信号肽酶(SPase)从输出的蛋白得到裂解。
在细菌中存在至少三种涉及裂解信号肽的不同SPase。SPase I可以处理通过SecYEG途径或双精氨酸定位(Tat)途径输出的非脂蛋白底物。通过SPase II裂解通过Sec途径输出的脂蛋白。SPase裂解为II型分泌装置组成部分的IV型prepilin和prepilin-样蛋白。
在真核细胞中,通过将蛋白共翻译或翻译后靶向Sec61移位机制的信号肽来介导将蛋白质靶向内质网(ER)膜。ER信号肽具有与细菌复本那些相似的特征。通过信号肽酶复合物(SPC)输出至ER腔内后,ER信号肽从输出的蛋白中裂解出来。将蛋白分至真核细胞内不同位置的信号肽必须是不同的,因为这些细胞含有许多不同膜状和水成区隔。被靶向ER的蛋白通常含有可裂解的信号序列。令人惊讶地,许多人造肽可以用作移位信号。认为最重要的关键特征是超过特定极限的疏水性。ER信号肽比细菌信号肽具有更高含量的亮氨酸残基。从核糖体出现后,信号识别颗粒(SRP)结合可裂解信号肽。将初生的蛋白质靶向ER膜需要SRP。蛋白质移位至ER腔后,通过SPC加工输出的蛋白。另一个实施方案利用了在真核细胞中天然产生的信号(前导)肽加工酶。在真核细胞中,通过将蛋白共翻译或翻译后靶向Sec61移位机制的信号肽来介导将蛋白质靶向内质网(ER)膜。通过信号肽酶复合物(SPC)输出至ER腔内后,ER信号肽从输出的蛋白中裂解出来。大部分已知的ER信号肽是N-端可裂解的或内部不可裂解的。最近,发现多种病毒多蛋白如在丙肝病毒,汉坦病毒,黄病毒,风疹病毒和C型流感病毒中发现的那些含有很可能通过ER SPC裂解的内部信号肽。这些关于病毒多蛋白成熟的研究表明SPC不仅可以裂解位于氨基端的信号肽,而且可以裂解之后的信号肽。
Presenilin-型天冬氨酸蛋白酶信号肽肽酶(SPP)裂解它们跨膜片段内的信号肽。SPP对于人类中信号肽产生的HLA-E抗原决定部分的产生是必需的。最近,发现多种病毒多蛋白如在丙肝病毒,汉坦病毒,黄病毒,风疹病毒和C型流感病毒中发现的那些含有很可能通过ERSPC裂解的内部信号肽。因此,预测的信号肽酶底物特异性序列的突变可以阻断病毒的感染性。这些对于多蛋白成熟的研究也是非常有趣的,因为它们显示出SPC不仅可以裂解位于氨基端的信号肽,而且可以裂解之后的信号肽。信号肽酶是本领域公知的。参见,例如,PaetzelM.2002,Chem.Rev.102(12):4549;Pekosz A.1998,Proc.Natl.Acad.Sci.USA.95:13233-13238;Marius K,2002,Molecular Cell 10:735-744;Okamoto K,2004,J.Virol.78:6370-6380,Vol.78;Martoglio B.2003,Human Molecular Genetics 12:R201-R206;和Xia W,2003,J.Cell.Sci.116:2839-2844。
通过将蛋白共翻译或翻译后靶向Sec61移位机制的信号肽来介导将蛋白质靶向内质网(ER)膜。通过信号肽酶复合物(SPC)输出至ER腔内后,ER信号肽从输出的蛋白中裂解出来。大部分已知ER信号肽是N-端可裂解的或内部不可裂解的。最近,发现多种病毒多蛋白如在丙肝病毒,汉坦病毒,黄病毒,风疹病毒和C型流感病毒中发现的那些含有很可能通过ER SPC裂解的内部信号肽。这些对于多蛋白成熟的研究也是非常有趣的,因为它们显示出SPC不仅可以裂解位于氨基端的信号肽,而且可以裂解之后的信号肽。
本发明利用了内部可裂解信号肽,用于在单个转录产物中的多肽表达。然后通过SPC裂解信号转录的多肽,留下分开的单个肽或待装配成蛋白质的单个肽。本发明的方法适用于在单个转录的多肽中表达免疫球蛋白重链和轻链,接着裂解,然后装配成成熟的免疫球蛋白。该技术适用于多肽细胞因子,生长因子,或各种其他蛋白质,例如,单个转录多肽中的IL-12p40和IL-12p35,然后在单个转录多肽中装配成IL-12,或IL-12p40和IL-23p19,然后装配成IL-23。
信号肽酶方法适用于哺乳动物表达载体,其导致从前体或多蛋白表达功能性抗体或其他加工过的产物。在抗体的情况中,作为含有重链和轻链的多蛋白从载体产生,重链和轻链之间的干预序列为内部可裂解信号肽。该内部可分离信号肽可以通过ER中的蛋白酶(主要的信号肽酶),presenilin或presenilin-样蛋白酶来裂解,留下重链和轻链折叠并装配来产生功能性分子,并且理想地将其分泌。除了源自丙肝病毒的内部可裂解信号肽,可以通过ER中的蛋白酶裂解的其他内部可裂解序列是它的替代物。相似地,本发明的实践不需要限于其中信号肽酶实现裂解的宿主细胞,而且还包括蛋白酶,包括但不限于,presenilin,presenilin-样蛋白酶,和其他用于加工多肽的蛋白酶。这些蛋白酶已经在引用的文献中进行了综述。
此外,本发明不限于免疫球蛋白重链和轻链的表达,而且还包括在单个转录产物中表达的其他多肽和多蛋白,接着通过内部信号肽裂解来释放每个单独的肽或蛋白质。这些蛋白质可以在成熟产物中装配在一起或不装配。
还在本发明范围内的是表达构建体,其中单个肽以可替换的次序存在,即,“肽1-内部可裂解信号肽-肽2”或“肽2-内部可裂解信号肽-肽1”。本发明进一步包括通过内部可裂解信号肽连接的多于两个的肽的表达,如“肽1-内部可裂解信号肽-肽2-内部可裂解信号肽-肽3”等。
此外,本发明涉及I型和II型跨膜蛋白的表达和表达构建体周围的其他蛋白酶裂解位点的添加。一个实例是在免疫球蛋白重链之后添加弗林蛋白酶或PC5/6裂解位点来促进重链肽羧基端的其他氨基酸残基的裂解,例如,“重链-弗林蛋白酶裂解位点-内部可裂解信号肽-轻链”。本发明还包括分开或串联的多于一个的内部可裂解信号肽,例如,“重链-弗林蛋白酶裂解位点-内部可裂解信号肽-内部可裂解信号肽-轻链”。再进一步,本发明包括其中存在重链和轻链自我信号肽的维持或去除的情况,如“HC信号肽-重链-弗林蛋白酶裂解位点-内部可裂解信号肽-LC信号肽-轻链”。
以下的描述在抗体生产载体的范围中,其中一些在别处得到了描述。载体涉及包括但不限于以下的。
载体设计表
启动子-分泌信号-重链-内部可裂解信号肽-分泌信号-轻链 -ployA
启动子-分泌信号-重链-内部可裂解信号肽-轻链-polyA
启动子-分泌信号-重链-内部可裂解信号肽-分泌信号-轻链-内部 可裂解信号肽-分泌信号-轻链-polyA
启动子-分泌信号-重链-弗林蛋白酶裂解位点-内部可裂解信号肽 -弗林蛋白酶裂解位点-分泌信号-轻链-plyA;和
启动子-分泌信号-重链-弗林蛋白酶裂解位点-内部可裂解信号肽 -弗林蛋白酶裂解位点-轻链-弗林蛋白酶裂解位点-内部可裂解信 号肽-弗林蛋白酶裂解位点-轻链-polyA。
融合构建体的特定实例编码与内部可裂解信号肽融合的D2E7(Humira/adalimumab)的重链,该信号肽自身与D2E7轻链的编码片段融合。在该实施方案中,成熟重链之前为重链分泌信号。该内部可裂解信号肽序列源自C型流感病毒。在重链的羧基端重包括弗林蛋白酶裂解位点。为了最小化对成熟抗体的影响,将重链的第三个至最后一个氨基酸残基从脯氨酸突变至精氨酸来形成弗林蛋白酶裂解位点。可替换的实施方案包括成熟轻链的轻链分泌信号5’。参见表9A-9C。该实施例中使用来自C型流感病毒的最小内部可裂解信号肽序列(MGRMAMKWLVVIICFSITSQPASA,SEQ ID NO:11)。较大的序列还可以用来提高裂解效率。参见GenBank登录号AB126196。还可以使用编码相同氨基酸序列的各种核苷酸序列。
本发明进一步使用内部可裂解信号肽,用于单个转录产物内编码的多蛋白内的一个或多个多肽的成熟。然后通过SPC裂解单个转录的多肽,留下分开的单个肽或待装配成蛋白的单个肽。本发明适用于在单个转录的多肽中表达免疫球蛋白重链和轻链,然后装配成成熟免疫球蛋白。本发明适用于表达多肽细胞因子,生长因子,或各种其他蛋白质,例如,在单个转录多肽中表达IL-12p40和IL-12p35,然后在单个转录多肽中装配成IL-12,或IL-12p40和IL-23p 19,然后装配成IL-23。
用于本发明载体的两个或多个异种DNA序列之间2A序列或其他蛋白酶或信号肽酶裂解(识别)位点的位置亚克隆允许两个或多个基因通过单个表达载体的传送和表达。优选,自我加工裂解位点如FMDV2A序列或蛋白酶识别序列提供了独特的方式,从单个病毒载体表达和传送两个或多个蛋白,多肽或肽,其可以是例如抗体,杂二聚受体或杂二聚蛋白的单独部分。
FMDV 2A是多肽片段,其在FMDV基因组中起作用来指导在其自身C-端的单个裂解,因此以顺式起作用。通常报道FMDV 2A结构域约十九个氨基酸长(LLNFDLLKLAGDVESNPGP,SEQ ID NO:12;TLNFDLLKLAGDVESNPGP,SEQ ID NO:13;Ryan等,1991,J.Gen.Virol.72:2727-2732),然而,少如十四个氨基酸残基的寡肽(LLKLAGDVESNPGP,SEQ ID NO:14)已经显示出能以与其在天然FMDV多蛋白加工中的作用相似的方式介导2A C-端的裂解。
已经研究了2A序列的变化介导多蛋白有效加工的能力(Donnelly等,2001)。2A序列的同系物和变体包括在本发明的范围内并包括但不限于以下的序列:
QLLNFDLLKLAGDVESNPGP,SEQID NO:15;NFDLLKLAGDVESNPGPFF,SEQ ID NO:16;LLKLAGDVESNPGP,SEQID NO:17;NFDLLKLAGDVESNPGP,SEQ ID NO:18;APVKQTLNFDLLKLAGDVESNPGP,SFQ ID NO:19;
VTELLYRMKRAETYCPRPLLAIHPTEARHKQKIVAPVKQTLNFDLLKLAGDVESNPGP,SEQ ID NO:20;LLAIHPTEARHKQKIVAPVKQTLNFDLLKLAGDVESNPGP,SEQID NO:141;
和EARHKQKIVAPVKQTLNFDLLKLAGDVESNPGP,SEQ ID NO:142
2A序列及其变体可以用来制备表达自我加工多蛋白的载体,包括其包括通过自我加工裂解位点或其他蛋白酶裂解位点连接的蛋白或多肽的编码序列的任何载体(基于质粒或病毒的),使得在由于自我加工或其他裂解位点的存在引起的多蛋白裂解后,单个蛋白以合适的摩尔比和/或含量表达。这些蛋白对于载体自身,相互或对于自我加工裂解位点例如FMDV,可以是异种的,因此用于本发明实践中的自我加工裂解位点没有识别异种蛋白和源自相同来源的编码序列,因为自我加工裂解位点作用或介导裂解的能力。
在一个实施方案中,根据本发明的载体中能够包括的FMDV 2A序列编码包括LLNFDLLKLAGDVESNPGP(SEQ ID NO:12)的氨基酸残基。或者,根据本发明的载体可以编码其他2A样片段的氨基酸残基,如Donnelly等中所述的,2001,J.Gen.Virol.82:1027-1041,并包括但不限于,来自小核糖核酸病毒,昆虫病毒,C型轮状病毒,锥体虫重复序列或细菌海栖热袍菌(thermatoga maritima)的2A样结构域。
本发明包括编码2A或2A样肽序列的核酸序列变体的用途,如2A或2A样多肽的核酸编码序列,其相对于亲本核苷酸具有一个或多个氨基酸的不同密码子。本发明特意考虑并包括这样的变体。2A肽和多肽的序列变体也包括在本发明的范围内。相似地,以顺势或反式提供的蛋白酶可以通过多蛋白片段之间的同源蛋白酶识别(裂解)位点介导蛋白酶解加工。
在使用蛋白内含子-抗体表达构建体的实验中,我们已经证明了极端嗜热古菌Pol I蛋白内含子介导的蛋白剪接反应可以在哺乳动物(293E)细胞,ER和抗体(D2E7)重链和轻链氨基酸序列范围内发生。为了在单个开放阅读框(sORF)形式的抗体表达中使用这种类型的反应,我们证明了可以使用两个构建体,pTT3-HcintLC1aa-p.hori和pTT3-HcintLC3aa-p.hori,在哺乳动物(293E)细胞,ER和抗体重链和轻链氨基酸序列范围内发生这种反应。参见表11A和12A。
在PPT3载体主链上形成这些构建体。该载体具有EB病毒(EBV)复制起点,其允许游离基因在悬浮液中的转染293E细胞(表达EB病毒核抗原1的细胞)中扩增(Durocher,2002,“High level andhigh-throughput recombinant protein production by transient transfectionof suspension-growing human 293-EBNA1 cells”(通过悬浮生长的人293-EBNA1细胞的瞬时转染的高水平和高通量的重组蛋白生产),Nucleic Acids Research 30(2):E9)。每个载体具有一个ORF,在CMV启动子的调控控制下转录表达。在ORF中,将极端嗜热古菌Pol I蛋白内含子框内插入D2E7重链和轻链之间,重链和轻链各自具有信号肽(SP)。pTT3-HcintLC1aa-p.hori和pTT3-HcintLC3aa-p.hori构建体在蛋白内含子的任一侧具有1个天然蛋白外显子氨基酸或3个天然蛋白外显子氨基酸,将D2E7抗体重链和轻链序列与蛋白内含子序列隔开。通过瞬时转染将这些构建体引入293E细胞中。分析培养液和细胞沉淀样品。
在允许分离胞质和胞内膜部分的条件下裂解细胞沉淀样品。使用蛋白质印迹(WB)分析这些部分,使用抗重链或抗κ-轻链抗体。在这些印迹中,我们看到对应于分成三个部分形式的4个蛋白物质的表达,如构建体的ORF(130kDa),源自剪接情况(80kDa)的H和L的融合体,抗体重链(50kDa)和抗体轻链(25kDa)。通过抗重链和抗轻链抗体检测头2个蛋白物质,只通过抗重链抗体检测重链,和只通过抗轻链抗体检测轻链。在这些构建体中通过重链和轻链抗体检的80kDa蛋白物质的存在证明了已经发生了蛋白剪接情况。此外,所有四个蛋白物质主要存在于亚细胞膜部分中,其含有内质网(ER)。这表明重链信号肽(在ORF开始处编码的)已经将完整多肽引至ER中,其中已经发生了剪接反应。不希望受到任何特定理论的束缚,认为游离重链和轻链多肽很可能是N-端和C-端剪接连接处裂解的结果,由不完整的剪接引起。
细胞沉淀样品还用于总RNA提取和RNA印迹分析,使用抗体重链探针和抗体轻链探针。RNA印迹分析揭示了这些sORF构建体中的三联mRNA(3.4kb),其与重链探针和轻链探针杂交,但不是分开的重链或轻链的mRNA。相反,在使用常规方法表达D2E7抗体的细胞沉淀样品中,即,引入来自两个pTT3载体中携带的两个分开ORF的抗体重链和轻链,各自使用重链和轻链探针检测重链(1.4kb)和L链(0.7kb)的mRNA。在这些对照细胞沉淀中没有检测到三联mRNA。
上述数据证明了使用含有单个ORF(D2E7重链-P.horikoshi蛋白内含子-D2E7轻链)的构建体,转录了含有全部3个蛋白的单个mRNA。该分成三个部分的信使翻译成分成三个部分的多肽,并共翻译输入至ER中,通过三联多蛋白的N-端存在的重链信号肽指引。使用该构建体,蛋白内含子-介导的蛋白剪接反应在ER内发生。这表明蛋白内含子介导的反应可以用于表达抗体以及其他多亚基分泌的蛋白,即,需要经历分泌途径的那些蛋白质,以便得到折叠和正确的翻译后修饰。
还分析了培养液。蛋白质印迹和ELISA允许检测从pTT3-HcintLC1aa-p.hori构建体表达分泌的抗体。在下文中将更详细地讨论这些研究;通过点突变和编码轻链信号肽序列内的突变已经提高了分泌的抗体表达含量。
设计突变来抑制蛋白内含子介导的连接但防止在剪接连接的N-端或C-端的裂解反应,该突变导致提高水平的抗体分泌。
为了提高的抗体分泌效率的目标,设计并测试了三种类型的点突变。第一种类型的突变在C-端蛋白外显子第一个丝氨酸残基的密码子中;这些构建体具有Ser至Met(S>M)改变(构建体pTT3-HcintLC-p.hori,构建体E和构建体A)。第二种类型的突变是在蛋白内含子第一个丝氨酸残基的编码处;这样的构建体具有Ser至Thr(S>T)改变(构建体E)。第三种类型的突变是在蛋白内含子第二个至最后一个(倒数第二个)氨基酸的组氨酸残基的密码子中;这些构建体具有His至Ala(H>A)置换突变(构建体A和构建体B)。将这些突变单独或结合引入。根据文献中所述的反应机理,设计所有突变构建体来防止N-或C-端剪接连接处的裂解和降低释放的蛋白外显子的剪接,或两者。如下所列出的,使用各种这样的构建体获得D2E7抗体的分泌。
在一个实施方案中,通过瞬时转染将这些构建体引入293E细胞中,并在7天后,通过ELISA分析来分析培养的上清液的IgG抗体滴定度。构建体pTT3-HcintLC3aa-p.hori,pTT3-HcintLC1aa-p.hori,pTT3-HcintLC-p.hori,E,A和B的抗体滴定度各自为17.0+0.6,113.8+2.6,225.8+10.0,9.3+0.5,161.7+4.4和48.2+1.0ng/ml(平均+s.d.)。
还在变性条件下在SDS-PAGE凝胶上分析这些上清液样品,并用抗人IgG重链抗体和抗人κ轻链抗体点迹。在这些蛋白质印迹上,从构建体pTT3-HcintLC-p.hori和A产生的上清液中的抗体重链(~50kDa)和抗体轻链(~25kDa)清晰可见,与通过ELISA测量的IgG水平的等级次序相一致。
还使用蛋白质印迹分析表征了来自这些转染的细胞沉淀样品。在含有所有上述构建体的细胞沉淀中看到沿着抗体重链(~50kDa)和轻链(~25kDa)条带的三联多肽(~130kDa)。在这些构建体中,pTT3-HcintLC-p.hori和构建体A给出最强烈的重链和轻链条带;因此,可以推断胞内游离重链和轻链水平与装配并且分泌的抗体之间的相关性。剪接的产物(~80kDa),是抗体重链和轻链之间的融合体,存在于使用构建体pTT3-HcintLC3aa-p.hori产生的细胞沉淀中,并且在构建体pTT3-HcintLC1aa-p.hori产生的细胞沉淀中水平较低;在构建体pTT3-HcintLC-p.hori和构建体A,B和E中不存在。这表明蛋白剪接的水平与抗体分泌效率逆相关,与抗体重链和轻链的连接将导致错折叠的预期相一致,基于关于抗体结构的一般知识,并且由于错折叠蛋白降解的细胞机理,这种misfold将因此防止分泌。这些印迹上的另一种蛋白物质是蛋白内含子-轻链融合体(80kDa,由轻链抗体但不是重链抗体识别),这由任何其他裂解不存在下的N-端剪接连接处的裂解形成。该条带存在于在此所述的构建体A,B,E,pTT3-HcintLC3aa-p.hori,pTT3-HcintLClaa-p.hori中,并且在构建体pTT3-HcintLC-p.hori和H中几乎不存在。因此,该蛋白物质的存在还与抗体分泌的含量逆相关。最后,还在这些细胞裂解物中检测到蛋白内含子条带,使用抗缀合KLH的P.horikoshii肽产生的兔子多克隆抗血清。
我们证明了使用sORF构建体pTT3-HcintLC-p.hori分泌的D2E7抗体具有正确的重链和轻链N-端序列,和正确的重链和轻链分子量以及完整的分子量。
通过蛋白A亲和色谱纯化使用一种sORF构建体pTT3-HcintLC-p.hori分泌的D2E7抗体,并对重链和轻链的N-端序列进行分析。明确的结果表明重链的N-端肽序列是EVQLVESGGG(SEQID NO:21)和轻链的N-端序列是DIQMTQSPSS(SEQ ID NO:22)。因此,使用该构建体,信号肽DIQMTQSPSS使用的裂解位点与常规用于D2E7抗体表达的双ORF/双载体方法中使用的那些相同。
这些数据给下一代构建体的设计提供了重要的科学理解:哺乳动物ER肽酶将在新合成的多蛋白中识别并正确裂解信号肽,即使对其呈现存在一些明确的要求(参见下文)。
通过质谱分析该纯化的抗体,连同通过常规制造方法产生的D2E7。在变性条件下,从pTT3-HcintLC-p.hori构建体产生的D2E7轻链在质谱上产生一个单个的峰,并且其分子量(MW)为23408.8,而从标准制造方法产生的D2E7轻链的分子量(MW)为23409.7,接近一致。还是在变性条件下,从pTT3-HcintLC-p.hori构建体产生的D2E7重链在质谱上产生一个主要峰和2个次要峰,并且它们的分子量(MW)各自为50640.6,50768.2和50802.4,而从标准制造方法产生的D2E7重链分子量(MW)各自为50641.7,50768.6和50804.1,再次接近一致。3个峰对应于D2E7重链的标准形式。
还使用质谱测定了天然条件下从pTT3-HcintLC-p.hori构建体产生的该D2E7抗体的完整分子量(MW),连同从制造方法产生的D2E7抗体一起。从pTT3-HcintLC-p.hori构建体产生的D2E7抗体具有3个峰,各自具有148097.6,148246.9和148413.1的MW;从制造方法产生的D2E7抗体也具有3个峰,各自具有148096.0,148252.3和148412.8的MW。
这些数据清楚地证明了从pTT3-HcintLC-p.hori构建体产生的D2E7抗体的大小在变性和天然条件下都与常规制造方法产生的D2E7抗体的相同。与常规制造方法相比较生产具有完全可靠的氨基酸序列的能力是本发明抗体表达系统的优势之一。使用例如Fang等所述的2A系统,Nature Biotechnology,2005产生的抗体在其重链的C-端具有2个额外的非天然氨基酸,并且由于裂解的性质不可能将这避免。
我们还证明了使用pTT3-HcintLC-p.hori sORF构建体产生的D2E7抗体对于结合TNF具有与制造方法产生的D2E7抗体相同的亲和性。使用Biacore 3000仪器(Pharmacia LKB Biotchnology,Uppsala,Sweden)根据制造商的说明和标准方法测量穿过生物传感器芯片通过固定的山羊抗人IgG捕获的rhTNFa拮抗剂和可溶性rhTNFa之间的实时结合相互作用。简而言之,将rhTNFa等份试样稀释至HBS-EP(Biocore)缓冲液中,将150-μl等份试样以25ml/min的流速注射穿过固定的蛋白基质。同时将相等浓度的分析物注射在未处理的参照表面上来用作空白sensorgram,用于减去bulk折射率背景。在循环之间用两次5-分钟注射10mM甘氨酸,25ml/min再生传感器芯片表面。然后使用BIA评价4.0.1软件评价所得到的实验结合sensorgram来测定动力学速率参数。将每个拮抗剂的数据集适合1∶1Langmuir模型。对于这些研究,在通用适合分析实验方案下分析结合和解离数据,同时选择最大分析物结合能力(RU)或Rmax特征的局部适合。在这种情况中,软件计算出单个解离常数(kd),缔合常数(ka)和亲合常数(Kd)。平衡解离常数是Kd=kd/ka。使用1-100nM范围内不同的TNFα浓度测定动力学on-rate,动力学off rate和整体亲合性。从构建体pTT3-HcintLC-p.hori产生的D2E7抗体的动力学on-rate,动力学off rate和整体亲合性各自为1.61E+6(M-1s-1),5.69E-5(s-1)和3.54E-11(M);通过制造方法产生的D2E7抗体的动力学on-rate,动力学off rate和整体亲合性各自为1.73E+6(M-1s-1),6.72E-5(s-1)和3.89E-11(M)。Biacore分析表明使用该sORF构建体产生的D2E7抗体具有与常规制造方法产生的D2E7抗体相似的TNFα亲合性。
信号肽的修饰
我们已经证明了在sORF构建体设计中,重链-int-轻链,当通过定点突变降低轻链信号肽序列的疏水性时,抗体分泌水平提高约10倍。
我们设计了构建体H,其中在P.horikoshi蛋白内含子序列后,轻链信号肽序列从“MDMRVPAQLLGLLLLWFPGSRC”(SEQ ID NO:23)改变成“MDMRVPAQLLG DEWFPGSRC”(SEQ ID NO:24)。在如上所述相同类型的转染实验中,表达该构建体的细胞的上清液含有2047+116ng/ml抗体,如通过ELISA分析所测量的。该抗体分泌水平与使用2A技术所述的相似(1.6μg/ml)。该上清液的蛋白质印迹分析显示出对应于抗体重链和抗体轻链的强烈条带。
在对照实验中,使用常规方法将该相同轻链信号肽突变引入用于表达该抗体的载体中(从两个分开载体中的两个分开的开放阅读框框表达抗体重链和轻链)。在该构建体中,SEQ ID NO:23提供SEQ IDNO:24的改变如所预期地消除了抗体分泌,因为在常规构建体设计中,疏水性片段对于靶向ER上的信号识别颗粒(SRP)复合物并指引进入translocon中是重要的。这证实了在sOR构建体设计中,轻链信号肽的靶向功能是不必要的,即使可以通过ER信号肽酶识别并裂解,与完整ORF已经通过ORF开始处的重链信号肽进入ER中的假设相一致。
通过蛋白A亲合色谱纯化使用sORF构建体H分泌的D2E7抗体,并对其轻链的N-端序列进行分析。轻链的N-端肽序列是MDMRVPAQLL(SEQ ID NO:26)(没有不明确),这表示了未裂解的信号肽。即使文献中表明哺乳动物信号肽的H片段主要作用在于靶向(SRP)复合物并指引通过translocon的移位,我们的数据表明信号肽的疏水性(H)片段还在信号肽酶的识别和裂解中起作用。
我们已经证明了使用pTT3-HcintLC-p.hori构建体和构建体H分泌的D2E7抗体在基于细胞的测试中是生物活性的。纯化使用pTT3-HcintLC-p.hori构建体和构建体H产生的D2E7抗体并测试它们中和L929细胞中TNFα诱导的细胞毒性的能力。基本上按照US6090382中所述的进行该测试(参见在此的实施例4)。人重组TNFα引起鼠L929细胞中的细胞毒性并用于该测试中。和D2E7一样,抗-TNFα抗体可以中和这种细胞毒性,L929测试是可以用于评价特定D2E7抗体制剂的生物活性的基于细胞的测试之一。使用该测试分析时,从pTT3-HcintLC-p.hori构建体和构建体H产生的D2E7中和TNFα诱导的细胞毒性。它们的IC50值与标准制造方法产生的D2E7的相似。
我们已经研究了在轻链信号肽区域中使用不同设计的其它构建体。为了鉴定允许高抗体分泌效率的最佳sORF构建体设计,我们已经设计了几种另外的构建体,改变了C-端剪接位点周围的片段和之后的信号肽。蛋白内含子的最后一个N替代H构建体的“MDMRVPAQLLGDE WFPGSRC”(SEQ ID NO:24)后,构建体J决定为“MDMRVPAQWFPGSRC”(SEQ ID NO:25),将其进一步除去该信号肽内部的疏水性片段同时保留C-端片段以及信号肽酶裂解位点。构建体K指导直接在蛋白内含子最后一个N后的成熟轻链序列的表达。构建体L指导蛋白内含子的最后一个N替代“MDMRVPAQLLGLLLLWFPGSRC”(SEQ ID NO:23)后“MDMRVPAQLLGLLLLWFPGSGG”(SEQ ID NO:27)的表达,如在构建体pTT3-HcintLC-p.hori中,其通过信号肽酶改变了裂解位点之前的-1和-2氨基酸。
在一个实验中,通过瞬时转染将这些构建体引入293E细胞中,并在7天后,通过ELISA分析分析培养的上清液的IgG抗体滴定度。构建体H,J,K和L的抗体滴定度各自为2328.5+79.9,1289.7+129.6,139.3+4.7和625.0+20.6ng/ml(平均+s.d.)。
还通过蛋白质印迹分析分析了来自这些转染的细胞沉淀物样品。所有构建体具有之前所述的三联多肽条带(~130kDa),重链条带(~50kDa)和轻链条带(~25kDa),并且没有一个具有可检测的剪接的产物(80kDa并通过重链和轻链抗体来识别)。在这组构建体中,构建体K产生了最不同的蛋白质印迹(WB)模式,其中只产生了非常少量的胞内轻链,代替产生了对应于蛋白内含子-轻链融合体的蛋白物质,N-端间接连接处一种裂解情况的产物。该组中的其他构建体不存在这种蛋白物质。构建体K在两个方面不同于其他构建体:不具有通过信号肽酶裂解的裂解位点,和具有天冬氨酸,而不是甲硫氨酸或丝氨酸,作为C-端蛋白外显子的第一个氨基酸残基。这些特征中的任一个或两个可以防止蛋白内含子和抗体轻链之间区域的裂解,导致降低的蛋白质分泌。
通过蛋白质A亲合色谱纯化使用sORF构建体J和L分泌的D2E7抗体,并分析轻链的N-端序列。该分析表明通过构建体J产生的轻链的N-端肽序列是MDMRVPAQLL,这表示了未裂解的信号肽;而通过构建体L产生的轻链的N-端肽序列是DIQMTQSPSS,这表示了正确的信号肽裂解厚的成熟轻链。因此,构建体L表示了与构建体pTT3-HcintLC-p.hori相比较给予了提高的抗体分泌的设计(在不同的瞬时转染中为0.6-1μg/ml),同时其轻链具有正确的N-端序列。
我们探究了使用蛋白内含子和进一步提高抗体分泌水平的方法从sORF构建体表达装配抗体的机理。用大部分所述的sORF构建体转染的细胞的胞内样品含有对应于未处理和处理轻链的两个抗体轻链。用阳性对照构建体或pTT3-HcintLC-p.hori构建体转染的细胞中,只分泌加工的轻链,表明不可以装配和分泌连接野生型轻链信号肽的未加工轻链。相反,能够装配和分泌来自H和J构建体的未加工轻链;都具有突变的信号肽。如在未加工和加工形式之间的胞内轻链多肽分布中所看到的,轻链信号肽加工的程度根据构建体而改变。与构建体pTT3-HcintLC-p.hori相比较,构建体L具有提高量的加工轻链,并且这翻译成提高的抗体分泌。
基于以上的实验数据,从sORF构建体提高抗体分泌的一种方式是提高轻链信号肽的加工效率。通过系统地测试疏水性片段以及裂解位点周围区域中的突变和通过测试不同长度的信号肽来进行这。还可以通过在酵母中筛选可以以这种形式有效裂解的肽序列和通过在CHO细胞中进行相似的筛选来进行这。
可以用来提高sORF构建体的抗体分泌水平的另一种方法是测试不同的5’和3’未翻译片段(UTR)来提高三联mRNA的稳定性,因为这些mRNA比分开编码抗体重链和轻链的传统mRNA大。
提高sORF构建体抗体分泌水平的另一种方法是产生和选择CHO或NS0细胞系并使用DHFR或GS扩增来提高重组基因拷贝数量。通过将重组基因的定位从游离(瞬时)改变至基因组(稳定)独立地提高了抗体分泌水平。还通过提高拷贝数,和/或通过操纵5’和3’UTR,启动子和增强子序列来提高。将表达二氢叶酸还原酶(dhfr)的载体转染至dhfr-缺陷细胞系中。使用氨甲蝶呤(dhfr的一种竞争性抑制剂)选择较高载体拷贝数的细胞系(Kaufman,R.J.和Sharp,P.A.J Mol.Biol.(1982)159:601-621)。作为进一步的独立可替换方案,使用携带巨细胞病毒启动子增强子结合谷氨酰胺合成酶选择标记的表达载体来提高表达(Bebbington,C.R.(1991)Methods 2:138-145)。除了提高重组基因拷贝数,在该方法中还选择了特别适用于从sORF构建体设计加工的细胞世系。
使用修饰的含有插入片段的蛋白内含子
为了追踪已经与D2E7重链和轻链多肽分离的胞内蛋白内含子蛋白的目的,我们在构建体pTT3-HcintLC-p.hori和构建体H中制备了4个在氨基酸序列位置FRKVR!RGRG(!表示插入位点,-HT1)和EGKR!IPEF(-HT2)引入组氨酸标记物的构建体。假设P.horikoshi蛋白内含子是hedgehog的,可以容纳插入片段同时保持其3维结构,因此可以起作用。在一个实验中,293E细胞转染后培养4天后,通过ELISA分析分析培养上清液的IgG 滴定度。构建体pTT3-LcintHC-p.hori-HT1,pTT3-LcintHC-p.hori-HT2,构建体H-HT1,构建体H-HT2和构建体H的抗体滴定度各自为78.3+3.2,67.3+0.6,663.0+15.5,402.7+5.5,747.0+22.5ng/ml(平均+s.d.)。在2个位置含有插入片段的P.hotikoshii蛋白内含子的使用允许装配抗体的分泌。特别地,与使用没有任何插入片段的蛋白内含子相比较,在第一个位置含有内部插入标记物的蛋白内含子的使用给予相似的抗体水平。
以上的数据证明了本发明的sORF构建体设计包括使用修饰的含有内部标记物的蛋白内含子。各种标记物是本领域已知的。本发明的标记物包括但不限于荧光标记物和化学发光标记物。使用这些构建体,可以使用单个细胞中的荧光检测来监控表达的多蛋白含量。此外,可以根据蛋白表达的水平使用FACS分选这些细胞。这样标记物的使用在稳定细胞系产生中特别有用,因为这允许通过FACS分析选择高产细胞或细胞系。如本发明中所教导的,已经在与侧翼抗体重链和轻链自体裂解后的细胞裂解物中观察到了全长蛋白内含子。这提供了检测荧光标记的蛋白内含子及其用于稳定细胞系产生中的基础。标记物还可以用于蛋白质的纯化中。
从以上呈现的数据看,我们已经知道可以在293E细胞,ER和抗体(如通过D2E7特意举例说明的)重链和轻链的范围中发生P.horikoshii Pol I蛋白内含子介导的蛋白剪接反应。点突变如C-端蛋白外显子的第一个氨基酸的S>M和蛋白内含子的倒数第二个氨基酸的H>A提高了分泌抗体的水平。降低轻链信号肽H片段的疏水性,如在构建体H和J中,产生更高的抗体分泌水平。缺少轻链信号肽的构建体中的抗体分泌水平相对低,这似乎是由于C-端剪接连接处不太有效的裂解引起的。使用两种方法来提高该裂解的效率。第一种在+1位置使用不是天冬氨酸的氨基酸。在此所述的另外几种构建体在+1位置使用甲硫氨酸并在C-端剪接连接处获得有效的裂解。第二种提高该裂解效率的方法是使用连接物改变C-端裂解位点和轻链球状结构之间的剪接,任选接着不同类型的裂解位点,如本说明书中所述的那些。
尽管已经描述和测试了包括极端嗜热古菌蛋白内含子和D2E7抗体的不同构建体,在本发明的sORF设计中可以使用其他蛋白内含子和蛋白内含子样蛋白(包括hedgehog和相关家族),例如,在抗体重链和轻链之间引入。还将其他多亚基蛋白(包括双亚基蛋白和具有多个两个亚基的蛋白)替代了抗体的重链和轻链蛋白。
除了以上所述的极端嗜热古菌PolI蛋白内含子构建体,我们使用Sce.VMA和Ssp.dnaE迷你蛋白内含子设计了类似的构建体:pTT3-Hc-VMAint-LC-0aa,pTT3-Hc-VMAint-LC-1aa,pTT3-Hc-VMAint-LC-3aa,pTT3-Hc-Ssp-GA-int-LC-0aa,pTT3-Hc-Ssp-GA-int-LC-1aa和pTT3-Hc-Ssp-GA-int-LC-3aa。将这些构建体转染至293E细胞中,并分析上清液和细胞沉淀样品。
在一个实验中,293E细胞转染后培养7天后,通过ELISA分析来分析培养上清液的IgG抗体滴定度。pTT3-Hc-VMAint-LC-0aa,pTT3-Hc-VMAint-LCá
,pTT3-Hc-VMAint-LC-3aa,pTT3-Hc-Ssp-GA-int-LC-0aa,pTT3-Hc-Ssp-GA-int-LC-1aa和pTT3-Hc-Ssp-GA-int-LC-3aa的抗体滴定度各自为9.0±3.5,12.0±0.0,39.7±1.2,90.0±2.0,38.7±1.5和32±2.6ng/ml(平均±s.d.)。
还通过蛋白质印迹分析分析了来自这些转染的细胞沉淀样品。在所有这些样品中观察到三联多肽。此外,在构建体pTT3-Hc-VMAint-LC-0aa,pTT3-Hc-Ssp-GA-int-LC-0aa,pTT3-Hc-Ssp-GA-int-LC-1aa和pTT3-Hc-Ssp-GA-int-LC-3aa中观察到重链多肽;和在pTT3-Hc-Ssp-GA-int-LC-0aa,pTT3-Hc-Ssp-GA-int-LC-1aa和pTT3-Hc-Ssp-GA-int-LC-3aa中观察到轻链多肽。
这些实验的结果表明蛋白内含子,作为一类蛋白质,可以成功地用于sORF蛋白表达策略中,如我们所述的。此外,细菌蛋白内含子-样(BIL)结构域和hedgehog(Hog)自我加工结构域,蛋白内含子以外的Hog/蛋白内含子(HINT)超家族的其他2个成员,适用于在此所述那些的相似构建体设计中。
此外,因为存在于包括极端嗜热古菌PolI蛋白内含子和Sce.VMA蛋白内含子的许多蛋白内含子中的核酸内切酶片段在本发明的基因表达策略中是没有用的,可以删除核酸内切酶结构域并用小的连接物替代来形成“迷你-蛋白内含子”。
这些的迷你蛋白内含子还用于所的构建体设计中,它们呈现出蛋白内含子编码片段显著更小的优势,因此允许较大的编码多肽的序列和/或更易于操作重组DNA分子。
与使用自我加工肽如2A或2A样-序列或蛋白酶识别相关的一个关注问题是一个或多个多肽链的C或N端含有源自自我加工肽的氨基酸,即2A产生的氨基酸残基,或蛋白酶识别序列,取决于初级翻译产物内裂解的位置和特定链的相对位置。这些氨基酸残基对宿主是“外来”的并当体内表达或传送时可以引发免疫应答(即,在基因治疗范围内,从病毒或非病毒载体表达,或作为体外产生的重组蛋白来给予)。此外,如果没有除去,2A产生的或蛋白酶位点产生的氨基酸残基可能影响生产细胞中的蛋白质分泌和/或改变蛋白质构象,导致低于最佳表达水平和/或降低的重组蛋白生物活性。
将基因表达载体工程化,使得在多肽编码序列和自我加工裂解位点(即,2A序列)或其他蛋白酶裂解位点之间提供另外的蛋白酶解裂解位点,作为裂解后除去自我加工裂解位点产生的氨基酸残基的一种方法,该基因表达载体可以用于本发明的实践中。
其他的蛋白酶解裂解位点的实例是具有一致序列RXK(R)R(SEQID NO:1)的弗林蛋白酶裂解位点,其可以通过内源subtilisin-样蛋白酶裂解,如蛋白质分泌途径内的弗林蛋白酶和其他丝氨酸蛋白酶。US专利公开2005/0042721表明了通过在第一个多肽和2A序列之间引入弗林蛋白酶裂解位点RAKR可以有效地除去第一个蛋白质N端的2A残基。此外,表明使用含有2A序列和邻接2A裂解位点的质粒导致比单独含有2A序列的质粒更高水平的蛋白表达。这种提高提供了进一步的优势,因为从蛋白质的N-端除去2A残基时,可以使用更长的2A或2A样序列或其他自我加工序列。这样的自我加工序列如2A-或2A样序列有助于两个或多个多肽通过单个启动子更好的等摩尔表达。多蛋白中免疫球蛋白轻链编码序列存在两次和重链编码序列只存在一次时,获得免疫球蛋白表达进一步的提高。
使用具有全部人类特征的抗体或其类似物是有利的。这些试剂避免了由源自非人物种的抗体或类似物诱导的不利免疫应答。为了解决对源自自我加工肽的氨基酸残基的可能宿主免疫应答,可以在第一个蛋白质的编码序列和自我加工肽之间插入蛋白酶解裂解位点的编码序列(使用本领域已知的标准方法),以便从表达的多肽即抗体除去自我加工肽序列。这发现在用于体内的治疗或诊断抗体中特别有用。
本领域已知的可以使用重组DNA技术表达的任何其他蛋白酶解裂解位点可以用于实践本发明。可以插入多肽或蛋白编码序列和自我加工裂解序列(如2A序列)的实例其他蛋白酶解裂解位点包括,但不限于弗林蛋白酶裂解位点。RXK(R)R(SEQ ID NO:1);因子Xa裂解位点,IE(D)GR(SEQ ID NO:6);信号肽酶I裂解位点,例如,LAGFATVAQA(SEQ ID NO:28);和凝血酶裂解位点,LVPRGS(SEQID NO:7)。
作为从单个开放阅读框表达多于一种成熟蛋白的IRES,弗林蛋白酶,2A和蛋白内含子方法的可替换方案,本发明还提供了使用置于多肽内第一个和第二个蛋白部分之间的hedgehog蛋白结构域的蛋白加工。我们设计了用于表达抗体重链和轻链的单个开放阅读框,使用hedgehog自体加工结构域来隔开抗体重链和轻链基因。在携带这样的ORF的细胞中,转录由至少一个抗体重链,一个抗体轻链和一个hedgehog自体加工结构域构成的单个mRNA,并用来产生相应的多肽。在翻译后,hedgehog自体加工结构域介导抗体重链和轻链的分离。
蛋白质的hedgehog家族含有保守的信号分子,作为不同发育系统中的成形物质,并设计各种人类疾病(Kalderon,D.2005,Biochem SocTrans.Dec;33(Pt6):1509-12)。Hedgehog蛋白具有2个结构域,在细胞信号中起作用的N-端结构域(Hh-N)和催化翻译后自我加工事件的C-端结构域(Hh-C),该自我加工裂解事件在这两个结构域之间分开,将胆固醇部分加入N-端结构域的C-端,因此激活信号分子(Traci等,1997,Cell,91,85-97)。
这样的sORF抗体表达技术给予的优势包括操纵重链和轻链的基因用量比例,用于ER中多亚基装配的重链和轻链多肽的接近性和高效蛋白分泌的潜能。
Hh-C蛋白结构域可以用来催化ER中的自我加工反应,导致以下所述单个开放构建体设计中抗体重链多肽和Hh-C多肽之间的翻译后裂解。
蛋白质的hedgehog家族具有N-端信号结构域和C-端自我加工结构域。它们的C-端自我加工结构域将它们自身与N-端结构域裂解,并通过2-步骤反应机理将胆固醇部分添加至它们的C-端(Porter等,1996,Science,274(5285):255-9)。除了胆固醇,其他亲核试剂如DTT或谷胱甘肽也刺激自我加工(Lee等,1994,Science,266,1528-1537)。和通过C-端自体加工结构域催化的裂解反应相同,hedgehog蛋白的N-端信号结构域由抗体重链或轻链多肽替代时,发生相似的裂解反应。该反应可以用来分离单个开放阅读框编码的多蛋白内含有的抗体重链和轻链。
首先在瞬时表达系统中测试抗体表达并为了该目的,在pTT3载体主链上形成构建体。该载体具有EBV复制起点,其允许游离基因在悬浮培养物中的转染293E细胞中(表达EB病毒核抗原1的细胞)扩增(Durocher等,2002)。每个载体具有单个开放阅读框,由CMV启动子驱动。在一个构建体设计中,pTT3-HC-Hh-C25-LC,将来自黑腹果蝇sonic hedgehog蛋白质的完整C-端结构域框内插入D2E7重链和轻链之间,其中每个具有信号肽(SP)。通过瞬时转染将这些构建体引入293E细胞中。分析了培养的上清液和细胞沉淀样品。
在允许cytosolic和胞内膜部分分离的条件下将细胞沉淀样品裂解。使用免疫印迹技术分析了这两个部分,使用抗重链或抗κ-轻链抗体。在这些印迹上,观察到的蛋白物质包括多蛋白(HC-Hh-C25-LC),Hh-C25-LC,和分开的重链(HC)和轻链(LC)。后3种蛋白物质的存在证实已经发生了自我加工反应。从Hh-C蛋白结构域催化的裂解产生游离的重链;游离轻链多肽是信号肽酶裂解的结果。含有内质网(ER)的亚细胞膜部分中蛋白物质的分离表明我们ORF开始处的重链信号肽已经指导完整ORF进入ER中,其中发生裂解反应。
还将这些细胞沉淀样品接受总RNA提取和Northern印迹分析,使用抗体重链特异性探针和抗体轻链特异性探针。与重链探针和轻链探针都杂交的三联mRNA的这些northern印迹观察证实了构建体设计的sORF性质。相反,在使用常规方法表达D2E7抗体的细胞沉淀样品中,即,引入两个pTT3载体中携带的两个分开ORF的抗体重链和轻链,各自使用重链或轻链探针检测重链(1.4kb)和L链(0.7kb)的mRNA。
这些实验证明使用含有单个ORF(D2E7重链-Hh-C25-D2E7轻链)构建体,转录了含有全部3个蛋白质的单个mRNA。该三联信息翻译成三联多肽,并共翻译地输入ER中,通过ORF开始处存在的重链信号肽指引。这表明Hh-C蛋白结构域用于抗体以及其他多亚基分泌的蛋白质和/或需要经历分泌途径以便折叠和正确翻译后修饰的蛋白质的表达。
对于分泌的抗体,除了细胞沉淀物,还使用蛋白质印迹和ELISA分析了培养的上清液,如在此所述的。可以测试使用删除的hh-C25的构建体来比较多蛋白加工和抗体分泌水平的效率。
已经表明从Hh-C25蛋白质结构域删除C-端63个氨基酸产生了一个蛋白结构域,Hh-C17,其可以催化蛋白加工但不催化胆固醇添加。Hh-C17很好地表达为重组蛋白,并且已经测定了它的晶体结构(Traci等,1997,上文)。因此,在另一个构建体设计中,pTT3-HC-C17-LC,将该截断的蛋白结构域插入D2E7抗体重链和轻链之间。
在hedgehog蛋白质和蛋白内含子的同源性比对中,我们已经在相似的构建体重测试了,如在此详述的,最后8个氨基酸延伸超出最后预测的β-折叠二级结构,它们对自体加工的效率可能有帮助或没帮助。因此,还测试了其他的构建体,pTT3-HC-C17sc-LC。
通过瞬时转染将这些构建体引入293E细胞中,并在7天后,通过ELISA测试分析培养的上清液的IgG抗体滴定度。pTT3-HC-C25-LC,pTT3-HC-C17-LC,pTT3-HC-C17sc-LC和pTT3-HC-C17hn-LC各自为0.038,0.042,0.040和0.046ug/ml。
还在SDS-PAGE凝胶(变性条件)上分析这些上清液样品,并用人IgG重链特异性抗体和人κ轻链特异性抗体点迹。在这些蛋白质印迹上,可以观察到抗体重链(~50kDa)和抗体轻链(~25kDa)蛋白,并且与通过ELISA测量的IgG水平相一致。
还通过蛋白质印迹分析分析了来自这些转染的细胞沉淀样品。可以比较不同构建体重所述四种蛋白物质的存在和相对密度来测定每个构建体设计提供的蛋白加工效率。
在另一类自我加工蛋白中,蛋白内含子,最后两个氨基酸倾向于为HisAsn。在通过蛋白内含子催化的蛋白质剪接过程中,Asn经受环化,His辅助,其导致蛋白内含子及其C-端侧翼多肽之间肽键的裂解。与蛋白内含子相反,hedgehog自我加工蛋白本质上不具有C-端侧翼多肽,并且它们在多肽的该位置不具有保守的Asn。在一个构建体设计中,pTT3-HC-C17hn-LC,我们已经在该位置引入了His-Asn,替代Ser-Cys。不希望受到理论的束缚,在该位置的工程化裂解位点使该特定构建体设计中的hedgehog自体加工蛋白和抗体轻链之间的分离更有效。如上所述的测试抗体分泌的效率。
表征了通过含有hedgehog自体加工蛋白的sORF构建体产生的抗体。通过蛋白质A亲合色谱纯化使用以上sORF构建体分泌的D2E7抗体,并分析其重链和轻链的N-端序列。按照之前所述的在变性条件下通过质谱分析这些纯化的抗体,和从标准制造方法产生的D2E7。在天然条件下使用质谱测定从这些构建体产生的D2E7抗体和从制造方法产生的D2E7抗体的完整分子量(MW)。
按照之前所述的使用Biacore分析D2E7抗体和人TNFα之间的结合。通过使用1-100nM范围内的不同TNFα浓度测定动力学on-rate,动力学off-rate和整体亲合性。
本发明包括多种载体中任一种的用途,用于将包括两个或多个多肽或蛋白质的编码序列和自我加工裂解序列引入细胞中。基因表达载体的各种实例是本领域已知的并可以是病毒或非病毒来源的。本发明实践中可以使用的非病毒基因传送方法包括但不限于质粒,脂质体,核酸/脂质体复合物,阳离子脂质等。
病毒载体
病毒和其他载体可以有效地转导细胞并将它们自己的DNA引入宿主细胞中。在产生重组病毒载体中,用编码目标蛋白或多肽的可表达序列替代非必需基因。示例载体包括但不限于病毒和非病毒载体,如逆转录病毒载体(包括慢病毒载体),腺病毒(Ad)载体,包括可复制型,复制缺陷型及其gutless形式,腺相关病毒(AAV)载体,猿病毒40(SV-40),牛乳头状瘤病毒,EB载体,疱疹载体,牛痘载体,莫洛尼氏鼠白血病载体,哈维鼠肉瘤病毒载体,鼠乳腺肿瘤病毒载体,劳氏肉瘤病毒载体和非病毒质粒。杆状病毒载体是公知的并适用于在昆虫细胞中的表达。许多适用于在哺乳动物或其他真核细胞中表达的载体是本领域公知的,并且许多是可购得的。商业来源包括,但不限于,Stratagene,La Jolla,CA;Invitrogen,Carlsbad,CA;Progema,Madison,WI和Sigma-Aldrich,St.Louis,MO。许多载体序列可通过GenBank获得,涉及载体的其他信息可通过Riken BioSource Center在互联网上获得。
载体通常包括复制起点,并且载体可以另外包括或不包括“标记”或“选择标记”功能,通过这可以鉴定和选择载体。尽管可以使用任何选择标记,用于重组载体中的选择标记通常是本领域已知的,并且正确选择标记的选择将取决于宿主细胞。编码给予抗生素或其他毒素抗性的蛋白质的选择标记基因的实例包括但不限于氨苄青霉素,氨甲喋呤,四环素,新霉素(Southern等,1982,J Mol Appl Genet.1:327-41),霉酚酸(Mulligan等,1980,Science 209:1422-7),嘌呤霉素,zeomycin,潮霉素(Sugden等,1985,Mol Cell Biol.5:410-3),二氢叶酸还原酶,谷氨酰胺合成酶和G418。如本领域技术人员所知道的,表达载体通常包括复制起点,可操纵地连接待表达的编码序列的启动子,以及核糖体结合位点,RNA剪接位点,多腺苷酸化位点和转录终止子序列,如果合适,待表达的编码序列。
参照载体或其他DNA序列,“重组”只表示通常不作为分离的或天然发现的形式可操纵地连接的DNA序列的可操纵地连接。表达和/或控制序列调控转录时,将调控(表达和/或控制)序列可操纵地连接核酸编码序列,并且如果合适,调控核酸序列的翻译。因此,表达和/或控制序列可以包括启动子,增强子,转录终止子,编码序列的起始密码子(即,ATG)5’,内含子的剪接信号和终止密码子。
已知腺病毒基因治疗载体在体内呈现出强烈的瞬时表达,卓越的滴定度和转导裂解和非裂解细胞的能力(Hitt等,2000,Adv in Virus Res55:479-505)。本发明的重组Ad载体包括能够将载体引入复制缺陷型Ad病毒粒子中的包装位点;两个或多个目标多肽或蛋白质的编码序列,例如,目标免疫球蛋白的重链和轻链;和编码单独的自我加工裂解位点或结合另外的蛋白酶解裂解位点的序列。引入感染性病毒粒子需要的或有帮助的其他序列包括5’和3’Ad ITR,E2基因,E4基因的一部分和任选的E3基因。
通过本领域已知的标准技术使用Ad包装细胞和包装技术来制备复制缺陷型Ad病毒粒子封装重组Ad载体。例如,可以在US专利No.5,872,005中找到这些方法的实例。通常将两个或多个目标多肽或蛋白质的编码序列插入腺病毒中,在病毒基因组删除的E3片段中。用于实践本发明的优选腺病毒载体不表达一个或多个野生型Ad基因产物,例如,E1a,E1b,E2,E3和E4。优选的实施方案是通常与补充E1,E2A,E4功能和任选E3基因片段的包装细胞系一起使用的病毒粒子。参见,例如,US专利No.5,872,005,5,994,106,6,113,028和6,127,175。
因此,如在此所用的,“腺病毒”和“腺病毒颗粒”指的是病毒自身或其衍生物,并涵盖所有血清型和亚型,以及天然产生的和重组形式,除了其中另外指出的情况。这样的腺病毒可以是野生型或可以是以本领域已知的或如在此所述的各种方式修饰的。这样的修饰包括包装于颗粒中的腺病毒基因组的修饰,以便制得感染性的病毒。这样的修饰包括本领域已知的删除,如E1a,E1b,E2a,E2b,E3或E4编码片段中一个或多个的删除。示例包装和生产细胞源自293,A549或Hela细胞。使用本领域已知的标准技术纯化和配制腺病毒载体。
腺相关病毒(AAV)是辅助病毒依赖性人细小病毒,其能够通过染色体整合潜在地感染细胞。由于其染色体整合的能力及其非致病的性质,AAV具有作为人基因治疗载体的显著潜能。为了用于实践本发明,可以使用本领域技术人员已知的标准技术产生rAAV病毒粒子,并构建使得它们包括作为朝转录方向的可操纵地连接成分的控制序列,包括转录启动和终止序列,以及目标编码序列。更具体地,本发明的重组AAV载体包括能够使载体引入复制缺陷型AAV病毒粒子中的包装位点;两个或多个目标多肽或蛋白质的编码序列,例如,目标免疫球蛋白的重链和轻链;编码单独的自我加工裂解位点或结合一个或两个其他的蛋白酶解位点的序列。构建用于实践本发明的AAV载体,使得它们包括作为朝转录方向的可操纵地连接成分的控制序列,包括转录启动和终止序列。这些成分在5’和3’端两侧由功能性AAV ITR序列连接。“功能型AAV ITR序列”意思是用于AAV病毒离子的拯救,复制和包装的ITR序列。
重组AAV载体的特征还在于它们能够指导目标细胞中选定的重组多肽或蛋白质产物的表达和生产。因此,重组载体包括至少全部壳体化必需的AAV序列和重组AAV(rAAV)病毒离子感染的物理结构。因此,用于表达载体中的AAV ITR不需要具有野生型的核苷酸序列(例如,如Kotin,1994,Hum.Gene Ther.5:793-801中所述的),并可以通过核苷酸的插入,删除或置换来改变,或AAV ITR可以源自几种AAV血清型中的任何一种。通常,AAV载体可以是源自本领域已知的腺相关病毒血清型中的任何一种载体。
通常,将AAV表达载体引入生产细胞中,接着引入AAV辅助构建体,其中辅助构建体包括能够在生产细胞中表达的AAV编码片段,并且其补充AAV载体中不存在的AAV辅助功能。设计辅助构建体来下调大的Rep蛋白(Rep78和Rep68)的表达,通常通过将p5后的起始密码子从ATG突变至ACG,如US专利No.6,548,286中所述的。接着,将辅助病毒和/或其他载体引入生产细胞中,其中辅助病毒和/或其他的载体提供了能够支持有效rAAV病毒生产的辅助功能。然后培养生产细胞来生产rAAV。使用标准方法进行这些步骤。通过本领域已知的标准技术使用AAV包装细胞和包装技术来制备本发明的辅助缺陷型AAV病毒粒子封装重组AAV载体。在US专利No.5,436,146;5,753,500,6,040,183,6,093,570和6,548,286中可以找到这些方法的实例,在此以其整体引入作为参考。用于包装的更多组合物和方法描述于Wang等中(US专利公开2002/0168342),在此也以其整体引入作为参考,并包括那些本领域技术人员知识范围内的那些技术。
在实践本发明中,用于生产rAAV或其他载体表达载体病毒粒子的宿主细胞包括哺乳动物细胞,昆虫细胞,微生物和酵母。宿主细胞还可以是包装细胞,其中在宿主细胞或生产细胞中稳定维持AAV(或其他)rep和cap基因,其中稳定维持和包装AAV载体基因组。示例包装和生产细胞源自293,A549或Hela细胞。使用本领域已知的标准技术纯化和配制AAV载体。其他合适的宿主细胞(取决于载体)包括中国仓鼠卵巢(CHO)细胞,CHO二氢叶酸还原酶缺陷型变体如CHO DXB11或CHO DG44细胞(参见,例如,Urlaub和Chasin,1980,Proc.Natl.Acad.Sci.77:4216-4220),PerC.6细胞(Jones等,2003,Biotechnol.Prog.19:163-168)或Sp/20鼠骨髓瘤细胞(Coney等,1994,Cancer Res.54:2448-2455)。
逆转录病毒载体
逆转录病毒载体也是用于基因传送的常用工具(Miller,1992,Nature 357:455-460)。逆转录病毒载体,更特别地慢病毒载体,可以用于实践本发明。因此,如在此所用的术语“逆转录病毒”或“逆转录病毒载体”各自意味着包括“慢病毒”和“慢病毒载体”。已经测试并发现逆转录病毒载体是合适的传送载体,将目标基因稳定引入多种目标细胞的基因组中。逆转录载体传送未重排的单拷贝转基因进入细胞的能力使得逆转录病毒载体非常适于将基因转染至细胞中。此外,逆转录病毒通过逆转录病毒包膜糖蛋白与宿主细胞上特定细胞表面受体的结合来进入宿主细胞。因此,还发现假型逆转录病毒载体在实践本发明中的用途,在该载体中编码的天然包膜蛋白由具有不同于天然包膜蛋白的细胞特异性(例如,与天然包膜蛋白相比较,结合不同的细胞表面受体)的异种包膜蛋白替代。指导编码一个或多个目标蛋白编码序列的逆转录病毒载体传送至特定靶细胞中的能力是本发明实践中所需的。
本发明提供了逆转录病毒载体,其包括,例如,包括一个或多个转基因序列的逆转录转移载体和包括一个或多个包装序列的逆转录包装载体。特别地,本发明提供了编码异种或功能上修饰的包膜蛋白的假型逆转录病毒载体,用于生产假型逆转录病毒。
本发明的逆转录病毒载体的核心序列可以容易地源自各种逆转录病毒,包括例如,B,C和D型逆转录病毒以及泡沫病毒和慢病毒(参见RNA Tumor Viruses(RNA肿瘤病毒),第二版,Cold Spring HarborLaboratory,1985)。适用于本发明的组合物和方法中的逆转录病毒的实例包括,但不限于,慢病毒。适用于本发明的组合物和方法中的其他逆转录病毒包括,但不限于,禽白血病病毒,牛白血病病毒,鼠白血病病毒,Mink-Cell Focus-诱导病毒,鼠肉瘤病毒,网状内皮组织增生病病毒和劳氏肉瘤病毒。特别优选的鼠白血病病毒包括4070A和1504A(Hartley和Rowe,1976,J.Virol.19:19-25),Abelson(ATCCNo.VR-999),Friend(ATCC No.VR-245),Graffi,Gross(ATCCNo.VR-590),Kirsteni Harvey肉瘤病毒和Rauscher(ATCC No.VR-998)和莫洛尼氏鼠白血病病毒(ATCC No.VR-190)。这样的逆转录病毒可以从保藏或收集中心容易地获得,如美国典型培养物保藏中心(ATCC;Manassas,VA),或使用常用的技术从已知来源分离。其他是可购得的。
本发明的逆转录病毒载体序列可以源自慢病毒。优选的慢病毒是人免疫缺陷型病毒,例如,1或2型(即,HIV-1或HIV-2,其中HIV-1之前称为淋巴结病相关病毒3(HTLV-III)和获取性免疫缺陷综合症(AIDS)相关病毒(ARV)),或另一种与HIV-1或HIV-2相关的病毒,已经鉴定并与AIDS或AIDS样疾病相关。其他慢病毒包括,绵羊Visna/maedi病毒,猫免疫缺陷型病毒(FIV),牛慢病毒,猿免疫缺陷型病毒(SIV),马传染性贫血病毒(EIAV)和公山羊关节炎-脑炎病毒(CAEV)。
逆转录病毒的合适属和株是本领域公知的(参见,例如,FieldsVirology,第三版,B.N.Fields等编辑,1996,Lippincott-Raven Publishers,参见,例如,第58章,Retroviridae:The Viruses and Their Replication,Classification(逆转录病毒科:病毒及其复制,分类),p1768-1771,包括表1,在此引入作为参考)。用于产生生产细胞和生产细胞系的逆转录病毒包装系统,和制备该包装细胞系统的方法也是本领域已知的,其中该生产细胞和生产细胞系产生逆转录病毒。
典型的包装系统包括至少两个包装载体:包括第一个核苷酸序列的第一个包装载体,该序列包括gag,pol或gag和pol基因;和包括第二个核苷酸序列的第二个包装载体,该序列包括异种或功能上修饰的包膜基因。逆转录病毒序列可以源自慢病毒,如HIV。载体可以缺乏功能性tat基因和/或功能性辅助基因(vlf,vpr,vpu,vpx,nef)。系统可以进一步包括第三个包装载体,具有包括rev基因的核苷酸序列。可以以含有第一个,第二个和任选第三个核苷酸序列的包装细胞形式来提供包装系统。
本发明适用于各种表达系统,尤其是使用真核细胞的那些,有利地哺乳动物细胞。在天然蛋白糖基化的情况中,优选表达系统是给表达的蛋白质提供天然样糖基化的一种表达系统。
慢病毒共享几个结构病毒粒子蛋白,包括包膜糖蛋白SU(gp120)和TM(gp41),其由env基因编码;CA(p24),MA(p17)和NC(p7-11),其由gag基因编码;和RT,PR和IN,由pol基因编码。HIV-1和HIV-2含有涉及合成调控和加工病毒RNA以及其他复制功能的辅助和其他蛋白质。可以从重组系统省略(或灭活)由vif,vpr,vpu/vpx和nef基因编码的辅助蛋白。此外,可以将tat和rev省略或灭活,例如,通过突变或删除。
第一代慢病毒载体包装系统提供了用于gag/pol和env的分开的包装构建体,并出于安全原因,通常使用异种或功能上修饰的包膜蛋白。在第二代慢病毒载体系统中,删除或灭活辅助基因,vif,vpr,vpu和nef。第三代慢病毒载体系统是从其删除或另外灭活(例如,通过突变)了tat基因的那些。
通过使用强组成型启动子如人巨细胞病毒立即早期(HCCAV-IE)增强子/启动子来提供通常由tat提供的转录调控的补偿。可以基于组成型启动子活性,目标组织的特异性(例如,肝脏-特异性启动子)或其他与所需表达控制相关的因素来选择其他启动子/增强子,如本领域所知的。例如,在一些实施方案中,理想的是使用诱导型启动子,如tet,来获得受控表达。可以在分开的表达构建体上提供编码rev的基因,使得典型的第三代慢病毒载体系统将包括四个质粒:其中各自用于gagpol,rev,包膜和转移载体。与所用的包装系统的世代无关,可以在单个构建体或分开的构建体上提供gag和pol。
通常,将包装载体包括于包装细胞中,并通过转染,转导或感染引入细胞中。用于转染,转导或感染的方法上本领域技术人员已知的。可以通过转染,转导或感染将本发明的逆转录病毒转移载体引入包装细胞系中,来产生生产细胞或细胞系。可以通过包括例如磷酸钙转染,脂转染或电穿孔的标准方法将本发明的包装载体引入人细胞或细胞系中。在一些实施方案中,将包装载体和诸如neo,二氢叶酸还原酶(DHFR),谷氨酰胺合成酶或ADA的显性选择标记一起引入细胞中,接着在合适药物的存在下选择并分离克隆。可以将选择标记基因在物理上连接由包装载体编码的基因。
其中设置包装功能使其通过合适包装细胞得到表达的稳定细胞系是已知的。例如,参见US专利No.5,686,279;和Ory等,1996,Proc.Natl.Acad.Sci.93:11400-11406,其描述了包装细胞。稳定细胞系产生的更多描述可以在Dull等,1988,J.Virol.72(11):8463-8471;和Zufferey等,1998,J.Virol.72:9873-9880中找到。
Zufferey等,1997,Nat.Biotechnol.15:871-75,教导了一种慢病毒包装质粒,其中删除了包括HIV-l包膜基因的pol的序列3’。构建体含有tet和rev序列并用polyA序列替代3’LTR。由另一个启动子,如诱导型的,替代5’LTR和psi序列。例如,可以使用CMV启动子及其衍生物。
包装载体可以含有包装功能的其他改变,来提高慢病毒蛋白表达和提高安全性。例如,可以除去所有gag的HIV序列上游。此外,可以除去包膜的序列下游。此外,可以进行修饰载体的步骤来提高RNA的剪接和翻译。
任选地,使用条件型包装系统,如Dull等,1998,上文中所述的。还优选使用自我灭活载体(SIN),其通过删除HIV-1长末端重复序列(LTR)提高了载体的生物安全性,如所述的,例如,Zufferey等,1998,J.Virol.72:9873-9880。也可以使用诱导型载体,如通过四环素诱导的LTR。
启动子
本发明的载体通常包括异种控制序列,其包括,但不限于,组成型启动子,如巨细胞病毒(CMV)立即早期启动子,RSV LTR,MOMLVLTR和PGK启动子;组织或细胞类型特异性启动子,包括mTTR,TK,HBV,hAAT,调控型或诱导型启动子,增强子等。
有用的启动子包括LSP启动子(III等,1997,Blood Coagul.Fibrinolysis 8S2:23-30),EF1-α启动子(Kim等,1990,Gene 91(2):217-23)和Guo等,1996,Gene Ther.3(9):802-10)。最优选的启动子包括延伸因子1-α(EF1α)启动子,磷酸甘油酸盐激酶-1(PGK)启动子,巨细胞病毒立即早期基因(CMV)启动子,嵌合肝特异性启动子(LSP),巨细胞病毒增强子/鸡β-肌动蛋白(CAG)启动子,四环素应答性启动子(TRE),转甲状腺素蛋白启动子(TTR),猿病毒40(SV40)启动子和CK6启动子。用于本发明实践中有利的启动子是腺病毒主要晚期启动子(Berkner和Sharp,1985,Nucl.Acids Res.13:841-857)。下文中提供了特意举例说明的使用腺病毒主要晚期启动子的表达载体的序列。这些和各种其他启动子的序列是本领域已知的。可以从公众数据库容易地获得相关序列并引入实践本发明中使用的载体中。
本发明实践中特别优选的启动子是腺病毒主要晚期启动子。表达盒在5’至3’方向中可以包括腺病毒主要晚期启动子,可操纵地连接目标蛋白或目标蛋白链的第一个编码序列的三联前导序列,编码自我加工序列或蛋白酶裂解序列的第二个编码序列,以及任选编码自我加工序列或蛋白酶裂解序列的序列,之后为目标蛋白或蛋白链的第三个编码序列。所有这些序列共价连接并在相同的阅读框中,使得不在多蛋白编码序列内终止翻译。在蛋白质合成过程中或多肽合成完整后,自我加工或蛋白酶解加工将多蛋白裂解成合适的蛋白链或蛋白质。在免疫球蛋白合成的情况中,轻链的编码序列在多蛋白编码序列内存在两次。有利地,前导序列编码片段可以与蛋白或蛋白链序列相连;通过信号肽酶的加工具有除去加工位点蛋白下游N-端的特定残余氨基酸残基的附加益处。免疫球蛋白重链的组成部分是Met,蛋白质启动甲硫氨酸;HC,重链;LC,轻链,SPPC,自我加工或蛋白酶裂解位点。免疫球蛋白合成的表达构建体可以包括以下的:Met-蛋白酶-SPPC-HC前导序列-HC-SPPC-LC前导序列-LC-SPPC-LC前导序列-LC;Met-蛋白酶-SPPC-LC前导序列-LC-SPPC-LC前导序列-LC-SPPC-HC前导序列-HC;Met-蛋白酶-SPPC-LC前导序列-LC-SPPC-HC前导序列-HC-SPPC-LC前导序列-LC;HC前导序列-HC-SPPC-LC前导序列-LC-SPPC-LC前导序列-LC;LC前导序列-LC-SPPC-HC前导序列-HC-SPPC-LC前导序列-LC;LC前导序列-LC-SPPC-LC前导序列-LC-SPPC-HC前导序列-HC;Met-蛋白酶-SPPC-HC前导序列-HC-SPPC-LC前导序列-LC。
图1中图示了特意举例说明的多蛋白编码序列(产物Met-HC前导序列-HC-工程化的弗林蛋白酶位点-TEV裂解位点-TEV Nia蛋白酶-TEV裂解位点-LC前导序列-LC),并且图2中显示了用于该构建体表达的表达载体的图示。对于其HC和LC序列,抗-TNFα是一种示例抗体。对于治疗抗体的生产不需要LC前导序列。SPPS是TEV蛋白酶识别位点,并且存在5’编码的弗林蛋白酶位点至TEV位点。TEV裂解后的弗林蛋白酶裂解恢复了重链“正确的”C端赖氨酸残基。表1中显示了D2E7-TEV表达载体的完整DNA序列。
已经设计了特意举例说明的D2E7多蛋白表达构建体(D2E7-Lc-LC-HC),该构建体编码LC的串联重复片段并使用2A蛋白酶序列来裂解。已经修饰D2E7轻链C端来添加弗林蛋白酶裂解位点。这导致(通常)倒数第二个氨基酸从Glu至Arg的改变和C-端赖氨酸的添加。通过将两个LC序列5’置于HC,两个LC拷贝保持相同的氨基酸序列。表6C中显示了表达载体完整的核苷酸序列,表6B和6A中各自显示了多蛋白的氨基酸序列和编码序列。还可以参见SEQ IDNO:29-31。图7中显示了图示的表达载体图谱。
另一个特意举例说明的多蛋白(及其编码序列)是ABT-007-TEV的;各自参见表2B和2A。参见SEQ ID NO:33和32。该重组抗体特异性地结合促红细胞生成素受体(EroR)。表2C(SEQ ID NO:35)中显示了编码工程化ABT-007-TEV多蛋白的表达载体的完整序列。还可以参见SEQ ID NO:34。图3中显示了载体的图示。
另外特意举例说明的多蛋白及其编码序列是ABT-874-TEV的;各自参见表3B和3A。该抗体特异性地结合白细胞介素-12。图4中显示了表达载体的图示。还可以参见SEQ ID NO:35-37。
再一特意举例说明的多蛋白(及其编码序列)是EL246-GG-TEV的;参见表4B和4A。其中编码的抗体特异性地结合E/L选择素。图5中以图示的形式提供了表达载体。还可以参见SEQ ID NO:38-40。
ABT-325-TEV是具有白细胞介素-18结合特异性的工程化抗体。表5A和5B中各自给出了多蛋白的编码序列和氨基酸序列,并且表5C中提供了完整的表达载体序列。图6中显示了用于其合成的表达载体。还可以参见SEQ ID NO:41-43。
还提供了除去了核定位信号(NLS)的TEV蛋白酶(TEV NLS-)。还可以在细胞中作为分开的载体或分开的转录物的一部分来瞬时或稳定表达TEV或TEV(NLS-)。可以各自在之前的NLS部分通过引入ER锚定序列或通过融合小核糖体结合蛋白将TEV(NLS-)蛋白锚定ER或核糖体。
尽管本发明含有合成过程中或合成后的细胞中前体蛋白和多蛋白的蛋白酶解裂解的讨论,可以理解在体外使用合适的蛋白酶收集那些蛋白质后可以获得多蛋白和前体蛋白(前蛋白)。
在本发明的范围内,特别的表达的抗体(免疫球蛋白)可以包括,特别是,特异性结合以下物质的那些:肿瘤坏死因子(对应于和/或源自HUMIRA/D2E7的工程化抗体;Abbott Biotechnology Ltd.的阿达木单抗(adalimumab)的商标,Hamilton,Bermuda);白细胞介素-12(源自ABT-874的工程化抗体);白细胞介素-18(源自ABT-325的工程化抗体);重组促红细胞生成素受体(源自ABT-007的工程化抗体);白细胞介素-18(源自ABT-325的工程化抗体);或E/L选择素(源自EL246-GG的工程化抗体)。表1-5中显示了工程化多蛋白的编码序列和氨基酸序列。适于本发明的更多抗体包括,例如,Remicade(英夫单抗);Rituxan/Mabthera(利妥希玛);Herceptin(司徒曼布);Avastin(bevacizumab);Synagis(palivizumab);Erbitux(Cetuximab);Reopro(阿昔单抗);Orthoclone OKT3(鼠单克隆抗体-CD3);Zenapax(daclizumab);Simulect(basiliximab);Mylotarg(gemtuzumab);Campath(alemtuzumab);Zevalin(ibritumomab);Xolair(omalizumab);Bexxar(tositumomab)和Raptiva(efalizumab);其中通常是商标名接着括号内的是代表性的一般名称。其他合适的蛋白质包括,例如,epoetin alfa,epoetin beta,etanercept,darbepoetin alfa,filgastim,干扰素β1a,干扰素β1b,干扰素α-2b,胰岛素glargine,somatropin,teriparatide,follitropinα,链道酶,因子VIII,因子VII,因子IX,伊米苷酶,nesiritide,lenograstim和Von Willebrand因子中的一种或多种;其中一个或多个一般命名可以各自对应于产品的一个或多个商标名。适于本发明的其他抗体和蛋白质是本领域技术人员已知的。
本发明还包括两个或多个目标多肽或蛋白或前体蛋白的编码序列的受控表达。基因调控系统在特定基因的受控表达中是有用的。在一个示例性方法中,基因调控系统或开关包括具有配体结合结构域的嵌合转录因子,转录激活结构域和DNA结合结构域。结构域实际上可以从任何来源获得并可以以任何方式结合来获得新的蛋白质。可调控基因系统还包括DNA应答元件,其与嵌合转录因子相互作用。将该转录调控序列邻接待调控的基因安置。
实践本发明中可使用的示例性转录调控序列包括,例如,果蝇蜕皮激素系统(Yao等,1996,Proc.Natl.Acad.Sci.93:3346),蚕蜕皮激素系统(Suhr等,1998,Proc.Natl.Acad.Sci.95:7999),GeneSwitch(Valentis的商标名,The Woodlands,TX)合成孕酮受体系统,其使用RU486作为诱导剂(Osterwalder等,2001,Proc.Natl.Acad.Sci.USA98(22):12596-601);Tet和Rev Tet系统(四环素调控的表达系统,BD Biosciences Clontech的商标,Mountain View,CA),其使用小分子,如四环素(Tc)或类似物,例如,强力霉素,来调节(打开或关闭)目标的转录(Knott等,2002,Biotechniques 32(4):796,798,800);ARIAD调控技术(Ariad,Cambridge,MA),其是基于使用小分子来集合两个胞内分子,其中每个连接转录激活子或DNA结合蛋白。当这些成分在一起时,激活了目标基因的转录。Ariad具有基于均二聚的系统和基于杂二聚的系统(Rivera等,1996,Nature Med.2(9):1028-1032;Ye等,2000,Science 283:88-91)。
将本发明包括抗体或其片段或其他以自我加工或蛋白酶裂解重组多肽形式的异种蛋白或前体蛋白的核酸编码序列的表达载体构建体引入细胞中,用于体外、离体(ex vivo)或体内传送外源物质,治疗剂或转基因至细胞中,例如,体细胞,或用于通过载体转导细胞的重组多肽生产中。
宿主细胞和载体的传送
可以使用本领域已知的标准方法将本发明的载体构建体在体外或ex vivo引入合适的细胞中。这样的技术包括,例如,使用磷酸钙的转染,微注射至培养的细胞中(Capecchi,1980,Cell 22:479-488),电穿孔(Shigekawa等,1988,Bio Technology 6:742-751),脂质体介导的基因转移(Mannino等,Bio Technology 6:682-690),脂质介导的转导(Feigner等,1987,Proc.Natl.Acad.Sci.USA 84:7413-7417),和使用高速基因枪的核酸传送(Klein等,1987,Nature 327:70-73)。
为了在体外或离体(ex vivo)表达,可以使用有效表达功能性蛋白产物的任何细胞。用于蛋白表达的各种细胞和细胞系实例是本领域已知的。例如,原核细胞和昆虫细胞可以用于表达。此外,可以使用真核微生物,如酵母。在原核,昆虫和酵母系统中的重组蛋白表达通常是本领域已知的并适用于使用本发明的组合物和方法的抗体或其他蛋白表达。
用于表达的细胞实例进一步包括哺乳动物细胞,如成纤维细胞,来自非人哺乳动物的细胞,如绵羊,猪,鼠和牛细胞,昆虫细胞等。哺乳动物细胞的特定实例包括,但不限于,COS细胞,VERO细胞,Hela细胞,中国仓鼠卵巢(CHO),CHO DXB11细胞,CHO DG44细胞,PerC.6细胞,Sp2/0细胞,293细胞,NSO细胞,3T3成纤维细胞,W138细胞,BHK细胞,HEPG2细胞和MDCK细胞。
在常规营养培养基中培养宿主细胞,培养基按照适于引入启动子,选择转化子或扩增编码所需序列的基因而改变。可以在各种培养基中培养哺乳动物宿主细胞。可购得的培养基如Ham’s F10(Sigma),基本培养基(MEM)(Sigma),RPMI 1640(Sigma)和Dulbecco’s改良Eagle’s培养基(DMEM)(Sigma)通常适用于培养宿主细胞。给定的培养基通常按照需要补充激素和/或其他生长因子(如胰岛素,转铁蛋白或表皮生长因子),盐(如氯化钠,钙,镁和磷),缓冲剂(如HEPES),核苷酸(如腺苷和胸苷嘧啶),抗生素,微量元素和葡萄糖或等价能源。还以包括适当浓度的任何其他必需补充剂,如本领域技术人员公知的。对于特定细胞系的合适培养条件,如温度,pH等,通常是本领域已知的,使用建议的培养条件用于各种细胞系的培养,例如,ATCC目录中的(在“atcc.org/SearchCatalogs/AllCollections.cfm”在互联网上获得或按照商业供应商的所说明的)。
可以通过各种途径(例如,皮内,静脉内,肿瘤,进入脑中,门静脉内,腹膜内,机内,进入膀胱中等)在体内给予表达载体,来传送通过自我加工裂解序列连接的多个基因以在动物模型或人患者中表达两个或多个蛋白质或多肽。根据给予的途径,治疗蛋白引发局部(在脑或膀胱中)或全身(其他给予途径)效果。开放阅读框5’的组织特异性启动子的使用导致整个开放阅读框编码的蛋白质或多肽的组织特异性表达。
之前已经描述了在体外,离体(ex vivo)或在体内将携带转基因的重组表达载体引入目标细胞中的各种方法,并且是本领域公知的。本发明提供了治疗方法,疫苗和癌症疗法,通过用含有两个或多个目标蛋白或多肽的编码序列的重组载体感染靶向的细胞,并在靶向的细胞中表达蛋白质或多肽。
例如,本发明重组载体的体内传送可以靶向各种器官类型,包括但不限于,脑,肝脏,血管,肌肉,心脏,肺和皮肤。
在离体(ex vivo)基因转移的情况中,从宿主取出目标细胞并使用本发明的载体和本领域公知的方法在实验室中进行遗传修饰。
可以使用常规给予模式来给予本发明的重组载体,包括但不限于上述的模式。本发明的载体可以是各种剂型,包括但不限于液体溶液和悬浮液,微泡,脂质体和可注射或可灌输的溶液。优选的形式取决于给予模式和治疗应用。
本发明的重组表达构建体在免疫球蛋白或其他生物活性蛋白体内生产中的优势包括单个载体的给予,用于患者中长期而持续的抗体表达;具有全部生物活性的抗体或其片段(或其他生物活性蛋白)的体内表达;和人细胞中产生的抗体的天然翻译后修饰。理想地,表达的蛋白与天然产生的蛋白相同或基本上相同,使得在给予表达的蛋白质的情况中没有引发对多种情况的免疫应答,或在需要所述蛋白的患者中连续表达。
在用于治疗或研究的重组抗体和其他生物活性蛋白的体外生产中发现了本发明的重组载体构建体的更多用途。重组蛋白生产的方法是本领域已知的并可以用于重组抗体的表达,使用在此所述的含自我加工裂解位点或其他蛋白酶裂解位点的载体构建体。
在一个方面中,本发明提供了生产重组免疫球蛋白或其片段的方法,通过将如上所述的表达载体引入细胞中来获得转染的细胞,其中载体在5’至3’方向包括:可操纵地连接免疫球蛋白重链和两个轻链或其片段的编码序列的启动子,每个所述链之间的自我加工序列如2A或2A-样序列或蛋白酶裂解位点。认识到任一免疫球蛋白重链的编码序列或免疫球蛋白轻链的编码序列可以是给定的载体构建体中2A序列的5’(即,第一个)。或者,可以作为多蛋白的一部分来表达与蛋白酶裂解位点同源的蛋白酶,使得与剩余的多蛋白自我加工或通过分开的(或相同的)蛋白酶蛋白酶解裂解。可以通过置换相关的编码序列以加工过的活性形式表达其他多链蛋白或其他蛋白质(如来自双杂交或三杂交系统的那些),散置自我加工位点或蛋白酶识别位点也可以产生大小正确的分开的蛋白质。
双(或其他)杂交系统方法已经用于筛选cDNA文库,用于蛋白复合物的已知配体或亚基的之前未知的结合伴侣。对该系统进行合适的改变,还可以鉴定已知复合物中抑制,竞争或破坏结合的蛋白质或亚基。尽管双(和其他)杂交系统已经用于各种科学研究中,但因为相当大频率的假阳性或假阴性结果,这些系统可能是无效的。至少在一些情况中,那些假信号已经引起“诱饵”蛋白相对于候选结合伴侣蛋白或候选破坏蛋白的相对表达的不平衡。本发明策略的其他优势在于只将一个质粒转染或转化至宿主细胞中,并且对于该质粒只需要单次选择,替代了二元载体双杂交方案中的两次选择。该方法还适用于三杂交系统。对于双杂交系统的讨论,参见Toby和Golemis,2001,Methods 24:201-217;Vidal和Legrain,1999,Nucl.Acids Res.27:919-929;Drees,B,1999,Curr.Op.Chem.Biol.3:64-70;和Fields和Song,1989,Nature 340:245-246。图9显示了用于诱饵和猎物蛋白(或候选猎物蛋白)的多蛋白/自我加工或蛋白酶裂解表达策略的图示,图8显示了含有表达盒的载体,使用该方法用于诱饵和猎物蛋白。将载体表达盒结构化,将诱饵蛋白首先翻译成GAL4::诱饵::2A肽融合体,其在2A肽翻译后自我加工。第二个开放阅读框(ORF)双NFκB::文库融合蛋白。将诱饵蛋白工程化至MCS1需要框内翻译成2A自我加工肽序列。MCS2下游中表达文库的工程化是不太关键。
在此提供的策略可以相似地用于作为通过蛋白酶解裂解加工成成熟活性形式的前体形式表达的蛋白质的表达,因此提供用于重组表达的组合物和方法。这样的蛋白质的实例包括但不限于白细胞介素1和18(IL-1和IL-18)胰岛素。在炎性细胞的细胞质中产生IL-1和IL-18。这些分子缺乏传统的分泌信号,并且必须通过蛋白酶来裂解,以便分泌为生物活性形式。通过白细胞介素转化酶(ICE)将IL-1加工成成熟形式。通过caspase将Pro-IL-18转化成成熟IL-18。这些重组形式分子的生产是困难的,因为通常用作宿主的细胞不表达产生这些蛋白生物活性成熟形式需要的蛋白酶。这些没有pro结构域的细胞因子的表达导致没有活性的分子和/或低水平的产生。本发明提供了初级翻译产物,其在pro结构域和成熟多肽的氨基酸之间含有工程化的自我加工位点(例如,2A序列)或插入的蛋白酶裂解位点,不需要表达与目标蛋白平行的潜在毒性蛋白酶。
在相关的方面中,本发明提供了产生重组免疫球蛋白或其片段的方法,通过将如上所述的表达载体引入细胞中,其中载体在第一个和第二个免疫球蛋白编码序列之间进一步包括另外的裂解位点。优选的其他蛋白酶解裂解位点是具有一致序列RXK/R-R(SEQ ID NO:1)的弗林蛋白酶裂解位点。对于讨论,参见US专利公开2005/0003482A1。
在本发明的一个示例性方面中,载体引入或给予细胞后是一个或多个以下的步骤:在选择细胞和表达多蛋白或前体蛋白的条件下培养转染的细胞;测量免疫球蛋白或其片段或其他蛋白的表达;和收集免疫球蛋白或其片段或其他蛋白。
本发明的另一个方面提供了用于表达重组免疫球蛋白或其片段或其他目标蛋白的细胞,其中细胞包括用于表达两个或多个免疫球蛋白链或其片段或其他前体蛋白或蛋白的表达载体,可操纵地连接免疫球蛋白或其他链或其片段的第一个编码序列的启动子,自我加工或其他裂解编码序列,如2A或2A-样序列或蛋白酶识别位点,和免疫球蛋白或其他链或其片段的第二个编码序列,其中将自我加工裂解序列或蛋白酶识别位点编码序列插入第一个和第二个编码序列之间。在相关的方面中,细胞包括如上所述的表达载体,其中表达载体在第一个和第二个免疫球蛋白或其他目标编码序列之间进一步包括另外的蛋白酶解裂解位点。优选的其他蛋白酶解裂解位点是具有一致序列RXK/R-R(SEQ ID NO:1)的弗林蛋白酶裂解位点。
如在此所用的,“免疫球蛋白分子或其片段的第一个链的编码序列”指的是编码蛋白质分子的核酸序列,蛋白分子包括但不限于抗体或免疫球蛋白的轻链或重链,或其片段。
编码抗体或免疫球蛋白第一个或第二个链或其片段的序列包括源自IgG,IgM,IgD,IgE或IgA的重链或其片段。如宽泛地所述的,编码抗体或免疫球蛋白链或其片段的序列还包括来自IgG,IgM,IgD,IgE或IgA的轻链或其片段。完整抗体分子及其修饰或衍生形式的基因,包括,例如,其他抗原识别分子片段,如Fab,单链Fv(scFv)和F(ab’)2。抗体和片段可以是动物产生的,人-鼠嵌合的,人源化的,通过DeimmunisationTM(Biovation Ltd)改变的,改变对Fc受体的亲和性,或全部是人的。理想地,抗体或其他重组蛋白没有在给予的人或动物中引发免疫应答。
抗体可以是双特异性的,并且包括但不限于,二抗(diantibody),四源杂交瘤(quadroma),迷你抗体,ScBs抗体和knobs-into-holes抗体。
可以以本领域公知的各种方式获得抗体自身的产生和收集(Harlow等,1988,Antibodies,A Laboratory Manual(抗体,实验室手册),Cold Spring Harbor Laboratory。根据本领域公知的方法收集和/或纯化和/或使用其他目标蛋白。
在实践本发明中,可以在适于宿主细胞生长和编码序列表达的培养条件下培养修饰的重组宿主细胞来实现使用重组DNA技术的抗体或其变体(类似物)的生产。为了监控表达的成功,可以使用标准技术如ELISA,RIA等监控相对于抗原的抗体水平。使用本领域已知的标准基数从培养物上清液收集抗体。当然,可以通过标准纯化技术容易地制得这些抗体的纯化形式,这些技术包括但不限于,通过蛋白A,蛋白G或蛋白L柱的亲和色谱,或相对于特定的抗原,或甚至相对于抗原的特定抗原决定部位,对于该抗原的特异性是所需的。还可以使用常规色谱纯化抗体,如离子交换或大小排阻柱,结合其他技术,如硫酸铵沉淀和大小限制的膜滤。将表达系统设计来包括信号肽的情况中,将所得到的抗体分泌至培养基或上清液中;然而,也可以是胞内生产。
之前已经描述了从人Ig基因座工程化的小鼠生产和选择抗原特异性的全部是人的单克隆抗体(Jakobovits等,1998,Advanced DrugDelivery Reviews 31:33-42;Mendez等,1997,Nature Genetics 15:146-156;Jakobovits等,1995,Curr Opin Biotechnol 6:561-566;Green等,1994,Nature Genetics Vol.7:13-21)。
已经在转基因山羊的奶中获得治疗性单克隆抗体的高水平表达,并已经表明抗原结合水平等于使用常规细胞培养技术产生的单克隆抗体。该方法是基于转基因动物奶中人治疗性蛋白的产生,这些转基因动物携带使它们在奶中表达人治疗性蛋白的遗传信息。一旦产生,可以使用标准技术从奶中有效地纯化这些重组蛋白。参见,例如,Pollock等,1999,J.Immunol.Meth.231:147-157和Young等,1998,ResImmunol.149(6):609-610。已经证明了来自转基因动物的动物奶,蛋清,血液,尿液,精浆和蚕茧可以作为工业规模生产重组蛋白的来源(Houdebine L M.2002,Curr Opin Biotechnol 13:625-629;Little等,2000,Immunol Today,21(8):364-70;和Gura T.2002,Nature,417:584-5860。本发明包括转基因动物表达系统的用途,用于表达重组抗体或变体(类似物)或其他目标蛋白,使用本发明的自我加工裂解位点-编码和/或蛋白酶识别位点载体。
也已经成功证明了植物中的重组蛋白生产,包括但不限于,通过农杆菌感染,基因枪转化,原生质体转化等转化的土豆,番茄,烟草,水稻和其他植物。已经证明了转基因烟草植物的种子中的重组人GM-CSF表达和植物中包括单链抗体的抗体表达。参见,例如,Streaffield和Howard,2003,Int.J.Parasitol.33:479-93;Schillberg等,2003,Cell Mol Life Sci.60:433A5;Pogue等,2002,Annu.Rev.Phytopathol.40:45-74;和McCormick等,2003,J Immunological Mthods,278:95-104。本发明包括转基因植物表达系统的用途,用于表达重组免疫球蛋白或其片段或其他目标蛋白,使用本发明的蛋白酶裂解位点或自我加工裂解位点编码载体。
杆状病毒载体表达系统结合昆虫细胞也得到了进展,作为重组蛋白生产的可行平台。已经报道了杆状病毒载体表达系统提供了相对于哺乳动物细胞培养物的优势,如易于培养和较高的表达水平。参见,例如,Ghosh等,2002,Mol Ther.6:5-11,和Ikonomou等,2003,Appl Microbiol Biotechnol.62:1-20。本发明进一步包括杆状病毒载体系统的用途,用于表达重组免疫球蛋白或其片段,使用本发明的自我加工裂解位点编码载体。杆状病毒载体和合适的宿主细胞是本领域公知的并可购得。
还可以使用基于酵母的系统,用于表达重组免疫球蛋白或其片段或其他目标蛋白,包括双-或三-杂交系统,使用本发明的自我加工裂解位点。参见,例如,US专利No.5,643,745,在此引入作为参考。
可以理解发现本发明的包括单独的自我加工肽的编码序列或结合其他的蛋白酶解裂解位点的编码序列的表达盒和载体和重组宿主细胞在重组免疫球蛋白或其片段,前体蛋白,生物活性蛋白和双-和三-杂交系统的蛋白组成部分表达中的用途,在各种本领域已知的任何蛋白质表达系统中,并且在此描述了其实例。
当要求化合物,构建体或组合物时,应当理解不包括本领域已知的化合物,构建体和组合物,包括通过在此公开的参考文献中教导的那些。在此使用马库什基团或其他基团时,确定说明书中单独包括基团的所有单个成员和基团内所有可能的组合和亚组合形式。
实施例1.使用蛋白内含子介导的加工的免疫球蛋白表达
抗体分子有效表达的策略是通过多蛋白表达,其中蛋白内含子位于重链和轻链之间,具有蛋白内含子序列和/或连接序列的修饰,使得存在组成蛋白的释放,而没有N-端和C-端蛋白的连接。在这样的构建体内,可以存在相关重链和轻链各自的一个拷贝,或轻链可以是双倍的,或可以存在重链和轻链的多个拷贝,只要提供功能性裂解序列来促进多蛋白内每个免疫球蛋白衍生的蛋白质的分离。可以多次使用蛋白内含子策略或可以将不同的蛋白酶解加工序列或酶置于免疫球蛋白产生的蛋白质的至少一个末端。
已经如上简述的将来自极端嗜热古菌的蛋白内含子引入构建体中并已经显示出成功地产生了正确加工的和全部功能的D2E7抗体。测试的其他蛋白内含子来自酿酒酵母和集胞藻。已经通过ELISA表明菌株PCC6803产生分泌的抗体。
极端嗜热古菌Pho Pol I蛋白内含子的PCR扩增和亚克隆:
以下的寡核苷酸用于极端嗜热古菌Pho Pol蛋白内含子的扩增(NCBI/蛋白质登录号#O59610,完整DNA聚合酶I DNA序列的GenBank登录号#为BA00001.2:1686361..1690068,取自极端嗜热古菌的完整基因组序列),使用基因组DNA作为模板和Platinum Taq HiFidelity DNA聚合酶Supermix(Invitrogen,Carlsbad,CA)。基因组DNA购自ATCC。
极端嗜热古菌int-5’:AGCATTTTACCAGATGAATGGCTCCC(SEQ IDNO:52)
极端嗜热古菌int-3’:AACGAGGAAGTTCTCATTATCCTCAAC(SEQID NO:53)
根据以下的程序运行PCR:
步骤 1 2 3 4 5 6 7 8
温度 94℃ 94℃ 55℃ 72℃ 转到步骤2(34次) 72℃ 4℃ 结束
时间 2min 1min 1min 2min 5min 保持
将PCR产物亚克隆至pCR2.1-TOPO(Invitrogen)中,并将插入片段测序并证明正确性。当时认识到由于打印输出错误,存在从蛋白内含子3’端的序列丢失。然后在随后的连接蛋白内含子与D2E7的重链和轻链的PCR反应过程中,填补了丢失的序列。
为了产生D2E7重链-蛋白内含子-D2E7轻链的融合体,设计了寡核苷酸引物。设计引物使得PCR产物可以用作随后PCR反应中的引物。
说明组成部分的序列代码:
重链序列(粗体红色)-轻链序列(下划线)-极端嗜热古菌蛋白内含子序列(无格式的Arial)-极端嗜热蛋白内含子序列(粗体下划线蓝色)
终止密码子,TCA(Times New Roman,Olive)
Kozak
D2E7重链-蛋白内含子-D2E7轻链融合体的PCR扩增和装配:使用如上产生的pCR2.1-TOPO-极端嗜热古菌蛋白内含子克隆作为模板,使用引物极端嗜热古菌int-5’和修正的P.hori-3’进行PCR,给蛋白内含子恢复正确的3’端。所用的聚合酶是Pful DNA聚合酶,以避免使用Platinum Taq发生的A-加尾。
根据以下的程序运行PCR:
步骤 1 2 3 4 5 6 7 8
温度 94℃ 94℃ 55℃ 72℃ 转到步骤2(34次) 72℃ 4℃ 结束
时间 2min 1min 1min 2min 5min 保持
使用Qiaquick Gel提取试剂盒(Qiagen,Valencia,CA)凝胶纯化PCR扩增产物。将该产物用作下一组反应的模板。
进行三组PCR反应来产生蛋白内含子编码序列,使用不同数目的蛋白内含子编码序列的蛋白外显子残基5’和3’。蛋白外显子密码子来自极端嗜热古菌中的天然DNA聚合酶基因,该蛋白内含子是天然部分。所用的引物如下:组1引入了零蛋白外显子序列(HC-蛋白内含子-5’和修正的LC-蛋白内含子-3’),组2在蛋白内含子(HC-蛋白内含子(1aa)-5’和修正的LC-蛋白内含子(1aa)-3’)的两端引入了一个氨基酸(3个碱基对),组3在蛋白内含子(HC-蛋白内含子(3aa)-5’和修正的LC-蛋白内含子(3aa)-3’)的两端引入了三个氨基酸(9个碱基对)。
PCR程序和以上给出的相同。使用Qiaquick Gel提取试剂盒(Qiagen)凝胶纯化PCR扩增产物。将这些产物用作下一组反应的引物。
进行三组PCR反应来产生D2E7重链与蛋白内含子的融合体,其中使用0,1或3个蛋白外显子氨基酸。用于反应的模板是D2E7重链DNA。将上述的PCR产物各自用作3’引物,将HC-Srfl-5’用作所有反应中的5’引物。使用Pful DNA聚合酶。
根据以下程序运行PCR:
步骤 1 2 3 4 5 6 7 8
温度 94℃ 94℃ 50℃ 72℃ 转到步骤2(34次) 72℃ 4℃ 结束
时间 2min 1min 1min 3min 5min 保持
使用Qiaquick Gel提取试剂盒(Qiagen)凝胶纯化PCR扩增产物。将这些产物用作下一组反应的引物。
进行三组PCR反应来产生D2E7重链-蛋白内含子与D2E7轻链的融合体,其中使用0,1或3个蛋白外显子氨基酸。用于反应的模板是D2E7轻链DNA。将以上所述的PCR产物各自用作5’引物,将LC-BamHI-3’用作所有反应中的3’引物。使用Pful DNA聚合酶。
根据以下程序运行PCR
步骤 1 2 3 4 5 6 7 8
温度 94℃ 94℃ 55℃ 72℃ 转到步骤2(34次) 72℃ 4℃ 结束
时间 2min 1min 1min 5min 5min 保持
在凝胶上跑胶时,产生的PCR产物扩散并且是稀少的。将这些反应直接用作最后一轮PCR的模板,使用HC-Srfl-5’和LC-BamHI-3’作为模板。使用如上所示的相同PCR程序。使用Qiaquick Gel提取试剂盒(Qiagen)凝胶纯化PCR产物。
将如上所述纯化的PCR产物亚克隆至pCR-BluntII-TOPO(Invitrogen)中,使用Zero Blunt TOPO PCR克隆试剂盒(Invitrogen)。将克隆测序来证实构建体呈现出预期的核酸序列。发现每种类型产物的正确克隆。使用SrfI和NotI从pCR-BluntII-TOPO切除D2E7重链-蛋白内含子-D2E7轻链盒,并亚克隆至使用相同的酶限制的pTT3中,并凝胶纯化。
使用极端嗜热古菌蛋白内含子设计了用于D2E7重链-蛋白内含子-D2E7轻链的三个表达构建体:pTT3-HcintLC-p.hori(参见图14的质粒图谱);pTT3-HcintLClaa-p.hori;和pTT3-HcintLC3aa-p.hori。
表10A.pTT3-HcintLC-p.hori的核苷酸序列(SEQ ID NO:62)
5’-
gcggccgctcgaggccggcaaggccggatcccccgacctcgacctctggctaataaaggaaatttattttcattgcaatagtgtgttggaattttttgtgtctctcactcggaaggacatatgggagggcaaatcatttggtcgagatccctcggagatctctagctagaggatcgatccccgccccggacgaactaaacctgactacgacatctctgccccttcttcgcggggcagtgcatgtaatcccttcagttggttggtacaacttgccaactgggccctgttccacatgtgacacggggggggaccaaacacaaaggggttctctgactgtagttgacatccttataaatggatgtgcacatttgccaacactgagtggctttcatcctggagcagactttgcagtctgtggactgcaacacaacattgcctttatgtgtaactcttggctgaagctcttacaccaatgctgggggacatgtacctcccaggggcccaggaagactacgggaggctacaccaacgtcaatcagaggggcctgtgtagctaccgataagcggaccctcaagagggcattagcaatagtgtttataaggcccccttgttaaccctaaacgggtagcatatgcttcccgggtagtagtatatactatccagactaaccctaattcaatagcatatgttacccaacgggaagcatatgctatcgaattagggttagtaaaagggtcctaaggaacagcgatatctcccaccccatgagctgtcacggttttatttacatggggtcaggattccacgagggtagtgaaccattttagtcacaagggcagtggctgaagatcaaggagcgggcagtgaactctcctgaatcttcgcctgcttcttcattctccttcgtttagctaatagaataactgctgagttgtgaacagtaaggtgtatgtgaggtgctcgaaaacaaggtttcaggtgacgcccccagaataaaatttggacggggggttcagtggtggcattgtgctatgacaccaatataaccctcacaaaccccttgggcaataaatactagtgtaggaatgaaacattctgaatatctttaacaatagaaatccatggggtggggacaagccgtaaagactggatgtccatctcacacgaatttatggctatgggcaacacataatcctagtgcaatatgatactggggttattaagatgtgtcccaggcagggaccaagacaggtgaaccatgttgttacactctatttgtaacaaggggaaagagagtggacgccgacagcagcggactccactggttgtctctaacacccccgaaaattaaacggggctccacgccaatggggcccataaacaaagacaagtggccactcttttttttgaaattgtggagtgggggcacgcgtcagcccccacacgccgccctgcggttttggactgtaaaataagggtgtaataacttggctgattgtaaccccgctaaccactgcggtcaaaccacttgcccacaaaaccactaatggcaccccggggaatacctgcataagtaggtgggcgggccaagataggggcgcgattgctgcgatctggaggacaaattacacacacttgcgcctgagcgccaagcacagggttgttggtcctcatattcacgaggtcgctgagagcacggtgggctaatgttgccatgggtagcatatactacccaaatatctggatagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctaatagagattagggtagtatatgctatcctaatttatatctgggtagcatatactacccaaatatctggatagcatatgctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctcatgataagctgtcaaacatgagaattttcttgaagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtgttgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgcagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgttcttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgccaagctctagctagaggtcgaccaattctcatgtttgacagcttatcatcgcagatccgggcaacgttgttgccattgctgcaggcgcagaactggtaggtatggaagatctatacattgaatcaatattggcaattagccatattagtcattggttatatagcataaatcaatattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattggctcatgtccaatatgaccgccatgttgacattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacaccaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaataaccccgccccgttgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcgtttagtgaaccgtcagatcctcactctcttccgcatcgctgtctgcgagggccagctgttgggctcgcggttgaggacaaactcttcgcggtctttccagtactcttggatcggaaacccgtcggcctccgaacggtactccgccaccgagggacctgagcgagtccgcatcgaccggatcggaaaacctctcgagaaaggcgtctaaccagtcacagtcgcaaggtaggctgagcaccgtggcgggcggcagcgggtggcggtcggggttgtttctggcggaggtgctgctgatgatgtaattaaagtaggcggtcttgagacggcggatggtcgaggtgaggtgtggcaggcttgagatccagctgttggggtgagtactccctctcaaaagcgggcattacttctgcgctaagattgtcagtttccaaaaacgaggaggatttgatattcacctggcccgatctggccatacacttgagtgacaatgacatccactttgcctttctctccacaggtgtccactcccaggtccaagtttgggcgccaccatggagtttgggctgagctggctttttcttgtcgcgattttaaaaggtgtccagtgt-
gaggtgcagctggtggagtctgggggaggcttggtacagcccggcaggtccctgagactctcctgtgcggcctctggattcacctttgatgattatgccatgcactgggtccggcaagctccagggaagggcctggaatgggtctcagctatcacttggaatagtggtcacatagactatgcggactctgtggagggccgattcaccatctccagagacaacgccaagaactccctgtatctgcaaatgaacagtctgagagctgaggatacggccgtatattactgtgcgaaagtctcgtaccttagcaccgcgtcctcccttgactattggggccaaggtaccctggtcaccgtctcgagtgcgtcgaccaagggcccatcggtcttccccctggcaccctcctccaagagcacctctgggggcacagcggccctgggctgcctggtcaaggactacttccccgaaccggtgacggtgtcgtggaactcaggcgccctgaccagcggcgtgcacaccttcccggctgtcctacagtcctcaggactctactccctcagcagcgtggtgaccgtgccctccagcagcttgggcacccagacctacatctgcaacgtgaatcacaagcccagcaacaccaaggtggacaagaaagttgagcccaaatcttgtgacaaaactcacacatgcccaccgtgcccagcacctgaactcctggggggaccgtcagtcttcctcttccccccaaaacccaaggacaccctcatgatctcccggacccctgaggtcacatgcgtggtggtggacgtgagccacgaagaccctgaggtcaagttcaactggtacgtggacggcgtggaggtgcataatgccaagacaaagccgcgggaggagcagtacaacagcacgtaccgtgtggtcagcgtcctcaccgtcctgcaccaggactggctgaatggcaaggagtacaagtgcaaggtctccaacaaagccctcccagcccccatcgagaaaaccatctccaaagccaaagggcagccccgagaaccacaggtgtacaccctgcccccatcccgggatgagctgaccaagaaccaggtcagcctgacctgcctggtcaaaggcttctatcccagcgacatcgccgtggagtgggagagcaatgggcagccggagaacaactacaagaccacgcctcccgtgctggactccgacggctccttcttcctctacagcaagctcaccgtggacaagagcaggtggcagcaggggaacgtcttctcatgctccgtgatgcatgaggctctgcacaaccactacacgcagaagagcctctccctgtctccgggtaaa-
agcattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatagggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagccctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcagggaaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaatggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttccagaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgatgatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaaggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtgaagttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaatagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtggataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactacataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcgaaacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgccatatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttccttaagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcctgaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatcctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtgttgaggataatgagaacttcctcgttggcttcggactactttacgcacacaac-
atggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgcgacatccagatgacccagtctccatcctccctgtctgcatctgtaggggacagagtcaccatcacttgtcgggcaagtcagggcatcagaaattacttagcctggtatcagcaaaaaccagggaaagcccctaagctcctgatctatgctgcatccactttgcaatcaggggtcccatctcggttcagtggcagtggatctgggacagatttcactctcaccatcagcagcctacagcctgaagatgttgcaacttattactgtcaaaggtataaccgtgcaccgtatacttttggccaggggaccaaggtggaaatcaaacgtacggtggctgcaccatctgtcttcatcttcccgccatctgatgagcagttgaaatctggaactgcctctgttgtgtgcctgctgaataacttctatcccagagaggccaaagtacagtggaaggtggataacgccctccaatcgggtaactcccaggagagtgtcacagagcaggacagcaaggacagcacctacagcctcagcagcaccctgacgctgagcaaagcagactacgagaaacacaaagtctacgcctgcgaagtcacccatcagggcctgagctcgcccgtcacaaagagcttcaacaggggagagtgt -3’
表10B.pTT3-HcintLC-p.hori中开放阅读框的氨基酸序列(SEQ IDNO:63)
Mefglswlflvailkgvqcevqlvesggglvqpgrslrlscaasgftfddyamhwvrqapgkglewvsaitwnsghidyadsvegrftisrdnaknslylqmnslraedtavyycakvsylstassldywgqgtlvtvssastkgpsvfplapsskstsggtaalgclvkdyfpepvtvswnsgaltsgvhtfpavlqssglyslssvvtvpssslgtqtyicnvnhkpsntkvdkkvepkscdkthtcppcpapellggpsvflfppkpkdtlmisrtpevtcvvvdvshedpevkfnwyvdgvevhnaktkpreeqynstyrvvsvltvlhqdwlngkeykckvsnkalpapiektiskakgqprepqvytlppsrdeltknqvsltclvkgfypsdiavewesngqpennykttppvldsdgsfflyskltvdksrwqqgnvfscsvmhealhnhytqkslslspgk-
silpdewlpivenekvrfvkigdfidreieenaervkrdgeteilevkdlkalsfnretkkselkkvkalirhrysgkvysiklksgrrikitsghslfsvkngklvkvrgdelkpgdlvvvpgrlklpeskqvlnlvelllklpeeetsnivmmipvkgrknffkgmlktlywifgegerprtagrylkhlerlgyvklkrrgcevldweslkryrklyetliknlkyngnsraymvefnslrdvvslmpieelkewiigeprgpkigtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaeklfgkvrrgrgyievsgkishaifrvlaegkripefiftspmdikvaflkglngnaeeltfstksellvnqlilllnsigvsdikiehekgvyrvyinkkessngdivldsvesievekyegyvydlsvednenflvgfgllyahn-
mdmrvpaqllgllllwfpgsrcdiqmtqspsslsasvgdrvtitcrasqgirnylawyqqkpgkapklliyaastlqsgvpsrfsgsgsgtdftltisslqpedvatyycqrynrapytfgqgtkvelkrtvaapsvfifppsdeqlksgtasvvcllnnfypreakvqwkvdnalqsgnsqesvteqdskdstyslsstltlskadyekhkvyacevthqglsspvtksfnrgec
序列的Text/font符号代码:
pTT3载体-重链-蛋白内含子-轻链
在以下的2个构建体中,与以上的构建体的唯一区别时包括极端嗜热古菌(下划线的)天然的蛋白外显子序列。所示的序列从D2E7重链编码片段的末端(如红色所示的最后9个碱基对)至D2D7轻链编码序列的5’端(如粉色所示的头9个碱基对,以分开的线表示)。
表11A.pTT3-HcintLC1aa-p.hori部分编码序列(SEQ ID NO:64)
5’-ccgggtaaa-
aacagcattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatagggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagccctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcagggaaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaatggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttccagaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgatgatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaaggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtgaagttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaatagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtggataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactacataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcgaaacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgccatatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttccttaagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcctgaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatcctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtgttgaggataatgagaacttcctcgttggcttcggactactttacgcacacaacagt-
atggacatg -3’
表11B.pTT3-HcintLC1aa-p.hori部分氨基酸序列,显示重链的4个氨基酸上游和蛋白内含子的四个氨基酸下游(SEQ ID NO:65)
Pgknsilpdewlpivenekvrfvkigdfidreieenaervkrdgeteilevkdlkalsfnretkkselkkvkalirhrysgkvysiklksgrrikitsghslfsvkngklvkvrgdelkpgdlvvvpgrlklpeskqvlnlvelllklpeeetsnivmmipvkgrknffkgmlktlywifgegerprtagrylkhlerlgyvklkrrgcevldweslkryrklyetliknlkyngnsraymvefnslrdvvslmpieelkewiigeprgpkigtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaeklfgkvrrgrgyievsgkishaifrvlaegkripefiftspmdikvaflkglngnaeeltfstksellvnqlilllnsigvsdikiehekgvyrvyinkkessngdivldsvesievekyegyvydlsvednenflvgfgllyahn-s-mdm
重链3’序列-蛋白内含子-蛋白外显子-轻链5’序列
表12A.pTT3-HcintLC3aa-p.hori部分编码序列(SEQ ID NO:66)
5’-ccgggtaaa-ttagcaaac-
agcattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatagggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagccctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcagggaaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaatggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttccagaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgatgatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaaggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtgaagttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaatagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtggataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactacataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcgaaacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgccatatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttccttaagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcctgaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatcctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtgttgaggataatgagaacttcctcgttggcttcggactactttacgcacacaac-agttattac-atggacatg-3’
表12B.pTT3-HcintLC3aa-p.hori部分氨基酸序列,显示出蛋白内含子和侧翼序列(SEQ ID NO:67)
Pgk-lan-
silpdewlpivenekvrfvkigdfidreieenaervkrdgeteilevkdlkalsfnretkkselkkvkalirhrysgkvysiklksgrrikitsghslfsvkngklvkvrgdelkpgdlvvvpgrlklpeskqvlnlvelllklpeeetsnivmmipvkgrknffkgmlktlywifgegerprtagrylkhlerlgyvklkrrgcevldweslkryrklyetliknlkyngnsraymvefnslrdvvslmpieelkewiigeprgpkigtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaeklfgkvrrgrgyievsgkishaifrvlaegkripefiftspmdikvaflkglngnaeeltfstksellvnqlilllnsigvsdikiehekgvyrvyinkkessngdivldsvesievekyegyvydlsvednenflvgfgllyahn-syy-mdm
重链3’序列-蛋白内含子-蛋白外显子-轻链5’序列
用于构建体A、B、E、H、I、J、K和L的引物为:
YKF1:GGACTACTTTACGCAGCCAACATGGACATGC(SEQ ID NO:68)
YKR1:GCATGTCCATGTTGGCTGCGTAAAGTAGTCC(SEQ ID NO:69)
YKF2:GGACTACTTTACGCAGCCAACAGTATGGACATGC(SEQ ID NO:70)
YKR2:GCATGTCCATACTGTTGGCTGCGTAAAGTAGTCC(SEQ ID NO:71)
YKF3:GGTGAGGAGAGGAAGAGG(SEQ ID NO:72)
YKR3:CCAGAGGTCGAGGTCG(SEQ ID NO:73)
YKF4:CGGCGTGGAGGTGC(SEQ ID NO:74)
YKR4:CAACAATTGGGAGCCATTCATCTGGTAAAATGGTTTTACCCGGAG(SEQID NO:75)
YKF5:CCGCCCAGCTGCTGGGCGACGAGTGGTTCCCCGGCTCGCG(SEQ IDNO:76)
YKR5:Cgcgagccggggaaccactcgtcgcccagcagctgggcgg(SEQ ID NO:77)
YKF6:tgagcggccgctcga(SEQ ID NO:78)
YKR6:gttgtgtgcgtaaag(SEQ ID NO:79)
YKF7:agcattttaccagat(SEQ ID NO:80)
YKR7:ggtggcgcccaaact(SEQ ID NO:81)
YKF8:ctttacgcacacaacatggacatgcgcgtg(SEQ ID NO:82)
YKR8:tcgagcggccgctcaacactctcccct(SEQ ID NO:83)
YKF9:agtttgggcgccaccatggagtttgggctg(SEQ ID NO:84)
YKR9:atctggtaaaatgcttttacccggagacag(SEQ ID NO:85)
YKF10:agtttgggcgccaccatggacatgcgcgtg(SEQ ID NO:86)
YKR10:atctggtaaaatgctacactctcccctgttg(SEQ ID NO:87)
YKF11:ctttacgcacacaacatggagtttgggctg(SEQ ID NO:88)
YKR11:tcgagcggccgctcatttacccggagacag(SEQ ID NO:89)
YKF12:cgccaagctctagc(SEQ ID NO:90)
YKR12:ggtcgaggtcgggg(SEQ ID NO:91)
YKF13:acatgcgcgtgcccgcccagtggttccccggctcgcgatg(SEQ ID NO:92)
YKR13:catcgcgagccggggaaccactgggcgggcacgcgcatgt(SEQ ID NO:93)
YKF14:ctttacgcacacaacgacatccagatgacc(SEQ ID NO:94)
YKR14:ggtcatctggatgtcgttgtgtgcgtaaag(SEQ ID NO:95)
YKF15:tggttccccggctcgGgaGgcgacatccagatgacc(SEQ ID NO:96)
YKR15:ggtcatctggatgtcgcctcccgagccggggaacca(SEQ ID NO:97)
为了制备构建体A,将质粒pTT3-HC-int-LC p.hori用作模板2,并各自使用诱变引物YKF1和引物YKR3以及诱变引物YKR1和引物YKF3扩增重叠DNA片段。通过PCR产生连接以上2个PCR片段的DNA片段,使用以上2个PCR片段的混合物作为模板,以及引物TKF3和YKR3。然后用限制酶EcoR I和Not I切割该PCR,并克隆至用相同限制酶切割的pTT3-HC-int-LC P.hori中。
以用于构建体A相似的方式产生构建体B,除了替代YKF1和YKR1使用诱变引物YKF2和YKR2,并替代质粒pTT3-HC-int-LCP.hori,将质粒pTT3-HC-int-LC-1aa P.hori用作PCR模板,并将pTT3-HC-int-LC P.hori载体用作克隆的背景。
为了制备构建体E,使用作为模板的质粒pTT3-HC-int-LC-1aaP.hori扩增DNA片段,以及引物YKF4和诱变引物YKR4。用Sac II和Mfe I切割该PCR片段,并克隆至使用相同限制酶切割的pTT3-HC-int-LC p.hori中。
对于构建体H,将pTT3-HC-int-LC P.hori用作模板2,并扩增重叠片段,使用诱变引物YKF5和引物YKR3用于一个片段,以及引物F3和诱变引物R5用于另一个片段。使用以上2个片段作为模板以及引物YKF3和YKR3进行第二轮PCR扩增。用限制酶EcoR I和Not I消化该片段,并克隆至使用相同酶切割的pTT3-HC-int-LC p.hori中。
为了制备构建体J,将pTT3-HC-int-LC P.hori用作模板2,并扩增重叠片段,使用诱变引物YKF13和引物YKR3用于一个片段,以及引物F3和诱变引物R13用于另一个片段。使用以上2个片段作为模板以及引物YKF3和YKR3进行第二轮PCR扩增。用限制酶EcoR I和NotI消化该片段,并克隆至使用相同酶切割的pTT3-HC-int-LC p.hori中。
对于构建体K,将pTT3-HC-int-LC P.hori用作模板2。扩增重叠片段,使用诱变引物YKF14和引物YKR3用于一个片段,以及引物F3和诱变引物R14用于另一个片段。使用以上2个片段作为模板以及引物YKF3和YKR3进行第二轮PCR扩增。用限制酶EcoR I和Not I消化该片段,并克隆至使用相同酶切割的pTT3-HC-int-LC P.hori中。
为了制备构建体L,将pTT3-HC-int-LC P.hori用作模板2,并扩增重叠片段,使用诱变引物YKF15和引物YKR3用于一个片段,以及引物F3和诱变引物R15用于另一个片段。使用以上2个片段作为模板以及引物YKF3和YKR3进行第二轮PCR扩增。用限制酶EcoR I和NotI消化该片段,并克隆至使用相同酶切割的pTT3-HC-int-LC P.hori中。
证实了所有构建体的核苷酸序列。所有构建体具有与pTT3-HC-int-LC P.hori相同的序列,除了D2E7重链的最后一个密码子(编码PGK)和D2E7轻链成熟序列的第一个密码子(编码DIQ)之间的序列。如下提供了所有构建体的该片段中的序列,其包括wt或突变蛋白内含子结合wt或突变轻链信号序列。
表13A.构建体A的部分编码序列(SEQ ID NO:98)
Ccgggtaaa-
agcattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatagggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagccctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcagggaaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaatggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttccagaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgatgatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaaggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtgaagttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaatagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtggataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactacataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcgaaacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgccatatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttccttaagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcctgaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatcctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtgttgaggataatgagaacttcctcgttggcttcggactactttacgcagccaacatggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgc-gacatccag
表13B.显示构建体A中蛋白内含子和侧翼序列的部分氨基酸序列(SEQ ID NO:99)
Pgk-
silpdewlpivenekvrfvkigdfidreieenaervkrdgeteilevkdlkalsfnretkkselkkvkalirhrysgkvysiklksgrrikitsghslfsvkngklvkvrgdelkpgdlvvvpgrlklpeskqvlnlvelllklpeeetsnivmmipvkgrknffkgmlktlywifgegerprtagrylkhlerlgyvklkrrgcevldweslkryrklyetliknlkyngnsraymvefnslrdvvslmpieelkewiigeprgpkigtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaeklfgkvrrgrgyievsgkishaifrvlaegkripefiftspmdikvaflkglngnaeeltfstksellvnqlilllnsigvsdikiehekgvyrvyinkkessngdivldsvesievekyegyvydlsvednenflvgfgllyaanmdmrvpaqllgllllwfpgsrc-diq
表14A.构建体B中的部分编码序列(SEQ ID NO:100)
Ccgggtaaa-
agcattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatagggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagccctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcagggaaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaatggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttccagaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgatgatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaaggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtgaagttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaatagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtggataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactacataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcgaaacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgccatatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttccttaagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcctgaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatcctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtgttgaggataatgagaacttcctcgttggcttcggactactttacgcagccaacagtatggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgc-gacatccag
表14B.构建体B中的部分氨基酸序列(SEQ ID NO:101)
Pgk-
silpdewlpivenekvrfvkigdfidreieenaervkrdgeteilevkdlkalsfnretkkselkkvkalirhrysgkvysiklksgrrikitsghslfsvkngklvkvrgdelkpgdlvvvpgrlklpeskqvlnlvelllklpeeetsnivmmipvkgrknffkgmlktlywifgegerprtagrylkhlerlgyvklkrrgcevldweslkryrklyetliknlkyngnsraymvefnslrdvvslmpieelkewiigeprgpkigtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaeklfgkvrrgrgyievsgkishaifrvlaegkripefiftspmdikvaflkglngnaeeltfstksellvnqlilllnsigvsdikiehekgvyrvyinkkessngdivldsvesievekyegyvydlsvednenflvgfgllyaansmdmrvpaqllgllllwfpgsrc-diq
表15A.构建体E中的部分编码序列(SEQ ID NO:102)
Ccgggtaaa-
accattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatagggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagccctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcagggaaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaatggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttccagaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgatgatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaaggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtgaagttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaatagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtggataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactacataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcgaaacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgccatatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttccttaagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcctgaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatcctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtgttgaggataatgagaacttcctcgttggcttcggactactttacgcacacaacagtatggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgc-gacatccag
表15B.构建体E中的部分氨基酸序列(SEQ ID NO:103)
Pgk-
tilpdewlpivenekvrfvkigdfidreieenaervkrdgetellevkdlkalsfnretkkselkkvkalirhrysgkvysiklksgrrikitsghslfsvkngklvkvrgdelkpgdlvvvpgrlklpeskqvlnlvelllklpeeetsnivmmipvkgrknffkgmlktlywifgegerprtagrylkhlerlgyvklkrrgcevldweslkryrklyetliknlkyngnsraymvefnslrdvvslmpieelkewiigeprgpkigtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaeklfgkvrrgrgyievsgkishaifrvlaegkripefiftspmdikvaflkglngnaeeltfstksellvnqlilllnsigvsdikiehekgvyrvyinkkessngdivldsvesievekyegyvydlsvednenflvgfgllyahnsmdmrvpaqllgllllwfpgsrc-diq
表16A.构建体H中的部分编码序列(SEQ ID NO:104)
Ccgggtaaa-
agcattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatagggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagccctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcagggaaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaatggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttccagaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgatgatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaaggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtgaagttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaatagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtggataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactacataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcgaaacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgccatatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttccttaagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcctgaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatcctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtgttgaggataatgagaacttcctcgttggcttcggactactttacgcacacaacatggacatgcgcgtgcccgcccagctgctgggcgacgagtggttccccggctcgcgatgc-gacatccag
表16B.构建体H中的部分氨基酸序列(SEQ ID NO:105)
Pgk-
silpdewlpivenekvrfvkigdfidreieenaervkrdgeteilevkdlkalsfnretkkselkkvkalirhrysgkvysiklksgrrikitsghslfsvkngklvkvrgdelkpgdlvvvpgrlklpeskqvlnlvelllklpeeetsnivmmipvkgrknffkgmlktlywifgegerprtagrylkhlerlgyvklkrrgcevldweslkryrklyetliknlkyngnsraymvefnslrdvvslmpieelkewiigeprgpkigtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaeklfgkvrrgrgyievsgkishaifrvlaegkripefiftspmdikvaflkglngnaeeltfstksellvnqlilllnsigvsdikiehekgvyrvyinkkessngdivldsvesievekyegyvydlsvednenflvgfgllyahnrmdmrvpaqllgdewfpgsrc-diq
表17A.构建体J中的部分编码序列(SEQ ID NO:106)
Ccgggtaaa-
agcattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatagggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagccctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcagggaaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaatggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttccagaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgatgatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaaggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtgaagttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaatagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtggataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactacataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcgaaacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgccatatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttccttaagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcctgaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatcctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtgttgaggataatgagaacttcctcgttggcttcggactactttacgcacacaacatggacatgcgcgtgcccgcccagtggttccccggctcgcgatgc-gacatccag
表17B.构建体J中的部分氨基酸序列(SEQ ID NO:107)
Pgk-
silpdewlpivenekvrfvkigdfidreieenaervkrdgeteilevkdlkalsfnretkkselkkvkalirhrysgkvysiklksgrrikitsghslfsvkngklvkvrgdelkpgdlvvvpgrlklpeskqvlnlvelllklpeeetsnivmmipvkgrknffkgmlktlywifgegerprtagrylkhlerlgyvklkrrgcevldweslkryrklyetliknlkyngnsraymvefnslrdvvslmpieelkewiigeprgpkigtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaeklfgkvrrgrgyievsgkishaifrvlaegkripefiftspmdikvaflkglngnaeeltfstksellvnqlllllnsigvsdikiehekgvyrvyinkkessngdivldsvesievekyegyvydlsvednenflvgfgllyahnmdmrvpaqvfpgsrc-diq
表18A.构建体K中的部分编码序列(SEQ ID NO:108)
Ccgggtaaa-
agcattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatagggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagccctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcagggaaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaatggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttccagaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgatgatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaaggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtgaagttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaatagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtggataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactacataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcgaaacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgccatatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttccttaagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcctgaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatcctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtgttgaggataatgagaacttcctcgttggcttcggactactttacgcacacaac-gacatccag
表18B.构建体K中的部分氨基酸序列(SEQ ID NO:109)
Pgk-
silpdewlpivenekvrfvkigdfidreieenaervkrdgeteilevkdlkalsfnretkkselkkvkalirhrysgkvysiklksgrrikitsghslfsvkngklvkvrgdelkpgdlvvvpgrlklpeskqvlnlvelllklpeeetsnivmmipvkgrknffkgmlktlywifgegerprtagrylkhlerlgyvklkrrgcevldweslkryrklyetliknlkyngnsraymvefnslrdvvslmpieelkewiigeprgpkigtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaeklfgkvrrgrgyievsgkishaifrvlaegkripefiftspmdikvaflkglngnaeeltfstksellvnqlilllnsigvsdikiehekgvyrvyinkkessngdivldsvesievekyegyvydlsvednenflvgfgllyahn-diq
表19A.构建体L中的部分编码序列(SEQ ID NO:110)
Ccgggtaaa-
agcattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatagggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagccctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcagggaaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaatggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttccagaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgatgatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaaggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtgaagttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaatagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtggataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactacataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcgaaacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgccatatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttccttaagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcctgaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatcctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtgttgaggataatgagaacttcctcgttggcttcggactactttacgcacacaacatggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgggaggc-gacatccag
表19B.构建体L中的部分氨基酸序列(SEQ ID NO:111)
Pgk-
silpdewlpivenekvrfvkigdfidreieenaervkrdgeteilevkdlkalsfnretkkselkkvkalirhrysgkvysiklksgrrikitsghslfsvkngklvkvrgdelkpgdlvvvpgrlklpeskqvlnlvelllklpeeetsnivmmipvkgrknffkgmlktlywifgegerprtagrylkhlerlgyvklkrrgcevldweslkryrklyetliknlkyngnsraymvefnslrdvvslmpieelkewiigeprgpkigtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaeklfgkvrrgrgyievsgkishaifrvlaegkripefiftspmdikvaflkglngnaeeltfstksellvnqlilllnsigvsdikiehekgvyrvyinkkessngdivldsvesievekyegyvydlsvednenflvgfgllyahnrmdmrvpaqllgllllwfpgsgg-diq
重链3’序列-蛋白内含子+轻链信号肽序列-轻链成熟序列
将以下寡核苷酸用于酿酒酵母VMA蛋白内含子(GenBank登录号#AB093499)的扩增,使用基因组DNA作为模板和Pfu-I Hi FidelityDNA聚合酶(Stratagene)。使用Yeast-Geno-DNA-Template试剂盒(GBiosciences,cat.#786-134)从酿酒酵母的培养物中制备基因组DNA。
Sce VMA蛋白内含子5’:TGCTTTGCCAAGGGTACCAATGTTTT(SEQ ID NO:112)
Sce VMA蛋白内含子3’:ATTATGGACGACAACCTGGTTGGCAA(SEQ ID NO:113)
根据以下程序运行PCR:
步骤 1 2 3 4 5 6 7 8
温度 94℃ 94℃ 50℃ 72℃ 转到步骤2(39次) 72℃ 4℃ 结束
时间 2min 1min 1min 2min 5min 保持
将PCR产物用作模板,使用以下的引物对来产生用于极端嗜热古菌构建体的蛋白内含子的0aa,1aa和3aa形式。使用Pfu-I Hi FidelityDNA聚合酶(Stratagene)。
Sce-5’-Sap
CCGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAATGCTTTGCCAAGGGTACCAATGTTTT(SEQ ID NO:114)
Sce-5’-1aa-Sap
CCGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAAGGGTGCTTTGCCAAGGGTACCAATGTTTT(SEQ ID NO:115)
Sce-5’-3aa-Sap
CCGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAATATGTCGGGTGCTTTGCCAAGGGTACCAATGTTTT(SEQ ID NO:116)
Sce-3’-Van911
CAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATATTATGGACGACAACCTGGTTGGCAA(SEQ ID NO:117)
Sce-3’-1aa-Van911
CAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATGCAATTATGGACGACAACCTGGTTGGCAA(SEQ ID NO:118)
Sce-3’-3aa-Van911
CAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATTTCTCCGCAATTATGGACGACAACCTGGT TGGCAA(SEQ ID NO:119)
使用以上提供的相同程序运行PCR。将来自每个反应类型的PCR产物亚克隆至pCR-BluntII-TOPO(Invitrogen)中,将每个类型的插入片段测序并证明正确性。
为了通过同源重组至大肠杆菌中的pTT3-HcintLC p.horikoshii构建体中来产生D2E7重链-蛋白内含子-D2E7轻链的融合体,设计寡核苷酸引物。通过工程化PCR产生的载体(含有pTT3载体,重链和轻链片段,但没有极端嗜热古菌蛋白内含子)和VMA蛋白内含子插入片段之间的40个碱基对悬垂物,可以混合两个DNA并转化至大肠杆菌中,没有连接的益处,导致两个片段的大肠杆菌同源重组至0aa,1aa和3aa形式的pTT3-HC-VMAint-LC中。
VMA同源重组引物:
VMA-HR5’:
CCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAA(SEQ IDNO:120)
VMA-HR3’:
GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCAT(SEQ IDNO:121)
pTT3-HcintLC同源重组引物:
pTT3int-HR5’:
ATGGACATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGC(SEQ IDNO:122)
pTT3int-HR3’:
TTTACCCGGAGACAGGGAGAGGCTCTTCTGCGTGTAGTGGT(SEQ IDNO:123)
根据以下程序运行用于蛋白内含子的PCR:使用Pfu-I Hi FidelityDNA聚合酶(Stratagene)。
步骤 1 2 3 4 5 6 7 8
温度 94℃ 94℃ 60℃ 72℃ 转到步骤2(34次) 72℃ 4℃ 结束
时间 2min 1min 1min 1.5min 5min 保持
按照以下程序运行用于载体的PCR:使用Platinum Taq Hi FidelitySupermix(Invitrogen)。
步骤 1 2 3 4 5 6 7 8
温度 94℃ 94℃ 60℃ 68℃ 转到步骤2(24次) 68℃ 4℃ 结束
时间 2min 30sec 30sec 10min 5min 保持
为了实现VMA同源重组至pTT3-HcintLC中,使用以下的策略。使用Qiaquick凝胶提取试剂盒(Qiagen)将PCR产物凝胶纯化,并将每个稀释至50μl稀释缓冲液中。将3μl载体PCR产物在eppendorf管中混合,并加入3μl所需的VMA蛋白内含子PCR产物(将0aa,1aa或3aa加入分开的管中)。将每个混合物转化至大肠杆菌中,然后将细胞置于LB+氨苄青霉素平板上,并在37℃培养过夜。将克隆生长至2ml培养物,使用Wizard Prep试剂盒(Promega)制备质粒DNA并通过限制性核酸内切酶消化和琼脂糖凝胶电泳来分析。对于DNA序列分析产生正确限制模式的克隆。
形成了三个使用酿酒酵母VMA蛋白内含子的用于D2E7重链-蛋白内含子-D2E7轻链的表达构建体:pTT3-Hc-VMAint-LC-0aa;pTT3-Hc-VMAint-LC-1aa;和pTT3-Hc-VMAint-LC-3aa。还可以参见图15的质粒图谱。
表20.完整的质粒pTT3-D2E7重链-蛋白内含子-D2E7轻链的序列(SEQ ID NO:124)
5’-
gcggccgctcgaggccggcaaggccggatcccccgacctcgacctctggctaataaaggaaatttattttcattgcaatagtgtgttggaattttttgtgtctctcactcggaaggacatatgggagggcaaatcatttggtcgagatccctcggagatctctagctagaggatcgatccccgccccggacgaactaaacctgactacgacatctctgccccttcttcgcggggcagtgcatgtaatcccttcagttggttggtacaacttgccaactgggccctgttccacatgtgacacggggggggacc aaacacaaaggggttctctgactgtagttgacatccttataaatggatgtgcacatttgccaacactgagtggctttcatcctggagcagactttgcagtctgtggactgcaacacaacattgcctttatgtgtaactcttggctgaagctcttacaccaatgctgggggacatgtacctcccaggggcccaggaagactacgggaggctacaccaacgtcaatcagaggggcctgtgtagctaccgataagcggaccctcaagagggcattagcaatagtgtttataaggcccccttgttaaccctaaacgggtagcatatgcttcccgggtagtagtatatactatccagactaaccctaattcaatagcatatgttacccaacgggaagcatatgctatcgaattagggttagtaaaagggtcctaaggaacagcgatatctcccaccccatgagctgtcacggttttatttacatggggtcaggattccacgagggtagtgaaccattttagtcacaagggcagtggctgaagatcaaggagcgggcagtgaactctcctgaatcttcgcctgcttcttcattctccttcgtttagctaatagaataactgctgagttgtgaacagtaaggtgtatgtgaggtgctcgaaaacaaggtttcaggtgacgcccccagaataaaatttggacggggggttcagtggtggcattgtgctatgacaccaatataaccctcacaaaccccttgggcaataaatactagtgtaggaatgaaacattctgaatatctttaacaatagaaatccatggggtggggacaagccgtaaagactggatgtccatctcacacgaatttatggctatgggcaacacataatcctagtgcaatatgatactggggttattaagatgtgtcccaggcagggaccaagacaggtgaaccatgttgttacactctatttgtaacaaggggaaagagagtggacgccgacagcagcggactccactggttgtctctaacacccccgaaaattaaacggggctccacgccaatggggcccataaacaaagacaagtggccactcttttttttgaaattgtggagtgggggcacgcgtcagcccccacacgccgccctgcggttttggactgtaaaataagggtgtaataacttggctgattgtaaccccgctaaccactgcggtcaaaccacttgcccacaaaaccactaatggcaccccggggaatacctgcataagtaggtgggcgggccaagataggggcgcgattgctgcgatctggaggacaaattacacacacttgcgcctgagcgccaagcacagggttgttggtcctcatattcacgaggtcgctgagagcacggtgggctaatgttgccatgggtagcatatactacccaaatatctggatagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctaatagagattagggtagtatatgctatcctaatttatatctgggtagcatatactacccaaatatctggatagcatatgctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctcatgataagctgtcaaacatgagaattttcttgaagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtgttgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgcagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgttcttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgccaagctctagctagaggtcgaccaattctcatgtttgacagcttatcatcgcagatccgggcaacgttgttgccattgctgcaggcgcagaactggtaggtatggaagatctatacattgaatcaatattggcaattagccatattagtcattggttatatagcataaatcaatattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattggctcatgtccaatatgaccgccatgttgacattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacaccaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaataaccccgccccgttgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcgtttagtgaaccgtcagatcctcactctcttccgcatcgctgtctgcgagggccagctgttgggctcgcggttgaggacaaactcttcgcggtctttccagtactcttggatcggaaacccgtcggcctccgaacggtactccgccaccgagggacctgagcgagtccgcatcgaccggatcggaaaacctctcgagaaaggcgtctaaccagtcacagtcgcaaggtaggctgagcaccgtggcgggcggcagcgggtggcggtcggggttgtttctggcggaggtgctgctgatgatgtaattaaagtaggcggtcttgagacggcggatggtcgaggtgaggtgtggcaggcttgagatccagctgttggggtgagtactccctctcaaaagcgggcattacttctgcgctaagattgtcagtttccaaaaacgaggaggatttgatattcacctggcccgatctggccatacacttgagtgacaatgacatccactttgcctttctctccacaggtgtccactcccaggtccaagtttgggcgccaccatggagtttgggctgagctggctttttcttgtcgcgattttaaaaggtgtccagtgt-
gaggtgcagctggtggagtctgggggaggcttggtacagcccggcaggtccctgagactctcctgtgcggcctctggattcacctttgatgattatgccatgcactgggtccggcaagctccagggaagggcctggaatgggtctcagctatcacttggaatagtggtcacatagactatgcggactctgtggagggccgattcaccatctccagagacaacgccaagaactccctgtatctgcaaatgaacagtctgagagctgaggatacggccgtatattactgtgcgaaagtctcgtaccttagcaccgcgtcctcccttgactattggggccaaggtaccctggtcaccgtctcgagtgcgtcgaccaagggcccatcggtcttccccctggcaccctcctccaagagcacctctgggggcacagcggccctgggctgcctggtcaaggactacttccccgaaccggtgacggtgtcgtggaactcaggcgccctgaccagcggcgtgcacaccttcccggctgtcctacagtcctcaggactctactccctcagcagcgtggtgaccgtgccctccagcagcttgggcacccagacctacatctgcaacgtgaatcacaagcccagcaacaccaaggtggacaagaaagttgagcccaaatcttgtgacaaaactcacacatgcccaccgtgcccagcacctgaactcctggggggaccgtcagtcttcctcttccccccaaaacccaaggacaccctcatgatctcccggacccctgaggtcacatgcgtggtggtggacgtgagccacgaagaccctgaggtcaagttcaactggtacgtggacggcgtggaggtgcataatgccaagacaaagccgcgggaggagcagtacaacagcacgtaccgtgtggtcagcgtcctcaccgtcctgcaccaggactggctgaatggcaaggagtacaagtgcaaggtctccaacaaagccctcccagcccccatcgagaaaaccatctccaaagccaaagggcagccccgagaaccacaggtgtacaccctgcccccatcccgggatgagctgaccaagaaccaggtcagcctgacctgcctggtcaaaggcttctatcccagcgacatcgccgtggagtgggagagcaatgggcagccggagaacaactacaagaccacgcctcccgtgctggactccgacggctccttcttcctctacagcaagctcaccgtggacaagagcaggtggcagcaggggaacgtcttctcatgctccgtgatgcatgaggctctgcacaaccactacacgcagaagagcctctccctgtctccgggtaaa-
tgctttgccaagggtaccaatgttttaatggcggatgggtctattgaatgtattgaaaacattgaggttggtaataaggtcatgggtaaagatggcagacctcgtgaggtaattaaattgcccagaggaagagaaactatgtacagcgtcgtgcagaaaagtcagcacagagcccacaaaagtgactcaagtcgtgaagtgccagaattactcaagtttacgtgtaatgcgacccatgagttggttgttagaacacctcgtagtgtccgccgtttgtctcgtaccattaagggtgtcgaatattttgaagttattacttttgagatgggccaaaagaaagcccccgacggtagaattgttgagcttgtcaaggaagtttcaaagagctacccaatatctgaggggcctgagagagccaacgaattagtagaatcctatagaaaggcttcaaataaagcttattttgagtggactattgaggccagagatctttctctgttgggttcccatgttcgtaaagctacctaccagacttacgctccaattctttatgagaatgaccactttttcgactacatgcaaaaaagtaagtttcatctcaccattgaaggtccaaaagtacttgcttatttacttggtttatggattggtgatggattgtctgacagggcaactttttcggttgattccagagatacttctttgatggaacgtgttactgaatatgctgaaaagttgaatttgtgcgccgagtataaggacagaaaagaaccacaagttgccaaaactgttaatttgtactctaaagttgtcagaggtaatggtattcgcaataatcttaatactgagaatccattatgggacgctattgttggcttaggattcttgaaggacggtgtcaaaaatattccttctttcttgtctacggacaatatcggtactcgtgaaacatttcttgctggtctaattgattctgatggctatgttactgatgagcatggtattaaagcaacaataaagacaattcatacttctgtcagagatggtttggtttcccttgctcgttctttaggcttagtagtctcggttaacgcagaacctgctaaggttgacatgaatggcaccaaacataaaattagttatgctatttatatgtctggtggagatgttttgcttaacgttctttcgaagtgtgccggctctaaaaaattcaggcctgctcccgccgctgcttttgcacgtgagtgccgcggattttatttcgagttacaagaattgaaggaagacgattattatgggattactttatctgatgattctgatcatcagtttttgcttgccaaccaggttgtcgtccataat-
atggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgcgacatccagatgacccagtctccatcctccctgtctgcatctgtaggggacagagtcaccatcacttgtcgggcaagtcagggcatcagaaattacttagcctggtatcagcaaaaaccagggaaagcccctaagctcctgatctatgctgcatccactttgcaatcaggggtcccatctcggttcagtggcagtggatctgggacagatttcactctcaccatcagcagcctacagcctgaagatgttgcaacttattactgtcaaaggtataaccgtgcaccgtatacttttggccaggggaccaaggtggaaatcaaacgtacggtggctgcaccatctgtcttcatcttcccgccatctgatgagcagttgaaatctggaactgcctctgttgtgtgcctgctgaataacttctatcccagagaggccaaagtacagtggaaggtggataacgccctccaatcgggtaactcccaggagagtgtcacagagcaggacagcaaggacagcacctacagcctcagcagcaccctgacgctgagcaaagcagactacgagaaacacaaagtctacgcctgcgaagtcacccatcagggcctgagctcgcccgtcacaaagagcttcaacaggggagagtgt -3’
pTT3载体-重链-蛋白内含子-轻链
在以下的构建体中,与以上构建体的唯一差异是包括酿酒酵母天然的蛋白外显子序列(以蓝色显示)。所示的序列从D2E7重链编码片段的末端(以红色显示的最后9个碱基对)至D2E7轻链编码片段的5’端(以粉色显示的头9个碱基对)。
表21.pTT3-HC-VMAint-LC-1aa的部分编码序列(SEQ ID NO:125)
5’-ccgggtaaa-ggg-
tgctttgccaagggtaccaatgttttaatggcggatgggtctattgaatgtattgaaaacattgaggttggtaataaggtcatgggtaaagatggcagacctcgtgaggtaattaaattgcccagaggaagagaaactatgtacagcgtcgtgcagaaaagtcagcacagagcccacaaaagtgactcaagtcgtgaagtgccagaattactcaagtttacgtgtaatgcgacccatgagttggttgttagaacacctcgtagtgtccgccgtttgtctcgtaccattaagggtgtcgaatattttgaagttattacttttgagatgggccaaaagaaagcccccgacggtagaattgttgagcttgtcaaggaagtttcaaagagctacccaatatctgaggggcctgagagagccaacgaattagtagaatcctatagaaaggcttcaaataaagcttattttgagtggactattgaggccagagatctttctctgttgggttcccatgttcgtaaagctacctaccagacttacgctccaattctttatgagaatgaccactttttcgactacatgcaaaaaagtaagtttcatctcaccattgaaggtccaaaagtacttgcttatttacttggtttatggattggtgatggattgtctgacagggcaactttttcggttgattccagagatacttctttgatggaacgtgttactgaatatgctgaaaagttgaatttgtgcgccgagtataaggacagaaaagaaccacaagttgccaaaactgttaatttgtactctaaagttgtcagaggtaatggtattcgcaataatcttaatactgagaatccattatgggacgctattgttggcttaggattcttgaaggacggtgtcaaaaatattccttctttcttgtctacggacaatatcggtactcgtgaaacatttcttgctggtctaattgattctgatggctatgttactgatgagcatggtattaaagcaacaataaagacaattcatacttctgtcagagatggtttggtttcccttgctcgttctttaggcttagtagtctcggttaacgcagaacctgctaaggttgacatgaatggcaccaaacataaaattagttatgctatttatatgtctggtggagatgttttgcttaacgttctttcgaagtgtgccggctctaaaaaattcaggcctgctcccgccgctgcttttgcacgtgagtgccgcggattttatttcgagttacaagaattgaaggaagacgattattatgggattactttatctgatgattctgatcatcagtttttgcttgccaaccaggttgtcgtccataat-tgc-atggacatg-3’
重链3’序列-蛋白内含子-蛋白外显子-轻链5’序列
表22.pTT3-HC-VMAint-LC-3aa(SEQ ID NO:126)
ccgggtaaatatgtcgggtgctttgccaagggtaccaatgttttaatggcggatgggtctattgaatgtattgaaaacattgaggttggtaataaggtcatgggtaaagatggcagacctcgtgaggtaattaaattgcccagaggaagagaaactatgtacagcgtcgtgcagaaaagtcagcacagagcccacaaaagtgactcaagtcgtgaagtgccagaattactcaagtttacgtgtaatgcgacccatgagttggttgttagaacacctcgtagtgtccgccgtttgtctcgtaccattaagggtgtcgaatattttgaagttattacttttgagatgggccaaaagaaagcccccgacggtagaattgttgagcttgtcaaggaagtttcaaagagctacccaatatctgaggggcctgagagagccaacgaattagtagaatcctatagaaaggcttcaaataaagcttattttgagtggactattgaggccagagatctttctctgttgggttcccatgttcgtaaagctacctaccagacttacgctccaattctttatgagaatgaccactttttcgactacatgcaaaaaagtaagtttcatctcaccattgaaggtccaaaagtacttgcttatttacttggtttatggattggtgatggattgtctgacagggcaactttttcggttgattccagagatacttctttgatggaacgtgttactgaatatgctgaaaagttgaatttgtgcgccgagtataaggacagaaaagaaccacaagttgccaaaactgttaatttgtactctaaagttgtcagaggtaatggtattcgcaataatcttaatactgagaatccattatgggacgctattgttggcttaggattcttgaaggacggtgtcaaaaatattccttctttcttgtctacggacaatatcggtactcgtgaaacatttcttgctggtctaattgattctgatggctatgttactgatgagcatggtattaaagcaacaataaagacaattcatacttctgtcagagatggtttggtttcccttgctcgttctttaggcttagtagtctcggttaacgcagaacctgctaaggttgacatgaatggcaccaaacataaaattagttatgctatttatatgtctggtggagatgttttgcttaacgttctttcgaagtgtgccggctctaaaaaattcaggcctgctcccgccgctgcttttgcacgtgagtgccgcggattttatttcgagttacaagaattgaaggaagacgattattatgggattactttatctgatgattctgatcatcagtttttgcttgccaaccaggttgtcgtccataattgcggagaaatggacatg
重链3’序列-蛋白内含子-蛋白外显子-轻链5’序列
集胞藻株PCC6803DnaE蛋白内含子:合成、PCR扩增和克隆
集胞藻株PCC6803DnaE蛋白内含子是天然裂解的蛋白内含子(NCBI登录号#s S76958和S75328)。我们已经连接该蛋白内含子的N’端和C-端对半,作为一个已经合成的开放阅读框。所需蛋白序列的编码序列是用于CHO细胞中表达的密码子最佳化的(www.geneart.com)。表23中给出了所得到的核苷酸序列。
表23.Ssp-Di(在黑线仓鼠(Cricetulus griseus)中表达最佳化的编码序列)(还可以参见SEQ ID NO:127和128)
KpnI EcoRI
GGGCGAATTGGGTACCGAATTCTGCCTGTCCTTCGGCACCGAGATCCTGACCGTGGAGTA
1 ---------+---------+---------+---------+---------+---------+
CCCGCTTAACCCATGGCTTAAGACGGACAGGAAGCCGTGGCTCTAGGACTGGCACCTCAT
C__L__S__F__G__T__E__I__L__T__V__E__Y_
CGGCCCTCTGCCTATCGGCAAGATCGTGTCCGAAGAGATCAACTGCTCCGTGTACTCCGT
61 ---------+---------+---------+---------+---------+---------+
GCCGGGAGACGGATAGCCGTTCTAGCACAGGCTTCTCTAGTTGACGAGGCACATGAGGCA
_G__P__L__P__I__G__K__I__V__S__E__E__I__N__C__S__V__Y__S__V_
AccI
GGACCCTGAGGGCCGGGTGTATACTCAGGCCATCGCCCAGTGGCACGACCGGGGCGAGCA
121 ---------+---------+---------+---------+---------+---------+
CCTGGGACTCCCGGCCCACATATGAGTCCGGTAGCGGGTCACCGTGCTGGCCCCGCTCGT
_D__P__E__G__R__V__Y__T__Q__A__I__A__Q__W__H__D__R__G__E__Q_
AgeI
GGAGGTGCTGGAGTACGAGCTGGAGGACGGCTCCGTGATCCGGGCCACCTCCGACCACCG
181 ---------+---------+---------+---------+---------+---------+
CCTCCACGACCTCATGCTCGACCTCCTGCCGAGGCACTAGGCCCGGTGGAGGCTGGTGGC
_E__V__L__E__Y__E__L__E__D__G__S__V__I__R__A__T__S__D__H__R_
PvuII BglII PvuII BspMI
GTTTCTGACCACCGACTATCAGCTGCTGGCCATCGAGGAGATCTTCGCCCGGCAGCTGGA
241 ---------+---------+---------+---------+---------+---------+
CAAAGACTGGTGGCTGATAGTCGACGACCGGTAGCTCCTCTAGAAGCGGGCCGTCGACCT
_F__L__T__T__D__Y__Q__L__L__A__I__E__E__I__F__A__R__Q__L__D_
BstNI BstNI
CCTGCTGACCCTGGAGAACATCAAGCAGACCGAGGAGGCCCTGGACAACCACCGGCTGCC
301 +---------+---------+---------+---------+---------+
GGACGACTGGGACCTCTTGTAGTTCGTCTGGCTCCTCCGGGACCTGTTGGTGGCCGACGG
_L__L__T__L__E__N__I__K__Q__T__E__E__A__L__D__N__H__R__L__P_
BstXI BstNI
TTTCCCTCTGCTGGACGCCGGCACCATCAAGATGGTGAAGGTGATCGGCAGGCGGTCCCT
361 ---------+---------+---------+---------+---------+---------+
AAAGGGAGACGACCTGCGGCCGTGGTAGTTCTACCACTTCCACTAGCCGTCCGCCAGGGA
_F__P__L__L__D__A__G__T__I__K__M__V__K__V__I__G__R__R__S__L_
GGGCGTGCAGCGGATCTTCGACATCGGCCTGCCTCAGGACCACAACTTTCTGCTGGCCAA
421 ---------+---------+---------+---------+---------+---------+
CCCGCACGTCGCCTAGAAGCTGTAGCCGGACGGAGTCCTGGTGTTGAAAGACGACCGGTT
_G__V__Q__R__T__F__D__I__G__L__P__Q__D__H__N__F__L__L__A__N_
NarI
KasI SacI
HaeII HindIII
CGGCGCCATCGCCGCCAACAAGCTTGAGCTCCAGCTTTTGTTCCC
481 ---------+---------+---------+---------+-----
GCCGCGGTAGCGGCGGTTGTTCGAACTCGAGGTCGAAAACAAGGG
_G__A__I__A__A__N__
1
以下的寡核苷酸用于集胞藻株PCC6803DnaE蛋白内含子的扩增,使用以上合成的DNA作为模板和Platinum Taq Hi Supermix(Invitrogen)。这些引物还引入蛋白外显子序列来产生0aa,1aa和3aa形式,以及用于PCR产物同源重组至pTT3-HcintLC载体中的序列,和使用酿酒酵母VMA蛋白内含子一样进行:
Ssp-geneart-5’HR:
CCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAATGCCTGTCCTTCGGCACCGAG(SEQ ID NO:129)
SSp-geneart-3’-HR:
GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATGTTGGCGGCGATGGCGCCGTTGGCC(SEQ ID NO:130)
Ssp-GA-1aa-5’-HR:
CCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAATATTGCCTGTCCTTCGGCACCGAG(SEQ ID NO:131)
Ssp-GA-1aa-3’-HR:
GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATACAGTTGGCGGCGATGGCGCCGT(SEQ ID NO:132)
Ssp-GA-3aa-5’-HR:
CCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAAGCCGAGTATTGCCTGTCCTTCGGCACCGAG(SEQ ID NO:133)
Ssp-GA-3aa-3’-HR:
CCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAAGCCGAGTATTGCCTGTCCTTCGGCACCGAG(SEQ ID NO:134)
根据以下程序运行PCR:
步骤 1 2 3 4 5 6 7 8
温度 94℃ 94℃ 60℃ 68℃ 转到步骤2(34次) 68℃ 4℃ 结束
时间 2min 30sec 30sec 1min 5min 保持
为了获得密码子最佳化的集胞藻株PCC6803 DnaE蛋白内含子同源克隆至pTT3-HcintLC中,使用以下的策略。将PCR产物凝胶纯化并将每个稀释至50μl稀释缓冲液中(Qiaquick凝胶提取试剂盒(Qiagen))。将2μl载体PCR产物(和使用VMA蛋白内含子的同源重组中所用的相同)和2μl所需的集胞藻株PCC6803DnaE蛋白内含子PCR产物(0aa,1aa或3aa在分开的管中)在Eppendorf管中混合。然后将核酸转化至大肠杆菌中并置于LB+氨苄青霉素平板上,然后在37℃培养过夜。将克隆生长至2ml培养物,使用Wizard prep试剂盒(Promega)制备DNA,并通过限制性核酸内切酶消化和琼脂糖凝胶电泳来分析。对于DNA序列分析产生正确限制模式的克隆,来证实存在所需的序列。
使用集胞藻株PCC6803DnaE蛋白内含子设计了三个用于D2E7重链-蛋白内含子-D2E7轻链的表达构建体:pTT3-Hc-Ssp-GA-int-LC-0aa(参见图16的质粒图谱);pTT3-Hc-Ssp-GA-int-LC-1aa;和pTT3-Hc-Ssp-GA-int-LC-3aa。
表24.完整质粒pTT3-D2E7重链-Ssp-GA-蛋白内含子-D2E7轻链的序列(SEQ ID NO:135)
5’-
gcggccgctcgaggccggcaaggccggatcccccgacctcgacctctggctaataaaggaaatttattttcattgcaatagtgtgttggaattttttgtgtctctcactcggaaggacatatgggagggcaaatcatttggtcgagatccctcggagatctctagctagaggatcgatccccgccccggacgaactaaacctgactacgacatctctgccccttcttcgcggggcagtgcatgtaatcccttcagttggttggtacaacttgccaactgggccctgttccacatgtgacacggggggggaccaaacacaaaggggttctctgactgtagttgacatccttataaatggatgtgcacatttgccaacactgagtggctttcatcctggagcagactttgcagtctgtggactgcaacacaacattgcctttatgtgtaactcttggctgaagctcttacaccaatgctgggggacatgtacctcccaggggcccaggaagactacgg gaggctacaccaacgtcaatcagaggggcctgtgtagctaccgataagcggaccctcaagagggcattagcaatagtgtttataaggcccccttgttaaccctaaacgggtagcatatgcttcccgggtagtagtatatactatccagactaaccctaattcaatagcatatgttacccaacgggaagcatatgctatcgaattagggttagtaaaagggtcctaaggaacagcgatatctcccaccccatgagctgtcacggttttatttacatggggtcaggattccacgagggtagtgaaccattttagtcacaagggcagtggctgaagatcaaggagcgggcagtgaactctcctgaatcttcgcctgcttcttcattctccttcgtttagctaatagaataactgctgagttgtgaacagtaaggtgtatgtgaggtgctcgaaaacaaggtttcaggtgacgcccccagaataaaatttggacggggggttcagtggtggcattgtgctatgacaccaatataaccctcacaaaccccttgggcaataaatactagtgtaggaatgaaacattctgaatatctttaacaatagaaatccatggggtggggacaagccgtaaagactggatgtccatctcacacgaatttatggctatgggcaacacataatcctagtgcaatatgatactggggttattaagatgtgtcccaggcagggaccaagacaggtgaaccatgttgttacactctatttgtaacaaggggaaagagagtggacgccgacagcagcggactccactggttgtctctaacacccccgaaaattaaacggggctccacgccaatggggcccataaacaaagacaagtggccactcttttttttgaaattgtggagtgggggcacgcgtcagcccccacacgccgccctgcggttttggactgtaaaataagggtgtaataacttggctgattgtaaccccgctaaccactgcggtcaaaccacttgcccacaaaaccactaatggcaccccggggaatacctgcataagtaggtgggcgggccaagataggggcgcgattgctgcgatctggaggacaaattacacacacttgcgcctgagcgccaagcacagggttgttggtcctcatattcacgaggtcgctgagagcacggtgggctaatgttgccatgggtagcatatactacccaaatatctggatagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctaatagagattagggtagtatatgctatcctaatttatatctgggtagcatatactacccaaatatctggatagcatatgctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctcatgataagctgtcaaacatgagaattttcttgaagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtgttgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgcagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgttcttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgccaagctctagctagaggtcgaccaattctcatgtttgacagcttatcatcgcagatccgggcaacgttgttgccattgctgcaggcgcagaactggtaggtatggaagatctatacattgaatcaatattggcaattagccatattagtcattggttatatagcataaatcaatattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattggctcatgtccaatatgaccgccatgttgacattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacaccaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaataaccccgccccgttgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcgtttagtgaaccgtcagatcctcactctcttccgcatcgctgtctgcgagggccagctgttgggctcgcggttgaggacaaactcttcgcggtctttccagtactcttggatcggaaacccgtcggcctccgaacggtactccgccaccgagggacctgagcgagtccgcatcgaccggatcggaaaacctctcgagaaaggcgtctaaccagtcacagtcgcaaggtaggctgagcaccgtggcgggcggcagcgggtggcggtcggggttgtttctggcggaggtgctgctgatgatgtaattaaagtaggcggtcttgagacggcggatggtcgaggtgaggtgtggcaggcttgagatccagctgttggggtgagtactccctctcaaaagcgggcattacttctgcgctaagattgtcagtttccaaaaacgaggaggatttgatattcacctggcccgatctggccatacacttgagtgacaatgacatccactttgcctttctctccacaggtgtccactcccaggtccaagtttgggcgccaccatggagtttgggctgagctggctttttcttgtcgcgattttaaaaggtgtccagtgt-
gaggtgcagctggtggagtctgggggaggcttggtacagcccggcaggtccctgagactctcctgtgcggcctctggattcacctttgatgattatgccatgcactgggtccggcaagctccagggaagggcctggaatgggtctcagctatcacttggaatagtggtcacatagactatgcggactctgtggagggccgattcaccatctccagagacaacgccaagaactccctgtatctgcaaatgaacagtctgagagctgaggatacggccgtatattactgtgcgaaagtctcgtaccttagcaccgcgtcctcccttgactattggggccaaggtaccctggtcaccgtctcgagtgcgtcgaccaagggcccatcggtcttccccctggcaccctcctccaagagcacctctgggggcacagcggccctgggctgcctggtcaaggactacttccccgaaccggtgacggtgtcgtggaactcaggcgccctgaccagcggcgtgcacaccttcccggctgtcctacagtcctcaggactctactccctcagcagcgtggtgaccgtgccctccagcagcttgggcacccagacctacatctgcaacgtgaatcacaagcccagcaacaccaaggtggacaagaaagttgagcccaaatcttgtgacaaaactcacacatgcccaccgtgcccagcacctgaactcctggggggaccgtcagtcttcctcttccccccaaaacccaaggacaccctcatgatctcccggacccctgaggtcacatgcgtggtggtggacgtgagccacgaagaccctgaggtcaagttcaactggtacgtggacggcgtggaggtgcataatgccaagacaaagccgcgg gaggagcagtacaacagcacgtaccgtgtggtcagcgtcctcaccgtcctgcaccaggactggctgaatggcaag gagtacaagtgcaaggtctccaacaaagccctcccagcccccatcgagaaaaccatctccaaagccaaagggcagccccgagaaccacaggtgtacaccctgcccccatcccgggatgagctgaccaagaaccaggtcagcctgacctgcctggtcaaaggcttctatcccagcgacatcgccgtggagtgggagagcaatgggcagccggagaacaactacaagaccacgcctcccgtgctggactccgacggctccttcttcctctacagcaagctcaccgtggacaagagcaggtggcagcaggggaacgtcttctcatgctccgtgatgcatgaggctctgcacaaccactacacgcagaagagcctctccctgtctccgggtaaa-
tgcctgtccttcggcaccgagatcctgaccgtggagtacggccctctgcctatcggcaagatcgtgtccgaagagatcaactgctccgtgtactccgtggaccctgagggccgggtgtatactcaggccatcgcccagtggcacgaccggggcgagcaggaggtgctggagtacgagctggaggacggctccgtgatccgggccacctccgaccaccggtttctgaccaccgactatcagctgctggccatcgaggagatcttcgcccggcagctggacctgctgaccctggagaacatcaagcagaccgaggaggccctggacaaccaccggctgcctttccctctgctggacgccggcaccatcaagatggtgaaggtgatcggcaggcggtccctgggcgtgcagcggatcttcgacatcggcctgcctcaggaccacaactttctgctggccaacggcgccatcgccgccaac-
atggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgcgacatccagatgacccagtctccatcctccctgtctgcatctgtaggggacagagtcaccatcacttgtcgggcaagtcagggcatcagaaattacttagcctggtatcagcaaaaaccagggaaagcccctaagctcctgatctatgctgcatccactttgcaatcaggggtcccatctcggttcagtggcagtggatctgggacagatttcactctcaccatcagcagcctacagcctgaagatgttgcaacttattactgtcaaaggtataaccgtgcaccgtatacttttggccaggggaccaaggtggaaatcaaacgtacggtggctgcaccatctgtcttcatcttcccgccatctgatgag cagttgaaatctggaactgcctctgttgtgtgcctgctgaataacttctatcccagagaggccaaagtacagtggaaggtggataacgccctccaatcgggtaactcccaggagagtgtcacagagcaggacagcaaggacagcacctacagcctcagcagcaccctgacgctgagcaaagcagactacgagaaacacaaagtctacgcctgcgaagtcacccatcagggcctgagctcgcccgtcacaaagagcttcaacaggggagagtgt-3’
pTT3载体-重链-蛋白内含子-轻链
在以下的构建体中,与以上构建体的唯一差异是包括集胞藻株PCC6803天然的蛋白外显子序列(以蓝色显示)。所示的序列从D2E7重链编码片段的末端(以红色显示的最后9个碱基对)至D2E7轻链编码片段的5’端(以粉色显示的头9个碱基对)。
表25.pTT3-HC-Ssp-GA-int-LC-1aa,编码序列的相关部分(SEQ IDNO:136)
Ccgggtaaa-tatt-
gcctgtccttcggcaccgagatcctgaccgtggagtacggccctctgcctatcggcaagatcgtgtccgaagagatcaactgctccgtgtactccgtggaccctgagggccgggtgtatactcaggccatcgcccagtggcacgaccggggcgagcaggaggtgctggagtacgagctggaggacggctccgtgatccgggccacctccgaccaccggtttctgaccaccgactatcagctgctggccatcgaggagatcttcgcccggcagctggacctgctgaccctggagaacatcaagcagaccgaggaggccctggacaaccaccggctgcctttccctctgctggacgccggcaccatcaagatggtgaaggtgatcggcaggcggtccctgggcgtgcagcggatcttcgacatcggcctgcctcaggaccacaactttctgctggccaacggcgccatcgccgccaac-tgt-atggacatg
pTT3载体-重链-蛋白内含子-轻链
表26.pTT3-HC-Ssp-GA-int-LC-3aa-编码序列的相关部分(SEQID NO:137)
Ccgggtaaa-gccgagtatt-
gcctgtccttcggcaccgagatcctgaccgtggagtacggccctctgcctatcggcaagatcgtgtccgaagagatcaactgctccgtgtactccgtggaccctgagggccgggtgtatactcaggccatcgcccagtggcacgaccggggcgagcaggaggtgctggagtacgagctggaggacggctccgtgatccgggccacctccgaccaccggtttctgaccaccgactatcagctgctggccatcgaggagatcttcgcccggcagctggacctgctgaccctggagaacatcaagcagaccgaggaggccctggacaaccaccggctgcctttccctctgctggacgccggcaccatcaagatggtgaaggtgatcggcaggcggtccctgggcgtgcagcggatcttcgacatcggcctgcctcaggaccacaactttctgctggccaacggcgccatcgccgccaac-tgtttcaac-atggacatg
pTT3载体-重链-蛋白内含子-轻链
此外,表8A-8C提供了D2E7蛋白内含子融合蛋白,表达载体的相关序列和使用突变的(丝氨酸至苏氨酸)Pyrococcus Ssp.GBD Pol蛋白内含子的编码序列。
表8A.D2E7蛋白内含子融合蛋白的编码序列(SEQ ID NO:48)
ATGGAGTTTGGGCTGAGCTGGCTTTTTCTTGTCGCGATTTTAAAAGGTGTCCAGTGTGAGGTGCAGCTGGTGGAGTCTGGGGGAGGCTTGGTACAGCCCGGCAGGTCCCTGAGACTCTCCTGTGCGGCCTCTGGATTCACCTTTGATGATTATGCCATGCACTGGGTCCGGCAAGCTCCAGGGAAGGGCCTGGAATGGGTCTCAGCTATCACTTGGAATAGTGGTCACATAGACTATGCGGACTCTGTGGAGGGCCGATTCACCATCTCCAGAGACAACGCCAAGAACTCCCTGTATCTGCAAATGAACAGTCTGAGAGCTGAGGATACGGCCGTATATTACTGTGCGAAAGTCTCGTACCTTAGCACCGCGTCCTCCCTTGACTATTGGGGCCAAGGTACCCTGGTCACCGTCTCGAGTGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCCAGACCTACATCTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGATGAGCTGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAAACCATTTTACCGGAAGAATGGGTTCCACTAATTAAAAACGGTAAAGTTAAGATATTCCGCATTGGGGACTTCGTTGATGGACTTATGAAGGCGAACCAAGGAAAAGTGAAGAAAACGGGGGATACAGAAGTTTTAGAAGTTGCAGGAATTCATGCGTTTTCCTTTGACAGGAAGTCCAAGAAGGCCCGTGTAATGGCAGTGAAAGCCGTGATAAGACACCGTTATTCCGGAAATGTTTATAGAATAGTCTTAAACTCTGGTAGAAAAATAACAATAACAGAAGGGCATAGCCTATTTGTCTATAGGAACGGGGATCTCGTTGAGGCAACTGGGGAGGATGTCAAAATTGGGGATCTTCTTGCAGTTCCAAGATCAGTAAACCTACCAGAGAAAAGGGAACGCTTGAATATTGTTGAACTTCTTCTGAATCTCTCACCGGAAGAGACAGAAGATATAATACTTACGATTCCAGTTAAAGGCAGAAAGAACTTCTTCAAGGGAATGTTGAGAACATTACGTTGGATTTTTGGTGAGGAAAAGAGAGTAAGGACAGCGAGCCGCTATCTAAGACACCTTGAAAATCTCGGATACATAAGGTTGAGGAAAATTGGATACGACATCATTGATAAGGAGGGGCTTGAGAAATATAGAACGTTGTACGAGAAACTTGTTGATGTTGTCCGCTATAATGGCAACAAGAGAGAGTATTTAGTTGAATTTAATGCTGTCCGGGACGTTATCTCACTAATGCCAGAGGAAGAACTGAAGGAATGGCGTATTGGAACTAGAAATGGATTCAGAATGGGTACGTTCGTAGATATTGATGAAGATTTTGCCAAGCTTGGATACGATAGCGGAGTCTACAGGGTTTATGTAAACGAGGAACTTAAGTTTACGGAATACAGAAAGAAAAAGAATGTATATCACTCTCACATTGTTCCAAAGGATATTCTCAAAGAAACTTTTGGTAAGGTCTTCCAGAAAAATATAAGTTACAAGAAATTTAGAGAGCTTGTAGAAAATGGAAAACTTGACAGGGAGAAAGCCAAACGCATTGAGTGGTTACTTAACGGAGATATAGTCCTAGATAGAGTCGTAGAGATTAAGAGAGAGTACTATGATGGTTACGTTTACGATCTAAGTGTCGATGAAGATGAGAATTTCCTTGCTGGCTTTGGATTCCTCTATGCAGATAATGACATCCAGATGACCCAGTCTCCATCCTCCCTGTCTGCATCTGTAGGGGACAGAGTCACCATCACTTGTCGGGCAAGTCAGGGCATCAGAAATTACTTAGCCTGGTATCAGCAAAAACCAGGGAAAGCCCCTAAGCTCCTGATCTATGCTGCATCCACTTTGCAATCAGGGGTCCCATCTCGGTTCAGTGGCAGTGGATCTGGGACAGATTTTCACTCTCACCATCAGCAGCCTACAGCCTGAAGATGTTGCAACTTATTACTGTCAAAGGTATAACCGTGCACCGTATACTTTTGGCCAGGGGACCAAGGTGGAAATCAAACGTACGGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAGAGTGTTGA
表8B.D2E7蛋白内含子融合构建体的氨基酸序列(SEQ ID NO:49)
MEFGLSWLFLVAILKGVQCEVQLVESGGGLVQPGRSLRLSCAASGFTFDDYAMHWVRQAPGKGLEWVSAITWNSGHIDYADSVEGRFTISRDNAKNSLYLQMNSLRAEDTAVYYCAKVSYLSTASSLDYWGQGTLVTVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTGGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPKSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGKTILPEEWVPLIKNGKVKIFRIGDFVDGLMKANQGKVKKTGDTEVLEVAGIHAFSFDRKSKKARVMAVKAVIRHRYSGNVYRIVLNSGRKITITEGHSLFVYRNGDLVEATGEDVKIGDLLAVPRSVNLPEKRERLNIVELLLNLSPEETEDIILTIPVKGRKNFFKGMLRTLRWIFGEEKRVRTASRYLRHLENLGYIRLRKIGYDIIDKEGLEKYRTLYEKLVDWRYNGNKREYLVEFNAVRDVISLMPEEELKEWRIGTRNGFRMGTFVDIDEDFAKLGYDSGVYRVYVNEELKFTEYRKKKNVYHSHIVPKDILKETFGKVFQKNISYKKFRELVENGKLDREKAKRIEWLLNGDIVLDRVVEIKREYYDGYVYDLSVDEDENFLAGFGFLYAHNDIQMTQSPSSLSASVGDRVTITCRASQGIRNYLAWYQQKPGKAPKLLIYAASTLQSGVPSRFSGSGSGTDFTLTISSLQPEDVATYYCQRYNRAPYTFGQGTKVEIKFITVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGEC*
表8C.用于D2E7蛋白内含子融合构建体的表达载体的完整核苷酸序列(SEQ ID NO:50)
GAAGTTCCTATTCCGAAGTTCCTATTCTCTAGACGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCAATGACGCAAATGGGCAGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCCCGGGCGCCACCATGGAGTTTGGGCTGAGCTGGCTTTTTCTTGTCGCGATTTTAAAAGGTGTCCAGTGTGAGGTGCAGCTGGTGGAGTCTGGGGGAGGCTTGGTACAGCCCGGCAGGTCCCTGAGACTCTCCTGTGCGGCCTCTGGATTCACCTTTGATGATTATGCCATGCACTGGGTCCGGCAAGCTCCAGGGAAGGGCCTGGAATGGGTCTCAGCTATCACTTGGAATAGTGGTCACATAGACTATGCGGACTCTGTGGAGGGCCGATTCACCATCTCCAGAGACAACGCCAAGAACTCCCTGTATCTGCAAATGAACAGTCTGAGAGCTGAGGATACGGCCGTATATTACTGTGCGAAAGTCTCGTACCTTAGCACCGCGTCCTCCCTTGACTATTGGGGCCAAGGTACCCTGGTCACCGTCTCGAGTGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCCAGACCTACATCTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGATGAGCTGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAAACCATTTTACCGGAAGAATGGGTTCCACTAATTAAAAACGGTAAAGTTAAGATATTCCGCATTGGGGACTTCGTTGATGGACTTATGAAGGCGAACCAAGGAAAAGTGAAGAAAACGGGGGATACAGAAGTTTTAGAAGTTGCAGGAATTCATGCGTTTTCCTTTGACAGGAAGTCCAAGAAGGCCCGTGTAATGGCAGTGAAAGCCGTGATAAGACACCGTTATTCCGGAAATGTTTATAGAATAGTCTTAAACTCTGGTAGAAAAATAACAATAACAGAAGGGCATAGCCTATTTGTCTATAGGAACGGGGATCTCGTTGAGGCAACTGGGGAGGATGTCAAAATTGGGGATCTTCTTGCAGTTCCAAGATCAGTAAACCTACCAGAGAAAAGGGAACGCTTGAATATTGTTGAACTTCTTCTGAATCTCTCACCGGAAGAGACAGAAGATATAATACTTACGATTCCAGTTAAAGGCAGAAAGAACTTCTTCAAGGGAATGTTGAGAACATTACGTTGGATTTTTGGTGAGGAAAAGAGAGTAAGGACAGCGAGCCGCTATCTAAGACACCTTGAAAATCTCGGATACATAAGGTTGAGGAAAATTGGATACGACATCATTGATAAGGAGGGGCTTGAGAAATATAGAACGTTGTACGAGAAACTTGTTGATGTTGTCCGCTATAATGGCAACAAGAGAGAGTATTTAGTTGAATTTAATGCTGTCCGGGACGTTATCTCACTAATGCCAGAGGAAGAACTGAAGGAATGGCGTATTGGAACTAGAAATGGATTCAGAATGGGTACGTTCGTAGATATTGATGAAGATTTTGCCAAGCTTGGATACGATAGCGGAGTCTACAGGGTTTATGTAAACGAGGAACTTAAGTTTACGGAATACAGAAAGAAAAAGAATGTATATCACTCTCACATTGTTCCAAAGGATATTCTCAAAGAAACTTTTGGTAAGGTCTTCCAGAAAAATATAAGTTACAAGAAATTTAGAGAGCTTGTAGAAAATGGAAAACTTGACAGGGAGAAAGCCAAACGCATTGAGTGGTTACTTAACGGAGATATAGTCCTAGATAGAGTCGTAGAGATTAAGAGAGAGTACTATGATGGTTACGTTTACGATCTAAGTGTCGATGAAGATGAGAATTTCCTTGCTGGCTTTGGATTCCTCTATGCACATAATGACATCCAGATGACCCAGTCTCCATCCTCCCTGTCTGCATCTGTAGGGGACAGAGTCACCATCACTTGTCGGGCAAGTCAGGGCATCAGAAATTACTTAGCCTGGTATCAGCAAAAACCAGGGAAAGCCCCTAAGCTCCTGATCTATGCTGCATCCACTTTGCAATCAGGGGTCCCATCTCGGTTCAGTGGCAGTGGATCTGGGACAGATTTCACTCTCACCATCAGCAGCCTACAGCCTGAAGATGTTGCAACTTATTACTGTCAAAGGTATAACCGTGCACCGTATACTTTTGGCCAGGGGACCAAGGTGGAAATCAAACGTACGGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAGAGTGTTGAGCGGCCGCGTTTAAACTGAATGAGCGCGTCCATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTAAAGCAAGTAAAACCTCTACAAATGTGGTATGGCTGATTATGATCCGGCTGCCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCGGTCGACGGCGCGCCTTTTTTTTTAATTTTTATTTTATTTTATTTTTGACGCGCCGAAGGCGCGATCTGAGCTCGGTACAGCTTGGCTGTGGAATGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTCCTCGAGGAACTGAAAAACCAGAAAGTTAACTGGTAAGTTTAGTCTTTTTGTCTTTTATTTCAGGTCCCGGATCCGGTGGTGGTGCAAATCAAAGAACTGCTCCTCAGTGGATGTTGCCTTTACTTCTAGGCCTGTACGGAAGTGTTACTTCTGCTCTAAAAGCTGCGGAATTGTACCCGCGGCCTAATACGACTCACTATAGGGACTAGTATGGTTCGACCATTGAACTGCATCGTCGCCGTGTCCCAAAATATGGGGATTGGCAAGAACGGAGACCTACCCTGGCCTCCGCTCAGGAACGAGTTCAAGTACTTCCAAAGAATGACCACAACCTCTTCAGTGGAAGGTAAACAGAATCTGGTGATTATGGGTAGGAAAACCTGGTTCTCCATTCCTGAGAAGAATCGACCTTTAAAGGACAGAATTAATATAGTTCTCAGTAGAGAACTCAAAGAACCACCACGAGGAGCTCATTTTCTTGCCAAAAGTTTAGATGATGCCTTAAGACTTATTGAACAACCGGAATTGGCAAGTAAAGTAGACATGGTTTGGATAGTCGGAGGCAGTTCTGTTTACCAGGAAGCCATGAATCAACCAGGCCACCTCAGACTCTTTGTGACAAGGATCATGCAGGAATTTGAAAGTGACACGTTTTTCCCAGAAATTGATTTGGGGAAATATAAACTTCTCCCAGAATACCCAGGCGTCCTCTCTGAGGTCCAGGAGGAAAAAGGCATCAAGTATAAGTTTGAAGTCTACGAGAAGAAAGACTAAGCGGCCGAGCGCGCGGATCTGGAAACGGGAGATGGGGGAGGCTAACTGAAGCACGGAAGGAGACAATACCGGAAGGAACCCGCGCTATGACGGCAATAAAAAGACAGAATAAAACGCACGGGTGTTGGGTCGTTTGTTCATAAACGCGGGGTTCGGTCCCAGGGCTGGCACTCTGTCGATACCCCACCGAGACCCCATTGGGGCCAATACGCCCGCGTTTCTTCCTTTTCCCCACCCCACCCCCCAAGTTCGGGTGAAGGCCCAGGGCTCGCAGCCAACGTCGGGGCGGCAGGCCCTGCCATAGCCACTGGCCCCGTGGGTTAGGGACGGGGTCCCCCATGGGGAATGGTTTATGGTTCGTGGGGGTTATTATTTTGGGCGTTGCGTGGGGTCTGGAGATCCCCCGGGCTGCAGGAATTCCGTTACATTACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAAAGGGCGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCGGGCGCCACCGCGGCCGCGGGGATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTCGGATCCTCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAAAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTCTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCCTTTTAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCAACGCTATTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTTACGACGTTGTAAAACGACGGCCAGTGAATT
表9.具有有限的侧翼序列信息的天然Psp-GBD Pol蛋白内含子序列的氨基酸序列(NCBI登录号No.AAA67132.1)(SEQ ID NO:51)
N/SILPEEWVPLIKNGKVKIFRIGDFVDGLMKANQGKVKKTGDTEVLEVAGIHAFSFDRKSKKARVMAVKAVIRHRYSGNVYRIVLNSGRKITITEGHSLFVYRNGDLVEATGEDVKIGDLLAVPRSVNLPEKRERLNIVELLLNLSPEETEDIILTIPVKGRKNFFKGMLRTLRWIFGEEKRVRTASRYLRHLENLGYIRLRKIGYDIIDKEGLEKYRTLYEKLVDVVRYNGNKREYLVEFNAVRDVISLMPEEELKEWRIGTRNGFRMGTFVDIDEDFAKLLGYYVSEGSARKWKNQTGGWSYTVRLYNENDEVLDDMEHLAKKFFGKVKRGKNYVEIPKKMAYIIFESLCGTLAENKRVPEVIFTSSKGVRWAFLEGYFIGDGDVHPSKRVRLSTKSELLVNGLVLLLNSLGVSAIKLGYDSGVYRVYVNEELKFTEYRKKKNVYHSHIVPKDILKETFGKVFQKNISYKKFRELVENGKLDREKAKRIEWLLNGDIVLDRVVEIKREYYDGYVYDLSVDEDENFLAGFGFLYAHN/SYYGYYGYA
/表示剪接连接,下划线的氨基酸表示蛋白内含子序列,剩余的表示蛋白外显子序列信息。
实施例2.免疫球蛋白多蛋白序列和具有黑腹果蝇Hedgehog自体加工结构域,C17和C25序列的载体的构建
有效表达抗体分子的再一策略是多蛋白表达,其中Hedgehog结构域位于重链和轻链之间,具有Hedgehog结构域序列和/或连接序列的修饰,使得存在组成蛋白的释放而没有胆固醇添加至N-端蛋白质。在这样的构建体内,存在每个相关重链和轻链的一个拷贝,或轻链可以加倍来提供至少两个轻链,或存在重链和轻链的多个拷贝,只要提供功能性裂解序列来促进多蛋白内每个免疫球蛋白衍生的蛋白质的分离。可以多次使用特定裂解位点策略(例如,Hedgehog结构域),或多个裂解位点各自可以是独立的。因此,可以相对于免疫球蛋白或免疫球蛋白衍生的蛋白质的至少一个末端来安置不同的蛋白酶解加工序列。
以下寡核苷酸用于黑腹果蝇Hedgehog C-端自体加工结构域(Hh-C),序列Hh-C17,Hh-C17截断(和具有突变的一个)和Hh-C25(GenBank登录号#L02793.1)的扩增,使用基因组DNA作为模板和Platinum Taq Hi Fidelity PCR Supermix(Invitrogen)。从DrosophilaD.Mel-2细胞的冷冻管(Invitrogen,cat.#10831-014)制备基因组DNA。
C17-5’:TGCTTCACGCCGGAGAGCAC(SEQ ID NO:141)
C17-full-3’ATTATGGACGACAACCTGGTTGGCAA(SEQ ID NO:142)
C25-actual-3’:ATCGTGGCGCCAGCTCTGCG(SEQ ID NO:143)
C17-3’:GCAACTGGCGGCCACCGAGT(SEQ ID NO:144)
C17-scya-3’:CGCATAGCAACTGGCGGCCA(SEQ ID NO:145)
C17-sc/hn-3’:GTTGTGGGCGGCCACCGAGT(SEQ ID NO:146)
根据以下程序运行PCR:
步骤 1 2 3 4 5 6 7 8
温度 94℃ 94℃ 55℃ 68℃ 转到步骤2(34次) 68℃ 4℃ 结束
时间 2min 1min 1min 2.5min 5min 保持
设计寡核苷酸引物来产生D2E7重链-Hh-C-D2E7轻链的融合体,通过同源重组至大肠杆菌中的pTT3-HcintLC p.horikoshii构建体中。通过工程化PCR产生的载体(含有pTT3载体,重链和轻链片段但没有极端嗜热古菌蛋白内含子)和Hh-C结构域插入片段之间的40个碱基对悬垂物,将两个DNA片段混合并转化至大肠杆菌中,没有连接的益处,导致两个片段大肠杆菌同源重组至pTT3-HC-Hh-C-LC中(以各种形式作为最初PCR产物指示)。
Hh-C结构域同源重组引物:
C17-HR5’:
CCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAATGCTTCACGCCGGAGAGCAC(SEQ ID NO:147)
C17-full-HR-3’:
GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATGCACTGGCTGTTGATCACCG(SEQ ID NO:148)
C25-actual-HR-3’:
GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATATCGTGGCGCCAGCTCTGCG(SEQ ID NO:149)
C17-HR3’:
GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATGCAACTGGCGGCCACCGAGT(SEQ ID NO:150)
C17-scya-HR-3’:
GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATCGCATAGCAACTGGCGGCCA(SEQ ID NO:151)
C17-sc/hn-HR-3’:
GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATGTTGTGGGCGGCCACCGAGT(SEQ ID NO:152)
pTT3-HcintLC同源重组引物:
pTT3int-HR5’:
ATGGACATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGC(SEQ IDNO:153)
pTT3int-HR3’:
TTTACCCGGAGACAGGGAGAGGCTCTTCTGCGTGTAGTGGT(SEQ IDNO:154)
根据以下程序运行Hh-C结构域的PCR:使用Pfu-I Hi Fidelity DNA聚合酶(Stratagene)。
步骤 1 2 3 4 5 6 7 8
温度 94℃ 94℃ 60℃ 72℃ 转到步骤2(34次) 72℃ 4℃ 结束
时间 2min 1min 1min 1.5min 5min 保持
根据以下程序运行载体的PCR:使用Platinum Taq Hi FidelitySupermix(Invitrogen)。
步骤 1 2 3 4 5 6 7 8
温度 94℃ 94℃ 60℃ 68℃ 转到步骤2(34次) 68℃ 4℃ 结束
时间 2min 30sec 30sec 10min 5min 保持
为了获得Hh-C结构域同源克隆至pTT3-HcintLC中,使用以下的策略。将PCR产物凝胶纯化并将每个稀释至50μl稀释缓冲液中(Qiaquick凝胶提取试剂盒,Qiagen)。将3μl载体PCR产物和3μl所需的Hint结构域PCR产物(各种形式)在Eppendorf管中混合。将PCR扩增产物转化至大肠杆菌中并置于LB+氨苄青霉素平板上,在37℃培养过夜,并将克隆生长至2ml培养物,使用Wizard prep试剂盒(Promega)提取质粒DNA,并通过限制性核酸内切酶消化和琼脂糖凝胶电泳来分析DNA样品。对于DNA序列分析产生正确限制模式的克隆,来证实已经产生所需的序列。
使用黑腹果蝇Hedgehog C-末端自体加工结构域设计了五个用于D2E7重链-Hh-C-D2E7轻链表达的表达构建体:pTT3-HC-Hh-C17-LC;pTT3-HC-Hh-C 17-SC-LC ;pTT3-HC-Hh-C17-NH-LC;和pTT3-HC-Hh-C25-LC。
表27.完整质粒pTT3-D2E7重链-Hh-C17-D2E7轻链的序列(SEQID NO:155)
5′-
gcggccgctcgaggccggcaaggccggatcccccgacctcgacctctggctaataaaggaaatttattttcattgcaatagtgtgttggaattttttgtgtctctcactcggaaggacatatgggagggcaaatcatttggtcgagatccctcggagatctctagctagaggatcgatccccgccccggacgaactaaacctgactacgacatctctgccccttcttcgcggggcagtgcatgtaatcccttcagttggttggtacaacttgccaactgggccctgttccacatgtgacacggggggggaccaaacacaaaggggttctctgactgtagttgacatccttataaatggatgtgcacatttgccaacactgagtggctttcatcctggagcagactttgcagtctgtggactgcaacacaacattgcctttatgtgtaactcttggctgaagctcttacaccaatgctgggggacatgtacctcccaggggcccaggaagactacgggaggctacaccaacgtcaatcagaggggcctgtgtagctaccgataagcggaccctcaagagggcattagcaatagtgtttataaggcccccttgttaaccctaaacgggtagcatatgcttcccgggtagtagtatatactatccagactaaccctaattcaatagcatatgttacccaacgggaagcatatgctatcgaattagggttagtaaaagggtcctaaggaacagcgatatctcccaccccatgagctgtcacggttttatttacatggggtcaggattccacgagggtagtgaaccattttagtcacaagggcagtggctgaagatcaaggagcgggcagtgaactctcctgaatcttcgcctgcttcttcattctccttcgtttagctaatagaataactgctgagttgtgaacagtaaggtgtatgtgaggtgctcgaaaacaaggtttcaggtgacgcccccagaataaaatttggacggggggttcagtggtggcattgtgctatgacaccaatataaccctcacaaaccccttgggcaataaatactagtgtaggaatgaaacattctgaatatctttaacaatagaaatccatggggtggggacaagccgtaaagactggatgtccatctcacacgaatttatggctatgggcaacacataatcctagtgcaatatgatactggggttattaagatgtgtcccaggcagggaccaagacaggtgaaccatgttgttacactctatttgtaacaaggggaaagagagtggacgccgacagcagcggactccactggttgtctctaacacccccgaaaattaaacggggctccacgccaatggggcccataaacaaagacaagtggccactcttttttttgaaattgtggagtgggggcacgcgtcagcccccacacgccgccctgcggttttggactgtaaaataagggtgtaataacttggctgattgtaaccccgctaaccactgcggtcaaaccacttgcccacaaaaccactaatggcaccccggggaatacctgcataagtaggtgggcgggccaagataggggcgcgattgctgcgatctggaggacaaattacacacacttgcgcctgagcgccaagcacagggttgttggtcctcatattcacgaggtcgctgagagcacggtgggctaatgttgccatgggtagcatatactacccaaatatctggatagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctaatagagattagggtagtatatgctatcctaatttatatctgggtagcatatactacccaaatatctggatagcatatgctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctcatgataagctgtcaaacatgagaattttcttgaagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtgttgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgcagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgttcttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgccaagctctagctagaggtcgaccaattctcatgtttgacagcttatcatcgcagatccgggcaacgttgttgccattgctgcaggcgcagaactggtaggtatggaagatctatacattgaatcaatattggcaattagccatattagtcattggttatatagcataaatcaatattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattggctcatgtccaatatgaccgccatgttgacattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacaccaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaataaccccgccccgttgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcgtttagtgaaccgtcagatcctcactctcttccgcatcgctgtctgcgagggccagctgttgggctcgcggttgaggacaaactcttcgcggtctttccagtactcttggatcggaaacccgtcggcctccgaacggtactccgccaccgagggacctgagcgagtccgcatcgaccggatcggaaaacctctcgagaaaggcgtctaaccagtcacagtcgcaaggtaggctgagcaccgtggcgggcggcagcgggtggcggtcggggttgtttctggcggaggtgctgctgatgatgtaattaaagtaggcggtcttgagacggcggatggtcgaggtgaggtgtggcaggcttgagatccagctgttggggtgagtactccctctcaaaagcgggcattacttctgcgctaagattgtcagtttccaaaaacgaggaggatttgatattcacctggcccgatctggccatacacttgagtgacaatgacatccactttgcctttctctccacaggtgtccactcccaggtccaagtttgggcgccaccatggagtttgggctgagctggctttttcttgtcgcgattttaaaaggtgtccagtgt-
gaggtgcagctggtggagtctgggggaggcttggtacagcccggcaggtccctgagactctcctgtgcggcctctggattcacctttgatgattatgccatgcactgggtccggcaagctccagggaagggcctggaatgggtctcagctatcacttggaatagtggtcacatagactatgcggactctgtggagggccgattcaccatctccagagacaacgccaagaactccctgtatctgcaaatgaacagtctgagagctgaggatacggccgtatattactgtgcgaaagtctcgtaccttagcaccgcgtcctcccttgactattggggccaaggtaccctggtcaccgtctcgagtgcgtcgaccaagggcccatcggtcttccccctggcaccctcctccaagagcacctctgggggcacagcggccctgggctgcctggtcaaggactacttccccgaaccggtgacggtgtcgtggaactcaggcgccctgaccagcggcgtgcacaccttcccggctgtcctacagtcctcaggactctactccctcagcagcgtggtgaccgtgccctccagcagcttgggcacccagacctacatctgcaacgtgaatcacaagcccagcaacaccaaggtggacaagaaagttgagcccaaatcttgtgacaaaactcacacatgcccaccgtgcccagcacctgaactcctggggggaccgtcagtcttcctcttccccccaaaacccaaggacaccctcatgatctcccggacccctgaggtcacatgcgtggtggtggacgtgagccacgaagaccctgaggtcaagttcaactggtacgtggacggcgtggaggtgcataatgccaagacaaagccgcgggaggagcagtacaacagcacgtaccgtgtggtcagcgtcctcaccgtcctgcaccaggactggctgaatggcaaggagtacaagtgcaaggtctccaacaaagccctcccagcccccatcgagaaaaccatctccaaagccaaagggcagccccgagaaccacaggtgtacaccctgcccccatcccgggatgagctgaccaagaaccaggtcagcctgacctgcctggtcaaaggcttctatcccagcgacatcgccgtggagtgggagagcaatgggcagccggagaacaactacaagaccacgcctcccgtgctggactccgacggctccttcttcctctacagcaagctcaccgtggacaagagcaggtggcagcaggggaacgtcttctcatgctccgtgatgcatgaggctctgcacaaccactacacgcagaagagcctctccctgtctccgggtaaa-
tgcttcacgccggagagcacagcgctgctggagagtggagtccggaagccgctcggcgagctctctatcggagatcgtgttttgagcatgaccgccaacggacaggccgtctacagcgaagtgatcctcttcatggaccgcaacctcgagcagatgcaaaactttgtgcagctgcacacggacggtggagcagtgctcacggtgacgccggctcacctggttagcgtttggcagccggagagccagaagctcacgtttgtgtttgcggatcgcatcgaggagaagaaccaggtgctcgtacgggatgtggagacgggcgagctgaggccccagcgagtcgtcaaggtgggcagtgtgcgcagtaagggcgtggtcgcgccgctgacccgcgagggcaccattgtggtcaactcggtggccgccagttgctatgcggtgatcaacagccagtcg-
atggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgcgacatccagatgacccagtctccatcctccctgtctgcatctgtaggggacagagtcaccatcacttgtcgggcaagtcagggcatcagaaattacttagcctggtatcagcaaaaaccagggaaagcccctaagctcctgatctatgctgcatccactttgcaatcaggggtcccatctcggttcagtggcagtggatctgggacagatttcactctcaccatcagcagcctacagcctgaagatgttgcaacttattactgtcaaaggtataaccgtgcaccgtatacttttggccaggggaccaaggtggaaatcaaacgtacggtggctgcaccatctgtcttcatcttcccgccatctgatgagcagttgaaatctggaactgcctctgttgtgtgcctgctgaataacttctatcccagagaggccaaagtacagtggaaggtggataacgccctccaatcgggtaactcccaggagagtgtcacagagcaggacagcaaggacagcacctacagcctcagcagcaccctgacgctgagcaaagcagactacgagaaacacaaagtctacgcctgcgaagtcacccatcaggggcctgagctcgcccgtcacaaagagcttcaacaggggagagtgt-3’
pTT3载体-重链-Hh-C17-轻链
在以下的构建体中,与以上构建体的唯一差异是C17片段的截断,结果是除去了胆固醇转移的活性。所示的序列从D2E7重链编码片段的末端(HC编码序列的最后9个碱基对,表的第一行)至D2E7轻链编码片段的5’端(LC编码序列的头9个碱基对,表的最后一行)。
表28.质粒pTT3-HC-C17-sc-LC的部分编码序列(SEQ ID NO:156)
Ccgggtaaa-
tgcttcacgccggagagcacagcgctgctggagagtggagtccggaagccgctcggcgagctctctatcggagatcgtgttttgagcatgaccgccaacggacaggccgtctacagcgaagtgatcctcttcatggaccgcaacctcgagcagatgcaaaactttgtgcagctgcacacggacggtggagcagtgctcacggtgacgccggctcacctggttagcgtttggcagccggagagccagaagctcacgtttgtgtttgcggatcgcatcgaggagaagaaccaggtgctcgtacgggatgtggagacgggcgagctgaggccccagcgagtcgtcaaggtgggcagtgtgcgcagtaagggcgtggtcgcgccgctgacccgcgagggcaccattgtggtcaactcggtggccgccagttgc-atggacatg
重链3’序列-Hh-C17-轻链5’序列
在以下的构建体中,与以上构建体pTT3-HC-C17-sc-LC的唯一差异是hedgehog C17片段中最后两个氨基酸的突变,从SC突变至HN(下划线的)。所示的序列从D2E7重链编码片段的末端(HC编码序列的最后9个碱基对,表的第一行)至D2E7轻链编码片段的5’端(表的最后一行)。
表29.质粒pTT3-HC-C17-hn-LC的部分编码序列(SEQ ID NO:157)
ccgggtaaa-
tgcttcacgccggagagcacagcgctgctggagagtggagtccggaagccgctcggcgagctctctatcggagatcgtgttttgagcatgaccgccaacggacaggccgtctacagcgaagtgatcctcttcatggaccgcaacctcgagcagatgcaaaactttgtgcagctgcacacggacggtggagcagtgctcacggtgacgccggctcacctggttagcgtttggcagccggagagccagaagctcacgtttgtgtttgcggatcgcatcgaggagaagaaccaggtgctcgtacgggatgtggagacgggcgagctgaggccccagcgagtcgtcaaggtgggcagtgtgcgcagtaagggcgtggtcgcgccgctgacccgcgagggcaccattgtggtcaactcggtggccgcccacaac-atggacatg
重链3’序列-Hh-C17-突变-轻链5’序列
在以下的构建体中,使用Hint结构域的全部C25片段,而不是C17。所示的序列从D2E7重链编码片段的末端(HC编码序列的最后9个碱基对,表的第一行)至D2E7轻链编码片段的5’端(LC编码序列的头9个碱基对,表的最后一行)。
表29B.pTT3-HC-C25-Hint-LC的部分编码序列(SEQ ID NO:158)
ccgggtaaa-
tgcttcacgccggagagcacagcgctgctggagagtggagtccggaagccgctcggcgagctctctatcggagatcgtgttttgagcatgaccgccaacggacaggccgtctacagcgaagtgatcctcttcatggaccgcaacctcgagcagatgcaaaactttgtgcagctgcacacggacggtggagcagtgctcacggtgacgccggctcacctggttagcgtttggcagccggagagccagaagctcacgtttgtgtttgcggatcgcatcgaggagaagaaccaggtgctcgtacgggatgtggagacgggcgagctgaggccccagcgagtcgtcaaggtgggcagtgtgcgcagtaagggcgtggtcgcgccgctgacccgcgagggcaccattgtggtcaactcggtggccgccagttgctatgcggtgatcaacagccagtcgctggcccactggggactggctcccatgcgcctgctgtccacgctggaggcgtggctgcccgccaaggagcagttgcacagttcgccgaaggtggtgagctcggcgcagcagcagaatggcatccattggtatgccaatgcgctctacaaggtcaaggactacgttctgccgcagagctggcgccacgat-
atggacatg
[重链3’序列-Hh-C25结构域-轻链5’序列]
(SEQ ID NO:140)
Hh-C25的氨基酸序列和相关的构建体(向下的箭头表示裂解位点;↓:Hh-C17↓:Hh-C17sc):
cttpestallesgvrkplgelsigdrvlsmtangqavyseviltmdrnleqmqntvqlhtdggavltvtpahlvsvwqpesqklttvtadrieeknqvlvrdvetgelrpqrvvkvgsvrskgvvapltregtivvnsvaasc↓yavinsqs↓lahwglapmrllstleawlpakeqlhsspkvvssaqqqngihwyanalykvkdyvlpqswrhd
实施例3.使用用于蛋白酶解加工的TEV识别序列的抗体表达
产生构建体和表达载体来指导肿瘤坏死因子-α,白细胞介素-12,白细胞介素-18和促红细胞生成素受体特异性抗体的表达,在包括目标抗体的免疫球蛋白重链和轻链序列片段之间具有TEV识别序列。优选,构建体包括表达载体,该表达载体包括腺病毒主要晚期启动子和指导目标抗体重链转录的巨细胞病毒增强子,在其之前为框内前导序列。将重链编码序列连接框内弗林蛋白酶裂解位点和TEV识别序列(E-P-V-Y-F-Q-G),之后为核定位片段删除的TEV蛋白酶的编码序列(Ceriani等(1998)Plant Molec Biol.36:239),之后为第二个TEV识别序列。将第二个TEV识别序列框内连接用于抗体轻链的前导序列,该前导序列连接用于目标抗体轻链的编码片段和终止密码子。编码片段之后为多腺苷酸化信号。下文中提供了相关的序列。
表1.D2E7(Humira/adalimumab)TEV表达载体完整的DNA序列(SEQ ID NO:44)
GAAGTTCCTATTCCGAAGTTCCTATTCTCTAGACGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCAATGACGCAAATGGGCAGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCCCGGGCGCCACCATGGAGTTTGGGCTGAGCTGGCTTTTTCTTGTCGCGATTTTAAAAGGTGTCCAGTGTGAGGTGCAGCTGGTGGAGTCTGGGGGAGGCTTGGTACAGCCCGGCAGGTCCCTGAGACTCTCCTGTGCGGCCTCTGGATTCACCTTTGATGATTATGCCATGCACTGGGTCCGGCAAGCTCCAGGGAAGGGCCTGGAATGGGTCTCAGCTATACTTGGAATAGTGGTCACATAGACTATGCGGACTCTGTGGAGGGCCGATTCACCATCTCCAGAGACAACGCCAAGAACTCCCTGTATCTGCAAATGAACAGTCTGAGAGCTGAGGATACGGCCGTATATTACTGTGCGAAAGTCTCGTACCTTAGCACCGCGTCCTCCCTTGACTATTGGGGCCAAGGTACCCTGGTCACCGTCTCGAGTGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCCAGACCTACATCTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGATGAGCTGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTAGGGGTAAACGCGAACCAGTTTATTTCCAGGGGAGCTTGTTTAAGGGGCCGCGTGATTATAACCCAATATCGAGTGCCATTTGTCATCTAACGAATGAATCTGATGGGCACACAACATCGTTGTATGGTATTGGTTTTGGCCCTTTCATCATCACAAACAAGCATTTGTTTAGAAGAAATAATGGTACACTGTTAGTTCAATCACTACATGGTGTGTTCAAGGTAAAGAATACCACAACTTTGCAACAACACCTCATTGATGGGAGGGACATGATGCTCATTCGCATGCCTAAGGATTTCCCACCATTTCCTCAAAAGCTGAAATTCAGAGAGCCACAAAGGGAAGAGCGCATATGTCTTGTGACAACCAACTTCCAAACTAAGAGCATGTCTAGCATGGTTTCAGATACTAGTTGCACATTCCCTTCATCTGATGGTATATTCTGGAAACATTGGATTCAGACCAAGGATGGGCACTGTGGTAGCCCGTTGGTGTCAACTAGAGATGGGTTTATTGTTGGTATACACTCAGCATCAAATTTCACCAACACAAACAATTATTTTACAAGTGTGCCGAAAGACTTCATGGATTTATTGACAAATCAAGAGGCGCAGCAATGGGTTAGTGGTTGGCGATTGAATGCTGACTCAGTGTTATGGGGAGGCCACAAAGTTTTCATGAGCAAACCTGAAGAACCCTTTCAGCCAGTCAAAGAAGCAACTCAACTCATGAGTGAATTAGTCTACTCGCAAGGGATGGACATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGCTGCTGTGGTTCCCCGGCTCGCGATGCGACATCCAGATGACCCAGTCTCCATCCTCCCTGTCTGCATCTGTAGGGGACAGAGTCACCATCACTTGTCGGGCAAGTCAGGGCATCAGAAATTACTTAGCCTGGTATCAGCAAAAACCAGGGAAAGCCCCTAAGCTCCTGATCTATGCTGCATCCACTTTGCAATCAGGGGTCCCATCTCGGTTCAGTGGCAGTGGATCTGGGACAGATTTCACTCTCACCATCAGCAGCCTACAGCCTGAAGATGTTGCAACTTATTACTGTCAAAGGTATAACCGTGCACCGTATACTTTTGGCCAGGGGACCAAGGTGGAAATCAAACGTACGGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAGAGTGTTGAGCGGCCGCGTTTAAACTGAATGAGCGCGTCCATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTAAAGCAAGTAAAACCTCTACAAATGTGGTATGGCTGATTATGATCCGGCTGCCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCGGTCGACGGCGCGCCTTTTTTTTTAATTTTTATTTTATTTTATTTTTGACGCGCCGAAGGCGCGATCTGAGCTCGGTACAGCTTGGCTGTGGAATGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTCCTCGAGGAACTGAAAAACCAGAAAGTTAACTGGTAAGTTTAGTCTTTTTGTCTTTTATTTCAGGTCCCGGATCCGGTGGTGGTGCAAATCAAAGAACTGCTCCTCAGTGGATGTTGCCTTTACTTCTAGGCCTGTACGGAAGTGTTACTTCTGCTCTAAAAGCTGCGGAATTGTACCCGCGGCCTAATACGACTCACTATAGGGACTAGTATGGTTCGACCATTGAACTGCATCGTCGCCGTGTCCCAAAATATGGGGATTGGCAAGAACGGAGACCTACCCTGGCCTCCGCTCAGGAACGAGTTCAAGTACTTCCAAAGAATGACCACAACCTCTTCAGTGGAAGGTAAACAGAATCTGGTGATTATGGGTAGGAAAACCTGGTTCTCCATTCCTGAGAAGAATCGACCTTTAAAGGACAGAATTAATATAGTTCTCAGTAGAGAACTCAAAGAACCACCACGAGGAGCTCATTTTCTTGCCAAAAGTTTAGATGATGCCTTAAGACTTATTGAACAACCGGAATTGGCAAGTAAAGTAGACATGGTTTGGATAGTCGGAGGCAGTTCTGTTTACCAGGAAGCCATGAATCAACCAGGCCACCTCAGACTCTTTGTGACAAGGATCATGCAGGAATTTGAAAGTGACACGTTTTTCCCAGAAATTGATTTGGGGAAATATAAACTTCTCCCAGAATACCCAGGCGTCCTCTCTGAGGTCCAGGAGGAAAAAGGCATCAAGTATAAGTTTGAAGTCTACGAGAAGAAAGACTAAGCGGCCGAGCGCGCGGATCTGGAAACGGGAGATGGGGGAGGCTAACTGAAGCACGGAAGGAGACAATACCGGAAGGAACCCGCGCTATGACGGCAATAAAAAGACAGAATAAAACGCACGGGTGTTGGGTCGTTTGTTCATAAACGCGGGGTTCGGTCCCAGGGCTGGCACTCTGTCGATACCCCACCGAGACCCCATTGGGGCCAATACGCCCGCGTTTCTTCCTTTTCCCCACCCCACCCCCCAAGTTCGGGTGAAGGCCCAGGGCTCGCAGCCAACGTCGGGGCGGCAGGCCCTGCCATAGCCACTGGCCCCGTGGGTTAGGGACGGGGTCCCCCATGGGGAATGGTTTATGGTTCGTGGGGGTTATTATTTTGGGCGTTGCGTGGGGTCTGGAGATCCCCCGGGCTGCAGGAATTCCGTTACATTACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAAAGGGCGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCGGGCGCCACCGCGGCCGCGGGGATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTCGGATCCTCTTGGCGTAATCATGGTCATAGCTGTTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAAAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTCTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCCTTTTAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCGCAACTGTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTTACGACGTTGTAAAACGACGGCCAGTGAATT
表2A.ABT-007TEV构建体:多蛋白的编码序列(SEQ ID NO:32)
ATGGAGTTTGGGCTGAGCTGGCTTTTTCTTGTCGCGATTTTAAAAGGTGTCCAGTGTCAGGTGCAGCTGCAGGAGTCGGGCCCAGGACTGGTGAAGCCTTCGGAGACCCTGTCCCTCACCTGCACTGTCTCTGGTGCCTCCATCAGTAGTTACTACTGGAGCTGGATCCGGCAGCCCCCAGGGAAGGGACTGGAGTGGATTGGGTATATCGGGGGGGAGGGGAGCACCAACTACAACCCCTCCCTCAAGAGTCGAGTCACCATATCAGTAGACACGTCCAAGAACCAGTTCTCCCTGAAGCTGAGGTCTGTGACCGCTGCGGACACGGCCGTGTATTACTGTGCGAGAGAGCGACTGGGGATCGGGGACTACTGGGGCCAGGGAACCCTGGTCACCGTCTCCTCAGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCGCCCTGCTCTAGAAGCACCTCCGAGAGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCTCTGACCAGCGGCGTGCACACCTTCCCAGCTGTCCTGCAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAACTTCGGCACCCAGACCTACACATGCAACGTAGATCACAAGCCCAGCAACACCAAGGTGGACAAGACAGTTGAGCGCAAATGTTGTGTCGAGTGCCCACCGTGCCCAGCACCACCTGTGGCAGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACGTGCGTGGTGGTGGACGTGAGCCACGAAGACCCCGAGGTCCAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCACGGGAGGAGCAGTTCAACAGCACGTTCCGTGTGGTCAGCGTCCTCACCGTTGTGCACCAGGACTGGCTGAACGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGGCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAACCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGAGGAGATGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTACCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACACCTCCCATGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTAGGGGTAAACGCGAACCAGTTTATTTCCAGGGGAGCTTGTTTAAGGGGCCGCGTGATTATAACCCAATATCGAGTGCCATTTGTCATCTAACGAATGAATCTGATGGGCACACAACATCGTTGTATGGTATTGGTTTTGGCCCTTTCATCATCACAAACAAGCATTTGTTTAGAAGAAATAATGGTACACTGTTAGTTCAATCACTACATGGTGTGTTCAAGGTAAAGAATACCACAACTTTGCAACAACACCTCATTGATGGGAGGGACATGATGCTCATTCGCATGCCTAAGGATTTCCCACCATTTCCTCAAAAGCTGAAATTCAGAGAGCCACAAAGGGAAGAGCGCATATGTCTTGTGACAACCAACTTCCAAACTAAGAGCATGTCTAGCATGGTTTCAGATACTAGTTGCACATTCCCTTCATCTGATGGTATATTCTGGAAACATTGGATTCAGACCAAGGATGGGCACTGTGGTAGCCCGTTGGTGTCAACTAGAGATGGGTTTATTGTTGGTATACACTCAGCATCAAATTTCACCAACACAAACAATTATTTTACAAGTGTGCCGAAAGACTTCATGGATTTATTGACAAATCAAGAGGCGCAGCAATGGGTTAGTGGTTGGCGATTGAATGCTGACTCAGTGTTATGGGGAGGCCACAAAGTTTTCATGAGCAAACCTGAAGAACCCTTTCAGCCAGTCAAAGAAGCAACTCAACTCATGAGTGAATTAGTCTACTCGGAAGGGATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGCTGCTGTGGTTCCCCGGCTCGCGATGCGACATCCAGCTGAGCCAATCTCCATCCTCCCTGTCTGCATCTGTAGGAGACAGAGTCACCATCACTTGCCGGGCAAGTCAGGGCATTAGAAATGATTTAGGCTGGTATCAGCAGAAACCAGGGAAAGCCCCTAAGCGCCTGATCTATGCTGCATCCAGTTTGCAAAGTGGGGTCCCATCAAGGTTCAGCGGCAGTGGATCTGGGACAGAATTCACTCTCACAATCAGCAGCCTGCAGCCTGAAGATTTTGCAACTTATTACTGTCTACAGCATAATACTTACCCTCCGACGTTCGGCCAAGGGACCAAGGTGGAAATCAAACGTACGGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAGAGTGTTGA
表2B.ABT-007TEV多蛋白氨基酸序列(SEQ ID NO:33)
MEFGLSWLFLVAILKGVQCQVQLQESGPGLVKPSETLSLTCTVSGASISSYYWSWIRQPPGKGLEWIGYIGGEGSTNYNPSLKSRVTISVDTSKNQFSLKLRSVTAADTAVYYCARERLGIGDYWGQGTLVTVSSASTKGPSVFPLAPCSRSTSESTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSNFGTQTYTCNVDHKPSNTKVDKTVERKCCVECPPCPAPPVAGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVQFNWYVDGVEVHNAKTKPREEQFNSTFRVVSVLTVVHQDWLNGKEYKCKVSNKGLPAPIEKTISKTKGQPREPQVYTLPPSREEMTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPMLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSRGKREPVYFQGSLFKGPRDYNPISSAICHLTNESDGHTTSLYGIGFGPFIITNKHLFRRNNGTLLVQSLHGVFKVKNTTTLQQHLIDGRDMMLIRMPKDFPPFPQKLKFREPQREERICLVTTNFGTKSMSSMVSDTSCTFPSSDGIFWKHWIQTKDGHCGSPLVSTRDGFIVGIHSASNFTNTNNYFTSVPKDFMDLLTNQEAQQWVSGWRLNADSVLWGGHKVFMSKPEEPFQPVKEATQLMSELVYSQGMRVPAQLLGLLLLWFPGSRCDIQLTQSPSSLSASVGDRVTITCRASQGIRNDLGWYQQKPGKAPKRLIYAASSLQSGVPSRFSGSGSGTEFTLTISSLQPEDFATYYCLQHNTYPPTFGQGTKVEIKRTVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGEC*
表2C.完整的ABT-007TEV构建体表达载体序列(SEQ ID NO:34)
GAAGTTCCTATTCCGAAGTTCCTATTCTCTAGACGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTTCCCATAGTAACGCCAATAGGGACTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCAATGACGCAAATGGGCAGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCCCGGGCGCCACCATGGAGTTTGGGCTGAGCTGGCTTTTTCTTGTCGCGATTTTAAAAGGTGTCCAGTGTCAGGTGCAGCTGCAGGAGTCGGGCCCAGGACTGGTGAAGCCTTCGGAGACCCTGTCCCTCACCTGCACTGTCTCTGGTGCCTCCATCAGTAGTTACTACTGGAGCTGGATCCGGCAGCCCCCAGGGAAGGGACTGGAGTGGATTGGGTATATCGGGGGGGAGGGGAGCACCAACTACAACCCCTCCCTCAAGAGTCGAGTCACCATATCAGTAGACACGTCCAAGAACCAGTTCTCCCTGAAGCTGAGGTCTGTGACCGCTGCGGACACGGCCGTGTATTACTGTGCGAGAGAGCGACTGGGGATCGGGGACTACTGGGGCCAGGGAACCCTGGTCACCGTCTCCTCAGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCGCCCTGCTCTAGAAGCACCTCCGAGAGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCTCTGACCAGCGGCGTGCACACCTTCCCAGCTGTCCTGCAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAACTTCGGCACCCAGACCTACACATGCAACGTAGATCACAAGCCCAGCAACACCAAGGTGGACAAGACAGTTGAGCGCAAATGTTGTGTCGAGTGCCCACCGTGCCCAGCACCACCTGTGGCAGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACGTGCGTGGTGGTGGACGTGAGCCACGAAGACCCCGAGGTCCAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCACGGGAGGAGCAGTTCAACAGCACGTTCCGTGTGGTCAGCGTCCTCACCGTTGTGCACCAGGACTGGCTGAACGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGGCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAACCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGAGGAGATGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTACCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACACCTCCCATGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTAGGGGTAAACGCGAACCAGTTTATTTCCAGGGGAGCTTGTTTAAGGGGCCGCGTGATTATAACCCAATATCGAGTGCCATTTGTCATCTAACGAATGAATCTGATGGGCACACAACATCGTTGTATGGTATTGGTTTTGGCCCTTTCATCATCACAAACAAGCATTTGTTTAGAAGAAATAATGGTACACTGTTAGTTCAATCACTACATGGTGTGTTCAAGGTAAAGAATACCACAACTTTGCAACAACACCTCATTGATGGGAGGGACATGATGCTCATTCGCATGCCTAAGGATTTCCCACCATTTCCTCAAAAGCTGAAATTCAGAGAGCCACAAAGGGAAGAGCGCATATGTCTTGTGACAACCAACTTCCAAACTAAGAGCATGTCTAGCATGGTTTCAGATACTAGTTGCACATTCCCTTCATCTGATGGTATATTCTGGAAACATTGGATTCAGACCAAGGATGGGCACTGTGGTAGCCCGTTGGTGTCAACTAGAGATGGGTTTATTGTTGGTATACACTCAGCATCAAATTTCACCAACACAAACAATTATTTTACAAGTGTGCCGAAAGACTTCATGGATTTATTGACAAATCAAGAGGCGCAGCAATGGGTTAGTGGTTGGCGATTGAATGCTGACTCAGTGTTATGGGGAGGCCACAAAGTTTTCATGAGCAAACCTGAAGAACCCTTTCAGCCAGTCAAAGAAGCAACTCAACTCATGAGTGAATTAGTCTACTCGCAAGGGATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGCTGCTGTGGTTCCCCGGCTCGCGATGCGACATCCAGCTGACCCAATCTCCATCCTCCCTGTCTGCATCTGTAGGAGACAGAGTCACCATCACTTGCCGGGCAAGTCAGGGCATTAGAAATGATTTAGGCTGGTATCAGCAGAAACCAGGGAAAGCCCCTAAGCGCCTGATCTATGCTGCATCCAGTTTGCAAAGTGGGGTCCCATCAAGGTTCAGCGGCAGTGGATCTGGGACAGAATTCACTCTCACAATCAGCAGCCTGCAGCCTGAAGATTTTGCAACTTATTACTGTCTACAGCATAATACTTACCCTCCGACGTTCGGCCAAGGGACCAAGGTGGAAATCAAACGTACGGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAGAGTGTTGAGCGGCCGCGTTTAAACTGAATGAGCGCGTCCATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTAAAGCAAGTAAAACCTCTACAAATGTGGTATGGCTGATTATGATCCGGCTGCCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCGGTCGACGGCGCGCCTTTTTTTTTAATTTTTATTTTATTTTATTTTTGACGCGCCGAAGGCGCGATCTGAGCTCGGTACAGCTTGGCTGTGGAATGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTCCTCGAGGAACTGAAAAACCAGAAAGTTAACTGGTAAGTTTAGTCTTTTTGTCTTTTATTTCAGGTCCCGGATCCGGTGGTGGTGCAAATCAAAGAACTGCTCCTCAGTGGATGTTGCCTTTACTTCTAGGCCTGTACGGAAGTGTTACTTCTGCTCTAAAAGCTGCGGAATTGTACCCGCGGCCTAATACGACTCACTATAGGGACTAGTATGGTTCGACCATTGAACTGCATCGTCGCCGTGTCCCAAAATATGGGGATTGGCAAGAACGGAGACCTACCCTGGCCTCCGCTCAGGAACGAGTTCAAGTACTTCCAAAGAATGACCACAACCTCTTCAGTGGAAGGTAAACAGAATCTGGTGATTATGGGTAGGAAAACCTGGTTCTCCATTCCTGAGAAGAATCGACCTTTAAAGGACAGAATTAATATAGTTCTCAGTAGAGAACTCAAAGAACCACCACGAGGAGCTCATTTTCTTGCCAAAAGTTTAGATGATGCCTTAAGACTTATTGAACAACCGGAATTGGCAAGTAAAGTAGACATGGTTTGGATAGTCGGAGGCAGTTCTGTTTACCAGGAAGCCATGAATCAACCAGGCCACCTCAGACTCTTTGTGACAAGGATCATGCAGGAATTTGAAAGTGACACGTTTTTCCCAGAAATTGATTTGGGGAAATATAAACTTCTCCCAGAATACCCAGGCGTCCTCTCTGAGGTCCAGGAGGAAAAAGGCATCAAGTATAAGTTTGAAGTCTACGAGAAGAAAGACTAAGCGGCCGAGCGCGCGGATCTGGAAACGGGAGATGGGGGAGGCTAACTGAAGCACGGAAGGAGACAATACCGGAAGGAACCCGCGCTATGACGGCAATAAAAAGACAGAATAAAACGCACGGGTGTTGGGTCGTTTGTTCATAAACGCGGGGTTCGGTCCCAGGGCTGGCACTCTGTCGATACCCCACCGAGACCCCATTGGGGCCAATACGCCCGCGTTTCTTCCTTTTCCCCACCCCACCCCCCAAGTTCGGGTGAAGGCCCAGGGCTCGCAGCCAACGTCGGGGCGGCAGGCCCTGCCATAGCCACTGGCCCCGTGGGTTAGGGACGGGGTCCCCCATGGGGAATGGTTTATGGTTCGTGGGGGTTATTATTTTGGGCGTTGCGTGGGGTCTGGAGATCCCCCGGGCTGCAGGAATTCCGTTACATTACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAAAGGGCGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCG GGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCGGGCGCCACCGCGGCCGCGGGGATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTCGGATCCTCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAAAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTCTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCCTTTTAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTTACGACGTTGTAAAACGACGGCCAGTGAATT
表3A.ABT-874(J695)TEV多蛋白的编码序列(SEQ ID NO:35)
ATGGAGTTTGGGCTGAGCTGGCTTTTTCTTGTCGCGATTTTAAAAGGTGTCCAGTGTCAGGTGCAGCTGGTGGAGTCTGGGGGAGGCGTGGTCCAGCCTGGGAGGTCCCTGAGACTCTCCTGTGCAGCGTCTGGATTCACCTTCAGTAGCTATGGCATGCACTGGGTCCGCCAGGCTCCAGGCAAGGGGCTGGAGTGGGTGGCATTTATACGGTATGATGGAAGTAATAAATACTATGCAGACTCCGTGAAGGGCCGATTCACCATCTCCAGAGACAATTCCAAGAACACGCTGTATCTGCAGATGAACAGCCTGAGAGCTGAGGACACGGCTGTGTATTACTGTAAGACCCATGGTAGCCATGACAACTGGGGCCAAGGGACAATGGTCACCGTCTCTTCAGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCCAGACCTACATCTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGCGAGGAGATGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTAGGGGTAAACGCGAACCAGTTTATTTCCAGGGGAGCTTGTTTAAGGGGCCGCGTGATTATAACCCAATATCGAGTGCCATTTGTCATCTAACGAATGAATCTGATGGGCACACAACATCGTTGTATGGTATTGGTTTTGGCCCTTTCATCATCACAAACAAGCATTTGTTTAGAAGAAATAATGGTACACTGTTAGTTCAATCACTACATGGTGTGTTCAAGGTAAAGAATACCACAACTTTGCAACAACACCTCATTGATGGGAGGGACATGATGCTCATTCGCATGCCTAAGGATTTCCCACCATTTCCTCAAAAGCTGAAATTCAGAGAGCCACAAAGGGAAGAGCGCATATGTCTTGTGACAACCAACTTCCAAACTAAGAGCATGTCTAGCATGGTTTCAGATACTAGTTGCACATTCCCTTCATCTGATGGTATATTCTGGAAACATTGGATTCAGACCAAGGATGGGCACTGTGGTAGCCCGTTGGTGTCAACTAGAGATGGGTTTATTGTTGGTATACACTCAGCATCAAATTTCACCAACACAAACAATTATTTTACAAGTGTGCCGAAAGACTTCATGGATTTATTGACAAATCAAGAGGCGCAGCAATGGGTTAGTGGTTGGCGATTGAATGCTGACTCAGTGTTATGGGGAGGCCACAAAGTTTTCATGAGCAAACCTGAAGAACCCTTTCAGCCAGTCAAAGAAGCAACTCAACTCATGAGTGAATTAGTCTACTCGCAAGGGATGACTTGGACCCCACTCCTCTTCCTCACCCTCCTCCTCCACTGCACAGGAAGCTTATCCCAGTCTGTGCTGACTCAGCCCCCCTCAGTGTCTGGGGCCCCCGGGCAGAGAGTCACCATCTCTTGTTCTGGAAGCAGATCCAACATCGGCAGTAATACTGTAAAGTGGTATCAGCAGCTCCCAGGAACGGCCCCCAAACTCCTCATCTATTACAATGATCAGCGGCCCTCAGGGGTCCCTGACCGATTCTCTGGATCCAAGTCTGGCACCTCAGCCTCCCTCGCCATCACTGGGCTCCAGGCTGAAGACGAGGCTGACTATTACTGCCAGTCATATGACAGATACACCCACCCCGCCCTGCTCTTCGGAACTGGGACCAAGGTCACAGTACTAGGTCAGCCCAAGGCTGCCCCCTCGGTCACTCTGTTCCCGCCCTCCTCTGAGGAGCTTCAAGCCAACAAGGCCACACTGGTGTGTCTCATAAGTGACTTCTACCCGGGAGCCGTGACAGTGGCCTGGAAGGCAGATAGCAGCCCCGTCAAGGCGGGAGTGGAGACCACCACACCCTCCAAACAAAGCAACAACAAGTACGCGGCCAGCAGCTACCTGAGCCTGACGCCTGAGCAGTGGAAGTCCCACAGAAGCTACAGCTGCCAGGTCACGCATGAAGGGAGCACCGTGGAGAAGACAGTGGCCCCTACAGAATGTTCATGA
表3B.ABT-874(J695)TEV多蛋白的氨基酸序列(SEQ ID NO:36)
MEFGLSWLFLVAILKGVQCQVQLVESGGGVVQPGRSLRLSCAASGFTFSSYGMHWVRQAPGKGLEWVAFIRYDGSNKYYADSVKGRFTISRDNSKNTLYLQMNSLRAEDTAVYYCKTHGSHDNWGQGTMVTVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPKSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSREEMTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSRGKREPVYFQGSLFKGPRDYNPISSAICHLTNESDGHTTSLYGIGFGPFIITNKHLFRRNNGTLLVQSLHGVFKVKNTTTLQQHLIDGRDMMLIRMPKDFPPFPQKLKFREPQREERICLVTTNFQTKSMSSMVSDTSCTFPSSDGIFWKHWIQTKDGHCGSPLVSTRDGFIVGIHSASNFTNTNNYFTSVPKDFMDLLTNQEAQQWVSGWRLNADSVLWGGHKVFMSKPEEPFQPVKEATQLMSELVYSQGMTWTPLLFLTLLLHCTGSLSQSVLTQPPSVSGAPGQRVTISCSGSRSNIGSNTVKWYQQLPGTAPKLLIYYNDQRPSGVPDRFSGSKSGTSASLAITGLQAEDEADYYCQSYDRYTHPALLFGTGTKVTVLGQPKAAPSVTLFPPSSEELQANKATLVCLISDFYPGAVTVAWKADSSPVKAGVETTTPSKQSNNKYAASSYLSLTPEQWKSHRSYSCQVTHEGSTVEKTVAPTECS*
表3C.ABT-874(J695)TEV表达载体的完整核苷酸序列(SEQ IDNO:37)
GAAGTTCCTATTCCGAAGTTCCTATTCTCTAGACGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCAATGACGCAAATGGGCAGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCCCGGGCGCCACCATGGAGTTTGGGCTGAGCTGGCTTTTTCTTGTCGCGATTTTAAAAGGTGTCCAGTGTCAGGTGCAGCTGGTGGAGTCTGGGGGAGGCGTGGTCCAGCCTGGGAGGTCCCTGAGACTCTCCTGTGCAGCGTCTGGATTCACCTTCAGTAGCTATGGCATGCACTGGGTCCGCCAGGTCCAGGCAAGGGGCTGGAGTGGGTGGCATTTATACGGTATGATGGAAGTAATAAATACTATGCAGACTCCGTGAAGGGCCGATTCACCATCTCCAGAGACAATTCCAAGAACACGCTGTATCTGCAGATGAACAGCCTGAGAGCTGAGGACACGGCTGTGTATTACTGTAAGACCCATGGTAGCCATGACAACTGGGGCCAAGGGACAATGGTCACCGTCTCTTCAGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACACTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCCAGACCTACATCTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGCGAGGAGATGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCAGGGGTAAACGCGAACCAGTTTATTTCCAGGGGAGCTTGTTTAAGGGGCCGCGTGATTATAACCCAATATCGAGTGCCATTTGTCATCTAACGAATGAATCTGATGGGCACACAACATCGTTGTATGGTATTGGTTTTGGCCCTTTCATCATCACAAACAAGCATTTGTTTAGAAGAAATAATGGTACACTGTTAGTTCAATCACTACATGGTGTGTTCAAGGTAAAGAATACCACAACTTTGCAACAACACCTCATTGATGGGAGGGACATGATGCTCATTCGCATGCCTAAGGATTTCCCACCATTTCCTCAAAAGCTGAAATTCAGAGAGCCACAAAGGGAAGAGCGCATATGTCTTGTGACAACCAACTTCCAAACTAAGAGCATGTCTAGCATGGTTTCAGATACTAGTTGCACATTCCCTTCATCTGATGGTATATTCTGGAAACATTGGATTCAGACCAAGGATGGGCACTGTGGTAGCCCGTTGGTGTCAACTAGAGATGGGTTTATTGTTGGTATACACTCAGCATCAAATTTCACCAACACAAACAATTATTTTACAAGTGTGCCGAAAGACTTCATGGATTTATTGACAAATCAAGAGGCGCAGCAATGGGTTAGTGGTTGGCGATTGAATGCTGACTCAGTGTTATGGGGAGGCCACAAAGTTTTCATGAGCAAACCTGAAGAACCCTTTCAGCCAGTCAAAGAAGCAACTCAACTCATGAGTGAATTAGTCTACTCGCAAGGGATGACTTGGACCCCACTCCTCTTCCTCACCCTCCTCCTCCACTGCACAGGAAGCTTATCCCAGTCTGTGCTGACTCAGCCCCCCTCAGTGTCTGGGGCCCCCGGGCAGAGAGTCACCATCTCTTGTTCTGGAAGCAGATCCAACATCGGCAGTAATACTGTAAAGTGGTATCAGCCAGCTCCCAGGAACGGCCCCCAAACTCCTCATCTATTACATGATCAGCGGCCCTCAGGGGTCCCTGACCGATTCTCTGGATCCAAGTCTGGCACCTCAGCCTCCCTCGCCATCACTGGGCTCCAGGCTGAAGACGAGGCTGACTATTACTGCCAGTCATATGACAGATACACCCACCCCGCCCTGCTCTTCGGAACTGGGACCAAGGTCACAGTACTAGGTCAGCCCAAGGCTGCCCCCTCGGTCACTCTGTTCCCGCCCTCCTCTGAGGAGCTTCAAGCCAACAAGGCCACACTGGTGTGTCTCATAAGTGACTTCTACCCGGGAGCCGTGACAGTGGCCTGGAAGGCAGATAGCAGCCCCGTCAAGGCGGGAGTGGAGACCACCACACCCTCCAAACAAAGCAACAACAAGTACGCGGCCAGCAGCTACCTGAGCCTGACGCCTGAGCAGTGGAAGTCCCACAGAAGCTACAGCTGCCAGGTCACGCATGAAGGGAGCACCGTGGAGAAGACAGTGGCCCCTACAGAATGTTCATGAGCGGCCGCGTTTAAACTGAATGAGCGCGTCCATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTAAAGCAAGTAAAACCTCTACAAATGTGGTATGGCTGATTATGATCCGGCTGCCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCGGTCGACGGCGCGCCTTTTTTTTTAATTTTTATTTTATTTTATTTTTGACGCGCCGAAGGCGCGATCTGAGCTCGGTACAGCTTGGTGTGGAATGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTCCTCGAGGAACTGAAAAACCAGAAAGTTAACTGGTAAGTTTAGTCTTTTTGTCTTTATTTCAGGTCCCGGATCCGGTGGTGGTGCAAATCAAAGAACTGCTCCTCAGTGGATGTTGCCTTTACTTCTAGGCCTGTACGGAAGTGTTACTTCTGCTCTAAAAGCTGCGGAATTGTACCCGCGGCCTAATACGACTCACTATAGGGACTAGTATGGTTCGACCATTGAACTGCATCGTCGCCGTGTCCCAAAATATGGGGATTGGCAAGAACGGAGACCTACCCTGGCCTCCGCTCAGGAACGAGTTCAAGTACTTCCAAAGAATGACCACAACCTCTTCAGTGGAAGGTAAACAGAATCTGGTGATTATGGGTAGGAAAACCTGGTTCTCCATTCCTGAGAAGAATCGACCTTTAAAGGACAGAATTAATATAGTTCTCAGTAGAGAACTCAAAGAACCACCACGAGGAGCTCATTTTCTTGCCAAAAGTTTAGATGATGCCTTAAGACTTATTGAACAACCGGAATTGGCAAGTAAAGTAGACATGGTTTGGATAGTCGGAGGCAGTTCTGTTTACCAGGAAGCCATGAATCAACCAGGCCACCTCAGACTCTTTGTGACAAGGATCATGCAGGAATTTGAAAGTGACACGTTTTTCCCAGAAATTGATTTGGGGAAATATAAACTTCTCCCAGAATACCCAGGCGTCCTCTCTGAGGTCCAGGAGGAAAAAGGCATCAAGTATAAGTTTGAAGTCTACGAGAAGAAAGACTAAGCGGCCGAGCGCGCGGATCTGGAAACGGGAGATGGGGGAGGCTAACTGAAGCACGGAAGGAGACAATACCGGAAGGAACCCGCGCTATGACGGCAATAAAAAGACAGAATAAAACGCACGGGTGTTGGGTCGTTTGTTCATAAACGCGGGGTTCGGTCCCAGGGCTGGCACTCTGTCGATACCCCACCGAGACCCCATTGGGGCCAATACGCCCGCGTTTCTTCCTTTTCCCCACCCCACCCCCCAAGTTCGGGTGAAGGCCCAGGGCTCGCAGCCAACGTCGGGGCGGCAGGCCCTGCCATAGCCACTGGCCCCGTGGGTTAGGGACGGGGTCCCCCATGGGGAATGGTTTATGGTTCGTGGGGGTTATTATTTTGGGCGTTGCGTGGGGTCTGGAGATCCCCCGGGCTGCAGGAATTCCGTTACATTACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAAAGGGCGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCGGGCGCCACCGCGGCCGCGGGGATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTCGGATCCTCTTGGCGTAATCATGCTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAAAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTCTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCCTTTTAATTAAAAATGAAGTTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATCCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTGTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTTACGACGTTGTAAAACGACGCCCAGTGAATT
表4A.编码EL246GG(抗-E/L选择素)TEV多蛋白的核酸序列(SEQ ID NO:38)
ATGGAGTTTGGGCTGAGCTGGCTTTTTCTTGTCGCGATTTTAAAAGGTGTCCAGTGCGAGGTGCAGCTGGTGCAGTCTGGAGCAGAGGTGAAAAAGCCCGGGGAGTCTCTGAAGATCTCCTGTAAGGGGTCCGGATACGCATTCAGTAGTTCCTGGATCGGCTGGGTGCGCCAGATGCCCGGGAAAGGCCTGGAGTGGATGGGGCGGATTTATCCTGGAGATGGAGATACTAACTACAATGGGAAGTTCAAGGGCCAGGTCACCATCTCAGCCGACAAGTCCATCAGCACCGCCTACCTGCAGTGGAGCAGCCTGAAGGCTAGCGACACCGCCATGTATTACTGTGCGAGAGCGCGCGTGGGATCCACGGTCTATGATGGTTACCTCTATGCAATGGACTACTGGGGTCAAGGTACCTCAGTCACCGTCTCCTCAGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCCAGACCTACATCTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTGAAGCCGCGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGCGAGGAGATGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTAGGGGTAAACGCGAACCAGTTTATTTCCAGGGGAGCTTGTTTAAGGGGCCGCGTGATTATAACCCAATATCGAGTGCCATTTGTCATCTAACGAATGAATCTGATGGGCACACAACATCGTTGTATGGTATTGGTTTTGGCCCTTTCATCATCACAAACAAGCATTTGTTTAGAAGAAATAATGGTACACTGTTAGTTCAATCACTACATGGTGTGTTCAAGGTAAAGAATACCACAACTTTGCAACAACACCTCATTGATGGGAGGGACATGATGCTCATTCGCATGCCTAAGGATTTCCCACCATTTCCTCAAAAGCTGAAATTCAGAGAGCCACAAAGGGAAGAGCGCATATGTCTTGTGACAACCAACTTCCAAACTAAGAGCATGTCTAGCATGGTTTCAGATACTAGTTGCACATTCCCTTCATCTGATGGTATATTCTGGAAACATTGGATTCAGACCAAGGATGGGCACTGTGGTAGCCCGTTGGTGTCAACTAGAGATGGGTTTATTGTTGGTATACACTCAGCATCAAATTTCACCAACACAAACAATTATTTTACAAGTGTGCCGAAAGACTTCATGGATTTATTGACAAATCAAGAGGCGCAGCAATGGGTTAGTGGTTGGCGATTGAATGCTGACTCAGTGTTATGGGGAGGCCACAAAGTTTTCATGAGCAAACCTGAAGAACCCTTTCAGCCAGTCAAAGAAGCAACTCAACTCATGAGTGAATTAGTCTACTCGCAAGGGATGGACATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGCTGCTGTGGTTCCCCGGCTCGCGATGCGACATCGTGATGACCCAGTCTCCAGACTCCCTGGCTGTGTCTCTGGGCGAGAGGGCCACCATCAACTGCAAGTCCAGTCAGAGCCTTTCATATAGAAGCAATCAAAAGAACTCGTTGGCCTGGTACCAGCAGAAACCAGGACAGCCTCCTAAGCTGCTCATTTACTGGGCTAGCACTAGGGAATCTGGGGTCCCTGACCGATTCAGTGGATCCGGGTCTGGGACAGATTTCACTCTCACCATCAGCAGCCTGCAGGCTGAAGATGTGGCAGTTTATTACTGTCACCAATATTATAGCTATCCGTACACGTTCGGAGGGGGGACCAAGGTGGAAATTAAACGTACGGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAGAGTGTTGA
表4B.EL246GG(抗-E/L选择素)TEV多蛋白的氨基酸序列(SEQID NO:39)
MEFGLSWLFLVAILKGVQCEVQLVQSGAEVKKPGESLKISCKGSGYAFSSSWIGWVRQMPGKGLEWMGRIYPGDGDTNYNGKFKGQVTISADKSISTAYLQVSSLKASDTAMYYCARARVGSTVYDGYLYAMDYWGQGTSVTVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPKSCDKTHTCPPCPAPEAAGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSREEMTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSRGKREPVYFQGSLFKGPRDYNPISSAICHLTNESDGHTTSLYGIGFGPFIITNKHLFRRNNGTLLVQSLHGVFKVKNTTTLQQHLIDGRDMMLIRMPKDFPPFPQKLKFREPQREERICLVTTNFQTKSMSSMVSDTSCTFPSSDGIFWKHWIQTKDGHCGSPLVSTRDGFIVGIHSASNFTNTNNYFTSVPKDFMDLLTNQEAQQWVSGWRLNADSVLWGGHKVFMSKPEEPFQPVKEATQLMSELVYSQGMDMRVPAQLLGLLLLWFPGSRCDIVMTQSPDSLAVSLGERATINCKSSQSLSYRSNQKNSLAWYQQKPGQPPKLLIYWASTRESGVPDRFSGSGSGTDFTLTISSLQAEDVAVCHQYYSYPYTFGGGTKVEIKRTVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGEC*
表4C.EL246GG(抗-E/L选择素)TEV多蛋白表达载体的完整核苷酸序列(SEQ ID NO:40)
GAAGTTCCTATTCCGAAGTTCCTATTCTCTAGACGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCAATGACGCAAATGGGCAGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCCCGGGCGCCACCATGGAGTTTGGGCTGAGCTGGCTTTTTCTTGTCGCGATTTTAAAAGGTGTCCAGTGCGAGGTGCAGCTGGTGCAGTCTGGAGCAGAGGTGAAAAAGCCCGGGGAGTCTCTGAAGATCTCCTGTAAGGGGTCCGGATACGCATTCAGTAGTTCCTGGATCGGCTGGGTGCGCCAGATGCCCGGGAAAGGCCTGGAGTGGATGGGGCGGATTTATCCTGGAGATGGAGATACTAACTACAATGGGAAGTTCAAGGGCCAGGTCACCATCTCAGCCGACAAGTCCATCAGCACCGCCTACCTGCAGTGGAGCAGCCTGAAGGCTAGCGACACCGCCATGTATTACTGTGCGAGAGCGCGCGTGGGATCCACGGTCTATGATGGTTACCTCTATGCAATGGACTACTGGGGTCAAGGTACCTCAGTCACCGTCTCCTCAGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGCACCCAGACCTACATCTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTGAAGCCGCGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGCGAGGAGATGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTAGGGGTAAACGCGAACCAGTTTATTTCCAGGGGAGCTTGTTTAAGGGGCCGCGTGATTATAACCCAATATCGAGTGCCATTTGTCATCTAACGAATGAATCTGATGGGCACACAACATCGTTGTATGGTATTGGTTTTGGCCCTTTCATCATCACAAACAAGCATTTGTTTAGAAGAAATAATGGTACACTGTTAGTTCAATCACTACATGGTGTGTTCAAGGTAAAGAATACCACAACTTTTGCAACAACACCTCATTGATGGGAGGGACATGATGCTCATTCGCATGCCTAAGGATTTCCCACCATTTCCTCAAAAGCTGAAATTCAGAGAGCCACAAAGGGAAGAGCGCATATGTCTTGTGACAACCAACTTCCAAACTAAGAGCATGTCTAGCATGGTTTCAGATACTAGTTGCACATTCCCTTCATCTGATGGTATATTCTGGAAACATTGGATTCAGACCAAGGATGGGCACTGTGGTAGCCCGTTGGTGTCAACTAGAGATGGGTTTATTGTTGGTATACACTCAGCATCAAATTTCACCAACACAAACAATTATTTTACAAGTGTGCCGAAAGACTTCATGGATTTATTGACAAATCAAGAGGCGCAGCAATGGGTTAGTGGTTGGCGATTGAATGCTGACTCAGTGTTATGGGGAGGCCACAAAGTTTTCATGAGCAAACCTGAAGAACCCTTTCAGCCAGTCAAAGAAGCAACTCAACTCATGAGTGAATTAGTCTACTCGCAAGGGATGGACATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGCTGCTGTGGTTCCCCGGCTCGCGATGCGACATCGTGATGACCCAGTCTCCAGACTCCCTGGCTGTGTCTCTGGGCGAGAGGGCCACCATCAACTGCAAGTCCAGTCAGAGCCTTTCATATAGAAGCAATCAAAAGAACTCGTTGGCCTGGTACCAGCAGAAACCAGGACAGCCTCCTAAGCTGCTCATTTACTGGGCTAGCACTAGGGAATCTGGGGTCCCTGACCGATTCAGTGGATCCGGGTCTGGGACAGATTTCACTCTCACCATCAGCAGCCTGCAGGCTGAAGATGTGGCAGTTTATTACTGTCACCAATATTATAGCTATCCGTACACGTTCGGAGGGGGGACCAAGGTGGAAATTAAACGTACGGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAGAGTGTTGAGCGGCCGCGTTTAAACTGAATGAGCGCGTCCATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTAAAGCAAGTAAAACCTCTACAAATGTGGTATGGCTGATTATGATCCGGCTGCCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCGGTCGACGGCGCGCCTTTTTTTTTAATTTTTATTTTATTTTATTTTTGACGCGCCGAAGGCGCGATCTGAGCTCGGTACAGCTTGGCTGTGGAATGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTCCTCGAGGAACTGAAAAACCAGAAAGTTAACTGGTAAGTTTAGTCTTTTTGTCTTTTATTTCAGGTCCCGGATCCGGTGGTGGTGCAAATCAAAGAACTGCTCCTCAGTGGATGTTGCCTTTACTTCTAGGCCTGTACGGAAGTGTTACTTCTGCTCTAAAAGCTGCGGAATTGTACCCGCGGCCTAATACGACTCACTATAGGGACTAGTATGGTTCGACCATTGAACTGCATCGTCGCCGTGTCCCAAAATATGGGGATTGGCAAGAACGGAGACCTACCCTGGCCTCCGCTCAGGAACGAGTTCAAGTACTTCCAAAGAATGACCACAACCTCTTCAGTGGAAGGTAAACAGAATCTGGTGATTATGGGTAGGAAAACCTGGTTCTCCATTCCTGAGAAGAATCGACCTTTAAAGGACAGAATTAATATAGTTCTCAGTAGAGAACTCAAAGAACCACCACGAGGAGCTCATTTTCTTGCCAAAAGTTTAGATGATGCCTTAAGACTTATTGAACAACCGGAATTGGCAAGTAAAGTAGACATGGTTTGATAGTCGGAGGCAGTTCTGTTTACCAGGAAGCCATGAATCAACCAGGCCACCTCAGACTCTTTGTGACAAGGATCATGCAGGAATTTGAAAGTGACACGTTTTTCCCAGAAATTGATTTGGGGAAATATAAACTTCTCCCAGAATACCCAGGCGTCCTCTCTGAGGTCCAGGAGGAAAAAGGCATCAAGTATAAGTTTGAAGTCTACGAGAAGAAAGACTAAGCGGCCGAGCGCGCGGATCTGGAAACGGGAGATGGGGGAGGCTAACTGAAGCACGGAAGGAGACAATACCGGAAGGAACCCGCGCTATGACGGCAATAAAAAGACAGAATAAAACGCACGGGTGTTGGGTCGTTTGTTCATAAACGCGGGGTTCGGTCCCAGGGCTGGCACTCTGTCGATACCCCACCGAGACCCCATTGGGGCCAATACGCCCGCGTTTCTTCCTTTTCCCCACCCCACCCCCCAAGTTCGGGTGAAGGCCCAGGGCTCGCAGCCAACGTCGGGGCGGCAGGCCCTGCCATAGCCACTGGCCCCGTGGGTTAGGGACGGGGTCCCCCATGGGGAATGGTTTAATGGTTCGTGGGGGTTATTATTTTGGGCGTTGCGTGGGGTCTGGAGATCCCCCGGGCTGCAGGAATTCCGTTACATTACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAAAGGGCGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCGGGCGCCACCGCGGCCGCGGGGATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTCGGATCCTCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAAAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTCTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCCTTTTAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGCTGCGCAACTGTTGGGAAG GCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTTACGACGTTGTAAAACGACGGCCAGTGAATT
表5A.ABT-325TEV多蛋白的编码序列(SEQ ID NO:41)
ATGGAGTTTGGGCTGAGCTGGCTTTTCCTTGTCGCGATTTTAAAAGGTGTCCAGTGTGAGGTGCAGGTGGTGCAGTCTGGAACAGAGGTGAAAAAACCCGGGGAGTCTCTGAAGATCTCCTGTAAGGGTTCTGGATACACTGTTACCAGTTACTGGATCGGCTGGGTGCGCCAGATGCCCGGGAAAGGCCTGGAGTGGATGGGATTCATCTATCCTGGTGACTCTGAAACCAGATACAGTCCGACCTTCCAAGGCCAGGTCACCATCTCAGCCGACAAGTCCTTCAATACCGCCTTCCTGCAGTGGAGCAGTCTAAAGGCCTCGGACACCGCCATGTATTACTGTGCGCGAGTCGGCAGTGGCTGGTACCCTTATACTTTTGATATCTGGGGCCAAGGGACAATGGTCACCGTCTCTTCAGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCCAGACCTACATCTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTGAAGCCGCGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGCGAGGAGATGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTAGGGGTAAACGCGAACCAGTTTATTTCCAGGGGAGCTTGTTTAAGGGGCCGCGTGATTATAACCCAATATCGAGTGCCATTTGTCATCTAACGAATGAATCTGATGGGCACACAACATCGTTGTATGGTATTGGTTTTGGCCCTTTCATCATCACAAACAAGCATTTGTTTAGAAGAAATAATGGTACACTGTTAGTTCAATCACTACATGGTGTGTTCAAGGTAAAGAATACCACAACTTTGCAACAACACCTCATTGATGGGAGGGACATGATGCTCATTCGCATGCCTAAGGATTTCCCACCATTTCCTCAAAAGCTGAAATTCAGAGAGCCACAAAGGGAAGAGCGCATATGTCTTGTGACAACCAACTTCCAAACTAAGAGCATGTGTAGCATGGTTTCAGATACTAGTTGCACATTCCCTTCATCTGATGGTATATTCTGGAAACATTGGATTCAGACCAAGGATGGGCACTGTGGTAGCCCGTTGGTGTCAACTAGAGATGGGTTTATTGTTGGTATACACTCAGCATCAAATTTCACCAACACAAACAATTATTTTACAAGTGTGCCGAAAGACTTCATGGATTTATTGACAAATCAAGAGGCGCAGCAATGGGTTAGTGGTTGGCGATTGAATGCTGACTCAGTGTTATGGGGAGGCCACAAAGTTTTCATGAGCAAACCTGAAGAACCCTTTCAGCCAGTCAAAGAAGCAACTCAACTCATGAGTGAATTAGTCTACTCGCAAGGGATGGAAGCCCCAGCGCAGCTTCTCTTCCTCCTGCTACTCTGGCTCCCAGATACCACTGGAGAAATAGTGATGACGCAGTCTCCAGCCACCCTGTCTGTGTCTCCAGGGGAAAGAGCCACCCTCTCCTGCAGGGCCAGTGAGAGTATTAGCAGCAACTTAGCCTGGTACCAGCAGAAACCTGGCCAGGCTCCCAGGCTCTTCATCTATACTGCATCCACCAGGGCCACTGATATCCCAGCCAGGTTCAGTGGCAGTGGGTCTGGGACAGAGTTCACTCTCACCATCAGCAGCCTGCAGTCTGAAGATTTTGCAGTTTATTACTGTCAGCAGTATAATAACTGGCCTTCGATCACCTTCGGCCAAGGGACACGACTGGAGATTAAACGAACTGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCTAGCGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAGAGTGTTGA
表5B.ABT-325TEV多蛋白氨基酸序列(SEQ ID NO:42)
MEFGLSWLFLVAILKGVQCEVQLVQSGTEVKKPGESLKISCKGSGYTVTSYWGWVRQMPGKGLEWMGFIYPGDSETRYSPTFQGQVTISADKSFNTAFLQWSSLKASDTAMYYCARVGSGVYPYTFDIWGQGTMVTVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPKSCDKTHTCPPCPAPEAAGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWVYDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSREEMTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSRGKREPVYFQGSLFKGPRDYNPISSAICHLTNESDGHTTSLYGIGFGPFIITNKHLFRRNNGTLLVQSLHGVFKVKNTTTLQQHLIDGRDMMLIRMPKDFPPFPQKLKFREPQREERICLVTTNFQTKSMSSMVSDTSCTFPSSDGIFWKHWIQTKDGHCGSPLVSTRDGFIVGIHSASNFTNTNNYFTSVPKDFMDLLTNQEAQQWVSGWRLNADSVLWGGHKVFMSKPEEPFQPVKEATQLMSELVYSQGMEAPAQLLFLLLLWLPDTTGEIVMTQSPATLSVSPGERATLSCRASESISSNLAWYQQKPGQAPRLFIYTASTRATDIPARFSGSGSGTEFTLTISSLQSEDFAVYYCQQYNNWPSITFGQGTRLEIKRTVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGEC*
表5C.完整的ABT-325TEV多蛋白表达载体的核苷酸序列(SEQID NO:43)
GAAGTTCCTATTCCGAAGTTCCTATTCTCTAGACGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCAATGACGCAAATGGGCAGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCCCGGGCGCCACCATGGAGTTTGGGCTGAGCTGGCTTTTCCTTGTCGCGATTTTAAAAGGTGTCCAGTGTGAGGTGCAGCTGGTGCAGTCTGGAACAGAGGTGAAAAAACCCGGGGAGTCTCTGAAGATCTCCTGTAAGGGTTCTGGATACACTGTTACCAGTTACTGGATCGGCTGGGTGCGCCAGATGCCCGGGAAAGGCCTGGAGTGGATGGGATTCATCTATCCTGGTGACTCTGAAACCAGATACAGTCCGACCTTCCAAGGCCAGGTCACCATCTCAGCCGACAAGTCCTTCAATACCGCCTTCCTGCAGTGGAGCAGTCTAAAGGCCTCGGACACCGCCATGTATTACTGTGCGCGAGTCGGCAGTGGCTGGTACCCTTATACTTTTGATATCTGGGGCCAAGGGACAATGGTCACCGTCTCTTCAGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCCAGACCTACATCTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTGAAGCCGCGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGTGTACACCCTGCCCCCATCCCGCGAGGAGATGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTAGGGGTAAACGCGAACCAGTTTATTTCCAGGGGAGCTTGTTTAAGGGGCCGCGTGATTATAACCCAATATCGAGTGCCATTTGTCATCTAACGAATGAATCTGATGGGCACACAACATCGTTGTATGGTATTGGTTTTGGCCCTTTCATCATCACAAACAAGCATTTGTTTAGAAGAAATAATGGTACACTGTTAGTTCAATCACTACATGGTGTGTTCAAGGTAAAGAATACCACAACTTTGCAACAACACCTCATTGATGGGAGGGACATGATGCTCATTCGCATGCCTAAGGATTTCCCACCATTTCCTCAAAAGCTGAAATTCAGAGAGCCACAAAGGGAAGAGCGCATATGTCTTGTGACAACCAACTTCCAAACTAAGAGCATGTCTAGCATGGTTTCAGATACTAGTTGCACATTCCCTTCATCTGATGGTATATTCTGGAAACATTGGATTCAGACCAAGGATGGGCACTGTGGTAGCCCGTTGGTGTCAACTAGAGATGGGTTTATTGTTGGTATACACTCAGCATCAAATTTCACCAACACAAACAATTATTTTACAAGTGTGCCGAAAGACTTCATGGATTTATTGACAAATCAAGAGGCGCAGCAATGGGTTAGTGGTTGGCGATTGAATGCTGACTCAGTGTTATGGGGAGGCCACAAAGTTTTCATGAGCAAACCTGAAGAACCCTTTCAGCCAGTCAAAGAAGCAACTCAACTCATGAGTGAATTAGTCTACTCGCAAGGGATGGAAGCCCCAGCGCAGCTTCTCTTCCTCCTGCTACTCTGGCTCCCAGATACCACTGGAGAAATAGTGATGACGCAGTCTCCAGCCACCCTGTCTGTGTCTCCAGGGGAAAGAGCCACCCTCTCCTGCAGGGCCAGTGAGAGTATTAGCAGCAACTTAGCCTGGTACCAGCAGAAACCTGGCCAGGCTCCCAGGCTCTTCATCTATACTGCATCCACCAGGGCCACTGATATCCCAGCCAGGTTCAGTGGCAGTGGGTCTGGGACAGAGTTCACTCTCACCATCAGCAGCCTGCAGTCTGAAGATTTTGCAGTTTATTACTGTCAGCAGTATAATAACTGGCCTTCGATCACCTTCGGCCAAGGGACACGACTGGAGATTAAACGAACTGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCTAGCGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAGAGTGTTGAGCGGCCGCGTTTAAACTGAATGAGCGCGTCCATGCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTAAAGCAAGTAAAACCTCTACAAATGTGGTATGGCTGATTATGATCCGGCTGCCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCGGTCGACGGCGCGCCTTTTTTTTTAATTTTTATTTTATTTTATTTTTGACGCGCCGAAGGCGCGATCTGAGCTCGGTACAGCTTGGCTGTGGAATGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTCCTCGAGGAACTGAAAAACCAGAAAGTTAACTGGTAAGTTTAGTCTTTTTGTCTTTTATTTCAGGTCCCGGATCCGGTGGTGGTGCAAATCAAAGAACTGCTCCTCAGTGGATGTTGCCTTTACTTCTAGGCCTGTACGGAAGTGTTACTTCTGCTCTAAAAGCTGCGGAATTGTACCCGCGCCTAATACGACTCACTATAGGGACTAGTATGGTTCGACCATTGAACTGCATCGTCGCCGTGTCCCAAAATATGGGGATTGCAAGAACGGAGACCTACCCTGGCCTCCGCTCAGGAACGAGTTCAAGTACTTCCAAAGAATGACCACAACCTCTTCAGTGGAAGGTAAACAGAATCTGGTGATTATGGGTAGGAAAACCTGGTTCTCCATTCCTGAGAAGAATCGACCTTTAAAGGACAGAATTAATATAGTTCTCAGTAGAGAACTCAAAGAACCACCACGAGGAGCTCATTTTCTTGCCAAAAGTTTAGATGATGCCTTAAGACTTATTGAACAACCGGAATTGGCAAGTAAAGTAGACATGGTTTGGATAGTCGGAGGCAGTTCTGTTTACCAGGAAGCCATGAATCAACCAGGCCACCTCAGACTCTTTGTGACAAGGATCATGCAGGAATTTGAAAGTGACACGTTTTTCCCAGAAATTGATTTGGGGAAATATAAACTTCTCCCAGAATACCCAGGCGTCCTCTCTGAGGTCCAGGAGGAAAAAGGCATCAAGTATAAGTTTGAAGTCTACGAGAAGAAAGACTAAGCGGCCGAGCGCGCGGATCTGGAAACGGGAGATGGGGGAGGCTAACTGAAGCACGGAAGGAGACAATACCGGAAGGAACCCGCGCTATGACGGCAATAAAAAGACAGAATAAAACGCACGGGTGTTGGGTCGTTTGTTCATAAACGCGGGGTTCGGTCCGAGGGCTGGCACTTGTCGATACCCCACCGAGACCCCATTGGGGCCAATACGCCCGCGTTTCTTCCTTTTCCCCACCCCACCCCCCAAGTTCGGGTGAAGGCCCAGGGCTCGCAGCCAACGTCGGGGCGGCAGGCCCTGCCATAGCCACTGGCCCCGTGGGTTAGGGACGGGGTCCCCCATGGGGAATGGTTTATGGTTCGTGGGGGTTATTATTTTGGGCGTTGCGTGGGGTCTGGAGATCCCCCGGGCTGCAGGAATTCCGTTACATTACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAAAGGGCGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCGGGCGCCACCGCGGCCGCGGGGATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTCGGATCCTCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAAAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTCTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCCTTTTAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTTACGACGTTGTAAAACGACGGCCAGTGAATT
表6A.D2E7LC-LC-HC多蛋白构建体的编码序列(SEQ ID NO:29)
ATGGACATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGCTGCTGTGGTTCCCCGGCTCGCGATGCGACATCCAGATGACCCAGTCTCCATCCTCCCTGTCTGCATCTGTAGGGGACAGAGTCACCATCACTTGTCGGGCAAGTCAGGGCATCAGAAATTACTTAGCCTGGTATCAGCAAAAACCAGGGAAAGCCCCTAAGCTCCTGATCTATGCTGCATCCACTTTGCAATCAGGGGTCCCATCTCGGTTCAGTGGCAGTGGATCTGGGACAGATTTCACTCTCACCATCAGCAGCCTACAGCCTGAAGATGTTGCAACTTATTACTGTCAAAGGTATAACCGTGCACCGTATACTTTTGGCCAGGGGACCAAGGTGGAAATCAAACGTACGGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAAGGTGTAAGAGACTTCTCAAGTTGGCAGGAGACGTTGAGTCCAACCCTGGGCCCATGGACATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGCTGCTGTGGTTCCCCGGCTCGCGATGCGACATCCAGATGACCCAGTCTCCATCCTCCCTGTCTGCATCTGTAGGGGACAGAGTCACCATCACTTGTCGGGCAAGTCAGGGCATCAGAAATTACTTAGCCTGGTATCAGCAAAAACCAGGGAAAGCCCCTAAGCTCCTGATCTATGCTGCATCCACTTTGCAATCAGGGGTCCCATCTCGGTTCAGTGGCAGTGGATCTGGGACAGATTTCACTCTCACCATCAGCAGCCTACAGCCTGAAGATGTTGCAACTTATTACTGTCAAAGGTATAACCGTGCACCGTATACTTTTGGCCAGGGGACCAAGGTGGAAATCAAACGTACGGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAAGGTGTAAGAGACTTCTCAAGTTGGCAGGAGACGTTGAGTCCAACCCTGGGCCCATGGAGTTTGGGCTGAGCTGGCTTTTTCTTGTCGCGATTTTAAAAGGTGTCCAGTGTGAGGTGCAGCTGGTGGAGTCTGGGGGAGGCTTGGTACAGCCCGGCAGGTCCCTGAGACTCTCCTGTGCGGCCTCTGGATTCACCTTTGATGATTATGCCATGCACTGGGTCCGGCAAGCTCCAGGGAAGGGCCTGGAATGGGTCTCAGCTATCACTTGGAATAGTGGTCACATAGACTATGCGGACTCTGTGGAGGGCCGATTCACCATCTCCAGAGACAACGCCAAGAACTCCCTGTATCTGCAAATGAACAGTCTGAGAGCTGAGGATACGGCCGTATATTACTGTGCGAAAGTCTCGTACCTTAGCACCGCGTCCTCCCTTGACTATTGGGGCCAAGGTACCCTGGTCACCGTCTCGAGTGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCCAGACCTACATCTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGATGAGCTGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAATGA
表6B.D2E7LC-LC-HC多蛋白氨基酸序列(SEQ ID NO:30)
MDMRVPAQLLGLLLLWFPGSRCDIQMTQSPSSLSASVGDRVTITCRASQGIRNYLAVYQQKPGKAPKLLIYAASTLQSGVPSRFSGSGSGTDFTLTISSLQPEDVATYYCQRYNRAPYTFGQGTKVEIKRTVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGRCKRLLKLAGDVESNPGPMDMRVPAQLLGLLLLWFPGSRCDIQMTQSPSSLSASVGDRVTITCRASQGIRNYLAWQQKPGKAPKLLIYAASTLQSGVPSRFSGSGSGTDFTLTISSLQPEDVATYYCQRYNRAPYTFGQGTKVEIKRTVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGRCKRLLKLAGDVESNPGPMEFGLSWLFLVAILKGVQCEVQLVESGGGLVQPGRSLRLSCAASGFTFDDYAMHWVRQAPGKGLEWVSAITWNSGHIDYADSVEGRFTISRDNAKNSLYLQMNSLRAEDTAVYYCAKVSYLSTASSLDYWGQGTLVTVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPKSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHTQKSLSLSPGK*
表6C.D2E7LCLC-HC多蛋白表达载体DNA序列的完整核苷酸序列(SEQ ID NO:31)
GAAGTTCCTATTCCGAAGTTCCTATTCTCTAGACGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCGCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCAATGACGCAAATGGGCAGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCAGGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCCCGGGCGCCACCATGGACATGCGCGTGCCGGCCCAGCTGCTGGGCCTGCTGCTGCTGTGGTTCCCCGGCTCGCGATGCGACATCCAGATGACCCAGTCTCCATCCTCCCTGTCTGCATCTGTAGGGGACAGAGTCACCATCACTTGTCGGGCAAGTCAGGGCATCAGAAATTACTTAGCCTGGTATCAGCAAAAACCAGGGAAAGCCCCTAAGCTCCTGATCTATGCTGCATCCACTTTGCAATCAGGGGTCCCATCTCGGTTCAGTGGCAGTGGATCTGGGACAGATTTCACTCTCACCATCAGCAGCCTACAGCCTGAAGATGTTGCAACTTATTACTGTCAAAGGTATAACCGTGCACCGTATACTTTTGGCCAGGGGACCAAGGTGGAAATCAAACGTACGGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAAGGTGTAAGAGACTTCTCAAGTTGGCAGGAGACGTTGAGTCCAACCCTGGGCCCATGGACATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGCTGCTGTGGTTCCCCGGCTCGCGATGCGACATCCAGATGACCCAGTCTCCATCCTCCCTGTCTGCATCTGTAGGGGACAGAGTCACCATCACTTGTCGGGCAAGTCAGGGCATCAGAAATTACTTAGCCTGGTATCAGCAAAAACCAGGGAAAGCCCCTAAGCTCCTGATCTATGCTGCATCCACTTTGCAATCAGGGGTCCCATCTCGGTTCAGTGGCAGTGGATCTGGGACAGATTTCACTCTCACCATCAGCAGCCTACAGCCTGAAGATGTTGCAACTTATTACTGTCAAAGGTATAACCGTGCACCGTATACTTTTGGCCAGGGGACCAAGGTGGAAATCAAACGTACGGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAAGGTGTAAGAGACTTCTCAAGTTGGCAGGAGACGTTGAGTCCAACCCTGGGCCCATGGAGTTTGGGCTGAGCTGGCTTTTTCTTGTCGCGATTTTAAAAGGTGTCCAGTGTGAGGTGCAGCTGGTGGAGTCTGGGGGAGGCTTGGTACAGCCCGGCAGGTCCCTGAGACTCTCCTGTGCGGCCTCTGGATTCACCTTTGATGATTATGCCATGCACTGGGTCCGGCAAGCTCCAGGGAAGGGCCTGGAATGGGTCTCAGCTATCACTTGGAATAGTGGTCACATAGACTATGCGGACTCTGTGGAGGGCCGATTCACCATCTCCAGAGACAACGCCAAGAACTCCCTGTATCTGCAAATGAACAGTCTGAGAGCTGAGGATACGGCCGTATATTACTGTGCGAAAGTCTCGTACCTTAGCACCGCGTCCTCCCTTGACTATTGGGGCCAAGGTACCCTGGTCACCGTCTCGAGTGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCCAGACCTACATCTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGATGAGCTGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAATGAGAATTAGTCTACTCGCAAGGGGCGGCCGCGTTTAAACTGAATGAGCGCGTCCATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTAAAGCAAGTAAAACCTCTACAAATGTGGTATGGCTGATTATGATCCGGCTGCCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCGGTCGACGGCGCGCCTTTTTTTTTAATTTTTATTTTATTTTATTTTTGACGCGCCGAAGCGCGATCTGAGCTCGGTACAGCTTGGCTGTGGAATGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTCCTCGAGGAACTGAAAAACCAGAAAGTTAACGGTAAGTTTAGTCTTTTTGTCTTTTATTTCAGGTCCCGGATCCGGTGGTGGTGCAAATCAAAGAACTGCTCCTCAGTGGATGTTGCCTTTACTTCTAGGCCTGTACGGAAGTGTTACTTCTGCTCTAAAAGCTGCGGAATTGTACCCGCGGCCTAATACGACTCACTATAGGGACTAGTATGGTTCGACCATTGAACTGCATCGTCGCCGTGTCCCAAAATATGGGGATTGGCAAGAACGGAGACCTACCCTGGCCTCCGCTCAGGAACGAGTTCAAGTACTTCCAAAGAATGACCACAACCTCTTCAGTGGAAGGTAAACAGAATCTGGTGATTATGGGTAGGAAAACCTGGTTCTCCATTCCTGAGAAGAATCGACCTTTAAAGGACAGAATTAATATAGTTCTCAGTAGAGAACTCAAAGAACCACCACGAGGAGCTCATTTTCTTGCCAAAAGTTTAGATGATGCCTTAAGACTTATTGAACAACCGGAATTGGCAAGTAAAGTAGACATGGTTTGGATAGTCGGAGGCAGTTCTGTTTACCAGGAAGCCATGAATCAACCAGGCCACCTCAGACTCTTTGTGACAAGGATCATGCAGGAATTTGAAAGTGACACGTTTTTCCCAGAAATTGATTTGGGGAAATATAAACTTCTCCCAGAATACCCAGGCGTCCTCTCTGAGGTCCAGGAGGAAAAAGGCATCAAGTATAAGTTTGAAGTCTACGAGAAGAAAGACTAAGCGGCCGAGCGCGCGGATCTGGAAACGGGAGATGGGGGAGGCTAACTGAAGCACGGAAGGAGACAATACCGGAAGGAACCCGCGCTATGACGGCAATAAAAAGACAGAATAAACGCACGGGTGTTGGGTCGTTTGTTCATAAACGCGGGGTTCGGTCCCAGGGCTGGCACTCTGTCGATACCCCACCGAGACCCCATTGGGGCCAATACGCCCGCGTTTCTTCCTTTTCCCCACCCCACCCCCCAAGTTCGGGTGAAGGCCCAGGGCTCGCAGCCAACGTCGGGGCGGCAGGCCCTGCCATAGCCACTGGCCCCGTGGGTTAGGGACGGGGTCCCCCATGGGGAATGGTTTATGGTTCGTGGGGGTTATTATTTTGGGCGTTGCGTGGGGTCTGGAGATCCCCCGGGCTGCAGGAATTCCGTTACATTACTTACGGTAAATGGCCCGGCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAAAGGGCGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTGGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCGGGCGCCACCGCGGCCGCGGGGATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTCGGATCCTCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAAAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTCTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCCTTTTAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTTACGACGTTGTAAAACGACGGCCAGTGAATT
实施例4.作为具有内部可裂解信号肽构建体的多蛋白的抗体表达
进一步的实施例形成了用于抗体表达的编码序列,表达载体和方法。初级表达构建体包括具有内部可裂解信号肽的多蛋白,使得表达和随后的裂解导致多链(例如,双链)抗体分子的形成。
表7A.D2E7内部可裂解信号肽构建体的编码序列(SEQ ID NO:45)
atggagtttgggctgagctggctttttcttgtcgcgattttaaaaggtgtccagtgtgaggtgcagctggtggagtctgggggaggcttggtacagcccggcaggtccctgagactctcctgtgcggcctctggattcacctttgatgattatgccatgcactgggtccggcaagctccagggaagggcctggaatgggtctcagctatcacttggaatagtggtcacatagactatgcggactctgtggagggccgattcaccatctccagagacaacgccaagaactccctgtatctgcaaatgaacagtctgagagctgaggatacggccgtatattactgtgcgaaagtctcgtaccttagcaccgcgtcctcccttgactattggggccaaggtaccctggtcaccgtctcgagtgcgtcgaccaagggcccatcggtcttccccctggcaccctcctccaagagcacctctgggggcacagcggccctgggctgcctggtcaaggactacttccccgaaccggtgacggtgtcgtggaactcaggcgccctgaccagcggcgtgcacaccttcccggctgtcctacagtcctcaggactctactccctcagcagcgtggtgaccgtgccctccagcagcttgggcacccagacctacatctgcaacgtgaatcacaagcccagcaacaccaaggtggacaagaaagttgagcccaaatcttgtgacaaaactcacacatgcccaccgtgcccagcacctgaactcctggggggaccgtcagtcttcctcttccccccaaaacccaaggacaccctcatgatctcccggacccctgaggtcacatgcgtgtggtggacgtgagccacgaagaccctgaggtcaagttcaactggtacgtggacggcgtggaggtgcataatgccaagacaaagccgcgggaggagcagtacaacagcacgtaccgtgtggtcagcgtcctcaccgtcctgcaccaggactggctgaatggcaaggagtacaagtgcaaggtctccaacaaagccctcccagcccccatcgagaaaaccatctccaaagccaaagggcagccccgagaaccacaggtgtacaccctgcccccatcccgggatgagctgaccaagaaccaggtcagcctgacctgcctggtcaaaggcttctatcccagcgacatcgccgtggagtgggagagcaatgggcagccggagaacaactacaagaccacgcctcccgtgctggactccgacggctccttcttcctctacagcaagctcaccgtggacaagagcaggtggcagcaggggaacgtcttctcatgctccgtgatgcatgaggctctgcacaaccactacacgcagaagagcctctccctgtctaggggtaaacgcatgggacgaatggcaatgaaatggttagttgttataatatgtttctctataacaagtcaacctgcttctgctatggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgcgacatccagatgacccagtctccatcctccctgtctgcatctgtaggggacagagtcaccatcacttgtcgggcaagtcagggcatcagaaattacttagcctggtatcagcaaaaaccagggaaagcccctaagctcctgatctatgctgcatccactttgcaatcaggggtcccatctcggttcagtggcagtggatctgggacagatttcactctcaccatcagcagcctacagcctgaagatgttgcaacttattactgtcaaaggtataaccgtgcaccgtatacttttggccaggggaccaaggtggaaatcaaacgtacggtggctgcaccatctgtcttcatcttcccgccatctgatgagcagttgaaatctggaactgcctctgttgtgtgcctgctgaataacttctatcccagagaggccaaagtacagtggaaggtggataacgccctccaatcgggtaactcccaggagagtgtcacagagcaggacagcaaggacagcacctacagcctcagcagcaccctgacgctgagcaaagcagactacgagaaacacaaagtctacgcctgcgaagtcacccatcagggcctgagctcgcccgtcacaaagagcttcaacaggggagagtgttga
表7B.D2E7内部可裂解信号肽构建体的氨基酸序列(SEQ ID NO:46)
MEFGLSWLFLVAILKGVQCEVQLVESGGGLVQPGRSLRLSCAASGFTFDDYAMHWVRQAPGKGLEWVSAITWNSGHIDYADSVEGRFTISRDNAKNSLYLQMNSLRAEDTAVYYCAKVSYLSTASSLDYWGQGTLVTVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPKSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSRGKRMGRMAMKWLVVIICFSITSQPASAMDMRVPAQLLGLLLLWFPGSRCDIQMTQSPSSLSASVGDRVTITCRASQGIRNYLAWYQQKPGKAPKLLIYAASTLQSGVPSRFSGSGSGTDFTLTISSLQPEDVATYYCQRYNRAPYTFGQGTKVEIKRTVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGEC*
表7C.完整的D2E7内部可裂解信号肽多蛋白表达载体DNA序列(SEQ ID NO:47)
gaagttcctattccgaagttcctattctctagacgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccaatgacgcaaatgggcagggaattcgagctcggtactcgagcggtgttccgcggtcctcctcgtatagaaactcggaccactctgagacgaaggctcgcgtccaggccagcacgaaggaggctaagtgggaggggtagcggtcgttgtccactagggggtccactcgctccagggtgtgaagacacatgtcgccctcttcggcatcaaggaaggtgattggtttataggtgtaggccacgtgaccgggtgttcctgaaggggggctataaaagggggtgggggcgcgttcgtcctcactctcttccgcatcgctgtctgcgagggccagctgttgggctcgcggttgaggacaaactcttcgcggtctttccagtactcttggatcggaaacccgtcggcctccgaacggtactccgccaccgagggacctgagcgagtccgcatcgaccggatcggaaaacctctcgactgttggggtgagtactccctctcaaaagtcgggcatgacttctgcgctaagattgtcagtttccaaaaacgaggaggatttgatattcacctggcccgcggtgatgcctttgagggtggccgcgtccatctggtcagaaaagacaatctttttgttgtcaagcttgaggtgtggcaggcttgagatctggccatacacttgagtgacaatgacatccactttgcctttctctccacaggtgtccactcccaggtccaaccggaattgtacccgcggccagagcttgcccgggcgccaccatggagtttgggctgagctggctttttcttgtcgcgattttaaaaggtgtccagtgtgaggtgcagctggtggagtctgggggaggcttggtacagcccggcaggtccctgagactctcctgtgcggcctctggattcacctttgatgattatgccatgcactgggtccggcaagctccagggaagggcctggaatgggtctcagctatcacttggaatagtggtcacatagactatgcggactctgtggagggccgattcaccatctccagagacaacgccaagaactccctgtatctgcaaatgaacagtctgagagctgaggatacggccgtatattactgtgcgaaagtctcgtaccttagcaccgcgtcctcccttgactattggggccaaggtaccctggtcaccgtctcgagtgcgtcgaccaagggcccatcggtcttccccctggcaccctcctccaagagcacctctgggggcacagcggccctgggctgcctggtcaaggactacttccccgaaccggtgacggtgtcgtggaactcaggcgccctgaccagcggcgtgcacaccttcccggctgtcctacagtcctcaggactctactccctcagcagcgtggtgaccgtgccctccagcagcttgggcacccagacctacatctgcaacgtgaatcacaagcccagcaacaccaaggtggacaagaaagttgagcccaaatcttgtgacaaaactcacacatgcccaccgtgcccagcacctgaactcctggggggaccgtcagtcttcctcttccccccaaaacccaaggacaccctcatgatctcccggacccctgaggtcacatgcgtggtggtggacgtgagccacgaagaccctgaggtcaagttcaactggtacgtggacggcgtggaggtgcataatgccaagacaaagccgcgggaggagcagtacaacagcacgtaccgtgtggtcagcgtcctcaccgtcctgcaccaggactggctgaatggcaaggagtacaagtgcaaggtctccaacaaagccctcccagcccccatcgagaaaaccatctccaaagccaaagggcagccccgagaaccacaggtgtacaccctgcccccatcccgggatgagctgaccaagaaccaggtcagcctgacctgcctggtcaaaggcttctatcccagcgacatcgccgtggagtgggagagcaatgggcagccggagaacaactacaagaccacgcctcccgtgctggactccgacggctccttcttcctctacagcaagctcaccgtggacaagagcaggtggcagcaggggaacgtcttctcatgctccgtgatgcatgaggctctgcacaaccactacacgcagaagagcctctccctgtctaggggtaaacgcatgggacgaatggcaatgaaatggttagttgttataatatgtttctctataacaagtcaacctgcttctgctatggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgcgacatccagatgacccagtctccatcctccctgtctgcatctgtaggggacagagtcaccatcacttgtcgggcaagtcagggcatcagaaattacttagcctggtatcagcaaaaaccagggaaagcccctaagctcctgatctatgctgcatccactttgcaatcaggggtcccatctcggttcagtggcagtggatctgggacagatttcactctcaccatcagcagcctacagcctgaagatgttgcaacttattactgtcaaaggtataaccgtgcaccgtatacttttggccaggggaccaaggtggaaatcaaacgtacggtggctgcaccatctgtcttcatcttcccgccatctgatgagcagttgaaatctggaactgcctctgttgtgtgcctgctgaataacttctatcccagagaggccaaagtacagtggaaggtggataacgccctccaatcgggtaactcccaggagagtgtcacagagcaggacagcaaggacagcacctacagcctcagcagcaccctgacgctgagcaaagcagactacgagaaacacaaagtctacgcctgcgaagtcacccatcagggcctgagctcgcccgtcacaaagagcttcaacaggggagagtgttgagcggccgcgtttaaactgaatgagcgcgtccatccagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggggaggtgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtatggctgattatgatccggctgcctcgcgcgtttcggtgatgacggtgaaaacctctgacacatgcagctcccggagacggtcacagcttgtctgtaagcggatgccgggagcagacaagcccgtcagggcgcgtcagcgggtgttggcgggtgtcggggcgcagccatgaccggtcgacggcgcgcctttttttttaatttttattttattttatttttgacgcgccgaaggcgcgatctgagctcggtacagcttggctgtggaatgtgtgtcagttagggtgtggaaagtccccaggctccccagcaggcagaagtatgcaaagcatgcatctcaattagtcagcaaccaggtgtggaaagtccccaggctccccagcaggcagaagtatgcaaagcatgcatctcaattagtcagcaaccatagtcccgcccctaactccgcccatcccgcccctaactccgcccagttccgcccattctccgccccatggctgactaattttttttatttatgcagaggccgaggccgcctcggcctctgagctattccagaagtagtgaggaggcttttttggaggcctaggcttttgcaaaaagctcctcgaggaactgaaaaaccagaaagttaactggtaagtttagtctttttgtcttttatttcaggtcccggatccggtggtggtgcaaatcaaagaactgctcctcagtggatgttgcctttacttctaggcctgtacggaagtgttacttctgctctaaaagctgcggaattgtacccgcggcctaatacgactcactatagggactagtatggttcgaccattgaactgcatcgtcgccgtgtcccaaaatatggggattggcaagaacggagacctaccctggcctccgctcaggaacgagttcaagtacttccaaagaatgaccacaacctcttcagtggaaggtaaacagaatctggtgattatgggtaggaaaacctggttctccattcctgagaagaatcgacctttaaaggacagaattaatatagttctcagtagagaactcaaagaaccaccacgaggagctcattttcttgccaaaagtttagatgatgccttaagacttattgaacaaccggaattggcaagtaaagtagacatggtttggatagtcggaggcagttctgtttaccaggaagccatgaatcaaccaggccacctcagactctttgtgacaaggatcatgcaggaatttgaaagtgacacgtttttcccagaaattgatttggggaaatataaacttctcccagaatacccaggcgtcctctctgaggtccaggaggaaaaaggcatcaagtataagtttgaagtctacgagaagaaagactaagcggccgagcgcgcggatctggaaacgggagatgggggaggctaactgaagcacggaaggagacaataccggaaggaacccgcgctatgacggcaataaaaagacagaataaaacgcacgggtgttgggtcgtttgttcataaacgcggggttcggtcccagggctggcactctgtcgataccccaccgagaccccattggggccaatacgcccgcgtttcttccttttccccaccccaccccccaagttcgggtgaaggcccagggctcgcagccaacgtcggggcggcaggccctgccatagccactggccccgtgggttagggacggggtcccccatggggaatggtttatggttcgtgggggttattattttgggcgttgcgtggggtctggagatcccccgggctgcaggaattccgttacattacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaaagggcgggaattcgagctcggtactcgagcggtgttccgcggtcctcctcgtatagaaactcggaccactctgagacgaaggctcgcgtccaggccagcacgaaggaggctaagtgggaggggtagcggtcgttgtccactagggggtccactcgctccagggtgtgaagacacatgtcgccctcttcggcatcaaggaaggtgattggtttataggtgtaggccacgtgaccgggtgttcctgaaggggggctataaaagggggtgggggcgcgttcgtcctcactctcttccgcatcgctgtctgcgagggccagctgttgggctcgcggtcgaggacaaactcttcgcggtcttcccagtactcttggatcggaaacccgtcggcctccgaacggtactccgccaccgagggacctgagcgagtccgcatcgaccggatcggaaaacctctcgactgttggggtgagtactccctctcaaaagcgggcatgacttctgcgctaagattgtcagtttccaaaaacgaggaggatttgatattcacctggcccgcggtgatgcctttgagggtggccgcgtccatctggtcagaaaagacaatctttttgttgtcaagcttgaggtgtggcaggcttgagatctggccatacacttgagtgacaatgacatccactttgcctttctctccacaggtgtccactcccaggtccaaccggaattgtacccgcggccagagcttgcgggcgccaccgcggccgcggggatccagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggggaggtgtgggaggttttttcggatcctcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctggggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcggggaaaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgttcttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatcccttttaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgacgtctaagaaaccattattatcatgacattaacctataaaaataggcgtatcacgaggccctttcgtctcgcgcgtttcggtgatgacggtgaaaacctctgacacatgcagctcccggagacggtcacagcttgtctgtaagcggatgccgggagcagacaagcccgtcagggcgcgtcagcgggtgttggcgggtgtcggggctggcttaactatgcggcatcagagcagattgtactgagagtgcaccatatgcggtgtgaaataccgcacagatgcgtaaggagaaaataccgcatcaggcgccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcctcttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgccagggttttcccagttacgacgttgtaaaacgacggccagtgaatt
材料和方法:
如下进行所述的构建体转染至293-6E细胞中。所用的细胞是指数生长期的HEK293-6E细胞(0.8至1.5×106细胞/ml),该细胞已经在培养物中传代少于30次;将培养物在新鲜生长培养基中培养至3×105细胞/ml浓度,每三天或四天。生长培养基是补充25ug/ml Geneticin(G418)(GIBCOTMCat.No.10131-027)和0.1%Pluronic F-68(表面活性剂,GIBCOTMCat.No.24040-032)的FreeStyleTM 293表达培养基(GIBCOTMCat.No.12338-018,Invitrogen,Carlsbad,CA)。转染培养基是具有10mM HEPES缓冲溶液ml(GIBCOTMCat.No.15630-080)终浓度的FreeStyleTM 293表达培养基(GIBCOTMCat.No.12338-018)。为了转染,加入选择的载体DNA来获得1μg(重链+轻链)/ml的浓度。接受基于最佳化实验的改变。PEI(聚氮丙啶),线性,25kD,1mg/ml无菌储液,pH7.0(Polysciences,Inc.,Warrington,PA)作为转染介质加入,DNA∶PEI比例为1∶2。所用的Feeding培养基是胰蛋白胨N1培养基(来自Organotchnie France的TN1粉,Cat No.19554,通过TekniScience Inc.Tel#1-800-267-9799可获得)。加入FreeStyleTM293表达培养基的5%w/v储液至0.5%的终浓度。通常使用标准实验室设备。使用Cedex细胞计数系统(Innovatis,Bielefeld,德国)。
如下在125ml锥形烧瓶中进行每个小规模的转染。将等份20ml的新鲜培养基培养1×106细胞/ml的活细胞。(标注:对于更大的体积,培养物应当是容器额定容量的20-25%,例如,500ml烧瓶中100ml培养物)。然后将培养物置于37℃培养箱中,使用5%CO2的潮湿大气和130rpm的转速。
通过在水浴中温热转染培养基至37℃,在室温融化冷冻的PEI储液和DNA溶液(储存在-20℃)来制备DNA-PEI复合物制剂。所用的DNA和PEI的量是基于待转染培养物的总体积。20ml培养物使用2.5mlDNA/PEI复合物,2.5ml Tn1需要总的25μg DNA和50μg PEI。通过混合12.5ml转染培养基至管A中来形成DNA∶PEI复合物(例如,用于十个转染),管A中已经加入了含有10μg/ml终浓度的选择的DNA载体的溶液,并且已经将12.5ml转染培养基加入PEI中(20μg/ml,终浓度)。在与DNA溶液混合之前,通过涡旋将PEI混合物混合约10秒钟。混合PEI和DNA混合物后,通过涡旋10秒钟来混合混合物。然后使混合物在室温静置15分钟(但不超过20分钟)。每20ml HEK-6E细胞加入2.5ml DNA∶PEI复合物溶液。转染后约20至24小时,将5%TN1上清液加入每个烧瓶中至0.5%的终浓度。
在第4天和第7天测定细胞密度和生活力。第4天时从2ml等份试样收集细胞沉淀,用于蛋白质印迹分析和Northern印迹分析。将沉淀在-80℃冷冻直至分析。转染后7天通过在1000rpm离心(10分钟)收集细胞,并使用前置过滤器滤纸和Corning 0.22μm CA过滤系统将上清液过滤。也将上清液样品存储在80℃直至分析,例如使用ELISA测试。
为了进行Northern印迹分析,如下所述从瞬时转染的293-6E细胞中分离出全部RNA。将冷冻的细胞沉淀在冰水融化。使用QiagenRneasy Mini Kit(Qiagen,cat.#74104),按照生产商的说明书,来纯化RNA。
甲醛/琼脂糖凝胶制备如下。将2克琼脂糖(Ambion,cat.#9040)在161.3ml蒸馏水中煮沸。加入4ml 1M MOPS(吗啉代丙烷磺酸)PH7.0,1ml 1M NaOAc,0.4ml 0.5M EDTA,并将混合物冷却至60℃。然后加入33.3ml 37%甲醛(J.T.Baker,cat#2106-01),并温和地混合熔化的琼脂糖溶液。倾倒凝胶且使其在通风橱中固化。
通过混合30ml 1M MOPS,pH 7.0,7ml 1M NaOAc,3ml 0.5M EDTA和DEPC(焦磷酸二乙酯)处理的dH2O至1.5来制备跑胶缓冲液。
通过混合3部分甲醛装载染料(Ambion,cat.#8552)和1部分RNA来制备RNA样品。每个泳道跑3至5μg RNA。使用的RNA分子量标记是0.5-10Kb梯度(Invitrogen,cat.#15623-200)。将样品在65℃加热5分钟来变性并在冰上冷却。然后将0.5μl 10μg/μl溴化乙锭(Pierce,cat.#17898)加入每个样品中。将每个样品简短离心来沉淀液体。
如下进行凝胶电泳。用跑胶缓冲液覆盖甲醛/琼脂糖凝胶,装载样品,然后在通风橱中150V跑胶2小时。使用紫外线投射法观察条带并拍照用于永久记录。
通过将凝胶在DEPC-处理的dH2O几次改变中浸泡五分钟来除去甲醛来进行毛细管转移。然后将凝胶在50mM NaOH,10mM NaCl中室温浸泡20分钟来进一步变性任何双链RNA。将凝胶将DEPC-处理的dH2O中漂洗一次,然后在20×SSC(175.3g NaCl;88.2g柠檬酸钠;用10M NaOH使pH至~7.0,体积调节至1L)中室温浸泡20分钟来中和。浸泡Hybond-N+膜(Amersham Bioscience,cat#RPN303B)并切割成和凝胶一样的大小,在DEPC-处理的dH2O中至湿润。将3M滤纸(Whatman cat#3030917)切割成与凝胶和膜一样的大小。通过将一层3M纸置于20×SSC存储器上方的固体支持物上来装配转移系统,使得纸通过顶部装配的层通过毛细作用带走20×SSC。将凝胶置于该芯上,将Hybond-N+膜,3层3M纸切割大小,和一厚叠凝胶印迹纸(Schleicher&Schuell,cat.#10427920)。将平的支持物置于厚叠的顶部,如果需要,并加上重量(通常是1升瓶装水),来确保有效的毛细管转移。使用塑料包来覆盖任何暴露于空气的存储器来防止蒸发。使转移在室温过夜进行。然后解开转移系统并将印迹浸泡在6×SSC中来除去任何琼脂糖。使膜空气干燥并暴露于UV来交联印迹。
DNA探针模板是D2E7重链和轻链的编码片段。使用AlkPhosDirect Labeling Reagents试剂盒(碱性磷酸酶标记系统,AmershamBiosciences,cat.#RPN3680)根据制造商的说明用碱性磷酸盐标记100ng所需的模板。使用和标记相同的试剂盒(含有杂交缓冲液)来进行预杂交和杂交步骤。将膜在杂交炉中在65℃预杂交至少1小时,然后将探针煮沸并直接加入预杂交缓冲液/印迹中。杂交在杂交炉中65℃进行过夜。滗去杂交溶液,并用2×SSC简短洗涤膜来除去杂交溶液,然后用2×SSC,0.1%SDS在65℃洗涤两次,每次15分钟,最后用0.1×SSC,0.1%SDS在65℃洗涤两次,每次15分钟。为了观察膜上的条带,使用化学发光。用CDP-Star检测试剂(碱性磷酸酶-从1,2-dioxetane底物的photope单独生产,Amersham Biociences,cat.#RPN3682)覆盖印迹,在室温持续5分钟。从印迹排出过多的试剂,然后将它们装入塑料层保护装置中。将印迹暴露于Kodak Biomax MR膜(x射线膜,Kodak,cat.#8952855),开始10秒钟至高达10分钟。使用Kodak M35A X-OMAT处理器(x射线展开仪/处理器)将膜展开。
如小制备用于蛋白质印迹的细胞沉淀样品。为了胞内抗体表达分析,将细胞在NP40裂解缓冲液(50mM Tris-HCl,pH7.5,150mM NaCl,1%NP40(辛基苯酚聚(ethyleneglycolether)),5mM BME和蛋白酶抑制剂混合物III中裂解,在冰上孵育10分钟。使用离心机在16,000rpm离心30分钟来收集用于膜的部分和可溶性蛋白质。将称为可溶性胞内或细胞质部分的上清液用于凝胶分析,添加含有DTT的SDS装载缓冲液。用等体积的裂解缓冲液悬浮沉淀,并加入含有DTT的SDS凝胶装载缓冲液。如下制备用于蛋白质印迹的培养物上清液样品。使用30,000道尔顿MW截留的Centricon Ultra(超滤装置,Millipore)将培养物上清液浓缩,或直接用于蛋白质印迹。为了免疫印迹(蛋白质印迹分析),将样品溶解于NUPAGE 4-12%Bis-Tris(聚丙烯酰胺)凝胶上并使用标准方法转移至PVDF膜上。将膜在阻断溶液(含有0.05%吐温20(聚氧乙烯脱水山梨醇单月桂酸酯)和5%奶粉的PBS)中孵育1h,洗涤,用来自DakoCytomation(丹麦)的以1∶1000稀释于PBST缓冲液中的多克隆兔子抗人IgG/HRP或多克隆兔子抗人κ轻链/HRP孵育,然后在室温的PBST的三次更换中再次洗涤。将来自GE/Amersham Biosciences(Piscataway,NJ)的ECL Plus蛋白质印迹检测(化学发光和化学荧光检测)系统用于检测。
使用标准方法进行ELISA测试,使用来自Southern Biotech(Birmingham,AL)的山羊抗人IgG,UNLB和山羊抗人IgG/HRP,PBS中的2%奶粉作为阻断缓冲液,K-Blue(3,3’,5,5’-四甲基联苯胺和过氧化氢(H2O2,Neogen,Lansing,MI)作为底物。使用Spectramax微平板阅读器在650nM的主波长和490nm的参照波长阅读平板。
使用标准方法亲和性纯化分泌的抗体,使用来自Invitrogen(Carlsbad,CA)的蛋白A琼脂糖珠,来自Pierce的免疫纯(A)IgG结合缓冲液,PBS,pH7.4作为洗涤缓冲液,和0.1M醋酸/150mM NaCl,pH3.5作为洗脱缓冲液(使用1M Tris pH 9.5中和的)。
完整分子量的测定。通过LC-MS分析从构建体pTT3HC-int-LCP.hori产生的D2E7样品的完整分子量。具有蛋白microtrap(MichromBioresources,Inc.cat.004/25109/03)的1100毛细管HPLC系统(AglientSN DE 14900659)用来脱盐并将样品引入Q Star Pulsar i质谱仪中(Applied Biosystems,SN K1820202)。为了洗脱样品,用缓冲液A(HPLC水中的0.08%FA,0.02%TFA)和缓冲液B(乙腈中0.08%FA和0.02%TFA)运行梯度,以50μL/min的流速,持续15分钟。
轻链和重链分子量的测定。通过LC-MS分析从构建体pTT3HC-int-LC P.hori产生的天然D2E7样品的完整分子量。在20mM DTT中在30℃进行连接轻链和重链的二硫键的还原30分钟。具有PLRP-S柱(Michrom Bioresources,Inc.8μm,4000
,1.0×150mm,P/N901-00911-00)的1100毛细管HPLC系统(Aglient SN DE 14900659)用来分离轻链和重链并将它们引入Q Star Pulsar i质谱仪中(AppliedBiosystems,SN K1820202)。在60℃加热柱子。用缓冲液A(HPLC水中的0.08%FA,0.02%TFA)和缓冲液B(乙腈中0.08%FA和0.02%TFA)运行HPLC梯度,以50μL/min的流速,运行60分钟来洗脱样品。
限制性核酸内切酶来自New England Biolabs(Beverly,MA)。用于克隆的Custom寡核苷酸,DNA聚合酶,DNA连接酶和大肠杆菌菌株来自Invitrogen(Carlsbad,CA)。蛋白酶抑制剂混合物III来自Calbiochem(La Jolla,CA)。Qiagen(Valencia,CA)产物用于DNA连接和纯化。
关于引入作为参考文献和变化的陈述
在整个申请中提及的所有参考文献,例如,专利文件,包括颁布或授权的专利或等价物;专利申请公开;未公开的专利申请;和非专利文献文件或其他来源的材料;在此以其整体引入作为参考,如同单独引入作为参考一样。在所引用的参考文献和本申请公开内容之间任何矛盾的情况中,在此的公开内容优先。在此提供的一些参考文献引入作为参考来提供信息,例如,关于本发明的原料来源,其他原料,其他试剂,其他合成方法,其他分析方法,其它生物材料,其它细胞和其他用途的详细内容。
在此提及的所有专利和出版物表示本发明所属领域技术人员的技术水平。在此所引用的参考文献表示公开或申请日时的现有技术,并且确定在此可以使用该信息,如果需要,排除具有资格的现有技术中的特定实施方案。例如,当在此要求物质的组成时,应当理解在此要求的物质组成中不打算包括已知的并按照关于申请人发明的有资格的现有技术可以获得的化合物,包括为此在此引用的参考文献中提供了授权公开内容的化合物。
在此的任何附录或附加内容引入作为参考,作为说明书和/或附图的一部分。
在此所用的术语“包括”,“包含”,“含有”或“是包括”,将它们解释为详细说明所述特征,整体,步骤或组成部分的存在,但不排除一个或多个其他特征,整体,步骤或组成部分或其组的存在或添加。因此,如在此所用的,包含与包括、含有、具有或特征在于是同义词,并且是包括式的或开放式的。如在此所用的,“由......组成”排除权利要求描述中没有具体说明的任何要素,步骤和成分等。如在此所用的“基本上由......组成”没有排除没有显著影响权利要求基本和新的特征的物质或步骤(例如,关于活性成分)。在在此的每个情况中,术语“包括”、“基本上由......组成”和“由......组成”中的任何一个可以由其他两个术语中的任一个替代,因此公开了不必定是共生的分开的实施方案和/或范围。可以在在此没有特异性公开的任何要素或限制不存在下实践在此适当地说明性描述的本发明。
无论何时在此公开的范围,例如,温度范围,时间范围,组成或浓度范围,或其他数值范围等,确定公开内容中包括给定的范围中包括的所有中间范围和子范围以及所有单个数值。本发明不受公开的实施方案的限制,包括附图中所示的或说明书中举例说明的任何内容,其通过实施例或说明给出并且没有限制。将理解在此描述中包括的范围或子范围中的任何子范围或单个数值可以从在此的权利要求中排除出去。
已经参照各种特定的和/或优选的实施方案和技术描述了本发明。然而,应当理解可以形成许多变化和改变,同时保持在本发明的精神和范围内。本领域技术人员将清楚在此特意公开的那些以外的组合物,方法,装置,装置部件,材料,程序和技术可以用于本发明的实践中,如在此宽泛地公开的而没有采取不适当的实验;例如,这可以延伸至特意举例说明的那些以外的原料,生物材料,试剂,合成方法,纯化方法,分析方法,测试方法和生物方法。本发明包括在此之前所述的所有本领域已知的功能性等价物(例如,组合物,方法,装置,装置部件,材料,程序和技术等)。已经使用的术语和表述可以用作说明的术语并且没有限制,不存在使用这样的术语和表述排除所示和所述特征的任何等价物或其部分的意图,而是认识到各种改变在所要求的本发明的范围内是可能的。因此,应当理解尽管已经通过实施方案,优选实施方案和任选的特征特意公开了本发明,本领域技术人员可以采取在此公开的概念的改变和变化,并且认为这样的改变和变化是在所附权利要求限定的本发明范围之内的。
其他参考文献
US 6258562,US 6090382;US 6455275;EP1080206B1;WO 9960135;US 5912167;US 5162601;WO 199521249A1;US 5149783;US 5955072;US5532142;US 20040224391;US 6537806;US 5846767;US 20030099932;WO9958663;US 20030157641;US 2003048306A2;US 6114146;US 6060273;US5925565;US 20040241821;WO 2003100021A2;WO 2003100022A2;US20040265955;US 20050003482;US 20050042721;WO 2005017149;WO2004113493;US 20050136035;WO 2004108893;US 6692736;US 20050147962;US 6331415;US 6632637;US 20040063186;US 7026526;US 6365377;WO2005123915;US 5665567;WO 9741241A1;EP 0701616B1;US 20060010506;WO2006048459;US 6852510;WO 2005072129;US 5648254;US 6908751;US20050221429;WO 2005071088;WO 2005108585;WO 2005085456;US 7029876;US 6638762;US 6544780;US 5519164;WO 2003031630;US 6294353;WO2005047512;US 7052905;US 7018833;US 20020034814;US 20040126883;US20050002907;US 20050112095;US 20050214258;EP 0598029
Mathys S等,1999,Gene 231(1-2):1-13,Characterization of a self-splicing mini-intein and its conversion into autocatalytic N-andC-terminal cleavage elements:facile production of protein building blocksfor protein ligation。(自我剪接迷你蛋白内含子的特征及其转化成自催化的N-和C-端裂解序列:用于蛋白质连接的蛋白质砌块的易化产生)。
序列表
<110>(APPLICANT)Abbott Laboratories
(AGENT)Greenlee,Winner and Sullivan,P.C.
CARSON,Gerald R.
GION,Wendy
SALFELD,Jochen G.
GU,Jijie
REGIER,Dean A.
KUNES,Yune
<120>包括SORF构建体的多基因表达和使用多蛋白、前体蛋白和蛋白酶解的方法
<130>74-05_WO
<140>PCT/US 06/______________(to is assigned)
<141>2006-07-21
<150>US 60/701,855
<151>2005-07-21
<160>158
<170>PatentIn version 3.3
<210>1
<211>4
<212>PRT
<213>人造
<220>
<223>合成:弗林蛋白酶的裂解识别位点。
<220>
<221>MISC_FEATURE
<222>(2)..(3)
<223>在位置2,Xaa可以是任何氨基酸,在位置3,Xaa
可以是Arg或Lys.
<400>1
Arg Xaa Xaa Arg
1
<210>2
<211>5
<212>PRT
<213>人造
<220>
<223>IPNV的VP4的识别序列。
<220>
<221>MISC_FEATURE
<222>(1)..(4)
<223>在位置1,Xaa可以是Ser或Thr,在位置4,Xaa可以
是Ser或Ala.
<400>2
Xaa Xaa Ala Xaa Gly
1 5
<210>3
<211>7
<212>PRT
<213>人造
<220>
<223>TEV蛋白酶的识别序列。
<220>
<221>misc_feature
<222>(2)..(3)
<223>Xaa可以是任何天然产生的氨基酸
<220>
<221>misc_feature
<222>(5)..(5)
<223>Xaa可以是任何天然产生的氨基酸
<400>3
Glu Xaa Xaa Tyr Xaa Gln Gly
1 5
<210>4
<211>8
<212>PRT
<213>人造
<220>
<223>鼻病毒3C蛋白酶的识别位点
<400>4
Leu Glu Val Leu Phe Gln Gly Pro
1 5
<210>5
<211>6
<212>PRT
<213>人造
<220>
<223>PC5/6蛋白质酶,LPC/PC7蛋白酶和肠激酶的识别序列。
<220>
<221>MISC_FEATURE
<222>(6)..(6)
<223>Xaa可以是任何氨基酸。
<400>5
Asp Asp Asp Asp Lys Xaa
1 5
<210>6
<211>5
<212>PRT
<213>人造
<220>
<223>因子Xa蛋白质酶的识别序列
<220>
<221>MISC_FEATURE
<222>(2)..(5)
<223>在位置2Xaa是Glu或Asp,在位置5Xaa可以是任何氨基酸。
<400>6
Ile Xaa Gly Arg Xaa
1 5
<210>7
<211>7
<212>PRT
<213>人造
<220>
<223>凝血酶的识别序列。
<400>7
Leu Val Gly Pro Arg Gly Ser
1 5
<210>8
<211>6
<212>PRT
<213>人造
<220>
<223>genenase I的识别序列。
<400>8
Pro Gly Ala Ala His Tyr
1 5
<210>9
<211>7
<212>PRT
<213>人造
<220>
<223>MMP蛋白酶,芜菁花叶病毒和KEX2蛋白酶的识别序列
<400>9
Met Tyr Lys Arg Glu Ala Asp
1 5
<210>10
<211>4
<212>PRT
<213>人造
<220>
<223>将蛋白靶向Trans Golgi网络的弗林蛋白酶的氨基酸序列。
<400>10
Glu Glu Asp Glu
1
<210>11
<211>24
<212>PRT
<213>人造
<220>
<223>C型流感病毒的内部可裂解信号肽。
<400>11
Met Gly Arg Met Ala Met Lys Trp Leu Val Val Ile Ile Cys Phe Ser
1 5 10 15
Ile Thr Ser Gln Pro Ala Ser Ala
20
<210>12
<211>19
<212>PRT
<213>人造
<220>
<223>FMDV 2A序列
<400>12
Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn
1 5 10 15
Pro Gly Pro
<210>13
<211>19
<212>PRT
<213>人造
<220>
<223>FMDV 2A序列.
<400>13
Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn
1 5 10 15
Pro Gly Pro
<210>14
<211>14
<212>PRT
<213>人造
<220>
<223>FDMV 2A序列.
<400>14
Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro
1 5 10
<210>15
<211>20
<212>PRT
<213>人造
<220>
<223>2A序列的变体。
<400>15
Gln Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser
1 5 10 15
Asn Pro Gly Pro
20
<210>16
<211>19
<212>PRT
<213>人造
<220>
<223>2A序列的变体。
<400>16
Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly
1 5 10 15
Pro Phe Phe
<210>17
<211>14
<212>PRT
<213>人造
<220>
<223>2A序列的变体。
<400>17
Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro
1 5 10
<210>18
<211>17
<212>PRT
<213>人造
<220>
<223>2A序列的变体。
<400>18
Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly
1 5 10 15
Pro
<210>19
<211>24
<212>PRT
<213>人造
<220>
<223>2A序列的变体。
<400>19
Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly
1 5 10 15
Asp Val Glu Ser Asn Pro Gly Pro
20
<210>20
<211>58
<212>PRT
<213>人造
<220>
<223>2A序列的变体。
<400>20
Val Thr Glu Leu Leu Tyr Arg Met Lys Arg Ala Glu Thr Tyr Cys Pro
1 5 10 15
Arg Pro Leu Leu Ala Ile His Pro Thr Glu Ala Arg His Lys Gln Lys
20 25 30
Ile Val Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu
35 40 45
Ala Gly Asp Val Glu Ser Asn Pro Gly Pro
50 55
<210>21
<211>10
<212>PRT
<213>人造
<220>
<223>D2E7免疫球蛋白重链的N-端序列。
<400>21
Glu Val Gln Leu Val Glu Ser Gly Gly Gly
1 5 10
<210>22
<211>10
<212>PRT
<213>人造
<220>
<223>D2E7免疫球蛋白轻链的N-端序列。
<400>22
Asp Ile Gln Met Thr Gln Ser Pro Ser Ser
1 5 10
<210>23
<211>22
<212>PRT
<213>人造
<220>
<223>D2E7轻链信号序列。
<400>23
Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp
1 5 10 15
Phe Pro Gly Ser Arg Cys
20
<210>24
<211>20
<212>PRT
<213>人造
<220>
<223>构建体H中D2E7信号肽序列。
<400>24
Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Asp Glu Trp Phe Pro
1 5 10 15
Gly Ser Arg Cys
20
<210>25
<211>15
<212>PRT
<213>人造
<220>
<223>构建体J中蛋白内含子结束处和轻链蛋白开始处的氨基酸序列。
<400>25
Met Asp Met Arg Val Pro Ala Gln Trp Phe Pro Gly Ser Arg Cys
1 5 10 15
<210>26
<211>10
<212>PRT
<213>人造
<220>
<223>构建体H中轻链的N-端序列。
<400>26
Met Asp Met Arg Val Pro Ala Gln Leu Leu
1 5 10
<210>27
<211>22
<212>PRT
<213>人造
<220>
<223>构建体L中蛋白内含子后的氨基酸序列。
<400>27
Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp
1 5 10 15
Phe Pro Gly Ser Gly Gly
20
<210>28
<211>10
<212>PRT
<213>人造
<220>
<223>信号肽酶裂解位点序列。
<400>28
Leu Ala Gly Phe Ala Thr Val Ala Gln Ala
1 5 10
<210>29
<211>2925
<212>DNA
<213>人造
<220>
<223>合成构建体,D2E7 LC-LC-HC多聚蛋白编码序列。
<220>
<221>CDS
<222>(1)..(2922)
<400>29
atg gac atg cgc gtg ccc gcc cag ctg ctg ggc ctg ctg ctg ctg tgg 48
Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp
1 5 10 15
ttc ccc ggc tcg cga tgc gac atc cag atg acc cag tct cca tcc tcc 96
Phe Pro Gly Ser Arg Cys Asp Ile Gln Met Thr Gln Ser Pro Ser Ser
20 25 30
ctg tct gca tct gta ggg gac aga gtc acc atc act tgt cgg gca agt 144
Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser
35 40 45
cag ggc atc aga aat tac tta gcc tgg tat cag caa aaa cca ggg aaa 192
Gln Gly Ile Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys
50 55 60
gcc cct aag ctc ctg atc tat gct gca tcc act ttg caa tca ggg gtc 240
Ala Pro Lys Leu Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val
65 70 75 80
cca tct cgg ttc agt ggc agt gga tct ggg aca gat ttc act ctc acc 288
Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr
85 90 95
atc agc agc cta cag cct gaa gat gtt gca act tat tac tgt caa agg 336
Ile Ser Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg
100 105 110
tat aac cgt gca ccg tat act ttt ggc cag ggg acc aag gtg gaa atc 384
Tyr Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile
115 120 125
aaa cgt acg gtg gct gca cca tct gtc ttc atc ttc ccg cca tct gat 432
Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp
130 135 140
gag cag ttg aaa tct gga act gcc tct gtt gtg tgc ctg ctg aat aac 480
Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn
145 150 155 160
ttc tat ccc aga gag gcc aaa gta cag tgg aag gtg gat aac gcc ctc 528
Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu
165 170 175
caa tcg ggt aac tcc cag gag agt gtc aca gag cag gac agc aag gac 576
Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp
180 185 190
agc acc tac agc ctc agc agc acc ctg acg ctg agc aaa gca gac tac 624
Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr
195 200 205
gag aaa cac aaa gtc tac gcc tgc gaa gtc acc ca cag ggc ctg agc 672
Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser
210 215 220
tcg ccc gtc aca aag agc ttc aac agg gga agg tgt aag aga ctt ctc 720
Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Arg Cys Lys Arg Leu Leu
225 230 235 240
aag ttg gca gga gac gtt gag tcc aac cct ggg ccc atg gac atg cgc 768
Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro Met Asp Met Arg
245 250 255
gtg ccc gcc cag ctg ctg ggc ctg ctg ctg ctg tgg ttc ccc ggc tcg 816
Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe Pro Gly Ser
260 265 270
cga tgc gac atc cag atg acc cag tct cca tcc tcc ctg tct gca tct 864
Arg Cys Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser
275 280 285
gta ggg gac aga gtc acc atc act tgt cgg gca agt cag ggc atc aga 912
Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Arg
290 295 300
aat tac tta gcc tgg tat cag caa aaa cca ggg aaa gcc cct aag ctc 960
Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu
305 310 315 320
ctg atc tat gct gca tcc act ttg caa tca ggg gtc cca tct cgg ttc 1008
Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val Pro Ser Arg Phe
325 330 335
agt ggc agt gga tct ggg aca gat ttc act ctc acc atc agc agc cta 1056
Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu
340 345 350
cag cct gaa gat gtt gca act tat tac tgt caa agg tat aac cgt gca 1104
Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg Tyr Asn Arg Ala
355 360 365
ccg tat act ttt ggc cag ggg acc aag gtg gaa atc aaa cgt acg gtg 1152
Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val
370 375 380
gct gca cca tct gtc ttc atc ttc ccg cca tct gat gag cag ttg aaa 1200
Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys
385 390 395 400
tct gga act gcc tct gtt gtg tgc ctg ctg aat aac ttc tat ccc aga 1248
Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg
405 410 415
gag gcc aaa gta cag tgg aag gtg gat aac gcc ctc caa tcg ggt aac 1296
Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn
420 425 430
tcc cag gag agt gtc aca gag cag gac agc aag gac agc acc tac agc 1344
Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser
435 440 445
ctc agc agc acc ctg acg ctg agc aaa gca gac tac gag aaa cac aaa 1392
Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys
450 455 460
gtc tac gcc tgc gaa gtc acc cat cag ggc ctg agc tcg ccc gtc aca 1440
Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr
4654 70 475 480
aag agc ttc aac agg gga agg tgt aag aga ctt ctc aag ttg gca gga 1488
Lys Ser Phe Asn Arg Gly Arg Cys Lys Arg Leu Leu Lys Leu Ala Gly
485 490 495
gac gtt gag tcc aac cct ggg ccc atg gag ttt ggg ctg agc tgg ctt 1536
Asp Val Glu Ser Asn Pro Gly Pro Met Glu Phe Gly Leu Ser Trp Leu
500 505 510
ttt ctt gtc gcg att tta aaa ggt gtc cag tgt gag gtg cag ctg gtg 1584
Phe Leu Val Ala Ile Leu Lys Gly Val Gln Cys Glu Val Gln Leu Val
515 520 525
gag tct ggg gga ggc ttg gta cag ccc ggc agg tcc ctg aga ctc tcc 1632
Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Arg Ser Leu Arg Leu Ser
530 535 540
tgt gcg gcc tct gga ttc acc ttt gat gat tat gcc atg cac tgg gtc 1680
Cys Ala Ala Ser Gly Phe Thr Phe Asp Asp Tyr Ala Met His Trp Val
545 550 555 560
cgg caa gct cca ggg aag ggc ctg gaa tgg gtc tca gct atc act tgg 1728
Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val Ser Ala Ile Thr Trp
565 570 575
aat agt ggt cac ata gac tat gcg gac tct gtg gag ggc cga ttc acc 1776
Asn Ser Gly His Ile Asp Tyr Ala Asp Ser Val Glu Gly Arg Phe Thr
580 585 590
atc tcc aga gac aac gcc aag aac tcc ctg tat ctg caa atg aac agt 1824
Ile Ser Arg Asp Asn Ala Lys Asn Ser Leu Tyr Leu Gln Met Asn Ser
595 600 605
ctg aga gct gag gat acg gcc gta tat tac tgt gcg aaa gtc tcg tac 1872
Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys Ala Lys Val Ser Tyr
610 615 620
ctt agc acc gcg tcc tcc ctt gac tat tgg ggc caa ggt acc ctg gtc 1920
Leu Ser Thr Ala Ser Ser Leu Asp Tyr Trp Gly Gln Gly Thr Leu Val
6256 30 635 640
acc gtc tcg agt gcg tcg acc aag ggc cca tcg gtc ttc ccc ctg gca 1968
Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala
645 650 655
ccc tcc tcc aag agc acc tct ggg ggc aca gcg gcc ctg ggc tgc ctg 2016
Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu
660 665 670
gtc aag gac tac ttc ccc gaa ccg gtg acg gtg tcg tgg aac tca ggc 2064
Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly
675 680 685
gcc ctg acc agc ggc gtg cac acc ttc ccg gct gtc cta cag tcc tca 2112
Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser
690 695 700
gga ctc tac tcc ctc agc agc gtg gtg acc gtg ccc tcc agc agc ttg 2160
Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu
705 710 715 720
ggc acc cag acc tac atc tgc aac gtg aat cac aag ccc agc aac acc 2208
Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr
725 730 735
aag gtg gac aag aaa gtt gag ccc aaa tct tgt gac aaa act cac aca 2256
Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr
740 745 750
tgc cca ccg tgc cca gca cct gaa ctc ctg ggg gga ccg tca gtc ttc 2304
Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe
755 760 765
ctc ttc ccc cca aaa ccc aag gac acc ctc atg atc tcc cgg acc cct 2352
Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro
770 775 780
gag gtc aca tgc gtg gtg gtg gac gtg agc cac gaa gac cct gag gtc 2400
Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val
785 790 795 800
aag ttc aac tgg tac gtg gac ggc gtg gag gtg cat aat gcc aag aca 2448
Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr
805 810 815
aag ccg cgg gag gag cag tac aac agc acg tac cgt gtg gtc agc gtc 2496
Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val
820 825 830
ctc acc gtc ctg cac cag gac tgg ctg aat ggc aag gag tac aag tgc 2544
Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys
835 840 845
aag gtc tcc aac aaa gcc ctc cca gcc ccc atc gag aaa acc atc tcc 2592
Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser
850 855 860
aaa gcc aaa ggg cag ccc cga gaa cca cag gtg tac acc ctg ccc cca 2640
Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro
865 870 875 880
tcc cgg gat gag ctg acc aag aac cag gtc agc ctg acc tgc ctg gtc 2688
Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val
885 890 895
aaa ggc ttc tat ccc agc gac atc gcc gtg gag tgg gag agc aat ggg 2736
Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly
900 905 910
cag ccg gag aac aac tac aag acc acg cct ccc gtg ctg gac tcc gac 2784
Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp
915 920 925
ggc tcc ttc ttc ctc tac agc aag ctc acc gtg gac aag agc agg tgg 2832
Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp
930 935 940
cag cag ggg aac gtc ttc tca tgc tcc gtg atg cat gag gct ctg cac 2880
Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His
945 950 955 960
aac cac tac acg cag aag agc ctc tcc ctg tct ccg ggt aaa tga 2925
Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
965 970
<210>30
<211>974
<212>PRT
<213>人造
<220>
<223>合成构建体
<400>30
Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp
1 5 10 15
Phe Pro Gly Ser Arg Cys Asp Ile Gln Met Thr Gln Ser Pro Ser Ser
20 25 30
Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser
35 40 45
Gln Gly Ile Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys
50 55 60
Ala Pro Lys Leu Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val
65 70 75 80
Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr
85 90 95
Ile Ser Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg
100 105 110
Tyr Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile
115 120 125
Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp
130 135 140
Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn
145 150 155 160
Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu
165 170 175
Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp
180 185 190
Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr
195 200 205
Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser
210 215 220
Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Arg Cys Lys Arg Leu Leu
225 230 235 240
Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro Met Asp Met Arg
245 250 255
Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe Pro Gly Ser
260 265 270
Arg Cys Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser
275 280 285
Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Arg
290 295 300
Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu
305 310 315 320
Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val Pro Ser Arg Phe
325 330 335
Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu
340 345 350
Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg Tyr Asn Arg Ala
355 360 365
Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val
370 375 380
Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys
385 390 395 400
Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg
405 410 415
Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn
420 425 430
Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser
435 440 445
Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys
450 455 460
Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr
465 470 475 480
Lys Ser Phe Asn Arg Gly Arg Cys Lys Arg Leu Leu Lys Leu Ala Gly
485 490 495
Asp Val Glu Ser Asn Pro Gly Pro Met Glu Phe Gly Leu Ser Trp Leu
500 505 510
Phe Leu Val Ala Ile Leu Lys Gly Val Gln Cys Glu Val Gln Leu Val
515 520 525
Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Arg Ser Leu Arg Leu Ser
530 535 540
Cys Ala Ala Ser Gly Phe Thr Phe Asp Asp Tyr Ala Met His Trp Val
545 550 555 560
Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val Ser Ala Ile Thr Trp
565 570 575
Asn Ser Gly His Ile Asp Tyr Ala Asp Ser Val Glu Gly Arg Phe Thr
580 585 590
Ile Ser Arg Asp Asn Ala Lys Asn Ser Leu Tyr Leu Gln Met Asn Ser
595 600 605
Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys Ala Lys Val Ser Tyr
610 615 620
Leu Ser Thr Ala Ser Ser Leu Asp Tyr Trp Gly Gln Gly Thr Leu Val
625 630 635 640
Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala
645 650 655
Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu
660 665 670
Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly
675 680 685
Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser
690 695 700
Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu
705 710 715 720
Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr
725 730 735
Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr
740 745 750
Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe
755 760 765
Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro
770 775 780
Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val
785 790 795 800
Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr
805 810 815
Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val
820 825 830
Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys
835 840 845
Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser
850 855 860
Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro
865 870 875 880
Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val
885 890 895
Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly
900 905 910
Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp
915 920 925
Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp
930 935 940
Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His
945 950 955 960
Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
965 970
<210>31
<211>10323
<212>DNA
<213>人造
<220>
<223>合成构建体,D2E7LC-LC-HC多聚蛋白表达载体。
<400>31
gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc 60
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 120
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 180
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 240
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 300
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 360
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 420
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 480
cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg 540
tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg 600
aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg 660
gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag 720
gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc 780
tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa 840
actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact 900
ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt 960
ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca 1020
aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt 1080
ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga 1140
tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca 1200
ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggac 1260
atgcgcgtgc ccgcccagct gctgggcctg ctgctgctgt ggttccccgg ctcgcgatgc 1320
gacatccaga tgacccagtc tccatcctcc ctgtctgcat ctgtagggga cagagtcacc 1380
atcacttgtc gggcaagtca gggcatcaga aattacttag cctggtatca gcaaaaacca 1440
gggaaagccc ctaagctcct gatctatgct gcatccactt tgcaatcagg ggtcccatct 1500
cggttcagtg gcagtggatc tgggacagat ttcactctca ccatcagcag cctacagcct 1560
gaagatgttg caacttatta ctgtcaaagg tataaccgtg caccgtatac ttttggccag 1620
gggaccaagg tggaaatcaa acgtacggtg gctgcaccat ctgtcttcat cttcccgcca 1680
tctgatgagc agttgaaatc tggaactgcc tctgttgtgt gcctgctgaa taacttctat 1740
cccagagagg ccaaagtaca gtggaaggtg gataacgccc tccaatcggg taactcccag 1800
gagagtgtca cagagcagga cagcaaggac agcacctaca gcctcagcag caccctgacg 1860
ctgagcaaag cagactacga gaaacacaaa gtctacgcct gcgaagtcac ccatcagggc 1920
ctgagctcgc ccgtcacaaa gagcttcaac aggggaaggt gtaagagact tctcaagttg 1980
gcaggagacg ttgagtccaa ccctgggccc atggacatgc gcgtgcccgc ccagctgctg 2040
ggcctgctgc tgctgtggtt ccccggctcg cgatgcgaca tccagatgac ccagtctcca 2100
tcctccctgt ctgcatctgt aggggacaga gtcaccatca cttgtcgggc aagtcagggc 2160
atcagaaatt acttagcctg gtatcagcaa aaaccaggga aagcccctaa gctcctgatc 2220
tatgctgcat ccactttgca atcaggggtc ccatctcggt tcagtggcag tggatctggg 2280
acagatttca ctctcaccat cagcagccta cagcctgaag atgttgcaac ttattactgt 2340
caaaggtata accgtgcacc gtatactttt ggccagggga ccaaggtgga aatcaaacgt 2400
acggtggctg caccatctgt cttcatcttc ccgccatctg atgagcagtt gaaatctgga 2460
actgcctctg ttgtgtgcct gctgaataac ttctatccca gagaggccaa agtacagtgg 2520
aaggtggata acgccctcca atcgggtaac tcccaggaga gtgtcacaga gcaggacagc 2580
aaggacagca cctacagcct cagcagcacc ctgacgctga gcaaagcaga ctacgagaaa 2640
cacaaagtct acgcctgcga agtcacccat cagggcctga gctcgcccgt cacaaagagc 2700
ttcaacaggg gaaggtgtaa gagacttctc aagttggcag gagacgttga gtccaaccct 2760
gggcccatgg agtttgggct gagctggctt tttcttgtcg cgattttaaa aggtgtccag 2820
tgtgaggtgc agctggtgga gtctggggga ggcttggtac agcccggcag gtccctgaga 2880
ctctcctgtg cggcctctgg attcaccttt gatgattatg ccatgcactg ggtccggcaa 2940
gctccaggga agggcctgga atgggtctca gctatcactt ggaatagtgg tcacatagac 3000
tatgcggact ctgtggaggg ccgattcacc atctccagag acaacgccaa gaactccctg 3060
tatctgcaaa tgaacagtct gagagctgag gatacggccg tatattactg tgcgaaagtc 3120
tcgtacctta gcaccgcgtc ctcccttgac tattggggcc aaggtaccct ggtcaccgtc 3180
tcgagtgcgt cgaccaaggg cccatcggtc ttccccctgg caccctcctc caagagcacc 3240
tctgggggca cagcggccct gggctgcctg gtcaaggact acttccccga accggtgacg 3300
gtgtcgtgga actcaggcgc cctgaccagc ggcgtgcaca ccttcccggc tgtcctacag 3360
tcctcaggac tctactccct cagcagcgtg gtgaccgtgc cctccagcag cttgggcacc 3420
cagacctaca tctgcaacgt gaatcacaag cccagcaaca ccaaggtgga caagaaagtt 3480
gagcccaaat cttgtgacaa aactcacaca tgcccaccgt gcccagcacc tgaactcctg 3540
gggggaccgt cagtcttcct cttcccccca aaacccaagg acaccctcat gatctcccgg 3600
acccctgagg tcacatgcgt ggtggtggac gtgagccacg aagaccctga ggtcaagttc 3660
aactggtacg tggacggcgt ggaggtgcat aatgccaaga caaagccgcg ggaggagcag 3720
tacaacagca cgtaccgtgt ggtcagcgtc ctcaccgtcc tgcaccagga ctggctgaat 3780
ggcaaggagt acaagtgcaa ggtctccaac aaagccctcc cagcccccat cgagaaaacc 3840
atctccaaag ccaaagggca gccccgagaa ccacaggtgt acaccctgcc cccatcccgg 3900
gatgagctga ccaagaacca ggtcagcctg acctgcctgg tcaaaggctt ctatcccagc 3960
gacatcgccg tggagtggga gagcaatggg cagccggaga acaactacaa gaccacgcct 4020
cccgtgctgg actccgacgg ctccttcttc ctctacagca agctcaccgt ggacaagagc 4080
aggtggcagc aggggaacgt cttctcatgc tccgtgatgc atgaggctct gcacaaccac 4140
tacacgcaga agagcctctc cctgtctccg ggtaaatgag aattagtcta ctcgcaaggg 4200
gcggccgcgt ttaaactgaa tgagcgcgtc catccagaca tgataagata cattgatgag 4260
tttggacaaa ccacaactag aatgcagtga aaaaaatgct ttatttgtga aatttgtgat 4320
gctattgctt tatttgtaac cattataagc tgcaataaac aagttaacaa caacaattgc 4380
attcatttta tgtttcaggt tcagggggag gtgtgggagg ttttttaaag caagtaaaac 4440
ctctacaaat gtggtatggc tgattatgat ccggctgcct cgcgcgtttc ggtgatgacg 4500
gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 4560
ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggcgcag 4620
ccatgaccgg tcgacggcgc gccttttttt ttaattttta ttttatttta tttttgacgc 4680
gccgaaggcg cgatctgagc tcggtacagc ttggctgtgg aatgtgtgtc agttagggtg 4740
tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc 4800
agcaaccagg tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca 4860
tctcaattag tcagcaacca tagtcccgcc cctaactccg cccatcccgc ccctaactcc 4920
gcccagttcc gcccattctc cgccccatgg ctgactaatt ttttttattt atgcagaggc 4980
cgaggccgcc tcggcctctg agctattcca gaagtagtga ggaggctttt ttggaggcct 5040
aggcttttgc aaaaagctcc tcgaggaact gaaaaaccag aaagttaact ggtaagttta 5100
gtctttttgt cttttatttc aggtcccgga tccggtggtg gtgcaaatca aagaactgct 5160
cctcagtgga tgttgccttt acttctaggc ctgtacggaa gtgttacttc tgctctaaaa 5220
gctgcggaat tgtacccgcg gcctaatacg actcactata gggactagta tggttcgacc 5280
attgaactgc atcgtcgccg tgtcccaaaa tatggggatt ggcaagaacg gagacctacc 5340
ctggcctccg ctcaggaacg agttcaagta cttccaaaga atgaccacaa cctcttcagt 5400
ggaaggtaaa cagaatctgg tgattatggg taggaaaacc tggttctcca ttcctgagaa 5460
gaatcgacct ttaaaggaca gaattaatat agttctcagt agagaactca aagaaccacc 5520
acgaggagct cattttcttg ccaaaagttt agatgatgcc ttaagactta ttgaacaacc 5580
ggaattggca agtaaagtag acatggtttg gatagtcgga ggcagttctg tttaccagga 5640
agccatgaat caaccaggcc acctcagact ctttgtgaca aggatcatgc aggaatttga 5700
aagtgacacg tttttcccag aaattgattt ggggaaatat aaacttctcc cagaataccc 5760
aggcgtcctc tctgaggtcc aggaggaaaa aggcatcaag tataagtttg aagtctacga 5820
gaagaaagac taagcggccg agcgcgcgga tctggaaacg ggagatgggg gaggctaact 5880
gaagcacgga aggagacaat accggaagga acccgcgcta tgacggcaat aaaaagacag 5940
aataaaacgc acgggtgttg ggtcgtttgt tcataaacgc ggggttcggt cccagggctg 6000
gcactctgtc gataccccac cgagacccca ttggggccaa tacgcccgcg tttcttcctt 6060
ttccccaccc caccccccaa gttcgggtga aggcccaggg ctcgcagcca acgtcggggc 6120
ggcaggccct gccatagcca ctggccccgt gggttaggga cggggtcccc catggggaat 6180
ggtttatggt tcgtgggggt tattattttg ggcgttgcgt ggggtctgga gatcccccgg 6240
gctgcaggaa ttccgttaca ttacttacgg taaatggccc gcctggctga ccgcccaacg 6300
acccccgccc attgacgtca ataatgacgt atgttcccat agtaacgcca atagggactt 6360
tccattgacg tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag 6420
tgtatcatat gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc 6480
attatgccca gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag 6540
tcatcgctat taccatggtg atgcggtttt ggcagtacat caatgggcgt ggatagcggt 6600
ttgactcacg gggatttcca agtctccacc ccattgacgt caatgggagt ttgttttggc 6660
accaaaatca acgggacttt ccaaaatgtc gtaacaactc cgccccattg acgcaaaagg 6720
gcgggaattc gagctcggta ctcgagcggt gttccgcggt cctcctcgta tagaaactcg 6780
gaccactctg agacgaaggc tcgcgtccag gccagcacga aggaggctaa gtgggagggg 6840
tagcggtcgt tgtccactag ggggtccact cgctccaggg tgtgaagaca catgtcgccc 6900
tcttcggcat caaggaaggt gattggttta taggtgtagg ccacgtgacc gggtgttcct 6960
gaaggggggc tataaaaggg ggtgggggcg cgttcgtcct cactctcttc cgcatcgctg 7020
tctgcgaggg ccagctgttg ggctcgcggt tgaggacaaa ctcttcgcgg tctttccagt 7080
actcttggat cggaaacccg tcggcctccg aacggtactc cgccaccgag ggacctgagc 7140
gagtccgcat cgaccggatc ggaaaacctc tcgactgttg gggtgagtac tccctctcaa 7200
aagcgggcat gacttctgcg ctaagattgt cagtttccaa aaacgaggag gatttgatat 7260
tcacctggcc cgcggtgatg cctttgaggg tggccgcgtc catctggtca gaaaagacaa 7320
tctttttgtt gtcaagcttg aggtgtggca ggcttgagat ctggccatac acttgagtga 7380
caatgacatc cactttgcct ttctctccac aggtgtccac tcccaggtcc aaccggaatt 7440
gtacccgcgg ccagagcttg cgggcgccac cgcggccgcg gggatccaga catgataaga 7500
tacattgatg agtttggaca aaccacaact agaatgcagt gaaaaaaatg ctttatttgt 7560
gaaatttgtg atgctattgc tttatttgta accattataa gctgcaataa acaagttaac 7620
aacaacaatt gcattcattt tatgtttcag gttcaggggg aggtgtggga ggttttttcg 7680
gatcctcttg gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt atccgctcac 7740
aattccacac aacatacgag ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt 7800
gagctaactc acattaattg cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc 7860
gtgccagctg cattaatgaa tcggccaacg cgcggggaaa ggcggtttgc gtattgggcg 7920
ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt 7980
atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa 8040
gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 8100
gttcttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 8160
gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt 8220
gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 8280
aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg 8340
ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 8400
taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 8460
tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 8520
gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt 8580
taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 8640
tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 8700
tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 8760
ggtcatgaga ttatcaaaaa ggatcttcac ctagatccct tttaattaaa aatgaagttt 8820
taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag 8880
tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt 8940
cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg caatgatacc 9000
gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc 9060
cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg 9120
ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac 9180
aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg 9240
atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc 9300
tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact 9360
gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc 9420
aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat 9480
acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc 9540
ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac 9600
tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa 9660
aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact 9720
catactcttc ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg 9780
atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg 9840
aaaagtgcca cctgacgtct aagaaaccat tattatcatg acattaacct ataaaaatag 9900
gcgtatcacg aggccctttc gtctcgcgcg tttcggtgat gacggtgaaa acctctgaca 9960
catgcagctc ccggagacgg tcacagcttg tctgtaagcg gatgccggga gcagacaagc 10020
ccgtcagggc gcgtcagcgg gtgttggcgg gtgtcggggc tggcttaact atgcggcatc 10080
agagcagatt gtactgagag tgcaccatat gcggtgtgaa ataccgcaca gatgcgtaag 10140
gagaaaatac cgcatcaggc gccattcgcc attcaggctg cgcaactgtt gggaagggcg 10200
atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg 10260
attaagttgg gtaacgccag ggttttccca gttacgacgt tgtaaaacga cggccagtga 10320
att 10323
<210>32
<211>2835
<212>DNA
<213>人造
<220>
<223>合成构建体,ABT-007多聚蛋白的编码序列。
<220>
<221>CDS
<222>(1)..(2832)
<400>32
atg gag ttt ggg ctg agc tgg ctt ttt ctt gtc gcg att tta aaa ggt 48
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1 5 10 15
gtc cag tgt cag gtg cag ctg cag gag tcg ggc cca gga ctg gtg aag 96
Val Gln Cys Gln Val Gln Leu Gln Glu Ser Gly Pro Gly Leu Val Lys
20 25 30
cct tcg gag acc ctg tcc ctc acc tgc act gtc tct ggt gcc tcc atc 144
Pro Ser Glu Thr Leu Ser Leu Thr Cys Thr Val Ser Gly Ala Ser Ile
35 40 45
agt agt tac tac tgg agc tgg atc cgg cag ccc cca ggg aag gga ctg 192
Ser Ser Tyr Tyr Trp Ser Trp Ile Arg Gln Pro Pro Gly Lys Gly Leu
50 55 60
gag tgg att ggg tat atc ggg ggg gag ggg agc acc aac tac aac ccc 240
Glu Trp Ile Gly Tyr Ile Gly Gly Glu Gly Ser Thr Asn Tyr Asn Pro
65 70 75 80
tcc ctc aag agt cga gtc acc ata tca gta gac acg tcc aag aac cag 288
Ser Leu Lys Ser Arg Val Thr Ile Ser Val Asp Thr Ser Lys Asn Gln
85 90 95
ttc tcc ctg aag ctg agg tct gtg acc gct gcg gac acg gcc gtg tat 336
Phe Ser Leu Lys Leu Arg Ser Val Thr Ala Ala Asp Thr Ala Val Tyr
100 105 110
tac tgt gcg aga gag cga ctg ggg atc ggg gac tac tgg ggc cag gga 384
Tyr Cys Ala Arg Glu Arg Leu Gly Ile Gly Asp Tyr Trp Gly Gln Gly
115 120 125
acc ctg gtc acc gtc tcc tca gcg tcg acc aag ggc cca tcg gtc ttc 432
Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe
130 135 140
ccc ctg gcg ccc tgc tct aga agc acc tcc gag agc aca gcg gcc ctg 480
Pro Leu Ala Pro Cys Ser Arg Ser Thr Ser Glu Ser Thr Ala Ala Leu
145 150 155 160
ggc tgc ctg gtc aag gac tac ttc ccc gaa ccg gtg acg gtg tcg tgg 528
Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp
165 170 175
aac tca ggc gct ctg acc agc ggc gtg cac acc ttc cca gct gtc ctg 576
Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu
180 185 190
cag tcc tca gga ctc tac tcc ctc agc agc gtg gtg acc gtg ccc tcc 624
Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser
195 200 205
agc aac ttc ggc acc cag acc tac aca tgc aac gta gat cac aag ccc 672
Ser Asn Phe Gly Thr Gln Thr Tyr Thr Cys Asn Val Asp His Lys Pro
210 215 220
agc aac acc aag gtg gac aag aca gtt gag cgc aaa tgt tgt gtc gag 720
Ser Asn Thr Lys Val Asp Lys Thr Val Glu Arg Lys Cys Cys Val Glu
225 230 235 240
tgc cca ccg tgc cca gca cca cct gtg gca gga ccg tca gtc ttc ctc 768
Cys Pro Pro Cys Pro Ala Pro Pro Val Ala Gly Pro Ser Val Phe Leu
245 250 255
ttc ccc cca aaa ccc aag gac acc ctc atg atc tcc cgg acc cct gag 816
Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu
260 265 270
gtc acg tgc gtg gtg gtg gac gtg agc cac gaa gac ccc gag gtc cag 864
Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Gln
275 280 285
ttc aac tgg tac gtg gac ggc gtg gag gtg cat aat gcc aag aca aag 912
Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys
290 295 300
cca cgg gag gag cag ttc aac agc acgttc cgt gtg gtc agc gtc ctc 960
Pro Arg Glu Glu Gln Phe Asn Ser Thr Phe Arg Val Val Ser Val Leu
305 310 315 320
acc gtt gtg cac cag gac tgg ctg aac ggc aag gag tac aag tgc aag 1008
Thr Val Val His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys
325 330 335
gtc tcc aac aaa ggc ctc cca gcc ccc atc gag aaa acc atc tcc aaa 1056
Val Ser Asn Lys Gly Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys
340 345 350
acc aaa ggg cag ccc cga gaa cca cag gtg tac acc ctg ccc cca tcc 1104
Thr Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser
355 360 365
cgg gag gag atg acc aag aac cag gtc agc ctg acc tgc ctg gtc aaa 1152
Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys
370 375 380
ggc ttc tac ccc agc gac atc gcc gtg gag tgg gag agc aat ggg cag 1200
Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln
385 390 395 400
ccg gag aac aac tac aag acc aca cct ccc atg ctg gac tcc gac ggc 1248
Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Met Leu Asp Ser Asp Gly
405 410 415
tcc ttc ttc ctc tac agc aag ctc acc gtg gac aag agc agg tgg cag 1296
Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln
420 425 430
cag ggg aac gtc ttc tca tgc tcc gtg atg cat gag gct ctg cac aac 1344
Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn
435 440 445
cac tac acg cag aag agc ctc tcc ctg tct agg ggt aaa cgc gaa cca 1392
His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Arg Gly Lys Arg Glu Pro
450 455 460
gtt tat ttc cag ggg agc ttg ttt aag ggg ccg cgt gat tat aac cca 1440
Val Tyr Phe Gln Gly Ser Leu Phe Lys Gly Pro Arg Asp Tyr Asn Pro
465 470 475 480
ata tcg agt gcc att tgt cat cta acg aat gaa tct gat ggg cac aca 1488
Ile Ser Ser Ala Ile Cys His Leu Thr Asn Glu Ser Asp Gly His Thr
485 490 495
aca tcg ttg tat ggt att ggt ttt ggc cct ttc atc atc aca aac aag 1536
Thr Ser Leu Tyr Gly Ile Gly Phe Gly Pro Phe Ile Ile Thr Asn Lys
500 505 510
cat ttg ttt aga aga aat aat ggt aca ctg tta gtt caa tca cta cat 1584
His Leu Phe Arg Arg Asn Asn Gly Thr Leu Leu Val Gln Ser Leu His
515 520 525
ggt gtg ttc aag gta aag aat acc aca act ttg caa caa cac ctc att 1632
Gly Val Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln His Leu Ile
530 535 540
gat ggg agg gac atg atg ctc att cgc atg cct aag gat ttc cca cca 1680
Asp Gly Arg Asp Met Met Leu Ile Arg Met Pro Lys Asp Phe Pro Pro
545 550 555 560
ttt cct caa aag ctg aaa ttc aga gag cca caa agg gaa gag cgc ata 1728
Phe Pro Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu Glu Arg Ile
565 570 575
tgt ctt gtg aca acc aac ttc caa act aag agc atg tct agc atg gtt 1776
Cys Leu Val Thr Thr Asn Phe Gln Thr Lys Ser Met Ser Ser Met Val
580 585 590
tca gat act agt tgc aca ttc cct tca tct gat ggt ata ttc tgg aaa 1824
Ser Asp Thr Ser Cys Thr Phe Pro Ser Ser Asp Gly Ile Phe Trp Lys
595 600 605
cat tgg att cag acc aag gat ggg cac tgt ggt agc ccg ttg gtg tca 1872
His Trp Ile Gln Thr Lys Asp Gly His Cys Gly Ser Pro Leu Val Ser
610 615 620
act aga gat ggg ttt att gtt ggt ata cac tca gca tca aat ttc acc 1920
Thr Arg Asp Gly Phe Ile Val Gly Ile His Ser Ala Ser Asn Phe Thr
625 630 635 640
aac aca aac aat tat ttt aca agt gtg ccg aaa gac ttc atg gat tta 1968
Asn Thr Asn Asn Tyr Phe Thr Ser Val Pro Lys Asp Phe Met Asp Leu
645 650 655
ttg aca aat caa gag gcg cag caa tgg gtt agt ggt tgg cga ttg aat 2016
Leu Thr Asn Gln Glu Ala Gln Gln Trp Val Ser Gly Trp Arg Leu Asn
660 665 670
gct gac tca gtg tta tgg gga ggc cac aaa gtt ttc atg agc aaa cct 2064
Ala Asp Ser Val Leu Trp Gly Gly His Lys Val Phe Met Ser Lys Pro
675 680 685
gaa gaa ccc ttt cag cca gtc aaa gaa gca act caa ctc atg agt gaa 2112
Glu Glu Pro Phe Gln Pro Val Lys Glu Ala Thr Gln Leu Met Ser Glu
690 695 700
tta gtc tac tcg caa ggg atg cgc gtg ccc gcc cag ctg ctg ggc ctg 2160
Leu Val Tyr Ser Gln Gly Met Arg Val Pro Ala Gln Leu Leu Gly Leu
705 710 715 720
ctg ctg ctg tgg ttc ccc ggc tcg cga tgc gac atc cag ctg acc caa 2208
Leu Leu Leu Trp Phe Pro Gly Ser Arg Cys Asp Ile Gln Leu Thr Gln
725 730 735
tct cca tcc tcc ctg tct gca tct gta gga gac aga gtc acc atc act 2256
Ser Pro Ser Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr
740 745 750
tgc cgg gca agt cag ggc att aga aat gat tta ggc tgg tat cag cag 2304
Cys Arg Ala Ser Gln Gly Ile Arg Asn Asp Leu Gly Trp Tyr Gln Gln
755 760 765
aaa cca ggg aaa gcc cct aag cgc ctg atc tat gct gca tcc agt ttg 2352
Lys Pro Gly Lys Ala Pro Lys Arg Leu Ile Tyr Ala Ala Ser Ser Leu
770 775 780
caa agt ggg gtc cca tca agg ttc agc ggc agt gga tct ggg aca gaa 2400
Gln Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Glu
785 790 795 800
ttc act ctc aca atc agc agc ctg cag cct gaa gat ttt gca act tat 2448
Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr
805 810 815
tac tgt cta cag cat aat act tac cct ccg acg ttc ggc caa ggg acc 2496
Tyr Cys Leu Gln His Asn Thr Tyr Pro Pro Thr Phe Gly Gln Gly Thr
820 825 830
aag gtg gaa atc aaa cgt acg gtg gct gca cca tct gtc ttc atc ttc 2544
Lys Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe
835 840 845
ccg cca tct gat gag cag ttg aaa tct gga act gcc tct gtt gtg tgc 2592
Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys
850 855 860
ctg ctg aat aac ttc tat ccc aga gag gcc aaa gta cag tgg aag gtg 2640
Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val
865 870 875 880
gat aac gcc ctc caa tcg ggt aac tcc cag gag agt gtc aca gag cag 2688
Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln
885 890 895
gac agc aag gac agc acc tac agc ctc agc agc acc ctg acg ctg agc 2736
Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser
900 905 910
aaa gca gac tac gag aaa cac aaa gtc tac gcc tgc gaa gtc acc cat 2784
Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His
915 920 925
cag ggc ctg agc tcg ccc gtc aca aag agc ttc aac agg gga gag tgt 2832
Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
930 935 940
tga 2835
<210>33
<211>944
<212>PRT
<213>人造
<220>
<223>合成构建体
<400>33
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1 5 10 15
Val Gln Cys Gln Val Gln Leu Gln Glu Ser Gly Pro Gly Leu Val Lys
20 25 30
Pro Ser Glu Thr Leu Ser Leu Thr Cys Thr Val Ser Gly Ala Ser Ile
35 40 45
Ser Ser Tyr Tyr Trp Ser Trp Ile Arg Gln Pro Pro Gly Lys Gly Leu
50 55 60
Glu Trp Ile Gly Tyr Ile Gly Gly Glu Gly Ser Thr Asn Tyr Asn Pro
65 70 75 80
Ser Leu Lys Ser Arg Val Thr Ile Ser Val Asp Thr Ser Lys Asn Gln
85 90 95
Phe Ser Leu Lys Leu Arg Ser Val Thr Ala Ala Asp Thr Ala Val Tyr
100 105 110
Tyr Cys Ala Arg Glu Arg Leu Gly Ile Gly Asp Tyr Trp Gly Gln Gly
115 120 125
Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe
130 135 140
Pro Leu Ala Pro Cys Ser Arg Ser Thr Ser Glu Ser Thr Ala Ala Leu
145 150 155 160
Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp
165 170 175
Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu
180 185 190
Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser
195 200 205
Ser Asn Phe Gly Thr Gln Thr Tyr Thr Cys Asn Val Asp His Lys Pro
210 215 220
Ser Asn Thr Lys Val Asp Lys Thr Val Glu Arg Lys Cys Cys Val Glu
225 230 235 240
Cys Pro Pro Cys Pro Ala Pro Pro Val Ala Gly Pro Ser Val Phe Leu
245 250 255
Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu
260 265 270
Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Gln
275 280 285
Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys
290 295 300
Pro Arg Glu Glu Gln Phe Asn Ser Thr Phe Arg Val Val Ser Val Leu
305 310 315 320
Thr Val Val His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys
325 330 335
Val Ser Asn Lys Gly Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys
340 345 350
Thr Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser
355 360 365
Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys
370 375 380
Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln
385 390 395 400
Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Met Leu Asp Ser Asp Gly
405 410 415
Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln
420 425 430
Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn
435 440 445
His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Arg Gly Lys Arg Glu Pro
450 455 460
Val Tyr Phe Gln Gly Ser Leu Phe Lys Gly Pro Arg Asp Tyr Asn Pro
465 470 475 480
Ile Ser Ser Ala Ile Cys His Leu Thr Asn Glu Ser Asp Gly His Thr
485 490 495
Thr Ser Leu Tyr Gly Ile Gly Phe Gly Pro Phe Ile Ile Thr Asn Lys
500 505 510
His Leu Phe Arg Arg Asn Asn Gly Thr Leu Leu Val Gln Ser Leu His
515 520 525
Gly Val Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln His Leu Ile
530 535 540
Asp Gly Arg Asp Met Met Leu Ile Arg Met Pro Lys Asp Phe Pro Pro
545 550 555 560
Phe Pro Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu Glu Arg Ile
565 570 575
Cys Leu Val Thr Thr Asn Phe Gln Thr Lys Ser Met Ser Ser Met Val
580 585 590
Ser Asp Thr Ser Cys Thr Phe Pro Ser Ser Asp Gly Ile Phe Trp Lys
595 600 605
His Trp Ile Gln Thr Lys Asp Gly His Cys Gly Ser Pro Leu Val Ser
610 615 620
Thr Arg Asp Gly Phe Ile Val Gly Ile His Ser Ala Ser Asn Phe Thr
625 630 635 640
Asn Thr Asn Asn Tyr Phe Thr Ser Val Pro Lys Asp Phe Met Asp Leu
645 650 655
Leu Thr Asn Gln Glu Ala Gln Gln Trp Val Ser Gly Trp Arg Leu Asn
660 665 670
Ala Asp Ser Val Leu Trp Gly Gly His Lys Val Phe Met Ser Lys Pro
675 680 685
Glu Glu Pro Phe Gln Pro Val Lys Glu Ala Thr Gln Leu Met Ser Glu
690 695 700
Leu Val Tyr Ser Gln Gly Met Arg Val Pro Ala Gln Leu Leu Gly Leu
705 710 715 720
Leu Leu Leu Trp Phe Pro Gly Ser Arg Cys Asp Ile Gln Leu Thr Gln
725 730 735
Ser Pro Ser Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr
740 745 750
Cys Arg Ala Ser Gln Gly Ile Arg Asn Asp Leu Gly Trp Tyr Gln Gln
755 760 765
Lys Pro Gly Lys Ala Pro Lys Arg Leu Ile Tyr Ala Ala Ser Ser Leu
770 775 780
Gln Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Glu
785 790 795 800
Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr
805 810 815
Tyr Cys Leu Gln His Asn Thr Tyr Pro Pro Thr Phe Gly Gln Gly Thr
820 825 830
Lys Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe
835 840 845
Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys
850 855 860
Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val
865 870 875 880
Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln
885 890 895
Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser
900 905 910
Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His
915 920 925
Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
930 935 940
<210>34
<211>10212
<212>DNA
<213>人造
<220>
<223>合成构建体,ABT-007多聚蛋白表达载体。
<400>34
gaagttccta ttccgaagttcctattctct agacgttaca taacttacgg taaatggccc 60
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 120
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 180
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 240
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 300
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 360
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 420
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 480
cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg 540
tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg 600
aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg 660
gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag 720
gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc 780
tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa 840
actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact 900
ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt 960
ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca 1020
aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt 1080
ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga 1140
tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca 1200
ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag 1260
tttgggctga gctggctttt tcttgtcgcg attttaaaag gtgtccagtg tcaggtgcag 1320
ctgcaggagt cgggcccagg actggtgaag ccttcggaga ccctgtccct cacctgcact 1380
gtctctggtg cctccatcag tagttactac tggagctgga tccggcagcc cccagggaag 1440
ggactggagt ggattgggta tatcgggggg gaggggagca ccaactacaa cccctccctc 1500
aagagtcgag tcaccatatc agtagacacg tccaagaacc agttctccct gaagctgagg 1560
tctgtgaccg ctgcggacac ggccgtgtat tactgtgcga gagagcgact ggggatcggg 1620
gactactggg gccagggaac cctggtcacc gtctcctcag cgtcgaccaa gggcccatcg 1680
gtcttccccc tggcgccctg ctctagaagc acctccgaga gcacagcggc cctgggctgc 1740
ctggtcaagg actacttccc cgaaccggtg acggtgtcgt ggaactcagg cgctctgacc 1800
agcggcgtgc acaccttccc agctgtcctg cagtcctcag gactctactc cctcagcagc 1860
gtggtgaccg tgccctccag caacttcggc acccagacct acacatgcaa cgtagatcac 1920
aagcccagca acaccaaggt ggacaagaca gttgagcgca aatgttgtgt cgagtgccca 1980
ccgtgcccag caccacctgt ggcaggaccg tcagtcttcc tcttcccccc aaaacccaag 2040
gacaccctca tgatctcccg gacccctgag gtcacgtgcg tggtggtgga cgtgagccac 2100
gaagaccccg aggtccagtt caactggtac gtggacggcg tggaggtgca taatgccaag 2160
acaaagccac gggaggagca gttcaacagc acgttccgtg tggtcagcgt cctcaccgtt 2220
gtgcaccagg actggctgaa cggcaaggag tacaagtgca aggtctccaa caaaggcctc 2280
ccagccccca tcgagaaaac catctccaaa accaaagggc agccccgaga accacaggtg 2340
tacaccctgc ccccatcccg ggaggagatg accaagaacc aggtcagcct gacctgcctg 2400
gtcaaaggct tctaccccag cgacatcgcc gtggagtggg agagcaatgg gcagccggag 2460
aacaactaca agaccacacc tcccatgctg gactccgacg gctccttctt cctctacagc 2520
aagctcaccg tggacaagag caggtggcag caggggaacg tcttctcatg ctccgtgatg 2580
catgaggctc tgcacaacca ctacacgcag aagagcctct ccctgtctag gggtaaacgc 2640
gaaccagttt atttccaggg gagcttgttt aaggggccgc gtgattataa cccaatatcg 2700
agtgccattt gtcatctaac gaatgaatct gatgggcaca caacatcgtt gtatggtatt 2760
ggttttggcc ctttcatcat cacaaacaag catttgttta gaagaaataa tggtacactg 2820
ttagttcaat cactacatgg tgtgttcaag gtaaagaata ccacaacttt gcaacaacac 2880
ctcattgatg ggagggacat gatgctcatt cgcatgccta aggatttccc accatttcct 2940
caaaagctga aattcagaga gccacaaagg gaagagcgca tatgtcttgt gacaaccaac 3000
ttccaaacta agagcatgtc tagcatggtt tcagatacta gttgcacatt cccttcatct 3060
gatggtatat tctggaaaca ttggattcag accaaggatg ggcactgtgg tagcccgttg 3120
gtgtcaacta gagatgggtt tattgttggt atacactcag catcaaattt caccaacaca 3180
aacaattatt ttacaagtgt gccgaaagac ttcatggatt tattgacaaa tcaagaggcg 3240
cagcaatggg ttagtggttg gcgattgaat gctgactcag tgttatgggg aggccacaaa 3300
gttttcatga gcaaacctga agaacccttt cagccagtca aagaagcaac tcaactcatg 3360
agtgaattag tctactcgca agggatgcgc gtgcccgccc agctgctggg cctgctgctg 3420
ctgtggttcc ccggctcgcg atgcgacatc cagctgaccc aatctccatc ctccctgtct 3480
gcatctgtag gagacagagt caccatcact tgccgggcaa gtcagggcat tagaaatgat 3540
ttaggctggt atcagcagaa accagggaaa gcccctaagc gcctgatcta tgctgcatcc 3600
agtttgcaaa gtggggtccc atcaaggttc agcggcagtg gatctgggac agaattcact 3660
ctcacaatca gcagcctgca gcctgaagat tttgcaactt attactgtct acagcataat 3720
acttaccctc cgacgttcgg ccaagggacc aaggtggaaa tcaaacgtac ggtggctgca 3780
ccatctgtct tcatcttccc gccatctgat gagcagttga aatctggaac tgcctctgtt 3840
gtgtgcctgc tgaataactt ctatcccaga gaggccaaag tacagtggaa ggtggataac 3900
gccctccaat cgggtaactc ccaggagagt gtcacagagc aggacagcaa ggacagcacc 3960
tacagcctca gcagcaccct gacgctgagc aaagcagact acgagaaaca caaagtctac 4020
gcctgcgaag tcacccatca gggcctgagc tcgcccgtca caaagagctt caacagggga 4080
gagtgttgag cggccgcgtt taaactgaat gagcgcgtcc atccagacat gataagatac 4140
attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa 4200
atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac 4260
aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaaagc 4320
aagtaaaacc tctacaaatg tggtatggct gattatgatc cggctgcctc gcgcgtttcg 4380
gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca gcttgtctgt 4440
aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt ggcgggtgtc 4500
ggggcgcagc catgaccggt cgacggcgcg cctttttttt taatttttat tttattttat 4560
ttttgacgcg ccgaaggcgc gatctgagct cggtacagct tggctgtgga atgtgtgtca 4620
gttagggtgt ggaaagtccc caggctcccc agcaggcaga agtatgcaaa gcatgcatct 4680
caattagtca gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca 4740
aagcatgcat ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc 4800
cctaactccg cccagttccg cccattctcc gccccatggc tgactaattt tttttattta 4860
tgcagaggcc gaggccgcct cggcctctga gctattccag aagtagtgag gaggcttttt 4920
tggaggccta ggcttttgca aaaagctcct cgaggaactg aaaaaccaga aagttaactg 4980
gtaagtttag tctttttgtc ttttatttca ggtcccggat ccggtggtgg tgcaaatcaa 5040
agaactgctc ctcagtggat gttgccttta cttctaggcc tgtacggaag tgttacttct 5100
gctctaaaag ctgcggaatt gtacccgcgg cctaatacga ctcactatag ggactagtat 5160
ggttcgacca ttgaactgca tcgtcgccgt gtcccaaaat atggggattg gcaagaacgg 5220
agacctaccc tggcctccgc tcaggaacga gttcaagtac ttccaaagaa tgaccacaac 5280
ctcttcagtg gaaggtaaac agaatctggt gattatgggt aggaaaacct ggttctccat 5340
tcctgagaag aatcgacctt taaaggacag aattaatata gttctcagta gagaactcaa 5400
agaaccacca cgaggagctc attttcttgc caaaagttta gatgatgcct taagacttat 5460
tgaacaaccg gaattggcaa gtaaagtaga catggtttgg atagtcggag gcagttctgt 5520
ttaccaggaa gccatgaatc aaccaggcca cctcagactc tttgtgacaa ggatcatgca 5580
ggaatttgaa agtgacacgt ttttcccaga aattgatttg gggaaatata aacttctccc 5640
agaataccca ggcgtcctct ctgaggtcca ggaggaaaaa ggcatcaagt ataagtttga 5700
agtctacgag aagaaagact aagcggccga gcgcgcggat ctggaaacgg gagatggggg 5760
aggctaactg aagcacggaa ggagacaata ccggaaggaa cccgcgctat gacggcaata 5820
aaaagacaga ataaaacgca cgggtgttgg gtcgtttgtt cataaacgcg gggttcggtc 5880
ccagggctgg cactctgtcg ataccccacc gagaccccat tggggccaat acgcccgcgt 5940
ttcttccttt tccccacccc accccccaag ttcgggtgaa ggcccagggc tcgcagccaa 6000
cgtcggggcg gcaggccctg ccatagccac tggccccgtg ggttagggac ggggtccccc 6060
atggggaatg gtttatggtt cgtgggggtt attattttgg gcgttgcgtg gggtctggag 6120
atcccccggg ctgcaggaat tccgttacat tacttacggt aaatggcccg cctggctgac 6180
cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa 6240
tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag 6300
tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc 6360
ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct 6420
acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc aatgggcgtg 6480
gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc aatgggagtt 6540
tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc gccccattga 6600
cgcaaaaggg cgggaattcg agctcggtac tcgagcggtg ttccgcggtc ctcctcgtat 6660
agaaactcgg accactctga gacgaaggct cgcgtccagg ccagcacgaa ggaggctaag 6720
tgggaggggt agcggtcgtt gtccactagg gggtccactc gctccagggt gtgaagacac 6780
atgtcgccct cttcggcatc aaggaaggtg attggtttat aggtgtaggc cacgtgaccg 6840
ggtgttcctg aaggggggct ataaaagggg gtgggggcgc gttcgtcctc actctcttcc 6900
gcatcgctgt ctgcgagggc cagctgttgg gctcgcggtt gaggacaaac tcttcgcggt 6960
ctttccagta ctcttggatc ggaaacccgt cggcctccga acggtactcc gccaccgagg 7020
gacctgagcg agtccgcatc gaccggatcg gaaaacctct cgactgttgg ggtgagtact 7080
ccctctcaaa agcgggcatg acttctgcgc taagattgtc agtttccaaa aacgaggagg 7140
atttgatatt cacctggccc gcggtgatgc ctttgagggt ggccgcgtcc atctggtcag 7200
aaaagacaat ctttttgttg tcaagcttga ggtgtggcag gcttgagatc tggccataca 7260
cttgagtgac aatgacatcc actttgcctt tctctccaca ggtgtccact cccaggtcca 7320
accggaattg tacccgcggc cagagcttgc gggcgccacc gcggccgcgg ggatccagac 7380
atgataagat acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc 7440
tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa 7500
caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga ggtgtgggag 7560
gttttttcgg atcctcttgg cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta 7620
tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc 7680
ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg 7740
aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggaaag gcggtttgcg 7800
tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg 7860
gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa 7920
cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 7980
gttgctggcg ttcttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 8040
aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 8100
ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 8160
cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 8220
ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 8280
cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 8340
agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 8400
gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct 8460
gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 8520
tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 8580
agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 8640
agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccctt ttaattaaaa 8700
atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg 8760
cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg 8820
actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc 8880
aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc 8940
cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa 9000
ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc 9060
cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg 9120
ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc 9180
cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat 9240
ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg 9300
tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc 9360
ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg 9420
aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat 9480
gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg 9540
gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg 9600
ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct 9660
catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac 9720
atttccccga aaagtgccac ctgacgtcta agaaaccatt attatcatga cattaaccta 9780
taaaaatagg cgtatcacga ggccctttcg tctcgcgcgt ttcggtgatg acggtgaaaa 9840
cctctgacac atgcagctcc cggagacggt cacagcttgt ctgtaagcgg atgccgggag 9900
cagacaagcc cgtcagggcg cgtcagcggg tgttggcggg tgtcggggct ggcttaacta 9960
tgcggcatca gagcagattg tactgagagt gcaccatatg cggtgtgaaa taccgcacag 10020
atgcgtaagg agaaaatacc gcatcaggcg ccattcgcca ttcaggctgc gcaactgttg 10080
ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc 10140
tgcaaggcga ttaagttggg taacgccagg gttttcccag ttacgacgtt gtaaaacgac 10200
ggccagtgaa tt 10212
<210>35
<211>2853
<212>DNA
<213>人造
<220>
<223>合成构建体,编码ABT-874(J695)TEV多聚蛋白的序列。
<220>
<221>CDS
<222>(1)..(2850)
<400>35
atg gag ttt ggg ctg agc tgg ctt ttt ctt gtc gcg att tta aaa ggt 48
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1 5 10 15
gtc cag tgt cag gtg cag ctg gtg gag tct ggg gga ggc gtg gtc cag 96
Val Gln Cys Gln Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln
20 25 30
cct ggg agg tcc ctg aga ctc tcc tgt gca gcg tct gga ttc acc ttc 144
Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
35 40 45
agt agc tat ggc atg cac tgg gtc cgc cag gct cca ggc aag ggg ctg 192
Ser Ser Tyr Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
gag tgg gtg gca ttt ata cgg tat gat gga agt aat aaa tac tat gca 240
Glu Trp Val Ala Phe Ile Arg Tyr Asp Gly Ser Asn Lys Tyr Tyr Ala
65 70 75 80
gac tcc gtg aag ggc cga ttc acc atc tcc aga gac aat tcc aag aac 288
Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn
85 90 95
acg ctg tat ctg cag atg aac agc ctg aga gct gag gac acg gct gtg 336
Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val
100 105 110
tat tac tgt aag acc cat ggt agc cat gac aac tgg ggc caa ggg aca 384
Tyr Tyr Cys Lys Thr His Gly Ser His Asp Asn Trp Gly Gln Gly Thr
115 120 125
atg gtc acc gtc tct tca gcg tcg acc aag ggc cca tcg gtc ttc ccc 432
Met Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro
130 135 140
ctg gca ccc tcc tcc aag agc acc tct ggg ggc aca gcg gcc ctg ggc 480
Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly
145 150 155 160
tgc ctg gtc aag gac tac ttc ccc gaa ccg gtg acg gtg tcg tgg aac 528
Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn
165 170 175
tca ggc gcc ctg acc agc ggc gtg cac acc ttc ccg gct gtc cta cag 576
Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln
180 185 190
tcc tca gga ctc tac tcc ctc agc agc gtg gtg acc gtg ccc tcc agc 624
Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser
195 200 205
agc ttg ggc acc cag acc tac atc tgc aac gtg aat cac aag ccc agc 672
Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser
210 215 220
aac acc aag gtg gac aag aaa gtt gag ccc aaa tct tgt gac aaa act 720
Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr
225 230 235 240
cac aca tgc cca ccg tgc cca gca cct gaa ctc ctg ggg gga ccg tca 768
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
245 250 255
gtc ttc ctc ttc ccc cca aaa ccc aag gac acc ctc atg atc tcc cgg 816
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
260 265 270
acc cct gag gtc aca tgc gtg gtg gtg gac gtg agc cac gaa gac cct 864
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
275 280 285
gag gtc aag ttc aac tgg tac gtg gac ggc gtg gag gtg cat aat gcc 912
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
290 295 300
aag aca aag ccg cgg gag gag cag tac aac agc acg tac cgt gtg gtc 960
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
305 310 315 320
agc gtc ctc acc gtc ctg cac cag gac tgg ctg aat ggc aag gag tac 1008
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
325 330 335
aag tgc aag gtc tcc aac aaa gcc ctc cca gcc ccc atc gag aaa acc 1056
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr
340 345 350
atc tcc aaa gcc aaa ggg cag ccc cga gaa cca cag gtg tac acc ctg 1104
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu
355 360 365
ccc cca tcc cgc gag gag atg acc aag aac cag gtc agc ctg acc tgc 1152
Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys
370 375 380
ctg gtc aaa ggc ttc tat ccc agc gac atc gcc gtg gag tgg gag agc 1200
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
385 390 395 400
aat ggg cag ccg gag aac aac tac aag acc acg cct ccc gtg ctg gac 1248
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp
405 410 415
tcc gac ggc tcc ttc ttc ctc tac agc aag ctc acc gtg gac aag agc 1296
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser
420 425 430
agg tgg cag cag ggg aac gtc ttc tca tgc tcc gtg atg cat gag gct 1344
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
435 440 445
ctg cac aac cac tac acg cag aag agc ctc tcc ctg tct agg ggt aaa 1392
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Arg Gly Lys
450 455 460
cgc gaa cca gtt tat ttc cag ggg agc ttg ttt aag ggg ccg cgt gat 1440
Arg Glu Pro Val Tyr Phe Gln Gly Ser Leu Phe Lys Gly Pro Arg Asp
465 470 475 480
tat aac cca ata tcg agt gcc att tgt cat cta acg aat gaa tct gat 1488
Tyr Asn Pro Ile Ser Ser Ala Ile Cys His Leu Thr Asn Glu Ser Asp
485 490 495
ggg cac aca aca tcg ttg tat ggt att ggt ttt ggc cct ttc atc atc 1536
Gly His Thr Thr Ser Leu Tyr Gly Ile Gly Phe Gly Pro Phe Ile Ile
500 505 510
aca aac aag cat ttg ttt aga aga aat aat ggt aca ctg tta gtt caa 1584
Thr Asn Lys His Leu Phe Arg Arg Asn Asn Gly Thr Leu Leu Val Gln
515 520 525
tca cta cat ggt gtg ttc aag gta aag aat acc aca act ttg caa caa 1632
Ser Leu His Gly Val Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln
530 535 540
cac ctc att gat ggg agg gac atg atg ctc att cgc atg cct aag gat 1680
His Leu Ile Asp Gly Arg Asp Met Met Leu Ile Arg Met Pro Lys Asp
545 550 555 560
ttc cca cca ttt cct caa aag ctg aaa ttc aga gag cca caa agg gaa 1728
Phe Pro Pro Phe Pro Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu
565 570 575
gag cgc ata tgt ctt gtg aca acc aac ttc caa act aag agc atg tct 1776
Glu Arg Ile Cys Leu Val Thr Thr Asn Phe Gln Thr Lys Ser Met Ser
580 585 590
agc atg gtt tca gat act agt tgc aca ttc cct tca tct gat ggt ata 1824
Ser Met Val Ser Asp Thr Ser Cys Thr Phe Pro Ser Ser Asp Gly Ile
595 600 605
ttc tgg aaa cat tgg att cag acc aag gat ggg cac tgt ggt agc ccg 1872
Phe Trp Lys His Trp Ile Gln Thr Lys Asp Gly His Cys Gly Ser Pro
610 615 620
ttg gtg tca act aga gat ggg ttt att gtt ggt ata cac tca gca tca 1920
Leu Val Ser Thr Arg Asp Gly Phe Ile Val Gly Ile His Ser Ala Ser
625 630 635 640
aat ttc acc aac aca aac aat tat ttt aca agt gtg ccg aaa gac ttc 1968
Asn Phe Thr Asn Thr Asn Asn Tyr Phe Thr Ser Val Pro Lys Asp Phe
645 650 655
atg gat tta ttg aca aat caa gag gcg cag caa tgg gtt agt ggt tgg 2016
Met Asp Leu Leu Thr Asn Gln Glu Ala Gln Gln Trp Val Ser Gly Trp
660 665 670
cga ttg aat gct gac tca gtg tta tgg gga ggc cac aaa gtt ttc atg 2064
Arg Leu Asn Ala Asp Ser Val Leu Trp Gly Gly His Lys Val Phe Met
675 680 685
agc aaa cct gaa gaa ccc ttt cag cca gtc aaa gaa gca act caa ctc 2112
Ser Lys Pro Glu Glu Pro Phe Gln Pro Val Lys Glu Ala Thr Gln Leu
690 695 700
atg agt gaa tta gtc tac tcg caa ggg atg act tgg acc cca ctc ctc 2160
Met Ser Glu Leu Val Tyr Ser Gln Gly Met Thr Trp Thr Pro Leu Leu
705 710 715 720
ttc ctc acc ctc ctc ctc cac tgc aca gga agc tta tcc cag tct gtg 2208
Phe Leu Thr Leu Leu Leu His Cys Thr Gly Ser Leu Ser Gln Ser Val
725 730 735
ctg act cag ccc ccc tca gtg tct ggg gcc ccc ggg cag aga gtc acc 2256
Leu Thr Gln Pro Pro Ser Val Ser Gly Ala Pro Gly Gln Arg Val Thr
740 745 750
atc tct tgt tct gga agc aga tcc aac atc ggc agt aat act gta aag 2304
Ile Ser Cys Ser Gly Ser Arg Ser Asn Ile Gly Ser Asn Thr Val Lys
755 760 765
tgg tat cag cag ctc cca gga acg gcc ccc aaa ctc ctc atc tat tac 2352
Trp Tyr Gln Gln Leu Pro Gly Thr Ala Pro Lys Leu Leu Ile Tyr Tyr
770 775 780
aat gat cag cgg ccc tca ggg gtc cct gac cga ttc tct gga tcc aag 2400
Asn Asp Gln Arg Pro Ser Gly Val Pro Asp Arg Phe Ser Gly Ser Lys
785 790 795 800
tct ggc acc tca gcc tcc ctc gcc atc act ggg ctc cag gct gaa gac 2448
Ser Gly Thr Ser Ala Ser Leu Ala Ile Thr Gly Leu Gln Ala Glu Asp
805 810 815
gag gct gac tat tac tgc cag tca tat gac aga tac acc cac ccc gcc 2496
Glu Ala Asp Tyr Tyr Cys Gln Ser Tyr Asp Arg Tyr Thr His Pro Ala
820 825 830
ctg ctc ttc gga act ggg acc aag gtc aca gta cta ggt cag ccc aag 2544
Leu Leu Phe Gly Thr Gly Thr Lys Val Thr Val Leu Gly Gln Pro Lys
835 840 845
gct gcc ccc tcg gtc act ctg ttc ccg ccc tcc tct gag gag ctt caa 2592
Ala Ala Pro Ser Val Thr Leu Phe Pro Pro Ser Ser Glu Glu Leu Gln
850 855 860
gcc aac aag gcc aca ctg gtg tgt ctc ata agt gac ttc tac ccg gga 2640
Ala Asn Lys Ala Thr Leu Val Cys Leu Ile Ser Asp Phe Tyr Pro Gly
865 870 875 880
gcc gtg aca gtg gcc tgg aag gca gat agc agc ccc gtc aag gcg gga 2688
Ala Val Thr Val Ala Trp Lys Ala Asp Ser Ser Pro Val Lys Ala Gly
885 890 895
gtg gag acc acc aca ccc tcc aaa caa agc aac aac aag tac gcg gcc 2736
Val Glu Thr Thr Thr Pro Ser Lys Gln Ser Asn Asn Lys Tyr Ala Ala
900 905 910
agc agc tac ctg agc ctg acg cct gag cag tgg aag tcc cac aga agc 2784
Ser Ser Tyr Leu Ser Leu Thr Pro Glu Gln Trp Lys Ser His Arg Ser
915 920 925
tac agc tgc cag gtc acg cat gaa ggg agc acc gtg gag aag aca gtg 2832
Tyr Ser Cys Gln Val Thr His Glu Gly Ser Thr Val Glu Lys Thr Val
930 935 940
gcc cct aca gaa tgt tca tga 2853
Ala Pro Thr Glu Cys Ser
945 950
<210>36
<211>950
<212>PRT
<213>人造
<220>
<223>合成构建体
<400>36
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1 5 10 15
Val Gln Cys Gln Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln
20 25 30
Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
35 40 45
Ser Ser Tyr Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
Glu Trp Val Ala Phe Ile Arg Tyr Asp Gly Ser Asn Lys Tyr Tyr Ala
65 70 75 80
Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn
85 90 95
Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Lys Thr His Gly Ser His Asp Asn Trp Gly Gln Gly Thr
115 120 125
Met Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro
130 135 140
Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly
145 150 155 160
Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn
165 170 175
Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln
180 185 190
Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser
195 200 205
Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser
210 215 220
Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr
225 230 235 240
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
245 250 255
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
260 265 270
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
275 280 285
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
290 295 300
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
305 310 315 320
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
325 330 335
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr
340 345 350
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu
355 360 365
Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys
370 375 380
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
385 390 395 400
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp
405 410 415
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser
420 425 430
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
435 440 445
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Arg Gly Lys
450 455 460
Arg Glu Pro Val Tyr Phe Gln Gly Ser Leu Phe Lys Gly Pro Arg Asp
465 470 475 480
Tyr Asn Pro Ile Ser Ser Ala Ile Cys His Leu Thr Asn Glu Ser Asp
485 490 495
Gly His Thr Thr Ser Leu Tyr Gly Ile Gly Phe Gly Pro Phe Ile Ile
500 505 510
Thr Asn Lys His Leu Phe Arg Arg Asn Asn Gly Thr Leu Leu Val Gln
515 520 525
Ser Leu His Gly Val Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln
530 535 540
His Leu Ile Asp Gly Arg Asp Met Met Leu Ile Arg Met Pro Lys Asp
545 550 555 560
Phe Pro Pro Phe Pro Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu
565 570 575
Glu Arg Ile Cys Leu Val Thr Thr Asn Phe Gln Thr Lys Ser Met Ser
580 585 590
Ser Met Val Ser Asp Thr Ser Cys Thr Phe Pro Ser Ser Asp Gly Ile
595 600 605
Phe Trp Lys His Trp Ile Gln Thr Lys Asp Gly His Cys Gly Ser Pro
610 615 620
Leu Val Ser Thr Arg Asp Gly Phe Ile Val Gly Ile His Ser Ala Ser
625 630 635 640
Asn Phe Thr Asn Thr Asn Asn Tyr Phe Thr Ser Val Pro Lys Asp Phe
645 650 655
Met Asp Leu Leu Thr Asn Gln Glu Ala Gln Gln Trp Val Ser Gly Trp
660 665 670
Arg Leu Asn Ala Asp Ser Val Leu Trp Gly Gly His Lys Val Phe Met
675 680 685
Ser Lys Pro Glu Glu Pro Phe Gln Pro Val Lys Glu Ala Thr Gln Leu
690 695 700
Met Ser Glu Leu Val Tyr Ser Gln Gly Met Thr Trp Thr Pro Leu Leu
705 710 715 720
Phe Leu Thr Leu Leu Leu His Cys Thr Gly Ser Leu Ser Gln Ser Val
725 730 735
Leu Thr Gln Pro Pro Ser Val Ser Gly Ala Pro Gly Gln Arg Val Thr
740 745 750
Ile Ser Cys Ser Gly Ser Arg Ser Asn Ile Gly Ser Asn Thr Val Lys
755 760 765
Trp Tyr Gln Gln Leu Pro Gly Thr Ala Pro Lys Leu Leu Ile Tyr Tyr
770 775 780
Asn Asp Gln Arg Pro Ser Gly Val Pro Asp Arg Phe Ser Gly Ser Lys
785 790 795 800
Ser Gly Thr Ser Ala Ser Leu Ala Ile Thr Gly Leu Gln Ala Glu Asp
805 810 815
Glu Ala Asp Tyr Tyr Cys Gln Ser Tyr Asp Arg Tyr Thr His Pro Ala
820 825 830
Leu Leu Phe Gly Thr Gly Thr Lys Val Thr Val Leu Gly Gln Pro Lys
835 840 845
Ala Ala Pro Ser Val Thr Leu Phe Pro Pro Ser Ser Glu Glu Leu Gln
850 855 860
Ala Asn Lys Ala Thr Leu Val Cys Leu Ile Ser Asp Phe Tyr Pro Gly
865 870 875 880
Ala Val Thr Val Ala Trp Lys Ala Asp Ser Ser Pro Val Lys Ala Gly
885 890 895
Val Glu Thr Thr Thr Pro Ser Lys Gln Ser Asn Asn Lys Tyr Ala Ala
900 905 910
Ser Ser Tyr Leu Ser Leu Thr Pro Glu Gln Trp Lys Ser His Arg Ser
915 920 925
Tyr Ser Cys Gln Val Thr His Glu Gly Ser Thr Val Glu Lys Thr Val
930 935 940
Ala Pro Thr Glu Cys Ser
945 950
<210>37
<211>10230
<212>DNA
<213>人造
<220>
<223>合成构建体,ABT-874TEV多聚蛋白表达载体。
<400>37
gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc 60
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 120
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 180
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 240
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 300
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 360
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 420
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 480
cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg 540
tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg 600
aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg 660
gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag 720
gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc 780
tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa 840
actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact 900
ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt 960
ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca 1020
aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt 1080
ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga 1140
tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca 1200
ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag 1260
tttgggctga gctggctttt tcttgtcgcg attttaaaag gtgtccagtg tcaggtgcag 1320
ctggtggagt ctgggggagg cgtggtccag cctgggaggt ccctgagact ctcctgtgca 1380
gcgtctggat tcaccttcag tagctatggc atgcactggg tccgccaggc tccaggcaag 1440
gggctggagt gggtggcatt tatacggtat gatggaagta ataaatacta tgcagactcc 1500
gtgaagggcc gattcaccat ctccagagac aattccaaga acacgctgta tctgcagatg 1560
aacagcctga gagctgagga cacggctgtg tattactgta agacccatgg tagccatgac 1620
aactggggcc aagggacaat ggtcaccgtc tcttcagcgt cgaccaaggg cccatcggtc 1680
ttccccctgg caccctcctc caagagcacc tctgggggca cagcggccct gggctgcctg 1740
gtcaaggact acttccccga accggtgacg gtgtcgtgga actcaggcgc cctgaccagc 1800
ggcgtgcaca ccttcccggc tgtcctacag tcctcaggac tctactccct cagcagcgtg 1860
gtgaccgtgc cctccagcag cttgggcacc cagacctaca tctgcaacgt gaatcacaag 1920
cccagcaaca ccaaggtgga caagaaagtt gagcccaaat cttgtgacaa aactcacaca 1980
tgcccaccgt gcccagcacc tgaactcctg gggggaccgt cagtcttcct cttcccccca 2040
aaacccaagg acaccctcat gatctcccgg acccctgagg tcacatgcgt ggtggtggac 2100
gtgagccacg aagaccctga ggtcaagttc aactggtacg tggacggcgt ggaggtgcat 2160
aatgccaaga caaagccgcg ggaggagcag tacaacagca cgtaccgtgt ggtcagcgtc 2220
ctcaccgtcc tgcaccagga ctggctgaat ggcaaggagt acaagtgcaa ggtctccaac 2280
aaagccctcc cagcccccat cgagaaaacc atctccaaag ccaaagggca gccccgagaa 2340
ccacaggtgt acaccctgcc cccatcccgc gaggagatga ccaagaacca ggtcagcctg 2400
acctgcctgg tcaaaggctt ctatcccagc gacatcgccg tggagtggga gagcaatggg 2460
cagccggaga acaactacaa gaccacgcct cccgtgctgg actccgacgg ctccttcttc 2520
ctctacagca agctcaccgt ggacaagagc aggtggcagc aggggaacgt cttctcatgc 2580
tccgtgatgc atgaggctct gcacaaccac tacacgcaga agagcctctc cctgtctagg 2640
ggtaaacgcg aaccagttta tttccagggg agcttgttta aggggccgcg tgattataac 2700
ccaatatcga gtgccatttg tcatctaacg aatgaatctg atgggcacac aacatcgttg 2760
tatggtattg gttttggccc tttcatcatc acaaacaagc atttgtttag aagaaataat 2820
ggtacactgt tagttcaatc actacatggt gtgttcaagg taaagaatac cacaactttg 2880
caacaacacc tcattgatgg gagggacatg atgctcattc gcatgcctaa ggatttccca 2940
ccatttcctc aaaagctgaa attcagagag ccacaaaggg aagagcgcat atgtcttgtg 3000
acaaccaact tccaaactaa gagcatgtct agcatggttt cagatactag ttgcacattc 3060
ccttcatctg atggtatatt ctggaaacat tggattcaga ccaaggatgg gcactgtggt 3120
agcccgttgg tgtcaactag agatgggttt attgttggta tacactcagc atcaaatttc 3180
accaacacaa acaattattt tacaagtgtg ccgaaagact tcatggattt attgacaaat 3240
caagaggcgc agcaatgggt tagtggttgg cgattgaatg ctgactcagt gttatgggga 3300
ggccacaaag ttttcatgag caaacctgaa gaaccctttc agccagtcaa agaagcaact 3360
caactcatga gtgaattagt ctactcgcaa gggatgactt ggaccccact cctcttcctc 3420
accctcctcc tccactgcac aggaagctta tcccagtctg tgctgactca gcccccctca 3480
gtgtctgggg cccccgggca gagagtcacc atctcttgtt ctggaagcag atccaacatc 3540
ggcagtaata ctgtaaagtg gtatcagcag ctcccaggaa cggcccccaa actcctcatc 3600
tattacaatg atcagcggcc ctcaggggtc cctgaccgat tctctggatc caagtctggc 3660
acctcagcct ccctcgccat cactgggctc caggctgaag acgaggctga ctattactgc 3720
cagtcatatg acagatacac ccaccccgcc ctgctcttcg gaactgggac caaggtcaca 3780
gtactaggtc agcccaaggc tgccccctcg gtcactctgt tcccgccctc ctctgaggag 3840
cttcaagcca acaaggccac actggtgtgt ctcataagtg acttctaccc gggagccgtg 3900
acagtggcct ggaaggcaga tagcagcccc gtcaaggcgg gagtggagac caccacaccc 3960
tccaaacaaa gcaacaacaa gtacgcggcc agcagctacc tgagcctgac gcctgagcag 4020
tggaagtccc acagaagcta cagctgccag gtcacgcatg aagggagcac cgtggagaag 4080
acagtggccc ctacagaatg ttcatgagcg gccgcgttta aactgaatga gcgcgtccat 4140
ccagacatga taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa 4200
aaatgcttta tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc 4260
aataaacaag ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggaggtg 4320
tgggaggttt tttaaagcaa gtaaaacctc tacaaatgtg gtatggctga ttatgatccg 4380
gctgcctcgc gcgtttcggt gatgacggtg aaaacctctg acacatgcag ctcccggaga 4440
cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca agcccgtcag ggcgcgtcag 4500
cgggtgttgg cgggtgtcgg ggcgcagcca tgaccggtcg acggcgcgcc ttttttttta 4560
atttttattt tattttattt ttgacgcgcc gaaggcgcga tctgagctcg gtacagcttg 4620
gctgtggaat gtgtgtcagt tagggtgtgg aaagtcccca ggctccccag caggcagaag 4680
tatgcaaagc atgcatctca attagtcagc aaccaggtgt ggaaagtccc caggctcccc 4740
agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccatag tcccgcccct 4800
aactccgccc atcccgcccc taactccgcc cagttccgcc cattctccgc cccatggctg 4860
actaattttt tttatttatg cagaggccga ggccgcctcg gcctctgagc tattccagaa 4920
gtagtgagga ggcttttttg gaggcctagg cttttgcaaa aagctcctcg aggaactgaa 4980
aaaccagaaa gttaactggt aagtttagtc tttttgtctt ttatttcagg tcccggatcc 5040
ggtggtggtg caaatcaaag aactgctcct cagtggatgt tgcctttact tctaggcctg 5100
tacggaagtg ttacttctgc tctaaaagct gcggaattgt acccgcggcc taatacgact 5160
cactataggg actagtatgg ttcgaccatt gaactgcatc gtcgccgtgt cccaaaatat 5220
ggggattggc aagaacggag acctaccctg gcctccgctc aggaacgagt tcaagtactt 5280
ccaaagaatg accacaacct cttcagtgga aggtaaacag aatctggtga ttatgggtag 5340
gaaaacctgg ttctccattc ctgagaagaa tcgaccttta aaggacagaa ttaatatagt 5400
tctcagtaga gaactcaaag aaccaccacg aggagctcat tttcttgcca aaagtttaga 5460
tgatgcctta agacttattg aacaaccgga attggcaagt aaagtagaca tggtttggat 5520
agtcggaggc agttctgttt accaggaagc catgaatcaa ccaggccacc tcagactctt 5580
tgtgacaagg atcatgcagg aatttgaaag tgacacgttt ttcccagaaa ttgatttggg 5640
gaaatataaa cttctcccag aatacccagg cgtcctctct gaggtccagg aggaaaaagg 5700
catcaagtat aagtttgaag tctacgagaa gaaagactaa gcggccgagc gcgcggatct 5760
ggaaacggga gatgggggag gctaactgaa gcacggaagg agacaatacc ggaaggaacc 5820
cgcgctatga cggcaataaa aagacagaat aaaacgcacg ggtgttgggt cgtttgttca 5880
taaacgcggg gttcggtccc agggctggca ctctgtcgat accccaccga gaccccattg 5940
gggccaatac gcccgcgttt cttccttttc cccaccccac cccccaagtt cgggtgaagg 6000
cccagggctc gcagccaacg tcggggcggc aggccctgcc atagccactg gccccgtggg 6060
ttagggacgg ggtcccccat ggggaatggt ttatggttcg tgggggttat tattttgggc 6120
gttgcgtggg gtctggagat cccccgggct gcaggaattc cgttacatta cttacggtaa 6180
atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg 6240
ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt 6300
aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg 6360
tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc 6420
ctacttggca gtacatctac gtattagtca tcgctattac catggtgatg cggttttggc 6480
agtacatcaa tgggcgtgga tagcggtttg actcacgggg atttccaagt ctccacccca 6540
ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta 6600
acaactccgc cccattgacg caaaagggcg ggaattcgag ctcggtactc gagcggtgtt 6660
ccgcggtcct cctcgtatag aaactcggac cactctgaga cgaaggctcg cgtccaggcc 6720
agcacgaagg aggctaagtg ggaggggtag cggtcgttgt ccactagggg gtccactcgc 6780
tccagggtgt gaagacacat gtcgccctct tcggcatcaa ggaaggtgat tggtttatag 6840
gtgtaggcca cgtgaccggg tgttcctgaa ggggggctat aaaagggggt gggggcgcgt 6900
tcgtcctcac tctcttccgc atcgctgtct gcgagggcca gctgttgggc tcgcggttga 6960
ggacaaactc ttcgcggtct ttccagtact cttggatcgg aaacccgtcg gcctccgaac 7020
ggtactccgc caccgaggga cctgagcgag tccgcatcga ccggatcgga aaacctctcg 7080
actgttgggg tgagtactcc ctctcaaaag cgggcatgac ttctgcgcta agattgtcag 7140
tttccaaaaa cgaggaggat ttgatattca cctggcccgc ggtgatgcct ttgagggtgg 7200
ccgcgtccat ctggtcagaa aagacaatct ttttgttgtc aagcttgagg tgtggcaggc 7260
ttgagatctg gccatacact tgagtgacaa tgacatccac tttgcctttc tctccacagg 7320
tgtccactcc caggtccaac cggaattgta cccgcggcca gagcttgcgg gcgccaccgc 7380
ggccgcgggg atccagacat gataagatac attgatgagt ttggacaaac cacaactaga 7440
atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc 7500
attataagct gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt 7560
cagggggagg tgtgggaggt tttttcggat cctcttggcg taatcatggt catagctgtt 7620
tcctgtgtga aattgttatc cgctcacaat tccacacaac atacgagccg gaagcataaa 7680
gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca ttaattgcgt tgcgctcact 7740
gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc 7800
ggggaaaggc ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg 7860
ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc 7920
cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag 7980
gaaccgtaaa aaggccgcgt tgctggcgtt cttccatagg ctccgccccc ctgacgagca 8040
tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 8100
ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 8160
atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag 8220
gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 8280
tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 8340
cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 8400
cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa gaacagtatt 8460
tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 8520
cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 8580
cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 8640
gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta 8700
gatccctttt aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg 8760
gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg 8820
ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc 8880
atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc cagatttatc 8940
agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc 9000
ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag 9060
tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt cgtttggtat 9120
ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg 9180
caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt 9240
gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag 9300
atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg 9360
accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata gcagaacttt 9420
aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct 9480
gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac 9540
tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat 9600
aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat 9660
ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca 9720
aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgtctaag aaaccattat 9780
tatcatgaca ttaacctata aaaataggcg tatcacgagg ccctttcgtc tcgcgcgttt 9840
cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca cagcttgtct 9900
gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg ttggcgggtg 9960
tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc accatatgcg 10020
gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc attcgccatt 10080
caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat tacgccagct 10140
ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt tttcccagtt 10200
acgacgttgt aaaacgacgg ccagtgaatt 10230
<210>38
<211>2901
<212>DNA
<213>人造
<220>
<223>合成构建体,编码EL246GG TEV多聚蛋白的序列。
<220>
<221>CDS
<222>(1)..(2898)
<400>38
atg gag ttt ggg ctg agc tgg ctt ttt ctt gtc gcg att tta aaa ggt 48
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1 5 10 15
gtc cag tgc gag gtg cag ctg gtg cag tct gga gca gag gtg aaa aag 96
Val Gln Cys Glu Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys
20 25 30
ccc ggg gag tct ctg aag atc tcc tgt aag ggg tcc gga tac gca ttc 144
Pro Gly Glu Ser Leu Lys Ile Ser Cys Lys Gly Ser Gly Tyr Ala Phe
35 40 45
agt agt tcc tgg atc ggc tgg gtg cgc cag atg ccc ggg aaa ggc ctg 192
Ser Ser Ser Trp Ile Gly Trp Val Arg Gln Met Pro Gly Lys Gly Leu
50 55 60
gag tgg atg ggg cgg att tat cct gga gat gga gat act aac tac aat 240
Glu Trp Met Gly Arg Ile Tyr Pro Gly Asp Gly Asp Thr Asn Tyr Asn
65 70 75 80
ggg aag ttc aag ggc cag gtc acc atc tca gcc gac aag tcc atc agc 288
Gly Lys Phe Lys Gly Gln Val Thr Ile Ser Ala Asp Lys Ser Ile Ser
85 90 95
acc gcc tac ctg cag tgg agc agc ctg aag gct agc gac acc gcc atg 336
Thr Ala Tyr Leu Gln Trp Ser Ser Leu Lys Ala Ser Asp Thr Ala Met
100 105 110
tat tac tgt gcg aga gcg cgc gtg gga tcc acg gtc tat gat ggt tac 384
Tyr Tyr Cys Ala Arg Ala Arg Val Gly Ser Thr Val Tyr Asp Gly Tyr
115 120 125
ctc tat gca atg gac tac tgg ggt caa ggt acc tca gtc acc gtc tcc 432
Leu Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr Ser Val Thr Val Ser
130 135 140
tca gcg tcg acc aag ggc cca tcg gtc ttc ccc ctg gca ccc tcc tcc 480
Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser
145 150 155 160
aag agc acc tct ggg ggc aca gcg gcc ctg ggc tgc ctg gtc aag gac 528
Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp
165 170 175
tac ttc ccc gaa ccg gtg acg gtg tcg tgg aac tca ggc gcc ctg acc 576
Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr
180 185 190
agc ggc gtg cac acc ttc ccg gct gtc cta cag tcc tca gga ctc tac 624
Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr
195 200 205
tcc ctc agc agc gtg gtg acc gtg ccc tcc agc agc ttg ggc acc cag 672
Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln
210 215 220
acc tac atc tgc aac gtg aat cac aag ccc agc aac acc aag gtg gac 720
Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp
225 230 235 240
aag aaa gtt gag ccc aaa tct tgt gac aaa act cac aca tgc cca ccg 768
Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro
245 250 255
tgc cca gca cct gaa gcc gcg ggg gga ccg tca gtc ttc ctc ttc ccc 816
Cys Pro Ala Pro Glu Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro
260 265 270
cca aaa ccc aag gac acc ctc atg atc tcc cgg acc cct gag gtc aca 864
Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr
275 280 285
tgc gtg gtg gtg gac gtg agc cac gaa gac cct gag gtc aag ttc aac 912
Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn
290 295 300
tgg tac gtg gac ggc gtg gag gtg cat aat gcc aag aca aag ccg cgg 960
Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg
305 310 315 320
gag gag cag tac aac agc acg tac cgt gtg gtc agc gtc ctc acc gtc 1008
Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val
325 330 335
ctg cac cag gac tgg ctg aat ggc aag gag tac aag tgc aag gtc tcc 1056
Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser
340 345 350
aac aaa gcc ctc cca gcc ccc atc gag aaa acc atc tcc aaa gcc aaa 1104
Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys
355 360 365
ggg cag ccc cga gaa cca cag gtg tac acc ctg ccc cca tcc cgc gag 1152
Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu
370 375 380
gag atg acc aag aac cag gtc agc ctg acc tgc ctg gtc aaa ggc ttc 1200
Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe
385 390 395 400
tat ccc agc gac atc gcc gtg gag tgg gag agc aat ggg cag ccg gag 1248
Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu
405 410 415
aac aac tac aag acc acg cct ccc gtg ctg gac tcc gac ggc tcc ttc 1296
Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe
420 425 430
ttc ctc tac agc aag ctc acc gtg gac aag agc agg tgg cag cag ggg 1344
Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly
435 440 445
aac gtc ttc tca tgc tcc gtg atg cat gag gct ctg cac aac cac tac 1392
Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr
450 455 460
acg cag aag agc ctc tcc ctg tct agg ggt aaa cgc gaa cca gtt tat 1440
Thr Gln Lys Ser Leu Ser Leu Ser Arg Gly Lys Arg Glu Pro Val Tyr
465 470 475 480
ttc cag ggg agc ttg ttt aag ggg ccg cgt gat tat aac cca ata tcg 1488
Phe Gln Gly Ser Leu Phe Lys Gly Pro Arg Asp Tyr Asn Pro Ile Ser
485 490 495
agt gcc att tgt cat cta acg aat gaa tct gat ggg cac aca aca tcg 1536
Ser Ala Ile Cys His Leu Thr Asn Glu Ser Asp Gly His Thr Thr Ser
500 505 510
ttg tat ggt att ggt ttt ggc cct ttc atc atc aca aac aag cat ttg 1584
Leu Tyr Gly Ile Gly Phe Gly Pro Phe Ile Ile Thr Asn Lys His Leu
515 520 525
ttt aga aga aat aat ggt aca ctg tta gtt caa tca cta cat ggt gtg 1632
Phe Arg Arg Asn Asn Gly Thr Leu Leu Val Gln Ser Leu His Gly Val
530 535 540
ttc aag gta aag aat acc aca act ttg caa caa cac ctc att gat ggg 1680
Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln His Leu Ile Asp Gly
545 550 555 560
agg gac atg atg ctc att cgc atg cct aag gat ttc cca cca ttt cct 1728
Arg Asp Met Met Leu Ile Arg Met Pro Lys Asp Phe Pro Pro Phe Pro
565 570 575
caa aag ctg aaa ttc aga gag cca caa agg gaa gag cgc ata tgt ctt 1776
Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu Glu Arg Ile Cys Leu
580 585 590
gtg aca acc aac ttc caa act aag agc atg tct agc atg gtt tca gat 1824
Val Thr Thr Asn Phe Gln Thr Lys Ser Met Ser Ser Met Val Ser Asp
595 600 605
act agt tgc aca ttc cct tca tct gat ggt ata ttc tgg aaa cat tgg 1872
Thr Ser Cys Thr Phe Pro Ser Ser Asp Gly Ile Phe Trp Lys His Trp
610 615 620
att cag acc aag gat ggg cac tgt ggt agc ccg ttg gtg tca act aga 1920
Ile Gln Thr Lys Asp Gly His Cys Gly Ser Pro Leu Val Ser Thr Arg
625 630 635 640
gat ggg ttt att gtt ggt ata cac tca gca tca aat ttc acc aac aca 1968
Asp Gly Phe Ile Val Gly Ile His Ser Ala Ser Asn Phe Thr Asn Thr
645 650 655
aac aat tat ttt aca agt gtg ccg aaa gac ttc atg gat tta ttg aca 2016
Asn Asn Tyr Phe Thr Ser Val Pro Lys Asp Phe Met Asp Leu Leu Thr
660 665 670
aat caa gag gcg cag caa tgg gtt agt ggt tgg cga ttg aat gct gac 2064
Asn Gln Glu Ala Gln Gln Trp Val Ser Gly Trp Arg Leu Asn Ala Asp
675 680 685
tca gtg tta tgg gga ggc cac aaa gtt ttc atg agc aaa cct gaa gaa 2112
Ser Val Leu Trp Gly Gly His Lys Val Phe Met Ser Lys Pro Glu Glu
690 695 700
ccc ttt cag cca gtc aaa gaa gca act caa ctc atg agt gaa tta gtc 2160
Pro Phe Gln Pro Val Lys Glu Ala Thr Gln Leu Met Ser Glu Leu Val
705 710 715 720
tac tcg caa ggg atg gac atg cgc gtg ccc gcc cag ctg ctg ggc ctg 2208
Tyr Ser Gln Gly Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu
725 730 735
ctg ctg ctg tgg ttc ccc ggc tcg cga tgc gac atc gtg atg acc cag 2256
Leu Leu Leu Trp Phe Pro Gly Ser Arg Cys Asp Ile Val Met Thr Gln
740 745 750
tct cca gac tcc ctg gct gtg tct ctg ggc gag agg gcc acc atc aac 2304
Ser Pro Asp Ser Leu Ala Val Ser Leu Gly Glu Arg Ala Thr Ile Asn
755 760 765
tgc aag tcc agt cag agc ctt tca tat aga agc aat caa aag aac tcg 2352
Cys Lys Ser Ser Gln Ser Leu Ser Tyr Arg Ser Asn Gln Lys Asn Ser
770 775 780
ttg gcc tgg tac cag cag aaa cca gga cag cct cct aag ctg ctc att 2400
Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Pro Pro Lys Leu Leu Ile
785 790 795 800
tac tgg gct agc act agg gaa tct ggg gtc cct gac cga ttc agt gga 2448
Tyr Trp Ala Ser Thr Arg Glu Ser Gly Val Pro Asp Arg Phe Ser Gly
805 810 815
tcc ggg tct ggg aca gat ttc act ctc acc atc agc agc ctg cag gct 2496
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Ala
820 825 830
gaa gat gtg gca gtt tat tac tgt cac caa tat tat agc tat ccg tac 2544
Glu Asp Val Ala Val Tyr Tyr Cys His Gln Tyr Tyr Ser Tyr Pro Tyr
835 840 845
acg ttc gga ggg ggg acc aag gtg gaa att aaa cgt acg gtg gct gca 2592
Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala
850 855 860
cca tct gtc ttc atc ttc ccg cca tct gat gag cag ttg aaa tct gga 2640
Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly
865 870 875 880
act gcc tct gtt gtg tgc ctg ctg aat aac ttc tat ccc aga gag gcc 2688
Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala
885 890 895
aaa gta cag tgg aag gtg gat aac gcc ctc caa tcg ggt aac tcc cag 2736
Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln
900 905 910
gag agt gtc aca gag cag gac agc aag gac agc acc tac agc ctc agc 2784
Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser
915 920 925
agc acc ctg acg ctg agc aaa gca gac tac gag aaa cac aaa gtc tac 2832
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr
930 935 940
gcc tgc gaa gtc acc cat cag ggc ctg agc tcg ccc gtc aca aag agc 2880
Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser
945 950 955 960
ttc aac agg gga gag tgt tga 2901
Phe Asn Arg Gly Glu Cys
965
<210>39
<211>966
<212>PRT
<213>人造
<220>
<223>合成构建体
<400>39
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1 5 10 15
Val Gln Cys Glu Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys
20 25 30
Pro Gly Glu Ser Leu Lys Ile Ser Cys Lys Gly Ser Gly Tyr Ala Phe
35 40 45
Ser Ser Ser Trp Ile Gly Trp Val Arg Gln Met Pro Gly Lys Gly Leu
50 55 60
Glu Trp Met Gly Arg Ile Tyr Pro Gly Asp Gly Asp Thr Asn Tyr Asn
65 70 75 80
Gly Lys Phe Lys Gly Gln Val Thr Ile Ser Ala Asp Lys Ser Ile Ser
85 90 95
Thr Ala Tyr Leu Gln Trp Ser Ser Leu Lys Ala Ser Asp Thr Ala Met
100 105 110
Tyr Tyr Cys Ala Arg Ala Arg Val Gly Ser Thr Val Tyr Asp Gly Tyr
115 120 125
Leu Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr Ser Val Thr Val Ser
130 135 140
Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser
145 150 155 160
Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp
165 170 175
Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr
180 185 190
Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr
195 200 205
Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln
210 215 220
Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp
225 230 235 240
Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro
245 250 255
Cys Pro Ala Pro Glu Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro
260 265 270
Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr
275 280 285
Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn
290 295 300
Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg
305 310 315 320
Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val
325 330 335
Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser
340 345 350
Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys
355 360 365
Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu
370 375 380
Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe
385 390 395 400
Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu
405 410 415
Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe
420 425 430
Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly
435 440 445
Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr
450 455 460
Thr Gln Lys Ser Leu Ser Leu Ser Arg Gly Lys Arg Glu Pro Val Tyr
465 470 475 480
Phe Gln Gly Ser Leu Phe Lys Gly Pro Arg Asp Tyr Asn Pro Ile Ser
485 490 495
Ser Ala Ile Cys His Leu Thr Asn Glu Ser Asp Gly His Thr Thr Ser
500 505 510
Leu Tyr Gly Ile Gly Phe Gly Pro Phe Ile Ile Thr Asn Lys His Leu
515 520 525
Phe Arg Arg Asn Asn Gly Thr Leu Leu Val Gln Ser Leu His Gly Val
530 535 540
Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln His Leu Ile Asp Gly
545 550 555 560
Arg Asp Met Met Leu Ile Arg Met Pro Lys Asp Phe Pro Pro Phe Pro
565 570 575
Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu Glu Arg Ile Cys Leu
580 585 590
Val Thr Thr Asn Phe Gln Thr Lys Ser Met Ser Ser Met Val Ser Asp
595 600 605
Thr Ser Cys Thr Phe Pro Ser Ser Asp Gly Ile Phe Trp Lys His Trp
610 615 620
Ile Gln Thr Lys Asp Gly His Cys Gly Ser Pro Leu Val Ser Thr Arg
625 630 635 640
Asp Gly Phe Ile Val Gly Ile His Ser Ala Ser Asn Phe Thr Asn Thr
645 650 655
Asn Asn Tyr Phe Thr Ser Val Pro Lys Asp Phe Met Asp Leu Leu Thr
660 665 670
Asn Gln Glu Ala Gln Gln Trp Val Ser Gly Trp Arg Leu Asn Ala Asp
675 680 685
Ser Val Leu Trp Gly Gly His Lys Val Phe Met Ser Lys Pro Glu Glu
690 695 700
Pro Phe Gln Pro Val Lys Glu Ala Thr Gln Leu Met Ser Glu Leu Val
705 710 715 720
Tyr Ser Gln Gly Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu
725 730 735
Leu Leu Leu Trp Phe Pro Gly Ser Arg Cys Asp Ile Val Met Thr Gln
740 745 750
Ser Pro Asp Ser Leu Ala Val Ser Leu Gly Glu Arg Ala Thr Ile Asn
755 760 765
Cys Lys Ser Ser Gln Ser Leu Ser Tyr Arg Ser Asn Gln Lys Asn Ser
770 775 780
Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Pro Pro Lys Leu Leu Ile
785 790 795 800
Tyr Trp Ala Ser Thr Arg Glu Ser Gly Val Pro Asp Arg Phe Ser Gly
805 810 815
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Ala
820 825 830
Glu Asp Val Ala Val Tyr Tyr Cys His Gln Tyr Tyr Ser Tyr Pro Tyr
835 840 845
Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala
850 855 860
Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly
865 870 875 880
Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala
885 890 895
Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln
900 905 910
Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser
915 920 925
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr
930 935 940
Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser
945 950 955 960
Phe Asn Arg Gly Glu Cys
965
<210>40
<211>10278
<212>DNA
<213>人造
<220>
<223>合成构建体,EL246 GG TEV多聚蛋白表达载体。
<400>40
gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc 60
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 120
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 180
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 240
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 300
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 360
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 420
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 480
cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg 540
tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg 600
aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg 660
gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag 720
gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc 780
tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa 840
actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact 900
ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt 960
ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca 1020
aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt 1080
ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga 1140
tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca 1200
ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag 1260
tttgggctga gctggctttt tcttgtcgcg attttaaaag gtgtccagtg cgaggtgcag 1320
ctggtgcagt ctggagcaga ggtgaaaaag cccggggagt ctctgaagat ctcctgtaag 1380
gggtccggat acgcattcag tagttcctgg atcggctggg tgcgccagat gcccgggaaa 1440
ggcctggagt ggatggggcg gatttatcct ggagatggag atactaacta caatgggaag 1500
ttcaagggcc aggtcaccat ctcagccgac aagtccatca gcaccgccta cctgcagtgg 1560
agcagcctga aggctagcga caccgccatg tattactgtg cgagagcgcg cgtgggatcc 1620
acggtctatg atggttacct ctatgcaatg gactactggg gtcaaggtac ctcagtcacc 1680
gtctcctcag cgtcgaccaa gggcccatcg gtcttccccc tggcaccctc ctccaagagc 1740
acctctgggg gcacagcggc cctgggctgc ctggtcaagg actacttccc cgaaccggtg 1800
acggtgtcgt ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta 1860
cagtcctcag gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc 1920
acccagacct acatctgcaa cgtgaatcac aagcccagca acaccaaggt ggacaagaaa 1980
gttgagccca aatcttgtga caaaactcac acatgcccac cgtgcccagc acctgaagcc 2040
gcggggggac cgtcagtctt cctcttcccc ccaaaaccca aggacaccct catgatctcc 2100
cggacccctg aggtcacatg cgtggtggtg gacgtgagcc acgaagaccc tgaggtcaag 2160
ttcaactggt acgtggacgg cgtggaggtg cataatgcca agacaaagcc gcgggaggag 2220
cagtacaaca gcacgtaccg tgtggtcagc gtcctcaccg tcctgcacca ggactggctg 2280
aatggcaagg agtacaagtg caaggtctcc aacaaagccc tcccagcccc catcgagaaa 2340
accatctcca aagccaaagg gcagccccga gaaccacagg tgtacaccct gcccccatcc 2400
cgcgaggaga tgaccaagaa ccaggtcagc ctgacctgcc tggtcaaagg cttctatccc 2460
agcgacatcg ccgtggagtg ggagagcaat gggcagccgg agaacaacta caagaccacg 2520
cctcccgtgc tggactccga cggctccttc ttcctctaca gcaagctcac cgtggacaag 2580
agcaggtggc agcaggggaa cgtcttctca tgctccgtga tgcatgaggc tctgcacaac 2640
cactacacgc agaagagcct ctccctgtct aggggtaaac gcgaaccagt ttatttccag 2700
gggagcttgt ttaaggggcc gcgtgattat aacccaatat cgagtgccat ttgtcatcta 2760
acgaatgaat ctgatgggca cacaacatcg ttgtatggta ttggttttgg ccctttcatc 2820
atcacaaaca agcatttgtt tagaagaaat aatggtacac tgttagttca atcactacat 2880
ggtgtgttca aggtaaagaa taccacaact ttgcaacaac acctcattga tgggagggac 2940
atgatgctca ttcgcatgcc taaggatttc ccaccatttc ctcaaaagct gaaattcaga 3000
gagccacaaa gggaagagcg catatgtctt gtgacaacca acttccaaac taagagcatg 3060
tctagcatgg tttcagatac tagttgcaca ttcccttcat ctgatggtat attctggaaa 3120
cattggattc agaccaagga tgggcactgt ggtagcccgt tggtgtcaac tagagatggg 3180
tttattgttg gtatacactc agcatcaaat ttcaccaaca caaacaatta ttttacaagt 3240
gtgccgaaag acttcatgga tttattgaca aatcaagagg cgcagcaatg ggttagtggt 3300
tggcgattga atgctgactc agtgttatgg ggaggccaca aagttttcat gagcaaacct 3360
gaagaaccct ttcagccagt caaagaagca actcaactca tgagtgaatt agtctactcg 3420
caagggatgg acatgcgcgt gcccgcccag ctgctgggcc tgctgctgct gtggttcccc 3480
ggctcgcgat gcgacatcgt gatgacccag tctccagact ccctggctgt gtctctgggc 3540
gagagggcca ccatcaactg caagtccagt cagagccttt catatagaag caatcaaaag 3600
aactcgttgg cctggtacca gcagaaacca ggacagcctc ctaagctgct catttactgg 3660
gctagcacta gggaatctgg ggtccctgac cgattcagtg gatccgggtc tgggacagat 3720
ttcactctca ccatcagcag cctgcaggct gaagatgtgg cagtttatta ctgtcaccaa 3780
tattatagct atccgtacac gttcggaggg gggaccaagg tggaaattaa acgtacggtg 3840
gctgcaccat ctgtcttcat cttcccgcca tctgatgagc agttgaaatc tggaactgcc 3900
tctgttgtgt gcctgctgaa taacttctat cccagagagg ccaaagtaca gtggaaggtg 3960
gataacgccc tccaatcggg taactcccag gagagtgtca cagagcagga cagcaaggac 4020
agcacctaca gcctcagcag caccctgacg ctgagcaaag cagactacga gaaacacaaa 4080
gtctacgcct gcgaagtcac ccatcagggc ctgagctcgc ccgtcacaaa gagcttcaac 4140
aggggagagt gttgagcggc cgcgtttaaa ctgaatgagc gcgtccatcc agacatgata 4200
agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 4260
tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 4320
aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt 4380
taaagcaagt aaaacctcta caaatgtggt atggctgatt atgatccggc tgcctcgcgc 4440
gtttcggtga tgacggtgaa aacctctgac acatgcagct cccggagacg gtcacagctt 4500
gtctgtaagc ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg 4560
ggtgtcgggg cgcagccatg accggtcgac ggcgcgcctt tttttttaat ttttatttta 4620
ttttattttt gacgcgccga aggcgcgatc tgagctcggt acagcttggc tgtggaatgt 4680
gtgtcagtta gggtgtggaa agtccccagg ctccccagca ggcagaagta tgcaaagcat 4740
gcatctcaat tagtcagcaa ccaggtgtgg aaagtcccca ggctccccag caggcagaag 4800
tatgcaaagc atgcatctca attagtcagc aaccatagtc ccgcccctaa ctccgcccat 4860
cccgccccta actccgccca gttccgccca ttctccgccc catggctgac taattttttt 4920
tatttatgca gaggccgagg ccgcctcggc ctctgagcta ttccagaagt agtgaggagg 4980
cttttttgga ggcctaggct tttgcaaaaa gctcctcgag gaactgaaaa accagaaagt 5040
taactggtaa gtttagtctt tttgtctttt atttcaggtc ccggatccgg tggtggtgca 5100
aatcaaagaa ctgctcctca gtggatgttg cctttacttc taggcctgta cggaagtgtt 5160
acttctgctc taaaagctgc ggaattgtac ccgcggccta atacgactca ctatagggac 5220
tagtatggtt cgaccattga actgcatcgt cgccgtgtcc caaaatatgg ggattggcaa 5280
gaacggagac ctaccctggc ctccgctcag gaacgagttc aagtacttcc aaagaatgac 5340
cacaacctct tcagtggaag gtaaacagaa tctggtgatt atgggtagga aaacctggtt 5400
ctccattcct gagaagaatc gacctttaaa ggacagaatt aatatagttc tcagtagaga 5460
actcaaagaa ccaccacgag gagctcattt tcttgccaaa agtttagatg atgccttaag 5520
acttattgaa caaccggaat tggcaagtaa agtagacatg gtttggatag tcggaggcag 5580
ttctgtttac caggaagcca tgaatcaacc aggccacctc agactctttg tgacaaggat 5640
catgcaggaa tttgaaagtg acacgttttt cccagaaatt gatttgggga aatataaact 5700
tctcccagaa tacccaggcg tcctctctga ggtccaggag gaaaaaggca tcaagtataa 5760
gtttgaagtc tacgagaaga aagactaagc ggccgagcgc gcggatctgg aaacgggaga 5820
tgggggaggc taactgaagc acggaaggag acaataccgg aaggaacccg cgctatgacg 5880
gcaataaaaa gacagaataa aacgcacggg tgttgggtcg tttgttcata aacgcggggt 5940
tcggtcccag ggctggcact ctgtcgatac cccaccgaga ccccattggg gccaatacgc 6000
ccgcgtttct tccttttccc caccccaccc cccaagttcg ggtgaaggcc cagggctcgc 6060
agccaacgtc ggggcggcag gccctgccat agccactggc cccgtgggtt agggacgggg 6120
tcccccatgg ggaatggttt atggttcgtg ggggttatta ttttgggcgt tgcgtggggt 6180
ctggagatcc cccgggctgc aggaattccg ttacattact tacggtaaat ggcccgcctg 6240
gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa 6300
cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact 6360
tggcagtaca tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta 6420
aatggcccgc ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt 6480
acatctacgt attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg 6540
ggcgtggata gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg 6600
ggagtttgtt ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc 6660
cattgacgca aaagggcggg aattcgagct cggtactcga gcggtgttcc gcggtcctcc 6720
tcgtatagaa actcggacca ctctgagacg aaggctcgcg tccaggccag cacgaaggag 6780
gctaagtggg aggggtagcg gtcgttgtcc actagggggt ccactcgctc cagggtgtga 6840
agacacatgt cgccctcttc ggcatcaagg aaggtgattg gtttataggt gtaggccacg 6900
tgaccgggtg ttcctgaagg ggggctataa aagggggtgg gggcgcgttc gtcctcactc 6960
tcttccgcat cgctgtctgc gagggccagc tgttgggctc gcggttgagg acaaactctt 7020
cgcggtcttt ccagtactct tggatcggaa acccgtcggc ctccgaacgg tactccgcca 7080
ccgagggacc tgagcgagtc cgcatcgacc ggatcggaaa acctctcgac tgttggggtg 7140
agtactccct ctcaaaagcg ggcatgactt ctgcgctaag attgtcagtt tccaaaaacg 7200
aggaggattt gatattcacc tggcccgcgg tgatgccttt gagggtggcc gcgtccatct 7260
ggtcagaaaa gacaatcttt ttgttgtcaa gcttgaggtg tggcaggctt gagatctggc 7320
catacacttg agtgacaatg acatccactt tgcctttctc tccacaggtg tccactccca 7380
ggtccaaccg gaattgtacc cgcggccaga gcttgcgggc gccaccgcgg ccgcggggat 7440
ccagacatga taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa 7500
aaatgcttta tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc 7560
aataaacaag ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggaggtg 7620
tgggaggttt tttcggatcc tcttggcgta atcatggtca tagctgtttc ctgtgtgaaa 7680
ttgttatccg ctcacaattc cacacaacat acgagccgga agcataaagt gtaaagcctg 7740
gggtgcctaa tgagtgagct aactcacatt aattgcgttg cgctcactgc ccgctttcca 7800
gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg ggaaaggcgg 7860
tttgcgtatt gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg 7920
gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg 7980
ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 8040
ggccgcgttg ctggcgttct tccataggct ccgcccccct gacgagcatc acaaaaatcg 8100
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 8160
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 8220
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 8280
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 8340
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 8400
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 8460
gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 8520
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 8580
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 8640
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 8700
acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tcccttttaa 8760
ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 8820
ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 8880
tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 8940
tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca 9000
gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 9060
tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 9120
tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 9180
ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 9240
tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 9300
ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 9360
gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 9420
ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat 9480
cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 9540
ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 9600
ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 9660
gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 9720
ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 9780
gcgcacattt ccccgaaaag tgccacctga cgtctaagaa accattatta tcatgacatt 9840
aacctataaa aataggcgta tcacgaggcc ctttcgtctc gcgcgtttcg gtgatgacgg 9900
tgaaaacctc tgacacatgc agctcccgga gacggtcaca gcttgtctgt aagcggatgc 9960
cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt ggcgggtgtc ggggctggct 10020
taactatgcg gcatcagagc agattgtact gagagtgcac catatgcggt gtgaaatacc 10080
gcacagatgc gtaaggagaa aataccgcat caggcgccat tcgccattca ggctgcgcaa 10140
ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta cgccagctgg cgaaaggggg 10200
atgtgctgca aggcgattaa gttgggtaac gccagggttt tcccagttac gacgttgtaa 10260
aacgacggcc agtgaatt 10278
<210>41
<211>2865
<212>DNA
<213>人造
<220>
<223>合成构建体,ABT-325 TEV多聚蛋白编码序列。
<220>
<221>CDS
<222>(1)..(2862)
<400>41
atg gag ttt ggg ctg agc tgg ctt ttc ctt gtc gcg att tta aaa ggt 48
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1 5 10 15
gtc cag tgt gag gtg cag ctg gtg cag tct gga aca gag gtg aaa aaa 96
Val Gln Cys Glu Val Gln Leu Val Gln Ser Gly Thr Glu Val Lys Lys
20 25 30
ccc ggg gag tct ctg aag atc tcc tgt aag ggt tct gga tac act gtt 144
Pro Gly Glu Ser Leu Lys Ile Ser Cys Lys Gly Ser Gly Tyr Thr Val
35 40 45
acc agt tac tgg atc ggc tgg gtg cgc cag atg ccc ggg aaa ggc ctg 192
Thr Ser Tyr Trp Ile Gly Trp Val Arg Gln Met Pro Gly Lys Gly Leu
50 55 60
gag tgg atg gga ttc atc tat cct ggt gac tct gaa acc aga tac agt 240
Glu Trp Met Gly Phe Ile Tyr Pro Gly Asp Ser Glu Thr Arg Tyr Ser
65 70 75 80
ccg acc ttc caa ggc cag gtc acc atc tca gcc gac aag tcc ttc aat 288
Pro Thr Phe Gln Gly Gln Val Thr Ile Ser Ala Asp Lys Ser Phe Asn
85 90 95
acc gcc ttc ctg cag tgg agc agt cta aag gcc tcg gac acc gcc atg 336
Thr Ala Phe Leu Gln Trp Ser Ser Leu Lys Ala Ser Asp Thr Ala Met
100 105 110
tat tac tgt gcg cga gtc ggc agt ggc tgg tac cct tat act ttt gat 384
Tyr Tyr Cys Ala Arg Val Gly Ser Gly Trp Tyr Pro Tyr Thr Phe Asp
115 120 125
atc tgg ggc caa ggg aca atg gtc acc gtc tct tca gcg tcg acc aag 432
Ile Trp Gly Gln Gly Thr Met Val Thr Val Ser Ser Ala Ser Thr Lys
130 135 140
ggc cca tcg gtc ttc ccc ctg gca ccc tcc tcc aag agc acc tct ggg 480
Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly
145 150 155 160
ggc aca gcg gcc ctg ggc tgc ctg gtc aag gac tac ttc ccc gaa ccg 528
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro
165 170 175
gtg acg gtg tcg tgg aac tca ggc gcc ctg acc agc ggc gtg cac acc 576
Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr
180 185 190
ttc ccg gct gtc cta cag tcc tca gga ctc tac tcc ctc agc agc gtg 624
Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val
195 200 205
gtg acc gtg ccc tcc agc agc ttg ggc acc cag acc tac atc tgc aac 672
Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn
210 215 220
gtg aat cac aag ccc agc aac acc aag gtg gac aag aaa gtt gag ccc 720
Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro
225 230 235 240
aaa tct tgt gac aaa act cac aca tgc cca ccg tgc cca gca cct gaa 768
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
245 250 255
gcc gcg ggg gga ccg tca gtc ttc ctc ttc ccc cca aaa ccc aag gac 816
Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
260 265 270
acc ctc atg atc tcc cgg acc cct gag gtc aca tgc gtg gtg gtg gac 864
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
275 280 285
gtg agc cac gaa gac cct gag gtc aag ttc aac tgg tac gtg gac ggc 912
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
290 295 300
gtg gag gtg cat aat gcc aag aca aag ccg cgg gag gag cag tac aac 960
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
305 310 315 320
agc acg tac cgt gtg gtc agc gtc ctc acc gtc ctg cac cag gac tgg 1008
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
325 330 335
ctg aat ggc aag gag tac aag tgc aag gtc tcc aac aaa gcc ctc cca 1056
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
340 345 350
gcc ccc atc gag aaa acc atc tcc aaa gcc aaa ggg cag ccc cga gaa 1104
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
355 360 365
cca cag gtg tac acc ctg ccc cca tcc cgc gag gag atg acc aag aac 1152
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn
370 375 380
cag gtc agc ctg acc tgc ctg gtc aaa ggc ttc tat ccc agc gac atc 1200
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
385 390 395 400
gcc gtg gag tgg gag agc aat ggg cag ccg gag aac aac tac aag acc 1248
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
405 410 415
acg cct ccc gtg ctg gac tcc gac ggc tcc ttc ttc ctc tac agc aag 1296
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
420 425 430
ctc acc gtg gac aag agc agg tgg cag cag ggg aac gtc ttc tca tgc 1344
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
435 440 445
tcc gtg atg cat gag gct ctg cac aac cac tac acg cag aag agc ctc 1392
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
450 455 460
tcc ctg tct agg ggt aaa cgc gaa cca gtt tat ttc cag ggg agc ttg 1440
Ser Leu Ser Arg Gly Lys Arg Glu Pro Val Tyr Phe Gln Gly Ser Leu
465 470 475 480
ttt aag ggg ccg cgt gat tat aac cca ata tcg agt gcc att tgt cat 1488
Phe Lys Gly Pro Arg Asp Tyr Asn Pro Ile Ser Ser Ala Ile Cys His
485 490 495
cta acg aat gaa tct gat ggg cac aca aca tcg ttg tat ggt att ggt 1536
Leu Thr Asn Glu Ser Asp Gly His Thr Thr Ser Leu Tyr Gly Ile Gly
500 505 510
ttt ggc cct ttc atc atc aca aac aag cat ttg ttt aga aga aat aat 1584
Phe Gly Pro Phe Ile Ile Thr Asn Lys His Leu Phe Arg Arg Asn Asn
515 520 525
ggt aca ctg tta gtt caa tca cta cat ggt gtg ttc aag gta aag aat 1632
Gly Thr Leu Leu Val Gln Ser Leu His Gly Val Phe Lys Val Lys Asn
530 535 540
acc aca act ttg caa caa cac ctc att gat ggg agg gac atg atg ctc 1680
Thr Thr Thr Leu Gln Gln His Leu Ile Asp Gly Arg Asp Met Met Leu
545 550 555 560
att cgc atg cct aag gat ttc cca cca ttt cct caa aag ctg aaa ttc 1728
Ile Arg Met Pro Lys Asp Phe Pro Pro Phe Pro Gln Lys Leu Lys Phe
565 570 575
aga gag cca caa agg gaa gag cgc ata tgt ctt gtg aca acc aac ttc 1776
Arg Glu Pro Gln Arg Glu Glu Arg Ile Cys Leu Val Thr Thr Asn Phe
580 585 590
caa act aag agc atg tct agc atg gtt tca gat act agt tgc aca ttc 1824
Gln Thr Lys Ser Met Ser Ser Met Val Ser Asp Thr Ser Cys Thr Phe
595 600 605
cct tca tct gat ggt ata ttc tgg aaa cat tgg att cag acc aag gat 1872
Pro Ser Ser Asp Gly Ile Phe Trp Lys His Trp Ile Gln Thr Lys Asp
610 615 620
ggg cac tgt ggt agc ccg ttg gtg tca act aga gat ggg ttt att gtt 1920
Gly His Cys Gly Ser Pro Leu Val Ser Thr Arg Asp Gly Phe Ile Val
625 630 635 640
ggt ata cac tca gca tca aat ttc acc aac aca aac aat tat ttt aca 1968
Gly Ile His Ser Ala Ser Asn Phe Thr Asn Thr Asn Asn Tyr Phe Thr
645 650 655
agt gtg ccg aaa gac ttc atg gat tta ttg aca aat caa gag gcg cag 2016
Ser Val Pro Lys Asp Phe Met Asp Leu Leu Thr Asn Gln Glu Ala Gln
660 665 670
caa tgg gtt agt ggt tgg cga ttg aat gct gac tca gtg tta tgg gga 2064
Gln Trp Val Ser Gly Trp Arg Leu Asn Ala Asp Ser Val Leu Trp Gly
675 680 685
ggc cac aaa gtt ttc atg agc aaa cct gaa gaa ccc ttt cag cca gtc 2112
Gly His Lys Val Phe Met Ser Lys Pro Glu Glu Pro Phe Gln Pro Val
690 695 700
aaa gaa gca act caa ctc atg agt gaa tta gtc tac tcg caa ggg atg 2160
Lys Glu Ala Thr Gln Leu Met Ser Glu Leu Val Tyr Ser Gln Gly Met
705 710 715 720
gaa gcc cca gcg cag ctt ctc ttc ctc ctg cta ctc tgg ctc cca gat 2208
Glu Ala Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro Asp
725 730 735
acc act gga gaa ata gtg atg acg cag tct cca gcc acc ctg tct gtg 2256
Thr Thr Gly Glu Ile Val Met Thr Gln Ser Pro Ala Thr Leu Ser Val
740 745 750
tct cca ggg gaa aga gcc acc ctc tcc tgc agg gcc agt gag agt att 2304
Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Glu Ser Ile
755 760 765
agc agc aac tta gcc tgg tac cag cag aaa cct ggc cag gct ccc agg 2352
Ser Ser Asn Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg
770 775 780
ctc ttc atc tat act gca tcc acc agg gcc act gat atc cca gcc agg 2400
Leu Phe Ile Tyr Thr Ala Ser Thr Arg Ala Thr Asp Ile Pro Ala Arg
785 790 795 800
ttc agt ggc agt ggg tct ggg aca gag ttc act ctc acc atc agc agc 2448
Phe Ser Gly Ser Gly Ser Gly Thr Glu Phe Thr Leu Thr Ile Ser Ser
805 810 815
ctg cag tct gaa gat ttt gca gtt tat tac tgt cag cag tat aat aac 2496
Leu Gln Ser Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Asn Asn
820 825 830
tgg cct tcg atc acc ttc ggc caa ggg aca cga ctg gag att aaa cga 2544
Trp Pro Ser Ile Thr Phe Gly Gln Gly Thr Arg Leu Glu Ile Lys Arg
835 840 845
act gtg gct gca cca tct gtc ttc atc ttc ccg cca tct gat gag cag 2592
Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln
850 855 860
ttg aaa tct gga act gct agc gtt gtg tgc ctg ctg aat aac ttc tat 2640
Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr
865 870 875 880
ccc aga gag gcc aaa gta cag tgg aag gtg gat aac gcc ctc caa tcg 2688
Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser
885 890 895
ggt aac tcc cag gag agt gtc aca gag cag gac agc aag gac agc acc 2736
Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr
900 905 910
tac agc ctc agc agc acc ctg acg ctg agc aaa gca gac tac gag aaa 2784
Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys
915 920 925
cac aaa gtc tac gcc tgc gaa gtc acc cat cag ggc ctg agc tcg ccc 2832
His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro
930 935 940
gtc aca aag agc ttc aac agg gga gag tgt tga 2865
Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
945 950
<210>42
<211>954
<212>PRT
<213>人造
<220>
<223>合成构建体
<400>42
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1 5 10 15
Val Gln Cys Glu Val Gln Leu Val Gln Ser Gly Thr Glu Val Lys Lys
20 25 30
Pro Gly Glu Ser Leu Lys Ile Ser Cys Lys Gly Ser Gly Tyr Thr Val
35 40 45
Thr Ser Tyr Trp Ile Gly Trp Val Arg Gln Met Pro Gly Lys Gly Leu
50 55 60
Glu Trp Met Gly Phe Ile Tyr Pro Gly Asp Ser Glu Thr Arg Tyr Ser
65 70 75 80
Pro Thr Phe Gln Gly Gln Val Thr Ile Ser Ala Asp Lys Ser Phe Asn
85 90 95
Thr Ala Phe Leu Gln Trp Ser Ser Leu Lys Ala Ser Asp Thr Ala Met
100 105 110
Tyr Tyr Cys Ala Arg Val Gly Ser Gly Trp Tyr Pro Tyr Thr Phe Asp
115 120 125
Ile Trp Gly Gln Gly Thr Met Val Thr Val Ser Ser Ala Ser Thr Lys
130 135 140
Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly
145 150 155 160
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro
165 170 175
Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr
180 185 190
Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val
195 200 205
Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn
210 215 220
Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro
225 230 235 240
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
245 250 255
Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
260 265 270
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
275 280 285
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
290 295 300
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
305 310 315 320
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
325 330 335
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
340 345 350
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
355 360 365
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn
370 375 380
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
385 390 395 400
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
405 410 415
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
420 425 430
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
435 440 445
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
450 455 460
Ser Leu Ser Arg Gly Lys Arg Glu Pro Val Tyr Phe Gln Gly Ser Leu
465 470 475 480
Phe Lys Gly Pro Arg Asp Tyr Asn Pro Ile Ser Ser Ala Ile Cys His
485 490 495
Leu Thr Asn Glu Ser Asp Gly His Thr Thr Ser Leu Tyr Gly Ile Gly
500 505 510
Phe Gly Pro Phe Ile Ile Thr Asn Lys His Leu Phe Arg Arg Asn Asn
515 520 525
Gly Thr Leu Leu Val Gln Ser Leu His Gly Val Phe Lys Val Lys Asn
530 535 540
Thr Thr Thr Leu Gln Gln His Leu Ile Asp Gly Arg Asp Met Met Leu
545 550 555 560
Ile Arg Met Pro Lys Asp Phe Pro Pro Phe Pro Gln Lys Leu Lys Phe
565 570 575
Arg Glu Pro Gln Arg Glu Glu Arg Ile Cys Leu Val Thr Thr Asn Phe
580 585 590
Gln Thr Lys Ser Met Ser Ser Met Val Ser Asp Thr Ser Cys Thr Phe
595 600 605
Pro Ser Ser Asp Gly Ile Phe Trp Lys His Trp Ile Gln Thr Lys Asp
610 615 620
Gly His Cys Gly Ser Pro Leu Val Ser Thr Arg Asp Gly Phe Ile Val
625 630 635 640
Gly Ile His Ser Ala Ser Asn Phe Thr Asn Thr Asn Asn Tyr Phe Thr
645 650 655
Ser Val Pro Lys Asp Phe Met Asp Leu Leu Thr Asn Gln Glu Ala Gln
660 665 670
Gln Trp Val Ser Gly Trp Arg Leu Asn Ala Asp Ser Val Leu Trp Gly
675 680 685
Gly His Lys Val Phe Met Ser Lys Pro Glu Glu Pro Phe Gln Pro Val
690 695 700
Lys Glu Ala Thr Gln Leu Met Ser Glu Leu Val Tyr Ser Gln Gly Met
705 710 715 720
Glu Ala Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro Asp
725 730 735
Thr Thr Gly Glu Ile Val Met Thr Gln Ser Pro Ala Thr Leu Ser Val
740 745 750
Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Glu Ser Ile
755 760 765
Ser Ser Asn Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg
770 775 780
Leu Phe Ile Tyr Thr Ala Ser Thr Arg Ala Thr Asp Ile Pro Ala Arg
785 790 795 800
Phe Ser Gly Ser Gly Ser Gly Thr Glu Phe Thr Leu Thr Ile Ser Ser
805 810 815
Leu Gln Ser Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Asn Asn
820 825 830
Trp Pro Ser Ile Thr Phe Gly Gln Gly Thr Arg Leu Glu Ile Lys Arg
835 840 845
Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln
850 855 860
Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr
865 870 875 880
Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser
885 890 895
Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr
900 905 910
Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys
915 920 925
His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro
930 935 940
Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
945 950
<210>43
<211>10242
<212>DNA
<213>人造
<220>
<223>合成构建体,ABT-325 TEV多聚蛋白表达载体。
<400>43
gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc 60
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 120
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 180
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 240
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 300
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 360
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 420
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 480
cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg 540
tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg 600
aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg 660
gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag 720
gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc 780
tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa 840
actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact 900
ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt 960
ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca 1020
aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt 1080
ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga 1140
tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca 1200
ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag 1260
tttgggctga gctggctttt ccttgtcgcg attttaaaag gtgtccagtg tgaggtgcag 1320
ctggtgcagt ctggaacaga ggtgaaaaaa cccggggagt ctctgaagat ctcctgtaag 1380
ggttctggat acactgttac cagttactgg atcggctggg tgcgccagat gcccgggaaa 1440
ggcctggagt ggatgggatt catctatcct ggtgactctg aaaccagata cagtccgacc 1500
ttccaaggcc aggtcaccat ctcagccgac aagtccttca ataccgcctt cctgcagtgg 1560
agcagtctaa aggcctcgga caccgccatg tattactgtg cgcgagtcgg cagtggctgg 1620
tacccttata cttttgatat ctggggccaa gggacaatgg tcaccgtctc ttcagcgtcg 1680
accaagggcc catcggtctt ccccctggca ccctcctcca agagcacctc tgggggcaca 1740
gcggccctgg gctgcctggt caaggactac ttccccgaac cggtgacggt gtcgtggaac 1800
tcaggcgccc tgaccagcgg cgtgcacacc ttcccggctg tcctacagtc ctcaggactc 1860
tactccctca gcagcgtggt gaccgtgccc tccagcagct tgggcaccca gacctacatc 1920
tgcaacgtga atcacaagcc cagcaacacc aaggtggaca agaaagttga gcccaaatct 1980
tgtgacaaaa ctcacacatg cccaccgtgc ccagcacctg aagccgcggg gggaccgtca 2040
gtcttcctct tccccccaaa acccaaggac accctcatga tctcccggac ccctgaggtc 2100
acatgcgtgg tggtggacgt gagccacgaa gaccctgagg tcaagttcaa ctggtacgtg 2160
gacggcgtgg aggtgcataa tgccaagaca aagccgcggg aggagcagta caacagcacg 2220
taccgtgtgg tcagcgtcct caccgtcctg caccaggact ggctgaatgg caaggagtac 2280
aagtgcaagg tctccaacaa agccctccca gcccccatcg agaaaaccat ctccaaagcc 2340
aaagggcagc cccgagaacc acaggtgtac accctgcccc catcccgcga ggagatgacc 2400
aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga catcgccgtg 2460
gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc cgtgctggac 2520
tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag gtggcagcag 2580
gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta cacgcagaag 2640
agcctctccc tgtctagggg taaacgcgaa ccagtttatt tccaggggag cttgtttaag 2700
gggccgcgtg attataaccc aatatcgagt gccatttgtc atctaacgaa tgaatctgat 2760
gggcacacaa catcgttgta tggtattggt tttggccctt tcatcatcac aaacaagcat 2820
ttgtttagaa gaaataatgg tacactgtta gttcaatcac tacatggtgt gttcaaggta 2880
aagaatacca caactttgca acaacacctc attgatggga gggacatgat gctcattcgc 2940
atgcctaagg atttcccacc atttcctcaa aagctgaaat tcagagagcc acaaagggaa 3000
gagcgcatat gtcttgtgac aaccaacttc caaactaaga gcatgtctag catggtttca 3060
gatactagtt gcacattccc ttcatctgat ggtatattct ggaaacattg gattcagacc 3120
aaggatgggc actgtggtag cccgttggtg tcaactagag atgggtttat tgttggtata 3180
cactcagcat caaatttcac caacacaaac aattatttta caagtgtgcc gaaagacttc 3240
atggatttat tgacaaatca agaggcgcag caatgggtta gtggttggcg attgaatgct 3300
gactcagtgt tatggggagg ccacaaagtt ttcatgagca aacctgaaga accctttcag 3360
ccagtcaaag aagcaactca actcatgagt gaattagtct actcgcaagg gatggaagcc 3420
ccagcgcagc ttctcttcct cctgctactc tggctcccag ataccactgg agaaatagtg 3480
atgacgcagt ctccagccac cctgtctgtg tctccagggg aaagagccac cctctcctgc 3540
agggccagtg agagtattag cagcaactta gcctggtacc agcagaaacc tggccaggct 3600
cccaggctct tcatctatac tgcatccacc agggccactg atatcccagc caggttcagt 3660
ggcagtgggt ctgggacaga gttcactctc accatcagca gcctgcagtc tgaagatttt 3720
gcagtttatt actgtcagca gtataataac tggccttcga tcaccttcgg ccaagggaca 3780
cgactggaga ttaaacgaac tgtggctgca ccatctgtct tcatcttccc gccatctgat 3840
gagcagttga aatctggaac tgctagcgtt gtgtgcctgc tgaataactt ctatcccaga 3900
gaggccaaag tacagtggaa ggtggataac gccctccaat cgggtaactc ccaggagagt 3960
gtcacagagc aggacagcaa ggacagcacc tacagcctca gcagcaccct gacgctgagc 4020
aaagcagact acgagaaaca caaagtctac gcctgcgaag tcacccatca gggcctgagc 4080
tcgcccgtca caaagagctt caacagggga gagtgttgag cggccgcgtt taaactgaat 4140
gagcgcgtcc atccagacat gataagatac attgatgagt ttggacaaac cacaactaga 4200
atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc 4260
attataagct gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt 4320
cagggggagg tgtgggaggt tttttaaagc aagtaaaacc tctacaaatg tggtatggct 4380
gattatgatc cggctgcctc gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc 4440
agctcccgga gacggtcaca gcttgtctgt aagcggatgc cgggagcaga caagcccgtc 4500
agggcgcgtc agcgggtgtt ggcgggtgtc ggggcgcagc catgaccggt cgacggcgcg 4560
cctttttttt taatttttat tttattttat ttttgacgcg ccgaaggcgc gatctgagct 4620
cggtacagct tggctgtgga atgtgtgtca gttagggtgt ggaaagtccc caggctcccc 4680
agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccaggt gtggaaagtc 4740
cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt cagcaaccat 4800
agtcccgccc ctaactccgc ccatcccgcc cctaactccg cccagttccg cccattctcc 4860
gccccatggc tgactaattt tttttattta tgcagaggcc gaggccgcct cggcctctga 4920
gctattccag aagtagtgag gaggcttttt tggaggccta ggcttttgca aaaagctcct 4980
cgaggaactg aaaaaccaga aagttaactg gtaagtttag tctttttgtc ttttatttca 5040
ggtcccggat ccggtggtgg tgcaaatcaa agaactgctc ctcagtggat gttgccttta 5100
cttctaggcc tgtacggaag tgttacttct gctctaaaag ctgcggaatt gtacccgcgg 5160
cctaatacga ctcactatag ggactagtat ggttcgacca ttgaactgca tcgtcgccgt 5220
gtcccaaaat atggggattg gcaagaacgg agacctaccc tggcctccgc tcaggaacga 5280
gttcaagtac ttccaaagaa tgaccacaac ctcttcagtg gaaggtaaac agaatctggt 5340
gattatgggt aggaaaacct ggttctccat tcctgagaag aatcgacctt taaaggacag 5400
aattaatata gttctcagta gagaactcaa agaaccacca cgaggagctc attttcttgc 5460
caaaagttta gatgatgcct taagacttat tgaacaaccg gaattggcaa gtaaagtaga 5520
catggtttgg atagtcggag gcagttctgt ttaccaggaa gccatgaatc aaccaggcca 5580
cctcagactc tttgtgacaa ggatcatgca ggaatttgaa agtgacacgt ttttcccaga 5640
aattgatttg gggaaatata aacttctccc agaataccca ggcgtcctct ctgaggtcca 5700
ggaggaaaaa ggcatcaagt ataagtttga agtctacgag aagaaagact aagcggccga 5760
gcgcgcggat ctggaaacgg gagatggggg aggctaactg aagcacggaa ggagacaata 5820
ccggaaggaa cccgcgctat gacggcaata aaaagacaga ataaaacgca cgggtgttgg 5880
gtcgtttgtt cataaacgcg gggttcggtc ccagggctgg cactctgtcg ataccccacc 5940
gagaccccat tggggccaat acgcccgcgt ttcttccttt tccccacccc accccccaag 6000
ttcgggtgaa ggcccagggc tcgcagccaa cgtcggggcg gcaggccctg ccatagccac 6060
tggccccgtg ggttagggac ggggtccccc atggggaatg gtttatggtt cgtgggggtt 6120
attattttgg gcgttgcgtg gggtctggag atcccccggg ctgcaggaat tccgttacat 6180
tacttacggt aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa 6240
taatgacgta tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg 6300
agtatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc 6360
cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct 6420
tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga 6480
tgcggttttg gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa 6540
gtctccaccc cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc 6600
caaaatgtcg taacaactcc gccccattga cgcaaaaggg cgggaattcg agctcggtac 6660
tcgagcggtg ttccgcggtc ctcctcgtat agaaactcgg accactctga gacgaaggct 6720
cgcgtccagg ccagcacgaa ggaggctaag tgggaggggt agcggtcgtt gtccactagg 6780
gggtccactc gctccagggt gtgaagacac atgtcgccct cttcggcatc aaggaaggtg 6840
attggtttat aggtgtaggc cacgtgaccg ggtgttcctg aaggggggct ataaaagggg 6900
gtgggggcgc gttcgtcctc actctcttcc gcatcgctgt ctgcgagggc cagctgttgg 6960
gctcgcggtt gaggacaaac tcttcgcggt ctttccagta ctcttggatc ggaaacccgt 7020
cggcctccga acggtactcc gccaccgagg gacctgagcg agtccgcatc gaccggatcg 7080
gaaaacctct cgactgttgg ggtgagtact ccctctcaaa agcgggcatg acttctgcgc 7140
taagattgtc agtttccaaa aacgaggagg atttgatatt cacctggccc gcggtgatgc 7200
ctttgagggt ggccgcgtcc atctggtcag aaaagacaat ctttttgttg tcaagcttga 7260
ggtgtggcag gcttgagatc tggccataca cttgagtgac aatgacatcc actttgcctt 7320
tctctccaca ggtgtccact cccaggtcca accggaattg tacccgcggc cagagcttgc 7380
gggcgccacc gcggccgcgg ggatccagac atgataagat acattgatga gtttggacaa 7440
accacaacta gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga tgctattgct 7500
ttatttgtaa ccattataag ctgcaataaa caagttaaca acaacaattg cattcatttt 7560
atgtttcagg ttcaggggga ggtgtgggag gttttttcgg atcctcttgg cgtaatcatg 7620
gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc 7680
cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc 7740
gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat 7800
cggccaacgc gcggggaaag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac 7860
tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 7920
aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca 7980
gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg ttcttccata ggctccgccc 8040
ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 8100
ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 8160
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 8220
ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 8280
cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 8340
cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 8400
gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 8460
aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 8520
tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 8580
gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 8640
tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 8700
gatcttcacc tagatccctt ttaattaaaa atgaagtttt aaatcaatct aaagtatata 8760
tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 8820
ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 8880
ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 8940
tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 9000
aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 9060
gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 9120
gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 9180
ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 9240
gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 9300
gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 9360
gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 9420
tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 9480
gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 9540
agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 9600
aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 9660
ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 9720
gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcta 9780
agaaaccatt attatcatga cattaaccta taaaaatagg cgtatcacga ggccctttcg 9840
tctcgcgcgt ttcggtgatg acggtgaaaa cctctgacac atgcagctcc cggagacggt 9900
cacagcttgt ctgtaagcgg atgccgggag cagacaagcc cgtcagggcg cgtcagcggg 9960
tgttggcggg tgtcggggct ggcttaacta tgcggcatca gagcagattg tactgagagt 10020
gcaccatatg cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc gcatcaggcg 10080
ccattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct 10140
attacgccag ctggcgaaag ggggatgtgc tgcaaggcga ttaagttggg taacgccagg 10200
gttttcccag ttacgacgtt gtaaaacgac ggccagtgaa tt 10242
<210>44
<211>10245
<212>DNA
<213>人造
<220>
<223>合成构建体,D2E7 TEV多聚蛋白表达载体。
<400>44
gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc 60
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 120
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 180
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 240
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 300
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 360
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 420
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 480
cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg 540
tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg 600
aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg 660
gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag 720
gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc 780
tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa 840
actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact 900
ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt 960
ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca 1020
aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt 1080
ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga 1140
tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca 1200
ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag 1260
tttgggctga gctggctttt tcttgtcgcg attttaaaag gtgtccagtg tgaggtgcag 1320
ctggtggagt ctgggggagg cttggtacag cccggcaggt ccctgagact ctcctgtgcg 1380
gcctctggat tcacctttga tgattatgcc atgcactggg tccggcaagc tccagggaag 1440
ggcctggaat gggtctcagc tatcacttgg aatagtggtc acatagacta tgcggactct 1500
gtggagggcc gattcaccat ctccagagac aacgccaaga actccctgta tctgcaaatg 1560
aacagtctga gagctgagga tacggccgta tattactgtg cgaaagtctc gtaccttagc 1620
accgcgtcct cccttgacta ttggggccaa ggtaccctgg tcaccgtctc gagtgcgtcg 1680
accaagggcc catcggtctt ccccctggca ccctcctcca agagcacctc tgggggcaca 1740
gcggccctgg gctgcctggt caaggactac ttccccgaac cggtgacggt gtcgtggaac 1800
tcaggcgccc tgaccagcgg cgtgcacacc ttcccggctg tcctacagtc ctcaggactc 1860
tactccctca gcagcgtggt gaccgtgccc tccagcagct tgggcaccca gacctacatc 1920
tgcaacgtga atcacaagcc cagcaacacc aaggtggaca agaaagttga gcccaaatct 1980
tgtgacaaaa ctcacacatg cccaccgtgc ccagcacctg aactcctggg gggaccgtca 2040
gtcttcctct tccccccaaa acccaaggac accctcatga tctcccggac ccctgaggtc 2100
acatgcgtgg tggtggacgt gagccacgaa gaccctgagg tcaagttcaa ctggtacgtg 2160
gacggcgtgg aggtgcataa tgccaagaca aagccgcggg aggagcagta caacagcacg 2220
taccgtgtgg tcagcgtcct caccgtcctg caccaggact ggctgaatgg caaggagtac 2280
aagtgcaagg tctccaacaa agccctccca gcccccatcg agaaaaccat ctccaaagcc 2340
aaagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga tgagctgacc 2400
aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga catcgccgtg 2460
gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc cgtgctggac 2520
tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag gtggcagcag 2580
gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta cacgcagaag 2640
agcctctccc tgtctagggg taaacgcgaa ccagtttatt tccaggggag cttgtttaag 2700
gggccgcgtg attataaccc aatatcgagt gccatttgtc atctaacgaa tgaatctgat 2760
gggcacacaa catcgttgta tggtattggt tttggccctt tcatcatcac aaacaagcat 2820
ttgtttagaa gaaataatgg tacactgtta gttcaatcac tacatggtgt gttcaaggta 2880
aagaatacca caactttgca acaacacctc attgatggga gggacatgat gctcattcgc 2940
atgcctaagg atttcccacc atttcctcaa aagctgaaat tcagagagcc acaaagggaa 3000
gagcgcatat gtcttgtgac aaccaacttc caaactaaga gcatgtctag catggtttca 3060
gatactagtt gcacattccc ttcatctgat ggtatattct ggaaacattg gattcagacc 3120
aaggatgggc actgtggtag cccgttggtg tcaactagag atgggtttat tgttggtata 3180
cactcagcat caaatttcac caacacaaac aattatttta caagtgtgcc gaaagacttc 3240
atggatttat tgacaaatca agaggcgcag caatgggtta gtggttggcg attgaatgct 3300
gactcagtgt tatggggagg ccacaaagtt ttcatgagca aacctgaaga accctttcag 3360
ccagtcaaag aagcaactca actcatgagt gaattagtct actcgcaagg gatggacatg 3420
cgcgtgcccg cccagctgct gggcctgctg ctgctgtggt tccccggctc gcgatgcgac 3480
atccagatga cccagtctcc atcctccctg tctgcatctg taggggacag agtcaccatc 3540
acttgtcggg caagtcaggg catcagaaat tacttagcct ggtatcagca aaaaccaggg 3600
aaagccccta agctcctgat ctatgctgca tccactttgc aatcaggggt cccatctcgg 3660
ttcagtggca gtggatctgg gacagatttc actctcacca tcagcagcct acagcctgaa 3720
gatgttgcaa cttattactg tcaaaggtat aaccgtgcac cgtatacttt tggccagggg 3780
accaaggtgg aaatcaaacg tacggtggct gcaccatctg tcttcatctt cccgccatct 3840
gatgagcagt tgaaatctgg aactgcctct gttgtgtgcc tgctgaataa cttctatccc 3900
agagaggcca aagtacagtg gaaggtggat aacgccctcc aatcgggtaa ctcccaggag 3960
agtgtcacag agcaggacag caaggacagc acctacagcc tcagcagcac cctgacgctg 4020
agcaaagcag actacgagaa acacaaagtc tacgcctgcg aagtcaccca tcagggcctg 4080
agctcgcccg tcacaaagag cttcaacagg ggagagtgtt gagcggccgc gtttaaactg 4140
aatgagcgcg tccatccaga catgataaga tacattgatg agtttggaca aaccacaact 4200
agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta 4260
accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt tatgtttcag 4320
gttcaggggg aggtgtggga ggttttttaa agcaagtaaa acctctacaa atgtggtatg 4380
gctgattatg atccggctgc ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca 4440
tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagc agacaagccc 4500
gtcagggcgc gtcagcgggt gttggcgggt gtcggggcgc agccatgacc ggtcgacggc 4560
gcgccttttt ttttaatttt tattttattt tatttttgac gcgccgaagg cgcgatctga 4620
gctcggtaca gcttggctgt ggaatgtgtg tcagttaggg tgtggaaagt ccccaggctc 4680
cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca ggtgtggaaa 4740
gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt agtcagcaac 4800
catagtcccg cccctaactc cgcccatccc gcccctaact ccgcccagtt ccgcccattc 4860
tccgccccat ggctgactaa ttttttttat ttatgcagag gccgaggccg cctcggcctc 4920
tgagctattc cagaagtagt gaggaggctt ttttggaggc ctaggctttt gcaaaaagct 4980
cctcgaggaa ctgaaaaacc agaaagttaa ctggtaagtt tagtcttttt gtcttttatt 5040
tcaggtcccg gatccggtgg tggtgcaaat caaagaactg ctcctcagtg gatgttgcct 5100
ttacttctag gcctgtacgg aagtgttact tctgctctaa aagctgcgga attgtacccg 5160
cggcctaata cgactcacta tagggactag tatggttcga ccattgaact gcatcgtcgc 5220
cgtgtcccaa aatatgggga ttggcaagaa cggagaccta ccctggcctc cgctcaggaa 5280
cgagttcaag tacttccaaa gaatgaccac aacctcttca gtggaaggta aacagaatct 5340
ggtgattatg ggtaggaaaa cctggttctc cattcctgag aagaatcgac ctttaaagga 5400
cagaattaat atagttctca gtagagaact caaagaacca ccacgaggag ctcattttct 5460
tgccaaaagt ttagatgatg ccttaagact tattgaacaa ccggaattgg caagtaaagt 5520
agacatggtt tggatagtcg gaggcagttc tgtttaccag gaagccatga atcaaccagg 5580
ccacctcaga ctctttgtga caaggatcat gcaggaattt gaaagtgaca cgtttttccc 5640
agaaattgat ttggggaaat ataaacttct cccagaatac ccaggcgtcc tctctgaggt 5700
ccaggaggaa aaaggcatca agtataagtt tgaagtctac gagaagaaag actaagcggc 5760
cgagcgcgcg gatctggaaa cgggagatgg gggaggctaa ctgaagcacg gaaggagaca 5820
ataccggaag gaacccgcgc tatgacggca ataaaaagac agaataaaac gcacgggtgt 5880
tgggtcgttt gttcataaac gcggggttcg gtcccagggc tggcactctg tcgatacccc 5940
accgagaccc cattggggcc aatacgcccg cgtttcttcc ttttccccac cccacccccc 6000
aagttcgggt gaaggcccag ggctcgcagc caacgtcggg gcggcaggcc ctgccatagc 6060
cactggcccc gtgggttagg gacggggtcc cccatgggga atggtttatg gttcgtgggg 6120
gttattattt tgggcgttgc gtggggtctg gagatccccc gggctgcagg aattccgtta 6180
cattacttac ggtaaatggc ccgcctggct gaccgcccaa cgacccccgc ccattgacgt 6240
caataatgac gtatgttccc atagtaacgc caatagggac tttccattga cgtcaatggg 6300
tggagtattt acggtaaact gcccacttgg cagtacatca agtgtatcat atgccaagta 6360
cgccccctat tgacgtcaat gacggtaaat ggcccgcctg gcattatgcc cagtacatga 6420
ccttatggga ctttcctact tggcagtaca tctacgtatt agtcatcgct attaccatgg 6480
tgatgcggtt ttggcagtac atcaatgggc gtggatagcg gtttgactca cggggatttc 6540
caagtctcca ccccattgac gtcaatggga gtttgttttg gcaccaaaat caacgggact 6600
ttccaaaatg tcgtaacaac tccgccccat tgacgcaaaa gggcgggaat tcgagctcgg 6660
tactcgagcg gtgttccgcg gtcctcctcg tatagaaact cggaccactc tgagacgaag 6720
gctcgcgtcc aggccagcac gaaggaggct aagtgggagg ggtagcggtc gttgtccact 6780
agggggtcca ctcgctccag ggtgtgaaga cacatgtcgc cctcttcggc atcaaggaag 6840
gtgattggtt tataggtgta ggccacgtga ccgggtgttc ctgaaggggg gctataaaag 6900
ggggtggggg cgcgttcgtc ctcactctct tccgcatcgc tgtctgcgag ggccagctgt 6960
tgggctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg atcggaaacc 7020
cgtcggcctc cgaacggtac tccgccaccg agggacctga gcgagtccgc atcgaccgga 7080
tcggaaaacc tctcgactgt tggggtgagt actccctctc aaaagcgggc atgacttctg 7140
cgctaagatt gtcagtttcc aaaaacgagg aggatttgat attcacctgg cccgcggtga 7200
tgcctttgag ggtggccgcg tccatctggt cagaaaagac aatctttttg ttgtcaagct 7260
tgaggtgtgg caggcttgag atctggccat acacttgagt gacaatgaca tccactttgc 7320
ctttctctcc acaggtgtcc actcccaggt ccaaccggaa ttgtacccgc ggccagagct 7380
tgcgggcgcc accgcggccg cggggatcca gacatgataa gatacattga tgagtttgga 7440
caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt 7500
gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa ttgcattcat 7560
tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt cggatcctct tggcgtaatc 7620
atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg 7680
agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat 7740
tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg 7800
aatcggccaa cgcgcgggga aaggcggttt gcgtattggg cgctcttccg cttcctcgct 7860
cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 7920
ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 7980
ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgttcttcc ataggctccg 8040
cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 8100
actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 8160
cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 8220
tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 8280
gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 8340
caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 8400
agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 8460
tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 8520
tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 8580
gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 8640
gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 8700
aaggatcttc acctagatcc cttttaatta aaaatgaagt tttaaatcaa tctaaagtat 8760
atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 8820
gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 8880
acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 8940
ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 9000
tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 9060
ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg 9120
ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 9180
atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 9240
taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 9300
catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 9360
atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc 9420
acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 9480
aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 9540
ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 9600
cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 9660
atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 9720
ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt 9780
ctaagaaacc attattatca tgacattaac ctataaaaat aggcgtatca cgaggccctt 9840
tcgtctcgcg cgtttcggtg atgacggtga aaacctctga cacatgcagc tcccggagac 9900
ggtcacagct tgtctgtaag cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc 9960
gggtgttggc gggtgtcggg gctggcttaa ctatgcggca tcagagcaga ttgtactgag 10020
agtgcaccat atgcggtgtg aaataccgca cagatgcgta aggagaaaat accgcatcag 10080
gcgccattcg ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc 10140
gctattacgc cagctggcga aagggggatg tgctgcaagg cgattaagtt gggtaacgcc 10200
agggttttcc cagttacgac gttgtaaaac gacggccagt gaatt 10245
<210>45
<211>2196
<212>DNA
<213>人造
<220>
<223>合成构建体,编码D2E7内部裂解信号肽构建体的序列。
<220>
<221>CDS
<222>(1)..(2193)
<400>45
atg gag ttt ggg ctg agc tgg ctt ttt ctt gtc gcg att tta aaa ggt 48
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1 5 10 15
gtc cag tgt gag gtg cag ctg gtg gag tct ggg gga ggc ttg gta cag 96
Val Gln Cys Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln
20 25 30
ccc ggc agg tcc ctg aga ctc tcc tgt gcg gcc tct gga ttc acc ttt 144
Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
35 40 45
gat gat tat gcc atg cac tgg gtc cgg caa gct cca ggg aag ggc ctg 192
Asp Asp Tyr Ala Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
gaa tgg gtc tca gct atc act tgg aat agt ggt cac ata gac tat gcg 240
Glu Trp Val Ser Ala Ile Thr Trp Asn Ser Gly His Ile Asp Tyr Ala
65 70 75 80
gac tct gtg gag ggc cga ttc acc atc tcc aga gac aac gcc aag aac 288
Asp Ser Val Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
85 90 95
tcc ctg tat ctg caa atg aac agt ctg aga gct gag gat acg gcc gta 336
Ser Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val
100 105 110
tat tac tgt gcg aaa gtc tcg tac ctt agc acc gcg tcc tcc ctt gac 384
Tyr Tyr Cys Ala Lys Val Ser Tyr Leu Ser Thr Ala Ser Ser Leu Asp
115 120 125
tat tgg ggc caa ggt acc ctg gtc acc gtc tcg agt gcg tcg acc aag 432
Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys
130 135 140
ggc cca tcg gtc ttc ccc ctg gca ccc tcc tcc aag agc acc tct ggg 480
Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly
145 150 155 160
ggc aca gcg gcc ctg ggc tgc ctg gtc aag gac tac ttc ccc gaa ccg 528
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro
165 170 175
gtg acg gtg tcg tgg aac tca ggc gcc ctg acc agc ggc gtg cac acc 576
Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr
180 185 190
ttc ccg gct gtc cta cag tcc tca gga ctc tac tcc ctc agc agc gtg 624
Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val
195 200 205
gtg acc gtg ccc tcc agc agc ttg ggc acc cag acc tac atc tgc aac 672
Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn
210 215 220
gtg aat cac aag ccc agc aac acc aag gtg gac aag aaa gtt gag ccc 720
Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro
225 230 235 240
aaa tct tgt gac aaa act cac aca tgc cca ccg tgc cca gca cct gaa 768
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
245 250 255
ctc ctg ggg gga ccg tca gtc ttc ctc ttc ccc cca aaa ccc aag gac 816
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
260 265 270
acc ctc atg atc tcc cgg acc cct gag gtc aca tgc gtg gtg gtg gac 864
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
275 280 285
gtg agc cac gaa gac cct gag gtc aag ttc aac tgg tac gtg gac ggc 912
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
290 295 300
gtg gag gtg cat aat gcc aag aca aag ccg cgg gag gag cag tac aac 960
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
305 310 315 320
agc acg tac cgt gtg gtc agc gtc ctc acc gtc ctg cac cag gac tgg 1008
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
325 330 335
ctg aat ggc aag gag tac aag tgc aag gtc tcc aac aaa gcc ctc cca 1056
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
340 345 350
gcc ccc atc gag aaa acc atc tcc aaa gcc aaa ggg cag ccc cga gaa 1104
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
355 360 365
cca cag gtg tac acc ctg ccc cca tcc cgg gat gag ctg acc aag aac 1152
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn
370 375 380
cag gtc agc ctg acc tgc ctg gtc aaa ggc ttc tat ccc agc gac atc 1200
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
385 390 395 400
gcc gtg gag tgg gag agc aat ggg cag ccg gag aac aac tac aag acc 1248
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
405 410 415
acg cct ccc gtg ctg gac tcc gac ggc tcc ttc ttc ctc tac agc aag 1296
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
420 425 430
ctc acc gtg gac aag agc agg tgg cag cag ggg aac gtc ttc tca tgc 1344
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
435 440 445
tcc gtg atg cat gag gct ctg cac aac cac tac acg cag aag agc ctc 1392
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
450 455 460
tcc ctg tct agg ggt aaa cgc atg gga cga atg gca atg aaa tgg tta 1440
Ser Leu Ser Arg Gly Lys Arg Met Gly Arg Met Ala Met Lys Trp Leu
465 470 475 480
gtt gtt ata ata tgt ttc tct ata aca agt caa cct gct tct gct atg 1488
Val Val Ile Ile Cys Phe Ser Ile Thr Ser Gln Pro Ala Ser Ala Met
485 490 495
gac atg cgc gtg ccc gcc cag ctg ctg ggc ctg ctg ctg ctg tgg ttc 1536
Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe
500 505 510
ccc ggc tcg cga tgc gac atc cag atg acc cag tct cca tcc tcc ctg 1584
Pro Gly Ser Arg Cys Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu
515 520 525
tct gca tct gta ggg gac aga gtc acc atc act tgt cgg gca agt cag 1632
Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln
530 535 540
ggc atc aga aat tac tta gcc tgg tat cag caa aaa cca ggg aaa gcc 1680
Gly Ile Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala
545 550 555 560
cct aag ctc ctg atc tat gct gca tcc act ttg caa tca ggg gtc cca 1728
Pro Lys Leu Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val Pro
565 570 575
tct cgg ttc agt ggc agt gga tct ggg aca gat ttc act ctc acc atc 1776
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile
580 585 590
agc agc cta cag cct gaa gat gtt gca act tat tac tgt caa agg tat 1824
Ser Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg Tyr
595 600 605
aac cgt gca ccg tat act ttt ggc cag ggg acc aag gtg gaa atc aaa 1872
Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys
610 615 620
cgt acg gtg gct gca cca tct gtc ttc atc ttc ccg cca tct gat gag 1920
Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu
625 630 635 640
cag ttg aaa tct gga act gcc tct gtt gtg tgc ctg ctg aat aac ttc 1968
Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe
645 650 655
tat ccc aga gag gcc aaa gta cag tgg aag gtg gat aac gcc ctc caa 2016
Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln
660 665 670
tcg ggt aac tcc cag gag agt gtc aca gag cag gac agc aag gac agc 2064
Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser
675 680 685
acc tac agc ctc agc agc acc ctg acg ctg agc aaa gca gac tac gag 2112
Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu
690 695 700
aaa cac aaa gtc tac gcc tgc gaa gtc acc cat cag ggc ctg agc tcg 2160
Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser
705 710 715 720
ccc gtc aca aag agc ttc aac agg gga gag tgt tga 2196
Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
725 730
<210>46
<211>731
<212>PRT
<213>人造
<220>
<223>合成构建体
<400>46
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1 5 10 15
Val Gln Cys Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln
20 25 30
Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
35 40 45
Asp Asp Tyr Ala Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
Glu Trp Val Ser Ala Ile Thr Trp Asn Ser Gly His Ile Asp Tyr Ala
65 70 75 80
Asp Ser Val Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
85 90 95
Ser Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Lys Val Ser Tyr Leu Ser Thr Ala Ser Ser Leu Asp
115 120 125
Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys
130 135 140
Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly
145 150 155 160
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro
165 170 175
Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr
180 185 190
Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val
195 200 205
Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn
210 215 220
Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro
225 230 235 240
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
245 250 255
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
260 265 270
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
275 280 285
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
290 295 300
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
305 310 315 320
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
325 330 335
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
340 345 350
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
355 360 365
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn
370 375 380
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
385 390 395 400
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
405 410 415
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
420 425 430
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
435 440 445
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
450 455 460
Ser Leu Ser Arg Gly Lys Arg Met Gly Arg Met Ala Met Lys Trp Leu
465 470 475 480
Val Val Ile Ile Cys Phe Ser Ile Thr Ser Gln Pro Ala Ser Ala Met
485 490 495
Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe
500 505 510
Pro Gly Ser Arg Cys Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu
515 520 525
Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln
530 535 540
Gly Ile Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala
545 550 555 560
Pro Lys Leu Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val Pro
565 570 575
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile
580 585 590
Ser Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg Tyr
595 600 605
Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys
610 615 620
Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu
625 630 635 640
Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe
645 650 655
Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln
660 665 670
Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser
675 680 685
Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu
690 695 700
Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser
705 710 715 720
Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
725 730
<210>47
<211>9573
<212>DNA
<213>人造
<220>
<223>合成构建体,D2E7内部可裂解信号肽
多聚蛋白表达载体。
<400>47
gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc 60
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 120
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 180
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 240
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 300
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 360
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 420
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 480
cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg 540
tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg 600
aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg 660
gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag 720
gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc 780
tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa 840
actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact 900
ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt 960
ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca 1020
aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt 1080
ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga 1140
tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca 1200
ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag 1260
tttgggctga gctggctttt tcttgtcgcg attttaaaag gtgtccagtg tgaggtgcag 1320
ctggtggagt ctgggggagg cttggtacag cccggcaggt ccctgagact ctcctgtgcg 1380
gcctctggat tcacctttga tgattatgcc atgcactggg tccggcaagc tccagggaag 1440
ggcctggaat gggtctcagc tatcacttgg aatagtggtc acatagacta tgcggactct 1500
gtggagggcc gattcaccat ctccagagac aacgccaaga actccctgta tctgcaaatg 1560
aacagtctga gagctgagga tacggccgta tattactgtg cgaaagtctc gtaccttagc 1620
accgcgtcct cccttgacta ttggggccaa ggtaccctgg tcaccgtctc gagtgcgtcg 1680
accaagggcc catcggtctt ccccctggca ccctcctcca agagcacctc tgggggcaca 1740
gcggccctgg gctgcctggt caaggactac ttccccgaac cggtgacggt gtcgtggaac 1800
tcaggcgccc tgaccagcgg cgtgcacacc ttcccggctg tcctacagtc ctcaggactc 1860
tactccctca gcagcgtggt gaccgtgccc tccagcagct tgggcaccca gacctacatc 1920
tgcaacgtga atcacaagcc cagcaacacc aaggtggaca agaaagttga gcccaaatct 1980
tgtgacaaaa ctcacacatg cccaccgtgc ccagcacctg aactcctggg gggaccgtca 2040
gtcttcctct tccccccaaa acccaaggac accctcatga tctcccggac ccctgaggtc 2100
acatgcgtgg tggtggacgt gagccacgaa gaccctgagg tcaagttcaa ctggtacgtg 2160
gacggcgtgg aggtgcataa tgccaagaca aagccgcggg aggagcagta caacagcacg 2220
taccgtgtgg tcagcgtcct caccgtcctg caccaggact ggctgaatgg caaggagtac 2280
aagtgcaagg tctccaacaa agccctccca gcccccatcg agaaaaccat ctccaaagcc 2340
aaagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga tgagctgacc 2400
aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga catcgccgtg 2460
gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc cgtgctggac 2520
tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag gtggcagcag 2580
gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta cacgcagaag 2640
agcctctccc tgtctagggg taaacgcatg ggacgaatgg caatgaaatg gttagttgtt 2700
ataatatgtt tctctataac aagtcaacct gcttctgcta tggacatgcg cgtgcccgcc 2760
cagctgctgg gcctgctgct gctgtggttc cccggctcgc gatgcgacat ccagatgacc 2820
cagtctccat cctccctgtc tgcatctgta ggggacagag tcaccatcac ttgtcgggca 2880
agtcagggca tcagaaatta cttagcctgg tatcagcaaa aaccagggaa agcccctaag 2940
ctcctgatct atgctgcatc cactttgcaa tcaggggtcc catctcggtt cagtggcagt 3000
ggatctggga cagatttcac tctcaccatc agcagcctac agcctgaaga tgttgcaact 3060
tattactgtc aaaggtataa ccgtgcaccg tatacttttg gccaggggac caaggtggaa 3120
atcaaacgta cggtggctgc accatctgtc ttcatcttcc cgccatctga tgagcagttg 3180
aaatctggaa ctgcctctgt tgtgtgcctg ctgaataact tctatcccag agaggccaaa 3240
gtacagtgga aggtggataa cgccctccaa tcgggtaact cccaggagag tgtcacagag 3300
caggacagca aggacagcac ctacagcctc agcagcaccc tgacgctgag caaagcagac 3360
tacgagaaac acaaagtcta cgcctgcgaa gtcacccatc agggcctgag ctcgcccgtc 3420
acaaagagct tcaacagggg agagtgttga gcggccgcgt ttaaactgaa tgagcgcgtc 3480
catccagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 3540
aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 3600
tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag 3660
gtgtgggagg ttttttaaag caagtaaaac ctctacaaat gtggtatggc tgattatgat 3720
ccggctgcct cgcgcgtttc ggtgatgacg gtgaaaacct ctgacacatg cagctcccgg 3780
agacggtcac agcttgtctg taagcggatg ccgggagcag acaagcccgt cagggcgcgt 3840
cagcgggtgt tggcgggtgt cggggcgcag ccatgaccgg tcgacggcgc gccttttttt 3900
ttaattttta ttttatttta tttttgacgc gccgaaggcg cgatctgagc tcggtacagc 3960
ttggctgtgg aatgtgtgtc agttagggtg tggaaagtcc ccaggctccc cagcaggcag 4020
aagtatgcaa agcatgcatc tcaattagtc agcaaccagg tgtggaaagt ccccaggctc 4080
cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca tagtcccgcc 4140
cctaactccg cccatcccgc ccctaactcc gcccagttcc gcccattctc cgccccatgg 4200
ctgactaatt ttttttattt atgcagaggc cgaggccgcc tcggcctctg agctattcca 4260
gaagtagtga ggaggctttt ttggaggcct aggcttttgc aaaaagctcc tcgaggaact 4320
gaaaaaccag aaagttaact ggtaagttta gtctttttgt cttttatttc aggtcccgga 4380
tccggtggtg gtgcaaatca aagaactgct cctcagtgga tgttgccttt acttctaggc 4440
ctgtacggaa gtgttacttc tgctctaaaa gctgcggaat tgtacccgcg gcctaatacg 4500
actcactata gggactagta tggttcgacc attgaactgc atcgtcgccg tgtcccaaaa 4560
tatggggatt ggcaagaacg gagacctacc ctggcctccg ctcaggaacg agttcaagta 4620
cttccaaaga atgaccacaa cctcttcagt ggaaggtaaa cagaatctgg tgattatggg 4680
taggaaaacc tggttctcca ttcctgagaa gaatcgacct ttaaaggaca gaattaatat 4740
agttctcagt agagaactca aagaaccacc acgaggagct cattttcttg ccaaaagttt 4800
agatgatgcc ttaagactta ttgaacaacc ggaattggca agtaaagtag acatggtttg 4860
gatagtcgga ggcagttctg tttaccagga agccatgaat caaccaggcc acctcagact 4920
ctttgtgaca aggatcatgc aggaatttga aagtgacacg tttttcccag aaattgattt 4980
ggggaaatat aaacttctcc cagaataccc aggcgtcctc tctgaggtcc aggaggaaaa 5040
aggcatcaag tataagtttg aagtctacga gaagaaagac taagcggccg agcgcgcgga 5100
tctggaaacg ggagatgggg gaggctaact gaagcacgga aggagacaat accggaagga 5160
acccgcgcta tgacggcaat aaaaagacag aataaaacgc acgggtgttg ggtcgtttgt 5220
tcataaacgc ggggttcggt cccagggctg gcactctgtc gataccccac cgagacccca 5280
ttggggccaa tacgcccgcg tttcttcctt ttccccaccc caccccccaa gttcgggtga 5340
aggcccaggg ctcgcagcca acgtcggggc ggcaggccct gccatagcca ctggccccgt 5400
gggttaggga cggggtcccc catggggaat ggtttatggt tcgtgggggt tattattttg 5460
ggcgttgcgt ggggtctgga gatcccccgg gctgcaggaa ttccgttaca ttacttacgg 5520
taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt 5580
atgttcccat agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac 5640
ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg 5700
acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact 5760
ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt 5820
ggcagtacat caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc 5880
ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc 5940
gtaacaactc cgccccattg acgcaaaagg gcgggaattc gagctcggta ctcgagcggt 6000
gttccgcggt cctcctcgta tagaaactcg gaccactctg agacgaaggc tcgcgtccag 6060
gccagcacga aggaggctaa gtgggagggg tagcggtcgt tgtccactag ggggtccact 6120
cgctccaggg tgtgaagaca catgtcgccc tcttcggcat caaggaaggt gattggttta 6180
taggtgtagg ccacgtgacc gggtgttcct gaaggggggc tataaaaggg ggtgggggcg 6240
cgttcgtcct cactctcttc cgcatcgctg tctgcgaggg ccagctgttg ggctcgcggt 6300
tgaggacaaa ctcttcgcgg tctttccagt actcttggat cggaaacccg tcggcctccg 6360
aacggtactc cgccaccgag ggacctgagc gagtccgcat cgaccggatc ggaaaacctc 6420
tcgactgttg gggtgagtac tccctctcaa aagcgggcat gacttctgcg ctaagattgt 6480
cagtttccaa aaacgaggag gatttgatat tcacctggcc cgcggtgatg cctttgaggg 6540
tggccgcgtc catctggtca gaaaagacaa tctttttgtt gtcaagcttg aggtgtggca 6600
ggcttgagat ctggccatac acttgagtga caatgacatc cactttgcct ttctctccac 6660
aggtgtccac tcccaggtcc aaccggaatt gtacccgcgg ccagagcttg cgggcgccac 6720
cgcggccgcg gggatccaga catgataaga tacattgatg agtttggaca aaccacaact 6780
agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta 6840
accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt tatgtttcag 6900
gttcaggggg aggtgtggga ggttttttcg gatcctcttg gcgtaatcat ggtcatagct 6960
gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat 7020
aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc 7080
actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg 7140
cgcggggaaa ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct 7200
gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 7260
atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 7320
caggaaccgt aaaaaggccg cgttgctggc gttcttccat aggctccgcc cccctgacga 7380
gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 7440
ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 7500
cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 7560
taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 7620
cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 7680
acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 7740
aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaagaacagt 7800
atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 7860
atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 7920
gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 7980
gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 8040
ctagatccct tttaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 8100
ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 8160
tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt 8220
accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt 8280
atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 8340
cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 8400
tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg 8460
tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt 8520
gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc 8580
agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt 8640
aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg 8700
gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac 8760
tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc 8820
gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt 8880
tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg 8940
aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat attattgaag 9000
catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa 9060
acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct aagaaaccat 9120
tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc gtctcgcgcg 9180
tttcggtgat gacggtgaaa acctctgaca catgcagctc ccggagacgg tcacagcttg 9240
tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg gtgttggcgg 9300
gtgtcggggc tggcttaact atgcggcatc agagcagatt gtactgagag tgcaccatat 9360
gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc gccattcgcc 9420
attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca 9480
gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag ggttttccca 9540
gttacgacgt tgtaaaacga cggccagtga att 9573
<210>48
<211>3252
<212>DNA
<213>人造
<220>
<223>合成构建体,D2E7蛋白内含子融合多聚蛋白编码序列。
<220>
<221>CDS
<222>(1)..(3249)
<400>48
atg gag ttt ggg ctg agc tgg ctt ttt ctt gtc gcg att tta aaa ggt 48
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1 5 10 15
gtc cag tgt gag gtg cag ctg gtg gag tct ggg gga ggc ttg gta cag 96
Val Gln Cys Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln
20 25 30
ccc ggc agg tcc ctg aga ctc tcc tgt gcg gcc tct gga ttc acc ttt 144
Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
35 40 45
gat gat tat gcc atg cac tgg gtc cgg caa gct cca ggg aag ggc ctg 192
Asp Asp Tyr Ala Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
gaa tgg gtc tca gct atc act tgg aat agt ggt cac ata gac tat gcg 240
Glu Trp Val Ser Ala Ile Thr Trp Asn Ser Gly His Ile Asp Tyr Ala
65 70 75 80
gac tct gtg gag ggc cga ttc acc atc tcc aga gac aac gcc aag aac 288
Asp Ser Val Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
85 90 95
tcc ctg tat ctg caa atg aac agt ctg aga gct gag gat acg gcc gta 336
Ser Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val
100 105 110
tat tac tgt gcg aaa gtc tcg tac ctt agc acc gcg tcc tcc ctt gac 384
Tyr Tyr Cys Ala Lys Val Ser Tyr Leu Ser Thr Ala Ser Ser Leu Asp
115 120 125
tat tgg ggc caa ggt acc ctg gtc acc gtc tcg agt gcg tcg acc aag 432
Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys
130 135 140
ggc cca tcg gtc ttc ccc ctg gca ccc tcc tcc aag agc acc tct ggg 480
Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly
145 150 155 160
ggc aca gcg gcc ctg ggc tgc ctg gtc aag gac tac ttc ccc gaa ccg 528
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro
165 170 175
gtg acg gtg tcg tgg aac tca ggc gcc ctg acc agc ggc gtg cac acc 576
Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr
180 185 190
ttc ccg gct gtc cta cag tcc tca gga ctc tac tcc ctc agc agc gtg 624
Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val
195 200 205
gtg acc gtg ccc tcc agc agc ttg ggc acc cag acc tac atc tgc aac 672
Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn
210 215 220
gtg aat cac aag ccc agc aac acc aag gtg gac aag aaa gtt gag ccc 720
Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro
225 230 235 240
aaa tct tgt gac aaa act cac aca tgc cca ccg tgc cca gca cct gaa 768
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
245 250 255
ctc ctg ggg gga ccg tca gtc ttc ctc ttc ccc cca aaa ccc aag gac 816
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
260 265 270
acc ctc atg atc tcc cgg acc cct gag gtc aca tgc gtg gtg gtg gac 864
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
275 280 285
gtg agc cac gaa gac cct gag gtc aag ttc aac tgg tac gtg gac ggc 912
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
290 295 300
gtg gag gtg cat aat gcc aag aca aag ccg cgg gag gag cag tac aac 960
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
305 310 315 320
agc acg tac cgt gtg gtc agc gtc ctc acc gtc ctg cac cag gac tgg 1008
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
325 330 335
ctg aat ggc aag gag tac aag tgc aag gtc tcc aac aaa gcc ctc cca 1056
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
340 345 350
gcc ccc atc gag aaa acc atc tcc aaa gcc aaa ggg cag ccc cga gaa 1104
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
355 360 365
cca cag gtg tac acc ctg ccc cca tcc cgg gat gag ctg acc aag aac 1152
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn
370 375 380
cag gtc agc ctg acc tgc ctg gtc aaa ggc ttc tat ccc agc gac atc 1200
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
385 390 395 400
gcc gtg gag tgg gag agc aat ggg cag ccg gag aac aac tac aag acc 1248
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
405 410 415
acg cct ccc gtg ctg gac tcc gac ggc tcc ttc ttc ctc tac agc aag 1296
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
420 425 430
ctc acc gtg gac aag agc agg tgg cag cag ggg aac gtc ttc tca tgc 1344
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
435 440 445
tcc gtg atg cat gag gct ctg cac aac cac tac acg cag aag agc ctc 1392
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
450 455 460
tcc ctg tct ccg ggt aaa acc att tta ccg gaa gaa tgg gtt cca cta 1440
Ser Leu Ser Pro Gly Lys Thr Ile Leu Pro Glu Glu Trp Val Pro Leu
465 470 475 480
att aaa aac ggt aaa gtt aag ata ttc cgc att ggg gac ttc gtt gat 1488
Ile Lys Asn Gly Lys Val Lys Ile Phe Arg Ile Gly Asp Phe Val Asp
485 490 495
gga ctt atg aag gcg aac caa gga aaa gtg aag aaa acg ggg gat aca 1536
Gly Leu Met Lys Ala Asn Gln Gly Lys Val Lys Lys Thr Gly Asp Thr
500 505 510
gaa gtt tta gaa gtt gca gga att cat gcg ttt tcc ttt gac agg aag 1584
Glu Val Leu Glu Val Ala Gly Ile His Ala Phe Ser Phe Asp Arg Lys
515 520 525
tcc aag aag gcc cgt gta atg gca gtg aaa gcc gtg ata aga cac cgt 1632
Ser Lys Lys Ala Arg Val Met Ala Val Lys Ala Val Ile Arg His Arg
530 535 540
tat tcc gga aat gtt tat aga ata gtc tta aac tct ggt aga aaa ata 1680
Tyr Ser Gly Asn Val Tyr Arg Ile Val Leu Asn Ser Gly Arg Lys Ile
545 550 555 560
aca ata aca gaa ggg cat agc cta ttt gtc tat agg aac ggg gat ctc 1728
Thr Ile Thr Glu Gly His Ser Leu Phe Val Tyr Arg Asn Gly Asp Leu
565 570 575
gtt gag gca act ggg gag gat gtc aaa att ggg gat ctt ctt gca gtt 1776
Val Glu Ala Thr Gly Glu Asp Val Lys Ile Gly Asp Leu Leu Ala Val
580 585 590
cca aga tca gta aac cta cca gag aaa agg gaa cgc ttg aat att gtt 1824
Pro Arg Ser Val Asn Leu Pro Glu Lys Arg Glu Arg Leu Asn Ile Val
595 600 605
gaa ctt ctt ctg aat ctc tca ccg gaa gag aca gaa gat ata ata ctt 1872
Glu Leu Leu Leu Asn Leu Ser Pro Glu Glu Thr Glu Asp Ile Ile Leu
610 615 620
acg att cca gtt aaa ggc aga aag aac ttc ttc aag gga atg ttg aga 1920
Thr Ile Pro Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Arg
625 630 635 640
aca tta cgt tgg att ttt ggt gag gaa aag aga gta agg aca gcg agc 1968
Thr Leu Arg Trp Ile Phe Gly Glu Glu Lys Arg Val Arg Thr Ala Ser
645 650 655
cgc tat cta aga cac ctt gaa aat ctc gga tac ata agg ttg agg aaa 2016
Arg Tyr Leu Arg His Leu Glu Asn Leu Gly Tyr Ile Arg Leu Arg Lys
660 665 670
att gga tac gac atc att gat aag gag ggg ctt gag aaa tat aga acg 2064
Ile Gly Tyr Asp Ile Ile Asp Lys Glu Gly Leu Glu Lys Tyr Arg Thr
675 680 685
ttg tac gag aaa ctt gtt gat gtt gtc cgc tat aat ggc aac aag aga 2112
Leu Tyr Glu Lys Leu Val Asp Val Val Arg Tyr Asn Gly Asn Lys Arg
690 695 700
gag tat tta gtt gaa ttt aat gct gtc cgg gac gtt atc tca cta atg 2160
Glu Tyr Leu Val Glu Phe Asn Ala Val Arg Asp Val Ile Ser Leu Met
705 710 715 720
cca gag gaa gaa ctg aag gaa tgg cgt att gga act aga aat gga ttc 2208
Pro Glu Glu Glu Leu Lys Glu Trp Arg Ile Gly Thr Arg Asn Gly Phe
725 730 735
aga atg ggt acg ttc gta gat att gat gaa gat ttt gcc aag ctt gga 2256
Arg Met Gly Thr Phe Val Asp Ile Asp Glu Asp Phe Ala Lys Leu Gly
740 745 750
tac gat agc gga gtc tac agg gtt tat gta aac gag gaa ctt aag ttt 2304
Tyr Asp Ser Gly Val Tyr Arg Val Tyr Val Asn Glu Glu Leu Lys Phe
755 760 765
acg gaa tac aga aag aaa aag aat gta tat cac tct cac att gtt cca 2352
Thr Glu Tyr Arg Lys Lys Lys Asn Val Tyr His Ser His Ile Val Pro
770 775 780
aag gat att ctc aaa gaa act ttt ggt aag gtc ttc cag aaa aat ata 2400
Lys Asp Ile Leu Lys Glu Thr Phe Gly Lys Val Phe Gln Lys Asn Ile
785 790 795 800
agt tac aag aaa ttt aga gag ctt gta gaa aat gga aaa ctt gac agg 2448
Ser Tyr Lys Lys Phe Arg Glu Leu Val Glu Asn Gly Lys Leu Asp Arg
805 810 815
gag aaa gcc aaa cgc att gag tgg tta ctt aac gga gat ata gtc cta 2496
Glu Lys Ala Lys Arg Ile Glu Trp Leu Leu Asn Gly Asp Ile Val Leu
820 825 830
gat aga gtc gta gag att aag aga gag tac tat gat ggt tac gtt tac 2544
Asp Arg Val Val Glu Ile Lys Arg Glu Tyr Tyr Asp Gly Tyr Val Tyr
835 840 845
gat cta agt gtc gat gaa gat gag aat ttc ctt gct ggc ttt gga ttc 2592
Asp Leu Ser Val Asp Glu Asp Glu Asn Phe Leu Ala Gly Phe Gly Phe
850 855 860
ctc tat gca cat aat gac atc cag atg acc cag tct cca tcc tcc ctg 2640
Leu Tyr Ala His Asn Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu
865 870 875 880
tct gca tct gta ggg gac aga gtc acc atc act tgt cgg gca agt cag 2688
Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln
885 890 895
ggc atc aga aat tac tta gcc tgg tat cag caa aaa cca ggg aaa gcc 2736
Gly Ile Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala
900 905 910
cct aag ctc ctg atc tat gct gca tcc act ttg caa tca ggg gtc cca 2784
Pro Lys Leu Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val Pro
915 920 925
tct cgg ttc agt ggc agt gga tct ggg aca gat ttc act ctc acc atc 2832
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile
930 935 940
agc agc cta cag cct gaa gat gtt gca act tat tac tgt caa agg tat 2880
Ser Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg Tyr
945 950 955 960
aac cgt gca ccg tat act ttt ggc cag ggg acc aag gtg gaa atc aaa 2928
Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys
965 970 975
cgt acg gtg gct gca cca tct gtc ttc atc ttc ccg cca tct gat gag 2976
Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu
980 985 990
cag ttg aaa tct gga act gcc tct gtt gtg tgc ctg ctg aat aac ttc 3024
Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe
995 1000 1005
tat ccc aga gag gcc aaa gta cag tgg aag gtg gat aac gcc ctc 3069
Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu
1010 1015 1020
caa tcg ggt aac tcc cag gag agt gtc aca gag cag gac agc aag 3114
Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys
1025 1030 1035
gac agc acc tac agc ctc agc agc acc ctg acg ctg agc aaa gca 3159
Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala
1040 1045 1050
gac tac gag aaa cac aaa gtc tac gcc tgc gaa gtc acc cat cag 3204
Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln
1055 1060 1065
ggc ctg agc tcg ccc gtc aca aag agc ttc aac agg gga gag tgt 3249
Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
1070 1075 1080
tga 3252
<210>49
<211>1083
<212>PRT
<213>人造
<220>
<223>合成构建体
<400>49
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1 5 10 15
Val Gln Cys Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln
20 25 30
Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
35 40 45
Asp Asp Tyr Ala Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
Glu Trp Val Ser Ala Ile Thr Trp Asn Ser Gly His Ile Asp Tyr Ala
65 70 75 80
Asp Ser Val Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
85 90 95
Ser Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Lys Val Ser Tyr Leu Ser Thr Ala Ser Ser Leu Asp
115 120 125
Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys
130 135 140
Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly
145 150 155 160
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro
165 170 175
Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr
180 185 190
Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val
195 200 205
Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn
210 215 220
Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro
225 230 235 240
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
245 250 255
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
260 265 270
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
275 280 285
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
290 295 300
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
305 310 315 320
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
325 330 335
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
340 345 350
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
355 360 365
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn
370 375 380
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
385 390 395 400
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
405 410 415
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
420 425 430
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
435 440 445
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
450 455 460
Ser Leu Ser Pro Gly Lys Thr Ile Leu Pro Glu Glu Trp Val Pro Leu
465 470 475 480
Ile Lys Asn Gly Lys Val Lys Ile Phe Arg Ile Gly Asp Phe Val Asp
485 490 495
Gly Leu Met Lys Ala Asn Gln Gly Lys Val Lys Lys Thr Gly Asp Thr
500 505 510
Glu Val Leu Glu Val Ala Gly Ile His Ala Phe Ser Phe Asp Arg Lys
515 520 525
Ser Lys Lys Ala Arg Val Met Ala Val Lys Ala Val Ile Arg His Arg
530 535 540
Tyr Ser Gly Asn Val Tyr Arg Ile Val Leu Asn Ser Gly Arg Lys Ile
545 550 555 560
Thr Ile Thr Glu Gly His Ser Leu Phe Val Tyr Arg Asn Gly Asp Leu
565 570 575
Val Glu Ala Thr Gly Glu Asp Val Lys Ile Gly Asp Leu Leu Ala Val
580 585 590
Pro Arg Ser Val Asn Leu Pro Glu Lys Arg Glu Arg Leu Asn Ile Val
595 600 605
Glu Leu Leu Leu Asn Leu Ser Pro Glu Glu Thr Glu Asp Ile Ile Leu
610 615 620
Thr Ile Pro Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Arg
625 630 635 640
Thr Leu Arg Trp Ile Phe Gly Glu Glu Lys Arg Val Arg Thr Ala Ser
645 650 655
Arg Tyr Leu Arg His Leu Glu Asn Leu Gly Tyr Ile Arg Leu Arg Lys
660 665 670
Ile Gly Tyr Asp Ile Ile Asp Lys Glu Gly Leu Glu Lys Tyr Arg Thr
675 680 685
Leu Tyr Glu Lys Leu Val Asp Val Val Arg Tyr Asn Gly Asn Lys Arg
690 695 700
Glu Tyr Leu Val Glu Phe Asn Ala Val Arg Asp Val Ile Ser Leu Met
705 710 715 720
Pro Glu Glu Glu Leu Lys Glu Trp Arg Ile Gly Thr Arg Asn Gly Phe
725 730 735
Arg Met Gly Thr Phe Val Asp Ile Asp Glu Asp Phe Ala Lys Leu Gly
740 745 750
Tyr Asp Ser Gly Val Tyr Arg Val Tyr Val Asn Glu Glu Leu Lys Phe
755 760 765
Thr Glu Tyr Arg Lys Lys Lys Asn Val Tyr His Ser His Ile Val Pro
770 775 780
Lys Asp Ile Leu Lys Glu Thr Phe Gly Lys Val Phe Gln Lys Asn Ile
785 790 795 800
Ser Tyr Lys Lys Phe Arg Glu Leu Val Glu Asn Gly Lys Leu Asp Arg
805 810 815
Glu Lys Ala Lys Arg Ile Glu Trp Leu Leu Asn Gly Asp Ile Val Leu
820 825 830
Asp Arg Val Val Glu Ile Lys Arg Glu Tyr Tyr Asp Gly Tyr Val Tyr
835 840 845
Asp Leu Ser Val Asp Glu Asp Glu Asn Phe Leu Ala Gly Phe Gly Phe
850 855 860
Leu Tyr Ala His Asn Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu
865 870 875 880
Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln
885 890 895
Gly Ile Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala
900 905 910
Pro Lys Leu Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val Pro
915 920 925
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile
930 935 940
Ser Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg Tyr
945 950 955 960
Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys
965 970 975
Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu
980 985 990
Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe
995 1000 1005
Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu
1010 1015 1020
Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys
1025 1030 1035
Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala
1040 1045 1050
Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln
1055 1060 1065
Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
1070 1075 1080
<210>50
<211>10629
<212>DNA
<213>人造
<220>
<223>合成构建体,D2E7蛋白内含子融合蛋白表达载体。
<400>50
gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc 60
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 120
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 180
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 240
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 300
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 360
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 420
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 480
cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg 540
tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg 600
aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg 660
gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag 720
gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc 780
tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa 840
actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact 900
ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt 960
ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca 1020
aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt 1080
ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga 1140
tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca 1200
ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag 1260
tttgggctga gctggctttt tcttgtcgcg attttaaaag gtgtccagtg tgaggtgcag 1320
ctggtggagt ctgggggagg cttggtacag cccggcaggt ccctgagact ctcctgtgcg 1380
gcctctggat tcacctttga tgattatgcc atgcactggg tccggcaagc tccagggaag 1440
ggcctggaat gggtctcagc tatcacttgg aatagtggtc acatagacta tgcggactct 1500
gtggagggcc gattcaccat ctccagagac aacgccaaga actccctgta tctgcaaatg 1560
aacagtctga gagctgagga tacggccgta tattactgtg cgaaagtctc gtaccttagc 1620
accgcgtcct cccttgacta ttggggccaa ggtaccctgg tcaccgtctc gagtgcgtcg 1680
accaagggcc catcggtctt ccccctggca ccctcctcca agagcacctc tgggggcaca 1740
gcggccctgg gctgcctggt caaggactac ttccccgaac cggtgacggt gtcgtggaac 1800
tcaggcgccc tgaccagcgg cgtgcacacc ttcccggctg tcctacagtc ctcaggactc 1860
tactccctca gcagcgtggt gaccgtgccc tccagcagct tgggcaccca gacctacatc 1920
tgcaacgtga atcacaagcc cagcaacacc aaggtggaca agaaagttga gcccaaatct 1980
tgtgacaaaa ctcacacatg cccaccgtgc ccagcacctg aactcctggg gggaccgtca 2040
gtcttcctct tccccccaaa acccaaggac accctcatga tctcccggac ccctgaggtc 2100
acatgcgtgg tggtggacgt gagccacgaa gaccctgagg tcaagttcaa ctggtacgtg 2160
gacggcgtgg aggtgcataa tgccaagaca aagccgcggg aggagcagta caacagcacg 2220
taccgtgtgg tcagcgtcct caccgtcctg caccaggact ggctgaatgg caaggagtac 2280
aagtgcaagg tctccaacaa agccctccca gcccccatcg agaaaaccat ctccaaagcc 2340
aaagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga tgagctgacc 2400
aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga catcgccgtg 2460
gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc cgtgctggac 2520
tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag gtggcagcag 2580
gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta cacgcagaag 2640
agcctctccc tgtctccggg taaaaccatt ttaccggaag aatgggttcc actaattaaa 2700
aacggtaaag ttaagatatt ccgcattggg gacttcgttg atggacttat gaaggcgaac 2760
caaggaaaag tgaagaaaac gggggataca gaagttttag aagttgcagg aattcatgcg 2820
ttttcctttg acaggaagtc caagaaggcc cgtgtaatgg cagtgaaagc cgtgataaga 2880
caccgttatt ccggaaatgt ttatagaata gtcttaaact ctggtagaaa aataacaata 2940
acagaagggc atagcctatt tgtctatagg aacggggatc tcgttgaggc aactggggag 3000
gatgtcaaaa ttggggatct tcttgcagtt ccaagatcag taaacctacc agagaaaagg 3060
gaacgcttga atattgttga acttcttctg aatctctcac cggaagagac agaagatata 3120
atacttacga ttccagttaa aggcagaaag aacttcttca agggaatgtt gagaacatta 3180
cgttggattt ttggtgagga aaagagagta aggacagcga gccgctatct aagacacctt 3240
gaaaatctcg gatacataag gttgaggaaa attggatacg acatcattga taaggagggg 3300
cttgagaaat atagaacgtt gtacgagaaa cttgttgatg ttgtccgcta taatggcaac 3360
aagagagagt atttagttga atttaatgct gtccgggacg ttatctcact aatgccagag 3420
gaagaactga aggaatggcg tattggaact agaaatggat tcagaatggg tacgttcgta 3480
gatattgatg aagattttgc caagcttgga tacgatagcg gagtctacag ggtttatgta 3540
aacgaggaac ttaagtttac ggaatacaga aagaaaaaga atgtatatca ctctcacatt 3600
gttccaaagg atattctcaa agaaactttt ggtaaggtct tccagaaaaa tataagttac 3660
aagaaattta gagagcttgt agaaaatgga aaacttgaca gggagaaagc caaacgcatt 3720
gagtggttac ttaacggaga tatagtccta gatagagtcg tagagattaa gagagagtac 3780
tatgatggtt acgtttacga tctaagtgtc gatgaagatg agaatttcct tgctggcttt 3840
ggattcctct atgcacataa tgacatccag atgacccagt ctccatcctc cctgtctgca 3900
tctgtagggg acagagtcac catcacttgt cgggcaagtc agggcatcag aaattactta 3960
gcctggtatc agcaaaaacc agggaaagcc cctaagctcc tgatctatgc tgcatccact 4020
ttgcaatcag gggtcccatc tcggttcagt ggcagtggat ctgggacaga tttcactctc 4080
accatcagca gcctacagcc tgaagatgtt gcaacttatt actgtcaaag gtataaccgt 4140
gcaccgtata cttttggcca ggggaccaag gtggaaatca aacgtacggt ggctgcacca 4200
tctgtcttca tcttcccgcc atctgatgag cagttgaaat ctggaactgc ctctgttgtg 4260
tgcctgctga ataacttcta tcccagagag gccaaagtac agtggaaggt ggataacgcc 4320
ctccaatcgg gtaactccca ggagagtgtc acagagcagg acagcaagga cagcacctac 4380
agcctcagca gcaccctgac gctgagcaaa gcagactacg agaaacacaa agtctacgcc 4440
tgcgaagtca cccatcaggg cctgagctcg cccgtcacaa agagcttcaa caggggagag 4500
tgttgagcgg ccgcgtttaa actgaatgag cgcgtccatc cagacatgat aagatacatt 4560
gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 4620
tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 4680
aattgcattc attttatgtt tcaggttcag ggggaggtgt gggaggtttt ttaaagcaag 4740
taaaacctct acaaatgtgg tatggctgat tatgatccgg ctgcctcgcg cgtttcggtg 4800
atgacggtga aaacctctga cacatgcagc tcccggagac ggtcacagct tgtctgtaag 4860
cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc gggtgttggc gggtgtcggg 4920
gcgcagccat gaccggtcga cggcgcgcct ttttttttaa tttttatttt attttatttt 4980
tgacgcgccg aaggcgcgat ctgagctcgg tacagcttgg ctgtggaatg tgtgtcagtt 5040
agggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca tgcatctcaa 5100
ttagtcagca accaggtgtg gaaagtcccc aggctcccca gcaggcagaa gtatgcaaag 5160
catgcatctc aattagtcag caaccatagt cccgccccta actccgccca tcccgcccct 5220
aactccgccc agttccgccc attctccgcc ccatggctga ctaatttttt ttatttatgc 5280
agaggccgag gccgcctcgg cctctgagct attccagaag tagtgaggag gcttttttgg 5340
aggcctaggc ttttgcaaaa agctcctcga ggaactgaaa aaccagaaag ttaactggta 5400
agtttagtct ttttgtcttt tatttcaggt cccggatccg gtggtggtgc aaatcaaaga 5460
actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 5520
ctaaaagctg cggaattgta cccgcggcct aatacgactc actataggga ctagtatggt 5580
tcgaccattg aactgcatcg tcgccgtgtc ccaaaatatg gggattggca agaacggaga 5640
cctaccctgg cctccgctca ggaacgagtt caagtacttc caaagaatga ccacaacctc 5700
ttcagtggaa ggtaaacaga atctggtgat tatgggtagg aaaacctggt tctccattcc 5760
tgagaagaat cgacctttaa aggacagaat taatatagtt ctcagtagag aactcaaaga 5820
accaccacga ggagctcatt ttcttgccaa aagtttagat gatgccttaa gacttattga 5880
acaaccggaa ttggcaagta aagtagacat ggtttggata gtcggaggca gttctgttta 5940
ccaggaagcc atgaatcaac caggccacct cagactcttt gtgacaagga tcatgcagga 6000
atttgaaagt gacacgtttt tcccagaaat tgatttgggg aaatataaac ttctcccaga 6060
atacccaggc gtcctctctg aggtccagga ggaaaaaggc atcaagtata agtttgaagt 6120
ctacgagaag aaagactaag cggccgagcg cgcggatctg gaaacgggag atgggggagg 6180
ctaactgaag cacggaagga gacaataccg gaaggaaccc gcgctatgac ggcaataaaa 6240
agacagaata aaacgcacgg gtgttgggtc gtttgttcat aaacgcgggg ttcggtccca 6300
gggctggcac tctgtcgata ccccaccgag accccattgg ggccaatacg cccgcgtttc 6360
ttccttttcc ccaccccacc ccccaagttc gggtgaaggc ccagggctcg cagccaacgt 6420
cggggcggca ggccctgcca tagccactgg ccccgtgggt tagggacggg gtcccccatg 6480
gggaatggtt tatggttcgt gggggttatt attttgggcg ttgcgtgggg tctggagatc 6540
ccccgggctg caggaattcc gttacattac ttacggtaaa tggcccgcct ggctgaccgc 6600
50 55 60
Thr Lys Lys Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg
65 70 75 80
Tyr Ser Gly Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile
85 90 95
Lys Ile Thr Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu
100 105 110
Val Lys Val Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val
115 120 125
Pro Gly Arg Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val
130 135 140
Glu Leu Leu Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met
145 150 155 160
Met Ile Pro Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys
165 170 175
Thr Leu Tyr Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 6660
ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 6720
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 6780
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 6840
tattagtcat cgctattacc atggtgatgc ggttttggca gtacatcaat gggcgtggat 6900
agcggtttga ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt 6960
tttggcacca aaatcaacgg gactttccaa aatgtcgtaa caactccgcc ccattgacgc 7020
aaaagggcgg gaattcgagc tcggtactcg agcggtgttc cgcggtcctc ctcgtataga 7080
aactcggacc actctgagac gaaggctcgc gtccaggcca gcacgaagga ggctaagtgg 7140
gaggggtagc ggtcgttgtc cactaggggg tccactcgct ccagggtgtg aagacacatg 7200
tcgccctctt cggcatcaag gaaggtgatt ggtttatagg tgtaggccac gtgaccgggt 7260
gttcctgaag gggggctata aaagggggtg ggggcgcgtt cgtcctcact ctcttccgca 7320
tcgctgtctg cgagggccag ctgttgggct cgcggttgag gacaaactct tcgcggtctt 7380
tccagtactc ttggatcgga aacccgtcgg cctccgaacg gtactccgcc accgagggac 7440
ctgagcgagt ccgcatcgac cggatcggaa aacctctcga ctgttggggt gagtactccc 7500
tctcaaaagc gggcatgact tctgcgctaa gattgtcagt ttccaaaaac gaggaggatt 7560
tgatattcac ctggcccgcg gtgatgcctt tgagggtggc cgcgtccatc tggtcagaaa 7620
agacaatctt tttgttgtca agcttgaggt gtggcaggct tgagatctgg ccatacactt 7680
gagtgacaat gacatccact ttgcctttct ctccacaggt gtccactccc aggtccaacc 7740
ggaattgtac ccgcggccag agcttgcggg cgccaccgcg gccgcgggga tccagacatg 7800
ataagataca ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt 7860
atttgtgaaa tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa 7920
gttaacaaca acaattgcat tcattttatg tttcaggttc agggggaggt gtgggaggtt 7980
ttttcggatc ctcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc 8040
gctcacaatt ccacacaaca tacgagccgg aagcataaag tgtaaagcct ggggtgccta 8100
atgagtgagc taactcacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa 8160
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggaaaggcg gtttgcgtat 8220
tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg 8280
agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc 8340
aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 8400
gctggcgttc ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag 8460
tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc 8520
cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 8580
ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt 8640
cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 8700
atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 8760
agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 8820
gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa 8880
gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 8940
tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga 9000
agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg 9060
gattttggtc atgagattat caaaaaggat cttcacctag atccctttta attaaaaatg 9120
aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt 9180
aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact 9240
ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat 9300
gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg 9360
aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg 9420
ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat 9480
tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc 9540
ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt 9600
cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc 9660
agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga 9720
gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc 9780
gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa 9840
acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta 9900
acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg 9960
agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg 10020
aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat 10080
gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt 10140
tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat taacctataa 10200
aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg gtgaaaacct 10260
ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg ccgggagcag 10320
acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc ttaactatgc 10380
ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac cgcacagatg 10440
cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca actgttggga 10500
agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc 10560
aaggcgatta agttgggtaa cgccagggtt ttcccagtta cgacgttgta aaacgacggc 10620
cagtgaatt 10629
<210>51
<211>547
<212>PRT
<213>古菌种
<400>51
Asn Ser Ile Leu Pro Glu Glu Trp Val Pro Leu Ile Lys Asn Gly Lys
1 5 10 15
Val Lys Ile Phe Arg Ile Gly Asp Phe Val Asp Gly Leu Met Lys Ala
20 25 30
Asn Gln Gly Lys Val Lys Lys Thr Gly Asp Thr Glu Val Leu Glu Val
35 40 45
Ala Gly Ile His Ala Phe Ser Phe Asp Arg Lys Ser Lys Lys Ala Arg
50 55 60
Val Met Ala Val Lys Ala Val Ile Arg His Arg Tyr Ser Gly Asn Val
65 70 75 80
Tyr Arg Ile Val Leu Asn Ser Gly Arg Lys Ile Thr Ile Thr Glu Gly
85 90 95
His Ser Leu Phe Val Tyr Arg Asn Gly Asp Leu Val Glu Ala Thr Gly
100 105 110
Glu Asp Val Lys Ile Gly Asp Leu Leu Ala Val Pro Arg Ser Val Asn
115 120 125
Leu Pro Glu Lys Arg Glu Arg Leu Asn Ile Val Glu Leu Leu Leu Asn
130 135 140
Leu Ser Pro Glu Glu Thr Glu Asp Ile Ile Leu Thr Ile Pro Val Lys
145 150 155 160
Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Arg Thr Leu Arg Trp Ile
165 170 175
Phe Gly Glu Glu Lys Arg Val Arg Thr Ala Ser Arg Tyr Leu Arg His
180 185 190
Leu Glu Asn Leu Gly Tyr Ile Arg Leu Arg Lys Ile Gly Tyr Asp Ile
195 200 205
Ile Asp Lys Glu Gly Leu Glu Lys Tyr Arg Thr Leu Tyr Glu Lys Leu
210 215 220
Val Asp Val Val Arg Tyr Asn Gly Asn Lys Arg Glu Tyr Leu Val Glu
225 230 235 240
Phe Asn Ala Val Arg Asp Val Ile Ser Leu Met Pro Glu Glu Glu Leu
245 250 255
Lys Glu Trp Arg Ile Gly Thr Arg Asn Gly Phe Arg Met Gly Thr Phe
260 265 270
Val Asp Ile Asp Glu Asp Phe Ala Lys Leu Leu Gly Tyr Tyr Val Ser
275 280 285
Glu Gly Ser Ala Arg Lys Trp Lys Asn Gln Thr Gly Gly Trp Ser Tyr
290 295 300
Thr Val Arg Leu Tyr Asn Glu Asn Asp Glu Val Leu Asp Asp Met Glu
305 310 315 320
His Leu Ala Lys Lys Phe Phe Gly Lys Val Lys Arg Gly Lys Asn Tyr
325 330 335
Val Glu Ile Pro Lys Lys Met Ala Tyr Ile Ile Phe Glu Ser Leu Cys
340 345 350
Gly Thr Leu Ala Glu Asn Lys Arg Val Pro Glu Val Ile Phe Thr Ser
355 360 365
Ser Lys Gly Val Arg Trp Ala Phe Leu Glu Gly Tyr Phe Ile Gly Asp
370 375 380
Gly Asp Val His Pro Ser Lys Arg Val Arg Leu Ser Thr Lys Ser Glu
385 390 395 400
Leu Leu Val Asn Gly Leu Val Leu Leu Leu Asn Ser Leu Gly Val Ser
405 410 415
Ala Ile Lys Leu Gly Tyr Asp Ser Gly Val Tyr Arg Val Tyr Val Asn
420 425 430
Glu Glu Leu Lys Phe Thr Glu Tyr Arg Lys Lys Lys Asn Val Tyr His
435 440 445
Ser His Ile Val Pro Lys Asp Ile Leu Lys Glu Thr Phe Gly Lys Val
450 455 460
Phe Gln Lys Asn Ile Ser Tyr Lys Lys Phe Arg Glu Leu Val Glu Asn
465 470 475 480
Gly Lys Leu Asp Arg Glu Lys Ala Lys Arg Ile Glu Trp Leu Leu Asn
485 490 495
Gly Asp Ile Val Leu Asp Arg Val Val Glu Ile Lys Arg Glu Tyr Tyr
500 505 510
Asp Gly Tyr Val Tyr Asp Leu Ser Val Asp Glu Asp Glu Asn Phe Leu
515 520 525
Ala Gly Phe Gly Phe Leu Tyr Ala His Asn Ser Tyr Tyr Gly Tyr Tyr
530 535 540
Gly Tyr Ala
545
<210>52
<211>26
<212>DNA
<213>人造
<220>
<223>合成构建体,用作引物的寡核苷酸。
<400>52
agcattttac cagatgaatg gctccc 26
<210>53
<211>27
<212>DNA
<213>人造
<220>
<223>合成构建体,用作引物的寡核苷酸。
<400>53
aacgaggaag ttctcattat cctcaac 27
<210>54
<211>44
<212>DNA
<213>人造
<220>
<223>合成构建体;用作引物的寡核苷酸。
<400>54
agcctctccc tgtctccggg taaaagcatt ttaccagatg aatg 44
<210>55
<211>42
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>55
gggcgggcac gcgcatgtcc atgttgtgtg cgtaaagtag tc 42
<210>56
<211>47
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>56
agcctctccc tgtctccggg taaaaacagc attttaccag atgaatg 47
<210>57
<211>45
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>57
gggcgggcac gcgcatgtcc atactgttgt gtgcgtaaag tagtc 45
<210>58
<211>53
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>58
agcctctccc tgtctccggg taaattagca aacagcattt taccagatga atg 53
<210>59
<211>51
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>59
gggcgggcac gcgcatgtcc atgtaataac tgttgtgtgc gtaaagtagt c 51
<210>60
<211>36
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>60
tgcccgggcg ccaccatgga gtttgggctg agctgg 36
<210>61
<211>36
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>61
tgcccgggcg ccaccatgga gtttgggctg agctgg 36
<210>62
<211>9460
<212>DNA
<213>人造
<220>
<223>合成构建体:质粒pTT3-HcintLC-p.hori的序列
<400>62
gcggccgctc gaggccggca aggccggatc ccccgacctc gacctctggc taataaagga 60
aatttatttt cattgcaata gtgtgttgga attttttgtg tctctcactc ggaaggacat 120
atgggagggc aaatcatttg gtcgagatcc ctcggagatc tctagctaga ggatcgatcc 180
ccgccccgga cgaactaaac ctgactacga catctctgcc ccttcttcgc ggggcagtgc 240
atgtaatccc ttcagttggt tggtacaact tgccaactgg gccctgttcc acatgtgaca 300
cgggggggga ccaaacacaa aggggttctc tgactgtagt tgacatcctt ataaatggat 360
gtgcacattt gccaacactg agtggctttc atcctggagc agactttgca gtctgtggac 420
tgcaacacaa cattgccttt atgtgtaact cttggctgaa gctcttacac caatgctggg 480
ggacatgtac ctcccagggg cccaggaaga ctacgggagg ctacaccaac gtcaatcaga 540
ggggcctgtg tagctaccga taagcggacc ctcaagaggg cattagcaat agtgtttata 600
aggccccctt gttaacccta aacgggtagc atatgcttcc cgggtagtag tatatactat 660
ccagactaac cctaattcaa tagcatatgt tacccaacgg gaagcatatg ctatcgaatt 720
agggttagta aaagggtcct aaggaacagc gatatctccc accccatgag ctgtcacggt 780
tttatttaca tggggtcagg attccacgag ggtagtgaac cattttagtc acaagggcag 840
tggctgaaga tcaaggagcg ggcagtgaac tctcctgaat cttcgcctgc ttcttcattc 900
tccttcgttt agctaataga ataactgctg agttgtgaac agtaaggtgt atgtgaggtg 960
ctcgaaaaca aggtttcagg tgacgccccc agaataaaat ttggacgggg ggttcagtgg 1020
tggcattgtg ctatgacacc aatataaccc tcacaaaccc cttgggcaat aaatactagt 1080
gtaggaatga aacattctga atatctttaa caatagaaat ccatggggtg gggacaagcc 1140
gtaaagactg gatgtccatc tcacacgaat ttatggctat gggcaacaca taatcctagt 1200
gcaatatgat actggggtta ttaagatgtg tcccaggcag ggaccaagac aggtgaacca 1260
tgttgttaca ctctatttgt aacaagggga aagagagtgg acgccgacag cagcggactc 1320
cactggttgt ctctaacacc cccgaaaatt aaacggggct ccacgccaat ggggcccata 1380
aacaaagaca agtggccact cttttttttg aaattgtgga gtgggggcac gcgtcagccc 1440
ccacacgccg ccctgcggtt ttggactgta aaataagggt gtaataactt ggctgattgt 1500
aaccccgcta accactgcgg tcaaaccact tgcccacaaa accactaatg gcaccccggg 1560
gaatacctgc ataagtaggt gggcgggcca agataggggc gcgattgctg cgatctggag 1620
gacaaattac acacacttgc gcctgagcgc caagcacagg gttgttggtc ctcatattca 1680
cgaggtcgct gagagcacgg tgggctaatg ttgccatggg tagcatatac tacccaaata 1740
tctggatagc atatgctatc ctaatctata tctgggtagc ataggctatc ctaatctata 1800
tctgggtagc atatgctatc ctaatctata tctgggtagt atatgctatc ctaatttata 1860
tctgggtagc ataggctatc ctaatctata tctgggtagc atatgctatc ctaatctata 1920
tctgggtagt atatgctatc ctaatctgta tccgggtagc atatgctatc ctaatagaga 1980
ttagggtagt atatgctatc ctaatttata tctgggtagc atatactacc caaatatctg 2040
gatagcatat gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg 2100
ggtagcatag gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg 2160
ggtagtatat gctatcctaa tttatatctg ggtagcatag gctatcctaa tctatatctg 2220
ggtagcatat gctatcctaa tctatatctg ggtagtatat gctatcctaa tctgtatccg 2280
ggtagcatat gctatcctca tgataagctg tcaaacatga gaattttctt gaagacgaaa 2340
gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac 2400
gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat 2460
acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg 2520
aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc 2580
attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga 2640
tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga 2700
gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg 2760
cgcggtatta tcccgtgttg acgccgggca agagcaactc ggtcgccgca tacactattc 2820
tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac 2880
agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact 2940
tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca 3000
tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg 3060
tgacaccacg atgcctgcag caatggcaac aacgttgcgc aaactattaa ctggcgaact 3120
acttactcta gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg 3180
accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg 3240
tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat 3300
cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc 3360
tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat 3420
actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt 3480
tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc 3540
cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt 3600
gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac 3660
tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt 3720
gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct 3780
gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga 3840
ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac 3900
acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg 3960
agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt 4020
cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc 4080
tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg 4140
gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc 4200
ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc 4260
ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag 4320
cgaggaagcg gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca 4380
ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat 4440
taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg 4500
tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga 4560
ttacgccaag ctctagctag aggtcgacca attctcatgt ttgacagctt atcatcgcag 4620
atccgggcaa cgttgttgcc attgctgcag gcgcagaact ggtaggtatg gaagatctat 4680
acattgaatc aatattggca attagccata ttagtcattg gttatatagc ataaatcaat 4740
attggctatt ggccattgca tacgttgtat ctatatcata atatgtacat ttatattggc 4800
tcatgtccaa tatgaccgcc atgttgacat tgattattga ctagttatta atagtaatca 4860
attacggggt cattagttca tagcccatat atggagttcc gcgttacata acttacggta 4920
aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat 4980
gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg 5040
taaactgccc acttggcagt acatcaagtg tatcatatgc caagtccgcc ccctattgac 5100
gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt acgggacttt 5160
cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg 5220
cagtacacca atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc 5280
attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt 5340
aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 5400
agcagagctc gtttagtgaa ccgtcagatc ctcactctct tccgcatcgc tgtctgcgag 5460
ggccagctgt tgggctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg 5520
atcggaaacc cgtcggcctc cgaacggtac tccgccaccg agggacctga gcgagtccgc 5580
atcgaccgga tcggaaaacc tctcgagaaa ggcgtctaac cagtcacagt cgcaaggtag 5640
gctgagcacc gtggcgggcg gcagcgggtg gcggtcgggg ttgtttctgg cggaggtgct 5700
gctgatgatg taattaaagt aggcggtctt gagacggcgg atggtcgagg tgaggtgtgg 5760
caggcttgag atccagctgt tggggtgagt actccctctc aaaagcgggc attacttctg 5820
cgctaagatt gtcagtttcc aaaaacgagg aggatttgat attcacctgg cccgatctgg 5880
ccatacactt gagtgacaat gacatccact ttgcctttct ctccacaggt gtccactccc 5940
aggtccaagt ttgggcgcca ccatggagtt tgggctgagc tggctttttc ttgtcgcgat 6000
tttaaaaggt gtccagtgtg aggtgcagct ggtggagtct gggggaggct tggtacagcc 6060
cggcaggtcc ctgagactct cctgtgcggc ctctggattc acctttgatg attatgccat 6120
gcactgggtc cggcaagctc cagggaaggg cctggaatgg gtctcagcta tcacttggaa 6180
tagtggtcac atagactatg cggactctgt ggagggccga ttcaccatct ccagagacaa 6240
cgccaagaac tccctgtatc tgcaaatgaa cagtctgaga gctgaggata cggccgtata 6300
ttactgtgcg aaagtctcgt accttagcac cgcgtcctcc cttgactatt ggggccaagg 6360
taccctggtc accgtctcga gtgcgtcgac caagggccca tcggtcttcc ccctggcacc 6420
ctcctccaag agcacctctg ggggcacagc ggccctgggc tgcctggtca aggactactt 6480
ccccgaaccg gtgacggtgt cgtggaactc aggcgccctg accagcggcg tgcacacctt 6540
cccggctgtc ctacagtcct caggactcta ctccctcagc agcgtggtga ccgtgccctc 6600
cagcagcttg ggcacccaga cctacatctg caacgtgaat cacaagccca gcaacaccaa 6660
ggtggacaag aaagttgagc ccaaatcttg tgacaaaact cacacatgcc caccgtgccc 6720
agcacctgaa ctcctggggg gaccgtcagt cttcctcttc cccccaaaac ccaaggacac 6780
cctcatgatc tcccggaccc ctgaggtcac atgcgtggtg gtggacgtga gccacgaaga 6840
ccctgaggtc aagttcaact ggtacgtgga cggcgtggag gtgcataatg ccaagacaaa 6900
gccgcgggag gagcagtaca acagcacgta ccgtgtggtc agcgtcctca ccgtcctgca 6960
ccaggactgg ctgaatggca aggagtacaa gtgcaaggtc tccaacaaag ccctcccagc 7020
ccccatcgag aaaaccatct ccaaagccaa agggcagccc cgagaaccac aggtgtacac 7080
cctgccccca tcccgggatg agctgaccaa gaaccaggtc agcctgacct gcctggtcaa 7140
aggcttctat cccagcgaca tcgccgtgga gtgggagagc aatgggcagc cggagaacaa 7200
ctacaagacc acgcctcccg tgctggactc cgacggctcc ttcttcctct acagcaagct 7260
caccgtggac aagagcaggt ggcagcaggg gaacgtcttc tcatgctccg tgatgcatga 7320
ggctctgcac aaccactaca cgcagaagag cctctccctg tctccgggta aaagcatttt 7380
accagatgaa tggctcccaa ttgttgaaaa tgaaaaagtt cgattcgtaa aaattggaga 7440
cttcatagat agggagattg aggaaaacgc tgagagagtg aagagggatg gtgaaactga 7500
aattctagag gttaaagatc ttaaagccct ttccttcaat agagaaacaa aaaagagcga 7560
gctcaagaag gtaaaggccc taattagaca ccgctattca gggaaggttt acagcattaa 7620
actaaagtca gggagaagga tcaaaataac ctcaggtcat agtctgttct cagtaaaaaa 7680
tggaaagcta gttaaggtca ggggagatga actcaagcct ggtgatctcg ttgtcgttcc 7740
aggaaggtta aaacttccag aaagcaagca agtgctaaat ctcgttgaac tactcctgaa 7800
attacccgaa gaggagacat cgaacatcgt aatgatgatc ccagttaaag gtagaaagaa 7860
tttcttcaaa gggatgctca aaacattata ctggatcttc ggggagggag aaaggccaag 7920
aaccgcaggg cgctatctca agcatcttga aagattagga tacgttaagc tcaagagaag 7980
aggctgtgaa gttctcgact gggagtcact taagaggtac aggaagcttt acgagaccct 8040
cattaagaac ctgaaatata acggtaatag cagggcatac atggttgaat ttaactctct 8100
cagggatgta gtgagcttaa tgccaataga agaacttaag gagtggataa ttggagaacc 8160
taggggtcct aagataggta ccttcattga tgtagatgat tcatttgcaa agctcctagg 8220
ttactacata agtagcggag atgtagagaa agatagggtg aagttccaca gtaaagatca 8280
aaacgttctc gaggatatag cgaaacttgc cgagaagtta tttggaaagg tgaggagagg 8340
aagaggatat attgaggtat cagggaaaat tagccatgcc atatttagag ttttagcgga 8400
aggtaagaga attccagagt tcatcttcac atccccaatg gatattaagg tagccttcct 8460
taagggactc aacggtaatg ctgaagaatt aacgttctcc actaagagtg agctattagt 8520
taaccagctt atccttctcc tgaactccat tggagtttcg gatataaaga ttgaacatga 8580
gaaaggggtt tacagagttt acataaataa gaaggaatcc tccaatgggg atatagtact 8640
tgatagcgtc gaatctatcg aagttgaaaa atacgagggc tacgtttatg atctaagtgt 8700
tgaggataat gagaacttcc tcgttggctt cggactactt tacgcacaca acatggacat 8760
gcgcgtgccc gcccagctgc tgggcctgct gctgctgtgg ttccccggct cgcgatgcga 8820
catccagatg acccagtctc catcctccct gtctgcatct gtaggggaca gagtcaccat 8880
cacttgtcgg gcaagtcagg gcatcagaaa ttacttagcc tggtatcagc aaaaaccagg 8940
gaaagcccct aagctcctga tctatgctgc atccactttg caatcagggg tcccatctcg 9000
gttcagtggc agtggatctg ggacagattt cactctcacc atcagcagcc tacagcctga 9060
agatgttgca acttattact gtcaaaggta taaccgtgca ccgtatactt ttggccaggg 9120
gaccaaggtg gaaatcaaac gtacggtggc tgcaccatct gtcttcatct tcccgccatc 9180
tgatgagcag ttgaaatctg gaactgcctc tgttgtgtgc ctgctgaata acttctatcc 9240
cagagaggcc aaagtacagt ggaaggtgga taacgccctc caatcgggta actcccagga 9300
gagtgtcaca gagcaggaca gcaaggacag cacctacagc ctcagcagca ccctgacgct 9360
gagcaaagca gactacgaga aacacaaagt ctacgcctgc gaagtcaccc atcagggcct 9420
gagctcgccc gtcacaaaga gcttcaacag gggagagtgt 9460
<210>63
<211>1166
<212>PRT
<213>人造
<220>
<223>合成:pTT3-HcintLC-p.hori中开放阅读框的氨基酸序列。
<400>63
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1 5 10 15
Val Gln Cys Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln
20 25 30
Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
35 40 45
Asp Asp Tyr Ala Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
50 55 60
Glu Trp Val Ser Ala Ile Thr Trp Asn Ser Gly His Ile Asp Tyr Ala
65 70 75 80
Asp Ser Val Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
85 90 95
Ser Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val
100 105 110
Tyr Tyr Cys Ala Lys Val Ser Tyr Leu Ser Thr Ala Ser Ser Leu Asp
115 120 125
Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys
130 135 140
Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly
145 150 155 160
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro
165 170 175
Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr
180 185 190
Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val
195 200 205
Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn
210 215 220
Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro
225 230 235 240
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
245 250 255
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
260 265 270
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
275 280 285
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
290 295 300
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
305 310 315 320
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
325 330 335
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
340 345 350
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
355 360 365
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn
370 375 380
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
385 390 395 400
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
405 410 415
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
420 425 430
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
435 440 445
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
450 455 460
Ser Leu Ser Pro Gly Lys Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile
465 470 475 480
Val Glu Asn Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp
485 490 495
Arg Glu Ile Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr
500 505 510
Glu Ile Leu Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu
515 520 525
Thr Lys Lys Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg
530 535 540
Tyr Ser Gly Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile
545 550 555 560
Lys Ile Thr Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu
565 570 575
Val Lys Val Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val
580 585 590
Pro Gly Arg Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val
595 600 605
Glu Leu Leu Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met
610 615 620
Met Ile Pro Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys
625 630 635 640
Thr Leu Tyr Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly
645 650 655
Arg Tyr Leu Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg
660 665 670
Arg Gly Cys Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys
675 680 685
Leu Tyr Glu Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg
690 695 700
Ala Tyr Met Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met
705 710 715 720
Pro Ile Glu Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro
725 730 735
Lys Ile Gly Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu
740 745 750
Gly Tyr Tyr Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe
755 760 765
His Ser Lys Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu
770 775 780
Lys Leu Phe Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser
785 790 795 800
Gly Lys Ile Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg
805 810 815
Ile Pro Glu Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe
820 825 830
Leu Lys Gly Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys
835 840 845
Ser Glu Leu Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly
850 855 860
Val Ser Asp Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr
865 870 875 880
Ile Asn Lys Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val
885 890 895
Glu Ser Ile Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser
900 905 910
Val Glu Asp Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala
915 920 925
His Asn Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu
930 935 940
Leu Trp Phe Pro Gly Ser Arg Cys Asp Ile Gln Met Thr Gln Ser Pro
945 950 955 960
Ser Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg
965 970 975
Ala Ser Gln Gly Ile Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro
980 985 990
Gly Lys Ala Pro Lys Leu Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser
995 1000 1005
Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe
1010 1015 1020
Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr
1025 1030 1035
Tyr Cys Gln Arg Tyr Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly
1040 1045 1050
Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe
1055 1060 1065
Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser
1070 1075 1080
Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val
1085 1090 1095
Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu
1100 1105 1110
Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser
1115 1120 1125
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val
1130 1135 1140
Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr
1145 1150 1155
Lys Ser Phe Asn Arg Gly Glu Cys
1160 1165
<210>64
<211>1404
<212>DNA
<213>人造
<220>
<223>合成构建体:pTT3-HcintLC1aa-p.hori的部分编码序列
<400>64
ccgggtaaaa acagcatttt accagatgaa tggctcccaa ttgttgaaaa tgaaaaagtt 60
cgattcgtaa aaattggaga cttcatagat agggagattg aggaaaacgc tgagagagtg 120
aagagggatg gtgaaactga aattctagag gttaaagatc ttaaagccct ttccttcaat 180
agagaaacaa aaaagagcga gctcaagaag gtaaaggccc taattagaca ccgctattca 240
gggaaggttt acagcattaa actaaagtca gggagaagga tcaaaataac ctcaggtcat 300
agtctgttct cagtaaaaaa tggaaagcta gttaaggtca ggggagatga actcaagcct 360
ggtgatctcg ttgtcgttcc aggaaggtta aaacttccag aaagcaagca agtgctaaat 420
ctcgttgaac tactcctgaa attacccgaa gaggagacat cgaacatcgt aatgatgatc 480
ccagttaaag gtagaaagaa tttcttcaaa gggatgctca aaacattata ctggatcttc 540
ggggagggag aaaggccaag aaccgcaggg cgctatctca agcatcttga aagattagga 600
tacgttaagc tcaagagaag aggctgtgaa gttctcgact gggagtcact taagaggtac 660
aggaagcttt acgagaccct cattaagaac ctgaaatata acggtaatag cagggcatac 720
atggttgaat ttaactctct cagggatgta gtgagcttaa tgccaataga agaacttaag 780
gagtggataa ttggagaacc taggggtcct aagataggta ccttcattga tgtagatgat 840
tcatttgcaa agctcctagg ttactacata agtagcggag atgtagagaa agatagggtg 900
aagttccaca gtaaagatca aaacgttctc gaggatatag cgaaacttgc cgagaagtta 960
tttggaaagg tgaggagagg aagaggatat attgaggtat cagggaaaat tagccatgcc 1020
atatttagag ttttagcgga aggtaagaga attccagagt tcatcttcac atccccaatg 1080
gatattaagg tagccttcct taagggactc aacggtaatg ctgaagaatt aacgttctcc 1140
actaagagtg agctattagt taaccagctt atccttctcc tgaactccat tggagtttcg 1200
gatataaaga ttgaacatga gaaaggggtt tacagagttt acataaataa gaaggaatcc 1260
tccaatgggg atatagtact tgatagcgtc gaatctatcg aagttgaaaa atacgagggc 1320
tacgtttatg atctaagtgt tgaggataat gagaacttcc tcgttggctt cggactactt 1380
tacgcacaca acagtatgga catg 1404
<210>65
<211>468
<212>PRT
<213>人造
<220>
<223>合成:pTT3-HcintLC1aa-p.hori的部分氨基酸序列,表明重链的4个
氨基酸上游和蛋白内含子的r个氨基酸下游。
<400>65
Pro Gly Lys Asn Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile Val Glu
1 5 10 15
Asn Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu
20 25 30
Ile Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile
35 40 45
Leu Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu Thr Lys
50 55 60
Lys Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr Ser
65 70 75 80
Gly Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys Ile
85 90 95
Thr Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu Val Lys
100 105 110
Val Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly
115 120 125
Arg Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val Glu Leu
130 135 140
Leu Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met Met Ile
145 150 155 160
Pro Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu
165 170 175
Tyr Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr
180 185 190
Leu Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly
195 200 205
Cys Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr
210 215 220
Glu Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr
225 230 235 240
Met Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met Pro Ile
245 250 255
Glu Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile
260 265 270
Gly Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu Gly Tyr
275 280 285
Tyr Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe His Ser
290 295 300
Lys Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu
305 310 315 320
Phe Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys
325 330 335
Ile Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro
340 345 350
Glu Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys
355 360 365
Gly Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys Ser Glu
370 375 380
Leu Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly Val Ser
385 390 395 400
Asp Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn
405 410 415
Lys Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val Glu Ser
420 425 430
Ile Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu
435 440 445
Asp Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala His Asn
450 455 460
Ser Met Asp Met
465
<210>66
<211>1416
<212>DNA
<213>人造
<220>
<223>合成构建体:pTT3-HcintLC3aa-p.hori部分编码序列。
<400>66
ccgggtaaat tagcaaacag cattttacca gatgaatggc tcccaattgt tgaaaatgaa 60
aaagttcgat tcgtaaaaat tggagacttc atagataggg agattgagga aaacgctgag 120
agagtgaaga gggatggtga aactgaaatt ctagaggtta aagatcttaa agccctttcc 180
ttcaatagag aaacaaaaaa gagcgagctc aagaaggtaa aggccctaat tagacaccgc 240
tattcaggga aggtttacag cattaaacta aagtcaggga gaaggatcaa aataacctca 300
ggtcatagtc tgttctcagt aaaaaatgga aagctagtta aggtcagggg agatgaactc 360
aagcctggtg atctcgttgt cgttccagga aggttaaaac ttccagaaag caagcaagtg 420
ctaaatctcg ttgaactact cctgaaatta cccgaagagg agacatcgaa catcgtaatg 480
atgatcccag ttaaaggtag aaagaatttc ttcaaaggga tgctcaaaac attatactgg 540
atcttcgggg agggagaaag gccaagaacc gcagggcgct atctcaagca tcttgaaaga 600
ttaggatacg ttaagctcaa gagaagaggc tgtgaagttc tcgactggga gtcacttaag 660
aggtacagga agctttacga gaccctcatt aagaacctga aatataacgg taatagcagg 720
gcatacatgg ttgaatttaa ctctctcagg gatgtagtga gcttaatgcc aatagaagaa 780
cttaaggagt ggataattgg agaacctagg ggtcctaaga taggtacctt cattgatgta 840
gatgattcat ttgcaaagct cctaggttac tacataagta gcggagatgt agagaaagat 900
agggtgaagt tccacagtaa agatcaaaac gttctcgagg atatagcgaa acttgccgag 960
aagttatttg gaaaggtgag gagaggaaga ggatatattg aggtatcagg gaaaattagc 1020
catgccatat ttagagtttt agcggaaggt aagagaattc cagagttcat cttcacatcc 1080
ccaatggata ttaaggtagc cttccttaag ggactcaacg gtaatgctga agaattaacg 1140
ttctccacta agagtgagct attagttaac cagcttatcc ttctcctgaa ctccattgga 1200
gtttcggata taaagattga acatgagaaa ggggtttaca gagtttacat aaataagaag 1260
gaatcctcca atggggatat agtacttgat agcgtcgaat ctatcgaagt tgaaaaatac 1320
gagggctacg tttatgatct aagtgttgag gataatgaga acttcctcgt tggcttcgga 1380
ctactttacg cacacaacag ttattacatg gacatg 1416
<210>67
<211>472
<212>PRT
<213>人造
<220>
<223>合成:pTT3-HcintLC3aa-p.hori部分氨基酸序列,
表明蛋白内含子和侧翼序列。
<400>67
Pro Gly Lys Leu Ala Asn Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile
1 5 10 15
Val Glu Asn Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp
20 25 30
Arg Glu Ile Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr
35 40 45
Glu Ile Leu Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu
180 185 190
Arg Tyr Leu Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg
195 200 205
Arg Gly Cys Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys
210 215 220
Leu Tyr Glu Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg
225 230 235 240
Ala Tyr Met Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met
245 250 255
Pro Ile Glu Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro
260 265 270
Lys Ile Gly Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu
275 280 285
Gly Tyr Tyr Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe
290 295 300
His Ser Lys Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu
305 310 315 320
Lys Leu Phe Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser
325 330 335
Gly Lys Ile Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg
340 345 350
Ile Pro Glu Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe
355 360 365
Leu Lys Gly Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys
370 375 380
Ser Glu Leu Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly
385 390 395 400
Val Ser Asp Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr
405 410 415
Ile Asn Lys Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val
420 425 430
Glu Ser Ile Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser
435 440 445
Val Glu Asp Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala
450 455 460
His Asn Ser Tyr Tyr Met Asp Met
465 470
<210>68
<211>31
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>68
ggactacttt acgcagccaa catggacatg c 31
<210>69
<211>31
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>69
gcatgtccat gttggctgcg taaagtagtc c 31
<210>70
<211>34
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>70
ggactacttt acgcagccaa cagtatggac atgc 34
<210>71
<211>34
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>71
gcatgtccat actgttggct gcgtaaagta gtcc 34
<210>72
<211>18
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>72
ggtgaggaga ggaagagg 18
<210>73
<211>16
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>73
ccagaggtcg aggtcg 16
<210>74
<211>14
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>74
cggcgtggag gtgc 14
<210>75
<211>45
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>75
caacaattgg gagccattca tctggtaaaa tggttttacc cggag 45
<210>76
<211>40
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>76
ccgcccagct gctgggcgac gagtggttcc ccggctcgcg 40
<210>77
<211>40
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>77
cgcgagccgg ggaaccactc gtcgcccagc agctgggcgg 40
<210>78
<211>15
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>78
tgagcggccg ctcga 15
<210>79
<211>15
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>79
gttgtgtgcg taaag 15
<210>80
<211>15
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>80
agcattttac cagat 15
<210>81
<211>15
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>81
ggtggcgccc aaact 15
<210>82
<211>30
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>82
ctttacgcac acaacatgga catgcgcgtg 30
<210>83
<211>27
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>83
tcgagcggcc gctcaacact ctcccct 27
<210>84
<211>30
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>84
agtttgggcg ccaccatgga gtttgggctg 30
<210>85
<211>30
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>85
atctggtaaa atgcttttac ccggagacag 30
<210>86
<211>30
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>86
agtttgggcg ccaccatgga catgcgcgtg 30
<210>87
<211>31
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>87
atctggtaaa atgctacact ctcccctgtt g 31
<210>88
<211>30
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>88
ctttacgcac acaacatgga gtttgggctg 30
<210>89
<211>30
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>89
tcgagcggcc gctcatttac ccggagacag 30
<210>90
<211>14
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>90
cgccaagctc tagc 14
<210>91
<211>14
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>91
ggtcgaggtc gggg 14
<210>92
<211>40
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>92
acatgcgcgt gcccgcccag tggttccccg gctcgcgatg 40
<210>93
<211>40
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>93
catcgcgagc cggggaacca ctgggcgggc acgcgca tgt 40
<210>94
<211>30
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>94
ctttacgcac acaacgacat ccagatgacc 30
<210>95
<211>30
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>95
ggtcatctgg atgtcgttgt gtgcgtaaag 30
<210>96
<211>36
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>96
tggttccccg gctcgggagg cgacatccag atgacc 36
<210>97
<211>36
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>97
ggtcatctgg atgtcgcctc ccgagccggg gaacca 36
<210>98
<211>1464
<212>DNA
<213>人造
<220>
<223>合成构建体:构建体A的部分编码序列。
<400>98
ccgggtaaaa gcattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga 60
ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag 120
agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga 180
gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg 240
aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt 300
ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt 360
gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc 420
gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca 480
gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg 540
gagggagaaa ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac 600
gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg 660
aagctttacg agaccctcat taagaacctg aaatataacg gtaatagcag ggcatacatg 720
gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag 780
tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca 840
tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag 900
ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt 960
ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata 1020
tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat 1080
attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact 1140
aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat 1200
ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc 1260
aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac 1320
gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac 1380
gcagccaaca tggacatgcg cgtgcccgcc cagctgctgg gcctgctgct gctgtggttc 1440
cccggctcgc gatgcgacat ccag 1464
<210>99
<211>488
<212>PRT
<213>人造
<220>
<223>合成:构建体A的部分氨基酸序列。
<400>99
Pro Gly Lys Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile Val Glu Asn
1 5 10 15
Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile
20 25 30
Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile Leu
35 40 45
Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu Thr Lys Lys
50 55 60
Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr Ser Gly
65 70 75 80
Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr
85 90 95
Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu Val Lys Val
100 105 110
Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly Arg
115 120 125
Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu
130 135 140
Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met Met Ile Pro
145 150 155 160
Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr
165 170 175
Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu
180 185 190
Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly Cys
195 200 205
Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu
210 215 220
Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr Met
225 230 235 240
Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met Pro Ile Glu
245 250 255
Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile Gly
260 265 270
Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu Gly Tyr Tyr
275 280 285
Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe His Ser Lys
290 295 300
Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe
305 310 315 320
Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys Ile
325 330 335
Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro Glu
340 345 350
Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys Gly
355 360 365
Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys Ser Glu Leu
370 375 380
Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly Val Ser Asp
385 390 395 400
Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn Lys
405 410 415
Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val Glu Ser Ile
420 425 430
Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu Asp
435 440 445
Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala Ala Asn Met
450 455 460
Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe
465 470 475 480
Pro Gly Ser Arg Cys Asp Ile Gln
485
<210>100
<211>1467
<212>DNA
<213>人造
<220>
<223>合成构建体:构建体B的部分编码序列。
<400>100
ccgggtaaaa gcattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga 60
ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag 120
agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga 180
gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg 240
aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt 300
ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt 360
gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc 420
gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca 480
gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg 540
gagggagaaa ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac 600
gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg 660
aagctttacg agaccctcat taagaacctg aaatataacg gtaatagcag ggcatacatg 720
gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag 780
tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca 840
tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag 900
ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt 960
ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata 1020
tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat 1080
attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact 1140
aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat 1200
ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc 1260
aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac 1320
gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac 1380
gcagccaaca gtatggacat gcgcgtgccc gcccagctgc tgggcctgct gctgctgtgg 1440
ttccccggct cgcgatgcga catccag 1467
<210>101
<211>489
<212>PRT
<213>人造
<220>
<223>合成构建体:构建体A的部分氨基酸序列。
<400>101
Pro Gly Lys Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile Val Glu Asn
1 5 10 15
Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile
20 25 30
Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile Leu
35 40 45
Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu Thr Lys Lys
50 55 60
Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr Ser Gly
65 70 75 80
Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr
85 90 95
Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu Val Lys Val
100 105 110
Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly Arg
115 120 125
Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu
130 135 140
Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met Met Ile Pro
145 150 155 160
Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr
165 170 175
Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu
180 185 190
Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly Cys
195 200 205
Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu
210 215 220
Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr Met
225 230 235 240
Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met Pro Ile Glu
245 250 255
Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile Gly
260 265 270
Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu Gly Tyr Tyr
275 280 285
Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe His Ser Lys
290 295 300
Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe
305 310 315 320
Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys Ile
325 330 335
Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro Glu
340 345 350
Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys Gly
355 360 365
Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys Ser Glu Leu
370 375 380
Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly Val Ser Asp
385 390 395 400
Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn Lys
405 410 415
Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val Glu Ser Ile
420 425 430
Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu Asp
435 440 445
Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala Ala Asn Ser
450 455 460
Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp
465 470 475 480
Phe Pro Gly Ser Arg Cys Asp Ile Gln
485
<210>102
<211>1467
<212>DNA
<213>人造
<220>
<223>合成构建体:构建体E中的部分编码序列。
<400>102
ccgggtaaaa ccattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga 60
ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag 120
agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga 180
gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg 240
aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt 300
ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt 360
gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc 420
gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca 480
gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg 540
gagggagaaa ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac 600
gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg 660
aagctttacg agaccctcat taagaacctg aaatataacg gtaatagcag ggcatacatg 720
gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag 780
tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca 840
tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag 900
ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt 960
ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata 1020
tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat 1080
attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact 1140
aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat 1200
ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc 1260
aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac 1320
gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac 1380
gcacacaaca gtatggacat gcgcgtgccc gcccagctgc tgggcctgct gctgctgtgg 1440
ttccccggct cgcgatgcga catccag 1467
<210>103
<211>489
<212>PRT
<213>人造
<220>
<223>合成构建体:构建体E的部分氨基酸序列。
<400>103
Pro Gly Lys Thr Ile Leu Pro Asp Glu Trp Leu Pro Ile Val Glu Asn
1 5 10 15
Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile
20 25 30
Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile Leu
35 40 45
Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu Thr Lys Lys
50 55 60
Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr Ser Gly
65 70 75 80
Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr
85 90 95
Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu Val Lys Val
100 105 110
Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly Arg
115 120 125
Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu
130 135 140
Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met Met Ile Pro
145 150 155 160
Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr
165 170 175
Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu
180 185 190
Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly Cys
195 200 205
Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu
210 215 220
Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr Met
225 230 235 240
Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met Pro Ile Glu
245 250 255
Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile Gly
260 265 270
Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu Gly Tyr Tyr
275 280 285
Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe His Ser Lys
290 295 300
Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe
305 310 315 320
Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys Ile
325 330 335
Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro Glu
340 345 350
Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys Gly
355 360 365
Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys Ser Glu Leu
370 375 380
Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly Val Ser Asp
385 390 395 400
Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn Lys
405 410 415
Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val Glu Ser Ile
420 425 430
Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu Asp
435 440 445
Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala His Asn Ser
450 455 460
Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp
465 470 475 480
Phe Pro Gly Ser Arg Cys Asp Ile Gln
485
<210>104
<211>1458
<212>DNA
<213>人造
<220>
<223>合成构建体:构建体H的部分编码序列。
<400>104
ccgggtaaaa gcattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga 60
ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag 120
agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga 180
gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg 240
aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt 300
ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt 360
gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc 420
gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca 480
gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg 540
gagggagaaa ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac 600
gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg 660
aagctttacg agaccctcat taagaacctg aaatataacg gtaatagcag ggcatacatg 720
gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag 780
tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca 840
tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag 900
ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt 960
ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata 1020
tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat 1080
attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact 1140
aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat 1200
ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc 1260
aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac 1320
gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac 1380
gcacacaaca tggacatgcg cgtgcccgcc cagctgctgg gcgacgagtg gttccccggc 1440
tcgcgatgcg acatccag 1458
<210>105
<211>486
<212>PRT
<213>人造
<220>
<223>合成构建体:构建体H的部分氨基酸序列。
<400>105
Pro Gly Lys Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile Val Glu Asn
1 5 10 15
Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile
20 25 30
Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile Leu
35 40 45
Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu Thr Lys Lys
50 55 60
Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr Ser Gly
65 70 75 80
Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr
85 90 95
Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu Val Lys Val
100 105 110
Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly Arg
115 120 125
Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu
130 135 140
Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met Met Ile Pro
145 150 155 160
Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr
165 170 175
Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu
180 185 190
Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly Cys
195 200 205
Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu
210 215 220
Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr Met
225 230 235 240
Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met Pro Ile Glu
245 250 255
Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile Gly
260 265 270
Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu Gly Tyr Tyr
275 280 285
Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe His Ser Lys
290 295 300
Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe
305 310 315 320
Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys Ile
325 330 335
Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro Glu
340 345 350
Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys Gly
355 360 365
Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys Ser Glu Leu
370 375 380
Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly Val Ser Asp
385 390 395 400
Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn Lys
405 410 415
Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val Glu Ser Ile
420 425 430
Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu Asp
435 440 445
Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala His Asn Met
450 455 460
Asp Met Arg Val Pro Ala Gln Leu Leu Gly Asp Glu Trp Phe Pro Gly
465 470 475 480
Ser Arg Cys Asp Ile Gln
485
<210>106
<211>1443
<212>DNA
<213>人造
<220>
<223>合成构建体:构建体J的部分编码序列。
<400>106
ccgggtaaaa gcattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga 60
ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag 120
agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga 180
gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg 240
aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt 300
ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt 360
gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc 420
gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca 480
gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg 540
gagggagaaa ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac 600
gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg 660
aagctttacg agaccctcat taagaacctg aaatataacg gtaatagcag ggcatacatg 720
gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag 780
tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca 840
tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag 900
ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt 960
ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata 1020
tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat 1080
attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact 1140
aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat 1200
ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc 1260
aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac 1320
gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac 1380
gcacacaaca tggacatgcg cgtgcccgcc cagtggttcc ccggctcgcg atgcgacatc 1440
cag 1443
<210>107
<211>481
<212>PRT
<213>人造
<220>
<223>合成构建体:构建体J的部分氨基酸序列。
<400>107
Pro Gly Lys Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile Val Glu Asn
1 5 10 15
Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile
20 25 30
Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile Leu
35 40 45
Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu Thr Lys Lys
50 55 60
Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr Ser Gly
65 70 75 80
Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr
85 90 95
Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu Val Lys Val
100 105 110
Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly Arg
115 120 125
Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu
130 135 140
Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met Met Ile Pro
145 150 155 160
Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr
165 170 175
Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu
180 185 190
Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly Cys
195 200 205
Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu
210 215 220
Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr Met
225 230 235 240
Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met Pro Ile Glu
245 250 255
Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile Gly
260 265 270
Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu Gly Tyr Tyr
275 280 285
Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe His Ser Lys
290 295 300
Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe
305 310 315 320
Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys Ile
325 330 335
Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro Glu
340 345 350
Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys Gly
355 360 365
Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys Ser Glu Leu
370 375 380
Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly Val Ser Asp
385 390 395 400
Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn Lys
405 410 415
Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val Glu Ser Ile
420 425 430
Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu Asp
435 440 445
Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala His Asn Met
450 455 460
Asp Met Arg Val Pro Ala Gln Trp Phe Pro Gly Ser Arg Cys Asp Ile
465 470 475 480
Gln
<210>108
<211>1398
<212>DNA
<213>人造
<220>
<223>合成构建体:构建体K的部分编码序列。
<400>108
ccgggtaaaa gcattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga 60
ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag 120
agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga 180
gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg 240
aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt 300
ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt 360
gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc 420
gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca 480
gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg 540
gagggagaaa ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac 600
gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg 660
aagctttacg agaccctcat taagaacctg aaatataacg gtaatagcag ggcatacatg 720
gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag 780
tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca 840
tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag 900
ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt 960
ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata 1020
tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat 1080
attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact 1140
aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat 1200
ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc 1260
aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac 1320
gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac 1380
gcacacaacg acatccag 1398
<210>109
<211>466
<212>PRT
<213>人造
<220>
<223>合成构建体:构建体K的部分氨基酸序列。
<400>109
Pro Gly Lys Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile Val Glu Asn
1 5 10 15
Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile
20 25 30
Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile Leu
35 40 45
Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu Thr Lys Lys
50 55 60
Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr Ser Gly
65 70 75 80
Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr
85 90 95
Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu Val Lys Val
100 105 110
Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly Arg
115 120 125
Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu
130 135 140
Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met Met Ile Pro
145 150 155 160
Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr
165 170 175
Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu
180 185 190
Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly Cys
195 200 205
Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu
210 215 220
Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr Met
225 230 235 240
Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met Pro Ile Glu
245 250 255
Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile Gly
260 265 270
Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu Gly Tyr Tyr
275 280 285
Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe His Ser Lys
290 295 300
Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe
305 310 315 320
Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys Ile
325 330 335
Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro Glu
340 345 350
Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys Gly
355 360 365
Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys Ser Glu Leu
370 375 380
Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly Val Ser Asp
385 390 395 400
Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn Lys
405 410 415
Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val Glu Ser Ile
420 425 430
Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu Asp
435 440 445
Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala His Asn Asp
450 455 460
Ile Gln
465
<210>110
<211>1464
<212>DNA
<213>人造
<220>
<223>合成构建体:构建体L的部分编码序列。
<400>110
ccgggtaaaa gcattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga 60
ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag 120
agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga 180
gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg 240
aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt 300
ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt 360
gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc 420
gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca 480
gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg 540
gagggagaaa ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac 600
gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg 660
aagctttacg agaccctcat taagaacctg aaatataacg gtaatagcag ggcatacatg 720
gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag 780
tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca 840
tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag 900
ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt 960
ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata 1020
tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat 1080
attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact 1140
aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat 1200
ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc 1260
aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac 1320
gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac 1380
gcacacaaca tggacatgcg cgtgcccgcc cagctgctgg gcctgctgct gctgtggttc 1440
cccggctcgg gaggcgacat ccag 1464
<210>111
<211>488
<212>PRT
<213>人造
<220>
<223>合成构建体:构建体L的部分氨基酸序列。
<400>111
Pro Gly Lys Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile Val Glu Asn
1 5 10 15
Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile
20 25 30
Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile Leu
35 40 45
Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu Thr Lys Lys
50 55 60
Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr Ser Gly
65 70 75 80
Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr
85 90 95
Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu Val Lys Val
100 105 110
Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly Arg
115 120 125
Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu
130 135 140
Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met Met Ile Pro
145 150 155 160
Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr
165 170 175
Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu
180 185 190
Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly Cys
195 200 205
Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu
210 215 220
Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr Met
225 230 235 240
Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met Pro Ile Glu
245 250 255
Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile Gly
260 265 270
Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu Gly Tyr Tyr
275 280 285
Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe His Ser Lys
290 295 300
Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe
305 310 315 320
Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys Ile
325 330 335
Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro Glu
340 345 350
Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys Gly
355 360 365
Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys Ser Glu Leu
370 375 380
Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly Val Ser Asp
385 390 395 400
Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn Lys
405 410 415
Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val Glu Ser Ile
420 425 430
Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu Asp
435 440 445
Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala His Asn Met
450 455 460
Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe
465 470 475 480
Pro Gly Ser Gly Gly Asp Ile Gln
485
<210>112
<211>26
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>112
tgctttgcca agggtaccaa tgtttt 26
<210>113
<211>26
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>113
attatggacg acaacctggt tggcaa 26
<210>114
<211>59
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>114
ccgcagaaga gcctctccct gtctccgggt aaatgctttg ccaagggtac caatgtttt 59
<210>115
<211>62
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>115
ccgcagaaga gcctctccct gtctccgggt aaagggtgct ttgccaaggg taccaatgtt 60
tt 62
<210>116
<211>68
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>116
ccgcagaaga gcctctccct gtctccgggt aaatatgtcg ggtgctttgc caagggtacc 60
aatgtttt 68
<210>117
<211>65
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>117
cagcaggccc agcagctggg cgggcacgcg catgtccata ttatggacga caacctggtt 60
ggcaa 65
<210>118
<211>68
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>118
cagcaggccc agcagctggg cgggcacgcg catgtccatg caattatgga cgacaacctg 60
gttggcaa 68
<210>119
<211>74
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>119
cagcaggccc agcagctggg cgggcacgcg catgtccatt tctccgcaat tatggacgac 60
aacctggttg gcaa 74
<210>120
<211>40
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>120
ccactacacg cagaagagcc tctccctgtc tccgggtaaa 40
<210>121
<211>40
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>121
gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat 40
<210>122
<211>40
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>122
atggacatgc gcgtgcccgc ccagctgctg ggcctgctgc 40
<210>123
<211>41
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>123
tttacccgga gacagggaga ggctcttctg cgtgtagtgg t 41
<210>124
<211>9442
<212>DNA
<213>人造
<220>
<223>合成构建体:质粒pTT3-D2E7重链
蛋白内含子-D2E7轻链的核苷酸序列。
<400>124
gcggccgctc gaggccggca aggccggatc ccccgacctc gacctctggc taataaagga 60
aatttatttt cattgcaata gtgtgttgga attttttgtg tctctcactc ggaaggacat 120
atgggagggc aaatcatttg gtcgagatcc ctcggagatc tctagctaga ggatcgatcc 180
ccgccccgga cgaactaaac ctgactacga catctctgcc ccttcttcgc ggggcagtgc 240
atgtaatccc ttcagttggt tggtacaact tgccaactgg gccctgttcc acatgtgaca 300
cgggggggga ccaaacacaa aggggttctc tgactgtagt tgacatcctt ataaatggat 360
gtgcacattt gccaacactg agtggctttc atcctggagc agactttgca gtctgtggac 420
tgcaacacaa cattgccttt atgtgtaact cttggctgaa gctcttacac caatgctggg 480
ggacatgtac ctcccagggg cccaggaaga ctacgggagg ctacaccaac gtcaatcaga 540
ggggcctgtg tagctaccga taagcggacc ctcaagaggg cattagcaat agtgtttata 600
aggccccctt gttaacccta aacgggtagc atatgcttcc cgggtagtag tatatactat 660
ccagactaac cctaattcaa tagcatatgt tacccaacgg gaagcatatg ctatcgaatt 720
agggttagta aaagggtcct aaggaacagc gatatctccc accccatgag ctgtcacggt 780
tttatttaca tggggtcagg attccacgag ggtagtgaac cattttagtc acaagggcag 840
tggctgaaga tcaaggagcg ggcagtgaac tctcctgaat cttcgcctgc ttcttcattc 900
tccttcgttt agctaataga ataactgctg agttgtgaac agtaaggtgt atgtgaggtg 960
ctcgaaaaca aggtttcagg tgacgccccc agaataaaat ttggacgggg ggttcagtgg 1020
tggcattgtg ctatgacacc aatataaccc tcacaaaccc cttgggcaat aaatactagt 1080
gtaggaatga aacattctga atatctttaa caatagaaat ccatggggtg gggacaagcc 1140
gtaaagactg gatgtccatc tcacacgaat ttatggctat gggcaacaca taatcctagt 1200
gcaatatgat actggggtta ttaagatgtg tcccaggcag ggaccaagac aggtgaacca 1260
tgttgttaca ctctatttgt aacaagggga aagagagtgg acgccgacag cagcggactc 1320
cactggttgt ctctaacacc cccgaaaatt aaacggggct ccacgccaat ggggcccata 1380
aacaaagaca agtggccact cttttttttg aaattgtgga gtgggggcac gcgtcagccc 1440
ccacacgccg ccctgcggtt ttggactgta aaataagggt gtaataactt ggctgattgt 1500
aaccccgcta accactgcgg tcaaaccact tgcccacaaa accactaatg gcaccccggg 1560
gaatacctgc ataagtaggt gggcgggcca agataggggc gcgattgctg cgatctggag 1620
gacaaattac acacacttgc gcctgagcgc caagcacagg gttgttggtc ctcatattca 1680
cgaggtcgct gagagcacgg tgggctaatg ttgccatggg tagcatatac tacccaaata 1740
tctggatagc atatgctatc ctaatctata tctgggtagc ataggctatc ctaatctata 1800
tctgggtagc atatgctatc ctaatctata tctgggtagt atatgctatc ctaatttata 1860
tctgggtagc ataggctatc ctaatctata tctgggtagc atatgctatc ctaatctata 1920
tctgggtagt atatgctatc ctaatctgta tccgggtagc atatgctatc ctaatagaga 1980
ttagggtagt atatgctatc ctaatttata tctgggtagc atatactacc caaatatctg 2040
gatagcatat gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg 2100
ggtagcatag gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg 2160
ggtagtatat gctatcctaa tttatatctg ggtagcatag gctatcctaa tctatatctg 2220
ggtagcatat gctatcctaa tctatatctg ggtagtatat gctatcctaa tctgtatccg 2280
ggtagcatat gctatcctca tgataagctg tcaaacatga gaattttctt gaagacgaaa 2340
gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac 2400
gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat 2460
acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg 2520
aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc 2580
attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga 2640
tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga 2700
gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg 2760
cgcggtatta tcccgtgttg acgccgggca agagcaactc ggtcgccgca tacactattc 2820
tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac 2880
agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact 2940
tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca 3000
tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg 3060
tgacaccacg atgcctgcag caatggcaac aacgttgcgc aaactattaa ctggcgaact 3120
acttactcta gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg 3180
accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg 3240
tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat 3300
cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc 3360
tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat 3420
actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt 3480
tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc 3540
cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt 3600
gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac 3660
tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt 3720
gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct 3780
gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga 3840
ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac 3900
acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg 3960
agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt 4020
cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc 4080
tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg 4140
gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc 4200
ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc 4260
ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag 4320
cgaggaagcg gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca 4380
ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat 4440
taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg 4500
tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga 4560
ttacgccaag ctctagctag aggtcgacca attctcatgt ttgacagctt atcatcgcag 4620
atccgggcaa cgttgttgcc attgctgcag gcgcagaact ggtaggtatg gaagatctat 4680
acattgaatc aatattggca attagccata ttagtcattg gttatatagc ataaatcaat 4740
attggctatt ggccattgca tacgttgtat ctatatcata atatgtacat ttatattggc 4800
tcatgtccaa tatgaccgcc atgttgacat tgattattga ctagttatta atagtaatca 4860
attacggggt cattagttca tagcccatat atggagttcc gcgttacata acttacggta 4920
aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat 4980
gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg 5040
taaactgccc acttggcagt acatcaagtg tatcatatgc caagtccgcc ccctattgac 5100
gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt acgggacttt 5160
cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg 5220
cagtacacca atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc 5280
attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt 5340
aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 5400
agcagagctc gtttagtgaa ccgtcagatc ctcactctct tccgcatcgc tgtctgcgag 5460
ggccagctgt tgggctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg 5520
atcggaaacc cgtcggcctc cgaacggtac tccgccaccg agggacctga gcgagtccgc 5580
atcgaccgga tcggaaaacc tctcgagaaa ggcgtctaac cagtcacagt cgcaaggtag 5640
gctgagcacc gtggcgggcg gcagcgggtg gcggtcgggg ttgtttctgg cggaggtgct 5700
gctgatgatg taattaaagt aggcggtctt gagacggcgg atggtcgagg tgaggtgtgg 5760
caggcttgag atccagctgt tggggtgagt actccctctc aaaagcgggc attacttctg 5820
cgctaagatt gtcagtttcc aaaaacgagg aggatttgat attcacctgg cccgatctgg 5880
ccatacactt gagtgacaat gacatccact ttgcctttct ctccacaggt gtccactccc 5940
aggtccaagt ttgggcgcca ccatggagtt tgggctgagc tggctttttc ttgtcgcgat 6000
tttaaaaggt gtccagtgtg aggtgcagct ggtggagtct gggggaggct tggtacagcc 6060
cggcaggtcc ctgagactct cctgtgcggc ctctggattc acctttgatg attatgccat 6120
gcactgggtc cggcaagctc cagggaaggg cctggaatgg gtctcagcta tcacttggaa 6180
tagtggtcac atagactatg cggactctgt ggagggccga ttcaccatct ccagagacaa 6240
cgccaagaac tccctgtatc tgcaaatgaa cagtctgaga gctgaggata cggccgtata 6300
ttactgtgcg aaagtctcgt accttagcac cgcgtcctcc cttgactatt ggggccaagg 6360
taccctggtc accgtctcga gtgcgtcgac caagggccca tcggtcttcc ccctggcacc 6420
ctcctccaag agcacctctg ggggcacagc ggccctgggc tgcctggtca aggactactt 6480
ccccgaaccg gtgacggtgt cgtggaactc aggcgccctg accagcggcg tgcacacctt 6540
cccggctgtc ctacagtcct caggactcta ctccctcagc agcgtggtga ccgtgccctc 6600
cagcagcttg ggcacccaga cctacatctg caacgtgaat cacaagccca gcaacaccaa 6660
ggtggacaag aaagttgagc ccaaatcttg tgacaaaact cacacatgcc caccgtgccc 6720
agcacctgaa ctcctggggg gaccgtcagt cttcctcttc cccccaaaac ccaaggacac 6780
cctcatgatc tcccggaccc ctgaggtcac atgcgtggtg gtggacgtga gccacgaaga 6840
ccctgaggtc aagttcaact ggtacgtgga cggcgtggag gtgcataatg ccaagacaaa 6900
gccgcgggag gagcagtaca acagcacgta ccgtgtggtc agcgtcctca ccgtcctgca 6960
ccaggactgg ctgaatggca aggagtacaa gtgcaaggtc tccaacaaag ccctcccagc 7020
ccccatcgag aaaaccatct ccaaagccaa agggcagccc cgagaaccac aggtgtacac 7080
cctgccccca tcccgggatg agctgaccaa gaaccaggtc agcctgacct gcctggtcaa 7140
aggcttctat cccagcgaca tcgccgtgga gtgggagagc aatgggcagc cggagaacaa 7200
ctacaagacc acgcctcccg tgctggactc cgacggctcc ttcttcctct acagcaagct 7260
caccgtggac aagagcaggt ggcagcaggg gaacgtcttc tcatgctccg tgatgcatga 7320
ggctctgcac aaccactaca cgcagaagag cctctccctg tctccgggta aatgctttgc 7380
caagggtacc aatgttttaa tggcggatgg gtctattgaa tgtattgaaa acattgaggt 7440
tggtaataag gtcatgggta aagatggcag acctcgtgag gtaattaaat tgcccagagg 7500
aagagaaact atgtacagcg tcgtgcagaa aagtcagcac agagcccaca aaagtgactc 7560
aagtcgtgaa gtgccagaat tactcaagtt tacgtgtaat gcgacccatg agttggttgt 7620
tagaacacct cgtagtgtcc gccgtttgtc tcgtaccatt aagggtgtcg aatattttga 7680
agttattact tttgagatgg gccaaaagaa agcccccgac ggtagaattg ttgagcttgt 7740
caaggaagtt tcaaagagct acccaatatc tgaggggcct gagagagcca acgaattagt 7800
agaatcctat agaaaggctt caaataaagc ttattttgag tggactattg aggccagaga 7860
tctttctctg ttgggttccc atgttcgtaa agctacctac cagacttacg ctccaattct 7920
ttatgagaat gaccactttt tcgactacat gcaaaaaagt aagtttcatc tcaccattga 7980
aggtccaaaa gtacttgctt atttacttgg tttatggatt ggtgatggat tgtctgacag 8040
ggcaactttt tcggttgatt ccagagatac ttctttgatg gaacgtgtta ctgaatatgc 8100
tgaaaagttg aatttgtgcg ccgagtataa ggacagaaaa gaaccacaag ttgccaaaac 8160
tgttaatttg tactctaaag ttgtcagagg taatggtatt cgcaataatc ttaatactga 8220
gaatccatta tgggacgcta ttgttggctt aggattcttg aaggacggtg tcaaaaatat 8280
tccttctttc ttgtctacgg acaatatcgg tactcgtgaa acatttcttg ctggtctaat 8340
tgattctgat ggctatgtta ctgatgagca tggtattaaa gcaacaataa agacaattca 8400
tacttctgtc agagatggtt tggtttccct tgctcgttct ttaggcttag tagtctcggt 8460
taacgcagaa cctgctaagg ttgacatgaa tggcaccaaa cataaaatta gttatgctat 8520
ttatatgtct ggtggagatg ttttgcttaa cgttctttcg aagtgtgccg gctctaaaaa 8580
attcaggcct gctcccgccg ctgcttttgc acgtgagtgc cgcggatttt atttcgagtt 8640
acaagaattg aaggaagacg attattatgg gattacttta tctgatgatt ctgatcatca 8700
gtttttgctt gccaaccagg ttgtcgtcca taatatggac atgcgcgtgc ccgcccagct 8760
gctgggcctg ctgctgctgt ggttccccgg ctcgcgatgc gacatccaga tgacccagtc 8820
tccatcctcc ctgtctgcat ctgtagggga cagagtcacc atcacttgtc gggcaagtca 8880
gggcatcaga aattacttag cctggtatca gcaaaaacca gggaaagccc ctaagctcct 8940
gatctatgct gcatccactt tgcaatcagg ggtcccatct cggttcagtg gcagtggatc 9000
tgggacagat ttcactctca ccatcagcag cctacagcct gaagatgttg caacttatta 9060
ctgtcaaagg tataaccgtg caccgtatac ttttggccag gggaccaagg tggaaatcaa 9120
acgtacggtg gctgcaccat ctgtcttcat cttcccgcca tctgatgagc agttgaaatc 9180
tggaactgcc tctgttgtgt gcctgctgaa taacttctat cccagagagg ccaaagtaca 9240
gtggaaggtg gataacgccc tccaatcggg taactcccag gagagtgtca cagagcagga 9300
cagcaaggac agcacctaca gcctcagcag caccctgacg ctgagcaaag cagactacga 9360
gaaacacaaa gtctacgcct gcgaagtcac ccatcagggc ctgagctcgc ccgtcacaaa 9420
gagcttcaac aggggagagt gt 9442
<210>125
<211>1386
<212>DNA
<213>人造
<220>
<223>合成构建体:pTT3-HC-VMAint-LC-1aa中的部分编码序列。
<400>125
ccgggtaaag ggtgctttgc caagggtacc aatgttttaa tggcggatgg gtctattgaa 60
tgtattgaaa acattgaggt tggtaataag gtcatgggta aagatggcag acctcgtgag 120
gtaattaaat tgcccagagg aagagaaact atgtacagcg tcgtgcagaa aagtcagcac 180
agagcccaca aaagtgactc aagtcgtgaa gtgccagaat tactcaagtt tacgtgtaat 240
gcgacccatg agttggttgt tagaacacct cgtagtgtcc gccgtttgtc tcgtaccatt 300
aagggtgtcg aatattttga agttattact tttgagatgg gccaaaagaa agcccccgac 360
ggtagaattg ttgagcttgt caaggaagtt tcaaagagct acccaatatc tgaggggcct 420
gagagagcca acgaattagt agaatcctat agaaaggctt caaataaagc ttattttgag 480
tggactattg aggccagaga tctttctctg ttgggttccc atgttcgtaa agctacctac 540
cagacttacg ctccaattct ttatgagaat gaccactttt tcgactacat gcaaaaaagt 600
aagtttcatc tcaccattga aggtccaaaa gtacttgctt atttacttgg tttatggatt 660
ggtgatggat tgtctgacag ggcaactttt tcggttgatt ccagagatac ttctttgatg 720
gaacgtgtta ctgaatatgc tgaaaagttg aatttgtgcg ccgagtataa ggacagaaaa 780
gaaccacaag ttgccaaaac tgttaatttg tactctaaag ttgtcagagg taatggtatt 840
cgcaataatc ttaatactga gaatccatta tgggacgcta ttgttggctt aggattcttg 900
aaggacggtg tcaaaaatat tccttctttc ttgtctacgg acaatatcgg tactcgtgaa 960
acatttcttg ctggtctaat tgattctgat ggctatgtta ctgatgagca tggtattaaa 1020
gcaacaataa agacaattca tacttctgtc agagatggtt tggtttccct tgctcgttct 1080
ttaggcttag tagtctcggt taacgcagaa cctgctaagg ttgacatgaa tggcaccaaa 1140
cataaaatta gttatgctat ttatatgtct ggtggagatg ttttgcttaa cgttctttcg 1200
aagtgtgccg gctctaaaaa attcaggcct gctcccgccg ctgcttttgc acgtgagtgc 1260
cgcggatttt atttcgagtt acaagaattg aaggaagacg attattatgg gattacttta 1320
tctgatgatt ctgatcatca gtttttgctt gccaaccagg ttgtcgtcca taattgcatg 1380
gacatg 1386
<210>126
<211>1398
<212>DNA
<213>人造
<220>
<223>合成构建体:pTT3-HC-VMAint-LC-3aa的部分编码序列。
<400>126
ccgggtaaat atgtcgggtg ctttgccaag ggtaccaatg ttttaatggc ggatgggtct 60
attgaatgta ttgaaaacat tgaggttggt aataaggtca tgggtaaaga tggcagacct 120
cgtgaggtaa ttaaattgcc cagaggaaga gaaactatgt acagcgtcgt gcagaaaagt 180
cagcacagag cccacaaaag tgactcaagt cgtgaagtgc cagaattact caagtttacg 240
tgtaatgcga cccatgagtt ggttgttaga acacctcgta gtgtccgccg tttgtctcgt 300
accattaagg gtgtcgaata ttttgaagtt attacttttg agatgggcca aaagaaagcc 360
cccgacggta gaattgttga gcttgtcaag gaagtttcaa agagctaccc aatatctgag 420
gggcctgaga gagccaacga attagtagaa tcctatagaa aggcttcaaa taaagcttat 480
tttgagtgga ctattgaggc cagagatctt tctctgttgg gttcccatgt tcgtaaagct 540
acctaccaga cttacgctcc aattctttat gagaatgacc actttttcga ctacatgcaa 600
aaaagtaagt ttcatctcac cattgaaggt ccaaaagtac ttgcttattt acttggttta 660
tggattggtg atggattgtc tgacagggca actttttcgg ttgattccag agatacttct 720
ttgatggaac gtgttactga atatgctgaa aagttgaatt tgtgcgccga gtataaggac 780
agaaaagaac cacaagttgc caaaactgtt aatttgtact ctaaagttgt cagaggtaat 840
ggtattcgca ataatcttaa tactgagaat ccattatggg acgctattgt tggcttagga 900
ttcttgaagg acggtgtcaa aaatattcct tctttcttgt ctacggacaa tatcggtact 960
cgtgaaacat ttcttgctgg tctaattgat tctgatggct atgttactga tgagcatggt 1020
attaaagcaa caataaagac aattcatact tctgtcagag atggtttggt ttcccttgct 1080
cgttctttag gcttagtagt ctcggttaac gcagaacctg ctaaggttga catgaatggc 1140
accaaacata aaattagtta tgctatttat atgtctggtg gagatgtttt gcttaacgtt 1200
ctttcgaagt gtgccggctc taaaaaattc aggcctgctc ccgccgctgc ttttgcacgt 1260
gagtgccgcg gattttattt cgagttacaa gaattgaagg aagacgatta ttatgggatt 1320
actttatctg atgattctga tcatcagttt ttgcttgcca accaggttgt cgtccataat 1380
tgcggagaaa tggacatg 1398
<210>127
<211>1050
<212>DNA
<213>人造
<220>
<223>合成构建体:工程化的集胞藻蛋白内含子编码序列。
<400>127
gggcgaattg ggtaccgaat tctgcctgtc cttcggcacc gagatcctga ccgtggagta 60
cccgcttaac ccatggctta agacggacag gaagccgtgg ctctaggact ggcacctcat 120
cggccctctg cctatcggca agatcgtgtc cgaagagatc aactgctccg tgtactccgt 180
gccgggagac ggatagccgt tctagcacag gcttctctag ttgacgaggc acatgaggca 240
ggaccctgag ggccgggtgt atactcaggc catcgcccag tggcacgacc ggggcgagca 300
cctgggactc ccggcccaca tatgagtccg gtagcgggtc accgtgctgg ccccgctcgt 360
ggaggtgctg gagtacgagc tggaggacgg ctccgtgatc cgggccacct ccgaccaccg 420
cctccacgac ctcatgctcg acctcctgcc gaggcactag gcccggtgga ggctggtggc 480
gtttctgacc accgactatc agctgctggc catcgaggag atcttcgccc ggcagctgga 540
caaagactgg tggctgatag tcgacgaccg gtagctcctc tagaagcggg ccgtcgacct 600
cctgctgacc ctggagaaca tcaagcagac cgaggaggcc ctggacaacc accggctgcc 660
ggacgactgg gacctcttgt agttcgtctg gctcctccgg gacctgttgg tggccgacgg 720
tttccctctg ctggacgccg gcaccatcaa gatggtgaag gtgatcggca ggcggtccct 780
aaagggagac gacctgcggc cgtggtagtt ctaccacttc cactagccgt ccgccaggga 840
gggcgtgcag cggatcttcg acatcggcct gcctcaggac cacaactttc tgctggccaa 900
cccgcacgtc gcctagaagc tgtagccgga cggagtcctg gtgttgaaag acgaccggtt 960
cggcgccatc gccgccaaca agcttgagct ccagcttttg ttcccgccgc ggtagcggcg 1020
gttgttcgaa ctcgaggtcg aaaacaaggg 1050
<210>128
<211>159
<212>PRT
<213>人造
<220>
<223>合成:工程化集胞藻序列编码的蛋白内含子。
<400>128
Cys Leu Ser Phe Gly Thr Glu Ile Leu Thr Val Glu Tyr Gly Pro Leu
1 5 10 15
Pro Ile Gly Lys Ile Val Ser Glu Glu Ile Asn Cys Ser Val Tyr Ser
20 25 30
Val Asp Pro Glu Gly Arg Val Tyr Thr Gln Ala Ile Ala Gln Trp His
35 40 45
Asp Arg Gly Glu Gln Glu Val Leu Glu Tyr Glu Leu Glu Asp Gly Ser
50 55 60
Val Ile Arg Ala Thr Ser Asp His Arg Phe Leu Thr Thr Asp Tyr Gln
65 70 75 80
Leu Leu Ala Ile Glu Glu Ile Phe Ala Arg Gln Leu Asp Leu Leu Thr
85 90 95
Leu Glu Asn Ile Lys Gln Thr Glu Glu Ala Leu Asp Asn His Arg Leu
100 105 110
Pro Phe Pro Leu Leu Asp Ala Gly Thr Ile Lys Met Val Lys Val Ile
115 120 125
Gly Arg Arg Ser Leu Gly Val Gln Arg Ile Phe Asp Ile Gly Leu Pro
130 135 140
Gln Asp His Asn Phe Leu Leu Ala Asn Gly Ala Ile Ala Ala Asn
145 150 155
<210>129
<211>61
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>129
ccactacacg cagaagagcc tctccctgtc tccgggtaaa tgcctgtcct tcggcaccga 60
g 61
<210>130
<211>65
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>130
gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat gttggcggcg atggcgccgt 60
tggcc 65
<210>131
<211>64
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>131
ccactacacg cagaagagcc tctccctgtc tccgggtaaa tattgcctgt ccttcggcac 60
cgag 64
<210>132
<211>63
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>132
gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat acagttggcg gcgatggcgc 60
cgt 63
<210>133
<211>70
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>133
ccactacacg cagaagagcc tctccctgtc tccgggtaaa gccgagtatt gcctgtcctt 60
cggcaccgag 70
<210>134
<211>70
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>134
ccactacacg cagaagagcc tctccctgtc tccgggtaaa gccgagtatt gcctgtcctt 60
cggcaccgag 70
<210>135
<211>8557
<212>DNA
<213>人造
<220>
<223>合成构建体:质粒pTT3-D2E7重链
-Ssp-GA-蛋白内含子-D2E7轻链的核苷酸序列。
<400>135
gcggccgctc gaggccggca aggccggatc ccccgacctc gacctctggc taataaagga 60
aatttatttt cattgcaata gtgtgttgga attttttgtg tctctcactc ggaaggacat 120
atgggagggc aaatcatttg gtcgagatcc ctcggagatc tctagctaga ggatcgatcc 180
ccgccccgga cgaactaaac ctgactacga catctctgcc ccttcttcgc ggggcagtgc 240
atgtaatccc ttcagttggt tggtacaact tgccaactgg gccctgttcc acatgtgaca 300
cgggggggga ccaaacacaa aggggttctc tgactgtagt tgacatcctt ataaatggat 360
gtgcacattt gccaacactg agtggctttc atcctggagc agactttgca gtctgtggac 420
tgcaacacaa cattgccttt atgtgtaact cttggctgaa gctcttacac caatgctggg 480
ggacatgtac ctcccagggg cccaggaaga ctacgggagg ctacaccaac gtcaatcaga 540
ggggcctgtg tagctaccga taagcggacc ctcaagaggg cattagcaat agtgtttata 600
aggccccctt gttaacccta aacgggtagc atatgcttcc cgggtagtag tatatactat 660
ccagactaac cctaattcaa tagcatatgt tacccaacgg gaagcatatg ctatcgaatt 720
agggttagta aaagggtcct aaggaacagc gatatctccc accccatgag ctgtcacggt 780
tttatttaca tggggtcagg attccacgag ggtagtgaac cattttagtc acaagggcag 840
tggctgaaga tcaaggagcg ggcagtgaac tctcctgaat cttcgcctgc ttcttcattc 900
tccttcgttt agctaataga ataactgctg agttgtgaac agtaaggtgt atgtgaggtg 960
ctcgaaaaca aggtttcagg tgacgccccc agaataaaat ttggacgggg ggttcagtgg 1020
tggcattgtg ctatgacacc aatataaccc tcacaaaccc cttgggcaat aaatactagt 1080
gtaggaatga aacattctga atatctttaa caatagaaat ccatggggtg gggacaagcc 1140
gtaaagactg gatgtccatc tcacacgaat ttatggctat gggcaacaca taatcctagt 1200
gcaatatgat actggggtta ttaagatgtg tcccaggcag ggaccaagac aggtgaacca 1260
tgttgttaca ctctatttgt aacaagggga aagagagtgg acgccgacag cagcggactc 1320
cactggttgt ctctaacacc cccgaaaatt aaacggggct ccacgccaat ggggcccata 1380
aacaaagaca agtggccact cttttttttg aaattgtgga gtgggggcac gcgtcagccc 1440
ccacacgccg ccctgcggtt ttggactgta aaataagggt gtaataactt ggctgattgt 1500
aaccccgcta accactgcgg tcaaaccact tgcccacaaa accactaatg gcaccccggg 1560
gaatacctgc ataagtaggt gggcgggcca agataggggc gcgattgctg cgatctggag 1620
gacaaattac acacacttgc gcctgagcgc caagcacagg gttgttggtc ctcatattca 1680
cgaggtcgct gagagcacgg tgggctaatg ttgccatggg tagcatatac tacccaaata 1740
tctggatagc atatgctatc ctaatctata tctgggtagc ataggctatc ctaatctata 1800
tctgggtagc atatgctatc ctaatctata tctgggtagt atatgctatc ctaatttata 1860
tctgggtagc ataggctatc ctaatctata tctgggtagc atatgctatc ctaatctata 1920
tctgggtagt atatgctatc ctaatctgta tccgggtagc atatgctatc ctaatagaga 1980
ttagggtagt atatgctatc ctaatttata tctgggtagc atatactacc caaatatctg 2040
gatagcatat gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg 2100
ggtagcatag gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg 2160
ggtagtatat gctatcctaa tttatatctg ggtagcatag gctatcctaa tctatatctg 2220
ggtagcatat gctatcctaa tctatatctg ggtagtatat gctatcctaa tctgtatccg 2280
ggtagcatat gctatcctca tgataagctg tcaaacatga gaattttctt gaagacgaaa 2340
gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac 2400
gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat 2460
acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg 2520
aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc 2580
attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga 2640
tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga 2700
gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg 2760
cgcggtatta tcccgtgttg acgccgggca agagcaactc ggtcgccgca tacactattc 2820
tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac 2880
agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact 2940
tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca 3000
tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg 3060
tgacaccacg atgcctgcag caatggcaac aacgttgcgc aaactattaa ctggcgaact 3120
acttactcta gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg 3180
accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg 3240
tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat 3300
cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc 3360
tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat 3420
actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt 3480
tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc 3540
cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt 3600
gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac 3660
tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt 3720
gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct 3780
gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga 3840
ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac 3900
acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg 3960
agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt 4020
cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc 4080
tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg 4140
gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc 4200
ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc 4260
ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag 4320
cgaggaagcg gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca 4380
ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat 4440
taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg 4500
tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga 4560
ttacgccaag ctctagctag aggtcgacca attctcatgt ttgacagctt atcatcgcag 4620
atccgggcaa cgttgttgcc attgctgcag gcgcagaact ggtaggtatg gaagatctat 4680
acattgaatc aatattggca attagccata ttagtcattg gttatatagc ataaatcaat 4740
attggctatt ggccattgca tacgttgtat ctatatcata atatgtacat ttatattggc 4800
tcatgtccaa tatgaccgcc atgttgacat tgattattga ctagttatta atagtaatca 4860
attacggggt cattagttca tagcccatat atggagttcc gcgttacata acttacggta 4920
aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat 4980
gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg 5040
taaactgccc acttggcagt acatcaagtg tatcatatgc caagtccgcc ccctattgac 5100
gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt acgggacttt 5160
cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg 5220
cagtacacca atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc 5280
attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt 5340
aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 5400
agcagagctc gtttagtgaa ccgtcagatc ctcactctct tccgcatcgc tgtctgcgag 5460
ggccagctgt tgggctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg 5520
atcggaaacc cgtcggcctc cgaacggtac tccgccaccg agggacctga gcgagtccgc 5580
atcgaccgga tcggaaaacc tctcgagaaa ggcgtctaac cagtcacagt cgcaaggtag 5640
gctgagcacc gtggcgggcg gcagcgggtg gcggtcgggg ttgtttctgg cggaggtgct 5700
gctgatgatg taattaaagt aggcggtctt gagacggcgg atggtcgagg tgaggtgtgg 5760
caggcttgag atccagctgt tggggtgagt actccctctc aaaagcgggc attacttctg 5820
cgctaagatt gtcagtttcc aaaaacgagg aggatttgat attcacctgg cccgatctgg 5880
ccatacactt gagtgacaat gacatccact ttgcctttct ctccacaggt gtccactccc 5940
aggtccaagt ttgggcgcca ccatggagtt tgggctgagc tggctttttc ttgtcgcgat 6000
tttaaaaggt gtccagtgtg aggtgcagct ggtggagtct gggggaggct tggtacagcc 6060
cggcaggtcc ctgagactct cctgtgcggc ctctggattc acctttgatg attatgccat 6120
gcactgggtc cggcaagctc cagggaaggg cctggaatgg gtctcagcta tcacttggaa 6180
tagtggtcac atagactatg cggactctgt ggagggccga ttcaccatct ccagagacaa 6240
cgccaagaac tccctgtatc tgcaaatgaa cagtctgaga gctgaggata cggccgtata 6300
ttactgtgcg aaagtctcgt accttagcac cgcgtcctcc cttgactatt ggggccaagg 6360
taccctggtc accgtctcga gtgcgtcgac caagggccca tcggtcttcc ccctggcacc 6420
ctcctccaag agcacctctg ggggcacagc ggccctgggc tgcctggtca aggactactt 6480
ccccgaaccg gtgacggtgt cgtggaactc aggcgccctg accagcggcg tgcacacctt 6540
cccggctgtc ctacagtcct caggactcta ctccctcagc agcgtggtga ccgtgccctc 6600
cagcagcttg ggcacccaga cctacatctg caacgtgaat cacaagccca gcaacaccaa 6660
ggtggacaag aaagttgagc ccaaatcttg tgacaaaact cacacatgcc caccgtgccc 6720
agcacctgaa ctcctggggg gaccgtcagt cttcctcttc cccccaaaac ccaaggacac 6780
cctcatgatc tcccggaccc ctgaggtcac atgcgtggtg gtggacgtga gccacgaaga 6840
ccctgaggtc aagttcaact ggtacgtgga cggcgtggag gtgcataatg ccaagacaaa 6900
gccgcgggag gagcagtaca acagcacgta ccgtgtggtc agcgtcctca ccgtcctgca 6960
ccaggactgg ctgaatggca aggagtacaa gtgcaaggtc tccaacaaag ccctcccagc 7020
ccccatcgag aaaaccatct ccaaagccaa agggcagccc cgagaaccac aggtgtacac 7080
cctgccccca tcccgggatg agctgaccaa gaaccaggtc agcctgacct gcctggtcaa 7140
aggcttctat cccagcgaca tcgccgtgga gtgggagagc aatgggcagc cggagaacaa 7200
ctacaagacc acgcctcccg tgctggactc cgacggctcc ttcttcctct acagcaagct 7260
caccgtggac aagagcaggt ggcagcaggg gaacgtcttc tcatgctccg tgatgcatga 7320
ggctctgcac aaccactaca cgcagaagag cctctccctg tctccgggta aatgcctgtc 7380
cttcggcacc gagatcctga ccgtggagta cggccctctg cctatcggca agatcgtgtc 7440
cgaagagatc aactgctccg tgtactccgt ggaccctgag ggccgggtgt atactcaggc 7500
catcgcccag tggcacgacc ggggcgagca ggaggtgctg gagtacgagc tggaggacgg 7560
ctccgtgatc cgggccacct ccgaccaccg gtttctgacc accgactatc agctgctggc 7620
catcgaggag atcttcgccc ggcagctgga cctgctgacc ctggagaaca tcaagcagac 7680
cgaggaggcc ctggacaacc accggctgcc tttccctctg ctggacgccg gcaccatcaa 7740
gatggtgaag gtgatcggca ggcggtccct gggcgtgcag cggatcttcg acatcggcct 7800
gcctcaggac cacaactttc tgctggccaa cggcgccatc gccgccaaca tggacatgcg 7860
cgtgcccgcc cagctgctgg gcctgctgct gctgtggttc cccggctcgc gatgcgacat 7920
ccagatgacc cagtctccat cctccctgtc tgcatctgta ggggacagag tcaccatcac 7980
ttgtcgggca agtcagggca tcagaaatta cttagcctgg tatcagcaaa aaccagggaa 8040
agcccctaag ctcctgatct atgctgcatc cactttgcaa tcaggggtcc catctcggtt 8100
cagtggcagt ggatctggga cagatttcac tctcaccatc agcagcctac agcctgaaga 8160
tgttgcaact tattactgtc aaaggtataa ccgtgcaccg tatacttttg gccaggggac 8220
caaggtggaa atcaaacgta cggtggctgc accatctgtc ttcatcttcc cgccatctga 8280
tgagcagttg aaatctggaa ctgcctctgt tgtgtgcctg ctgaataact tctatcccag 8340
agaggccaaa gtacagtgga aggtggataa cgccctccaa tcgggtaact cccaggagag 8400
tgtcacagag caggacagca aggacagcac ctacagcctc agcagcaccc tgacgctgag 8460
caaagcagac tacgagaaac acaaagtcta cgcctgcgaa gtcacccatc agggcctgag 8520
ctcgcccgtc acaaagagct tcaacagggg agagtgt 8557
<210>136
<211>501
<212>DNA
<213>人造
<220>
<223>合成构建体:pTT3-HC-Ssp-GA-int-LC-1aa的部分编码序列。
<400>136
ccgggtaaat attgcctgtc cttcggcacc gagatcctga ccgtggagta cggccctctg 60
cctatcggca agatcgtgtc cgaagagatc aactgctccg tgtactccgt ggaccctgag 120
ggccgggtgt atactcaggc catcgcccag tggcacgacc ggggcgagca ggaggtgctg 180
gagtacgagc tggaggacgg ctccgtgatc cgggccacct ccgaccaccg gtttctgacc 240
accgactatc agctgctggc catcgaggag atcttcgccc ggcagctgga cctgctgacc 300
ctggagaaca tcaagcagac cgaggaggcc ctggacaacc accggctgcc tttccctctg 360
ctggacgccg gcaccatcaa gatggtgaag gtgatcggca ggcggtccct gggcgtgcag 420
cggatcttcg acatcggcct gcctcaggac cacaactttc tgctggccaa cggcgccatc 480
gccgccaact gtatggacat g 501
<210>137
<211>513
<212>DNA
<213>人造
<220>
<223>合成构建体:质粒pTT3-HC-Ssp-GA-int-LC-3aa的编码序列的相关部分。
<400>137
ccgggtaaag ccgagtattg cctgtccttc ggcaccgaga tcctgaccgt ggagtacggc 60
cctctgccta tcggcaagat cgtgtccgaa gagatcaact gctccgtgta ctccgtggac 120
cctgagggcc gggtgtatac tcaggccatc gcccagtggc acgaccgggg cgagcaggag 180
gtgctggagt acgagctgga ggacggctcc gtgatccggg ccacctccga ccaccggttt 240
ctgaccaccg actatcagct gctggccatc gaggagatct tcgcccggca gctggacctg 300
ctgaccctgg agaacatcaa gcagaccgag gaggccctgg acaaccaccg gctgcctttc 360
cctctgctgg acgccggcac catcaagatg gtgaaggtga tcggcaggcg gtccctgggc 420
gtgcagcgga tcttcgacat cggcctgcct caggaccaca actttctgct ggccaacggc 480
gccatcgccg ccaactgttt caacatggac atg 513
<210>138
<211>11
<212>PRT
<213>古菌种
<400>138
Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser
1 5 10
<210>139
<211>12
<212>PRT
<213>古菌种
<400>139
His Asn Ser Tyr Tyr Gly Tyr Tyr Gly Tyr Ala Lys
1 5 10
<210>140
<211>214
<212>PRT
<213>人造
<220>
<223>合成构建体:Hedgehog-抗体构建体中包括裂解位点的部分氨基酸序列。
<400>140
Cys Phe Thr Pro Glu Ser Thr Ala Leu Leu Glu Ser Gly Val Arg Lys
1 5 10 15
Pro Leu Gly Glu Leu Ser Ile Gly Asp Arg Val Leu Ser Met Thr Ala
20 25 30
Asn Gly Gln Ala Val Tyr Ser Glu Val Ile Leu Phe Met Asp Arg Asn
35 40 45
Leu Glu Gln Met Gln Asn Phe Val Gln Leu His Thr Asp Gly Gly Ala
50 55 60
Val Leu Thr Val Thr Pro Ala His Leu Val Ser Val Trp Gln Pro Glu
65 70 75 80
Ser Gln Lys Leu Thr Phe Val Phe Ala Asp Arg Ile Glu Glu Lys Asn
85 90 95
Gln Val Leu Val Arg Asp Val Glu Thr Gly Glu Leu Arg Pro Gln Arg
100 105 110
Val Val Lys Val Gly Ser Val Arg Ser Lys Gly Val Val Ala Pro Leu
115 120 125
Thr Arg Glu Gly Thr Ile Val Val Asn Ser Val Ala Ala Ser Cys Tyr
130 135 140
Ala Val Ile Asn Ser Gln Ser Leu Ala His Trp Gly Leu Ala Pro Met
145 150 155 160
Arg Leu Leu Ser Thr Leu Glu Ala Trp Leu Pro Ala Lys Glu Gln Leu
165 170 175
His Ser Ser Pro Lys Val Val Ser Ser Ala Gln Gln Gln Asn Gly Ile
180 185 190
His Trp Tyr Ala Asn Ala Leu Tyr Lys Val Lys Asp Tyr Val Leu Pro
195 200 205
Gln Ser Trp Arg His Asp
210
<210>141
<211>40
<212>PRT
<213>人造
<220>
<223>2A序列的变体。
<400>141
Leu Leu Ala Ile His Pro Thr Glu Ala Arg His Lys Gln Lys Ile Val
1 5 10 15
Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly
20 25 30
Asp Val Glu Ser Asn Pro Gly Pro
35 40
<210>142
<211>33
<212>PRT
<213>人造
<220>
<223>2A序列的变体。
<400>142
Glu Ala Arg His Lys Gln Lys Ile Val Ala Pro Val Lys Gln Thr Leu
1 5 10 15
Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly
20 25 30
Pro
<210>143
<211>20
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>143
atcgtggcgc cagctctgcg 20
<210>144
<211>20
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>144
gcaactggcg gccaccgagt 20
<210>145
<211>20
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>145
cgcatagcaa ctggcggcca 20
<210>146
<211>20
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>146
gttgtgggcg gccaccgagt 20
<210>147
<211>60
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>147
ccactacacg cagaagagcc tctccctgtc tccgggtaaa tgcttcacgc cggagagcac 60
<210>148
<211>60
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>148
gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat gcactggctg ttgatcaccg 60
<210>149
<211>60
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>149
gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat atcgtggcgc cagctctgcg 60
<210>150
<211>60
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>150
gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat gcaactggcg gccaccgagt 60
<210>151
<211>60
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>151
gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat cgcatagcaa ctggcggcca 60
<210>152
<211>60
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>152
gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat gttgtgggcg gccaccgagt 60
<210>153
<211>40
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>153
atggacatgc gcgtgcccgc ccagctgctg ggcctgctgc 40
<210>154
<211>41
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>154
tttacccgga gacagggaga ggctcttctg cgtgtagtgg t 41
<210>155
<211>8533
<212>DNA
<213>人造
<220>
<223>合成构建体:质粒pTT3-D2E7重链
-Hh-C17-D2E7轻链的核苷酸序列。
<400>155
gcggccgctc gaggccggca aggccggatc ccccgacctc gacctctggc taataaagga 60
aatttatttt cattgcaata gtgtgttgga attttttgtg tctctcactc ggaaggacat 120
atgggagggc aaatcatttg gtcgagatcc ctcggagatc tctagctaga ggatcgatcc 180
ccgccccgga cgaactaaac ctgactacga catctctgcc ccttcttcgc ggggcagtgc 240
atgtaatccc ttcagttggt tggtacaact tgccaactgg gccctgttcc acatgtgaca 300
cgggggggga ccaaacacaa aggggttctc tgactgtagt tgacatcctt ataaatggat 360
gtgcacattt gccaacactg agtggctttc atcctggagc agactttgca gtctgtggac 420
tgcaacacaa cattgccttt atgtgtaact cttggctgaa gctcttacac caatgctggg 480
ggacatgtac ctcccagggg cccaggaaga ctacgggagg ctacaccaac gtcaatcaga 540
ggggcctgtg tagctaccga taagcggacc ctcaagaggg cattagcaat agtgtttata 600
aggccccctt gttaacccta aacgggtagc atatgcttcc cgggtagtag tatatactat 660
ccagactaac cctaattcaa tagcatatgt tacccaacgg gaagcatatg ctatcgaatt 720
agggttagta aaagggtcct aaggaacagc gatatctccc accccatgag ctgtcacggt 780
tttatttaca tggggtcagg attccacgag ggtagtgaac cattttagtc acaagggcag 840
tggctgaaga tcaaggagcg ggcagtgaac tctcctgaat cttcgcctgc ttcttcattc 900
tccttcgttt agctaataga ataactgctg agttgtgaac agtaaggtgt atgtgaggtg 960
ctcgaaaaca aggtttcagg tgacgccccc agaataaaat ttggacgggg ggttcagtgg 1020
tggcattgtg ctatgacacc aatataaccc tcacaaaccc cttgggcaat aaatactagt 1080
gtaggaatga aacattctga atatctttaa caatagaaat ccatggggtg gggacaagcc 1140
gtaaagactg gatgtccatc tcacacgaat ttatggctat gggcaacaca taatcctagt 1200
gcaatatgat actggggtta ttaagatgtg tcccaggcag ggaccaagac aggtgaacca 1260
tgttgttaca ctctatttgt aacaagggga aagagagtgg acgccgacag cagcggactc 1320
cactggttgt ctctaacacc cccgaaaatt aaacggggct ccacgccaat ggggcccata 1380
aacaaagaca agtggccact cttttttttg aaattgtgga gtgggggcac gcgtcagccc 1440
ccacacgccg ccctgcggtt ttggactgta aaataagggt gtaataactt ggctgattgt 1500
aaccccgcta accactgcgg tcaaaccact tgcccacaaa accactaatg gcaccccggg 1560
gaatacctgc ataagtaggt gggcgggcca agataggggc gcgattgctg cgatctggag 1620
gacaaattac acacacttgc gcctgagcgc caagcacagg gttgttggtc ctcatattca 1680
cgaggtcgct gagagcacgg tgggctaatg ttgccatggg tagcatatac tacccaaata 1740
tctggatagc atatgctatc ctaatctata tctgggtagc ataggctatc ctaatctata 1800
tctgggtagc atatgctatc ctaatctata tctgggtagt atatgctatc ctaatttata 1860
tctgggtagc ataggctatc ctaatctata tctgggtagc atatgctatc ctaatctata 1920
tctgggtagt atatgctatc ctaatctgta tccgggtagc atatgctatc ctaatagaga 1980
ttagggtagt atatgctatc ctaatttata tctgggtagc atatactacc caaatatctg 2040
gatagcatat gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg 2100
ggtagcatag gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg 2160
ggtagtatat gctatcctaa tttatatctg ggtagcatag gctatcctaa tctatatctg 2220
ggtagcatat gctatcctaa tctatatctg ggtagtatat gctatcctaa tctgtatccg 2280
ggtagcatat gctatcctca tgataagctg tcaaacatga gaattttctt gaagacgaaa 2340
gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac 2400
gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat 2460
acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg 2520
aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc 2580
attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga 2640
tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga 2700
gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg 2760
cgcggtatta tcccgtgttg acgccgggca agagcaactc ggtcgccgca tacactattc 2820
tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac 2880
agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact 2940
tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca 3000
tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg 3060
tgacaccacg atgcctgcag caatggcaac aacgttgcgc aaactattaa ctggcgaact 3120
acttactcta gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg 3180
accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg 3240
tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat 3300
cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc 3360
tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat 3420
actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt 3480
tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc 3540
cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt 3600
gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac 3660
tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt 3720
gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct 3780
gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga 3840
ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac 3900
acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg 3960
agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt 4020
cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc 4080
tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg 4140
gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc 4200
ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc 4260
ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag 4320
cgaggaagcg gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca 4380
ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat 4440
taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg 4500
tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga 4560
ttacgccaag ctctagctag aggtcgacca attctcatgt ttgacagctt atcatcgcag 4620
atccgggcaa cgttgttgcc attgctgcag gcgcagaact ggtaggtatg gaagatctat 4680
acattgaatc aatattggca attagccata ttagtcattg gttatatagc ataaatcaat 4740
attggctatt ggccattgca tacgttgtat ctatatcata atatgtacat ttatattggc 4800
tcatgtccaa tatgaccgcc atgttgacat tgattattga ctagttatta atagtaatca 4860
attacggggt cattagttca tagcccatat atggagttcc gcgttacata acttacggta 4920
aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat 4980
gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg 5040
taaactgccc acttggcagt acatcaagtg tatcatatgc caagtccgcc ccctattgac 5100
gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt acgggacttt 5160
cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg 5220
cagtacacca atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc 5280
attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt 5340
aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 5400
agcagagctc gtttagtgaa ccgtcagatc ctcactctct tccgcatcgc tgtctgcgag 5460
ggccagctgt tgggctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg 5520
atcggaaacc cgtcggcctc cgaacggtac tccgccaccg agggacctga gcgagtccgc 5580
atcgaccgga tcggaaaacc tctcgagaaa ggcgtctaac cagtcacagt cgcaaggtag 5640
gctgagcacc gtggcgggcg gcagcgggtg gcggtcgggg ttgtttctgg cggaggtgct 5700
gctgatgatg taattaaagt aggcggtctt gagacggcgg atggtcgagg tgaggtgtgg 5760
caggcttgag atccagctgt tggggtgagt actccctctc aaaagcgggc attacttctg 5820
cgctaagatt gtcagtttcc aaaaacgagg aggatttgat attcacctgg cccgatctgg 5880
ccatacactt gagtgacaat gacatccact ttgcctttct ctccacaggt gtccactccc 5940
aggtccaagt ttgggcgcca ccatggagtt tgggctgagc tggctttttc ttgtcgcgat 6000
tttaaaaggt gtccagtgtg aggtgcagct ggtggagtct gggggaggct tggtacagcc 6060
cggcaggtcc ctgagactct cctgtgcggc ctctggattc acctttgatg attatgccat 6120
gcactgggtc cggcaagctc cagggaaggg cctggaatgg gtctcagcta tcacttggaa 6180
tagtggtcac atagactatg cggactctgt ggagggccga ttcaccatct ccagagacaa 6240
cgccaagaac tccctgtatc tgcaaatgaa cagtctgaga gctgaggata cggccgtata 6300
ttactgtgcg aaagtctcgt accttagcac cgcgtcctcc cttgactatt ggggccaagg 6360
taccctggtc accgtctcga gtgcgtcgac caagggccca tcggtcttcc ccctggcacc 6420
ctcctccaag agcacctctg ggggcacagc ggccctgggc tgcctggtca aggactactt 6480
ccccgaaccg gtgacggtgt cgtggaactc aggcgccctg accagcggcg tgcacacctt 6540
cccggctgtc ctacagtcct caggactcta ctccctcagc agcgtggtga ccgtgccctc 6600
cagcagcttg ggcacccaga cctacatctg caacgtgaat cacaagccca gcaacaccaa 6660
ggtggacaag aaagttgagc ccaaatcttg tgacaaaact cacacatgcc caccgtgccc 6720
agcacctgaa ctcctggggg gaccgtcagt cttcctcttc cccccaaaac ccaaggacac 6780
cctcatgatc tcccggaccc ctgaggtcac atgcgtggtg gtggacgtga gccacgaaga 6840
ccctgaggtc aagttcaact ggtacgtgga cggcgtggag gtgcataatg ccaagacaaa 6900
gccgcgggag gagcagtaca acagcacgta ccgtgtggtc agcgtcctca ccgtcctgca 6960
ccaggactgg ctgaatggca aggagtacaa gtgcaaggtc tccaacaaag ccctcccagc 7020
ccccatcgag aaaaccatct ccaaagccaa agggcagccc cgagaaccac aggtgtacac 7080
cctgccccca tcccgggatg agctgaccaa gaaccaggtc agcctgacct gcctggtcaa 7140
aggcttctat cccagcgaca tcgccgtgga gtgggagagc aatgggcagc cggagaacaa 7200
ctacaagacc acgcctcccg tgctggactc cgacggctcc ttcttcctct acagcaagct 7260
caccgtggac aagagcaggt ggcagcaggg gaacgtcttc tcatgctccg tgatgcatga 7320
ggctctgcac aaccactaca cgcagaagag cctctccctg tctccgggta aatgcttcac 7380
gccggagagc acagcgctgc tggagagtgg agtccggaag ccgctcggcg agctctctat 7440
cggagatcgt gttttgagca tgaccgccaa cggacaggcc gtctacagcg aagtgatcct 7500
cttcatggac cgcaacctcg agcagatgca aaactttgtg cagctgcaca cggacggtgg 7560
agcagtgctc acggtgacgc cggctcacct ggttagcgtt tggcagccgg agagccagaa 7620
gctcacgttt gtgtttgcgg atcgcatcga ggagaagaac caggtgctcg tacgggatgt 7680
ggagacgggc gagctgaggc cccagcgagt cgtcaaggtg ggcagtgtgc gcagtaaggg 7740
cgtggtcgcg ccgctgaccc gcgagggcac cattgtggtc aactcggtgg ccgccagttg 7800
ctatgcggtg atcaacagcc agtcgatgga catgcgcgtg cccgcccagc tgctgggcct 7860
gctgctgctg tggttccccg gctcgcgatg cgacatccag atgacccagt ctccatcctc 7920
cctgtctgca tctgtagggg acagagtcac catcacttgt cgggcaagtc agggcatcag 7980
aaattactta gcctggtatc agcaaaaacc agggaaagcc cctaagctcc tgatctatgc 8040
tgcatccact ttgcaatcag gggtcccatc tcggttcagt ggcagtggat ctgggacaga 8100
tttcactctc accatcagca gcctacagcc tgaagatgtt gcaacttatt actgtcaaag 8160
gtataaccgt gcaccgtata cttttggcca ggggaccaag gtggaaatca aacgtacggt 8220
ggctgcacca tctgtcttca tcttcccgcc atctgatgag cagttgaaat ctggaactgc 8280
ctctgttgtg tgcctgctga ataacttcta tcccagagag gccaaagtac agtggaaggt 8340
ggataacgcc ctccaatcgg gtaactccca ggagagtgtc acagagcagg acagcaagga 8400
cagcacctac agcctcagca gcaccctgac gctgagcaaa gcagactacg agaaacacaa 8460
agtctacgcc tgcgaagtca cccatcaggg cctgagctcg cccgtcacaa agagcttcaa 8520
caggggagag tgt 8533
<210>156
<211>447
<212>DNA
<213>人造
<220>
<223>合成构建体:质粒pTT3-HC-C17-sc-LC的部分编码序列。
<400>156
ccgggtaaat gcttcacgcc ggagagcaca gcgctgctgg agagtggagt ccggaagccg 60
ctcggcgagc tctctatcgg agatcgtgtt ttgagcatga ccgccaacgg acaggccgtc 120
tacagcgaag tgatcctctt catggaccgc aacctcgagc agatgcaaaa ctttgtgcag 180
ctgcacacgg acggtggagc agtgctcacg gtgacgccgg ctcacctggt tagcgtttgg 240
cagccggaga gccagaagct cacgtttgtg tttgcggatc gcatcgagga gaagaaccag 300
gtgctcgtac gggatgtgga gacgggcgag ctgaggcccc agcgagtcgt caaggtgggc 360
agtgtgcgca gtaagggcgt ggtcgcgccg ctgacccgcg agggcaccat tgtggtcaac 420
tcggtggccg ccagttgcat ggacatg 447
<210>157
<211>447
<212>DNA
<213>人造
<220>
<223>合成构建体:质粒pTT3-HC-C17-hn-LC的部分编码序列。
<400>157
ccgggtaaat gcttcacgcc ggagagcaca gcgctgctgg agagtggagt ccggaagccg 60
ctcggcgagc tctctatcgg agatcgtgtt ttgagcatga ccgccaacgg acaggccgtc 120
tacagcgaag tgatcctctt catggaccgc aacctcgagc agatgcaaaa ctttgtgcag 180
ctgcacacgg acggtggagc agtgctcacg gtgacgccgg ctcacctggt tagcgtttgg 240
cagccggaga gccagaagct cacgtttgtg tttgcggatc gcatcgagga gaagaaccag 300
gtgctcgtac gggatgtgga gacgggcgag ctgaggcccc agcgagtcgt caaggtgggc 360
agtgtgcgca gtaagggcgt ggtcgcgccg ctgacccgcg agggcaccat tgtggtcaac 420
tcggtggccg cccacaacat ggacatg 447
<210>158
<211>660
<212>DNA
<213>人造
<220>
<223>合成构建体:pTT3-HC-C25-Hint-LC的部分编码序列。
<400>158
ccgggtaaat gcttcacgcc ggagagcaca gcgctgctgg agagtggagt ccggaagccg 60
ctcggcgagc tctctatcgg agatcgtgtt ttgagcatga ccgccaacgg acaggccgtc 120
tacagcgaag tgatcctctt catggaccgc aacctcgagc agatgcaaaa ctttgtgcag 180
ctgcacacgg acggtggagc agtgctcacg gtgacgccgg ctcacctggt tagcgtttgg 240
cagccggaga gccagaagct cacgtttgtg tttgcggatc gcatcgagga gaagaaccag 300
gtgctcgtac gggatgtgga gacgggcgag ctgaggcccc agcgagtcgt caaggtgggc 360
agtgtgcgca gtaagggcgt ggtcgcgccg ctgacccgcg agggcaccat tgtggtcaac 420
tcggtggccg ccagttgcta tgcggtgatc aacagccagt cgctggccca ctggggactg 480
gctcccatgc gcctgctgtc cacgctggag gcgtggctgc ccgccaagga gcagttgcac 540
agttcgccga aggtggtgag ctcggcgcag cagcagaatg gcatccattg gtatgccaat 600
gcgctctaca aggtcaagga ctacgttctg ccgcagagct ggcgccacga tatggacatg 660