包括SORF构建体的多基因表达和使用多蛋白、前体蛋白和蛋白酶解的方法.pdf

上传人:a*** 文档编号:857060 上传时间:2018-03-15 格式:PDF 页数:544 大小:20.10MB
返回 下载 相关 举报
摘要
申请专利号:

CN200680034979.8

申请日:

2006.07.21

公开号:

CN101595228A

公开日:

2009.12.02

当前法律状态:

驳回

有效性:

无权

法律详情:

发明专利申请公布后的驳回IPC(主分类):C12P 21/06申请公布日:20091202|||专利申请权的转移IPC(主分类):C12P 21/06变更事项:申请人变更前权利人:雅培制药有限公司变更后权利人:ABBVIE 公司变更事项:地址变更前权利人:美国伊利诺伊州变更后权利人:美国伊利诺伊州登记生效日:20130624|||实质审查的生效|||公开

IPC分类号:

C12P21/06; C12P21/04; C12N15/00; C07H21/02; C07H21/04

主分类号:

C12P21/06

申请人:

艾博特公司

发明人:

G·R·卡森; W·吉安; J·G·萨尔费尔德; J·古; D·A·雷吉尔; Y·库尼斯

地址:

美国伊利诺伊州

优先权:

2005.7.21 US 60/701,855

专利代理机构:

中国专利代理(香港)有限公司

代理人:

刘 健;李连涛

PDF下载: PDF下载
内容摘要

公开的是有用的构建体和方法,用于蛋白质的表达,使用重组宿主细胞内加工的初级翻译产物。描述了包括单个开放阅读框(sORF)的构建体,用于蛋白质的表达,包括多个多肽的表达。初级翻译产物(前体蛋白或多蛋白)含有多肽,如蛋白内含子或hedgehog家族自体加工结构域,或其变体,框内插入多个目标蛋白亚基之间。初级产物还可以含有裂解序列,如其他蛋白酶解裂解或蛋白酶识别位点,或含有信号肽酶识别序列的信号肽,隔开多个蛋白亚基中的至少两个。可以操纵插入的自体加工多肽或裂解位点的序列来提高分开的多个蛋白亚基的表达效率。还公开了进行蛋白质如免疫球蛋白的有效表达,分泌和/或多亚基装配的独立方面。在多蛋白含有免疫球蛋白重链和轻链片段或能够抗原识别的片段的情况中,在一个实施方案中,可选择的化学计量比为每个重链片段至少两个轻链片段的拷贝,结果是形成了正确折叠和装配的功能抗体的产生。描述了修饰的信号肽,包括来自免疫球蛋白轻链的那些。

权利要求书

1.  用于产生一个或多个重组蛋白产物的包括sORF插入片段的表达载体;所述sORF插入片段包括编码第一个多肽的第一个核酸序列,编码第一个蛋白裂解位点的第一个插入核酸序列,和编码第二个多肽的第二个核酸序列;其中将编码所述第一个蛋白裂解位点的所述插入核酸序列可操纵地置于所述第一个核酸序列和所述第二个核酸序列之间;并且其中所述表达载体能够表达在所述第一个蛋白裂解位点可裂解的sORF多肽。

2.
  权利要求1的表达载体,其中所述第一个蛋白裂解位点包括自我加工裂解位点。

3.
  权利要求1或2的表达载体,其中所述自我加工裂解位点包括蛋白内含子片段或修饰的蛋白内含子片段,其中修饰的蛋白内含子片段允许所述第一个多肽和所述第二个多肽的裂解但不容许所述第一个多肽和所述第二个多肽的完全连接。

4.
  权利要求1或2的表达载体,其中所述自我加工裂解位点包括hedgehog片段或修饰的hedgehog片段,其中修饰的hedgehog片段允许所述第一个多肽与所述第二个多肽的裂解。

5.
  权利要求1-4任一项的表达载体,其中第一个多肽和第二个多肽能够多亚基装配。

6.
  权利要求1-5任一项的表达载体,其中所述第一个多肽和第二个多肽中的至少一个能够胞外分泌。

7.
  权利要求1-6任一项的表达载体,其中所述第一个多肽和第二个多肽中的至少一个是哺乳动物来源的。

8.
  权利要求1-7任一项的表达载体,其中所述第一个多肽和第二个多肽中的至少一个包括免疫球蛋白重链或其功能片段。

9.
  权利要求1-8任一项的表达载体,其中所述第一个多肽和第二个多肽中的至少一个包括免疫球蛋白轻链或其功能片段。

10.
  权利要求1-9任一项的表达载体,其中所述第一个多肽包括免疫球蛋白重链或其功能片段,并且所述第二个多肽包括免疫球蛋白轻链或其功能片段;并且其中所述第一个和第二个多肽是任何次序的。

11.
  权利要求1-10任一项的表达载体,其中所述第一个多肽和第二个多肽合起来能够以多亚基装配来结合,形成功能片段或其他抗原识别分子。

12.
  权利要求1-11任一项的表达载体,其中所述第一个多肽是所述第二个多肽的上游。

13.
  权利要求1-12任一项的表达载体,其中所述第二个多肽是所述第一个多肽的上游。

14.
  权利要求1-13任一项的表达载体,进一步包括编码第三个多肽的第三个核酸序列,其中将所述第三个核酸序列可操纵地置于所述第二个核酸序列之后;并且其中所述第三个序列可以独立地与所述第一个或第二个核酸序列中的任一个相同或不同。

15.
  权利要求14的表达载体,其中所述第一个、第二个和第三个多肽中的至少两个合起来能够以多亚基装配来结合。

16.
  权利要求1-15任一项的表达载体,进一步包括编码第二个蛋白裂解位点的第二个插入核酸序列,其中将所述第二个插入核酸序列可操纵地置于所述第一个和所述第二个核酸序列之后;并且其中所述第二个插入序列可以与所述第一个插入核酸序列相同或不同。

17.
  权利要求1-16任一项的表达载体,进一步包括编码第三个多肽的第三个核酸序列,和编码第二个蛋白裂解位点的第二个插入核酸序列;其中第二个插入核酸序列和第三个核酸序列以该次序可操纵地置于所述第二个核酸序列之后。

18.
  权利要求1-17任一项的表达载体,其中所述第三个核酸序列编码免疫球蛋白重链、轻链或各自的功能片段。

19.
  权利要求14-18任一项的表达载体,其中所述第三个核酸序列编码免疫球蛋白轻链或其功能片段。

20.
  权利要求14-18任一项的表达载体,其中所述第三个核酸序列编码免疫球蛋白重链或其功能片段。

21.
  权利要求1-20任一项的表达载体,其中所述编码第一个蛋白裂解位点的第一个插入核酸序列包括编码信号肽裂解位点或修饰的信号肽裂解位点序列的信号肽核酸。

22.
  权利要求1-21任一项的表达载体,进一步包括编码信号肽裂解位点的信号肽核酸序列,其可操纵地置于所述第一个核酸序列或所述第二个核酸序列之前。

23.
  权利要求1-22任一项的表达载体,进一步包括两个信号肽核酸序列,每个信号肽核酸序列独立地编码信号肽裂解位点,其中将一个信号肽核酸序列可操纵地置于编码所述第一个多肽的所述第一个核酸之前,并将另一个信号肽核酸序列可操纵地置于编码所述第二个多肽的所述第二个核酸之前。

24.
  权利要求21-23任一项的表达载体,其中所述信号肽核酸序列编码免疫球蛋白轻链信号肽裂解位点或修饰的免疫球蛋白轻链信号肽裂解位点。

25.
  权利要求24的表达载体,其中信号肽核酸序列编码修饰的或未修饰的免疫球蛋白轻链信号肽裂解位点,并且其中所述修饰的位点能够实现裂解并提高所述第一个多肽、所述第二个多肽和所述第一个与第二个多肽装配的分子中的至少一个的分泌;并且其中在所述信号肽位点存在下的分泌水平比所述信号肽位点不存在下的分泌水平高约10%至高约100倍。

26.
  权利要求1-3任一项的表达载体,其中所述编码第一个蛋白裂解位点的插入核酸序列包括选自以下的蛋白内含子或修饰的蛋白内含子序列:极端嗜热古菌Pho Pol I序列、酿酒酵母VMA序列、集胞藻株PCC6803DnaE序列、蟾蜍分枝杆菌GyrA序列、古菌种GB-D DNA聚合酶、A-型细菌蛋白内含子样(BIL)结构域和B-型BIL。

27.
  权利要求1-2和4任一项的表达载体,其中所述编码第一个蛋白裂解位点的插入核酸序列包括hedgehog家族成员的C-端自体加工结构域,其中hedgehog家族成员来自果蝇、小鼠、人或其他昆虫或动物物种。

28.
  权利要求1-2和4任一项的表达载体,其中所述编码第一个蛋白裂解位点的插入核酸序列包括来自疣猪、土拨鼠的C-端自体加工结构域,或来自线虫的其他含hog基因,或来自领鞭毛虫的Hoglet结构域。

29.
  权利要求1-28任一项的表达载体,其中所述第一个和所述第二个多肽包括功能抗体或其他抗原识别分子;抗原特异性指引结合选自以下的抗原:肿瘤坏死因子-α、促红细胞生成素受体、RSV、E/L选择素、白细胞介素-1、白细胞介素-12、白细胞介素-13、白细胞介素-18、白细胞介素-23、CXCL-13、GLP-1R和淀粉状蛋白β。

30.
  权利要求1-28任一项的载体,其中第一个和第二个多肽包括来自D2E7、ABT-007、ABT-325、EL246或ABT-874抗体的一对免疫球蛋白链。

31.
  权利要求1-28任一项的载体,其中第一个核第二个多肽各自独立地选自来自D2E7、ABT-007、ABT-325、EL246、ABT-874或其他抗体的类似片段的免疫球蛋白重链或免疫球蛋白轻链片段。

32.
  权利要求1-31任一项的表达载体,其中所述载体进一步包括用于所述sORF插入片段的启动子调控元件。

33.
  根据权利要求32的表达载体,其中所述启动子调控元件是诱导型或组成型的。

34.
  根据权利要求32的表达载体,其中所述启动子调控元件是组织特异性的。

35.
  根据权利要求32的表达载体,其中所述启动子包括腺病毒主要晚期启动子。

36.
  根据权利要求1-35任一项的表达载体,其中所述载体进一步包括编码能够裂解所述第一个蛋白裂解位点的蛋白酶的核酸。

37.
  根据权利要求36的表达载体,其中将所述编码蛋白酶的核酸可操纵地置于所述sORF插入片段内;所述表达载体进一步包括编码第二个裂解位点的其他核酸,该第二个裂解位点位于所述编码蛋白酶的核酸与所述第一个核酸和所述第二个核酸中的至少一个之间。

38.
  包括根据权利要求1-37任一项的载体的宿主细胞。

39.
  根据权利要求38的宿主细胞,其中所述宿主细胞是原核细胞。

40.
  根据权利要求39的宿主细胞,其中所述宿主细胞是大肠杆菌。

41.
  根据权利要求38的宿主细胞,其中所述宿主细胞是真核细胞。

42.
  根据权利要求41的宿主细胞,其中所述真核细胞选自原生动物细胞、动物细胞、植物细胞和真菌细胞。

43.
  根据权利要求42的宿主细胞,其中所述真核细胞是选自哺乳动物细胞、鸟类细胞和昆虫细胞的动物细胞。

44.
  根据权利要求43的宿主细胞,其中所述宿主细胞是CHO细胞或二氢叶酸还原酶缺陷型CHO细胞。

45.
  根据权利要求43的宿主细胞,其中所述宿主细胞是COS细胞。

46.
  根据权利要求42的宿主细胞,其中所述宿主细胞是酵母细胞。

47.
  根据权利要求46的宿主细胞,其中所述酵母细胞是酿酒酵母。

48.
  根据权利要求43的宿主细胞,其中所述宿主细胞是昆虫草地贪夜蛾Sf9细胞。

49.
  根据权利要求43的宿主细胞,其中所述宿主细胞是人胚胎肾脏细胞。

50.
  生产重组多蛋白或多个蛋白的方法,所述方法包括在足以允许载体蛋白表达的条件下在培养基中培养根据权利要求38的宿主细胞。

51.
  权利要求50的方法,所述方法进一步包括收集和/或纯化所述载体蛋白。

52.
  权利要求50-51任一项的方法,其中所述多个蛋白能够多亚基装配。

53.
  权利要求50-52任一项的方法,其中重组多蛋白或多个蛋白是生物上功能性的和/或治疗性的。

54.
  生产免疫球蛋白或其功能片段、装配的抗体或其他抗原识别分子的方法,所述方法包括在足以产生免疫球蛋白或其功能片段、装配的抗体或其他抗原识别分子的条件下在培养基中培养根据权利要求38的宿主细胞。

55.
  根据权利要求50-54任一项的方法产生的蛋白。

56.
  根据权利要求50-55任一项的方法产生的多蛋白。

57.
  根据权利要求50-56任一项的方法产生的装配的免疫球蛋白;装配的其他抗原识别分子;或单独的免疫球蛋白链或其功能片段。

58.
  根据权利要求57的免疫球蛋白;其他抗原识别分子;或单独的免疫球蛋白链或其功能片段,其中存在实现或引起与肿瘤坏死因子-α、促红细胞生成素受体、白细胞介素-18、EL/选择素或白细胞介素-12的特异性抗原结合的能力。

59.
  根据权利要求58的免疫球蛋白或其功能片段,其中免疫球蛋白是D2E7或其中功能片段是D2E7的片段。

60.
  包括根据权利要求55-59任一项的蛋白和药物学上可接受载体的药物组合物。

61.
  权利要求1或2的表达载体,其中所述第一个蛋白裂解位点包括细胞蛋白酶裂解位点或病毒蛋白酶裂解位点。

62.
  根据权利要求1或2的表达载体,其中所述第一个蛋白裂解位点包括由以下物质识别的位点:弗林蛋白酶;IPNV的VP4;烟草蚀刻病毒(TEV)蛋白酶;鼻病毒的3C蛋白酶;PC5/6蛋白酶;PACE蛋白酶,LPC/PC7蛋白酶;肠激酶;因子Xa蛋白酶;凝血酶;genenase I;MMP蛋白酶;芜菁花叶病毒的核内含体蛋白a(N1a);4型登革热黄病毒的NS2B/NS3,黄热病毒的NS3蛋白酶;花椰菜花叶病毒的ORF V;KEX2蛋白酶;CB2;或2A。

63.
  权利要求1或2的表达载体,其中所述第一个蛋白裂解位点是病毒内部可裂解信号肽裂解位点。

64.
  权利要求63的表达载体,其中所述病毒内部可裂解信号肽裂解位点包括来自C型流感病毒、丙肝病毒、汉坦病毒、黄病毒或风疹病毒。

65.
  表达双杂交系统的蛋白质的方法,其中所述双杂交系统包括诱饵蛋白和候选猎物蛋白,所述方法包括以下步骤:提供其中已经引入了编码多蛋白的表达载体的宿主细胞,该多蛋白包括诱饵蛋白部分和候选猎物蛋白部分,所述部分通过自我加工裂解序列、信号肽序列或蛋白酶裂解位点隔开;并且在允许多蛋白表达和多蛋白的自我加工或蛋白酶裂解的条件下培养宿主细胞。

66.
  权利要求65的方法,其中多蛋白进一步包括三杂交系统的可裂解成分。

67.
  根据权利要求1-37和61-64任一项的表达载体,其中所述载体不含有2A序列。

68.
  根据权利要求1或2的表达载体,其中所述第一个蛋白裂解位点包括FMDV 2A序列;或来自其他小核糖核酸病毒科、昆虫病毒、C型轮状病毒、锥体虫或海栖热袍菌(thermatoga maritima)的2A样结构域。

69.
  用于表达重组蛋白的表达载体,其包括多蛋白的编码序列,其中多蛋白包括至少第一个和第二个蛋白片段,其中所述蛋白片段通过其中的蛋白裂解位点隔开,其中蛋白裂解位点包括自我加工肽裂解序列、信号肽裂解序列或蛋白酶裂解序列;并且其中所述编码序列在宿主细胞内是可表达的并且在宿主细胞内是可裂解的。

70.
  权利要求1-37、61-64、67和68任一项的表达载体,其中所述插入核酸序列另外编码标记物。

说明书

包括SORF构建体的多基因表达和使用多蛋白、前体蛋白和蛋白酶解的方法
相关申请的交叉参考
本申请要求2005年7月21日申请的U.S.临时申请No.60/701855的权益,在此以其整体引入作为参考。
联邦政府资助研究或研发的声明
不适用
参照序列表,表格或计算机程序列表光盘附件不适用(提供了序列表,但不是作为光盘附件)。
发明背景
本发明的领域是分子生物学,尤其总地涉及重组蛋白表达领域,特别是重组多蛋白(polyprotein)或前体蛋白(pre-protein)的表达和加工,包括翻译后加工。
近些年来发现抗体作为诊断工具和治疗形态的使用日益增加。第一个FDA批准的单克隆抗体,OKT 3(Johnson and Johnson)批准用于治疗患有肾脏移植排斥的患者。在1998年批准了Herceptin(GenentechInc.的商标,South San Francisco,CA),一种人源化的单克隆抗体,用于治疗患有转移性乳癌的患者。各种基于抗体的治疗正显示出在临床研发的各个阶段中的希望。抗体技术广泛临床应用的一个限制是通常需要大量抗体用于治疗功效并且与充足生产相关的成本是相当大的。中国仓鼠卵巢(CHO)细胞和NS0黑素瘤细胞是最常用的哺乳动物细胞系,用于商业规模生产糖基化人蛋白,如抗体和其他生物治疗剂(Humphreys和Glover 2001.Curr.Opln.Drug Discov.Devel.4:172-85)。哺乳动物细胞系生产通常在分批发酵罐中5-7天培养产生50-250mg/L,或在流加发酵罐中7-12天产生300-600mg/L。可以在酵母或大肠杆菌中成功地生产非糖基化的免疫球蛋白(参见,例如,Humphreys DP等,2000,Protein Expr purify.20(2):252-64),然而,细菌表达系统中的大多数成功是抗体片段(Humphreys,D.P.2003.Curr.Opin.Drug Discov.Devel.20036:188-96)。
表达多个基因片段或基因领域中的重要发展是蛋白内含子的发现(参见,例如,Hirata,R等,1990,J.Biol.Chem.265:6726-6733;Kane,PM等,1990,Science 250:651-657;Xu,M-Q和Perler,FB,1996,EMBO Journal 15(19):5146-5153)。认为蛋白内含子是基因内含子的蛋白等价物并促进蛋白剪接。如Snell K的US7026526中所述的,蛋白剪接是切除前体蛋白(蛋白内含子)的内部片段并连接蛋白(蛋白外显子)的两侧片段形成成熟蛋白的过程。已经在来自原核生物和真核生物的多种蛋白质中观察到该过程(Perler,F.B.,Xu,M.Q.,Paulus,H.Current Opinion in Chemical Biology 1997,1,292-299;Perler,F.B.Nucleic Acids Research 1999,27,346-347)。蛋白内含子单位含有催化蛋白质剪接需要的必需成分并通常含有参与蛋白内含子活动性的核酸内切酶结构域(Perler,F.B.Nucleic Acids Research 1994,22,1127-1127)。
尽管基于蛋白内含子系统的主要焦点在于纯化技术的产生和来自表达基因片段的新融合蛋白,US7026526报道了具有修饰蛋白内含子的DNA构建体,用于表达作为分开蛋白质的多个基因产物来获得植物中的大量性状。然而,仍然缺乏的是那些系统可以成功地用于分开蛋白质表达的显示,所述分开的蛋白装配成功能性多亚基(multimeric)蛋白,胞外分泌的蛋白质,哺乳动物蛋白,或者真核宿主细胞中产生的蛋白。值得注意的是免疫球蛋白落入所有这些类别中。
增加将US7026526的修饰蛋白内含子方法延伸至其他基因或目的的困难是与涉及的蛋白内含子系统相关的所需蛋白外显子基因片段引起的潜在重要性的认识。Paulus报道“实际上,蛋白质剪接,即使完全通过蛋白内含子来催化,可以受到蛋白质外显子序列的显著影响。这种影响通过嵌合蛋白剪接系统表达的事实显现出来,其中将蛋白内含子序列框内插入外源编码序列之间,通常导致实质性的副反应,如剪接连接的上游或下游处的裂解(Xu M-Q等,1993,Cell 75:1371-77;和Shingledecker K等,1998,Gene 207:187-95)。这表明了蛋白内含子呈现蛋白剪接最佳化结构的能力,而在特定蛋白外显子的范围内没有产生副反应。”参见Paulus H,2000,Protein splicing and related formsof protein autoprocessing(蛋白质剪接和相关形式的蛋白质自体加工),Annu.Rev.Biochem.69:447-96。另一名评论员声称:“尽管可能使用合理的设计将所需的特征和活性引入蛋白质中,使工程化的产物有效而可行需要的微妙改变通常仍是超越我们的预测能力(Shao,Z.和Arnold,F.H.1996,Curr.Opin.Struct.Biol.6,513-518)。无论如何,已经发现就在蛋白内含子两侧的片段影响剪接的效率(Chong,S.等,1998,Nucleic Acids Res.26,5109-5115;Southwrth,M.W.等,199,Biotechniques 27,110-114)和一些蛋白宿主可能与蛋白内含子活性不相容。尽管高表达和产物纯度是重要的考虑因素,如果最终产物没有活性,那么它们是没有实际意义的。”参见,Amitai G和Pietrokovski,1999,Nature Biotechnology 17:854-855。
因此,在其中优选结果是裂解而没有再连接的修饰蛋白内含子系统中,相对于给定蛋白内含子序列的外源蛋白外显子的存在影响实践上有效的精确裂解的组合,再连接的不存在和副反应的不存在。清楚修饰蛋白内含子方法适用于保留功能活性的特定蛋白质作为终产物例如免疫球蛋白和其他生物治疗剂的重组生产表示了对创新的实质性挑战。
在本发明中,已经接受了该挑战,不仅用于基于蛋白内含子的系统,而且以先锋的意义研发用于关于hedgehog结构域的应用中。Hedgehog家族中的蛋白质是脊椎动物胚胎模式化必需的胞内信号分子。参见,Mann,R.K.和Beachy,P.A.(2000)Biochim.Biophys.Acta.1529,188-202;Beachy,PA,(1997)Cold Spring Harb Symp Quant Biol62:191-204。天然hedgehog前体蛋白通过与蛋白剪接相似的自体加工反应裂解成C-端(Hh-C)和N-端片段(Hh-N)。对于包括适于多个分开的蛋白片段表达的修饰形式的系统的创造性研发,Hedgehog系统呈现出未经试验的机会。
之前使用单个载体通过重组DNA技术表达全长抗体/免疫球蛋白分子的尝试取得了有限的成功,通常导致抗体/免疫球蛋白分子的重链和轻链显著不同水平的表达,更特别地,对于第二种基因较低水平的表达。其他因素需要与另一条链相比较的一条链相对更高的表达水平,用于适当装配的多亚基抗体或其功能性片段的最佳化生产。因此,一个问题是形成全面低产量的装配的多亚基抗体的细胞内重链和轻链表达的次优化学计算法。Fang等指出为了从单个载体表达高水平的全部生物功能性抗体,需要重链和轻链的等摩尔表达(参见Fang等,2005,Nature Biotechnology 23:584-590;US专利公开2004/0265955A1)。此外,依赖于独立表达多个多肽的载体系统的常规表达系统受到这些因素如启动子相互作用(例如,启动子干扰)的显著影响。这些相互作用可能损害基因的有效表达和/或所表达的链的装配,或需要使用多于一个的载体(参见,例如,US专利6331415,Cabilly等)。由于除了通常需要其他操作以外的潜在复杂化,失去一个或多个单独的载体,需要多个载体是不利的。
限制从单个载体表达两个或多个编码序列能力的其他因素包括载体自身的包装能力。例如,在考虑合适的载体/编码序列中,待考虑的因素包括载体的包装能力(例如,对于腺相关病毒,AAV,大约4,500bp);重组蛋白通过载体转化的细胞或器官体外/体内表达的持续时间(例如,对于腺病毒载体的短期表达);如果使用病毒载体,支持载体有效感染的细胞类型;和所需的基因产物表达水平。两个或多个基因产物的受控表达和病毒载体如腺病毒和AAV的包装限制的需求限制了对于载体构建和用于特定基因如免疫球蛋白或其片段表达的系统的选择。
从单个载体表达两个或多个蛋白质或多肽序列的更多方法中,在目标编码序列之间使用两个或多个启动子或单个启动子和内部核糖体进入位点(IRES)序列来驱动单个编码序列的表达。由于启动子干扰,单个载体内使用两个启动子导致低蛋白表达。当两个编码序列由IRES序列隔开时,第二个编码序列的翻译表达通常显著弱于第一个的(Furler等,2001,Gene Therapy 8:864-873)。US专利公开2004/0241821描述了一种黄病毒,其中将异种编码序列掺入病毒多蛋白编码序列的下游,并通过IRES与其隔开。US专利公开2005/0026137中描述了用于重组基因表达的核锚定载体策略,包括其中片段通过蛋白酶识别位点隔开的融合蛋白。
单个开放阅读框(sORF)中多蛋白形式的蛋白连接是在许多天然病毒包括小核糖核酸病毒科的复制中观察到的策略。翻译时,病毒编码的蛋白酶介导多蛋白的快速分子内(cis)裂解来产生分开的成熟蛋白质产物。口蹄疫病毒(FMDV)是小核糖核酸病毒科内的一组,表达编码大约225kD多蛋白的单个长开放阅读框。全长翻译产物在衣壳蛋白前体(P1-2A)和多蛋白2BC和P3的复制结构域之间产生的2A片段的C-端处经历快速分子内(cis)裂解,并且该裂解是通过核糖体stutter机理由2A片段自身介导的(Ryan等,1991,J.Gen.Virol.72:2727-2732);Vakharia等,198887,J.Virol.61:3199-3207)。已经鉴定出通过FMDV 2A片段表达裂解活性必需的氨基酸残基。还已经从aphthoviridae和小核糖核酸病毒科的cardioviridae表征了2A和相似的结构域(Donnelly等,1997,J.Gen.Virol.78:13-21)。
仍然在使用蛋白酶解处理技术的其他尝试中,重组胰岛素生产的早期描述包括,例如,EP055945(Genentech);和EP037723(The Regentsof the University of California)。然而,这是一个巨大的飞跃,能够在研发更大且更复杂的功能性蛋白如免疫球蛋白的重组表达中应用这些成果。功能性抗体分子的实例可以涉及需要四个或多个链装配的杂多聚体(例如,两个免疫球蛋白重链和两个轻链)。
仍然存在需要可替换的和/或改进的表达系统,用于产生重组蛋白质。在全长免疫球蛋白及其抗原结合片段的有效和/或正确表达的领域中反映出特定的需要,其相对于目前可用的技术提供了优势。本发明通过提供单个构建体解决了这些需要,各自使用各种策略如蛋白内含子,hedgehog自体加工片段,自体催化病毒蛋白酶及其变化来提供单个构建体。独立地,通过调节亚基(例如,其片段的重链和轻链)的化学计算关系解决了有效多亚基(例如,免疫球蛋白)装配的需要。在实施方案中,sORF中的构建体编码自我加工的肽成分,用于表达工业上和生物上的功能性多肽,如酶,免疫球蛋白,细胞因子,趋化因子,受体,激素,两个杂交系统的成分,或其他目标多亚基蛋白。
发明概述
本发明提供了表达盒,载体,重组宿主细胞和用于重组多蛋白和前体蛋白的重组表达和加工的方法,包括翻译后加工。
在一个实施方案中,本发明提供了用于产生一个或多个重组蛋白质产物的包括sORF插入片段的表达载体;所述sORF插入片段包括编码第一个多肽的第一个核酸序列,编码第一个蛋白裂解位点的干扰核酸序列和编码第二个多肽的第二个核酸序列;其中编码所述第一个蛋白裂解位点的所述干扰核酸序列可操纵地位于所述第一个核酸序列和所述第二个核酸序列之间;和其中所述表达载体能够表达在所述第一个蛋白裂解位点可裂解的sORF多肽。在一个实施方案中,第一个裂解位点包括自我加工裂解位点。在一个实施方案中,自我加工裂解位点包括蛋白内含子片段或修饰的蛋白内含子片段,其中修饰的(或未修饰的)蛋白内含子片段允许所表达的第一个多肽和所表达的第二个多肽的裂解但不允许所表达的第一个多肽和所表达的第二个多肽的完全连接。在一个实施方案,自我加工裂解位点包括hedgehog片段或修饰的hedgehog片段,其中修饰的(或未修饰的)hedgehog片段允许所表达的第一个多肽和所表达的第二个多肽的裂解。在一个实施方案中,表达多个分开的蛋白质(例如,第一个多肽,第二个多肽,第三个多肽等)。在一个实施方案中,第一个多肽和第二个多肽能够多亚基装配。在一个实施方案中,所述第一个多肽和第二个多肽中的至少一个是哺乳动物来源的。在一个实施方案中,提供了产生装配的抗体的载体和方法。
在实施方案中,本发明提供了用于多个分开的蛋白质重组表达的构建体和方法。在特别的实施方案中,蛋白质能够胞外分泌。在特定的实施方案中,蛋白质是哺乳动物来源的。在特别的实施方案中,蛋白质能够多亚基装配。在特别的实施方案中,蛋白质是免疫球蛋白。
在一个实施方案中,引入蛋白酶识别位点,可裂解的信号肽或自体加工多肽序列(包括来自果蝇,小鼠,人和其他物种的蛋白内含子,hedgehog的C-端自体加工结构域(Dassa等,Trends in Genetics,Vol.20No.11 Nov,2004,538-542;Ibrahim等,Biochimica et Biophysics Acta1760(2006)347-355)。我们注意到在一些情况中,自体加工多肽序列可以称为与蛋白酶解处理有关的蛋白酶解位点。使用疣猪,土拨鼠的C-端自体加工结构域,和来自线虫如秀丽隐杆线虫(Caenorhabditiselegans)的其他含hog基因(Snell EA等,Proc.R.Soc.B(2006)273,401-407;Aspock等,Genome Reseach,1999,9:909-923);和来自领鞭毛虫(choanoflagellate)的Hoglet-C自体加工结构域(Aspock等,Genome Research,1999,9:909-923)。A-型细菌蛋白内含子样(BIL)结构域如来自细菌如热纤梭菌(Clostridium thermocellum)的那些,和来自细菌如球形红细菌(Rhodobacter sphaeroides)的B-型BIL结构域(Dassa等,Journal of Biological Chemistry,Vol.279,No.31,July 30,32001-32007),野生型,平截的,或其他修饰形式)进入重组前体蛋白序列中允许前体蛋白的有效表达和裂解,使得生物活性蛋白释放或使得多蛋白内表达的所需蛋白释放。该实施方案消除了前体蛋白的天然蛋白酶解处理酶的共表达的需要。或者,与特定识别位点同源的蛋白酶可以与前体蛋白序列共生(coextensively)表达,在蛋白酶识别位点之间,使得可以通过蛋白酶解作用释放蛋白酶,然后通过随后的蛋白酶解裂解释放前体蛋白的前体部分,使得释放前体蛋白的活性部分。再一个实施方案中,可以将2A自体蛋白酶解处理肽序列工程化至成熟(生物活性)部分和前体蛋白之间的前体蛋白中,使得表达后工程化的重组蛋白自我加工。
在本发明的另一个实施方案中,本发明通过重组表达包括至少一个重链片段和至少一个轻链片段的多蛋白,提供了用于有效表达重组免疫球蛋白分子的方法,其中通过一个或多个介导多肽,hedgehog序列,其他蛋白内含子样或hedgehog样自体加工序列或其变化的裂解但不连接的蛋白酶识别位点,信号肽,蛋白内含子序列,或通过序列如在翻译过程中隔开两侧肽的2A肽隔开所述片段。再一实施方案中,可以作为多蛋白的一部分表达蛋白酶,通过蛋白酶识别位点从多蛋白的剩余物中分离出来,并且其中每个蛋白酶识别位点与伴随表达的蛋白酶同源。然后,蛋白酶解或信号肽酶作用从初级翻译产物释放蛋白酶和其他单个蛋白质。上述用于隔开多蛋白中蛋白亚基的方法也可以结合使用来获得所需的裂解和蛋白质表达结果。
在免疫球蛋白表达实施方案的情况中,轻链编码片段的复制允许提高的装配和/或完整免疫球蛋白分子的表达,超过其中表达盒中存在轻链编码片段和/或表达载体与重链编码片段1∶1比例的情况。在本发明的范围中,重链和轻链蛋白可以是天然产生的重链和轻链的功能性片段(功能性片段保持结合其对应抗体链的能力,并且还保持结合同源抗原的能力,如本领域公知的)。因此,本发明提供了构建体和方法,其中轻链组分与重链组分的编码片段比例为1∶1或高于1∶1。例如,在一个实施方案中,L:H比例是2∶1或高于2∶1;在其他实施方案中,比例为3∶1、3∶2、4∶1或高于4∶1。
在本发明的优选方面中,轻链免疫球蛋白编码序列或其组成片段在多蛋白编码序列内复制,并且重链和轻链免疫球蛋白编码序列以约2个轻链比约一个重链的摩尔比存在,并以高于1∶1轻链:重链的比例表达。轻链和重链在多蛋白中通过蛋白酶裂解位点,信号(或前导)肽,蛋白内含子或自我加工位点连接。
用于在多蛋白翻译产物及其识别序列内隔开生物活性蛋白组分的蛋白酶(内蛋白酶)和信号肽酶及其识别位点的氨基酸序列包括,但不限于,弗林蛋白酶(furin),RXR/K-R(SEQ ID NO:1);IPNV的VP4,S/TXA-S/AG(SEQ ID NO:2);烟草蚀刻病毒(Tobacco etch virus)(TEV)蛋白酶,EXXYXQ-G(SEQ ID NO:3);鼻病毒的3C蛋白酶,LEVLFQ-GP(SEQ ID NO:4);PC5/6蛋白酶;PACE蛋白酶,LPC/PC7蛋白酶;肠激酶,DDDDK-X(SEQ ID NO:5);因子Xa蛋白酶,IE/DGR-X(SEQ ID NO:6);凝血酶,LVPR-GS(SEQ ID NO:7);genenase I,PGAAH-Y(SEQ ID NO:8);和MMP蛋白酶;芜菁花叶病毒(turnipmosaic potyvirus)的核内含体蛋白a(Nla);4型登革热(DEN4)黄病毒的NS2B/NS3,黄热病毒(YFV)的NS3蛋白酶;花椰菜花叶病毒(cauliflower mosaic virus)的ORF V;和KEX2蛋白酶,MYKR-EAD(SEQ ID)。另一种内部裂解位点选择是CB2。用连字符显示识别序列内发生裂解的位置。
在一个实施方案中,所用的信号序列是野生型的,突变的或随机突变的并通过使用本领域已知技术的筛选来选择。
上述本发明范围内还有表达盒,其中特定的多蛋白或前体蛋白(前体蛋白,多蛋白)编码序列可操纵地连接转录调控序列,表达载体和含有表达载体或表达盒的重组宿主细胞。
本发明提供了用于表达全长免疫球蛋白或其片段的系统,基于在单个启动子的转录控制下重链和轻链编码序列的表达,其中通过蛋白内含子或修饰的蛋白内含子(其裂解但不连接释放的蛋白分子,或可以修饰抗体或其他侧翼蛋白序列,使得防止蛋白的连接),或通过来自果蝇,小鼠,人和其他物种的hedgehog的C-端自体加工结构域,或通过来自疣猪,土拨鼠的C-端自体加工结构域和线虫如秀丽隐杆线虫的含hog基因介导的重链和轻链的隔开。Hoglet-C自体加工结构域来自领鞭毛虫,或通过A-型细菌蛋白内含子样(BIL)结构域如来自细菌如热纤梭菌的那些,和来自细菌如球形红细菌的B-型BIL结构域。用于本发明中的蛋白内含子包括,但不限于酿酒酵母(Saccharomycescerevisiae)VMA,古菌(Pyrococcus),集胞藻(Synechocystis)和其他本领域已知的蛋白内含子。还可以通过自我加工裂解位点,例如,2A或2A样序列来介导重链和轻链的隔开。
在一个方面中,本发明提供了用于表达重组免疫球蛋白的载体,其包括可操纵地连接用于免疫球蛋白分子第一链或其片段的编码序列,编码自我加工裂解位点的序列和用于免疫球蛋白分子第二链或其片段的编码序列的启动子,其中将编码自我加工裂解位点的序列插入用于免疫球蛋白分子第一链的编码序列和用于免疫球蛋白分子第二链的编码序列之间。免疫球蛋白分子的第一或第二链中的任一个可以是重链或轻链,并且编码重组免疫球蛋白的序列可以是全长编码序列或其片段。对应于轻链的第二个片段通过蛋白酶识别位点,信号肽或自我加工位点如2A位点与邻近的片段隔开。存在两个轻链序列的拷贝和H链序列的一个拷贝(或各自的多个拷贝),附带条件是每个抗体链成分具有合适的加工位点或与其相关的序列,只要产生正确加工的抗体链。
载体可以是任何能够表达全长多肽例如免疫球蛋白分子或其片段的重组载体,例如,质粒载体,尤其是适用于哺乳动物细胞中基因表达的载体,用于在昆虫细胞中表达的杆状病毒载体,腺相关病毒(AAV)载体,慢病毒载体,逆转录病毒载体,可复制型腺病毒载体,复制缺陷型腺病毒载体和gutless腺病毒载体,肝炎病毒载体或非病毒载体(质粒)。
自我加工裂解位点包括2A肽序列,例如,源自口蹄疫病毒(FMDV)的2A序列。再一优选的方面中,载体包括编码位于免疫球蛋白分子第一链或其片段的编码序列和免疫球蛋白分子第二链或其片段的编码序列之间(即,邻接自我加工裂解位点如2A裂解位点的序列)并且还邻接第二个轻链序列的其他蛋白裂解位点的序列。在一个示例性的方法中,其他的蛋白酶解裂解位点是具有一致序列RXK/R-R(SEQ ID NO:1)的弗林蛋白酶裂解位点。使用自我加工肽的重组免疫球蛋白的载体包括任一种启动子,其中启动子是组成型的,可调控或可诱导的,细胞类型特异性的,组织特异性的或物种特异性的。载体可以进一步包括编码免疫球蛋白链,前体蛋白等的一个或多个编码序列的信号序列的序列。
本发明进一步提供了用载体感染的宿主细胞或宿主细胞的稳定克隆,该载体包括编码免疫球蛋白(即抗体)重链和轻链的序列;编码自我加工裂解位点的序列;并可以进一步包括编码其他蛋白酶解位点的序列,和任选通过自我加工位点或蛋白酶识别位点将蛋白酶编码片段与剩余的编码序列相似地隔开。本发明范围内还包括这样的细胞或克隆在产生全长重组免疫球蛋白或其片段的用途。合适的宿主细胞包括,但不限于,昆虫培养的细胞,如草地贪夜蛾(Spodoptera frugiperda)细胞,微生物,包括细菌,酵母细胞,如酿酒酵母或甲醇酵母(Pichiapastoris),真菌如里氏木霉(Trichoderma reesei),曲霉属(Aspergillus),Aureobasidum和青霉属种,以及哺乳动物细胞如中国仓鼠卵巢(例如,CHO-K1,ATCC CCL 61;CHO DG44;Chasin等,1986,Som.Cell.Molec.Genet.12:555),幼仓鼠肾脏(BHK-21,BHK-570,ATCC CRL 8544,ATCC CRL 10314),COS,小鼠胚胎(NIH-3T3,ATCC CRL 1658),Vero细胞(非洲绿猴肾脏,以ATCC CRL 1587获得),犬肾脏细胞(例如,MDCK,ATCC CCL 34),大鼠垂体细胞(GH1,ATCC CCL 34),特定的人细胞系,包括人胚胎肾脏细胞(例如,HEK293,ATCC CRL1573),也可以使用各种转基因动物系统,包括但不限于,猪,小鼠,大鼠,绵羊,奶牛。用于在蛋清中表达的小鸡系统和用于在奶中表达的转基因绵羊,山羊和奶牛系统是已知的。植物细胞也适于用作宿主细胞。
在相关的方面中,本发明提供了通过这样的细胞或克隆产生的重组免疫球蛋白分子或其片段及其生产方法,其中免疫球蛋白包括源自自我加工裂解位点,信号肽,蛋白内含子,含hog C-端自体加工基因,细菌蛋白内含子样(BIL)结构域或蛋白酶识别序列的氨基酸。在使用蛋白内含子的情况中,优选修饰的蛋白内含子,使得两个抗体链没有剪接在一起形成单个多肽链或抗体多肽的末端,使得它们不能通过蛋白内含子剪接在一起。将蛋白内含子作为框内融合体置于N-蛋白外显子和C-蛋白外显子之间,例如,在免疫球蛋白重链和免疫球蛋白轻链之间,附带条件是蛋白内含子和/或多蛋白初级翻译产物的连接最接近的氨基酸序列导致裂解来释放蛋白外显子,但是没有产生这些蛋白外显子蛋白的连接。
本发明进一步提供了使用位于第一个表达的蛋白部分和第二个蛋白部分之间的hedgehog蛋白加工结构域的翻译后蛋白加工策略。任选可以将hedgehog蛋白加工结构域(Hh-C)截断来删除胆固醇转移部分,使得只发生蛋白裂解。在没有发生Hh-C完全切除的情况中,在第二个蛋白部分的N-端包括信号肽结构域可以允许成熟的第二个蛋白与Hh-C/第一个蛋白部分的蛋白酶解隔开。非天然产生的重组DNA分子也包括在本发明这个方面的范围内,该分子包括编码多蛋白的序列,该多蛋白包括置于第一个表达的蛋白部分编码序列和第二个蛋白部分编码序列之间的hedgehog蛋白加工结构域,使得通过从单个信号翻译来产生多蛋白。
本发明另外一个发面是修饰的弗林蛋白酶,其特征在于将靶向新合成的弗林蛋白酶蛋白的肽片段添加至内质网的内腔。还包括蛋白内含子或修饰的蛋白内含子策略,如在此所列的。
本发明的另一个方面是将多蛋白/自我加工,蛋白内含子加工,信号肽裂解或蛋白酶解裂解方法应用至双杂交和三杂交(和变体)技术。第一个和第二个或第一个,第二个和第三个蛋白在合适的宿主细胞中作为多蛋白从单个转录产物表达,并且通过自我加工位点(例如,2A),蛋白内含子,信号肽或通过蛋白酶识别位点隔开这些蛋白的编码序列。该策略消除了与多于一个载体共转染或通过表达单个转录产物的每个蛋白的需要,因为可以方便地进行,使用本发明的结果是存在提高的经济,有效性和蛋白表达,以及可能的结合在相互的近端内,认为这提高了相互相关的结合伴侣的可能性。在特定的实施方案中,多蛋白包括诱饵蛋白,和自我加工,蛋白内含子,信号肽或蛋白酶识别序列和插入的cDNA片段,其表示一个或多个与目标诱饵蛋白相互作用的潜在猎物蛋白。图8和9中以图解显示了这种克隆和表达策略。
在一个实施方案中,本发明提供了用于在细胞中表达多个基因产物的DNA构建体,包括在构建体5’端的单个启动子,包括两个或多个编码隔开蛋白的蛋白外显子序列的含蛋白内含子单体,和一个或多个与每个蛋白外显子序列的羧基端编码部分融合的蛋白内含子序列,除了最后一个待表达的蛋白外显子序列;和3’端序列,包括最后一个蛋白外显子蛋白编码序列后的多腺苷酸化信号;其中作为前体蛋白表达含蛋白内含子的单体,该前体蛋白含有至少一个两侧为蛋白外显子编码的蛋白的蛋白内含子;其中至少一个蛋白内含子可以催化蛋白外显子的切除;并优选,含蛋白内含子单体中其中至少一个氨基酸残基得到置换,或将至少一个氨基酸残基添加至含蛋白内含子单体,使得切除的蛋白外显子没有通过蛋白内含子连接。在特定的实施方案中,构造构建体,其中至少两个蛋白外显子序列,作为蛋白质表达时,能够以多亚基装配相连。在一个实施方案中,至少两个蛋白外显子序列能够编码免疫球蛋白或其他抗原识别分子。在一个实施方案中,至少一个蛋白外显子序列,作为蛋白质表达时,能够胞外分泌。在一个实施方案中,至少一个蛋白外显子序列是哺乳动物基因。
在实施方案中,本发明提供了使用修饰或非修饰的蛋白内含子表达免疫球蛋白的构建体和方法,其中表达的免疫球蛋白片段没有再连接/融合,因此允许从多个亚基产生装配的抗体。在特定的实施方案中,修饰的蛋白内含子包括位于C-蛋白外显子第一个位置的氨基酸残基的改变。在特定的实施方案中,在蛋白内含子片段内的第二个至最后一个氨基酸存在改变。
在实施方案中,本发明提供了用于任何基因或基因组合表达的构建体和方法。在特定的实施方案中,C-蛋白外显子是修饰的。再一特定的实施方案中,C-蛋白外显子是使用信号序列修饰的。另一特定实施方案中,存在末端C-蛋白外显子组分的缺失。
在实施方案中,本发明提供了用于抗体基因表达的构建体和方法,使用用于免疫球蛋白第二个链(重链或轻链)的修饰信号肽,并且如果使用第三个,将其置于蛋白内含子或hedgehog自体加工结构域后。在一个实施方案中,片段的次序如下:第一个链-第一个蛋白内含子或hedgehog-第一个修饰的信号肽-第二个链-第二个修饰的信号肽-第三个链(在两个链的情况中,例如,省略第三个链或“第二个修饰的信号肽-第三个链”片段)。在另一个实施方案中,在第二个链之后包括第二个蛋白内含子或hedgehog片段。在特定的实施方案中,使用这样的修饰信号肽产生提高的抗体分泌。在一个实施方案中,修饰所用的信号肽来降低疏水性。在一个实施方案中,信号肽是未修饰的。
在实施方案中,提供sORF载体用于瞬时表达。在其他实施方案中,在稳定的表达系统中提供sORF载体。在一个实施方案中,按照本领域已知的,例如,通过转染和其他技术,生产稳定的宿主细胞。
尽管在此特意公开了许多示例构建体用于肿瘤坏死因子α(alpha)特异性抗体的表达,应当理解可以使用相同的策略容易地制备构建体,使用编码其他蛋白的序列的置换。特定实施例包括其他免疫球蛋白和生物治疗分子。更多特定的实施例包括E/L选择素、白细胞介素-12、白细胞介素-18或促红细胞生成素特异性的抗体,或本领域可用氨基酸序列和/或编码序列所需特异性的任何其他抗体。
在一个实施方案中,本发明提供了用于产生一个或多个重组蛋白产物的包括sORF插入片段的表达载体;所述sORF插入片段包括编码第一个多肽的第一个核酸序列,编码第一个蛋白裂解位点的第一个插入核酸序列,和编码第二个多肽的第二个核酸序列;其中将编码所述第一个蛋白裂解位点的所述插入核酸序列可操纵地置于所述第一个核酸序列和所述第一个核酸序列之间;并且其中所述表达载体能够表达在所述第一个蛋白裂解位点可裂解的sORF多肽。在一个实施方案中,所述第一个蛋白裂解位点包括自我加工裂解位点。
在一个实施方案中,自我加工裂解位点包括蛋白内含子片段或修饰的蛋白内含子片段,其中修饰的蛋白内含子片段允许所述第一个多肽和所述第二个多肽的裂解但不容许所述第一个多肽和所述第二个多肽的完全连接。在一个实施方案,自我加工裂解位点包括hedgehog片段或修饰的hedgehog片段,其中修饰的hedgehog片段允许所述第一个多肽和所述第二个多肽的裂解。在一个实施方案中,第一个多肽和第二个多肽能够多亚基装配。在一个实施方案中,所述第一个多肽和第二个多肽中的至少一个能够胞外分泌。在一个实施方案中,所述第一个多肽和第二个多肽中的至少一个是哺乳动物来源的。
在一个实施方案中,所述第一个多肽和第二个多肽中的至少一个包括免疫球蛋白重链或其功能片段。在一个实施方案中,所述第一个多肽和第二个多肽中的至少一个包括免疫球蛋白轻链及其功能片段。在一个实施方案中,所述第一个多肽包括免疫球蛋白重链或其功能片段和所述第一个多肽包括免疫球蛋白轻链或其功能片段;并且其中所述第一个和第二个多肽合在一起能够以多亚基装配结合来形成功能性抗体或其他抗原识别分子。
在一个实施方案中,所述第一个多肽是所述第二个多肽的上游。在一个实施方案中,所述第二个多肽是所述第一个多肽的上游。
在一个实施方案中,表达载体进一步包括编码第三个多肽的第三个核酸序列,其中将所述第三个核酸序列可操纵地置于所述第二个核酸序列之后;并且其中所述第三个序列可以独立地与所述第一个或第二个核酸序列中的任一个相同或不同。在一个实施方案中,所述第一个,第二个和第三个多肽中的至少两个合在一起能够以多亚基装配结合。
在一个实施方案中,表达载体进一步包括编码第二个蛋白裂解位点的第二个插入核酸序列,其中将所述第二个插入核酸序列可操纵地置于所述第一个和所述第二个核酸序列之后;并且其中所述第二个干预序列可以与所述第二个插入核酸序列相同或不同。在一个实施方案中,表达载体进一步包括编码第三个多肽的第三个核酸序列,和编码第二个多肽裂解位点的第二个插入核酸序列;其中将第二个插入核酸序列和第三个核酸序列以该次序可操纵地置于所述第二个核酸序列之后。在一个实施方案中,所述第三个核酸序列编码免疫球蛋白重链,轻链或其代表性的功能片段。在一个实施方案中,所述第三个核酸序列编码免疫球蛋白或其功能片段。在一个实施方案中,所述第三个核酸序列编码免疫球蛋白或其功能片段。
在表达载体的一个实施方案中,所述编码第一个蛋白裂解位点的所述第一个插入核酸序列包括编码信号肽裂解位点或修饰的信号肽裂解位点序列的信号肽核酸。在一个实施方案中,表达载体进一步包括编码信号肽裂解位点的信号肽核酸序列,可操纵地置于所述第一个核酸序列或所述第二个核酸序列之前。
在一个实施方案中,表达载体进一步包括两个信号肽核酸序列,每个独立地编码信号肽裂解位点,其中将一个信号肽核酸序列可操纵地置于编码所述第一个多肽的所述第一个核酸之前,并将连一个信号肽核酸序列可操纵地置于编码所述第二个多肽的所述第二个核酸之前。在实施方案中,两个信号肽序列是相同或不同的。
在一个实施方案中,信号肽核酸序列编码免疫球蛋白轻链信号肽裂解位点或修饰的免疫球蛋白轻链信号肽裂解位点。在一个实施方案中,信号肽核酸序列编码修饰的或未修饰的免疫球蛋白轻链信号肽裂解位点,并且其中所述修饰的位点能够实现裂解并提高所述第一个多肽,所述第二个多肽和所述第一个和第二个多肽的装配分子中至少一个的分泌;并且其中在所述信号肽位点存在下的分泌水平比所述信号肽位点不存在下的分泌水平高约10%至高约100倍。
在一个实施方案中,编码第一个蛋白裂解位点的插入核酸序列包括蛋白内含子或修饰的蛋白内含子序列选自:极端嗜热古菌(Pyrococcus horikoshii)Pho Pol I序列,酿酒酵母(saccharomycescerevisiae)VMA序列,集胞藻(Synechocystis)株PCC6803DnaE序列,蟾蜍分枝杆菌(Mycobacterium xenopi)GyrA序列,古菌(Pyrococcus)种GB-D DNA聚合酶,A型细菌蛋白内含子样(BIL)结构域和B-型BIL。
在一个实施方案中,编码第一个蛋白裂解位点的插入核酸序列包括hedgehog家族成员的C-端自体加工结构域,其中hedgehog家族成员来自果蝇,小鼠,人或其他昆虫或动物物种。在一个实施方案中,编码第一个蛋白裂解位点的插入核酸序列包括来自疣猪,土拨鼠的C-端自体加工结构域,或来自线虫的其他含hog基因,或来自领鞭毛虫的Hoglet结构域。
在一个实施方案中,第一个和所述第二个多肽包括功能性抗体或其他抗原识别分子;抗原特异性指导结合选自以下的抗原:肿瘤坏死因子-α,促红细胞生成素受体,RSV,EL/选择素,白细胞介素-1,白细胞介素-12,白细胞介素-13,白细胞介素-18,白细胞介素-23,CXCL-13,GLP-1R和淀粉状蛋白β。在一个实施方案中,第一个和第二个多肽包括一对来自D2E7,ABT-007,ABT-325,EL246或ABT-874抗体的免疫球蛋白链。在一个实施方案中,第一个和第二个多肽各自独立地选自来自D2E7,ABT-007,ABT-325,EL246,ABT-874或其他抗体的类似片段的免疫球蛋白重链或免疫球蛋白轻链。
在一个实施方案中,载体进一步包括用于所述sORF插入片段的启动子调控元件。在一个实施方案中,所述启动子调控元件是诱导型或组成型的。在一个实施方案中,所述启动子调控元件是组织特异性的。在一个实施方案中,所述启动子包括限病毒主要晚期启动子。
在一个实施方案中,载体进一步包括编码能够裂解所述第一个蛋白裂解位点的蛋白酶的核酸。在一个实施方案中,将编码蛋白酶的所述核酸可操纵地置于所述sORF插入片段内;所述表达载体进一步包括编码位于编码蛋白酶的所述核酸与所述第一个核酸和所述第二个核酸中至少一个之间的第二个裂解位点的其他核酸。
在一个实施方案中,本发明提供了包括在此所述载体的宿主细胞。在一个实施方案中,宿主细胞是原核细胞。在一个实施方案中,所述宿主细胞是大肠杆菌。在一个实施方案中,所述宿主细胞是真核细胞。在一个实施方案中,所述真核细胞选自原生动物细胞,动物细胞,植物细胞和真菌细胞。在一个实施方案中,所述真核细胞是选自哺乳动物细胞,鸟类细胞和昆虫细胞的动物细胞。在优选的实施方案中,所述宿主细胞是CHO细胞或二氢叶酸还原酶缺陷CHO细胞。在一个实施方案中,所述宿主细胞是COS细胞。在一个实施方案中,所述宿主细胞是酵母细胞。在一个实施方案中,所述酵母细胞是酿酒酵母。在一个实施方案中,所述宿主细胞是昆虫草地贪夜蛾Sf9细胞。在一个实施方案中,所述宿主细胞是人胚胎肾脏细胞。
在一个实施方案中,本发明提供了用于生产重组多蛋白或多个蛋白的方法,包括在足以使载体蛋白表达的条件下在培养基中培养宿主细胞。在一个实施方案中,该方法进一步包括收集和/或纯化所述载体蛋白。在一个实施方案中,所述多个蛋白能够多亚基装配。在一个实施方案中,重组多蛋白或多个蛋白在生物上是功能性的和/或治疗性的。
在一个实施方案中,本发明提供了生产免疫球蛋白或其功能片段,装配的抗体或其他抗原识别分子的方法,包括在足以产生免疫蛋白或其功能片段,装配的抗体,或其他抗原识别分子的条件下在培养基中培养根据权利要求38的宿主细胞。
在一个实施方案中,本发明提供了根据在此的方法产生的蛋白或多蛋白。在一个实施方案中,本发明提供了根据在此的方法产生的装配的免疫球蛋白;装配的其他抗原识别分子;或单个免疫球蛋白链或其功能片段。在一个实施方案中,免疫球蛋白;其他抗原识别分子;或单个免疫球蛋白链或其功能片段具有实现或促进特定的抗原结合肿瘤坏死因子-α,促红细胞生成素受体,白细胞介素-18,EL/选择素或白细胞介素-12的能力。在一个实施方案中,免疫球蛋白是D2E7或其中功能片段是D2E7的片段。
在一个实施方案中,本发明提供了包括蛋白质和药物学上可接受载体的药物组合物或药物。按照本领域公知的选择用于药物制剂的赋形剂和载体。
在一个实施方案中,本发明提供了表达载体,其中第一个蛋白裂解位点包括细胞蛋白酶裂解位点或病毒蛋白酶裂解位点。在一个实施方案中,所述第一个蛋白裂解位点包括由以下蛋白酶识别的位点:弗林蛋白酶;IPNV的VP4;烟草蚀刻病毒(TEV)蛋白酶;鼻病毒的3C蛋白酶;PC5/6蛋白酶;PACE蛋白酶,LPC/PC7蛋白酶;肠激酶;因子Xa蛋白酶;凝血酶;genenase I;MMP蛋白酶;芜菁花叶病毒的核内含体蛋白a(Nla);4型登革热黄病毒的NS2B/NS3,黄热病毒的NS3蛋白酶;花椰菜花叶病毒的ORF V;KEX2蛋白酶;CB2;或2A。在一个实施方案中,所述第一个蛋白裂解位点是病毒内部可裂解信号肽裂解位点。在一个实施方案中,所述病毒内部可裂解信号肽裂解位点包括来自C型流感病毒,丙肝病毒,汉坦病毒,黄病毒或风疹病毒的位点。
在一个实施方案中,本发明提供了用于双杂交系统蛋白表达的方法,其中所述双杂交系统包括诱饵蛋白和候选猎物蛋白,所述方法包括以下步骤:提供其中已经引入编码多蛋白的表达载体的宿主细胞,该多蛋白包括诱饵蛋白部分和候选猎物蛋白部分,通过自我加工裂解序列,信号肽序列或蛋白酶裂解序列来隔开所述部分;在允许多肽和多肽的自我加工或蛋白酶裂解表达的条件下培养宿主细胞。在一个实施方案中,多蛋白进一步包括三杂交系统的可裂解组分。
在一个实施方案中,表达载体不含有2A序列。在一个实施方案中,提供了表达载体,其中所述第一个蛋白裂解位点包括FMDV 2A序列;来自其他小核糖核酸病毒科,昆虫病毒,C型轮状病毒,锥体虫或海栖热袍菌(thermatoga maritima)的2A样结构域。
在一个实施方案中,本发明提供了用于表达重组蛋白的表达载体,包括多蛋白的编码序列,其中多蛋白包括至少第一个和第二个蛋白片段,其中通过蛋白裂解位点隔开所述蛋白片段,其中蛋白裂解位点包括自我加工肽裂解序列,信号肽裂解序列或蛋白酶裂解序列;并且其中所述编码序列在宿主细胞中是可表达的并且在宿主细胞内得到裂解。
在一个实施方案中,本发明提供了表达载体,其中插入核酸序列另外编码标记物。
结合附图时,将从本发明以下为公开目的而提供的描述中清楚本发明的其他方面,特征和优势。
通常,在此所用的术语和短语具有本领域已知的意思,可以通过参考本领域技术人员已知的标准教科书,杂志参考和内容来找到。在此提供的定义用来明确它们在本发明范围内的特定用途。
不希望受到任何特定理论的束缚,在此存在与本发明相关的基础原理或机理的看法或理解的讨论。认识到与任何解释或假设的最终正确性无关,无论如何,本发明的实施方案是可操作的和有用的。

附图简述
图1说明了优选的稳定sORF表达载体构建体。
图2说明了优选的稳定sORF表达载体构建体,进一步包括编码第二个蛋白裂解位点(其可以是自体加工位点)的另外的(第二个)干预核酸和编码第三个多肽的第三个核酸。这样的载体能够表达多于两个多肽。
图3说明了优选的瞬时sORF表达载体构建体,(例如,pTT3-HC-Ssp-GA-int-LC-0aa)。
图4说明了含有用于双杂交系统的2A片段的表达载体。将表达载体结构化来作为GAL4::诱饵::2A肽融合体翻译第一个诱饵蛋白,其在2A肽翻译后自我加工。
图5是图4质粒(带有2A裂解的2-杂交系统)表达片段的扩大的线性图。
图6说明了用于免疫球蛋白表达的基于蛋白内含子的sORF载体。
图7说明了用于装配多亚基分子如抗体表达的具有选定点突变的几个sORF构建体。
图8说明了具有改变的信号肽的sORF构建体,例如,修饰的免疫球蛋白轻链信号肽。
图9说明了使用hedgehog自我加工结构域的sORF构建体。
发明详述
可以通过以下的描述和非限制性实施例来进一步理解本发明。
本发明提供了用于表达结构或生物活性蛋白如酶,激素(例如,胰岛素),细胞因子,趋化因子,受体,抗体或其他分子的系统,例如,构建体和方法。优选,蛋白质是免疫调节蛋白,如白细胞介素,全长免疫球蛋白,其片段,其他抗原识别分子,如本领域所知的,或其他生物治疗分子。这样系统的综述是基于单个启动子转录控制下的重链和轻链编码序列的表达,其中单个翻译产物(多肽)转化成分开的重链和轻链是通过翻译过程中核糖体处的蛋白内含子,含-hog自我加工结构域,隔开侧翼肽的2A或2A-样序列来介导的或是位于成熟生物活性蛋白的两条链之间的一个或多个蛋白酶识别序列处的蛋白酶解加工的结果。
干预位点(不管是与蛋白内含子片段,hog结构域,2A或2A-样相关,还是与蛋白酶识别位点相关,以及各自的变化)可以称为裂解位点。在表达三个或多个蛋白片段的情况中,这样的裂解位点可以位于多个片段的至少任意两个之间,或裂解位点可以位于每个片段之后,任选并优选不在最后一个片段之后。如果使用多个裂解位点,每一个可以与另一个相同或与另一个无关。
在一个方面中,本发明提供了用于表达重组免疫球蛋白的载体,其包括启动子,该启动子可操纵地连接用于免疫球蛋白分子第一链或其片段的编码序列,编码自我加工或其他蛋白酶解裂解位点的序列和用于免疫球蛋白分子第二链或其片段的编码序列,其中将编码自我加工或其他蛋白酶解裂解位点的序列插入免疫球蛋白分子第一链的编码序列和免疫球蛋白分子第二链的编码序列之间,和第三个片段,编码免疫球蛋白轻链,也通过自我加工或其他蛋白酶解裂解位点与剩余的多蛋白隔开。
在一个实施方案中,免疫球蛋白分子的第一或第二链可以是重链或轻链。编码重组免疫球蛋白片段的序列可以是全长编码序列或其片段。在特定的实施方案中,第二个轻链编码序列必须是编码本发明实践中加工的多蛋白的序列的一部分;即,合在一起存在三个片段,包括两个轻链和一个重链,以任何次序。在特定的实施方案,用这些组分并且以这种次序构造构建体:a)IgH-IgL;b)IgL-IgH;c)IgH-IgL-IgL;d)IgL-IgH-IgL;e)IgL-IgL-IgH;f)IgH-IgH-IgL;g)IgH-IgL-IgH;和/或h)IgL-IgH-IgH。在一个实施方案中,连字符表示其中安置裂解位点序列的位置。
或者,免疫球蛋白重链和轻链编码序列与其中存在的蛋白内含子编码序列框内融合,蛋白内含子是修饰的,使得缺乏剪接活性或设计重链和轻链的末端使得优选不发生剪接或使得发生效率差的剪接,使得主要为未剪接的抗体分子。此外,修饰的蛋白内含子可以进一步修饰,仍然进一步使得不存在核酸内切酶片段(其中之前已经将核酸内切酶片段切除),附带条件是保留位点特异性蛋白酶解裂解活性,使得轻链和重链抗体多肽与初级翻译产物的干预蛋白内含子部分分离开来。轻链或重链抗体多肽中任一个可以是N-蛋白外显子,并且任一个可以是C-蛋白外显子。
载体可以是能够表达全长多蛋白的任何重组载体,例如,腺相关病毒(AAV)载体,慢病毒载体,逆转录病毒载体,可复制型腺病毒载体,复制缺陷型腺病毒载体和gutless腺病毒载体,肝炎病毒载体或非病毒载体(质粒)或任何其他本领域已知的载体,选择适用于其中表达免疫球蛋白或其他蛋白的宿主细胞的载体。杆状病毒载体可用于在昆虫细胞中表达基因。各种载体是本领域已知的,并且许多是可购得的或另外本领域易于获得的。
裂解位点
优选的自我加工裂解位点包括蛋白内含子序列;修饰的蛋白内含子;hedgehog序列;其他hog家族序列;2A序列,例如,源自口蹄疫病毒(FMDV)的2A序列;和各自的变化。
其识别序列可以由2A序列替代的蛋白酶包括,但不限于,弗林蛋白酶,靶向内质网而不是反式Golgi网的修饰弗林蛋白酶,IPNV的VP4,TEV蛋白酶,核定位信号缺陷TEV蛋白酶(TVE Nls-),鼻病毒的3C蛋白酶,PC5/6蛋白酶,PACE蛋白酶,LPC/PC7蛋白酶,肠激酶,Xa蛋白酶,凝血酶,genenase I,MMP蛋白酶,如上所讨论的。用于本发明实践中的其他内蛋白酶是包括但不限于以下的蛋白酶,芜菁花叶病毒的核内含体蛋白a(Nla)(Kim等,1996,Virology 221:245-249);4型登革热(DEN4)黄病毒的NS2B/NS3(Falgout等,1993,J.Virol.67:2034-2042;Lai等,1994,Arch.Virol.Suppl.9:359-368),黄热病毒(YFV)的NS3蛋白酶(Chambers等,1991,J.Virol.65:6042-6050);花椰菜花叶病毒的ORF V(Torruella等,1989,EMBO Journal 8:2819-2825);蛋白内含子,其实例是Psp-GBD Pol蛋白内含子(Xu,M.Q.1996,EMBO 15:5146-5153);内部可裂解信号肽,其实例是C型流感病毒的内部可裂解信号肽(Pekosz A,1992,Proc.Natl.Acad.Sci.USA 95:3233-13238);和KEX2蛋白酶,MYKR-EAD(SEQ ID NO:9);KEX2和靶向ER的修饰KEX2(参见,Chaudhuri等,1992,Eur.J.Biochem.210:811-822)。唯一针对ER的修饰KEX2具有各自如表7A和7B中给出的编码序列和氨基酸序列;将其称为KEX2-sol-KDEL。已经将来自酿酒酵母的KEX2初级氨基酸序列进行修饰,在蛋白的C端除去膜相关结构域和添加ER靶向序列KDEL。用于裂解含有合适裂解识别位点的多蛋白的其他人蛋白酶包括US专利公开2005/0112565中列出的那些。来自黑腹果蝇(Drosophila melanogaster)的sonichedgehog蛋白,尤其是来自其的加工结构域,也可用来从多蛋白初级翻译产物分离蛋白。
在本发明范围内的是修饰的弗林蛋白酶,其瞄准内质网(ER)而不是反式Golgi网(TGN),因为这是天然产生的弗林蛋白酶。Vorhees等,1995,EMBO Journal 14:4961-4975,描述了弗林蛋白酶(氨基酸775-778)的EEDE(SEQ ID NO:10)部分,如涉及蛋白酶瞄准TGN(Nakayama等,1997,Biochem.Journal 327:625-635)。Zerangue等,2001,Proc.Natl.Acad.Sci.USA 98:2431-2436报道了ER运输信号,包括蛋白C端的KKXX。因此,研发修饰的弗林蛋白酶并用来将弗林蛋白酶裂解活性瞄准替代TGN或添加至TGN的ER间隔并在间隔之后。
再一方面中,载体包括编码位于免疫球蛋白分子第一链或其片段的编码序列和免疫球蛋白第二和/或第三链(例如,第一或第二链的复本)或其片段的编码序列之间(即,邻接裂解位点序列,其可以是2A裂解位点)的序列。在一个示例性的方法中,另外的蛋白酶解裂解位点是具有一致序列RXK(R)R(SEQ ID NO:1)的弗林蛋白酶裂解位点。
包括启动子的调控序列;宿主细胞
用于重组免疫球蛋白或其他蛋白表达的载体包括本领域已知的多种启动子中的任一种,其中启动子是组成型的,可调控或可诱导的,细胞类型特异性的,组织特异性的,或物种特异性的。更多特定的实施例包括,例如,四环素-应答性启动子(Gossen M,Bujard H,Proc NatlAcad Sci USA.1992,15;89(12):5547-51)。载体是适于其中表达嵌合基因的宿主细胞的复制子,并且理想地其还包括在细菌细胞中功能性的复制子,有利地,细菌细胞是大肠杆菌,这是用于分子生物学操作的常规细胞。
用于基因表达的宿主细胞是,但不限于,动物细胞,尤其是哺乳动物细胞,或可以是微生物细胞(细菌,酵母,真菌,但优选真核的)或植物细胞。特别合适的宿主细胞包括昆虫培养的细胞,如草地贪夜蛾细胞,酵母细胞,如酿酒酵母或甲醇酵母,真菌,如里氏木霉(Trichoderma reesei),曲霉属(Aspergillus),Aureobasidum和青霉属种,以及哺乳动物细胞如CHO(中国仓鼠卵巢),BHK(幼仓鼠肾脏),COS,293,3T3(小鼠),Vero(非洲绿猴)细胞,也可以使用各种转基因动物系统,包括但不限于,猪,小鼠,大鼠,绵羊,山羊,奶牛。用于在蛋清中表达的小鸡系统和用于在奶中表达的转基因绵羊,山羊和奶牛系统是已知的。杆状病毒尤其是AcNPV载体可以用于本发明的单ORF抗体表达和裂解,例如,在昆虫细胞系中在多hedrin启动子或其他强启动子的调控控制下的表达;这样的载体和细胞系是本领域公知的并可购得。哺乳动物细胞中所用的启动子可以是组成型的(肝炎病毒TK启动子,McKnight,Cell 31:355,1982;SV40早期启动子,Benoist等,Nature 290:304,1981;巨细胞病毒启动子,Foeking等,Gene 45:101,1980;小鼠乳癌病毒启动子,总地参见Etcheverry inProtein Engineering:Principles and Practice,Cleland等编辑,pp.162-181,Wiley & Sons,1996)或调控型的(例如,亲金属蛋白启动子,Hamer等,J.Molec.Appl.Genet.1:273,1982)。载体可以是基于感染特定哺乳动物细胞的病毒,尤其是逆转录病毒,牛痘和腺病毒及其本领域已知并可购得的衍生物。启动子包括,但不限于,巨细胞病毒,后期腺病毒和牛痘7.5K启动子。酵母和真菌载体(参见,例如,Van den Handel,C等(1991)In:Bennett,J.W.和Lasure,L.L.(编辑),More Gene Manipulations in Fungi(真菌中的更多基因操作),Academy Press,Inc.,New York,397-428)和启动子也是公知的并可广泛获得。烯醇酶是公知的组成型酵母启动子,并且乙醇脱氢酶是公知的调控型启动子。
特定启动子,转录终止序列和其他任选序列如编码组织特异性序列的序列的选择,很大程度上由其中需要表达的细胞类型所决定的。可以是细菌,酵母,真菌,哺乳动物,昆虫,小鸡或其他动物细胞。
信号序列
将其引入载体中的待裂解的,蛋白酶解加工或自我加工的蛋白的编码序列,可以进一步包括一个或多个编码一个或多个信号序列的序列。这些编码的信号序列与多蛋白内一个或多个成熟片段相关。例如,编码免疫球蛋白重链前导序列的序列可以在重链编码序列之前,可操纵地在框内连接剩余的多蛋白编码序列。相似地,轻链前导肽编码序列或其他前导肽编码序列可以框内连接一个或两个免疫球蛋白轻链编码序列,前导序列链由来自自我加工位点(如2A)的邻接链或由编码蛋白酶识别序列的序列隔开,保持合适的阅读框。
免疫球蛋白重链和轻链的化学计算
在此的许多实施方案中,免疫球蛋白/抗体轻链(IgL)和重链(IgH)在宿主细胞内以约1∶1比例(IgL∶IgH)以载体水平或表达的胞内水平存在。而在此和别处的重组方法依赖于重链和轻链的等摩尔表达(参见,例如,US专利公开2005/0003482A1或国际公开WO2004/113493),在其他实施方案中,本发明提供了具有2∶1比例轻链和重链编码序列的方法和表达盒和载体,当初级翻译产物是多蛋白时,并与链的自我加工或蛋白酶解加工共表达。在实施方案中,比例高于1∶1,如约2∶1或高于2∶1。在特定的实施方案中,以高于1∶1的比例使用轻链编码序列(IgL∶IgH)。在特定的实施方案中,IgL∶IgH的比例是2∶1。
本发明进一步提供了用载体转化或感染的宿主细胞或宿主细胞的稳定克隆,该载体包括编码免疫球蛋白(即,抗体)的重链和任一个或至少两个轻链的序列;编码其中的裂解位点,如自我加工,蛋白酶识别位点或信号肽的序列;并可以进一步包括编码其他蛋白酶解裂解位点的序列。本发明的范围内还包括该细胞或克隆在产生全长重组免疫球蛋白或其片段或其他由多个亚基构成的生物活性蛋白中的用途(例如,双链或多链分子或作为前体蛋白天然产生并裂解或加工来释放前体衍生的蛋白和活性部分的那些)。非限制实例包括胰岛素,白细胞介素-18,白细胞介素-1,骨形态发生蛋白4,骨形态发生蛋白2,任何其他双链骨形态发生蛋白,神经生长因子,肾素,凝乳蛋白酶,转化生长因子β和白细胞介素1β。
在相关的方面中,本发明提供了通过这样的细胞或克隆产生的重组免疫球蛋白,分子或其片段或其他蛋白,其中免疫球蛋白包括源自自我加工裂解位点(如蛋白内含子或hedgehog结构域),裂解位点或信号肽裂解的氨基酸,并提供了用于生产这些的方法,载体和宿主细胞。在实施方案中,本发明提供了含有一个或多个在此所述的构建体的宿主细胞。
本发明提供了用于表达免疫球蛋白分子或其片段的单个载体构建体和用于体外或体内使用的方法。载体在第一个和第二个之间以及在第二个和第三个免疫球蛋白编码序列之间具有自我加工或其他蛋白酶识别序列,允许功能性抗体分子的表达,使用单个启动子和转录产物。示例性载体构建体包括开放阅读框之间编码自我加工裂解位点的序列,并可以进一步包括与自我加工裂解位点邻接的其他蛋白酶解裂解位点,用于在裂解后除去包括自我加工裂解位点的氨基酸。载体构建体发现在一些方法中的实用性,这些方法关于全长生物活性免疫球蛋白或其片段在体外和体内提高的生产。尽管理解不需要链的编码序列相对于其他链的编码序列以高于1的比例存在,可以使用相同的策略制得具有至少两个不同链的其他生物活性蛋白。
尽管在此具体举例说明了特定的组成和方法,理解许多可替换组成和方法中的任一个是合适的并且适用于实践本发明。还理解可以使用本领域中的标准方法进行本发明的多蛋白表达盒和载体,宿主细胞和方法的评价。本发明的实践将使用,除非另外指出,细胞生物学,分子生物学(包括重组技术),微生物学,生物化学和免疫学的常规技术,这些在本领域技术人员的范围内。这样的技术在文献中得到全面地解释,如,Molecular Cloing:A Laboratory Manual,第二版,(Sambrook等,1989);Oligonucleotide Synthesis(M.J.Gait编辑,1984);AnimalCell Culture(R.I.Freshney编辑,1987);Methods in Enzymology(Academic Press,Inc.);Handbook of Experimental Immunology(D.M.Weir & C.C.Blackwell编辑);Gene Transfer Vectors for MammalianCells(J.M.Miller & M.P.Calos编辑,1987);Current Protocols inMolecular Biology(F.M.Ausubel等,编辑,1993);PCR:The PolymeraseChain Reaction,(Mullis等,编辑,1994);和Current Protcols inImmunology(J.E.Coligan等,编辑,1991),在此将每篇特意引入作为参考。
除非另外指出,在此所用的所有术语具有本领域技术人员所知的相同意思,并且本发明的实践将使用微生物学的常规技术和重组DNA技术,这些在本领域技术人员的知识范围内。
在此通常所用的术语“修饰的”在蛋白质的范围内指的是其中参照分子内至少一个氨基酸残基被置换,删除或添加的片段。相似地,在核酸范围内,术语指的是其中参照分子内至少一个核酸残基被置换,删除或添加的片段。
如在此所用的术语“蛋白内含子”通常指的是促进其自身去除并实现称为蛋白外显子的侧翼片段连接的蛋白质的内部片段。在多种类型的生物体中认识到蛋白内含子的许多实例,在一些情况中,具有共有的结构和/或功能特征。本发明宽泛地能够使用蛋白内含子,或其变体,如现在已知的或进一步认识或发现的。参见,例如,Gogarten JP等,2002,Annu Rev Microbiol.2002;56:263-87;Perler,F.B.(2002),InBase,the Intein Database.Nucleic Acids Res.30,383-384(还通过互联网在New England Biolabs,Inc.,Ipswich,MA的网址http://www.neb.com/neb/intein.html;Amitai G等,Mol Microbiol.2003,47(1):61-73;Gorbalenya AE,Nucleic Acids Res.1998;26(7):1741-1748。非典型蛋白内含子)。在蛋白质中,含有蛋白内含子单位或蛋白内含子剪接单位可以理解为包括两翼蛋白外显子的部分,其中结构方面可以促进裂解,连接等的反应。术语还可以理解为关于基于蛋白内含子系统的一个类别,该系统具有“修饰的蛋白内含子”组分。
如在此所用的术语“修饰的蛋白内含子”可以指和成的蛋白内含子或天然蛋白内含子,其中蛋白内含子剪接单位中至少一个氨基酸残基被置换,删除,或添加,使得裂解的或切除的蛋白外显子没有通过蛋白内含子完全连接。
如在此所用的术语“hedgehog”指的是基因家族(和相应的蛋白片段),成员具有影响自体蛋白酶解功能的结构。家族成员包括,例如,来自果蝇,小鼠,人和其他物种的类似物。此外,术语“hedgehog片段”不仅用来包括这样的家族成员,而且宽泛地涉及疣猪,土拨鼠的自体加工结构域和来自线虫如秀丽隐杆线虫的其它含hog-基因,和来自领鞭毛虫的Hoglet-C自体加工结构域。参见,例如,Perler FB.Proteinsplicing of inteins and hedgehog autoproteolysis:structure,function,andevolution(蛋白内含子和hedgehog自体蛋白酶解的蛋白质剪接:结构,功能和评价),Cell.1998,92(1):1-4;Koonin,EV等,(1995)A Proteinsplice-junction motif in hedgehog family proteins.(hedgehog家族蛋白中蛋白剪接-连接基序)Trends Biochem Sci.20(4):141-28;Hall TM等,(1997)Crystal structure of a Hedgehog autoprocessing domain:homology between Hedgehog and self-splicing proteins.(Hedgehog自体加工结构域的晶体结构:Hedgehog和自我剪接蛋白之间的同源性)Cell91(1):85-97;Snell EA等,Proc.R.Soc.B(2006)273,401-407;Aspock等,Genome Research,1999,9:909-923。Hedgehog片段的特定实例是来自黑腹果蝇的sonic hedgehog蛋白。术语还可以理解为关于基于hedgehog系统的一个类别,该系统具有“修饰的hedgehog”组分。
术语“修饰的hedgehog”片段可以指和成的hedgehog片段或天然hedgehog片段,其中hedgehog剪接单位中的至少一个氨基酸残基被置换,删除或添加,使得裂解的蛋白没有完全连接。
如在此所用的术语“载体”指的是DNA或RNA分子,如质粒,病毒或其他载体,其含有一个或多个异种或重组DNA序列并设计用于不同宿主细胞之间的转移。术语“表达载体”和“基因治疗载体”指的是将异种DNA片段有效引入细胞中并表达的任何载体。克隆或表达载体可以包括其他元件,例如,表达载体可以具有两个复制系统,因此允许其在两个有机体中得到维持,例如,在用于表达的人细胞中和用于克隆和扩增的原核宿主中。可以使用任何合适的载体,该载体将核酸有效引入细胞中,使得蛋白或多肽表达,例如,病毒载体或非病毒载体。用于表达的任何有效细胞,例如,昆虫细胞和真核细胞,如酵母或哺乳动物细胞可用于本发明实践中。
术语“异种DNA”和“异种RNA”指的是不是细胞内源(天然)的核酸或其中存在它们的基因组或载体的一部分。通常,通过转导,感染,转染,转化,电穿孔,基因枪转化等将异种DNA或RNA加入细胞中。这样的核苷酸通常包括至少一个编码序列,但是编码序列不需要得到表达。术语“异种DNA”可以指“异种编码序列”或“转基因”。
如在此所用的,术语“蛋白质”和“多肽”可以交替使用,并通常指的是使用本发明的含自我加工裂解位点的载体表达的目标“蛋白质”和“多肽”。这样的“蛋白质”和“多肽”可以是用于研究,诊断或治疗目的的任何蛋白质或多肽,如以下进一步所述的。如在此所用的,多蛋白是设计用于加工产生两个或多个多肽产物的蛋白质。
如在此所用的,术语“多聚体”指的是由两个或多个多肽链(有时候称为“亚基”)构成的蛋白质,其装配形成功能蛋白。多聚体可以由两个(二聚体),三个(三聚体),四个(四聚体)或更多(例如,五聚体等)肽链构成。多聚体可以由自我装配而得,或者需要成分,如催化剂来帮助装配。多聚体可以只由相同的肽链构成(同型-多聚体),或两个或多个不同的肽链构成(异型多聚体)。这样的多聚体可以在结构上或化学上是功能性的。许多多聚体是本领域已知并使用的,包括但不限于酶,激素,抗体,细胞因子,趋化因子和受体。同样,多聚体可以具有生物(例如药物)和工业(例如,生物加工/生物生产)用途。
如在此所用的,术语“标记物”指的是肽,可以将其引入表达载体中,其可以用来允许一个或多个载体插入片段的表达产物的删除和/或纯化。这样的标记物是本领域公知的并包括放射性标记的氨基酸或连接可以通过标记的抗生物素蛋白(例如,含有可以通过光学或比色方法检测的荧光标记或酶活性的抗生蛋白链菌素)检测的生物素部分的多肽。亲和性标记物如FLAG,谷胱甘肽-S-转移酶,麦芽糖结合蛋白,纤维素结合结构域,硫氧还蛋白,NusA,mistin,几丁质结合结构域,角质酶,AGT,GFP和广泛使用的其它标记物,如蛋白表达和纯化系统中所用的。用于多肽的更多非限制性实例包括,但不限于以下的:组氨酸标记物,放射性同位素或放射性核素(利如,3H,14C,35S,90Y,99Tc,111In,125I,177Lu,166Ho或153Sm);荧光标记物(例如,FITC,若丹明,镧系磷),酶标记物(例如,辣根过氧化物酶,莹光素酶,碱性磷酸酶);化学发光标记物;生物素基团;由第二报告子识别的悬垂多肽抗原决定部位(例如,亮氨酸拉链对序列,用于二抗的结合位点,金属结合结构域,抗原决定部位标记物);和磁性试剂,如钆螯合物。
如在此所用的关于本发明病毒基因治疗载体的术语“复制缺陷”意思是病毒载体不能能够独立地进一步复制和包装其基因组。例如,用rAAV病毒粒子感染患者的细胞时,在感染的细胞中表达异种基因,然而,由于感染的细胞缺乏AAV rep和cap基因以及辅助功能基因的事实,rAAV不能复制。
如在此所用的,“逆转录转移载体”指的是包括编码转基因的核苷酸序列并进一步包括载体包装必需的核苷酸序列的表达载体。优选,逆转录转移载体还可以包括在细胞中表达转基因的必需序列。
如在此所用的,“包装系统”指的是一套包括编码病毒蛋白的基因的构建体,该病毒蛋白涉及重组病毒的包装。通常,最终将包装系统的构建体引入包装细胞中。
如在此所用的,“第二代”慢病毒载体系统指的是缺乏功能性辅助基因的慢病毒包装系统,如已经从其删除或灭活辅助基因,vif,vpr,vpu和nef的一种。参见,例如,Zufferey等,1997,Nat.Biotechnol.15:871-875。
如在此所用的,“第三代”慢病毒载体指的是居有第二代载体系统的特征并进一步缺乏功能性tat基因的慢病毒包装系统,如已经从其删除或灭活tat基因的一种。参见,例如,Dull等,1998,J.Virol.72:8463-8471。
如在此关于病毒或病毒载体所用的,“假模的”指的是天然病毒包膜蛋白由异种或功能上修饰的病毒包膜蛋白的替代。
如在此关于重组DNA构建体或载体所用的术语“可操纵地连接”意思是重组构建体或载体的核苷酸成分通常相互共价连接。通常,“可操纵地连接”DNA序列是邻接的,并且在分泌前导的情况中,是邻接的并且在相同阅读框内。然而,增强子不必须与表达得到上调的序列邻接。术语与可操纵地安置相一致。
增强子序列影响启动子依赖性基因表达并可以位于天然基因的5’或3’片段中。“增强子”是刺激或抑制邻接基因转录的顺式作用元件。已知转录的增强子也称为“沉默子”。增强子可以以任一方向,离开编码序列和离开转录片段的下游位置高达几千碱基对(kb)的距离起作用(即,可以与编码序列相关)。此外,绝缘子和染色质开放序列,如基质连接片段(Chung,Cell,1993,Aug,13:74(3):505-14,Frisch等,Genome Research,2001,12:349-354,Kim等,J.Biotch 107,2004,95-105)可以用来提高稳定整合的基因盒的转录。
如在此所用的,术语“基因”或“编码序列”意思是可操纵地连接合适的调控序列时,在体外或体内转录(DNA)和翻译(mRNA)成多肽的核酸序列。基因可以包括或不包括编码序列之前和之后的片段,例如,5’未翻译的(5’UTR)或“前导”序列和3’UTR或“尾巴”序列,以及单个编码片段(外显子)之间的干预序列(内含子)。
“启动子”是指导RNA聚合酶的结合并因此促进RNA合成的DNA序列,即,足以指导转录的最小序列。启动子和相应的蛋白质或多肽表达可以是细胞特异性的,组织特异性的或物种特异性的。本发明的核酸构建体或载体中还包括的是增强子序列,其可以与启动子序列邻接或不邻接。
如在此宽泛使用的“转录调控序列”或表达控制序列包括启动子序列和物理上相连的序列,其调节或调控相连编码序列的转录,通常应答营养或环境信号。那些相连的序列可以决定组织或细胞特异性表达,应答环境信号,提高或降低转录的蛋白的结合等。“调控型启动子”是任何其活性受顺或反作用因子(例如,诱导型启动子,其通过外部信号或试剂激活)影响的启动子。
“组成型启动子”是指导许多或全部组织/细胞类型在大部分时间的RNA产生的任何启动子,例如,人CMV即时早期增强子/启动子片段,其促进哺乳动物细胞中克隆的DNA插入片段的组成型表达。
术语“转录调控蛋白”,“转录调控因子”和“转录因子”在此可交替使用,并指的是结合DNA应答元件并因此在转录上调控相关基因表达的核蛋白。转录调控蛋白通常直接结合DNA应答元件,然而,在一些情况中,与DNA的结合可以是间接的,通过结合另一个蛋白,该蛋白随后结合或被结合DNA应答元件。
如在此所用的,“内部核糖体进入位点”或“IRES”指的是促进指导内部核糖体进入顺反子(蛋白质编码片段)的启动密码子如ATG的元件,因此导致基因的cap自主翻译。参见,例如,Jackson R.J.等,1990,Trends Biochem Sci 15:477-83)和Jackson R.J.和Kaminski,A.1995,RNA 1:985-1000。在此所述的实施例与任何IRES元件的使用相关,IRES元件能够促进指导内部核糖体进入顺反子的启动密码子。如在此所用的“在IRES的翻译控制下”意思是翻译与IRES相关并以cap-自主方式进行。例如,可以通过隔开单个编码序列的IRES翻译重链和两个轻链编码序列,不需要蛋白酶解或自我加工来将两个链相互隔开。
将“自我加工裂解位点”或“自我加工裂解序列”在此定义为翻译后或共翻译加工裂解位点序列。如“自我加工裂解”位点或序列指的是DNA或氨基酸序列,在此通过2A位点,序列或结构域或2A样位点,序列或结构域来举例说明。如在此所用的,将“自我加工肽”在此定义为编码自我加工裂解位点或序列的DNA序列的肽表达产物,其在翻译时,介导包括自我加工裂解位点的蛋白或多肽的快速分子内(cis)裂解,来产生分开的成熟蛋白或多肽产物。
如在此所用的,术语“其他的蛋白酶解裂解位点”指的是一种序列,将该序列引入本发明表达载体的邻接自我加工裂解位点,如2A或2A样序列,并且该序列提供了除去由自我加工裂解序列裂解后保留的其他氨基酸的方式。在此描述了示例性“其他的蛋白酶解裂解位点”并包括但不限于,具有一致序列RXK/R-R的弗林蛋白酶裂解位点。可以通过内源枯草杆菌蛋白酶样蛋白酶裂解这样的弗林蛋白酶裂解位点,如蛋白分泌途径内的弗林蛋白酶和其他丝氨酸蛋白酶。
如在此所用的,术语“免疫球蛋白”和“抗体”指的是完整的蛋白质及其片段,如Fa,F(ab’)2和Fv,其能够结合目标抗原性决定因子。这样的“免疫球蛋白”和“抗体”由两个分子量大约23,000的相同多肽轻链和两个分子量53,000-70,000的相同重链构成。通过二硫键以“Y”构造连接四条链。将重链分类为γ(IgG),μ(IgM),α(IgA),δ(IgD)或ε(IgE)并且是免疫球蛋白分类命名的基础,其决定了给定抗体的效应物功能。将轻链分类为κ和λ。在此参照“免疫球蛋白或其片段”时,将理解这样的“其片段”是免疫上功能性的免疫球蛋白片段,尤其是结合其同源配体的一种,具有完整免疫球蛋白至少10%的结合亲和性。
抗体的Fab片段是抗体分子的单价抗原结合片段。Fv片段通常是工程化的片段,含有表达为两个链的轻链可变区和重链可变区。
术语“人源化抗体”指的是其中已经替代了非抗原结合片段中一个或多个氨基酸的抗体分子,以便更接近地象人抗体,同时仍然保持抗体最初的结合活性。参见,例如,U.S.专利No.6,602,503。
如在此所用的术语“抗原决定因子”指的是接触特定抗体的分子的片段(即,抗原决定部位)。蛋白或肽或蛋白或糖蛋白的糖肽的各种片段可以诱导特异性结合蛋白的给定片段或三维结构的抗体的产生。将这些片段或结构称为抗原决定因子或抗原决定部位。抗原决定因子可以与完整的抗原(即,用于引发免疫应答的免疫原)竞争与抗体的结合。
当涉及本发明的重组蛋白或多肽时,术语“片段”意思是具有与相应的全长蛋白或多肽的氨基酸序列部分但不是全部相同的氨基酸序列的肽或多肽,其保留相应的全长蛋白或多肽的至少一种功能或活性。片段优选包括全长蛋白或多肽的至少20-100个邻接氨基酸残基。
如在此所用的术语“给予”或“引入”意思是通过本领域已知的途径将蛋白质(包括免疫球蛋白)传送至需要的人或动物。药物载体和制剂或组合物也是本领域公知的。给予途径包括静脉内,肌内,皮内,皮下,经皮,粘膜,腔内或粘膜。或者,这些术语可以指用于重组蛋白表达的载体至细胞或至培养物中的细胞和或至患者的细胞或器官的传送。这样的给予或引入可以发生在体内,体外或离体(ex vivo)。可以通过转染,感染或转导将用于重组蛋白或多肽表达的载体引入细胞中,转染通常意思是通过物理方式(例如,磷酸钙转染,电穿孔,微注射或脂质转染)将异种DNA插入细胞中;感染,通常意思是通过感染剂即病毒的引入;转导,通常意思是用病毒稳定感染细胞或将来自一个微生物的基因组材料通过病毒剂(即,噬菌体)转移至另一个微生物。
“转化”通常用来涉及包括异种DNA的细菌或表达致癌基因并已经转化成连续生长模式的细胞,例如,肿瘤细胞。用来“转化”细胞的载体可以是质粒,病毒或其他载体。
通常,根据用于异种DNA(即,载体)的给予,引入或插入细胞中的方式,将细胞称为“转导的”,“感染的”,“转染的”或“转化的”。术语“转导的”,“转染的”和“转化的”在此可交替使用,与异种DNA的引入方式无关。
如在此所用的,术语“稳定转化的”,“稳定转染的”和“转基因”指的是具有整合至基因组的非天然(异种)核酸序列的细胞。通过由子细胞群构成的细胞系或克隆的建立来证明稳定的转染,该子细胞含有通过整合至它们的基因组或作为游离序列稳定复制的转染DNA。在一些情况中,“转染”不是稳定的,即,是瞬时的。在瞬时转染的情况中,表达内源或异种DNA,然而,引入的细胞没有整合至基因组中或宿主细胞不能复制。
如在此所用的,“离体(ex vivo)给予”指的是其中从患者获取初级细胞,将载体给予细胞来产生转导的,感染的或转染的重组细胞并将重组细胞再次给予相同或不同患者的过程。
“多顺反子转录产物”指的是含有多于一个蛋白质编码片段或顺反子的mRNA分子。包括两个编码片段的mRNA称为“双顺反子转录产物”。“5’-近端”编码片段或顺反子是其翻译启动密码子(通常是AUG)最接近多顺反子mRNA分子的5’端编码片段。“5’远端”编码片段或顺反子是其翻译启动密码子(通常是AUG)不是最接近mRNA5’端编码片段启动密码子的编码片段或顺反子。
术语“5’-远端”和“下游”涉及不邻接mRNA分子的5’端的编码片段时可同义使用。
如在此所用的,“共转染”意思是两个(或多个)开放阅读框或编码片段或多核苷酸在信号转录控制或包括启动子的调控序列的转录控制下。
如在此所用的术语“宿主细胞”指的是已经用载体转导,感染,转染或转化的细胞。载体可以是质粒,病毒颗粒,噬菌体等。培养条件,如温度,pH等,是之前用于选定的用于表达的宿主细胞的那些,并且是本领域技术人员清楚的。将认识到术语“宿主细胞”指的是最初转导的,感染的,转染的或转化的细胞及其子代。
如在此所用的,术语“生物活性”和“生物上活性的”指的是归因于培养物中细胞系中或无细胞系统中的特定蛋白质的活性,如ELISA平板中的配体-受体测试。“免疫球蛋白”,“抗体”或其片段的“生物活性”指的是结合抗原决定因子并因此促进免疫功能的能力。激素或白细胞介素的“生物活性”是本领域已知的。
如在此所用的,术语“肿瘤”和“癌症”指的是在正常生长和/或发育中呈现出至少部分失去控制的细胞。例如,常见的肿瘤或癌细胞通常已经失去了接触抑制并可能是入侵性的和/或具有转移的能力。
抗体是免疫球蛋白,其是重链和轻链的杂二聚体。典型的抗体是具有连在一起的两个重链和两个轻链(或其功能片段)的多聚体。抗体可以具有更多的多聚结构次序,二聚体,三聚体,四聚体,五聚体等,通常取决于同型(isotype)。非常难以证明它们在哺乳动物培养物表达系统中从单个载体或从两个载体表达全长形式。几种方法目前用于生产抗体:动物的体内免疫来产生“多克隆”抗体,B细胞杂交瘤的体外细胞培养来产生单克隆抗体(Kohler等,1988,Eur.J.Immunol.6:511;Antibodies:A Laboratory Manual,Cold Spring Harbor Laboratory,1988;在此引入作为参考)和重组DNA技术(例如,描述于Cabilly等,US专利No.6331415,在此引入作为参考)。
公知免疫球蛋白多肽的基础分子结构包括两个分子量大约23,000道尔顿的相同轻链和两个分子量53,000-70,000的相同重链,其中四条链以“Y”构型通过二硫键连接。氨基酸序列从Y顶端的N-端至每条链底部的C-端。在N-端是可变区(大约100个氨基酸长),其提供了抗原结合的特异性。
本发明涉及用于生产所有类型的免疫球蛋白的改良方法,包括但不限于,具有天然序列(即,应答抗原刺激产生的序列)的全长抗体和抗体片段,合并单个稳定折叠多肽链中重链和轻链的抗原结合可变区的单链抗体;单价抗体(其包括结合第二个重链的Fc片段的重链/轻链二聚体);“Fab片段”,其包括免疫球蛋白分子的全部“Y”片段,即,“Y”的分支,单独的轻链或重链,或其部分(即,一个重链和一个轻链的组合体,通常称为Fab’);“杂交免疫球蛋白”,其具有两个或多个不同抗原的特异性(例如,quadromas或双特异性抗体,如US专利No.6,623,940中所述的);“合成的免疫球蛋白”,其中重链和轻链模拟来自不同物种或特征的那些;和“嵌合抗体”,其中重链和轻链氨基酸序列的每个部分源自多于一个物种(即,可变区源自一个来源,如鼠抗体,而不变区源自另一个来源,如人抗体)。
在免疫球蛋白或其片段的生产中发现本发明的组合物和方法的实用性,其中重链和轻链是“哺乳动物”,“嵌合”或修饰的方式来提高其功效。修饰的抗体包括保持未修饰形式的相同生物活性的氨基酸和核酸序列和已经修饰使得活性改变的那些,即,不变区的改变提高了补体结合,与膜的相互作用,和其他效应物功能,或可变区的改变提高了抗原结合特性。本发明的组合物和方法可以进一步包括催化免疫球蛋白或其片段。
“变体”免疫球蛋白编码多核苷酸序列可以编码“变体”免疫球蛋白氨基酸序列,其通过参照多肽序列的一个或多个氨基酸得到改变。以下该相同的讨论适用于其他目标生物活性蛋白序列(及其编码序列)。变体多核苷酸序列可以编码变体氨基酸序列,其含有“保守性”取代,其中取代的氨基酸具有与其取代的氨基酸相似的结构或化学特征。理解目标蛋白的变体可以由天然产生的序列的氨基酸序列基本上相同的(至少约80至99%相同,以及其中所有的整数)氨基酸序列制得,并且其形成功能上等价的三维结构和保留天然产生蛋白的生物活性。生物领域公知可以在蛋白质序列中形成特定的氨基酸置换而没有影响蛋白质的功能。通常,定制保守氨基酸置换或相似氨基酸的置换而没有相应蛋白质功能。相似的氨基酸可以是大小和/或电荷特征相似的那些,例如,天冬酰胺和谷氨酰胺,异亮氨酸和缬氨酸是两对相似的氨基酸。除非故意,当没有破坏天然二级和三级结构形成时,允许相互的置换。在本领域中以各种方式测定了氨基酸对之间的相似性。例如,Dayhoff等,在Atlas of Protein Sequence and Structure,1978,Volumn 5,增补3,22章,345-352页,在此将其引入作为参考,提供了氨基端置换的频率表,其可以用作氨基酸相似性的测量。Dayhoff等的频率表是基于来自各种进化不同来源的具有相同功能的蛋白质的氨基酸序列的比较。
可以通过本领域公知的方法容易地制备所公开核苷酸(和氨基酸)序列的置换突变,插入和删除变体。这些变体可以以特意举例说明的序列相同的方式使用,只要变体具有与本发明特意举例说明的序列基本的序列同一性并保持所需的功能性。
如在此所用的,基本序列同一性指的是足以使变体多核苷酸或蛋白以与产生变体的多核苷酸或蛋白相同的能力作用的同源性(或同一性)。优选,该序列同一性高于70%或80%,更优选,该同一性高于85%,或该同一性高于90%,和或,这高于95%,以及70和100%之间的所有整数。本领域技术人员公知制备功能等价的置换突变,插入和删除突变或设计来提高序列的功能或另外提供方法优势。确定没有可以根据任何天然产生的蛋白质或根据具有资格的现有技术条目理解的实施方案/变体在所要求的本发明范围内。本领域公知本发明的多核苷酸序列可以截断和/或另外突变,使得所得到的特定片段和/或最初的全长序列的突变体可以保留所需的全长序列的特征。适用于从较大的核酸分子产生片段的各种限制酶是公知的。此外,公知Bal31内切核酸酶可以方便地用于DNA控时的有限消化。参见,例如,Maniatis等,1982,Molecular Cloning :A Laboratory Manual,Cold Spring HarborLaboratory,New York,135-139页,在此引入作为参考。还可以参见Wel等,1983,J.Biol.Chem.258:13006-13512。通过使用Bal31内切核酸酶(通常称为“erase-a-base”方法),本领域技术人员可以从主体核酸的任一个或两个末端除去核苷酸来产生宽谱的片段,其在功能上等价于主体核苷酸序列。本领域技术人员可以以这种方式从沿着最初编码序列的所有位置产生数百个受控的不同长度的片段。本领域技术人员可以常规地测试或筛选产生的片段的特征并按照在此教导的测定片段的实用性。还公知的是可以用定点突变容易地产生全长序列或其片段的突变序列。参见,例如,Larionov,O.A.和Nikiforov,V.G.1982,Genetika 18:349-59;Shortle等,(1981)Annu.Rev.Genet.15:265-94;在此将两篇都引入作为参考。本领域技术人员可以常规地生产删除-,插入-或置换-型突变并鉴定含有所需全长野生型序列或其片段特征的那些所得到的突变体,例如,保持激素,细胞因子,抗原结合或其他生物活性的那些。
此外,或可替换地,变体多核苷酸序列可以编码含有“非保守”置换的变体氨基酸序列,其中置换的氨基酸具有与置换的氨基酸不同的结构或化学特征。变体免疫球蛋白编码序列还可以编码含有氨基酸插入或删除或两者的变体氨基酸序列。此外,变体免疫球蛋白编码序列可以编码与参照多肽序列相同的多肽,但是由于遗传密码的简并,具有参照多核苷酸序列一个或多个碱基改变的多核苷酸序列。
当涉及本发明的重组免疫球蛋白时,术语“片段”意思是具有与相应的全长免疫球蛋白的部分但不是全部的氨基酸序列相同的氨基酸序列的多肽,其基本上保留与相应的全长蛋白相同的生物功能或活性,或保留相应全长蛋白的至少一种功能或活性。片段优选包括全长免疫球蛋白的至少20-100个邻接氨基酸残基,并优选,保留与全长抗体结合相同抗原的能力。
如在此所用的,术语“序列同一性”意思是使用序列比对程序比对时,两个或多个比对的序列相同的核酸或氨基酸序列。在此的术语“%同源性”和在此的术语“%同一性”交替使用并指的是使用序列比对程序比对时,两个或多个比对序列之间的核酸或氨基酸序列同一性的水平。例如,如在此所用的,80%同源性意思是通过限定的算法测定相同的物质为80%序列同一性,并因此给定序列的同系物在给定序列的长度具有高于80%的序列同一性。
可以进行用于比较的最佳序列比对,例如,通过Smith和Waterman的局部同源性算法,Adv.Appl.Math.2:482,通过Needleman和Wunsch的同源性比对算法,1970,J.Mol.Biol.48:443,通过Pearson和Lipman的相似性方法的探寻,1988,Proc.Natl.Acad.Sci.USA 85:244,通过这些算法的计算机化执行(Wisconsin Genetics软件包中的GAP,BESTFIT,FASTA和TFASTA,Genetics Computer Group,Madison,Wis.),通过BLAST算法,Altschul等,1990,J Mol.Biol.215:403-410,软件通过生物信息网址的国家中心公众可以获得(参见nlm.nih.gov/),或通过视觉观察(总地参见,Ausubel等,下文)。为了本发明的目的,最优选通过Smith和Waterman的局部同源性算法来进行用于比较的最佳序列比对,1981,Adv.Appl.Math.2:482。还可以参见Altschul等,1990和Altschul等,1997。
在两个或多个核酸或蛋白序列范围内的术语“相同的”或百分比“同一性”指的是为最大相应性比较和比对时,两个或多个相同的或具有特定百分比的相同氨基酸残基或核苷酸的序列或子序列,如使用在此所述的一种序列比较算法如Smith-Waterman算法,本领域已知的其他算法,例如,BLAST,或通过视觉观察所测量的。
根据本发明,还包括的是序列变体,其编码自我加工裂解多肽和多肽本身,具有与天然序列80%、85%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%(以及80和100之间的所有整数)或更多的序列同一性。还包括的是表示至少5个,至少10个或至少15个单体连续链的多肽的氨基酸片段;以及根据所述的同一性条件与其同源的片段;和表示至少15个,至少30个或至少45个单体的连续链的核酸序列的片段。
如果两个序列在中等至高严谨杂交和洗涤条件下相互特异性杂交,认为核酸序列与参照核酸序列“选择性杂交”。杂交条件是基于核酸结合复合物或探针的熔化温度(Tm)。例如,“最大严谨”通常发生在Tm-5℃(比探针的Tm低5℃);“高严谨”在低于Tm约5-10℃;“中等严谨”在低于探针的Tm约10-20℃;和“低严谨”在低于Tm约20-25℃。在功能上,最大严谨条件可以用来鉴定与杂交探针具有严格同一性或接近严格同一性的序列;而高严谨条件用来鉴定与探针具有约80%或更高序列同一性的序列。
中等和高严谨杂交条件是本领域公知的(参见,例如,Sambrook等,1989,第9和11章,和Ausubel,F.M.等,1993)。高严谨条件的一个实例包括在50%甲酰胺,5×SSC,5×Denhardt’s溶液,0.5%SDS和100μg/ml变性载体DNA中在约42℃杂交,接着在2×SSC和0.5%SDS中在室温洗涤两次,在0.1×SSC和0.5%SDS中在42℃再洗涤两次。认为编码具有与天然产生的目标蛋白相同生物活性的多肽并在高严谨杂交条件下杂交的2A序列在本发明的范围内。
作为遗传密码子简并性的结果,可以产生编码相同2A或2A样多肽序列或其他蛋白酶或信号肽酶裂解序列的多个编码序列。例如,三联体CGT编码氨基酸精氨酸。可替换地,通过CGA,CGC,CGG,AGA和AGG来编码精氨酸。因此,认识到编码片段中这样的同义密码子置换落入本发明涵盖的序列变体内。
进一步认识到这样的序列变体在高严谨条件下与亲本序列可以杂交或不可以杂交。例如,当序列变体包括亲本核苷酸编码的每个氨基酸的不同密码子时,这是可能的。无论如何,特意考虑并由本发明包括这样的变体。
抗体作为治疗形式的潜能受到目前技术的生产能力和经费的普遍限制。用于免疫球蛋白(或其他蛋白)生产的改进病毒或非病毒单个表达载体促进两个或多个编码序列的表达和传送,即,具有来自单个载体的双-或多-特异性的免疫球蛋白或其他蛋白。本发明解决了这些局限并适用于任何免疫球蛋白(即,抗体)或其片段,或其他多部分蛋白或结合蛋白对,如在此进一步详述的,包括工程化的抗体,如单链抗体,全长抗体或抗体片段,双链激素,双链细胞因子,双链趋化因子,双链受体等。
IRES
首先在piconavirusm RNA中发现了内部核糖体进入位点(IRES)(Jackson等,1990,Trends Biochem.Sci.15:477-83,和Jackson和Kaminski,1995,RNA 1:985-1000)。本领域技术人员通常使用的IRES实例包括表1中涉及的那些,以及US专利No.6,692,736中所述的那些。本领域已知的“IRES”实例包括,但不限于从小核糖核酸病毒获得的IRES(Jackson等,1990)和从病毒或细胞mRNA来源获得的IRES,如,免疫球蛋白重链结合蛋白(BiP),血管内皮生长因子(VEGF)(Huez等,1998,Mol.Cell.Biol.18:6178-6190),成纤维细胞生长因子2(FGF-2),和胰岛素样生长因子(IGFII),翻译启动因子elF4G和酵母转录因子TFIID和HAP4,从Novagen购得的脑心肌炎病毒(EMCV)(Duke等,1992,J.Virol.66:1602-9)和VEGF IRES(Huez等,1998,Mol.Cell.Biol.18:6178-90)。已经在不同的病毒中报道了IRES,如心病毒(cardiovirus),鼻病毒,口疮病毒(aphthovirus),HCV,Friend鼠白血病病毒(FrMLV)和莫洛尼氏鼠白血病病毒(MoMLV)。如在此所用的,“IRES”包括IRES序列的功能性变化,至少变化能够促进指导内部核糖体进入顺反子的启动子密码子中。IRES可以是哺乳动物,病毒或原生动物的。
IRES促进指导内部核糖体进入下游顺反子的启动密码子中,导致cap-自主翻译。因此,可以从双顺反子(或多顺反子)mRNA表达下游顺反子的产物,而不需要多蛋白的裂解或单顺反子mRNA的产生。内部核糖体进入位点大约450个核苷酸长,并且特征在于初级序列的中等保守和二级结构的强烈保守。IRES最显著的初级序列特征是富嘧啶位点,其起始点大约位于IRES 3’端上游25个核苷酸。参见Jackson等(1990)。
已经鉴定并表征了三个主要类别的小核糖核酸病毒IRES:心病毒和口疮病毒类别(例如,脑心肌炎病毒,Jang等,1990,Gene Dev 4:1560-1572);肠道病毒和鼻病毒类别(例如,脊髓灰质炎病毒,Borman等,1994,EMBO J.13:3149-3157);和甲肝病毒(HAV)类别,Glass等,1993,Virol.193:842-852)。对于头两个类别,使用两个一般的原则。首先,大部分IRES的450-核苷酸序列用来维持有助于核糖体结合和翻译启动的特定二级和三级结构。其次,核糖体进入位点是位于IRES 3’端的AUG三联体,保守寡嘧啶区域下游的大约25个核苷酸。翻译启动可以发生在核糖体进入位点(心病毒)或下一个下游AUG(肠道病毒/鼻病毒类别)。在口疮病毒中,在两个位点发生启动。HCV和pestivirus如牛病毒腹泻病毒(BVDV)或传统猪瘟病毒(CSFV)各自具有341nt和370nt长5’-UTR。这些5’-UTR片段形成相似的RNA二级结构并可以具有适度有效的IRES功能(Tsuklyama-Kohara等,1992,J.Virol.66:1476-1483;Frolov等,1998,RNA 4:1418-1435)。最近的研究表明Friend-鼠白血病病毒(MLV)5’-UTR和大鼠逆转录转座子病毒样30S(VL30)序列含有逆转录病毒来源的IRES结构(Torrent等,1996,Hum.Gene Ther 7:603-612)。
在真核细胞中,通常通过从加帽mRNA 5’端的核糖体扫描启动翻译,在启动因子的控制下。然而,已经发现几个细胞mRNA具有IRES结构来介导cap-自主翻译(van der Velde等,1999,Int J Biochem CellBiol.31:87-106)。IRES序列的实例包括,但不限于,免疫球蛋白重链结合蛋白(BiP)(Macejak等,1991,Nature 353:90-94),果蝇的antennapedia mRNA(Oh等,1992,Gene and Dev 6:1643-1653),成纤维细胞生长因子-2(FGF-2)(Vagner等,1995,Mol.Cell.Biol.15:35-44),血小板产生的生长因子B(PDGF-B)(Bernstein等,1997,J.Biol.Chem.272:9356-9362),胰岛素样生长因子II(Teerink等,(1995)Biochim.Biophys.Acta 1264:403-408),和翻译启动因子elF4G(Gan等,1996,J.Biol.Chem.271:623-626)。最近,还发现血管内皮生长因子(VEGF)具有IRES序列(Stein等,1998,Mol.Cell.Biol.18:3112-3119;Huez等,1998,Mol.Cell.Biol.18:6178-6190)。IRES序列的更多实例包括小核糖核酸病毒HAV(Glass等,1993,Virology 193:842-852);EMCV(Jang和Wimmer,1990,Gene Dev.4:1560-1572);脊髓灰质炎病毒(Borman等,1994,EMBO J.13:3149-3157);HCV(Tsukiyama-Kohara等,1992,J.Virol.66:1476-1483);pestivirus BVDV(Frolov等,1998,RNA.4:1418-1435);Leishmania LRV-1(Maga等,1995,Mol.Cell.Biol.15:4884-4889);逆转录病毒:MoMLV(Torrent等,1996,Hum.Gene Ther.7:603-612)。VL30,Harvey鼠肉瘤病毒,REV(Lopez-Lastra等,1997,Hum.Gene Ther.8:1855-1865)。可以使用本领域已知的标准重组和合成方法制备IRES。为了克隆方便,可以将限制位点工程化至待使用的IRES片段末端之中。
为了从病毒或非病毒载体决定的单个转录产物表达两个或多个蛋白,内部核糖体进入位点(IRES)序列通常用来驱动第二,第三,第四个编码序列等的表达。当通过IRES连接两个编码序列时,第二个编码序列的翻译表达水平通常显著降低(Furler等,2001,Gene Therapy 8:864-873)。实际上,使用IRES来控制可操纵地连接相同启动子的两个或多个编码序列的转录导致第二个,第三个等的编码序列相对于邻接启动子的编码序列较低的表达水平。此外,IRES序列可以足够长来影响完成载体的包装,例如,eCMV IRES具有507个碱基对长。
多蛋白(作为初级翻译产物)形式的蛋白表达是适用于许多病毒复制的策略,包括但不限于,小核糖核酸病毒科。在翻译时,病毒编码的自我加工肽介导多蛋白的快速分子内(cis)裂解来产生分开的(成熟)蛋白产物。本发明提供了优于使用IRES的优势,因为提供了用于重组蛋白或多肽表达的载体,该载体包括自我加工肽序列(在此通过2A肽序列举例说明)或其它蛋白酶裂解位点,其促进了使用单个启动子的两个或多个蛋白或多肽编码序列的表达,其中两个或多个蛋白或多肽以有利的摩尔比表达。对于免疫球蛋白,通过用于一个重链的编码序列和用于一个或两个轻链的编码序列来编码多蛋白,每个其中含有编码的自我加工位点或蛋白酶识别位点。
在含有蛋白内含子的构建体中,只存在各自一个重链和轻链片段,以框内容和多蛋白表达,在两个免疫球蛋白链之间具有蛋白内含子,具有合适的特征以能够在蛋白内含子-免疫球蛋白链连接处裂解但两个免疫球蛋白不再连接。在另一个含有蛋白内含子的构建体中,存在一个或多个其它的免疫球蛋白片段,任选通过裂解位点与第一个和/或第二个片段隔开。例如,使用蛋白内含子方法来表达一个重链片段和一个轻链片段或表达一个重链和两个轻链等。
如上定义的“自我加工裂解位点”或“自我加工裂解序列”指的是DNA编码序列或氨基酸序列,其中翻译时,包括自我加工裂解位点的多肽发生快速分子内(cis)裂解来产生分开的成熟蛋白产物。这样的“自我加工裂解位点”也可以称为共翻译或翻译后加工裂解位点,在此通过2A位点,序列或结构域或蛋白内含子来举例说明。2A位点,序列或结构域证明了翻译效果,通过改变核糖体促进酯键水解的能力,因此以允许分开的下游翻译产物进行合成的方式从翻译复合物中释放多肽(Donnelly,2001)。或者,2A位点或结构域证明了“自我蛋白酶解”或“裂解”,通过以cis裂解其自身的C-端来产生初级裂解产物(Furler和Palmnberg,1990,Ann.Rev.Microbiol.44:603-623)。其它蛋白酶识别序列,包括信号肽酶裂解位点可以取代自我加工位点。蛋白内含子在多蛋白中也是有用的。
蛋白内含子
如在此所用的,蛋白内含子是表达的蛋白内的片段,通过N-蛋白外显子结合初级表达产物的N-端,通过C-蛋白外显子结合初级表达产物的C-端。天然产生的蛋白内含子介导蛋白内含子的切除以及N-和C-蛋白外显子的再连接(蛋白连接)。然而,在本发明表达产物的范围内,蛋白内含子的初级序列或侧翼蛋白外显子氨基酸序列使得在蛋白外显子的连接不存在或降低或最小量的蛋白外显子连接下发生蛋白主链的裂解,使得蛋白外显子蛋白从初级翻译产物(多蛋白)中释放出来而没有连接形成融合蛋白。初级表达产物的蛋白内含子部分(通过mRNA合成的蛋白,在任何蛋白酶解裂解之前)介导N-蛋白外显子/蛋白内含子处的蛋白酶解裂解和蛋白内含子/C-蛋白内含子连接。通常,天然产生的蛋白内含子还介导N-蛋白外显子和C-蛋白外显子的剪接在一起(通过形成肽键的连接)。然而,在本发明中,因为应用于表达两个多肽的目标(如通过抗体分子的重链和轻链特意举例说明的),优选没有发生蛋白连接。这可以通过引入蛋白内含子来实现,该蛋白内含子天然或通过突变而不具有连接活性。或者,通过突变来改变剪接位点处或邻近的氨基酸来防止释放蛋白的连接,因此防止剪接。参见,Xu和Perler,1996,EMBO J.15:5146-5153;通常在C-蛋白外显子的起点处产生Ser、Thr或Cys。
蛋白内含子是一类蛋白质,只在其它蛋白的基因内发现它们的基因。与称为蛋白外显子的侧翼宿主基因一起,将蛋白内含子转录为单个mRNA,并作为单个多肽翻译。在翻译后,蛋白内含子启动自体催化事件来除去自身并使用新的多肽键连接侧翼宿主蛋白片段。该反应只通过蛋白内含子来催化,不需要其它细胞蛋白,辅因子或ATP。在各种单细胞生物体中发现蛋白内含子,并且它们具有不同的大小。许多蛋白内含子含有核酸内切酶结构域,其引起它们在基因组内的移动性。
蛋白内含子介导的反应已经用于生物技术中,尤其用于体外情况中,如用于纯化和用于蛋白质芯片构建,和用于植株改良中(Perler,F.B.2005,IUBMB Life 57(7):469-76)。已经将突变引入天然蛋白内含子核苷酸序列中,并且报道了这些突变中的一些具有改变的特征(Xu和Perler,1996,EMBO J.15(9),5146-5153)。除了蛋白内含子,还已知细菌蛋白内含子样(BIL)结构域和hedgehog(Hog)自体加工结构域,Hog/蛋白内含子(HINT)超家族的其它2成员催化通过相似机理的翻译后自我加工(Dassa等,2004,J.Biol.Chem.279(31):32001-32007)。
蛋白内含子作为特定宿主蛋白中的框内插入产生。在自我剪接反应中,蛋白内含子从前体蛋白切除它们自身,同时侧翼片段,蛋白外显子,变成连接的来恢复宿主基因功能。这些序列还含有核酸内切酶功能,引起它们在基因组内的移动性。蛋白内含子以各种大小(134至1650个氨基酸)产生,并且已经在真细菌,真核生物和archaea中得到鉴定。使用模式剪接/报告系统的实验已经表明可以将核酸内切酶,蛋白裂解和蛋白剪接功能分开(Xu和Perler,1996,EMBO J.15:5146-5153)。以下描述的实施例使用了来自嗜热极端古菌(Pyrococcushorikoshii)Pho Pol I,酿酒酵母VMA和集胞藻的蛋白内含子,与来自抗体重链和轻链的序列形成融合蛋白。设计蛋白内含子的突变来删除蛋白内含子的剪接能力,导致单个多肽经受自我裂解来正确产生编码的抗体重链和轻链。可以将这种策略相似地用于其它多链蛋白,激素或细胞因子的表达中,并且还适用于前体蛋白(前蛋白)加工成成熟的生物活性形式。尽管在此特意举例说明使用极端嗜热古菌Pho Pol I,酿酒酵母VMA和集胞藻的蛋白内含子,本领域已知的其他蛋白内含子也可用于本发明的多蛋白表达载体和方法中。
除了极端嗜热古菌Pho Pol I,酿酒酵母VMA和集胞藻蛋白内含子以外的许多其它蛋白内含子是本领域已知的(参见,例如,Perler,F.B.2002,InBase,the Intein Database,Nucl.Acids.Res.30(1):383-384和the Intein Database and Registry,通过New England Biolabs网址可获得,例如,http://tools.neb.com/inbase/)。已经在各种生物体如酵母,分枝杆菌和极端嗜热古细菌中鉴定出蛋白内含子。特定的蛋白内含子具有核酸内切酶活性以及位点特异性蛋白切割和剪接活性。核酸内切酶活性对于本发明的实践不是必需的;可以删除核酸内切酶编码片段,只要保留蛋白裂解活性。
已经很详细地研究了蛋白剪接过程的机理(Chong等,1996,J.Biol.Chem.271:22159-22168;Xu和Perler,1996,EMBO J 15:5146-5153)并且已经在蛋白内含子和蛋白外显子剪接点处发现了保守的氨基酸(Xu等,1994,EMBO J 13:5517-5522)。在此所述的构建体含有与第一个编码序列的5’-端融合的蛋白内含子序列,第二个编码序列在框内融合蛋白内含子的C-端。可以从任何一种已知的蛋白选择合适的蛋白内含子序列来含有蛋白剪接序列。含有所有已知蛋白内含子的数据库可以在环球网上找到(Perler,F.B.1999,Nucl.Acads Res.27:346-347)。将蛋白内含子编码序列在3’端融合(框内)第二个编码序列的5’端。为了将该蛋白靶向特定细胞器,可以将合适的肽信号融合蛋白的编码序列。
在第二个蛋白外显子编码序列后,可以重复蛋白内含子编码序列-蛋白外显子编码序列,重复数量为用于在相同细胞中多个蛋白表达所需的那样多。对于含有多个蛋白内含子构建体,可以使用来自不同来源的蛋白内含子序列。在最后一个待表达基因的序列之后,理想地插入转录终止序列,并有利地包括多腺苷酸序列。多腺苷酸化序列和终止序列的次序可以按照本领域技术人员所知的。在一个实施方案中,多腺苷酸化序列可以在终止序列之前。
已经设计了修饰的蛋白内含子剪接单体,使得修饰的目标蛋白内含子可以催化从蛋白内含子切除蛋白外显子但不能催化蛋白外显子的连接(例如,参见,US专利7026526和US专利公开20020129400)。Pyrococcus物种GB-D DNA聚合酶中C-端蛋白外显子连接的突变产生改变的剪接序列,该序列包括蛋白外显子和蛋白外显子的裂解但防止蛋白外显子随后的连接(Xu和Perler,1996,EMBO J 15:5146-5153)。丝氨酸538突变成丙氨酸或甘氨酸(Ser至Ala或Gly)诱导了裂解但防止了连接。在这样的位置,Ser至Met或Ser至Thr还用来获得多蛋白的表达,该多蛋白裂解成分开的片段和至少部分不再连接。由于C-端蛋白外显子连接处氨基酸与蛋白内含子的相对保守,其它蛋白内含子剪接单体中等价残基的突变还可以防止蛋白外显子片段的连接。在低保守/同源性的情况中,例如,C-端蛋白外显子的头几个,例如,约五个残基和/或蛋白内含子片段的最后几个残基有系统地改变,并筛选给定蛋白外显子片段支持裂解但不剪接的能力,特别是在此公开的和本领域已知的蛋白外显子片段。存在不含有核酸内切酶结构域的蛋白内含子;这些包括集胞藻dnaE蛋白内含子和蟾蜍分枝杆菌GyrA蛋白(Magnasco等,Biochemistry,2004,43,10265-10276;Telenti等,1997,J.Bacteriol.179:6378-6382)。其它已经在自然中发现或已经通过从编码含核酸内切酶的蛋白内含子的序列除去核酸内切酶编码结构域人工形成(Chong等,1997,J.Biol.Chem.272:15587-15590)。在理想的情况中,最初选择素内含子使得其由执行剪接功能需要的最小数量氨基酸构成,如来自蟾蜍分枝杆菌GyrA蛋白的蛋白内含子(Telenti等,1997,上文)。在可替换的实施方案中,选择没有核酸内切酶的蛋白内含子,如来自蟾蜍分枝杆菌GyrA蛋白或酿酒酵母VMA蛋白内含子的已经修饰除去核酸内切酶结构域的蛋白内含子(Chong等,1997,上文)。
蛋白内含子剪接单体的进一步修饰可以改变裂解反应的反应速率,使得通过简单修饰剪接单体的基因序列来控制蛋白含量。
在一个实施方案中,将C-端蛋白外显子的第一个残基工程化来含有甘氨酸或丙氨酸,显示出该修饰防止使用古菌种GB-D DNA聚合酶的蛋白外显子连接(Xu和Perler,1996,EMBO J 15:5146-5153)。在该实施方案中,优选的C-端蛋白外显子蛋白在天然氨基酸序列中的N-甲硫氨酸之后天然含有甘氨酸或丙氨酸残基。蛋白外显子的甘氨酸或丙氨酸与蛋白内含子C-端的融合在多蛋白加工后提供了天然的氨基酸序列。在另一个实施方案中,通过改变天然序列或通过将另外的氨基酸残基天价之天然序列的N-端上,将人造甘氨酸或丙氨酸置于C-端蛋白外显子中。在该实施方案中,在多蛋白加工后,蛋白的天然氨基酸序列将改变一个氨基酸。在进一步的实施方案中,用于本发明中的其它修饰描述于US7026526中。
古菌种GB-D DNA聚合酶蛋白内含子的DNA序列是US专利No.7,026,526的SEQ ID NO:1。N-端蛋白外显子连接点是“aac”序列(SEQ ID NO:1的核苷酸1-3)并编码天冬酰胺残基。天然GB-D DNA聚合酶前体蛋白的剪接为点之后为SEQ ID NO:1中的核苷酸3和核苷酸1614。C-端蛋白外显子连接点是“agc”序列(SEQ ID NO:1的核苷酸1615-1617),其编码丝氨酸残基。C-端蛋白外显子丝氨酸突变成丙氨酸或甘氨酸形成修饰的蛋白内含子剪接序列,该序列能够促进多蛋白的切除但不促进蛋白外显子单体的连接。
蟾蜍分枝杆菌GyrA最小蛋白内含子的DNA序列是US专利7,026,526的SEQ ID NO:2。N-端蛋白外显子连接点是“tac”序列(SEQID NO:2的核苷酸1-3)并编码酪氨酸残基。前体蛋白中剪接位点后为SEQ ID NO:2的核苷酸3和核苷酸597。C-端蛋白内含子连接点是“acc”序列(SEQ ID NO:2的核苷酸598-600)并编码苏氨酸残基。C-端蛋白内含子苏氨酸土变成丙氨酸或甘氨酸形成修饰的蛋白内含子剪接序列,该序列促进多蛋白的切除但不促进蛋白外显子单体的连接。
2A系统
现在转向本发明的2A蛋白酶加工实施方案,2A的活性涉及密码子之间的核糖体跳跃,其防止了肽键的形成(de Felipe等,2000,HumanGene Therpy 11:1921-1931;Donnelly等,2001,J.Gen.Virol.82:1013-1025),尽管已经认为结构域作用更象自溶酶(Ryan等,1989,Virology 173:35-45)。已经建立了其中将口蹄疫病毒(FMDV)2A编码片段克隆至表达载体并转染至靶细胞中的研究,人造报告多蛋白的FMDV 2A裂解在多种异种表达系统中是有效的(麦芽溶菌产物和转基因烟草植物(Halpin等,U.S.专利No.5846767(1998)和Halpin等,1999,The Plant Journal 17:453-459);Hs 683人神经胶质瘤细胞系(deFelipe等,1999,Gene Therapy 6:198-208;此后称为“de Felipe II”);兔子网织红细胞溶菌产物和人HTK-143细胞(Ryan等,1994,EMBOJ.13:928-933);和昆虫细胞(Roosien等,1990,J.Gen.Virol.71:1703-1711)。已经表明对于生物相关分子的异种多蛋白的FMDV 2A介导的裂解为IL-12(p40/p35杂二聚体;Chaplin等,1999,J.InterferonCytokine Res.19:235-241)。在转染的COS-7细胞中,FMDV 2A介导了p40-2A-p35多蛋白裂解成具有IL-12相关活性的生物功能性p40和p35亚基。
已经将FMDV 2A序列引入表达载体中,单独或结合不同IRES序列,来构建双顺反子,三顺反子和四顺反子载体。Furler(2001)证明了动物中2A介导的基因表达的效率,使用编码α-突触核蛋白和EGFP或Cu/Zn超氧化物歧化酶(SOD-1)的重组腺相关病毒(AAV)载体并通过FMDV 2A序列连接EGFP。EGFP和α-突触核蛋白以相对于相应的基于IRES的载体显著更高的水平从包括2A序列的载体表达,而SOD-1以相当或略高的水平得到表达。
通过源自小核糖核酸病毒的病毒序列来举例说明编码自我加工裂解位点的DNA序列,包括但不限于肠道病毒,心病毒,口疮病毒或口蹄疫病毒(FMDV)。在优选的实施方案中,自我加工裂解位点编码序列源自FMDV。自我加工裂解位点包括但不限于2A和2A样结构域(Donnelly等,2001,J.Gen.Virol.82:1027-1041,在此以其整体引入作为参考)。
或者,蛋白酶识别位点可以替代自我加工位点。合适的蛋白酶和同源识别位点包括,但不限于,弗林蛋白酶,RXR/K-R(SEQ ID NO:1);IPNV的VP4,S/TXA-S/AG(SEQ ID NO:2);烟草蚀刻病毒(TEV)蛋白酶,EXXYXQ-G(SEQ ID NO:3);鼻病毒的3C蛋白酶,LEVLFQ-GP(SEQ ID NO:4);PC5/6蛋白酶;PACE蛋白酶,LPC/PC7蛋白酶;肠激酶,DDDDK-X(SEQ ID NO:5);因子Xa蛋白酶,IE/DGR-X(SEQ ID NO:6);凝血酶,LVPR-GS(SEQ ID NO:7);genenase I,PGAAH-Y(SEQ ID NO:8);和MMP蛋白酶;内部可裂解信号肽,其实例是C型流感病毒的内部可裂解信号肽(Pekosz A.1998,Proc.Natl.Acad.Sci.USA 95:I13222-13238)(MGRMAMKWLVVIICFSITSQPASA,SEQ ID NO:11)。可以作为多蛋白的一部分以反式或顺式提供蛋白酶,使得在相同转录内得到编码并与剩余的初级翻译产物分离,例如,通过自我加工位点或蛋白酶识别位点。
随着越来越多的抗体治疗剂批准用于临床应用,在过去20年中制造这些治疗蛋白的方法中存在稳定的提高(Wurm,FM,2004,“Production of recombinant protein therapeutics in cultivated mammaliancells”(在培养的哺乳动物中重组蛋白治疗剂的生产)Nat.Biotechnol.22(11):1393)。然而,工业上仍然希望更有效和可靠的生产方法。一些所需的特征包括更高水平的抗体分泌至培养基中,生产细胞系提高的遗传稳定性和细胞系更高的传代速度。
在我们对更有效生产治疗性抗体方法的研究中,我们已经研发了从单个开放阅读框表达抗体重链和轻链的方法。在一个这样的方法中,将蛋白内含子编码序列用来隔开单个开放阅读框(sORF)内的抗体重链和轻链。通过这样的sORF抗体表达技术给予的优势包括操纵用于重链和轻链的基因用量比例的能力,用于ER中多亚基装配的重链和轻链多肽的接近性和高效蛋白分泌的潜能。
其它用于在哺乳动物细胞中表达单克降抗体的技术涉及引入两个分开的ORF中的重链和轻链基因,每个ORF具有自己的启动子和调控序列。启动子干扰是与此方法相关的关注问题。将抗体重链和轻链序列引入表达细胞系中的可替换方法是使用内部核糖体进入位点(IRES)来隔开抗体重链和轻链编码序列。由于在翻译IRES序列的编码序列下游中降低的效率,该方法还没有广泛使用。最近,已经描述了使用编码口蹄疫病毒肽(2A肽)的序列来隔开抗体重链和轻链编码序列的方法(Fang等,2005,Nat.Biotechnol.23(5):584-90)。在该方法中,抗体重链和轻链以及2A肽作为单个mRNA转录。然而,在它们进入内质网(ER)之前裂解抗体重链和轻链。此外,在重链和轻链裂解/分开后在重链的C-端留下两个非天然氨基酸。本发明的蛋白内含子表达系统在根本上是不同的。其不同于2A方法,因为翻译重链和轻链多肽并作为单个多蛋白带至ER中。有利地,不需要将非天然氨基酸包括在成熟抗体分子中。
以下的描述是在抗体生产载体的所有内容中,载体包括如下的表达盒:启动子-分泌信号-重链-wt蛋白内含子,如极端嗜热古菌Pol I蛋白内含子-分泌信号-轻链-polyA;启动子-分泌信号-重链-修饰的蛋白内含子如极端嗜热古菌Pol I蛋白内含子-轻链-polyA;启动子-分泌信号-重链-Pol修饰的蛋白内含子如极端嗜热古菌Pol I蛋白内含子-分泌信号-轻链-Pol修饰的蛋白内含子如极端嗜热古菌Pol I蛋白内含子-分泌信号-轻链-polyA;启动子-分泌信号-重链-wt或修饰的蛋白内含子如p.horikoshii Pol I蛋白内含子-修饰的分泌信号-轻链-polyA;启动子-分泌信号-轻链-wt或修饰的蛋白内含子如极端嗜热古菌Pol I蛋白内含子-修饰的分泌信号-重链-polyA;启动子-分泌信号-重链-wt或修饰的蛋白内含子如极端嗜热古菌Pol I蛋白内含子-修饰的分泌信号-轻链-polyA;启动子-分泌信号-重链-弗林蛋白酶裂解位点-修饰的蛋白内含子如极端嗜热古菌Pol I蛋白内含子-弗林蛋白酶裂解位点-修饰的蛋白内含子如极端嗜热古菌Pol I蛋白内含子-弗林蛋白酶裂解位点-轻链-弗林蛋白酶裂解位点-修饰的蛋白内含子如极端嗜热古菌Pol I蛋白内含子-弗林蛋白酶裂解位点-轻链-polyA。在更多的构建体中,使用修饰的Psp-GBDPol蛋白内含子。
在此所述的特异举例说明的多蛋白使用在框内与各自在其之前和之后的D2E7重链和轻链融合的极端嗜热古菌Pol I蛋白内含子。在-1位的氨基酸是赖氨酸,在+1位的氨基酸是甲硫氨酸,轻链信号肽的第一个氨基酸。在+1位使用甲硫氨酸允许消除剪接,重链和轻链的连接,如我们在之后的部分中所证明的,理解在+1位需要亲核氨基酸残基如丝氨酸,半胱氨酸或苏氨酸来允许剪接。除了wt蛋白内含子,改变最后一个氨基酸天冬酰胺和第二个至最后一个组氨酸的突变可以用作这些通常消除剪接并防止在N-端剪接连接处裂解的突变(Mills,2004;Xu,1996,Chong,1997)。或者,还可以使用改变蛋白内含子第一个氨基酸的突变,这样的突变通常消除剪接,防止C-端剪接连接处的裂解,并且消除或防止N-端剪接连接处减弱的裂解(Nichols,2004;Evans,1999,和Xu,1996)。例如,这已经证明了“完全阻断剪接并抑制分支中间产物的形成,导致在两个剪接连接处的裂解”(Xu,M.Q.,EMBOvol.15:5146-5153)。
在可替换形式的多肽中,弗林蛋白酶裂解位点的包括允许连接序列的改变,随后在分泌过程中通过弗林蛋白酶裂解切除。表9中给出了蛋白内含子的野生型序列。在古菌GB-D的DNA聚合酶中,裂解/剪接连接是RQRAIKILAN/S(SEQ ID NO:138)(N-端)和HN/SYYGYYGYAK(SEQ ID NO:139)(C端)。理想地,通过HindIII裂解切除核酸内切酶编码片段。裂解,剪接和核酸内切酶功能相互分开,并且该核酸内切酶片段可以由小的连接物取代来形成仍然能够裂解和剪接的迷你-蛋白内含子(Telenti等,1997,J.Bacteriol.179:6378-6382)。还注意到至少一个酵母蛋白内含子在哺乳动物细胞中起作用(Mootz等,2003,J.Am.Chem.Soc.125:10561-10569)。参见用于D2E7(免疫球蛋白)蛋白内含子构建体的编码序列和氨基酸序列的表8A和8B;表8C提供了D2E7蛋白内含子构建体表达载体的完整核苷酸序列。描述了编码D2E7(Humira-阿达木单抗(adalimumab)的注册商标)重链的融合构建,该重链融合修饰的Psp Pol1蛋白内含子,该内含子自身融合D2E7轻链的编码片段。可以扩增轻链序列,蛋白内含子,信号肽或蛋白酶裂解位点将其与剩余的多蛋白隔开。在该实施方案中,成熟重链之前为重链分泌信号。已经按照上述的将蛋白内含子改变,将丝氨酸1改变成苏氨酸,切除内部Hind III片段来除去核酸内切酶活性。将蛋白内含子框内融合成熟D2E7轻链片段。可替换的实施方案将包括成熟轻链的轻链分泌信号5’。参见图10和11用于D2E7蛋白内含子构建体和表达载体的图示,表8A-8C用于表达构建体和完整表达载体的核苷酸序列以及D2E7蛋白内含子构建体的氨基酸序列。
信号肽和信号肽酶
信号假设,其中蛋白在其氨基酸序列内含有用于蛋白靶向膜的信息,已经知道三十多年了。Milstein和同事发现来自骨髓瘤细胞的IgG的轻链以较高的分子量形式合成并将内质网泡囊(微粒体)加入翻译系统时转化成成熟形式,并提出基于这些结果的模型,其中微粒体含有蛋白酶,该蛋白酶通过除去氨基-端延伸肽将前体蛋白形式转化成成熟形式。信号假设很快得到扩充来包括定位于不同胞内膜如线粒体和叶绿体的蛋白质内的不同靶向序列。后来发现这些不同的靶向序列通过特定的信号肽酶(SPase)从输出的蛋白得到裂解。
在细菌中存在至少三种涉及裂解信号肽的不同SPase。SPase I可以处理通过SecYEG途径或双精氨酸定位(Tat)途径输出的非脂蛋白底物。通过SPase II裂解通过Sec途径输出的脂蛋白。SPase裂解为II型分泌装置组成部分的IV型prepilin和prepilin-样蛋白。
在真核细胞中,通过将蛋白共翻译或翻译后靶向Sec61移位机制的信号肽来介导将蛋白质靶向内质网(ER)膜。ER信号肽具有与细菌复本那些相似的特征。通过信号肽酶复合物(SPC)输出至ER腔内后,ER信号肽从输出的蛋白中裂解出来。将蛋白分至真核细胞内不同位置的信号肽必须是不同的,因为这些细胞含有许多不同膜状和水成区隔。被靶向ER的蛋白通常含有可裂解的信号序列。令人惊讶地,许多人造肽可以用作移位信号。认为最重要的关键特征是超过特定极限的疏水性。ER信号肽比细菌信号肽具有更高含量的亮氨酸残基。从核糖体出现后,信号识别颗粒(SRP)结合可裂解信号肽。将初生的蛋白质靶向ER膜需要SRP。蛋白质移位至ER腔后,通过SPC加工输出的蛋白。另一个实施方案利用了在真核细胞中天然产生的信号(前导)肽加工酶。在真核细胞中,通过将蛋白共翻译或翻译后靶向Sec61移位机制的信号肽来介导将蛋白质靶向内质网(ER)膜。通过信号肽酶复合物(SPC)输出至ER腔内后,ER信号肽从输出的蛋白中裂解出来。大部分已知的ER信号肽是N-端可裂解的或内部不可裂解的。最近,发现多种病毒多蛋白如在丙肝病毒,汉坦病毒,黄病毒,风疹病毒和C型流感病毒中发现的那些含有很可能通过ER SPC裂解的内部信号肽。这些关于病毒多蛋白成熟的研究表明SPC不仅可以裂解位于氨基端的信号肽,而且可以裂解之后的信号肽。
Presenilin-型天冬氨酸蛋白酶信号肽肽酶(SPP)裂解它们跨膜片段内的信号肽。SPP对于人类中信号肽产生的HLA-E抗原决定部分的产生是必需的。最近,发现多种病毒多蛋白如在丙肝病毒,汉坦病毒,黄病毒,风疹病毒和C型流感病毒中发现的那些含有很可能通过ERSPC裂解的内部信号肽。因此,预测的信号肽酶底物特异性序列的突变可以阻断病毒的感染性。这些对于多蛋白成熟的研究也是非常有趣的,因为它们显示出SPC不仅可以裂解位于氨基端的信号肽,而且可以裂解之后的信号肽。信号肽酶是本领域公知的。参见,例如,PaetzelM.2002,Chem.Rev.102(12):4549;Pekosz A.1998,Proc.Natl.Acad.Sci.USA.95:13233-13238;Marius K,2002,Molecular Cell 10:735-744;Okamoto K,2004,J.Virol.78:6370-6380,Vol.78;Martoglio B.2003,Human Molecular Genetics 12:R201-R206;和Xia W,2003,J.Cell.Sci.116:2839-2844。
通过将蛋白共翻译或翻译后靶向Sec61移位机制的信号肽来介导将蛋白质靶向内质网(ER)膜。通过信号肽酶复合物(SPC)输出至ER腔内后,ER信号肽从输出的蛋白中裂解出来。大部分已知ER信号肽是N-端可裂解的或内部不可裂解的。最近,发现多种病毒多蛋白如在丙肝病毒,汉坦病毒,黄病毒,风疹病毒和C型流感病毒中发现的那些含有很可能通过ER SPC裂解的内部信号肽。这些对于多蛋白成熟的研究也是非常有趣的,因为它们显示出SPC不仅可以裂解位于氨基端的信号肽,而且可以裂解之后的信号肽。
本发明利用了内部可裂解信号肽,用于在单个转录产物中的多肽表达。然后通过SPC裂解信号转录的多肽,留下分开的单个肽或待装配成蛋白质的单个肽。本发明的方法适用于在单个转录的多肽中表达免疫球蛋白重链和轻链,接着裂解,然后装配成成熟的免疫球蛋白。该技术适用于多肽细胞因子,生长因子,或各种其他蛋白质,例如,单个转录多肽中的IL-12p40和IL-12p35,然后在单个转录多肽中装配成IL-12,或IL-12p40和IL-23p19,然后装配成IL-23。
信号肽酶方法适用于哺乳动物表达载体,其导致从前体或多蛋白表达功能性抗体或其他加工过的产物。在抗体的情况中,作为含有重链和轻链的多蛋白从载体产生,重链和轻链之间的干预序列为内部可裂解信号肽。该内部可分离信号肽可以通过ER中的蛋白酶(主要的信号肽酶),presenilin或presenilin-样蛋白酶来裂解,留下重链和轻链折叠并装配来产生功能性分子,并且理想地将其分泌。除了源自丙肝病毒的内部可裂解信号肽,可以通过ER中的蛋白酶裂解的其他内部可裂解序列是它的替代物。相似地,本发明的实践不需要限于其中信号肽酶实现裂解的宿主细胞,而且还包括蛋白酶,包括但不限于,presenilin,presenilin-样蛋白酶,和其他用于加工多肽的蛋白酶。这些蛋白酶已经在引用的文献中进行了综述。
此外,本发明不限于免疫球蛋白重链和轻链的表达,而且还包括在单个转录产物中表达的其他多肽和多蛋白,接着通过内部信号肽裂解来释放每个单独的肽或蛋白质。这些蛋白质可以在成熟产物中装配在一起或不装配。
还在本发明范围内的是表达构建体,其中单个肽以可替换的次序存在,即,“肽1-内部可裂解信号肽-肽2”或“肽2-内部可裂解信号肽-肽1”。本发明进一步包括通过内部可裂解信号肽连接的多于两个的肽的表达,如“肽1-内部可裂解信号肽-肽2-内部可裂解信号肽-肽3”等。
此外,本发明涉及I型和II型跨膜蛋白的表达和表达构建体周围的其他蛋白酶裂解位点的添加。一个实例是在免疫球蛋白重链之后添加弗林蛋白酶或PC5/6裂解位点来促进重链肽羧基端的其他氨基酸残基的裂解,例如,“重链-弗林蛋白酶裂解位点-内部可裂解信号肽-轻链”。本发明还包括分开或串联的多于一个的内部可裂解信号肽,例如,“重链-弗林蛋白酶裂解位点-内部可裂解信号肽-内部可裂解信号肽-轻链”。再进一步,本发明包括其中存在重链和轻链自我信号肽的维持或去除的情况,如“HC信号肽-重链-弗林蛋白酶裂解位点-内部可裂解信号肽-LC信号肽-轻链”。
以下的描述在抗体生产载体的范围中,其中一些在别处得到了描述。载体涉及包括但不限于以下的。
载体设计表

  启动子-分泌信号-重链-内部可裂解信号肽-分泌信号-轻链  -ployA  启动子-分泌信号-重链-内部可裂解信号肽-轻链-polyA  启动子-分泌信号-重链-内部可裂解信号肽-分泌信号-轻链-内部  可裂解信号肽-分泌信号-轻链-polyA  启动子-分泌信号-重链-弗林蛋白酶裂解位点-内部可裂解信号肽  -弗林蛋白酶裂解位点-分泌信号-轻链-plyA;和  启动子-分泌信号-重链-弗林蛋白酶裂解位点-内部可裂解信号肽  -弗林蛋白酶裂解位点-轻链-弗林蛋白酶裂解位点-内部可裂解信  号肽-弗林蛋白酶裂解位点-轻链-polyA。

融合构建体的特定实例编码与内部可裂解信号肽融合的D2E7(Humira/adalimumab)的重链,该信号肽自身与D2E7轻链的编码片段融合。在该实施方案中,成熟重链之前为重链分泌信号。该内部可裂解信号肽序列源自C型流感病毒。在重链的羧基端重包括弗林蛋白酶裂解位点。为了最小化对成熟抗体的影响,将重链的第三个至最后一个氨基酸残基从脯氨酸突变至精氨酸来形成弗林蛋白酶裂解位点。可替换的实施方案包括成熟轻链的轻链分泌信号5’。参见表9A-9C。该实施例中使用来自C型流感病毒的最小内部可裂解信号肽序列(MGRMAMKWLVVIICFSITSQPASA,SEQ ID NO:11)。较大的序列还可以用来提高裂解效率。参见GenBank登录号AB126196。还可以使用编码相同氨基酸序列的各种核苷酸序列。
本发明进一步使用内部可裂解信号肽,用于单个转录产物内编码的多蛋白内的一个或多个多肽的成熟。然后通过SPC裂解单个转录的多肽,留下分开的单个肽或待装配成蛋白的单个肽。本发明适用于在单个转录的多肽中表达免疫球蛋白重链和轻链,然后装配成成熟免疫球蛋白。本发明适用于表达多肽细胞因子,生长因子,或各种其他蛋白质,例如,在单个转录多肽中表达IL-12p40和IL-12p35,然后在单个转录多肽中装配成IL-12,或IL-12p40和IL-23p 19,然后装配成IL-23。
用于本发明载体的两个或多个异种DNA序列之间2A序列或其他蛋白酶或信号肽酶裂解(识别)位点的位置亚克隆允许两个或多个基因通过单个表达载体的传送和表达。优选,自我加工裂解位点如FMDV2A序列或蛋白酶识别序列提供了独特的方式,从单个病毒载体表达和传送两个或多个蛋白,多肽或肽,其可以是例如抗体,杂二聚受体或杂二聚蛋白的单独部分。
FMDV 2A是多肽片段,其在FMDV基因组中起作用来指导在其自身C-端的单个裂解,因此以顺式起作用。通常报道FMDV 2A结构域约十九个氨基酸长(LLNFDLLKLAGDVESNPGP,SEQ ID NO:12;TLNFDLLKLAGDVESNPGP,SEQ ID NO:13;Ryan等,1991,J.Gen.Virol.72:2727-2732),然而,少如十四个氨基酸残基的寡肽(LLKLAGDVESNPGP,SEQ ID NO:14)已经显示出能以与其在天然FMDV多蛋白加工中的作用相似的方式介导2A C-端的裂解。
已经研究了2A序列的变化介导多蛋白有效加工的能力(Donnelly等,2001)。2A序列的同系物和变体包括在本发明的范围内并包括但不限于以下的序列:
QLLNFDLLKLAGDVESNPGP,SEQID NO:15;NFDLLKLAGDVESNPGPFF,SEQ ID NO:16;LLKLAGDVESNPGP,SEQID NO:17;NFDLLKLAGDVESNPGP,SEQ ID NO:18;APVKQTLNFDLLKLAGDVESNPGP,SFQ ID NO:19;
VTELLYRMKRAETYCPRPLLAIHPTEARHKQKIVAPVKQTLNFDLLKLAGDVESNPGP,SEQ ID NO:20;LLAIHPTEARHKQKIVAPVKQTLNFDLLKLAGDVESNPGP,SEQID NO:141;
和EARHKQKIVAPVKQTLNFDLLKLAGDVESNPGP,SEQ ID NO:142
2A序列及其变体可以用来制备表达自我加工多蛋白的载体,包括其包括通过自我加工裂解位点或其他蛋白酶裂解位点连接的蛋白或多肽的编码序列的任何载体(基于质粒或病毒的),使得在由于自我加工或其他裂解位点的存在引起的多蛋白裂解后,单个蛋白以合适的摩尔比和/或含量表达。这些蛋白对于载体自身,相互或对于自我加工裂解位点例如FMDV,可以是异种的,因此用于本发明实践中的自我加工裂解位点没有识别异种蛋白和源自相同来源的编码序列,因为自我加工裂解位点作用或介导裂解的能力。
在一个实施方案中,根据本发明的载体中能够包括的FMDV 2A序列编码包括LLNFDLLKLAGDVESNPGP(SEQ ID NO:12)的氨基酸残基。或者,根据本发明的载体可以编码其他2A样片段的氨基酸残基,如Donnelly等中所述的,2001,J.Gen.Virol.82:1027-1041,并包括但不限于,来自小核糖核酸病毒,昆虫病毒,C型轮状病毒,锥体虫重复序列或细菌海栖热袍菌(thermatoga maritima)的2A样结构域。
本发明包括编码2A或2A样肽序列的核酸序列变体的用途,如2A或2A样多肽的核酸编码序列,其相对于亲本核苷酸具有一个或多个氨基酸的不同密码子。本发明特意考虑并包括这样的变体。2A肽和多肽的序列变体也包括在本发明的范围内。相似地,以顺势或反式提供的蛋白酶可以通过多蛋白片段之间的同源蛋白酶识别(裂解)位点介导蛋白酶解加工。
在使用蛋白内含子-抗体表达构建体的实验中,我们已经证明了极端嗜热古菌Pol I蛋白内含子介导的蛋白剪接反应可以在哺乳动物(293E)细胞,ER和抗体(D2E7)重链和轻链氨基酸序列范围内发生。为了在单个开放阅读框(sORF)形式的抗体表达中使用这种类型的反应,我们证明了可以使用两个构建体,pTT3-HcintLC1aa-p.hori和pTT3-HcintLC3aa-p.hori,在哺乳动物(293E)细胞,ER和抗体重链和轻链氨基酸序列范围内发生这种反应。参见表11A和12A。
在PPT3载体主链上形成这些构建体。该载体具有EB病毒(EBV)复制起点,其允许游离基因在悬浮液中的转染293E细胞(表达EB病毒核抗原1的细胞)中扩增(Durocher,2002,“High level andhigh-throughput recombinant protein production by transient transfectionof suspension-growing human 293-EBNA1 cells”(通过悬浮生长的人293-EBNA1细胞的瞬时转染的高水平和高通量的重组蛋白生产),Nucleic Acids Research 30(2):E9)。每个载体具有一个ORF,在CMV启动子的调控控制下转录表达。在ORF中,将极端嗜热古菌Pol I蛋白内含子框内插入D2E7重链和轻链之间,重链和轻链各自具有信号肽(SP)。pTT3-HcintLC1aa-p.hori和pTT3-HcintLC3aa-p.hori构建体在蛋白内含子的任一侧具有1个天然蛋白外显子氨基酸或3个天然蛋白外显子氨基酸,将D2E7抗体重链和轻链序列与蛋白内含子序列隔开。通过瞬时转染将这些构建体引入293E细胞中。分析培养液和细胞沉淀样品。
在允许分离胞质和胞内膜部分的条件下裂解细胞沉淀样品。使用蛋白质印迹(WB)分析这些部分,使用抗重链或抗κ-轻链抗体。在这些印迹中,我们看到对应于分成三个部分形式的4个蛋白物质的表达,如构建体的ORF(130kDa),源自剪接情况(80kDa)的H和L的融合体,抗体重链(50kDa)和抗体轻链(25kDa)。通过抗重链和抗轻链抗体检测头2个蛋白物质,只通过抗重链抗体检测重链,和只通过抗轻链抗体检测轻链。在这些构建体中通过重链和轻链抗体检的80kDa蛋白物质的存在证明了已经发生了蛋白剪接情况。此外,所有四个蛋白物质主要存在于亚细胞膜部分中,其含有内质网(ER)。这表明重链信号肽(在ORF开始处编码的)已经将完整多肽引至ER中,其中已经发生了剪接反应。不希望受到任何特定理论的束缚,认为游离重链和轻链多肽很可能是N-端和C-端剪接连接处裂解的结果,由不完整的剪接引起。
细胞沉淀样品还用于总RNA提取和RNA印迹分析,使用抗体重链探针和抗体轻链探针。RNA印迹分析揭示了这些sORF构建体中的三联mRNA(3.4kb),其与重链探针和轻链探针杂交,但不是分开的重链或轻链的mRNA。相反,在使用常规方法表达D2E7抗体的细胞沉淀样品中,即,引入来自两个pTT3载体中携带的两个分开ORF的抗体重链和轻链,各自使用重链和轻链探针检测重链(1.4kb)和L链(0.7kb)的mRNA。在这些对照细胞沉淀中没有检测到三联mRNA。
上述数据证明了使用含有单个ORF(D2E7重链-P.horikoshi蛋白内含子-D2E7轻链)的构建体,转录了含有全部3个蛋白的单个mRNA。该分成三个部分的信使翻译成分成三个部分的多肽,并共翻译输入至ER中,通过三联多蛋白的N-端存在的重链信号肽指引。使用该构建体,蛋白内含子-介导的蛋白剪接反应在ER内发生。这表明蛋白内含子介导的反应可以用于表达抗体以及其他多亚基分泌的蛋白,即,需要经历分泌途径的那些蛋白质,以便得到折叠和正确的翻译后修饰。
还分析了培养液。蛋白质印迹和ELISA允许检测从pTT3-HcintLC1aa-p.hori构建体表达分泌的抗体。在下文中将更详细地讨论这些研究;通过点突变和编码轻链信号肽序列内的突变已经提高了分泌的抗体表达含量。
设计突变来抑制蛋白内含子介导的连接但防止在剪接连接的N-端或C-端的裂解反应,该突变导致提高水平的抗体分泌。
为了提高的抗体分泌效率的目标,设计并测试了三种类型的点突变。第一种类型的突变在C-端蛋白外显子第一个丝氨酸残基的密码子中;这些构建体具有Ser至Met(S>M)改变(构建体pTT3-HcintLC-p.hori,构建体E和构建体A)。第二种类型的突变是在蛋白内含子第一个丝氨酸残基的编码处;这样的构建体具有Ser至Thr(S>T)改变(构建体E)。第三种类型的突变是在蛋白内含子第二个至最后一个(倒数第二个)氨基酸的组氨酸残基的密码子中;这些构建体具有His至Ala(H>A)置换突变(构建体A和构建体B)。将这些突变单独或结合引入。根据文献中所述的反应机理,设计所有突变构建体来防止N-或C-端剪接连接处的裂解和降低释放的蛋白外显子的剪接,或两者。如下所列出的,使用各种这样的构建体获得D2E7抗体的分泌。
在一个实施方案中,通过瞬时转染将这些构建体引入293E细胞中,并在7天后,通过ELISA分析来分析培养的上清液的IgG抗体滴定度。构建体pTT3-HcintLC3aa-p.hori,pTT3-HcintLC1aa-p.hori,pTT3-HcintLC-p.hori,E,A和B的抗体滴定度各自为17.0+0.6,113.8+2.6,225.8+10.0,9.3+0.5,161.7+4.4和48.2+1.0ng/ml(平均+s.d.)。
还在变性条件下在SDS-PAGE凝胶上分析这些上清液样品,并用抗人IgG重链抗体和抗人κ轻链抗体点迹。在这些蛋白质印迹上,从构建体pTT3-HcintLC-p.hori和A产生的上清液中的抗体重链(~50kDa)和抗体轻链(~25kDa)清晰可见,与通过ELISA测量的IgG水平的等级次序相一致。
还使用蛋白质印迹分析表征了来自这些转染的细胞沉淀样品。在含有所有上述构建体的细胞沉淀中看到沿着抗体重链(~50kDa)和轻链(~25kDa)条带的三联多肽(~130kDa)。在这些构建体中,pTT3-HcintLC-p.hori和构建体A给出最强烈的重链和轻链条带;因此,可以推断胞内游离重链和轻链水平与装配并且分泌的抗体之间的相关性。剪接的产物(~80kDa),是抗体重链和轻链之间的融合体,存在于使用构建体pTT3-HcintLC3aa-p.hori产生的细胞沉淀中,并且在构建体pTT3-HcintLC1aa-p.hori产生的细胞沉淀中水平较低;在构建体pTT3-HcintLC-p.hori和构建体A,B和E中不存在。这表明蛋白剪接的水平与抗体分泌效率逆相关,与抗体重链和轻链的连接将导致错折叠的预期相一致,基于关于抗体结构的一般知识,并且由于错折叠蛋白降解的细胞机理,这种misfold将因此防止分泌。这些印迹上的另一种蛋白物质是蛋白内含子-轻链融合体(80kDa,由轻链抗体但不是重链抗体识别),这由任何其他裂解不存在下的N-端剪接连接处的裂解形成。该条带存在于在此所述的构建体A,B,E,pTT3-HcintLC3aa-p.hori,pTT3-HcintLClaa-p.hori中,并且在构建体pTT3-HcintLC-p.hori和H中几乎不存在。因此,该蛋白物质的存在还与抗体分泌的含量逆相关。最后,还在这些细胞裂解物中检测到蛋白内含子条带,使用抗缀合KLH的P.horikoshii肽产生的兔子多克隆抗血清。
我们证明了使用sORF构建体pTT3-HcintLC-p.hori分泌的D2E7抗体具有正确的重链和轻链N-端序列,和正确的重链和轻链分子量以及完整的分子量。
通过蛋白A亲和色谱纯化使用一种sORF构建体pTT3-HcintLC-p.hori分泌的D2E7抗体,并对重链和轻链的N-端序列进行分析。明确的结果表明重链的N-端肽序列是EVQLVESGGG(SEQID NO:21)和轻链的N-端序列是DIQMTQSPSS(SEQ ID NO:22)。因此,使用该构建体,信号肽DIQMTQSPSS使用的裂解位点与常规用于D2E7抗体表达的双ORF/双载体方法中使用的那些相同。
这些数据给下一代构建体的设计提供了重要的科学理解:哺乳动物ER肽酶将在新合成的多蛋白中识别并正确裂解信号肽,即使对其呈现存在一些明确的要求(参见下文)。
通过质谱分析该纯化的抗体,连同通过常规制造方法产生的D2E7。在变性条件下,从pTT3-HcintLC-p.hori构建体产生的D2E7轻链在质谱上产生一个单个的峰,并且其分子量(MW)为23408.8,而从标准制造方法产生的D2E7轻链的分子量(MW)为23409.7,接近一致。还是在变性条件下,从pTT3-HcintLC-p.hori构建体产生的D2E7重链在质谱上产生一个主要峰和2个次要峰,并且它们的分子量(MW)各自为50640.6,50768.2和50802.4,而从标准制造方法产生的D2E7重链分子量(MW)各自为50641.7,50768.6和50804.1,再次接近一致。3个峰对应于D2E7重链的标准形式。
还使用质谱测定了天然条件下从pTT3-HcintLC-p.hori构建体产生的该D2E7抗体的完整分子量(MW),连同从制造方法产生的D2E7抗体一起。从pTT3-HcintLC-p.hori构建体产生的D2E7抗体具有3个峰,各自具有148097.6,148246.9和148413.1的MW;从制造方法产生的D2E7抗体也具有3个峰,各自具有148096.0,148252.3和148412.8的MW。
这些数据清楚地证明了从pTT3-HcintLC-p.hori构建体产生的D2E7抗体的大小在变性和天然条件下都与常规制造方法产生的D2E7抗体的相同。与常规制造方法相比较生产具有完全可靠的氨基酸序列的能力是本发明抗体表达系统的优势之一。使用例如Fang等所述的2A系统,Nature Biotechnology,2005产生的抗体在其重链的C-端具有2个额外的非天然氨基酸,并且由于裂解的性质不可能将这避免。
我们还证明了使用pTT3-HcintLC-p.hori sORF构建体产生的D2E7抗体对于结合TNF具有与制造方法产生的D2E7抗体相同的亲和性。使用Biacore 3000仪器(Pharmacia LKB Biotchnology,Uppsala,Sweden)根据制造商的说明和标准方法测量穿过生物传感器芯片通过固定的山羊抗人IgG捕获的rhTNFa拮抗剂和可溶性rhTNFa之间的实时结合相互作用。简而言之,将rhTNFa等份试样稀释至HBS-EP(Biocore)缓冲液中,将150-μl等份试样以25ml/min的流速注射穿过固定的蛋白基质。同时将相等浓度的分析物注射在未处理的参照表面上来用作空白sensorgram,用于减去bulk折射率背景。在循环之间用两次5-分钟注射10mM甘氨酸,25ml/min再生传感器芯片表面。然后使用BIA评价4.0.1软件评价所得到的实验结合sensorgram来测定动力学速率参数。将每个拮抗剂的数据集适合1∶1Langmuir模型。对于这些研究,在通用适合分析实验方案下分析结合和解离数据,同时选择最大分析物结合能力(RU)或Rmax特征的局部适合。在这种情况中,软件计算出单个解离常数(kd),缔合常数(ka)和亲合常数(Kd)。平衡解离常数是Kd=kd/ka。使用1-100nM范围内不同的TNFα浓度测定动力学on-rate,动力学off rate和整体亲合性。从构建体pTT3-HcintLC-p.hori产生的D2E7抗体的动力学on-rate,动力学off rate和整体亲合性各自为1.61E+6(M-1s-1),5.69E-5(s-1)和3.54E-11(M);通过制造方法产生的D2E7抗体的动力学on-rate,动力学off rate和整体亲合性各自为1.73E+6(M-1s-1),6.72E-5(s-1)和3.89E-11(M)。Biacore分析表明使用该sORF构建体产生的D2E7抗体具有与常规制造方法产生的D2E7抗体相似的TNFα亲合性。
信号肽的修饰
我们已经证明了在sORF构建体设计中,重链-int-轻链,当通过定点突变降低轻链信号肽序列的疏水性时,抗体分泌水平提高约10倍。
我们设计了构建体H,其中在P.horikoshi蛋白内含子序列后,轻链信号肽序列从“MDMRVPAQLLGLLLLWFPGSRC”(SEQ ID NO:23)改变成“MDMRVPAQLLG DEWFPGSRC”(SEQ ID NO:24)。在如上所述相同类型的转染实验中,表达该构建体的细胞的上清液含有2047+116ng/ml抗体,如通过ELISA分析所测量的。该抗体分泌水平与使用2A技术所述的相似(1.6μg/ml)。该上清液的蛋白质印迹分析显示出对应于抗体重链和抗体轻链的强烈条带。
在对照实验中,使用常规方法将该相同轻链信号肽突变引入用于表达该抗体的载体中(从两个分开载体中的两个分开的开放阅读框框表达抗体重链和轻链)。在该构建体中,SEQ ID NO:23提供SEQ IDNO:24的改变如所预期地消除了抗体分泌,因为在常规构建体设计中,疏水性片段对于靶向ER上的信号识别颗粒(SRP)复合物并指引进入translocon中是重要的。这证实了在sOR构建体设计中,轻链信号肽的靶向功能是不必要的,即使可以通过ER信号肽酶识别并裂解,与完整ORF已经通过ORF开始处的重链信号肽进入ER中的假设相一致。
通过蛋白A亲合色谱纯化使用sORF构建体H分泌的D2E7抗体,并对其轻链的N-端序列进行分析。轻链的N-端肽序列是MDMRVPAQLL(SEQ ID NO:26)(没有不明确),这表示了未裂解的信号肽。即使文献中表明哺乳动物信号肽的H片段主要作用在于靶向(SRP)复合物并指引通过translocon的移位,我们的数据表明信号肽的疏水性(H)片段还在信号肽酶的识别和裂解中起作用。
我们已经证明了使用pTT3-HcintLC-p.hori构建体和构建体H分泌的D2E7抗体在基于细胞的测试中是生物活性的。纯化使用pTT3-HcintLC-p.hori构建体和构建体H产生的D2E7抗体并测试它们中和L929细胞中TNFα诱导的细胞毒性的能力。基本上按照US6090382中所述的进行该测试(参见在此的实施例4)。人重组TNFα引起鼠L929细胞中的细胞毒性并用于该测试中。和D2E7一样,抗-TNFα抗体可以中和这种细胞毒性,L929测试是可以用于评价特定D2E7抗体制剂的生物活性的基于细胞的测试之一。使用该测试分析时,从pTT3-HcintLC-p.hori构建体和构建体H产生的D2E7中和TNFα诱导的细胞毒性。它们的IC50值与标准制造方法产生的D2E7的相似。
我们已经研究了在轻链信号肽区域中使用不同设计的其它构建体。为了鉴定允许高抗体分泌效率的最佳sORF构建体设计,我们已经设计了几种另外的构建体,改变了C-端剪接位点周围的片段和之后的信号肽。蛋白内含子的最后一个N替代H构建体的“MDMRVPAQLLGDE WFPGSRC”(SEQ ID NO:24)后,构建体J决定为“MDMRVPAQWFPGSRC”(SEQ ID NO:25),将其进一步除去该信号肽内部的疏水性片段同时保留C-端片段以及信号肽酶裂解位点。构建体K指导直接在蛋白内含子最后一个N后的成熟轻链序列的表达。构建体L指导蛋白内含子的最后一个N替代“MDMRVPAQLLGLLLLWFPGSRC”(SEQ ID NO:23)后“MDMRVPAQLLGLLLLWFPGSGG”(SEQ ID NO:27)的表达,如在构建体pTT3-HcintLC-p.hori中,其通过信号肽酶改变了裂解位点之前的-1和-2氨基酸。
在一个实验中,通过瞬时转染将这些构建体引入293E细胞中,并在7天后,通过ELISA分析分析培养的上清液的IgG抗体滴定度。构建体H,J,K和L的抗体滴定度各自为2328.5+79.9,1289.7+129.6,139.3+4.7和625.0+20.6ng/ml(平均+s.d.)。
还通过蛋白质印迹分析分析了来自这些转染的细胞沉淀物样品。所有构建体具有之前所述的三联多肽条带(~130kDa),重链条带(~50kDa)和轻链条带(~25kDa),并且没有一个具有可检测的剪接的产物(80kDa并通过重链和轻链抗体来识别)。在这组构建体中,构建体K产生了最不同的蛋白质印迹(WB)模式,其中只产生了非常少量的胞内轻链,代替产生了对应于蛋白内含子-轻链融合体的蛋白物质,N-端间接连接处一种裂解情况的产物。该组中的其他构建体不存在这种蛋白物质。构建体K在两个方面不同于其他构建体:不具有通过信号肽酶裂解的裂解位点,和具有天冬氨酸,而不是甲硫氨酸或丝氨酸,作为C-端蛋白外显子的第一个氨基酸残基。这些特征中的任一个或两个可以防止蛋白内含子和抗体轻链之间区域的裂解,导致降低的蛋白质分泌。
通过蛋白质A亲合色谱纯化使用sORF构建体J和L分泌的D2E7抗体,并分析轻链的N-端序列。该分析表明通过构建体J产生的轻链的N-端肽序列是MDMRVPAQLL,这表示了未裂解的信号肽;而通过构建体L产生的轻链的N-端肽序列是DIQMTQSPSS,这表示了正确的信号肽裂解厚的成熟轻链。因此,构建体L表示了与构建体pTT3-HcintLC-p.hori相比较给予了提高的抗体分泌的设计(在不同的瞬时转染中为0.6-1μg/ml),同时其轻链具有正确的N-端序列。
我们探究了使用蛋白内含子和进一步提高抗体分泌水平的方法从sORF构建体表达装配抗体的机理。用大部分所述的sORF构建体转染的细胞的胞内样品含有对应于未处理和处理轻链的两个抗体轻链。用阳性对照构建体或pTT3-HcintLC-p.hori构建体转染的细胞中,只分泌加工的轻链,表明不可以装配和分泌连接野生型轻链信号肽的未加工轻链。相反,能够装配和分泌来自H和J构建体的未加工轻链;都具有突变的信号肽。如在未加工和加工形式之间的胞内轻链多肽分布中所看到的,轻链信号肽加工的程度根据构建体而改变。与构建体pTT3-HcintLC-p.hori相比较,构建体L具有提高量的加工轻链,并且这翻译成提高的抗体分泌。
基于以上的实验数据,从sORF构建体提高抗体分泌的一种方式是提高轻链信号肽的加工效率。通过系统地测试疏水性片段以及裂解位点周围区域中的突变和通过测试不同长度的信号肽来进行这。还可以通过在酵母中筛选可以以这种形式有效裂解的肽序列和通过在CHO细胞中进行相似的筛选来进行这。
可以用来提高sORF构建体的抗体分泌水平的另一种方法是测试不同的5’和3’未翻译片段(UTR)来提高三联mRNA的稳定性,因为这些mRNA比分开编码抗体重链和轻链的传统mRNA大。
提高sORF构建体抗体分泌水平的另一种方法是产生和选择CHO或NS0细胞系并使用DHFR或GS扩增来提高重组基因拷贝数量。通过将重组基因的定位从游离(瞬时)改变至基因组(稳定)独立地提高了抗体分泌水平。还通过提高拷贝数,和/或通过操纵5’和3’UTR,启动子和增强子序列来提高。将表达二氢叶酸还原酶(dhfr)的载体转染至dhfr-缺陷细胞系中。使用氨甲蝶呤(dhfr的一种竞争性抑制剂)选择较高载体拷贝数的细胞系(Kaufman,R.J.和Sharp,P.A.J Mol.Biol.(1982)159:601-621)。作为进一步的独立可替换方案,使用携带巨细胞病毒启动子增强子结合谷氨酰胺合成酶选择标记的表达载体来提高表达(Bebbington,C.R.(1991)Methods 2:138-145)。除了提高重组基因拷贝数,在该方法中还选择了特别适用于从sORF构建体设计加工的细胞世系。
使用修饰的含有插入片段的蛋白内含子
为了追踪已经与D2E7重链和轻链多肽分离的胞内蛋白内含子蛋白的目的,我们在构建体pTT3-HcintLC-p.hori和构建体H中制备了4个在氨基酸序列位置FRKVR!RGRG(!表示插入位点,-HT1)和EGKR!IPEF(-HT2)引入组氨酸标记物的构建体。假设P.horikoshi蛋白内含子是hedgehog的,可以容纳插入片段同时保持其3维结构,因此可以起作用。在一个实验中,293E细胞转染后培养4天后,通过ELISA分析分析培养上清液的IgG  滴定度。构建体pTT3-LcintHC-p.hori-HT1,pTT3-LcintHC-p.hori-HT2,构建体H-HT1,构建体H-HT2和构建体H的抗体滴定度各自为78.3+3.2,67.3+0.6,663.0+15.5,402.7+5.5,747.0+22.5ng/ml(平均+s.d.)。在2个位置含有插入片段的P.hotikoshii蛋白内含子的使用允许装配抗体的分泌。特别地,与使用没有任何插入片段的蛋白内含子相比较,在第一个位置含有内部插入标记物的蛋白内含子的使用给予相似的抗体水平。
以上的数据证明了本发明的sORF构建体设计包括使用修饰的含有内部标记物的蛋白内含子。各种标记物是本领域已知的。本发明的标记物包括但不限于荧光标记物和化学发光标记物。使用这些构建体,可以使用单个细胞中的荧光检测来监控表达的多蛋白含量。此外,可以根据蛋白表达的水平使用FACS分选这些细胞。这样标记物的使用在稳定细胞系产生中特别有用,因为这允许通过FACS分析选择高产细胞或细胞系。如本发明中所教导的,已经在与侧翼抗体重链和轻链自体裂解后的细胞裂解物中观察到了全长蛋白内含子。这提供了检测荧光标记的蛋白内含子及其用于稳定细胞系产生中的基础。标记物还可以用于蛋白质的纯化中。
从以上呈现的数据看,我们已经知道可以在293E细胞,ER和抗体(如通过D2E7特意举例说明的)重链和轻链的范围中发生P.horikoshii Pol I蛋白内含子介导的蛋白剪接反应。点突变如C-端蛋白外显子的第一个氨基酸的S>M和蛋白内含子的倒数第二个氨基酸的H>A提高了分泌抗体的水平。降低轻链信号肽H片段的疏水性,如在构建体H和J中,产生更高的抗体分泌水平。缺少轻链信号肽的构建体中的抗体分泌水平相对低,这似乎是由于C-端剪接连接处不太有效的裂解引起的。使用两种方法来提高该裂解的效率。第一种在+1位置使用不是天冬氨酸的氨基酸。在此所述的另外几种构建体在+1位置使用甲硫氨酸并在C-端剪接连接处获得有效的裂解。第二种提高该裂解效率的方法是使用连接物改变C-端裂解位点和轻链球状结构之间的剪接,任选接着不同类型的裂解位点,如本说明书中所述的那些。
尽管已经描述和测试了包括极端嗜热古菌蛋白内含子和D2E7抗体的不同构建体,在本发明的sORF设计中可以使用其他蛋白内含子和蛋白内含子样蛋白(包括hedgehog和相关家族),例如,在抗体重链和轻链之间引入。还将其他多亚基蛋白(包括双亚基蛋白和具有多个两个亚基的蛋白)替代了抗体的重链和轻链蛋白。
除了以上所述的极端嗜热古菌PolI蛋白内含子构建体,我们使用Sce.VMA和Ssp.dnaE迷你蛋白内含子设计了类似的构建体:pTT3-Hc-VMAint-LC-0aa,pTT3-Hc-VMAint-LC-1aa,pTT3-Hc-VMAint-LC-3aa,pTT3-Hc-Ssp-GA-int-LC-0aa,pTT3-Hc-Ssp-GA-int-LC-1aa和pTT3-Hc-Ssp-GA-int-LC-3aa。将这些构建体转染至293E细胞中,并分析上清液和细胞沉淀样品。
在一个实验中,293E细胞转染后培养7天后,通过ELISA分析来分析培养上清液的IgG抗体滴定度。pTT3-Hc-VMAint-LC-0aa,pTT3-Hc-VMAint-LCá,pTT3-Hc-VMAint-LC-3aa,pTT3-Hc-Ssp-GA-int-LC-0aa,pTT3-Hc-Ssp-GA-int-LC-1aa和pTT3-Hc-Ssp-GA-int-LC-3aa的抗体滴定度各自为9.0±3.5,12.0±0.0,39.7±1.2,90.0±2.0,38.7±1.5和32±2.6ng/ml(平均±s.d.)。
还通过蛋白质印迹分析分析了来自这些转染的细胞沉淀样品。在所有这些样品中观察到三联多肽。此外,在构建体pTT3-Hc-VMAint-LC-0aa,pTT3-Hc-Ssp-GA-int-LC-0aa,pTT3-Hc-Ssp-GA-int-LC-1aa和pTT3-Hc-Ssp-GA-int-LC-3aa中观察到重链多肽;和在pTT3-Hc-Ssp-GA-int-LC-0aa,pTT3-Hc-Ssp-GA-int-LC-1aa和pTT3-Hc-Ssp-GA-int-LC-3aa中观察到轻链多肽。
这些实验的结果表明蛋白内含子,作为一类蛋白质,可以成功地用于sORF蛋白表达策略中,如我们所述的。此外,细菌蛋白内含子-样(BIL)结构域和hedgehog(Hog)自我加工结构域,蛋白内含子以外的Hog/蛋白内含子(HINT)超家族的其他2个成员,适用于在此所述那些的相似构建体设计中。
此外,因为存在于包括极端嗜热古菌PolI蛋白内含子和Sce.VMA蛋白内含子的许多蛋白内含子中的核酸内切酶片段在本发明的基因表达策略中是没有用的,可以删除核酸内切酶结构域并用小的连接物替代来形成“迷你-蛋白内含子”。
这些的迷你蛋白内含子还用于所的构建体设计中,它们呈现出蛋白内含子编码片段显著更小的优势,因此允许较大的编码多肽的序列和/或更易于操作重组DNA分子。
与使用自我加工肽如2A或2A样-序列或蛋白酶识别相关的一个关注问题是一个或多个多肽链的C或N端含有源自自我加工肽的氨基酸,即2A产生的氨基酸残基,或蛋白酶识别序列,取决于初级翻译产物内裂解的位置和特定链的相对位置。这些氨基酸残基对宿主是“外来”的并当体内表达或传送时可以引发免疫应答(即,在基因治疗范围内,从病毒或非病毒载体表达,或作为体外产生的重组蛋白来给予)。此外,如果没有除去,2A产生的或蛋白酶位点产生的氨基酸残基可能影响生产细胞中的蛋白质分泌和/或改变蛋白质构象,导致低于最佳表达水平和/或降低的重组蛋白生物活性。
将基因表达载体工程化,使得在多肽编码序列和自我加工裂解位点(即,2A序列)或其他蛋白酶裂解位点之间提供另外的蛋白酶解裂解位点,作为裂解后除去自我加工裂解位点产生的氨基酸残基的一种方法,该基因表达载体可以用于本发明的实践中。
其他的蛋白酶解裂解位点的实例是具有一致序列RXK(R)R(SEQID NO:1)的弗林蛋白酶裂解位点,其可以通过内源subtilisin-样蛋白酶裂解,如蛋白质分泌途径内的弗林蛋白酶和其他丝氨酸蛋白酶。US专利公开2005/0042721表明了通过在第一个多肽和2A序列之间引入弗林蛋白酶裂解位点RAKR可以有效地除去第一个蛋白质N端的2A残基。此外,表明使用含有2A序列和邻接2A裂解位点的质粒导致比单独含有2A序列的质粒更高水平的蛋白表达。这种提高提供了进一步的优势,因为从蛋白质的N-端除去2A残基时,可以使用更长的2A或2A样序列或其他自我加工序列。这样的自我加工序列如2A-或2A样序列有助于两个或多个多肽通过单个启动子更好的等摩尔表达。多蛋白中免疫球蛋白轻链编码序列存在两次和重链编码序列只存在一次时,获得免疫球蛋白表达进一步的提高。
使用具有全部人类特征的抗体或其类似物是有利的。这些试剂避免了由源自非人物种的抗体或类似物诱导的不利免疫应答。为了解决对源自自我加工肽的氨基酸残基的可能宿主免疫应答,可以在第一个蛋白质的编码序列和自我加工肽之间插入蛋白酶解裂解位点的编码序列(使用本领域已知的标准方法),以便从表达的多肽即抗体除去自我加工肽序列。这发现在用于体内的治疗或诊断抗体中特别有用。
本领域已知的可以使用重组DNA技术表达的任何其他蛋白酶解裂解位点可以用于实践本发明。可以插入多肽或蛋白编码序列和自我加工裂解序列(如2A序列)的实例其他蛋白酶解裂解位点包括,但不限于弗林蛋白酶裂解位点。RXK(R)R(SEQ ID NO:1);因子Xa裂解位点,IE(D)GR(SEQ ID NO:6);信号肽酶I裂解位点,例如,LAGFATVAQA(SEQ ID NO:28);和凝血酶裂解位点,LVPRGS(SEQID NO:7)。
作为从单个开放阅读框表达多于一种成熟蛋白的IRES,弗林蛋白酶,2A和蛋白内含子方法的可替换方案,本发明还提供了使用置于多肽内第一个和第二个蛋白部分之间的hedgehog蛋白结构域的蛋白加工。我们设计了用于表达抗体重链和轻链的单个开放阅读框,使用hedgehog自体加工结构域来隔开抗体重链和轻链基因。在携带这样的ORF的细胞中,转录由至少一个抗体重链,一个抗体轻链和一个hedgehog自体加工结构域构成的单个mRNA,并用来产生相应的多肽。在翻译后,hedgehog自体加工结构域介导抗体重链和轻链的分离。
蛋白质的hedgehog家族含有保守的信号分子,作为不同发育系统中的成形物质,并设计各种人类疾病(Kalderon,D.2005,Biochem SocTrans.Dec;33(Pt6):1509-12)。Hedgehog蛋白具有2个结构域,在细胞信号中起作用的N-端结构域(Hh-N)和催化翻译后自我加工事件的C-端结构域(Hh-C),该自我加工裂解事件在这两个结构域之间分开,将胆固醇部分加入N-端结构域的C-端,因此激活信号分子(Traci等,1997,Cell,91,85-97)。
这样的sORF抗体表达技术给予的优势包括操纵重链和轻链的基因用量比例,用于ER中多亚基装配的重链和轻链多肽的接近性和高效蛋白分泌的潜能。
Hh-C蛋白结构域可以用来催化ER中的自我加工反应,导致以下所述单个开放构建体设计中抗体重链多肽和Hh-C多肽之间的翻译后裂解。
蛋白质的hedgehog家族具有N-端信号结构域和C-端自我加工结构域。它们的C-端自我加工结构域将它们自身与N-端结构域裂解,并通过2-步骤反应机理将胆固醇部分添加至它们的C-端(Porter等,1996,Science,274(5285):255-9)。除了胆固醇,其他亲核试剂如DTT或谷胱甘肽也刺激自我加工(Lee等,1994,Science,266,1528-1537)。和通过C-端自体加工结构域催化的裂解反应相同,hedgehog蛋白的N-端信号结构域由抗体重链或轻链多肽替代时,发生相似的裂解反应。该反应可以用来分离单个开放阅读框编码的多蛋白内含有的抗体重链和轻链。
首先在瞬时表达系统中测试抗体表达并为了该目的,在pTT3载体主链上形成构建体。该载体具有EBV复制起点,其允许游离基因在悬浮培养物中的转染293E细胞中(表达EB病毒核抗原1的细胞)扩增(Durocher等,2002)。每个载体具有单个开放阅读框,由CMV启动子驱动。在一个构建体设计中,pTT3-HC-Hh-C25-LC,将来自黑腹果蝇sonic hedgehog蛋白质的完整C-端结构域框内插入D2E7重链和轻链之间,其中每个具有信号肽(SP)。通过瞬时转染将这些构建体引入293E细胞中。分析了培养的上清液和细胞沉淀样品。
在允许cytosolic和胞内膜部分分离的条件下将细胞沉淀样品裂解。使用免疫印迹技术分析了这两个部分,使用抗重链或抗κ-轻链抗体。在这些印迹上,观察到的蛋白物质包括多蛋白(HC-Hh-C25-LC),Hh-C25-LC,和分开的重链(HC)和轻链(LC)。后3种蛋白物质的存在证实已经发生了自我加工反应。从Hh-C蛋白结构域催化的裂解产生游离的重链;游离轻链多肽是信号肽酶裂解的结果。含有内质网(ER)的亚细胞膜部分中蛋白物质的分离表明我们ORF开始处的重链信号肽已经指导完整ORF进入ER中,其中发生裂解反应。
还将这些细胞沉淀样品接受总RNA提取和Northern印迹分析,使用抗体重链特异性探针和抗体轻链特异性探针。与重链探针和轻链探针都杂交的三联mRNA的这些northern印迹观察证实了构建体设计的sORF性质。相反,在使用常规方法表达D2E7抗体的细胞沉淀样品中,即,引入两个pTT3载体中携带的两个分开ORF的抗体重链和轻链,各自使用重链或轻链探针检测重链(1.4kb)和L链(0.7kb)的mRNA。
这些实验证明使用含有单个ORF(D2E7重链-Hh-C25-D2E7轻链)构建体,转录了含有全部3个蛋白质的单个mRNA。该三联信息翻译成三联多肽,并共翻译地输入ER中,通过ORF开始处存在的重链信号肽指引。这表明Hh-C蛋白结构域用于抗体以及其他多亚基分泌的蛋白质和/或需要经历分泌途径以便折叠和正确翻译后修饰的蛋白质的表达。
对于分泌的抗体,除了细胞沉淀物,还使用蛋白质印迹和ELISA分析了培养的上清液,如在此所述的。可以测试使用删除的hh-C25的构建体来比较多蛋白加工和抗体分泌水平的效率。
已经表明从Hh-C25蛋白质结构域删除C-端63个氨基酸产生了一个蛋白结构域,Hh-C17,其可以催化蛋白加工但不催化胆固醇添加。Hh-C17很好地表达为重组蛋白,并且已经测定了它的晶体结构(Traci等,1997,上文)。因此,在另一个构建体设计中,pTT3-HC-C17-LC,将该截断的蛋白结构域插入D2E7抗体重链和轻链之间。
在hedgehog蛋白质和蛋白内含子的同源性比对中,我们已经在相似的构建体重测试了,如在此详述的,最后8个氨基酸延伸超出最后预测的β-折叠二级结构,它们对自体加工的效率可能有帮助或没帮助。因此,还测试了其他的构建体,pTT3-HC-C17sc-LC。
通过瞬时转染将这些构建体引入293E细胞中,并在7天后,通过ELISA测试分析培养的上清液的IgG抗体滴定度。pTT3-HC-C25-LC,pTT3-HC-C17-LC,pTT3-HC-C17sc-LC和pTT3-HC-C17hn-LC各自为0.038,0.042,0.040和0.046ug/ml。
还在SDS-PAGE凝胶(变性条件)上分析这些上清液样品,并用人IgG重链特异性抗体和人κ轻链特异性抗体点迹。在这些蛋白质印迹上,可以观察到抗体重链(~50kDa)和抗体轻链(~25kDa)蛋白,并且与通过ELISA测量的IgG水平相一致。
还通过蛋白质印迹分析分析了来自这些转染的细胞沉淀样品。可以比较不同构建体重所述四种蛋白物质的存在和相对密度来测定每个构建体设计提供的蛋白加工效率。
在另一类自我加工蛋白中,蛋白内含子,最后两个氨基酸倾向于为HisAsn。在通过蛋白内含子催化的蛋白质剪接过程中,Asn经受环化,His辅助,其导致蛋白内含子及其C-端侧翼多肽之间肽键的裂解。与蛋白内含子相反,hedgehog自我加工蛋白本质上不具有C-端侧翼多肽,并且它们在多肽的该位置不具有保守的Asn。在一个构建体设计中,pTT3-HC-C17hn-LC,我们已经在该位置引入了His-Asn,替代Ser-Cys。不希望受到理论的束缚,在该位置的工程化裂解位点使该特定构建体设计中的hedgehog自体加工蛋白和抗体轻链之间的分离更有效。如上所述的测试抗体分泌的效率。
表征了通过含有hedgehog自体加工蛋白的sORF构建体产生的抗体。通过蛋白质A亲合色谱纯化使用以上sORF构建体分泌的D2E7抗体,并分析其重链和轻链的N-端序列。按照之前所述的在变性条件下通过质谱分析这些纯化的抗体,和从标准制造方法产生的D2E7。在天然条件下使用质谱测定从这些构建体产生的D2E7抗体和从制造方法产生的D2E7抗体的完整分子量(MW)。
按照之前所述的使用Biacore分析D2E7抗体和人TNFα之间的结合。通过使用1-100nM范围内的不同TNFα浓度测定动力学on-rate,动力学off-rate和整体亲合性。
本发明包括多种载体中任一种的用途,用于将包括两个或多个多肽或蛋白质的编码序列和自我加工裂解序列引入细胞中。基因表达载体的各种实例是本领域已知的并可以是病毒或非病毒来源的。本发明实践中可以使用的非病毒基因传送方法包括但不限于质粒,脂质体,核酸/脂质体复合物,阳离子脂质等。
病毒载体
病毒和其他载体可以有效地转导细胞并将它们自己的DNA引入宿主细胞中。在产生重组病毒载体中,用编码目标蛋白或多肽的可表达序列替代非必需基因。示例载体包括但不限于病毒和非病毒载体,如逆转录病毒载体(包括慢病毒载体),腺病毒(Ad)载体,包括可复制型,复制缺陷型及其gutless形式,腺相关病毒(AAV)载体,猿病毒40(SV-40),牛乳头状瘤病毒,EB载体,疱疹载体,牛痘载体,莫洛尼氏鼠白血病载体,哈维鼠肉瘤病毒载体,鼠乳腺肿瘤病毒载体,劳氏肉瘤病毒载体和非病毒质粒。杆状病毒载体是公知的并适用于在昆虫细胞中的表达。许多适用于在哺乳动物或其他真核细胞中表达的载体是本领域公知的,并且许多是可购得的。商业来源包括,但不限于,Stratagene,La Jolla,CA;Invitrogen,Carlsbad,CA;Progema,Madison,WI和Sigma-Aldrich,St.Louis,MO。许多载体序列可通过GenBank获得,涉及载体的其他信息可通过Riken BioSource Center在互联网上获得。
载体通常包括复制起点,并且载体可以另外包括或不包括“标记”或“选择标记”功能,通过这可以鉴定和选择载体。尽管可以使用任何选择标记,用于重组载体中的选择标记通常是本领域已知的,并且正确选择标记的选择将取决于宿主细胞。编码给予抗生素或其他毒素抗性的蛋白质的选择标记基因的实例包括但不限于氨苄青霉素,氨甲喋呤,四环素,新霉素(Southern等,1982,J Mol Appl Genet.1:327-41),霉酚酸(Mulligan等,1980,Science 209:1422-7),嘌呤霉素,zeomycin,潮霉素(Sugden等,1985,Mol Cell Biol.5:410-3),二氢叶酸还原酶,谷氨酰胺合成酶和G418。如本领域技术人员所知道的,表达载体通常包括复制起点,可操纵地连接待表达的编码序列的启动子,以及核糖体结合位点,RNA剪接位点,多腺苷酸化位点和转录终止子序列,如果合适,待表达的编码序列。
参照载体或其他DNA序列,“重组”只表示通常不作为分离的或天然发现的形式可操纵地连接的DNA序列的可操纵地连接。表达和/或控制序列调控转录时,将调控(表达和/或控制)序列可操纵地连接核酸编码序列,并且如果合适,调控核酸序列的翻译。因此,表达和/或控制序列可以包括启动子,增强子,转录终止子,编码序列的起始密码子(即,ATG)5’,内含子的剪接信号和终止密码子。
已知腺病毒基因治疗载体在体内呈现出强烈的瞬时表达,卓越的滴定度和转导裂解和非裂解细胞的能力(Hitt等,2000,Adv in Virus Res55:479-505)。本发明的重组Ad载体包括能够将载体引入复制缺陷型Ad病毒粒子中的包装位点;两个或多个目标多肽或蛋白质的编码序列,例如,目标免疫球蛋白的重链和轻链;和编码单独的自我加工裂解位点或结合另外的蛋白酶解裂解位点的序列。引入感染性病毒粒子需要的或有帮助的其他序列包括5’和3’Ad ITR,E2基因,E4基因的一部分和任选的E3基因。
通过本领域已知的标准技术使用Ad包装细胞和包装技术来制备复制缺陷型Ad病毒粒子封装重组Ad载体。例如,可以在US专利No.5,872,005中找到这些方法的实例。通常将两个或多个目标多肽或蛋白质的编码序列插入腺病毒中,在病毒基因组删除的E3片段中。用于实践本发明的优选腺病毒载体不表达一个或多个野生型Ad基因产物,例如,E1a,E1b,E2,E3和E4。优选的实施方案是通常与补充E1,E2A,E4功能和任选E3基因片段的包装细胞系一起使用的病毒粒子。参见,例如,US专利No.5,872,005,5,994,106,6,113,028和6,127,175。
因此,如在此所用的,“腺病毒”和“腺病毒颗粒”指的是病毒自身或其衍生物,并涵盖所有血清型和亚型,以及天然产生的和重组形式,除了其中另外指出的情况。这样的腺病毒可以是野生型或可以是以本领域已知的或如在此所述的各种方式修饰的。这样的修饰包括包装于颗粒中的腺病毒基因组的修饰,以便制得感染性的病毒。这样的修饰包括本领域已知的删除,如E1a,E1b,E2a,E2b,E3或E4编码片段中一个或多个的删除。示例包装和生产细胞源自293,A549或Hela细胞。使用本领域已知的标准技术纯化和配制腺病毒载体。
腺相关病毒(AAV)是辅助病毒依赖性人细小病毒,其能够通过染色体整合潜在地感染细胞。由于其染色体整合的能力及其非致病的性质,AAV具有作为人基因治疗载体的显著潜能。为了用于实践本发明,可以使用本领域技术人员已知的标准技术产生rAAV病毒粒子,并构建使得它们包括作为朝转录方向的可操纵地连接成分的控制序列,包括转录启动和终止序列,以及目标编码序列。更具体地,本发明的重组AAV载体包括能够使载体引入复制缺陷型AAV病毒粒子中的包装位点;两个或多个目标多肽或蛋白质的编码序列,例如,目标免疫球蛋白的重链和轻链;编码单独的自我加工裂解位点或结合一个或两个其他的蛋白酶解位点的序列。构建用于实践本发明的AAV载体,使得它们包括作为朝转录方向的可操纵地连接成分的控制序列,包括转录启动和终止序列。这些成分在5’和3’端两侧由功能性AAV ITR序列连接。“功能型AAV ITR序列”意思是用于AAV病毒离子的拯救,复制和包装的ITR序列。
重组AAV载体的特征还在于它们能够指导目标细胞中选定的重组多肽或蛋白质产物的表达和生产。因此,重组载体包括至少全部壳体化必需的AAV序列和重组AAV(rAAV)病毒离子感染的物理结构。因此,用于表达载体中的AAV ITR不需要具有野生型的核苷酸序列(例如,如Kotin,1994,Hum.Gene Ther.5:793-801中所述的),并可以通过核苷酸的插入,删除或置换来改变,或AAV ITR可以源自几种AAV血清型中的任何一种。通常,AAV载体可以是源自本领域已知的腺相关病毒血清型中的任何一种载体。
通常,将AAV表达载体引入生产细胞中,接着引入AAV辅助构建体,其中辅助构建体包括能够在生产细胞中表达的AAV编码片段,并且其补充AAV载体中不存在的AAV辅助功能。设计辅助构建体来下调大的Rep蛋白(Rep78和Rep68)的表达,通常通过将p5后的起始密码子从ATG突变至ACG,如US专利No.6,548,286中所述的。接着,将辅助病毒和/或其他载体引入生产细胞中,其中辅助病毒和/或其他的载体提供了能够支持有效rAAV病毒生产的辅助功能。然后培养生产细胞来生产rAAV。使用标准方法进行这些步骤。通过本领域已知的标准技术使用AAV包装细胞和包装技术来制备本发明的辅助缺陷型AAV病毒粒子封装重组AAV载体。在US专利No.5,436,146;5,753,500,6,040,183,6,093,570和6,548,286中可以找到这些方法的实例,在此以其整体引入作为参考。用于包装的更多组合物和方法描述于Wang等中(US专利公开2002/0168342),在此也以其整体引入作为参考,并包括那些本领域技术人员知识范围内的那些技术。
在实践本发明中,用于生产rAAV或其他载体表达载体病毒粒子的宿主细胞包括哺乳动物细胞,昆虫细胞,微生物和酵母。宿主细胞还可以是包装细胞,其中在宿主细胞或生产细胞中稳定维持AAV(或其他)rep和cap基因,其中稳定维持和包装AAV载体基因组。示例包装和生产细胞源自293,A549或Hela细胞。使用本领域已知的标准技术纯化和配制AAV载体。其他合适的宿主细胞(取决于载体)包括中国仓鼠卵巢(CHO)细胞,CHO二氢叶酸还原酶缺陷型变体如CHO DXB11或CHO DG44细胞(参见,例如,Urlaub和Chasin,1980,Proc.Natl.Acad.Sci.77:4216-4220),PerC.6细胞(Jones等,2003,Biotechnol.Prog.19:163-168)或Sp/20鼠骨髓瘤细胞(Coney等,1994,Cancer Res.54:2448-2455)。
逆转录病毒载体
逆转录病毒载体也是用于基因传送的常用工具(Miller,1992,Nature 357:455-460)。逆转录病毒载体,更特别地慢病毒载体,可以用于实践本发明。因此,如在此所用的术语“逆转录病毒”或“逆转录病毒载体”各自意味着包括“慢病毒”和“慢病毒载体”。已经测试并发现逆转录病毒载体是合适的传送载体,将目标基因稳定引入多种目标细胞的基因组中。逆转录载体传送未重排的单拷贝转基因进入细胞的能力使得逆转录病毒载体非常适于将基因转染至细胞中。此外,逆转录病毒通过逆转录病毒包膜糖蛋白与宿主细胞上特定细胞表面受体的结合来进入宿主细胞。因此,还发现假型逆转录病毒载体在实践本发明中的用途,在该载体中编码的天然包膜蛋白由具有不同于天然包膜蛋白的细胞特异性(例如,与天然包膜蛋白相比较,结合不同的细胞表面受体)的异种包膜蛋白替代。指导编码一个或多个目标蛋白编码序列的逆转录病毒载体传送至特定靶细胞中的能力是本发明实践中所需的。
本发明提供了逆转录病毒载体,其包括,例如,包括一个或多个转基因序列的逆转录转移载体和包括一个或多个包装序列的逆转录包装载体。特别地,本发明提供了编码异种或功能上修饰的包膜蛋白的假型逆转录病毒载体,用于生产假型逆转录病毒。
本发明的逆转录病毒载体的核心序列可以容易地源自各种逆转录病毒,包括例如,B,C和D型逆转录病毒以及泡沫病毒和慢病毒(参见RNA Tumor Viruses(RNA肿瘤病毒),第二版,Cold Spring HarborLaboratory,1985)。适用于本发明的组合物和方法中的逆转录病毒的实例包括,但不限于,慢病毒。适用于本发明的组合物和方法中的其他逆转录病毒包括,但不限于,禽白血病病毒,牛白血病病毒,鼠白血病病毒,Mink-Cell Focus-诱导病毒,鼠肉瘤病毒,网状内皮组织增生病病毒和劳氏肉瘤病毒。特别优选的鼠白血病病毒包括4070A和1504A(Hartley和Rowe,1976,J.Virol.19:19-25),Abelson(ATCCNo.VR-999),Friend(ATCC No.VR-245),Graffi,Gross(ATCCNo.VR-590),Kirsteni Harvey肉瘤病毒和Rauscher(ATCC No.VR-998)和莫洛尼氏鼠白血病病毒(ATCC No.VR-190)。这样的逆转录病毒可以从保藏或收集中心容易地获得,如美国典型培养物保藏中心(ATCC;Manassas,VA),或使用常用的技术从已知来源分离。其他是可购得的。
本发明的逆转录病毒载体序列可以源自慢病毒。优选的慢病毒是人免疫缺陷型病毒,例如,1或2型(即,HIV-1或HIV-2,其中HIV-1之前称为淋巴结病相关病毒3(HTLV-III)和获取性免疫缺陷综合症(AIDS)相关病毒(ARV)),或另一种与HIV-1或HIV-2相关的病毒,已经鉴定并与AIDS或AIDS样疾病相关。其他慢病毒包括,绵羊Visna/maedi病毒,猫免疫缺陷型病毒(FIV),牛慢病毒,猿免疫缺陷型病毒(SIV),马传染性贫血病毒(EIAV)和公山羊关节炎-脑炎病毒(CAEV)。
逆转录病毒的合适属和株是本领域公知的(参见,例如,FieldsVirology,第三版,B.N.Fields等编辑,1996,Lippincott-Raven Publishers,参见,例如,第58章,Retroviridae:The Viruses and Their Replication,Classification(逆转录病毒科:病毒及其复制,分类),p1768-1771,包括表1,在此引入作为参考)。用于产生生产细胞和生产细胞系的逆转录病毒包装系统,和制备该包装细胞系统的方法也是本领域已知的,其中该生产细胞和生产细胞系产生逆转录病毒。
典型的包装系统包括至少两个包装载体:包括第一个核苷酸序列的第一个包装载体,该序列包括gag,pol或gag和pol基因;和包括第二个核苷酸序列的第二个包装载体,该序列包括异种或功能上修饰的包膜基因。逆转录病毒序列可以源自慢病毒,如HIV。载体可以缺乏功能性tat基因和/或功能性辅助基因(vlf,vpr,vpu,vpx,nef)。系统可以进一步包括第三个包装载体,具有包括rev基因的核苷酸序列。可以以含有第一个,第二个和任选第三个核苷酸序列的包装细胞形式来提供包装系统。
本发明适用于各种表达系统,尤其是使用真核细胞的那些,有利地哺乳动物细胞。在天然蛋白糖基化的情况中,优选表达系统是给表达的蛋白质提供天然样糖基化的一种表达系统。
慢病毒共享几个结构病毒粒子蛋白,包括包膜糖蛋白SU(gp120)和TM(gp41),其由env基因编码;CA(p24),MA(p17)和NC(p7-11),其由gag基因编码;和RT,PR和IN,由pol基因编码。HIV-1和HIV-2含有涉及合成调控和加工病毒RNA以及其他复制功能的辅助和其他蛋白质。可以从重组系统省略(或灭活)由vif,vpr,vpu/vpx和nef基因编码的辅助蛋白。此外,可以将tat和rev省略或灭活,例如,通过突变或删除。
第一代慢病毒载体包装系统提供了用于gag/pol和env的分开的包装构建体,并出于安全原因,通常使用异种或功能上修饰的包膜蛋白。在第二代慢病毒载体系统中,删除或灭活辅助基因,vif,vpr,vpu和nef。第三代慢病毒载体系统是从其删除或另外灭活(例如,通过突变)了tat基因的那些。
通过使用强组成型启动子如人巨细胞病毒立即早期(HCCAV-IE)增强子/启动子来提供通常由tat提供的转录调控的补偿。可以基于组成型启动子活性,目标组织的特异性(例如,肝脏-特异性启动子)或其他与所需表达控制相关的因素来选择其他启动子/增强子,如本领域所知的。例如,在一些实施方案中,理想的是使用诱导型启动子,如tet,来获得受控表达。可以在分开的表达构建体上提供编码rev的基因,使得典型的第三代慢病毒载体系统将包括四个质粒:其中各自用于gagpol,rev,包膜和转移载体。与所用的包装系统的世代无关,可以在单个构建体或分开的构建体上提供gag和pol。
通常,将包装载体包括于包装细胞中,并通过转染,转导或感染引入细胞中。用于转染,转导或感染的方法上本领域技术人员已知的。可以通过转染,转导或感染将本发明的逆转录病毒转移载体引入包装细胞系中,来产生生产细胞或细胞系。可以通过包括例如磷酸钙转染,脂转染或电穿孔的标准方法将本发明的包装载体引入人细胞或细胞系中。在一些实施方案中,将包装载体和诸如neo,二氢叶酸还原酶(DHFR),谷氨酰胺合成酶或ADA的显性选择标记一起引入细胞中,接着在合适药物的存在下选择并分离克隆。可以将选择标记基因在物理上连接由包装载体编码的基因。
其中设置包装功能使其通过合适包装细胞得到表达的稳定细胞系是已知的。例如,参见US专利No.5,686,279;和Ory等,1996,Proc.Natl.Acad.Sci.93:11400-11406,其描述了包装细胞。稳定细胞系产生的更多描述可以在Dull等,1988,J.Virol.72(11):8463-8471;和Zufferey等,1998,J.Virol.72:9873-9880中找到。
Zufferey等,1997,Nat.Biotechnol.15:871-75,教导了一种慢病毒包装质粒,其中删除了包括HIV-l包膜基因的pol的序列3’。构建体含有tet和rev序列并用polyA序列替代3’LTR。由另一个启动子,如诱导型的,替代5’LTR和psi序列。例如,可以使用CMV启动子及其衍生物。
包装载体可以含有包装功能的其他改变,来提高慢病毒蛋白表达和提高安全性。例如,可以除去所有gag的HIV序列上游。此外,可以除去包膜的序列下游。此外,可以进行修饰载体的步骤来提高RNA的剪接和翻译。
任选地,使用条件型包装系统,如Dull等,1998,上文中所述的。还优选使用自我灭活载体(SIN),其通过删除HIV-1长末端重复序列(LTR)提高了载体的生物安全性,如所述的,例如,Zufferey等,1998,J.Virol.72:9873-9880。也可以使用诱导型载体,如通过四环素诱导的LTR。
启动子
本发明的载体通常包括异种控制序列,其包括,但不限于,组成型启动子,如巨细胞病毒(CMV)立即早期启动子,RSV LTR,MOMLVLTR和PGK启动子;组织或细胞类型特异性启动子,包括mTTR,TK,HBV,hAAT,调控型或诱导型启动子,增强子等。
有用的启动子包括LSP启动子(III等,1997,Blood Coagul.Fibrinolysis 8S2:23-30),EF1-α启动子(Kim等,1990,Gene 91(2):217-23)和Guo等,1996,Gene Ther.3(9):802-10)。最优选的启动子包括延伸因子1-α(EF1α)启动子,磷酸甘油酸盐激酶-1(PGK)启动子,巨细胞病毒立即早期基因(CMV)启动子,嵌合肝特异性启动子(LSP),巨细胞病毒增强子/鸡β-肌动蛋白(CAG)启动子,四环素应答性启动子(TRE),转甲状腺素蛋白启动子(TTR),猿病毒40(SV40)启动子和CK6启动子。用于本发明实践中有利的启动子是腺病毒主要晚期启动子(Berkner和Sharp,1985,Nucl.Acids Res.13:841-857)。下文中提供了特意举例说明的使用腺病毒主要晚期启动子的表达载体的序列。这些和各种其他启动子的序列是本领域已知的。可以从公众数据库容易地获得相关序列并引入实践本发明中使用的载体中。
本发明实践中特别优选的启动子是腺病毒主要晚期启动子。表达盒在5’至3’方向中可以包括腺病毒主要晚期启动子,可操纵地连接目标蛋白或目标蛋白链的第一个编码序列的三联前导序列,编码自我加工序列或蛋白酶裂解序列的第二个编码序列,以及任选编码自我加工序列或蛋白酶裂解序列的序列,之后为目标蛋白或蛋白链的第三个编码序列。所有这些序列共价连接并在相同的阅读框中,使得不在多蛋白编码序列内终止翻译。在蛋白质合成过程中或多肽合成完整后,自我加工或蛋白酶解加工将多蛋白裂解成合适的蛋白链或蛋白质。在免疫球蛋白合成的情况中,轻链的编码序列在多蛋白编码序列内存在两次。有利地,前导序列编码片段可以与蛋白或蛋白链序列相连;通过信号肽酶的加工具有除去加工位点蛋白下游N-端的特定残余氨基酸残基的附加益处。免疫球蛋白重链的组成部分是Met,蛋白质启动甲硫氨酸;HC,重链;LC,轻链,SPPC,自我加工或蛋白酶裂解位点。免疫球蛋白合成的表达构建体可以包括以下的:Met-蛋白酶-SPPC-HC前导序列-HC-SPPC-LC前导序列-LC-SPPC-LC前导序列-LC;Met-蛋白酶-SPPC-LC前导序列-LC-SPPC-LC前导序列-LC-SPPC-HC前导序列-HC;Met-蛋白酶-SPPC-LC前导序列-LC-SPPC-HC前导序列-HC-SPPC-LC前导序列-LC;HC前导序列-HC-SPPC-LC前导序列-LC-SPPC-LC前导序列-LC;LC前导序列-LC-SPPC-HC前导序列-HC-SPPC-LC前导序列-LC;LC前导序列-LC-SPPC-LC前导序列-LC-SPPC-HC前导序列-HC;Met-蛋白酶-SPPC-HC前导序列-HC-SPPC-LC前导序列-LC。
图1中图示了特意举例说明的多蛋白编码序列(产物Met-HC前导序列-HC-工程化的弗林蛋白酶位点-TEV裂解位点-TEV Nia蛋白酶-TEV裂解位点-LC前导序列-LC),并且图2中显示了用于该构建体表达的表达载体的图示。对于其HC和LC序列,抗-TNFα是一种示例抗体。对于治疗抗体的生产不需要LC前导序列。SPPS是TEV蛋白酶识别位点,并且存在5’编码的弗林蛋白酶位点至TEV位点。TEV裂解后的弗林蛋白酶裂解恢复了重链“正确的”C端赖氨酸残基。表1中显示了D2E7-TEV表达载体的完整DNA序列。
已经设计了特意举例说明的D2E7多蛋白表达构建体(D2E7-Lc-LC-HC),该构建体编码LC的串联重复片段并使用2A蛋白酶序列来裂解。已经修饰D2E7轻链C端来添加弗林蛋白酶裂解位点。这导致(通常)倒数第二个氨基酸从Glu至Arg的改变和C-端赖氨酸的添加。通过将两个LC序列5’置于HC,两个LC拷贝保持相同的氨基酸序列。表6C中显示了表达载体完整的核苷酸序列,表6B和6A中各自显示了多蛋白的氨基酸序列和编码序列。还可以参见SEQ IDNO:29-31。图7中显示了图示的表达载体图谱。
另一个特意举例说明的多蛋白(及其编码序列)是ABT-007-TEV的;各自参见表2B和2A。参见SEQ ID NO:33和32。该重组抗体特异性地结合促红细胞生成素受体(EroR)。表2C(SEQ ID NO:35)中显示了编码工程化ABT-007-TEV多蛋白的表达载体的完整序列。还可以参见SEQ ID NO:34。图3中显示了载体的图示。
另外特意举例说明的多蛋白及其编码序列是ABT-874-TEV的;各自参见表3B和3A。该抗体特异性地结合白细胞介素-12。图4中显示了表达载体的图示。还可以参见SEQ ID NO:35-37。
再一特意举例说明的多蛋白(及其编码序列)是EL246-GG-TEV的;参见表4B和4A。其中编码的抗体特异性地结合E/L选择素。图5中以图示的形式提供了表达载体。还可以参见SEQ ID NO:38-40。
ABT-325-TEV是具有白细胞介素-18结合特异性的工程化抗体。表5A和5B中各自给出了多蛋白的编码序列和氨基酸序列,并且表5C中提供了完整的表达载体序列。图6中显示了用于其合成的表达载体。还可以参见SEQ ID NO:41-43。
还提供了除去了核定位信号(NLS)的TEV蛋白酶(TEV NLS-)。还可以在细胞中作为分开的载体或分开的转录物的一部分来瞬时或稳定表达TEV或TEV(NLS-)。可以各自在之前的NLS部分通过引入ER锚定序列或通过融合小核糖体结合蛋白将TEV(NLS-)蛋白锚定ER或核糖体。
尽管本发明含有合成过程中或合成后的细胞中前体蛋白和多蛋白的蛋白酶解裂解的讨论,可以理解在体外使用合适的蛋白酶收集那些蛋白质后可以获得多蛋白和前体蛋白(前蛋白)。
在本发明的范围内,特别的表达的抗体(免疫球蛋白)可以包括,特别是,特异性结合以下物质的那些:肿瘤坏死因子(对应于和/或源自HUMIRA/D2E7的工程化抗体;Abbott Biotechnology Ltd.的阿达木单抗(adalimumab)的商标,Hamilton,Bermuda);白细胞介素-12(源自ABT-874的工程化抗体);白细胞介素-18(源自ABT-325的工程化抗体);重组促红细胞生成素受体(源自ABT-007的工程化抗体);白细胞介素-18(源自ABT-325的工程化抗体);或E/L选择素(源自EL246-GG的工程化抗体)。表1-5中显示了工程化多蛋白的编码序列和氨基酸序列。适于本发明的更多抗体包括,例如,Remicade(英夫单抗);Rituxan/Mabthera(利妥希玛);Herceptin(司徒曼布);Avastin(bevacizumab);Synagis(palivizumab);Erbitux(Cetuximab);Reopro(阿昔单抗);Orthoclone OKT3(鼠单克隆抗体-CD3);Zenapax(daclizumab);Simulect(basiliximab);Mylotarg(gemtuzumab);Campath(alemtuzumab);Zevalin(ibritumomab);Xolair(omalizumab);Bexxar(tositumomab)和Raptiva(efalizumab);其中通常是商标名接着括号内的是代表性的一般名称。其他合适的蛋白质包括,例如,epoetin alfa,epoetin beta,etanercept,darbepoetin alfa,filgastim,干扰素β1a,干扰素β1b,干扰素α-2b,胰岛素glargine,somatropin,teriparatide,follitropinα,链道酶,因子VIII,因子VII,因子IX,伊米苷酶,nesiritide,lenograstim和Von Willebrand因子中的一种或多种;其中一个或多个一般命名可以各自对应于产品的一个或多个商标名。适于本发明的其他抗体和蛋白质是本领域技术人员已知的。
本发明还包括两个或多个目标多肽或蛋白或前体蛋白的编码序列的受控表达。基因调控系统在特定基因的受控表达中是有用的。在一个示例性方法中,基因调控系统或开关包括具有配体结合结构域的嵌合转录因子,转录激活结构域和DNA结合结构域。结构域实际上可以从任何来源获得并可以以任何方式结合来获得新的蛋白质。可调控基因系统还包括DNA应答元件,其与嵌合转录因子相互作用。将该转录调控序列邻接待调控的基因安置。
实践本发明中可使用的示例性转录调控序列包括,例如,果蝇蜕皮激素系统(Yao等,1996,Proc.Natl.Acad.Sci.93:3346),蚕蜕皮激素系统(Suhr等,1998,Proc.Natl.Acad.Sci.95:7999),GeneSwitch(Valentis的商标名,The Woodlands,TX)合成孕酮受体系统,其使用RU486作为诱导剂(Osterwalder等,2001,Proc.Natl.Acad.Sci.USA98(22):12596-601);Tet和Rev Tet系统(四环素调控的表达系统,BD Biosciences Clontech的商标,Mountain View,CA),其使用小分子,如四环素(Tc)或类似物,例如,强力霉素,来调节(打开或关闭)目标的转录(Knott等,2002,Biotechniques 32(4):796,798,800);ARIAD调控技术(Ariad,Cambridge,MA),其是基于使用小分子来集合两个胞内分子,其中每个连接转录激活子或DNA结合蛋白。当这些成分在一起时,激活了目标基因的转录。Ariad具有基于均二聚的系统和基于杂二聚的系统(Rivera等,1996,Nature Med.2(9):1028-1032;Ye等,2000,Science 283:88-91)。
将本发明包括抗体或其片段或其他以自我加工或蛋白酶裂解重组多肽形式的异种蛋白或前体蛋白的核酸编码序列的表达载体构建体引入细胞中,用于体外、离体(ex vivo)或体内传送外源物质,治疗剂或转基因至细胞中,例如,体细胞,或用于通过载体转导细胞的重组多肽生产中。
宿主细胞和载体的传送
可以使用本领域已知的标准方法将本发明的载体构建体在体外或ex vivo引入合适的细胞中。这样的技术包括,例如,使用磷酸钙的转染,微注射至培养的细胞中(Capecchi,1980,Cell 22:479-488),电穿孔(Shigekawa等,1988,Bio Technology 6:742-751),脂质体介导的基因转移(Mannino等,Bio Technology 6:682-690),脂质介导的转导(Feigner等,1987,Proc.Natl.Acad.Sci.USA 84:7413-7417),和使用高速基因枪的核酸传送(Klein等,1987,Nature 327:70-73)。
为了在体外或离体(ex vivo)表达,可以使用有效表达功能性蛋白产物的任何细胞。用于蛋白表达的各种细胞和细胞系实例是本领域已知的。例如,原核细胞和昆虫细胞可以用于表达。此外,可以使用真核微生物,如酵母。在原核,昆虫和酵母系统中的重组蛋白表达通常是本领域已知的并适用于使用本发明的组合物和方法的抗体或其他蛋白表达。
用于表达的细胞实例进一步包括哺乳动物细胞,如成纤维细胞,来自非人哺乳动物的细胞,如绵羊,猪,鼠和牛细胞,昆虫细胞等。哺乳动物细胞的特定实例包括,但不限于,COS细胞,VERO细胞,Hela细胞,中国仓鼠卵巢(CHO),CHO DXB11细胞,CHO DG44细胞,PerC.6细胞,Sp2/0细胞,293细胞,NSO细胞,3T3成纤维细胞,W138细胞,BHK细胞,HEPG2细胞和MDCK细胞。
在常规营养培养基中培养宿主细胞,培养基按照适于引入启动子,选择转化子或扩增编码所需序列的基因而改变。可以在各种培养基中培养哺乳动物宿主细胞。可购得的培养基如Ham’s F10(Sigma),基本培养基(MEM)(Sigma),RPMI 1640(Sigma)和Dulbecco’s改良Eagle’s培养基(DMEM)(Sigma)通常适用于培养宿主细胞。给定的培养基通常按照需要补充激素和/或其他生长因子(如胰岛素,转铁蛋白或表皮生长因子),盐(如氯化钠,钙,镁和磷),缓冲剂(如HEPES),核苷酸(如腺苷和胸苷嘧啶),抗生素,微量元素和葡萄糖或等价能源。还以包括适当浓度的任何其他必需补充剂,如本领域技术人员公知的。对于特定细胞系的合适培养条件,如温度,pH等,通常是本领域已知的,使用建议的培养条件用于各种细胞系的培养,例如,ATCC目录中的(在“atcc.org/SearchCatalogs/AllCollections.cfm”在互联网上获得或按照商业供应商的所说明的)。
可以通过各种途径(例如,皮内,静脉内,肿瘤,进入脑中,门静脉内,腹膜内,机内,进入膀胱中等)在体内给予表达载体,来传送通过自我加工裂解序列连接的多个基因以在动物模型或人患者中表达两个或多个蛋白质或多肽。根据给予的途径,治疗蛋白引发局部(在脑或膀胱中)或全身(其他给予途径)效果。开放阅读框5’的组织特异性启动子的使用导致整个开放阅读框编码的蛋白质或多肽的组织特异性表达。
之前已经描述了在体外,离体(ex vivo)或在体内将携带转基因的重组表达载体引入目标细胞中的各种方法,并且是本领域公知的。本发明提供了治疗方法,疫苗和癌症疗法,通过用含有两个或多个目标蛋白或多肽的编码序列的重组载体感染靶向的细胞,并在靶向的细胞中表达蛋白质或多肽。
例如,本发明重组载体的体内传送可以靶向各种器官类型,包括但不限于,脑,肝脏,血管,肌肉,心脏,肺和皮肤。
在离体(ex vivo)基因转移的情况中,从宿主取出目标细胞并使用本发明的载体和本领域公知的方法在实验室中进行遗传修饰。
可以使用常规给予模式来给予本发明的重组载体,包括但不限于上述的模式。本发明的载体可以是各种剂型,包括但不限于液体溶液和悬浮液,微泡,脂质体和可注射或可灌输的溶液。优选的形式取决于给予模式和治疗应用。
本发明的重组表达构建体在免疫球蛋白或其他生物活性蛋白体内生产中的优势包括单个载体的给予,用于患者中长期而持续的抗体表达;具有全部生物活性的抗体或其片段(或其他生物活性蛋白)的体内表达;和人细胞中产生的抗体的天然翻译后修饰。理想地,表达的蛋白与天然产生的蛋白相同或基本上相同,使得在给予表达的蛋白质的情况中没有引发对多种情况的免疫应答,或在需要所述蛋白的患者中连续表达。
在用于治疗或研究的重组抗体和其他生物活性蛋白的体外生产中发现了本发明的重组载体构建体的更多用途。重组蛋白生产的方法是本领域已知的并可以用于重组抗体的表达,使用在此所述的含自我加工裂解位点或其他蛋白酶裂解位点的载体构建体。
在一个方面中,本发明提供了生产重组免疫球蛋白或其片段的方法,通过将如上所述的表达载体引入细胞中来获得转染的细胞,其中载体在5’至3’方向包括:可操纵地连接免疫球蛋白重链和两个轻链或其片段的编码序列的启动子,每个所述链之间的自我加工序列如2A或2A-样序列或蛋白酶裂解位点。认识到任一免疫球蛋白重链的编码序列或免疫球蛋白轻链的编码序列可以是给定的载体构建体中2A序列的5’(即,第一个)。或者,可以作为多蛋白的一部分来表达与蛋白酶裂解位点同源的蛋白酶,使得与剩余的多蛋白自我加工或通过分开的(或相同的)蛋白酶蛋白酶解裂解。可以通过置换相关的编码序列以加工过的活性形式表达其他多链蛋白或其他蛋白质(如来自双杂交或三杂交系统的那些),散置自我加工位点或蛋白酶识别位点也可以产生大小正确的分开的蛋白质。
双(或其他)杂交系统方法已经用于筛选cDNA文库,用于蛋白复合物的已知配体或亚基的之前未知的结合伴侣。对该系统进行合适的改变,还可以鉴定已知复合物中抑制,竞争或破坏结合的蛋白质或亚基。尽管双(和其他)杂交系统已经用于各种科学研究中,但因为相当大频率的假阳性或假阴性结果,这些系统可能是无效的。至少在一些情况中,那些假信号已经引起“诱饵”蛋白相对于候选结合伴侣蛋白或候选破坏蛋白的相对表达的不平衡。本发明策略的其他优势在于只将一个质粒转染或转化至宿主细胞中,并且对于该质粒只需要单次选择,替代了二元载体双杂交方案中的两次选择。该方法还适用于三杂交系统。对于双杂交系统的讨论,参见Toby和Golemis,2001,Methods 24:201-217;Vidal和Legrain,1999,Nucl.Acids Res.27:919-929;Drees,B,1999,Curr.Op.Chem.Biol.3:64-70;和Fields和Song,1989,Nature 340:245-246。图9显示了用于诱饵和猎物蛋白(或候选猎物蛋白)的多蛋白/自我加工或蛋白酶裂解表达策略的图示,图8显示了含有表达盒的载体,使用该方法用于诱饵和猎物蛋白。将载体表达盒结构化,将诱饵蛋白首先翻译成GAL4::诱饵::2A肽融合体,其在2A肽翻译后自我加工。第二个开放阅读框(ORF)双NFκB::文库融合蛋白。将诱饵蛋白工程化至MCS1需要框内翻译成2A自我加工肽序列。MCS2下游中表达文库的工程化是不太关键。
在此提供的策略可以相似地用于作为通过蛋白酶解裂解加工成成熟活性形式的前体形式表达的蛋白质的表达,因此提供用于重组表达的组合物和方法。这样的蛋白质的实例包括但不限于白细胞介素1和18(IL-1和IL-18)胰岛素。在炎性细胞的细胞质中产生IL-1和IL-18。这些分子缺乏传统的分泌信号,并且必须通过蛋白酶来裂解,以便分泌为生物活性形式。通过白细胞介素转化酶(ICE)将IL-1加工成成熟形式。通过caspase将Pro-IL-18转化成成熟IL-18。这些重组形式分子的生产是困难的,因为通常用作宿主的细胞不表达产生这些蛋白生物活性成熟形式需要的蛋白酶。这些没有pro结构域的细胞因子的表达导致没有活性的分子和/或低水平的产生。本发明提供了初级翻译产物,其在pro结构域和成熟多肽的氨基酸之间含有工程化的自我加工位点(例如,2A序列)或插入的蛋白酶裂解位点,不需要表达与目标蛋白平行的潜在毒性蛋白酶。
在相关的方面中,本发明提供了产生重组免疫球蛋白或其片段的方法,通过将如上所述的表达载体引入细胞中,其中载体在第一个和第二个免疫球蛋白编码序列之间进一步包括另外的裂解位点。优选的其他蛋白酶解裂解位点是具有一致序列RXK/R-R(SEQ ID NO:1)的弗林蛋白酶裂解位点。对于讨论,参见US专利公开2005/0003482A1。
在本发明的一个示例性方面中,载体引入或给予细胞后是一个或多个以下的步骤:在选择细胞和表达多蛋白或前体蛋白的条件下培养转染的细胞;测量免疫球蛋白或其片段或其他蛋白的表达;和收集免疫球蛋白或其片段或其他蛋白。
本发明的另一个方面提供了用于表达重组免疫球蛋白或其片段或其他目标蛋白的细胞,其中细胞包括用于表达两个或多个免疫球蛋白链或其片段或其他前体蛋白或蛋白的表达载体,可操纵地连接免疫球蛋白或其他链或其片段的第一个编码序列的启动子,自我加工或其他裂解编码序列,如2A或2A-样序列或蛋白酶识别位点,和免疫球蛋白或其他链或其片段的第二个编码序列,其中将自我加工裂解序列或蛋白酶识别位点编码序列插入第一个和第二个编码序列之间。在相关的方面中,细胞包括如上所述的表达载体,其中表达载体在第一个和第二个免疫球蛋白或其他目标编码序列之间进一步包括另外的蛋白酶解裂解位点。优选的其他蛋白酶解裂解位点是具有一致序列RXK/R-R(SEQ ID NO:1)的弗林蛋白酶裂解位点。
如在此所用的,“免疫球蛋白分子或其片段的第一个链的编码序列”指的是编码蛋白质分子的核酸序列,蛋白分子包括但不限于抗体或免疫球蛋白的轻链或重链,或其片段。
编码抗体或免疫球蛋白第一个或第二个链或其片段的序列包括源自IgG,IgM,IgD,IgE或IgA的重链或其片段。如宽泛地所述的,编码抗体或免疫球蛋白链或其片段的序列还包括来自IgG,IgM,IgD,IgE或IgA的轻链或其片段。完整抗体分子及其修饰或衍生形式的基因,包括,例如,其他抗原识别分子片段,如Fab,单链Fv(scFv)和F(ab’)2。抗体和片段可以是动物产生的,人-鼠嵌合的,人源化的,通过DeimmunisationTM(Biovation Ltd)改变的,改变对Fc受体的亲和性,或全部是人的。理想地,抗体或其他重组蛋白没有在给予的人或动物中引发免疫应答。
抗体可以是双特异性的,并且包括但不限于,二抗(diantibody),四源杂交瘤(quadroma),迷你抗体,ScBs抗体和knobs-into-holes抗体。
可以以本领域公知的各种方式获得抗体自身的产生和收集(Harlow等,1988,Antibodies,A Laboratory Manual(抗体,实验室手册),Cold Spring Harbor Laboratory。根据本领域公知的方法收集和/或纯化和/或使用其他目标蛋白。
在实践本发明中,可以在适于宿主细胞生长和编码序列表达的培养条件下培养修饰的重组宿主细胞来实现使用重组DNA技术的抗体或其变体(类似物)的生产。为了监控表达的成功,可以使用标准技术如ELISA,RIA等监控相对于抗原的抗体水平。使用本领域已知的标准基数从培养物上清液收集抗体。当然,可以通过标准纯化技术容易地制得这些抗体的纯化形式,这些技术包括但不限于,通过蛋白A,蛋白G或蛋白L柱的亲和色谱,或相对于特定的抗原,或甚至相对于抗原的特定抗原决定部位,对于该抗原的特异性是所需的。还可以使用常规色谱纯化抗体,如离子交换或大小排阻柱,结合其他技术,如硫酸铵沉淀和大小限制的膜滤。将表达系统设计来包括信号肽的情况中,将所得到的抗体分泌至培养基或上清液中;然而,也可以是胞内生产。
之前已经描述了从人Ig基因座工程化的小鼠生产和选择抗原特异性的全部是人的单克隆抗体(Jakobovits等,1998,Advanced DrugDelivery Reviews 31:33-42;Mendez等,1997,Nature Genetics 15:146-156;Jakobovits等,1995,Curr Opin Biotechnol 6:561-566;Green等,1994,Nature Genetics Vol.7:13-21)。
已经在转基因山羊的奶中获得治疗性单克隆抗体的高水平表达,并已经表明抗原结合水平等于使用常规细胞培养技术产生的单克隆抗体。该方法是基于转基因动物奶中人治疗性蛋白的产生,这些转基因动物携带使它们在奶中表达人治疗性蛋白的遗传信息。一旦产生,可以使用标准技术从奶中有效地纯化这些重组蛋白。参见,例如,Pollock等,1999,J.Immunol.Meth.231:147-157和Young等,1998,ResImmunol.149(6):609-610。已经证明了来自转基因动物的动物奶,蛋清,血液,尿液,精浆和蚕茧可以作为工业规模生产重组蛋白的来源(Houdebine L M.2002,Curr Opin Biotechnol 13:625-629;Little等,2000,Immunol Today,21(8):364-70;和Gura T.2002,Nature,417:584-5860。本发明包括转基因动物表达系统的用途,用于表达重组抗体或变体(类似物)或其他目标蛋白,使用本发明的自我加工裂解位点-编码和/或蛋白酶识别位点载体。
也已经成功证明了植物中的重组蛋白生产,包括但不限于,通过农杆菌感染,基因枪转化,原生质体转化等转化的土豆,番茄,烟草,水稻和其他植物。已经证明了转基因烟草植物的种子中的重组人GM-CSF表达和植物中包括单链抗体的抗体表达。参见,例如,Streaffield和Howard,2003,Int.J.Parasitol.33:479-93;Schillberg等,2003,Cell Mol Life Sci.60:433A5;Pogue等,2002,Annu.Rev.Phytopathol.40:45-74;和McCormick等,2003,J Immunological Mthods,278:95-104。本发明包括转基因植物表达系统的用途,用于表达重组免疫球蛋白或其片段或其他目标蛋白,使用本发明的蛋白酶裂解位点或自我加工裂解位点编码载体。
杆状病毒载体表达系统结合昆虫细胞也得到了进展,作为重组蛋白生产的可行平台。已经报道了杆状病毒载体表达系统提供了相对于哺乳动物细胞培养物的优势,如易于培养和较高的表达水平。参见,例如,Ghosh等,2002,Mol Ther.6:5-11,和Ikonomou等,2003,Appl Microbiol Biotechnol.62:1-20。本发明进一步包括杆状病毒载体系统的用途,用于表达重组免疫球蛋白或其片段,使用本发明的自我加工裂解位点编码载体。杆状病毒载体和合适的宿主细胞是本领域公知的并可购得。
还可以使用基于酵母的系统,用于表达重组免疫球蛋白或其片段或其他目标蛋白,包括双-或三-杂交系统,使用本发明的自我加工裂解位点。参见,例如,US专利No.5,643,745,在此引入作为参考。
可以理解发现本发明的包括单独的自我加工肽的编码序列或结合其他的蛋白酶解裂解位点的编码序列的表达盒和载体和重组宿主细胞在重组免疫球蛋白或其片段,前体蛋白,生物活性蛋白和双-和三-杂交系统的蛋白组成部分表达中的用途,在各种本领域已知的任何蛋白质表达系统中,并且在此描述了其实例。
当要求化合物,构建体或组合物时,应当理解不包括本领域已知的化合物,构建体和组合物,包括通过在此公开的参考文献中教导的那些。在此使用马库什基团或其他基团时,确定说明书中单独包括基团的所有单个成员和基团内所有可能的组合和亚组合形式。
实施例1.使用蛋白内含子介导的加工的免疫球蛋白表达
抗体分子有效表达的策略是通过多蛋白表达,其中蛋白内含子位于重链和轻链之间,具有蛋白内含子序列和/或连接序列的修饰,使得存在组成蛋白的释放,而没有N-端和C-端蛋白的连接。在这样的构建体内,可以存在相关重链和轻链各自的一个拷贝,或轻链可以是双倍的,或可以存在重链和轻链的多个拷贝,只要提供功能性裂解序列来促进多蛋白内每个免疫球蛋白衍生的蛋白质的分离。可以多次使用蛋白内含子策略或可以将不同的蛋白酶解加工序列或酶置于免疫球蛋白产生的蛋白质的至少一个末端。
已经如上简述的将来自极端嗜热古菌的蛋白内含子引入构建体中并已经显示出成功地产生了正确加工的和全部功能的D2E7抗体。测试的其他蛋白内含子来自酿酒酵母和集胞藻。已经通过ELISA表明菌株PCC6803产生分泌的抗体。
极端嗜热古菌Pho Pol I蛋白内含子的PCR扩增和亚克隆:
以下的寡核苷酸用于极端嗜热古菌Pho Pol蛋白内含子的扩增(NCBI/蛋白质登录号#O59610,完整DNA聚合酶I DNA序列的GenBank登录号#为BA00001.2:1686361..1690068,取自极端嗜热古菌的完整基因组序列),使用基因组DNA作为模板和Platinum Taq HiFidelity DNA聚合酶Supermix(Invitrogen,Carlsbad,CA)。基因组DNA购自ATCC。
极端嗜热古菌int-5’:AGCATTTTACCAGATGAATGGCTCCC(SEQ IDNO:52)
极端嗜热古菌int-3’:AACGAGGAAGTTCTCATTATCCTCAAC(SEQID NO:53)
根据以下的程序运行PCR:
步骤    1     2     3     4     5                6     7    8
温度    94℃  94℃  55℃  72℃  转到步骤2(34次)  72℃  4℃  结束
时间    2min  1min  1min  2min                   5min  保持
将PCR产物亚克隆至pCR2.1-TOPO(Invitrogen)中,并将插入片段测序并证明正确性。当时认识到由于打印输出错误,存在从蛋白内含子3’端的序列丢失。然后在随后的连接蛋白内含子与D2E7的重链和轻链的PCR反应过程中,填补了丢失的序列。
为了产生D2E7重链-蛋白内含子-D2E7轻链的融合体,设计了寡核苷酸引物。设计引物使得PCR产物可以用作随后PCR反应中的引物。

说明组成部分的序列代码:
重链序列(粗体红色)-轻链序列(下划线)-极端嗜热古菌蛋白内含子序列(无格式的Arial)-极端嗜热蛋白内含子序列(粗体下划线蓝色)

终止密码子,TCA(Times New Roman,Olive)
Kozak
D2E7重链-蛋白内含子-D2E7轻链融合体的PCR扩增和装配:使用如上产生的pCR2.1-TOPO-极端嗜热古菌蛋白内含子克隆作为模板,使用引物极端嗜热古菌int-5’和修正的P.hori-3’进行PCR,给蛋白内含子恢复正确的3’端。所用的聚合酶是Pful DNA聚合酶,以避免使用Platinum Taq发生的A-加尾。
根据以下的程序运行PCR:
步骤  1     2     3     4     5                6     7    8
温度  94℃  94℃  55℃  72℃  转到步骤2(34次)  72℃  4℃  结束
时间  2min  1min  1min  2min                   5min  保持
使用Qiaquick Gel提取试剂盒(Qiagen,Valencia,CA)凝胶纯化PCR扩增产物。将该产物用作下一组反应的模板。
进行三组PCR反应来产生蛋白内含子编码序列,使用不同数目的蛋白内含子编码序列的蛋白外显子残基5’和3’。蛋白外显子密码子来自极端嗜热古菌中的天然DNA聚合酶基因,该蛋白内含子是天然部分。所用的引物如下:组1引入了零蛋白外显子序列(HC-蛋白内含子-5’和修正的LC-蛋白内含子-3’),组2在蛋白内含子(HC-蛋白内含子(1aa)-5’和修正的LC-蛋白内含子(1aa)-3’)的两端引入了一个氨基酸(3个碱基对),组3在蛋白内含子(HC-蛋白内含子(3aa)-5’和修正的LC-蛋白内含子(3aa)-3’)的两端引入了三个氨基酸(9个碱基对)。
PCR程序和以上给出的相同。使用Qiaquick Gel提取试剂盒(Qiagen)凝胶纯化PCR扩增产物。将这些产物用作下一组反应的引物。
进行三组PCR反应来产生D2E7重链与蛋白内含子的融合体,其中使用0,1或3个蛋白外显子氨基酸。用于反应的模板是D2E7重链DNA。将上述的PCR产物各自用作3’引物,将HC-Srfl-5’用作所有反应中的5’引物。使用Pful DNA聚合酶。
根据以下程序运行PCR:
步骤  1     2     3     4     5                6     7    8
温度  94℃  94℃  50℃  72℃  转到步骤2(34次)  72℃  4℃  结束
时间  2min  1min  1min  3min                   5min  保持
使用Qiaquick Gel提取试剂盒(Qiagen)凝胶纯化PCR扩增产物。将这些产物用作下一组反应的引物。
进行三组PCR反应来产生D2E7重链-蛋白内含子与D2E7轻链的融合体,其中使用0,1或3个蛋白外显子氨基酸。用于反应的模板是D2E7轻链DNA。将以上所述的PCR产物各自用作5’引物,将LC-BamHI-3’用作所有反应中的3’引物。使用Pful DNA聚合酶。
根据以下程序运行PCR
步骤  1     2     3     4     5                6     7    8
温度  94℃  94℃  55℃  72℃  转到步骤2(34次)  72℃  4℃  结束
时间  2min  1min  1min  5min                   5min  保持
在凝胶上跑胶时,产生的PCR产物扩散并且是稀少的。将这些反应直接用作最后一轮PCR的模板,使用HC-Srfl-5’和LC-BamHI-3’作为模板。使用如上所示的相同PCR程序。使用Qiaquick Gel提取试剂盒(Qiagen)凝胶纯化PCR产物。
将如上所述纯化的PCR产物亚克隆至pCR-BluntII-TOPO(Invitrogen)中,使用Zero Blunt TOPO PCR克隆试剂盒(Invitrogen)。将克隆测序来证实构建体呈现出预期的核酸序列。发现每种类型产物的正确克隆。使用SrfI和NotI从pCR-BluntII-TOPO切除D2E7重链-蛋白内含子-D2E7轻链盒,并亚克隆至使用相同的酶限制的pTT3中,并凝胶纯化。
使用极端嗜热古菌蛋白内含子设计了用于D2E7重链-蛋白内含子-D2E7轻链的三个表达构建体:pTT3-HcintLC-p.hori(参见图14的质粒图谱);pTT3-HcintLClaa-p.hori;和pTT3-HcintLC3aa-p.hori。
表10A.pTT3-HcintLC-p.hori的核苷酸序列(SEQ ID NO:62)
5’-
gcggccgctcgaggccggcaaggccggatcccccgacctcgacctctggctaataaaggaaatttattttcattgcaatagtgtgttggaattttttgtgtctctcactcggaaggacatatgggagggcaaatcatttggtcgagatccctcggagatctctagctagaggatcgatccccgccccggacgaactaaacctgactacgacatctctgccccttcttcgcggggcagtgcatgtaatcccttcagttggttggtacaacttgccaactgggccctgttccacatgtgacacggggggggaccaaacacaaaggggttctctgactgtagttgacatccttataaatggatgtgcacatttgccaacactgagtggctttcatcctggagcagactttgcagtctgtggactgcaacacaacattgcctttatgtgtaactcttggctgaagctcttacaccaatgctgggggacatgtacctcccaggggcccaggaagactacgggaggctacaccaacgtcaatcagaggggcctgtgtagctaccgataagcggaccctcaagagggcattagcaatagtgtttataaggcccccttgttaaccctaaacgggtagcatatgcttcccgggtagtagtatatactatccagactaaccctaattcaatagcatatgttacccaacgggaagcatatgctatcgaattagggttagtaaaagggtcctaaggaacagcgatatctcccaccccatgagctgtcacggttttatttacatggggtcaggattccacgagggtagtgaaccattttagtcacaagggcagtggctgaagatcaaggagcgggcagtgaactctcctgaatcttcgcctgcttcttcattctccttcgtttagctaatagaataactgctgagttgtgaacagtaaggtgtatgtgaggtgctcgaaaacaaggtttcaggtgacgcccccagaataaaatttggacggggggttcagtggtggcattgtgctatgacaccaatataaccctcacaaaccccttgggcaataaatactagtgtaggaatgaaacattctgaatatctttaacaatagaaatccatggggtggggacaagccgtaaagactggatgtccatctcacacgaatttatggctatgggcaacacataatcctagtgcaatatgatactggggttattaagatgtgtcccaggcagggaccaagacaggtgaaccatgttgttacactctatttgtaacaaggggaaagagagtggacgccgacagcagcggactccactggttgtctctaacacccccgaaaattaaacggggctccacgccaatggggcccataaacaaagacaagtggccactcttttttttgaaattgtggagtgggggcacgcgtcagcccccacacgccgccctgcggttttggactgtaaaataagggtgtaataacttggctgattgtaaccccgctaaccactgcggtcaaaccacttgcccacaaaaccactaatggcaccccggggaatacctgcataagtaggtgggcgggccaagataggggcgcgattgctgcgatctggaggacaaattacacacacttgcgcctgagcgccaagcacagggttgttggtcctcatattcacgaggtcgctgagagcacggtgggctaatgttgccatgggtagcatatactacccaaatatctggatagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctaatagagattagggtagtatatgctatcctaatttatatctgggtagcatatactacccaaatatctggatagcatatgctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctcatgataagctgtcaaacatgagaattttcttgaagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtgttgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgcagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgttcttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgccaagctctagctagaggtcgaccaattctcatgtttgacagcttatcatcgcagatccgggcaacgttgttgccattgctgcaggcgcagaactggtaggtatggaagatctatacattgaatcaatattggcaattagccatattagtcattggttatatagcataaatcaatattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattggctcatgtccaatatgaccgccatgttgacattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacaccaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaataaccccgccccgttgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcgtttagtgaaccgtcagatcctcactctcttccgcatcgctgtctgcgagggccagctgttgggctcgcggttgaggacaaactcttcgcggtctttccagtactcttggatcggaaacccgtcggcctccgaacggtactccgccaccgagggacctgagcgagtccgcatcgaccggatcggaaaacctctcgagaaaggcgtctaaccagtcacagtcgcaaggtaggctgagcaccgtggcgggcggcagcgggtggcggtcggggttgtttctggcggaggtgctgctgatgatgtaattaaagtaggcggtcttgagacggcggatggtcgaggtgaggtgtggcaggcttgagatccagctgttggggtgagtactccctctcaaaagcgggcattacttctgcgctaagattgtcagtttccaaaaacgaggaggatttgatattcacctggcccgatctggccatacacttgagtgacaatgacatccactttgcctttctctccacaggtgtccactcccaggtccaagtttgggcgccaccatggagtttgggctgagctggctttttcttgtcgcgattttaaaaggtgtccagtgt-
gaggtgcagctggtggagtctgggggaggcttggtacagcccggcaggtccctgagactctcctgtgcggcctctggattcacctttgatgattatgccatgcactgggtccggcaagctccagggaagggcctggaatgggtctcagctatcacttggaatagtggtcacatagactatgcggactctgtggagggccgattcaccatctccagagacaacgccaagaactccctgtatctgcaaatgaacagtctgagagctgaggatacggccgtatattactgtgcgaaagtctcgtaccttagcaccgcgtcctcccttgactattggggccaaggtaccctggtcaccgtctcgagtgcgtcgaccaagggcccatcggtcttccccctggcaccctcctccaagagcacctctgggggcacagcggccctgggctgcctggtcaaggactacttccccgaaccggtgacggtgtcgtggaactcaggcgccctgaccagcggcgtgcacaccttcccggctgtcctacagtcctcaggactctactccctcagcagcgtggtgaccgtgccctccagcagcttgggcacccagacctacatctgcaacgtgaatcacaagcccagcaacaccaaggtggacaagaaagttgagcccaaatcttgtgacaaaactcacacatgcccaccgtgcccagcacctgaactcctggggggaccgtcagtcttcctcttccccccaaaacccaaggacaccctcatgatctcccggacccctgaggtcacatgcgtggtggtggacgtgagccacgaagaccctgaggtcaagttcaactggtacgtggacggcgtggaggtgcataatgccaagacaaagccgcgggaggagcagtacaacagcacgtaccgtgtggtcagcgtcctcaccgtcctgcaccaggactggctgaatggcaaggagtacaagtgcaaggtctccaacaaagccctcccagcccccatcgagaaaaccatctccaaagccaaagggcagccccgagaaccacaggtgtacaccctgcccccatcccgggatgagctgaccaagaaccaggtcagcctgacctgcctggtcaaaggcttctatcccagcgacatcgccgtggagtgggagagcaatgggcagccggagaacaactacaagaccacgcctcccgtgctggactccgacggctccttcttcctctacagcaagctcaccgtggacaagagcaggtggcagcaggggaacgtcttctcatgctccgtgatgcatgaggctctgcacaaccactacacgcagaagagcctctccctgtctccgggtaaa-
agcattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatagggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagccctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcagggaaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaatggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttccagaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgatgatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaaggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtgaagttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaatagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtggataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactacataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcgaaacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgccatatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttccttaagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcctgaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatcctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtgttgaggataatgagaacttcctcgttggcttcggactactttacgcacacaac-
atggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgcgacatccagatgacccagtctccatcctccctgtctgcatctgtaggggacagagtcaccatcacttgtcgggcaagtcagggcatcagaaattacttagcctggtatcagcaaaaaccagggaaagcccctaagctcctgatctatgctgcatccactttgcaatcaggggtcccatctcggttcagtggcagtggatctgggacagatttcactctcaccatcagcagcctacagcctgaagatgttgcaacttattactgtcaaaggtataaccgtgcaccgtatacttttggccaggggaccaaggtggaaatcaaacgtacggtggctgcaccatctgtcttcatcttcccgccatctgatgagcagttgaaatctggaactgcctctgttgtgtgcctgctgaataacttctatcccagagaggccaaagtacagtggaaggtggataacgccctccaatcgggtaactcccaggagagtgtcacagagcaggacagcaaggacagcacctacagcctcagcagcaccctgacgctgagcaaagcagactacgagaaacacaaagtctacgcctgcgaagtcacccatcagggcctgagctcgcccgtcacaaagagcttcaacaggggagagtgt -3’
表10B.pTT3-HcintLC-p.hori中开放阅读框的氨基酸序列(SEQ IDNO:63)
Mefglswlflvailkgvqcevqlvesggglvqpgrslrlscaasgftfddyamhwvrqapgkglewvsaitwnsghidyadsvegrftisrdnaknslylqmnslraedtavyycakvsylstassldywgqgtlvtvssastkgpsvfplapsskstsggtaalgclvkdyfpepvtvswnsgaltsgvhtfpavlqssglyslssvvtvpssslgtqtyicnvnhkpsntkvdkkvepkscdkthtcppcpapellggpsvflfppkpkdtlmisrtpevtcvvvdvshedpevkfnwyvdgvevhnaktkpreeqynstyrvvsvltvlhqdwlngkeykckvsnkalpapiektiskakgqprepqvytlppsrdeltknqvsltclvkgfypsdiavewesngqpennykttppvldsdgsfflyskltvdksrwqqgnvfscsvmhealhnhytqkslslspgk-
silpdewlpivenekvrfvkigdfidreieenaervkrdgeteilevkdlkalsfnretkkselkkvkalirhrysgkvysiklksgrrikitsghslfsvkngklvkvrgdelkpgdlvvvpgrlklpeskqvlnlvelllklpeeetsnivmmipvkgrknffkgmlktlywifgegerprtagrylkhlerlgyvklkrrgcevldweslkryrklyetliknlkyngnsraymvefnslrdvvslmpieelkewiigeprgpkigtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaeklfgkvrrgrgyievsgkishaifrvlaegkripefiftspmdikvaflkglngnaeeltfstksellvnqlilllnsigvsdikiehekgvyrvyinkkessngdivldsvesievekyegyvydlsvednenflvgfgllyahn-
mdmrvpaqllgllllwfpgsrcdiqmtqspsslsasvgdrvtitcrasqgirnylawyqqkpgkapklliyaastlqsgvpsrfsgsgsgtdftltisslqpedvatyycqrynrapytfgqgtkvelkrtvaapsvfifppsdeqlksgtasvvcllnnfypreakvqwkvdnalqsgnsqesvteqdskdstyslsstltlskadyekhkvyacevthqglsspvtksfnrgec
序列的Text/font符号代码:
pTT3载体-重链-蛋白内含子-轻链
在以下的2个构建体中,与以上的构建体的唯一区别时包括极端嗜热古菌(下划线的)天然的蛋白外显子序列。所示的序列从D2E7重链编码片段的末端(如红色所示的最后9个碱基对)至D2D7轻链编码序列的5’端(如粉色所示的头9个碱基对,以分开的线表示)。
表11A.pTT3-HcintLC1aa-p.hori部分编码序列(SEQ ID NO:64)
5’-ccgggtaaa-
aacagcattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatagggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagccctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcagggaaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaatggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttccagaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgatgatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaaggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtgaagttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaatagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtggataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactacataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcgaaacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgccatatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttccttaagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcctgaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatcctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtgttgaggataatgagaacttcctcgttggcttcggactactttacgcacacaacagt-
atggacatg -3’
表11B.pTT3-HcintLC1aa-p.hori部分氨基酸序列,显示重链的4个氨基酸上游和蛋白内含子的四个氨基酸下游(SEQ ID NO:65)
Pgknsilpdewlpivenekvrfvkigdfidreieenaervkrdgeteilevkdlkalsfnretkkselkkvkalirhrysgkvysiklksgrrikitsghslfsvkngklvkvrgdelkpgdlvvvpgrlklpeskqvlnlvelllklpeeetsnivmmipvkgrknffkgmlktlywifgegerprtagrylkhlerlgyvklkrrgcevldweslkryrklyetliknlkyngnsraymvefnslrdvvslmpieelkewiigeprgpkigtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaeklfgkvrrgrgyievsgkishaifrvlaegkripefiftspmdikvaflkglngnaeeltfstksellvnqlilllnsigvsdikiehekgvyrvyinkkessngdivldsvesievekyegyvydlsvednenflvgfgllyahn-s-mdm
重链3’序列-蛋白内含子-蛋白外显子-轻链5’序列
表12A.pTT3-HcintLC3aa-p.hori部分编码序列(SEQ ID NO:66)
5’-ccgggtaaa-ttagcaaac-
agcattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatagggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagccctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcagggaaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaatggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttccagaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgatgatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaaggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtgaagttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaatagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtggataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactacataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcgaaacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgccatatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttccttaagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcctgaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatcctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtgttgaggataatgagaacttcctcgttggcttcggactactttacgcacacaac-agttattac-atggacatg-3’
表12B.pTT3-HcintLC3aa-p.hori部分氨基酸序列,显示出蛋白内含子和侧翼序列(SEQ ID NO:67)
Pgk-lan-
silpdewlpivenekvrfvkigdfidreieenaervkrdgeteilevkdlkalsfnretkkselkkvkalirhrysgkvysiklksgrrikitsghslfsvkngklvkvrgdelkpgdlvvvpgrlklpeskqvlnlvelllklpeeetsnivmmipvkgrknffkgmlktlywifgegerprtagrylkhlerlgyvklkrrgcevldweslkryrklyetliknlkyngnsraymvefnslrdvvslmpieelkewiigeprgpkigtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaeklfgkvrrgrgyievsgkishaifrvlaegkripefiftspmdikvaflkglngnaeeltfstksellvnqlilllnsigvsdikiehekgvyrvyinkkessngdivldsvesievekyegyvydlsvednenflvgfgllyahn-syy-mdm
重链3’序列-蛋白内含子-蛋白外显子-轻链5’序列
用于构建体A、B、E、H、I、J、K和L的引物为:
YKF1:GGACTACTTTACGCAGCCAACATGGACATGC(SEQ ID NO:68)
YKR1:GCATGTCCATGTTGGCTGCGTAAAGTAGTCC(SEQ ID NO:69)
YKF2:GGACTACTTTACGCAGCCAACAGTATGGACATGC(SEQ ID NO:70)
YKR2:GCATGTCCATACTGTTGGCTGCGTAAAGTAGTCC(SEQ ID NO:71)
YKF3:GGTGAGGAGAGGAAGAGG(SEQ ID NO:72)
YKR3:CCAGAGGTCGAGGTCG(SEQ ID NO:73)
YKF4:CGGCGTGGAGGTGC(SEQ ID NO:74)
YKR4:CAACAATTGGGAGCCATTCATCTGGTAAAATGGTTTTACCCGGAG(SEQID NO:75)
YKF5:CCGCCCAGCTGCTGGGCGACGAGTGGTTCCCCGGCTCGCG(SEQ IDNO:76)
YKR5:Cgcgagccggggaaccactcgtcgcccagcagctgggcgg(SEQ ID NO:77)
YKF6:tgagcggccgctcga(SEQ ID NO:78)
YKR6:gttgtgtgcgtaaag(SEQ ID NO:79)
YKF7:agcattttaccagat(SEQ ID NO:80)
YKR7:ggtggcgcccaaact(SEQ ID NO:81)
YKF8:ctttacgcacacaacatggacatgcgcgtg(SEQ ID NO:82)
YKR8:tcgagcggccgctcaacactctcccct(SEQ ID NO:83)
YKF9:agtttgggcgccaccatggagtttgggctg(SEQ ID NO:84)
YKR9:atctggtaaaatgcttttacccggagacag(SEQ ID NO:85)
YKF10:agtttgggcgccaccatggacatgcgcgtg(SEQ ID NO:86)
YKR10:atctggtaaaatgctacactctcccctgttg(SEQ ID NO:87)
YKF11:ctttacgcacacaacatggagtttgggctg(SEQ ID NO:88)
YKR11:tcgagcggccgctcatttacccggagacag(SEQ ID NO:89)
YKF12:cgccaagctctagc(SEQ ID NO:90)
YKR12:ggtcgaggtcgggg(SEQ ID NO:91)
YKF13:acatgcgcgtgcccgcccagtggttccccggctcgcgatg(SEQ ID NO:92)
YKR13:catcgcgagccggggaaccactgggcgggcacgcgcatgt(SEQ ID NO:93)
YKF14:ctttacgcacacaacgacatccagatgacc(SEQ ID NO:94)
YKR14:ggtcatctggatgtcgttgtgtgcgtaaag(SEQ ID NO:95)
YKF15:tggttccccggctcgGgaGgcgacatccagatgacc(SEQ ID NO:96)
YKR15:ggtcatctggatgtcgcctcccgagccggggaacca(SEQ ID NO:97)
为了制备构建体A,将质粒pTT3-HC-int-LC p.hori用作模板2,并各自使用诱变引物YKF1和引物YKR3以及诱变引物YKR1和引物YKF3扩增重叠DNA片段。通过PCR产生连接以上2个PCR片段的DNA片段,使用以上2个PCR片段的混合物作为模板,以及引物TKF3和YKR3。然后用限制酶EcoR I和Not I切割该PCR,并克隆至用相同限制酶切割的pTT3-HC-int-LC P.hori中。
以用于构建体A相似的方式产生构建体B,除了替代YKF1和YKR1使用诱变引物YKF2和YKR2,并替代质粒pTT3-HC-int-LCP.hori,将质粒pTT3-HC-int-LC-1aa P.hori用作PCR模板,并将pTT3-HC-int-LC P.hori载体用作克隆的背景。
为了制备构建体E,使用作为模板的质粒pTT3-HC-int-LC-1aaP.hori扩增DNA片段,以及引物YKF4和诱变引物YKR4。用Sac II和Mfe I切割该PCR片段,并克隆至使用相同限制酶切割的pTT3-HC-int-LC p.hori中。
对于构建体H,将pTT3-HC-int-LC P.hori用作模板2,并扩增重叠片段,使用诱变引物YKF5和引物YKR3用于一个片段,以及引物F3和诱变引物R5用于另一个片段。使用以上2个片段作为模板以及引物YKF3和YKR3进行第二轮PCR扩增。用限制酶EcoR I和Not I消化该片段,并克隆至使用相同酶切割的pTT3-HC-int-LC p.hori中。
为了制备构建体J,将pTT3-HC-int-LC P.hori用作模板2,并扩增重叠片段,使用诱变引物YKF13和引物YKR3用于一个片段,以及引物F3和诱变引物R13用于另一个片段。使用以上2个片段作为模板以及引物YKF3和YKR3进行第二轮PCR扩增。用限制酶EcoR I和NotI消化该片段,并克隆至使用相同酶切割的pTT3-HC-int-LC p.hori中。
对于构建体K,将pTT3-HC-int-LC P.hori用作模板2。扩增重叠片段,使用诱变引物YKF14和引物YKR3用于一个片段,以及引物F3和诱变引物R14用于另一个片段。使用以上2个片段作为模板以及引物YKF3和YKR3进行第二轮PCR扩增。用限制酶EcoR I和Not I消化该片段,并克隆至使用相同酶切割的pTT3-HC-int-LC P.hori中。
为了制备构建体L,将pTT3-HC-int-LC P.hori用作模板2,并扩增重叠片段,使用诱变引物YKF15和引物YKR3用于一个片段,以及引物F3和诱变引物R15用于另一个片段。使用以上2个片段作为模板以及引物YKF3和YKR3进行第二轮PCR扩增。用限制酶EcoR I和NotI消化该片段,并克隆至使用相同酶切割的pTT3-HC-int-LC P.hori中。
证实了所有构建体的核苷酸序列。所有构建体具有与pTT3-HC-int-LC P.hori相同的序列,除了D2E7重链的最后一个密码子(编码PGK)和D2E7轻链成熟序列的第一个密码子(编码DIQ)之间的序列。如下提供了所有构建体的该片段中的序列,其包括wt或突变蛋白内含子结合wt或突变轻链信号序列。
表13A.构建体A的部分编码序列(SEQ ID NO:98)
Ccgggtaaa-
agcattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatagggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagccctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcagggaaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaatggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttccagaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgatgatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaaggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtgaagttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaatagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtggataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactacataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcgaaacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgccatatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttccttaagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcctgaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatcctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtgttgaggataatgagaacttcctcgttggcttcggactactttacgcagccaacatggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgc-gacatccag
表13B.显示构建体A中蛋白内含子和侧翼序列的部分氨基酸序列(SEQ ID NO:99)
Pgk-
silpdewlpivenekvrfvkigdfidreieenaervkrdgeteilevkdlkalsfnretkkselkkvkalirhrysgkvysiklksgrrikitsghslfsvkngklvkvrgdelkpgdlvvvpgrlklpeskqvlnlvelllklpeeetsnivmmipvkgrknffkgmlktlywifgegerprtagrylkhlerlgyvklkrrgcevldweslkryrklyetliknlkyngnsraymvefnslrdvvslmpieelkewiigeprgpkigtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaeklfgkvrrgrgyievsgkishaifrvlaegkripefiftspmdikvaflkglngnaeeltfstksellvnqlilllnsigvsdikiehekgvyrvyinkkessngdivldsvesievekyegyvydlsvednenflvgfgllyaanmdmrvpaqllgllllwfpgsrc-diq
表14A.构建体B中的部分编码序列(SEQ ID NO:100)
Ccgggtaaa-
agcattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatagggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagccctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcagggaaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaatggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttccagaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgatgatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaaggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtgaagttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaatagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtggataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactacataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcgaaacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgccatatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttccttaagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcctgaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatcctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtgttgaggataatgagaacttcctcgttggcttcggactactttacgcagccaacagtatggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgc-gacatccag
表14B.构建体B中的部分氨基酸序列(SEQ ID NO:101)
Pgk-
silpdewlpivenekvrfvkigdfidreieenaervkrdgeteilevkdlkalsfnretkkselkkvkalirhrysgkvysiklksgrrikitsghslfsvkngklvkvrgdelkpgdlvvvpgrlklpeskqvlnlvelllklpeeetsnivmmipvkgrknffkgmlktlywifgegerprtagrylkhlerlgyvklkrrgcevldweslkryrklyetliknlkyngnsraymvefnslrdvvslmpieelkewiigeprgpkigtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaeklfgkvrrgrgyievsgkishaifrvlaegkripefiftspmdikvaflkglngnaeeltfstksellvnqlilllnsigvsdikiehekgvyrvyinkkessngdivldsvesievekyegyvydlsvednenflvgfgllyaansmdmrvpaqllgllllwfpgsrc-diq
表15A.构建体E中的部分编码序列(SEQ ID NO:102)
Ccgggtaaa-
accattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatagggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagccctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcagggaaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaatggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttccagaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgatgatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaaggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtgaagttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaatagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtggataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactacataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcgaaacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgccatatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttccttaagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcctgaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatcctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtgttgaggataatgagaacttcctcgttggcttcggactactttacgcacacaacagtatggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgc-gacatccag
表15B.构建体E中的部分氨基酸序列(SEQ ID NO:103)
Pgk-
tilpdewlpivenekvrfvkigdfidreieenaervkrdgetellevkdlkalsfnretkkselkkvkalirhrysgkvysiklksgrrikitsghslfsvkngklvkvrgdelkpgdlvvvpgrlklpeskqvlnlvelllklpeeetsnivmmipvkgrknffkgmlktlywifgegerprtagrylkhlerlgyvklkrrgcevldweslkryrklyetliknlkyngnsraymvefnslrdvvslmpieelkewiigeprgpkigtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaeklfgkvrrgrgyievsgkishaifrvlaegkripefiftspmdikvaflkglngnaeeltfstksellvnqlilllnsigvsdikiehekgvyrvyinkkessngdivldsvesievekyegyvydlsvednenflvgfgllyahnsmdmrvpaqllgllllwfpgsrc-diq
表16A.构建体H中的部分编码序列(SEQ ID NO:104)
Ccgggtaaa-
agcattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatagggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagccctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcagggaaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaatggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttccagaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgatgatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaaggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtgaagttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaatagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtggataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactacataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcgaaacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgccatatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttccttaagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcctgaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatcctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtgttgaggataatgagaacttcctcgttggcttcggactactttacgcacacaacatggacatgcgcgtgcccgcccagctgctgggcgacgagtggttccccggctcgcgatgc-gacatccag
表16B.构建体H中的部分氨基酸序列(SEQ ID NO:105)
Pgk-
silpdewlpivenekvrfvkigdfidreieenaervkrdgeteilevkdlkalsfnretkkselkkvkalirhrysgkvysiklksgrrikitsghslfsvkngklvkvrgdelkpgdlvvvpgrlklpeskqvlnlvelllklpeeetsnivmmipvkgrknffkgmlktlywifgegerprtagrylkhlerlgyvklkrrgcevldweslkryrklyetliknlkyngnsraymvefnslrdvvslmpieelkewiigeprgpkigtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaeklfgkvrrgrgyievsgkishaifrvlaegkripefiftspmdikvaflkglngnaeeltfstksellvnqlilllnsigvsdikiehekgvyrvyinkkessngdivldsvesievekyegyvydlsvednenflvgfgllyahnrmdmrvpaqllgdewfpgsrc-diq
表17A.构建体J中的部分编码序列(SEQ ID NO:106)
Ccgggtaaa-
agcattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatagggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagccctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcagggaaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaatggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttccagaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgatgatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaaggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtgaagttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaatagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtggataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactacataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcgaaacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgccatatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttccttaagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcctgaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatcctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtgttgaggataatgagaacttcctcgttggcttcggactactttacgcacacaacatggacatgcgcgtgcccgcccagtggttccccggctcgcgatgc-gacatccag
表17B.构建体J中的部分氨基酸序列(SEQ ID NO:107)
Pgk-
silpdewlpivenekvrfvkigdfidreieenaervkrdgeteilevkdlkalsfnretkkselkkvkalirhrysgkvysiklksgrrikitsghslfsvkngklvkvrgdelkpgdlvvvpgrlklpeskqvlnlvelllklpeeetsnivmmipvkgrknffkgmlktlywifgegerprtagrylkhlerlgyvklkrrgcevldweslkryrklyetliknlkyngnsraymvefnslrdvvslmpieelkewiigeprgpkigtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaeklfgkvrrgrgyievsgkishaifrvlaegkripefiftspmdikvaflkglngnaeeltfstksellvnqlllllnsigvsdikiehekgvyrvyinkkessngdivldsvesievekyegyvydlsvednenflvgfgllyahnmdmrvpaqvfpgsrc-diq
表18A.构建体K中的部分编码序列(SEQ ID NO:108)
Ccgggtaaa-
agcattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatagggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagccctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcagggaaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaatggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttccagaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgatgatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaaggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtgaagttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaatagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtggataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactacataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcgaaacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgccatatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttccttaagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcctgaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatcctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtgttgaggataatgagaacttcctcgttggcttcggactactttacgcacacaac-gacatccag
表18B.构建体K中的部分氨基酸序列(SEQ ID NO:109)
Pgk-
silpdewlpivenekvrfvkigdfidreieenaervkrdgeteilevkdlkalsfnretkkselkkvkalirhrysgkvysiklksgrrikitsghslfsvkngklvkvrgdelkpgdlvvvpgrlklpeskqvlnlvelllklpeeetsnivmmipvkgrknffkgmlktlywifgegerprtagrylkhlerlgyvklkrrgcevldweslkryrklyetliknlkyngnsraymvefnslrdvvslmpieelkewiigeprgpkigtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaeklfgkvrrgrgyievsgkishaifrvlaegkripefiftspmdikvaflkglngnaeeltfstksellvnqlilllnsigvsdikiehekgvyrvyinkkessngdivldsvesievekyegyvydlsvednenflvgfgllyahn-diq
表19A.构建体L中的部分编码序列(SEQ ID NO:110)
Ccgggtaaa-
agcattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatagggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagccctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcagggaaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaatggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttccagaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgatgatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaaggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtgaagttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaatagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtggataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactacataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcgaaacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgccatatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttccttaagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcctgaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatcctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtgttgaggataatgagaacttcctcgttggcttcggactactttacgcacacaacatggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgggaggc-gacatccag
表19B.构建体L中的部分氨基酸序列(SEQ ID NO:111)
Pgk-
silpdewlpivenekvrfvkigdfidreieenaervkrdgeteilevkdlkalsfnretkkselkkvkalirhrysgkvysiklksgrrikitsghslfsvkngklvkvrgdelkpgdlvvvpgrlklpeskqvlnlvelllklpeeetsnivmmipvkgrknffkgmlktlywifgegerprtagrylkhlerlgyvklkrrgcevldweslkryrklyetliknlkyngnsraymvefnslrdvvslmpieelkewiigeprgpkigtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaeklfgkvrrgrgyievsgkishaifrvlaegkripefiftspmdikvaflkglngnaeeltfstksellvnqlilllnsigvsdikiehekgvyrvyinkkessngdivldsvesievekyegyvydlsvednenflvgfgllyahnrmdmrvpaqllgllllwfpgsgg-diq
重链3’序列-蛋白内含子+轻链信号肽序列-轻链成熟序列
将以下寡核苷酸用于酿酒酵母VMA蛋白内含子(GenBank登录号#AB093499)的扩增,使用基因组DNA作为模板和Pfu-I Hi FidelityDNA聚合酶(Stratagene)。使用Yeast-Geno-DNA-Template试剂盒(GBiosciences,cat.#786-134)从酿酒酵母的培养物中制备基因组DNA。
Sce VMA蛋白内含子5’:TGCTTTGCCAAGGGTACCAATGTTTT(SEQ ID NO:112)
Sce VMA蛋白内含子3’:ATTATGGACGACAACCTGGTTGGCAA(SEQ ID NO:113)
根据以下程序运行PCR:
步骤  1     2     3     4     5                6     7    8
温度  94℃  94℃  50℃  72℃  转到步骤2(39次)  72℃  4℃  结束
时间  2min  1min  1min  2min                   5min  保持
将PCR产物用作模板,使用以下的引物对来产生用于极端嗜热古菌构建体的蛋白内含子的0aa,1aa和3aa形式。使用Pfu-I Hi FidelityDNA聚合酶(Stratagene)。
Sce-5’-Sap
CCGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAATGCTTTGCCAAGGGTACCAATGTTTT(SEQ ID NO:114)
Sce-5’-1aa-Sap
CCGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAAGGGTGCTTTGCCAAGGGTACCAATGTTTT(SEQ ID NO:115)
Sce-5’-3aa-Sap
CCGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAATATGTCGGGTGCTTTGCCAAGGGTACCAATGTTTT(SEQ ID NO:116)
Sce-3’-Van911
CAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATATTATGGACGACAACCTGGTTGGCAA(SEQ ID NO:117)
Sce-3’-1aa-Van911
CAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATGCAATTATGGACGACAACCTGGTTGGCAA(SEQ ID NO:118)
Sce-3’-3aa-Van911
CAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATTTCTCCGCAATTATGGACGACAACCTGGT TGGCAA(SEQ ID NO:119)
使用以上提供的相同程序运行PCR。将来自每个反应类型的PCR产物亚克隆至pCR-BluntII-TOPO(Invitrogen)中,将每个类型的插入片段测序并证明正确性。
为了通过同源重组至大肠杆菌中的pTT3-HcintLC p.horikoshii构建体中来产生D2E7重链-蛋白内含子-D2E7轻链的融合体,设计寡核苷酸引物。通过工程化PCR产生的载体(含有pTT3载体,重链和轻链片段,但没有极端嗜热古菌蛋白内含子)和VMA蛋白内含子插入片段之间的40个碱基对悬垂物,可以混合两个DNA并转化至大肠杆菌中,没有连接的益处,导致两个片段的大肠杆菌同源重组至0aa,1aa和3aa形式的pTT3-HC-VMAint-LC中。
VMA同源重组引物:
VMA-HR5’:
CCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAA(SEQ IDNO:120)
VMA-HR3’:
GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCAT(SEQ IDNO:121)
pTT3-HcintLC同源重组引物:
pTT3int-HR5’:
ATGGACATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGC(SEQ IDNO:122)
pTT3int-HR3’:
TTTACCCGGAGACAGGGAGAGGCTCTTCTGCGTGTAGTGGT(SEQ IDNO:123)
根据以下程序运行用于蛋白内含子的PCR:使用Pfu-I Hi FidelityDNA聚合酶(Stratagene)。
步骤  1     2     3     4     5                6     7    8
温度  94℃  94℃  60℃  72℃  转到步骤2(34次)  72℃  4℃  结束
时间  2min  1min  1min  1.5min                 5min  保持
按照以下程序运行用于载体的PCR:使用Platinum Taq Hi FidelitySupermix(Invitrogen)。
步骤  1     2      3      4      5                6     7    8
温度  94℃  94℃   60℃   68℃   转到步骤2(24次)  68℃  4℃  结束
时间  2min  30sec  30sec  10min                   5min  保持
为了实现VMA同源重组至pTT3-HcintLC中,使用以下的策略。使用Qiaquick凝胶提取试剂盒(Qiagen)将PCR产物凝胶纯化,并将每个稀释至50μl稀释缓冲液中。将3μl载体PCR产物在eppendorf管中混合,并加入3μl所需的VMA蛋白内含子PCR产物(将0aa,1aa或3aa加入分开的管中)。将每个混合物转化至大肠杆菌中,然后将细胞置于LB+氨苄青霉素平板上,并在37℃培养过夜。将克隆生长至2ml培养物,使用Wizard Prep试剂盒(Promega)制备质粒DNA并通过限制性核酸内切酶消化和琼脂糖凝胶电泳来分析。对于DNA序列分析产生正确限制模式的克隆。
形成了三个使用酿酒酵母VMA蛋白内含子的用于D2E7重链-蛋白内含子-D2E7轻链的表达构建体:pTT3-Hc-VMAint-LC-0aa;pTT3-Hc-VMAint-LC-1aa;和pTT3-Hc-VMAint-LC-3aa。还可以参见图15的质粒图谱。
表20.完整的质粒pTT3-D2E7重链-蛋白内含子-D2E7轻链的序列(SEQ ID NO:124)
5’-
gcggccgctcgaggccggcaaggccggatcccccgacctcgacctctggctaataaaggaaatttattttcattgcaatagtgtgttggaattttttgtgtctctcactcggaaggacatatgggagggcaaatcatttggtcgagatccctcggagatctctagctagaggatcgatccccgccccggacgaactaaacctgactacgacatctctgccccttcttcgcggggcagtgcatgtaatcccttcagttggttggtacaacttgccaactgggccctgttccacatgtgacacggggggggacc aaacacaaaggggttctctgactgtagttgacatccttataaatggatgtgcacatttgccaacactgagtggctttcatcctggagcagactttgcagtctgtggactgcaacacaacattgcctttatgtgtaactcttggctgaagctcttacaccaatgctgggggacatgtacctcccaggggcccaggaagactacgggaggctacaccaacgtcaatcagaggggcctgtgtagctaccgataagcggaccctcaagagggcattagcaatagtgtttataaggcccccttgttaaccctaaacgggtagcatatgcttcccgggtagtagtatatactatccagactaaccctaattcaatagcatatgttacccaacgggaagcatatgctatcgaattagggttagtaaaagggtcctaaggaacagcgatatctcccaccccatgagctgtcacggttttatttacatggggtcaggattccacgagggtagtgaaccattttagtcacaagggcagtggctgaagatcaaggagcgggcagtgaactctcctgaatcttcgcctgcttcttcattctccttcgtttagctaatagaataactgctgagttgtgaacagtaaggtgtatgtgaggtgctcgaaaacaaggtttcaggtgacgcccccagaataaaatttggacggggggttcagtggtggcattgtgctatgacaccaatataaccctcacaaaccccttgggcaataaatactagtgtaggaatgaaacattctgaatatctttaacaatagaaatccatggggtggggacaagccgtaaagactggatgtccatctcacacgaatttatggctatgggcaacacataatcctagtgcaatatgatactggggttattaagatgtgtcccaggcagggaccaagacaggtgaaccatgttgttacactctatttgtaacaaggggaaagagagtggacgccgacagcagcggactccactggttgtctctaacacccccgaaaattaaacggggctccacgccaatggggcccataaacaaagacaagtggccactcttttttttgaaattgtggagtgggggcacgcgtcagcccccacacgccgccctgcggttttggactgtaaaataagggtgtaataacttggctgattgtaaccccgctaaccactgcggtcaaaccacttgcccacaaaaccactaatggcaccccggggaatacctgcataagtaggtgggcgggccaagataggggcgcgattgctgcgatctggaggacaaattacacacacttgcgcctgagcgccaagcacagggttgttggtcctcatattcacgaggtcgctgagagcacggtgggctaatgttgccatgggtagcatatactacccaaatatctggatagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctaatagagattagggtagtatatgctatcctaatttatatctgggtagcatatactacccaaatatctggatagcatatgctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctcatgataagctgtcaaacatgagaattttcttgaagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtgttgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgcagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgttcttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgccaagctctagctagaggtcgaccaattctcatgtttgacagcttatcatcgcagatccgggcaacgttgttgccattgctgcaggcgcagaactggtaggtatggaagatctatacattgaatcaatattggcaattagccatattagtcattggttatatagcataaatcaatattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattggctcatgtccaatatgaccgccatgttgacattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacaccaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaataaccccgccccgttgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcgtttagtgaaccgtcagatcctcactctcttccgcatcgctgtctgcgagggccagctgttgggctcgcggttgaggacaaactcttcgcggtctttccagtactcttggatcggaaacccgtcggcctccgaacggtactccgccaccgagggacctgagcgagtccgcatcgaccggatcggaaaacctctcgagaaaggcgtctaaccagtcacagtcgcaaggtaggctgagcaccgtggcgggcggcagcgggtggcggtcggggttgtttctggcggaggtgctgctgatgatgtaattaaagtaggcggtcttgagacggcggatggtcgaggtgaggtgtggcaggcttgagatccagctgttggggtgagtactccctctcaaaagcgggcattacttctgcgctaagattgtcagtttccaaaaacgaggaggatttgatattcacctggcccgatctggccatacacttgagtgacaatgacatccactttgcctttctctccacaggtgtccactcccaggtccaagtttgggcgccaccatggagtttgggctgagctggctttttcttgtcgcgattttaaaaggtgtccagtgt-
gaggtgcagctggtggagtctgggggaggcttggtacagcccggcaggtccctgagactctcctgtgcggcctctggattcacctttgatgattatgccatgcactgggtccggcaagctccagggaagggcctggaatgggtctcagctatcacttggaatagtggtcacatagactatgcggactctgtggagggccgattcaccatctccagagacaacgccaagaactccctgtatctgcaaatgaacagtctgagagctgaggatacggccgtatattactgtgcgaaagtctcgtaccttagcaccgcgtcctcccttgactattggggccaaggtaccctggtcaccgtctcgagtgcgtcgaccaagggcccatcggtcttccccctggcaccctcctccaagagcacctctgggggcacagcggccctgggctgcctggtcaaggactacttccccgaaccggtgacggtgtcgtggaactcaggcgccctgaccagcggcgtgcacaccttcccggctgtcctacagtcctcaggactctactccctcagcagcgtggtgaccgtgccctccagcagcttgggcacccagacctacatctgcaacgtgaatcacaagcccagcaacaccaaggtggacaagaaagttgagcccaaatcttgtgacaaaactcacacatgcccaccgtgcccagcacctgaactcctggggggaccgtcagtcttcctcttccccccaaaacccaaggacaccctcatgatctcccggacccctgaggtcacatgcgtggtggtggacgtgagccacgaagaccctgaggtcaagttcaactggtacgtggacggcgtggaggtgcataatgccaagacaaagccgcgggaggagcagtacaacagcacgtaccgtgtggtcagcgtcctcaccgtcctgcaccaggactggctgaatggcaaggagtacaagtgcaaggtctccaacaaagccctcccagcccccatcgagaaaaccatctccaaagccaaagggcagccccgagaaccacaggtgtacaccctgcccccatcccgggatgagctgaccaagaaccaggtcagcctgacctgcctggtcaaaggcttctatcccagcgacatcgccgtggagtgggagagcaatgggcagccggagaacaactacaagaccacgcctcccgtgctggactccgacggctccttcttcctctacagcaagctcaccgtggacaagagcaggtggcagcaggggaacgtcttctcatgctccgtgatgcatgaggctctgcacaaccactacacgcagaagagcctctccctgtctccgggtaaa-
tgctttgccaagggtaccaatgttttaatggcggatgggtctattgaatgtattgaaaacattgaggttggtaataaggtcatgggtaaagatggcagacctcgtgaggtaattaaattgcccagaggaagagaaactatgtacagcgtcgtgcagaaaagtcagcacagagcccacaaaagtgactcaagtcgtgaagtgccagaattactcaagtttacgtgtaatgcgacccatgagttggttgttagaacacctcgtagtgtccgccgtttgtctcgtaccattaagggtgtcgaatattttgaagttattacttttgagatgggccaaaagaaagcccccgacggtagaattgttgagcttgtcaaggaagtttcaaagagctacccaatatctgaggggcctgagagagccaacgaattagtagaatcctatagaaaggcttcaaataaagcttattttgagtggactattgaggccagagatctttctctgttgggttcccatgttcgtaaagctacctaccagacttacgctccaattctttatgagaatgaccactttttcgactacatgcaaaaaagtaagtttcatctcaccattgaaggtccaaaagtacttgcttatttacttggtttatggattggtgatggattgtctgacagggcaactttttcggttgattccagagatacttctttgatggaacgtgttactgaatatgctgaaaagttgaatttgtgcgccgagtataaggacagaaaagaaccacaagttgccaaaactgttaatttgtactctaaagttgtcagaggtaatggtattcgcaataatcttaatactgagaatccattatgggacgctattgttggcttaggattcttgaaggacggtgtcaaaaatattccttctttcttgtctacggacaatatcggtactcgtgaaacatttcttgctggtctaattgattctgatggctatgttactgatgagcatggtattaaagcaacaataaagacaattcatacttctgtcagagatggtttggtttcccttgctcgttctttaggcttagtagtctcggttaacgcagaacctgctaaggttgacatgaatggcaccaaacataaaattagttatgctatttatatgtctggtggagatgttttgcttaacgttctttcgaagtgtgccggctctaaaaaattcaggcctgctcccgccgctgcttttgcacgtgagtgccgcggattttatttcgagttacaagaattgaaggaagacgattattatgggattactttatctgatgattctgatcatcagtttttgcttgccaaccaggttgtcgtccataat-
atggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgcgacatccagatgacccagtctccatcctccctgtctgcatctgtaggggacagagtcaccatcacttgtcgggcaagtcagggcatcagaaattacttagcctggtatcagcaaaaaccagggaaagcccctaagctcctgatctatgctgcatccactttgcaatcaggggtcccatctcggttcagtggcagtggatctgggacagatttcactctcaccatcagcagcctacagcctgaagatgttgcaacttattactgtcaaaggtataaccgtgcaccgtatacttttggccaggggaccaaggtggaaatcaaacgtacggtggctgcaccatctgtcttcatcttcccgccatctgatgagcagttgaaatctggaactgcctctgttgtgtgcctgctgaataacttctatcccagagaggccaaagtacagtggaaggtggataacgccctccaatcgggtaactcccaggagagtgtcacagagcaggacagcaaggacagcacctacagcctcagcagcaccctgacgctgagcaaagcagactacgagaaacacaaagtctacgcctgcgaagtcacccatcagggcctgagctcgcccgtcacaaagagcttcaacaggggagagtgt -3’
pTT3载体-重链-蛋白内含子-轻链
在以下的构建体中,与以上构建体的唯一差异是包括酿酒酵母天然的蛋白外显子序列(以蓝色显示)。所示的序列从D2E7重链编码片段的末端(以红色显示的最后9个碱基对)至D2E7轻链编码片段的5’端(以粉色显示的头9个碱基对)。
表21.pTT3-HC-VMAint-LC-1aa的部分编码序列(SEQ ID NO:125)
5’-ccgggtaaa-ggg-
tgctttgccaagggtaccaatgttttaatggcggatgggtctattgaatgtattgaaaacattgaggttggtaataaggtcatgggtaaagatggcagacctcgtgaggtaattaaattgcccagaggaagagaaactatgtacagcgtcgtgcagaaaagtcagcacagagcccacaaaagtgactcaagtcgtgaagtgccagaattactcaagtttacgtgtaatgcgacccatgagttggttgttagaacacctcgtagtgtccgccgtttgtctcgtaccattaagggtgtcgaatattttgaagttattacttttgagatgggccaaaagaaagcccccgacggtagaattgttgagcttgtcaaggaagtttcaaagagctacccaatatctgaggggcctgagagagccaacgaattagtagaatcctatagaaaggcttcaaataaagcttattttgagtggactattgaggccagagatctttctctgttgggttcccatgttcgtaaagctacctaccagacttacgctccaattctttatgagaatgaccactttttcgactacatgcaaaaaagtaagtttcatctcaccattgaaggtccaaaagtacttgcttatttacttggtttatggattggtgatggattgtctgacagggcaactttttcggttgattccagagatacttctttgatggaacgtgttactgaatatgctgaaaagttgaatttgtgcgccgagtataaggacagaaaagaaccacaagttgccaaaactgttaatttgtactctaaagttgtcagaggtaatggtattcgcaataatcttaatactgagaatccattatgggacgctattgttggcttaggattcttgaaggacggtgtcaaaaatattccttctttcttgtctacggacaatatcggtactcgtgaaacatttcttgctggtctaattgattctgatggctatgttactgatgagcatggtattaaagcaacaataaagacaattcatacttctgtcagagatggtttggtttcccttgctcgttctttaggcttagtagtctcggttaacgcagaacctgctaaggttgacatgaatggcaccaaacataaaattagttatgctatttatatgtctggtggagatgttttgcttaacgttctttcgaagtgtgccggctctaaaaaattcaggcctgctcccgccgctgcttttgcacgtgagtgccgcggattttatttcgagttacaagaattgaaggaagacgattattatgggattactttatctgatgattctgatcatcagtttttgcttgccaaccaggttgtcgtccataat-tgc-atggacatg-3’
重链3’序列-蛋白内含子-蛋白外显子-轻链5’序列
表22.pTT3-HC-VMAint-LC-3aa(SEQ ID NO:126)
ccgggtaaatatgtcgggtgctttgccaagggtaccaatgttttaatggcggatgggtctattgaatgtattgaaaacattgaggttggtaataaggtcatgggtaaagatggcagacctcgtgaggtaattaaattgcccagaggaagagaaactatgtacagcgtcgtgcagaaaagtcagcacagagcccacaaaagtgactcaagtcgtgaagtgccagaattactcaagtttacgtgtaatgcgacccatgagttggttgttagaacacctcgtagtgtccgccgtttgtctcgtaccattaagggtgtcgaatattttgaagttattacttttgagatgggccaaaagaaagcccccgacggtagaattgttgagcttgtcaaggaagtttcaaagagctacccaatatctgaggggcctgagagagccaacgaattagtagaatcctatagaaaggcttcaaataaagcttattttgagtggactattgaggccagagatctttctctgttgggttcccatgttcgtaaagctacctaccagacttacgctccaattctttatgagaatgaccactttttcgactacatgcaaaaaagtaagtttcatctcaccattgaaggtccaaaagtacttgcttatttacttggtttatggattggtgatggattgtctgacagggcaactttttcggttgattccagagatacttctttgatggaacgtgttactgaatatgctgaaaagttgaatttgtgcgccgagtataaggacagaaaagaaccacaagttgccaaaactgttaatttgtactctaaagttgtcagaggtaatggtattcgcaataatcttaatactgagaatccattatgggacgctattgttggcttaggattcttgaaggacggtgtcaaaaatattccttctttcttgtctacggacaatatcggtactcgtgaaacatttcttgctggtctaattgattctgatggctatgttactgatgagcatggtattaaagcaacaataaagacaattcatacttctgtcagagatggtttggtttcccttgctcgttctttaggcttagtagtctcggttaacgcagaacctgctaaggttgacatgaatggcaccaaacataaaattagttatgctatttatatgtctggtggagatgttttgcttaacgttctttcgaagtgtgccggctctaaaaaattcaggcctgctcccgccgctgcttttgcacgtgagtgccgcggattttatttcgagttacaagaattgaaggaagacgattattatgggattactttatctgatgattctgatcatcagtttttgcttgccaaccaggttgtcgtccataattgcggagaaatggacatg
重链3’序列-蛋白内含子-蛋白外显子-轻链5’序列
集胞藻株PCC6803DnaE蛋白内含子:合成、PCR扩增和克隆
集胞藻株PCC6803DnaE蛋白内含子是天然裂解的蛋白内含子(NCBI登录号#s S76958和S75328)。我们已经连接该蛋白内含子的N’端和C-端对半,作为一个已经合成的开放阅读框。所需蛋白序列的编码序列是用于CHO细胞中表达的密码子最佳化的(www.geneart.com)。表23中给出了所得到的核苷酸序列。
表23.Ssp-Di(在黑线仓鼠(Cricetulus griseus)中表达最佳化的编码序列)(还可以参见SEQ ID NO:127和128)
KpnI EcoRI
GGGCGAATTGGGTACCGAATTCTGCCTGTCCTTCGGCACCGAGATCCTGACCGTGGAGTA
1 ---------+---------+---------+---------+---------+---------+
CCCGCTTAACCCATGGCTTAAGACGGACAGGAAGCCGTGGCTCTAGGACTGGCACCTCAT
C__L__S__F__G__T__E__I__L__T__V__E__Y_
CGGCCCTCTGCCTATCGGCAAGATCGTGTCCGAAGAGATCAACTGCTCCGTGTACTCCGT
61 ---------+---------+---------+---------+---------+---------+
GCCGGGAGACGGATAGCCGTTCTAGCACAGGCTTCTCTAGTTGACGAGGCACATGAGGCA
_G__P__L__P__I__G__K__I__V__S__E__E__I__N__C__S__V__Y__S__V_
AccI
GGACCCTGAGGGCCGGGTGTATACTCAGGCCATCGCCCAGTGGCACGACCGGGGCGAGCA
121 ---------+---------+---------+---------+---------+---------+
CCTGGGACTCCCGGCCCACATATGAGTCCGGTAGCGGGTCACCGTGCTGGCCCCGCTCGT
_D__P__E__G__R__V__Y__T__Q__A__I__A__Q__W__H__D__R__G__E__Q_
AgeI
GGAGGTGCTGGAGTACGAGCTGGAGGACGGCTCCGTGATCCGGGCCACCTCCGACCACCG
181 ---------+---------+---------+---------+---------+---------+
CCTCCACGACCTCATGCTCGACCTCCTGCCGAGGCACTAGGCCCGGTGGAGGCTGGTGGC
_E__V__L__E__Y__E__L__E__D__G__S__V__I__R__A__T__S__D__H__R_
PvuII BglII PvuII BspMI
GTTTCTGACCACCGACTATCAGCTGCTGGCCATCGAGGAGATCTTCGCCCGGCAGCTGGA
241 ---------+---------+---------+---------+---------+---------+
CAAAGACTGGTGGCTGATAGTCGACGACCGGTAGCTCCTCTAGAAGCGGGCCGTCGACCT
_F__L__T__T__D__Y__Q__L__L__A__I__E__E__I__F__A__R__Q__L__D_
BstNI BstNI
CCTGCTGACCCTGGAGAACATCAAGCAGACCGAGGAGGCCCTGGACAACCACCGGCTGCC
301 +---------+---------+---------+---------+---------+
GGACGACTGGGACCTCTTGTAGTTCGTCTGGCTCCTCCGGGACCTGTTGGTGGCCGACGG
_L__L__T__L__E__N__I__K__Q__T__E__E__A__L__D__N__H__R__L__P_
BstXI BstNI
TTTCCCTCTGCTGGACGCCGGCACCATCAAGATGGTGAAGGTGATCGGCAGGCGGTCCCT
361 ---------+---------+---------+---------+---------+---------+
AAAGGGAGACGACCTGCGGCCGTGGTAGTTCTACCACTTCCACTAGCCGTCCGCCAGGGA
_F__P__L__L__D__A__G__T__I__K__M__V__K__V__I__G__R__R__S__L_
GGGCGTGCAGCGGATCTTCGACATCGGCCTGCCTCAGGACCACAACTTTCTGCTGGCCAA
421 ---------+---------+---------+---------+---------+---------+
CCCGCACGTCGCCTAGAAGCTGTAGCCGGACGGAGTCCTGGTGTTGAAAGACGACCGGTT
_G__V__Q__R__T__F__D__I__G__L__P__Q__D__H__N__F__L__L__A__N_
NarI
KasI SacI
HaeII HindIII
CGGCGCCATCGCCGCCAACAAGCTTGAGCTCCAGCTTTTGTTCCC
481 ---------+---------+---------+---------+-----
GCCGCGGTAGCGGCGGTTGTTCGAACTCGAGGTCGAAAACAAGGG
_G__A__I__A__A__N__
1
以下的寡核苷酸用于集胞藻株PCC6803DnaE蛋白内含子的扩增,使用以上合成的DNA作为模板和Platinum Taq Hi Supermix(Invitrogen)。这些引物还引入蛋白外显子序列来产生0aa,1aa和3aa形式,以及用于PCR产物同源重组至pTT3-HcintLC载体中的序列,和使用酿酒酵母VMA蛋白内含子一样进行:
Ssp-geneart-5’HR:
CCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAATGCCTGTCCTTCGGCACCGAG(SEQ ID NO:129)
SSp-geneart-3’-HR:
GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATGTTGGCGGCGATGGCGCCGTTGGCC(SEQ ID NO:130)
Ssp-GA-1aa-5’-HR:
CCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAATATTGCCTGTCCTTCGGCACCGAG(SEQ ID NO:131)
Ssp-GA-1aa-3’-HR:
GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATACAGTTGGCGGCGATGGCGCCGT(SEQ ID NO:132)
Ssp-GA-3aa-5’-HR:
CCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAAGCCGAGTATTGCCTGTCCTTCGGCACCGAG(SEQ ID NO:133)
Ssp-GA-3aa-3’-HR:
CCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAAGCCGAGTATTGCCTGTCCTTCGGCACCGAG(SEQ ID NO:134)
根据以下程序运行PCR:
步骤  1     2      3      4     5                6     7    8
温度  94℃  94℃   60℃   68℃  转到步骤2(34次)  68℃  4℃  结束
时间  2min  30sec  30sec  1min                   5min  保持
为了获得密码子最佳化的集胞藻株PCC6803 DnaE蛋白内含子同源克隆至pTT3-HcintLC中,使用以下的策略。将PCR产物凝胶纯化并将每个稀释至50μl稀释缓冲液中(Qiaquick凝胶提取试剂盒(Qiagen))。将2μl载体PCR产物(和使用VMA蛋白内含子的同源重组中所用的相同)和2μl所需的集胞藻株PCC6803DnaE蛋白内含子PCR产物(0aa,1aa或3aa在分开的管中)在Eppendorf管中混合。然后将核酸转化至大肠杆菌中并置于LB+氨苄青霉素平板上,然后在37℃培养过夜。将克隆生长至2ml培养物,使用Wizard prep试剂盒(Promega)制备DNA,并通过限制性核酸内切酶消化和琼脂糖凝胶电泳来分析。对于DNA序列分析产生正确限制模式的克隆,来证实存在所需的序列。
使用集胞藻株PCC6803DnaE蛋白内含子设计了三个用于D2E7重链-蛋白内含子-D2E7轻链的表达构建体:pTT3-Hc-Ssp-GA-int-LC-0aa(参见图16的质粒图谱);pTT3-Hc-Ssp-GA-int-LC-1aa;和pTT3-Hc-Ssp-GA-int-LC-3aa。
表24.完整质粒pTT3-D2E7重链-Ssp-GA-蛋白内含子-D2E7轻链的序列(SEQ ID NO:135)
5’-
gcggccgctcgaggccggcaaggccggatcccccgacctcgacctctggctaataaaggaaatttattttcattgcaatagtgtgttggaattttttgtgtctctcactcggaaggacatatgggagggcaaatcatttggtcgagatccctcggagatctctagctagaggatcgatccccgccccggacgaactaaacctgactacgacatctctgccccttcttcgcggggcagtgcatgtaatcccttcagttggttggtacaacttgccaactgggccctgttccacatgtgacacggggggggaccaaacacaaaggggttctctgactgtagttgacatccttataaatggatgtgcacatttgccaacactgagtggctttcatcctggagcagactttgcagtctgtggactgcaacacaacattgcctttatgtgtaactcttggctgaagctcttacaccaatgctgggggacatgtacctcccaggggcccaggaagactacgg gaggctacaccaacgtcaatcagaggggcctgtgtagctaccgataagcggaccctcaagagggcattagcaatagtgtttataaggcccccttgttaaccctaaacgggtagcatatgcttcccgggtagtagtatatactatccagactaaccctaattcaatagcatatgttacccaacgggaagcatatgctatcgaattagggttagtaaaagggtcctaaggaacagcgatatctcccaccccatgagctgtcacggttttatttacatggggtcaggattccacgagggtagtgaaccattttagtcacaagggcagtggctgaagatcaaggagcgggcagtgaactctcctgaatcttcgcctgcttcttcattctccttcgtttagctaatagaataactgctgagttgtgaacagtaaggtgtatgtgaggtgctcgaaaacaaggtttcaggtgacgcccccagaataaaatttggacggggggttcagtggtggcattgtgctatgacaccaatataaccctcacaaaccccttgggcaataaatactagtgtaggaatgaaacattctgaatatctttaacaatagaaatccatggggtggggacaagccgtaaagactggatgtccatctcacacgaatttatggctatgggcaacacataatcctagtgcaatatgatactggggttattaagatgtgtcccaggcagggaccaagacaggtgaaccatgttgttacactctatttgtaacaaggggaaagagagtggacgccgacagcagcggactccactggttgtctctaacacccccgaaaattaaacggggctccacgccaatggggcccataaacaaagacaagtggccactcttttttttgaaattgtggagtgggggcacgcgtcagcccccacacgccgccctgcggttttggactgtaaaataagggtgtaataacttggctgattgtaaccccgctaaccactgcggtcaaaccacttgcccacaaaaccactaatggcaccccggggaatacctgcataagtaggtgggcgggccaagataggggcgcgattgctgcgatctggaggacaaattacacacacttgcgcctgagcgccaagcacagggttgttggtcctcatattcacgaggtcgctgagagcacggtgggctaatgttgccatgggtagcatatactacccaaatatctggatagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctaatagagattagggtagtatatgctatcctaatttatatctgggtagcatatactacccaaatatctggatagcatatgctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctcatgataagctgtcaaacatgagaattttcttgaagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtgttgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgcagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgttcttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgccaagctctagctagaggtcgaccaattctcatgtttgacagcttatcatcgcagatccgggcaacgttgttgccattgctgcaggcgcagaactggtaggtatggaagatctatacattgaatcaatattggcaattagccatattagtcattggttatatagcataaatcaatattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattggctcatgtccaatatgaccgccatgttgacattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacaccaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaataaccccgccccgttgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcgtttagtgaaccgtcagatcctcactctcttccgcatcgctgtctgcgagggccagctgttgggctcgcggttgaggacaaactcttcgcggtctttccagtactcttggatcggaaacccgtcggcctccgaacggtactccgccaccgagggacctgagcgagtccgcatcgaccggatcggaaaacctctcgagaaaggcgtctaaccagtcacagtcgcaaggtaggctgagcaccgtggcgggcggcagcgggtggcggtcggggttgtttctggcggaggtgctgctgatgatgtaattaaagtaggcggtcttgagacggcggatggtcgaggtgaggtgtggcaggcttgagatccagctgttggggtgagtactccctctcaaaagcgggcattacttctgcgctaagattgtcagtttccaaaaacgaggaggatttgatattcacctggcccgatctggccatacacttgagtgacaatgacatccactttgcctttctctccacaggtgtccactcccaggtccaagtttgggcgccaccatggagtttgggctgagctggctttttcttgtcgcgattttaaaaggtgtccagtgt-
gaggtgcagctggtggagtctgggggaggcttggtacagcccggcaggtccctgagactctcctgtgcggcctctggattcacctttgatgattatgccatgcactgggtccggcaagctccagggaagggcctggaatgggtctcagctatcacttggaatagtggtcacatagactatgcggactctgtggagggccgattcaccatctccagagacaacgccaagaactccctgtatctgcaaatgaacagtctgagagctgaggatacggccgtatattactgtgcgaaagtctcgtaccttagcaccgcgtcctcccttgactattggggccaaggtaccctggtcaccgtctcgagtgcgtcgaccaagggcccatcggtcttccccctggcaccctcctccaagagcacctctgggggcacagcggccctgggctgcctggtcaaggactacttccccgaaccggtgacggtgtcgtggaactcaggcgccctgaccagcggcgtgcacaccttcccggctgtcctacagtcctcaggactctactccctcagcagcgtggtgaccgtgccctccagcagcttgggcacccagacctacatctgcaacgtgaatcacaagcccagcaacaccaaggtggacaagaaagttgagcccaaatcttgtgacaaaactcacacatgcccaccgtgcccagcacctgaactcctggggggaccgtcagtcttcctcttccccccaaaacccaaggacaccctcatgatctcccggacccctgaggtcacatgcgtggtggtggacgtgagccacgaagaccctgaggtcaagttcaactggtacgtggacggcgtggaggtgcataatgccaagacaaagccgcgg gaggagcagtacaacagcacgtaccgtgtggtcagcgtcctcaccgtcctgcaccaggactggctgaatggcaag gagtacaagtgcaaggtctccaacaaagccctcccagcccccatcgagaaaaccatctccaaagccaaagggcagccccgagaaccacaggtgtacaccctgcccccatcccgggatgagctgaccaagaaccaggtcagcctgacctgcctggtcaaaggcttctatcccagcgacatcgccgtggagtgggagagcaatgggcagccggagaacaactacaagaccacgcctcccgtgctggactccgacggctccttcttcctctacagcaagctcaccgtggacaagagcaggtggcagcaggggaacgtcttctcatgctccgtgatgcatgaggctctgcacaaccactacacgcagaagagcctctccctgtctccgggtaaa-
tgcctgtccttcggcaccgagatcctgaccgtggagtacggccctctgcctatcggcaagatcgtgtccgaagagatcaactgctccgtgtactccgtggaccctgagggccgggtgtatactcaggccatcgcccagtggcacgaccggggcgagcaggaggtgctggagtacgagctggaggacggctccgtgatccgggccacctccgaccaccggtttctgaccaccgactatcagctgctggccatcgaggagatcttcgcccggcagctggacctgctgaccctggagaacatcaagcagaccgaggaggccctggacaaccaccggctgcctttccctctgctggacgccggcaccatcaagatggtgaaggtgatcggcaggcggtccctgggcgtgcagcggatcttcgacatcggcctgcctcaggaccacaactttctgctggccaacggcgccatcgccgccaac-
atggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgcgacatccagatgacccagtctccatcctccctgtctgcatctgtaggggacagagtcaccatcacttgtcgggcaagtcagggcatcagaaattacttagcctggtatcagcaaaaaccagggaaagcccctaagctcctgatctatgctgcatccactttgcaatcaggggtcccatctcggttcagtggcagtggatctgggacagatttcactctcaccatcagcagcctacagcctgaagatgttgcaacttattactgtcaaaggtataaccgtgcaccgtatacttttggccaggggaccaaggtggaaatcaaacgtacggtggctgcaccatctgtcttcatcttcccgccatctgatgag cagttgaaatctggaactgcctctgttgtgtgcctgctgaataacttctatcccagagaggccaaagtacagtggaaggtggataacgccctccaatcgggtaactcccaggagagtgtcacagagcaggacagcaaggacagcacctacagcctcagcagcaccctgacgctgagcaaagcagactacgagaaacacaaagtctacgcctgcgaagtcacccatcagggcctgagctcgcccgtcacaaagagcttcaacaggggagagtgt-3’
pTT3载体-重链-蛋白内含子-轻链
在以下的构建体中,与以上构建体的唯一差异是包括集胞藻株PCC6803天然的蛋白外显子序列(以蓝色显示)。所示的序列从D2E7重链编码片段的末端(以红色显示的最后9个碱基对)至D2E7轻链编码片段的5’端(以粉色显示的头9个碱基对)。
表25.pTT3-HC-Ssp-GA-int-LC-1aa,编码序列的相关部分(SEQ IDNO:136)
Ccgggtaaa-tatt-
gcctgtccttcggcaccgagatcctgaccgtggagtacggccctctgcctatcggcaagatcgtgtccgaagagatcaactgctccgtgtactccgtggaccctgagggccgggtgtatactcaggccatcgcccagtggcacgaccggggcgagcaggaggtgctggagtacgagctggaggacggctccgtgatccgggccacctccgaccaccggtttctgaccaccgactatcagctgctggccatcgaggagatcttcgcccggcagctggacctgctgaccctggagaacatcaagcagaccgaggaggccctggacaaccaccggctgcctttccctctgctggacgccggcaccatcaagatggtgaaggtgatcggcaggcggtccctgggcgtgcagcggatcttcgacatcggcctgcctcaggaccacaactttctgctggccaacggcgccatcgccgccaac-tgt-atggacatg
pTT3载体-重链-蛋白内含子-轻链
表26.pTT3-HC-Ssp-GA-int-LC-3aa-编码序列的相关部分(SEQID NO:137)
Ccgggtaaa-gccgagtatt-
gcctgtccttcggcaccgagatcctgaccgtggagtacggccctctgcctatcggcaagatcgtgtccgaagagatcaactgctccgtgtactccgtggaccctgagggccgggtgtatactcaggccatcgcccagtggcacgaccggggcgagcaggaggtgctggagtacgagctggaggacggctccgtgatccgggccacctccgaccaccggtttctgaccaccgactatcagctgctggccatcgaggagatcttcgcccggcagctggacctgctgaccctggagaacatcaagcagaccgaggaggccctggacaaccaccggctgcctttccctctgctggacgccggcaccatcaagatggtgaaggtgatcggcaggcggtccctgggcgtgcagcggatcttcgacatcggcctgcctcaggaccacaactttctgctggccaacggcgccatcgccgccaac-tgtttcaac-atggacatg
pTT3载体-重链-蛋白内含子-轻链
此外,表8A-8C提供了D2E7蛋白内含子融合蛋白,表达载体的相关序列和使用突变的(丝氨酸至苏氨酸)Pyrococcus Ssp.GBD Pol蛋白内含子的编码序列。
表8A.D2E7蛋白内含子融合蛋白的编码序列(SEQ ID NO:48)
ATGGAGTTTGGGCTGAGCTGGCTTTTTCTTGTCGCGATTTTAAAAGGTGTCCAGTGTGAGGTGCAGCTGGTGGAGTCTGGGGGAGGCTTGGTACAGCCCGGCAGGTCCCTGAGACTCTCCTGTGCGGCCTCTGGATTCACCTTTGATGATTATGCCATGCACTGGGTCCGGCAAGCTCCAGGGAAGGGCCTGGAATGGGTCTCAGCTATCACTTGGAATAGTGGTCACATAGACTATGCGGACTCTGTGGAGGGCCGATTCACCATCTCCAGAGACAACGCCAAGAACTCCCTGTATCTGCAAATGAACAGTCTGAGAGCTGAGGATACGGCCGTATATTACTGTGCGAAAGTCTCGTACCTTAGCACCGCGTCCTCCCTTGACTATTGGGGCCAAGGTACCCTGGTCACCGTCTCGAGTGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCCAGACCTACATCTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGATGAGCTGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAAACCATTTTACCGGAAGAATGGGTTCCACTAATTAAAAACGGTAAAGTTAAGATATTCCGCATTGGGGACTTCGTTGATGGACTTATGAAGGCGAACCAAGGAAAAGTGAAGAAAACGGGGGATACAGAAGTTTTAGAAGTTGCAGGAATTCATGCGTTTTCCTTTGACAGGAAGTCCAAGAAGGCCCGTGTAATGGCAGTGAAAGCCGTGATAAGACACCGTTATTCCGGAAATGTTTATAGAATAGTCTTAAACTCTGGTAGAAAAATAACAATAACAGAAGGGCATAGCCTATTTGTCTATAGGAACGGGGATCTCGTTGAGGCAACTGGGGAGGATGTCAAAATTGGGGATCTTCTTGCAGTTCCAAGATCAGTAAACCTACCAGAGAAAAGGGAACGCTTGAATATTGTTGAACTTCTTCTGAATCTCTCACCGGAAGAGACAGAAGATATAATACTTACGATTCCAGTTAAAGGCAGAAAGAACTTCTTCAAGGGAATGTTGAGAACATTACGTTGGATTTTTGGTGAGGAAAAGAGAGTAAGGACAGCGAGCCGCTATCTAAGACACCTTGAAAATCTCGGATACATAAGGTTGAGGAAAATTGGATACGACATCATTGATAAGGAGGGGCTTGAGAAATATAGAACGTTGTACGAGAAACTTGTTGATGTTGTCCGCTATAATGGCAACAAGAGAGAGTATTTAGTTGAATTTAATGCTGTCCGGGACGTTATCTCACTAATGCCAGAGGAAGAACTGAAGGAATGGCGTATTGGAACTAGAAATGGATTCAGAATGGGTACGTTCGTAGATATTGATGAAGATTTTGCCAAGCTTGGATACGATAGCGGAGTCTACAGGGTTTATGTAAACGAGGAACTTAAGTTTACGGAATACAGAAAGAAAAAGAATGTATATCACTCTCACATTGTTCCAAAGGATATTCTCAAAGAAACTTTTGGTAAGGTCTTCCAGAAAAATATAAGTTACAAGAAATTTAGAGAGCTTGTAGAAAATGGAAAACTTGACAGGGAGAAAGCCAAACGCATTGAGTGGTTACTTAACGGAGATATAGTCCTAGATAGAGTCGTAGAGATTAAGAGAGAGTACTATGATGGTTACGTTTACGATCTAAGTGTCGATGAAGATGAGAATTTCCTTGCTGGCTTTGGATTCCTCTATGCAGATAATGACATCCAGATGACCCAGTCTCCATCCTCCCTGTCTGCATCTGTAGGGGACAGAGTCACCATCACTTGTCGGGCAAGTCAGGGCATCAGAAATTACTTAGCCTGGTATCAGCAAAAACCAGGGAAAGCCCCTAAGCTCCTGATCTATGCTGCATCCACTTTGCAATCAGGGGTCCCATCTCGGTTCAGTGGCAGTGGATCTGGGACAGATTTTCACTCTCACCATCAGCAGCCTACAGCCTGAAGATGTTGCAACTTATTACTGTCAAAGGTATAACCGTGCACCGTATACTTTTGGCCAGGGGACCAAGGTGGAAATCAAACGTACGGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAGAGTGTTGA
表8B.D2E7蛋白内含子融合构建体的氨基酸序列(SEQ ID NO:49)
MEFGLSWLFLVAILKGVQCEVQLVESGGGLVQPGRSLRLSCAASGFTFDDYAMHWVRQAPGKGLEWVSAITWNSGHIDYADSVEGRFTISRDNAKNSLYLQMNSLRAEDTAVYYCAKVSYLSTASSLDYWGQGTLVTVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTGGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPKSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGKTILPEEWVPLIKNGKVKIFRIGDFVDGLMKANQGKVKKTGDTEVLEVAGIHAFSFDRKSKKARVMAVKAVIRHRYSGNVYRIVLNSGRKITITEGHSLFVYRNGDLVEATGEDVKIGDLLAVPRSVNLPEKRERLNIVELLLNLSPEETEDIILTIPVKGRKNFFKGMLRTLRWIFGEEKRVRTASRYLRHLENLGYIRLRKIGYDIIDKEGLEKYRTLYEKLVDWRYNGNKREYLVEFNAVRDVISLMPEEELKEWRIGTRNGFRMGTFVDIDEDFAKLGYDSGVYRVYVNEELKFTEYRKKKNVYHSHIVPKDILKETFGKVFQKNISYKKFRELVENGKLDREKAKRIEWLLNGDIVLDRVVEIKREYYDGYVYDLSVDEDENFLAGFGFLYAHNDIQMTQSPSSLSASVGDRVTITCRASQGIRNYLAWYQQKPGKAPKLLIYAASTLQSGVPSRFSGSGSGTDFTLTISSLQPEDVATYYCQRYNRAPYTFGQGTKVEIKFITVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGEC*
表8C.用于D2E7蛋白内含子融合构建体的表达载体的完整核苷酸序列(SEQ ID NO:50)
GAAGTTCCTATTCCGAAGTTCCTATTCTCTAGACGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCAATGACGCAAATGGGCAGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCCCGGGCGCCACCATGGAGTTTGGGCTGAGCTGGCTTTTTCTTGTCGCGATTTTAAAAGGTGTCCAGTGTGAGGTGCAGCTGGTGGAGTCTGGGGGAGGCTTGGTACAGCCCGGCAGGTCCCTGAGACTCTCCTGTGCGGCCTCTGGATTCACCTTTGATGATTATGCCATGCACTGGGTCCGGCAAGCTCCAGGGAAGGGCCTGGAATGGGTCTCAGCTATCACTTGGAATAGTGGTCACATAGACTATGCGGACTCTGTGGAGGGCCGATTCACCATCTCCAGAGACAACGCCAAGAACTCCCTGTATCTGCAAATGAACAGTCTGAGAGCTGAGGATACGGCCGTATATTACTGTGCGAAAGTCTCGTACCTTAGCACCGCGTCCTCCCTTGACTATTGGGGCCAAGGTACCCTGGTCACCGTCTCGAGTGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCCAGACCTACATCTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGATGAGCTGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAAACCATTTTACCGGAAGAATGGGTTCCACTAATTAAAAACGGTAAAGTTAAGATATTCCGCATTGGGGACTTCGTTGATGGACTTATGAAGGCGAACCAAGGAAAAGTGAAGAAAACGGGGGATACAGAAGTTTTAGAAGTTGCAGGAATTCATGCGTTTTCCTTTGACAGGAAGTCCAAGAAGGCCCGTGTAATGGCAGTGAAAGCCGTGATAAGACACCGTTATTCCGGAAATGTTTATAGAATAGTCTTAAACTCTGGTAGAAAAATAACAATAACAGAAGGGCATAGCCTATTTGTCTATAGGAACGGGGATCTCGTTGAGGCAACTGGGGAGGATGTCAAAATTGGGGATCTTCTTGCAGTTCCAAGATCAGTAAACCTACCAGAGAAAAGGGAACGCTTGAATATTGTTGAACTTCTTCTGAATCTCTCACCGGAAGAGACAGAAGATATAATACTTACGATTCCAGTTAAAGGCAGAAAGAACTTCTTCAAGGGAATGTTGAGAACATTACGTTGGATTTTTGGTGAGGAAAAGAGAGTAAGGACAGCGAGCCGCTATCTAAGACACCTTGAAAATCTCGGATACATAAGGTTGAGGAAAATTGGATACGACATCATTGATAAGGAGGGGCTTGAGAAATATAGAACGTTGTACGAGAAACTTGTTGATGTTGTCCGCTATAATGGCAACAAGAGAGAGTATTTAGTTGAATTTAATGCTGTCCGGGACGTTATCTCACTAATGCCAGAGGAAGAACTGAAGGAATGGCGTATTGGAACTAGAAATGGATTCAGAATGGGTACGTTCGTAGATATTGATGAAGATTTTGCCAAGCTTGGATACGATAGCGGAGTCTACAGGGTTTATGTAAACGAGGAACTTAAGTTTACGGAATACAGAAAGAAAAAGAATGTATATCACTCTCACATTGTTCCAAAGGATATTCTCAAAGAAACTTTTGGTAAGGTCTTCCAGAAAAATATAAGTTACAAGAAATTTAGAGAGCTTGTAGAAAATGGAAAACTTGACAGGGAGAAAGCCAAACGCATTGAGTGGTTACTTAACGGAGATATAGTCCTAGATAGAGTCGTAGAGATTAAGAGAGAGTACTATGATGGTTACGTTTACGATCTAAGTGTCGATGAAGATGAGAATTTCCTTGCTGGCTTTGGATTCCTCTATGCACATAATGACATCCAGATGACCCAGTCTCCATCCTCCCTGTCTGCATCTGTAGGGGACAGAGTCACCATCACTTGTCGGGCAAGTCAGGGCATCAGAAATTACTTAGCCTGGTATCAGCAAAAACCAGGGAAAGCCCCTAAGCTCCTGATCTATGCTGCATCCACTTTGCAATCAGGGGTCCCATCTCGGTTCAGTGGCAGTGGATCTGGGACAGATTTCACTCTCACCATCAGCAGCCTACAGCCTGAAGATGTTGCAACTTATTACTGTCAAAGGTATAACCGTGCACCGTATACTTTTGGCCAGGGGACCAAGGTGGAAATCAAACGTACGGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAGAGTGTTGAGCGGCCGCGTTTAAACTGAATGAGCGCGTCCATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTAAAGCAAGTAAAACCTCTACAAATGTGGTATGGCTGATTATGATCCGGCTGCCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCGGTCGACGGCGCGCCTTTTTTTTTAATTTTTATTTTATTTTATTTTTGACGCGCCGAAGGCGCGATCTGAGCTCGGTACAGCTTGGCTGTGGAATGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTCCTCGAGGAACTGAAAAACCAGAAAGTTAACTGGTAAGTTTAGTCTTTTTGTCTTTTATTTCAGGTCCCGGATCCGGTGGTGGTGCAAATCAAAGAACTGCTCCTCAGTGGATGTTGCCTTTACTTCTAGGCCTGTACGGAAGTGTTACTTCTGCTCTAAAAGCTGCGGAATTGTACCCGCGGCCTAATACGACTCACTATAGGGACTAGTATGGTTCGACCATTGAACTGCATCGTCGCCGTGTCCCAAAATATGGGGATTGGCAAGAACGGAGACCTACCCTGGCCTCCGCTCAGGAACGAGTTCAAGTACTTCCAAAGAATGACCACAACCTCTTCAGTGGAAGGTAAACAGAATCTGGTGATTATGGGTAGGAAAACCTGGTTCTCCATTCCTGAGAAGAATCGACCTTTAAAGGACAGAATTAATATAGTTCTCAGTAGAGAACTCAAAGAACCACCACGAGGAGCTCATTTTCTTGCCAAAAGTTTAGATGATGCCTTAAGACTTATTGAACAACCGGAATTGGCAAGTAAAGTAGACATGGTTTGGATAGTCGGAGGCAGTTCTGTTTACCAGGAAGCCATGAATCAACCAGGCCACCTCAGACTCTTTGTGACAAGGATCATGCAGGAATTTGAAAGTGACACGTTTTTCCCAGAAATTGATTTGGGGAAATATAAACTTCTCCCAGAATACCCAGGCGTCCTCTCTGAGGTCCAGGAGGAAAAAGGCATCAAGTATAAGTTTGAAGTCTACGAGAAGAAAGACTAAGCGGCCGAGCGCGCGGATCTGGAAACGGGAGATGGGGGAGGCTAACTGAAGCACGGAAGGAGACAATACCGGAAGGAACCCGCGCTATGACGGCAATAAAAAGACAGAATAAAACGCACGGGTGTTGGGTCGTTTGTTCATAAACGCGGGGTTCGGTCCCAGGGCTGGCACTCTGTCGATACCCCACCGAGACCCCATTGGGGCCAATACGCCCGCGTTTCTTCCTTTTCCCCACCCCACCCCCCAAGTTCGGGTGAAGGCCCAGGGCTCGCAGCCAACGTCGGGGCGGCAGGCCCTGCCATAGCCACTGGCCCCGTGGGTTAGGGACGGGGTCCCCCATGGGGAATGGTTTATGGTTCGTGGGGGTTATTATTTTGGGCGTTGCGTGGGGTCTGGAGATCCCCCGGGCTGCAGGAATTCCGTTACATTACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAAAGGGCGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCGGGCGCCACCGCGGCCGCGGGGATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTCGGATCCTCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAAAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTCTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCCTTTTAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCAACGCTATTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTTACGACGTTGTAAAACGACGGCCAGTGAATT
表9.具有有限的侧翼序列信息的天然Psp-GBD Pol蛋白内含子序列的氨基酸序列(NCBI登录号No.AAA67132.1)(SEQ ID NO:51)
N/SILPEEWVPLIKNGKVKIFRIGDFVDGLMKANQGKVKKTGDTEVLEVAGIHAFSFDRKSKKARVMAVKAVIRHRYSGNVYRIVLNSGRKITITEGHSLFVYRNGDLVEATGEDVKIGDLLAVPRSVNLPEKRERLNIVELLLNLSPEETEDIILTIPVKGRKNFFKGMLRTLRWIFGEEKRVRTASRYLRHLENLGYIRLRKIGYDIIDKEGLEKYRTLYEKLVDVVRYNGNKREYLVEFNAVRDVISLMPEEELKEWRIGTRNGFRMGTFVDIDEDFAKLLGYYVSEGSARKWKNQTGGWSYTVRLYNENDEVLDDMEHLAKKFFGKVKRGKNYVEIPKKMAYIIFESLCGTLAENKRVPEVIFTSSKGVRWAFLEGYFIGDGDVHPSKRVRLSTKSELLVNGLVLLLNSLGVSAIKLGYDSGVYRVYVNEELKFTEYRKKKNVYHSHIVPKDILKETFGKVFQKNISYKKFRELVENGKLDREKAKRIEWLLNGDIVLDRVVEIKREYYDGYVYDLSVDEDENFLAGFGFLYAHN/SYYGYYGYA
/表示剪接连接,下划线的氨基酸表示蛋白内含子序列,剩余的表示蛋白外显子序列信息。
实施例2.免疫球蛋白多蛋白序列和具有黑腹果蝇Hedgehog自体加工结构域,C17和C25序列的载体的构建
有效表达抗体分子的再一策略是多蛋白表达,其中Hedgehog结构域位于重链和轻链之间,具有Hedgehog结构域序列和/或连接序列的修饰,使得存在组成蛋白的释放而没有胆固醇添加至N-端蛋白质。在这样的构建体内,存在每个相关重链和轻链的一个拷贝,或轻链可以加倍来提供至少两个轻链,或存在重链和轻链的多个拷贝,只要提供功能性裂解序列来促进多蛋白内每个免疫球蛋白衍生的蛋白质的分离。可以多次使用特定裂解位点策略(例如,Hedgehog结构域),或多个裂解位点各自可以是独立的。因此,可以相对于免疫球蛋白或免疫球蛋白衍生的蛋白质的至少一个末端来安置不同的蛋白酶解加工序列。
以下寡核苷酸用于黑腹果蝇Hedgehog C-端自体加工结构域(Hh-C),序列Hh-C17,Hh-C17截断(和具有突变的一个)和Hh-C25(GenBank登录号#L02793.1)的扩增,使用基因组DNA作为模板和Platinum Taq Hi Fidelity PCR Supermix(Invitrogen)。从DrosophilaD.Mel-2细胞的冷冻管(Invitrogen,cat.#10831-014)制备基因组DNA。
C17-5’:TGCTTCACGCCGGAGAGCAC(SEQ ID NO:141)
C17-full-3’ATTATGGACGACAACCTGGTTGGCAA(SEQ ID NO:142)
C25-actual-3’:ATCGTGGCGCCAGCTCTGCG(SEQ ID NO:143)
C17-3’:GCAACTGGCGGCCACCGAGT(SEQ ID NO:144)
C17-scya-3’:CGCATAGCAACTGGCGGCCA(SEQ ID NO:145)
C17-sc/hn-3’:GTTGTGGGCGGCCACCGAGT(SEQ ID NO:146)
根据以下程序运行PCR:
步骤  1     2     3     4       5                6     7    8
温度  94℃  94℃  55℃  68℃    转到步骤2(34次)  68℃  4℃  结束
时间  2min  1min  1min  2.5min                   5min  保持
设计寡核苷酸引物来产生D2E7重链-Hh-C-D2E7轻链的融合体,通过同源重组至大肠杆菌中的pTT3-HcintLC p.horikoshii构建体中。通过工程化PCR产生的载体(含有pTT3载体,重链和轻链片段但没有极端嗜热古菌蛋白内含子)和Hh-C结构域插入片段之间的40个碱基对悬垂物,将两个DNA片段混合并转化至大肠杆菌中,没有连接的益处,导致两个片段大肠杆菌同源重组至pTT3-HC-Hh-C-LC中(以各种形式作为最初PCR产物指示)。
Hh-C结构域同源重组引物:
C17-HR5’:
CCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAATGCTTCACGCCGGAGAGCAC(SEQ ID NO:147)
C17-full-HR-3’:
GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATGCACTGGCTGTTGATCACCG(SEQ ID NO:148)
C25-actual-HR-3’:
GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATATCGTGGCGCCAGCTCTGCG(SEQ ID NO:149)
C17-HR3’:
GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATGCAACTGGCGGCCACCGAGT(SEQ ID NO:150)
C17-scya-HR-3’:
GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATCGCATAGCAACTGGCGGCCA(SEQ ID NO:151)
C17-sc/hn-HR-3’:
GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATGTTGTGGGCGGCCACCGAGT(SEQ ID NO:152)
pTT3-HcintLC同源重组引物:
pTT3int-HR5’:
ATGGACATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGC(SEQ IDNO:153)
pTT3int-HR3’:
TTTACCCGGAGACAGGGAGAGGCTCTTCTGCGTGTAGTGGT(SEQ IDNO:154)
根据以下程序运行Hh-C结构域的PCR:使用Pfu-I Hi Fidelity DNA聚合酶(Stratagene)。
步骤  1     2     3     4       5                6     7    8
温度  94℃  94℃  60℃  72℃    转到步骤2(34次)  72℃  4℃  结束
时间  2min  1min  1min  1.5min                   5min  保持
根据以下程序运行载体的PCR:使用Platinum Taq Hi FidelitySupermix(Invitrogen)。
步骤  1     2      3      4      5                6     7    8
温度  94℃  94℃   60℃   68℃   转到步骤2(34次)  68℃  4℃  结束
时间  2min  30sec  30sec  10min                   5min  保持
为了获得Hh-C结构域同源克隆至pTT3-HcintLC中,使用以下的策略。将PCR产物凝胶纯化并将每个稀释至50μl稀释缓冲液中(Qiaquick凝胶提取试剂盒,Qiagen)。将3μl载体PCR产物和3μl所需的Hint结构域PCR产物(各种形式)在Eppendorf管中混合。将PCR扩增产物转化至大肠杆菌中并置于LB+氨苄青霉素平板上,在37℃培养过夜,并将克隆生长至2ml培养物,使用Wizard prep试剂盒(Promega)提取质粒DNA,并通过限制性核酸内切酶消化和琼脂糖凝胶电泳来分析DNA样品。对于DNA序列分析产生正确限制模式的克隆,来证实已经产生所需的序列。
使用黑腹果蝇Hedgehog C-末端自体加工结构域设计了五个用于D2E7重链-Hh-C-D2E7轻链表达的表达构建体:pTT3-HC-Hh-C17-LC;pTT3-HC-Hh-C 17-SC-LC ;pTT3-HC-Hh-C17-NH-LC;和pTT3-HC-Hh-C25-LC。
表27.完整质粒pTT3-D2E7重链-Hh-C17-D2E7轻链的序列(SEQID NO:155)
5′-
gcggccgctcgaggccggcaaggccggatcccccgacctcgacctctggctaataaaggaaatttattttcattgcaatagtgtgttggaattttttgtgtctctcactcggaaggacatatgggagggcaaatcatttggtcgagatccctcggagatctctagctagaggatcgatccccgccccggacgaactaaacctgactacgacatctctgccccttcttcgcggggcagtgcatgtaatcccttcagttggttggtacaacttgccaactgggccctgttccacatgtgacacggggggggaccaaacacaaaggggttctctgactgtagttgacatccttataaatggatgtgcacatttgccaacactgagtggctttcatcctggagcagactttgcagtctgtggactgcaacacaacattgcctttatgtgtaactcttggctgaagctcttacaccaatgctgggggacatgtacctcccaggggcccaggaagactacgggaggctacaccaacgtcaatcagaggggcctgtgtagctaccgataagcggaccctcaagagggcattagcaatagtgtttataaggcccccttgttaaccctaaacgggtagcatatgcttcccgggtagtagtatatactatccagactaaccctaattcaatagcatatgttacccaacgggaagcatatgctatcgaattagggttagtaaaagggtcctaaggaacagcgatatctcccaccccatgagctgtcacggttttatttacatggggtcaggattccacgagggtagtgaaccattttagtcacaagggcagtggctgaagatcaaggagcgggcagtgaactctcctgaatcttcgcctgcttcttcattctccttcgtttagctaatagaataactgctgagttgtgaacagtaaggtgtatgtgaggtgctcgaaaacaaggtttcaggtgacgcccccagaataaaatttggacggggggttcagtggtggcattgtgctatgacaccaatataaccctcacaaaccccttgggcaataaatactagtgtaggaatgaaacattctgaatatctttaacaatagaaatccatggggtggggacaagccgtaaagactggatgtccatctcacacgaatttatggctatgggcaacacataatcctagtgcaatatgatactggggttattaagatgtgtcccaggcagggaccaagacaggtgaaccatgttgttacactctatttgtaacaaggggaaagagagtggacgccgacagcagcggactccactggttgtctctaacacccccgaaaattaaacggggctccacgccaatggggcccataaacaaagacaagtggccactcttttttttgaaattgtggagtgggggcacgcgtcagcccccacacgccgccctgcggttttggactgtaaaataagggtgtaataacttggctgattgtaaccccgctaaccactgcggtcaaaccacttgcccacaaaaccactaatggcaccccggggaatacctgcataagtaggtgggcgggccaagataggggcgcgattgctgcgatctggaggacaaattacacacacttgcgcctgagcgccaagcacagggttgttggtcctcatattcacgaggtcgctgagagcacggtgggctaatgttgccatgggtagcatatactacccaaatatctggatagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctaatagagattagggtagtatatgctatcctaatttatatctgggtagcatatactacccaaatatctggatagcatatgctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctcatgataagctgtcaaacatgagaattttcttgaagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtgttgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgcagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgttcttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgccaagctctagctagaggtcgaccaattctcatgtttgacagcttatcatcgcagatccgggcaacgttgttgccattgctgcaggcgcagaactggtaggtatggaagatctatacattgaatcaatattggcaattagccatattagtcattggttatatagcataaatcaatattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattggctcatgtccaatatgaccgccatgttgacattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacaccaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaataaccccgccccgttgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcgtttagtgaaccgtcagatcctcactctcttccgcatcgctgtctgcgagggccagctgttgggctcgcggttgaggacaaactcttcgcggtctttccagtactcttggatcggaaacccgtcggcctccgaacggtactccgccaccgagggacctgagcgagtccgcatcgaccggatcggaaaacctctcgagaaaggcgtctaaccagtcacagtcgcaaggtaggctgagcaccgtggcgggcggcagcgggtggcggtcggggttgtttctggcggaggtgctgctgatgatgtaattaaagtaggcggtcttgagacggcggatggtcgaggtgaggtgtggcaggcttgagatccagctgttggggtgagtactccctctcaaaagcgggcattacttctgcgctaagattgtcagtttccaaaaacgaggaggatttgatattcacctggcccgatctggccatacacttgagtgacaatgacatccactttgcctttctctccacaggtgtccactcccaggtccaagtttgggcgccaccatggagtttgggctgagctggctttttcttgtcgcgattttaaaaggtgtccagtgt-
gaggtgcagctggtggagtctgggggaggcttggtacagcccggcaggtccctgagactctcctgtgcggcctctggattcacctttgatgattatgccatgcactgggtccggcaagctccagggaagggcctggaatgggtctcagctatcacttggaatagtggtcacatagactatgcggactctgtggagggccgattcaccatctccagagacaacgccaagaactccctgtatctgcaaatgaacagtctgagagctgaggatacggccgtatattactgtgcgaaagtctcgtaccttagcaccgcgtcctcccttgactattggggccaaggtaccctggtcaccgtctcgagtgcgtcgaccaagggcccatcggtcttccccctggcaccctcctccaagagcacctctgggggcacagcggccctgggctgcctggtcaaggactacttccccgaaccggtgacggtgtcgtggaactcaggcgccctgaccagcggcgtgcacaccttcccggctgtcctacagtcctcaggactctactccctcagcagcgtggtgaccgtgccctccagcagcttgggcacccagacctacatctgcaacgtgaatcacaagcccagcaacaccaaggtggacaagaaagttgagcccaaatcttgtgacaaaactcacacatgcccaccgtgcccagcacctgaactcctggggggaccgtcagtcttcctcttccccccaaaacccaaggacaccctcatgatctcccggacccctgaggtcacatgcgtggtggtggacgtgagccacgaagaccctgaggtcaagttcaactggtacgtggacggcgtggaggtgcataatgccaagacaaagccgcgggaggagcagtacaacagcacgtaccgtgtggtcagcgtcctcaccgtcctgcaccaggactggctgaatggcaaggagtacaagtgcaaggtctccaacaaagccctcccagcccccatcgagaaaaccatctccaaagccaaagggcagccccgagaaccacaggtgtacaccctgcccccatcccgggatgagctgaccaagaaccaggtcagcctgacctgcctggtcaaaggcttctatcccagcgacatcgccgtggagtgggagagcaatgggcagccggagaacaactacaagaccacgcctcccgtgctggactccgacggctccttcttcctctacagcaagctcaccgtggacaagagcaggtggcagcaggggaacgtcttctcatgctccgtgatgcatgaggctctgcacaaccactacacgcagaagagcctctccctgtctccgggtaaa-
tgcttcacgccggagagcacagcgctgctggagagtggagtccggaagccgctcggcgagctctctatcggagatcgtgttttgagcatgaccgccaacggacaggccgtctacagcgaagtgatcctcttcatggaccgcaacctcgagcagatgcaaaactttgtgcagctgcacacggacggtggagcagtgctcacggtgacgccggctcacctggttagcgtttggcagccggagagccagaagctcacgtttgtgtttgcggatcgcatcgaggagaagaaccaggtgctcgtacgggatgtggagacgggcgagctgaggccccagcgagtcgtcaaggtgggcagtgtgcgcagtaagggcgtggtcgcgccgctgacccgcgagggcaccattgtggtcaactcggtggccgccagttgctatgcggtgatcaacagccagtcg-
atggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgcgacatccagatgacccagtctccatcctccctgtctgcatctgtaggggacagagtcaccatcacttgtcgggcaagtcagggcatcagaaattacttagcctggtatcagcaaaaaccagggaaagcccctaagctcctgatctatgctgcatccactttgcaatcaggggtcccatctcggttcagtggcagtggatctgggacagatttcactctcaccatcagcagcctacagcctgaagatgttgcaacttattactgtcaaaggtataaccgtgcaccgtatacttttggccaggggaccaaggtggaaatcaaacgtacggtggctgcaccatctgtcttcatcttcccgccatctgatgagcagttgaaatctggaactgcctctgttgtgtgcctgctgaataacttctatcccagagaggccaaagtacagtggaaggtggataacgccctccaatcgggtaactcccaggagagtgtcacagagcaggacagcaaggacagcacctacagcctcagcagcaccctgacgctgagcaaagcagactacgagaaacacaaagtctacgcctgcgaagtcacccatcaggggcctgagctcgcccgtcacaaagagcttcaacaggggagagtgt-3’
pTT3载体-重链-Hh-C17-轻链
在以下的构建体中,与以上构建体的唯一差异是C17片段的截断,结果是除去了胆固醇转移的活性。所示的序列从D2E7重链编码片段的末端(HC编码序列的最后9个碱基对,表的第一行)至D2E7轻链编码片段的5’端(LC编码序列的头9个碱基对,表的最后一行)。
表28.质粒pTT3-HC-C17-sc-LC的部分编码序列(SEQ ID NO:156)
Ccgggtaaa-
tgcttcacgccggagagcacagcgctgctggagagtggagtccggaagccgctcggcgagctctctatcggagatcgtgttttgagcatgaccgccaacggacaggccgtctacagcgaagtgatcctcttcatggaccgcaacctcgagcagatgcaaaactttgtgcagctgcacacggacggtggagcagtgctcacggtgacgccggctcacctggttagcgtttggcagccggagagccagaagctcacgtttgtgtttgcggatcgcatcgaggagaagaaccaggtgctcgtacgggatgtggagacgggcgagctgaggccccagcgagtcgtcaaggtgggcagtgtgcgcagtaagggcgtggtcgcgccgctgacccgcgagggcaccattgtggtcaactcggtggccgccagttgc-atggacatg
重链3’序列-Hh-C17-轻链5’序列
在以下的构建体中,与以上构建体pTT3-HC-C17-sc-LC的唯一差异是hedgehog C17片段中最后两个氨基酸的突变,从SC突变至HN(下划线的)。所示的序列从D2E7重链编码片段的末端(HC编码序列的最后9个碱基对,表的第一行)至D2E7轻链编码片段的5’端(表的最后一行)。
表29.质粒pTT3-HC-C17-hn-LC的部分编码序列(SEQ ID NO:157)
ccgggtaaa-
tgcttcacgccggagagcacagcgctgctggagagtggagtccggaagccgctcggcgagctctctatcggagatcgtgttttgagcatgaccgccaacggacaggccgtctacagcgaagtgatcctcttcatggaccgcaacctcgagcagatgcaaaactttgtgcagctgcacacggacggtggagcagtgctcacggtgacgccggctcacctggttagcgtttggcagccggagagccagaagctcacgtttgtgtttgcggatcgcatcgaggagaagaaccaggtgctcgtacgggatgtggagacgggcgagctgaggccccagcgagtcgtcaaggtgggcagtgtgcgcagtaagggcgtggtcgcgccgctgacccgcgagggcaccattgtggtcaactcggtggccgcccacaac-atggacatg
重链3’序列-Hh-C17-突变-轻链5’序列
在以下的构建体中,使用Hint结构域的全部C25片段,而不是C17。所示的序列从D2E7重链编码片段的末端(HC编码序列的最后9个碱基对,表的第一行)至D2E7轻链编码片段的5’端(LC编码序列的头9个碱基对,表的最后一行)。
表29B.pTT3-HC-C25-Hint-LC的部分编码序列(SEQ ID NO:158)
ccgggtaaa-
tgcttcacgccggagagcacagcgctgctggagagtggagtccggaagccgctcggcgagctctctatcggagatcgtgttttgagcatgaccgccaacggacaggccgtctacagcgaagtgatcctcttcatggaccgcaacctcgagcagatgcaaaactttgtgcagctgcacacggacggtggagcagtgctcacggtgacgccggctcacctggttagcgtttggcagccggagagccagaagctcacgtttgtgtttgcggatcgcatcgaggagaagaaccaggtgctcgtacgggatgtggagacgggcgagctgaggccccagcgagtcgtcaaggtgggcagtgtgcgcagtaagggcgtggtcgcgccgctgacccgcgagggcaccattgtggtcaactcggtggccgccagttgctatgcggtgatcaacagccagtcgctggcccactggggactggctcccatgcgcctgctgtccacgctggaggcgtggctgcccgccaaggagcagttgcacagttcgccgaaggtggtgagctcggcgcagcagcagaatggcatccattggtatgccaatgcgctctacaaggtcaaggactacgttctgccgcagagctggcgccacgat-
atggacatg
[重链3’序列-Hh-C25结构域-轻链5’序列]
(SEQ ID NO:140)
Hh-C25的氨基酸序列和相关的构建体(向下的箭头表示裂解位点;↓:Hh-C17↓:Hh-C17sc):
cttpestallesgvrkplgelsigdrvlsmtangqavyseviltmdrnleqmqntvqlhtdggavltvtpahlvsvwqpesqklttvtadrieeknqvlvrdvetgelrpqrvvkvgsvrskgvvapltregtivvnsvaasc↓yavinsqslahwglapmrllstleawlpakeqlhsspkvvssaqqqngihwyanalykvkdyvlpqswrhd
实施例3.使用用于蛋白酶解加工的TEV识别序列的抗体表达
产生构建体和表达载体来指导肿瘤坏死因子-α,白细胞介素-12,白细胞介素-18和促红细胞生成素受体特异性抗体的表达,在包括目标抗体的免疫球蛋白重链和轻链序列片段之间具有TEV识别序列。优选,构建体包括表达载体,该表达载体包括腺病毒主要晚期启动子和指导目标抗体重链转录的巨细胞病毒增强子,在其之前为框内前导序列。将重链编码序列连接框内弗林蛋白酶裂解位点和TEV识别序列(E-P-V-Y-F-Q-G),之后为核定位片段删除的TEV蛋白酶的编码序列(Ceriani等(1998)Plant Molec Biol.36:239),之后为第二个TEV识别序列。将第二个TEV识别序列框内连接用于抗体轻链的前导序列,该前导序列连接用于目标抗体轻链的编码片段和终止密码子。编码片段之后为多腺苷酸化信号。下文中提供了相关的序列。
表1.D2E7(Humira/adalimumab)TEV表达载体完整的DNA序列(SEQ ID NO:44)
GAAGTTCCTATTCCGAAGTTCCTATTCTCTAGACGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCAATGACGCAAATGGGCAGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCCCGGGCGCCACCATGGAGTTTGGGCTGAGCTGGCTTTTTCTTGTCGCGATTTTAAAAGGTGTCCAGTGTGAGGTGCAGCTGGTGGAGTCTGGGGGAGGCTTGGTACAGCCCGGCAGGTCCCTGAGACTCTCCTGTGCGGCCTCTGGATTCACCTTTGATGATTATGCCATGCACTGGGTCCGGCAAGCTCCAGGGAAGGGCCTGGAATGGGTCTCAGCTATACTTGGAATAGTGGTCACATAGACTATGCGGACTCTGTGGAGGGCCGATTCACCATCTCCAGAGACAACGCCAAGAACTCCCTGTATCTGCAAATGAACAGTCTGAGAGCTGAGGATACGGCCGTATATTACTGTGCGAAAGTCTCGTACCTTAGCACCGCGTCCTCCCTTGACTATTGGGGCCAAGGTACCCTGGTCACCGTCTCGAGTGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCCAGACCTACATCTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGATGAGCTGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTAGGGGTAAACGCGAACCAGTTTATTTCCAGGGGAGCTTGTTTAAGGGGCCGCGTGATTATAACCCAATATCGAGTGCCATTTGTCATCTAACGAATGAATCTGATGGGCACACAACATCGTTGTATGGTATTGGTTTTGGCCCTTTCATCATCACAAACAAGCATTTGTTTAGAAGAAATAATGGTACACTGTTAGTTCAATCACTACATGGTGTGTTCAAGGTAAAGAATACCACAACTTTGCAACAACACCTCATTGATGGGAGGGACATGATGCTCATTCGCATGCCTAAGGATTTCCCACCATTTCCTCAAAAGCTGAAATTCAGAGAGCCACAAAGGGAAGAGCGCATATGTCTTGTGACAACCAACTTCCAAACTAAGAGCATGTCTAGCATGGTTTCAGATACTAGTTGCACATTCCCTTCATCTGATGGTATATTCTGGAAACATTGGATTCAGACCAAGGATGGGCACTGTGGTAGCCCGTTGGTGTCAACTAGAGATGGGTTTATTGTTGGTATACACTCAGCATCAAATTTCACCAACACAAACAATTATTTTACAAGTGTGCCGAAAGACTTCATGGATTTATTGACAAATCAAGAGGCGCAGCAATGGGTTAGTGGTTGGCGATTGAATGCTGACTCAGTGTTATGGGGAGGCCACAAAGTTTTCATGAGCAAACCTGAAGAACCCTTTCAGCCAGTCAAAGAAGCAACTCAACTCATGAGTGAATTAGTCTACTCGCAAGGGATGGACATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGCTGCTGTGGTTCCCCGGCTCGCGATGCGACATCCAGATGACCCAGTCTCCATCCTCCCTGTCTGCATCTGTAGGGGACAGAGTCACCATCACTTGTCGGGCAAGTCAGGGCATCAGAAATTACTTAGCCTGGTATCAGCAAAAACCAGGGAAAGCCCCTAAGCTCCTGATCTATGCTGCATCCACTTTGCAATCAGGGGTCCCATCTCGGTTCAGTGGCAGTGGATCTGGGACAGATTTCACTCTCACCATCAGCAGCCTACAGCCTGAAGATGTTGCAACTTATTACTGTCAAAGGTATAACCGTGCACCGTATACTTTTGGCCAGGGGACCAAGGTGGAAATCAAACGTACGGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAGAGTGTTGAGCGGCCGCGTTTAAACTGAATGAGCGCGTCCATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTAAAGCAAGTAAAACCTCTACAAATGTGGTATGGCTGATTATGATCCGGCTGCCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCGGTCGACGGCGCGCCTTTTTTTTTAATTTTTATTTTATTTTATTTTTGACGCGCCGAAGGCGCGATCTGAGCTCGGTACAGCTTGGCTGTGGAATGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTCCTCGAGGAACTGAAAAACCAGAAAGTTAACTGGTAAGTTTAGTCTTTTTGTCTTTTATTTCAGGTCCCGGATCCGGTGGTGGTGCAAATCAAAGAACTGCTCCTCAGTGGATGTTGCCTTTACTTCTAGGCCTGTACGGAAGTGTTACTTCTGCTCTAAAAGCTGCGGAATTGTACCCGCGGCCTAATACGACTCACTATAGGGACTAGTATGGTTCGACCATTGAACTGCATCGTCGCCGTGTCCCAAAATATGGGGATTGGCAAGAACGGAGACCTACCCTGGCCTCCGCTCAGGAACGAGTTCAAGTACTTCCAAAGAATGACCACAACCTCTTCAGTGGAAGGTAAACAGAATCTGGTGATTATGGGTAGGAAAACCTGGTTCTCCATTCCTGAGAAGAATCGACCTTTAAAGGACAGAATTAATATAGTTCTCAGTAGAGAACTCAAAGAACCACCACGAGGAGCTCATTTTCTTGCCAAAAGTTTAGATGATGCCTTAAGACTTATTGAACAACCGGAATTGGCAAGTAAAGTAGACATGGTTTGGATAGTCGGAGGCAGTTCTGTTTACCAGGAAGCCATGAATCAACCAGGCCACCTCAGACTCTTTGTGACAAGGATCATGCAGGAATTTGAAAGTGACACGTTTTTCCCAGAAATTGATTTGGGGAAATATAAACTTCTCCCAGAATACCCAGGCGTCCTCTCTGAGGTCCAGGAGGAAAAAGGCATCAAGTATAAGTTTGAAGTCTACGAGAAGAAAGACTAAGCGGCCGAGCGCGCGGATCTGGAAACGGGAGATGGGGGAGGCTAACTGAAGCACGGAAGGAGACAATACCGGAAGGAACCCGCGCTATGACGGCAATAAAAAGACAGAATAAAACGCACGGGTGTTGGGTCGTTTGTTCATAAACGCGGGGTTCGGTCCCAGGGCTGGCACTCTGTCGATACCCCACCGAGACCCCATTGGGGCCAATACGCCCGCGTTTCTTCCTTTTCCCCACCCCACCCCCCAAGTTCGGGTGAAGGCCCAGGGCTCGCAGCCAACGTCGGGGCGGCAGGCCCTGCCATAGCCACTGGCCCCGTGGGTTAGGGACGGGGTCCCCCATGGGGAATGGTTTATGGTTCGTGGGGGTTATTATTTTGGGCGTTGCGTGGGGTCTGGAGATCCCCCGGGCTGCAGGAATTCCGTTACATTACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAAAGGGCGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCGGGCGCCACCGCGGCCGCGGGGATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTCGGATCCTCTTGGCGTAATCATGGTCATAGCTGTTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAAAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTCTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCCTTTTAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCGCAACTGTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTTACGACGTTGTAAAACGACGGCCAGTGAATT
表2A.ABT-007TEV构建体:多蛋白的编码序列(SEQ ID NO:32)
ATGGAGTTTGGGCTGAGCTGGCTTTTTCTTGTCGCGATTTTAAAAGGTGTCCAGTGTCAGGTGCAGCTGCAGGAGTCGGGCCCAGGACTGGTGAAGCCTTCGGAGACCCTGTCCCTCACCTGCACTGTCTCTGGTGCCTCCATCAGTAGTTACTACTGGAGCTGGATCCGGCAGCCCCCAGGGAAGGGACTGGAGTGGATTGGGTATATCGGGGGGGAGGGGAGCACCAACTACAACCCCTCCCTCAAGAGTCGAGTCACCATATCAGTAGACACGTCCAAGAACCAGTTCTCCCTGAAGCTGAGGTCTGTGACCGCTGCGGACACGGCCGTGTATTACTGTGCGAGAGAGCGACTGGGGATCGGGGACTACTGGGGCCAGGGAACCCTGGTCACCGTCTCCTCAGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCGCCCTGCTCTAGAAGCACCTCCGAGAGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCTCTGACCAGCGGCGTGCACACCTTCCCAGCTGTCCTGCAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAACTTCGGCACCCAGACCTACACATGCAACGTAGATCACAAGCCCAGCAACACCAAGGTGGACAAGACAGTTGAGCGCAAATGTTGTGTCGAGTGCCCACCGTGCCCAGCACCACCTGTGGCAGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACGTGCGTGGTGGTGGACGTGAGCCACGAAGACCCCGAGGTCCAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCACGGGAGGAGCAGTTCAACAGCACGTTCCGTGTGGTCAGCGTCCTCACCGTTGTGCACCAGGACTGGCTGAACGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGGCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAACCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGAGGAGATGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTACCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACACCTCCCATGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTAGGGGTAAACGCGAACCAGTTTATTTCCAGGGGAGCTTGTTTAAGGGGCCGCGTGATTATAACCCAATATCGAGTGCCATTTGTCATCTAACGAATGAATCTGATGGGCACACAACATCGTTGTATGGTATTGGTTTTGGCCCTTTCATCATCACAAACAAGCATTTGTTTAGAAGAAATAATGGTACACTGTTAGTTCAATCACTACATGGTGTGTTCAAGGTAAAGAATACCACAACTTTGCAACAACACCTCATTGATGGGAGGGACATGATGCTCATTCGCATGCCTAAGGATTTCCCACCATTTCCTCAAAAGCTGAAATTCAGAGAGCCACAAAGGGAAGAGCGCATATGTCTTGTGACAACCAACTTCCAAACTAAGAGCATGTCTAGCATGGTTTCAGATACTAGTTGCACATTCCCTTCATCTGATGGTATATTCTGGAAACATTGGATTCAGACCAAGGATGGGCACTGTGGTAGCCCGTTGGTGTCAACTAGAGATGGGTTTATTGTTGGTATACACTCAGCATCAAATTTCACCAACACAAACAATTATTTTACAAGTGTGCCGAAAGACTTCATGGATTTATTGACAAATCAAGAGGCGCAGCAATGGGTTAGTGGTTGGCGATTGAATGCTGACTCAGTGTTATGGGGAGGCCACAAAGTTTTCATGAGCAAACCTGAAGAACCCTTTCAGCCAGTCAAAGAAGCAACTCAACTCATGAGTGAATTAGTCTACTCGGAAGGGATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGCTGCTGTGGTTCCCCGGCTCGCGATGCGACATCCAGCTGAGCCAATCTCCATCCTCCCTGTCTGCATCTGTAGGAGACAGAGTCACCATCACTTGCCGGGCAAGTCAGGGCATTAGAAATGATTTAGGCTGGTATCAGCAGAAACCAGGGAAAGCCCCTAAGCGCCTGATCTATGCTGCATCCAGTTTGCAAAGTGGGGTCCCATCAAGGTTCAGCGGCAGTGGATCTGGGACAGAATTCACTCTCACAATCAGCAGCCTGCAGCCTGAAGATTTTGCAACTTATTACTGTCTACAGCATAATACTTACCCTCCGACGTTCGGCCAAGGGACCAAGGTGGAAATCAAACGTACGGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAGAGTGTTGA
表2B.ABT-007TEV多蛋白氨基酸序列(SEQ ID NO:33)
MEFGLSWLFLVAILKGVQCQVQLQESGPGLVKPSETLSLTCTVSGASISSYYWSWIRQPPGKGLEWIGYIGGEGSTNYNPSLKSRVTISVDTSKNQFSLKLRSVTAADTAVYYCARERLGIGDYWGQGTLVTVSSASTKGPSVFPLAPCSRSTSESTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSNFGTQTYTCNVDHKPSNTKVDKTVERKCCVECPPCPAPPVAGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVQFNWYVDGVEVHNAKTKPREEQFNSTFRVVSVLTVVHQDWLNGKEYKCKVSNKGLPAPIEKTISKTKGQPREPQVYTLPPSREEMTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPMLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSRGKREPVYFQGSLFKGPRDYNPISSAICHLTNESDGHTTSLYGIGFGPFIITNKHLFRRNNGTLLVQSLHGVFKVKNTTTLQQHLIDGRDMMLIRMPKDFPPFPQKLKFREPQREERICLVTTNFGTKSMSSMVSDTSCTFPSSDGIFWKHWIQTKDGHCGSPLVSTRDGFIVGIHSASNFTNTNNYFTSVPKDFMDLLTNQEAQQWVSGWRLNADSVLWGGHKVFMSKPEEPFQPVKEATQLMSELVYSQGMRVPAQLLGLLLLWFPGSRCDIQLTQSPSSLSASVGDRVTITCRASQGIRNDLGWYQQKPGKAPKRLIYAASSLQSGVPSRFSGSGSGTEFTLTISSLQPEDFATYYCLQHNTYPPTFGQGTKVEIKRTVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGEC*
表2C.完整的ABT-007TEV构建体表达载体序列(SEQ ID NO:34)
GAAGTTCCTATTCCGAAGTTCCTATTCTCTAGACGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTTCCCATAGTAACGCCAATAGGGACTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCAATGACGCAAATGGGCAGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCCCGGGCGCCACCATGGAGTTTGGGCTGAGCTGGCTTTTTCTTGTCGCGATTTTAAAAGGTGTCCAGTGTCAGGTGCAGCTGCAGGAGTCGGGCCCAGGACTGGTGAAGCCTTCGGAGACCCTGTCCCTCACCTGCACTGTCTCTGGTGCCTCCATCAGTAGTTACTACTGGAGCTGGATCCGGCAGCCCCCAGGGAAGGGACTGGAGTGGATTGGGTATATCGGGGGGGAGGGGAGCACCAACTACAACCCCTCCCTCAAGAGTCGAGTCACCATATCAGTAGACACGTCCAAGAACCAGTTCTCCCTGAAGCTGAGGTCTGTGACCGCTGCGGACACGGCCGTGTATTACTGTGCGAGAGAGCGACTGGGGATCGGGGACTACTGGGGCCAGGGAACCCTGGTCACCGTCTCCTCAGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCGCCCTGCTCTAGAAGCACCTCCGAGAGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCTCTGACCAGCGGCGTGCACACCTTCCCAGCTGTCCTGCAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAACTTCGGCACCCAGACCTACACATGCAACGTAGATCACAAGCCCAGCAACACCAAGGTGGACAAGACAGTTGAGCGCAAATGTTGTGTCGAGTGCCCACCGTGCCCAGCACCACCTGTGGCAGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACGTGCGTGGTGGTGGACGTGAGCCACGAAGACCCCGAGGTCCAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCACGGGAGGAGCAGTTCAACAGCACGTTCCGTGTGGTCAGCGTCCTCACCGTTGTGCACCAGGACTGGCTGAACGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGGCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAACCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGAGGAGATGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTACCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACACCTCCCATGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTAGGGGTAAACGCGAACCAGTTTATTTCCAGGGGAGCTTGTTTAAGGGGCCGCGTGATTATAACCCAATATCGAGTGCCATTTGTCATCTAACGAATGAATCTGATGGGCACACAACATCGTTGTATGGTATTGGTTTTGGCCCTTTCATCATCACAAACAAGCATTTGTTTAGAAGAAATAATGGTACACTGTTAGTTCAATCACTACATGGTGTGTTCAAGGTAAAGAATACCACAACTTTGCAACAACACCTCATTGATGGGAGGGACATGATGCTCATTCGCATGCCTAAGGATTTCCCACCATTTCCTCAAAAGCTGAAATTCAGAGAGCCACAAAGGGAAGAGCGCATATGTCTTGTGACAACCAACTTCCAAACTAAGAGCATGTCTAGCATGGTTTCAGATACTAGTTGCACATTCCCTTCATCTGATGGTATATTCTGGAAACATTGGATTCAGACCAAGGATGGGCACTGTGGTAGCCCGTTGGTGTCAACTAGAGATGGGTTTATTGTTGGTATACACTCAGCATCAAATTTCACCAACACAAACAATTATTTTACAAGTGTGCCGAAAGACTTCATGGATTTATTGACAAATCAAGAGGCGCAGCAATGGGTTAGTGGTTGGCGATTGAATGCTGACTCAGTGTTATGGGGAGGCCACAAAGTTTTCATGAGCAAACCTGAAGAACCCTTTCAGCCAGTCAAAGAAGCAACTCAACTCATGAGTGAATTAGTCTACTCGCAAGGGATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGCTGCTGTGGTTCCCCGGCTCGCGATGCGACATCCAGCTGACCCAATCTCCATCCTCCCTGTCTGCATCTGTAGGAGACAGAGTCACCATCACTTGCCGGGCAAGTCAGGGCATTAGAAATGATTTAGGCTGGTATCAGCAGAAACCAGGGAAAGCCCCTAAGCGCCTGATCTATGCTGCATCCAGTTTGCAAAGTGGGGTCCCATCAAGGTTCAGCGGCAGTGGATCTGGGACAGAATTCACTCTCACAATCAGCAGCCTGCAGCCTGAAGATTTTGCAACTTATTACTGTCTACAGCATAATACTTACCCTCCGACGTTCGGCCAAGGGACCAAGGTGGAAATCAAACGTACGGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAGAGTGTTGAGCGGCCGCGTTTAAACTGAATGAGCGCGTCCATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTAAAGCAAGTAAAACCTCTACAAATGTGGTATGGCTGATTATGATCCGGCTGCCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCGGTCGACGGCGCGCCTTTTTTTTTAATTTTTATTTTATTTTATTTTTGACGCGCCGAAGGCGCGATCTGAGCTCGGTACAGCTTGGCTGTGGAATGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTCCTCGAGGAACTGAAAAACCAGAAAGTTAACTGGTAAGTTTAGTCTTTTTGTCTTTTATTTCAGGTCCCGGATCCGGTGGTGGTGCAAATCAAAGAACTGCTCCTCAGTGGATGTTGCCTTTACTTCTAGGCCTGTACGGAAGTGTTACTTCTGCTCTAAAAGCTGCGGAATTGTACCCGCGGCCTAATACGACTCACTATAGGGACTAGTATGGTTCGACCATTGAACTGCATCGTCGCCGTGTCCCAAAATATGGGGATTGGCAAGAACGGAGACCTACCCTGGCCTCCGCTCAGGAACGAGTTCAAGTACTTCCAAAGAATGACCACAACCTCTTCAGTGGAAGGTAAACAGAATCTGGTGATTATGGGTAGGAAAACCTGGTTCTCCATTCCTGAGAAGAATCGACCTTTAAAGGACAGAATTAATATAGTTCTCAGTAGAGAACTCAAAGAACCACCACGAGGAGCTCATTTTCTTGCCAAAAGTTTAGATGATGCCTTAAGACTTATTGAACAACCGGAATTGGCAAGTAAAGTAGACATGGTTTGGATAGTCGGAGGCAGTTCTGTTTACCAGGAAGCCATGAATCAACCAGGCCACCTCAGACTCTTTGTGACAAGGATCATGCAGGAATTTGAAAGTGACACGTTTTTCCCAGAAATTGATTTGGGGAAATATAAACTTCTCCCAGAATACCCAGGCGTCCTCTCTGAGGTCCAGGAGGAAAAAGGCATCAAGTATAAGTTTGAAGTCTACGAGAAGAAAGACTAAGCGGCCGAGCGCGCGGATCTGGAAACGGGAGATGGGGGAGGCTAACTGAAGCACGGAAGGAGACAATACCGGAAGGAACCCGCGCTATGACGGCAATAAAAAGACAGAATAAAACGCACGGGTGTTGGGTCGTTTGTTCATAAACGCGGGGTTCGGTCCCAGGGCTGGCACTCTGTCGATACCCCACCGAGACCCCATTGGGGCCAATACGCCCGCGTTTCTTCCTTTTCCCCACCCCACCCCCCAAGTTCGGGTGAAGGCCCAGGGCTCGCAGCCAACGTCGGGGCGGCAGGCCCTGCCATAGCCACTGGCCCCGTGGGTTAGGGACGGGGTCCCCCATGGGGAATGGTTTATGGTTCGTGGGGGTTATTATTTTGGGCGTTGCGTGGGGTCTGGAGATCCCCCGGGCTGCAGGAATTCCGTTACATTACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAAAGGGCGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCG GGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCGGGCGCCACCGCGGCCGCGGGGATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTCGGATCCTCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAAAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTCTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCCTTTTAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTTACGACGTTGTAAAACGACGGCCAGTGAATT
表3A.ABT-874(J695)TEV多蛋白的编码序列(SEQ ID NO:35)
ATGGAGTTTGGGCTGAGCTGGCTTTTTCTTGTCGCGATTTTAAAAGGTGTCCAGTGTCAGGTGCAGCTGGTGGAGTCTGGGGGAGGCGTGGTCCAGCCTGGGAGGTCCCTGAGACTCTCCTGTGCAGCGTCTGGATTCACCTTCAGTAGCTATGGCATGCACTGGGTCCGCCAGGCTCCAGGCAAGGGGCTGGAGTGGGTGGCATTTATACGGTATGATGGAAGTAATAAATACTATGCAGACTCCGTGAAGGGCCGATTCACCATCTCCAGAGACAATTCCAAGAACACGCTGTATCTGCAGATGAACAGCCTGAGAGCTGAGGACACGGCTGTGTATTACTGTAAGACCCATGGTAGCCATGACAACTGGGGCCAAGGGACAATGGTCACCGTCTCTTCAGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCCAGACCTACATCTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGCGAGGAGATGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTAGGGGTAAACGCGAACCAGTTTATTTCCAGGGGAGCTTGTTTAAGGGGCCGCGTGATTATAACCCAATATCGAGTGCCATTTGTCATCTAACGAATGAATCTGATGGGCACACAACATCGTTGTATGGTATTGGTTTTGGCCCTTTCATCATCACAAACAAGCATTTGTTTAGAAGAAATAATGGTACACTGTTAGTTCAATCACTACATGGTGTGTTCAAGGTAAAGAATACCACAACTTTGCAACAACACCTCATTGATGGGAGGGACATGATGCTCATTCGCATGCCTAAGGATTTCCCACCATTTCCTCAAAAGCTGAAATTCAGAGAGCCACAAAGGGAAGAGCGCATATGTCTTGTGACAACCAACTTCCAAACTAAGAGCATGTCTAGCATGGTTTCAGATACTAGTTGCACATTCCCTTCATCTGATGGTATATTCTGGAAACATTGGATTCAGACCAAGGATGGGCACTGTGGTAGCCCGTTGGTGTCAACTAGAGATGGGTTTATTGTTGGTATACACTCAGCATCAAATTTCACCAACACAAACAATTATTTTACAAGTGTGCCGAAAGACTTCATGGATTTATTGACAAATCAAGAGGCGCAGCAATGGGTTAGTGGTTGGCGATTGAATGCTGACTCAGTGTTATGGGGAGGCCACAAAGTTTTCATGAGCAAACCTGAAGAACCCTTTCAGCCAGTCAAAGAAGCAACTCAACTCATGAGTGAATTAGTCTACTCGCAAGGGATGACTTGGACCCCACTCCTCTTCCTCACCCTCCTCCTCCACTGCACAGGAAGCTTATCCCAGTCTGTGCTGACTCAGCCCCCCTCAGTGTCTGGGGCCCCCGGGCAGAGAGTCACCATCTCTTGTTCTGGAAGCAGATCCAACATCGGCAGTAATACTGTAAAGTGGTATCAGCAGCTCCCAGGAACGGCCCCCAAACTCCTCATCTATTACAATGATCAGCGGCCCTCAGGGGTCCCTGACCGATTCTCTGGATCCAAGTCTGGCACCTCAGCCTCCCTCGCCATCACTGGGCTCCAGGCTGAAGACGAGGCTGACTATTACTGCCAGTCATATGACAGATACACCCACCCCGCCCTGCTCTTCGGAACTGGGACCAAGGTCACAGTACTAGGTCAGCCCAAGGCTGCCCCCTCGGTCACTCTGTTCCCGCCCTCCTCTGAGGAGCTTCAAGCCAACAAGGCCACACTGGTGTGTCTCATAAGTGACTTCTACCCGGGAGCCGTGACAGTGGCCTGGAAGGCAGATAGCAGCCCCGTCAAGGCGGGAGTGGAGACCACCACACCCTCCAAACAAAGCAACAACAAGTACGCGGCCAGCAGCTACCTGAGCCTGACGCCTGAGCAGTGGAAGTCCCACAGAAGCTACAGCTGCCAGGTCACGCATGAAGGGAGCACCGTGGAGAAGACAGTGGCCCCTACAGAATGTTCATGA
表3B.ABT-874(J695)TEV多蛋白的氨基酸序列(SEQ ID NO:36)
MEFGLSWLFLVAILKGVQCQVQLVESGGGVVQPGRSLRLSCAASGFTFSSYGMHWVRQAPGKGLEWVAFIRYDGSNKYYADSVKGRFTISRDNSKNTLYLQMNSLRAEDTAVYYCKTHGSHDNWGQGTMVTVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPKSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSREEMTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSRGKREPVYFQGSLFKGPRDYNPISSAICHLTNESDGHTTSLYGIGFGPFIITNKHLFRRNNGTLLVQSLHGVFKVKNTTTLQQHLIDGRDMMLIRMPKDFPPFPQKLKFREPQREERICLVTTNFQTKSMSSMVSDTSCTFPSSDGIFWKHWIQTKDGHCGSPLVSTRDGFIVGIHSASNFTNTNNYFTSVPKDFMDLLTNQEAQQWVSGWRLNADSVLWGGHKVFMSKPEEPFQPVKEATQLMSELVYSQGMTWTPLLFLTLLLHCTGSLSQSVLTQPPSVSGAPGQRVTISCSGSRSNIGSNTVKWYQQLPGTAPKLLIYYNDQRPSGVPDRFSGSKSGTSASLAITGLQAEDEADYYCQSYDRYTHPALLFGTGTKVTVLGQPKAAPSVTLFPPSSEELQANKATLVCLISDFYPGAVTVAWKADSSPVKAGVETTTPSKQSNNKYAASSYLSLTPEQWKSHRSYSCQVTHEGSTVEKTVAPTECS*
表3C.ABT-874(J695)TEV表达载体的完整核苷酸序列(SEQ IDNO:37)
GAAGTTCCTATTCCGAAGTTCCTATTCTCTAGACGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCAATGACGCAAATGGGCAGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCCCGGGCGCCACCATGGAGTTTGGGCTGAGCTGGCTTTTTCTTGTCGCGATTTTAAAAGGTGTCCAGTGTCAGGTGCAGCTGGTGGAGTCTGGGGGAGGCGTGGTCCAGCCTGGGAGGTCCCTGAGACTCTCCTGTGCAGCGTCTGGATTCACCTTCAGTAGCTATGGCATGCACTGGGTCCGCCAGGTCCAGGCAAGGGGCTGGAGTGGGTGGCATTTATACGGTATGATGGAAGTAATAAATACTATGCAGACTCCGTGAAGGGCCGATTCACCATCTCCAGAGACAATTCCAAGAACACGCTGTATCTGCAGATGAACAGCCTGAGAGCTGAGGACACGGCTGTGTATTACTGTAAGACCCATGGTAGCCATGACAACTGGGGCCAAGGGACAATGGTCACCGTCTCTTCAGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACACTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCCAGACCTACATCTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGCGAGGAGATGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCAGGGGTAAACGCGAACCAGTTTATTTCCAGGGGAGCTTGTTTAAGGGGCCGCGTGATTATAACCCAATATCGAGTGCCATTTGTCATCTAACGAATGAATCTGATGGGCACACAACATCGTTGTATGGTATTGGTTTTGGCCCTTTCATCATCACAAACAAGCATTTGTTTAGAAGAAATAATGGTACACTGTTAGTTCAATCACTACATGGTGTGTTCAAGGTAAAGAATACCACAACTTTGCAACAACACCTCATTGATGGGAGGGACATGATGCTCATTCGCATGCCTAAGGATTTCCCACCATTTCCTCAAAAGCTGAAATTCAGAGAGCCACAAAGGGAAGAGCGCATATGTCTTGTGACAACCAACTTCCAAACTAAGAGCATGTCTAGCATGGTTTCAGATACTAGTTGCACATTCCCTTCATCTGATGGTATATTCTGGAAACATTGGATTCAGACCAAGGATGGGCACTGTGGTAGCCCGTTGGTGTCAACTAGAGATGGGTTTATTGTTGGTATACACTCAGCATCAAATTTCACCAACACAAACAATTATTTTACAAGTGTGCCGAAAGACTTCATGGATTTATTGACAAATCAAGAGGCGCAGCAATGGGTTAGTGGTTGGCGATTGAATGCTGACTCAGTGTTATGGGGAGGCCACAAAGTTTTCATGAGCAAACCTGAAGAACCCTTTCAGCCAGTCAAAGAAGCAACTCAACTCATGAGTGAATTAGTCTACTCGCAAGGGATGACTTGGACCCCACTCCTCTTCCTCACCCTCCTCCTCCACTGCACAGGAAGCTTATCCCAGTCTGTGCTGACTCAGCCCCCCTCAGTGTCTGGGGCCCCCGGGCAGAGAGTCACCATCTCTTGTTCTGGAAGCAGATCCAACATCGGCAGTAATACTGTAAAGTGGTATCAGCCAGCTCCCAGGAACGGCCCCCAAACTCCTCATCTATTACATGATCAGCGGCCCTCAGGGGTCCCTGACCGATTCTCTGGATCCAAGTCTGGCACCTCAGCCTCCCTCGCCATCACTGGGCTCCAGGCTGAAGACGAGGCTGACTATTACTGCCAGTCATATGACAGATACACCCACCCCGCCCTGCTCTTCGGAACTGGGACCAAGGTCACAGTACTAGGTCAGCCCAAGGCTGCCCCCTCGGTCACTCTGTTCCCGCCCTCCTCTGAGGAGCTTCAAGCCAACAAGGCCACACTGGTGTGTCTCATAAGTGACTTCTACCCGGGAGCCGTGACAGTGGCCTGGAAGGCAGATAGCAGCCCCGTCAAGGCGGGAGTGGAGACCACCACACCCTCCAAACAAAGCAACAACAAGTACGCGGCCAGCAGCTACCTGAGCCTGACGCCTGAGCAGTGGAAGTCCCACAGAAGCTACAGCTGCCAGGTCACGCATGAAGGGAGCACCGTGGAGAAGACAGTGGCCCCTACAGAATGTTCATGAGCGGCCGCGTTTAAACTGAATGAGCGCGTCCATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTAAAGCAAGTAAAACCTCTACAAATGTGGTATGGCTGATTATGATCCGGCTGCCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCGGTCGACGGCGCGCCTTTTTTTTTAATTTTTATTTTATTTTATTTTTGACGCGCCGAAGGCGCGATCTGAGCTCGGTACAGCTTGGTGTGGAATGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTCCTCGAGGAACTGAAAAACCAGAAAGTTAACTGGTAAGTTTAGTCTTTTTGTCTTTATTTCAGGTCCCGGATCCGGTGGTGGTGCAAATCAAAGAACTGCTCCTCAGTGGATGTTGCCTTTACTTCTAGGCCTGTACGGAAGTGTTACTTCTGCTCTAAAAGCTGCGGAATTGTACCCGCGGCCTAATACGACTCACTATAGGGACTAGTATGGTTCGACCATTGAACTGCATCGTCGCCGTGTCCCAAAATATGGGGATTGGCAAGAACGGAGACCTACCCTGGCCTCCGCTCAGGAACGAGTTCAAGTACTTCCAAAGAATGACCACAACCTCTTCAGTGGAAGGTAAACAGAATCTGGTGATTATGGGTAGGAAAACCTGGTTCTCCATTCCTGAGAAGAATCGACCTTTAAAGGACAGAATTAATATAGTTCTCAGTAGAGAACTCAAAGAACCACCACGAGGAGCTCATTTTCTTGCCAAAAGTTTAGATGATGCCTTAAGACTTATTGAACAACCGGAATTGGCAAGTAAAGTAGACATGGTTTGGATAGTCGGAGGCAGTTCTGTTTACCAGGAAGCCATGAATCAACCAGGCCACCTCAGACTCTTTGTGACAAGGATCATGCAGGAATTTGAAAGTGACACGTTTTTCCCAGAAATTGATTTGGGGAAATATAAACTTCTCCCAGAATACCCAGGCGTCCTCTCTGAGGTCCAGGAGGAAAAAGGCATCAAGTATAAGTTTGAAGTCTACGAGAAGAAAGACTAAGCGGCCGAGCGCGCGGATCTGGAAACGGGAGATGGGGGAGGCTAACTGAAGCACGGAAGGAGACAATACCGGAAGGAACCCGCGCTATGACGGCAATAAAAAGACAGAATAAAACGCACGGGTGTTGGGTCGTTTGTTCATAAACGCGGGGTTCGGTCCCAGGGCTGGCACTCTGTCGATACCCCACCGAGACCCCATTGGGGCCAATACGCCCGCGTTTCTTCCTTTTCCCCACCCCACCCCCCAAGTTCGGGTGAAGGCCCAGGGCTCGCAGCCAACGTCGGGGCGGCAGGCCCTGCCATAGCCACTGGCCCCGTGGGTTAGGGACGGGGTCCCCCATGGGGAATGGTTTATGGTTCGTGGGGGTTATTATTTTGGGCGTTGCGTGGGGTCTGGAGATCCCCCGGGCTGCAGGAATTCCGTTACATTACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAAAGGGCGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCGGGCGCCACCGCGGCCGCGGGGATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTCGGATCCTCTTGGCGTAATCATGCTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAAAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTCTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCCTTTTAATTAAAAATGAAGTTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATCCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTGTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTTACGACGTTGTAAAACGACGCCCAGTGAATT
表4A.编码EL246GG(抗-E/L选择素)TEV多蛋白的核酸序列(SEQ ID NO:38)
ATGGAGTTTGGGCTGAGCTGGCTTTTTCTTGTCGCGATTTTAAAAGGTGTCCAGTGCGAGGTGCAGCTGGTGCAGTCTGGAGCAGAGGTGAAAAAGCCCGGGGAGTCTCTGAAGATCTCCTGTAAGGGGTCCGGATACGCATTCAGTAGTTCCTGGATCGGCTGGGTGCGCCAGATGCCCGGGAAAGGCCTGGAGTGGATGGGGCGGATTTATCCTGGAGATGGAGATACTAACTACAATGGGAAGTTCAAGGGCCAGGTCACCATCTCAGCCGACAAGTCCATCAGCACCGCCTACCTGCAGTGGAGCAGCCTGAAGGCTAGCGACACCGCCATGTATTACTGTGCGAGAGCGCGCGTGGGATCCACGGTCTATGATGGTTACCTCTATGCAATGGACTACTGGGGTCAAGGTACCTCAGTCACCGTCTCCTCAGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCCAGACCTACATCTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTGAAGCCGCGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGCGAGGAGATGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTAGGGGTAAACGCGAACCAGTTTATTTCCAGGGGAGCTTGTTTAAGGGGCCGCGTGATTATAACCCAATATCGAGTGCCATTTGTCATCTAACGAATGAATCTGATGGGCACACAACATCGTTGTATGGTATTGGTTTTGGCCCTTTCATCATCACAAACAAGCATTTGTTTAGAAGAAATAATGGTACACTGTTAGTTCAATCACTACATGGTGTGTTCAAGGTAAAGAATACCACAACTTTGCAACAACACCTCATTGATGGGAGGGACATGATGCTCATTCGCATGCCTAAGGATTTCCCACCATTTCCTCAAAAGCTGAAATTCAGAGAGCCACAAAGGGAAGAGCGCATATGTCTTGTGACAACCAACTTCCAAACTAAGAGCATGTCTAGCATGGTTTCAGATACTAGTTGCACATTCCCTTCATCTGATGGTATATTCTGGAAACATTGGATTCAGACCAAGGATGGGCACTGTGGTAGCCCGTTGGTGTCAACTAGAGATGGGTTTATTGTTGGTATACACTCAGCATCAAATTTCACCAACACAAACAATTATTTTACAAGTGTGCCGAAAGACTTCATGGATTTATTGACAAATCAAGAGGCGCAGCAATGGGTTAGTGGTTGGCGATTGAATGCTGACTCAGTGTTATGGGGAGGCCACAAAGTTTTCATGAGCAAACCTGAAGAACCCTTTCAGCCAGTCAAAGAAGCAACTCAACTCATGAGTGAATTAGTCTACTCGCAAGGGATGGACATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGCTGCTGTGGTTCCCCGGCTCGCGATGCGACATCGTGATGACCCAGTCTCCAGACTCCCTGGCTGTGTCTCTGGGCGAGAGGGCCACCATCAACTGCAAGTCCAGTCAGAGCCTTTCATATAGAAGCAATCAAAAGAACTCGTTGGCCTGGTACCAGCAGAAACCAGGACAGCCTCCTAAGCTGCTCATTTACTGGGCTAGCACTAGGGAATCTGGGGTCCCTGACCGATTCAGTGGATCCGGGTCTGGGACAGATTTCACTCTCACCATCAGCAGCCTGCAGGCTGAAGATGTGGCAGTTTATTACTGTCACCAATATTATAGCTATCCGTACACGTTCGGAGGGGGGACCAAGGTGGAAATTAAACGTACGGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAGAGTGTTGA
表4B.EL246GG(抗-E/L选择素)TEV多蛋白的氨基酸序列(SEQID NO:39)
MEFGLSWLFLVAILKGVQCEVQLVQSGAEVKKPGESLKISCKGSGYAFSSSWIGWVRQMPGKGLEWMGRIYPGDGDTNYNGKFKGQVTISADKSISTAYLQVSSLKASDTAMYYCARARVGSTVYDGYLYAMDYWGQGTSVTVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPKSCDKTHTCPPCPAPEAAGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSREEMTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSRGKREPVYFQGSLFKGPRDYNPISSAICHLTNESDGHTTSLYGIGFGPFIITNKHLFRRNNGTLLVQSLHGVFKVKNTTTLQQHLIDGRDMMLIRMPKDFPPFPQKLKFREPQREERICLVTTNFQTKSMSSMVSDTSCTFPSSDGIFWKHWIQTKDGHCGSPLVSTRDGFIVGIHSASNFTNTNNYFTSVPKDFMDLLTNQEAQQWVSGWRLNADSVLWGGHKVFMSKPEEPFQPVKEATQLMSELVYSQGMDMRVPAQLLGLLLLWFPGSRCDIVMTQSPDSLAVSLGERATINCKSSQSLSYRSNQKNSLAWYQQKPGQPPKLLIYWASTRESGVPDRFSGSGSGTDFTLTISSLQAEDVAVCHQYYSYPYTFGGGTKVEIKRTVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGEC*
表4C.EL246GG(抗-E/L选择素)TEV多蛋白表达载体的完整核苷酸序列(SEQ ID NO:40)
GAAGTTCCTATTCCGAAGTTCCTATTCTCTAGACGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCAATGACGCAAATGGGCAGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCCCGGGCGCCACCATGGAGTTTGGGCTGAGCTGGCTTTTTCTTGTCGCGATTTTAAAAGGTGTCCAGTGCGAGGTGCAGCTGGTGCAGTCTGGAGCAGAGGTGAAAAAGCCCGGGGAGTCTCTGAAGATCTCCTGTAAGGGGTCCGGATACGCATTCAGTAGTTCCTGGATCGGCTGGGTGCGCCAGATGCCCGGGAAAGGCCTGGAGTGGATGGGGCGGATTTATCCTGGAGATGGAGATACTAACTACAATGGGAAGTTCAAGGGCCAGGTCACCATCTCAGCCGACAAGTCCATCAGCACCGCCTACCTGCAGTGGAGCAGCCTGAAGGCTAGCGACACCGCCATGTATTACTGTGCGAGAGCGCGCGTGGGATCCACGGTCTATGATGGTTACCTCTATGCAATGGACTACTGGGGTCAAGGTACCTCAGTCACCGTCTCCTCAGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGCACCCAGACCTACATCTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTGAAGCCGCGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGCGAGGAGATGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTAGGGGTAAACGCGAACCAGTTTATTTCCAGGGGAGCTTGTTTAAGGGGCCGCGTGATTATAACCCAATATCGAGTGCCATTTGTCATCTAACGAATGAATCTGATGGGCACACAACATCGTTGTATGGTATTGGTTTTGGCCCTTTCATCATCACAAACAAGCATTTGTTTAGAAGAAATAATGGTACACTGTTAGTTCAATCACTACATGGTGTGTTCAAGGTAAAGAATACCACAACTTTTGCAACAACACCTCATTGATGGGAGGGACATGATGCTCATTCGCATGCCTAAGGATTTCCCACCATTTCCTCAAAAGCTGAAATTCAGAGAGCCACAAAGGGAAGAGCGCATATGTCTTGTGACAACCAACTTCCAAACTAAGAGCATGTCTAGCATGGTTTCAGATACTAGTTGCACATTCCCTTCATCTGATGGTATATTCTGGAAACATTGGATTCAGACCAAGGATGGGCACTGTGGTAGCCCGTTGGTGTCAACTAGAGATGGGTTTATTGTTGGTATACACTCAGCATCAAATTTCACCAACACAAACAATTATTTTACAAGTGTGCCGAAAGACTTCATGGATTTATTGACAAATCAAGAGGCGCAGCAATGGGTTAGTGGTTGGCGATTGAATGCTGACTCAGTGTTATGGGGAGGCCACAAAGTTTTCATGAGCAAACCTGAAGAACCCTTTCAGCCAGTCAAAGAAGCAACTCAACTCATGAGTGAATTAGTCTACTCGCAAGGGATGGACATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGCTGCTGTGGTTCCCCGGCTCGCGATGCGACATCGTGATGACCCAGTCTCCAGACTCCCTGGCTGTGTCTCTGGGCGAGAGGGCCACCATCAACTGCAAGTCCAGTCAGAGCCTTTCATATAGAAGCAATCAAAAGAACTCGTTGGCCTGGTACCAGCAGAAACCAGGACAGCCTCCTAAGCTGCTCATTTACTGGGCTAGCACTAGGGAATCTGGGGTCCCTGACCGATTCAGTGGATCCGGGTCTGGGACAGATTTCACTCTCACCATCAGCAGCCTGCAGGCTGAAGATGTGGCAGTTTATTACTGTCACCAATATTATAGCTATCCGTACACGTTCGGAGGGGGGACCAAGGTGGAAATTAAACGTACGGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAGAGTGTTGAGCGGCCGCGTTTAAACTGAATGAGCGCGTCCATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTAAAGCAAGTAAAACCTCTACAAATGTGGTATGGCTGATTATGATCCGGCTGCCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCGGTCGACGGCGCGCCTTTTTTTTTAATTTTTATTTTATTTTATTTTTGACGCGCCGAAGGCGCGATCTGAGCTCGGTACAGCTTGGCTGTGGAATGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTCCTCGAGGAACTGAAAAACCAGAAAGTTAACTGGTAAGTTTAGTCTTTTTGTCTTTTATTTCAGGTCCCGGATCCGGTGGTGGTGCAAATCAAAGAACTGCTCCTCAGTGGATGTTGCCTTTACTTCTAGGCCTGTACGGAAGTGTTACTTCTGCTCTAAAAGCTGCGGAATTGTACCCGCGGCCTAATACGACTCACTATAGGGACTAGTATGGTTCGACCATTGAACTGCATCGTCGCCGTGTCCCAAAATATGGGGATTGGCAAGAACGGAGACCTACCCTGGCCTCCGCTCAGGAACGAGTTCAAGTACTTCCAAAGAATGACCACAACCTCTTCAGTGGAAGGTAAACAGAATCTGGTGATTATGGGTAGGAAAACCTGGTTCTCCATTCCTGAGAAGAATCGACCTTTAAAGGACAGAATTAATATAGTTCTCAGTAGAGAACTCAAAGAACCACCACGAGGAGCTCATTTTCTTGCCAAAAGTTTAGATGATGCCTTAAGACTTATTGAACAACCGGAATTGGCAAGTAAAGTAGACATGGTTTGATAGTCGGAGGCAGTTCTGTTTACCAGGAAGCCATGAATCAACCAGGCCACCTCAGACTCTTTGTGACAAGGATCATGCAGGAATTTGAAAGTGACACGTTTTTCCCAGAAATTGATTTGGGGAAATATAAACTTCTCCCAGAATACCCAGGCGTCCTCTCTGAGGTCCAGGAGGAAAAAGGCATCAAGTATAAGTTTGAAGTCTACGAGAAGAAAGACTAAGCGGCCGAGCGCGCGGATCTGGAAACGGGAGATGGGGGAGGCTAACTGAAGCACGGAAGGAGACAATACCGGAAGGAACCCGCGCTATGACGGCAATAAAAAGACAGAATAAAACGCACGGGTGTTGGGTCGTTTGTTCATAAACGCGGGGTTCGGTCCCAGGGCTGGCACTCTGTCGATACCCCACCGAGACCCCATTGGGGCCAATACGCCCGCGTTTCTTCCTTTTCCCCACCCCACCCCCCAAGTTCGGGTGAAGGCCCAGGGCTCGCAGCCAACGTCGGGGCGGCAGGCCCTGCCATAGCCACTGGCCCCGTGGGTTAGGGACGGGGTCCCCCATGGGGAATGGTTTAATGGTTCGTGGGGGTTATTATTTTGGGCGTTGCGTGGGGTCTGGAGATCCCCCGGGCTGCAGGAATTCCGTTACATTACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAAAGGGCGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCGGGCGCCACCGCGGCCGCGGGGATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTCGGATCCTCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAAAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTCTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCCTTTTAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGCTGCGCAACTGTTGGGAAG GCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTTACGACGTTGTAAAACGACGGCCAGTGAATT
表5A.ABT-325TEV多蛋白的编码序列(SEQ ID NO:41)
ATGGAGTTTGGGCTGAGCTGGCTTTTCCTTGTCGCGATTTTAAAAGGTGTCCAGTGTGAGGTGCAGGTGGTGCAGTCTGGAACAGAGGTGAAAAAACCCGGGGAGTCTCTGAAGATCTCCTGTAAGGGTTCTGGATACACTGTTACCAGTTACTGGATCGGCTGGGTGCGCCAGATGCCCGGGAAAGGCCTGGAGTGGATGGGATTCATCTATCCTGGTGACTCTGAAACCAGATACAGTCCGACCTTCCAAGGCCAGGTCACCATCTCAGCCGACAAGTCCTTCAATACCGCCTTCCTGCAGTGGAGCAGTCTAAAGGCCTCGGACACCGCCATGTATTACTGTGCGCGAGTCGGCAGTGGCTGGTACCCTTATACTTTTGATATCTGGGGCCAAGGGACAATGGTCACCGTCTCTTCAGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCCAGACCTACATCTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTGAAGCCGCGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGCGAGGAGATGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTAGGGGTAAACGCGAACCAGTTTATTTCCAGGGGAGCTTGTTTAAGGGGCCGCGTGATTATAACCCAATATCGAGTGCCATTTGTCATCTAACGAATGAATCTGATGGGCACACAACATCGTTGTATGGTATTGGTTTTGGCCCTTTCATCATCACAAACAAGCATTTGTTTAGAAGAAATAATGGTACACTGTTAGTTCAATCACTACATGGTGTGTTCAAGGTAAAGAATACCACAACTTTGCAACAACACCTCATTGATGGGAGGGACATGATGCTCATTCGCATGCCTAAGGATTTCCCACCATTTCCTCAAAAGCTGAAATTCAGAGAGCCACAAAGGGAAGAGCGCATATGTCTTGTGACAACCAACTTCCAAACTAAGAGCATGTGTAGCATGGTTTCAGATACTAGTTGCACATTCCCTTCATCTGATGGTATATTCTGGAAACATTGGATTCAGACCAAGGATGGGCACTGTGGTAGCCCGTTGGTGTCAACTAGAGATGGGTTTATTGTTGGTATACACTCAGCATCAAATTTCACCAACACAAACAATTATTTTACAAGTGTGCCGAAAGACTTCATGGATTTATTGACAAATCAAGAGGCGCAGCAATGGGTTAGTGGTTGGCGATTGAATGCTGACTCAGTGTTATGGGGAGGCCACAAAGTTTTCATGAGCAAACCTGAAGAACCCTTTCAGCCAGTCAAAGAAGCAACTCAACTCATGAGTGAATTAGTCTACTCGCAAGGGATGGAAGCCCCAGCGCAGCTTCTCTTCCTCCTGCTACTCTGGCTCCCAGATACCACTGGAGAAATAGTGATGACGCAGTCTCCAGCCACCCTGTCTGTGTCTCCAGGGGAAAGAGCCACCCTCTCCTGCAGGGCCAGTGAGAGTATTAGCAGCAACTTAGCCTGGTACCAGCAGAAACCTGGCCAGGCTCCCAGGCTCTTCATCTATACTGCATCCACCAGGGCCACTGATATCCCAGCCAGGTTCAGTGGCAGTGGGTCTGGGACAGAGTTCACTCTCACCATCAGCAGCCTGCAGTCTGAAGATTTTGCAGTTTATTACTGTCAGCAGTATAATAACTGGCCTTCGATCACCTTCGGCCAAGGGACACGACTGGAGATTAAACGAACTGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCTAGCGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAGAGTGTTGA
表5B.ABT-325TEV多蛋白氨基酸序列(SEQ ID NO:42)
MEFGLSWLFLVAILKGVQCEVQLVQSGTEVKKPGESLKISCKGSGYTVTSYWGWVRQMPGKGLEWMGFIYPGDSETRYSPTFQGQVTISADKSFNTAFLQWSSLKASDTAMYYCARVGSGVYPYTFDIWGQGTMVTVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPKSCDKTHTCPPCPAPEAAGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWVYDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSREEMTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSRGKREPVYFQGSLFKGPRDYNPISSAICHLTNESDGHTTSLYGIGFGPFIITNKHLFRRNNGTLLVQSLHGVFKVKNTTTLQQHLIDGRDMMLIRMPKDFPPFPQKLKFREPQREERICLVTTNFQTKSMSSMVSDTSCTFPSSDGIFWKHWIQTKDGHCGSPLVSTRDGFIVGIHSASNFTNTNNYFTSVPKDFMDLLTNQEAQQWVSGWRLNADSVLWGGHKVFMSKPEEPFQPVKEATQLMSELVYSQGMEAPAQLLFLLLLWLPDTTGEIVMTQSPATLSVSPGERATLSCRASESISSNLAWYQQKPGQAPRLFIYTASTRATDIPARFSGSGSGTEFTLTISSLQSEDFAVYYCQQYNNWPSITFGQGTRLEIKRTVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGEC*
表5C.完整的ABT-325TEV多蛋白表达载体的核苷酸序列(SEQID NO:43)
GAAGTTCCTATTCCGAAGTTCCTATTCTCTAGACGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCAATGACGCAAATGGGCAGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCCCGGGCGCCACCATGGAGTTTGGGCTGAGCTGGCTTTTCCTTGTCGCGATTTTAAAAGGTGTCCAGTGTGAGGTGCAGCTGGTGCAGTCTGGAACAGAGGTGAAAAAACCCGGGGAGTCTCTGAAGATCTCCTGTAAGGGTTCTGGATACACTGTTACCAGTTACTGGATCGGCTGGGTGCGCCAGATGCCCGGGAAAGGCCTGGAGTGGATGGGATTCATCTATCCTGGTGACTCTGAAACCAGATACAGTCCGACCTTCCAAGGCCAGGTCACCATCTCAGCCGACAAGTCCTTCAATACCGCCTTCCTGCAGTGGAGCAGTCTAAAGGCCTCGGACACCGCCATGTATTACTGTGCGCGAGTCGGCAGTGGCTGGTACCCTTATACTTTTGATATCTGGGGCCAAGGGACAATGGTCACCGTCTCTTCAGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCCAGACCTACATCTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTGAAGCCGCGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGTGTACACCCTGCCCCCATCCCGCGAGGAGATGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTAGGGGTAAACGCGAACCAGTTTATTTCCAGGGGAGCTTGTTTAAGGGGCCGCGTGATTATAACCCAATATCGAGTGCCATTTGTCATCTAACGAATGAATCTGATGGGCACACAACATCGTTGTATGGTATTGGTTTTGGCCCTTTCATCATCACAAACAAGCATTTGTTTAGAAGAAATAATGGTACACTGTTAGTTCAATCACTACATGGTGTGTTCAAGGTAAAGAATACCACAACTTTGCAACAACACCTCATTGATGGGAGGGACATGATGCTCATTCGCATGCCTAAGGATTTCCCACCATTTCCTCAAAAGCTGAAATTCAGAGAGCCACAAAGGGAAGAGCGCATATGTCTTGTGACAACCAACTTCCAAACTAAGAGCATGTCTAGCATGGTTTCAGATACTAGTTGCACATTCCCTTCATCTGATGGTATATTCTGGAAACATTGGATTCAGACCAAGGATGGGCACTGTGGTAGCCCGTTGGTGTCAACTAGAGATGGGTTTATTGTTGGTATACACTCAGCATCAAATTTCACCAACACAAACAATTATTTTACAAGTGTGCCGAAAGACTTCATGGATTTATTGACAAATCAAGAGGCGCAGCAATGGGTTAGTGGTTGGCGATTGAATGCTGACTCAGTGTTATGGGGAGGCCACAAAGTTTTCATGAGCAAACCTGAAGAACCCTTTCAGCCAGTCAAAGAAGCAACTCAACTCATGAGTGAATTAGTCTACTCGCAAGGGATGGAAGCCCCAGCGCAGCTTCTCTTCCTCCTGCTACTCTGGCTCCCAGATACCACTGGAGAAATAGTGATGACGCAGTCTCCAGCCACCCTGTCTGTGTCTCCAGGGGAAAGAGCCACCCTCTCCTGCAGGGCCAGTGAGAGTATTAGCAGCAACTTAGCCTGGTACCAGCAGAAACCTGGCCAGGCTCCCAGGCTCTTCATCTATACTGCATCCACCAGGGCCACTGATATCCCAGCCAGGTTCAGTGGCAGTGGGTCTGGGACAGAGTTCACTCTCACCATCAGCAGCCTGCAGTCTGAAGATTTTGCAGTTTATTACTGTCAGCAGTATAATAACTGGCCTTCGATCACCTTCGGCCAAGGGACACGACTGGAGATTAAACGAACTGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCTAGCGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAGAGTGTTGAGCGGCCGCGTTTAAACTGAATGAGCGCGTCCATGCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTAAAGCAAGTAAAACCTCTACAAATGTGGTATGGCTGATTATGATCCGGCTGCCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCGGTCGACGGCGCGCCTTTTTTTTTAATTTTTATTTTATTTTATTTTTGACGCGCCGAAGGCGCGATCTGAGCTCGGTACAGCTTGGCTGTGGAATGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTCCTCGAGGAACTGAAAAACCAGAAAGTTAACTGGTAAGTTTAGTCTTTTTGTCTTTTATTTCAGGTCCCGGATCCGGTGGTGGTGCAAATCAAAGAACTGCTCCTCAGTGGATGTTGCCTTTACTTCTAGGCCTGTACGGAAGTGTTACTTCTGCTCTAAAAGCTGCGGAATTGTACCCGCGCCTAATACGACTCACTATAGGGACTAGTATGGTTCGACCATTGAACTGCATCGTCGCCGTGTCCCAAAATATGGGGATTGCAAGAACGGAGACCTACCCTGGCCTCCGCTCAGGAACGAGTTCAAGTACTTCCAAAGAATGACCACAACCTCTTCAGTGGAAGGTAAACAGAATCTGGTGATTATGGGTAGGAAAACCTGGTTCTCCATTCCTGAGAAGAATCGACCTTTAAAGGACAGAATTAATATAGTTCTCAGTAGAGAACTCAAAGAACCACCACGAGGAGCTCATTTTCTTGCCAAAAGTTTAGATGATGCCTTAAGACTTATTGAACAACCGGAATTGGCAAGTAAAGTAGACATGGTTTGGATAGTCGGAGGCAGTTCTGTTTACCAGGAAGCCATGAATCAACCAGGCCACCTCAGACTCTTTGTGACAAGGATCATGCAGGAATTTGAAAGTGACACGTTTTTCCCAGAAATTGATTTGGGGAAATATAAACTTCTCCCAGAATACCCAGGCGTCCTCTCTGAGGTCCAGGAGGAAAAAGGCATCAAGTATAAGTTTGAAGTCTACGAGAAGAAAGACTAAGCGGCCGAGCGCGCGGATCTGGAAACGGGAGATGGGGGAGGCTAACTGAAGCACGGAAGGAGACAATACCGGAAGGAACCCGCGCTATGACGGCAATAAAAAGACAGAATAAAACGCACGGGTGTTGGGTCGTTTGTTCATAAACGCGGGGTTCGGTCCGAGGGCTGGCACTTGTCGATACCCCACCGAGACCCCATTGGGGCCAATACGCCCGCGTTTCTTCCTTTTCCCCACCCCACCCCCCAAGTTCGGGTGAAGGCCCAGGGCTCGCAGCCAACGTCGGGGCGGCAGGCCCTGCCATAGCCACTGGCCCCGTGGGTTAGGGACGGGGTCCCCCATGGGGAATGGTTTATGGTTCGTGGGGGTTATTATTTTGGGCGTTGCGTGGGGTCTGGAGATCCCCCGGGCTGCAGGAATTCCGTTACATTACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAAAGGGCGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCGGGCGCCACCGCGGCCGCGGGGATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTCGGATCCTCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAAAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTCTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCCTTTTAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTTACGACGTTGTAAAACGACGGCCAGTGAATT
表6A.D2E7LC-LC-HC多蛋白构建体的编码序列(SEQ ID NO:29)
ATGGACATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGCTGCTGTGGTTCCCCGGCTCGCGATGCGACATCCAGATGACCCAGTCTCCATCCTCCCTGTCTGCATCTGTAGGGGACAGAGTCACCATCACTTGTCGGGCAAGTCAGGGCATCAGAAATTACTTAGCCTGGTATCAGCAAAAACCAGGGAAAGCCCCTAAGCTCCTGATCTATGCTGCATCCACTTTGCAATCAGGGGTCCCATCTCGGTTCAGTGGCAGTGGATCTGGGACAGATTTCACTCTCACCATCAGCAGCCTACAGCCTGAAGATGTTGCAACTTATTACTGTCAAAGGTATAACCGTGCACCGTATACTTTTGGCCAGGGGACCAAGGTGGAAATCAAACGTACGGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAAGGTGTAAGAGACTTCTCAAGTTGGCAGGAGACGTTGAGTCCAACCCTGGGCCCATGGACATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGCTGCTGTGGTTCCCCGGCTCGCGATGCGACATCCAGATGACCCAGTCTCCATCCTCCCTGTCTGCATCTGTAGGGGACAGAGTCACCATCACTTGTCGGGCAAGTCAGGGCATCAGAAATTACTTAGCCTGGTATCAGCAAAAACCAGGGAAAGCCCCTAAGCTCCTGATCTATGCTGCATCCACTTTGCAATCAGGGGTCCCATCTCGGTTCAGTGGCAGTGGATCTGGGACAGATTTCACTCTCACCATCAGCAGCCTACAGCCTGAAGATGTTGCAACTTATTACTGTCAAAGGTATAACCGTGCACCGTATACTTTTGGCCAGGGGACCAAGGTGGAAATCAAACGTACGGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAAGGTGTAAGAGACTTCTCAAGTTGGCAGGAGACGTTGAGTCCAACCCTGGGCCCATGGAGTTTGGGCTGAGCTGGCTTTTTCTTGTCGCGATTTTAAAAGGTGTCCAGTGTGAGGTGCAGCTGGTGGAGTCTGGGGGAGGCTTGGTACAGCCCGGCAGGTCCCTGAGACTCTCCTGTGCGGCCTCTGGATTCACCTTTGATGATTATGCCATGCACTGGGTCCGGCAAGCTCCAGGGAAGGGCCTGGAATGGGTCTCAGCTATCACTTGGAATAGTGGTCACATAGACTATGCGGACTCTGTGGAGGGCCGATTCACCATCTCCAGAGACAACGCCAAGAACTCCCTGTATCTGCAAATGAACAGTCTGAGAGCTGAGGATACGGCCGTATATTACTGTGCGAAAGTCTCGTACCTTAGCACCGCGTCCTCCCTTGACTATTGGGGCCAAGGTACCCTGGTCACCGTCTCGAGTGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCCAGACCTACATCTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGATGAGCTGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAATGA
表6B.D2E7LC-LC-HC多蛋白氨基酸序列(SEQ ID NO:30)
MDMRVPAQLLGLLLLWFPGSRCDIQMTQSPSSLSASVGDRVTITCRASQGIRNYLAVYQQKPGKAPKLLIYAASTLQSGVPSRFSGSGSGTDFTLTISSLQPEDVATYYCQRYNRAPYTFGQGTKVEIKRTVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGRCKRLLKLAGDVESNPGPMDMRVPAQLLGLLLLWFPGSRCDIQMTQSPSSLSASVGDRVTITCRASQGIRNYLAWQQKPGKAPKLLIYAASTLQSGVPSRFSGSGSGTDFTLTISSLQPEDVATYYCQRYNRAPYTFGQGTKVEIKRTVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGRCKRLLKLAGDVESNPGPMEFGLSWLFLVAILKGVQCEVQLVESGGGLVQPGRSLRLSCAASGFTFDDYAMHWVRQAPGKGLEWVSAITWNSGHIDYADSVEGRFTISRDNAKNSLYLQMNSLRAEDTAVYYCAKVSYLSTASSLDYWGQGTLVTVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPKSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHTQKSLSLSPGK*
表6C.D2E7LCLC-HC多蛋白表达载体DNA序列的完整核苷酸序列(SEQ ID NO:31)
GAAGTTCCTATTCCGAAGTTCCTATTCTCTAGACGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCGCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCAATGACGCAAATGGGCAGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCAGGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCCCGGGCGCCACCATGGACATGCGCGTGCCGGCCCAGCTGCTGGGCCTGCTGCTGCTGTGGTTCCCCGGCTCGCGATGCGACATCCAGATGACCCAGTCTCCATCCTCCCTGTCTGCATCTGTAGGGGACAGAGTCACCATCACTTGTCGGGCAAGTCAGGGCATCAGAAATTACTTAGCCTGGTATCAGCAAAAACCAGGGAAAGCCCCTAAGCTCCTGATCTATGCTGCATCCACTTTGCAATCAGGGGTCCCATCTCGGTTCAGTGGCAGTGGATCTGGGACAGATTTCACTCTCACCATCAGCAGCCTACAGCCTGAAGATGTTGCAACTTATTACTGTCAAAGGTATAACCGTGCACCGTATACTTTTGGCCAGGGGACCAAGGTGGAAATCAAACGTACGGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAAGGTGTAAGAGACTTCTCAAGTTGGCAGGAGACGTTGAGTCCAACCCTGGGCCCATGGACATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGCTGCTGTGGTTCCCCGGCTCGCGATGCGACATCCAGATGACCCAGTCTCCATCCTCCCTGTCTGCATCTGTAGGGGACAGAGTCACCATCACTTGTCGGGCAAGTCAGGGCATCAGAAATTACTTAGCCTGGTATCAGCAAAAACCAGGGAAAGCCCCTAAGCTCCTGATCTATGCTGCATCCACTTTGCAATCAGGGGTCCCATCTCGGTTCAGTGGCAGTGGATCTGGGACAGATTTCACTCTCACCATCAGCAGCCTACAGCCTGAAGATGTTGCAACTTATTACTGTCAAAGGTATAACCGTGCACCGTATACTTTTGGCCAGGGGACCAAGGTGGAAATCAAACGTACGGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAAGGTGTAAGAGACTTCTCAAGTTGGCAGGAGACGTTGAGTCCAACCCTGGGCCCATGGAGTTTGGGCTGAGCTGGCTTTTTCTTGTCGCGATTTTAAAAGGTGTCCAGTGTGAGGTGCAGCTGGTGGAGTCTGGGGGAGGCTTGGTACAGCCCGGCAGGTCCCTGAGACTCTCCTGTGCGGCCTCTGGATTCACCTTTGATGATTATGCCATGCACTGGGTCCGGCAAGCTCCAGGGAAGGGCCTGGAATGGGTCTCAGCTATCACTTGGAATAGTGGTCACATAGACTATGCGGACTCTGTGGAGGGCCGATTCACCATCTCCAGAGACAACGCCAAGAACTCCCTGTATCTGCAAATGAACAGTCTGAGAGCTGAGGATACGGCCGTATATTACTGTGCGAAAGTCTCGTACCTTAGCACCGCGTCCTCCCTTGACTATTGGGGCCAAGGTACCCTGGTCACCGTCTCGAGTGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCCAGACCTACATCTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGATGAGCTGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAATGAGAATTAGTCTACTCGCAAGGGGCGGCCGCGTTTAAACTGAATGAGCGCGTCCATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTAAAGCAAGTAAAACCTCTACAAATGTGGTATGGCTGATTATGATCCGGCTGCCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCGGTCGACGGCGCGCCTTTTTTTTTAATTTTTATTTTATTTTATTTTTGACGCGCCGAAGCGCGATCTGAGCTCGGTACAGCTTGGCTGTGGAATGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCTCCTCGAGGAACTGAAAAACCAGAAAGTTAACGGTAAGTTTAGTCTTTTTGTCTTTTATTTCAGGTCCCGGATCCGGTGGTGGTGCAAATCAAAGAACTGCTCCTCAGTGGATGTTGCCTTTACTTCTAGGCCTGTACGGAAGTGTTACTTCTGCTCTAAAAGCTGCGGAATTGTACCCGCGGCCTAATACGACTCACTATAGGGACTAGTATGGTTCGACCATTGAACTGCATCGTCGCCGTGTCCCAAAATATGGGGATTGGCAAGAACGGAGACCTACCCTGGCCTCCGCTCAGGAACGAGTTCAAGTACTTCCAAAGAATGACCACAACCTCTTCAGTGGAAGGTAAACAGAATCTGGTGATTATGGGTAGGAAAACCTGGTTCTCCATTCCTGAGAAGAATCGACCTTTAAAGGACAGAATTAATATAGTTCTCAGTAGAGAACTCAAAGAACCACCACGAGGAGCTCATTTTCTTGCCAAAAGTTTAGATGATGCCTTAAGACTTATTGAACAACCGGAATTGGCAAGTAAAGTAGACATGGTTTGGATAGTCGGAGGCAGTTCTGTTTACCAGGAAGCCATGAATCAACCAGGCCACCTCAGACTCTTTGTGACAAGGATCATGCAGGAATTTGAAAGTGACACGTTTTTCCCAGAAATTGATTTGGGGAAATATAAACTTCTCCCAGAATACCCAGGCGTCCTCTCTGAGGTCCAGGAGGAAAAAGGCATCAAGTATAAGTTTGAAGTCTACGAGAAGAAAGACTAAGCGGCCGAGCGCGCGGATCTGGAAACGGGAGATGGGGGAGGCTAACTGAAGCACGGAAGGAGACAATACCGGAAGGAACCCGCGCTATGACGGCAATAAAAAGACAGAATAAACGCACGGGTGTTGGGTCGTTTGTTCATAAACGCGGGGTTCGGTCCCAGGGCTGGCACTCTGTCGATACCCCACCGAGACCCCATTGGGGCCAATACGCCCGCGTTTCTTCCTTTTCCCCACCCCACCCCCCAAGTTCGGGTGAAGGCCCAGGGCTCGCAGCCAACGTCGGGGCGGCAGGCCCTGCCATAGCCACTGGCCCCGTGGGTTAGGGACGGGGTCCCCCATGGGGAATGGTTTATGGTTCGTGGGGGTTATTATTTTGGGCGTTGCGTGGGGTCTGGAGATCCCCCGGGCTGCAGGAATTCCGTTACATTACTTACGGTAAATGGCCCGGCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAAAGGGCGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTGGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCGGGCGCCACCGCGGCCGCGGGGATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTCGGATCCTCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAAAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTCTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCCTTTTAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTTACGACGTTGTAAAACGACGGCCAGTGAATT
实施例4.作为具有内部可裂解信号肽构建体的多蛋白的抗体表达
进一步的实施例形成了用于抗体表达的编码序列,表达载体和方法。初级表达构建体包括具有内部可裂解信号肽的多蛋白,使得表达和随后的裂解导致多链(例如,双链)抗体分子的形成。
表7A.D2E7内部可裂解信号肽构建体的编码序列(SEQ ID NO:45)
atggagtttgggctgagctggctttttcttgtcgcgattttaaaaggtgtccagtgtgaggtgcagctggtggagtctgggggaggcttggtacagcccggcaggtccctgagactctcctgtgcggcctctggattcacctttgatgattatgccatgcactgggtccggcaagctccagggaagggcctggaatgggtctcagctatcacttggaatagtggtcacatagactatgcggactctgtggagggccgattcaccatctccagagacaacgccaagaactccctgtatctgcaaatgaacagtctgagagctgaggatacggccgtatattactgtgcgaaagtctcgtaccttagcaccgcgtcctcccttgactattggggccaaggtaccctggtcaccgtctcgagtgcgtcgaccaagggcccatcggtcttccccctggcaccctcctccaagagcacctctgggggcacagcggccctgggctgcctggtcaaggactacttccccgaaccggtgacggtgtcgtggaactcaggcgccctgaccagcggcgtgcacaccttcccggctgtcctacagtcctcaggactctactccctcagcagcgtggtgaccgtgccctccagcagcttgggcacccagacctacatctgcaacgtgaatcacaagcccagcaacaccaaggtggacaagaaagttgagcccaaatcttgtgacaaaactcacacatgcccaccgtgcccagcacctgaactcctggggggaccgtcagtcttcctcttccccccaaaacccaaggacaccctcatgatctcccggacccctgaggtcacatgcgtgtggtggacgtgagccacgaagaccctgaggtcaagttcaactggtacgtggacggcgtggaggtgcataatgccaagacaaagccgcgggaggagcagtacaacagcacgtaccgtgtggtcagcgtcctcaccgtcctgcaccaggactggctgaatggcaaggagtacaagtgcaaggtctccaacaaagccctcccagcccccatcgagaaaaccatctccaaagccaaagggcagccccgagaaccacaggtgtacaccctgcccccatcccgggatgagctgaccaagaaccaggtcagcctgacctgcctggtcaaaggcttctatcccagcgacatcgccgtggagtgggagagcaatgggcagccggagaacaactacaagaccacgcctcccgtgctggactccgacggctccttcttcctctacagcaagctcaccgtggacaagagcaggtggcagcaggggaacgtcttctcatgctccgtgatgcatgaggctctgcacaaccactacacgcagaagagcctctccctgtctaggggtaaacgcatgggacgaatggcaatgaaatggttagttgttataatatgtttctctataacaagtcaacctgcttctgctatggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgcgacatccagatgacccagtctccatcctccctgtctgcatctgtaggggacagagtcaccatcacttgtcgggcaagtcagggcatcagaaattacttagcctggtatcagcaaaaaccagggaaagcccctaagctcctgatctatgctgcatccactttgcaatcaggggtcccatctcggttcagtggcagtggatctgggacagatttcactctcaccatcagcagcctacagcctgaagatgttgcaacttattactgtcaaaggtataaccgtgcaccgtatacttttggccaggggaccaaggtggaaatcaaacgtacggtggctgcaccatctgtcttcatcttcccgccatctgatgagcagttgaaatctggaactgcctctgttgtgtgcctgctgaataacttctatcccagagaggccaaagtacagtggaaggtggataacgccctccaatcgggtaactcccaggagagtgtcacagagcaggacagcaaggacagcacctacagcctcagcagcaccctgacgctgagcaaagcagactacgagaaacacaaagtctacgcctgcgaagtcacccatcagggcctgagctcgcccgtcacaaagagcttcaacaggggagagtgttga
表7B.D2E7内部可裂解信号肽构建体的氨基酸序列(SEQ ID NO:46)
MEFGLSWLFLVAILKGVQCEVQLVESGGGLVQPGRSLRLSCAASGFTFDDYAMHWVRQAPGKGLEWVSAITWNSGHIDYADSVEGRFTISRDNAKNSLYLQMNSLRAEDTAVYYCAKVSYLSTASSLDYWGQGTLVTVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSVVTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPKSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVKFNWYVDGVEVHNAKTKPREEQYNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSRGKRMGRMAMKWLVVIICFSITSQPASAMDMRVPAQLLGLLLLWFPGSRCDIQMTQSPSSLSASVGDRVTITCRASQGIRNYLAWYQQKPGKAPKLLIYAASTLQSGVPSRFSGSGSGTDFTLTISSLQPEDVATYYCQRYNRAPYTFGQGTKVEIKRTVAAPSVFIFPPSDEQLKSGTASVVCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGEC*
表7C.完整的D2E7内部可裂解信号肽多蛋白表达载体DNA序列(SEQ ID NO:47)
gaagttcctattccgaagttcctattctctagacgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccaatgacgcaaatgggcagggaattcgagctcggtactcgagcggtgttccgcggtcctcctcgtatagaaactcggaccactctgagacgaaggctcgcgtccaggccagcacgaaggaggctaagtgggaggggtagcggtcgttgtccactagggggtccactcgctccagggtgtgaagacacatgtcgccctcttcggcatcaaggaaggtgattggtttataggtgtaggccacgtgaccgggtgttcctgaaggggggctataaaagggggtgggggcgcgttcgtcctcactctcttccgcatcgctgtctgcgagggccagctgttgggctcgcggttgaggacaaactcttcgcggtctttccagtactcttggatcggaaacccgtcggcctccgaacggtactccgccaccgagggacctgagcgagtccgcatcgaccggatcggaaaacctctcgactgttggggtgagtactccctctcaaaagtcgggcatgacttctgcgctaagattgtcagtttccaaaaacgaggaggatttgatattcacctggcccgcggtgatgcctttgagggtggccgcgtccatctggtcagaaaagacaatctttttgttgtcaagcttgaggtgtggcaggcttgagatctggccatacacttgagtgacaatgacatccactttgcctttctctccacaggtgtccactcccaggtccaaccggaattgtacccgcggccagagcttgcccgggcgccaccatggagtttgggctgagctggctttttcttgtcgcgattttaaaaggtgtccagtgtgaggtgcagctggtggagtctgggggaggcttggtacagcccggcaggtccctgagactctcctgtgcggcctctggattcacctttgatgattatgccatgcactgggtccggcaagctccagggaagggcctggaatgggtctcagctatcacttggaatagtggtcacatagactatgcggactctgtggagggccgattcaccatctccagagacaacgccaagaactccctgtatctgcaaatgaacagtctgagagctgaggatacggccgtatattactgtgcgaaagtctcgtaccttagcaccgcgtcctcccttgactattggggccaaggtaccctggtcaccgtctcgagtgcgtcgaccaagggcccatcggtcttccccctggcaccctcctccaagagcacctctgggggcacagcggccctgggctgcctggtcaaggactacttccccgaaccggtgacggtgtcgtggaactcaggcgccctgaccagcggcgtgcacaccttcccggctgtcctacagtcctcaggactctactccctcagcagcgtggtgaccgtgccctccagcagcttgggcacccagacctacatctgcaacgtgaatcacaagcccagcaacaccaaggtggacaagaaagttgagcccaaatcttgtgacaaaactcacacatgcccaccgtgcccagcacctgaactcctggggggaccgtcagtcttcctcttccccccaaaacccaaggacaccctcatgatctcccggacccctgaggtcacatgcgtggtggtggacgtgagccacgaagaccctgaggtcaagttcaactggtacgtggacggcgtggaggtgcataatgccaagacaaagccgcgggaggagcagtacaacagcacgtaccgtgtggtcagcgtcctcaccgtcctgcaccaggactggctgaatggcaaggagtacaagtgcaaggtctccaacaaagccctcccagcccccatcgagaaaaccatctccaaagccaaagggcagccccgagaaccacaggtgtacaccctgcccccatcccgggatgagctgaccaagaaccaggtcagcctgacctgcctggtcaaaggcttctatcccagcgacatcgccgtggagtgggagagcaatgggcagccggagaacaactacaagaccacgcctcccgtgctggactccgacggctccttcttcctctacagcaagctcaccgtggacaagagcaggtggcagcaggggaacgtcttctcatgctccgtgatgcatgaggctctgcacaaccactacacgcagaagagcctctccctgtctaggggtaaacgcatgggacgaatggcaatgaaatggttagttgttataatatgtttctctataacaagtcaacctgcttctgctatggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgcgacatccagatgacccagtctccatcctccctgtctgcatctgtaggggacagagtcaccatcacttgtcgggcaagtcagggcatcagaaattacttagcctggtatcagcaaaaaccagggaaagcccctaagctcctgatctatgctgcatccactttgcaatcaggggtcccatctcggttcagtggcagtggatctgggacagatttcactctcaccatcagcagcctacagcctgaagatgttgcaacttattactgtcaaaggtataaccgtgcaccgtatacttttggccaggggaccaaggtggaaatcaaacgtacggtggctgcaccatctgtcttcatcttcccgccatctgatgagcagttgaaatctggaactgcctctgttgtgtgcctgctgaataacttctatcccagagaggccaaagtacagtggaaggtggataacgccctccaatcgggtaactcccaggagagtgtcacagagcaggacagcaaggacagcacctacagcctcagcagcaccctgacgctgagcaaagcagactacgagaaacacaaagtctacgcctgcgaagtcacccatcagggcctgagctcgcccgtcacaaagagcttcaacaggggagagtgttgagcggccgcgtttaaactgaatgagcgcgtccatccagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggggaggtgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtatggctgattatgatccggctgcctcgcgcgtttcggtgatgacggtgaaaacctctgacacatgcagctcccggagacggtcacagcttgtctgtaagcggatgccgggagcagacaagcccgtcagggcgcgtcagcgggtgttggcgggtgtcggggcgcagccatgaccggtcgacggcgcgcctttttttttaatttttattttattttatttttgacgcgccgaaggcgcgatctgagctcggtacagcttggctgtggaatgtgtgtcagttagggtgtggaaagtccccaggctccccagcaggcagaagtatgcaaagcatgcatctcaattagtcagcaaccaggtgtggaaagtccccaggctccccagcaggcagaagtatgcaaagcatgcatctcaattagtcagcaaccatagtcccgcccctaactccgcccatcccgcccctaactccgcccagttccgcccattctccgccccatggctgactaattttttttatttatgcagaggccgaggccgcctcggcctctgagctattccagaagtagtgaggaggcttttttggaggcctaggcttttgcaaaaagctcctcgaggaactgaaaaaccagaaagttaactggtaagtttagtctttttgtcttttatttcaggtcccggatccggtggtggtgcaaatcaaagaactgctcctcagtggatgttgcctttacttctaggcctgtacggaagtgttacttctgctctaaaagctgcggaattgtacccgcggcctaatacgactcactatagggactagtatggttcgaccattgaactgcatcgtcgccgtgtcccaaaatatggggattggcaagaacggagacctaccctggcctccgctcaggaacgagttcaagtacttccaaagaatgaccacaacctcttcagtggaaggtaaacagaatctggtgattatgggtaggaaaacctggttctccattcctgagaagaatcgacctttaaaggacagaattaatatagttctcagtagagaactcaaagaaccaccacgaggagctcattttcttgccaaaagtttagatgatgccttaagacttattgaacaaccggaattggcaagtaaagtagacatggtttggatagtcggaggcagttctgtttaccaggaagccatgaatcaaccaggccacctcagactctttgtgacaaggatcatgcaggaatttgaaagtgacacgtttttcccagaaattgatttggggaaatataaacttctcccagaatacccaggcgtcctctctgaggtccaggaggaaaaaggcatcaagtataagtttgaagtctacgagaagaaagactaagcggccgagcgcgcggatctggaaacgggagatgggggaggctaactgaagcacggaaggagacaataccggaaggaacccgcgctatgacggcaataaaaagacagaataaaacgcacgggtgttgggtcgtttgttcataaacgcggggttcggtcccagggctggcactctgtcgataccccaccgagaccccattggggccaatacgcccgcgtttcttccttttccccaccccaccccccaagttcgggtgaaggcccagggctcgcagccaacgtcggggcggcaggccctgccatagccactggccccgtgggttagggacggggtcccccatggggaatggtttatggttcgtgggggttattattttgggcgttgcgtggggtctggagatcccccgggctgcaggaattccgttacattacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaaagggcgggaattcgagctcggtactcgagcggtgttccgcggtcctcctcgtatagaaactcggaccactctgagacgaaggctcgcgtccaggccagcacgaaggaggctaagtgggaggggtagcggtcgttgtccactagggggtccactcgctccagggtgtgaagacacatgtcgccctcttcggcatcaaggaaggtgattggtttataggtgtaggccacgtgaccgggtgttcctgaaggggggctataaaagggggtgggggcgcgttcgtcctcactctcttccgcatcgctgtctgcgagggccagctgttgggctcgcggtcgaggacaaactcttcgcggtcttcccagtactcttggatcggaaacccgtcggcctccgaacggtactccgccaccgagggacctgagcgagtccgcatcgaccggatcggaaaacctctcgactgttggggtgagtactccctctcaaaagcgggcatgacttctgcgctaagattgtcagtttccaaaaacgaggaggatttgatattcacctggcccgcggtgatgcctttgagggtggccgcgtccatctggtcagaaaagacaatctttttgttgtcaagcttgaggtgtggcaggcttgagatctggccatacacttgagtgacaatgacatccactttgcctttctctccacaggtgtccactcccaggtccaaccggaattgtacccgcggccagagcttgcgggcgccaccgcggccgcggggatccagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggggaggtgtgggaggttttttcggatcctcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctggggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaatcggccaacgcgcggggaaaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgttcttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatcccttttaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgacgtctaagaaaccattattatcatgacattaacctataaaaataggcgtatcacgaggccctttcgtctcgcgcgtttcggtgatgacggtgaaaacctctgacacatgcagctcccggagacggtcacagcttgtctgtaagcggatgccgggagcagacaagcccgtcagggcgcgtcagcgggtgttggcgggtgtcggggctggcttaactatgcggcatcagagcagattgtactgagagtgcaccatatgcggtgtgaaataccgcacagatgcgtaaggagaaaataccgcatcaggcgccattcgccattcaggctgcgcaactgttgggaagggcgatcggtgcgggcctcttcgctattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgccagggttttcccagttacgacgttgtaaaacgacggccagtgaatt
材料和方法:
如下进行所述的构建体转染至293-6E细胞中。所用的细胞是指数生长期的HEK293-6E细胞(0.8至1.5×106细胞/ml),该细胞已经在培养物中传代少于30次;将培养物在新鲜生长培养基中培养至3×105细胞/ml浓度,每三天或四天。生长培养基是补充25ug/ml Geneticin(G418)(GIBCOTMCat.No.10131-027)和0.1%Pluronic F-68(表面活性剂,GIBCOTMCat.No.24040-032)的FreeStyleTM 293表达培养基(GIBCOTMCat.No.12338-018,Invitrogen,Carlsbad,CA)。转染培养基是具有10mM HEPES缓冲溶液ml(GIBCOTMCat.No.15630-080)终浓度的FreeStyleTM 293表达培养基(GIBCOTMCat.No.12338-018)。为了转染,加入选择的载体DNA来获得1μg(重链+轻链)/ml的浓度。接受基于最佳化实验的改变。PEI(聚氮丙啶),线性,25kD,1mg/ml无菌储液,pH7.0(Polysciences,Inc.,Warrington,PA)作为转染介质加入,DNA∶PEI比例为1∶2。所用的Feeding培养基是胰蛋白胨N1培养基(来自Organotchnie France的TN1粉,Cat No.19554,通过TekniScience Inc.Tel#1-800-267-9799可获得)。加入FreeStyleTM293表达培养基的5%w/v储液至0.5%的终浓度。通常使用标准实验室设备。使用Cedex细胞计数系统(Innovatis,Bielefeld,德国)。
如下在125ml锥形烧瓶中进行每个小规模的转染。将等份20ml的新鲜培养基培养1×106细胞/ml的活细胞。(标注:对于更大的体积,培养物应当是容器额定容量的20-25%,例如,500ml烧瓶中100ml培养物)。然后将培养物置于37℃培养箱中,使用5%CO2的潮湿大气和130rpm的转速。
通过在水浴中温热转染培养基至37℃,在室温融化冷冻的PEI储液和DNA溶液(储存在-20℃)来制备DNA-PEI复合物制剂。所用的DNA和PEI的量是基于待转染培养物的总体积。20ml培养物使用2.5mlDNA/PEI复合物,2.5ml Tn1需要总的25μg DNA和50μg PEI。通过混合12.5ml转染培养基至管A中来形成DNA∶PEI复合物(例如,用于十个转染),管A中已经加入了含有10μg/ml终浓度的选择的DNA载体的溶液,并且已经将12.5ml转染培养基加入PEI中(20μg/ml,终浓度)。在与DNA溶液混合之前,通过涡旋将PEI混合物混合约10秒钟。混合PEI和DNA混合物后,通过涡旋10秒钟来混合混合物。然后使混合物在室温静置15分钟(但不超过20分钟)。每20ml HEK-6E细胞加入2.5ml DNA∶PEI复合物溶液。转染后约20至24小时,将5%TN1上清液加入每个烧瓶中至0.5%的终浓度。
在第4天和第7天测定细胞密度和生活力。第4天时从2ml等份试样收集细胞沉淀,用于蛋白质印迹分析和Northern印迹分析。将沉淀在-80℃冷冻直至分析。转染后7天通过在1000rpm离心(10分钟)收集细胞,并使用前置过滤器滤纸和Corning 0.22μm CA过滤系统将上清液过滤。也将上清液样品存储在80℃直至分析,例如使用ELISA测试。
为了进行Northern印迹分析,如下所述从瞬时转染的293-6E细胞中分离出全部RNA。将冷冻的细胞沉淀在冰水融化。使用QiagenRneasy Mini Kit(Qiagen,cat.#74104),按照生产商的说明书,来纯化RNA。
甲醛/琼脂糖凝胶制备如下。将2克琼脂糖(Ambion,cat.#9040)在161.3ml蒸馏水中煮沸。加入4ml 1M MOPS(吗啉代丙烷磺酸)PH7.0,1ml 1M NaOAc,0.4ml 0.5M EDTA,并将混合物冷却至60℃。然后加入33.3ml 37%甲醛(J.T.Baker,cat#2106-01),并温和地混合熔化的琼脂糖溶液。倾倒凝胶且使其在通风橱中固化。
通过混合30ml 1M MOPS,pH 7.0,7ml 1M NaOAc,3ml 0.5M EDTA和DEPC(焦磷酸二乙酯)处理的dH2O至1.5来制备跑胶缓冲液。
通过混合3部分甲醛装载染料(Ambion,cat.#8552)和1部分RNA来制备RNA样品。每个泳道跑3至5μg RNA。使用的RNA分子量标记是0.5-10Kb梯度(Invitrogen,cat.#15623-200)。将样品在65℃加热5分钟来变性并在冰上冷却。然后将0.5μl 10μg/μl溴化乙锭(Pierce,cat.#17898)加入每个样品中。将每个样品简短离心来沉淀液体。
如下进行凝胶电泳。用跑胶缓冲液覆盖甲醛/琼脂糖凝胶,装载样品,然后在通风橱中150V跑胶2小时。使用紫外线投射法观察条带并拍照用于永久记录。
通过将凝胶在DEPC-处理的dH2O几次改变中浸泡五分钟来除去甲醛来进行毛细管转移。然后将凝胶在50mM NaOH,10mM NaCl中室温浸泡20分钟来进一步变性任何双链RNA。将凝胶将DEPC-处理的dH2O中漂洗一次,然后在20×SSC(175.3g NaCl;88.2g柠檬酸钠;用10M NaOH使pH至~7.0,体积调节至1L)中室温浸泡20分钟来中和。浸泡Hybond-N+膜(Amersham Bioscience,cat#RPN303B)并切割成和凝胶一样的大小,在DEPC-处理的dH2O中至湿润。将3M滤纸(Whatman cat#3030917)切割成与凝胶和膜一样的大小。通过将一层3M纸置于20×SSC存储器上方的固体支持物上来装配转移系统,使得纸通过顶部装配的层通过毛细作用带走20×SSC。将凝胶置于该芯上,将Hybond-N+膜,3层3M纸切割大小,和一厚叠凝胶印迹纸(Schleicher&Schuell,cat.#10427920)。将平的支持物置于厚叠的顶部,如果需要,并加上重量(通常是1升瓶装水),来确保有效的毛细管转移。使用塑料包来覆盖任何暴露于空气的存储器来防止蒸发。使转移在室温过夜进行。然后解开转移系统并将印迹浸泡在6×SSC中来除去任何琼脂糖。使膜空气干燥并暴露于UV来交联印迹。
DNA探针模板是D2E7重链和轻链的编码片段。使用AlkPhosDirect Labeling Reagents试剂盒(碱性磷酸酶标记系统,AmershamBiosciences,cat.#RPN3680)根据制造商的说明用碱性磷酸盐标记100ng所需的模板。使用和标记相同的试剂盒(含有杂交缓冲液)来进行预杂交和杂交步骤。将膜在杂交炉中在65℃预杂交至少1小时,然后将探针煮沸并直接加入预杂交缓冲液/印迹中。杂交在杂交炉中65℃进行过夜。滗去杂交溶液,并用2×SSC简短洗涤膜来除去杂交溶液,然后用2×SSC,0.1%SDS在65℃洗涤两次,每次15分钟,最后用0.1×SSC,0.1%SDS在65℃洗涤两次,每次15分钟。为了观察膜上的条带,使用化学发光。用CDP-Star检测试剂(碱性磷酸酶-从1,2-dioxetane底物的photope单独生产,Amersham Biociences,cat.#RPN3682)覆盖印迹,在室温持续5分钟。从印迹排出过多的试剂,然后将它们装入塑料层保护装置中。将印迹暴露于Kodak Biomax MR膜(x射线膜,Kodak,cat.#8952855),开始10秒钟至高达10分钟。使用Kodak M35A X-OMAT处理器(x射线展开仪/处理器)将膜展开。
如小制备用于蛋白质印迹的细胞沉淀样品。为了胞内抗体表达分析,将细胞在NP40裂解缓冲液(50mM Tris-HCl,pH7.5,150mM NaCl,1%NP40(辛基苯酚聚(ethyleneglycolether)),5mM BME和蛋白酶抑制剂混合物III中裂解,在冰上孵育10分钟。使用离心机在16,000rpm离心30分钟来收集用于膜的部分和可溶性蛋白质。将称为可溶性胞内或细胞质部分的上清液用于凝胶分析,添加含有DTT的SDS装载缓冲液。用等体积的裂解缓冲液悬浮沉淀,并加入含有DTT的SDS凝胶装载缓冲液。如下制备用于蛋白质印迹的培养物上清液样品。使用30,000道尔顿MW截留的Centricon Ultra(超滤装置,Millipore)将培养物上清液浓缩,或直接用于蛋白质印迹。为了免疫印迹(蛋白质印迹分析),将样品溶解于NUPAGE 4-12%Bis-Tris(聚丙烯酰胺)凝胶上并使用标准方法转移至PVDF膜上。将膜在阻断溶液(含有0.05%吐温20(聚氧乙烯脱水山梨醇单月桂酸酯)和5%奶粉的PBS)中孵育1h,洗涤,用来自DakoCytomation(丹麦)的以1∶1000稀释于PBST缓冲液中的多克隆兔子抗人IgG/HRP或多克隆兔子抗人κ轻链/HRP孵育,然后在室温的PBST的三次更换中再次洗涤。将来自GE/Amersham Biosciences(Piscataway,NJ)的ECL Plus蛋白质印迹检测(化学发光和化学荧光检测)系统用于检测。
使用标准方法进行ELISA测试,使用来自Southern Biotech(Birmingham,AL)的山羊抗人IgG,UNLB和山羊抗人IgG/HRP,PBS中的2%奶粉作为阻断缓冲液,K-Blue(3,3’,5,5’-四甲基联苯胺和过氧化氢(H2O2,Neogen,Lansing,MI)作为底物。使用Spectramax微平板阅读器在650nM的主波长和490nm的参照波长阅读平板。
使用标准方法亲和性纯化分泌的抗体,使用来自Invitrogen(Carlsbad,CA)的蛋白A琼脂糖珠,来自Pierce的免疫纯(A)IgG结合缓冲液,PBS,pH7.4作为洗涤缓冲液,和0.1M醋酸/150mM NaCl,pH3.5作为洗脱缓冲液(使用1M Tris pH 9.5中和的)。
完整分子量的测定。通过LC-MS分析从构建体pTT3HC-int-LCP.hori产生的D2E7样品的完整分子量。具有蛋白microtrap(MichromBioresources,Inc.cat.004/25109/03)的1100毛细管HPLC系统(AglientSN DE 14900659)用来脱盐并将样品引入Q Star Pulsar i质谱仪中(Applied Biosystems,SN K1820202)。为了洗脱样品,用缓冲液A(HPLC水中的0.08%FA,0.02%TFA)和缓冲液B(乙腈中0.08%FA和0.02%TFA)运行梯度,以50μL/min的流速,持续15分钟。
轻链和重链分子量的测定。通过LC-MS分析从构建体pTT3HC-int-LC P.hori产生的天然D2E7样品的完整分子量。在20mM DTT中在30℃进行连接轻链和重链的二硫键的还原30分钟。具有PLRP-S柱(Michrom Bioresources,Inc.8μm,4000,1.0×150mm,P/N901-00911-00)的1100毛细管HPLC系统(Aglient SN DE 14900659)用来分离轻链和重链并将它们引入Q Star Pulsar i质谱仪中(AppliedBiosystems,SN K1820202)。在60℃加热柱子。用缓冲液A(HPLC水中的0.08%FA,0.02%TFA)和缓冲液B(乙腈中0.08%FA和0.02%TFA)运行HPLC梯度,以50μL/min的流速,运行60分钟来洗脱样品。
限制性核酸内切酶来自New England Biolabs(Beverly,MA)。用于克隆的Custom寡核苷酸,DNA聚合酶,DNA连接酶和大肠杆菌菌株来自Invitrogen(Carlsbad,CA)。蛋白酶抑制剂混合物III来自Calbiochem(La Jolla,CA)。Qiagen(Valencia,CA)产物用于DNA连接和纯化。
关于引入作为参考文献和变化的陈述
在整个申请中提及的所有参考文献,例如,专利文件,包括颁布或授权的专利或等价物;专利申请公开;未公开的专利申请;和非专利文献文件或其他来源的材料;在此以其整体引入作为参考,如同单独引入作为参考一样。在所引用的参考文献和本申请公开内容之间任何矛盾的情况中,在此的公开内容优先。在此提供的一些参考文献引入作为参考来提供信息,例如,关于本发明的原料来源,其他原料,其他试剂,其他合成方法,其他分析方法,其它生物材料,其它细胞和其他用途的详细内容。
在此提及的所有专利和出版物表示本发明所属领域技术人员的技术水平。在此所引用的参考文献表示公开或申请日时的现有技术,并且确定在此可以使用该信息,如果需要,排除具有资格的现有技术中的特定实施方案。例如,当在此要求物质的组成时,应当理解在此要求的物质组成中不打算包括已知的并按照关于申请人发明的有资格的现有技术可以获得的化合物,包括为此在此引用的参考文献中提供了授权公开内容的化合物。
在此的任何附录或附加内容引入作为参考,作为说明书和/或附图的一部分。
在此所用的术语“包括”,“包含”,“含有”或“是包括”,将它们解释为详细说明所述特征,整体,步骤或组成部分的存在,但不排除一个或多个其他特征,整体,步骤或组成部分或其组的存在或添加。因此,如在此所用的,包含与包括、含有、具有或特征在于是同义词,并且是包括式的或开放式的。如在此所用的,“由......组成”排除权利要求描述中没有具体说明的任何要素,步骤和成分等。如在此所用的“基本上由......组成”没有排除没有显著影响权利要求基本和新的特征的物质或步骤(例如,关于活性成分)。在在此的每个情况中,术语“包括”、“基本上由......组成”和“由......组成”中的任何一个可以由其他两个术语中的任一个替代,因此公开了不必定是共生的分开的实施方案和/或范围。可以在在此没有特异性公开的任何要素或限制不存在下实践在此适当地说明性描述的本发明。
无论何时在此公开的范围,例如,温度范围,时间范围,组成或浓度范围,或其他数值范围等,确定公开内容中包括给定的范围中包括的所有中间范围和子范围以及所有单个数值。本发明不受公开的实施方案的限制,包括附图中所示的或说明书中举例说明的任何内容,其通过实施例或说明给出并且没有限制。将理解在此描述中包括的范围或子范围中的任何子范围或单个数值可以从在此的权利要求中排除出去。
已经参照各种特定的和/或优选的实施方案和技术描述了本发明。然而,应当理解可以形成许多变化和改变,同时保持在本发明的精神和范围内。本领域技术人员将清楚在此特意公开的那些以外的组合物,方法,装置,装置部件,材料,程序和技术可以用于本发明的实践中,如在此宽泛地公开的而没有采取不适当的实验;例如,这可以延伸至特意举例说明的那些以外的原料,生物材料,试剂,合成方法,纯化方法,分析方法,测试方法和生物方法。本发明包括在此之前所述的所有本领域已知的功能性等价物(例如,组合物,方法,装置,装置部件,材料,程序和技术等)。已经使用的术语和表述可以用作说明的术语并且没有限制,不存在使用这样的术语和表述排除所示和所述特征的任何等价物或其部分的意图,而是认识到各种改变在所要求的本发明的范围内是可能的。因此,应当理解尽管已经通过实施方案,优选实施方案和任选的特征特意公开了本发明,本领域技术人员可以采取在此公开的概念的改变和变化,并且认为这样的改变和变化是在所附权利要求限定的本发明范围之内的。
其他参考文献
US 6258562,US 6090382;US 6455275;EP1080206B1;WO 9960135;US 5912167;US 5162601;WO 199521249A1;US 5149783;US 5955072;US5532142;US 20040224391;US 6537806;US 5846767;US 20030099932;WO9958663;US 20030157641;US 2003048306A2;US 6114146;US 6060273;US5925565;US 20040241821;WO 2003100021A2;WO 2003100022A2;US20040265955;US 20050003482;US 20050042721;WO 2005017149;WO2004113493;US 20050136035;WO 2004108893;US 6692736;US 20050147962;US 6331415;US 6632637;US 20040063186;US 7026526;US 6365377;WO2005123915;US 5665567;WO 9741241A1;EP 0701616B1;US 20060010506;WO2006048459;US 6852510;WO 2005072129;US 5648254;US 6908751;US20050221429;WO 2005071088;WO 2005108585;WO 2005085456;US 7029876;US 6638762;US 6544780;US 5519164;WO 2003031630;US 6294353;WO2005047512;US 7052905;US 7018833;US 20020034814;US 20040126883;US20050002907;US 20050112095;US 20050214258;EP 0598029
Mathys S等,1999,Gene 231(1-2):1-13,Characterization of a self-splicing mini-intein and its conversion into autocatalytic N-andC-terminal cleavage elements:facile production of protein building blocksfor protein ligation。(自我剪接迷你蛋白内含子的特征及其转化成自催化的N-和C-端裂解序列:用于蛋白质连接的蛋白质砌块的易化产生)。
序列表
<110>(APPLICANT)Abbott Laboratories
     (AGENT)Greenlee,Winner and Sullivan,P.C.
     CARSON,Gerald R.
     GION,Wendy
     SALFELD,Jochen G.
     GU,Jijie
     REGIER,Dean A.
     KUNES,Yune
<120>包括SORF构建体的多基因表达和使用多蛋白、前体蛋白和蛋白酶解的方法
<130>74-05_WO
<140>PCT/US 06/______________(to is assigned)
<141>2006-07-21
<150>US 60/701,855
<151>2005-07-21
<160>158
<170>PatentIn version 3.3
<210>1
<211>4
<212>PRT
<213>人造
<220>
<223>合成:弗林蛋白酶的裂解识别位点。
<220>
<221>MISC_FEATURE
<222>(2)..(3)
<223>在位置2,Xaa可以是任何氨基酸,在位置3,Xaa
     可以是Arg或Lys.
<400>1
Arg Xaa Xaa Arg
1
<210>2
<211>5
<212>PRT
<213>人造
<220>
<223>IPNV的VP4的识别序列。
<220>
<221>MISC_FEATURE
<222>(1)..(4)
<223>在位置1,Xaa可以是Ser或Thr,在位置4,Xaa可以
     是Ser或Ala.
<400>2
Xaa Xaa Ala Xaa Gly
1                5
<210>3
<211>7
<212>PRT
<213>人造
<220>
<223>TEV蛋白酶的识别序列。
<220>
<221>misc_feature
<222>(2)..(3)
<223>Xaa可以是任何天然产生的氨基酸
<220>
<221>misc_feature
<222>(5)..(5)
<223>Xaa可以是任何天然产生的氨基酸
<400>3
Glu Xaa Xaa Tyr Xaa Gln Gly
1                5
<210>4
<211>8
<212>PRT
<213>人造
<220>
<223>鼻病毒3C蛋白酶的识别位点
<400>4
Leu Glu Val Leu Phe Gln Gly Pro
1                5
<210>5
<211>6
<212>PRT
<213>人造
<220>
<223>PC5/6蛋白质酶,LPC/PC7蛋白酶和肠激酶的识别序列。
<220>
<221>MISC_FEATURE
<222>(6)..(6)
<223>Xaa可以是任何氨基酸。
<400>5
Asp Asp Asp Asp Lys Xaa
1                5
<210>6
<211>5
<212>PRT
<213>人造
<220>
<223>因子Xa蛋白质酶的识别序列
<220>
<221>MISC_FEATURE
<222>(2)..(5)
<223>在位置2Xaa是Glu或Asp,在位置5Xaa可以是任何氨基酸。
<400>6
Ile Xaa Gly Arg Xaa
1                5
<210>7
<211>7
<212>PRT
<213>人造
<220>
<223>凝血酶的识别序列。
<400>7
Leu Val Gly Pro Arg Gly Ser
1                5
<210>8
<211>6
<212>PRT
<213>人造
<220>
<223>genenase I的识别序列。
<400>8
Pro Gly Ala Ala His Tyr
1                5
<210>9
<211>7
<212>PRT
<213>人造
<220>
<223>MMP蛋白酶,芜菁花叶病毒和KEX2蛋白酶的识别序列
<400>9
Met Tyr Lys Arg Glu Ala Asp
1                5
<210>10
<211>4
<212>PRT
<213>人造
<220>
<223>将蛋白靶向Trans Golgi网络的弗林蛋白酶的氨基酸序列。
<400>10
Glu Glu Asp Glu
1
<210>11
<211>24
<212>PRT
<213>人造
<220>
<223>C型流感病毒的内部可裂解信号肽。
<400>11
Met Gly Arg Met Ala Met Lys Trp Leu Val Val Ile Ile Cys Phe Ser
1               5                   10                  15
Ile Thr Ser Gln Pro Ala Ser Ala
            20
<210>12
<211>19
<212>PRT
<213>人造
<220>
<223>FMDV 2A序列
<400>12
Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn
1               5                   10                  15
Pro Gly Pro
<210>13
<211>19
<212>PRT
<213>人造
<220>
<223>FMDV 2A序列.
<400>13
Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn
1               5                   10                  15
Pro Gly Pro
<210>14
<211>14
<212>PRT
<213>人造
<220>
<223>FDMV 2A序列.
<400>14
Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro
1               5                   10
<210>15
<211>20
<212>PRT
<213>人造
<220>
<223>2A序列的变体。
<400>15
Gln Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser
1               5                   10                  15
Asn Pro Gly Pro
            20
<210>16
<211>19
<212>PRT
<213>人造
<220>
<223>2A序列的变体。
<400>16
Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly
1               5                   10                  15
Pro Phe Phe
<210>17
<211>14
<212>PRT
<213>人造
<220>
<223>2A序列的变体。
<400>17
Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro
1               5                   10
<210>18
<211>17
<212>PRT
<213>人造
<220>
<223>2A序列的变体。
<400>18
Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly
1               5                   10                  15
Pro
<210>19
<211>24
<212>PRT
<213>人造
<220>
<223>2A序列的变体。
<400>19
Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly
1               5                   10                  15
Asp Val Glu Ser Asn Pro Gly Pro
            20
<210>20
<211>58
<212>PRT
<213>人造
<220>
<223>2A序列的变体。
<400>20
Val Thr Glu Leu Leu Tyr Arg Met Lys Arg Ala Glu Thr Tyr Cys Pro
1               5                   10                  15
Arg Pro Leu Leu Ala Ile His Pro Thr Glu Ala Arg His Lys Gln Lys
            20                  25                  30
Ile Val Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu
        35                  40                  45
Ala Gly Asp Val Glu Ser Asn Pro Gly Pro
    50                  55
<210>21
<211>10
<212>PRT
<213>人造
<220>
<223>D2E7免疫球蛋白重链的N-端序列。
<400>21
Glu Val Gln Leu Val Glu Ser Gly Gly Gly
1               5                   10
<210>22
<211>10
<212>PRT
<213>人造
<220>
<223>D2E7免疫球蛋白轻链的N-端序列。
<400>22
Asp Ile Gln Met Thr Gln Ser Pro Ser Ser
1               5                   10
<210>23
<211>22
<212>PRT
<213>人造
<220>
<223>D2E7轻链信号序列。
<400>23
Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp
1               5                   10                  15
Phe Pro Gly Ser Arg Cys
            20
<210>24
<211>20
<212>PRT
<213>人造
<220>
<223>构建体H中D2E7信号肽序列。
<400>24
Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Asp Glu Trp Phe Pro
1               5                   10                  15
Gly Ser Arg Cys
            20
<210>25
<211>15
<212>PRT
<213>人造
<220>
<223>构建体J中蛋白内含子结束处和轻链蛋白开始处的氨基酸序列。
<400>25
Met Asp Met Arg Val Pro Ala Gln Trp Phe Pro Gly Ser Arg Cys
1               5                   10                  15
<210>26
<211>10
<212>PRT
<213>人造
<220>
<223>构建体H中轻链的N-端序列。
<400>26
Met Asp Met Arg Val Pro Ala Gln Leu Leu
1               5                   10
<210>27
<211>22
<212>PRT
<213>人造
<220>
<223>构建体L中蛋白内含子后的氨基酸序列。
<400>27
Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp
1               5                   10                  15
Phe Pro Gly Ser Gly Gly
            20
<210>28
<211>10
<212>PRT
<213>人造
<220>
<223>信号肽酶裂解位点序列。
<400>28
Leu Ala Gly Phe Ala Thr Val Ala Gln Ala
1               5                   10
<210>29
<211>2925
<212>DNA
<213>人造
<220>
<223>合成构建体,D2E7 LC-LC-HC多聚蛋白编码序列。
<220>
<221>CDS
<222>(1)..(2922)
<400>29
atg gac atg cgc gtg ccc gcc cag ctg ctg ggc ctg ctg ctg ctg tgg    48
Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp
1               5                   10                  15
ttc ccc ggc tcg cga tgc gac atc cag atg acc cag tct cca tcc tcc    96
Phe Pro Gly Ser Arg Cys Asp Ile Gln Met Thr Gln Ser Pro Ser Ser
            20                  25                  30
ctg tct gca tct gta ggg gac aga gtc acc atc act tgt cgg gca agt    144
Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser
        35                  40                  45
cag ggc atc aga aat tac tta gcc tgg tat cag caa aaa cca ggg aaa    192
Gln Gly Ile Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys
    50                  55                  60
gcc cct aag ctc ctg atc tat gct gca tcc act ttg caa tca ggg gtc    240
Ala Pro Lys Leu Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val
65                  70                  75                  80
cca tct cgg ttc agt ggc agt gga tct ggg aca gat ttc act ctc acc    288
Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr
                85                  90                  95
atc agc agc cta cag cct gaa gat gtt gca act tat tac tgt caa agg    336
Ile Ser Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg
            100                 105                 110
tat aac cgt gca ccg tat act ttt ggc cag ggg acc aag gtg gaa atc    384
Tyr Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile
        115                 120                 125
aaa cgt acg gtg gct gca cca tct gtc ttc atc ttc ccg cca tct gat    432
Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp
    130                 135                 140
gag cag ttg aaa tct gga act gcc tct gtt gtg tgc ctg ctg aat aac    480
Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn
145                 150                 155                 160
ttc tat ccc aga gag gcc aaa gta cag tgg aag gtg gat aac gcc ctc    528
Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu
                165                 170                 175
caa tcg ggt aac tcc cag gag agt gtc aca gag cag gac agc aag gac    576
Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp
            180                 185                 190
agc acc tac agc ctc agc agc acc ctg acg ctg agc aaa gca gac tac    624
Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr
        195                 200                 205
gag aaa cac aaa gtc tac gcc tgc gaa gtc acc ca  cag ggc ctg agc    672
Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser
    210                 215                 220
tcg ccc gtc aca aag agc ttc aac agg gga agg tgt aag aga ctt ctc    720
Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Arg Cys Lys Arg Leu Leu
225                 230                 235                 240
aag ttg gca gga gac gtt gag tcc aac cct ggg ccc atg gac atg cgc    768
Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro Met Asp Met Arg
                245                 250                 255
gtg ccc gcc cag ctg ctg ggc ctg ctg ctg ctg tgg ttc ccc ggc tcg    816
Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe Pro Gly Ser
            260                 265                 270
cga tgc gac atc cag atg acc cag tct cca tcc tcc ctg tct gca tct    864
Arg Cys Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser
        275                 280                 285
gta ggg gac aga gtc acc atc act tgt cgg gca agt cag ggc atc aga    912
Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Arg
    290                 295                 300
aat tac tta gcc tgg tat cag caa aaa cca ggg aaa gcc cct aag ctc    960
Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu
305                 310                 315                 320
ctg atc tat gct gca tcc act ttg caa tca ggg gtc cca tct cgg ttc    1008
Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val Pro Ser Arg Phe
                325                 330                 335
agt ggc agt gga tct ggg aca gat ttc act ctc acc atc agc agc cta    1056
Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu
            340                 345                 350
cag cct gaa gat gtt gca act tat tac tgt caa agg tat aac cgt gca    1104
Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg Tyr Asn Arg Ala
        355                 360                 365
ccg tat act ttt ggc cag ggg acc aag gtg gaa atc aaa cgt acg gtg    1152
Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val
    370                 375                 380
gct gca cca tct gtc ttc atc ttc ccg cca tct gat gag cag ttg aaa    1200
Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys
385                 390                 395                 400
tct gga act gcc tct gtt gtg tgc ctg ctg aat aac ttc tat ccc aga    1248
Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg
                405                 410                 415
gag gcc aaa gta cag tgg aag gtg gat aac gcc ctc caa tcg ggt aac    1296
Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn
            420                 425                 430
tcc cag gag agt gtc aca gag cag gac agc aag gac agc acc tac agc    1344
Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser
        435                 440                 445
ctc agc agc acc ctg acg ctg agc aaa gca gac tac gag aaa cac aaa    1392
Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys
    450                 455                 460
gtc tac gcc tgc gaa gtc acc cat cag ggc ctg agc tcg ccc gtc aca    1440
Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr
4654                 70                 475                 480
aag agc ttc aac agg gga agg tgt aag aga ctt ctc aag ttg gca gga    1488
Lys Ser Phe Asn Arg Gly Arg Cys Lys Arg Leu Leu Lys Leu Ala Gly
                485                 490                 495
gac gtt gag tcc aac cct ggg ccc atg gag ttt ggg ctg agc tgg ctt    1536
Asp Val Glu Ser Asn Pro Gly Pro Met Glu Phe Gly Leu Ser Trp Leu
            500                 505                 510
ttt ctt gtc gcg att tta aaa ggt gtc cag tgt gag gtg cag ctg gtg    1584
Phe Leu Val Ala Ile Leu Lys Gly Val Gln Cys Glu Val Gln Leu Val
        515                 520                 525
gag tct ggg gga ggc ttg gta cag ccc ggc agg tcc ctg aga ctc tcc    1632
Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Arg Ser Leu Arg Leu Ser
    530                 535                 540
tgt gcg gcc tct gga ttc acc ttt gat gat tat gcc atg cac tgg gtc    1680
Cys Ala Ala Ser Gly Phe Thr Phe Asp Asp Tyr Ala Met His Trp Val
545                 550                 555                 560
cgg caa gct cca ggg aag ggc ctg gaa tgg gtc tca gct atc act tgg    1728
Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val Ser Ala Ile Thr Trp
                565                 570                 575
aat agt ggt cac ata gac tat gcg gac tct gtg gag ggc cga ttc acc    1776
Asn Ser Gly His Ile Asp Tyr Ala Asp Ser Val Glu Gly Arg Phe Thr
            580                 585                 590
atc tcc aga gac aac gcc aag aac tcc ctg tat ctg caa atg aac agt    1824
Ile Ser Arg Asp Asn Ala Lys Asn Ser Leu Tyr Leu Gln Met Asn Ser
        595                 600                 605
ctg aga gct gag gat acg gcc gta tat tac tgt gcg aaa gtc tcg tac    1872
Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys Ala Lys Val Ser Tyr
    610                 615                 620
ctt agc acc gcg tcc tcc ctt gac tat tgg ggc caa ggt acc ctg gtc    1920
Leu Ser Thr Ala Ser Ser Leu Asp Tyr Trp Gly Gln Gly Thr Leu Val
6256                 30                 635                 640
acc gtc tcg agt gcg tcg acc aag ggc cca tcg gtc ttc ccc ctg gca    1968
Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala
                645                 650                 655
ccc tcc tcc aag agc acc tct ggg ggc aca gcg gcc ctg ggc tgc ctg    2016
Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu
            660                 665                 670
gtc aag gac tac ttc ccc gaa ccg gtg acg gtg tcg tgg aac tca ggc    2064
Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly
        675                 680                 685
gcc ctg acc agc ggc gtg cac acc ttc ccg gct gtc cta cag tcc tca    2112
Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser
    690                 695                 700
gga ctc tac tcc ctc agc agc gtg gtg acc gtg ccc tcc agc agc ttg    2160
Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu
705                 710                 715                 720
ggc acc cag acc tac atc tgc aac gtg aat cac aag ccc agc aac acc    2208
Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr
                725                 730                 735
aag gtg gac aag aaa gtt gag ccc aaa tct tgt gac aaa act cac aca    2256
Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr
            740                 745                 750
tgc cca ccg tgc cca gca cct gaa ctc ctg ggg gga ccg tca gtc ttc    2304
Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe
        755                 760                 765
ctc ttc ccc cca aaa ccc aag gac acc ctc atg atc tcc cgg acc cct    2352
Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro
    770                 775                 780
gag gtc aca tgc gtg gtg gtg gac gtg agc cac gaa gac cct gag gtc    2400
Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val
785                 790                 795                 800
aag ttc aac tgg tac gtg gac ggc gtg gag gtg cat aat gcc aag aca    2448
Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr
                805                 810                 815
aag ccg cgg gag gag cag tac aac agc acg tac cgt gtg gtc agc gtc    2496
Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val
            820                 825                 830
ctc acc gtc ctg cac cag gac tgg ctg aat ggc aag gag tac aag tgc    2544
Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys
        835                 840                 845
aag gtc tcc aac aaa gcc ctc cca gcc ccc atc gag aaa acc atc tcc    2592
Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser
    850                 855                 860
aaa gcc aaa ggg cag ccc cga gaa cca cag gtg tac acc ctg ccc cca    2640
Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro
865                 870                 875                 880
tcc cgg gat gag ctg acc aag aac cag gtc agc ctg acc tgc ctg gtc    2688
Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val
                885                 890                 895
aaa ggc ttc tat ccc agc gac atc gcc gtg gag tgg gag agc aat ggg    2736
Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly
            900                 905                 910
cag ccg gag aac aac tac aag acc acg cct ccc gtg ctg gac tcc gac    2784
Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp
        915                 920                 925
ggc tcc ttc ttc ctc tac agc aag ctc acc gtg gac aag agc agg tgg    2832
Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp
    930                 935                 940
cag cag ggg aac gtc ttc tca tgc tcc gtg atg cat gag gct ctg cac    2880
Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His
945                 950                 955                 960
aac cac tac acg cag aag agc ctc tcc ctg tct ccg ggt aaa tga        2925
Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
                965                 970
<210>30
<211>974
<212>PRT
<213>人造
<220>
<223>合成构建体
<400>30
Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp
1               5                   10                  15
Phe Pro Gly Ser Arg Cys Asp Ile Gln Met Thr Gln Ser Pro Ser Ser
            20                  25                  30
Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser
        35                  40                  45
Gln Gly Ile Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys
    50                  55                  60
Ala Pro Lys Leu Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val
65                  70                  75                  80
Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr
                85                  90                  95
Ile Ser Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg
            100                 105                 110
Tyr Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile
        115                 120                 125
Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp
    130                 135                 140
Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn
145                 150                 155                 160
Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu
                165                 170                 175
Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp
            180                 185                 190
Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr
        195                 200                 205
Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser
    210                 215                 220
Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Arg Cys Lys Arg Leu Leu
225                 230                 235                 240
Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly Pro Met Asp Met Arg
                245                 250                 255
Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe Pro Gly Ser
            260                 265                 270
Arg Cys Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser
        275                 280                 285
Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Arg
    290                 295                 300
Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu
305                 310                 315                 320
Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val Pro Ser Arg Phe
                325                 330                 335
Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu
            340                 345                 350
Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg Tyr Asn Arg Ala
        355                 360                 365
Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val
    370                 375                 380
Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys
385                 390                 395                 400
Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg
                405                 410                 415
Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn
            420                 425                 430
Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser
        435                 440                 445
Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys
    450                 455                 460
Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr
465                 470                 475                 480
Lys Ser Phe Asn Arg Gly Arg Cys Lys Arg Leu Leu Lys Leu Ala Gly
                485                 490                 495
Asp Val Glu Ser Asn Pro Gly Pro Met Glu Phe Gly Leu Ser Trp Leu
            500                 505                 510
Phe Leu Val Ala Ile Leu Lys Gly Val Gln Cys Glu Val Gln Leu Val
        515                 520                 525
Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Arg Ser Leu Arg Leu Ser
    530                 535                 540
Cys Ala Ala Ser Gly Phe Thr Phe Asp Asp Tyr Ala Met His Trp Val
545                 550                 555                 560
Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val Ser Ala Ile Thr Trp
                565                 570                 575
Asn Ser Gly His Ile Asp Tyr Ala Asp Ser Val Glu Gly Arg Phe Thr
            580                 585                 590
Ile Ser Arg Asp Asn Ala Lys Asn Ser Leu Tyr Leu Gln Met Asn Ser
        595                 600                 605
Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys Ala Lys Val Ser Tyr
    610                 615                 620
Leu Ser Thr Ala Ser Ser Leu Asp Tyr Trp Gly Gln Gly Thr Leu Val
625                 630                 635                 640
Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala
                645                 650                 655
Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu
            660                 665                 670
Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly
        675                 680                 685
Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser
    690                 695                 700
Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu
705                 710                 715                 720
Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr
                725                 730                 735
Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr
            740                 745                 750
Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe
        755                 760                 765
Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro
    770                 775                 780
Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val
785                 790                 795                 800
Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr
                805                 810                 815
Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val
            820                 825                 830
Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys
        835                 840                 845
Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser
    850                 855                 860
Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro
865                 870                 875                 880
Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val
                885                 890                 895
Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly
            900                 905                 910
Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp
        915                 920                 925
Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp
    930                 935                 940
Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His
945                 950                 955                 960
Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
                965                 970
<210>31
<211>10323
<212>DNA
<213>人造
<220>
<223>合成构建体,D2E7LC-LC-HC多聚蛋白表达载体。
<400>31
gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc    60
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat    120
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc    180
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga    240
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg    300
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat    360
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt    420
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc    480
cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg    540
tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg    600
aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg    660
gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag    720
gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc    780
tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa    840
actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact    900
ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt    960
ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca    1020
aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt    1080
ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga    1140
tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca    1200
ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggac    1260
atgcgcgtgc ccgcccagct gctgggcctg ctgctgctgt ggttccccgg ctcgcgatgc    1320
gacatccaga tgacccagtc tccatcctcc ctgtctgcat ctgtagggga cagagtcacc    1380
atcacttgtc gggcaagtca gggcatcaga aattacttag cctggtatca gcaaaaacca    1440
gggaaagccc ctaagctcct gatctatgct gcatccactt tgcaatcagg ggtcccatct    1500
cggttcagtg gcagtggatc tgggacagat ttcactctca ccatcagcag cctacagcct    1560
gaagatgttg caacttatta ctgtcaaagg tataaccgtg caccgtatac ttttggccag    1620
gggaccaagg tggaaatcaa acgtacggtg gctgcaccat ctgtcttcat cttcccgcca    1680
tctgatgagc agttgaaatc tggaactgcc tctgttgtgt gcctgctgaa taacttctat    1740
cccagagagg ccaaagtaca gtggaaggtg gataacgccc tccaatcggg taactcccag    1800
gagagtgtca cagagcagga cagcaaggac agcacctaca gcctcagcag caccctgacg    1860
ctgagcaaag cagactacga gaaacacaaa gtctacgcct gcgaagtcac ccatcagggc    1920
ctgagctcgc ccgtcacaaa gagcttcaac aggggaaggt gtaagagact tctcaagttg    1980
gcaggagacg ttgagtccaa ccctgggccc atggacatgc gcgtgcccgc ccagctgctg    2040
ggcctgctgc tgctgtggtt ccccggctcg cgatgcgaca tccagatgac ccagtctcca    2100
tcctccctgt ctgcatctgt aggggacaga gtcaccatca cttgtcgggc aagtcagggc    2160
atcagaaatt acttagcctg gtatcagcaa aaaccaggga aagcccctaa gctcctgatc    2220
tatgctgcat ccactttgca atcaggggtc ccatctcggt tcagtggcag tggatctggg    2280
acagatttca ctctcaccat cagcagccta cagcctgaag atgttgcaac ttattactgt    2340
caaaggtata accgtgcacc gtatactttt ggccagggga ccaaggtgga aatcaaacgt    2400
acggtggctg caccatctgt cttcatcttc ccgccatctg atgagcagtt gaaatctgga    2460
actgcctctg ttgtgtgcct gctgaataac ttctatccca gagaggccaa agtacagtgg    2520
aaggtggata acgccctcca atcgggtaac tcccaggaga gtgtcacaga gcaggacagc    2580
aaggacagca cctacagcct cagcagcacc ctgacgctga gcaaagcaga ctacgagaaa    2640
cacaaagtct acgcctgcga agtcacccat cagggcctga gctcgcccgt cacaaagagc    2700
ttcaacaggg gaaggtgtaa gagacttctc aagttggcag gagacgttga gtccaaccct    2760
gggcccatgg agtttgggct gagctggctt tttcttgtcg cgattttaaa aggtgtccag    2820
tgtgaggtgc agctggtgga gtctggggga ggcttggtac agcccggcag gtccctgaga    2880
ctctcctgtg cggcctctgg attcaccttt gatgattatg ccatgcactg ggtccggcaa    2940
gctccaggga agggcctgga atgggtctca gctatcactt ggaatagtgg tcacatagac    3000
tatgcggact ctgtggaggg ccgattcacc atctccagag acaacgccaa gaactccctg    3060
tatctgcaaa tgaacagtct gagagctgag gatacggccg tatattactg tgcgaaagtc    3120
tcgtacctta gcaccgcgtc ctcccttgac tattggggcc aaggtaccct ggtcaccgtc    3180
tcgagtgcgt cgaccaaggg cccatcggtc ttccccctgg caccctcctc caagagcacc    3240
tctgggggca cagcggccct gggctgcctg gtcaaggact acttccccga accggtgacg    3300
gtgtcgtgga actcaggcgc cctgaccagc ggcgtgcaca ccttcccggc tgtcctacag    3360
tcctcaggac tctactccct cagcagcgtg gtgaccgtgc cctccagcag cttgggcacc    3420
cagacctaca tctgcaacgt gaatcacaag cccagcaaca ccaaggtgga caagaaagtt    3480
gagcccaaat cttgtgacaa aactcacaca tgcccaccgt gcccagcacc tgaactcctg    3540
gggggaccgt cagtcttcct cttcccccca aaacccaagg acaccctcat gatctcccgg    3600
acccctgagg tcacatgcgt ggtggtggac gtgagccacg aagaccctga ggtcaagttc    3660
aactggtacg tggacggcgt ggaggtgcat aatgccaaga caaagccgcg ggaggagcag    3720
tacaacagca cgtaccgtgt ggtcagcgtc ctcaccgtcc tgcaccagga ctggctgaat    3780
ggcaaggagt acaagtgcaa ggtctccaac aaagccctcc cagcccccat cgagaaaacc    3840
atctccaaag ccaaagggca gccccgagaa ccacaggtgt acaccctgcc cccatcccgg    3900
gatgagctga ccaagaacca ggtcagcctg acctgcctgg tcaaaggctt ctatcccagc    3960
gacatcgccg tggagtggga gagcaatggg cagccggaga acaactacaa gaccacgcct    4020
cccgtgctgg actccgacgg ctccttcttc ctctacagca agctcaccgt ggacaagagc    4080
aggtggcagc aggggaacgt cttctcatgc tccgtgatgc atgaggctct gcacaaccac    4140
tacacgcaga agagcctctc cctgtctccg ggtaaatgag aattagtcta ctcgcaaggg    4200
gcggccgcgt ttaaactgaa tgagcgcgtc catccagaca tgataagata cattgatgag    4260
tttggacaaa ccacaactag aatgcagtga aaaaaatgct ttatttgtga aatttgtgat    4320
gctattgctt tatttgtaac cattataagc tgcaataaac aagttaacaa caacaattgc    4380
attcatttta tgtttcaggt tcagggggag gtgtgggagg ttttttaaag caagtaaaac    4440
ctctacaaat gtggtatggc tgattatgat ccggctgcct cgcgcgtttc ggtgatgacg    4500
gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg    4560
ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggcgcag    4620
ccatgaccgg tcgacggcgc gccttttttt ttaattttta ttttatttta tttttgacgc    4680
gccgaaggcg cgatctgagc tcggtacagc ttggctgtgg aatgtgtgtc agttagggtg    4740
tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc    4800
agcaaccagg tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca    4860
tctcaattag tcagcaacca tagtcccgcc cctaactccg cccatcccgc ccctaactcc    4920
gcccagttcc gcccattctc cgccccatgg ctgactaatt ttttttattt atgcagaggc    4980
cgaggccgcc tcggcctctg agctattcca gaagtagtga ggaggctttt ttggaggcct    5040
aggcttttgc aaaaagctcc tcgaggaact gaaaaaccag aaagttaact ggtaagttta    5100
gtctttttgt cttttatttc aggtcccgga tccggtggtg gtgcaaatca aagaactgct    5160
cctcagtgga tgttgccttt acttctaggc ctgtacggaa gtgttacttc tgctctaaaa    5220
gctgcggaat tgtacccgcg gcctaatacg actcactata gggactagta tggttcgacc    5280
attgaactgc atcgtcgccg tgtcccaaaa tatggggatt ggcaagaacg gagacctacc    5340
ctggcctccg ctcaggaacg agttcaagta cttccaaaga atgaccacaa cctcttcagt    5400
ggaaggtaaa cagaatctgg tgattatggg taggaaaacc tggttctcca ttcctgagaa    5460
gaatcgacct ttaaaggaca gaattaatat agttctcagt agagaactca aagaaccacc    5520
acgaggagct cattttcttg ccaaaagttt agatgatgcc ttaagactta ttgaacaacc    5580
ggaattggca agtaaagtag acatggtttg gatagtcgga ggcagttctg tttaccagga    5640
agccatgaat caaccaggcc acctcagact ctttgtgaca aggatcatgc aggaatttga    5700
aagtgacacg tttttcccag aaattgattt ggggaaatat aaacttctcc cagaataccc    5760
aggcgtcctc tctgaggtcc aggaggaaaa aggcatcaag tataagtttg aagtctacga    5820
gaagaaagac taagcggccg agcgcgcgga tctggaaacg ggagatgggg gaggctaact    5880
gaagcacgga aggagacaat accggaagga acccgcgcta tgacggcaat aaaaagacag    5940
aataaaacgc acgggtgttg ggtcgtttgt tcataaacgc ggggttcggt cccagggctg    6000
gcactctgtc gataccccac cgagacccca ttggggccaa tacgcccgcg tttcttcctt    6060
ttccccaccc caccccccaa gttcgggtga aggcccaggg ctcgcagcca acgtcggggc    6120
ggcaggccct gccatagcca ctggccccgt gggttaggga cggggtcccc catggggaat    6180
ggtttatggt tcgtgggggt tattattttg ggcgttgcgt ggggtctgga gatcccccgg    6240
gctgcaggaa ttccgttaca ttacttacgg taaatggccc gcctggctga ccgcccaacg    6300
acccccgccc attgacgtca ataatgacgt atgttcccat agtaacgcca atagggactt    6360
tccattgacg tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag    6420
tgtatcatat gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc    6480
attatgccca gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag    6540
tcatcgctat taccatggtg atgcggtttt ggcagtacat caatgggcgt ggatagcggt    6600
ttgactcacg gggatttcca agtctccacc ccattgacgt caatgggagt ttgttttggc    6660
accaaaatca acgggacttt ccaaaatgtc gtaacaactc cgccccattg acgcaaaagg    6720
gcgggaattc gagctcggta ctcgagcggt gttccgcggt cctcctcgta tagaaactcg    6780
gaccactctg agacgaaggc tcgcgtccag gccagcacga aggaggctaa gtgggagggg    6840
tagcggtcgt tgtccactag ggggtccact cgctccaggg tgtgaagaca catgtcgccc    6900
tcttcggcat caaggaaggt gattggttta taggtgtagg ccacgtgacc gggtgttcct    6960
gaaggggggc tataaaaggg ggtgggggcg cgttcgtcct cactctcttc cgcatcgctg    7020
tctgcgaggg ccagctgttg ggctcgcggt tgaggacaaa ctcttcgcgg tctttccagt    7080
actcttggat cggaaacccg tcggcctccg aacggtactc cgccaccgag ggacctgagc    7140
gagtccgcat cgaccggatc ggaaaacctc tcgactgttg gggtgagtac tccctctcaa    7200
aagcgggcat gacttctgcg ctaagattgt cagtttccaa aaacgaggag gatttgatat    7260
tcacctggcc cgcggtgatg cctttgaggg tggccgcgtc catctggtca gaaaagacaa    7320
tctttttgtt gtcaagcttg aggtgtggca ggcttgagat ctggccatac acttgagtga    7380
caatgacatc cactttgcct ttctctccac aggtgtccac tcccaggtcc aaccggaatt    7440
gtacccgcgg ccagagcttg cgggcgccac cgcggccgcg gggatccaga catgataaga    7500
tacattgatg agtttggaca aaccacaact agaatgcagt gaaaaaaatg ctttatttgt    7560
gaaatttgtg atgctattgc tttatttgta accattataa gctgcaataa acaagttaac    7620
aacaacaatt gcattcattt tatgtttcag gttcaggggg aggtgtggga ggttttttcg    7680
gatcctcttg gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt atccgctcac    7740
aattccacac aacatacgag ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt    7800
gagctaactc acattaattg cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc    7860
gtgccagctg cattaatgaa tcggccaacg cgcggggaaa ggcggtttgc gtattgggcg    7920
ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt    7980
atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa    8040
gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc    8100
gttcttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag    8160
gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt    8220
gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg    8280
aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg    8340
ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg    8400
taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac    8460
tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg    8520
gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt    8580
taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg    8640
tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc    8700
tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt    8760
ggtcatgaga ttatcaaaaa ggatcttcac ctagatccct tttaattaaa aatgaagttt    8820
taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag    8880
tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt    8940
cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg caatgatacc    9000
gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc    9060
cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg    9120
ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac    9180
aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg    9240
atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc    9300
tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact    9360
gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc    9420
aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat    9480
acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc    9540
ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac    9600
tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa    9660
aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact    9720
catactcttc ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg    9780
atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg    9840
aaaagtgcca cctgacgtct aagaaaccat tattatcatg acattaacct ataaaaatag    9900
gcgtatcacg aggccctttc gtctcgcgcg tttcggtgat gacggtgaaa acctctgaca    9960
catgcagctc ccggagacgg tcacagcttg tctgtaagcg gatgccggga gcagacaagc    10020
ccgtcagggc gcgtcagcgg gtgttggcgg gtgtcggggc tggcttaact atgcggcatc    10080
agagcagatt gtactgagag tgcaccatat gcggtgtgaa ataccgcaca gatgcgtaag    10140
gagaaaatac cgcatcaggc gccattcgcc attcaggctg cgcaactgtt gggaagggcg    10200
atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg    10260
attaagttgg gtaacgccag ggttttccca gttacgacgt tgtaaaacga cggccagtga    10320
att                                                                  10323
<210>32
<211>2835
<212>DNA
<213>人造
<220>
<223>合成构建体,ABT-007多聚蛋白的编码序列。
<220>
<221>CDS
<222>(1)..(2832)
<400>32
atg gag ttt ggg ctg agc tgg ctt ttt ctt gtc gcg att tta aaa ggt    48
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1               5                   10                  15
gtc cag tgt cag gtg cag ctg cag gag tcg ggc cca gga ctg gtg aag    96
Val Gln Cys Gln Val Gln Leu Gln Glu Ser Gly Pro Gly Leu Val Lys
            20                  25                  30
cct tcg gag acc ctg tcc ctc acc tgc act gtc tct ggt gcc tcc atc    144
Pro Ser Glu Thr Leu Ser Leu Thr Cys Thr Val Ser Gly Ala Ser Ile
        35                  40                  45
agt agt tac tac tgg agc tgg atc cgg cag ccc cca ggg aag gga ctg    192
Ser Ser Tyr Tyr Trp Ser Trp Ile Arg Gln Pro Pro Gly Lys Gly Leu
    50                  55                  60
gag tgg att ggg tat atc ggg ggg gag ggg agc acc aac tac aac ccc    240
Glu Trp Ile Gly Tyr Ile Gly Gly Glu Gly Ser Thr Asn Tyr Asn Pro
65                  70                  75                  80
tcc ctc aag agt cga gtc acc ata tca gta gac acg tcc aag aac cag    288
Ser Leu Lys Ser Arg Val Thr Ile Ser Val Asp Thr Ser Lys Asn Gln
                85                  90                  95
ttc tcc ctg aag ctg agg tct gtg acc gct gcg gac acg gcc gtg tat    336
Phe Ser Leu Lys Leu Arg Ser Val Thr Ala Ala Asp Thr Ala Val Tyr
            100                 105                 110
tac tgt gcg aga gag cga ctg ggg atc ggg gac tac tgg ggc cag gga    384
Tyr Cys Ala Arg Glu Arg Leu Gly Ile Gly Asp Tyr Trp Gly Gln Gly
        115                 120                 125
acc ctg gtc acc gtc tcc tca gcg tcg acc aag ggc cca tcg gtc ttc    432
Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe
    130                 135                 140
ccc ctg gcg ccc tgc tct aga agc acc tcc gag agc aca gcg gcc ctg    480
Pro Leu Ala Pro Cys Ser Arg Ser Thr Ser Glu Ser Thr Ala Ala Leu
145                 150                 155                 160
ggc tgc ctg gtc aag gac tac ttc ccc gaa ccg gtg acg gtg tcg tgg    528
Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp
                165                 170                 175
aac tca ggc gct ctg acc agc ggc gtg cac acc ttc cca gct gtc ctg    576
Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu
            180                 185                 190
cag tcc tca gga ctc tac tcc ctc agc agc gtg gtg acc gtg ccc tcc    624
Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser
        195                 200                 205
agc aac ttc ggc acc cag acc tac aca tgc aac gta gat cac aag ccc    672
Ser Asn Phe Gly Thr Gln Thr Tyr Thr Cys Asn Val Asp His Lys Pro
    210                 215                 220
agc aac acc aag gtg gac aag aca gtt gag cgc aaa tgt tgt gtc gag    720
Ser Asn Thr Lys Val Asp Lys Thr Val Glu Arg Lys Cys Cys Val Glu
225                 230                 235                 240
tgc cca ccg tgc cca gca cca cct gtg gca gga ccg tca gtc ttc ctc    768
Cys Pro Pro Cys Pro Ala Pro Pro Val Ala Gly Pro Ser Val Phe Leu
                245                 250                 255
ttc ccc cca aaa ccc aag gac acc ctc atg atc tcc cgg acc cct gag    816
Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu
            260                 265                 270
gtc acg tgc gtg gtg gtg gac gtg agc cac gaa gac ccc gag gtc cag    864
Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Gln
        275                 280                 285
ttc aac tgg tac gtg gac ggc gtg gag gtg cat aat gcc aag aca aag    912
Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys
    290                 295                 300
cca cgg gag gag cag ttc aac agc acgttc cgt  gtg gtc agc gtc ctc    960
Pro Arg Glu Glu Gln Phe Asn Ser Thr Phe Arg Val Val Ser Val Leu
305                 310                 315                 320
acc gtt gtg cac cag gac tgg ctg aac ggc aag gag tac aag tgc aag    1008
Thr Val Val His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys
                325                 330                 335
gtc tcc aac aaa ggc ctc cca gcc ccc atc gag aaa acc atc tcc aaa    1056
Val Ser Asn Lys Gly Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys
            340                 345                 350
acc aaa ggg cag ccc cga gaa cca cag gtg tac acc ctg ccc cca tcc    1104
Thr Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser
        355                 360                 365
cgg gag gag atg acc aag aac cag gtc agc ctg acc tgc ctg gtc aaa    1152
Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys
    370                 375                 380
ggc ttc tac ccc agc gac atc gcc gtg gag tgg gag agc aat ggg cag    1200
Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln
385                 390                 395                 400
ccg gag aac aac tac aag acc aca cct ccc atg ctg gac tcc gac ggc    1248
Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Met Leu Asp Ser Asp Gly
                405                 410                 415
tcc ttc ttc ctc tac agc aag ctc acc gtg gac aag agc agg tgg cag    1296
Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln
            420                 425                 430
cag ggg aac gtc ttc tca tgc tcc gtg atg cat gag gct ctg cac aac    1344
Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn
        435                 440                 445
cac tac acg cag aag agc ctc tcc ctg tct agg ggt aaa cgc gaa cca    1392
His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Arg Gly Lys Arg Glu Pro
    450                 455                 460
gtt tat ttc cag ggg agc ttg ttt aag ggg ccg cgt gat tat aac cca    1440
Val Tyr Phe Gln Gly Ser Leu Phe Lys Gly Pro Arg Asp Tyr Asn Pro
465                 470                 475                 480
ata tcg agt gcc att tgt cat cta acg aat gaa tct gat ggg cac aca    1488
Ile Ser Ser Ala Ile Cys His Leu Thr Asn Glu Ser Asp Gly His Thr
                485                 490                 495
aca tcg ttg tat ggt att ggt ttt ggc cct ttc atc atc aca aac aag    1536
Thr Ser Leu Tyr Gly Ile Gly Phe Gly Pro Phe Ile Ile Thr Asn Lys
            500                 505                 510
cat ttg ttt aga aga aat aat ggt aca ctg tta gtt caa tca cta cat    1584
His Leu Phe Arg Arg Asn Asn Gly Thr Leu Leu Val Gln Ser Leu His
        515                 520                 525
ggt gtg ttc aag gta aag aat acc aca act ttg caa caa cac ctc att    1632
Gly Val Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln His Leu Ile
    530                 535                 540
gat ggg agg gac atg atg ctc att cgc atg cct aag gat ttc cca cca    1680
Asp Gly Arg Asp Met Met Leu Ile Arg Met Pro Lys Asp Phe Pro Pro
545                 550                 555                 560
ttt cct caa aag ctg aaa ttc aga gag cca caa agg gaa gag cgc ata    1728
Phe Pro Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu Glu Arg Ile
                565                 570                 575
tgt ctt gtg aca acc aac ttc caa act aag agc atg tct agc atg gtt    1776
Cys Leu Val Thr Thr Asn Phe Gln Thr Lys Ser Met Ser Ser Met Val
            580                 585                 590
tca gat act agt tgc aca ttc cct tca tct gat ggt ata ttc tgg aaa    1824
Ser Asp Thr Ser Cys Thr Phe Pro Ser Ser Asp Gly Ile Phe Trp Lys
        595                 600                 605
cat tgg att cag acc aag gat ggg cac tgt ggt agc ccg ttg gtg tca    1872
His Trp Ile Gln Thr Lys Asp Gly His Cys Gly Ser Pro Leu Val Ser
    610                 615                 620
act aga gat ggg ttt att gtt ggt ata cac tca gca tca aat ttc acc    1920
Thr Arg Asp Gly Phe Ile Val Gly Ile His Ser Ala Ser Asn Phe Thr
625                 630                 635                 640
aac aca aac aat tat ttt aca agt gtg ccg aaa gac ttc atg gat tta    1968
Asn Thr Asn Asn Tyr Phe Thr Ser Val Pro Lys Asp Phe Met Asp Leu
                645                 650                 655
ttg aca aat caa gag gcg cag caa tgg gtt agt ggt tgg cga ttg aat    2016
Leu Thr Asn Gln Glu Ala Gln Gln Trp Val Ser Gly Trp Arg Leu Asn
            660                 665                 670
gct gac tca gtg tta tgg gga ggc cac aaa gtt ttc atg agc aaa cct    2064
Ala Asp Ser Val Leu Trp Gly Gly His Lys Val Phe Met Ser Lys Pro
        675                 680                 685
gaa gaa ccc ttt cag cca gtc aaa gaa gca act caa ctc atg agt gaa    2112
Glu Glu Pro Phe Gln Pro Val Lys Glu Ala Thr Gln Leu Met Ser Glu
    690                 695                 700
tta gtc tac tcg caa ggg atg cgc gtg ccc gcc cag ctg ctg ggc ctg    2160
Leu Val Tyr Ser Gln Gly Met Arg Val Pro Ala Gln Leu Leu Gly Leu
705                 710                 715                 720
ctg ctg ctg tgg ttc ccc ggc tcg cga tgc gac atc cag ctg acc caa    2208
Leu Leu Leu Trp Phe Pro Gly Ser Arg Cys Asp Ile Gln Leu Thr Gln
                725                 730                 735
tct cca tcc tcc ctg tct gca tct gta gga gac aga gtc acc atc act    2256
Ser Pro Ser Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr
            740                 745                 750
tgc cgg gca agt cag ggc att aga aat gat tta ggc tgg tat cag cag    2304
Cys Arg Ala Ser Gln Gly Ile Arg Asn Asp Leu Gly Trp Tyr Gln Gln
        755                 760                 765
aaa cca ggg aaa gcc cct aag cgc ctg atc tat gct gca tcc agt ttg    2352
Lys Pro Gly Lys Ala Pro Lys Arg Leu Ile Tyr Ala Ala Ser Ser Leu
    770                 775                 780
caa agt ggg gtc cca tca agg ttc agc ggc agt gga tct ggg aca gaa    2400
Gln Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Glu
785                 790                 795                 800
ttc act ctc aca atc agc agc ctg cag cct gaa gat ttt gca act tat    2448
Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr
                805                 810                 815
tac tgt cta cag cat aat act tac cct ccg acg ttc ggc caa ggg acc    2496
Tyr Cys Leu Gln His Asn Thr Tyr Pro Pro Thr Phe Gly Gln Gly Thr
            820                 825                 830
aag gtg gaa atc aaa cgt acg gtg gct gca cca tct gtc ttc atc ttc    2544
Lys Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe
        835                 840                 845
ccg cca tct gat gag cag ttg aaa tct gga act gcc tct gtt gtg tgc    2592
Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys
    850                 855                 860
ctg ctg aat aac ttc tat ccc aga gag gcc aaa gta cag tgg aag gtg    2640
Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val
865                 870                 875                 880
gat aac gcc ctc caa tcg ggt aac tcc cag gag agt gtc aca gag cag    2688
Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln
                885                 890                 895
gac agc aag gac agc acc tac agc ctc agc agc acc ctg acg ctg agc    2736
Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser
            900                 905                 910
aaa gca gac tac gag aaa cac aaa gtc tac gcc tgc gaa gtc acc cat    2784
Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His
        915                 920                 925
cag ggc ctg agc tcg ccc gtc aca aag agc ttc aac agg gga gag tgt    2832
Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
    930                 935                 940
tga                                                                2835
<210>33
<211>944
<212>PRT
<213>人造
<220>
<223>合成构建体
<400>33
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1               5                   10                  15
Val Gln Cys Gln Val Gln Leu Gln Glu Ser Gly Pro Gly Leu Val Lys
            20                  25                  30
Pro Ser Glu Thr Leu Ser Leu Thr Cys Thr Val Ser Gly Ala Ser Ile
        35                  40                  45
Ser Ser Tyr Tyr Trp Ser Trp Ile Arg Gln Pro Pro Gly Lys Gly Leu
    50                  55                  60
Glu Trp Ile Gly Tyr Ile Gly Gly Glu Gly Ser Thr Asn Tyr Asn Pro
65                  70                  75                  80
Ser Leu Lys Ser Arg Val Thr Ile Ser Val Asp Thr Ser Lys Asn Gln
                85                  90                  95
Phe Ser Leu Lys Leu Arg Ser Val Thr Ala Ala Asp Thr Ala Val Tyr
            100                 105                 110
Tyr Cys Ala Arg Glu Arg Leu Gly Ile Gly Asp Tyr Trp Gly Gln Gly
        115                 120                 125
Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe
    130                 135                 140
Pro Leu Ala Pro Cys Ser Arg Ser Thr Ser Glu Ser Thr Ala Ala Leu
145                 150                 155                 160
Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp
                165                 170                 175
Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu
            180                 185                 190
Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser
        195                 200                 205
Ser Asn Phe Gly Thr Gln Thr Tyr Thr Cys Asn Val Asp His Lys Pro
    210                 215                 220
Ser Asn Thr Lys Val Asp Lys Thr Val Glu Arg Lys Cys Cys Val Glu
225                 230                 235                 240
Cys Pro Pro Cys Pro Ala Pro Pro Val Ala Gly Pro Ser Val Phe Leu
                245                 250                 255
Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu
            260                 265                 270
Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Gln
        275                 280                 285
Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys
    290                 295                 300
Pro Arg Glu Glu Gln Phe Asn Ser Thr Phe Arg Val Val Ser Val Leu
305                 310                 315                 320
Thr Val Val His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys
                325                 330                 335
Val Ser Asn Lys Gly Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys
            340                 345                 350
Thr Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser
        355                 360                 365
Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys
    370                 375                 380
Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln
385                 390                 395                 400
Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Met Leu Asp Ser Asp Gly
                405                 410                 415
Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln
            420                 425                 430
Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn
        435                 440                 445
His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Arg Gly Lys Arg Glu Pro
    450                 455                 460
Val Tyr Phe Gln Gly Ser Leu Phe Lys Gly Pro Arg Asp Tyr Asn Pro
465                 470                 475                 480
Ile Ser Ser Ala Ile Cys His Leu Thr Asn Glu Ser Asp Gly His Thr
                485                 490                 495
Thr Ser Leu Tyr Gly Ile Gly Phe Gly Pro Phe Ile Ile Thr Asn Lys
            500                 505                 510
His Leu Phe Arg Arg Asn Asn Gly Thr Leu Leu Val Gln Ser Leu His
        515                 520                 525
Gly Val Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln His Leu Ile
    530                 535                 540
Asp Gly Arg Asp Met Met Leu Ile Arg Met Pro Lys Asp Phe Pro Pro
545                 550                 555                 560
Phe Pro Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu Glu Arg Ile
                565                 570                 575
Cys Leu Val Thr Thr Asn Phe Gln Thr Lys Ser Met Ser Ser Met Val
            580                 585                 590
Ser Asp Thr Ser Cys Thr Phe Pro Ser Ser Asp Gly Ile Phe Trp Lys
        595                 600                 605
His Trp Ile Gln Thr Lys Asp Gly His Cys Gly Ser Pro Leu Val Ser
    610                 615                 620
Thr Arg Asp Gly Phe Ile Val Gly Ile His Ser Ala Ser Asn Phe Thr
625                 630                 635                 640
Asn Thr Asn Asn Tyr Phe Thr Ser Val Pro Lys Asp Phe Met Asp Leu
                645                 650                 655
Leu Thr Asn Gln Glu Ala Gln Gln Trp Val Ser Gly Trp Arg Leu Asn
            660                 665                 670
Ala Asp Ser Val Leu Trp Gly Gly His Lys Val Phe Met Ser Lys Pro
        675                 680                 685
Glu Glu Pro Phe Gln Pro Val Lys Glu Ala Thr Gln Leu Met Ser Glu
    690                 695                 700
Leu Val Tyr Ser Gln Gly Met Arg Val Pro Ala Gln Leu Leu Gly Leu
705                 710                 715                 720
Leu Leu Leu Trp Phe Pro Gly Ser Arg Cys Asp Ile Gln Leu Thr Gln
                725                 730                 735
Ser Pro Ser Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr
            740                 745                 750
Cys Arg Ala Ser Gln Gly Ile Arg Asn Asp Leu Gly Trp Tyr Gln Gln
        755                 760                 765
Lys Pro Gly Lys Ala Pro Lys Arg Leu Ile Tyr Ala Ala Ser Ser Leu
    770                 775                 780
Gln Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Glu
785                 790                 795                 800
Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr
                805                 810                 815
Tyr Cys Leu Gln His Asn Thr Tyr Pro Pro Thr Phe Gly Gln Gly Thr
            820                 825                 830
Lys Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe
        835                 840                 845
Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys
    850                 855                 860
Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val
865                 870                 875                 880
Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln
                885                 890                 895
Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser
            900                 905                 910
Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His
        915                 920                 925
Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
    930                 935                 940
<210>34
<211>10212
<212>DNA
<213>人造
<220>
<223>合成构建体,ABT-007多聚蛋白表达载体。
<400>34
gaagttccta ttccgaagttcctattctct agacgttaca taacttacgg taaatggccc    60
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat    120
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc    180
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga    240
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg    300
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat    360
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt    420
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc    480
cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg    540
tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg    600
aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg    660
gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag    720
gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc    780
tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa    840
actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact    900
ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt    960
ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca    1020
aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt    1080
ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga    1140
tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca    1200
ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag    1260
tttgggctga gctggctttt tcttgtcgcg attttaaaag gtgtccagtg tcaggtgcag    1320
ctgcaggagt cgggcccagg actggtgaag ccttcggaga ccctgtccct cacctgcact    1380
gtctctggtg cctccatcag tagttactac tggagctgga tccggcagcc cccagggaag    1440
ggactggagt ggattgggta tatcgggggg gaggggagca ccaactacaa cccctccctc    1500
aagagtcgag tcaccatatc agtagacacg tccaagaacc agttctccct gaagctgagg    1560
tctgtgaccg ctgcggacac ggccgtgtat tactgtgcga gagagcgact ggggatcggg    1620
gactactggg gccagggaac cctggtcacc gtctcctcag cgtcgaccaa gggcccatcg    1680
gtcttccccc tggcgccctg ctctagaagc acctccgaga gcacagcggc cctgggctgc    1740
ctggtcaagg actacttccc cgaaccggtg acggtgtcgt ggaactcagg cgctctgacc    1800
agcggcgtgc acaccttccc agctgtcctg cagtcctcag gactctactc cctcagcagc    1860
gtggtgaccg tgccctccag caacttcggc acccagacct acacatgcaa cgtagatcac    1920
aagcccagca acaccaaggt ggacaagaca gttgagcgca aatgttgtgt cgagtgccca    1980
ccgtgcccag caccacctgt ggcaggaccg tcagtcttcc tcttcccccc aaaacccaag    2040
gacaccctca tgatctcccg gacccctgag gtcacgtgcg tggtggtgga cgtgagccac    2100
gaagaccccg aggtccagtt caactggtac gtggacggcg tggaggtgca taatgccaag    2160
acaaagccac gggaggagca gttcaacagc acgttccgtg tggtcagcgt cctcaccgtt    2220
gtgcaccagg actggctgaa cggcaaggag tacaagtgca aggtctccaa caaaggcctc    2280
ccagccccca tcgagaaaac catctccaaa accaaagggc agccccgaga accacaggtg    2340
tacaccctgc ccccatcccg ggaggagatg accaagaacc aggtcagcct gacctgcctg    2400
gtcaaaggct tctaccccag cgacatcgcc gtggagtggg agagcaatgg gcagccggag    2460
aacaactaca agaccacacc tcccatgctg gactccgacg gctccttctt cctctacagc    2520
aagctcaccg tggacaagag caggtggcag caggggaacg tcttctcatg ctccgtgatg    2580
catgaggctc tgcacaacca ctacacgcag aagagcctct ccctgtctag gggtaaacgc    2640
gaaccagttt atttccaggg gagcttgttt aaggggccgc gtgattataa cccaatatcg    2700
agtgccattt gtcatctaac gaatgaatct gatgggcaca caacatcgtt gtatggtatt    2760
ggttttggcc ctttcatcat cacaaacaag catttgttta gaagaaataa tggtacactg    2820
ttagttcaat cactacatgg tgtgttcaag gtaaagaata ccacaacttt gcaacaacac    2880
ctcattgatg ggagggacat gatgctcatt cgcatgccta aggatttccc accatttcct    2940
caaaagctga aattcagaga gccacaaagg gaagagcgca tatgtcttgt gacaaccaac    3000
ttccaaacta agagcatgtc tagcatggtt tcagatacta gttgcacatt cccttcatct    3060
gatggtatat tctggaaaca ttggattcag accaaggatg ggcactgtgg tagcccgttg    3120
gtgtcaacta gagatgggtt tattgttggt atacactcag catcaaattt caccaacaca    3180
aacaattatt ttacaagtgt gccgaaagac ttcatggatt tattgacaaa tcaagaggcg    3240
cagcaatggg ttagtggttg gcgattgaat gctgactcag tgttatgggg aggccacaaa    3300
gttttcatga gcaaacctga agaacccttt cagccagtca aagaagcaac tcaactcatg    3360
agtgaattag tctactcgca agggatgcgc gtgcccgccc agctgctggg cctgctgctg    3420
ctgtggttcc ccggctcgcg atgcgacatc cagctgaccc aatctccatc ctccctgtct    3480
gcatctgtag gagacagagt caccatcact tgccgggcaa gtcagggcat tagaaatgat    3540
ttaggctggt atcagcagaa accagggaaa gcccctaagc gcctgatcta tgctgcatcc    3600
agtttgcaaa gtggggtccc atcaaggttc agcggcagtg gatctgggac agaattcact    3660
ctcacaatca gcagcctgca gcctgaagat tttgcaactt attactgtct acagcataat    3720
acttaccctc cgacgttcgg ccaagggacc aaggtggaaa tcaaacgtac ggtggctgca    3780
ccatctgtct tcatcttccc gccatctgat gagcagttga aatctggaac tgcctctgtt    3840
gtgtgcctgc tgaataactt ctatcccaga gaggccaaag tacagtggaa ggtggataac    3900
gccctccaat cgggtaactc ccaggagagt gtcacagagc aggacagcaa ggacagcacc    3960
tacagcctca gcagcaccct gacgctgagc aaagcagact acgagaaaca caaagtctac    4020
gcctgcgaag tcacccatca gggcctgagc tcgcccgtca caaagagctt caacagggga    4080
gagtgttgag cggccgcgtt taaactgaat gagcgcgtcc atccagacat gataagatac    4140
attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa    4200
atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac    4260
aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaaagc    4320
aagtaaaacc tctacaaatg tggtatggct gattatgatc cggctgcctc gcgcgtttcg    4380
gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca gcttgtctgt    4440
aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt ggcgggtgtc    4500
ggggcgcagc catgaccggt cgacggcgcg cctttttttt taatttttat tttattttat    4560
ttttgacgcg ccgaaggcgc gatctgagct cggtacagct tggctgtgga atgtgtgtca    4620
gttagggtgt ggaaagtccc caggctcccc agcaggcaga agtatgcaaa gcatgcatct    4680
caattagtca gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca    4740
aagcatgcat ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc    4800
cctaactccg cccagttccg cccattctcc gccccatggc tgactaattt tttttattta    4860
tgcagaggcc gaggccgcct cggcctctga gctattccag aagtagtgag gaggcttttt    4920
tggaggccta ggcttttgca aaaagctcct cgaggaactg aaaaaccaga aagttaactg    4980
gtaagtttag tctttttgtc ttttatttca ggtcccggat ccggtggtgg tgcaaatcaa    5040
agaactgctc ctcagtggat gttgccttta cttctaggcc tgtacggaag tgttacttct    5100
gctctaaaag ctgcggaatt gtacccgcgg cctaatacga ctcactatag ggactagtat    5160
ggttcgacca ttgaactgca tcgtcgccgt gtcccaaaat atggggattg gcaagaacgg    5220
agacctaccc tggcctccgc tcaggaacga gttcaagtac ttccaaagaa tgaccacaac    5280
ctcttcagtg gaaggtaaac agaatctggt gattatgggt aggaaaacct ggttctccat    5340
tcctgagaag aatcgacctt taaaggacag aattaatata gttctcagta gagaactcaa    5400
agaaccacca cgaggagctc attttcttgc caaaagttta gatgatgcct taagacttat    5460
tgaacaaccg gaattggcaa gtaaagtaga catggtttgg atagtcggag gcagttctgt    5520
ttaccaggaa gccatgaatc aaccaggcca cctcagactc tttgtgacaa ggatcatgca    5580
ggaatttgaa agtgacacgt ttttcccaga aattgatttg gggaaatata aacttctccc    5640
agaataccca ggcgtcctct ctgaggtcca ggaggaaaaa ggcatcaagt ataagtttga    5700
agtctacgag aagaaagact aagcggccga gcgcgcggat ctggaaacgg gagatggggg    5760
aggctaactg aagcacggaa ggagacaata ccggaaggaa cccgcgctat gacggcaata    5820
aaaagacaga ataaaacgca cgggtgttgg gtcgtttgtt cataaacgcg gggttcggtc    5880
ccagggctgg cactctgtcg ataccccacc gagaccccat tggggccaat acgcccgcgt    5940
ttcttccttt tccccacccc accccccaag ttcgggtgaa ggcccagggc tcgcagccaa    6000
cgtcggggcg gcaggccctg ccatagccac tggccccgtg ggttagggac ggggtccccc    6060
atggggaatg gtttatggtt cgtgggggtt attattttgg gcgttgcgtg gggtctggag    6120
atcccccggg ctgcaggaat tccgttacat tacttacggt aaatggcccg cctggctgac    6180
cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa    6240
tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag    6300
tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc    6360
ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct    6420
acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc aatgggcgtg    6480
gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc aatgggagtt    6540
tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc gccccattga    6600
cgcaaaaggg cgggaattcg agctcggtac tcgagcggtg ttccgcggtc ctcctcgtat    6660
agaaactcgg accactctga gacgaaggct cgcgtccagg ccagcacgaa ggaggctaag    6720
tgggaggggt agcggtcgtt gtccactagg gggtccactc gctccagggt gtgaagacac    6780
atgtcgccct cttcggcatc aaggaaggtg attggtttat aggtgtaggc cacgtgaccg    6840
ggtgttcctg aaggggggct ataaaagggg gtgggggcgc gttcgtcctc actctcttcc    6900
gcatcgctgt ctgcgagggc cagctgttgg gctcgcggtt gaggacaaac tcttcgcggt    6960
ctttccagta ctcttggatc ggaaacccgt cggcctccga acggtactcc gccaccgagg    7020
gacctgagcg agtccgcatc gaccggatcg gaaaacctct cgactgttgg ggtgagtact    7080
ccctctcaaa agcgggcatg acttctgcgc taagattgtc agtttccaaa aacgaggagg    7140
atttgatatt cacctggccc gcggtgatgc ctttgagggt ggccgcgtcc atctggtcag    7200
aaaagacaat ctttttgttg tcaagcttga ggtgtggcag gcttgagatc tggccataca    7260
cttgagtgac aatgacatcc actttgcctt tctctccaca ggtgtccact cccaggtcca    7320
accggaattg tacccgcggc cagagcttgc gggcgccacc gcggccgcgg ggatccagac    7380
atgataagat acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc    7440
tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa    7500
caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga ggtgtgggag    7560
gttttttcgg atcctcttgg cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta    7620
tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc    7680
ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg    7740
aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggaaag gcggtttgcg    7800
tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg    7860
gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa    7920
cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc    7980
gttgctggcg ttcttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc    8040
aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag    8100
ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct    8160
cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta    8220
ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc    8280
cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc    8340
agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt    8400
gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct    8460
gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc    8520
tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca    8580
agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta    8640
agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccctt ttaattaaaa    8700
atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg    8760
cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg    8820
actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc    8880
aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc    8940
cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa    9000
ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc    9060
cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg    9120
ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc    9180
cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat    9240
ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg    9300
tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc    9360
ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg    9420
aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat    9480
gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg    9540
gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg    9600
ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct    9660
catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac  9720
atttccccga aaagtgccac ctgacgtcta agaaaccatt attatcatga cattaaccta  9780
taaaaatagg cgtatcacga ggccctttcg tctcgcgcgt ttcggtgatg acggtgaaaa  9840
cctctgacac atgcagctcc cggagacggt cacagcttgt ctgtaagcgg atgccgggag  9900
cagacaagcc cgtcagggcg cgtcagcggg tgttggcggg tgtcggggct ggcttaacta  9960
tgcggcatca gagcagattg tactgagagt gcaccatatg cggtgtgaaa taccgcacag  10020
atgcgtaagg agaaaatacc gcatcaggcg ccattcgcca ttcaggctgc gcaactgttg  10080
ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc  10140
tgcaaggcga ttaagttggg taacgccagg gttttcccag ttacgacgtt gtaaaacgac  10200
ggccagtgaa tt                                                      10212
<210>35
<211>2853
<212>DNA
<213>人造
<220>
<223>合成构建体,编码ABT-874(J695)TEV多聚蛋白的序列。
<220>
<221>CDS
<222>(1)..(2850)
<400>35
atg gag ttt ggg ctg agc tgg ctt ttt ctt gtc gcg att tta aaa ggt    48
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1               5                   10                  15
gtc cag tgt cag gtg cag ctg gtg gag tct ggg gga ggc gtg gtc cag    96
Val Gln Cys Gln Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln
            20                  25                  30
cct ggg agg tcc ctg aga ctc tcc tgt gca gcg tct gga ttc acc ttc    144
Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
        35                  40                  45
agt agc tat ggc atg cac tgg gtc cgc cag gct cca ggc aag ggg ctg    192
Ser Ser Tyr Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
    50                  55                  60
gag tgg gtg gca ttt ata cgg tat gat gga agt aat aaa tac tat gca    240
Glu Trp Val Ala Phe Ile Arg Tyr Asp Gly Ser Asn Lys Tyr Tyr Ala
65                  70                  75                  80
gac tcc gtg aag ggc cga ttc acc atc tcc aga gac aat tcc aag aac    288
Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn
                85                  90                  95
acg ctg tat ctg cag atg aac agc ctg aga gct gag gac acg gct gtg    336
Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val
            100                 105                 110
tat tac tgt aag acc cat ggt agc cat gac aac tgg ggc caa ggg aca    384
Tyr Tyr Cys Lys Thr His Gly Ser His Asp Asn Trp Gly Gln Gly Thr
        115                 120                 125
atg gtc acc gtc tct tca gcg tcg acc aag ggc cca tcg gtc ttc ccc    432
Met Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro
    130                 135                 140
ctg gca ccc tcc tcc aag agc acc tct ggg ggc aca gcg gcc ctg ggc    480
Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly
145                 150                 155                 160
tgc ctg gtc aag gac tac ttc ccc gaa ccg gtg acg gtg tcg tgg aac    528
Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn
                165                 170                 175
tca ggc gcc ctg acc agc ggc gtg cac acc ttc ccg gct gtc cta cag    576
Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln
            180                 185                 190
tcc tca gga ctc tac tcc ctc agc agc gtg gtg acc gtg ccc tcc agc    624
Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser
        195                 200                 205
agc ttg ggc acc cag acc tac atc tgc aac gtg aat cac aag ccc agc    672
Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser
    210                 215                 220
aac acc aag gtg gac aag aaa gtt gag ccc aaa tct tgt gac aaa act    720
Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr
225                 230                 235                 240
cac aca tgc cca ccg tgc cca gca cct gaa ctc ctg ggg gga ccg tca    768
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
                245                 250                 255
gtc ttc ctc ttc ccc cca aaa ccc aag gac acc ctc atg atc tcc cgg    816
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
            260                 265                 270
acc cct gag gtc aca tgc gtg gtg gtg gac gtg agc cac gaa gac cct    864
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
        275                 280                 285
gag gtc aag ttc aac tgg tac gtg gac ggc gtg gag gtg cat aat gcc    912
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
    290                 295                 300
aag aca aag ccg cgg gag gag cag tac aac agc acg tac cgt gtg gtc    960
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
305                 310                 315                 320
agc gtc ctc acc gtc ctg cac cag gac tgg ctg aat ggc aag gag tac    1008
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
                325                 330                 335
aag tgc aag gtc tcc aac aaa gcc ctc cca gcc ccc atc gag aaa acc    1056
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr
            340                 345                 350
atc tcc aaa gcc aaa ggg cag ccc cga gaa cca cag gtg tac acc ctg    1104
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu
        355                 360                 365
ccc cca tcc cgc gag gag atg acc aag aac cag gtc agc ctg acc tgc    1152
Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys
    370                 375                 380
ctg gtc aaa ggc ttc tat ccc agc gac atc gcc gtg gag tgg gag agc    1200
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
385                 390                 395                 400
aat ggg cag ccg gag aac aac tac aag acc acg cct ccc gtg ctg gac    1248
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp
                405                 410                 415
tcc gac ggc tcc ttc ttc ctc tac agc aag ctc acc gtg gac aag agc    1296
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser
            420                 425                 430
agg tgg cag cag ggg aac gtc ttc tca tgc tcc gtg atg cat gag gct    1344
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
        435                 440                 445
ctg cac aac cac tac acg cag aag agc ctc tcc ctg tct agg ggt aaa    1392
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Arg Gly Lys
    450                 455                 460
cgc gaa cca gtt tat ttc cag ggg agc ttg ttt aag ggg ccg cgt gat    1440
Arg Glu Pro Val Tyr Phe Gln Gly Ser Leu Phe Lys Gly Pro Arg Asp
465                 470                 475                 480
tat aac cca ata tcg agt gcc att tgt cat cta acg aat gaa tct gat    1488
Tyr Asn Pro Ile Ser Ser Ala Ile Cys His Leu Thr Asn Glu Ser Asp
                485                 490                 495
ggg cac aca aca tcg ttg tat ggt att ggt ttt ggc cct ttc atc atc    1536
Gly His Thr Thr Ser Leu Tyr Gly Ile Gly Phe Gly Pro Phe Ile Ile
            500                 505                 510
aca aac aag cat ttg ttt aga aga aat aat ggt aca ctg tta gtt caa    1584
Thr Asn Lys His Leu Phe Arg Arg Asn Asn Gly Thr Leu Leu Val Gln    
        515                 520                 525
tca cta cat ggt gtg ttc aag gta aag aat acc aca act ttg caa caa    1632
Ser Leu His Gly Val Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln
    530                 535                 540
cac ctc att gat ggg agg gac atg atg ctc att cgc atg cct aag gat    1680
His Leu Ile Asp Gly Arg Asp Met Met Leu Ile Arg Met Pro Lys Asp
545                 550                 555                 560
ttc cca cca ttt cct caa aag ctg aaa ttc aga gag cca caa agg gaa    1728
Phe Pro Pro Phe Pro Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu
                565                 570                 575
gag cgc ata tgt ctt gtg aca acc aac ttc caa act aag agc atg tct    1776
Glu Arg Ile Cys Leu Val Thr Thr Asn Phe Gln Thr Lys Ser Met Ser
            580                 585                 590
agc atg gtt tca gat act agt tgc aca ttc cct tca tct gat ggt ata    1824
Ser Met Val Ser Asp Thr Ser Cys Thr Phe Pro Ser Ser Asp Gly Ile
        595                 600                 605
ttc tgg aaa cat tgg att cag acc aag gat ggg cac tgt ggt agc ccg    1872
Phe Trp Lys His Trp Ile Gln Thr Lys Asp Gly His Cys Gly Ser Pro
    610                 615                 620
ttg gtg tca act aga gat ggg ttt att gtt ggt ata cac tca gca tca    1920
Leu Val Ser Thr Arg Asp Gly Phe Ile Val Gly Ile His Ser Ala Ser
625                 630                 635                 640
aat ttc acc aac aca aac aat tat ttt aca agt gtg ccg aaa gac ttc    1968
Asn Phe Thr Asn Thr Asn Asn Tyr Phe Thr Ser Val Pro Lys Asp Phe
                645                 650                 655
atg gat tta ttg aca aat caa gag gcg cag caa tgg gtt agt ggt tgg    2016
Met Asp Leu Leu Thr Asn Gln Glu Ala Gln Gln Trp Val Ser Gly Trp
            660                 665                 670
cga ttg aat gct gac tca gtg tta tgg gga ggc cac aaa gtt ttc atg    2064
Arg Leu Asn Ala Asp Ser Val Leu Trp Gly Gly His Lys Val Phe Met
        675                 680                 685
agc aaa cct gaa gaa ccc ttt cag cca gtc aaa gaa gca act caa ctc    2112
Ser Lys Pro Glu Glu Pro Phe Gln Pro Val Lys Glu Ala Thr Gln Leu
    690                 695                 700
atg agt gaa tta gtc tac tcg caa ggg atg act tgg acc cca ctc ctc    2160
Met Ser Glu Leu Val Tyr Ser Gln Gly Met Thr Trp Thr Pro Leu Leu
705                 710                 715                 720
ttc ctc acc ctc ctc ctc cac tgc aca gga agc tta tcc cag tct gtg    2208
Phe Leu Thr Leu Leu Leu His Cys Thr Gly Ser Leu Ser Gln Ser Val
                725                 730                 735
ctg act cag ccc ccc tca gtg tct ggg gcc ccc ggg cag aga gtc acc    2256
Leu Thr Gln Pro Pro Ser Val Ser Gly Ala Pro Gly Gln Arg Val Thr
            740                 745                 750
atc tct tgt tct gga agc aga tcc aac atc ggc agt aat act gta aag    2304
Ile Ser Cys Ser Gly Ser Arg Ser Asn Ile Gly Ser Asn Thr Val Lys
        755                 760                 765
tgg tat cag cag ctc cca gga acg gcc ccc aaa ctc ctc atc tat tac    2352
Trp Tyr Gln Gln Leu Pro Gly Thr Ala Pro Lys Leu Leu Ile Tyr Tyr
    770                 775                 780
aat gat cag cgg ccc tca ggg gtc cct gac cga ttc tct gga tcc aag    2400
Asn Asp Gln Arg Pro Ser Gly Val Pro Asp Arg Phe Ser Gly Ser Lys
785                 790                 795                 800
tct ggc acc tca gcc tcc ctc gcc atc act ggg ctc cag gct gaa gac    2448
Ser Gly Thr Ser Ala Ser Leu Ala Ile Thr Gly Leu Gln Ala Glu Asp
                805                 810                 815
gag gct gac tat tac tgc cag tca tat gac aga tac acc cac ccc gcc    2496
Glu Ala Asp Tyr Tyr Cys Gln Ser Tyr Asp Arg Tyr Thr His Pro Ala
            820                 825                 830
ctg ctc ttc gga act ggg acc aag gtc aca gta cta ggt cag ccc aag    2544
Leu Leu Phe Gly Thr Gly Thr Lys Val Thr Val Leu Gly Gln Pro Lys
        835                 840                 845
gct gcc ccc tcg gtc act ctg ttc ccg ccc tcc tct gag gag ctt caa    2592
Ala Ala Pro Ser Val Thr Leu Phe Pro Pro Ser Ser Glu Glu Leu Gln
    850                 855                 860
gcc aac aag gcc aca ctg gtg tgt ctc ata agt gac ttc tac ccg gga    2640
Ala Asn Lys Ala Thr Leu Val Cys Leu Ile Ser Asp Phe Tyr Pro Gly
865                 870                 875                 880
gcc gtg aca gtg gcc tgg aag gca gat agc agc ccc gtc aag gcg gga    2688
Ala Val Thr Val Ala Trp Lys Ala Asp Ser Ser Pro Val Lys Ala Gly
                885                 890                 895
gtg gag acc acc aca ccc tcc aaa caa agc aac aac aag tac gcg gcc    2736
Val Glu Thr Thr Thr Pro Ser Lys Gln Ser Asn Asn Lys Tyr Ala Ala
            900                 905                 910
agc agc tac ctg agc ctg acg cct gag cag tgg aag tcc cac aga agc    2784
Ser Ser Tyr Leu Ser Leu Thr Pro Glu Gln Trp Lys Ser His Arg Ser
        915                 920                 925
tac agc tgc cag gtc acg cat gaa ggg agc acc gtg gag aag aca gtg    2832
Tyr Ser Cys Gln Val Thr His Glu Gly Ser Thr Val Glu Lys Thr Val
    930                 935                 940
gcc cct aca gaa tgt tca tga                                        2853
Ala Pro Thr Glu Cys Ser
945                 950
<210>36
<211>950
<212>PRT
<213>人造
<220>
<223>合成构建体
<400>36
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1               5                   10                  15
Val Gln Cys Gln Val Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln
            20                  25                  30
Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
        35                  40                  45
Ser Ser Tyr Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
    50                  55                  60
Glu Trp Val Ala Phe Ile Arg Tyr Asp Gly Ser Asn Lys Tyr Tyr Ala
65                  70                  75                  80
Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn
                85                  90                  95
Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val
            100                 105                 110
Tyr Tyr Cys Lys Thr His Gly Ser His Asp Asn Trp Gly Gln Gly Thr
        115                 120                 125
Met Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro
    130                 135                 140
Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly
145                 150                 155                 160
Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn
                165                 170                 175
Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln
            180                 185                 190
Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser
        195                 200                 205
Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser
    210                 215                 220
Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr
225                 230                 235                 240
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
                245                 250                 255
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
            260                 265                 270
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro
        275                 280                 285
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
    290                 295                 300
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val
305                 310                 315                 320
Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
                325                 330                 335
Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr
            340                 345                 350
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu
        355                 360                 365
Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys
    370                 375                 380
Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
385                 390                 395                 400
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp
                405                 410                 415
Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser
            420                 425                 430
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala
        435                 440                 445
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Arg Gly Lys
    450                 455                 460
Arg Glu Pro Val Tyr Phe Gln Gly Ser Leu Phe Lys Gly Pro Arg Asp
465                 470                 475                 480
Tyr Asn Pro Ile Ser Ser Ala Ile Cys His Leu Thr Asn Glu Ser Asp
                485                 490                 495
Gly His Thr Thr Ser Leu Tyr Gly Ile Gly Phe Gly Pro Phe Ile Ile
            500                 505                 510
Thr Asn Lys His Leu Phe Arg Arg Asn Asn Gly Thr Leu Leu Val Gln
        515                 520                 525
Ser Leu His Gly Val Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln
    530                 535                 540
His Leu Ile Asp Gly Arg Asp Met Met Leu Ile Arg Met Pro Lys Asp
545                 550                 555                 560
Phe Pro Pro Phe Pro Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu
                565                 570                 575
Glu Arg Ile Cys Leu Val Thr Thr Asn Phe Gln Thr Lys Ser Met Ser
            580                 585                 590
Ser Met Val Ser Asp Thr Ser Cys Thr Phe Pro Ser Ser Asp Gly Ile
        595                 600                 605
Phe Trp Lys His Trp Ile Gln Thr Lys Asp Gly His Cys Gly Ser Pro
    610                 615                 620
Leu Val Ser Thr Arg Asp Gly Phe Ile Val Gly Ile His Ser Ala Ser
625                 630                 635                 640
Asn Phe Thr Asn Thr Asn Asn Tyr Phe Thr Ser Val Pro Lys Asp Phe
                645                 650                 655
Met Asp Leu Leu Thr Asn Gln Glu Ala Gln Gln Trp Val Ser Gly Trp
            660                 665                 670
Arg Leu Asn Ala Asp Ser Val Leu Trp Gly Gly His Lys Val Phe Met
        675                 680                 685
Ser Lys Pro Glu Glu Pro Phe Gln Pro Val Lys Glu Ala Thr Gln Leu
    690                 695                 700
Met Ser Glu Leu Val Tyr Ser Gln Gly Met Thr Trp Thr Pro Leu Leu
705                 710                 715                 720
Phe Leu Thr Leu Leu Leu His Cys Thr Gly Ser Leu Ser Gln Ser Val
                725                 730                 735
Leu Thr Gln Pro Pro Ser Val Ser Gly Ala Pro Gly Gln Arg Val Thr
            740                 745                 750
Ile Ser Cys Ser Gly Ser Arg Ser Asn Ile Gly Ser Asn Thr Val Lys
        755                 760                 765
Trp Tyr Gln Gln Leu Pro Gly Thr Ala Pro Lys Leu Leu Ile Tyr Tyr
    770                 775                 780
Asn Asp Gln Arg Pro Ser Gly Val Pro Asp Arg Phe Ser Gly Ser Lys
785                 790                 795                 800
Ser Gly Thr Ser Ala Ser Leu Ala Ile Thr Gly Leu Gln Ala Glu Asp
                805                 810                 815
Glu Ala Asp Tyr Tyr Cys Gln Ser Tyr Asp Arg Tyr Thr His Pro Ala
            820                 825                 830
Leu Leu Phe Gly Thr Gly Thr Lys Val Thr Val Leu Gly Gln Pro Lys
        835                 840                 845
Ala Ala Pro Ser Val Thr Leu Phe Pro Pro Ser Ser Glu Glu Leu Gln
    850                 855                 860
Ala Asn Lys Ala Thr Leu Val Cys Leu Ile Ser Asp Phe Tyr Pro Gly
865                 870                 875                 880
Ala Val Thr Val Ala Trp Lys Ala Asp Ser Ser Pro Val Lys Ala Gly
                885                 890                 895
Val Glu Thr Thr Thr Pro Ser Lys Gln Ser Asn Asn Lys Tyr Ala Ala
            900                 905                 910
Ser Ser Tyr Leu Ser Leu Thr Pro Glu Gln Trp Lys Ser His Arg Ser
        915                 920                 925
Tyr Ser Cys Gln Val Thr His Glu Gly Ser Thr Val Glu Lys Thr Val
    930                 935                 940
Ala Pro Thr Glu Cys Ser
945                 950
<210>37
<211>10230
<212>DNA
<213>人造
<220>
<223>合成构建体,ABT-874TEV多聚蛋白表达载体。
<400>37
gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc    60
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat    120
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc    180
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga    240
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg    300
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat    360
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt    420
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc    480
cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg    540
tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg    600
aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg    660
gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag    720
gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc    780
tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa    840
actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact    900
ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt    960
ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca    1020
aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt    1080
ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga    1140
tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca    1200
ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag    1260
tttgggctga gctggctttt tcttgtcgcg attttaaaag gtgtccagtg tcaggtgcag    1320
ctggtggagt ctgggggagg cgtggtccag cctgggaggt ccctgagact ctcctgtgca    1380
gcgtctggat tcaccttcag tagctatggc atgcactggg tccgccaggc tccaggcaag    1440
gggctggagt gggtggcatt tatacggtat gatggaagta ataaatacta tgcagactcc    1500
gtgaagggcc gattcaccat ctccagagac aattccaaga acacgctgta tctgcagatg    1560
aacagcctga gagctgagga cacggctgtg tattactgta agacccatgg tagccatgac    1620
aactggggcc aagggacaat ggtcaccgtc tcttcagcgt cgaccaaggg cccatcggtc    1680
ttccccctgg caccctcctc caagagcacc tctgggggca cagcggccct gggctgcctg    1740
gtcaaggact acttccccga accggtgacg gtgtcgtgga actcaggcgc cctgaccagc    1800
ggcgtgcaca ccttcccggc tgtcctacag tcctcaggac tctactccct cagcagcgtg    1860
gtgaccgtgc cctccagcag cttgggcacc cagacctaca tctgcaacgt gaatcacaag    1920
cccagcaaca ccaaggtgga caagaaagtt gagcccaaat cttgtgacaa aactcacaca    1980
tgcccaccgt gcccagcacc tgaactcctg gggggaccgt cagtcttcct cttcccccca    2040
aaacccaagg acaccctcat gatctcccgg acccctgagg tcacatgcgt ggtggtggac    2100
gtgagccacg aagaccctga ggtcaagttc aactggtacg tggacggcgt ggaggtgcat    2160
aatgccaaga caaagccgcg ggaggagcag tacaacagca cgtaccgtgt ggtcagcgtc    2220
ctcaccgtcc tgcaccagga ctggctgaat ggcaaggagt acaagtgcaa ggtctccaac    2280
aaagccctcc cagcccccat cgagaaaacc atctccaaag ccaaagggca gccccgagaa    2340
ccacaggtgt acaccctgcc cccatcccgc gaggagatga ccaagaacca ggtcagcctg    2400
acctgcctgg tcaaaggctt ctatcccagc gacatcgccg tggagtggga gagcaatggg    2460
cagccggaga acaactacaa gaccacgcct cccgtgctgg actccgacgg ctccttcttc    2520
ctctacagca agctcaccgt ggacaagagc aggtggcagc aggggaacgt cttctcatgc    2580
tccgtgatgc atgaggctct gcacaaccac tacacgcaga agagcctctc cctgtctagg    2640
ggtaaacgcg aaccagttta tttccagggg agcttgttta aggggccgcg tgattataac    2700
ccaatatcga gtgccatttg tcatctaacg aatgaatctg atgggcacac aacatcgttg    2760
tatggtattg gttttggccc tttcatcatc acaaacaagc atttgtttag aagaaataat    2820
ggtacactgt tagttcaatc actacatggt gtgttcaagg taaagaatac cacaactttg    2880
caacaacacc tcattgatgg gagggacatg atgctcattc gcatgcctaa ggatttccca    2940
ccatttcctc aaaagctgaa attcagagag ccacaaaggg aagagcgcat atgtcttgtg    3000
acaaccaact tccaaactaa gagcatgtct agcatggttt cagatactag ttgcacattc    3060
ccttcatctg atggtatatt ctggaaacat tggattcaga ccaaggatgg gcactgtggt    3120
agcccgttgg tgtcaactag agatgggttt attgttggta tacactcagc atcaaatttc    3180
accaacacaa acaattattt tacaagtgtg ccgaaagact tcatggattt attgacaaat    3240
caagaggcgc agcaatgggt tagtggttgg cgattgaatg ctgactcagt gttatgggga    3300
ggccacaaag ttttcatgag caaacctgaa gaaccctttc agccagtcaa agaagcaact    3360
caactcatga gtgaattagt ctactcgcaa gggatgactt ggaccccact cctcttcctc    3420
accctcctcc tccactgcac aggaagctta tcccagtctg tgctgactca gcccccctca    3480
gtgtctgggg cccccgggca gagagtcacc atctcttgtt ctggaagcag atccaacatc    3540
ggcagtaata ctgtaaagtg gtatcagcag ctcccaggaa cggcccccaa actcctcatc    3600
tattacaatg atcagcggcc ctcaggggtc cctgaccgat tctctggatc caagtctggc    3660
acctcagcct ccctcgccat cactgggctc caggctgaag acgaggctga ctattactgc    3720
cagtcatatg acagatacac ccaccccgcc ctgctcttcg gaactgggac caaggtcaca    3780
gtactaggtc agcccaaggc tgccccctcg gtcactctgt tcccgccctc ctctgaggag    3840
cttcaagcca acaaggccac actggtgtgt ctcataagtg acttctaccc gggagccgtg    3900
acagtggcct ggaaggcaga tagcagcccc gtcaaggcgg gagtggagac caccacaccc    3960
tccaaacaaa gcaacaacaa gtacgcggcc agcagctacc tgagcctgac gcctgagcag    4020
tggaagtccc acagaagcta cagctgccag gtcacgcatg aagggagcac cgtggagaag    4080
acagtggccc ctacagaatg ttcatgagcg gccgcgttta aactgaatga gcgcgtccat    4140
ccagacatga taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa    4200
aaatgcttta tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc    4260
aataaacaag ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggaggtg    4320
tgggaggttt tttaaagcaa gtaaaacctc tacaaatgtg gtatggctga ttatgatccg    4380
gctgcctcgc gcgtttcggt gatgacggtg aaaacctctg acacatgcag ctcccggaga    4440
cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca agcccgtcag ggcgcgtcag    4500
cgggtgttgg cgggtgtcgg ggcgcagcca tgaccggtcg acggcgcgcc ttttttttta    4560
atttttattt tattttattt ttgacgcgcc gaaggcgcga tctgagctcg gtacagcttg    4620
gctgtggaat gtgtgtcagt tagggtgtgg aaagtcccca ggctccccag caggcagaag    4680
tatgcaaagc atgcatctca attagtcagc aaccaggtgt ggaaagtccc caggctcccc    4740
agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccatag tcccgcccct    4800
aactccgccc atcccgcccc taactccgcc cagttccgcc cattctccgc cccatggctg    4860
actaattttt tttatttatg cagaggccga ggccgcctcg gcctctgagc tattccagaa    4920
gtagtgagga ggcttttttg gaggcctagg cttttgcaaa aagctcctcg aggaactgaa    4980
aaaccagaaa gttaactggt aagtttagtc tttttgtctt ttatttcagg tcccggatcc    5040
ggtggtggtg caaatcaaag aactgctcct cagtggatgt tgcctttact tctaggcctg    5100
tacggaagtg ttacttctgc tctaaaagct gcggaattgt acccgcggcc taatacgact    5160
cactataggg actagtatgg ttcgaccatt gaactgcatc gtcgccgtgt cccaaaatat    5220
ggggattggc aagaacggag acctaccctg gcctccgctc aggaacgagt tcaagtactt    5280
ccaaagaatg accacaacct cttcagtgga aggtaaacag aatctggtga ttatgggtag    5340
gaaaacctgg ttctccattc ctgagaagaa tcgaccttta aaggacagaa ttaatatagt    5400
tctcagtaga gaactcaaag aaccaccacg aggagctcat tttcttgcca aaagtttaga    5460
tgatgcctta agacttattg aacaaccgga attggcaagt aaagtagaca tggtttggat    5520
agtcggaggc agttctgttt accaggaagc catgaatcaa ccaggccacc tcagactctt    5580
tgtgacaagg atcatgcagg aatttgaaag tgacacgttt ttcccagaaa ttgatttggg    5640
gaaatataaa cttctcccag aatacccagg cgtcctctct gaggtccagg aggaaaaagg    5700
catcaagtat aagtttgaag tctacgagaa gaaagactaa gcggccgagc gcgcggatct    5760
ggaaacggga gatgggggag gctaactgaa gcacggaagg agacaatacc ggaaggaacc    5820
cgcgctatga cggcaataaa aagacagaat aaaacgcacg ggtgttgggt cgtttgttca    5880
taaacgcggg gttcggtccc agggctggca ctctgtcgat accccaccga gaccccattg    5940
gggccaatac gcccgcgttt cttccttttc cccaccccac cccccaagtt cgggtgaagg    6000
cccagggctc gcagccaacg tcggggcggc aggccctgcc atagccactg gccccgtggg    6060
ttagggacgg ggtcccccat ggggaatggt ttatggttcg tgggggttat tattttgggc    6120
gttgcgtggg gtctggagat cccccgggct gcaggaattc cgttacatta cttacggtaa    6180
atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg    6240
ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt    6300
aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg    6360
tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc    6420
ctacttggca gtacatctac gtattagtca tcgctattac catggtgatg cggttttggc    6480
agtacatcaa tgggcgtgga tagcggtttg actcacgggg atttccaagt ctccacccca    6540
ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta    6600
acaactccgc cccattgacg caaaagggcg ggaattcgag ctcggtactc gagcggtgtt    6660
ccgcggtcct cctcgtatag aaactcggac cactctgaga cgaaggctcg cgtccaggcc    6720
agcacgaagg aggctaagtg ggaggggtag cggtcgttgt ccactagggg gtccactcgc    6780
tccagggtgt gaagacacat gtcgccctct tcggcatcaa ggaaggtgat tggtttatag    6840
gtgtaggcca cgtgaccggg tgttcctgaa ggggggctat aaaagggggt gggggcgcgt    6900
tcgtcctcac tctcttccgc atcgctgtct gcgagggcca gctgttgggc tcgcggttga    6960
ggacaaactc ttcgcggtct ttccagtact cttggatcgg aaacccgtcg gcctccgaac    7020
ggtactccgc caccgaggga cctgagcgag tccgcatcga ccggatcgga aaacctctcg    7080
actgttgggg tgagtactcc ctctcaaaag cgggcatgac ttctgcgcta agattgtcag    7140
tttccaaaaa cgaggaggat ttgatattca cctggcccgc ggtgatgcct ttgagggtgg    7200
ccgcgtccat ctggtcagaa aagacaatct ttttgttgtc aagcttgagg tgtggcaggc    7260
ttgagatctg gccatacact tgagtgacaa tgacatccac tttgcctttc tctccacagg    7320
tgtccactcc caggtccaac cggaattgta cccgcggcca gagcttgcgg gcgccaccgc    7380
ggccgcgggg atccagacat gataagatac attgatgagt ttggacaaac cacaactaga    7440
atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc    7500
attataagct gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt    7560
cagggggagg tgtgggaggt tttttcggat cctcttggcg taatcatggt catagctgtt    7620
tcctgtgtga aattgttatc cgctcacaat tccacacaac atacgagccg gaagcataaa    7680
gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca ttaattgcgt tgcgctcact    7740
gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc    7800
ggggaaaggc ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg    7860
ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc    7920
cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag    7980
gaaccgtaaa aaggccgcgt tgctggcgtt cttccatagg ctccgccccc ctgacgagca    8040
tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca    8100
ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg    8160
atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag    8220
gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt    8280
tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca    8340
cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg    8400
cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa gaacagtatt    8460
tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc    8520
cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg    8580
cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg    8640
gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta    8700
gatccctttt aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg    8760
gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg    8820
ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc    8880
atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc cagatttatc    8940
agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc    9000
ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag    9060
tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt cgtttggtat    9120
ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg    9180
caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt    9240
gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag    9300
atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg    9360
accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata gcagaacttt    9420
aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct    9480
gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac    9540
tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat    9600
aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat    9660
ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca    9720
aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgtctaag aaaccattat    9780
tatcatgaca ttaacctata aaaataggcg tatcacgagg ccctttcgtc tcgcgcgttt    9840
cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca cagcttgtct    9900
gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg ttggcgggtg  9960
tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc accatatgcg  10020
gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc attcgccatt  10080
caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat tacgccagct  10140
ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt tttcccagtt  10200
acgacgttgt aaaacgacgg ccagtgaatt                                   10230
<210>38
<211>2901
<212>DNA
<213>人造
<220>
<223>合成构建体,编码EL246GG TEV多聚蛋白的序列。
<220>
<221>CDS
<222>(1)..(2898)
<400>38
atg gag ttt ggg ctg agc tgg ctt ttt ctt gtc gcg att tta aaa ggt      48
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1               5                   10                  15
gtc cag tgc gag gtg cag ctg gtg cag tct gga gca gag gtg aaa aag    96
Val Gln Cys Glu Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys
            20                  25                  30
ccc ggg gag tct ctg aag atc tcc tgt aag ggg tcc gga tac gca ttc    144
Pro Gly Glu Ser Leu Lys Ile Ser Cys Lys Gly Ser Gly Tyr Ala Phe
        35                  40                  45
agt agt tcc tgg atc ggc tgg gtg cgc cag atg ccc ggg aaa ggc ctg    192
Ser Ser Ser Trp Ile Gly Trp Val Arg Gln Met Pro Gly Lys Gly Leu
    50                  55                  60
gag tgg atg ggg cgg att tat cct gga gat gga gat act aac tac aat    240
Glu Trp Met Gly Arg Ile Tyr Pro Gly Asp Gly Asp Thr Asn Tyr Asn
65                  70                  75                  80
ggg aag ttc aag ggc cag gtc acc atc tca gcc gac aag tcc atc agc    288
Gly Lys Phe Lys Gly Gln Val Thr Ile Ser Ala Asp Lys Ser Ile Ser
                85                  90                  95
acc gcc tac ctg cag tgg agc agc ctg aag gct agc gac acc gcc atg    336
Thr Ala Tyr Leu Gln Trp Ser Ser Leu Lys Ala Ser Asp Thr Ala Met
            100                 105                 110
tat tac tgt gcg aga gcg cgc gtg gga tcc acg gtc tat gat ggt tac    384
Tyr Tyr Cys Ala Arg Ala Arg Val Gly Ser Thr Val Tyr Asp Gly Tyr
        115                 120                 125
ctc tat gca atg gac tac tgg ggt caa ggt acc tca gtc acc gtc tcc    432
Leu Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr Ser Val Thr Val Ser
    130                 135                 140
tca gcg tcg acc aag ggc cca tcg gtc ttc ccc ctg gca ccc tcc tcc    480
Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser
145                 150                 155                 160
aag agc acc tct ggg ggc aca gcg gcc ctg ggc tgc ctg gtc aag gac    528
Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp
                165                 170                 175
tac ttc ccc gaa ccg gtg acg gtg tcg tgg aac tca ggc gcc ctg acc    576
Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr
            180                 185                 190
agc ggc gtg cac acc ttc ccg gct gtc cta cag tcc tca gga ctc tac    624
Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr
        195                 200                 205
tcc ctc agc agc gtg gtg acc gtg ccc tcc agc agc ttg ggc acc cag    672
Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln
    210                 215                 220
acc tac atc tgc aac gtg aat cac aag ccc agc aac acc aag gtg gac    720
Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp
225                 230                 235                 240
aag aaa gtt gag ccc aaa tct tgt gac aaa act cac aca tgc cca ccg    768
Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro
                245                 250                 255
tgc cca gca cct gaa gcc gcg ggg gga ccg tca gtc ttc ctc ttc ccc    816
Cys Pro Ala Pro Glu Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro
            260                 265                 270
cca aaa ccc aag gac acc ctc atg atc tcc cgg acc cct gag gtc aca    864
Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr
        275                 280                 285
tgc gtg gtg gtg gac gtg agc cac gaa gac cct gag gtc aag ttc aac    912
Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn
    290                 295                 300
tgg tac gtg gac ggc gtg gag gtg cat aat gcc aag aca aag ccg cgg    960
Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg
305                 310                 315                 320
gag gag cag tac aac agc acg tac cgt gtg gtc agc gtc ctc acc gtc    1008
Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val
                325                 330                 335
ctg cac cag gac tgg ctg aat ggc aag gag tac aag tgc aag gtc tcc    1056
Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser
            340                 345                 350
aac aaa gcc ctc cca gcc ccc atc gag aaa acc atc tcc aaa gcc aaa    1104
Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys
        355                 360                 365
ggg cag ccc cga gaa cca cag gtg tac acc ctg ccc cca tcc cgc gag    1152
Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu
    370                 375                 380
gag atg acc aag aac cag gtc agc ctg acc tgc ctg gtc aaa ggc ttc    1200
Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe
385                 390                 395                 400
tat ccc agc gac atc gcc gtg gag tgg gag agc aat ggg cag ccg gag    1248
Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu
                405                 410                 415
aac aac tac aag acc acg cct ccc gtg ctg gac tcc gac ggc tcc ttc    1296
Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe  
            420                 425                 430
ttc ctc tac agc aag ctc acc gtg gac aag agc agg tgg cag cag ggg    1344
Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly
        435                 440                 445
aac gtc ttc tca tgc tcc gtg atg cat gag gct ctg cac aac cac tac    1392
Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr
    450                 455                 460
acg cag aag agc ctc tcc ctg tct agg ggt aaa cgc gaa cca gtt tat    1440
Thr Gln Lys Ser Leu Ser Leu Ser Arg Gly Lys Arg Glu Pro Val Tyr
465                 470                 475                 480
ttc cag ggg agc ttg ttt aag ggg ccg cgt gat tat aac cca ata tcg    1488
Phe Gln Gly Ser Leu Phe Lys Gly Pro Arg Asp Tyr Asn Pro Ile Ser
                485                 490                 495
agt gcc att tgt cat cta acg aat gaa tct gat ggg cac aca aca tcg    1536
Ser Ala Ile Cys His Leu Thr Asn Glu Ser Asp Gly His Thr Thr Ser
            500                 505                 510
ttg tat ggt att ggt ttt ggc cct ttc atc atc aca aac aag cat ttg    1584
Leu Tyr Gly Ile Gly Phe Gly Pro Phe Ile Ile Thr Asn Lys His Leu
        515                 520                 525
ttt aga aga aat aat ggt aca ctg tta gtt caa tca cta cat ggt gtg    1632
Phe Arg Arg Asn Asn Gly Thr Leu Leu Val Gln Ser Leu His Gly Val
    530                 535                 540
ttc aag gta aag aat acc aca act ttg caa caa cac ctc att gat ggg    1680
Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln His Leu Ile Asp Gly
545                 550                 555                 560
agg gac atg atg ctc att cgc atg cct aag gat ttc cca cca ttt cct    1728
Arg Asp Met Met Leu Ile Arg Met Pro Lys Asp Phe Pro Pro Phe Pro
                565                 570                 575
caa aag ctg aaa ttc aga gag cca caa agg gaa gag cgc ata tgt ctt    1776
Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu Glu Arg Ile Cys Leu
            580                 585                 590
gtg aca acc aac ttc caa act aag agc atg tct agc atg gtt tca gat    1824
Val Thr Thr Asn Phe Gln Thr Lys Ser Met Ser Ser Met Val Ser Asp
        595                 600                 605
act agt tgc aca ttc cct tca tct gat ggt ata ttc tgg aaa cat tgg    1872
Thr Ser Cys Thr Phe Pro Ser Ser Asp Gly Ile Phe Trp Lys His Trp
    610                 615                 620
att cag acc aag gat ggg cac tgt ggt agc ccg ttg gtg tca act aga    1920
Ile Gln Thr Lys Asp Gly His Cys Gly Ser Pro Leu Val Ser Thr Arg
625                 630                 635                 640
gat ggg ttt att gtt ggt ata cac tca gca tca aat ttc acc aac aca    1968
Asp Gly Phe Ile Val Gly Ile His Ser Ala Ser Asn Phe Thr Asn Thr
                645                 650                 655
aac aat tat ttt aca agt gtg ccg aaa gac ttc atg gat tta ttg aca    2016
Asn Asn Tyr Phe Thr Ser Val Pro Lys Asp Phe Met Asp Leu Leu Thr
            660                 665                 670
aat caa gag gcg cag caa tgg gtt agt ggt tgg cga ttg aat gct gac    2064
Asn Gln Glu Ala Gln Gln Trp Val Ser Gly Trp Arg Leu Asn Ala Asp
        675                 680                 685
tca gtg tta tgg gga ggc cac aaa gtt ttc atg agc aaa cct gaa gaa    2112
Ser Val Leu Trp Gly Gly His Lys Val Phe Met Ser Lys Pro Glu Glu
    690                 695                 700
ccc ttt cag cca gtc aaa gaa gca act caa ctc atg agt gaa tta gtc    2160
Pro Phe Gln Pro Val Lys Glu Ala Thr Gln Leu Met Ser Glu Leu Val
705                 710                 715                 720
tac tcg caa ggg atg gac atg cgc gtg ccc gcc cag ctg ctg ggc ctg    2208
Tyr Ser Gln Gly Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu
                725                 730                 735
ctg ctg ctg tgg ttc ccc ggc tcg cga tgc gac atc gtg atg acc cag    2256
Leu Leu Leu Trp Phe Pro Gly Ser Arg Cys Asp Ile Val Met Thr Gln
            740                 745                 750
tct cca gac tcc ctg gct gtg tct ctg ggc gag agg gcc acc atc aac    2304
Ser Pro Asp Ser Leu Ala Val Ser Leu Gly Glu Arg Ala Thr Ile Asn
        755                 760                 765
tgc aag tcc agt cag agc ctt tca tat aga agc aat caa aag aac tcg    2352
Cys Lys Ser Ser Gln Ser Leu Ser Tyr Arg Ser Asn Gln Lys Asn Ser
    770                 775                 780
ttg gcc tgg tac cag cag aaa cca gga cag cct cct aag ctg ctc att    2400
Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Pro Pro Lys Leu Leu Ile
785                 790                 795                 800
tac tgg gct agc act agg gaa tct ggg gtc cct gac cga ttc agt gga    2448
Tyr Trp Ala Ser Thr Arg Glu Ser Gly Val Pro Asp Arg Phe Ser Gly
                805                 810                 815
tcc ggg tct ggg aca gat ttc act ctc acc atc agc agc ctg cag gct    2496
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Ala
            820                 825                 830
gaa gat gtg gca gtt tat tac tgt cac caa tat tat agc tat ccg tac    2544
Glu Asp Val Ala Val Tyr Tyr Cys His Gln Tyr Tyr Ser Tyr Pro Tyr
        835                 840                 845
acg ttc gga ggg ggg acc aag gtg gaa att aaa cgt acg gtg gct gca    2592
Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala
    850                 855                 860
cca tct gtc ttc atc ttc ccg cca tct gat gag cag ttg aaa tct gga    2640
Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly
865                 870                 875                 880
act gcc tct gtt gtg tgc ctg ctg aat aac ttc tat ccc aga gag gcc    2688
Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala
                885                 890                 895
aaa gta cag tgg aag gtg gat aac gcc ctc caa tcg ggt aac tcc cag    2736
Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln
            900                 905                 910
gag agt gtc aca gag cag gac agc aag gac agc acc tac agc ctc agc    2784
Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser
        915                 920                 925
agc acc ctg acg ctg agc aaa gca gac tac gag aaa cac aaa gtc tac    2832
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr
    930                 935                 940
gcc tgc gaa gtc acc cat cag ggc ctg agc tcg ccc gtc aca aag agc    2880
Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser
945                 950                 955                 960
ttc aac agg gga gag tgt tga                                        2901
Phe Asn Arg Gly Glu Cys
                965
<210>39
<211>966
<212>PRT
<213>人造
<220>
<223>合成构建体
<400>39
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1               5                   10                  15
Val Gln Cys Glu Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys
            20                 25                 30
Pro Gly Glu Ser Leu Lys Ile Ser Cys Lys Gly Ser Gly Tyr Ala Phe
        35                  40                  45
Ser Ser Ser Trp Ile Gly Trp Val Arg Gln Met Pro Gly Lys Gly Leu
    50                  55                  60
Glu Trp Met Gly Arg Ile Tyr Pro Gly Asp Gly Asp Thr Asn Tyr Asn
65                  70                  75                  80
Gly Lys Phe Lys Gly Gln Val Thr Ile Ser Ala Asp Lys Ser Ile Ser
                85                  90                  95
Thr Ala Tyr Leu Gln Trp Ser Ser Leu Lys Ala Ser Asp Thr Ala Met
            100                 105                 110
Tyr Tyr Cys Ala Arg Ala Arg Val Gly Ser Thr Val Tyr Asp Gly Tyr
        115                 120                 125
Leu Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr Ser Val Thr Val Ser
    130                 135                 140
Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser
145                 150                 155                 160
Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp
                165                 170                 175
Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr
            180                 185                 190
Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr
        195                 200                 205
Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln
    210                 215                 220
Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp
225                 230                 235                 240
Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro
                245                 250                 255
Cys Pro Ala Pro Glu Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro
            260                 265                 270
Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr
        275                 280                 285
Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn
    290                 295                 300
Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg
305                 310                 315                 320
Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val
                325                 330                 335
Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser
            340                 345                 350
Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys
        355                 360                 365
Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu
    370                 375                 380
Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe
385                 390                 395                 400
Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu
                405                 410                 415
Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe
            420                 425                 430
Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly
        435                 440                 445
Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr
    450                 455                 460
Thr Gln Lys Ser Leu Ser Leu Ser Arg Gly Lys Arg Glu Pro Val Tyr
465                 470                 475                 480
Phe Gln Gly Ser Leu Phe Lys Gly Pro Arg Asp Tyr Asn Pro Ile Ser
                485                 490                 495
Ser Ala Ile Cys His Leu Thr Asn Glu Ser Asp Gly His Thr Thr Ser
            500                 505                 510
Leu Tyr Gly Ile Gly Phe Gly Pro Phe Ile Ile Thr Asn Lys His Leu
        515                 520                 525
Phe Arg Arg Asn Asn Gly Thr Leu Leu Val Gln Ser Leu His Gly Val
    530                 535                 540
Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln His Leu Ile Asp Gly
545                 550                 555                 560
Arg Asp Met Met Leu Ile Arg Met Pro Lys Asp Phe Pro Pro Phe Pro
                565                 570                 575
Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu Glu Arg Ile Cys Leu
            580                 585                 590
Val Thr Thr Asn Phe Gln Thr Lys Ser Met Ser Ser Met Val Ser Asp
        595                 600                 605
Thr Ser Cys Thr Phe Pro Ser Ser Asp Gly Ile Phe Trp Lys His Trp
    610                 615                 620
Ile Gln Thr Lys Asp Gly His Cys Gly Ser Pro Leu Val Ser Thr Arg
625                 630                 635                 640
Asp Gly Phe Ile Val Gly Ile His Ser Ala Ser Asn Phe Thr Asn Thr
                645                 650                 655
Asn Asn Tyr Phe Thr Ser Val Pro Lys Asp Phe Met Asp Leu Leu Thr
            660                 665                 670
Asn Gln Glu Ala Gln Gln Trp Val Ser Gly Trp Arg Leu Asn Ala Asp
        675                 680                 685
Ser Val Leu Trp Gly Gly His Lys Val Phe Met Ser Lys Pro Glu Glu
    690                 695                 700
Pro Phe Gln Pro Val Lys Glu Ala Thr Gln Leu Met Ser Glu Leu Val
705                 710                 715                 720
Tyr Ser Gln Gly Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu
                725                 730                 735
Leu Leu Leu Trp Phe Pro Gly Ser Arg Cys Asp Ile Val Met Thr Gln
            740                 745                 750
Ser Pro Asp Ser Leu Ala Val Ser Leu Gly Glu Arg Ala Thr Ile Asn
        755                 760                 765
Cys Lys Ser Ser Gln Ser Leu Ser Tyr Arg Ser Asn Gln Lys Asn Ser
    770                 775                 780
Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Pro Pro Lys Leu Leu Ile
785                 790                 795                 800
Tyr Trp Ala Ser Thr Arg Glu Ser Gly Val Pro Asp Arg Phe Ser Gly
                805                 810                 815
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Ala
            820                 825                 830
Glu Asp Val Ala Val Tyr Tyr Cys His Gln Tyr Tyr Ser Tyr Pro Tyr
        835                 840                 845
Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala
    850                 855                 860
Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly
865                 870                 875                 880
Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala
                885                 890                 895
Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln
            900                 905                 910
Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser
        915                 920                 925
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr
    930                 935                 940
Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser
945                 950                 955                 960
Phe Asn Arg Gly Glu Cys
                965
<210>40
<211>10278
<212>DNA
<213>人造
<220>
<223>合成构建体,EL246 GG TEV多聚蛋白表达载体。
<400>40
gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc    60
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat    120
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc    180
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga    240
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg    300
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat    360
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt    420
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc    480
cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg    540
tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg    600
aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg    660
gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag    720
gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc    780
tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa    840
actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact    900
ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt    960
ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca    1020
aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt    1080
ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga    1140
tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca    1200
ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag    1260
tttgggctga gctggctttt tcttgtcgcg attttaaaag gtgtccagtg cgaggtgcag    1320
ctggtgcagt ctggagcaga ggtgaaaaag cccggggagt ctctgaagat ctcctgtaag    1380
gggtccggat acgcattcag tagttcctgg atcggctggg tgcgccagat gcccgggaaa    1440
ggcctggagt ggatggggcg gatttatcct ggagatggag atactaacta caatgggaag    1500
ttcaagggcc aggtcaccat ctcagccgac aagtccatca gcaccgccta cctgcagtgg    1560
agcagcctga aggctagcga caccgccatg tattactgtg cgagagcgcg cgtgggatcc    1620
acggtctatg atggttacct ctatgcaatg gactactggg gtcaaggtac ctcagtcacc    1680
gtctcctcag cgtcgaccaa gggcccatcg gtcttccccc tggcaccctc ctccaagagc    1740
acctctgggg gcacagcggc cctgggctgc ctggtcaagg actacttccc cgaaccggtg    1800
acggtgtcgt ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta    1860
cagtcctcag gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc    1920
acccagacct acatctgcaa cgtgaatcac aagcccagca acaccaaggt ggacaagaaa    1980
gttgagccca aatcttgtga caaaactcac acatgcccac cgtgcccagc acctgaagcc    2040
gcggggggac cgtcagtctt cctcttcccc ccaaaaccca aggacaccct catgatctcc    2100
cggacccctg aggtcacatg cgtggtggtg gacgtgagcc acgaagaccc tgaggtcaag    2160
ttcaactggt acgtggacgg cgtggaggtg cataatgcca agacaaagcc gcgggaggag    2220
cagtacaaca gcacgtaccg tgtggtcagc gtcctcaccg tcctgcacca ggactggctg    2280
aatggcaagg agtacaagtg caaggtctcc aacaaagccc tcccagcccc catcgagaaa    2340
accatctcca aagccaaagg gcagccccga gaaccacagg tgtacaccct gcccccatcc    2400
cgcgaggaga tgaccaagaa ccaggtcagc ctgacctgcc tggtcaaagg cttctatccc    2460
agcgacatcg ccgtggagtg ggagagcaat gggcagccgg agaacaacta caagaccacg    2520
cctcccgtgc tggactccga cggctccttc ttcctctaca gcaagctcac cgtggacaag    2580
agcaggtggc agcaggggaa cgtcttctca tgctccgtga tgcatgaggc tctgcacaac    2640
cactacacgc agaagagcct ctccctgtct aggggtaaac gcgaaccagt ttatttccag    2700
gggagcttgt ttaaggggcc gcgtgattat aacccaatat cgagtgccat ttgtcatcta    2760
acgaatgaat ctgatgggca cacaacatcg ttgtatggta ttggttttgg ccctttcatc    2820
atcacaaaca agcatttgtt tagaagaaat aatggtacac tgttagttca atcactacat    2880
ggtgtgttca aggtaaagaa taccacaact ttgcaacaac acctcattga tgggagggac    2940
atgatgctca ttcgcatgcc taaggatttc ccaccatttc ctcaaaagct gaaattcaga    3000
gagccacaaa gggaagagcg catatgtctt gtgacaacca acttccaaac taagagcatg    3060
tctagcatgg tttcagatac tagttgcaca ttcccttcat ctgatggtat attctggaaa    3120
cattggattc agaccaagga tgggcactgt ggtagcccgt tggtgtcaac tagagatggg    3180
tttattgttg gtatacactc agcatcaaat ttcaccaaca caaacaatta ttttacaagt    3240
gtgccgaaag acttcatgga tttattgaca aatcaagagg cgcagcaatg ggttagtggt    3300
tggcgattga atgctgactc agtgttatgg ggaggccaca aagttttcat gagcaaacct    3360
gaagaaccct ttcagccagt caaagaagca actcaactca tgagtgaatt agtctactcg    3420
caagggatgg acatgcgcgt gcccgcccag ctgctgggcc tgctgctgct gtggttcccc    3480
ggctcgcgat gcgacatcgt gatgacccag tctccagact ccctggctgt gtctctgggc    3540
gagagggcca ccatcaactg caagtccagt cagagccttt catatagaag caatcaaaag    3600
aactcgttgg cctggtacca gcagaaacca ggacagcctc ctaagctgct catttactgg    3660
gctagcacta gggaatctgg ggtccctgac cgattcagtg gatccgggtc tgggacagat    3720
ttcactctca ccatcagcag cctgcaggct gaagatgtgg cagtttatta ctgtcaccaa    3780
tattatagct atccgtacac gttcggaggg gggaccaagg tggaaattaa acgtacggtg    3840
gctgcaccat ctgtcttcat cttcccgcca tctgatgagc agttgaaatc tggaactgcc    3900
tctgttgtgt gcctgctgaa taacttctat cccagagagg ccaaagtaca gtggaaggtg    3960
gataacgccc tccaatcggg taactcccag gagagtgtca cagagcagga cagcaaggac    4020
agcacctaca gcctcagcag caccctgacg ctgagcaaag cagactacga gaaacacaaa    4080
gtctacgcct gcgaagtcac ccatcagggc ctgagctcgc ccgtcacaaa gagcttcaac    4140
aggggagagt gttgagcggc cgcgtttaaa ctgaatgagc gcgtccatcc agacatgata    4200
agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt    4260
tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt    4320
aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt    4380
taaagcaagt aaaacctcta caaatgtggt atggctgatt atgatccggc tgcctcgcgc    4440
gtttcggtga tgacggtgaa aacctctgac acatgcagct cccggagacg gtcacagctt    4500
gtctgtaagc ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg    4560
ggtgtcgggg cgcagccatg accggtcgac ggcgcgcctt tttttttaat ttttatttta    4620
ttttattttt gacgcgccga aggcgcgatc tgagctcggt acagcttggc tgtggaatgt    4680
gtgtcagtta gggtgtggaa agtccccagg ctccccagca ggcagaagta tgcaaagcat    4740
gcatctcaat tagtcagcaa ccaggtgtgg aaagtcccca ggctccccag caggcagaag    4800
tatgcaaagc atgcatctca attagtcagc aaccatagtc ccgcccctaa ctccgcccat    4860
cccgccccta actccgccca gttccgccca ttctccgccc catggctgac taattttttt    4920
tatttatgca gaggccgagg ccgcctcggc ctctgagcta ttccagaagt agtgaggagg    4980
cttttttgga ggcctaggct tttgcaaaaa gctcctcgag gaactgaaaa accagaaagt    5040
taactggtaa gtttagtctt tttgtctttt atttcaggtc ccggatccgg tggtggtgca    5100
aatcaaagaa ctgctcctca gtggatgttg cctttacttc taggcctgta cggaagtgtt    5160
acttctgctc taaaagctgc ggaattgtac ccgcggccta atacgactca ctatagggac    5220
tagtatggtt cgaccattga actgcatcgt cgccgtgtcc caaaatatgg ggattggcaa    5280
gaacggagac ctaccctggc ctccgctcag gaacgagttc aagtacttcc aaagaatgac    5340
cacaacctct tcagtggaag gtaaacagaa tctggtgatt atgggtagga aaacctggtt    5400
ctccattcct gagaagaatc gacctttaaa ggacagaatt aatatagttc tcagtagaga    5460
actcaaagaa ccaccacgag gagctcattt tcttgccaaa agtttagatg atgccttaag    5520
acttattgaa caaccggaat tggcaagtaa agtagacatg gtttggatag tcggaggcag    5580
ttctgtttac caggaagcca tgaatcaacc aggccacctc agactctttg tgacaaggat    5640
catgcaggaa tttgaaagtg acacgttttt cccagaaatt gatttgggga aatataaact    5700
tctcccagaa tacccaggcg tcctctctga ggtccaggag gaaaaaggca tcaagtataa    5760
gtttgaagtc tacgagaaga aagactaagc ggccgagcgc gcggatctgg aaacgggaga    5820
tgggggaggc taactgaagc acggaaggag acaataccgg aaggaacccg cgctatgacg    5880
gcaataaaaa gacagaataa aacgcacggg tgttgggtcg tttgttcata aacgcggggt    5940
tcggtcccag ggctggcact ctgtcgatac cccaccgaga ccccattggg gccaatacgc    6000
ccgcgtttct tccttttccc caccccaccc cccaagttcg ggtgaaggcc cagggctcgc    6060
agccaacgtc ggggcggcag gccctgccat agccactggc cccgtgggtt agggacgggg    6120
tcccccatgg ggaatggttt atggttcgtg ggggttatta ttttgggcgt tgcgtggggt    6180
ctggagatcc cccgggctgc aggaattccg ttacattact tacggtaaat ggcccgcctg    6240
gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa    6300
cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact    6360
tggcagtaca tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta    6420
aatggcccgc ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt    6480
acatctacgt attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg    6540
ggcgtggata gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg    6600
ggagtttgtt ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc    6660
cattgacgca aaagggcggg aattcgagct cggtactcga gcggtgttcc gcggtcctcc    6720
tcgtatagaa actcggacca ctctgagacg aaggctcgcg tccaggccag cacgaaggag    6780
gctaagtggg aggggtagcg gtcgttgtcc actagggggt ccactcgctc cagggtgtga    6840
agacacatgt cgccctcttc ggcatcaagg aaggtgattg gtttataggt gtaggccacg    6900
tgaccgggtg ttcctgaagg ggggctataa aagggggtgg gggcgcgttc gtcctcactc    6960
tcttccgcat cgctgtctgc gagggccagc tgttgggctc gcggttgagg acaaactctt    7020
cgcggtcttt ccagtactct tggatcggaa acccgtcggc ctccgaacgg tactccgcca    7080
ccgagggacc tgagcgagtc cgcatcgacc ggatcggaaa acctctcgac tgttggggtg    7140
agtactccct ctcaaaagcg ggcatgactt ctgcgctaag attgtcagtt tccaaaaacg    7200
aggaggattt gatattcacc tggcccgcgg tgatgccttt gagggtggcc gcgtccatct    7260
ggtcagaaaa gacaatcttt ttgttgtcaa gcttgaggtg tggcaggctt gagatctggc    7320
catacacttg agtgacaatg acatccactt tgcctttctc tccacaggtg tccactccca    7380
ggtccaaccg gaattgtacc cgcggccaga gcttgcgggc gccaccgcgg ccgcggggat    7440
ccagacatga taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa    7500
aaatgcttta tttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc    7560
aataaacaag ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggaggtg    7620
tgggaggttt tttcggatcc tcttggcgta atcatggtca tagctgtttc ctgtgtgaaa    7680
ttgttatccg ctcacaattc cacacaacat acgagccgga agcataaagt gtaaagcctg    7740
gggtgcctaa tgagtgagct aactcacatt aattgcgttg cgctcactgc ccgctttcca    7800
gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg ggaaaggcgg    7860
tttgcgtatt gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg    7920
gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg    7980
ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa    8040
ggccgcgttg ctggcgttct tccataggct ccgcccccct gacgagcatc acaaaaatcg    8100
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc    8160
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc    8220
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc    8280
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg    8340
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc    8400
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga    8460
gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc    8520
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac    8580
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg    8640
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc    8700
acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tcccttttaa    8760
ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta    8820
ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt    8880
tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag    8940
tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca    9000
gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc    9060
tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt    9120
tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag    9180
ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt    9240
tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat    9300
ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt    9360
gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc    9420
ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat    9480
cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag    9540
ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt    9600
ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg    9660
gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta    9720
ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc    9780
gcgcacattt ccccgaaaag tgccacctga cgtctaagaa accattatta tcatgacatt    9840
aacctataaa aataggcgta tcacgaggcc ctttcgtctc gcgcgtttcg gtgatgacgg  9900
tgaaaacctc tgacacatgc agctcccgga gacggtcaca gcttgtctgt aagcggatgc  9960
cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt ggcgggtgtc ggggctggct  10020
taactatgcg gcatcagagc agattgtact gagagtgcac catatgcggt gtgaaatacc  10080
gcacagatgc gtaaggagaa aataccgcat caggcgccat tcgccattca ggctgcgcaa  10140
ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta cgccagctgg cgaaaggggg  10200
atgtgctgca aggcgattaa gttgggtaac gccagggttt tcccagttac gacgttgtaa  10260
aacgacggcc agtgaatt                                                10278
<210>41
<211>2865
<212>DNA
<213>人造
<220>
<223>合成构建体,ABT-325 TEV多聚蛋白编码序列。
<220>
<221>CDS
<222>(1)..(2862)
<400>41
atg gag ttt ggg ctg agc tgg ctt ttc ctt gtc gcg att tta aaa ggt    48
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1               5                   10                  15
gtc cag tgt gag gtg cag ctg gtg cag tct gga aca gag gtg aaa aaa    96
Val Gln Cys Glu Val Gln Leu Val Gln Ser Gly Thr Glu Val Lys Lys
            20                  25                  30
ccc ggg gag tct ctg aag atc tcc tgt aag ggt tct gga tac act gtt    144
Pro Gly Glu Ser Leu Lys Ile Ser Cys Lys Gly Ser Gly Tyr Thr Val
        35                  40                  45
acc agt tac tgg atc ggc tgg gtg cgc cag atg ccc ggg aaa ggc ctg    192
Thr Ser Tyr Trp Ile Gly Trp Val Arg Gln Met Pro Gly Lys Gly Leu
    50                  55                  60
gag tgg atg gga ttc atc tat cct ggt gac tct gaa acc aga tac agt    240
Glu Trp Met Gly Phe Ile Tyr Pro Gly Asp Ser Glu Thr Arg Tyr Ser
65                  70                  75                  80
ccg acc ttc caa ggc cag gtc acc atc tca gcc gac aag tcc ttc aat    288
Pro Thr Phe Gln Gly Gln Val Thr Ile Ser Ala Asp Lys Ser Phe Asn
                85                  90                  95
acc gcc ttc ctg cag tgg agc agt cta aag gcc tcg gac acc gcc atg    336
Thr Ala Phe Leu Gln Trp Ser Ser Leu Lys Ala Ser Asp Thr Ala Met
            100                 105                 110
tat tac tgt gcg cga gtc ggc agt ggc tgg tac cct tat act ttt gat    384
Tyr Tyr Cys Ala Arg Val Gly Ser Gly Trp Tyr Pro Tyr Thr Phe Asp
        115                 120                 125
atc tgg ggc caa ggg aca atg gtc acc gtc tct tca gcg tcg acc aag    432
Ile Trp Gly Gln Gly Thr Met Val Thr Val Ser Ser Ala Ser Thr Lys
    130                 135                 140
ggc cca tcg gtc ttc ccc ctg gca ccc tcc tcc aag agc acc tct ggg    480
Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly
145                 150                 155                 160
ggc aca gcg gcc ctg ggc tgc ctg gtc aag gac tac ttc ccc gaa ccg    528
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro
                165                 170                 175
gtg acg gtg tcg tgg aac tca ggc gcc ctg acc agc ggc gtg cac acc    576
Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr
            180                 185                 190
ttc ccg gct gtc cta cag tcc tca gga ctc tac tcc ctc agc agc gtg    624
Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val
        195                 200                 205
gtg acc gtg ccc tcc agc agc ttg ggc acc cag acc tac atc tgc aac    672
Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn
    210                 215                 220
gtg aat cac aag ccc agc aac acc aag gtg gac aag aaa gtt gag ccc    720
Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro
225                 230                 235                 240
aaa tct tgt gac aaa act cac aca tgc cca ccg tgc cca gca cct gaa    768
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
                245                 250                 255
gcc gcg ggg gga ccg tca gtc ttc ctc ttc ccc cca aaa ccc aag gac    816
Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
            260                 265                 270
acc ctc atg atc tcc cgg acc cct gag gtc aca tgc gtg gtg gtg gac    864
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
        275                 280                 285
gtg agc cac gaa gac cct gag gtc aag ttc aac tgg tac gtg gac ggc    912
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
    290                 295                 300
gtg gag gtg cat aat gcc aag aca aag ccg cgg gag gag cag tac aac    960
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
305                 310                 315                 320
agc acg tac cgt gtg gtc agc gtc ctc acc gtc ctg cac cag gac tgg    1008
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
                325                 330                 335
ctg aat ggc aag gag tac aag tgc aag gtc tcc aac aaa gcc ctc cca    1056
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
            340                 345                 350
gcc ccc atc gag aaa acc atc tcc aaa gcc aaa ggg cag ccc cga gaa    1104
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
        355                 360                 365
cca cag gtg tac acc ctg ccc cca tcc cgc gag gag atg acc aag aac    1152
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn
    370                 375                 380
cag gtc agc ctg acc tgc ctg gtc aaa ggc ttc tat ccc agc gac atc    1200
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
385                 390                 395                 400
gcc gtg gag tgg gag agc aat ggg cag ccg gag aac aac tac aag acc    1248
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
                405                 410                 415
acg cct ccc gtg ctg gac tcc gac ggc tcc ttc ttc ctc tac agc aag    1296
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
            420                 425                 430
ctc acc gtg gac aag agc agg tgg cag cag ggg aac gtc ttc tca tgc    1344
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
        435                 440                 445
tcc gtg atg cat gag gct ctg cac aac cac tac acg cag aag agc ctc    1392
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
    450                 455                 460
tcc ctg tct agg ggt aaa cgc gaa cca gtt tat ttc cag ggg agc ttg    1440
Ser Leu Ser Arg Gly Lys Arg Glu Pro Val Tyr Phe Gln Gly Ser Leu
465                 470                 475                 480
ttt aag ggg ccg cgt gat tat aac cca ata tcg agt gcc att tgt cat    1488
Phe Lys Gly Pro Arg Asp Tyr Asn Pro Ile Ser Ser Ala Ile Cys His
                485                 490                 495
cta acg aat gaa tct gat ggg cac aca aca tcg ttg tat ggt att ggt    1536
Leu Thr Asn Glu Ser Asp Gly His Thr Thr Ser Leu Tyr Gly Ile Gly
            500                 505                 510
ttt ggc cct ttc atc atc aca aac aag cat ttg ttt aga aga aat aat    1584
Phe Gly Pro Phe Ile Ile Thr Asn Lys His Leu Phe Arg Arg Asn Asn
        515                 520                 525
ggt aca ctg tta gtt caa tca cta cat ggt gtg ttc aag gta aag aat    1632
Gly Thr Leu Leu Val Gln Ser Leu His Gly Val Phe Lys Val Lys Asn
    530                 535                 540
acc aca act ttg caa caa cac ctc att gat ggg agg gac atg atg ctc    1680
Thr Thr Thr Leu Gln Gln His Leu Ile Asp Gly Arg Asp Met Met Leu
545                 550                 555                 560
att cgc atg cct aag gat ttc cca cca ttt cct caa aag ctg aaa ttc    1728
Ile Arg Met Pro Lys Asp Phe Pro Pro Phe Pro Gln Lys Leu Lys Phe
                565                 570                 575
aga gag cca caa agg gaa gag cgc ata tgt ctt gtg aca acc aac ttc    1776
Arg Glu Pro Gln Arg Glu Glu Arg Ile Cys Leu Val Thr Thr Asn Phe
            580                 585                 590
caa act aag agc atg tct agc atg gtt tca gat act agt tgc aca ttc    1824
Gln Thr Lys Ser Met Ser Ser Met Val Ser Asp Thr Ser Cys Thr Phe
        595                 600                 605
cct tca tct gat ggt ata ttc tgg aaa cat tgg att cag acc aag gat    1872
Pro Ser Ser Asp Gly Ile Phe Trp Lys His Trp Ile Gln Thr Lys Asp
    610                 615                 620
ggg cac tgt ggt agc ccg ttg gtg tca act aga gat ggg ttt att gtt    1920
Gly His Cys Gly Ser Pro Leu Val Ser Thr Arg Asp Gly Phe Ile Val
625                 630                 635                 640
ggt ata cac tca gca tca aat ttc acc aac aca aac aat tat ttt aca    1968
Gly Ile His Ser Ala Ser Asn Phe Thr Asn Thr Asn Asn Tyr Phe Thr
                645                 650                 655
agt gtg ccg aaa gac ttc atg gat tta ttg aca aat caa gag gcg cag    2016
Ser Val Pro Lys Asp Phe Met Asp Leu Leu Thr Asn Gln Glu Ala Gln
            660                 665                 670
caa tgg gtt agt ggt tgg cga ttg aat gct gac tca gtg tta tgg gga    2064
Gln Trp Val Ser Gly Trp Arg Leu Asn Ala Asp Ser Val Leu Trp Gly
675                 680                 685
ggc cac aaa gtt ttc atg agc aaa cct gaa gaa ccc ttt cag cca gtc    2112
Gly His Lys Val Phe Met Ser Lys Pro Glu Glu Pro Phe Gln Pro Val
                690                 695                 700
aaa gaa gca act caa ctc atg agt gaa tta gtc tac tcg caa ggg atg    2160
Lys Glu Ala Thr Gln Leu Met Ser Glu Leu Val Tyr Ser Gln Gly Met
705                 710                 715                 720
gaa gcc cca gcg cag ctt ctc ttc ctc ctg cta ctc tgg ctc cca gat    2208
Glu Ala Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro Asp
                725                 730                 735
acc act gga gaa ata gtg atg acg cag tct cca gcc acc ctg tct gtg    2256
Thr Thr Gly Glu Ile Val Met Thr Gln Ser Pro Ala Thr Leu Ser Val
            740                 745                 750
tct cca ggg gaa aga gcc acc ctc tcc tgc agg gcc agt gag agt att    2304
Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Glu Ser Ile
    755                 760                 765
agc agc aac tta gcc tgg tac cag cag aaa cct ggc cag gct ccc agg    2352
Ser Ser Asn Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg
    770                 775                 780
ctc ttc atc tat act gca tcc acc agg gcc act gat atc cca gcc agg    2400
Leu Phe Ile Tyr Thr Ala Ser Thr Arg Ala Thr Asp Ile Pro Ala Arg
785                 790                 795                 800
ttc agt ggc agt ggg tct ggg aca gag ttc act ctc acc atc agc agc    2448
Phe Ser Gly Ser Gly Ser Gly Thr Glu Phe Thr Leu Thr Ile Ser Ser
                805                 810                 815
ctg cag tct gaa gat ttt gca gtt tat tac tgt cag cag tat aat aac    2496
Leu Gln Ser Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Asn Asn
            820                 825                 830
tgg cct tcg atc acc ttc ggc caa ggg aca cga ctg gag att aaa cga    2544
Trp Pro Ser Ile Thr Phe Gly Gln Gly Thr Arg Leu Glu Ile Lys Arg
        835                 840                 845
act gtg gct gca cca tct gtc ttc atc ttc ccg cca tct gat gag cag    2592
Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln
    850                 855                 860
ttg aaa tct gga act gct agc gtt gtg tgc ctg ctg aat aac ttc tat    2640
Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr
865                 870                 875                 880
ccc aga gag gcc aaa gta cag tgg aag gtg gat aac gcc ctc caa tcg    2688
Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser
                885                 890                 895
ggt aac tcc cag gag agt gtc aca gag cag gac agc aag gac agc acc    2736
Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr
            900                 905                 910
tac agc ctc agc agc acc ctg acg ctg agc aaa gca gac tac gag aaa    2784
Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys
        915                 920                 925
cac aaa gtc tac gcc tgc gaa gtc acc cat cag ggc ctg agc tcg ccc    2832
His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro
    930                 935                 940
gtc aca aag agc ttc aac agg gga gag tgt tga                        2865
Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
945                 950
<210>42
<211>954
<212>PRT
<213>人造
<220>
<223>合成构建体
<400>42
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1               5                   10                  15
Val Gln Cys Glu Val Gln Leu Val Gln Ser Gly Thr Glu Val Lys Lys
            20                  25                  30
Pro Gly Glu Ser Leu Lys Ile Ser Cys Lys Gly Ser Gly Tyr Thr Val
        35                  40                  45
Thr Ser Tyr Trp Ile Gly Trp Val Arg Gln Met Pro Gly Lys Gly Leu
    50                  55                  60
Glu Trp Met Gly Phe Ile Tyr Pro Gly Asp Ser Glu Thr Arg Tyr Ser
65                  70                  75                  80
Pro Thr Phe Gln Gly Gln Val Thr Ile Ser Ala Asp Lys Ser Phe Asn
                85                  90                  95
Thr Ala Phe Leu Gln Trp Ser Ser Leu Lys Ala Ser Asp Thr Ala Met
            100                 105                 110
Tyr Tyr Cys Ala Arg Val Gly Ser Gly Trp Tyr Pro Tyr Thr Phe Asp
        115                 120                 125
Ile Trp Gly Gln Gly Thr Met Val Thr Val Ser Ser Ala Ser Thr Lys
    130                 135                 140
Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly
145                 150                 155                 160
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro
                165                 170                 175
Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr
            180                 185                 190
Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val
        195                 200                 205
Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn
    210                 215                 220
Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro
225                 230                 235                 240
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
                245                 250                 255
Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
            260                 265                 270
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
        275                 280                 285
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
    290                 295                 300
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
305                 310                 315                 320
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
                325                 330                 335
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
            340                 345                 350
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
        355                 360                 365
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn
    370                 375                 380
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
385                 390                 395                 400
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
                405                 410                 415
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
            420                 425                 430
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
        435                 440                 445
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
    450                 455                 460
Ser Leu Ser Arg Gly Lys Arg Glu Pro Val Tyr Phe Gln Gly Ser Leu
465                 470                 475                 480
Phe Lys Gly Pro Arg Asp Tyr Asn Pro Ile Ser Ser Ala Ile Cys His
                485                 490                 495
Leu Thr Asn Glu Ser Asp Gly His Thr Thr Ser Leu Tyr Gly Ile Gly
            500                 505                 510
Phe Gly Pro Phe Ile Ile Thr Asn Lys His Leu Phe Arg Arg Asn Asn
        515                 520                 525
Gly Thr Leu Leu Val Gln Ser Leu His Gly Val Phe Lys Val Lys Asn
    530                 535                 540
Thr Thr Thr Leu Gln Gln His Leu Ile Asp Gly Arg Asp Met Met Leu
545                 550                 555                 560
Ile Arg Met Pro Lys Asp Phe Pro Pro Phe Pro Gln Lys Leu Lys Phe
                565                 570                 575
Arg Glu Pro Gln Arg Glu Glu Arg Ile Cys Leu Val Thr Thr Asn Phe
            580                 585                 590
Gln Thr Lys Ser Met Ser Ser Met Val Ser Asp Thr Ser Cys Thr Phe
        595                 600                 605
Pro Ser Ser Asp Gly Ile Phe Trp Lys His Trp Ile Gln Thr Lys Asp
    610                 615                 620
Gly His Cys Gly Ser Pro Leu Val Ser Thr Arg Asp Gly Phe Ile Val
625                 630                 635                 640
Gly Ile His Ser Ala Ser Asn Phe Thr Asn Thr Asn Asn Tyr Phe Thr
                645                 650                 655
Ser Val Pro Lys Asp Phe Met Asp Leu Leu Thr Asn Gln Glu Ala Gln
            660                 665                 670
Gln Trp Val Ser Gly Trp Arg Leu Asn Ala Asp Ser Val Leu Trp Gly
        675                 680                 685
Gly His Lys Val Phe Met Ser Lys Pro Glu Glu Pro Phe Gln Pro Val
    690                 695                 700
Lys Glu Ala Thr Gln Leu Met Ser Glu Leu Val Tyr Ser Gln Gly Met
705                 710                 715                 720
Glu Ala Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro Asp
                725                 730                 735
Thr Thr Gly Glu Ile Val Met Thr Gln Ser Pro Ala Thr Leu Ser Val
            740                 745                 750
Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Glu Ser Ile
        755                 760                 765
Ser Ser Asn Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg
    770                 775                 780
Leu Phe Ile Tyr Thr Ala Ser Thr Arg Ala Thr Asp Ile Pro Ala Arg
785                 790                 795                 800
Phe Ser Gly Ser Gly Ser Gly Thr Glu Phe Thr Leu Thr Ile Ser Ser
                805                 810                 815
Leu Gln Ser Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Asn Asn
            820                 825                 830
Trp Pro Ser Ile Thr Phe Gly Gln Gly Thr Arg Leu Glu Ile Lys Arg
        835                 840                 845
Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln
    850                 855                 860
Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr
865                 870                 875                 880
Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser
                885                 890                 895
Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr
            900                 905                 910
Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys
        915                 920                 925
His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro
    930                 935                 940
Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
945                 950
<210>43
<211>10242
<212>DNA
<213>人造
<220>
<223>合成构建体,ABT-325 TEV多聚蛋白表达载体。
<400>43
gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc    60
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat    120
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc    180
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga    240
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg    300
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat    360
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt    420
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc    480
cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg    540
tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg    600
aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg    660
gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag    720
gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc    780
tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa    840
actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact    900
ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt    960
ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca    1020
aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt    1080
ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga    1140
tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca    1200
ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag    1260
tttgggctga gctggctttt ccttgtcgcg attttaaaag gtgtccagtg tgaggtgcag    1320
ctggtgcagt ctggaacaga ggtgaaaaaa cccggggagt ctctgaagat ctcctgtaag    1380
ggttctggat acactgttac cagttactgg atcggctggg tgcgccagat gcccgggaaa    1440
ggcctggagt ggatgggatt catctatcct ggtgactctg aaaccagata cagtccgacc    1500
ttccaaggcc aggtcaccat ctcagccgac aagtccttca ataccgcctt cctgcagtgg    1560
agcagtctaa aggcctcgga caccgccatg tattactgtg cgcgagtcgg cagtggctgg    1620
tacccttata cttttgatat ctggggccaa gggacaatgg tcaccgtctc ttcagcgtcg    1680
accaagggcc catcggtctt ccccctggca ccctcctcca agagcacctc tgggggcaca    1740
gcggccctgg gctgcctggt caaggactac ttccccgaac cggtgacggt gtcgtggaac    1800
tcaggcgccc tgaccagcgg cgtgcacacc ttcccggctg tcctacagtc ctcaggactc    1860
tactccctca gcagcgtggt gaccgtgccc tccagcagct tgggcaccca gacctacatc    1920
tgcaacgtga atcacaagcc cagcaacacc aaggtggaca agaaagttga gcccaaatct    1980
tgtgacaaaa ctcacacatg cccaccgtgc ccagcacctg aagccgcggg gggaccgtca    2040
gtcttcctct tccccccaaa acccaaggac accctcatga tctcccggac ccctgaggtc    2100
acatgcgtgg tggtggacgt gagccacgaa gaccctgagg tcaagttcaa ctggtacgtg    2160
gacggcgtgg aggtgcataa tgccaagaca aagccgcggg aggagcagta caacagcacg    2220
taccgtgtgg tcagcgtcct caccgtcctg caccaggact ggctgaatgg caaggagtac    2280
aagtgcaagg tctccaacaa agccctccca gcccccatcg agaaaaccat ctccaaagcc    2340
aaagggcagc cccgagaacc acaggtgtac accctgcccc catcccgcga ggagatgacc    2400
aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga catcgccgtg    2460
gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc cgtgctggac    2520
tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag gtggcagcag    2580
gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta cacgcagaag    2640
agcctctccc tgtctagggg taaacgcgaa ccagtttatt tccaggggag cttgtttaag    2700
gggccgcgtg attataaccc aatatcgagt gccatttgtc atctaacgaa tgaatctgat    2760
gggcacacaa catcgttgta tggtattggt tttggccctt tcatcatcac aaacaagcat    2820
ttgtttagaa gaaataatgg tacactgtta gttcaatcac tacatggtgt gttcaaggta    2880
aagaatacca caactttgca acaacacctc attgatggga gggacatgat gctcattcgc    2940
atgcctaagg atttcccacc atttcctcaa aagctgaaat tcagagagcc acaaagggaa    3000
gagcgcatat gtcttgtgac aaccaacttc caaactaaga gcatgtctag catggtttca    3060
gatactagtt gcacattccc ttcatctgat ggtatattct ggaaacattg gattcagacc    3120
aaggatgggc actgtggtag cccgttggtg tcaactagag atgggtttat tgttggtata    3180
cactcagcat caaatttcac caacacaaac aattatttta caagtgtgcc gaaagacttc    3240
atggatttat tgacaaatca agaggcgcag caatgggtta gtggttggcg attgaatgct    3300
gactcagtgt tatggggagg ccacaaagtt ttcatgagca aacctgaaga accctttcag    3360
ccagtcaaag aagcaactca actcatgagt gaattagtct actcgcaagg gatggaagcc    3420
ccagcgcagc ttctcttcct cctgctactc tggctcccag ataccactgg agaaatagtg    3480
atgacgcagt ctccagccac cctgtctgtg tctccagggg aaagagccac cctctcctgc    3540
agggccagtg agagtattag cagcaactta gcctggtacc agcagaaacc tggccaggct    3600
cccaggctct tcatctatac tgcatccacc agggccactg atatcccagc caggttcagt    3660
ggcagtgggt ctgggacaga gttcactctc accatcagca gcctgcagtc tgaagatttt    3720
gcagtttatt actgtcagca gtataataac tggccttcga tcaccttcgg ccaagggaca    3780
cgactggaga ttaaacgaac tgtggctgca ccatctgtct tcatcttccc gccatctgat    3840
gagcagttga aatctggaac tgctagcgtt gtgtgcctgc tgaataactt ctatcccaga    3900
gaggccaaag tacagtggaa ggtggataac gccctccaat cgggtaactc ccaggagagt    3960
gtcacagagc aggacagcaa ggacagcacc tacagcctca gcagcaccct gacgctgagc    4020
aaagcagact acgagaaaca caaagtctac gcctgcgaag tcacccatca gggcctgagc    4080
tcgcccgtca caaagagctt caacagggga gagtgttgag cggccgcgtt taaactgaat    4140
gagcgcgtcc atccagacat gataagatac attgatgagt ttggacaaac cacaactaga    4200
atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc    4260
attataagct gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt    4320
cagggggagg tgtgggaggt tttttaaagc aagtaaaacc tctacaaatg tggtatggct    4380
gattatgatc cggctgcctc gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc    4440
agctcccgga gacggtcaca gcttgtctgt aagcggatgc cgggagcaga caagcccgtc    4500
agggcgcgtc agcgggtgtt ggcgggtgtc ggggcgcagc catgaccggt cgacggcgcg    4560
cctttttttt taatttttat tttattttat ttttgacgcg ccgaaggcgc gatctgagct    4620
cggtacagct tggctgtgga atgtgtgtca gttagggtgt ggaaagtccc caggctcccc    4680
agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccaggt gtggaaagtc    4740
cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt cagcaaccat    4800
agtcccgccc ctaactccgc ccatcccgcc cctaactccg cccagttccg cccattctcc    4860
gccccatggc tgactaattt tttttattta tgcagaggcc gaggccgcct cggcctctga    4920
gctattccag aagtagtgag gaggcttttt tggaggccta ggcttttgca aaaagctcct    4980
cgaggaactg aaaaaccaga aagttaactg gtaagtttag tctttttgtc ttttatttca    5040
ggtcccggat ccggtggtgg tgcaaatcaa agaactgctc ctcagtggat gttgccttta    5100
cttctaggcc tgtacggaag tgttacttct gctctaaaag ctgcggaatt gtacccgcgg    5160
cctaatacga ctcactatag ggactagtat ggttcgacca ttgaactgca tcgtcgccgt    5220
gtcccaaaat atggggattg gcaagaacgg agacctaccc tggcctccgc tcaggaacga    5280
gttcaagtac ttccaaagaa tgaccacaac ctcttcagtg gaaggtaaac agaatctggt    5340
gattatgggt aggaaaacct ggttctccat tcctgagaag aatcgacctt taaaggacag    5400
aattaatata gttctcagta gagaactcaa agaaccacca cgaggagctc attttcttgc    5460
caaaagttta gatgatgcct taagacttat tgaacaaccg gaattggcaa gtaaagtaga    5520
catggtttgg atagtcggag gcagttctgt ttaccaggaa gccatgaatc aaccaggcca    5580
cctcagactc tttgtgacaa ggatcatgca ggaatttgaa agtgacacgt ttttcccaga    5640
aattgatttg gggaaatata aacttctccc agaataccca ggcgtcctct ctgaggtcca    5700
ggaggaaaaa ggcatcaagt ataagtttga agtctacgag aagaaagact aagcggccga    5760
gcgcgcggat ctggaaacgg gagatggggg aggctaactg aagcacggaa ggagacaata    5820
ccggaaggaa cccgcgctat gacggcaata aaaagacaga ataaaacgca cgggtgttgg    5880
gtcgtttgtt cataaacgcg gggttcggtc ccagggctgg cactctgtcg ataccccacc    5940
gagaccccat tggggccaat acgcccgcgt ttcttccttt tccccacccc accccccaag    6000
ttcgggtgaa ggcccagggc tcgcagccaa cgtcggggcg gcaggccctg ccatagccac    6060
tggccccgtg ggttagggac ggggtccccc atggggaatg gtttatggtt cgtgggggtt    6120
attattttgg gcgttgcgtg gggtctggag atcccccggg ctgcaggaat tccgttacat    6180
tacttacggt aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa    6240
taatgacgta tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg    6300
agtatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc    6360
cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct    6420
tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga    6480
tgcggttttg gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa    6540
gtctccaccc cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc    6600
caaaatgtcg taacaactcc gccccattga cgcaaaaggg cgggaattcg agctcggtac    6660
tcgagcggtg ttccgcggtc ctcctcgtat agaaactcgg accactctga gacgaaggct    6720
cgcgtccagg ccagcacgaa ggaggctaag tgggaggggt agcggtcgtt gtccactagg    6780
gggtccactc gctccagggt gtgaagacac atgtcgccct cttcggcatc aaggaaggtg    6840
attggtttat aggtgtaggc cacgtgaccg ggtgttcctg aaggggggct ataaaagggg    6900
gtgggggcgc gttcgtcctc actctcttcc gcatcgctgt ctgcgagggc cagctgttgg    6960
gctcgcggtt gaggacaaac tcttcgcggt ctttccagta ctcttggatc ggaaacccgt    7020
cggcctccga acggtactcc gccaccgagg gacctgagcg agtccgcatc gaccggatcg    7080
gaaaacctct cgactgttgg ggtgagtact ccctctcaaa agcgggcatg acttctgcgc    7140
taagattgtc agtttccaaa aacgaggagg atttgatatt cacctggccc gcggtgatgc    7200
ctttgagggt ggccgcgtcc atctggtcag aaaagacaat ctttttgttg tcaagcttga    7260
ggtgtggcag gcttgagatc tggccataca cttgagtgac aatgacatcc actttgcctt    7320
tctctccaca ggtgtccact cccaggtcca accggaattg tacccgcggc cagagcttgc    7380
gggcgccacc gcggccgcgg ggatccagac atgataagat acattgatga gtttggacaa    7440
accacaacta gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga tgctattgct    7500
ttatttgtaa ccattataag ctgcaataaa caagttaaca acaacaattg cattcatttt    7560
atgtttcagg ttcaggggga ggtgtgggag gttttttcgg atcctcttgg cgtaatcatg    7620
gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc    7680
cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc    7740
gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat    7800
cggccaacgc gcggggaaag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac    7860
tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt    7920
aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca    7980
gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg ttcttccata ggctccgccc    8040
ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact    8100
ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct    8160
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag    8220
ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca    8280
cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa    8340
cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc    8400
gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag    8460
aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg    8520
tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca    8580
gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc    8640
tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag    8700
gatcttcacc tagatccctt ttaattaaaa atgaagtttt aaatcaatct aaagtatata    8760
tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat    8820
ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg    8880
ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc    8940
tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc    9000
aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc    9060
gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc    9120
gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc    9180
ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa    9240
gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat    9300
gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata    9360
gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca    9420
tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag    9480
gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc    9540
agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc    9600
aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata    9660
ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta    9720
gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcta    9780
agaaaccatt attatcatga cattaaccta taaaaatagg cgtatcacga ggccctttcg    9840
tctcgcgcgt ttcggtgatg acggtgaaaa cctctgacac atgcagctcc cggagacggt    9900
cacagcttgt ctgtaagcgg atgccgggag cagacaagcc cgtcagggcg cgtcagcggg    9960
tgttggcggg tgtcggggct ggcttaacta tgcggcatca gagcagattg tactgagagt    10020
gcaccatatg cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc gcatcaggcg  10080
ccattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct  10140
attacgccag ctggcgaaag ggggatgtgc tgcaaggcga ttaagttggg taacgccagg  10200
gttttcccag ttacgacgtt gtaaaacgac ggccagtgaa tt                     10242
<210>44
<211>10245
<212>DNA
<213>人造
<220>
<223>合成构建体,D2E7 TEV多聚蛋白表达载体。
<400>44
gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc    60
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat    120
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc    180
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga    240
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg    300
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat    360
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt    420
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc    480
cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg    540
tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg    600
aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg    660
gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag    720
gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc    780
tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa    840
actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact    900
ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt    960
ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca    1020
aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt    1080
ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga    1140
tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca    1200
ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag    1260
tttgggctga gctggctttt tcttgtcgcg attttaaaag gtgtccagtg tgaggtgcag    1320
ctggtggagt ctgggggagg cttggtacag cccggcaggt ccctgagact ctcctgtgcg    1380
gcctctggat tcacctttga tgattatgcc atgcactggg tccggcaagc tccagggaag    1440
ggcctggaat gggtctcagc tatcacttgg aatagtggtc acatagacta tgcggactct    1500
gtggagggcc gattcaccat ctccagagac aacgccaaga actccctgta tctgcaaatg    1560
aacagtctga gagctgagga tacggccgta tattactgtg cgaaagtctc gtaccttagc    1620
accgcgtcct cccttgacta ttggggccaa ggtaccctgg tcaccgtctc gagtgcgtcg    1680
accaagggcc catcggtctt ccccctggca ccctcctcca agagcacctc tgggggcaca    1740
gcggccctgg gctgcctggt caaggactac ttccccgaac cggtgacggt gtcgtggaac    1800
tcaggcgccc tgaccagcgg cgtgcacacc ttcccggctg tcctacagtc ctcaggactc    1860
tactccctca gcagcgtggt gaccgtgccc tccagcagct tgggcaccca gacctacatc    1920
tgcaacgtga atcacaagcc cagcaacacc aaggtggaca agaaagttga gcccaaatct    1980
tgtgacaaaa ctcacacatg cccaccgtgc ccagcacctg aactcctggg gggaccgtca    2040
gtcttcctct tccccccaaa acccaaggac accctcatga tctcccggac ccctgaggtc    2100
acatgcgtgg tggtggacgt gagccacgaa gaccctgagg tcaagttcaa ctggtacgtg    2160
gacggcgtgg aggtgcataa tgccaagaca aagccgcggg aggagcagta caacagcacg    2220
taccgtgtgg tcagcgtcct caccgtcctg caccaggact ggctgaatgg caaggagtac    2280
aagtgcaagg tctccaacaa agccctccca gcccccatcg agaaaaccat ctccaaagcc    2340
aaagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga tgagctgacc    2400
aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga catcgccgtg    2460
gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc cgtgctggac    2520
tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag gtggcagcag    2580
gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta cacgcagaag    2640
agcctctccc tgtctagggg taaacgcgaa ccagtttatt tccaggggag cttgtttaag    2700
gggccgcgtg attataaccc aatatcgagt gccatttgtc atctaacgaa tgaatctgat    2760
gggcacacaa catcgttgta tggtattggt tttggccctt tcatcatcac aaacaagcat    2820
ttgtttagaa gaaataatgg tacactgtta gttcaatcac tacatggtgt gttcaaggta    2880
aagaatacca caactttgca acaacacctc attgatggga gggacatgat gctcattcgc    2940
atgcctaagg atttcccacc atttcctcaa aagctgaaat tcagagagcc acaaagggaa    3000
gagcgcatat gtcttgtgac aaccaacttc caaactaaga gcatgtctag catggtttca    3060
gatactagtt gcacattccc ttcatctgat ggtatattct ggaaacattg gattcagacc    3120
aaggatgggc actgtggtag cccgttggtg tcaactagag atgggtttat tgttggtata    3180
cactcagcat caaatttcac caacacaaac aattatttta caagtgtgcc gaaagacttc    3240
atggatttat tgacaaatca agaggcgcag caatgggtta gtggttggcg attgaatgct    3300
gactcagtgt tatggggagg ccacaaagtt ttcatgagca aacctgaaga accctttcag    3360
ccagtcaaag aagcaactca actcatgagt gaattagtct actcgcaagg gatggacatg    3420
cgcgtgcccg cccagctgct gggcctgctg ctgctgtggt tccccggctc gcgatgcgac    3480
atccagatga cccagtctcc atcctccctg tctgcatctg taggggacag agtcaccatc    3540
acttgtcggg caagtcaggg catcagaaat tacttagcct ggtatcagca aaaaccaggg    3600
aaagccccta agctcctgat ctatgctgca tccactttgc aatcaggggt cccatctcgg    3660
ttcagtggca gtggatctgg gacagatttc actctcacca tcagcagcct acagcctgaa    3720
gatgttgcaa cttattactg tcaaaggtat aaccgtgcac cgtatacttt tggccagggg    3780
accaaggtgg aaatcaaacg tacggtggct gcaccatctg tcttcatctt cccgccatct    3840
gatgagcagt tgaaatctgg aactgcctct gttgtgtgcc tgctgaataa cttctatccc    3900
agagaggcca aagtacagtg gaaggtggat aacgccctcc aatcgggtaa ctcccaggag    3960
agtgtcacag agcaggacag caaggacagc acctacagcc tcagcagcac cctgacgctg    4020
agcaaagcag actacgagaa acacaaagtc tacgcctgcg aagtcaccca tcagggcctg    4080
agctcgcccg tcacaaagag cttcaacagg ggagagtgtt gagcggccgc gtttaaactg    4140
aatgagcgcg tccatccaga catgataaga tacattgatg agtttggaca aaccacaact    4200
agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta    4260
accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt tatgtttcag    4320
gttcaggggg aggtgtggga ggttttttaa agcaagtaaa acctctacaa atgtggtatg    4380
gctgattatg atccggctgc ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca    4440
tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagc agacaagccc    4500
gtcagggcgc gtcagcgggt gttggcgggt gtcggggcgc agccatgacc ggtcgacggc    4560
gcgccttttt ttttaatttt tattttattt tatttttgac gcgccgaagg cgcgatctga    4620
gctcggtaca gcttggctgt ggaatgtgtg tcagttaggg tgtggaaagt ccccaggctc    4680
cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca ggtgtggaaa    4740
gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt agtcagcaac    4800
catagtcccg cccctaactc cgcccatccc gcccctaact ccgcccagtt ccgcccattc    4860
tccgccccat ggctgactaa ttttttttat ttatgcagag gccgaggccg cctcggcctc    4920
tgagctattc cagaagtagt gaggaggctt ttttggaggc ctaggctttt gcaaaaagct    4980
cctcgaggaa ctgaaaaacc agaaagttaa ctggtaagtt tagtcttttt gtcttttatt    5040
tcaggtcccg gatccggtgg tggtgcaaat caaagaactg ctcctcagtg gatgttgcct    5100
ttacttctag gcctgtacgg aagtgttact tctgctctaa aagctgcgga attgtacccg    5160
cggcctaata cgactcacta tagggactag tatggttcga ccattgaact gcatcgtcgc    5220
cgtgtcccaa aatatgggga ttggcaagaa cggagaccta ccctggcctc cgctcaggaa    5280
cgagttcaag tacttccaaa gaatgaccac aacctcttca gtggaaggta aacagaatct    5340
ggtgattatg ggtaggaaaa cctggttctc cattcctgag aagaatcgac ctttaaagga    5400
cagaattaat atagttctca gtagagaact caaagaacca ccacgaggag ctcattttct    5460
tgccaaaagt ttagatgatg ccttaagact tattgaacaa ccggaattgg caagtaaagt    5520
agacatggtt tggatagtcg gaggcagttc tgtttaccag gaagccatga atcaaccagg    5580
ccacctcaga ctctttgtga caaggatcat gcaggaattt gaaagtgaca cgtttttccc    5640
agaaattgat ttggggaaat ataaacttct cccagaatac ccaggcgtcc tctctgaggt    5700
ccaggaggaa aaaggcatca agtataagtt tgaagtctac gagaagaaag actaagcggc    5760
cgagcgcgcg gatctggaaa cgggagatgg gggaggctaa ctgaagcacg gaaggagaca    5820
ataccggaag gaacccgcgc tatgacggca ataaaaagac agaataaaac gcacgggtgt    5880
tgggtcgttt gttcataaac gcggggttcg gtcccagggc tggcactctg tcgatacccc    5940
accgagaccc cattggggcc aatacgcccg cgtttcttcc ttttccccac cccacccccc    6000
aagttcgggt gaaggcccag ggctcgcagc caacgtcggg gcggcaggcc ctgccatagc    6060
cactggcccc gtgggttagg gacggggtcc cccatgggga atggtttatg gttcgtgggg    6120
gttattattt tgggcgttgc gtggggtctg gagatccccc gggctgcagg aattccgtta    6180
cattacttac ggtaaatggc ccgcctggct gaccgcccaa cgacccccgc ccattgacgt    6240
caataatgac gtatgttccc atagtaacgc caatagggac tttccattga cgtcaatggg    6300
tggagtattt acggtaaact gcccacttgg cagtacatca agtgtatcat atgccaagta    6360
cgccccctat tgacgtcaat gacggtaaat ggcccgcctg gcattatgcc cagtacatga    6420
ccttatggga ctttcctact tggcagtaca tctacgtatt agtcatcgct attaccatgg    6480
tgatgcggtt ttggcagtac atcaatgggc gtggatagcg gtttgactca cggggatttc    6540
caagtctcca ccccattgac gtcaatggga gtttgttttg gcaccaaaat caacgggact    6600
ttccaaaatg tcgtaacaac tccgccccat tgacgcaaaa gggcgggaat tcgagctcgg    6660
tactcgagcg gtgttccgcg gtcctcctcg tatagaaact cggaccactc tgagacgaag    6720
gctcgcgtcc aggccagcac gaaggaggct aagtgggagg ggtagcggtc gttgtccact    6780
agggggtcca ctcgctccag ggtgtgaaga cacatgtcgc cctcttcggc atcaaggaag    6840
gtgattggtt tataggtgta ggccacgtga ccgggtgttc ctgaaggggg gctataaaag    6900
ggggtggggg cgcgttcgtc ctcactctct tccgcatcgc tgtctgcgag ggccagctgt    6960
tgggctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg atcggaaacc    7020
cgtcggcctc cgaacggtac tccgccaccg agggacctga gcgagtccgc atcgaccgga    7080
tcggaaaacc tctcgactgt tggggtgagt actccctctc aaaagcgggc atgacttctg    7140
cgctaagatt gtcagtttcc aaaaacgagg aggatttgat attcacctgg cccgcggtga    7200
tgcctttgag ggtggccgcg tccatctggt cagaaaagac aatctttttg ttgtcaagct    7260
tgaggtgtgg caggcttgag atctggccat acacttgagt gacaatgaca tccactttgc    7320
ctttctctcc acaggtgtcc actcccaggt ccaaccggaa ttgtacccgc ggccagagct    7380
tgcgggcgcc accgcggccg cggggatcca gacatgataa gatacattga tgagtttgga    7440
caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt    7500
gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa ttgcattcat    7560
tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt cggatcctct tggcgtaatc    7620
atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg    7680
agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat    7740
tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg    7800
aatcggccaa cgcgcgggga aaggcggttt gcgtattggg cgctcttccg cttcctcgct    7860
cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc    7920
ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg    7980
ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgttcttcc ataggctccg    8040
cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg    8100
actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac    8160
cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca    8220
tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt    8280
gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc    8340
caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag    8400
agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac    8460
tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt    8520
tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa    8580
gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg    8640
gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa    8700
aaggatcttc acctagatcc cttttaatta aaaatgaagt tttaaatcaa tctaaagtat    8760
atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc    8820
gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat    8880
acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc    8940
ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc    9000
tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag    9060
ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg    9120
ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg    9180
atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag    9240
taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt    9300
catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga    9360
atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc    9420
acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc    9480
aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc    9540
ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc    9600
cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca    9660
atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat    9720
ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt    9780
ctaagaaacc attattatca tgacattaac ctataaaaat aggcgtatca cgaggccctt    9840
tcgtctcgcg cgtttcggtg atgacggtga aaacctctga cacatgcagc tcccggagac    9900
ggtcacagct tgtctgtaag cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc    9960
gggtgttggc gggtgtcggg gctggcttaa ctatgcggca tcagagcaga ttgtactgag    10020
agtgcaccat atgcggtgtg aaataccgca cagatgcgta aggagaaaat accgcatcag  10080
gcgccattcg ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc  10140
gctattacgc cagctggcga aagggggatg tgctgcaagg cgattaagtt gggtaacgcc  10200
agggttttcc cagttacgac gttgtaaaac gacggccagt gaatt                  10245
<210>45
<211>2196
<212>DNA
<213>人造
<220>
<223>合成构建体,编码D2E7内部裂解信号肽构建体的序列。
<220>
<221>CDS
<222>(1)..(2193)
<400>45
atg gag ttt ggg ctg agc tgg ctt ttt ctt gtc gcg att tta aaa ggt 48
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1               5                   10                  15
gtc cag tgt gag gtg cag ctg gtg gag tct ggg gga ggc ttg gta cag    96
Val Gln Cys Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln
            20                  25                  30
ccc ggc agg tcc ctg aga ctc tcc tgt gcg gcc tct gga ttc acc ttt    144
Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
        35                  40                  45
gat gat tat gcc atg cac tgg gtc cgg caa gct cca ggg aag ggc ctg    192
Asp Asp Tyr Ala Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
    50                  55                  60
gaa tgg gtc tca gct atc act tgg aat agt ggt cac ata gac tat gcg    240
Glu Trp Val Ser Ala Ile Thr Trp Asn Ser Gly His Ile Asp Tyr Ala
65                  70                  75                  80
gac tct gtg gag ggc cga ttc acc atc tcc aga gac aac gcc aag aac    288
Asp Ser Val Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
                85                  90                  95
tcc ctg tat ctg caa atg aac agt ctg aga gct gag gat acg gcc gta    336
Ser Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val
            100                 105                 110
tat tac tgt gcg aaa gtc tcg tac ctt agc acc gcg tcc tcc ctt gac    384
Tyr Tyr Cys Ala Lys Val Ser Tyr Leu Ser Thr Ala Ser Ser Leu Asp
        115                 120                 125
tat tgg ggc caa ggt acc ctg gtc acc gtc tcg agt gcg tcg acc aag    432
Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys
    130                 135                 140
ggc cca tcg gtc ttc ccc ctg gca ccc tcc tcc aag agc acc tct ggg    480
Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly
145                 150                 155                 160
ggc aca gcg gcc ctg ggc tgc ctg gtc aag gac tac ttc ccc gaa ccg    528
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro
                165                 170                 175
gtg acg gtg tcg tgg aac tca ggc gcc ctg acc agc ggc gtg cac acc    576
Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr
            180                 185                 190
ttc ccg gct gtc cta cag tcc tca gga ctc tac tcc ctc agc agc gtg    624
Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val
        195                 200                 205
gtg acc gtg ccc tcc agc agc ttg ggc acc cag acc tac atc tgc aac    672
Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn
    210                 215                 220
gtg aat cac aag ccc agc aac acc aag gtg gac aag aaa gtt gag ccc    720
Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro
225                 230                 235                 240
aaa tct tgt gac aaa act cac aca tgc cca ccg tgc cca gca cct gaa    768
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
                245                 250                 255
ctc ctg ggg gga ccg tca gtc ttc ctc ttc ccc cca aaa ccc aag gac    816
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
            260                 265                 270
acc ctc atg atc tcc cgg acc cct gag gtc aca tgc gtg gtg gtg gac    864
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
        275                 280                 285
gtg agc cac gaa gac cct gag gtc aag ttc aac tgg tac gtg gac ggc    912
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
    290                 295                 300
gtg gag gtg cat aat gcc aag aca aag ccg cgg gag gag cag tac aac    960
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
305                 310                 315                 320
agc acg tac cgt gtg gtc agc gtc ctc acc gtc ctg cac cag gac tgg    1008
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
                325                 330                 335
ctg aat ggc aag gag tac aag tgc aag gtc tcc aac aaa gcc ctc cca    1056
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
            340                 345                 350
gcc ccc atc gag aaa acc atc tcc aaa gcc aaa ggg cag ccc cga gaa    1104
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
        355                 360                 365
cca cag gtg tac acc ctg ccc cca tcc cgg gat gag ctg acc aag aac    1152
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn
    370                 375                 380
cag gtc agc ctg acc tgc ctg gtc aaa ggc ttc tat ccc agc gac atc    1200
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
385                 390                 395                 400
gcc gtg gag tgg gag agc aat ggg cag ccg gag aac aac tac aag acc    1248
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
                405                 410                 415
acg cct ccc gtg ctg gac tcc gac ggc tcc ttc ttc ctc tac agc aag    1296
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
            420                 425                 430
ctc acc gtg gac aag agc agg tgg cag cag ggg aac gtc ttc tca tgc    1344
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
        435                 440                 445
tcc gtg atg cat gag gct ctg cac aac cac tac acg cag aag agc ctc    1392
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
    450                 455                 460
tcc ctg tct agg ggt aaa cgc atg gga cga atg gca atg aaa tgg tta    1440
Ser Leu Ser Arg Gly Lys Arg Met Gly Arg Met Ala Met Lys Trp Leu
465                 470                 475                 480
gtt gtt ata ata tgt ttc tct ata aca agt caa cct gct tct gct atg    1488
Val Val Ile Ile Cys Phe Ser Ile Thr Ser Gln Pro Ala Ser Ala Met
                485                 490                 495
gac atg cgc gtg ccc gcc cag ctg ctg ggc ctg ctg ctg ctg tgg ttc    1536
Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe
            500                 505                 510
ccc ggc tcg cga tgc gac atc cag atg acc cag tct cca tcc tcc ctg    1584
Pro Gly Ser Arg Cys Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu
        515                 520                 525
tct gca tct gta ggg gac aga gtc acc atc act tgt cgg gca agt cag    1632
Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln
    530                 535                 540
ggc atc aga aat tac tta gcc tgg tat cag caa aaa cca ggg aaa gcc    1680
Gly Ile Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala
545                 550                 555                 560
cct aag ctc ctg atc tat gct gca tcc act ttg caa tca ggg gtc cca    1728
Pro Lys Leu Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val Pro
                565                 570                 575
tct cgg ttc agt ggc agt gga tct ggg aca gat ttc act ctc acc atc    1776
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile
            580                 585                 590
agc agc cta cag cct gaa gat gtt gca act tat tac tgt caa agg tat    1824
Ser Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg Tyr
        595                 600                 605
aac cgt gca ccg tat act ttt ggc cag ggg acc aag gtg gaa atc aaa    1872
Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys
    610                 615                 620
cgt acg gtg gct gca cca tct gtc ttc atc ttc ccg cca tct gat gag    1920
Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu
625                 630                 635                 640
cag ttg aaa tct gga act gcc tct gtt gtg tgc ctg ctg aat aac ttc    1968
Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe
                645                 650                 655
tat ccc aga gag gcc aaa gta cag tgg aag gtg gat aac gcc ctc caa    2016
Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln
            660                 665                 670
tcg ggt aac tcc cag gag agt gtc aca gag cag gac agc aag gac agc    2064
Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser
        675                 680                 685
acc tac agc ctc agc agc acc ctg acg ctg agc aaa gca gac tac gag    2112
Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu
    690                 695                 700
aaa cac aaa gtc tac gcc tgc gaa gtc acc cat cag ggc ctg agc tcg    2160
Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser
705                 710                 715                 720
ccc gtc aca aag agc ttc aac agg gga gag tgt tga                    2196
Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
                725                 730
<210>46
<211>731
<212>PRT
<213>人造
<220>
<223>合成构建体
<400>46
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1               5                   10                  15
Val Gln Cys Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln
            20                  25                  30
Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
        35                  40                  45
Asp Asp Tyr Ala Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
    50                  55                  60
Glu Trp Val Ser Ala Ile Thr Trp Asn Ser Gly His Ile Asp Tyr Ala
65                  70                  75                  80
Asp Ser Val Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
                85                  90                  95
Ser Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val
            100                 105                 110
Tyr Tyr Cys Ala Lys Val Ser Tyr Leu Ser Thr Ala Ser Ser Leu Asp
        115                 120                 125
Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys
    130                 135                 140
Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly
145                 150                 155                 160
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro
                165                 170                 175
Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr
            180                 185                 190
Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val
        195                 200                 205
Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn
    210                 215                 220
Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro
225                 230                 235                 240
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
                245                 250                 255
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
            260                 265                 270
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
        275                 280                 285
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
    290                 295                 300
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
305                 310                 315                 320
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
                325                 330                 335
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
            340                 345                 350
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
        355                 360                 365
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn
    370                 375                 380
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
385                 390                 395                 400
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
                405                 410                 415
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
            420                 425                 430
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
        435                 440                 445
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
    450                 455                 460
Ser Leu Ser Arg Gly Lys Arg Met Gly Arg Met Ala Met Lys Trp Leu
465                 470                 475                 480
Val Val Ile Ile Cys Phe Ser Ile Thr Ser Gln Pro Ala Ser Ala Met
                485                 490                 495
Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe
            500                 505                 510
Pro Gly Ser Arg Cys Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu
        515                 520                 525
Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln
    530                 535                 540
Gly Ile Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala
545                 550                 555                 560
Pro Lys Leu Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val Pro
                565                 570                 575
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile
            580                 585                 590
Ser Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg Tyr
        595                 600                 605
Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys
    610                 615                 620
Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu
625                 630                 635                 640
Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe
                645                 650                 655
Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln
            660                 665                 670
Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser
        675                 680                 685
Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu
    690                 695                 700
Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser
705                 710                 715                 720
Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
                725                 730
<210>47
<211>9573
<212>DNA
<213>人造
<220>
<223>合成构建体,D2E7内部可裂解信号肽
多聚蛋白表达载体。
<400>47
gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc    60
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat    120
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc    180
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga    240
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg    300
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat    360
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt    420
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc    480
cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg    540
tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg    600
aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg    660
gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag    720
gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc    780
tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa    840
actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact    900
ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt    960
ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca    1020
aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt    1080
ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga    1140
tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca    1200
ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag    1260
tttgggctga gctggctttt tcttgtcgcg attttaaaag gtgtccagtg tgaggtgcag    1320
ctggtggagt ctgggggagg cttggtacag cccggcaggt ccctgagact ctcctgtgcg    1380
gcctctggat tcacctttga tgattatgcc atgcactggg tccggcaagc tccagggaag    1440
ggcctggaat gggtctcagc tatcacttgg aatagtggtc acatagacta tgcggactct    1500
gtggagggcc gattcaccat ctccagagac aacgccaaga actccctgta tctgcaaatg    1560
aacagtctga gagctgagga tacggccgta tattactgtg cgaaagtctc gtaccttagc    1620
accgcgtcct cccttgacta ttggggccaa ggtaccctgg tcaccgtctc gagtgcgtcg    1680
accaagggcc catcggtctt ccccctggca ccctcctcca agagcacctc tgggggcaca    1740
gcggccctgg gctgcctggt caaggactac ttccccgaac cggtgacggt gtcgtggaac    1800
tcaggcgccc tgaccagcgg cgtgcacacc ttcccggctg tcctacagtc ctcaggactc    1860
tactccctca gcagcgtggt gaccgtgccc tccagcagct tgggcaccca gacctacatc    1920
tgcaacgtga atcacaagcc cagcaacacc aaggtggaca agaaagttga gcccaaatct    1980
tgtgacaaaa ctcacacatg cccaccgtgc ccagcacctg aactcctggg gggaccgtca    2040
gtcttcctct tccccccaaa acccaaggac accctcatga tctcccggac ccctgaggtc    2100
acatgcgtgg tggtggacgt gagccacgaa gaccctgagg tcaagttcaa ctggtacgtg    2160
gacggcgtgg aggtgcataa tgccaagaca aagccgcggg aggagcagta caacagcacg    2220
taccgtgtgg tcagcgtcct caccgtcctg caccaggact ggctgaatgg caaggagtac    2280
aagtgcaagg tctccaacaa agccctccca gcccccatcg agaaaaccat ctccaaagcc    2340
aaagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga tgagctgacc    2400
aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga catcgccgtg    2460
gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc cgtgctggac    2520
tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag gtggcagcag    2580
gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta cacgcagaag    2640
agcctctccc tgtctagggg taaacgcatg ggacgaatgg caatgaaatg gttagttgtt    2700
ataatatgtt tctctataac aagtcaacct gcttctgcta tggacatgcg cgtgcccgcc    2760
cagctgctgg gcctgctgct gctgtggttc cccggctcgc gatgcgacat ccagatgacc    2820
cagtctccat cctccctgtc tgcatctgta ggggacagag tcaccatcac ttgtcgggca    2880
agtcagggca tcagaaatta cttagcctgg tatcagcaaa aaccagggaa agcccctaag    2940
ctcctgatct atgctgcatc cactttgcaa tcaggggtcc catctcggtt cagtggcagt    3000
ggatctggga cagatttcac tctcaccatc agcagcctac agcctgaaga tgttgcaact    3060
tattactgtc aaaggtataa ccgtgcaccg tatacttttg gccaggggac caaggtggaa    3120
atcaaacgta cggtggctgc accatctgtc ttcatcttcc cgccatctga tgagcagttg    3180
aaatctggaa ctgcctctgt tgtgtgcctg ctgaataact tctatcccag agaggccaaa    3240
gtacagtgga aggtggataa cgccctccaa tcgggtaact cccaggagag tgtcacagag    3300
caggacagca aggacagcac ctacagcctc agcagcaccc tgacgctgag caaagcagac    3360
tacgagaaac acaaagtcta cgcctgcgaa gtcacccatc agggcctgag ctcgcccgtc    3420
acaaagagct tcaacagggg agagtgttga gcggccgcgt ttaaactgaa tgagcgcgtc    3480
catccagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga    3540
aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc    3600
tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag    3660
gtgtgggagg ttttttaaag caagtaaaac ctctacaaat gtggtatggc tgattatgat    3720
ccggctgcct cgcgcgtttc ggtgatgacg gtgaaaacct ctgacacatg cagctcccgg    3780
agacggtcac agcttgtctg taagcggatg ccgggagcag acaagcccgt cagggcgcgt    3840
cagcgggtgt tggcgggtgt cggggcgcag ccatgaccgg tcgacggcgc gccttttttt    3900
ttaattttta ttttatttta tttttgacgc gccgaaggcg cgatctgagc tcggtacagc    3960
ttggctgtgg aatgtgtgtc agttagggtg tggaaagtcc ccaggctccc cagcaggcag    4020
aagtatgcaa agcatgcatc tcaattagtc agcaaccagg tgtggaaagt ccccaggctc    4080
cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca tagtcccgcc    4140
cctaactccg cccatcccgc ccctaactcc gcccagttcc gcccattctc cgccccatgg    4200
ctgactaatt ttttttattt atgcagaggc cgaggccgcc tcggcctctg agctattcca    4260
gaagtagtga ggaggctttt ttggaggcct aggcttttgc aaaaagctcc tcgaggaact    4320
gaaaaaccag aaagttaact ggtaagttta gtctttttgt cttttatttc aggtcccgga    4380
tccggtggtg gtgcaaatca aagaactgct cctcagtgga tgttgccttt acttctaggc    4440
ctgtacggaa gtgttacttc tgctctaaaa gctgcggaat tgtacccgcg gcctaatacg    4500
actcactata gggactagta tggttcgacc attgaactgc atcgtcgccg tgtcccaaaa    4560
tatggggatt ggcaagaacg gagacctacc ctggcctccg ctcaggaacg agttcaagta    4620
cttccaaaga atgaccacaa cctcttcagt ggaaggtaaa cagaatctgg tgattatggg    4680
taggaaaacc tggttctcca ttcctgagaa gaatcgacct ttaaaggaca gaattaatat    4740
agttctcagt agagaactca aagaaccacc acgaggagct cattttcttg ccaaaagttt    4800
agatgatgcc ttaagactta ttgaacaacc ggaattggca agtaaagtag acatggtttg    4860
gatagtcgga ggcagttctg tttaccagga agccatgaat caaccaggcc acctcagact    4920
ctttgtgaca aggatcatgc aggaatttga aagtgacacg tttttcccag aaattgattt    4980
ggggaaatat aaacttctcc cagaataccc aggcgtcctc tctgaggtcc aggaggaaaa    5040
aggcatcaag tataagtttg aagtctacga gaagaaagac taagcggccg agcgcgcgga    5100
tctggaaacg ggagatgggg gaggctaact gaagcacgga aggagacaat accggaagga    5160
acccgcgcta tgacggcaat aaaaagacag aataaaacgc acgggtgttg ggtcgtttgt    5220
tcataaacgc ggggttcggt cccagggctg gcactctgtc gataccccac cgagacccca    5280
ttggggccaa tacgcccgcg tttcttcctt ttccccaccc caccccccaa gttcgggtga    5340
aggcccaggg ctcgcagcca acgtcggggc ggcaggccct gccatagcca ctggccccgt    5400
gggttaggga cggggtcccc catggggaat ggtttatggt tcgtgggggt tattattttg    5460
ggcgttgcgt ggggtctgga gatcccccgg gctgcaggaa ttccgttaca ttacttacgg    5520
taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt    5580
atgttcccat agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac    5640
ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg    5700
acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact    5760
ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt    5820
ggcagtacat caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc    5880
ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc    5940
gtaacaactc cgccccattg acgcaaaagg gcgggaattc gagctcggta ctcgagcggt    6000
gttccgcggt cctcctcgta tagaaactcg gaccactctg agacgaaggc tcgcgtccag    6060
gccagcacga aggaggctaa gtgggagggg tagcggtcgt tgtccactag ggggtccact    6120
cgctccaggg tgtgaagaca catgtcgccc tcttcggcat caaggaaggt gattggttta    6180
taggtgtagg ccacgtgacc gggtgttcct gaaggggggc tataaaaggg ggtgggggcg    6240
cgttcgtcct cactctcttc cgcatcgctg tctgcgaggg ccagctgttg ggctcgcggt    6300
tgaggacaaa ctcttcgcgg tctttccagt actcttggat cggaaacccg tcggcctccg    6360
aacggtactc cgccaccgag ggacctgagc gagtccgcat cgaccggatc ggaaaacctc    6420
tcgactgttg gggtgagtac tccctctcaa aagcgggcat gacttctgcg ctaagattgt    6480
cagtttccaa aaacgaggag gatttgatat tcacctggcc cgcggtgatg cctttgaggg    6540
tggccgcgtc catctggtca gaaaagacaa tctttttgtt gtcaagcttg aggtgtggca    6600
ggcttgagat ctggccatac acttgagtga caatgacatc cactttgcct ttctctccac    6660
aggtgtccac tcccaggtcc aaccggaatt gtacccgcgg ccagagcttg cgggcgccac    6720
cgcggccgcg gggatccaga catgataaga tacattgatg agtttggaca aaccacaact    6780
agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta    6840
accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt tatgtttcag    6900
gttcaggggg aggtgtggga ggttttttcg gatcctcttg gcgtaatcat ggtcatagct    6960
gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat    7020
aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc    7080
actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg    7140
cgcggggaaa ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct    7200
gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt    7260
atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc    7320
caggaaccgt aaaaaggccg cgttgctggc gttcttccat aggctccgcc cccctgacga    7380
gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata    7440
ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac    7500
cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg    7560
taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc    7620
cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag    7680
acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt    7740
aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaagaacagt    7800
atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg    7860
atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac    7920
gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca    7980
gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac    8040
ctagatccct tttaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac    8100
ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt    8160
tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt    8220
accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt    8280
atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc    8340
cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa    8400
tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg    8460
tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt    8520
gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc    8580
agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt    8640
aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg    8700
gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac    8760
tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc    8820
gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt    8880
tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg    8940
aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat attattgaag    9000
catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa    9060
acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct aagaaaccat    9120
tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc gtctcgcgcg    9180
tttcggtgat gacggtgaaa acctctgaca catgcagctc ccggagacgg tcacagcttg    9240
tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg gtgttggcgg    9300
gtgtcggggc tggcttaact atgcggcatc agagcagatt gtactgagag tgcaccatat    9360
gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc gccattcgcc    9420
attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca    9480
gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag ggttttccca    9540
gttacgacgt tgtaaaacga cggccagtga att                                 9573
<210>48
<211>3252
<212>DNA
<213>人造
<220>
<223>合成构建体,D2E7蛋白内含子融合多聚蛋白编码序列。
<220>
<221>CDS
<222>(1)..(3249)
<400>48
atg gag ttt ggg ctg agc tgg ctt ttt ctt gtc gcg att tta aaa ggt    48
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1               5                   10                  15
gtc cag tgt gag gtg cag ctg gtg gag tct ggg gga ggc ttg gta cag    96
Val Gln Cys Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln
            20                  25                  30
ccc ggc agg tcc ctg aga ctc tcc tgt gcg gcc tct gga ttc acc ttt    144
Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
        35                  40                  45
gat gat tat gcc atg cac tgg gtc cgg caa gct cca ggg aag ggc ctg    192
Asp Asp Tyr Ala Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
    50                  55                  60
gaa tgg gtc tca gct atc act tgg aat agt ggt cac ata gac tat gcg    240
Glu Trp Val Ser Ala Ile Thr Trp Asn Ser Gly His Ile Asp Tyr Ala
65                  70                  75                  80
gac tct gtg gag ggc cga ttc acc atc tcc aga gac aac gcc aag aac    288
Asp Ser Val Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
                85                  90                  95
tcc ctg tat ctg caa atg aac agt ctg aga gct gag gat acg gcc gta    336
Ser Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val
            100                 105                 110
tat tac tgt gcg aaa gtc tcg tac ctt agc acc gcg tcc tcc ctt gac    384
Tyr Tyr Cys Ala Lys Val Ser Tyr Leu Ser Thr Ala Ser Ser Leu Asp
        115                 120                 125
tat tgg ggc caa ggt acc ctg gtc acc gtc tcg agt gcg tcg acc aag    432
Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys
    130                 135                 140
ggc cca tcg gtc ttc ccc ctg gca ccc tcc tcc aag agc acc tct ggg    480
Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly
145                 150                 155                 160
ggc aca gcg gcc ctg ggc tgc ctg gtc aag gac tac ttc ccc gaa ccg    528
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro
                165                 170                 175
gtg acg gtg tcg tgg aac tca ggc gcc ctg acc agc ggc gtg cac acc    576
Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr
            180                 185                 190
ttc ccg gct gtc cta cag tcc tca gga ctc tac tcc ctc agc agc gtg    624
Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val
        195                 200                 205
gtg acc gtg ccc tcc agc agc ttg ggc acc cag acc tac atc tgc aac    672
Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn
    210                 215                 220
gtg aat cac aag ccc agc aac acc aag gtg gac aag aaa gtt gag ccc    720
Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro
225                 230                 235                 240
aaa tct tgt gac aaa act cac aca tgc cca ccg tgc cca gca cct gaa    768
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
                245                 250                 255
ctc ctg ggg gga ccg tca gtc ttc ctc ttc ccc cca aaa ccc aag gac    816
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
            260                 265                 270
acc ctc atg atc tcc cgg acc cct gag gtc aca tgc gtg gtg gtg gac    864
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
        275                 280                 285
gtg agc cac gaa gac cct gag gtc aag ttc aac tgg tac gtg gac ggc    912
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
    290                 295                 300
gtg gag gtg cat aat gcc aag aca aag ccg cgg gag gag cag tac aac    960
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
305                 310                 315                 320
agc acg tac cgt gtg gtc agc gtc ctc acc gtc ctg cac cag gac tgg    1008
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
                325                 330                 335
ctg aat ggc aag gag tac aag tgc aag gtc tcc aac aaa gcc ctc cca    1056
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
            340                 345                 350
gcc ccc atc gag aaa acc atc tcc aaa gcc aaa ggg cag ccc cga gaa    1104
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
        355                 360                 365
cca cag gtg tac acc ctg ccc cca tcc cgg gat gag ctg acc aag aac    1152
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn
    370                 375                 380
cag gtc agc ctg acc tgc ctg gtc aaa ggc ttc tat ccc agc gac atc    1200
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
385                 390                 395                 400
gcc gtg gag tgg gag agc aat ggg cag ccg gag aac aac tac aag acc    1248
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
                405                 410                 415
acg cct ccc gtg ctg gac tcc gac ggc tcc ttc ttc ctc tac agc aag    1296
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
            420                 425                 430
ctc acc gtg gac aag agc agg tgg cag cag ggg aac gtc ttc tca tgc    1344
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
        435                 440                 445
tcc gtg atg cat gag gct ctg cac aac cac tac acg cag aag agc ctc    1392
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
    450                 455                 460
tcc ctg tct ccg ggt aaa acc att tta ccg gaa gaa tgg gtt cca cta    1440
Ser Leu Ser Pro Gly Lys Thr Ile Leu Pro Glu Glu Trp Val Pro Leu
465                 470                 475                 480
att aaa aac ggt aaa gtt aag ata ttc cgc att ggg gac ttc gtt gat    1488
Ile Lys Asn Gly Lys Val Lys Ile Phe Arg Ile Gly Asp Phe Val Asp
                485                 490                 495
gga ctt atg aag gcg aac caa gga aaa gtg aag aaa acg ggg gat aca    1536
Gly Leu Met Lys Ala Asn Gln Gly Lys Val Lys Lys Thr Gly Asp Thr
            500                 505                 510
gaa gtt tta gaa gtt gca gga att cat gcg ttt tcc ttt gac agg aag    1584
Glu Val Leu Glu Val Ala Gly Ile His Ala Phe Ser Phe Asp Arg Lys
        515                 520                 525
tcc aag aag gcc cgt gta atg gca gtg aaa gcc gtg ata aga cac cgt    1632
Ser Lys Lys Ala Arg Val Met Ala Val Lys Ala Val Ile Arg His Arg
    530                 535                 540
tat tcc gga aat gtt tat aga ata gtc tta aac tct ggt aga aaa ata    1680
Tyr Ser Gly Asn Val Tyr Arg Ile Val Leu Asn Ser Gly Arg Lys Ile
545                 550                 555                 560
aca ata aca gaa ggg cat agc cta ttt gtc tat agg aac ggg gat ctc    1728
Thr Ile Thr Glu Gly His Ser Leu Phe Val Tyr Arg Asn Gly Asp Leu
                565                 570                 575
gtt gag gca act ggg gag gat gtc aaa att ggg gat ctt ctt gca gtt    1776
Val Glu Ala Thr Gly Glu Asp Val Lys Ile Gly Asp Leu Leu Ala Val
            580                 585                 590
cca aga tca gta aac cta cca gag aaa agg gaa cgc ttg aat att gtt    1824
Pro Arg Ser Val Asn Leu Pro Glu Lys Arg Glu Arg Leu Asn Ile Val
        595                 600                 605
gaa ctt ctt ctg aat ctc tca ccg gaa gag aca gaa gat ata ata ctt    1872
Glu Leu Leu Leu Asn Leu Ser Pro Glu Glu Thr Glu Asp Ile Ile Leu
    610                 615                 620
acg att cca gtt aaa ggc aga aag aac ttc ttc aag gga atg ttg aga    1920
Thr Ile Pro Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Arg
625                 630                 635                 640
aca tta cgt tgg att ttt ggt gag gaa aag aga gta agg aca gcg agc    1968
Thr Leu Arg Trp Ile Phe Gly Glu Glu Lys Arg Val Arg Thr Ala Ser
                645                 650                 655
cgc tat cta aga cac ctt gaa aat ctc gga tac ata agg ttg agg aaa    2016
Arg Tyr Leu Arg His Leu Glu Asn Leu Gly Tyr Ile Arg Leu Arg Lys
            660                 665                 670
att gga tac gac atc att gat aag gag ggg ctt gag aaa tat aga acg    2064
Ile Gly Tyr Asp Ile Ile Asp Lys Glu Gly Leu Glu Lys Tyr Arg Thr
        675                 680                 685
ttg tac gag aaa ctt gtt gat gtt gtc cgc tat aat ggc aac aag aga    2112
Leu Tyr Glu Lys Leu Val Asp Val Val Arg Tyr Asn Gly Asn Lys Arg
    690                 695                 700
gag tat tta gtt gaa ttt aat gct gtc cgg gac gtt atc tca cta atg    2160
Glu Tyr Leu Val Glu Phe Asn Ala Val Arg Asp Val Ile Ser Leu Met
705                 710                 715                 720
cca gag gaa gaa ctg aag gaa tgg cgt att gga act aga aat gga ttc    2208
Pro Glu Glu Glu Leu Lys Glu Trp Arg Ile Gly Thr Arg Asn Gly Phe
                725                 730                 735
aga atg ggt acg ttc gta gat att gat gaa gat ttt gcc aag ctt gga    2256
Arg Met Gly Thr Phe Val Asp Ile Asp Glu Asp Phe Ala Lys Leu Gly
            740                 745                 750
tac gat agc gga gtc tac agg gtt tat gta aac gag gaa ctt aag ttt    2304
Tyr Asp Ser Gly Val Tyr Arg Val Tyr Val Asn Glu Glu Leu Lys Phe
        755                 760                 765
acg gaa tac aga aag aaa aag aat gta tat cac tct cac att gtt cca    2352
Thr Glu Tyr Arg Lys Lys Lys Asn Val Tyr His Ser His Ile Val Pro
    770                 775                 780
aag gat att ctc aaa gaa act ttt ggt aag gtc ttc cag aaa aat ata    2400
Lys Asp Ile Leu Lys Glu Thr Phe Gly Lys Val Phe Gln Lys Asn Ile
785                 790                 795                 800
agt tac aag aaa ttt aga gag ctt gta gaa aat gga aaa ctt gac agg    2448
Ser Tyr Lys Lys Phe Arg Glu Leu Val Glu Asn Gly Lys Leu Asp Arg
                805                 810                 815
gag aaa gcc aaa cgc att gag tgg tta ctt aac gga gat ata gtc cta    2496
Glu Lys Ala Lys Arg Ile Glu Trp Leu Leu Asn Gly Asp Ile Val Leu
            820                 825                 830
gat aga gtc gta gag att aag aga gag tac tat gat ggt tac gtt tac    2544
Asp Arg Val Val Glu Ile Lys Arg Glu Tyr Tyr Asp Gly Tyr Val Tyr
        835                 840                 845
gat cta agt gtc gat gaa gat gag aat ttc ctt gct ggc ttt gga ttc    2592
Asp Leu Ser Val Asp Glu Asp Glu Asn Phe Leu Ala Gly Phe Gly Phe
    850                 855                 860
ctc tat gca cat aat gac atc cag atg acc cag tct cca tcc tcc ctg    2640
Leu Tyr Ala His Asn Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu
865                 870                 875                 880
tct gca tct gta ggg gac aga gtc acc atc act tgt cgg gca agt cag    2688
Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln
                885                 890                 895
ggc atc aga aat tac tta gcc tgg tat cag caa aaa cca ggg aaa gcc    2736
Gly Ile Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala
            900                 905                 910
cct aag ctc ctg atc tat gct gca tcc act ttg caa tca ggg gtc cca    2784
Pro Lys Leu Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val Pro
        915                 920                 925
tct cgg ttc agt ggc agt gga tct ggg aca gat ttc act ctc acc atc    2832
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile
    930                 935                 940
agc agc cta cag cct gaa gat gtt gca act tat tac tgt caa agg tat    2880
Ser Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg Tyr
945                 950                 955                 960
aac cgt gca ccg tat act ttt ggc cag ggg acc aag gtg gaa atc aaa    2928
Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys
                965                 970                 975
cgt acg gtg gct gca cca tct gtc ttc atc ttc ccg cca tct gat gag    2976
Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu
            980                 985                 990
cag ttg aaa tct gga act gcc tct gtt gtg tgc ctg ctg aat aac ttc    3024
Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe
        995                 1000                1005
tat ccc aga gag gcc aaa gta cag tgg aag gtg gat aac gcc ctc        3069
Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu
    1010                1015                1020
caa tcg ggt aac tcc cag gag agt gtc aca gag cag gac agc aag        3114
Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys
    1025                1030                1035
gac agc acc tac agc ctc agc agc acc ctg acg ctg agc aaa gca        3159
Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala
    1040                1045                1050
gac tac gag aaa cac aaa gtc tac gcc tgc gaa gtc acc cat cag        3204
Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln
    1055                1060                1065
ggc ctg agc tcg ccc gtc aca aag agc ttc aac agg gga gag tgt        3249
Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
    1070                1075                1080
tga                                                                3252
<210>49
<211>1083
<212>PRT
<213>人造
<220>
<223>合成构建体
<400>49
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1               5                   10                  15
Val Gln Cys Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln
            20                  25                  30
Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
        35                  40                  45
Asp Asp Tyr Ala Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
    50                  55                  60
Glu Trp Val Ser Ala Ile Thr Trp Asn Ser Gly His Ile Asp Tyr Ala
65                  70                  75                  80
Asp Ser Val Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
                85                  90                  95
Ser Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val
            100                 105                 110
Tyr Tyr Cys Ala Lys Val Ser Tyr Leu Ser Thr Ala Ser Ser Leu Asp
        115                 120                 125
Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys
    130                 135                 140
Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly
145                 150                 155                 160
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro
                165                 170                 175
Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr
            180                 185                 190
Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val
        195                 200                 205
Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn
    210                 215                 220
Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro
225                 230                 235                 240
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
                245                 250                 255
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
            260                 265                 270
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
        275                 280                 285
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
    290                 295                 300
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
305                 310                 315                 320
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
                325                 330                 335
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
            340                 345                 350
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
        355                 360                 365
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn
    370                 375                 380
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
385                 390                 395                 400
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
                405                 410                 415
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
            420                 425                 430
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
        435                 440                 445
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
    450                 455                 460
Ser Leu Ser Pro Gly Lys Thr Ile Leu Pro Glu Glu Trp Val Pro Leu
465                 470                 475                 480
Ile Lys Asn Gly Lys Val Lys Ile Phe Arg Ile Gly Asp Phe Val Asp
                485                 490                 495
Gly Leu Met Lys Ala Asn Gln Gly Lys Val Lys Lys Thr Gly Asp Thr
            500                 505                 510
Glu Val Leu Glu Val Ala Gly Ile His Ala Phe Ser Phe Asp Arg Lys
        515                 520                 525
Ser Lys Lys Ala Arg Val Met Ala Val Lys Ala Val Ile Arg His Arg
    530                 535                 540
Tyr Ser Gly Asn Val Tyr Arg Ile Val Leu Asn Ser Gly Arg Lys Ile
545                 550                 555                 560
Thr Ile Thr Glu Gly His Ser Leu Phe Val Tyr Arg Asn Gly Asp Leu
                565                 570                 575
Val Glu Ala Thr Gly Glu Asp Val Lys Ile Gly Asp Leu Leu Ala Val
            580                 585                 590
Pro Arg Ser Val Asn Leu Pro Glu Lys Arg Glu Arg Leu Asn Ile Val
        595                 600                 605
Glu Leu Leu Leu Asn Leu Ser Pro Glu Glu Thr Glu Asp Ile Ile Leu
    610                 615                 620
Thr Ile Pro Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Arg
625                 630                 635                 640
Thr Leu Arg Trp Ile Phe Gly Glu Glu Lys Arg Val Arg Thr Ala Ser
                645                 650                 655
Arg Tyr Leu Arg His Leu Glu Asn Leu Gly Tyr Ile Arg Leu Arg Lys
            660                 665                 670
Ile Gly Tyr Asp Ile Ile Asp Lys Glu Gly Leu Glu Lys Tyr Arg Thr
        675                 680                 685
Leu Tyr Glu Lys Leu Val Asp Val Val Arg Tyr Asn Gly Asn Lys Arg
    690                 695                 700
Glu Tyr Leu Val Glu Phe Asn Ala Val Arg Asp Val Ile Ser Leu Met
705                 710                 715                 720
Pro Glu Glu Glu Leu Lys Glu Trp Arg Ile Gly Thr Arg Asn Gly Phe
                725                 730                 735
Arg Met Gly Thr Phe Val Asp Ile Asp Glu Asp Phe Ala Lys Leu Gly
            740                 745                 750
Tyr Asp Ser Gly Val Tyr Arg Val Tyr Val Asn Glu Glu Leu Lys Phe
        755                 760                 765
Thr Glu Tyr Arg Lys Lys Lys Asn Val Tyr His Ser His Ile Val Pro
    770                 775                 780
Lys Asp Ile Leu Lys Glu Thr Phe Gly Lys Val Phe Gln Lys Asn Ile
785                 790                 795                 800
Ser Tyr Lys Lys Phe Arg Glu Leu Val Glu Asn Gly Lys Leu Asp Arg
                805                 810                 815
Glu Lys Ala Lys Arg Ile Glu Trp Leu Leu Asn Gly Asp Ile Val Leu
            820                 825                 830
Asp Arg Val Val Glu Ile Lys Arg Glu Tyr Tyr Asp Gly Tyr Val Tyr
        835                 840                 845
Asp Leu Ser Val Asp Glu Asp Glu Asn Phe Leu Ala Gly Phe Gly Phe
    850                 855                 860
Leu Tyr Ala His Asn Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu
865                 870                 875                 880
Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln
                885                 890                 895
Gly Ile Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala
            900                 905                 910
Pro Lys Leu Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val Pro
        915                 920                 925
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile
    930                 935                 940
Ser Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg Tyr
945                 950                 955                 960
Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys
                965                 970                 975
Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu
            980                 985                 990
Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe
        995                 1000                1005
Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu
    1010                1015                1020
Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys
    1025                1030                1035
Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala
    1040                1045                1050
Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln
    1055                1060                1065
Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
    1070                1075                1080
<210>50
<211>10629
<212>DNA
<213>人造
<220>
<223>合成构建体,D2E7蛋白内含子融合蛋白表达载体。
<400>50
gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc    60
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat    120
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc    180
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga    240
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg    300
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat    360
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt    420
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc    480
cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg    540
tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg    600
aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg    660
gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag    720
gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc    780
tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa    840
actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact    900
ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt    960
ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca    1020
aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt    1080
ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga    1140
tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca    1200
ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag    1260
tttgggctga gctggctttt tcttgtcgcg attttaaaag gtgtccagtg tgaggtgcag    1320
ctggtggagt ctgggggagg cttggtacag cccggcaggt ccctgagact ctcctgtgcg    1380
gcctctggat tcacctttga tgattatgcc atgcactggg tccggcaagc tccagggaag    1440
ggcctggaat gggtctcagc tatcacttgg aatagtggtc acatagacta tgcggactct    1500
gtggagggcc gattcaccat ctccagagac aacgccaaga actccctgta tctgcaaatg    1560
aacagtctga gagctgagga tacggccgta tattactgtg cgaaagtctc gtaccttagc    1620
accgcgtcct cccttgacta ttggggccaa ggtaccctgg tcaccgtctc gagtgcgtcg    1680
accaagggcc catcggtctt ccccctggca ccctcctcca agagcacctc tgggggcaca    1740
gcggccctgg gctgcctggt caaggactac ttccccgaac cggtgacggt gtcgtggaac    1800
tcaggcgccc tgaccagcgg cgtgcacacc ttcccggctg tcctacagtc ctcaggactc    1860
tactccctca gcagcgtggt gaccgtgccc tccagcagct tgggcaccca gacctacatc    1920
tgcaacgtga atcacaagcc cagcaacacc aaggtggaca agaaagttga gcccaaatct    1980
tgtgacaaaa ctcacacatg cccaccgtgc ccagcacctg aactcctggg gggaccgtca    2040
gtcttcctct tccccccaaa acccaaggac accctcatga tctcccggac ccctgaggtc    2100
acatgcgtgg tggtggacgt gagccacgaa gaccctgagg tcaagttcaa ctggtacgtg    2160
gacggcgtgg aggtgcataa tgccaagaca aagccgcggg aggagcagta caacagcacg    2220
taccgtgtgg tcagcgtcct caccgtcctg caccaggact ggctgaatgg caaggagtac    2280
aagtgcaagg tctccaacaa agccctccca gcccccatcg agaaaaccat ctccaaagcc    2340
aaagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga tgagctgacc    2400
aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga catcgccgtg    2460
gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc cgtgctggac    2520
tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag gtggcagcag    2580
gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta cacgcagaag    2640
agcctctccc tgtctccggg taaaaccatt ttaccggaag aatgggttcc actaattaaa    2700
aacggtaaag ttaagatatt ccgcattggg gacttcgttg atggacttat gaaggcgaac    2760
caaggaaaag tgaagaaaac gggggataca gaagttttag aagttgcagg aattcatgcg    2820
ttttcctttg acaggaagtc caagaaggcc cgtgtaatgg cagtgaaagc cgtgataaga    2880
caccgttatt ccggaaatgt ttatagaata gtcttaaact ctggtagaaa aataacaata    2940
acagaagggc atagcctatt tgtctatagg aacggggatc tcgttgaggc aactggggag    3000
gatgtcaaaa ttggggatct tcttgcagtt ccaagatcag taaacctacc agagaaaagg    3060
gaacgcttga atattgttga acttcttctg aatctctcac cggaagagac agaagatata    3120
atacttacga ttccagttaa aggcagaaag aacttcttca agggaatgtt gagaacatta    3180
cgttggattt ttggtgagga aaagagagta aggacagcga gccgctatct aagacacctt    3240
gaaaatctcg gatacataag gttgaggaaa attggatacg acatcattga taaggagggg    3300
cttgagaaat atagaacgtt gtacgagaaa cttgttgatg ttgtccgcta taatggcaac    3360
aagagagagt atttagttga atttaatgct gtccgggacg ttatctcact aatgccagag    3420
gaagaactga aggaatggcg tattggaact agaaatggat tcagaatggg tacgttcgta    3480
gatattgatg aagattttgc caagcttgga tacgatagcg gagtctacag ggtttatgta    3540
aacgaggaac ttaagtttac ggaatacaga aagaaaaaga atgtatatca ctctcacatt    3600
gttccaaagg atattctcaa agaaactttt ggtaaggtct tccagaaaaa tataagttac    3660
aagaaattta gagagcttgt agaaaatgga aaacttgaca gggagaaagc caaacgcatt    3720
gagtggttac ttaacggaga tatagtccta gatagagtcg tagagattaa gagagagtac    3780
tatgatggtt acgtttacga tctaagtgtc gatgaagatg agaatttcct tgctggcttt    3840
ggattcctct atgcacataa tgacatccag atgacccagt ctccatcctc cctgtctgca    3900
tctgtagggg acagagtcac catcacttgt cgggcaagtc agggcatcag aaattactta    3960
gcctggtatc agcaaaaacc agggaaagcc cctaagctcc tgatctatgc tgcatccact    4020
ttgcaatcag gggtcccatc tcggttcagt ggcagtggat ctgggacaga tttcactctc    4080
accatcagca gcctacagcc tgaagatgtt gcaacttatt actgtcaaag gtataaccgt    4140
gcaccgtata cttttggcca ggggaccaag gtggaaatca aacgtacggt ggctgcacca    4200
tctgtcttca tcttcccgcc atctgatgag cagttgaaat ctggaactgc ctctgttgtg    4260
tgcctgctga ataacttcta tcccagagag gccaaagtac agtggaaggt ggataacgcc    4320
ctccaatcgg gtaactccca ggagagtgtc acagagcagg acagcaagga cagcacctac    4380
agcctcagca gcaccctgac gctgagcaaa gcagactacg agaaacacaa agtctacgcc    4440
tgcgaagtca cccatcaggg cctgagctcg cccgtcacaa agagcttcaa caggggagag    4500
tgttgagcgg ccgcgtttaa actgaatgag cgcgtccatc cagacatgat aagatacatt    4560
gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt    4620
tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac    4680
aattgcattc attttatgtt tcaggttcag ggggaggtgt gggaggtttt ttaaagcaag    4740
taaaacctct acaaatgtgg tatggctgat tatgatccgg ctgcctcgcg cgtttcggtg    4800
atgacggtga aaacctctga cacatgcagc tcccggagac ggtcacagct tgtctgtaag    4860
cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc gggtgttggc gggtgtcggg    4920
gcgcagccat gaccggtcga cggcgcgcct ttttttttaa tttttatttt attttatttt    4980
tgacgcgccg aaggcgcgat ctgagctcgg tacagcttgg ctgtggaatg tgtgtcagtt    5040
agggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca tgcatctcaa    5100
ttagtcagca accaggtgtg gaaagtcccc aggctcccca gcaggcagaa gtatgcaaag    5160
catgcatctc aattagtcag caaccatagt cccgccccta actccgccca tcccgcccct    5220
aactccgccc agttccgccc attctccgcc ccatggctga ctaatttttt ttatttatgc    5280
agaggccgag gccgcctcgg cctctgagct attccagaag tagtgaggag gcttttttgg    5340
aggcctaggc ttttgcaaaa agctcctcga ggaactgaaa aaccagaaag ttaactggta    5400
agtttagtct ttttgtcttt tatttcaggt cccggatccg gtggtggtgc aaatcaaaga    5460
actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct    5520
ctaaaagctg cggaattgta cccgcggcct aatacgactc actataggga ctagtatggt    5580
tcgaccattg aactgcatcg tcgccgtgtc ccaaaatatg gggattggca agaacggaga    5640
cctaccctgg cctccgctca ggaacgagtt caagtacttc caaagaatga ccacaacctc    5700
ttcagtggaa ggtaaacaga atctggtgat tatgggtagg aaaacctggt tctccattcc    5760
tgagaagaat cgacctttaa aggacagaat taatatagtt ctcagtagag aactcaaaga    5820
accaccacga ggagctcatt ttcttgccaa aagtttagat gatgccttaa gacttattga    5880
acaaccggaa ttggcaagta aagtagacat ggtttggata gtcggaggca gttctgttta    5940
ccaggaagcc atgaatcaac caggccacct cagactcttt gtgacaagga tcatgcagga    6000
atttgaaagt gacacgtttt tcccagaaat tgatttgggg aaatataaac ttctcccaga    6060
atacccaggc gtcctctctg aggtccagga ggaaaaaggc atcaagtata agtttgaagt    6120
ctacgagaag aaagactaag cggccgagcg cgcggatctg gaaacgggag atgggggagg    6180
ctaactgaag cacggaagga gacaataccg gaaggaaccc gcgctatgac ggcaataaaa    6240
agacagaata aaacgcacgg gtgttgggtc gtttgttcat aaacgcgggg ttcggtccca    6300
gggctggcac tctgtcgata ccccaccgag accccattgg ggccaatacg cccgcgtttc    6360
ttccttttcc ccaccccacc ccccaagttc gggtgaaggc ccagggctcg cagccaacgt    6420
cggggcggca ggccctgcca tagccactgg ccccgtgggt tagggacggg gtcccccatg    6480
gggaatggtt tatggttcgt gggggttatt attttgggcg ttgcgtgggg tctggagatc    6540
ccccgggctg caggaattcc gttacattac ttacggtaaa tggcccgcct ggctgaccgc    6600
    50                  55                  60
Thr Lys Lys Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg
65                  70                  75                  80
Tyr Ser Gly Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile
                85                  90                  95
Lys Ile Thr Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu
            100                 105                 110
Val Lys Val Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val
        115                 120                 125
Pro Gly Arg Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val
    130                 135                 140
Glu Leu Leu Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met
145                 150                 155                 160
Met Ile Pro Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys
                165                 170                 175
Thr Leu Tyr Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag    6660
ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac    6720
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg    6780
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg    6840
tattagtcat cgctattacc atggtgatgc ggttttggca gtacatcaat gggcgtggat    6900
agcggtttga ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt    6960
tttggcacca aaatcaacgg gactttccaa aatgtcgtaa caactccgcc ccattgacgc    7020
aaaagggcgg gaattcgagc tcggtactcg agcggtgttc cgcggtcctc ctcgtataga    7080
aactcggacc actctgagac gaaggctcgc gtccaggcca gcacgaagga ggctaagtgg    7140
gaggggtagc ggtcgttgtc cactaggggg tccactcgct ccagggtgtg aagacacatg    7200
tcgccctctt cggcatcaag gaaggtgatt ggtttatagg tgtaggccac gtgaccgggt    7260
gttcctgaag gggggctata aaagggggtg ggggcgcgtt cgtcctcact ctcttccgca    7320
tcgctgtctg cgagggccag ctgttgggct cgcggttgag gacaaactct tcgcggtctt    7380
tccagtactc ttggatcgga aacccgtcgg cctccgaacg gtactccgcc accgagggac    7440
ctgagcgagt ccgcatcgac cggatcggaa aacctctcga ctgttggggt gagtactccc    7500
tctcaaaagc gggcatgact tctgcgctaa gattgtcagt ttccaaaaac gaggaggatt    7560
tgatattcac ctggcccgcg gtgatgcctt tgagggtggc cgcgtccatc tggtcagaaa    7620
agacaatctt tttgttgtca agcttgaggt gtggcaggct tgagatctgg ccatacactt    7680
gagtgacaat gacatccact ttgcctttct ctccacaggt gtccactccc aggtccaacc    7740
ggaattgtac ccgcggccag agcttgcggg cgccaccgcg gccgcgggga tccagacatg    7800
ataagataca ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt    7860
atttgtgaaa tttgtgatgc tattgcttta tttgtaacca ttataagctg caataaacaa    7920
gttaacaaca acaattgcat tcattttatg tttcaggttc agggggaggt gtgggaggtt    7980
ttttcggatc ctcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc    8040
gctcacaatt ccacacaaca tacgagccgg aagcataaag tgtaaagcct ggggtgccta    8100
atgagtgagc taactcacat taattgcgtt gcgctcactg cccgctttcc agtcgggaaa    8160
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggaaaggcg gtttgcgtat    8220
tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg    8280
agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc    8340
aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt    8400
gctggcgttc ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag    8460
tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc    8520
cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc    8580
ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt    8640
cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt    8700
atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc    8760
agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa    8820
gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa    8880
gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg    8940
tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga    9000
agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg    9060
gattttggtc atgagattat caaaaaggat cttcacctag atccctttta attaaaaatg    9120
aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt    9180
aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact    9240
ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat    9300
gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg    9360
aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg    9420
ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat    9480
tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc    9540
ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt    9600
cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc    9660
agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga    9720
gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc    9780
gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa    9840
acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta    9900
acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg    9960
agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg    10020
aatactcata ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat    10080
gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt    10140
tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat taacctataa    10200
aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg gtgaaaacct    10260
ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg ccgggagcag    10320
acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc ttaactatgc    10380
ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac cgcacagatg    10440
cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca actgttggga  10500
agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc  10560
aaggcgatta agttgggtaa cgccagggtt ttcccagtta cgacgttgta aaacgacggc  10620
cagtgaatt                                                          10629
<210>51
<211>547
<212>PRT
<213>古菌种
<400>51
Asn Ser Ile Leu Pro Glu Glu Trp Val Pro Leu Ile Lys Asn Gly Lys
1               5                   10                  15
Val Lys Ile Phe Arg Ile Gly Asp Phe Val Asp Gly Leu Met Lys Ala
            20                  25                  30
Asn Gln Gly Lys Val Lys Lys Thr Gly Asp Thr Glu Val Leu Glu Val
        35                  40                  45
Ala Gly Ile His Ala Phe Ser Phe Asp Arg Lys Ser Lys Lys Ala Arg
    50                  55                  60
Val Met Ala Val Lys Ala Val Ile Arg His Arg Tyr Ser Gly Asn Val
65                  70                  75                  80
Tyr Arg Ile Val Leu Asn Ser Gly Arg Lys Ile Thr Ile Thr Glu Gly
                85                  90                  95
His Ser Leu Phe Val Tyr Arg Asn Gly Asp Leu Val Glu Ala Thr Gly
            100                 105                 110
Glu Asp Val Lys Ile Gly Asp Leu Leu Ala Val Pro Arg Ser Val Asn
        115                 120                 125
Leu Pro Glu Lys Arg Glu Arg Leu Asn Ile Val Glu Leu Leu Leu Asn
    130                 135                 140
Leu Ser Pro Glu Glu Thr Glu Asp Ile Ile Leu Thr Ile Pro Val Lys
145                 150                 155                 160
Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Arg Thr Leu Arg Trp Ile
                165                 170                 175
Phe Gly Glu Glu Lys Arg Val Arg Thr Ala Ser Arg Tyr Leu Arg His
            180                 185                 190
Leu Glu Asn Leu Gly Tyr Ile Arg Leu Arg Lys Ile Gly Tyr Asp Ile
        195                 200                 205
Ile Asp Lys Glu Gly Leu Glu Lys Tyr Arg Thr Leu Tyr Glu Lys Leu
    210                 215                 220
Val Asp Val Val Arg Tyr Asn Gly Asn Lys Arg Glu Tyr Leu Val Glu
225                 230                 235                 240
Phe Asn Ala Val Arg Asp Val Ile Ser Leu Met Pro Glu Glu Glu Leu
                245                 250                 255
Lys Glu Trp Arg Ile Gly Thr Arg Asn Gly Phe Arg Met Gly Thr Phe
            260                 265                 270
Val Asp Ile Asp Glu Asp Phe Ala Lys Leu Leu Gly Tyr Tyr Val Ser
        275                 280                 285
Glu Gly Ser Ala Arg Lys Trp Lys Asn Gln Thr Gly Gly Trp Ser Tyr
    290                 295                 300
Thr Val Arg Leu Tyr Asn Glu Asn Asp Glu Val Leu Asp Asp Met Glu
305                 310                 315                 320
His Leu Ala Lys Lys Phe Phe Gly Lys Val Lys Arg Gly Lys Asn Tyr
                325                 330                 335
Val Glu Ile Pro Lys Lys Met Ala Tyr Ile Ile Phe Glu Ser Leu Cys
            340                 345                 350
Gly Thr Leu Ala Glu Asn Lys Arg Val Pro Glu Val Ile Phe Thr Ser
        355                 360                 365
Ser Lys Gly Val Arg Trp Ala Phe Leu Glu Gly Tyr Phe Ile Gly Asp
    370                 375                 380
Gly Asp Val His Pro Ser Lys Arg Val Arg Leu Ser Thr Lys Ser Glu
385                 390                 395                 400
Leu Leu Val Asn Gly Leu Val Leu Leu Leu Asn Ser Leu Gly Val Ser
                405                 410                 415
Ala Ile Lys Leu Gly Tyr Asp Ser Gly Val Tyr Arg Val Tyr Val Asn
            420                 425                 430
Glu Glu Leu Lys Phe Thr Glu Tyr Arg Lys Lys Lys Asn Val Tyr His
        435                 440                 445
Ser His Ile Val Pro Lys Asp Ile Leu Lys Glu Thr Phe Gly Lys Val
    450                 455                 460
Phe Gln Lys Asn Ile Ser Tyr Lys Lys Phe Arg Glu Leu Val Glu Asn
465                 470                 475                 480
Gly Lys Leu Asp Arg Glu Lys Ala Lys Arg Ile Glu Trp Leu Leu Asn
                485                 490                 495
Gly Asp Ile Val Leu Asp Arg Val Val Glu Ile Lys Arg Glu Tyr Tyr
            500                 505                 510
Asp Gly Tyr Val Tyr Asp Leu Ser Val Asp Glu Asp Glu Asn Phe Leu
        515                 520                 525
Ala Gly Phe Gly Phe Leu Tyr Ala His Asn Ser Tyr Tyr Gly Tyr Tyr
    530                 535                 540
Gly Tyr Ala
545
<210>52
<211>26
<212>DNA
<213>人造
<220>
<223>合成构建体,用作引物的寡核苷酸。
<400>52
agcattttac cagatgaatg gctccc                        26
<210>53
<211>27
<212>DNA
<213>人造
<220>
<223>合成构建体,用作引物的寡核苷酸。
<400>53
aacgaggaag ttctcattat cctcaac                       27
<210>54
<211>44
<212>DNA
<213>人造
<220>
<223>合成构建体;用作引物的寡核苷酸。
<400>54
agcctctccc tgtctccggg taaaagcatt ttaccagatg aatg    44
<210>55
<211>42
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>55
gggcgggcac gcgcatgtcc atgttgtgtg cgtaaagtag tc         42
<210>56
<211>47
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>56
agcctctccc tgtctccggg taaaaacagc attttaccag atgaatg    47
<210>57
<211>45
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>57
gggcgggcac gcgcatgtcc atactgttgt gtgcgtaaag tagtc             45
<210>58
<211>53
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>58
agcctctccc tgtctccggg taaattagca aacagcattt taccagatga atg    53
<210>59
<211>51
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>59
gggcgggcac gcgcatgtcc atgtaataac tgttgtgtgc gtaaagtagt c      51
<210>60
<211>36
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>60
tgcccgggcg ccaccatgga gtttgggctg agctgg                              36
<210>61
<211>36
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>61
tgcccgggcg ccaccatgga gtttgggctg agctgg                              36
<210>62
<211>9460
<212>DNA
<213>人造
<220>
<223>合成构建体:质粒pTT3-HcintLC-p.hori的序列
<400>62
gcggccgctc gaggccggca aggccggatc ccccgacctc gacctctggc taataaagga    60
aatttatttt cattgcaata gtgtgttgga attttttgtg tctctcactc ggaaggacat    120
atgggagggc aaatcatttg gtcgagatcc ctcggagatc tctagctaga ggatcgatcc    180
ccgccccgga cgaactaaac ctgactacga catctctgcc ccttcttcgc ggggcagtgc    240
atgtaatccc ttcagttggt tggtacaact tgccaactgg gccctgttcc acatgtgaca    300
cgggggggga ccaaacacaa aggggttctc tgactgtagt tgacatcctt ataaatggat    360
gtgcacattt gccaacactg agtggctttc atcctggagc agactttgca gtctgtggac    420
tgcaacacaa cattgccttt atgtgtaact cttggctgaa gctcttacac caatgctggg    480
ggacatgtac ctcccagggg cccaggaaga ctacgggagg ctacaccaac gtcaatcaga    540
ggggcctgtg tagctaccga taagcggacc ctcaagaggg cattagcaat agtgtttata    600
aggccccctt gttaacccta aacgggtagc atatgcttcc cgggtagtag tatatactat    660
ccagactaac cctaattcaa tagcatatgt tacccaacgg gaagcatatg ctatcgaatt    720
agggttagta aaagggtcct aaggaacagc gatatctccc accccatgag ctgtcacggt    780
tttatttaca tggggtcagg attccacgag ggtagtgaac cattttagtc acaagggcag    840
tggctgaaga tcaaggagcg ggcagtgaac tctcctgaat cttcgcctgc ttcttcattc    900
tccttcgttt agctaataga ataactgctg agttgtgaac agtaaggtgt atgtgaggtg    960
ctcgaaaaca aggtttcagg tgacgccccc agaataaaat ttggacgggg ggttcagtgg    1020
tggcattgtg ctatgacacc aatataaccc tcacaaaccc cttgggcaat aaatactagt    1080
gtaggaatga aacattctga atatctttaa caatagaaat ccatggggtg gggacaagcc    1140
gtaaagactg gatgtccatc tcacacgaat ttatggctat gggcaacaca taatcctagt    1200
gcaatatgat actggggtta ttaagatgtg tcccaggcag ggaccaagac aggtgaacca    1260
tgttgttaca ctctatttgt aacaagggga aagagagtgg acgccgacag cagcggactc    1320
cactggttgt ctctaacacc cccgaaaatt aaacggggct ccacgccaat ggggcccata    1380
aacaaagaca agtggccact cttttttttg aaattgtgga gtgggggcac gcgtcagccc    1440
ccacacgccg ccctgcggtt ttggactgta aaataagggt gtaataactt ggctgattgt    1500
aaccccgcta accactgcgg tcaaaccact tgcccacaaa accactaatg gcaccccggg    1560
gaatacctgc ataagtaggt gggcgggcca agataggggc gcgattgctg cgatctggag    1620
gacaaattac acacacttgc gcctgagcgc caagcacagg gttgttggtc ctcatattca    1680
cgaggtcgct gagagcacgg tgggctaatg ttgccatggg tagcatatac tacccaaata    1740
tctggatagc atatgctatc ctaatctata tctgggtagc ataggctatc ctaatctata    1800
tctgggtagc atatgctatc ctaatctata tctgggtagt atatgctatc ctaatttata    1860
tctgggtagc ataggctatc ctaatctata tctgggtagc atatgctatc ctaatctata    1920
tctgggtagt atatgctatc ctaatctgta tccgggtagc atatgctatc ctaatagaga    1980
ttagggtagt atatgctatc ctaatttata tctgggtagc atatactacc caaatatctg    2040
gatagcatat gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg    2100
ggtagcatag gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg    2160
ggtagtatat gctatcctaa tttatatctg ggtagcatag gctatcctaa tctatatctg    2220
ggtagcatat gctatcctaa tctatatctg ggtagtatat gctatcctaa tctgtatccg    2280
ggtagcatat gctatcctca tgataagctg tcaaacatga gaattttctt gaagacgaaa    2340
gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac    2400
gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat    2460
acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg    2520
aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc    2580
attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga    2640
tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga    2700
gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg    2760
cgcggtatta tcccgtgttg acgccgggca agagcaactc ggtcgccgca tacactattc    2820
tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac    2880
agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact    2940
tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca    3000
tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg    3060
tgacaccacg atgcctgcag caatggcaac aacgttgcgc aaactattaa ctggcgaact    3120
acttactcta gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg    3180
accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg    3240
tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat    3300
cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc    3360
tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat    3420
actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt    3480
tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc    3540
cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt    3600
gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac    3660
tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt    3720
gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct    3780
gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga    3840
ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac    3900
acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg    3960
agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt    4020
cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc    4080
tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg    4140
gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc    4200
ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc    4260
ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag    4320
cgaggaagcg gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca    4380
ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat    4440
taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg    4500
tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga    4560
ttacgccaag ctctagctag aggtcgacca attctcatgt ttgacagctt atcatcgcag    4620
atccgggcaa cgttgttgcc attgctgcag gcgcagaact ggtaggtatg gaagatctat    4680
acattgaatc aatattggca attagccata ttagtcattg gttatatagc ataaatcaat    4740
attggctatt ggccattgca tacgttgtat ctatatcata atatgtacat ttatattggc    4800
tcatgtccaa tatgaccgcc atgttgacat tgattattga ctagttatta atagtaatca    4860
attacggggt cattagttca tagcccatat atggagttcc gcgttacata acttacggta    4920
aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat    4980
gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg    5040
taaactgccc acttggcagt acatcaagtg tatcatatgc caagtccgcc ccctattgac    5100
gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt acgggacttt    5160
cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg    5220
cagtacacca atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc    5280
attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt    5340
aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata    5400
agcagagctc gtttagtgaa ccgtcagatc ctcactctct tccgcatcgc tgtctgcgag    5460
ggccagctgt tgggctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg    5520
atcggaaacc cgtcggcctc cgaacggtac tccgccaccg agggacctga gcgagtccgc    5580
atcgaccgga tcggaaaacc tctcgagaaa ggcgtctaac cagtcacagt cgcaaggtag    5640
gctgagcacc gtggcgggcg gcagcgggtg gcggtcgggg ttgtttctgg cggaggtgct    5700
gctgatgatg taattaaagt aggcggtctt gagacggcgg atggtcgagg tgaggtgtgg    5760
caggcttgag atccagctgt tggggtgagt actccctctc aaaagcgggc attacttctg    5820
cgctaagatt gtcagtttcc aaaaacgagg aggatttgat attcacctgg cccgatctgg    5880
ccatacactt gagtgacaat gacatccact ttgcctttct ctccacaggt gtccactccc    5940
aggtccaagt ttgggcgcca ccatggagtt tgggctgagc tggctttttc ttgtcgcgat    6000
tttaaaaggt gtccagtgtg aggtgcagct ggtggagtct gggggaggct tggtacagcc    6060
cggcaggtcc ctgagactct cctgtgcggc ctctggattc acctttgatg attatgccat    6120
gcactgggtc cggcaagctc cagggaaggg cctggaatgg gtctcagcta tcacttggaa    6180
tagtggtcac atagactatg cggactctgt ggagggccga ttcaccatct ccagagacaa    6240
cgccaagaac tccctgtatc tgcaaatgaa cagtctgaga gctgaggata cggccgtata    6300
ttactgtgcg aaagtctcgt accttagcac cgcgtcctcc cttgactatt ggggccaagg    6360
taccctggtc accgtctcga gtgcgtcgac caagggccca tcggtcttcc ccctggcacc    6420
ctcctccaag agcacctctg ggggcacagc ggccctgggc tgcctggtca aggactactt    6480
ccccgaaccg gtgacggtgt cgtggaactc aggcgccctg accagcggcg tgcacacctt    6540
cccggctgtc ctacagtcct caggactcta ctccctcagc agcgtggtga ccgtgccctc    6600
cagcagcttg ggcacccaga cctacatctg caacgtgaat cacaagccca gcaacaccaa    6660
ggtggacaag aaagttgagc ccaaatcttg tgacaaaact cacacatgcc caccgtgccc    6720
agcacctgaa ctcctggggg gaccgtcagt cttcctcttc cccccaaaac ccaaggacac    6780
cctcatgatc tcccggaccc ctgaggtcac atgcgtggtg gtggacgtga gccacgaaga    6840
ccctgaggtc aagttcaact ggtacgtgga cggcgtggag gtgcataatg ccaagacaaa    6900
gccgcgggag gagcagtaca acagcacgta ccgtgtggtc agcgtcctca ccgtcctgca    6960
ccaggactgg ctgaatggca aggagtacaa gtgcaaggtc tccaacaaag ccctcccagc    7020
ccccatcgag aaaaccatct ccaaagccaa agggcagccc cgagaaccac aggtgtacac    7080
cctgccccca tcccgggatg agctgaccaa gaaccaggtc agcctgacct gcctggtcaa    7140
aggcttctat cccagcgaca tcgccgtgga gtgggagagc aatgggcagc cggagaacaa    7200
ctacaagacc acgcctcccg tgctggactc cgacggctcc ttcttcctct acagcaagct    7260
caccgtggac aagagcaggt ggcagcaggg gaacgtcttc tcatgctccg tgatgcatga    7320
ggctctgcac aaccactaca cgcagaagag cctctccctg tctccgggta aaagcatttt    7380
accagatgaa tggctcccaa ttgttgaaaa tgaaaaagtt cgattcgtaa aaattggaga    7440
cttcatagat agggagattg aggaaaacgc tgagagagtg aagagggatg gtgaaactga    7500
aattctagag gttaaagatc ttaaagccct ttccttcaat agagaaacaa aaaagagcga    7560
gctcaagaag gtaaaggccc taattagaca ccgctattca gggaaggttt acagcattaa    7620
actaaagtca gggagaagga tcaaaataac ctcaggtcat agtctgttct cagtaaaaaa    7680
tggaaagcta gttaaggtca ggggagatga actcaagcct ggtgatctcg ttgtcgttcc    7740
aggaaggtta aaacttccag aaagcaagca agtgctaaat ctcgttgaac tactcctgaa    7800
attacccgaa gaggagacat cgaacatcgt aatgatgatc ccagttaaag gtagaaagaa    7860
tttcttcaaa gggatgctca aaacattata ctggatcttc ggggagggag aaaggccaag    7920
aaccgcaggg cgctatctca agcatcttga aagattagga tacgttaagc tcaagagaag    7980
aggctgtgaa gttctcgact gggagtcact taagaggtac aggaagcttt acgagaccct    8040
cattaagaac ctgaaatata acggtaatag cagggcatac atggttgaat ttaactctct    8100
cagggatgta gtgagcttaa tgccaataga agaacttaag gagtggataa ttggagaacc    8160
taggggtcct aagataggta ccttcattga tgtagatgat tcatttgcaa agctcctagg    8220
ttactacata agtagcggag atgtagagaa agatagggtg aagttccaca gtaaagatca    8280
aaacgttctc gaggatatag cgaaacttgc cgagaagtta tttggaaagg tgaggagagg    8340
aagaggatat attgaggtat cagggaaaat tagccatgcc atatttagag ttttagcgga    8400
aggtaagaga attccagagt tcatcttcac atccccaatg gatattaagg tagccttcct    8460
taagggactc aacggtaatg ctgaagaatt aacgttctcc actaagagtg agctattagt    8520
taaccagctt atccttctcc tgaactccat tggagtttcg gatataaaga ttgaacatga    8580
gaaaggggtt tacagagttt acataaataa gaaggaatcc tccaatgggg atatagtact    8640
tgatagcgtc gaatctatcg aagttgaaaa atacgagggc tacgtttatg atctaagtgt    8700
tgaggataat gagaacttcc tcgttggctt cggactactt tacgcacaca acatggacat  8760
gcgcgtgccc gcccagctgc tgggcctgct gctgctgtgg ttccccggct cgcgatgcga  8820
catccagatg acccagtctc catcctccct gtctgcatct gtaggggaca gagtcaccat  8880
cacttgtcgg gcaagtcagg gcatcagaaa ttacttagcc tggtatcagc aaaaaccagg  8940
gaaagcccct aagctcctga tctatgctgc atccactttg caatcagggg tcccatctcg  9000
gttcagtggc agtggatctg ggacagattt cactctcacc atcagcagcc tacagcctga  9060
agatgttgca acttattact gtcaaaggta taaccgtgca ccgtatactt ttggccaggg  9120
gaccaaggtg gaaatcaaac gtacggtggc tgcaccatct gtcttcatct tcccgccatc  9180
tgatgagcag ttgaaatctg gaactgcctc tgttgtgtgc ctgctgaata acttctatcc  9240
cagagaggcc aaagtacagt ggaaggtgga taacgccctc caatcgggta actcccagga  9300
gagtgtcaca gagcaggaca gcaaggacag cacctacagc ctcagcagca ccctgacgct  9360
gagcaaagca gactacgaga aacacaaagt ctacgcctgc gaagtcaccc atcagggcct  9420
gagctcgccc gtcacaaaga gcttcaacag gggagagtgt                        9460
<210>63
<211>1166
<212>PRT
<213>人造
<220>
<223>合成:pTT3-HcintLC-p.hori中开放阅读框的氨基酸序列。
<400>63
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1               5                   10                  15
Val Gln Cys Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln
            20                  25                  30
Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe
        35                  40                  45
Asp Asp Tyr Ala Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu
    50                  55                  60
Glu Trp Val Ser Ala Ile Thr Trp Asn Ser Gly His Ile Asp Tyr Ala
65                  70                  75                  80
Asp Ser Val Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn
                85                  90                  95
Ser Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val
            100                 105                 110
Tyr Tyr Cys Ala Lys Val Ser Tyr Leu Ser Thr Ala Ser Ser Leu Asp
        115                 120                 125
Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys
    130                 135                 140
Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly
145                 150                 155                 160
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro
                165                 170                 175
Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr
            180                 185                 190
Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val
        195                 200                 205
Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn
    210                 215                 220
Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro
225                 230                 235                 240
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu
                245                 250                 255
Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
            260                 265                 270
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
        275                 280                 285
Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly
    290                 295                 300
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn
305                 310                 315                 320
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
                325                 330                 335
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro
            340                 345                 350
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
        355                 360                 365
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn
    370                 375                 380
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
385                 390                 395                 400
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
                405                 410                 415
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys
            420                 425                 430
Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys
        435                 440                 445
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
    450                 455                 460
Ser Leu Ser Pro Gly Lys Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile
465                 470                 475                 480
Val Glu Asn Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp
                485                 490                 495
Arg Glu Ile Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr
            500                 505                 510
Glu Ile Leu Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu
        515                 520                 525
Thr Lys Lys Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg
    530                 535                 540
Tyr Ser Gly Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile
545                 550                 555                 560
Lys Ile Thr Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu
                565                 570                 575
Val Lys Val Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val
            580                 585                 590
Pro Gly Arg Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val
        595                 600                 605
Glu Leu Leu Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met
    610                 615                 620
Met Ile Pro Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys
625                 630                 635                 640
Thr Leu Tyr Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly
                645                 650                 655
Arg Tyr Leu Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg
            660                 665                 670
Arg Gly Cys Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys
        675                 680                 685
Leu Tyr Glu Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg
    690                 695                 700
Ala Tyr Met Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met
705                 710                 715                 720
Pro Ile Glu Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro
                725                 730                 735
Lys Ile Gly Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu
            740                 745                 750
Gly Tyr Tyr Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe
        755                 760                 765
His Ser Lys Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu
    770                 775                 780
Lys Leu Phe Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser
785                 790                 795                 800
Gly Lys Ile Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg
                805                 810                 815
Ile Pro Glu Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe
            820                 825                 830
Leu Lys Gly Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys
        835                 840                 845
Ser Glu Leu Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly
    850                 855                 860
Val Ser Asp Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr
865                 870                 875                 880
Ile Asn Lys Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val
                885                 890                 895
Glu Ser Ile Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser
            900                 905                 910
Val Glu Asp Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala
        915                 920                 925
His Asn Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu
    930                 935                 940
Leu Trp Phe Pro Gly Ser Arg Cys Asp Ile Gln Met Thr Gln Ser Pro
945                 950                 955                 960
Ser Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg
                965                 970                 975
Ala Ser Gln Gly Ile Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro
            980                 985                 990
Gly Lys Ala Pro Lys Leu Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser
        995                 1000                1005
Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe
    1010                1015                1020
Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr
    1025                1030                1035
Tyr Cys Gln Arg Tyr Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly
    1040                1045                1050
Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe
    1055                1060                1065
Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser
    1070                1075                1080
Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val
    1085                1090                1095
Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu
    1100                1105                1110
Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser
    1115                1120                1125
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val
    1130                1135                1140
Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr
    1145                1150                1155
Lys Ser Phe Asn Arg Gly Glu Cys
    1160                1165
<210>64
<211>1404
<212>DNA
<213>人造
<220>
<223>合成构建体:pTT3-HcintLC1aa-p.hori的部分编码序列
<400>64
ccgggtaaaa acagcatttt accagatgaa tggctcccaa ttgttgaaaa tgaaaaagtt    60
cgattcgtaa aaattggaga cttcatagat agggagattg aggaaaacgc tgagagagtg    120
aagagggatg gtgaaactga aattctagag gttaaagatc ttaaagccct ttccttcaat    180
agagaaacaa aaaagagcga gctcaagaag gtaaaggccc taattagaca ccgctattca    240
gggaaggttt acagcattaa actaaagtca gggagaagga tcaaaataac ctcaggtcat    300
agtctgttct cagtaaaaaa tggaaagcta gttaaggtca ggggagatga actcaagcct    360
ggtgatctcg ttgtcgttcc aggaaggtta aaacttccag aaagcaagca agtgctaaat    420
ctcgttgaac tactcctgaa attacccgaa gaggagacat cgaacatcgt aatgatgatc    480
ccagttaaag gtagaaagaa tttcttcaaa gggatgctca aaacattata ctggatcttc    540
ggggagggag aaaggccaag aaccgcaggg cgctatctca agcatcttga aagattagga    600
tacgttaagc tcaagagaag aggctgtgaa gttctcgact gggagtcact taagaggtac    660
aggaagcttt acgagaccct cattaagaac ctgaaatata acggtaatag cagggcatac    720
atggttgaat ttaactctct cagggatgta gtgagcttaa tgccaataga agaacttaag    780
gagtggataa ttggagaacc taggggtcct aagataggta ccttcattga tgtagatgat    840
tcatttgcaa agctcctagg ttactacata agtagcggag atgtagagaa agatagggtg    900
aagttccaca gtaaagatca aaacgttctc gaggatatag cgaaacttgc cgagaagtta    960
tttggaaagg tgaggagagg aagaggatat attgaggtat cagggaaaat tagccatgcc    1020
atatttagag ttttagcgga aggtaagaga attccagagt tcatcttcac atccccaatg    1080
gatattaagg tagccttcct taagggactc aacggtaatg ctgaagaatt aacgttctcc    1140
actaagagtg agctattagt taaccagctt atccttctcc tgaactccat tggagtttcg    1200
gatataaaga ttgaacatga gaaaggggtt tacagagttt acataaataa gaaggaatcc  1260
tccaatgggg atatagtact tgatagcgtc gaatctatcg aagttgaaaa atacgagggc  1320
tacgtttatg atctaagtgt tgaggataat gagaacttcc tcgttggctt cggactactt  1380
tacgcacaca acagtatgga catg                                         1404
<210>65
<211>468
<212>PRT
<213>人造
<220>
<223>合成:pTT3-HcintLC1aa-p.hori的部分氨基酸序列,表明重链的4个
氨基酸上游和蛋白内含子的r个氨基酸下游。
<400>65
Pro Gly Lys Asn Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile Val Glu
1               5                   10                  15
Asn Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu
            20                  25                  30
Ile Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile
        35                  40                  45
Leu Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu Thr Lys
    50                  55                  60
Lys Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr Ser
65                  70                  75                  80
Gly Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys Ile
                85                  90                  95
Thr Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu Val Lys
            100                 105                 110
Val Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly
        115                 120                 125
Arg Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val Glu Leu
    130                 135                 140
Leu Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met Met Ile
145                 150                 155                 160
Pro Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu
                165                 170                 175
Tyr Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr
            180                 185                 190
Leu Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly
        195                 200                 205
Cys Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr
    210                 215                 220
Glu Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr
225                 230                 235                 240
Met Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met Pro Ile
                245                 250                 255
Glu Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile
            260                 265                 270
Gly Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu Gly Tyr
        275                 280                 285
Tyr Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe His Ser
    290                 295                 300
Lys Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu
305                 310                 315                 320
Phe Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys
                325                 330                 335
Ile Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro
            340                 345                 350
Glu Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys
        355                 360                 365
Gly Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys Ser Glu
    370                 375                 380
Leu Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly Val Ser
385                 390                 395                 400
Asp Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn
                405                 410                 415
Lys Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val Glu Ser
            420                 425                 430
Ile Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu
        435                 440                 445
Asp Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala His Asn
    450                 455                 460
Ser Met Asp Met
465
<210>66
<211>1416
<212>DNA
<213>人造
<220>
<223>合成构建体:pTT3-HcintLC3aa-p.hori部分编码序列。
<400>66
ccgggtaaat tagcaaacag cattttacca gatgaatggc tcccaattgt tgaaaatgaa    60
aaagttcgat tcgtaaaaat tggagacttc atagataggg agattgagga aaacgctgag    120
agagtgaaga gggatggtga aactgaaatt ctagaggtta aagatcttaa agccctttcc    180
ttcaatagag aaacaaaaaa gagcgagctc aagaaggtaa aggccctaat tagacaccgc    240
tattcaggga aggtttacag cattaaacta aagtcaggga gaaggatcaa aataacctca    300
ggtcatagtc tgttctcagt aaaaaatgga aagctagtta aggtcagggg agatgaactc    360
aagcctggtg atctcgttgt cgttccagga aggttaaaac ttccagaaag caagcaagtg    420
ctaaatctcg ttgaactact cctgaaatta cccgaagagg agacatcgaa catcgtaatg    480
atgatcccag ttaaaggtag aaagaatttc ttcaaaggga tgctcaaaac attatactgg    540
atcttcgggg agggagaaag gccaagaacc gcagggcgct atctcaagca tcttgaaaga    600
ttaggatacg ttaagctcaa gagaagaggc tgtgaagttc tcgactggga gtcacttaag    660
aggtacagga agctttacga gaccctcatt aagaacctga aatataacgg taatagcagg    720
gcatacatgg ttgaatttaa ctctctcagg gatgtagtga gcttaatgcc aatagaagaa    780
cttaaggagt ggataattgg agaacctagg ggtcctaaga taggtacctt cattgatgta    840
gatgattcat ttgcaaagct cctaggttac tacataagta gcggagatgt agagaaagat    900
agggtgaagt tccacagtaa agatcaaaac gttctcgagg atatagcgaa acttgccgag    960
aagttatttg gaaaggtgag gagaggaaga ggatatattg aggtatcagg gaaaattagc    1020
catgccatat ttagagtttt agcggaaggt aagagaattc cagagttcat cttcacatcc    1080
ccaatggata ttaaggtagc cttccttaag ggactcaacg gtaatgctga agaattaacg    1140
ttctccacta agagtgagct attagttaac cagcttatcc ttctcctgaa ctccattgga    1200
gtttcggata taaagattga acatgagaaa ggggtttaca gagtttacat aaataagaag    1260
gaatcctcca atggggatat agtacttgat agcgtcgaat ctatcgaagt tgaaaaatac  1320
gagggctacg tttatgatct aagtgttgag gataatgaga acttcctcgt tggcttcgga  1380
ctactttacg cacacaacag ttattacatg gacatg                            1416
<210>67
<211>472
<212>PRT
<213>人造
<220>
<223>合成:pTT3-HcintLC3aa-p.hori部分氨基酸序列,
表明蛋白内含子和侧翼序列。
<400>67
Pro Gly Lys Leu Ala Asn Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile
1               5                   10                  15
Val Glu Asn Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp
            20                  25                  30
Arg Glu Ile Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr
        35                  40                  45
Glu Ile Leu Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu
            180                 185                 190
Arg Tyr Leu Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg
        195                 200                 205
Arg Gly Cys Glu Val  Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys
    210                 215                 220
Leu Tyr Glu Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg
225                 230                 235                 240
Ala Tyr Met Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met
                245                 250                 255
Pro Ile Glu Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro
            260                 265                 270
Lys Ile Gly Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu
        275                 280                 285
Gly Tyr Tyr Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe
    290                 295                 300
His Ser Lys Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu
305                 310                 315                 320
Lys Leu Phe Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser
                325                 330                 335
Gly Lys Ile Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg
            340                 345                 350
Ile Pro Glu Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe
        355                 360                 365
Leu Lys Gly Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys
    370                 375                 380
Ser Glu Leu Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly
385                 390                 395                 400
Val Ser Asp Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr
                405                 410                 415
Ile Asn Lys Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val
            420                 425                 430
Glu Ser Ile Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser
        435                 440                 445
Val Glu Asp Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala
    450                 455                 460
His Asn Ser Tyr Tyr Met Asp Met
465                 470
<210>68
<211>31
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>68
ggactacttt acgcagccaa catggacatg c                              31
<210>69
<211>31
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>69
gcatgtccat gttggctgcg taaagtagtc c                     31
<210>70
<211>34
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>70
ggactacttt acgcagccaa cagtatggac atgc                  34
<210>71
<211>34
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>71
gcatgtccat actgttggct gcgtaaagta gtcc                  34
<210>72
<211>18
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>72
ggtgaggaga ggaagagg                           18
<210>73
<211>16
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>73
ccagaggtcg aggtcg                             16
<210>74
<211>14
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>74
cggcgtggag gtgc                               14
<210>75
<211>45
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>75
caacaattgg gagccattca tctggtaaaa tggttttacc cggag          45
<210>76
<211>40
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>76
ccgcccagct gctgggcgac gagtggttcc ccggctcgcg                40
<210>77
<211>40
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>77
cgcgagccgg ggaaccactc gtcgcccagc agctgggcgg                 40
<210>78
<211>15
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>78
tgagcggccg ctcga                                            15
<210>79
<211>15
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>79
gttgtgtgcg taaag                                            15
<210>80
<211>15
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>80
agcattttac cagat                                   15
<210>81
<211>15
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>81
ggtggcgccc aaact                                   15
<210>82
<211>30
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>82
ctttacgcac acaacatgga catgcgcgtg                   30
<210>83
<211>27
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>83
tcgagcggcc gctcaacact ctcccct                            27
<210>84
<211>30
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>84
agtttgggcg ccaccatgga gtttgggctg                         30
<210>85
<211>30
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>85
atctggtaaa atgcttttac ccggagacag                          30
<210>86
<211>30
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>86
agtttgggcg ccaccatgga catgcgcgtg                          30
<210>87
<211>31
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>87
atctggtaaa atgctacact ctcccctgtt g                        31
<210>88
<211>30
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>88
ctttacgcac acaacatgga gtttgggctg                        30
<210>89
<211>30
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>89
tcgagcggcc gctcatttac ccggagacag                        30
<210>90
<211>14
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>90
cgccaagctc tagc                                         14
<210>91
<211>14
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>91
ggtcgaggtc gggg                                          14
<210>92
<211>40
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>92
acatgcgcgt gcccgcccag tggttccccg gctcgcgatg              40
<210>93
<211>40
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>93
catcgcgagc cggggaacca ctgggcgggc acgcgca tgt                40
<210>94
<211>30
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>94
ctttacgcac acaacgacat ccagatgacc                            30
<210>95
<211>30
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>95
ggtcatctgg atgtcgttgt gtgcgtaaag                            30
<210>96
<211>36
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>96
tggttccccg gctcgggagg cgacatccag atgacc                              36
<210>97
<211>36
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>97
ggtcatctgg atgtcgcctc ccgagccggg gaacca                              36
<210>98
<211>1464
<212>DNA
<213>人造
<220>
<223>合成构建体:构建体A的部分编码序列。
<400>98
ccgggtaaaa gcattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga    60
ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag    120
agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga    180
gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg    240
aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt    300
ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt    360
gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc    420
gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca    480
gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg    540
gagggagaaa ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac    600
gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg    660
aagctttacg agaccctcat taagaacctg aaatataacg gtaatagcag ggcatacatg    720
gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag    780
tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca    840
tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag    900
ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt    960
ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata    1020
tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat    1080
attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact  1140
aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat  1200
ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc  1260
aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac  1320
gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac  1380
gcagccaaca tggacatgcg cgtgcccgcc cagctgctgg gcctgctgct gctgtggttc  1440
cccggctcgc gatgcgacat ccag                                         1464
<210>99
<211>488
<212>PRT
<213>人造
<220>
<223>合成:构建体A的部分氨基酸序列。
<400>99
Pro Gly Lys Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile Val Glu Asn
1               5                   10                  15
Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile
            20                  25                  30
Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile Leu
        35                  40                  45
Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu Thr Lys Lys
    50                  55                  60
Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr Ser Gly
65                  70                  75                  80
Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr
                85                  90                  95
Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu Val Lys Val
            100                 105                 110
Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly Arg
        115                 120                 125
Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu
    130                 135                 140
Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met Met Ile Pro
145                 150                 155                 160
Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr
                165                 170                 175
Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu
            180                 185                 190
Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly Cys
        195                 200                 205
Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu
    210                 215                 220
Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr Met
225                 230                 235                 240
Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met Pro Ile Glu
                245                 250                 255
Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile Gly
            260                 265                 270
Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu Gly Tyr Tyr
        275                 280                 285
Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe His Ser Lys
    290                 295                 300
Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe
305                 310                 315                 320
Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys Ile
                325                 330                 335
Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro Glu
            340                 345                 350
Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys Gly
        355                 360                 365
Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys Ser Glu Leu
    370                 375                 380
Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly Val Ser Asp
385                 390                 395                 400
Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn Lys
                405                 410                 415
Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val Glu Ser Ile
            420                 425                 430
Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu Asp
        435                 440                 445
Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala Ala Asn Met
    450                 455                 460
Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe
465                 470                 475                 480
Pro Gly Ser Arg Cys Asp Ile Gln
                485
<210>100
<211>1467
<212>DNA
<213>人造
<220>
<223>合成构建体:构建体B的部分编码序列。
<400>100
ccgggtaaaa gcattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga    60
ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag    120
agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga    180
gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg    240
aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt    300
ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt    360
gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc    420
gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca    480
gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg    540
gagggagaaa ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac    600
gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg    660
aagctttacg agaccctcat taagaacctg aaatataacg gtaatagcag ggcatacatg    720
gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag    780
tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca    840
tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag    900
ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt    960
ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata    1020
tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat  1080
attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact  1140
aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat  1200
ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc  1260
aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac  1320
gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac  1380
gcagccaaca gtatggacat gcgcgtgccc gcccagctgc tgggcctgct gctgctgtgg  1440
ttccccggct cgcgatgcga catccag                                      1467
<210>101
<211>489
<212>PRT
<213>人造
<220>
<223>合成构建体:构建体A的部分氨基酸序列。
<400>101
Pro Gly Lys Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile Val Glu Asn
1               5                   10                  15
Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile
            20                  25                  30
Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile Leu
        35                  40                  45
Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu Thr Lys Lys
    50                  55                  60
Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr Ser Gly
65                  70                  75                  80
Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr
                85                  90                  95
Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu Val Lys Val
            100                 105                 110
Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly Arg
        115                 120                 125
Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu
    130                 135                 140
Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met Met Ile Pro
145                 150                 155                 160
Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr
                165                 170                 175
Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu
            180                 185                 190
Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly Cys
        195                 200                 205
Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu
    210                 215                 220
Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr Met
225                 230                 235                 240
Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met Pro Ile Glu
                245                 250                 255
Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile Gly
            260                 265                 270
Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu Gly Tyr Tyr
        275                 280                 285
Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe His Ser Lys
    290                 295                 300
Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe
305                 310                 315                 320
Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys Ile
                325                 330                 335
Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro Glu
            340                 345                 350
Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys Gly
        355                 360                 365
Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys Ser Glu Leu
    370                 375                 380
Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly Val Ser Asp
385                 390                 395                 400
Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn Lys
                405                  410                 415
Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val Glu Ser Ile
            420                 425                 430
Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu Asp
        435                 440                 445
Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala Ala Asn Ser
    450                 455                 460
Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp
465                 470                 475                 480
Phe Pro Gly Ser Arg Cys Asp Ile Gln
                485
<210>102
<211>1467
<212>DNA
<213>人造
<220>
<223>合成构建体:构建体E中的部分编码序列。
<400>102
ccgggtaaaa ccattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga    60
ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag    120
agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga    180
gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg    240
aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt    300
ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt    360
gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc    420
gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca    480
gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg    540
gagggagaaa ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac    600
gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg    660
aagctttacg agaccctcat taagaacctg aaatataacg gtaatagcag ggcatacatg    720
gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag    780
tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca    840
tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag    900
ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt    960
ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata  1020
tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat  1080
attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact  1140
aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat  1200
ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc  1260
aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac  1320
gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac  1380
gcacacaaca gtatggacat gcgcgtgccc gcccagctgc tgggcctgct gctgctgtgg  1440
ttccccggct cgcgatgcga catccag                                      1467
<210>103
<211>489
<212>PRT
<213>人造
<220>
<223>合成构建体:构建体E的部分氨基酸序列。
<400>103
Pro Gly Lys Thr Ile Leu Pro Asp Glu Trp Leu Pro Ile Val Glu Asn
1               5                   10                  15
Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile
            20                  25                  30
Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile Leu
        35                  40                  45
Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu Thr Lys Lys
    50                  55                  60
Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr Ser Gly
65                  70                  75                  80
Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr
                85                  90                  95
Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu Val Lys Val
            100                 105                 110
Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly Arg
        115                 120                 125
Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu
    130                 135                 140
Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met Met Ile Pro
145                 150                 155                 160
Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr
                165                 170                 175
Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu
            180                 185                 190
Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly Cys
        195                 200                 205
Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu
    210                 215                 220
Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr Met
225                 230                 235                 240
Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met Pro Ile Glu
                245                 250                 255
Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile Gly
            260                 265                 270
Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu Gly Tyr Tyr
        275                 280                 285
Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe His Ser Lys
    290                 295                 300
Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe
305                 310                 315                 320
Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys Ile
                325                 330                 335
Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro Glu
            340                 345                 350
Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys Gly
        355                 360                 365
Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys Ser Glu Leu
    370                 375                 380
Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly Val Ser Asp
385                 390                 395                 400
Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn Lys
                405                 410                 415
Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val Glu Ser Ile
            420                 425                 430
Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu Asp
        435                 440                 445
Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala His Asn Ser
    450                 455                 460
Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp
465                 470                 475                 480
Phe Pro Gly Ser Arg Cys Asp Ile Gln
                485
<210>104
<211>1458
<212>DNA
<213>人造
<220>
<223>合成构建体:构建体H的部分编码序列。
<400>104
ccgggtaaaa gcattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga    60
ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag    120
agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga    180
gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg    240
aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt    300
ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt    360
gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc    420
gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca    480
gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg    540
gagggagaaa ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac    600
gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg    660
aagctttacg agaccctcat taagaacctg aaatataacg gtaatagcag ggcatacatg    720
gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag    780
tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca    840
tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag    900
ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt  960
ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata  1020
tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat  1080
attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact  1140
aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat  1200
ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc  1260
aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac  1320
gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac  1380
gcacacaaca tggacatgcg cgtgcccgcc cagctgctgg gcgacgagtg gttccccggc  1440
tcgcgatgcg acatccag                                                1458
<210>105
<211>486
<212>PRT
<213>人造
<220>
<223>合成构建体:构建体H的部分氨基酸序列。
<400>105
Pro Gly Lys Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile Val Glu Asn
1               5                   10                  15
Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile
            20                  25                  30
Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile Leu
        35                  40                  45
Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu Thr Lys Lys
    50                  55                  60
Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr Ser Gly
65                  70                  75                  80
Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys  Ile Thr
                85                  90                  95
Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu Val Lys Val
            100                 105                 110
Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly Arg
        115                 120                 125
Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu
    130                 135                 140
Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met Met Ile Pro
145                 150                 155                 160
Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr
                165                 170                 175
Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu
            180                 185                 190
Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly Cys
        195                 200                 205
Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu
    210                 215                 220
Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr Met
225                 230                 235                 240
Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met Pro Ile Glu
                245                 250                 255
Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile Gly
            260                 265                 270
Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu Gly Tyr Tyr
        275                 280                 285
Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe His Ser Lys
    290                 295                 300
Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe
305                 310                 315                 320
Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys Ile
                325                 330                 335
Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro Glu
            340                 345                 350
Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys Gly
        355                 360                 365
Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys Ser Glu Leu
    370                 375                 380
Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly Val Ser Asp
385                 390                 395                 400
Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn Lys
                405                 410                 415
Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val Glu Ser Ile
            420                 425                 430
Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu Asp
        435                 440                 445
Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala His Asn Met
    450                 455                 460
Asp Met Arg Val Pro Ala Gln Leu Leu Gly Asp Glu Trp Phe Pro Gly
465                 470                 475                 480
Ser Arg Cys Asp Ile Gln
                485
<210>106
<211>1443
<212>DNA
<213>人造
<220>
<223>合成构建体:构建体J的部分编码序列。
<400>106
ccgggtaaaa gcattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga    60
ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag    120
agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga    180
gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg    240
aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt    300
ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt    360
gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc    420
gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca    480
gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg    540
gagggagaaa ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac    600
gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg    660
aagctttacg agaccctcat taagaacctg aaatataacg gtaatagcag ggcatacatg    720
gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag    780
tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca  840
tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag  900
ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt  960
ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata  1020
tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat  1080
attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact  1140
aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat  1200
ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc  1260
aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac  1320
gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac  1380
gcacacaaca tggacatgcg cgtgcccgcc cagtggttcc ccggctcgcg atgcgacatc  1440
cag                                                                1443
<210>107
<211>481
<212>PRT
<213>人造
<220>
<223>合成构建体:构建体J的部分氨基酸序列。
<400>107
Pro Gly Lys Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile Val Glu Asn
1               5                   10                  15
Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile
            20                  25                  30
Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile Leu
        35                  40                  45
Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu Thr Lys Lys
    50                  55                  60
Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr Ser Gly
65                  70                  75                  80
Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr
                85                  90                  95
Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu Val Lys Val
            100                 105                 110
Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly Arg
        115                 120                 125
Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu
    130                 135                 140
Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met Met Ile Pro
145                 150                 155                 160
Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr
                165                 170                 175
Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu
            180                 185                 190
Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly Cys
        195                 200                 205
Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu
    210                 215                 220
Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr Met
225                 230                 235                 240
Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met Pro Ile Glu
                245                 250                 255
Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile Gly
            260                 265                 270
Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu Gly Tyr Tyr
        275                 280                 285
Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe His Ser Lys
    290                 295                 300
Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe
305                 310                 315                 320
Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys Ile
                325                 330                 335
Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro Glu
            340                 345                 350
Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys Gly
        355                 360                 365
Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys Ser Glu Leu
    370                 375                 380
Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly Val Ser Asp
385                 390                 395                 400
Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn Lys
                405                 410                 415
Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val Glu Ser Ile
            420                 425                 430
Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu Asp
        435                 440                 445
Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala His Asn Met
    450                 455                 460
Asp Met Arg Val Pro Ala Gln Trp Phe Pro Gly Ser Arg Cys Asp Ile
465                 470                 475                 480
Gln
<210>108
<211>1398
<212>DNA
<213>人造
<220>
<223>合成构建体:构建体K的部分编码序列。
<400>108
ccgggtaaaa gcattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga    60
ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag    120
agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga    180
gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg    240
aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt    300
ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt    360
gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc    420
gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca    480
gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg    540
gagggagaaa ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac    600
gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg    660
aagctttacg agaccctcat taagaacctg aaatataacg gtaatagcag ggcatacatg    720
gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag    780
tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca    840
tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag    900
ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt    960
ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata    1020
tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat    1080
attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact    1140
aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat    1200
ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc    1260
aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac    1320
gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac    1380
gcacacaacg acatccag                                                  1398
<210>109
<211>466
<212>PRT
<213>人造
<220>
<223>合成构建体:构建体K的部分氨基酸序列。
<400>109
Pro Gly Lys Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile Val Glu Asn
1               5                   10                  15
Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile
            20                  25                  30
Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile Leu
        35                  40                  45
Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu Thr Lys Lys
    50                  55                  60
Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr Ser Gly
65                  70                  75                  80
Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr
                85                  90                  95
Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu Val Lys Val
            100                 105                 110
Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly Arg
        115                 120                 125
Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu
    130                 135                 140
Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met Met Ile Pro
145                 150                 155                 160
Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr
                165                 170                 175
Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu
            180                 185                 190
Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly Cys
        195                 200                 205
Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu
    210                 215                 220
Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr Met
225                 230                 235                 240
Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met Pro Ile Glu
                245                 250                 255
Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile Gly
            260                 265                 270
Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu Gly Tyr Tyr
        275                 280                 285
Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe His Ser Lys
    290                 295                 300
Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe
305                 310                 315                 320
Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys Ile
                325                 330                 335
Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro Glu
            340                 345                 350
Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys Gly
        355                 360                 365
Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys Ser Glu Leu
    370                 375                 380
Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly Val Ser Asp
385                 390                 395                 400
Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn Lys
                405                 410                 415
Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val Glu Ser Ile
            420                 425                 430
Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu Asp
        435                 440                 445
Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala His Asn Asp
    450                 455                 460
Ile Gln
465
<210>110
<211>1464
<212>DNA
<213>人造
<220>
<223>合成构建体:构建体L的部分编码序列。
<400>110
ccgggtaaaa gcattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga    60
ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag    120
agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga    180
gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg    240
aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt    300
ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt    360
gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc    420
gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca    480
gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg    540
gagggagaaa ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac    600
gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg    660
aagctttacg agaccctcat taagaacctg aaatataacg gtaatagcag ggcatacatg    720
gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag    780
tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca  840
tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag  900
ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt  960
ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata  1020
tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat  1080
attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact  1140
aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat  1200
ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc  1260
aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac  1320
gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac  1380
gcacacaaca tggacatgcg cgtgcccgcc cagctgctgg gcctgctgct gctgtggttc  1440
cccggctcgg gaggcgacat ccag                                         1464
<210>111
<211>488
<212>PRT
<213>人造
<220>
<223>合成构建体:构建体L的部分氨基酸序列。
<400>111
Pro Gly Lys Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile Val Glu Asn
1               5                   10                   15
Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile
            20                  25                  30
Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile Leu
        35                  40                  45
Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu Thr Lys Lys
    50                  55                  60
Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr Ser Gly
65                  70                  75                  80
Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr
                85                  90                  95
Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu Val Lys Val
            100                 105                 110
Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly Arg
        115                 120                 125
Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu
    130                 135                 140
Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met Met Ile Pro
145                 150                 155                 160
Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr
                165                 170                 175
Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu
            180                 185                 190
Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly Cys
        195                 200                 205
Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu
    210                 215                 220
Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr Met
225                 230                 235                 240
Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met Pro Ile Glu
                245                 250                 255
Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile Gly
            260                 265                 270
Thr Phe Ile Asp Val Asp Asp Ser Phe Ala Lys Leu Leu Gly Tyr Tyr
        275                 280                 285
Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe His Ser Lys
    290                 295                 300
Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe
305                 310                 315                 320
Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys Ile
                325                 330                 335
Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro Glu
            340                 345                 350
Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys Gly
        355                 360                 365
Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys Ser Glu Leu
    370                 375                 380
Leu Val Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly Val Ser Asp
385                 390                 395                 400
Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn Lys
                405                 410                 415
Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val Glu Ser Ile
            420                 425                 430
Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu Asp
        435                 440                 445
Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala His Asn Met
    450                 455                 460
Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe
465                 470                 475                 480
Pro Gly Ser Gly Gly Asp Ile Gln
                485
<210>112
<211>26
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>112
tgctttgcca agggtaccaa tgtttt                            26
<210>113
<211>26
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>113
attatggacg acaacctggt tggcaa                            26
<210>114
<211>59
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>114
ccgcagaaga gcctctccct gtctccgggt aaatgctttg ccaagggtac caatgtttt     59
<210>115
<211>62
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>115
ccgcagaaga gcctctccct gtctccgggt aaagggtgct ttgccaaggg taccaatgtt    60
tt                                                                   62
<210>116
<211>68
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>116
ccgcagaaga gcctctccct gtctccgggt aaatatgtcg ggtgctttgc caagggtacc    60
aatgtttt                                                             68
<210>117
<211>65
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>117
cagcaggccc agcagctggg cgggcacgcg catgtccata ttatggacga caacctggtt    60
ggcaa                                                                65
<210>118
<211>68
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>118
cagcaggccc agcagctggg cgggcacgcg catgtccatg caattatgga cgacaacctg    60
gttggcaa                                                             68
<210>119
<211>74
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>119
cagcaggccc agcagctggg cgggcacgcg catgtccatt tctccgcaat tatggacgac    60
aacctggttg gcaa                                                      74
<210>120
<211>40
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>120
ccactacacg cagaagagcc tctccctgtc tccgggtaaa                          40
<210>121
<211>40
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>121
gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat                          40
<210>122
<211>40
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>122
atggacatgc gcgtgcccgc ccagctgctg ggcctgctgc                         40
<210>123
<211>41
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>123
tttacccgga gacagggaga ggctcttctg cgtgtagtgg t                       41
<210>124
<211>9442
<212>DNA
<213>人造
<220>
<223>合成构建体:质粒pTT3-D2E7重链
蛋白内含子-D2E7轻链的核苷酸序列。
<400>124
gcggccgctc gaggccggca aggccggatc ccccgacctc gacctctggc taataaagga    60
aatttatttt cattgcaata gtgtgttgga attttttgtg tctctcactc ggaaggacat    120
atgggagggc aaatcatttg gtcgagatcc ctcggagatc tctagctaga ggatcgatcc    180
ccgccccgga cgaactaaac ctgactacga catctctgcc ccttcttcgc ggggcagtgc    240
atgtaatccc ttcagttggt tggtacaact tgccaactgg gccctgttcc acatgtgaca    300
cgggggggga ccaaacacaa aggggttctc tgactgtagt tgacatcctt ataaatggat    360
gtgcacattt gccaacactg agtggctttc atcctggagc agactttgca gtctgtggac    420
tgcaacacaa cattgccttt atgtgtaact cttggctgaa gctcttacac caatgctggg    480
ggacatgtac ctcccagggg cccaggaaga ctacgggagg ctacaccaac gtcaatcaga    540
ggggcctgtg tagctaccga taagcggacc ctcaagaggg cattagcaat agtgtttata    600
aggccccctt gttaacccta aacgggtagc atatgcttcc cgggtagtag tatatactat    660
ccagactaac cctaattcaa tagcatatgt tacccaacgg gaagcatatg ctatcgaatt    720
agggttagta aaagggtcct aaggaacagc gatatctccc accccatgag ctgtcacggt    780
tttatttaca tggggtcagg attccacgag ggtagtgaac cattttagtc acaagggcag    840
tggctgaaga tcaaggagcg ggcagtgaac tctcctgaat cttcgcctgc ttcttcattc    900
tccttcgttt agctaataga ataactgctg agttgtgaac agtaaggtgt atgtgaggtg    960
ctcgaaaaca aggtttcagg tgacgccccc agaataaaat ttggacgggg ggttcagtgg    1020
tggcattgtg ctatgacacc aatataaccc tcacaaaccc cttgggcaat aaatactagt    1080
gtaggaatga aacattctga atatctttaa caatagaaat ccatggggtg gggacaagcc    1140
gtaaagactg gatgtccatc tcacacgaat ttatggctat gggcaacaca taatcctagt    1200
gcaatatgat actggggtta ttaagatgtg tcccaggcag ggaccaagac aggtgaacca    1260
tgttgttaca ctctatttgt aacaagggga aagagagtgg acgccgacag cagcggactc    1320
cactggttgt ctctaacacc cccgaaaatt aaacggggct ccacgccaat ggggcccata    1380
aacaaagaca agtggccact cttttttttg aaattgtgga gtgggggcac gcgtcagccc    1440
ccacacgccg ccctgcggtt ttggactgta aaataagggt gtaataactt ggctgattgt    1500
aaccccgcta accactgcgg tcaaaccact tgcccacaaa accactaatg gcaccccggg    1560
gaatacctgc ataagtaggt gggcgggcca agataggggc gcgattgctg cgatctggag    1620
gacaaattac acacacttgc gcctgagcgc caagcacagg gttgttggtc ctcatattca    1680
cgaggtcgct gagagcacgg tgggctaatg ttgccatggg tagcatatac tacccaaata    1740
tctggatagc atatgctatc ctaatctata tctgggtagc ataggctatc ctaatctata    1800
tctgggtagc atatgctatc ctaatctata tctgggtagt atatgctatc ctaatttata    1860
tctgggtagc ataggctatc ctaatctata tctgggtagc atatgctatc ctaatctata    1920
tctgggtagt atatgctatc ctaatctgta tccgggtagc atatgctatc ctaatagaga    1980
ttagggtagt atatgctatc ctaatttata tctgggtagc atatactacc caaatatctg    2040
gatagcatat gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg    2100
ggtagcatag gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg    2160
ggtagtatat gctatcctaa tttatatctg ggtagcatag gctatcctaa tctatatctg    2220
ggtagcatat gctatcctaa tctatatctg ggtagtatat gctatcctaa tctgtatccg    2280
ggtagcatat gctatcctca tgataagctg tcaaacatga gaattttctt gaagacgaaa    2340
gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac    2400
gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat    2460
acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg    2520
aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc    2580
attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga    2640
tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga    2700
gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg    2760
cgcggtatta tcccgtgttg acgccgggca agagcaactc ggtcgccgca tacactattc    2820
tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac    2880
agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact    2940
tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca    3000
tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg    3060
tgacaccacg atgcctgcag caatggcaac aacgttgcgc aaactattaa ctggcgaact    3120
acttactcta gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg    3180
accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg    3240
tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat    3300
cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc    3360
tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat    3420
actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt    3480
tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc    3540
cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt    3600
gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac    3660
tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt    3720
gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct    3780
gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga    3840
ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac    3900
acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg    3960
agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt    4020
cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc    4080
tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg    4140
gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc    4200
ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc    4260
ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag    4320
cgaggaagcg gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca    4380
ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat    4440
taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg    4500
tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga    4560
ttacgccaag ctctagctag aggtcgacca attctcatgt ttgacagctt atcatcgcag    4620
atccgggcaa cgttgttgcc attgctgcag gcgcagaact ggtaggtatg gaagatctat    4680
acattgaatc aatattggca attagccata ttagtcattg gttatatagc ataaatcaat    4740
attggctatt ggccattgca tacgttgtat ctatatcata atatgtacat ttatattggc    4800
tcatgtccaa tatgaccgcc atgttgacat tgattattga ctagttatta atagtaatca    4860
attacggggt cattagttca tagcccatat atggagttcc gcgttacata acttacggta    4920
aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat    4980
gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg    5040
taaactgccc acttggcagt acatcaagtg tatcatatgc caagtccgcc ccctattgac    5100
gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt acgggacttt    5160
cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg    5220
cagtacacca atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc    5280
attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt    5340
aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata    5400
agcagagctc gtttagtgaa ccgtcagatc ctcactctct tccgcatcgc tgtctgcgag    5460
ggccagctgt tgggctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg    5520
atcggaaacc cgtcggcctc cgaacggtac tccgccaccg agggacctga gcgagtccgc    5580
atcgaccgga tcggaaaacc tctcgagaaa ggcgtctaac cagtcacagt cgcaaggtag    5640
gctgagcacc gtggcgggcg gcagcgggtg gcggtcgggg ttgtttctgg cggaggtgct    5700
gctgatgatg taattaaagt aggcggtctt gagacggcgg atggtcgagg tgaggtgtgg    5760
caggcttgag atccagctgt tggggtgagt actccctctc aaaagcgggc attacttctg    5820
cgctaagatt gtcagtttcc aaaaacgagg aggatttgat attcacctgg cccgatctgg    5880
ccatacactt gagtgacaat gacatccact ttgcctttct ctccacaggt gtccactccc    5940
aggtccaagt ttgggcgcca ccatggagtt tgggctgagc tggctttttc ttgtcgcgat    6000
tttaaaaggt gtccagtgtg aggtgcagct ggtggagtct gggggaggct tggtacagcc    6060
cggcaggtcc ctgagactct cctgtgcggc ctctggattc acctttgatg attatgccat    6120
gcactgggtc cggcaagctc cagggaaggg cctggaatgg gtctcagcta tcacttggaa    6180
tagtggtcac atagactatg cggactctgt ggagggccga ttcaccatct ccagagacaa    6240
cgccaagaac tccctgtatc tgcaaatgaa cagtctgaga gctgaggata cggccgtata    6300
ttactgtgcg aaagtctcgt accttagcac cgcgtcctcc cttgactatt ggggccaagg    6360
taccctggtc accgtctcga gtgcgtcgac caagggccca tcggtcttcc ccctggcacc    6420
ctcctccaag agcacctctg ggggcacagc ggccctgggc tgcctggtca aggactactt    6480
ccccgaaccg gtgacggtgt cgtggaactc aggcgccctg accagcggcg tgcacacctt    6540
cccggctgtc ctacagtcct caggactcta ctccctcagc agcgtggtga ccgtgccctc    6600
cagcagcttg ggcacccaga cctacatctg caacgtgaat cacaagccca gcaacaccaa    6660
ggtggacaag aaagttgagc ccaaatcttg tgacaaaact cacacatgcc caccgtgccc    6720
agcacctgaa ctcctggggg gaccgtcagt cttcctcttc cccccaaaac ccaaggacac    6780
cctcatgatc tcccggaccc ctgaggtcac atgcgtggtg gtggacgtga gccacgaaga    6840
ccctgaggtc aagttcaact ggtacgtgga cggcgtggag gtgcataatg ccaagacaaa    6900
gccgcgggag gagcagtaca acagcacgta ccgtgtggtc agcgtcctca ccgtcctgca    6960
ccaggactgg ctgaatggca aggagtacaa gtgcaaggtc tccaacaaag ccctcccagc    7020
ccccatcgag aaaaccatct ccaaagccaa agggcagccc cgagaaccac aggtgtacac    7080
cctgccccca tcccgggatg agctgaccaa gaaccaggtc agcctgacct gcctggtcaa    7140
aggcttctat cccagcgaca tcgccgtgga gtgggagagc aatgggcagc cggagaacaa    7200
ctacaagacc acgcctcccg tgctggactc cgacggctcc ttcttcctct acagcaagct    7260
caccgtggac aagagcaggt ggcagcaggg gaacgtcttc tcatgctccg tgatgcatga    7320
ggctctgcac aaccactaca cgcagaagag cctctccctg tctccgggta aatgctttgc    7380
caagggtacc aatgttttaa tggcggatgg gtctattgaa tgtattgaaa acattgaggt    7440
tggtaataag gtcatgggta aagatggcag acctcgtgag gtaattaaat tgcccagagg    7500
aagagaaact atgtacagcg tcgtgcagaa aagtcagcac agagcccaca aaagtgactc    7560
aagtcgtgaa gtgccagaat tactcaagtt tacgtgtaat gcgacccatg agttggttgt    7620
tagaacacct cgtagtgtcc gccgtttgtc tcgtaccatt aagggtgtcg aatattttga    7680
agttattact tttgagatgg gccaaaagaa agcccccgac ggtagaattg ttgagcttgt    7740
caaggaagtt tcaaagagct acccaatatc tgaggggcct gagagagcca acgaattagt    7800
agaatcctat agaaaggctt caaataaagc ttattttgag tggactattg aggccagaga    7860
tctttctctg ttgggttccc atgttcgtaa agctacctac cagacttacg ctccaattct    7920
ttatgagaat gaccactttt tcgactacat gcaaaaaagt aagtttcatc tcaccattga    7980
aggtccaaaa gtacttgctt atttacttgg tttatggatt ggtgatggat tgtctgacag    8040
ggcaactttt tcggttgatt ccagagatac ttctttgatg gaacgtgtta ctgaatatgc    8100
tgaaaagttg aatttgtgcg ccgagtataa ggacagaaaa gaaccacaag ttgccaaaac    8160
tgttaatttg tactctaaag ttgtcagagg taatggtatt cgcaataatc ttaatactga    8220
gaatccatta tgggacgcta ttgttggctt aggattcttg aaggacggtg tcaaaaatat    8280
tccttctttc ttgtctacgg acaatatcgg tactcgtgaa acatttcttg ctggtctaat    8340
tgattctgat ggctatgtta ctgatgagca tggtattaaa gcaacaataa agacaattca    8400
tacttctgtc agagatggtt tggtttccct tgctcgttct ttaggcttag tagtctcggt    8460
taacgcagaa cctgctaagg ttgacatgaa tggcaccaaa cataaaatta gttatgctat    8520
ttatatgtct ggtggagatg ttttgcttaa cgttctttcg aagtgtgccg gctctaaaaa    8580
attcaggcct gctcccgccg ctgcttttgc acgtgagtgc cgcggatttt atttcgagtt    8640
acaagaattg aaggaagacg attattatgg gattacttta tctgatgatt ctgatcatca    8700
gtttttgctt gccaaccagg ttgtcgtcca taatatggac atgcgcgtgc ccgcccagct    8760
gctgggcctg ctgctgctgt ggttccccgg ctcgcgatgc gacatccaga tgacccagtc    8820
tccatcctcc ctgtctgcat ctgtagggga cagagtcacc atcacttgtc gggcaagtca    8880
gggcatcaga aattacttag cctggtatca gcaaaaacca gggaaagccc ctaagctcct    8940
gatctatgct gcatccactt tgcaatcagg ggtcccatct cggttcagtg gcagtggatc    9000
tgggacagat ttcactctca ccatcagcag cctacagcct gaagatgttg caacttatta    9060
ctgtcaaagg tataaccgtg caccgtatac ttttggccag gggaccaagg tggaaatcaa    9120
acgtacggtg gctgcaccat ctgtcttcat cttcccgcca tctgatgagc agttgaaatc    9180
tggaactgcc tctgttgtgt gcctgctgaa taacttctat cccagagagg ccaaagtaca    9240
gtggaaggtg gataacgccc tccaatcggg taactcccag gagagtgtca cagagcagga    9300
cagcaaggac agcacctaca gcctcagcag caccctgacg ctgagcaaag cagactacga    9360
gaaacacaaa gtctacgcct gcgaagtcac ccatcagggc ctgagctcgc ccgtcacaaa    9420
gagcttcaac aggggagagt gt                                             9442
<210>125
<211>1386
<212>DNA
<213>人造
<220>
<223>合成构建体:pTT3-HC-VMAint-LC-1aa中的部分编码序列。
<400>125
ccgggtaaag ggtgctttgc caagggtacc aatgttttaa tggcggatgg gtctattgaa    60
tgtattgaaa acattgaggt tggtaataag gtcatgggta aagatggcag acctcgtgag    120
gtaattaaat tgcccagagg aagagaaact atgtacagcg tcgtgcagaa aagtcagcac    180
agagcccaca aaagtgactc aagtcgtgaa gtgccagaat tactcaagtt tacgtgtaat    240
gcgacccatg agttggttgt tagaacacct cgtagtgtcc gccgtttgtc tcgtaccatt    300
aagggtgtcg aatattttga agttattact tttgagatgg gccaaaagaa agcccccgac    360
ggtagaattg ttgagcttgt caaggaagtt tcaaagagct acccaatatc tgaggggcct    420
gagagagcca acgaattagt agaatcctat agaaaggctt caaataaagc ttattttgag    480
tggactattg aggccagaga tctttctctg ttgggttccc atgttcgtaa agctacctac    540
cagacttacg ctccaattct ttatgagaat gaccactttt tcgactacat gcaaaaaagt    600
aagtttcatc tcaccattga aggtccaaaa gtacttgctt atttacttgg tttatggatt    660
ggtgatggat tgtctgacag ggcaactttt tcggttgatt ccagagatac ttctttgatg    720
gaacgtgtta ctgaatatgc tgaaaagttg aatttgtgcg ccgagtataa ggacagaaaa    780
gaaccacaag ttgccaaaac tgttaatttg tactctaaag ttgtcagagg taatggtatt    840
cgcaataatc ttaatactga gaatccatta tgggacgcta ttgttggctt aggattcttg    900
aaggacggtg tcaaaaatat tccttctttc ttgtctacgg acaatatcgg tactcgtgaa    960
acatttcttg ctggtctaat tgattctgat ggctatgtta ctgatgagca tggtattaaa    1020
gcaacaataa agacaattca tacttctgtc agagatggtt tggtttccct tgctcgttct    1080
ttaggcttag tagtctcggt taacgcagaa cctgctaagg ttgacatgaa tggcaccaaa    1140
cataaaatta gttatgctat ttatatgtct ggtggagatg ttttgcttaa cgttctttcg    1200
aagtgtgccg gctctaaaaa attcaggcct gctcccgccg ctgcttttgc acgtgagtgc    1260
cgcggatttt atttcgagtt acaagaattg aaggaagacg attattatgg gattacttta    1320
tctgatgatt ctgatcatca gtttttgctt gccaaccagg ttgtcgtcca taattgcatg    1380
gacatg                                                               1386
<210>126
<211>1398
<212>DNA
<213>人造
<220>
<223>合成构建体:pTT3-HC-VMAint-LC-3aa的部分编码序列。
<400>126
ccgggtaaat atgtcgggtg ctttgccaag ggtaccaatg ttttaatggc ggatgggtct    60
attgaatgta ttgaaaacat tgaggttggt aataaggtca tgggtaaaga tggcagacct    120
cgtgaggtaa ttaaattgcc cagaggaaga gaaactatgt acagcgtcgt gcagaaaagt    180
cagcacagag cccacaaaag tgactcaagt cgtgaagtgc cagaattact caagtttacg    240
tgtaatgcga cccatgagtt ggttgttaga acacctcgta gtgtccgccg tttgtctcgt    300
accattaagg gtgtcgaata ttttgaagtt attacttttg agatgggcca aaagaaagcc    360
cccgacggta gaattgttga gcttgtcaag gaagtttcaa agagctaccc aatatctgag    420
gggcctgaga gagccaacga attagtagaa tcctatagaa aggcttcaaa taaagcttat    480
tttgagtgga ctattgaggc cagagatctt tctctgttgg gttcccatgt tcgtaaagct    540
acctaccaga cttacgctcc aattctttat gagaatgacc actttttcga ctacatgcaa    600
aaaagtaagt ttcatctcac cattgaaggt ccaaaagtac ttgcttattt acttggttta    660
tggattggtg atggattgtc tgacagggca actttttcgg ttgattccag agatacttct    720
ttgatggaac gtgttactga atatgctgaa aagttgaatt tgtgcgccga gtataaggac    780
agaaaagaac cacaagttgc caaaactgtt aatttgtact ctaaagttgt cagaggtaat    840
ggtattcgca ataatcttaa tactgagaat ccattatggg acgctattgt tggcttagga  900
ttcttgaagg acggtgtcaa aaatattcct tctttcttgt ctacggacaa tatcggtact  960
cgtgaaacat ttcttgctgg tctaattgat tctgatggct atgttactga tgagcatggt  1020
attaaagcaa caataaagac aattcatact tctgtcagag atggtttggt ttcccttgct  1080
cgttctttag gcttagtagt ctcggttaac gcagaacctg ctaaggttga catgaatggc  1140
accaaacata aaattagtta tgctatttat atgtctggtg gagatgtttt gcttaacgtt  1200
ctttcgaagt gtgccggctc taaaaaattc aggcctgctc ccgccgctgc ttttgcacgt  1260
gagtgccgcg gattttattt cgagttacaa gaattgaagg aagacgatta ttatgggatt  1320
actttatctg atgattctga tcatcagttt ttgcttgcca accaggttgt cgtccataat  1380
tgcggagaaa tggacatg                                                1398
<210>127
<211>1050
<212>DNA
<213>人造
<220>
<223>合成构建体:工程化的集胞藻蛋白内含子编码序列。
<400>127
gggcgaattg ggtaccgaat tctgcctgtc cttcggcacc gagatcctga ccgtggagta    60
cccgcttaac ccatggctta agacggacag gaagccgtgg ctctaggact ggcacctcat    120
cggccctctg cctatcggca agatcgtgtc cgaagagatc aactgctccg tgtactccgt    180
gccgggagac ggatagccgt tctagcacag gcttctctag ttgacgaggc acatgaggca    240
ggaccctgag ggccgggtgt atactcaggc catcgcccag tggcacgacc ggggcgagca    300
cctgggactc ccggcccaca tatgagtccg gtagcgggtc accgtgctgg ccccgctcgt    360
ggaggtgctg gagtacgagc tggaggacgg ctccgtgatc cgggccacct ccgaccaccg    420
cctccacgac ctcatgctcg acctcctgcc gaggcactag gcccggtgga ggctggtggc    480
gtttctgacc accgactatc agctgctggc catcgaggag atcttcgccc ggcagctgga    540
caaagactgg tggctgatag tcgacgaccg gtagctcctc tagaagcggg ccgtcgacct    600
cctgctgacc ctggagaaca tcaagcagac cgaggaggcc ctggacaacc accggctgcc    660
ggacgactgg gacctcttgt agttcgtctg gctcctccgg gacctgttgg tggccgacgg    720
tttccctctg ctggacgccg gcaccatcaa gatggtgaag gtgatcggca ggcggtccct    780
aaagggagac gacctgcggc cgtggtagtt ctaccacttc cactagccgt ccgccaggga    840
gggcgtgcag cggatcttcg acatcggcct gcctcaggac cacaactttc tgctggccaa    900
cccgcacgtc gcctagaagc tgtagccgga cggagtcctg gtgttgaaag acgaccggtt    960
cggcgccatc gccgccaaca agcttgagct ccagcttttg ttcccgccgc ggtagcggcg  1020
gttgttcgaa ctcgaggtcg aaaacaaggg                                   1050
<210>128
<211>159
<212>PRT
<213>人造
<220>
<223>合成:工程化集胞藻序列编码的蛋白内含子。
<400>128
Cys Leu Ser Phe Gly Thr Glu Ile Leu Thr Val Glu Tyr Gly Pro Leu
1               5                   10                  15
Pro Ile Gly Lys Ile Val Ser Glu Glu Ile Asn Cys Ser Val Tyr Ser
            20                  25                  30
Val Asp Pro Glu Gly Arg Val Tyr Thr Gln Ala Ile Ala Gln Trp His
        35                  40                  45
Asp Arg Gly Glu Gln Glu Val Leu Glu Tyr Glu Leu Glu Asp Gly Ser
    50                  55                  60
Val Ile Arg Ala Thr Ser Asp His Arg Phe Leu Thr Thr Asp Tyr Gln
65                  70                  75                  80
Leu Leu Ala Ile Glu Glu Ile Phe Ala Arg Gln Leu Asp Leu Leu Thr
                85                  90                  95
Leu Glu Asn Ile Lys Gln Thr Glu Glu Ala Leu Asp Asn His Arg Leu
            100                 105                 110
Pro Phe Pro Leu Leu Asp Ala Gly Thr Ile Lys Met Val Lys Val Ile
        115                 120                 125
Gly Arg Arg Ser Leu Gly Val Gln Arg Ile Phe Asp Ile Gly Leu Pro
    130                 135                 140
Gln Asp His Asn Phe Leu Leu Ala Asn Gly Ala Ile Ala Ala Asn
145                 150                 155
<210>129
<211>61
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>129
ccactacacg cagaagagcc tctccctgtc tccgggtaaa tgcctgtcct tcggcaccga    60
g                                                                    61
<210>130
<211>65
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>130
gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat gttggcggcg atggcgccgt    60
tggcc                                                                65
<210>131
<211>64
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>131
ccactacacg cagaagagcc tctccctgtc tccgggtaaa tattgcctgt ccttcggcac    60
cgag                                                                 64
<210>132
<211>63
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>132
gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat acagttggcg gcgatggcgc    60
cgt                                                                  63
<210>133
<211>70
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>133
ccactacacg cagaagagcc tctccctgtc tccgggtaaa gccgagtatt gcctgtcctt    60
cggcaccgag                                                           70
<210>134
<211>70
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>134
ccactacacg cagaagagcc tctccctgtc tccgggtaaa gccgagtatt gcctgtcctt    60
cggcaccgag                                                           70
<210>135
<211>8557
<212>DNA
<213>人造
<220>
<223>合成构建体:质粒pTT3-D2E7重链
-Ssp-GA-蛋白内含子-D2E7轻链的核苷酸序列。
<400>135
gcggccgctc gaggccggca aggccggatc ccccgacctc gacctctggc taataaagga    60
aatttatttt cattgcaata gtgtgttgga attttttgtg tctctcactc ggaaggacat    120
atgggagggc aaatcatttg gtcgagatcc ctcggagatc tctagctaga ggatcgatcc    180
ccgccccgga cgaactaaac ctgactacga catctctgcc ccttcttcgc ggggcagtgc    240
atgtaatccc ttcagttggt tggtacaact tgccaactgg gccctgttcc acatgtgaca    300
cgggggggga ccaaacacaa aggggttctc tgactgtagt tgacatcctt ataaatggat    360
gtgcacattt gccaacactg agtggctttc atcctggagc agactttgca gtctgtggac    420
tgcaacacaa cattgccttt atgtgtaact cttggctgaa gctcttacac caatgctggg    480
ggacatgtac ctcccagggg cccaggaaga ctacgggagg ctacaccaac gtcaatcaga    540
ggggcctgtg tagctaccga taagcggacc ctcaagaggg cattagcaat agtgtttata    600
aggccccctt gttaacccta aacgggtagc atatgcttcc cgggtagtag tatatactat    660
ccagactaac cctaattcaa tagcatatgt tacccaacgg gaagcatatg ctatcgaatt    720
agggttagta aaagggtcct aaggaacagc gatatctccc accccatgag ctgtcacggt    780
tttatttaca tggggtcagg attccacgag ggtagtgaac cattttagtc acaagggcag    840
tggctgaaga tcaaggagcg ggcagtgaac tctcctgaat cttcgcctgc ttcttcattc    900
tccttcgttt agctaataga ataactgctg agttgtgaac agtaaggtgt atgtgaggtg    960
ctcgaaaaca aggtttcagg tgacgccccc agaataaaat ttggacgggg ggttcagtgg    1020
tggcattgtg ctatgacacc aatataaccc tcacaaaccc cttgggcaat aaatactagt    1080
gtaggaatga aacattctga atatctttaa caatagaaat ccatggggtg gggacaagcc    1140
gtaaagactg gatgtccatc tcacacgaat ttatggctat gggcaacaca taatcctagt    1200
gcaatatgat actggggtta ttaagatgtg tcccaggcag ggaccaagac aggtgaacca    1260
tgttgttaca ctctatttgt aacaagggga aagagagtgg acgccgacag cagcggactc    1320
cactggttgt ctctaacacc cccgaaaatt aaacggggct ccacgccaat ggggcccata    1380
aacaaagaca agtggccact cttttttttg aaattgtgga gtgggggcac gcgtcagccc    1440
ccacacgccg ccctgcggtt ttggactgta aaataagggt gtaataactt ggctgattgt    1500
aaccccgcta accactgcgg tcaaaccact tgcccacaaa accactaatg gcaccccggg    1560
gaatacctgc ataagtaggt gggcgggcca agataggggc gcgattgctg cgatctggag    1620
gacaaattac acacacttgc gcctgagcgc caagcacagg gttgttggtc ctcatattca    1680
cgaggtcgct gagagcacgg tgggctaatg ttgccatggg tagcatatac tacccaaata    1740
tctggatagc atatgctatc ctaatctata tctgggtagc ataggctatc ctaatctata    1800
tctgggtagc atatgctatc ctaatctata tctgggtagt atatgctatc ctaatttata    1860
tctgggtagc ataggctatc ctaatctata tctgggtagc atatgctatc ctaatctata    1920
tctgggtagt atatgctatc ctaatctgta tccgggtagc atatgctatc ctaatagaga    1980
ttagggtagt atatgctatc ctaatttata tctgggtagc atatactacc caaatatctg    2040
gatagcatat gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg    2100
ggtagcatag gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg    2160
ggtagtatat gctatcctaa tttatatctg ggtagcatag gctatcctaa tctatatctg    2220
ggtagcatat gctatcctaa tctatatctg ggtagtatat gctatcctaa tctgtatccg    2280
ggtagcatat gctatcctca tgataagctg tcaaacatga gaattttctt gaagacgaaa    2340
gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac    2400
gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat    2460
acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg    2520
aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc    2580
attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga    2640
tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga    2700
gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg    2760
cgcggtatta tcccgtgttg acgccgggca agagcaactc ggtcgccgca tacactattc    2820
tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac    2880
agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact    2940
tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca    3000
tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg    3060
tgacaccacg atgcctgcag caatggcaac aacgttgcgc aaactattaa ctggcgaact    3120
acttactcta gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg    3180
accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg    3240
tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat    3300
cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc    3360
tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat    3420
actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt    3480
tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc    3540
cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt    3600
gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac    3660
tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt    3720
gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct    3780
gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga    3840
ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac    3900
acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg    3960
agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt    4020
cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc    4080
tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg    4140
gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc    4200
ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc    4260
ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag    4320
cgaggaagcg gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca    4380
ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat    4440
taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg    4500
tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga    4560
ttacgccaag ctctagctag aggtcgacca attctcatgt ttgacagctt atcatcgcag    4620
atccgggcaa cgttgttgcc attgctgcag gcgcagaact ggtaggtatg gaagatctat    4680
acattgaatc aatattggca attagccata ttagtcattg gttatatagc ataaatcaat    4740
attggctatt ggccattgca tacgttgtat ctatatcata atatgtacat ttatattggc    4800
tcatgtccaa tatgaccgcc atgttgacat tgattattga ctagttatta atagtaatca    4860
attacggggt cattagttca tagcccatat atggagttcc gcgttacata acttacggta    4920
aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat    4980
gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg    5040
taaactgccc acttggcagt acatcaagtg tatcatatgc caagtccgcc ccctattgac    5100
gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt acgggacttt    5160
cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg    5220
cagtacacca atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc    5280
attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt    5340
aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata    5400
agcagagctc gtttagtgaa ccgtcagatc ctcactctct tccgcatcgc tgtctgcgag    5460
ggccagctgt tgggctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg    5520
atcggaaacc cgtcggcctc cgaacggtac tccgccaccg agggacctga gcgagtccgc    5580
atcgaccgga tcggaaaacc tctcgagaaa ggcgtctaac cagtcacagt cgcaaggtag    5640
gctgagcacc gtggcgggcg gcagcgggtg gcggtcgggg ttgtttctgg cggaggtgct    5700
gctgatgatg taattaaagt aggcggtctt gagacggcgg atggtcgagg tgaggtgtgg    5760
caggcttgag atccagctgt tggggtgagt actccctctc aaaagcgggc attacttctg    5820
cgctaagatt gtcagtttcc aaaaacgagg aggatttgat attcacctgg cccgatctgg    5880
ccatacactt gagtgacaat gacatccact ttgcctttct ctccacaggt gtccactccc    5940
aggtccaagt ttgggcgcca ccatggagtt tgggctgagc tggctttttc ttgtcgcgat    6000
tttaaaaggt gtccagtgtg aggtgcagct ggtggagtct gggggaggct tggtacagcc    6060
cggcaggtcc ctgagactct cctgtgcggc ctctggattc acctttgatg attatgccat    6120
gcactgggtc cggcaagctc cagggaaggg cctggaatgg gtctcagcta tcacttggaa    6180
tagtggtcac atagactatg cggactctgt ggagggccga ttcaccatct ccagagacaa    6240
cgccaagaac tccctgtatc tgcaaatgaa cagtctgaga gctgaggata cggccgtata    6300
ttactgtgcg aaagtctcgt accttagcac cgcgtcctcc cttgactatt ggggccaagg    6360
taccctggtc accgtctcga gtgcgtcgac caagggccca tcggtcttcc ccctggcacc    6420
ctcctccaag agcacctctg ggggcacagc ggccctgggc tgcctggtca aggactactt    6480
ccccgaaccg gtgacggtgt cgtggaactc aggcgccctg accagcggcg tgcacacctt    6540
cccggctgtc ctacagtcct caggactcta ctccctcagc agcgtggtga ccgtgccctc    6600
cagcagcttg ggcacccaga cctacatctg caacgtgaat cacaagccca gcaacaccaa    6660
ggtggacaag aaagttgagc ccaaatcttg tgacaaaact cacacatgcc caccgtgccc    6720
agcacctgaa ctcctggggg gaccgtcagt cttcctcttc cccccaaaac ccaaggacac    6780
cctcatgatc tcccggaccc ctgaggtcac atgcgtggtg gtggacgtga gccacgaaga    6840
ccctgaggtc aagttcaact ggtacgtgga cggcgtggag gtgcataatg ccaagacaaa    6900
gccgcgggag gagcagtaca acagcacgta ccgtgtggtc agcgtcctca ccgtcctgca    6960
ccaggactgg ctgaatggca aggagtacaa gtgcaaggtc tccaacaaag ccctcccagc    7020
ccccatcgag aaaaccatct ccaaagccaa agggcagccc cgagaaccac aggtgtacac    7080
cctgccccca tcccgggatg agctgaccaa gaaccaggtc agcctgacct gcctggtcaa    7140
aggcttctat cccagcgaca tcgccgtgga gtgggagagc aatgggcagc cggagaacaa    7200
ctacaagacc acgcctcccg tgctggactc cgacggctcc ttcttcctct acagcaagct    7260
caccgtggac aagagcaggt ggcagcaggg gaacgtcttc tcatgctccg tgatgcatga    7320
ggctctgcac aaccactaca cgcagaagag cctctccctg tctccgggta aatgcctgtc    7380
cttcggcacc gagatcctga ccgtggagta cggccctctg cctatcggca agatcgtgtc    7440
cgaagagatc aactgctccg tgtactccgt ggaccctgag ggccgggtgt atactcaggc    7500
catcgcccag tggcacgacc ggggcgagca ggaggtgctg gagtacgagc tggaggacgg    7560
ctccgtgatc cgggccacct ccgaccaccg gtttctgacc accgactatc agctgctggc    7620
catcgaggag atcttcgccc ggcagctgga cctgctgacc ctggagaaca tcaagcagac    7680
cgaggaggcc ctggacaacc accggctgcc tttccctctg ctggacgccg gcaccatcaa    7740
gatggtgaag gtgatcggca ggcggtccct gggcgtgcag cggatcttcg acatcggcct    7800
gcctcaggac cacaactttc tgctggccaa cggcgccatc gccgccaaca tggacatgcg    7860
cgtgcccgcc cagctgctgg gcctgctgct gctgtggttc cccggctcgc gatgcgacat    7920
ccagatgacc cagtctccat cctccctgtc tgcatctgta ggggacagag tcaccatcac    7980
ttgtcgggca agtcagggca tcagaaatta cttagcctgg tatcagcaaa aaccagggaa    8040
agcccctaag ctcctgatct atgctgcatc cactttgcaa tcaggggtcc catctcggtt 8100
cagtggcagt ggatctggga cagatttcac tctcaccatc agcagcctac agcctgaaga 8160
tgttgcaact tattactgtc aaaggtataa ccgtgcaccg tatacttttg gccaggggac 8220
caaggtggaa atcaaacgta cggtggctgc accatctgtc ttcatcttcc cgccatctga 8280
tgagcagttg aaatctggaa ctgcctctgt tgtgtgcctg ctgaataact tctatcccag 8340
agaggccaaa gtacagtgga aggtggataa cgccctccaa tcgggtaact cccaggagag 8400
tgtcacagag caggacagca aggacagcac ctacagcctc agcagcaccc tgacgctgag 8460
caaagcagac tacgagaaac acaaagtcta cgcctgcgaa gtcacccatc agggcctgag 8520
ctcgcccgtc acaaagagct tcaacagggg agagtgt                          8557
<210>136
<211>501
<212>DNA
<213>人造
<220>
<223>合成构建体:pTT3-HC-Ssp-GA-int-LC-1aa的部分编码序列。
<400>136
ccgggtaaat attgcctgtc cttcggcacc gagatcctga ccgtggagta cggccctctg    60
cctatcggca agatcgtgtc cgaagagatc aactgctccg tgtactccgt ggaccctgag    120
ggccgggtgt atactcaggc catcgcccag tggcacgacc ggggcgagca ggaggtgctg    180
gagtacgagc tggaggacgg ctccgtgatc cgggccacct ccgaccaccg gtttctgacc    240
accgactatc agctgctggc catcgaggag atcttcgccc ggcagctgga cctgctgacc    300
ctggagaaca tcaagcagac cgaggaggcc ctggacaacc accggctgcc tttccctctg    360
ctggacgccg gcaccatcaa gatggtgaag gtgatcggca ggcggtccct gggcgtgcag    420
cggatcttcg acatcggcct gcctcaggac cacaactttc tgctggccaa cggcgccatc    480
gccgccaact gtatggacat g                                              501
<210>137
<211>513
<212>DNA
<213>人造
<220>
<223>合成构建体:质粒pTT3-HC-Ssp-GA-int-LC-3aa的编码序列的相关部分。
<400>137
ccgggtaaag ccgagtattg cctgtccttc ggcaccgaga tcctgaccgt ggagtacggc    60
cctctgccta tcggcaagat cgtgtccgaa gagatcaact gctccgtgta ctccgtggac    120
cctgagggcc gggtgtatac tcaggccatc gcccagtggc acgaccgggg cgagcaggag    180
gtgctggagt acgagctgga ggacggctcc gtgatccggg ccacctccga ccaccggttt    240
ctgaccaccg actatcagct gctggccatc gaggagatct tcgcccggca gctggacctg    300
ctgaccctgg agaacatcaa gcagaccgag gaggccctgg acaaccaccg gctgcctttc    360
cctctgctgg acgccggcac catcaagatg gtgaaggtga tcggcaggcg gtccctgggc    420
gtgcagcgga tcttcgacat cggcctgcct caggaccaca actttctgct ggccaacggc    480
gccatcgccg ccaactgttt caacatggac atg                                 513
<210>138
<211>11
<212>PRT
<213>古菌种
<400>138
Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser
1               5                   10
<210>139
<211>12
<212>PRT
<213>古菌种
<400>139
His Asn Ser Tyr Tyr Gly Tyr Tyr Gly Tyr Ala Lys
1               5                   10
<210>140
<211>214
<212>PRT
<213>人造
<220>
<223>合成构建体:Hedgehog-抗体构建体中包括裂解位点的部分氨基酸序列。
<400>140
Cys Phe Thr Pro Glu Ser Thr Ala Leu Leu Glu Ser Gly Val Arg Lys
1               5                   10                  15
Pro Leu Gly Glu Leu Ser Ile Gly Asp Arg Val Leu Ser Met Thr Ala
            20                  25                  30
Asn Gly Gln Ala Val Tyr Ser Glu Val Ile Leu Phe Met Asp Arg Asn
        35                  40                  45
Leu Glu Gln Met Gln Asn Phe Val Gln Leu His Thr Asp Gly Gly Ala
    50                  55                  60
Val Leu Thr Val Thr Pro Ala His Leu Val Ser Val Trp Gln Pro Glu
65                  70                  75                  80
Ser Gln Lys Leu Thr Phe Val Phe Ala Asp Arg Ile Glu Glu Lys Asn
                85                  90                  95
Gln Val Leu Val Arg Asp Val Glu Thr Gly Glu Leu Arg Pro Gln Arg
            100                  105                  110
Val Val Lys Val Gly Ser Val Arg Ser Lys Gly Val Val Ala Pro Leu
        115                  120                  125
Thr Arg Glu Gly Thr Ile Val Val Asn Ser Val Ala Ala Ser Cys Tyr
    130                  135                  140
Ala Val Ile Asn Ser Gln Ser Leu Ala His Trp Gly Leu Ala Pro Met
145                 150                 155                 160
Arg Leu Leu Ser Thr Leu Glu Ala Trp Leu Pro Ala Lys Glu Gln Leu
                165                 170                 175
His Ser Ser Pro Lys Val Val Ser Ser Ala Gln Gln Gln Asn Gly Ile
            180                 185                 190
His Trp Tyr Ala Asn Ala Leu Tyr Lys Val Lys Asp Tyr Val Leu Pro
        195                 200                 205
Gln Ser Trp Arg His Asp
    210
<210>141
<211>40
<212>PRT
<213>人造
<220>
<223>2A序列的变体。
<400>141
Leu Leu Ala Ile His Pro Thr Glu Ala Arg His Lys Gln Lys Ile Val
1               5                   10                  15
Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly
            20                  25                  30
Asp Val Glu Ser Asn Pro Gly Pro
        35                  40
<210>142
<211>33
<212>PRT
<213>人造
<220>
<223>2A序列的变体。
<400>142
Glu Ala Arg His Lys Gln Lys Ile Val Ala Pro Val Lys Gln Thr Leu
1               5                   10                  15
Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly
            20                  25                  30
Pro
<210>143
<211>20
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>143
atcgtggcgc cagctctgcg                                         20
<210>144
<211>20
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>144
gcaactggcg gccaccgagt                                      20
<210>145
<211>20
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>145
cgcatagcaa ctggcggcca                                      20
<210>146
<211>20
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>146
gttgtgggcg gccaccgagt                                                20
<210>147
<211>60
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>147
ccactacacg cagaagagcc tctccctgtc tccgggtaaa tgcttcacgc cggagagcac    60
<210>148
<211>60
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>148
gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat gcactggctg ttgatcaccg    60
<210>149
<211>60
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>149
gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat atcgtggcgc cagctctgcg    60
<210>150
<211>60
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>150
gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat gcaactggcg gccaccgagt    60
<210>151
<211>60
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>151
gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat cgcatagcaa ctggcggcca    60
<210>152
<211>60
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>152
gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat gttgtgggcg gccaccgagt    60
<210>153
<211>40
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>153
atggacatgc gcgtgcccgc ccagctgctg ggcctgctgc                          40
<210>154
<211>41
<212>DNA
<213>人造
<220>
<223>合成构建体:用作引物的寡核苷酸。
<400>154
tttacccgga gacagggaga ggctcttctg cgtgtagtgg t                        41
<210>155
<211>8533
<212>DNA
<213>人造
<220>
<223>合成构建体:质粒pTT3-D2E7重链
-Hh-C17-D2E7轻链的核苷酸序列。
<400>155
gcggccgctc gaggccggca aggccggatc ccccgacctc gacctctggc taataaagga    60
aatttatttt cattgcaata gtgtgttgga attttttgtg tctctcactc ggaaggacat    120
atgggagggc aaatcatttg gtcgagatcc ctcggagatc tctagctaga ggatcgatcc    180
ccgccccgga cgaactaaac ctgactacga catctctgcc ccttcttcgc ggggcagtgc    240
atgtaatccc ttcagttggt tggtacaact tgccaactgg gccctgttcc acatgtgaca    300
cgggggggga ccaaacacaa aggggttctc tgactgtagt tgacatcctt ataaatggat    360
gtgcacattt gccaacactg agtggctttc atcctggagc agactttgca gtctgtggac    420
tgcaacacaa cattgccttt atgtgtaact cttggctgaa gctcttacac caatgctggg    480
ggacatgtac ctcccagggg cccaggaaga ctacgggagg ctacaccaac gtcaatcaga    540
ggggcctgtg tagctaccga taagcggacc ctcaagaggg cattagcaat agtgtttata    600
aggccccctt gttaacccta aacgggtagc atatgcttcc cgggtagtag tatatactat    660
ccagactaac cctaattcaa tagcatatgt tacccaacgg gaagcatatg ctatcgaatt    720
agggttagta aaagggtcct aaggaacagc gatatctccc accccatgag ctgtcacggt    780
tttatttaca tggggtcagg attccacgag ggtagtgaac cattttagtc acaagggcag    840
tggctgaaga tcaaggagcg ggcagtgaac tctcctgaat cttcgcctgc ttcttcattc    900
tccttcgttt agctaataga ataactgctg agttgtgaac agtaaggtgt atgtgaggtg    960
ctcgaaaaca aggtttcagg tgacgccccc agaataaaat ttggacgggg ggttcagtgg    1020
tggcattgtg ctatgacacc aatataaccc tcacaaaccc cttgggcaat aaatactagt    1080
gtaggaatga aacattctga atatctttaa caatagaaat ccatggggtg gggacaagcc    1140
gtaaagactg gatgtccatc tcacacgaat ttatggctat gggcaacaca taatcctagt    1200
gcaatatgat actggggtta ttaagatgtg tcccaggcag ggaccaagac aggtgaacca    1260
tgttgttaca ctctatttgt aacaagggga aagagagtgg acgccgacag cagcggactc    1320
cactggttgt ctctaacacc cccgaaaatt aaacggggct ccacgccaat ggggcccata    1380
aacaaagaca agtggccact cttttttttg aaattgtgga gtgggggcac gcgtcagccc    1440
ccacacgccg ccctgcggtt ttggactgta aaataagggt gtaataactt ggctgattgt    1500
aaccccgcta accactgcgg tcaaaccact tgcccacaaa accactaatg gcaccccggg    1560
gaatacctgc ataagtaggt gggcgggcca agataggggc gcgattgctg cgatctggag    1620
gacaaattac acacacttgc gcctgagcgc caagcacagg gttgttggtc ctcatattca    1680
cgaggtcgct gagagcacgg tgggctaatg ttgccatggg tagcatatac tacccaaata    1740
tctggatagc atatgctatc ctaatctata tctgggtagc ataggctatc ctaatctata    1800
tctgggtagc atatgctatc ctaatctata tctgggtagt atatgctatc ctaatttata    1860
tctgggtagc ataggctatc ctaatctata tctgggtagc atatgctatc ctaatctata    1920
tctgggtagt atatgctatc ctaatctgta tccgggtagc atatgctatc ctaatagaga    1980
ttagggtagt atatgctatc ctaatttata tctgggtagc atatactacc caaatatctg    2040
gatagcatat gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg    2100
ggtagcatag gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg    2160
ggtagtatat gctatcctaa tttatatctg ggtagcatag gctatcctaa tctatatctg    2220
ggtagcatat gctatcctaa tctatatctg ggtagtatat gctatcctaa tctgtatccg    2280
ggtagcatat gctatcctca tgataagctg tcaaacatga gaattttctt gaagacgaaa    2340
gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac    2400
gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat    2460
acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg    2520
aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc    2580
attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga    2640
tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga    2700
gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg    2760
cgcggtatta tcccgtgttg acgccgggca agagcaactc ggtcgccgca tacactattc    2820
tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac    2880
agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact    2940
tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca    3000
tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg    3060
tgacaccacg atgcctgcag caatggcaac aacgttgcgc aaactattaa ctggcgaact    3120
acttactcta gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg    3180
accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg    3240
tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat    3300
cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc    3360
tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat    3420
actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt    3480
tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc    3540
cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt    3600
gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac    3660
tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt    3720
gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct    3780
gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga    3840
ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac    3900
acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg    3960
agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt    4020
cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc    4080
tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg    4140
gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc    4200
ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc    4260
ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag    4320
cgaggaagcg gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca    4380
ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat    4440
taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg    4500
tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga    4560
ttacgccaag ctctagctag aggtcgacca attctcatgt ttgacagctt atcatcgcag    4620
atccgggcaa cgttgttgcc attgctgcag gcgcagaact ggtaggtatg gaagatctat    4680
acattgaatc aatattggca attagccata ttagtcattg gttatatagc ataaatcaat    4740
attggctatt ggccattgca tacgttgtat ctatatcata atatgtacat ttatattggc    4800
tcatgtccaa tatgaccgcc atgttgacat tgattattga ctagttatta atagtaatca    4860
attacggggt cattagttca tagcccatat atggagttcc gcgttacata acttacggta    4920
aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat    4980
gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg    5040
taaactgccc acttggcagt acatcaagtg tatcatatgc caagtccgcc ccctattgac    5100
gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt acgggacttt    5160
cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg    5220
cagtacacca atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc    5280
attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt    5340
aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata    5400
agcagagctc gtttagtgaa ccgtcagatc ctcactctct tccgcatcgc tgtctgcgag    5460
ggccagctgt tgggctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg    5520
atcggaaacc cgtcggcctc cgaacggtac tccgccaccg agggacctga gcgagtccgc    5580
atcgaccgga tcggaaaacc tctcgagaaa ggcgtctaac cagtcacagt cgcaaggtag    5640
gctgagcacc gtggcgggcg gcagcgggtg gcggtcgggg ttgtttctgg cggaggtgct    5700
gctgatgatg taattaaagt aggcggtctt gagacggcgg atggtcgagg tgaggtgtgg    5760
caggcttgag atccagctgt tggggtgagt actccctctc aaaagcgggc attacttctg    5820
cgctaagatt gtcagtttcc aaaaacgagg aggatttgat attcacctgg cccgatctgg    5880
ccatacactt gagtgacaat gacatccact ttgcctttct ctccacaggt gtccactccc    5940
aggtccaagt ttgggcgcca ccatggagtt tgggctgagc tggctttttc ttgtcgcgat    6000
tttaaaaggt gtccagtgtg aggtgcagct ggtggagtct gggggaggct tggtacagcc    6060
cggcaggtcc ctgagactct cctgtgcggc ctctggattc acctttgatg attatgccat    6120
gcactgggtc cggcaagctc cagggaaggg cctggaatgg gtctcagcta tcacttggaa    6180
tagtggtcac atagactatg cggactctgt ggagggccga ttcaccatct ccagagacaa    6240
cgccaagaac tccctgtatc tgcaaatgaa cagtctgaga gctgaggata cggccgtata    6300
ttactgtgcg aaagtctcgt accttagcac cgcgtcctcc cttgactatt ggggccaagg    6360
taccctggtc accgtctcga gtgcgtcgac caagggccca tcggtcttcc ccctggcacc    6420
ctcctccaag agcacctctg ggggcacagc ggccctgggc tgcctggtca aggactactt    6480
ccccgaaccg gtgacggtgt cgtggaactc aggcgccctg accagcggcg tgcacacctt    6540
cccggctgtc ctacagtcct caggactcta ctccctcagc agcgtggtga ccgtgccctc    6600
cagcagcttg ggcacccaga cctacatctg caacgtgaat cacaagccca gcaacaccaa    6660
ggtggacaag aaagttgagc ccaaatcttg tgacaaaact cacacatgcc caccgtgccc    6720
agcacctgaa ctcctggggg gaccgtcagt cttcctcttc cccccaaaac ccaaggacac    6780
cctcatgatc tcccggaccc ctgaggtcac atgcgtggtg gtggacgtga gccacgaaga    6840
ccctgaggtc aagttcaact ggtacgtgga cggcgtggag gtgcataatg ccaagacaaa    6900
gccgcgggag gagcagtaca acagcacgta ccgtgtggtc agcgtcctca ccgtcctgca    6960
ccaggactgg ctgaatggca aggagtacaa gtgcaaggtc tccaacaaag ccctcccagc    7020
ccccatcgag aaaaccatct ccaaagccaa agggcagccc cgagaaccac aggtgtacac    7080
cctgccccca tcccgggatg agctgaccaa gaaccaggtc agcctgacct gcctggtcaa    7140
aggcttctat cccagcgaca tcgccgtgga gtgggagagc aatgggcagc cggagaacaa    7200
ctacaagacc acgcctcccg tgctggactc cgacggctcc ttcttcctct acagcaagct    7260
caccgtggac aagagcaggt ggcagcaggg gaacgtcttc tcatgctccg tgatgcatga    7320
ggctctgcac aaccactaca cgcagaagag cctctccctg tctccgggta aatgcttcac    7380
gccggagagc acagcgctgc tggagagtgg agtccggaag ccgctcggcg agctctctat    7440
cggagatcgt gttttgagca tgaccgccaa cggacaggcc gtctacagcg aagtgatcct    7500
cttcatggac cgcaacctcg agcagatgca aaactttgtg cagctgcaca cggacggtgg    7560
agcagtgctc acggtgacgc cggctcacct ggttagcgtt tggcagccgg agagccagaa    7620
gctcacgttt gtgtttgcgg atcgcatcga ggagaagaac caggtgctcg tacgggatgt    7680
ggagacgggc gagctgaggc cccagcgagt cgtcaaggtg ggcagtgtgc gcagtaaggg    7740
cgtggtcgcg ccgctgaccc gcgagggcac cattgtggtc aactcggtgg ccgccagttg    7800
ctatgcggtg atcaacagcc agtcgatgga catgcgcgtg cccgcccagc tgctgggcct    7860
gctgctgctg tggttccccg gctcgcgatg cgacatccag atgacccagt ctccatcctc    7920
cctgtctgca tctgtagggg acagagtcac catcacttgt cgggcaagtc agggcatcag    7980
aaattactta gcctggtatc agcaaaaacc agggaaagcc cctaagctcc tgatctatgc    8040
tgcatccact ttgcaatcag gggtcccatc tcggttcagt ggcagtggat ctgggacaga    8100
tttcactctc accatcagca gcctacagcc tgaagatgtt gcaacttatt actgtcaaag    8160
gtataaccgt gcaccgtata cttttggcca ggggaccaag gtggaaatca aacgtacggt    8220
ggctgcacca tctgtcttca tcttcccgcc atctgatgag cagttgaaat ctggaactgc    8280
ctctgttgtg tgcctgctga ataacttcta tcccagagag gccaaagtac agtggaaggt  8340
ggataacgcc ctccaatcgg gtaactccca ggagagtgtc acagagcagg acagcaagga  8400
cagcacctac agcctcagca gcaccctgac gctgagcaaa gcagactacg agaaacacaa  8460
agtctacgcc tgcgaagtca cccatcaggg cctgagctcg cccgtcacaa agagcttcaa  8520
caggggagag tgt                                                     8533
<210>156
<211>447
<212>DNA
<213>人造
<220>
<223>合成构建体:质粒pTT3-HC-C17-sc-LC的部分编码序列。
<400>156
ccgggtaaat gcttcacgcc ggagagcaca gcgctgctgg agagtggagt ccggaagccg  60
ctcggcgagc tctctatcgg agatcgtgtt ttgagcatga ccgccaacgg acaggccgtc  120
tacagcgaag tgatcctctt catggaccgc aacctcgagc agatgcaaaa ctttgtgcag  180
ctgcacacgg acggtggagc agtgctcacg gtgacgccgg ctcacctggt tagcgtttgg  240
cagccggaga gccagaagct cacgtttgtg tttgcggatc gcatcgagga gaagaaccag  300
gtgctcgtac gggatgtgga gacgggcgag ctgaggcccc agcgagtcgt caaggtgggc    360
agtgtgcgca gtaagggcgt ggtcgcgccg ctgacccgcg agggcaccat tgtggtcaac    420
tcggtggccg ccagttgcat ggacatg                                        447
<210>157
<211>447
<212>DNA
<213>人造
<220>
<223>合成构建体:质粒pTT3-HC-C17-hn-LC的部分编码序列。
<400>157
ccgggtaaat gcttcacgcc ggagagcaca gcgctgctgg agagtggagt ccggaagccg    60
ctcggcgagc tctctatcgg agatcgtgtt ttgagcatga ccgccaacgg acaggccgtc    120
tacagcgaag tgatcctctt catggaccgc aacctcgagc agatgcaaaa ctttgtgcag    180
ctgcacacgg acggtggagc agtgctcacg gtgacgccgg ctcacctggt tagcgtttgg    240
cagccggaga gccagaagct cacgtttgtg tttgcggatc gcatcgagga gaagaaccag    300
gtgctcgtac gggatgtgga gacgggcgag ctgaggcccc agcgagtcgt caaggtgggc    360
agtgtgcgca gtaagggcgt ggtcgcgccg ctgacccgcg agggcaccat tgtggtcaac    420
tcggtggccg cccacaacat ggacatg                                        447
<210>158
<211>660
<212>DNA
<213>人造
<220>
<223>合成构建体:pTT3-HC-C25-Hint-LC的部分编码序列。
<400>158
ccgggtaaat gcttcacgcc ggagagcaca gcgctgctgg agagtggagt ccggaagccg    60
ctcggcgagc tctctatcgg agatcgtgtt ttgagcatga ccgccaacgg acaggccgtc    120
tacagcgaag tgatcctctt catggaccgc aacctcgagc agatgcaaaa ctttgtgcag    180
ctgcacacgg acggtggagc agtgctcacg gtgacgccgg ctcacctggt tagcgtttgg    240
cagccggaga gccagaagct cacgtttgtg tttgcggatc gcatcgagga gaagaaccag    300
gtgctcgtac gggatgtgga gacgggcgag ctgaggcccc agcgagtcgt caaggtgggc    360
agtgtgcgca gtaagggcgt ggtcgcgccg ctgacccgcg agggcaccat tgtggtcaac    420
tcggtggccg ccagttgcta tgcggtgatc aacagccagt cgctggccca ctggggactg    480
gctcccatgc gcctgctgtc cacgctggag gcgtggctgc ccgccaagga gcagttgcac    540
agttcgccga aggtggtgag ctcggcgcag cagcagaatg gcatccattg gtatgccaat    600
gcgctctaca aggtcaagga ctacgttctg ccgcagagct ggcgccacga tatggacatg    660

包括SORF构建体的多基因表达和使用多蛋白、前体蛋白和蛋白酶解的方法.pdf_第1页
第1页 / 共544页
包括SORF构建体的多基因表达和使用多蛋白、前体蛋白和蛋白酶解的方法.pdf_第2页
第2页 / 共544页
包括SORF构建体的多基因表达和使用多蛋白、前体蛋白和蛋白酶解的方法.pdf_第3页
第3页 / 共544页
点击查看更多>>
资源描述

《包括SORF构建体的多基因表达和使用多蛋白、前体蛋白和蛋白酶解的方法.pdf》由会员分享,可在线阅读,更多相关《包括SORF构建体的多基因表达和使用多蛋白、前体蛋白和蛋白酶解的方法.pdf(544页珍藏版)》请在专利查询网上搜索。

公开的是有用的构建体和方法,用于蛋白质的表达,使用重组宿主细胞内加工的初级翻译产物。描述了包括单个开放阅读框(sORF)的构建体,用于蛋白质的表达,包括多个多肽的表达。初级翻译产物(前体蛋白或多蛋白)含有多肽,如蛋白内含子或hedgehog家族自体加工结构域,或其变体,框内插入多个目标蛋白亚基之间。初级产物还可以含有裂解序列,如其他蛋白酶解裂解或蛋白酶识别位点,或含有信号肽酶识别序列的信号肽,隔开。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 化学;冶金 > 生物化学;啤酒;烈性酒;果汁酒;醋;微生物学;酶学;突变或遗传工程


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1