CN200880020335.2
2008.06.02
CN101679958A
2010.03.24
驳回
无权
发明专利申请公布后的驳回IPC(主分类):C12N 9/16申请公布日:20100324|||实质审查的生效IPC(主分类):C12N 9/16申请日:20080602|||公开
C12N9/16; C12N15/62; C12N15/73; C12P21/02
C12N9/16
丹尼斯科美国公司
鲍 锴; 费尔南多·瓦耳
美国加利福尼亚州
2007.6.18 US 60/936,183; 2007.6.18 US 60/936,186
北京市中咨律师事务所
黄革生;林柏楠
本发明提供了编码TAT融合蛋白的多核苷酸,以及用于在宿主细胞中生产目标蛋白质的方法。特别地,本发明涉及用于在宿主细胞、例如链霉菌属宿主细胞中表达有机磷-降解酶、例如有机磷水解酶(OPH)的多核苷酸、载体、多肽和方法。
1、 分离的多核苷酸,其包含可操作地连接的第一核酸序列和第二核酸序列,所述第一核酸序列编码TAT信号肽,所述第二核酸序列编码分类为EC 3.1.8蛋白质的磷酸三酯水解酶。2、 权利要求1的分离的多核苷酸,其中所述TAT信号肽包含选自SEQID NO:1-5的氨基酸序列。3、 权利要求1的分离的多核苷酸,其中所述水解酶是有机磷水解酶(OPH)。4、 权利要求1的分离的多核苷酸,其中所述水解酶是SEQ ID NO:18的有机磷水解酶(OPH),或其变体。5、 权利要求1的分离的多核苷酸,其中编码所述水解酶的所述第二核酸经过优化,用于在链霉菌属宿主细胞中表达所述水解酶。6、 权利要求1的分离的多核苷酸,其中所述分离的多核苷酸可操作地连接SEQ ID NO:23的A4启动子。7、 包含权利要求1的分离的多核苷酸的表达载体。8、 包含权利要求7的表达载体的分离的宿主细胞。9、 权利要求8的分离的宿主细胞,其中所述宿主细胞是链霉菌属宿主细胞。10、 分离的融合多肽,其包含与SEQ ID NO:18的有机磷水解酶或其变体连接的TAT2或TAT3信号肽。11、 权利要求10的分离的融合多肽,其中所述TAT信号肽选自SEQID NO:1或5。12、 生产有机磷降解酶的方法,包括:(a)在宿主细胞中表达权利要求1的多核苷酸;和(b)生产所述酶。13、 权利要求12的方法,其中回收所述宿主细胞产生的所述酶。14、 权利要求12的方法,其中所述宿主细胞是链霉菌属宿主细胞。15、 权利要求12的方法,其中所述酶是有机磷水解酶。
用于在原核生物中生产蛋白质的TAT信号肽 本申请要求于2007年6月18日提交的美国临时申请60/936,183,和于2007年6月18日提交的美国临时申请60/936,186的优先权。 政府支持 部分本工作得到了美国军方Edgewood化学生物学中心(ECBC)合同号BAA ECBC-04的资助。因此,美国政府可以要求本发明的一定权利。 1.发明领域 本发明提供了编码TAT融合蛋白的多核苷酸,以及用于在微生物中生产目标蛋白质的方法。特别地,本发明涉及用于在宿主细胞,例如链霉菌属的宿主细胞中表达有机磷-降解酶,例如有机磷水解酶(OPH)的多核苷酸、载体、多肽和方法。 2.发明背景 已经认识到在原核生物中存在两种用于蛋白质跨细胞质膜转运的途径。在多数细菌中,一般分泌(Sec)途径是最详细表征的蛋白质输出途径。通过Sec途径输出的蛋白质以非折叠的状态通过膜-嵌入的易位子(translocon)跨膜,可切割的N-末端信号肽靶向所述易位子。 第二种一般的输出途径是双-精氨酸转运(Tat)途径。不同于Sec系统,Tat系统涉及预折叠蛋白质底物的转运。靶向Tat途径的蛋白质具有N-末端信号肽,其包括在Tat信号肽的N-区域中保守的双-精氨酸基序。 由于其分泌预折叠蛋白质底物的能力,Tat途径代表了用于产生分泌蛋白质的重要机制,可以利用所述途径用于大规模生产蛋白质,所述蛋白质用于对在多种农业杀虫剂中和作为化学战剂(例如,沙林、索曼和VX[O-乙基-S-(2-二异丙基氨乙基)甲基硫代膦酸酯])使用的有机磷化合物解毒。 3.发明概述 本文教导的内容至少部分基于这样的发现,即,可以利用细菌宿主细胞中的Tat途径生产一些蛋白质。因此,本发明提供编码TAT融合蛋白的多核苷酸,和用于在宿主细胞中生产目标蛋白质的方法。特别地,本发明涉及用于在宿主细胞,例如链霉菌属的宿主细胞中表达有机磷-降解酶,例如有机磷水解酶(OPH)的多核苷酸、载体、多肽和方法。 在一个实施方案中,本发明提供了分离的多核苷酸,其包含可操作地连接的第一核酸序列和第二核酸序列,所述第一核酸序列编码TAT信号肽,所述第二核酸序列编码分类为EC 3.1.8蛋白质的磷酸三酯水解酶。在另一个实施方案中,本发明的分离的多核苷酸包括可操作地连接的第一核酸序列和第二核酸序列,所述第一核酸序列编码具有选自SEQ ID NO:1-5的氨基酸序列的TAT信号肽,所述第二核酸序列编码分类为EC 3.1.8蛋白质的磷酸三酯水解酶。在另一个实施方案中,本发明的分离的多核苷酸包括可操作地连接的第一核酸序列和第二核酸序列,所述第一核酸序列编码TAT信号肽,所述第二核酸序列编码有机磷水解酶(OPH)。在另一个实施方案中,有机磷水解酶是SEQ ID NO:18的OPH,或其变体。在另一个实施方案中,本发明提供了分离的多核苷酸,包括可操作地连接的第一核酸序列和第二核酸序列,所述第一核酸序列编码TAT信号肽,所述第二核酸序列编码分类为EC 3.1.8蛋白质的磷酸三酯水解酶,其中分离的多核苷酸的第二核酸是密码子优化的,用于在链霉菌属宿主细胞中表达磷酸三酯水解酶。在另一个实施方案中,本发明提供了分离的多核苷酸,包括可操作地连接的第一核酸序列和第二核酸序列,所述第一核酸序列编码TAT信号肽,所述第二核酸序列编码分类为EC 3.1.8蛋白质的磷酸三酯水解酶,其中该分离的多核苷酸还可操作地连接SEQ ID NO:23的A4启动子。 在另一个实施方案中,本发明提供了包含分离的多核苷酸的表达载体,所述分离的多核苷酸包括可操作地连接的第一核酸序列和第二核酸序列,所述第一核酸序列编码TAT信号肽,所述第二核酸序列编码分类为EC3.1.8蛋白质的磷酸三酯水解酶。在一些实施方案中,表达载体包括编码SEQ ID NO:1-5任一项的TAT信号肽的第一核酸序列,和编码分类为EC3.1.8蛋白质的磷酸三酯水解酶的第二核酸序列。在一些实施方案中,表达载体包括分离的多核苷酸,所述分离的多核苷酸包括可操作地连接的第一核酸序列和第二核酸序列,所述第一核酸序列编码TAT信号肽,所述第二核酸序列编码有机磷水解酶。在一些实施方案中,有机磷水解酶是SEQ IDNO:18的OPH,或其变体。在一些实施方案中,分离的多核苷酸包括可操作地连接的第一核酸序列和第二核酸序列,所述第一核酸序列编码TAT信号肽,所述第二核酸序列编码磷酸三酯水解酶,所述分离的多核苷酸还可操作地连接SEQ ID NO:23的A4启动子。在其它实施方案中,编码磷酸三酯水解酶的核酸序列是密码子优化的,用于在链霉菌属宿主细胞中表达。在一些实施方案中,链霉菌属宿主细胞是浅青紫链霉菌(Streptomyceslividans)宿主细胞。 在另一个实施方案中,本发明提供了包含表达载体的分离的宿主细胞,所述表达载体包含分离的多核苷酸,所述分离的多核苷酸包括可操作地连接的第一核酸序列和第二核酸序列,所述第一核酸序列编码TAT信号肽,所述第二核酸序列编码分类为EC 3.1.8蛋白质的磷酸三酯水解酶。在一些实施方案中,宿主细胞包含表达载体,所述载体包括编码SEQ ID NO:1-5的任一项的TAT信号肽的第一核酸序列,和编码磷酸三酯水解酶的第二核酸序列。在另一个实施方案中,宿主细胞包含表达载体,所述表达载体包括分离的多核苷酸,所述分离的多核苷酸包括可操作地连接的第一核酸序列和第二核酸序列,所述第一核酸序列编码TAT信号肽,所述第二核酸序列编码有机磷水解酶。在一些实施方案中,有机磷水解酶是SEQ ID NO:18的OPH,或其变体。在另一个实施方案中,宿主细胞包含的表达载体包括分离的多核苷酸,所述分离的多核苷酸包括可操作地连接的第一核酸序列和第二核酸序列,所述第一核酸序列编码TAT信号肽,所述第二核酸序列编码磷酸三酯水解酶,所述分离的多核苷酸还可操作地连接SEQ ID NO:23的A4启动子。在一些实施方案中,编码磷酸三酯水解酶的核酸序列是密码子优化的,用于在链霉菌属宿主细胞中表达。在一些实施方案中,本发明的宿主细胞是链霉菌属宿主细胞,例如浅青紫链霉菌(Streptomyceslividans)宿主细胞。 在另一个实施方案中,本发明提供了分离的融合多肽,包含与SEQ IDNO:18的有机磷水解酶连接的TAT2或TAT3信号肽。在另一个实施方案中,TAT信号肽包含在选自SEQ ID NO:1或5的分离的融合多肽中。 在另一个实施方案中,本发明提供了用于生产有机磷降解酶的方法,包括:表达分离的多核苷酸,所述分离的多核苷酸包括可操作地连接的第一核酸序列和第二核酸序列,所述第一核酸序列编码TAT信号肽,所述第二核酸序列编码分类为EC 3.1.8蛋白质的磷酸三酯水解酶;和生产所述有机磷降解酶。在一个实施方案中,通过本发明的方法生产的有机磷降解酶是有机磷水解酶。在一些实施方案中,有机磷水解酶是SEQ ID NO:18的OPH,或其变体。在另一个实施方案中,本发明的方法还包括回收通过宿主细胞生产的酶。在另一个实施方案中,本发明方法的宿主细胞是链霉菌属宿主细胞。 4.附图的简要说明 本领域技术人员可以理解,附图仅用于示例性目的。附图并非意在以任何方式限制本教导的范围。 图1显示了pKB105载体,其含有黑曲霉A4启动子、浅青紫链霉菌纤维素酶(CelA)截短的信号序列、编码来自放线菌属的纤维素酶11AG8基因的多核苷酸,和纤维素酶11AG3终止子序列。 图2显示了从图1的pKB105载体衍生的pKB229载体,其中,用TAT1信号序列取代了CelA信号肽,用密码子优化的OPH基因取代了纤维素酶基因。 图3显示了从图1的pKB105载体衍生的pKB231载体,其中,用TAT2信号序列取代了CelA信号肽,用密码子优化的OPH基因取代了纤维素酶基因。 图4显示了从图1的pKB105载体衍生的pKB233载体,其中,用TAT3信号序列取代了CelA信号肽,用密码子优化的OPH基因取代了纤维素酶基因。 图5显示了从pKB233载体衍生的pKB234载体,其通过去除了SphI和EcoRI限制性酶切位点之间的大肠杆菌DNA序列得到。 图6显示了在链霉菌中生产并在该宿主细胞中表达的OPH的SDS-PAGE分析,所述OPH与TAT1、TAT2和TAT3信号肽融合。 图7显示了添加Zn2+和Co2+对作为TAT3融合蛋白在链霉菌中表达的OPH的生产和储存稳定性的影响。 图8显示了通过胰蛋白酶凝胶内消化鉴定,和链霉菌细胞生产的预期的OPH的MALDI肽质量图谱。 图9显示了由链霉素宿主细胞生产的OPH的对氧磷酶活性。 5.发明详述 本发明提供了编码TAT融合蛋白的多核苷酸,和用于在宿主细胞中生产目标蛋白质的方法。特别地,本发明涉及用于在宿主细胞中,例如在链霉菌属的宿主细胞中表达有机磷水解酶(OPH)的多核苷酸、载体、多肽和方法。 通过参照利用下列定义和实例,将详细的描述本文教导的内容。所有的专利和出版物,包括在此类专利和出版物中公开的所有序列,都明确的并入到本文中作为参考。 除非本文中另外的定义,本文中使用的所有技术和科学术语都具有本发明所属领域的普通技术人员常规理解的相同含义。例如,Singleton andSainsbury,Dictionary of Microbiology and Molecular Biology,第2版,John Wiley和Sons,NY(1994);以及Hale和Markham,The Harper CollinsDictionary of Biology,Harper Perennial,NY(1991)为本领域技术人员提供了本发明使用的许多术语的常规词典。虽然在本发明的实践中可以使用与本文描述的相似或等同的任何方法和材料,但是,优选的方法和材料在本文中描述。因此,通过整体参考说明书可以更全面的描述下文定义的术语。此外,如本文中使用的,除非上下文明确指出,否则单数形式“一”、“一个”和“这个”包括了复数指代。数值范围包含了定义范围的数字。除非另外指出,核酸分别按照5’至3’方向由左至右书写;氨基酸序列按照氨基至羧基方向由左至右书写。可以理解,本发明不限于所描述的具体方法学、规程和试剂,根据本领域技术人员使用的环境,其可以相应变化。 可以预期,本说明书全文给出的每个最大数值界限都包括了各较低的数值界限,如同此类较小的数值界限明确的记载在本文中一样。本说明书全文给出的每个最小数值界限将包括了每个较高的数值界限,如同此类较高的数值界限明确的记载在本文中一样。本说明书全文给出的所有数值范围都包括了落入此较宽数值范围内各较窄的数值范围,如同此类较窄的数值范围明确的记载在本文中一样。 本文提供的标题不是各方面或实施方案的限制,可以通过整体参考说明书得出所述各方面或实施方案。因此,将通过整体参考说明书更全面的定义下文的术语。 定义 术语“有机磷降解酶”在本文中指催化有机磷中的磷酯键水解的酶。 术语“磷酸三酯水解酶”或“磷酸三酯酶”在本文中指分类为EC3.1.8的酶,其作用于有机磷化合物(例如对氧磷),包括膦酸和次膦酸的酯。磷酸三酯水解酶包括芳基二烷基磷酸酶(EC3.1.8.1),也称为OPH,和二异丙基-氟磷酸酶(EC3.1.8.2),也称为DFP酶。 本文中使用的术语“多肽”指由通过肽键连接的氨基酸残基单链组成的化合物。本文中使用的术语“蛋白质”与术语“多肽”可以是同义词,或者还可以指两种或多种多肽的复合物。在本文中使用氨基酸残基的常规三字母或单字母代码,其中丙氨酸(A);精氨酸(R);天冬酰胺(N);天冬氨酸(D);半胱氨酸(C);谷氨酸(E);谷氨酰胺(Q);甘氨酸(G);组氨酸(H);异亮氨酸(I);亮氨酸(L);赖氨酸(K);甲硫氨酸(M);苯丙氨酸(F);脯氨酸(P);丝氨酸(S);苏氨酸(T);色氨酸(W);酪氨酸(Y)和缬氨酸(V)。 如本文中使用的,术语“融合多肽”或“Tat融合多肽”指直接连接,或通过接头连接目标蛋白质的Tat信号肽。 如本文中使用的,术语“信号肽”指待分泌的蛋白质氨基末端的延伸。几乎所有的分泌蛋白质都使用氨基端蛋白质延伸,所述延伸在靶向前体蛋白,和前体蛋白跨膜转运中发挥关键作用,且所述延伸通常在膜转运的过程中或之后,立刻通过信号肽酶蛋白水解去除。 “Tat信号肽”指N-端延伸的序列,其包括两个连续的精氨酸残基,在预折叠构象的蛋白质的分泌中发挥作用。“Tat信号肽”可以可互换的称为“Tat肽”或“Tat多肽”。 如本文中使用的,“目标蛋白质”或“目标多肽”指通过宿主细胞来表达和分泌的蛋白质。目标蛋白质可以是目前认为可以在原核生物中表达的任何蛋白质。目标蛋白质可以是宿主同源的或异源的。在同源的目标蛋白质的情况下,过表达是超过所述宿主中的正常水平的表达。在异源的目标蛋白质的情况下,任何表达都是过表达。 如本文中使用的,术语“异源蛋白”指宿主细胞中不天然发生的蛋白质或多肽。异源蛋白质的实例包括但不限于酶,例如水解酶,包括酯酶、蛋白酶、糖基化酶;异构酶,例如消旋酶、差向异构酶、互变异构酶或变位酶;裂合酶;连接酶;转移酶,例如激酶、氨基移转酶和磷酸转移酶;或氧化还原酶,例如氧化酶和脱氢酶。异源基因可以编码治疗上重要的蛋白质或肽,例如生长因子、细胞因子、配体、受体和抑制剂,以及疫苗和抗体。基因可以编码经济上重要的工业蛋白质或肽,例如酯酶、蛋白酶、糖酶例如淀粉酶和葡糖淀粉酶,纤维素酶、氧化酶和脂肪酶。目标基因可以是天然发生的基因、突变基因或合成的基因。 术语“同源蛋白质”指在宿主细胞中天然的或天然发生的蛋白质或多肽。本发明包括这样的同源蛋白,其与天然发生的同源蛋白相比,是例如包含插入、缺失或中断的变体。 术语“核酸”与“多核苷酸”是可互换的使用的,涵盖了RNA、DNA和cDNA分子。如本文中使用的,该术语指任何长度的核苷酸的聚合形式,不论是核糖核苷酸或脱氧核糖核苷酸。该术语仅指分子的一级结构,从而包括双链或单链的DNA和RNA。还包括已知的修饰类型,包括但不限于本领域已知的标记,甲基化、“帽”、用类似物对一个或多个天然发生的核苷酸的取代、核苷酸间修饰例如具有无电荷的连接(如,甲基膦酸酯、磷酸三酯、磷酰胺、氨基甲酸酯等)和带电荷的连接(如,硫代磷酸酯、二硫代磷酸酯等)的那些,具有侧面部分的那些,例如蛋白质(包括例如,核酸酶、毒素、抗体、信号肽、聚-L-赖氨酸等),具有嵌入剂(例如,吖啶、补骨脂内酯等)的那些,含有螯合剂的(例如,金属、放射性金属、硼、氧化金属等)的那些,含有烷化剂的那些,具有修饰的连接的那些(例如,α异头核酸等),以及多核苷酸的未修饰形式。通常,可以从基因组片段和短的寡核苷酸接头,或者从一系列寡核苷酸,或者从单个的核苷酸装配本发明提供的核酸片段,来提供能够以重组转录单位表达的合成核酸,所述单位包括源自微生物、病毒操纵子或真核基因的调控元件。因为遗传密码是简并的,可以使用一个以上的密码子编码特定的氨基酸,因此本发明涵盖了编码特定氨基酸序列的所有多核苷酸。 与另一种序列具有一定百分比(例如,65%、70%、75%、80%、85%、90%、95%或99%)序列同一性的多核苷酸或多肽意指,比对时,比较的两条序列之间相同的碱基或氨基酸残基的百分比。可以使用本领域已知的任何合适软件程序确定比对和同源性或同一性的百分比,例如,在CurrentProtocols in Molecular Biology(F.M.Ausubel等人(编著)1987,增刊30,7.7.18节)中描述的。在一些实施方案中,程序包括GCG Pileup程序,FASTA(Pearson等人,(1988)Proc.Natl,Acad.Sci USA 85:24442448),和BLAST(BLAST Manual,Altschul等人,Natl Cent.Biotechnol.Inf.,NatlLib.Med.(NCIB NLM NIH),Bethesda,Md.,和Altschul等人,(1997)NAR25:3389 3402)。其它示例性比对程序是ALIGN Plus(Scientific andEducational Software,PA),优选的使用默认参数,和可从SequenceSoftware Package 6.0版获得的TFASTA Data Searching Program(Genetics Computer Group,University of Wisconsin,Madison,Wis.)。本领域技术人员可以认识到,本发明涵盖的序列包括在严格杂交条件下,与本发明的多核苷酸杂交的序列。 “异源”核酸构建体或序列,在本文中也称为“嵌合基因”,具有一部分序列,其对于表达其的细胞不是天然的。对于控制序列,异源指控制序列(例如,启动子或增强子)天然上不调控某基因的表达,而其当前调控该相同基因的表达。通常,异源核酸序列对于其所存在的细胞或基因组部分不是内源性的,并通过感染、转染、显微注射、电穿孔等加入到细胞中。“异源”核酸构建体可以包含控制序列/DNA编码序列组合,其与天然细胞中发现的控制序列/DNA编码序列组合相同或不同。控制序列,例如转录调控序列,通常可操作地连接异源蛋白质编码序列,或者在选择性标记嵌合基因中,连接选择性标记基因,所述基因编码赋予转化细胞抗生素抗性的蛋白质。本发明的典型的嵌合基因或异源核酸构建体包括转录调控区、信号肽编码序列、蛋白质编码序列和终止子序列。转录调控区可以是组成型的或诱导型的。 如本文中使用的,术语“载体”指设计为向一种或多种细胞类型引入核酸的多核苷酸序列。载体包括克隆载体、表达载体、穿梭载体、质粒、表达盒等。 如本文中使用的,术语“表达载体”指具有在外源细胞中整合和表达异源DNA片段的能力的载体。多种原核和真核表达载体是可商购的。 如本文中使用的,术语“核酸构建体”和“表达载体”是可互换的使用的,指用于向宿主细胞或生物体中引入序列的核酸。通过PCR或本领域已知的任何其它合适的技术,可以在体外产生核酸。可以将核酸构建体或重组表达盒整合到质粒、染色体、线粒体核酸、质体核酸、病毒或核酸片段中。典型的,除其它序列外,表达载体或核酸构建体的重组表达盒部分包括,将被转录的核酸序列和启动子。在一些实施方案中,表达载体具有在宿主细胞中整合和表达异源核酸片段的能力。多种原核和真核表达载体是可商购的。选择合适的表达载体是在本领域技术人员的知识范围内的。 如本文中使用的,术语“质粒”指用作克隆载体的环状双链DNA构建体,其在多种细菌和一些真核生物中形成染色体外自我复制的遗传元件。 如本文中使用的,术语“启动子”指发挥指导基因转录的功能的核酸序列。启动子通常对于表达靶基因的宿主细胞是合适的。对于表达给定的基因,启动子和其它转录和翻译调控核酸序列(也称为“控制序列”)是必需的。通常,转录和翻译调控序列包括但不限于启动子序列、核糖体结合位点、转录起始和终止序列、翻译起始和终止序列,以及增强子或激活子序列。 当核酸与另一种核酸序列置于功能性关系中时,核酸是“可操作地连接的”。例如,如果表达为参与多肽分泌的前体蛋白质,则编码分泌前导序列的核酸与编码多肽的核酸是可操作地连接的;如果影响序列的转录,则启动子或增强子与编码序列是可操作地连接的;或者如果其放置有利于翻译,则核糖体结合位点与编码序列是可操作地连接的。通常,“可操作地连接”意指连接的核酸序列是连续的,在分泌前导序列的情况下,是连续且处于阅读相中。然而,增强子和启动子不必须是连续的。在方便的限制酶位点连接可以实现连接。如果不存在此类位点,根据常规实践使用合成的寡核苷酸衔接头或接头。 第一多肽与第二多肽“连接”通常意指连接的多肽序列是连续的,并形成了融合蛋白。 如本文中使用的,术语“基因”指在生产多肽链中涉及的多核苷酸(例如,DNA片段),其可以包括或不包括在编码区前后的区域,例如,5’非翻译(5’UTR)或“前导”序列和3’UTR或“拖尾”序列,以及位于单个编码区段(外显子)之间的间插序列(内含子)。 当术语“重组”的使用涉及细胞、核酸、蛋白质或载体时,表示细胞、核酸、蛋白质或载体已经通过引入异源核酸或蛋白质,或通过改变天然的核酸或蛋白质进行了修饰,或者源自上述修饰的细胞的细胞,或者在非天然的或遗传修饰的环境中表达的蛋白质,例如在用于原核或真核系统的表达载体中。因此,例如,重组细胞表达在天然(非重组)形式的细胞中未发现的核酸或多肽,或者以异常表达、低表达、过表达或完全不表达的方式表达天然的基因。 如本文中使用的,术语“转化的”、“稳定转化的”和“转基因的”针对细胞使用时意指,细胞具有非天然的(例如,异源的)核酸序列,该序列整合在其基因组中,或作为附加体质粒维持多代。 如本文中使用的,术语“表达”指基于基因的核酸序列产生多肽的过程。该过程包括转录和翻译。 如本文中使用的,术语“可操作地连接”意指转录和翻译调控核酸相对于编码序列以启动转录的方式放置。通常,这意指启动子和转录初始或起始序列放置在编码区的5’。转录和翻译调控核酸将通常对用于表达蛋白质的宿主细胞是合适的。用于多种宿主细胞的多种类型的适合的表达载体,和适合的调控序列是本领域已知的。 关于希望的蛋白质,例如OPH,术语“生产”和“分泌”涵盖了在表达后的过程,包括以下加工步骤:去除信号肽,其已知在蛋白质分泌过程中发生,和希望的蛋白质转运到宿主细胞外侧。 关于OPH,术语“加工”或“加工的”指全长蛋白质如OPH经历成为活性的成熟酶的成熟过程。 如本文中使用的,术语“在转录控制下”表示多核苷酸序列(通常是DNA序列)的转录依赖于它可操作连接的元件,所述元件对转录起始有贡献或促进转录。 如本文中使用的,术语“在翻译控制下”表示在形成mRNA后发生的调控过程。 如本文中使用的,术语“质粒”指用作克隆载体的环状双链DNA构建体,其在一些真核或原核生物中形成染色体外自我复制的遗传元件,或整合到宿主染色体中。 在向细胞插入核酸序列的情况下,术语“引入”意指“转染”或“转化”或“转导”,并且包括关于核酸序列向真核或原核细胞中掺入,其中核酸序列可以整合到细胞基因组中(例如,染色体、质粒、质体或线粒体DNA),转化成自主复制子,或瞬时表达(例如,转染的mRNA)。 如本文中使用的,术语“回收的”、“分离的”和“分隔的”指从与其天然相关的至少一种组分中,去除化合物、蛋白质、细胞、核酸或氨基酸。 如本文中使用的,术语“活性”或“生物学活性”指与特定蛋白质相关的活性,例如酶活性。生物学活性指本领域技术人员通常归因于蛋白质的任何活性。 如本文中使用的,术语“比活”意指酶单位,所述酶单位定义为在特定条件下,每单位时间通过酶制品转化为产物的底物摩尔数。比活通常表示为单位(U)/mg蛋白质。 术语“源自”涵盖了术语“起源自”、“得到”、“得自”和“分离自”。 术语“宿主细胞”或“宿主菌株”意指含有载体,并支持表达构建体复制和/或转录或转录和翻译(表达)的细胞。在一些实施方案中,宿主细胞或菌株是原核的,例如细菌细胞,包括但不限于链霉菌属细胞。 术语“变体”指与参考核酸或蛋白质,例如天然存在的或野生型的核酸或蛋白质相比,核酸或蛋白质的区域包含一个或多个不同的、额外或缺少的核苷酸或氨基酸。预期变体蛋白质保留了参考蛋白质的功能,即变体蛋白质是参考蛋白质的功能活性变体。在一些实施方案中,变体蛋白质实施所述功能的能力与参考蛋白质的相同或更大。 如本文中使用的,术语“链霉菌属”包括在本领域技术人员已知的“链霉菌属”中的所有物种,包括但不限于不产色链球菌(S.achromogenes)、略白链球菌(S.albicans)、白浅灰链霉菌(S.albogriseolus)、产二素链霉菌(S.ambofaciens)、除虫链霉菌(S.avermitilis)、嗜碳链霉菌(S.carbophilus)、带小棒链霉菌(S.clavuligerus)、天蓝色链霉菌(S.coelicolor)、苦胆链霉菌(S.felleus)、S.ferralitis、丝状链霉菌(S.filamentosus)、灰色链霉菌(Streptomyces griseus)、淡蜡黄链霉菌(S.helvaticus)、吸水链霉菌(S.hygroscopicus)、溶表面链霉菌(S.lysosuperficus)、浅青紫链霉菌(S.lividans)、诺尔斯氏链霉菌(S.noursei)、S.plicatosporus、锈赤链霉菌(S.rubiginosus)、疮痂病链霉菌(S.scabies)、索马里链霉菌(S.somaliensis)、热紫链霉菌(S.thermoviolaceus)和紫红链霉菌(S.violaceoruber)。 本文教导的内容是基于这样的发现,即,可以利用Tat途径在细菌宿主细胞中生产一些蛋白质。因此,本发明提供了在宿主细胞中生产目标蛋白质的方法。本文教导的内容还提供了编码目标蛋白质和Tat信号肽序列的多核苷酸,以及该多核苷酸编码的融合多肽。特别地,本发明涉及用于在宿主细胞中表达有机磷-降解酶的多核苷酸、载体、多肽和方法,所述酶例如有机磷水解酶(OPH),所述宿主细胞例如链霉菌属的宿主细胞。 在一个方面,本文教导的内容提供了多核苷酸,其包含第一核酸序列和第二核酸序列。第一核酸序列编码TAT信号肽,第二核酸序列编码目标蛋白质。通常,第一核酸序列与第二核酸序列是可操作地连接的。 第一核酸序列编码的Tat信号肽可以是在通过Tat途径分泌多肽中涉及的、目前已知的或以后发现的任何Tat信号肽。典型的,Tat信号肽包括含有双精氨酸(即,“RR”)基序的氨基酸序列,其中RR代表两个相邻的精氨酸氨基酸。在一些实施方案中,Tat信号肽序列包含的RR基序位于多肽的N-末端前5、10、15、20、25、30、35或40个氨基酸中。在其它实施方案中,Tat信号肽序列包含的RR基序不位于多肽的N-末端前5、10、15、20、25、30、35或40个氨基酸中。 在一些实施方案中,Tat信号肽是TAT2或TAT3信号肽,例如包含SEQ ID NO:1-4中任一项的氨基酸序列的信号肽,或TAT3(SEQ ID NO:5)信号肽,目标蛋白质是酯酶,例如磷酸三酯酶。在一些实施方案中,Tat信号肽是TAT2或TAT3信号肽,或蛋白质SCO2286(SEQ ID NO:6)、SCO3790long(SEQ ID NO:7)、SCO6580long(SEQ ID NO:8)、SCO1590(SEQ ID NO:9)、SCO1824(SEQ ID NO:10)、SCO6580short(SEQ IDNO:11)、SCO3790short(SEQ ID NO:12)、SCO736(SEQ ID NO:13)、SCO2068(SEQ ID NO:14)、SCO3471(SEQ ID NO:15)或SCO7677(SEQ ID NO:16)的信号肽,目标蛋白质是OPH或其生物学活性的变体或片段(参见例如,PCT申请号GB/004816)。在一些实施方案中,Tat信号肽包括与表1提供的SEQ ID NO:1至SEQ ID NO:16中任一项的氨基酸序列基本相同的氨基酸序列,例如,80%、85%、90%、95%、97%、98%、99%或100%同一性。在一些实施方案中,Tat信号肽是TAT2或TAT3信号肽。在一些实施方案中,Tat信号肽是TAT3信号肽。在一些实施方案中,Tat信号肽是SEQ ID NO:5的TAT3信号肽,目标蛋白质是磷酸三酯酶,例如来自黄杆菌属菌株ATCC27551(Mulbry et Karns J上文)、缺陷短波单胞菌(Pseudomonas diminuta)OPH(Munnecke上文),或放射形土壤杆菌(Agrobacterium radiobacter)(Home等人,见上文)的OPH,或其生物学活性变体或片段。 第二核酸序列编码目标蛋白质或其片段。目标蛋白质可以是可以通过Tat途径被宿主细胞分泌的目前已知的,或以后发现的任何蛋白质或多肽。此类蛋白质的实例包括但不限于水解酶,包括酯酶、蛋白酶、糖基化酶;异构酶,例如消旋酶、差向异构酶、互变异构酶或变位酶;裂合酶;连接酶;转移酶,例如激酶、氨基移转酶和磷酸转移酶;或氧化还原酶,例如氧化酶和脱氢酶。目的蛋白质也可以是治疗上重要的蛋白质或多肽,例如生长因子、细胞因子、配体、受体或抑制剂,以及疫苗或抗体。目的蛋白质可以是经济上重要的工业蛋白质或肽,例如酯酶、蛋白酶、糖酶例如淀粉酶和葡糖淀粉酶,纤维素酶、氧化酶或脂肪酶。 目标蛋白质可以是天然发生的蛋白质,突变蛋白质或合成的多肽。目标蛋白质还可以是全长蛋白质的生物学活性片段。本领域技术人员可以基于目标蛋白质预期的活性或功能选择此类片段。此外,目标蛋白质可以是异源的或同源的蛋白质。同源的蛋白质可以包括天然发生的蛋白质的氨基酸序列,或者与天然发生的同源蛋白质相比,可以包括含有插入、缺失或中断的序列。 在一些实施方案中,编码目标蛋白质的第二核酸可以是,但不必需是对特定宿主中的表达密码子优化的。密码子优化是本领域技术人员普遍已知的技术,用于在外源宿主细胞中有效的翻译异源多肽。例如,可以通过商业服务来实施密码子优化,例如GeneArt(Toronto,Canada),所述服务优化了特定的目标蛋白的编码基因用于在选定的宿主细胞中表达。 在一些实施方案中,目标蛋白质是有机磷-降解酶。在一个实施方案中,有机磷-降解酶是磷酸三酯水解酶(EC 3.1.8),即,芳基-二烷基磷酸酶(EC3.1.8.1)或二异丙基-氟磷酸酶(EC 3.1.8.2)。芳基-二烷基磷酸酶也称为有机磷水解酶(OPH);对氧磷酶;A-酯酶;芳基三磷酸酶;有机磷酯酶;酯酶B1;酯酶E4;对氧磷酯酶;pirimiphos-methyl oxon酯酶;OPA脱水酶;有机磷水解酶;磷酸三酯酶;对氧磷水解酶;OPH;或有机磷酸脱水酶。二异丙基-氟磷酸酶也称为DFP酶;塔崩酶;索曼分解酶;有机磷酸脱水酶;有机磷酸脱水酶;OPA脱水酶;二异丙基氟代磷酸酶;二烷基氟代磷酸酶;二异丙基氟代磷酸水解酶;异丙基氟代磷酸酶;和二异丙基氟代膦酸脱卤素酶。磷酸三酯酶(OPH)是酰胺水解酶超家族的成员(Seibert&Raushel,Biochemistry,44,6383-6391[2005]),催化具有不同化学性质的多种化合物(磷酯、酯、酰胺等)的水解。本发明涵盖了细菌物种的OPH酶,所述菌种包括黄杆菌属菌株ATCC27551(Mulbry et KarnsJ Bacteriol.171:6740-6746[1989])、缺陷短波单胞菌OPH(Munnecke,DM.Appl.Environ.Microbiol.32,7-13[1976]),和来自放射形土壤杆菌(Home等人,FEMS Microbiol.Lett.222,1-8[2003])的非常相似的(90%序列同一性)OpdA。在一些实施方案中,OPH具有SEQ ID NO:18,或其变体。 有机磷水解酶(OPH,EC 3.1.8.1)是二聚体的细菌酶,通过水解多种膦酸酯键脱毒许多有机磷神经毒素。通过使用杀虫剂进行成功的害虫控制,在农业作物生产中已经取得了重大的成绩。最常用的杀虫剂类型之一是有机磷(OP)家族,由于其急性的神经毒性,有效的消灭害虫。OP化合物作为杀虫剂和杀昆虫剂的有效性使它们对人类和环境也是有害的。OP及其家族的化合物是强效的神经毒素,与化学武器试剂,例如沙林、索曼和VX[O-乙基-S-(2-二异丙基氨乙基)甲基硫代膦酸酯]具有结构相似性。它们作为胆碱酯酶抑制剂发挥作用,反过来阻断昆虫和人的神经传递。OPH能够水解多种OP神经毒素,包括常规的杀昆虫剂,和结构相似的化学武器试剂例如沙林和索曼(Dumas等人,J boil Chem 261:19659-19665[1989])。 尽管该酶的天然底物和功能仍然未知,但是最有效的是水解磷酸三酯杀虫剂对氧磷的P-O键,催化速率接近扩散的极限(108-109M-1s-1)。天然OPH的活性随不同的硫代膦酸酯底物而变化,对内吸磷(demeton-S)的P-S键表现出更受限的功效(kcat=4s-1)(Lai等人,Archives of BiochemBiophys 318:59-64[1995],Kolakowski等人,Biocatal.Biotransform.15:297-312[1997];diSioudi等人,Chem Biol Interact119-120:211-223[1999])。化学武器试剂VX(O-乙基-S-(2-二异丙基氨乙基)甲基硫代膦酸酯)和VR(O-异丁基-S-N.N-二乙基氨基乙基甲基硫代膦酸酯)属于这类适度水解的化合物(P-S键)(Lai等人,1995,见上文;Kolakowski等人,1997,见上文;Rastogi等人,1997,见上文)。在增强OPH对这类硫代膦酸酯神经试剂的降解能力的尝试中,研究工作集中在通过产生天然OPH的变体,来提高OPH的催化效率和底物特异性(Lai等人,1996,见上文;diSioudi等人,Biochemistry 38:2866-2872[1999])。(Hill等人,Am.Chem.Soc.125:8990-8991[2003])。因此,在一些实施方案中,目标蛋白质是OPH的变体。预期OPH的变体保留了水解有机磷的能力。 在另一个实施方案中,有机磷降解酶是氨酰基脯氨酸二肽酶,例如,有机磷酸脱水酶(OPAA),如在交替单胞菌属(Alteromonas)的菌株中鉴别的OPAA(Cheng等人,Appl.Environ.Microbiol.59,3138-3140[1993])。在另一个实施方案中,有机磷降解酶是HDL-相关的人对氧磷酶(HPON)(Harel,M.等人,Nature Struct.MoI.Biol.11:412-419[2004])。 在一些实施方案中,目标蛋白质是水解酶;氧化还原酶,例如氧化酶;转移酶;裂合酶;异构酶;连接酶;或者商业上或治疗上重要的蛋白质或多肽。在一些实施方案中,水解酶是酯酶或金属依赖性水解酶。在一些实施方案中,酯酶是磷酸三酯酶,例如分类为EC 3.1.8蛋白质的磷酸三酯酶。 在一些实施方案中,目标蛋白质是与至少一种二价金属离子结合的金属依赖性水解酶。金属依赖性水解酶的超家族(也称为酰胺水解酶超家族)是在其3维折叠(TIM桶)和其活性位点的细节表现出保守性的一大类蛋白质。大部分的成员具有保守的金属结合位点,涉及四个组氨酸和一个天冬氨酸残基。在常规的反应机制中,金属离子使水分子脱质子化,用于对底物进行亲核攻击。该家族包括脲酶α、腺苷脱氨酶、磷酸三酯酶、二氢乳清酸酶、尿囊素酶、乙内酰脲酶、AMP-、腺嘌呤和胞嘧啶脱氨酶、咪唑酮丙酸酶、芳基二烷基磷酸酶、氯水解酶(chlorohydrolase)、甲酰甲烷呋喃脱氢酶等等。 在一些实施方案中,金属依赖性水解酶是OPH。OPH可以功能性的适应多种不同的金属。OPH的Zn2+形式是已鉴定过的最稳定的二聚体蛋白质之一,构象稳定性为40kcal/mol,Co2+形式是最具活性的金属配位的形式(Grimsley等人,Biochemistry 36:14366-14374[1997])。可以与OPH结合的二价金属离子的实例包括但不限于Mg2+、Ca2+、Mn2+、Co2+、Ni2+、Zn2+和Cd2+。在一些实施方案中,二价金属离子包括但不限于Mg2+、Co2+、Ni2+、Zn2+和Cd2+。在一些实施方案中,目标蛋白质是与二价金属离子结合的金属依赖性水解酶。二价金属离子可以相同或不同。在一些实施方案中,金属依赖性水解酶是OPH,与OPH相关的二价金属离子选自Mg2+、Co2+、Ni2+、Zn2+和Cd2+及其组合。 在一些实施方案中,目标蛋白质是有机磷水解酶(“OPH”)、己糖氧化酶(“HOX”)、山梨糖醇氧化酶(“SOX”)、乙酰转移酶(“ACT”),或其生物学活性的变体或片段。在一些实施方案中,目标蛋白质是OPH,或其生物学活性的变体或片段。 在一些实施方案中,目标蛋白质是OPH,且编码OPH的第二核酸序列经过密码子优化用于在原核宿主细胞中表达OPH。在一些实施方案中,宿主细胞是链霉菌属宿主细胞,例如浅青紫链霉菌(Streptomyces lividans)宿主细胞。 在一些实施方案中,目标蛋白质是水解酶,但不是糖基化酶或糖苷水解酶。在一些实施方案中,目标蛋白质是水解酶,但不是分类到EC 3.2.1蛋白质中的酶。在一些实施方案中,目标蛋白质是水解酶,但不是木聚糖酶A或脱乙酰壳多糖酶。 在一些实施方案中,本发明的多核苷酸与启动子可操作地连接。多核苷酸可以与本领域目前已知的或以后发现的任何合适的启动子连接。启动子对表达目标蛋白质的原核宿主可以是天然的或异源的。启动子的实例包括但不限于黑曲霉A4启动子(本文中SEQ ID NO:23)、黑曲霉A4长启动子(A4-长启动子),黑曲霉A4-5’启动子(美国专利公开2006/0105425),来自米苏里游动放线菌(Actinoplanes missouriensis)的葡萄糖异构酶(GI)启动子和衍生的GI(GIT)启动子(美国专利号6,562,612和EPA 351029);来自浅青紫链霉菌的葡萄糖异构酶(GI)启动子(SEQ ID NO:1),短野生型GI启动子,1.5GI启动子,1.20GI启动子,或WO 03/089621中公开的任何变体GI启动子,弗氏链霉菌(Streptomyces fradiae)氨基糖苷3’磷酸转移酶基因的aph启动子,ssi启动子,和浅青紫链霉菌的木聚糖酶xlnA启动子。在一些实施方案中,本发明的多核苷酸与SEQ ID NO:23的A4启动子可操作地连接,所述多核苷酸包含可操作地连接的第一核酸和第二核酸,所述第一核酸编码TAT信号肽,所述第二核酸编码分类为EC 3.1.8的磷酸三酯水解酶。 TGCCGGCTTCTCTGTGGGCTTCGGCCCCTCTGGCCCAATGGCTAGCGGAGCAAACTCCC GATCGAACTTCATGTTCGAGTTCTTGTTCACGTAGAAGCCGGAGATGTGAGAGGTGATCTG GAACTGCTCACCCTCGTTGGTGGTGACCTGGAGGTAAAGCAAGTGACCCTTCTGGCGGAG GTGGTAAGGAACGGGGTTCCACGGGGAGAGAGAGATGGCCTTGACGGTCTTGGGAAGGG GAGCTTCGGCGCGGGGGAGGATGGTCTTGAGAGAGGGGGAGCTAGTAATGTCGTACTTG GACAGGGAGTGCTCCTTCTCCGACGCATCAGCCACCTCAGCGGAGATGGCATCGTGCAG AGACAGAC(SEQ ID NO:23) 表1 示例性信号肽和目标蛋白质的序列,及其编码核酸序列 名称 序列 序列ID TAT2 MGTEVSRRKLMKGAAVSGGALALP ALGAPPATAAPAAGPEDLPGPAAA SEQ ID NO:1 TAT2替代 物1 MGTEVSRRKLMKGAAVSGGALALP ALGAPPATAAPAAGPEDLPGPAAAA A SEQ ID NO:2 TAT2替代 物2 MTEVSRRKLMKGAAVSGGALALPA LGAPPATAAPAAGPEDLPGPAAA SEQ ID NO:3 TAT2替代 物3 MTEVSRRKLMKGAAVSGGALALPA LGAPPATAAPAAGPEDLPGPAAAAA SEQ ID NO:4 TAT3: MHEPHLDRRLFLKGTAVTGAALAL GATAAPTASAAP SEQ ID NO:5 SCO2286 信号肽 MTPANHQAPTSAPSPAPSQSSHAPEL RAAARSLGRRRFLTVTGAAAALAFA VNLPAAGTASAAE SEQ ID NO:6 SCO3790 长信号肽 MRKLLPLIGTPSGSHPGGRSAMTCR FRCGDACFHEVPNTSSNEYVGDVIAG ALSRRSMMRAAAVVTVAAAGAGAV GVAGAPSAQAAP SEQ ID NO:7 SCO6580 长信号肽 MTPFTDSSRTDAGTDPSADGPGESLR RALGVNRRRFLSTCTAVAAGAVAAP VFGASPALAHDR SEQ ID NO:8 SCO1590 信号肽 MGGVSRRAFTVAALSAFTLVPEASA ATP SEQ ID NO:9 SCO1824 信号肽 MTAPLSRHRRALAIPAGLAVAASLAF LPGTPAAATPAAEAAP SEQ ID NO:10 SCO6580 短信号肽 MNRRRFLSTCTAVAAGAVAAPVFGA SPALAHDR SEQ ID NO:11 SCO3790 短信号肽 MPNTSSNEYVGDVIAGALSRRSMMR AAAVVTVAAAGAGAVGVAGAPSAQ AAP SEQ ID NO:12 SCO736 信号肽 MGDIRRRGAVALGVTALVAPLTLAL TAAPAQAASC SEQ ID NO:13 SCO2068 信号肽 MTSRHRASENSRTPSRRTVVKAAAA GAVLAAPLAAALPAGAADAAP SEQ ID NO:14 SCO3471 信号肽 MVNRRDLIKWSAVALGAGAGLAGP APAAHAADL SEQ ID NO:15 SCO7677 信号肽 MSRQIDRRSFLRRGAAGAAALAVGP GLLAACSTDEPGSAGNPG SEQ ID NO:16 TAT1信 号肽 MQTRRVVLKSAAAAGTLLGGLAGC ASVAGS SEQ ID NO:17 OPH IGTGDRINTVRGPITISEAGFTLTHEH ICGSSAGFLRAWPEFFGSRKALAEKA VRGLRRARAAGVRTIVDVSTFDIGRD VSLLAEVSRAADVHIVAATGLWFDP PLSMRLRSVEELTQFFLREIQYGIED TGIRAGIIKVATTGKATPFQELVLKA AARASLATGVPVTTHTAASQRDGEQ QAAIFESEGLSPSRVCIGHSDDTDDLS YLTALAARGYLIGLDHIPHSAIGLED NASASALLGIRSWQTRALLIKALIDQ GYMKQILVSNDWLFGFSSYVTNIMD VMDRVNPDGMAFIPLRVIPFLREKG VPQETLAGITVTNPARFLSPTLRAS SEQ ID NO:18 TAT1DNA ATGCAAACGAGAAGGGTTGTGCTC AAGTCTGCGGCCGCCGCAGGAACT CTGCTCGGCGGCCTGGCTGGGTGC GCGAGCGTGGCTGGATCG SEQ ID NO:19 TAT2DNA ATGGGCACCGAGGTCTCCCGCCGC AAGCTGATGAAGGGCGCCGCCGTC AGCGGCGGCGCCCTGGCCCTGCCG GCCCTGGGCGCCCCGCCGGCCACC GCCGCCCCGGCCGCCGGCCCGGA GGACCTGCCGGGCCCGGCCGCCGC G SEQ ID NO:20 TAT3DNA ATGCACGAGCCGCACCTCGACCGC CGTCTGTTCCTGAAGGGCACGGCC GTCACCGGCGCCGCCCTCGCACTG GGCGCCACCGCCGCGCCCACCGCC TCCGCCGCCCCC SEQ ID NO:21 经过密码子 优化用于在 链霉菌属中 表达的 OPH基因 ATCGGCACCGGCGACCGCATCAAC ACGGTCCGCGGCCCGATCACCATC TCCGAGGCCGGCTTCACCCTGACC CACGAGCACATCTGCGGCTCCTCC GCCGGCTTCCTGCGCGCCTGGCCG GAGTTCTTCGGCTCCCGCAAGGCC CTGGCCGAGAAGGCCGTCCGCGGC CTGCGCCGCGCCCGGGCCGCCGGC GTCCGCACCATCGTGGACGTGTCC ACCTTCGACATCGGCCGCGACGTG TCCCTGCTGGCCGAGGTCTCGCGC GCCGCCGACGTCCACATCGTCGCC GCCACCGGCCTGTGGTTCGACCCG CCGCTGTCCATGCGCCTGCGCTCC GTCGAGGAGCTGACCCAGTTCTTC CTCCGCGAGATCCAGTACGGCATC GAGGACACCGGCATCCGCGCCGGC ATCATCAAGGTCGCCACCACCGGC AAGGCCACCCCGTTCCAGGAGCTG GTCCTGAAGGCCGCCGCCCGCGCC TCCCTGGCCACCGGCGTCCCGGTC ACCACCCACACCGCCGCCTCCCAG CGCGACGGCGAGCAGCAGGCCGC CATCTTCGAGTCCGAGGGCCTGTC CCCGTCCCGCGTCTGCATCGGCCA CTCCGACGACACCGACGACCTGTC CTACCTGACCGCCCTGGCCGCCCG CGGCTACCTGATCGGCCTGGACCA SEQ ID NO:22 CATCCCGCACTCCGCCATCGGCCT GGAGGACAACGCCTCCGCCTCCGC CCTGCTGGGCATCCGCTCGTGGCA GACCCGCGCCCTGCTGATCAAGGC CCTGATCGACCAGGGCTACATGAA GCAGATCCTGGTCTCCAACGACTG GCTGTTCGGCTTCTCCTCCTACGTC ACCAACATCATGGACGTCATGGAC CGCGTCAACCCGGACGGCATGGCC TTCATCCCGCTGCGCGTGATCCCG TTCCTGCGCGAGAAGGGCGTCCCG CAGGAGACCCTGGCCGGCATCACC GTGACCAACCCGGCCCGCTTCCTG TCCCCGACCCTGCGCGCCTCCTGA在另一个方面,本文教导的内容提供了包含Tat信号肽和本发明的目标蛋白的融合多肽。本文中描述的任一种TAT信号肽与目标蛋白质融合。在一些实施方案中,本发明提供了这样的融合多肽,所述融合多肽包含TAT2(例如,SEQ ID NO:1-4)或TAT3(例如,SEQ ID NO:5)信号肽,其与SEQ ID NO:18的有机磷水解酶或其变体可操作地连接。在其它实施方案中,TAT信号肽选自SEQ ID NO:1或5。 融合多肽任选的包括位于TAT信号肽和目标蛋白(例如,OPH)之间的接头肽。接头肽可以是任何合适的长度,包括但不限于1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45或50个氨基酸。在一些实施方案中,接头肽包括1至10个氨基酸,或1至5个氨基酸。在一些实施方案中,接头肽包括1或2个氨基酸。接头肽可以包括任何天然发生的或修饰的氨基酸。在一些实施方案中,接头肽包括丙氨酸。在一些实施方案中,接头肽是可切割的接头,并且可以容易的切割而从还含有信号肽的前蛋白中释放出成熟的蛋白质。 在一些实施方案中,本文教导的内容提供了包含本发明的多核苷酸的表达载体。载体可以是任何目前已知的或以后发现的载体,将适合在宿主细胞中表达目标蛋白质。载体可以是整合载体或复制载体。通常,载体含有在至少一种生物体中有功能的复制起点,方便的限制性内切核酸酶位点,和用于宿主细胞的选择性标记。可以使用的载体的实例包括但不限于pKB105、pKB229、pKB231、pKB233和pKB234。在一些实施方案中,表达载体包括可操作地连接的第一核酸序列和第二核酸序列,所述第一核酸序列编码TAT信号肽,所述第二核酸序列编码分类为EC 3.1.8,例如有机磷水解酶蛋白的磷酸三酯水解酶。在一些实施方案中,表达载体包含第一核酸序列和第二核酸序列,所述第一核酸序列编码SEQ ID NO:1-5的任一项的TAT信号肽,所述第二核酸序列编码磷酸三酯水解酶。在一些实施方案中,分离的多核苷酸还可操作地连接SEQ ID NO:23的A4启动子,所述多核苷酸包括与第二核酸序列可操作地连接的第一核酸序列,所述第一核酸序列编码TAT信号肽,所述第二核酸序列编码磷酸三酯水解酶。在其它实施方案中,编码磷酸三酯水解酶的核酸序列是密码子优化的,用于在链霉菌属宿主细胞中表达。在一些实施方案中,链霉菌属宿主细胞是浅青紫链霉菌宿主细胞。 在一些实施方案中,本文教导的内容提供了包含本发明的多核苷酸的宿主细胞。宿主细胞可以是任何细胞,例如本领域已知的高等真核细胞、低等真核细胞或原核细胞,其能够表达目标蛋白质并通过Tat途径分泌所述蛋白质。在一些实施方案中,宿主细胞是原核细胞,例如细菌细胞。细菌宿主细胞可以来自革兰氏阳性或革兰氏阳性细菌。在一些实施方案中,宿主细胞来自革兰氏阳性细菌。多种类型的革兰氏阳性细胞可以作为用于生产目标蛋白质的合适的宿主细胞,例如,链霉菌属、芽孢杆菌属和乳球菌属细胞。 在一些实施方案中,宿主细胞是链霉菌属细胞。如本文中使用的,属名链霉菌属包括本领域技术人员已知的所有成员,包括但不限于不产色链球菌(S.achromogenes)、略白链球菌(S.albicans)、白浅灰链霉菌(S.albogriseolus)、产二素链霉菌(S.ambofaciens)、除虫链霉菌(S.avermitilis)、嗜碳链霉菌(S.carbophilus)、带小棒链霉菌(S.clavuligerus)、天蓝色链霉菌(S.coelicolor)、苦胆链霉菌(S.felleus)、S.ferralitis、丝状链霉菌(S.filamentosus)、灰色链霉菌(Streptomyces griseus)、淡蜡黄链霉菌(S.helvaticus)、吸水链霉菌(S.hygroscopicus)、溶表面链霉菌(S.lysosuperficus)、浅青紫链霉菌(S.lividans)、诺尔斯氏链霉菌(S.noursei)、S.plicatosporus、锈赤链霉菌(S.rubiginosus)、疮痂病链霉菌(S.scabies)、索马里链霉菌(S.somaliensis)、热紫链霉菌(S.thermoviolaceus)和紫红链霉菌(S.violaceoruber)。在一些实施方案中,宿主细胞是芽孢杆菌属细胞,包括但不限于克劳氏芽孢杆菌(B.clausii)、枯草芽孢杆菌(B.subtilis)、地衣芽孢杆菌(B.licheniformis)和迟缓芽孢杆菌(B.lentus)细胞。在一些实施方案中,宿主细胞是白浅灰链霉菌、嗜碳链霉菌、天蓝色链霉菌、浅青紫链霉菌、锈赤链霉菌、淡蜡黄链霉菌或枯草芽孢杆菌细胞。 在另一个方面,本文教导的内容提供了在宿主细胞中生产目标蛋白质的方法。该方法包括在宿主细胞中表达本发明的多核苷酸。如上所述,宿主细胞可以是任何合适的细胞,例如,原核细胞或细菌细胞,包括但不限于链霉菌属或芽孢杆菌属细胞。在一些实施方案中,以折叠形式生产目标蛋白质。在一些实施方案中,以其活性形式生产目标蛋白质。在一些实施方案中,本发明的宿主细胞(例如链霉菌属宿主细胞)包含含有分离的多核苷酸的表达载体,所述表达载体包括可操作地连接的第一核酸序列和第二核酸序列,所述第一核酸序列编码TAT信号肽,所述第二核酸序列编码分类为EC 3.1.8蛋白质,例如有机磷水解酶蛋白的磷酸三酯水解酶。在一些实施方案中,表达载体包括第一核酸序列和第二核酸序列,所述第一核酸序列编码SEQ ID NO:1-5的任一项的TAT信号肽,所述第二核酸序列编码磷酸三酯水解酶。在另一个实施方案中,表达载体包含分离的多核苷酸,所述分离的多核苷酸包括与第二核酸序列可操作地连接的第一核酸序列,所述第一核酸序列编码TAT信号肽,所述第二核酸序列编码磷酸三酯水解酶,所述分离的多核苷酸还可操作地连接SEQ ID NO:23的A4启动子。在其它实施方案中,编码磷酸三酯水解酶的核酸序列是密码子优化的,用于在链霉菌属宿主细胞中表达。在一些实施方案中,本发明的宿主细胞是链霉菌属宿主细胞,例如浅青紫链霉菌宿主细胞。 在一些实施方案中,本发明的宿主细胞和转化的细胞培养在常规的营养培养基中。合适的特定培养条件,例如温度、pH等是本领域技术人员已知的。此外,一些优选的培养条件可以在科学文献中发现,例如Hopwood(2000)Practical Streptomyces Genetics,John lnnes Foundation,NorwichUK;Hardwood等人,(1990)Molecular Biological Methods for Bacillus,John Wiley和来自美国典型培养物保藏中心(ATCC)。 在一些实施方案中,用编码TAT-融合蛋白(例如,TAT-OPH融合蛋白)的多核苷酸序列转化的宿主细胞培养在适合表达编码蛋白和从细胞培养物中回收编码蛋白的条件下。重组宿主细胞生产的蛋白质分泌到培养基中。在一些实施方案中,其它重组构建将编码TAT-OPH蛋白的异源多核苷酸序列连接到编码多肽结构域的核苷酸序列上,所述结构域有利于可溶性蛋白质的纯化(Kroll DJ等人,(1993)DNA Cell Biol 12:441-53)。 此类纯化有利的结构域包括但不限于金属螯合肽,例如允许在固定化金属上纯化的组氨酸-色氨酸模块(Porath J(1992)Protein Expr Purif3:263-281),允许在固定化免疫球蛋白上纯化的A蛋白结构域,和在FLAGS延伸/亲和纯化系统(Immunex Corp,Seattle WA)中使用的结构域。在纯化结构域和异源蛋白之间包括可切割接头序列,如因子XA或肠激酶(Invitrogen,San Diego CA),也可以用于方便纯化。 在一些优选的实施方案中,本发明的转化的宿主细胞培养在合适的营养培养基中,所述培养基允许本发明OPH的表达,其后从培养物中回收获得的OPH。用于培养细胞的培养基包含任何适合生长宿主细胞的常规培养基,例如含有合适的添加物的基本或复合培养基。从经济供应商可以获得合适的培养基,或可以根据已公开的配方(例如,美国典型培养物保藏中心的目录)制备。在一些实施方案中,通过常规的程序从培养基中回收细胞生产的OPH,包括但不限于通过离心或过滤从培养基中分离宿主细胞,沉淀上清液的蛋白质组分,或通过盐(如,硫酸铵)、层析纯化(如,离子交换、凝胶过滤、亲和等)的方式过滤。因此,本发明可以使用任何适合回收本发明的OPH的方法。实际上,其并非意在限制本发明为任何特定的纯化方法。 在一些实施方案中,本文教导的内容提供了在宿主细胞中生产目标蛋白质的方法。该方法包括在宿主细胞中表达本发明的多核苷酸,在培养基中培养宿主细胞和从培养基中回收目标蛋白质。 可以小规模的或较大规模(例如,工业规模)实践本发明的方法和分离表达的蛋白质。在一些实施方案中,本文教导的内容提供了通过本发明的方法生产的目标蛋白质。在一些实施方案中,目标蛋白质是折叠的形式或其活性形式。 还可以根据下列实施例进一步理解本文教导的内容的各方面,其不应该认为是限制了本文教导内容的范围。在不脱离本文教导内容的条件下,可以实施对材料和方法的多种修饰,这对本领域技术人员是显而易见的。 实验 在下文公开的实验中,使用了下列缩写:eq(当量);M(摩尔的);μM(微摩尔的);mol(摩尔);mmol(毫摩尔);μmol(微摩尔);nmol(纳摩尔);g(克);mg(毫克);kg(千克);μg(微克);L(升);ml(毫升);μl(微升);cm(厘米);mm(毫米);μm(微米);nm(纳米);℃(摄氏度);h(小时);min(分钟);sec(秒);msec(毫秒);TY,胰蛋白胨/酵母提取物;Ap,青霉素;DTT,二硫苏糖醇;Em,红霉素;HPDM,高磷酸盐已知成份培养液;MM,基本培养基;OD,光密度;PAGE,聚丙烯酰胺凝胶电泳;PCR,聚合酶链式反应。 实施例1:构建用于在链霉菌属宿主细胞中生产OPH的表达质粒 在浅青紫链霉菌g3s3宿主细胞中表达的OPH蛋白包含以下氨基酸序列: IGTGDRINTVRGPITISEAGFTLTHEHICGSSAGFLRAWPEFFGSRKALAEKAVRGLRRARAAGVRTIVDVSTFDIGRDVSLLAEVSRAADVHIVAATGLWFDPPLSMRLRSVEELTQFFLREIQYGIEDTGIRAGIIKVATTGKATPFQELVLKAAARASLATGVPVTTHTAASQRDGEQQAAIFESEGLSPSRVCIGHSDDTDDLSYLTALAARGYLIGLDHIPHSAIGLEDNASASALLGIRSWQTRALLIKALIDQGYMKQILVSNDWLFGFSSYVTNIMDVMDRVNPDGMAFIPLRVIPFLREKGVPQETLAGITVTNPARFLSPTLRAS(SEQ ID NO:18) 其由相应的OPH基因(SEQ ID NO:22)编码,通过GeneArt公司(Toronto,Canada)合成,对用于链霉菌属基因进行了密码子优化。 ATCGGCACCGGCGACCGCATCAACACGGTCCGCGGCCCGATCACCATCTCCGAGGCCGGCTTCACCCTGACCCACGAGCACATCTGCGGCTCCTCCGCCGGCTTCCTGCGCGCCTGGCCGGAGTTCTTCGGCTCCCGCAAGGCCCTGGCCGAGAAGGCCGTCCGCGGCCTGCGCCGCGCCCGGGCCGCCGGCGTCCGCACCATCGTGGACGTGTCCACCTTCGACATCGGCCGCGACGTGTCCCTGCTGGCCGAGGTCTCGCGCGCCGCCGACGTCCACATCGTCGCCGCCACCGGCCTGTGGTTCGACCCGCCGCTGTCCATGCGCCTGCGCTCCGTCGAGGAGCTGACCCAGTTCTTCCTCCGCGAGATCCAGTACGGCATCGAGGACACCGGCATCCGCGCCGGCATCATCAAGGTCGCCACCACCGGCAAGGCCACCCCGTTCCAGGAGCTGGTCCTGAAGGCCGCCGCCCGCGCCTCCCTGGCCACCGGCGTCCCGGTCACCACCCACACCGCCGCCTCCCAGCGCGACGGCGAGCAGCAGGCCGCCATCTTCGAGTCCGAGGGCCTGTCCCCGTCCCGCGTCTGCATCGGCCACTCCGACGACACCGACGACCTGTCCTACCTGACCGCCCTGGCCGCCCGCGGCTACCTGATCGGCCTGGACCACATCCCGCACTCCGCCATCGGCCTGGAGGACAACGCCTCCGCCTCCGCCCTGCTGGGCATCCGCTCGTGGCAGACCCGCGCCCTGCTGATCAAGGCCCTGATCGACCAGGGCTACATGAAGCAGATCCTGGTCTCCAACGACTGGCTGTTCGGCTTCTCCTCCTACGTCACCAACATCATGGACGTCATGGACCGCGTCAACCCGGACGGCATGGCCTTCATCCCGCTGCGCGTGATCCCGTTCCTGCGCGAGAAGGGCGTCCCGCAGGAGACCCTGGCCGGCATCACCGTGACCAACCCGGCCCGCTTCCTGTCCCCGACCCTGCGCGCCTCCTGA(SEQ ID NO:22) 使用编码信号序列的下列多核苷酸在浅青紫链霉菌宿主细胞中表达OPH: 1、截短的celA信号序列; 2、ASP信号序列; 3、TAT1:密码子优化的OPH信号序列,用于在链霉菌属中表达 ATGCAAACGAGAAGGGTTGTGCTCAAGTCTGCGGCCGCCGCAGGAACTCTGCTCGGCGG CCTGGCTGGGTGCGCGAGCGTGGCTGGATCG(SEQ ID NO:19); 4、TAT2:SCO6272的修饰的假定信号肽 ATGGGCACCGAGGTCTCCCGCCGCAAGCTGATGAAGGGCGCCG CCGTCAGCGGCGGCGCCCTGGCCCTGCCGGCCCTGGGCGCCCC GCCGGCCACCGCCGCCCCGGCCGCCGGCCCGGAGGACCTGCCG GGCCCGGCCGCCGCG(SEQ ID NO:20);和 5、TAT3:SCO624的假定信号肽 ATGCACGAGCCGCACCTCGACCGCCGTCTGTTCCTGAAGGGCACGGCCGTCACCGGCGC CGCCCTCGCACTGGGCGCCACCGCCGCGCCCACCGCCTCCGCCGCCCCC(SEQ IDNO:21) 通过用编码OPH信号肽(TAT1;SEQ ID NO:19)和OPH蛋白(SEQID NO:18)的融合多核苷酸序列,来取代编码celA信号肽和纤维素酶催化核心的片段,从质粒pKB105构建质粒pKB229。参见图2。 通过用编码TAT2信号肽(SEQ ID NO:1)和OPH蛋白(SEQ IDNO:18)的融合多核苷酸序列(SEQ ID NO:20),来取代编码celA信号肽和纤维素酶催化核心的片段,从质粒pKB105构建质粒pKB231。参见图3。 通过用编码TAT3信号肽(SEQ ID NO:5)和OPH蛋白(SEQ IDNO:18)的融合多核苷酸序列(SEQ ID NO:21),来取代编码celA信号肽和纤维素酶催化核心的片段,从质粒pKB105构建质粒pKB233。参见图4。 对于在发酵罐中生产OPH,通过去除pKB233中的大肠杆菌DNA序列,自pKB233得到表达载体pKB234。为了去除大肠杆菌序列,用SphI、EcoRI和HindIII在37℃消化pKB233过夜。使用Qiagen试剂盒纯化消化的DNA,然后重新连接用于链霉菌属宿主细胞的转化。图5显示了pKB234载体。 实施例2:链霉菌属宿主细胞生产的OPH的表达和活性 下列实施例描述了不同TAT信号肽对OPH的表达和活性的影响。 转化和表达: 该实施例中使用了上述表达载体:pKB229、pKB231和pKB233。 在这些实验中,用上述载体转化宿主浅青紫链霉菌细胞。转化技术是在Hopwood等人,GENETIC MANIPULATION OF STREPTOMYCES,A LABORATORY MANUAL.The John lnnes Foundation,Norwich,United Kingdom(1985)中描述的原生质体方法。 用上述的一种表达载体转化浅青紫链霉菌。转化的细胞接种在R5平板上(1升R5平板:206g蔗糖,0.5g K2SO4,20.24g MgCl2,20g葡萄糖,0.2g Difco酪蛋白氨基酸,10g Difco酵母提取物和11.46g TES,4gL-Asp,4ml的微量元素和44g Difco琼脂,加入800ml H2O中。在高压灭菌后,加入20ml 5%K2HPO4和8ml 5M CaCl2.2H2O和14ml 1NNaOH至终体积1升)。在存在50μg/ml硫链丝菌素的条件下,在30℃下,在250ml摇瓶中,转化体在20ml的TSG中生长2天。然后将细胞转移至不含抗生素的生产培养基中(50ml),再持续生长3天。采集样品供电泳和酶活性测定。 TSG培养基含有16g Difco胰蛋白胨,4g Difco大豆蛋白胨,20g酪蛋白(水解产物)sigm和5g K2HPO4,至1升。在高压灭菌后,加入50%过滤除菌的葡萄糖至终浓度为1.5%。 生长培养基:2.4g柠檬酸·H2O;8.3g Biospringer酵母提取物;2.4g(NH4)2SO4;72.4g MgSO4·7H2O;0.1g CaCl2·2H2O;0.3ml Mazu DF204(消泡剂);5ml链霉菌修饰的微量元素(1升贮存液含有:250g柠檬酸·H2O;3.25g FeSO4·7H2O;5g ZnSO4·7H2O;5g MnSO4·H2O;0.25g H3BO3);10g葡萄糖,调节体积至1升。用NaOH调节pH至6.9。在一些实验中,生产培养基添加了Zn2+或Co2+。 回收 从每个摇瓶中采集1ml细胞培养物样品,在14,000rpm离心沉淀细胞。通过SDS-PAGE电泳分析分泌到培养基中的OPH酶,如下述测试酶活性。 OPH活性测定和SDS-PAGE分析 (A)如图6所示,通过SDS-PAGE检测分析浅青紫链霉菌细胞(泳道1-4和6-9)中上述载体的OPH生产。双箭头表示OPH在非还原条件下作为二聚体迁移。泳道1:没有任何信号肽,在A4启动子下直接的OPH表达;泳道2:用TAT1信号序列的OPH表达;泳道3:用TAT3信号序列的OPH表达;泳道4:只有A4启动子的表达骨架(作为阴性对照);泳道5:OPH在大肠杆菌中作为包含体表达(作为阳性对照);泳道6:与泳道3相同;泳道7:除向生产培养基中添加钴(终浓度为0.5mM)以外,与泳道3相同;泳道8:用TAT2信号序列的OPH表达,生产中添加的钴终浓度为0.5mM;泳道9:用TAT1信号序列的OPH表达,钴终浓度为0.5mM。 结果显示,当OPH作为TAT2-OPH或TAT3-OPH融合蛋白表达时,与TAT1-OPH的生产相比,细菌宿主细胞生产OPH较多。TAT3-OPH融合多核苷酸的表达导致了链霉菌属宿主细胞最大的OPH生产。 (B)检查向生产培养基发酵中添加Zn2+或Co2+对OPH生产的影响。图7显示了当用TAT3信号肽表达时,添加Zn2+或Co2+对OPH生产和储存稳定性的影响。泳道1、2和3显示了分别在4℃、-20℃和-20℃具有20%甘油的条件下储存后,作为TAT3-OPH表达的OPH生产水平。泳道4、5和6显示,在存在0.1mM Zn2+的条件下,分别在4℃、-20℃和-20℃具有20%甘油的条件下储存后,作为TAT3-OPH表达的OPH生产水平。泳道7、8和9显示,在存在0.1mM Co2+的条件下,分别在4℃、-20℃和-20℃具有20%甘油的条件下储存后,作为TAT3-OPH表达的OPH生产水平。通过MS肽图谱验证了预期的OPH条带的序列,如图8所示。 这些数据表明,不论在存在或缺失金属离子的条件下,OPH的生产水平是相似的,OPH最佳储存在4℃或-20℃下。 (C)检测与图7显示的样品1-9对应的样品的活性(Caldwell等人,Biochemistry 30:7438-7444[1991];Rastogi等人,Biochem Biophys ResCommun 241:294-296[1997])。由于OPH活性测定中使用的对氧磷和VX底物是剧毒的,不同的摇瓶样品的上清液送至美国军方(USArmy-ECBC,AMSRD-ECB-RT-BP,E-3150Kingscreek St.N.APG,MD21010)进行OPH比活测定。 图9显示了OPH比活测定的结果。作为OPH 1-9显示的条带对应图7的泳道1-9中的样品。这些数据显示,作为具有TAT3信号肽的融合蛋白表达,且通过链霉菌属宿主细胞生产的OPH,保留了有机磷降解活性。
《用于在原核生物中生产蛋白质的TAT信号肽.pdf》由会员分享,可在线阅读,更多相关《用于在原核生物中生产蛋白质的TAT信号肽.pdf(42页珍藏版)》请在专利查询网上搜索。
本发明提供了编码TAT融合蛋白的多核苷酸,以及用于在宿主细胞中生产目标蛋白质的方法。特别地,本发明涉及用于在宿主细胞、例如链霉菌属宿主细胞中表达有机磷-降解酶、例如有机磷水解酶(OPH)的多核苷酸、载体、多肽和方法。 。
copyright@ 2017-2020 zhuanlichaxun.net网站版权所有经营许可证编号:粤ICP备2021068784号-1