突变微生物和利用该类微生物合成肽的方法 【技术领域】
本发明涉及突变微生物和利用该类微生物合成肽的方法、具体而言、涉及可以高效地合成肽的突变微生物和利用所述微生物合成肽的方法。
背景技术
肽已广泛应用于医药、食品等领域。例如,与L-谷氨酰胺相比,L-丙氨酰-谷氨酰胺的稳定性和水溶性高、因而广泛地作为输液和无血清培养基成分使用。
目前已知的肽制造方法通常是化学合成法,但该方法不能完全满足简单、高效的要求。
此外,还开发了利用酶来合成肽的方法。但是,以前的利用酶来合成肽的方法,由于肽的合成速度极慢、生成的肽的回收率低等原因存在改善余地。。在这样的背景下,人们期待着开发一种可以在工业上高效地生产肽的方法。
作为利用微生物高效生产目的产物的方法,有通过构建破坏以产物为底物的酶的基因的突变株和利用该突变株来生产目地产物的方法。(例如专利文献1)。
专利文献1特开2003-189863。
【发明内容】
发明解决的问题
如果不适当地破坏从出发物质到产物间的反应体系中相关的、作为促使生成副产物的因子以及能分解产物的因子的酶,则通过制备破坏菌株进行生产的方法因为回收率低不能进行有效地生产。
但是,利用微生物的反应体系有很多复杂的情况,根据原料、目的产物、利用来生产的微生物种类等条件、也不易发现适宜被破坏的基因。
基于上述情况,本发明提供了利用破坏株进行高效肽合成的方法。
解决上述问题的手段
为了解决上述问题发明人锐意研究,发现了利用微生物来高效的生产肽时应破坏掉的基因,由此完成了本发明。
即本发明提供了下述的突变微生物、突变微生物的构建方法和肽的制造方法。
[1]一种突变微生物,其染色体上的一种或两种以上基因被破坏,所述基因选自编码氨酰基组氨酸二肽酶、亮氨酰氨肽酶、异天冬氨酰二肽酶的基因。
[2][1]中所述的微生物,其染色体上编码α-天冬氨酰二肽酶的基因被破坏。
[3][1]或[2]所述的微生物,其中所述的细菌是埃希氏菌属的细菌。
[4]一种微生物,其染色体上的基因被破坏,所述基因选自编码氨酰基组氨酸二肽酶的基因、编码亮氨酰氨肽酶的基因、编码异天冬氨酰氨肽酶的基因中的一种或两种以上;
并且所述微生物被含有编码具有肽合成活性的蛋白的多核苷酸的重组DNA转化。
[5][4]中所述的微生物,其染色体上编码α-天冬氨酰二肽酶的基因被破坏。
[6][4]或[5]中所述的微生物,其中,所述的微生物是埃希氏菌属的细菌。
[7][4]至[6]中任意一项所述的微生物,其中所述的具有肽合成活性的蛋白是来自稳杆菌属或鞘氨醇杆菌属的细菌的蛋白质。
[8][4]至[6]中任意一项所述的微生物,其中所述的具有肽合成活性的蛋白是下述(A)或(B)中所示的蛋白质:
(A)具有SEQ ID NO 14所示的氨基酸序列的蛋白质
(B)具有在SEQ ID NO 14所示的氨基酸序列中引入了一个或几个氨基酸取代、缺失、插入、附加、和/或倒位所得的氨基酸序列,并且具有肽合成活性的蛋白质。
[9][4]至[6]中任意一项所述的微生物,其中所述的具有肽合成活性的蛋白是下述(C)或(D)所示的蛋白质:
(C)具有SEQ ID NO 20所示的氨基酸序列的蛋白质
(D)具有在SEQ ID NO 20的氨基酸序列中引入一个或几个氨基酸取代、缺失、插入、附加、和/或倒位所得的氨基酸序列,并且具有肽合成活性的蛋白质。
[10]一种微生物的制备方法,所述微生物染色体上的基因被破坏,所述基因选自编码氨酰基组氨酸二肽酶的基因、编码亮氨酰氨肽酶的基因、编码异天冬氨酰氨肽酶的基因中的一种或两种以上。
[11][10]中所述的微生物的制备方法,其中所述微生物染色体上编码α-天冬氨酰二肽酶的基因被破坏。
[12]一种微生物的制备方法,其中,所述微生物染色体上的基因被破坏,所述基因选自编码氨酰基组氨酸二肽酶的基因、编码亮氨酰氨肽酶的基因、编码异天冬氨酰氨肽酶的基因中的一种或两种以上;
并且所述微生物被含有编码具有肽合成活性的蛋白的多核苷酸的重组DNA转化。
[13][12]中所述的微生物的制备方法,其中所述微生物染色体上编码α-天冬氨酰二肽酶的基因被破坏。
[14]一种肽的制备方法,该方法包括在培养基中培养微生物,将所培养的微生物和所述微生物的细胞破碎物中的至少一种与羧基组分和胺组分混合来合成肽,
所述微生物染色体上的基因被破坏,所述基因选自编码氨酰基组氨酸二肽酶的基因、编码亮氨酰氨肽酶的基因、编码异天冬氨酰氨肽酶的基因中的一种或两种以上;
并且所述微生物被含有编码具有肽合成活性的蛋白的多核苷酸的重组DNA转化。
[15][14]中所述的肽的制备方法,其中所述的微生物是染色体上编码α-天冬氨酰二肽酶的基因被破坏的微生物。
发明的效果
本发明提供了高效的肽的制造方法。
本发明的最佳实施方案
以下的实施方案是对本发明的最佳实施方案的说明。下述各种基因工程实验技术记载在分子克隆,第2版,冷泉港出版社(1989)、细胞遗传学手册,黑木登志夫等编,羊土社(1992)、新基因工程学手册修订第3版,村松等编,羊土社(1999)等多种标准实验手册中,这些文献的内容引入本发明的说明书中。
1本发明的突变微生物及其制备方法
本发明中的突变微生物是已将妨碍肽高效合成的基因破坏的微生物。被破坏的基因是存在于染色体上的编码氨酰基组氨酸二肽酶(以下称作“pepD基因”)的基因、编码亮氨酰氨肽酶(以下称作“pepA”基因)的基因、异天冬氨酰二肽酶(以下称作iadA基因)的基因。可以破坏这些基因中的一个或多个。
并且,与存在于染色体上的α-天冬氨酰二肽酶基因(以下称为pepE基因)被破坏的突变株相比,本发明提供的突变株显示为一种更优选的方式。
使用选至上述中的一个或多个基因被破坏的突变株、可以比使用这些基因能表达的微生物更高效的合成肽。达到高效的合成肽的目的,主要是由于上述操作可以使作为产物的肽的分解活性降低以至于消失。
本说明书中所述的基因,是遗传信息的载体,例如其包含编码蛋白质的碱基序列的多核苷酸。
本说明书中所述的将基因破坏是指,使蛋白等基因产物的表达受抑制或不表达。更具体地,是指通过使编码对作为目的产物的肽有分解活性的肽酶的基因发生突变,和使该基因发生缺失等手段破坏该基因。基因破坏的具体方法在下述内容中进行详细说明。
本说明书中所述的“肽”指含有肽键的多聚体,即所谓的二肽、三肽、寡肽等多肽。
本发明的一个优选的实施方案是在这些基因中至少pepD基因被破坏。因为pepD基因被破坏,肽合成效率大幅改善,特别是在天冬氨酰苯基丙氨酸、丙氨酰谷氨酰胺的生产中极其有效。此外,本发明一个更优选的实施方式是pepD基因、pepA基因、iadA基因、pepE基因全部被破坏。在四个基因全部被破坏的情况下,在合成各种肽时,可以最大限度地抑制最终合成的肽的分解消失。
本发明对微生物种类没有特别的限定,只要其能合成肽即可。本说明书所涉及的微生物包括真核微生物、原核微生物以及病毒等。从适合于工业生产的观点来,优选便于操作的细菌等,更优选肠杆菌,特别优选例如以大肠杆菌为代表的埃希氏属的细菌。
基因破坏株的制备方法以微生物中的丙氨酰谷氨酰胺以及天冬氨酰苯基丙氨酸分解活性降低以至消失为例来具体说明。通过使编码细胞内作用于丙氨酰谷氨酰胺和天冬氨酰苯基丙氨酸以及它们的衍生物的肽酶的基因突变或者缺失,使上述肽酶的分解活性降低以至消失,从而实现丙氨酰谷氨酰胺以及天冬氨酰苯基丙氨酸分解活性降低以至消失。肽酶基因失活可以是由紫外线照射和亚硝基呱诱变处理、位点特异性诱变、同源重组及/或称为[Red-driven整合]的插入-缺失诱变(Datsenko K.A.and Wanner B.L.,Proc.Natl.Acad.Sci.USA,2000,Vol 97(12):p6640-45)等通常的基因破坏方法来实行。
分解丙氨酰谷氨酰胺和天冬氨酰苯基丙氨酸以及它们的衍生物的肽酶是pepD基因编码的氨酰基组氨酸二肽酶、pepE基因编码的α-天冬酰氨二肽酶、pepA基因编码的亮氨酰氨肽酶、以及iadA基因编码的异天冬氨酰二肽酶。已知pepD基因、pepE基因、pepA基因以及iadA基因存在于,例如大肠杆菌中。(pepD基因,J.Bacteriol.172(8),4641-4651(1990)、pepE基因,JP-A-2003-189863、pepA基因,J.Mol.Biol.2000 Sep 15;302(2):411-26、iadA基因,J.Biol.Chem.1995 Feb 24;270(8):4076-87)。各肽酶基因的缺失突变株可以通过包含各基因的一部分的DNA片段与微生物染色体上各基因间发生同源重组而获得的。
具体而言,例如用其中含有因肽酶基因的一部分缺失,不能产生行使正常功能的肽酶的缺失型肽酶基因的DNA转化,例如大肠杆菌,诱导缺失型肽酶基因和染色体上的肽酶基因间发生同源重组,由此使染色体上的肽酶基因变为缺失型肽酶基因。通过同源重组引起的基因缺失的技术已经确立,例如可以使用线性DNA以及含有温度敏感的复制起点的质粒及/或称为[Red-driven整合]的插入-缺失诱变使基因缺失。以下说明使用含有温度敏感的复制起点的质粒的方法以及称为[Red-driven整合]的插入-缺失诱变的方法。
大肠杆菌的各肽酶基因pepD基因、pepE基因、pepA基因以及iadA基因在国际碱基序列数据库DDBJ/EMBL/GeneBank登陆的索引号分别是AE000132、AE000475、AE000496、AE000503。基于这些碱基序列合成引物以埃希氏属菌,例如大肠杆菌W3110等的染色体DNA为模板进行PCR(PCR:polymerase chain reaction;White,T.J.等.,Trends Genet.,5,18,5,1998)扩增,就可能获得各基因的片断。
以所得的肽酶基因为材料,构建包含因基因内部缺失不能产生正常功能的肽酶的改变型的基因(缺失型肽酶基因)的DNA。用这样的缺失型肽酶基因去置换染色体上的肽酶基因可通过如下的方式进行。即制备插入有温度敏感的复制起点、突变的肽酶基因、氨苄青霉素、卡那霉素、四环素、氯霉素等抗生素抗性的标记基因的重组DNA,用这样的重组DNA转化微生物,在使温度敏感的复制起点不起作用的温度下培养株转化子后,在含有抗生素的培养基上继续培养,就可以获得重组DNA交换染色体DNA的重组子。
所述染色体上整合有重组DNA菌株的正常肽酶基因被置换,由2个融合基因偶联的位于染色体上的肽酶基因和缺失型肽酶基因之间,包含有重组DNA的其它部分(载体部分、温度敏感的复制起点以及抗性标记基因)。然后,由于在这种状态下,正常的肽酶基因处于显性而在转化子里能表达。
此后,通过2个肽酶基因的重组使1个拷贝的肽酶、和载体部分(包括温度敏感的复制起点以及抗性标记基因)从染色体上脱落下来,由此在染色体上仅残留有缺失型肽酶基因。正常的肽酶基因留在染色体上、缺失型肽酶基因被切除的情况,反之,缺失型肽酶基因留在染色体上、正常的肽酶基因被切除的情况均可能发生。无论哪种情况,在温度敏感的复制起点有功能的温度下培养时,切除下来的DNA以质粒的形式保持在细胞内。在温度敏感的复制起点丧失功能的温度下培养时,在缺失型肽酶基因残留在染色体上,含有正常的肽酶基因的质粒从细胞内脱落的情况下,肽酶活性降低以至于消失。在正常型肽酶基因残留在染色体上的情况下,细胞显示有肽酶活性。从侯选菌株的染色体DNA中通过PCR扩增肽酶基因片断,利用限制性内切酶分析来确证肽酶基因是否为缺失,由此筛选目的菌株。
目标肽酶基因也可以通过Red-driven整合法(Proc.Natl.Acad.Sci.USA,2000,Vol 97(12):p6640-6645)缺失。即参考文献的方法,设计分别与肽酶基因以及模板质粒上的抗性标记基因附近区域互补的引物。比如,肽酶基因以及模板质粒上的氯霉素抗性基因的各相临区域,分别使用互补的引物,以质粒pACYC184(NBL Gene SciencesLtd,英国产。GenBank/EMBL索引号X06403)为模板进行PCR。制备在缺失的肽酶基因内部插入有氯霉素抗性基因的基因。得到的PCR产物用琼脂糖凝胶纯化。电穿孔转化包含具有复制温度敏感特性的质粒pKD46的大肠杆菌。质粒pKD46(Proc.Natl.Acad.Sci.USA,2000,Vol 97(12):p6640-6645)含有阿拉伯糖诱导的受ParaB启动子调控的λRed同源重组系统的基因(λ、β、exo基因)、即含有2154碱基长度的λ噬菌体DNA片断(GenBank/EMBL索引号J02459,第31088~第33241)。质粒pKD46是PCR产物重组到大肠杆菌染色体中所必需的。
电转化用的感受态细胞按如下方法制备。大肠杆菌在含有100mg/氨苄青霉素的LB培养基中30℃培养过夜。用5ml含有氨苄青霉素和L-阿拉伯糖(1mM)的SOB(分子克隆,第2版,Sambrook等,冷泉港出版社(1989))培养基100倍稀释。所得稀释物在30℃无通气培养至OD600约0.6后,浓缩100倍,用冰冷的去离子水洗涤3次就可以用于电转化。用70μL感受态细胞和约100ng PCR产物进行电转化。在含氯霉素的L-琼脂培养基平板上,37℃培养后选择氯霉素抗性的转化子。通过插入-缺失突变可获得肽酶基因缺失突变株。随后,在含氯霉素的L-琼脂培养基平板上,在42℃培养2代后,选择氨苄青霉素抗性丢失的菌落就是消除了质粒pKD46的菌落。
这样得到根据氯霉素抗性基因识别的肽酶缺失突变株。通过对侯选菌株的染色体DNA进行PCR,扩增含肽酶基因的片断,再通过限制性内切酶分析来确证肽酶基因是否为缺失型,由此确认目的菌株。通过上述方法可以构建基因破坏株。
本发明的另一优选实施方案可以获得,利用含有编码具有肽合成活性的蛋白的多核苷酸的重组DNA分子转化通过上述方法构建的基因破坏株所得的重组微生物。更为优选的实施方案是具有肽合成活性的蛋白是来源于短稳杆菌属和鞘氨醇杆菌属的细菌的蛋白质。具体而言,优选使用选至下述(A)~(D)蛋白的1种或2种以上。下述(A)~(D)蛋白有优良的肽合成活性。并且下述(A)~(D)蛋白适宜合成天冬氨酰苯基丙氨酸、丙氨酰谷氨酰胺等肽。
(A)具有SEQ ID NO 14所示氨基酸序列中第23~616位的氨基酸残基的氨基酸序列的蛋白质。
(B)包含在具有SEQ ID NO 14所示的氨基酸序列中23~616位氨基酸残基中的序列中一个或几个氨基酸发生取代、缺失、插入、附加、和/或倒位的氨基酸序列,且具有肽合成活性的蛋白质。
(C)具有SEQ ID NO 20所示的氨基酸序列中第21~619位的氨基酸残基的氨基酸序列的蛋白质。
(D)包含在具有SEQ ID NO 20所示的氨基酸序列中21~616位氨基酸残基中的序列中一个或几个氨基酸发生取代、缺失、插入、附加、和/或倒位的氨基酸序列,且具有肽合成活性的蛋白质。
SEQ ID NO 14记载的氨基酸全序列包含前导肽和成熟蛋白区域。1~22位氨基酸是前导肽,23~616位是成熟蛋白区域。
SEQ ID NO 20记载的氨基酸全序列包含前导肽和成熟蛋白区域。第1~20位氨基酸是前导肽,21~619位是成熟蛋白区域。
这里,“几个”氨基酸残基,在蛋白质的立体构造中,其位置和种类各不相同。这些氨基酸残基位于对蛋白质的立体构造中与活性没有大的损伤的范围内。具体说来,是2~50个,优选2~30个,更优选2~10个。但是,在(B)和(D)所述蛋白的氨基酸序列包含一个或几个氨基酸被取代、缺失、插入、附加、和/或倒位的氨基酸序列情况下,希望在50℃、pH8条件下,具有非突变的蛋白质的一半以上、优选80%以上、更优选90%以上的酶活性。以(B)情况为例来说明,(B)含序列表SEQ ID NO 6的氨基酸序列中一个或几个氨基酸被取代、缺失、插入、附加、和/或倒位的氨基酸序列情况下,在50℃、pH8条件下,期望具有序列表SEQ ID NO 6的氨基酸序列的蛋白质的一半以上、优选80%以上、更优选90%以上的酶活性。
上述(B)所示氨基酸变异、是通过如位点特异性诱变法使该酶基因的特定部位的氨基酸被取代、缺失、插入、附加使氨基酸序列发生改变所得的。并且,上述含有改变的碱基序列多聚核苷酸以前也可以由诱变处理得到。诱变处理方法,例如用羟胺等对编码(A)以及(C)的DNA进行体外处理的方法,以及对带有(A)以及(C)的埃希氏菌属细菌用紫外线或亚硝基呱及亚硝酸等常用人工诱变的诱变剂处理。
上述碱基发生取代、缺失、插入、附加、和/或倒位时,由于微生物的种以及菌株的差异,也包含有自发的突变。含有上述突变的DNA在适当的细胞里表达来研究表达产物的活性时,可以得到和编码序列表中SEQ ID NO 14以及SEQ ID NO 20的蛋白质基本上同一的蛋白质的DNA。
上述(A)蛋白质含有氨基酸序列,例如可以是由序列SEQ ID NO13所示的碱基序列编码的。SEQ ID NO 13中第61~1908位的碱基序列组成的DNA是从短稳杆菌(Empedobacter brevis)FERM BP-8113株(保藏单位:独立行政法人产业技术综合研究所,国际专利微生物保藏中心,保藏单位地址:日本茨城县筑波市东1-1-1,中央第6,国际保藏移管日,2002年7月8日)分离来的。
SEQ ID NO 13中第61~1908位碱基序列组成的DNA是编码序列部分(CDS)。碱基编号61~1908的碱基序列包括信号肽序列部分和成熟蛋白质序列部分。碱基编号61~126的碱基序列是信号肽序列部分,碱基编号127~1908的碱基序列是成熟蛋白质序列部分。即,本发明提供带有信号肽的肽酶蛋白质基因和作为成熟蛋白质的肽酶蛋白质基因。SEQ ID NO 13中记载的序列包括信号序列属于前导序列类。推定前导序列编码的前导肽的主要功能与从细胞内向细胞外分泌相关。碱基编号127~1908编码的蛋白质、即除了前导肽外的其余部分是成熟蛋白质,推定其显示高的肽合成活性。
上述(C)蛋白质含有氨基酸序列,例如可以是由序列SEQ ID NO19的碱基序列编码的。SEQ ID NO 19中第61~1917位的碱基序列是从鞘氨醇杆菌(Sphingobacterium sp)FERM BP-8124株(保藏单位:独立行政法人产业技术综合研究所,国际专利微生物保藏中心,保藏单位地址:日本茨城县筑波市东1-1-1,中央第6,国际保藏移管日,2002年7月22日)分离来的。SEQ ID NO 11中第61~1917位的碱基序列是编码序列部分(CDS)。
第61~1917位的碱基序列包括信号肽序列部分和成熟蛋白质序列部分。碱基编号61~120的碱基序列是信号肽序列部分,碱基编号127~1917的碱基序列是成熟蛋白质序列部分。即,本发明提供带有信号肽的肽酶蛋白质基因和作为成熟蛋白质的肽酶蛋白质基因。SEQ IDNO 19中记载的序列包括信号序列属于前导序列类。推定前导序列编码的前导肽的主要功能与从细胞内向细胞外分泌相关。碱基编号127~1917编码的蛋白质、即除了前导肽外的其余部分是成熟蛋白质,推定其显示高的肽合成活性。
SEQ ID NO 13和SEQ ID NO 19的DNA序列是分别从短稳杆菌和鞘氨醇杆菌的染色体DNA中或DNA文库中通过PCR(polymerase chainreaction;White,T.J.等.,Trends Genet.,5,18,5,1998)或杂交获得的。PCR使用的引物,可以根据例如基于提纯的有肽酶活性的蛋白质的已被测定的内部氨基酸序列来设计的。可以根据SEQ ID NO13和SEQ ID NO 19的DNA序列来设计引物和杂交用的探针,也可以使用探针分离上述DNA序列。作为PCR用的引物,可以含有对应于5’非翻译区域和3’非翻译区域的序列的引物扩增本蛋白的全长编码区域。例如扩增SEQ ID NO 13记载的编码包括前导肽序列和成熟蛋白质区域的情况下,作为5’引物,可以是具有SEQ ID NO 13中第61位碱基上游区域中的序列的引物,作为3’引物,例如可以是具有与第1908位下游区域的碱基互补序列的引物。
引物合成采用Applied Biosystems公司的380B型DNA合成仪,用ホスホアミダイト法(参考Tetrahedron Letters(1981),22,1859)来合成。PCR反应使用Gene Amp PCR System 9600(PERKIN ELMER公司产)及TaKaRa LA PCR体外克隆试剂盒(宝酒造公司产),实验按照生产厂商设定的方法进行。
此外,SEQ ID NO 13所示的DNA碱基序列中,无论其是否含有前导肽均含有与序列表中SEQ ID NO 13所述CDS的DNA基本上同一的DNA。和SEQ ID NO 13所述CDS的DNA基本上同一的DNA可以通过下述方式获得,即从含有突变的编码该酶的DNA或含有该突变DNA的细胞中,分离可与由含SEQ ID NO 13所示的CDS互补的碱基序列或由该碱基序列制备的探针在严紧条件下杂交,且编码具有肽酶合成活性的蛋白质的DNA。
此外,SEQ ID NO 19所示的DNA碱基序列中,无论其是否含有前导肽均含有与序列表中SEQ ID NO 19所述CDS的DNA基本上同一的DNA。和SEQ ID NO 19所述CDS的DNA基本上同一的DNA可以通过下述方式获得,即从含有突变的编码该酶的DNA或含有该突变DNA的细胞中,分离可与由含SEQ ID NO 19所示的CDS互补的碱基序列或由该碱基序列制备的探针在严紧条件下杂交,且编码具有肽酶合成活性的蛋白质的DNA。
例如根据SEQ ID NO 19的DNA碱基序列按常规方法制备探针。用探针钓能和该探针杂交的DNA,以及靶DNA的分离方法都可以按照常规的方法进行。关于DNA探针的制备可以通过如下方式进行,例如扩增克隆于质粒、噬菌体载体的碱基序列,再用限制性内切酶切出用作探针的碱基序列。酶切位点根据目的DNA进行调整。
严谨条件即所谓可以形成特异性杂交,而不形成非特异性杂交的条件。该条件很难明确的数值化。举例来说,同源性高的DNA之间,比如50%以上、优选80%以上、更优选90%以上同源性的DNA之间杂交、同源性低的DNA之间不杂交的条件。或使用通常Southern杂交的洗涤条件60℃、1XSSC、0.1%SDS,优选0.1XSSC、0.1%SDS条件下的盐浓度。在该条件下杂交的基因中包括基因内有终止密码、活性中心发生突变而丧失活性的基因,但使用市售的表达载体和适当的表达宿主,用后述方法测定表达产物的酶活性可容易地将其排除。
但是,上述严紧条件下可杂交的碱基序列中,期望在50℃、pH8条件下,上述碱基序列所编码的蛋白质具有相当于含有原碱基序列编码的氨基酸序列的蛋白质一半以上、优选80%以上、更优选90%以上的酶活性。例如,以含有可以和下述碱基序列在严谨条件下杂交的碱基序列为例进行说明,所述碱基序列是与序列表中SEQ ID NO 9所示DNA碱基序列中第127~1908位碱基序列互补的DNA碱基序列。即,在50℃、pH8条件下,保有含序列表中SEQ ID NO 6所示的氨基酸序列中第23~616位氨基酸序列的蛋白质大约一半以上、优选80%以上、更优选90%以上的酶活性。
下面以示例的方式说明能表达上述(A)以及(C)的蛋白质的微生物转化子的构建方法。对于能表达上述(A)以及(C)的蛋白质的转化子,可以将含有SEQ ID NO 13或SEQ ID NO 19的DNA碱基序列,导入适当的宿主,通过表达生成有肽酶活性的蛋白质。
使含有SEQ ID NO 13或SEQ ID NO 19的DNA碱基序列编码的蛋白质表达的适宜宿主可以是例如大肠杆菌等埃希氏菌属的细菌,稳杆菌属,鞘氨醇杆菌属(Sphingobacterium),以及黄杆菌属(Flavobacterium)以及枯草芽孢杆菌(Bacillus subtilis)等原核细胞、酿酒酵母(Saccharomyces cerevisiae)、毕赤氏酵母(Pichiastipitis)、米曲霉(Aspergillus oryzae)等真核细胞。
通过将DNA以其可表达的形式插入到根据用于表达宿主种类所选择的载体中制备用于将含有SEQ ID NO 13或SEQ ID NO 19碱基序列的DNA导入宿主的重组DNA。作为使蛋白表达的启动子,可以使用短稳杆菌所固有的肽酶合成基因的启动子,只要其能在宿主细胞中行使功能即可。此外,根据需要也可以将在宿主中有功能的其它启动子连接到SEQ ID NO 13或SEQ ID NO 19的DNA上,控制所述DNA的表达。
将重组DNA导入宿主细胞的转化方法采用D.M.Morrison(酶学方法68,326(1979))用氯化钙处理受体菌提高DNA通透性的方法(Mandel,M.and Higa,A.,J.M1.Biol.,53,159(1970))。
应用重组DNA技术来大量生产蛋白时,该蛋白会在生产该蛋白的转化子里聚集,形成蛋白质包涵体也可以作为优选实施方案。该表达方法在生产上的有利点是可保护靶蛋白存在于菌体里不被蛋白酶消化以及可以通过菌体破碎和后继的离心分离操作而简单的纯化靶蛋白。
蛋白质包涵体可用蛋白质变性剂溶解、再通过去除主要的蛋白质变性剂的蛋白复性处理,可变换成正确折叠的有生理活性的蛋白。例如,参见白介素-2的复性(特开昭61-257931)等。
蛋白质包涵体转变成有活性的蛋白必须经过可溶化、复性等一系列必要步骤、比直接生产有活性的蛋白的操作烦杂。但是,当需要在菌体内大量合成影响菌体生长的蛋白时,使所述蛋白在菌体内以非活性的包涵体的形式积累可以抑制这种的影响。
作为大量生产靶蛋白质包涵体的方法,已知除了有在强启动子控制下,单独表达靶蛋白质的方法外、还有与已知可以大量表达的蛋白质形成融合蛋白的表达方法。
下面以制备经转化的大肠杆菌,随后使用该大肠杆菌制备肽合成酶的方法为例具体说明。以大肠杆菌等微生物来合成肽酶时,作为编码蛋白质的序列,可以结合编码包含前导肽的蛋白质前体的DNA,也可以只结合不包含前导肽的成熟蛋白质区域,所述表达方法可以根据制备条件、形态、使用条件等进行适宜的选择。
作为使编码有肽酶活性的蛋白的DNA表达的启动子,可以使用在大肠杆菌来合成异源蛋白质时通常使用的启动子,例如:T7启动子、lac启动子、trp启动子、trc启动子、tac启动子、λ噬菌体PR启动子、PL启动子等强启动子。此外,作为载体,可以使用pUC19、pUC18、pBR322、pHSG299、pHSG298、pHSG399、pHSG398、RSF1010、pMW119、pMW118、pMW219、pMW218等等。也可以使用其它的噬菌体DNA为载体。此外,也可以使用含有启动子和插入DNA序列的表达载体。
为了得到肽酶合成酶的融合蛋白包涵体,优选在肽酶合成酶基因的上游或下游连接其它蛋白质,优选编码亲水性的肽的基因,形成融合蛋白。最好是能增加融合蛋白的积累、在变性、复性步骤后能提高融合蛋白溶解性的编码其它蛋白的基因。例如,T7基因10、β-半乳糖苷酶基因、脱氢叶酸还原酶基因(dehydrofolate reductase)γ-干扰素基因、IL-2基因、凝乳酶原基因等。
上述基因和编码肽酶合成酶的基因连接时,为了使密码子阅读框一致,可以适当地选择的限制性内切酶的位点连接,或使用适当的序列合成DNA。
并且为了增加产量,优选在融合蛋白的下游连接使翻译终止的T7终止子、fd噬菌体终止子、T4终止子、四环素抗性基因终止子、大肠杆菌trpA基因终止子序列。
将编码有肽合成活性的蛋白以及编码具有肽合成活性的蛋白和其它蛋白的融合蛋白的基因导入大肠杆菌时所用的载体,优选所谓多拷贝型,含有来源于ColE1复制起点的质粒。例如pUC和pBR322系列质粒及其衍生物。此处衍生物指实施了碱基的取代、缺失、插入、附加、和/或倒位等改变的质粒,这里的改变指经过诱变剂和紫外线诱变处理、也包含有自发突变。
为了筛选转化子,优选该载体上带有氨苄青霉素等抗性标记基因。市售的带有强启动子的表达载体有pUC系列(宝酒造(株)产)、pPROK(Clonetech产)、pKK233-2(Clonetech产)等。
编码含启动子和肽酶合成活性的蛋白以及编码有肽酶合成活性的蛋白和其它蛋白的融合蛋白的基因,根据不同情况还可以制备在载体上依次连接有终止子的重组DNA。
用该重组DNA转化大肠杆菌,培养大肠杆菌可表达肽合成酶以及有肽酶合成活性的蛋白和其它蛋白的融合蛋白。转化的宿主菌株可以使用通常用于表达异源基因的菌株,优选大肠杆菌K12亚种JM109。转化方法以及转化子的筛选方法参见分子克隆,第2版,冷泉港出版社(1989)。
表达融合蛋白时,优选血液凝固因子Xa、激肽释放酶等肽合成酶序列内不存在的序列作为识别序列的限制蛋白酶来切除出肽合成酶。
生产用的培养基使用培养大肠杆菌常用的M9-酪蛋白氨基酸培养基、LB培养基。根据使用的载体的标记基因、启动子、宿主菌种类对应选择合适的培养条件、生产的诱导条件。
用以下方法回收肽合成酶以及有肽酶合成活性的蛋白和其它蛋白的融合蛋白。肽合成酶以及有肽酶合成活性的蛋白和其它蛋白的融合蛋白能溶解在菌体中时,可在回收菌体后,破碎或溶菌后,使用所制备的粗酶液。如果必要,也可能使用常规的沉淀、过滤、柱层析来纯化肽合成酶以及有肽酶合成活性的蛋白和其它蛋白的融合蛋白。这些情况下可利用肽合成酶以及有肽酶合成活性的蛋白和其它蛋白的融合蛋白的抗体。
蛋白形成包涵体的情况用变性剂使其溶解。菌体蛋白也随之溶解,考虑到后续纯化,优选分离出包涵体后再使其溶解。从菌体中回收包涵体的方法可以采用熟知的方法,例如,破碎菌体离心分离回收包涵体。蛋白包涵体溶解变性试剂,例如胍基盐酸(6M,pH5~8)尿素(8M)。
透析去除变性剂可再生出有活性的蛋白质。作为透析用的透析液,可以使用Tris盐酸缓冲液或磷酸缓冲液等,浓度例如为20mM~0.5M,pH例如为5~8。
复性步骤的蛋白浓度优选在500μg/ml或以下。为了抑制复性后的肽合成酶蛋白自交联,透析温度优选5℃或以下。作为去除变性剂的方法除透析法之外,还可以使用稀释法、超滤法等任何可以使活性再生的方法。
按上述转化方法转化pepD基因、pepA基因、iadA基因、pepE基因被破坏的微生物,可构建氨基酸酯转肽酶高表达、丙氨酰谷氨酰胺和天冬氨酰苯基丙氨酸分解活性降低以至消失的微生物。
2.本发明的肽合成方法
本发明的肽合成方法是利用上述的微生物等来合成肽。该方法包括在培养基中培养被含有编码具有肽合成活性的蛋白的多核苷酸的重组DNA转化的微生物,,所述微生物染色体上选自编码氨酰基组氨酸二肽酶的基因、编码亮氨酰氨肽酶的基因、编码异天冬氨酰氨肽酶的基因中的一种或两种以上的基因被破坏,将所培养的微生物和所述微生物的细胞破碎物中的至少一种与羧基组分和胺组分混合来合成肽。更优选的实施方式中,所述微生物是染色体上编码α-天冬氨酰二肽酶的基因被破坏的微生物。
作为本发明使用的微生物作用于羧基组分和胺组分的方法,是把上述的微生物或微生物的细胞破碎物和羧基组分和胺组分混合。具体而言,可以是把所指定的微生物添加到含有羧基组分和胺组分的混合溶液中使之反应的方法。也可以是培养具有合成目的肽能力的微生物、微生物以及微生物的培养液中合成、积累该酶、向培养液中添加羧基组分和胺组分的方法。合成的肽,按常规方法回收,根据需要进行纯化。
本发明所述微生物破碎物指微生物的细胞膜被破坏后得到的微生物的细胞内容物的混合物、除通过物理方法破坏细胞膜所得的物质之外,也可以含有用化学方法溶解细胞膜后所得的物质。
所用的微生物指本发明中所述基因被破坏后的微生物。用于肽合成的微生物,不仅限于微生物菌体,也可使用丙酮处理后的菌体、冷冻干燥菌体等菌体处理物。亦可使用经共价结合法、吸附法、包埋法等固定化的菌体及固定化菌体处理物。此外,经常存在与肽合成无关的,可分解所生成的肽的酶,此时优选添加EDTA等金属蛋白酶抑制剂。添加量在0.1mM至300mM的范围,优选1mM到100mM。
作为羧基组分可以是任一一种能和作为另一种底物的胺组分缩合成肽的物质。作为羧基组分可以是L-氨基酸酯、D-氨基酸酯、L-氨基酸酰胺、D-氨基酸酰胺以及没有氨基的有机酸酯。并且,氨基酸酯不仅仅局限于天然氨基酸对应的氨基酸酯,也可以是例如相应于非天然氨基酸及其衍生物的氨基酸酯。作为氨基酸酯、除α-氨基酸酯外,因氨基酸基团位置的不同也可以是例如β-氨基酸酯、γ-氨基酸酯、ω-氨基酸酯。代表性的氨基酸酯是:氨基酸的甲酯、乙酯、正丙酯、异丙酯、正丁酯、异丁酯、叔丁酯。
作为胺组分可以是能和作为另一种底物的羧基组分缩合成肽的任一物质。作为胺可以是例如L-氨基酸、C保护L-氨基酸、D-氨基酸、C保护D-氨基酸、胺。并且,胺不仅仅局限于天然胺,也可以是例如非天然胺及其衍生物。氨基酸也不仅仅局限于天然氨基酸,也可以是例如非天然氨基酸及其衍生物。除α-氨基酸外,因氨基位置的不同也可以是例如β-、γ-、ω-氨基酸等。
起始原料的羧基组分和胺组分分别在1mM~10M的范围,优选0.05M~2M。有时候最好添加与羧基组分等量以上的胺组分。并且,在高浓度基质对反应有抑制作用时,按对反应无抑制的浓度逐渐添加。
肽合成的可能温度是0~60℃,优选5~40℃。肽合成的可能pH是6.5~10.5,优选pH是7.0~10.0。
实施例
以下说明本方法的实施例,但本发明不仅限于此实施例。
实施例1各肽酶基因缺失菌株的天冬氨酰苯基丙氨酸分解活性的测定
以下显示的操作中大肠杆菌ATCC8739作为亲株,该亲株的氨酰基组氨酸二肽酶(pepD)、异天冬氨酰二肽酶(idaA)、α-天冬氨酰二肽酶基因(pepE基因)、亮氨酰氨肽酶(pepA)被依次中断,构建pepD基因缺失菌株、pepD iadA双重缺失菌株,pepD iadA pepE三重缺失菌株、pepD iadA pepE pepA四重缺失菌株后测定了其天冬氨酰苯基丙氨酸分解活性。
(1)氨酰基组氨酸二肽酶基因的(pepD基因)缺失
基于在碱基序列数据库(DDBJ/EMBL/GeneBank登陆的索引号分别是AE000132)里pepD基因的序列信息合成引物
5’-GATCTGGCGCACTAAAAACC(序列号1)
5’-GGGATGGCTTTTATCGAAGG(序列号2)
利用该引物以大肠杆菌ATCC8739的染色体DNA为模板,PCR(94℃,1min、54℃,2min、72℃,3min、30个循环)扩增SD-ATG和翻译终止密码间覆盖的1.6Kbp基因区域。PCR产物用SureCloneLIgation Kit(Amersham Pharmacia Biotech)试剂盒连接到pUC18(宝酒造)载体的SmaI位点,构建了pUC18-pepD。该质粒转化大肠杆菌JM109(宝酒造)感受态细胞后,在含有50μg/ml氨苄青霉素的LB琼脂平板(胰蛋白胨1%、酵母提取物0.5%、氯化钠0.5%、琼脂1.5%、pH7.0)培养。转化子在含50μg/ml氨苄青霉素的LB液体培养基(胰蛋白胨1%、酵母提取物0.5%、氯化钠0.5%、琼脂1.5%)37℃培养16小时、收集菌体从转化子中制备质粒。pUC18-pepD用NruI和HpaI(含有pepD基因的1.6Kbp插入片断中的限制酶切位点)双酶切后自连接。该连接混合物转化大肠杆菌JM109感受态细胞后,从含有50μg/ml氨苄青霉素的LB琼脂平板上培养出的转化子制备质粒。这样选择的含有1.4Kbp插入片断的质粒DNA为pUCΔpepD。该质粒DNA上连接的pepD基因缺失了NruI-HpaI区域,推测其编码的酶没有功能。
pUCΔpepD用EcoRI-SalI双酶切,制备含缺失型pepD基因的1.4Kbp DNA片断。该DNA片断和含有温度敏感复制起点(tsori)的同源交换载体pMAN997的EcoRI-SalI位点连接、构建了用于缺失pepD基因的pMANΔpepD。pMANΔpepD转化大肠杆菌K12亚种JM109感受态细胞后,在含50μg/ml氨苄青霉素的LB液体培养基37℃培养16小时、收集菌体从转化子里制备pMANΔpepD。
用于pepD基因缺失的质粒pMANΔpepD电转化大肠杆菌ATCC8739后,涂布于含有50μg/ml氨苄青霉素的LB琼脂平板、30℃培养。(ATCC编号记载的菌株为美国标准培养物保藏中心,P.O.Box 1549 Manassas,VA 20110,USA)保藏,根据保藏编号分发的菌株)取若干转化子于含50μg/ml氨苄青霉素的4ml(直径1.4cm×18cm试管)LB液体培养基30℃培养16小时。该培养物用生理盐水稀释后,涂布于含有50μg/ml氨苄青霉素的LB琼脂平板、42℃培养10小时后,得单菌落。所得单菌落依照上述方法培养后再分离单菌落,筛选整个质粒经同源重组入染色体的克隆。在含50μg/ml氨苄青霉素的LB培养基中培养重组交换株后抽提质粒,以确证该菌株的细胞质液中无质粒。
选取上述整个质粒经同源重组入染色体的克隆中的10个,在M9基本液体培养基(4ml、1L包含磷酸氢二钠6.8g,磷酸二氢钾3g,氯化钠0.5g,氯化铵1g,七水硫酸镁0.5g,二水氯化钙15mg,ThiaminHCl 2mg,葡萄糖0.2g,pH7.0)中30℃培养24小时。取该培养物100μl接种于4ml同样培养基,42℃继续培养24小时。该培养物用生理盐水稀释后,涂布于M9琼脂平板,42℃继续培养12小时得单菌落。所得单菌落分别接种LB琼脂平板和含有50μg/ml氨苄青霉素的LB琼脂平板,30℃培养12小时。筛选发生双交换后的,仅仅在LB琼脂平板生长的氨苄青霉素敏感的交换株。以双交换株染色体为模板,用SEQ ID NO 1和SEQ ID NO 2的引物PCR扩增pepD片断。扩增出的pepD片断为缺失了NruI-HpaI区域的缺失型pepD基因(约1.4kb)。确证该菌株pepD基因被缺失型pepD基因置换而获得了pepD基因的缺失菌株。
(2)获取异天冬氨酰二肽酶(iadA)基因缺失突变株
基于在碱基序列数据库(DDBJ/EMBL/GeneBank登陆的索引号分别是AE000503)中iadA基因的序列信息合成引物
5’-CAAGGAGTTCCATGATTGA(序列号3)
5’-AACCGTTTAAGCCGTTTCAA(序列号4)
利用该引物以大肠杆菌ATCC8739的染色体DNA为模板,PCR(94℃,1min、54℃,2min、72℃,3min、30个循环)扩增SD-ATG和翻译终止密码间覆盖的1.7Kbp基因区域。PCR产物用SureCloneLigation Kit(Amersham Pharmacia Biotech)试剂盒连接到pUC18载体的SmaI位点,构建了pUC18-iadA。该质粒转化大肠杆菌JM109感受态细胞后,转化子在含50μg/ml氨苄青霉素的LB液体培养基中37℃培养16小时、收集菌体从转化子里制备质粒。pUC18-iadA用HpaI酶切(含iadA基因的1.7Kbp插入片断中的限制内切酶位点)后和EcoRI-NotI-BamHI接头连接。得到的质粒再用NotI酶切后自连接。该连接混合物转化大肠杆菌JM109感受态细胞后,从含有50μg/ml氨苄青霉素的LB琼脂平板上培养出的转化子制备质粒。这样筛选的能被NotI切断的质粒DNA就是pUCΔiadA。该质粒DNA含有的iadA基因从HpaI位点开始发生移码突变,推测其编码的酶没有功能。
pUCΔiadA用EcoRI-SalI双酶切,制备含缺失型iadA基因的1.7Kbp DNA片断。该DNA片断和含有温度敏感复制起点(tsori)的同源交换载体pMAN997的EcoRI/SalI位点连接、构建了用于缺失iadA基因的pMANΔiadA。pMANΔiadA转化大肠杆菌JM109感受态细胞后,在含50μg/ml氨苄青霉素的LB液体培养基中37℃培养16小时、收集菌体从转化子里制备pMANΔiadA。
用于iadA基因缺失的质粒pMANΔiadA电转化上述大肠杆菌ATCC8739 pepD缺失突变株。继续按同样操作,用缺失型iadA基因置换iadA基因得到氨苄青霉素敏感的双交换株。以双交换株染色体为模板,用SEQ ID NO 3和SEQ ID NO 4的引物PCR扩增iadA片断。扩增出的iadA片断能被NotI切断,确证该菌株iadA基因被缺失型iadA基因置换而获得了pepD iadA基因的双重缺失菌株。
(3)获取α-天冬氨酰二肽酶基因(pepE基因)缺失突变株
基于在碱基序列数据库(DDBJ/EMBL/GeneBank登陆的索引号分别是AE000475)里pepE基因的序列信息合成引物
5’-TATTTGTTATTTCCATTGGC(序列号5)
5’-AATGTCGCTCAACCTTGAAC(序列号6)
使用该引物以大肠杆菌ATCC8739的染色体DNA为模板,PCR(94℃,1min、54℃,2min、72℃,3min、30个循环)扩增SD-ATG和翻译终止密码间覆盖的1.4Kbp基因区域。PCR产物用SureCloneLigation试剂盒连接到pUC18载体的SmaI位点,构建了pUC18-pepE。该质粒转化大肠杆菌JM109感受态细胞后,转化子在含50μg/ml氨苄青霉素的LB液体培养基37℃培养16小时、收集菌体从转化子里制备质粒。pUC18-pepE用NruI酶切(含pepE基因的1.4Kbp插入片断中的限制内切酶位点)后和EcoRI-NotI-BamHI接头连接。得到的质粒再用NotI酶切后自连接。该连接混合物转化大肠杆菌JM109感受态细胞后,从含有50μg/ml氨苄青霉素的LB琼脂平板上培养出的转化子制备质粒。这样筛选能被NotI切断的质粒DNA就是pUCΔpepE。该质粒DNA含有的pepE基因从NruI位点开始发生移码突变,推测其编码的酶没有功能。
pUCΔpepE用EcoRI-SalI双酶切,制备含缺失型pepE基因的1.4Kbp DNA片断。该DNA片断和含有温度敏感复制起点(tsori)的同源交换载体pMAN997的EcoRI-SalI位点连接、构建了用于缺失pepE基因的pMANΔpepE。pMANΔpepE转化大肠杆菌JM109感受态细胞后,在50μg/ml氨苄青霉素的LB液体培养基37℃培养16小时、收集菌体从转化子里制备pMANΔpepE。
用于pepE基因缺失的质粒pMANΔpepE电转化上述大肠杆菌ATCC8739 pepD iadA双重缺失突变株。继续按同样操作,用缺失型pepE基因置换pepE基因得到氨苄青霉素敏感的双交换株。以双交换株染色体为模板,用SEQ ID NO 5和SEQ ID NO 6的引物PCR扩增pepE片断。扩增出的pepE片断能被NotI切断,确证该菌株pepE基因被缺失型pepE基因置换而获得了pepD iadA pepE基因的三重缺失菌株。
(4)获取亮氨酰氨肽酶(pepA)缺失突变株
基于在碱基序列数据库(DDBJ/EMBL/GeneBank登陆的索引号分别是AE000496)里pepA基因的序列信息合成引物
5’-ACAGCGGACATGAGTTACGA(序列号7)
5’-CCCGCTAAATTATGCGGAAC(序列号8)
使用该引物以大肠杆菌ATCC8739的染色体DNA为模板,PCR(94℃,1min、54℃,2min、72℃,3min、30个循环)扩增SD-ATG和翻译终止密码间覆盖的1.9Kbp基因区域。PCR产物用SureCloneLigation试剂盒连接到pUC18载体的SmaI位点,构建了pUC18-pepA。该质粒转化大肠杆菌JM109感受态细胞后,转化子在含50μg/ml氨苄青霉素的LB液体培养基37℃培养16小时、收集菌体从转化子里制备质粒。pUC18-pepA用HpaI酶切(含pepA基因的1.9Kbp插入片断中的限制内切酶位点)后自连接。该连接混合物转化大肠杆菌JM109感受态细胞后,从含有50μg/ml氨苄青霉素的LB琼脂平板上培养出的转化子制备质粒。这样筛选出的能被HpaI切断的质粒DNA就是pUCΔpepA。该质粒DNA上连接的pepA基因缺失了HpaI-HpaI区域,推测其编码的酶没有功能。pUCΔpepA用SacI-SphI双酶切,制备含缺失型pepA基因的1.9Kbp DNA片断。该DNA片断和含有温度敏感复制起点(tsori)的同源交换载体pMAN997的SacI-SphI连接、构建了用于缺失pepA基因的pMANΔpepA。pMANΔpepA转化大肠杆菌JM109感受态细胞后,在含50μg/ml氨苄青霉素的LB液体培养基37℃培养16小时、收集菌体从转化子里制备pMANΔpepA。用于pepA基因缺失的质粒pMANΔpepA电转化上述大肠杆菌ATCC8739 pepD iadApepE三重缺失突变株。继续按同样操作,用缺失型pepE基因置换pepE基因得到氨苄青霉素敏感的双交换株。以双交换株染色体为模板,用SEQ ID NO 7和SEQ ID NO 8的引物PCR扩增pepA片断。扩增出的pepA片断能被MulI切断生成849bp和1039bp的DNA片断,确证该×菌株pepA基因被缺失型pepA基因置换而获得了pepD iadA pepEpepA基因的四重缺失菌株。
实施例2各肽酶基因缺失菌株的天冬氨酰苯基丙氨酸分解活性的测定
亲本菌株和各基因缺失菌株分别接种4ml LB培养基,30℃、16小时振荡培养。把4ml培养物于2200×g15分钟离心分离得菌体沉淀。向该菌体沉淀添加4ml生理盐水,2200×g15分钟离心分离得洗净菌体。把洗净菌体悬浮于1ml超声波破碎溶液(含1mM DTT的20mMMOPS-KOH缓冲液(pH7.0))。菌体悬液经超声波破碎(Bioruptor产,7.5分钟)后,12000×g10分钟离心分离得无细胞抽提液。使用蛋白分析CBB溶液(ナカライテスク公司产),按Bradford法对蛋白质定量。使用Sigma公司的牛血清白蛋白作标准蛋白。
无细胞抽提液100μl添加底物溶液100μl(100mM天冬氨酰苯基丙氨酸、2mM MnCl2、100mM MOPS-KOH缓冲液,pH7.0)置30℃反应2小时。反应后的反应液置95℃热处理5分钟后,用蒸馏水稀释5倍、取反应稀释液10μl上氨基酸分析仪(日立产L-8500型)分析生成的天冬氨酸和苯基苯丙氨酸的含量。
亲本菌株和各基因缺失菌株天冬氨酰苯基丙氨酸分解活性如表1所示。1酶活单位定义为置30℃1分钟生成1摩尔Phe的酶量。从亲本菌株可检测出强的天冬氨酰苯基丙氨酸分解活性、各基因缺失菌株天冬氨酰苯基丙氨酸分解活性降低。pepD iadA pepE pepA基因的四重缺失菌株的天冬氨酰苯基丙氨酸分解活性低至亲本的1.6%。
表1菌株AP分解活性(mU/mg-蛋白)AP分解活性(相对活性:%)大肠杆菌ATCC8739(亲本)425.8 100pepD缺失菌株66.9 16pepD iadA双重缺失株32.4 7.6pepD iadA pepE三重缺失株15.2 3.6pepD iadA pepE pepA四重缺失株6.8 1.6
实施例3各肽酶基因缺失菌株的天冬氨酰苯基丙氨酸分解活性的测定
亲本菌株和各基因缺失菌株分别接种于3ml LB(Bacto公司胰蛋白胨1.0%、Bacto公司酵母提取物1.0%、氯化钠1.0%、pH7.0)培养基,置37℃、振荡培养16小时。取1ml培养物2200×g15分钟离心分离得菌体沉淀。向该菌体沉淀添加1ml生理盐水,2200×g15分钟离心分离得洗净菌体。向洗净菌体中添加底物溶液0.1ml(100mM丙氨酰谷氨酰胺、100mM硼酸-NaOH缓冲液,pH9.0)置30℃反应6小时。
反应液中的丙氨酰谷氨酰胺按下述条件用HPLC定量而求出丙氨酰谷氨酰胺的分解量。柱:Inertsil ODS-2(4.6×250mm,GL Science公司)。流动相:5mM钠1-辛基磺酸盐∶甲醇=10∶1.5(pH2.1浓缩的磷酸)
流速1.0/分钟,40℃,紫外检测波长210nm。
亲本菌株和各基因缺失菌株天冬氨酰苯基丙氨酸分解活性如下表所示。亲本菌株反应6小时能完全分解100mM的丙氨酰谷氨酰胺,pepD缺失突变株的丙氨酰谷氨酰胺分解活性很低。pepE、pepA突变株的丙氨酰谷氨酰胺分解活性更低。
表2菌株丙氨酰谷氨酰胺残留(mM)丙氨酰谷氨酰胺分解活性(相对活性:%)大肠杆菌JM109(亲本)0 100pepD缺失菌株71.2 28.8pepD pepE双重缺失株79.8 20.2pepD pepE pepA三重缺失株81.0 19.0
参考例1来源于短稳杆菌E的肽合成酶基因的分离
以下说明从短稳杆菌FERM BP-8113中分离肽合成酶基因。分离该基因用大肠杆菌JM109为宿主、pUC118为载体。
(1)基于内部氨基酸序列而制备PCR引物
基于来源于短稳杆菌FERM BP-8113的肽合成酶基因用肽酶消化后,经Edman降解法测定得到的氨基酸序列(序列号9及10),设计了含有序列号11及12分别所示碱基序列的混合引物。
(2)菌体制备
短稳杆菌FERM BP-8113在CM2G琼脂培养基上置30℃培养24小时。所得菌体接种一接种环入盛有50ml CM2G培养液(上述培养基不含琼脂)的500ml平口烧瓶、30℃振荡培养。
(3)从菌体制备染色体DNA
50ml培养液离心(12000rpm,4℃,15分钟)分离收集菌体。按QIAGEN Genomic-tip system说明书所示方法从该菌体制备染色体DNA。
(4)用PCR法来制备含有部分肽合成酶基因的DNA片断
使用宝酒造公司的LA-Taq酶来PCR扩增获得了含来源于短稳杆菌的部分肽合成酶基因。使用对应于制备的短稳杆菌的染色体DNA、含有序列号11和12所示碱基序列的引物进行PCR反应。
PCR反应使用宝酒造Takara PCR Thermal Cycler PERSONAL,按下述条件反应30个循环。
94℃ 30秒
52℃ 1分钟
72℃ 1分钟
反应完成后,取3μl PCR反应产物在0.8%琼脂糖电泳,证实扩增产物为1.5kb的DNA片断。
(5)从基因文库克隆肽合成酶基因
为获得全长的肽酶合成基因,使用上述PCR产物为探针来Southern杂交。Southern杂交步骤说明见分子克隆,第2版,冷泉港出版社(1989)。
上述PCR扩增的1.5kbDNA片断,经0.8%琼脂糖电泳分离,切出目的片断后提纯。该DNA片断按Boehringer公司DIG High Primer试剂盒说明书提示的方法作地高辛探针标记。
本参考例1(3)得到的短稳杆菌的染色体DNA用限制性内切酶HindIII在37℃16小时完全消化后,在0.8%琼脂糖电泳。电泳后琼脂糖凝胶印渍转移至尼龙膜上(正电荷尼龙膜,Roche Diagnostics产)、经碱变性、中和、固定化处理。杂交使用Boehringer-Mannheim公司的EASY HYB。尼龙膜先在50℃预杂交1小时。添加上述制备的地高辛标记的探针,50℃杂交16小时。然后,用含有0.1%SDS的2×SSC室温洗涤20分钟,优选用含有0.1%SDS的0.1×SSC 65℃15分钟洗涤2回。
探针和与之杂交的带的检测按Boehringer公司DIG NucleotideDetection检测试剂盒说明书提示的方法进行。检出了和探针杂交的4kb的带。
本参考例1(3)制备的染色体DNA 5μg用限制性内切酶HindIII完全消化后,经0.8%琼脂糖电泳分离约4kb的DNA片断后用フナコシ公司Gene Clean II试剂盒纯化后,溶解于10μl TE。取4μl和经HindIII/BAP处理过的pUC118混合,用宝酒造公司的DNALigation Kit Ver 2试剂盒连接。连接混合物5μl转化100μl大肠杆菌JM109感受态细胞(Toyobo产)。所得转化子涂布于适当固体培养基上构建染色体DNA文库。
为了获得全长的肽合成酶,用上述探针通过菌落杂交从染色体DNA文库中来筛选。菌落杂交依照分子克隆,第2版,冷泉港出版社(1989)的说明。
将染色体DNA文库的菌落转移到尼龙膜上(菌落和噬菌斑杂交用尼龙膜,Roche Diagnostics产)、经碱变性、中和、固定化处理。杂交使用Boehringer公司的EASY HYB。尼龙膜先在37℃预杂交1小时。添加上述制备的地高辛标记的探针,50℃杂交16小时。然后,用含有0.1%SDS的2XSSC室温洗涤20分钟,优选用含有0.1%SDS的0.1XSSC 65℃15分钟洗涤2回。
探针和于之杂交的菌落的检测按Boehringer公司DIGNucleotide Detection检测试剂盒说明书提示的方法进行。检出了和标记的探针杂交的2个菌落。
(6)来源于短稳杆菌的肽合成酶基因
从确证的和标记的探针杂交的2个菌落出发,从JM109宿主中使用Promega公司的Wizard Plus Minipreps DNA purification system试剂盒制备质粒、用于测定和探针杂交的临近的碱基序列。按贝克曼(Beckman-Coulter)公司CEQ DTCS-Quick Start试剂盒说明提示的方法进行测序反应。电泳使用贝克曼公司CEQ 2000-XL。
测序结果显示在编码含肽合成酶内部氨基酸序列(序列号9和10)的蛋白的寡核苷酸中存在开放阅读框,证实了存在编码肽合成酶的基因。肽合成酶的基因全长碱基序列和与其对应的氨基酸序列如序列号13所示。用BLASTP程序分析所得开放阅读框的同源型,发现和其它2个蛋白有同源性。即和巴氏醋杆菌(Acetobacterpasteurianus)的α-氨基酸酯水解酶(Appl.Environ.Microbiol.68(1),211-218(2002))的氨基酸序列34%同源。和Brebibacilluslac戊二酰-7ACA酰基转移酶(J.Bacteriol.173(24),7848-7855(1991))的氨基酸序列26%同源。
(7) 来源于短稳杆菌的肽合成酶基因在大肠杆菌中表达
大肠杆菌W3110染色体DNA上的trp调控元的启动子区域是用序列号15及16所示寡核苷酸作为引物经PCR扩增出的目的基因区域,所得DNA片断连接至Promega公司的载体pGEM-Teasy。该连接混合物转化大肠杆菌JM109。在氨苄青霉素抗性株中筛选trp启动子方向和lac启动子方向相反的质粒。用EcoO109I/EcoRI处理含有trp启动子的DNA片断后,将其与经EcoO109I/EcoRI处理过的pUC19(宝酒造)连接。该连接混合物转化大肠杆菌JM109,在氨苄青霉素抗性株中筛选含有目的质粒的克隆。目的质粒经HindIII/PvuII处理后所得的DNA片断和用HindIII/HincII处理pKK223-3(Amersham Pharmacia公司)所得的带有rrnB终止手DNA片断连接。该连接混合物转化大肠杆菌JM109,在氨苄青霉素抗性株中筛选含有目的质粒的克隆,该质粒命名为pTrpT。
以短稳杆菌FERM BP-8113的染色体DNA为模板,利用序列号17、18所示寡核苷酸作为引物经PCR扩增出目的基因区域。扩增片断经NdeI/PstI处理后所得的DNA片断与经NdeI/PstI处理的pTrpT连接。该连接混合物转化大肠杆菌JM109,在氨苄青霉素抗性株中筛选含有目的质粒的克隆,该质粒命名为pTrpT-Gtg2。
将带有pTrpT-Gtg2的大肠杆菌JM109在含有100μg/ml氨苄青霉素的LB培养基中于30℃下预培养24小时。接种1ml培养物至盛有50ml培养基(2g/l-葡萄糖,10g/l酵母提取物,10g/l酪蛋白氨基酸、5g/l硫酸氨、3g/l磷酸二氢钾、1g/l磷酸氢二钾、0.5g/l七水硫酸镁、100mg/l氨苄青霉素)的500ml平口烧瓶中、25℃、培养24小时。每1ml培养液含有0.11单位的α-L-天冬氨酰-L-苯基丙氨酸-β-甲酯生成活性,证实了克隆的基因在大肠杆菌里能表达。同时作为对照的含pTrpT的转化子无活性检出。
(信号序列预测)
用SignalP V1.1程序(Protein Engineering,vol12,no.1,pp.3-9,1999)分析序列号6的氨基酸序列。推测第1-22位氨基酸是有分泌到细胞周质功能的信号肽,成熟蛋白为23位氨基酸下游。
(分泌的证实)
将带有pTrpT-Gtg2的大肠杆菌JM109在含有100μg/ml氨苄青霉素的LB培养基中于30℃下预培养24小时。接种1ml培养物至盛有50ml培养基(2g/1-葡萄糖,10g/l酵母提取物,10g/l酪蛋白氨基酸、5g/l硫酸氨、3g/l磷酸二氢钾、1g/l磷酸氢二钾、0.5g/l七水硫酸镁、100mg/l氨苄青霉素)的500ml平口烧瓶中、25℃、培养24小时。
上述菌体培养物利用20g/dl的蔗糖溶液采用渗透压Shock法来分离成周质组分和胞质组分。20g/dl的蔗糖溶液浸润的菌体加入5mM硫酸镁溶液。该溶液离心后的上清为周质组分(Pe)。并且,该溶液离心后的沉淀再悬浮后,经超声波破碎后为胞质组分(Cy)。为了确证分离到了胞质组分,用已知存在于胞质中的葡萄糖-6磷酸脱氢酶作为指示存在胞质组分的指标。测定方法是在30℃时向1mM葡萄糖-6磷酸、0.4mM NADP 10mM MgSO4 50mM Tris-Cl(pH8)的反应液中添加适量酶,然后测定340nm的吸光度来测定NADPH的合成。
以另外制备的无细胞抽提液的活性为100%,测定周质组分和胞质组分的酶含量。周质组分中无葡萄糖-6磷酸脱氢酶酶活性表示周质组分中没有混入胞质组分。发现周质组分中存在60%的α-L-天冬氨酰-L-苯基丙氨酸-β-甲酯(α-AMP)生成活性。且用上述SignalPV1.1程序分析所用氨基酸序列来预测,α-AMP合成酶分泌到周质组分中。
参考例2来源于鞘氨醇杆菌的肽合成酶基因的分离
以下说明从鞘氨醇杆菌FERM BP-8124分离肽合成酶基因。分离该基因用大肠杆菌DH5α为宿主、pUC118为载体。
(1)菌体制备
鞘氨醇杆菌FERM BP-8124在CM2G(50g/1-葡萄糖,10g/l酵母提取物,10g/l蛋白胨、5g/l氯化钠、20g/l琼脂、pH7.0)琼脂培养基上25℃培养24小时。所得菌体接种一接种环入盛有50ml CM2G培养液的500ml平口烧瓶、25℃振荡培养。
(2)从菌体制备染色体DNA
50ml培养液离心(12000rpm,4℃,15分钟)分离收集菌体。按QIAGEN Genomic-tip system说明书所示方法从该菌体制备染色体DNA。
(3)用PCR法来制备含有部分肽合成酶基因的DNA片断。
使用宝酒造公司的LA-Taq酶来PCR扩增了来源于鞘氨醇杆菌FERM BP-8124的肽合成酶基因。使用对应于制备的鞘氨醇杆菌FERMBP-8124的染色体DNA,用含有序列号11和12所示碱基序列作为引物进行PCR反应。
PCR反应使用宝酒造Takara PCR Thermal Cycler PERSONAL,按下述条件反应30个循环。
94℃ 30秒
52℃ 1分钟
72℃ 1分钟
取3μl PCR反应产物在0.8%琼脂糖电泳,证实扩增产物为1.5kb的DNA片断。
(4)从基因文库克隆肽合成酶基因
为获得全长的肽酶合成基因,使用上述PCR产物为探针来Southern杂交。Southern杂交步骤说明见分子克隆,第2版,冷泉港出版社(1989)。
上述PCR扩增的1.5kbDNA片断,经0.8%琼脂糖电泳分离,切出目的片断后提纯。该DNA片断按Boehringer公司DIG High Primer试剂盒说明书提示的方法作地高辛探针标记。
本参考例2(2)得到的鞘氨醇杆菌的染色体DNA用限制性内切酶SacI在37℃16小时完全消化后,在0.8%琼脂糖电泳。电泳后琼脂糖凝胶印渍转移至尼龙膜上(正电荷尼龙膜,Roche产)、经碱变性、中和、固定化处理。杂交使用Boehringer公司的EASY HYB。尼龙膜先在37℃预杂交1小时。添加上述制备的地高辛标记的探针,37℃杂交16小时。然后,用含有0.1%SDS的1XSSC 60℃洗涤2回。
探针和与之杂交的带的检测按Boehringer公司DIG NucleotideDetection检测试剂盒说明书提示的方法进行。检出了和探针杂交的3kb的带。
本参考例2(2)制备的染色体DNA 5μg用限制性内切酶SacI完全消化后,经0.8%琼脂糖电泳分离约3kb的DNA片断后用フナコシ公司Gene Clean II试剂盒纯化,溶解于10μl TE。取4μl和经SacI37℃16小时完全消化、碱性磷酸化酶(E.coli C75)37℃、30分钟,50℃、30分钟处理过的pUC118混合,用宝酒造公司的DNA LigationKit Ver 2试剂盒连接。连接混合物5μl转化100μl大肠杆菌DH5α感受态细胞(东洋纺织产)。所得转化子涂布于适当固体培养基上构建染色体DNA文库。
为了获得全长的肽合成酶,用上述探针通过菌落杂交从染色体DNA文库中来筛选。菌落杂交依照分子克隆,第2版,冷泉港出版社(1989)的说明。
将染色体DNA文库的菌落转移到尼龙膜上(菌落和噬菌斑用尼龙膜,Roche产)、经碱变性、中和、固定化处理。杂交使用Boehringer公司的EASY HYB。尼龙膜先在37℃预杂交1小时。添加上述制备的地高辛标记的探针,37℃杂交16小时。然后,用含有0.1%SDS的1XSSC60℃洗膜2回。
探针和与之杂交的菌落的检测按Boehringer公司DIGNucleotide Detection检测试剂盒说明书提示的方法进行。检出了和标记的探针杂交的6个菌落。
(5)来源于鞘氨醇杆菌的肽合成酶基因的碱基序列
从与标记的探针杂交确证的6个菌落出发,从DH5α宿主中使用Promega公司的Wizard Plus Minipreps DNA purification system试剂盒制备质粒、用于测定和探针杂交的临近的碱基序列。按贝克曼公司CEQ DTCS-Quick Start试剂盒说明提示的方法进行测序反应。电泳使用贝克曼公司CEQ 2000-XL。
测序结果显示存在编码含肽合成酶的开放阅读框。来源于鞘氨醇杆菌的肽合成酶的基因全长碱基序列和与其对应的氨基酸序列如序列号19所示。用BLASTP程序分析,发现来源于鞘氨醇杆菌的肽合成酶的基因和来源于短稳杆菌的肽合成酶的基因的氨基酸序列有63.5%的同源性。
(6)来源于鞘氨醇杆菌的肽合成酶基因在大肠杆菌中表达
以鞘氨醇杆菌FERM BP-8124的染色体DNA为模板,序列号21、22所示寡核苷酸作为引物经PCR扩增出目的基因区域。NdeI/XbaI处理扩增所得的该片断所得后的DNA片断,其与经NdeI/XbaI处理后pTrpT连接。该连接混合物转化大肠杆菌JM109,在氨苄青霉素抗性株中筛选含有目的质粒的克隆,该质粒命名为pTrpT-Sm-aet。
在盛有3ml培养基(2g/1-葡萄糖,10g/l酵母提取物,10g/l酪蛋白氨基酸、5g/l硫酸氨、3g/l磷酸二氢钾、1g/l磷酸氢二钾、0.5g/l七水硫酸镁、100μg/ml氨苄青霉素)的普通试管中接种一环,25℃,20小时培养带有pTrpT-Sm-aet的大肠杆菌JM109。每1ml培养液含有0.53单位的α-AMP生成活性,证实了克隆的基因在大肠杆菌里能表达。同时作为对照的含pTrpT的转化子无活性检出。
(信号序列预测)
用SignalP V1.1程序(Protein Engineering,vol12,no.1,pp.3-9,1999)分析序列号20的氨基酸序列。推测氨基酸序列中第1-20位氨基酸是向周质中分泌功能的信号肽,成熟蛋白为21位氨基酸下游。
(信号序列的证实)
在盛有50ml培养基(2g/l-葡萄糖,10g/l酵母提取物,10g/l酪蛋白氨基酸、5g/l硫酸氨、3g/l磷酸二氢钾、1g/l磷酸氢二钾、0.5g/l七水硫酸镁、100mg/l氨苄青霉素)的普通试管中接种一环带有pTrpT-Sm-aet的大肠杆菌JM109、25℃、培养24小时。
下述离心以后的操作在冰上或4℃进行。培养完成后把培养液离心分离菌体,加100mM磷酸缓冲液(pH7)洗涤后,用同种缓冲液悬浮。195W、20分钟超声波破碎。超声波破碎物离心分离(12000rpm,30分钟)去处菌体碎片后得到可溶性部分。可溶性部分上样于经100mM磷酸缓冲液(pH7)预平衡过的CHT-II柱。以500mM磷酸缓冲液的线性浓度梯度洗脱出酶。活性部分(fraction)和5倍体积的2M硫酸氨、100mM磷酸缓冲液混合后,上样于经2M硫酸氨、100mM磷酸缓冲液预平衡过的Resource-PHE柱(Amersham公司)。经上述步骤纯化的肽合成酶可由电泳的单组分得到确证。
用Edman降解法测定上述肽合成酶的氨基酸序列为序列号15所示。用SignalP V1.1程序来预测,可确证成熟蛋白在21号氨基酸下游。
实施例4宿主中各肽酶基因缺失、含来源于Empedobaceraerogenes的氨基酸酯转移酶的高表达菌株来生成丙氨酰谷氨酰胺
把来源于短稳杆菌的氨基酸酯转移酶表达质粒pTrp-aet电转化入实例1中构建的大肠杆菌JM109 pepD pepE双缺陷菌株以及pepDpepE pepA三重缺陷菌株。在含氨苄青霉素100μ/ml的L-琼脂培养基上20℃培养48小时。取1/4平板的细胞接入50ml L-培养基(蛋白胨10g/l、酵母提取物5g/l、氯化钠10g/l)在22℃振荡摇床(140rpm)培养16小时。取3ml培养物(OD610=0.15,26倍稀释)接种300ml下述成分的培养基,于1升实验室用发酵罐、700rpm搅拌、通气(1/1vvm)批式培养。糖耗尽后的培养物15ml(OD610=0.60,51倍稀释)接种300ml相同组成的培养基,于同样发酵罐、通气(1/1vvm)、20℃补糖培养。使用氨气自动调节pH7.0。
培养基组成(g/L)
葡萄糖 25.0
MgSO4·7H2O 1.0
(NH4)2SO4 5.0
H3PO4 3.5
FeSO4 0.05
MnSO4·5H2O 0.05
Mameno(TN) 0.45
GD113 0.1
氨苄青霉素 0.1
葡萄糖和硫酸锰单独灭菌。其它组分用氢氧化钾调节pH至5.0。
补糖溶液的组成(g/L)
葡萄糖500.0
pH不调节
培养液2ml离心分离(2200Xg15min)后取菌体沉淀。向菌体沉淀中添加2ml生理盐水后,离心分离(2200Xg15min)后,得洗净菌体。向洗净菌体中添加10ml含有L-丙氨酸-0-甲酯氢氯化物100mM(14.0mg/ml)、L-Gln 200mM(14.0mg/ml)(0.2M)、硼酸-NaOH缓冲液(pH9.0)100mM的反应液进行丙氨酰谷氨酰胺合成反应。结果如图1。
反应的初速度几乎完全相同,使用大肠杆菌JM109菌株作为宿主菌株来进行。反应时间不长时生成的丙氨酰谷氨酰胺不会被分解。使用pepD pepE双重缺失株以及pepD pepE pepA三重缺失株可以延长反应时间同时可以抑制丙氨酰谷氨酰胺被分解。在实际的生产反应中,确立反应的终点而迅速终止反应很困难。依照此结果,值得期待的生产丙氨酰谷氨酰胺的宿主是pepD pepE双重缺失株以及pepD pepEpepA三重缺失株。
本发明对在工业上生产肽极其有用。
附图简述
图1显示丙氨酰谷氨酰胺的产量
【序列表】
SEQ ID NO 1 PCR引物
SEQ ID NO 2 PCR引物
SEQ ID NO 3 PCR引物
SEQ ID NO 4 PCR引物
SEQ ID NO 5 PCR引物
SEQ ID NO 6 PCR引物
SEQ ID NO 7 PCR引物
SEQ ID NO 8 PCR引物
SEQ ID NO 9来源于短稳杆菌的酶由Edman降解法确定的氨基酸序列
SEQ ID NO 10来源于短稳杆菌的酶由Edman降解法确定的氨基酸序列
SEQ ID NO 11混合引物
SEQ ID NO 12混合引物
SEQ ID NO 13来源于短稳杆菌的肽合成酶
SEQ ID NO 14来源于短稳杆菌的肽合成酶
SEQ ID NO 15制备pTrpT用的引物
SEQ ID NO 16制备pTrpT用的引物
SEQ ID NO 17制备pTrpT_Gtg2用的引物
SEQ ID NO 18制备pTrpT_Gtg2用的引物
SEQ ID NO 19来源于鞘氨醇杆菌的肽合成酶
SEQ ID NO 20来源于鞘氨醇杆菌的肽合成酶
SEQ ID NO 21制备pTrpT_Sm_aet用的引物
SEQ ID NO 22制备pTrpT_Sm_aet用的引物
序列表
<110>Ajinomoto Co.,Inc.
<120>突变微生物和利用该类微生物合成肽的方法
<130>PAMA-15895
<160>22
<170>PatentIn version 3.1
<210>1
<211>20
<212>DNA
<213>人工的
<150>
<151>Inventor:KIRA,Ikuo
Inventor:YOKOZEKI,Kenzo
Inventor:SUZUKI,Sonoko
Inventor:MIHARA,Yasuhiro
Inventor:HIRAO,Yoshinori
<220>
<223>PCR引物
<400>1
gatctggcgc actaaaaacc 20
<210>2
<211>20
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>2
gggatggctt ttatcgaagg 20
<210>3
<211>20
<212>DNA
<213>人工的
<220>
<223>PCR primer
<400>3
caaggagtta ccatgattga 20
<210>4
<211>20
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>4
aaccgtttaa gccgtttcaa 20
<210>5
<211>20
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>5
tatttgttat ttccattggc 20
<210>6
<211>20
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>6
aatgtcgctc aaccttgaac 20
<210>7
<211>20
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>7
acagcggaca tgagttacga 20
<210>8
<211>20
<212>DNA
<213>人工的
<220>
<223>PCR引物
<400>8
cccgctaaat tatgcggaac 20
<210>9
<211>9
<212>PRT
<213>短稳杆菌
<400>9
Leu Phe Thr Ala Ile Tyr Gln Pro Lys
1 5
<210>10
<211>9
<212>PRT
<213>短稳杆菌
<400>10
Thr Asn Val Thr Tyr Thr Met Pro Asp
1 5
<210>11
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:混合引物
<400>11
ttyacngcna thtaycarcc 20
<210>12
<211>23
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:混合引物
<400>12
tcnggcatng trtangtnac rtt 23
<210>13
<211>2024
<212>DNA
<213>短稳杆菌
<220>
<221>CDS
<222>(61)..(1908)
<223>编码肽形成酶的基因
<400>13
atttcttaat aaaaactgaa atcttaatac atttatacta tcgtaaaatt tattgaacac 60
gtg aaa aaa tta aca tta aaa gta act cta ctt aca ctt ttg ttg gga 108
Val Lys Lys Leu Thr Leu Lys Val Thr Leu Leu Thr Leu Leu Leu Gly
1 5 10 15
agt aca gtt gga ttt gcg caa gat gca aaa gca gat tct gct tat gtg 156
Ser Thr Val Gly Phe Ala Gln Asp Ala Lys Ala Asp Ser Ala Tyr Val
20 25 30
cgc gac aat tac gaa aaa ata gaa caa gta att ccg atg cgc gat ggt 204
Arg Asp Asn Tyr Glu Lys Ile Glu Gln Val Ile Pro Met Arg Asp Gly
35 40 45
aca aag tta ttt aca gct att tat cag cca aaa gat aaa aca aaa caa 252
Thr Lys Leu Phe Thr Ala Ile Tyr Gln Pro Lys Asp Lys Thr Lys Gln
50 55 60
tat ccc gtt ttg tta aat cgt acg cct tat aca gtt gcg cct tat ggt 300
Tyr Pro Val Leu Leu Asn Arg Thr Pro Tyr Thr Val Ala Pro Tyr Gly
65 70 75 80
gta aat gaa tac aag aaa tcg tta gga aat ttt cct aca gaa atg cgc 348
Val Asn Glu Tyr Lys Lys Ser Leu Gly Asn Phe Pro Thr Glu Met Arg
85 90 95
gaa ggt ttt att ttt gtt tac caa gat gtg aga gga aaa tgg atg agc 396
Glu Gly Phe Ile Phe Val Tyr Gln Asp Val Arg Gly Lys Trp Met Ser
100 105 110
gaa ggc gaa ttt gaa gat gtt cga cct ata aat cct tca aaa agt aaa 444
Glu Gly Glu Phe Glu Asp Val Arg Pro Ile Asn Pro Ser Lys Ser Lys
115 120 125
aag gca att gac gaa agc aca gat aca ttt gat acg cta gaa tgg ctt 492
Lys Ala Ile Asp Glu Ser Thr Asp Thr Phe Asp Thr Leu Glu Trp Leu
130 135 140
gct aaa aac ttg aag aat tac acg aaa aaa gct gga att tat gga att 540
Ala Lys Asn Leu Lys Asn Tyr Thr Lys Lys Ala Gly Ile Tyr Gly Ile
145 150 155 160
tcg tat cct ggt ttt tat tcg aca atg agt ttg gtt aat tcg cat cca 588
Ser Tyr Pro Gly Phe Tyr Ser Thr Met Ser Leu Val Asn Ser His Pro
165 170 175
act cta aaa gcc gtt tcg cca caa gcg ccc gtt acc aat tgg ttt tta 636
Thr Leu Lys Ala Val Ser Pro Gln Ala Pro Val Thr Asn Trp Phe Leu
180 185 190
ggt gac gat ttt cat cat aat gga gtt tta ttc ttg aat gat tct ttc 684
Gly Asp Asp Phe His His Asn Gly Val Leu Phe Leu Asn Asp Ser Phe
195 200 205
tca ttt atg act ttt ttt ggt gta aaa cgt ccg caa cca att acg cca 732
Ser Phe Met Thr Phe Phe Gly Val Lys Arg Pro Gln Pro Ile Thr Pro
210 215 220
gat aaa ggt ccg aaa cgt ttt gaa tat cca ata aaa gat aat tat aga 780
Asp Lys Gly Pro Lys Arg Phe Glu Tyr Pro Ile Lys Asp Asn Tyr Arg
225 230 235 240
ttt tat gca agt ggc tct gta aaa gag ttg aaa gat aaa tat ttg caa 828
Phe Tyr Ala Ser Gly Ser Val Lys Glu Leu Lys Asp Lys Tyr Leu Gln
245 250 255
gat aat atc aag ttt tac aat gat tta ttt gcg cat cca gat tac gat 876
Asp Asn Ile Lys Phe Tyr Asn Asp Leu Phe Ala His Pro Asp Tyr Asp
260 265 270
caa ttt tgg caa gat cgt aat gtt tta cca cat tta act aac gtg caa 924
Gln Phe Trp Gln Asp Arg Asn Val Leu Pro His Leu Thr Asn Val Gln
275 280 285
cct gct gta atg acg gtt gga ggt ttt ttt gat gca gaa gat gtc tac 972
Pro Ala Val Met Thr Val Gly Gly Phe Phe Asp Ala Glu Asp Val Tyr
290 295 300
ggc gct ttc gaa acg tat aaa gca att gag aaa caa aat ccg aaa gca 1020
Gly Ala Phe Glu Thr Tyr Lys Ala Ile Glu Lys Gln Asn Pro Lys Ala
305 310 315 320
aca aat att atg gtt gcc gga cct tgg ttt cat ggt ggt tgg gtt cgt 1068
Thr Asn Ile Met Val Ala Gly Pro Trp Phe His Gly Gly Trp Val Arg
325 330 335
agc aac gga agt act ttt gga gat atg caa ttt gca tcg aat aca agt 1116
Ser Asn Gly Ser Thr Phe Gly Asp Met Gln Phe Ala Ser Asn Thr Ser
340 345 350
gag cat tat cag caa gaa ata gaa ttg cct ttt ttt aat tat tac tta 1164
Glu His Tyr Gln Gln Glu Ile Glu Leu Pro Phe Phe Asn Tyr Tyr Leu
355 360 365
aaa gat aaa ggt aat ttt aaa cca acc gaa gct aca att ttt att acg 1212
Lys Asp Lys Gly Asn Phe Lys Pro Thr Glu Ala Thr Ile Phe Ile Thr
370 375 380
gga tct aac gaa tgg aaa caa ttt gat gct tgg cca cca aaa aat gta 1260
Gly Ser Asn Glu Trp Lys Gln Phe Asp Ala Trp Pro Pro Lys Asn Val
385 390 395 400
aca aca caa aaa att tat ttg caa caa aat ggt aaa ata gct ttt aat 1308
Thr Thr Gln Lys Ile Tyr Leu Gln Gln Asn Gly Lys Ile Ala Phe Asn
405 410 415
aaa acc aat aca aca act act ttt gac gaa tat gtt gca gat cca aat 1356
Lys Thr Asn Thr Thr Thr Thr Phe Asp Glu Tyr Val Ala Asp Pro Asn
420 425 430
tct cca gtt cct tat tca gga gga gtt tta gaa act cgt tca aga gaa 1404
Ser Pro Val Pro Tyr Ser Gly Gly Val Leu Glu Thr Arg Ser Arg Glu
435 440 445
tat atg gtc gat gat caa cgc ttt gct tct act cgt cct gat gtt atg 1452
Tyr Met Val Asp Asp Gln Arg Phe Ala Ser Thr Arg Pro Asp Val Met
450 455 460
gtg tat caa tct gat att ttg aca gaa gat att acg ctt gct ggt cct 1500
Val Tyr Gln Ser Asp Ile Leu Thr Glu Asp Ile Thr Leu Ala Gly Pro
465 470 475 480
gtt atc aat cat tta gtg gtt tct act acg gga aca gac gct gat tat 1548
Val Ile Asn His Leu Val Val Ser Thr Thr Gly Thr Asp Ala Asp Tyr
485 490 495
gtt gta aaa ttg att gat gtt tat cct gaa aac acg cca aaa ttt aat 1596
Val Val Lys Leu Ile Asp Val Tyr Pro Glu Asn Thr Pro Lys Phe Asn
500 505 510
aac aaa tta atg gct gga tat caa aat ttg att cgt gca gaa att atg 1644
Asn Lys Leu Met Ala Gly Tyr Gln Asn Leu Ile Arg Ala Glu Ile Met
515 520 525
cgc gga aaa tat aga aat agt ttc tct aac ccc gaa gct atg gtt ccg 1692
Arg Gly Lys Tyr Arg Asn Ser Phe Ser Asn Pro Glu Ala Met Val Pro
530 535 540
aat aaa gaa aca aat gta acg tac acg atg cca gat gtt gga cat aca 1740
Asn Lys Glu Thr Asn Val Thr Tyr Thr Met Pro Asp Val Gly His Thr
545 550 555 560
ttt aag aaa gga cat cgc att atg att caa gtt cag aac agt tgg ttt 1788
Phe Lys Lys Gly His Arg Ile Met Ile Gln Val Gln Asn Ser Trp Phe
565 570 575
cct tta gca gat cgc aat ccg caa caa ttt atg aat gtt tac gaa gca 1836
Pro Leu Ala Asp Arg Asn Pro Gln Gln Phe Met Asn Val Tyr Glu Ala
580 585 590
act tct aaa gat tat tta aaa caa acg caa cga att tat cat act tct 1884
Thr Ser Lys Asp Tyr Leu Lys Gln Thr Gln Arg Ile Tyr His Thr Ser
595 600 605
tat atc gaa att ccg gta ttg aaa taacaaaaaa atccagctaa ttagctggat 1938
Tyr Ile Glu Ile Pro Val Leu Lys
610 615
tttttttata atgttacttt tcctattttt cctttatttc caactaaaat tacatatttt 1998
ttatcgggcg aaaccgtaca agtatg 2024
<210>14
<211>616
<212>PRT
<213>短稳杆菌
<400>14
Val Lys Lys Leu Thr Leu Lys Val Thr Leu Leu Thr Leu Leu Leu Gly
1 5 10 15
Ser Thr Val Gly Phe Ala Gln Asp Ala Lys Ala Asp Ser Ala Tyr Val
20 25 30
Arg Asp Asn Tyr Glu Lys Ile Glu Gln Val Ile Pro Met Arg Asp Gly
35 40 45
Thr Lys Leu Phe Thr Ala Ile Tyr Gln Pro Lys Asp Lys Thr Lys Gln
50 55 60
Tyr Pro Val Leu Leu Asn Arg Thr Pro Tyr Thr Val Ala Pro Tyr Gly
65 70 75 80
Val Asn Glu Tyr Lys Lys Ser Leu Gly Asn Phe Pro Thr Glu Met Arg
85 90 95
Glu Gly Phe Ile Phe Val Tyr Gln Asp Val Arg Gly Lys Trp Met Ser
100 105 110
Glu Gly Glu Phe Glu Asp Val Arg Pro Ile Asn Pro Ser Lys Ser Lys
115 120 125
Lys Ala Ile Asp Glu Ser Thr Asp Thr Phe Asp Thr Leu Glu Trp Leu
130 135 140
Ala Lys Asn Leu Lys Asn Tyr Thr Lys Lys Ala Gly Ile Tyr Gly Ile
145 150 155 160
Ser Tyr Pro Gly Phe Tyr Ser Thr Met Ser Leu Val Asn Ser His Pro
165 170 175
Thr Leu Lys Ala Val Ser Pro Gln Ala Pro Val Thr Asn Trp Phe Leu
180 185 190
Gly Asp Asp Phe His His Asn Gly Val Leu Phe Leu Asn Asp Ser Phe
195 200 205
Ser Phe Met Thr Phe Phe Gly Val Lys Arg Pro Gln Pro Ile Thr Pro
210 215 220
Asp Lys Gly Pro Lys Arg Phe Glu Tyr Pro Ile Lys Asp Asn Tyr Arg
225 230 235 240
Phe Tyr Ala Ser Gly Ser Val Lys Glu Leu Lys Asp Lys Tyr Leu Gln
245 250 255
Asp Asn Ile Lys Phe Tyr Asn Asp Leu Phe Ala His Pro Asp Tyr Asp
260 265 270
Gln Phe Trp Gln Asp Arg Asn Val Leu Pro His Leu Thr Asn Val Gln
275 280 285
Pro Ala Val Met Thr Val Gly Gly Phe Phe Asp Ala Glu Asp Val Tyr
290 295 300
Gly Ala Phe Glu Thr Tyr Lys Ala Ile Glu Lys Gln Asn Pro Lys Ala
305 310 315 320
Thr Asn Ile Met Val Ala Gly Pro Trp Phe His Gly Gly Trp Val Arg
325 330 335
Ser Asn Gly Ser Thr Phe Gly Asp Met Gln Phe Ala Ser Asn Thr Ser
340 345 350
Glu His Tyr Gln Gln Glu Ile Glu Leu Pro Phe Phe Asn Tyr Tyr Leu
355 360 365
Lys Asp Lys Gly Asn Phe Lys Pro Thr Glu Ala Thr Ile Phe Ile Thr
370 375 380
Gly Ser Asn Glu Trp Lys Gln Phe Asp Ala Trp Pro Pro Lys Asn Val
385 390 395 400
Thr Thr Gln Lys Ile Tyr Leu Gln Gln Asn Gly Lys Ile Ala Phe Asn
405 410 415
Lys Thr Asn Thr Thr Thr Thr Phe Asp Glu Tyr Val Ala Asp Pro Asn
420 425 430
Ser Pro Val Pro Tyr Ser Gly Gly Val Leu Glu Thr Arg Ser Arg Glu
435 440 445
Tyr Met Val Asp Asp Gln Arg Phe Ala Ser Thr Arg Pro Asp Val Met
450 455 460
Val Tyr Gln Ser Asp Ile Leu Thr Glu Asp Ile Thr Leu Ala Gly Pro
465 470 475 480
Val Ile Asn His Leu Val Val Ser Thr Thr Gly Thr Asp Ala Asp Tyr
485 490 495
Val Val Lys Leu Ile Asp Val Tyr Pro Glu Asn Thr Pro Lys Phe Asn
500 505 510
Asn Lys Leu Met Ala Gly Tyr Gln Asn Leu Ile Arg Ala Glu Ile Met
515 520 525
Arg Gly Lys Tyr Arg Asn Ser Phe Ser Asn Pro Glu Ala Met Val Pro
530 535 540
Asn Lys Glu Thr Asn Val Thr Tyr Thr Met Pro Asp Val Gly His Thr
545 550 555 560
Phe Lys Lys Gly His Arg Ile Met Ile Gln Val Gln Asn Ser Trp Phe
565 570 575
Pro Leu Ala Asp Arg Asn Pro Gln Gln Phe Met Asn Val Tyr Glu Ala
580 585 590
Thr Ser Lys Asp Tyr Leu Lys Gln Thr Gln Arg Ile Tyr His Thr Ser
595 600 605
Tyr Ile Glu Ile Pro Val Leu Lys
610 615
<210>15
<211>40
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:为制备pTrpT所合成的引物
<400>15
gtatcacgag gccctagctg tggtgtcatg gtcggtgatc 40
<210>16
<211>40
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:为制备pTrpT所合成的引物
<400>16
ttcggggatt ccatatgata ccctttttac gtgaacttgc 40
<210>17
<211>38
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:为制备pTrpT_Gtg2所合成的引物
<400>17
gggaattcca tatgaaaaaa ttaacattaa aagtaact 38
<210>18
<211>36
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:为制备pTrpT_Gtg2所合成的引物
<400>18
gggggctgca gtacttgtac ggtttcgccc gataaa 36
<210>19
<211>1935
<212>DNA
<213>鞘氨醇杆菌
<220>
<221>CDS
<222>(61)..(1917)
<223>肽形成酶基因
<400>19
gaaaccaagt gtaaaattat aatttacacc aaagaatgta ctgaacaaat aattatctga 60
atg aaa aat aca att tcg tgc cta act tta gcg ctt tta agc gca agc 108
Met Lys Asn Thr Ile Ser Cys Leu Thr Leu Ala Leu Leu Ser Ala Ser
1 5 10 15
cag tta cat gct caa aca gct gcc gac tcg gct tat gtt aga gat cat 156
Gln Leu His Ala Gln Thr Ala Ala Asp Ser Ala Tyr Val Arg Asp His
20 25 30
tat gaa aag acc gaa gta gca att ccc atg cga gat ggg aaa aaa tta 204
Tyr Glu Lys Thr Glu Val Ala Ile Pro Met Arg Asp Gly Lys Lys Leu
35 40 45
ttt act gcg atc tac agt cca aaa gac aaa tcc aag aaa tat cca gtt 252
Phe Thr Ala Ile Tyr Ser Pro Lys Asp Lys Ser Lys Lys Tyr Pro Val
50 55 60
ttg ctc aat aga acg ccc tac acg gtt tca cct tat ggg cag aac gaa 300
Leu Leu Asn Arg Thr Pro Tyr Thr Val Ser Pro Tyr Gly Gln Asn Glu
65 70 75 80
tat aaa aaa agc ttg gga aac ttt ccc caa atg atg cgt gaa ggc tat 348
Tyr Lys Lys Ser Leu Gly Asn Phe Pro Gln Met Met Arg Glu Gly Tyr
85 90 95
att ttc gtt tac cag gat gtc cgt ggc aag tgg atg agc gaa ggt gat 396
Ile Phe Val Tyr Gln Asp Val Arg Gly Lys Trp Met Ser Glu Gly Asp
100 105 110
ttt gaa gat ata cgt ccg acc acg tac agc aaa gat aaa aaa gca atc 444
Phe Glu Asp Ile Arg Pro Thr Thr Tyr Ser Lys Asp Lys Lys Ala Ile
115 120 125
gat gaa agt acg gat acc tat gat gcg ctt gaa tgg tta cag aaa aat 492
Asp Glu Ser Thr Asp Thr Tyr Asp Ala Leu Glu Trp Leu Gln Lys Asn
130 135 140
ctc aaa aac tat aat ggc aaa gcc ggg ctc tat ggg att tcc tat cca 540
Leu Lys Asn Tyr Asn Gly Lys Ala Gly Leu Tyr Gly Ile Ser Tyr Pro
145 150 155 160
ggc ttc tat tct acc gtc gga ttg gtc aaa aca cac ccg agc ttg aag 588
Gly Phe Tyr Ser Thr Val Gly Leu Val Lys Thr His Pro Ser Leu Lys
165 170 175
gca gtc tcc cca cag gct ccc gta aca gac tgg tat atc ggc gac gac 636
Ala Val Ser Pro Gln Ala Pro Val Thr Asp Trp Tyr Ile Gly Asp Asp
180 185 190
ttc cac cat aat ggc gta ttg ttt ctt cag gat gca ttt aca ttc atg 684
Phe His His Asn Gly Val Leu Phe Leu Gln Asp Ala Phe Thr Phe Met
195 200 205
tca acc ttt ggt gtc cct cgt cca aaa ccc att aca ccg gat caa ttt 732
Ser Thr Phe Gly Val Pro Arg Pro Lys Pro Ile Thr Pro Asp Gln Phe
210 215 220
aag ggc aaa att cag atc aaa gaa gcc gat aaa tat aac ttt ttt gca 780
Lys Gly Lys Ile Gln Ile Lys Glu Ala Asp Lys Tyr Asn Phe Phe Ala
225 230 235 240
gaa gca gga aca gcg cgg gaa ctc aaa gaa aag tat ttt ggt gac tcc 828
Glu Ala Gly Thr Ala Arg Glu Leu Lys Glu Lys Tyr Phe Gly Asp Ser
245 250 255
gta caa ttt tgg aat gac ctg ttt aag cat ccc gac tat gat gat ttt 876
Val Gln Phe Trp Asn Asp Leu Phe Lys His Pro Asp Tyr Asp Asp Phe
260 265 270
tgg aaa tcg cgt gtg atc acg aat tct tta cag gag gta aaa cca gct 924
Trp Lys Ser Arg Val Ile Thr Asn Ser Leu Gln Glu Val Lys Pro Ala
275 280 285
gtg atg gtg gtt ggt ggt ttc ttt gac gcg gaa gat gct tat gga aca 972
Val Met Val Val Gly Gly Phe Phe Asp Ala Glu Asp Ala Tyr Gly Thr
290 295 300
ttt aag acc tac caa tcg att gag gat aaa agc aaa aaa aac aac tcg 1020
Phe Lys Thr Tyr Gln Ser Ile Glu Asp Lys Ser Lys Lys Asn Asn Ser
305 310 315 320
att tta gtc gcg gga cct tgg tat cat ggc ggt tgg gtt cgt gca gaa 1068
Ile Leu Val Ala Gly Pro Trp Tyr His Gly Gly Trp Val Arg Ala Glu
325 330 335
gga aac tat tta ggt gat atc caa ttt gag aaa aaa acc agt att act 1116
Gly Asn Tyr Leu Gly Asp Ile Gln Phe Glu Lys Lys Thr Ser Ile Thr
340 345 350
tat cag gaa caa ttt gaa caa cca ttt ttc aaa tat tac cta aaa gat 1164
Tyr Gln Glu Gln Phe Glu Gln Pro Phe Phe Lys Tyr Tyr Leu Lys Asp
355 360 365
gaa gga aac ttc gcc cct tcc gaa gct aac att ttt gtt tca ggc agc 1212
Glu Gly Asn Phe Ala Pro Ser Glu Ala Asn Ile Phe Val Ser Gly Ser
370 375 380
aac gaa tgg aaa cat ttc gaa cag tgg cca cca aaa aat gta gag aca 1260
Asn Glu Trp Lys His Phe Glu Gln Trp Pro Pro Lys Asn Val Glu Thr
385 390 395 400
aaa aaa cta tacttc caa cct cag ggg aaa ctt gga ttt gac aaa gtt 1308
Lys Lys Leu Tyr Phe Gln Pro Gln Gly Lys Leu Gly Phe Asp Lys Val
405 410 415
caa cgt aca gat tcc tgg gat gaa tat gta aca gac cct aat aaa cct 1356
Gln Arg Thr Asp Ser Trp Asp Glu Tyr Val Thr Asp Pro Asn Lys Pro
420 425 430
gtt ccg cat caa ggt ggg gta att caa aac cga aca cgg gag tat atg 1404
Val Pro His Gln Gly Gly Val Ile Gln Asn Arg Thr Arg Glu Tyr Met
435 440 445
gta gat gat caa cgt ttc gcg gct agt cgc cct gat gtc atg gtt tat 1452
Val Asp Asp Gln Arg Phe Ala Ala Ser Arg Pro Asp Val Met Val Tyr
450 455 460
caa acg gaa ccg ttg acg gag gac ctg acg ata gta ggc cca atc aaa 1500
Gln Thr Glu Pro Leu Thr Glu Asp Leu Thr Ile Val Gly Pro Ile Lys
465 470 475 480
aac ttt ctc aaa gtt tct tca aca gga aca gac gcg gac tat gtt gtc 1548
Asn Phe Leu Lys Val Ser Ser Thr Gly Thr Asp Ala Asp Tyr Val Val
485 490 495
aaa ctg att gac gtt tat ccg aat gat gca gca agt tat caa gga aaa 1596
Lys Leu Ile Asp Val Tyr Pro Asn Asp Ala Ala Ser Tyr Gln Gly Lys
500 505 510
aca atg gct gga tat caa atg atg gta cgt ggt gag atc atg gcg ggg 1644
Thr Met Ala Gly Tyr Gln Met Met Val Arg Gly Glu Ile Met Ala Gly
515 520 525
aaa tac cga aat ggt ttc gat aaa gcg cag gcc ttg act cca ggt atg 1692
Lys Tyr Arg Asn Gly Phe Asp Lys Ala Gln Ala Leu Thr Pro Gly Met
530 535 540
gtc gaa aag gtg aat ttt gaa atg cca gac gtt gcg cat acc ttc aaa 1740
Val Glu Lys Val Asn Phe Glu Met Pro Asp Val Ala His Thr Phe Lys
545 550 555 560
aaa gga cat cgc att atg gtt cag gta caa aac tca tgg ttt ccg ctg 1788
Lys Gly His Arg Ile Met Val Gln Val Gln Asn Ser Trp Phe Pro Leu
565 570 575
gca gaa cga aat cca cag gtg ttt tta gca cct tat aca gct acc aaa 1836
Ala Glu Arg Asn Pro Gln Val Phe Leu Ala Pro Tyr Thr Ala Thr Lys
580 585 590
gct gat ttc cgc aaa gct acc caa cgt att ttt cac gat gtg aac aat 1884
Ala Asp Phe Arg Lys Ala Thr Gln Arg Ile Phe His Asp Val Asn Asn
595 600 605
gcc aca tac atc gaa ttt tct gtc ctc aaa gat tagcaggtaa attcgaaa 1935
Ala Thr Tyr Ile Glu Phe Ser Val Leu Lys Asp
610 615
<210>20
<211>619
<212>PRT
<213>鞘氨醇杆菌
<400>20
Met Lys Asn Thr Ile Ser Cys Leu Thr Leu Ala Leu Leu Ser Ala Ser
1 5 10 15
Gln Leu His Ala Gln Thr Ala Ala Asp Ser Ala Tyr Val Arg Asp His
20 25 30
Tyr Glu Lys Thr Glu Val Ala Ile Pro Met Arg Asp Gly Lys Lys Leu
35 40 45
Phe Thr Ala Ile Tyr Ser Pro Lys Asp Lys Ser Lys Lys Tyr Pro Val
50 55 60
Leu Leu Asn Arg Thr Pro Tyr Thr Val Ser Pro Tyr Gly Gln Asn Glu
65 70 75 80
Tyr Lys Lys Ser Leu Gly Asn Phe Pro Gln Met Met Arg Glu Gly Tyr
85 90 95
Ile Phe Val Tyr Gln Asp ValArg Gly Lys Trp Met Ser Glu Gly Asp
100 105 110
Phe Glu Asp Ile Arg Pro Thr Thr Tyr Ser Lys Asp Lys Lys Ala Ile
115 120 125
Asp Glu Ser Thr Asp Thr Tyr Asp Ala Leu Glu Trp Leu Gln Lys Asn
130 135 140
Leu Lys Asn Tyr Asn Gly Lys Ala Gly Leu Tyr Gly Ile Ser Tyr Pro
145 150 155 160
Gly Phe Tyr Ser Thr Val Gly Leu Val Lys Thr His Pro Ser Leu Lys
165 170 175
Ala Val Ser Pro Gln Ala Pro Val Thr Asp Trp Tyr Ile Gly Asp Asp
180 185 190
Phe His His Asn Gly Val Leu Phe Leu Gln Asp Ala Phe Thr Phe Met
195 200 205
Ser Thr Phe Gly Val Pro Arg Pro Lys Pro Ile Thr Pro Asp Gln Phe
210 215 220
Lys Gly Lys Ile Gln Ile Lys Glu Ala Asp Lys Tyr Asn Phe Phe Ala
225 230 235 240
Glu Ala Gly Thr Ala Arg Glu Leu Lys Glu Lys Tyr Phe Gly Asp Ser
245 250 255
Val Gln Phe Trp Asn Asp Leu Phe Lys His Pro Asp Tyr Asp Asp Phe
260 265 270
Trp Lys Ser Arg Val Ile Thr Asn Ser Leu Gln Glu Val Lys Pro Ala
275 280 285
Val Met Val Val Gly Gly Phe Phe Asp Ala Glu Asp Ala Tyr Gly Thr
290 295 300
Phe Lys Thr Tyr Gln Ser Ile Glu Asp Lys Ser Lys Lys Asn Asn Ser
305 310 315 320
Ile Leu Val Ala Gly Pro Trp Tyr His Gly Gly Trp Val Arg Ala Glu
325 330 335
Gly Asn Tyr Leu Gly Asp Ile Gln Phe Glu Lys Lys Thr Ser Ile Thr
340 345 350
Tyr Gln Glu Gln Phe Glu Gln Pro Phe Phe Lys Tyr Tyr Leu Lys Asp
355 360 365
Glu Gly Asn Phe Ala Pro Ser Glu Ala Asn Ile Phe Val Ser Gly Ser
370 375 380
Asn Glu Trp Lys His Phe Glu Gln Trp Pro Pro Lys Asn Val Glu Thr
385 390 395 400
Lys Lys Leu Tyr Phe Gln Pro Gln Gly Lys Leu Gly Phe Asp Lys Val
405 410 415
Gln Arg Thr Asp Ser Trp Asp Glu Tyr Val Thr Asp Pro Asn Lys Pro
420 425 430
Val Pro His Gln Gly Gly Val Ile Gln Asn Arg Thr Arg Glu Tyr Met
435 440 445
Val Asp Asp Gln Arg Phe Ala Ala Ser Arg Pro Asp Val Met Val Tyr
450 455 460
Gln Thr Glu Pro Leu Thr Glu Asp Leu Thr Ile Val Gly Pro Ile Lys
465 470 475 480
Asn Phe Leu Lys Val Ser Ser Thr Gly Thr Asp Ala Asp Tyr Val Val
485 490 495
Lys Leu Ile Asp Val Tyr Pro Asn Asp Ala Ala Ser Tyr Gln Gly Lys
500 505 510
Thr Met Ala Gly Tyr Gln Met Met Val Arg Gly Glu Ile Met Ala Gly
515 520 525
Lys Tyr Arg Asn Gly Phe Asp Lys Ala Gln Ala Leu Thr Pro Gly Met
530 535 540
Val Glu Lys Val Asn Phe Glu Met Pro Asp Val Ala His Thr Phe Lys
545 550 555 560
Lys Gly His Arg Ile Met Val Gln Val Gln Asn Ser Trp Phe Pro Leu
565 570 575
Ala Glu Arg Asn Pro Gln Val Phe Leu Ala Pro Tyr Thr Ala Thr Lys
580 585 590
Ala Asp Phe Arg Lys Ala Thr Gln Arg Ile Phe His Asp Val Asn Asn
595 600 605
Ala Thr Tyr Ile Glu Phe Ser Val Leu Lys Asp
610 615
<210>21
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:为制备pTrpT_Sm_aet所合成的引物
<400>21
gggaattcca tatgaaaaat acaatttcgt 30
<210>22
<211>29
<212>DNA
<213>人工序列
<220>
<223>人工序列描述:为制备pTrpT_Sm_aet所合成的引物
<400>22
gctctagact aatctttgag gacagaaaa 29