编码rplK基因的核苷酸序列及其使用方法 本发明提供了编码rplK基因的核苷酸序列,及用棒状细菌经发酵制备氨基酸,尤其L-赖氨酸的方法,其中棒状细菌中rplK基因是弱化的。
L-氨基酸,尤其L-赖氨酸,用于动物营养、人用药及制药工业。
已知氨基酸可通过棒状细菌菌株,尤其谷氨酸棒杆菌的发酵而生产。由于L-氨基酸的极其重要性,已持续进行改良生产方法地尝试,为改良这些微生物的生产性质,可使用诱变,选择及突变体选择等方法,以此获得对抗代谢物如赖氨酸类似物S-(2-氨乙基)-半胱氨酸有抗性或重要的调节氨基酸缺陷的并产生L-氨基酸的菌株。
一段时间以来,重组DNA技术的方法也用于棒杆菌生产L-赖氨酸的菌株改良,其通过扩增各个氨基酸生物合成基因,并研究对L-氨基酸生产的作用而进行改良。此方面的综述文章见Kinoshita(“谷氨酸细菌”,工业微生物的生物学,Demain和Soloman编辑,Benjamin Cummings,英国伦敦,1985,115-142),Hilliger(生物技术2,40-44(1991)),Eggeling(氨基酸6:261-272(1994)),Jetten和Sinskey(生物技术的关键回顾15,73-103(1995)),及Sahm等(纽约科学协会年报782,25-39(1996))。
rplK蛋白(核糖体大亚基蛋白K)是细菌核糖体的一组成成份,它是第一个阐述的大肠杆菌(E.coli)细胞的翻译装置,在其上发生蛋白质合成。
核糖体是由3种核糖核酸(RNA)分子和特定数目的蛋白质组成的细胞颗粒。核糖体大部分经超离心得自细胞提取物。剩余细胞成分的进一步纯化通常以蔗糖梯度通过沉降梯度分离进行。此制备技术使得通常使用直接涉及沉降性质的核糖体组分的名称。因此,一个有功能细菌核糖体通常称为70S核糖体,其由小(小亚基)30S亚基和大(大亚基)50S亚基组成。E.coli的小30S亚基由21个不同的多肽和长度为1542个核苷酸的RNA分子组成,该RNA已知为16S-rRNA;除了rplK蛋白,大50S亚基还含有另外31个不同的多肽和长度分别为120和2904个核苷酸的2个RNA,分别称为5S或23S rRNA分子。另外还有一种核糖体蛋白的命名方式。小30S亚基的多肽称为S1-S21,而大50S亚基称为L1~L32。本文rplK蛋白相当于核糖体L11蛋白(Noller和Nomura,在Neidhardt等,大肠杆菌和鼠伤寒杆菌:细胞和分子生物学,美国微生物学会,华盛顿特区,167-186,1996)。近年来,类L11蛋白在其它生物体中也已鉴别出,如Borrelia burgdorferi(Fraser等,自然390,580-586,1997),Helicobacter pylori(Tomb等,自然388,539-547,1997),Serratia marcescens(Sor和Nomura,分子和普通遗传学210,52-59,1987),Haemophilus influenzae(Fleischmann等,科学269,496-512,1995)及革兰氏阳性菌Bacillus subtilis(Jeong等,分子微生物学10,133-142,1993)。
翻译过程发生在核糖体,因此信使RNA控制的多肽的生物合成是复杂的。除核糖体之外,称为蛋白质合成因子的其它蛋白质(Noller,生物化学关键回顾,60,191-227,1991)也是翻译过程所必需的。L11蛋白介导核糖体和一些蛋白质合成因子间的相互作用,可提及的例如是延伸因子G(EF-G)和终止因子1(RF-1)。E.coli L11突变体的核糖体中没有L11蛋白,因此导致翻译速度降低(Xing和Draper,生物化学35,1581-1588,1996)。
L11蛋白对于RelA蛋白与核糖体结合与活化也是必需的。RelA在氨基酸缺陷的条件下,通过将一个焦磷酸基团从ATP移至GDP而催化鸟苷四磷酸(ppGpp)的合成。在E.coli中,ppGpp负性或正性影响许多基因的表达。一般地,在生物合成途径中有作用的基因产物的表达是被刺激的。有分解代谢作用的基因产物通常相应地被负调节的。在氨基酸生物合成中起中心作用的大量基因和操纵子在E.coli中是通过ppGpp调节的。这些基因中目前已知在E.coli中被正性影响的基因是arg F,arg I,arg ECBH(精氨酸生物合成),gltB,glnA,gdh(谷氨酰胺/谷氨酸生物合成),ilvB,IlvA(异亮氨酸生物合成),metC,metF metK(甲硫氨酸生物合成),thrA,thrB,thrC(苏氨酸生物合成),lysA,lysC,dapB,asd(赖氨酸生物合成)(Cashel等,Neidbvardt等,大肠杆菌和鼠伤寒杆菌:细胞和分子生物学,美国微生物学会,华盛顿特区,1458-1496,1996)。ppGpp作为氨基酸生物合成的正调节因子的功能也在其它细菌中证实,如鼠伤寒杆菌(Rudd等,细菌学杂志163,534-542,1985),Vibrio sp.(Flardh等,细菌学杂志176,5949-5957,1994)和B.subtilis(Wendrich和Marahiel,分子微生物学26,65-79,1997)。
从现有技术可以明白,令人感兴趣的是了解棒状细菌rplK基因的核苷酸序列,是否可以促进这些细菌生产氨基酸。
因此本发明的目的是提供改良的经发酵制备氨基酸,尤其L-赖氨酸的新措施。
L-氨基酸,尤其赖氨酸用于人用药物及制药工业,食品工业以及特别是动物营养。因此提供生产氨基酸,尤其L-赖氨酸的新改良方法总是令人感兴趣的。
本发明提供了分离的多核苷酸,其包括选自如下一组的多核苷酸序列:
a)与编码含有SEQ ID NO:2的氨基酸序列的多肽的多核苷酸至少70%相同的多核苷酸,
b)编码含有与SEQ ID NO:2的氨基酸序列至少70%相同的氨基酸序列的多肽的多核苷酸,
c)与a)或b)的多核苷酸互补的多核苷酸,以及
d)含有a)、b)或c)的多核苷酸序列的至少15个连续碱基的多核苷酸。
本发明还提供了根据上述a)~d)所述的多核苷酸,其优选是能复制的DNA,含有:
(ⅰ)SEQ ID NO:1的核苷酸序列,或
(ⅱ)在遗传密码简并范围内相应于(ⅰ)序列的至少一个序列,或
(ⅲ)与互补于(ⅰ)或(ⅱ)序列的序列杂交的至少一个序列,并任选地,
(ⅳ)(ⅰ)中有功能的中性有义突变体。
本发明还提供了:
能复制的优选为重组DNA的多核苷酸,含有SEQ ID NO:1所示核苷酸序列,
能复制的优选为重组DNA的多核苷酸,其编码含有SEQ IDNO:2所示氨基酸序列的多肽,
如上述a)-d)尤其d)所述的多核苷酸,含有SEQ ID NO:3所示核苷酸序列,
如上述a)-d)尤其d)所述的多核苷酸,其编码含有SEQ ID NO:4所示氨基酸序列的多肽,
含有如上述a)-d)尤其d)所述的SEQ ID NO:3所示的突变的多核苷酸的载体,如图1所示(Δ=deHa),并根据布达佩斯条约保藏在E.coli DH5α/pΔrplK中,保藏号DSM13158,其在1999年11月26日保藏在德意志微生物保藏中心(DSMZ,不论瑞克,德国),
及作为宿主细胞的棒状细菌,其含有rplK基因的插入或缺失。
本发明还提供了多核苷酸,其基本上含有一多核苷酸序列,其可通过用含有SEQ ID NO:1所述多核苷酸序列或其片段的序列的探针杂交相应的基因文库,并分离所述的DNA序列来筛选获得,所述文库包括具有相应于SEQ ID NO:1的多核苷酸序列的完整基因。
本发明的多核苷酸序列适用作RNA,cDNA和DNA的杂交探针,以分离编码核糖体蛋白L11的全长cDNA,以及分离与rplK基因具有高度序列相似性的cDNA或基因。
本发明的多核苷酸序列还适用作通过聚合酶链反应(PCR)制备编码rplK基因产物或产生核糖体蛋白L11的基因的DNA的引物。
作为探针或引物的这种寡核苷酸包括至少30个,优选至少20个,特别优选至少15个连续碱基。具有至少40个或50个碱基对的寡核苷酸也是合适的。
“分离的”是指从其天然环境中分离出来。
“多核苷酸”一般地涉及多聚核糖核苷酸和多聚脱氧核糖核苷酸,其可以是非修饰的RNA或DNA,或修饰的RNA或DNA。
“多肽”应理解为含有经肽键结合的两个或多个氨基酸的肽或蛋白质。
本发明的多肽包括SEQ ID NO:2的多肽。特别是具有rplK基因产物生物学活性的多肽,以及与SEQ ID NO:2的多肽至少70%相同的多肽,优选地与SEQ ID NO:2的多肽至少80%,特别是至少90%-95%相同并具有所述活性的多肽。
本发明另外还提供了用尤其已生产氨基酸的棒状细菌生产氨基酸尤其L-赖氨酸的发酵方法,在该棒状细菌中编码rplK基因的核苷酸序列是弱化的。
文中术语“弱化”是指微生物中由相应DNA编码的一或多种酶或蛋白质的胞内活性或功能的降低或关闭,例如通过用弱启动子或编码低活性相应酶或蛋白质的基因或等位基因,及任选地组合使用这些方法。
本发明的微生物可从葡萄糖、蔗糖、乳糖、果糖、麦芽糖、糖蜜、淀粉,纤维素或从甘油和乙醇中生产氨基酸,尤其赖氨酸。所述微生物可以是棒状细菌的代表菌,尤其是棒状菌属,在棒状菌属中尤其应提及的谷氨酸棒杆菌,本领域技术人员已知其生产L-氨基酸的能力。
本发明通过参考附图将进一步得以阐述,附图只是举例说明本发明而非限制本发明。
图1是质粒pΔrplK图。
所用缩写及符号有如下含义:
pdeltarplK:pΔrplK
sacB基因:编码果聚糖酶的枯草芽胞杆菌的sacB基因。
lacZ-α:β-半乳糖苷酶基因的5’端部分
oriV:复制源点
KmR:卡那霉素抗性
RP4mob:质粒RP4的mob区
BamHⅠ:限制酶BamHⅠ的酶切位点
EcoRⅠ:限制酶EcoRⅠ的酶切位点
ΔrplK:在N末端区缺失12bp的rplK等位基因
序列数据简述
SEQ ID NO:1是编码rplK基因的新核苷酸序列
SEQ ID NO:2是rplK基因产物(L11蛋白)的氨基酸序列
SEQ ID NO:3是rplK基因的等位基因
SEQ ID NO:4是由ΔrplK等位基因编码的L11蛋白的变异体
SEQ ID NO:5是基于SEQ ID NO:1衍生的P1正向引物
SEQ ID NO:6是基于SEQ ID NO:1衍生的P2反向引物
SEQ ID NO:7是基于SEQ ID NO:1衍生的P1反向引物
SEQ ID NO:8是基于SEQ ID NO:1衍生的P2正向引物
以下已知野生型菌株:
谷氨酸棒杆菌ATCC13032
醋谷棒杆菌ATCC15806
嗜乙酰乙酸棒杆菌ATCC13870
嗜热产氨棒杆菌FERM BP-1539
Corynebacterium melassecola ATCC17965
黄色短杆菌ATCC14067
乳发酵短杆菌ATCC13869和
扩展短杆菌ATCC14020和从中获得的生产L-氨基酸的突变体或菌株,如L-赖氨酸生产菌:
谷氨酸棒杆菌FERM-P1709
黄色短杆菌FERM-P1708
乳发酵短杆菌FERM-P1712
谷氨酸棒杆菌FERM-P6463
谷氨酸棒杆菌FERM-P6464
谷氨酸棒杆菌DSM5715
谷氨酸棒杆菌DSM12866,和
谷氨酸棒杆菌DM58-1是棒杆菌属,尤其谷氨酸棒杆菌菌株的适当实例。
本发明人已成功地分离谷氨酸棒杆菌的新rplK基因。
为分离谷氨酸棒杆菌的rplK基因或其它基因,首先在大肠杆菌中建立这一微生物的基因文库。可根据通常已知的教材和手册建立基因文库。例如由Winnacker所著教材:基因与克隆,基因工程入门(Verlag Chamie,Weinheim,德国,1990),或Sambrook等所著手册:分子克隆实验手册(Cold Spring Harbor Laboratory Press,1989)。-非常熟知的基因文库是由Kohara等(细胞50,495-508(1987))在λ载体中建立的E.coli K-12菌株W3110的基因文库。Bathe等(分子及普通遗传学,252:255-265,1996)阐述了借助于粘粒载体SuperCosⅠ(Wahl等,1987,美国科学院院刊84,2160-2164),在E.coli K-12菌株NM554(Raleigh等,1988,核酸研究16:1563-1575)中建立的谷氨酸棒杆菌ATCC13032的基因文库。Bormann等(分子微生物学6(3),317-326)描述了用粘粒pHC79(Hohn和Collins,基因11,291-298(1980))制备谷氨酸棒杆菌ATCC13032的基因文库。
为在大肠杆菌中制备谷氨酸棒杆菌的基因文库,也可使用质粒如pBR322(Bolivar,生命科学25,807-818(1979))或pUC9(Vieira等,1982,基因19:259~268)。合适的宿主尤其是限制和重组缺陷的大肠杆菌菌株,一个例子是菌株DH5αmcr,如Grant等(美国科学院院报87(1990)4645~4649)所述。
借助于粘粒克隆的长DNA片段随后可亚克隆在适于测序的通用载体中。
DNA测序方法如Sanger等(美国科学院院报74:5463-5467,1977))所述。
以此方式可获得编码rplK基因的谷氨酸棒杆菌的新DNA序列,示作SEQ ID NO:1,是本发明的一部分。另外,用前述方法从此DNA序列中也已衍生出相应蛋白质的氨基酸序列。所得rplK基因产物或L-11蛋白的氨基酸序列以SEQ ID NO:2表示。
通过遗传密码的简并性产生自SEQ ID NO:1的编码DNA序列也是本发明的一部分。同样,与SEQ ID NO:1或SEQ ID NO:1的部分杂交的DNA序列也是本发明的一部分。以相应方式产生自SEQ ID NO:1的氨基酸序列也是本发明的一部分。
本发明人发现,在rplK基因弱化后,棒状细菌以改良方式生产L-氨基酸,尤其L-赖氨酸。
为获得弱化,可降低rplK基因的表达或优选地降低蛋白质功能。可任选地组合这两种方法。
降低基因表达可通过适当培养或通过遗传改变(突变)基因表达的信号结构而进行。基因表达的信号结构例如是阻抑物基因,激活物基因,操纵子,启动子,弱化子,核糖体结合位点,起始密码子和终止子。技术人员例如从以下文献中可发现对此的信息:专利申请WO96/15246,Boyd和Murphy(细菌学杂志170:5949(1988)),Voskuil和Chambliss(核酸研究26:3548(1998)),Jensen和Hammer(生物技术及生物工程58:191(1998)),Patek等(微生物学142:1297(1996)),以及熟知的遗传学及微生物学教材如Knippers所著《分子遗传学》第6版,Georg Thieme Verlag,Stuttgart,德国,(1995),或由Winnacker所著《基因与克隆》,VCH Verlagsgesellschaft,Weinheim,德国(1990)。
本领域已知导致改变或降低蛋白质功能性质的突变。例如可提及的是Qiu和Goodman(生物化学杂志272:8611-8617(1997)),Sugimoto等(生物科学生物技术及生物化学61:1760-1762(1997)),Mockel(“谷氨酸棒杆菌的苏氨酸脱水酶:消除别构调节及酶的结构”,由Julich研究中心报道,Jul-2906,ISSN09442952,Julich,德国,1994)所进行的研究工作。熟知的遗传学及分子生物学教材如Hagemann(普通遗传学,Gustav Fischer Verlag,Stuttgart,1986)对此也作了概括。
转换,颠换,插入及缺失是突变的可能方式。所述错义突变或无义突变是根据对氨基酸活性的影响而定。在基因中插入或缺失至少一个碱基对导致读框移位(移码突变),因此掺入错误的氨基酸或翻译过早中止。本领域已知产生这种突变的方法并可参见遗传及分子生物学教材如Knippers所著《分子遗传》第6版,Georg ThiemeVerlag,Stuttgart,德国,1995,及由Winnacker所著《基因与克隆》,VCH Verlagsgesellschaft,Weinheim,德国,1990,或由Hagemann所著《普通遗传学》,Gustav Fischer Verlag,Stuttagart,1986。借助于聚合酶链反应(PCR)产生突变的方法见于C.R.Newton和A.Graham,PCR,第2版,Spektrum Akademischer Verlag,Heidelberg,1997所述。
用其可进行rplK基因缺失诱变的质粒例如是由图1所示质粒pΔrplK。
质粒pΔrplK是由Jager等所述的质粒pK18mobsacB(细菌学杂志,1992,174:54-65)组成,其中插入SEQ ID NO:3所示rplK基因的等位基因。称为ΔrplK的该等位基因在基因的5’区缺失12bp。由ΔrplK等位基因编码的L11蛋白变体由SEQ ID NO:4所示。所示L-11蛋白变体与野生型L-11蛋白不同之处在于在相当于SEQ ID NO:2的30-33位氨基酸的四肽脯氨酸-丙氨酸-亮氨酸-甘氨酸处的错误。
质粒pΔrplK在同源重组后,导致染色体rplK基因与ΔrplK等位基因的置换。关于插入诱变的方法例如可参Schwarzer和Puhler(生物/技术9,84-87(1991))或Fitzpatrick等(应用微生物学与生物技术42,575-580(1994))。
另外,除弱化rplK基因之外,增强尤其过表达相关生物合成途径的一或多种酶,对L-氨基酸尤其L-赖氨酸的生产可以是有益的。
因此,例如以下基因可被同时增强特别是过表达以生产L-赖氨酸:
·编码二氢-2,6-吡啶二羧酸合酶的dapA基因(EP-B-0197335),
·编码反馈抗性天冬氨酸激酶的lysC基因(Kalinowski等,(1990),分子及普通遗传学224:317-324),
·编码丙酮酸羧化酶的pyc基因(Eikmanns(1992),细菌学杂志174,6076-6086),
·编码赖氨酸输出蛋白的lysE基因(DE-A-19548222),
·编码苹果酸醌氧化还原酶的mqo基因(Molenaar等(1998),欧洲生物化学杂志254,395-403),
·zwal基因(DE19959328.0,DSM13115)。
除弱化rplK基因之外,同时弱化以下基因对L-氨基酸的生产也可以是有益的:
·编码烯醇丙酮酸磷酸激酶的pck基因(DE19950409.1,DSM13047),
·编码葡萄糖-6-磷酸异构酶的pgi基因(US09/396478,DSM12969),
·编码丙酮酸氧化酶的poxB基因(DE19951975.7,DSM13114)
·zwa2基因(DE19959327.2,DSM13113)。
·编码PPGPP合成酶Ⅰ(EC2.7.6.5)的rel A基因。
除过表达6-葡糖酸磷酸脱氢酶之外,排除非所需的二级反应对L-氨基酸的生产也是有益的(Nakayama:“生产氨基酸的微生物的育种”,微生物产物的过量产生,Krumphanzl,Sikyta,Vanek(编辑),学术出版社,伦敦英国,1982)。
含有上述(a-d)特别是(d)的突变的多核苷酸的微生物也是本发明的一个方面,根据本发明产生的微生物可连续或非连续通过分批,补料分批法或重复补料发批法培养,以生产L-氨基酸尤其L-赖氨酸。已知培养法见于由Chmiel(生物方法技术学1,生物工程入门,Gustav Fischer Verlag,Stuttgart,1991)所著教材,或由Storhas(生物反应器及外周设备,Vieweg Verlag,Brannschweig/Wiesbaden,1994)所著教材中所述。
所用培养基必须以适当方式符合各菌株的需要。关于各种微生物培养基的阐述见于美国细菌学会的“细菌学通用方法手册”(华盛顿D.C..USA,1981)。可使用的碳源包括糖及碳水化合物,例如葡萄糖,蔗糖,乳糖,果糖,麦芽糖,糖蜜,淀粉和纤维素,油和脂肪如豆油,葵花油,落花生油和椰子油,脂肪酸如棕榈酸,硬脂酸和亚油酸,醇如甘油和乙醇,及有机酸如乙酸。这些物质可单独或混合使用。可使用的氮源包括含氮的有机化合物如胨,酵母提取物,肉膏,麦芽提取物,玉米浸液,大豆粉和尿素,或无机化合物如硫酸铵,氯化铵,磷酸铵,碳酸铵和硝酸铵。氮源可单独或混合使用。可使用的磷源包括磷酸,磷酸二氢钾或磷酸氢二钾,或相应钠盐。培养基另外还必须含有为生长所需的金属盐如硫酸镁或硫酸铁。最后,除了上述物质之外,可使用生长必需物质如氨基酸和维生素。引外,可将适当前体加入培养基中,上述物质可以单批形式或在培养期间适当补加。
可以适当方式加入碱性化合物如NaOH,KOH,氨或氨水,或酸性化合物如磷酸或硫酸,以调节培养物的PH值。抗泡沫剂例如脂肪酸聚乙二醇可用于控制泡沫产生。适当的选择性作用物质例如抗生素,可加入培养基中保持质粒的稳定性,氧气或含氧混合气,例如空气,可充入培养物中以保持有氧条件。培养温度通常在20℃~45℃,优选25℃-40℃。持续培养直至所需产物形成最大量。此目的通常在10~160小时范围内达到。
L-氨基酸的分析可通过阴离子交换层析,随后经过如Spackman等(分析化学30(1958)1190)所述茚三酮衍生化作用进行,或如Lindroth等(分析化学(1979)51:1167-1174)所述反相HPLC进行。
以下微生物根据布达佩斯条约,已保藏在德意志微生物保藏中心(DSMZ,不伦瑞克,德国):
大肠杆菌菌株DH5α/pΔrplK,保藏号DSM13158。
实施例1:制备谷氨酸棒杆菌ATCC13032的基因组粘粒文库
如Tauch等(1995,质粒33:168-179)所述分离谷氨酸棒杆菌ATCC13032的染色体DNA,并用限制性内切酶Sau3AⅠ(AmershamPharmacia,Freiburg,德国,产品描述Sau3AⅠ,编码27-0913-02)部分酶切。用虾碱性磷酸酶(Roche Molecular Biochemicals,德国曼海姆,产品描述SAP,编码1758250)将DNA片段去磷酸化。将得自Stratagene公司(La Jolla,USA,产品描述SuperCosl粘粒载体试剂盒,编码251301)的粘粒载体SuperCosl(Wahl等,(1987)美国科学院院报84:2160-2164)的DNA,用限制性内切酶XbaⅠ(Amersham Pharmacia,Freiburg,德国,产品描述XbaⅠ,编码27-0948-02)酶切,并也用虾碱性磷酸酶去磷酸化。粘粒DNA然后用限制性的内切酶BamHⅠ(Amersham Pharmacia,Freiburg,德国,产品描述BamHⅠ,编码27-0868-04)酶切。将以此方式处理的粘粒DNA与处理的ATCC13032DNA混合,并用T4DNA连接酶(Amersham Pharmacia,Freiburg,德国,产品描述T4-DNA-连接酶,编码27-0870-04)处理。连接混合物然后用GigapackⅡXL包装提取物(Stratagene,La Jolla,USA,产品描述GigapackⅡXL包装物提取物,编码200217)包装进噬菌体中。为感染大肠杆菌菌株NM554(Raleigh等,1988,核酸研究16:1563-1575),将细菌置于10mM MgSO4中并与噬菌体悬浮液混合。如Sambrook等(1989,分子克隆实验手册,冷泉港)所述进行粘粒文库的感染和滴定,细胞在含100mg/l氨苄青霉素的LB琼脂(Lennox.1955,病毒学,1:190)上铺板。在37℃保温过夜后,选择重组克隆。
实施例2rplK基因的分离与测序
用Qiaprep Spin微量制备试剂盒(产品号27106,Qiagen,Hilden,德国)根据厂商指导分离单个菌落的粘粒DNA,并用限制性内切酶Sau 3AⅠ(Amersham Pharmacia,Freiburg,德国,产品描述Sau 3AⅠ,编码27-0913-02)部分酶切。用虾碱性磷酸酶(Roche分子生物化学品公司,德国曼海姆,产品描述SAP,编码1758250)将DNA片段去磷酸化。经凝胶电泳分离后,用QiaExⅡ凝胶提取试剂盒(产品号20021,Qiagen,Hilden,德国)分离大小范围为1500-2000bp的粘粒片段。将得自Invitrogen公司(Groningen,荷兰,产品描述Zero背景克隆试剂盒,产品号K2500-01)的测序载体pZer0-1的DNA,用限制性内切酶BamHⅠ(Amersham Pharmacia,Freiburg,德国,产品描述BamHⅠ,产品号27-0868-04)酶切。如Sambrook等(1989,分子克隆实验手册,冷泉港)所述进行粘粒片段在测序载体pZero-1中的连接,将DNA混合物与T4连接酶(Pharmacia Biobech,Freiburg,德国)保温过夜。然后将连接混合物电穿孔(Tauch等,1994,FEMS微生物学通信,123:343-7)进大肠杆菌菌株DH5αMCR(Grant,1990,美国科学院院报87:4645-4649),并在含有50mg/l zeocin的LB琼脂(Lennox,1955,病毒学,1:190)上铺板。重组克隆的质粒制备用Biorobot 9600(产品号900200,Qiagen,Hilden,德国)进行。测序用Zimmermann等(1990,核酸研究18:1067)改良的Sanger等(1977,美国科学院院报74:5463-5467)的双脱氧链终止法进行。使用得自PE应用生物系统公司的“RR罗丹明终止循环测序试剂盒”(产品号403044,Weiterstadt,德国),在带有购自PE应用生物系统公司(Weiterstadt,德国)的“ABI Prism377”测序仪的“Rotiphoresis NF丙烯酰胺/双丙烯酰胺”凝胶(29:1)(产品号A124.1,Roth,Karlsruhe,德国)中,进行凝胶电泳分离和序列分析。
所得原始数据资料然后用Staden程序包(1986,核酸研究,14:217-231)版本97-0处理。pZero-1衍生物的各个序列组装成连续重叠群。用XNIP程序(Staden,1986,核酸研究,14:217-231)进行计算机辅助编码区分析。用“BLAST搜索程序”(Altschul等,1997,核酸研究,25:3389-3402)对“国家生物技术信息中心”(NCBI,Bethesda,MD,USA)的非冗余数据库进行进一步分析。
获得的核苷酸序列如SEQ ID NO:1所示,对该核苷酸序列的分析显示438碱基对的开放读框,其被称为rplK基因。rplK基因编码145个氨基酸的多肽,如SEQ ID NO:2所示。
实施例3:制备具有rplK基因拷贝的载体
利用PCR克隆含有谷氨酸棒杆菌rplK基因的染色体1200bp的DNA片段。
此染色体DNA如Tauch等所述(1995,质粒33:168-179)分离自谷氨酸棒杆菌ATCC13032。含有rplK基因的一个1200bp的DNA片段通过聚合酶链反应(PCR)扩增。另外,以下引物是基于SEQ ID NO:1衍生的:
P1正向引物(SEQ ID NO:5):
5’-AGG AGC AGG CTG TTG TCA CC-3’
P2反向引物(SEQ ID NO:6):
5’-GCG GAT AGC TAC TGC GAT GG-3’
通过ARK科技公司(ARK科技有限公司系统,Darmstadt,德国)合成所示的寡核苷酸,并用Pfu-DNA聚合酶(Stratagene,La Jolla,美国)和PTC100热循环仪(MJ Research Inc.,Waltham,美国)进行PCR。
PCR进行35次循环,每次循环包括热变性(94℃,90秒),退火(58℃,90秒)和聚合酶反应(72℃,90秒)。所得1200bp的DNA片段然后通过Qiagen PCR纯化自旋试剂盒(Qiagen,Hilden,德国)纯化。
为将含有rplK基因的DNA扩增物克隆在能在谷氨酸棒杆菌中复制的质粒中,制备Tauch等所述质粒pECM2(FEMS微生物学通信23,343-347(1994))的缺失衍生物pECM3。为此质粒pECM2用限制酶BamHⅠ(Amersham-Pharmacia,Freiburg,德国)和BglⅡ(Amersham-Pharmacia,Freiburg,德国)消化,并用T4连接酶(Amersham-Pharmacia,Freiburg,德国)处理,如Sambrook等所述(分子克隆实验手册,冷泉港实验室(1989)),这样产生质粒pECM3。用pECM3根据Tauch等所述(FEMS微生物学通信23,343-347(1994))转化Grant等所述(Proceedings of National Academy ofScience USA87,4645-4649(1990))的大肠杆菌菌株DH5α MCR。在已加入氯霉素(Merck,Darmstadt,德国)(50mg/l)的LBG琼脂(10g胰化蛋白胨,5g酵母提取物,5gNaCl,2g葡萄糖,15g琼脂/升)上选择转化体。
然后将含rplK基因的1200bp DNA扩增物与质粒pECM3混合并用T4DNA连接酶(Amersham-Pharmacia,Freiburg,德国)处理而产生质粒prplK,质粒pECM3已预先用限制酶SmaⅠ(Amersham-Pharmacia,Freiburg,德国)线性化。用质粒prplK如Tauch等所述(FEMS微生物学通信23,343-347(1994))转化大肠杆菌菌株DH5αMCR,并在已加入氯霉素(Merck,Darmstadt,德国)(50mg/l)的LBG琼脂上转择转化体。质粒prplK因此携带谷氨酸棒杆菌的完整rplK基因,且能在大肠杆菌和谷氨酸棒杆菌中自主复制。
实施例4:在rplK基因中引入缺失
通过PCR制备缺失12bp长并称为ΔrplK的rplK基因的等位基因。rplK基因中缺失12bp导致谷氨酸棒杆菌L11蛋白N末端缺失四肽脯氨酸-丙氨酸-亮氨酸-甘氨酸。
作为产生rplK缺失等位基因的引物,除实施例3中所述的P1正向引物和P2反向引物之外,还使用以下通过ARK科技(ARK科技有限公司生物系统,Darmstadt,德国)制备的寡核苷酸:
P1反向引物(SEQ ID NO:7):
5’-延伸-CGC CGT GAG C-5’-侧-GCC AAC TGG AGGAGC AGG GT-3’
P2正向引物(SEQ ID NO:8)
5’-延伸-TCC AGT TGG C-5’-侧-GCT CAC GGC GTCAAC ATC AG-3’。
用于PCR的引物衍生自己知DNA序列。每种引物均具有10bp的5’延伸,其精确地互补于P1正向引物和P2反向引物的5’侧。染色体DNA提取自谷氨酸棒杆菌ATCC13032,首先使用该DNA在独立的PCR反应中生产二个600bp的DNA片段,PCR使用寡核苷酸P1正向引物,P1反向引物,P2正向引物和P2反向引物,Pfu DNA聚合酶(Stratagene,La Jolla,美国)和PTC100热循环仪(MJ ResearchInc.,Waltham,美国)进行。每个PCR进行35次循环,每次循环包括热变性(94℃,90秒),退火(58℃,90秒)和聚合酶反应(72℃,90秒)。
第一个600bp DNA扩增物称为rplK部分1,是使用寡核苷酸P1正向和P1反向引物获得的。其含有rplK基因的5’区(1-87位核苷酸),及衍生自寡核苷酸P1反向引物并相当于rplK基因(SEQ IDNO:1)的100-109位核苷酸的10bp延伸。因此此扩增的rplK基因区与使用的染色体DNA模板相对比有一个12bp的间隔。第二个600bp DNA片段称为rplK部分2,是使用寡核苷酸P2反向和P2正向引物获得的,其含有rplK基因的3’区(78-435位核苷酸)并在扩增在的rplK基因区中携带相同的间隔(88-99位核苷酸)。这二个600bp PCR产物rplK部分1和rplK部分2因此具有一个20bp的重叠DNA区。这两个600bp的PCR产物rplK部分1和rplK部分2一起用于第一PCR反应作为DNA模板,其中由于重叠互补DNA区,rplK部分1的引导链可与rplK部分2的后随链结合。此重叠DNA区的延伸或寡核苷酸引物P1正向和P2反向引物的加入可形成1200bp的PCR扩增物,其含有谷氨酸棒杆菌rplK基因的12bp缺失衍生物。每个PCR进行35次循环,每次循环包括热变性(94℃,90秒),退火(58℃,90℃),及聚合酶反应(72℃,90秒)。
ΔrplK等位基因的核苷酸序列如SEQ ID NO:3所示,由此等位基因编码的L11蛋白的变体如SEQ ID NO:4所示。此L11蛋白变体缺失相当于SEQ ID NO:2所示野生型L11蛋白的30~33位氨基酸的四肽脯氨酸-丙氨酸-亮氨酸-甘氨酸。
实施例5:ΔrplK等位基因插入染色体
含有rplK基因中12bp缺失的ΔrplK等位基因,通过Schafer等所述的sacB系统(基因14,69-73(1994))经整合诱变插入谷氨酸棒杆菌的染色体中。此系统能鉴别或选择通过同源重组产生的等位基因置换。
1、构建置换载体pΔrplK
实施例4中获得的1200bp的rplK缺失等位基因ΔrplK用QiagenPCR纯化自旋试剂盒(Qiagen,Hilder,德国)纯化,并用于与Schafer等所述的可活动克隆载体pK18mobsacB(基因14,69-73(1994))连接。此载体预先用限制酶SmaⅠ(Amersham-Pharmacia,Freiburg,德国)线性化,与rplK缺失等位基因混合并用T4 DNA连接酶(Amersham-Pharmacia,Freiburg,德国)处理。
所得质粒为p/ΔrplK。
如Tauch等所述(FEMS微生物学通信23,343-347(1994)),用质粒pΔrplK转化大肠杆菌DH5α。在已加入50mg/l卡那霉素(Merck,Darmstadt,德国)的LBG琼脂上选择转化体。以此方式获得菌株DH5α/pΔrplK。
选择并鉴定的克隆为ATCC13032ΔrplK。
2、进行等位基因置换
用Schafer等所述的sacB系统(基因14,69-73(1994))经整合诱变获得谷氨酸棒杆菌rplK基因的染色体12bp缺失体。此系统能鉴别或选择通过同源重组产生的等位基因置换。
可活动的质粒pΔrplK然后用Schafer所述接合法(细菌学杂志172,1663-1666(1990))插入受体谷氨酸棒杆菌菌株ATCC13032中,如Simon等所述(生物/技术1,784-794(1993))的大肠杆菌菌株S17-1作为供体。由于质粒pΔrplK不能在谷氨酸酸杆菌中复制,建立其只能通过在质粒编码的rplK缺失片段与相同染色体rplK基因区之间同源重组而整合入谷氨酸棒杆菌染色体中。在已加入25mg/l卡那霉素(Merck,Darmstadt,德国)和50mg/l萘啶酮酸(Merck,Darmstadt,德国)的LBG琼脂上选择转接合物。
选择借助于sacB系统质粒pΔrplK的随后切除可只用rplK的野生型等位基因进行。将实施例3中构建的含有完整rplK基因的质粒prplK,通过Liebl所述方法(FEMS微生物学通信65,299-304(1989))经电穿孔转移至整合菌株中。在已加入25mg/l卡那霉素(Merck,Darmstadt,德国)和10mg/l氯霉素(Merck,Darmstadt,德国)的LBG琼脂上选择菌株。
将选择的转化菌落转接种于100ml LGB液态培养基(在具有挡板的250ml Erlenmeyer烧瓶中),并在30℃,以300rpm培养24h。然后将2×106个细胞/ml的此液体培养物施加于含有10%蔗糖(Merck,Darmstadt,德国)的LBG琼脂上,并在30℃培养48h。在此培养基上能生长的谷氨酸棒杆菌细胞由于rplK缺失等位基因与天然rplK区之间的第二次重组已丧失整合的质粒pΔrplK。此第二次重组导致重新形成天然染色体rplK基因排列或产生12bp N末端DNA片段缺失的谷氨酸棒杆菌pΔrplK突变体。自选择的“有蔗糖抗性的”及携带潜在pΔrplK的谷氨酸棒杆菌细胞提取染色体DNA。用其作基质,用rplK序列衍生寡核苷酸Pdel正向和Pdel反向2引物(ARK ScientificGmbH Biosystems,Darmstadt,德国)。用此引物,Pfu DNA聚合酶(Stratagene,La Jolla,USA)和PTC100热循环仪(MJ Research Inc.,Waltham,USA)和PTC100热循环仪(MJ Research Inc.,Waltham.USA)进行PCR。PCR进行35次循环,每次循环包括热变性(94℃,90秒),退火(58℃,90秒)和聚合酶反应(72℃,90秒)。然后所得DNA扩增物用Qiagen PCR纯化自旋试剂盒(Qiagen,Hilden,德国)纯化。如上所述分析纯化的DNA扩增物的核苷酸序列,示出43%情况中缺失12bp DNA区的DNA扩增物已产生。因此,在相关携带pΔrplK的转接合物中,第二次重组导致rplK基因中形成成染色体12bp缺失体。
然后通过Schafer所述的质粒清除法(细菌学杂志176,7309-7319(1994)),将质粒prplK从选择的具有缺失体的转接合物中除去。所得菌株谷氨酸棒杆菌ATCC13032ΔrplK因此携带rplK基因中的染色体12bp缺失,其导致丧失L11蛋白的四肽脯氨酸-丙氨酸-亮氨酸-甘氨酸。
实施例6:制备赖氨酸
将实施例5中所得的谷氨酸棒杆菌菌株ATCC13032ΔrplK在适于生产赖氨酸的营养培养基中培养,并确定培养物上清中赖氨酸含量。
为此,首先在33℃在琼脂板(脑心琼脂)上培养菌株24小时。此琼脂板培养物用于接种预培养物(10ml培养基于100ml锥形瓶)。用于预培养的培养基是完全培养基CgⅢ(10g/Lbacto肽胨,10g/L酵母膏,2.5g/LNaCl,20g/L葡萄糖,pH7.4)。在摇床上于33℃以240rpm振荡预培养物24小时。此预培养物接种主培养物,从而主培养物的起始OD(波长660nm)为0.1。培养基MM用作主培养物。
培养基MM:
CSL(玉米浆) 5g/l
MOPS(吗啉代丙磺酸) 20g/l
葡萄糖(单独高压灭菌) 50g/l
(NH4)2SO4 25g/l
KH2PO4 0.1g/l
MgSO4·7H2O 1.0g/l
CaCl2·2H2O 10mg/l
FeSO4·7H2O 10mg/l
MnSO4·H2O 5.0mg/l
生物素(过滤灭菌) 0.3mg/l
硫胺素·HCl(过滤灭菌) 0.2mg/l
CaCO3 25g/l
用氨水将CSL,MOPS和盐溶液调至PH7并高压灭菌。然后加入无菌的底物和维生素溶液,并加入干态高压灭菌的CaCO3。
以在具有档板的100ml锥形瓶中的10ml体积进行培养。在33℃和80%大气湿度下进行培养。
48小时后,用Biomek1000(Beckmann Instruments GmbH,Munich)测定在660nm波长的OD。用Eppendorf-BioTronik公司的氨基酸分析仪(汉堡,德国)经离子交换层析和用茚三酮检测柱后衍生化而确定赖氨酸生成量。
实验结果示于表1。
表1菌株OD(660)赖氨酸·HCl g/LATCC13032ΔrplK13.00.98ATCC1303213.80.0序列表<110>德古萨股份公司<120>编码rplK基因的核苷酸序列及其使用方法<130>990178 BT<140><141><160>8<170>PatentIn Ver.2.1<210>1<211>835<212>DNA<213>谷氨酸棒杆菌<220><221>CDS<222>(201)..(635)<223>rplK-基因<400>1ttgcgtgtag ggtagacaat cgcgtgtttt ttaagcatgc tcaaaatcat tcatccccgg 60tggcccggtt acgtaaagat cagcaaagat gatcaactaa agcgatcatc tgaagttgta 120gcgggaccga gcatccggac ggttactagt ggggtttcat cgtcccagtt gtggccggta 180acaaggaagc aggtttaacg atg gct cct aag aag aag aag aag gtc act ggc 233
Met Ala Pro Lys Lys Lys Lys Lys Val Thr Gly
1 5 10ctc atc aag ctc cag atc cag gca gga cag gca aac cct gct cct cca 281Leu Ile Lys Leu Gln Ile Gln Ala Gly Gln Ala Asn Pro Ala Pro Pro
15 20 25gtt ggc cca gca ctt ggt gct cac ggc gtc aac atc atg gaa ttc tgc 329Val Gly Pro Ala Leu Gly Ala His Gly Val Asn Ile Met Glu Phe Cys
30 35 40aag gct tac aac gct gcg act gaa aac cag cgc ggc aac gtt gtt cct 377Lys Ala Tyr Asn Ala Ala Thr Glu Asn Gln Arg Gly Asn Val Val Pro
45 50 55gtt gag atc acc gtt tac gaa gac cgt tca ttc gac ttc aag ctg aag 425Val Glu Ile Thr Val Tyr Glu Asp Arg Ser Phe Asp Phe Lys Leu Lys 60 65 70 75act cct cca gct gca aag ctt ctt ctg aag gct gct ggc ctg cag aag 473Thr Pro Pro Ala Ala Lys Leu Leu Leu Lys Ala Ala Gly Leu Gln Lys
80 85 90ggc tcc ggc gtt cct cac acc cag aag gtc ggc aag gtt tcc atg gct 521Gly Ser Gly Val Pro His Thr Gln Lys Val Gly Lys Val Ser Met Ala
95 100 105cag gtt cgt gag atc gct gag acc aag aag gaa gac ctg aac gct cgc 569Gln Val Arg Glu Ile Ala Glu Thr Lys Lys Glu Asp Leu Ash Ala Arg
110 115 120gat atc gac gct gct gcg aag atc atc gct ggt acc gct cgt tcc atg 617Asp Ile Asp Ala Ala Ala Lys Ile Ile Ala Gly Thr Ala Arg Ser Met
125 130 135ggc atc acc gtc gaa ggc taaaagcttt cacaccggtt agtggctcat 665Gly Ile Thr Val Glu Gly140 145tcaaaatgaa tggccaccaa ccaattttca ccaaagtttt atgtggcagg gccagctccg 725gcccgttaaa ccacagaatt ccatgaaagg gaatttctaa tgagcaagaa ctctaaggcg 785taccgcgagg ccgctgagaa gatcgacgct ggtcgcatct actccccact 835<210>2<211>145<212>PRT<213>谷氨酸棒杆菌<400>2Met Ala Pro Lys Lys Lys Lys Lys Val Thr Gly Leu Ile Lys Leu Gln 1 5 10 15Ile Gln Ala Gly Gln Ala Asn Pro Ala Pro Pro Val Gly Pro Ala Leu
20 25 30Gly Ala His Gly Val Asn Ile Met Glu Phe Cys Lys Ala Tyr Asn Ala
35 40 45Ala Thr Glu Asn Gln Arg Gly Asn Val Val Pro Val Glu Ile Thr Val
50 55 60Tyr Glu Asp Arg Set Phe Asp Phe Lys Leu Lys Thr Pro Pro Ala Ala 65 70 75 80Lys Leu Leu Leu Lys Ala Ala Gly Leu Gln Lys Gly Ser Gly Val Pro
85 90 95His Thr Gln Lys Val Gly Lys Val Ser Met Ala Gln Val Arg Glu Ile
100 105 110Ala Glu Thr Lys Lys Glu Asp Leu Asn Ala Arg Asp Ile Asp Ala Ala
115 120 125Ala Lys Ile Ile Ala Gly Thr Ala Arg Set Met Gly Ile Thr Val Glu
130 135 140Gly145<210>3<211>825<212>DNA<213>谷氨酸棒杆菌<220><221>CDS<222>(200)..(622)<223>delta rplK<400>3tgcgtgtagg gtagacaatc gcgtgttttt taagcatgct caaaatcatt catccccggt 60ggcccggtta cgtaaagatc agcaaagatg atcaactaaa gcgatcatct gaagttgtag 120cgggaccgag catccggacg gttactagtg gggtttcatc gtcccagttg tggccggtaa 180caaggaagca ggtttaacg atg gct cct aag aag aag aag aag gtc act ggc 232
Met Ala Pro Lys Lys Lys Lys Lys Val Thr Gly
1 5 10ctc atc aag ctc cag atc cag gca gga cag gca aac cct gct cct cca 280Leu Ile Lys Leu Gln Ile Gln Ala Gly Gln Ala Ash Pro Ala Pro Pro
15 20 25gtt ggc gct cac ggc gtc aac atc atg gaa ttc tgc aag gct tac aac 328Val Gly Ala His Gly Val Asn Ile Met Glu Phe Cys Lys Ala Tyr Asn
30 35 40gct gcg act gaa aac cag cgc ggc aac gtt gtt cct gtt gag atc acc 376Ala Ala Thr Glu Asn Gln Arg Gly Asn Val Val Pro Val Glu Ile Thr
45 50 55gtt tac gaa gac cgt tca ttc gac ttc aag ctg aag act cct cca gct 424Val Tyr Glu Asp Arg Ser Phe Asp Phe Lys Leu Lys Thr Pro Pro Ala 60 65 70 75gca aag ctt ctt ctg aag gct gct ggc ctg cag aag ggc tcc ggc gtt 472Ala Lys Leu Leu Leu Lys Ala Ala Gly Leu Gln Lys Gly Ser Gly Val
80 85 90cct cac acc cag aag gtc ggc aag gtt tcc atg gct cag gtt cgt gag 520Pro His Thr Gln Lys Val Gly Lys Val Ser Met Ala Gln Val Arg Glu
95 100 105atc gct gag acc aag aag gaa gac ctg aac gct cgc gat atc gac gct 568Ile Ala Glu Thr Lys Lys Glu Asp Leu Asn Ala Arg Asp Ile Asp Ala
110 115 120gct gcg aag atc atc gct ggt acc gct cgt tcc atg ggc atc acc gtc 616Ala Ala Lys Ile Ile Ala Gly Thr Ala Arg Ser Met Gly Ile Thr Val
125 130 135gaa ggc taaaagcttt cacaccggtt agtggctcat tcaaaatgaa tggccaccaa 672Glu Gly140ccaattttca ccaaagtttt atgtggcagg gccagctccg gcccgttaaa ccacagaatt 732ccatgaaagg gaatttctaa tgagcaagaa ctctaaggcg taccgcgagg ccgctgagaa 792gatcgacgct ggtcgcatct actccccact cga 825<210>4<211>141<212>PRT<213>谷氨酸棒杆菌<400> 4Met Ala Pro Lys Lys Lys Lys Lys Val Thr Gly Leu Ile Lys Leu Gln 1 5 10 15Ile Gln Ala Gly Gln Ala Asn Pro Ala Pro Pro Val Gly Ala His Gly
20 25 30Val Asn Ile Met Glu Phe Cys Lys Ala Tyr Asn Ala Ala Thr Glu Asn
35 40 45Gln Arg Gly Asn Val Val Pro Val Glu Ile Thr Val Tyr Glu Asp Arg
50 55 60Ser Phe Asp Phe Lys Leu Lys Thr Pro Pro Ala Ala Lys Leu Leu Leu 65 70 75 80Lys Ala Ala Gly Leu Gln Lys Gly Ser Gly Val Pro His Thr Gln Lys
85 90 95Val Gly Lys Val Ser Met Ala Gln Val Arg Glu Ile Ala Glu Thr Lys
100 105 110Lys Glu Asp Leu Asn Ala Arg Asp Ile Asp Ala Ala Ala Lys Ile Ile
115 120 125Ala Gly Thr Ala Arg Ser Met Gly Ile Thr Val Glu Gly
130 135 140<210>5<211>20<212>DNA<213>人工序列<220><223>引物P1-up<220><223>人工序列的描述:引物<400>aggagcaggc tgttgtcacc 20<210>6<211>20<212>DNA<213>人工序列<220><223>P2-down<220><223>人工序列的描述:引物<400>6gcggatagct acgtcgatgg 20<210>7<211>30<212>DNA<213>人工序列<220><223>P1-down<220><223>人工序列的描述:引物<400>7cgccgtgagc gccaactgga ggagcagggt 30<210>8<211>30<212>DNA<213>人工序列<220><223>P2-up<220><223>人工序列的描述:引物<400>8tccagttggc gctcacggcg tcaacatcag