具有改善的酯合酶特性的酶变体.pdf

上传人:万林****人 文档编号:8678977 上传时间:2020-11-23 格式:PDF 页数:187 大小:13.30MB
返回 下载 相关 举报
摘要
申请专利号:

CN201380058918.5

申请日:

20130315

公开号:

CN104955944A

公开日:

20150930

当前法律状态:

有效性:

审查中

法律详情:

IPC分类号:

C12N9/10,C12P7/64,C12N1/21,C12N1/15,C12N9/18

主分类号:

C12N9/10,C12P7/64,C12N1/21,C12N1/15,C12N9/18

申请人:

REG生命科学有限责任公司

发明人:

A·舒马克,B·M·达寇斯塔,K·霍尔登,L·G·霍尔姆,T·S·巴隆,N·海尔曼

地址:

美国加利福尼亚

优先权:

61/701,191,61/708,424

专利代理机构:

中国国际贸易促进委员会专利商标事务所

代理人:

袁泉

PDF下载: PDF下载
内容摘要

公开内容涉及用于生产脂肪酸酯的、具有改善的酯合酶特性的酶变体。进一步考虑的是表达此类变体的重组宿主细胞、包含重组宿主细胞的细胞培养物和由此类重组宿主细胞产生的脂肪酸酯组合物。

权利要求书

1.一种包含SEQ ID NO:2的变体酯合酶多肽,其中所述变体酯合酶多肽遗传改造为具有在选自下述氨基酸位的氨基酸位置处的至少一个突变:4、5、7、15、24、30、33、39、40、41、43、44、58、73、76、77、78、80、98、99、101、102、111、122、131、146、147、149、150、155、157、162、164、166、170、171、172、173、177、179、182、184、185、186、187、188、190、192、193、195、197、201、202、203、206、207、212、216、219、234、239、242、243、244、246、255、257、258、259、260、262、263、264、265、266、267、285、288、289、293、294、301、302、303、304、306、307、309、310、311、313、314、315、316、317、319、320、323、328、334、348、349、351、352、353、356、357、360、366、375、381、393、394、395、409、411、413、420、424、442、443、447、454、455、457、458、461、466、468和472,其中与相应的野生型多肽相比较,所述变体酯合酶多肽具有改善的脂肪酸甲酯活性。 2.权利要求1的变体酯合酶多肽,其中所述多肽是除烃海杆菌(WS377)酯合酶多肽。 3.权利要求1的变体酯合酶多肽,其中与表达所述相应的野生型多肽的重组宿主细胞相比较,所述变体酯合酶多肽在重组宿主细胞中的表达导致更高滴度的脂肪酯组合物。 4.权利要求3的变体酯合酶,其中所述滴度是至少约5%或更大。 5.权利要求3的变体酯合酶,其中所述脂肪酯组合物选自脂肪酸甲酯、脂肪酸乙酯、脂肪酸丙酯、脂肪酸异丙酯、脂肪酸丁酯、甘油单酯、脂肪酸异丁酯、脂肪酸2-丁酯和脂肪酸叔丁酯。 6.权利要求1的变体酯合酶,其中所述改善的脂肪酸甲酯活性产生选自增加的β羟基酯、减少的β羟基酯、增加的脂肪酸酯链长和减少的脂肪酸酯链长的性质。 7.权利要求1的变体酯合酶多肽,其中所述变体酯合酶多肽具有在选自下述氨基酸位的氨基酸位置处的突变:7、24、30、41、99、111、122、146、147、149、150、171、172、173、179、187、192、212、234、239、244、246、258、264、266、267、285、301、302、303、304、306、307、309、310、311、313、314、315、316、320、348、349、352、356、357、360、375、381、393、409、411、424、443、455、457、458、461和472。 8.权利要求7的变体酯合酶多肽,其中与表达所述相应的野生型酯合酶多肽的重组宿主细胞相比较,所述变体酯合酶多肽在重组宿主细胞中的表达导致产生改变百分比的β羟基酯。 9.权利要求8的变体酯合酶多肽,其中所述改变百分比的β羟基酯是增加或减少百分比的β羟基酯。 10.权利要求1的变体酯合酶多肽,其中所述变体酯合酶多肽具有在选自下述氨基酸位的氨基酸位置处的突变:5、7、15、24、33、44、58、73、78、101、111、162、171、179、184、187、188、192、201、207、212、234、243、244、255、257、267、307、310、317、320、348、349、353、357、366、381、394、409、411、413、442、443和461。 11.根据权利要求10的变体酯合酶多肽,其包含在第5位氨基酸处的突变。 12.根据权利要求10的变体酯合酶多肽,其包含在第7位氨基酸处的突变。 13.根据权利要求10的变体酯合酶多肽,其包含在第15位氨基酸处的突变。 14.根据权利要求10的变体酯合酶多肽,其包含在第24位氨基酸处的突变。 15.根据权利要求10的变体酯合酶多肽,其包含在第33位氨基酸处的突变。 16.根据权利要求10的变体酯合酶多肽,其包含在第44位氨基酸处的突变。 17.根据权利要求10的变体酯合酶多肽,其包含在第48位氨基酸处的突变。 18.根据权利要求10的变体酯合酶多肽,其包含在第73位氨基酸处的突变。 19.根据权利要求10的变体酯合酶多肽,其包含在第78位氨基酸处的突变。 20.根据权利要求10的变体酯合酶多肽,其包含在第101位氨基酸处的突变。 21.根据权利要求10的变体酯合酶多肽,其包含在第111位氨基酸处的突变。 22.根据权利要求10的变体酯合酶多肽,其包含在第162位氨基酸处的突变。 23.根据权利要求10的变体酯合酶多肽,其包含在第171位氨基酸处的突变。 24.根据权利要求10的变体酯合酶多肽,其包含在第179位氨基酸处的突变。 25.根据权利要求10的变体酯合酶多肽,其包含在第184位氨基酸处的突变。 26.根据权利要求10的变体酯合酶多肽,其包含在第187位氨基酸处的突变。 27.根据权利要求10的变体酯合酶多肽,其包含在第188位氨基酸处的突变。 28.根据权利要求10的变体酯合酶多肽,其包含在第192位氨基酸处的突变。 29.根据权利要求10的变体酯合酶多肽,其包含在第201位氨基酸处的突变。 30.根据权利要求10的变体酯合酶多肽,其包含在第207位氨基酸处的突变。 31.根据权利要求10的变体酯合酶多肽,其包含在第212位氨基酸处的突变。 32.根据权利要求10的变体酯合酶多肽,其包含在第234位氨基酸处的突变。 33.根据权利要求10的变体酯合酶多肽,其包含在第243位氨基酸处的突变。 34.根据权利要求10的变体酯合酶多肽,其包含在第244位氨基酸处的突变。 35.根据权利要求10的变体酯合酶多肽,其包含在第255位氨基酸处的突变。 36.根据权利要求10的变体酯合酶多肽,其包含在第257位氨基酸处的突变。 37.根据权利要求10的变体酯合酶多肽,其包含在第267位氨基酸处的突变。 38.根据权利要求10的变体酯合酶多肽,其包含在第307位氨基酸处的突变。 39.根据权利要求10的变体酯合酶多肽,其包含在第310位氨基酸处的突变。 40.根据权利要求10的变体酯合酶多肽,其包含在第317位氨基酸处的突变。 41.根据权利要求10的变体酯合酶多肽,其包含在第320位氨基酸处的突变。 42.根据权利要求10的变体酯合酶多肽,其包含在第348位氨基酸处的突变。 43.根据权利要求10的变体酯合酶多肽,其包含在第349位氨基酸处的突变。 44.根据权利要求10的变体酯合酶多肽,其包含在第353位氨基酸处的突变。 45.根据权利要求10的变体酯合酶多肽,其包含在第357位氨基酸处的突变。 46.根据权利要求10的变体酯合酶多肽,其包含在第366位氨基酸处的突变。 47.根据权利要求10的变体酯合酶多肽,其包含在第381位氨基酸处的突变。 48.根据权利要求10的变体酯合酶多肽,其包含在第394位氨基酸处的突变。 49.根据权利要求10的变体酯合酶多肽,其包含在第409位氨基酸处的突变。 50.根据权利要求10的变体酯合酶多肽,其包含在第411位氨基酸处的突变。 51.根据权利要求10的变体酯合酶多肽,其包含在第413位氨基酸处的突变。 52.根据权利要求10的变体酯合酶多肽,其包含在第442位氨基酸处的突变。 53.根据权利要求10的变体酯合酶多肽,其包含在第443位氨基酸处的突变。 54.根据权利要求10的变体酯合酶多肽,其包含在第461位氨基酸处的突变。 55.根据权利要求1的变体酯合酶多肽,其包含选自下述氨基酸的至少一个突变:G4R、T5P、T5S、D7N、S15G、T24M、T24W、L30H、G33D、G33S、L39A、L39M、L39S、R40S、D41A、D41G、D41H、D41Y、V43K、V43S、T44A、T44F、T44K、Y58C、Y58L、A73Q、V76L、D77A、K78F、K78W、I80V、R98D、E99Q、G101L、I102R、P111D、P111G、P111S、H122S、R131M、I146K、I146L、I146R、S147A、V149L、R150P、V155G、T157S、R162E、N164D、N164R、P166S、T170R、T170S、V171E、V171F、V171H、V171R、V171W、R172S、R172W、P173W、R177V、A179S、A179V、D182G、E184F、E184G、E184L、E184R、E184S、A185L、A185M、S186T、V187G、V187R、P188R、A190P、A190R、A190W、S192A、S192L、S192V、Q193R、Q193S、M195G、A197T、A197V、Q201A、Q201V、Q201W、A202L、D203R、P206F、R207A、G212A、G212L、V216I、V219L、V234C、H239G、T242K、T242R、A243R、Q244G、R246A、R246G、R246L、R246Q、R246V、R246W、D255E、L257I、K258R、N259E、N259Q、L260V、H262Q、A263V、S264D、S264V、S264W、G265N、G266A、G266S、S267G、A285L、A285R、A285V、N288D、N289E、N289G、T293A、P294G、V301A、N302G、I303G、I303R、I303W、R304W、A306G、D307F、D307G、D307L、D307N、D307R、D307V、E309A、E309G、E309S、G310H、G310R、G310V、T311S、T313S、Q314G、I315F、S316G、F317W、I319G、A320C、A323G、D328F、Q334K、Q334S、Q348A、Q348R、K349A、K349C、K349H、K349Q、P351G、K352I、K352N、S353K、S353T、T356G、T356W、Q357V、M360Q、M360R、M360S、M360W、Y366G、Y366W、G375A、G375V、G375S、V381F、E393G、E393R、E393W、G394E、T395E、V409L、L411A、A413T、I420V、S424G、S424Q、S442E、S442G、M443G、A447C、A447I、A447L、L454V、D455E、L457Y、E458W、I461G、I461L、I461V、K466N、A468G、K472T和K472。 56.根据权利要求55的变体酯合酶多肽,其中所述酯合酶多肽包含突变D7N、A179V和V381F。 57.根据权利要求55的变体酯合酶多肽,其中所述酯合酶多肽包含突变D7N、A179V、Q348R和V381F。 58.根据权利要求55的变体酯合酶多肽,其中所述酯合酶多肽包含突变D7N、A179V、V187R、G212A、Q357V、V381F和M443G。 59.根据权利要求55的变体酯合酶多肽,其中所述酯合酶多肽包含突变T5S、S15G、P111S、V171R、P188R、F317W、S353T、V409L和S442G。 60.根据权利要求55的变体酯合酶多肽,其中所述酯合酶多肽包含突变T5S、S15G、K78F、P111S、V171R、P188R、S192V、A243R、F317W、K349H、S353T、V409L和S442G。 61.根据权利要求55的变体酯合酶多肽,其中所述酯合酶多肽包含突变T5S、S15G、V76L、P111S、V171R、P188R、K258R、S316G、F317W、S353T、M360R、V409L和S442G。 62.根据权利要求55的变体酯合酶多肽,其中所述酯合酶多肽包含突变T5S、S15G、P111S、V171R、P188R、Q244G、S267G、G310V、F317W、A320C、S353T、Y366W、V409L和S442G。 63.根据权利要求55的变体酯合酶多肽,其中所述酯合酶多肽包含突变S15G、P111S、V155G、P166S、V171R、P188R、F317W、Q348A、S353T、V381F、V409L和S442G。 64.根据权利要求55的变体酯合酶多肽,其中所述酯合酶多肽包含突变S15G、L39S、D77A、P111S、V171R、P188R、T313S、F317W、Q348A、S353T、V381F、V409L、I420V和S442G。 65.根据权利要求55的变体酯合酶多肽,其中所述酯合酶多肽包含突变T5S、S15G、T24W、T44F、P111S、I146L、V171R、P188R、D307N、F317W、S353T、V409L和S442G。 66.根据权利要求55的变体酯合酶多肽,其中所述酯合酶多肽包含突变T5S、S15G、K78F、P111S、V171R、P188R、S192V、R207A、A243R、D255E、L257I、N259Q、L260V、H262Q、G265N、A285V、N288D、N289G、F317W、Q348R、S353T、V381F、V409L和S442G。 67.根据权利要求55的变体酯合酶多肽,其中所述酯合酶多肽包含突变T5S、S15G、K78F、P111S、V171R、P188R、S192V、R207A、A243R、D255E、L257I、N259Q、L260V、H262Q、G265N、A285V、N288D、N289G、F317W、H349K、S353T、V381F、V409L和S442G。 68.根据权利要求55的变体酯合酶多肽,其中所述酯合酶多肽包含突变T5P、S15G、G33D、T44K、Y58L、P111S、R162E、V171R、P188R、R207A、V234C、Q244G、D255E、S267G、D307N、G310V、F317W、A320C、S353T、Y366W、G394E、V409L、S442G和I461V。 69.根据权利要求55的变体酯合酶多肽,其中所述酯合酶多肽包含突变T5P、S15G、G33D、T44K、Y58C、P111S、V171R、P188R、R207A、V234C、Q244G、L257I、S267G、D307N、G310V、F317W、A320C、S353T、Y366W、G394E、V409L、A413T、S442G和I461V。 70.根据权利要求55的变体酯合酶多肽,其中所述酯合酶多肽包含突变T5P、S15G、T44A、P111S、T157S、N164D、T170S、V171R、P188R、R207A、V216I、V234C、Q244G、L257I、S267G、D307N、G310V、F317W、A320C、Q334K、S353T、Y366W、G394E、V409L、S442G和I461V。 71.根据权利要求55的变体酯合酶多肽,其中所述酯合酶多肽包含突变T5P、S15G、Y58L、P111S、R162E、T170S、V171R、A179S、P188R、R207A、V234C、Q244G、L257I、S267G、D307N、G310V、F317W、A320C、S353K、Y366W、G394E、V409L、S442G和I461V。 72.一种重组宿主细胞,其遗传改造为表达根据权利要求1-71中任一项的变体酯合酶多肽。 73.一种培养的重组宿主细胞,其包含编码根据权利要求1-71中任一项的变体酯合酶多肽的多核苷酸序列,其中当在含有碳源的培养基中在有效表达所述变体酯合酶多肽的条件下进行培养时,与表达所述相应的野生型多肽的宿主细胞相比较,所述重组宿主细胞在表达所述变体酯合酶多肽时,产生具有脂肪酸酯的更高滴度、更高得率和/或更高生产率的脂肪酸酯组合物。 74.权利要求73的培养的重组宿主细胞,其中所述滴度是至少约5%或更大。 75.一种培养的重组宿主细胞,其包含编码根据权利要求1-71中任一项的变体酯合酶多肽的多核苷酸序列,其中与表达所述野生型酯合酶多肽的宿主细胞相比较,所述重组宿主细胞在所述表达变体酯合酶多肽时,产生具有改变百分比的β羟基酯的脂肪酯组合物。 76.权利要求75的培养的重组宿主细胞,其中所述改变百分比的β羟基酯是增加百分比的β羟基酯。 77.权利要求75的培养的重组宿主细胞,其中所述改变百分比的β羟基酯是减少百分比的β羟基酯。 78.一种细胞培养物,其包含根据权利要求72-77中任一项的重组宿主细胞和脂肪酯组合物。 79.权利要求78的细胞培养物,其中所述脂肪酯组合物包含C6、C8、C10、C12、C13、C14、C15、C16、C17或C18脂肪酯中的一种或多种。 80.权利要求78的细胞培养物,其中所述脂肪酯组合物包含不饱和脂肪酯。 81.权利要求78的细胞培养物,其中所述脂肪酯组合物包含在距离所述脂肪酯的还原端的C和C之间的碳链中的第7位处的双键。 82.权利要求78的细胞培养物,其中所述脂肪酯组合物包含饱和脂肪酯。 83.权利要求78的细胞培养物,其中所述脂肪酯组合物包含支链脂肪酯。 84.一种包含SEQ ID NO:2的变体除烃海杆菌(WS377)酯合酶多肽,其中与所述野生型WS377多肽相比较,所述变体WS377多肽具有改善的脂肪酸甲酯活性,并且其中所述变体WS377具有在选自下述氨基酸位的氨基酸位置处的至少一个突变:4、5、7、15、24、30、33、39、40、41、43、44、58、73、76、77、78、80、98、99、101、102、111、122、131、146、147、149、150、155、157、162、164、166、170、171、172、173、177、179、182、184、185、186、187、188、190、192、193、195、197、201、202、203、206、207、212、216、219、234、239、242、243、244、246、255、257、258、259、260、262、263、264、265、266、267、285、288、289、293、294、301、302、303、304、306、307、309、310、311、313、314、315、316、317、319、320、323、328、334、348、349、351、352、353、356、357、360、366、375、381、393、394、395、409、411、413、420、424、442、443、447、454、455、457、458、461、466、468和472。 85.一种包含如下氨基酸序列的变体硫酯酶多肽,所述氨基酸序列与SEQ ID NO:51具有至少约90%序列同一性,其中所述变体酯合酶多肽遗传改造为具有在选自下述氨基酸位的氨基酸位置处的至少一个突变:32、33、34、38、45、46、48、49、51、52、76、81、82、84、88、112、115、116、118、119、148、149、156、159和164,其中与所述相应的野生型多肽相比较,所述变体硫酯酶多肽具有更大的酯合酶活性。 86.权利要求85的变体硫酯酶多肽,其中所述多肽是Photobacterium profundum(Ppro)硫酯酶多肽。 87.权利要求85的变体硫酯酶多肽,其中与表达所述相应的野生型多肽的重组宿主细胞相比较,所述变体硫酯酶多肽在重组宿主细胞中的表达导致更高滴度的脂肪酯组合物。 88.权利要求87的变体酯合酶,其中所述滴度是至少约5%或更大。 89.根据权利要求85的变体硫酯酶多肽,其包含在第32位氨基酸处的突变。 90.根据权利要求85的变体硫酯酶多肽,其包含在第33位氨基酸处的突变。 91.根据权利要求85的变体硫酯酶多肽,其包含在第34位氨基酸处的突变。 92.根据权利要求85的变体硫酯酶多肽,其包含在第46位氨基酸处的突变。 93.根据权利要求85的变体硫酯酶多肽,其包含在第48位氨基酸处的突变。 94.根据权利要求85的变体硫酯酶多肽,其包含在第49位氨基酸处的突变。 95.根据权利要求85的变体硫酯酶多肽,其包含在第51位氨基酸处的突变。 96.根据权利要求85的变体硫酯酶多肽,其包含在第52位氨基酸处的突变。 97.根据权利要求85的变体硫酯酶多肽,其包含在第76位氨基酸处的突变。 98.根据权利要求85的变体硫酯酶多肽,其包含在第82位氨基酸处的突变。 99.根据权利要求85的变体硫酯酶多肽,其包含在第84位氨基酸处的突变。 100.根据权利要求85的变体硫酯酶多肽,其包含在第112位氨基酸处的突变。 101.根据权利要求85的变体硫酯酶多肽,其包含在第115位氨基酸处的突变。 102.根据权利要求85的变体硫酯酶多肽,其包含在第116位氨基酸处的突变。 103.根据权利要求85的变体硫酯酶多肽,其包含在第148位氨基酸处的突变。 104.根据权利要求85的变体硫酯酶多肽,其包含在第149位氨基酸处的突变。 105.根据权利要求85的变体硫酯酶多肽,其包含在第156位氨基酸处的突变。 106.根据权利要求85的变体硫酯酶多肽,其包含在第159位氨基酸处的突变。 107.根据权利要求85的变体硫酯酶多肽,其包含选自下述的至少一个突变:K32M、Q33A、Q33R、Q34R、I38Y、I45R、S46K、S46V、S46W、D48E、D48F、D48L、D48M、T49D、T49L,T49V、T49W、G51R、N52C、N52F、N52K、N52L、N52R、N76I、N76L、N76V、G81C、F82G、F82I、F82R、Q84A、Q84L、Q84V、R88H、V112L、N115F、N115W、N115Y、Y116H、Y116N、Y116P、Y116R、Y116S、Y116T、K118Q、R119C、I148Y、L149F、L149M、L149T、N156K、N156R、N156Y、L159K、L159M和D164T。 108.根据权利要求107的变体硫酯酶多肽,其中所述硫酯酶多肽包含突变S46V和Y116H。 109.根据权利要求107的变体硫酯酶多肽,其中所述硫酯酶多肽包含突变S46V、D48M、G51R、N76V和Y116H。 110.根据权利要求107的变体硫酯酶多肽,其中所述硫酯酶多肽包含突变S46V、D48M、T49L、G51R、N76V、Y116H和I148Y。 111.根据权利要求107的变体硫酯酶多肽,其中所述硫酯酶多肽包含突变S46V、D48M、T49L、G51R、N76V、N115F、Y116H和I148Y。 112.根据权利要求107的变体硫酯酶多肽,其中所述硫酯酶多肽包含突变Q33R、Q34R、S46V、D48M、T49L、G51R、N52R、N76V、V112L、N115W、Y116H和I148Y。 113.根据权利要求107的变体硫酯酶多肽,其中所述硫酯酶多肽包含突变Q33R、S46V、D48M、T49L、G51R、N52K、N76V、V112L、N115W、Y116H、I148Y和L149M。 114.根据权利要求107的变体硫酯酶多肽,其中所述硫酯酶多肽包含突变S46V、D48M、T49L、G51R、N52R、N76V、Q84A、V112L、N115W、Y116H、I148Y和L149M。 115.一种重组宿主细胞,其遗传改造为表达根据权利要求85-114中任一项的变体硫酯酶多肽。 116.一种培养的重组宿主细胞,其包含编码根据权利要求85-114中任一项的变体硫酯酶多肽的多核苷酸序列,其中当在含有碳源的培养基中在有效表达所述变体硫酯酶多肽的条件下进行培养时,与表达所述相应的野生型硫酯酶多肽的宿主细胞相比较,所述重组宿主细胞在表达所述变体硫酯酶多肽时,产生具有脂肪酸酯的更高滴度、更高得率和/或更高生产率的脂肪酸酯组合物。 117.权利要求116的培养的重组宿主细胞,其中所述滴度是至少约5%或更大。 118.一种细胞培养物,其包含根据权利要求115-117中任一项的重组宿主细胞和脂肪酯组合物。 119.权利要求118的细胞培养物,其中所述脂肪酯组合物包含C6、C8、C10、C12、C13、C14、C15、C16、C17或C18脂肪酯中的一种或多种。 120.权利要求118的细胞培养物,其中所述脂肪酯组合物包含不饱和脂肪酯。 121.权利要求118的细胞培养物,其中所述脂肪酯组合物包含在距离所述脂肪酯的还原端的C和C之间的碳链中的第7位处的双键。 122.权利要求118的细胞培养物,其中所述脂肪酯组合物包含饱和脂肪酯。 123.权利要求118的细胞培养物,其中所述脂肪酯组合物包含支链脂肪酯。 124.根据权利要求85的变体硫酯酶多肽,其中所述变体硫酯酶多肽包含SEQ ID NO:51的氨基酸73-81,如LG[AG][VIL]D[AG]LRG。 125.一种变体Photobacterium profundum(“Ppro”)硫酯酶多肽,其与包含SEQ ID NO:51的相应的野生型Ppro多肽序列具有至少90%序列同一性,其中与所述野生型Ppro多肽相比较,所述变体Ppro多肽具有更大的酯合酶活性,并且其中所述变体Ppro多肽具有在选自下述的氨基酸中的至少一个突变:32、33、34、38、45、46、48、49、51、52、76、81、82、84、88、112、115、116、118、119、148、149、156、159和164。 126.一种重组宿主细胞,其包含:(a)编码根据权利要求1-71、84-114或124-125中任一项,具有增加的酯合酶活性的变体多肽的多核苷酸;(b)活化的脂肪酸;和(c)醇,其中所述重组宿主细胞在有效表达所述变体多肽的酯合酶活性的条件下产生脂肪酯组合物。 127.权利要求126的重组宿主细胞,其中所述活化的脂肪酸是酰基-ACP或酰基-CoA。 128.权利要求126的重组宿主细胞,其进一步包含碳源。 129.权利要求126的重组宿主细胞,其中所述脂肪酯组合物以至少约5%或更高的滴度产生。 130.一种编码变体酯合酶多肽的多核苷酸,其中所述多核苷酸与SEQ ID NO:1具有至少约85%序列同一性,其中所述多核苷酸进一步在ATG起始之前包含SEQ ID NO:27。 131.一种包含如下氨基酸序列的变体酯合酶多肽,所述氨基酸序列与SEQ ID NO:29具有至少约95%序列同一性。 132.一种包含如下氨基酸序列的变体酯合酶多肽,所述氨基酸序列与SEQ ID NO:33具有至少约95%序列同一性。 133.一种包含如下氨基酸序列的变体酯合酶多肽,所述氨基酸序列与SEQ ID NO:35具有至少约95%序列同一性。 134.一种包含如下氨基酸序列的变体酯合酶多肽,所述氨基酸序列与SEQ ID NO:37具有至少约95%序列同一性。 135.一种包含如下氨基酸序列的变体酯合酶多肽,所述氨基酸序列与SEQ ID NO:39具有至少约95%序列同一性。 136.一种包含如下氨基酸序列的变体酯合酶多肽,所述氨基酸序列与SEQ ID NO:41具有至少约95%序列同一性。 137.一种包含如下氨基酸序列的变体酯合酶多肽,所述氨基酸序列与SEQ ID NO:43具有至少约95%序列同一性。 138.根据权利要求131-137中任一项的变体酯合酶多肽,其中与表达野生型除烃海杆菌(WS377)酯合酶多肽的重组宿主细胞相比较,所述变体酯合酶多肽在重组宿主细胞中的表达导致产生脂肪酸酯的更高滴度、更高得率或增加的生产率。 139.权利要求138的变体酯合酶,其中所述滴度是至少约5%或更高。 140.权利要求3、5、73、75、87、116和126中任一项的变体多肽,其中所述脂肪酯组合物选自脂肪酸甲酯、脂肪酸乙酯、脂肪酸丙酯、脂肪酸异丙酯、脂肪酸丁酯、甘油单酯、脂肪酸异丁酯、脂肪酸2-丁酯和脂肪酸叔丁酯。 141.权利要求1-71中任一项的变体多肽,其中所述改善的脂肪酸甲酯活性产生选自增加的β羟基酯、减少的β羟基酯、增加的脂肪酸酯链长和减少的脂肪酸酯链长的性质。 142.权利要求85-114中任一项的变体多肽,其中所述增加的酯合酶活性产生选自增加的脂肪酸酯链长、减少的脂肪酸酯链长、和脂肪酸种类的脂肪酯比例的改变的性质。

说明书

与相关申请的交叉参考

本申请要求于2012年10月1日提交的美国临时申请号61/708,424 和2012年9月14日提交的美国临时申请号61/701,191的利益,所述 美国临时申请的整个公开内容通过引用在此并入。

序列表

本申请含有序列表,其已经由EFS-Web以ASCII形式提交且通过 引用在此整体并入。ASCII拷贝于2013年3月12日创建,命名为 LS00043-44PCT_SL.txt,并且大小为164,228字节。

发明领域

公开内容涉及用于产生脂肪酯的、具有改善的酯合酶特性的酶变 体。

发明背景

石油是以液体、气体或固体形式在地球上发现的有限的天然资源。 然而,石油产品是以经济和环境两者上相当大的成本开发。以其天然 形式,从地球中提取的原油具有少数商业用途。它是不同长度和复杂 性的烃类的混合物,例如石蜡(或烷烃)、链烯(或烯烃)、炔、环 烃(或环烷烃)、脂肪族化合物、芳香族化合物等。另外,原油含有 其他有机化合物(例如含有氮、氧、硫等的有机化合物)和杂质(例 如硫、盐、酸、金属等)。由于其高能量密度及其容易运输性,将大 多数石油精炼成燃料,例如运输燃料(例如汽油、柴油、航空燃料等)、 取暖用油、液化石油气等。

石油化学品可以用于制备专用化学品,例如塑料、树脂、纤维、 弹性体、药物、润滑剂或凝胶。可以由石油化学品原材料产生的专用 化学品的例子包括脂肪酸、烃类(例如长链烃、支链烃、饱和烃、不 饱和烃等)、脂肪醇、脂肪酯、脂肪醛、酮、润滑剂等。专用化学品 可以具有许多商业用途。脂肪酸在商业上用作表面活性剂。表面活性 剂可见于去污剂和肥皂中。脂肪酸还可以用作燃料、润滑油、涂料、 油漆、蜡烛、起酥油、化妆品和乳化剂中的添加剂。另外,脂肪酸用 作橡胶产品中的加速活化剂。脂肪酸还可以用作原料以产生甲基酯、 酰胺、胺、酰基氯、酸酐、烯酮二聚物、以及过氧酸和酯。

酯具有许多商业用途。例如,生物柴油,一种代用燃料,其由酯 (例如脂肪酸甲酯、脂肪酸乙酯等)组成。一些低分子量酯是挥发性 的,具有令人愉快的气味,这使得其可用作芳香剂或调味剂。另外, 酯用作油漆、涂料和清漆的溶剂。此外,一些天然存在的物质例如蜡、 脂肪和油由酯组成。酯还用作树脂和塑料中的软化剂、增塑剂、阻燃 剂以及汽油和油中的添加剂。另外,酯可以用于制造聚合物、薄膜、 纺织品、染料和药物。

需要用于制备目前衍生自石油的燃料和产品两者的替代途径。像 这样,微生物系统提供了用于众多类型的生物燃料和化学品的生物生 产的潜力。可再生燃料和化学品可以来自遗传改造的生物体(例如细 菌、酵母和藻类)。天然存在的生物合成途径可以遗传改变,以允许 经改造的生物体合成可再生燃料和化学产品。另外,微生物可以进行 定制或代谢改造,以利用多种碳源作为生产燃料和化学产品的原料。 例如,FAME(脂肪酸甲酯)可以通过将甲醇加入重组宿主细胞培养物 中进行生产,所述重组宿主细胞表达蜡酯合酶,例如衍生自除烃海杆 菌(Marinobacter hydrocarbonoclasticus)(“M.hydrocarbonoclasticus”) 的蜡酯合酶。然而,来自除烃海杆菌的野生型蜡酯合酶的表达不产生 显著量的FAME,因此高度希望开发改善的蜡酯合酶。另外,来自除 烃海杆菌的野生型蜡酯合酶产生显著量的β羟基(“β-OH”)酯,其通 常在衍生自植物来源的燃料或化学品中未发现。参见例如专利合作条 约申请号PCT/US12/31682,其通过引用并入本文。因此,希望改造酯 合酶以产生更高得率的脂肪酯;和当在重组宿主细胞中表达时,酯合 酶产生更高得率的脂肪酸而不产生显著量的β-OH酯。最后,希望改造 具有酯合酶活性的其他酶,以进一步改善脂肪酯生产的得率。

尽管领域中的进展,仍需要在遗传修饰的酶、重组宿主细胞、方 法和系统中的改善,以便通过重组宿主细胞的发酵,实现稳健和成本 有效的目的燃料和化学品产生。本公开内容通过提供增加脂肪酯得率 的许多酯合酶变体解决该需要。公开内容的酯合酶变体中的一些还改 变(即增加或降低)通过重组宿主细胞发酵产生的脂肪酯组合物的 β-OH酯含量,所述重组宿主细胞表达酯合酶变体。本公开内容通过提 供许多硫酯酶变体进一步解决该需要,所述硫酯酶变体已改造为具有 更大的酯合酶活性,从而进一步增强脂肪酯生产。

发明概述

本发明的一个方面提供了具有SEQ ID NO:2的变体酯合酶多肽, 其中所述变体酯合酶多肽遗传改造为具有在如下氨基酸位置处的至少 一个突变,所述氨基酸位置包括但不限于氨基酸4、5、7、15、24、30、 33、39、40、41、43、44、58、73、76、77、78、80、98、99、101、 102、111、122、131、146、147、149、150、155、157、162、164、166、 170、171、172、173、177、179、182、184、185、186、187、188、190、 192、193、195、197、201、202、203、206、207、212、216、219、234、 239、242、243、244、246、255、257、258、259、260、262、263、264、 265、266、267、285、288、289、293、294、301、302、303、304、306、 307、309、310、311、313、314、315、316、317、319、320、323、328、 334、348、349、351、352、353、356、357、360、366、375、381、393、 394、395、409、411、413、420、424、442、443、447、454、455、457、 458、461、466、468和472,其中与相应的野生型多肽相比较,变体 酯合酶多肽具有改善的脂肪酸甲酯活性。在相关方面,变体多肽是除 烃海杆菌(WS377)酯合酶多肽。在另一个相关方面,与表达相应的 野生型多肽的重组宿主细胞相比较,变体酯合酶多肽在重组宿主细胞 中的表达导致更高滴度的脂肪酯组合物。滴度是至少约5百分比或更 大。脂肪酯组合物包括但不限于脂肪酸甲酯(FAME)、脂肪酸乙酯 (FAEE)、脂肪酸丙酯、脂肪酸异丙酯、脂肪酸丁酯、甘油单酯、脂 肪酸异丁酯、脂肪酸2-丁酯和脂肪酸叔丁酯。变体酯合酶具有改善的 酯合酶活性,特别是改善的脂肪酸甲酯活性,其导致改善的特性,包 括但不限于增加的β羟基酯、减少的β羟基酯、增加的脂肪酸酯链长 和减少的脂肪酸酯链长。

公开内容的另一个方面提供了具有SEQ ID NO:2的变体酯合酶多 肽,其中所述变体酯合酶多肽遗传改造为具有在如下氨基酸位置处的 至少一个突变,所述氨基酸位置包括但不限于氨基酸7、24、30、41、 99、111、122、146、147、149、150、171、172、173、179、187、192、 212、234、239、244、246、258、264、266、267、285、301、302、303、 304、306、307、309、310、311、313、314、315、316、320、348、349、 352、356、357、360、375、381、393、409、411、424、443、455、457、 458、461和472。与表达相应的野生型酯合酶多肽的重组宿主细胞相 比较,变体酯合酶多肽在重组宿主细胞中的表达可以导致产生改变百 分比的β羟基酯,其中所述改变百分比的β羟基酯是增加或减少百分 比的β羟基酯。

公开内容的另一个方面提供了具有SEQ ID NO:2的变体酯合酶多 肽,其中所述变体酯合酶多肽遗传改造为具有在如下氨基酸位置处的 至少一个突变,所述氨基酸位置包括但不限于氨基酸5、7、15、24、 33、44、58、73、78、101、111、162、171、179、184、187、188、192、 201、207、212、234、243、244、255、257、267、307、310、317、320、 348、349、353、357、366、381、394、409、411、413、442、443和 461。

公开内容的另一个方面提供了具有SEQ ID NO:2的变体酯合酶多 肽,其中所述变体酯合酶多肽遗传改造为具有在如下氨基酸位置处的 至少一个突变,所述氨基酸位置包括但不限于氨基酸G4R、T5P、T5S、 D7N、S15G、T24M、T24W、L30H、G33D、G33S、L39A、L39M、 L39S、R40S、D41A、D41G、D41H、D41Y、V43K、V43S、T44A、 T44F、T44K、Y58C、Y58L、A73Q、V76L、D77A、K78F、K78W、 I80V、R98D、E99Q、G101L、I102R、P111D、P111G、P111S、H122S、 R131M、I146K、I146L、I146R、S147A、V149L、R150P、V155G、 T157S、R162E、N164D、N164R、P166S、T170R、T170S、V171E、 V171F、V171H、V171R、V171W、R172S、R172W、P173W、R177V、 A179S、A179V、D182G、E184F、E184G、E184L、E184R、E184S、 A185L、A185M、S186T、V187G、V187R、P188R、A190P、A190R、 A190W、S192A、S192L、S192V、Q193R、Q193S、M195G、A197T、 A197V、Q201A、Q201V、Q201W、A202L、D203R、P206F、R207A、 G212A、G212L、V216I、V219L、V234C、H239G、T242K、T242R、 A243R、Q244G、R246A、R246G、R246L、R246Q、R246V、R246W、 D255E、L257I、K258R、N259E、N259Q、L260V、H262Q、A263V、 S264D、S264V、S264W、G265N、G266A、G266S、S267G、A285L、 A285R、A285V、N288D、N289E、N289G、T293A、P294G、V301A、 N302G、I303G、I303R、I303W、R304W、A306G、D307F、D307G、 D307L、D307N、D307R、D307V、E309A、E309G、E309S、G310H、 G310R、G310V、T311S、T313S、Q314G、I315F、S316G、F317W、 I319G、A320C、A323G、D328F、Q334K、Q334S、Q348A、Q348R、 K349A、K349C、K349H、K349Q、P351G、K352I、K352N、S353K、 S353T、T356G、T356W、Q357V、M360Q、M360R、M360S、M360W、 Y366G、Y366W、G375A、G375V、G375S、V381F、E393G、E393R、 E393W、G394E、T395E、V409L、L411A、A413T、I420V、S424G、 S424Q、S442E、S442G、M443G、A447C、A447I、A447L、L454V、 D455E、L457Y、E458W、I461G、I461L、I461V、K466N、A468G、 K472T和K472。在公开内容的特定方面,变体酯合酶多肽包括突变 D7N、A179V和V381F;D7N、A179V、Q348R和V381F;D7N、A179V、 V187R、G212A、Q357V、V381F和M443G;T5S、S15G、P111S、 V171R、P188R、F317W、S353T、V409L和S442G;T5S、S15G、 K78F、P111S、V171R、P188R、S192V、A243R、F317W、K349H、 S353T、V409L和S442G;T5S、S15G、V76L、P111S、V171R、P188R、 K258R、S316G、F317W、S353T、M360R、V409L和S442G;T5S、 S15G、P111S、V171R、P188R、Q244G、S267G、G310V、F317W、 A320C、S353T、Y366W、V409L和S442G;S15G、P111S、V155G、 P166S、V171R、P188R、F317W、Q348A、S353T、V381F、V409L 和S442G;S15G、L39S、D77A、P111S、V171R、P188R、T313S、 F317W、Q348A、S353T、V381F、V409L、I420V和S442G;T5S、 S15G、T24W、T44F、P111S、I146L、V171R、P188R、D307N、F317W、 S353T、V409L和S442G;T5S、S15G、K78F、P111S、V171R、P188R、 S192V、R207A、A243R、D255E、L257I、N259Q、L260V、H262Q、 G265N、A285V、N288D、N289G、F317W、Q348R、S353T、V381F、 V409L和S442G;T5S、S15G、K78F、P111S、V171R、P188R、S192V、 R207A、A243R、D255E、L257I、N259Q、L260V、H262Q、G265N、 A285V、N288D、N289G、F317W、H349K、S353T、V381F、V409L 和S442G;T5P、S15G、G33D、T44K、Y58L、P111S、R162E、V171R、 P188R、R207A、V234C、Q244G、D255E、S267G、D307N、G310V、 F317W、A320C、S353T、Y366W、G394E、V409L、S442G和I461V; T5P、S15G、G33D、T44K、Y58C、P111S、V171R、P188R、R207A、 V234C、Q244G、L257I、S267G、D307N、G310V、F317W、A320C、 S353T、Y366W、G394E、V409L、A413T、S442G和I461V;T5P、 S15G、T44A、P111S、T157S、N164D、T170S、V171R、P188R、R207A、 V216I、V234C、Q244G、L257I、S267G、D307N、G310V、F317W、 A320C、Q334K、S353T、Y366W、G394E、V409L、S442G和I461V; 或突变T5P、S15G、Y58L、P111S、R162E、T170S、V171R、A179S、 P188R、R207A、V234C、Q244G、L257I、S267G、D307N、G310V、 F317W、A320C、S353K、Y366W、G394E、V409L、S442G和I461V。

公开内容的另一个方面提供了遗传改造为表达变体酯合酶多肽的 重组宿主细胞。在相关方面,公开内容提供了具有编码变体酯合酶多 肽的多核苷酸序列的培养的重组宿主细胞,其中当在含有碳源的培养 基中在有效表达变体酯合酶多肽的条件下进行培养时,与表达相应的 野生型多肽的宿主细胞相比较,所述重组宿主细胞在表达变体酯合酶 多肽时,产生具有脂肪酸酯的更高滴度、更高得率和/或更高生产率的 脂肪酸酯组合物。滴度是至少约5百分比或更大。在相关方面,与表 达野生型酯合酶多肽的宿主细胞相比较,重组宿主细胞在表达变体酯 合酶多肽时,产生具有改变百分比的β羟基酯的脂肪酯组合物。在本 文中,改变百分比的β羟基酯是增加或减少百分比的β羟基酯。

本发明的另外一个方面提供了包含重组宿主细胞和脂肪酯组合物 的细胞培养物。脂肪酯组合物可以包括C6、C8、C10、C12、C13、 C14、C15、C16、C17或C18脂肪酯中的一种或多种。另外,脂肪酯 组合物可以包括不饱和脂肪酯和/或饱和脂肪酯和/或支链脂肪酯。脂肪 酯组合物可以进一步包括在距离脂肪酯的还原端的C7和C8之间的碳 链中的第7位处的双键。

公开内容进一步考虑具有SEQ ID NO:2的变体除烃海杆菌 (WS377)酯合酶多肽,其中与野生型WS377多肽相比较,所述变体 WS377多肽具有改善的脂肪酸甲酯活性,并且其中所述变体WS377具 有在如下氨基酸位置处的至少一个突变,所述氨基酸位置包括但不限 于氨基酸4、5、7、15、24、30、33、39、40、41、43、44、58、73、 76、77、78、80、98、99、101、102、111、122、131、146、147、149、 150、155、157、162、164、166、170、171、172、173、177、179、182、 184、185、186、187、188、190、192、193、195、197、201、202、203、 206、207、212、216、219、234、239、242、243、244、246、255、257、 258、259、260、262、263、264、265、266、267、285、288、289、293、 294、301、302、303、304、306、307、309、310、311、313、314、315、 316、317、319、320、323、328、334、348、349、351、352、353、356、 357、360、366、375、381、393、394、395、409、411、413、420、424、 442、443、447、454、455、457、458、461、466、468和472。

公开内容的另一个方面提供了包含如下氨基酸序列的变体硫酯酶 多肽,所述氨基酸序列与SEQ ID NO:51具有至少约90%序列同一性, 其中所述变体酯合酶多肽遗传改造为具有在如下氨基酸位置处的至少 一个突变,所述氨基酸位置包括但不限于氨基酸32、33、34、38、45、 46、48、49、51、52、76、81、82、84、88、112、115、116、118、119、 148、149、156、159和164,其中与相应的野生型多肽相比较,所述 变体硫酯酶多肽具有更大的酯合酶活性。在公开内容的相关方面,变 体多肽是Photobacterium profundum(Ppro)硫酯酶多肽。与表达相应 的野生型多肽的重组宿主细胞相比较,变体硫酯酶多肽在重组宿主细 胞中的表达导致更高滴度的脂肪酯组合物,其中所述滴度是至少约5 百分比或更大。在相关方面,变体酯合酶多肽生脂肪酯组合物,其包 括但不限于脂肪酸甲酯、脂肪酸乙酯、脂肪酸丙酯、脂肪酸异丙酯、 脂肪酸丁酯、甘油单酯、脂肪酸异丁酯、脂肪酸2-丁酯和脂肪酸叔丁 酯。在另外的相关方面,所述增加的酯合酶活性产生如下性质,包括 但不限于增加的脂肪酸酯链长、减少的脂肪酸酯链长、和脂肪酸种类 的脂肪酯比例的改变。

公开内容的另一个方面提供了具有至少一个突变的变体硫酯酶多 肽,所述突变包括但不限于氨基酸K32M、Q33A、Q33R、Q34R、I38Y、 I45R、S46K、S46V、S46W、D48E、D48F、D48L、D48M、T49D、 T49L,T49V、T49W、G51R、N52C、N52F、N52K、N52L、N52R、 N76I、N76L、N76V、G81C、F82G、F82I、F82R、Q84A、Q84L、 Q84V、R88H、V112L、N115F、N115W、N115Y、Y116H、Y116N、 Y116P、Y116R、Y116S、Y116T、K118Q、R119C、I148Y、L149F、 L149M、L149T、N156K、N156R、N156Y、L159K、L159M和D164T。 公开内容的相关方面提供了具有下述突变的变体硫酯酶多肽:S46V和 Y116H;S46V、D48M、G51R、N76V和Y116H;S46V、D48M、T49L、 G51R、N76V、Y116H和I148Y;S46V、D48M、T49L、G51R、N76V、 N115F、Y116H和I148Y;Q33R、Q34R、S46V、D48M、T49L、G51R、 N52R、N76V、V112L、N115W、Y116H和I148Y;Q33R、S46V、D48M、 T49L、G51R、N52K、N76V、V112L、N115W、Y116H、I148Y和 L149M;或突变S46V、D48M、T49L、G51R、N52R、N76V、Q84A、 V112L、N115W、Y116H、I148Y和L149M。

公开内容进一步包含遗传改造为表达变体硫酯酶多肽的重组宿主 细胞,所述变体硫酯酶多肽具有酯合酶活性。公开内容进一步考虑了 培养的重组宿主细胞,其包括编码变体硫酯酶多肽的多核苷酸序列。 当在含有碳源的培养基中在有效表达变体硫酯酶多肽的条件下进行培 养时,与表达相应的野生型硫酯酶多肽的宿主细胞相比较,所述重组 宿主细胞在表达变体硫酯酶多肽时,产生具有脂肪酸酯的更高滴度、 更高得率和/或更高生产率的脂肪酸酯组合物。滴度是至少约5百分比 或更大。细胞培养物进一步包括重组宿主细胞和脂肪酯组合物。脂肪 酯组合物可以包括C6、C8、C10、C12、C13、C14、C15、C16、C17 或C18脂肪酯中的一种或多种。另外,脂肪酯组合物可以包括不饱和 脂肪酯和/或饱和脂肪酯和/或支链脂肪酯。脂肪酯组合物可以进一步包 括在距离脂肪酯的还原端的C7和C8之间的碳链中的第7位处的双键。

公开内容的另一个方面提供了具有酯合酶活性的变体硫酯酶多 肽,其中所述变体硫酯酶多肽包括SEQ ID NO:51的氨基酸73-81,如 LG[AG][VIL]D[AG]LRG。

公开内容的另外一个方面提供了变体Photobacterium profundum (Ppro)硫酯酶多肽,其与具有SEQ ID NO:51的相应的野生型Ppro 多肽序列具有至少约90%序列同一性,其中与野生型Ppro多肽相比较, 所述变体Ppro多肽具有更大的酯合酶活性,并且其中变体Ppro多肽 具有至少一个突变,包括但不限于氨基酸32、33、34、38、45、46、 48、49、51、52、76、81、82、84、88、112、115、116、118、119、 148、149、156、159和164。

公开内容仍涵盖包括下述的重组宿主细胞:(a)编码具有增加的 酯合酶活性的变体多肽的多核苷酸,(b)活化的脂肪酸和(c)醇, 其中在有效表达变体多肽的酯合酶活性的条件下,所述重组宿主细胞 产生脂肪酯组合物。活化的脂肪酸是酰基-ACP或酰基-CoA。重组宿主 细胞可以进一步利用碳源。脂肪酯组合物以至少约5百分比或更高的 滴度产生。

公开内容的另一个方面提供了编码变体酯合酶多肽的多核苷酸, 其中所述多核苷酸与SEQ ID NO:1具有至少约85%序列同一性,其中 所述多核苷酸进一步在ATG起始之前包含SEQ ID NO:27。

公开内容的另外一个方面提供了具有如下氨基酸序列的变体酯合 酶多肽,所述氨基酸序列与SEQ ID NO:29具有至少约95%序列同一 性;或与SEQ ID NO:33具有至少约95%序列同一性;或与SEQ ID NO: 35具有至少约95%序列同一性;或与SEQ ID NO:37具有至少约95% 序列同一性;或与SEQ ID NO:39具有至少约95%序列同一性;或与 SEQ ID NO:41具有至少约95%序列同一性;或与SEQ ID NO:43具 有至少约95%序列同一性。在本文中,与表达野生型除烃海杆菌 (WS377)酯合酶多肽的重组宿主细胞相比较,变体酯合酶多肽在重 组宿主细胞中的表达导致产生脂肪酸酯的更高滴度、更高得率或增加 的生产率。滴度是至少约5%或更高。

附图简述

当与附图结合阅读时,本公开内容得到更佳理解,所述附图作用 于举例说明优选实施方案。然而,应当理解公开内容并不限于附图中 公开的具体实施方案。

图1是示例性三基因生物合成途径的示意性描述,所述三基因生 物合成途径可以掺入重组宿主细胞内用于产生多种链长的脂肪酸酯。 使用的缩写包括用于硫酯酶的TE,用于脂肪酰CoA合成酶的FACS, 和用于乙酰转移酶的AT。

图2是所提出的由硫酯酶催化的无效循环的示意性描述。

图3是用于以酰基-ACP开始产生脂肪酯的两种示意性生物合成途 径的示意性描述,其中脂肪酯的产生通过单酶系统或三酶系统完成。

图4显示来自组合文库命中的平板发酵的GC-FID筛选结果。组 合文库使用转化到BD64内的组0引物和作为模板的pKEV38进行构 建。

图5显示与含有野生型‘377酯合酶的菌株相比较,通过突变株 KEV040、KEV075和KEV085产生的FAME滴度和%β-OH FAME。

图6显示当甲醇、乙醇、1-丙醇、异丙醇、1-丁醇或甘油进料给菌 株时,由KEV040(Wax)和becos.128(Ppro)产生的总脂肪酸种类 的滴度。

图7A和7B显示当Ppro组合文库构建进料甲醇以评估Ppro变体 使用甲醇制备FAME(图7A)或使用乙醇制备FAEE(图7B)的能力 时,产生的滴度和%FAME(图7A)或FAEE(图7B)。

图8显示当在(进料)甲醇、乙醇、1-丙醇、异丙醇、1-丁醇或甘 油的存在下进行培养时,由becos.128产生的脂肪酸种类的组成。FFA 指游离脂肪酸种类,并且FAxE指酯种类。

发明详述

一般概述

公开内容涉及用于生产脂肪酯的、具有改善的酯合酶特性的变体 酶。在本文中,公开内容涉及酶例如具有改善的酯合酶特性的变体酯 合酶和设计为具有酯合酶活性的变体硫酯酶。两类酶均改造为当单独 或与其他蛋白质组合时改善脂肪酯的产生。为了举例说明这点,申请 人已改造来自除烃海杆菌的酯合酶和来自Photobacterium profundum 的硫酯酶,以在体内产生脂肪酯,而无需过表达脂肪酰-CoA合成酶或 不同的硫酯酶。迄今为止,已认为为了产生更高得率的脂肪酯,至少 酰基-CoA合成酶或硫酯酶必须与酯合酶同时过表达,因为任何脂肪酯 生产均需要硫酯酶、酰基-CoA合成酶和酯合酶的共表达。此外,一般 未知天然海杆菌属(Marinobacter)酯合酶和天然硫酯酶利用短链醇。 然而,申请人已改变具有酯合酶活性的变体酶,从而使得该酶可以利 用短链醇包括甲醇和乙醇,允许该酶产生脂肪酯。例如,变体酯合酶 和具有酯合酶活性的变体硫酯酶可以以高数量产生一种或多种脂肪酸 甲酯(FAME)和/或一种或多种脂肪酸乙酯(FAEE)。像这样,申请 人已改造变体酶,其各自导致在体内更高的酯生产。

在本文中,申请人采用方便的单基因系统(参见图3)用于生产脂 肪酯。单基因系统通常采用编码具有改善的酯合酶活性的变体酶的基 因,所述变体酶与活化的脂肪酸例如酰基-ACP或酰基-CoA(即作为底 物)和醇组合,以在重组宿主细胞中产生脂肪酯。存在使用单基因系 统(即,而不是多基因系统)用于生产脂肪酯的某些优点。例如,一 个此类优点是系统自身的简单性,这允许其更快速实现和更容易监控。 另一个优点是单基因系统对于细胞是更能量有效的,因为它可能绕过 或避免所谓的无效循环(即,底物无效循环,其中两种代谢途径以相 反方向同时运行,并且没有总体效应),从而增加体内酯生产的得率。

更具体而言,在大肠杆菌(Escherichia coli)中的脂肪酸酯生产通 常依赖硫酯酶(‘tesA)、酰基-CoA合成酶(fadD)和蜡或酯合酶的共 表达。为了使酯生产达到最大,三种基因小心地平衡,以便使游离脂 肪酸(“FFA”)生产降到最低。硫酯酶可以作用于酰基-ACP(脂肪酸 生物合成的产物)和酰基-CoA(酰基-CoA合成酶的产物)两者,生成 游离脂肪酸(酰基-CoA合成酶的底物)。本公开内容涉及经修饰的酯 合酶,其相对于野生型酶具有改善的特性,克隆自除烃海杆菌DSM 8798GenBank:EF219377(在本文中被称为“’377”)。经修饰的‘377 已显示作用于酰基-ACP和酰基-CoA两者,以生成脂肪酸酯例如脂肪 酸甲酯(“FAME”)。

另外,生成的总酰基种类(FAME+FFA)的FAME百分比依赖 于所使用的硫酯酶而改变。Photobacterium profundum(“P.profundum” 或“Ppro”)的‘tesA天然产生小百分比的FAME。改造Photobacterium  profundum‘tesA,以产生更高百分比的FAME。因此,本公开内容进 一步涉及来自Photobacterium profundum(在本文中被称为“Ppro”)的 经修饰的硫酯酶(‘tesA),其遗传改造为产生更高百分比的FAME, 而无需在宿主细胞例如大肠杆菌中过表达任何其他基因。虽然不希望 受理论束缚,直接作用于酰基-ACP(脂肪酸生物合成的产物)的酯合 酶可以消除无效循环,其理论上存在于目前的生物柴油途径中,因此 保存来自细胞的资源,这可以针对脂肪酸生物合成,这还应改善生产。

定义

如本说明书和所附权利要求中使用的,单数形式“一个”、“一种” 和“该/所述”包括复数参考,除非上下文另有明确说明。因此,例如, 提及“重组宿主细胞”包括两种或更多种此类重组宿主细胞,提及“脂肪 酯”包括一种或多种脂肪酯,或酯的混合物,提及“核酸编码序列”包括 一种或多种核酸编码序列,提及“酶”包括一种或多种酶等等。

本说明书自始至终的序列登录号得自通过美国国立卫生研究院维 持的由NCBI(美国国家生物技术信息中心)提供的数据库(其在本文 中鉴定为“NCBI登录号”或备选地“GenBank登录号”),并且得自由 瑞士生物信息研究所(Swiss Institute of Bioinformatics)提供的UniProt  Knowledgebase(UniProtKB)和Swiss-Prot数据库(其在本文中鉴定 为“UniProtKB登录号”)。

EC编号由国际生物化学与分子生物学联盟命名委员会 (Nomenclature Committee of the International Union of Biochemistry  and Molecular Biology,IUBMB)建立,其描述在万维网上的IUBMB 酶命名法网站上可获得。EC编号根据催化的反应分类酶。

如本文使用的,术语“核苷酸”指多核苷酸的单体单元,其由杂环 碱基、糖和一个或多个磷酸基组成。天然存在的碱基(鸟嘌呤(G)、 腺嘌呤(A)、胞嘧啶(C)、胸腺嘧啶(T)和尿嘧啶(U))通常是 嘌呤或嘧啶的衍生物,尽管应当理解还包括天然和非天然存在的碱基 类似物。天然存在的糖是戊糖(五碳糖)脱氧核糖(其形成DNA)或 核糖(其形成RNA),尽管应当理解还包括天然和非天然存在的糖类 似物。核酸通常经由磷酸键连接,以形成核酸或多核苷酸,尽管许多 其他连接是本领域已知的(例如硫代磷酸酯、硼烷磷酸酯 (boranophosphate)等等)。

术语“多核苷酸”指核糖核苷酸(RNA)或脱氧核糖核苷酸(DNA) 的聚合物,其可以是单链或双链的,并且可以含有非天然或改变的核 苷酸。术语“多核苷酸”、“核酸序列”和“核苷酸序列”在本文中可互换 使用,并且指任何长度的核苷酸聚合形式,或RNA或DNA。这些术 语指分子的一级结构,并且因此包括双链和单链DNA,以及双链和单 链RNA。该术语包括由例如核苷酸类似物和经修饰的多核苷酸制备的 RNA或DNA类似物作为等价物,尽管并不限于甲基化和/或封端多核 苷酸。多核苷酸可以采用任何形式,包括但不限于质粒、病毒、染色 体、EST、cDNA、mRNA和rRNA。

如本文使用的,术语“多肽”和“蛋白质”可互换使用,以指氨基酸 残基的聚合物。术语“重组多肽”指通过重组技术产生的多肽,其中一 般将编码所表达蛋白质的DNA或RNA插入合适的表达载体内,所述 表达载体进而又用于转化宿主细胞,以产生多肽。

如本文使用的,术语“同系物”和“同源的”指包含与相应的多核苷 酸或多肽序列至少约50%等同的序列的多核苷酸或多肽。优选地,同 源多核苷酸或多肽具有多核苷酸序列或氨基酸序列,其与相应的氨基 酸序列或多核苷酸序列具有至少约80%、81%、82%、83%、84%、 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、 96%、97%、98%或至少约99%同源性。如本文使用的,术语序列“同 源性”和序列“同一性”可互换使用。

本领域普通技术人员充分意识到测定两种或更多种序列之间的同 源性的方法。简言之,两种序列之间的“同源性”计算可以如下执行。 序列就最佳比较目的进行比对(例如可以在第一种和第二种氨基酸或 核酸序列之一或两者中引入缺口用于最佳比对,并且非同源序列对于 比较目的可以弃去)。在一个优选实施方案中,就比较目的进行比对 的第一种序列的长度是第二种序列长度的至少约30%、优选至少约 40%、更优选至少约50%、甚至更优选至少约60%,且甚至更优选至 少约70%、至少约80%、至少约85%、至少约90%、至少约95%、 至少约98%或约100%。随后比较在第一种和第二种序列的相应氨基 酸位置或核苷酸位置处的氨基酸残基或核苷酸。当第一种序列中的位 置由与第二种序列中的相应位置相同的氨基酸残基或核苷酸占据时, 则分子在该位置处是等同的。两种序列之间的同源性百分比是由序列 共享的等同位置数目的函数,考虑到需要引入用于两种序列的最佳比 对的缺口数目和每个缺口的长度。两种序列之间的序列比较和同源性 百分比测定可以使用数学算法来完成,所述数学算法例如BLAST (Altschul等人,J.Mol.Biol.,215(3):403--410(1990))。两种 氨基酸序列之间的同源性百分比还可以使用Needleman和Wunsch算 法进行测定,所述Needleman和Wunsch算法已并入GCG软件包中 的GAP程序内,使用Blossum 62矩阵或PAM250矩阵,以及16、14、 12、10、8、6或4的缺口权和1、2、3、4、5或6的长度权(Needleman 和Wunsch,J.Mol.Biol.,48:444--453(1970))。两种核苷酸序列 之间的同源性百分比还可以使用GCG软件包中的GAP程序进行测定, 使用NWSgapdna.CMP矩阵以及40、50、60、70或80的缺口权和1、 2、3、4、5或6的长度权。本领域普通技术人员可以执行初始同源性 计算且相应地调整算法参数。优选参数集(和如果从业者不确定何种 参数应应用于确定分子是否在请求保护的同源性限制内,则应使用的 参数)是Blossum 62评分矩阵,其中缺口罚分12,缺口延伸罚分4和 移码缺口罚分5。另外的序列比对方法是生物技术领域中已知的(参见 例如Rosenberg,BMC Bioinformatics,6:278(2005);Altschul,等 人,FEBS J.,272(20):5101–5109(2005))。

术语“在低严格、中等严格、高严格或极高严格条件下杂交”描述 用于杂交和洗涤的条件。用于执行杂交反应的指导可以在Current  Protocols in Molecular Biology,John Wiley&Sons,N.Y.(1989), 6.3.1-6.3.6中找到。水性和非水性方法在该参考文献中描述,并且可 以使用任一方法。本文提及的具体杂交条件如下:1)低严格杂交条件 --在约45℃下的6X氯化钠/柠檬酸钠(SSC),随后为至少在50℃下 在0.2X SSC、0.1%SDS中的两次洗涤(对于低严格条件,洗涤温度可 以增至55℃);2)中等严格杂交条件--在约45℃下的6X SSC,随 后为在60℃下在0.2X SSC、0.1%SDS中的一次或多次洗涤;3)高严 格杂交条件--在约45℃下的6X SSC,随后为在65℃下在0.2X SSC、 0.1%SDS中的一次或多次洗涤;和4)极高严格杂交条件--在65℃ 下的0.5M磷酸钠、7%SDS,随后为在65℃下在0.2X SSC、1%SDS 中的一次或多次洗涤。极高严格杂交条件(4)是优选条件,除非另有 说明。

“内源”多肽指通过由其改造(或“衍生”)出重组细胞的亲本微生 物细胞(也称为“宿主细胞”)的基因组编码的多肽。“外源”多肽指不 由亲本微生物细胞的基因组编码的多肽。变体(即突变型)多肽是外 源多肽的例子。

如本文使用的,术语“异源的”通常指非天然存在于给定生物体中 的核苷酸、多肽或蛋白质序列。例如,对植物内源的多核苷酸序列可 以通过重组方法引入宿主细胞内,并且植物多核苷酸随后对该重组宿 主细胞是异源的。术语“异源”还可以就核苷酸、多肽或蛋白质序列而 言使用,所述核苷酸、多肽或蛋白质序列以非天然状态存在于重组宿 主细胞中。例如,“异源”核苷酸、多肽或蛋白质序列可以相对于天然 存在于相应的野生型宿主细胞中的野生型序列进行修饰,例如表达水 平或者核苷酸、多肽或蛋白质序列中的修饰。

如本文使用的,术语多肽的“片段”指全长多肽或蛋白质的更短部 分,大小范围为四个氨基酸残基到整个氨基酸序列减去一个氨基酸残 基。在公开内容的某些实施方案中,片段指多肽或蛋白质的结构域(例 如底物结合结构域或催化结构域)的整个氨基酸序列。

术语“诱变”指通过其生物体的遗传信息以稳定方式改变的过程。 蛋白质编码核酸序列的诱变产生突变蛋白质。诱变还指非编码核酸序 列中的变化,其导致经修饰的蛋白质活性。

如本文使用的,“突变”指基因的核酸位置或者多肽或蛋白质的氨 基酸位置中的永久变化。突变包括置换、添加、插入和缺失。例如, 氨基酸位置中的突变可以是一类氨基酸由另一类氨基酸的置换(例如 丝氨酸(S)可以由丙氨酸(A)置换;赖氨酸(L)可以由T(苏氨酸) 置换;等)。像这样,多肽或蛋白质可以具有其中一种氨基酸由另一 种氨基酸置换的一个或多个突变。例如,酯合酶多肽或蛋白质可以具 有在其氨基酸序列中的一个或多个突变。

“酯合酶变体”是在其氨基酸序列中具有一个或多个突变的酯合酶 多肽或蛋白质。在一个例子中,氨基酸序列范围为0(即基于ATG起 始位点的起始甲硫氨酸(M))到473。此类酯合酶变体可以具有在下 述氨基酸位置中的一个或多个突变:1、2、3、4、5、6、7、8、9、10、 11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、 26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、 41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、 56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、 71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、 86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、 101、102、103、104、105、106、107、108、109、110、111、112、113、 114、115、116、117、118、119、120、121、122、123、124、125、126、 127、128、129、130、131、132、133、134、135、136、137、138、141、 142、143、144、145、146、147、148、149、150、151、152、153、154、 155、156、157、158、159、160、161、162、163、164、165、166、167、 168、169、170、171、172、173、174、175、176、177、178、179、180、 181、182、183、184、185、186、187、188、189、190、191、192、193、 194、195、196、197、198、199、200、201、202、203、204、205、206、 207、208、209、210、211、212、213、214、215、216、217、218、219、 220、221、222、223、224、225、226、227、228、229、230、231、232、 233、234、235、236、237、238、239、240、241、242、243、244、245、 246、247、248、249、250、251、252、253、254、255、256、257、258、 259、260、261、262、263、264、265、266、267、268、269、270、271、 272、273、274、275、276、277、278、279、280、281、282、283、284、 285、286、287、288、289、290、291、292、293、294、295、296、297、 298、299、300、301、302、303、304、305、306、307、308、309、310、 311、312、313、314、315、316、317、318、319、320、321,322、323、 324、325、326、327、328、329、330、331、332、333、334、335、336、 337、338、339、340、341、342、343、344、345、346、347、348、349、 350、351、352、353、354、355、356、357、358、359、360、361、362、 363、364、365、366、367、368、369、370、371、372、373、374、375、 376、377、378、379、380、381、382、383、384、385、386、387、388、 389、390、391、392、393、394、395、396、397、398、399、400、401、 402、403、404、405、406、407、408、409、410、411、412、413、414、 415、416、417、418、419、420、421、422、423、424、425、426、427、 428、429、430、431、432、433、434、435、436、437、438、439、440、 441、442、443、444、445、446、447、448、449、450、451、452、453、 454、455、456、457、458、459、460、461、462、463、464、465、466、 467、468、469、470、471、472和/或473。值得注意的是,氨基酸位 置139和140是保守基序的一部分,并且因此对于酶活性是重要的。 在一个实施方案中,突变包括G4R、T5P、T5S、D7N、S15G、T24M、 T24N、T24W、Q26T、L30H、G33D、G33N、G33S、L39A、L39M、 L39S、R40S、D41A、D41G、D41H、D41Y、V43K、V43S、T44A、 T44F、T44K、E48A、E48Q、A49D、A49T、Y58C、Y58L、I70L、 I70V、A73G、A73Q、A73S、A73T、V76L、D77A、K78F、K78W、 D79H、D79K、I80V、R98D、E99Q、G101L、I102R、P111D、P111G、 P111S、H122S、V123I、V123M、R131M、I146K、I146L、I146R、 S147A、V149L、R150P、V155G、T157S、T158E、T158K、R162E、 R162K、C163I、C163R、N164D、N164R、P166L、P166S、T170R、 T170S、V171E、V171F、V171H、V171R、V171W、R172S、R172W、 P173W、H174E、Q175R、Q175S、R176T、R177V、A179K、A179S、 A179V、D182G、K183S、E184F、E184G、E184L、E184R、E184S、 A185L、A185M、S186T、V187G、V187R、P188R、A189G、A190P、 A190R、A190W、V191I、V191L、S192A、S192L、S192V、Q193R、 Q193S、M195G、D196E、A197T、A197V、Q201A、Q201V、Q201W、 A202L、D203R、P206F、R207A、G212A、G212L、G212M、G212S、 V216I、V219L、V234C、V236A、V236K、L237I、H239G、T242K、 T242R、A243G、A243R、Q244G、R246A、R246G、R246L、R246Q、 R246V、R246W、D255E、L257I、L257M、K258R、N259A、N259E、 N259Q、L260M、L260V、H262Q、H262R、A263V、S264D、S264V、 S264W、G265N、G266A、G266S、S267G、A285L、A285R、A285V、 N288D、N289E、N289G、T293A、T293I、P294G、V301A、N302G、 I303G、I303R、I303W、R304W、A306G、A306S、D307F、D307G、 D307L、D307N、D307R、D307V、E309A、E309G、E309S、G310H、 G310R、G310V、T311S、T313S、Q314G、I315F、S316G、F317W、 I319G、A320C、A323G、D328F、N331I、N331K、N331T、Q334K、 Q334S、Q335C、Q335N、Q335S、T338A、T338E、T338H、Q348A、 Q348R、K349A、K349C、K349H、K349Q、P351G、K352I、K352N、 S353K、S353T、T356G、T356W、Q357V、M360R、M360Q、M360S、 M360W、Y366G、Y366W、G375A、G375V、G375S、V381F、E393G、 E393R、E393W、G394E、G394R、T395E、R402K、V409L、L411A、 A413T、I420V、S424G、S424Q、S442E、S442G、M443G、A447C、 A447I、A447L、L454V、D455E、L457Y、E458W、I461G、I461L、 I461V、K466N、A468G、K472T和K472。

术语“具有酯合酶活性的硫酯酶变体”或“硫酯酶变体”在本文中可 互换使用,并且指具有酯合酶活性且在其氨基酸序列中具有一个或多 个突变的硫酯酶多肽或蛋白质。在一个例子中,氨基酸序列范围为0 (即基于ATG起始位点的起始甲硫氨酸(M))到182。此类硫酯酶 变体可以具有在下述氨基酸位置中的一个或多个突变:1、2、3、4、5、 6、7、8、9、11、12、13、14、15、16、17、18、19、20、21、22、 23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、 38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、 53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、 68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、 83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、 98、99、100、101、102、103、104、105、106、107、108、109、110、 111、112、113、114、115、116、117、118、119、120、121、122、123、 124、125、126、127、128、129、130、131、132、133、134、135、136、 137、138、139、140、141、142、143、144、145、146、147、148、149、 150、151、152、153、154、155、156、158、159、161、162、163、164、 165、166、167、168、169、170、171、172、173、174、175、176、177、 178、179、180、181和/或182。然而,氨基酸位置10、157和160是 催化三分子的一部分,并且因此对于酶活性是重要的。在一个实施方 案中,突变包括R18C、K32M、Q33A、Q33R、Q34R、E37D、I38Y、 I45R、I45T、S46K、S46V、S46W、D48E、D48F、D48L、D48M、 T49D、T49L,T49V、T49W、G51R、N52C、N52F、N52K、N52L、 N52R、K65M、N76I、N76L、N76V、G81C、F82G、F82I、F82R、 Q84A、Q84L、Q84V、R88H、D102V、V112L、N115F、N115W、N115Y、 Y116H、Y116N、Y116P、Y116R、Y116S、Y116T、K118Q、R119C、 I148Y、L149F、L149M、L149T、N156K、N156R、N156Y、L159K、 L159M和D164T。

如本文使用的,术语“基因”指编码RNA产物或蛋白质产物的核酸 序列,以及影响RNA或蛋白质表达的、可操作地连接的核酸序列(例 如此类序列包括但不限于启动子或增强子序列),或影响RNA或蛋白 质表达的、可操作地连接的核酸序列编码序列(例如此类序列包括但 不限于核糖体结合位点或翻译控制序列)。

表达控制序列是本领域已知的,并且包括例如启动子、增强子、 多腺苷酸化信号、转录终止子、内部核糖体进入位点(IRES)等等, 其提供了多核苷酸序列在宿主细胞中的表达。表达控制序列与涉及转 录的细胞蛋白质特异性相互作用(Maniatis等人,Science,236: 1237-1245(1987))。示例性表达控制序列在例如Goeddel,Gene  Expression Technology:Methods in Enzymology,第185卷,Academic  Press,San Diego,Calif.(1990)中描述。在公开内容的方法中,表达 控制序列可操作地连接至多核苷酸序列。“可操作地连接的”意指多核 苷酸序列和一种或多种表达控制序列以这样的方式连接,以便允许当 适当分子(例如转录激活蛋白)与一种或多种表达控制序列结合时的 基因表达。可操作地连接的启动子位于就转录和翻译方向而言的所选 多核苷酸序列上游。可操作地连接的增强子可以位于所选多核苷酸上 游、其内或下游。

如本文使用的,术语“载体”指能够转运已与之连接的另一种核酸 即多核苷酸序列的核酸分子。一类有用的载体是附加体(即,能够染 色体外复制的核酸)。有用的载体是能够自主复制和/或表达与之连接 的核酸的那些。能够指导与之可操作地连接的基因的表达的载体在本 文中被称为“表达载体”。一般而言,在重组DNA技术中有用的表达载 体通常采取“质粒”的形式,其一般指环状双链DNA环,以其载体形式 不结合染色体。术语“质粒”和“载体”在本文中可互换使用,因为质粒 是最常用形式的载体。然而,还包括的是此类其他形式的表达载体, 其发挥等价功能且其后变得本领域已知的。在一些实施方案中,重组 载体进一步包括可操作地连接至多核苷酸序列的启动子。在一些实施 方案中,启动子是发育调节、器官特异性、组织特异性、诱导型、组 成型或细胞特异性启动子。重组载体通常包含选自下述的至少一种序 列:可操作地偶联至多核苷酸序列的表达控制序列;可操作地偶联至 多核苷酸序列的选择标记;可操作地偶联至多核苷酸序列的标记序列; 可操作地偶联至多核苷酸序列的纯化部分;可操作地偶联至多核苷酸 序列的分泌序列;和可操作地偶联至多核苷酸序列的靶向序列。在某 些实施方案中,核苷酸序列稳定掺入宿主细胞的基因组DNA内,并且 核苷酸序列的表达处于调节的启动子区的控制下。本文描述的表达载 体包括以适合于在宿主细胞中表达多核苷酸序列的形式的本文描述的 多核苷酸序列。本领域技术人员应当理解表达载体的设计可以取决于 此类因素如待转化的宿主细胞的选择、所需多肽表达水平等。本文描 述的表达载体可以引入宿主细胞内,以产生由如本文描述的多核苷酸 序列编码的多肽,包括融合多肽。

如本文使用的,重组或经改造的“宿主细胞”是宿主细胞,例如用 于产生脂肪酸衍生物中的一种或多种的微生物,所述脂肪酸衍生物包 括例如酰基-CoA、脂肪酸、脂肪醛、短和长链醇、烃、脂肪醇、脂肪 酯(例如,蜡、脂肪酸酯、脂肪酯和/或脂肪脂肪酯)、末端烯烃、内 烯烃和酮。在一些实施方案中,重组宿主细胞包含一种或多种多核苷 酸,每种多核苷酸编码具有脂肪酸生物合成酶活性的多肽,其中当在 碳源的存在下在有效表达所述多核苷酸的条件下进行培养时,所述重 组宿主细胞产生脂肪酯组合物。

如本文使用的,“酰基-ACP”指在烷基链的羰基碳和酰基载体蛋白 质(ACP)的磷酸泛酰巯基乙胺基(phosphopantetheinyl)部分的硫 氢基之间形成的酰基硫酯。通过holo-酰基载体蛋白合酶(ACPS), 一种磷酸泛酰巯基乙胺基转移酶,磷酸泛酰巯基乙胺基部分以翻译后 附着至ACP上的保守丝氨酸残基。在一些实施方案中,酰基-ACP是 完全饱和的酰基-ACP合成中的中间产物。在其他实施方案中,酰基 -ACP是不饱和酰基-ACP合成中的中间产物。在一些实施方案中,碳 链具有约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、 20、21、22、23、24、25或26个碳。这些酰基-ACP各自是将其转换 为脂肪酸衍生物的酶的底物。

如本文使用的,术语“脂肪酸衍生物”意指“脂肪酸”或“脂肪酸衍生 物”,其可以被称为“脂肪酸或其衍生物”。术语“脂肪酸”意指具有式 RCOOH的羧酸。R表示脂肪族基团,优选烷基。R可以包含约4-约 22个碳原子。脂肪酸可以具有支链或直链,并且可以是饱和、单不饱 和或多不饱和的。“脂肪酸衍生物”是部分由生产宿主生物体的脂肪酸 生物合成途径制备的产物。“脂肪酸衍生物”包括部分由酰基-ACP或酰 基-ACP衍生物制备的产物。示例性脂肪酸衍生物包括酰基-CoA、脂肪 酸、脂肪醛、短和长链醇、脂肪醇、烃类、酯类(例如、蜡、脂肪酸 酯、脂肪酯)、末端烯烃、内烯烃和酮。

如本文提及的,“脂肪酸衍生物组合物”由重组宿主细胞产生,并 且通常包括脂肪酸衍生物的混合物。在一些情况下,混合物包括超过 一类脂肪酸衍生物产物(例如脂肪酸、脂肪酯、脂肪醇、脂肪醛、脂 肪酮、烃等)。在其他情况下,脂肪酸衍生物组合物可以包括例如具 有不同链长、饱和度和/或分支特征的脂肪酯(或另一种脂肪酸衍生物) 混合物。在另外其他情况下,脂肪酸衍生物组合物可以包含超过一类 具有不同链长、饱和度和/或分支特征的脂肪酸衍生物产物和脂肪酸衍 生物的混合物。在另外其他情况下,脂肪酸衍生物组合物可以包括例 如脂肪酯和β羟基酯的混合物。

如本文使用的,术语“脂肪酸生物合成途径”意指产生脂肪酸衍生 物的生物合成途径。脂肪酸生物合成途径可以包括另外的酶,以产生 具有所需特征的脂肪酸衍生物。

如本文使用的,“脂肪酯”意指具有式RCOOR’的酯。如本文提及 的脂肪酯可以是由脂肪酸制备的任何酯,例如脂肪酸酯。在一些实施 方案中,R基团是长度至少5、至少6、至少7、至少8、至少9、至少 10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、 至少18或至少19个碳。备选地或另外地,R基团是长度20或更少、 19或更少、18或更少、17或更少、16或更少、15或更少、14或更少、 13或更少、12或更少、11或更少、10或更少、9或更少、8或更少、 7或更少、或6或更少个碳。因此,R基团可以具有由上述端点中的任 何两个约束的R基团。例如,R基团可以是长度6-16个碳、长度10-14 个碳、或长度12-18个碳。在一些实施方案中,脂肪酯组合物包含C6、 C7、C8、C9、C10、C11、C12、C13、C14、C15、C16、C17、C18、 C19、C20、C21、C22、C23、C24、C25和C26脂肪酯中的一种或多 种。在其他实施方案中,脂肪酯组合物包括C6、C7、C8、C9、C10、 C11、C12、C13、C14、C15、C16、C17和C18脂肪酯中的一种或多 种。在另外其他实施方案中,脂肪酯组合物包括C12、C14、C16和 C18脂肪酯;C12、C14和C16脂肪酯;C14、C16和C18脂肪酯;或 C12和C14脂肪酯。

脂肪酸衍生物例如脂肪酯的R基团可以是直链或支链。支链可以 具有超过一个分支点,并且可以包括环状分支。在一些实施方案中, 分支脂肪酸、分支脂肪醛或分支脂肪酯是C6、C7、C8、C9、C10、 C11、C12、C13、C14、C15、C16、C17、C18、C19、C20、C21、 C22、C23、C24、C25或C26分支脂肪酸、分支脂肪醛或分支脂肪酯。 在特定实施方案中,分支脂肪酸、分支脂肪醛或分支脂肪酯是C6、C7、 C8、C9、C10、C11、C12、C13、C14、C15、C16、C17或C18分支 脂肪酸或分支脂肪酯。本公开内容的脂肪酯可以被称为含有A侧和B 侧。如本文使用的,酯的“A侧”指附着至酯的羧化物氧的碳链。如本 文使用的,酯的“B侧”指包含酯的亲本羧化物的碳链。当脂肪酯衍生自 脂肪酸生物合成途径时,A侧通常由醇贡献,并且B侧由脂肪酸贡献。

任何醇均可用于形成脂肪酯的A侧。例如,醇可以衍生自脂肪酸 生物合成途径,例如本文描述的那些。备选地,醇可以通过非脂肪酸 生物合成途径产生。此外,醇可以外源提供。例如,在其中脂肪酯由 生物体产生的情况下,醇可以在发酵液中供应。备选地,在其中脂肪 酯由还产生醇的生物体产生的情况下,羧酸例如脂肪酸或乙酸可以外 源供应。

包含酯的A侧或B侧的碳链可以具有任何长度。在一个实施方案 中,酯的A侧可以是长度至少约1、2、3、4、5、6、7、8、10、12、 14、16或18个碳。当脂肪酯是脂肪酸甲酯时,酯的A侧是长度1个 碳。当脂肪酯是脂肪酸乙酯时,酯的A侧是长度2个碳。酯的B侧可 以是长度至少约4、6、8、10、12、14、16、18、20、22、24或26个 碳。A侧和/或B侧可以是直链或支链。支链可以具有一个或多个分支 点。另外,支链可以包括环状分支。此外,A侧和/或B侧可以是饱和 或不饱和的。如果不饱和,则A侧和/或B侧可以具有一个或多个不饱 和点。另外,依照本公开内容产生的脂肪酯的醇基团无需在首要(C1) 位置中。在一个实施方案中,脂肪酯生物合成产生。在该实施方案中, 首先脂肪酸是“活化的”。“活化”脂肪酸的非限制性例子是酰基-CoA、 酰基ACP和酰基磷酸酯。酰基-CoA可以是脂肪酸生物合成或降解的 直接产物。另外,酰基-CoA可以由游离脂肪酸、CoA和腺嘌呤核苷三 磷酸(ATP)合成。产生酰基-CoA的酶的例子是酰基-CoA合酶。

在某些实施方案中,分支脂肪酸衍生物是异脂肪酸衍生物例如异 脂肪酯,或反异脂肪酸衍生物例如反异脂肪酯。在示例性实施方案中, 分支脂肪酸衍生物选自异-C7:0、异-C8:0、异-C9:0、异-C10:0、异-C11:0、 异-C12:0、异-C13:0、异-C14:0、异-C15:0、异-C16:0、异-C17:0、异 -C18:0、异-C19:0、反异-C7:0、反异-C8:0、反异-C9:0、反异-C10:0、 反异-C11:0,反异-C12:0、反异-C13:0、反异-C14:0、反异-C15:0、反异 -C16:0、反异-C17:0、反异-C18:0和反异-C19:0分支脂肪酯。

分支或未分支脂肪酸衍生物的R基团可以是饱和或不饱和的。如 果不饱和,则R基团可以具有一个或超过一个不饱和点。在一些实施 方案中,不饱和脂肪酸衍生物是单不饱和脂肪酸衍生物。在某些实施 方案中,不饱和脂肪酸衍生物是C6:1、C7:1、C8:1、C9:1、C10:1、 C11:1、C12:1、C13:1、C14:1、C15:1、C16:1、C17:1、C18:1、C19:1、 C20:1、C21:1、C22:1、C23:1、C24:1、C25:1或C26:1不饱和脂肪酸 衍生物。在某些实施方案中,不饱和脂肪酸衍生物是C10:1、C12:1、 C14:1、C16:1或C18:1不饱和脂肪酸衍生物。在其他实施方案中,不 饱和脂肪酸衍生物在ω-7位置处是不饱和的。在某些实施方案中,不 饱和脂肪酸衍生物包含顺式双键。

如本文使用的,术语“克隆”通常指由单个共同祖先遗传且基本上 遗传上等同于单个共同祖先的细胞或细胞群,例如起因于单一细菌细 胞的克隆的细菌菌落的细菌。

如本文使用的,术语“培养物”通常指包含活细胞的液体培养基。 在一个实施方案中,培养物包含在控制条件下在预定培养基中繁殖的 细胞,例如在包含所选碳源和氮源的液体培养基中生长的重组宿主细 胞培养物。“培养”或“培育”指在合适条件下在液体或固体培养基中生 长重组宿主细胞群体。在特定实施方案中,培养指底物的发酵生物转 换为最终产物。培养基可以是众所周知的,并且此类培养基的个别组 分可得自商业来源,例如DifcoTM培养基和BBLTM培养基。在一个非限 制性例子中,水性营养培养基是“丰富培养基”,包括氮、盐和碳的复 杂来源,例如包含10g/L蛋白胨和10g/L此类培养基的酵母提取物的 YP培养基。

如本文使用的,术语“在有效表达所述异源多核苷酸序列的条件 下”意指允许宿主细胞产生所需脂肪酸衍生物的任何条件。合适条件包 括例如发酵条件。

如本文使用的,重组宿主细胞中“经修饰的”或“改变水平的”蛋白 质例如酶的活性指相对于亲本或天然宿主细胞,所测定的活性中的一 种或多种特征中的差异。通常,活性中的差异在具有经修饰的活性的 重组宿主细胞和相应的野生型宿主细胞之间进行测定(例如,相对于 相应的野生型宿主细胞比较重组宿主细胞的培养物)。经修饰的活性 可以是例如由重组宿主细胞表达的经修饰量的蛋白质的结果(例如由 于增加或减少数目的拷贝的编码蛋白质的DNA序列,增加或减少数目 的编码蛋白质的mRNA转录物,和/或增加或减少量的由mRNA蛋白 质翻译的蛋白质);蛋白质结构中的变化(例如对一级结构的变化, 例如对蛋白质的编码序列的变化,其导致底物特异性中的变化、在观 察到的动力学参数中的变化);和蛋白质稳定性中的变化(例如增加 或减少的蛋白质降解)。在一些实施方案中,多肽是本文描述的多肽 中的任一种的突变体或变体,例如WS377(“’377”),Ppro。在某些 情况下,本文描述的多肽的编码序列对于在特定宿主细胞中的表达是 密码子优化的。例如,对于在大肠杆菌中的表达,一种或多种密码子 可以如例如Grosjean等人,Gene 18:199-209(1982)中所述进行优化。

如本文使用的,术语“调节序列”通常指可操作地连接至编码蛋白 质的DNA序列的DNA中的碱基序列,其最终控制蛋白质的表达。调 节序列的例子包括但不限于RNA启动子序列、转录因子结合序列、转 录终止序列、转录的调节剂(例如增强子元件)、影响RNA稳定性的 核苷酸序列、和翻译调节序列(例如核糖体结合位点(例如,在原核 生物中的Shine-Dalgarno序列或在真核生物中的Kozak序列)、起始 密码子、终止密码子)。如本文使用的,短语“所述核苷酸序列的表达 相对于野生型核苷酸序列是经修饰的”,意指内源核苷酸序列的表达和 /或活性或者异源或非天然多肽编码核苷酸序列的表达和/或活性水平 中的增加或减少。术语“改变的表达水平”和“经修饰的表达水平”可互 换使用,并且意指与其在相同条件下在相应的野生型细胞中的浓度相 比较,多核苷酸、多肽或烃在经改造的宿主细胞中以不同浓度存在。 如本文使用的,就多核苷酸而言的术语“表达”是促使其起作用。当表 达时,编码多肽(或蛋白质)的多核苷酸将转录且翻译,以产生该多 肽(或蛋白质)。如本文使用的,术语“过表达”意指表达或促使多核 苷酸或多肽在细胞中以比在相同条件下在相应的野生型细胞中通常表 达更大的浓度表达。

如本文使用的,术语“滴度”指每单位体积的宿主细胞培养物产生 的脂肪酸衍生物的数量。在本文描述的组合物和方法的任何方面,脂 肪酸衍生物以约25mg/L、约50mg/L、约75mg/L、约100mg/L、约 125mg/L、约150mg/L、约175mg/L、约200mg/L、约225mg/L、 约250mg/L、约275mg/L、约300mg/L、约325mg/L、约350mg/L、 约375mg/L、约400mg/L、约425mg/L、约450mg/L、约475mg/L、 约500mg/L、约525mg/L、约550mg/L、约575mg/L、约600mg/L、 约625mg/L、约650mg/L、约675mg/L、约700mg/L、约725mg/L、 约750mg/L、约775mg/L、约800mg/L、约825mg/L、约850mg/L、 约875mg/L、约900mg/L、约925mg/L、约950mg/L、约975mg/L、 约1000mg/L、约1050mg/L、约1075mg/L、约1100mg/L、约1125 mg/L、约1150mg/L、约1175mg/L、约1200mg/L、约1225mg/L、 约1250mg/L、约1275mg/L、约1300mg/L、约1325mg/L、约1350 mg/L、约1375mg/L、约1400mg/L、约1425mg/L、约1450mg/L、 约1475mg/L、约1500mg/L、约1525mg/L、约1550mg/L、约1575 mg/L、约1600mg/L、约1625mg/L、约1650mg/L、约1675mg/L、 约1700mg/L、约1725mg/L、约1750mg/L、约1775mg/L、约1800 mg/L、约1825mg/L、约1850mg/L、约1875mg/L、约1900mg/L、 约1925mg/L、约1950mg/L、约1975mg/L、约2000mg/L(2g/L)、 3g/L、5g/L、10g/L、20g/L、30g/L、40g/L、50g/L、60g/L、70g/L、80g/L、 90g/L、100g/L滴度或由前述值中的任何两个约束的范围产生。在其他 实施方案中,脂肪酸衍生物以超过100g/L、超过200g/L或超过300g/L 的滴度产生。由根据公开内容的方法的重组宿主细胞产生的脂肪酸衍 生物的一个优选滴度是5g/L-200g/L、10g/L-150g/L、20g/L-120g/L 和30g/L-100g/L。滴度可以指由给定重组宿主细胞培养物产生的特定 脂肪酸衍生物或脂肪酸衍生物组合。例如,与表达相应的野生型多肽 的重组宿主细胞相比较,具有酯合酶活性的变体多肽在重组宿主细胞 例如大肠杆菌中的表达导致产生更高的滴度。在一个实施方案中,更 高滴度范围为至少约5g/L-约200g/L。

如本文使用的,“由宿主细胞产生的脂肪酸衍生物得率”指在宿主 细胞中输入碳源转换为产物(即脂肪酯)的效率。根据公开内容的方 法改造为产生脂肪酸衍生物的宿主细胞具有至少约3%、至少约4%、 至少约5%、至少约6%、至少约7%、至少约8%、至少约9%、至少 约10%、至少约11%、至少约12%、至少约13%、至少约14%、至 少约15%、至少约16%、至少约17%、至少约18%、至少约19%、 至少约20%、至少约21%、至少约22%、至少约23%、至少约24%、 至少约25%、至少约26%、至少约27%、至少约28%、至少约29%、 或至少约30%得率或由前述值中的任何两个约束的范围。在其他实施 方案中,一种或多种脂肪酸衍生物以超过约30%、约40%、约50%、 约60%、约70%、约80%、约90%或更多的得率产生。备选地或另外 地,得率是约30%或更少、约27%或更少、约25%或更少、或约22% 或更少。因此,得率可以由上述端点中的任何两个约束。例如,由根 据公开内容的方法的重组宿主细胞产生的一种或多种脂肪酸衍生物得 率可以是约5%-约15%、约10%-约25%、约10%-约22%、约 15%-约27%、约18%-约22%、约20%-约28%、或约20%-约 30%。得率可以指由给定重组宿主细胞培养物产生的特定脂肪酸衍生 物或脂肪酸衍生物组合。例如,与表达相应的野生型多肽的重组宿主 细胞相比较,具有酯合酶活性的变体多肽在重组宿主细胞例如大肠杆 菌中的表达导致产生更高得率的脂肪酸酯。在一个实施方案中,更高 得率范围为约10%-约100%的理论得率。

如本文使用的,术语“生产率”指每单位时间每单位体积的宿主细 胞培养物产生的一种或多种脂肪酸衍生物的数量。在本文描述的组合 物和方法的任何方面,由重组宿主细胞产生的一种或多种脂肪酸衍生 物的生产率是至少100mg/L/小时、至少200mg/L/小时、至少300mg/L/ 小时、至少400mg/L/小时、至少500mg/L/小时、至少600mg/L/小时、 至少700mg/L/小时、至少800mg/L/小时、至少900mg/L/小时、至少 1000mg/L/小时、至少1100mg/L/小时、至少1200mg/L/小时、至少 1300mg/L/小时、至少1400mg/L/小时、至少1500mg/L/小时、至少 1600mg/L/小时、至少1700mg/L/小时、至少1800mg/L/小时、至少 1900mg/L/小时、至少2000mg/L/小时、至少2100mg/L/小时、至少 2200mg/L/小时、至少2300mg/L/小时、至少2400mg/L/小时、2500 mg/L/小时或高达10g/L/hr(取决于细胞群)。例如,由根据公开内容 的方法的重组宿主细胞产生的一种或多种脂肪酸衍生物的生产率可以 是500mg/L/小时-2500mg/L/小时、或700mg/L/小时-2000mg/L/ 小时。生产率可以指由给定重组宿主细胞培养物产生的特定脂肪酸衍 生物或脂肪酸衍生物组合。例如,与表达相应的野生型多肽的重组宿 主细胞相比较,具有酯合酶活性的变体多肽在重组宿主细胞例如大肠 杆菌中的表达导致产生增加的脂肪酸酯生产率。在一个实施方案中, 更高的生产率范围为约0.3g/L/h-约3g/L/h。

如本文使用的,术语“总脂肪种类”和“总脂肪酸产物”在本文中就 脂肪酯和脂肪酸的量而言可以互换使用,如通过GC-FID评估的。当 提及脂肪醇分析时,相同术语可以用于意指脂肪醇、脂肪醛和游离脂 肪酸。

如本文使用的,术语“葡萄糖利用率”意指每单位时间由培养物使 用的葡萄糖量,报告为克/升/小时(g/L/hr)。

如本文使用的,术语“与野生型多肽相比较更大的酯合酶活性”就 酯合酶或具有酯合酶活性的硫酯酶而言使用,所述酯合酶或具有酯合 酶活性的硫酯酶具有比相应的野生型酶更高的滴度、更高的得率和/或 更高的生产率。在一个优选实施方案中,滴度、得率或生产率是野生 型多肽那种的至少两倍。在其他优选实施方案中,滴度、得率或生产 率是野生型多肽那种的至少3倍、4倍、5倍、6倍、7倍、8倍、9倍 或10倍。在一个特定实施方案中,滴度是至少约5%或更大。在一些 情况下,“与野生型多肽相比较更大的酯合酶活性”也意指除比相应的 野生型酯合酶更高的滴度、得率和/或生产率之外,所述酯合酶产生低 或更低百分比(例如1-5%)的β羟基酯(参见下文实施例)。在其他 情况下,“与野生型多肽相比较更大的酯合酶活性”也意指除比相应的 野生型酯合酶更高的滴度、得率和/或生产率之外,所述酯合酶产生更 高百分比的β羟基酯(参见下文实施例)。

术语“改善的脂肪酸甲酯活性”意指变体多肽或酶可以产生脂肪酸 甲酯、脂肪酸乙酯、脂肪酸丙酯、脂肪酸异丙酯、脂肪酸丁酯、甘油 单酯、脂肪酸异丁酯、脂肪酸2-丁酯和脂肪酸叔丁酯等等。具有改善 的脂肪酸甲酯活性的变体多肽或酶具有改善的性质,包括但不限于增 加的β羟基酯、减少的β羟基酯、增加的脂肪酸酯链长和减少的脂肪 酸酯链长。当变体多肽在重组微生物中表达时,具有改善的脂肪酸甲 酯活性的变体酯合酶多肽产生至少约5%或更大的滴度。

如本文使用的,术语“碳源”指适合用作原核或简单真核细胞生长 的碳源的底物或化合物。碳源可以采取多种形式,包括但不限于聚合 物、碳水化合物、酸、醇、醛、酮、氨基酸、肽和气体(例如CO和 CO2)。示例性碳源包括但不限于单糖例如葡萄糖、果糖、甘露糖、半 乳糖、木糖和阿拉伯糖;寡糖例如果寡糖和半乳寡聚糖;多糖例如淀 粉、纤维素、果胶和木聚糖;二糖例如蔗糖、麦芽糖、纤维二糖和松 二糖;纤维素材料和变体例如半纤维素、甲基纤维素和羧甲基纤维素 钠;饱和或不饱和脂肪酸、琥珀酸盐、乳酸盐和乙酸盐;醇例如乙醇、 甲醇和甘油、或其混合物。碳源还可以是光合作用的产物,例如葡萄 糖。在某些优选实施方案中,碳源是生物量。在其他优选实施方案中, 碳源是葡萄糖。在其他优选实施方案中,碳源是蔗糖。在其他实施方 案中,碳源是甘油。

如本文使用的,术语“生物量”指由其衍生碳源的任何生物材料。 在一些实施方案中,生物量加工成适合于生物转换的碳源。在其他实 施方案中,生物量不需要进一步加工成碳源。碳源可以转换成包含脂 肪酯的组合物。脂肪酯在许多产品中有用,包括但不限于表面活性剂、 聚合物、薄膜、纺织品、染料、药物、香料和调味剂、油漆、涂料、 清漆、在树脂和塑料中的软化剂、增塑剂、阻燃剂以及在汽油和油中 的添加剂。

示例性生物量来源是植物物质或植物,例如玉米、甘蔗或柳枝稷。 另一种示例性生物量来源是代谢废弃物,例如动物物质(例如牛粪)。 进一步示例性生物量来源包括藻类及其他海洋植物。生物量还包括来 自工业、农业、林业和家庭的废弃物,包括但不限于甘油、发酵废料、 青贮饲料、稻草、木材、污水、垃圾、纤维质城市垃圾和剩余食物(例 如肥皂、油和脂肪酸)。术语“生物量”还可以指碳源,例如碳水化合 物(例如单糖、二糖或多糖)。

如本文使用的,就产物(例如脂肪酸及其衍生物)而言的术语“经 分离的”指与细胞组分、细胞培养基或者化学或合成前体分离的产物。 由本文描述的方法产生的脂肪酸及其衍生物可以是在发酵液中以及在 细胞质中相对不能混合的。因此,脂肪酸及其衍生物可以在细胞内或 细胞外的有机相中收集。

如本文使用的,术语“提纯”、“纯化的”或“纯化”意指通过例如离 心或分离,分子从其环境中取出或与其环境的分离。“基本上纯化的” 分子是至少约60%不含(例如至少约70%不含、至少约75%不含、至 少约85%不含、至少约90%不含、至少约95%不含、至少约97%不含、 至少约99%不含)它们与之结合的其他组分。如本文使用的,这些术 语还指从样品中去除污染物。例如,污染物去除可以导致样品中脂肪 酸衍生物百分比中的增加。例如,当脂肪酸衍生物在重组宿主细胞中 产生时,脂肪酸衍生物可以通过去除宿主细胞蛋白质进行纯化。在纯 化后,样品中的脂肪酸衍生物百分比增加。术语“提纯”、“纯化的”和“纯 化”是不要求绝对纯度的相对术语。因此,例如当脂肪酸衍生物在重组 宿主细胞中产生时,纯化的脂肪酸衍生物是基本上与其他细胞组分(例 如核酸、多肽、脂质、碳水化合物或其他烃)分离的脂肪酸衍生物。 如本文使用的,术语“减弱”意指弱化、降低或缩小。例如,多肽可以 通过修饰多肽以降低其活性进行减弱(例如通过修饰编码多肽的核苷 酸序列)。

酯合酶变体

本公开内容尤其涉及变体酯合酶、具有改善特性的此类变体及其 功能片段的多肽序列;编码变体酯合酶多肽序列的多核苷酸;包括编 码改善的酯合酶多肽的核酸的重组微生物;能够表达改善的酯合酶多 肽的微生物;此类微生物的培养物;用于产生脂肪酸酯的过程;脂肪 酸酯组合物及其他使用改善的酯合酶多肽由其衍生的组合物;和所得 的组合物。

特别地,本文提供了具有改善特性的酯合酶多肽和表达这些多肽 的微生物。来自除烃海杆菌菌株DSM8798的野生型酯合酶多肽已在 Holtzapple等人(参见J Bacteriol.(2007)189(10):3804–3812)和 美国专利号7,897,369中描述。SEQ ID NO:2是野生型酯合酶的氨基酸 序列,即来自除烃海杆菌的ES9/DSM8798(除烃海杆菌,GenBank登 录号ABO21021),其用作生成改善的酯合酶的模板,以便举例说明本 发明(参见下文实施例)。优选的酯合酶变体与SEQ ID NO:2的野生 型除烃海杆菌酯合酶(在本文中被称为“WS377”或“’377”)的氨基酸序 列具有至少约90%序列同一性。此外,SEQ ID NO:1是编码SEQ ID  NO:2的多核苷酸序列。就本文描述的酯合酶多肽序列而言,“M” (ATG)视为氨基酸“0”。在ATG后的第一个氨基酸指定为氨基酸“1”。

在一个方面,公开内容提供了具有增强的酯合酶活性的改善的酯 合酶多肽和编码其的核苷酸序列。在另一个方面,可见在SEQ ID NO: 2的野生型‘377多肽内的众多不同氨基酸位置(在本文中也称为“残 基”)处引入的置换获得改善的‘377多肽,相对于野生型‘377,所述改 善的‘377多肽能够催化增加的脂肪酯产生。取决于突变的位置,在指 定位置处的单一氨基酸变化引起脂肪酯生产中的增加或减少。在指定 位置处的单一氨基酸变化还可以引起β羟基(β-OH)酯生产中的增加 或减少。在一个实施方案中,单一氨基酸变化导致脂肪酯生产中的增 加和β-OH酯生产中的减少。在另一个实施方案中,单一氨基酸变化导 致脂肪酯生产中的增加和β-OH酯生产中无变化。在另外一个实施方案 中,单一氨基酸变化导致脂肪酯生产中的增加和β-OH酯生产中的增 加。单一氨基酸变化还可以导致脂肪酯生产中的减少,以及β-OH酯生 产中的增加、减少或无变化。在其他实施方案中,单一或多重氨基酸 变化导致脂肪酯生产中的增加。在另外其他实施方案中,单一或多重 氨基酸变化导致β-OH生产中的增加或减少。

因此,在指定位置处的两个或更多个氨基酸变化的组合可以引起 脂肪酯和/或游离脂肪酸生产中的增加或减少。每个个别氨基酸变化对 脂肪酯和游离脂肪酸生产的作用对于其他个别氨基酸变化对脂肪酯和 游离脂肪酸生产的作用可以是或不是累加的。在一些优选实施方案中, 在指定位置处的两个或更多个氨基酸变化的组合导致脂肪酯生产的增 加和游离脂肪酸生产中的减少。相应地,在指定位置处的多重氨基酸 变化引起脂肪酯生产中的增加或减少。像这样,在指定位置处的多重 氨基酸变化还可以引起β-OH酯生产中的减少。在一些实施方案中,多 重氨基酸变化导致脂肪酯生产中的增加和β-OH酯生产中的减少。在其 他实施方案中,多重氨基酸变化导致脂肪酯生产中的增加和β-OH酯生 产中无变化。在另外其他实施方案中,多重氨基酸变化导致脂肪酯生 产中的增加和β-OH酯生产中的增加。多重氨基酸变化还可以导致脂肪 酯生产中的减少,以及β-OH酯生产中的增加、减少或无变化。

如实施例1(下文)中所述,使用WS377酯合酶作为模板制备完 全饱和文库(saturation library)。基于增加的脂肪酯滴度和/或产生的 β羟基酯百分比中的减少,鉴定了超过200个有利突变。如实施例2和 5中详述的,基于来自饱和文库的“命中”制备组合文库。在一个方面, 公开内容涉及与SEQ ID NO:2具有至少约70%序列同一性的改善的 酯合酶多肽。在一些实施方案中,改善的酯合酶多肽显示与SEQ ID NO: 2的野生型‘377序列至少约75%(例如至少76%、77%、78%、79%、 80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、 91%、92%、93%、94%、95%、96%、97%、98%或至少99%)序 列同一性,并且还包括导致如本文描述的有用特征和/或特性的一种或 多种置换。在公开内容的一个方面,改善的酯合酶多肽与SEQ ID NO: 4具有约100%序列同一性。在公开内容的另一个方面,改善的酯合酶 多肽与下述SEQ ID NO中的任何一个具有约100%序列同一性,所述 SEQ ID NO包括但不限于SEQ ID NO:6、SEQ ID NO:12、SEQ ID NO: 14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、 SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:29、SEQ ID NO:33、 SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41 和SEQ ID NO:43。

在相关方面,改善的酯合酶多肽由与SEQ ID NO:3或SEQ ID NO: 7具有100%序列同一性的核苷酸序列编码。在另一个相关方面,改善 的酯合酶多肽由与下述SEQ ID NO中的任何一个具有约100%序列同 一性的核苷酸序列编码,所述SEQ ID NO包括但不限于SEQ ID NO: 5、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、 SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、 SEQ ID NO:25、SEQ ID NO:28、SEQ ID NO:32、SEQ ID NO:34、 SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40和SEQ ID NO:42。

在另一个方面,公开内容涉及与SEQ ID NO:4具有至少约70%序 列同一性的改善的酯合酶多肽。在一些实施方案中,改善的酯合酶多 肽与SEQ ID NO:4的酯合酶序列具有至少约75%(例如至少76%、 77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或至少99%)序列同一性,并且还包括导致如本文描述的改善特征和/ 或特性的一种或多种置换。在另一个方面,公开内容涉及与下述SEQ  ID NO中的任何一个具有至少约70%序列同一性的改善的酯合酶多 肽,所述SEQ ID NO包括但不限于SEQ ID NO:6、SEQ ID NO:12、 SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、 SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:29、 SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、 SEQ ID NO:41和SEQ ID NO:43。在一些实施方案中,改善的酯合酶 多肽与下述SEQ ID NO中的任何一个的酯合酶序列具有至少约75% (例如至少76%、77%、78%、79%、80%、81%、82%、83%、84%、 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、 96%、97%、98%或至少99%)序列同一性,所述SEQ ID NO包括但 不限于SEQ ID NO:6、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO: 16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、 SEQ ID NO:26、SEQ ID NO:29、SEQ ID NO:33、SEQ ID NO:35、 SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41和SEQ ID NO:43, 并且还包括导致如本文描述的改善特征和/或特性的一种或多种置换。

在另一个方面,公开内容涉及改善的酯合酶多肽,其包含由如下 核酸序列编码的氨基酸序列,所述核酸序列与SEQ ID NO:5的酯合酶 序列具有至少约75%(例如至少76%、77%、78%、79%、80%、81%、 82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%或至少99%)序列同一性。在 一些实施方案中,核酸序列编码具有一种或多种置换的酯合酶变体, 所述一种或多种置换导致如本文描述的改善特征和/或特性。在其他实 施方案中,改善的或变体酯合酶核酸序列衍生自除了除烃海杆菌外的 物种。在另一个方面,公开内容涉及改善的酯合酶多肽,其包含由核 酸序列编码的氨基酸序列,所述核酸序列与下述SEQ ID NO中的任何 一个的酯合酶序列具有至少约75%(例如至少76%、77%、78%、79%、 80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、 91%、92%、93%、94%、95%、96%、97%、98%或至少99%)序 列同一性,所述SEQ ID NO包括但不限于SEQ ID NO:7、SEQ ID NO: 9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、 SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、 SEQ ID NO:28、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、 SEQ ID NO:38、SEQ ID NO:40和SEQ ID NO:42。在一些实施方案 中,核酸序列编码具有一种或多种置换的酯合酶变体,所述一种或多 种置换导致如本文描述的改善特征和/或特性。在其他实施方案中,改 善的或变体酯合酶核酸序列衍生自除了除烃海杆菌外的物种。

在另一个方面,公开内容涉及包含由如下核酸编码的氨基酸序列 的酯合酶多肽,所述核酸在严格条件下在对应于下述SEQ ID NO中的 任何一个的核酸的基本上整个长度上杂交,所述SEQ ID NO包括但不 限于SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、 SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、 SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:28、SEQ ID NO:32、 SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40 和SEQ ID NO:42。在一些实施方案中,核酸序列编码衍生自除了除烃 海杆菌外的物种的改善的或变体酯合酶核酸序列。在相关方面,公开 内容提供了由核苷酸序列编码的酯合酶,所述核苷酸序列与SEQ ID  NO:1具有至少约70%(例如至少71%、72%、73%、74%、75%、 76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、 98%或至少99%)序列同一性,并且包含本文公开的置换中的一种或 多种。

酯合酶变体的改善特性

来自除烃海杆菌DSM 8798(“’377”)的野生型酯合酶改造为产生 高百分比的脂肪酯,而无需过表达任何其他基因,使用在大肠杆菌中 的表达作为举例说明性模型。另外,当在重组宿主细胞例如大肠杆菌 中表达时,导致更高滴度、得率或生产率的野生型酯合酶的变体还产 生大于约20%、25%、30%、35%、40%、45%、50%或更多β–OH 酯。在一个方面,本公开内容提供了酯合酶的改善变体,其具有比野 生型酯合酶更高的滴度、得率或生产率,并且还产生比野生型酶更低 百分比的β-OH酯。在优选实施方案中,公开内容的变体酯合酶产生小 于约20%、18%、16%、14%、12%、10%、9%、8%、7%、6%、 5%、4%、3%、2%或小于约1%β-OH酯。像这样,公开内容的酯合 酶变体显示出如本文描述的改善特征和/或特性,例如脂肪酸酯的滴度、 得率和/或生产率中的增加;和/或β羟基酯的滴度、得率或生产率中的 减少。因此,改造酯合酶以具有更高的滴度、得率和/或生产率基本上 阻止大肠杆菌使用无效循环中的资源(参见图2),同时允许脂肪酸酯 的高水平生产,例如用作生物柴油或用于制造表面活性剂。

Photobacterium profundum变体

本公开内容尤其涉及具有增加的酯合酶活性的变体硫酯酶;具有 改善特性的此类变体及其功能片段的多肽序列;编码具有增加的酯合 酶活性的变体硫酯酶多肽序列的多核苷酸;包含编码具有增加的酯合 酶活性的改善硫酯酶多肽的核酸的重组微生物;能够表达具有增加的 酯合酶活性的改善硫酯酶多肽序列的微生物;此类微生物的培养物; 用于产生脂肪酸酯的过程;脂肪酸酯组合物及使用具有增加的酯合酶 活性的改善硫酯酶多肽由其衍生的其他组合物;和所得的组合物。

特别地,本文提供了具有改善特性例如增加的酯合酶活性的硫酯 酶多肽和表达这些多肽的微生物。野生型Photobacterium profundum (Ppro)多肽已在Vezzi等人(参见Science(2005)307:1459-1461) 中描述。SEQ ID NO:51是来自Photobacterium profundum的硫酯酶的 野生型氨基酸序列。SEQ ID NO:50是编码SEQ ID NO:51的多核苷 酸序列。将硫酯酶靶向周质内的前导序列从SEQ ID NO:50中去除。 改善的硫酯酶多肽例如变体Ppro多肽具有增强的酯合酶活性。就本文 描述的Ppro多肽序列而言,“M”(ATG)视为氨基酸“0”。在ATG后 的第一个氨基酸指定为氨基酸“1”。

在一个方面,公开内容提供了具有增强的酯合酶活性的改善的 Ppro多肽和编码其的核苷酸序列。改善的Ppro多肽是具有增加或增强 的酯合酶活性的变体硫酯酶多肽的例子。在另一个方面,可见在SEQ  ID NO:51的野生型Ppro内的众多不同氨基酸位置(在本文中也称为 “残基”位置)处引入的置换获得改善的Ppro多肽,相对于野生型Ppro, 所述改善的Ppro多肽能够催化增加的脂肪酯产生。取决于突变的位置, 在指定位置处的单一氨基酸变化引起脂肪酯生产中的增加或减少。在 指定位置处的单一氨基酸变化还可以引起游离脂肪酸生产中的增加或 减少。在一些优选实施方案中,单一氨基酸变化导致脂肪酯生产中的 增加和游离脂肪酸生产中的减少。在其他实施方案中,单一氨基酸变 化导致脂肪酯生产中的增加和游离脂肪酸生产中无变化。在另外其他 实施方案中,单一氨基酸变化导致脂肪酯生产中的增加和游离脂肪酸 生产中的增加。单一氨基酸变化还可以导致脂肪酯生产中的减少,以 及游离脂肪酸生产中的增加、减少或无变化。在指定位置处的两个或 更多个氨基酸变化的组合还可以引起脂肪酯和/或游离脂肪酸生产中的 增加或减少。每个个别氨基酸变化对脂肪酯和游离脂肪酸生产的作用 对于其他个别氨基酸变化对脂肪酯和游离脂肪酸生产的作用可以是或 不是累加的。在一些优选实施方案中,在指定位置处的两个或更多个 氨基酸变化的组合导致脂肪酯生产的增加和游离脂肪酸生产中的减 少。

在一个方面,公开内容涉及与SEQ ID NO:51具有至少约70%序 列同一性的Ppro多肽。在一些实施方案中,Ppro多肽显示与SEQ ID  NO:51的野生型Ppro序列至少约75%(例如至少76%、77%、78%、 79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、 90%、91%、92%、93%、94%、95%、96%、97%、98%或和至少 99%)序列同一性,并且还包括导致如本文描述的改善特征和/或特性 的一种或多种置换。在相关方面,Ppro多肽与SEQ ID NO:51具有 100%序列同一性。在其他相关方面,Ppro多肽与SEQ ID NO:53、SEQ  ID NO:55、SEQ ID NO:58、SEQ ID NO:61、SEQ ID NO:63、SEQ ID  NO:65或SEQ ID NO:31具有100%序列同一性。

在一个方面,公开内容涉及与SEQ ID NO:61具有至少约70%序 列同一性的Ppro多肽。在一些实施方案中,Ppro多肽与SEQ ID NO:61 的野生型Ppro序列具有至少约75%(例如至少76%、77%、78%、79%、 80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、 91%、92%、93%、94%、95%、96%、97%、98%或和至少99%) 序列同一性,并且还包括导致如本文描述的改善特征和/或特性的一种 或多种置换。

在另一个方面,公开内容涉及与SEQ ID NO:31具有至少约70% 序列同一性的Ppro多肽。在一些实施方案中,Ppro多肽与SEQ ID NO: 31的野生型Ppro序列具有至少约75%(例如至少76%、77%、78%、 79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、 90%、91%、92%、93%、94%、95%、96%、97%、98%或和至少 99%)序列同一性,并且还包括导致如本文描述的改善特征和/或特性 的一种或多种置换。

在另一个方面,公开内容涉及包含由如下核酸序列编码的氨基酸 序列的Ppro多肽,所述核酸序列与SEQ ID NO:50、SEQ ID NO:52、 SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO:59、 SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64或SEQ ID NO:30 的野生型Ppro序列具有至少约75%(例如至少76%、77%、78%、79%、 80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、 91%、92%、93%、94%、95%、96%、97%、98%或和至少99%) 序列同一性。在一些实施方案中,核酸序列编码具有一种或多种置换 的Ppro变体,所述一种或多种置换导致如本文描述的改善特征和/或特 性。在其他实施方案中,Ppro核酸序列衍生自除了Photobacterium  profundum外的物种。

在另一个方面,公开内容涉及包含由如下核酸编码的氨基酸序列 的Ppro多肽,所述核酸在严格条件下在对应于SEQ ID NO:50、SEQ ID  NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:57、SEQ ID NO: 59、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64或SEQ ID NO: 30的核酸的基本上整个长度上杂交。在一些实施方案中,核酸序列编 码衍生自除了Photobacterium profundum外的物种的Ppro变体。在相 关方面,公开内容提供了由如下核苷酸序列编码的Ppro,所述核苷酸 序列与SEQ ID NO:50具有至少约70%(例如至少71%、72%、73%、 74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、 96%、97%、98%或至少99%)序列同一性,并且包含本文公开的置 换(参见例如表13)。

Ppro变体的改善特性

为了举例说明公开内容,来自P.profundum的‘tesA改造为产生更 高百分比的FAME,而无需在大肠杆菌中过表达任何其他基因。直接 作用于酰基-ACP(脂肪酸生物合成的产物)的酯合酶可以针对增加的 酯生产,以及允许直接拉动来自脂肪酸生物合成的途径,其也应改善 生产。另外,文库之一就FAEE的产生进行测试,并且观察到对于FAME 经改造的来自P.profundum的‘tesA,还产生比野生型菌株更高水平的 FAEE。这些Ppro变体显示出如本文描述的改善特征和/或特性,例如 脂肪酸酯滴度、得率和/或生产率中的增加;和/或游离脂肪酸滴度、得 率和/或生产率中的减少。作为例子,P.profundum(Ppro)的tesA改 造为具有酯合酶活性。换言之,Ppro的tesA改造为充当酯合酶。当在 板中筛选中,野生型tesA Ppro基因产生总酰基产物(FAME+游离脂 肪酸(“FFA”))的约15-18%FAME。当在板上测试时,鉴定了导致 FAME生产增加42-44%的突变体。当这些相同突变体在摇瓶中测试 时,当与仅产生30%FAME的野生型tesA Ppro相比较时,它们产生 62-65%FAME(参见下文实施例7)。

制备酯合酶或Ppro变体的方法

在实践本公开内容的方法中,诱变用于制备重组宿主细胞群用于 筛选。通常,重组宿主细胞包含一种或多种多核苷酸序列,其包括关 于酯合酶或Ppro多肽的开放读码框,例如酯合酶的变体或硫酯酶(例 如Ppro)的变体连同可操作地连接的调节序列。在本文中描述了在本 公开内容的方法的实践中有用的变体酯合酶多肽和变体硫酯酶多肽的 众多例子。在本文中还描述了在本公开内容的方法的实践中有用的调 节序列的例子。此类多核苷酸序列的诱变可以使用遗传改造技术执行, 所述遗传改造技术例如定点诱变、随机化学诱变、外切核酸酶III缺失 操作或标准克隆技术。备选地,多核苷酸序列中的突变可以使用化学 合成或修饰操作进行制备。

诱变方法是本领域众所周知的,并且包括例如下述。在易错PCR (参见例如Leung等人,Technique 1:11-15,1989;和Caldwell等人, PCR Methods Applic.2:28-33,1992)中,PCR在其中DNA聚合酶的 拷贝保真度很低的条件下执行,从而使得沿PCR产物的整个长度获得 高点突变率。简言之,在此类操作中,待诱变的多核苷酸与PCR引物、 反应缓冲液、MgCl2、MnCl2、Taq聚合酶和适当浓度的dNTP混合, 用于实现沿PCR产物的整个长度的高点突变率。例如,反应可以使用 20fmole待诱变的核酸、30pmole每种PCR引物、包含下述的反应缓 冲液来执行:50mM KCl、10mM Tris HCl(pH 8.3)和0.01%明胶、 7mM MgCl2、0.5mM MnCl2、5单位Taq聚合酶、0.2mM dGTP、0.2 mM dATP、1mM dCTP和1mM dTTP。PCR可以执行30个循环: 94℃1分钟、45℃1分钟和72℃1分钟。应当理解这些参数可以适当加 以改变。随后将诱变的多核苷酸克隆到适当载体内,并且评估由诱变 的多核苷酸编码的受影响多肽的活性。诱变还可以使用寡核苷酸指导 的诱变执行(参见例如Reidhaar-Olson等人,Science 241:53-57,1988), 以在任何目的克隆DNA中生成位点特异性突变。简言之,在此类操作 中,具有待引入克隆DNA内的一个或多个突变的多个双链寡核苷酸合 成且装配到待诱变的克隆DNA内。回收含有诱变DNA的克隆,并且 评价受影响多肽的活性。用于生成多核苷酸序列变体的另一种诱变方 法是装配PCR。装配PCR涉及来自小DNA片段混合物的PCR产物 的装配。大量不同PCR反应在同一小瓶中平行发生,其中一种反应的 产物作为另一种反应的产物的引物。装配PCR在例如美国专利号 5,965,408中描述。生成多核苷酸序列变体的另外一种诱变方法是有性 PCR诱变(Stemmer,PNAS,USA 91:10747-10751,1994)。在有性 PCR诱变中,由于DNA分子基于序列同源性的随机断裂,被迫的同源 重组在体外在不同但高度相关的DNA序列的DNA分子之间发生。这 随后为在PCR反应中通过引物延伸的交换固定。

酯合酶(例如‘377)或硫酯酶(例如Ppro)序列变体还可以通过 体内诱变进行制备。在一些实施方案中,核酸序列中的随机突变通过 在细菌菌株例如大肠杆菌菌株中繁殖多核苷酸序列来生成,所述细菌 菌株携带在DNA修复途径的一种或多种中的突变。此类“增变”株具有 比野生型菌株那种更高的随机突变率。在这些菌株之一中繁殖DNA序 列最终生成在DNA内的随机突变。适用于体内诱变的增变株在例如 PCT国际公开号WO 91/16427中描述。

酯合酶(例如‘377)或硫酯酶(例如Ppro)序列变体还可以使用 盒式诱变来生成。在盒式诱变中,将双链DNA分子的小区域替换为合 成寡核苷酸“盒”,其不同于起始多核苷酸序列。寡核苷酸通常含有完 全和/或部分随机化形式的起始多核苷酸序列。存在盒式诱变的许多应 用;例如,通过盒式诱变制备突变蛋白质(参见例如Richards,J.H., Nature 323,187(1986);Ecker,D.J.,等人,J.Biol.Chem.262:3524-3527 (1987));密码子盒式诱变以插入或替换个别密码子(参见例如 Kegler-Ebo,D.M.,等人,Nucleic Acids Res.22(9):1593–1599(1994)); 通过包含调节序列的非编码多核苷酸序列的随机化制备变体多核苷酸 序列(例如核糖体结合位点,参见例如Barrick,D.,等人,Nucleic Acids  Res.22(7):1287–1295(1994);Wilson,B.S.,等人,Biotechniques 17:944-953(1994))。

递归整体诱变(Recursive ensemble mutagenesis)(参见例如Arkin 等人,PNAS,USA 89:7811-7815,1992)也可以用于生成多核苷酸序 列变体。递归整体诱变是用于蛋白质改造(即蛋白质诱变)的算法, 开发以产生表型相关突变体的不同群体,其成员在氨基酸序列中不同。 该方法使用反馈机制来控制组合盒式诱变的相继循环。指数整体诱变 (Exponential ensemble mutagenesis)(参见例如Delegrave等人, Biotech.Res.11:1548-1552,1993)也可以用于生成多核苷酸序列变体。 指数整体诱变是用于生成具有高百分比的独特和功能突变体的组合文 库的方法,其中残基的小群体平行随机化,以鉴定在每个改变的位置 处导致功能蛋白质的氨基酸。还可以使用随机和定点诱变(参见例如 Arnold,Curr.Opin.Biotech.4:450-455,1993)。

进一步地,可以使用体内诱变的标准方法。例如,包含一种或多 种多核苷酸序列的宿主细胞,可以经由暴露于射线(例如UV光或X 筛选)或暴露于化学制品(例如乙基化剂、烷化剂或核酸类似物)实 施诱变,所述多核苷酸序列包括关于酯合酶(例如‘377)或硫酯酶(例 如Ppro)多肽的开放读码框,以及可操作地连接的调节序列。在一些 宿主细胞类型例如细菌、酵母和植物中,转座元件也可以用于体内诱 变。

编码酯合酶变体例如‘377变体的一种或多种多核苷酸序列的诱变 一般导致酯合酶多肽产物的表达,其证实经修饰和改善的生物功能。 类似地,编码Ppro变体的一种或多种多核苷酸序列的诱变一般导致 Ppro多肽产物的表达,其证实经修饰和改善的生物功能例如增强的酯 合酶活性。例如,当通过一种或多种多核苷酸序列的诱变制备一群重 组微生物时,所述多核苷酸序列包括编码‘377多肽的开放读码框和可 操作地连接的调节序列,由所得到的诱变的多核苷酸序列表达的蛋白 质可以维持‘377酯合酶生物功能,然而,在有效表达突变型‘377多核 苷酸的条件下培养重组微生物后,观察到改善的脂肪酯得率、减少的β 羟基酯得率和/或包含脂肪酯产物的经修饰混合物的改善组合物(就链 长、饱和度等等而言)。类似地,当通过一种或多种多核苷酸序列的 诱变制备一群重组微生物时,所述多核苷酸序列包括编码Ppro多肽的 开放读码框和可操作地连接的调节序列,由所得到的诱变的多核苷酸 序列表达的蛋白质可以维持Ppro硫酯酶生物功能,但在重组微生物中 观察到酯合酶活性。由于酯合酶活性,在有效表达突变型Ppro多核苷 酸的条件下培养重组微生物后,观察到改善的脂肪酯得率、包含脂肪 酯产物的经修饰混合物的改善组合物(就链长、饱和度等等而言)。 在另一个实施方案中,一种或多种Ppro多核苷酸序列的诱变一般导致 Ppro多肽产物的表达,其可以保留与野生型或亲本Ppro多肽相同的生 物功能,即使突变型Ppro多肽证实经修饰的生物功能。例如,当通过 一种或多种多核苷酸序列的诱变制备一群重组微生物时,所述多核苷 酸序列包括编码Ppro多肽的开放读码框和可操作地连接的调节序列, 由所得到的诱变的多核苷酸序列表达的蛋白质可以维持Ppro硫酯酶生 物功能,但在重组微生物中观察到酯合酶活性。

热点

公开内容至少部分基于在变体酯合酶多肽例如‘377多肽中的某些 结构上保守的“热点”的鉴定。热点是其中观察到大量突变的区域,所 述突变导致‘377多肽中更高滴度的脂肪酯产物和/或更低的β羟基酯生 产。值得注意的是,此类区域在变体酯合酶多肽中可见,与缺乏这些 热点的野生型多肽相比较,所述变体酯合酶多肽显示出更大的酯合酶 活性。热点包括氨基酸区域39-44;76-80;98-102;146-150;170-207, 特别是182-207(例如显示最高数目的突变);242-246;300-320;348-357; 和454-458。

基序

公开内容至少部分基于在具有增强的酯合酶活性的硫酯酶多肽中 的某些结构上保守的基序的鉴定,其中与缺乏所述基序的野生型硫酯 酶多肽相比较,包含这些基序之一的硫酯酶多肽例如Ppro具有最大的 酯合酶活性。相应地,公开内容特征在于变体硫酯酶多肽,例如Ppro, 其包含在SEQ ID NO:51的氨基酸区域73-81处的基序,具有下文所 示的置换。

Leu-Gly-[Ala或Gly]-[Val或Ile或Leu]-Asp-[Ala或Gly]-Leu-Arg-Gly

LG[AG][VIL]D[AG]LRG(SEQ ID NO:66)

潜在置换包括在第75位氨基酸处的丙氨酸(A)或甘氨酸(G); 在第76位氨基酸处的缬氨酸(V)、异亮氨酸(I)或亮氨酸(L); 和在第78位氨基酸处的丙氨酸(A)或甘氨酸(G)。

重组宿主细胞和重组宿主细胞培养物

公开内容的重组宿主细胞包含一种或多种多核苷酸序列,其包含 编码具有酯合酶活性的多肽的开放读码框,例如催化酰基-硫酯至脂肪 酯的转换的任何多肽,连同可操作地连接的调节序列,其促进具有酯 合酶活性的多肽在重组宿主细胞中的表达。在一个优选实施方案中, 具有改善的酯合酶活性的多肽是‘377的变体或突变体。在另一个优选 实施方案中,具有改善的酯合酶活性的多肽是Ppro的变体或突变体。 在公开内容的重组宿主细胞中,开放读码框编码序列和/或调节序列可 以相对于‘377或Ppro多肽的相应野生型编码序列进行修饰。通过在碳 源的存在下,在有效表达变体酯合酶多肽(例如‘377)或具有酯合酶活 性的变体硫酯酶多肽(例如Ppro)的条件下,培养重组宿主细胞产生 脂肪酯组合物。突变体或变体‘377多肽的表达导致脂肪酯组合物的产 生,所述脂肪酯组合物具有增加的脂肪酯得率和减少的β羟基酯得率。 突变体或变体Ppro多肽的表达导致产生具有增加的脂肪酯得率的脂肪 酯组合物。

为了举例说明公开内容,申请人已构建表达变体酯合酶多肽序列 的宿主菌株(参见下文实施例)。当在重组宿主细胞中表达时,导致 更高滴度的脂肪酯的变体酯合酶多肽序列的例子包括但不限于在以下 宿主菌株中表达的序列:9B12(SEQ ID NO:4)、pKEV022(SEQ ID  NO:10)、KASH008(SEQ ID NO:16)、KASH280(SEQ ID NO:33) 和KASH281(SEQ ID NO:35)。当在重组宿主细胞中表达时,导致 更高滴度的脂肪酯和β-OH酯生产中的减少的变体酯合酶多肽序列的 例子包括但不限于在一下宿主菌株中表达的序列:pKEV28(SEQ ID  NO:12)和KASH008(SEQ ID NO:16)、KASH285(SEQ ID NO:37)、 KASH286(SEQ ID NO:39)、KASH288(SEQ ID NO:41)和KASH289 (SEQ ID NO:43)。

当在重组宿主细胞中表达时,导致更高滴度的脂肪酯的变体Ppro 多肽序列的例子包括但不限于在以下宿主菌株中表达的序列:PROF1 (SEQ ID NO:53)、PROF2(SEQ ID NO:55)、P1B9(SEQ ID NO: 58)、N115F(SEQ ID NO:61)、Vc7P4H5(SEQ ID NO:63)、Vc7P5H9 (SEQ ID NO:65)和Vc7P6F9(SEQ ID NO:31)。

重组宿主细胞可以产生脂肪酯,例如脂肪酸甲酯(FAME)、脂肪 酸乙酯(FAEE)、蜡酯等等。脂肪酸酯通常从培养基中回收。由重组 宿主细胞产生的脂肪酸酯组合物可以使用本领域已知的方法例如 GC-FID进行分析,以便测定特定脂肪酸酯的分布以及脂肪酯组合物的 组分的链长和饱和程度。

制备重组宿主细胞和培养物的方法

本领域众所周知的多种方法可以用于遗传改造宿主细胞,以产生 脂肪酯和/或脂肪酯组合物。该方法可以包括载体优选表达载体的使用, 所述载体包含编码突变体或变体‘377酯合酶或者具有酯合酶活性的 Ppro硫酯酶的核酸。本领域技术人员应当理解多种病毒和非病毒载体 可以用于本文描述的方法中。

在本公开内容的一些实施方案中,特定组合物中的脂肪酯的“更 高”滴度是相对于由相应的野生型宿主细胞的对照培养物产生的相同 脂肪酸酯或脂肪酸酯组合的滴度,由重组宿主细胞培养物产生的特定 类型脂肪酸酯或脂肪酸酯组合的更高滴度。在一些实施方案中,突变 体或变体‘377酯合酶多核苷酸(或基因)序列或者突变体或变体Ppro 多核苷酸(或基因)序列通过重组载体提供给宿主细胞,所述重组载 体包含可操作地连接至多核苷酸序列的启动子。在某些实施方案中, 启动子是发育调节、器官特异性、组织特异性、诱导型、组成型或细 胞特异性启动子。重组载体通常包含选自下述的至少一种序列:可操 作地偶联至多核苷酸序列的表达控制序列;可操作地偶联至多核苷酸 序列的选择标记;可操作地偶联至多核苷酸序列的标记序列;可操作 地偶联couple至多核苷酸序列的纯化部分;可操作地偶联至多核苷酸 序列的分泌序列;和可操作地偶联至多核苷酸序列的靶向序列。包含 编码蛋白质的开放读码框和可操作地连接的调节序列的一种或多种多 核苷酸序列,可以整合到重组宿主细胞的染色体内,掺入位于重组宿 主细胞中的一种或多种质粒表达系统内,或两者。

本文描述的表达载体包括以适合于在宿主细胞中表达多核苷酸序 列的形式的本文描述的多核苷酸序列。本领域技术人员应当理解表达 载体的设计可以取决于此类因素,如待转化的宿主细胞的选择、所需 多肽表达水平等。本文描述的表达载体可以引入宿主细胞内,以产生 由如本文描述的多核苷酸序列编码的多肽,包括融合多肽。编码多肽 的基因在原核生物例如大肠杆菌中的表达最通常用含有组成型或诱导 型启动子的载体进行,所述组成型或诱导型启动子指导融合或非融合 多肽的表达。用于原核和真核细胞两者的合适表达系统是本领域众所 周知的;参见例如Sambrook等人,“Molecular Cloning:A Laboratory  Manual,”第二版,Cold Spring Harbor Laboratory,(1989)。在某 些实施方案中,公开内容的多核苷酸序列可操作地连接至衍生自细菌 噬菌体T5的启动子。在一个实施方案中,宿主细胞是酵母细胞。在该 实施方案中,表达载体是酵母表达载体。经由多种领域公认的用于将 外源核酸(例如DNA)引入宿主细胞内的技术,可以将载体引入原核 或真核细胞内。用于转化或转染宿主细胞的合适方法可以在例如 Sambrook等人(同上)中找到。

对于细菌细胞的稳定转化,已知取决于使用的表达载体和转化技 术,仅小部分的细胞将吸收且复制表达载体。为了鉴定且选择这些转 化体,编码可选标记(例如对抗生素的抗性)的基因可以连同目的基 因一起引入宿主细胞内。可选标记包括赋予对于药物的抗性的那些, 所述药物例如但不限于氨苄青霉素、卡那霉素、氯霉素或四环素。编 码可选标记的核酸可以在与编码本文描述的多肽相同的载体上引入宿 主细胞内,或可以在分开的载体上引入。用所引入的核酸稳定转化的 细胞可以通过在合适的选择药物的存在下的生长进行鉴定。

其为微生物的宿主细胞的例子包括但不限于来自下述属的细胞: 埃希氏菌属(Escherichia)、芽孢杆菌属(Bacillus)、乳杆菌属 (Lactobacillus)、发酵单胞菌属(Zymomonas)、红球菌属 (Rhodococcus)、假单胞菌属(Pseudomonas)、曲霉菌属(Aspergillus)、 木霉属(Trichoderma)、链孢霉属(Neurospora)、镰刀菌属(Fusarium)、 腐质霉属(Humicola)、根毛霉菌属(Rhizomucor)、克鲁维酵母属 (Kluyveromyces)、毕赤酵母属(Pichia)、毛霉菌属(Mucor)、毁 丝菌属(Myceliophtora)、青霉属(Penicillium)、平革菌属 (Phanerochaete)、侧耳属(Pleurotus)、栓菌属(Trametes)、金 孢子菌属(Chrysosporium)、酵母属(Saccharomyces)、寡养单胞菌 属(Stenotrophamonas)、裂殖酵母属(Schizosaccharomyces)、耶氏 酵母属(Yarrowia)、或链霉菌属(Streptomyces)。在一些实施方案 中,宿主细胞是革兰氏阳性菌细胞。在其他实施方案中,宿主细胞是 革兰氏阴性菌细胞。在一些实施方案中,宿主细胞是大肠杆菌细胞。 在其他实施方案中,宿主细胞是迟缓芽孢杆菌(Bacillus lentus)细胞、 短芽孢杆菌(Bacillus brevis)细胞、嗜热脂肪芽孢杆菌(Bacillus  stearothermophilus)细胞、地衣芽孢杆菌(Bacillus lichenoformis)细 胞、嗜碱芽孢杆菌(Bacillus alkalophilus)细胞、凝结芽孢杆菌(Bacillus  coagulans)细胞、环状芽孢杆菌(Bacillus circulans)细胞、短小芽孢 杆菌(Bacillus pumilis)细胞、苏云金芽孢杆菌(Bacillus thuringiensis) 细胞、克劳氏芽孢杆菌(Bacillus clausii)细胞、巨大芽孢杆菌(Bacillus  megaterium)细胞、枯草芽孢杆菌(Bacillus subtilis)细胞、或解淀粉 芽孢杆菌(Bacillus amyloliquefaciens)细胞。

在另外其他实施方案中,宿主细胞是康氏木霉(Trichoderma  koningii)细胞、绿色木霉(Trichoderma viride)细胞、里氏木霉 (Trichoderma reesei)细胞、长梗木霉(Trichoderma longibrachiatum) 细胞、泡盛曲霉(Aspergillus awamori)细胞、烟曲霉(Aspergillus  fumigates)细胞、臭曲霉(Aspergillus foetidus)细胞、构巢曲霉 (Aspergillus nidulans)细胞、黑曲霉(Aspergillus niger)细胞、米曲 霉(Aspergillus oryzae)细胞、特异腐质霉(Humicola insolens)细胞、 柔毛腐质霉(Humicola lanuginose)细胞、混浊红球菌(Rhodococcus  opacus)细胞、米赫根毛霉(Rhizomucor miehei)细胞或米黑毛霉(Mucor  michei)细胞。在另外其他实施方案中,宿主细胞是变铅青链霉菌 (Streptomyces lividans)细胞或鼠灰链霉菌(Streptomyces murinus) 细胞。在另外其他实施方案中,宿主细胞是放线菌属(Actinomycetes) 细胞。在一些实施方案中,宿主细胞是酿酒酵母(Saccharomyces  cerevisiae)细胞。

在其他实施方案中,宿主细胞是来自真核植物、藻类、蓝细菌、 绿色硫细菌、绿色非硫细菌、紫色硫细菌、紫色非硫细菌、嗜极生物 (extremophile)、酵母、真菌、其改造生物体、或其合成生物体的细 胞。在一些实施方案中,宿主细胞是光依赖性的或固氮。在一些实施 方案中,宿主细胞具有自养活性。

在一些实施方案中,宿主细胞例如在光的存在下具有光合自养活 性。在一些实施方案中,宿主细胞在不存在光的情况下是异养或兼氧 的。在某些实施方案中,宿主细胞是来自拟南芥(Arabidopsis thaliana)、 柳枝稷(Panicum virgatum)、芒草(Miscanthus giganteus)、玉蜀黍 (Zea mays)、布朗葡萄藻(Botryococcuse braunii)、莱茵衣藻 (Chlamydomonas reinhardtii)、盐生杜氏藻(Dunaliela salina)、聚 球藻属物种(Synechococcus Sp.)PCC 7002、聚球藻属物种PCC 7942、 集胞藻属物种(Synechocystis Sp.)PCC 6803、嗜热聚球藻 (Thermosynechococcus elongates)BP-1、绿硫菌(Chlorobium  tepidum)、嗜热光合绿曲菌(Chlorojlexus auranticus)、酒色着色菌 (Chromatiumm vinosum)、深红红螺菌(Rhodospirillum rubrum)、 荚膜红细菌(Rhodobacter capsulatus)、沼泽红假单胞菌 (Rhodopseudomonas palusris)、杨氏梭菌(Clostridium ljungdahlii)、 热纤梭菌(Clostridium thermocellum)、产黄青霉(Penicillium  chrysogenum)、巴斯德毕赤酵母(Pichia pastoris)、酿酒酵母、粟酒 裂殖酵母(Schizosaccharomyces pombe)、荧光假单胞菌(Pseudomonas  fluorescens)、或运动发酵单胞菌(Zymomonas mobilis)的细胞。

遗传改造的宿主细胞的培养和发酵

如本文使用的,术语“发酵”泛指有机材料通过宿主细胞转换成靶 物质,例如通过在包含碳源的培养基中繁殖重组宿主细胞的培养物, 碳源通过重组宿主细胞转换成脂肪酸或其衍生物。如本文使用的,术 语“允许生产的条件”意指允许宿主细胞产生所需产物例如脂肪酸酯组 合物的任何条件。类似地,术语“其中表达载体的多核苷酸序列的条件” 意指允许宿主细胞合成多肽的任何条件。合适条件包括例如发酵条件。 发酵条件可以包含许多参数,包括但不限于温度范围、曝气水平、进 料速率和培养基组成。这些条件各自个别和组合允许宿主细胞生长。 发酵可以是好氧的、厌氧的或其变化(例如微好氧的)。示例性培养 基包括肉汤或凝胶。一般地,培养基包括可以由宿主细胞直接代谢的 碳源。另外,酶可以在培养基中使用,以促进碳源的动员(例如淀粉 或纤维素解聚为可发酵糖)和后续代谢。

对于小规模生产,经改造的宿主细胞可以在例如约100μL、200 μL、300μL、400μL、500μL、1mL、5mL、10mL、15mL、25mL、 50mL、75mL、100mL、500mL、1L、2L、5L或10L的分批中生 长;发酵;且诱导以表达所需多核苷酸序列,例如编码具有酯合酶活 性的多肽的多核苷酸序列。对于大规模生产,经改造的宿主细胞可以 在具有约10L、100L、1000L、10,000L、100,000L、1,000,000L或 更大的体积分批的培养物中生长;发酵;且诱导以表达所需多核苷酸 序列。本文描述的脂肪酯组合物在重组宿主细胞培养物的细胞外环境 中发现,并且可以与培养基容易地分离。脂肪酸衍生物可以由重组宿 主细胞分泌,转运到细胞外环境内或被动转移到重组宿主细胞培养物 的细胞外环境内。脂肪酯组合物可以使用本领域已知的常规方法从重 组宿主细胞培养物中分离。

筛选遗传改造的宿主细胞

在本公开内容的一个实施方案中,突变体或变体‘377酯合酶多肽 的活性通过下述进行测定:培养重组宿主细胞(包含一种或多种诱变 的酯合酶例如‘377多核苷酸序列),随后筛选以测定由重组宿主细胞 产生的脂肪酸酯组合物的特征;例如脂肪酸酯的滴度、得率和生产率; 和β羟基酯百分比。在另一个实施方案中,突变体或变体Ppro多肽的 活性通过下述进行测定:培养重组宿主细胞(包含一种或多种诱变的 硫酯酶例如Ppro多核苷酸序列),随后筛选以测定由重组宿主细胞产 生的脂肪酸酯组合物的特征;例如:脂肪酸酯的滴度、得率和生产率; 和游离脂肪酸。突变体或变体‘377酯合酶多肽或者突变体或变体Ppro 多肽及其片段可以使用常规方法就酯合酶活性进行测定。例如,突变 体或变体‘377酯合酶多肽或者Ppro多肽或其片段与底物(例如酰基 -CoA、酰基-ACP、游离脂肪酸或醇)在允许多肽起作用的条件下接触。 可以测量底物水平中的减少或者脂肪酯或脂肪酯组合物水平中的增 加,以测定酯合酶活性。

衍生自重组宿主细胞的产物

如本文使用的,“现代碳分数(fraction of modem carbon)”或fM 具有与由美国国家标准技术研究所(National Institute of Standards  and Technology)(NIST)标准参考材料(SRMs 4990B和4990C,分 别称为草酸标准HOxI和HOxII)定义的相同含义。基础定义涉及0.95 倍的14C/12C同位素比率HOxI(参考AD 1950)。这大致等于衰变 校正的工业革命前树木(decay-corrected pre-Industrial Revolution  wood)。对于现今生命生物圈(植物物质),fM为大约1.1。

包含生物产生的有机化合物的生物制品(例如依照本公开内容产 生的脂肪酯组合物)以及特别是使用本文的脂肪酸生物合成途径产生 的脂肪酯组合物,已由可再生来源产生,并且像这样是新物质组合物。 基于双重碳-同位素指纹分析或14C测年,这些新的生物制品可以区别 于衍生自石油化学品碳的有机化合物。另外,生物来源的碳(例如葡 萄糖相对于甘油)的特异性来源可以通过双重碳同位素指纹分析进行 测定(参见例如美国专利号7,169,588)。使生物制品区别于基于石油 的有机化合物的能力在商业中跟踪这些材料中是有利的。例如,包含 基于生物和基于石油的碳同位素概况两者的有机化合物或化学制品可 以区别于仅由基于石油的材料制备的有机化合物和化学制品。因此, 生物制品在本文中可以基于其独特的碳同位素概况在商业中跟踪或追 踪。通过比较每种样品中的稳定碳同位素比率(13C/12C),生物制品 可以区别于基于石油的有机化合物。给定生物制品中的13C/12C比率是 在二氧化碳固定时大气层二氧化碳中的13C/12C比例的结果。它还反映 精确的代谢途径。还发生区域变异。石油、C3植物(阔叶树)、C4 植物(草类)和海洋碳酸酯均显示13C/12C和相应的δ13C值中的显著差 异。C4和C3植物两者均显示出一系列13C/12C同位素比率,但典型值 对于C4植物为每密耳(mil)约-7至约-13,并且对于C3植物为每密 耳约-19至约-27(参见例如Stuiver等人,Radiocarbon 19:355(1977))。 煤和石油一般落入后面一个范围内。

δ13C(‰)=[(13C/12C)样品-(13C/12C)标准]/(13C/12C)标准× 1000

与IAEA、USGS、NIST及其他所选国际同位素实验室合作已开发 一系列备选RM。与PDB的每密耳偏差的符号为δ13C。通过在质量44、 45和46的分子离子上的高精确度稳定比率质谱法(IRMS)对CO2进 行测量。本文描述的组合物包括由本文描述的方法中的任一种产生的 脂肪酯组合物和产物。具体地,脂肪酯组合物或产物可以具有约-28或 更大、约-27或更大、-20或更大、-18或更大、-15或更大、-13或更大、 -10或更大、或-8或更大的δ13C。例如,脂肪酯组合物或产物可以具有 约-30至约-15、约-27至约-19、约-25至约-21、约-15至约-5、约-13至 约-7、或约-13至约-10的δ13C。在其他情况下,脂肪酯组合物或产物 可以具有约-10、-11、-12或-12.3的δ13C。依照本文公开内容产生的脂 肪酯组合物和产物还可以通过比较每种化合物中的14C量区别于基于 石油的有机化合物。因为14C具有5730年的核半衰期,所以含有“更老 的”碳的基于石油的燃料可以区别于含有“更年轻的”碳的脂肪酯组合 物和生物制品(参见例如Currie,“Source Apportionment of  Atmospheric Particles”,Characterization of Environmental Particles, J.Buffle和H.P.van Leeuwen,编辑,IUPAC Environmental Analytical  Chemistry Series的第I卷的1(Lewis Publishers,Inc.)3-74、(1992))。

放射性碳测年中的基础假设是大气层中的14C浓度的恒定性导致 活生物体中的14C的恒定性。然而,由于自从1950年以后的大气层核 试验和自从1850年以后的化石燃料燃烧,14C已获得第二种地球化学 时间特征。它在大气CO2中的浓度和因此在生命生物圈中的浓度在二 十世纪六十年代中期核试验高峰期大约加倍。它从那以后已逐渐恢复 至约1.2x 10-12的稳态宇宙成因(大气层)基线同位素比率(14C/12C), 具有7-10年的近似松弛“半衰期”。(这后面一种半衰期不能按字面意 思理解;相反,必须使用详细的大气层核输入/衰变函数,以追踪自从 核时代开始以后大气层和生物圈14C的变化。)正是这后面一种生物圈 14C时间特征保持近期生物圈碳的每年测年的希望。14C可以通过加速 器质谱法(AMS)进行测量,其结果以“现代碳分数”(fM)单位给出。 本文描述的脂肪酯组合物和产物包括可以具有至少约1的fM 14C的生 物制品。例如,公开内容的生物制品可以具有至少约1.01的fM 14C, 约1至约1.5的fM 14C,约1.04至约1.18的fM 14C,或约1.111至约 1.124的fM 14C。

14C的另一种测量称为现代碳百分比(pMC)。对于使用14C日期 的考古学家或地质学家,AD 1950等于“0岁”。这还表示100pMC。大 气层中的“炸弹碳”在1963年在热核武器高峰期时达到正常水平的几乎 两倍。它在大气层内的分布自从它出现后已进行约计,显示对于自从 AD 1950以后有生命的植物和动物大于100pMC的值。它已随着时间 过去逐渐减少,今天的值是接近107.5pMC。这意指新鲜的生物量材 料例如玉米将给出接近107.5pMC的14C标记。基于石油的化合物将 具有零的pMC值。组合化石碳与当今碳将导致当今pMC含量的稀释。 通过假定107.5pMC表示当今生物量材料的14C含量,并且0pMC表 示基于石油的产品的14C含量,对于该材料测量的pMC值将反映两个 组分类型的比例。例如,100%衍生自当今大豆的材料给出接近107.5 pMC的放射性碳标记。如果该材料由基于石油的产品稀释50%,则它 将给出大约54pMC的放射性碳标记。基于生物的碳含量通过指定 “100%”等于107.5pMC并且“0%”对于0pMC而衍生。例如,测量99 pMC的样品将给出93%的等价基于生物的碳含量。该值被称为平均基 于生物的碳结果,且假设在分析的材料内的所有组分均源于当今生物 材料或基于石油的材料。包含如本文描述的一种或多种脂肪酯的生物 制品可以具有至少约50、60、70、75、80、85、90、95、96、97、98、 99或100的pMC。在其他情况下,本文描述的脂肪酯组合物可以具有 约50-约100;约60-约100;约70-约100;约80-约100;约85 -约100;约87-约98;或约90-约95的pMC。在另外其他情况下, 本文描述的脂肪酯组合物可以具有约90、91、92、93、94或94.2的 pMC。

脂肪酯组合物

脂肪酯的例子包括脂肪酸酯,例如衍生自短链醇的那些包括FAEE 和FAME,以及衍生自更长链脂肪醇的那些。产生的脂肪酯和/或脂肪 酯组合物可以个别或以合适组合用作生物燃料(例如生物柴油)、工 业化学制品或者生物燃料或工业化学制品的组分或原料。在一些方面, 公开内容涉及产生脂肪酯组合物的方法,所述脂肪酯组合物包含一种 或多种脂肪酸酯,包括例如FAEE、FAME和/或更长链醇的其他脂肪 酸酯衍生物。在相关方面,该方法包括适合于制备脂肪酯和脂肪酯组 合物的遗传改造的生产宿主,所述脂肪酯和脂肪酯组合物包括但不限 于FAME、FAEE、脂肪酸丙酯、脂肪酸异丙酯、脂肪酸丁酯、甘油单 酯、脂肪酸异丁酯、脂肪酸2-丁酯和脂肪酸叔丁酯等等。

相应地,在一个方面,公开内容特征在于制备脂肪酯组合物的方 法,相对于由野生型酯合酶例如‘377产生的脂肪酯组合物,所述脂肪 酯组合物可以包含减少百分比的β羟基酯和游离脂肪酸。变体‘377多 肽或具有改善的脂肪酸甲酯活性的酶具有改善的性质,包括但不限于 增加的β羟基酯、减少的β羟基酯、增加的脂肪酸酯链长和减少的脂 肪酸酯链长。该方法包括在宿主细胞中表达编码具有酯合酶活性的多 肽的基因。在另一个方面,公开内容特征在于制备脂肪酯组合物的方 法,所述脂肪酯组合物可以包含或不包含游离脂肪酸,其中所述方法 包括在宿主细胞中表达编码具有酯合酶活性的Ppro多肽的基因。在一 些实施方案中,编码酯合酶多肽或具有酯合酶活性的硫酯酶多肽的基 因选自分别分类为EC 2.3.1.75或EC 3.1.2的酶,以及能够催化酰基硫 酯至脂肪酯的转换的任何其他多肽,包括但不限于硫酯酶、酯合酶、 酰基-CoA:醇酰基转移酶、醇O型脂肪酸酰基转移酶、酰基转移酶、和 脂肪酰-CoA:脂肪醇酰基转移酶或其合适变体。

在某些实施方案中,如果存在,则宿主细胞的内源硫酯酶是未经 修饰的。在某些其他实施方案中,宿主细胞表达减弱水平的硫酯酶活 性或硫酯酶是功能缺失的。在一些实施方案中,宿主细胞具有无法检 测的硫酯酶活性。如本文使用的,术语“可检测的”意指能够具有确定 的出现或存在。例如,由反应物产生产物(例如产生某些类型的脂肪 酸酯)使用本领域已知或本文提供的方法是可检测的。在某些实施方 案中,宿主细胞表达减弱水平的脂肪酸降解酶,例如酰基-CoA合酶, 或脂肪酸降解酶是功能缺失的。在一些实施方案中,宿主细胞具有无 法检测的脂肪酸降解酶活性。在特定实施方案中,宿主细胞表达减弱 水平的硫酯酶、脂肪酸降解酶或两者。在其他实施方案中,硫酯酶、 脂肪酸降解酶或两者是功能缺失的。在某些实施方案中,在不存在硫 酯酶、脂肪酸降解酶或两者的情况下,宿主细胞可以将酰基-ACP或酰 基-CoA转换成脂肪酸和/或其衍生物例如酯。备选地,在不存在硫酯酶、 脂肪酸降解酶或两者的情况下,宿主细胞可以将游离脂肪酸转换为脂 肪酯。在某些实施方案中,该方法进一步包括从宿主细胞或宿主细胞 培养物中分离脂肪酯组合物、脂肪酯或游离脂肪酸。在公开内容的优 选实施方案中,脂肪酸衍生物组合物包含高百分比的脂肪酯。在某些 实施方案中,脂肪酯或脂肪酯组合物衍生自合适的醇底物例如短或长 链醇。

一般而言,脂肪酯或脂肪酯组合物从宿主细胞的细胞外环境中分 离。在一些实施方案中,脂肪酯或脂肪酯组合物从宿主细胞部分地或 完全地自发分泌。在备选实施方案中,脂肪酯或脂肪酯组合物转运到 细胞外环境内,任选借助于一种或多种转运蛋白。在另外其他实施方 案中,脂肪酯或脂肪酯组合物被动转运到细胞外环境内。

在一些实施方案中,公开内容包括通过在允许突变体或变体‘377 多肽表达或过表达的条件下培养遗传改造的宿主细胞,产生脂肪酸酯 或脂肪酸酯组合物的方法,所述组合物可以包含减少百分比的β羟基 酯和/或游离脂肪酸。在备选实施方案中,公开内容包括通过在允许突 变体或变体‘377多肽表达或过表达的条件下培养遗传改造的宿主细 胞,产生脂肪酸酯或脂肪酸酯组合物的方法,所述组合物可以包含增 加百分比的β羟基酯和/或游离脂肪酸。在一些实施方案中,该方法进 一步包括在允许脂肪酸酯或脂肪酸酯组合物产生的条件下,在包含碳 源(例如碳水化合物)的培养基中培养遗传改造的宿主细胞,所述脂 肪酸酯或脂肪酸酯组合物可以包含增加或减少百分比的β羟基酯和/或 游离脂肪酸。在其他实施方案中,公开内容包括通过在允许具有酯合 酶活性的Ppro多肽表达或过表达的条件下培养遗传改造的宿主细胞, 产生脂肪酸酯或脂肪酸酯组合物的方法,所述组合物可以包含游离脂 肪酸。在一些实施方案中,该方法进一步包括在允许脂肪酸酯或脂肪 酸酯组合物产生的条件下,在包含碳源例如碳水化合物的培养基中培 养遗传改造的宿主细胞,所述脂肪酸酯或脂肪酸酯组合物可以包含游 离脂肪酸。

在一些实施方案中,公开内容提供了包含SEQ ID NO:2的氨基酸 序列的酯合酶多肽,具有一种或多种氨基酸置换、添加、插入或缺失, 其中所述多肽具有酯合酶活性。突变体或变体‘377多肽具有比相应的 野生型‘377多肽更大的酯合酶活性。例如,突变体或变体‘377多肽能 够催化硫酯例如脂肪酰-CoA或脂肪酰-ACP至脂肪酸和/或脂肪酸衍生 物的转换,或具有改善的催化硫酯例如脂肪酰-CoA或脂肪酰-ACP至 脂肪酸和/或脂肪酸衍生物的转换的能力。在特定实施方案中,在不存 在硫酯酶活性、脂肪酸降解酶活性或两者的情况下,突变体或变体‘377 多肽能够催化硫酯底物至脂肪酸和/或其衍生物的转换,或具有改善的 催化硫酯底物至脂肪酸和/或其衍生物的转换的能力。例如,在不存在 硫酯酶或酰基-CoA合酶活性的情况下,突变体或变体‘377多肽可以在 体内将脂肪酰-ACP和/或脂肪酰-CoA转换成脂肪酯。

在其他实施方案中,公开内容提供了包含SEQ ID NO:51的氨基 酸序列的Ppro多肽,具有一种或多种氨基酸置换、添加、插入或缺失, 其中所述多肽具有酯合酶活性。在某些实施方案中,公开内容的Ppro 多肽具有比相应的野生型Ppro多肽更大的酯合酶活性。例如,具有酯 合酶活性的公开内容的Ppro多肽能够催化硫酯例如脂肪酰-CoA或脂 肪酰-ACP至脂肪酸和/或脂肪酸衍生物的转换,或具有改善的催化硫酯 例如脂肪酰-CoA或脂肪酰-ACP至脂肪酸和/或脂肪酸衍生物的转换的 能力。在特定实施方案中,在不存在硫酯酶活性、脂肪酸降解酶活性 或两者的情况下,具有酯合酶活性的Ppro多肽能够催化硫酯底物至脂 肪酸和/或其衍生物的转换,或具有改善的催化硫酯底物至脂肪酸和/或 其衍生物的转换的能力。例如,在不存在硫酯酶或酰基-CoA合酶活性 的情况下,具有酯合酶活性的Ppro多肽可以在体内将脂肪酰-ACP和/ 或脂肪酰-CoA转换成脂肪酯。

在一些实施方案中,突变体或变体‘377多肽或者突变体或变体 Ppro多肽包含下述保守氨基酸置换中的一种或多种:脂肪族氨基酸例 如丙氨酸、缬氨酸、亮氨酸和异亮氨酸替换为另一种脂肪族氨基酸; 丝氨酸替换为苏氨酸;苏氨酸替换为丝氨酸;酸性残基例如天冬氨酸 和谷氨酸替换为另一种酸性残基;具有酰胺基团的残基的替换;碱性 残基例如赖氨酸和精氨酸更换为另一种碱性残基;以及芳香族残基例 如苯丙氨酸和酪氨酸替换为另一种脂肪酸残基。在一些实施方案中, 突变体或变体‘377多肽或者具有酯合酶活性的突变体或变体Ppro多肽 具有约1、2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、 70、80、90、100个或更多个氨基酸置换、添加、插入或缺失。在一些 实施方案中,多肽变体具有酯合酶和/或酰基转移酶活性。例如,突变 体或变体‘377多肽或者突变体或变体Ppro多肽能够催化硫酯至脂肪酸 和/或脂肪酸衍生物的转换,使用醇作为底物。在非限制性例子中,突 变体或变体‘377多肽或者突变体或变体Ppro多肽能够催化脂肪酰 -CoA和/或脂肪酰-ACP至脂肪酸和/或脂肪酸酯的转换,使用合适的醇 底物例如甲醇、乙醇、丙醇、异丙醇、丁醇、戊醇、己醇、庚醇、辛 醇、癸醇、十二醇、十四醇或十六醇。

实施例

下述具体实施例预期举例说明公开内容,并且不应解释为限制权 利要求的范围。申请人已采用单基因系统用于在重组宿主细胞中产生 脂肪酸酯。这包括在合适的宿主细胞中表达突变体或变体‘377多肽, 其已改造为具有改善的酯合酶活性,以便产生以增加滴度和得率的脂 肪酯组合物。所获得的脂肪酯组合物包括FAME以及增加和减少量的 β羟基酯。相同策略用于制备具有增强的酯合酶活性的Ppro多肽,用 于产生以增加滴度和得率的脂肪酯。

方案:

所有方案均使用96孔板、主块(master block)、2mL(Greiner  Bio-One,Monroe,NC或Corning,Amsterdam,荷兰)用于生长培 养物,并且使用Costar板用于从培养肉汤中提取脂肪酸种类。下文方 案包括发酵条件,并且可以用于评估脂肪酸种类生产。备选方案还可 以用于评估脂肪酸种类生产。

方案1(FA4P,32℃):

来自在96孔板中生长的LB培养物:30μL LB培养物用于接种270 μL FA2P(表4),其随后在32℃振荡器中温育大约16小时。30μL 过夜种子随后用于接种300μL FA4P+2%MeOH+1mM IPTG(表4)。 培养物随后在32℃振荡器中温育24小时,这时它们遵循下文详述的标 准提取方案进行提取(方案5)。

方案2(BP3G2P,32℃):

将文库甘油原种解冻,并且将10μL转移至96浅孔板中的150μL  LB+100μg/mL壮观霉素,所述96浅孔板在32℃下温育20小时。20μL 该培养物用于接种280μL BS1G4P培养基(表4),其在以250rpm的 32℃振荡下温育20小时。20μL该培养物用于接种380μL BP3G2P培 养基(表4)。培养物在32℃振荡下温育24小时,这时或遵循下文详 述的标准方案对它们实施尼罗红测定法,或遵循下文详述的标准提取 方案对它们实施提取(方案5)。

方案3(FA2,32℃):

来自在96孔板中生长的LB培养物:30μL LB培养物用于接种270 μL FA2,其随后在32℃下在振荡器上温育大约16小时。30μL过夜种 子随后用于接种300μL FA2+2%MeOH+1mM IPTG。培养物随后在 32℃下在振荡器上温育24小时,这时它们遵循下文详述的标准提取方 案进行提取(方案5)。

方案4(FA2P,32℃):

来自在96孔板中生长的LB培养物:30μL LB培养物用于接种270 μL FA2P,其随后在32℃振荡器中温育大约16小时。30μL过夜种子 随后用于接种300μL FA2P+2%MeOH+1mM IPTG。培养物随后在 32℃振荡器中温育24小时,这时它们遵循下文详述的标准提取方案进 行提取(方案5)。

方案5(脂肪酸种类标准提取):

向待提取的每个孔中加入40μL 1M HCl,随后为具有500mg/L  C11-FAME的300μL乙酸丁酯作为内部标准。96孔板随后使用板密封 器(ALPS-300;Abgene,ThermoScientific,Rockford,IL)进行热 密封,并且使用MixMate(Eppendorf,Hamburg,德国)以2000rpm 振荡15分钟。在振荡后,板以4500rpm在室温下离心10分钟(Allegra  X-15R,转子SX4750A,Beckman Coulter,Brea,CA),以分离水 层和有机层。将50μL有机层转移至96孔板(96孔板,聚丙烯,Corning, Amsterdam,荷兰)。将板热密封,随后贮存于-20℃下,直至它通过 采用标准自动化方法通过GC-FID进行评估。

方案6(脂肪酸种类标准尼罗红测定法):

在24小时发酵后,通过将70μL发酵液加入在Greiner  MicrolonFluotrac 200板中在84.6%水和15.4%乙腈溶液中的130μL 1.54μg/mL尼罗红(对于1μg/mL尼罗红的最终测定浓度)而进行尼 罗红测定。相对荧光单位使用SpectraMax M2以540nm的激发和630 nm的发射进行测量。

方案7(构建饱和文库):

本领域技术人员已知的标准技术用于制备饱和文库。例如,载体 主链可以通过在载体中使用限制性内切核酸酶进行制备,同时可以使 用简并引物生成DNA插入片段中的多样性制备。例如,根据制造商的 方案,可以使用InFusion Cloning System(Clontech Laboratories,Inc., Mountain View,CA)执行载体主链和具有多样性的DNA插入片段的 克隆。

方案8(构建组合文库):

组合鉴定为有利的突变,以提供在脂肪酸种类或FAME生产中具 有进一步改善的Ppro或377变体。本领域技术人员已知的标准技术用 于制备组合文库,例如,载体主链可以通过在载体中使用限制性内切 核酸酶进行制备,同时可以使用引入所需突变的引物生成DNA插入片 段中的多样性制备。例如,根据制造商的方案,可以使用InFusion  Cloning System(Clontech Laboratories,Inc.,Mountain View,CA) 执行载体主链和具有多样性的DNA插入片段的克隆。例如,组合文库 可以使用转移PCR(tPCR)方案(Erijman等人,2011.J.Structural  Bio.175,171-177)生成。

方案9(文库筛选):

一旦文库多样性在饱和文库或组合文库中生成,它就使用上文描 述的方法(方案1-4)之一进行筛选。当筛选酯合酶变体时,鉴定三类 命中:(1)增加的脂肪酸酯种类滴度(“FAS”滴度);(2)增加的所 产生的FAME量;例如C14-FAME;和/或(3)减少的所产生的β羟 基酯量。通过使用本领域技术人员常规采用的标准技术的测序,鉴定 在每个命中内的‘377变体中的突变。通过使用本领域技术人员常规采 用的标准技术的测序,鉴定在每个命中内的‘377变体中的突变。表1 和2列出了在饱和文库中鉴定为有利的突变(“命中”),并且表5列 出了在组合文库中鉴定为有利的突变(“命中”)。当筛选Ppro变体时, 鉴定了两类命中:(1)增加的脂肪酸酯种类;(2)增加的所产生的 FAME量。通过测序且使用由相关领域技术人员常规采用的标准技术, 鉴定在每个命中内的Ppro变体中的突变。表8到11列出了在饱和文 库中鉴定为有利的突变(“命中”),并且表12和14列出了在组合文 库中鉴定为有利的突变(“命中”)。

实施例1

使用WS377作为模板制备的饱和文库

构建来自除烃海杆菌(“‘377”)的酯合酶的完全饱和文库,并且筛 选显示超过野生型WS377的改善的变体(方案7)。用于制备完全饱 和文库的质粒指定为pKEV027,其表达SEQ ID NO:1(即WS377的 野生型核酸序列)。完全饱和文库在大肠杆菌菌株(BD64)中进行筛 选,所述大肠杆菌菌株通过标准操作技术改造为阻断β氧化(经由FadE 的耗尽),且过表达许多脂肪酸生物合成途径酶(例如FabA、FabB、 FabF、FabG、FabI、FabH、FabV、FabZ、accABCD)。使用上文 描述的标准方案(方案1-2)之一筛选文库。改善最初分类为改善FAME 滴度或降低β羟基酯(在本文中称为“β-OH酯”或“β-OH FAME”或 “β-OH”或“β羟基”)的级分,而不影响FAME滴度。来自筛选饱和文 库的结果显示于下表1和2中。表1呈现当使用‘377作为模板(SEQ ID  NO:1)时,全部显示增加的脂肪酯滴度的突变的结果。表2呈现使用 ‘377作为模板,导致%β-OH FAME中的减少的突变的结果。值得注 意的是,一些突变显示改善的FAME滴度以及β-OH FAME中的减少 两者,如果最终所需产物主要是FAME,则这是有利的。一些突变体 显示改善的FAME滴度以及β-OH FAME中的增加。另外,一些突变 体导致短链酯的增加或减少。

如下表1中可见,来自‘377饱和文库的突变与所有突变体中改善 的脂肪酯滴度关联,而β-OH酯和更短链长的酯的产生从突变体到突变 体不同。例如,在第15位置处的氨基酸置换(丝氨酸至甘氨酸)使总 FAME滴度从基线1变成2.402。因此,与基线(即野生型)相比较, 滴度增加2.4倍。在该特定突变体中,β-OH酯增加约2.66倍。具有碳 链长14的酯超过具有碳链长16的酯的产生增加超过基线(即野生型) 1.48倍。另一方面,氨基酸位置393的置换(谷氨酰胺至甘氨酸)使 FAME滴度增加2.3倍,并且使β-OH酯减少至对照的70%,而C14/C16 酯生产保持大约相同。

表中的一些突变具有星号,例如*474Y,这意指该位置具有终止密 码子。

申请人发现在变体突变型核酸序列之一(即SEQ ID NO:28)中的 24bp重复。该24bp重复是核酸区域 ATGAAACGTCTCGGAACCCTGGAC(SEQ ID NO:27)的复制,并 且位于ATG起始密码子之前的基因起始处。因此,SEQ ID NO:28是 变体‘377核酸序列(该序列是组合SEQ ID NO:27和SEQ ID NO:1 的结果,而无另外的突变),其编码SEQ ID NO:29的氨基酸序列。 如表1中所示,SEQ ID NO:29给出令人惊讶的良好滴度。然而,检测 到两种另外的突变体,其包括SEQ ID NO:29作为模板序列,在其中 具有另外的突变,其中突变甚至进一步增加滴度(参见表1)。(突变 编号不包括24bp重复)。值得注意的是,24bp重复导致FAS滴度和% β-OH FAME中的增加,如表1中可见,其描述当在宿主菌株中表达 SEQ ID NO:29时获得的滴度。

如下表2中可见,来自‘377饱和文库的一些突变与%β-OH FAME 中的减少关联,同时仍增加总FAME滴度至表1中比较的更少程度(同 上)。然而,一些突变体显著减少%β-OH FAME,同时仍显著增加总 FAME滴度。

实施例2

使用作为WS377模板制备的组合文库

标准技术用于制备组合文库(方案8)。在组合文库中测试的突变 (表3A和3B)最初在‘377的完全饱和文库中鉴定(如实施例1中所 述)。用于制备组合文库的质粒是pKEV38,其通过去除pKEV027中 的accABCD_birA进行构建。不希望受理论束缚,accABCD_birA的 去除被认为降低生物合成途径中的脂肪酸的中间产物水平,从而使得 突变型酶对于底物的亲和力更容易检测到。将细胞在2NBT+尼罗红 琼脂上铺平板(表4)。使用在400nm-500nm的激发范围处的Dark  Reader DR88X Transilluminator和在580-620nm处许可的琥珀滤光器 观察菌落,精心挑选到LB+100μg/mL壮观霉素内,生长过夜,并且 使用上文描述的标准方案(方案1-2)之一筛选。如图4中所示,来自 该文库的变体之一显示超过对照(BD64/pKEV038,SEQ ID NO:2) 的FAS中的急剧增加。图4显示组合文库命中的平板发酵结果。几个 文库命中表现优于对照(即BD64/pKEV038),显示‘377变体可以支 持FAS的高生产。分离最高生产变体的质粒,命名为pSHU10(SEQ ID  NO:14的表达变体‘377),且用作模板用于后续组合文库。

通过使用标准方案(方案1-2;同上)之一,在菌株BD64(同上) 中筛选组合文库。来自筛选‘377组合文库的结果显示于表5中。

下表3A显示了在第一轮组合文库中引入的氨基酸置换。

下表3B显示了在第二轮组合文库中引入的氨基酸置换。

下表4显示了使用的培养基名称和制剂。

下表5描述了二次筛选,显示超过pSHU10(其含有突变T5S、 S15G、P111S、V171R、P188R、F317W、S353T、V409L、S442G)) 的突变和标准化的GC-FID结果。所述结果是相对于对照(即pSHU10, SEQ ID NO:14)。表中的每行表示制备的不同组合突变体。所有突变 体均测量为具有不同特性,因为它们或影响产生的总FAME、产生的 总FAS、产生的FAME百分比,或最终组合物中的酯种类(具有 C12/C14或C14/C16链长),或这些特性的组合。如表5中可见的, 一些突变体就其特性而言表现类似于其他突变体。

例如,如下表5中的第一行中所示,含有突变A190P、N302G、 T313S和Q348R的突变体产生更高百分比的FAME(和β-OH FAME 的减少),并且还增加C14/C16链长酯的生产,意指它在最终产物中 产生比C16酯更多的C14酯。这是期望的,因为更短链的酯可以用于 许多产品包括生物柴油。结果还显示申请人能够改变最终组合物中的 酯种类的最终链长。

下述突变组合涉及本文所示的结果;其表现是相对于对照 (pSHU10;SEQ ID NO:14)。KASH008(SEQ ID NO:16)使%FAME 增加1.4倍,同时使滴度增加1.06倍。KASH032(SEQ ID NO:18) 使%FAME增加1.29倍,同时影响滴度。KASH040(SEQ ID NO:20) 使%FAME增加1.16倍,同时滴度减少至对照的0.91倍。KASH078 (SEQ ID NO:26)使%FAME增加1.25倍,同时使滴度减少至对照 的0.76。KASH060(SEQ ID NO:22)和KASH061(SEQ ID NO:24) 是特别有利的,因为它们不仅影响%FAME,它们还产生显著更短酯 链的产物,如由C12/C14(对于KASH060为6.8倍,并且对于KASH061 为3.1倍)和C14/C16(对于KASH060为4.0倍,并且对于KASH061 为3.2倍)中的增加所示。

实施例3

具有有利特性的酯合酶突变株。

如实施例1和2中所述,鉴定了具有有利特性的许多变体或突变 体形式的‘377。在该实验中,将本文指定为9B12(SEQ ID NO:4)(其 含有相对于野生型377的三个不同突变(D7N、A179V、V381F))的 特定‘377突变体克隆到pKEV027内,替换编码野生型‘377多肽(SEQ  ID NO:2)的野生型‘377基因(SEQ ID NO:1),并且制备pKEV018。 当转化到菌株BD64(同上)内时,制备菌株KEV040。使用在基因(起 始密码子=0)的密码子348处的饱和诱变,使质粒pKEV018进一步突 变,以产生质粒pKEV022,其含有相对于野生型‘377的四个不同突变 (D7N、A179V、Q348R、V381F)。分开地,几个先前鉴定的突变与 pKEV018质粒组合,以产生质粒pKEV028(其含有相对于野生型‘377 的八个突变(D7N、R87R“沉默突变”、A179V、V187R、G212A、Q357V、 V381F、M443G)。将pKEV022和pKEV028转化到菌株BD64内, 这分别产生指定为KEV075(SEQ ID NO:10)和KEV085(SEQ ID NO: 12)的菌株。观察到这些突变株产生FAME滴度中的显著增加或 “β-OH”FAME百分比中的降低或两者(例如突变株9B12和KEV085 实现两者)。

使用上文描述的标准方案(方案1-2)之一筛选菌株KEV080 (BD64/pKEV027);KEV040;KEV075和KEV085。图5显示了与 含有野生型‘377酯合酶的菌株相比较,突变株KEV040,KEV075和 KEV085的相对FAME滴度和%β-OH FAME。在本文中,图5举例 说明了观察到这三种变体具有比对照(野生型)显著更高的FAME滴 度;%β-OH FAME从一种变体到另一种不同;并且菌株9B12 (KEV040)和KEV085产生比对照(野生型)更低的%β-OH FAME。

实施例4

通过改造为表达变体‘377酯合酶和变体Ppro的重组宿主细胞的酯 生产

如实施例1、2和3中证实的,改造来自除烃海杆菌(WS377)的 酯合酶,以产生更高水平的脂肪酸酯和更低百分比的β-OH酯。在进行 本公开内容中,改造野生型WS377(SEQ ID NO:1),产生新菌株例 如9B12,其直接由酰基-ACP产生更高水平的FAME。

Photobacterium Profundum(Ppro)的‘tesA改造为具有酯合酶活 性。质粒pBD207中的Ppro Vc7P6F9(SEQ ID NO:31)的一种变体 在BD64(本文指定为becos.128)中进行测试。类似地,pKEV18中的 ‘377的9B12变体(SEQ ID NO:4)在BD64(本文指定为KEV040) 中进行测试。becos.128(BD64/pBD207)和KEV040(BD64/pKEV018) 的培养物在具有2%醇的最小培养基中进行测试。在生产约24小时后, 将它们提取且通过GC/FID或GC/MS分析,用于鉴定脂肪酰基酯(遵 循上文列出的方案)。

图6显示了当进料甲醇、乙醇、1-丙醇、异丙醇、1-丁醇或甘油时, 来自KEV040(来自除烃海杆菌的酯合酶)的脂肪酰基酯(图6中显示 为蜡)和来自becos.128(来自P.profundum的‘tesA)(图6中显示为 Ppro)脂肪酸种类生产。作为阴性对照,加入水(缺乏外源醇意指任 何酯生产均依赖通过大肠杆菌的醇的内源生产)。虽然通过KEV040 不产生游离脂肪酸,但becos.128产生脂肪酸酯和脂肪酸的混合物。图 8显示了由becos.128产生的脂肪酸酯和脂肪酸的量。应当指出 Holtzapple和Schmidt-Dannert(参见Journal of Bacteriology(2007) 189(10):3804-3812)中呈现的体外结果显示来自除烃海杆菌的酯合 酶(‘377)具有对于更长链的醇的优先,主要产生蜡。Holtzapple的数 据提示‘377不能使用更短链的醇。相比之下,申请人的工作在体内进 行,并且确定变体‘377酶可以利用更短链的醇(C1、C2、C3和C4), 导致可以用于多种有价值产品(例如生物柴油、表面活性剂等)的更 短链的酯。申请人使用酰基-ACP作为底物,所述酰基-ACP被认为造 成无效循环牵涉的降低(即使得细胞更能量有效)。另外,申请人显 示并非所有醇均需要具有在第1位置处的OH基团,例如,关于丙醇 的OH基团可以在第1或2位置处。图6显示了使用遗传修饰为表达 单一变体‘377酯合酶的重组宿主细胞,产生具有多种链长的脂肪酰基 酯。该结果对于P.profundum(Ppro)的tesA的变体和‘377酯合酶的 变体两者的改造形式观察到。值得注意的是经改造的突变体不仅可以 将伯醇,还可以将仲醇转换成多种不同产物,包括FAME、FAEE、脂 肪酰甘油单酯及其他。重组细菌、酵母、藻类或其他宿主细胞可以用 于脂肪酯的生产。

实施例5

表达组合突变体的酯合酶突变株

本领域技术人员已知的标准技术用于制备组合文库(方案8)。在 组合文库中测试的突变(表3A和3B)最初在‘377的完全饱和文库中 鉴定(如实施例1中所述)。

组合文库在菌株GLPH077中进行筛选,所述菌株GLPH077类似 于BD64,但表达轻微不同水平的生物合成途径酶(同上),且使用标 准方案(方案1-2)(同上)之一。来自筛选pKASH008(SEQ ID NO: 16)组合文库的结果显示于表6中。如表6中可见,与野生型377相 比较,所得的‘377酯合酶变体具有24个突变。两种菌株KASH280(SEQ  ID NO:33)和KASH281(SEQ ID NO:35)用于测试变体‘377。然而, KASH280表达‘377变体,其通过一个置换突变不同于KASH280中表 达的那种。KASH280表达其中在第348位置处的谷氨酰胺更换为精氨 酸(Q348R)的‘377变体,允许菌株产生更高滴度的FAME和更多数 目的短链酯。相反,KASH281表达其中在第349位置处的赖氨酸更换 为组氨酸(K349H)的‘377变体,导致与KASH008相比较,菌株产生 更低滴度的FAME。另外,与KASH008相比较,KASH281产生更低 滴度的FAME和更少数目的短链酯。总之,比较针对KASH008,所 述KASH008优于pSHU10,所述pSHU10优于野生型(参见上文实施 例)。

实施例6

来自天然多样性的具有有利特性的酯合酶突变株

如实施例1和2中所述,鉴定了具有有利特性的许多变体或突变 体形式的‘377。使用标准比对操作,比对来自不同海杆菌属生物体(例 如Marinobacter adhaerens HP15(YP_005886638.1,SEQ ID NO:45)、 栖藻海杆菌(Marinobacter algicola)DG893(ZP_01893763.1,SEQ ID  NO:47)、海杆菌属物种ELB17(ZP_01736818.1,SEQ ID NO:49)) 的酯合酶多肽与来自除烃海杆菌DSM 8798(SEQ ID NO:2)的那种, 用于鉴定已存在于自然界中的突变,因为这将揭示特异性突变以及氨 基酸位置,其天然具有多样性并且因此可以用于稳定化变体蛋白质。 进行比对且分析鉴定在酯合酶同源多肽内的天然多样性。下表7举例 说明了此类突变群的概括。当这些突变与来自除烃海杆菌的经改造的 酯合酶组合时,如果它们使用上文描述的标准方案(方案1-2)之一进 行筛选时,则可以观察到有利变体。此类变体的例子描述为SEQ ID NO: 37、39、41和43。

下表7显示了通过比对除烃海杆菌、M.adhaerens、栖藻海杆菌和 海杆菌属物种ELB17观察到的天然多样性列表。

表7

实施例7

P.profundum(Ppro)的‘tesA的改造

改造P.profundum(Ppro)的‘tesA,以充当酯合酶。当在96孔板 中筛选时,野生型Ppro产生总酰基产物(FAME+游离脂肪酸)的约 15-18%FAME。当变体在96孔板上进行测试时,鉴定了使FAME含 量增至42-44%的突变。当相同突变体在摇瓶中进行测试时,与由野生 型酶产生的30%FAME相比较,它们产生62-65%FAME。基于标准 技术例如易错PCR或Ppro的饱和文库(方案7),鉴定了突变。组合 鉴定的突变,生成同样进行测试的组合文库。随后使用上文描述的方 法(方案1-4)之一筛选文库。

基于组合文库的筛选,突变选择为(1)固定用于下一轮组合文库 筛选;(2)在下一轮组合文库筛选中再测试;或(3)在那时不进一 步测试。将鉴定为有利的突变固定用于未来文库。过程可以通过使用 96孔板筛选,在96孔板中验证和在摇瓶中的后续验证来进行。

摇瓶中的最佳表现者随后可以在发酵罐中进行测试,以验证存在 与按比例扩大一致的经改造的Ppro的改善。来自组合文库的少数最高 命中可以在摇瓶中进行测试,以证实Ppro变体在比96孔板那种更大 的规模时具有改善的性能。摇瓶验证可以如下进行。将所需突变体在 LB+壮观霉素琼脂上划线培养,以获得单个菌落,并且在37℃下温育 过夜。将来自每种突变体的三个单一菌落挑选到4mL LB+壮观霉素 内,并且在37℃振荡器下温育大约6小时。1.5mL LB培养物用于接种 在有挡板的125mL烧瓶中的15mL FA2(2g/L NH4Cl)+0.05%Triton  X-100+壮观霉素,并且在32℃下温育过夜。3mL过夜培养物用于接 种在有挡板的125mL烧瓶中的15mL FA2(2g/L NH4Cl)+0.05% Triton X-100+1mM IPTG,2%甲醇+壮观霉素,并且在32℃下温育 大约24小时。在提取时,将300μL培养物从烧瓶取样到96孔板内, 并且使用标准提取方案(方案5)进行提取。

标准提取方案如上所述(方案5)进行。来自筛选饱和文库的结果 显示于表8到11中。表8呈现关于使用野生型即SEQ ID NO:51作为 模板发现的单一有利突变的结果。表9呈现关于使用野生型作为模板 发现的组合突变体的结果。表10呈现关于使用SEQ ID NO:53(被称 为PROF 1)作为模板(SEQ ID NO:53已含有在其序列中的两个有利 突变,包括S46V和Y116H突变)发现的单一有利突变的结果。对于 PROF1,将S46V和Y116H突变“固定”到模板内,从而使得饱和/组合 的未来循环将从该变体而不是野生型序列开始。表11呈现关于使用 PROF1作为模板发现为有利的双重突变的结果。表12呈现关于使用野 生型作为模板发现的组合突变体的结果。表13呈现关于在BD64中使 用P1B9v2.0(SEQ ID NO:58)作为模板发现的组合突变体的结果。

下表8显示了使用Ppro野生型(SEQ ID NO:51)作为模板发现 的单一有利突变的列表。

表8

突变 Norm FAME Norm FFA Norm滴度 Norm%FAME T3L 0.911 0.882 0.889 1.023 P29A 1.015 1.088 1.071 0.947 P29F 0.984 0.984 0.984 1.000 P29G 1.008 1.009 1.009 0.999 P29S 1.018 1.030 1.027 0.992 I38Y 0.765 0.592 0.632 1.211 I45A 0.420 0.304 0.320 1.317 I45G 0.311 0.109 0.137 2.242 I45K 1.205 1.145 1.154 1.046 I45R 1.313 1.257 1.265 1.038 I45S 0.398 0.242 0.264 1.509 I45V 1.162 1.096 1.105 1.050 I45W 0.281 0.202 0.213 1.322 S46K 0.387 0.224 0.247 1.556 S46V 1.166 0.899 0.937 1.250 S46W 0.346 0.211 0.230 1.517 D48A 1.297 1.417 1.396 0.929 D48E 1.267 1.278 1.276 0.993 D48F 0.892 0.773 0.794 1.123 D48G 0.921 0.835 0.851 1.083

突变 Norm FAME Norm FFA Norm滴度 Norm%FAME D48H 1.081 0.955 0.977 1.106 D48L 1.774 1.816 1.808 0.980 D48M 1.880 2.159 2.109 0.891 D48V 0.626 0.535 0.551 1.136 D48W 1.263 1.252 1.254 1.010 T49D 0.556 0.378 0.408 1.364 T49G 0.273 0.263 0.265 1.024 T49L 0.595 0.425 0.453 1.311 T49M 0.461 0.334 0.356 1.292 T49R 0.402 0.214 0.244 1.651 T49S 0.447 0.360 0.374 1.194 T49V 0.503 0.336 0.362 1.389 T49W 0.678 0.542 0.565 1.203 G51A 1.079 1.068 1.070 1.009 G51E 1.025 0.938 0.952 1.076 G51F 0.921 0.830 0.844 1.091 G51H 1.083 1.087 1.086 0.997 G51L 0.956 0.871 0.887 1.076 G51M 1.013 0.952 0.962 1.053 G51P 0.460 0.308 0.332 1.385 G51Q 1.047 1.082 1.075 0.972 G51R 1.377 1.452 1.440 0.955 G51S 1.088 1.046 1.053 1.033 G51T 1.062 1.115 1.107 0.959 G51V 1.003 1.036 1.031 0.973 G51Y 0.852 0.833 0.837 1.016 N52A 0.970 0.856 0.883 1.099 N52C 0.825 0.676 0.710 1.161 N52F 0.797 0.668 0.697 1.141 N52G 1.026 1.093 1.078 0.951 N52H 0.959 1.035 1.017 0.943 N52L 0.974 0.848 0.877 1.110 N52M 1.040 1.045 1.044 0.996 N52R 1.405 1.641 1.587 0.885 N52S 0.903 0.810 0.832 1.084 N52T 0.874 0.785 0.806 1.084 N52V 0.812 0.699 0.725 1.118

突变 Norm FAME Norm FFA Norm滴度 Norm%FAME N76I 0.518 0.285 0.326 1.584 N76L 0.366 0.160 0.200 1.834 N76V 0.642 0.336 0.395 1.624 S92A 1.001 1.054 1.042 0.960 S92H 1.026 1.106 1.087 0.943 S92S 1.002 0.972 0.979 1.022 S92Y 1.022 1.199 1.158 0.881 I95V 0.910 0.876 0.884 1.028 Y116A 0.923 0.889 0.895 1.032 Y116F 1.077 1.035 1.042 1.034 Y116I 1.392 1.303 1.318 1.055 Y116L 1.203 1.246 1.239 0.971 Y116N 1.430 1.424 1.425 1.003 Y116P 0.628 0.460 0.488 1.284 Y116R 1.442 1.701 1.657 0.872 Y116S 0.876 0.757 0.777 1.127 Y116T 1.079 0.939 0.963 1.121 Y120R 0.490 0.399 0.420 1.164 N156A 1.048 1.090 1.082 0.969 N156C 0.903 0.858 0.866 1.042 N156G 0.984 1.070 1.055 0.933 N156L 0.841 0.821 0.825 1.018 N156R 1.477 1.942 1.856 0.796 N156W 0.824 0.678 0.705 1.168 L159G 0.399 0.245 0.273 1.455 L159M 1.254 1.651 1.577 0.795 L159N 0.513 0.323 0.358 1.433 L159R 0.554 0.540 0.542 1.021 L159S 0.390 0.237 0.265 1.466 L159Y 0.476 0.318 0.347 1.368

下表9显示了使用Ppro野生型(SEQ ID NO:51)作为模板发现 的组合突变体的列表。

表9

突变 突变 Norm FAME Norm FFA Norm滴度 Norm%FAME E37D I45R 1.189 1.255 1.246 0.953 P29A Stop_182I 1.014 1.058 1.047 0.967

突变 突变 Norm FAME Norm FFA Norm滴度 Norm%FAME I38L V41I 0.843 0.760 0.779 1.082 Y116I Q146H 1.554 1.906 1.846 0.841 Y116P E175D 0.341 0.231 0.252 1.350 Y116Q G117R 0.438 0.350 0.365 1.202 G8V T49S 0.405 0.277 0.299 1.358 A30T G51C 0.566 0.483 0.499 1.134 T49Q Y116H 0.383 0.247 0.269 1.417 T49R Y116H 0.441 0.303 0.324 1.362 N156K L159K 1.456 1.955 1.862 0.782 G158D L159V 0.334 0.224 0.244 1.362

下表10显示了使用PROF1(SEQ ID NO:53)作为模板发现的单 一有利突变的列表。

表10

突变 Norm FAME Norm FFA Norm滴度 Norm%FAME V41D 0.394 0.310 0.330 1.195 V41E 0.891 0.855 0.863 1.033 V41K 0.999 1.016 1.012 0.989 V41Q 1.015 1.048 1.040 0.976 V41R 0.996 1.019 1.014 0.983 V41S 0.577 0.495 0.515 1.122 V41T 0.732 0.669 0.684 1.070 V41W 0.856 0.778 0.797 1.075 F82A 1.036 0.940 0.963 1.077 F82E 0.861 0.747 0.775 1.111 F82G 0.770 0.577 0.625 1.233 F82K 1.167 1.220 1.207 0.967 F82Q 0.996 0.927 0.944 1.054 F82R 1.426 1.552 1.521 0.938 F82V 0.975 0.883 0.906 1.076 F82W 1.089 1.141 1.128 0.966 Q84A 0.989 0.936 0.949 1.043 Q84E 0.990 1.050 1.036 0.957 Q84G 0.822 0.774 0.785 1.047

下表11显示了使用PROF1(SEQ ID NO:53)作为模板发现为有 利的双重突变的列表。

表11

突变 突变 Norm FAME Norm FFA Norm滴度 Norm%FAME V41L D48G 0.684 0.601 0.621 1.103 F82G T86P 0.589 0.399 0.446 1.323

本文讨论的是将乙醇进料到Ppro文库之一的结果。组合文库之一 进料甲醇或乙醇,以便测试使用甲醇具有改善的酯合酶活性的基因在 乙醇的存在下是否也显示改善的酯合酶活性。如图7A和7B中可见的, 用甲醇或乙醇进料观察到改善的酯合酶活性,尽管使用甲醇获得更高 百分比的酯。表12显示使用Ppro野生型(SEQ ID NO:51)作为模板 发现的组合突变体的列表。

表12

表13显示使用P1B9v2.0(SEQ ID NO:58)作为BD64中的模板发现的组合突变体的列 表。

表13

如对于本领域技术人员显而易见的,可以制备上文方面和实施方 案的多种修饰和变化,而不背离本公开内容的精神和范围。此类修饰 和变化在本公开内容的范围内。

具有改善的酯合酶特性的酶变体.pdf_第1页
第1页 / 共187页
具有改善的酯合酶特性的酶变体.pdf_第2页
第2页 / 共187页
具有改善的酯合酶特性的酶变体.pdf_第3页
第3页 / 共187页
点击查看更多>>
资源描述

《具有改善的酯合酶特性的酶变体.pdf》由会员分享,可在线阅读,更多相关《具有改善的酯合酶特性的酶变体.pdf(187页珍藏版)》请在专利查询网上搜索。

公开内容涉及用于生产脂肪酸酯的、具有改善的酯合酶特性的酶变体。进一步考虑的是表达此类变体的重组宿主细胞、包含重组宿主细胞的细胞培养物和由此类重组宿主细胞产生的脂肪酸酯组合物。。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 >


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1