《脂肪酶变体以及编码它们的多核苷酸.pdf》由会员分享,可在线阅读,更多相关《脂肪酶变体以及编码它们的多核苷酸.pdf(41页珍藏版)》请在专利查询网上搜索。
1、10申请公布号CN104080908A43申请公布日20141001CN104080908A21申请号201380007787822申请日2013012512153817720120203EPC12N9/20200601C07K14/37200601C11D3/38620060171申请人诺维信公司地址丹麦鲍斯韦72发明人L厄兰森CH汉森J文德A斯文德森CP索恩克森74专利代理机构北京市柳沈律师事务所11105代理人张文辉54发明名称脂肪酶变体以及编码它们的多核苷酸57摘要本发明涉及脂肪酶变体以及获得它们的方法。本发明还涉及编码这些变体的多核苷酸;包括这些多核苷酸的核酸构建体、载体以及宿主细胞。
2、;以及使用这些变体的方法。30优先权数据85PCT国际申请进入国家阶段日2014080186PCT国际申请的申请数据PCT/EP2013/0514172013012587PCT国际申请的公布数据WO2013/113622EN2013080851INTCL权利要求书3页说明书34页序列表3页19中华人民共和国国家知识产权局12发明专利申请权利要求书3页说明书34页序列表3页10申请公布号CN104080908ACN104080908A1/3页21一种用于获得脂肪酶变体的方法,该方法包括在对应于SEQIDNO2的成熟多肽的位置T37、N39或G91的一个或多个位置处向一种亲本脂肪酶中引入一个取代,。
3、其中该变体具有脂肪酶活性并且与该亲本脂肪酶相比在一种选自下组的有机催化剂的存在下具有改进的性能,该组由具有以下化学式的有机催化剂组成A化学式1;B化学式2;或C其混合物,其中每个R1独立地是一个包含从3个至24个碳的支链烷基基团或一个包含从1个至24个碳的直链烷基基团;并且回收该变体。2如权利要求1所述的方法,其中R1独立地选自下组,该组由以下各项组成2丙基庚基、2丁基辛基、2戊基壬基、2己基癸基、正十二烷基、正十四烷基、正十六烷基、正十八烷基、异壬基、异癸基、异十三烷基以及异十五烷基。3如以上任一项权利要求所述的方法,其中该亲本脂肪酶包括一个与SEQIDNO2的成熟多肽具有至少60一致性的氨。
4、基酸序列;由SEQIDNO2的成熟多肽的氨基酸序列或其具有脂肪酶活性的片段组成。4如以上任一项权利要求所述的方法,其中该变体是A一种包括与SEQIDNO2的成熟多肽具有至少60一致性的氨基酸序列的多肽;B一种由以下多核苷酸编码的多肽,该多核苷酸在至少低严谨度条件下与ISEQIDNO1的成熟多肽编码序列;或III的全长互补链杂交,或C一种由以下多核苷酸编码的多肽,该多核苷酸包括一个与SEQIDNO1的成熟多肽编码序列具有至少60一致性的核苷酸序列。5如以上任一项权利要求所述的方法,其中该取代选自T37A、D、E、F、G、H、I、L、N、P、Q、R、S、V、W、Y,N39A、C、D、E、F、G、I。
5、、K、L、M、P、Q、R、T、V、W、Y,以及G91D、H、I、P、Q。6如以上任一项权利要求所述的方法,其中该变体在对应于SEQIDNO2的成熟多肽的位置D96、T143、A150、E210、G225、T231、N233以及P250的一个或多个位置处进一步包括一个取代。7如前一权利要求所述的方法,其中该取代选自D96G、T143A、A150G、E210Q、G225R、T231R、N233R以及P250R。8如权利要求1所述的方法,其中该变体是AG91AD96GT231RN233R;BG91QT143AE210QT231RN233RP250R;CG91QA150GE210QT231RN233R。
6、P250R;DT37RN39RG91AD96GT231RN233R;EG91AD96GG225RT231RN233R;FG91QE210QT231RN233RP250R;GG91NE210QT231RN233RP250R;权利要求书CN104080908A2/3页3HG91IE210QT231RN233RP250R;IG91LE210QT231RN233R;或JG91AD96GA150GT231RN233R。9一种脂肪酶变体,该脂肪酶变体在对应于SEQIDNO2的成熟多肽的位置T37A、D、E、F、G、H、I、L、N、P、Q、R、S、V、W、Y,N39A、C、D、E、F、G、I、K、L、M、P。
7、、Q、R、T、V、W、Y,以及G91D、H、I、P、Q的一个或多个位置处包括一个取代,其中该变体具有脂肪酶活性。10如权利要求9所述的变体,该变体是一种选自下组的亲本脂肪酶的变体,该组由以下各项组成A一种与SEQIDNO2的成熟多肽具有至少60序列一致性的多肽;B一种由以下多核苷酸编码的多肽,该多核苷酸在低严谨度条件下与ISEQIDNO1的成熟多肽编码序列,或III的全长互补体杂交;C一种由以下多核苷酸编码的多肽,该多核苷酸与SEQIDNO1的成熟多肽编码序列具有至少60一致性;以及DSEQIDNO2的成熟多肽的一个片段,该片段具有脂肪酶活性。11如权利要求10所述的变体,该变体与该亲本脂肪酶。
8、的氨基酸序列具有至少60、至少65、至少70、至少75、至少80、至少85、至少90、至少95、至少96、至少97、至少98、或至少99、但小于100的序列一致性。12如权利要求911中任一项所述的变体,其中取代的数目是120个,例如110个和15个,如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个取代。13如权利要求912中任一项所述的变体,该变体在对应于位置D96、T143、A150、E210、G225、T231、N233以及P250的一个或多个位置处进一步包括一个取代。14如前一权利要求所述的变。
9、体,其中该取代选自D96G、T143A、A150G、E210Q、G225R、T231R、N233R以及P250R。15如以上权利要求中任一项所述的变体,其中所述变体是AG91QT143AE210QT231RN233RP250R;BG91QA150GE210QT231RN233RP250R;CT37RN39RG91AD96GT231RN233R;DG91QE210QT231RN233RP250R;或EG91IE210QT231RN233RP250R。16一种变体,其中所述变体是AG91AD96GT231RN233R;BG91AD96GG225RT231RN233R;CG91NE210QT231R。
10、N233RP250R;DG91LE210QT231RN233R;或EG91AD96GA150GT231RN233R。17如权利要求916中任一项所述的变体,与该亲本脂肪酶相比,该变体在一种选自下组的有机催化剂的存在下具有改进的性能,该组由具有以下化学式的有机催化剂组成权利要求书CN104080908A3/3页4A化学式1;B化学式2;或C其混合物,其中每个R1独立地是一个包含从3个至24个碳的支链烷基基团或一个包含从1个至24个碳的直链烷基基团;并且回收该变体。18如权利要求17所述的变体,其中R1独立地选自下组,该组由以下各项组成2丙基庚基、2丁基辛基、2戊基壬基、2己基癸基、正十二烷基、正。
11、十四烷基、正十六烷基、正十八烷基、异壬基、异癸基、异十三烷基、以及异十五烷基。19一种编码如权利要求918中任一项所述的变体的分离的多核苷酸。20一种包括如权利要求19所述的多核苷酸的核酸构建体。21一种包括如权利要求19所述的多核苷酸的表达载体。22一种包括如权利要求19所述的多核苷酸的宿主细胞。23一种产生如权利要求918中任一项的变体的方法,该方法包括A在适合于表达该变体的条件下培养如权利要求22所述的宿主细胞;并且B回收该变体。24用如权利要求19所述的多核苷酸转化的一种转基因植物、植物部分或植物细胞。25一种产生如权利要求918中任一项所述的变体的方法,该方法包括A在有益于产生该变体。
12、的条件下,培养包括一种编码该变体的多核苷酸的一种转基因植物或植物细胞;并且B回收该变体。权利要求书CN104080908A1/34页5脂肪酶变体以及编码它们的多核苷酸0001对序列表的引用0002本申请含有一个计算机可读形式的序列表,将该序列表通过引用结合在此。0003发明背景发明领域0004本发明涉及脂肪酶变体、编码这些变体的多核苷酸、产生这些变体的方法以及使用这些变体的方法。本发明提供了与其亲本相比具有改进特性的脂肪酶变体。具体而言,这些变体在有机催化剂如3,4二氢异喹啉的两性离子硫酸盐衍生物的存在下更稳定。0005相关技术说明0006在用于产生有效的清洁组合物的需求中,脂肪酶在其他组分之。
13、中被应用于配制此类组合物。然而,脂肪酶的活性可能受包含的其他组分的存在的影响。具体而言,已经显示引入一些漂白催化剂灭活某些酶。这一相容性问题构成一个可能并不总是通过单独的配制品即可令人满意的解决的挑战。0007WO07/001262涉及包括具有增强的酶相容性的有机催化剂以及用于制造和使用此类组合物的方法,其中所述催化剂是3,4二氢异喹啉的两性离子硫酸盐衍生物。显示这些催化剂具有增强的淀粉酶相容性,但是不具有脂肪酶相容性。0008因此,对于与有机催化剂如3,4二氢异喹啉的两性离子硫酸盐衍生物具有改进的相容性的脂肪酶以及用于制造它们的方法存在需要。0009发明概述0010本发明涉及一种用于获得脂肪。
14、酶变体的方法,该方法包括在对应于SEQIDNO2的成熟多肽的位置T37、N39或G91的一个或多个位置处向亲本脂肪酶中引入一个取代,其中该变体具有脂肪酶活性并且与该亲本脂肪酶相比在一种选自下组的有机催化剂的存在下具有改进的性能,该组由具有以下化学式的有机催化剂组成0011A化学式1;0012B化学式2;或0013C其混合物,0014其混合物,其中每个R1独立地是包含从3个至24个碳的支链烷基基团或包含从1个至24个碳的直链烷基基团;并且回收该变体。0015本发明还涉及一种脂肪酶变体,该脂肪酶变体在对应于SEQIDNO2的成熟多肽的位置T37A、D、E、F、G、H、I、L、N、P、Q、R、S、V。
15、、W、Y,N39A、C、D、E、F、G、I、K、L、M、P、Q、R、T、V、W、Y,以及G91D、H、I、P、Q的一个或多个位置处包括一个取代,其中该变体具有脂肪酶活性。0016本发明还涉及编码这些变体的分离的多核苷酸;包含这些多核苷酸的核酸构建说明书CN104080908A2/34页6体、载体和宿主细胞;以及产生这些变体的方法。0017定义0018脂肪酶术语“脂肪酶”或“脂解酶”或“脂质酯酶”是如酶命名法所定义的EC31,1类中的一种酶。它可以具有脂肪酶活性三酰基甘油脂肪酶,EC3113、角质酶活性EC31174、固醇酯酶活性EC31113和/或蜡酯水解酶活性EC31150。出于本发明的目的。
16、,根据实例中所述的程序确定脂肪酶活性。在一个方面,本发明的变体具有SEQIDNO2的成熟多肽的脂肪酶活性的至少20、例如至少25、至少30、至少35、至少40、至少45、至少50、至少55、至少60、至少65、至少70、至少75、至少80、至少85、至少90、至少95或至少100。0019等位基因变体术语“等位基因变体”意指占用同一染色体位点的一种基因的两个或更多个替代形式中的任一者。等位基因变异由突变天然产生,并且可以导致群体内的多态性。基因突变可以是静默的在所编码的多肽中没有改变或可编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。0020CDNA术语“C。
17、DNA”意指一种DNA分子,该分子可以通过由获自一种真核或原核细胞的一种成熟剪接的MRNA分子反转录而制备。CDNA缺乏内含子序列,这些序列可能存在于相对应的基因组DNA中。早先的初始RNA转录本是MRNA的前体,其在呈现为成熟的剪接的MRNA之前要经一系列的步骤进行加工,包括剪接。0021编码序列术语“编码序列”意指一种多核苷酸,该多核苷酸直接规定了一种变体的氨基酸序列。编码序列的边界一般由一个开放阅读框架决定,该开放阅读框架从一个起始密码子如ATG、GTG或TTG开始并且以一个终止密码子如TAA、TAG或TGA结束。编码序列可以是一种基因组DNA、CDNA、合成DNA或其组合。0022控制。
18、序列术语“控制序列”意指为编码本发明的一种变体的一种多核苷酸的表达所需的核酸序列。每个控制序列对于编码该变体的多核苷酸来说可以是原生的即,来自相同基因或者外源的即,来自不同基因,或者相对于彼此是原生的或外源的。这类控制序列包括但不限于,前导子、聚腺苷酸化序列、前肽序列、启动子、信号肽序列及转录终止子。至少,控制序列包括启动子,以及转录和翻译终止信号。出于引入有利于将这些控制序列与编码一种变体的多核苷酸的编码区连接的特异性限制酶切位点的目的,这些控制序列可以提供有多个接头。0023表达术语“表达”包括涉及一种变体的产生的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰以及分泌。0024表。
19、达载体术语“表达载体”意指一种直链或环状DNA分子,该分子包括编码一种变体的一种多核苷酸并且可操作地连接至提供用于其表达的控制序列。0025片段术语“片段”意指在一种成熟多肽的氨基和/或羧基末端不存在一个或多个例如若干个氨基酸的一种多肽;其中该片段具有脂肪酶活性。在一个方面,一个片段含有成熟多肽的氨基酸数目的至少50、至少55、至少60、至少65、至少70、至少75、至少80、至少85、至少90、以及至少95。0026高严谨度条件术语“高严谨度条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹SOUTHERNBLOTTING程序,在42下在5XSSPE、03SDS、200微克。
20、/ML剪切并变性的鲑鱼精子DNA和50甲酰胺中预杂交和杂交12至24小时。载体材料说明书CN104080908A3/34页7最终使用2XSSC、02SDS,在65下洗涤三次,每次15分钟。0027宿主细胞术语“宿主细胞”意指易于用包括本发明的一种多核苷酸的一种核酸构建体或表达载体进行转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖了一种亲本细胞的任何子代,该子代由于在复制期间发生的突变而与亲本细胞不相同。0028改进的特性术语“改进的特性”意指与一种变体相关的相对于亲本有所改进的特征。此类改进的特性包括在有机催化剂的存在下的改进的性能。在一些实施例中,本发明涉及一种选自下组的有机催化剂,。
21、该组由具有以下化学式的有机催化剂组成0029A化学式1;0030B化学式2;或0031C其混合物,0032其混合物,其中每个R1独立地是包含从3个至24个碳的支链烷基基团或包含从1个至24个碳的直链烷基基团,具体而言其中R是2丁基辛基,并且优选地,改进的稳定性是在化学式2其中R是2丁基辛基的存在下。0033分离的术语“分离的”意指在自然界中不存在的一种形式或环境中的一种物质。分离的物质的非限制性实例包括1任何非天然存在的物质,2任何物质,包括但不限于从与其性质上相关的一种或多种或所有天然存在的组分至少部分除去的任何酶、变体、核酸、蛋白质、肽或辅因子;3相对于自然中发现的物质,由人工修饰的任何物。
22、质;或4通过相对于与其天然相关的其他组分,增加物质的量而修饰的任何物质例如编码该物质的基因的多个拷贝;使用比与编码该物质的基因天然相关的启动子更强的启动子。分离的物质可以存在于发酵液样品中。0034低严谨度条件术语“低严谨度条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42下在5XSSPE、03SDS、200微克/ML剪切并变性的鲑鱼精子DNA和25甲酰胺中预杂交和杂交12至24小时。载体材料最终使用2XSSC、02SDS,在50下洗涤三次,每次15分钟。0035成熟多肽术语“成熟多肽”意指在翻译和任何翻译后修饰例如N末端加工、C末端截短、糖基化、磷酸化等之后处于。
23、其最终形式的多肽。在一方面,成熟多肽是SEQIDNO2的氨基酸1至269。0036成熟多肽编码序列术语“成熟多肽编码序列”意指编码具有脂肪酶活性的一种成熟多肽的一种多核苷酸。在一方面,成熟多肽编码序列是SEQIDNO1的核苷酸67至873。0037中严谨度条件术语“中严谨度条件”意指对于至少100个核苷酸长度的探针而言,遵循标准DNA印迹程序,在42在5XSSPE、03SDS、200微克/ML剪切和变性的鲑精DNA和35甲酰胺中预杂交和杂交12至24小时。载体材料最终使用2XSSC、02SDS,在55下洗涤三次,每次15分钟。0038中高严谨度条件术语“中高严谨度条件”意指对于至少100个核苷。
24、酸长度的探针来说,遵循标准DNA印迹程序,在42下在5SSPE、03SDS、200微克/毫升剪切并变性的鲑鱼精子DNA以及或者35甲酰胺中预杂交和杂交12至24小时。最终在60下说明书CN104080908A4/34页8将载体材料使用2SSC、02SDS洗涤三次各15分钟。0039突变体术语“突变体”意指编码一种变体的多核苷酸。0040核酸构建体术语“核酸构建体”意指从天然存在的基因中分离的、或以自然中不会另外出现的方式被修饰成包含核酸区段的、或合成的单链或双链的核酸分子,它包括一个或多个控制序列。0041可操作地连接术语“可操作地连接”意指一种配置,其中一个控制序列相对于一种多核苷酸的编码序。
25、列放置在一个适当位置处,以使得控制序列指引编码序列的表达。0042亲本或亲本脂肪酶术语“亲本”或“亲本脂肪酶”意指一种脂肪酶,对该脂肪酶进行一个改变以产生本发明的酶变体。亲本可以是天然存在的野生型多肽或其变体或片段。0043序列一致性两个氨基酸序列之间或两个核苷酸序列之间的相关性由参数“序列一致性”描述。出于本发明的目的,使用尼德曼翁施NEEDLEMANWUNSCH算法尼德曼和翁施,1970,JMOLBIOL分子生物学杂志48443453来确定两个氨基酸序列之间的序列一致性,该算法如EMBOSS软件包EMBOSSTHEEUROPEANMOLECULARBIOLOGYOPENSOFTWARESU。
26、ITE欧洲分子生物学开放软件套件,RICE赖斯等人,2000,TRENDSGENET遗传学趋势16276277优选500版或更新版本的尼德尔NEEDLE程序所实施的。使用的这些参数是空位开放罚分10、空位延伸罚分05,以及EBLOSUM62BLOSUM62的EMBOSS版本取代矩阵。标记为“最长一致性”的尼德尔的输出使用NOBRIEF选项获得被用作百分比一致性并且被计算如下0044一致的残基100/比对长度比对中的空位总数0045出于本发明的目的,使用尼德曼翁施算法尼德曼和翁施,1970,同上确定两个脱氧核糖核苷酸序列之间的序列一致性,该算法如EMBOSS软件包EMBOSS欧洲分子生物学开放软。
27、件套件,赖斯等人,2000,同上优选500版或更新版本的尼德尔程序所实施的。使用的这些参数是空位开放罚分10、空位延伸罚分05以及EDNAFULLNCBINUC44的EMBOSS版本取代矩阵。标记为“最长一致性”的尼德尔的输出使用NOBRIEF选项获得被用作百分比一致性并且被计算如下0046一致的脱氧核糖核苷酸100/比对长度比对中的空位总数0047子序列术语“子序列”意指使一个或多个例如,若干个核苷酸从成熟多肽编码序列的5端和/或3端缺少的多核苷酸;其中该子序列编码具有脂肪酶活性的一个片段。在一个方面,一个子序列含有成熟多肽编码序列的核苷酸的数目的至少50、至少55、至少60、至少65、至少。
28、70、至少75、至少80、至少85、至少90、以及至少95。0048变体术语“变体”意指在一个或多个例如若干个位置处包括一个取代的具有脂肪酶活性的一种多肽。一个取代意指用一个不同氨基酸置换占用一个位置的氨基酸。本发明的变体具有SEQIDNO2的成熟多肽的脂肪酶活性的至少20、例如至少25、至少30、至少35、至少40、至少45、至少50、至少55、至少60、至少65、至少70、至少75、至少80、至少85、至少90、至少95、或至少100。0049非常高严谨度条件术语“非常高严谨度条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42下在5XSSPE、03SDS、20。
29、0微克/ML剪切并说明书CN104080908A5/34页9变性的鲑鱼精子DNA和50甲酰胺中预杂交和杂交12至24小时。载体材料最终使用2XSSC、02SDS,在70下洗涤三次,每次15分钟。0050非常低严谨度条件术语“非常低严谨度条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42下在5XSSPE、03SDS、200微克/ML剪切并变性的鲑鱼精子DNA和25甲酰胺中预杂交和杂交12至24小时。载体材料最终使用2XSSC、02SDS,在45下洗涤三次,每次15分钟。0051野生型脂肪酶术语“野生型”脂肪酶意指由见于自然界中的一种天然存在的微生物如一种细菌、酵母或。
30、丝状真菌表达的一种脂肪酶。0052用于变体的命名的公约0053出于本发明的目的,将SEQIDNO2中披露的成熟多肽用以确定另一种脂肪酶中的对应的氨基酸残基。将另一种脂肪酶的氨基酸序列与SEQIDNO2中披露的成熟多肽进行比对,并且基于该比对,使用尼德曼翁施算法尼德曼和翁施,1970,分子生物学杂志48443453来确定与SEQIDNO2中披露的成熟多肽的任何氨基酸残基相对应的氨基酸位置编号,该算法如EMBOSS软件包EMBOSS欧洲分子生物学开放软件套件,赖斯等人,2000,遗传学趋势16276277优选500版或更新版本的尼德尔程序所实施的。使用的这些参数是空位开放罚分10、空位延伸罚分05。
31、,以及EBLOSUM62BLOSUM62的EMBOSS版本取代矩阵。0054可以使用若干计算机程序通过多种多肽序列的比对来确定在另一种脂肪酶中的对应氨基酸残基的鉴定,这些计算机程序包括,但不限于MUSCLEMULTIPLESEQUENCECOMPARISONBYLOGEXPECTATION基于日志期望值的多序列比较;版本35或更新版本;EDGAR埃德加,2004,NUCLEICACIDSRESEARCH核酸研究3217921797,MAFFT版本6857或更新版本;KATOH卡托赫和KUMA库玛,2002,NUCLEICACIDSRESEARCH核酸研究3030593066;KATOH卡托赫等。
32、人,2005,NUCLEICACIDSRESEARCH核酸研究33511518;KATOH卡托赫和TOH都,2007,BIOINFORMATICS生物信息学23372374;KATOH卡托赫等人,2009,METHODSINMOLECULARBIOLOGY分子生物学方法5373964;KATOH卡托赫和TOH都,2010,BIOINFORMATICS生物信息学2618991900,以及利用CLUSTALW的EMBOSSEMMA183或更新版本;THOMPSON汤普森等人,1994,NUCLEICACIDSRESEARCH核酸研究2246734680,使用它们各自的缺省参数。0055当其他酶与S。
33、EQIDNO2的成熟多肽相背离使得传统的基于序列的比较方法不能检测其相互关系时LINDAHL林达尔和ELOFSSON埃洛弗松,2000,JMOLBIOL分子生物学杂志295613615,可应用其他成对序列比较算法。在基于序列的搜索中的更大灵敏度可以使用搜索程序来获得,这些搜索程序利用多肽家族的概率表示特征曲线来搜索数据库。例如,PSIBLAST程序通过一个迭代数据库搜索过程来产生多个特征曲线并且能够检测远距离同源物ATSCHUL阿特休尔等人,1997,NUCLEICACIDSRES核酸研究2533893402。如果多肽的家族或超家族在蛋白结构数据库中具有一个或多个代表,则可以实现甚至更大的灵敏。
34、度。程序例如GENTHREADERJONES琼斯,1999,JMOLBIOL分子生物学杂志287797815;MCGUF麦谷芬和JONES琼斯,2003,BIOINFORMATICS生物信息学19874881利用来自多种来源PSIBLAST,二说明书CN104080908A6/34页10级结构预测、结构比对特征曲线、以及溶剂化可能性的信息作为预测查询序列的结构折叠的神经网络的输入。类似地,GOUGH高夫等人,2000,JMOLBIOL分子生物学杂志313903919的方法可以用于比对未知结构的序列与存在于SCOP数据库中的超家族模型。这些比对进而可以用于产生多肽的同源性模型,并且使用出于该目的。
35、而开发的多种工具可以评定这类模型的准确度。0056对于已知结构的蛋白,若干工具和资源可用于检索并产生结构比对。例如,蛋白的SCOP超家族已经在结构上进行比对,并且那些比对是可访问的并且可下载的。使用多种算法例如距离比对矩阵HOLM赫尔姆和SANDER桑德尔,1998,PROTEINS蛋白杂志338896或者组合扩展SHINDYALOV辛迪亚洛夫和BOURNE伯恩,1998,PROTEINENGINEERING蛋白质工程11739747可以比对两个或更多个蛋白结构,并且可以额外利用这些算法的实施来随所感兴趣的结构查询结构数据库以便发现可能的结构同源物例如,赫尔姆和PARK帕克,2000,PROT。
36、EINENGINEERING生物信息学16566567。0057在描述本发明的变体中,以下所述的命名法适于方便参考。采用已接受的IUPAC单字母或三字母氨基酸缩写。0058取代。对于氨基酸取代,使用了以下命名法原始氨基酸、位置、取代的氨基酸。因此,在位置226处的苏氨酸被丙氨酸取代表示为“THR226ALA”或者“T226A”。多个突变由加号“”分开,例如“GLY205ARGSER411PHE”或者“G205RS411F”代表分别在位置205和411上的甘氨酸G被精氨酸R并且丝氨酸S被苯丙氨酸F取代。0059多个取代。包括多个取代的变体由加号“”分开,例如“ARG170TYRGLY195GLU。
37、”或“R170YG195E”代表分别在位置170和195上的精氨酸和甘氨酸被酪氨酸和谷氨酸取代。0060不同的取代。可以在一个位置上引入不同改变时,这些不同的变化由一个逗号分开,例如“ARG170TYR,GLU”或“R170Y,E”代表在位置170上的精氨酸被酪氨酸或谷氨酸取代。因此,“TYR167GLY,ALAARG170GLY,ALA”表示以下变体“TYR167GLYARG170GLY”、“TYR167GLYARG170ALA”、“TYR167ALAARG170GLY”以及“TYR167ALAARG170ALA”。0061发明详细说明0062变体0063本发明涉及分离的脂肪酶变体,这些分离。
38、的脂肪酶变体在对应于SEQIDNO2的成熟多肽的位置T37A、D、E、F、G、H、I、L、N、P、Q、R、S、V、W、Y,N39A、C、D、E、F、G、I、K、L、M、P、Q、R、T、V、W、Y,以及G91D、H、I、P、Q的一个或多个例如若干个位置处包括一个取代,其中该变体具有脂肪酶活性。0064在一个实施例中,该变体与该亲本脂肪酶的氨基酸序列具有至少60、例如至少65、至少70、至少75、至少80、至少85、至少90、至少91、至少92、至少93、至少94、至少95、至少96、至少97、至少98、或至少99但小于100的序列一致性。0065在另一个实施例中,该变体与SEQIDNO2的成熟多。
39、肽具有至少60、例如至少65、至少70、至少75、至少80、至少85、至少90、至少91、至少92、至少93、至少94、至少95、如至少96、至少97、至少98、或至少99但小于100的序列一致性。0066在一个方面,本发明的变体中的取代的数目是120个,例如110个和15个,如1说明书CN104080908A107/34页11个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个取代。0067在另一个方面,一种变体在对应于SEQIDNO2的成熟多肽的位置T37A、D、E、F、G、H、I、L、N、P、Q、R、S。
40、、V、W、Y,N39A、C、D、E、F、G、I、K、L、M、P、Q、R、T、V、W、Y,以及G91D、H、I、P、Q的一个或多个例如若干个位置处包括一个取代。在另一个方面,一种变体在对应于SEQIDNO2的成熟多肽的位置T37A、D、E、F、G、H、I、L、N、P、Q、R、S、V、W、Y,N39A、C、D、E、F、G、I、K、L、M、P、Q、R、T、V、W、Y,以及G91D、H、I、P、Q中的任一者的两个位置处包括一个改变。在另一个方面,一种变体在对应于SEQIDNO2的成熟多肽的位置T37A、D、E、F、G、H、I、L、N、P、Q、R、S、V、W、Y,N39A、C、D、E、F、G、I、K、L。
41、、M、P、Q、R、T、V、W、Y,以及G91D、H、I、P、Q中的任一者的三个位置处包括一个改变。0068在另一个方面,该变体在对应于SEQIDNO2的成熟多肽的位置T37的一个位置处包括一个取代,或由其组成,该位置被ALA、ARG、ASN、ASP、CYS、GLN、GLU、GLY、HIS、ILE、LEU、LYS、MET、PHE、PRO、SER、THR、TRP、TYR、或VAL,优选被ALA、ARG、ASN、ASP、GLN、GLU、GLY、HIS、ILE、LEU、PHE、PRO、SER、TRP、TYR、或VAL取代。在另一个方面,该变体包括SEQIDNO2的成熟多肽的取代T37A、T37D、T3。
42、7E、T37F、T37G、T37H、T37I、T37L、T37N、T37P、T37Q、T37R、T37S、T37V、T37W、或T37Y,或由其组成。0069在另一个方面,该变体在对应于SEQIDNO2的成熟多肽的位置N39的一个位置处包括一个取代,或由其组成,该位置被ALA、ARG、ASN、ASP、CYS、GLN、GLU、GLY、HIS、ILE、LEU、LYS、MET、PHE、PRO、SER、THR、TRP、TYR、或VAL,优选被ALA、ARG、ASP、CYS、GLN、GLU、GLY、ILE、LEU、LYS、MET、PHE、PRO、THR、TRP、TYR、或VAL取代。在另一个方面,该变体。
43、包括SEQIDNO2的成熟多肽的取代N39A、N39C、N39D、N39E、N39F、N39G、N39I、N39K、N39L、N39M、N39P、N39Q、N39R、N39T、N39V、N39W、N39Y,或由其组成。0070在另一个方面,该变体在对应于SEQIDNO2的成熟多肽的位置G91的一个位置处包括一个取代,或由其组成,该位置被ALA、ARG、ASN、ASP、CYS、GLN、GLU、GLY、HIS、ILE、LEU、LYS、MET、PHE、PRO、SER、THR、TRP、TYR、或VAL,优选被ASP、GLN、HIS、ILE、或PRO取代。在另一个方面,该变体包括SEQIDNO2的成熟多。
44、肽的取代G91D、G91H、G91I、G91P、G91Q或甚至G91A,或由其组成。在一个优选方面,该变体在对应于G91的一个位置处包括一个取代,或由其组成,该取代为G91A。0071在另一个实施例中,在位置37、39和/或91处的任何这样的一个或多个取代与一个或多个优选T231R和N233R两者相组合。0072在另一个方面,该变体在对应于位置T37和N39的位置处包括如上描述的那些取代,或由其组成。0073在另一个方面,该变体在对应于位置T37和G91的位置处包括如上描述的那些取代,或由其组成。0074在另一个方面,该变体在对应于位置N39和G91的位置处包括如上描述的那些取代,或由其组成。。
45、0075在另一个方面,该变体在对应于位置T37、N39和G91的位置处包括如上描述的那些取代,或由其组成。0076这些变体可以在一个或多个例如若干个其他位置处进一步包括一个或多个另说明书CN104080908A118/34页12外的取代。0077这些氨基酸变化可以具有微小性质,即,不会显著地影响蛋白质的折叠和/或活性的保守氨基酸取代或插入;典型地130个氨基酸的较小缺失;较小的氨基或羧基末端延伸,如氨基末端的甲硫氨酸残基;多达2025个残基的较小接头肽;或便于通过改变净电荷或另一种功能来纯化的较小延伸,如聚组氨酸段TRACT、抗原表位或结合结构域。0078保守取代的实例在下组的范围内碱性氨基酸。
46、精氨酸、赖氨酸及组氨酸、酸性氨基酸谷氨酸和天冬氨酸、极性氨基酸谷氨酰胺和天冬酰胺、疏水性氨基酸亮氨酸、异亮氨酸及缬氨酸、芳香族氨基酸苯丙氨酸、色氨酸及酪氨酸、以及小氨基酸甘氨酸、丙氨酸、丝氨酸、苏氨酸及甲硫氨酸。0079可替代地,这些氨基酸变化具有改变这些多肽的物理化学特性的这样一种性质。例如,氨基酸变化可以改进多肽的热稳定性、改变底物特异性、改变PH最适值、等。0080例如,这些变体在对应于SEQIDNO2的成熟多肽的位置D96、T143、A150、E210、G225、T231、N233以及P250的一个位置处可以包括一个取代。在一些实施例中,该取代选自D96G、T143A、A150G、E2。
47、10Q、G225R、T231R、N233R以及P250R。0081在一些实施例中,本发明涉及选自以下各项的变体0082G91QT143AE210QT231RN233RP250RG91QA150GE210QT231RN233RP250RT37RN39RG91AD96GT231RN233RG91QE210QT231RN233RP250RG91IE210QT231RN233RP250RG91AD96GT231RN233RG91AD96GG225RT231RN233RG91NE210QT231RN233RP250RG91LE210QT231RN233RG91AD96GA150GT231RN233R00。
48、830084可以根据本领域已知的程序来鉴定多肽中的必需氨基酸,例如定点诱变或丙氨酸扫描诱变CUNNINGHAM坎宁安和WELLS威尔斯,1989,SCIENCE科学24410811085。在后一种技术中,在分子中的每个残基处引入单个丙氨酸突变,并且测试所得突变分子的脂肪酶活性以鉴别对分子的活性关键的氨基酸残基。还参见HILTON希尔顿等人,1996,JBIOLCHEM生物化学杂志,27146994708。也可结合假定接触位点氨基酸的突变,如通过以下技术例如核磁共振、结晶学、电子衍射、或光亲说明书CN104080908A129/34页13和标记进行确定,对结构进行物理学分析,从而确定酶的活性位点。
49、或其他生物学相互作用。参见例如DEVOS德福斯等人,1992,SCIENCE科学255306312;SMITH史密斯等人,1992,JMOLBIOL分子生物学杂志224899904;WLODAVER沃勒达尔等人,1992,FEBSLETT欧洲生物化学学会联盟通讯3095964。还可以从与相关多肽的比对来推断鉴别必需氨基酸。0085这些变体可以由至少50、至少55、至少60、至少65、至少70、至少75、至少80、至少85、至少90、以及至少95的成熟多肽的氨基酸数目组成。0086在一个实施例中,该变体在一种漂白组分或多于一种漂白组分的混合物的存在下具有改进的性能。适合的漂白组分包括漂白催化剂、光漂白剂、漂白活化剂、过氧化氢、过氧化氢源、预先形成的过酸及其混合物。通常,漂白组分可以按清洁组合物的重量计从约000001至90WT,优选00001至约50或甚至从约0001至约25的漂白组分存在。适合的漂白组分的实例包括00871预先形成的过酸适合的预先形成的过酸包括但不限于选自下组的。