与相关申请的交叉引用
本申请要求于2013年3月8日提交的美国临时申请序列号61/774,982的权益,该临时申请通过引用结合到本文中。
公开内容领域
本发明涉及用于生产蛋白质的分离核酸、表达方法、宿主细胞、表达载体和DNA构建体,并且涉及使用所述表达方法生产的蛋白质。更特别地,本发明涉及从巴斯德毕赤酵母(Pichiapastoris)分离的核酸,其中所述核酸具有启动子活性。本发明还涉及用于使用巴斯德毕赤酵母启动子生产蛋白质的表达方法、宿主细胞、表达载体和DNA构建体,并涉及使用所述表达方法生产的蛋白质。
背景和发明概述
酵母表达系统可用于有效地生产蛋白质,例如酶、激素和疫苗蛋白质,部分上是因为一些酵母迅速生长至高细胞密度,在简单和廉价的培养基中生长,并且为真核生物,因此可以以与哺乳动物中天然蛋白质相似的方式修饰蛋白质。此外,用合适的信号序列,表达的蛋白质可被分泌入培养基中以方便分离和纯化。一些酵母表达系统还为食品和制药工业所接受,因为其对于药物和食物产品的生产是安全的,不像真菌和细菌表达系统,它们可能在一些情况下是不安全的,例如对于人食品制造。
因此,开发或改善可用于表达高水平蛋白质以增加产率、减少蛋白质分离和纯化费用以及降低人和动物健康产品和食物产品的成本的酵母表达系统,对多种工业例如食品和动物饲料工业、人和动物健康工业等是有益的。
已经开发了多种类型的酵母表达系统,包括使用编码同源或异源蛋白质的核酸在酵母启动子控制下的诱导性或组成型蛋白质表达。启动子为连接编码蛋白质的核酸的5’末端的调节元件,并且可与宿主细胞(例如,酵母宿主细胞)中的多种调节因子相互作用以控制RNA从DNA转录。启动子还可控制RNA从DNA转录的时机。例如,在酵母的巴斯德毕赤酵母中已经鉴定出AOX1启动子,并通常用于酵母表达系统中,因为其为紧密调节的强启动子。
由于酵母表达系统对包括人类制药工业以及人食品和动物饲料工业在内的多种工业的重要性,酵母表达系统的改善为许多研究和开发的焦点。因此,本发明人从巴斯德毕赤酵母中鉴定了对用于蛋白质在酵母中表达特别有效的启动子。本文所述启动子可用在例如用于蛋白质组成型表达的表达系统中。
在本发明一个说明性实施方案中,提供了一种分离核酸,其中所述分离核酸的序列包含例如与选自本文所述的SEQIDNO:1和SEQIDNO:2的序列具有至少90%、95%或98%同一性,或与其片段具有至少90%、95%或98%同一性的序列,其中所述分离核酸包含组成型巴斯德毕赤酵母启动子序列。在其它实施方案中,提供包含这些启动子序列的表达载体、宿主细胞和DNA构建体。
在另一个实施方案中,提供使用这些启动子序列生产蛋白质的方法。所述方法包括在培养基中培养含有包含与编码蛋白质的异源编码序列操作性连接的任何上述启动子序列的第一表达盒的宿主细胞的步骤,其中所述培养在允许该蛋白质表达的条件下进行。在另一个说明性实施方案中,提供根据该方法生产的分离蛋白质。
下列条款清单中描述的所有实施方案也被考虑为按照本发明使用。对于下列条款中所述的所有实施方案,认为实施方案的任何可应用的组合均与本发明一致。
1.一种分离核酸,其中所述分离核酸的序列包含与选自SEQIDNO:1和SEQIDNO:2的序列具有至少90%同一性或与其片段具有至少90%同一性的序列,其中所述分离核酸包含组成型巴斯德毕赤酵母启动子序列。
2.条款1的分离核酸,其中所述分离核酸的序列与选自SEQIDNO:1和SEQIDNO:2的序列具有至少95%同一性,或与其片段具有至少95%同一性。
3.条款1的分离核酸,其中所述分离核酸的序列与选自SEQIDNO:1和SEQIDNO:2的序列具有至少98%同一性,或与其片段具有至少98%同一性。
4.条款1的分离核酸序列,其中所述分离核酸的序列为选自SEQIDNO:1和SEQIDNO:2的序列或其片段。
5.条款1-4中任一项的分离核酸,其中所述分离核酸与异源编码序列操作性连接。
6.条款5的分离核酸,其中所述异源编码序列编码选自毒素、抗体、激素、酶、生长因子、细胞因子、结构蛋白、免疫原性蛋白和细胞信号传导蛋白的蛋白质。
7.条款6的分离核酸,其中所述蛋白质为用于动物饲料的酶。
8.条款7的分离核酸,其中所述蛋白质选自植酸酶、甘露聚糖酶、半乳糖苷酶、淀粉酶、葡聚糖酶、蛋白酶、纤维素酶和木聚糖酶。
9.条款8的分离核酸,其中所述蛋白质为植酸酶。
10.条款8的分离核酸,其中所述蛋白质为半乳糖苷酶。
11.包含条款1-10中任一项的分离核酸的表达载体。
12.包含条款11的表达载体的宿主细胞。
13.包含条款1-10中任一项的分离核酸的宿主细胞。
14.条款12或13中任一项的宿主细胞,其中所述宿主细胞为毕赤酵母属(Pichia)物种。
15.条款14的宿主细胞,其中所述毕赤酵母属物种为巴斯德毕赤酵母。
16.包含条款1-10中任一项的分离核酸的DNA构建体。
17.生产蛋白质的方法,所述方法包括在培养基中培养含有包含与编码蛋白质的异源编码序列操作性连接的条款1-4中任一项的分离核酸的第一表达盒的宿主细胞的步骤,其中所述培养在允许该蛋白质表达的条件下进行。
18.条款17的方法,其中所述蛋白质选自毒素、抗体、激素、酶、生长因子、细胞因子、结构蛋白、免疫原性蛋白和细胞信号传导蛋白。
19.条款18的方法,其中所述蛋白质为用于动物饲料的酶。
20.条款19的方法,其中所述蛋白质选自植酸酶、甘露聚糖酶、半乳糖苷酶、淀粉酶、葡聚糖酶、纤维素酶、蛋白酶和木聚糖酶。
21.条款20的方法,其中所述蛋白质为植酸酶。
22.条款20的方法,其中所述蛋白质为半乳糖苷酶。
23.条款17-22中任一项的方法,其中所述蛋白质使用第一表达盒与第二表达盒组合表达。
24.条款23的方法,其中所述第二表达盒包含:与具有包含SEQIDNO:3或SEQIDNO:4的序列或任何其它AOX1或AOX2启动子序列的序列的分离核酸操作性连接的编码蛋白质的异源编码序列,其中SEQIDNO:3和SEQIDNO:4具有启动子活性。
25.条款24的方法,其中所述蛋白质使用第一表达盒、第二表达盒和第三表达盒表达。
26.条款25的方法,其中所述第三表达盒包含:与具有与选自SEQIDNO:1和SEQIDNO:2的序列具有至少90%同一性或与其片段具有至少90%同一性的序列的分离核酸操作性连接的编码蛋白质的异源编码序列。
27.条款23的方法,其中所述第二表达盒包含:与具有与选自SEQIDNO:1和SEQIDNO:2的序列具有至少90%同一性或与其片段具有至少90%同一性的序列的分离核酸操作性连接的编码蛋白质的异源编码序列。
28.根据条款17-27中任一项的方法生产的分离蛋白质。
29.条款12或13中任一项的宿主细胞,其中所述宿主细胞为甲基营养型酵母。
30.条款29的宿主细胞,其中所述宿主细胞选自汉逊酵母属(Hansenula)物种、毕赤酵母属物种和假丝酵母属(Candida)物种。
31.包含条款16的DNA构建体的宿主细胞,其中所述宿主细胞为甲基营养型酵母。
32.条款31的宿主细胞,其中所述宿主细胞选自汉逊酵母属物种、毕赤酵母属物种和假丝酵母属物种。
33.条款17-27中任一项的方法,其中所述宿主细胞为甲基营养型酵母。
34.条款33的方法,其中所述宿主细胞选自汉逊酵母属物种、毕赤酵母属物种和假丝酵母属物种。
35.条款25的方法,其中所述第三表达盒包含:与具有包含SEQIDNO:3或SEQIDNO:4的序列或任何其它AOX1或AOX2启动子序列的分离核酸操作性连接的编码蛋白质的异源编码序列,其中SEQIDNO:3和SEQIDNO:4具有启动子活性。
36.生产一种或多种蛋白质的方法,所述方法包括在培养基中培养包含第一表达盒、第二表达盒以及一个或多个额外表达盒的宿主细胞的步骤,其中所述一个或多个额外表达盒的每个包含与编码一种或多种蛋白质的异源编码序列操作性连接的条款1-4中任一项的分离核酸,其中所述培养在允许该一种或多种蛋白质表达的条件下进行。
37.条款17的方法,进一步包括从所培养的宿主细胞的培养基中纯化蛋白质的步骤。
38.条款36的方法,进一步包括从所培养的宿主细胞的培养基中纯化所述一种或多种蛋白质的一种或多种的步骤。
39.条款1-38中任一项的分离核酸、宿主细胞、表达载体、分离蛋白质、DNA构建体或方法,其中所述分离核酸由SEQIDNO.1-2中的任一个或其片段组成。
40.由SEQIDNO.1-2中的任一个或其片段组成的分离核酸。
41.条款12或13的宿主细胞,其中所述宿主细胞选自汉逊酵母属物种、毕赤酵母属物种、酵母属(Saccharomyces)物种、裂殖酵母属(Schizosaccharomyces)物种、有孢圆酵母属(Torulaspora)物种、假丝酵母属物种、耶氏酵母属(Yarrowia)物种和克鲁维酵母属(Kluveromyces)物种。
42.条款5的分离核酸,其中所述异源编码序列编码选自毒素、抗体、激素、酶、生长因子、细胞因子、结构蛋白、免疫原性蛋白和细胞信号传导蛋白的蛋白质或多肽。
43.生产蛋白质或多肽的方法,所述方法包括在培养基中培养含有包含与编码蛋白质的异源编码序列操作性连接的条款1-4中任一项的分离核酸的第一表达盒的宿主细胞的步骤,其中所述培养在允许该蛋白质表达的条件下进行。
44.条款23的方法,其中所述第二表达盒包含:与具有包含SEQIDNO:3或SEQIDNO:4的序列或任何其它启动子序列的序列的分离核酸操作性连接的编码蛋白质的异源编码序列,其中SEQIDNO:3和SEQIDNO:4具有启动子活性。
45.条款25的方法,其中所述第三表达盒包含:与具有SEQIDNO:3或SEQIDNO:4的序列或任何其它启动子序列的分离核酸操作性连接的编码蛋白质的异源编码序列,其中SEQIDNO:3和SEQIDNO:4具有启动子活性。
附图简述
图1显示Chr1-0469启动子的核苷酸序列(SEQIDNO:1)。
图2显示UPP启动子的核苷酸序列(SEQIDNO:2)。
图3显示AoX1启动子序列的核苷酸序列(SEQIDNO:3)。
图4显示AOX1启动子ATG起始密码子上游1000bp的基因组序列(SEQIDNO:4)。
图5显示在复制板上各种转化体的GFP表达水平。
图6显示在各种条件下pUPP、TEF2、Chr1-0469、GAP、AOX1和DAS启动子的相对启动子活性。
图7显示报告载体图谱。使用类似的载体,其具有α和β-半乳糖苷酶ORF两者,以及具有或没有分泌信号(α交配因子)。
图8显示用于通过PCR自巴斯德毕赤酵母基因组DNA分离Chr1-0469启动子(SEQIDNO:1)和UPP启动子(SEQIDNO:2)的正向引物的核苷酸序列。将相应的DNA片段——这些PCR反应的产物——引入具有α-半乳糖苷酶ORF的报告载体中(图7)。
图9(子图A–C)显示来自具有指示的启动子-报告构建体的分离转化体的α-半乳糖苷酶的表达水平。
图10显示大肠杆菌appA2植酸酶在巴斯德毕赤酵母中的活性。
说明性实施方案的详述
在本发明一个说明性实施方案中,提供一种分离核酸,其中所述分离核酸的序列包含例如与选自本文所述的SEQIDNO:1和SEQIDNO:2的序列具有至少90%、95%或98%同一性或与其片段具有至少90%、95%或98%同一性的序列,其中所述核酸包含组成型巴斯德毕赤酵母启动子序列。在另一个实施方案中,所述分离核酸的序列为选自SEQIDNO:1和SEQIDNO:2的序列或其片段的序列。在其它实施方案中,提供包含这些启动子序列的表达载体、宿主细胞和DNA构建体。
上述启动子已经从目前被归类为巴斯德毕赤酵母酵母菌株的酵母菌株(即,NRRLY11430)中分离出。然而,该分类在某些时候可能更改为Komagataella物种(例如,Komagataellaphaffii)。
在另一个实施方案中,提供使用这些启动子序列生产蛋白质的方法。所述方法包括在培养基中培养含有包含与编码蛋白质的异源编码序列操作性连接的任何上述启动子序列的第一表达盒的宿主细胞的步骤,其中所述培养在允许该蛋白质表达的条件下进行。在另一个说明性实施方案中,提供根据该方法生产的分离蛋白质。
下列条款清单中描述的所有实施方案均考虑为按照本发明使用。对于下列条款中所述的所有实施方案,认为实施方案的任何可应用的组合均与本发明一致。下列条款清单中描述的任何实施方案还考虑为与本申请的发明概述部分或本申请的说明性实施方案的详述部分所描述的任何实施方案一起使用。
1.一种分离核酸,其中所述分离核酸的序列包含与选自SEQIDNO:1和SEQIDNO:2的序列具有至少90%同一性或与其片段具有至少90%同一性的序列,其中所述分离核酸包含组成型巴斯德毕赤酵母启动子序列。
2.条款1的分离核酸,其中所述分离核酸的序列与选自SEQIDNO:1和SEQIDNO:2的序列具有至少95%同一性或与其片段具有至少95%同一性。
3.条款1的分离核酸,其中所述分离核酸的序列与选自SEQIDNO:1和SEQIDNO:2的序列具有至少98%同一性或与其片段具有至少98%同一性。
4.条款1的分离核酸序列,其中所述分离核酸的序列为选自SEQIDNO:1和SEQIDNO:2或其片段的序列。
5.条款1-4中任一项的分离核酸,其中所述分离核酸与异源编码序列操作性连接。
6.条款5的分离核酸,其中所述异源编码序列编码选自毒素、抗体、激素、酶、生长因子、细胞因子、结构蛋白、免疫原性蛋白和细胞信号传导蛋白的蛋白质。
7.条款6的分离核酸,其中所述蛋白质为用于动物饲料的酶。
8.条款7的分离核酸,其中所述蛋白质选自植酸酶、甘露聚糖酶、半乳糖苷酶、淀粉酶、葡聚糖酶、蛋白酶、纤维素酶和木聚糖酶。
9.条款8的分离核酸,其中所述蛋白质为植酸酶。
10.条款8的分离核酸,其中所述蛋白质为半乳糖苷酶。
11.包含条款1-10中任一项的分离核酸的表达载体。
12.包含条款11的表达载体的宿主细胞。
13.包含条款1-10中任一项的分离核酸的宿主细胞。
14.条款12或13中任一项的宿主细胞,其中所述宿主细胞为毕赤酵母属物种。
15.条款14的宿主细胞,其中所述毕赤酵母属物种为巴斯德毕赤酵母。
16.包含条款1-10中任一项的分离核酸的DNA构建体。
17.生产蛋白质的方法,所述方法包括在培养基中培养含有包含与编码蛋白质的异源编码序列操作性连接的条款1-4中任一项的分离核酸的第一表达盒的宿主细胞的步骤,其中所述培养在允许该蛋白质表达的条件下进行。
18.条款17的方法,其中所述蛋白质选自毒素、抗体、激素、酶、生长因子、细胞因子、结构蛋白、免疫原性蛋白和细胞信号传导蛋白。
19.条款18的方法,其中所述蛋白质为用于动物饲料的酶。
20.条款19的方法,其中所述蛋白质选自植酸酶、甘露聚糖酶、半乳糖苷酶、淀粉酶、葡聚糖酶、纤维素酶、蛋白酶和木聚糖酶。
21.条款20的方法,其中所述蛋白质为植酸酶。
22.条款20的方法,其中所述蛋白质为半乳糖苷酶。
23.条款17-22中任一项的方法,其中所述蛋白质使用第一表达盒与第二表达盒组合表达。
24.条款23的方法,其中所述第二表达盒包含:与具有包含SEQIDNO:3或SEQIDNO:4的序列或任何其它AOX1或AOX2启动子序列的序列的分离核酸操作性连接的编码蛋白质的异源编码序列,其中SEQIDNO:3和SEQIDNO:4具有启动子活性。
25.条款24的方法,其中所述蛋白质使用第一表达盒、第二表达盒和第三表达盒表达。
26.条款25的方法,其中所述第三表达盒包含:与具有与选自SEQIDNO:1和SEQIDNO:2的序列具有至少90%同一性或与其片段具有至少90%同一性的序列的分离核酸操作性连接的编码蛋白质的异源编码序列。
27.条款23的方法,其中所述第二表达盒包含:与具有与选自SEQIDNO:1和SEQIDNO:2的序列具有至少90%同一性或与其片段具有至少90%同一性的序列的分离核酸操作性连接的编码蛋白质的异源编码序列。
28.根据条款17-27中任一项的方法生产的分离蛋白质。
29.条款12或13中任一项的宿主细胞,其中所述宿主细胞为甲基营养型酵母。
30.条款29的宿主细胞,其中所述宿主细胞选自汉逊酵母属物种、毕赤酵母属物种和假丝酵母属物种。
31.包含条款16的DNA构建体的宿主细胞,其中所述宿主细胞为甲基营养型酵母。
32.条款31的宿主细胞,其中所述宿主细胞选自汉逊酵母属物种、毕赤酵母属物种和假丝酵母属物种。
33.条款17-27中任一项的方法,其中所述宿主细胞为甲基营养型酵母。
34.条款33的方法,其中所述宿主细胞选自汉逊酵母属物种、毕赤酵母属物种和假丝酵母属物种。
35.条款25的方法,其中所述第三表达盒包含:与具有SEQIDNO:3或SEQIDNO:4的序列或任何其它AOX1或AOX2启动子序列的分离核酸操作性连接的编码蛋白质的异源编码序列,其中SEQIDNO:3和SEQIDNO:4具有启动子活性。
36.生产一种或多种蛋白质的方法,所述方法包括在培养基中培养包含第一表达盒、第二表达盒以及一个或多个额外表达盒的宿主细胞的步骤,其中所述一个或多个额外表达盒的每个包含与编码一种或多种蛋白质的异源编码序列操作性连接的条款1-4中任一项的分离核酸,其中所述培养在允许该一种或多种蛋白质表达的条件下进行。
37.条款17的方法,进一步包括从所培养的宿主细胞的培养基中纯化蛋白质的步骤。
38.条款36的方法,进一步包括从所培养的宿主细胞的培养基中纯化所述一种或多种蛋白质的一种或多种的步骤。
39.条款1-38中任一项的分离核酸、宿主细胞、表达载体、分离蛋白质、DNA构建体或方法,其中所述分离核酸由SEQIDNO.1-2中的任一个或其片段组成。
40.由SEQIDNO.1-2中的任一个或其片段组成的分离核酸。
41.条款12或13的宿主细胞,其中所述宿主细胞选自汉逊酵母属物种、毕赤酵母属物种、酵母属物种、裂殖酵母属物种、有孢圆酵母属物种、假丝酵母属物种、耶氏酵母属物种和克鲁维酵母属物种。
42.条款5的分离核酸,其中所述异源编码序列编码选自毒素、抗体、激素、酶、生长因子、细胞因子、结构蛋白、免疫原性蛋白和细胞信号传导蛋白的蛋白质或多肽。
43.生产蛋白质或多肽的方法,所述方法包括在培养基中培养含有包含与编码蛋白质的异源编码序列操作性连接的条款1-4中任一项的分离核酸的第一表达盒的宿主细胞的步骤,其中所述培养在允许该蛋白质表达的条件下进行。
44.条款23的方法,其中所述第二表达盒包含:与具有包含SEQIDNO:3或SEQIDNO:4的序列或任何其它启动子序列的序列的分离核酸操作性连接的编码蛋白质的异源编码序列,其中SEQIDNO:3和SEQIDNO:4具有启动子活性。
45.条款25的方法,其中所述第三表达盒包含:与具有SEQIDNO:3或SEQIDNO:4的序列或任何其它启动子序列的分离核酸操作性连接的编码蛋白质的异源编码序列,其中SEQIDNO:3和SEQIDNO:4具有启动子活性。
短语“由……组成”意指SEQIDNO.所指定的序列除SEQIDNO.所对应的那些核苷酸序列外不包含额外的核苷酸序列。
本领域技术人员已知的任何酵母表达系统均可根据本发明使用。例如,美国专利号6,451,572、6,841,370、6,974,690、7,320,876、7,078,035、7,138,260和PCT公布号WO2007/112739中描述了多种酵母表达系统,这些文件均通过引用结合到本文中。在任何本文所述的实施方案中,可使用这些酵母表达系统中的任一个。或者,可使用任何适合蛋白质表达的酵母物种或酵母表达系统,包括酵母物种,例如酵母属物种(例如,酿酒酵母(Saccharomycescerevisiae))、克鲁维酵母属物种(例如乳酸克鲁维酵母(Kluyveromyceslactis))、有孢圆酵母属物种、耶氏酵母属物种(例如,解脂耶氏酵母(Yarrowialipolitica))、裂殖酵母属物种(例如,粟酒裂殖酵母(Schizosaccharomycespombe))。在另一个实施方案中,可使用甲基营养型酵母物种,例如毕赤酵母属物种(例如,巴斯德毕赤酵母或甲醇毕赤酵母(Pichiamethanolica))、汉逊酵母属物种(例如,多形汉逊酵母(Hansenulapolymorpha))、球拟酵母属(Torulopsis)物种、Komagataella物种、假丝酵母属物种(例如,博伊丁假丝酵母(Candidaboidinii))和Karwinskia物种。在一个实施方案中,蛋白质可在甲基营养型酵母巴斯德毕赤酵母中表达。甲基营养型酵母能够利用甲醇作为单一碳源产生维持细胞功能所需的能源。甲基营养型酵母包含编码用于甲醇利用的酶的基因,例如编码醇氧化酶的基因。这些宿主细胞的任一种可为与本文所述启动子异源的宿主细胞菌株(即,宿主细胞通常不天然包含本文所述启动子)。
酵母表达系统可用于胞内生产充足量的蛋白质,或从酵母细胞分泌以使该蛋白质可方便地从培养基中分离或纯化。如本文所使用的,术语“表达”意指核酸在宿主细胞中的转录和/或翻译。酵母表达系统可包括但不限于用于表达蛋白质的酵母宿主细胞和表达载体(例如,DNA构建体)。所述表达载体可包含本文所述的启动子,并且如本领域已知的,启动子与表达载体异源(即,该组合不天然存在)。在一个实施方案中,蛋白质分泌入培养基受掺入表达载体中的并且能够指导所表达蛋白质分泌出酵母细胞外的信号肽(例如,酵母α-因子信号肽、酵母KILM1信号肽、酵母PHO1信号肽或酵母SUC2信号肽)控制。在其它实施方案中,适合促进蛋白质从酵母细胞分泌的其它信号肽为本领域技术人员所已知。在一个方面,分泌后信号肽通常从蛋白质上切去。
在多个实施方案中,可使用本领域技术人员已知并且与酵母表达系统相容的任何表达载体(例如,自主复制或整合入宿主基因组的载体)。如本文所使用的,术语“载体”意指可通过整合入酵母细胞基因组或通过染色体外存在(例如,自主复制的质粒)转化酵母细胞的双链或单链形式或线性或环状形式的任何质粒或其它载体。如本领域所已知的,载体(例如,表达载体或表达盒)为用于转化宿主细胞表达蛋白质、多肽或肽的核酸构建体,并且所述载体在其转化的宿主细胞中不天然存在。
在一个实施方案中,表达载体具有用于插入DNA片段的限制性核酸内切酶切割位点(例如,一个或多个克隆位点和/或多克隆位点)和用于转化体选择的遗传标志物。例如,用于转化体选择的遗传标志物可包括允许转化的酵母在缺乏缺陷菌株所不能生产的必需营养物的培养基上生长的选择标志物、编码已知生色底物的酶的选择标志物或提供对药物包括但不限于G418、诺尔丝菌素(Nat)、Zeocin、杀稻瘟素或潮霉素的抗性的选择标志物。在另一个实施方案中,表达载体具有用于转录终止的终止子序列(例如,AOX1或HSP150终止子)。在另一个实施方案中,表达载体具有含有多聚腺苷酸化位点的蛋白质编码序列下游的3’非翻译区。如本文所使用的,“3’非翻译区”意指不翻译为蛋白质并且位于蛋白质编码序列下游的核苷酸序列。通常,3’非翻译区包含用于mRNA加工的调节序列。在另一个实施方案中,表达载体具有用于在例如细菌宿主中合成和复制载体的复制起点(例如,细菌复制起点)。美国专利号6,451,572、6,841,370、6,974,690、7,320,876、7,078,035、7,138,260和PCT公布号WO2007/112739中描述了多种表达载体,这些文件均通过引用结合到本文中。表达载体的构建和使用在Sambrook等,“MolecularCloning:ALaboratoryManual(分子克隆:实验室手册)”,第3版,ColdSpringHarborLaboratoryPress,(2001)中描述,其通过引用结合到本文中。在另一个实施方案中,表达载体或其片段可从新合成,或可使用PCR扩增并连接表达载体的各部分。
如本文所使用的,“调节序列”意指通常分别在蛋白质编码序列5’或3’末端上游或下游的核苷酸序列。调节序列不翻译为蛋白质。调节序列包括但不限于影响RNA加工或稳定性的序列,例如多聚腺苷酸化信号序列、增强子、阻遏物结合位点和启动子。
在一个实施方案中,蛋白质编码序列可在表达载体中与能够指导蛋白质在例如酵母中表达的启动子序列操作性连接。如本文所使用的,“操作性连接”意指功能性连接。如本文所述,启动子可为“组成型启动子”。“组成型启动子”意指调节目的基因表达的启动子。术语“组成型启动子”为本领域所已知。组成型启动子可具有一些诱导型活性,但用该启动子获得的最大活性不是诱导性的。
如本文所使用的,“启动子”意指通常位于蛋白质编码序列5’末端上游的核苷酸序列,其部分上通过与控制转录的各种调节因子相互作用来控制RNA从DNA转录。在一个实施方案中,启动子可来源于与用于蛋白质表达的酵母宿主细胞相同的酵母物种。在另一个实施方案中,启动子可来源于与用于蛋白质表达的酵母宿主细胞不同的酵母物种。在一个实施方案中,启动子可包含充当指导起始转录的识别位点的TATA盒序列,包括,但不限于一个或多个转录增强子元件。增强子元件可在TATA盒序列的近端或远端并且可为正常的5’到3’取向或可为3’到5’取向。在另一个实施方案中,增强子元件可为启动子序列天然的增强子元件,或其可为插入表达载体构建体的异源增强子元件。如本文所使用的,“增强子元件”为可刺激启动子活性的调节元件。
在本文所述多个说明性实施方案中,启动子可为分离核酸,其中所述分离核酸的序列包含与选自SEQIDNO:1和SEQIDNO:2的序列具有至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%或至少99%同一性或与其片段具有至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%或至少99%同一性的序列,其中所述分离核酸包含组成型巴斯德毕赤酵母启动子序列。在另一个实施方案中,所述分离核酸序列为选自SEQIDNO:1和SEQIDNO:2的序列或其片段,其中所述分离核酸包含组成型巴斯德毕赤酵母启动子序列。
如本文所使用的,“分离核酸”意指基本上不含在该核酸的来源生物的基因组DNA中天然位于该核酸两侧的序列的核酸。例如,在多个实施方案中,本发明的分离核酸可包含小于约2kb、小于约1kb、小于约0.5kb、小于约0.1kb的核苷酸序列、小于约0.05kb或不包含在该分离核酸的来源生物的基因组DNA中天然位于该核酸分子两侧的核苷酸序列。
如本文所使用的,“其片段”当涉及分离核酸分子时意指SEQIDNO:1-2的分离核酸的片段。在多个说明性实施方案中,片段可为约50个核苷酸长、约100个核苷酸长、约200个核苷酸长、约300个核苷酸长、约400个核苷酸长、约500个核苷酸长、约600个核苷酸长、约700个核苷酸长、约800个核苷酸长或约900个核苷酸长。在其它实施方案中,片段可在SEQIDNO:1-2中任一个的分离核酸的3’末端上游延伸约50个核苷酸、约100个核苷酸、约200个核苷酸、约300个核苷酸、约400个核苷酸、约500个核苷酸、约600个核苷酸、约700个核苷酸、约800个核苷酸或约900个核苷酸。在另外的实施方案中,片段可包含SEQIDNO:1-2的每个中所存在的TATA盒序列上游和/或下游的约50个核苷酸、约100个核苷酸、约200个核苷酸、约300个核苷酸或约350个核苷酸。
在多个实施方案中,本文所述分离核酸可通过本领域所熟知的核酸(例如,DNA)纯化技术纯化。例如,可通过物理方法将核酸与污染物分离,包括但不限于离心、压力技术,或通过使用具有核酸(例如,DNA)亲和性的物质,例如二氧化硅小球。充分洗涤后,可将分离核酸悬浮在水或缓冲液中。在其它实施方案中,市售试剂盒为可用的,例如Qiagen?、Nuclisensm?,以及Wizard?(Promega)和Promegam?。用于纯化核酸的方法在Sambrook等,“MolecularCloning:ALaboratoryManual(分子克隆:实验室手册)”,第3版,ColdSpringHarborLaboratoryPress,(2001)中描述,其通过引用结合到本文中。本文所述的分离核酸可为还经过纯化的分离核酸,或分离核酸可为不纯的。“纯化的核酸”当通过重组技术生产时基本上不含其它细胞物质或培养基,或当化学合成时基本上不含化学前体或其它化学品。
本文所述分离核酸能够在合适的杂交条件(例如,合适的缓冲液、离子强度、温度、甲酰胺和MgCl2浓度)下与互补核酸特异性杂交。本文所述分离核酸可通过置换、缺失、截短修饰,和/或可与其它核酸分子融合,其中所得分离核酸与互补核酸特异性杂交。
同样在本发明范围内的为与本文所述分离核酸或其片段互补的核酸,以及与本文所述分离核酸杂交的那些或与其互补物在高度严格的条件下杂交的那些。如本文所使用的,术语“互补的”是指嘌呤和嘧啶核苷酸序列通过氢键结合而缔合形成双链核酸分子的能力。鸟嘌呤与胞嘧啶、腺嘌呤与胸腺嘧啶以及腺嘌呤和尿嘧啶为互补的并且可通过氢键结合而缔合,当两个核酸分子具有“互补”序列时导致形成双链核酸分子。互补DNA序列被称为“互补物”。
根据本发明,“高度严格的条件”意指在5XSSPE和50%甲酰胺中于65℃杂交,并在0.5XSSPE中于65℃洗涤。高度严格杂交的条件在Sambrook等,“MolecularCloning:ALaboratoryManual(分子克隆:实验室手册)”,第3版,ColdSpringHarborLaboratoryPress,(2001)中描述,其通过引用结合到本文中。在一些说明性的方面,杂交可沿分离核酸的全长或沿着其长度的部分或与其片段发生。
还包括与本文所述分离核酸或其片段具有约60%、约70%、约75%、约80%、约85%、约90%、约92%、约95%、96%、97%、98%和99%同一性的分离核酸分子。序列之间百分比同一性或相似性的确定可例如使用GAP程序(GeneticsComputerGroup,软件;目前可经由http://www.accelrys.com上的Accelrys取得)进行,比对可使用例如ClustalW算法(VNTI软件,InforMaxInc.)进行。序列数据库可使用目的分离核酸序列或其片段的序列搜索。数据库搜索的算法通常基于BLAST软件(Altschul等,1990)。在一些实施方案中,百分比同一性可沿分离核酸的全长确定。
用于合成本文所述分离核酸的技术为本领域所熟知并且包括化学合成和重组方法。这样的技术在Sambrook等,“MolecularCloning:ALaboratoryManual(分子克隆:实验室手册)”,第3版,ColdSpringHarborLaboratoryPress,(2001)中描述,其通过引用结合到本文中。分离核酸分子还可商业上制成。用于合成本文所述分离核酸的技术为本领域所熟知。本文所述分离核酸可通过本领域已知的技术例如限制酶分析或测序来分析,以确定分离核酸的序列。因此,本文所述分离核酸可为合成的。
在说明性的方面,用包含与本文所述启动子之一操作性连接的编码目的蛋白质的异源核酸的表达载体,使用本领域技术人员熟知的程序转化酵母细胞。术语“转化”意指核酸或核酸片段至宿主细胞内的转移。在说明性实施方案中,这样的转化方案包括电穿孔、醋酸锂方法和使用原生质球。在说明性的方面,表达的核酸编码序列可为异源核酸编码序列。如本文所使用的,异源编码序列定义为人造或合成的核酸或源自与启动子序列的来源物种不同的物种的核酸。因此,异源编码序列与本文所述启动子的连接不天然发生。
在多个实施方案中,转化的酵母细胞可通过包括分批和连续发酵在内的技术在液体培养基中或在半固体培养基或固体培养基上生长。通常,本文所使用的“允许蛋白质表达的条件”意指酵母在液体培养基中分批或连续发酵的条件,但并不排除在半固体培养基例如琼脂上生长。用于酵母细胞的培养基为本领域所已知并且通常添加有碳源(例如,葡萄糖)。典型的酵母培养基为包含酵母提取物(10克)、Bacto蛋白胨(20克)和葡萄糖(20克)的YPD肉汤(SunriseScienceProducts,Inc.)。在一个说明性的方面,转化的酵母细胞可在特定时期内在控制pH的环境(pH约6)中并将碳源(例如,葡萄糖)连续维持在已知支持酵母细胞生长至期需密度的预定水平于30℃需氧生长。
在一个说明性实施方案中,提供生产蛋白质的方法。所述方法包括在培养基中培养含有包含与编码蛋白质的异源编码序列操作性连接的SEQIDNO:1-2中任一个的分离核酸或其片段的第一表达盒的宿主细胞的步骤,其中所述培养在允许该蛋白质表达的条件下进行。所述方法可进一步包括从所培养的宿主细胞的培养基纯化蛋白质的步骤。如本文所使用的,“表达盒”意指指导酵母细胞制造RNA的表达载体元件。表达盒至少包括调节序列(例如,启动子)和用于RNA与蛋白质的编码序列(即,开放阅读框,ORF)。分离核酸可为与SEQIDNO:1-2中任一个的分离核酸或其片段具有至少80%、至少85%、至少90%、92%、95%、96%、97%、98%或99%的同源性。在多个说明性的方面,蛋白质编码序列可来自细菌、酵母、真菌或病毒。
在该方法实施方案中,蛋白质可使用第一表达盒与第二表达盒组合表达。在另一个实施方案中,第二表达盒可包含:1)与具有包含SEQIDNO:3或SEQIDNO:4的序列或任何其它已知甲醇-调节启动子(例如AOX1、AOX2、FLD或DAS启动子)序列的序列的分离核酸操作性连接的编码蛋白质的异源编码序列,其中SEQIDNO:3和SEQIDNO:4具有启动子活性;或2)与编码蛋白质的异源编码序列操作性连接的SEQIDNO:1-2中任一个的分离核酸或其片段。
在又一个实施方案中,蛋白质可使用第一表达盒、第二表达盒和第三表达盒表达。在另一个说明性的方面,第三表达盒可包含:1)与具有包含SEQIDNO:3或SEQIDNO:4的序列或任何其它已知甲醇-调节启动子(例如AOX1、AOX2、FLD或DAS启动子)序列的序列的分离核酸操作性连接的编码蛋白质的异源编码序列,其中SEQIDNO:3和SEQIDNO:4具有启动子活性;或2)与编码蛋白质的异源编码序列操作性连接的SEQIDNO:1-2任一个的分离核酸或其片段。
在另一个实施方案中,可使用任何数目的额外表达盒,并且表达盒可包含:1)与具有包含SEQIDNO:3或SEQIDNO:4的序列或任何其它已知甲醇-调节启动子(例如AOX1、AOX2、FLD或DAS启动子)序列的序列的分离核酸操作性连接的编码蛋白质的异源编码序列,其中SEQIDNO:3和SEQIDNO:4具有启动子活性;或2)与编码蛋白质的异源编码序列操作性连接的SEQIDNO:1-2中任一个的分离核酸或其片段。在另一个实施方案中,如上所述的第一表达盒、第二表达盒和第三表达盒连同第四表达盒、第五表达盒和第六表达盒一起用于所述方法中,其中所有的表达盒均包含与编码蛋白质的异源编码序列操作性连接的SEQIDNO:1-2中任一个的分离核酸或其片段。
在又一个实施方案中,提供生产一种或多种蛋白质的方法。所述方法包括在培养基中培养包含第一表达盒、第二表达盒和任选一个或多个额外表达盒的宿主细胞的步骤,其中每个表达盒包含:1)与具有包含SEQIDNO:3或SEQIDNO:4的序列或任何其它已知甲醇-调节启动子(例如AOX1、AOX2、FLD或DAS启动子)序列的序列的分离核酸操作性连接的编码一种或多种蛋白质的异源编码序列,其中SEQIDNO:3和SEQIDNO:4具有启动子活性;或2)与编码一种或多种蛋白质的异源编码序列操作性连接的SEQIDNO:1-2中任一个的分离核酸或其片段,其中所述培养在允许该一种或多种蛋白质表达的条件下进行。所述方法可进一步包括从所培养的宿主细胞的培养基中纯化该一种或多种蛋白质之一的步骤。
在前述两个段落中所描述的任何实施方案中,分离核酸可为与SEQIDNO:1-2中任一个的分离核酸或其片段具有至少80%、至少85%、至少90%、92%、95%、96%、97%、98%或99%的同源性。在前述两个段落中所描述的任何实施方案中,表达盒可被包含在一个表达载体或多个表达载体中。在前述两个段落中所描述的任何实施方案中,并有表达盒的表达载体可为自主复制或整合入宿主细胞基因组的载体。
在多个说明性实施方案中,本文所述与启动子操作性连接的任何异源编码序列所编码的蛋白质可为选自毒素、抗体、激素、酶、生长因子、细胞因子、结构蛋白、免疫原性蛋白(例如,疫苗抗原)和细胞信号传导蛋白的蛋白质。在一个实施方案中,蛋白质为用于动物饲料的酶。在该实施方案中,蛋白质可选自植酸酶、甘露聚糖酶、半乳糖苷酶、淀粉酶、葡聚糖酶、纤维素酶、蛋白酶和木聚糖酶。在另一个实施方案中,蛋白质可为可用于糖基化的酶。在另一个方面,通过使用多个表达盒(每个含有与启动子操作性连接的异源编码序列),可表达不止一种的蛋白质。然而,这些蛋白质实例为非限制性的,并且能够在酵母中表达的任何蛋白质、肽或多肽均可根据本文所述的分离核酸、表达载体、宿主细胞、DNA构建体、方法和分离蛋白质表达。上述酶可来自任何物种(例如,真菌物种,如酵母物种)。
用于根据本发明使用的酵母-表达蛋白质可通过常规技术以纯化形式生产。如本文所使用的,“分离蛋白质”意指纯化的蛋白质。纯化蛋白质基本上不含其它酵母细胞污染物或来自培养基的污染物。例如,“基本上不含”其它酵母细胞污染物或来自培养基的污染物意指蛋白质为至少约60%纯的、至少约70%纯的、至少约80%纯的、至少约90%纯的、至少约95%纯的、至少约98%纯的、约60%纯的、约70%纯的、约80%纯的、约90%纯的、约95%纯的或约98%纯的(所有均基于干重)。通常,蛋白质被分泌入酵母培养基并且从培养基中收集。
在一个说明性实施方案中,为了从培养基中纯化,蛋白质可例如进行硫酸铵沉淀,随后进行DEAE-Sepharose柱色谱。在其它实施方案中,可使用本领域技术人员已知的常规技术,例如硫酸铵或乙醇沉淀、酸提取、凝胶过滤、阴离子或阳离子交换色谱、DEAE-Sepharose柱色谱、羟基磷灰石色谱、凝集素色谱、亲和色谱、溶剂-溶剂萃取、超滤和HPLC。
或者,可能不需要纯化步骤,因为蛋白质在培养基中可能以蛋白质在培养基中为基本上纯的高浓度存在(例如,70-80%纯的)。在一个实施方案中,通过冷却酵母培养物(例如至约4℃-约8℃)并使用诸如离心、微孔过滤和旋转式真空过滤的技术去除酵母细胞,从培养基中收集蛋白质而无进一步纯化步骤。然后可将无细胞培养基中的蛋白质通过诸如超滤和切向流过滤的技术浓缩。
在蛋白质不分泌入培养基的一些实施方案中,可例如通过超声处理、热或化学处理裂解酵母细胞,并离心匀浆以去除细胞碎片。然后可使上清液经受硫酸铵沉淀以及根据需要额外的分级分离技术(例如凝胶过滤、离子交换色谱、DEAE-Sepharose柱色谱、亲和色谱、溶剂-溶剂萃取、超滤和HPLC)以纯化蛋白质。应理解的是,上述用于从培养基或从裂解的酵母细胞中纯化蛋白质的纯化方法为非限制性的,若需要这样的技术以获得基本上纯的蛋白质,可使用本领域技术人员已知的任何纯化技术纯化酵母-表达的蛋白质。
可根据本发明制备所纯化蛋白质制备物的多种制剂。在一些实施方案中,蛋白质可通过添加其它蛋白质(例如,明胶和脱脂奶粉)、化学剂(例如,甘油、聚乙二醇、EDTA、山梨酸钾、苯甲酸钠以及还原剂和醛类)、多糖、单糖、脂类(氢化植物油)等稳定。在一个实施方案中,可将用于添加到食物产品或动物饲料掺和物中的蛋白质干燥(例如,喷雾干燥、滚筒干燥和冻干法)并通过已知方法配制为粉末、颗粒、丸剂、矿物块、液体和凝胶。在一个实施方案中,可使用胶凝剂例如明胶、藻酸盐、胶原、琼脂、果胶和角叉菜胶。
在备选的实施方案中,蛋白质表达可以是为了胞内表达,例如为了酵母中生物转化过程的酶促作用,或为了在酵母细胞表面展示。对于这样的实施方案,如本文所述表达的蛋白质未进行纯化。
在多个实施方案中,上述蛋白质选自毒素、抗体、激素、酶、生长因子、细胞因子、结构蛋白、免疫原性蛋白(例如疫苗抗原)和细胞信号传导蛋白。在另一个实施方案中,上述蛋白质选自抗体、激素、酶、生长因子、细胞因子、结构蛋白、免疫原性蛋白(例如,疫苗抗原)和细胞信号传导蛋白。在又一个实施方案中,可根据本发明使用蛋白质、其片段、融合蛋白质(例如,嵌合蛋白质)或肽的编码序列。在另一个实施方案中,可表达修饰的蛋白质,例如突变的蛋白质或含非天然氨基酸的蛋白质。
在一个实施方案中,毒素可为蛋白质(例如,肉毒杆菌毒素或vero毒素-1),并且使用本文所述方法、分离核酸、表达载体、宿主细胞和DNA构建体制备后,可使用靶向剂修饰毒素以使它们特异性地指向患病细胞。在另一个说明性的方面,抗体可为人源化抗体、未人源化的抗体、纳米抗体或抗体片段,例如抗体的Fab片段或单链抗体。在另一个实施方案中,激素可为例如促性腺激素、促肾上腺皮质激素、生长激素、加压素、催产素、生长抑素、胃泌素或瘦素。在另一个说明性实施方案中,生长因子可为胰岛素、表皮生长因子、成纤维细胞生长因子、血管内皮生长因子、红细胞生成素、血小板衍生生长因子、血小板生成素或骨形态发生蛋白。在一个方面,细胞因子可为IL-2、IFN-α、IFN-γ或GM-CSF。在一个实施方案中,蛋白质不是丝毒素(silktoxin)。在另一个说明性方面,疫苗蛋白可为在患者或动物中具有免疫原性的任何合适疫苗蛋白,包括但不限于作为实例的HPV蛋白(例如HPV16和HPV18)和破伤风疫苗蛋白。在另一个说明性实施方案中,酶可为例如本文所讨论的用于动物饲料的酶、乙酰胆碱酯酶、环氧合酶或可在酵母中表达的任何其它有用酶。在另一个实施方案中,可表达结构蛋白,例如导素、肌动蛋白结合蛋白或肌球蛋白,并且在另一个实施方案中,可使用本文所述方法、分离核酸、表达载体、宿主细胞和DNA构建体表达细胞信号传导蛋白,例如ras蛋白、激酶、ErbB2蛋白(Her-2受体)。
在一个实施方案中,蛋白质为用于动物饲料的酶。在该实施方案中,蛋白质可选自植酸酶、甘露聚糖酶、半乳糖苷酶、淀粉酶、葡聚糖酶、纤维素酶、蛋白酶和木聚糖酶或其组合。例如,可根据本文所述方法表达多种植酸酶。可根据本发明表达的示例性植酸酶基因(即,植酸酶编码序列)为衍生自细菌、丝状真菌、植物和酵母的植酸酶基因,例如衍生自大肠杆菌的appA(GeneBank登录号M58708)和appA2(GeneBank登录号250016)基因以及衍生自真菌黑曲霉(Aspergillusniger)的phyA和phyB基因,或这些基因的保留或具有改善的肌醇六磷酸磷酸水解酶活性的任何突变体(参见例如Rodriguez等,Arch.ofBiochem.andBiophys.382:105-112(2000),通过引用结合到本文中)。示例性的α-和β-半乳糖苷酶基因来自曲霉(Aspergillus)物种(例如,洋葱曲霉(Aspergillusalliaceus)、米曲霉(Aspergillusorzae)、构巢曲霉(Aspergillusnidulans)、寄生曲霉(Aspergillusparasiticus)和黑曲霉(Aspergillusniger))。还可根据本发明表达置换、缺失和截短的植酸酶基因或其片段。
在一个实施方案中,使用本文所述方法表达的蛋白质可用于包含动物饲料掺和物的动物饲料。在多个实施方案中,可使用本领域已知的任何动物饲料掺和物,例如菜籽粉、棉籽粉、大豆粉和玉米粉。任选的动物饲料掺和物成分包括糖和复合碳水化合物,例如水溶性和水不溶性单糖、二糖和多糖。可添加到饲料掺和物的任选氨基酸成分为精氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、苏氨酸、色氨酸、缬氨酸、酪氨酸乙基HCl、丙氨酸、天冬氨酸、谷氨酸钠、甘氨酸、脯氨酸、丝氨酸、半胱氨酸乙基HCl和类似物及其盐。可任选添加的维生素为硫胺素HCl、核黄素、吡哆醇HCl、尼克酸、烟酰胺、肌醇、氯化胆碱、泛酸钙、生物素、叶酸、抗坏血酸和维生素A、B、K、D、E等。还可添加矿物质、蛋白质成分(包括从肉粉或鱼粉获得的蛋白质)、液体或粉末鸡蛋、鱼汁、乳清蛋白质浓缩物、油类(例如,大豆油)、玉米淀粉、钙、无机磷酸盐、硫酸铜、盐和石灰石。还可添加抗氧化剂。
在另一个实施方案中,提供含有包含SEQIDNO:1-SEQIDNO:2的分离核酸或其片段的表达载体的试剂盒。在一个说明性的方面,分离核酸或其片段可与SEQIDNO:1-SEQIDNO:2的分离核酸或与其片段具有80%、85%、90%、92%、95%、96%、97%、98%或99%同一性。在多个说明性实施方案中,片段可为约50个核苷酸长、约100个核苷酸长、约200个核苷酸长、约300个核苷酸长、约400个核苷酸长、约500个核苷酸长、约600个核苷酸长、约700个核苷酸长、约800个核苷酸长或约900个核苷酸长。在其它实施方案中,片段可从SEQIDNO:1-2中任一个的分离核酸的3’末端上游延伸约50个核苷酸、约100个核苷酸、约200个核苷酸、约300个核苷酸、约400个核苷酸、约500个核苷酸、约600个核苷酸、约700个核苷酸、约800个核苷酸或约900个核苷酸。在另外的实施方案中,片段可包含SEQIDNO:1-2的每个中所存在的TATA盒序列的上游和/或下游的约50个核苷酸、约100个核苷酸、约200个核苷酸、约300个核苷酸或约350个核苷酸。
在一个实施方案中,试剂盒中包含的表达载体(即,含有异源启动子)可具有本文所述的任何其它元件,例如选择标志物、克隆位点如多克隆位点、增强子、终止序列、信号肽序列等。在另一个方面,表达载体可为自主复制或整合入宿主细胞基因组的载体。在另一个实施方案中,表达载体可为环化或线性化的(即,用限制酶消化以使目的基因可容易地克隆入表达载体)。在另一个实施方案中,试剂盒可包含表达载体和编码表达标志物或对照基因的对照ORF(例如,编码LacZ-α片段的ORF),其用作对照显示该表达载体是有能力与目的基因连接和使用的。
在另一个说明性实施方案中,试剂盒可含有包含环状表达质粒的管。在另一个实施方案中,试剂盒可包含具有用限制酶消化而容易克隆目的基因的线性表达载体的管。在一个实施方案中,管可为灭菌的。在这些实施方案的任一个中,试剂盒还可包含环状或线性表达载体和编码表达标志物或对照基因的对照ORF(例如,编码LacZ-α片段的ORF),其用作对照显示该表达载体可与目的基因连接和/或显示宿主细胞有能力转化。
在又一个实施方案中,试剂盒可包含多个不同的表达载体。在另一个实施方案中,多个不同的表达载体可包含相同的启动子,但包含不同的选择标志物,例如耐药物G418、诺尔丝菌素(Nat)、Zeocin、杀稻瘟素或潮霉素的基因。在该实施方案中,试剂盒还可包含在管或其它容器中的与相应载体分开的等份的药物(例如,G418、诺尔丝菌素(Nat)、Zeocin、杀稻瘟素或潮霉素)。
在上述任何试剂盒的实施方案中,分离核酸可由SEQIDNO.1-2中的任一个或其片段组成。短语“由……组成”意指SEQIDNO.所指定的序列除SEQIDNO.所对应的那些核苷酸序列外不含有额外的核苷酸序列。
在另一个说明性的方面,试剂盒可包含与表达载体一起使用的其它组分,例如用于转化酵母细胞的组分、用于将目的蛋白质编码序列掺入表达载体的限制酶、连接酶、用于纯化表达载体构建体的组分、缓冲液(例如,连接缓冲液)、使用说明书(例如,为了帮助克隆)和适合在试剂盒中用于制造和使用本文所述表达载体的任何其它组分。在另一个实施方案中,表达载体或试剂盒的任何其它组分可在密闭管(例如,灭菌或未灭菌的)或任何其它合适容器或包装(例如,灭菌或未灭菌的)中包含在试剂盒中。前述段落中所述包含表达载体的试剂盒含有包含与载体(其与启动子异源)操作性连接的本文所述启动子的表达载体(即,该组合不天然存在)。
下列实施例提供用于实施本发明实践的说明性方法。因此,这些实施例仅提供用于说明目的而不意在限制。
实施例
实施例1:启动子序列和含启动子质粒的制备
测量巴斯德毕赤酵母mRNA水平的微阵列“芯片”由Affymetrix(Affymetrix,Inc.)使用JamesCregg博士提供的毕赤酵母基因组DNA序列制造。微阵列芯片用来自在不同碳源上生长的酵母培养物的RNA样品探查,碳源包括甲醇、甘油和乙醇。在对数中期的各个时间点收获培养物,并冷冻用于后续RNA分离,如Affymetrix所建议。接着是用于探查Affymetrix微阵列的标准Affymetrix方案。
通过玻璃珠破坏/苯酚提取/LiCl沉淀方法,自各细胞样品提取总RNA。将RNA转化成cDNA并随后扩增和标记以探查Affymetrix芯片。使标记的cDNA与Affymetrix巴斯德毕赤酵母微阵列芯片杂交,并使用Affymetrix软件评价。数据分析鉴定了由甲醇(相对于甘油)诱导的基因或在大多数条件下表达(即组成型表达)的基因,如在表1所示。
表1列举了所指示基因的相对mRNA水平,比较来自在具有甲醇、甘油或乙醇作为碳源的培养基上生长的巴斯德毕赤酵母细胞的启动子活性。
表1.启动子的相对活性
图6显示pUPP、TEF2、Chr1-0469、GAP、AOX1和DAS的相对启动子活性,使用碳源甲醇(每组柱的最左边的柱)、甲醇饥饿(每组柱从左边起第二个柱)、甘油(每组柱从左边其第三个柱)和乙醇(每组柱的最右边的柱)。推定的蛋白质是UPP和Chr1-0469启动子的ORF。
克隆来自两个组成型表达基因的启动子并用报告载体检验。所有报告质粒不存在驱动报告分子ORF的表达的启动子元件;或者,利用II型限制酶(即BsaI)实施克隆方案以引入DNA片段(启动子)至ORF的上游。所有构建体在报告分子ORF的终止密码子后包含相同的3’AOX1转录终止子序列。
一个报告质粒pTZ-GFP是pJAZ(zeocin抗性作为选择标志物)的衍生物,其没有AOX1启动子,但具有绿色荧光蛋白(GFP)ORF作为胞内表达的报告基因。第二组报告质粒包含zeocin或G418抗性的选择标志物基因和作为胞内表达的报告分子的曲霉α-半乳糖苷酶或β-半乳糖苷酶ORF。第三组报告质粒具有与磷酸酶(植酸酶)的大肠杆菌appA2编码序列融合在框内的酿酒酵母(S.cerevisiae)前-原-α交配因子(aMF)分泌信号,作为报告分子ORF。没有在报告分子ORF的上游引入具有启动子活性的序列的情况下,报告质粒序列都没有在巴斯德毕赤酵母中表达。
来自UPP和Chr1-0469基因的两个最具活性的组成型启动子由功能未知的ORF的“上游”约1000bp的DNA组成。这些启动子序列使用PCR引物和巴斯德毕赤酵母基因组DNA扩增。PCR产物的序列经证实,然后连接至报告质粒中。使用在启动子侧翼的引物中策略性安置的BsaI位点,克隆UPP启动子。Chr1-0469启动子包含BsaI和BsmBI的识别位点;因此,通过PCR-变性-退火程序产生克隆末端。简言之,用两组引物扩增启动子。PCR产物表示两个几乎相同的双链DNA分子,除了末端偏移了4bp(一个自5’-末端短4个核苷酸和自3’-末端长4个核苷酸,而另一个自5’-末端长4个核苷酸和自3’-末端短4个核苷酸)。将两种不同的PCR产物混合,变性和退火,产生在分子的每个末端具有合适的4碱基单链延伸的启动子分子(“粘性”末端以利于克隆)。通过BsaI消化或通过PCR-变性-退火产生的克隆末端与报告质粒中产生的末端互补。将调节巴斯德毕赤酵母AOX1和GAP1基因的启动子引入相同的报告构建体作为对照。
通过用特异性限制酶消化将启动子特异性质粒构建体线性化,并通过电穿孔引入野生型巴斯德毕赤酵母细胞。含有整合至宿主菌株基因组的质粒DNA的转化体在具有zeocin或G418的YPD琼脂上筛选。来自转化体的单菌落经纯化(再次在选择性板上),然后在YPD母板上收集多个克隆。这些母板经复制铺板至一系列具有含以下化合物之一作为巴斯德毕赤酵母细胞生长的唯一碳源的琼脂培养基的诊断板上:葡萄糖(即右旋糖)、甘油、甲醇或乙醇(全都为1%w/v)。将板在30℃孵育20-44小时,然后评分。
实施例2:测定转化体中的GFP表达
比较各种转化体之间GFP表达的相对水平。在该实施例中,使用透照灯将复制板暴露于UV光,并通过直接显像比较不同菌株的荧光强度。没有GFP表达的毕赤酵母细胞(阴性菌落)在UV光照下未显示GFP荧光。观察到的荧光强度与GFP表达的增加相关。
图5是各种转化体在具有不同碳源的复制板上的GFP表达的实例。各子图中不同毕赤酵母启动子菌株的位置相同,并且“YPD母板”子图通过它们的启动子命名标示了菌株的位置:AOX1、pUPP、GAP1、0001、0002、0003、0004、0005、0006、0007和载体(模拟物对照)。图5的下部分标记为“通过Dex、Gly、MeOH或EtOH诱导的GFP的表达”,显示用于各子图的碳源分别是右旋糖(D)、甘油(G)、甲醇(M)或乙醇(E)。数据显示,在测试条件下UPP启动子与GAP启动子一样强或比其更强,并且在大多数测试条件下比AOX启动子更强。
实施例3:测定转化体的α-和β-半乳糖苷酶的相对活性
使用PCR引物和巴斯德毕赤酵母基因组DNA扩增UPP启动子和Chr1-0469启动子序列(用于扩增启动子片段的正向引物序列显示于图8)。PCR产物的序列经证实,然后连接至α-GAL报告质粒(图7)。将调节巴斯德毕赤酵母GAP、TEF2、DAS和AOX1ORF的启动子引入至相同的报告质粒中作为对照。使用位于插入片段上游(正向引物)和α-半乳糖苷酶ORF的5’区(反向引物)的质粒特异性引物,以两个方向,通过测序整个插入物证实插入的启动子片段的序列。启动子特异性质粒构建体通过用特异性限制酶消化而线性化,并通过电穿孔引入至野生型巴斯德毕赤酵母细胞,选择含有整合至宿主菌株基因组的质粒DNA的转化体。将来自良好分离的单菌落转化体的细胞纯化,并在YPD母板上收集和在30℃孵育。然后将母板复制铺板至一系列具有含有以下化合物之一作为巴斯德毕赤酵母细胞生长的唯一碳源和α-X-Gal生色底物的琼脂培养基的诊断板:葡萄糖(即右旋糖)、甘油、甲醇或乙醇(全都为1%w/v)。这些板然后在30℃孵育44小时(图9)。
不同启动子-α-半乳糖苷酶报告基因构建体的表达水平通过自YPD琼脂板的α-半乳糖苷酶的观察结果来测定,YPD琼脂板用100mM磷酸盐缓冲液pH6.5和作为生色底物的α-X-GAL制成。报告分子活性作为在细胞中或细胞周围的蓝色产物检测。用UPP和Chr1-0469启动子证实报告分子活性。
图9中的启动子命名对应于Chr1-0469启动子(SEQIDNO:1)和UPP启动子(SEQIDNO:2),各启动子片段的长度用等于巴斯德毕赤酵母基因组的相应基因的ATG起始密码子的A的+1位置指示(因此,启动子序列为-1至-1500)。其它巴斯德毕赤酵母启动子的片段以及没有任何启动子序列的报告载体用作对照。转化体在含有X-α-GAL、α-半乳糖苷酶的生色底物和所示四种碳源之一的琼脂板上孵育。图9子图A中的板A和B分别复制铺板于不同碳源的板A和B上,分别如图9子图B和C所示。因此,板A和B在图9子图A中的命名分别指图9子图B和C。NO:1和NO:2的符号是指SEQIDNOS:1和2(即用于表达α-半乳糖苷酶的启动子)。各启动子的α-半乳糖苷酶表达水平显示于下文对各个碳源标为板A和板B的表中。α-半乳糖苷酶的表达水平显示为0、+1、+2、+3、+4和+5,表达水平从0至+5增加。
类似地,β-半乳糖苷酶ORF用于在巴斯德毕赤酵母转化体中分析具有Chr1-0469启动子和UPP启动子序列的报告构建体表达。在这些实验中,来自β-半乳糖苷酶报告基因的表达水平在具有β-X-GAL作为生色底物的板上测定。还用UPP和Chr1-0469启动子两者证实了具有β-半乳糖苷酶ORF的报告分子活性。
相对α-半乳糖苷酶表达,板A,来自图9
相对α-半乳糖苷酶表达,板B,来自图9
实施例4:测定转化体的植酸酶活性
在各转化体中测定植酸酶活性水平。板上的琼脂培养基补充有100mM磷酸盐缓冲液pH6.5和植酸钙。植酸酶活性起作用将不透明的胶状植酸钙物质转化成透明的物质,在表达和分泌磷酸酶(植酸酶)的菌落周围形成透明的光圈。细胞的植酸酶表达增加导致酶分泌增加,如通过细胞菌落周围所观察到的更宽的光圈所证实。用UPP和Chr1-0469启动子证实了报告分子活性(图10)。在图10中,在由与编码大肠杆菌appA2植酸酶的DNA融合在框内的酿酒酵母前-原α因子组成的ORF上游,克隆包含启动子序列GAP、Chr1-0469启动子(SEQIDNO:1)和UPP启动子(SEQIDNO:2)的转化体。将细胞点到具有植酸钙和葡萄糖或甲醇的诊断板上,并在30℃孵育27小时。各启动子的植酸酶表达水平标记为0、+1、+2、+3、+4和+5,表达水平从0至+5增加。植酸酶表达的相对水平在下表中显示,其中No:1和No:2分别表示SEQIDNO:1和SEQIDNO:2。
表X
来自图10的相对植酸酶活性