刺糖多孢菌染色体的基因整合优先权
本申请要求2011年5月3日提交的美国专利申请系列号为13/100,220
的“刺糖多孢菌染色体的基因整合”的申请日的权益。
技术领域
本发明应用于分子遗传学技术领域,其中,基因可以整合入刺糖多孢
菌(Saccharopolyspora spinosa)的染色体。一种关键的代谢工程方法是在对多
杀菌素产生或生长几乎没有到没有负面影响的染色体DNA区域整合和表达
靶基因。
背景技术
正如美国专利No.5,362,634公开的,发酵产物A83543是由剌糖多孢菌
(Saccharopolyspora spinosa)产生的相关化合物家族。该家族的已知成员被称
作因子或组分,而且每一个都给予标识字母命名。在下文中这些化合物指
多杀菌素A、B等。多杀菌素化合物对于防治蜘蛛、线虫类及昆虫,尤其是
鳞翅目(Lepidoptera)、双翅目(Diptera)物种。这些化合物被认为对环境友好,
具有有吸引力的毒理学谱(toxicological profile)。
这些天然产生的多杀菌素化合物是大环内酯类,由附接有两个脱氧糖
的21-碳四环内酯组成,所述两个脱氧糖为一个中性糖(鼠李糖)和一个氨基糖
(福乐糖胺(forosamine))(参见Kirst等,(1991))。如果氨基糖不存在,将该化
合物称为假糖苷配基(pseudoaglycones)A、D等,如果中性糖不存在,则将
该化合物称为反式假糖苷配基(reverse pseudoaglycones)A、D等。更优选的
命名法将假糖苷配基称为多杀菌素A17-Psa、多杀菌素D17-Psa等,而将反
式假糖苷配基称为多杀菌素A9-Psa,多杀菌素D9-Psa等。
天然产生的多杀菌素化合物可通过刺糖多孢菌菌株NRRL18395、
18537、18538、18539、18719、18720、18743和18823以及由此而来的衍生
物发酵产生。已经保藏了这些培养物并使其成为美国农业部农业研究服务
部门中西部地区北方区域研究中心(北方大学街道1815号,皮奥里亚,I11.,
61604)的原种培养物保藏的一部分。
美国专利No.5,362,634以及相应的欧洲专利号0375316B1涉及多杀菌
素A、B、C、D、E、F、G、H和J。据称这些化合物通过培养选自NRRL18395、
NRRL18537、NRRL18538和NRRL18539的新的微生物剌糖多孢菌的菌株
产生。
WO93/09126涉及多杀菌素L、M、N、Q、R、S和T。其中还讨论了
两种产生多杀菌素J的菌株:NRRL18719和NRRL18720,和一种产生多杀
菌素Q、R、S和T的菌株:NRRL18823。
WO94/20518和美国专利No.5,670,486涉及多杀菌素K、O、P、U、V、
W和Y及其衍生物。其中也讨论了产多杀菌素K的菌株NRRL18743。
生产多杀菌素化合物的挑战源自需要鉴定并验证刺糖多孢菌基因组中
的中性位点,其中包含基因表达盒的多核苷酸能够整合并稳定表达。在其
他会赋予现存多杀菌素产生菌株新的有益特征的基因表达盒之外,引入的基
因表达盒可含有生物合成基因,所述生物合成基因提供产生可具有不同杀虫
活性谱的新的多杀菌素衍生物的方法,或能增加多杀菌素的滴度水平的基因
表达盒。鉴定和引入导致多杀菌素化合物的产生增加的基因会是有利的。
使用中性位点也会是有利的,其中稳定的整合对多杀菌素产生、生长或其
他期望的代谢特征造成很少的负面影响或没有负面影响。
发明内容
本发明提供鉴定和验证刺糖多孢菌基因组中性位点的方法,其中含有
至少一种基因表达盒的新的多核苷酸能够整合并稳定表达。
本发明的一些实施方案包括刺糖多孢菌基因组中的中性位点的鉴定和
验证,其中含有至少一种基因表达盒的新的多核苷酸能够整合并在后代中
稳定表达。
本发明的实施方案也可包括使用遮蔽蛋白聚酮合成酶(obscurin
polyketide synthase;PKS)基因座作为中性位点用于在刺糖多孢菌基因组中整
合外源或天然的含有基因表达盒的多核苷酸。更具体地说,在不负面影响多
杀菌素产生、生长或其他期望的代谢特征的情况下,可以破坏遮蔽蛋白聚酮
合成酶(PKS)基因座的obsA基因。
本发明的其他方法包括将多核苷酸整合入刺糖多孢菌菌种的染色体
DNA中,该方法可用于产生杀虫剂、其整合体,并且还可用于整合体的应
用。
本发明的一些实施方案可包括鉴定刺糖多孢菌基因组中任何中性位点
以及稳定表达的含有基因表达盒的多核苷酸的整合的方法。
本发明的其他实施方案可包括将多核苷酸整合入刺糖多孢菌基因组中
而不负面影响多杀菌素产生、生长或其他期望的代谢特征。
本发明的其他实施方案可包括将含有基因表达盒的多核苷酸整合入刺
糖多孢菌基因组中,所述多核苷酸的表达导致增加的多杀菌素产生。
附图简述
图1描绘了将粘粒克隆的末端序列定位到遮蔽蛋白基因簇上。显示重叠
的粘粒克隆。实心竖条表示相对于遮蔽蛋白基因簇的粘粒克隆1E3和粘粒
克隆2N14中插入物的实际大小。虚线表示只有一个粘粒末端在遮蔽蛋白基
因簇中。
图2描绘了质粒pIJ773,其含有阿泊拉霉素抗性表达盒(标记为aac(3)
IV)。
具体实施方式
对于用于多杀菌素菌株改善的代谢工程有用的分子工具包括鉴定和验
证剌糖多孢菌基因组中可以引入基因表达盒的中性位点。中性位点定义为
基因组中的DNA区域,其对刺糖多孢菌初级代谢活性、多杀菌素产生以及
其他期望的特征具有很少的负面影响或没有负面影响。鉴定的中性位点意
图用于稳定整合和表达对于刺糖多孢菌为天然或异源的靶基因,其可以包
括:i)将有益的特征引入现有的多杀菌素产生菌株,如异源血红蛋白基因的
表达;ii)改善现有的多杀菌素产生菌株的特定特征(例如改善由假糖苷配基
到多杀菌素的生物转换);iii)在不同的中性位点引入同一基因的多个拷贝,
从而最大化靶基因的益处并确保工程化重组菌株的稳定性;或iv)引入多个
靶基因以同时消除两个或更多个控制多杀菌素生物合成和产生的限速步骤
的瓶颈。刺糖多孢菌中对于生物体的初级代谢活性非关键性的次级代谢途
径表现为有吸引力的中性位点来源。在这些中,非多杀菌素聚酮合成酶基因
簇尤其受到关注,因为破坏该基因簇可能导致多杀菌素生物合成和产生所
必需的常见乙酰CoA前体和辅因子的潜在竞争途径的消除。这可在靶基因
的益处和增加的前体可使用性间产生协同作用。
在刺糖多孢菌染色体中整合的基因有很多不同的用途。无论天然或异
源的克隆基因,均可以用于改善多杀菌素的产量和产生新的多杀菌素。通
过在特定菌株的基因组中整合双重拷贝的基因以克服该菌株中限速的酶来
获得改善的产量。在有些情况下,由于缺少所需的酶使特定突变菌株中的生
物合成途径被阻断,而通过整合所需基因的拷贝可以恢复期望的多杀菌素
的产生。在生物合成途径遭破坏的其他情况下,可以产生不同的前体菌株。
本文使用的下列定义将用作参考来解释权利要求和说明书。
如本文使用的,本发明中元件或组分前的不定冠词“一/一个/一种”针对
该元件或组分的出现(如发生)数量意图为非限制性的。因此,“一/一个/一
种”应当被解读为包括一个/一种或至少一个/至少一种,并且元件或组分的
单数形式也包括复数,除非该数明显表示单数。
如本文使用的,术语“包含”和“包括”意指存在如权利要求中涉及的规定
的特征、整体(integer)、步骤或组分,但不排除存在或增加一个或多个其他
特征、整体、步骤、组分或其组合。这意味着“包含”或“包括”一系列元件的
组合物、混合物、过程/工艺、方法、物品或装置不限于这些元件,而是可能
包括其他未明确列出的或其固有的元件。如本文使用的,“或”指相容的和互
斥的“或”。例如,以下任何一种都满足条件A或B:A为真(或存在的)且B
为伪(或不存在的),A为伪(或不存在的)且B为真(或存在的),以及A和B
均为真(或存在的)。
如本文使用的,术语“约”修饰本发明中的成分或反应物的量,或是用于
指可能发生的数字量的变化,例如,经由在现实的世界中用于制备浓缩物或
使用溶液的典型测量和液体处理过程;经由这些过程中的意外错误;经由用
于制备组合物或实施方法的成分在制造、来源或纯度上的差异;等等。术语
“约”也包括由于从特定的初始混合物产生的组合物的不同平衡条件而不同
的量。无论有或没有术语“约”修饰,权利要求都包括所述量的等效量。
如本文使用的,术语“发明”或“本发明”是非限制性术语,旨在包含如说
明书中描述的和权利要求中记载的所有可能的变化。
如本文使用的,术语“多肽”和“肽”会是可以互换使用的,用于指两个或
更多个氨基酸通过肽键连接在一起的聚合物。在一个方面,该术语也包括
多肽的表达后修饰,例如,糖基化、乙酰化、磷酸化等等。例如,含有一个
或多个氨基酸类似物或标记的氨基酸和肽模拟物(peptidomimetic)的肽包括
在该定义中。肽可能包含L-氨基酸。
如本文使用的,术语“目的肽”、“POI”、“基因产物”、“靶基因产物”和“靶
编码区基因产物”指由重组表达的外源基因编码的期望的异源肽/蛋白质产
物。目的肽可包括任何肽/蛋白质产物,其包括但不限于蛋白质、融合蛋白、
酶、肽、多肽和寡肽。目的肽的大小为长度范围从2到398个氨基酸。
如本文使用的,术语“遗传构建体”指一系列用于调节生物体基因型或表
型的连续核酸。遗传构建体的非限制性实例包括但不限于核酸分子、开放阅
读框、基因、表达盒、载体、质粒等等。
如本文使用的,术语“内源基因”指生物体基因组中在其天然位点的天然
基因。
如本文使用的,“外源基因”指正常情况下不存在于宿主生物体中,但通
过基因转移引入该宿主生物体中的基因。外源基因可包括插入到非天然生
物体的天然基因或嵌合基因。
如本文使用的,涉及特定生物体/基因组内的序列的术语“异源的”表明该
序列源自外源物种,或者,如果来自相同物种,则通过有意的人为干预实
质上进行了修饰而在组成和/或基因组位点上不同于其天然形式。因此,例
如,异源基因表达指通过将来自一种生物体/基因组的基因置于不同的生物体
/基因组中而表达该基因的方法。
如本文使用的,术语“重组体”指人工组合两个本来是单独的序列片段
(otherwise separated segments of sequence),例如,通过化学合成或通过遗传
工程技术操作分离的核酸片段。“重组体”还包括所提到的通过引入异源核
酸而经过修饰的细胞或载体,或衍生自这样修饰的细胞的细胞,但是不包括
通过自然发生事件(如,自发突变、天然转化、天然转导、天然转座)造成的
细胞或载体的改变,例如不存在有意的人为干预而发生的那些改变。
术语“遗传工程化的(genetically engineered)”和“遗传改变的”指科学改变
活生物体中遗传物质的结构。其牵涉重组DNA的产生和使用。更具体而
言,将其用于描述来自天然存在的生物体的经遗传工程化或修饰的生物体。
遗传工程化可以通过许多本领域已知的技术进行,诸如例如使用质粒、病毒
或其他载体进行的基因取代、基因扩增、基因破坏、转染、转化。遗传修
饰的生物体,例如遗传修饰的微生物,也经常称作重组生物体,如重组微生
物。
如本文使用的,术语“破坏的”或“破坏”在涉及基因时指已经通过遗传工
程化或通过改变该基因活性的天然原因而经过操作或修饰的基因。这样的基
因活性可以是增加的或减少的。此外,这样的破坏可能消除蛋白质功能。为
了促进这种减少,可以减少基因的拷贝数,诸如例如通过该基因的不足表
达(underexpression)或破坏该基因。与野生型基因相比,如果所述基因的转录
水平降低则称该基因为“表达不足的”。这可以通过例如量化mRNA量作为基
因表达的指示的Northern印迹分析来测量。如本文使用的,如果与从野生型
基因产生的mRNA量相比,产生的mRNA量减少了至少1%、2%、5%、10%、
25%、50%、75%、100%、200%或甚至大于500%,则基因是表达不足的。
或者,可使用弱启动子指导多核苷酸的表达。在另一个实施方案中,可以
改变基因上游的启动子、调节区和/或核糖体结合位点来实现降低的表达。表
达也可以通过减少信使RNA的相对半衰期来降低。在另一个实施方案中,
多肽的活性本身可以通过在多肽氨基酸序列中采用一个或多个减少活性的
突变来减少。例如,改变多肽对其相应底物的亲和力可导致活性减少。同
样,可减少多肽的相对半衰期。在有降低的基因表达或降低的活性的任一
情况下,可以通过改变细胞培养基的组成和/或用于培养的方法来实现所述降
低。如本文使用的“降低的表达”或“降低的活性”意指与野生型蛋白质、多核
苷酸、基因相比,或与该多核苷酸或多肽降低之前存在的蛋白质的活性和/
或浓度相比,至少5%、10%、25%、50%、75%、100%、200%或甚至超过
500%的减少。obsA基因组基因座的活性也可通过将蛋白质与其活性的特异
性或通用抑制剂接触来降低。在本文术语“降低的活性”和“减少或消除的活
性”可互换使用。
在另一个实施方案中,可以改变基因上游的启动子、调节区和/或核糖
体结合位点以实现增加的表达。过表达也可通过增加信使RNA的相对半衰
期来降低。在另一个实施方案中,多肽本身的活性可以通过在多肽氨基酸
序列中采用一个或多个增加活性的突变来增加。例如,改变多肽对其相应底
物的亲和力可导致增加的活性。同样,可增加多肽的相对半衰期。在有基
因过表达或增加的活性的任一情况下,可以通过改变细胞培养基的组成和/
或用于培养的方法来实现所述增加。如本文使用的“过表达”或“增加的活性”
意指与野生型蛋白质、多核苷酸、基因相比,或与该多核苷酸或多肽降低之
前存在的蛋白质的活性和/或浓度相比,至少5%、10%、25%、50%、75%、
100%、200%或甚至超过500%的增加。obsA基因组基因座的活性也可通过
将蛋白质与其活性的特异性或通用抑制剂接触来增加。在本文术语“过表
达”和“增加的活性”可互换使用。
表述“调控序列”概括地指启动子序列、核糖体结合位点、转录终止序列、
上游调节结构域、增强子等等,它们在宿主细胞中共同提供编码序列的转录
和翻译。并不是所有这些调控序列都始终需要存在于重组载体中,只要期望
的基因能够得到转录和翻译即可。
“重组”指两个DNA或RNA分子之间部分DNA或RNA序列的重排。“同
源重组”发生在两个DNA分子之间,所述两个DNA借助存在于每个DNA
分子中的同源的或互补的核苷酸序列杂交。
术语“严格条件”或“在严格条件下杂交”指在该条件下探针会优先与其靶
亚序列杂交,且较低程度或完全不与其他序列杂交。在核酸杂交实验如
Southern杂交和Northern杂交的语境中的“严格杂交”和“严格杂交洗涤条件”
是序列依赖性的,并且在不同的环境参数下是不同的。纽约埃尔塞维尔科学
出版社的Tiissen(1993)的《生物化学和分子生物试验技术》中第一部分第二
章的“用核苷酸探针杂交”中关于杂交原理和核苷酸探针测定法策略的概述
(Tijssen(1993)Laboratory Techniques in Biochemistry and Molecular
Biology-Hybridization with Nucleic Acid Probes part I chapter 2 Overview of
principles of hybridization and the strategy of nucleic acid probe assays,Elsevier,
New York)中有核苷酸杂交的详尽指南。一般来说,高严格杂交和洗涤条件
选择为低于在限定的离子强度和pH下特定序列的热解链温度(Tm)约5℃。
Tm指(在限定的离子强度和pH下)50%的靶序列杂交到完全匹配的探针的温
度。非常严格条件选择为与特定探针的Tm相等。
用于互补核酸的杂交(其在Southern或Northern印迹中的滤膜上具有超
过100个互补残基)的严格杂交条件的实例为,具有1mg肝素的50%甲酰胺,
在42℃,使杂交过夜进行。高严格洗涤条件的实例是在72℃,0.15M NaCl,
约15分钟。严格洗涤条件的实例是在65℃,0.2×SSC洗涤15分钟(关于SSC
缓冲液的描述参见,Sambrook等,(1989),分子克隆-实验室手册(第二版)1-3
卷,冷泉港实验室,冷泉港出版社,纽约(Sambrook et al.,(1989)Molecular
Cloning-A Laboratory Manual(2nd ed.)Vo1.1-3,Cold Spring Harbor
Laboratory,Cold Spring Harbor Press,NY))。通常,在高严格洗涤前为低严格
洗涤,以去除背景探针信号。用于例如超过100个核苷酸的双链体的中等严
格洗涤的实例是在45℃,1×SSC,15分钟。对于例如超过100个核苷酸的
双链体的低严格洗涤的实例是在40℃,4-6×SSC,15分钟。一般来说,在
特定的杂交测定法中,与对于不相关的探针观察到的相比为2x(或更高的)
信噪比表明检测到特异性杂交。在严格条件下彼此不杂交的核酸,如果它们
编码的多肽基本上相同,则仍为基本上相同的。这发生在,例如,当核酸拷
贝是使用遗传密码所允许的最大密码子简并性来产生的时。
本发明也涉及在严格条件下,优选在高严格条件下可与如本发明的多核
苷酸杂交的分离的多核苷酸。
如本文使用的,术语“杂交”旨在描述杂交和洗涤条件,在该条件下,
彼此至少约50%、至少约60%、至少约70%,更优选至少约80%,甚至更
优选至少约85%至90%,最优选至少95%同源的核苷酸序列通常保持彼此
杂交。
在一个实施方案中,本发明的核酸与本申请中所示的核酸序列或其互
补物为至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、
90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高同源
的。
严格杂交条件的另一个非限定性实例是,在约45℃在6×氯化钠/柠檬酸
钠(SSC)中杂交,随后在50℃,优选在55℃,更优选在60℃,并且甚至更
优选在65℃,在1×SSC、0.1%SDS中进行一次或多次洗涤。
高严格条件可包括在42℃温育数天的时间,如2-4天,使用标记的
DNA探针,例如洋地黄毒苷(DIG)标记的DNA探针,随后为在室温在
2×SSC、0.1%SDS中的一次或多次洗涤,和在65-68℃在0.5×SSC、0.1%SDS
或0.1×SSC、0.1%SDS中的一次或多次洗涤。具体而言,高严格条件包括,
例如,使用DIG标记的DNA探针(由例如使用DIG标记系统制备;罗氏诊
断有限公司,68298曼海姆,德国(Roche Diagonostics GmbH,68298
Mannheim,Germany)),在溶液中,如DigEasyHyb溶液(罗氏诊断有限公司
(Roche Diagonostics GmbH))(含有或不含100ug/ml鲑精DNA),或包含50%
甲酰胺、5×SSC(150mM NaCl、15mM柠檬酸钠)、0.02%十二烷基硫酸钠、
0.1%N-月桂酰肌氨酸和2%封闭试剂的溶液(罗氏诊断有限公司(Roche
Diagonostics GmbH)),在42℃温育2小时到4天,随后在室温在2×SSC和
0.1%SDS中洗涤滤膜2次,5-15分钟,然后再在65-68℃,在0.5×SSC和
0.1%SDS或0.1×SSC和0.1%SDS中洗涤两次,15-30分钟。
在一些实施方案中,在高严格条件下与本发明的核苷酸序列杂交的本
发明的分离的核酸分子可对应于天然存在的核酸分子。如本文使用的,“天
然存在的”核酸分子指具有自然界中存在的核苷酸序列的RNA或DNA分子
(例如,编码天然蛋白质)。
本领域技术人员会知道哪些条件适用于严格和高严格杂交条件。现有
技术中可以容易地获得关于这些条件的其他指导,例如,Sambrook等,
1989,分子克隆,实验室手册,冷泉港出版社,纽约(Sambrook et al.,1989,
Molecular Cloning,A Laboratory Manual,Cold Spring Harbor Press,N.Y.);和
Ausubel等(编辑),1995,分子生物学的通用流程(Current Protocols in
Molecular Biology),(John Wiley&Sons,纽约)。
含有多杀菌素生物合成酶基因的DNA的克隆片段会使在多杀菌素产生
中编码限速酶的基因能够加倍(duplication)。这能够用于在任何编码的活性
之一限制了期望的多杀菌素合成的情况中来提高产量。当多杀菌素聚酮合成
酶连锁的基因通过将含有它们的粘粒整合入刺糖多孢菌而加倍时,观察到多
杀菌素A/D的产量增加(Madduri等,2001)。在另一个实例中,在弗氏链霉
菌(Streptomyces fradiae)的发酵中,通过加倍编码限速甲基转移酶的基因实
现了这种类型的产量增加,所述甲基转移酶使大菌素转化为泰乐菌素(Baltz
等,1997)。
特定的中间体(或它们的天然衍生物)能够通过刺糖多孢菌的突变菌株合
成,在所述刺糖多孢菌的突变菌株中,已经破坏了某些编码多杀菌素生物
合成的酶的基因。这样的菌株可以通过经由同源重组整合含有靶基因的内
部片段的诱变质粒来产生。在质粒整合后,形成生物合成基因的两个不完
整拷贝,由此消除其编码的酶功能。这种酶的底物,或其一些天然衍生
物,应在该突变菌株发酵时积累。将这样的策略有效地用于生成产生新的
6-脱氧红霉素衍生物的红色糖多孢菌(Saccharopolyspora erythraea)菌株
(Weber和McAlpine,1992)。
这样的菌株可经由双交换同源重组通过与诱变质粒交换靶区产生,所
述诱变质粒含有在所述靶区侧翼的非突变序列之间的新片段。该杂合基因会
产生具有改变的功能的蛋白质,其或是缺少活性,或是实施新的酶促转
化。新的衍生物会在所述突变菌株发酵时积累。将这样的策略有效地用于
生成产生新的脱水红霉素衍生物红色糖多孢菌菌株(Donadio等,1993)。
克隆了多杀菌素生物合成基因和相关的ORF,并确定了各自的DNA序
列。克隆的基因和ORF在下文中命名为spnA、spnB、spnC、spnD、spnE、
spnF、spnG、spnH、spnI、spnJ、spnK、spnL、spnM、spnN、spnO、
spnP、spnQ、spnR、spnS、ORFL15、ORFL16、ORFR1、ORFR2、剌糖多
孢菌gtt、刺糖多孢菌gdh、刺糖多孢菌epi和刺糖多孢菌kre。
刺糖多孢菌产生统称为“多杀菌素”的9种密切相关的化合物的混合物。
在该混合物中,称为Spinosad的多杀菌素A和D是主要组分并具有针对关
键昆虫目标的活性。多杀菌素J和L,两种在多杀菌素混合物中的次要组
分,是乙基多杀菌素的前体,乙基多杀菌素是另一种多杀菌素类杀虫剂。
Spinosad是一种由Dow AgroSciences(Indianapolis,Ind.)生产的杀虫剂,
该杀虫剂主要含有约85%的多杀菌素A和约15%的多杀菌素D。多杀菌素A
和D是由刺糖多孢菌发酵产生的天然产物,如美国专利No.5,362,634中公
开的。Spinosad是可从Dow AgroSciences商购获得的数种杀虫制剂中的活性
成分,所述制剂包括TRACERTM、SUCCESSTM、SPINTORTM和
CONSERVETM昆虫防治产品。例如,TRACER产品包含约44%到约48%
Spinosad(w/v),或每加仑约4磅的Spinosad。已经确定了颗粒和液体制剂中
的多杀菌素化合物用于控制蜘蛛、线虫和昆虫,特别是鳞翅目
(Lepidoptera)、缨翅目(Thysanoptera)和双翅目(Diptera)物种的用途。多杀菌素
A和D在此也称作多杀菌素A/D。
乙基多杀菌素是5,6-二氢-3′-乙氧基多杀菌素J(主要成分)和3′-乙氧基多
杀菌素L的混合物,由Dow AgroScience生产。该混合物可以通过乙氧基化
多杀菌素J和多杀菌素L的混合物,再进行氢化来制备。多杀菌素J的5,6
双键及其3′-乙氧基比多杀菌素L和其3′-乙氧基衍生物更加易于氢化,原因
是多杀菌素L及其3′-乙氧基衍生物中C-5上的甲基的空间位阻。参见,美
国专利No.6,001,981。多杀菌素J和L在此也称作多杀菌素J/L。
此处使用常规表示法来描述多核苷酸序列:单链多核苷酸序列的左手
端是5′端;双链多核苷酸序列的左手方向称为5′方向。向新生RNA转录物
从5′到3′添加核苷酸的方向称为转录方向。与mRNA具有相同序列的DNA
链称为“编码链”;在具有与转录自该DNA的mRNA相同序列的DNA链上
且位于该RNA转录物5’端的5’的序列称作“上游序列”;在具有与RNA相同
序列的DNA链上且位于该编码RNA转录物3’端的3’的序列称作“下游序
列”。
在某些用于改善剌糖多孢菌菌株改良的实施方案中,通过将基因表达
盒整合入刺糖多孢菌的基因组中来产生稳定的多核苷酸转化体。这通过使
用染色体DNA的一部分和插入元件经由同源重组整合基因来实现的。基于
这种重组并作为其应用的结果,分别将aac(3)IV和vhb基因表达盒整合入了
刺糖多孢菌染色体中遮蔽蛋白聚酮合成酶(PKS)基因座处,导致天然基因
obsA的失活。
本发明的其他实施方案可包括将多核苷酸整合入刺糖多孢菌基因组,
而不负面影响多杀菌素产生、生长和其他期望的代谢特征。
本发明的另外的实施方案可包括将包含基因表达盒的多核苷酸整合入
刺糖多孢菌基因组,其表达导致增加的多杀菌素产生。
本发明的实施方案也可以包括将多核苷酸整合入剌糖多孢菌基因组的
中性位点,并且随后在相同位置叠加第二多核苷酸。其中,利用剌糖多孢
菌内的中性位点作为引入额外的多核苷酸的优选基因座。
本发明的其他实施方案可以包括将含有基因表达盒的多核苷酸整合入
刺糖多孢菌基因组的中性位点,并且随后从整合的多核苷酸中去除选择性
标志表达盒。其中,除了现有技术中已知的其他切除方法外,用于去除所
述选择性标志表达盒的方法是双交换方法、使用CRE-LOX的切除方法、使
用FLP-FRT的切除方法、或使用RED/ET试剂盒
(Genebridges,Heidelberg,Germany)的切除万法。
本发明另外的实施方案包括将多核苷酸整合入刺糖多孢菌基因组的中
性位点,作为使用外来复制质粒的替代物。其中,由于存在类似的来源或
复制、不相容群、冗余的选择性标志、或其他基因元件,一个或多个外来复
制质粒是不相容的。其中,由于刺糖多孢菌限制修饰系统的特异性,一个
或多个外来复制质粒在刺糖多孢菌中是不起作用的。其中,一个或多个外
来复制质粒在刺糖多孢菌中不可用、不起作用的或不是能够容易地转化
的。
本发明的其他实施方案可以包括在原核细胞中增加同源重组效率的方
法。依赖于引入的酶介导的同源重组的方法,如λ-red“重组工程化”和类
似方法在有限数量的细菌种类中是有用的,尤其是埃希氏菌属(Escherichia)
(Datsenko和Wanner(2000)Proc Natl Acad Sci USA.97:6640-597:6640-5)和
沙门氏菌属(Salmonella)。也可以使用依赖于引入的酶介导的位点特异性重
组的方法,所述酶如噬菌体整合酶、FLP/FRT或Cre/loxP,但依赖于靶DNA
中事先存在的位点的存在(Wirth等,(2007)Current Opinions in Biotechnology
18,411-419)。另一方法采用病毒或可动因子(mobile element),或它们的组分
(例如噬菌体、转座子或可动内含子)。
然而,依赖于宿主介导的同源重组的方法是目前最常使用的染色体
DNA修饰类型。在宿主介导的同源重组的典型微生物应用中,通过单交换
整合将具有与染色体有序列同一性的单个区域的质粒整合入染色体,有时
称作坎贝尔式整合(Campbell-like integration)。在这样的事件后,在引入的
质粒上的基因作为染色体的一部分复制,这可以比质粒复制更迅速。相应
地,在带有针对质粒携带的选择性标志基因的选择的培养基中生长可为整
合提供选择压力。通过将目的基因的内部片段置于质粒上,坎贝尔式整合
能够用于失活染色体基因,从而在整合之后,染色体将不含该基因的全长拷
贝。坎贝尔式整合体细胞的染色体是不稳定的,因为整合的质粒侧翼是引导
该整合的同源序列。这些序列间的进一步同源重组事件导致质粒的切除,和
染色体逆转为野生型。因为这个原因,可能有必要保持对质粒携带的选择
性标志基因的选择以保持整合体克隆。
对染色体修饰的基本单交换整合方法的改进可以包括双交换同源重
组,也称作等位基因交换,其涉及两个重组事件。将期望的经修饰的等位
基因置于质粒上,侧翼是与染色体中靶等位基因侧翼的区域具有同源性的区
域(“同源臂”)。第一整合事件可以发生在任一一对同源臂中,导致质粒以
与坎贝尔式整合相同的方式整合入染色体。在第一交换事件之后,染色体
含有能够引导第二重组事件的两组可供选择的同源序列。如果与引导第一
事件的相同的序列重组,那么质粒会被切除,并且细胞会回复成野生型。
如果第二重组事件由另一同源臂引导,质粒会被切除,但原有的染色体等
位基因会替换为质粒上引入的经修饰的等位基因;会实现期望的染色体修
饰。与坎贝尔式整合一样,通常检测第一重组事件,并且使用通过质粒携
带的选择性标志基因的整合所赋予的选择优势来分离整合体。
本文使用的“功能多态性”指基因碱基对序列的变化,所述变化导致在
该基因编码的蛋白质的活性上的质变或量变(例如,活性的特异性的改变;
活性水平的改变)。术语“功能多态性”包括突变、缺失和插入。
一般来说,可以通过从来源收集合有DNA的生物学样品,然后确定该
生物学样品中含有目的多态性的DNA存在或缺失来实施检测目的多态性的
步骤。
确定编码特定突变的DNA的存在或缺失可以使用以合适的可检测基团
标记的寡核苷酸探针,和/或凭借扩增反应如聚合酶链式反应或连接酶链式
反应(其后可使用标记的寡核苷酸探针或多种其他技术来检测这些扩增反应
的产物)来实施。可以用于实施本发明的大量不同的寡核苷酸探针测定形式
是已知的。参见如Wahl等的美国专利No.4,302,204;Falkow等的美国专利
No.4,358,535;Ranki等的美国专利No.4,563,419;及Stavrianopoulos等的
美国专利No.4,994,373。
选定的或靶核酸序列的扩增可以通过任何适合的手段实施。大体上参
见Kwoh等,Am.Biotechnol.Lab.8,14-25(1990)。合适的扩增技术的实例
包括但不限于,聚合酶链式反应、连接酶链式反应、链置换扩增(大体上参
见G.Walker等,Proc.Natl.Acad.Sci.USA 89,392-396(1992);G.Walker
等,Nucleic Acids Res.20,1691-1696(1992))、基于转录的扩增(参见D.Kwoh
等,Proc.Natl.Acad Sci.USA 86,1173-1177(1989))、自动维持序列复制(或
“3SR”)(参见J.Guatelli等,Proc.Natl.Acad.Sci.USA87,1874-1878(1990))、
Qβ复制酶系统(参见P.Lizardi等,BioTechnology6,1197-1202(1988))、基
于核酸序列的扩增(或“NASBA”)(参见R.Lewis,Genetic Engineering News 12
(9),1(1992))、修复链反应(或″RCR″)(参见R.Lewis,同上)和回旋DNA扩增
(或″BDA″)(boomerang DNA amplification)(参见R.Lewis,同上)。通常优选
聚合酶链式反应。
聚合酶链式反应(PCR)可以依照已知技术实施。参见,例如,美国专利
No.4,683,195;4,683,202;4,800,159和4,965,188。一般来说,PCR涉及,
首先,在杂交条件下使用针对待检测的特定序列各条链的一个寡核苷酸引
物处理核酸样品(例如,在热稳定DNA聚合酶的存在下),以便合成各引物
的延伸产物,该产物与各条核酸链互补,引物与引物所杂交的特定序列的
各条链充分互补,从而从各引物合成延伸产物,当它与其互补物分开后,能
够充当模板用于其他引物的延伸产物的合成,然后如果带检测的一个或多
个序列存在,在变性条件下处理所述样品以将引物延伸产物与它们的模板分
开。循环重复这些步骤直到获得期望的扩增程度。通过向反应产物添加能够
与该反应产物杂交的寡核苷酸探针(例如,本发明的寡核苷酸探针)来实施对
扩增序列的检测,该探针携带可检测的标记,然后依照已知技术,或通过
在凝胶上直接显现来检测该标志。这些探针的长度可以是从5到500个核苷
酸,优选5到250个,更优选5到100或5到50个核酸。当PCR条件允许
扩增所有的等位基因类型时,通过与等位基因特异性探针杂交、通过限制
性内切核酸酶消化、通过在变性梯度凝胶上电泳或其他技术能够区分所述
类型。
连接酶链式反应(LCR)也依照已知技术实施。参见例如R.Weiss,
Science 254,1292(1991)。一般来说,该反应使用两对寡核苷酸探针进行:
一对结合至待检测序列的一条链上,另一对结合至待检测序列的另一条链
上。每一对在一起与其对应的链完全重叠。如下实施该反应,首先使待检
测序列的链变性(例如,分离),然后在热稳定连接酶存在下使所述链与两对
寡核苷酸探针反应,从而使每对寡核苷酸探针连接在一起,然后分离反应
产物,然后循环重复该过程直到序列已经扩增到期望的程度。然后可以按
照与如上所述的关于PCR的类似方式检测。
DNA扩增技术(例如前述的)可以涉及使用探针、一对探针或两对探针,
其特异性结合至含有功能多态性的DNA,但不结合至不含该功能多态性的
DNA。或者,探针或探针对能够结合至含有和不含功能多态性的两种
DNA,但产生或扩增出其中可以确定可检测差异的产物(例如,延伸产物)
(例如,较短的产物,在此功能多态性是缺失突变)。可以依照标准技术从与
obsA连锁的基因中的或与该基因有关的DNA的已知序列中或从能够从这些
基因生成的序列依照标准技术来生成这类探针。
会理解的是本文描述的检测步骤可以直接或间接实施。其他间接确定等
位基因类型的手段包括测量与特定功能多态性连锁的多态性标志,如已经
针对VNTR(可变数目串联重复)所示范的。
分子生物学包含广泛多样的用于核酸和蛋白质序列分析的技术。许多
技术和程序形成了临床诊断测定和检验的基础。这些技术包括核酸杂交分
析、限制酶分析、基因序列分析、以及核酸和蛋白质的分离和纯化(参见,
例如,J.Sambrook,E.F.Fritsch,和T.Maniatis,Molecular Cloning:A
Laboratory Manual,第二版,Cold spring Harbor Laboratory Press,Cold Spring
Harbor,N.Y.,1989)。
这些技术中的大部分涉及对大量样品实施许多操作(例如,移液、离心
和电泳)。它们常常是复杂且费时的,并且通常要求高度精确性。许多技术
由于缺乏灵敏度、特异性和再现性而在应用上受限。
核酸杂交分析通常涉及在相对大量的复杂非靶核酸中,用过量的探针
DNA检测非常小量的特定靶核酸(DNA或RNA)。样品中核酸的复杂性的降
低有助于检测低拷贝数(即10,000到100,000)的核酸靶物。通过扩增靶核酸
序列来实现某种程度的DNA复杂性降低。(参见,M.A.Innis等,PCR
Protocols:A Guide to Methods and Applications,Academic Press,1990;
Spargo等,1996,Molecular & Cellular Probes,in regard to SDA
amplification)。这是因为靶核酸的扩增导致相对于非靶序列而言巨大数量的
靶核酸序列,由此改善后续的靶杂交步骤。
杂交步骤涉及将制备好的DNA样品与特异性报告探针在为了使靶DNA
序列和探针之间发生杂交的设定的最适条件下接触。杂交可能在许多形式
中的任何一种中进行。例如,多样品核酸杂交分析已经在多种滤膜和固体
支持物形式下进行(参见Beltz等,Methods in Enzymology,Vol.100,Part等编
辑,Academic Press,New York,Chapter19,pp.266-308,1985)。一种所谓的
“点印迹”杂交形式涉及将靶DNA非共价附接至滤膜,接着是与放射性同位
素标记的探针的后续杂交。“点印迹”杂交在过去的二十年间得到了广泛使
用,在这段时间里发展出很多版本(参见Anderson和Young,于Nucleic Acid
Hybridization-A Practical Approach;Hames和Higgins编辑,IRL Press,
Washington,D.C.Chapter4,pp.73-111,1985)。例如,点印迹方法已经发展
用于基因组突变的多重分析(Nanibhushan等的EPA0228075)以及用于重叠
克隆的检测和基因组图谱的构建(Evans的美国专利No.5,219,726)。
用于实施多样品核酸杂交分析的其他技术包括微量形式多路或矩阵设
备(micro-formatted multiplex or matrix device)(例如,DNA芯片)(参见M.
Barinaga,253 Science,pp.1489,1991;W.Bains,10Bio/Technology,pp.
757-758,1992)。这些方法通常将特定DNA序列附接至固体支持物的非常小
的特定区域,例如DNA芯片的微孔。这些杂交形式是常规“点印迹”和“夹
心”杂交系统的微量规模版本。
该微量形式杂交可以用于实施“通过杂交进行的测序”(SBH)(参见M.
Barinaga,253 Science,pp.1489,1991;W.Bains,10 Bio/Technology,pp.
757-758,1992)。SBH使用所有可能的n核苷酸寡聚体(n聚物(n-mer))来鉴定
未知DNA样品中的n聚物,其后通过算法分析排列这些n聚物以产生DNA
序列(参见Drmanac美国专利No.5,202,230)。
有两种用于实施SBH的形式。第一种形式涉及在支持物上创建所有可
能的n聚物的阵列,然后将其与靶序列杂交。第二种形式涉及将靶序列附接
至支持物,将其用所有可能的n聚物按顺序探查。Southern(英国专利申请
GB8810400,1988;E.M.Southern等,13 Genomics 1008,1992)提出使用第
一种形式分析或测序DNA。Southern使用PCR扩增的基因组DNA鉴定了
已知的单点突变。Southern还描述了一种在固体支持物上合成寡核苷酸阵列
以供SBH的方法。Drmanac等(260 Science 1649-1652,1993)使用了第二种形
式来测序几种短(116bp)DNA序列。将靶DNA附接至膜支持物上(“点印迹”
形式)。将各滤膜与272种标记的10聚物和1聚物寡核苷酸按顺序杂交。使
用了较宽范围的严格条件来实现每种n聚物探针的特异性杂交。使用从0℃
至16℃的温度,洗涤时间从5分钟到过夜不等。大多数探针需要在16℃下
的3小时洗涤。为了检测杂交信号,必需将滤膜曝光2到18小时。
一般来说,多种方法可用于杂交事件的检测和分析。取决于用于标记
DNA探针的报告基团(荧光团、酶、放射性同位素等),通过荧光计量法、
量热法或通过放射自显影来进行检测和分析。通过观察和测量发出的辐
射,如荧光辐射或粒子发射,可以获得有关杂交事件的信息。即使当检测
方法具有非常高的固有灵敏度时,由于背景存在非特异性结合的物质,杂
交事件的检测是困难的。因此,杂交事件的检测依赖于能够使杂交具有何
种特异性和灵敏度。关于遗传分析,已经开发了几种试图增加特异性和灵
敏度的方法。
遗传分析的一种形式是以阐明单核酸多态性或(“SNP”)为中心的分析。
使用SNP的有利因素是其在人类基因组内的高丰度(尤其与短串联重复(STR)
相比),其频繁定位在基因的编码区或调节区内(这能够影响蛋白质结构或表
达水平),以及其从一代传递到下一代时的稳定性(Landegren等,Genome
Research,第8卷,第769-776页,1998)。
SNP定义为以两种变型存在的基因组中的任意位置,并且最常见的变
型在少于99%的时间出现。为了使用SNP作为普遍的遗传标志,关键是能
够简单、快速、准确和经济地对它们进行分型。目前有很多技术可用于测
定SNP类型(关于综述,参见Landegren等,Genome Research,第8卷,第
769-776页,(1998)),所有这些都需要靶扩增。它们包括直接测序(Carothers
等,BioTechniques,第7卷,第494-499页,1989),单链构象多态性(Orita
等,Proc.Natl.Acad.Sci.USA,第86卷,第2766-2770页,1989),等位基
因特异性扩增(Newton等,Nucleic Acids Research,第17卷,第2503-2516
页,(1989),限制性生消化(Day和Humphries,Analytical Biochemistry,第222
卷,第389-395页,1994)和杂交测定法。在其最基本的形式中,杂交测定法
通过区别针对匹配和错配靶物的短寡核苷酸报告物来发挥功能。对该基本
方案已经发展出了许多适应性变化。这些包括连接链反应(Wu和Wallace,
Gene,第76卷,第245-254页,1989)和微测序(minisequencing)(Syvanen等,
Genomics,第8卷,第684-692页,1990)。其他的增强包括使用Taq DNA
聚合酶的5′-核酸酶活性(Holland等,Proc.Natl.Acad.Sci.USA,第88卷,
第7276-7280页,1991)、分子信标(Tyagi和Kramer,Nature Biotechnology,
第14卷,303-308页,1996)、热变性曲线(Howell等,Nature
Biotechnology,第17卷,第87-88页,1999)和DNA“芯片”(Wang等,
Science,第280卷,1077-1082页,1998)。
能够用于区分SNP的另一个现象是源自多靶特异性探针对单一靶的杂
交的核酸相互作用能或碱基堆积能。(参见,R.Ornstein等,″An O ptimized
Potential Function for the Calculation of Nucleic Acid Interaction Energies″,
Biopolymers,第17卷,第2341-2360页,(1978);J.Norberg和L.Nilsson,
Biophysical Journal,第74卷,第394-402页,(1998);和J.Pieters等,
Nucleic Acids Research,第17卷,第12期,第4551-4565页(1989))。在本
发明中,以独特的形式利用碱基堆积现象,以提供高灵敏度的Tm微分(Tm
differentials),允许直接检测在核酸样品中的SNP。
已经使用了其他方法来区分相关生物中的核酸序列或测序DNA。例
如,Hogan等的美国专利No.5,030,557公开了单链靶核酸的二级和三级结构
除了“探针”寡核苷酸之外还可能因结合“辅助(helper)”寡核苷酸而受到影
响,导致在探针和靶核酸之间展现较高的Tm。然而,该应用在其方法上限
于仅将杂交能用于改变自退火RNA链的二级和三级结构,如果其保持不变
则会倾向于阻止探针杂交至靶。
关于DNA测序,例如,K.Khrapko等,Federation of European
Biochemical Societies Letters,第256卷,第1,2期,第118-122页(1989),公
开了连续堆积杂交导致的双链体稳定化。另外,J.Kieleczawa等,Science,
第258卷,第1787-1791页(1992),公开了使用六聚体的连续串(contiguous
strings)来引发DNA合成,其中所述连续串似乎将引发稳定化。同样地,L.
Kotler等,Proc.Natl.Acad.Sci.USA,第90卷,第4241-4245页,(1993),公
开了通过使用六聚体和五聚体寡核苷酸模块,在DNA测序反应引发中的序
列特异性。此外,S.Parinov等,Nucleic Acids Research,第24卷,no.15,
第2998-3004页,(1996),公开了使用碱基堆积寡聚物用于与被动DNA测序
微芯片(passive DNA sequencing microchips)联合的DNA测序。而且,G.
Yershov等,Proc.Natl.Acad.Sci.USA,第93卷,第4913-4918页(1996),
公开了碱基堆积能在被动微芯片(passive microchip)上的SBH中的应用。在
Yershov的实例中,将10聚物DNA探针锚定于微芯片表面,并连同另外短
探针杂交至靶序列,这样的组合似乎稳定了探针的结合。以这种形式,能
够阐明核酸序列的短片段以供DNA测序。Yershov进一步指出,在其系统
中使用较短的探针(例如,5聚物)增加了错配的去稳定化效果。在DNA测序
中使用这样的短探针提供了沿着正在探查的序列辨别错配存在的能力,而
不是仅仅在探针/靶杂交复合物的一个指定位置的单一错配。对于这样的目
的,使用较长的探针(例如,8聚物、10聚物和13聚物寡聚物)功能较差。
在核酸分析中已经使用了碱基堆积的方法的其他实例包括Lane等的美
国专利No.5,770,365,其中公开了使用具有单链环和双链区的单分子捕获
探针捕获核酸靶的方法,所述探针连同结合的靶发挥作用通过堆积能稳定
双链体形成。
依照常规方法,通过定点诱变可以方便地修饰核苷酸序列。或者,可
以通过化学合成制备核苷酸序列,包括但不限于通过使用寡核苷酸合成
仪,其中基于所需多肽的氨基酸序列设计寡核苷酸,并且优选选择将要产
生该重组多肽的宿主细胞中偏好的那些密码子。
通过克隆基因的诱变,并在产生多杀菌素的生物中用突变的基因取代
其未突变的对应物,也可以产生新型多杀菌素。诱变可以涉及,例如:1)酮
还原酶、脱水酶或烯酰还原酶(KR、DH或ER)结构域的缺失或失活,使得这
些功能中的一种或多种被阻断,而菌株产生具有含双键、羟基或酮基(其不
存在于多杀菌素A的核中)的内酯核的多杀菌素(参见Donadio等,1993);2)
替换AT结构域,从而将不同的羧酸并入该内酯核中(参见Ruan等,1997);
3)向现有的PKS模块添加KR、DH或ER结构域,从而使得菌株产生具有含
饱和键、羟基或双键(其不存在于多杀菌素A的核中)的内酯核的多杀菌素;
或4)添加或去掉完整的PKS模块,从而使环内酯核具有更多或更少的碳原
子数。通过用异源PKS加载物(loading)替代多杀菌素PKS加载结构域来产
生杂合PKS。参见,例如,美国专利7,626,010。进一步注意到通过修饰附
接于多杀菌素内酯骨架的糖多杀菌素可以包括鼠李糖和/或福乐糖胺
(forosamine)部分的修饰或不同脱氧糖的附接。西班牙的Salas小组证明,通
过用不同的糖分子取代现有的糖分子可以产生新的聚酮化合物。Rodriguez
等,J.Mol.Microbiol Biotechnol.2000 Jul;2(3):271-6。遵循贯穿本申请的实
例有助于举例说明使用诱变来产生具有经修饰的功能性的多杀菌素。
来自多杀菌素基因簇区的DNA可以用作杂交探针来鉴定同源序列。因
此,在此克隆的DNA可用于从刺糖多孢菌基因文库定位其他的质粒,所述
质粒与此处描述的区重叠,但还包含来自刺糖多孢菌基因组中邻近区域的之
前未克隆的DNA。另外,来自此处克隆的区的DNA可以用于鉴定其他生物
中不同但类似的序列。杂交探针通常长至少约20个碱基并被标记以允许检
测。
为了不同的目的,本发明中可以使用多种类型的诱变。它们包括但不
限于,定点的、随机点诱变、同源重组、DNA改组或其他递归诱变方法、
嵌合构建、使用含尿嘧啶的模板的诱变、寡核苷酸定向诱变、硫代磷酸酯修
饰的DNA诱变、使用缺口双链DNA的诱变等等,或其任意组合。其他合
适的方法包括点错配修复、使用修复缺陷型宿主菌株的诱变、限制性选择和
限制性纯化、缺失诱变、通过全基因合成进行的诱变、双链断裂修复等等。
诱变包括但不限于,涉及嵌合建构体的,也包括在本发明中。在一个实施
方案中,由天然存在的分子或改变的或突变的天然存在的分子的已知信息
来指导诱变,所述信息包括但不限于序列、序列比较、物理性质、晶体结构
等等。
此处存在的文字和实例描述了这些程序。在下列出版物和其中引用的
参考文件中存在额外的信息:Ling等,Approaches to DNA mutagenesis:an
overview,Anal Biochem.254(2):10157-178(1997);Dale等,
Oligonucleotide-directed random mutagenesis using the phosphorothioate
method,Methods Mo1.Biol.57:369-374(1996);Smith,In vitro mutagenesis,
Ann.Rev.Genet.19:423-462(1985);Botstein & Shortle,Strategies and
applications of in vitro mutagenesis,Science 229:1193-1201(1985);Carter,
Site-directed mutagenesis,Biochem.J.237:1-7(1986);Kunkel,The efficiency
of oligonucleotide directed mutagenesis,于 Nucleic Acids&Molecular Biology
(Eckstein,F.and Lilley,D.M.J.编辑,Springer Verlag,Berlin)(1987);Kunkel,
Rapid and efficient site-specific mutagenesis without phenotypic selection,Proc.
Natl.Acad.Sci.USA 82:488-492(1985);Kunkel等,Rapid and efficient
site-specific mutagenesis without phenotypic selection,Methods in Enzymol.154,
367-382(1987);Bass等,Mutant Trp repressors with new DNA-binding
specificities,Science 242:240-245(1988);Methods in Enzymol.100:468-500
(1983);Methods in Enzymol.154:329-350(1987);Zoller&Smith,
Oligonucleotide-directed mutagenesis using M13-derived vectors:an efficient
and general procedure for the production of point mutations in any DNA
fragment,Nucleic Acids Res.10:6487-6500(1982);Zoller&Smith,
Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13
vectors,Methods in Enzymol.100:468-500(1983);Zoller&Smith,
Oligonucleotide-directed mutagenesis:a simple method using two
oligonucleotide primers and a single-stranded DNA template,Methods in
Enzymol.154:329-350(1987);Taylor等,The use of
phosphorothioate-modified DNA in restriction enzyme reactions to prepare
nicked DNA,Nucl.Acids Res.13:8749-8764(1985);Taylor等,The rapid
generation of oligonucleotide-directed mutations at high frequency using
phosphorothioate-modified DNA,Nucl.Acids Res.13:8765-8787(1985);
Nakamaye&Eckstein,Inhibition of restriction endonuclease Nci I cleavage by
phosphorothioate groups and its application to oligonucleotide-directed
mutagenesis,Nucl.Acids Res.14:9679-9698(1986);Sayers等,Y-T
Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis,
Nucl.Acids Res.16:791-802(1988);Sayers等,Strand specific cleavage of
phosphorothioate-containing DNA by reaction with restriction endonucleases in
the presence of ethidium bromide,(1988)Nucl.Acids Res.16:803-814;Kramer
等,The gapped duplex DNA approach to oligonucleotide-directed mutation
construction,Nucl.Acids Res.12:9441-9456(1984);Kramer&Fritz
Oligonucleotide-directed construction of mutations via gapped duplex DNA,
Methods in Enzymol.154:350-367(1987);Kramer等,Improved enzymatic in
vitro reactions in the gapped duplex DNA approach to oligonucleotide-directed
constrtuction of mutations,Nucl.Acids Res.16:7207(1988);Fritz等,
Oligonucleotide-directed construction of mutations:a gapped duplex DNA
procedure without enzymatic reactions in vitro,Nucl.Acids Res.16:6987-6999
(1988);Kramer等,Point Mismatch Repair,Cell 38:879-887(1984);Carter等
Improved oligonucleotide site-directed mutagennesis using M13 vectors,Nucl.
Acids Res.13:4431-4443(1985);Carter,Improved oligonucleotide-directed
mutagennesis using M13 vectors,Methods in Enzymol.154:382-403(1987);
Eghtedarzadeh&Henikoff,Use of oligonucleotides to generate large deletions,
Nucl.Acids Res.14:5115(1986);Wells等,Importance of hydrogen-bond
formation in stabilizing the trarnsition state of subtilisin,Phil.Trans.R.Soc.Lond.
A 317:415-423(1986);Nambiar等,Total synthesis and cloning of a genne
coding for the ribonuclease S protein,Science 223:1299-1301(1984);Sakamar
和Khorana,Total synthesis and expression of a gene for the a-subunnit of bovine
rod outer segment guanine nucleotide-binding protein(transducin),Nucl.Acids
Res.14:6361-6372(1988);Wells等,Cassette mutagenesis:an efficient
method for generation of multiple mutations at defined sites,Genne 34:315-323
(1985);Grundstrom等,Oligonucleotide-directed mutagenesis by microscale
′shot-gun′gene synthesis,Nucl.Acids Res.13:3305-3316(1985);Mandecki,
Oligonucleotide-directed double-strand break repair in plasmids of Escherichia
coli:a method for site-specific mutagenesis,Proc.Natl.Acad.Sci.USA,
83:7177-7181(1986);Arnold,Protein engineering for unusual environments,
Current Opinion in Biotechnology4:450-455(1993);Sieber等,Nature
Biotechnology,19:456-460(2001).W.P.C.Stemmet,Nature 370,389-91
(1994);和I.A.Lorimer,I.Pastan,Nucleic Acids Res.23,3067-8(1995)。以上
许多方法的其他细节可以在Methods in Enzymology第154卷找到,其还描
述了对于解决各种诱变方法的问题有用的控制方法。
术语“同源性”或“百分比同一性”在此处可互换使用。为了本发明的目
的,此处定义为了确定两个氨基酸序列或两个核酸序列的百分比同一性,
出于最佳比较的目的来比对序列(例如,为了与第二氨基酸或核酸序列的最
佳比对,可以将缺口引入第一氨基酸或核酸序列的序列中)。然后比较在相
应氨基酸位置或核苷酸位置的氨基酸残基或核苷酸。当第一序列中的位置
由与第二序列中相应位置相同的氨基酸残基或核苷酸占据时,那么这些分
子在该位置是相同的。两个序列间的百分比同一性是序列共享的相同位置
的数目的函数(即,%同一性=相同位置数/位置总数(即,重叠位置×100)。优
选地,两个序列的长度相同。
本领域技术人员将会意识到可以使用几个不同的计算机程序测定两个
序列之间的同源性。例如,使用数学算法可以完成两个序列之间的序列比
较和百分比同一性的测定。在优选的实施方案中,使用Needleman和
Wunsch(J.Mol.Biol.(48):444-453(1970))算法测定两个氨基酸序列间的百
分比同一性,所述算法已经纳入GCG软件包(可从因特网的accelrys网站获
得,更具体地,在http://www.accelrys.com)中的GAP程序中,使用Blossom
62矩阵或PAM250矩阵,和缺口加权(gap weight)16、14、12、10、8、6或
4,长度加权(length weight)1、2、3、4、5或6。本领域技术人员会理解,
所有这些不同的参数会产生稍微不同的结果,但是当使用不同的算法时,
两个序列的整体百分比同一性不会显著变化。
在又一个实施方案中,使用GCG软件包(可从因特网上的accelrys网站
获得,更具体地,在http://www.accelrys.com)中的GAP程序确定两个核苷酸
序列间的百分比同一性,使用NWSgapdna.CMP矩阵以及缺口加权40、
50、60、70或80,和长度加权1、2、3、4、5或6。在另一个实施方案中,
使用E.Meyers和W.Miller的算法(CABIOS,4:11-17(1989))确定两个氨基酸
或核苷酸序列间的百分比同一性,该算法已经并入ALIGN程序(2.0版本)(可
从因特网在vega网站获得,更具体为ALIGN-IGH Montpellier,或更具体
地,http://vega.1gh.cnrs.fr/bin/align-guess.cgi),使用PAM120加权残基表,缺
口长度罚分(gap length penalty)12和缺口罚分(gap penalty)4。
本发明的核酸和蛋白质序列可进一步作为“查询序列”使用,以针对公
共数据库进行检索,例如,以鉴定其他家族成员或相关序列。使用Altschul
等(1990)J.Mol.Biol.215:403-10的BLASTN和BLASTX程序(2.0版本)进行
这样的检索。BLAST核苷酸检索可以使用BLASTN程序执行,分值
(score)=100,字长(word length)=12,以获得与本发明的核酸分子同源的核
苷酸序列。BLAST蛋白质检索可以使用BLASTX程序执行,分值=50,字
长=5,以获得与本发明的蛋白质分子同源的氨基酸序列。为了获得用于比
较目的的带缺口比对(gapped alignments),缺口BLAST(Gapped BLAST)可
以如Altschul等,(1997)Nucleic Acids Res.25(17):3389-3402中所述使用。
当使用BLAST和缺口BLAST程序时,可使用各程序(例如,BLASTX和
BLASTN)的缺省参数(可从因特网在ncbi网站获得,更具体地在
www.ncbi.nlm.nih.gov)。
在本发明中使用的合适的表达载体包括原核和真核载体(例如,质粒、
噬菌粒或噬菌体),包括哺乳动物载体和植物载体。合适的原核载体包括质
粒,例如但不限于,通常用于在放线菌属(Actinomyces)中的DNA操作的质
粒,(例如pSET152、pOJ260、pIJ101、pJV1、pSG5、pHJL302、pSAM2、
pKC1250)。Kieser等(″Practical Streptomyces Genetics″,2000)公开了这些质
粒。其他合适的载体可以包括例如那些在大肠杆菌中能够复制的质粒(例
如,pBR322、ColE1、pSC101、PACYC 184、itVX、pRSET、pBAD
(Invitrogen,Carlsbad,Calif.)等等)。Sambrook公开了这些质粒(参见
″Molecular Cloning:A Laboratory Manual,″第二版,Sambrook,Fritsch,&
Maniatis编辑,Cold Spring Harbor Laboratory,(1989)),并且许多这类载体可
通过商业方法获得。芽孢杆菌属(Bacillus)质粒包括pC194、pC221、pT127
等等,并且由Gryczan公开(在:The Molecular Biology of the Bacilli、
Academic Press,NY(1982),第307-329页)。合适的链霉菌属(Streptomyces)
质粒包括pli101(Kendall等,J.Bacteriol.169:4177-4183,1987),而链霉菌属
噬菌体包括但不限于如ΨC31(Chater等,在Sixth International Symposium on
Actinomycetales Biology,Akademiai Kaido,Budapest,Hungary(1986),第
45-54页)。John等(Rev.Infect.Dis.8:693-704,1986)和Izaki(Jpn.J.Bacteriol.
33:729-742,1978)综述了假单胞菌属(Pseudomonas)质粒。
特定基因表达的抑制对于研究和开发更适合特定目的的遗传工程化生
物都是重要的手段。基因沉默可以通过引入转基因实现,所述转基因对应
于目的基因处于相对于其启动子的反义方向(参见,例如,Sheehy等,Proc.
Nat′l Acad.Sci.USA 85:8805 8808(1988);Smith等,Nature 334:724 726
(1988)),或处于相对于其启动子的有义方向(Napoli等,Plant Cell 2:279 289
(1990);van der Krol等,Plant Cell 2:291 299(1990);美国专利No.
5,034,323;美国专利No.5,231,020;和美国专利No.5,283,184),这两种情
况都导致转基因以及内源基因的表达降低。
已报导了转录后的基因沉默伴随着反义RNA小片段(20至25个核苷酸)
的积累,所述片段可从RNA模板合成,并且代表该过程的特异性和移动性
(mobility)的决定因素(Hamilton & Baulcombe,Science286:950952(1999))。
已经清楚的是在一系列生物中,dsRNA(双链RNA)的引入是导致基因沉默的
重要要素(Fire等,Nature 391:806 811(1998);Timmons & Fire,Nature
395:854(1998);W099/32619;Kennerdell & Carthew,Cell 95:1017 1026
(1998);Ngo等,Proc.Nat′l Acad.Sci.USA 95:14687 14692(1998);
Waterhouse等,Proc.Nat′l Acad.Sci.USA 95:13959 13964(1998);
W099/53050;Cogoni&Macino,Nature399:166 169(1999);Lohmann等,
Dev.Biol.214:211 214(1999);Sanchez-Alvarado & Newmark,Proc.Nat′l
Acad.Sci.USA 96:5049 5054(1999))。在细菌中受抑制的基因不需要是内源
细菌基因,因为报告转基因和病毒基因二者均受到引入的转基因的转录后
基因沉默(English等,Plant Cell8:179 188(1996);Waterhouse等,同上)。
然而,在以上所有情况中,在引入的转基因和受到抑制的基因之间的一些
序列相似性可能是优选的。
在以下的非限制性实施例中更详细地解释本发明。
实施例
携带遮蔽蛋白PKS基因obsA的粘粒克隆的鉴定
使用来自刺糖多孢菌的obsA基因组基因座的806-bp探针(SEQ ID NO:1)
完成了粘粒文库的筛选。通过BioS&T(Montreal,Canada)使用Supercos I粘
粒载体(Stratagene,La Jolla,CA)和根据Kieser等(2000)描述的基因组DNA分
离方案制备的来自刺糖多孢菌菌株的基因组DNA,从刺糖多孢菌菌株构建
了粘粒文库。
使用obsA探针筛选文库允许在严格条件下鉴定携带obsA的5′端的粘粒
克隆。根据制造商的说明书使用DIG DNA标记试剂盒和DIG核酸检测试剂
盒(Roche,Basel,Switzerland)进行探针标记、杂交和检测。具体地,将源自
obsA的5′端的806-bp PCR片段使用随机引物DNA标记试剂盒(Roche)标记。
在杂交烘箱中于58℃杂交过夜,之后在65℃使用含有0.1X SSC和0.1%SDS
的洗涤缓冲液洗涤两个滤膜两次,共30分钟。使用Roche的DIG核酸检测
试剂盒基于酶联免疫测定法使用高特异性抗-DIG-AP抗体缀合物和有色底
物NBT(硝基四氮唑蓝)和BCIP(5-溴-4-氯-3-吲哚基磷酸盐)来检测杂交的探
针。鉴定出了几组具有强杂交信号的粘粒。选择克隆中的四个,即1E3、
2N14、3M23和4E16用于粘粒DNA分离和测序确认。
使用obsA正向引物(SEQ ID NO:2
5′-CAAGATCGTTGGGACCTGGCC-3′)和obsA反向引物(SEQ ID NO:3
5′-TCGACGTACTGGACCTCGGC-3′)对粘粒克隆进行PCR扩增,产生了大
小等同于806-bp探针的单一PCR片段。根据制造商说明书使用
FAILSAFETM PCR系统(Epicentre Biotechnologies,Madison,WI)完成PCR反
应。
也对四个粘粒克隆携带的DNA插入物的两个末端都进行了测序,从而
将所述粘粒克隆定位到遮蔽蛋白基因簇上并估算所述粘粒克隆的插入物大
小(图1)。确定了粘粒克隆1E3的大小为42,900bp,并且在DNA插入物的
中部含有obsA的5′端。确定了粘粒克隆2N14的大小为40,153bp,并且不
携带整个obsA编码区。粘粒克隆3M23和4E16中的插入物在一端含有obsA
的5′端,并在另一端含有超出遮蔽蛋白基因簇之外的DNA序列。没有估算
粘粒克隆3M23和4El6的实际大小。选择了粘粒克隆1E3用于完成obsA的
破坏,以确定聚酮合成酶基因功能消除对刺糖多孢菌特征和多杀菌素的产生
的影响。
经由PCR靶向来工程化obsA破坏粘粒克隆
为了破坏遮蔽蛋白基因簇中的obsA,经由PCR靶向将质粒pIJ773(由
John Innes Center Plant Biosciences Limited,Norwich,England提供;图2)的
阿泊拉霉素抗性破坏表达盒(disruption cassette)(FRT-aac3(IV)-oriT-FRT)整合
到粘粒克隆1E3中。
根据Gust等(2002)将obsA破坏表达盒(FRT-aac3(IV)-oriT-FRT)整合入粘
粒克隆1E3中,并做出以下修改。使用了从耶鲁大学的The Coli Cenetic
Stock Center(CGSC)获得的包含λred重组酶表达质粒pKD78的大肠杆菌
BW25141/pKD78,该表达质粒衍生自pKD46(Datsenko和Wanner,2000)。
以下长PCR引物,ObsA5′FRT aac3(SEQ ID NO:45′-
GGCAATGCGCAGAGTTCGTAGTGCGGGAGCCATTTGATGTGTAGGCT
GGAGCTGCTTC-3′)和ObsA内部oriT FRT SEQ ID NO:55′-
GAAGAAGGCGGCGTCGAACTGGTCGACCTCGGTGAGGAAATTCCGG
GGATCCGTCGACC-3′),用于使用pIJ773(图2)作为模板扩增携带FRT
-aac3(IV)-oriT-FRT的1322-bp片段。根据Gust等(2002)纯化了1,322bp的扩
增片段并将其整合入粘粒1E3中。
所有十个从所述PCR靶向产生的重组大肠杆菌克隆对阿泊拉霉素都有
抗性,并且都具有相同的BamHI限制性酶消化模式(这种消化模式与不含所
述破坏表达盒的粘粒克隆1E3不同)。经由使用一对分别退火至obsA的起始
密码子上游的95bp DNA区和obsA起始密码子下游的334bp DNA区的引物
的扩增来进行对重组克隆的进一步确认。所述引物为obsA 5′上游正向(SEQ
ID NO:65′-CGACCGGTGTGTCGATGTTAGGGT-3′)和obsA内部反向(SEQ
ID NO:75′-CTTCCAACGCTTCCCAGCCC-3′)。根据制造商的说明书,使用
FAILSAFETM PCR系统(Epicentre Biotechnologies,Madison,WI)完成了PCR
反应。
使用用来生成粘粒的Spinosad菌株的基因组DNA或来自粘粒克隆1E3
的DNA的扩增生成了预期的429bp片段。使用分离自十个重组粘粒克隆中
的九个的粘粒DNA(克隆10由于冗余而未继续)的扩增生成了对应于预期大
小1,538bp的单一片段。预期的1,538bp的PCR片段是由于在obsA的5′端
插入了1,322bp的破坏表达盒(FRT-aac3(IV)-oriT-FRT),同时从obsA基因缺
失了213bp。所有的重组粘粒克隆都产生了1,538bp的单一PCR片段,并
且没有产生见于对照粘粒克隆1E3的429-bp片段,表明每个重组粘粒克隆
都在obsA的5′端含有破坏表达盒(FRT-aac3(IV)-oriT-FRT)。
经由将破坏表达盒(FRT-aac3(IV)-oriT-FRT)整合入刺糖多孢菌破坏遮
蔽蛋白基因簇内的obsA
使用接合方法将携带obsA破坏表达盒(FRT-aac3(IV)-oriT-FRT)的重组
粘粒克隆引入刺糖多孢菌菌株,从而从全部靶菌株取得转化接合自
(transconjugant)以供结论性分析obsA破坏对生长和多杀菌素的产生的影
响。
根据Matsushima等(1994)描述的方法,实施在携带重组粘粒1E3的供体
菌株和受体刺糖多孢菌菌株NRRL18538之间的菌丝接合。
产生了转化接合子。几乎所有的原代(primary)转化接合子均确认了期
望的阿泊拉霉素抗性表型,表明所述转化接合子携带经由同源重组整合入
遮蔽蛋白聚酮合成酶基因簇的阿泊拉霉素抗性基因aac3(IV)。测试了几个选
出的转化接合子中对应于PCR扩增中的785bp大小的aac3(IV)片段的DNA
片段的存在。不含破坏表达盒(FRT-aac3(IV)-oriT-FRT)的阴性对照不产生
PCR扩增子。
obsA破坏对刺糖多孢菌生长和多杀菌素产生的影响
使用多杀菌素摇瓶方案来评估obsA破坏对多杀菌素的产生的影响。在
Burns等(WO2003070908)描述的条件下进行了转化接合子的发酵。在Baltz
等(美国专利No.6,143,526)描述的条件下进行了对发酵液中多杀菌素因子存
在性的分析。
对于刺糖多孢菌分离株完成了所述转化接合子相对于它们各自的亲本
菌株的直接比较。在摇瓶中评估了衍生自NRRL 18538的四个obsA敲除突变
体。每个敲除突变体的平均滴度均高于亲本菌株。然而,该差异基于统计分
析并没有显示为显著的(表1)。
表1.衍生自NRRL 18538的obsA敲除突变体在第10天的多杀菌素产生
在A/D菌株NRRL18538中破坏遮蔽蛋白PKS基因obsA在当前摇瓶发
酵条件下如与各自的亲本对照菌株相比,对多杀菌素产生没有负面影响。
在obsA破坏时不存在对多杀菌素产生的负面影响使得遮蔽蛋白聚酮合成酶
基因簇具备作为中性位点用于整合和表达目的靶基因以供改进的多杀菌素
产生和发酵过程的资格。该基因组基因座作为整合位点的实例用于将基因
整合至刺糖多孢菌基因组内。
上述内容对于本发明是示例性的,而不将其理解为对本发明的限制。通
过所附权利要求书来限定本发明,并且将所述权利要求的等效内容也包括
在内。