用于植物转化的质粒和使用此质粒的方法发明领域:
本发明涉及农杆菌介导的植物转化,特别是用T-DNA进行的植物
转化,其中防止了非T-DNA载体序列的同时转移。
领域背景:
通过使用农杆菌和存在于野生型农杆菌中的Ti或Ri质粒转化植
物的方法自1983年来就为人所知(如在EP 0 116 718和EP 0 120 516
中)。此转化方法一般包括用提供异源基因的非致瘤性农杆菌菌株侵染
植物。异源基因位于质粒上一段所谓的T-DNA中,T-DNA是位于两
个24碱基对长的不完全正向重复序列即T-DNA边界之间的DNA。异
源基因向植物中的转移发生在通过农杆菌和植物细胞的共培养而由酚
化合物活化质粒定位的Vir基因的过程中。这些vir基因(D1和D2)
在精确位点使边界重复序列产生切口,由此T-DNA在T-DNA边界处
从质粒上切割下来并插入植物基因组中。
看来右边界区在T-DNA转移中最关键:删去T-DNA右边界区的
Ti质粒是无毒的(Holsters,M.等,质粒3,212-230,1980)。左边
界区的删除对毒性无影响(Joos,H.等,细胞32,1057-1067,1983)。
当使用双元载体系统进行转化时,需要T-DNA边界的存在,其中
T-DNA位于分开的独立复制子双元载体上。
转化后,T-DNA以单一单位或串联排列的多拷贝存在于宿主植物
基因组中。但是,还经常发现截短的T-DNA区(Deroles S.C.和
Gardner,R.C.,植物分子生物学,11,365-377,1988)。最近,有
信息表明还有边界外的DNA整合入宿主植物基因组中。据报道该现象
发生在20%-30%的转基因植物中(Martineau,B.等,植物细胞6,1032
-1033,1994)。但是,最近,有文献报道约75%的烟草转化体含有载
体“骨架”序列(Kononov,M.E.等,植物杂志11(5),945-957,1997)。
另一有时发生的现象是T-DNA转移在也作用为(弱)起始点的左
边界起始。于是“连读”的DNA量可能变得丰富:发现有时在左边界
起始的转移连读通过右边界并再次终止于左边界,导致全部双元载体
的转移(Van der Graaff,E.等,植物分子生物学31,677-681,1996)。
由于只转移存在于T-DNA中的DNA是植物遗传学家的目标,因此
防止两个连读机制是受欢迎的。而且,处理转基因植物和/或转基因食
品(市场)注册请求的注册机构也认为转基因植物载体DNA的污染应尽
可能避免。
发明概述:
本发明包括包含具有侧翼T-DNA边界的T-DNA的植物转化载
体,其特征在于载体进一步包含可防止带有比T-DNA序列更多的载体
序列的植物转化体形成的核酸序列。
可防止带有比T-DNA序列更多的载体序列的转化体形成的该序
列是编码毒性化合物的基因,优选地选自RNA酶、DNA酶、植物毒素、
白喉毒素、蛋白酶和反义管家基因如ATP合酶、细胞色素c、丙酮酸
激酶、氨酰基转移酶或者磷酸、二羧酸、三羧酸和2-氧代-戊二酸
转运蛋白。
上述载体的另一实施方案是防止带有T-DNA序列外的载体序列
的转化体形成的序列包含结合DNA结合蛋白的序列或G+C含量高的序
列。
通过用根据本发明所述的载体转化植物获得不含有T-DNA外的
载体序列的转基因植物的方法也是本发明的一部分。其次,含有这样
的载体的宿主如细菌、优选地农杆菌科(Agrobacteriaceae)成员、
更优选地农杆菌属或根瘤杆菌属(Rhizobacterium)成员、最优选地根
瘤农杆菌也构成本发明的一部分。
此外,特征在于使用根据本发明所述载体的植物转化方法也包含
于本发明中。
附图简述:
图1:所用构建体的图示。
图2:用于检测载体序列共整合的引物杂交位置的图示。
发明详述:
基本上所有用于植物转化的已知质粒和载体都能加工成根据本发
明所述的载体或在根据本发明所述的方法中可用的载体。这样的质粒
的例子是pBin19(Bevan,M.,核酸研究12,8711-8721,1984)、
pMOG101(WO93/10251)、pMOG800(WO95/05467)、pMON128(EP 0 131
623)、GV2260(Deblaere等,1985,核酸研究13,4777-4788)、
etcetera和所有从它们衍生的质粒。
这些质粒的关键特征是它们包含具有侧翼T-DNA边界序列的T-
DNA。而且,它们必须适于在农杆菌中复制,因此它们应含有适合用于
农杆菌中的复制起点(ori)序列。尽管最常使用的农杆菌菌株是根瘤农
杆菌,但发根农杆菌也适于植物转化。在此,可转化的DNA位于Ri质
粒上并且该DNA因此应称为R-DNA。但是,T-DNA是普遍使用的术语,
这并不将本发明限制于根瘤农杆菌,而是包括所有用于植物转化的其
中DNA序列位于两个正向重复序列之间的转化方法。
对于转化,除T-DNA之外,毒性蛋白也是必需的。这些毒性蛋白
可由也包含T-DNA的相同质粒编码,在此组中的质粒一般称为共整合
质粒。毒性基因位于分开的质粒上(该系统常称为双元载体系统)或甚
至位于细菌染色体上也是同样可行的。
而且,质粒一般还包含编码抗生素抗性的基因(使其能在选择压力
下培养)以及在大肠杆菌中复制的起点。
关于植物基因转化以及农杆菌和其中Ti质粒的作用的一般介绍
可在“基因操作原理”手册(old,R.W.和Primrose,S.B.,Blackwell
科学出版社,伦敦,1994,第14章,268-301页)中找到。
本发明的一个实施方案包括其中植物表达启动子控制下的编码毒
素的基因位于T-DNA边界之外的载体。关键是此基因对细菌是无毒的
或者不在细菌中表达,否则它将伤害细菌及其将T-DNA转化到植物中
的能力。有几种可防止对细菌的毒性效应的方法。其中一种方法是选
择对细菌无毒的毒性化合物。这样的毒性化合物的例子是白喉毒素。
相似地,将必需的植物管家基因敲除的反义方法也是避免细菌损伤的
选择。对于此方法,必须记住要选择在植物中有活性(并且必需的)
但在细菌中缺乏或仅有次要功能或同源性不大不会受到基因反义表达
阻碍的基因。
然而,即使毒素对细菌是有害的,也可找到防止上述毒素在细菌
中表达的方法。实现此目的的一个选择是制备毒素在植物启动子控制
之下的基因构建体。尽管不是所有植物特异性启动子都可用于这样的
载体,因为它们在细菌中至少有一些表达,但是容易确定所选启动子
是否在细菌细胞中未产生表达(例如通过用上述启动子引导的GUS基
因转化细菌;细菌中的GUS表达可以容易地得到检测)。
最后,防止毒素在细菌中表达的方法是将内含子序列引入毒素的
编码序列(或用含有内含子的基因组序列)。由于细菌不能切除内含
子,因此只会产生非功能性蛋白(或其部分),这对细菌是无害的。
可用的毒素包括针对于特定植物的毒素,但也可使用作用于膜系
统和/或其它基本细胞结构或过程的更广泛有效毒素。这样的毒素的例
子包括:RIP、爪蟾抗菌肽、RNA酶(如芽孢杆菌RNA酶)、DNA酶、蛋
白酶、etcetera。
其它方法可以几种方式应用,并且用于这些方法中的基因可选自
(a)编码抗内源RNA转录物的核酶的基因,(b)产生能引起过敏反应的
蛋白的基因,(c)转录时产生与细胞存活必需内源基因的RNA转录物互
补或至少部分互补的RNA转录物的基因,即已知的基因表达反义抑制
方法(公开于EP-A 240 208中)和(d)转录时产生与细胞存活必需内源
基因的RNA转录物相同或至少非常相似的RNA转录物的基因,这是称
为共抑制的尚未完全了解的基因表达抑制方法(公开于Napoli C.等,
1990,植物细胞2,279-289)。
当病原体来源的诱导蛋白与对应的植物来源的受体蛋白同时表达
时有可能引起过敏反应(HR)。这样的对应的诱导物/受体基因及它们在
转基因植物中引起HR的适用性在本领域内已知,例如黄枝孢avr基因
和Lycopersicon esculentum Cf基因(WO91/15585)或丁香假单胞菌
avr基因和拟南芥RPMI基因(Grant M.R.等,科学269,843-846,
1995)。这些基因用于本发明的一般方法是将这些基因之一插入T-
DNA边界之间而互补基因在边界之外。因此,当边界外DNA转移入植
物中时,两基因都表达并将产生会杀死由此转化的细胞的过敏反应。
因为植物来源的抗性基因在一些植物中天然存在,因此那些植物
有可能具有编码位于T-DNA边界外的相应无毒基因的基因。当它在转
化后表达时将遇到内源产生的相应植物基因并引起HR反应。
用于此HR机制的构建体的优选实施方案(鉴于调节限制)是植物
来源的基因存在于T-DNA边界之间并且病原体来源的基因存在于边
界外的构建体。
根据本发明的另一实施方案,使用反义基因以抑制细胞存活必需
的内源基因的表达,其中基因在植物细胞中表达。
反义干扰基因的靶基因选自那些编码细胞存活必需的酶(也称为
管家酶)的基因并且应该是核编码的、优选地单拷贝基因,尽管那些
由小型基因家族编码的酶也适于本发明的目的。而且,上述基因的反
义表达效应必须不能由于正常由这样的酶合成的酶产物从其它细胞或
细胞器的扩散或转运而消除。优选地,选择编码膜转运酶的基因,因
为它们参与建立跨细胞器膜的化学梯度。根据定义,通过反义表达对
这些蛋白的抑制不能由于跨越这些蛋白定位其中的膜的底物扩散而消
除。转运的化合物不仅限于有机分子也可以是无机性质的分子如P、H、
OH或电子。
靶酶的目录以举例的方式在表1中给出,但本发明并不限于此表
中提及的酶。更详细的目录可见《植物的生物化学》(编辑:Stumpf &
Conn,1988-1991,1-16卷,学术出版社)丛书或《植物生理学百科
全书》(新刊,1976,Springer-Verlag,柏林)。
尽管编码这些酶的基因仅在一些情况下得到分离并因此基因拷贝
数是未知的,但是它们应满足的标准已在本发明中得到描述。
表1反义和有义表达的靶酶的例子
酶
通路/细胞器
ATP合酶
线粒
腺嘌呤核苷酸转运蛋白
线粒体
磷酸转运蛋白
线粒体
三羧酸转运蛋白
线粒体
二羧酸转运蛋白
线粒体
2-氧代-戊二酸转运蛋白
线粒体
细胞色素C
线粒体
丙酮酸激酶
糖酵解
甘油醛-3磷酸-脱氢酶
糖酵解
NADPH-细胞色素P450还原酶
脂类代谢
脂肪酸合酶复合物
脂类代谢
甘油-3磷酸-乙酰转移酶
脂类代谢
羟甲基-戊二酰CoA还原酶
甲羟戊酸途径
氨酰转移酶
核酸代谢
转录因子
核酸代谢
延伸因子
核酸代谢
为得到植物宿主中最大的反义效应,使用同源基因是优选的。同
源意味着可以从与植物宿主相同的植物物种获得。对于本说明书的目
的,异源意味着可从不同植物或非植物物种获得。异源还应包括在其
编码核酸序列的mRNA中修饰的与宿主基因至少5%不同的合成基因类
似物。因为管家基因一般是高度保守的,所以来自其它(植物)物种的
异源探针可用于分离来自作物物种的形成抗性的相应基因。因为此方
法不需要过多实验,这样的基因分离在本领域普通技术人员能力范围
之内。
关于转录终止区的必需性,普遍认为这样的区域增强植物细胞中
的转录效率和可靠性。因此使用这些区域在本发明内容中是特别优选
的。
本发明的另一实施方案是一种载体,其中连读或从左边界开始的
DNA转移通过T-DNA边界外的核酸序列插入而受到抑制,上述核酸序
列插入影响要转移入植物中的DNA分子形成天然需要的DNA解旋过
程。
这样的序列的例子是约40个核苷酸(优选地20-60碱基对)的
GC富集序列,此序列在能量上不利于其DNA解旋,因此预期可通过此
序列阻碍DNA解旋。但是,也可使用其它阻碍连读或左边界起始的序
列。这样的双链序列增加的稳定性的计算方法为本领域技术人员所
知,并在Maniatis、Fritsch和Sambrook所著的分子克隆,实验室手
册,冷泉港,1982,第388页中有所描述。
可在T-DNA边界外的序列中阻碍DNA解旋过程的核苷酸序列的另
一个例子是包含农杆菌DNA结合蛋白的结合位点的序列。结合的双链
DNA结合蛋白的移位是DNA解旋所必需的,因此链移位所需的能量大
大增加。另外,靠近左边界的DNA结合蛋白的存在可在物理上影响左
边界下游的DNA解旋所需的DNA-蛋白复合物的装配。
一般而言,所有双链DNA结合蛋白都能影响此过程。优选地,使
用那些DNA-蛋白相互作用可通过用外界刺激处理农杆菌细胞来诱导
或增强的蛋白结合位点。更优选地,DNA结合蛋白是virG,它也是参
与T-DNA动员和转移的所有vir基因的活化蛋白。已知VirG与vir
元件盒结合,包含序列5’TNCAATTGAAAY 3’〔其中N是任意核苷酸,
而Y是嘧啶碱基核苷酸(T或C)〕。认为virG与此vir元件盒的结合
是在通过virA/virG双成分调节系统活化农杆菌的基础上起始或增强
的。在体内,vir基因的活化依赖于virG的磷酸化,但此修饰的真正
作用仍不清楚。如Sheng和Citovsky所概述的(植物细胞8,1699-
1710,1996),可能性很大的解释是磷酸化的virG在其相关结合位点
上有增强的亲和性。
而且,与左边界序列紧密连接的、结合的DNA结合蛋白的结合位
点的引入能通过空间障碍在物理上影响此左边界上链移位所需蛋白的
装配,因而有效地减弱左边界上的起始。
尽管例如因为一些植物物种到目前为止仍难以进行遗传转化,所
以本发明的一些实施方案目前可能不能实施,但是本发明在这些物种
中的实施仅是时间问题而不是原理问题,因为遗传转化本身的可行性
与本发明的基本实施方案无关。
目前植物物种转化对于大量植物物种包括双子叶植物和单子叶植
物来说是常规的。原则上任何转化方法都可用于将根据本发明所述的
嵌合DNA导入适当祖细胞。根据本发明所述的优选方法包括农杆菌介
导的DNA转移。特别优选的是使用EP A 120 576和美国专利4,940,838
中公开的所谓双元载体技术。
番茄转化优选地基本按Van Roekel等所述的进行〔Van Roekel,
J.S.C.,Damm,B.,Melchers,L.S.,Hoekema,A(1993)影响番茄
(Lycopersicon esculentum)转化频率的因素,植物细胞报告,12,644
-647〕。马铃薯转化优选地基本按Hoekema等所述的进行〔Hoekema,
A.,Huisman,M.J.Molendijk,L.,van den Elazen,P.J.M.和
Cornelissen,B.J.C.(1989)两个对马铃薯X病毒有抗性的商业马铃
薯载培品种的遗传工程,生物/技术7,273-278〕。
尽管有时认为单子叶植物更难于进行遗传转化,但是它们可以接
受转化并且可以从转化的细胞或胚或者其它植物材料再生出可育的转
基因植物。单子叶植物包括商业上重要的作物如水稻和玉米可以接受
通过农杆菌菌株进行的DNA转移(参见WO94/00977;EP 0 159 418 B1;
Gould J,Michael D,Hasegawa O,Ulian EC,Peterson G,Smith RH,
(1991)植物生理学95,426-434)。
已知几乎所有植物都可从培养的细胞或组织再生。再生方法在植
物物种与物种间有所差异,但一般是首先提供转化原生质体的悬浮液
或含有转化外植体的培养皿。可直接诱导苗或经器官发生或胚胎发生
从愈伤组织间接诱导芽并随后使之生根。除了选择性标记,培养基一
般还含有多种氨基酸和激素如植物生长素和细胞因子。向培养基加谷
氨酸和脯氨酸也是有利的,特别是对诸如玉米和紫花苜蓿的物种。有
效再生将取决于培养基、基因型和载培史。如果对这三个可变因素加
以调控,再生常常是可再现和重复的。将转化的基因序列稳定整合入
转基因植物中后,由它们所赋予的特征可通过有性杂交转移给其它植
物。根据所要杂交的物种,可使用任何常规育种技术。
实验部分
实施例1:双元载体骨架的构建
将单一的SalI限制性核酸内切酶位点导入pMOG800以便将用于抑
制连读或反选择带有载体序列的转基因的元件克隆入左边界的相邻
处。此位点位于与左边界相邻的10bp处。用引物SEQ ID NO:1到SEQ ID
NO:4,采用简单的基于PCR的诱变策略产生包含DraIII和NruI单一
位点的片段,此片段与双元载体pMOG800(于1993年8月12日以
CBS414.93保存于真菌菌种保藏中心,Baarn,荷兰)中的相应片段几
乎相同,在T-DNA外离左边界重复序列10bp处有额外的单一SalI
位点。
用DraIII和NruI消化此PCR片段并将其克隆入用DraIII和NruI
消化的pMOG800。获得的质粒称为pNE03。
实施例2:GC富集序列的插入
通过使SEQ ID NO:5和6彼此退火产生40bp GC富集片段。将此
片段插入SalI位点将只在一个完整末端留下SalI位点。合成的双链
寡核苷酸由T4多核苷酸激酶磷酸化并克隆入SalI消化的pNE03载
体。获得的质粒pNE07具有在SalI位点插入的GC富集序列,这导致
左T-DNA边界最近一侧的SalI位点的去除。表示定位的图示见图1。
实施例3:virG结合位点的插入
含有virG结合位点的片段来自农杆菌菌株EHA101的virB启动
子。以前已证明virB启动子含有两个为VirG所识别的vir元件盒序
列(Das和Pazour,1989,核酸研究17,4541-4150)。认为只有Vir
元件盒不足以结合virG蛋白,另外Vir元件盒3’端约19bp的特异性
非保守序列最可能也是结合VirG蛋白所需要的。使用引物SEQ ID NO:7
和8从根瘤农杆菌菌株MOG101 PCR扩增出约90bp的VirB启动子片
段。用SalI和AvaI消化该片段并将其导入pNE03载体的单一SalI
位点。再次定位此片段以使SalI-AvaI末端在离左边界最近处结合。
表示定位的图示见1。此载体称为pNE09。
实施例4:芽孢杆菌RNA酶表达盒的导入
用NcoI和EcoRI位点从pMOG944(WO98/22599)切下芽孢杆菌RNA
酶开放阅读框和nos终止子序列(925bp)并将其克隆入用NcoI和
EcoRI消化的pMOG1302中。pMOG1302含有GapC启动子片段(Shih等,
1991,基因104,133-138)和pMOG445(以pUC为基础)载体骨架
〔pMOG445是通过将用引物SEQ ID NO:9和10制备的合成双链DNA插
入用EcoRI和SstI消化的pUC18从pUC18(Yannisch-Perron和
Messing,1985,基因33,103-119)制备的〕。获得的质粒含有与
Gapc启动子结合的芽孢杆菌RNA酶开放阅读框和nos 3’非翻译序列/
终止子以及位于起始密码子NocI位点上的5’非翻译序列。获得的质
粒称为pNE01。随后用BamHI和XhoI位点将pNE01的完整表达盒(GapC
-芽孢杆菌RNA酶-nos)克隆入pBSK+(Stratagene,La Jolla,CA,
美国)。此质粒称为pNE05。用BamHI消化pNE05并导入破坏BamHI位
点并引入SalI位点的衔接头(SEQ ID NO:11)。获得的质粒是pNE08。
然后用SalI和XhoI将表达盒从pNE08中切出并将其克隆入全都用
SalI消化的修饰的双元载体pNE03、pNE07和pNE09。这导致产生载体
pNE10(仅含芽孢杆菌RNA酶元件盒)、pNE11(GC堆+芽孢杆菌RNA酶盒)
和pNE12(virG结合位点+芽孢杆菌RNA酶元件盒)。
实施例5:GUS标记元件盒的导入
来自pMOG1059的EcoRI-HindIII片段含有GUS表达盒,它包含
1)fdrolD嵌合启动子和非翻译序列(专利申请号97203912,12/12/97
递交),2)含有StLS1内含子的GUS开放阅读框(Vancanneyt等,1990,
Mol.Gen.Genet.220-245-250)和3)蛋白酶抑制剂II基因的3’
非翻译/终止子序列(Thorhburg等,1987,美国国家科学院院报84,
744-748)。将此EcoRI-HindIII片段插入双元载体pNE10、11和12
边界间的EcoRI-HindIII位点。GUS元件盒离右边界最近,发现nptII
选择性标记离左边界最近(见图1)。用pMOG1059作为未修饰的对照,
其载体序列是未经修饰的pMOG800骨架。pMOG1313是在T-DNA上含
有FdrolD-GUS元件盒并含有与其左边界相邻的GC堆的双元载体,
pMOG1314在T-DNA内与之相同,但含有与左边界相邻的virG结合位
点,pMOG1315也含有相同的T-DNA序列并含有与左边界相邻的芽孢
杆菌RNA酶元件盒。同样地,pMOG1316含有GC堆和芽孢杆菌RNA酶
元件盒,而pMOG1317在芽孢杆菌RNA酶元件盒之后含有virG结合位
点。
实施例6:用新双元载体转化马铃薯的频率分析
在三个分开的转化实验中用常规转化方法以根瘤农杆菌菌株
EHA105转化载培品种Kardal的马铃薯茎段(如PCT/EP 98/02979中所
述)。每个构建体最少使用150个外植体。这经常会导致约90个转化
体/构建体的再生。转化频率测定为相对于所用外植体数的能在含卡那
霉素生长培养基上选择压力下生根的再生体数。在表1中我们将对照
构建体pMOG1059的转化频率定为1.0。
表1.对测试的构建体观察到的平均相对转化频率。在每个实验中所
有值以pMOG1059(设为1.00)为标准。数值是三次独立转化实验的平均
值。
构建体
描述
转化频率
pMOG1313
pMOG1314
pMOG1315
pMOG1316
pMOG1317
GC堆
virG结合位点
芽孢杆菌RNA酶
GC+芽孢杆菌RNA酶
virG+芽孢杆菌RNA酶
1.35
1.24
0.97
0.85
0.90
左边界外GC堆或VirG结合位点的插入看来可在一定程度上增加
转化频率。我们并不完全理解此效应的原因。一种解释是对DNA转移
的左边界起始的影响〔正如恰好由一些研究者所指出的(Kononov.M.E.
等,1997,植物杂志11,945-957;Ramanathan,V.和Veluthambi,
K.,1995植物分子生物学28,1149-1154〕将增加T-DNA转移的机
会,这将增加nptII选择性标记的原始转化细胞数目。
实施例7:载体骨架共整合的分析
下面我们通过PCR分析覆盖T-DNA的左右边界的片段,即表明载
体DNA在转化体中整合的片段的存在。对每个构建体,通过多重PCR
分析75个单独株系的外边界序列。以nptII引物作为内对照,用6个
引物进行多重PCR。引物在双元载体上的位置见图2。
使用引物SEQ ID NO:12和13从用载体pMOG1313、pMOG1314和
pMOG1059制备的转化体扩增覆盖左边界的序列,获得约1200bp的片
段。对于用构建体pMOG1315、pMOG1316和pMOG1317制备的转化体,
使用引物SEQ ID NO:12和14扩增其覆盖左边界的序列。此情况中的
外部引物退火到芽孢杆菌RNA酶基因上。选择此引物,因为否则PCR
片段会太大使得不能有效扩增。用内对照nptII的引物SEQ ID NO:15
和16进行的PCR扩增将得到约850bp的片段。对于包含右边界的序
列,用引物SEQ ID NO:17和18扩增到500bp片段。PCR反应在Perkin
-Elmer 480热循环仪上进行。
扩增后,将获得的PCR片段在含有溴化乙锭的0.8%琼脂糖凝胶中
电泳。照相之后计数不同片段并测定连读的百分比(详见表2)。
表2:带有覆盖左右边界的序列的单独转化体的百分比
构建体
仅有LB
仅有RB
LB和RB
都存在
发生边界转移
的株系总数
pMOG1313
pMOG1314
pMOG1315
pMOG1316
pMOG1317
pMOG1059
2.82%
4.76%
4.17%
4.35%
5.56%
2.90%
16.90%
12.70%
6.94%
4.35%
5.56%
8.70%
28.17%
20.63%
2.78%
1.45%
1.39%
37.68%
47.89%
38.10%
13.89%
10.14%
12.50%
49.28%
从表2中可以看出,表现不需要的载体序列共整合的株系数非常
高。用未修饰的pMOG1059构建体制备的转基因株系的约半数有至少部
分载体骨架的整合。当将GC富集序列导入左边界相邻处时此数值没有
降低。将virG结合位点导入左边界相邻处看来可在一定程度上降低边
界转移的数目。明确地,当在左边界外导入GC富集序列或virG结合
位点时,左边界转移的株系数有显著降低(计算为仅带有LB或LB+RB
转移的株系的百分比),从pMOG1059中的40%下降到pMOG133和
pMOG1314转化系中的约30%和25%。
在左边界外只带有芽孢杆菌RNA酶表达盒的构建体pMOG1315表现
带有载体序列的转化体数显著降低。GC片段或virG结合位点与芽孢
杆菌RNA酶的结合看来可进一步降低带有载体序列的转化体数。在我
们的实验中,我们看到带有边界转移的单独株系数下降到约10%,这
相对于未修饰的pMOG1059对照是非常显著的改善。
对我们所收集的初级番茄转化体的粗略调查表明约40%的转基因
番茄植物含有边界外序列。这清楚地表明在其它植物物种中也需要此
技术。
实施例8:使用无毒基因和抗性基因进行T-DNA外载体序列的反选择
将来自丁香假单胞菌的AvrRpml诱导物编码区有效地克隆到强组
成型启动子之后及马铃薯蛋白酶抑制剂II转录终止子序列之前。将此
表达盒导入左T-DNA边界下游的BglII位点。将含有来自拟南芥的以
组成型启动子和终止子序列为侧翼的Rpml抗性基因的基因组DNA片段
导入T-DNA,从而形成pMOG1257(图2)。使用常规方法用构建体进行
欧洲油菜、番茄和马铃薯植物的转化。
通过使用每一转化体基因组DNA的PCR反应,分析用此转化方法
得到的转基因植物中T-DNA外载体序列的存在。所用载体覆盖靠近左
边界的T-DNA外约300bp序列。
实施例9:拷贝数的测定
为测定含有构建体pMOG1317的植物和含有构建体pMOG1059的对
照植物的拷贝数,使用基本如(Rogers和Bendich,1985,植物分子生
物学5,69-76)所述的CTAB提取方法从每株系的25株植物的叶中分
离基因组DNA。用限制性内切酶EcoRI在适当的缓冲液中于37℃消化
约10μg基因组DNA 16小时。此限制性位点在两个构建体中都只有一
个,在GUS表达盒和NPT-II表达盒之间。用1体积酚∶氯仿∶异戊
醇(25∶24∶1,v/v,Gibco BRL公司)抽提消化混合物并用0.1体积
的3M NaAc(pH=5.2)和2.5体积的96%乙醇沉淀。用70%乙醇洗DNA沉
淀,然后将其溶于20μl蒸馏水中。
将每个样品以2V/cm在0.7%琼脂糖凝胶中分离约16小时。用0.4M
NaOH采用Southern印迹将DNA转移到尼龙膜(Hybond-N+,Amersham
Life Science公司)上。用32P-dCTP标记的558bp GUS片段(pMOG18
的NcoI-EcoRV片段;Sijmons等,生物技术,第8卷,1990年3月,
第217-221页)作为探针与印迹杂交(16小时,65℃)。然后以65℃
0.2×SSC的严谨性洗涤印迹。Southern印迹的结果在表3中列出。
表3.在用pMOG1059和pMOG1317转化的不同单独株系中观察到的T-
DNA插入数目
pMOG1059系
拷贝数
pMOG1317系
拷贝数
66
67
68
69
70
71
72
73
74
76
77
78
79
80
81
82
83
85
86
87
88
89
90
91
5
5
1
2
3
3
3
5
6
2
9
3
4
2
3
1
3
1
3
4
9
2
1
2
1
2
3
5
6
7
8
9
11
12
14
15
16
17
18
19
20
21
22
23
25
26
3
1
1
1
4
4
2
2
1
1
1
3
2
4
3
2
1
3
2
2
3
2
平均值
3.4
平均值
2.2
标准偏差
2.2
标准偏差
1.1
序列表
(1)基本信息
(i)申请人:
(A)名称:MOGEN International nv
(B)街道:Einsternweg 97
(C)城市:Leiden
(E)国家:The Netherlands
(F)邮政编号(Zip):2333 CB
(G)电话:31-(0)71-5258282
(H)传真:31-(0)71-5221471
(ii)发明名称:用于植物转化的质粒和使用此质粒的方法
(iii)序列数:18
(iv)计算机可读形式:
(A)介质类型:软盘
(B)计算机:IBM PC兼容机
(C)操作系统:PC-DOS/MS-DOS
(D)软件:PatentIn Release#1.0,版本#1.25(EPO)
(vi)在先申请资料:
(A)申请号:EP 97201990.5
(B)递交目:1997年6月30日
(2)关于SEQ ID NO:1的信息:
(i)序列特征
(A)长度:21个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:cDNA
(iii)假设:否
(iii)反义:否
(xi)序列描述:SEQ ID NO:1:
GATGGCAAAC GCTAATAAGG G 21
(2)关于SEQ ID NO:2的信息:
(i)序列特征
(A)长度:21个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:cDNA
(iii)假设:否
(iii)反义:否
(xi)序列描述:SEQ ID NO:2:
GAGCGGGTTT AACCTACTTC C 21
(2)关于SEQ ID NO:3的信息:
(i)序列特征
(A)长度:39个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:cDNA
(iii)假设:否
(iii)反义:否
(xi)序列描述:SEQ ID NO:3:
CTGTTGTCGA CGGCTGGCTG GTGGCAGGAT ATATTGTGG 39
(2)关于SEQ ID NO:4的信息:
(i)序列特征
(A)长度:38个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:cDNA
(iii)假设:否
(iii)反义:否
(xi)序列描述:SEQ ID NO:4:
CCAGCCGTCG ACAACAGCTC CCCGACCGGC AGCTCGGC 38
(2)关于SEQ ID NO:5的信息:
(i)序列特征
(A)长度:44个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:cDNA
(iii)假设:否
(iii)反义:否
(xi)序列描述:SEQ ID NO:5:
TCGACGGGGT GCCTGGGGCG GTGGCGGGGc GGGCCGGGGC GTGC 44
(2)关于SEQ ID NO:6的信息:
(i)序列特征
(A)长度:44个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:cDNA
(iii)假设:否
(iii)反义:否
(xi)序列描述:SEQ ID NO:6:
TCGAGCACGC CCCGGCCCGC CCCGCCACCG CCCCAGGCAC CCCG 44
(2)关于SEQ ID NO:7的信息:
(i)序列特征
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:线型
(ii)分子类型:cDNA
(iii)假设:否
(iii)反义:否
(xi)序列描述:SEQ ID NO:7:
TTCTCGAGAG GGTCGGTTAC TCG 23
(2)关于SEQ ID NO:8的信息:
(i)序列特征
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:cDNA
(iii)假设:否
(xi)序列描述:SEQ ID NO:8:
TTGTCGACTC CAAGACGCCG AGC 23
(2)关于SEQ ID NO:9的信息:
(i)序列特征
(A)长度:28个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:cDNA
(iii)假设:否
(xi)序列描述:SEQ ID NO:9:
AATTCAGATC TCCATGGATC GATGAGCT 28
(2)关于SEQ ID NO:10的信息:
(i)序列特征
(A)长度:20个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:cDNA
(iii)假设:否
(xi)序列描述:SEQ ID NO:10:
CATCGATCCA TGGAGATCTG 20
(2)关于SEQ ID NO:11的信息:
(i)序列特征
(A)长度:12个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:cDNA
(iii)假设:否
(xi)序列描述:SEQ ID NO:11:
GATCGGTCGA CC 12
(2)关于SEQ ID NO:12的信息:
(i)序列特征
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:cDNA
(iii)假设:否
(xi)序列描述:SEQ ID NO:12:
GACGCTAAAG GCAAACTTGA TTC 23
(2)关于SEQ ID NO:13的信息:
(i)序列特征
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:cDNA
(iii)假设:否
(xi)序列描述:SEQ ID NO:13:
TTAACCTACT TCCTTTGGTT CCG 23
(2)关于SEQ ID NO:14的信息:
(i)序列特征
(A)长度:23个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:cDNA
(iii)假设:否
(xi)序列描述:SEQ ID NO:14:
AGCGGCCCAT TTTAGTAGAC GGG 23
(2)关于SEQ ID NO:15的信息:
(i)序列特征
(A)长度:28个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:cDNA
(iii)假设:否
(xi)序列描述:SEQ ID NO:15:
ATCAATTCGA ACCCCAGAGT CCCGTCCA 28
(2)关于SEQ ID NO:16的信息:
(i)序列特征
(A)长度:21个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:cDNA
(iii)假设:否
(xi)序列描述:SEQ ID NO:16:
CTGGATCGTT TCGCATGATT G 21
(2)关于SEQ ID NO:17的信息:
(i)序列特征
(A)长度:27个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:cDNA
(iii)假设:否
(xi)序列描述:SEQ ID NO:17:
CCAACTTATC AGTGATAAAG AATCCGC 27
(2)关于SEQ ID NO:18的信息:
(i)序列特征
(A)长度:27个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(ii)分子类型:cDNA
(iii)假设:否
(xi)序列描述:SEQ ID NO:18:
GAGATCAGAT TGTCGTTTCC CGCCTTC 27