本发明涉及改善植物生长特性的方法。更具体地,本发明涉及通过 调控编码GRUBX蛋白的核酸的表达和/或通过调控植物中GRUBX蛋白的活 性和/或水平而改善植物生长特性的方法。本发明还提供了新的GRUBX蛋 白和编码这样的蛋白的核酸。本发明还涉及包含GRUBX编码核酸的构建 体和具有受调控的GRUBX蛋白编码核酸的表达和/或受调控的GRUBX蛋白 活性和/或水平的植物,该植物相对于对应的野生型植物而言具有改善的 生长特性。
基于不断增长的世界人口和日益减少的农用土地面积,提高农业 效率和增加园艺植物的多样性仍然是农业研究的一个主要目标。作物 和园艺改良的传统方式采用选择育种技术来识别具有需要的特性的植 物。然而,这种选择育种技术具有几个缺点,即这些技术通常是劳动 密集型的,导致经常含有异源遗传组分的植物,其可能不总是产生从 亲本植物传承的理想性状。此外,合适的用于提供理想性状的供体物种 可能是稀少的。分子生物学的进步已经允许人类操纵动物和植物的种 质。植物的遗传工程使分离和操纵遗传材料(通常为DNA或RNA的形式) 以及随后将遗传材料导入植物成为可能。这种技术已经导致具有多种 改良的经济学、农艺学或园艺学性状的植物的开发。具体的、有经济 学价值的性状是生长特性,例如高产量。产量通常定义为来自作物的经 济价值的可度量生产。这可以以数量和/或质量的方式来定义。作物产量 会受到植物或作物面临的典型压力的不利影响。这样的压力包括非生物 的压力,例如非典型的高温或低温造成的温度压力;营养缺乏造成的压 力;缺少或过量水造成的压力(干旱,水灾),化学试剂例如肥料或杀 虫剂造成的压力。典型的压力也包括生物的压力,其可以由其它植物(杂 草,或高密度种植效应)、动物害虫(包括由放牧造成的压力)和病原体强 加于植物上。作物产量不但可以通过与作物或植物面临的一种或多种压 力进行斗争来提高,也可以通过改良植物的固有生长机理来提高。可以 在几种水平和通过多种代谢过程控制植物的固有生长机理。一种这样的 过程是通过泛素-介导的蛋白降解控制细胞中的蛋白水平。
泛素化指通过缀合泛素分子而修饰蛋白。术语泛素化经常延伸指能 介导泛素蛋白或能模仿泛素功能的蛋白的结合的过程。泛素化是真核细 胞控制蛋白的稳定性、功能和亚细胞定位的万能工具。该机制在蛋白降 解、细胞周期控制、应激反应、DNA修复、信号转导、转录调节和囊泡 运输中起中心作用。由于泛素介导的蛋白降解是许多细胞过程的基础, 它是受到高度调节的,且需要高底物特异性和足够的下游效应物多样性。 已知几种泛素-结合蛋白。这些蛋白经常具有模块域结构。例如,泛素结 合蛋白通常将泛素结合域与可变的效应物域结合起来。其次,也存在其 它的类型,其不含有泛素结合域,但是具有类似于泛素的三级结构,因 此可以模仿泛素化的某些方面(泛素样域)。
随着有关于基因组序列的更多信息可供利用,泛素相关基序和存在 于泛素和泛素样蛋白中的结构域的数目也在增加。那些结构域的一些原 型是例如UBA,UBD,UIM和UBX(见例如Pfam数据库;Bateman等, Nucleic Acids Research 30(1):276-280(2002))。UBX结构域是约80 个氨基酸残基长的序列,其功能未知,存在于多种生物的蛋白中。大多 数这样的蛋白属于5个进化保守家族之一,如人FAF1,p47,Y33K,REP8, 和UBXD1蛋白所示例(Buchberger等(2001)J.Mol.Biol.307,17-24; Carim-Todd等(2001)Biochim.Biophys.Acta 1517,298-301)。典 型地,UBX结构域位于蛋白的C-末端。
结构证据揭示了UBX结构域在泛素-有关的过程中的功能;更具体地, UBX结构域可能参与蛋白-蛋白相互作用。通常预测包含UBX结构域的蛋 白主要存在于细胞质中,但是也已经报道了其它的亚细胞定位。例如, 已经证实,磷酸化这种用于调节许多蛋白的活性的特异性蛋白修饰也会 影响FAF-1向核中的运输(Olsen等(2003)FEBS Lett.546,218-222)。
总之,已经提出含有UBX的动物蛋白可能参与与细胞凋亡、细胞周 期或降解蛋白的靶向有关的基因的增强表达。
Arabidopsis的基因组已经被完全测序,该植物中存在至少15种含 有UBX的蛋白。根据序列相似性,它们可以分成FAF1,p47,Y33K和UBXD1 组,仅仅与REP8相对应的组似乎不存在于植物中(见图1)。象动物界一 样,植物蛋白中的UBX结构域与其它结构域一起存在,象例如SEP,G6PD, PUG,或锌指结构。已经描述了含有UBX的蛋白和这些蛋白的域结构(见 Buchberger(2002)Trends Cell Biol.12,216-221),它们可以通过 使用专门的数据库例如SMART进行搜索来鉴别(Schultz等(1998) Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)核 酸研究30,242-244)。
PUG结构域(Pept ide:N-Glycanases and other putative nuclear UBX-domain-containing Proteins;Doerks等(2002)Genome Research 12,47-56)与对于泛素-介导的蛋白水解重要的结构域共同存在于蛋白 中,包括UBX(在哺乳动物和植物中),UBA(在植物中)和UBC结构域(在 Plasmodium中)。认为含有PUG的蛋白例如PNG酶在未折叠的蛋白反应 (即能将异常的蛋白与正确折叠的蛋白区别开的内质网(ER)质量控制监 视系统)中起作用。在一些情况下,已经证实这些错误折叠的和/或未折 叠的蛋白会通过所谓的ER-联合的降解机制降解,该机制包含泛素-蛋白 酶体系统(Suzuki等(2000)J.Cell Bio l.149,1039-1052)。PUG 结构域的变化形式也存在于IRE1p型激酶中,已知它们在未折叠蛋白反 应的起始阶段起作用(Shamu和Walter(1996)EMBO J.15,3028-3039)。
最近表征的包含UBX结构域的Arabidopsis蛋白是PUX1(Rancour 等(2004)J.Biol.Chem.,online publication 10.1074/jbc.M405498200)。PUX1是Arabidopsis中的单个基因,可能 在植物中普遍表达。已证实该蛋白是AAA-型ATP酶CDC48的非竞争性抑 制剂。PUX1通过它的UBX结构域与非六聚形式的CDC48(但不与六聚形 式的CDC48)相结合。推测PUX1有利于有活性的六聚CDC48的解装配, 且该过程需要所述蛋白的N-末端结构域。pux1敲除植物表现出了更快 发育成熟,但是不具有总体形态学异常。除了PUX1以外,证实了2种其 它的包含UBX结构域的蛋白(PUX2和PUX3)能与CDC48相互作用(Rancour 等,2004)。PUX2(At2g01650)以前公开在WO 03/085115(基因和蛋白 序列分别公开为SEQ ID NO:1和SEQ ID NO:2)。
现在已经发现,调控植物中编码GRUBX蛋白(包含生长有关UBX结构 域的蛋白)的核酸、尤其是编码SEQ ID NO:2示例的GRUBX蛋白的核酸 的表达,能产生具有改良的生长特性的植物。因此,根据本发明的第一 个实施方案,提供了改善植物的生长特性的方法,包括调控植物中编码 GRUBX蛋白的核酸的表达,和/或调控植物中GRUBX蛋白的活性和/或水 平。根据本发明的一个优选方面,受调控的表达是增加的表达,受调控 的活性和/或水平是增加的活性和/或水平。任选地,可以选择具有改良 的生长特性的植物。
对编码GRUBX蛋白的核酸的表达的调控(增强或减少)或对GRUBX蛋 白本身的活性和/或水平的调控,可以源自特定细胞或组织中改变的基因 表达和/或基因产物(即多肽)的改变的活性和/或水平。受调控的表达 可以源自内源性GRUBX基因的改变的表达水平,和/或可以源自以前导 入植物中的GRUBX编码核酸的改变的表达。类似地,受调控的GRUBX蛋 白的水平和/或活性可以是内源性GRUBX基因的改变的表达水平的结果, 和/或可以源自以前导入植物中的GRUBX编码核酸的改变的表达。当 GRUBX蛋白的水平没有变化时,或甚至当GRUBX蛋白的水平减少时,活 性可以增加。这可以通过改变固有的性质来实现,例如,通过制备比野 生型更有活性的突变体。还包括抑制或刺激调节序列,或提供新的调节 序列,其能驱动编码GRUBX的天然基因或编码GRUBX的转基因的表达。 这样的调节序列可以被导入植物中。例如,导入植物中的调节序列可以 是启动子,其能驱动内源性GRUBX基因的表达。
通过导入遗传修饰(优选地在GRUBX基因的基因座中),可以调控基 因的表达和蛋白的活性和/或水平。如本文中定义的基因的基因座用于指 包含目标基因和编码区上游或下游10kb的基因组区域。可以通过例如 任一种(或多种)下述的方法导入遗传修饰:TDNA活化,TILLING,定 位诱变,同源重组,或通过在植物中导入和表达编码GRUBX多肽或或其 同系物的核酸。在导入遗传修饰后进行选择增加的GRUBX多肽活性的步 骤,该活性的增加会产生具有改良的生长特性的植物。
T-DNA活化标记(Hayashi等Science(1992)1350-1353)包含以 使启动子能指导所靶向基因的表达的构型将通常含有启动子(也可以是 翻译增强子或内含子)的T-DNA插入目标基因的基因组区域或基因编码 区的上游或下游10kB。典型地,破坏所靶向基因的天然启动子对它的 表达的调节,该基因处于新导入的启动子控制下。启动子典型地嵌入在 T-DNA中。该T-DNA随机地插入植物基因组中,例如通过土壤杆菌感染 实现,并导致插入的T-DNA附近的基因的过表达。由于所导入启动子附 近的基因的过表达,得到的转基因植物表现出显性表型。要导入的启动 子可以是能指导基因在需要的生物(在该情况下是植物)中的表达的任 意启动子。例如,组成型、组织特异性的、细胞类型特异性的和诱导型 启动子都适用于T-DNA活化。
使用TILLING(基因组中靶向诱导的局部损害)技术,也可以将遗传 修饰导入GRUBX基因的基因座中。这是一种诱变技术,可以用于产生和 /或鉴别以及最终分离能表现出GRUBX活性的GRUBX核酸的诱变变体。 TILLING也允许选择携带这样的突变变体的植物。这些突变变体甚至可 以表现出比处于自然形式的基因更高的GRUBX活性。TILLING将高密度 诱变和高通量筛选方法结合起来。典型地,在TILLING中进行如下的步 骤:(a)EMS诱变(Redei和Koncz(1992),C Koncz,N-H Chua,J Schell 编,Methods in Arabidopsis Research.World Scientific,Singapore, pp 16-82;Feldmann等,(1994)EM Meyerowitz,CR Somerville编, Arabidopsis.Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,pp137-172;Lightner和Caspar(1998),J Martinez-Zapater,J Salinas编,Methods on Molecular Biology,Vol. 82.Humana Press,Totowa,NJ,pp 91-104);(b)DNA制备和个体的 合并;(c)目标区域的PCR扩增;(d)变性和退火,以允许形成异源双 链体;(e)DHPLC,其中异源双链体在库(pool)中的存在以色谱图中的 多余峰检测出来;(f)鉴别突变个体;和(g)对突变PCR产物测序。 TILLING的方法是本领域众所周知的(McCallum,Nat Biotechnol.2000 Apr;18(4):455-7,Stemple,Nature Rev.Genet.5,145-150,2004)。
定位诱变可以用于产生GRUBX核酸或其保留GRUBX活性(例如阳离 子转移剂活性)的部分的变体。可以有几种方法可用于实现定位诱变, 最常见的是基于PCR的方法(见例如Ausubel等,Current Protocols in Molecular Biology. Wiley Eds. http://www.4ulr.com/products/cUrrentprotocols/index.html)。
TDNA活化、TILLING和定位诱变是能产生新的等位基因和保留GRUBX 功能的GRUBX变体的技术实例,因此可以用于本发明的方法中。
同源重组允许在规定的选择位点处导入所选定核酸的基因组。同源 重组是生物科学中常规地用于低等生物(例如酵母和苔藓 Physcomitrella)的标准技术。不但已经针对模型植物(Offringa等 (1990)EMBO J.9,3077-3084),而且已经针对作物植物例如稻(Terada 等,(2002)Nature Biotechnol.20,1030-1034;或Iida和Terada(2004) Curr.Opin.Biotechno l.15,132-138)描述了在植物中进行同源重组 的方法。待靶向的核酸(其可以是GRUBX核酸分子或如前文定义的变体) 不需要被靶向到GRUBX基因的基因座,但是可以导入例如高表达区域。 待靶向的核酸可以是用于替代内源基因的等位基因,或可以除内源基因 之外还额外导入。
优选的调控GRUBX基因的表达、或调控GRUBX蛋白的活性和/或水平 的方法包括向植物中导入编码GRUBX蛋白或其同系物、衍生物或活性片 段的分离核酸序列。通过例如转化,可以将该核酸导入植物。因此,根 据本发明的一个优选方面,提供了改善植物的生长特性的方法,包括将 GRUBX编码核酸导入植物中并表达。
如本文所定义的,术语GRUBX蛋白指至少包含UBX结构域、优选包 含UBX和PUG结构域、并且可选地包含锌指结构域的蛋白。优选地,GRUBX 蛋白在结构上与人UBXD1蛋白(SPTrEMBL AAH07414)相关。优选地,GRUBX 蛋白来自植物。更优选地,GRUBX蛋白来自茄科(Solanaceae),更优选 地,GRUBX是来自烟草的蛋白,最优选地,GRUBX是由SEQ ID NO:2 代表的蛋白或者其同系物、衍生物或活性片段,该同系物、衍生物或活 性片段具有与SEQ ID NO:2类似的生物活性。但是,应当理解,来自单 子叶植物的GRUBX蛋白同样可以用于本发明的方法中,包括来自玉米 (Zea mays),甘蔗(Saccharum officinarum)(SEQ ID NO 4),稻(Oryza sativa)(SEQ ID NO 7),小麦(Triticum sp.),大麦(Hordeum sp.), 和高粱(Sorghum sp.)的GRUBX蛋白,因为这些序列与SEQ ID NO 2有 关(见图1b)。
当在如本发明中使用的谷醇溶蛋白启动子控制下在稻中表达编码这 样的GRUBX蛋白的核酸时,GRUBX蛋白的活性之一是增加种子产量,尤 其是提高收获指数。有利地,GRUBX蛋白能在Rancour等(2004)所述的 条件下与植物CDC48蛋白相互作用。
用SMART工具分析了烟草的GRUBX蛋白,并用于筛选Pfam(11.0版, November 2003;Bateman等(2002)Nucl.Acids Res.30,276-280) 和InterPro数据库(Release 7.0,22July 2003;Mulder等(2003) Nucl.Acids.Res.31,315-318)。GRUBX蛋白包含UBX结构域(PF00789, SM00166,IPR001012)和PUG结构域(SM00580,IPR006567)。如InterPro 中定义的UBX结构域出现在泛素-调节蛋白(它们是泛素化途径的成员) 以及许多其它的蛋白中,包括FAF-1(FAS-有关的因子1),人Rep-8再 生蛋白(reproduction protein)和几种假定的来自酵母的蛋白。在 Arabidopsis中,预测约20种蛋白包含该结构域。PUG结构域可见于真 核生物的蛋白激酶、N-聚糖酶和其它核蛋白中,推定其参与蛋白-蛋白相 互作用(评论见Suzuki&Lennarz(2003)Biochem Biophys Res Commun. 302,1-5和Biochem Biophys Res Commun.303,732)和RNA结合(Doerks 等,2002)。PUG结构域经常与UBA或UBX结构域一起出现在Arabidopsis 蛋白中(Doerks等,2002)。图2a给出了如SMART数据库(软件版本4.0, 2003年9月15日的序列数据库更新)中定义的UBX和PUG结构域的共有 序列;图2b显示了SEQ ID NO 2和SPTrEMBL Q9ZU93各自的UBX和PUG 结构域;图2c显示了这2种蛋白的BLAST比对;图2d和2e分别显示了 SEQ ID NO 2和SEQ ID NO 4之间、SEQ ID NO 4和SEQ ID NO 7之间的 比对。指示了PUG和UBX结构域。
任选地,锌指结构域可以存在于GRUBX蛋白中。如InterPro中定义 的,锌指结构域是首先在爪蟾(Xenopus laevis)转录因子TFIIIA中鉴 定到的核酸结合蛋白结构。已经在许多核酸结合蛋白中发现了这些结构 域。锌指结构域由25-30个氨基酸残基组成,包括处于C-2-C-12-H-3-H 型基序中的2个保守的Cys和2个保守的His残基。分隔第2个Cys和 第1个His的12个残基主要是极性和碱性的,表明该区域会参与核酸结 合。锌指结构基序是非同寻常地小的、自折叠的结构域,其中Zn是它的 三级结构的关键组分。所有锌指结构域都能结合四面体阵列中的Zn原 子,导致指-样突出的形成,后者可以与核酸大沟中的核苷酸相互作用。 该Zn能结合保守的Cys和His残基。已经发现指能结合约5个碱基对 的核酸一一含有小批量的鸟嘌呤残基,且具有结合RNA和DNA的能力。 锌指结构因而可以代表原始的核酸结合蛋白。已经提出,以Zn为中心的 结构域可以用于蛋白相互作用中,例如蛋白激酶C中。根据参与锌原子 的空间定位的组氨酸和半胱氨酸残基的数目和位置,表征了许多类型的 锌指结构。在要表征的称作C2H2(IPR007087)的第一类中,第一对锌配 价残基由半胱氨酸组成,而第二对是组氨酸。另一个锌指结构域 (IPR006642)可以是在酿酒酵母蛋白Rad18中发现的类型。同样,锌指 结构域是假定的核酸结合序列。但是,如本文定义的GRUBX蛋白中的任 选的锌指结构域不限于C2H2或Rad18类型,而可以是任意类型的锌指结 构域。
如本文所定义的,术语GRUBX核酸/基因指编码GRUBX蛋白的所有核 酸或其互补体。核酸可以(直接地或间接地(如果随后修饰))源自任何天 然的或人工的来源,只要当在植物中表达时该核酸能导致受调控的GRUBX 核酸/基因的表达或受调控的GRUBX蛋白活性和/或水平。核酸可以分离 自微生物来源,例如细菌、酵母或真菌,或植物、藻类或动物(包括人) 来源。优选地,核酸源自真核生物。优选地,GRUBX核酸是植物来源, 更优选地是单子叶或双子叶植物来源,更优选地,GRUBX核酸编码来自 茄科的GRUBX蛋白,更优选地,GRUBX核酸是来自烟草的核酸序列,最 优选地,GRUBX核酸是由SEQ ID NO:1代表的核酸序列或其功能部分, 或是能与其杂交的核酸序列,该杂交序列编码具有GRUBX蛋白活性、即 与SEQ ID NO:1类似的生物活性的蛋白,也包括编码由SEQ ID NO:2 代表的氨基酸序列或其同系物、衍生物或活性片段的核酸。或者,编码 GRUBX蛋白的核酸可以源自Poaceae科,优选稻。通过审慎的人工操纵, 该核酸可以在组成和/或染色体组环境中由其天然形式修饰得到。核酸序 列优选地是同源核酸序列,即结构上和/或功能上相关的核酸序列,优选 地从植物得到,无论是来自相同的植物物种还是不同的植物物种。
术语“功能部分”指编码多肽的GRUBX基因的一部分,所述多肽保 留了GRUBX蛋白的相同生物活性,且具有UBX结构域,优选地还具有PUG 结构域,并且可选地具有锌指结构域。术语“GRUBX核酸/基因”也包括 由于遗传密码的简并性产生的编码GRUBX蛋白的核酸变体,编码GRUBX 的核酸的等位基因变体,编码GRUBX的核酸的不同剪接变体,和被一个 或多个插入序列中断的变体。
有利地,使用编码GRUBX蛋白的核酸序列(例如由SEQ ID NO:1代 表的序列)的部分,或通过使用优选地在严格条件下能与编码GRUBX蛋白 的核酸序列杂交的序列(该杂交序列编码具有GRUBX活性的蛋白),或通 过使用GRUBX蛋白的同系物、衍生物或活性片段,例如根据SEQ ID NO: 2的序列,或通过使用编码这些同系物、衍生物或活性片段的核酸,也 可以实施本发明的方法。
在多种真核生物中,可以发现GRUBX蛋白的同系物,例如由SEQ ID NO 2代表的。最接近的同系物通常是在植物界中发现。拟南芥基因组似乎 具有至少15种GRUBX蛋白,其中具有SPTrEMBL Q9ZU93和Q8LGE5(MIPS No.At2G01650,或GenBank AY084317和AAM60904)所示序列的同系物是 SEQ ID NO:2的最接近的同系物,SEQ ID NO:2的其它合适的同系物包 括来自甘蔗的SEQ ID NO 4,其由SEQ ID NO 3代表的核酸编码,来自稻 的SEQ ID NO 7(其由SEQ ID NO 6代表的核酸序列编码),和来自Pinus taeda的GenBank登记号BQ198347和BF778922。
本领域的技术人员熟知搜索和鉴别GRUBX同系物的方法。这样的方 法包括使用本领域众所周知的进行序列比对或对比的算法,例如GAP (Needleman和Wunsch,J.Mol.Biol.48,443-453(1970)),BESTFIT (使用Smith和Waterman的局部同源性算法(Advances in Applied Mathematics 2,482-489(1981))),BLAST(Altschul,S.F.,Gish,W., Miller,W.,Myers,E.W.&Lipman,D.J.,J.Mol.Biol.215,403-410 (1990)),FASTA和TFASTA(W.R.Pearson和D.J.Lipman Proc.Natl. Acad.Sci.USA 85,2444-2448(1988)),将计算机可读格式的由SEQ ID NO 1或2代表的序列与可以从公开数据库得到的序列进行对比,所述数 据库例如MIPS(慕尼黑蛋白序列信息中心,http://mips.gsf.de/), GenBank(http://www.ncbi.nlm.nih.gov/Genbank/index.html)或EMBL 核苷酸序列数据库(http://www.ebi.ac.uk/embl/index.html)。可以从 国家生物技术信息中心公开地得到进行BLAST分析的软件。使用blast 缺省参数(例如BLASTN程序高级选项:G-Cost(打开缺口)=5;E-Cost (延伸缺口)=2;q-Penaity(错配)=-3;r-Reward(匹配)=1;e-期望值 (E)=10.0;W-字符大小=11;TBLASTN程序高级选项:G-Cost(打开缺 口)=11;E-Cost(延伸缺口)=1;e-期望值(E)=10.0;W-字符大小=3), 可以鉴别出上述的同系物。随着更多的基因组被测序,预期可以鉴定到 更多的GRUBX同系物。
迄今尚不知道由SEQ ID NO:6代表的序列。因此,在本发明的第二 个实施方案中提供了分离的核酸序列,其包含
(a)由SEQ ID NO:6代表的核酸序列,或其互补链;
(b)编码由SEQ ID NO:7代表的氨基酸序列或其同系物、衍生物或 活性片段的核酸序列;
(c)能与上述(i)或(ii)的核酸序列(优选地在严格条件下)杂交的核 酸序列,该杂交序列优选地编码具有GRUBX活性的蛋白;
(d)根据上面的(i)至(iii)的核酸序列,其因遗传密码而是简并性 的;
(e)核酸,它是根据(a)-(d)的核酸序列的等位基因变体;
(f)核酸,它是根据(a)-(e)的核酸序列的可变剪接变体;
(g)核酸序列,它与(a)-(f)定义的任意一个或多个序列具有75.00%, 80.00%,85.00%,90.00%,95.00%,96.00%,97.00%,98.00%或99.00% 序列一致性;
(h)上述(a)-(g)中任一项的核酸序列的一部分,该部分优选地编码 具有GRUBX活性的蛋白。
由SEQ ID NO:4代表的序列是从4个EST序列(CA154270,CA144028, BQ535511&CA184742)装配而成,迄今尚不知道。因此,提供了选自下 述的分离的GRUBX蛋白:
(i)如SEQ ID NO 4所述的多肽;
(ii)如SEQ ID NO 7所述的多肽;
(iii)多肽,其氨基酸序列与SEQ ID NO 4或7所述的氨基酸序列 具有至少40.00%序列一致性,优选50.00%、60.00%、70.00%序列一致性, 更优选80%或90%序列一致性,最优选95.00%、96.00%、97.00%、98.00% 或99.00%序列一致性;
(iv)多肽,其至少包含UBX结构域,优选地包含UBX和PUG结构域, 并可选地包含锌指结构域;
(v)(i)至(iv)中任一项定义的蛋白的同系物、衍生物、免疫活性的 和/或功能性片段,
条件是所述多肽序列不是由SEQ ID NO 2或者数据库条目Q9ZU93, AAR01744,Q9D7L9,Q9BZV1,Q99PL6,ENSANGP00000020442,Q7SXA8, Q9V8K8,Q96IK9,ENSRNOP00000037228,或AAH07414代表的序列。
术语GRUBX包括与SEQ ID NO 2代表的GRUBX同源的蛋白。因此, 在本发明的方法中使用的优选同系物至少包含UBX结构域,优选地,它 们包含UBX和PUG结构域。GRUBX蛋白的“同系物”包括肽、寡肽、多 肽、蛋白和酶,与未修饰的目标蛋白相比,其具有氨基酸取代、缺失和/ 或插入,且具有与它们所来源的未修饰蛋白相似的生物和功能活性。为 了生产这样的同系物,可以将蛋白的氨基酸替换为具有类似性质(例如类 似的疏水性,亲水性,抗原性,形成或破坏α-螺旋结构或β-片结构的 倾向)的其它氨基酸。保守取代表是本领域众所周知的(见例如Creighton (1984)Proteins.W.H.Freeman和Company)。
可用于本发明方法的同系物与未修饰的蛋白具有至少40.00%序列一 致性或相似性(功能一致性),或者与未修饰的蛋白具有至少50.00%序 列一致性或相似性,或者与未修饰的蛋白具有至少60.00%序列一致性或 相似性,或者与未修饰的蛋白具有至少70.00%序列一致性或相似性。典 型地,同系物与未修饰的蛋白具有至少80%序列一致性或相似性,优选 地具有至少85.00%序列一致性或相似性,更优选地,与未修饰的蛋白具 有至少90.00%序列一致性或相似性,最优选地,与未修饰的蛋白具有至 少95.00%,96.00%,97.00%,98.00%或99.00%序列一致性或相似性。使 用比对程序例如GAP,可以计算一致性百分比。尽管其可能表现出相对 较低的序列同源性(低至大约40.00%),GRUBX蛋白在结构上是高度保守 的,所有全长蛋白至少具有UBX结构域、优选地具有UBX结构域和PUG 结构域,并且可选地具有锌指结构域。因此,可以容易地发现其它植物 物种中的GRUBX蛋白(如上述稻和甘蔗的新序列所证实的)。
同源蛋白可以归入“蛋白家族”中。通过功能和序列相似性分析,例 如Clustal W,可以确定蛋白家族。通过Clustal W程序,可以产生与 GRUBX同源的蛋白的邻近-连接树,并得到它的结构和祖先关系的良好概 况(见例如图1a和b,用Vector NTI Suite 5.5,Informax构建)。在 本发明的一个具体实施方案中,GRUBX同系物属于与SEQ ID NO 2对应 的蛋白相同的蛋白家族。
在Arabidopsis基因组中,鉴定到了优选的GRUBX蛋白家族成员 (Q9ZU93,GenBank Refseq NM_126226)。还在其它植物例如稻、甘蔗或 其它单子叶植物中,如上所述鉴别出了GRUBX蛋白家族成员。还有利地, 这些家族成员也可以用于本发明的方法中。
同源性的2种特殊形式,即正向同源和共生同源,是用于描述基因 的祖先关系的进化概念。术语“共生同源”指因物种基因组内的一个或 多个基因重复产生的同源基因。术语“正向同源”指不同生物中由于基 因的祖先关系形成的同源基因。如本文使用的,术语“同系物”也包括 可用于本发明方法中的蛋白的共生同源物和正向同源物。使用例如BLAST 程序,通过用目标查询基因查询一个或多个基因数据库,可以鉴别出正 向同源基因。然后,再对搜索得到的最高级别目标基因进行BLAST分析, 并仅仅将与查询基因再次匹配的那些目标基因保留为真正的正向同源基 因。
如果寻找例如稻中的正向同源基因,可针对来自可以从NCBI得到的 稻Nipponbare的28,469个全长cDNA克隆对目标序列进行搜索(blast)。 当从核苷酸开始时,可以使用BLASTn或tBLASTX;或当从蛋白开始时, 可以使用BLASTP或TBLASTN,其中使用标准的缺省值。可以过滤搜索结 果。然后,针对目标序列的来源生物(in casu烟草)的序列,将过滤 结果或未过滤结果的全长序列反向搜索(第二次搜索)。然后,对比第一 次和第二次搜索的结果。当第二次搜索的结果得到了与查询GRUBX核酸 或GRUBX多肽有最高相似性的击中(hit)时,则发现了正向同源基因。 如果对于特定的查询序列,用GRUBX的共生同源基因发现了最高击中, 则将这样的查询序列也视作GRUBX的同系物,条件是该同系物具有GRUBX 活性,且至少包含UBX结构域,优选包含UBX结构域和PUG结构域,并 可选地包含锌指结构域。当用Clustal W分析得到的序列并展示在邻近 连接树中时,可以进一步细化结果。该方法可以用于鉴定许多不同物种 中的正向同源基因。
鉴别相关蛋白组中的功能性正向同源物的另一种方法是,确定该蛋 白家族的成员的表达模式和组织分布,由此预期存在于相同组织中并具 有类似表达模式的序列将具有相关的功能。鉴别蛋白的功能性同系物的 另一种方法是鉴别具有类似的保守域结构的序列。预期携带相同结构域 的蛋白,尤其是当结构域的分布是保守的时,将能执行类似的功能。因 而,化学结构和调节(表达模式,组织特异性)的相似性可以用于鉴定 GRUBX的功能同系物。
GRUBX的“同系物”包括与未修饰蛋白相比具有氨基酸取代、插入和 /或缺失的蛋白。
蛋白的“取代变体”是这样的,其中已经去除了氨基酸序列中的至 少一个残基,并且在它的位置插入了不同的残基。氨基酸取代通常是单 个残基,但是根据多肽的功能限制,也可以成串;插入通常是约1-10个 氨基酸残基的量级,缺失的范围是从约1至20个残基。优选地,氨基酸 取代包含保守的氨基酸取代。
蛋白的“插入变体”是这样的,其中在蛋白的预定位置处导入了一 个或多个氨基酸残基。插入可以包括氨基端和/或羧基端的融合以及单个 或多个氨基酸的序列内插入。通常,氨基酸序列内的插入比氨基或羧基 端的融合小为约1-10个残基的量级。氨基端或羧基端融合蛋白或肽的实 例包括在酵母双杂交系统中使用的转录活化子的结合域或活化结构域、 噬菌体包膜蛋白,(组氨酸)6-标签,谷胱甘肽S-转移酶标签,蛋白A, 麦芽糖-结合蛋白,二氢叶酸还原酶,标签·100表位,c-myc表位,FLAG- 表位,1acZ,CMP(钙调蛋白-结合肽),HA表位,蛋白C表位和VSV表 位。
蛋白的“缺失变体”以从该蛋白中去除一个或多个氨基酸为特征。 蛋白的氨基酸变体可以容易地用本领域众所周知的肽合成技术制成,例 如固相肽合成等,或通过重组DNA操作。本领域众所周知操作DNA序列 来产生蛋白的取代、插入或缺失变体的方法。例如,在DNA中预先确定 的位点处产生取代突变的技术为本领域技术人员熟知,包括M13诱变, T7-Gen体外诱变(USB,Cleveland,OH),QuickChange定位诱变 (Stratagene,San Diego,CA),PCR-介导的定点诱变或其它定点诱变方 案。
术语“衍生物”指肽,寡肽,多肽,蛋白和酶,它们与天然形式的 蛋白质的氨基酸序列、例如SEQ ID NO 2或4所列的氨基酸序列相比, 可以包含天然和非天然发生的氨基酸残基的取代、缺失或添加。GRUBX 的“衍生物”包含肽、寡肽,多肽,蛋白和酶,它们与多肽的天然形式 的氨基酸序列相比可以包含天然发生的改变,糖基化,酰基化或非天然 发生的氨基酸残基。与其来源的氨基酸序列相比,衍生物也可以包含一 个或多个非氨基酸的取代,例如报告分子或其它配体,其与氨基酸序列 共价地或非共价地结合,例如结合其上以促进其检测的报告分子,以及 相对于天然发生蛋白的氨基酸序列而属于非天然发生的氨基酸残基。
GRUBX蛋白的“活性片段”包括蛋白的至少80个毗邻氨基酸残基, 该残基能保留与天然发生的蛋白类似的生物和/或功能活性。活性片段至 少包含UBX结构域,优选地,活性片段包含UBX和PUG结构域。
有利地,根据本发明的方法也可以用DNA或核酸序列的部分来实施, 该部分编码保留GRUBX活性的多肽。DNA序列的部分指源自原始(更大的) DNA分子或从中制备的一片DNA,当在植物中表达时,该DNA部分能产生 具有改良的生长特性的植物。该部分包含至少200个核苷酸,且至少包 含编码UBX结构域、优选地UBX结构域和PUG结构域以及可选地锌指结 构域的序列。可以通过例如使GRUBX核酸分子产生一个或多个缺失而制 备部分。该部分可以包含许多基因,有或没有其它的控制元件,或可以 仅仅含有间隔序列等。该部分可以是分离的形式,或者与其它的编码(或 非编码)序列相融合,以便例如生成兼有几种活性的蛋白,所述活性之 一是当在谷醇溶蛋白启动子控制下在植物中表达时,可增加种子产量。 优选地,该部分是SEQ ID NO:1,SEQ ID NO:3或SEQ ID NO:6中任 一个上的部分。
本发明也包括能与编码GRUBX蛋白的核酸序列杂交的核酸序列,该 核酸序列也可以用于实施根据本发明的方法。如本文定义的,术语″杂交 ″是基本上同源的互补核苷酸序列相互退火的过程。杂交过程可以完全在 溶液中进行,即互补核酸都在溶液中。依赖于这一过程的分子生物学工 具包括聚合酶链反应(PCR;以及所有以此为基础的方法)、扣除杂交、随 机引物延伸、核酸酶S1作图、引物延伸、反转录、cDNA合成、RNA差异 显示、以及DNA序列确定。也可以用固定到基质例如磁珠、琼脂糖珠子 或任何其它树脂上的互补核酸之一进行杂交过程。依赖于这一过程的分 子生物学工具包括聚(A+)mRNA的分离。此外,也可以用固定到固体支持 物例如硝酸纤维素或尼龙膜,或者用如光刻技术固定到例如硅玻璃支持 物(后者称作核酸阵列或微阵列或核酸芯片)上的互补核酸之一进行杂 交过程。依赖于这一过程的分子生物学工具包括RNA和DNA凝胶印迹分 析、克隆杂交、斑点杂交、原位杂交和微阵列杂交。为了使杂交发生, 核酸分子通常被热或化学变性,以将双链熔解为两条单链,和/或从单链 核酸中去除发卡结构或其它二级结构。杂交的严格性受条件例如温度、 盐浓度和杂交缓冲液组成的影响。
对于需要高选择性的应用,本领域的技术人员通常希望采用相对严 格的条件,以形成杂合体,例如,人们会选择相对较低的盐和/或高温条 件,例如由约0.02M至约0.15M NaCl、约50℃至约70℃的温度提 供的条件。杂交的高严格性条件因而包括高温度和/或低盐浓度(盐包括 NaCl和柠檬酸钠,但是也可以受下述因素的影响:杂交缓冲液中包含甲 酰胺,和/或降低杂交缓冲液中化合物例如SDS(十二烷基硫酸钠)的浓 度,和/或从杂交缓冲液中排除硫酸葡聚糖或聚乙二醇(促进分子拥挤) 等化合物。足够低的严格杂交条件特别优选地用于分离与上面定义的本 发明DNA序列同源的核酸。有助于同源性的因素包括等位性、遗传密码 的简并和优选密码子用法的差异。
在核酸杂交实验例如DNA印迹和RNA印迹杂交的上下文中,“严格的 杂交条件”和“严格的杂交洗涤条件”是序列依赖性的,且在不同的环 境参数下是不同的。例如,较长的序列能在较高的温度下特异性地杂交。 Tm是在确定的离子强度和pH下,50%靶序列与完全匹配的探针杂交时的 温度。特异性通常是杂交后洗涤的函数。这种洗涤的关键因素包括最终 洗涤溶液的离子强度和温度。
通常,严格条件被选择成比特定序列在定义的离子强度和pH下的热 熔点(Tm)低约50℃。Tm是在定义的离子强度和pH下,50%靶序列与完全 匹配的探针杂交时的温度。Tm依赖于溶液条件和探针的碱基组成,且可 以用下面的方程计算:
Tm=79.8℃+(18.5xlog[Na+])+(58.4℃x%[G+C])-(820x(双链 体中的碱基对数目)-1)-(0.5x%甲酰胺)
更优选的严格条件是温度在Tm以下20℃时,最优选的严格条件是 温度在Tm以下10℃时。使用许多已知技术中的任一种,例如用含有蛋 白的溶液封闭膜,向杂交缓冲液添加异源的RNA、DNA和SDS,以及用RNA 酶处理,也可以控制非特异性的结合。
通常在杂交严格性或更低条件下进行洗涤条件。通常,用于核酸杂 交测定或基因扩增检测方法的合适的严格条件如上所述。也可以选择更 严格或更不严格的条件。
为了确定严格性的水平,可以方便地参考Sambrook等(2001) Molecular Cloning:a laboratory manual,3rd Edition Cold Spring Harbor Laboratory Press,CSH,New York或Current Protocols in Molecular Biology,John Wiley&Sons,N.Y.(1989)。低严格性条件 的实例是4-6x SSC/0.1-0.5%w/v SDS,37-45℃,2-3小时。根据杂 交中所涉及的核酸的来源和浓度,可以采用替代性的严格性条件,例如 中等严格性条件。中等严格性条件的实例包括1-4x SSC/0.25%w/v SDS, ≥45℃,2-3小时。高严格性条件的实例包括0.1-1x SSC/0.1%w/v SDS,60℃,1-3小时。熟练技术人员能知道杂交及洗涤期间可以改变 的多种参数,以维持或改变严格性条件。例如,另一种严格的杂交条件 是在4x SSC、65℃杂交,然后在0.1x SSC、65℃洗涤约1小时。或 者,另一种严格的杂交条件是50%甲酰胺,4x SSC,42℃。严格条件 的另一个实例包括在62℃、6x SSC、0.05x BLOTTO杂交,在2x SSC、 0.1%w/v SDS、62℃洗涤。
使用编码GRUBX蛋白的核酸序列的可变剪接变体,也可以实施本发 明的方法。如本文使用的,术语“可变剪接变体”包括核酸序列的变体, 其中所选择的内含子和/或外显子已经被切除、替代或加入。这种剪接 变体可以是这样的,其中蛋白的生物活性保留不受影响,这可以通过选 择性地保留蛋白的功能片段来实现。这种剪接变体可以在自然界中发现 或人工制造。制造这样的剪接变体的方法是本领域众所周知的。因此, 根据本发明的另一个方面,提供了改善植物的生长特性的方法,其包括 调控编码GRUBX蛋白的核酸序列的可变剪接变体在植物中的表达,和/ 或调控由可变剪接变体编码的GRUBX蛋白的活性和/或水平。优选地,剪 接变体是由SEQ ID NO:1代表的序列的剪接变体。
有利地,使用编码GRUBX蛋白的核酸序列的等位基因变体、优选 由SEQ ID NO:1代表的序列的等位基因变体,也可以实现根据本发明 的方法。等位基因变体存在于自然界中,在本发明的方法中包括这些 天然等位基因的应用。等位基因变体包括单核苷酸多态性(SNP),以及 小插入/缺失多态性(INDEL)。INDEL的大小通常小于100bp。在大多 数生物体的自然发生的多态系中,SNP和INDEL形成了最大一组的序 列变体。
本发明也包括这些等位基因变体在特定的常规育种程序中的应用, 例如在标记-辅助的育种中的应用;这可以是它们在本发明方法中的应用 的补充。这样的育种程序有时需要通过植物的诱变处理,将等位基因变 异导入植物中。一种合适的诱变方法是EMS诱变。然后,通过例如PCR, 可以进行等位基因变体的鉴定。其后是选择GRUBX目标序列的优秀等位 基因变体的选择步骤,所述变体能在植物中产生改良的生长特性。典型 地,通过监视含有目标序列的不同等位基因变体(例如,SEQ ID NO:1 的不同的等位基因变体)的植物的生长性状来进行选择。监视生长性状 可以在温室或田地中进行。其它任选的步骤包括将其中鉴定到了优秀的 等位基因变体的植物与另一植物杂交。这可以用于例如制备令人感兴趣 的表型特征的组合。
因此,由于GRUBX基因中的突变可以天然产生,它们可以构成选择 表现出高产的植物的基础。因此,作为本发明的另一个方面,提供了选 择具有改良的生长特性的植物的方法,该方法是基于对GRUBX序列的优 秀等位基因变体(其能在植物中产生改良的生长特性)的选择。
根据本发明的方法也可以通过向植物中导入(自然的或人工的)染 色体(例如细菌人工染色体(BAC))的至少一部分来实现,该染色体至少含 有编码GRUBX蛋白的基因/核酸序列(例如SEQ ID NO:1或SEQ ID NO 3),优选地还含有一个或多个相关基因家族成员和/或编码GRUBX 表达和/或活性的调节蛋白的核酸序列。因此,根据本发明的另一个 方面,提供了通过向植物中导入至少包含编码GRUBX蛋白的基因/核 酸的染色体的至少一部分来改善植物的生长特性的方法。
根据本发明的另一个方面,可以在育种程序中利用编码GRUBX蛋白 的核酸。该核酸序列可以位于染色体或其一部分上,其至少包含编码 GRUBX蛋白的核酸序列,并优选地包含一个或多个相关的家族成员。在 这样的育种程序的实例中,鉴定出可以与能调控植物中编码GRUBX蛋白 的核酸表达的基因遗传上连接的DNA标记,该基因可以是编码GRUBX蛋 白本身的基因,或是可能直接或间接影响编码GRUBX蛋白的基因表达和/ 或GRUBX蛋白本身的活性的任意其它基因。然后,该DNA标记可以用于 育种程序,以选择具有改良的生长特性的植物。
本发明因此扩展到编码GRUBX蛋白的核酸序列在育种程序中的应用。
GRUBX核酸或其变体或者GRUBX多肽或其同系物可以用于育种程序, 其中鉴定出可能与GRUBX基因或其变体遗传上连接的DNA标记、理想的 性状或数量性状基因座(QTL)。该理想特征或QTL可以包含能影响该理想 性状的单个基因或一串相连的基因。GRUBX或其变体或者GRUBX或其同 系物可以用于定义分子标记。该DNA或蛋白标记然后可以用于育种程序, 以选择具有改良的生长特性的植物。GRUBX基因或其变体可以是例如由 SEQ ID NO:1代表的核酸,或编码任一种上述同系物的核酸。
GRUBX的等位基因变体也可以用于标记-辅助的育种程序。这样的育 种程序有时需要通过对植物的诱变处理,使用例如EMS诱变,导入等位 基因变异;或者,该程序可以从所谓的(无意中造成的)“天然”来源的 等位基因变体集合开始。然后,可以通过例如PCR进行等位基因变体的 鉴别。其后是选择目标序列的优秀等位基因变体的选择步骤,所述变体 能在植物中产生改良的生长特性,例如提高的收获指数。通常通过监测 含有目标序列的不同等位基因变体(例如,SEQ ID NO:1的不同等位基 因变体)或编码任一种上述植物同系物的核酸的不同等位基因变体之植 物的生长性状来进行选择。可以在温室或田间监测生长性状。其它任选 的步骤包括将其中鉴定出导致增强的GRUBX活性的优秀等位基因变体的 植物与另一植物杂交。这可以用于例如制备令人感兴趣的表型特征的组 合。
GRUBX核酸或其变体也可以用作探针,对它们作为其中一部分的基 因在遗传上和物理上作图,以及作为与那些基因有联系的性状的标记。 这样的信息可以用于植物育种,以开发具有需要的表型的品系。GRUBX核 酸或其变体的这种应用仅仅需要至少10个核苷酸长的核酸序列。GRUBX 核酸或其变体可以用作限制性片段长度多态性(RFLP)标记。可以用GRUBX 核酸或其变体探测限制性消化的植物基因组DNA的DNA印迹。然后,可 以使用计算机程序例如MapMaker(Lander等(1987)Genomics 1, 174-181),对得到的带型进行遗传分析,以构建遗传图谱。另外,该核 酸可以用于探测DNA印迹,后者含有一组个体的经限制性内切核酸酶处 理的基因组DNA,所述个体代表确定的遗传杂交的亲本和后代。注意到 DNA多态性的分离,并用于计算GRUBX核酸或其变体在以前使用该群体 得到的遗传图谱中的位置(Botstein等(1980)Am.J.Hum.Genet.32, 314-331)。
植物基因衍生的探针的生产和在遗传作图中的应用记载在Bematzky 和Tanksley(Plant Mol.Biol.Reporter 4,37-41,1986)。许多出 版物描述了使用上述方法或其变化形式对特定cDNA克隆进行遗传作图。 例如,F2杂交群体,回交群体,随机交配的群体,近等基因系,和其它 组的个体可以用于作图。这样的方法是本领域的技术人员众所周知的。
核酸探针也可以用于物理作图(即,将序列置于物理图谱上;见 Hoheisel等:Non-mammalian Genomic Analysis:A Practical Guide, Academic press 1996,pp.319-346,和其中引用的文献)。
在另一个实施方案中,核酸探针可以用于直接荧光原位杂交(FISH) 作图中(Trask(1991)Trends Genet.7,149-154)。尽管当前的FISH 作图方法偏好使用大克隆(几至几百kb;见Laan等(1995)Genome Res. 5,13-20),灵敏度的提高可以允许使用更短探针进行FISH作图。
使用核酸可以实现许多基于核酸扩增的遗传和物理作图方法。实例 包括等位基因特异性的扩增(Kazazian(1989)J.Lab.Clin.Med.11, 95-96),PCR-扩增的片段的多态性(CAPS;Sheffield等(1993) Genomics 16,325-332),等位基因特异性的连接(Landegren等(1988) Science 241,1077-1080),核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18,3671),放射杂交作图(Walter等(1997)Nat.Genet.7, 22-28)和Happy Mapping(Dear和Cook(1989)Nucleic Acid Res.17, 6795-6807)。对于这些方法,核酸序列被用于设计和生产用于扩增反应 或引物延伸反应的引物对。这样的引物的设计是本领域的技术人员众所 周知的。在采用基于PCR的遗传作图的方法中,必须鉴别作图杂交的亲 本在与本核酸序列相对应的区域中的DNA序列差异。但是,这通常不是 作图方法所必需的。
这样,可以产生、鉴别和/或分离具有改变的GRUBX活性、表现出改 良的生长特性的改良植物。
根据本发明的另一个特征,提供了改善植物生长特性的方法,其包 括调控植物中编码GRUBX蛋白的核酸序列的表达和/或调控GRUBX蛋白的 水平和/或活性,其中所述核酸序列和所述蛋白包括选自下述的变体:
(i)编码GRUBX蛋白的核酸序列的可变剪接变体,或其中所述GRUBX 蛋白由剪接变体编码;
(ii)编码GRUBX蛋白的核酸序列的等位基因变体,或其中所述GRUBX 蛋白由等位基因变体编码;
(iii)编码GRUBX蛋白的核酸序列,其包含在人工染色体的至少一部 分上,该人工染色体优选地还包含一个或多个相关基因家族成员;
(iii) GRUBX编码核酸的功能部分;
(iv)能与GRUBX编码核酸杂交的序列;
(v)GRUBX蛋白的同系物、衍生物和活性片段。
根据本发明的一个优选的方面,实现了核酸的增强的或增加的表达。 获得基因或基因产物的增强的或增加的表达的方法是本领域熟知的,包 括例如(强)启动子驱动的过表达,转录增强子或翻译增强子的使用。可 以将充当启动子或增强子元件的分离的核酸导入非异源形式的多核苷酸 的合适位置(通常为上游),以便上调GRUBX核酸或其变体的表达。例如, 通过突变、缺失和/或取代,可以体内地改变内源性启动子(见Kmiec,美 国专利号5,565,350;Zarling等,PCT/US93/03868),或可以将分离的 启动子以合适的方向和与本发明基因的距离导入植物细胞,以便控制基 因的表达。优选地,在植物或植物细胞中过表达在本发明中有用的核酸。 如本文使用的,术语过表达指在原始野生型表达水平上附加的任意形式 的表达。优选地,要导入植物中的核酸和/或要在植物中过表达的核酸相 对于它所可操作地连接的启动子而言是有义方向。优选地,要过表达的 核酸编码GRUBX蛋白,更优选地,编码GRUBX蛋白的核酸序列分离自双 子叶植物,优选茄科,更优选地,其中所述序列分离自烟草,最优选地, 所述核酸序列由SEQ ID NO:1或其一部分代表,或编码由SEQ ID NO:2 代表的氨基酸序列或其同系物、衍生物或活性片段。或者,编码GRUBX 蛋白的核酸序列由MIPS No.At2g01650,SEQ ID NO:3或6代表,或是 其一部分,或编码由Q9ZU93,SEQ ID NO:4或7代表的氨基酸序列,或 编码其同系物、衍生物或活性片段。应当指出,本发明的适用性不依赖 于由SEQ ID NO:1代表的核酸的应用,也不依赖于编码SEQ ID NO:2 的氨基酸序列的核酸序列,而是在本发明的方法中可以使用编码SEQ ID NO:2的同系物、衍生物或活性片段的其它核酸序列,或SEQ ID NO:1 的一部分,或能与SEQ ID NO:1杂交的序列。更具体地,在本发明的方 法中有用的核酸编码至少包含UBX结构域、优选包含UBX结构域和PUG 结构域、以及可选地包含锌指结构域的蛋白质。
根据本发明的另一个实施方案,提供了促进可用于本发明方法中的 核苷酸序列的导入和/或表达的遗传构建体和载体。因此,根据本发明的 第三个实施方案,提供了基因构建体,其包含:
(i)编码GRUBX蛋白的核酸;
(ii)一个或多个控制序列,其能调节(i)所述核酸序列的表达;和任 选的
(iii)转录终止序列。
条件是所述编码GRUBX蛋白的核酸不是由GenBank登记号AX927140 代表的核酸。
使用本领域的技术人员众所周知的重组DNA技术,可以建立可用于 本发明方法中的构建体。可以将该基因构建体插入载体,后者可以从商 业上得到,适用于转化植物,并适用于目标基因在转化的细胞中的表达。 所述遗传构建体可以是表达载体,其中核酸序列可操作地连接了一个或 多个允许在原核和/或真核宿主细胞中表达的控制序列。
根据本发明的一个优选实施方案,所述遗传构建体是设计成过表达 核酸序列的表达载体。该核酸序列可以是编码GRUBX蛋白或其同系物、 衍生物或活性片段的核酸序列,例如前文所述的任一种核酸序列。优选 的核酸序列是由SEQ ID NO:1代表的序列或其部分或能与其杂交的序列 或者编码由SEQ ID NO:2代表的序列或其同系物、衍生物或活性片段的 核酸序列。优选地,相对于它所可操作地连接的控制序列而言以有义方 向克隆该核酸。
用包含目标序列的载体(即能调控编码GRUBX蛋白的核酸表达的核酸 序列)转化植物,该序列可操作地连接了一个或多个控制序列(至少是启 动子)。术语“调控元件”、“控制序列”和“启动子”在这里都可互换 使用,并且作广义理解,指能实现它们所连接的序列的表达的调节核酸 序列。前述术语包括源自经典的真核基因组基因的转录调节序列(包括精 确的转录起始所必需的TATA盒,具有或不具有CCAAT盒序列)以及附加 的调控元件(即上游活化序列,增强子,沉默子),其响应于发育和/或 外部刺激或者以组织特异性的方式改变基因表达。在该术语范围内也包 含经典原核基因的转录调控序列,在该情形下,它可以包括-35盒序列 和/或-10盒转录调节序列。术语“调控元件”也包含能赋予、活化或增 强核酸分子在细胞、组织或器官中的表达的合成融合分子或衍生物。如 本文使用的,术语“可操作地连接”指启动子序列和目标基因之间的功 能性连接,这种连接使得启动子序列能够启动目标基因的转录。
有利地,根据所需要的结果,可以使用任意类型的启动子来驱动核 酸序列的表达。合适的启动子包括在单子叶植物例如稻或玉米中有活性 的启动子。
优选地,能调控编码GRUBX蛋白的基因的表达的核酸序列可操作地 连接了种子偏好的启动子。如本文定义的,术语“种子偏好的”指主要 在种子组织中表达的启动子,但不一定仅在该组织中表达。术语“种子 偏好的”包括在种子中有活性的所有启动子。种子组织包括种子的任何 部分,包括胚乳、糊粉或胚。优选地,种子偏好的启动子是谷醇溶蛋白 启动子,或类似强度的启动子和/或具有类似表达模式的启动子。最优选 地,谷醇溶蛋白启动子由SEQ ID NO:5所示表达盒中的核苷酸1-654 代表。通过例如将启动子偶联到报告基因上,并测定报告基因在各种植 物组织中的表达,可以分析启动子强度和/或表达模式。本领域的技术人 员众所周知的一种合适的报告基因是细菌β-葡糖醛酸糖苷酶。其它种子 -偏好的启动子的实例如表1所示,这些启动子可用于本发明的方法中。
表1:用于实施本发明的种子偏好的启动子实例:
也可以将内含子序列添加到5′非翻译区或部分编码序列的编码序 列处,以增加在胞质中积累的成熟信使的量。已经证实,在植物和动物 表达构建体的转录单元中包含可剪接的内含子可以使基因表达在mRNA 和蛋白水平上增加高达1000-倍(Buchman和Berg,Mol.Cell Biol.8, 4395-4405(1988);Callis等,Genes Dev.1,1183-1200(1987))。 当置于转录单元的5′末端附近时,这种基因表达的内含子增强通常是 最大的。本领域已知玉米内含子Adh1-S内含子1、2和6,Bronze-1内 含子的应用。一般参见The Maize Handbook,Chapter 116,Freeling and Walbot,Eds.,Springer,N.Y.(1994)。
任选地,在导入植物的构建体中也可以应用一个或多个终止子序列。 术语“终止子”包括控制序列,其是在转录单元末端的DNA序列,它给 予初级转录物的3’端加工和多聚腺苷酸化和转录终止的信号。其它的 调控元件可以包括转录以及翻译增强子。本领域技术人员已知适用于实 施本发明的终止子和增强子序列。本领域技术人员可以知道或可以容易 地得到这种序列。
本发明的遗传构建体还可以包括复制序列起点,其是在特定细胞类 型中维持和/或复制所必需的。一个实例是,当需要在细菌细胞中以附 加体遗传元件(例如质粒或粘粒分子)形式维持遗传构建体之时。优选的 复制起点包括,但不限于f1-ori和colE1.
遗传构建体可以可选地包含选择标记基因。如本文使用的,术语″选 择标记基因″包括能赋予它在其中表达的细胞以表型从而促进已被本发 明核酸构建体转染或转化的细胞的鉴别和/或选择的任何基因。合适的标 记可以选自能赋予抗生素或除草剂抗性的标记,其能导入新的代谢性状, 或允许视觉选择。选择标记基因的实例包括赋予对抗生素(例如能磷酸化 新霉素和卡那霉素的nptII,或能磷酸化潮霉素的hpt)、除草剂(例如能 提供对Basta的抗性的bar,能提供对草甘磷的抗性的aroA或gox)的抗 性的基因,或能提供代谢性状的基因(例如manA,其允许植物使用甘露 糖作为唯一碳源)。视觉标记基因会导致颜色(例如β-葡糖醛酸糖苷酶, GUS)、发光(例如萤光素酶)或荧光(绿色荧光蛋白,GFP,和其衍生物)的 形成。
在优选的实施方案中,如上所述的遗传构建体包含以有义方向偶联 到启动子上的GRUBX,所述启动子优选地是种子偏好的启动子,例如稻 谷醇溶蛋白启动子。因此,本发明的另一个方面是载体构建体,其包含 基本上类似于SEQ ID NO 5的表达盒,其中包含谷醇溶蛋白启动子,烟 草GRUBX基因和T-玉米醇溶蛋白+T-二磷酸核酮糖氧合酶/羧化酶δGA 转录终止子序列。基本上类似于SEQ ID NO 5的序列包括编码与SEQ ID NO 2同源的蛋白或与SEQ ID NO 1杂交的第一核酸序列,该第一核酸可 操作地连接了谷醇溶蛋白启动子或具有类似表达模式的启动子,另外或 备选地,该第一核酸连接了转录终止序列。
因此,根据本发明的另一个方面,提供了核酸构建体,其包含表达 盒,其中含有选自下述的编码GRUBX蛋白的核酸序列:
(i)由SEQ ID NO:1代表的核酸序列或其互补链;
(ii)编码由SEQ ID NO:2代表的氨基酸序列或其同系物、衍生物或 活性片段的核酸序列;
(iii)能与上述(i)或(ii)的核酸序列(优选地,在严格条件下) 杂交的核酸序列,该杂交序列优选地编码具有GRUBX蛋白活性的蛋白;
(iv)根据上述(i)至(iii)的核酸序列,其由于遗传密码而是简并的;
(v)核酸序列,它是根据(i)至(iv)的核酸序列的等位基因变体;
(vi)核酸序列,它是根据(i)至(v)的核酸序列的可变剪接变体。
本发明也包括可通过根据本发明的方法得到的植物。本发明因此提 供了可通过根据本发明的方法得到的植物,该植物具有改良的生长特性, 且该植物具有改变的GRUBX蛋白活性和/或水平和/或编码GRUBX蛋白的 核酸的改变的表达,条件是所述GRUBX蛋白不是由GenBank登记号 AX927140代表的核酸序列编码。
因而,根据本发明的第四个实施方案,提供了生产具有改良的生长 特性的转基因植物的方法,包括向植物中导入和表达本发明的核酸分子。
更具体地,本发明提供了生产具有改良的生长特性的转基因植物的 方法,该方法包括:
(a)向植物或植物细胞中导入核酸序列,该核酸序列能与其或其一部 分杂交,编码GRUBX蛋白或其同系物、衍生物或活性片段;
(b)在促进植物生长的条件下培养该植物。
可以将GRUBX蛋白本身和/或GRUBX核酸本身细胞直接导入植物细 胞或植物本身(包括导入植物的组织、器官或任何其它部分)。根据本发 明的一个优选的特征,所述核酸优选地通过转化导入植物内。该核酸优 选地是SEQ ID NO:1代表的核酸或其一部分或能与其杂交的序列,或是 编码由SEQ ID NO:2代表的氨基酸序列或其同系物、衍生物或活性片段 的核酸。或者,该核酸序列是MIPS No.At2g01650,SEQ ID NO:3,SEQ ID NO 6中的任一个,或其一部分,或能与任一种前述序列杂交的序列。 或者,氨基酸序列可以是由SPTrEMBL Q9ZU93,GenBank登记号AAR01744, SEQ ID NO:4,SEQ ID NO 7中的任一个代表的序列,或其同系物、衍 生物或活性片段。
这里涉及的术语“转化”包括将外源性多核苷酸转移到宿主细胞中, 而不考虑用来转移的方法。能够随后克隆繁殖(无论通过器官发生的还 是胚发生的)的植物组织都可以用本发明的遗传构建体来转化,由此再 生整株植物。选择的特定组织根据可供利用的克隆繁殖系统而变化,且 最好适合于被转化的特定物种。代表性的组织目标包括叶盘、花粉、胚、 子叶、下胚轴、雌配子体、愈伤组织、已有的分生组织(例如顶端分生组 织,腋芽,以及根分生组织),和诱导的分生组织(例如,子叶分生组织 和下胚轴分生组织)。多核苷酸可以被瞬时地或稳定地导入宿主细胞中, 并可以非整合形式保持,例如作为质粒。或者,它可以整合入宿主基因 组。所获得的转化植物细胞然后可以用于以本领域技术人员已知的方式 再生转化植物。
目前植物物种的转化是一种相当常规的技术。有利地,可以使用几 种转化方法中的任意一种,将目标基因导入合适的祖细胞中。转化方法 包括使用脂质体、电穿孔、能增加游离DNA摄入的化学物质、向植物中 直接注射DNA、粒子枪轰击、用病毒或花粉转化和显微发射。方法可以 选自:用于原生质体的钙/聚乙二醇方法(Krens,F.A.等,1882, Nature 296,72-74;Negrutiu I.等,June 1987,Plant Mol.Biol.8, 363-373);原生质体的电穿孔(Shilllto R.D.等,1985 Bio/Technol 3, 1099-1102);向植物材料显微注射(Crossway A.等,1986,Mol.Gen Genet 202,179-185);DNA或RNA-包被的粒子轰击(Klein T.M.等,1987, Nature 327,70),用(非整合的)病毒感染等。
采用任何一种众所周知的稻转化方法,例如下列文献中的任一篇所 描述的方法,生成表达GRUBX基因的转基因稻植物,优选通过土壤杆菌 -介导的转化进行:公开的欧洲专利申请EP1198985 A1,Aldemita和 Hodges(Planta,199,612-617,1996);Chan等(Plant Mol.Biol.22 (3)491-506,1993);Hiei等(Plant J.6(2)271-282,1994);其内 容在这里全篇引作参考。在玉米转化的情形下,优选的方法记载在Ishida 等(Nat.Biotechnol.1996 Jun;14(6):745-50)或Frame等(Plant Physiol. 2002May;129(1):13-22),其内容在这里全篇引作参考。
通常,在转化后,筛选植物细胞或细胞组中由与目标基因共转移的 植物可表达基因编码的一个或多个标记的存在情况,接着使转化材料再 生为完整的植物。
DNA转移和再生后,可以例如使用DNA印迹分析评价推定转化的植 物中目标基因的存在、拷贝数和/或基因组组成。可选地或附加地,可 以使用RNA印迹和/或蛋白分析这两种本领域普通技术人员所熟知的技 术监测新导入的DNA的表达水平。
所产生的转化植物可以通过多种方式繁殖,如通过克隆繁殖或传统 的育种技术。例如,第一代(或T1)转化植物可以自花受精,以产生纯 合的第二代(或T2)转化体,T2植物进一步通过传统育种技术繁殖。
所产生的转化生物体可以采取多种形式。例如,它们可以是转化细 胞和非转化细胞的嵌合体;克隆转化体(例如,所有细胞被转化而含有表 达盒);转化和非转化组织的嫁接体(例如,在植物中,将转化的根状茎 (rootstock)嫁接到未转化的接穗上)。
本发明无疑延伸至通过本文描述的任意方法产生的任意植物细胞或 植物,及其所有植物部分、繁殖体和后代。本发明进一步延伸至包含已 经由任意的前述方法产生的初级转化或转染细胞、组织、器官或整株植 物的后代,唯一的要求是后代表现出与通过根据本发明的方法在亲本中 产生的相同的基因型和/或表型特征。本发明也包括含有分离的编码 GRUBX蛋白的核酸分子的宿主细胞。优选的根据本发明的宿主细胞是植 物细胞。因此,本发明也包括宿主细胞,转基因植物细胞,或具有改良 的生长特性的转基因植物,其特征在于所述宿主细胞、转基因植物或植 物细胞具有编码GRUBX蛋白的核酸序列的增加表达和/或GRUBX蛋白的增 加的活性和/或水平。
本发明也延伸至植物的可收获部分,例如但不限于种子、叶、果实、 花、茎或茎培养物、根茎、根、块茎、鳞茎和其直接衍生的产物,例如 干球或粉末、油、脂肪和脂肪酸、淀粉或蛋白。
如本文使用的,术语“植物”包括整株植物、植物的祖先和后代、 植物部分、植物细胞、组织和器官。术语“植物”也包括悬浮培养物、 胚、分生组织区域、愈伤组织、叶、花、果实、种子、根(包括根茎和 块茎)、芽、球茎、茎、配子体、孢子体、花粉、以及小孢子。本发明的 方法中特别有用的植物包括藻类、厥类和所有属于植物界 (Viridiplantae)超家族的植物,特别是单子叶和双子叶植物,包括饲 料或草料豆类、观赏植物、粮食作物、树木或灌木,其选自下列植物: 秋葵属(Abelmoschus spp.),槭属(Acer spp.),猕猴桃属(Actinidia spp.),冰草属(Agropyron spp.),葱属(Allium spp.),苋属 (Amaranthus spp.),菠萝,番荔枝属(Annona spp.),旱芹(Apium graveolens),拟南芥,花生属(Arachis spp),菠萝蜜属(Artocarpus spp.),石刁柏(Asparagus officinalis),燕麦(Avena sativa),阳 桃(Averrhoa carambola),冬瓜(Benincasa hispida),Bertholletia excelsoa,甜菜,芸苔属(Brassica spp.),Cadaba farinosa,茶 (Camellia sinensis),美人蕉(Canna indica),辣椒属(Capsicum spp.),番木瓜(Carica papaya),大花假虎刺(Carissa macrocarpa), 红花,山核桃属(Carya spp.),栗属(Castanea spp.),Cichorium endivia,樟属(Cinnamomum spp.),西瓜(Citrullus lanatus),柑 桔属(Citrus spp.),椰子属(Cocos spp.),咖啡属(Coffea spp.), 可乐果属(Cola spp.),芋头(Colocasia esculenta),榛属(Corylus spp.),山楂属(Crataegus spp.),香瓜属(Cucumis spp.),南瓜属 (Cucurbita spp.),菜蓟属(Cynara spp.),野胡萝卜(Daucus carota), 山蚂蝗属(Desmodium spp.),龙眼(Dimocarpus longan),薯蓣属 (Dioscorea spp.),柿树属(Diospyros spp.),稗属(Echinochloa spp.),(Eleusine coracana),枇杷(Eriobotrya japonica),红 果仔(Eugenia uniflora),荞麦属(Fagopyrum spp.),水青冈属(Fagus spp.),无花果(Ficus carica),金橘属(Fortunella spp.),草莓 属(Fragaria spp.),银杏(Ginkgo biloba),大豆属(Glycine spp.), 陆地棉(Gossypium hirsutum),向日葵属(Helianthus spp.),木槿 属(Hibiscus spp.),大麦属(Hordeum spp.),甘薯(Ipomoea batatas), 胡桃属(Juglans spp.),莴苣(Lactuca sativa),山黧豆属(Lathyrus spp.),浮萍属(Lemna spp.),兵豆(Lens culinaris),亚麻(Linum usitatissimum),荔枝(Litchi chinensis),百脉根属(Lotuss pp.), 棱角丝瓜(Luffa acutangula),羽扇豆属(Lupinus spp.),硬皮豆 属(Macrotyloma spp.),Malpighia emarginata,苹果属(Malus spp.), Mammea americana,Mangifera indica,木薯属(Manihot spp.),人 心果(Manilkara zapota),紫苜蓿(Medicago sativa),草木犀属 (Melilotus spp.),薄荷属(Mentha spp.),苦瓜属(Momordica spp.), Morus nigra,芭蕉属(Musa spp.),烟草属(Nicotiana spp.),木 犀榄属(Olea spp.),仙人掌属(Opuntia spp.),料豆属(Ornithopus spp.),稻属(Oryzas pp.),稷(Panicum miliaceum),Passiflora edulis,欧防风(Pastinaca sativa),鳄梨属(Persea spp.),皱叶 欧芹(Petroselinum crispum),菜豆属(Phaseolus spp.),刺葵属 (Phoenix spp.),酸浆属(Physalis spp.),松属(Pinuss pp.),阿 月浑子(Pistacia vera),豌豆属(Pisum spp.),早熟禾属(Poa spp.), 杨属(Populus spp.),牧豆树属(Prosopis spp.),李属(Prunus spp.), 番石榴属(Psidium spp.),石榴(Punica granatum),西洋梨(Pyrus communis),栎属(Quercuss pp.),萝卜(Raphanus sativus),Rheum rhabarbarum,茶藨子属(Ribes spp.),悬钩子属(Rubus spp.),甘 蔗属(Saccharum spp.),接骨木属(Sambucus spp.),黑麦(Secale cereale),胡麻属(Sesamum spp.),茄属(Solanum spp.),高粱 (Sorghum bicolor),菠菜属(Spinacia spp.),蒲桃属(Syzygium spp.), 酸豆(Tamarindus indica),可可(Theobroma cacao),三叶草属 (Trifolium spp.),Triticosecale rimpaui,小麦属(Triticum spp.), 越桔属(Vaccinium spp.),野豌豆属(Vicia spp.),豇豆属(Vigna spp.),葡萄属(Vitis spp.),玉米,Zizania palustris,枣属 (Ziziphus spp.)等。
根据本发明的一个优选的特征,所述植物是作物植物,包含大豆,向 日葵,芸苔(canola),苜蓿,油菜(rapeseed)或棉花。更优选地, 根据本发明的植物是单子叶植物,例如甘蔗,最优选地谷类,例如稻, 玉米,小麦,黍,大麦,黑麦,高粱或燕麦。
但是,预期本发明的方法可以适用于广泛种类的植物,因为已知的 真核GRUBX同系物中的结构域保守性暗示着在细胞代谢中同样保守的功 能。
有利地,本发明方法的实施会产生具有许多改良的生长特性的植物, 这样的改良的生长特性包括改良的生长,增加的产量和/或增加的生物 量,改良的结构和改良的细胞分裂,每项都是相对于对应的野生型植物 而言。
本发明涉及改良植物的生长特性的方法,或生产具有改良的生长特 性的植物的方法,其中所述生长特性包含选自下述的任意一个或多个: 增加的产量,增加的生物量,增加的总地上面积,增加的植物高度,增 加的分蘖数,增加的第一圆锥花序数,增加的第二圆锥花序数,增加的 种子总数,增加的饱满种子数,增加的每株植物总种子产量,增加的种 子生物量,增加的种子大小,增加的种子体积,提高的收获指数,增加 的千粒重量(TKW),改变的周转时间和/改变的生长曲线。本发明也提供 了改变上述生长特性之一而不损及其它生长特性之一的方法,例如增加 地上绿组织面积,同时维持相同的饱满种子数和相同的种子产量。
术语“增加的产量”包括与对应的野生型植物的生物量相比,植物 的一个或多个部分的生物量的增加。该术语也包括种子产量的增加,这 包括种子生物量(种子重量)的增加和/或(饱满)种子数的增加和/或种子 大小的增加和/或种子体积的增加,每项都是相对于对应的野生型植物而 言的。对于玉米,种子产量的增加可以由每穗(种子)排数的增加和/或每 排粒数的增加来反映。以稻为例,产量增加可以表现为下述的一项或多 项:每公顷或英亩的植物数,每株植物的圆锥花序数,每个圆锥花序的 小穗数,每个圆锥花序的花数,种子饱满率的增加,等等。种子大小和/ 或体积的增加也可以影响种子的组成。种子产量的增加可能是由于花朵 数目和/或大小的增加所致。产量的增加也可能提高收获指数,后者以总 生物量与可收获部分(例如种子)的产量的比例;或千粒重量表示。增 加的产量也包括以更高的密度种植的能力(每公顷或英亩的植物数)。
术语“改良的细胞分裂”包括细胞分裂的增加或减少或者异常的细 胞分裂/胞质分裂,改变的分裂平面,改变的细胞极性,改变的细胞分 化。该术语也包含核内有丝分裂、胞质分裂(acytokinesis)、多倍性、 多染色线和核内再复制等现象。
可以预见,当与对应的野生型植物相比较时,具有增加的生物量和 高度的植物能表现出改良的生长速率。如本文使用的,术语“改良的生 长速率”包括、但不限于在植物生命周期的一个或多个阶段,植物的一 个或多个部分的(包括绿色生物量,包括种子)更快的生长速率。术语“改 良的生长”包括增强的活力,更早的开花,改良的循环时间。如果生长 速率得到足够提高,所引起的更短的循环时间可以允许在一个常规生长 期内有额外收获。在有些植物的情况下,也可以从相同的根状茎(root stock)收获额外的次数。植物的收获周期的改善可以导致每英亩的年度 生物量生产的增加(由于任何特定植物可以生长和收获的次数(以年计) 的增加)。生长速率的增加也允许在比它们的野生型对应物更广的地理区 域栽培改良的植物,因为用于种植作物的土地限制经常由不利的环境条 件决定,包括在种植时(早期)或在收获时(晚期)。如果缩短收获周期, 则可以避免这样的不利条件。具有改良的生长的植物可以表现出改良的 生长曲线,且可以具有改良的Tmid或T90值(分别是都相对于对应的野生型 植物而言达到它们的最大面积的一半或它们的面积的90%所需的时间)。
根据本发明的一个优选的特征,本发明方法的实施会产生具有增加 的产量的植物。优选地,增加的产量至少包括相对于对照植物而言收获 指数的提高。因此,根据本发明,提供了增加植物的产量、尤其是收获 指数的方法,该方法包括增加植物中编码GRUBX蛋白的核酸序列的表达 和/或增加GRUBX蛋白本身的活性,优选地,其中该GRUBX蛋白由SEQ ID NO:1代表的核酸序列或其一部分编码,或由能与其杂交的序列编码, 或其中该GRUBX蛋白由SEQ ID NO:2代表,或是其同系物、衍生物或活 性片段。或者,该GRUBX可以由MIPS No.At2g01650,SEQ ID NO:3中 的任一个代表的核酸序列或其一部分编码,或由能与其杂交的序列编码, 或其中所述GRUBX是由SPTrEMBL Q9ZU93,SEQ ID NO:4中的任一个代 表,或是其同系物、衍生物或活性片段。
本发明的方法可以有利地适用于作物植物,因为本发明的方法可以 用于提高植物的收获指数。因此,本发明的方法特别适用于为它们的种 子栽培的作物植物,例如谷类。因此,本发明的一个具体实施方案涉及 提高谷类的收获指数的方法。
与对照植物相比,无论植物是在无压力条件下,还是植物暴露于各 种压力下,都会发生产量和/或生长的增加。植物通常通过生长得更缓慢 来对压力的暴露作出响应。在严重的压力条件下,植物甚至可以完全停 止生长。另一方面,在本文中将温和的压力定义为植物暴露的任何压力, 其不会导致植物丧失恢复生长能力的完全停止生长。由于农业实践(灌溉, 浇肥,杀虫剂处理)的进步,在种植的作物植物中不会经常遇到严重的压 力。结果,由温和的压力诱导的受损的生长经常是农业的不希望的特征。 温和的压力是植物所暴露的典型压力。这些压力可以是植物每天暴露的 生物的和/或非生物的(环境的)压力。典型的非生物的或环境的压力包括 非典型的热或冷/冷冻温度造成的温度压力,盐压力,水压力(干旱或水 灾)。化学试剂也可以造成非生物的压力。生物压力通常是由病原体例 如细菌、病毒、真菌或昆虫造成的那些压力。
“改良的结构”可能是由于细胞分裂的变化所致。如本文使用的,术 语“结构”包括植物的外观或形态,包括任一种或多种结构特征或其结 构特征的组合。这种结构特征包括植物的任意细胞、组织或器官或细胞、 组织或器官组的形状、大小、数量、位置、纹理、排列和模式,包括根、 叶、芽、茎或分蘖、叶柄、毛状体、花、花序(对于单子叶和双子叶植物)、 圆锥花序、花瓣、柱头、花柱、雄蕊、花粉、胚珠、种子、胚、胚乳、 种皮、糊粉、须根、形成层、木材、心材、薄壁组织、通气组织、筛分 子、韧皮部或者脉管组织等。因此,改良的结构包括植物的改良的生长 的所有方面。
本发明还涉及编码GRUBX蛋白的核酸和其部分或能与其杂交的核酸 在改善植物的生长特性中的应用,优选地,在增加植物的产量和/或生物 量中的应用。本发明还涉及GRUBX蛋白和其同系物、衍生物和活性片段 在改善植物的生长特性中的应用。所述核酸序列优选地由SEQ ID NO:1, 6代表,或是其一部分或能与其杂交的序列,或编码由SEQ ID NO:2,4, 7代表的氨基酸序列或其同系物、衍生物或活性片段。
本发明还涉及编码GRUBX蛋白和其变体的核酸序列以及GRUBX蛋白 本身和其同系物、衍生物和活性片段作为生长调节剂的应用。前文所述 的核酸序列(和其部分以及能与其杂交的序列)和前文所述的氨基酸序列 (和其同系物、衍生物和活性片段)可以用于改善植物的生长特性,如前 文所述。因此,该序列可以用作生长调节剂,以刺激或抑制植物生长。 因此,本发明提供了一种用于改善植物的生长特性的组合物,其包含 GRUBX蛋白或由SEQ ID NO 2代表的蛋白或其同系物、衍生物或活性片 段。本发明此外提供了一种用于改善植物的生长特性的组合物,其包含 能编码GRUBX蛋白的核酸,或由SEQ ID NO 1代表的核酸或其一部分或 者能与其杂交的序列。本发明也提供了一种用作生长调节剂的组合物, 其包含由任一种前述的氨基酸序列代表的蛋白或其同系物、衍生物或活 性片段。
现在将参考下列附图描述本发明,其中:
图1a.代表包含UBX结构域的拟南芥蛋白和动物参考蛋白的系统 树,如通过SMART工具所识别的。人蛋白由它们的GenBank登记号 NP_079517(含有1的人类UBX结构域(UBXD1)),AAP97263(人类Fas- 有关的蛋白因子FAF1 mRNA),NP_005662(人类再生8(D8S2298E),REP8) 代表,大鼠蛋白由NP_114187(褐鼠p47蛋白)代表。对于拟南芥蛋白, 其它的标识符(除了SEQ ID NO 2,SEQ ID NO 4和SEQ ID NO 7以外) 是GenBank或SPTrEMBL登记号。
图1b.代表包含PUG结构域的植物蛋白的系统树,如通过SMART 工具所识别的。将SEQ ID NO 2和SEQ ID NO 4与拟南芥蛋白(SPTrEMBL 登记号Q9ZU93(表达的蛋白),Q9FKI1(与锌金属蛋白酶类似),Q9MAT3 (F13M7.16蛋白),Q9FKC7(基因组DNA,染色体5,TAC克隆:K24G6), Q9SF12(假定的蛋白),Q9C5S2(核糖核酸内切酶/蛋白激酶IRE1), Q8RX75(AT5g24360/K16H17_7),Q94IG5(Irel同系物-1)),和稻蛋白 SPTrEMBL Q7XIT1(OsIrelp)进行了对比。
图2a.通过它们的共有序列对UBX1和PUG结构域进行定义(SMART 数据库)。CONSENSUS/50%、/65%和/80%是包含UBX1或PUG结构域的参照 序列中50,65和80%所享有的共有序列。大写字母是各种氨基酸的标准 单字母IUPAC码,其它的字母象征着如下所述的氨基酸的性质:
图2b.存在于SEQ ID NO 2和Q9ZU93中的UBX和PUG结构域序列。
图2c.Q9ZU93和SEQ ID NO 2的比对,PUG结构域标有下划线,UBX 结构域以粗体表示。
图2d.SEQ ID NO 2和SEQ ID NO 4的比对,PUG结构域标有下划线, UBX结构域以粗体表示。
图2e.SEQ ID NO 4和SEQ ID NO 7的比对,PUG结构域标有下划线, UBX结构域以粗体表示。
图3.条目克隆p77的示意图,其在AttL1和AttL2位点内含有 CDS0669,用于在pDONR201主链中进行Gateway克隆。CDS0669是烟草 GRUBX编码序列的内部码。该载体也含有细菌卡那霉素-抗性盒和细菌复 制起点。
图4.在谷醇溶蛋白启动子(PRO0090)控制下在稻中表达烟草 GRUBX基因(CDS0669)的二元载体。该载体含有源自Ti质粒的T-DNA, 其由左边界(LB重复,LB Ti C58)和右边界(RB重复,RB Ti C58))界定。 从左边界至右边界,该T-DNA含有:用于转化植物的抗生素选择的盒; 用于转化植物的可视筛选的盒;用于表达烟草GRUBX基因的PRO0090- CDS0669-玉米醇溶蛋白和rbcS-deltaGA双终止子盒。该载体还含有用 于细菌复制的来自pBR322的复制起点和用于壮观霉素和链霉素细菌选 择的选择标记(Spe/SmeR)。
图5.可用于本发明的序列实例。SEQ ID NO:1和SEQ ID NO:2分 别是在实施例中使用的GRUBX核酸和GRUBX蛋白的序列。SEQ ID NO:3 和SEQ ID NO:4代表着甘蔗GRUBX正向同源物的编码序列和蛋白质序 列,SEQ ID NO:5是在转化的稻植物中使用的表达盒的序列,SEQ ID NO: 6和SEQ ID NO:7分别代表着稻GRUBX正向同源物的编码序列和蛋白 质序列。
实施例
现在参考下列实施例描述本发明,这些实施例仅仅用于举例说明。
DNA操作
除非另外说明,根据(Sambrook(2001)Molecular Cloning:a laboratory manual,第三版,Cold Spring Harbor Laboratory Press, CSH,纽约),或Ausubel等(Current Protocols in Molecular Biology. New York:John Wiley和Sons,1998)中所述的标准方法进行重组DNA 技术。用于植物分子工作的标准材料和方法记载在Plant Molecular Biology Labfax(1993),作者R.D.D.Croy,BIOS Scientific Publications Ltd(UK)和Blackwell Scientific Publications(UK) 出版。
实施例1:CDS0669序列的克隆
从烟草克隆GRUBX基因片段
在同步化的烟草BY2细胞培养物(烟草L.cv.Bright Yellow-2)上, 进行cDNA-AFLP实验,选择BY2表达的受到细胞周期调控的序列标签用 于进一步克隆。所述表达序列标签用于筛选烟草cDNA库和分离目标全长 cDNA,即编码GRUBX基因(CDS0669)的cDNA。
BY2细胞的同步化.
如下所述,通过用阿非迪霉素将细胞阻断在早期S-阶段,对烟草BY2 (烟草L.cv.Bright Yellow-2)的培养细胞悬浮液同步化。如(Nagata等 Int.Rev.Cytol.132,1-30,1992)所述,维持烟草L.cv.Bright Yellow 2的细胞悬浮液。为了同步化,在添加了阿非迪霉素(Sigma-Aldrich,St. Louis,MO;5mg/l)(一种DNA-聚合酶α抑制药物)的新鲜培养基中,将 7日龄静止培养物稀释10倍。24小时后,通过用新鲜培养基洗涤几次而 将细胞解除阻断,此后它们的细胞周期进程得到恢复。
RNA提取和cDNA合成
使用LiCl沉淀法(Sambrook等,2001)制备总RNA。根据生产商的说 明书,使用Oligotex柱(Qiagen,Hilden,Germany),从500μg总RNA 提取了poly(A+)RNA。从1μg poly(A+)RNA开始,通过用生物素化的寡-dT25 引物(Genset,Paris,France)和Superscript II(Life Technologies, Gaithersburg,MD)进行反转录,合成第一链cDNA。通过用大肠杆菌连 接酶(Life Technologies),DNA聚合酶I(USB,Cleveland,OH)和 RNAse-H(USB)进行链置换,完成第二链的合成。
cDNA-AFLP分析.
如(Vos等,Nucleic Acid Res.23(21)4407-4414,1995;Bachem 等,植物J.9(5)745-53,1996)所述,经改进后,将500ng双链cDNA 用于AFLP分析。使用的限制酶是BstYI和MseI(Biolabs),并在2个分 开的步骤中进行消化。用一种酶进行第一个限制消化后,借助于它们的生 物素化尾巴将3′末端片段捕获到Dyna珠子(Dynal,Oslo,Norway)上, 而其它的片段则被洗掉。用第二种酶消化后,收集释放的限制性片段,并 在随后的AFLP步骤中用作模板。为了预扩增,将没有选择性核苷酸的MseI 引物与含有T或C作为3′最末端核苷酸的BstYI引物相组合。PCR条件 如(Vos等,1995)所述。将得到的扩增混合物稀释600倍,将5μl用于使 用P33-标记的BstYI引物和Amplitaq-Gold聚合酶(Roche Diagnostics, Brussels,Belgium)的选择性扩增。使用Sequigel系统(Biorad),在 5%聚丙烯酰胺凝胶上分离扩增产物。将干燥的凝胶暴露于Kodak Biomax 胶片,并在Phos phor Imager(Amersham Pharmacia Biotech,Little Chalfont,UK)中扫描。
AFLP片段的表征
从凝胶中分离与有差别地表达的转录物相对应的带,其中(部分)转 录物对应着SEQ ID NO 1(或CDS0669),并在与用于选择性扩增相同的 条件下重新扩增所洗脱的DNA。通过对用选择性BstYI引物重新扩增的 聚合酶链反应产物直接测序,或在将片段克隆进pGEM-T easy(Promega, Madison,WI)内并对各克隆测序后,得到序列信息。通过BLAST序列比 对(Altschul等,Nucleic Acid Res.25(17)3389-3402 1997),将 得到的序列与可公开得到的数据库中的核苷酸和蛋白质序列进行比较。 当可行时,用更长的EST或分离的cDNA序列替代标签序列,以增加发现 显著同源性的机会。随后,如下所述从商业化的烟草cDNA文库中扩增与 SEQ ID NO 1(CDS0669)相对应的物理cDNA克隆:
GRUBX基因(CDS0669)的克隆
用从活跃地分裂的、非-同步化的BY2烟草细胞分离的poly(A+)RNA, 制备了平均大小为1,400bp的插入物的cDNA文库。将这些文库插入物 克隆进载体pCMVSPORT6.0,后者包含attB Gateway盒(Life Technologies)。从该文库中选择46,000个克隆,排列在384-孔微量滴 定板中,随后一式两份地点在尼龙滤膜上。使用数百种放射性标记的标 签的集合作为探针(包括与序列CDS0669,SEQ IDNO 1相对应的BY2- 标签)筛选排列的克隆。分离阳性克隆(其中有克隆对应着CDS0669,SEQ ID NO 1),测序,并与标签序列比对。当与标签杂交失败时,通过PCR扩 增选择与该标签对应的全长cDNA:使用引物3程序 (http://www-genome.wi.mit.edu/genome-software/other/primer3.html)设计标签特异性引物,并与普通的载体引物组合使用,以扩增部分 cDNA插入物。将来自50,000,100,000,150,000,和300,000个cDNA克 隆的DNA库用作PCR扩增的模板。然后,从琼脂糖凝胶分离扩增产物, 克隆,测序,并将它们的序列与标签序列进行比对。接着,通过LR反应, 将与SEQ ID NO 1的核苷酸序列相对应的全长cDNA从pCMVsport6.0文 库载体克隆进pDONR201,即一种Gateway供体载体(Invitrogen, Paisley,UK)内,产生条目克隆p77(图3)。
实施例2:载体构建
随后,将条目克隆p77与p0830(一种用于稻转化的目标载体)用于 LR反应中。该载体在T-DNA边界内含有下述内容作为功能元件:植物选 择标记;可视标记表达盒;和用于与已经克隆进条目克隆的目标序列进 行LR体内重组的Gateway盒。用于种子-优选的表达的谷醇溶蛋白启动 子(PRO0090)在该Gateway盒的上游。LR重组步骤后,将得到的表达载 体p72(图4)转化进土壤杆菌株LBA4404中,并随后转化进稻植物内。
实施例3:用PRO0090-CDS0669构建体转化稻
将稻日本品种Nipponbare的成熟干种子去壳。通过将种子在70%乙 醇中温育1分钟,然后在0.2%HgCl2中30分钟,并用无菌蒸馏水洗涤6 次、每次15分钟,完成灭菌。然后,使无菌的种子在含有2,4-D的培养 基(愈伤组织诱导培养基)中发芽。在黑暗中温育4周后,切下胚性的、 盾片衍生的愈伤组织,并在相同的培养基上繁殖。2周后,通过在相同 培养基上继代培养另外2周,使愈伤组织倍增或繁殖。在共培养前3天, 在新鲜培养基上继代培养胚性愈伤组织片,以促进细胞分裂活性。将携 带二元载体p72的土壤杆菌株LBA4414用于共培养。在28℃,在含有适 当抗生素的AB培养基上培养土壤杆菌株3天。然后收集细菌,并以约1 的OD600悬浮在液体共培养培养基中。将悬浮液转移到有盖培养皿中,并 将愈伤组织进入悬浮液15分钟。接着,将愈伤组织干点在滤纸上,转移 到固化的共培养培养基中,并在25℃,在黑暗中温育3天。此后,在 28℃,在含有2,4-D的培养基上,在有适当浓度的选择剂存在下,培养 共培养的愈伤组织4周。在该阶段中,形成迅速生长的抗性愈伤组织小 块。将该材料转移到再生培养基中,在光下温育,会释放出胚胎发生潜 力,在以后的4-5周形成芽。从愈伤组织切下芽,在含有生长素的培养 基上温育2-3周,从中转移到土壤。在高湿度和短日照下,在温室中生 长变硬的芽。最后,在移植后3-5个月收获种子。该方法能以超过50% 的比例得到单基因座转化体(Aldemita和Hodges,Planta 199,612-617, 1996;Chan等,Plant Mol.Biol.22(3),491-506,1993;Hiei等, Plant J.6(2),271-282,1994)。
实施例4:评价用PR00090-CDS0669构建体转化的转基因稻
产生了大约15到20个独立的T0稻转化体。将一代转化体从组织培 养室转移到温室中,以便生长并收获T1种子。保留6个事件,这些事 件中T1后代中转基因的存在/缺失以3∶1的比例分离。对于这些事件中 的每一个,通过监测可视标记表达,选择大约10株含有转基因的T1幼 苗(杂合子和纯合子)和大约10株缺少转基因的T1幼苗(零合子)。如下 所述评价了许多与植物生长和种子生产有关的参数,并统计分析所有数 据:
统计分析:t-检验和F-检验:
将双因子ANOVA(变体的分析)用作植物表型特征的总体评价的统计 模型。对用本发明的基因转化的所有植物的所有事件测量的所有参数, 进行F-检验。进行F-检验,以检查基因对所有转化事件的作用,并验证 基因的总作用,在本文中也称作“总体基因作用”。如果F-检验的值表 明数据是显著的,则认为存在“基因”作用,这意味着不仅仅基因的存 在或位置会造成表型的差异。真实的总基因作用的显著性阈值设定为 F-检验的5%概率水平。
4.1植物生长测量:
将选择的T1植物(大约10株具有转基因,大约10株没有转基因) 转移到温室中。每株植物接受独特的条码标记,以清楚地将表型数据和 对应的植物相联系。在下面的环境设置下,使选择的T1植物在10cm 直径盆中的土壤上生长:光周期=11.5h,日照强度=30,000 lux或更 高,白天温度=28℃或更高,夜间温度=22℃,相对湿度=60-70%。 使转基因植物和对应的零合子在随机的位置并列生长。从播种阶段直到 成熟阶段,每株植物通过数码成像盒几次,并成像。在每个时间点,从 至少6个不同的角度,为每株植物拍数码图像(2048x1536像素,1600 万色)。使用图像分析软件,可以从所有植物的所有数码图像以自动化方 式得出几个参数。
4.2种子-有关的参数测量:
收获成熟的第一圆锥花序,装袋,用条码标记,然后在37℃烘箱 中干燥3天。然后拍打圆锥花序,收集所有种子,并计数。使用吹风装 置,将饱满的秕(husk)与空秕分开。抛弃空秕,再次计数剩下的部分。 在分析天平上称量饱满秕。该方法能产生一组种子有关的参数。
植物的收获指数
将本发明中的收获指数定义为总种子产量和地上面积(mm2)的比,并 乘以因子106。如上所述,通过称量从植物收获的所有饱满秕来测量每株 植物的总种子产量。通过计算来自与背景区别开的地上植物部分的数码 图像的像素总数,确定植物地上面积。该值是在同一时间点从不同角度 拍摄的照片的平均值,并通过校正而转化成以mm2表示的物理表面值。实 验表明,以该方式测量的地上植物面积与地上植物部分的生物量相关。
在用T2植物进行的第二个实验中,证实了在第一个实验中得到的数 据。选择了具有正确的表达模式的3个系用于进一步分析。通过监视标 记表达,筛选来自T1中的阳性植物(杂合子和纯合子)的种子批次。对 于每个选择的事件,再保留杂合子种子批次用于T2评价。在每个种子批 次中,使相同数目的阳性和阴性植物生长在温室中,用于评价。
在T2代中,总共评价120株GRUBX转化植物,即针对每个事件采 用40株植物中,其中20株是转基因阳性的,20株是阴性的。
因为已经进行了具有重叠事件的2个实验,故进行了合并分析。这 可以用于检查2个实验的效果的一致性,如果确是这种情况,则积累来 自2个实验的证据,以增加结论的可靠性。使用的方法是混合模型方法, 其考虑了数据的多级结构(即实验-事件-分离子)。通过对比似然比值测 定和卡方分布,得到了P-值。
在第一个实验中,评价了T1代中的6个系。与零合子系相比,收获 指数存在平均增加,2个系具有50%或更高的显著增加(表2)。
表2:对两个表现最好的T1事件进行评价
列2和3中给出了T1代中的转基因系(TR)和对照植物(零)的收获指 数测量值的平均绝对值,列4给出了绝对差值,列5给出了%差值,列6 给出了以在t-检验中得到的p-值表示的显著性。
在T2代中证实了从T1代得到的结果;收获指数的平均增加是13%, F-检验证实,该增加是显著的(p-值为0.0447)。此外,在与T1代的结 果的合并分析中,重新评价了这些T2数据,从F-检验得到的p-值再次 证实所观察到的效果是显著的(p-值0.0181)。