具有增强的产量相关性状的植物和用于产生该植物的方法 本发明一般地涉及分子生物学领域, 并涉及通过调节编码 eRF1 多肽的核酸在植 物中的表达而增强产量相关性状的方法。本发明还涉及具有调节了编码该 eRF1 多肽之核 酸的表达的植物, 所述植物相对于相应的野生型植物或其他对照植物而言具有增强的产量 相关性状。本发明还提供可用于本发明方法的构建体。
本发明一般地涉及分子生物学领域, 并涉及用于在植物中增强多种经济上重要的 产量相关性状的方法。更具体地, 本发明涉及通过调节编码 SCAMP 样 ( 分泌载体膜蛋白 ) 多肽的核酸在植物中的表达而增强产量相关性状的方法。本发明还涉及具有调节了编码 SCAMP 样多肽之核酸的表达的植物, 所述植物相对于对照植物而言具有增强的产量相关性 状。本发明还提供可用于实施本发明方法的迄今为止未知的 SCAMP 样编码核酸以及包含该 核酸的构建体。
本发明一般地涉及分子生物学领域, 并涉及通过调节编码肌原纤蛋白多肽的核酸 在植物的质体中的表达而增强多种产量相关性状的方法。 本发明还涉及具有调节了编码肌 原纤蛋白之核酸在植物的质体中表达的植物, 所述植物相对于相应的野生型植物或其他对 照植物而言具有增强的产量相关性状。本发明还提供可用于本发明方法的构建体。
本发明一般地涉及分子生物学领域, 并涉及通过调节编码 PLATZ( 植物富含 AT 序 列和锌结合蛋白质 ) 多肽的核酸在植物中的表达而改进多种植物生长特性的方法。本发明 还涉及具有调节了编码 PLATZ 多肽之核酸的表达的植物, 所述植物相对于相应的野生型植 物或其他对照植物而言具有改进的生长特性。本发明还提供可用于本发明方法的构建体。
本发明一般地涉及分子生物学领域, 并涉及通过调节编码 PLST 样多肽的核酸在 植物中的表达而增强产量相关性状的方法。本发明还涉及具有调节了编码 PLST 样多肽之 核酸的表达的植物, 所述植物相对于相应的野生型植物或其他对照植物而言具有增强的产 量相关性状。本发明还提供可用于本发明方法的构建体。
本发明一般地涉及分子生物学领域, 并涉及通过调节编码 Glomalin(HSP60, 陪伴 蛋白 CNP60) 多肽的核酸在植物中的表达而增强产量相关性状的方法。本发明还涉及具有 调节了编码 Glomalin 多肽之核酸的表达的植物, 所述植物相对于相应的野生型植物或其 他对照植物而言具有增强的产量相关性状。本发明还提供可用于本发明方法的构建体。
持续增长的世界人口和农业用可耕地供应萎缩刺激了有关增加农业效率的研究。 常规的作物及园艺学改进手段利用选择育种技术来鉴定具有受欢迎特性的植物。然而, 此 类选择育种技术具有几个缺陷, 即这些技术一般耗费很多劳动并且产生这样的植物, 其经 常含有异源性遗传组分, 这可能不总是导致从亲代植物中传递所希望的性状。分子生物学 进展已经允许人类改进动物及植物的种质。 植物的遗传工程使得可以分离和操作遗传物质 ( 一般处于 DNA 或 RNA 形式 ) 并且随后引入该遗传物质至植物中。此类技术具有产生具备 多种经济学、 农学或园艺学改进性状的作物或植物的能力。
具有特殊经济意义的性状是增加的产量特性。 产量通常定义为作物产生的可测量 的经济价值。这可以就数量和 / 或品质方面进行定义。产量直接取决于几个因素, 例如器 官的数目和大小、 植物构造 ( 例如枝的数目 )、 种子产生、 叶衰老等。 根发育、 养分摄入量、 胁
迫耐性和早期萌发势 (early vigor) 也可以是决定产量的重要因素。因此, 优化前述因素 可以对增加作物产量有贡献。
种子产量是特别重要的性状, 这是因为许多植物的种子对于人类和动物营养而言 至关重要。诸如玉米、 稻、 小麦、 卡诺拉 (canola) 和大豆等作物占人类总卡路里摄取量的一 半以上, 不论是通过种子本身的直接消耗, 还是通过由加工的种子所饲养的肉类产品的消 耗。它们也是工业加工所用的糖类、 油类和多类代谢物的来源。种子含有胚 ( 新的苗和根 的来源 ) 和胚乳 ( 萌发和幼苗早期生长过程中胚生长的营养源 )。种子的发育涉及许多基 因, 并且需要代谢物自根、 叶和茎转移至正在生长的种子。 特别是胚乳, 同化糖类、 油类和蛋 白质的代谢前体, 将其合成为贮存性高分子, 以充盈籽粒。
植物生物量为饲料作物如苜蓿、 青贮谷物和干草的产量。在谷物作物中使用产量 的许多替代参数。 其中首要的是估算植物大小。 根据物种以及发育阶段的不同, 可以通过许 多方法测量植物大小, 但是包括植物总干重、 地上干重、 地上鲜重、 叶面积、 茎体积、 植物高 度、 莲座 (rosette) 直径、 叶长、 根长、 根生物量、 分蘖数和叶数。许多物种在给定的发育阶 段维持植物不同部分大小间的保守比。 利用这些异速生长关系而对这些有关大小的测量结 果进行由此及彼的外推 ( 如 Tittonell 等 2005 Agric Ecosys &Environ 105 : 213)。早期 发育阶段的植物大小通常将与晚期发育阶段的植物大小有关。 具有更大叶面积的较大植物 通常能够比较小的植物吸收更多的光和二氧化碳, 因此很可能在同期增重更多 (Fasoula & Tollenaar 2005Maydica 50 : 39)。 除了植物所具有的最初达到较大大小的微环境或遗传优 势的潜在延续, 此为其附加效应。植物大小和生长速率存在着强遗传组分 ( 如 ter Steege 等 2005 Plant Physiology 139 : 1078), 且因此对于多种多样化基因型植物在一种环境 条件下的大小很可能与另一种环境条件下的大小有关 (Hittalmani 等 2003Theoretical Applied Genetics 107 : 679)。 以这种方式, 使用标准环境作为田地中作物在不同时间和地 点所遭遇的多样化动态环境的替代参数。
对于众多作物的另一个重要性状是早期萌发势。 改进早期萌发势是现代稻育种计 划在温带和热带稻栽培品种上的一个重要目标。 长根在水栽稻中对于正确土壤固着是重要 的。 在将稻直接播种至涝田的情况下, 以及在植物必须从水中迅速出苗的情况下, 较长的苗 与萌发势相关。在实施条播 (drill-seeding) 的情况下, 较长的中胚轴和胚芽鞘对于良好 的出苗是重要的。人工改造植物内早期萌发势的能力将在农业中是极其重要的。例如, 不 良的早期萌发势已经限制了基于玉米带生殖质 (Corn Belt germplasm) 的玉米 (Zea mayes L.) 杂种在欧洲大西洋地区的引种。
收获指数为种子产量与地上干重的比值, 其在许多环境条件下相对稳定, 因此在 植物大小和谷物产量之间通常能够获得比较稳固的相关性 ( 如 Rebetzke 等 2002 Crop Science 42 : 739)。这些过程固有地联系在一起, 因为谷物生物量的大多数取决于植物叶 和茎当前或贮存的光合作用生产力 (Gardener 等 1985 Physiology of Crop Plants.Iowa State University Press, 第 68-73 页 )。 因此, 对植物大小的选择, 甚至是在发育早期阶段 的选择, 已经用作为未来潜在产量的指标 ( 如 Tittonell 等, 2005, Agric Ecosys &Environ 105 : 213)。当测试遗传差异对胁迫耐性的影响时, 温室或植物培养室环境与田地相比具有 固有的优势 : 即能够使土壤性能、 温度、 水和营养的可用性以及光强度标准化。 不过, 因缺乏 风力或昆虫导致不良授粉, 或由于空间不足以让成熟根或株冠生长等等, 对产量造成的这些人工局限性会限制这些受控环境在测试产量差异中的应用。因此, 在培养室或温室标准 条件下测量早期发育阶段的植物大小, 是提供潜在遗传产量优势指标的标准方法。
另外的重要性状是改进的非生物胁迫耐受性。 非生物胁迫是世界范围作物损失的 主要原因, 对于大多数主要作物植物而言降低平均产量超过 50% (Wang 等、 (2003)Planta 218 : 1-14)。非生物胁迫可以由干旱、 盐度、 极端温度、 化学毒性、 养分 ( 大量元素和 / 或微 量元素 ) 过剩或者缺乏、 辐射和氧化胁迫引起。改进植物对非生物胁迫 ( 即干旱 ) 耐受性 的能力将在世界范围对农民具有极大的经济优势并且会允许在不利条件期间及在作物栽 培否则是不可能的陆地上栽培作物。
作物产量因而可以通过优化前述因素之一而增加。
取决于最终用途, 对某些产量性状的改进可能优先于其它产量性状。例如对于应 用如饲料或木材生产或生物燃料资源而言, 增加植物营养体部分可能是期望的, 而对于应 用如面粉、 淀粉或油生产而言, 增加种子参数可能是尤其希望的。即便在种子参数当中, 某 些参数可以更优先于其它参数, 这取决于应用。 多种机制可以对增加种子产量有贡献, 无论 形式为增加的种子大小或是增加的种子数目。
现已发现可以通过在植物中调节编码 eRF1 蛋白质样的核酸在植物中的表达而增 强植物中的多种产量相关性状。
现已发现可以通过在植物中调节编码 SCAMP 样的核酸在植物中的表达而改进植 物中的多种生长特性。
现已发现可以通过在植物中调节编码肌原纤蛋白多肽的核酸的表达而改进植物 中的多种产量相关性状。
现已发现可以通过在植物中调节编码 PLATZ( 植物富含 AT 序列和锌结合蛋白质 ) 的核酸在植物中的表达而改进植物中的多种生长特性。
现已发现可以通过在植物中调节编码 PLST 样蛋白质的核酸在植物中的表达而增 强植物中的多种产量相关性状。
现已发现可以通过在植物中调节编码 Glomalin(HSP60, 陪伴蛋白 CNP60) 多肽的 核酸在植物中的表达而改进植物中的多种产量相关性状。
背景
1.SCAMP 样多肽
植物中的胞吞作用已经在最近几年期间积累了相当多的证据 (Samaj 等人, 2004 ; Plant Physiol.135 : 1150-1161)。已经鉴定了基于网格蛋白的内化结构的一些组分, 并 积累了摄取细胞表面受体 - 配体复合物的数据 (Russinova 等人 2004, Plant Cell 16 : 3216-3229)。最近, 推测植物 SCAMP 蛋白可以在介导植物细胞的胞吞作用中发挥作用 (Lam 等人 2007 ; The Plant Cell, Vol.19 : 296-319)。 最初, 将 SCAMP 蛋白鉴定为哺乳动物外分泌 腺中的分泌小泡组分, 并后来发现其是真核细胞中普遍存在的蛋白质 (Fernandez-Chacon 和 Sudhof, 2000 ; J.Neurosci.20 : 7941-7950)。在高尔基体反面和内体再循环区室中都发 现了 SCAMP, 并且它们集中在早期和再循环内体的能动群体内 (Castle 和 Castle, 2005J. Cell Sci.118 : 3769-3780)。其中, 已经在稻 (Oryza sativa)、 拟南芥 (Arabidopsis) 和 豌豆 (Pisum sativum) 中发现了植物 SCAMP 同源物, 并认为其存在于许多其他植物物种中 (Fernandez-Chacon 和 Sudhof, 2000)。在植物中, SCAMP 位于质膜和能动胞质细胞器 (Lam等人 2007)。
2. 肌原纤蛋白多肽
在质体小球 (PG) 中最主要的蛋白质是肌原纤蛋白。肌原纤蛋白是质体相关的脂 质结合蛋白质, 其遍布于植物和蓝细菌中。主要在番茄和胡椒果实的色质体中表征了它 们, 并且已知它们在非生物胁迫期间 ( 例如, 受强光、 冷冻和干旱胁迫 ), 以及在病原体感 染期间在质体中积累。肌原纤蛋白样蛋白质家族含有疏水结构域, 其与脂质相关或者锚 定在脂质内。肌原纤蛋白与类囊体的基质片层和色质体的含纤维类胡萝卜素 (fibrillic carotenoid) 结构相关。纤维结构的模型预测肌原纤蛋白层屏蔽极性脂质和类胡萝卜素。 此外, 已知肌原纤蛋白在强光条件期间积累, 并且肌原纤蛋白影响光合效率 ( 参见 Yang 等 人, Proc Natl Acad Sci U S A.2006 年 4 月 11 日 ; 103(15) : 6061-6066)。 可利用的证据还 有这些蛋白质在非胁迫条件下与多种脂质小球结合, 以阻止质体球 (plastoglobule) 聚结 ( 参见 CAB 摘要, Simkin 等人, Recent Research Developments in Biochemistry, 2004)。
拟南芥基因组具有 13 个肌原纤蛋白基因, 经预测它们都编码质体定位的蛋白质 (Laizet 等人, 2004)。Rey 等人, (Plant J.2000 年 3 月 ; 21(5) : 483-94) 公开了使用组成 型启动子过表达肌原纤蛋白的转基因烟草 (Nicotiana tabacum) 植物。在弱光条件下没有 观察到野生型植物和转基因植物之间的生长差异, 但据报道, 在更强的光照强度下, 转基因 植物显示出更长的主茎、 增强的侧茎发育和加速的花发育。
3.PLATZ 多肽
PLATZ 蛋白质来自植物特异的 DNA 结合蛋白质家族。 到目前为止, 仅详细描述了一 个成员 (PLATZ1, Nagano 等人, Nucl.Acids Res.29, 4097-4105, 2001)。PLATZ1 与其他推定 的 PLATZ 蛋白质之间的序列比较显示, 存在具有保守的半胱氨酸和组氨酸残基的两个锌结 合结构域。DNA 结合活性需要锌的存在。PLATZ1 显示出以非特异性方式与富含 A/T 的区域 结合, 并且能诱导 GTP 酶 pra2 和质体蓝素 petE 基因的表达 (Nagano 等人, 2001)。虽然 DNA 结合蛋白质与 DNA 复制和基因表达的调节有关, 但是还仍缺少对 PLATZ 蛋白质的作用的精 确表征。
4.Glomalin 多肽
最初, 将 Glomalin 鉴定为由丛枝菌根真菌 (arbuscular mycorrhizal)( 如 Glomus 属物种 ) 产生的大分子量糖蛋白。其分泌到环境中, 并且推断其糖部分在螯合土壤中的铜 和锌中发挥作用。Gadkar 和 Rillig(FEMS Microbiol Lett.263, 93-101, 2006) 显示, 丛枝 菌根真菌 (Glomus intraradices) 的 glomalin 是 590 个氨基酸的蛋白质, 其具有 3 个氨基 端糖基化位点和在羧基末端的一串 GGM 基序。基因组序列具有 67、 76 和 131bp 长的 3 个内 含子。该蛋白质与热休克蛋白 60(hsp 60) 同源 ; 据报道, hsp60 的植物同源物在使光合作 用适应热胁迫中发挥作用, 可能通过保护 Rubisco 活性酶免于热变性 (Salvucci M., E., J Exp Bot.2008 ; 59(7) : 1923-33)。然而, glomalin 直向同源物在植物生物学中的精确作用 仍有待阐明。
概述
1.eRF1 多肽
目前令人惊讶地发现, 调节编码 eRF1 多肽之核酸的表达产生相对于对照植物具 有增强的产量相关性状, 特别是增加的产量的植物。根据一个实施方案, 提供了相对于对照植物增强植物产量相关性状的方法, 包括 在植物中调节编码 eRF1 多肽之核酸的表达。
2.SCAMP 样多肽
目前令人惊讶地发现, 调节编码 SCAMP 样多肽之核酸的表达产生相对于对照植物 具有增强的产量相关性状的植物。
根据一个实施方案, 提供了相对于对照植物增强植物产量相关性状的方法, 包括 在植物中调节编码 SCAMP 样多肽之核酸的表达。
3. 肌原纤蛋白多肽
目前令人惊讶地发现, 调节编码肌原纤蛋白多肽之核酸在植物的质体中的表达产 生相对于对照植物具有增强的产量相关性状的植物。
根据一个实施方案, 提供了相对于对照植物增强产量相关性状的方法, 包括调节 编码肌原纤蛋白多肽之核酸在植物质体中的表达。
4.PLATZ 多肽
目前令人惊讶地发现, 调节编码 PLATZ 多肽之核酸的表达产生相对于对照植物具 有增强的产量相关性状, 特别是增加的产量的植物。
根据一个实施方案, 提供了相对于对照植物改进植物产量相关性状的方法, 包括 在植物中调节编码 PLATZ 多肽之核酸的表达。
5.PLST 样多肽
目前令人惊讶地发现, 调节编码 PLST 样多肽之核酸的表达产生相对于对照植物 具有增强的产量相关性状, 特别是增加的产量的植物。
根据一个实施方案, 提供了相对于对照植物增强植物产量相关性状的方法, 包括 在植物中调节编码 PLST 样多肽之核酸的表达。
6.Glomalin 多肽
目前令人惊讶地发现, 调节编码 Glomalin 多肽之核酸的表达产生相对于对照植 物具有增强的产量相关性状, 特别是增加的种子产量的植物。
根据一个实施方案, 提供了相对于对照植物改进植物产量相关性状的方法, 包括 调节编码 Glomalin 多肽之核酸在植物中的表达。
定义
在整个本说明书中使用以下定义。
多肽 / 蛋白质
术语 “多肽” 和 “蛋白质” 在本文中可互换使用, 指通过肽键连接在一起的处于任 意长度的氨基酸聚合形式。
多核苷酸 / 核酸 / 核酸序列 / 核苷酸序列
术语 “多核苷酸” 、 “核酸序列” 、 “核苷酸序列” 、 “核酸” 、 “核酸分子” 在本文中可互 换使用并且指任意长度聚合的无分支形式的核苷酸, 即核糖核苷酸或脱氧核糖核苷酸或这 二者组合。
同源物
蛋白质的 “同源物” 包括这样的肽、 寡肽、 多肽、 蛋白质及酶, 它们相对于非修饰的 所讨论蛋白质具有氨基酸替换、 缺失和 / 或插入并且与其所源自的非修饰蛋白质具有相似生物学活性和功能活性。
缺失指从蛋白质中移除一个或多个氨基酸。
插入指一个或多个氨基酸残基在蛋白质中预定位点内的引入。 插入可以包含氨基 端融合和 / 或羧基端融合以及单个或多个氨基酸的序列内插入。通常, 在氨基酸序列内部 的插入会比氨基端融合或羧基端融合小, 约 1-10 个残基的级别。氨基端或羧基端融合蛋白 或融合肽的例子包括如酵母双杂交系统中所用转录激活物的结合结构域或激活结构域、 噬 菌体外壳蛋白、 ( 组氨酸 )-6- 标签、 谷胱甘肽 S- 转移酶 - 标签、 蛋白 A、 麦芽糖结合蛋白、 二氢叶酸还原酶、 Tag·100 表位、 c-myc 表位、 - 表位、 lacZ、 CMP( 钙调蛋白结合 肽 )、 HA 表位、 蛋白 C 表位和 VSV 表位。
替换指以具有相似特性 ( 如相似疏水性、 亲水性、 抗原性、 形成或破坏 α- 螺旋结 构或 β- 折叠结构的倾向 ) 的其它氨基酸替换蛋白质的氨基酸。氨基酸替换一般是单个 残基的, 不过可以是簇集性的, 这取决于置于多肽的功能性约束, 并且可以是 1-10 个氨基 酸; 插入通常会是约 1-10 个氨基酸残基级别。氨基酸替换优选地是保守性氨基酸替换。 保守性替换表是本领域众所周知的 ( 见例如 Creighton(1984)Proteins.W.H.Freeman 和 Company( 编著 ) 和下表 1)。
残基 Ala Arg Asn Asp Gln Cys Glu Gly His Ile
保守性替换 Ser Lys Gln ; His Glu Asn Ser Asp Pro Asn ; Gln Leu, Val 残基 Leu Lys Met Phe Ser Thr Trp Tyr Val 保守性替换 Ile ; Val Arg ; Gln Leu ; Ile Met ; Leu ; Tyr Thr ; Gly Ser ; Val Tyr Trp ; Phe Ile ; Leu表1: 保守性氨基酸替换的例子氨基酸替换、 缺失和 / 或插入可以使用本领域众所周知的肽合成技术如固相肽合 成法等或通过重组 DNA 操作而容易地进行。用于操作 DNA 序列以产生蛋白质的替换、 插入 或缺失变体的方法是本领域众所周知的。例如, 用于在 DNA 中的预定位点处产生替换突 变的技术是本领域技术人员众所周知的并且包括 M13 诱变法、 T7-Gen 体外诱变法 (USB,Clevelaand, OH)、 QuickChange 位点定向诱变法 (Stratagene, San Diego, CA)、 PCR- 介导 的位点定向诱变或其它位点定向诱变法。
衍生物
“衍生物” 包括这样的肽、 寡肽、 多肽, 其中与天然存在形式的蛋白质 ( 如目的蛋 白 ) 的氨基酸序列相比, 它们包含以非天然存在的氨基酸残基对氨基酸的替换或非天然存 在的氨基酸残基的添加。蛋白质的 “衍生物” 也包含这样的肽、 寡肽、 多肽, 其中与多肽的天 然存在形式的氨基酸序列相比, 它们包含天然存在的经改变 ( 糖基化、 酰化、 异戊二烯化、 磷酸化、 肉豆蔻酰化、 硫酸化等 ) 的氨基酸残基或非天然的经改变的氨基酸残基。与衍生 物所来源的氨基酸序列相比, 该衍生物可以也包含与所述氨基酸序列共价或非共价结合的 一个或多个非氨基酸取代基或添加 ( 例如报道分子或其它配体 ), 如为促进检测该衍生物 而结合的报道分子, 和与天然存在的蛋白质的氨基酸序列相对比的非天然存在的氨基酸残 基。此外, “衍生物” 还包括天然发生形式蛋白质与标签肽 ( 如 FLAG、 HIS6 或硫氧还蛋白 ) 的融合物 ( 标签肽的综述参阅 Terpe, Appl.Microbiol.Biotechnol.60, 523-533, 2003)。
直向同源物 / 旁系同源物
直向同源物和旁系同源物包含用来描述基因祖先关系的进化概念。 旁系同源物是 相同物种内起源于先祖基因复制的基因 ; 直向同源物是来自不同生物的起源于物种形成的 基因, 并且也来源于共同的先祖基因。
结构域, 基序 / 共有序列 / 特征序列
术语 “结构域” 指依据进化相关蛋白质的序列比对结果而在特定位置处保守的一 组氨基酸。尽管在其它位置处的氨基酸可以在同源物之间变动, 然而在特定位置处的高度 保守的氨基酸指示在蛋白质的结构、 稳定性或功能方面可能是必需的氨基酸。结构域因通 过在蛋白质同源物家族的比对序列中的高保守程度而被鉴定, 它们可以用作鉴定物以确定 任意的所讨论多肽是否属于先前已鉴定的多肽家族。
术语 “基序” 或 “共有序列” 或 “特征序列” 指在进化相关蛋白质的序列中的短保守 区。 基序往往是结构域的高度保守部分, 不过也可以仅包括结构域的部分, 或可以位于保守 结构域之外 ( 若基序的全部氨基酸位于定义的结构域之外 )。
存在用于鉴定结构域的专门数据库, 例如 SMART(Schultz 等 (1998)Proc.Natl. Acad.Sci.USA 95, 5857-5864 ; Letunic 等 (2002)Nucleic Acids Res 30, 242-244), InterPro(Mulder 等,(2003)Nucl.Acids.Res.31 , 315-318) ,Prosite(Bucher 和 Bairoch(1994), A generalized profile syntax for biomolecular sequences motifs and its function in automatic sequence interpretation.(In)ISMB-94 ; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D. 编著, 第 53-61 页, AAAI Press, Menlo Park ; Hulo 等, Nucl.Acids.Res.32 : D134-D137, (2004) 或 者 Pfam(Bateman 等, Nucleic Acids Research 30(1) : 276-280(2002))。用于计算机分析蛋白质序列的一组 工具可获得自 ExPASy 蛋白组服务器 (Swiss Institute of Bioinformatics(Gasteiger 等, ExPASy : the proteomics server for in-depth protein knowledge and analysis, Nucleic Acids Res.31 : 3784-3788(2003))。还可以使用常规技术 ( 如序列比对 ) 来鉴定 结构域或基序。比对序列以进行比较的方法为本领域所众所周知, 这些方法包括 GAP、 BESTFIT、 BLAST、 FASTA 和 TFASTA。GAP 利用 Needleman 和 Wunsch((1970)J Mol Biol 48 : 443-453) 的算法来寻找两序列间使匹配数最高并使空位数最少的全局比对 ( 即在完整序列上 )。 BLAST 算法 (Altschul 等 (1990)J Mol Biol 215 : 403-10) 在两序列间计算百分比序列同 一性并进行相似性的统计学分析。用于进行 BLAST 分析的软件在国家生物技术信息中心 (National Centre for Biotechnology Information(NCBI)) 向公众提供。可以使用例如 默认配对比对参数的 ClustalW 多重序列比对算法 (1.83 版 ) 和百分比评分法来容易地鉴 定同源物。 也可以使用 MatGAT 软件包 (Campanella 等, BMC Bioinformatics.2003 Jul 10 ; 4: 29.MatGAT : an application that generates similarity/identity matrices using protein or DNA sequence) 中提供的一种方法确定全局的相似性和同一性百分比。 本领域 技术人员会意识到, 可以进行少量手动编辑以优化保守性基序之间的比对。 此外, 还可以使 用特定的结构域代替全长序列来鉴定同源物。 序列同一性值可以是使用默认参数的上述程 序在完整的核酸或氨基酸序列上或在所选择的结构域或保守的基序上测定的。 对于局部比 对, Smith-Waterman 算法是特别有用的 (Smith TF, Waterman MS(1981)J.Mol.Biol147(1) ; 195-7)。 交互 BLAST
通常, 这包括以查询序列 ( 例如, 利用实施例章节表 A2、 A3、 A4、 A5 和 A6 中所列 的任一序列 ) 针对任何序列数据库如可公共获得的 NCBI 数据库进行 BLAST 的首次 BLAST。 当从核苷酸序列开始时, 通常使用 BLASTN 或 TBLASTX( 利用标准默认值 ), 而当从蛋白质 序列开始时, 则使用 BLASTP 或 TBLASTN( 利用标准默认值 )。BLAST 结果可以任选地过滤。 接着使用过滤的结果或者未过滤的结果的全长序列针对查询序列来源生物的序列进行反 向 BLAST( 二次 BLAST)。然后比较首次和二次 BLAST 的结果。如果首次 BLAST 中的高排名 命中来自查询序列来源的相同物种, 然后反向 BLAST 理想地导致查询序列处于最高命中之 列, 则找到了旁系同源物 ; 如果首次 BLAST 中高排名命中不来自查询序列来源的相同物种, 且优选地在反向 BLAST 时导致查询序列在最高命中之列, 则找到了直向同源物。
高排名的命中是那些 E 值低的命中。E 值越低, 分值越具有显著性 ( 或者换句话 说, 偶然发现此命中的几率越低 )。E 值的计算是本领域众所周知的。除了 E 值之外, 还对 比较进行同一性百分比评分。同一性百分比是指两比较核酸 ( 或多肽 ) 序列之间在特定长 度上的相同核苷酸 ( 或氨基酸 ) 数。在大家族的情况下可以使用 ClustalW, 继之以邻接树 来辅助相关基因的聚类可视化, 和鉴定直向同源物和旁系同源物。
杂交
如本文中所定义的术语 “杂交” 是其中基本上同源的互补核苷酸序列彼此退火的 过程。杂交过程可以完全在溶液中进行, 即两种互补性核酸均处于溶液中。杂交过程也可 以在互补性核酸之一固定到基质如磁珠、 琼脂糖 (Sepharose) 珠或任何其它树脂的情况下 发生。 杂交过程也可以在互补性核酸之一固定至固相支持体如硝酸纤维素膜或尼龙膜上或 通过例如照相平版印刷术固定至例如硅酸玻璃支持物 ( 后者称作核酸阵列或微阵列或称 作核酸芯片 ) 上的情况下进行。为使杂交发生, 通常将核酸分子热变性或化学变性以使双 链解链成为两条单链和 / 或去除来自单链核酸的发夹或其它二级结构。
术语 “严格性” 指在其中发生杂交的条件。 杂交的严格性受条件如温度、 盐浓度、 离
子强度和杂交缓冲液组成影响。通常, 将低严格性条件选择为在确定的离子强度及 pH 时低 于特定序列热解链温度 (Tm) 约 30℃。中等严格性条件是此时温度低于 Tm 约 20℃, 高严格 性条件是此时温度低于 Tm 约 10℃。高严格性杂交条件一般用于分离与靶核酸序列具有高 序列相似性的杂交序列。然而, 核酸可以在序列上偏离并且因遗传密码子的简并性而依旧 编码基本上相同的多肽。因而有时候可能需要中等严格性杂交条件来鉴定此类核酸分子。
Tm 是在确定的离子强度及 pH 下 50%的靶序列与完全匹配的探针杂交时的温度。 Tm 取决于溶液条件和探针的碱基组成及长度。例如, 较长的序列在较高温度下特异性地杂 交。从低于 Tm 约 16℃直至 32℃获得最大杂交速率。一价阳离子在杂交溶液中的存在降低 了两条核酸链间的静电排斥, 因而促进杂交分子形成 ; 这种作用对于高达 0.4M 的钠浓度是 明显的 ( 对于更高浓度, 这种效应可以忽略 )。甲酰胺降低 DNA-DNA 和 DNA-RNA 双链体的解 链温度, 每百分数甲酰胺降低 0.6 至 0.7℃, 并且添加 50%甲酰胺允许在 30 至 45℃进行杂 交, 虽然杂交速率会降低。碱基对错配降低了杂交速率及双链体的热稳定性。平均而言并 且对于大的探针来说, 每%碱基错配 Tm 下降约 1℃。取决于杂交分子的类型, Tm 可以使用下 列等式计算 :
1)DNA-DNA 杂交分子 (Meinkoth 和 Wahl, Anal.Biochem., 138 : 267-284, 1984) : + a b c -1
Tm = 81.5℃ +16.6xlog10[Na ] +0.41x% [G/C ]-500x[L ] -0.61x%甲酰胺
2)DNA-RNA 或 RNA-RNA 杂交分子 :
Tm = 79.8+18.5(log10[Na+]a)+0.58(% G/Cb)+11.8(% G/Cb)2-820/Lc
3) 寡 DNA 或寡 RNAd 杂交分子 :
对于< 20 个核苷酸 : Tm = 2(ln)
对于 20-35 个核苷酸 : Tm = 22+1.46(ln) a
或对于其它一价阳离子, 但是仅在 0.01-0.4M 范围内是精确的。 b
仅对于% GC 在 30%至 75%范围内是精确的。 c
L =双链体的长度 ( 以碱基对计 )。 d
oligo, 寡核苷酸 ; ln, =引物的有效长度= 2×(G/C 数 )+(A/T 数 )。
可以使用众多已知技术的任何一种来控制非特异性结合, 如例如用含蛋白质的溶 液封闭薄膜、 添加异源性 RNA、 异源性 DNA 及 SDS 至杂交缓冲液并且用 RNA 酶处理。对于非 同源性探针, 一系列杂交可以通过改变以下条件之一进行 : (i) 逐渐降低退火温度 ( 例如从 68℃至 42℃ ) 或 (ii) 逐渐降低甲酰胺浓度 ( 例如从 50%至 0% )。技术人员了解杂交期 间可以加以改变和将维持或改变严格性条件的多种参数。
除杂交条件之外, 杂交特异性一般还取决于杂交后洗涤的功能。为除去因非特异 性杂交所致的背景, 样品用稀释的盐溶液洗涤。此类洗涤的关键因素包括最终洗涤溶液的 离子强度及温度 : 盐浓度越低并且洗涤温度越高, 则洗涤的严格性越高。 洗涤条件一般在杂 交严格性上或低于杂交严格性而进行。阳性杂交产生至少两倍于背景信号的信号。通常, 用于核酸杂交分析法或基因扩增检测方法的合适严格性条件如上所述。 也可以选择更严格 或更不严格的条件。 技术人员了解洗涤期间可以加以改变和将维持或改变严格性条件的多 种参数。
例如, 用于长度大于 50 个核苷酸的 DNA 杂交分子的常见高严格性杂交条件包括在 65℃于 1×SSC 中或在 42℃于 1×SSC 和 50%甲酰胺中杂交, 随后在 65℃于 0.3×SSC 中洗涤。用于长度大于 50 个核苷酸的 DNA 杂交分子的中等严格性杂交条件的例子包括在 50℃ 于 4×SSC 中或在 40℃于 6×SSC 和 50%甲酰胺中杂交, 随后在 50℃于 2×SSC 中洗涤。杂 交分子的长度是杂交核酸的预期长度。当序列已知的核酸杂交时, 可以通过比对序列并鉴 定本文中所述的保守区而确定杂交分子长度。1×SSC 是 0.15M NaCl 和 15mM 柠檬酸钠 ; 杂 交溶液和洗涤溶液可以额外地包含 5×Denhardt 试剂、 0.5-1.0% SDS、 100μg/ml 变性的片 段化鲑精 DNA、 0.5%焦磷酸钠。
为了定义严格性水平的目的, 可以参考 Sambrook 等 (2001)Molecular Cloning : a laboratory manual, 第三版, Cold Spring Harbor Laboratory Press, CSH, New York 或参 考 Current Protocols in Molecular Biology, John Wiley & Sons, N.Y.(1989 和每年更 新版本 )。
剪接变体
如本文中所用的术语 “剪接变体” 包含其中已经切除、 替换、 移位或添加所选内含 子和 / 或外显子或其中内含子已经缩短或加长的核酸序列的变体。此类变体将是其中基本 上保留了蛋白质的生物活性的一种变体 ; 这可以通过选择性保留蛋白质的功能性片段而实 现。此类剪接变体可以在自然界中找到或可以人工制造。用于预测和分离此类剪接变体的 方法是本领域众所周知的 ( 见例如 Foissac 和 Schiex, (2005)BMC Bioinformatics.6 : 25)。
等位变体
等位基因或等位变体是给定基因的替代形式, 位于相同染色体位置内。等位变体 包含单核苷酸多态性 (SNP) 和小插入 / 缺失多态性 (INDEL)。 INDEL 的尺寸通常小于 100bp。 SNP 和 INDEL 形成在大部分生物的天然存在性多态性株系中序列变体的最大集合。
内源基因
本文中提及的 “内源” 基因不仅仅指如在植物中以其天然形式 ( 即没有任何人类 干预 ) 存在的所讨论基因, 还指处于分离形式随后 ( 再 ) 引入植物中的相同基因 ( 或基本 上同源的核酸 / 基因 )( 转基因 )。例如, 含有这种转基因的转基因植物可以遭遇转基因表 达大幅降低和 / 或内源基因表达的大幅降低。分离的基因可从生物体分离, 或可人工制造 ( 例如通过化学合成 )。
基因改组 / 定向进化
基因改组或定向进化的组成为 : 反复 DNA 改组, 随后适当筛选和 / 或选择以产生 编码具有修饰的生物学活性的蛋白质之核酸或其部分的变体 (Castle 等, (2004)Science 304(5674) : 1151-4 ; 美国专利 5,811,238 和 6,395,547)。
构建体
其它调节元件可包括转录及翻译增强子。 本领域技术人员会了解适于在实施本发 明中使用的终止子和增强子序列。如在定义部分所述, 也可将内含子序列添加至 5′非翻 译区 (UTR) 或编码序列上, 以增加在细胞质内积累的成熟信息的量。其它控制序列 ( 除启 动子、 增强子、 沉默子、 内含子序列、 3’ UTR 和 / 或 5’ UTR 区之外 ) 可以是蛋白质和 / 或 RNA 稳定元件。本领域技术人员会知道或可以容易地获得此类序列。
本发明的遗传构建体还可以包括在特定细胞类型中维持和 / 或复制需要的复制 起点序列。一个例子是当需要将遗传构建体在细菌细胞中作为附加型遗传元件 ( 例如质粒 或粘粒分子 ) 维持时。优选的复制起点包括但不限于 f1-ori 和 colE1。为检测如在本发明方法中所用核酸序列的成功转移和 / 或选择包含这些核酸序 列的转基因植物, 使用标记基因 ( 或报告基因 ) 是有利的。因而, 遗传构建体可以任选地包 含可选择标记基因。可选择标记在本文 “定义” 部分中有更详细的描述。一旦不再需要, 可 以从转基因细胞中去除或切除标记基因。用于标记基因去除的技术是本领域已知的, 有用 的技术在上文定义部分中描述。
调节元件 / 控制序列 / 启动子
术语 “调节元件” 、 “控制序列” 和 “启动子” 均在本文中可互换使用, 并且在广义上 意指能够影响与之连接的序列表达的调节性核酸序列。术语 “启动子” 一般指位于基因转 录起点上游并参与识别及结合 RNA 聚合酶和其它蛋白质, 因而指导有效连接的核酸转录的 核酸控制序列。前述术语包括从典型的真核基因组基因 ( 包括对于精确转录启动所需的 TATA 盒, 具有或没有 CCAAT 盒序列 ) 中衍生的转录调节序列和应答发育刺激和 / 或外部刺 激或以组织特异性方式改变基因表达的额外调节元件 ( 如, 上游激活序列、 增强子和沉默 子 )。 本术语还包括典型的原核基因的转录调节序列, 在此情况下它可以包括 -35 盒序列和 / 或 -10 盒转录调节序列。术语 “调节元件” 也包含赋予、 激活或增强核酸分子在细胞、 组织 或器官中表达的合成的融合分子或衍生物。
“植物启动子” 包含介导编码序列区段在植物细胞中表达的调节元件。因此, 植物 启动子不一定是植物来源的, 而是可以源自病毒或微生物, 例如来自侵袭植物细胞的病毒。 “植物启动子” 也可以源自植物细胞, 例如来自用待于本发明方法中表达及在本文中描述的 核酸序列所转化的植物。这也适用于其它 “植物” 调节性信号, 如 “植物” 终止子。用于本 发明方法中的核苷酸序列上游的启动子可以由一个或多个核苷酸替换、 插入和 / 或缺失而 受到修饰, 但不干扰启动子、 开放阅读框 (ORF) 或 3′调节区 ( 如终止子 ) 或远离 ORF 的其 它 3′调节区的功能性或活性。启动子的活性还有可能因修饰该启动子的序列或由更具活 性的启动子、 甚至来自异源生物的启动子彻底替换该启动子而增加。 为在植物中表达, 如上 所述, 核酸分子必须有效连接至或包含合适的启动子, 其中所述的启动子在正确时间点上 并以所需要的空间表达模式表达基因。
为了鉴定功能等价启动子, 可以分析候选启动子的启动子强度和 / 或表达模式, 例如通过将该启动子与报告基因有效连接并测定该报告基因在多种植物组织中的表达水 平和模式。合适的公知报告基因包括例如 β- 葡糖醛酸糖苷酶或 β- 半乳糖苷酶。通过 测量 β- 葡糖醛酸糖苷酶或 β- 半乳糖苷酶的酶活性来测定启动子活性。接着可以将启动 子强度和 / 或表达模式与参考启动子 ( 如用于本发明方法中的 ) 进行比较。或者, 可以通 过定量 mRNA 水平或者将本发明方法中所用核酸的 mRNA 水平与持家基因 ( 如 18S rRNA) 的 mRNA 水平进行比较来测定启动子强度, 其中使用本领域众所周知的技术, 如通过放射自显 影的光密度测定分析进行的 Northern 印迹、 定量实时 PCR 或 RT-PCR(Heid 等, 1996 Genome Methods 6 : 986-994)。通常, “弱启动子” 指驱动编码序列低水平表达的启动子。 “低水平” 指每个细胞中约 1/10,000 的转录物至约 1/100,000 的转录物至约 1/500,0000 的转录物的 水平。相反, “强启动子” 驱动编码序列高水平表达, 或者每个细胞中约 1/10 的转录物至约 1/100 的转录物至约 1/1000 的转录物的水平。通常, “中等强度启动子” 指此类启动子, 其 驱动编码序列以低于强启动子的水平表达, 特别是在所有情况下以低于 35S CaMV 启动子控 制时获得的水平表达。有效连接
如本文中所用的术语 “有效连接” 指启动子序列与目的基因之间功能性地连接, 以 至于启动子序列能够启动目的基因转录。
组成型启动子
“组成型启动子” 指在至少一种细胞、 组织或器官中在其大多数 ( 但不一定是全 部 ) 生长和发育阶段并在大多数环境条件下有转录活性的启动子。下表 2a 给出了组成型 启动子的例子。
表 2a : 组成型启动子的例子
遍在启动子 遍在启动子在生物的基本上全部组织或细胞中有活性。 发育调节性启动子发育调节性启动子在某个发育期期间或在经历发育变化的植物部分内有活性。
诱导型启动子
诱导型启动子在应答化学品 ( 综述见 Gatz 1997, Annu.Rev.Plant Physiol.Plant Mol.Biol., 48 : 89-108)、 环境刺激或物理刺激时具有受诱导或增加的转录启动, 或可以是 “胁迫诱导型” , 即当植物暴露于多种胁迫条件时受到激活, 或是 “病原体诱导型” , 即当植物 暴露于多种病原体时受到激活。
器官特异性 / 组织特异性启动子
器官特异性或组织特异性启动子是能够优先在某些器官或组织如叶、 根、 种子组 织等内启动转录的启动子。例如, “根特异性启动子” 是在植物根中优势地具有转录活性的 启动子, 在植物的任何其它部分内基本上无活性, 尽管在植物的这些其它部分内允许任何 泄露表达。能够仅在某些细胞中启动转录的启动子在本文中称作 “细胞特异性” 。
根特异性启动子的例子列于下表 2b 中 :
表 2b : 根特异性启动子的例子
种子特异性启动子主要在种子组织中有转录活性, 但不一定仅在种子组织中有 ( 泄漏表达的情况 )。种子特异性启动子可在种子发育和 / 或萌发过程中有活性。种子特异性启动子可以是胚乳 / 糊粉 / 胚特异性的。种子特异性启动子的实例 ( 胚乳 / 糊粉 / 胚特异性的 ) 在下表 2c 至表 2f 中显示。种子特异性启动子的其它实例在 Qing Qu 和 Takaiwa(Plant Biotechnol.J.2, 113-125, 2004) 中给出, 其公开内容整体并入本文作为参 考。
表 2c : 种子特异性启动子的例子
表 2d : 胚乳特异性启动子的例子
表 2e : 胚特异性启动子的例子 :基因来源 稻 OSH1 KNOX PRO0151 PRO0175 PRO005 PRO0095 参考文献 Sato 等, Proc.Natl.Acad.Sci.USA, 93 : 8117-8122, 1996 Postma-Haarsma 等, Plant Mol.Biol.39 : 257-71, 1999 WO 2004/070039 WO 2004/070039 WO 2004/070039 WO 2004/070039
表 2f : 糊粉特异性启动子的例子 :如本文中所定义的绿色组织特异性启动子是主要在绿色组织中具有转录活性的 启动子, 在植物的任何其它部分内基本上无活性, 尽管在植物的这些其它部分内允许任何 泄露表达。
可以用来实施本发明方法的绿色组织特异性启动子的例子在下表 2g 中显示。
表 2g : 绿色组织特异性启动的例子
组织特异性启动子的另一个例子是分生组织特异性启动子, 其主要在分生性组织 中具有转录活性, 在植物的任何其它部分内基本上无活性, 尽管在植物的这些其它部分内 允许任何泄露表达。 可用于实施本发明方法的绿色分生组织特异性启动子的例子示于下列 的表 2h。
表 2h : 分生组织特异性启动子的例子终止子
术语 “终止子” 包括这样的控制序列, 其是在转录单位末端的 DNA 序列, 发出对初 级转录物进行 3’ 加工并多聚腺苷化以及终止转录的信号。终止子可以来自天然基因、 来自 多种其它植物基因或来自 T-DNA。待添加的终止子可以来自例如胭脂碱合酶或章鱼碱合酶 基因, 或者来自另一植物基因或较不优选地来自任何其它真核基因。
可选择标记 ( 基因 )/ 报告基因
“可选择标记” 、 “可选择标记基因” 或 “报告基因” 包括向细胞赋予表型的任何基 因, 其中在所述的细胞内表达所述基因以促进鉴定和 / 或选择用本发明的核酸构建体所转 染或转化的细胞。这些标记基因能够通过一系列不同原理鉴定核酸分子的成功转移。合 适的标记可以选自赋予抗生素抗性或除草剂抗性、 引入新代谢性状或允许目视选择的标 记。可选择标记基因的例子包括赋予抗生素抗性的基因 ( 如使新霉素和卡那霉素磷酸化的
nptII 或使潮霉素磷酸化的 hpt 或赋予对例如博来霉素、 链霉素、 四环素、 氯霉素、 氨苄青霉 素、 庆大霉素、 遗传霉素 (Geneticin, G418)、 壮观霉素或杀稻瘟素的抗性的基因 )、 赋予除 草剂抗性的基因 ( 例如提供 抗性的 bar ; 提供草甘膦抗性的 aroA 或 gox 或赋予对 例如咪唑啉酮、 膦丝菌素或磺脲类的抗性的基因 ) 或提供代谢性状的基因 ( 如允许植物使 用甘露糖作为唯一碳源的 manA 或利用木糖的木糖异构酶或抗营养标记如 2- 脱氧葡萄糖抗 性 )。视觉标记基因的表达导致形成颜色 ( 例如 β- 葡糖醛酸糖苷酶、 GUS 或 β- 半乳糖 苷酶与其有色底物例如 X-Gal)、 发光 ( 如萤光素 / 萤光素酶系统 ) 或荧光 ( 绿色荧光蛋白 GFP 及其衍生物 )。这个名单仅代表少数的可能标记。技术人员熟悉此类标记。取决于生 物和选择方法, 优选不同的标记。
已知当核酸稳定或瞬时整合至植物细胞时, 仅小部分的细胞摄取外来 DNA 并且根 据需要将其整合至细胞基因组, 这取决于所用表达载体和使用的转染技术。为鉴定并选择 这些整合子, 通常将编码可选择标记 ( 如上文所述之一 ) 的基因连同目的基因一起引入宿 主细胞。 这些标记可以例如在其中这些基因因例如常规方法所致的缺失而无功能的突变体 中使用。 此外, 编码可选择标记的核酸分子可以引入宿主细胞中, 与编码本发明多肽或本发 明方法中所用多肽的序列在同一载体上, 或在单独的载体上。已经用引入的核酸稳定转染 的细胞可以例如通过选择进行鉴定 ( 例如具有整合的可选择标记的细胞存活而其它细胞 死亡 )。
因为一旦已经成功引入了核酸, 则转基因宿主细胞中就不再需要或不希望有标记 基因, 尤其抗生素抗性基因和除草剂抗性基因, 因此用于引入核酸的本发明方法有利地使 用能够去掉或切除这些标记基因的技术。一种如此方法称作共转化法。共转化法使用同时 用于转化的两种载体, 一种载体携带本发明的核酸而另一种载体携带标记基因。高比例的 转化体接受, 或在植物的情况下, 包含 ( 高达 40%或更多的转化体 ) 这两种载体。在用农 杆菌转化的情况下, 转化体通常仅接受载体的一部分, 即侧翼有 T-DNA 的序列, 它通常代表 表达盒。标记基因随后可以通过进行杂交而从转化的植物中去掉。在另一种方法中, 整合 至转座子的标记基因用来与想要的核酸一起进行转化 ( 称作 Ac/Ds 技术 )。转化体可以与 转座酶来源植物杂交或转化体与导致转座酶表达的核酸构建体瞬时或稳定地转化。 在一些 情况下 ( 大约 10% ), 转座子在已经成功发生转化时跳出宿主细胞的基因组并丢失。在其 它更多情况下, 转座子跳至不同位置。在这些情况下, 标记基因必须通过进行杂交而去除。 在微生物学中, 开发了实现或促进检测这类事件的技术。又一个有利的方法依赖于已知的 重组系统 ; 此方法的优势在于不必通过杂交去除。 该类型的最知名系统称作 Cre/lox 系统。 Cre1 是去掉位于 loxP 序列之间序列的重组酶。若标记基因整合于 loxP 序列之间, 则在已 经成功发生转化时, 通过重组酶表达去除标记基因。其它重组系统是 HIN/HIX、 FLP/FRT 和 REP/STB 系统 (Tribble 等, J.Biol.Chem., 275, 2000 : 22255-22267 ; Velmurugan 等, J.Cell Biol., 149, 2000 : 553-566)。有可能将本发明核酸序列以位点特异性方式整合至植物基因 组。这些方法自然也可以应用至微生物如酵母、 真菌或细菌。
转基因的 / 转基因 / 重组
为本发明目的, “转基因的” 、 “转基因” 或 “重组” 就例如核酸序列而言意指包含此 核酸序列的表达盒、 基因构建体或载体或用本发明的核酸序列、 表达盒或载体转化的生物, 所有那些构建均通过重组方法产生, 其中(a) 编码用于本发明方法中的蛋白质的核酸序列, 或
(b) 与本发明核酸序列有效连接的遗传控制序列, 例如启动子, 或
(c)a) 和 b)
不处于其天然遗传环境中或已经通过重组方法修饰, 修饰有可能采用例如替换、 添加、 缺失、 倒位或插入一个或多个核苷酸残基的形式。天然遗传环境理解为意指来源植 物中或存在于基因组文库中的天然基因组基因座或染色体基因座。在基因组文库的情况 下, 核酸序列的天然遗传环境优选地得到保留, 至少部分地得以保留。该环境分布在核酸 序列的至少一侧并且具有至少 50bp, 优选至少 500bp, 特别优选至少 1000bp, 最优选至少 5000bp 的序列长度。 天然存在的表达盒 - 例如核酸序列的天然启动子与编码本发明方法中 所用多肽的对应核酸序列的天然存在的组合, 如上文所定义 - 在这种表达盒通过非天然的 合成 (“人工” ) 方法 ( 如例如诱变处理 ) 修饰后, 变成转基因表达盒。合适方法例如在 US 5,565,350 或 WO 00/15815 中描述。
为本发明目的, 转基因植物因此如上理解为意指本发明方法中所用的核酸不位于 所述植物基因组中该核酸的天然基因座内, 所述核酸有可能同源或异源地表达。然而如所 提及, 转基因还意指尽管本发明核酸或在本发明方法中所用核酸处于植物基因组中该核酸 的天然位置内, 然而其序列相对于天然序列而言已经受到修饰, 和 / 或所述天然序列的调 节序列已经受到修饰。 转基因优选地理解为意指本发明核酸在基因组中的非天然基因座内 表达, 即发生核酸的同源表达或优选异源表达。在本文中提到了优选的转基因植物。
调节
术语 “调节” 就表达或基因表达而言意指这样的过程, 其中表达水平与对照植物相 比因所述基因的表达而改变, 表达水平可以是增加或减少。原先未受调节的表达可以是结 构 RNA(rRNA、 tRNA) 或 mRNA 的任何类型表达, 随后是翻译。术语 “调节活性” 应当意指本 发明核酸序列或所编码蛋白质的表达的任何变化, 这导致植物增加的产量和 / 或增加的生 长。
表达
术语 “表达” 或 “基因表达” 指转录一个或多个特定基因或特定的遗传构建体。特 别地, 术语 “表达” 或 “基因表达” 指将一个或多个基因或遗传构建体转录成结构 RNA(rRNA、 tRNA) 或 mRNA, 包括或者不包括后者随后翻译成蛋白质。该过程包括转录 DNA 和加工所得 的 mRNA 产物。
增加的表达 / 过表达
如本文中所用的术语 “增加的表达” 或 “过表达” 意指对于原有野生型表达水平是 额外的任何形式表达。
在本领域内详细记载了用于增加基因或基因产物表达的方法并且它们包括例如, 由适宜启动子驱动的过表达、 使用转录增强子或翻译增强子。可以在非异源形式的多核苷 酸的适宜位置 ( 一般是上游 ) 内引入作为启动子或增强子元件的分离核酸, 以便上调编码 目的多肽的核酸的表达。例如, 内源性启动子可以通过突变、 缺失和 / 或置换而在体内改变 ( 见 Kmiec, US5,565,350 ; Zarling 等, WO9322443), 或可以将分离的启动子以相对于本发明 基因的正确方向及距离引入植物细胞, 以便控制基因表达。
如果期望表达多肽, 一般期望在多核苷酸编码区的 3’ 末端包含多腺苷酸化区。多腺苷酸化区可来自该天然基因, 来自多种其它植物基因, 或者来自 T-DNA。待被加入的 3’ 末 端序列可来自例如胭脂碱合酶或章鱼碱合酶基因, 或者来自另一植物基因, 或者较不优选 地来自任何其它真核基因。
内含子序列也可添加至 5′非翻译区 (UTR) 或部分编码性序列的编码序列上, 以 增加在细胞质内积累的成熟信息的量。已经证实可剪接内含子在植物表达构建体和动物 表达构建体中转录单位内的包含在 mRNA 水平及蛋白质水平上增加基因表达至多达 1000 倍 (Buchman 和 Berg(1988)Mol.Cell biol.8 : 4395-4405 ; Callis 等 (1987)Gens Dev 1 : 1183-1200)。基因表达的此类内含子增强作用一般在位于转录单元 5′端附近时最强烈。 使用玉米内含子 Adh1-S 内含子 1、 2 和 6、 Bronze-1 内含子是本领域已知的。对于一般信 息, 见: 《玉米手册》 , 第 116 章, 编者 Freeling 和 Walbot, Springer, N.Y.(1994)。
降低的表达
本文中提及的 “降低的表达” 或者 “降低或基本去除” 的表达意指内源基因表达和 / 或多肽水平和 / 或多肽活性相对于对照植物的降低。 与对照植物相比, 降低或基本去除以 递增优选顺序是至少 10%、 20%、 30%、 40%或 50%、 60%、 70%、 80%、 85%、 90%或 95%、 96%、 97%、 98%、 99%或更多的降低。
为了降低或基本去除内源基因在植物中的表达, 需要核酸序列的足够长度的基本 上连续的核苷酸。 为了开展基因沉默, 这个长度可以是少至 20、 19、 18、 17、 16、 15、 14、 13、 12、 11、 10 个或更少的核苷酸, 或者该长度可以多至整个基因 ( 包括 5’ 和 / 或 3’ UTR, 部分或全 体 )。基本上连续的核苷酸片段可以来自编码目的蛋白质的核酸 ( 靶基因 ) 或来自能够编 码目的蛋白质的直向同源物、 旁系同源物或同源物的任何核酸。 优选地, 基本上连续的核苷 酸片段能够与靶基因 ( 有义链或反义链 ) 形成氢键, 更优选地, 基本上连续的核苷酸片段以 递增优选顺序与靶基因 ( 有义链或反义链 ) 具有 50%、 60%、 70%、 80%、 85%、 90%、 95%、 96%、 97%、 98%、 99%、 100%的序列同一性。编码 ( 功能性 ) 多肽的核酸序列不是本文中 所讨论用于降低或基本去除内源基因表达的多种方法所需的。
表达的这种降低或基本去除可以使用常规工具和技术完成。用于降低或基本去 除内源基因表达的优选方法是通过在植物中引入和表达遗传构建体, 将被间隔物 ( 非编码 DNA) 分隔的核酸作为反向重复序列 ( 部分地或完全地 ) 克隆入此构建体中 ( 在此情况下该 核酸是从目的基因或从任何核酸中衍生的一段基本上连续的核苷酸, 其中所述的任何核酸 能够编码任何目的蛋白质之一的直向同源物、 旁系同源物或同源物 )。
在这样的优选方法中, 通过 RNA 介导的沉默降低或基本去除内源基因表达, 其中 使用核酸或其部分的反向重复序列 ( 在此情况下是从目的基因或从任何核酸中衍生的一 段基本上连续的核苷酸片段, 其中所述的任何核酸能够编码目的蛋白质的直向同源物、 旁 系同源物或同源物 ), 优选能够形成发夹结构。 反向重复序列克隆在含有控制序列的表达载 体中。非编码 DNA 核酸序列 ( 间隔物, 例如基质结合区片段 (MAR)、 内含子、 聚合接头等等 ) 位于形成反向重复序列的两个反向核酸之间。在反向重复序列转录后, 形成带有自身互补 结构 ( 部分或完全的 ) 的嵌合 RNA。这个双链 RNA 结构被称为发夹 RNA(hpRNA)。hpRNA 由 植物加工成 siRNA, 其整合入 RNA 诱导的沉默复合物 (RISC) 中。RISC 进一步切割 mRNA 转 录本, 由此大量减少将被翻译成多肽的 mRNA 转录本的数量。对于更多一般性细节见例如, Grierson 等 (1998)WO 98/53083 ; Waterhouse 等 (1999)WO99/53050)。本发明方法的实施不依赖于在植物中引入和表达遗传构建体 ( 核酸作为反向重 复序列克隆至该构建体中 ), 也可使用数个众所周知的 “基因沉默” 方法中的任何一个或多 个达到相同效果。
用于减少内源基因表达的一个此类方法是 RNA 介导的基因表达沉默 ( 下调 )。在 此情况下, 沉默由植物中的双链 RNA 序列 (dsRNA) 引发, 该双链 RNA 序列与内源靶基因基本 相似。这个 dsRNA 由植物进一步加工成约 20 至约 26 个核苷酸, 被称为短干扰 RNA(siRNA)。 siRNA 整合入 RNA 诱导的沉默复合物 (RISC) 中, 该复合物切割内源靶基因的 mRNA 转录本, 由此大量减少将被翻译成多肽的 mRNA 转录本的数量。 优选地, 双链 RNA 序列对应于靶基因。
RNA 沉默方法的另一个例子包括以有义方向引入核酸序列或其部分 ( 在此情况下 是从目的基因或从任何核酸中衍生的一段基本上连续的核苷酸片段, 其中所述的任何核酸 能够编码目的蛋白质的直向同源物、 旁系同源物或同源物 ) 至植物内。 “有义方向” 指与其 mRNA 转录本同源的 DNA 序列。因此引入植物的将至少是核酸序列的一个拷贝。附加的核酸 序列将减少内源基因的表达, 引起通常所说的共抑制现象。因为高转录本水平和共抑制的 引发之间正相关, 如果数个附加拷贝的核酸序列引入植物中, 基因表达的减少将更显著。
RNA 沉默方法的另一个例子包括使用反义核酸序列。 “反义” 核酸序列包含与编码 蛋白质的 “有义” 核酸序列互补的核苷酸序列, 也就是, 与双链 cDNA 分子的编码链互补或与 mRNA 转录本序列互补。 反义核酸序列优选与将被沉默的内源基因互补。 互补性可位于基因 的 “编码区” 和/或 “非编码区” 。术语 “编码区” 指含有翻译成氨基酸残基的密码子的核苷 酸序列区。术语 “非编码区” 指位于编码区侧翼的 5′和 3′序列, 其将被转录却不被翻译 成氨基酸 ( 也称为 5′和 3′非翻译区 )。
反义核酸序列可根据 Watson 和 Crick 碱基配对的规则进行设计。反义核酸序列 可以与整个核酸序列互补 ( 在这种情况下, 基本上连续的核苷酸片段可以来自目的基因, 或来自能够编码目的蛋白质的直向同源物、 旁系同源物或同源物的任何核酸 ), 也可以是寡 核苷酸, 其仅与核酸序列 ( 包括 mRNA 5’ 和 3’ UTR) 的一部分是反义的。例如, 反义寡核苷 酸序列可以与编码多肽的 mRNA 转录本的翻译起始位点周围的区域互补。适合的反义寡核 苷酸序列长度在本领域是已知的, 可从约 50、 45、 40、 35、 30、 25、 20、 15 或 10 核苷酸长度或更 少起始。 本发明的反义核酸序列可使用化学合成以及酶连接反应通过本领域已知的方法构 建。例如, 反义核酸序列 ( 例如, 反义寡核苷酸序列 ) 可以使用天然存在的核苷酸或各种改 进的核苷酸 ( 为增加分子的生物稳定性或增加反义和有义核酸序列之间形成的双螺旋的 物理稳定性而设计 ) 进行化学合成, 例如, 可以使用硫代磷酸酯衍生物和吖啶取代的核苷 酸。本领域众所周知可用于产生反义核酸序列的改进的核苷酸实例。已知的核苷酸改进包 括甲基化、 环化和 ‘帽’ 和一个或多个天然存在核苷酸用类似物如肌苷替换。核苷酸的其它 改进是本领域众所周知的。
可使用表达载体生物学产生反义核酸序列, 其中核酸序列以反义方向亚克隆进入 该表达载体 ( 即, 转录自插入核酸的 RNA 与目的靶核酸是反义方向的 )。 优选地, 植物中反义 核酸序列通过稳定整合的核酸构建体 ( 包含启动子、 有效连接的反义寡核苷酸和终止子 ) 产生。
本发明方法中用于沉默的核酸分子 ( 无论引入植物或在原位产生 ) 与 mRNA 转录 本和 / 或编码多肽的基因组 DNA 杂交或结合, 由此抑制蛋白质的表达, 例如, 通过抑制转录和 / 或翻译。杂交可以通过常规的核苷酸互补形成稳定的双螺旋, 或例如, 就结合至 DNA 双 螺旋的反义核酸序列而言, 通过双螺旋大沟中的特异性相互作用。反义核酸序列可通过转 化或在特异组织位点直接注射引入植物中。 备选地, 可改进反义核酸序列以靶向被选细胞, 随后全身性施用。例如, 对于全身施用, 可改进反义核酸序列, 使它们与表达于被选细胞表 面上的受体或抗原特异性结合, 例如通过将反义核酸序列连接至与细胞表面受体或抗原结 合的肽或抗体。也可使用本文所述的载体将反义核酸序列输送至细胞。
另一方面, 反义核酸序列是一种 a- 异头物核酸序列。a- 异头物核酸序列与互补 的 RNA 形成特异性双链杂交, 其中 ( 与常见的 b- 单位相反 ) 链相互之间平行 (Gaultier 等 (1987)Nucl Ac Res 15 : 6625-6641)。 反义核酸序列也可包含 2′ -o- 甲基核糖核苷 (Inoue 等 (1987)Nucl Ac Res 15, 6131-6148) 或嵌合的 RNA-DNA 类似物 (Inoue 等 (1987)FEBS Lett.215, 327-330)。
内源基因表达的降低或基本消除也可使用核酶实施。核酶是有核糖核酸酶活性 的催化 RNA 分子, 能切割单链的核酸序列, 如 mRNA, 它们与切割的单链核酸序列具有互补 区。因此, 核酶 ( 例如, 锤头核酶 ( 在 Haselhoff 和 Gerlach(1988)Nature 334, 585-591 中描述 ) 可用于催化切割编码多肽的 mRNA 转录本, 由此基本上减少将要被翻译成多肽的 mRNA 转录本的数量。可以设计对核酸序列具有特异性的核酶 ( 见例如 : Cech 等美国专利号 4,987,071 ; 和 Cech 等美国专利号 5,116,742)。备选地, 对应于核酸序列的 mRNA 转录本可 用于从 RNA 分子库中选择具有特定核糖核酸酶活性的催化 RNA(Bartel 和 Szostak(1993) Science 261, 1411-1418)。 使用核酶用于植物中基因沉默是本领域已知的。 ( 例如, Atkins 等 (1994)WO 94/00012 ; Lenne 等 (1995)WO 95/03404 ; Lutziger 等 (2000)WO 00/00619 ; Prinsen 等 (1997)WO 97/13865 和 Scott 等 (1997)WO 97/38116)。
基 因 沉 默 也 可 以 通 过 插 入 诱 变 ( 例 如 T-DNA 插 入 或 转 座 子 插 入 ) 或 通 过 如 Angell 和 Baulcombe((1999)Plant J.20(3) : 357-62)、 (Amplicon VIGSWO 98/36083) 或 Baulcombe(WO 99/15682) 及其它人描述的策略而实现。
如果内源基因上有突变, 和 / 或在随后引入植物中的分离的基因 / 核酸上有突变, 也可以发生基因沉默。降低或基本上消除可由非功能性多肽引起。例如, 多肽可结合至多 种相互作用的蛋白质 ; 因此一个或多个突变和 / 或截断可提供一种多肽, 该多肽仍能结合 至相互作用的蛋白质 ( 如受体蛋白质 ), 但不可显示其正常功能 ( 如信号配体 )。
基因沉默的另一种方法是通过靶向与基因调节区 ( 例如启动子和 / 或增强子 ) 互补的核酸序列以形成三重螺旋结构, 该结构防止基因在靶细胞中转录。见 Helene, C., Anticancer Drug Res.6, 569-84, 1991 ; Helene 等, Ann.N.Y.Acad.Sci.660, 27-361992 和 Maher, L.J.Bioassays 14, 807-15, 1992。
其它方法, 如使用针对内源性多肽的抗体以抑制此多肽在植物中的功能, 或干扰 所述多肽参与的信号途径, 对于技术人员将是众所周知的。 特别地, 可预见人造分子可用于 抑制靶多肽的生物学功能或用于干扰靶多肽参与的信号通路。
备选地, 可以设立筛选程序以鉴定植物群体中基因的天然变体, 该变体编码具有 降低活性的多肽。此类天然变体也可用于例如实施同源重组。 人工和 / 或天然的微 RNA(miRNA) 可以用来敲除基因表达和 / 或 mRNA 翻译。内源 性 miRNA 是通常 19-24 个核苷酸长度的单链小 RNA。它们的主要功能是调节基因表达和 /
或 mRNA 翻译。大多数植物微 RNA(miRNA) 与它们的靶序列具有完全或近乎完全的互补性。 然而, 有的天然靶标多达五个错配。它们通过 Dicer 家族双链特异性核糖核酸酶从更长的 非编码 RNA( 带有特征性折回结构 ) 加工。 加工后, 通过结合到其主要组分 (Argonaute 蛋白 质 ) 将它们整合入 RNA 诱导的沉默复合物 (RISC) 中。由于它们与细胞质中的靶核酸 ( 主 要是 mRNA) 进行碱基配对, MiRNA 用作 RISC 的特异性组分。随后的调节事件包括靶 mRNA 切 割和破坏和 / 或翻译抑制。因此, miRNA 过表达的影响常常反映在靶基因减少的 mRNA 水平 中。
通常 21 个核苷酸长度的人工微 RNA(amiRNA) 可以遗传改造以特异性地负调节单 个或多个目的基因的基因表达。植物微 RNA 靶的选择的决定因素是本领域众所周知的。 用于靶识别的经验参数已经确定并且可以用来辅助设计特定的 amiRNA(Schwab 等, Dev. Cell 8 : 517-527, 2005)。用于设计并产生 amiRNA 及其前体的便利工具也是公众可获得的 (Schwab 等, Plant Cell 18 : 1121-1133, 2006)。
为优化性能, 用于降低内源基因在植物中表达的基因沉默技术需要使用来自单子 叶植物的核酸序列以转化单子叶植物, 和使用来自双子叶植物的核酸序列以转化双子叶植 物。优选地, 将来自任何给定植物物种的核酸序列引入同一个物种内。例如, 将来自稻的核 酸序列转化至稻植物。然而, 并非绝对要求待引入的核酸序列起源于与该核酸序列将要引 入的植物相同的植物物种。 只要内源性靶基因与待引入的核酸之间存在相当大的同源性就 足够了。
上文描述的是用于降低或基本去除内源基因在植物中表达的多种方法的例子。 本 领域技术人员会轻易地能够调整前述用于沉默的方法以至于例如通过利用合适启动子而 实现在整株植物或在其部分中降低内源基因的表达。
转化
如本文中所提及的术语 “引入” 或 “转化” 包括将外源性多核苷酸转移至宿主细胞 内, 无论用于转化的方法是什么。能够后续克隆性增殖 ( 无论通过器官发生或胚胎发生 ) 的植物组织可以用本发明的遗传构建体转化并且可以从中再生整株植物。 选择的具体组织 将取决于可用于并且最适于正进行转化的具体物种的克隆性增殖系统。 示例性组织靶包括 叶盘、 花粉、 胚、 子叶、 下胚轴、 大配子体、 愈伤组织、 已有的分生组织 ( 例如顶端分生组织、 腋芽和根分生组织 ) 和诱导的分生组织 ( 例如子叶分生组织和下胚轴分生组织 )。多核苷 酸可以瞬时或稳定地引入宿主细胞并且可以非整合地维持, 例如作为质粒。 或者, 多核苷酸 可以整合至宿主基因组内。 产生的转化植物细胞随后可以用来以本领域技术人员已知的方 式再生出转化植物。
外来基因转移至植物基因组内称作转化。植物物种的转化现在是相当常规的技 术。有利地, 几种转化方法中的任一方法可以用来将目的基因引入合适的祖先细胞。用 于从植物组织或植物细胞中转化并再生出植物所述的方法可以用于瞬时转化或用于稳定 转化。转化方法包括使用脂质体、 电穿孔法、 增加游离 DNA 摄入的化学品、 DNA 直接注射 至植物、 粒子枪轰击法、 使用病毒或花粉的转化法和显微注射。转化方法可以选自用于 原生质体的钙 / 聚乙二醇法 (Krens, F.A. 等, (1982)Nature 296, 72-74 ; Negrutiu I 等 (1987)Plant Mol Biol 8 : 363-373) ; 原生质体的电穿孔法 (Shillito R.D. 等 (1985)Bio/ Technol 3, 1099-1102) ; 对植物材料的显微注射 (Crossway A 等, (1986)Mol.Gen Genet202 : 179-185) ; 包被有 DNA 或 RNA 的粒子轰击法 (Klein TM 等, (1987)Nature 327 : 70)、 ( 非整合性 ) 病毒感染法等。转基因植物, 包括转基因作物植物, 优选地通过农杆菌介导的 转化法产生。有利的转化方法是在植物中 (in planta) 的转化法。为此目的, 例如有可能 使农杆菌作用于植物种子或有可能用农杆菌接种植物的分生组织。 根据本发明已经证明使 转化的农杆菌混悬液作用于完整植物或至少作用于花原基是特别有利的。植物随后继续 培育直至获得所处理植物的种子 (Clough 和 Bent, Plant J.(1998)16, 735-743)。用于农 杆菌介导的稻转化的方法包括用于稻转化的公知方法, 如在任一以下文献中描述的那些方 法: 欧洲专利申请 EP 1198985 A1, Aldemita 和 Hodges(Planta 199 : 612-617, 1996) ; Chan 等 (Plant Mol Biol 22(3) : 491-506, 1993), Hiei 等 (Plant J 6(2) : 271-282, 1994), 其 公开内容在本文中引入作为参考, 如同完全给出那样。 在玉米转化的情况下, 优选的方法如 Ishida 等 (Nat.Biotechnol 14(6) : 745-50, 1996) 或 Frame 等 (Plant Physiol 129(1) : 13-22, 2002) 描述, 其公开内容在本文中如充分所述那样引入作为参考。 所述方法通过举例 方式进一步由 B.Jenes 等, Techniques for Gene Transfer, 在: Transgenic Plants, 第1 卷, Engineering and Utilization, 编者 S.D.Kung 和 R.Wu, Academic Press(1993)128-143 及在 Potrykus Annu.Rev.Plant Physiol.Plant Molec.Biol.42(1991)205-225) 中描述。 待表达的核酸或构建体优选地克隆至适于转化根癌农杆菌 (Agrobacterium tumefaciens) 的载体中, 例如 pBin19(Bevan 等, Nucl.Acids Res.12(1984)8711)。由这种载体转化的农 杆菌随后可以按照已知方式用于转化植物, 例如作为模型使用的植物, 如拟南芥 ( 拟南芥 属于本发明的范围, 不视为作物植物 ) 或作物植物如, 例如烟草植物, 例如通过在农杆菌溶 液中浸泡擦伤的叶或切碎的叶并随后将它们在合适的培养基内培育。 植物通过根癌农杆菌 的转化例如由 和 Willmitzer 在 Nucl.Acid Res.(1988)16, 9877 中描述或尤其从 F.F.White, Vectors for Gene Transfer in Higher Plants ; 在 Transgenic Plants, 第1 卷, Engineering and Utilization, 编者 S.D.Kung 和 R.Wu, Academic Press, 1993, 第 15-38 页中获知。 除了转化体细胞 ( 其随后必须再生成完整植物 ) 之外, 还有可能转化植物分生 组织的细胞及特别转化发育成配子的那些细胞。在这种情况下, 转化的配子遵循天然的 植物发育过程, 产生转基因植物。因此, 例如拟南芥种子用农杆菌处理并且从发育植物中 获得种子, 其中一定比例的所述植物受到转化并且因此是转基因的 [Feldman, KA 和 Marks MD(1987)Mol Gen Genet.208 : 274-289 ; Feldmann K(1992)。 在: 编者 C Koncz, N-H Chua 和 J Shell, Methods in Arabidopsis Research.Word Scientific, Singapore, 第 274-289 页 ]。 替代性方法基于反复去掉花序并使莲座中心中的切除部位与转化的农杆菌孵育, 因而转化 的种子同样可以在较晚的时间点获得 (Chang(1994)Plant J.5 : 551-558 ; Katavic(1994). Mol Gen Genet, 245 : 363-370)。然而, 尤其有效的方法是改进的真空渗入法, 如 “花浸染” 法。在拟南芥真空渗入法的情况下, 完整植物在减压下用农杆菌混悬液处理 [Bechthold, N(1993).C R Acad Sci Paris Life Sci, 316 : 1194-1199], 而在 “花浸染” 法的情况下, 正在 发育的花组织与表面活性剂处理的农杆菌混悬液短暂孵育 [Clough, SJ 和 Bent, AF(1998)
The Plant J.16, 735-743]。 在两种情况下收获了一定比例的转基因种子, 并且这些种子可 以通过在如上所述的选择条件下培育而与非转基因种子区分。此外, 质体的稳定转化是有 利的, 因为质体在大部分作物中以母体方式遗传, 降低或消除了转基因经花粉流动风险。 叶绿体基因组的转化一般通过已在 Klaus 等, 2004[Nature Biotechnology 22(2), 225-229] 中示例性加以展示的方法实现。简而言之, 待转化的序列连同可选择标记基因一起克隆至 与叶绿体基因组同源的侧翼序列之间。 这些同源的侧翼序列指导位点特异性整合至原质体 系内。已经对众多不同植物物种描述了质体转化并且综述可以出自 Bock(2001) 在基础研 究和植物生物技术中的转基因质体 (Transgenic plastids in basic research and plant biotechnology).J Mol Biol.2001 年 9 月 21 日 ; 312(3) : 425-38 或 Maliga, P(2003) 质体转 化技术商业化进展 (Progress towards commercialization of plastid transformation technology).Trends Biotechnol.21, 20-28。进一步生物技术进展最近已经以无标记质 体转化体的形式作了报道, 所述无标记质体转化体可以通过瞬时共整合的标记基因产生 (Klaus 等, 2004, Nature Biotechnology 22(2), 225-229)。
遗传修饰的植物细胞能够通过技术人员熟悉的所有方法再生。 合适的方法可见于 上述 S.D.Kung 和 R.Wu、 Potrykus 或者
和 Willmitzer 的出版物。通常在转化以后, 选出存在一个或多个标记的植物细胞或细胞群, 所述标记由与 目的基因共转移的植物可表达基因编码, 继之将转化的材料再生成整个植物。为选择转化 的植物, 通常将在转化过程中获得的植物材料置于选择性条件下, 从而可将转化的植物与 非转化植物区分开来。例如, 可以种植以上述方式获得的种子, 并在最初的生长期之后, 通 过喷雾对其进行合适的选择。另一可能方案是使用合适的选择剂, 将种子 ( 适当时在灭菌 之后 ) 种在琼脂板上, 从而仅转化的种子能够长成植物。备选地, 针对转化的植物筛选可选 择标记 ( 如上文所述标记 ) 的存在。 DNA 转移和再生之后, 还可评价推定转化的植物, 例如用 Southern 分析, 评价目的 基因的存在、 拷贝数和 / 或基因组构造。备选地或额外地, 可用 Northern 和 / 或 Western 分析监测新引入的 DNA 的表达水平, 这两种技术都是本领域普通技术人员所众所周知的。
产生的转化植物可以通过多种方式繁殖, 如通过克隆繁殖或经典的育种技术。例 如, 第一代 ( 或 T1) 转化的植物可自交, 选择纯合的第二代 ( 或 T2) 转化体, 而 T2 植物可进 一步通过经典育种技术繁殖。产生的转化生物体可以有多种形式。例如, 它们可以是转化 细胞和非转化细胞的嵌合体 ; 克隆的转化体 ( 例如所有细胞经转化含有表达盒 ) ; 转化和非 转化组织的嫁接体 ( 例如在植物中, 转化的根状茎嫁接到非转化的接穗上 )。
T-DNA 激活标签化
T-DNA 激活标签化 (Hayashi 等 Science(1992)1350-1353) 涉及在目的基因的基因 组区域内或基因编码区上游或下游 10kb 处以如此结构插入 T-DNA( 通常含有启动子, 也可 以是翻译增强子或内含子 ), 使得启动子指导被靶定基因的表达。通常, 由靶定基因的天然 启动子对所述靶定基因表达的调节作用遭到破坏并且该基因处在新引入的启动子控制下。
启动子一般嵌入在 T-DNA 中。这种 T-DNA 随机地插入植物基因组, 例如通过农杆菌感染, 并 导致在所插入 T-DNA 附近的基因的经修饰的表达。因靠近所引入启动子的基因的经修饰的 表达, 产生的转基因植物表现显性表型。
TILLING
术语 “TILLING” 是 “基因组内定向诱导的局部损伤” 的缩写, 指用于产生和 / 或鉴 定核酸的诱变技术, 其中所述的核酸编码具有修饰的表达和 / 或活性的蛋白质。 TILLING 还 允许选择携带此类突变变体的植物。 这些突变变体可以显示在强度方面或在位置方面或在时间方面经修饰的表达 ( 例如若突变影响启动子 )。这些突变变体可以显示比由处于其天 然形式的基因所显出活性更高的活性。TILLING 将高密度诱变与高通量筛选方法组合。一 般在 TILLING 中遵循的步骤是 : (a)EMS 诱变 (Redei GP 和 Koncz C(1992) 在 Methods in Arabidopsis Research, Koncz C, Chua NH, Schell J 编辑, Singapore, World Scientific Publishing Co, 第 16-82 页 ; Feldmann 等, (1994) 在 Meyerowitz EM, Somerville CR 编 辑, Arabidopsis.Cold Spring Harb 或 Laboratory Press, Cold Spring Harbor, NY, 第 137-172 页 ; Lightner J 和 Caspar T(1998) 在 J Martinez-Zapater, J Salinas 编 者, Methods on Molecular Biology 第 82 卷 .Humana Press, Totowa, NJ, 第 91-104 页 ) ; (b) 个体的 DNA 制备和汇集 ; (c)PCR 扩增目的区 ; (d) 变性和退火以允许形成异源双链体 ; (e) DHPLC, 其中将异源双链体在汇集物中的存在检测为色谱图之一额外峰 ; (f) 鉴定突变个 体; 和 (g) 对突变 PCR 产物测序。用于 TILLING 的方法是本领域众所周知的 (McCallum 等, (2000)Nat Biotechnol 18 : 455-457 ; 综 述 见 Stemple(2004)Nat Rev Genet 5(2) : 145-50)。
同源重组
同源重组允许选择的核酸在基因组中于确定的所选择位置内引入。 同源重组是在 生物科学中常规地用于低等生物如酵母或苔藓剑叶藓 (Physcomitrella) 的标准技术。用 于在植物中开展同源重组的方法已经不仅对模式植物 (Offringa 等, (1990)EMBO J 9(10) : 3077-84) 而且对作物植物例如稻 (Terada 等, (2002)Nat Biotech 20(10) : 1030-4 ; Iida 和 Terada(2004)Curr Opin Biotech 15(2) : 132-8) 进行了描述, 并且不论何种目标生物, 都存在一般可用的方法 (Miller 等, Nature Biotechnol.25, 778-785, 2007)。
产量相关性状
产量相关性状包括下述一项或多项 : 早期开花时间 ; 产量、 生物量、 种子产量、 早 期萌发势、 绿度指数、 增加的生长速率、 改进的农学性状 ( 如改进的用水效率 (WUE)、 氮利用 效率 (NUE) 等 )。
产量
术语 “产量” 通常意指经济价值的可测量结果, 一般与指定作物、 与面积并与时间 段有关。单个植物部分基于它们的数目、 大小和 / 或重量而直接对产量有贡献, 或实际产量 是对于某作物而言一年内每平方米的产量, 这通过总产量 ( 包括收获的和评价的产量 ) 除 以种植的平方米数而确定。在本文中可互换使用的术语植物的 “产量” 和 “植物产量” 可以 与该植物的营养体生物量如根和 / 或苗生物量、 繁殖器官和 / 或繁殖体例如种子有关。
以玉米为例, 产量增加可以表现为下列一种或多种指标 : 每平方米中已建立植物 数的增加、 每株植物穗数的增加、 行数、 每行粒数、 粒重、 千粒重、 玉米穗长度 / 直径的增加、 种子饱满率的增加 ( 其中种子饱满率是饱满种子数除以种子总数并乘以 100) 及其它。以 稻为例, 产量增加本身可以表现为下列一种或多种指标的增加 : 每平方米植物数、 每株植物 穗 (panicle) 数、 穗长度、 每穗小穗数、 每穗花 ( 小花 ) 数、 种子饱满率的增加 ( 其中种子饱 满率是饱满种子数除以种子总数并乘以 100)、 千粒重的增加及其它。 在稻中, 浸没耐受性也 可以产生增加的产量。
早期开花时间
如本文中所用, 具有 “早期开花时间”的植物是比对照植物更早开始开花的植物。因此该术语指显示出更早开始开花的植物。植物的开花时间可以通过计数播种和第 一个花序出现之间的天数 (“开花时间” ) 评价。植物的 “开花时间” 可以例如使用如在 WO 2007/093444 中所述的方法测定。
早期萌发势
“早期萌发势” 指活跃、 健康、 良好平衡的生长 ( 特别是在植物生长早期期间 ), 并 可以因植物适合度增加而产生, 其原因在于例如植物更好地适应其环境 ( 即优化能源的使 用和苗与根之间的分配 )。具有早期萌发势的植物也显示增加的幼苗存活和更好的作物建 立, 这往往导致高度均匀的田块 ( 作物整齐地生长, 即大多数植物在基本上相同的时间上 达到发育的各阶段 ) 和往往更好及更高的产量。因而, 早期萌发势可以通过测量多种因素 如千粒重、 萌发百分数、 出苗百分数、 幼苗生长、 幼苗高度、 根长度、 根及苗生物量和众多其 它因素而确定。
增加的生长速率
增加的生长速率可以对于植物的一个或多个部分 ( 包括种子 ) 是特异性的, 或可 以基本上遍及整株植物。具有增加的生长速率的植物可以具备较短的生活周期。植物的生 活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种 子的阶段所需要的时间。这个生活周期可以受下列因素影响, 如发芽的速度、 早期萌发势、 生长速率、 绿度指数、 开花时间和种子成熟速度。 生长速率的增加可以在植物生活周期之一 或多个阶段上或在基本上整个植物生活周期期间发生。 在植物生活周期中的早期期间增加 的生长速率可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期, 允许植物 较晚播种和 / 或较早收获, 否则这将不可能 ( 相似的作用可以用较早的开花时间获得 )。 若 生长速率充分地增加, 可以允许再播种相同植物物种的种子 ( 例如播种并收获稻植物, 随 后播种并收获其它稻植物, 全部均在一个常规生长时段内 )。类似地, 若生长速率足够地增 加, 可以允许再播种不同植物物种的种子 ( 例如播种并收获玉米植物, 随后例如播种并任 选收获大豆、 马铃薯或任何其它合适植物 )。 从相同的根茎中收获额外次数在一些作物植物 的情况中也是可能的。改变植物的收获周期可以导致每平方米的年生物量产量的增加 ( 因 任何特定植物可以生长并收获的次数 ( 如在一年中 ) 增加 )。生长速率的增加也可以允许 比其野生型对应物而言在更广泛的地理区域内培育转基因植物, 因为对培育作物的区域限 制往往由栽种时节 ( 早季 ) 或在收获时期 ( 晚季 ) 的不利环境条件所决定。若缩短收获周 期, 则可以避开这类不利条件。 生长速率可以通过从生长曲线中得到多种参数而确定, 此类 参数可以是 : T-Mid( 植物达到其 50%最大尺寸所花费的时间 ) 和 T-90( 植物达到其 90% 最大尺寸所花费的时间 ), 等等。
胁迫抗性
与对照植物相比, 无论植物处于非胁迫条件下还是植物暴露于多种胁迫下, 都发 生产量和 / 或生长速率的增加。植物一般通过生长得更慢而对暴露于胁迫作出应答。在 严重胁迫条件下, 植物甚至可以完全停止生长。另一方面, 轻微胁迫在本文中定义为植物 暴露于其的任何胁迫, 其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。 与非胁迫条件下的对照植物相比, 轻微胁迫在本发明意义中导致受胁迫植物生长降低小于 40%、 35%、 30%或 25%, 更优选小于 20%或 15%。由于农业实践 ( 灌溉、 施肥、 杀虫剂处 理 ) 上的进步, 在栽培作物植物中并不经常遇到严重胁迫。因此, 由轻微胁迫诱导的受损生长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和 / 或非生物性 ( 环 境 ) 胁迫。非生物胁迫可以因干旱或水涝、 厌氧胁迫、 盐胁迫、 化学毒性、 氧化胁迫和热、 寒 冷或冰冻温度所致。非生物胁迫可以是由水胁迫 ( 尤其因为干旱 )、 盐胁迫、 氧化胁迫或离 子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、 病毒、 真菌、 线虫和昆虫引起的 那些胁迫。
尤其, 本发明的方法可以在非胁迫条件下或在轻微干旱条件下实施以产生相对于 对照植物而具有增加的产量的植物。如在 Wang 等 (Planta(2003)218 : 1-14) 中报道, 非生 物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、 生理学变化、 生物化学变 化和分子变化。 已知干旱、 盐度、 极端温度和氧化胁迫是相互联系的并可以通过相似机制而 诱导生长损害及细胞损害。Rabbani 等 (Plant Physiol(2003)133 : 1755-1767) 描述了干 旱胁迫与高盐度胁迫间极高程度的 “交叉 (cross talk)” 。例如, 干旱和 / 或盐化作用主要 表现为渗透胁迫, 导致细胞内稳态和离子分布的破坏。 经常伴随高温或低温、 盐度或干旱胁 迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此, 这些多样的环境胁迫常常激活 相似的细胞信号途径和细胞应答, 如产生胁迫蛋白质、 上调抗氧化物质、 积累相容性溶质和 生长抑制。如本文中所用的术语 “非胁迫” 条件是允许植物最佳生长的环境条件。本领域 技术人员清楚对于给定地点的正常土壤条件和气候条件。最佳生长下生长的植物 ( 在非 胁迫条件下生长 ) 一般出产以递增优选顺序至少 97%、 95%、 92%、 90%、 87%、 85%、 83%、 80%、 77%或 75%的给定环境下这样植物的平均生产。平均生产可以收获和 / 或季节为基 础进行计算。本领域技术人员清楚作物的平均产量生产。
营养缺乏可以由营养物 ( 例如氮、 磷和其它含磷化合物、 钾、 钙、 镁、 锰、 铁或者硼 以及其它 ) 缺少引起。
术语盐胁迫不限于常见盐 (NaCl), 可以为以下一种或多种 : NaCl、 KCl、 LiCl、 MgCl2、 CaCl2 等。
增加 / 改进 / 增强
术语 “增加” 、 “改进” 或 “增强” 是可互换的并且应当在本申请含义上指与如本文中 定义的对照植物相比至少 3%、 4%、 5%、 6%、 7%、 8%、 9%或 10%、 优选至少 15%或 20%、 更优选 25%、 30%、 35%或 40%更多的产量和 / 或生长。
种子产量
增加的种子产量本身可以表现为下列一种或多种指标 :
a) 种子生物量 ( 种子总重量 ) 增加, 这可以基于单粒种子和 / 或每株植物和 / 或 每平方米 ;
b) 每株植物增加的花数 ;
c) 增加的种子数和 / 或增加的饱满种子数 ;
d) 增加的种子饱满率 ( 其表述为饱满种子数除以种子总数的比率 ) ;
e) 增加的收获指数, 其表述为可收获部分 ( 如种子 ) 产量除以总生物量 ( 即植物 地上部分的生物量 ) 的比率 ; 和
f) 增加的千粒重 (TKW), 其从计数的饱满种子数及其总重量外推而来。
增加的 TKW 可以因增加的种子大小和 / 或种子重量所致, 并且也可以因胚和 / 或 胚乳尺寸的增加所致。种子产量的增加也可以表现为种子大小和 / 或种子体积的增加。此外, 种子产量 的增加本身也可以表现为种子面积和 / 或种子长度和 / 或种子宽度和 / 或种子周长的增 加。
绿度指数
如本文所用的 “绿度指数” 根据植物的数字图像计算。对于图像中属于植物目标 的每一个像素, 计算绿色值相对于红色值 ( 在用于编码颜色的 RGB 模型中 ) 之比。绿度指 数表达为绿红比超过给定阈值的像素百分比。 在正常生长条件下、 在盐胁迫生长条件下、 及 在养分利用度下降的生长条件下, 测量开花前末次成像时的植物绿度指数。 相反, 在干旱胁 迫生长条件下, 测量干旱后首次成像时的植物绿度指数。
生物量
如本文中所用的术语 “生物量” 意图指植物的总重量。在定义生物量的情况下, 在植物的一个或多个部分的生物量之间可以进行区分, 所述植物的一个或多个部分可以包 括:
- 地上 ( 可收获 ) 部分例如但不限于苗生物量、 种子生物量、 叶生物量等和 / 或
- 地下 ( 可收获 ) 部分, 例如但不限于根生物量等, 和/或
- 营养生物量例如根生物量、 苗生物量等, 和/或
- 繁殖器官, 和/或
- 繁殖体例如种子。
标记辅助的育种
这种育种程序有时需要通过使用例如 EMS 诱变法对植物作诱变处理而引入等位 基因变异 ; 备选地, 该程序可以从非故意引起的所谓 “自然” 起源的等位变体集合开始。随 后进行等位变体的鉴定, 例如通过 PCR 法。此后是用于选择所讨论序列的优选等位变体且 其导致增加的产量的步骤。 一般通过监测含有所讨论序列的不同等位变体的植物的生长性 能而实施选择。可以在温室中或田间监测生长性能。其它任选步骤包括将鉴定到有优选等 位变体的植物与另一种植物杂交。这可以用来例如产生目标表型特征的组合。
探针在 ( 遗传作图 ) 中的用途
编码目的蛋白质的核酸用于遗传和物理作图, 该基因仅需要具有至少 15 个核苷 酸长度的核酸序列。 这些核酸可以用作限制性片段长度多态性 (RFLP) 标记。 限制性消化的 植物基因组 DNA 的 Southern 印迹 (Sambrook J, Fritsch EF 和 Maniatis T(1989)Molecular Cloning, A Laboratory Manual) 可以用编码目的蛋白质的核酸序列来探测。产生的条带 图谱随后可以使用计算机程序如 MapMaker(Lander 等 (1987)Genomics 1 : 174-181) 进行遗 传分析以构建遗传图。此外, 该核酸可以用来探测含有经限制性内切核酸酶处理的一组个 体的基因组 DNA 的 Southern 印迹, 其中所述的一组个体代表具有确定的遗传杂交的亲代和 后代。DNA 多态性的分离被标出并用来计算编码目的蛋白质的核酸在使用这个群体先前所 获得的遗传图中的位置 (Botstein 等 (1980)Am.J.Hum.Genet.32 : 314-331)。
在 Bernatzky 和 Tanksley(1986)Plant Mol.Biol.Reporter 4 : 37-41 中描述了植 物基因衍生的探针的产生和其在遗传作图中的用途。 众多出版物描述了使用以上所提及的 方法学或其改进方法对特定 cDNA 克隆的遗传作图。例如, F2 互交群、 回交群、 随机交配群、 近等基因系和其它个体群体可以用于作图。此类方法学是本领域技术人员众所周知的。所述核酸序列探针也可以用于物理作图 ( 即序列在物理图上的排列 ; 见 Hoheisel 等在 : Non-mammalian Genomic Analyasis : A Practical Guide, Academic press 1996, 第 319-346 页及其中引用的参考文献 )。
在 另 一 实 施 方 案 中, 核 酸 探 针 可 以 在 直 接 荧 光 原 位 杂 交 (FISH) 作 图 (Trask(1991)Trends Genet.7 : 149-154) 中使用。尽管当前的 FISH 作图法支持使用大型 克隆 ( 几个 kb 至几百个 kb ; 见 Laan 等 (1995)Genome Res.5 : 13-20), 然而灵敏度的改进可 以允许使用更短探针进行 FISH 作图。
用于遗传作图及物理作图的多种基于核酸序列扩增的方法可以使用所述核酸序 列而实施。例子包括等位基因特异的扩增 (Kazazian(1989)J.Lab.Clin.Med 11 : 95-96)、 PCR 扩增片段的多态性 (CAPS ; Sheffield 等 (1993)Genomics 16 : 325-332)、 等位基因特异 性连接 (Landegren 等 (1988)Science241 : 1077-1080)、 核苷酸延伸反应 (Sokolov(1990) Nucleic Acid Res.18 : 3671)、 放射杂交作图 (Walter 等 (1997)Nat.Genet.7 : 22-28) 和 Happy 作图 (Dear 和 Cook(1989)Nucleic Acid Res.17 : 6795-6807)。对于这些方法, 使用 核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。 此类引物的设计 是本领域技术人员众所周知的。在使用基于 PCR 遗传作图的方法中, 可能必须鉴定在对应 于当前核酸序列的整个区域内作图亲代间的 DNA 序列差异。然而, 这对于作图法而言通常 不是必需的。
植物
如本文中所用的术语 “植物” 包括整株植物、 植物的祖先及后代和植物部分, 包括 种子、 苗、 茎、 叶、 根 ( 包括块茎 )、 花和组织及器官, 其中每种所提及对象包含目的基因 / 核 酸。术语 “植物” 也包括植物细胞、 悬浮培养物、 愈伤组织、 胚、 分生组织区、 配子体、 孢子体、 花粉和小孢子, 同样每种提及的对象包含目的基因 / 核酸。
特别用于本发明方法中的植物包括属于植物界 (Viridiplantae) 超家族的全部 植物, 尤其单子叶植物和双子叶植物, 包括选自以下的饲用或饲料豆类、 观赏植物、 粮食作 物、 树或灌木 : 槭树属物种 (Acer spp.)、 猕猴桃属物种 (Actinidia spp.)、 秋葵属物种 (Abelmoschus spp.)、 剑麻 (Agave sisalana)、 冰草属物种 (Agropyron spp.)、 匍匐剪股 颖 (Agrostis stolonifera)、 葱属物种 (Allium spp.)、 苋属物种 (Amaranthus spp.)、 欧 洲海滨草 (Ammophila arenaria)、 凤梨 (Ananas comosus)、 番荔枝属物种 (Annona spp.)、 芹菜 (Apium graveolens)、 落花生属物种 (Arachis spp.)、 木波罗属物种 (Artocarpus spp.)、 石刁柏 (Asparagus officinalis)、 燕麦属物种 (Avena spp.)( 例如燕麦 (Avena sativa)、 野燕麦 (Avena fatua)、 比赞燕麦 (Avena byzantina)、 Avena fatua var.sativa、 杂种燕麦 (Avena hybrida))、 阳桃 (Averrhoa carambola)、 箣竹属物种 (Bambusa sp.)、 冬 瓜 (Benincasa hispida)、 巴西栗 (Bertholletia excelsea)、 甜菜 (Beta vulgaris)、 芸 苔属物种 (Brassica spp.)( 例如欧洲油菜 (Brassica napus)、 芜青物种 (Brassica rapa ssp.)[ 芸苔 (canola)、 油菜 (oilseed rape)、 蔓青 (turnip rape)])、 Cadaba farinosa、 茶 (Camellia sinensis)、 美 人 蕉 (Canna indica)、 大 麻 (Cannabis sativa)、 辣椒属物 种 (Capsicum spp.)、 天 麻 苔 草 (Carex elata)、 番 木 瓜 (Carica papaya)、 大果假虎刺 (Carissa macrocarpa)、 山核桃属物种 (Carya spp.)、 红花 (Carthamus tinctorius)、 栗 属物种 (Castanea spp.)、 美洲木棉 (Ceiba pentandra)、 苦苣 (Cichorium endivia)、 樟属物种 (Cinnamomum spp.)、 西瓜 (Citrullus lanatus)、 柑桔属物种 (Citrus spp.)、 椰子属 物种 (Cocos spp.)、 咖啡属物种 (Coffea spp.)、 芋头 (Colocasia esculenta)、 非洲梧桐 属物种 (Cola spp.)、 黄麻属物种 (Corchorus sp.)、 芫荽 (Coriandrum sativum)、 榛属物 种 (Corylus spp.)、 山楂属物种 (Crataegus spp.)、 番红花 (Crocus sativus)、 南瓜属物 种 (Cucurbita spp.)、 香瓜属物种 (Cucumis spp.)、 菜蓟属物种 (Cynara spp.)、 胡萝卜 (Daucus carota)、 山马蝗属物种 (Desmodium spp.)、 龙眼 (Dimocarpus longan)、 薯蓣属 物种 (Dioscorea spp.)、 柿树属物种 (Diospyros spp.)、 稗属物种 (Echinochloa spp.)、 油棕属 (Elaeis)( 例如油棕 (Elaeis guineensis)、 美洲油棕 (Elaeis oleifera))、 穇子 (Eleusine coracana)、 Eragrostis tef、 蔗茅属物种 (Erianthus sp.)、 枇杷 (Eriobotrya japonica)、 桉 属 物 种 (Eucalyptus sp.)、 红 仔 果 (Eugenia uniflora)、 荞麦属物种 (Fagopyrum spp.)、 水青冈属物种 (Fagus spp.)、 苇状羊茅 (Festuca arundinacea)、 无 花果 (Ficus carica)、 金桔属物种 (Fortunella spp.)、 草莓属物种 (Fragaria spp.)、 银 杏 (Ginkgo biloba)、 大豆属物种 (Glycine spp.)( 例如大豆 (Glycine max)、 大豆 (Soja hispida) 或大豆 (Soja max))、 陆地棉 (Gossypium hirstum)、 向日葵属物种 (Helianthus spp.)( 例 如 向 日 葵 (Helianthus annuus))、 长 管 萱 草 (Hemerocallis fulva)、 木槿属 物 种 (Hibiscus spp.)、 大 麦 属 物 种 (Hordeum spp.)( 例 如 大 麦 (Hordeum vulgare))、 甘 薯 (Ipomoea batatas)、 核 桃 属 物 种 (Juglans spp.)、 莴 苣 (Lactuca sativa)、 山黧 豆 属 物 种 (Lathyrus spp.)、 兵 豆 (Lens culinaris)、 亚 麻 (Linum usitatissimum)、 荔 枝 (Litchi chinensis)、 百脉根属物种 (Lotus spp.)、 棱角丝瓜 (Luffa acutangula)、 羽扇豆属物种 (Lupinus spp.)、 Luzula sylvatica、 番茄属物种 (Lycopersicon spp.) ( 例 如 番 茄 (Lycopersicon esculentum)、 Lycopersicon lycopersicum、 Lycopersicon pyriforme)、 硬皮豆属物种 (Macrotyloma spp.)、 苹果属物种 (Malus spp.)、 凹缘金虎尾 (Malpighia emarginata)、 牛油果 (Mammea americana)、 芒果 (Mangifera indica)、 木薯 属物种 (Manihot spp.)、 人心果 (Manilkara zapota)、 紫苜蓿 (Medicago sativa)、 草木 樨属物种 (Melilotus spp.)、 薄荷属物种 (Mentha spp.)、 芒 (Miscanthus sinensis)、 苦 瓜属物种 (Momordica spp.)、 黑桑 (Morus nigra)、 芭蕉属物种 (Musa spp.)、 烟草属物种 (Nicotiana spp.)、 木犀榄属物种 (Olea spp.)、 仙人掌属物种 (Opuntia spp.)、 鸟足豆属 物种 (Ornithopus spp.)、 稻属物种 (Oryza spp.)( 例如稻、 阔叶稻 (Oryza latifolia))、 稷 (Panicum miliaceum)、 柳枝稷 (Panicum virgatum)、 鸡蛋果 (Passiflora edulis)、 欧 防风 (Pastinaca sativa)、 狼尾草属物种 (Pennisetum sp.)、 鳄梨属物种 (Persea spp.)、 芹菜 (Petroselinum crispum)、 虉草 (Phalaris arundinacea)、 菜豆属物种 (Phaseolus spp.)、 猫尾草 (Phleum pratense)、 刺葵属物种 (Phoenix spp.)、 南方芦苇 (Phragmites australis)、 酸浆属物种 (Physalis spp.)、 松属物种 (Pinus spp.)、 阿月浑子 (Pistacia vera)、 豌豆属物种 (Pisum spp.)、 早熟禾属物种 (Poa spp.)、 杨属物种 (Populus spp.)、 牧 豆草属物种 (Prosopis spp.)、 李属物种 (Prunus spp.)、 番石榴属物种 (Psidium spp.)、 石 榴 (Punica granatum)、 西 洋 梨 (Pyrus communis)、 栎 属 物 种 (Quercus spp.)、 萝卜 (Raphanus sativus)、 波叶大黄 (Rheum rhabarbarum)、 茶藨子属物种 (Ribes spp.)、 蓖 麻 (Ricinus communis)、 悬钩子属物种 (Rubus spp.)、 甘蔗属物种 (Saccharum spp.)、 柳 属物种 (Salix sp.)、 接骨木属物种 (Sambucus spp.)、 黑麦 (Secale cereale)、 胡麻属物种 (Sesamum spp.)、 白芥属物种 (Sinapis sp.)、 茄属物种 (Solanum spp.)( 例如马铃薯 (Solanum tuberosum)、 红茄 (Solanum integrifolium) 或番茄 (Solanum lycopersicum))、 高粱 (Sorghum bicolor)、 菠菜属物种 (Spinacia spp.)、 蒲桃属物种 (Syzygium spp.)、 万寿菊属物种 (Tagetes spp.)、 酸豆 (Tamarindus indica)、 可可树 (Theobroma cacao)、 车 轴 草 属 物 种 (Trifolium spp.)、 Tripsacum dactyloides、 黑 小 麦 物 种 (Triticale sp.)、 Triticosecale rimpaui、 小麦属物种 (Triticum spp.)( 例如普通小麦 (Triticum aestivum)、 硬 粒 小 麦 (Triticum durum)、 圆 柱 小 麦 (Triticum turgidum)、 Triticum hybernum、马 卡 小 麦 (Triticum macha)、普 通 小 麦 (Triticum sativum)、 Triticum monococcum 或普通小麦 (Triticum vulgare))、 小金莲花 (Tropaeolum minus)、 金莲花 (Tropaeolum majus)、 越桔属物种 (Vaccinium spp.)、 野碗豆属物种 (Vicia spp.)、 豇豆属 物种 (Vigna spp.)、 香堇 (Viola odorata)、 葡萄属物种 (Vitis spp.)、 玉蜀黍 (Zea mays)、 Zizania palustris、 枣属物种 (Ziziphus spp.) 等等。
对照植物
选择合适的对照植物是实验设置的常规部分并且可以包括对应的野生型植物或 无目的基因的对应植物。 对照植物一般是与待评价植物属于相同的植物物种或甚至是相同 的品种。对照植物也可以是待评价植物的失效合子。失效合子是通过分离丢失转基因的个 体。如本文中所用的 “对照植物” 不仅指整株植物, 还指植物部分, 包括种子及种子部分。
发明详述
意想不到的是, 现在发现调节编码 eRF1 多肽之核酸在植物中的表达产生相对于 对照植物而言具有增强的产量相关性状的植物。根据第一个实施方案, 本发明提供了在植 物中相对于对照植物而言增强产量相关性状的方法, 包括调节植物中编码 eRF1 多肽之核 酸的表达, 和任选地选择具有增强的产量相关性状的植物。
本发明还提供了迄今未知的编码 eRF1 的核酸, 以及 eRF1 多肽。
根据本发明另外的实施方案, 从而提供了分离的核酸分子, 选自 :
(i) 由以下核酸序列 : 具有 SEQ ID NO : 15 的 G.max_GM06MC33657_sm55b10@32878 ; 具有 SEQ ID NO : 17 的 H.vulgare_c64960768hv270303@ 的任一表示的核酸 ;
(ii) 由所述序列 : 具有 SEQ ID NO : 15 的 G.max_GM06MC33657_sm55b10@32878 ; 具 有 SEQ ID NO : 17 的 H.vulgare_c64960768hv270303@2598 表示的核酸的互补序列 ;
(iii) 编码由具有 SEQ ID NO : 16 的 G.max_GM06MC33657_sm55b10@32878 ; 具有 SEQ ID NO : 18 的 H.vulgare_c64960768hv270303@ 的任一表示的多肽的核酸, 优选地, 由于遗传 密码的简并性, 所述分离的核酸可以衍生自由 SEQ ID NO : 16 和 18 的任一表示的多肽序列, 并且还优选地赋予相对于对照植物而言增强的产量相关性状。
(iv) 核酸, 所述核酸以递增的优先顺序与表 A1 的任一核酸序列具有至少 30%、 31 %、 32 %、 33 %、 34 %、 35 %、 36 %、 37 %、 38 %、 39 %、 40 %、 41 %、 42 %、 43 %、 44 %、 45 %、 46 %、 47 %、 48 %、 49 %、 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%的序列同一性, 并且另外优选地赋予 相对于对照植物而言增强的产量相关性状 ;(v) 核酸分子, 所述核酸分子在严格杂交条件下与 (i) 至 (iv) 项的核酸分子杂交, 并优选地赋予相对于对照植物而言增强的产量相关性状。
(vi) 编码 eRF1 多肽的核酸, 所述 eRF1 多肽以递增的优先顺序与由 SEQ ID NO : 16 和 18 的任一表示的氨基酸序列和表 A1 中的任一其它氨基酸序列具有至少 50%、 51%、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92 %、 93 %、 94 %、 95 %、 96 %、 97%、 98%或 99%的序列同一性, 并且优选地赋予相对于对照植物而言增强的产量相关性 状。
根据本发明另外的实施方案, 从而还提供了分离的多肽, 选自 :
(i) 由 SEQ ID NO : 16 和 18 的任一表示的氨基酸序列 ;
(ii) 氨基酸序列, 所述氨基酸序列以递增的优先顺序与由 SEQ ID NO : 16 和 18 的 任一表示的氨基酸序列和表 A1 中的任一其它氨基酸序列具有至少 50%、 51%、 52%、 53%、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92 %、 93 %、 94 %、 95 %、 96 %、 97 %、 98 %或 99%的序列同一性, 并且优选地赋予相对于对照植物而言增强的产量相关性状。
(iii) 上述 (i) 或 (ii) 项中给出的任一氨基酸序列的衍生物。
此外, 意想不到的是, 现在发现调节编码 SCAMP 样多肽之核酸在植物中的表达产 生相对于对照植物而言具有增强的产量相关性状的植物。根据第一个实施方案, 本发明提 供了在植物中相对于对照植物而言增强产量相关性状的方法, 包括调节植物中编码 SCAMP 样多肽之核酸的表达, 和任选地选择具有增强的产量相关性状的植物。
本发明还提供了迄今未知的编码 SCAMP 样的核酸, 以及多肽。
根据本发明另外的实施方案, 从而提供了分离的核酸分子, 选自 : (i) 由 SEQ ID NO : 100、 102、 104、 106、 180、 182、 184、 186、 188、 190 和 192 的任一表示的核酸 ;
(ii) 由 (i) 项 SEQ ID NO : 100、 102、 104、 106、 108、 182、 184、 186、 188、 190 和 192 的 任一表示的核酸的互补序列 ;
(iii) 编码由 SEQ ID NO : 101、 103、 105、 107、 181、 183、 185、 187、 189、 191 和 193 的 任一表示的多肽的核酸 ; 优选地, 由于遗传密码的简并性, 所述分离的核酸可以衍生自由 SEQ ID NO : 101、 103、 105、 107、 181、 183、 185、 187、 189、 191 和 193 的任一表示的多肽序列, 并且另外优选地赋予相对于对照植物而言增强的产量相关性状。
(iv) 核酸, 所述核酸以递增的优先顺序与表 A2 的任一核酸序列具有至少 30%、 31 %、 32 %、 33 %、 34 %、 35 %、 36 %、 37 %、 38 %、 39 %、 40 %、 41 %、 42 %、 43 %、 44 %、 45 %、 46 %、 47 %、 48 %、 49 %、 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%的序列同一性, 并且另外优选地赋予 相对于对照植物而言增强的产量相关性状 ;
(v) 核酸分子, 所述核酸分子在严格杂交条件下与 (i) 至 (iv) 项的核酸分子杂交,并优选地赋予相对于对照植物而言增强的产量相关性状。
(vi) 编码多肽的核酸, 所述多肽以递增的优先顺序与由 SEQ ID NO : 101、 103、 105、 107、 181、 183、 185、 187、 189、 191 和 193 的任一表示的氨基酸序列和表 A2 中的任一其它氨 基酸序列具有至少 50%、 51%、 52%、 53%、 54%、 55%、 56%、 57%、 58%、 59%、 60%、 61%、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%的序列同一性, 并且优选地赋予相对于对照 植物而言增强的产量相关性状。
根据本发明另外的实施方案, 从而还提供了分离的多肽, 选自 :
(i) 由 SEQ ID NO : 101、 103、 105、 107、 181、 183、 185、 187、 189、 191 和 193 的任一表 示的氨基酸序列 ;
(ii) 氨基酸序列, 所述氨基酸序列以递增的优先顺序与由 SEQ ID NO : 101、 103、 105、 107、 181、 183、 185、 187、 189、 191 和 193 的任一表示的氨基酸序列和表 A2 中的任一其 它氨基酸序列具有至少 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%的序列同一性, 并且优选地赋予相对 于对照植物而言增强的产量相关性状。
(iii) 上述 (i) 或 (ii) 项中给出的任一氨基酸序列的衍生物。
此外, 意想不到的是, 现在发现调节编码肌原纤蛋白多肽之核酸在植物质体中的 表达产生相对于对照植物而言具有增强的产量相关性状的植物。根据第一个实施方案, 本 发明提供了在植物中相对于对照植物而言增强产量相关性状的方法, 包括调节植物质体中 编码肌原纤蛋白多肽之核酸的表达, 和任选地选择具有增强的产量相关性状的植物。
根据本发明另外的实施方案, 从而提供了分离的核酸分子, 选自 :
(i) 由 以 下 核 酸 序 列 的 任 一 表 示 的 核 酸 : 具 有 SEQ ID NO : 206 的 B.napus_BN06MC20042_46499279@19975 ; 具 有 SEQ ID NO : 220 的 G.max_GM06MC 19234_59694709@18873 ;
(ii) 由 所 述 序 列 : 具 有 SEQ ID NO : 206 的 B.napus_ BN06MC20042_46499279@19975 ; 具 有 SEQ ID NO : 220 的 G.max_ GM06MC19234_59694709@18873 表示的核酸的互补序列 ;
(iii) 编码由 SEQ ID NO : 207 ; SEQ ID NO : 221 的任一表示的多肽的核酸, 优选地, 由于遗传密码的简并性, 所述分离的核酸可以衍生自由 SEQID NO : 207 和 221 的任一表示的 多肽序列, 并且还优选地赋予相对于对照植物而言增强的产量相关性状。
(iv) 核酸, 所述核酸以递增的优先顺序与表 A3 的任一核酸序列具有至少 30%、 31 %、 32 %、 33 %、 34 %、 35 %、 36 %、 37 %、 38 %、 39 %、 40 %、 41 %、 42 %、 43 %、 44 %、 45 %、 46 %、 47 %、 48 %、 49 %、 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%的序列同一性, 并且还优选地赋予相对于对照植物而言增强的产量相关性状 ;
(v) 核酸分子, 所述核酸分子在严格杂交条件下与 (i) 至 (iv) 项的核酸分子杂交, 并优选地赋予相对于对照植物而言增强的产量相关性状。
(vi) 编码肌原纤蛋白多肽的核酸, 所述肌原纤蛋白多肽以递增的优先顺序与由 SEQ ID NO : 207 和 221 的任一表示的氨基酸序列和表 A3 中的任一其它氨基酸序列具有至 少 50%、 51%、 52%、 53%、 54%、 55%、 56%、 57%、 58%、 59%、 60%、 61%、 62%、 63%、 64%、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92 %、 93 %、 94 %、 95%、 96%、 97%、 98%或 99%的序列同一性, 并且优选地赋予相对于对照植物而言增强的 产量相关性状。
根据本发明另外的实施方案, 从而还提供了分离的多肽分子, 选自 :
(i) 由 SEQ ID NO : 207 和 221 的任一表示的氨基酸序列 ;
(ii) 氨基酸序列, 所述氨基酸序列以递增的优先顺序与由 SEQ ID NO : 207 和 221 的任一表示的氨基酸序列和表 A3 中的任一其它氨基酸序列具有至少 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92 %、 93 %、 94 %、 95 %、 96 %、 97 %、 98%或 99%的序列同一性, 并且优选地赋予相对于对照植物而言增强的产量相关性状。
(iii) 上述 (i) 或 (ii) 项中给出的任一氨基酸序列的衍生物。
此外, 意想不到的是, 现在发现调节编码 PLATZ 多肽之核酸在植物中的表达产生 相对于对照植物而言具有增强的产量相关性状的植物。根据第一个实施方案, 本发明提供 了在植物中相对于对照植物而言增强产量相关性状的方法, 包括调节植物中编码 PLATZ 多 肽之核酸的表达, 和任选地选择具有增强的产量相关性状的植物。
本发明还提供了迄今未知的编码 PLATZ 的核酸, 以及 PLATZ 多肽。
根据本发明另外的实施方案, 从而提供了分离的核酸分子, 选自 :
(i) 由 SEQ ID NO : 354 表示的核酸 ;
(ii) 由 SEQ ID NO : 354 表示的核酸的互补序列 ;
(iii) 编码 PLATZ 多肽的核酸, 所述 PLATZ 多肽以递增的优先顺序与由 SEQ ID NO : 355 表示的氨基酸序列具有至少 50 %、 55 %、 60 %、 65 %、 70 %、 75 %、 80 %、 85 %、 90%、 95 %、 96 %、 97 %、 98 %、 99 %或更多的序列同一性, 并且以递增的优先顺序与在本文中所 定义的基序的一个或多个具有至少 50 %、 55 %、 60 %、 65 %、 70 %、 75 %、 80 %、 85 %、 90 %、 95%、 96%、 97%、 98%、 99%或更多的序列同一性。
根据本发明另外的实施方案, 从而还提供了分离的多肽分子, 选自 :
(i) 由 SEQ ID NO : 355 表示的氨基酸序列 ;
(ii) 氨基酸序列, 所述氨基酸序列以递增的优先顺序与由 SEQ ID NO : 355 表示 的氨基酸序列具有至少 50 %、 55 %、 60 %、 65 %、 70 %、 75 %、 80 %、 85 %、 90 %、 95 %、 96 %、 97 %、 98 %、 99 %或更多的序列同一性, 并且以递增的优先顺序与在本文中所定义的基序 的一个或多个具有至少 50 %、 55 %、 60 %、 65 %、 70 %、 75 %、 80 %、 85 %、 90 %、 95 %、 96 %、 97%、 98%、 99%或更多的序列同一性。(iii) 上述 (i) 或 (ii) 项中给出的任一氨基酸序列的衍生物。
此外, 意想不到的是, 现在发现调节编码 PLST 样多肽之核酸在植物中的表达产生 相对于对照植物而言具有增强的产量相关性状的植物。根据第一个实施方案, 本发明提供 了在植物中相对于对照植物而言增强产量相关性状的方法, 包括调节植物中编码 PLST 样 多肽之核酸的表达, 和任选地选择具有增强的产量相关性状的植物。
本发明还提供了迄今未知的编码 PLST 样的核酸, 以及 PLST 样多肽。
根据本发明另外的实施方案, 从而提供了分离的核酸分子, 选自 : (i) 由以下核酸 序列的任一表示的核酸 : 具有 SEQ ID NO : 414 ; SEQ ID NO : 426 ; SEQ ID NO : 428 ; SEQ ID NO : 434 ; SEQ ID NO : 438 ;
(ii) 由所述具有 SEQ ID NO : 414 ; SEQ ID NO : 426 ; SEQ ID NO : 428 ; SEQ ID NO : 434 ; SEQ ID NO : 438 的序列表示的核酸的互补序列 ;
(iii) 编码由具有 SEQ ID NO : 415 ; SEQ ID NO : 427 ; SEQ ID NO : 429 ; SEQ ID NO : 435 ; SEQ ID NO : 439 的任一表示的多肽的核酸, 优选地, 由于遗传密码的简并性, 所述分离 的核酸可以衍生自由 SEQ ID NO : 415 ; SEQ ID NO : 427 ; SEQ ID NO : 429 ; SEQ ID NO : 435 ; SEQ ID NO : 439 的任一表示的多肽序列, 并且另外优选地赋予相对于对照植物而言增强的 产量相关性状。
(iv) 核酸, 所述核酸以递增的优先顺序与表 A5 的任一核酸序列具有至少 30%、 31 %、 32 %、 33 %、 34 %、 35 %、 36 %、 37 %、 38 %、 39 %、 40 %、 41 %、 42 %、 43 %、 44 %、 45 %、 46 %、 47 %、 48 %、 49 %、 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%的序列同一性, 并且另外优选地赋予 相对于对照植物而言增强的产量相关性状 ;
(v) 核酸分子, 所述核酸分子在严格杂交条件下与 (i) 至 (iv) 项的核酸分子杂交, 并优选地赋予相对于对照植物而言增强的产量相关性状。
(vi) 编码 PLST 样多肽的核酸, 所述 PLST 样多肽以递增的优先顺序与由 SEQ ID NO : 415 ; SEQ ID NO : 427 ; SEQ ID NO : 429 ; SEQ ID NO : 435 ; SEQ ID NO : 439 的任一表示的 氨基酸序列和表 A5 中的任一其它氨基酸序列具有至少 50%、 51%、 52%、 53%、 54%、 55%、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86%、 87%、 88%、 89%、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%的序列 同一性, 并且优选地包含基序 19 至 21 和 44 至 60 和 PF 结构域, 赋予相对于对照植物而言 增强的产量相关性状。
根据本发明另外的实施方案, 从而还提供了分离的多肽分子, 选自 :
(i) 由 SEQ ID NO : 415 ; SEQ ID NO : 427 ; SEQ ID NO : 429 ; SEQ IDNO : 435 ; SEQ ID NO : 439 的任一表示的氨基酸序列 ;
(ii) 氨基酸序列, 所述氨基酸序列以递增的优先顺序与由 SEQ ID NO : 415 ; SEQ ID NO : 427 ; SEQ ID NO : 429 ; SEQ ID NO : 435 ; SEQ ID NO : 439 的任一表示的氨基酸序列和表 A5 中的任一其他氨基酸序列具有至少 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89%、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%的序列同一性, 并且优选 地包含基序 19 至 21 和 44 至 60 和 PF 结构域, 赋予相对于对照植物而言增强的产量相关性 状。
(iii) 上述 (i) 或 (ii) 项中给出的任一氨基酸序列的衍生物。
此外, 意想不到的是, 现在发现调节编码 Glomalin 多肽之核酸在植物中的表达 产生相对于对照植物而言具有增强的产量相关性状的植物。根据第一个实施方案, 本发 明提供了在植物中相对于对照植物而言增强产量相关性状的方法, 包括调节植物中编码 Glomalin 多肽之核酸的表达, 和任选地选择具有增强的产量相关性状的植物。
本发明还提供了迄今未知的编码 Glomalin 的核酸, 以及 Glomalin 多肽。
根据本发明另外的实施方案, 从而提供了分离的核酸分子, 选自 :
(i) 由 SEQ ID NO : 568、 SEQ ID NO : 569 或 SEQ ID NO : 570 之一表示的核酸 ;
(ii) 由 SEQ ID NO : 568、 SEQ ID NO : 569 或 SEQ ID NO : 570 之一表示的核酸的互 补序列 ;
(iii) 编码 Glomalin 多肽的核酸, 所述 Glomalin 多肽以递增的优先顺序与由 SEQ ID NO : 592、 SEQ ID NO : 593 或 SEQ ID NO : 594 之一表示的氨基酸序列具有至少 50%、 51%、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92 %、 93 %、 94 %、 95 %、 96 %、 97%、 98%或 99%的序列同一性, 并且另外地或备选地包含一个或多个基序, 所述基序以递 增的优先顺序与基序 31 至 43(SEQ ID NO : 596 至 SEQ ID NO : 608) 之一比较具有两个、 一个 序列错配或者没有序列错配, 并还优选地赋予相对于对照植物而言增强的产量相关性状。
(iv) 核酸分子, 所述核酸分子在高严格杂交条件下与 (i) 至 (iii) 项的核酸分子 杂交, 并优选地赋予相对于对照植物而言增强的产量相关性状。
根据本发明另外的实施方案, 从而还提供了分离的多肽分子, 选自 :
(i) 由 SEQ ID NO : 592、 SEQ ID NO : 593 或 SEQ ID NO : 594 之一表示的氨基酸序 列;
(ii) 氨基酸序列, 所述氨基酸序列以递增的优先顺序与由 SEQ ID NO : 592、 SEQ ID NO : 593 或 SEQ ID NO : 594 之一表示的氨基酸序列具有至少 50%、 51%、 52%、 53%、 54%、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85%、 86%、 87%、 88%、 89%、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%的 序列同一性, 并且另外地或备选地包含一个或多个基序, 所述基序以递增的优先顺序与基 序 41 至 43(SEQID NO : 596 至 SEQ ID NO : 608) 之一比较具有两个、 一个序列错配或者没有 序列错配, 并另外优选地赋予相对于对照植物而言增强的产量相关性状。
(iii) 上述 (i) 或 (ii) 项中给出的任一氨基酸序列的衍生物。
用于调节 ( 优选增加 ) 编码 eRF1 多肽之核酸的表达的优选的方法是通过在植物 中引入和表达编码 eRF1 多肽之核酸。用于调节 ( 优选增加 ) 编码 SCAMP 样多肽之核酸的表达的另一优选方法是通过在植物中引入和表达编码 SCAMP 样多肽之核酸。用于调节 ( 优 选增加 ) 编码肌原纤蛋白多肽之核酸的表达的又另一优选方法是通过在植物中引入和表 达编码肌原纤蛋白多肽之核酸。用于调节 ( 优选增加 ) 编码 PLATZ 多肽之核酸的表达的另 一优选方法是通过在植物中引入和表达编码 PLATZ 多肽之核酸。用于调节 ( 优选增加 ) 编 码 PLST 样多肽之核酸的表达的还另一优选方法是通过在植物中引入和表达编码 PLST 样多 肽之核酸。用于调节 ( 优选增加 ) 编码 Glomalin 多肽之核酸的表达的另一优选方法是通 过在植物中引入和表达编码 Glomalin 多肽之核酸。
在一个实施方案中, “用于本发明方法的蛋白质” 指本文所定义的 eRF1 多肽。在另 一实施方案中, “用于本发明方法的核酸” 指能够编码此 eRF1 多肽的核酸。在这种实施方案 中, 待引入植物 ( 因此可用于实施本发明方法 ) 的核酸是编码现将描述的蛋白质类型的任 何核酸, 下文也称为 “eRF1 核酸” 或 “eRF1 基因” 。
如本文中所定义, “eRF1 多肽” 指包含至少 3 个共有结构域 -eRF1 结构域 1、 eRF1 结构域 2 和 eRF1 结构域 3(PFam 登录号分别为 PF03463、 PF03464 和 PF03465) 的任一多肽。
优选地, eRF1 多肽的 eRF1 结构域 1 以递增的优先顺序与位于 SEQ IDNO 2 的氨基 酸 6 和 140 之间的序列具有至少 49%、 50%、 51%、 52%、 53%、 54%、 55%、 56%、 57%、 58%、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89%、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%或者更多的序列同一性。
优选地, eRF1 多肽的 eRF1 结构域 2 以递增的优先顺序与位于 SEQ IDNO 2 的氨 基酸 144 和 278 之间的序列具有至少 49%、 50%、 51%、 52%、 53%、 54%、 55%、 56%、 57%、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88%、 89%、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%或者更多的序列同 一性。
优选地, eRF1 多肽的 eRF1 结构域 3 以递增的优先顺序与位于 SEQ IDNO 2 的氨 基酸 281 和 418 之间的序列具有至少 49%、 50%、 51%、 52%、 53%、 54%、 55%、 56%、 57%、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88%、 89%、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%或者更多的序列同 一性。
本发明另外优选的 eRF1 多肽包含一个或多个以下多肽 : 分别具有 SEQID NO : 73、 74 和 75 的 GGQ、 NIKS 和 [GA][IMLV]LR[YW]。
备选地, 用于本发明方法的 eRF1 多肽包含一个或多个序列基序, 所述序列基序以 递增的优先顺序与任一以下基序 :
基序 1 :
FGTLSGNTREVLHKF[TS]VDLPKKHGRGGQSALRFARLRMEKRHNYVRK[TV]AE(SEQ ID NO : 76) ;
基序 2 :
YN[KR]VPPNGLVLY[TC]GT[IV]VT[ED][DE]GKEKKV[TN]IDFEPF[KR]PIN[AT]SLYLCDNKFHTE(SEQ ID NO : 77) ;
基序 3 :
ARGNGTSMISLI[MI]PP[RK]DQ[IV]SRVTKML[GA]DE[YF]GTASNIKSRVNR[QL]SVL[GS] AIT(SEQ ID NO : 78) 具有至少 49%、 50%、 51%、 52%、 53%、 54%、 55%、 56%、 57%、 58%、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89%、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%或者更多的序列同一性。
本文中以括号指出的氨基酸表示可以由任一其他氨基酸取代。
基序 1 至 3 在任一 eRF1 多肽中通常可见。
在本发明另一优选的实施方案中, 本发明的 eRF1 多肽可以包含任意一个或多个 序列基序, 所述序列基序以递增的优先顺序与任一以下基序 :
基序 4 :
F[TS]VDLPKKHGRGGQSALRFARLR[EM]EKRHNYVRKVAE[VL]A[VT]QNFITND[KR][PV] NV(SEQ ID NO : 79) ;
基序 5 :
Y[NT][KR]VPPNGLV[VLI]YCG[TD][IV][ILM]T[ED][ED]GKE[KR]K[VM][NT]ID[FI] EPFKPINTSLYLCDNKFHTE(SEQ ID NO : 80) ;
基序 6 :
ARGNGTSMISL[IV][IM]PPK[DG]Q[IV]S[RL]V[QA]KML[AT][DE] EYGTASNIKSRVNR[LQ]SVL[SG]AIT(SEQ ID NO : 81) 具有至少 49 %、 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92 %、 93 %、 94 %、 95 %、 96 %、 97 %、 98 %或 99%或者更多的序列同一性。
基序 4、 5 和 6 对应于非链形植物 (non-Streptophyta) 来源的 eRF1 多肽中代表保 守蛋白质区域的共有序列。
更优选地, 本发明的 eRF1 多肽可以包含任意一个或多个以下序列基序, 所述序列 基序以递增的优先顺序与任一以下基序 :
基序 7 :
VDLPKKHGRGGQSALRFARLRMEKRHNYVRKTAELATQF[YF]INPATSQPNV(SEQ ID NO : 82)
基序 8 :
YNKVPPNGLVLYTGTIVT[ED]DGKEKKVTIDFEPF[KR]PINASLYLCDNKFHTE(SEQ ID NO : 83)
基序 9 :
TSMISLIMPPRDQ[VI]SRVTKMLGDE[FY]GTASNIKSRVNRQSVLGAITSAQQR(SEQ ID NO : 84) 具有至少 49%、 50%、 51%、 52%、 53%、 54%、 55%、 56%、 57%、 58%、 59%、 60%、 61%、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%或者更多的序列同一性。基序 7、 8 和 9 对应于如下共有序列, 所述共有序列代表拟南芥属于的链形植物簇 的 eRF1 多肽中的保守蛋白质区域。
应当理解, 本文所指的基序 1、 2、 3、 4、 5、 6、 7、 8 和 9 代表在特定 eRF1 多肽中, 优选 在表 A1 的任一 eRF1 多肽中, 更优选在 SEQ ID NO : 2 中存在的同源基序的共有序列。本文 中所定义的基序并不限于其各个序列, 并且它们包括在任一 eRF1 中存在的同源基序。
鉴定与用于本发明方法的多肽中的基序 1 至 9 同源的基序的方法是本领域众所周 知的。例如, 可以使用算法例如 Blast(Altschul 等人 (1990)J Mol Biol 215 : 403-10), 通 过将它们的各个氨基酸序列比对而将多肽与基序比较, 以鉴定具有类似序列的区域。
备选地, eRF1 多肽的同源物以递增的优先顺序与由表 A1 的任一多肽, 优选地由 SEQ ID NO : 2 表示的氨基酸具有至少 25%、 26%、 27%、 28%、 29%、 30%、 31%、 32%、 33%、 34 %、 35 %、 36 %、 37 %、 38 %、 39 %、 40 %、 41 %、 42 %、 43 %、 44 %、 45 %、 46 %、 47 %、 48 %、 49 %、 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92 %、 93 %、 94%、 95%、 96%、 97%、 98%或 99%的整体序列同一性, 只要同源多肽包括如上所述的保守 基序。 整体序列同一性使用全局比对算法, 如 GAP 程序 (GCG Wisconsin Package, Accelrys) 中的 Needleman Wunsch 算法, 优选用默认参数并优选使用成熟蛋白质的序列 ( 即, 不考虑 分泌信号或转运肽 ) 来进行确定。与整体序列同一性相比, 当仅考虑保守结构域或基序 时, 序列同一性通常较高。对于局部比对, Smith-Waterman 算法是特别有用的 (Smith TF, Waterman MS(1981)J.Mol.Biol 147(1) ; 195-7)。
优选地, eRF1 多肽的序列, 当用于构建系统树 ( 例如图 1 中描述的 ) 时, 与包含由 SEQ ID NO : 2 表示的氨基酸序列的 eRF1 多肽的群聚簇。
在另一实施方案中, “用于本发明方法的蛋白质 / 多肽” 指本文所定义的 SCAMP 样 多肽。在另一实施方案中, “用于本发明方法的核酸” 指能够编码此 SCAMP 样多肽的核酸。 在此种实施方案中, 待引入植物 ( 因此可用于实施本发明方法 ) 的核酸是编码现将描述的 蛋白质类型的任何核酸, 下文也称为 “SCAMP 样核酸” 或 “SCAMP 样基因” 。
如本文中所定义, “SCAMP 样多肽” 指包含 SCAMP 结构域 (HMM PFam PF04144) 的任 一多肽。
优选地, SCAMP 样多肽的 SCAMP 结构域以递增的优先顺序与表 A2 的任一多肽中存 在的 SCAMP 结构域的氨基酸, 优选与由位于 SEQ ID NO : 89 的氨基酸 91 和 265 之间的序列 表示的 SCAMP 结构域具有至少 50%、 51%、 52%、 53%、 54%、 55%、 56%、 57%、 58%、 59%、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%、 99%或 100%的序列同一性。
更优选地, 除 SCAMP 结构域外, 用于本发明方法的 SCAMP 样多肽具有一个或多个, 优选至少 4 个或 3 个、 或 2 个、 或 1 个跨膜结构域区域 (TMR)。
多肽中的跨膜结构域区域 (TMR), 以及鉴定它们的方法是本领域众所周知的。 在实 施例部分中另外提供了此类方法的实例。
更优选地, 用于本发明方法的 SCAMP 样多肽的 TMR 以递增的优先顺序与在表 A2 的任一多肽中, 优选 SEQ ID NO : 89 中存在的 TMR 的一个或多个的氨基酸具有至少 50%、 51%、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92 %、 93 %、 94 %、 95 %、 96 %、 97%、 98%、 99%或 100%的序列同一性。
在 SEQ ID NO : 89 中存在的 TMR 由以下序列表示 :
氨基端 121 151 186 227
跨膜区 AFTTLLGLVGCLLWNIVAVTVAW IWLLSIIYFLAGVPGAYVLWYRP FGAFFFFYVFHIAFCGFAAVAPP TTNAAVGIMYFIGAGFFCIETLL 羧基端 143 173 208 249 长度 23 23 23 23 SEQ ID NO : 194 195 196 197氨基端和羧基端列表示 SEQ ID NO : 89 中跨膜结构域的氨基酸坐标。
另外更优选地, 用于本发明方法的 SCAMP 样多肽包含至少 2、 1、 0、 3、 4 或 5 个重复 或者三肽 NPF(SEQ ID NO : 198)。该三肽与胞吞作用期间 SCAMP 蛋白质通过结合来招募 EH 蛋白质的生物学作用有关。 SCAMP 多肽中 NPF 三肽优选地以递增的优先顺序位于氨基端、 羧 基端, 以及氨基端和羧基端二者。
一般地和甚至更优选地, 本发明的 SCAMP 样多肽共有常见的结构域结构, 其包含 具有多个 NPF 重复的胞质氨基端结构域、 4 个高度保守的跨膜区 (TMR) 和短的胞质羧基端尾 巴。
本发明优选的 SCAMP 样多肽的氨基端尾巴以递增的优先顺序与在表 A2 的任一多 肽中存在的氨基端尾巴, 优选 SEQ ID NO : 89 的氨基端尾巴和由 MARHDPNPFADEEINPFANHTS VPPASNSYLKPLPPEPYDRGATVDIPLDSGNDLRAKEMELQAKENELKRKEQELKRREDAIARTGVVIEEKNWPEFF PLIHHDIPNEIPIHLQKIQYV(SEQ ID NO : 199) 表示的氨基酸具有至少 50%、 51%、 52%、 53%、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92 %、 93 %、 94 %、 95 %、 96 %、 97 %、 98 %或 99%的序列同一性。
本 发 明 优 选 的 SCAMP 样 多 肽 的 羧 基 端 尾 巴 以 递 增 的 优 先 顺 序 与 在 表 A2 的 任 一 多 肽 中 存 在 的 羧 基 端 尾 巴, 优 选 SEQ ID NO : 89 的 羧 基 端 尾 巴 和 由 NIWVIQQVYAYFRGSGKAAEMKREA TKSTLMRAL(SEQ ID NO : 200) 表示的氨基酸具有至少 50%、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92 %、 93 %、 94 %、 95 %、 96%、 97%、 98%或 99%的序列同一性。
一 般 地, 多 肽 包 含 E 肽。E 肽 指 保 守 的 氨 基 酸 基 序, 其以递增的优先顺序与LWYRPLYRAFRTDSA(SEQ ID NO : 201) 或 LWYRPLYNAMRTESA(SEQ ID NO : 202) 表示的氨基酸具 有至少 50%、 51%、 52%、 53 %、 54%、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92 %、 93 %、 94%、 95%、 96%、 97%、 98%、 99%或 100%的整体序列同一性。
备选地, 本发明的 SCAMP 样核酸是任一这样的核酸, 所述核酸编码表 A2 的任一多 肽的同源物, 优选其直向同源物或旁系同源物。优选此类同源物具有等同的 ( 或类似的 ) 生物学功能, 例如在细胞分离时 ( 例如果实脱落和裂开期间 ) 发生的内吞过程期间招募 EH 蛋白质。
备选地, 用于本发明方法的 SCAMP 样蛋白质的同源物以递增的优先顺序与由表 A2 的任一多肽表示的氨基酸, 优选地与 SEQ ID NO : 89 具有至少 50%、 51%、 52%、 53%、 54%、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92 %、 93 %、 94 %、 95 %、 96 %、 97 %、 98 %、 99 %或 100%的整体序列同一性。
整 体 序 列 同 一 性 使 用 全 局 比 对 算 法, 如 GAP 程 序 (GCG Wisconsin Package, Accelrys) 中的 Needleman Wunsch 算法, 优选用默认参数并优选的使用成熟蛋白质的序列 ( 即, 不考虑分泌信号或转运肽 ) 来进行确定。与整体序列同一性相比, 当仅考虑保守结 构域或基序时, 序列同一性通常较高。对于局部比对, Smith-Waterman 算法是特别有用的 (Smith TF, Waterman MS(1981)J.Mol.Biol 147(1) ; 195-7)。
在另一实施方案中, “用于本发明方法的蛋白质” 指本文所定义的肌原纤蛋白多 肽。在另一实施方案中, “用于本发明方法的核酸” 指能够编码此肌原纤蛋白多肽的核酸。 在此种实施方案中, 待引入植物 ( 因此可用于实施本发明方法 ) 的核酸是编码现将描述的 蛋白质类型的任何核酸, 下文也称为 “肌原纤蛋白核酸” 或 “肌原纤蛋白基因” 。
如本文中所定义, “肌原纤蛋白多肽” 指包含以下的任一多肽 :
(i) 由 PFAM 登录号 PF04755 表示的 PAP 肌原纤蛋白结构域 ; 和
(ii) 由 KFECQNESRGGLVRNVIKWSVPRLLEEN
EGATLIVTARFSSVSARNIYLKFEEIGLQNINISDDLQAVIAPAILPRSFLSLQILQFIRSFKARVPVT SPERHSVGGLYYLSYLDKNMLLGRAVGGGGVFIFTRAHTL(SEQ ID NO : 253) 表示的羧基端结构域, 其 可以含有表示 1 至 15 个残基之间的 0 至 5 个之间的空位, 或者结构域, 其以递增的优先顺 序与 (SEQID NO : 253) 具有至少 50%、 51%、 52%、 53%、 54%、 55%、 56%、 57%、 58%、 59%、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%的整体序列同一性 ; 和任选地
(iii) 在多肽的氨基端区域内的转运肽。
SEQ ID NO : 253 表示如出现在由 SEQ ID NO : 205 表示的肌原纤蛋白中羧基端结构 域的氨基酸序列。
根据本发明优选的特征, PAP 肌原纤蛋白结构域由 ENRKYELLNIIQDTQRGLVTTADQRS TIEEAMVVVEGFDAGKEIDLSKLDG TWQYTSAPDVLILFESAARLPFFQVGQIFQ(SEQ ID NO : 252) 表示,其可以含有表示 1 至 15 个残基之间的 0 至 5 个之间的空位, 或者结构域, 其以递增的优先顺 序与 SEQ ID NO : 252 具有至少 50%、 51%、 52%、 53%、 54%、 55%、 56%、 57%、 58%、 59%、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92 %、 93 %、 94 %、 95 %、 96 %、 97 %、 98 %或 99 %的整体序列同一性的结构域。 SEQ ID NO : 252 表示 PAP 肌原纤蛋白结构域的氨基酸序列, 其出现在由 SEQ ID NO : 205 表 示的肌原纤蛋白中。
肌原纤蛋白多肽的另外特征是存在一个或多个以下结构域 :
结 构 域 X: NIYLQF[EQ]E[IA]S[VL]Q[ND]INISE[EQ]LQAL[IL]APA[IL]LPRSFL[SN] LQILQ[FA][LI][RK][TS]F[KR]AQ[VI]P(SEQ ID NO : 254) ;
结构域 Y : YYL[ST]YLD[RN][ND]MLLGR[AS]VGGGGV(SEQID NO : 255) ;
结构域 Z : [PA][IL]DL[AS]KLDGTWRLQYTSA[SP]DV(SEQ ID NO : 256) ; 或以递增的 优先顺序与结构域 X、 Y 和 Z 的任意一个或多个具有至少 50%、 51%、 52%、 53%、 54%、 55%、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86%、 87%、 88%、 89%、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%的整体 序列同一性的结构域。
肌原纤蛋白通常以递增的优先顺序与由 SEQ ID NO : 205 表示的氨基酸具有至少 45 %、 46 %、 47 %、 48 %、 49 %、 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92 %、 93 %、 94 %、 95 %、 96 %、 97 %、 98 %、 99 %或更多的整体序列同一性。整 体序列同一性使用全局比对算法, 如 GAP 程序 (GCG Wisconsin Package, Accelrys) 中的 Needleman Wunsch 算法, 优选用默认参数并优选的使用成熟蛋白质的序列 ( 即, 不考虑分 泌信号或转运肽 ) 来进行确定。与整体序列同一性相比, 当仅考虑保守结构域或基序时, 序列同一性通常较高。对于局部比对, Smith-Waterman 算法是特别有用的 (Smith TF, Waterman MS(1981)J.Mol.Biol147(1) ; 195-7)。
优选地, 当多肽序列用于构建系统树时, 例如图 6 中描述的, 与包含由 SEQ ID NO : 205 表示的氨基酸序列的肌原纤蛋白多肽的群聚簇, 而不与任何其他群聚簇。
在另一实施方案中, “用于本发明方法的蛋白质” 指本文所定义的 PLATZ 多肽。在 另一实施方案中, “用于本发明方法的核酸” 指能够编码此 PLATZ 多肽的核酸。在此种实施 方案中, 待引入植物 ( 因此可用于实施本发明方法 ) 的核酸是编码现将描述的蛋白质类型 的任何核酸, 下文也称为 “PLATZ 核酸” 或 “PLATZ 基因” 。
如本文中所定义, “PLATZ 多肽” 指包含 PLATZ 结构域 (Pfam accession PF04640 ; InterPro accession IPR006734) ; 并包含具有共有序列 C-x(2)-H-x(11)-C-x(2)-C-x(4-5)-C-x(2 262) 的氨基端锌结合区和具有在中心区共有序列 C-x(2)-C)-C-x(3-7)-H-x(2)-H(SEQ ID NO : x(10-11)-C-x(3)-C(SEQID NO : 263) 的锌结合区的任一多肽, 如在 Nagano 等人 (2001) 中所述。 换言之, 如在本文中所定义, “PLATZ 多肽” 指包含 PLATZ 结构域 (Pfam accession PF04640 ; InterPro accession IPR006734) ; 并包含具有由任一以下序列 : CxxHxxxxxxxxxxxCxxCxxxxCxxCxxxHxxH(SEQ ID NO : 645) ; CxxHxxxxxxxxxxxCxxCxxxxCxxCxxxxHxxH(SEQ ID NO : 646) ; CxxHxxxxxxxxxxxCxxCxxxxCxxCxxxxxHxxH(SEQ ID NO : 647) ; CxxHxxxxxxxxxxxCxxC xxxxCxxCxxxxxxHxxH(SEQ ID NO : 648) ; CxxHxxxxxxxxxxxCxxCxxxxCxxCxxxxxxxHxxH(SEQ ID NO : 649) ; CxxHxxxxxxxxxxxCxxCxxxxxCxxCxxxHxxH(SEQ ID NO : 650) ; CxxHxxxxxxxxxxx CxxCxxxxxCxxCxxxxHxxH(SEQ ID NO : 651) ; CxxHxxxxxxxxxxxCxxCxxxxxCxxCxxxxxHxxH(SE Q ID NO : 652) ; CxxHxxxxxxxxxxxCxxCxxxxxCxxCxxxxxxHxxH (SEQ ID NO : 653) ; CxxHxxxx xxxxxxxCxxCxxxxxCxxCxxxxxxxHxxH(SEQ ID NO : 654) 给出的共有序列的氨基端锌结合区 ; 和在中心区中具有共有序列 CxxCxxxxxxxxxxCxxxC(SEQ ID NO : 655) 或 CxxCxxxxxxxxxxx CxxxC(SEQ ID NO : 656) 的锌结合区的任一多肽, 如在 Nagano 等人 (2001) 中所述。
优选地, 用于本发明方法的 PLATZ 蛋白质包含一个或多个以下基序 ( 由 MEME 定 义; Bailey 和 Elkan, Proceedings of the Second International Conference on Intelligent Systems for Molecular Biology, 第 28-36 页, AAAI Press, Menlo Park, California, 1994, Bailey 等人, Nucleic Acids Research, 34, W369-W373, 2006) :
基序 10(SEQ ID NO : 264) : [VI]QTY[TVI]INSA[KR]V[VI]FL[NK][QE]RPQ[SP]R
基序 11(SEQ ID NO : 265) : HRSHR[LV][LI]Q[VI]RR[YS][VS]YHDV[VI]R[LV]x[DE] [LI][QE]KL[IL]D[CI]
基序 12(SEQ ID NO : 266) : [KR]NE[KC]N[IV]FCLDC
更优选地, PLATZ 蛋白质包含一个或多个由 MEME 所定义的以下基序 :
基序 13(SEQ ID NO : 267) : HRSH[RP]LLQVRRYVYHDV[VI]RLEDL[EQ]KLIDCS
基 序 14(SEQ ID NO : 268) : FKG[SL]GN[SY]CT[TS]CDR[SI]LQEP[FY][HR][FHY] CS[LV][SG]CKV
基序 15(SEQ ID NO : 269) : AWLE[AG]L[LY][TA][EDQ]KFFV[GA]C[SP]xHEx[AR][KR] KNEKN[IV][FC]C[LV]DC[CS][AT]SIC[PQ]HC。
最优选地, PLATZ 蛋白质包含一个或多个如由 MEME 所定义的以下基序 :
基 序 16(SEQ ID NO : 270) : RRYVYHDVVRLEDL[EQ]KLIDCS[NS]VQ[AS]YTINS[AS] KVVF[IL]KKRPQNRQFKG[SA]GN
基 序 17(SEQ ID NO : 271) : PAWLEALY[TA][QE]KFF[VA][GA]CS[YF]HE[HNT] AKKNEKN[IV]CCLDCC[TI]SICPHC[VL]P[SA]HR[FV]HR
基序 18(SEQ ID NO : 272) : CTSCDRSLQEP[FY][IF]HCSL[GD]CKV[DE][FY][VI]L[KR] [HQ][YK]KDLS[PA]YLR[PTR]C[KN][TS]L[QT]L[GS]PDF[FL]IP。
此外, 优选地, PLATZ 多肽以递增的优先顺序包含至少 2 个或者至少 3 个上述基序。
备选地或另外地, PLATZ 蛋白质的同源物以递增的优先顺序与由 SEQID NO : 261 表示的氨基酸具有至少 25 %、 26 %、 27 %、 28 %、 29 %、 30 %、 31 %、 32 %、 33 %、 34 %、 35 %、 36 %、 37 %、 38 %、 39 %、 40 %、 41 %、 42 %、 43 %、 44 %、 45 %、 46 %、 47 %、 48 %、 49 %、 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92 %、 93 %、 94 %、 95 %、 96 %、 97 %、 98 %或 99 %的整体序列同一性, 只要同源蛋白质包括如上所述的一个或多个 保守基序。整体序列同一性使用全局比对算法, 如 GAP 程序 (GCG Wisconsin Package,Accelrys) 中的 Needleman Wunsch 算法, 优选用默认参数并优选的使用成熟蛋白质的序列 ( 即, 不考虑分泌信号或转运肽 ) 来进行确定。与整体序列同一性相比, 当仅考虑保守结构 域或基序时, 序列同一性通常较高。 优选地, PLATZ 多肽中的基序以递增的优先顺序与由 SEQ ID NO : 264 至 SEQ ID NO : 272( 基序 10-18) 表示的基序具有至少 70%、 71%、 72%、 73%、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89%、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%的序列同一性。
优选地, 当多肽序列用于构建系统树时, 例如图 12 中描述的, 与包含由 SEQ ID NO : 261 表示的氨基酸序列的 PLATZ-A 多肽的群, 更优选地与 PLATZ-A1 蛋白质, 最优选地与 PLATZ-A1-α 蛋白质聚簇, 而不与任何其他 PLATZ 蛋白质的群聚簇。
在另一实施方案中, “用于本发明方法的蛋白质” 指本文所定义的 PLST 样多肽。在 另一实施方案中, “用于本发明方法的核酸” 指能够编码此 PLST 样多肽的核酸。在此种实施 方案中, 待引入植物 ( 因此可用于实施本发明方法 ) 的核酸是编码现将描述的蛋白质类型 的任何核酸, 下文也称为 “PLST 样核酸” 或 “PLST 样基因” 。
如本文中所定义, “PLST 样多肽” 指包含至少一个 PLST 样共有结构域 (Pfam 登录 号 PF02298) 的任一多肽。
优选地, PLST 样多肽的 PLST 样结构域以递增的优先顺序与位于 SEQID NO 411 的 氨基酸 38 至 124 之间的序列具有至少 49%、 50%、 51%、 52%、 53%、 54%、 55%、 56%、 57%、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88%、 89%、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%或者更多的序列同 一性。
备选地, 用于本发明方法的 PLST 样多肽包含一个或多个序列基序, 所述序列基序 以递增的优先顺序与任一以下基序 :
基序 19 : [DH]SV[LI]QV[TS]KE[DA][YF][DK]SCNT[SK][NSD]P(SEQ ID NO : 530) ;
基序 20 : [FHY]YF[IT]SGV[PK][GD][HN]C(SEQ ID NO : 531) ;
基 序 21 : Y[NT][QK]WA[ESK][KS]NRF[KQ][IV]GD[ST][LI][VL]F[KL]YP(SEQ ID NO : 532) ;
基序 44 : [DHN][SND][VLM]xx[VL]xxxx[FYHN]xxCxxTx[NSD](SEQ ID NO : 615) ;
基序 45 : [GD]xx[FY][FYI]x[SGC][GAIT](SEQ ID NO : 616) ; 并优选地位置 3 处所 述 x 选自以下氨基酸 : F、 H、 Y、 V 和 A。
基 序 46 : [GV][GDAE]xxxWx[VITLA]xxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY] (SEQ IDNO : 617) ;
基 序 47 : [GV][GDAE]xxxWx[VITLA]xxxxxxxW[ASPV]xxxx[FL]xx[GDNS] Dxxxxx[FY](SEQID NO : 618) ;
基 序 48 : [GV][GDAE]xxxWx[VITLA]xxxxxxxxW[ASPV]xxxx[FL]xx[GDNS] Dxxxxx[FY](SEQID NO : 619) ;
基 序 49 : [GV][GDAE]xxxWx[VITLA]xxxxxxxxxW[ASPV]xxxx[FL]xx[GDNS] Dxxxxx[FY](SEQ ID NO : 620) ;
基 序 50 : [GV][GDAE]xxxWx[VITLA]xxxxxxxxxxW[ASPV]xxxx[FL]xx[GDNS]Dxxxxx[FY](SEQ ID NO : 621) ;
基 序 51[GV][GDAE]xxxWx[VITLA]xxxxxxxxxxxW[ASPV]xxxx[FL]xx[GDNS] Dxxxxx[FY](SEQ ID NO : 622) ;
基 序 52 : [GV][GDAE]xxxWx[VITLA]xxxxxxxxxxxxW[ASPV]xxxx[FL]xx[GDNS] Dxxxxx[FY](SEQ ID NO : 623) ;
基 序 53 : [GV][GDAE]xxxxWx[VITLA]xxxxxxW[ASPV]xxxx[FL]xx[GDNS] Dxxxxx[FY](SEQID NO : 624) ;
基 序 54 : [GV][GDAE]xxxxWx[VITLA]xxxxxxxW[ASPV]xxxx[FL]xx[GDNS] Dxxxxx[FY](SEQID NO : 625) ;
基 序 55 : [GV][GDAE]xxxxWx[VITLA]xxxxxxxxW[ASPV]xxxx[FL]xx[GDNS] Dxxxxx[FY](SEQ ID NO : 626) ;
基 序 56 : [GV][GDAE]xxxxWx[VITLA]xxxxxxxxxW[ASPV]xxxx[FL]xx[GDNS] Dxxxxx[FY](SEQ ID NO : 627) ;
基 序 57 : [GV][GDAE]xxxxWx[VITLA]xxxxxxxxxxW[ASPV]xxxx[FL]xx[GDNS] Dxxxxx[FY](SEQ ID NO : 628) ;
基 序 58[GV][GDAE]xxxxWx[VITLA]xxxxxxxxxxxW[ASPV]xxxx[FL]xx[GDNS] Dxxxxx[FY](SEQ ID NO : 629) ;
基 序 59[GV][GDAE]xxxxWx[VTLA]xxxxxxxxxxxxW[ASPV]xxxx[FL]xx[GDNS] Dxxxxx[FY](SEQ ID NO : 630)
具有至少 49 %、 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%或者更多的序列同一性。
备选地, 或者此外组合地, 在另一实施方案中, 用于本发明方法的 PLST 样多肽包 含序列基序, 所述序列基序以递增的优先顺序与以下基序 :
基 序 60 : [FHY][YF][FY][TAI]S[GAD]xx[GD][HRN]C(SEQ ID NO : 631) 具 有 至 少 49 %、 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92 %、 93 %、 94%、 95%、 96%、 97%、 98%或 99%或者更多的序列同一性。
这些基序是共有序列, 并且在 PLST 样序列中并非总是相同的。应当注意, 本文中 方括号中标出的氨基酸代表特定位置的备选氨基酸。在本文给定序列中, “x” 可以是任一 不同的氨基酸。
在本发明另一优选的实施方案中, 本发明的 PLST 样多肽可以包含任意一个或多 个序列基序, 所述序列基序以递增的优先顺序与任一以下基序 :
基 序 22 : [DN]GN[TS][LVK][FV][KN][LF][DT]R[SP]GP[FY]YF[IT]SG[VA][KP] [GD][HN]CEK[GN][QE]K(SEQ ID NO : 533) ;
基 序 23 : [YL]N[QK]WA[EK][KS][NH]RF[KQ][IV]GD[ST]L[LV]F[LK]Y[PD](SEQ ID NO : 534) ;基序 24 ; [KQ]DSV[LI]QVTKE[DA]YKSCNT[SK][DSN]PI(SEQ ID NO : 535) ;
基序 61 :
[DNT][GDE][NDKH][TS][LVKM][FVYI]x[LIF]xxxGx[FYHV][YF][FYI][ITVA] S[GAD]xxxxxC(SEQ ID NO : 632) ;
基序 62 :
[DNT][GDE][NDKH][TS][LVKM][FVYI]x[LIF]xxxGx[FYHV][YF][FYI][ITVA] S[GAD]xxxxxxC(SEQ ID NO : 633) ;
基序 63 :
[DNT][GDE][NDKH][TS][LVKM][FVYI]x[LIF]xxxGx[FYHV][YF][FYI][ITVA] S[GAD]xxxxC(SEQ ID NO : 667) ;
基序 64 :
[NSDT]xW[ASPV]xxx[RSNT][FLV]x[VILT][GN]Dx[LIV]x[FLW]x[YF](SEQ ID NO : 634) ;
基 序 65 : S[VALM][LIM]x[VL]xxxx[YF]xxC[NTKD][SKTDG]xx[PAHY](SEQ ID NO : 635)。
具有至少 49 %、 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%或者更多的序列同一性。
基序 22、 23 和 24, 以及基序 61 至 65 对应于共有序列, 其代表在包含 PLST 样、 P_ Class( 拟南芥和毛果杨 (P.trichocarpa) 属于其 ) 和 NDL 的群的多肽中保守的蛋白质区 域。
最优选地, 本发明的 PLST 样多肽可以包含任意一个或多个序列基序, 所述序列基 序以递增的优先顺序与任一以下基序 :
基 序 25 : DSVI[QV]VT[EKA][EQ]S[YF][KN][SK]CNL[KST]DPIL[YF][MS]N[ND] GN[ST][LV]FN[LI][TD][RS]PGL[FY]YF[TI]SG[VA][PS]GHC[EQ][KR](SEQ ID NO : 536) ;
基 序 26 : P[PT]SA[DN]P[DQ][VL]YTKW[AS][KS][NS][HN][RN]FK[IL]GD[ST][LI] LFLYP(SEQ ID NO : 537) ;
基序 27 : XVS[CS]Y[QE][YF]KVG[DG]LD[AGS]W(SEQ ID NO 538) ;
基 序 66 : DS[VALM][LVIM][QVE][VL][STA]xxx[FY]xxC[NDQ]x[KST]xP[LVIQH] [LATF][YFTKS][FSLM]x[ND][GE][NDK][ST]x[FYI]x[LIF][TDSE](SEQ ID NO : 636) ;
基 序 67 : [YF]xxW[APV][KSG]xxx[FLV][KART][LIV][GN]D[SAT][LI]xFxY(SEQ ID NO : 6377) ;
基序 68 : [YF]x[VA]G[DAGE]xx[GAS]Wx[VAI]P(SEQ ID NO : 638)。具有至少 49%、 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92 %、 93 %、 94 %、 95%、 96%、 97%、 98%或 99%或者更多的序列同一性。
基序 25、 26 和 27, 以及基序 66 至 68 对应于共有序列, 其代表在属于 PLST 样的多肽和拟南芥属于的 P_Class 群多肽中最保守的蛋白质区域。
在本发明最优选的实施方案中, 本发明的 PLST 样多肽可以包含任意一个或多个 序列基序, 所述序列基序以递增的优先顺序与任一以下基序 :
基 序 28 : HN[FL]K[IL]GDSLLFLYPPSQDSVIQVTA[QE][SAN][YF][KN]SC[ND]L[KS] DPILYMN[DN]GNSLFN[IL]T(SEQ ID NO : 539) ;
基序 29 : GDFYFTSG[AVE]PGHC[EQ]K[SK]QKLH[IV](SEQ ID NO : 540) ;
基序 30 : VSCYQYKVGDLD[AS]WGIPTSA[NK](SEQ ID NO : 541) ;
基序 69 :
[FLV]x[LIV]GD[SA][LIV][LFW]FLY[PL]PS[QE]DS[LMAV][LIV]Q[VL][TA]x2[ASN] [FY](SEQID NO : 639) ;
基 序 70 : C[NDQ]X[SKT][DNS]P[LVI][LAT]X[MFL]X[ND]GN[ST][LAV][NK][LFI] [ST](SEQ IDNO : 640) ;
基 序 71 : Gxx[FHY][YF][FY][TAI]S[GAD]xxG[HR]Cx[KR]x[QS][KR][LAI](SEQ ID NO : 641) ;
基序 72 : [YF][KQ]VG[DAGN]L[DQN][AS]W[GAN][VAI]P[TIPS](SEQ ID NO : 642) ;
基序 73 : GD[SA][LIV][LFW]FLY[PL]PS[QE](SEQ ID NO : 643) ;
基序 74 : LY[PL]PS[QE](SEQ ID NO : 644) 具有至少 49%、 50%、 51%、 52%、 53%、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92 %、 93 %、 94 %、 95 %、 96 %、 97 %、 98 %或 99%或者更多的序列同一性。
应当理解, 如本文中所述, 由 MEME(Timothy L.Bailey 和 Charles Elkan“ ,Fitting a mixture model by expectation maximization to discover motifs in biopolymers” , Proceedings of the Second International Conference on Intelligent Systems for Molecular Biology, 第 28-36 页, AAAI Press, Menlo Park, California, 1994) 测定的基序 19、 20、 21、 22、 23、 24、 25、 26、 27、 28、 29 和 30 表示在 PLST 样多肽中, 优选地在表 A5 的 PLST 样多肽中, 最优选地在 SEQ ID NO : 411 中存在的基序的共有序列。本文中定义的基序并不 限于其各个序列, 并且它们包括在任一 PLST 样中显示的同源基序。
应当理解, 如本文中所述, 由 MEME(Timothy L.Bailey 和 Charles Elkan“ ,Fitting a mixture model by expectation maximization to discover motifs in biopolymers” , Proceedings of the Second International Conference on Intelligent Systems for Molecular Biology, 第 28-36 页, AAAI Press, Menlo Park, California, 1994) 测定的基序 44 至 74 表示在 PLST 样多肽中, 优选在表 A5 的 PLST 样多肽中, 更优选在 SEQ ID NO : 411 中存在的基序的共有序列。本文中定义的基序并不限于其各个序列, 并且它们包括在任一 PLST 样中显示的同源基序。
鉴定与用于本发明方法的多肽中的基序 19 至 30 和 / 或基序 44 至 74 同源的基序 的方法是本领域众所周知的。例如, 可以使用算法例如 Blast(Altschul 等人 (1990)J Mol Biol 215 : 403-10), 通过将它们的各个氨基酸序列比对将多肽与基序比较, 以鉴定具有类 似序列的区域。备选地, PLST 样多肽的同源物以递增的优先顺序与由表 A5 的任一多肽, 优选地 由 SEQ ID NO : 411 表示的氨基酸具有至少 25%、 26%、 27%、 28%、 29%、 30%、 31%、 32%、 33 %、 34 %、 35 %、 36 %、 37 %、 38 %、 39 %、 40 %、 41 %、 42 %、 43 %、 44 %、 45 %、 46 %、 47 %、 48 %、 49 %、 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92 %、 93%、 94%、 95%、 96%、 97%、 98%或 99%的整体序列同一性, 只要同源多肽包括如上所述 的保守基序。整体序列同一性使用全局比对算法, 如 GAP 程序 (GCG Wisconsin Package, Accelrys) 中的 Needleman Wunsch 算法, 优选用默认参数并优选的使用成熟蛋白质的序列 ( 即, 不考虑分泌信号或转运肽 ) 来进行确定。与整体序列同一性相比, 当仅考虑保守结 构域或基序时, 序列同一性通常较高。对于局部比对, Smith-Waterman 算法是特别有用的 (Smith TF, Waterman MS(1981)J.Mol.Biol 147(1) ; 195-7)。
优选地, PLST 样多肽的序列, 当用于构建系统树时, 例如图 15 中描述的, 与包含由 SEQ ID NO : 411 表示的氨基酸序列的 PLST 样多肽的群聚簇。
在另一实施方案中, “用于本发明方法的蛋白质” 指本文所定义的 Glomalin 多肽。 在另一实施方案中, “用于本发明方法的核酸” 指能够编码此 Glomalin 多肽的核酸。在此种 实施方案中, 待引入植物 ( 因此可用于实施本发明方法 ) 的核酸是编码现将描述的蛋白质 类型的任何核酸, 下文也称为 “Glomalin 核酸” 或 “Glomalin 基因” 。
如本文中所定义, “Glomalin 多肽” 指包含 Cpn60_TCP1 结构域 (Pfam accession PF00118) 和另外包含基序 31、 32 和 33 或者具有与基序 31 至 33 不多于 2 个错配的基序的 任一热休克蛋白 60(HSP60 多肽 )。
基序 31(SEQ ID NO : 596) : DDT(I/V/L)(I/V)L(D/H)G(G/A/L)G(N/D/E)K(A/T/K/Q) X(I/L)(E/D)(E/D) 其中 X 为任一氨基酸, 优选地为 I、 A、 S、 G、 L、 Q、 T 之一。
基 序 32(SEQ ID NO : 597) : (T/A)(S/A/N/E)N(F/E/D)(D/G)(E/Q)(K/R)(V/I/R) GV(Q/E)
基序 33(SEQ ID NO : 598) : (E/Q)X(N/D)X(N/S/D)(I/L/F/M)G(Y/F/C)DAA(K/R)(A/ G/D)(E/K/T)Y(V/L)(D/H)M, 其中位置 2 的 X 为任一氨基酸, 优选地为 A、 T、 S、 D、 E 之一, 位 置 4 的 X 为任一氨基酸, 优选地为 L、 P、 T、 C 之一。
另外地或备选地, Glomalin 多肽包含基序 34 至 43 的一个或多个。
基 序 34(SEQ ID NO : 599) : L(Q/R/K)GV(E/S/N)(Q/E/D)(V/L)A(D/E)AV(K/Q) VTMGPKGR(T/H/N)V(V/I)(I/L)EXS, 其中 X 为任一氨基酸, 优选地为 Q、 S、 R、 K、 G 之一, 最优 选地为 Q。
基序 35(SEQ ID NO : 600) : KDGVTVAK(A/S)(I/V)(E/S/KN)F
基序 36(SEQ ID NO : 601) : (KQ)(N/S)(I/V)GA(S/E/D/N)LVK(S/Q)VA(S/N/E/D)(S/ A)TN
基 序 37(SEQ ID NO : 602) : TT(C/A)AT(V/I)L(T/A)(R/K/Q)AI(F/L)XEGCK(S/A) V(A/S)AG(M/V)(N/S)AMDLR, 其中 X 为任一氨基酸, 优选地为 V、 A、 T、 S、 I 之一。
基序 38(SEQ ID NO : 603) : TISANG
基片 39(SEQ ID NO : 604) : GK(E/H/D)GVIT(V/I)XDG(K/N)T(L/M), 其中 X 为任一氨基酸, 优选地为 S、 A、 Q、 T、 V 之一。
基序 40(SEQ ID NO : 605) : RGY(I/T)SPYF(V/I)T(N/D)
基序 41(SEQ ID NO : 606) : PLLI(V/I)(A/S)ED(V/L/I)(E/D)
基序 42(SEQ ID NO : 607) : K(A/S)PGFG(E/D)(N/S)R
基序 43(SEQ ID NO : 608, 位于蛋白质序列的羧基端末端 ) : GMGG
更优选地, Glomalin 多肽以递增的优先顺序包含至少 3 个、 至少 4 个、 至少 5 个、 至少 6 个、 至少 7 个、 至少 8 个、 至少 9 个、 至少 10 个、 至少 11 个、 至少 12 个或者全部 13 个 基序。此外, glomalin 优选地不具有分泌信号。
另外地或备选地备选地, Glomalin 蛋白质的同源物以递增的优先顺序与由 SEQ ID NO : 546 表示的氨基酸具有至少 25%、 26%、 27%、 28%、 29%、 30%、 31%、 32%、 33%、 34%、 35 %、 36 %、 37 %、 38 %、 39 %、 40 %、 41 %、 42 %、 43 %、 44 %、 45 %、 46 %、 47 %、 48 %、 49 %、 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92 %、 93 %、 94 %、 95%、 96%、 97%、 98%或 99%的整体序列同一性, 只要同源多肽包括如上所述的保守基序 任一或多个。整体序列同一性使用全局比对算法, 如 GAP 程序 (GCG Wisconsin Package, Accelrys) 中的 Needleman Wunsch 算法, 优选用默认参数并优选的使用成熟蛋白质的序列 ( 即, 不考虑分泌信号或转运肽 ) 来进行确定。与整体序列同一性相比, 当仅考虑保守结构 域或基序时, 序列同一性通常较高。 优选地, Glomalin 多肽中的基序以递增的优先顺序与由 SEQ ID NO : 596 至 SEQ ID NO : 608( 基序 31 至 43) 表示的基序具有至少 70%、 71%、 72%、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88%、 89%、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%的序列同一性。
优选地, 多肽序列, 当用于构建系统树时, 例如图 19 中描述的, 与包含由 SEQ ID NO : 546 表示的氨基酸序列的 Glomalin 多肽的群聚簇, 而不与其他任何群聚簇。
术语 “结构域” 、 “特征序列” 和 “基序” 在本文 “定义” 章节中定义。存在用于鉴 定 结 构 域 的 专 门 数 据 库, 例 如 SMART(Schultz 等 (1998)Proc.Natl.Acad.Sci.USA 95, 5857-5864 ; Letunic 等 (2002)Nucleic Acids Res30, 242-244), InterPro(Mulder 等, (2003)Nucl.Acids.Res.31, 315-318), Prosite(Bucher 和 Bairoch(1994), A generalized profile syntax for biomolecular sequences motifs and its function in automatic sequence interpretation.(In)ISMB-94 ; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology.Altman R., Brutlag D., Karp P., Lathrop R., Searls D. 编著, 第 53-61 页, AAAI Press, Menlo Park ; Hulo 等, Nucl.Acids. Res.32 : D134-D137, (2004) 或 者 Pfam(Bateman 等, Nucleic Acids Research 30(1) : 276-280(2002))。用于计算机分析蛋白质序列的一组工具可获得自 ExPASy 蛋白组服 务 器 (Swiss Institute of Bioinformatics(Gasteiger 等, ExPASy : the proteomics server for in-depth protein knowledge and analysis, Nucleic Acids Res.31 : 3784-3788(2003))。还可以使用常规技术 ( 如序列比对 ) 来鉴定结构域或基序。
关于 PLATZ 多肽, 本文表 A4 中的 PLATZ-A1-α 多肽的比对示于图 11 中。这样的 比对用于鉴定如本文定义的 PLATZ 多肽间最保守的结构域或者基序。一个这样的结构域是PLATZ 结构域, 在图 10 中以黑斜体标出。此类基序的实例是 SEQ ID NO : 264 至 SEQ ID NO : 272, 在图 10 中以各个基序号标记。
比对序列以进行比较的方法为本领域所众所周知, 这些方法包括 GAP、 BESTFIT、 BLAST、 FASTA 和 TFASTA。GAP 利用 Needleman 和 Wunsch((1970)J Mol Biol 48 : 443-453) 的算法来寻找两序列间使匹配数最高并使空位数最少的全局比对 ( 即在完整序列上 )。 BLAST 算法 (Altschul 等 (1990)J Mol Biol 215 : 403-10) 在两序列间计算百分比序列同一 性并进行相似性的统计学分析。用于进行 BLAST 分析的软件在美国国家生物技术信息中心 (National Centre for Biotechnology Information(NCBI)) 向公众提供。可以使用例如 默认配对比对参数的 ClustalW 多重序列比对算法 (1.83 版 ) 和百分比评分法来容易地鉴 定同源物。 也可以使用 MatGAT 软件包 (Campanella 等, BMC Bioinformatics.2003 Jul 10 ; 4: 29.MatGAT : an application that generates similarity/identity matrices using protein or DNA sequence) 中提供的一种方法确定全局的相似性和同一性百分比。 本领域 技术人员会意识到, 可以进行少量手动编辑以优化保守性基序之间的比对。 此外, 还可以使 用特定的结构域代替全长序列来鉴定同源物。 序列同一性值可以是使用默认参数的上述程 序在完整的核酸或氨基酸序列上或在所选择的结构域或保守的基序上测定的。 对于局部比 对, Smith-Waterman 算法是特别有用的 (Smith TF, Waterman MS(1981)J.Mol.Biol147(1) ; 195-7)。
关于 PLATZ 多肽, 实施例 3 在表 B3 中描述了多种 PLATZ 多肽之间的同一性百分比, 特别是 SEQ ID NO : 261( 表示为 Pt583639) 与其他 PLATZ-A1-α 多肽之间的同一性百分比, 其可以低至 70%。通常, PLATZ-A1-α 多肽的群内的同一性百分比为 55%或者更高。
蛋白质亚细胞定位预测的工作是重要的并且已经进行了充分的研究。 知晓蛋白质 的定位有助于阐明其功能。用于蛋白质定位的实验方法涉及从免疫定位到使用绿色荧光 蛋白 (GFP) 或者 β- 葡糖醛酸糖苷酶 (GUS) 的蛋白质标记的范围。与计算方法相比, 尽管 这些方法劳动量大, 但是却是精确的。近来从数据库计算预测蛋白质定位取得了极大的进 展。本领域技术人员众所周知的算法可获得自由瑞士信息学协会 (Swiss Institute for Bioinformatics) 管理的 ExPASy 蛋白质组学工具, 例如 PSort、 TargetP、 ChloroP、 LocTree、 Predotar、 LipoP、 MITOPROT、 PATS、 PTS1、 SignalP、 TMHMM 以及其他。
关于 PLATZ 多肽、 PLATZ 蛋白质, 作为 DNA 结合蛋白质, 可能具有核定位。
此外, eRF1 多肽 ( 至少以其天然形态 ) 通常具有调节花分生组织活性的作用。用 于测量花分生组织活性的工具和技术是本领域众所周知的。
另外, 如实施例部分所述, 当根据本发明方法在稻中表达时, eRF1 多肽产生具有增 强的产量相关性状, 特别是增加的种子产量以及生物量的植物。
此外, eRF1 多肽可以显示出优选的亚细胞定位, 通常为核、 胞质、 叶绿体或者线粒 体的一种或多种。蛋白质亚细胞定位预测的工作是重要的并且已经进行了充分的研究。知 晓蛋白质的定位有助于阐明其功能。 用于蛋白质定位的实验方法涉及从免疫定位到使用绿 色荧光蛋白 (GFP) 或者 β- 葡糖醛酸糖苷酶 (GUS) 的蛋白质标记的范围。 与计算方法相比, 尽管这些方法劳动量大, 但是却是精确的。近来从数据库计算预测蛋白质定位取得了极大 的进展。本领域技术人员熟知的算法可获得自由瑞士信息学协会 (Swiss Institute for Bioinformatics) 管理的 ExPASy 蛋白质组学工具, 例如 PSort、 TargetP、 ChloroP、 LocTree、Predotar、 LipoP、 MITOPROT、 PATS、 PTS1、 SignalP、 TMHMM 以及其他。
此外, SCAMP 样多肽 ( 至少以其天然形态 ) 通常具有 EH 蛋白质结合活性。用于测 量 EH 蛋白质结合活性的工具和技术是本领域众所周知的。
另外, 如实施例部分所述, 当根据本发明方法在稻中表达时, SCAMP 样多肽产生具 有增强的产量相关性状的植物, 特别是增加在氮缺乏生长条件下生长的植物的种子和 / 或 生物量产量, 如在实施例部分中所述的那些植物。
此外, SCAMP 样多肽可以显示出优选的亚细胞定位, 通常为核、 胞质、 叶绿体或者线 粒体的一种或多种。蛋白质亚细胞定位预测的工作是重要的并且已经进行了充分的研究。 知晓蛋白质的定位有助于阐明其功能。 用于蛋白质定位的实验方法涉及从免疫定位到使用 绿色荧光蛋白 (GFP) 或者 β- 葡糖醛酸糖苷酶 (GUS) 的蛋白质标记的范围。与计算方法相 比, 尽管这些方法劳动量大, 但是却是精确的。 近来从数据库计算预测蛋白质定位取得了极 大的进展。 本领域技术人员熟知的算法可获得自由瑞士信息学协会 (Swiss Institute for Bioinformatics) 管理的 ExPASy 蛋白质组学工具, 例如 PSort、 TargetP、 ChloroP、 LocTree、 Predotar、 LipoP、 MITOPROT、 PATS、 PTS1、 SignalP、 TMHMM 以及其他。优选地, 本发明的 SCAMP 多肽与膜连接, 优选与内质网的膜连接。
在本发明的另一优选的实施方案中, 本发明的 SCAMP 多肽与膜连接。将多肽与膜 连接 ( 也称为将多肽锚定在膜上 ) 或者增加细胞中多肽与膜连接的部分的方法是本领域众 所周知的。例如, GPI( 糖基 - 磷脂酰肌醇 )(GPI) 部分基序可以以递增的优先顺序与 SCAMP 多肽的氨基端、 羧基端、 中心部分连接 ( 通常共价地连接 )(Bertozzi 等人, Biochemistry。 2008 年 7 月 8 日 ; 47(27) : 6991-7000)。备选地, SCAMP 多肽可以富含脯氨酸和 / 或丙氨酸 残基。此类残基通常在细胞上被糖修饰, 并随后隐蔽 (sequester) 在膜 ( 主要是质膜 ) 中 (Kjellbom P, Snogerup L, C, Reuzeau C, McCabe PF, Pennell RI。Plant J.1997 年 11 月 ; 12(5) : 189-96)。
如实施例部分所述, 当根据本发明方法在稻中表达时, 肌原纤蛋白多肽产生具有 增强的产量相关性状的植物。
肌原纤蛋白多肽通常在叶绿体中显示出优选的亚细胞定位。 蛋白质亚细胞定位预 测的工作是重要的并且已经进行了充分的研究。知晓蛋白质的定位有助于阐明其功能。用 于蛋白质定位的实验方法涉及从免疫定位到使用绿色荧光蛋白 (GFP) 或者 β- 葡糖醛酸糖 苷酶 (GUS) 的蛋白质标记的范围。与计算方法相比, 尽管这些方法劳动量大, 但是却是精确 的。近来从数据库计算预测蛋白质定位取得了极大的进展。本领域技术人员熟知的算法可 获得自由瑞士信息学协会 (Swiss Institute for Bioinformatics) 管理的 ExPASy 蛋白质 组学工具, 例如 PSort、 TargetP、 ChloroP、 LocTree、 Predotar、 LipoP、 MITOPROT、 PATS、 PTS1、 SignalP、 TMHMM 以及其他。
此外, PLATZ 多肽 ( 至少以其天然形态 ) 通常具有锌依赖的 DNA 结合活性。用于 测量 DNA 结合活性的工具和技术是本领域众所周知的 ( 参见例如 Nagano 等人, 2001)。在 实施例部分提供了另外的详细说明。
另外, 如实施例部分所述, 当根据本发明方法在稻中表达时, PLATZ 多肽产生具有 增强的产量相关性状的植物, 特别是增加的种子产量, 例如增加的种子总重量和 / 或增加 的饱满率和 / 或增加的千粒重 ; 和 / 或增加的收获指数 ; 和 / 或增加的地上生物量 ( 在本文中也称为 areamax) 和 / 或快速的早期发育等。
另外, 如实施例部分所述, 当根据本发明方法在稻中表达时, PLST 样多肽产生具有 增强的产量相关性状, 特别是增加的种子产率以及生物量的植物。
此外, PLST 样多肽可以显示出优选的亚细胞定位, 通常为核、 胞质、 叶绿体或者线 粒体的一种或多种。蛋白质亚细胞定位预测的工作是重要的并且已经进行了充分的研究。 知晓蛋白质的定位有助于阐明其功能。 用于蛋白质定位的实验方法涉及从免疫定位到使用 绿色荧光蛋白 (GFP) 或者 β- 葡糖醛酸糖苷酶 (GUS) 的蛋白质标记的范围。与计算方法相 比, 尽管这些方法劳动量大, 但是却是精确的。 近来从数据库计算预测蛋白质定位取得了极 大的进展。 本领域技术人员熟知的算法可获得自由瑞士信息学协会 (Swiss Institute for Bioinformatics) 管理的 ExPASy 蛋白质组学工具, 例如 PSort、 TargetP、 ChloroP、 LocTree、 Predotar、 LipoP、 MITOPROT、 PATS、 PTS1、 SignalP、 TMHMM 以及其他。
此 外, Glomalin 多 肽 ( 至 少 以 其 天 然 形 态 ) 通 常 拯 救 温 度 敏 感 型 突 变 株 (Hemmingsen 等 人, Nature 333, 330-334, 1988, Salvucci, J.Exp.Bot.59, 1923-1933, 2008)。
另外, 如实施例部分所述, 当根据本发明方法在稻中表达时, Glomalin 多肽产生具 有增强的产量相关性状, 特别是增加的收获指数的植物。
关于 eRF1 多肽, 本发明通过用 SEQ ID NO : 1 表示的核酸序列转化植物进行了示 例, 上述核酸序列编码 SEQ ID NO : 2 的多肽序列。然而, 本发明的实施不限于这些序列 ; 本 发明的方法可有利的通过使用本文定义的任何 eRF1 多肽编码核酸或 eRF1 多肽来实施。
编码 eRF1 多肽的核酸的实例在本文实施例章节表 A1 中给出。这样的核酸可用于 实施本发明的方法。实施例章节表 A1 中给出的氨基酸序列为 SEQ ID NO : 2 所示 eRF1 多 肽的直向同源物和旁系同源物的示例序列, 术语 “直向同源物” 和 “旁系同源物” 如本文所 定义。可以通过进行所谓的交互 blast 检索容易地找到更多直向同源物和旁系同源物。通 常, 这包括以查询序列 ( 例如, 利用实施例章节表 A1 中所列的任一序列 ) 针对任何序列数 据库如可公共获得的 NCBI 数据库进行 BLAST 的首次 BLAST。当从核苷酸序列开始时, 通常 使用 BLASTN 或 TBLASTX( 利用标准默认值 ), 而当从蛋白质序列开始时, 则使用 BLASTP 或 TBLASTN( 利用标准默认值 )。BLAST 结果可以任选地过滤。接着使用过滤的结果或者未过 滤的结果的全长序列针对查询序列来源生物的序列进行反向 BLAST( 二次 BLAST)。然后比 较首次和二次 BLAST 的结果。如果首次 BLAST 中的高排名命中来自查询序列来源的相同物 种, 然后反向 BLAST 理想地导致查询序列处于最高命中之列, 则找到了旁系同源物 ; 如果首 次 BLAST 中高排名命中不来自查询序列来源的相同物种, 且优选地在反向 BLAST 时导致查 询序列在最高命中之列, 则找到了直向同源物。
关于 SCAMP 样多肽, 本发明通过用 SEQ ID NO : 88 表示的核酸序列转化植物进行 了示例, 上述核酸序列编码 SEQ ID NO : 89 的多肽序列。然而, 本发明的实施不限于这些序 列; 本发明的方法可有利的通过使用本文定义的任何 SCAMP 样编码核酸或 SCAMP 样多肽来 实施。
编码 SCAMP 样多肽的核酸的实例在本文实施例章节表 A2 中给出。 这样的核酸可用 于实施本发明的方法。实施例章节表 A2 中给出的氨基酸序列为 SEQ ID NO : 89 所示 SCAMP 样多肽的直向同源物和旁系同源物的示例序列, 术语 “直向同源物” 和 “旁系同源物” 如本文所定义。可以通过进行所谓的交互 blast 检索容易地找到更多直向同源物和旁系同源物。 通常, 这包括以查询序列 ( 例如, 利用实施例章节表 A2 中所列的任一序列 ) 针对任何序列 数据库如可公共获得的 NCBI 数据库进行 BLAST 的首次 BLAST。当从核苷酸序列开始时, 通 常使用 BLASTN 或 TBLASTX( 利用标准默认值 ), 而当从蛋白质序列开始时, 则使用 BLASTP 或 TBLASTN( 利用标准默认值 )。BLAST 结果可以任选地过滤。接着使用过滤的结果或者未过 滤的结果的全长序列针对查询序列来源生物的序列进行反向 BLAST( 二次 BLAST)( 在查询 序列为 SEQ ID NO : 88 或 SEQ ID NO : 89 的情况下, 二次 BLAST 将因此会针对拟南芥序列 )。 然后比较首次和二次 BLAST 的结果。如果首次 BLAST 中的高排名命中来自查询序列源自的 相同物种, 然后反向 BLAST 理想地导致查询序列处于最高命中之列, 则找到了旁系同源物 ; 如果首次 BLAST 中高排名命中不来自查询序列源自的相同物种, 且优选地在反向 BLAST 时 导致查询序列在最高命中之列, 则找到了直向同源物。
关于肌原纤蛋白多肽, 本发明通过用 SEQ ID NO : 204 表示的核酸序列转化植物进 行了示例, 上述核酸序列编码 SEQ ID NO : 205 的多肽序列。 然而, 本发明的实施不限于这些 序列 ; 本发明的方法可有利的通过使用本文定义的任何肌原纤蛋白编码核酸或肌原纤蛋白 多肽来实施。
编码肌原纤蛋白多肽的核酸的实例在本文实施例章节表 A3 中给出。这样的核酸 可用于实施本发明的方法。实施例章节表 A3 中给出的氨基酸序列为 SEQ ID NO : 205 所示 肌原纤蛋白多肽的直向同源物和旁系同源物的示例序列, 术语 “直向同源物” 和 “旁系同源 物” 如本文所定义。可以通过进行所谓的交互 blast 检索容易地找到更多直向同源物和旁 系同源物。通常, 这包括以查询序列 ( 例如, 利用实施例章节表 A3 中所列的任一序列 ) 针 对任何序列数据库如可公共获得的 NCBI 数据库进行 BLAST 的首次 BLAST。 当从核苷酸序列 开始时, 通常使用 BLASTN 或 TBLASTX( 利用标准默认值 ), 而当从蛋白质序列开始时, 则使用 BLASTP 或 TBLASTN( 利用标准默认值 )。BLAST 结果可以任选地过滤。接着使用过滤的结果 或者未过滤的结果的全长序列针对查询序列来源生物的序列进行反向 BLAST( 二次 BLAST) ( 在查询序列为 SEQ ID NO : 204 或 SEQ ID NO : 205 的情况下, 二次 BLAST 将因此会针对番 茄序列 )。然后比较首次和二次 BLAST 的结果。如果首次 BLAST 中的高排名命中来自查询 序列源自的相同物种, 然后反向 BLAST 理想地导致查询序列处于最高命中之列, 则找到了 旁系同源物 ; 如果首次 BLAST 中高排名命中不来自查询序列源自的相同物种, 且优选地在 反向 BLAST 时导致查询序列在最高命中之列, 则找到了直向同源物。
关于 PLATZ 多肽, 本发明通过用 SEQ ID NO : 260 表示的核酸序列转化植物进行了 示例, 上述核酸序列编码 SEQ ID NO : 261 的多肽序列。然而, 本发明的实施不限于这些序 列; 本发明的方法可有利的通过使用本文定义的任何 PLATZ 编码核酸或 PLATZ 多肽来实施。 例如, 在另一实施方案中, 本发明通过用 SEQ ID NO : 356 表示的核酸序列转化植物进行了示 例, 上述核酸序列编码 SEQ ID NO : 357 的多肽序列。
编码 PLATZ 多肽的核酸的实例在本文实施例章节表 A4 中给出。这样的核酸可用 于实施本发明的方法。 实施例章节表 A4 中给出的氨基酸序列为 SEQ ID NO : 261 所示 PLATZ 多肽的直向同源物和旁系同源物的示例序列, 术语 “直向同源物” 和 “旁系同源物” 如本文 所定义。可以通过进行所谓的交互 blast 检索容易地找到更多直向同源物和旁系同源物。 通常, 这包括以查询序列 ( 例如, 利用实施例章节表 A4 中所列的任一序列 ) 针对任何序列数据库如可公共获得的 NCBI 数据库进行 BLAST 的首次 BLAST。当从核苷酸序列开始时, 通 常使用 BLASTN 或 TBLASTX( 利用标准默认值 ), 而当从蛋白质序列开始时, 则使用 BLASTP 或 TBLASTN( 利用标准默认值 )。 BLAST 结果可以任选地过滤。 接着使用过滤的结果或者未过滤 的结果的全长序列针对查询序列来源生物的序列进行反向 BLAST( 二次 BLAST)( 在查询序 列为 SEQ ID NO : 260 或 SEQ ID NO : 261 的情况下, 二次 BLAST 将因此会针对杨树 (poplar) 序列 )。然后比较首次和二次 BLAST 的结果。如果首次 BLAST 中的高排名命中来自查询序 列源自的相同物种, 然后反向 BLAST 理想地导致查询序列处于最高命中之列, 则找到了旁 系同源物 ; 如果首次 BLAST 中高排名命中不来自查询序列源自的相同物种, 且优选地在反 向 BLAST 时导致查询序列在最高命中之列, 则找到了直向同源物。
关于 PLST 样多肽, 本发明通过用 SEQ ID NO : 410 表示的核酸序列转化植物进行了 示例, 上述核酸序列编码 SEQ ID NO : 411 的多肽序列。然而, 本发明的实施不限于这些序 列; 本发明的方法可有利的通过使用本文定义的任何 PLST 样编码核酸或 PLST 样多肽来实 施。
编码 PLST 样多肽的核酸的实例在本文实施例章节表 A5 中给出。这样的核酸可用 于实施本发明的方法。实施例章节表 A5 中给出的氨基酸序列为 SEQ ID NO : 411 所示 PLST 样多肽的直向同源物和旁系同源物的示例序列, 术语 “直向同源物” 和 “旁系同源物” 如本文 所定义。可以通过进行所谓的交互 blast 检索容易地找到更多直向同源物和旁系同源物。 通常, 这包括以查询序列 ( 例如, 利用实施例章节表 A5 中所列的任一序列 ) 针对任何序列 数据库如可公共获得的 NCBI 数据库进行 BLAST 的首次 BLAST。当从核苷酸序列开始时, 通 常使用 BLASTN 或 TBLASTX( 利用标准默认值 ), 而当从蛋白质序列开始时, 则使用 BLASTP 或 TBLASTN( 利用标准默认值 )。BLAST 结果可以任选地过滤。接着使用过滤的结果或者未过 滤的结果的全长序列针对查询序列来源生物的序列进行反向 BLAST( 二次 BLAST)。然后比 较首次和二次 BLAST 的结果。如果首次 BLAST 中的高排名命中来自查询序列源自的相同物 种, 然后反向 BLAST 理想地导致查询序列处于最高命中之列, 则找到了旁系同源物 ; 如果首 次 BLAST 中高排名命中不来自查询序列源自的相同物种, 且优选地在反向 BLAST 时导致查 询序列在最高命中之列, 则找到了直向同源物。
关于 Glomalin 多肽, 本发明通过用 SEQ ID NO : 545 表示的核酸序列转化植物进行 了示例, 上述核酸序列编码 SEQ ID NO : 546 的多肽序列。 然而, 本发明的实施不限于这些序 列; 本发明的方法可有利的通过使用本文定义的任何 Glomalin 编码核酸或 Glomalin 多肽 来实施。
编码 Glomalin 多肽的核酸的实例在本文实施例章节表 A6 中给出。这样的核酸 可用于实施本发明的方法。实施例章节表 A6 中给出的氨基酸序列为 SEQ ID NO : 546 所示 Glomalin 多肽的直向同源物和旁系同源物的示例序列, 术语 “直向同源物” 和 “旁系同源物” 如本文所定义。可以通过进行如在定义部分中所述的所谓的交互 blast 检索容易地找到更 多直向同源物和旁系同源物 ; 其中在查询序列为 SEQ ID NO : 545 或 SEQ ID NO : 546 的情况 下, 二次 BLAST( 反向 BLAST) 会针对稻序列。
高排名的命中是那些 E 值低的命中。E 值越低, 分值越具有显著性 ( 或者换句话 说, 偶然发现此命中的几率越低 )。E 值的计算是本领域众所周知的。除了 E 值之外, 还对 比较进行同一性百分比评分。同一性百分比是指两比较核酸 ( 或多肽 ) 序列之间在特定长度上的相同核苷酸 ( 或氨基酸 ) 数。在大家族的情况下可以使用 ClustalW, 继之以邻接树 来辅助相关基因的聚类可视化, 和鉴定直向同源物和旁系同源物。
核酸变体也可用于实施本发明的方法。 这类核酸变体的例子包括编码实施例章节 表 A1 至 A6 中给出的任一氨基酸序列的同源物和衍生物的核酸序列, 其中术语 “同源物” 和 “衍生物” 如本文所定义。同样可用于本发明方法的有编码实施例章节表 A1 至 A6 中给出的 任一氨基酸序列的直向同源物或旁系同源物的同源物和衍生物的核酸。 用于本发明方法的 同源物和衍生物与其源自的未修饰蛋白质具有基本上相同的生物活性和功能活性。 在实施 本发明方法中有用的其他变体是这样的变体, 其中已经优化了密码子使用或者其中移除了 miRNA 靶向位点。
可用于实施本发明方法的其它核酸变体包括编码 eRF1 多肽或 SCAMP 样多肽、 或肌 原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽的核酸的部分, 与编码 eRF1 多肽或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽 的核酸杂交的核酸, 编码 eRF1 多肽或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽的核酸的剪接变体, 编码 eRF1 多肽或 SCAMP 样多肽、 或肌原 纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽的核酸的等位变体, 以及通过 基因改组获得的 eRF1 多肽或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样 多肽、 或 Glomalin 多肽编码核酸的变体。术语杂交序列、 剪接变体、 等位变体和基因改组如 本文所述。
编码 eRF1 多肽或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多 肽、 或 Glomalin 多肽的核酸无需是全长核酸, 因为本发明方法的实施不依赖于全长核酸序 列的使用。 根据本发明, 提供了增强植物中产量相关性状的方法, 包括在植物中引入和表达 实施例章节表 A1 至 A6 中给出的任一核酸序列的部分、 或者编码实施例章节表 A1 至 A6 中 给出的任一氨基酸序列之直向同源物、 旁系同源物或同源物的核酸的部分。
例如, 可以通过对核酸进行一个或多个缺失来制备所述核酸的部分。部分可以以 分离的形式使用, 或者可将其与其它编码 ( 或非编码 ) 序列融合, 以便例如产生组合了若干 活性的蛋白质。当与其它编码序列融合时, 经翻译后所产生的多肽可能比针对该蛋白质部 分所预测到的要大。
关于 eRF1 多肽, 可用于本发明方法的部分编码如本文所定义的 eRF1 多肽, 并与实 施例章节表 A1 中给出的氨基酸序列具有基本上相同的生物活性。优选部分是实施例章节 表 A1 中给出的任一核酸的部分, 或是编码实施例章节表 A1 中给出的任一氨基酸序列之直 向同源物或旁系同源物的核酸的部分。 优选该部分长度为至少 500、 550、 600、 650、 700、 750、 800、 850、 900、 950、 1000、 1050、 1100、 1150、 1200、 1250、 1300、 1350 个连续核苷酸, 所述连续 核苷酸是实施例章节表 A1 中给出的任一核酸序列或者编码实施例章节表 A1 中给出的任一 氨基酸序列之直向同源物或旁系同源物的核酸。 最优选该部分是核酸 SEQ ID NO : 1 的一部 分。优选该部分编码这样的氨基酸序列的片段, 所述氨基酸序列当用于构建系统树 ( 例如 图 1 所示的系统发生树 ) 时, 与包含由 SEQ ID NO : 2 表示的氨基酸序列的 eRF1 多肽的群聚 簇, 而非与其他群聚簇。
关于 SCAMP 样多肽, 可用于本发明方法的部分编码如本文所定义的 SCAMP 样多肽, 并与实施例章节表 A2 中给出的氨基酸序列具有基本上相同的生物活性。优选部分是实施例章节表 A2 中给出的任一核酸的部分, 或是编码实施例章节表 A2 中给出的任一氨基酸序 列之直向同源物或旁系同源物的核酸的部分。优选该部分长度为至少 100、 200、 300、 400、 500、 550、 600、 650、 700、 750、 800、 850、 900、 950、 1000 个连续核苷酸, 所述连续核苷酸是实施 例章节表 A2 中给出的任一核酸序列或者是编码实施例章节表 A2 中给出的任一氨基酸序列 之直向同源物或旁系同源物的核酸。最优选该部分是核酸 SEQ ID NO : 88 的一部分。优选 该部分编码这样的氨基酸序列的片段, 所述氨基酸序列包含如本文中所定义的 SCAMP 结构 域。
关于肌原纤蛋白多肽, 可用于本发明方法的部分编码如本文所定义的肌原纤蛋白 多肽, 并与实施例章节表 A3 中给出的氨基酸序列具有基本上相同的生物活性。优选部分是 实施例章节表 A3 中给出的任一核酸的部分, 或是编码实施例章节表 A3 中给出的任一氨基 酸序列之直向同源物或旁系同源物的核酸的部分。优选该部分长度为至少 500、 550、 600、 650、 700、 750、 800、 850、 900、 950、 1000 个连续核苷酸, 所述连续核苷酸是实施例章节表 A3 中给出的任一核酸序列或者是编码实施例章节表 A3 中给出的任一氨基酸序列之直向同源 物或旁系同源物的核酸。最优选该部分是核酸 SEQ ID NO : 204 的一部分。优选该部分编码 这样的氨基酸序列的片段, 所述氨基酸序列当用于构建系统树 ( 例如图 6 所示的系统发生 树 ) 时, 与包含由 SEQ ID NO : 205 表示的氨基酸序列的肌原纤蛋白多肽的群聚簇, 而非与其 他群聚簇。
关于 PLATZ 多肽, 可用于本发明方法的部分编码如本文所定义的 PLATZ 多肽, 并与 实施例章节表 A4 中给出的氨基酸序列具有基本上相同的生物活性。优选部分是实施例章 节表 A4 中给出的任一核酸的部分, 或是编码实施例章节表 A4 中给出的任一氨基酸序列之 直向同源物或旁系同源物的核酸的部分。优选该部分长度为至少 300、 350、 400、 450、 500、 550、 600、 650、 700、 750、 800、 850、 900、 950、 1000、 1050、 1100 个连续核苷酸, 所述连续核苷酸 是实施例章节表 A4 中给出的任一核酸序列或者是编码实施例章节表 A4 中给出的任一氨基 酸序列之直向同源物或旁系同源物的核酸。最优选该部分是核酸 SEQ ID NO : 260 的一部 分。优选该部分编码这样的氨基酸序列的片段, 所述氨基酸序列包含 PLATZ 结构域和一个 或多个如上所定义的基序, 并且当用于构建系统树 ( 例如图 12 所示的系统发生树 ) 时, 与 包含由 SEQ ID NO : 261 表示的氨基酸序列的 PLATZ-A 多肽的群, 更优选地与 PLATZ-A1 蛋白 质的群, 最优选地与 PLATZ-A1-α 蛋白质的群聚簇, 而非与其他 PLATZ 蛋白质的群聚簇。
关于 PLST 样多肽, 可用于本发明方法的部分编码如本文所定义的 PLST 样多肽, 并 与实施例章节表 A5 中给出的氨基酸序列具有基本上相同的生物活性。优选部分是实施例 章节表 A5 中给出的任一核酸的部分, 或是编码实施例章节表 A5 中给出的任一氨基酸序列 之直向同源物或旁系同源物的核酸的部分。 优选该部分长度为至少 100、 150、 200、 250、 300、 350、 400、 450、 500、 550、 600、 650、 700 个连续核苷酸, 所述连续核苷酸是实施例章节表 A5 中 给出的任一核酸序列或者编码实施例章节表 A5 中给出的任一氨基酸序列之直向同源物或 旁系同源物的核酸。最优选该部分具有基序 1 至 12 的一个或多个和 PF 结构域, 并且是核 酸 SEQ ID NO : 410 的一部分。优选该部分编码这样的氨基酸序列的片段, 所述氨基酸序列 当用于构建系统树 ( 例如图 19 所示的系统发生树 ) 时, 与包含由 SEQ ID NO : 411 表示的氨 基酸序列的 PLST 样多肽的群聚簇, 而非与其他群聚簇。
关于 Glomalin 多肽, 可用于本发明方法的部分编码如本文所定义的 Glomalin 多肽, 并与实施例章节表 A6 中给出的氨基酸序列具有基本上相同的生物活性。优选部分是 实施例章节表 A6 中给出的任一核酸的部分, 或是编码实施例章节表 A6 中给出的任一氨基 酸序列之直向同源物或旁系同源物的核酸的部分。优选该部分长度为至少 450、 500、 550、 600、 650、 700、 750、 800、 850、 900、 950、 1000、 1050、 1100、 1150、 1200、 1250、 1300、 1350、 1400、 1450、 1500、 1550、 1600、 1650、 1700、 1750、 1800、 1850、 1900 个连续核苷酸, 所述连续核苷酸 是实施例章节表 A6 中给出的任一核酸序列或者是编码实施例章节表 A6 中给出的任一氨基 酸序列之直向同源物或旁系同源物的核酸。 最优选该部分是核酸 SEQ ID NO : 545 的一部分。 优选该部分编码这样的氨基酸序列的片段, 所述氨基酸序列包含 Cpn60_TCP1 结构域 (Pfam accession PF00118), 或者所述氨基酸序列当用于构建系统树 ( 例如图 19 所示的系统发生 树 ) 时, 与包含由 SEQ ID NO : 546 表示的氨基酸序列的 Glomalin 多肽的群聚簇, 而非与其 他群聚簇。
可用于本发明方法中的另一种核酸变体是能够在降低的严格性条件下、 优选在 严格条件下与编码如本文中所定义的 eRF1 多肽、 或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽的核酸杂交, 或与如本文中所定义的部分进行 杂交的核酸。
根据本发明, 提供用于增强植物中产量相关性状的方法, 包括在植物中引入并表 达能够与实施例章节表 A1 至 A6 中给出的任何一种核酸杂交的核酸, 或包括在植物中引入 并表达这样的核酸, 其能够与编码在实施例章节表 A1 至 A6 中给出的任一氨基酸序列之直 向同源物、 旁系同源物或同源物的核酸序列杂交。
关于 eRF1 多肽, 可用于本发明方法的杂交序列编码如本文所定义的 eRF1 多肽, 与 实施例章节表 A1 中给出的氨基酸序列具有基本上相同的生物活性。优选杂交序列能够与 实施例章节表 A1 中给出的任一核酸的互补序列杂交、 或与任一这些序列的部分杂交, 其中 部分如上文所定义, 或者杂交序列能够与编码实施例章节表 A1 中给出的任一氨基酸序列 之直向同源物或旁系同源物的核酸的互补序列杂交。最优选杂交序列能够与 SEQ IDNO : 1 所示核酸的互补序列或其部分杂交。
优选地, 杂交序列编码具有这样的氨基酸序列的多肽, 所述氨基酸序列当全长用 于构建系统树时, ( 例如图 1 所示的系统发生树 ) 时, 与包含由 SEQ ID NO : 2 表示的氨基酸 序列的 eRF1 多肽的群聚簇, 而非与其他群聚簇。
关于 SCAMP 样多肽, 可用于本发明方法的杂交序列编码如本文所定义的 SCAMP 样 多肽, 与实施例章节表 A2 中给出的氨基酸序列具有基本上相同的生物活性。优选杂交序列 能够与实施例章节表 A2 中给出的任一核酸的互补序列杂交、 或与任一这些序列的部分杂 交, 其中部分如上文所定义, 或者杂交序列能够与编码实施例章节表 A2 中给出的任一氨基 酸序列之直向同源物或旁系同源物的核酸的互补序列杂交。 最优选杂交序列能够与 SEQ ID NO : 88 所示核酸的互补序列或其部分杂交。
优选杂交序列编码具有这样的氨基酸序列的多肽, 所述氨基酸序列包含如本文中 所定义的 SCAMP 结构域。
关于肌原纤蛋白多肽, 可用于本发明方法的杂交序列编码如本文所定义的肌原纤 蛋白多肽, 与实施例章节表 A3 中给出的氨基酸序列具有基本上相同的生物活性。优选杂交 序列能够与实施例章节表 A3 中给出的任一核酸的互补序列杂交、 或与任一这些序列的部分杂交, 其中部分如上文所定义, 或者杂交序列能够与编码实施例章节表 A3 中给出的任一 氨基酸序列之直向同源物或旁系同源物的核酸的互补序列杂交。最优选杂交序列能够与 SEQ ID NO : 204 所示核酸的互补序列或其部分杂交。
优选地, 杂交序列编码具有这样的氨基酸序列的多肽, 所述氨基酸序列当全长用 于构建系统树时, ( 例如图 6 所示的系统发生树 ) 时, 与包含由 SEQ ID NO : 205 表示的氨基 酸序列的肌原纤蛋白多肽的群聚簇, 而非与其他群聚簇。
关于 PLATZ 多肽, 可用于本发明方法的杂交序列编码如本文所定义的 PLATZ 多肽, 与实施例章节表 A4 中给出的氨基酸序列具有基本上相同的生物活性。优选杂交序列能够 与实施例章节表 A4 中给出的任一核酸的互补序列杂交、 或与任一这些序列的部分杂交, 其 中部分如上文所定义, 或者杂交序列能够与编码实施例章节表 A4 中给出的任一氨基酸序 列之直向同源物或旁系同源物的核酸的互补序列杂交。 最优选杂交序列能够与 SEQ ID NO : 260 所示核酸的互补序列或其部分杂交。
优选地, 杂交序列编码具有这样的氨基酸序列的多肽, 所述氨基酸序列包含 PLATZ 结构域和一个或多个如上所定义的基序, 并且当用于构建系统树 ( 例如图 12 所示的系统发 生树 ) 时, 与包含由 SEQ ID NO : 261 表示的氨基酸序列的 PLATZ-A 多肽的群, 更优选地与 PLATZ-A1 蛋白质的群, 最优选地与 PLATZ-A1-α 蛋白质的群聚簇, 而非与其他 PLATZ 蛋白质 的群聚簇。
关于 PLST 样多肽, 可用于本发明方法的杂交序列编码如本文所定义的 PLST 样多 肽, 与实施例章节表 A5 中给出的氨基酸序列具有基本上相同的生物活性。优选杂交序列能 够与实施例章节表 A5 中给出的任一核酸的互补序列杂交、 或与任一这些序列的部分杂交, 其中部分如上文所定义, 或者杂交序列能够与编码实施例章节表 A5 中给出的任一氨基酸 序列之直向同源物或旁系同源物的核酸的互补序列杂交。最优选杂交序列能够与 SEQ ID NO : 410 所示核酸的互补序列或其部分杂交。
优选地, 杂交序列编码具有这样的氨基酸序列的多肽, 所述氨基酸序列当全长并 用于构建系统树 ( 例如图 15 所示的系统发生树 ) 时, 具有基序 1 至 12 的一个或多个和 PF 结构域, 并与包含由 SEQ ID NO : 411 表示的氨基酸序列的 PLST 样多肽的群聚簇, 而非与其 他群聚簇。
关 于 Glomalin 多 肽, 可用于本发明方法的杂交序列编码如本文所定义的 Glomalin 多肽, 与实施例章节表 A6 中给出的氨基酸序列具有基本上相同的生物活性。 优选 杂交序列能够与实施例章节表 A6 中给出的任一核酸的互补序列杂交、 或与任一这些序列 的部分杂交, 其中部分如上文所定义, 或者杂交序列能够与编码实施例章节表 A6 中给出的 任一氨基酸序列之直向同源物或旁系同源物的核酸的互补序列杂交。 最优选杂交序列能够 与 SEQ ID NO : 545 所示核酸的互补序列或其部分杂交。优选的, 杂交序列编码具有这样的 氨基酸序列的多肽, 所述氨基酸序列包含 Cpn60_TCP1 结构域 (Pfam accession PF00118), 或者当用于构建系统树时, ( 例如图 19 所示的系统发生树 ) 时, 与包含 SEQ ID NO : 546 所 示的氨基酸序列的 Glomalin 多肽的群聚簇, 而非与其他群聚簇。
可用于本发明方法中的另一种核酸变体是编码如上文所定义的 eRF1 多肽、 或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽的剪接 变体, 剪接变体如本文所定义。根据本发明, 提供用于增强植物中产量相关性状的方法, 包括在植物中引入并表达在实施例章节表 A1 至 A6 中给出的任何一种核酸序列的剪接变体, 或下述核酸的剪接变体, 其中所述的核酸编码在实施例章节表 A1 至 A6 中给出的任一氨基 酸序列之直向同源物、 旁系同源物或同源物。
关于 eRF1 多肽, 优选剪接变体是 SEQ ID NO : 1 所示核酸的剪接变体, 或编码 SEQ ID NO : 2 之直向同源物或旁系同源物的核酸的剪接变体。优选地, 由剪接变体编码的氨基 酸序列, 当用于构建系统树 ( 例如图 1 所示的系统发生树 ) 时, 与包含 SEQ ID NO : 2 所示的 氨基酸序列的 eRF1 多肽的群聚簇, 而非与其他群聚簇。
关于 SCAMP 样多肽, 优选剪接变体是 SEQ ID NO : 88 所示核酸的剪接变体, 或编码 SEQ ID NO : 89 之直向同源物或旁系同源物的核酸的剪接变体。优选地, 由剪接变体编码的 氨基酸序列包含如本文中所定义的 SCAMP 结构域。
关于肌原纤蛋白多肽, 优选剪接变体是 SEQ ID NO : 204 所示核酸的剪接变体, 或编 码 SEQ ID NO : 205 之直向同源物或旁系同源物的核酸的剪接变体。优选地, 由剪接变体编 码的氨基酸序列, 当用于构建系统树 ( 例如图 6 所示的系统发生树 ) 时, 与包含 SEQ ID NO : 205 所示的氨基酸序列的肌原纤蛋白多肽的群聚簇, 而非与其他群聚簇。
关于 PLATZ 多肽, 优选剪接变体是 SEQ ID NO : 260 所示核酸的剪接变体, 或编码 SEQ ID NO : 261 之直向同源物或旁系同源物的核酸的剪接变体。优选地, 由剪接变体编码 的氨基酸序列包含 PLATZ 结构域和一个或多个如上所定义的基序, 并且当用于构建系统树 ( 例如图 12 所示的系统发生树 ) 时, 与包含由 SEQ ID NO : 261 表示的氨基酸序列的 PLATZ-A 多肽的群, 更优选地与 PLATZ-A1 蛋白质的群, 最优选地与 PLATZ-A1-α 蛋白质的群聚簇, 而 非与其他 PLATZ 蛋白质的群聚簇。
关于 PLST 样多肽, 优选剪接变体是 SEQ ID NO : 410 所示核酸的剪接变体, 或编码 SEQ ID NO : 411 之直向同源物或旁系同源物的核酸的剪接变体。 优选地, 由剪接变体编码的 氨基酸序列, 当用于构建系统树 ( 例如图 15 所示的系统发生树 ) 时, 具有基序 19 至 30 的 一个或多个和 PF 结构域, 并与包含 SEQ ID NO : 411 所示的氨基酸序列的 PLST 样多肽的群 聚簇, 而非与其他群聚簇。
关于 Glomalin 多肽, 优选剪接变体是 SEQ ID NO : 545 所示核酸的剪接变体, 或编 码 SEQ ID NO : 546 之直向同源物或旁系同源物的核酸的剪接变体。 优选地, 由剪接变体编码 的氨基酸序列包含 Cpn60_TCP1 结构域 (Pfam accession PF00118), 或者当用于构建系统树 ( 例如图 19 所示的系统发生树 ) 时, 与包含 SEQ ID NO : 546 所示的氨基酸序列的 Glomalin 多肽的群聚簇, 而非与其他群聚簇。
可用于本发明方法中的另一种核酸变体是编码如上文所定义的 eRF1 多肽、 或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽的核酸 的等位变体, 等位变体如本文所定义。
根据本发明, 提供用于增强植物中产量相关性状的方法, 包括在植物中引入并表 达在实施例章节表 A1 至 A6 中给出的任何一种核酸的等位变体, 或包括在植物中引入并表 达下述核酸的等位变体, 其中所述的核酸编码在实施例章节表 A1 至 A6 中给出的任一氨基 酸序列之直向同源物、 旁系同源物或同源物。
关于 eRF1 多肽, 可用于本发明方法的等位变体编码的多肽与 SEQ IDNO : 2 的 eRF1 样多肽及实施例章节表 A1 中所示任一氨基酸具有基本上相同的生物活性。等位变体天然存在, 并且这些天然等位基因的使用包含于本发明的方法中。优选地, 等位变体为 SEQ ID NO : 1 的等位变体, 或编码 SEQ ID NO : 2 之直向同源物或旁系同源物的核酸的等位变体。优 选地, 由等位变体编码的氨基酸序列, 当用于构建系统树 ( 例如图 1 所示的系统发生树 ) 时, 与包含 SEQ ID NO : 2 所示的氨基酸序列的 eRF1 多肽的群聚簇, 而非与其他群聚簇。
关于 SCAMP 样多肽, 可用于本发明方法的等位变体编码的多肽与 SEQ ID NO : 89 的 SCAMP 样多肽及实施例章节表 A2 中所示任一氨基酸具有基本上相同的生物活性。 等位变体 天然存在, 并且这些天然等位基因的使用包含于本发明的方法中。优选地, 等位变体为 SEQ ID NO : 88 的等位变体, 或编码 SEQ ID NO : 89 之直向同源物或旁系同源物的核酸的等位变 体。优选地, 由等位变体编码的氨基酸序列包含如本文中所定义的 SCAMP 结构域。
关于肌原纤蛋白多肽, 可用于本发明方法的等位变体编码的多肽与 SEQ ID NO : 205 的肌原纤蛋白多肽及实施例章节表 A3 中所示任一氨基酸具有基本上相同的生物活性。 等位变体天然存在, 并且这些天然等位基因的使用包含于本发明的方法中。 优选地, 等位变 体为 SEQ ID NO : 204 的等位变体, 或编码 SEQ ID NO : 205 之直向同源物或旁系同源物的核 酸的等位变体。优选地, 由等位变体编码的氨基酸序列, 当用于构建系统树 ( 例如图 6 所示 的系统发生树 ) 时, 与包含 SEQ ID NO : 205 所示的氨基酸序列的肌原纤蛋白多肽聚簇, 而非 与其他群聚簇。
关于 PLATZ 多肽, 可用于本发明方法的等位变体编码的多肽与 SEQID NO : 261 的 PLATZ 多肽及实施例章节表 A4 中所示任一氨基酸具有基本上相同的生物活性。等位变体 天然存在, 并且这些天然等位基因的使用包含于本发明的方法中。优选地, 等位变体为 SEQ ID NO : 260 的等位变体, 或编码 SEQ ID NO : 261 之直向同源物或旁系同源物的核酸的等位 变体。优选地, 由等位变体编码的氨基酸序列包含 PLATZ 结构域和一个或多个如上所定义 的基序, 并且当用于构建系统树 ( 例如图 12 所示的系统发生树 ) 时, 与包含由 SEQ ID NO : 261 表示的氨基酸序列的 PLATZ-A 多肽的群, 更优选地与 PLATZ-A1 蛋白质的群, 最优选地与 PLATZ-A1-α 蛋白质的群聚簇, 而非与其他 PLATZ 蛋白质的群聚簇。
关于 PLST 样多肽, 可用于本发明方法的等位变体编码的多肽与 SEQID NO : 411 的 PLST 样多肽及实施例章节表 A5 中所示任一氨基酸具有基本上相同的生物活性。等位变体 天然存在, 并且这些天然等位基因的使用包含于本发明的方法中。优选地, 等位变体为 SEQ ID NO : 410 的等位变体, 或编码 SEQ ID NO : 411 之直向同源物或旁系同源物的核酸的等位 变体。优选地, 由等位变体编码的氨基酸序列, 当用于构建系统树 ( 例如图 14 所示的系统 发生树 ) 时, 具有基序 19 至 30 的一个或多个和 PF 结构域, 并与包含 SEQ ID NO : 411 所示 的氨基酸序列的 PLST 样多肽聚簇, 而非与其他群聚簇。
关于 Glomalin 多肽, 可用于本发明方法的等位变体编码的多肽与 SEQID NO : 546 的 Glomalin 多肽及实施例章节表 A6 中所示任一氨基酸具有基本上相同的生物活性。等位 变体天然存在, 并且这些天然等位基因的使用包含于本发明的方法中。 优选地, 等位变体为 SEQ ID NO : 545 的等位变体, 或编码 SEQ ID NO : 546 之直向同源物或旁系同源物的核酸的等 位变体。优选地, 由等位变体编码的氨基酸序列包含 Cpn60_TCP1 结构域 (Pfam accession PF00118), 或者当用于构建系统树 ( 例如图 19 所示的系统发生树 ) 时, 与包含 SEQ ID NO : 546 所示的氨基酸序列的 Glomalin 多肽的群聚簇, 而非与其他群聚簇。
基因改组或定向进化也可用于产生上文所定义的 eRF1 多肽、 或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽的编码核酸的变体 ; 其中 术语 “基因改组” 如本文所定义。
根据本发明, 提供了在植物中增强产量相关性状的方法, 包括在植物中引入和表 达实施例章节表 A1 至 A6 中给出的任一核酸序列的变体, 或者包括在植物中引入和表达编 码实施例章节表 A1 至 A6 中给出的任一氨基酸序列之直向同源物、 旁系同源物或同源物的 核酸的变体, 其中所述变体核酸通过基因改组获得。
关于 eRF1 多肽, 优选通过基因改组获得的变体核酸编码下述氨基酸序列, 所述氨 基酸序列当用于构建系统树 ( 例如图 1 所示的系统发生树 ) 时, 与包含 SEQ ID NO : 2 所示 的氨基酸序列的 eRF1 多肽的群聚簇, 而非与其他群聚簇。
关于 SCAMP 样多肽, 优选通过基因改组获得的变体核酸编码下述氨基酸序列, 所 述氨基酸序列包含如本文中所定义的 SCAMP 结构域。
关于肌原纤蛋白多肽, 优选通过基因改组获得的变体核酸编码下述氨基酸序列, 所述氨基酸序列当用于构建系统树 ( 例如图 6 所示的系统发生树 ) 时, 与包含 SEQ ID NO : 205 所示的氨基酸序列的肌原纤蛋白多肽的群聚簇, 而非与其他群聚簇。
关于 PLATZ 多肽, 优选通过基因改组获得的变体核酸编码下述氨基酸序列, 所述 氨基酸序列包含 PLATZ 结构域和一个或多个如上所定义的基序, 并且当用于构建系统树 ( 例如图 12 所示的系统发生树 ) 时, 与包含由 SEQ ID NO : 261 表示的氨基酸序列的 PLATZ-A 多肽的群, 更优选地与 PLATZ-A1 蛋白质的群, 最优选地与 PLATZ-A1-α 蛋白质的群聚簇, 而 非与其他 PLATZ 蛋白质的群聚簇。
关于 PLST 样多肽, 优选通过基因改组获得的变体核酸编码下述氨基酸序列, 所述 氨基酸序列当用于构建系统树 ( 例如图 15 所示的系统发生树 ) 时, 与包含 SEQ ID NO : 411 所示的氨基酸序列的 PLST 样多肽的群聚簇, 而非与其他群聚簇。
关于 Glomalin 多肽, 优选通过基因改组获得的变体核酸编码下述氨基酸序列, 所 述氨基酸序列包含 Cpn60_TCP1 结构域 (Pfam accession PF00118), 或者当用于构建系统树 ( 例如图 19 所示的系统发生树 ) 时, 与包含 SEQ ID NO : 546 所示的氨基酸序列的 Glomalin 多肽的群聚簇, 而非与其他群聚簇。
此外, 还可利用定点诱变获得核酸变体。 若干方法可用来实现定点诱变, 最常见的 是基于 PCR 的方法 (Current Protocols in Molecular Biology.Wiley 编辑 )。
编码 eRF1 多肽的核酸可以来自任何天然或人工来源。可以通过有目的的人工操 作对其进行修饰, 使之不同于其在组合物和 / 或基因组环境中的天然形式。优选 eRF1 多肽 编码核酸来自植物, 还优选来自单子叶植物, 更优选来自禾本科, 最优选该核酸来自稻。
编码 SCAMP 样多肽的核酸可以来自任何天然或人工来源。可以通过有目的的人工 操作对其进行修饰, 使之不同于其在组合物和 / 或基因组环境中的天然形式。优选 SCAMP 样多肽编码核酸来自植物, 还优选来自双子叶植物, 更优选来自十字花科, 最优选该核酸来 自拟南芥。
可以将任一前述肌原纤蛋白多肽序列靶向质体。优选的质体是叶绿体。用于靶向 质体的方法是本领域众所周知的, 并且包括但不限于使用转运肽。下表 3 显示了适合用于 任一肌原纤蛋白多肽靶向质体的转运肽的实例。 肌原纤蛋白多肽可以不以其天然形式靶向 质体或者可以靶向不同的质体。此外, 肌原纤蛋白可以通过不同的转运肽 ( 例如, 其天然转运肽 ) 以其天然形式靶向质体。
表3: 用于靶向氨基酸到质体的转运肽序列的实例
编码肌原纤蛋白多肽的核酸可以来自任何天然或人工来源。 可以通过有目的的人 工操作对其进行修饰, 使之不同于其在组合物和 / 或基因组环境中的天然形式。优选肌原 纤蛋白多肽编码核酸来自植物, 还优选来自双子叶植物, 更优选来自茄科 (Solanaceae), 另 外优选地, 该核酸来自番茄属 (Lycopersicon), 还优选地来自番茄属物种, 最优选核酸来自 番茄。
编码 PLATZ 多肽的核酸可以来自任何天然或人工来源。可以通过有目的的人工操 作对其进行修饰, 使之不同于其在组合物和 / 或基因组环境中的天然形式。优选 PLATZ 多 肽编码核酸来自植物, 还优选来自双子叶植物, 更优选来自杨柳科 (Salicaceae), 最优选核 酸来自杨属物种 (Populus sp)。
编码 PLST 样多肽的核酸可以来自任何天然或人工来源。可以通过有目的的人工 操作对其进行修饰, 使之不同于其在组合物和 / 或基因组环境中的天然形式。优选 PLST 样 多肽编码核酸来自植物, 还优选来自双子叶植物, 更优选来自杨柳科, 最优选核酸来自毛果 杨 (Populus trichocarpa)。
编码 Glomalin 多肽的核酸可以来自任何天然或人工来源。可以通过有目的的 人工操作对其进行修饰, 使之不同于其在组合物和 / 或基因组环境中的天然形式。优选 Glomalin 多肽编码核酸来自植物, 还优选来自单子叶植物, 更优选来自禾本科, 最优选核酸
来自稻。 本发明方法的实施产生具有增强的产量相关性状的植物。 尤其本发明方法的实施 产生相对于对照植物而具有增加的产量、 尤其增加的种子产量的植物。在本文中的 “定义” 部分中更详细地描述了术语 “产量” 和 “种子产量” 。
在本文中对增强的产量相关性状的提及意指植物的一个或多个部分的生物量 ( 重量 ) 增加, 所述的部分可以包括地上 ( 可收获 ) 部分和 / 或地下 ( 可收获 ) 部分。 尤其, 此类可收获部分是生物量和 / 或种子, 并且本发明方法的实施产生相对于对照植物的种子 产量而具有增加的生物量和 / 或增加的种子产量的植物。
以玉米为例, 产量增加可以表现为下列一种或多种指标 : 每平方米中已建立植物 数的增加、 每株植物穗数的增加、 行数、 每行粒数、 粒重、 千粒重、 穗长度 / 直径的增加、 种子 饱满率的增加 ( 其中种子饱满率是饱满种子数除以种子总数并乘以 100 的值 ) 及其它。
以稻为例, 产量增加本身可以表现为下列一种或多种指标的增加 : 每平方米植物 数、 每株植物穗数、 每穗小穗数、 每穗花 ( 小花 ) 数 ( 其表示为饱满种子数与原穗数的比 率 )、 种子饱满率的增加 ( 其中种子饱满率是饱满种子数除以种子总数并乘以 100 的值 )、 千粒重的增加及其它。
本发明提供了增加植物相对于对照植物的产量、 特别是生物量和 / 或种子产量的 方法, 所述方法包括调节植物和 / 或植物质体中如本文所定义的 eRF1 多肽、 或 SCAMP 样多 肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽的编码核酸的表 达。
由于本发明的转基因植物具有增加的产量特性和 / 或产量, 因而相对于对照植物 的生长速率, 这些植物有可能在其生活周期中的对应阶段上表现增加的生长速率 ( 在其生 活周期的至少部分期间 )。
增加的生长速率可以对于植物的一个或多个部分 ( 包括种子 ) 是特异性的, 或可 以基本上遍及整株植物。具有增加的生长速率的植物可以具备较短的生活周期。植物的生 活周期可以视为意指从干燥成熟种子成长至植物已经产生与起始材料相似的干燥成熟种 子的阶段所需要的时间。这个生活周期可以受下列因素影响, 如发芽的速度、 早期萌发势、 生长速率、 绿度指数、 开花时间和种子成熟速度。 生长速率的增加可以在植物生活周期之一 或多个阶段上或在基本上整个植物生活周期期间发生。 在植物生活周期中的早期期间增加 的生长速率可以反映增强的萌发势。生长速率的增加可以改变植物的收获周期, 允许植物 较晚播种和 / 或较早收获, 否则这将不可能 ( 相似的作用可以用较早的开花时间获得 )。 若 生长速率充分地增加, 可以允许再播种相同植物物种的种子 ( 例如播种并收获稻植物, 随 后播种并收获其它稻植物, 全部均在一个常规生长时段内 )。类似地, 若生长速率足够地增 加, 可以允许再播种不同植物物种的种子 ( 例如播种并收获玉米植物, 随后例如任选播种 并收获大豆、 马铃薯或任何其它合适植物 )。 从相同的根茎中收获额外次数在一些作物植物 的情况中也是可能的。改变植物的收获周期可以导致每平方米的年生物量产量的增加 ( 因 任何特定植物可以生长并收获的次数 ( 如在一年中 ) 增加 )。生长速率的增加也可以允许 比其野生型对应物而言在更广泛的地理区域内培育转基因植物, 因为对培育作物的区域限 制往往由栽种时节 ( 早季 ) 或在收获时期 ( 晚季 ) 的不利环境条件所决定。若缩短收获周 期, 则可以避开这类不利条件。 生长速率可以通过从生长曲线中得到多种参数而确定, 此类
参数可以是 : T-Mid( 植物达到其 50%最大尺寸所花费的时间 ) 和 T-90( 植物达到其 90% 最大尺寸所花费的时间 ), 等等。
根据本发明的优选特征, 本发明方法的实施产生相对于对照植物而具有增加的生 长速率的植物。 因而根据本发明, 提供增加植物生长速率的方法, 所述方法包括调节如本文 中所定义的编码 eRF1 多肽的核酸在植物中的表达。
与对照植物相比, 无论植物处于非胁迫条件下还是植物暴露于多种胁迫下, 都发 生产量和 / 或生长速率的增加。植物一般通过生长得更慢而对暴露于胁迫作出应答。在 严重胁迫条件下, 植物甚至可以完全停止生长。另一方面, 轻微胁迫在本文中定义为植物 暴露于其的任何胁迫, 其中所述的胁迫未导致植物完全停止生长而没有恢复生长的能力。 与非胁迫条件下的对照植物相比, 轻微胁迫在本发明意义中导致受胁迫植物生长降低小于 40%、 35%、 30%或 25%, 更优选小于 20%或 15%。由于农业实践 ( 灌溉、 施肥、 杀虫剂处 理 ) 上的进步, 在栽培作物植物中并不经常遇到严重胁迫。因此, 由轻微胁迫诱导的受损生 长往往是农业上不希望的特征。轻微胁迫是植物暴露的常见生物性和 / 或非生物性 ( 环 境 ) 胁迫。非生物胁迫可以因干旱或水涝、 厌氧胁迫、 盐胁迫、 化学毒性、 氧化胁迫和热、 寒 冷或冰冻温度所致。非生物胁迫可以是由水胁迫 ( 尤其因为干旱 )、 盐胁迫、 氧化胁迫或离 子胁迫引起的渗透胁迫。生物胁迫一般是由病原体如细菌、 病毒、 真菌、 线虫和昆虫引起的 那些胁迫。如本文中所用的术语 “非胁迫” 条件是允许植物最佳生长的环境条件。本领域 技术人员清楚对于给定地点的正常土壤条件和气候条件。如本文中所用的术语非胁迫, 包 括如本文中所定义, 植物暴露的偶尔或每天的轻微胁迫, 但是不包括严重胁迫。
尤其, 本发明的方法可以在非胁迫条件下或者轻微干旱的条件下实施以产生相对 于对照植物而言具有增加的产量特性的植物。如在 Wang 等 (Planta(2003)218 : 1-14) 中报 道, 非生物胁迫导致不利地影响植物生长及生产力的一系列形态学变化、 生理学变化、 生物 化学变化和分子变化。 已知干旱、 盐浓度、 极端温度和氧化胁迫是相互联系的并可以通过相 似机制而诱导生长损害及细胞损害。 Rabbani 等 (Plant Physiol(2003)133 : 1755-1767) 描 述了干旱胁迫与高盐度胁迫间极高程度的 “交叉对话 (cross talk)” 。例如, 干旱和 / 或盐 化作用主要表现为渗透胁迫, 导致细胞内稳态和离子分布的破坏。 经常伴随高温或低温、 盐 浓度或干旱胁迫的氧化胁迫可以造成功能性蛋白和结构蛋白变性。因此, 这些多样的环境 胁迫常常激活相似的细胞信号途径和细胞应答, 如产生胁迫蛋白质、 上调抗氧化物质、 积累 相容性溶质和生长抑制。如本文中所用的术语 “非胁迫” 条件是允许植物最佳生长的环境 条件。本领域技术人员清楚对于给定地点的正常土壤条件和气候条件。最佳生长下生长的 植物 ( 在非胁迫条件下生长 ) 一般出产以递增优选顺序至少 97%、 95%、 92%、 90%、 87%、 85%、 83%、 80%、 77%或 75%的给定环境下这样植物的平均生产。平均生产可以收获和 / 或季节为基础进行计算。本领域技术人员清楚作物的平均产量生产。
实施本发明方法产生在非胁迫条件下或者轻微干旱的条件下相对于在相当条件 下培育的对照植物而言具有增加的产量特性和 / 或产量的植物。因此, 根据本发明, 提供了 增加在非胁迫条件下或者轻微干旱的条件下培育的植物的产量的方法, 所述方法包括在植 物中和 / 或植物质体中调节编码 eRF1 多肽、 或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽的核酸的表达。
实施本发明方法产生在营养缺乏条件下, 特别是氮缺乏条件下相对于在相当条件下培育的对照植物而言具有增加的产量特性的植物。因此, 根据本发明, 提供了增加在 营养缺乏条件件下培育的植物的产量的方法, 该方法包括在植物中调节编码 eRF1 多肽、 或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLST 样多肽、 或 Glomalin 多肽的核酸的表达。 营养缺 乏可以由营养物 ( 例如氮、 磷和其它含磷化合物、 钾、 钙、 镁、 锰、 铁或者硼以及其它 ) 缺少引 起。
对于 PLATZ 多肽, 实施本发明方法产生在营养缺乏条件下, 特别是氮缺乏条件下 相对于在相当条件下培育的对照植物而言具有增加的产量的植物。 由于养分利用效率对植 物产量和产品质量有显著影响, 因此在田间倾倒了大量肥料来优化植物生长和质量。植物 的生产力一般受限于三种主要养分 : 磷、 钾和氮, 在植物生长的这三者中, 氮通常是植物生 长的限速元素。 因此, 植物生长所需的主要营养元素是氮 (N)。 这是可见于活细胞中的多种 重要化合物的组分, 所述化合物包括氨基酸、 蛋白质 ( 酶 )、 核酸和叶绿素。植物干物质的 1.5%至 2%以及总植物蛋白质的约 16%是氮。因此, 氮的利用度是作物植物生长和生产的 主要限制因素 (Frink 等 (1999)Proc Natl Acad Sci USA 96(4) : 1175-1180), 并也对蛋白 质积累和氨基酸组成有重大影响。因此, 在氮有限条件下培养时具有增加的产量相关性状 的作物植物是很有意义的。 因此, 根据本发明, 提供了增加在营养缺乏条件下培育的植物的 产量的方法, 该方法包括在植物中调节编码 PLATZ 多肽的核酸的表达。营养缺乏可以由营 养物 ( 例如氮、 磷和其它含磷化合物、 钾、 钙、 镁、 锰、 铁或者硼以及其它 ) 缺少引起。
实施本发明方法产生在盐胁迫下相对于在相当条件下培育的对照植物而言具有 增加的产量特性的植物。因此, 根据本发明, 提供了增加在盐胁迫条件下培育的植物的产 量的方法, 该方法包括在植物中调节编码 eRF1 多肽、 或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽的核酸的表达。术语盐胁迫不限于常见盐 (NaCl), 而是可以为由以下一种或多种引起的任何胁迫 : NaCl、 KCl、 LiCl、 MgCl2、 CaCl2 等。
本发明包括可由根据本发明的方法获得的植物或其部分 ( 包括种子 )。所述植 物或其部分包含编码如上文所定义的 eRF1 多肽、 或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽的核酸转基因。
本发明还提供遗传构建体和载体, 以利于在植物中引入和 / 或表达编码 eRF1 多 肽、 或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽 的核酸。 可以将遗传构建体插入适于转化进入植物并适于在转化的细胞中表达目的基因的 载体中, 该载体可以是可商购的载体。本发明还提供了如本文所定义的遗传构建体在本发 明方法中的用途。
更具体地, 本发明提供这样的构建体, 其含有 :
(a) 编码如上文所定义的 eRF1 多肽、 或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽的核酸 ;
(b) 一个或多个能够驱动 (a) 中核酸序列表达的控制序列 ; 和任选的
(c) 转录终止序列。
优选地, 编码 eRF1 多肽、 或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽的核酸是如上文所定义的。术语 “控制序列” 和 “终止序列” 是如本文所定义的。
可以使用含有任何上述核酸的载体转化植物。 技术人员充分知晓载体中必须存在的遗传元件, 以便成功进行转化、 选择并繁殖含目的序列的宿主细胞。 将目的序列有效连接 于一个或多个控制序列 ( 至少连接于启动子 )。
有利地, 任何类型的启动子, 不论天然的或合成的, 均可用于驱动核酸序列的表 达, 但是优选启动子是植物来源的。组成型启动子在方法中是特别有用的。优选组成型启 动子也是中等强度的遍在组成型启动子。多种启动子类型的定义参见本文的 “定义” 部分。 对于 eRF1 多肽和 / 或 PLST 样多肽, 也在本发明中有用的是根特异性启动子。
对于 Glomalin 多肽, 有利地, 任何类型的启动子, 不论天然的或合成的, 均可用于 驱动核酸序列的表达, 但是优选启动子是植物来源的。多种启动子类型的定义参见本文的 “定义” 部分。根特异性启动子在方法中是特别有用的。优选根特异性启动子是 RCc3 启动 子 (Plant Mol Biol.1995 年 1 月 ; 27(2) : 237-48), 更优选 RCc3 启动子来自稻, 还优选 RCc3 启动子是由与 SEQ ID NO : 611 基本相似的核酸序列所表示的, 最优选组成型启动子如 SEQ ID NO : 611 所示。也可以用于执行本发明方法的其他根特异性启动子的实例见如上 “定义” 部分表 2b 中所示。
组成型启动子在本发明方法中也是有用的 ; 优选组成型启动子也是中等强度的遍 在组成型启动子, 例如 GOS2 启动子, 更优选来自稻的 GOS2 启动子。还优选组成型启动子是 由与 SEQ ID NO : 612 基本相似的核酸序列所表示的, 最优选组成型启动子如 SEQ ID NO : 612 所示。组成型启动子的其它实例见本文 “定义” 部分。
关于 eRF1 多肽, 应该明白, 本发明的适用范围不限于 SEQ ID NO : 1 所示 eRF1 多肽 的编码核酸, 本发明的适用范围也不限于由组成型启动子驱动时或者由根特异性启动子驱 动时编码 eRF1 多肽的核酸的表达。
组成型启动子优选是中等强度的启动子, 更优选的选自植物来源的启动子, 例如 GOS2 启动子, 更优选来自稻的 GOS2 启动子。还优选组成型启动子是由与 SEQ ID NO : 85 基 本相似的核酸序列所表示的, 最优选组成型启动子如 SEQ ID NO : 85 所示。 组成型启动子的 其它实例见本文 “定义” 部分。
任选地, 可在引入植物的构建体中使用一个或多个终止子序列。 优选的, 构建体包 括包含 GOS2 启动子 ( 与 SEQ ID NO : 85 基本相似 ) 和编码 eRF1 多肽的核酸的表达盒。
关于 SCAMP 样多肽, 应该明白, 本发明的适用范围不限于 SEQ IDNO : 88 所示 SCAMP 样多肽的编码核酸, 本发明的适用范围也不限于由组成型启动子驱动时编码 SCAMP 样多肽 的核酸的表达。
组成型启动子优选是中等强度的启动子, 更优选的选自植物来源的启动子, 例如 GOS2 启动子, 更优选来自稻的 GOS2 启动子。 还优选组成型启动子是由与 SEQ ID NO : 203 基 本相似的核酸序列所表示的, 最优选组成型启动子如 SEQ ID NO : 203 所示。组成型启动子 的其它实例见本文 “定义” 部分。
任选地, 可在引入植物的构建体中使用一个或多个终止子序列。 优选的, 构建体包 括包含 GOS2 启动子 ( 与 SEQ ID NO : 203 基本相似 ) 和编码 SCAMP 样多肽的核酸的表达盒。
关于肌原纤蛋白多肽, 应该明白, 本发明的适用范围不限于 SEQ IDNO : 204 所示肌 原纤蛋白多肽的编码核酸, 本发明的适用范围也不限于由组成型启动子驱动时编码肌原纤 蛋白多肽的核酸的表达。
组成型启动子优选是中等强度的启动子, 更优选的选自植物来源的启动子, 例如GOS2 启动子, 更优选来自稻的 GOS2 启动子。 还优选组成型启动子是由与 SEQ ID NO : 257 基 本相似的核酸序列所表示的, 最优选组成型启动子如 SEQ ID NO : 257 所示。组成型启动子 的其它实例见本文 “定义” 部分。
任选地, 可在引入植物的构建体中使用一个或多个终止子序列。 优选的, 构建体包 括包含 GOS2 启动子 ( 与 SEQ ID NO : 257 基本相似 ) 和编码肌原纤蛋白多肽的核酸的表达 盒。
关于 PLATZ 多肽, 应该明白, 本发明的适用范围不限于 SEQ ID NO : 260 所示 PLATZ 多肽的编码核酸, 本发明的适用范围也不限于由组成型启动子驱动时编码 PLATZ 多肽的核 酸的表达。
组成型启动子优选选自植物来源的启动子, 例如 GOS2 启动子, 更优选来自稻的 GOS2 启动子。还优选组成型启动子是由与 SEQ ID NO : 273 基本相似的核酸序列所表示的, 最优选组成型启动子如 SEQ ID NO : 273 所示。组成型启动子的其它实例见本文 “定义” 部 分。
任选地, 可在引入植物的构建体中使用一个或多个终止子序列。 优选的, 构建体包 括包含 GOS2 启动子 ( 与 SEQ ID NO : 273 基本相似 ) 和编码 PLATZ 多肽的核酸的表达盒。
关于 PLST 样多肽, 应该明白, 本发明的适用范围不限于 SEQ ID NO : 410 所示 PLST 样多肽的编码核酸, 本发明的适用范围也不限于由组成型启动子驱动时编码 PLST 样多肽 的核酸的表达。
组成型启动子优选是中等强度的启动子, 更优选的选自植物来源的启动子, 例如 GOS2 启动子, 更优选来自稻的 GOS2 启动子。 还优选组成型启动子是由与 SEQ ID NO : 542 基 本相似的核酸序列所表示的, 最优选组成型启动子如 SEQ ID NO : 542 所示。组成型启动子 的其它实例见本文 “定义” 部分。
任选地, 可在引入植物的构建体中使用一个或多个终止子序列。 优选的, 构建体包 括包含 GOS2 启动子 ( 与 SEQ ID NO : 542 基本相似 ) 和编码 PLST 样多肽的核酸的表达盒。
关于 Glomalin 多肽, 应该明白, 本发明的适用范围不限于 SEQ ID NO : 545 所示 Glomalin 多肽的编码核酸, 本发明的适用范围也不限于由根特异性启动子驱动时或者由组 成型启动子驱动时编码 Glomalin 多肽的核酸的表达。
任选地, 可在引入植物的构建体中使用一个或多个终止子序列。 优选的, 构建体包 括包含 RCc3 启动子 ( 与 SEQ ID NO : 611 基本相似 ) 和编码 Glomalin 多肽的核酸的表达 盒。
根据本发明优选的特征, 调节的表达是增加的表达。在本领域内详细记载了用于 增加核酸或基因或者基因产物表达的方法, 并且在定义部分提供了实例。
其它调节元件可包括转录及翻译增强子。 本领域技术人员会了解适于在实施本发 明中使用的终止子和增强子序列。如在定义部分所述, 也可将内含子序列添加至 5′非翻 译区 (UTR) 或编码序列上, 以增加在细胞质内积累的成熟信息的量。其它控制序列 ( 除启 动子、 增强子、 沉默子、 内含子序列、 3’ UTR 和 / 或 5’ UTR 区之外 ) 可以是蛋白质和 / 或 RNA 稳定元件。本领域技术人员会知道或可以容易地获得此类序列。
本发明的遗传构建体还可以包括在特定细胞类型中维持和 / 或复制需要的复制 起点序列。一个例子是当需要将遗传构建体在细菌细胞中作为附加型遗传元件 ( 例如质粒或粘粒分子 ) 维持时。优选的复制起点包括但不限于 f1-ori 和 colE1。
为检测如在本发明方法中所用核酸序列的成功转移和 / 或选择包含这些核酸序 列的转基因植物, 使用标记基因 ( 或报告基因 ) 是有利的。因而, 遗传构建体可以任选地包 含可选择标记基因。可选择标记在本文 “定义” 部分中有更详细的描述。一旦不再需要, 可 以从转基因细胞中去除或切除标记基因。用于标记基因去除的技术是本领域已知的, 有用 的技术在上文 “定义” 部分中描述。
本发明还提供产生与对照植物相比具有增强的产量相关性状的转基因植物的方 法, 其包括在植物和 / 或植物质体中引入和表达编码上文所定义的 eRF1 多肽、 或 SCAMP 样 多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽的任何核酸。
更具体地, 本发明提供了产生具有增强的产量相关性状 ( 特别是增加的种子产量 以及生物量 ) 的转基因植物的方法, 所述方法包括 :
(i) 向植物或植物细胞中引入和表达 eRF1 多肽、 或 SCAMP 样多肽、 或肌原纤蛋白多 肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽的编码核酸 ; 和
(ii) 在促进植物生长和发育的条件下培养植物细胞。
(i) 的核酸可以是任何能编码如本文所定义的 eRF1 多肽、 或 SCAMP 样多肽、 或肌原 纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽的核酸。
可以将核酸直接引入植物细胞或植物本身 ( 包括引入植物的组织、 器官或任何其 它部分 )。根据本发明优选的特征, 优选通过转化将核酸引入植物。术语 “转化” 在本文 “定 义” 部分有更详细的说明。
遗传修饰的植物细胞能够通过技术人员熟悉的所有方法再生。 合适的方法可见于 上述 S.D.Kung 和 R.Wu、 Potrykus 或者
和 Willmitzer 的出版物。通常在转化以后, 选出存在一个或多个标记的植物细胞或细胞群, 所述标记由与 目的基因共转移的植物可表达基因编码, 继之将转化的材料再生成整个植物。为选择转化 的植物, 通常将在转化过程中获得的植物材料置于选择性条件下, 从而可将转化的植物与 非转化植物区分开来。例如, 可以种植以上述方式获得的种子, 并在最初的生长期之后, 通 过喷雾对其进行合适的选择。另一可能方案是使用合适的选择剂, 将种子 ( 适当时在灭菌 之后 ) 种在含有合适选择剂琼脂板上, 从而仅转化的种子能够长成植物。备选地, 针对转化 的植物筛选可选择标记 ( 如上文所述标记 ) 的存在。
DNA 转移和再生之后, 还可评价推定转化的植物, 例如用 Southern 分析, 评价目的 基因的存在、 拷贝数和 / 或基因组构造。备选地或另外地, 可用 Northern 和 / 或 Western 分析监测新引入的 DNA 的表达水平, 这两种技术都是本领域普通技术人员所熟知的。
产生的转化植物可以通过多种方式繁殖, 如通过克隆繁殖或经典的育种技术。例 如, 第一代 ( 或 T1) 转化的植物可自交, 选择纯合的第二代 ( 或 T2) 转化体, 而 T2 植物可进 一步通过经典育种技术繁殖。产生的转化生物体可以有多种形式。例如, 它们可以是转化 细胞和非转化细胞的嵌合体 ; 克隆的转化体 ( 例如所有细胞经转化含有表达盒 ) ; 转化和非 转化组织的嫁接体 ( 例如在植物中, 转化的根状茎嫁接到非转化的接穗上 )。
本发明显然延及由本文所述任何方法产生的任何植物细胞或植物, 以及所有的植 物部分及其繁殖体。 本发明还延及由任何上述方法产生的原代转化或转染的细胞、 组织、 器 官或整个植物的后代, 唯一的要求是所述后代呈现出与在本发明方法中亲本产生的基因型和 / 或表型特征相同的基因型和 / 或表型特征。
本发明也包括含有分离的编码如上文所定义的 eRF1 多肽、 或 SCAMP 样多肽、 或肌 原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽的核酸的宿主细胞。根据 本发明优选的宿主细胞是植物细胞。对于用于本发明方法的核酸或载体、 表达盒或构建体 或载体, 其宿主植物原则上有利地为能够合成在本发明方法中使用的多肽的所有植物。
本发明方法有利地适用于任何植物。 特别用于本发明方法中的植物包括属于植物 界超家族的全部植物, 尤其是单子叶植物和双子叶植物, 包括饲用或饲料豆类、 观赏植物、 粮食作物、 树或灌木。根据本发明优选的实施方案, 植物是作物植物。作物植物的例子包 括大豆、 向日葵、 芸苔、 苜蓿、 油菜 (rapeseed)、 亚麻子、 棉花、 番茄、 马铃薯和烟草。还优选 地, 植物是单子叶植物。单子叶植物的例子包括甘蔗。更优选地, 植物是谷物。谷物的例子 包括稻、 玉米、 小麦、 大麦、 粟、 黑麦、 黑小麦、 高粱、 野小麦 (emmer)、 德国小麦 (spelt)、 黑麦 属、 一粒系小麦 (einkorn)、 teff、 蜀黍 (milo) 和燕麦。
本发明也延及植物的可收获部分, 该植物可收获部分包含编码 eRF1 多肽、 或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽的重组 核酸, 这样的可收获部分包括, 但不限于种子、 叶、 果实、 花、 茎、 根、 根茎、 块茎和鳞茎。本发 明进一步涉及来自、 优选直接来自该植物的可收获部分的产物, 如干燥颗粒或粉末、 油、 脂 肪及脂肪酸、 淀粉或蛋白质。
根据本发明优选的特征, 调节的表达是增加的表达。在本领域内详细记载了用于 增加核酸或基因或者基因产物表达的方法, 并且在定义部分提供了实例。
如上所述, 用于调节编码 eRF1 多肽、 或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽的核酸表达的优选方法是通过在植物中引入并表 达编码 eRF1 多肽、 或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽的核酸 ; 然而实施该方法的效果 ( 也就是增强产量相关性状 ) 也可使用其它 已知技术来实现, 包括但不限于 T-DNA 激活标签、 TILLING、 同源重组。在定义部分提供了这 些技术的描述。
本发明也包括编码如本文中所述的 eRF1 多肽、 或 SCAMP 样多肽、 或肌原纤蛋白多 肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽的核酸的用途和这些 eRF1 多肽、 或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽的用途, 用于增强植物中的任何前述的产量相关性状。
编码本文中所述 eRF1 多肽、 或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽的核酸、 或者 eRF1 多肽、 或 SCAMP 样多肽、 或肌原纤蛋白 多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽本身可以用于育种程序中, 其中鉴定 到可以与 eRF1 多肽、 或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽编码基因遗传连锁的 DNA 标记。所述核酸 / 基因或 eRF1 多肽、 或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽本身可以用来 定义分子标记。这种 DNA 或蛋白质标记随后可以在育种程序中用来选择具有本发明方法中 如上文所定义的增强的产量相关性状的植物。
编码 eRF1 多肽、 或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多 肽、 或 Glomalin 多肽的基因 / 核酸的等位变体也可以用于标记辅助的育种程序中。这种育种程序有时需要通过使用例如 EMS 诱变法对植物作诱变处理而引入等位基因变异 ; 备选 地, 该程序可以从非故意引起的所谓 “自然” 起源的等位变体集合开始。随后进行等位变体 的鉴定, 例如通过 PCR 法。此后是用于选择所讨论序列的优选等位变体且其导致增加的产 量性状的步骤。 一般通过监测含有所讨论序列的不同等位变体的植物的生长性能而实施选 择。可以在温室中或田间监测生长性能。其它任选步骤包括将鉴定到有优选等位变体的植 物与另一种植物杂交。这可以用来例如产生目标表型特征的组合。
编码 eRF1 多肽、 或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样 多肽、 或 Glomalin 多肽的核酸序列也可以用作探针以便对基因进行遗传作图和物理作图, 所述探针作为所述基因的一部分, 及用作与那些基因关联的性状的标记。此类信息可以用 于植物育种中, 以便开发具有想要表型的株系。编码 eRF1 多肽、 或 SCAMP 样多肽、 或肌原纤 蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽的核酸的这种用途仅需要具有 至少 15 个核苷酸长度的核酸序列。编码 eRF1 多肽、 或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽的核酸可以用作限制性片段长度多态性 (RFLP) 标记。限制性消化的植物基因组 DNA 的 Southern 印迹 (Sambrook J, Fritsch EF 和 Maniatis T(1989)Molecular Cloning, A Laboratory Manual) 可以用编码 eRF1 多肽、 或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多肽的核 酸序列来探测。产生的条带图谱随后可以使用计算机程序如 MapMaker(Lander 等 (1987) Genomics 1 : 174-181) 进行遗传分析以构建遗传图。此外, 该核酸序列可以用来探测含有 经限制性内切核酸酶处理的一组个体的基因组 DNA 的 Southern 印迹, 其中所述的一组个体 代表具有确定的遗传杂交的亲代和后代。DNA 多态性的分离被标出并用来计算编码 eRF1 多肽、 或 SCAMP 样多肽、 或肌原纤蛋白多肽、 或 PLATZ 多肽、 或 PLST 样多肽、 或 Glomalin 多 肽的核酸在使用这个群体先前所获得的遗传图中的位置 (Botstein 等 (1980)Am.J.Hum. Genet.32 : 314-331)。
在 Bernatzky 和 Tanksley(1986)Plant Mol.Biol.Reporter 4 : 37-41 中描述了植 物基因衍生的探针的产生和其在遗传作图中的用途。 众多出版物描述了使用以上所提及的 方法学或其改进方法对特定 cDNA 克隆的遗传作图。例如, F2 互交群、 回交群、 随机交配群、 近等基因系和其它个体群体可以用于作图。此类方法学是本领域技术人员众所周知的。
所述核酸序列探针也可以用于物理作图 ( 即序列在物理图上的排列 ; 见 Hoheisel 等在 : Non-mammalian Genomic Analyasis : A Practical Guide, Academic press 1996, 第 319-346 页及其中引用的参考文献 )。
在 另 一 实 施 方 案 中, 核 酸 探 针 可 以 在 直 接 荧 光 原 位 杂 交 (FISH) 作 图 (Trask(1991)Trends Genet.7 : 149-154) 中使用。尽管当前的 FISH 作图法支持使用大型 克隆 ( 几个 kb 至几百个 kb ; 见 Laan 等 (1995)Genome Res.5 : 13-20), 然而灵敏度的改进可 以允许使用更短探针进行 FISH 作图。
用于遗传作图及物理作图的多种基于核酸序列扩增的方法可以使用所述核酸序 列而实施。例子包括等位基因特异的扩增 (Kazazian(1989)J.Lab.Clin.Med 11 : 95-96)、 PCR 扩增片段的多态性 (CAPS ; Sheffield 等 (1993)Genomics 16 : 325-332)、 等位基因特异 性连接 (Landegren 等 (1988)Science241 : 1077-1080)、 核苷酸延伸反应 (Sokolov(1990) Nucleic Acid Res.18 : 3671)、 放射杂交作图 (Walter 等 (1997)Nat.Genet.7 : 22-28) 和Happy 作图 (Dear 和 Cook(1989)Nucleic Acid Res.17 : 6795-6807)。对于这些方法, 使用 核酸的序列来设计并产生在扩增反应或在引物延伸反应中使用的引物对。 此类引物的设计 是本领域技术人员众所周知的。在使用基于 PCR 遗传作图的方法中, 可能必须鉴定在对应 于当前核酸序列的整个区域内作图亲代间的 DNA 序列差异。然而, 这对于作图法而言通常 不是必需的。
本发明方法产生具有如前文所述的增强的产量相关性状的植物。 这些性状也可以 与其它经济有利的性状组合, 如其它的产量增强性状、 对其它非生物胁迫和生物胁迫的耐 性、 调节多种构造性特征和 / 或生物化学特征和 / 或生理学特征的性状。
项目
1.eRF1 多肽
在一个方面, 本发明的特征在于一个或多个以下项目 :
1. 用于在植物中相对于对照植物增强产量相关性状的方法, 包括调节编码 eRF1 多肽的核酸在植物中的表达, 其中所述多肽包含至少 3 个共有结构域, eRF1 结构域 1、 eRF1 结构域 2 和 eRF1 结构域 3(Pfam 登录号分别为 PF03463、 PF03464 和 PF03465)。
2. 项目 1 的方法, 其中 eRF1 多肽的 eRF1 结构域 1 以递增的优先顺序与位于 SEQ ID NO 2 的氨基酸 6 至 140 之间的序列具有至少 49%、 50%、 51%、 52%、 53%、 54%、 55%、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86%、 87%、 88%、 89%、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%或者更 多的序列同一性。
3. 项目 1 的方法, 其中 eRF1 多肽的 eRF1 结构域 2 以递增的优先顺序与位于 SEQ ID NO 2 的氨基酸 144 至 278 之间的序列具有至少 49%、 50%、 51%、 52%、 53%、 54%、 55%、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86%、 87%、 88%、 89%、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%或者更 多的序列同一性。
4. 项目 1 的方法, 其中 eRF1 多肽的 eRF1 结构域 3 以递增的优先顺序与位于 SEQ ID NO 2 的氨基酸 281 至 418 之间的序列具有至少 49%、 50%、 51%、 52%、 53%、 54%、 55%、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86%、 87%、 88%、 89%、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%或者更 多的序列同一性。
5. 项目 1-4 的任一项的方法, 其中本发明的 eRF1 多肽包含一个或多个以下肽 : 分 别具有 SEQ ID NO : 73、 74 和 75 的 GGQ、 NIKS 和 [GA][IMLV]LR[YW]。
6. 项目 1 的方法, 其中所述 eRF1 多肽还可以包含序列基序, 所述序列基序以递增 的优先顺序与任一以下基序 :
(i) 基 序 1 : FGTLSGNTREVLHKF[TS]VDLPKKHGRGGQSALRFARLRMEKRHNYVRK[TV] AE(SEQ ID NO : 76),
(ii) 基 序 2 : YN[KR]VPPNGLVLY[TC]GT[IV]VT[ED][DE]GKEKKV[TN]IDFEPF[KR]PIN[AT]SLYLCDNKFHTE(SEQ ID NO : 77),
(iii) 基 序 3 : ARGNGTSMISLI[MI]PP[RK]DQ[IV]SRVTKML[GA]DE[YF]GTASNI KSRVNR[QL]SVL[GS]AIT(SEQ ID NO : 78) 具有至少 49%、 50%、 51%、 52%、 53%、 54%、 55%、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86%、 87%、 88%、 89%、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%或者更 多的序列同一性。
7. 项目 1-6 的任一项的方法, 其中所述 eRF1 多肽还可以包含任意一个或多个序列 基序, 所述序列基序以递增的优先顺序与任一以下基序 :
(i) 基 序 4 : [TS]VDLPKKHGRGGQSALRFARLR[EM]EKRHNYVRKVAE[VL]A[VT] QNFITND[KR][PV]NV(SEQ ID NO : 79),
(ii) 基序 5 : Y[NT][KR]VPPNGLV[VLI]YCG[TD][IV][ILM]T[ED][ED]GKE[KR]K[VM] [NT]ID[FI]EPFKPINTSLYLCDNKFHTE(SEQ ID NO : 80),
(iii) 基 序 6 : ARGNGTSMISL[IV][IM]PPK[DG]Q[IV]S[RL]V[QA]KML[AT][DE] EYGTASNIKSRVNR[LQ]SVL[SG]AIT(SEQ ID NO : 81)
具有至少 49 %、 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%或者更多的序列同一性。
8. 项目 6-7 的任一项的方法, 其中所述 eRF1 多肽还可以包含任意一个或多个序列 基序, 所述序列基序以递增的优先顺序与任一以下基序 :
(i) 基序 7 : VDLPKKHGRGGQSALRFARLRMEKRHNYVRKTAELATQF[YF]INPATSQPNV(SEQ ID NO : 82),
(ii) 基 序 8 : YNKVPPNGLVLYTGTIVT[ED]DGKEKKVTIDFEPF[KR] PINASLYLCDNKFHTE(SEQ ID NO : 83),
(iii) 基 序 9 : TSMISLIMPPRDQ[VI]SRVTKMLGDE[FY] GTASNIKSRVNRQSVLGAITSAQQR(SEQ ID NO : 84) 具有至少 49%、 50%、 51%、 52%、 53%、 54%、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85%、 86%、 87%、 88%、 89%、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%或 者更多的序列同一性。
9. 项目 1-8 的任一项的方法, 其中 eRF1 多肽的同源物以递增的优先顺序与由 表 A1 的任一多肽, 优选地由 SEQ ID NO : 2 表示的氨基酸具有至少 25%、 26%、 27%、 28%、 29 %、 30 %、 31 %、 32 %、 33 %、 34 %、 35 %、 36 %、 37 %、 38 %、 39 %、 40 %、 41 %、 42 %、 43 %、 44 %、 45 %、 46 %、 47 %、 48 %、 49 %、 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89%、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%的整体序列同一性。
10. 项目 1-9 的任一项的方法, 其中所述受调控的表达通过在植物中引入和表达如前述项目任一项所述的 eRF1 多肽之编码核酸而实现。
11. 项目 1-10 的任一项的方法, 其中所述编码 eRF1 多肽之核酸编码表 A1 中列举 的任一蛋白质, 或者是此类核酸的一部分, 或者是能够与此类核酸杂交的核酸。
12. 项目 1-11 的任一项的方法, 其中所述核酸序列编码表 A1 给出的任一蛋白质的 直向同源物或旁系同源物。
13. 任一前述项目的方法, 其中所述增强的产量相关性状包括相对于对照植物增 加的产量, 优选增加的生物量和 / 或增加的种子产量。
14. 项目 1-13 的任一项的方法, 其中所述增强的产量相关性状是在非胁迫条件下 获得的。
15. 项目 1-14 的任一项的方法, 其中所述增强的产量相关性状是在干旱胁迫、 盐 胁迫或氮缺乏条件下获得的。
16. 项目 10-12 的任一项的方法, 其中所述核酸与组成型启动子, 优选 GOS2 启动 子, 最优选来自稻的 GOS2 启动子有效连接。
17. 项目 1-16 的任一项的方法, 其中所述 eRF1 多肽之编码核酸是植物来源的, 优 选来自双子叶植物, 进一步优选来自十字花科, 更优选来自拟南芥属, 最优选来自拟南芥。
18. 通过项目 1-17 的任一项方法可获得的植物或其部分, 包括种子, 其中所述植 物或其部分包含编码 eRF1 多肽的重组核酸。
19. 构建体, 包含 :
(i) 编码如项目 1-9 定义的 eRF1 多肽的核酸 ;
(ii) 能够驱动 (i) 的核酸序列表达的一个或多个控制序列 ; 和任选的
(iii) 转录终止序列。
20. 项目 19 的构建体, 其中所述控制序列之一是组成型启动子, 优选 GOS2 启动子, 最优选来自稻的 GOS2 启动子。
21. 项目 19 或 20 的构建体在用于制造相对于对照植物具有增加的产量, 特别是增 加的生物量和 / 或增加的种子产量的植物的方法中的用途。
22. 用项目 19 或 20 的构建体转化的植物、 植物部分或植物细胞。
23. 用于生产相对于对照植物具有增加的产量, 特别是增加的生物量和 / 或增加 的种子产量的转基因植物的方法, 包括 :
(i) 在植物中引入和表达如项目 1-9 定义的 eRF1 多肽之编码核酸 ; 和
(ii) 在促进植物生长和发育的条件下培养植物细胞。
24. 相对于对照植物, 具有增加的产量, 特别是增加的生物量和 / 或增加的种子 产量的转基因植物或者源自所述转基因植物的转基因植物细胞, 获得自如项目 1-9 定义的 eRF1 多肽之编码核酸受调控的表达。
25. 项目 18、 22 或 24 的转基因植物, 或源自它的转基因植物细胞, 其中所述植物是 作物植物或单子叶或谷物, 例如稻、 玉米、 小麦、 大麦、 粟、 黑麦、 黑小麦、 高粱、 野小麦、 德国 小麦、 黑麦属、 一粒系小麦、 teff、 蜀黍和燕麦。
26. 项目 25 的植物的可收获部分, 其中所述可收获部分优选是苗生物量和 / 或种 子。
27. 来自项目 25 的植物和 / 或项目 26 的植物的可收获部分的产物。28.eRF1 多肽之编码核酸在相对于对照植物, 在植物中增加产量, 特别是增加的种 子产量和 / 或苗生物量的用途。
29. 分离的核酸分子, 选自 :
(i) 由 以 下 核 酸 序 列 的 任 一 表 示 的 核 酸 :具 有 SEQ ID NO : 15 的 G.max_GM06MC33657_sm55b10@32878 ; 具 有 SEQ ID NO : 17 的 H.vulgare_ c64960768hv270303@2598 ;
(ii) 由 所 述 序 列 表 示 的 核 酸 的 互 补 序 列 : 所 述 序 列 具 有 SEQ ID NO : 15 的 G.max_GM06MC33657_sm55b10@32878 ; 具 有 SEQ ID NO : 17 的 H.vulgare_ c64960768hv270303@2598 ;
(iii) 编码由 SEQ ID NO : 16 ; SEQ ID NO : 18 的任一表示的多肽的核酸, 优选地, 由 于遗传密码的简并性, 所述分离的核酸可以衍生自由 SEQID NO : 16 和 18 的任一表示的多肽 序列, 并且另外优选地赋予相对于对照植物而言增强的产量相关性状 ;
(iv) 核酸, 所述核酸以递增的优先顺序与表 A1 的任一核酸序列具有至少 30%、 31 %、 32 %、 33 %、 34 %、 35 %、 36 %、 37 %、 38 %、 39 %、 40 %、 41 %、 42 %、 43 %、 44 %、 45 %、 46 %、 47 %、 48 %、 49 %、 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%的序列同一性, 并且另外优选地赋予 相对于对照植物而言增强的产量相关性状 ;
(v) 核酸分子, 所述核酸分子在严格杂交条件下与 (i) 至 (iv) 项的核酸分子杂交, 并优选地赋予相对于对照植物而言增强的产量相关性状 ;
(vi) 编码 eRF1 多肽的核酸, 所述 eRF1 多肽以递增的优先顺序与由 SEQ ID NO : 16 和 18 的任一表示的氨基酸序列和表 A1 中的任一其它氨基酸序列具有至少 50%、 51%、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92 %、 93 %、 94 %、 95 %、 96 %、 97%、 98%或 99%的序列同一性, 并且优选地赋予相对于对照植物而言增强的产量相关性 状。
30. 本发明另外的实施方案, 从而还提供了分离的多肽, 选自 :
(i) 由 SEQ ID NO : 16 和 18 的任一表示的氨基酸序列 ;
(ii) 氨基酸序列, 所述氨基酸序列以递增的优先顺序与由 SEQ ID NO : 16 和 18 的 任一表示的氨基酸序列和表 A1 中的任一其它氨基酸序列具有至少 50%、 51%、 52%、 53%、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92 %、 93 %、 94 %、 95 %、 96 %、 97 %、 98 %或 99%的序列同一性, 并且优选地赋予相对于对照植物而言增强的产量相关性状。
(iii) 上述 (i) 或 (ii) 项中给出的任一氨基酸序列的衍生物。
2.SCAMP 样多肽
在另一方面, 本发明的特征在于一个或多个以下项目 :1. 用于在植物中相对于对照植物增强产量相关性状的方法, 包括调节编码 SCAMP 样多肽的核酸在植物中的表达, 其中所述 SCAMP 样多肽包含 SCAMP 结构域。
2. 项目 1 的方法, 其中所述 SCAMP 结构域以递增的优先顺序与表 A2 的任一多肽中 存在的 SCAMP 结构域的氨基酸, 优选地与位于 SEQ IDNO 89 的氨基酸 91 至 265 之间的序列 表示的 SCAMP 结构域具有至少 50%、 51%、 52%、 53%、 54%、 55%、 56%、 57%、 58%、 59%、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%、 99%或 100%的序列同一性。
3. 项目 1 或 2 的方法, 其中所述受调控的表达通过在植物中引入和表达 SCAMP 样 多肽之编码核酸而实现。
4. 项目 1-3 的任一项的方法, 其中所述编码 SCAMP 样多肽之核酸编码表 A2 中列举 的任一蛋白质, 或者是此类核酸的一部分, 或者是能够与此类核酸杂交的核酸。
5. 项目 1-4 的任一项的方法, 其中所述核酸序列编码表 A2 给出的任一蛋白质的直 向同源物或旁系同源物。
6. 任一前述项目的方法, 其中所述增强的产量相关性状包括相对于对照植物增加 的产量, 优选增加的生物量和 / 或增加的种子产量。
7. 项目 1-6 的任一项的方法, 其中所述增强的产量相关性状是在非胁迫条件下获 得的。
8. 项目 1-6 的任一项的方法, 其中所述增强的产量相关性状是在干旱胁迫、 盐胁 迫或氮缺乏条件下获得的。
9. 项目 3-8 的任一项的方法, 其中所述核酸与组成型启动子, 优选 GOS2 启动子, 最 优选来自稻的 GOS2 启动子有效连接。
10. 项目 1-9 的任一项的方法, 其中所述 LBD 多肽之编码核酸是植物来源的, 优选 来自双子叶植物, 进一步优选来自十字花科, 更优选来自拟南芥属, 最优选来自拟南芥。
11. 通过项目 1-10 的任一项方法可获得的植物或其部分, 包括种子, 其中所述植 物或其部分包含编码 SCAMP 样多肽的重组核酸。
12. 构建体, 包含 :
(i) 编码如项目 1 或 2 定义的 SCAMP 样多肽的核酸 ;
(ii) 能够驱动 (i) 的核酸序列表达的一个或多个控制序列 ; 和任选的
(iii) 转录终止序列。
13. 项目 12 的构建体, 其中所述控制序列之一是组成型启动子, 优选 GOS2 启动子, 最优选来自稻的 GOS2 启动子。
14. 项目 12 或 13 的构建体在用于制造相对于对照植物具有增加的产量, 特别是增 加生物量和 / 或增加的种子产量的植物的方法中的用途。
15. 用项目 12 或 13 的构建体转化的植物、 植物部分或植物细胞。
16. 用于生产相对于对照植物具有增加的产量, 特别是增加的生物量和 / 或增加 的种子产量的转基因植物的方法, 包括 :
(i) 在植物中引入和表达如项目 1 或 2 定义的 SCAMP 样多肽之编码核酸 ; 和
(ii) 在促进植物生长和发育的条件下培养植物细胞。17. 相对于对照植物, 具有增加的产量, 特别是增加的生物量和 / 或增加的种子产 量的转基因植物或者源自所述转基因植物的转基因植物细胞, 获得自如项目 1 或 2 定义的 SCAMP 样多肽之编码核酸受调控的表达。
18. 项目 11、 15 或 17 的转基因植物, 或源自它的转基因植物细胞, 其中所述植物是 作物植物或单子叶或谷物, 例如稻、 玉米、 小麦、 大麦、 粟、 黑麦、 黑小麦、 高粱、 野小麦、 德国 小麦、 黑麦属、 一粒系小麦、 teff、 蜀黍和燕麦。
19. 项目 18 的植物的可收获部分, 其中所述可收获部分优选是苗生物量和 / 或种 子。
20. 来自项目 18 的植物和 / 或项目 19 的植物的可收获部分的产物。
21.SCAMP 样多肽之编码核酸在相对于对照植物, 在植物中增加产量, 特别是增加 种子产量和 / 或苗生物量的用途。
22. 分离的核酸分子, 选自 :
(i) 由 SEQ ID NO : 100、 102、 104、 106、 180、 182、 184、 186、 188、 190 和 192 的任一表 示的核酸 ;
(ii) 由 (i) 项 SEQ ID NO : 100、 102、 104、 106、 180、 182、 184、 186、 188、 190 和 192 的 任一表示的核酸的互补序列 ;
(iii) 编码由 SEQ ID NO : 101、 103、 105、 107、 109、 183、 185、 187、 189、 191 和 193 的 任一表示的多肽的核酸 ; 优选地, 由于遗传密码的简并性, 所述分离的核酸可以衍生自由 SEQ ID NO : 101、 103、 105、 107、 181、 183、 185、 187、 189、 191 和 193 的任一表示的多肽序列, 并且另外优选地赋予相对于对照植物而言增强的产量相关性状 ;
(iv) 核酸, 所述核酸以递增的优先顺序与表 A2 的任一核酸序列具有至少 30%、 31 %、 32 %、 33 %、 34 %、 35 %、 36 %、 37 %、 38 %、 39 %、 40 %、 41 %、 42 %、 43 %、 44 %、 45 %、 46 %、 47 %、 48 %、 49 %、 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%的序列同一性, 并且另外优选地赋予 相对于对照植物而言增强的产量相关性状 ;
(v) 核酸分子, 所述核酸分子在严格杂交条件下与 (i) 至 (iv) 项的核酸分子杂交, 并优选地赋予相对于对照植物而言增强的产量相关性状。
(vi) 编码多肽的核酸, 所述多肽以递增的优先顺序与由 SEQ ID NO : 101、 103、 105、 107、 181、 183、 185、 187、 189、 191 和 193 的任一表示的氨基酸序列和表 A2 中的任一其它氨 基酸序列具有至少 50%、 51%、 52%、 53%、 54%、 55%、 56%、 57%、 58%、 59%、 60%、 61%、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%的序列同一性, 并且优选地赋予相对于对照 植物而言增强的产量相关性状。
23. 分离的多肽, 选自
(i) 由 SEQ ID NO : 101、 103、 105、 107、 181、 183、 185、 187、 189、 191 和 193 的任一表 示的氨基酸序列 ;(ii) 氨基酸序列, 所述氨基酸序列以递增的优先顺序与由 SEQ ID NO : 101、 103、 105、 107、 181、 183、 185、 187、 189、 191 和 193 的任一表示的氨基酸序列和表 A2 中的任一其 它氨基酸序列具有至少 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%的序列同一性, 并且优选地赋予相对 于对照植物而言增强的产量相关性状。
(iii) 上述 (i) 或 (ii) 项中给出的任一氨基酸序列的衍生物。
3. 肌原纤蛋白多肽
在另一方面, 本发明的特征在于一个或多个以下项目 :
1. 用于在植物中相对于对照植物而言增强产量相关性状的方法, 包括调节植物中 编码肌原纤蛋白多肽之核酸的表达, 所述肌原纤蛋白多肽包括 :
(i) 由 PFAM 登录号 PF04755 表示的 PAP 肌原纤蛋白结构域 ; 和
(ii) 由 KFECQNESRGGLVRNVIKWSVPRLLE
ENEGATLIVTARFSSVSARNIYLKFEEIGLQNINISDDLQAVIAPAILPRSFLSLQILQFIRSFKAR VPVTSPERHSVGGLYYLSYLDKNMLLGRAVGGGGVFIFTRAHTL(SEQ ID NO : 253) 表示的羧基端结构 域, 其可以含有表示 1 至 15 个之间的残基的 0 至 5 个之间的空位, 或者以递增的优先顺序 54%、 55%、 56%、 57%、 58%、 59%、 与 (SEQ ID NO : 253) 具有至少 50%、 51%、 52%、 53%、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92 %、 93 %、 94 %、 95 %、 96 %、 97 %、 98 %或 99 %的整体序列同一性的结构域 ; 和任选地
(iii) 在多肽的氨基端区域内的转运肽。
2. 项目 1 的方法, 其中所述 PAP 肌原纤蛋白结构域由 ENRKYELLNIIQDTQRGLVTTAD QRSTIEEAMVVVEGFDAGKEIDLSKLDGTWQYTSAPDVLILFESAARLPFFQVGQIFQ SEQ ID NO : 252 表示, 其可以含有表示 1 至 15 个之间的残基的 0 至 5 个之间的空位, 或者以递增的优先顺序与 SEQID NO : 252 具有至少 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%的整体序列同一性的结构域。
3. 项目 1 或 2 的方法, 其中所述肌原纤蛋白多肽包含以下结构域的一个或多个 :
结 构 域 X: NIYLQF[EQ]E[IA]S[VL]Q[ND]INISE[EQ]LQAL[IL]APA[IL]LPRSFL[SN] LQILQ[FA][LI][RK][TS]F[KR]AQ[VI]P ;
结构域 Y : YYL[ST]YLD[RN][ND]MLLGR[AS]VGGGGV ;
结构域 Z : [PA][IL]DL[AS]KLDGTWRLQYTSA[SP]DV ; 或
以递增的优先顺序与结构域 X、 Y 和 Z 的任意一个或多个具有至少 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92 %、 93 %、 94 %、 95 %、 96 %、97%、 98%或 99%的整体序列同一性的结构域。
4. 项目 1-3 的任一项的方法, 其中所述受调控的表达通过在植物中引入和表达肌 原纤蛋白多肽之编码核酸而实现。
5. 项目 1-4 的任一项的方法, 其中所述编码肌原纤蛋白多肽之核酸编码表 A3 中列 举的任一蛋白质, 或者是此类核酸的一部分, 或者是能够与此类核酸杂交的核酸。
6. 项目 1-5 的任一项的方法, 其中所述核酸序列编码表 A3 给出的任一蛋白质的直 向同源物或旁系同源物。
7. 任一前述项目的方法, 其中所述增强的产量相关性状包括相对于对照植物增加 的产量, 优选的种子产量。
8. 项目 1-7 的任一项的方法, 其中所述增强的产量相关性状是在非胁迫条件下获 得的。
9. 项目 4-8 的任一项的方法, 其中所述核酸与组成型启动子, 优选 GOS2 启动子, 最 优选来自稻的 GOS2 启动子有效连接。
10. 项目 1-9 的任一项的方法, 其中所述肌原纤蛋白多肽之编码核酸是植物来 源的, 优选来自双子叶植物, 更优选来自茄科 (Solanaceae), 还优选该核酸来自番茄属 (Lycopersicon), 进一步优选地来自番茄属物种, 最优选核酸来自番茄。
11. 通过项目 1-10 的任一项方法可获得的植物或其部分, 包括种子, 其中所述植 物或其部分包含编码肌原纤蛋白多肽的重组核酸。
12. 构建体, 包含 :
(i) 编码如项目 1-3 定义的肌原纤蛋白多肽的核酸 ;
(ii) 能够驱动 (i) 的核酸序列表达的一个或多个控制序列 ; 和任选的
(iii) 转录终止序列。
13. 项目 12 的构建体, 其中所述控制序列之一是组成型启动子, 优选 GOS2 启动子, 最优选来自稻的 GOS2 启动子。
14. 项目 12 或 13 的构建体在用于制造相对于对照植物具有增加的产量, 特别是增 加的种子产量的植物的方法中的用途。
15. 用项目 12 或 13 的构建体转化的植物、 植物部分或植物细胞。
16. 用于生产相对于对照植物具有增加的产量, 特别是增加的生物量和 / 或增加 的种子产量的转基因植物的方法, 包括 :
(i) 在植物中引入和表达如项目 1-3 定义的肌原纤蛋白多肽之编码核酸 ; 和
(ii) 在促进植物生长和发育的条件下培养植物细胞。
17. 相对于对照植物, 具有增加的产量, 特别是增加的种子产量的转基因植物或者 源自所述转基因植物的转基因植物细胞, 获得自如项目 1-3 定义的肌原纤蛋白多肽之编码 核酸受调控的表达。
18. 项目 11、 15 或 17 的转基因植物, 或源自它的转基因植物细胞, 其中所述植物是 作物植物或单子叶或谷物, 例如稻、 玉米、 小麦、 大麦、 粟、 黑麦、 黑小麦、 高粱、 野小麦、 德国 小麦、 黑麦属、 一粒系小麦、 teff、 蜀黍和燕麦。
19. 项目 18 的植物的可收获部分, 其中所述可收获部分优选是种子。
20. 来自项目 18 的植物和 / 或项目 19 的植物的可收获部分的产物。21. 肌原纤蛋白多肽之编码核酸在相对于对照植物, 在植物中增加产量, 特别是增 加种子产量的用途。
22. 分离的核酸分子, 选自 :
(i) 由 以 下 核 酸 序 列 的 任 一 表 示 的 核 酸 : 具 有 SEQ ID NO : 206 的 B.napus_BN06MC20042_46499279@19975 ; 具 有 SEQ ID NO : 220 的 G.max_ GM06MC19234_59694709@18873 ;
(ii) 由 所 述 序 列 表 示 的 核 酸 的 互 补 序 列 : 所 述 序 列 具 有 SEQ ID NO : 206 的 B.napus_BN06MC20042_46499279@19975 ; 具 有 SEQ ID NO : 220 的 G.max_ GM06MC19234_59694709@18873 ;
(iii) 编码由 SEQ ID NO : 207 ; SEQ ID NO : 221 的任一表示的多肽的核酸, 优选地, 由于遗传密码的简并性, 所述分离的核酸可以衍生自由 SEQID NO : 207 和 221 的任一表示的 多肽序列, 并且另外优选地赋予相对于对照植物而言增强的产量相关性状 ;
(iv) 核酸, 所述核酸以递增的优先顺序与表 A3 的任一核酸序列具有至少 30%、 31 %、 32 %、 33 %、 34 %、 35 %、 36 %、 37 %、 38 %、 39 %、 40 %、 41 %、 42 %、 43 %、 44 %、 45 %、 46 %、 47 %、 48 %、 49 %、 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%的序列同一性, 并且另外优选地赋予 相对于对照植物而言增强的产量相关性状 ;
(v) 核酸分子, 所述核酸分子在严格杂交条件下与 (i) 至 (iv) 项的核酸分子杂交, 并优选地赋予相对于对照植物而言增强的产量相关性状 ;
(vi) 编码肌原纤蛋白多肽的核酸, 所述肌原纤蛋白多肽以递增的优先顺序与由 SEQ ID NO : 207 和 221 的任一表示的氨基酸序列和表 A3 中的任一其它氨基酸序列具有至 少 50%、 51%、 52%、 53%、 54%、 55%、 56%、 57%、 58%、 59%、 60%、 61%、 62%、 63%、 64%、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92 %、 93 %、 94 %、 95%、 96%、 97%、 98%或 99%的序列同一性, 并且优选地赋予相对于对照植物而言增强的 产量相关性状。
23. 根据本发明另外的实施方案, 从而还提供了分离的多肽分子, 选自 :
(i) 由 SEQ ID NO : 207 和 221 的任一表示的氨基酸序列 ;
(ii) 氨基酸序列, 所述氨基酸序列以递增的优先顺序与由 SEQ ID NO : 207 和 221 的任一表示的氨基酸序列和表 A3 中的任一其它氨基酸序列具有至少 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91 %、 92 %、 93 %、 94 %、 95 %、 96 %、 97 %、 98%或 99%的序列同一性, 并且优选地赋予相对于对照植物而言增强的产量相关性状。
(iii) 上述 (i) 或 (ii) 项中给出的任一氨基酸序列的衍生物。
4.PLATZ 多肽
在另一方面, 本发明的特征在于一个或多个以下项目 :1. 用于在植物中相对于对照植物而言增强产量相关性状的方法, 包括调节植物中 编码 PLATZ 多肽之核酸的表达, 其中所述 PLATZ 多肽包含 PLATZ 结构域。
2. 项目 1 的方法, 其中所述 PLATZ 多肽包含基序 10 至 18(SEQ IDNO : 264 至 SEQ ID NO : 272) 的一个或多个。
3. 项目 1 或 2 的任一项的方法, 其中所述受调控的表达通过在植物中引入和表达 PLATZ 多肽之编码核酸而实现。
4. 项目 1-3 的任一项的方法, 其中所述编码 PLATZ 多肽之核酸编码表 A4 中列举的 任一蛋白质, 或者是此类核酸的一部分, 或者是能够与此类核酸杂交的核酸。
5. 项目 1-4 的任一项的方法, 其中所述核酸序列编码表 A4 给出的任一蛋白质的直 向同源物或旁系同源物。
6. 任一前述项目的方法, 其中所述增强的产量相关性状包括相对于对照植物增加 的产量, 优选增加的生物量和 / 或增加的种子产量。
7. 项目 1-6 的任一项的方法, 其中所述增强的产量相关性状是在非胁迫条件下获 得的。
8. 项目 3-7 的任一项的方法, 其中所述核酸与组成型启动子, 优选 GOS2 启动子, 最 优选来自稻的 GOS2 启动子有效连接。
9. 项目 1-8 的任一项的方法, 其中所述 PLATZ 多肽之编码核酸是植物来源的, 优选 来自双子叶植物, 进一步优选来自杨柳科, 最优选地来自杨属。
10. 通过项目 1-9 的任一项方法可获得的植物或其部分, 包括种子, 其中所述植物 或其部分包含编码 PLATZ 多肽的重组核酸。
11. 构建体, 包含 :
(i) 编码如项目 1 或 2 定义的 PLATZ 多肽的核酸 ;
(ii) 能够驱动 (i) 的核酸序列表达的一个或多个控制序列 ; 和任选的
(iii) 转录终止序列。
12. 项目 11 的构建体, 其中所述控制序列之一是组成型启动子, 优选 GOS2 启动子, 最优选来自稻的 GOS2 启动子。
13. 项目 11 或 12 的构建体在用于制造相对于对照植物具有增加的产量, 特别是增 加的生物量和 / 或增加的种子产量的植物的方法中的用途。
14. 用项目 11 或 12 的构建体转化的植物、 植物部分或植物细胞。
15. 用于生产相对于对照植物具有增加的产量, 特别是增加的生物量和 / 或增加 的种子产量的转基因植物的方法, 包括 :
(i) 在植物中引入和表达如项目 1 或 2 定义的 PLATZ 多肽之编码核酸 ; 和
(ii) 在促进植物生长和发育的条件下培养植物细胞。
16. 相对于对照植物, 具有增加的产量, 特别是增加的生物量和 / 或增加的种子产 量的转基因植物或者源自所述转基因植物的转基因植物细胞, 获得自如项目 1 或 2 定义的 PLATZ 多肽之编码核酸受调控的表达。
17. 项目 10、 14 或 16 的转基因植物, 或源自它的转基因植物细胞, 其中所述植物是 作物植物或单子叶或谷物, 例如稻、 玉米、 小麦、 大麦、 粟、 黑麦、 黑小麦、 高粱、 野小麦、 德国 小麦、 黑麦属、 一粒系小麦、 teff、 蜀黍和燕麦。18. 项目 17 的植物的可收获部分, 其中所述可收获部分优选是苗生物量和 / 或种子。 19. 来自项目 17 的植物和 / 或项目 18 的植物的可收获部分的产物。
20.PLATZ 多肽之编码核酸在相对于对照植物, 在植物中增加产量, 特别是增加种 子产量和 / 或苗生物量的用途。
21. 分离的核酸分子, 选自 :
(i) 由 SEQ ID NO : 354 表示的核酸 ;
(ii) 由 SEQ ID NO : 354 表示的核酸的互补序列 ;
(iii) 编码 PLATZ 多肽的核酸, 所述 PLATZ 多肽以递增的优先顺序与由 SEQ ID NO : 355 表示的氨基酸序列具有至少 50 %、 55 %、 60 %、 65 %、 70 %、 75 %、 80 %、 85 %、 90 %、 95%、 96%、 97%、 98%、 99%或更多的序列同一性, 并且以递增的优先顺序与在上文所定义 的基序的一个或多个具有至少 50%、 55%、 60%、 65%、 70%、 75%、 80%、 85%、 90%、 95%、 96%、 97%、 98%、 99%或更多的序列同一性。
22. 分离的多肽, 选自 :
(i) 由 SEQ ID NO : 355 表示的氨基酸序列 ;
(ii) 氨基酸序列, 所述氨基酸序列以递增的优先顺序与由 SEQ ID NO : 355 表示 的氨基酸序列具有至少 50 %、 55 %、 60 %、 65 %、 70 %、 75 %、 80 %、 85 %、 90 %、 95 %、 96 %、 97%、 98%、 99%或更多的序列同一性, 并且以递增的优先顺序与在上文所定义的基序的一 个或多个具有至少 50%、 55%、 60%、 65%、 70%、 75%、 80%、 85%、 90%、 95%、 96%、 97%、 98%、 99%或更多的序列同一性。
(iii) 上述 (i) 或 (ii) 项中给出的任一氨基酸序列的衍生物。
5.PLST 样多肽
在另一方面, 本发明的特征在于一个或多个以下项目 :
1. 用于在植物中相对于对照植物而言增强产量相关性状的方法, 包括调节植物中 编码 PLST 样多肽之核酸的表达, 其中所述 PLST 样多肽至少包含 PLST 共有结构域 (PFam 登 录号 PF02298)。
2. 项目 1 的方法, 其中 PLST 样多肽的 PLST 结构域以递增的优先顺序与位于 SEQ ID NO 411 的氨基酸 38 至 124 之间的序列具有至少 49 %、 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85%、 86%、 87%、 88%、 89%、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%或 者更多的序列同一性。
3. 项目 1 或 2 的任一项的方法, 其中所述 PLST 样多肽可以包含序列基序, 所述序 列基序以递增的优先顺序与任一以下基序 :
(i) 基 序 19 : [DH]SV[LI]QV[TS]KE[DA][YF][DK]SCNT[SK][NSD]P(SEQ ID NO : 530)
(ii) 基序 20 : [FHY]YF[IT]SGV[PK][GD][HN]C(SEQ ID NO : 531)
(iii) 基序 21 : Y[NT][QK]WA[ESK][KS]NRF[KQ][IV]GD[ST][LI][VL]F[KL]YP(SEQ IDNO : 532)
具有至少 49 %、 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%或者更多的序列同一性。
4. 项目 1 至 3 的任一项的方法, 其中所述 PLST 样多肽可以包含任意一个或多个序 列基序, 所述序列基序以递增的优先顺序与任一以下基序 :
(i) 基序 22 : [DN]GN[TS][LVK][FV][KN][LF][DT]R[SP]GP[FY]YF[IT]SG[VA][KP] [GD][HN]CEK[GN][QE]K(SEQ ID NO : 533)
(ii) 基 序 23 : [YL]N[QK]WA[EK][KS][NH]RF[KQ][IV]GD[ST]L[LV]F[LK]Y[PD] (SEQID NO : 534)
(iii) 基序 24 : [KQ]DSV[LI]QVTKE[DA]YKSCNT[SK][DSN]PI(SEQ ID NO : 535)
具有至少 49 %、 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%或者更多的序列同一性。
5. 项目 1 至 4 的任一项的方法, 其中所述 PLST 样多肽可以包含任意一个或多个序 列基序, 所述序列基序以递增的优先顺序与任一以下基序 :
(i) 基 序 25 : DSVI[QV]VT[EKA][EQ]S[YF][KN][SK]CNL[KST]DPIL[YF][MS]N[ND] GN[ST][LV]FN[LI][TD][RS]PGL[FY]YF[TI]SG[VA][PS]GHC[EQ][KR](SEQ ID NO : 536)
(ii) 基 序 26 : P[PT]SA[DN]P[DQ][VL]YTKW[AS][KS][NS][HN][RN]FK[IL]GD[ST] [LI]LFLYP(SEQ ID NO : 537)
(iii) 基序 27 : XVS[CS]Y[QE][YF]KVG[DG]LD[AGS]W(SEQ ID NO : 538)
具有至少 49 %、 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%或者更多的序列同一性。
6. 项目 1 至 5 的任一项的方法, 其中所述 PLST 样多肽可以包含任意一个或多个序 列基序, 所述序列基序以递增的优先顺序与任一以下基序 :
(i) 基 序 28 : HN[FL]K[IL]GDSLLFLYPPSQDSVIQVTA[QE][SAN][YF][KN]SC[ND] L[KS]DPILYMN[DN]GNSLFN[IL]T(SEQ ID NO : 539)
(ii) 基序 29 : GDFYFTSG[AVE]PGHC[EQ]K[SK]QKLH[IV](SEQ ID NO : 540)
(iii) 基序 30 : VSCYQYKVGDLD[AS]WGIPTSA[NK](SEQ ID NO : 541)
具有至少 49 %、 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89 %、 90 %、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%或者更多的序列同一性。
7. 项目 1 至 6 的任一项的方法, 其中 PLST 样多肽的同源物以递增的优先顺序与由 表 A5 的任一多肽, 优选地由 SEQ ID NO : 411 表示的氨基酸具有至少 25%、 26%、 27%、 28%、 29 %、 30 %、 31 %、 32 %、 33 %、 34 %、 35 %、 36 %、 37 %、 38 %、 39 %、 40 %、 41 %、 42 %、 43 %、44 %、 45 %、 46 %、 47 %、 48 %、 49 %、 50 %、 51 %、 52 %、 53 %、 54 %、 55 %、 56 %、 57 %、 58 %、 59 %、 60 %、 61 %、 62 %、 63 %、 64 %、 65 %、 66 %、 67 %、 68 %、 69 %、 70 %、 71 %、 72 %、 73 %、 74 %、 75 %、 76 %、 77 %、 78 %、 79 %、 80 %、 81 %、 82 %、 83 %、 84 %、 85 %、 86 %、 87 %、 88 %、 89%、 90%、 91%、 92%、 93%、 94%、 95%、 96%、 97%、 98%或 99%的整体序列同一性。
8. 项目 1-7 的任一项的方法, 其中所述受调控的表达通过在植物中引入和表达如 任一前述项目的 PLST 样多肽之编码核酸而实现。
9. 项目 1-8 的任一项的方法, 其中所述编码 PLST 样多肽之核酸编码表 A5 中列举 的任一蛋白质, 或者是此类核酸的一部分, 或者是能够与此类核酸杂交的核酸。
10. 项目 1-9 的任一项的方法, 其中所述核酸序列编码表 A5 给出的任一蛋白质的 直向同源物或旁系同源物。
11. 任一前述项目的方法, 其中所述增强的产量相关性状包括相对于对照植物增 加的产量, 优选增加的种子产量。
12. 项目 1-11 的任一项的方法, 其中所述增强的产量相关性状是在非胁迫条件下 获得的。
13. 项目 1-11 的任一项的方法, 其中所述增强的产量相关性状是在干旱胁迫、 盐 胁迫或氮缺乏条件下获得的。
14. 项目 8-10 的任一项的方法, 其中所述核酸与组成型启动子, 优选 GOS2 启动子, 最优选来自稻的 GOS2 启动子有效连接。
15. 项目 1-14 的任一项的方法, 其中所述 PLST 样多肽之编码核酸是植物来源的。
16. 项目 15 的方法, 其中所述 PLST 样多肽之编码核酸来自双子叶植物, 进一步优 选来自杨柳科, 最优选核酸来自毛果杨。
17. 通过项目 1-16 的任一项方法可获得的植物或其部分, 包括种子, 其中所述植 物或其部分包含编码 PLST 样多肽的重组核酸。
18. 构建体, 包含 :
(i) 编码如项目 1-7 定义的 PLST 样多肽的核酸 ;
(ii) 能够驱动 (a) 的核酸序列表达的一个或多个控制序列 ; 和任选的
(iii) 转录终止序列。
19. 项目 18 的构建体, 其中所述控制序列之一是组成型启动子, 优选 GOS2 启动子, 最优选来自稻的 GOS2 启动子。
20. 项目 18 或 19 的构建体在用于制造相对于对照植物具有增加的产量, 特别是增 加的种子产量的植物的方法中的用途。
21. 用项目 18 或 19 的构建体转化的植物、 植物部分或植物细胞。
22. 用于生产相对于对照植物具有增加的产量, 特别是增加的生物量和 / 或增加 的种子产量的转基因植物的方法, 包括 :
(i) 在植物中引入和表达如项目 1-7 定义的 PLST 样多肽之编码核酸 ; 和
(ii) 在促进植物生长和发育的条件下培养植物细胞。
23. 相对于对照植物, 具有增加的产量, 特别是增加的生物量和 / 或增加的种子 产量的转基因植物或者源自所述转基因植物的转基因植物细胞, 获得自如项目 1-7 定义的 PLST 样多肽之编码核酸受调控的表达。24. 项目 17、 21 或 23 的转基因植物, 或源自它的转基因植物细胞, 其中所述植物是 作物植物或单子叶或谷物, 例如稻、 玉米、 小麦、 大麦、 粟、 黑麦、 黑小麦、 高粱、 野小麦、 德国 小麦、 黑麦属、 一粒系小麦、 teff、 蜀黍和燕麦。
25. 项目 24 的植物的可收获部分, 其中所述可收获部分优选是种子。
26. 来自项目 24 的植物和 / 或项目 25 的植物的可收获部分的产物。
27.PLST 样多肽之编码核酸在相对于对照植物, 在植物中增加产量, 特别是增加种 子产量的用途。
28. 分离的核酸分子, 选自 :
(i) 由 SEQ ID NO : 414 ; SEQ ID NO : 426 ; SEQ ID NO : 428 ; SEQ IDNO : 434 ; SEQ ID NO : 438 表示的核酸 ;
(ii) 由 SEQ ID NO : 414 ; SEQ ID NO : 426 ; SEQ ID NO : 428 ; SEQ IDNO : 434 ; SEQ ID NO : 438 表示的核酸的互补序列 ;
(iii) 编码由 SEQ ID NO : 415 ; SEQ ID NO : 427 ; SEQ ID NO : 429 ; SEQ ID NO : 435 ; SEQ ID NO : 439 的任一表示的 PLST 样多肽的核酸, 优选地, 由于遗传密码的简并性, 所述分 离的核酸可以衍生自由 SEQ ID NO : 415 ; SEQ ID NO : 427 ; SEQ ID NO : 429 ; SEQ ID NO : 435 ; SEQ ID NO : 439 的任一表示的多肽序列, 并且另外优选地赋予相对于对照植物而言增强的 产量相关性状 ;
(iv) 核酸, 所述核酸以递增的优先顺序与表 A5 的任一核酸序列具有至少 50%, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 96 %, 97 %, 98 %, 99 %或更多的序列 同一性, 并且另外优选地赋予相对于对照植物而言增强的产量相关性状 ;
(v) 核酸分子, 所述核酸分子在严格杂交条件下与 (i) 至 (iv) 项的核酸分子杂交, 并优选地赋予相对于对照植物而言增强的产量相关性状。
(vi) 编码 PLST 样多肽的核酸, 所述 PLST 样多肽以递增的优先顺序与由 SEQ ID NO : 415 ; SEQ ID NO : 427 ; SEQ ID NO : 429 ; SEQ ID NO : 435 ; SEQ ID NO : 439 的任一表示的 氨基酸序列和表 A5 中的任一其它氨基酸序列具有至少 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%或更多的序列同一性, 并且优选地赋予相对 于对照植物而言增强的产量相关性状。
29. 根据本发明另外的实施方案, 从而还提供了分离的多肽分子, 选自 : .
(i) 由 SEQ ID NO : 415 ; SEQ ID NO : 427 ; SEQ ID NO : 429 ; SEQ IDNO : 435 ; SEQ ID NO : 439 表示的氨基酸序列 ;
(ii) 氨基酸序列, 所述氨基酸序列以递增的优先顺序与 SEQ ID NO : Y 表示的氨 基酸序列具有至少 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%或更多的序列同一性, 以及以递增的优先顺序与 SEQ ID NO : 415 ; SEQ ID NO : 427 ; SEQ ID NO : 429 ; SEQ ID NO : 435 ; SEQ ID NO : 439 具有至少 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%或更多的序列同一性。
(iii) 上述 (i) 或 (ii) 项中给出的任一氨基酸序列的衍生物。
6.Glomalin 多肽
在另一方面, 本发明的特征在于一个或多个以下项目 :
1. 用于在植物中相对于对照植物而言增强产量相关性状的方法, 包括调节植物中编码 Glomalin 多肽之核酸的表达, 其中所述 Glomalin 多肽包含 Cpn60_TCP1 结构域。
2. 项目 1 的方法, 其中所述 Glomalin 多肽包含基序 31 至 43(SEQ IDNO : 596 至 SEQ ID NO : 608) 的一个或多个。
3. 项目 1 或 2 的方法, 其中所述受调控的表达通过在植物中引入和表达 Glomalin 多肽之编码核酸而实现。
4. 项目 1-3 的任一项的方法, 其中所述编码 Glomalin 多肽之核酸编码表 A6 中列 举的任一蛋白质, 或者是此类核酸的一部分, 或者是能够与此类核酸杂交的核酸。
5. 项目 1-4 的任一项的方法, 其中所述核酸序列编码表 A6 给出的任一蛋白质的直 向同源物或旁系同源物。
6. 任一前述项目的方法, 其中所述增强的产量相关性状包括相对于对照植物增加 的产量, 优选增加的种子产量。
7. 项目 1-6 的任一项的方法, 其中所述增强的产量相关性状是在非胁迫条件下获 得的。
8. 项目 3-7 的任一项的方法, 其中所述核酸与根特异性启动子, 优选 RCc3 启动子, 最优选来自稻的 RCc3 启动子有效连接。
9. 项目 1-8 的任一项的方法, 其中所述 Glomalin 多肽之编码核酸是植物来源的, 优选来自双子叶植物, 进一步优选来自禾本科, 更优选来自稻属, 最优选来自稻。
10. 通过项目 1-9 的任一项方法可获得的植物或其部分, 包括种子, 其中所述植物 或其部分包含编码 Glomalin 多肽的重组核酸。
11. 构建体, 包含 :
(i) 编码如项目 1 或 2 定义的 Glomalin 多肽的核酸 ;
(ii) 能够驱动 (a) 的核酸序列表达的一个或多个控制序列 ; 和任选的
(iii) 转录终止序列。
12. 项目 11 的构建体, 其中所述控制序列之一是组成型启动子, 优选 RCc3 启动子, 最优选来自稻的 RCc3 启动子。
13. 项目 11 或 12 的构建体在用于制造相对于对照植物具有增加的产量, 特别是增 加的种子产量的植物的方法中的用途。
14. 用项目 11 或 12 的构建体转化的植物、 植物部分或植物细胞。
15. 用于生产相对于对照植物具有增加的产量, 特别是增加的种子产量的转基因 植物的方法, 包括 :
(i) 在植物中引入和表达如项目 1 或 2 定义的 Glomalin 多肽之编码核酸 ; 和
(ii) 在促进植物生长和发育的条件下培养植物细胞。
16. 相对于对照植物, 具有增加的产量, 特别是增加的种子产量的转基因植物或者 源自所述转基因植物的转基因植物细胞, 获得自如项目 1 或 2 定义的 Glomalin 多肽之编码 核酸受调控的表达。
17. 项目 10、 14 或 16 的转基因植物, 或源自它的转基因植物细胞, 其中所述植物是 作物植物或单子叶或谷物, 例如稻、 玉米、 小麦、 大麦、 粟、 黑麦、 黑小麦、 高粱、 野小麦、 德国 小麦、 黑麦属、 一粒系小麦、 teff、 蜀黍和燕麦。
18. 项目 17 的植物的可收获部分, 其中所述可收获部分优选是种子。19. 来自项目 18 的植物和 / 或项目 18 的植物的可收获部分的产物。
20.Glomalin 多肽之编码核酸在相对于对照植物, 在植物中增加产量, 特别是增加 种子产量的用途。 附图说明 现将参考以下附图描述本发明, 其中 :
图 1 表示不同簇的选择的 eRF1 蛋白质的系统发生树 : 显示了链形植物来源和非 链形植物来源的蛋白质。SPT =链形植物, CHL =绿藻门 (chlorophyta), STR =原生藻菌 原生藻菌 (Stramenopile), BAC =细菌, FUNGI =真菌, HUM =人类, PROT =原生动物。使 用 MAFFT(Katoh 和 Toh(2008)Briefings in Bioinformatics 9 : 286-298) 进行比对。使用 QuickTree(Howe 等人 (2002), Bioinformatics 18(11) : 1546-7), 100 次自引重复计算邻接 树。使用 Dendroscope(Huson 等人 (2007), BMC Bioinformatics 8(1) : 460) 绘制环形系统 发生图。显示了主要分支的 100 次自引重复的置信度。用圆圈标出了主要分支的位置。
图 2 表示用于增加在稻 GOS2 启动子 (pGOS2) 控制下的 eRF1 编码核酸在稻中表达 的二元载体。
图 3 表示 SCAMP 多肽的多重比对。
图 4 表示用于增加在稻 GOS2 启动子 (pGOS2) 控制下的 SCAMP 样编码核酸在稻中 表达的二元载体。
图 5 显示用 AlignX( 来自 Vector NTI 10.3, Invitrogen Corporation) 多重序列 比对实施的肌原纤蛋白多肽序列的多重比对。将保守的 PAP 肌原纤蛋白 PF04755 在共有序 列下标记为 X。将保守的羧基端结构域在共有序列下也标记为 X。
图 6 显示使用在来自 Vector NTI(Invitrogen) 的 AlignX 程序中提供的邻接聚类 算法构建的肌原纤蛋白多肽的系统发生树。
图 7 来 自 Ytterberg 等 人, 2006(Plant Physiology, 2006 年 3 月, 第 140 卷, 第 984-997 页 ) 显示质体球 (PG) 及其蛋白质组的可能构造 (proposed organization)(A) 和 功能作用 (B) 的图解。PG 由单层脂质和隐蔽的不同亲水小分子如醌类和生育酚类组成。结 构蛋白 ( 肌原纤蛋白 ) 和酶连接于或者嵌入单层中, 但蛋白质缺少跨膜结构域 (A)。PG 功 能整合 (Integration) 在质体代谢 (B) 中。
图 8 表示由 MEME 算法测定的 3 个保守结构域 X、 Y 和 Z 的序列标识 (sequence logos)。序列标识是氨基酸多重序列比对的图标形式, 其由符号的堆栈 (stack) 组成, 序列 中的每一位置为一个堆栈。堆栈的总高度表示该位置处的序列保守性, 而堆栈内符号的高 度表示每一氨基酸或核酸在该位置处的相对频率。
图 9 表示用于增加在稻 GOS2 启动子 (pGOS2) 控制下的肌原纤蛋白编码核酸在稻 中表达的二元载体。
图 10 表示 SEQ ID NO : 261 的结构域结构, 标出了保守基序 10 至 18 和 PLATZ 结构 域 ( 黑体斜体 )。
图 11 表 示 使 用 用 于 慢 比 对 (slow alignment) 默 认 设 置 的 ClustalW 的 多 种 PLATZ-A1-α 多肽的多重比对。
图 12 显示 PLATZ 多肽的系统发生树, 使用 MAFFT(Katoh 和 Toh(2008)Briefings
in Bioinformatics 9 : 286-298) 进 行 比 对。 使 用 QuickTree(Howe 等 人 (2002), Bioinformatics 18(11) : 1546-7), 100 次自引重复计算邻接树。使用 Dendroscope(Huson 等人 (2007), BMC Bioinformatics 8(1) : 460) 绘制环形系统发生图。显示了主要分支的 100 次自引重复后的置信度。用圆圈标出了主要分支的位置。在进化支 PLATZ-A1-α 中, SEQ ID NO : 261 表示为 P.trichocarpa_583639。
图 13 表示用于增加在稻 GOS2 启动子 (pGOS2) 控制下的 PLATZ 编码核酸在稻中表 达的二元载体。
图 14 表示 SEQ ID NO 411, 标出了 PF 02298 结构域和基序 19 至 30.
图 15 表示针对不同簇的选择的 PLST 样蛋白质的系统发生树 : P-class =质体 蓝 素 样, NDL = 结 瘤 素 样, Z = 其 他, PLST = PLST 群。 使 用 MAFFT(Katoh 和 Toh(2008) Briefings in Bioinformatics 9 : 286-298) 进行比对。 使用 QuickTree(Howe 等人 (2002), Bioinformatics 18(11) : 1546-7), 100 次自引重复计算邻接树。使用 Dendroscope(Huson 等人 (2007), BMC Bioinformatics 8(1) : 460) 绘制环形系统发生图。显示了主要分支的 100 次自引重复后的置信度。用圆圈标出了主要分支的位置。
图 16 表示用于增加在稻 GOS2 启动子 (pGOS2) 控制下的 PLST 样编码核酸在稻中 表达的二元载体。
图 17 表示 SEQ ID NO : 546 的结构域结构, 标出了保守基序 31 至 43, 并以黑体显 示了 Cpn60_TCP1 结构域。
图 18 表示多种 Glomalin 多肽的多重比对。星号表示多种蛋白质序列之间相同的 氨基酸, 冒号表示高度保守的氨基酸替换, 和圆点表示较不保守的氨基酸替换 ; 在其他位置 上不存在序列保守性。当使用保守氨基酸时, 这些比对可以用于定义另外的基序。
图 19 显示 Glomalin 多肽的系统发生树。来自杨树的序列 XM_002297581 表示外 类群 (outgroup)。其他序列表示 Glomalin 序列的簇。
图 20 表示用于增加在稻 RCc3 启动子 (pRC3) 控制下的 Glomalin 编码核酸在稻中 表达的二元载体。 实施例
现将参考以下仅用于说明的实施例来描述本发明。 以下实施例不旨在限定本发明的范围。 DNA 操 作 :除 非 另 有 说 明,根 据 (Sambrook(2001)Molecular Cloning : a laboratory manual, 第三版, Cold Spring Harbor Laboratory Press, CSH, New York) 或 Ausubel 等 (1994), Current Protocols in Molecular Biology, Current Protocols 第 1 卷和第 2 卷中所述标准方案进行重组 DNA 技术。用于植物分子工作的标准材料和方法描述 于 BIOS Scientific Publications Ltd(UK) 和 Blackwell Scientific Publications(UK) 出版的由 R.D.D Croy 编著的 Plant Molecular Biology Labfax(1993) 中。
实施例 1 : 鉴定与本发明方法中使用的核酸序列相关的序列。
使用数据库序列检索工具, 如基本局部比对工具 (BLAST)(Altschul 等 (1990) J.Mol.Biol.215 : 403-410 ; 和 Altschul 等 (1997)Nucleic Acids Res.25 : 3389-3402) 在 美国国家生物技术信息中心 (NCBI) 的 Entrez 核苷酸数据库中所维护的那些序列内鉴定到
与 eRF1 序列相关的序列 ( 全长 cDNA、 EST 或基因组 )。该程序用来通过核酸序列或多肽序 列与序列数据库比较并通过计算匹配的统计学显著性而找到序列间具有局部相似性的区 域。例如, 在本发明中使用的核酸所编码的多肽用于 TBLASTN 算法, 采用默认设置并关闭忽 略低复杂度序列的过滤。分析的结果通过配对性比较显示, 并根据概率评分 (E- 值 ) 排序, 其中该评分反映特定比对结果因偶然而发生的概率 (E- 值越低, 命中的显著性越高 )。 除了 E- 值外, 比较还通过同一性百分数进行记分。同一性百分数指两个所比较核酸 ( 或多肽 ) 序列之间在特定长度范围内的相同核苷酸 ( 或氨基酸 ) 数目。在一些例子中, 可以调整缺 省参数以修改检索的严格性。例如可以提高 E 值以显示较低严格性的匹配。这样, 可以鉴 定短的近似精确的匹配。
1.1 eRF1 多肽
表 A1 提供了与 SEQ ID NO : 1 和 SEQ ID NO : 2 相关的核酸和多肽序列的列表。
表 A1 : eRF1 核酸和多肽的实例 :
在一些情况下, 相关序列已经由研究协会例如基因组研究协会 (The Institute for Genomic Research, TIGR ; 以 TA 开头 ) 暂时组装并对公众公开。还可以使用真核基因 直向同源物 (Eukaryotic Gene Orthologs, EGO) 数据库鉴定这类相关序列, 用目的核酸或 多肽序列进行关键词搜索或通过使用 BLAST 算法进行。在其他一些情况下, 针对具体的生 物已经创建了具体的核酸序列数据库, 例如由联合基因组协会 (Joint Genome Institute) 创建的那些。另外, 使用专利数据库允许鉴定新的核酸和多肽序列。
1.2 SCAMP 样多肽
表 A2 提供了与 SEQ ID NO : 88 和 SEQ ID NO : 89 相关的核酸和多肽序列的列表。
表 A2 : SCAMP 样核酸和多肽的实例 :
在一些情况下, 相关序列已经由研究协会例如基因组研究协会 (TIGR ; 以 TA 开头 ) 暂时组装并对公众公开。还可以使用真核基因直向同源物 (EGO) 数据库鉴定这类相关序列, 用目的核酸或多肽序列进行关键词搜索或通过使用 BLAST 算法进行。在其他一些情况 下, 针对具体的生物已经创建了具体的核酸序列数据库, 例如由联合基因组协会创建的那 些。另外, 使用专利数据库允许鉴定新的核酸和多肽序列。
1.3. 肌原纤蛋白多肽
表 A3 提供了与 SEQ ID NO : 204 和 SEQ ID NO : 205 相关的核酸和多肽序列的列表。
表 A3 : 肌原纤蛋白核酸和多肽的实例 :
可以将研究协会例如基因组研究协会 (TIGR ; 以 TA 开头 )、 真核基因直向同源物 (EGO) 数据库和联合基因组协会的数据库用于鉴定另外的肌原纤蛋白序列, 用目的核酸或 多肽序列进行关键词搜索或通过使用 BLAST 算法进行。
1.4.PLATZ 多肽
表 A4 提供了与 SEQ ID NO : 260 和 SEQ ID NO : 261 相关的核酸和多肽序列的列表。
表 A4 : PLATZ 核酸和多肽的实例 :
在一些情况下, 相关序列已经由研究协会例如基因组研究协会 (TIGR ; 以 TA 开 头 ) 暂时组装并对公众公开。还可以使用真核基因直向同源物 (EGO) 数据库鉴定这类相关 序列, 用目的核酸或多肽序列进行关键词搜索或通过使用 BLAST 算法进行。在其他一些情 况下, 针对具体的生物已经创建了具体的核酸序列数据库, 例如由联合基因组协会 (Joint Genome Institute) 创建的那些。另外, 使用专利数据库允许鉴定新的核酸和多肽序列。
1.5.PLST 样多肽
表 A5 提供了与 SEQ ID NO : 410 和 SEQ ID NO : 411 相关的核酸和多肽序列的列表。
表 A5 : PLST 样核酸和多肽的实例 :
在一些情况下, 相关序列已经由研究协会例如基因组研究协会 (TIGR ; 以 TA 开 头 ) 暂时组装并对公众公开。还可以使用真核基因直向同源物 (EGO) 数据库鉴定这类相关
序列, 用目的核酸或多肽序列进行关键词搜索或通过使用 BLAST 算法进行。在其他一些情 况下, 针对具体的生物已经创建了具体的核酸序列数据库, 例如由联合基因组协会 (Joint Genome Institute) 创建的那些。另外, 使用专利数据库允许鉴定新的核酸和多肽序列。
1.6.Glomalin 多肽
表 A6 提供了与 SEQ ID NO : 545 和 SEQ ID NO : 546 相关的核酸和多肽序列的列表。
表 A6 : Glomalin 核酸和多肽的实例 :
在一些情况下, 相关序列已经由研究协会例如基因组研究协会 (TIGR ; 以 TA 开 头 ) 暂时组装并对公众公开。还可以使用真核基因直向同源物 (EGO) 数据库鉴定这类相关 序列, 用目的核酸或多肽序列进行关键词搜索或通过使用 BLAST 算法进行。在其他一些情 况下, 针对具体的生物已经创建了具体的核酸序列数据库, 例如由联合基因组协会 (Joint Genome Institute) 创建的那些。另外, 使用专利数据库允许鉴定新的核酸和多肽序列。
实施例 2 : 与本发明方法中使用的多肽序列相关的序列比对
2.1 eRF1 多肽
使用逐步比对的 ClustalW 2.0 算法 (Thompson 等人 (1997)Nucleic Acids Res 25 : 4876-4882 ; Chenna 等 (2003).Nucleic Acids Res31 : 3497-3500) 实施多肽序列的比 对, 采用标准设定 ( 慢比对, 相似矩阵 : Gonnet 或 Blosum 62( 如果比对多肽 ), 空位开放罚 分 10, 空位延伸罚分 0.2。
使用在来自 Vector NTI(Invitrogen) 的 AlignX 程序中提供的邻接聚类算法构建 eRF1 多肽的系统发生树 ( 图 1)。
2.2.SCAMP 样多肽
使用逐步比对的 ClustalW 1.8 算法 (Thompson 等人 (1997)Nucleic Acids Res 25 : 4876-4882 ; Chenna 等 (2003).Nucleic Acids Res31 : 3497-3500) 实施多肽序列的比 对, 采用标准设定 : 空位开放罚分 10, 空位延伸罚分 0.2。进行少量人工编辑以进一步优化 比对。SCAMP 样多肽比对在图 3 中。
2.3. 肌原纤蛋白多肽
采用标准设定, 使用来自 Vector NTI(Invitrogen) 的 AlignX 程序实施多肽序列 的比对。进行少量人工编辑以进一步优化比对。肌原纤蛋白多肽比对在图 5 中。
使用在来自 Vector NTI(Invitrogen) 的 AlignX 程序中提供的邻接聚类算法构建 肌原纤蛋白多肽的系统发生树 ( 图 6)。
2.4.PLATZ 多肽
使用逐步比对的 ClustalW 2.0 算法 (Thompson 等人 (1997)Nucleic Acids Res 25 : 4876-4882 ; Chenna 等 (2003).Nucleic Acids Res31 : 3497-3500) 实施多肽序列的比 对, 采用标准设定 ( 慢比对, 相似矩阵 : Gonnet, 空位开放罚分 10, 空位延伸罚分 0.2。进行 少量人工编辑以进一步优化比对。PLATZ 多肽比对在图 11 中。
该比对可以用于测定约 5 至 10 个氨基酸长度的保守特征序列。优选地使用蛋白 质的保守区, 由星号 ( 相同残基 )、 冒号 ( 高保守替换 ) 和圆点 ( 保守替换 ) 指出该保守区。
使用 MAFFT(Katoh 和 Toh(2008)Briefings in Bioinformatics 9 : 286-298) 构 建 PLATZ 多肽的系统发生树 ( 图 12)。使用 QuickTree(Howe 等人 (2002), Bioinformatics 18(11) : 1546-7), 100 次自引重复计算邻接树。使用 Dendroscope(Huson 等人 (2007), BMC Bioinformatics 8(1) : 460) 绘制环形系统发生图。显示了主要分支的 100 次自引重复后 的置信度。
2.5.PLST 样多肽
[1000] 使用逐步比对的 ClustalW 2.0 算法 (Thompson 等人 (1997)Nucleic Acids Res 25 : 4876-4882 ; Chenna 等 (2003).Nucleic Acids Res31 : 3497-3500) 实施多肽序列的比 对, 采用标准设定 ( 慢比对, 相似矩阵 : Gonnet 或 Blosum 62( 如果比对多肽 ), 空位开放罚 分 10, 空位延伸罚分 0.2。
[1001] 用在来自 Vector NTI(Invitrogen) 的 AlignX 程序中提供的邻接聚类算法构建 PLST 样多肽的系统发生树 ( 图 15)。
[1002] 2.6.Glomalin 多肽
[1003] 使用逐步比对的 ClustalW 2.0 算法 (Thompson 等人 (1997)Nucleic Acids Res 25 : 4876-4882 ; Chenna 等 (2003).Nucleic Acids Res31 : 3497-3500) 实施多肽序列的比对, 采用标准设定 ( 慢比对, 相似矩阵 : Gonnet, 空位开放罚分 10, 空位延伸罚分 0.2。进行 少量人工编辑以进一步优化比对。Glomalin 多肽比对在图 18 中。
[1004] 用在来自 Vector NTI(Invitrogen) 的 AlignX 程序中提供的邻接聚类算法构建 Glomalin 多肽的系统发生树 ( 图 19)。
[1005] 实施例 3 : 计算在用于实施本发明方法的多肽序列之间的全局百分比同一性
[1006] 3.1.eRF1 多肽
[1007] 使 用 本 领 域 可 获 得 的 方 法 之 一 MatGAT( 矩 阵 全 局 比 对 工 具 ) 软 件 (BMC Bioinformatics.20034 : 29.MatGAT : an application that generates similarity/ identity matrices using protein or DNA sequences.Campanella JJ, Bitincka L, Smalley J ; 软件由 Ledion Bitincka 提供 ) 确定用于实施本发明方法的全长多肽序列之间 全局相似性百分数和同一性百分数。 MatGAT 软件为 DNA 序列或蛋白质序列产生相似性 / 同 一性矩阵, 无需数据的预比对。该程序使用 Myers 和 Miller 全局比对算法 ( 空位开放罚分 12 和空位延伸罚分 2) 执行一系列逐对比对, 使用例如 Blosum 62( 对于多肽 ) 计算相似性 和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示, 序列 同一性在对角分界线的上半部分中显示。
[1008] 比较中所用的参数是 :
[1009] 评分矩阵 : Blosum62
[1010] 第一空位 : 12
[1011] 延伸空位 : 2
[1012] 多肽序列全长上的全局相似性和同一性软件分析结果在表 B1 中显示。同一性百 分数以黑体在对角线之上给出并且相似性百分数在对角线之下给出 ( 正常字体 )。
[1013] 在实施本发明方法中有用的 eRF1 多肽序列之间的百分比同一性可低至与 SEQ ID NO : 2 相比为 49%的氨基酸同一性。
[1014] 3.2.SCAMP 样多肽 使 用 本 领 域 可 获 得 的 方 法 之 一 MatGAT( 矩 阵 全 局 比 对 工 具 ) 软 件 (BMCBioinformatics.2003 4 : 29.MatGAT : an application that generates similarity/ identity matrices using protein or DNA sequences.Campanella JJ, Bitincka L, Smalley J ; 软件由 Ledion Bitincka 提供 ) 确定用于实施本发明方法的全长多肽序列之间 全局相似性百分数和同一性百分数。 MatGAT 软件为 DNA 序列或蛋白质序列产生相似性 / 同 一性矩阵, 无需数据的预比对。该程序使用 Myers 和 Miller 全局比对算法 ( 空位开放罚分 12 和空位延伸罚分 2) 执行一系列逐对比对, 使用例如 Blosum 62( 对于多肽 ) 计算相似性 和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示, 序列 同一性在对角分界线的上半部分中显示。
[1017] 比较中通常所用的参数是 :
[1018] 评分矩阵 : Blosum62
[1019] 第一空位 : 12
[1020] 延伸空位 : 2
[1021] 3.3. 肌原纤蛋白多肽
[1022] 使用 MatGAT( 矩阵全局比对工具 ) 软件 (BMC Bioinformatics.20034 : 29.MatGAT : an application that generates similarity/identity matrices using protein or DNA sequences.Campanella JJ, Bitincka L, Smalley J ; 软件由 Ledion Bitincka 提供 ) 确定 用于实施本发明方法的全长多肽序列之间全局相似性百分数和同一性百分数。 MatGAT 软件 为 DNA 序列或蛋白质序列产生相似性 / 同一性矩阵, 无需数据的预比对。 该程序使用 Myers 和 Miller 全局比对算法 ( 空位开放罚分 12 和空位延伸罚分 2) 执行一系列逐对比对, 使用 例如 Blosum 62( 对于多肽 ) 计算相似性和同一性并且随后将结果置于距离矩阵中。序列 相似性在分界线的下半部分中显示, 序列同一性在对角分界线的上半部分中显示。
[1023] 比较中所用的参数是 :
[1024] 评分矩阵 : Blosum62
[1025] 第一空位 : 12
[1026] 延伸空位 : 2
[1027] 多肽序列全长上的全局相似性和同一性软件分析结果在表 B2 中显示。同一性百 分数在对角线之上给出并且相似性百分数在对角线之下给出。
[1028] 还可以制作关于特定结构域例如在 PAP 肌原纤蛋白结构域上或者在羧基端结构 域上的局部比对, 或者在特定结构域之间的同一性 / 相似性百分数的数据的 MATGAT 表格。
[1030] 3.4.PLATZ 多肽
[1032] 使 用 本 领 域 可 获 得 的 方 法 之 一 MatGAT( 矩 阵 全 局 比 对 工 具 ) 软 件 (BMC Bioinformatics.20034 : 29.MatGAT : an application that generates similarity/ identity matrices using protein or DNA sequences.Campanella JJ, Bitincka L, Smalley J ; 软件由 Ledion Bitincka 提供 ) 确定用于实施本发明方法的全长多肽序列之间 全局相似性百分数和同一性百分数。 MatGAT 软件为 DNA 序列或蛋白质序列产生相似性 / 同 一性矩阵, 无需数据的预比对。该程序使用 Myers 和 Miller 全局比对算法 ( 空位开放罚分 12 和空位延伸罚分 2) 执行一系列逐对比对, 使用例如 Blosum 62( 对于多肽 ) 计算相似性 和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示, 序列 同一性在对角分界线的上半部分中显示。
[1033] 比较中所用的参数是 :
[1034] 评分矩阵 : Blosum62
[1035] 第一空位 : 12
[1036] 延伸空位 : 2
[1037] 多肽序列全长上的全局相似性和同一性软件分析结果在表 B3 中显示。同一性百 分数以黑体在对角线之上给出并且相似性百分数在对角线之下给出 ( 正常字体 )。
[1038] 在实施本发明方法中有用的 PLATZ-A1-α 多肽序列之间的百分比同一性可低至 与 SEQ ID NO : 261 相比为 65%的氨基酸同一性。
[1039] 3.5.PLST 样多肽
[1041] 使 用 本 领 域 可 获 得 的 方 法 之 一 MatGAT( 矩 阵 全 局 比 对 工 具 ) 软 件 (BMC Bioinformatics.20034 : 29.MatGAT : an application that generates similarity/ identity matrices using protein or DNA sequences.Campanella JJ, Bitincka L, Smalley J ; 软件由 Ledion Bitincka 提供 ) 确定用于实施本发明方法的全长多肽序列之间 全局相似性百分数和同一性百分数。 MatGAT 软件为 DNA 序列或蛋白质序列产生相似性 / 同
[1040] 一性矩阵, 无需数据的预比对。该程序使用 Myers 和 Miller 全局比对算法 ( 空位开放罚分 12 和空位延伸罚分 2) 执行一系列逐对比对, 使用例如 Blosum 62( 对于多肽 ) 计算相似性 和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示, 序列 同一性在对角分界线的上半部分中显示。
[1042] 比较中所用的参数是 :
[1043] 评分矩阵 : Blosum62
[1044] 第一空位 : 12
[1045] 延伸空位 : 2
[1046] 多肽序列全长上的全局相似性和同一性软件分析结果在表 B4 中显示。同一性百 分数以黑体在对角线之上给出并且相似性百分数在对角线之下给出 ( 正常字体 )。
[1047] 在实施本发明方法中有用的 PLST 样多肽序列之间的百分比同一性可低至与 SEQ ID NO : 411 相比为 49%的氨基酸同一性。
[1048] 3.6.Glomalin 多肽
[1050] 使 用 本 领 域 可 获 得 的 方 法 之 一 MatGAT( 矩 阵 全 局 比 对 工 具 ) 软 件 (BMC Bioinformatics.2003 4 : 29.MatGAT : an application that generates similarity/ identity matrices using protein or DNA sequences.Campanella JJ, Bitincka L, Smalley J ; 软件由 Ledion Bitincka 提供 ) 确定用于实施本发明方法的全长多肽序列之间 全局相似性百分数和同一性百分数。 MatGAT 软件为 DNA 序列或蛋白质序列产生相似性 / 同 一性矩阵, 无需数据的预比对。该程序使用 Myers 和 Miller 全局比对算法 ( 空位开放罚分 12 和空位延伸罚分 2) 执行一系列逐对比对, 使用例如 Blosum 62( 对于多肽 ) 计算相似性
[1049] 和同一性并且随后将结果置于距离矩阵中。序列相似性在分界线的下半部分中显示, 序列 同一性在对角分界线的上半部分中显示。
[1051] 比较中所用的参数是 :
[1052] 评分矩阵 : Blosum62 ; 第一空位 : 12 ; 延伸空位 : 2
[1053] 多肽序列全长上的全局相似性和同一性软件分析结果在表 B 中显示。同一性百分 数以黑体在对角线之上给出并且相似性百分数在对角线之下给出 ( 正常字体 )。
[1054] 在实施本发明方法中有用的 Glomalin 多肽序列之间的序列同一性 ( 以%表示 ) 与 SEQ ID NO : 546 相比一般高于 50%。
[1055] 实施例 4 : 鉴定用于实施本发明方法的多肽序列中包含的结构域
[1059] 4.1.eRF1 多肽
[1060] 蛋 白 质 家 族、 结 构 域 和 位 点 集 成 资 源 (Integrated Resouce of Protein Families, domain and Site, InterPro) 数据库是基于文本和序列进行检索的通常所用特 征序列数据库的集成界面。InterPro 数据库组合了这些数据库, 所述的数据库使用不同方
[1058] 法学和不同程度的有关已充分表征蛋白质的生物学信息以得到蛋白质特征序列。 合作数据 库包括 SWISS-PROT、 PROSITE、 TrEMBL、 PRINTS、 ProDom 和 Pfam、 Smart 和 TIGRFAMs。Pfam 是覆盖许多常见蛋白质结构域和家族的, 多重序列比对和隐藏的马尔可夫模型 (hidden Markov models) 的大集合。Pfam 由大不列颠联合王国的 Sanger 研究所的服务器所维护。 Interpro 由大不列颠联合王国的欧洲生物信息研究所维护。
[1061] 如 SEQ ID NO : 2 所表示的多肽序列的 InterPro 扫描结果在表 C1 中示出。
[1062] 表 C1 : SEQ ID NO : 2 所示多肽序列的 InterPro 扫描结果 ( 主要登录号 )。
[1063] 4.2.SCAMP 样多肽
[1067] Pfam 是覆盖许多常见蛋白质结构域和家族的, 多重序列比对和隐藏的马尔可夫模 型的大集合。Pfam 由大不列颠联合王国的 Sanger 研究所的服务器上维护。
[1068] 如 SEQ ID NO : 89 所表示的多肽序列的保守 HMM Pfam 结构域的 Pfam 扫描结果在 表 C2 中示出。
[1066] 表 C2 : SEQ ID NO : 89 所示多肽序列的 InterPro 扫描结果 ( 主要登录号 )
[1070] 4.3. 肌原纤蛋白多肽
[1072] 蛋 白 质 家 族、 结 构 域 和 位 点 集 成 资 源 (Integrated Resouce of Protein Families, domain and Site, InterPro) 数据库是基于文本和序列进行检索的通常所用特 征序列数据库的集成界面。InterPro 数据库组合了这些数据库, 所述的数据库使用不同方 法学和不同程度的有关已充分表征蛋白质的生物学信息以得到蛋白质特征序列。 合作数据 库包括 SWISS-PROT、 PROSITE、 TrEMBL、 PRINTS、 ProDom 和 Pfam、 Smart 和 TIGRFAMs。Pfam 是覆盖许多常见蛋白质结构域和家族的, 多重序列比对和隐藏的马尔可夫模型 (hidden Markov models) 的大集合。Pfam 由大不列颠联合王国的 Sanger 研究所的服务器上维护。 Interpro 由大不列颠联合王国的欧洲生物信息研究所维护。
[1073] 如 SEQ ID NO : 205 所表示的多肽序列的 InterPro 扫描结果在表 C3 中示出。
[1074] 表 C3 : SEQ ID NO : 205 所示多肽序列的 InterPro 扫描结果 ( 主要登录号 )
[1071] 4.4.PLATZ 多肽
[1077] 蛋 白 质 家 族、 结 构 域 和 位 点 集 成 资 源 (Integrated Resouce of Protein Families, domain and Site, InterPro) 数据库是基于文本和序列进行检索的通常所用特 征序列数据库的集成界面。InterPro 数据库组合了这些数据库, 所述的数据库使用不同方 法学和不同程度的有关已充分表征蛋白质的生物学信息以得到蛋白质特征序列。 合作数据 库包括 SWISS-PROT、 PROSITE、 TrEMBL、 PRINTS、 ProDom 和 Pfam、 Smart 和 TIGRFAMs。Pfam 是覆盖许多常见蛋白质结构域和家族的, 多重序列比对和隐藏的马尔可夫模型 (hidden Markov models) 的大集合。Pfam 由大不列颠联合王国的 Sanger 研究所的服务器上维护。 Interpro 由大不列颠联合王国的欧洲生物信息研究所维护。
[1078] 如 SEQ ID NO : 261 所表示的多肽序列的 InterPro 扫描结果在表 C4 中示出。
[1079] 表 C4 : SEQ ID NO : 261 所示多肽序列的 InterPro 扫描结果 ( 主要登录号 )
[1076] 4.5.PLST 样多肽
[1082] 蛋 白 质 家 族、 结 构 域 和 位 点 集 成 资 源 (Integrated Resouce of Protein Families, domain and Site, InterPro) 数据库是基于文本和序列进行检索的通常所用特 征序列数据库的集成界面。InterPro 数据库组合了这些数据库, 所述的数据库使用不同方 法学和不同程度的有关已充分表征蛋白质的生物学信息以得到蛋白质特征序列。 合作数据
[1081] 库包括 SWISS-PROT、 PROSITE、 TrEMBL、 PRINTS、 ProDom 和 Pfam、 Smart 和 TIGRFAMs。Pfam 是覆盖许多常见蛋白质结构域和家族的, 多重序列比对和隐藏的马尔可夫模型 (hidden Markov models) 的大集合。Pfam 由大不列颠联合王国的 Sanger 研究所的服务器上维护。 Interpro 由大不列颠联合王国的欧洲生物信息研究所维护。
[1083] 如 SEQ ID NO : 411 所表示的多肽序列的 InterPro 扫描结果在表 C5 中示出。
[1084] 表 C5 : SEQ ID NO : 411 所示多肽序列的 InterPro 扫描结果 ( 主要登录号 )
[1085] 4.6.Glomalin 多肽
[1087] 蛋 白 质 家 族、 结 构 域 和 位 点 集 成 资 源 (Integrated Resouce of Protein Families, domain and Site, InterPro) 数据库是基于文本和序列进行检索的通常所用特 征序列数据库的集成界面。InterPro 数据库组合了这些数据库, 所述的数据库使用不同方 法学和不同程度的有关已充分表征蛋白质的生物学信息以得到蛋白质特征序列。 合作数据 库包括 SWISS-PROT、 PROSITE、 TrEMBL、 PRINTS、 ProDom 和 Pfam、 Smart 和 TIGRFAMs。Pfam 是覆盖许多常见蛋白质结构域和家族的, 多重序列比对和隐藏的马尔可夫模型 (hidden Markov models) 的大集合。Pfam 由大不列颠联合王国的 Sanger 研究所的服务器上维护。 Interpro 由大不列颠联合王国的欧洲生物信息研究所维护。
[1088] 如 SEQ ID NO : 546 所表示的多肽序列的 InterPro 扫描结果在表 C6 中示出。
[1089] 表 C6 : SEQ ID NO : 546 所示多肽序列的 InterPro 扫描结果 ( 主要登录号 )。
[1086] 此外, SEQ ID NO : 546 具有 3 个 N- 糖基化位点 (Prosite PS00001) : 110-NATN-113, 113-NDTA-116 和 432-NATK-435。
[1093] 实施例 5 : 用于实施本发明方法的多肽序列的拓扑学预测
[1094] 5.1.eRF1 多肽
[1095] TargetP 1.1 预测真核蛋白质的亚细胞定位。位置分配是基于经预测存在的任何 N 端前序列 : 叶绿体转运肽 (cTP)、 线粒体靶向肽 (mTP) 或分泌途径信号肽 (SP)。最终预测 所依据的评分并不是真正的概率, 并且它们未必加起来等于一。 然而, 具有最高评分的位置 根据 TargetP 是最有可能的, 并且评分之间的关系 ( 可靠性类别 ) 可以是预测的肯定性的 一个指标。可靠性类别 (RC) 范围从 1 至 5, 其中 1 表示最强预测。TargetP 在丹麦技术大 学 (Technical University of Denmark) 的服务器上维护。
[1096] 对于预测含有 N 端前序列的序列, 也可以预测潜在的切割位点。
[1097] 选择了众多参数, 如生物群 ( 非植物或植物 )、 临界设置 (cutoff set)( 无、 临界的 预定义设置或临界的用户指定设置 ) 和对切割位点预测的计算 ( 是或否 )。
[1098] 众多其它算法可以用来执行此类分析, 包括 :
[1099] ·在丹麦技术大学服务器上维护的 ChloroP 1.1 ;
[1100] · 在 澳 大 利 亚 布 里 斯 班 昆 士 兰 大 学 分 子 生 物 科 学 研 究 所 (Institute for Molecular Bioscience, University of Queensland, Brisbane, Australia) 的服务器上维 护的蛋白质 Prowler 亚细胞定位预测程序 (Protein Prowler Subcellular Localisation Predictor) 第 1.2 版 ;
[1101] · 在加拿大阿尔伯塔省埃德蒙顿市阿尔伯塔大学 (University of Alberta, Edmonton, Alberta, Canada) 的服务器上维护的 PENCE Proteome Analyst PA-GOSUB 2.5 ;
[1092] ·在丹麦技术大学服务器上维护的 TMHMM ;
[1103] ·PSORT(URL : psort.org)。
[1104] ·PLOC(Park 和 Kanehisa, Bioinformatics, 19, 1656-1663, 2003)。
[1105] 5.2.SCAMP 样多肽
[1106] TargetP 1.1 预测真核蛋白质的亚细胞定位。位置分配是基于经预测存在的任何 N 端前序列 : 叶绿体转运肽 (cTP)、 线粒体靶向肽 (mTP) 或分泌途径信号肽 (SP)。最终预测 所依据的评分并不是真正的概率, 并且它们未必加起来等于一。 然而, 具有最高评分的位置 根据 TargetP 是最有可能的, 并且评分之间的关系 ( 可靠性类别 ) 可以是预测的肯定性的 一个指标。可靠性类别 (RC) 范围从 1 至 5, 其中 1 表示最强预测。TargetP 在丹麦技术大 学的服务器上维护。
[1107] 对于预测含有 N 端前序列的序列, 也可以预测潜在的切割位点。
[1108] 众多其它算法可以用来执行此类分析, 包括 :
[1109] ·在丹麦技术大学服务器上维护的 ChloroP 1.1 ;
[1110] ·在澳大利亚布里斯班昆士兰大学分子生物科学研究所的服务器上维护的蛋白质 Prowler 亚细胞定位预测程序第 1.2 版 ;
[1111] · 在 加 拿 大 阿 尔 伯 塔 省 埃 德 蒙 顿 市 阿 尔 伯 塔 大 学 的 服 务 器 上 维 护 的 PENCE Proteome Analyst PA-GOSUB 2.5 ;
[1112] ·在丹麦技术大学服务器上维护的 TMHMM ;
[1113] ·PSORT(URL : psort.org)。
[1114] ·PLOC(Park 和 Kanehisa, Bioinformatics, 19, 1656-1663, 2003)。
[1115] 5.3. 肌原纤蛋白多肽
[1116] TargetP 1.1 预测真核蛋白质的亚细胞定位。位置分配是基于经预测存在的任何 N 端前序列 : 叶绿体转运肽 (cTP)、 线粒体靶向肽 (mTP) 或分泌途径信号肽 (SP)。最终预测 所依据的评分并不是真正的概率, 并且它们未必加起来等于一。 然而, 具有最高评分的位置 根据 TargetP 是最有可能的, 并且评分之间的关系 ( 可靠性类别 ) 可以是预测的肯定性的 一个指标。可靠性类别 (RC) 范围从 1 至 5, 其中 1 表示最强预测。TargetP 在丹麦技术大 学的服务器上维护。
[1117] 对于预测含有 N 端前序列的序列, 也可以预测潜在的切割位点。选择了众多参数, 如生物群 ( 非植物或植物 )、 临界设置 (cutoff set)( 无、 临界的预定义设置或临界的用户 指定设置 ) 和对切割位点预测的计算 ( 是或否 )。
[1118] 众多其它算法可以用来执行此类分析, 包括 :
[1119] ·在丹麦技术大学服务器上维护的 ChloroP 1.1 ;
[1120] ·在澳大利亚布里斯班昆士兰大学分子生物科学研究所的服务器上维护的蛋白质 Prowler 亚细胞定位预测程序第 1.2 版 ;
[1121] · 在 加 拿 大 阿 尔 伯 塔 省 埃 德 蒙 顿 市 阿 尔 伯 塔 大 学 的 服 务 器 上 维 护 的 PENCE Proteome Analyst PA-GOSUB 2.5 ;
[1122] ·在丹麦技术大学服务器上维护的 TMHMM ;
[1123] ·PSORT(URL : psort.org)。
[1124] ·PLOC(Park 和 Kanehisa, Bioinformatics, 19, 1656-1663, 2003)。5.4.PLATZ 多肽
[1126] TargetP 1.1 预测真核蛋白质的亚细胞定位。位置分配是基于经预测存在的任何 N 端前序列 : 叶绿体转运肽 (cTP)、 线粒体靶向肽 (mTP) 或分泌途径信号肽 (SP)。最终预测 所依据的评分并不是真正的概率, 并且它们未必加起来等于一。 然而, 具有最高评分的位置 根据 TargetP 是最有可能的, 并且评分之间的关系 ( 可靠性类别 ) 可以是预测的肯定性的 一个指标。可靠性类别 (RC) 范围从 1 至 5, 其中 1 表示最强预测。TargetP 在丹麦技术大 学的服务器上维护。
[1127] 对于预测含有 N 端前序列的序列, 也可以预测潜在的切割位点。
[1128] 选择了众多参数, 如生物群 ( 非植物或植物 )、 临界设置 (cutoff set)( 无、 临界的 预定义设置或临界的用户指定设置 ) 和对切割位点预测的计算 ( 是或否 )。
[1129] 如 SEQ ID NO : 261 所表示的多肽序列的 TargetP 1.1 分析的结果在表 D1 中显示。 已经选择 “植物” 生物群, 未定义临界值并且需要转运肽的预测长度。SEQ ID NO : 261 所示 多肽序列的亚细胞定位预测可以是在细胞质或者细胞核, 没有预测到转运肽。
[1130] 表 D1 : SEQ ID NO : 261 所示多肽序列的 TargetP 1.1 分析。缩写 : Len, 长度 ; cTP, 叶绿体转运肽 ; mTP, 线粒体转运肽, SP, 分泌途径信号肽, 其他, 其他亚细胞靶向, Loc, 预测 的定位 ; RC, 可靠性类别 ; TPlen, 预测的转运肽长度。
[1131] 众多其它算法可以用来执行此类分析, 包括 :
[1133] ·在丹麦技术大学服务器上维护的 ChloroP 1.1 ;
[1134] ·在澳大利亚布里斯班昆士兰大学分子生物科学研究所的服务器上维护的蛋白质 Prowler 亚细胞定位预测程序第 1.2 版 ;
[1135] · 在 加 拿 大 阿 尔 伯 塔 省 埃 德 蒙 顿 市 阿 尔 伯 塔 大 学 的 服 务 器 上 维 护 的 PENCE Proteome Analyst PA-GOSUB 2.5 ;
[1136] ·在丹麦技术大学服务器上维护的 TMHMM ;
[1137] ·PSORT(URL : psort.org)。
[1138] ·PLOC(Park 和 Kanehisa, Bioinformatics, 19, 1656-1663, 2003)。
[1139] 5.5.PLST 样多肽
[1140] TargetP 1.1 预测真核蛋白质的亚细胞定位。位置分配是基于经预测存在的任何 N 端前序列 : 叶绿体转运肽 (cTP)、 线粒体靶向肽 (mTP) 或分泌途径信号肽 (SP)。最终预测 所依据的评分并不是真正的概率, 并且它们未必加起来等于一。 然而, 具有最高评分的位置 根据 TargetP 是最有可能的, 并且评分之间的关系 ( 可靠性类别 ) 可以是预测的肯定性的 一个指标。可靠性类别 (RC) 范围从 1 至 5, 其中 1 表示最强预测。TargetP 在丹麦技术大 学的服务器上维护。
[1141] 对于预测含有 N 端前序列的序列, 也可以预测潜在的切割位点。
[1142] TargetP 1.1 预测结果
[1143] 查询序列数 : 1
[1132] 包括了切割位点预测。 使用 PLANT 网络 (PLANT network)。选择了众多参数, 如生物群 ( 非植物或植物 )、 临界设置 (cutoff set)( 无、 临界的 预定义设置或临界的用户指定设置 ) 和对切割位点预测的计算 ( 是或否 )。
[1148] 众多其它算法可以用来执行此类分析, 包括 :
[1149] ·在丹麦技术大学服务器上维护的 ChloroP 1.1 ;
[1150] ·在澳大利亚布里斯班昆士兰大学分子生物科学研究所的服务器上维护的蛋白质 Prowler 亚细胞定位预测程序第 1.2 版 ;
[1151] · 在 加 拿 大 阿 尔 伯 塔 省 埃 德 蒙 顿 市 阿 尔 伯 塔 大 学 的 服 务 器 上 维 护 的 PENCE Proteome Analyst PA-GOSUB 2.5 ;
[1147] ·在丹麦技术大学服务器上维护的 TMHMM ;
[1153] ·PSORT(URL : psort.org)。
[1154] ·PLOC(Park 和 Kanehisa, Bioinformatics, 19, 1656-1663, 2003)。
[1155] 5.6.Glomalin 多肽
[1156] TargetP 1.1 预测真核蛋白质的亚细胞定位。位置分配是基于经预测存在的任何 N 端前序列 : 叶绿体转运肽 (cTP)、 线粒体靶向肽 (mTP) 或分泌途径信号肽 (SP)。最终预测 所依据的评分并不是真正的概率, 并且它们未必加起来等于一。 然而, 具有最高评分的位置 根据 TargetP 是最有可能的, 并且评分之间的关系 ( 可靠性类别 ) 可以是预测的肯定性的 一个指标。可靠性类别 (RC) 范围从 1 至 5, 其中 1 表示最强预测。TargetP 在丹麦技术大 学的服务器上维护。
[1157] 对于预测含有 N 端前序列的序列, 也可以预测潜在的切割位点。
[1158] 选择了众多参数, 如生物群 ( 非植物或植物 )、 临界设置 (cutoff set)( 无、 临界的 预定义设置或临界的用户指定设置 ) 和对切割位点预测的计算 ( 是或否 )。
[1159] 如 SEQ ID NO : 546 所表示的多肽序列的 TargetP 1.1 分析的结果在表 D2 中显示。 已经选择 “植物” 生物群, 未定义临界值并且需要转运肽的预测长度。SEQ ID NO : 546 所示 多肽序列的亚细胞定位最可能是在线粒体 ( 其与来自 PSORT 的结果一致 ), 但也可能在叶绿 体。
[1160] 表 D2 : SEQ ID NO : 546 所示多肽序列的 TargetP 1.1 分析。缩写 : Len, 长度 ; cTP, 叶绿体转运肽 ; mTP, 线粒体转运肽, SP, 分泌途径信号肽, 其他, 其他亚细胞靶向, Loc, 预测 的定位 ; RC, 可靠性类别 ; TPlen, 预测的转运肽长度。
[1152] 众多其它算法可以用来执行此类分析, 包括 :
[1163] ·在丹麦技术大学服务器上维护的 ChloroP 1.1 ;
[1164] ·在澳大利亚布里斯班昆士兰大学分子生物科学研究所的服务器上维护的蛋白质 Prowler 亚细胞定位预测程序第 1.2 版 ;
[1165] · 在 加 拿 大 阿 尔 伯 塔 省 埃 德 蒙 顿 市 阿 尔 伯 塔 大 学 的 服 务 器 上 维 护 的 PENCE Proteome Analyst PA-GOSUB 2.5 ;
[1166] ·在丹麦技术大学服务器上维护的 TMHMM ;
[1167] ·PSORT(URL : psort.org)。
[1168] ·PLOC(Park 和 Kanehisa, Bioinformatics, 19, 1656-1663, 2003)。
[1169] 实施例 6 : 与用于实施本发明方法的多肽序列相关的测定
[1170] 6.1.PLATZ 多肽
[1171] PLATZ 蛋白质结合 DNA 的测定描述于 Nagano 等人 (2001) 中。 简言之, 在含 2μg 的 聚 (dI-dC)- 聚 (dI-dC)、 牛血清白蛋白 (500μg/μl) 和竞争剂 DNA 的结合缓冲液 (20μl) 中, 使用来源于豌豆 pra2 转录起始位点下游 -734 至 -667 区域的 [γ-32P]ATP 标记探针实 施标准的电泳迁移率变动分析 (EMSA)。使用重组产生并随后纯化的 PLATZ 蛋白质, 蛋白 32 在 5%的 质 -DNA 复合物通过用 P 标记的探针在 25℃温育该混合物 20 分钟形成。在 4℃, 聚丙烯酰胺 Tris- 硼酸盐 /EDTA 凝胶中进行电泳。干燥后, 将凝胶进行放射自显影。PLATZ 蛋白质结合 DNA 需要锌离子可以通过添加 0-5mM 浓度的 1, 10- 邻二氮杂菲得到测试。
[1172] 实施例 7 : 用于本发明方法的核酸序列的克隆
[1173] 7.1.eRF1 多肽
[1174] 通过 PCR, 使用定制的稻幼苗 cDNA 文库 ( 在 pCMV Sport 6.0 中 ; Invitrogen, Paisley, 英国 ) 作为模板, 扩增在本发明方法中使用的核酸序列。在标准条件中使用 Hifi Taq DNA 聚合酶, 使用在 50μl PCR 混合物中的 200ng 模板实施 PCR。
[1175] 使用的引物为 : prm09556(fw)(SEQ ID NO : 86 ; 正义, 起始密码子为黑体 ) : 5’ -ggacaagtttgtacaaaaaagcaggcttaaacaatgggagacaaaaacgatgac-3’ 和 prm09557(rev) (SEQ ID NO : 87 ; 反 义, 互补的 ) : 5’ -ggggaccactttgtacaagaaagctgggttttgattgattgtca ttccga-3’ , 其包含用于 Gateway 重组的 AttB 位点。并使用标准方法纯化扩增的 PCR 片段。 随后实施 Gateway 方法的第一步骤, 即 BP 反应, 在此期间 PCR 片段与 pDONR201 质粒发生体 内重组以产生根据 Gateway 命名的 “进入克隆” , peRF1。质粒 pDONR201 作为 技术的部分从 Invitrogen 购买。
[1176] 含有 SEQ ID NO : 1 的进入克隆随后在 LR 反应中与一种用于稻转化的目的载体一 起使用。这种载体在 T-DNA 边界内含有作为功能性元件的 : 植物可选择标记 ; 可筛选标记 表达盒 ; 和意图与已经克隆于所述进入克隆内的目的核酸序列用于 LR 体内重组的 Gateway 盒。用于组成型特异表达的稻 GOS2 启动子 (SEQ ID NO : 85) 位于这种 Gateway 盒的上游。
[1177] LR 重组步骤之后, 获得的表达载体 pGOS2::eRF1( 图 2) 根据本领域众所周知的方 法转化至农杆菌菌株 LBA4044 中。
[1178] 7.2.SCAMP 样多肽
[1179] 通过 PCR, 使用定制的拟南芥幼苗 cDNA 文库 ( 在 pCMV Sport 6.0 中 ; Invitrogen, Paisley, 英国 ) 作为模板, 扩增在本发明方法中使用的核酸序列。在标准条件中使用 HifiTaq DNA 聚合酶, 使用在 50μl PCR 混合物中的 200ng 模板实施 PCR。使用的引物为 : prm13820(SEQ IDNO : 657 ; 正义 ) : 5’ -ggggacaagtttgtacaaaaaagcaggcttaaacaatggcacgac acgatccta-3’ 和 prm13821(SEQ ID NO : 658 ; 反义, 互补的 ) : 5’ -ggggaccactttgtacaagaaag ctgggttgatttcttcatagtgcacgc-3’ , 其包含用于 Gateway 重组的 AttB 位点。并使用标准方 法纯化扩增的 PCR 片段。随后实施 Gateway 方法的第一步骤, 即 BP 反应, 在此期间 PCR 片 段与 pDONR201 质粒发生体内重组以产生根据 Gateway 命名的 “进入克隆” , pSCAMP。质粒 pDONR201 作为
[1180] 技术的部分从 Invitrogen 购买。含有 SEQ ID NO : 88 的进入克隆随后在 LR 反应中与一种用于稻转化的目的载体一 起使用。 这种载体在 T-DNA 边界内含有作为功能性元件的 : 植物可选择标记 ; 可筛选标记表 达盒和意图与已经克隆于所述进入克隆内的目的核酸序列用于 LR 体内重组的 Gateway 盒。 用于组成型特异表达的稻 GOS2 启动子 (SEQ ID NO : 203) 位于这种 Gateway 盒的上游。
[1181] LR 重组步骤之后, 获得的表达载体 pGOS2::SCAMP-LIKE( 图 4) 根据本领域众所周 知的方法转化至农杆菌菌株 LBA4044 中。
[1182] 通过 PCR, 使用定制的拟南芥幼苗 cDNA 文库作为模板, 扩增在本发明方法中使用 的另外的核酸序列。在标准条件中使用 Hifi Taq DNA 聚合酶, 使用在 50μl PCR 混合物 659 ; 正义 ) : 5’ -ggggaca 中的 200ng 模板实施 PCR。使用的引物为 : prm13818(SEQ ID NO : agtttgtacaaaaaagcaggcttaaacaatgaatcgccaccacgat-3’ 和 prm13819(SEQ ID NO : 660 ; 反 义, 互补的 ) : 5’ -ggggaccactttgtacaagaaagctgggttctccttttcacttgtttccc-3’ , 其包含用 于 Gateway 重组的 AttB 位点。并使用标准方法纯化扩增的 PCR 片段。随后实施 Gateway 方法的第一步骤, 即 BP 反应, 在此期间 PCR 片段与 pDONR201 质粒发生体内重组以产生根 据 Gateway 命名的 “进入克隆” , pSCAMP。质粒 pDONR201 作为 Invitrogen 购买。 含有 SEQ ID NO : 663 的进入克隆随后在 LR 反应中与一种用于稻转化的目的载体 一起使用。 这种载体在 T-DNA 边界内含有作为功能性元件的 : 植物可选择标记 ; 可筛选标记 表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列用于 LR 体内重组的 Gateway 盒。用于组成型特异表达的稻 GOS2 启动子 (SEQ ID NO : 203) 位于这种 Gateway 盒的上游。
[1184] LR 重组步骤之后, 获得的表达载体 pGOS2::SCAMP-LIKEx 根据本领域众所周知的 方法转化至农杆菌菌株 LBA4044 中。
[1185] 通过 PCR, 使用定制的拟南芥幼苗 cDNA 文库作为模板, 扩增在本发明方法中使用 的另一核酸序列。在标准条件中使用 Hifi Taq DNA 聚合酶, 使用在 50μl PCR 混合物中 的 200ng 模板实施 PCR。使用的引物为 : prm13816(SEQ ID NO : 661 ; 正义 ) : 5’ -ggggacaagt
[1183] 技术的部分从ttgtacaaaaaagcaggcttaaacaatggctaatcgttatgatcca-3’ 和 prm13817(SEQ ID NO : 662 ; 反 义, 互补的 ) : 5’ -ggggaccactttgtacaagaaagctgggtcaaggagaactctca aacagc-3’ , 其包含用 于 Gateway 重组的 AttB 位点。并使用标准方法纯化扩增的 PCR 片段。随后实施 Gateway 方法的第一步骤, 即 BP 反应, 在此期间 PCR 片段与 pDONR201 质粒发生体内重组以产生根 据 Gateway 命名的 “进入克隆” , pSCAMP。质粒 pDONR201 作为 技术的部分从 Invitrogen 购买。
[1186] 含有 SEQ ID NO : 665 的进入克隆随后在 LR 反应中与一种用于稻转化的目的载体 一起使用。 这种载体在 T-DNA 边界内含有作为功能性元件的 : 植物可选择标记 ; 可筛选标记表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列用于 LR 体内重组的 Gateway 盒。用于组成型特异表达的稻 GOS2 启动子 (SEQ ID NO : 203) 位于这种 Gateway 盒的上游。
[1187] LR 重组步骤之后, 获得的表达载体 pGOS2::SCAMP-LIKEy 根据本领域众所周知的 方法转化至农杆菌菌株 LBA4044 中。
[1188] 7.3. 肌原纤蛋白多肽
[1189] 通过 PCR, 使用番茄 ( 番茄 (Solanum lycopersicum))cDNA 文库作为模板, 扩增在 本发明方法中使用的核酸序列。在标准条件中使用 Hifi Taq DNA 聚合酶, 使用在 50μl PCR 混合物中的 200ng 模板实施 PCR。 使用的引物为 : prm10420(SEQ ID NO : 258 ; 正义, 起始 密码子为黑体 ) : 5’ -ggggacaagtttgtacaaaaaagcaggcttaaacaatgatttcagcaggtttcg-3’ 和 prm10421(SEQ ID NO : 259 ; 反义, 互补的 ) : 5’ -ggggaccactttgtacaagaaagctgggtggctggtt ag caaataagagt-3’ , 其包含用于 Gateway 重组的 AttB 位点。并使用标准方法纯化扩增的 PCR 片段。随后实施 Gateway 方法的第一步骤, 即 BP 反应, 在此期间 PCR 片段与 pDONR201 质粒发生体内重组以产生根据 Gateway 命名的 “进入克隆” , pfibrillin。质粒 pDONR201 作 为
[1190] 技术的部分从 Invitrogen 购买。含有 SEQ ID NO : 204 的进入克隆随后在 LR 反应中与一种用于稻转化的目的载体 一起使用。 这种载体在 T-DNA 边界内含有作为功能性元件的 : 植物可选择标记 ; 可筛选标记 表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列用于 LR 体内重组的 Gateway 盒。用于组成型特异表达的稻 GOS2 启动子 (SEQ ID NO : 257) 位于这种 Gateway 盒的上游。
[1191] LR 重组步骤之后, 获得的表达载体 pGOS2::fibrillin( 图 9) 根据本领域众所周知 的方法转化至农杆菌菌株 LBA4044 中。
[1192] 7.4.PLATZ 多肽
[1193] 实施例 A
[1194] 在该实施例中, 通过 PCR, 使用定制的杨属物种幼苗 cDNA 文库 ( 在 pCMV Sport 6.0 中; Invitrogen, Paisley, 英国 ) 作为模板, 扩增在本发明方法中使用的核酸序列。在标准 条件中使用 Hifi Taq DNA 聚合酶, 使用在 50μl PCR 混合物中的 200ng 模板实施 PCR。 使用 的引物为 : prm13426(SEQ ID NO : 274 ; 正义, 起始密码子为黑体 ) : 5’ 互补的 ): 5’ ggggacaagtttg tacaaaaaagcaggcttaaacaatgggaactcaaaagcctgcat-3’ 和 prm13427(SEQ ID NO : 275 ; 反义, ggggaccactttgtacaagaaagctgggtttttcctaacataaaggagatcgatga-3’ , 其包含用于 Gateway 重组的 AttB 位点。并使用标准方法纯化扩增的 PCR 片段。随后实施 Gateway 方法的第一步骤, 即 BP 反应, 在此期间 PCR 片段与 pDONR201 质粒发生体内重组以 产生根据 Gateway 命名的 “进入克隆” , pPLATZ。质粒 pDONR201 作为 技术的部 分从 Invitrogen 购买。
[1195] 含有 SEQ ID NO : 260 的进入克隆随后在 LR 反应中与一种用于稻转化的目的载体 一起使用。 这种载体在 T-DNA 边界内含有作为功能性元件的 : 植物可选择标记 ; 可筛选标记 表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列用于 LR 体内重组的 Gateway 盒。用于组成型表达的稻 GOS2 启动子 (SEQ ID NO : 273) 位于这种 Gateway 盒的上游。
[1196] LR 重组步骤之后, 获得的表达载体 pGOS2::PLATZ( 图 13) 根据本领域众所周知的 方法转化至农杆菌菌株 LBA4044 中。实施例 B
[1198] 在另一实施例中, 通过 PCR, 使用定制的拟南芥幼苗 cDNA 文库作为模板, 扩增 另 一 个 核 酸 序 列。 在 标 准 条 件 中 使 用 Hifi Taq DNA 聚 合 酶, 使 用 在 50μl PCR 混 合 物 中 的 200ng 模 板 实 施 PCR。 使 用 的 引 物 为 : prm17901(SEQ ID NO : 613 ; 正义 ) : ggggacaagtttgtacaaaaaagca ggcttaaacaatggttagagaaggtgaagaa-3’ 和 prm17902(SEQ ID NO : 614 ; 反义, 互补的 ) : 5’ -ggggaccactttgtacaagaaagctgggttatgatttttgcctatggtt a-3’ , 其包含用于 Gateway 重组的 AttB 位点。使用标准方法纯化扩增的 PCR 片段。随后实 施 Gateway 方法的第一步骤, 即 BP 反应, 在此期间 PCR 片段与 pDONR201 质粒发生体内重组 以产生根据 Gateway 命名的另一个 “进入克隆” , pPLATZAt。 质粒 pDONR201 作为 技术的部分从 Invitrogen 购买。
[1199] 含有 SEQ ID NO : 356 的进入克隆随后在 LR 反应中与一种用于稻转化的目的载体 一起使用。 这种载体在 T-DNA 边界内含有作为功能性元件的 : 植物可选择标记 ; 可筛选标记 表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列用于 LR 体内重组的 Gateway 盒。用于组成型表达的稻 GOS2 启动子 (SEQ ID NO : 273) 位于这种 Gateway 盒的上游。
[1200] LR 重组步骤之后, 获得的表达载体 pGOS2::PLATZAt 根据本领域众所周知的方法 转化至农杆菌菌株 LBA4044 中。
[1201] 7.5.PLST 样多肽
[1202] 通 过 PCR, 使 用 定 制 的 杨 属 物 种 幼 苗 cDNA 文 库 ( 在 pCMV Sport6.0 中 ; Invitrogen, Paisley, 英国 ) 作为模板, 扩增在本发明方法中使用的核酸序列。在标准条件 中使用 Hifi Taq DNA 聚合酶, 使用在 50μlPCR 混合物中的 200ng 模板实施 PCR。
[1203] 使用的引物为 prm13192(fw)(SEQ ID NO : 543 ; 正义, 起始密码子为黑体 ) : 5’ ggggaccactttgtacaagaaagctgggtctcatctgggttggggacaagtttgtacaaaaa agcaggcttaaacaatggtcaatcttagaagtcct-3’ 和 prm13193(rev) (SEQ ID NO : 544 ; 反义, 互补的 ) : 5’ cttg taata-3’ , 其包含用于 Gateway 重组的 AttB 位点。使用标准方法纯化扩增的 PCR 片 段。随后实施 Gateway 方法的第一步骤, 即 BP 反应, 在此期间 PCR 片段与 pDONR201 质粒 发生体内重组以产生根据 Gateway 命名的 “进入克隆” , pPLST-like。质粒 pDONR201 作为 技术的部分从 Invitrogen 购买。 含有 SEQ ID NO : 410 的进入克隆随后在 LR 反应中与一种用于稻转化的目的载体 一起使用。 这种载体在 T-DNA 边界内含有作为功能性元件的 : 植物可选择标记 ; 可筛选标记 表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列用于 LR 体内重组的 Gateway 盒。用于组成型特异表达的稻 GOS2 启动子 (SEQ ID NO : 542) 位于这种 Gateway 盒的上游。
[1205] LR 重组步骤之后, 获得的表达载体 pGOS2::PLST-like( 图 2) 根据本领域众所周知 的方法转化至农杆菌菌株 LBA4044 中。
[1206] 7.6.Glomalin 多肽
[1207] 通过 PCR, 使用定制的稻幼苗 cDNA 文库 ( 在 pCMV Sport 6.0 中 ; Invitrogen, Paisley, 英国 ) 作为模板, 扩增核酸序列。 在标准条件中使用 Hifi Taq DNA 聚合酶, 使用在 50μl PCR 混合物中的 200ng 模板实施 PCR。使用的引物为 : prm13455(SEQ ID NO : 609 ; 正 义, 起始密码子为黑体 ) : 5’ -ggggacaagtttgtacaaaaaagcaggcttaaacaatgtaccgcgcggc-3’
[1204] 和 prm13456(SEQ ID NO : 610 ; 反义, 互补的 ) : 5’ -ggggaccactttgtacaagaaagctgggtttagta atccattccac ccat-3’ , 其包含用于 Gateway 重组的 AttB 位点。 并使用标准方法纯化扩增的 PCR 片段。随后实施 Gateway 方法的第一步骤, 即 BP 反应, 在此期间 PCR 片段与 pDONR201 质粒发生体内重组以产生根据 Gateway 命名的 “进入克隆” , pGlomalin。质粒 pDONR201 作 为
[1208] 技术的部分从 Invitrogen 购买。含有 SEQ ID NO : 545 的进入克隆随后在 LR 反应中与一种用于稻转化的目的载体 一起使用。 这种载体在 T-DNA 边界内含有作为功能性元件的 : 植物可选择标记 ; 可筛选标记 表达盒和意图与已经克隆于所述进入克隆内的目的核酸序列用于 LR 体内重组的 Gateway 盒。用于根特异表达的稻 RCc3 启动子 (SEQ ID NO : 611) 位于这种 Gateway 盒的上游。
[1209] LR 重组步骤之后, 获得的表达载体 pRCc3::Glomalin( 图 19) 根据本领域众所周知 的方法转化至农杆菌菌株 LBA4044 中。
[1210] 实施例 8 : 植物转化
[1211] 稻转化
[1212] 含有表达载体的农杆菌用来转化稻植物。将稻的日本栽培品种 Nipponbare 的成 熟干燥种子脱壳。通过在 70%乙醇中孵育一分钟, 随后在 0.2% HgCl2 中 30 分钟, 随后用 无菌蒸馏水洗涤 6 次 15 分钟而实施消毒。消毒的种子随后在含有 2, 4-D 的培养基 ( 俞伤 组织诱导培养基 ) 上萌发。在黑暗中孵育 4 周后, 将胚胎发生的, 来自小盾片的愈伤组织切 下并在同一种培养基上增殖。 2 周后, 愈伤组织通过在同一种培养基上继代培养另外 2 周而 繁殖或增殖。胚发生性愈伤组织片在新鲜培养基上继代培养 3 日, 之后共培育 ( 以增强细 胞分裂活性 )。
[1213] 含有表达载体的农杆菌菌株 LBA4404 用于共培育。农杆菌接种在含有适宜抗生素 的 AB 培养基上并在 28℃培养 3 日。随后将细菌收集并重悬在液体共培育培养基中至密度 (OD600) 约 1。将混悬液随后转移至培养皿并将愈伤组织在该混悬液内浸泡 15 分钟。愈伤 组织随后在滤纸上吸干并转移至固化的共培育培养基上并且在黑暗中于 25℃孵育 3 日。 共 培育的愈伤组织在黑暗中于 28℃在选择剂存在下于含有 2, 4-D 的培养基上培育 4 周。 在此 时段期间, 形成迅速生长的抗性愈伤组织岛。在这种材料转移至再生培养基并在光照下培 育后, 胚发生潜力释放并且苗在随后 4 至 5 周发育。将苗从愈伤组织中切下并且在含有生 长素的培养基上培育 2 至 3 周, 将苗从所述的培养基上转移至土壤。硬化的苗在高湿度和 短日照下于温室中培育。
[1214] 对一个构建体而言产生约 35 个独立的 T0 稻转化体。原代转化体从组织培养箱转 移至温室。 在定量 PCR 分析以验证 T-DNA 插入物的拷贝数后, 仅保留表现选择剂耐受性的单 拷贝转基因植物用于收获 T1 种子。种子随后在移植后 3 至 5 月收获。本方法以超过 50% 的比率产生单一基因座转化体 (Aldemita 和 Hodges1996, Chan 等 1993, Hiei 等 1994)。
[1215] 实施例 9 : 其他作物的转化
[1216] 玉米转化
[1217] 玉米 ( 玉蜀黍 ) 的转化根据 Ishida 等 (1996.Nature Biotech 14(6) : 745-50) 描 述方法的改进方法进行。 在玉米中的转化是基因型依赖的并且仅特定的基因型可适用于转 化和再生。近交系 A188( 明尼苏达大学 ) 或以 A188 作为亲本的杂种是用于转化的供体材 料的良好来源, 但是其它基因型也可以成功地使用。在授粉后 (DAP) 大约 11 日从玉米植物中收获玉米穗, 此时不成熟胚的长度是大约 1 至 1.2mm。 不成熟胚与含有表达载体的根癌农 杆菌共培育并且转基因植物通过器官发生而回收。切下的胚在愈伤组织诱导培养基上、 随 后在玉米再生培养基上培育, 其中所述的再生培养基含有选择剂 ( 例如咪唑啉酮, 但可以 使用多种选择标记 )。培养板在 25℃于光照下培养 2-3 周, 或直至苗发育。将绿色苗从每 个胚转移至玉米生根培养基并在 25℃培养 2-3 周, 直至根发育。将生根的苗移植至温室的 土壤中。从表现选择剂耐受的并含有单拷贝的 T-DNA 插入物的植物中产生 T1 种子。
[1218] 小麦转化
[1219] 小麦的转化用 Ishida 等 (1996)Nature Biotech 14(6) : 745-50 描述的方法进行。 通常在转化中使用 ( 可从墨西哥 CIMMYT 获得的 ) 栽培品种 Bobwhite。不成熟胚与含有表 达载体的根癌农杆菌共培育并且转基因植物通过器官发生而回收。在与农杆菌孵育后, 胚 在愈伤组织诱导培养基上、 随后在再生培养基上体外培育, 其中所述的再生培养基含有选 择剂 ( 例如咪唑啉酮, 但可以使用多种选择标记 )。培养平板在 25℃于光照下培养 2-3 周, 或直至苗发育。将绿色苗从每个胚转移至生根培养基并在 25℃培养 2-3 周, 直至根发育。 将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝的 T-DNA 插入物的植 物中产生 T1 种子。
[1220] 大豆转化
[1221] 根据对 Texas A&M 美国专利 5,164,310 中所述方法的改进方法转化大豆。几个商 业大豆品种对于通过这种方法的转化是可行的。 栽培品种 Jack( 从 Illinois 种子基金会可 获得 ) 通常用于转化。对大豆种子消毒以便体外播种。从 7 日龄幼苗中切下下胚轴、 胚根 和一片子叶。进一步培育上胚轴和余下的子叶以发育腋生节。将这些腋生节切下并与含有 表达载体的根癌农杆菌孵育。在共培育处理之后, 将外植体洗涤并转移至选择培养基。将 再生的苗切下并置于苗伸长培养基上。将长度不超过 1cm 的苗置于生根培养基上直至根发 育。将生根的苗移植至温室的土壤中。从表现选择剂耐受的并含有单拷贝 T-DNA 插入物的 植物中产生 T1 种子。
[1222] 油菜 / 芸苔转化
[1223] 使用 5-6 日龄幼苗的子叶柄和下胚轴作为用于组织培育的外植体并且根据 Babic 等 (1998, Plant Cell Rep 17 : 183-188) 转化。 商业栽培品种 Westar(Agriculture Canada) 是用于转化的标准品种, 但是也可以使用其它品种。 对芸苔种子作表面消毒以便体外播种。 从体外幼苗中切下具有附着子叶的子叶柄外植体, 并通过叶柄外植体的切口端浸入细菌混 悬液而接种 ( 含有表达载体的 ) 农杆菌。外植体随后在含有 3mg/l BAP、 3%蔗糖、 0.7%植 物琼脂 (Phytagar) 的 MSBAP-3 培养基上在 23℃, 16 小时光照下培养 2 天。 在与农杆菌共培 育 2 日后, 将叶柄外植体转移至含有的 3mg/l BAP、 头孢噻肟、 羧苄青霉素或特美汀 (300mg/ l) 的 MSBAP-3 培养基上持续 7 日, 并且随后在含头孢噻肟、 羧苄青霉素或特美汀和选择剂的 MSBAP-3 培养基上培养, 直至苗再生。 当苗具有 5-10mm 长度时, 将苗切下并转移至苗伸长培 养基 ( 含 0.5mg/l BAP 的 MSBAP-0.5)。将长度大约 2cm 的苗转移至用于根诱导的生根培养 基 (MS0)。将生根的苗移植至温室的土壤中。从表现选择剂耐受性并含有单拷贝 T-DNA 插 入物的植物中产生 T1 种子。
[1224] 苜蓿转化 紫苜蓿 (Medicago sativa) 的再生性克隆使用 (McKersie 等, 1999Plant Physiol119 : 839-847) 的方法加以转化。苜蓿的再生和转化是基因型依赖性的并且因而需要再 生植物。已经描述了获得再生性植物的方法。例如, 这些再生性植物可以选自栽培品种 Rangelander(Agriculture Canada) 或 如 Brown DCW 与 A Atanassov(1985.Plant Cell Tissue Organ Culture 4 : 111-112) 描述的任何其它商业苜蓿品种。备选地, RA3 品种 ( 威 斯康星大学 (University of Wisconsin)) 已经被选择用于组织培养中 (Walker 等, 1978 Am J Bot 65 : 654-659)。将叶柄外植体与含有表达载体的根癌农杆菌 C58C1 pMP90(McKersie 等, 1999 Plant Physiol 119 : 839-847) 或 LBA4404 的过夜培养物共培育。外植体在黑 暗中在含有 288mg/L Pro、 53mg/L 硫代脯氨酸、 4.35g/L K2SO4 和 100μm 乙酰丁香酮的 SH 诱导培养基上共培育 3 天。外植体在半强度 (half-strength)Murashige-Skoog 培养基 (Murashige 和 Skoog, 1962) 中洗涤并平板接种在不含乙酰丁香酮而含有合适选择剂和合 适抗生素以抑止农杆菌生长的相同 SH 诱导培养基上。在数周后, 将体细胞胚转移至不含生 长调节剂、 不含抗生素而含有 50g/L 蔗糖的 BOi2Y 发育培养基中。体细胞胚随后在半强度 Murashige-Skoog 培养基上萌发。将生根的幼苗移植至花盆内并且在温室中培育。从表现 选择剂耐受性并含有单拷贝 T-DNA 插入物的植物中产生 T1 种子。
[1226] 棉花转化
[1227] 根据 US 5,159,135 中所述的方法使用根癌农杆菌转化棉花。 将棉花种子在 3%次 氯酸钠溶液中表面灭菌 20 分钟, 并以含有 500μg/ml 头孢噻肟的蒸馏水洗涤。接着将种子 转移至含有 50μg/ml 苯菌灵的 SH 培养基中进行萌发。取下 4 至 6 日龄幼苗的下胚轴, 剪 8 成 0.5cm 的片并置于 0.8%琼脂上。用农杆菌悬液 ( 约 10 个细胞 /ml, 从转化有目的基因 和适当选择标记的过夜培养物稀释而成 ) 接种下胚轴外植体。 室温光照 3 天后, 将组织转移 至固体培养基 (1.6g/l Gelrite), 其带有包含 B5 维生素的 Murashige 和 Skoog 盐 (Gamborg 等, Exp.Cell Res.50 : 151-158(1968)), 0.1mg/l 2, 4-D, 0.1mg/l 6- 糠胺嘌呤和 750μg/ml MgCL2, 并含有 50 至 100μg/ml 头孢噻肟和 400-500μg/ml 羧苄青霉素以杀死残余细菌。2 至 3 个月 ( 每 4 至 6 周继代培养 ) 后分离单个细胞系, 并在选择培养基上进一步培养进行 组织扩增 (30℃, 16 小时光周期 )。接着在非选择培养基上将转化组织再培养 2 至 3 个月, 以产生体细胞胚。将至少 4mm 长的表观健康的胚转移至管中, 其中含有细蛭石中的 SH 培养 基, 并补充有 0.1mg/l 吲哚乙酸、 6 糠胺嘌呤和赤霉酸。以 16 小时光周期在 30℃下培养胚, 并将 2 至 3 叶期的小植株转移至含有蛭石和养分的盆中。植物变硬并接着移至温室中进一 步培养。
[1228] 实施例 10 : 表型评价方法
[1229] 10.1 评价设置
[1230] 产生大约 35 个独立的 T0 稻转化体。原代转化体从组织培养箱转移至温室用于生 长和收获 T1 种子。留下 T1 后代对转基因的存在 / 不存在以 3 ∶ 1 比例分离的 6 个事件。 对于这些事件中的每一事件, 通过监测目视标记表达而选择含有转基因的大约 10 株 T1 幼 苗 ( 杂合子和纯合子 ) 和缺少转基因的大约 10 株 T1 幼苗 ( 失效合子 )。转基因植物和对 应的失效合子在随机位置上并排培育。温室条件是短日照 (12 小时光照 ), 在光照下 28℃ 和在黑暗中 22℃以及相对湿度 70%。定期给生长于非胁迫条件下的植物浇水, 以确保水和 养分不受限制, 从而满足植物完成生长和发育的需要。
[1231] 4 个 T1 事件在 T2 世代中按照如用于 T1 世代的相同评价方法作进一步评价, 但每个事件采用更多的个体。使植物从播种期直至成熟期通过数字成像箱数次。在每一时间点 上, 对每株植物从至少 6 个不同角度拍摄数字图像 (2048×1536 像素, 1600 万颜色 )。
[1232] 干旱筛选
[1233] 在正常培养条件下在盆土中培养来自 T2 种子的植物, 直至到达抽穗阶段。接着将 其转移至停止浇水的 “干旱” 部分。在随机选择的盆中插入湿度探测器, 以检测土壤含水量 (SWC)。当 SWC 降至一定阈值之下时, 自动对植物持续再浇水直至再次达到正常水平。接着 将植物再转移至正常条件。其余培养 ( 植物成熟、 种子收获 ) 与不在非生物胁迫条件下培 育的植物相同。如正常条件下培养所详细描述的那样记录生长和收获参数。
[1234] 氮使用效能筛选
[1235] 在除营养液以外均为正常的条件下在盆土中培养来自 T2 种子的稻植物。从移植 到成熟均使用特定的营养液对盆浇水, 其中含有降低的氮 (N) 含量, 通常降低 7 至 8 倍。其 余培养 ( 植物成熟、 种子收获 ) 与不在非生物胁迫条件下培育的植物相同。如正常条件下 培养所详细描述的那样记录生长和收获参数。
[1236] 盐胁迫筛选
[1237] 在由椰子纤维和 argex(3 ∶ 1 比例 ) 构成的基质上培养植物。在将小植株移植到 温室后的前两周使用正常营养液。前两周之后, 向营养液中加入 25mM 盐 (NaCl), 直至收获 植物。随后测量种子相关参数。
[1238] 10.2 统计分析 : F 检验
[1239] 使用双因子 ANOVA( 方差分析 ) 作为统计模型用于植物表型特征的整体评价。对 用本发明基因转化的全部事件的全部植物的所有测量参数实施 F 检验。实施 F 检验以检查 基因对于全部转化事件的作用并验证基因的整体作用 ( 又称作全局基因作用 )。用于真实 全局基因作用的显著性的阈值对于 F 检验设置在 5%概率水平上。显著性 F 检验值标示基 因作用, 意味着不仅仅基因的存在或位置才造成表型上的差异。
[1240] 当实施的是具有相互重叠事件的两个实验时, 对此进行组合分析。这可用来检验 两次实验效果的一致性, 如果一致, 可积累两个实验的证据以提高结论的置信度。 所用的方 法是混合模型法, 考虑了数据的多级结构 ( 即实验 - 事件 - 分离子 )。通过比较似然比检验 与卡方分布获得 P 值。
[1241] 10.3 测量的参数
[1242] 生物量相关的参数测量
[1243] 从播种期直至成熟期, 使植物通过数字成像箱数次。 在每一时间点上, 对每株植物 从至少 6 个不同角度拍摄数字图像 (2048×1536 像素, 1600 万颜色 )。
[1244] 植物地上部分面积 ( 或叶生物量 ) 通过计数在来自植物地上部分的数字图像上区 别于背景的像素的总数而测定。 该值对在相同时间点上从不同角度拍摄的画面进行平均化 并且通过校正转化成以平方毫米表达的物理表面值。 实验证实以这种方式测量的地上部分 植物面积与地上植物部分的生物量相关。 地上部分面积是在植物已经达到其最大叶生物量 的时间点上所测量的面积。早期萌发势是萌发后 3 周的植物 ( 幼苗 ) 地上部分面积。根生 物量的增加被表述为总根生物量 ( 测量为植物寿命中观察到的根的最大的生物量 ) 的增 加; 或者表述为根 / 苗指数 ( 测量为根和苗活性生长期中根质量和苗质量的比例 ) 的提高。
[1245] 根生物量可以使用如在 WO 2006/029987 中公开的方法测定。早期萌发势是涉及植物发育时间的参数。 早期萌发势通过计数在来自植物地上部 分的区别于背景的像素的总数而测定。 该值对在相同时间点上从不同角度拍摄的画面进行 平均化并且通过校正转化成以平方毫米表达的物理表面值。 以下描述的结果是针对萌发后 三周的植物。
[1247] 植物的 “开花时间” 可以使用如在 WO 2007/093444 中公开的方法测定。
[1248] 种子相关参数的测量
[1249] 将成熟的原穗 (primary panicle) 收获、 计数、 装袋、 加条形码标记并且随后在干 燥箱内在 37℃干燥 3 日。随后将穗脱粒并且收集及计数全部种子。使用吹气装置分开饱满 粒 (husk) 与空粒。弃去空粒并再次对剩余部分计数。饱满粒在分析天平上称重。饱满种 子数通过计数分离步骤后保留下来的饱满粒数而确定。 种子总产量通过称量从植物中收获 的全部饱满粒而测量。每株植物种子总数通过计数从植物中收获的粒数而测量。根据计数 的饱满种子数及其总重量外推得出千粒重 (TKW)。 收获指数 (HI) 在本发明中定义为种子总 2 6 产量和地上面积 (mm ) 之间的比值再乘以因子 10 。每个穗的花总数在本发明中定义为种 子总数与成熟的原穗数之间的比率。种子饱满率在本发明中定义为饱满种子数占种子 ( 或 小花 ) 总数的比例 ( 以 a%表示 )。
[1250] 实施例 11 : 转基因植物的表型评价结果
[1251] 11.1.eRF1 多肽
[1252] 在非胁迫条件下, 表达包含 SEQ ID NO : 1 中最长开放阅读框的核酸的 T2 代植物中 转基因稻植物的评估结果显示如下。
[1253] 在非胁迫条件下评估转基因稻植物的结果显示如下 ( 表 E1)。观察到地上生物 量 (AreaMax)、 出苗萌发势 (EmerVigor)、 每株植物产量 (totalwgseeds)、 每株植物的种 子总数 (nrtotalseed)、 在第一次清除 (flush) 中的穗数 (firstpan)、 植物的饱满种子数 (nrfilledseed)、 收获指数 ( 为 totalwgseeds/AreaMax, harvestindex) 至少 5%的增加至 超过 5%的增加。
[1254] 表 E1 : 非胁迫条件
[1255] 表 E1 : 非胁迫
[1256] 条件
[1257] 参数 AreaMax EmerVigor totalwgseeds nrtotalseed firstpan nrfilledseed 145 整体 11.3 20.0 14.6 12.2 11.4 14.对于每一参数, 显示了整体百分比, 只要其达到 p ≤ 0:05 并大于 5%阈值。
[1259] 11.2.SCAMP 样多肽
[1260] 在稻 GOS2 启动子的控制下并在氮使用效能筛选条件下培养、 表达包含 SEQ ID NO : 88 的最长开放阅读框的核酸的 T1 代转基因稻植物的评估结果显示如下 ( 表 E2A)。关于转 基因植物产生的详细内容参见前面的实施例。
[1261] 对于地上生物量 (AreaMax)、 根生物量 (RootMax)、 萌发势 (Emervigor, 早期萌发 势 )、 总种子产量 (totalwgseeds)、 饱满种子数 (nrfilledseed)、 饱满率、 每株植物的种子 总数 (nrtotalseed)、 收获指数 (harvestindex) 和原穗数 (firstpan), 与对照植物比较, 观 察到至少 5%的增加至超过 5%的增加。
[1262] 表 E2A :
[1263] 在稻 GOS2 启动子的控制下并在氮使用效能筛选条件下培养的、 表达包含 SEQ ID NO : 663 的最长开放阅读框的核酸的 T1 代转基因稻植物的评估结果显示如下。关于转基因 植物产生的详细内容参见前面的实施例。
[1265] 对于 3 个株系开花前的绿度 (GNbfFlow)、 对于 2 个株系重力产量最大值 (Gravity Yield Max)(GravityYMax), 与对照植物比较, 观察到了至少 5%的增加。此外, 在至少一个 株系中对于饱满率、 千粒重 (TKW)、 饱满种子数 (nrfilledseed)、 每穗的花 (flowerperpan) 和植物的最大高度, 即植物的最高端, 我们观察到了至少 5%的增加。
[1264] 在稻 GOS2 启动子的控制下并在氮使用效能筛选条件下培养的表达包含 SEQ ID NO : 665 的最长开放阅读框的核酸的 T1 代转基因稻植物的评估结果显示如下 ( 表 E2B)。关 于转基因植物产生的详细内容参见前面的实施例。
[1267] 对于地上生物量 (Rootbiomass(RootMax))、 总种子产量 (totalwgseeds)、 收获指 数 (harvestindex)、 千粒重 (TKW) 和饱满种子数 (nrfilledseed), 与对照植物比较, 观察到 至少 5%的增加至超过 5%的增加。
[1268] 表 E2B :
[1266] 11.3. 肌原纤蛋白多肽
[1271] 在下表中显示的每一参数给出了具有 p < 0.05 的 p 值的整体百分比差异。与对 照植物 ( 对应于无义纯合子 ) 比较, 评价的结果显示出总种子重量、 种子饱满率、 收获指数 和饱满种子数的增加。
[1272] 表 E3 : T1 代
[1270] 参数 总种子重量 饱满率 收获指数 饱满种子数
[1274] 参数 总种子重量 饱满率 收获指数 饱满种子数
[1276] 整体 12.3% 8.5% 9.8% 9.8% 整体 17.9% 9.6% 10.5% 15.1%表 E4 : T2 代11.4.PLATZ 多肽
[1277] 实施例 A
[1278] 在非胁迫条件下, 表达 SEQ ID NO : 260( 参见上文 7.4 部分 - 实施例 A) 的 PLATZ 核酸的 T1 代转基因稻植物的评价结果显示如下。对于地上生物量 (AreaMax) 和根生物量 (RootThickMax)、 总种子重量 (totalwgseeds)、 收获指数、 千粒重 (TKW) 观察到了增加 ( 表 E5A)。
[1279] 表 E5A : 转基因稻植物的数据概述 ; 对于每一参数, 显示了相对于对照植物的整体百分比增加, 对于每一参数, p 值≤ 0.05。
[1280] 参数 AreaMax totalwgseeds harvestindex TKW RootThickMax
[1281] 整体增加 12.6 19.8 7.6 17.9 5.9实施例 B
[1282] 在非胁迫条件下, 表达 SEQ ID NO : 356( 参见上文 7.4 部分 - 实施例 B) 的 PLATZ 核酸的 T1 代植物中转基因稻植物的评价结果显示如下。观察到了产量相关参数的增加, 例 如饱满种子与总种子数比例的增加 (fillrate) 和增加的千粒重 (TKW)。 转基因植物与对照 植物比较还表现出更快的早期发育 ( 表 E5B)。后面的参数在表 E5B 中由 AreaEmer 显示, 并 以百分比表示植物产生 30%的终生物量需要的时间与植物产生 90%的终生物量需要的时 间之间的比率。
[1283] 参数 Fillrate TKW AreaEmer 整体增加 5.7% 3.5% 5.3%表 E5B : 转基因稻植物的数据概述 ; 对于每一参数, 显示了相对于对照植物的整体 百分比增加, 对于每一参数, p 值≤ 0.05。此外, 在非生物胁迫例如干旱胁迫、 营养胁迫、 盐胁迫条件下培养的表达 PLATZ 蛋 白质的植物显示出改进的产量相关性状, 包括增加的生物量, 例如地上和 / 或地下生物量 的增加 ; 增加的如在定义部分中定义的种子产量 ; 改善的早期萌发势的一种或多种。
[1286] 11.5.PLST 样多肽
[1287] 在非胁迫条件下, 表达包含 SEQ ID NO : 410 中最长开放阅读框的核酸的 T2 代转基 因稻植物的评价结果显示如下。
[1288] 在干旱条件下评价表达 SEQ ID NO : 411 所示的 PLST 样多肽的转基因稻植物 的结果显示如下 ( 表 E6)。观察到总种子重量 (totalwgseeds)、 饱满种子与总种子数 的 比 率 (fillrate)、 收 获 指 数 (totalwgseeds/AreaMax)(harvestindex) 和 饱 满 种 子 数 (nrfilledseed) 大于 5%的增加。
[1289] 表 E6 : 在干旱胁迫条件下培养的转基因稻植物的数据概述 ; 显示了整体增加, 并
[1285] 且对于每一参数, p 值≤ 0.05。
[1290] 参数 totalwgseeds fillrate harvestindex nrfilledseed
[1291] 整体 19.2 27.2 21.6 17.111.6.Glomalin 多肽
[1292] 在根特异性 RCc3 启动子的控制下, 表达 Glomalin 基因的转基因稻植物具有增加 的种子产量, 尤其是增加的千粒重 ( 整体增加 2.8%, p 值为 0.035)。6 株株系中的 3 株还 具有增加的收获指数。