耐灰叶斑病玉米及其生产方法 本申请要求于 2007 年 12 月 31 日提交的第 61/009,697 号美国临时申请的优先权, 该临时申请的公开内容全文引入本文。
发明领域 本发明涉及耐灰叶斑病 (GLS) 玉米植物以及生产该种植物的方法。更具体地讲, 本发明涉及能够引起玉米 GLS 耐受性的可确认的遗传物质, 以及该遗传物质基因渗入到玉 米植株中的现象。此外, 本发明涉及来自一个或多个亲本植物的期望遗传物质以一定的速 度、 精密度、 和准确度渗入到子代植物中的现象。
背景技术
从历史上看, 玉米是一种具有食物、 饲料和工业用途的重要作物。 影响玉米的任何 环境胁迫因素如病害可对这些用途的玉米谷物可用性产生影响。
灰叶斑病 ( 下文称为 GLS) 在过去的三十年中已经变成一种突出病害, 并且在美国 和其他主要玉米产地如墨西哥、 巴西、 欧洲、 和南非是一种显著的叶片病害。 GLS 的发病率和 严重性在美国似乎是渐增的 (Wang 等人, Phytopathology 88 : 1269-75(1998)), 这或许是 由于玉米种植增加而耕作减少的原因。 这些病症可能导致真菌越冬以及下一季节的早期感 染 (Laterall 和 Rossi, Plant Dis.67 : 842-37(1983))。在美国在 GLS 流行期间已经报道 了超过 50%的产量损失 (Laterall 和 Rossi, 同上 ; Lipps, Plant Dis.71 : 281(1987)), 并 且其中严重流行导致茎倒伏和早衰增加时预计的损失已经高达 100% (Laterall 和 Rossi, 同上 )。
引起 GLS 的真菌病原体玉米灰叶斑病菌 (Cercospora zeae-maydis) 表征性地 生成与叶脉平行的、 长矩形浅灰 - 棕褐色叶片损伤 (Tehon 和 Daniels, Mycologia 17 : 240-49(1925) ; Latterell 和 Rossi, 同上 ; Ward 等人, Plant Dis.83 : 884-95(1999))。 损伤 可使部分或全部叶片枯萎并且通常首先出现在较低的叶片中。GLS 引起的枯萎与光合作用 区域的早熟损失关联。开花后玉米植株的主要接收区是穗, 枯萎诱导植物将光合作用产物 以高水平从茎和根转移到穗, 因此引起早衰和产量降低。
具有 GLS 耐受性的玉米品种的快速有效的开发是有益的。在商业杂交体和自交体 中的 GLS 耐受性水平随品种而不同。已经报道了一些表现出强耐受性的品种。然而, 使用 表型选择以将 GLS 性状从耐受性品种渗入到易感品种中可能是耗时的并且是困难的。GLS 对环境条件敏感并且需要高湿度和叶片长期湿润。 这种敏感性使得每年仅基于表型来可靠 地选择 GLS 耐受性变得困难 (Lehmensiek 等人, Theor.Appl.Genet.103 : 797-803(2001))。 特定的病害筛选位点可能操纵起来比较昂贵, 并且为了区分耐受性水平, 植物必须生长至 成熟。 与之相反, 通过使用与 GLS 耐受性关联的分子标记进行选择具有以下优点 : 使得至少 一些选择仅基于子代的遗传组合物进行。因此, 可在植物生命周期非常早的阶段测量 GLS 耐受性, 甚至在种子阶段。通过使用与 GLS 耐受性性状关联的分子标记提高选择速率意味 着具有 GLS 耐受性的植物育种能够以较快速率发生, 并且能够较迅速地开发商业上可接受的耐 GLS 植物。
发明概述
本发明的实施方案基于与提高 GLS 耐受性显著相关的基因座的精细作图, 以及将 该知识应用于植物育种。提供了鉴定耐 GLS 玉米植物的组合物和方法。提供了利用标记进 行育种以制备耐 GLS 的玉米植物的方法, 以及通过此类方法产生的植物。
实施方案包括使用改良的供体品种 PHJEP 作为种质来源以将 GLS 耐受性渗入到玉 米植物及其子代中。所述品种的代表性样品已经作为保藏号 PTA-8851 被保藏在美国典型 培养物保藏中心 (ATCC)。
一个方面是命名 PHJEP 的玉米品种的种子, 其中所述玉米品种的代表性样品已经 以保藏号 PTA-8851 被保藏, 或者得自该种子的子代种子, 所述种子包含 PHJEP 灰叶斑病耐 受性基因座, 并且当生长时, 产生表现出耐灰叶斑病的植物。由 PHJEP 种子或其子代的种子 产生的植物也是受关注的, 这些植物的细胞也同样受关注。
实施方案也包括得自 PHJEP 的特定重组染色体区间, 它们与 GLS 耐受性提高关联, 并且将该染色体区间基因渗入到其他品种和植物中。一些实施方案包括将 PHJEP 的特定单 倍型基因渗入到其他品种和植物中。 在一个方面, 子代种子中的 PHJEP 灰叶斑病耐受性基因座位于 PHJEP 来源的染色 体区间上, 该区间包含由 UMC1346 和 UMC1702 限定的 PHJEP 的染色体区域。在另一方面, 子代种子中的 PHJEP 灰叶斑病耐受性基因座由单倍型限定, 它包含 : 在 PHM 00045-01 上 的等位基因 G、 在 PHM 00043-01 上的等位基因 A、 在 PHM 15534-13 上的等位基因 A、 在 PHM 04694-10 上的等位基因 G、 在 PHM 01811-32 上的等位基因 T、 在 PHM 01963-15 上的等位基 因 T、 在 PHM 01963-22 上的等位基因 C、 在 PHM 05013-12 上的等位基因 T、 在 PHM 00586-10 上的等位基因 T、 在 PHM 00049-01 上的等位基因 A。在另一个方面, PHJEP 灰叶斑病耐受性 基因座由单倍型限定, 它包含 : 在 PHM 00045-01 上的等位基因 G、 在 PHM 00043-01 上的等 位基因 A、 在 PHM 01963-22 上的等位基因 C、 和在 PHM 05013-12 上的等位基因 T。
在其他方面, 子代种子是 PHJEP 灰叶斑病耐受性基因座的回交转化体。由选自 PHVNV、 PHW3Y、 PHVRA、 PHEWB、 和 PHWRC 的轮回亲本产生的回交转化体的子代种子也是受关 注的。
在其他方面, 子代种子是杂交品种, 并且杂交品种的至少一个自交亲本是 PHJEP 灰叶斑病耐受性基因座到选自 PHVNV、 PHW3Y、 PHVRA、 PHEWB、 和 PHWRC 的轮回亲本的回交转 化体。
其他实施方案包括鉴定包含与灰叶斑病耐受性关联的基因座的第一玉米植物的 方法, 所述方法包括 : (a) 获取所述第一玉米植物在染色体 4 上 BNLG1755 和 UMC1299 之间 的染色体区间的第一遗传特征图, (b) 从包含与灰叶斑病耐受性关联的基因座的第二玉米 植物获取第二遗传特征图, 其中所述基因座位于在染色体 4 上 BNLG1755 和 UMC1299 之间, 和 (c) 比较所述第一遗传特征图和所述第二遗传特征图。
在另一方面, 如果所述第一玉米植物包含与灰叶斑病耐受性关联的基因座, 该方 法还包括选择所述第一玉米植物的方法。
此外, 第二遗传特征图可为 PHJEP 或 PHJEP 子代的遗传特征图, 或者可包含一个或 多个标记等位基因, 所述等位基因选自 : 在 PHM00045-01 上的等位基因 G、 在 PHM 00043-01
上的等位基因 A、 在 PHM15534-13 上的等位基因 A、 在 PHM 04694-10 上的等位基因 G、 在 PHM01811-32 上的等位基因 T、 在 PHM 01963-15 上的等位基因 T、 在 PHM01963-22 上的等 位基因 C、 在 PHM 05013-12 上的等位基因 T、 在 PHM00586-10 上的等位基因 T、 以及在 PHM 00049-01 上的等位基因 A。
第二遗传特征图也可包含一个或多个标记等位基因, 所述等位基因选自 : 在 PHM 00045-01 上的等位基因 G、 在 PHM 00043-01 上的等位基因 A、 在 PHM 01963-22 上的等位基 因 C、 和在 PHM 05013-12 上的等位基因 T。
在其他方面, 遗传特征图能够被确定为在染色体 4 上 BNLG1755 和 UMC0371 之间 的染色体区间。此外, 与灰叶斑病耐受性关联的基因座可为 PHM 15534、 PHM 04694、 PHM 01811、 PHM 01963、 PHM 05013、 或 PHM 00586。
通过所述方法鉴定的玉米植物和那些玉米植物的细胞及种子也是受关注的。
另一个实施方案包括鉴定包含与灰叶斑病耐受性关联的基因座的第一玉米植物 的方法, 所述方法包括 : (a) 获取所述第一玉米植物在染色体 4 上的染色体区间的第一遗传 特征图, 所述区间由以下序列描述并且包括以下序列 : SEQ ID NO : 86, 或基于 Clustal V 比 对方法与 SEQID NO : 86 具有 95%同一性的核苷酸序列, 以及 SEQ ID NO : 87, 或基于 Clustal V 比对方法与 SEQ ID NO : 87 具有 95%同一性的核苷酸序列, (b) 从包含与灰叶斑病耐受性 关联的基因座的第二玉米植物获取第二遗传特征图, 其中所述基因座在所述区间中, 以及 (c) 比较所述第一遗传特征图和所述第二遗传特征图。 其他实施方案包括包含以下单倍型的玉米种子 : 在 PHM 00045-01 上的等位基因 G、 在 PHM 00043-01 上的等位基因 A、 在 PHM 15534-13 上的等位基因 A、 在 PHM 04694-10 上 的等位基因 G、 在 PHM 01811-32 上的等位基因 T、 在 PHM 01963-15 上的等位基因 T、 在 PHM 01963-22 上的等位基因 C、 在 PHM 05013-12 上的等位基因 T、 在 PHM 00586-10 上的等位基 因 T、 在 PHM 00049-01 上的等位基因 A ; 并且玉米种子包含以下单倍型 : 在 PHM 00045-01 上的等位基因 G、 在 PHM 00043-01 上的等位基因 A、 在 PHM 01963-22 上的等位基因 C、 和在 PHM05013-12 上的等位基因 T。由该玉米种子生成的植物也是受关注的。
定义
在详述本发明之前, 应当了解本发明不受特定实施方案的限制, 它当然能够改变。 也应当了解本文所用的术语仅是为了描述特定实施方案, 而不旨在进行限制。当在本说明 书和所附权利要求中使用时, 除非内容清楚地表明, 单数和单数形式的术语包括复数指代。 因此, 例如术语 “一个植物” 也包括多个植物 ; 也取决于上下文, 使用的术语 “植物” 也可包 括该植物遗传相似或相同的子代 ; 使用的术语 “核酸” 实际上任选地包括该核酸分子的多个 拷贝 ; 同样地, 术语 “探针” 任选地 ( 并且通常 ) 包括许多相似或相同的探针分子。
除非另外说明, 核酸是以 5′到 3′方向从左往右写。说明书中所述的数字范围包 括限定范围的端值并且包括在限定范围内的各个整数或任何非整数的分数。除非另外指 明, 本文所用的所有技术和科学术语具有与本发明所属领域普通技术人员一般理解相同的 含义。 虽然与本文所述的那些方法和材料相似或等同的任何方法和材料可用于本发明的测 试实践, 但本文描述了优选的材料和方法。 在本发明的描述和权利要求中, 将根据下文列陈 述的定义使用以下术语。
“植物” 可为整个植株、 其任何部分、 或来源于植物的细胞或组织培养物。因此, 术
语 “植物” 可指代以下任何一种材料 : 整个植株、 植物部分或器官 ( 例如叶片、 茎、 根等 )、 植 物组织、 种子、 植物细胞、 和 / 或子代的相同材料。植物细胞是从植物中获取的细胞或来源 于从植物中所获取细胞经培养出的细胞。
术语 “玉米植物” 包括整个玉米植株、 玉米植物细胞、 玉米植物原生质体、 能从其中 再生玉米植株的玉米植物细胞或玉米组织培养物、 玉米植物愈伤组织、 玉米植物丛生物和 玉米植物中的完整玉米植物细胞或玉米植物部分, 如玉米种子、 玉米芯、 玉米花、 玉米子叶、 玉米叶、 玉米茎、 玉米芽、 玉米根、 玉米根尖等。
术语 “玉米”包括玉米 (Zea mays) 物种的任何成员。 “玉米 (maize)”和 “玉米 (corn)” 本文可互换使用。
“种子” 是包封在保护种皮中的小胚体。它是成熟的植物胚珠在授精后生成的产 物。
“种质” 指个体 ( 例如一个植株 )、 一组个体 ( 例如一个植物品系、 品种或家族 )、 或 来源于一个品系、 品种、 物种、 或培养物的克隆的或从其中得到的遗传物质。种质可为生物 或细胞的部分, 或者可从生物或细胞中分离得到。种质通常提供遗传物质与特异性分子构 成, 该分子构成提供生物或细胞培养物的一些或全部遗传性状的物理基础。 如本文所用, 种 质包括可从中生长出新植物的细胞、 种子或组织, 或者植物部分如叶、 茎、 花粉、 或细胞, 它 们能够被培养成整个植株。 当与植物一起使用时, “品种” 包括植物学和栽植植物, 包括自交体和杂交体, 并且 指植物学分类上已知的最低阶层的植物族群, 其中该族群可由给定基因型或基因型组合的 特性的表达来限定。
术语 “自交体” 指基本上纯合的品种。
术语 “杂交体” 指两个遗传上不同的个体之间自交产生的任何子代, 包括两个不同 自交系之间的杂交。
术语 “等位基因” 指在特定基因座处发生的两个或更多个不同核苷酸序列的其中 一个。
当等位基因与性状关联时, 以及当存在的等位基因是期望的性状或性状形式将发 生在包含等位基因的植物中的指示时, 等位基因与性状 “关联” 。
“BAC” 或细菌人工染色体是来源于大肠杆菌 (Escherichia coli) 天然存在的 F 因 子的克隆载体。BAC 能够接受 DNA 序列的较大插入序列。在玉米中, 已经将许多 BAC 或细菌 人工染色体装配成重叠群 ( 重叠的邻接基因片段, 或 “邻接 DNA” ), 它们每个包含玉米基因 组 DNA 的较大插入序列。
“有利等位基因” 是在特定基因座的等位基因, 该基因座赋予或有助于产生农学上 期望的表型, 例如 GLS 耐受性, 或者作为另外一种选择是允许鉴定能够从育种程序或种植 中除去的易感植物的等位基因。标记的有利等位基因是分离有利表型的标记等位基因, 或 者作为另外一种选择, 分离易感植物表型并因此提供鉴定易感病植物的有益效果。染色体 片段的一种有利等位基因形式是包括在位于染色体片段上的一个或多个基因座上的核苷 酸序列的染色体片段, 所述核苷酸序列有助于产生优异的农学性能。
“等位基因频率” 指等位基因存在于个体、 品系、 或一组品系中的基因座上的频率 ( 比例或百分比 )。例如, 就等位基因 “A” 而言, 基因型 “AA” 、 “Aa” 、 或 “aa” 的二倍体个体
分别具有 1.0、 0.5、 或 0.0 的等位基因频率。 人们能够通过平均化来自品系的个体样品的等 位基因频率来估计该品系中的等位基因频率。同样地, 人们能够通过平均化构成种群的品 系的等位基因频率来计算该种群品系中的等位基因频率。 就一组限定数目的个体或品系而 言, 可将所有等位基因频率表示为包含等位基因的个体或品系 ( 或任何其他指定组 ) 的计 数。
当等位基因与性状关联时, 以及当存在的等位基因是期望的性状或性状形式将发 生在包含等位基因的植物中的指示时, 等位基因与性状 “正” 相关。当等位基因与性状关联 时, 以及当存在的等位基因是期望的性状或性状形式将不发生在包含等位基因的植物中的 指示时, 等位基因与性状 “负” 相关。
假如个体在等位基因仅有一种类型的等位基因 ( 例如二倍体个体在两个同源染 色体中的每一个的基因座上具有一拷贝的相同等位基因 ), 则该个体是 “纯合的” 。
假如一种以上的等位基因类型存在于给定基因座上 ( 例如二倍体个体具有两个 不同等位基因中的每一个的一个拷贝 ), 则该个体是 “杂合的” 。
杂合情况的一种特殊情况是其中一个染色体具有一个基因的等位基因而其他染 色体完全缺乏该基因、 基因座、 或区域 -- 换句话说, 具有相对于第一染色体的缺失。这种情 况称为 “半合子的” 。
术语 “同质” 指一组成员在一个或多个特定基因座上具有相同基因型。与之相反, 术语 “异质” 用于指明一组内的个体在一个或多个特定基因座上基因型不同。
“基因座” 是多态核酸、 性状决定子、 基因、 或标记所在的染色体区域。因此, 例如 “基因座” 是物种基因组中的特定染色体位置, 其中能够发现特定基因。与 GLS 耐受性关联 的基因座指示与表型可计量的 GLS 耐受性直接相关的基因组上的区域。
“遗传互补序列” 具有至少一套或倍数性等位基因。例如, 单交种杂合体继承两个 遗传互补序列, 各来自每个自交亲本。
术语 “数量性状基因座” 或 “QTL” 指在至少一种遗传背景下 ( 例如在至少一个育种 种群或子代中 ), 具有与表型性状的差异表达关联的至少一个等位基因的多态基因座。QTL 能够通过单基因机制或多基因机制发挥作用。
术语 “标记” 、 “分子标记” 、 “标记核酸” 、 和 “标记座位” 指核苷酸序列或其编码的产 物 ( 例如蛋白 ), 当鉴定关联的基因座它们时用作参考点。 标记能够来源于基因组核苷酸序 列或表达的核苷酸序列 ( 例如来源于剪接的 RNA 或 cDNA), 或来源于编码的多肽。该术语 也指与标记序列互补或侧接标记序列的核酸序列, 如用作探针或能够扩增标记序列的引物 对的核酸。很多玉米分子标记是本领域已知的, 并且被公布于或得自多个来源, 例如 Maize GDB 因特网资源和 University ofArizona 运营的 Arizona Genomics Institute 因特网资 源。同样地, 已经建立了用于检测分子标记的多种方法。
“多态性” 是 DNA 中的变异, 这种现象太过普遍以至于不仅仅是由于新的突变而产 生 ( 即种群中的发生频率为至少 1% )。在子代中分离的任何差异继承的多态性状 ( 包括 核酸多态性 ) 是潜在的标记。基因组可变性可为任何一种起源, 例如插入、 缺失、 复制、 重复 元件、 点突变、 重组事件、 或转座因子的存在和序列。
“标记探针” 是可用于鉴定标记座位存在与否的核酸序列或分子, 例如与标记座位 序列互补的核酸分子探针。作为另外一种选择, 在某些方面分子探针指能够区别 ( 即基因型 ) 存在于标记座位上的特定等位基因的任何类型的探针。当核酸在溶液中特异性杂交 时, 例如根据 Watson-Crick 碱基配对原则杂交, 核酸是 “互补的” 。
“标记座位” 是可用于追踪存在的第二连接基因座的基因座, 例如编码或有助于表 达表型性状的连接基因座。例如标记座位能够用于监控等位基因在某一基因座的分离, 如 QTL, 它们与标记座位在遗传上或在物理上连锁。
“标记等位基因” 或者 “标记座位的等位基因” 是种群中位于标记座位的多个多态 性核苷酸序列的其中一个, 它就标记座位而言是多态的。在某些方面, 本发明提供与玉米 GLS 耐受性关联的标记座位。期望每个鉴定的标记与有助于产生 GLS 耐受性的遗传元件如 QTL 在物理上和遗传上相近 ( 导致物理和 / 或遗传连锁 )。
“遗传标记” 是种群中的多态核酸, 并且其中可通过一种或多种分析方法检测并区 分出它们的等位基因, 例如 RFLP、 AFLP、 同功酶、 SNP、 SSR 等。该术语也指与基因组序列互 补的核酸序列, 如用作探针的核酸。术语 “遗传标记” 可指任何类型的核酸基的标记, 包括 但不限于限制性片段长度多态性 (Restriction Fragment LengthPolymorphism, RFLP)、 简单重复序列 (Simple Sequence Repeat, SSR)、 随机扩增多态性 DNA(Random Amplified Polymorphic DNA, RAPD)、 酶 切 扩 增 多 态 性 序 列 (Cleaved Amplified Polymorphic Sequence, CAPS)(Rafalski 和 Tingey, 1993, Trends in Genetics 9 : 275-280)、 扩增片段 长度多态性 (Amplified Fragment Length Polymorphism, AFLP)(Vos 等人, 1995, Nucleic Acids Res.23 : 4407-4414)、 单 核 苷 酸 多 态 性 (SingleNucleotide Polymorphism, SNP) (Brookes, 1999, Gene 234 : 177-186)、 序 列 特 异 性 扩 增 区 域 (Sequence Characterized Amplified Region, SCAR)(Paran 和 Michelmore, 1993, Theor.Appl.Genet.85 : 985-993)、 序 列 标 签 位 点 (Sequence Tagged Site, STS)(Onozaki 等 人, 2004, Euphytica138 : 255-262)、 单链构象多态性 (Single Stranded ConformationPolymorphism, SSCP)(Orita 等人, 1989, Proc Natl Acad Sci USA86 : 2766-2770)、 简单重复序列区间 (Inter-Simple Sequence Repeat, ISSR)(Blair 等人, 1999, Theor.Appl.Genet.98 : 780-792)、 反转录转座 子位点间扩增多态性 (Inter-Retrotransposon Amplified Polymorphism, IRAP)、 反转录 转座子微卫星扩增多态性 (Retrotransposon-MicrosatelliteAmplified Polymorphism, REMAP)(Kalendar 等人, 1999, Theor.Appl.Genet.98 : 704-711)、 RNA 裂解产物 ( 如 Lynx 标 记 ) 等。
术语 “插入缺失 (indel)” 指插入或缺失, 其中可将一个品系相对于第二品系称为 插入, 或者可将第二品系相对于第一品系称为具有缺失。
对应于种群成员之间的遗传多态性的标记能够通过本领域已建立的方法进行 检测。这些方法包括例如基于 PCR 的序列特异性扩增方法、 限制性片段长度多态性检测 (RFLP)、 同功酶标记检测、 通过等位基因特异性杂交 (ASH) 进行的多核苷酸多态性检测、 植物基因组的扩增可变序列检测、 自主序列复制检测、 简单重复序列检测 (SSR)、 单核苷酸 多态性检测 (SNP)、 或扩增片段长度多态性检测 (AFLP)。已经建立的方法也已知用于检 测表达序列标签 (EST) 和来源于 EST 序列的 SSR 标记以及随机扩增的多态性 DNA(RAPD)。 经 由 酶 切 扩 增 多 态 性 序 列 (CAPS) 对 基 因 绘 图 的 方 法 也 是 为 人 们 熟 知 的 ( 参 见 例 如 Konieczny&Ausubel, Plant J.4 : 403-10(1993))。
“标记辅助选择” ( 或 MAS) 是一种基于标记基因型进行表型选择的方法。“标记辅助反选择” 是一种通过它将标记基因型用于鉴定植物的方法, 所述植物将 不被选择, 使得它们被从育种程序或种植中去除。
“参比序列” 是用作序列比对基准的限定序列。参比序列通过对基因座上的多个品 系进行基因分型、 以序列比对程序进行核苷酸序列比对 ( 例如 Sequencher)、 然后获取比对 的共有序列来获取。
“基因图谱” 是对给定物种中一个或多个染色体 ( 或连锁群 ) 上的基因座间的基因 连锁关系的描述, 一般以图表或表格形式描述。 该基因座是遗传界标或标记, 并且就每个基 因图谱而言, 标记间的距离通过它们之间的重组频率来测量。 基因图谱是作图的种群、 使用 的标记的类型、 以及不同种群间各个标记的多态性潜力的产物。一个基因图谱与另一个基 因图谱在基因座之间的顺序和遗传距离可能不同。例如, 在内部来源的基因图谱上 ( 本文 也将 Pioneer Hi-Bred 称为 “PHB” ) 的 10cM 大概等同于在 IBM2 2005 neighbors 框图谱 ( 在玉米 GDB 上可用的高分辨率图谱 ) 上的 25-30cM。然而, 使用常见标记的通用框能够将 一个图谱与另一个图谱的信息关联。 本领域的普通技术人员可使用常见标记的框架来鉴定 在各个个体基因图谱上的标记位置和受关注的其他基因座。
“基因作图” 是限定基因座的连锁关系的方法, 该方法通过使用遗传标记、 标记的 种群分离、 以及重组频率的标准遗传原则进行。 “基因图谱位置” 是在相同连锁群上, 相对于 围绕的遗传标记在基因图谱上的位置, 其中能够在给定种群中发现指定标记。 基因组的 “物理图谱” 指绝对距离 ( 例如在碱基对或分离和重叠邻接的基因片段 如重叠群中测量的距离 )。基因组的物理图谱不考虑物理图谱上不同点之间的遗传行为 ( 例如重组频率 )。
“重组” 是在减数分裂期间同源染色体片段的交换, 以此重组连锁的基因 ; 也指此 类交换的产物。
“遗传重组频率” 是两个基因座之间的交换事件 ( 重组 ) 的频率。在标记和 / 或 减数分裂后性状的分离后可观察到重组频率。可将遗传重组频率用厘摩 (cM) 表示, 其中一 cM 是两个遗传标记间的距离, 它们显示 1%的重组频率 ( 即那两个标记间每 100 次细胞分 裂发生交换事件一次 )。
“基因组” 指总 DNA 或整套基因, 由染色体或染色体组携带。
如本文所用, 术语 “连锁” 用于描述一个标记座位与另一个标记座位或一些其他基 因座 ( 例如耐受性基因座 )“关联” 的程度。较接近的两个标记座位位于相同染色体上, 越 是接近, 它们将结合成配子, 并且一起出现的频率将越高 ; 非常接近的标记座位基本上不再 分离, 因为它们之间将出现交换点的可能性非常小。
如本文所用, “连锁平衡” 描述其中两个标记独立地分离的情况, 即, 在子代中随机 分离。认为显示连锁平衡的标记不连锁 ( 无论它们是否位于相同染色体上 )。
术语 “连锁不平衡” 指基因座或性状 ( 或者两者都有 ) 非随机地分离。在任一情 况下, 连锁不平衡意味着相关的基因座沿着一段染色体在物理上足够接近, 以便它们以大 于随机 ( 即非随机 ) 的频率一起分离 ( 在共分离性状的情况下, 产生该性状的基因座彼此 足够接近 )。显示连锁不平衡的标记被认为是连锁的。
连锁不平衡最常见地用量度 r2 测量, 它通过 Hill, W.G. 和 Robertson, A, Theor. 2 Appl.Genet.38 : 226-231(1968) 的公式计算。 当 r = 1 时, 两个标记座位间存在完全的 LD,
意味着标记还未进行重组分离并且具有相同的等位基因频率。r2 值大于 1/3 指示足够强的 LD 将被用于作图 (Ardlie 等人, Nature Reviews Genetics 3 : 299-309(2002))。因此, 当 2 成对标记座位间的 r 值大于或等于 0.33、 0.4、 0.5、 0.6、 0.7、 0.8、 0.9、 或 1.0 时, 等位基因 处于连锁不平衡。
如本文所用, 分子标记和表型间的连锁关系被给定为 “概率” 或 “调整概率” 。概 率值是表型的特定组合和特定标记等位基因随机性存在或不存在的统计学可能性。因此, 概率评分越低, 表型和特性标记将共分离的可能性越大。在某些方面, 认为概率评分是 “显 著的” 或 “不显著的” 。在一些实施方案中, 认为随机分离的概率评分为 0.05(p = 0.05, 或 5%的概率 ) 是共分离的显著性指示。然而, 本发明不受该特定标准的限制, 并且可接受的 概率可以是小于 50% (p = 0.5) 的任何概率。例如, 显著概率可小于 0.25、 小于 0.20、 小于 0.15、 或小于 0.1。
术语 “物理上连锁” 有时用于指示两个基因座例如两个标记座位物理上存在于相 同染色体上。
有利的是, 两个连锁基因座位置接近, 使得减数分裂期间这两个基因座不发生高 频率的同源染色体对间的重组, 例如使得连锁基因座至少约 90 %的时间, 如 91 %、 92 %、 93%、 94%、 95%、 96%、 97%、 98%、 99%、 99.5%、 99.75%、 或更多的时间共分离。 在本专利申请中, 短语 “紧密连锁” 指两个连锁基因座间重组的发生频率为等于或 小于约 10% ( 即在基因图谱上的分离频率不超过 10cM)。 换句话说, 紧密连锁的基因座至少 90%的情况下共分离。当标记座位显示与期望性状 ( 例如病原体耐受性 ) 共分离 ( 连锁 ) 的显著概率时, 它们在本发明中尤其有用。例如在某些方面, 这些标记可被称为连锁 QTL 标 记。在其他方面, 尤其有用的分子标记是那些连锁或紧密连锁的标记。
在某些方面, 能够将连锁表示成任何期望的限制或范围。 例如在一些实施方案中, 两个连锁基因座是被小于 50cM 的图谱单位分开的两个基因座。在其他实施方案中, 连锁基 因座是被小于 40cM 的图谱单位分开的两个基因座。在其他实施方案中, 两个连锁基因座是 被小于 30cM 的图谱单位分开的两个基因座。在其他实施方案中, 两个连锁基因座是被小于 25cM 的图谱单位分开的两个基因座。 在其他实施方案中, 两个连锁基因座是被小于 20cM 的 图谱单位分开的两个基因座。在其他实施方案中, 两个连锁基因座是被小于 15cM 的图谱单 位分开的两个基因座。在某些方面, 有利地是限定连锁的相等范围, 例如介于 10 和 20cM 之 间, 或者介于 10 和 30cM 之间, 或者介于 10 和 40cM 之间。
标记与第二基因座连锁越紧密, 标记越可能变成第二基因座的指示。因此在一个 实施方案中, 紧密连锁的基因座如标记座位和第二基因座显示 10%或更低, 优选约 9%或 更低, 更优选约 8%或更低, 更优选约 7%或更低, 更优选约 6%或更低, 更优选约 5%或更 低, 更优选约 4%或更低, 更优选约 3%或更低, 更优选约 2%或更低的基因座内重组频率。 在高度优选的实施方案中, 关联基因座显示约 1%或更低的重组频率, 例如约 0.75%或更 低, 更优选约 0.5%或更低, 更优选约 0.25%或更低的重组频率。位于相同染色体上, 并且 它们间的距离使得两个基因座间的重组发生频率小于 10 % ( 例如约 9 %、 8 %、 7 %、 6 %、 5%、 4%、 3%、 2 %、 1 %、 0.75%、 0.5 %、 0.25%、 或更低 ) 的两个基因座也称为彼此紧密连 锁。在某些情况下, 两个不同标记能够具有相同的基因图谱坐标。在那种情况下, 两个标记 彼此足够接近使得它们之间的重组发生频率低至无法检测。
当涉及两个遗传因子间的关系时, 如有助于产生耐受性和紧密关联标记的遗传因 子, “相引” 相连锁指示下述状态 : 其中在耐受性基因座上的 “有利” 等位基因与相应连锁的 标记座位的 “有利” 等位基因物理上附连在相同染色体链上。在相引相中, 两个有利等位基 因被继承了该染色体链的子代一起继承。在 “相斥” 相连锁中, 在受关注基因座上的 “有利” 等位基因与在连锁标记座位上的 “不利” 等位基因物理上连锁, 并且两个 “有利” 等位基因 不被一起继承 ( 即这两个基因座彼此 “异相” )。
如本文所用, 术语 “染色体区间” 、 “染色体的区间” 、 “染色体片段” 、 或 “染色体的片 段” 命名基因组 DNA 的邻接线性片段, 它驻留在植物中的单染色体上, 通常定义关于限定染 色体区间的端点的两个标记。位于单染色体间隔上的遗传因子或基因是物理上连锁的。不 特别限定染色体区间的大小。
在某些方面, 例如在本发明的上下文中, 位于单染色体区间中的遗传因子一般也 是遗传连锁的, 通常在例如小于或等于 20cM 或者小于或等于 10cM 的遗传重组距离内。即, 在单染色体区间内的两个遗传因子发生重组的频率小于或等于 20%或 10%。
在一个方面, 本发明的任何标记与等于或小于 50cM 的任何其他标记连锁 ( 遗传上 和物理上 )。 在另一方面, 本发明的任何标记与非常接近 ( 例如距离等于或小于 10cM) 的任 何其他标记紧密连锁 ( 遗传上和物理上 )。在相同染色体上的两个紧密连锁的标记可被彼 此定位于 9、 8、 7、 6、 5、 4、 3、 2、 1、 0.75、 0.5 或 0.25cM 或更小。
短语 “灰叶斑病” 或 “GLS” 指由真菌病原体玉米灰叶斑病菌引起的谷物病害, 它表 征性地生成与叶脉平行的、 长矩形浅灰 - 棕褐色叶片损伤。
玉米植物对 GLS“新赋予的耐受性” 或 “提高的耐受性” 指示玉米植物当导入病害 如诱发剂玉米灰叶斑病菌时其产量和 / 或存活能力或其他相关农学指标较少受影响。耐受 性是一个相对定义, 指示被感染的植物比另一株同样处理的、 更易感的植物玉米产量更高。 即, 与易感玉米植物相比, 在耐受性玉米植物中病害引起的玉米存活率和 / 或产量减少的 程度较低。
技术人员将会知道玉米植物对 GLS 的耐受性相差很大, 能够提供一系列耐受性较 高至耐受性较低的表型, 并且耐受性取决于感染的严重程度能够发生变化。 然而, 通过简单 的观察, 技术人员能测定不同植物、 植物品系或植物家族对 GLS 的相对耐受性或易感性, 此 外也将认识到 “耐受性” 的表型等级。例如可使用 1 至 9 的视觉评分指示 GLS 耐受性。评 分越高指示耐受性越强。仅当在测量实验中存在足够的选择压力时, 数据将被收集。
在本发明上下文中的术语 “杂交的” 或 “杂交” 指经由授粉产生子代的配子融合 ( 例如细胞、 种子或植物 )。该术语包括有性杂交 ( 一株植物被另一株植物授粉 ) 和自交 ( 自花授粉, 例如当花粉和胚珠来自相同植物时 )。术语 “杂交” 指经由授粉产生子代的配 子融合行为。
术语 “渗入” 指基因座的期望等位基因从一种遗传背景传递到另一种遗传背景的 现象。例如在特定基因座的期望等位基因通过渗入、 经由相同物种的两个亲本间的有性杂 交可被传递到至少一个子代, 其中至少一个亲本在其基因组中具有期望的等位基因。作为 另外一种选择, 例如等位基因的传递能够通过两个供体基因组之间的重组而发生, 例如在 融合原生质体中, 其中至少其中一个供体原生质体在其基因组中具有期望的等位基因。期 望的等位基因可为例如标记的选择等位基因、 QTL、 转基因等。 在任何情况下, 能够将包含期望等位基因的子代与具有期望遗传背景的品系反复回交并选择期望的等位基因以产生固 定在选择遗传背景中的等位基因。
当重复 “基因渗入” 过程两次或更多次时, 该过程常被称为 “回交” 。
“回交转化体” 是通过回交将某一基因座或性状渗入某一品种的产物。
“回交” 指其中杂交子代反复与其中一个亲本回交的过程。在一个回交方案中, “供体” 亲本指具有将被渗入的期望基因或基因座的亲本植物。 “受体” 亲本 ( 使用一次或 多次 ) 或 “轮回” 亲本 ( 使用两次或多次 ) 指将基因或基因座渗入其中的亲本植物。例 如 参 见 Ragot, M. 等 人 (1995)Marker-assisted backcrossing : a practical example, inTechniques et Utilisations des Marqueurs Moleculaires Les Colloques, 第 72 卷 第 45-56 页, 以 及 Openshaw 等 人, (1994)Marker-assisted Selectionin Backcross Breeding, Analysis of Molecular Marker Data, 第 41-43 页。初始杂交产生 F1 代 ; 然后 术语 “BC1” 指轮回亲本的第二次使用, “BC2” 指轮回亲本的第三次使用等等。
“品系” 或 “品种” 是一组具有相同亲本的个体, 它们一般是某种程度的自交体, 并 且一般在大多数基因座是纯合的和同质的 ( 同基因的或接近同基因的 )。 “亚系” 指子代的 自交体亚群, 它们与相同祖先来源的其他相似自交体亚群遗传上不同。
“祖先品系” 是用作基因来源的亲本品系, 例如用于开发优良品系。 “祖先种群” 是 已经产生大部分基因变异的一组祖先, 这些基因变异被用于开发优良品系。 “子代” 是祖先 的子代, 并且可通过多代育种从它们的祖先分离得到。 例如优良品系是它们的祖先的子代。 “谱系结构” 规定了子代和产生该子代的各个祖先的关系。谱系结构能够跨越一代或多代, 描述子代及其父母亲本、 祖父母亲本、 曾祖父母亲本等的关系。
“优良品系” 或 “优良品种” 是农学上优异的品系, 该品系由多代育种以及选择优异 农学特性产生。多个优良品系对玉米育种领域的技术人员来说是可用的和已知的。 “优良 种群” 是一类优良个体或品系, 根据给定作物物种如玉米的农学上优异的基因型, 它们将可 用于代表技术发展水平。同样的, “优良种质” 或优良品种的种质是农学上优异的种质, 通常 来源于和 / 或能够生成具有优异农学性能的植物, 如现有的或新开发的优良玉米品系。
与之相反, “外来玉米品种” 或 “外来玉米种质” 是来源于不属于可利用优良玉米品 系或品种的种质的玉米的品种或种质。 在杂交发生在两个玉米植株或品种的种质之间的情 况下, 外来种质的子代不与它杂交的优良种质密切相关。最常见的是外来种质不来源于任 何已知的玉米优良品系, 而是选择将新遗传因子 ( 通常新等位基因 ) 导入育种程序。
在核酸扩增的情况下术语 “扩增” 是其中产生附加拷贝的选择核酸 ( 或其转录 形式 ) 的任何过程。一般的扩增方法包括基于多种聚合酶的复制方法包括聚合酶链反应 (PCR)、 连接酶介导的方法如连接酶链反应 (LCR)、 以及基于 RNA 聚合酶的扩增 ( 例如通过转 录 ) 方法。
“扩增子” 是被扩增的核酸, 例如使用任何可用的扩增方法 ( 例如 PCR、 LCR、 转录 等 ) 通过扩增模板核酸制备的核酸。
“基因组学核酸” 是按顺序对应于细胞中的可遗传核酸的核酸。常见实例包括核基 因组 DNA 及其扩增子。在某些情况下基因组核酸不同于剪接 RNA 或对应的 cDNA, 因为剪接 RNA 或 cDNA 通过例如剪接机制进行处理以除去内含子。基因组核酸任选地包含非转录的 ( 例如染色体结构序列、 启动子区、 或增强子区 ) 和 / 或非翻译的序列 ( 例如内含子 ), 然而剪接 RNA/cDNA 通常不具备非转录的序列或内含子。 “模板核酸” 是在扩增反应 ( 例如基于 聚合酶的扩增反应如 PCR、 连接酶介导的扩增反应如 LCR、 转录反应等 ) 中起到模板作用的 核酸。模板核酸可为基因组起源的, 或者可来源于表达序列如 cDNA 或 EST。
“核苷酸序列” 、 “多核苷酸” 、 “核酸序列” 、 和 “核酸片段” 可互换使用, 并且指作为单 链或双链的 RNA 或 DNA 聚合物, 任选含有合成的、 非天然的或改变的核苷酸碱基。 “核苷酸” 是构成 DNA 或 RNA 聚合物的单体单元, 它由嘌呤或嘧啶碱基、 戊糖、 和磷酸基组成。核苷酸 ( 通常以它们的 5′单磷酸形式存在 ) 通过如下它们的单个字母名称来指代 : “A” 为腺苷酸 或脱氧腺苷酸 ( 分别对应 RNA 或 DNA), “C” 表示胞苷酸或脱氧胞苷酸, “G” 表示鸟苷酸或脱 氧鸟苷酸, “U” 表示尿苷酸, “T” 表示脱氧胸苷酸, “R” 表示嘌呤 (A 或 G), “Y” 表示嘧啶 (C 或 T), “K” 表示 G 或 T, “H” 表示 A 或 C 或 T, “I” 表示肌苷, 并且 “N” 表示任何核苷酸。
“外源核酸” 指针对序列、 基因组位置、 或两者的, 不是原产于指定体系 ( 例如种质、 植物、 或品种 ) 的核酸。如本文所用, 应用于多核苷酸或多肽的术语 “外源的” 或 “异源的” 通常指已经被人工供给生物系统 ( 例如研究的植物细胞、 植物基因、 特定植物物种或品种 或植物染色体 ) 的分子, 并且所述分子不是该特定生物系统自有的。该术语能够指示从除 天然存在来源之外的来源获取的有关材料, 或者能够指具有非天然构型、 遗传位置或部件 排列的分子。 与之相反, 例如 “天然的” 或 “内源的” 基因是不包含由除染色体或其他遗传因子 之外的来源编码的核酸元件的基因, 在所述染色体或其他遗传因子上内源基因通常天然存 在。内源基因、 转录物或多肽由其天然染色体座位编码, 并且不被人工供给于细胞。
关于核酸或多肽的术语 “重组体” 指示该材料 ( 例如重组核酸、 基因、 多核苷酸、 或 多肽 ) 已经被人工干预改变。重组分子部分的排列一般不是天然构型, 或者重组多核苷酸 或多肽的一级序列已经在某些方面被操纵了。可在材料的天然环境或状态下、 或使其脱离 天然环境或状态, 对所述材料进行改变以产生重组材料。例如如果在获取天然存在核酸的 细胞中通过人工干预使得天然存在的核酸发生变化, 或者转录出该核酸的 DNA 已经发生了 变化, 该核苷酸变成重组核酸。如果核苷酸序列已经从其天然环境中移除并被克隆进任何 类型的人工核酸载体中, 该基因序列开放阅读框是重组体。制备重组分子尤其是重组核酸 分子的规程和试剂是本领域常见的和常规的。在一个实施方案中, 可制备人工染色体并通 过本领域已知的任何方法将其插入玉米植物中 ( 例如直接递送方法如 PEG 诱导的 DNA 摄 入、 原生质体融合、 显微注射、 电穿孔、 以及基因枪轰击 )。人工染色体是一条可稳定复制并 沿着内源染色体分离的 DNA。它具有容纳并表达该处插入的异源基因的能力。将异源 DNA 整合到大复制区域 ( 着丝粒的主要复制起始位点 ) 中或与其足够接近, 启动兆碱基大小的 染色体片段的大规模扩增, 这导致重新形成染色体。参见例如美国专利 6,077,697, 该专利 以引用方式并入本文。
术语重组体也可指包含重组材料的生物, 如包含重组核酸的植物被认为是重组植 物。在一些实施方案中, 重组生物体是转基因生物体。
当涉及将异源或外源核酸转位到细胞中时, 术语 “导入” 指使用任何方法将核酸掺 入细胞。该术语包括核酸导入方法如 “转染” 、 “转化” 、 和 “转导” 。
如本文所用, 术语 “载体” 用于指将核酸片段转运到细胞中的多核苷酸或其他分 子。术语 “运载体” 有时与 “载体” 互换使用。载体任选地包含介导载体维持和使其发挥预
期用途的部分 ( 例如复制必需的序列、 赋予药物或抗生素抗性的基因、 多克隆位点、 或者可 操作地连接的使得克隆基因能够表达的启动子 / 增强子元件 )。载体通常来源于质粒、 噬 菌体、 或者植物或动物病毒。 “克隆载体” 或 “穿梭载体” 或 “亚克隆载体” 包含可操作地连 接的部分, 所述部分有利于亚克隆步骤 ( 例如包含多个限制性内切核酸酶位点的多克隆位 点 )。
如本文所用, 术语 “表达载体” 指包含可操作地连接的多核苷酸序列的载体, 所述 多核苷酸序列有利于在特定宿主生物中表达编码序列 ( 例如细菌表达载体或植物表达载 体 )。有利于在原核生物中表达的多核苷酸序列通常包括例如启动子、 操纵子 ( 任选的 )、 和核糖体结合位点、 通常还包括其他序列。真核细胞能够使用启动子、 增强子、 终止和聚腺 苷酸化信号、 以及一般不同于原核生物使用的那些序列的其他序列。
术语 “转基因植物” 指在其细胞中包含异源多核苷酸的植物。异源多核苷酸一般 被稳定地整合进基因组中, 使得该多核苷酸传递至连续的世代。异源多核苷酸可单独地或 作为重组表达盒的部分整合进基因组中。本文所用的 “转基因” 包括因异源核酸存在而已 经改变了基因型的任何细胞、 细胞系、 愈伤组织、 组织、 植物部分或植物, 包括初始进行此类 改变的转基因以及从初始的转基因生物或细胞通过杂交或无性繁殖产生的那些转基因生 物或细胞。如本文所用, 术语 “转基因” 不涵盖通过常规植物育种方法 ( 如杂交 ) 或通过诸 如随机异花受精、 非重组病毒感染、 非重组细菌转化、 非重组转座或自发突变之类的自然发 生事件导致的基因组 ( 染色体基因组或染色体外基因组 ) 改变。 “定位克隆” 是一种克隆方法, 其中靶核酸通过它与标记核酸的基因组接近程度被 鉴定并分离。 例如基因组核酸克隆能够包括部分或全部两个更多的彼此紧密连锁的染色体 区域。如果可使用标记从基因组文库中鉴定基因组核酸克隆, 能够使用标准方法如亚克隆 或测序来鉴定和 / 或分离靠近标记的克隆的亚序列。
当指定核酸使用给定核酸的序列进行构建时, 或者当指定核酸使用给定核酸进行 构建时, 该指定核酸 “来源于” 给定核酸。例如, cDNA 或 EST 来源于表达 mRNA。
术语 “遗传因子” 或 “基因” 指具有功能意义的 DNA 的可遗传序列, 即基因组序列。 也可使用术语 “基因” 指例如 cDNA 和 / 或由基因组序列编码的 mRNA, 以及该基因组序列。
术语 “基因型” 是个体 ( 或个体组 ) 在一个或多个基因座上的基因组成, 它与可观 察到的性状 ( 表型 ) 形成对照。基因型由一个或多个已知基因座的等位基因限定, 个体已 经从其亲本中继承了所述基因座。术语基因型可被用于指个体在单个基因座上的基因组 成, 在多个基因座上的基因组成, 或者更一般的, 术语基因型可被用于指个体在其基因组中 的所有基因的基因组成。
“单倍型” 是个体在多个基因座上的基因型。单倍型描述的基因座通常是物理上和 遗传上连锁的, 即在相同染色体片段上。术语 “单倍型” 可指在特定基因座的多态性, 如单 标记座位, 或者在沿染色体片段的多个基因座上的多态性。前者也可被称为 “标记单倍型” 或 “标记等位基因” , 而后者可被称为 “远程单倍型” 。
术语 “表型” 或 “表型性状” 或 “性状” 指生物的一个或多个性状。表型可用肉眼或 者本领域已知的任何其他评估手段观察到, 例如显微镜法、 生物化学分析、 基因组分析、 或 用于特定病害耐受性的检测分析法。 在某些情况下, 表型由单个基因或基因座直接控制, 即 “单基因性状” 。在其他情况下, 表型是若干个基因的结果。
“分子表型” 是在一组 ( 一个或多个 ) 分子水平上可检测的表型。此类分子可为核 酸如基因组 DNA 或 RNA、 蛋白、 或代谢物。例如, 分子表型可为一种或多种基因产物的表达 谱, 例如在植物发育的特定阶段, 响应于环境条件或胁迫等的基因产物。表达谱通常在 RNA 或蛋白水平上评估, 例如在核酸阵列或 “芯片” 上评估或者使用抗体或其他结合蛋白进行评 估。
“代表性样品” 是涵盖采样种群的相关组合物和特性的样品。
“着丝粒” 是在每个染色体上的单个位点, 用于在有丝分裂和减数分裂过程中的着 丝粒装配和正确的染色体分离。
术语 “产量” 指具有商业价值的特定植物产品每单位面积的产量。例如玉米产量 一般以每季每英亩种子蒲式耳数或每季每公顷种子公吨数来测量。 产量受遗传和环境因素 的影响。 “农学” 、 “农学特性” 、 和 “农学性能” 指给定植物品种的性状 ( 以及产生性状的遗 传因子 ), 所述性状有助于经过生长期的产量。 单个农学特性包括出苗活力、 营养势、 胁迫耐 受性、 病害抗性或耐受性、 除草剂抗性、 发生分枝、 开花、 结实率、 种子大小、 种子密度、 抗倒 伏性、 脱粒率等。因此产量是所有农学特性的最终结果。
一 “组” 标记或探针指标记或探针、 或由此获得的数据的一个集合或组, 它们用于 常见目的, 例如鉴定具有期望性状的玉米植物 ( 例如 GLS 耐受性 )。很多情况下, 对应于标 记或探针的数据、 或者来源于它们的应用的数据, 被储存在电子介质中。 当一组的每个成员 具有针对特定目的的效用时, 从包括一些但不是全部标记的所述组以及亚组中选择的单个 标记对达到特定目的也是有效的。
“遗传特征图” 是对特定性状或基因座的序列特征的鉴定和表征。
“查找表” 是将一种形式的数据与另一种形式的数据关联, 或者将一种或多种形式 的数据与该数据相关的预测结果关联的表。例如, 查找表能够包括等位基因数据和预测的 包含给定等位基因的植物可能显示的性状间的相关性。这些表可为并且通常为多维的, 例 如同时考虑多个等位基因并且也任选地考虑其他因素, 例如遗传背景如进行性状预测。
“重叠群”指来源于单一基因来源的一组重叠 DNA 片段。重叠群图谱描述了 代表延长染色体片段的重叠群的连锁文库的相对顺序。 “公开重叠群”是公开可用的 一组重叠 DNA 片段, 它们来源于单一基因来源。公开来源的实例包括 Maize Mapping Project(University ofMissouri-Columbia、 University of Georgia、 和 University of Arizona)、 Arizona Genomics Institute、 MaizeGDB 网站、 以及 Maize Sequence 网站。序 列比对或重叠群也可用于查找本文列出的特定标记的上游或下游序列。 这些新序列靠近本 文所述的标记, 然后被用于发现和开发功能等同的标记。例如将不同的物理和 / 或基因图 谱进行比对以定位等同标记, 所述标记不在所述公开中描述, 但是位于相似区域内。 这些图 谱可在玉米物种中, 或者甚至包括已经与玉米进行了遗传上或物理上的比对的其他物种, 如大米、 小麦、 大麦、 或高粱。
可用 LASARGENE 生物信息计算包 (DNASTAR Inc., Madison, WI) 的 Megalign 程序 进行序列比对和相似度百分比计算。用带默认参数 ( 空位罚分= 10, 空位长度罚分= 10) 的 Clustal 比对方法 (Higgins 和 Sharp, CABIOS 5 : 151-153(1989)) 进行序列的多重比对。 用 Clustal 方法进行成对比对和蛋白质序列的百分比同一性计算的默认参数为 KTUPLE = 1、 空位罚分= 3、 窗口 (WINDOW) = 5 和 DIAGONALSSAVED = 5。就核酸而言, 这些参数为空位罚分= 10, 空位长度罚分= 10, KTUPLE = 2, 空位罚分= 5, 窗口= 4, 和 DIAGONALS SAVED = 4。氨基酸或核苷酸序列的 “主要部分” 包含足够的多肽的氨基酸序列或基因的核苷酸 序列以提供该多肽或基因的推定鉴定, 所述序列可由本领域技术人员来人工评估, 或使用 计算机自动化的序列比较和鉴定工具进行评估, 所述工具使用算法如 BLAST(Altschul, S.F. 等 人, J.Mol.Biol.215 : 403-410(1993)) 和 Gapped Blast(Altschul, S.F. 等 人, Nucleic AcidsRes.25 : 3389-3402(1997))。可使用 BLASTN 程序进行 BLAST 核苷酸搜索, 得分= 100, 字长= 12, 以获取与编码本实施方案的蛋白的核苷酸序列同源的核苷酸序列。 可使用 BLASTX 程序进行 BLAST 蛋白搜索, 得分= 50, 字长= 3, 以获取与本实施方案的多 肽同源的氨基酸序列。为了获取用于比对目的的空位比对, 可利用 Gapped BLAST(BLAST 2.0), 如 Altschul 等人 (1997)Nucleic Acids Res.25 : 3389. 作为另外一种选择, 可使用 PSI-BLAST(BLAST 2.0) 进行重复搜索, 它检测分子间的较远关系。参见 Altschul 等人 (1997) 同上。当利用 BLAST、 Gapped BLAST、 PSI-BLAST 时, 可使用相应程序 ( 例如用于核 苷酸序列的 BLASTN, 用于蛋白的 BLASTX) 的默认参数。也可通过检查进行手动比对。
“电脑可读介质” 是一种信息存储介质, 使用电脑可用的或定制的接口可对之进行 存取利用。实例包括存储器 ( 例如 ROM、 RAM、 或闪存 )、 光存储介质 ( 例如 CD-ROM)、 磁存储 介质 ( 电脑硬盘、 软盘等 )、 穿孔卡片、 以及许多其他可商购获得的存储介质。 信息可在受关 注的系统和电脑之间传递, 或者传递到电脑及用于存储或获取存储信息的电脑可读介质上 或者从中获取信息。这种传递可为电传递, 或者可通过其他可用方法如 IR 连接、 无线连接 等进行。
“系统说明书” 是可被系统部分或完全执行的说明书。说明书通常以系统软件形式 存在。
附图和序列简述
根据以下的详细描述和附图以及序列表, 可更全面地理解本发明, 以下的详细描 述和附图以及序列表形成本申请的一部分。此序列表中以单个字母表示核苷酸, 以三字母 表示氨基酸, 如 Nucleic AcidsResearch 13 : 3021-3030(1985) 和 Biochemical Journal 219(No.2) : 345-373(1984) 所描述的 IUPAC-IUBMB 标准中所规定, 它们以引用方式全文并 入本文。用于核苷酸和氨基酸序列数据的符号和格式遵循在 37C.F.R.§1.822 中所列出的 规定。
图 1 示出在 IBM2 2004 neighbors 染色体 4 图谱上的 PHJEP GLSQTL 的最终位置。 距离单位为 cM。
图 2 示出在第二轮作图后, 在 IBM2 2004 neighbors 染色体 4 图谱上的 GLS QTL 的特写图。在第二轮 QTL 作图中使用加框的标记。箭头显示在该第二轮 QTL 作图后的 QTL 区域。黑色框示出精细作图后的最终 QTL 位置。
图 3 示出精细作图后的 GLS QTL 图谱位置。
图 4A-F 示出序列 BAC 的物理图谱排列 ( 获取自 Maize GenomeBrowser, 它在因特 网上公开可用 ; 网址为 http://www.maizesequence.org), 所述序列 BAC 在包含 GLS QTL 的 染色体 4 区域中。
图 5 示出 GLS QTL 渗入到 PHN46 中的过程。深灰色指示 PH14T 起点。水平线指示 PHN46 起点。对角线指示重组区域。*UMC1299 位置来自 IBM2 Neighbors 框图谱 -- 与物理图谱位置一致。
图 6 示出 PHN46( 左 )、 PH14T( 中 ) 和 PHJEP( 右 ) 中的 GLS 病害抗性水平。
图 7 示出以下杂交体的 GLS 病害抗性水平 : A) 具有 QTL 渗入的 Pioneer 杂交体, 它通过杂交自交体 PHP38 和 PHJEP 制备, 和 B) 不具有 QTL 渗入的 Pioneer 杂交体 3394。
图 8 示出 GLS QTL 进一步渗入到优良材料中的过程。深灰色指示 PH14T 起点。水 平线指示 PHN46 起点。对角线指示 PHJEP 和新的优良种质之间的重组。圆点指示 PH14T 和 PHN46 之间的重组。无阴影部分指示新的优良种质 PHVNV、 PHEHG、 PHW3Y、 PHEWB、 或 PHWRC。
图 9 提供基因组和 SSR 标记的列表, 包括那些证明与 GLS 耐受性表型连锁不平衡 的标记 ( 从基因图谱中直接或通过外推法得到 )。该表提供用于 SSR 标记座位基因型分析 的左和右 PCR 引物序列。也显示在 SSR 的串联重复元件中的核苷酸数目。
图 10 提供列出证明与 GLS 耐受性表型连锁不平衡的 SNP 标记。该表提供用于生 成包含 SNP 的扩增子的 PCR 引物的序列。
序列描述以及关联的序列表遵循如 37 C.F R.§1.821-1.825 中所列出的管理专 利申请中的核苷酸和 / 或氨基酸序列公开的规则。序列表包含核苷酸序列字符的单字母 码以及氨基酸的三字母码, 如遵照 IUPAC-IUBMB 标准所定义的, 该标准在 Nucleic Acids Res.13 : 3021-3030(1985) 以 及 在 Biochemical J.219(2) : 345-373(1984) 中 描 述, 这两 篇文献以引用的方式并入本文。用于核苷酸和氨基酸序列数据的符号和格式遵循在 37C. F.R.§1.822 中列出的规则。
SEQ ID NO : 1 和 SEQ ID NO : 2 是设计用于扩增 BAC 末端 bacm2.pk027.h10.f 的引 物。
SEQ ID NO : 3 和 SEQ ID NO : 4 是设计用于扩增 BAC 末端 bacm.pk098.d7 的引物。
SEQ ID NO : 5 和 SEQ ID NO : 6 是设计用于扩增 BAC 末端 bacm.pk106.j3 的引物。
SEQ ID NO : 7 和 SEQ ID NO : 8 是设计用于扩增 BAC 末端 bacm.pk018.h15 的引物。
SEQ ID NO : 9 和 SEQ ID NO : 10 是设计用于扩增 BAC 末端 bacm.pk040.o17 的引物。 该引物对代表本文称为 PHM 00045 的 CAPs 标记。
SEQ ID NO : 11 和 SEQ ID NO : 12 是设计用于扩增 BAC 末端 bacm2.pk065.b22.f 的 引物。
SEQ ID NO : 13 和 SEQ ID NO : 14 是设计用于扩增 BAC 末端 bacb.pk0333.o19 的引 物。该引物对代表本文称为 PHM 00043 的 CAPs 标记。
SEQ ID NO : 15 和 SEQ ID NO : 16 是设计用于扩增 BAC 末端 bacc.pk0267.m12.f 的 引物。
SEQ ID NO : 17 和 SEQ ID NO : 18 是 设 计 用 于 扩 增 EST 横 穿 (overgo) 探 针 cl33021_1 的引物。
SEQ ID NO : 19 和 SEQ ID NO : 20 是设计用于扩增 BAC 末端 bacb.pk0241.h17.f 的 引物。
SEQ ID NO : 21 和 SEQ ID NO : 22 是设计用于扩增克隆 chp2.pk0007.d2 的引物。
SEQ ID NO : 23 和 SEQ ID NO : 24 是设计用于扩增 BAC 末端 bacc.pk0530.f13.f 的 引物。
SEQ ID NO : 25 和 SEQ ID NO : 26 是设计用于克隆 p0094.csstg88 的引物。SEQ ID NO : 27 和 SEQ ID NO : 28 是设计用于扩增 BAC 末端 bacb.pk0269.n19 的引 SEQ ID NO : 29 和 SEQ ID NO : 30 是设计用于扩增 BAC 末端 bacb.pk0009.b21.f 的 SEQ ID NO : 31 和 SEQ ID NO : 32 是设计用于扩增 BAC 末端 bacb.pk0117.i09.f 的 SEQ ID NO : 33 和 SEQ ID NO : 34 是设计用于扩增 BAC 末端 bacc.pk0280.n12 的引 SEQ ID NO : 35 和 SEQ ID NO : 36 是设计用于扩增 BAC 末端 bacb.pk0219.j20 的引 SEQ ID NO : 37 和 SEQ ID NO : 38 是设计用于扩增 BAC 末端 bacc.pk0132.b16.f 的 SEQ ID NO : 39 和 SEQ ID NO : 40 是设计用于扩增 BAC 末端 bacb.pk0221.o22 的引 SEQ ID NO : 41 和 SEQ ID NO : 42 是设计用于扩增 BAC 末端 bacb.pk0544.j18 的引 SEQ ID NO : 43 和 SEQ ID NO : 44 是设计用于扩增 BAC 末端 bacb.pk0540.c18.f 的物。
引物。
引物。
物。
物。
引物。
物。
物。
引物。 SEQ ID NO : 45 和 SEQ ID NO : 46 是设计用于扩增 BAC 末端 bacm.pk022.b8 的引物。 该引物对代表本文称为 PHM 00049 的 CAPs 标记。
SEQ ID NO : 47 和 SEQ ID NO : 48 是用于标记座位 PHM 7245 的引物。
SEQ ID NO : 49 是分类为 LRR 样蛋白激酶型的推定 R 基因的注解核苷酸序列。
SEQ ID NO : 50 是由 SEQ ID NO : 49 编码的蛋白的氨基酸序列。
SEQ ID NO : 51 是 PHM 15534-13 正向引物的序列。
SEQ ID NO : 52 是 PHM 15534-13 反向引物的序列。
SEQ ID NO : 53 是 PHM 15534-13 探针 1 的序列。
SEQ ID NO : 54 是 PHM 15534-13 探针 2 的序列。
SEQ ID NO : 55 是 PHM 15534 参比序列的序列。
SEQ ID NO : 56 是 PHM 04694-10 正向引物的序列。
SEQ ID NO : 57 是 PHM 04694-10 反向引物的序列。
SEQ ID NO : 58 是 PHM 04694-10 探针 1 的序列。
SEQ ID NO : 59 是 PHM 04694-10 探针 2 的序列。
SEQ ID NO : 60 是 PHM 04694-10 参比序列的序列。
SEQ ID NO : 61 是 PHM 01811-32 正向引物的序列。
SEQ ID NO : 62 是 PHM 01811-32 反向引物的序列。
SEQ ID NO : 63 是 PHM 01811-32 探针 1 的序列。
SEQ ID NO : 64 是 PHM 01811-32 探针 2 的序列。
SEQ ID NO : 65 是 PHM 01811-32 参比序列的序列。
SEQ ID NO : 66 是 PHM 01963-15 正向引物的序列。
SEQ ID NO : 67 是 PHM 01963-15 反向引物的序列。 SEQ ID NO : 68 是 PHM 01963-15 探针 1 的序列。 SEQ ID NO : 69 是 PHM 01963-15 探针 2 的序列。 SEQ ID NO : 70 是 PHM 01963-15 参比序列的序列。 SEQ ID NO : 71 是 PHM 01963-22 正向引物的序列。 SEQ ID NO : 72 是 PHM 01963-22 反向引物的序列。 SEQ ID NO : 73 是 PHM 01963-22 探针 1 的序列。 SEQ ID NO : 74 是 PHM 01963-22 探针 2 的序列。 SEQ ID NO : 75 是 PHM 01963-22 参比序列的序列。 SEQ ID NO : 76 是 PHM 05013-12 正向引物的序列。 SEQ ID NO : 77 是 PHM 05013-12 反向引物的序列。 SEQ ID NO : 78 是 PHM 05013-12 探针 1 的序列。 SEQ ID NO : 79 是 PHM 05013-12 探针 2 的序列。 SEQ ID NO : 80 是 PHM 05013-12 参比序列的序列。 SEQ ID NO : 81 是 PHM 00586-10 正向引物的序列。 SEQ ID NO : 82 是 PHM 00586-10 反向引物的序列。 SEQ ID NO : 83 是 PHM 00586-10 探针 1 的序列。 SEQ ID NO : 84 是 PHM 00586-10 探针 2 的序列。 SEQ ID NO : 85 是 PHM 00586-10 参比序列的序列。 SEQ ID NO : 86 是标记 bnlg1755 的左引物的序列。 SEQ ID NO : 87 是标记 bnlg1755 的右引物的序列。 SEQ ID NO : 88 是标记 umc156a 的左引物的序列。 SEQ ID NO : 89 是标记 umc156a 的右引物的序列。 SEQ ID NO : 90 是标记 umc1142 的左引物的序列。 SEQ ID NO : 91 是标记 umc1142 的右引物的序列。 SEQ ID NO : 92 是标记 umc1346 的左引物的序列。 SEQ ID NO : 93 是标记 umc1346 的右引物的序列。 SEQ ID NO : 94 是标记 umc1702 的左引物的序列。 SEQ ID NO : 95 是标记 umc1702 的右引物的序列。 SEQ ID NO : 96 是标记 mmc0371 的左引物的序列。 SEQ ID NO : 97 是标记 mmc0371 的右引物的序列。 SEQ ID NO : 98 是标记 bnlg1621a 的左引物的序列。 SEQ ID NO : 99 是标记 bnlg1621a 的右引物的序列。 SEQ ID NO : 100 是标记 umc1299 的左引物的序列。 SEQ ID NO : 101 是标记 umc1299 的右引物的序列。 SEQ ID NO : 102 是 PHM 00045 参比序列的序列。 SEQ ID NO : 103 是 PHM 00049 参比序列的序列。 发明详述 使用 MAS 鉴定并选择显示 GLS 耐受性的玉米植物能够提供有效的和环境友好的方法以减少这种病害引起的损失。本发明提供玉米标记座位, 所述标记座位显示统计意义上 显著性的 GLS 耐受性共分离。能够在标记辅助的玉米育种程序中检测这些基因座或附加的 连锁基因座以制备耐受性植物或具有改善的 GLS 耐受性的植物。本文鉴定的连锁 SSR 和 SNP 标记在下文和图中提供。这些标记包括 PHM 15534、 PHM04694、 PHM 01811、 PHM 01963、 PHM 05013、 和 PHM 00586( 图 10)。
每个 SSR 型标记显示多个等位基因, 所述等位基因可被视为不同大小的 PCR 扩增 子。用于生成 SSR 标记扩增子的 PCR 引物在图 9 中提供。SNP 型标记的等位基因使用等位 基因特异性的杂交规程进行测定, 该规程是本领域已知的。用于扩增 SNP 结构域的 PCR 引 物在图 10 中提供
本领域认识到与 QTL 标记连锁的任何其他标记 ( 例如病害耐受性标记 ) 也发现用 于相同目的。提供了与本文所述的病害耐受性标记连锁的附加标记的实例。例如可从表 3 提供的紧密连锁中测定连锁标记。然而并不意味着本发明使用的连锁标记受表 3 所述的那 些标记的限制。
本发明也提供与 GLS 耐受性关联的染色体 QTL 区间。 这些区间位于连锁群 4 上。 将 位于这些区间内的任何标记用作 GLS 耐受性标记。 这些区间包括 : (i)BNLG1755 和 UMC1299, (ii)BNLG1755 和 BNLG1621A, (iii)BNLG1755 和 MMC0371, (iv)BNLG1755 和 UMC1702, (v) UMC156A 和 UMC1299, (vi)UMC156A 和 BNLG1621A, (vii)UMC156A 和 MMC0371, (viii)UMC156A 和 UMC1702, (ix)UMC1142 和 UMC1299, (x)UMC1142 和 BNLG1621A, (xi)UMC1142 和 MMC0371, (xii)UMC1142 和 UMC1702, (xiii)UMC1346 和 UMC1299, (xiv)UMC1346 和 BNLG1621A, (xv) UMC1346 和 MMC0371, 以及 (xvi)UMC1346 和 UMC1702。
本发明还提供由 PHM 00043(SEQ ID NO : 102) 和 PHM 00049(SEQID NO : 103) 限定 并包括它们的邻接 DNA 区域, 其中包含与 GLS 耐受性共分离的标记座位 ( 图 4)。可使用位 于 DNA 邻接片段内的任何标记座位作为 GLS 耐受性标记, 所述 DNA 邻接片段位于以下两个 核苷酸序列之间并包括它们 : SEQ ID NO : 102, 或者基于 Clustal V 比对方法与 SEQ ID NO : 102 具有 95%同一性的核苷酸序列, 以及 SEQ IDNO : 103, 或者基于 Clustal V 比对方法与 SEQ ID NO : 103 具有 95%同一性的核苷酸序列。
鉴定携带优选耐受性标记座位的等位基因的玉米植物或种质的方法是本发明的 一个特征。 在这些方法中, 取决于标记座位的类型, 可使用多种标记检测规程中的任何一种 来鉴定在标记座位的等位基因。一般检测方法包括 ASH、 SSR 检测、 RFLP 分析、 以及多种其 他方法。
虽然特定标记等位基因可显示与病害耐受性表型或易感性表型的共分离, 但重要 的是注意到标记座位是导致耐受性或易感性的 QTL 基因座非必需的部分。例如不需要标记 多核苷酸序列是赋予病害耐受性的基因的部分 ( 例如是基因开放阅读框的部分 )。在耐受 性或易感性等位基因从中起源的祖先玉米品系中, 特定标记等位基因与耐受性或易感性表 型的关联是由于标记等位基因和 QTL 耐受性或易感性等位基因之间的最初 “相引” 相连锁。 最后通过反复重组, 标记和 QTL 基因座间的交换事件能够改变这种取向。正是因为这个原 因, 有利标记等位基因可根据存在于耐受性亲本中的相连锁发生改变, 所述耐受性亲本用 于制备分离种群。这不改变可使用遗传标记监控表型分离的事实。它仅仅改变在给定分离 种群中认为哪个标记等位基因是有利的。鉴定包含与改善耐受性关联的标记等位基因的玉米植物或种质提供了进行玉米 标记辅助选择的基础。选择包含有利标记等位基因的玉米植物, 而不选择包含与耐受性负 相关的标记等位基因的玉米植物。可将期望的标记等位基因渗入具有期望 ( 例如优良的或 外来的 ) 遗传背景的玉米以生成渗入耐受性的玉米植物或种质。在某些方面, 预期多个耐 受性标记等位基因被连续或同时选择和 / 或渗入。可在单个植物中用于选择耐受性的耐受 性标记的组合不受限制, 并且能够包括图 3 所述标记、 与图 3 所述标记连锁的任何标记、 或 者位于本文限定的 QTL 区间中的任何标记的任何组合。
作为将受关注的性状导入玉米的标准育种方法 ( 例如基因渗入 ) 的替代方法, 也 可使用转基因方法。在这些方法中, 可将控制受关注性状如病害耐受性的外源核酸导入靶 植物或种质中。耐受性确认能通过可用的耐受性规程进行 ( 例如如上文所述 )。使用耐受 性检测分析法确认在任何特定植物或种群中耐受性性状仍与标记一起分离, 并且当然测量 通过将性状渗入或转基因导入期望背景获得的耐受性改善程度。在一个一分至九分的评 分等级中, 包含灰叶斑病 QTL 的有利等位基因的植物可具有的耐受性评分为至少 2.7、 2.6、 2.5、 2.4、 2.3、 2.2、 2.1、 2.0、 1.9、 1.8、 或 1.7 分, 其评分在与不包含灰叶斑病 QTL 的有利等 位基因的近等基因植物进行比较时更高。在一个 1 至 9 的视觉评分系统中, 评分越高指示 抗性越高。仅当在测量实验中存在足够的选择压力时, 数据将被收集。
包括用于选择包含受关注标记的植物和 / 或用于将存在的标记与耐受性关联的 自动化系统的系统也是本发明的一个特征。这些系统可包括与标记座位检测有关的探针、 用于检测探针上标记的检测器、 混合探针与模板和 / 或扩增模板的合适流体处理元件和温 度控制器、 以及将标记检测与特定标记座位或等位基因存在关联的系统说明书。
试剂盒也是本发明的一个特征。例如试剂盒可包括用于检测耐受性关联的标记 座位的合适的引物或探针, 以及使用所述引物或探针来检测标记座位并将基因座与预测的 GLS 耐受性关联的说明书。 该试剂盒还可包括包装探针、 引物、 或说明书的包装材料、 对照物 如包括用于扩增的探针、 引物或模板核酸的对照扩增反应、 分子量标记等。
耐受性标记和有利等位基因
在传统的连锁分析中, 不需要直接知道染色体上基因的物理关系。孟德尔第一定 律是控制成对性状的因子会分离, 意指成对性状的等位基因分离到两个配子中去, 然后进 入不同的子代。可将经典的连锁分析认为是对不同性状的共分离相对频率的统计学描述。 连锁分析是关于性状如何基于它们共分离的频率集合的表征良好的描述性结构。即, 如果 两个非等位性状以大于随机频率的频率被一起继承, 将它们称为 “连锁的” 。性状被一起继 承的频率是性状连锁紧密程度的主要量度, 即以较高频率被一起继承的性状比以较低频率 ( 但仍高于随机频率 ) 被一起继承的性状连锁更紧密。性状连锁是因为导致该性状的基因 位于相同染色体上。 基因在染色体上的位置越分散, 它们共分离的可能性越低, 因为同源染 色体在减数分裂期间重组。因此基因在染色体上分散的越远, 在减数分裂期间将发生会导 致两个基因分开地分离到子代中的交换事件的可能性越大。
连锁的常见量度是性状共分离的频率。 这可能以共分离百分比 ( 重组频率 ) 表示, 或者也常见地以厘摩 (cM) 表示。cM 以先驱遗传学者 Thomas Hunt Morgan 命名, 是遗传重 组频率的量度单位。一 cM 等于由于在一代中的交换导致的在一个基因座上的性状将与在 另一个基因座上的性状分离的概率为 1% ( 意味着性状 99%的情况下共分离 )。因为染色体距离与性状间交换事件的频率大约成比例, 有与重组频率关联的近似物理距离。
标记座位本身是性状, 并且在分离期间能够通过跟踪标记座位、 根据标准连锁分 析进行评估。因此在本发明的情况下, 一 cM 等于由于在一代中的交换导致的标记座位将 与另一个基因座 ( 它可为任何其他性状, 例如另一个标记座位, 或另一个编码 QTL 的性状 基因座 ) 分离的概率为 1%。本文标记参见图 3, 例如 PHM 15534、 PHM 04694、 PHM01811、 PHM 01963、 PHM 05013、 和 PHM 00586, 以及任何染色体区间 (i)BNLG1755 和 UMC1299, (ii) BNLG1755 和 BNLG1621A, (iii)BNLG1755 和 MMC0371, (iv)BNLG1755 和 UMC1702, (v)UMC156A 和 UMC1299, (vi)UMC156A 和 BNLG1621A, (vii)UMC156A 和 MMC0371, (viii)UMC156A 和 UMC1702, (ix)UMC1142 和 UMC1299, (x)UMC1142 和 BNLG1621A, (xi)UMC1142 和 MMC0371, (xii)UMC1142 和 UMC1702, (xiii)UMC1346 和 UMC1299, (xiv)UMC1346 和 BNLG1621A, (xv) UMC1346 和 MMC0371, 以及 (xvi)UMC1346 和 UMC1702, 已经发现它们与新赋予的耐受性、 提高 的耐受性、 或玉米 GLS 易感性关联。这意味着标记与耐受性性状的连锁足够紧密使得它们 可被用作耐受性性状的预报。这在本文详述的标记辅助选择 (MAS) 中是非常有用的。简而 言之, 能够选择标记等位基因与耐受性正相关的玉米植物或种质, 实际上不种植玉米并测 量新赋予的耐受性或提高的耐受性 ( 或者相反地, 如果玉米植物具有与新赋予的耐受性或 提高的耐受性负相关的标记, 可不选择它们 )。MAS 是一种选择期望表型并将期望性状渗入 玉米栽培变种 ( 例如将期望性状渗入优良品系 ) 的强大快捷工具。MAS 容易适应高通量的 分子分析方法, 该方法可迅速筛选大量植物或种质遗传材料的受关注的标记, 并且比种植 植物并观察其可见性状的方法的性价比高得多。
在一些实施方案中, QTL 标记是图 3 提供的标记的亚群, 例如设计用于 bacb. pk0333.o19( 例 如 PHM 00043)、 bacc.pk0267.m12.f、 cl33021_1、 bacb.pk0241.h17.f、 chp2.pk0007.d2、 p0094.csstg88、 bacb.pk0269.n19、 bacb.pk0009.b21.f、 bacb.pk0117. i09.f、 bacc.pk0280.n12、 bacb.pk0219.j20、 bacc.pk0132.b16.f、 bacb.pk0221.o22、 bacb. pk0544.j18、 bacb.pk0540.c18.f、 和 bacm.pk022.b8( 例如 PHM00049) 的标记。
当涉及两个遗传因子间的关系时, 如有助于产生耐受性和紧密关联标记的遗传因 子, 则 “耦合” 相连锁指示下述状态 : 其中在耐受性基因座上的 “有利” 等位基因与相应连锁 的标记座位的 “有利” 等位基因物理上附连在相同染色体链上。在耦合相中, 两个有利等位 基因被继承了该染色体链的子代一起继承。在 “相斥” 相连锁中, 在受关注基因座上的 “有 利” 等位基因 ( 例如 QTL 耐受性 ) 与在紧密连锁标记座位上的 “不利” 等位基因物理上连 锁, 并且两个 “有利” 等位基因不被一起继承 ( 即这两个基因座彼此 “异相” )。
标记的有利等位基因是与期望表型 ( 例如病害耐受性 ) 共分离的标记的等位基 因。 如本文所用, 虽然所述标记具有两个或更多个存在于种群中的有利等位基因是可能的, QTL 标记具有最少一个有利等位基因。任何该标记的有利等位基因可被有利地用于鉴定和 构造耐受性玉米品系。 任选地在植物中鉴定不同标记的一个、 两个、 三个或更多个有利等位 基因, 或者将它们渗入植物, 并且它们在 MAS 期间可进行选择。期望鉴定具有至少一个此类 有利等位基因的植物或种质, 所述有利等位基因与新赋予的或提高的耐受性正相关。
作为另外一种选择, 也发现与病害易感性关联的标记等位基因用于本发明, 因为 该等位基因可用于鉴定并反选择病害易感植物。 在育种期间此种等位基因可用于排除目的 以鉴定具有与耐受性负相关的等位基因的植物或种质, 从而从随后若干轮的育种中除去易感植物或种质。
在本发明的一些实施方案中, 同时选择多个标记等位基因用于单个植物或一组植 物。在这些方法中, 选择的植物包含 GLS 耐受性的有利等位基因, 或者将 GLS 耐受性的有利 等位基因渗入期望的玉米种质中。本领域的技术人员认识到在相同植物中同时选择 GLS 耐 受性的有利等位基因可能导致对植物附加的 ( 或甚至协同的 ) 保护效应。
技术人员认识到在某些情况下有利标记等位基因的鉴别是种质特异性的。 测定所 研究的特定种质以确定哪些标记等位基因与耐受性 ( 或易感性 ) 关联。技术人员认识到用 于鉴定有利等位基因的方法是常规的并且是本领域熟知的, 此外鉴定和使用此类有利等位 基因属于本发明的范围内。 此外鉴定除本文使用的或描述的种群之外的玉米种群中的有利 标记等位基因属于本发明的范围内。
用于扩增 SSR 型标记座位的扩增引物是本发明的特征。本发明的另一个特征是特 异用于扩增 SNP 结构域 (SNP 标记 ) 的引物, 以及用于检测 SNP 序列的探针。图 9 和 10 提 供了用于标记座位扩增的特异引物和用于检测扩增标记座位的探针。 然而技术人员将立即 认识到可使用给定引物的任一侧的其他序列代替给定引物, 只要该引物能够扩增包括将被 检测的等位基因的区域。此外应当理解用于检测的精确探针能够改变, 例如能鉴定将被检 测的标记扩增子区域的任何探针可被本文提供的那些实例取代。 此外扩增引物和检测探针 的构型当然能够改变。因此本发明不受本文所述的引物和探针的限制。
在某些方面, 本发明的方法利用扩增步骤以检测 / 确定标记座位基因型。然而应 当理解标记检测不需要扩增, 例如人们能够通过简单地对基因组 DNA 样品进行 Southern 印迹直接检测未扩增的基因组 DNA。已经确定并提出了进行 Southern 印迹、 扩增 (PCR、 LCR 等 ) 以及多种其他核酸检测方法的过程, 例如 Sambrook 等人, Molecular Cloning-A Laboratory Manual( 第 3 版 ), 第 1-3 卷, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 2000(“Sambrook” ); Current Protocolsin Molecular Biology, F.M.Ausubel 等人编辑, Current Protocols, a jointventure between Greene Publishing Associates, Inc.and John Wiley&Sons, Inc., (supplemented through 2002)( “Ausubel” ) 和 PCR ProtocolsA Guide to Methods and Applications(Innis 等 人 编 辑 )Academic Press Inc.San Diego, CA(1990)(“Innis” )。关于检测植物中的核酸的附加细节也可参 见例如 Plant Molecular Biology(1993)Croy( 编辑 )BIOSScientific Publishers, Inc. (“Croy” )。
在扩增 / 检测方法中也可省略分离检测探针, 例如通过进行实时扩增反应, 该反 应通过当掺入产物时改变相关扩增引物、 将标记核苷酸掺入扩增子、 或通过监控扩增子的 摩尔旋光度特性与未扩增前体相比的变化 ( 例如通过荧光偏振 ) 来检测产物形成。
分子标记通常通过任何本领域可用的确立方法进行检测, 所述方法不受限制的包 括等位基因特异性杂交 (ASH) 或其他方法, 用于检测单核苷酸多态性、 扩增片段长度多态 性 (AFLP) 检测、 扩增可变序列检测、 随机扩增多态性 DNA(RAPD) 检测、 限制性片段长度多态 性 (RFLP) 检测、 自主序列复制检测、 简单序列重复 (SSR) 检测、 单链构象多态性 (SSCP) 检 测、 酶切扩增多态序列 (CAPS) 检测、 同功酶标记检测等。虽然本文图表中提供的示例性标 记是 SSR 或 SNP(ASH) 标记, 但是可在本发明的情况下使用任何前述标记类型以鉴定染色体 片段, 所述染色体片段包含有助于产生优异农学性能 ( 例如新赋予的耐受性或提高的耐受性 ) 的遗传因子。
QTL 染色体区间
在某些方面, 本发明提供 QTL 染色体区间, 其中在那些区间中包含与 GLS 耐受性关 联的一个或多个 QTL。本领域熟知的多种方法可用于鉴定染色体区间 ( 在下文实施例中详 述 )。扩展此类染色体区间的边界以包含将与一个或多个 QTL 连锁的标记。换句话说, 扩 展染色体区间使得位于区间内的任何标记 ( 包括限定区间边界的末端标记 ) 可被用作病害 耐受性标记。每个区间包含一个 GLS QTL, 此外甚至可包含一个以上的 QTL。相同区间中非 常接近的多个 QTL 可搅乱特定标记与特定 QTL 的关联, 因为一个标记可显示与一个以上的 QTL 连锁。相反地, 例如如果非常接近的两个标记显示与期望表型性状共分离, 有时分不清 楚是否那些标记中的每一个鉴定相同 QTL 或两个不同的 QTL。
本发明提供玉米染色体区间, 其中在所述区间内的标记显示与 GLS 耐受性共分离 ( 参见表 1)。
表1
侧接标记 BNLG1755 和 UMC1299 BNLG1755 和 BNLG1621A BNLG1755 和 MMC0371 BNLG1755 和 UMC1702 UMC156A 和 UMC1299 UMC156A 和 BNLG1621A UMC156A 和 MMC0371 UMC156A 和 UMC1702 UMC1142 和 UMC1299 UMC1142 和 BNLG1621A UMC1142 和 MMC0371 UMC1142 和 UMC1702 UMC1346 和 UMC1299 UMC1346 和 BNLG1621A鉴定方法 与优选标记连锁 与优选标记连锁 与优选标记连锁 与优选标记连锁 与优选标记连锁 与优选标记连锁 与优选标记连锁 与优选标记连锁 与优选标记连锁 与优选标记连锁 与优选标记连锁 与优选标记连锁 与优选标记连锁 与优选标记连锁26CN 101970669 A说UMC1346 和 MMC0371 UMC1346 和 UMC1702明书与优选标记连锁 与优选标记连锁23/51 页上述每个区间包含一簇可与 GLS 耐受性共分离的标记。该簇标记发生在染色体上 相对小的结构域内, 并且可与那些染色体区域中的一个或多个 QTL 连锁。扩展 QTL 区间已 包含与耐受性共分离的标记。所述区间由在它们的边界处的标记限定, 其中该区间包含图 谱中在该区间内的所有标记以及限定边界的标记。
在某些情况下, 区间可由优选标记的连锁限定。例如在染色体 4 上的区间由在一 定距离内的与标记 PHM 01811 连锁的任何标记限定, 参照任何合适的遗传连锁图谱。例如 如本文所用, 连锁由在 PHM 0181125cM 内的任何标记限定, 这由在 MaizeGDB 网站上存在的 IBM2 2004Neighbors 图谱详细说明。在染色体 4 上这个区间还在表 3 中示出。这些标记以 遗传顺序显示。包括末端标记 BNLG1755 和 UMC1299 在内的每个列出的标记是该区间的成 员。BNLG1755 和 UMC1299 标记是本领域已知的。
如上所述区间 ( 例如染色体区间或 QTL 区间 ) 不取决于区间大小的绝对量度如厘 摩值。 区间可用末端标记描述, 所述标记限定该区间的端点, 并且该区间通常将包括限定区 间范围的末端标记。例如图 4 中的物理图谱描述了由 PHM 00045 和 PHM 00049 限定并包括 它们的染色体物理区域。区间能够包括位于染色体结构域内的任何标记, 无论那些标记是 当前已知的或未知的。本发明提供多种手段限定染色体区间, 例如在表 3 的连锁标记的列 表中以及在本文参考中。
基因图谱
本领域的技术人员将认识到 : 在任何特定种群中的重组频率 ( 以及由此导致的基 因图谱位置 ) 不是固定的。分开两个标记 ( 或者一个标记和一个 QTL) 的遗传距离能够取 决于图谱位置如何测定而发生变化。变量如选择的亲本、 作图使用的种群、 标记作图或 QTL 作图使用的软件、 以及作图软件使用者的参数输入能够产生 QTL/ 标记基因图谱关系。例如 cM 距离能够取决于重组循环的数目而发生很大变化, 所述重组循环用于产生作图种群 ( 例 如 IBM2 =八个重组循环, 而本文 BC1 为一个重组循环 ; 因此 IBM2 距离为 5cM, 与 BC1 的 5cM 距离差异很大 )。然而本发明不旨在受以下变量的限制 : 任何特定作图种群、 使用的任何特 定软件、 或任何特定的软件参数组, 这些变量用于测定特定标记或染色体区间与 GLS 耐受 性表型的连锁。 本领域的普通技术人员的能力足以使用任何特定软件或软件参数将本文所 述的新特征外推至任何玉米基因库或受关注的种群。 实际上, 使用本公开的教导, 关于除本 文所述的那些种群之外的种群中的耐受性标记和染色体区间的观察被容易地进行。
作图软件
多种商业软件可用于基因作图和标记关联研究 ( 例如 QTL 作图 )。这种软件包括 但不限于表 2 中列出的软件。
表2
统一基因图谱
已经制备了 “统一的” 、 “共有的” 、 或 “整合的” 基因图谱, 该基因图谱加入了来自 两个或更多个来源的作图数据, 包括使用不同作图种群和不同统计分析模式的来源。基因 图谱信息的加入提高了图谱上的标记密度。 可将这些改善的图谱有利地用于标记辅助的选 择和基于作图的克隆并提供用于定位新鉴定分子标记的改善框。 改善的图谱也有助于鉴定 QTL 染色体区间和有利连锁的标记簇。
在某些方面, 共有图谱来源于将一个图谱简单地覆盖在另一个图谱顶部。在其他
方面, 多种算法如分析允许从多个来源组合基因图谱数据, 并且解决来自最初来源的图谱数据间的不一致。 参见 Van Ooijen 和 Voorrips(2001) “JoinMap 3.0s oftware for the calculation ofgenetic linkage maps” , Plant Research International, Wageningen, theNetherlands ; Stam(1993)“Construction of integrated genetic linkage mapsby means of a new computer package : JoinMap” , The Plant Journal 3(5) :739-744。
连锁标记
根据本公开以及本领域的广泛认识, 清楚的是可使用以下任何遗传标记作为所述 性状的标记 : 所述遗传标记与受关注的表型性状 ( 例如在本文实例中, 新赋予的耐受性或 提高的耐受性的性状 ) 具有显著的共分离概率。图 3 提供了本发明提供的可用 QTL 标记列 表。
除图 3 所示的 QTL 标记之外, 还可使用与 QTL 标记连锁的附加标记 ( 显示连锁不 平衡 ) 预测玉米植物中新赋予的耐受性或提高的耐受性性状。换句话说, 显示任何与本发 明的 QTL 标记小于 50%的重组频率 ( 由小于 50cM 的遗传距离分开 ) 的任何其他标记 ( 例 如图 3 中提供的标记 ) 也是本发明的特征。也可在标记辅助选择特定性状的过程中有利地 使用与 QTL 标记连锁的任何标记。
当遗传标记与给定 QTL 的连锁足够紧密使得它们显示低重组频率时, 与 QTL 连锁 的遗传标记 ( 例如图 3 提供的 QTL 标记 ) 是尤其有用的。在本发明中, 此类紧密连锁的标 记是本发明的一个特征。如本文所述, 紧密连锁的标记显示约 10%或更低的重组频率 ( 给 定标记位于 QTL 10cM 内 )。换句话说, 这些紧密连锁的基因座至少 90%的情况下共分离。 实际上, 一个标记与 QTL 标记连锁越紧密, 该标记越会更有效地和更有利地变成期望性状 的指示物。
因此在其他实施方案中, 紧密连锁的基因座如 QTL 标记座位和第二基因座显示约 10%或更低, 优选约 9%或更低, 更优选约 8%或更低, 更优选约 7%或更低, 更优选约 6%或 更低, 更优选约 5%或更低, 更优选约 4%或更低, 更优选约 3%或更低, 更优选约 2%或更低 的基因座内交换频率。在高度优选的实施方案中, 相关基因座 ( 例如标记座位和靶基因座 如 QTL) 显示约 1%或更低的重组频率, 例如约 0.75%或更低, 更优选约 0.5%或更低, 或更 优选的约 0.25%或更低的重组频率。因此, 所述基因座分开距离为约 10cM、 9cM、 8cM、 7cM、 6cM、 5cM、 4cM、 3cM、 2cM、 1cM、 0.75cM、 0.5cM 或 0.25cM 或更低。换句话说, 位于相同染色体 上, 并且它们间的距离使得两个基因座间的重组发生频率小于 10% ( 例如约 9%、 8%、 7%、 6 %、 5 %、 4 %、 3 %、 2 %、 1 %、 0.75 %、 0.5 %、 0.25 %、 或更低 ) 的两个基因座称为彼此紧密 连锁。
在某些方面, 本发明的连锁标记 ( 包括紧密连锁标记 ) 通过参考基因图谱确定, 例如存在于 MaizeGDB 网站的整合基因图谱。例如本文显示连锁群 4 标记 PHM 15534、 PHM 04694、 PHM 01811、 PHM01963、 PHM 05013、 和 PHM 00586 ; 以及设计用于 bacb.pk0333. o19(PHM 00043)、 bacc.pk0267.m12.f、 cl33021_1、 bacb.pk0241.h17.f、 chp2.pk0007. d2、 p0094.csstg88、 bacb.pk0269.n19、 bacb.pk0009.b21.f、 bacb.pk0117.i09.f、 bacc. pk0280.n12、 bacb.pk0219.j20、 bacc.pk0132.b16.f、 bacb.pk0221.o22、 bacb.pk0544.j18、 bacb.pk0540.c18.f、 和 bacm.pk022.b8(PHM 00049) 的标记, 所述标记与至少一个 GLS 耐受 性 QTL 关联。与前述标记连锁的标记可例如从表 3 中测定。
表3: IBM2 2004 Neighbors 图谱上位于 PHM 01811 25cM 内的标记
同样地, 本发明的连锁标记 ( 包括紧密连锁标记 ) 可通过参考任何合适的玉米基 因图谱来确定。例如存在于 MaizeGDB 网站来源的整合基因图谱。
不旨在将连锁或紧密连锁标记的测定限制在使用任何特定玉米基因图谱。 实际上 很多玉米基因图谱是可用的, 并且是本领域技术人员所熟知的。 作为另外一种选择, 可通过 生成实验数据集和连锁分析进行连锁和紧密连锁标记的测定。
与 GLS 耐受性 QTL 标记连锁 ( 例如在约 50cM 内或在约 10cM 内 ) 标记的鉴定也不
旨在受任何特定图谱或方法的限制。在 MaizeGDB 网站上提供的整合基因图谱仅起到鉴定 连锁标记的实例的作用。实际上, 本文定义的连锁标记可从本领域已知的任何基因图谱中 测定 ( 实验图谱或整合图谱 ), 或者可从任何新图谱数据集中测定。
注意到连锁和紧密连锁标记的列表可由于多种因素在图和方法之间发生变化。 首 先, 位于任意两个图谱上的标记可为不相同的, 此外一些图谱可具有比另一个图谱更大的 标记密度。用于构建图谱的作图种群、 方法和算法也可以不同。本领域的技术人员认识到 一个基因图谱或多或少地比另一个基因图谱精确是不必要的, 此外还认识到可使用任何玉 米基因图谱测定与本发明的 QTL 标记连锁或紧密连锁的标记。
标记检测技术
本发明提供与 QTL 共分离具有显著概率的分子标记, 所述 QTL 赋予 GLS 耐受性表 型。 这些 QTL 标记用于期望性状的标记辅助的选择 ( 新赋予的耐受性或提高的耐受性 ), 并 且也具有其他用途。本发明不旨在受检测这些标记的任何特定方法的限制。
对应于在种群成员间的遗传多态性的标记能够通过本领域已经确定的多种方法 进行检测 ( 例如基于 PCR 的序列特异性扩增、 限制性片段长度多态性 (RFLP)、 同功酶标 记、 等位基因特异性杂交 (ASH)、 植物基因组的扩增可变序列、 自主序列复制、 简单重复序 列 (SSR)、 单核苷酸多态性 (SNP)、 随机扩增的多态性 DNA(“RAPD” )、 酶切扩增多态序列 (CAPS)、 或扩增片段长度多态性 (AFLP))。在一个附加实施方案中, 简单地通过多态标记区 域的核苷酸测序测定分子标记存在与否。该方法易于适应高通量分析, 该分析方法是上文 提到的其他方法, 例如使用可用的高通量测序方法如杂交测序。
主要遗传标记通常依靠核酸的一个或多个特性进行检测。例如用于遗传标记检 测的一些技术利用探针核酸与对应于遗传标记的核酸 ( 例如使用基因组玉米 DNA 作模板 产生的扩增核酸 ) 的杂交。杂交形式包括但不限于液相、 固相、 混合相、 或原位杂交检测 分析, 它们用于等位基因检测。对核酸杂交的一个广泛适用的指导存在于 Tijssen(1993) Laboratory Techniques in Biochemistry and MolecularBiology-Hybridization with Nucleic Acid Probes Elsevier, New York ; 以及 Sambrook 和 Ausubel( 本文 ) ; 以及 Berger 和 Kimmel, Guide toMolecular Cloning Techniques, Methods in Enzymology volume 152Academic Press, Inc., San Diego, CA(“Berger” )。
例如检测包含限制性片段长度多态性 (RFLP) 的标记, 如通过将通常是将被检测 的核酸亚片段的探针 ( 或者对应于亚片段的合成寡核苷酸 ) 与经限制性消化的基因组 DNA 杂交进行检测。选择限制性酶以提供在不同个体或种群中的至少两个长度可供选择的 ( 或 多态的 ) 限制性片段。测定产生每个杂交信息片段的一种或多种限制性酶是一个简单的程 序, 该程序是本领域熟知的。标记探针在合适基质 ( 如琼脂糖或聚丙烯酰胺 ) 中根据长度 分离并转移到膜 ( 如硝化纤维、 尼龙等 ) 上后, 它在导致探针平衡结合的条件下与靶杂交, 随后通过洗涤移除过多的探针。
可克隆和 / 或合成用于标记座位的核酸探针。可与本发明的探针一起使用任何合 适的标记。 适于与核酸探针一起使用的可检测标记包括例如通过光谱、 放射性同位素、 光化 学、 生物化学、 免疫化学、 电学、 光学或化学方法可检测的任何组合物。 可用的标记包括用于 染色的生物素, 它具有标记的链霉亲和素、 磁珠、 荧光染料、 放射标记物、 酶、 和色度标记。 其 他标记包括与抗体结合的配体, 该抗体用荧光团、 化学发光试剂、 和酶标记。探针也可组成放射标记的 PCR 引物, 该引物用于生成放射标记的扩增子。标记核酸的标记方法和对应的 检测方法参见 Haugland(1996)Handbook of Fluorescent Probes and ResearchChemicals Sixth Edition by Molecular Probes, Inc.(Eugene OR) ; 或 Haugland(2001)Handbook of Fluorescent Probes and Research ChemicalsEighth Edition by Molecular Probes, Inc.(Eugene OR)( 在 CD ROM 上可用 )。
基于扩增的检测方法
PCR、 RT-PCR 和 LCR 作为用于扩增受关注核酸 ( 例如那些包含标记座位的核酸 ) 的扩增和扩增检测方法具有尤其广泛的应用, 有利于检测标记。关于这些方法和其他扩增 方法的详细描述可见于本文多种标准文献中任何一种, 例如 Sambrook、 Ausubel、 Berger 和 Croy。许多可用的生物学文献具有关于 PCR 和相关扩增方法的深入讨论。技术人员将会知 道使用逆转录酶和聚合酶 (“反转录 -PCR, 或 “RT-PCR” ), 基本上可将任何 RNA 转化成适于 限制消化、 PCR 扩增和测序的双链 DNA。也参见上文的 Ausubel、 Sambrook 和 Berger。
实时扩增 / 检测方法
在一个方面, 实时 PCR 或 LCR 在本文所述的扩增混合物中进行, 例如使用分子信标 TM 或 TaqMan 探针。分子信标 (MB) 是寡核苷酸或 PNA, 它在合适的杂交条件下自杂交以形成 茎环结构。MB 在寡核苷酸或 PNA 末端具有标记和淬灭剂 ; 因此在使得分子内杂交发生的条 件下, 所述标记通常被淬灭剂淬灭 ( 或至少其荧光改变 )。在其中 MB 不显示分子内杂交的 条件下 ( 例如当与靶核酸结合时, 如在扩增期间结合扩增子区域 ), MB 标记不被淬灭。关 于制备和使用 MB 的标准方法的细节已在文献中确立, 并且 MB 得自许多商业试剂来源。也 参见例如 Leone 等人 (1995)“Molecular beacon probes combined with amplification byNASBA enable homogenous real-time detection of RNA” , Nucleic AcidsRes.26 : 2150-2155 ; Tyagi 和 Kramer(1996)“Molecular beacons : probesthat fluoresce upon hybridization” Nature Biotechnology 14 : 303-308 ; Blok 和 Kramer(1997) “Amplifiable hybridization probes containing amolecular switch” Mol Cell Probes 11 : 187-194 ; Hsuih 等人 (1997) “Novel, ligation-dependent PCR assay for detection of hepatitis C in serum” J ClinMicrobiol 34 : 501-507 ; Kostrikis 等 人 (1998)“Molecular beacons : spectralgenotyping of human alleles” Science 279 : 1228-1229 ; Sokol 等 人 (1998)“Real time detection of DNA : RNA hybridization in living cells” Proc. Natl.Acad.Sci.U.S.A.95 : 11538-11543 ; Tyagi 等 人 (1998)“Multicolormolecular Nature Biotechnology16 : 49-53 ; Bonnet 等 beacons for allele discrimination” 人 (1999)“Thermodynamic basis of the chemicalspecificity of structured DNA probes” Proc.Natl.Acad.Sci.U.S.A.96 : 6171-6176 ; Fang 等人 (1999) “Designing a novel molecular beacon forsurface-immobilized DNA hybridization studies” J.Am.Chem. Soc.121 : 2921-2922 ; Marras 等 人 (1999)“Multiplex detection ofsingle-nucleotide variation using molecular beacons” Genet.Anal.Biomol.Eng.14 : 151-156 ; 以及 Vet 等 人 (1999)“Multiplex detection of fourpathogenic retroviruses using molecular beacons” Proc.Natl.Acad.Sci.U.S.A.96 : 6394-6399。关于 MB 构建和使用的附加细节可 见于专利文献如美国专利 5,925,517、 6,150,097、 和 6,037,130。
使用双标记荧光寡核苷酸探针 ( 一般称为 “TaqManTM” 探针 ) 的 PCR 检测和量化也可根据本发明进行。这些探针由短 ( 例如 20-25 个碱基 ) 的寡聚脱氧核苷酸组成, 该寡 聚脱氧核苷酸用两个不同荧光染料标记。在每个探针的 5′末端以及 3′末端上存在淬灭 染料。寡核苷酸探针序列与存在于 PCR 扩增子内的内部靶序列互补。当探针完整时, 能 量传递发生在两个荧光团之间并且从报告基团发射的荧光通过 FRET 被淬灭剂淬灭。在 PCR 延伸阶段, 探针被反应中使用的聚合酶的 5′核酸酶活性酶解, 从而从寡核苷酸 - 淬灭 TM 剂中释放报告基团并提高报告基团的发光强度。因此 TaqMan 探针是具有标记和淬灭剂 的寡核苷酸, 其中所述标记在扩增期间通过扩增中使用的聚合酶的核酸外切酶作用而被 释放。这提供合成期间的扩增实时测量。多种 TaqManTM 试剂是可商购获得的, 例如购自 Applied Biosystems(Division Headquarters inFoster City, CA) 以及多个专业供应商 如 Biosearch Technologies( 例如 black hole quencher 探针 )。
关于扩增可变序列、 SSR、 AFLP、 ASH、 SNP 和同功酶标记的附加细节描述
扩增可变序列指植物基因组的扩增序列, 该序列在相同物种的成员间表现出高核 酸残基可变性。所有生物具有可变基因组序列, 并且每种生物 ( 除了克隆以外 ) 具有不同 的一组可变序列。一旦确认, 可使用存在的特定可变序列预测表型性状。来自植物的 DNA 与侧接 DNA 可变序列的引物一起优选地起到扩增模板的作用。扩增可变序列, 然后进行测 序。 作为另外一种选择, 可使用自主复制序列鉴定遗传标记。自主复制序列指使用靶 核酸序列进行核酸扩增的方法, 该序列在基本上等温的条件下通过使用逆转录复制涉及的 三种酶活性进行体外的指数复制 : (1) 逆转录酶, (2)RNase H, 以及 (3) 依赖 DNA 的 RNA 聚 合酶 (Guatelli 等人 (1990)Proc Natl Acad Sci USA 87 : 1874)。通过 cDNA 中间体模仿 RNA 逆转录复制机制, 这种方法积聚初始靶的 cDNA 和 RNA 拷贝。
也可使用扩增片段长度多态性 (AFLP) 作为遗传标记 (Vos 等人 (1995)Nucleic Acids Res 23 : 4407)。短语 “扩增片段长度多态性” 指在用限制性核酸内切酶酶解之前或 之后选择的限制性片段。 扩增步骤使得特定限制性片段检测较容易。 AFLP 允许检测大量多 态性标记, 并且已经被用于植物基因图谱 (Becker 等人 (1995)Mol Gen Genet 249 : 65 ; 以 及 Meksem 等人 (1995)Mol Gen Genet 249 : 74)。
可使用等位基因特异性杂交 (ASH) 鉴定本发明的遗传标记。ASH 技术基于短的单 链寡核苷酸探针与单链靶核酸的完全互补序列的稳定退火。 经由结合到探针上的同位素或 非同位素标记进行检测。
就每种多态性而言, 设计两个或更多个不同的 ASH 探针, 所述探针除了多态核苷 酸之外具有相同的 DNA 序列。每个探针与一个等位基因序列将具有确切同源性以便探针的 范围能够识别所有已知的可供选择的等位基因序列。每个探针与靶 DNA 杂交。使用适当的 探针设计和杂交条件, 探针和靶 DNA 之间的单碱基错配将阻止杂交。用这种方法, 仅仅其中 一个供选择探针将与靶样品杂交, 所述样品是与等位基因纯合的或同质的。两个等位基因 是杂合的或异质的样品将与两个供选择探针杂交。
使用 ASH 标记作为显性标记, 其中是否存在仅一个等位基因通过仅一个探针杂交 或不杂交来确定。可供选择的等位基因可从不杂交的等位基因中推断得到。ASH 探针和靶 分子任选地是 RNA 或 DNA ; 靶分子是任何长度的核苷酸, 除了与探针互补的序列 ; 设计探针 与 DNA 靶的任一链杂交 ; 确认探针大小范围, 不同的严格杂交条件等。
PCR 使得 ASH 的靶序列从相对小量的低浓度核酸中扩增。此外用限制性核酸内切 酶消化来自基因组 DNA 的靶序列并通过凝胶电泳分离不同大小的序列。随着靶序列结合到 膜表面上, 或者如美国专利 5,468,613 所述 ASH 探针序列可结合到膜上, 通常发生杂交。
在一个实施方案中, ASH 数据通常通过以下步骤获得 : 使用 PCR 从基因组 DNA 中扩 增核酸片段 ( 扩增子 ), 将扩增子靶 DNA 转移到点杂交形式的膜上, 将标记寡核苷酸探针与 扩增子靶杂交, 以及通过放射自显影观察杂交斑点。
单核苷酸多态性 (SNP) 是由共有序列组成的标记, 该序列基于单核苷酸而不同。 这种区别可通过包含 SNP 的扩增子在例如丙烯酰胺凝胶上的不同差别迁移图谱而进行检 测。检测的替代模式如杂交、 如 ASH、 或 RFLP 分析也是适用的。SNP 标记检测单碱基对核 苷酸取代。在所有分子标记类型当中, SNP 是最多的, 因此具有提供最高基因图谱分辨率 的 能 力 (Bhattramakki 等 人 2002 Plant Molecular Biology48 : 539-547)。SNP 可 在 甚 至比 SSR 更高的通量水平上进行检测, 即以所谓的 “超高通量” 模式进行检测, 因为它们不 需要大量 DNA, 并且可直接进行自动化检测。SNP 也具有成为相对低成本系统的前景。这 三个因素一起使得 SNP 对在 MAS 中的应用具有高度吸引力。若干种方法可用于 SNP 基 因分型, 包括但不限于杂交、 引物延伸、 寡核苷酸连接、 核酸酶酶解、 微测序和编码球。此 类方法已经被以下文献叙述 : Gut(2001)Hum Mutat 17 第 475-492 页 ; Shi(2001)Clin Chem 47,第 164-172 页 ; Kwok(2000)Pharmacogenomics 1,第 95-100 页 ; Bhattramakki 和 Rafalski(2001)Discovery and application of singlenucleotide polymorphism markers in plants. : R.J.Henry 编 辑, PlantGenotyping : The DNA Fingerprinting of Plants, CABI Publishing, Wallingford。多种可商购获得的技术利用这些方法和其他 方 法 检 查 SNP, 包 括 Masscode.TM.(Qiagen), Invader.RTM.(Third WaveTechnologies), SnapShot.RTM.(Applied Biosystems) , Taqman.RTM.(Applied Biosystems) 以 及 Beadarrays.TM.(Illumina)。
在序列内或穿过连锁序列的许多 SNP 可一起用于描述任何特定基因型的单倍型 (Ching 等人 (2002), BMC Genet.3 : 19 pp Gupta 等人, 2001, Rafalski(2002b), 同上 )。单 倍型可比单个的 SNP 提供更多信息, 并且可描述较多的任何特定基因型。例如, 单个 SNP 可 为 PHM01811-32 的等位基因 “T” , 但是等位基因 “T” 也可发生在被轮回亲本利用的玉米育种 种群中。在这种情况下, 单倍型例如在连锁 SNP 标记上的一系列等位基因可提供较多的信 息。一旦已经将唯一的单倍型分配给供体染色体区域, 该单倍型可用于种群或其任何亚群 以确定是否个体具有特定基因。 参见例如 WO2003054229。 使用本领域普通技术人员已知的 那些自动化高通量标记检测平台使得这一方法高效和有效。
可使用同功酶标记作为遗传标记, 例如用于追踪除本文耐受性标记外的标记, 或 者追踪与本文标记连锁的同功酶标记。同功酶是酶的多样形式, 它们的氨基酸序列彼此不 同, 因此它们的核酸序列不同。一些同功酶是包含些微不同的亚基的多聚体酶。其他同功 酶是多聚体或单体, 但是已经在氨基酸序列的不同位点被从酶原上裂解。同功酶可在蛋白 水平上表征和分析, 或者可测定在核酸水平上不同的同功酶。在这些情况下可使用本文所 述的任何基于核酸的方法分析同功酶标记。
关于核酸扩增的附加细节
已经提到核酸扩增技术如 PCR 和 LCR 为本领域人们所熟知, 并且能够应用于本发明以扩增和 / 或检测受关注的核酸, 如包含标记座位的核酸。体外方法包括聚合酶链 反应 (PCR)、 连接酶链反应 (LCR)、 Qββ- 复制酶扩增和其他 RNA 聚合酶介导的技术 ( 例 如 NASBA), 足以指导技术人员掌握此类体外方法的技术实例存在于上述参考文献中, 例如 Innis、 Sambrook、 Ausubel、 Berger 和 Croy。附加的细节可见于 Mullis 等人 (1987), 美国 专利 4,683,202 ; Arnheim&Levinson(1990 年 10 月 1 日 )C&EN 36-47 ; The Journal Of NIH Research(1991)3 : 81-94 ; Kwoh 等人 (1989)Proc.Natl.Acad.Sci.USA 86 : 1173 ; Guatelli 等 人 (1990)Proc.Natl.Acad.Sci.USA 87 : 1874 ; Lomell 等 人 (1989)J.Clin.Chem 35 : 1826 ; Landegren 等 人 (1988)Science 241 : 1077-1080 ; Van Brunt(1990)Biotechnology 8: 291-294 ; Wu 和 Wallace(1989)Gene 4 : 560 ; Barringer 等人 (1990)Gene 89 : 117 ; 以及 Sooknanan 和 Malek(1995)Biotechnology 13 : 563-564。通过 PCR 扩增大核酸的改良方法 ( 用于定位克隆的情况下 ) 被进一步综述于 Cheng 等人 (1994)Nature 369 : 684, 以及本文 参考文献, 其中生成了最多 40kb 的 PCR 扩增子。
用于定位克隆的标记检测
在一些实施方案中, 使用核酸探针检测包含标记序列的核酸。此类特征可在例如 定位克隆中使用以分离与标记核苷酸序列连锁的核苷酸序列。 不旨在将本发明的核酸探针 限制在任何特定大小。在一些实施方案中, 核酸探针长度为至少 20 个核苷酸, 或者至少 50 个核苷酸, 或者至少 100 个核苷酸, 或者至少 200 个核苷酸。
取决于需被检测的标记, 杂交探针使用放射自显影、 荧光照相或其他相似的检 测技术进行检测。特定杂交规程的实例是本领域广泛可用的, 参见例如本文的 Berger、 Sambrook、 和 Ausubel。
探针 / 引物合成方法
制备包括探针、 引物、 分子信标、 PNA、 LNA( 锁核酸 ) 等在内的寡核苷酸的合成方法 通常为人们所熟知。例如寡核苷酸可根据固相亚磷酰胺三酯方法进行化学合成, 该方法描 述于 Beaucage 和 Caruthers(1981), Tetrahedron Letts.22(20) : 1859-1862, 例如使用可 商购获得的自动化合成器合成, 如描述于 Needham-VanDevanter 等人 (1984)Nucleic Acids Res.12 : 6159-6168 的方法。寡核苷酸包括修饰寡核苷酸, 也可从技术人员已知的多种商业 来源订购。 有许多寡核苷酸合成服务的商业供应商, 因此这是可广泛获得的技术。 可从多种 商业来源中的任何一种来源订购任何核酸, 如 The Midland Certified ReagentCompany, The Great American Gene Company, ExpressGen Inc., OperonTechnologies Inc. (Alameda, CA), 以及许多其他来源。同样地, 可从多种来源订购 PNA, 如 PeptidoGenic, HTI Bio-Products, Inc., BMABiomedicals Ltd(UK.), Bio·Synthesis, Inc., 以及许多其他来 源。
用电脑进行标记检测
在可供选择的实施方案中, 可使用利用电脑的方法检测受关注的标记座位。例如 可将包含受关注标记座位的核酸序列存储在电脑中。 期望的标记座位序列或其同源物可使 用合适的核酸搜索算法进行鉴定, 该算法由例如此类易得的程序如 BLAST, 或甚至简单的文 字处理器提供。
用于标记检测的扩增引物
在一些优选实施方案中, 本发明的分子标记使用合适的基于 PCR 的检测方法检测, 其中 PCR 扩增子的大小或序列指示特定标记等位基因存在与否。在这些类型的方法中, 将 PCR 引物与侧接多态性标记区域的保守区域杂交。如本领域所用, 用于扩增分子标记的 PCR 引物有时称为 “PCR 标记” 或简单的 “标记” 。
应当理解, 虽然本文提供了多种引物的具体实例 ( 参见例如图 3、 图 9、 和图 10), 能 够使用任何合适方法设计将被用于本发明的合适引物。 不旨在将本发明限制在任何特定引 物或引物对。例如可使用任何适用的软件程序设计引物, 例如 在一些实施方案中, 本发明的引物进行放射标记或通过任何合适的方法进行标记 ( 例如使用非放射性荧光标记 ) 以在扩增反应和按大小分离后 ( 例如通过在琼脂糖凝胶上 电泳 ) 迅速可视化不同大小的扩增子。在一些实施方案中, 引物不进行标记, 并且扩增子按 照它们的大小分辨率用例如溴化乙锭染色可视化。
不旨在将本发明的引物限制在生成任何特定大小的扩增子。 例如用于扩增标记座 位和本文等位基因的引物不限于扩增相关基因座的整个区域。 引物能生成任何合适长度的 扩增子。在一些实施方案中, 标记扩增生成的扩增子长度为至少 20 个核苷酸, 或者至少 50 个核苷酸, 或者至少 100 个核苷酸, 或者至少 200 个核苷酸。
标记辅助选择和植物育种
在作物中开发分子标记的主要动力是通过标记辅助选择 (MAS) 在植物育种中提 高效率。将遗传标记用于鉴定在一个或多个基因座包含期望基因型的植物, 并且期望该 植物将期望基因型与期望表型一起传递到它们的子代中。可使用遗传标记鉴定在一个基 因座或若干个不连锁或连锁基因座包含期望基因型的植物 ( 例如单倍型 ), 并且期望该 植物将期望基因型与期望表型一起传递到它们的子代中。本发明提供鉴定植物尤其是玉 米植物的方法, 所述植物具有对 GLS 新赋予的耐受性或提高的耐受性, 或者易感 GLS, 所 述方法通过鉴定在那些基因座中的其中一个基因座具有特定等位基因的植物, 所述基因 座如 PHM15534、 PHM 04694、 PHM 01811、 PHM 01963、 PHM 05013、 和 PHM00586 ; 以及设计用 于 bacb.pk0333.o19(PHM 00043)、 bacc.pk0267.m12.f、 cl33021_1、 bacb.pk0241.h17.f、 chp2.pk0007.d2、 p0094.csstg88、 bacb.pk0269.n19、 bacb.pk0009.b21.f、 bacb.pk0117. i09.f、 bacc.pk0280.n12、 bacb.pk0219.j20、 bacc.pk0132.b16.f、 bacb.pk0221.o22、 bacb. pk0544.j18、 bacb.pk0540.c18.f、 和 bacm.pk022.b8(PHM 00049) 的标记。
同样地, 通过鉴定缺乏期望标记座位的植物, 能够鉴定易感的或耐受性较小的植 物, 并且能够例如将这些植物从随后的杂交中除去。 同样地, 作为设计用于提高玉米产量的 全部 MAS 育种程序的一部分, 可将这些标记座位渗入任何期望的基因组背景、 种质、 植物、 品系、 品种等中。
本发明也提供染色体 QTL 区间, 该区间在选择植物的 MAS 中发挥相同的作用, 所述 植物显示新赋予的或提高的 GLS 耐受性。同样地, QTL 区间也可用于反选择易感的或对 GLS 耐受性降低的植物。 本发明使用在图谱上位于 QTL 区间中内的任何标记 ( 包括区间末端 )。 通过以下标记对限定这些区间 : (i)BNLG1755 和 UMC1299, (ii)BNLG1755 和 BNLG1621A, (iii)BNLG1755 和 MMC0371, (iv)BNLG1755 和 UMC1702, (v)UMC156A 和 UMC1299, (vi) UMC156A 和 BNLG1621A, (vii)UMC156A 和 MMC0371, (viii)UMC156A 和 UMC1702, (ix)UMC1142 和 UMC1299, (x)UMC1142 和 BNLG1621A, (xi)UMC1142 和 MMC0371, (xii)UMC1142 和 UMC1702, (xiii)UMC1346 和 UMC1299, (xiv)UMC1346 和 BNLG1621A, (xv)UMC1346 和 MMC0371, 以及
(xvi)UMC1346 和 UMC1702。
MAS 通常使用多态性标记, 所述标记已经被鉴定为具有与耐受性性状共分离的显 著可能性的标记。推测此类标记在图谱上接近产生植物耐受性表型的一个或多个基因, 并 且认为此类标记是期望性状的指示, 称为 QTL 标记。测试植物在 QTL 标记上是否存在期望 等位基因。最优选的标记 ( 或标记等位基因 ) 是那些与耐受性性状具有最强关联的标记。
使用连锁分析确定哪个多态性标记等位基因 ( 因此是 “耐受性标记等位基因” )显 示与耐受性表型共分离的统计学可能性。在鉴定与耐受性表型共分离的标记等位基因后, 可能使用这个标记迅速精确的筛选耐受性等位基因的植物品系, 而不需要使植物生长完成 它们的生命周期以及等候表型评估的结果, 此外甚至当实际耐受性 QTL 的分子特性是未知 的时候, 允许进行特定耐受性等位基因的遗传选择。能够从例如植物的第一片叶上采集组 织样品并用合适的分子标记进行筛选, 并且迅速确定将继续研究哪个子代。连锁标记也消 除了环境因素的影响, 所述环境因素常常影响表型表达。
可使用多态性 QTL 标记座位选择包含标记等位基因 ( 或等位基因 ) 的植物, 所述 等位基因与期望耐受性表型关联。简而言之, 检测来自将进行选择的植物的生物样品中对 应于标记核酸等位基因的核酸。 这种检测能够采取探针核酸与标记等位基因或其扩增子杂 交的形式, 例如使用等位基因特异性杂交、 DNA 印迹分析、 RNA 印记分析、 原位杂交、 引物杂 交后进行标记区域的 PCR 扩增等。 本文描述了检测标记的多种方法, 例如在题目为 “标记检 测技术” 的部分。在确认在生物样品中存在 ( 或不存在 ) 特定样品等位基因后, 选择该植物 ( 例如用于通过选择性育种制备子代植物 )。
玉米植物育种人员期望将耐受性基因座与高产基因以及其他期望性状组合以开 发改良的玉米品种。通过非分子方法 ( 例如玉米植物性状评估 ) 筛选大量样品可能是昂贵 的、 耗时的, 并且是不可靠的。 使用本文所述的多态性标记, 当与耐受性基因座遗传连锁时, 提供一种在育种程序中选择耐受性品种的有效方法。 例如标记辅助选择耐受性对田间评估 耐受性的一个优点是 MAS 能够在一年中的任何时间进行, 不受生长季节的限制。此外环境 效应很大程度上与标记辅助选择无关。
当一个种群在分离影响一个或多个性状的多个基因座时, 例如涉及耐受性的多个 基因座或每个涉及对不同病害耐受性的多个基因座, MAS 效率与表型筛选相比变得甚至更 高, 因为所有基因座能在实验室中从 DNA 的单个样品中一起评估。在本实例中, PHM 15534、 PHM04694、 PHM 01811、 PHM 01963、 PHM 05013、 和 PHM 00586 ; 以及设计用于 bacb.pk0333. o19( 如 PHM 00043)、 bacc.pk0267.m12.f、 cl33021_1、 bacb.pk0241.h17.f、 chp2.pk0007. d2、 p0094.csstg88、 bacb.pk0269.n19、 bacb.pk0009.b21.f、 bacb.pk0117.i09.f、 bacc. pk0280.n12、 bacb.pk0219.j20、 bacc.pk0132.b16.f、 bacb.pk0221.o22、 bacb.pk0544.j18、 bacb.pk0540.c18.f、 and bacm.pk022.b8( 如 PHM 00049) 的标记, 以及任何染色体区间 (i)BNLG1755 和 UMC1299, (ii)BNLG1755 和 BNLG1621A, (iii)BNLG1755 和 MMC0371, (iv) BNLG1755 和 UMC1702, (v)UMC156A 和 UMC1299, (vi)UMC156A 和 BNLG1621A, (vii)UMC156A 和 MMC0371, (viii)UMC156A 和 UMC1702, (ix)UMC1142 和 UMC1299, (x)UMC1142 和 BNLG1621A, (xi)UMC1142 和 MMC0371, (xii)UMC1142 和 UMC1702, (xiii)UMC1346 和 UMC1299, (xiv) UMC1346 和 BNLG1621A, (xv)UMC1346 和 MMC0371, 以及 (xvi)UMC1346 和 UMC1702, 可被同时 或按顺序检测分析, 它们来自单个样品或一组样品。MAS 在植物育种中的另一个用途是辅助通过回交育种恢复轮回亲本基因型。回交 育种是将子代与其他的其中一个亲本或亲本品系回交的方法。 回交通常用于将来自供体亲 本 ( 例如包含期望耐受性标记座位的亲本 ) 的一个或一些基因座渗入来自轮回亲本 ( 例如 另外的高产量玉米品系 ) 的其他期望的遗传背景中。回交进行的次数越多, 轮回亲本对所 得渗入品种的遗传贡献越大。 这常常是必需的, 因为耐受性植物否则可为非期望的, 例如因 为低产量、 低结实率等。 与之相反, 品种是多次育种程序的结果, 它可具有优异的产量、 结实 率等, 仅仅缺乏一个期望性状如 GLS 耐受性。
通过本文所述的任何方法来确定在植物基因组中存在和 / 或不存在特定遗传标 记或等位基因如 PHM 15534、 PHM 04694、 PHM 01811、 PHM 01963、 PHM 05013、 和 PHM 00586 ; 以及设计用于 bacb.pk0333.o19( 如 PHM 00043)、 bacc.pk0267.m12.f、 cl33021_1、 bacb. pk0241.h17.f、 chp2.pk0007.d2、 p0094.csstg88、 bacb.pk0269.n19、 bacb.pk0009.b21. f、 bacb.pk0117.i09.f、 bacc.pk0280.n12、 bacb.pk0219.j20、 bacc.pk0132.b16.f、 bacb. pk0221.o22、 bacb.pk0544.j18、 bacb.pk0540.c18.f、 andbacm.pk022.b8( 如 PHM 00049) 的 标记, 以及任何染色体区间 (i)BNLG1755 和 UMC1299, (ii)BNLG1755 和 BNLG1621A, (iii) BNLG1755 和 MMC0371, (iv)BNLG1755 和 UMC1702, (v)UMC156A 和 UMC1299, (vi)UMC156A 和 BNLG1621A, (vii)UMC156A 和 MMC0371, (viii)UMC156A 和 UMC1702, (ix)UMC1142 和 UMC1299, (x)UMC1142 和 BNLG1621A, (xi)UMC1142 和 MMC0371, (xii)UMC1142 和 UMC1702, (xiii)UMC1346 和 UMC1299, (xiv)UMC1346 和 BNLG1621A, (xv)UMC1346 和 MMC0371, 以及 (xvi)UMC1346 和 UMC1702。如果来自植物的核酸就期望遗传标记等位基因而言是阳性的, 该植物可为自花授粉的以制备具有相同基因型的纯种品系, 或者它可与具有相同标记或其 他期望特性的植物杂交以制备有性杂交的杂交世代。
将有利等位基因渗入 -- 将耐受性标记高效回交于优良品系
在本发明的情况下, MAS 的一个应用是使用新赋予的耐受性或提高的耐受性以提 高渗入或回交的效率, 渗入或回交的目的在于将耐受性 QTL 导入期望的 ( 通常是高产量 ) 背景。在特定标记 ( 以及关联的 QTL) 的标记辅助回交中, 例如从供体来源回交到优良的或 外来的遗传背景, 技术人员在回交子代中选择供体性状, 然后重复回交到优良的或外来的 品系以重构尽可能多的优良 / 外来背景的基因组。
因此可利用本发明的标记和方法指导标记辅助选择或玉米品种的育种, 所述玉米 品种具有期望的与优异农学性能关联的染色体片段等位基因形式的互补序列 ( 套 )( 用于 产量耐受性以及任何其他可用的标记等 )。通过传统的育种方法能将任何公开的标记等位 基因经由渗入导入玉米品系 ( 或经由转化导入, 或两种方法都使用 ) 以生成具有优异农学 性能的玉米植物。 与耐受性关联的等位基因的数目介于一和本文所公开的等位基因数目之 间, 所述耐受性可被导入或存在于本发明的玉米植物中, 其每个整数被引入本文明确引用。
本发明也提供了制备子代玉米植物的方法和这些子代玉米植物本身。 该方法包括 将第一亲本玉米植物与第二玉米植物杂交并在植物生长条件下培养雌性玉米植物以生成 玉米植物子代。本领域普通技术人员的能力足以掌握杂交方法和培养玉米植物的方法。能 检测分析此类玉米植物子代与耐受性关联的等位基因并从而选择期望的子代。 可商业售卖 此类子代植物或种子用于玉米生产、 用作食品、 处理以获取玉米的期望组分。 或者在随后若 干轮的育种中进一步利用。 第一玉米植物或第二玉米植物中的至少一个是本发明的玉米植物, 因为它包含至少其中一个本发明标记的等位基因形式, 使得子代能够继承该等位基因。
可将本发明的方法应用于至少一个相关的玉米植物如来自在受试玉米植物家谱 中的祖先或子代品系的玉米植物, 使得期望耐受性等位基因的继承可被追踪。分离经受本 发明方法的玉米植物的世代数一般将为 1 至 20, 常见 1 至 5, 通常 1、 2、 或 3 代分离, 并且相 当常用的是直系子代或亲本的玉米植物将经受该方法 ( 即一代分离 )。
当保持育种进行时渗入有利等位基因 -- 加入 “外来” 种质
遗传多样性就任何育种程序中的长期遗传增益而言是重要的。因为有限的多样 性, 当已经将所有有利等位基因固定在优良种群中时, 遗传增益将最终稳定下来。 一个目标 是用尽可能低的投资将多样性导入优良品种库, 同时不损失已经取得的遗传增益。 MAS 提供 从原始祖先中已经选择并长期保存了哪个基因组区域和哪个有利等位基因的指示, 有利于 从外来种质资源 ( 与优良基因库不相关的亲本 ) 中导入有利变异的尝试, 所述尝试希望发 现当前不存在于优良基因库中的有利等位基因。
例如在涉及优良 x 外来玉米品系的杂交中能使用本发明的标记进行 MAS, 通过使 分离子代经受 MAS 以保留主要的产量等位基因以及本文的耐受性标记等位基因。
定位克隆
如上文所述本发明的分子标记座位和等位基因如 PHM 15534、 PHM 04694、 PHM 01811、 PHM 01963、 PHM 05013、 和 PHM 00586 ; 以 及 设 计 用 于 bacb.pk0333.o19( 如 PHM 00043)、 bacc.pk0267.m12.f、 cl33021_1、 bacb.pk0241.h17.f、 chp2.pk0007.d2、 p0094. csstg88、 bacb.pk0269.n19、 bacb.pk0009.b21.f、 bacb.pk0117.i09.f、 bacc.pk0280. n12、 bacb.pk0219.j20、 bacc.pk0132.b16.f、 bacb.pk0221.o22、 bacb.pk0544.j18、 bacb. pk0540.c18.f、 and bacm.pk022.b8( 如 PHM 00049) 的 标 记, 以 及 任 何 染 色 体 区 间 (i) BNLG1755 和 UMC1299, (ii)BNLG1755 和 BNLG1621A, (iii)BNLG1755 和 MMC0371, (iv) BNLG1755 和 UMC1702, (v)UMC156A 和 UMC1299, (vi)UMC156A 和 BNLG1621A, (vii)UMC156A 和 MMC0371, (viii)UMC156A 和 UMC1702, (ix)UMC1142 和 UMC1299, (x)UMC1142 和 BNLG1621A, (xi)UMC1142 和 MMC0371, (xii)UMC1142 和 UMC1702, (xiii)UMC1346 和 UMC1299, (xiv) UMC1346 和 BNLG1621A, (xv)UMC1346 和 MMC0371, 以及 (xvi)UMC1346 和 UMC1702 可被用于 鉴定耐受性 QTL, 它能通过已确立的程序进行克隆, 例如详述于本文的 Ausubel、 Berger 和 Sambrook 的程序。
这些耐受性克隆首先通过它们与本发明标记的遗传连锁进行鉴定。通过任意多 种方法分离受关注的核酸, 例如在参考文献如本文的 Ausubel、 Berger 和 Sambrook 中详细 讨论的方法, 以及 Clark 编辑, (1997)Plant Molecular Biology : A Laboratory Manual Springer-Verlag, Berlin。
例如 “定位基因克隆” 使用接近的耐受性标记以物理上限定包含耐受性 QTL 基因 的分离染色体片段。能通过此类熟知的方法制备分离的染色体片段 : 如用一种或多种限制 性酶消化染色体 DNA, 或通过聚合酶链反应 (PCR) 扩增染色体区域, 或者任何适用的替代扩 增反应。 通常将消化的或扩增的片段连接到适于复制的载体中, 并且例如表达插入的片段。 邻近与表型性状关联的开放阅读框 (ORF) 的标记能与 DNA 克隆 ( 例如来自基因组 DNA 文库 的克隆 ) 杂交, 从而鉴定 ORF( 或者 ORF 的片段 ) 位于其上的克隆。如果标记距离较远, 通 过连续若干轮筛选和分离包含 DNA 邻近序列的克隆 ( 该过程称为 “染色体步移” ) 鉴定包含ORF 的片段, 产生 “重叠群” 或 “重叠群图谱” 。足以指导技术人员分离与连锁标记关联的克 隆的规程存在于例如本文的 Berger、 Sambrook 和 Ausubel。
生成转基因细胞和植物
本发明也涉及用对应于耐受性 QTL 的核酸转化的宿主细胞和生物体, 耐受性 QTL 根据本发明进行鉴定。 例如此类核酸包括染色体区间 ( 例如基因组片段 )、 ORF 和 / 或 cDNA, 它们编码新赋予的耐受性或提高的耐受性性状。 此外本发明提供通过重组技术生产多肽的 方法, 所述多肽提供新赋予的耐受性或提高的耐受性。
描述用于克隆和操纵核酸并生产编码多肽的分子生物学技术的一般文献包括上 文的 Berger、 Sambrook、 和 Ausubel。这些文献描述诱变、 载体的用途、 启动子和许多相关主 题, 例如与克隆世代相关的主题, 所述克隆包含受关注核酸如标记座位、 标记探针、 与标记 座位一起分离的 QTL 等。
用本发明的载体 ( 例如载体如表达载体, 它包含来源于耐受性 QTL 或与其相关的 ORF) 将宿主细胞遗传工程化 ( 例如转导、 转染、 转化等 ), 所述载体可为例如克隆载体、 穿 梭载体或表达载体。此类载体以例如以下形式存在 : 质粒、 噬粒、 农杆菌、 病毒、 裸多核苷酸 ( 线性或环状的 )、 或结合多核苷酸。 可将载体导入细菌中, 尤其是为了繁殖和增加。 也通过 本领域已知的多种标准方法将载体导入植物组织、 培养的植物细胞或植物原生质体, 包括 但不限于电穿孔 (From 等人 (1985)Proc.Natl.Acad.Sci.USA 82 : 5824)、 病毒载体感染如 花椰菜花叶病毒 (CaMV)(Hohn 等人 (1982)Molecular Biology of Plant Tumors(Academic Press, New York), 第 549-560 页 ; 美国专利 4,407,956)、 用在小珠基质或粒子内或表面 上具有核酸的粒子进行高速轰击穿透 (Klein 等人 (1987)Nature 327 : 70)、 用花粉作载体 (WO85/01856)、 或用携带其中克隆 DNA 片段的 T-DNA 质粒的根癌农杆菌或发根农杆菌。通 过根癌农杆菌感染将 T-DNA 质粒传递到植物细胞中, 并且将一部分 T-DNA 质粒稳定整合进 植物基因组中 (Horsch 等人 (1984)Science233 : 496 ; Fraley 等人 (1983)Proc.Natl.Acad. Sci.USA 80 : 4803)。关于核酸导入方法的附加细节可见于上文的 Sambrook、 Berger 和 Ausubel。 将本发明的核酸导入宿主细胞的方法就本发明而言不是至关重要的, 并且本发明 不旨在受将外源遗传材料导入宿主细胞的任何特定方法的限制。 因此可使用任何合适的方 法用于本发明, 所述方法例如包括但不限于本文提供的方法, 该方法将核酸有效导入细胞 或原生质体中。
可在常规营养物质培养基中培养工程化宿主细胞, 所述培养基经合适的改性以获 得此类活性如活化启动子或选自转化体。 可任选地培养这些细胞, 使它们进入转基因植物。 除了上文的 Sambrook、 Berger 和 Ausubel 外, 从培养原生质体中再生植物描述于 Evans 等 人 (1983)“Protoplast Isolation and Culture” , Handbook of Plant Cell Cultures 1, 124-176(MacMillan Publishing Co.), New York ; Davey(1983)“RecentDevelopments in the Culture and Regeneration of Plant Protoplasts” , Protoplasts,第 12-29 页, (Birkhauser, Basel) ; Dale(1983)“ProtoplastCulture and Plant Regeneration of Cereals and Other Recalcitrant Crops” , Protoplasts, 第 31-41 页, (Birkhauser, Basel) ; Binding(1985) “Regeneration of Plants” , Plant Protoplasts, 第 21-73 页, (CRC Press, Boca Raton, FL)。 关于植物细胞培养和再生的附加细节包括 Payne 等人 (1992)Plant Cell and Tissue Culture in Liquid Systems John Wiley&Sons, Inc.New York, NY ;Gamborg 和 Phillips( 编辑 )(1995)Plant Cell, Tissue and Organ Culture ; Fundamental Methods Springer Lab Manual, Springer-Verlag(Berlin Heidelberg New York) 以及 Plant MolecularBiology(1993)R.R.D.Croy 编辑, Bios Scientific Publishers, Oxford, U.K.ISBN 0 12 198370 6。细胞培养基通常也如 Atlas 和 Parks( 编辑 )The Handbook of Microbiolo gical Media(1993)CRC Press, Boca Raton, FL 所示。细胞培养的附加信 息可见于可商购获得的文献如 Life ScienceResearch Cell Culture Catalogue(1998), 得 自 Sigma-Aldrich, Inc.(StLouis, MO)(“Sigma-LSRCCC” ), 以 及 例 如 Plant Culture Catalogue 和补充文献 ( 例如 1997 或随后的文献 ), 它们也得自 Sigma-Aldrich, Inc.(St Louis, MO)(“Sigma-PCCS” )。
本发明也涉及转基因生物的制备, 转基因生物可为细菌、 酵母、 真菌、 动物或植物, 它们用本发明的核酸转导 ( 例如本文所述的包含标记座位和 / 或 QTL 的核酸 )。与细菌、 单细胞真核生物和细胞培养物有关的技术详细讨论可见于本文列举的参考文献并在下文 中略述。将靶核酸导入细菌细胞的若干种熟知方法是可用的, 本发明可使用任何一种方 法。这些方法包括 : 融合受体细胞与包含 DNA 的细菌原生质体、 用包含 DNA 的脂质体处理细 胞、 电穿孔、 基因枪轰击 (biolistics)、 碳纤维递送、 以及用病毒载体感染 ( 下文进一步讨 论 ) 等。可使用细菌细胞扩增包含本发明 DNA 构建体的质粒的数目。细菌生长至对数期, 并且可通过本领域已知的多种方法分离在细菌中的质粒 ( 参见例如 Sambrook)。此外用于 纯化来自细菌的质粒的多种试剂盒是可商购获得的。按照制造商的说明书正确地使用它 们 ( 参见例如 EasyPrepTM、 FlexiPrepTM, 它们都来自 Pharmacia Biotech ; StrataCleanTM, 来自 Stratagene ; 以及 QIAprepTM, 来自 Qiagen)。然后进一步操纵经分离和纯化的质粒以 制备其他质粒, 所述质粒用于转染植物细胞或导入根癌农杆菌相关载体以感染植物。一般 的载体包含转录和翻译终止子、 转录和翻译启动序列、 以及用于调控特定靶核酸表达的启 动子。载体任选地包含遗传表达盒, 该表达盒包含至少一个独立的终止子序列、 允许该盒 在真核生物或原核生物或两种细胞中均复制的序列 ( 例如穿梭载体 ) 以及用于原核系统 和真核系统的选择标记。载体适于在原核生物、 真核生物、 或优选两者中复制并整合。参 见 Giliman&Smith(1979)Gene 8 : 81 ; Roberts 等人 (1987)Nature 328 : 731 ; Schneider 等 人 (1995)Protein Expr.Purif.6 : 10 ; Ausubel、 Sambrook、 Berger( 所有同上 )。提供了 用于克隆的细菌和噬菌体的目录, 例如美国典型培养物保藏中心 (ATCC) 提供目录, 如 The ATCC Catalogue of Bacteria andBacteriophage(1992)、 Gherna 等人 ( 编辑 ) 由 ATCC 公 布的目录。用于测序、 克隆和分子生物学其他方面的附加基本程序及其理论基础也可见于 Watson 等人 (1992), Recombinant DNA, 第二版, ScientificAmerican Books, NY。此外, 基本上任何核酸 ( 事实上任何标记核酸, 无论是标准的或非标准的 ) 可从多个商业来源中 的任何一个定制或订购标准品, 如 Midland Certified Reagent Company(Midland, TX)、 TheGreat American Gene Company(Ramona, CA)、 ExpressGen Inc.(Chicago, IL)、 Operon Technologies Inc.(Alameda, CA) 以及多个其他公司。
将核酸导入植物中。
本发明的实施方案涉及生产包含克隆核酸的转基因植物, 例如分离 ORF 和编码耐 受性基因的 cDNA。用核酸转化植物的技术是广泛可用的并易于适应本发明。除上文所有 的 Berger、 Ausubel 和 Sambrook 外, 用于植物细胞克隆、 培养和再生的可用一般参考文献包括 Jones( 编辑 )(1995)Plant Gene Transfer and Expression Protocols--Methods inMolecular Biology, Volume 49 Humana Press Towata NJ(“Jones” ); Payne 等 人 (1992)Plant Cell and Tissue Culture in Liquid Systems John Wiley&Sons, Inc.New York, NY(“Payne” ); 以及 Gamborg 和 Phillips( 编辑 )(1995)Plant Cell, Tissue and Organ Culture ; Fundamental MethodsSpringer Lab Manual, Springer-Verlag(Berlin Heidelberg New York)(“Gamborg” )。多种细胞培养基也描述于 Atlas 和 Parks( 编辑 ) TheHandbook of Microbiological Media(1993)CRC Press, Boca Raton, FL( “Atlas” )。 植 物细胞培养的附加信息可见于可商购获得的文献如 Life Science Research Cell Culture Catalogue(1998), 得 自 Sigma-Aldrich, Inc.(St Louis, MO)(Sigma-LSRCCC), 以及例如 PlantCulture Catalogue and supplement(1997), 它们也得自 Sigma-Aldrich, Inc.(St Louis, MO)(Sigma-PCCS)。关于植物细胞培养的附加细节可见于 Croy。
通过多种常规技术将本发明的核酸构建体如质粒、 黏性质粒、 人工染色体、 DNA 和 RNA 多核苷酸导入在培养物或植物器官中的植物细胞中。其中表达所述序列, 该序列任选 地与转录和翻译启动调控序列结合, 所述调控序列在转化植物的目标组织中引导来自外源 DNA 的序列的翻录或翻译。
可根据本领域已知的多种技术将本发明的分离核酸导入植物。 用于转化多种高等 植物物种的技术也是为人们熟知的, 并且被描述于广泛可用的技术、 科学、 和专利文献中。 参见例如 Weising 等人 (1988)Ann.Rev.Genet.22 : 421-477。
本发明的 DNA 构建体如质粒、 噬菌粒、 黏性质粒、 噬菌体、 裸多核苷酸或不同结合 的 DNA 多核苷酸 ( 例如结合聚赖氨酸的 DNA、 结合多肽的 DNA、 结合脂质体的 DNA)、 或人工染 色体, 可将它们直接导入植物细胞的基因组 DNA, 使用的导入技术如电穿孔和显微注射植物 细胞原生质体, 或者可使用轰击方法将 DNA 构建体直接导入植物细胞, 如 DNA 粒子轰击。
显微注射技术用于注射植物如细胞、 胚芽、 愈伤组织和原生质体, 该技术是本领域 已知的并详述于科学和专利文献中。例如许多方法在 Jones 以及本文所述的其他参考文献 中描述, 并且在文献中可用。
例如使用聚乙二醇沉淀导入 DNA 构建体, 描述于 Paszkowski 等人, EMBO J.3 : 2717(1984)。电穿孔技术描述于 Fromm 等人, Proc.Natl.Acad.Sci.USA 82 : 5824(1985)。 粒子轰击转化技术描述于 Klein 等人, Nature 327 : 70-73(1987)。 附加的细节可见于 Jones 和 Gamborg, 同上, 并且可见于美国专利 5,990,387。
作为另外一种选择并且优选地在某些情况下, 使用农杆菌介导转化以生成转基因 植物。农杆菌介导转化技术包括消除并使用二元载体, 该技术也详述于科学文献中。参见 例如 Horsch 等人 (1984), Science233 : 496 ; Fraley 等人 (1984)Proc.Natl.Acad.Sci.USA 80 : 4803 : 以 及 参 见 Hansen 和 Chilton(1998)Curr.Top.Microbiol.Immunol.240 : 21 和 Das(1998)Subcellular Biochemistry 29 : Plant Microbe Interactions, 第 343-363 页。
将 DNA 构建体任选地与合适的 T-DNA 侧接区域结合并将其导入常规根癌农杆菌宿 主载体。当根癌农杆菌感染细胞时, 根癌农杆菌宿主的致病功能将引导构建体和邻近的标 记插入植物细胞 DNA。参见美国专利 5,591,616。尽管农杆菌主要用于双子叶植物, 但某些 单子叶植物可被农杆菌转化。例如玉米的农杆菌转化描述于美国专利 5,550,318 中。
转染或转化的其他方法包括 (1) 发根农杆菌介导的转化 ( 参见例如 Lichtenstein和 Fuller(1987) : Genetic Engineering,第 6 卷, PWJ Rigby 编 辑, London, Academic Press ; 以及 Lichtenstein 和 Draper(1985) : DNACloning, 卷 II, D.M.Glover 编辑, Oxford, IRI Press ; 公布于 1988 年 4 月 7 日的 WO 88/02405 描述了发根农杆菌菌株 A4 及其 Ri 质 粒以及根癌农杆菌载体 pARC8 或 pARC16 的用途 ), (2) 脂质体介导的 DNA 摄入 ( 参见例 如 Freeman 等人 (1984)Plant Cell Physiol.25 : 1353), 以及 (3) 涡旋方法 ( 参见例如 Kindle(1990)Proc.Natl.Acad.Sci.(USA)87 : 1228)。
也可通过直接引导 DNA 转移到花粉中将 DNA 导入植物, 该方法描述于 Zhou 等 人, (1983)Meth.Enzymol.101 : 433 ; D.Hess(1987)Intern Rev.Cytol.107 : 367 ; Luo 等 人 (1988)Plant Mol.Biol.Rep.6 : 165。可通过将 DNA 注入植物生殖器官表达多肽编码基因, 如 Pena 等人, (1987)Nature 325 : 274 所述。也可将 DNA 直接注入未成熟胚芽和再水合 的干燥胚芽细胞中, 该技术描述于 Neuhaus 等人, (1987)Theor.Appl.Genet.75 : 30 ; 以及 Benbrook 等人 (1986), Proceedings Bio ExpoButterworth, Stoneham, Mass., 第 27-54 页。 可用作载体的多种植物病毒是本领域已知的并包括花椰菜花叶病毒 (CaMV)、 双生病毒、 雀 麦花叶病毒、 和烟草花叶病毒。
转基因植物的生成 / 再生 可培养通过任何一种上述转化技术获得的转化植物细胞以再生具有转化基因型 并因此具有期望表型的整个植株。此类再生技术依靠操纵在组织培养物生长培养基中的 某些植物激素, 通常依靠生物杀灭剂和 / 或除草剂标记, 它们与期望的核苷酸序列一起 被导入。从培养的原生质体中再生植物描述于 Payne ; Fundamental Methods Springer LabManual, Springer-Verlag(Berlin Heidelberg New York) ; Evans 等 人 (1983) Protoplasts Isolation and Culture, Handbook of Plant Cell Culture 第 124-176 页, Macmillian Publishing Company, New York ; 以及 Binding(1985)Regeneration of Plants, Plant Protoplasts 第 21-73 页, CRC Press, Boca Raton。也能从植物愈伤组织、 外植体、 体细胞胚芽 (Dandekar 等人 (1989)J.Tissue Cult.Meth.12 : 145 ; McGranahan 等人 (1990)Plant Cell Rep.8 : 512)、 器官、 或它们的部分中再生植物。此类再生技术一般描述 于 Klee 等人 (1987)Ann.Rev.Plant Phys.38 : 467-486。 附加的细节存在于 Payne 和 Jones, 二者均如上所述, 以及 Weissbach 和 Weissbach 编辑, (1988)Methods for Plant Molecular Biology AcademicPress, Inc., San Diego, CA。 这种再生和生长过程包括以下步骤 : 选择转 化细胞和苗, 使转化体苗生根, 并在土壤中使苗生长。这些方法适合本发明以制备具有 QTL 的转基因植物和根据本发明方法分离的其他基因。
此外能再生包含本发明多核苷酸和通过农杆菌导入叶片外植体细胞的多核苷酸 的植物的再生, 如 Horsch 等人, (1985)Science227 : 1229-1231 所述。在该方法中, 在存在 选择剂的情况下在诱导转化植物苗再生的培养基中使转化体生长, 如 Fraley 等人 (1983) Proc.Natl.Acad.Sci.(U.S.A.)80 : 4803 所述。该方法通常在二至四周中生成苗, 然后将 这些转化体苗转移到合适的苗诱导培养基中, 该培养基包含选择剂和防止细菌生长的抗生 素。本发明的转基因植物可为能繁殖的或不能繁殖的。
本发明提供的导致病害耐受性的多肽的转化和表达不旨在受玉米物种的限制。 实 际上预期在玉米中提供期望耐受性的多肽当在其他农学上和园艺上重要的物种中转化和 表达时也能提供此类耐受性。此类物种包括例如 : 大豆、 油菜、 苜蓿、 小麦、 向日葵、 和高粱。
在本发明的重组表达盒构建过程中 ( 表达盒包括例如包含致病功能的辅助质粒、 以及包含外源 DNA 序列如结构基因的质粒或病毒 ), 任选地使用植物启动子片段, 该片段在 再生植物的任何或所有组织中引导核酸表达。组成型启动子的实例包括花椰菜花叶病毒 (CaMV)35S 转录初始区、 来源于根癌农杆菌的 T-DNA 的 1′ - 或 2′ - 启动子、 以及来自技术 人员已知的多种植物的其他转录初始区。作为另外一种选择, 植物启动子可在特定组织中 引导本发明多核苷酸的表达 ( 组织特异性启动子 ), 或者否则可在较精确的环境控制条件 下引导本发明多核苷酸的表达 ( 诱导型启动子 )。处于发育控制下的组织特异性启动子的 实例包括仅在一些组织例如果实、 种子或花中启动转录的启动子。
在植物细胞中引导转录的多个启动子中的任何一个可为适用的。该启动子可为 组成型启动子或诱导型启动子。除上述启动子外, 在植物中起作用的细菌来源启动子还 包括章鱼碱合酶启动子、 胭脂碱合酶启动子和其他来源于天然 Ti 质粒的启动子。参见 Herrara-Estrella 等人 (1983)Nature 303 : 209。病毒启动子包括花椰菜花叶病毒 35S 和 19SRNA 启动子。参见 Odell 等人 (1985)Nature 313 : 810。其他植物启动子包括 Kunitz 胰 蛋白酶抑制剂启动子 (KTI)、 SCP1、 SUP、 UCD3、 核酮糖 -1, 3- 二磷酸羧化酶小亚基启动子和 菜豆蛋白启动子。也可使用来自 E8 基因和其他基因的启动子序列。E8 启动子的分离和序 列详述于 Deikman 和 Fischer(1988)EMBO J.7 : 3315 中。当前使用许多其他启动子, 并且能 将启动子连接到外源 DNA 序列上以引导核酸表达。
如果期望从 cDNA 表达多肽, 则通常包括在编码区的 3′末端的聚腺苷酸化区。该 聚腺苷酸化区可源自天然基因、 源自多种其他植物基因或源自例如 T-DNA。
包含来自编码表达产物和本发明转基因序列 ( 例如启动子或编码区 ) 的载体将 通常包括核酸亚序列、 赋予植物细胞可选择的或供选择的、 可筛选的表型的标记。例如 该标记能编码生物杀灭剂耐受性尤其是抗生素耐受性, 如卡那霉素、 G418、 博莱霉素、 潮 霉素耐受性, 或除草剂耐受性如氯磺隆或草胺膦 ( 在除草剂双丙氨磷或 Basta 中的活性 成 分 ) 耐受 性。参 见例 如 Padgette 等 人 (1996) : Herbicide-Resistant Crops(Duke 编 辑 ), 第 53-84 页, CRC Lewis Publishers, Boca Raton。例如可通过工程化基因到作物中 赋予作物对特定除草剂的选择性, 所述基因编码来自其他生物如微生物的合适的除草剂 代谢酶。参见 Vasil(1996) : Herbicide-Resistant Crops(Duke 编辑 ), 第 85-91 页, CRC LewisPublishers, Boca Raton)。
技术人员将认识到在将重组表达盒稳定地导入转基因植物中并确认其可操作后, 可通过有性杂交将其导入其他植物中。取决于将进行杂交的物种, 可使用多种标准育种技 术中的任何一种。在无性繁殖作物中, 成熟的转基因植物能通过插枝或组织培养技术来繁 殖以制备多个相同植物。 选择期望转基因并获取新品种, 将其无性繁殖用于商业。 在种子繁 殖的农作物中, 成熟的转基因植物可以自交而产生纯合的自交系植物。自交植物产生包含 新导入的异源核酸的种子。这些种子可生长以产生植物, 该植物将产生所选择的表型。本 发明包括从再生植物获取的部分如花、 种子、 叶片、 枝、 果实等, 前提条件是这些部分包含具 有本发明分离核酸的细胞。 再生植物的子代和变型、 以及突变体也在本发明的范围内, 前提 条件是这些部分包含导入的核酸序列。
可通过例如标准核酸检测方法或通过免疫印迹规程来筛选表达本发明的多核苷 酸的转基因或基因渗入植物以传递本发明的核酸。能测定 RNA 水平的表达以鉴定和测定阳性表达的植物。能使用 RNA 分析标准技术, 并且该技术包括使用设计仅用于扩增异源或渗 入 RNA 模板的寡核苷酸引物的 RT-PCR 扩增检测分析法, 以及使用标记或连锁 QTL 特异探针 的溶液杂交检测分析法。也能分析植物的蛋白表达, 例如通过使用抗体的 Western 免疫印 迹分析, 该抗体识别编码的多肽。 此外根据标准规程能进行原位杂交和免疫细胞化学分析, 该分析分别使用异源核酸特异性多核苷酸探针和抗体以定位在转基因组织中的表达位点。 通常筛选许多转基因品系的导入核酸以鉴定和选择具有最适合的表达谱的植物。
本发明的一个实施方案是就加入的异源核酸而言是纯合的转基因植物 ; 例如包含 两个加入核酸序列拷贝的转基因植物, 如在同源染色体对的每个染色体上的相同基因座的 基因。纯合的转基因植物能通过有性交配 ( 自花授粉的 ) 杂合转基因植物获取, 杂合的转 基因植物包含一个单独加入的异源核酸, 使得一些产生的种子发芽并分析所得植物, 该植 物相对于对照植物 ( 例如天然的非转基因植物 ) 改变了本发明的多核苷酸表达产生。能通 过对亲本植物的回交和对非转基因植物的异交将异源核酸渗入选择的背景 ( 例如优良的 或外来的玉米品系 )。
评估并生产 GLS 耐受性玉米植物的方法
有经验的植物育种人员能识别田间的耐受性玉米植物并能选择耐受性个体或种 群用于育种目的或繁殖。在这种情况下, 植物育种人员识别 “耐受性” 和 “非耐受性” 、 或 “易 感的” 玉米植物。
此类植物育种从业者将会知道植物耐受性是一种表型谱, 由极端耐受性和易感性 以及连续统中等耐受性表型组成。耐受性也根据环境效应和病原体感染的严重程度而变 化。使用可重现的检测分析法和耐受性评分方法进行表型评估对科学家而言是有价值的, 科学家例如寻找鉴定赋予耐受性的基因座的方法, 进行耐受性种群的标记辅助选择, 并且 将耐受性性状经由渗入技术育种到优良玉米品系中。
和将植物归类为 “耐受性” 或 “易感性” 的偶然田间观察形成对比, 已知多种体系 用于对植物耐受性或易感性程度评分。可将这些技术在不同时间应用于不同的田地, 并且 提供近似的耐受性评分, 无论任何生长条件或位置, 该评分可用于表征给定品种。
本发明也涉及通过将第一亲本玉米植物与第二亲本玉米植物杂交的方法生产玉 米植物, 其中第一亲本玉米植物或第二亲本玉米植物是 PHJEP 品系的自交玉米植物。此外 第一亲本玉米植物和第二亲本玉米植物都可来自自交玉米品系 PHJEP。此外本发明也涉及 生产自交玉米品系 PHJEP 来源的玉米植物的方法, 该方法通过杂交自交玉米品系 PHJEP 与 第二玉米植物、 使子代种子生长、 并且重复与自交玉米品系 PHJEP 来源的植物的杂交和生 长步骤 0 至 5 次。因此使用自交玉米品系 PHJEP 的任何此类方法是本发明的一部分 : 自交、 回交、 杂交体生产、 杂交到种群等。所有使用自交玉米品系 PHJEP 作亲本生产的植物处于本 发明的范围内, 包括来源于自交玉米品系 PHJEP 的植物。有利的是, 将自交玉米品系用于与 其他不同玉米杂交体的杂交以生产第一代 (F1) 玉米杂交体种子和具有优异特性的植物。
应当理解能通过细胞质或其他因子的常规操纵以雄性不育形式来生产自交体。 此 类实施方案也被设想在本发明权利要求的范围内。
如本文所用, 术语植物包括植物细胞、 植物原生质体、 从其中再生玉米植物的植物 细胞组织培养物、 植物愈伤组织、 植物, 植物丛生物、 以及在植物或植物部分中完整的植物 细胞如胚芽、 花粉、 胚珠、 花、 仁、 穗、 芯、 叶片、 壳、 茎、 根、 根尖、 花药、 须等。Duncan 等人, Planta(1985)165 : 322-332 反映 97 %的产生愈伤组织的培养植物 能够再生植物。随后用自交体和杂交体进行的实验生产 91%的产生植物的可再生愈伤组 织。在进一步的研究中, 1988, Songstad 等人, Plant Cell Reports(1988), 7: 262-265 报 道了若干个培养基添加物, 该添加物促进两个自交品系的愈伤组织再生。其他公布的报道 也指示 “非传统的” 组织能够形成体细胞胚胎并再生植物。K.P.Rao 等人, Maize Genetics Cooperation Newsletter, 60 : 64-65(1986) 提到从颖片愈伤组织培养物中形成体细胞胚 胎, B.V.Conger 等人, PlantCell Reports, 6: 345-347(1987) 指出体细胞胚胎从玉米叶结 组织培养物中形成。 因此从文献中清楚地看出技术发展水平是使得这些获取植物的方法在 现在及过去都是 “常规的” , 这意味着它们被常规使用并且具有非常高的成功率。
玉米组织培养描述于欧洲专利申请公布 160,390, 该文献以引用方式并入本文。 玉米组织培养程序也描述于 Green 和 Rhodes, “PlantRegeneration in Tissue Culture of Maize” , Maize for Biological Research(Plant Molecular Biology Association, Charlottesville, Va.1982, 367-372) 以 及 Duncan 等 人, “The Production of Callus Capable of PlantRegeneration from Immature Embryos of Numerous Zea Mays Genotypes” , 165 Planta 322-332(1985)。因此本发明的另一方面是为了提供当生长和分 化时产生玉米植物的细胞, 所述玉米植物具有自交品系 PHJEP 的生理和形态特性。
自交玉米品系 PHJEP 的应用也扩展到与其他物种的杂交。适用的物种一般将是禾 本科 (Graminaceae), 尤其是玉蜀黍 (Maydeae) 族的玉蜀黍 (Zea) 属、 摩擦禾 (Tripsacum) 属、 薏苡 (Coix) 属、 硬颖草 (Schierachne) 属, 多裔黍 (Polytoca) 属、 葫芦草 (Chionachne) 属、 和三裂草 (Trilobachne) 属。潜在适用于与 PHJEP 杂交的物种可为高梁的不同品种双 色高粱 (Sorghum bicolor)(L.)Moench。
本发明的自动化检测 / 关联系统
在一些实施方案中, 本发明包括用于检测本发明标记和 / 或与期望表型 ( 例如耐 受性 ) 关联的标记的自动化系统。因此一般系统可包括一组标记探针或引物, 构造它们用 于检测一个或多个与新赋予的 GLS 耐受性或提高的 GLS 耐受性关联的标记座位的至少一个 有利等位基因。构造这些探针或标记以检测本文表和实施例中提到的标记等位基因, 例如 使用任何可用的等位基因检测形式如基于固相或液相阵列的检测、 基于微流体的样品检测 等。
例如在一个实施方案中, 标记座位是 PHM 15534、 PHM 04694、 PHM 01811、 PHM 01963、 PHM 05013、 和 PHM 00586, 或者它们的任何组合, 以及任何染色体区间 (i)BNLG1755 和 UMC1299, (ii)BNLG1755 和 BNLG1621A, (iii)BNLG1755 和 MMC0371, (iv)BNLG1755 和 UMC1702, (v)UMC156A 和 UMC1299, (vi)UMC156A 和 BNLG1621A, (vii)UMC156A 和 MMC0371, (viii)UMC156A 和 UMC1702, (ix)UMC1142 和 UMC1299, (x)UMC1142 和 BNLG1621A, (xi) UMC1142 和 MMC0371, (xii)UMC1142 和 UMC1702, (xiii)UMC1346 和 UMC1299, (xiv)UMC1346 和 BNLG1621A, (xv)UMC1346 和 MMC0371, 以及 (xvi)UMC1346 和 UMC1702, 或者它们的任何组 合, 并且构造出探针组以检测该基因座。
一般的系统包括一个检测器, 该检测器被构造为检测从标记探针或引物组或它们 的扩增子中输出的一种或多种信号, 从而确定等位基因是否存在。很多种信号检测设备是 可用的, 包括光电倍增管、 分光光度计、 CCD 阵列、 阵列和阵列扫描器、 扫描检测器、 光电管和光电二极管、 显微镜工作站、 galvo 扫描仪、 微流体核酸扩增检测设备等。检测器的精确构 型将部分取决于用于检测标记等位基因的标记类型, 以及使用者最方便获得的仪器。可使 用检测器检测荧光、 磷光、 放射性、 pH、 电荷、 吸光度、 发光、 温度、 磁力等。 一般的检测器实施 方案包括光 ( 如荧光 ) 检测器或放射性检测器。例如检测到发光 ( 例如发荧光 ) 或其他探 针标记指示存在或不存在标记等位基因。荧光检测是尤其优选的, 并且一般用于检测扩增 的核酸 ( 然而也能对扩增子进行上游和 / 或下游操纵, 这可涉及其他检测方法 )。 检测器通 常从探针标记中检测一种或多种标记 ( 例如发光 ), 它指示标记等位基因是否存在。
检测器任选地监控来自扩增反应的一个或多个信号。例如检测器能监控光信号, 该信号对应于 “实时” 扩增检测分析结果。
将是否存在有利等位基因与预测耐受性关联的系统说明书也是本发明的一个特 征。例如该说明书能够包括至少一个查找表, 该表包括是否存在有利等位基因与预测的新 赋予耐受性或提高耐受性的关联。该说明书的具体形式可根据该系统组成而不同, 例如它 们可能以系统软件形式在系统的一个或多个整合单位中存在 ( 例如微处理器、 电脑或电脑 可读的介质 ), 或者能在与检测器可操作连接的一个或多个单位 ( 例如电脑或电脑可读的 介质 ) 中存在。如在一个一般实施方案中所述, 该系统说明书包括至少一个查找表, 该表包 括是否存在有利等位基因与预测的新赋予耐受性或提高耐受性的关联。 说明书也通常包括 提供系统的使用者接口的说明, 例如允许使用者观看样品分析结果及输入参数到系统中的 接口。
系统通常包括存储或传递电脑可读数据的组件, 所述数据提供或指明通过本发明 方法检测的等位基因, 例如在自动化系统中。 电脑可读的介质能够包括高速缓冲存储器、 主 存储器、 和存储器和 / 或其他电子数据存储部件 ( 硬盘、 软盘、 存储盘等 ) 用于存储计算机 编码。 通过本发明方法检测的描述等位基因的数据也能通过电子、 光学、 或磁力传递到电脑 数据信号中, 该信号经过网络如内联网或因特网或它们的组合被保存在传递介质中。该系 统也能或可供选择地经由无线的、 IR、 或其他可用的供选择的替代方案传递数据。
在运行期间, 系统通常包含一个供分析的样品, 如植物组织或从组织中分离的材 料, 如基因组 DNA、 扩增的基因组 DNA、 cDNA、 扩增的 cDNA、 RNA、 扩增的 RNA 等。
在本发明的情况下短语 “等位基因检测 / 关联系统” 指这样一种系统 : 其中进入 电脑的数据对应于物理目标或电脑的外部处理, 例如标记等位基因和在电脑内的处理, 该 处理引起输入信号被物理转化成不同的输出信号。换句话说, 将输入数据如特定标记等位 基因的扩增转化成输出数据如染色体片段等位基因形式的鉴定。 电脑内的处理是一套指令 或 “程序” , 由此通过整合系统识别阳性扩增或杂交信号并将个体样品归为基因型。附加程 序如统计方法将个体样品的特性与表型评价或标记等位基因关联。 此外存在用于计算的多 个 C/C++ 程序、 用于 GUI 接口的 Delphi 和 / 或 Java 程序、 以及用于制图或制备有关等位基 因 - 性状关联的查找表的制作工具 ( 例如 Microsoft Excel 和 / 或 SigmaPlot)。在本发明 的整合系统中其他有用的软件工具包括统计软件包如 SAS、 Genstat、 Matlab、 Mathematica、 和 S-Plus 以及遗传建模软件包如 QU-GENE。此外附加的程序语言如 visual basic 也适用 于本发明的整合系统。
例如将分配给得自优良品系间杂交的一组子代的耐受性标记等位基因值记录在 电脑可读介质中, 从而建立对应耐受性等位基因与子代种群成员的唯一标识的数据库。适于在电脑可读介质中记录数据的任何文件或文件夹, 不管是定制的还是可商购获得的 ( 例 如购自 Oracle 或 Sybase), 在本发明的情况下可接受作为数据库。关于一个或多个分子标 记的基因型的数据, 例如如本文所述的 ASH、 SSR、 RFLP、 RAPD、 AFLP、 SNP、 CAPS、 同功酶标记 或其他标记, 同样被记录在电脑可用的数据库中。 任选地使用整合系统获取标记数据, 该系 统使用于测定标记基因型的检测分析方法的一个或多个方面自动化。在这种系统中, 输入 数据对应于分子标记的基因型, 它从检测器 ( 如阵列、 扫描仪、 CCD、 或其他检测装置 ) 被直 接转播到中央处理单位可用的电脑可读介质的文件中。 然后通过计算装置执行编码耐受性 和本发明等位基因间关联的一套系统指令 ( 通常用一个或多个程序实现 ) 以确认标记等位 基因和预测性状表型间的关联。
系统通常也包括用户输入装置, 如键盘、 鼠标、 触摸屏等 ( 例如用于选择文件、 检 索数据、 查阅制造者信息表 ), 以及输出装置 ( 例如监控器、 打印机 ) 用于查阅或回收统计分 析的结果。
因此在一个方面, 本发明提供包括电脑或电脑可读介质的整合系统, 所述介质包 含一组文件和 / 或数据库, 它们具有至少一个对应于本文标记等位基因的数据集。所述系 统也包括使用者接口, 允许使用者选择性地查阅一个或多个这些数据库。此外可使用标准 文本处理软件如字处理软件 ( 例如 Microsoft WordTM 或 Corel WordPerfectTM) 以及数据库 或电子表格软件 ( 例如电子表格软件如 Microsoft ExcelTM、 CorelQuattro ProTM、 或数据库 TM TM 程序如 Microsoft Access 或 Paradox ), 这些软件与使用者接口一起使用 ( 例如在标准 操作系统中的 GUI 如 Windows、 Macintosh、 Unix 或 Linux 系统 ) 以操纵对应于等位基因或 数据库其他部分的字符串。
所述系统任选地包括用于样品操纵的组件, 例如加入机械手装置。例如机械手液 体控制电枢用于将溶液 ( 例如植物细胞提取物 ) 从一个来源转移到目的地, 例如从微滴定 板转移到阵列基质, 将该电枢任选地可操作地连接至数字电脑 ( 或者连接至整合系统中的 附加电脑 )。 输入装置一般是整合系统的一个特征, 该装置用于将数据输入数字电脑以通过 机械手液体控制电枢控制高通量液体转移, 并且任选地通过电枢控制到固体载体的转移。 多种此类自动化机械手流体处理系统是可商购获得的。例如多种自动化系统得自 Caliper Technologies(Hopkinton, MA), 它利用多种 Zymate 系统, 该系统通常包括例如机械手和流 体处理模块。同样地, 用于多种实验室系统例如微量滴定盘的常见 机械手也是可 商购获得的, 例如来自 BeckmanCoulter, Inc.(Fullerton, CA)。作为常规机械手的可供选 择的备选系统, 进行流体处理和检测的微流体系统现在是广泛可用的, 例如来自 Caliper Technologies Corp.(Hopkinton, MA) 和 Agilent Technologies(Palo Alto, CA)。
因此用于本发明分子标记分析的系统可包括数字电脑, 它具有一个或多个高通量 液体控制软件、 用于分析来自标记的数据的图像分析软件、 数据解释软件、 可操作地连接数 字电脑的用于将溶液从一个来源转移到目的地的机械手液体控制电枢、 用于输入数据到数 字电脑中以通过机械手液体控制电枢控制高通量液体转移的输入装置 ( 例如电脑键盘 )、 以及任选地一个用于数字化来自标记探针的标记信号的图像扫描仪, 所述探针与例如在可 操作地连接至数字电脑的固体载体上的标记杂交。图像扫描仪接口具有图像分析软件, 该 软件用以测量例如当与阵列样品核酸群 ( 例如包含一个或多个标记 ) 杂交时的核酸探针标 记强度, 其中探针标记强度测量由数据解释软件进行解释以显示标记探针与标记核酸 ( 例如扩增的标记等位基因 ) 是否杂交以及杂交到何种程度。然后将如此得到的数据与样品特 性关联以确定具有特定标记或等位基因的特定基因型的植物的特性, 例如用以促进具有染 色体片段的有利等位基因形式的玉米植物的标记辅助选择, 所述染色体片段涉及农学性能 ( 例如新赋予的耐受性或提高的耐受性 )。
在本文任何实施方案中, 光学图像如通过照相机或其他记录装置 ( 例如光电二极 管和数据存储装置 ) 观察 ( 以及任选地记录 ) 到的杂交图任选地经过进一步处理, 例如数 字化图像和 / 或在电脑上存储并分析图像。多种可商购获得的外围设备和软件可用于数字 化、 存储并分析数字化的视频或数字化的光学图像, 例如使用 PC( 如 Intel x86 或 Pentium TM TM TM TM 芯片兼容的 DOS 、 OS2 、 WINDOWS 、 WINDOWS NT 、 WINDOWS 95TM、 WINDOWS 97TM、 WINDOWS TM TM TM TM 2000 、 WINDOWS XP 、 或 WINDOWS VISTA 基的机器 )、 MACINTOSH 、 LINUX、 或 UNIX 基的 ( 例 TM 如 SUN 工作站 ) 电脑。 实施例 提供以下实施例以示出受权利要求书保护的本发明, 但本发明不受以下实施例的 限制。应当理解本文所述的实施例和实施方案仅用于例证性的目的, 并且本领域的技术人 员将认识到在不脱离本发明精神或所附权利要求范围的情况下可改变多种试剂或参数。
实施例 1
对 GLS 耐受性的强效应 QTL 作图
GLS 来源的耐受性在 North American(NA) 种质中是不常见的。为了制备优良品 系用作 GLS 耐受性的供体来源, GLS 耐受性品系 PH14T( 美国专利 5,942,670) 与 PHN46( 美 国专利 5,567,861) 杂交以生成 F1 种群。然后将 F1 种群的个体与 PHN46 回交以生成大约 190 个个体的 BC5 回交种群。
在田间进行 F1 种群的 GLS 抗性表型分型。收集使用 SSR 标记的每个子代个体的 标记数据, 它们具有良好的基因组覆盖率以生成种群的分子标记图谱。来自 F1 种群的数据 的 QTL 分析确定了在染色体 4, 区段 (bin)5 上的、 介于标记 UMC1791 和 UMC1346 之间的 GLS 耐受性 QTL。
也在田间进行 BC5 种群的 GLS 抗性表型分型。收集使用 SSR 标记的每个子代个体 的标记数据, 它们具有良好的基因组覆盖率以生成种群的分子标记图谱。BC5 作图种群证 实了 GLS 耐受性 QTL 的位置并较精确地确定 GLS 耐受性 QTL 与 BNLG1755 紧密连锁。这个 QTL 显示强并且一致的效应, 解释了 8-44%的总表型变异 ( 表 4)。
表 4. 来自 BC5 种群的 GLS 耐受性的单标记回归 QTL 作图 ( 所有标记在染色体 4 上)
实施例 2
对 GLS 耐受性的 QTL 精细作图
使用玉米的完整基因图谱和物理图谱鉴定位于该区域内的所有 BAC 重叠群。使用 来自这些重叠群的低拷贝 BAC 末端序列和 PHM 标记开发 CAPS 标记。测定出 bacm2.pk027. h10.f 和 bacm.pk098.d7 侧接一侧的 GLS 基因座, 而 bacm.pk022.b8 和 PHM 7245 侧接另一 侧。
实施例 3
开发 PHJEP
选择来源于 BC4 世代的子代个体, 所述 BC4 世代具有 QTL 区域、 最像 PHN46 的表 型、 以及良好的抗性表型。该个体进行自交以确保高度纯合的基因组。将所得自交体命名 为 PHJEP。GLS QTL 的基因渗入导致 PHJEP 的病害抗性评分为 4( 评分等级 1-9), 与之相比 cPHN46 的评分为 1 或 2。图 6 显示用玉米灰叶斑病菌接种后的 PHN46 和 PH14T 间的表型差 异。
将 QTL 进一步回交到 PHN46 中。 选择来源于 BC7(dose 8) 世代的子代个体, 它们具 有新限定的 QTL 区域, 并且该区域中较小的供体片段紧接 QTL。 该个体进行自交以确保高度 纯合的基因组。将所得自交体编码为 PHW6N 和 PHW6M。发现这些自交体具有等同于 PH14T 和 PHJEP 的 GLS 耐受性水平。因为 PHJEP 被首先开发并且不表现出由于 QTL 渗入导致的连 锁累赘或者其他有害效应, 选择 PHJEP 作为 GLS 耐受性 QTL 对 PHW6N 和 PHW6M 的主要供体。
实施例 4
PHJEP 中的唯一单倍型
PH14T 中的供体区域在 PHM 00045-01 和 PHM 00043-01 分别具有 SNP 核苷酸 A 和 A。轮回亲本 PHN46 在这些相同的标记座位具有核苷酸 G 和 G。将 GLS QTL 从 PH14T 渗入 PHN46 并且随后经多个 BC 世代选择 QTL, 同时在侧接区域选择轮回亲本, 导致恰好在 GLS QTL 上的重组以及 PHJEP 中的 PHM 00045-01 和 PHM 00043-01 的核苷酸分别为 G(PHN46 等 位基因 ) 和 A(PH14T 等位基因 )。GLS QTL 的位置靠近具有低重组频率区域中的染色体 4 着丝点。认为恰好发生在 PHJEP 中的 GLS 基因座上的重组是一个稀少的重组事件。在随后 的育种种群中, 在 PHJEP 和其他自交体之间保持了这个核苷酸模式或单倍型。在将 PHJEP GLS 供体区域多次渗入优良材料期间, 保持这一重组。限定罕见重组的一个单倍型是 : PHM 00045-01 : G; PHM 00043-01 : A; PHM15534-13 : A; PHM 04694-10 : G; PHM 01811-32 : T; PHM
01963-15 : T; PHM 01963-22 : C; PHM 05013-12 : T; PHM 00586-10 : T; 和 PHM00049-01 : A( 参 见表 5)。对公开和专有自交体的调查确定这个单倍型是对 PHJEP 唯一的。这个等位基因组 合在申请人的种质中是唯一的。
表5: 在包含 GLS QTL 的染色体 4 区域中的自交体 PH14T、 PHN46、 和 PHJEP 的单倍 型
PH14T PHM 00045-01 PHM 00043-01 PHM 15534-13 PHM 04694-10 PHM 01811-32 PHM 01963-15 PHM 01963-22 PHM 05013-12 PHM 00586-10 PHM 00049-01
PHN46 3, 3 3, 3 4, 4 4, 4 2, 2 2, 2 2, 2 4, 4 2, 2 4, 4PHJEP 3, 3 1, 1 1, 1 3, 3 4, 4 4, 4 2, 2 4, 4 4, 4 1, 11, 1 1, 1 1, 1 3, 3 4, 4 4, 4 2, 2 4, 4 4, 4 1, 11 = A, 2 = C, 3 = G, 4=T
实施例 5
PH14T、 PHN46、 和 PHJEP 的 GLS 分析
PH14T、 PHN46、 和 PHJEP 在 4 个位置生长, 每个位置重复 8 次。玉米植物的 GLS 评 分使用 1 至 9 的评分系统, 一代表 “差” 而 9 代表 “良好” 。
按照 1 至 9 的评分系统, PH14T、 PHN46、 和 PHJEP 的平均 GLS 评分分别是 5.4、 3.6、 和 5.3。自交体 PHJEP 的病害抗性与自交体 PHN46 相比提高了 1.5 倍 ( 按照 1-9 的评分系 统 ), 并且该差异是显著的, P 值≤ 0.05。自交体 PHJEP 和 GLS 耐受性品系 PH14T 具有相似 的 GLS 评分。
实施例 6
用 PHJEP 转化其他优良自交体
使用 PHJEP 作为供体转化超过 40 个不同自交体以具有 GLS 抗性。表 6 示出这三 个杂交体和从非 PHJEP 来源制备的三个杂交体之间的比较。表6 Exp 杂交体 PHP38/PHJEP PH705/PHJEP PH05F/PHJEP 3394(PHP38/PHN46) PH705/PHN46 PH05F/PHN46 CV% 2 项均值的 SED 优点 产量 (bu/a) 188.5 185.8 178.1 155.9 155.7 153.3 5.9 7 29±4.0 Stagrn 193 147 166 79 70 70 25.5 37 96±19 GLFSPT 6 6 7 3 5 5 13.6 1 2.0±0.5产量 (bu/a) 是产量 ( 蒲式耳 / 英亩 ), 即收获的谷物产量按每单位面积 ( 英亩 ) 重量或体积计 ( 蒲式耳 ), 有 15%的可调水分含量。Stagrn 是保绿度, 即接近黑层形成时 ( 生理成熟期 ) 植物健康的量度。高分指示季节晚期植物健康状态较好。GLFSPT 是灰叶斑 病, 即 1-9 的视觉评分指示对灰叶斑病的抗性。评分越高指示抗性越强。CV%是变异系数 ( 以百分比表示 )。SED 是差值的标准误差。
实施例 7
使用 QTL 选择 GLS 耐受性植物
在 连 续 回 交 期 间 使 用 SSR 标 记 PHI026[PHI079 或 GPC1 或 GAPC1 或 NC005] 、LGI145183[BNLG1937] 、LGI455751[BNLG1265] 、LGI135263[BNLG1755] 、 EST337321[UMC1175]、 LGI123864[BNLG1189] 和 UMC1346 选择来自 PH14T 的供体 QTL 区域。 表型分型也在 BC3(270 个个体 ) 和 BC4(110 个个体 ) 世代中进行以便能进一步验证 QTL 并 进一步限定位置。
在 BC4 种群中, 将 QTL 定位在由 BNLG1755 和 UMC1346( 图 2) 限定的区域内 ; 在 IBM2 2004 neighbors 图谱上的距离为 4.4cM。发现 GLS QTL 解释了 55.1%的总表型变异。QTL 的平均表型效应在 1-9 的 GLS 病害评分系统中大于 2。
实施例 8
杂交体中的功效
PHJEP、 PHW6N、 PHW6M、 和近等基因的自交体 PHN46 缺乏 GLSQTL, 使它们与 PHP38、 PH705、 和 PH05F 杂交进行测试。所得杂交体在 16 个产量测试位置进行比较, 每个位置重复
3-4 次。所述位置集中在东方玉米带区域。十四个位置提供了产量数据, 13 个位置提供了 GLS 耐受性数据。发现杂交体的 GLS 耐受性版本与非耐受性版本相比具有一致的产量优势 和提高的病害耐受性 ( 表 7)。在表 7 中, 3394 是通过自交体 PHP38 和 PHN46 间的杂交形成 的杂交体。
表7
例如具有 PHJEP 的杂交体具有介于 20.9 和 43.5bu/ 英亩之间的产量优势以及 1.7-2.7 的病害抗性提高 (1-9 的评分体系 )。图 7 显示杂交抗性的 GLS QTL 效应。
实施例 9
GLS 耐受性 QTL 的基于图谱的分析
使用标记 BNLG1755 和 UMC1346 鉴定 QTL 区域下的 B73 重叠群 4022、 4023 和 4024。 通过设计 BAC 末端序列的引物并酶切所得扩增子来设计三个 CAPs( 酶切扩增多态性 ) 标记 用于 BAC bacm.pk040.o17( 标记 PHM 00045)、 bcb.pk0333.o19(PHM 00043) 和 bacm.pk022. b8(PHM 00049)( 参见图 3)。 使用相同 BAC 末端序列设计应用于高通量分子育种的 Invader SNP 标记检测分析。生成 4,464 RI 个体的 BC7 种群, 并且使用 CAPs 标记鉴定区域中具有重 组体的子代个体。这些子代在田间进行 GLS 抗性表型分析, 也进行自交以生成更多子代并 能够进行更精确的表型分型。使用组合的标记和表型数据以将 QTL 定位到重叠群 4024。开 发 BAC 的附加标记 (bacm2.pk065.b22.f、 bacc.pk0267.m12.f、 bacb.pk0241.h17.f、 chp2. pk0007.d2、 bacc.pk0530.f13.f、 bacb.pk0269.n19、 bacb.pk0009.b21.f、 bacb.pk0117. i09.f、 bacc.pk0280.n12、 bacb.pk0219.j20、 bacc.pk0132.b16.f、 bacb.pk0221.o22、 bacb. pk0544.j18 和 bacb.pk0540.c18.f) 以及在此重叠群中的 EST 横穿探针 (cl33021_1)。使 用这些附加的 CAPs 标记辅助精细作图和基于作图的克隆。
在精细作图过程中, 启动一个方案以对 QTL 区域中的 EST 和 BAC 测序, 测序使用来 自 Life Sciences 的高通量 454 测序技术。收集二十五个重叠的 B73 BAC 克隆, 它们覆盖 bcb.pk0333.o19 和 p0094.csstg88 之间的区间, 并且通过 454 Life Sciences 测序。短序
列读取意味着该序列不能进行装配以产生并列途径, 但是 BAC 克隆的深序列采样 ( 平均 20X 覆盖率 ) 指示该区域进行了完全测序。序列注解未能鉴定类似该区间中病害抗性基因的序 列。
在此期间, 使用在该区域内的附加 CAPs 标记进一步将 QTL 定位到 EST cl33021_1 和 BAC 末端 bacb.pk0009.b21.f 之间的区域中。这在表 8 中示出, 其中重组体栏的数字描 述了 4,464 个子代个体中在对应标记和 QTL 之间具有重组体的植物数目。重组体数目为零 表示该标记非常接近引起表型的基因, 使得重组不能中断表型 ( 以及导致该表型的基因 ) 和标记间的牢固连锁。4,464 个子代中有零个重组体代表重组距离小于 0.02cM。
表 8. 用 4,464 个子代个体和对 BAC 末端序列开发的标记对 GLSQTL 精细作图
两 个 附 加 的 BAC 克 隆 ; bacb.pk0269.n19 和 bacb.pk0009.b21.f,使 用 双 链 随 机 鸟 枪 法 进 行 测 序 (Bodenteich 等 人, “Automated DNAsequencing and analysis techniques” ( 编辑 : Adams 等人 ), 第 42-50 页, Academic Press, London, UK(1994))。简 言之, 在经由双乙酸澄清裂解液规程分离每个 BAC 后, 通过雾化作用剪切克隆, 所得片段进 行末端修补并被亚克隆到 pBluescript II SK(+) 中。在经由电穿孔转化到 DH-10B 电感受 态大肠杆菌细胞 (In Vitrogen) 中后, 用自动 Q-Bot 菌落挑取仪 (Genetix) 采集菌落并将
其贮存在 -80℃下, 冷冻培养基包含 6%甘油和 100μg/mL 氨苄青霉素。
为了进行测序, 从贮藏的甘油培养物中回收克隆, 甘油培养物生长 / 冷冻在 384- 孔冷冻培养基板中, 克隆用无菌 384 针复制仪 (Genetix) 在 384 孔微滴定板中复制, 所 述微滴定板包含 LB+100μg/mL 的氨苄青霉素 ( 平行测定板 )。然后使用 Templiphi DNA 测 序模板扩增试剂盒方法 (Amersham Biosciences) 分离质粒。简而言之, Templiphi 方法通 过等温滚环扩增, 使用噬菌体 DNA 聚合酶扩增环状单链或双链 DNA(Dean 等人, Genome Res.11 : 1095-99(2001) ; Nelson 等 人, Biotechniques 32 : S44-S47(2002) ; Reagin 等 人, J.Biomol.Tech.14 : 143-148(2003))。将细胞加入 5μL 稀释缓冲液中, 并且在 95 ℃下部 分地溶解 3 分钟以释放变性模板。然后加入 5μL Templiphi 预混物到每个样品中, 所得 反应混合物在 30℃下培养 16 小时, 然后在 65℃下放置 10 分钟以灭活 性。DNA 定量在用蒸馏水 1 ∶ 3 稀释扩增样品后, 使用 DNA 聚合酶活 dsDNA Quantitati onReagent(Molecular Probes) 进行。然后在 95℃下变性扩增产物 10 分钟, 在 384 孔板中进 行末端测序, 测序使用载体引导的 M13 寡核苷酸和 ABIBigDye 3.1 版 Prism 测序试剂盒。 在 用乙醇清洗后, 溶解循环测序反应产物并在 Perkin-Elmer ABI 3730xl 自动测序仪上检测, 单个序列用公共领域的 Phred/Phrap/Consed 包装配。当 Phred 读取 DNA 测序追踪文件、 读取碱基、 分配质量值给每个读取碱基、 并且写下读取碱基和质量值以输出文件时, Phrap 使用基于 Phred 的测序文件汇集鸟枪 DNA 序列数据 ( 参见 Laboratory of Phil Green 网 站, Genome Sciences Department, University of Washington)。Consed 是一种用于查 Genome Res.8 : 看、 编辑、 和完成用 Phred and Phrap 生成的序列装配的工具 (Gordon 等人, 195-202(1998))。重叠群顺序用 Exgap(A.Hua, University ofOklahoma, 个人沟通 ) 察看 和确认, 这是一个局部图形工具, 它使用成对读取信息为由 Phred、 Phrap、 和 Consed 生成的 重叠群排序, 并且确认基于 Phrap 的装配的精确性。
发明领域 本发明涉及耐灰叶斑病 (GLS) 玉米植物以及生产该种植物的方法。更具体地讲, 本发明涉及能够引起玉米 GLS 耐受性的可确认的遗传物质, 以及该遗传物质基因渗入到玉 米植株中的现象。此外, 本发明涉及来自一个或多个亲本植物的期望遗传物质以一定的速 度、 精密度、 和准确度渗入到子代植物中的现象。
背景技术
从历史上看, 玉米是一种具有食物、 饲料和工业用途的重要作物。 影响玉米的任何 环境胁迫因素如病害可对这些用途的玉米谷物可用性产生影响。
灰叶斑病 ( 下文称为 GLS) 在过去的三十年中已经变成一种突出病害, 并且在美国 和其他主要玉米产地如墨西哥、 巴西、 欧洲、 和南非是一种显著的叶片病害。 GLS 的发病率和 严重性在美国似乎是渐增的 (Wang 等人, Phytopathology 88 : 1269-75(1998)), 这或许是 由于玉米种植增加而耕作减少的原因。 这些病症可能导致真菌越冬以及下一季节的早期感 染 (Laterall 和 Rossi, Plant Dis.67 : 842-37(1983))。在美国在 GLS 流行期间已经报道 了超过 50%的产量损失 (Laterall 和 Rossi, 同上 ; Lipps, Plant Dis.71 : 281(1987)), 并 且其中严重流行导致茎倒伏和早衰增加时预计的损失已经高达 100% (Laterall 和 Rossi, 同上 )。
引起 GLS 的真菌病原体玉米灰叶斑病菌 (Cercospora zeae-maydis) 表征性地 生成与叶脉平行的、 长矩形浅灰 - 棕褐色叶片损伤 (Tehon 和 Daniels, Mycologia 17 : 240-49(1925) ; Latterell 和 Rossi, 同上 ; Ward 等人, Plant Dis.83 : 884-95(1999))。 损伤 可使部分或全部叶片枯萎并且通常首先出现在较低的叶片中。GLS 引起的枯萎与光合作用 区域的早熟损失关联。开花后玉米植株的主要接收区是穗, 枯萎诱导植物将光合作用产物 以高水平从茎和根转移到穗, 因此引起早衰和产量降低。
具有 GLS 耐受性的玉米品种的快速有效的开发是有益的。在商业杂交体和自交体 中的 GLS 耐受性水平随品种而不同。已经报道了一些表现出强耐受性的品种。然而, 使用 表型选择以将 GLS 性状从耐受性品种渗入到易感品种中可能是耗时的并且是困难的。GLS 对环境条件敏感并且需要高湿度和叶片长期湿润。 这种敏感性使得每年仅基于表型来可靠 地选择 GLS 耐受性变得困难 (Lehmensiek 等人, Theor.Appl.Genet.103 : 797-803(2001))。 特定的病害筛选位点可能操纵起来比较昂贵, 并且为了区分耐受性水平, 植物必须生长至 成熟。 与之相反, 通过使用与 GLS 耐受性关联的分子标记进行选择具有以下优点 : 使得至少 一些选择仅基于子代的遗传组合物进行。因此, 可在植物生命周期非常早的阶段测量 GLS 耐受性, 甚至在种子阶段。通过使用与 GLS 耐受性性状关联的分子标记提高选择速率意味 着具有 GLS 耐受性的植物育种能够以较快速率发生, 并且能够较迅速地开发商业上可接受的耐 GLS 植物。
发明概述
本发明的实施方案基于与提高 GLS 耐受性显著相关的基因座的精细作图, 以及将 该知识应用于植物育种。提供了鉴定耐 GLS 玉米植物的组合物和方法。提供了利用标记进 行育种以制备耐 GLS 的玉米植物的方法, 以及通过此类方法产生的植物。
实施方案包括使用改良的供体品种 PHJEP 作为种质来源以将 GLS 耐受性渗入到玉 米植物及其子代中。所述品种的代表性样品已经作为保藏号 PTA-8851 被保藏在美国典型 培养物保藏中心 (ATCC)。
一个方面是命名 PHJEP 的玉米品种的种子, 其中所述玉米品种的代表性样品已经 以保藏号 PTA-8851 被保藏, 或者得自该种子的子代种子, 所述种子包含 PHJEP 灰叶斑病耐 受性基因座, 并且当生长时, 产生表现出耐灰叶斑病的植物。由 PHJEP 种子或其子代的种子 产生的植物也是受关注的, 这些植物的细胞也同样受关注。
实施方案也包括得自 PHJEP 的特定重组染色体区间, 它们与 GLS 耐受性提高关联, 并且将该染色体区间基因渗入到其他品种和植物中。一些实施方案包括将 PHJEP 的特定单 倍型基因渗入到其他品种和植物中。 在一个方面, 子代种子中的 PHJEP 灰叶斑病耐受性基因座位于 PHJEP 来源的染色 体区间上, 该区间包含由 UMC1346 和 UMC1702 限定的 PHJEP 的染色体区域。在另一方面, 子代种子中的 PHJEP 灰叶斑病耐受性基因座由单倍型限定, 它包含 : 在 PHM 00045-01 上 的等位基因 G、 在 PHM 00043-01 上的等位基因 A、 在 PHM 15534-13 上的等位基因 A、 在 PHM 04694-10 上的等位基因 G、 在 PHM 01811-32 上的等位基因 T、 在 PHM 01963-15 上的等位基 因 T、 在 PHM 01963-22 上的等位基因 C、 在 PHM 05013-12 上的等位基因 T、 在 PHM 00586-10 上的等位基因 T、 在 PHM 00049-01 上的等位基因 A。在另一个方面, PHJEP 灰叶斑病耐受性 基因座由单倍型限定, 它包含 : 在 PHM 00045-01 上的等位基因 G、 在 PHM 00043-01 上的等 位基因 A、 在 PHM 01963-22 上的等位基因 C、 和在 PHM 05013-12 上的等位基因 T。
在其他方面, 子代种子是 PHJEP 灰叶斑病耐受性基因座的回交转化体。由选自 PHVNV、 PHW3Y、 PHVRA、 PHEWB、 和 PHWRC 的轮回亲本产生的回交转化体的子代种子也是受关 注的。
在其他方面, 子代种子是杂交品种, 并且杂交品种的至少一个自交亲本是 PHJEP 灰叶斑病耐受性基因座到选自 PHVNV、 PHW3Y、 PHVRA、 PHEWB、 和 PHWRC 的轮回亲本的回交转 化体。
其他实施方案包括鉴定包含与灰叶斑病耐受性关联的基因座的第一玉米植物的 方法, 所述方法包括 : (a) 获取所述第一玉米植物在染色体 4 上 BNLG1755 和 UMC1299 之间 的染色体区间的第一遗传特征图, (b) 从包含与灰叶斑病耐受性关联的基因座的第二玉米 植物获取第二遗传特征图, 其中所述基因座位于在染色体 4 上 BNLG1755 和 UMC1299 之间, 和 (c) 比较所述第一遗传特征图和所述第二遗传特征图。
在另一方面, 如果所述第一玉米植物包含与灰叶斑病耐受性关联的基因座, 该方 法还包括选择所述第一玉米植物的方法。
此外, 第二遗传特征图可为 PHJEP 或 PHJEP 子代的遗传特征图, 或者可包含一个或 多个标记等位基因, 所述等位基因选自 : 在 PHM00045-01 上的等位基因 G、 在 PHM 00043-01
在其他方面, 子代种子是 PHJEP 灰叶斑病耐受性基因座的回交转化体。由选自 PHVNV、 PHW3Y、 PHVRA、 PHEWB、 和 PHWRC 的轮回亲本产生的回交转化体的子代种子也是受关 注的。
在其他方面, 子代种子是杂交品种, 并且杂交品种的至少一个自交亲本是 PHJEP 灰叶斑病耐受性基因座到选自 PHVNV、 PHW3Y、 PHVRA、 PHEWB、 和 PHWRC 的轮回亲本的回交转 化体。
其他实施方案包括鉴定包含与灰叶斑病耐受性关联的基因座的第一玉米植物的 方法, 所述方法包括 : (a) 获取所述第一玉米植物在染色体 4 上 BNLG1755 和 UMC1299 之间 的染色体区间的第一遗传特征图, (b) 从包含与灰叶斑病耐受性关联的基因座的第二玉米 植物获取第二遗传特征图, 其中所述基因座位于在染色体 4 上 BNLG1755 和 UMC1299 之间, 和 (c) 比较所述第一遗传特征图和所述第二遗传特征图。
在另一方面, 如果所述第一玉米植物包含与灰叶斑病耐受性关联的基因座, 该方 法还包括选择所述第一玉米植物的方法。
此外, 第二遗传特征图可为 PHJEP 或 PHJEP 子代的遗传特征图, 或者可包含一个或 多个标记等位基因, 所述等位基因选自 : 在 PHM00045-01 上的等位基因 G、 在 PHM 00043-01
上的等位基因 A、 在 PHM15534-13 上的等位基因 A、 在 PHM 04694-10 上的等位基因 G、 在 PHM01811-32 上的等位基因 T、 在 PHM 01963-15 上的等位基因 T、 在 PHM01963-22 上的等 位基因 C、 在 PHM 05013-12 上的等位基因 T、 在 PHM00586-10 上的等位基因 T、 以及在 PHM 00049-01 上的等位基因 A。
第二遗传特征图也可包含一个或多个标记等位基因, 所述等位基因选自 : 在 PHM 00045-01 上的等位基因 G、 在 PHM 00043-01 上的等位基因 A、 在 PHM 01963-22 上的等位基 因 C、 和在 PHM 05013-12 上的等位基因 T。
在其他方面, 遗传特征图能够被确定为在染色体 4 上 BNLG1755 和 UMC0371 之间 的染色体区间。此外, 与灰叶斑病耐受性关联的基因座可为 PHM 15534、 PHM 04694、 PHM 01811、 PHM 01963、 PHM 05013、 或 PHM 00586。
通过所述方法鉴定的玉米植物和那些玉米植物的细胞及种子也是受关注的。
另一个实施方案包括鉴定包含与灰叶斑病耐受性关联的基因座的第一玉米植物 的方法, 所述方法包括 : (a) 获取所述第一玉米植物在染色体 4 上的染色体区间的第一遗传 特征图, 所述区间由以下序列描述并且包括以下序列 : SEQ ID NO : 86, 或基于 Clustal V 比 对方法与 SEQID NO : 86 具有 95%同一性的核苷酸序列, 以及 SEQ ID NO : 87, 或基于 Clustal V 比对方法与 SEQ ID NO : 87 具有 95%同一性的核苷酸序列, (b) 从包含与灰叶斑病耐受性 关联的基因座的第二玉米植物获取第二遗传特征图, 其中所述基因座在所述区间中, 以及 (c) 比较所述第一遗传特征图和所述第二遗传特征图。 其他实施方案包括包含以下单倍型的玉米种子 : 在 PHM 00045-01 上的等位基因 G、 在 PHM 00043-01 上的等位基因 A、 在 PHM 15534-13 上的等位基因 A、 在 PHM 04694-10 上 的等位基因 G、 在 PHM 01811-32 上的等位基因 T、 在 PHM 01963-15 上的等位基因 T、 在 PHM 01963-22 上的等位基因 C、 在 PHM 05013-12 上的等位基因 T、 在 PHM 00586-10 上的等位基 因 T、 在 PHM 00049-01 上的等位基因 A ; 并且玉米种子包含以下单倍型 : 在 PHM 00045-01 上的等位基因 G、 在 PHM 00043-01 上的等位基因 A、 在 PHM 01963-22 上的等位基因 C、 和在 PHM05013-12 上的等位基因 T。由该玉米种子生成的植物也是受关注的。
定义
在详述本发明之前, 应当了解本发明不受特定实施方案的限制, 它当然能够改变。 也应当了解本文所用的术语仅是为了描述特定实施方案, 而不旨在进行限制。当在本说明 书和所附权利要求中使用时, 除非内容清楚地表明, 单数和单数形式的术语包括复数指代。 因此, 例如术语 “一个植物” 也包括多个植物 ; 也取决于上下文, 使用的术语 “植物” 也可包 括该植物遗传相似或相同的子代 ; 使用的术语 “核酸” 实际上任选地包括该核酸分子的多个 拷贝 ; 同样地, 术语 “探针” 任选地 ( 并且通常 ) 包括许多相似或相同的探针分子。
除非另外说明, 核酸是以 5′到 3′方向从左往右写。说明书中所述的数字范围包 括限定范围的端值并且包括在限定范围内的各个整数或任何非整数的分数。除非另外指 明, 本文所用的所有技术和科学术语具有与本发明所属领域普通技术人员一般理解相同的 含义。 虽然与本文所述的那些方法和材料相似或等同的任何方法和材料可用于本发明的测 试实践, 但本文描述了优选的材料和方法。 在本发明的描述和权利要求中, 将根据下文列陈 述的定义使用以下术语。
“植物” 可为整个植株、 其任何部分、 或来源于植物的细胞或组织培养物。因此, 术
定义
在详述本发明之前, 应当了解本发明不受特定实施方案的限制, 它当然能够改变。 也应当了解本文所用的术语仅是为了描述特定实施方案, 而不旨在进行限制。当在本说明 书和所附权利要求中使用时, 除非内容清楚地表明, 单数和单数形式的术语包括复数指代。 因此, 例如术语 “一个植物” 也包括多个植物 ; 也取决于上下文, 使用的术语 “植物” 也可包 括该植物遗传相似或相同的子代 ; 使用的术语 “核酸” 实际上任选地包括该核酸分子的多个 拷贝 ; 同样地, 术语 “探针” 任选地 ( 并且通常 ) 包括许多相似或相同的探针分子。
除非另外说明, 核酸是以 5′到 3′方向从左往右写。说明书中所述的数字范围包 括限定范围的端值并且包括在限定范围内的各个整数或任何非整数的分数。除非另外指 明, 本文所用的所有技术和科学术语具有与本发明所属领域普通技术人员一般理解相同的 含义。 虽然与本文所述的那些方法和材料相似或等同的任何方法和材料可用于本发明的测 试实践, 但本文描述了优选的材料和方法。 在本发明的描述和权利要求中, 将根据下文列陈 述的定义使用以下术语。
“植物” 可为整个植株、 其任何部分、 或来源于植物的细胞或组织培养物。因此, 术
语 “植物” 可指代以下任何一种材料 : 整个植株、 植物部分或器官 ( 例如叶片、 茎、 根等 )、 植 物组织、 种子、 植物细胞、 和 / 或子代的相同材料。植物细胞是从植物中获取的细胞或来源 于从植物中所获取细胞经培养出的细胞。
术语 “玉米植物” 包括整个玉米植株、 玉米植物细胞、 玉米植物原生质体、 能从其中 再生玉米植株的玉米植物细胞或玉米组织培养物、 玉米植物愈伤组织、 玉米植物丛生物和 玉米植物中的完整玉米植物细胞或玉米植物部分, 如玉米种子、 玉米芯、 玉米花、 玉米子叶、 玉米叶、 玉米茎、 玉米芽、 玉米根、 玉米根尖等。
术语 “玉米”包括玉米 (Zea mays) 物种的任何成员。 “玉米 (maize)”和 “玉米 (corn)” 本文可互换使用。
“种子” 是包封在保护种皮中的小胚体。它是成熟的植物胚珠在授精后生成的产 物。
“种质” 指个体 ( 例如一个植株 )、 一组个体 ( 例如一个植物品系、 品种或家族 )、 或 来源于一个品系、 品种、 物种、 或培养物的克隆的或从其中得到的遗传物质。种质可为生物 或细胞的部分, 或者可从生物或细胞中分离得到。种质通常提供遗传物质与特异性分子构 成, 该分子构成提供生物或细胞培养物的一些或全部遗传性状的物理基础。 如本文所用, 种 质包括可从中生长出新植物的细胞、 种子或组织, 或者植物部分如叶、 茎、 花粉、 或细胞, 它 们能够被培养成整个植株。 当与植物一起使用时, “品种” 包括植物学和栽植植物, 包括自交体和杂交体, 并且 指植物学分类上已知的最低阶层的植物族群, 其中该族群可由给定基因型或基因型组合的 特性的表达来限定。
术语 “自交体” 指基本上纯合的品种。
术语 “杂交体” 指两个遗传上不同的个体之间自交产生的任何子代, 包括两个不同 自交系之间的杂交。
术语 “等位基因” 指在特定基因座处发生的两个或更多个不同核苷酸序列的其中 一个。
当等位基因与性状关联时, 以及当存在的等位基因是期望的性状或性状形式将发 生在包含等位基因的植物中的指示时, 等位基因与性状 “关联” 。
“BAC” 或细菌人工染色体是来源于大肠杆菌 (Escherichia coli) 天然存在的 F 因 子的克隆载体。BAC 能够接受 DNA 序列的较大插入序列。在玉米中, 已经将许多 BAC 或细菌 人工染色体装配成重叠群 ( 重叠的邻接基因片段, 或 “邻接 DNA” ), 它们每个包含玉米基因 组 DNA 的较大插入序列。
“有利等位基因” 是在特定基因座的等位基因, 该基因座赋予或有助于产生农学上 期望的表型, 例如 GLS 耐受性, 或者作为另外一种选择是允许鉴定能够从育种程序或种植 中除去的易感植物的等位基因。标记的有利等位基因是分离有利表型的标记等位基因, 或 者作为另外一种选择, 分离易感植物表型并因此提供鉴定易感病植物的有益效果。染色体 片段的一种有利等位基因形式是包括在位于染色体片段上的一个或多个基因座上的核苷 酸序列的染色体片段, 所述核苷酸序列有助于产生优异的农学性能。
“等位基因频率” 指等位基因存在于个体、 品系、 或一组品系中的基因座上的频率 ( 比例或百分比 )。例如, 就等位基因 “A” 而言, 基因型 “AA” 、 “Aa” 、 或 “aa” 的二倍体个体
术语 “自交体” 指基本上纯合的品种。
术语 “杂交体” 指两个遗传上不同的个体之间自交产生的任何子代, 包括两个不同 自交系之间的杂交。
术语 “等位基因” 指在特定基因座处发生的两个或更多个不同核苷酸序列的其中 一个。
当等位基因与性状关联时, 以及当存在的等位基因是期望的性状或性状形式将发 生在包含等位基因的植物中的指示时, 等位基因与性状 “关联” 。
“BAC” 或细菌人工染色体是来源于大肠杆菌 (Escherichia coli) 天然存在的 F 因 子的克隆载体。BAC 能够接受 DNA 序列的较大插入序列。在玉米中, 已经将许多 BAC 或细菌 人工染色体装配成重叠群 ( 重叠的邻接基因片段, 或 “邻接 DNA” ), 它们每个包含玉米基因 组 DNA 的较大插入序列。
“有利等位基因” 是在特定基因座的等位基因, 该基因座赋予或有助于产生农学上 期望的表型, 例如 GLS 耐受性, 或者作为另外一种选择是允许鉴定能够从育种程序或种植 中除去的易感植物的等位基因。标记的有利等位基因是分离有利表型的标记等位基因, 或 者作为另外一种选择, 分离易感植物表型并因此提供鉴定易感病植物的有益效果。染色体 片段的一种有利等位基因形式是包括在位于染色体片段上的一个或多个基因座上的核苷 酸序列的染色体片段, 所述核苷酸序列有助于产生优异的农学性能。
“等位基因频率” 指等位基因存在于个体、 品系、 或一组品系中的基因座上的频率 ( 比例或百分比 )。例如, 就等位基因 “A” 而言, 基因型 “AA” 、 “Aa” 、 或 “aa” 的二倍体个体
分别具有 1.0、 0.5、 或 0.0 的等位基因频率。 人们能够通过平均化来自品系的个体样品的等 位基因频率来估计该品系中的等位基因频率。同样地, 人们能够通过平均化构成种群的品 系的等位基因频率来计算该种群品系中的等位基因频率。 就一组限定数目的个体或品系而 言, 可将所有等位基因频率表示为包含等位基因的个体或品系 ( 或任何其他指定组 ) 的计 数。
当等位基因与性状关联时, 以及当存在的等位基因是期望的性状或性状形式将发 生在包含等位基因的植物中的指示时, 等位基因与性状 “正” 相关。当等位基因与性状关联 时, 以及当存在的等位基因是期望的性状或性状形式将不发生在包含等位基因的植物中的 指示时, 等位基因与性状 “负” 相关。
假如个体在等位基因仅有一种类型的等位基因 ( 例如二倍体个体在两个同源染 色体中的每一个的基因座上具有一拷贝的相同等位基因 ), 则该个体是 “纯合的” 。
假如一种以上的等位基因类型存在于给定基因座上 ( 例如二倍体个体具有两个 不同等位基因中的每一个的一个拷贝 ), 则该个体是 “杂合的” 。
杂合情况的一种特殊情况是其中一个染色体具有一个基因的等位基因而其他染 色体完全缺乏该基因、 基因座、 或区域 -- 换句话说, 具有相对于第一染色体的缺失。这种情 况称为 “半合子的” 。
术语 “同质” 指一组成员在一个或多个特定基因座上具有相同基因型。与之相反, 术语 “异质” 用于指明一组内的个体在一个或多个特定基因座上基因型不同。
“基因座” 是多态核酸、 性状决定子、 基因、 或标记所在的染色体区域。因此, 例如 “基因座” 是物种基因组中的特定染色体位置, 其中能够发现特定基因。与 GLS 耐受性关联 的基因座指示与表型可计量的 GLS 耐受性直接相关的基因组上的区域。
“遗传互补序列” 具有至少一套或倍数性等位基因。例如, 单交种杂合体继承两个 遗传互补序列, 各来自每个自交亲本。
术语 “数量性状基因座” 或 “QTL” 指在至少一种遗传背景下 ( 例如在至少一个育种 种群或子代中 ), 具有与表型性状的差异表达关联的至少一个等位基因的多态基因座。QTL 能够通过单基因机制或多基因机制发挥作用。
术语 “标记” 、 “分子标记” 、 “标记核酸” 、 和 “标记座位” 指核苷酸序列或其编码的产 物 ( 例如蛋白 ), 当鉴定关联的基因座它们时用作参考点。 标记能够来源于基因组核苷酸序 列或表达的核苷酸序列 ( 例如来源于剪接的 RNA 或 cDNA), 或来源于编码的多肽。该术语 也指与标记序列互补或侧接标记序列的核酸序列, 如用作探针或能够扩增标记序列的引物 对的核酸。很多玉米分子标记是本领域已知的, 并且被公布于或得自多个来源, 例如 Maize GDB 因特网资源和 University ofArizona 运营的 Arizona Genomics Institute 因特网资 源。同样地, 已经建立了用于检测分子标记的多种方法。
“多态性” 是 DNA 中的变异, 这种现象太过普遍以至于不仅仅是由于新的突变而产 生 ( 即种群中的发生频率为至少 1% )。在子代中分离的任何差异继承的多态性状 ( 包括 核酸多态性 ) 是潜在的标记。基因组可变性可为任何一种起源, 例如插入、 缺失、 复制、 重复 元件、 点突变、 重组事件、 或转座因子的存在和序列。
“标记探针” 是可用于鉴定标记座位存在与否的核酸序列或分子, 例如与标记座位 序列互补的核酸分子探针。作为另外一种选择, 在某些方面分子探针指能够区别 ( 即基因型 ) 存在于标记座位上的特定等位基因的任何类型的探针。当核酸在溶液中特异性杂交 时, 例如根据 Watson-Crick 碱基配对原则杂交, 核酸是 “互补的” 。
“标记座位” 是可用于追踪存在的第二连接基因座的基因座, 例如编码或有助于表 达表型性状的连接基因座。例如标记座位能够用于监控等位基因在某一基因座的分离, 如 QTL, 它们与标记座位在遗传上或在物理上连锁。
“标记等位基因” 或者 “标记座位的等位基因” 是种群中位于标记座位的多个多态 性核苷酸序列的其中一个, 它就标记座位而言是多态的。在某些方面, 本发明提供与玉米 GLS 耐受性关联的标记座位。期望每个鉴定的标记与有助于产生 GLS 耐受性的遗传元件如 QTL 在物理上和遗传上相近 ( 导致物理和 / 或遗传连锁 )。
“遗传标记” 是种群中的多态核酸, 并且其中可通过一种或多种分析方法检测并区 分出它们的等位基因, 例如 RFLP、 AFLP、 同功酶、 SNP、 SSR 等。该术语也指与基因组序列互 补的核酸序列, 如用作探针的核酸。术语 “遗传标记” 可指任何类型的核酸基的标记, 包括 但不限于限制性片段长度多态性 (Restriction Fragment LengthPolymorphism, RFLP)、 简单重复序列 (Simple Sequence Repeat, SSR)、 随机扩增多态性 DNA(Random Amplified Polymorphic DNA, RAPD)、 酶 切 扩 增 多 态 性 序 列 (Cleaved Amplified Polymorphic Sequence, CAPS)(Rafalski 和 Tingey, 1993, Trends in Genetics 9 : 275-280)、 扩增片段 长度多态性 (Amplified Fragment Length Polymorphism, AFLP)(Vos 等人, 1995, Nucleic Acids Res.23 : 4407-4414)、 单 核 苷 酸 多 态 性 (SingleNucleotide Polymorphism, SNP) (Brookes, 1999, Gene 234 : 177-186)、 序 列 特 异 性 扩 增 区 域 (Sequence Characterized Amplified Region, SCAR)(Paran 和 Michelmore, 1993, Theor.Appl.Genet.85 : 985-993)、 序 列 标 签 位 点 (Sequence Tagged Site, STS)(Onozaki 等 人, 2004, Euphytica138 : 255-262)、 单链构象多态性 (Single Stranded ConformationPolymorphism, SSCP)(Orita 等人, 1989, Proc Natl Acad Sci USA86 : 2766-2770)、 简单重复序列区间 (Inter-Simple Sequence Repeat, ISSR)(Blair 等人, 1999, Theor.Appl.Genet.98 : 780-792)、 反转录转座 子位点间扩增多态性 (Inter-Retrotransposon Amplified Polymorphism, IRAP)、 反转录 转座子微卫星扩增多态性 (Retrotransposon-MicrosatelliteAmplified Polymorphism, REMAP)(Kalendar 等人, 1999, Theor.Appl.Genet.98 : 704-711)、 RNA 裂解产物 ( 如 Lynx 标 记 ) 等。
术语 “插入缺失 (indel)” 指插入或缺失, 其中可将一个品系相对于第二品系称为 插入, 或者可将第二品系相对于第一品系称为具有缺失。
对应于种群成员之间的遗传多态性的标记能够通过本领域已建立的方法进行 检测。这些方法包括例如基于 PCR 的序列特异性扩增方法、 限制性片段长度多态性检测 (RFLP)、 同功酶标记检测、 通过等位基因特异性杂交 (ASH) 进行的多核苷酸多态性检测、 植物基因组的扩增可变序列检测、 自主序列复制检测、 简单重复序列检测 (SSR)、 单核苷酸 多态性检测 (SNP)、 或扩增片段长度多态性检测 (AFLP)。已经建立的方法也已知用于检 测表达序列标签 (EST) 和来源于 EST 序列的 SSR 标记以及随机扩增的多态性 DNA(RAPD)。 经 由 酶 切 扩 增 多 态 性 序 列 (CAPS) 对 基 因 绘 图 的 方 法 也 是 为 人 们 熟 知 的 ( 参 见 例 如 Konieczny&Ausubel, Plant J.4 : 403-10(1993))。
“标记辅助选择” ( 或 MAS) 是一种基于标记基因型进行表型选择的方法。“标记辅助反选择” 是一种通过它将标记基因型用于鉴定植物的方法, 所述植物将 不被选择, 使得它们被从育种程序或种植中去除。
“参比序列” 是用作序列比对基准的限定序列。参比序列通过对基因座上的多个品 系进行基因分型、 以序列比对程序进行核苷酸序列比对 ( 例如 Sequencher)、 然后获取比对 的共有序列来获取。
“基因图谱” 是对给定物种中一个或多个染色体 ( 或连锁群 ) 上的基因座间的基因 连锁关系的描述, 一般以图表或表格形式描述。 该基因座是遗传界标或标记, 并且就每个基 因图谱而言, 标记间的距离通过它们之间的重组频率来测量。 基因图谱是作图的种群、 使用 的标记的类型、 以及不同种群间各个标记的多态性潜力的产物。一个基因图谱与另一个基 因图谱在基因座之间的顺序和遗传距离可能不同。例如, 在内部来源的基因图谱上 ( 本文 也将 Pioneer Hi-Bred 称为 “PHB” ) 的 10cM 大概等同于在 IBM2 2005 neighbors 框图谱 ( 在玉米 GDB 上可用的高分辨率图谱 ) 上的 25-30cM。然而, 使用常见标记的通用框能够将 一个图谱与另一个图谱的信息关联。 本领域的普通技术人员可使用常见标记的框架来鉴定 在各个个体基因图谱上的标记位置和受关注的其他基因座。
“基因作图” 是限定基因座的连锁关系的方法, 该方法通过使用遗传标记、 标记的 种群分离、 以及重组频率的标准遗传原则进行。 “基因图谱位置” 是在相同连锁群上, 相对于 围绕的遗传标记在基因图谱上的位置, 其中能够在给定种群中发现指定标记。 基因组的 “物理图谱” 指绝对距离 ( 例如在碱基对或分离和重叠邻接的基因片段 如重叠群中测量的距离 )。基因组的物理图谱不考虑物理图谱上不同点之间的遗传行为 ( 例如重组频率 )。
“重组” 是在减数分裂期间同源染色体片段的交换, 以此重组连锁的基因 ; 也指此 类交换的产物。
“遗传重组频率” 是两个基因座之间的交换事件 ( 重组 ) 的频率。在标记和 / 或 减数分裂后性状的分离后可观察到重组频率。可将遗传重组频率用厘摩 (cM) 表示, 其中一 cM 是两个遗传标记间的距离, 它们显示 1%的重组频率 ( 即那两个标记间每 100 次细胞分 裂发生交换事件一次 )。
“基因组” 指总 DNA 或整套基因, 由染色体或染色体组携带。
如本文所用, 术语 “连锁” 用于描述一个标记座位与另一个标记座位或一些其他基 因座 ( 例如耐受性基因座 )“关联” 的程度。较接近的两个标记座位位于相同染色体上, 越 是接近, 它们将结合成配子, 并且一起出现的频率将越高 ; 非常接近的标记座位基本上不再 分离, 因为它们之间将出现交换点的可能性非常小。
如本文所用, “连锁平衡” 描述其中两个标记独立地分离的情况, 即, 在子代中随机 分离。认为显示连锁平衡的标记不连锁 ( 无论它们是否位于相同染色体上 )。
术语 “连锁不平衡” 指基因座或性状 ( 或者两者都有 ) 非随机地分离。在任一情 况下, 连锁不平衡意味着相关的基因座沿着一段染色体在物理上足够接近, 以便它们以大 于随机 ( 即非随机 ) 的频率一起分离 ( 在共分离性状的情况下, 产生该性状的基因座彼此 足够接近 )。显示连锁不平衡的标记被认为是连锁的。
连锁不平衡最常见地用量度 r2 测量, 它通过 Hill, W.G. 和 Robertson, A, Theor. 2 Appl.Genet.38 : 226-231(1968) 的公式计算。 当 r = 1 时, 两个标记座位间存在完全的 LD,
意味着标记还未进行重组分离并且具有相同的等位基因频率。r2 值大于 1/3 指示足够强的 LD 将被用于作图 (Ardlie 等人, Nature Reviews Genetics 3 : 299-309(2002))。因此, 当 2 成对标记座位间的 r 值大于或等于 0.33、 0.4、 0.5、 0.6、 0.7、 0.8、 0.9、 或 1.0 时, 等位基因 处于连锁不平衡。
如本文所用, 分子标记和表型间的连锁关系被给定为 “概率” 或 “调整概率” 。概 率值是表型的特定组合和特定标记等位基因随机性存在或不存在的统计学可能性。因此, 概率评分越低, 表型和特性标记将共分离的可能性越大。在某些方面, 认为概率评分是 “显 著的” 或 “不显著的” 。在一些实施方案中, 认为随机分离的概率评分为 0.05(p = 0.05, 或 5%的概率 ) 是共分离的显著性指示。然而, 本发明不受该特定标准的限制, 并且可接受的 概率可以是小于 50% (p = 0.5) 的任何概率。例如, 显著概率可小于 0.25、 小于 0.20、 小于 0.15、 或小于 0.1。
术语 “物理上连锁” 有时用于指示两个基因座例如两个标记座位物理上存在于相 同染色体上。
有利的是, 两个连锁基因座位置接近, 使得减数分裂期间这两个基因座不发生高 频率的同源染色体对间的重组, 例如使得连锁基因座至少约 90 %的时间, 如 91 %、 92 %、 93%、 94%、 95%、 96%、 97%、 98%、 99%、 99.5%、 99.75%、 或更多的时间共分离。 在本专利申请中, 短语 “紧密连锁” 指两个连锁基因座间重组的发生频率为等于或 小于约 10% ( 即在基因图谱上的分离频率不超过 10cM)。 换句话说, 紧密连锁的基因座至少 90%的情况下共分离。当标记座位显示与期望性状 ( 例如病原体耐受性 ) 共分离 ( 连锁 ) 的显著概率时, 它们在本发明中尤其有用。例如在某些方面, 这些标记可被称为连锁 QTL 标 记。在其他方面, 尤其有用的分子标记是那些连锁或紧密连锁的标记。
在某些方面, 能够将连锁表示成任何期望的限制或范围。 例如在一些实施方案中, 两个连锁基因座是被小于 50cM 的图谱单位分开的两个基因座。在其他实施方案中, 连锁基 因座是被小于 40cM 的图谱单位分开的两个基因座。在其他实施方案中, 两个连锁基因座是 被小于 30cM 的图谱单位分开的两个基因座。在其他实施方案中, 两个连锁基因座是被小于 25cM 的图谱单位分开的两个基因座。 在其他实施方案中, 两个连锁基因座是被小于 20cM 的 图谱单位分开的两个基因座。在其他实施方案中, 两个连锁基因座是被小于 15cM 的图谱单 位分开的两个基因座。在某些方面, 有利地是限定连锁的相等范围, 例如介于 10 和 20cM 之 间, 或者介于 10 和 30cM 之间, 或者介于 10 和 40cM 之间。
标记与第二基因座连锁越紧密, 标记越可能变成第二基因座的指示。因此在一个 实施方案中, 紧密连锁的基因座如标记座位和第二基因座显示 10%或更低, 优选约 9%或 更低, 更优选约 8%或更低, 更优选约 7%或更低, 更优选约 6%或更低, 更优选约 5%或更 低, 更优选约 4%或更低, 更优选约 3%或更低, 更优选约 2%或更低的基因座内重组频率。 在高度优选的实施方案中, 关联基因座显示约 1%或更低的重组频率, 例如约 0.75%或更 低, 更优选约 0.5%或更低, 更优选约 0.25%或更低的重组频率。位于相同染色体上, 并且 它们间的距离使得两个基因座间的重组发生频率小于 10 % ( 例如约 9 %、 8 %、 7 %、 6 %、 5%、 4%、 3%、 2 %、 1 %、 0.75%、 0.5 %、 0.25%、 或更低 ) 的两个基因座也称为彼此紧密连 锁。在某些情况下, 两个不同标记能够具有相同的基因图谱坐标。在那种情况下, 两个标记 彼此足够接近使得它们之间的重组发生频率低至无法检测。
当涉及两个遗传因子间的关系时, 如有助于产生耐受性和紧密关联标记的遗传因 子, “相引” 相连锁指示下述状态 : 其中在耐受性基因座上的 “有利” 等位基因与相应连锁的 标记座位的 “有利” 等位基因物理上附连在相同染色体链上。在相引相中, 两个有利等位基 因被继承了该染色体链的子代一起继承。在 “相斥” 相连锁中, 在受关注基因座上的 “有利” 等位基因与在连锁标记座位上的 “不利” 等位基因物理上连锁, 并且两个 “有利” 等位基因 不被一起继承 ( 即这两个基因座彼此 “异相” )。
如本文所用, 术语 “染色体区间” 、 “染色体的区间” 、 “染色体片段” 、 或 “染色体的片 段” 命名基因组 DNA 的邻接线性片段, 它驻留在植物中的单染色体上, 通常定义关于限定染 色体区间的端点的两个标记。位于单染色体间隔上的遗传因子或基因是物理上连锁的。不 特别限定染色体区间的大小。
在某些方面, 例如在本发明的上下文中, 位于单染色体区间中的遗传因子一般也 是遗传连锁的, 通常在例如小于或等于 20cM 或者小于或等于 10cM 的遗传重组距离内。即, 在单染色体区间内的两个遗传因子发生重组的频率小于或等于 20%或 10%。
在一个方面, 本发明的任何标记与等于或小于 50cM 的任何其他标记连锁 ( 遗传上 和物理上 )。 在另一方面, 本发明的任何标记与非常接近 ( 例如距离等于或小于 10cM) 的任 何其他标记紧密连锁 ( 遗传上和物理上 )。在相同染色体上的两个紧密连锁的标记可被彼 此定位于 9、 8、 7、 6、 5、 4、 3、 2、 1、 0.75、 0.5 或 0.25cM 或更小。
短语 “灰叶斑病” 或 “GLS” 指由真菌病原体玉米灰叶斑病菌引起的谷物病害, 它表 征性地生成与叶脉平行的、 长矩形浅灰 - 棕褐色叶片损伤。
玉米植物对 GLS“新赋予的耐受性” 或 “提高的耐受性” 指示玉米植物当导入病害 如诱发剂玉米灰叶斑病菌时其产量和 / 或存活能力或其他相关农学指标较少受影响。耐受 性是一个相对定义, 指示被感染的植物比另一株同样处理的、 更易感的植物玉米产量更高。 即, 与易感玉米植物相比, 在耐受性玉米植物中病害引起的玉米存活率和 / 或产量减少的 程度较低。
技术人员将会知道玉米植物对 GLS 的耐受性相差很大, 能够提供一系列耐受性较 高至耐受性较低的表型, 并且耐受性取决于感染的严重程度能够发生变化。 然而, 通过简单 的观察, 技术人员能测定不同植物、 植物品系或植物家族对 GLS 的相对耐受性或易感性, 此 外也将认识到 “耐受性” 的表型等级。例如可使用 1 至 9 的视觉评分指示 GLS 耐受性。评 分越高指示耐受性越强。仅当在测量实验中存在足够的选择压力时, 数据将被收集。
在本发明上下文中的术语 “杂交的” 或 “杂交” 指经由授粉产生子代的配子融合 ( 例如细胞、 种子或植物 )。该术语包括有性杂交 ( 一株植物被另一株植物授粉 ) 和自交 ( 自花授粉, 例如当花粉和胚珠来自相同植物时 )。术语 “杂交” 指经由授粉产生子代的配 子融合行为。
术语 “渗入” 指基因座的期望等位基因从一种遗传背景传递到另一种遗传背景的 现象。例如在特定基因座的期望等位基因通过渗入、 经由相同物种的两个亲本间的有性杂 交可被传递到至少一个子代, 其中至少一个亲本在其基因组中具有期望的等位基因。作为 另外一种选择, 例如等位基因的传递能够通过两个供体基因组之间的重组而发生, 例如在 融合原生质体中, 其中至少其中一个供体原生质体在其基因组中具有期望的等位基因。期 望的等位基因可为例如标记的选择等位基因、 QTL、 转基因等。 在任何情况下, 能够将包含期望等位基因的子代与具有期望遗传背景的品系反复回交并选择期望的等位基因以产生固 定在选择遗传背景中的等位基因。
当重复 “基因渗入” 过程两次或更多次时, 该过程常被称为 “回交” 。
“回交转化体” 是通过回交将某一基因座或性状渗入某一品种的产物。
“回交” 指其中杂交子代反复与其中一个亲本回交的过程。在一个回交方案中, “供体” 亲本指具有将被渗入的期望基因或基因座的亲本植物。 “受体” 亲本 ( 使用一次或 多次 ) 或 “轮回” 亲本 ( 使用两次或多次 ) 指将基因或基因座渗入其中的亲本植物。例 如 参 见 Ragot, M. 等 人 (1995)Marker-assisted backcrossing : a practical example, inTechniques et Utilisations des Marqueurs Moleculaires Les Colloques, 第 72 卷 第 45-56 页, 以 及 Openshaw 等 人, (1994)Marker-assisted Selectionin Backcross Breeding, Analysis of Molecular Marker Data, 第 41-43 页。初始杂交产生 F1 代 ; 然后 术语 “BC1” 指轮回亲本的第二次使用, “BC2” 指轮回亲本的第三次使用等等。
“品系” 或 “品种” 是一组具有相同亲本的个体, 它们一般是某种程度的自交体, 并 且一般在大多数基因座是纯合的和同质的 ( 同基因的或接近同基因的 )。 “亚系” 指子代的 自交体亚群, 它们与相同祖先来源的其他相似自交体亚群遗传上不同。
“祖先品系” 是用作基因来源的亲本品系, 例如用于开发优良品系。 “祖先种群” 是 已经产生大部分基因变异的一组祖先, 这些基因变异被用于开发优良品系。 “子代” 是祖先 的子代, 并且可通过多代育种从它们的祖先分离得到。 例如优良品系是它们的祖先的子代。 “谱系结构” 规定了子代和产生该子代的各个祖先的关系。谱系结构能够跨越一代或多代, 描述子代及其父母亲本、 祖父母亲本、 曾祖父母亲本等的关系。
“优良品系” 或 “优良品种” 是农学上优异的品系, 该品系由多代育种以及选择优异 农学特性产生。多个优良品系对玉米育种领域的技术人员来说是可用的和已知的。 “优良 种群” 是一类优良个体或品系, 根据给定作物物种如玉米的农学上优异的基因型, 它们将可 用于代表技术发展水平。同样的, “优良种质” 或优良品种的种质是农学上优异的种质, 通常 来源于和 / 或能够生成具有优异农学性能的植物, 如现有的或新开发的优良玉米品系。
与之相反, “外来玉米品种” 或 “外来玉米种质” 是来源于不属于可利用优良玉米品 系或品种的种质的玉米的品种或种质。 在杂交发生在两个玉米植株或品种的种质之间的情 况下, 外来种质的子代不与它杂交的优良种质密切相关。最常见的是外来种质不来源于任 何已知的玉米优良品系, 而是选择将新遗传因子 ( 通常新等位基因 ) 导入育种程序。
在核酸扩增的情况下术语 “扩增” 是其中产生附加拷贝的选择核酸 ( 或其转录 形式 ) 的任何过程。一般的扩增方法包括基于多种聚合酶的复制方法包括聚合酶链反应 (PCR)、 连接酶介导的方法如连接酶链反应 (LCR)、 以及基于 RNA 聚合酶的扩增 ( 例如通过转 录 ) 方法。
“扩增子” 是被扩增的核酸, 例如使用任何可用的扩增方法 ( 例如 PCR、 LCR、 转录 等 ) 通过扩增模板核酸制备的核酸。
“基因组学核酸” 是按顺序对应于细胞中的可遗传核酸的核酸。常见实例包括核基 因组 DNA 及其扩增子。在某些情况下基因组核酸不同于剪接 RNA 或对应的 cDNA, 因为剪接 RNA 或 cDNA 通过例如剪接机制进行处理以除去内含子。基因组核酸任选地包含非转录的 ( 例如染色体结构序列、 启动子区、 或增强子区 ) 和 / 或非翻译的序列 ( 例如内含子 ), 然而剪接 RNA/cDNA 通常不具备非转录的序列或内含子。 “模板核酸” 是在扩增反应 ( 例如基于 聚合酶的扩增反应如 PCR、 连接酶介导的扩增反应如 LCR、 转录反应等 ) 中起到模板作用的 核酸。模板核酸可为基因组起源的, 或者可来源于表达序列如 cDNA 或 EST。
“核苷酸序列” 、 “多核苷酸” 、 “核酸序列” 、 和 “核酸片段” 可互换使用, 并且指作为单 链或双链的 RNA 或 DNA 聚合物, 任选含有合成的、 非天然的或改变的核苷酸碱基。 “核苷酸” 是构成 DNA 或 RNA 聚合物的单体单元, 它由嘌呤或嘧啶碱基、 戊糖、 和磷酸基组成。核苷酸 ( 通常以它们的 5′单磷酸形式存在 ) 通过如下它们的单个字母名称来指代 : “A” 为腺苷酸 或脱氧腺苷酸 ( 分别对应 RNA 或 DNA), “C” 表示胞苷酸或脱氧胞苷酸, “G” 表示鸟苷酸或脱 氧鸟苷酸, “U” 表示尿苷酸, “T” 表示脱氧胸苷酸, “R” 表示嘌呤 (A 或 G), “Y” 表示嘧啶 (C 或 T), “K” 表示 G 或 T, “H” 表示 A 或 C 或 T, “I” 表示肌苷, 并且 “N” 表示任何核苷酸。
“外源核酸” 指针对序列、 基因组位置、 或两者的, 不是原产于指定体系 ( 例如种质、 植物、 或品种 ) 的核酸。如本文所用, 应用于多核苷酸或多肽的术语 “外源的” 或 “异源的” 通常指已经被人工供给生物系统 ( 例如研究的植物细胞、 植物基因、 特定植物物种或品种 或植物染色体 ) 的分子, 并且所述分子不是该特定生物系统自有的。该术语能够指示从除 天然存在来源之外的来源获取的有关材料, 或者能够指具有非天然构型、 遗传位置或部件 排列的分子。 与之相反, 例如 “天然的” 或 “内源的” 基因是不包含由除染色体或其他遗传因子 之外的来源编码的核酸元件的基因, 在所述染色体或其他遗传因子上内源基因通常天然存 在。内源基因、 转录物或多肽由其天然染色体座位编码, 并且不被人工供给于细胞。
关于核酸或多肽的术语 “重组体” 指示该材料 ( 例如重组核酸、 基因、 多核苷酸、 或 多肽 ) 已经被人工干预改变。重组分子部分的排列一般不是天然构型, 或者重组多核苷酸 或多肽的一级序列已经在某些方面被操纵了。可在材料的天然环境或状态下、 或使其脱离 天然环境或状态, 对所述材料进行改变以产生重组材料。例如如果在获取天然存在核酸的 细胞中通过人工干预使得天然存在的核酸发生变化, 或者转录出该核酸的 DNA 已经发生了 变化, 该核苷酸变成重组核酸。如果核苷酸序列已经从其天然环境中移除并被克隆进任何 类型的人工核酸载体中, 该基因序列开放阅读框是重组体。制备重组分子尤其是重组核酸 分子的规程和试剂是本领域常见的和常规的。在一个实施方案中, 可制备人工染色体并通 过本领域已知的任何方法将其插入玉米植物中 ( 例如直接递送方法如 PEG 诱导的 DNA 摄 入、 原生质体融合、 显微注射、 电穿孔、 以及基因枪轰击 )。人工染色体是一条可稳定复制并 沿着内源染色体分离的 DNA。它具有容纳并表达该处插入的异源基因的能力。将异源 DNA 整合到大复制区域 ( 着丝粒的主要复制起始位点 ) 中或与其足够接近, 启动兆碱基大小的 染色体片段的大规模扩增, 这导致重新形成染色体。参见例如美国专利 6,077,697, 该专利 以引用方式并入本文。
术语重组体也可指包含重组材料的生物, 如包含重组核酸的植物被认为是重组植 物。在一些实施方案中, 重组生物体是转基因生物体。
当涉及将异源或外源核酸转位到细胞中时, 术语 “导入” 指使用任何方法将核酸掺 入细胞。该术语包括核酸导入方法如 “转染” 、 “转化” 、 和 “转导” 。
如本文所用, 术语 “载体” 用于指将核酸片段转运到细胞中的多核苷酸或其他分 子。术语 “运载体” 有时与 “载体” 互换使用。载体任选地包含介导载体维持和使其发挥预
期用途的部分 ( 例如复制必需的序列、 赋予药物或抗生素抗性的基因、 多克隆位点、 或者可 操作地连接的使得克隆基因能够表达的启动子 / 增强子元件 )。载体通常来源于质粒、 噬 菌体、 或者植物或动物病毒。 “克隆载体” 或 “穿梭载体” 或 “亚克隆载体” 包含可操作地连 接的部分, 所述部分有利于亚克隆步骤 ( 例如包含多个限制性内切核酸酶位点的多克隆位 点 )。
如本文所用, 术语 “表达载体” 指包含可操作地连接的多核苷酸序列的载体, 所述 多核苷酸序列有利于在特定宿主生物中表达编码序列 ( 例如细菌表达载体或植物表达载 体 )。有利于在原核生物中表达的多核苷酸序列通常包括例如启动子、 操纵子 ( 任选的 )、 和核糖体结合位点、 通常还包括其他序列。真核细胞能够使用启动子、 增强子、 终止和聚腺 苷酸化信号、 以及一般不同于原核生物使用的那些序列的其他序列。
术语 “转基因植物” 指在其细胞中包含异源多核苷酸的植物。异源多核苷酸一般 被稳定地整合进基因组中, 使得该多核苷酸传递至连续的世代。异源多核苷酸可单独地或 作为重组表达盒的部分整合进基因组中。本文所用的 “转基因” 包括因异源核酸存在而已 经改变了基因型的任何细胞、 细胞系、 愈伤组织、 组织、 植物部分或植物, 包括初始进行此类 改变的转基因以及从初始的转基因生物或细胞通过杂交或无性繁殖产生的那些转基因生 物或细胞。如本文所用, 术语 “转基因” 不涵盖通过常规植物育种方法 ( 如杂交 ) 或通过诸 如随机异花受精、 非重组病毒感染、 非重组细菌转化、 非重组转座或自发突变之类的自然发 生事件导致的基因组 ( 染色体基因组或染色体外基因组 ) 改变。 “定位克隆” 是一种克隆方法, 其中靶核酸通过它与标记核酸的基因组接近程度被 鉴定并分离。 例如基因组核酸克隆能够包括部分或全部两个更多的彼此紧密连锁的染色体 区域。如果可使用标记从基因组文库中鉴定基因组核酸克隆, 能够使用标准方法如亚克隆 或测序来鉴定和 / 或分离靠近标记的克隆的亚序列。
当指定核酸使用给定核酸的序列进行构建时, 或者当指定核酸使用给定核酸进行 构建时, 该指定核酸 “来源于” 给定核酸。例如, cDNA 或 EST 来源于表达 mRNA。
术语 “遗传因子” 或 “基因” 指具有功能意义的 DNA 的可遗传序列, 即基因组序列。 也可使用术语 “基因” 指例如 cDNA 和 / 或由基因组序列编码的 mRNA, 以及该基因组序列。
术语 “基因型” 是个体 ( 或个体组 ) 在一个或多个基因座上的基因组成, 它与可观 察到的性状 ( 表型 ) 形成对照。基因型由一个或多个已知基因座的等位基因限定, 个体已 经从其亲本中继承了所述基因座。术语基因型可被用于指个体在单个基因座上的基因组 成, 在多个基因座上的基因组成, 或者更一般的, 术语基因型可被用于指个体在其基因组中 的所有基因的基因组成。
“单倍型” 是个体在多个基因座上的基因型。单倍型描述的基因座通常是物理上和 遗传上连锁的, 即在相同染色体片段上。术语 “单倍型” 可指在特定基因座的多态性, 如单 标记座位, 或者在沿染色体片段的多个基因座上的多态性。前者也可被称为 “标记单倍型” 或 “标记等位基因” , 而后者可被称为 “远程单倍型” 。
术语 “表型” 或 “表型性状” 或 “性状” 指生物的一个或多个性状。表型可用肉眼或 者本领域已知的任何其他评估手段观察到, 例如显微镜法、 生物化学分析、 基因组分析、 或 用于特定病害耐受性的检测分析法。 在某些情况下, 表型由单个基因或基因座直接控制, 即 “单基因性状” 。在其他情况下, 表型是若干个基因的结果。
“分子表型” 是在一组 ( 一个或多个 ) 分子水平上可检测的表型。此类分子可为核 酸如基因组 DNA 或 RNA、 蛋白、 或代谢物。例如, 分子表型可为一种或多种基因产物的表达 谱, 例如在植物发育的特定阶段, 响应于环境条件或胁迫等的基因产物。表达谱通常在 RNA 或蛋白水平上评估, 例如在核酸阵列或 “芯片” 上评估或者使用抗体或其他结合蛋白进行评 估。
“代表性样品” 是涵盖采样种群的相关组合物和特性的样品。
“着丝粒” 是在每个染色体上的单个位点, 用于在有丝分裂和减数分裂过程中的着 丝粒装配和正确的染色体分离。
术语 “产量” 指具有商业价值的特定植物产品每单位面积的产量。例如玉米产量 一般以每季每英亩种子蒲式耳数或每季每公顷种子公吨数来测量。 产量受遗传和环境因素 的影响。 “农学” 、 “农学特性” 、 和 “农学性能” 指给定植物品种的性状 ( 以及产生性状的遗 传因子 ), 所述性状有助于经过生长期的产量。 单个农学特性包括出苗活力、 营养势、 胁迫耐 受性、 病害抗性或耐受性、 除草剂抗性、 发生分枝、 开花、 结实率、 种子大小、 种子密度、 抗倒 伏性、 脱粒率等。因此产量是所有农学特性的最终结果。
一 “组” 标记或探针指标记或探针、 或由此获得的数据的一个集合或组, 它们用于 常见目的, 例如鉴定具有期望性状的玉米植物 ( 例如 GLS 耐受性 )。很多情况下, 对应于标 记或探针的数据、 或者来源于它们的应用的数据, 被储存在电子介质中。 当一组的每个成员 具有针对特定目的的效用时, 从包括一些但不是全部标记的所述组以及亚组中选择的单个 标记对达到特定目的也是有效的。
“遗传特征图” 是对特定性状或基因座的序列特征的鉴定和表征。
“查找表” 是将一种形式的数据与另一种形式的数据关联, 或者将一种或多种形式 的数据与该数据相关的预测结果关联的表。例如, 查找表能够包括等位基因数据和预测的 包含给定等位基因的植物可能显示的性状间的相关性。这些表可为并且通常为多维的, 例 如同时考虑多个等位基因并且也任选地考虑其他因素, 例如遗传背景如进行性状预测。
“重叠群”指来源于单一基因来源的一组重叠 DNA 片段。重叠群图谱描述了 代表延长染色体片段的重叠群的连锁文库的相对顺序。 “公开重叠群”是公开可用的 一组重叠 DNA 片段, 它们来源于单一基因来源。公开来源的实例包括 Maize Mapping Project(University ofMissouri-Columbia、 University of Georgia、 和 University of Arizona)、 Arizona Genomics Institute、 MaizeGDB 网站、 以及 Maize Sequence 网站。序 列比对或重叠群也可用于查找本文列出的特定标记的上游或下游序列。 这些新序列靠近本 文所述的标记, 然后被用于发现和开发功能等同的标记。例如将不同的物理和 / 或基因图 谱进行比对以定位等同标记, 所述标记不在所述公开中描述, 但是位于相似区域内。 这些图 谱可在玉米物种中, 或者甚至包括已经与玉米进行了遗传上或物理上的比对的其他物种, 如大米、 小麦、 大麦、 或高粱。
可用 LASARGENE 生物信息计算包 (DNASTAR Inc., Madison, WI) 的 Megalign 程序 进行序列比对和相似度百分比计算。用带默认参数 ( 空位罚分= 10, 空位长度罚分= 10) 的 Clustal 比对方法 (Higgins 和 Sharp, CABIOS 5 : 151-153(1989)) 进行序列的多重比对。 用 Clustal 方法进行成对比对和蛋白质序列的百分比同一性计算的默认参数为 KTUPLE = 1、 空位罚分= 3、 窗口 (WINDOW) = 5 和 DIAGONALSSAVED = 5。就核酸而言, 这些参数为空位罚分= 10, 空位长度罚分= 10, KTUPLE = 2, 空位罚分= 5, 窗口= 4, 和 DIAGONALS SAVED = 4。氨基酸或核苷酸序列的 “主要部分” 包含足够的多肽的氨基酸序列或基因的核苷酸 序列以提供该多肽或基因的推定鉴定, 所述序列可由本领域技术人员来人工评估, 或使用 计算机自动化的序列比较和鉴定工具进行评估, 所述工具使用算法如 BLAST(Altschul, S.F. 等 人, J.Mol.Biol.215 : 403-410(1993)) 和 Gapped Blast(Altschul, S.F. 等 人, Nucleic AcidsRes.25 : 3389-3402(1997))。可使用 BLASTN 程序进行 BLAST 核苷酸搜索, 得分= 100, 字长= 12, 以获取与编码本实施方案的蛋白的核苷酸序列同源的核苷酸序列。 可使用 BLASTX 程序进行 BLAST 蛋白搜索, 得分= 50, 字长= 3, 以获取与本实施方案的多 肽同源的氨基酸序列。为了获取用于比对目的的空位比对, 可利用 Gapped BLAST(BLAST 2.0), 如 Altschul 等人 (1997)Nucleic Acids Res.25 : 3389. 作为另外一种选择, 可使用 PSI-BLAST(BLAST 2.0) 进行重复搜索, 它检测分子间的较远关系。参见 Altschul 等人 (1997) 同上。当利用 BLAST、 Gapped BLAST、 PSI-BLAST 时, 可使用相应程序 ( 例如用于核 苷酸序列的 BLASTN, 用于蛋白的 BLASTX) 的默认参数。也可通过检查进行手动比对。
“电脑可读介质” 是一种信息存储介质, 使用电脑可用的或定制的接口可对之进行 存取利用。实例包括存储器 ( 例如 ROM、 RAM、 或闪存 )、 光存储介质 ( 例如 CD-ROM)、 磁存储 介质 ( 电脑硬盘、 软盘等 )、 穿孔卡片、 以及许多其他可商购获得的存储介质。 信息可在受关 注的系统和电脑之间传递, 或者传递到电脑及用于存储或获取存储信息的电脑可读介质上 或者从中获取信息。这种传递可为电传递, 或者可通过其他可用方法如 IR 连接、 无线连接 等进行。
“系统说明书” 是可被系统部分或完全执行的说明书。说明书通常以系统软件形式 存在。
附图和序列简述
根据以下的详细描述和附图以及序列表, 可更全面地理解本发明, 以下的详细描 述和附图以及序列表形成本申请的一部分。此序列表中以单个字母表示核苷酸, 以三字母 表示氨基酸, 如 Nucleic AcidsResearch 13 : 3021-3030(1985) 和 Biochemical Journal 219(No.2) : 345-373(1984) 所描述的 IUPAC-IUBMB 标准中所规定, 它们以引用方式全文并 入本文。用于核苷酸和氨基酸序列数据的符号和格式遵循在 37C.F.R.§1.822 中所列出的 规定。
图 1 示出在 IBM2 2004 neighbors 染色体 4 图谱上的 PHJEP GLSQTL 的最终位置。 距离单位为 cM。
图 2 示出在第二轮作图后, 在 IBM2 2004 neighbors 染色体 4 图谱上的 GLS QTL 的特写图。在第二轮 QTL 作图中使用加框的标记。箭头显示在该第二轮 QTL 作图后的 QTL 区域。黑色框示出精细作图后的最终 QTL 位置。
图 3 示出精细作图后的 GLS QTL 图谱位置。
图 4A-F 示出序列 BAC 的物理图谱排列 ( 获取自 Maize GenomeBrowser, 它在因特 网上公开可用 ; 网址为 http://www.maizesequence.org), 所述序列 BAC 在包含 GLS QTL 的 染色体 4 区域中。
图 5 示出 GLS QTL 渗入到 PHN46 中的过程。深灰色指示 PH14T 起点。水平线指示 PHN46 起点。对角线指示重组区域。*UMC1299 位置来自 IBM2 Neighbors 框图谱 -- 与物理图谱位置一致。
图 6 示出 PHN46( 左 )、 PH14T( 中 ) 和 PHJEP( 右 ) 中的 GLS 病害抗性水平。
图 7 示出以下杂交体的 GLS 病害抗性水平 : A) 具有 QTL 渗入的 Pioneer 杂交体, 它通过杂交自交体 PHP38 和 PHJEP 制备, 和 B) 不具有 QTL 渗入的 Pioneer 杂交体 3394。
图 8 示出 GLS QTL 进一步渗入到优良材料中的过程。深灰色指示 PH14T 起点。水 平线指示 PHN46 起点。对角线指示 PHJEP 和新的优良种质之间的重组。圆点指示 PH14T 和 PHN46 之间的重组。无阴影部分指示新的优良种质 PHVNV、 PHEHG、 PHW3Y、 PHEWB、 或 PHWRC。
图 9 提供基因组和 SSR 标记的列表, 包括那些证明与 GLS 耐受性表型连锁不平衡 的标记 ( 从基因图谱中直接或通过外推法得到 )。该表提供用于 SSR 标记座位基因型分析 的左和右 PCR 引物序列。也显示在 SSR 的串联重复元件中的核苷酸数目。
图 10 提供列出证明与 GLS 耐受性表型连锁不平衡的 SNP 标记。该表提供用于生 成包含 SNP 的扩增子的 PCR 引物的序列。
序列描述以及关联的序列表遵循如 37 C.F R.§1.821-1.825 中所列出的管理专 利申请中的核苷酸和 / 或氨基酸序列公开的规则。序列表包含核苷酸序列字符的单字母 码以及氨基酸的三字母码, 如遵照 IUPAC-IUBMB 标准所定义的, 该标准在 Nucleic Acids Res.13 : 3021-3030(1985) 以 及 在 Biochemical J.219(2) : 345-373(1984) 中 描 述, 这两 篇文献以引用的方式并入本文。用于核苷酸和氨基酸序列数据的符号和格式遵循在 37C. F.R.§1.822 中列出的规则。
SEQ ID NO : 1 和 SEQ ID NO : 2 是设计用于扩增 BAC 末端 bacm2.pk027.h10.f 的引 物。
SEQ ID NO : 3 和 SEQ ID NO : 4 是设计用于扩增 BAC 末端 bacm.pk098.d7 的引物。
SEQ ID NO : 5 和 SEQ ID NO : 6 是设计用于扩增 BAC 末端 bacm.pk106.j3 的引物。
SEQ ID NO : 7 和 SEQ ID NO : 8 是设计用于扩增 BAC 末端 bacm.pk018.h15 的引物。
SEQ ID NO : 9 和 SEQ ID NO : 10 是设计用于扩增 BAC 末端 bacm.pk040.o17 的引物。 该引物对代表本文称为 PHM 00045 的 CAPs 标记。
SEQ ID NO : 11 和 SEQ ID NO : 12 是设计用于扩增 BAC 末端 bacm2.pk065.b22.f 的 引物。
SEQ ID NO : 13 和 SEQ ID NO : 14 是设计用于扩增 BAC 末端 bacb.pk0333.o19 的引 物。该引物对代表本文称为 PHM 00043 的 CAPs 标记。
SEQ ID NO : 15 和 SEQ ID NO : 16 是设计用于扩增 BAC 末端 bacc.pk0267.m12.f 的 引物。
SEQ ID NO : 17 和 SEQ ID NO : 18 是 设 计 用 于 扩 增 EST 横 穿 (overgo) 探 针 cl33021_1 的引物。
SEQ ID NO : 19 和 SEQ ID NO : 20 是设计用于扩增 BAC 末端 bacb.pk0241.h17.f 的 引物。
SEQ ID NO : 21 和 SEQ ID NO : 22 是设计用于扩增克隆 chp2.pk0007.d2 的引物。
SEQ ID NO : 23 和 SEQ ID NO : 24 是设计用于扩增 BAC 末端 bacc.pk0530.f13.f 的 引物。
SEQ ID NO : 25 和 SEQ ID NO : 26 是设计用于克隆 p0094.csstg88 的引物。SEQ ID NO : 27 和 SEQ ID NO : 28 是设计用于扩增 BAC 末端 bacb.pk0269.n19 的引 SEQ ID NO : 29 和 SEQ ID NO : 30 是设计用于扩增 BAC 末端 bacb.pk0009.b21.f 的 SEQ ID NO : 31 和 SEQ ID NO : 32 是设计用于扩增 BAC 末端 bacb.pk0117.i09.f 的 SEQ ID NO : 33 和 SEQ ID NO : 34 是设计用于扩增 BAC 末端 bacc.pk0280.n12 的引 SEQ ID NO : 35 和 SEQ ID NO : 36 是设计用于扩增 BAC 末端 bacb.pk0219.j20 的引 SEQ ID NO : 37 和 SEQ ID NO : 38 是设计用于扩增 BAC 末端 bacc.pk0132.b16.f 的 SEQ ID NO : 39 和 SEQ ID NO : 40 是设计用于扩增 BAC 末端 bacb.pk0221.o22 的引 SEQ ID NO : 41 和 SEQ ID NO : 42 是设计用于扩增 BAC 末端 bacb.pk0544.j18 的引 SEQ ID NO : 43 和 SEQ ID NO : 44 是设计用于扩增 BAC 末端 bacb.pk0540.c18.f 的物。
引物。
引物。
物。
物。
引物。
物。
物。
引物。 SEQ ID NO : 45 和 SEQ ID NO : 46 是设计用于扩增 BAC 末端 bacm.pk022.b8 的引物。 该引物对代表本文称为 PHM 00049 的 CAPs 标记。
SEQ ID NO : 47 和 SEQ ID NO : 48 是用于标记座位 PHM 7245 的引物。
SEQ ID NO : 49 是分类为 LRR 样蛋白激酶型的推定 R 基因的注解核苷酸序列。
SEQ ID NO : 50 是由 SEQ ID NO : 49 编码的蛋白的氨基酸序列。
SEQ ID NO : 51 是 PHM 15534-13 正向引物的序列。
SEQ ID NO : 52 是 PHM 15534-13 反向引物的序列。
SEQ ID NO : 53 是 PHM 15534-13 探针 1 的序列。
SEQ ID NO : 54 是 PHM 15534-13 探针 2 的序列。
SEQ ID NO : 55 是 PHM 15534 参比序列的序列。
SEQ ID NO : 56 是 PHM 04694-10 正向引物的序列。
SEQ ID NO : 57 是 PHM 04694-10 反向引物的序列。
SEQ ID NO : 58 是 PHM 04694-10 探针 1 的序列。
SEQ ID NO : 59 是 PHM 04694-10 探针 2 的序列。
SEQ ID NO : 60 是 PHM 04694-10 参比序列的序列。
SEQ ID NO : 61 是 PHM 01811-32 正向引物的序列。
SEQ ID NO : 62 是 PHM 01811-32 反向引物的序列。
SEQ ID NO : 63 是 PHM 01811-32 探针 1 的序列。
SEQ ID NO : 64 是 PHM 01811-32 探针 2 的序列。
SEQ ID NO : 65 是 PHM 01811-32 参比序列的序列。
SEQ ID NO : 66 是 PHM 01963-15 正向引物的序列。
SEQ ID NO : 67 是 PHM 01963-15 反向引物的序列。 SEQ ID NO : 68 是 PHM 01963-15 探针 1 的序列。 SEQ ID NO : 69 是 PHM 01963-15 探针 2 的序列。 SEQ ID NO : 70 是 PHM 01963-15 参比序列的序列。 SEQ ID NO : 71 是 PHM 01963-22 正向引物的序列。 SEQ ID NO : 72 是 PHM 01963-22 反向引物的序列。 SEQ ID NO : 73 是 PHM 01963-22 探针 1 的序列。 SEQ ID NO : 74 是 PHM 01963-22 探针 2 的序列。 SEQ ID NO : 75 是 PHM 01963-22 参比序列的序列。 SEQ ID NO : 76 是 PHM 05013-12 正向引物的序列。 SEQ ID NO : 77 是 PHM 05013-12 反向引物的序列。 SEQ ID NO : 78 是 PHM 05013-12 探针 1 的序列。 SEQ ID NO : 79 是 PHM 05013-12 探针 2 的序列。 SEQ ID NO : 80 是 PHM 05013-12 参比序列的序列。 SEQ ID NO : 81 是 PHM 00586-10 正向引物的序列。 SEQ ID NO : 82 是 PHM 00586-10 反向引物的序列。 SEQ ID NO : 83 是 PHM 00586-10 探针 1 的序列。 SEQ ID NO : 84 是 PHM 00586-10 探针 2 的序列。 SEQ ID NO : 85 是 PHM 00586-10 参比序列的序列。 SEQ ID NO : 86 是标记 bnlg1755 的左引物的序列。 SEQ ID NO : 87 是标记 bnlg1755 的右引物的序列。 SEQ ID NO : 88 是标记 umc156a 的左引物的序列。 SEQ ID NO : 89 是标记 umc156a 的右引物的序列。 SEQ ID NO : 90 是标记 umc1142 的左引物的序列。 SEQ ID NO : 91 是标记 umc1142 的右引物的序列。 SEQ ID NO : 92 是标记 umc1346 的左引物的序列。 SEQ ID NO : 93 是标记 umc1346 的右引物的序列。 SEQ ID NO : 94 是标记 umc1702 的左引物的序列。 SEQ ID NO : 95 是标记 umc1702 的右引物的序列。 SEQ ID NO : 96 是标记 mmc0371 的左引物的序列。 SEQ ID NO : 97 是标记 mmc0371 的右引物的序列。 SEQ ID NO : 98 是标记 bnlg1621a 的左引物的序列。 SEQ ID NO : 99 是标记 bnlg1621a 的右引物的序列。 SEQ ID NO : 100 是标记 umc1299 的左引物的序列。 SEQ ID NO : 101 是标记 umc1299 的右引物的序列。 SEQ ID NO : 102 是 PHM 00045 参比序列的序列。 SEQ ID NO : 103 是 PHM 00049 参比序列的序列。 发明详述 使用 MAS 鉴定并选择显示 GLS 耐受性的玉米植物能够提供有效的和环境友好的方法以减少这种病害引起的损失。本发明提供玉米标记座位, 所述标记座位显示统计意义上 显著性的 GLS 耐受性共分离。能够在标记辅助的玉米育种程序中检测这些基因座或附加的 连锁基因座以制备耐受性植物或具有改善的 GLS 耐受性的植物。本文鉴定的连锁 SSR 和 SNP 标记在下文和图中提供。这些标记包括 PHM 15534、 PHM04694、 PHM 01811、 PHM 01963、 PHM 05013、 和 PHM 00586( 图 10)。
每个 SSR 型标记显示多个等位基因, 所述等位基因可被视为不同大小的 PCR 扩增 子。用于生成 SSR 标记扩增子的 PCR 引物在图 9 中提供。SNP 型标记的等位基因使用等位 基因特异性的杂交规程进行测定, 该规程是本领域已知的。用于扩增 SNP 结构域的 PCR 引 物在图 10 中提供
本领域认识到与 QTL 标记连锁的任何其他标记 ( 例如病害耐受性标记 ) 也发现用 于相同目的。提供了与本文所述的病害耐受性标记连锁的附加标记的实例。例如可从表 3 提供的紧密连锁中测定连锁标记。然而并不意味着本发明使用的连锁标记受表 3 所述的那 些标记的限制。
本发明也提供与 GLS 耐受性关联的染色体 QTL 区间。 这些区间位于连锁群 4 上。 将 位于这些区间内的任何标记用作 GLS 耐受性标记。 这些区间包括 : (i)BNLG1755 和 UMC1299, (ii)BNLG1755 和 BNLG1621A, (iii)BNLG1755 和 MMC0371, (iv)BNLG1755 和 UMC1702, (v) UMC156A 和 UMC1299, (vi)UMC156A 和 BNLG1621A, (vii)UMC156A 和 MMC0371, (viii)UMC156A 和 UMC1702, (ix)UMC1142 和 UMC1299, (x)UMC1142 和 BNLG1621A, (xi)UMC1142 和 MMC0371, (xii)UMC1142 和 UMC1702, (xiii)UMC1346 和 UMC1299, (xiv)UMC1346 和 BNLG1621A, (xv) UMC1346 和 MMC0371, 以及 (xvi)UMC1346 和 UMC1702。
本发明还提供由 PHM 00043(SEQ ID NO : 102) 和 PHM 00049(SEQID NO : 103) 限定 并包括它们的邻接 DNA 区域, 其中包含与 GLS 耐受性共分离的标记座位 ( 图 4)。可使用位 于 DNA 邻接片段内的任何标记座位作为 GLS 耐受性标记, 所述 DNA 邻接片段位于以下两个 核苷酸序列之间并包括它们 : SEQ ID NO : 102, 或者基于 Clustal V 比对方法与 SEQ ID NO : 102 具有 95%同一性的核苷酸序列, 以及 SEQ IDNO : 103, 或者基于 Clustal V 比对方法与 SEQ ID NO : 103 具有 95%同一性的核苷酸序列。
鉴定携带优选耐受性标记座位的等位基因的玉米植物或种质的方法是本发明的 一个特征。 在这些方法中, 取决于标记座位的类型, 可使用多种标记检测规程中的任何一种 来鉴定在标记座位的等位基因。一般检测方法包括 ASH、 SSR 检测、 RFLP 分析、 以及多种其 他方法。
虽然特定标记等位基因可显示与病害耐受性表型或易感性表型的共分离, 但重要 的是注意到标记座位是导致耐受性或易感性的 QTL 基因座非必需的部分。例如不需要标记 多核苷酸序列是赋予病害耐受性的基因的部分 ( 例如是基因开放阅读框的部分 )。在耐受 性或易感性等位基因从中起源的祖先玉米品系中, 特定标记等位基因与耐受性或易感性表 型的关联是由于标记等位基因和 QTL 耐受性或易感性等位基因之间的最初 “相引” 相连锁。 最后通过反复重组, 标记和 QTL 基因座间的交换事件能够改变这种取向。正是因为这个原 因, 有利标记等位基因可根据存在于耐受性亲本中的相连锁发生改变, 所述耐受性亲本用 于制备分离种群。这不改变可使用遗传标记监控表型分离的事实。它仅仅改变在给定分离 种群中认为哪个标记等位基因是有利的。鉴定包含与改善耐受性关联的标记等位基因的玉米植物或种质提供了进行玉米 标记辅助选择的基础。选择包含有利标记等位基因的玉米植物, 而不选择包含与耐受性负 相关的标记等位基因的玉米植物。可将期望的标记等位基因渗入具有期望 ( 例如优良的或 外来的 ) 遗传背景的玉米以生成渗入耐受性的玉米植物或种质。在某些方面, 预期多个耐 受性标记等位基因被连续或同时选择和 / 或渗入。可在单个植物中用于选择耐受性的耐受 性标记的组合不受限制, 并且能够包括图 3 所述标记、 与图 3 所述标记连锁的任何标记、 或 者位于本文限定的 QTL 区间中的任何标记的任何组合。
作为将受关注的性状导入玉米的标准育种方法 ( 例如基因渗入 ) 的替代方法, 也 可使用转基因方法。在这些方法中, 可将控制受关注性状如病害耐受性的外源核酸导入靶 植物或种质中。耐受性确认能通过可用的耐受性规程进行 ( 例如如上文所述 )。使用耐受 性检测分析法确认在任何特定植物或种群中耐受性性状仍与标记一起分离, 并且当然测量 通过将性状渗入或转基因导入期望背景获得的耐受性改善程度。在一个一分至九分的评 分等级中, 包含灰叶斑病 QTL 的有利等位基因的植物可具有的耐受性评分为至少 2.7、 2.6、 2.5、 2.4、 2.3、 2.2、 2.1、 2.0、 1.9、 1.8、 或 1.7 分, 其评分在与不包含灰叶斑病 QTL 的有利等 位基因的近等基因植物进行比较时更高。在一个 1 至 9 的视觉评分系统中, 评分越高指示 抗性越高。仅当在测量实验中存在足够的选择压力时, 数据将被收集。
包括用于选择包含受关注标记的植物和 / 或用于将存在的标记与耐受性关联的 自动化系统的系统也是本发明的一个特征。这些系统可包括与标记座位检测有关的探针、 用于检测探针上标记的检测器、 混合探针与模板和 / 或扩增模板的合适流体处理元件和温 度控制器、 以及将标记检测与特定标记座位或等位基因存在关联的系统说明书。
试剂盒也是本发明的一个特征。例如试剂盒可包括用于检测耐受性关联的标记 座位的合适的引物或探针, 以及使用所述引物或探针来检测标记座位并将基因座与预测的 GLS 耐受性关联的说明书。 该试剂盒还可包括包装探针、 引物、 或说明书的包装材料、 对照物 如包括用于扩增的探针、 引物或模板核酸的对照扩增反应、 分子量标记等。
耐受性标记和有利等位基因
在传统的连锁分析中, 不需要直接知道染色体上基因的物理关系。孟德尔第一定 律是控制成对性状的因子会分离, 意指成对性状的等位基因分离到两个配子中去, 然后进 入不同的子代。可将经典的连锁分析认为是对不同性状的共分离相对频率的统计学描述。 连锁分析是关于性状如何基于它们共分离的频率集合的表征良好的描述性结构。即, 如果 两个非等位性状以大于随机频率的频率被一起继承, 将它们称为 “连锁的” 。性状被一起继 承的频率是性状连锁紧密程度的主要量度, 即以较高频率被一起继承的性状比以较低频率 ( 但仍高于随机频率 ) 被一起继承的性状连锁更紧密。性状连锁是因为导致该性状的基因 位于相同染色体上。 基因在染色体上的位置越分散, 它们共分离的可能性越低, 因为同源染 色体在减数分裂期间重组。因此基因在染色体上分散的越远, 在减数分裂期间将发生会导 致两个基因分开地分离到子代中的交换事件的可能性越大。
连锁的常见量度是性状共分离的频率。 这可能以共分离百分比 ( 重组频率 ) 表示, 或者也常见地以厘摩 (cM) 表示。cM 以先驱遗传学者 Thomas Hunt Morgan 命名, 是遗传重 组频率的量度单位。一 cM 等于由于在一代中的交换导致的在一个基因座上的性状将与在 另一个基因座上的性状分离的概率为 1% ( 意味着性状 99%的情况下共分离 )。因为染色体距离与性状间交换事件的频率大约成比例, 有与重组频率关联的近似物理距离。
标记座位本身是性状, 并且在分离期间能够通过跟踪标记座位、 根据标准连锁分 析进行评估。因此在本发明的情况下, 一 cM 等于由于在一代中的交换导致的标记座位将 与另一个基因座 ( 它可为任何其他性状, 例如另一个标记座位, 或另一个编码 QTL 的性状 基因座 ) 分离的概率为 1%。本文标记参见图 3, 例如 PHM 15534、 PHM 04694、 PHM01811、 PHM 01963、 PHM 05013、 和 PHM 00586, 以及任何染色体区间 (i)BNLG1755 和 UMC1299, (ii) BNLG1755 和 BNLG1621A, (iii)BNLG1755 和 MMC0371, (iv)BNLG1755 和 UMC1702, (v)UMC156A 和 UMC1299, (vi)UMC156A 和 BNLG1621A, (vii)UMC156A 和 MMC0371, (viii)UMC156A 和 UMC1702, (ix)UMC1142 和 UMC1299, (x)UMC1142 和 BNLG1621A, (xi)UMC1142 和 MMC0371, (xii)UMC1142 和 UMC1702, (xiii)UMC1346 和 UMC1299, (xiv)UMC1346 和 BNLG1621A, (xv) UMC1346 和 MMC0371, 以及 (xvi)UMC1346 和 UMC1702, 已经发现它们与新赋予的耐受性、 提高 的耐受性、 或玉米 GLS 易感性关联。这意味着标记与耐受性性状的连锁足够紧密使得它们 可被用作耐受性性状的预报。这在本文详述的标记辅助选择 (MAS) 中是非常有用的。简而 言之, 能够选择标记等位基因与耐受性正相关的玉米植物或种质, 实际上不种植玉米并测 量新赋予的耐受性或提高的耐受性 ( 或者相反地, 如果玉米植物具有与新赋予的耐受性或 提高的耐受性负相关的标记, 可不选择它们 )。MAS 是一种选择期望表型并将期望性状渗入 玉米栽培变种 ( 例如将期望性状渗入优良品系 ) 的强大快捷工具。MAS 容易适应高通量的 分子分析方法, 该方法可迅速筛选大量植物或种质遗传材料的受关注的标记, 并且比种植 植物并观察其可见性状的方法的性价比高得多。
在一些实施方案中, QTL 标记是图 3 提供的标记的亚群, 例如设计用于 bacb. pk0333.o19( 例 如 PHM 00043)、 bacc.pk0267.m12.f、 cl33021_1、 bacb.pk0241.h17.f、 chp2.pk0007.d2、 p0094.csstg88、 bacb.pk0269.n19、 bacb.pk0009.b21.f、 bacb.pk0117. i09.f、 bacc.pk0280.n12、 bacb.pk0219.j20、 bacc.pk0132.b16.f、 bacb.pk0221.o22、 bacb. pk0544.j18、 bacb.pk0540.c18.f、 和 bacm.pk022.b8( 例如 PHM00049) 的标记。
当涉及两个遗传因子间的关系时, 如有助于产生耐受性和紧密关联标记的遗传因 子, 则 “耦合” 相连锁指示下述状态 : 其中在耐受性基因座上的 “有利” 等位基因与相应连锁 的标记座位的 “有利” 等位基因物理上附连在相同染色体链上。在耦合相中, 两个有利等位 基因被继承了该染色体链的子代一起继承。在 “相斥” 相连锁中, 在受关注基因座上的 “有 利” 等位基因 ( 例如 QTL 耐受性 ) 与在紧密连锁标记座位上的 “不利” 等位基因物理上连 锁, 并且两个 “有利” 等位基因不被一起继承 ( 即这两个基因座彼此 “异相” )。
标记的有利等位基因是与期望表型 ( 例如病害耐受性 ) 共分离的标记的等位基 因。 如本文所用, 虽然所述标记具有两个或更多个存在于种群中的有利等位基因是可能的, QTL 标记具有最少一个有利等位基因。任何该标记的有利等位基因可被有利地用于鉴定和 构造耐受性玉米品系。 任选地在植物中鉴定不同标记的一个、 两个、 三个或更多个有利等位 基因, 或者将它们渗入植物, 并且它们在 MAS 期间可进行选择。期望鉴定具有至少一个此类 有利等位基因的植物或种质, 所述有利等位基因与新赋予的或提高的耐受性正相关。
作为另外一种选择, 也发现与病害易感性关联的标记等位基因用于本发明, 因为 该等位基因可用于鉴定并反选择病害易感植物。 在育种期间此种等位基因可用于排除目的 以鉴定具有与耐受性负相关的等位基因的植物或种质, 从而从随后若干轮的育种中除去易感植物或种质。
在本发明的一些实施方案中, 同时选择多个标记等位基因用于单个植物或一组植 物。在这些方法中, 选择的植物包含 GLS 耐受性的有利等位基因, 或者将 GLS 耐受性的有利 等位基因渗入期望的玉米种质中。本领域的技术人员认识到在相同植物中同时选择 GLS 耐 受性的有利等位基因可能导致对植物附加的 ( 或甚至协同的 ) 保护效应。
技术人员认识到在某些情况下有利标记等位基因的鉴别是种质特异性的。 测定所 研究的特定种质以确定哪些标记等位基因与耐受性 ( 或易感性 ) 关联。技术人员认识到用 于鉴定有利等位基因的方法是常规的并且是本领域熟知的, 此外鉴定和使用此类有利等位 基因属于本发明的范围内。 此外鉴定除本文使用的或描述的种群之外的玉米种群中的有利 标记等位基因属于本发明的范围内。
用于扩增 SSR 型标记座位的扩增引物是本发明的特征。本发明的另一个特征是特 异用于扩增 SNP 结构域 (SNP 标记 ) 的引物, 以及用于检测 SNP 序列的探针。图 9 和 10 提 供了用于标记座位扩增的特异引物和用于检测扩增标记座位的探针。 然而技术人员将立即 认识到可使用给定引物的任一侧的其他序列代替给定引物, 只要该引物能够扩增包括将被 检测的等位基因的区域。此外应当理解用于检测的精确探针能够改变, 例如能鉴定将被检 测的标记扩增子区域的任何探针可被本文提供的那些实例取代。 此外扩增引物和检测探针 的构型当然能够改变。因此本发明不受本文所述的引物和探针的限制。
在某些方面, 本发明的方法利用扩增步骤以检测 / 确定标记座位基因型。然而应 当理解标记检测不需要扩增, 例如人们能够通过简单地对基因组 DNA 样品进行 Southern 印迹直接检测未扩增的基因组 DNA。已经确定并提出了进行 Southern 印迹、 扩增 (PCR、 LCR 等 ) 以及多种其他核酸检测方法的过程, 例如 Sambrook 等人, Molecular Cloning-A Laboratory Manual( 第 3 版 ), 第 1-3 卷, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 2000(“Sambrook” ); Current Protocolsin Molecular Biology, F.M.Ausubel 等人编辑, Current Protocols, a jointventure between Greene Publishing Associates, Inc.and John Wiley&Sons, Inc., (supplemented through 2002)( “Ausubel” ) 和 PCR ProtocolsA Guide to Methods and Applications(Innis 等 人 编 辑 )Academic Press Inc.San Diego, CA(1990)(“Innis” )。关于检测植物中的核酸的附加细节也可参 见例如 Plant Molecular Biology(1993)Croy( 编辑 )BIOSScientific Publishers, Inc. (“Croy” )。
在扩增 / 检测方法中也可省略分离检测探针, 例如通过进行实时扩增反应, 该反 应通过当掺入产物时改变相关扩增引物、 将标记核苷酸掺入扩增子、 或通过监控扩增子的 摩尔旋光度特性与未扩增前体相比的变化 ( 例如通过荧光偏振 ) 来检测产物形成。
分子标记通常通过任何本领域可用的确立方法进行检测, 所述方法不受限制的包 括等位基因特异性杂交 (ASH) 或其他方法, 用于检测单核苷酸多态性、 扩增片段长度多态 性 (AFLP) 检测、 扩增可变序列检测、 随机扩增多态性 DNA(RAPD) 检测、 限制性片段长度多态 性 (RFLP) 检测、 自主序列复制检测、 简单序列重复 (SSR) 检测、 单链构象多态性 (SSCP) 检 测、 酶切扩增多态序列 (CAPS) 检测、 同功酶标记检测等。虽然本文图表中提供的示例性标 记是 SSR 或 SNP(ASH) 标记, 但是可在本发明的情况下使用任何前述标记类型以鉴定染色体 片段, 所述染色体片段包含有助于产生优异农学性能 ( 例如新赋予的耐受性或提高的耐受性 ) 的遗传因子。
QTL 染色体区间
在某些方面, 本发明提供 QTL 染色体区间, 其中在那些区间中包含与 GLS 耐受性关 联的一个或多个 QTL。本领域熟知的多种方法可用于鉴定染色体区间 ( 在下文实施例中详 述 )。扩展此类染色体区间的边界以包含将与一个或多个 QTL 连锁的标记。换句话说, 扩 展染色体区间使得位于区间内的任何标记 ( 包括限定区间边界的末端标记 ) 可被用作病害 耐受性标记。每个区间包含一个 GLS QTL, 此外甚至可包含一个以上的 QTL。相同区间中非 常接近的多个 QTL 可搅乱特定标记与特定 QTL 的关联, 因为一个标记可显示与一个以上的 QTL 连锁。相反地, 例如如果非常接近的两个标记显示与期望表型性状共分离, 有时分不清 楚是否那些标记中的每一个鉴定相同 QTL 或两个不同的 QTL。
本发明提供玉米染色体区间, 其中在所述区间内的标记显示与 GLS 耐受性共分离 ( 参见表 1)。
表1
侧接标记 BNLG1755 和 UMC1299 BNLG1755 和 BNLG1621A BNLG1755 和 MMC0371 BNLG1755 和 UMC1702 UMC156A 和 UMC1299 UMC156A 和 BNLG1621A UMC156A 和 MMC0371 UMC156A 和 UMC1702 UMC1142 和 UMC1299 UMC1142 和 BNLG1621A UMC1142 和 MMC0371 UMC1142 和 UMC1702 UMC1346 和 UMC1299 UMC1346 和 BNLG1621A鉴定方法 与优选标记连锁 与优选标记连锁 与优选标记连锁 与优选标记连锁 与优选标记连锁 与优选标记连锁 与优选标记连锁 与优选标记连锁 与优选标记连锁 与优选标记连锁 与优选标记连锁 与优选标记连锁 与优选标记连锁 与优选标记连锁26CN 101970669 A说UMC1346 和 MMC0371 UMC1346 和 UMC1702明书与优选标记连锁 与优选标记连锁23/51 页上述每个区间包含一簇可与 GLS 耐受性共分离的标记。该簇标记发生在染色体上 相对小的结构域内, 并且可与那些染色体区域中的一个或多个 QTL 连锁。扩展 QTL 区间已 包含与耐受性共分离的标记。所述区间由在它们的边界处的标记限定, 其中该区间包含图 谱中在该区间内的所有标记以及限定边界的标记。
在某些情况下, 区间可由优选标记的连锁限定。例如在染色体 4 上的区间由在一 定距离内的与标记 PHM 01811 连锁的任何标记限定, 参照任何合适的遗传连锁图谱。例如 如本文所用, 连锁由在 PHM 0181125cM 内的任何标记限定, 这由在 MaizeGDB 网站上存在的 IBM2 2004Neighbors 图谱详细说明。在染色体 4 上这个区间还在表 3 中示出。这些标记以 遗传顺序显示。包括末端标记 BNLG1755 和 UMC1299 在内的每个列出的标记是该区间的成 员。BNLG1755 和 UMC1299 标记是本领域已知的。
如上所述区间 ( 例如染色体区间或 QTL 区间 ) 不取决于区间大小的绝对量度如厘 摩值。 区间可用末端标记描述, 所述标记限定该区间的端点, 并且该区间通常将包括限定区 间范围的末端标记。例如图 4 中的物理图谱描述了由 PHM 00045 和 PHM 00049 限定并包括 它们的染色体物理区域。区间能够包括位于染色体结构域内的任何标记, 无论那些标记是 当前已知的或未知的。本发明提供多种手段限定染色体区间, 例如在表 3 的连锁标记的列 表中以及在本文参考中。
基因图谱
本领域的技术人员将认识到 : 在任何特定种群中的重组频率 ( 以及由此导致的基 因图谱位置 ) 不是固定的。分开两个标记 ( 或者一个标记和一个 QTL) 的遗传距离能够取 决于图谱位置如何测定而发生变化。变量如选择的亲本、 作图使用的种群、 标记作图或 QTL 作图使用的软件、 以及作图软件使用者的参数输入能够产生 QTL/ 标记基因图谱关系。例如 cM 距离能够取决于重组循环的数目而发生很大变化, 所述重组循环用于产生作图种群 ( 例 如 IBM2 =八个重组循环, 而本文 BC1 为一个重组循环 ; 因此 IBM2 距离为 5cM, 与 BC1 的 5cM 距离差异很大 )。然而本发明不旨在受以下变量的限制 : 任何特定作图种群、 使用的任何特 定软件、 或任何特定的软件参数组, 这些变量用于测定特定标记或染色体区间与 GLS 耐受 性表型的连锁。 本领域的普通技术人员的能力足以使用任何特定软件或软件参数将本文所 述的新特征外推至任何玉米基因库或受关注的种群。 实际上, 使用本公开的教导, 关于除本 文所述的那些种群之外的种群中的耐受性标记和染色体区间的观察被容易地进行。
作图软件
多种商业软件可用于基因作图和标记关联研究 ( 例如 QTL 作图 )。这种软件包括 但不限于表 2 中列出的软件。
表2
统一基因图谱
已经制备了 “统一的” 、 “共有的” 、 或 “整合的” 基因图谱, 该基因图谱加入了来自 两个或更多个来源的作图数据, 包括使用不同作图种群和不同统计分析模式的来源。基因 图谱信息的加入提高了图谱上的标记密度。 可将这些改善的图谱有利地用于标记辅助的选 择和基于作图的克隆并提供用于定位新鉴定分子标记的改善框。 改善的图谱也有助于鉴定 QTL 染色体区间和有利连锁的标记簇。
在某些方面, 共有图谱来源于将一个图谱简单地覆盖在另一个图谱顶部。在其他
方面, 多种算法如分析允许从多个来源组合基因图谱数据, 并且解决来自最初来源的图谱数据间的不一致。 参见 Van Ooijen 和 Voorrips(2001) “JoinMap 3.0s oftware for the calculation ofgenetic linkage maps” , Plant Research International, Wageningen, theNetherlands ; Stam(1993)“Construction of integrated genetic linkage mapsby means of a new computer package : JoinMap” , The Plant Journal 3(5) :739-744。
连锁标记
根据本公开以及本领域的广泛认识, 清楚的是可使用以下任何遗传标记作为所述 性状的标记 : 所述遗传标记与受关注的表型性状 ( 例如在本文实例中, 新赋予的耐受性或 提高的耐受性的性状 ) 具有显著的共分离概率。图 3 提供了本发明提供的可用 QTL 标记列 表。
除图 3 所示的 QTL 标记之外, 还可使用与 QTL 标记连锁的附加标记 ( 显示连锁不 平衡 ) 预测玉米植物中新赋予的耐受性或提高的耐受性性状。换句话说, 显示任何与本发 明的 QTL 标记小于 50%的重组频率 ( 由小于 50cM 的遗传距离分开 ) 的任何其他标记 ( 例 如图 3 中提供的标记 ) 也是本发明的特征。也可在标记辅助选择特定性状的过程中有利地 使用与 QTL 标记连锁的任何标记。
当遗传标记与给定 QTL 的连锁足够紧密使得它们显示低重组频率时, 与 QTL 连锁 的遗传标记 ( 例如图 3 提供的 QTL 标记 ) 是尤其有用的。在本发明中, 此类紧密连锁的标 记是本发明的一个特征。如本文所述, 紧密连锁的标记显示约 10%或更低的重组频率 ( 给 定标记位于 QTL 10cM 内 )。换句话说, 这些紧密连锁的基因座至少 90%的情况下共分离。 实际上, 一个标记与 QTL 标记连锁越紧密, 该标记越会更有效地和更有利地变成期望性状 的指示物。
因此在其他实施方案中, 紧密连锁的基因座如 QTL 标记座位和第二基因座显示约 10%或更低, 优选约 9%或更低, 更优选约 8%或更低, 更优选约 7%或更低, 更优选约 6%或 更低, 更优选约 5%或更低, 更优选约 4%或更低, 更优选约 3%或更低, 更优选约 2%或更低 的基因座内交换频率。在高度优选的实施方案中, 相关基因座 ( 例如标记座位和靶基因座 如 QTL) 显示约 1%或更低的重组频率, 例如约 0.75%或更低, 更优选约 0.5%或更低, 或更 优选的约 0.25%或更低的重组频率。因此, 所述基因座分开距离为约 10cM、 9cM、 8cM、 7cM、 6cM、 5cM、 4cM、 3cM、 2cM、 1cM、 0.75cM、 0.5cM 或 0.25cM 或更低。换句话说, 位于相同染色体 上, 并且它们间的距离使得两个基因座间的重组发生频率小于 10% ( 例如约 9%、 8%、 7%、 6 %、 5 %、 4 %、 3 %、 2 %、 1 %、 0.75 %、 0.5 %、 0.25 %、 或更低 ) 的两个基因座称为彼此紧密 连锁。
在某些方面, 本发明的连锁标记 ( 包括紧密连锁标记 ) 通过参考基因图谱确定, 例如存在于 MaizeGDB 网站的整合基因图谱。例如本文显示连锁群 4 标记 PHM 15534、 PHM 04694、 PHM 01811、 PHM01963、 PHM 05013、 和 PHM 00586 ; 以及设计用于 bacb.pk0333. o19(PHM 00043)、 bacc.pk0267.m12.f、 cl33021_1、 bacb.pk0241.h17.f、 chp2.pk0007. d2、 p0094.csstg88、 bacb.pk0269.n19、 bacb.pk0009.b21.f、 bacb.pk0117.i09.f、 bacc. pk0280.n12、 bacb.pk0219.j20、 bacc.pk0132.b16.f、 bacb.pk0221.o22、 bacb.pk0544.j18、 bacb.pk0540.c18.f、 和 bacm.pk022.b8(PHM 00049) 的标记, 所述标记与至少一个 GLS 耐受 性 QTL 关联。与前述标记连锁的标记可例如从表 3 中测定。
表3: IBM2 2004 Neighbors 图谱上位于 PHM 01811 25cM 内的标记
同样地, 本发明的连锁标记 ( 包括紧密连锁标记 ) 可通过参考任何合适的玉米基 因图谱来确定。例如存在于 MaizeGDB 网站来源的整合基因图谱。
不旨在将连锁或紧密连锁标记的测定限制在使用任何特定玉米基因图谱。 实际上 很多玉米基因图谱是可用的, 并且是本领域技术人员所熟知的。 作为另外一种选择, 可通过 生成实验数据集和连锁分析进行连锁和紧密连锁标记的测定。
与 GLS 耐受性 QTL 标记连锁 ( 例如在约 50cM 内或在约 10cM 内 ) 标记的鉴定也不
旨在受任何特定图谱或方法的限制。在 MaizeGDB 网站上提供的整合基因图谱仅起到鉴定 连锁标记的实例的作用。实际上, 本文定义的连锁标记可从本领域已知的任何基因图谱中 测定 ( 实验图谱或整合图谱 ), 或者可从任何新图谱数据集中测定。
注意到连锁和紧密连锁标记的列表可由于多种因素在图和方法之间发生变化。 首 先, 位于任意两个图谱上的标记可为不相同的, 此外一些图谱可具有比另一个图谱更大的 标记密度。用于构建图谱的作图种群、 方法和算法也可以不同。本领域的技术人员认识到 一个基因图谱或多或少地比另一个基因图谱精确是不必要的, 此外还认识到可使用任何玉 米基因图谱测定与本发明的 QTL 标记连锁或紧密连锁的标记。
标记检测技术
本发明提供与 QTL 共分离具有显著概率的分子标记, 所述 QTL 赋予 GLS 耐受性表 型。 这些 QTL 标记用于期望性状的标记辅助的选择 ( 新赋予的耐受性或提高的耐受性 ), 并 且也具有其他用途。本发明不旨在受检测这些标记的任何特定方法的限制。
对应于在种群成员间的遗传多态性的标记能够通过本领域已经确定的多种方法 进行检测 ( 例如基于 PCR 的序列特异性扩增、 限制性片段长度多态性 (RFLP)、 同功酶标 记、 等位基因特异性杂交 (ASH)、 植物基因组的扩增可变序列、 自主序列复制、 简单重复序 列 (SSR)、 单核苷酸多态性 (SNP)、 随机扩增的多态性 DNA(“RAPD” )、 酶切扩增多态序列 (CAPS)、 或扩增片段长度多态性 (AFLP))。在一个附加实施方案中, 简单地通过多态标记区 域的核苷酸测序测定分子标记存在与否。该方法易于适应高通量分析, 该分析方法是上文 提到的其他方法, 例如使用可用的高通量测序方法如杂交测序。
主要遗传标记通常依靠核酸的一个或多个特性进行检测。例如用于遗传标记检 测的一些技术利用探针核酸与对应于遗传标记的核酸 ( 例如使用基因组玉米 DNA 作模板 产生的扩增核酸 ) 的杂交。杂交形式包括但不限于液相、 固相、 混合相、 或原位杂交检测 分析, 它们用于等位基因检测。对核酸杂交的一个广泛适用的指导存在于 Tijssen(1993) Laboratory Techniques in Biochemistry and MolecularBiology-Hybridization with Nucleic Acid Probes Elsevier, New York ; 以及 Sambrook 和 Ausubel( 本文 ) ; 以及 Berger 和 Kimmel, Guide toMolecular Cloning Techniques, Methods in Enzymology volume 152Academic Press, Inc., San Diego, CA(“Berger” )。
例如检测包含限制性片段长度多态性 (RFLP) 的标记, 如通过将通常是将被检测 的核酸亚片段的探针 ( 或者对应于亚片段的合成寡核苷酸 ) 与经限制性消化的基因组 DNA 杂交进行检测。选择限制性酶以提供在不同个体或种群中的至少两个长度可供选择的 ( 或 多态的 ) 限制性片段。测定产生每个杂交信息片段的一种或多种限制性酶是一个简单的程 序, 该程序是本领域熟知的。标记探针在合适基质 ( 如琼脂糖或聚丙烯酰胺 ) 中根据长度 分离并转移到膜 ( 如硝化纤维、 尼龙等 ) 上后, 它在导致探针平衡结合的条件下与靶杂交, 随后通过洗涤移除过多的探针。
可克隆和 / 或合成用于标记座位的核酸探针。可与本发明的探针一起使用任何合 适的标记。 适于与核酸探针一起使用的可检测标记包括例如通过光谱、 放射性同位素、 光化 学、 生物化学、 免疫化学、 电学、 光学或化学方法可检测的任何组合物。 可用的标记包括用于 染色的生物素, 它具有标记的链霉亲和素、 磁珠、 荧光染料、 放射标记物、 酶、 和色度标记。 其 他标记包括与抗体结合的配体, 该抗体用荧光团、 化学发光试剂、 和酶标记。探针也可组成放射标记的 PCR 引物, 该引物用于生成放射标记的扩增子。标记核酸的标记方法和对应的 检测方法参见 Haugland(1996)Handbook of Fluorescent Probes and ResearchChemicals Sixth Edition by Molecular Probes, Inc.(Eugene OR) ; 或 Haugland(2001)Handbook of Fluorescent Probes and Research ChemicalsEighth Edition by Molecular Probes, Inc.(Eugene OR)( 在 CD ROM 上可用 )。
基于扩增的检测方法
PCR、 RT-PCR 和 LCR 作为用于扩增受关注核酸 ( 例如那些包含标记座位的核酸 ) 的扩增和扩增检测方法具有尤其广泛的应用, 有利于检测标记。关于这些方法和其他扩增 方法的详细描述可见于本文多种标准文献中任何一种, 例如 Sambrook、 Ausubel、 Berger 和 Croy。许多可用的生物学文献具有关于 PCR 和相关扩增方法的深入讨论。技术人员将会知 道使用逆转录酶和聚合酶 (“反转录 -PCR, 或 “RT-PCR” ), 基本上可将任何 RNA 转化成适于 限制消化、 PCR 扩增和测序的双链 DNA。也参见上文的 Ausubel、 Sambrook 和 Berger。
实时扩增 / 检测方法
在一个方面, 实时 PCR 或 LCR 在本文所述的扩增混合物中进行, 例如使用分子信标 TM 或 TaqMan 探针。分子信标 (MB) 是寡核苷酸或 PNA, 它在合适的杂交条件下自杂交以形成 茎环结构。MB 在寡核苷酸或 PNA 末端具有标记和淬灭剂 ; 因此在使得分子内杂交发生的条 件下, 所述标记通常被淬灭剂淬灭 ( 或至少其荧光改变 )。在其中 MB 不显示分子内杂交的 条件下 ( 例如当与靶核酸结合时, 如在扩增期间结合扩增子区域 ), MB 标记不被淬灭。关 于制备和使用 MB 的标准方法的细节已在文献中确立, 并且 MB 得自许多商业试剂来源。也 参见例如 Leone 等人 (1995)“Molecular beacon probes combined with amplification byNASBA enable homogenous real-time detection of RNA” , Nucleic AcidsRes.26 : 2150-2155 ; Tyagi 和 Kramer(1996)“Molecular beacons : probesthat fluoresce upon hybridization” Nature Biotechnology 14 : 303-308 ; Blok 和 Kramer(1997) “Amplifiable hybridization probes containing amolecular switch” Mol Cell Probes 11 : 187-194 ; Hsuih 等人 (1997) “Novel, ligation-dependent PCR assay for detection of hepatitis C in serum” J ClinMicrobiol 34 : 501-507 ; Kostrikis 等 人 (1998)“Molecular beacons : spectralgenotyping of human alleles” Science 279 : 1228-1229 ; Sokol 等 人 (1998)“Real time detection of DNA : RNA hybridization in living cells” Proc. Natl.Acad.Sci.U.S.A.95 : 11538-11543 ; Tyagi 等 人 (1998)“Multicolormolecular Nature Biotechnology16 : 49-53 ; Bonnet 等 beacons for allele discrimination” 人 (1999)“Thermodynamic basis of the chemicalspecificity of structured DNA probes” Proc.Natl.Acad.Sci.U.S.A.96 : 6171-6176 ; Fang 等人 (1999) “Designing a novel molecular beacon forsurface-immobilized DNA hybridization studies” J.Am.Chem. Soc.121 : 2921-2922 ; Marras 等 人 (1999)“Multiplex detection ofsingle-nucleotide variation using molecular beacons” Genet.Anal.Biomol.Eng.14 : 151-156 ; 以及 Vet 等 人 (1999)“Multiplex detection of fourpathogenic retroviruses using molecular beacons” Proc.Natl.Acad.Sci.U.S.A.96 : 6394-6399。关于 MB 构建和使用的附加细节可 见于专利文献如美国专利 5,925,517、 6,150,097、 和 6,037,130。
使用双标记荧光寡核苷酸探针 ( 一般称为 “TaqManTM” 探针 ) 的 PCR 检测和量化也可根据本发明进行。这些探针由短 ( 例如 20-25 个碱基 ) 的寡聚脱氧核苷酸组成, 该寡 聚脱氧核苷酸用两个不同荧光染料标记。在每个探针的 5′末端以及 3′末端上存在淬灭 染料。寡核苷酸探针序列与存在于 PCR 扩增子内的内部靶序列互补。当探针完整时, 能 量传递发生在两个荧光团之间并且从报告基团发射的荧光通过 FRET 被淬灭剂淬灭。在 PCR 延伸阶段, 探针被反应中使用的聚合酶的 5′核酸酶活性酶解, 从而从寡核苷酸 - 淬灭 TM 剂中释放报告基团并提高报告基团的发光强度。因此 TaqMan 探针是具有标记和淬灭剂 的寡核苷酸, 其中所述标记在扩增期间通过扩增中使用的聚合酶的核酸外切酶作用而被 释放。这提供合成期间的扩增实时测量。多种 TaqManTM 试剂是可商购获得的, 例如购自 Applied Biosystems(Division Headquarters inFoster City, CA) 以及多个专业供应商 如 Biosearch Technologies( 例如 black hole quencher 探针 )。
关于扩增可变序列、 SSR、 AFLP、 ASH、 SNP 和同功酶标记的附加细节描述
扩增可变序列指植物基因组的扩增序列, 该序列在相同物种的成员间表现出高核 酸残基可变性。所有生物具有可变基因组序列, 并且每种生物 ( 除了克隆以外 ) 具有不同 的一组可变序列。一旦确认, 可使用存在的特定可变序列预测表型性状。来自植物的 DNA 与侧接 DNA 可变序列的引物一起优选地起到扩增模板的作用。扩增可变序列, 然后进行测 序。 作为另外一种选择, 可使用自主复制序列鉴定遗传标记。自主复制序列指使用靶 核酸序列进行核酸扩增的方法, 该序列在基本上等温的条件下通过使用逆转录复制涉及的 三种酶活性进行体外的指数复制 : (1) 逆转录酶, (2)RNase H, 以及 (3) 依赖 DNA 的 RNA 聚 合酶 (Guatelli 等人 (1990)Proc Natl Acad Sci USA 87 : 1874)。通过 cDNA 中间体模仿 RNA 逆转录复制机制, 这种方法积聚初始靶的 cDNA 和 RNA 拷贝。
也可使用扩增片段长度多态性 (AFLP) 作为遗传标记 (Vos 等人 (1995)Nucleic Acids Res 23 : 4407)。短语 “扩增片段长度多态性” 指在用限制性核酸内切酶酶解之前或 之后选择的限制性片段。 扩增步骤使得特定限制性片段检测较容易。 AFLP 允许检测大量多 态性标记, 并且已经被用于植物基因图谱 (Becker 等人 (1995)Mol Gen Genet 249 : 65 ; 以 及 Meksem 等人 (1995)Mol Gen Genet 249 : 74)。
可使用等位基因特异性杂交 (ASH) 鉴定本发明的遗传标记。ASH 技术基于短的单 链寡核苷酸探针与单链靶核酸的完全互补序列的稳定退火。 经由结合到探针上的同位素或 非同位素标记进行检测。
就每种多态性而言, 设计两个或更多个不同的 ASH 探针, 所述探针除了多态核苷 酸之外具有相同的 DNA 序列。每个探针与一个等位基因序列将具有确切同源性以便探针的 范围能够识别所有已知的可供选择的等位基因序列。每个探针与靶 DNA 杂交。使用适当的 探针设计和杂交条件, 探针和靶 DNA 之间的单碱基错配将阻止杂交。用这种方法, 仅仅其中 一个供选择探针将与靶样品杂交, 所述样品是与等位基因纯合的或同质的。两个等位基因 是杂合的或异质的样品将与两个供选择探针杂交。
使用 ASH 标记作为显性标记, 其中是否存在仅一个等位基因通过仅一个探针杂交 或不杂交来确定。可供选择的等位基因可从不杂交的等位基因中推断得到。ASH 探针和靶 分子任选地是 RNA 或 DNA ; 靶分子是任何长度的核苷酸, 除了与探针互补的序列 ; 设计探针 与 DNA 靶的任一链杂交 ; 确认探针大小范围, 不同的严格杂交条件等。
PCR 使得 ASH 的靶序列从相对小量的低浓度核酸中扩增。此外用限制性核酸内切 酶消化来自基因组 DNA 的靶序列并通过凝胶电泳分离不同大小的序列。随着靶序列结合到 膜表面上, 或者如美国专利 5,468,613 所述 ASH 探针序列可结合到膜上, 通常发生杂交。
在一个实施方案中, ASH 数据通常通过以下步骤获得 : 使用 PCR 从基因组 DNA 中扩 增核酸片段 ( 扩增子 ), 将扩增子靶 DNA 转移到点杂交形式的膜上, 将标记寡核苷酸探针与 扩增子靶杂交, 以及通过放射自显影观察杂交斑点。
单核苷酸多态性 (SNP) 是由共有序列组成的标记, 该序列基于单核苷酸而不同。 这种区别可通过包含 SNP 的扩增子在例如丙烯酰胺凝胶上的不同差别迁移图谱而进行检 测。检测的替代模式如杂交、 如 ASH、 或 RFLP 分析也是适用的。SNP 标记检测单碱基对核 苷酸取代。在所有分子标记类型当中, SNP 是最多的, 因此具有提供最高基因图谱分辨率 的 能 力 (Bhattramakki 等 人 2002 Plant Molecular Biology48 : 539-547)。SNP 可 在 甚 至比 SSR 更高的通量水平上进行检测, 即以所谓的 “超高通量” 模式进行检测, 因为它们不 需要大量 DNA, 并且可直接进行自动化检测。SNP 也具有成为相对低成本系统的前景。这 三个因素一起使得 SNP 对在 MAS 中的应用具有高度吸引力。若干种方法可用于 SNP 基 因分型, 包括但不限于杂交、 引物延伸、 寡核苷酸连接、 核酸酶酶解、 微测序和编码球。此 类方法已经被以下文献叙述 : Gut(2001)Hum Mutat 17 第 475-492 页 ; Shi(2001)Clin Chem 47,第 164-172 页 ; Kwok(2000)Pharmacogenomics 1,第 95-100 页 ; Bhattramakki 和 Rafalski(2001)Discovery and application of singlenucleotide polymorphism markers in plants. : R.J.Henry 编 辑, PlantGenotyping : The DNA Fingerprinting of Plants, CABI Publishing, Wallingford。多种可商购获得的技术利用这些方法和其他 方 法 检 查 SNP, 包 括 Masscode.TM.(Qiagen), Invader.RTM.(Third WaveTechnologies), SnapShot.RTM.(Applied Biosystems) , Taqman.RTM.(Applied Biosystems) 以 及 Beadarrays.TM.(Illumina)。
在序列内或穿过连锁序列的许多 SNP 可一起用于描述任何特定基因型的单倍型 (Ching 等人 (2002), BMC Genet.3 : 19 pp Gupta 等人, 2001, Rafalski(2002b), 同上 )。单 倍型可比单个的 SNP 提供更多信息, 并且可描述较多的任何特定基因型。例如, 单个 SNP 可 为 PHM01811-32 的等位基因 “T” , 但是等位基因 “T” 也可发生在被轮回亲本利用的玉米育种 种群中。在这种情况下, 单倍型例如在连锁 SNP 标记上的一系列等位基因可提供较多的信 息。一旦已经将唯一的单倍型分配给供体染色体区域, 该单倍型可用于种群或其任何亚群 以确定是否个体具有特定基因。 参见例如 WO2003054229。 使用本领域普通技术人员已知的 那些自动化高通量标记检测平台使得这一方法高效和有效。
可使用同功酶标记作为遗传标记, 例如用于追踪除本文耐受性标记外的标记, 或 者追踪与本文标记连锁的同功酶标记。同功酶是酶的多样形式, 它们的氨基酸序列彼此不 同, 因此它们的核酸序列不同。一些同功酶是包含些微不同的亚基的多聚体酶。其他同功 酶是多聚体或单体, 但是已经在氨基酸序列的不同位点被从酶原上裂解。同功酶可在蛋白 水平上表征和分析, 或者可测定在核酸水平上不同的同功酶。在这些情况下可使用本文所 述的任何基于核酸的方法分析同功酶标记。
关于核酸扩增的附加细节
已经提到核酸扩增技术如 PCR 和 LCR 为本领域人们所熟知, 并且能够应用于本发明以扩增和 / 或检测受关注的核酸, 如包含标记座位的核酸。体外方法包括聚合酶链 反应 (PCR)、 连接酶链反应 (LCR)、 Qββ- 复制酶扩增和其他 RNA 聚合酶介导的技术 ( 例 如 NASBA), 足以指导技术人员掌握此类体外方法的技术实例存在于上述参考文献中, 例如 Innis、 Sambrook、 Ausubel、 Berger 和 Croy。附加的细节可见于 Mullis 等人 (1987), 美国 专利 4,683,202 ; Arnheim&Levinson(1990 年 10 月 1 日 )C&EN 36-47 ; The Journal Of NIH Research(1991)3 : 81-94 ; Kwoh 等人 (1989)Proc.Natl.Acad.Sci.USA 86 : 1173 ; Guatelli 等 人 (1990)Proc.Natl.Acad.Sci.USA 87 : 1874 ; Lomell 等 人 (1989)J.Clin.Chem 35 : 1826 ; Landegren 等 人 (1988)Science 241 : 1077-1080 ; Van Brunt(1990)Biotechnology 8: 291-294 ; Wu 和 Wallace(1989)Gene 4 : 560 ; Barringer 等人 (1990)Gene 89 : 117 ; 以及 Sooknanan 和 Malek(1995)Biotechnology 13 : 563-564。通过 PCR 扩增大核酸的改良方法 ( 用于定位克隆的情况下 ) 被进一步综述于 Cheng 等人 (1994)Nature 369 : 684, 以及本文 参考文献, 其中生成了最多 40kb 的 PCR 扩增子。
用于定位克隆的标记检测
在一些实施方案中, 使用核酸探针检测包含标记序列的核酸。此类特征可在例如 定位克隆中使用以分离与标记核苷酸序列连锁的核苷酸序列。 不旨在将本发明的核酸探针 限制在任何特定大小。在一些实施方案中, 核酸探针长度为至少 20 个核苷酸, 或者至少 50 个核苷酸, 或者至少 100 个核苷酸, 或者至少 200 个核苷酸。
取决于需被检测的标记, 杂交探针使用放射自显影、 荧光照相或其他相似的检 测技术进行检测。特定杂交规程的实例是本领域广泛可用的, 参见例如本文的 Berger、 Sambrook、 和 Ausubel。
探针 / 引物合成方法
制备包括探针、 引物、 分子信标、 PNA、 LNA( 锁核酸 ) 等在内的寡核苷酸的合成方法 通常为人们所熟知。例如寡核苷酸可根据固相亚磷酰胺三酯方法进行化学合成, 该方法描 述于 Beaucage 和 Caruthers(1981), Tetrahedron Letts.22(20) : 1859-1862, 例如使用可 商购获得的自动化合成器合成, 如描述于 Needham-VanDevanter 等人 (1984)Nucleic Acids Res.12 : 6159-6168 的方法。寡核苷酸包括修饰寡核苷酸, 也可从技术人员已知的多种商业 来源订购。 有许多寡核苷酸合成服务的商业供应商, 因此这是可广泛获得的技术。 可从多种 商业来源中的任何一种来源订购任何核酸, 如 The Midland Certified ReagentCompany, The Great American Gene Company, ExpressGen Inc., OperonTechnologies Inc. (Alameda, CA), 以及许多其他来源。同样地, 可从多种来源订购 PNA, 如 PeptidoGenic, HTI Bio-Products, Inc., BMABiomedicals Ltd(UK.), Bio·Synthesis, Inc., 以及许多其他来 源。
用电脑进行标记检测
在可供选择的实施方案中, 可使用利用电脑的方法检测受关注的标记座位。例如 可将包含受关注标记座位的核酸序列存储在电脑中。 期望的标记座位序列或其同源物可使 用合适的核酸搜索算法进行鉴定, 该算法由例如此类易得的程序如 BLAST, 或甚至简单的文 字处理器提供。
用于标记检测的扩增引物
在一些优选实施方案中, 本发明的分子标记使用合适的基于 PCR 的检测方法检测, 其中 PCR 扩增子的大小或序列指示特定标记等位基因存在与否。在这些类型的方法中, 将 PCR 引物与侧接多态性标记区域的保守区域杂交。如本领域所用, 用于扩增分子标记的 PCR 引物有时称为 “PCR 标记” 或简单的 “标记” 。
应当理解, 虽然本文提供了多种引物的具体实例 ( 参见例如图 3、 图 9、 和图 10), 能 够使用任何合适方法设计将被用于本发明的合适引物。 不旨在将本发明限制在任何特定引 物或引物对。例如可使用任何适用的软件程序设计引物, 例如 在一些实施方案中, 本发明的引物进行放射标记或通过任何合适的方法进行标记 ( 例如使用非放射性荧光标记 ) 以在扩增反应和按大小分离后 ( 例如通过在琼脂糖凝胶上 电泳 ) 迅速可视化不同大小的扩增子。在一些实施方案中, 引物不进行标记, 并且扩增子按 照它们的大小分辨率用例如溴化乙锭染色可视化。
不旨在将本发明的引物限制在生成任何特定大小的扩增子。 例如用于扩增标记座 位和本文等位基因的引物不限于扩增相关基因座的整个区域。 引物能生成任何合适长度的 扩增子。在一些实施方案中, 标记扩增生成的扩增子长度为至少 20 个核苷酸, 或者至少 50 个核苷酸, 或者至少 100 个核苷酸, 或者至少 200 个核苷酸。
标记辅助选择和植物育种
在作物中开发分子标记的主要动力是通过标记辅助选择 (MAS) 在植物育种中提 高效率。将遗传标记用于鉴定在一个或多个基因座包含期望基因型的植物, 并且期望该 植物将期望基因型与期望表型一起传递到它们的子代中。可使用遗传标记鉴定在一个基 因座或若干个不连锁或连锁基因座包含期望基因型的植物 ( 例如单倍型 ), 并且期望该 植物将期望基因型与期望表型一起传递到它们的子代中。本发明提供鉴定植物尤其是玉 米植物的方法, 所述植物具有对 GLS 新赋予的耐受性或提高的耐受性, 或者易感 GLS, 所 述方法通过鉴定在那些基因座中的其中一个基因座具有特定等位基因的植物, 所述基因 座如 PHM15534、 PHM 04694、 PHM 01811、 PHM 01963、 PHM 05013、 和 PHM00586 ; 以及设计用 于 bacb.pk0333.o19(PHM 00043)、 bacc.pk0267.m12.f、 cl33021_1、 bacb.pk0241.h17.f、 chp2.pk0007.d2、 p0094.csstg88、 bacb.pk0269.n19、 bacb.pk0009.b21.f、 bacb.pk0117. i09.f、 bacc.pk0280.n12、 bacb.pk0219.j20、 bacc.pk0132.b16.f、 bacb.pk0221.o22、 bacb. pk0544.j18、 bacb.pk0540.c18.f、 和 bacm.pk022.b8(PHM 00049) 的标记。
同样地, 通过鉴定缺乏期望标记座位的植物, 能够鉴定易感的或耐受性较小的植 物, 并且能够例如将这些植物从随后的杂交中除去。 同样地, 作为设计用于提高玉米产量的 全部 MAS 育种程序的一部分, 可将这些标记座位渗入任何期望的基因组背景、 种质、 植物、 品系、 品种等中。
本发明也提供染色体 QTL 区间, 该区间在选择植物的 MAS 中发挥相同的作用, 所述 植物显示新赋予的或提高的 GLS 耐受性。同样地, QTL 区间也可用于反选择易感的或对 GLS 耐受性降低的植物。 本发明使用在图谱上位于 QTL 区间中内的任何标记 ( 包括区间末端 )。 通过以下标记对限定这些区间 : (i)BNLG1755 和 UMC1299, (ii)BNLG1755 和 BNLG1621A, (iii)BNLG1755 和 MMC0371, (iv)BNLG1755 和 UMC1702, (v)UMC156A 和 UMC1299, (vi) UMC156A 和 BNLG1621A, (vii)UMC156A 和 MMC0371, (viii)UMC156A 和 UMC1702, (ix)UMC1142 和 UMC1299, (x)UMC1142 和 BNLG1621A, (xi)UMC1142 和 MMC0371, (xii)UMC1142 和 UMC1702, (xiii)UMC1346 和 UMC1299, (xiv)UMC1346 和 BNLG1621A, (xv)UMC1346 和 MMC0371, 以及
(xvi)UMC1346 和 UMC1702。
MAS 通常使用多态性标记, 所述标记已经被鉴定为具有与耐受性性状共分离的显 著可能性的标记。推测此类标记在图谱上接近产生植物耐受性表型的一个或多个基因, 并 且认为此类标记是期望性状的指示, 称为 QTL 标记。测试植物在 QTL 标记上是否存在期望 等位基因。最优选的标记 ( 或标记等位基因 ) 是那些与耐受性性状具有最强关联的标记。
使用连锁分析确定哪个多态性标记等位基因 ( 因此是 “耐受性标记等位基因” )显 示与耐受性表型共分离的统计学可能性。在鉴定与耐受性表型共分离的标记等位基因后, 可能使用这个标记迅速精确的筛选耐受性等位基因的植物品系, 而不需要使植物生长完成 它们的生命周期以及等候表型评估的结果, 此外甚至当实际耐受性 QTL 的分子特性是未知 的时候, 允许进行特定耐受性等位基因的遗传选择。能够从例如植物的第一片叶上采集组 织样品并用合适的分子标记进行筛选, 并且迅速确定将继续研究哪个子代。连锁标记也消 除了环境因素的影响, 所述环境因素常常影响表型表达。
可使用多态性 QTL 标记座位选择包含标记等位基因 ( 或等位基因 ) 的植物, 所述 等位基因与期望耐受性表型关联。简而言之, 检测来自将进行选择的植物的生物样品中对 应于标记核酸等位基因的核酸。 这种检测能够采取探针核酸与标记等位基因或其扩增子杂 交的形式, 例如使用等位基因特异性杂交、 DNA 印迹分析、 RNA 印记分析、 原位杂交、 引物杂 交后进行标记区域的 PCR 扩增等。 本文描述了检测标记的多种方法, 例如在题目为 “标记检 测技术” 的部分。在确认在生物样品中存在 ( 或不存在 ) 特定样品等位基因后, 选择该植物 ( 例如用于通过选择性育种制备子代植物 )。
玉米植物育种人员期望将耐受性基因座与高产基因以及其他期望性状组合以开 发改良的玉米品种。通过非分子方法 ( 例如玉米植物性状评估 ) 筛选大量样品可能是昂贵 的、 耗时的, 并且是不可靠的。 使用本文所述的多态性标记, 当与耐受性基因座遗传连锁时, 提供一种在育种程序中选择耐受性品种的有效方法。 例如标记辅助选择耐受性对田间评估 耐受性的一个优点是 MAS 能够在一年中的任何时间进行, 不受生长季节的限制。此外环境 效应很大程度上与标记辅助选择无关。
当一个种群在分离影响一个或多个性状的多个基因座时, 例如涉及耐受性的多个 基因座或每个涉及对不同病害耐受性的多个基因座, MAS 效率与表型筛选相比变得甚至更 高, 因为所有基因座能在实验室中从 DNA 的单个样品中一起评估。在本实例中, PHM 15534、 PHM04694、 PHM 01811、 PHM 01963、 PHM 05013、 和 PHM 00586 ; 以及设计用于 bacb.pk0333. o19( 如 PHM 00043)、 bacc.pk0267.m12.f、 cl33021_1、 bacb.pk0241.h17.f、 chp2.pk0007. d2、 p0094.csstg88、 bacb.pk0269.n19、 bacb.pk0009.b21.f、 bacb.pk0117.i09.f、 bacc. pk0280.n12、 bacb.pk0219.j20、 bacc.pk0132.b16.f、 bacb.pk0221.o22、 bacb.pk0544.j18、 bacb.pk0540.c18.f、 and bacm.pk022.b8( 如 PHM 00049) 的标记, 以及任何染色体区间 (i)BNLG1755 和 UMC1299, (ii)BNLG1755 和 BNLG1621A, (iii)BNLG1755 和 MMC0371, (iv) BNLG1755 和 UMC1702, (v)UMC156A 和 UMC1299, (vi)UMC156A 和 BNLG1621A, (vii)UMC156A 和 MMC0371, (viii)UMC156A 和 UMC1702, (ix)UMC1142 和 UMC1299, (x)UMC1142 和 BNLG1621A, (xi)UMC1142 和 MMC0371, (xii)UMC1142 和 UMC1702, (xiii)UMC1346 和 UMC1299, (xiv) UMC1346 和 BNLG1621A, (xv)UMC1346 和 MMC0371, 以及 (xvi)UMC1346 和 UMC1702, 可被同时 或按顺序检测分析, 它们来自单个样品或一组样品。MAS 在植物育种中的另一个用途是辅助通过回交育种恢复轮回亲本基因型。回交 育种是将子代与其他的其中一个亲本或亲本品系回交的方法。 回交通常用于将来自供体亲 本 ( 例如包含期望耐受性标记座位的亲本 ) 的一个或一些基因座渗入来自轮回亲本 ( 例如 另外的高产量玉米品系 ) 的其他期望的遗传背景中。回交进行的次数越多, 轮回亲本对所 得渗入品种的遗传贡献越大。 这常常是必需的, 因为耐受性植物否则可为非期望的, 例如因 为低产量、 低结实率等。 与之相反, 品种是多次育种程序的结果, 它可具有优异的产量、 结实 率等, 仅仅缺乏一个期望性状如 GLS 耐受性。
通过本文所述的任何方法来确定在植物基因组中存在和 / 或不存在特定遗传标 记或等位基因如 PHM 15534、 PHM 04694、 PHM 01811、 PHM 01963、 PHM 05013、 和 PHM 00586 ; 以及设计用于 bacb.pk0333.o19( 如 PHM 00043)、 bacc.pk0267.m12.f、 cl33021_1、 bacb. pk0241.h17.f、 chp2.pk0007.d2、 p0094.csstg88、 bacb.pk0269.n19、 bacb.pk0009.b21. f、 bacb.pk0117.i09.f、 bacc.pk0280.n12、 bacb.pk0219.j20、 bacc.pk0132.b16.f、 bacb. pk0221.o22、 bacb.pk0544.j18、 bacb.pk0540.c18.f、 andbacm.pk022.b8( 如 PHM 00049) 的 标记, 以及任何染色体区间 (i)BNLG1755 和 UMC1299, (ii)BNLG1755 和 BNLG1621A, (iii) BNLG1755 和 MMC0371, (iv)BNLG1755 和 UMC1702, (v)UMC156A 和 UMC1299, (vi)UMC156A 和 BNLG1621A, (vii)UMC156A 和 MMC0371, (viii)UMC156A 和 UMC1702, (ix)UMC1142 和 UMC1299, (x)UMC1142 和 BNLG1621A, (xi)UMC1142 和 MMC0371, (xii)UMC1142 和 UMC1702, (xiii)UMC1346 和 UMC1299, (xiv)UMC1346 和 BNLG1621A, (xv)UMC1346 和 MMC0371, 以及 (xvi)UMC1346 和 UMC1702。如果来自植物的核酸就期望遗传标记等位基因而言是阳性的, 该植物可为自花授粉的以制备具有相同基因型的纯种品系, 或者它可与具有相同标记或其 他期望特性的植物杂交以制备有性杂交的杂交世代。
将有利等位基因渗入 -- 将耐受性标记高效回交于优良品系
在本发明的情况下, MAS 的一个应用是使用新赋予的耐受性或提高的耐受性以提 高渗入或回交的效率, 渗入或回交的目的在于将耐受性 QTL 导入期望的 ( 通常是高产量 ) 背景。在特定标记 ( 以及关联的 QTL) 的标记辅助回交中, 例如从供体来源回交到优良的或 外来的遗传背景, 技术人员在回交子代中选择供体性状, 然后重复回交到优良的或外来的 品系以重构尽可能多的优良 / 外来背景的基因组。
因此可利用本发明的标记和方法指导标记辅助选择或玉米品种的育种, 所述玉米 品种具有期望的与优异农学性能关联的染色体片段等位基因形式的互补序列 ( 套 )( 用于 产量耐受性以及任何其他可用的标记等 )。通过传统的育种方法能将任何公开的标记等位 基因经由渗入导入玉米品系 ( 或经由转化导入, 或两种方法都使用 ) 以生成具有优异农学 性能的玉米植物。 与耐受性关联的等位基因的数目介于一和本文所公开的等位基因数目之 间, 所述耐受性可被导入或存在于本发明的玉米植物中, 其每个整数被引入本文明确引用。
本发明也提供了制备子代玉米植物的方法和这些子代玉米植物本身。 该方法包括 将第一亲本玉米植物与第二玉米植物杂交并在植物生长条件下培养雌性玉米植物以生成 玉米植物子代。本领域普通技术人员的能力足以掌握杂交方法和培养玉米植物的方法。能 检测分析此类玉米植物子代与耐受性关联的等位基因并从而选择期望的子代。 可商业售卖 此类子代植物或种子用于玉米生产、 用作食品、 处理以获取玉米的期望组分。 或者在随后若 干轮的育种中进一步利用。 第一玉米植物或第二玉米植物中的至少一个是本发明的玉米植物, 因为它包含至少其中一个本发明标记的等位基因形式, 使得子代能够继承该等位基因。
可将本发明的方法应用于至少一个相关的玉米植物如来自在受试玉米植物家谱 中的祖先或子代品系的玉米植物, 使得期望耐受性等位基因的继承可被追踪。分离经受本 发明方法的玉米植物的世代数一般将为 1 至 20, 常见 1 至 5, 通常 1、 2、 或 3 代分离, 并且相 当常用的是直系子代或亲本的玉米植物将经受该方法 ( 即一代分离 )。
当保持育种进行时渗入有利等位基因 -- 加入 “外来” 种质
遗传多样性就任何育种程序中的长期遗传增益而言是重要的。因为有限的多样 性, 当已经将所有有利等位基因固定在优良种群中时, 遗传增益将最终稳定下来。 一个目标 是用尽可能低的投资将多样性导入优良品种库, 同时不损失已经取得的遗传增益。 MAS 提供 从原始祖先中已经选择并长期保存了哪个基因组区域和哪个有利等位基因的指示, 有利于 从外来种质资源 ( 与优良基因库不相关的亲本 ) 中导入有利变异的尝试, 所述尝试希望发 现当前不存在于优良基因库中的有利等位基因。
例如在涉及优良 x 外来玉米品系的杂交中能使用本发明的标记进行 MAS, 通过使 分离子代经受 MAS 以保留主要的产量等位基因以及本文的耐受性标记等位基因。
定位克隆
如上文所述本发明的分子标记座位和等位基因如 PHM 15534、 PHM 04694、 PHM 01811、 PHM 01963、 PHM 05013、 和 PHM 00586 ; 以 及 设 计 用 于 bacb.pk0333.o19( 如 PHM 00043)、 bacc.pk0267.m12.f、 cl33021_1、 bacb.pk0241.h17.f、 chp2.pk0007.d2、 p0094. csstg88、 bacb.pk0269.n19、 bacb.pk0009.b21.f、 bacb.pk0117.i09.f、 bacc.pk0280. n12、 bacb.pk0219.j20、 bacc.pk0132.b16.f、 bacb.pk0221.o22、 bacb.pk0544.j18、 bacb. pk0540.c18.f、 and bacm.pk022.b8( 如 PHM 00049) 的 标 记, 以 及 任 何 染 色 体 区 间 (i) BNLG1755 和 UMC1299, (ii)BNLG1755 和 BNLG1621A, (iii)BNLG1755 和 MMC0371, (iv) BNLG1755 和 UMC1702, (v)UMC156A 和 UMC1299, (vi)UMC156A 和 BNLG1621A, (vii)UMC156A 和 MMC0371, (viii)UMC156A 和 UMC1702, (ix)UMC1142 和 UMC1299, (x)UMC1142 和 BNLG1621A, (xi)UMC1142 和 MMC0371, (xii)UMC1142 和 UMC1702, (xiii)UMC1346 和 UMC1299, (xiv) UMC1346 和 BNLG1621A, (xv)UMC1346 和 MMC0371, 以及 (xvi)UMC1346 和 UMC1702 可被用于 鉴定耐受性 QTL, 它能通过已确立的程序进行克隆, 例如详述于本文的 Ausubel、 Berger 和 Sambrook 的程序。
这些耐受性克隆首先通过它们与本发明标记的遗传连锁进行鉴定。通过任意多 种方法分离受关注的核酸, 例如在参考文献如本文的 Ausubel、 Berger 和 Sambrook 中详细 讨论的方法, 以及 Clark 编辑, (1997)Plant Molecular Biology : A Laboratory Manual Springer-Verlag, Berlin。
例如 “定位基因克隆” 使用接近的耐受性标记以物理上限定包含耐受性 QTL 基因 的分离染色体片段。能通过此类熟知的方法制备分离的染色体片段 : 如用一种或多种限制 性酶消化染色体 DNA, 或通过聚合酶链反应 (PCR) 扩增染色体区域, 或者任何适用的替代扩 增反应。 通常将消化的或扩增的片段连接到适于复制的载体中, 并且例如表达插入的片段。 邻近与表型性状关联的开放阅读框 (ORF) 的标记能与 DNA 克隆 ( 例如来自基因组 DNA 文库 的克隆 ) 杂交, 从而鉴定 ORF( 或者 ORF 的片段 ) 位于其上的克隆。如果标记距离较远, 通 过连续若干轮筛选和分离包含 DNA 邻近序列的克隆 ( 该过程称为 “染色体步移” ) 鉴定包含ORF 的片段, 产生 “重叠群” 或 “重叠群图谱” 。足以指导技术人员分离与连锁标记关联的克 隆的规程存在于例如本文的 Berger、 Sambrook 和 Ausubel。
生成转基因细胞和植物
本发明也涉及用对应于耐受性 QTL 的核酸转化的宿主细胞和生物体, 耐受性 QTL 根据本发明进行鉴定。 例如此类核酸包括染色体区间 ( 例如基因组片段 )、 ORF 和 / 或 cDNA, 它们编码新赋予的耐受性或提高的耐受性性状。 此外本发明提供通过重组技术生产多肽的 方法, 所述多肽提供新赋予的耐受性或提高的耐受性。
描述用于克隆和操纵核酸并生产编码多肽的分子生物学技术的一般文献包括上 文的 Berger、 Sambrook、 和 Ausubel。这些文献描述诱变、 载体的用途、 启动子和许多相关主 题, 例如与克隆世代相关的主题, 所述克隆包含受关注核酸如标记座位、 标记探针、 与标记 座位一起分离的 QTL 等。
用本发明的载体 ( 例如载体如表达载体, 它包含来源于耐受性 QTL 或与其相关的 ORF) 将宿主细胞遗传工程化 ( 例如转导、 转染、 转化等 ), 所述载体可为例如克隆载体、 穿 梭载体或表达载体。此类载体以例如以下形式存在 : 质粒、 噬粒、 农杆菌、 病毒、 裸多核苷酸 ( 线性或环状的 )、 或结合多核苷酸。 可将载体导入细菌中, 尤其是为了繁殖和增加。 也通过 本领域已知的多种标准方法将载体导入植物组织、 培养的植物细胞或植物原生质体, 包括 但不限于电穿孔 (From 等人 (1985)Proc.Natl.Acad.Sci.USA 82 : 5824)、 病毒载体感染如 花椰菜花叶病毒 (CaMV)(Hohn 等人 (1982)Molecular Biology of Plant Tumors(Academic Press, New York), 第 549-560 页 ; 美国专利 4,407,956)、 用在小珠基质或粒子内或表面 上具有核酸的粒子进行高速轰击穿透 (Klein 等人 (1987)Nature 327 : 70)、 用花粉作载体 (WO85/01856)、 或用携带其中克隆 DNA 片段的 T-DNA 质粒的根癌农杆菌或发根农杆菌。通 过根癌农杆菌感染将 T-DNA 质粒传递到植物细胞中, 并且将一部分 T-DNA 质粒稳定整合进 植物基因组中 (Horsch 等人 (1984)Science233 : 496 ; Fraley 等人 (1983)Proc.Natl.Acad. Sci.USA 80 : 4803)。关于核酸导入方法的附加细节可见于上文的 Sambrook、 Berger 和 Ausubel。 将本发明的核酸导入宿主细胞的方法就本发明而言不是至关重要的, 并且本发明 不旨在受将外源遗传材料导入宿主细胞的任何特定方法的限制。 因此可使用任何合适的方 法用于本发明, 所述方法例如包括但不限于本文提供的方法, 该方法将核酸有效导入细胞 或原生质体中。
可在常规营养物质培养基中培养工程化宿主细胞, 所述培养基经合适的改性以获 得此类活性如活化启动子或选自转化体。 可任选地培养这些细胞, 使它们进入转基因植物。 除了上文的 Sambrook、 Berger 和 Ausubel 外, 从培养原生质体中再生植物描述于 Evans 等 人 (1983)“Protoplast Isolation and Culture” , Handbook of Plant Cell Cultures 1, 124-176(MacMillan Publishing Co.), New York ; Davey(1983)“RecentDevelopments in the Culture and Regeneration of Plant Protoplasts” , Protoplasts,第 12-29 页, (Birkhauser, Basel) ; Dale(1983)“ProtoplastCulture and Plant Regeneration of Cereals and Other Recalcitrant Crops” , Protoplasts, 第 31-41 页, (Birkhauser, Basel) ; Binding(1985) “Regeneration of Plants” , Plant Protoplasts, 第 21-73 页, (CRC Press, Boca Raton, FL)。 关于植物细胞培养和再生的附加细节包括 Payne 等人 (1992)Plant Cell and Tissue Culture in Liquid Systems John Wiley&Sons, Inc.New York, NY ;Gamborg 和 Phillips( 编辑 )(1995)Plant Cell, Tissue and Organ Culture ; Fundamental Methods Springer Lab Manual, Springer-Verlag(Berlin Heidelberg New York) 以及 Plant MolecularBiology(1993)R.R.D.Croy 编辑, Bios Scientific Publishers, Oxford, U.K.ISBN 0 12 198370 6。细胞培养基通常也如 Atlas 和 Parks( 编辑 )The Handbook of Microbiolo gical Media(1993)CRC Press, Boca Raton, FL 所示。细胞培养的附加信 息可见于可商购获得的文献如 Life ScienceResearch Cell Culture Catalogue(1998), 得 自 Sigma-Aldrich, Inc.(StLouis, MO)(“Sigma-LSRCCC” ), 以 及 例 如 Plant Culture Catalogue 和补充文献 ( 例如 1997 或随后的文献 ), 它们也得自 Sigma-Aldrich, Inc.(St Louis, MO)(“Sigma-PCCS” )。
本发明也涉及转基因生物的制备, 转基因生物可为细菌、 酵母、 真菌、 动物或植物, 它们用本发明的核酸转导 ( 例如本文所述的包含标记座位和 / 或 QTL 的核酸 )。与细菌、 单细胞真核生物和细胞培养物有关的技术详细讨论可见于本文列举的参考文献并在下文 中略述。将靶核酸导入细菌细胞的若干种熟知方法是可用的, 本发明可使用任何一种方 法。这些方法包括 : 融合受体细胞与包含 DNA 的细菌原生质体、 用包含 DNA 的脂质体处理细 胞、 电穿孔、 基因枪轰击 (biolistics)、 碳纤维递送、 以及用病毒载体感染 ( 下文进一步讨 论 ) 等。可使用细菌细胞扩增包含本发明 DNA 构建体的质粒的数目。细菌生长至对数期, 并且可通过本领域已知的多种方法分离在细菌中的质粒 ( 参见例如 Sambrook)。此外用于 纯化来自细菌的质粒的多种试剂盒是可商购获得的。按照制造商的说明书正确地使用它 们 ( 参见例如 EasyPrepTM、 FlexiPrepTM, 它们都来自 Pharmacia Biotech ; StrataCleanTM, 来自 Stratagene ; 以及 QIAprepTM, 来自 Qiagen)。然后进一步操纵经分离和纯化的质粒以 制备其他质粒, 所述质粒用于转染植物细胞或导入根癌农杆菌相关载体以感染植物。一般 的载体包含转录和翻译终止子、 转录和翻译启动序列、 以及用于调控特定靶核酸表达的启 动子。载体任选地包含遗传表达盒, 该表达盒包含至少一个独立的终止子序列、 允许该盒 在真核生物或原核生物或两种细胞中均复制的序列 ( 例如穿梭载体 ) 以及用于原核系统 和真核系统的选择标记。载体适于在原核生物、 真核生物、 或优选两者中复制并整合。参 见 Giliman&Smith(1979)Gene 8 : 81 ; Roberts 等人 (1987)Nature 328 : 731 ; Schneider 等 人 (1995)Protein Expr.Purif.6 : 10 ; Ausubel、 Sambrook、 Berger( 所有同上 )。提供了 用于克隆的细菌和噬菌体的目录, 例如美国典型培养物保藏中心 (ATCC) 提供目录, 如 The ATCC Catalogue of Bacteria andBacteriophage(1992)、 Gherna 等人 ( 编辑 ) 由 ATCC 公 布的目录。用于测序、 克隆和分子生物学其他方面的附加基本程序及其理论基础也可见于 Watson 等人 (1992), Recombinant DNA, 第二版, ScientificAmerican Books, NY。此外, 基本上任何核酸 ( 事实上任何标记核酸, 无论是标准的或非标准的 ) 可从多个商业来源中 的任何一个定制或订购标准品, 如 Midland Certified Reagent Company(Midland, TX)、 TheGreat American Gene Company(Ramona, CA)、 ExpressGen Inc.(Chicago, IL)、 Operon Technologies Inc.(Alameda, CA) 以及多个其他公司。
将核酸导入植物中。
本发明的实施方案涉及生产包含克隆核酸的转基因植物, 例如分离 ORF 和编码耐 受性基因的 cDNA。用核酸转化植物的技术是广泛可用的并易于适应本发明。除上文所有 的 Berger、 Ausubel 和 Sambrook 外, 用于植物细胞克隆、 培养和再生的可用一般参考文献包括 Jones( 编辑 )(1995)Plant Gene Transfer and Expression Protocols--Methods inMolecular Biology, Volume 49 Humana Press Towata NJ(“Jones” ); Payne 等 人 (1992)Plant Cell and Tissue Culture in Liquid Systems John Wiley&Sons, Inc.New York, NY(“Payne” ); 以及 Gamborg 和 Phillips( 编辑 )(1995)Plant Cell, Tissue and Organ Culture ; Fundamental MethodsSpringer Lab Manual, Springer-Verlag(Berlin Heidelberg New York)(“Gamborg” )。多种细胞培养基也描述于 Atlas 和 Parks( 编辑 ) TheHandbook of Microbiological Media(1993)CRC Press, Boca Raton, FL( “Atlas” )。 植 物细胞培养的附加信息可见于可商购获得的文献如 Life Science Research Cell Culture Catalogue(1998), 得 自 Sigma-Aldrich, Inc.(St Louis, MO)(Sigma-LSRCCC), 以及例如 PlantCulture Catalogue and supplement(1997), 它们也得自 Sigma-Aldrich, Inc.(St Louis, MO)(Sigma-PCCS)。关于植物细胞培养的附加细节可见于 Croy。
通过多种常规技术将本发明的核酸构建体如质粒、 黏性质粒、 人工染色体、 DNA 和 RNA 多核苷酸导入在培养物或植物器官中的植物细胞中。其中表达所述序列, 该序列任选 地与转录和翻译启动调控序列结合, 所述调控序列在转化植物的目标组织中引导来自外源 DNA 的序列的翻录或翻译。
可根据本领域已知的多种技术将本发明的分离核酸导入植物。 用于转化多种高等 植物物种的技术也是为人们熟知的, 并且被描述于广泛可用的技术、 科学、 和专利文献中。 参见例如 Weising 等人 (1988)Ann.Rev.Genet.22 : 421-477。
本发明的 DNA 构建体如质粒、 噬菌粒、 黏性质粒、 噬菌体、 裸多核苷酸或不同结合 的 DNA 多核苷酸 ( 例如结合聚赖氨酸的 DNA、 结合多肽的 DNA、 结合脂质体的 DNA)、 或人工染 色体, 可将它们直接导入植物细胞的基因组 DNA, 使用的导入技术如电穿孔和显微注射植物 细胞原生质体, 或者可使用轰击方法将 DNA 构建体直接导入植物细胞, 如 DNA 粒子轰击。
显微注射技术用于注射植物如细胞、 胚芽、 愈伤组织和原生质体, 该技术是本领域 已知的并详述于科学和专利文献中。例如许多方法在 Jones 以及本文所述的其他参考文献 中描述, 并且在文献中可用。
例如使用聚乙二醇沉淀导入 DNA 构建体, 描述于 Paszkowski 等人, EMBO J.3 : 2717(1984)。电穿孔技术描述于 Fromm 等人, Proc.Natl.Acad.Sci.USA 82 : 5824(1985)。 粒子轰击转化技术描述于 Klein 等人, Nature 327 : 70-73(1987)。 附加的细节可见于 Jones 和 Gamborg, 同上, 并且可见于美国专利 5,990,387。
作为另外一种选择并且优选地在某些情况下, 使用农杆菌介导转化以生成转基因 植物。农杆菌介导转化技术包括消除并使用二元载体, 该技术也详述于科学文献中。参见 例如 Horsch 等人 (1984), Science233 : 496 ; Fraley 等人 (1984)Proc.Natl.Acad.Sci.USA 80 : 4803 : 以 及 参 见 Hansen 和 Chilton(1998)Curr.Top.Microbiol.Immunol.240 : 21 和 Das(1998)Subcellular Biochemistry 29 : Plant Microbe Interactions, 第 343-363 页。
将 DNA 构建体任选地与合适的 T-DNA 侧接区域结合并将其导入常规根癌农杆菌宿 主载体。当根癌农杆菌感染细胞时, 根癌农杆菌宿主的致病功能将引导构建体和邻近的标 记插入植物细胞 DNA。参见美国专利 5,591,616。尽管农杆菌主要用于双子叶植物, 但某些 单子叶植物可被农杆菌转化。例如玉米的农杆菌转化描述于美国专利 5,550,318 中。
转染或转化的其他方法包括 (1) 发根农杆菌介导的转化 ( 参见例如 Lichtenstein和 Fuller(1987) : Genetic Engineering,第 6 卷, PWJ Rigby 编 辑, London, Academic Press ; 以及 Lichtenstein 和 Draper(1985) : DNACloning, 卷 II, D.M.Glover 编辑, Oxford, IRI Press ; 公布于 1988 年 4 月 7 日的 WO 88/02405 描述了发根农杆菌菌株 A4 及其 Ri 质 粒以及根癌农杆菌载体 pARC8 或 pARC16 的用途 ), (2) 脂质体介导的 DNA 摄入 ( 参见例 如 Freeman 等人 (1984)Plant Cell Physiol.25 : 1353), 以及 (3) 涡旋方法 ( 参见例如 Kindle(1990)Proc.Natl.Acad.Sci.(USA)87 : 1228)。
也可通过直接引导 DNA 转移到花粉中将 DNA 导入植物, 该方法描述于 Zhou 等 人, (1983)Meth.Enzymol.101 : 433 ; D.Hess(1987)Intern Rev.Cytol.107 : 367 ; Luo 等 人 (1988)Plant Mol.Biol.Rep.6 : 165。可通过将 DNA 注入植物生殖器官表达多肽编码基因, 如 Pena 等人, (1987)Nature 325 : 274 所述。也可将 DNA 直接注入未成熟胚芽和再水合 的干燥胚芽细胞中, 该技术描述于 Neuhaus 等人, (1987)Theor.Appl.Genet.75 : 30 ; 以及 Benbrook 等人 (1986), Proceedings Bio ExpoButterworth, Stoneham, Mass., 第 27-54 页。 可用作载体的多种植物病毒是本领域已知的并包括花椰菜花叶病毒 (CaMV)、 双生病毒、 雀 麦花叶病毒、 和烟草花叶病毒。
转基因植物的生成 / 再生 可培养通过任何一种上述转化技术获得的转化植物细胞以再生具有转化基因型 并因此具有期望表型的整个植株。此类再生技术依靠操纵在组织培养物生长培养基中的 某些植物激素, 通常依靠生物杀灭剂和 / 或除草剂标记, 它们与期望的核苷酸序列一起 被导入。从培养的原生质体中再生植物描述于 Payne ; Fundamental Methods Springer LabManual, Springer-Verlag(Berlin Heidelberg New York) ; Evans 等 人 (1983) Protoplasts Isolation and Culture, Handbook of Plant Cell Culture 第 124-176 页, Macmillian Publishing Company, New York ; 以及 Binding(1985)Regeneration of Plants, Plant Protoplasts 第 21-73 页, CRC Press, Boca Raton。也能从植物愈伤组织、 外植体、 体细胞胚芽 (Dandekar 等人 (1989)J.Tissue Cult.Meth.12 : 145 ; McGranahan 等人 (1990)Plant Cell Rep.8 : 512)、 器官、 或它们的部分中再生植物。此类再生技术一般描述 于 Klee 等人 (1987)Ann.Rev.Plant Phys.38 : 467-486。 附加的细节存在于 Payne 和 Jones, 二者均如上所述, 以及 Weissbach 和 Weissbach 编辑, (1988)Methods for Plant Molecular Biology AcademicPress, Inc., San Diego, CA。 这种再生和生长过程包括以下步骤 : 选择转 化细胞和苗, 使转化体苗生根, 并在土壤中使苗生长。这些方法适合本发明以制备具有 QTL 的转基因植物和根据本发明方法分离的其他基因。
此外能再生包含本发明多核苷酸和通过农杆菌导入叶片外植体细胞的多核苷酸 的植物的再生, 如 Horsch 等人, (1985)Science227 : 1229-1231 所述。在该方法中, 在存在 选择剂的情况下在诱导转化植物苗再生的培养基中使转化体生长, 如 Fraley 等人 (1983) Proc.Natl.Acad.Sci.(U.S.A.)80 : 4803 所述。该方法通常在二至四周中生成苗, 然后将 这些转化体苗转移到合适的苗诱导培养基中, 该培养基包含选择剂和防止细菌生长的抗生 素。本发明的转基因植物可为能繁殖的或不能繁殖的。
本发明提供的导致病害耐受性的多肽的转化和表达不旨在受玉米物种的限制。 实 际上预期在玉米中提供期望耐受性的多肽当在其他农学上和园艺上重要的物种中转化和 表达时也能提供此类耐受性。此类物种包括例如 : 大豆、 油菜、 苜蓿、 小麦、 向日葵、 和高粱。
在本发明的重组表达盒构建过程中 ( 表达盒包括例如包含致病功能的辅助质粒、 以及包含外源 DNA 序列如结构基因的质粒或病毒 ), 任选地使用植物启动子片段, 该片段在 再生植物的任何或所有组织中引导核酸表达。组成型启动子的实例包括花椰菜花叶病毒 (CaMV)35S 转录初始区、 来源于根癌农杆菌的 T-DNA 的 1′ - 或 2′ - 启动子、 以及来自技术 人员已知的多种植物的其他转录初始区。作为另外一种选择, 植物启动子可在特定组织中 引导本发明多核苷酸的表达 ( 组织特异性启动子 ), 或者否则可在较精确的环境控制条件 下引导本发明多核苷酸的表达 ( 诱导型启动子 )。处于发育控制下的组织特异性启动子的 实例包括仅在一些组织例如果实、 种子或花中启动转录的启动子。
在植物细胞中引导转录的多个启动子中的任何一个可为适用的。该启动子可为 组成型启动子或诱导型启动子。除上述启动子外, 在植物中起作用的细菌来源启动子还 包括章鱼碱合酶启动子、 胭脂碱合酶启动子和其他来源于天然 Ti 质粒的启动子。参见 Herrara-Estrella 等人 (1983)Nature 303 : 209。病毒启动子包括花椰菜花叶病毒 35S 和 19SRNA 启动子。参见 Odell 等人 (1985)Nature 313 : 810。其他植物启动子包括 Kunitz 胰 蛋白酶抑制剂启动子 (KTI)、 SCP1、 SUP、 UCD3、 核酮糖 -1, 3- 二磷酸羧化酶小亚基启动子和 菜豆蛋白启动子。也可使用来自 E8 基因和其他基因的启动子序列。E8 启动子的分离和序 列详述于 Deikman 和 Fischer(1988)EMBO J.7 : 3315 中。当前使用许多其他启动子, 并且能 将启动子连接到外源 DNA 序列上以引导核酸表达。
如果期望从 cDNA 表达多肽, 则通常包括在编码区的 3′末端的聚腺苷酸化区。该 聚腺苷酸化区可源自天然基因、 源自多种其他植物基因或源自例如 T-DNA。
包含来自编码表达产物和本发明转基因序列 ( 例如启动子或编码区 ) 的载体将 通常包括核酸亚序列、 赋予植物细胞可选择的或供选择的、 可筛选的表型的标记。例如 该标记能编码生物杀灭剂耐受性尤其是抗生素耐受性, 如卡那霉素、 G418、 博莱霉素、 潮 霉素耐受性, 或除草剂耐受性如氯磺隆或草胺膦 ( 在除草剂双丙氨磷或 Basta 中的活性 成 分 ) 耐受 性。参 见例 如 Padgette 等 人 (1996) : Herbicide-Resistant Crops(Duke 编 辑 ), 第 53-84 页, CRC Lewis Publishers, Boca Raton。例如可通过工程化基因到作物中 赋予作物对特定除草剂的选择性, 所述基因编码来自其他生物如微生物的合适的除草剂 代谢酶。参见 Vasil(1996) : Herbicide-Resistant Crops(Duke 编辑 ), 第 85-91 页, CRC LewisPublishers, Boca Raton)。
技术人员将认识到在将重组表达盒稳定地导入转基因植物中并确认其可操作后, 可通过有性杂交将其导入其他植物中。取决于将进行杂交的物种, 可使用多种标准育种技 术中的任何一种。在无性繁殖作物中, 成熟的转基因植物能通过插枝或组织培养技术来繁 殖以制备多个相同植物。 选择期望转基因并获取新品种, 将其无性繁殖用于商业。 在种子繁 殖的农作物中, 成熟的转基因植物可以自交而产生纯合的自交系植物。自交植物产生包含 新导入的异源核酸的种子。这些种子可生长以产生植物, 该植物将产生所选择的表型。本 发明包括从再生植物获取的部分如花、 种子、 叶片、 枝、 果实等, 前提条件是这些部分包含具 有本发明分离核酸的细胞。 再生植物的子代和变型、 以及突变体也在本发明的范围内, 前提 条件是这些部分包含导入的核酸序列。
可通过例如标准核酸检测方法或通过免疫印迹规程来筛选表达本发明的多核苷 酸的转基因或基因渗入植物以传递本发明的核酸。能测定 RNA 水平的表达以鉴定和测定阳性表达的植物。能使用 RNA 分析标准技术, 并且该技术包括使用设计仅用于扩增异源或渗 入 RNA 模板的寡核苷酸引物的 RT-PCR 扩增检测分析法, 以及使用标记或连锁 QTL 特异探针 的溶液杂交检测分析法。也能分析植物的蛋白表达, 例如通过使用抗体的 Western 免疫印 迹分析, 该抗体识别编码的多肽。 此外根据标准规程能进行原位杂交和免疫细胞化学分析, 该分析分别使用异源核酸特异性多核苷酸探针和抗体以定位在转基因组织中的表达位点。 通常筛选许多转基因品系的导入核酸以鉴定和选择具有最适合的表达谱的植物。
本发明的一个实施方案是就加入的异源核酸而言是纯合的转基因植物 ; 例如包含 两个加入核酸序列拷贝的转基因植物, 如在同源染色体对的每个染色体上的相同基因座的 基因。纯合的转基因植物能通过有性交配 ( 自花授粉的 ) 杂合转基因植物获取, 杂合的转 基因植物包含一个单独加入的异源核酸, 使得一些产生的种子发芽并分析所得植物, 该植 物相对于对照植物 ( 例如天然的非转基因植物 ) 改变了本发明的多核苷酸表达产生。能通 过对亲本植物的回交和对非转基因植物的异交将异源核酸渗入选择的背景 ( 例如优良的 或外来的玉米品系 )。
评估并生产 GLS 耐受性玉米植物的方法
有经验的植物育种人员能识别田间的耐受性玉米植物并能选择耐受性个体或种 群用于育种目的或繁殖。在这种情况下, 植物育种人员识别 “耐受性” 和 “非耐受性” 、 或 “易 感的” 玉米植物。
此类植物育种从业者将会知道植物耐受性是一种表型谱, 由极端耐受性和易感性 以及连续统中等耐受性表型组成。耐受性也根据环境效应和病原体感染的严重程度而变 化。使用可重现的检测分析法和耐受性评分方法进行表型评估对科学家而言是有价值的, 科学家例如寻找鉴定赋予耐受性的基因座的方法, 进行耐受性种群的标记辅助选择, 并且 将耐受性性状经由渗入技术育种到优良玉米品系中。
和将植物归类为 “耐受性” 或 “易感性” 的偶然田间观察形成对比, 已知多种体系 用于对植物耐受性或易感性程度评分。可将这些技术在不同时间应用于不同的田地, 并且 提供近似的耐受性评分, 无论任何生长条件或位置, 该评分可用于表征给定品种。
本发明也涉及通过将第一亲本玉米植物与第二亲本玉米植物杂交的方法生产玉 米植物, 其中第一亲本玉米植物或第二亲本玉米植物是 PHJEP 品系的自交玉米植物。此外 第一亲本玉米植物和第二亲本玉米植物都可来自自交玉米品系 PHJEP。此外本发明也涉及 生产自交玉米品系 PHJEP 来源的玉米植物的方法, 该方法通过杂交自交玉米品系 PHJEP 与 第二玉米植物、 使子代种子生长、 并且重复与自交玉米品系 PHJEP 来源的植物的杂交和生 长步骤 0 至 5 次。因此使用自交玉米品系 PHJEP 的任何此类方法是本发明的一部分 : 自交、 回交、 杂交体生产、 杂交到种群等。所有使用自交玉米品系 PHJEP 作亲本生产的植物处于本 发明的范围内, 包括来源于自交玉米品系 PHJEP 的植物。有利的是, 将自交玉米品系用于与 其他不同玉米杂交体的杂交以生产第一代 (F1) 玉米杂交体种子和具有优异特性的植物。
应当理解能通过细胞质或其他因子的常规操纵以雄性不育形式来生产自交体。 此 类实施方案也被设想在本发明权利要求的范围内。
如本文所用, 术语植物包括植物细胞、 植物原生质体、 从其中再生玉米植物的植物 细胞组织培养物、 植物愈伤组织、 植物, 植物丛生物、 以及在植物或植物部分中完整的植物 细胞如胚芽、 花粉、 胚珠、 花、 仁、 穗、 芯、 叶片、 壳、 茎、 根、 根尖、 花药、 须等。Duncan 等人, Planta(1985)165 : 322-332 反映 97 %的产生愈伤组织的培养植物 能够再生植物。随后用自交体和杂交体进行的实验生产 91%的产生植物的可再生愈伤组 织。在进一步的研究中, 1988, Songstad 等人, Plant Cell Reports(1988), 7: 262-265 报 道了若干个培养基添加物, 该添加物促进两个自交品系的愈伤组织再生。其他公布的报道 也指示 “非传统的” 组织能够形成体细胞胚胎并再生植物。K.P.Rao 等人, Maize Genetics Cooperation Newsletter, 60 : 64-65(1986) 提到从颖片愈伤组织培养物中形成体细胞胚 胎, B.V.Conger 等人, PlantCell Reports, 6: 345-347(1987) 指出体细胞胚胎从玉米叶结 组织培养物中形成。 因此从文献中清楚地看出技术发展水平是使得这些获取植物的方法在 现在及过去都是 “常规的” , 这意味着它们被常规使用并且具有非常高的成功率。
玉米组织培养描述于欧洲专利申请公布 160,390, 该文献以引用方式并入本文。 玉米组织培养程序也描述于 Green 和 Rhodes, “PlantRegeneration in Tissue Culture of Maize” , Maize for Biological Research(Plant Molecular Biology Association, Charlottesville, Va.1982, 367-372) 以 及 Duncan 等 人, “The Production of Callus Capable of PlantRegeneration from Immature Embryos of Numerous Zea Mays Genotypes” , 165 Planta 322-332(1985)。因此本发明的另一方面是为了提供当生长和分 化时产生玉米植物的细胞, 所述玉米植物具有自交品系 PHJEP 的生理和形态特性。
自交玉米品系 PHJEP 的应用也扩展到与其他物种的杂交。适用的物种一般将是禾 本科 (Graminaceae), 尤其是玉蜀黍 (Maydeae) 族的玉蜀黍 (Zea) 属、 摩擦禾 (Tripsacum) 属、 薏苡 (Coix) 属、 硬颖草 (Schierachne) 属, 多裔黍 (Polytoca) 属、 葫芦草 (Chionachne) 属、 和三裂草 (Trilobachne) 属。潜在适用于与 PHJEP 杂交的物种可为高梁的不同品种双 色高粱 (Sorghum bicolor)(L.)Moench。
本发明的自动化检测 / 关联系统
在一些实施方案中, 本发明包括用于检测本发明标记和 / 或与期望表型 ( 例如耐 受性 ) 关联的标记的自动化系统。因此一般系统可包括一组标记探针或引物, 构造它们用 于检测一个或多个与新赋予的 GLS 耐受性或提高的 GLS 耐受性关联的标记座位的至少一个 有利等位基因。构造这些探针或标记以检测本文表和实施例中提到的标记等位基因, 例如 使用任何可用的等位基因检测形式如基于固相或液相阵列的检测、 基于微流体的样品检测 等。
例如在一个实施方案中, 标记座位是 PHM 15534、 PHM 04694、 PHM 01811、 PHM 01963、 PHM 05013、 和 PHM 00586, 或者它们的任何组合, 以及任何染色体区间 (i)BNLG1755 和 UMC1299, (ii)BNLG1755 和 BNLG1621A, (iii)BNLG1755 和 MMC0371, (iv)BNLG1755 和 UMC1702, (v)UMC156A 和 UMC1299, (vi)UMC156A 和 BNLG1621A, (vii)UMC156A 和 MMC0371, (viii)UMC156A 和 UMC1702, (ix)UMC1142 和 UMC1299, (x)UMC1142 和 BNLG1621A, (xi) UMC1142 和 MMC0371, (xii)UMC1142 和 UMC1702, (xiii)UMC1346 和 UMC1299, (xiv)UMC1346 和 BNLG1621A, (xv)UMC1346 和 MMC0371, 以及 (xvi)UMC1346 和 UMC1702, 或者它们的任何组 合, 并且构造出探针组以检测该基因座。
一般的系统包括一个检测器, 该检测器被构造为检测从标记探针或引物组或它们 的扩增子中输出的一种或多种信号, 从而确定等位基因是否存在。很多种信号检测设备是 可用的, 包括光电倍增管、 分光光度计、 CCD 阵列、 阵列和阵列扫描器、 扫描检测器、 光电管和光电二极管、 显微镜工作站、 galvo 扫描仪、 微流体核酸扩增检测设备等。检测器的精确构 型将部分取决于用于检测标记等位基因的标记类型, 以及使用者最方便获得的仪器。可使 用检测器检测荧光、 磷光、 放射性、 pH、 电荷、 吸光度、 发光、 温度、 磁力等。 一般的检测器实施 方案包括光 ( 如荧光 ) 检测器或放射性检测器。例如检测到发光 ( 例如发荧光 ) 或其他探 针标记指示存在或不存在标记等位基因。荧光检测是尤其优选的, 并且一般用于检测扩增 的核酸 ( 然而也能对扩增子进行上游和 / 或下游操纵, 这可涉及其他检测方法 )。 检测器通 常从探针标记中检测一种或多种标记 ( 例如发光 ), 它指示标记等位基因是否存在。
检测器任选地监控来自扩增反应的一个或多个信号。例如检测器能监控光信号, 该信号对应于 “实时” 扩增检测分析结果。
将是否存在有利等位基因与预测耐受性关联的系统说明书也是本发明的一个特 征。例如该说明书能够包括至少一个查找表, 该表包括是否存在有利等位基因与预测的新 赋予耐受性或提高耐受性的关联。该说明书的具体形式可根据该系统组成而不同, 例如它 们可能以系统软件形式在系统的一个或多个整合单位中存在 ( 例如微处理器、 电脑或电脑 可读的介质 ), 或者能在与检测器可操作连接的一个或多个单位 ( 例如电脑或电脑可读的 介质 ) 中存在。如在一个一般实施方案中所述, 该系统说明书包括至少一个查找表, 该表包 括是否存在有利等位基因与预测的新赋予耐受性或提高耐受性的关联。 说明书也通常包括 提供系统的使用者接口的说明, 例如允许使用者观看样品分析结果及输入参数到系统中的 接口。
系统通常包括存储或传递电脑可读数据的组件, 所述数据提供或指明通过本发明 方法检测的等位基因, 例如在自动化系统中。 电脑可读的介质能够包括高速缓冲存储器、 主 存储器、 和存储器和 / 或其他电子数据存储部件 ( 硬盘、 软盘、 存储盘等 ) 用于存储计算机 编码。 通过本发明方法检测的描述等位基因的数据也能通过电子、 光学、 或磁力传递到电脑 数据信号中, 该信号经过网络如内联网或因特网或它们的组合被保存在传递介质中。该系 统也能或可供选择地经由无线的、 IR、 或其他可用的供选择的替代方案传递数据。
在运行期间, 系统通常包含一个供分析的样品, 如植物组织或从组织中分离的材 料, 如基因组 DNA、 扩增的基因组 DNA、 cDNA、 扩增的 cDNA、 RNA、 扩增的 RNA 等。
在本发明的情况下短语 “等位基因检测 / 关联系统” 指这样一种系统 : 其中进入 电脑的数据对应于物理目标或电脑的外部处理, 例如标记等位基因和在电脑内的处理, 该 处理引起输入信号被物理转化成不同的输出信号。换句话说, 将输入数据如特定标记等位 基因的扩增转化成输出数据如染色体片段等位基因形式的鉴定。 电脑内的处理是一套指令 或 “程序” , 由此通过整合系统识别阳性扩增或杂交信号并将个体样品归为基因型。附加程 序如统计方法将个体样品的特性与表型评价或标记等位基因关联。 此外存在用于计算的多 个 C/C++ 程序、 用于 GUI 接口的 Delphi 和 / 或 Java 程序、 以及用于制图或制备有关等位基 因 - 性状关联的查找表的制作工具 ( 例如 Microsoft Excel 和 / 或 SigmaPlot)。在本发明 的整合系统中其他有用的软件工具包括统计软件包如 SAS、 Genstat、 Matlab、 Mathematica、 和 S-Plus 以及遗传建模软件包如 QU-GENE。此外附加的程序语言如 visual basic 也适用 于本发明的整合系统。
例如将分配给得自优良品系间杂交的一组子代的耐受性标记等位基因值记录在 电脑可读介质中, 从而建立对应耐受性等位基因与子代种群成员的唯一标识的数据库。适于在电脑可读介质中记录数据的任何文件或文件夹, 不管是定制的还是可商购获得的 ( 例 如购自 Oracle 或 Sybase), 在本发明的情况下可接受作为数据库。关于一个或多个分子标 记的基因型的数据, 例如如本文所述的 ASH、 SSR、 RFLP、 RAPD、 AFLP、 SNP、 CAPS、 同功酶标记 或其他标记, 同样被记录在电脑可用的数据库中。 任选地使用整合系统获取标记数据, 该系 统使用于测定标记基因型的检测分析方法的一个或多个方面自动化。在这种系统中, 输入 数据对应于分子标记的基因型, 它从检测器 ( 如阵列、 扫描仪、 CCD、 或其他检测装置 ) 被直 接转播到中央处理单位可用的电脑可读介质的文件中。 然后通过计算装置执行编码耐受性 和本发明等位基因间关联的一套系统指令 ( 通常用一个或多个程序实现 ) 以确认标记等位 基因和预测性状表型间的关联。
系统通常也包括用户输入装置, 如键盘、 鼠标、 触摸屏等 ( 例如用于选择文件、 检 索数据、 查阅制造者信息表 ), 以及输出装置 ( 例如监控器、 打印机 ) 用于查阅或回收统计分 析的结果。
因此在一个方面, 本发明提供包括电脑或电脑可读介质的整合系统, 所述介质包 含一组文件和 / 或数据库, 它们具有至少一个对应于本文标记等位基因的数据集。所述系 统也包括使用者接口, 允许使用者选择性地查阅一个或多个这些数据库。此外可使用标准 文本处理软件如字处理软件 ( 例如 Microsoft WordTM 或 Corel WordPerfectTM) 以及数据库 或电子表格软件 ( 例如电子表格软件如 Microsoft ExcelTM、 CorelQuattro ProTM、 或数据库 TM TM 程序如 Microsoft Access 或 Paradox ), 这些软件与使用者接口一起使用 ( 例如在标准 操作系统中的 GUI 如 Windows、 Macintosh、 Unix 或 Linux 系统 ) 以操纵对应于等位基因或 数据库其他部分的字符串。
所述系统任选地包括用于样品操纵的组件, 例如加入机械手装置。例如机械手液 体控制电枢用于将溶液 ( 例如植物细胞提取物 ) 从一个来源转移到目的地, 例如从微滴定 板转移到阵列基质, 将该电枢任选地可操作地连接至数字电脑 ( 或者连接至整合系统中的 附加电脑 )。 输入装置一般是整合系统的一个特征, 该装置用于将数据输入数字电脑以通过 机械手液体控制电枢控制高通量液体转移, 并且任选地通过电枢控制到固体载体的转移。 多种此类自动化机械手流体处理系统是可商购获得的。例如多种自动化系统得自 Caliper Technologies(Hopkinton, MA), 它利用多种 Zymate 系统, 该系统通常包括例如机械手和流 体处理模块。同样地, 用于多种实验室系统例如微量滴定盘的常见 机械手也是可 商购获得的, 例如来自 BeckmanCoulter, Inc.(Fullerton, CA)。作为常规机械手的可供选 择的备选系统, 进行流体处理和检测的微流体系统现在是广泛可用的, 例如来自 Caliper Technologies Corp.(Hopkinton, MA) 和 Agilent Technologies(Palo Alto, CA)。
因此用于本发明分子标记分析的系统可包括数字电脑, 它具有一个或多个高通量 液体控制软件、 用于分析来自标记的数据的图像分析软件、 数据解释软件、 可操作地连接数 字电脑的用于将溶液从一个来源转移到目的地的机械手液体控制电枢、 用于输入数据到数 字电脑中以通过机械手液体控制电枢控制高通量液体转移的输入装置 ( 例如电脑键盘 )、 以及任选地一个用于数字化来自标记探针的标记信号的图像扫描仪, 所述探针与例如在可 操作地连接至数字电脑的固体载体上的标记杂交。图像扫描仪接口具有图像分析软件, 该 软件用以测量例如当与阵列样品核酸群 ( 例如包含一个或多个标记 ) 杂交时的核酸探针标 记强度, 其中探针标记强度测量由数据解释软件进行解释以显示标记探针与标记核酸 ( 例如扩增的标记等位基因 ) 是否杂交以及杂交到何种程度。然后将如此得到的数据与样品特 性关联以确定具有特定标记或等位基因的特定基因型的植物的特性, 例如用以促进具有染 色体片段的有利等位基因形式的玉米植物的标记辅助选择, 所述染色体片段涉及农学性能 ( 例如新赋予的耐受性或提高的耐受性 )。
在本文任何实施方案中, 光学图像如通过照相机或其他记录装置 ( 例如光电二极 管和数据存储装置 ) 观察 ( 以及任选地记录 ) 到的杂交图任选地经过进一步处理, 例如数 字化图像和 / 或在电脑上存储并分析图像。多种可商购获得的外围设备和软件可用于数字 化、 存储并分析数字化的视频或数字化的光学图像, 例如使用 PC( 如 Intel x86 或 Pentium TM TM TM TM 芯片兼容的 DOS 、 OS2 、 WINDOWS 、 WINDOWS NT 、 WINDOWS 95TM、 WINDOWS 97TM、 WINDOWS TM TM TM TM 2000 、 WINDOWS XP 、 或 WINDOWS VISTA 基的机器 )、 MACINTOSH 、 LINUX、 或 UNIX 基的 ( 例 TM 如 SUN 工作站 ) 电脑。 实施例 提供以下实施例以示出受权利要求书保护的本发明, 但本发明不受以下实施例的 限制。应当理解本文所述的实施例和实施方案仅用于例证性的目的, 并且本领域的技术人 员将认识到在不脱离本发明精神或所附权利要求范围的情况下可改变多种试剂或参数。
实施例 1
对 GLS 耐受性的强效应 QTL 作图
GLS 来源的耐受性在 North American(NA) 种质中是不常见的。为了制备优良品 系用作 GLS 耐受性的供体来源, GLS 耐受性品系 PH14T( 美国专利 5,942,670) 与 PHN46( 美 国专利 5,567,861) 杂交以生成 F1 种群。然后将 F1 种群的个体与 PHN46 回交以生成大约 190 个个体的 BC5 回交种群。
在田间进行 F1 种群的 GLS 抗性表型分型。收集使用 SSR 标记的每个子代个体的 标记数据, 它们具有良好的基因组覆盖率以生成种群的分子标记图谱。来自 F1 种群的数据 的 QTL 分析确定了在染色体 4, 区段 (bin)5 上的、 介于标记 UMC1791 和 UMC1346 之间的 GLS 耐受性 QTL。
也在田间进行 BC5 种群的 GLS 抗性表型分型。收集使用 SSR 标记的每个子代个体 的标记数据, 它们具有良好的基因组覆盖率以生成种群的分子标记图谱。BC5 作图种群证 实了 GLS 耐受性 QTL 的位置并较精确地确定 GLS 耐受性 QTL 与 BNLG1755 紧密连锁。这个 QTL 显示强并且一致的效应, 解释了 8-44%的总表型变异 ( 表 4)。
表 4. 来自 BC5 种群的 GLS 耐受性的单标记回归 QTL 作图 ( 所有标记在染色体 4 上)
实施例 2
对 GLS 耐受性的 QTL 精细作图
使用玉米的完整基因图谱和物理图谱鉴定位于该区域内的所有 BAC 重叠群。使用 来自这些重叠群的低拷贝 BAC 末端序列和 PHM 标记开发 CAPS 标记。测定出 bacm2.pk027. h10.f 和 bacm.pk098.d7 侧接一侧的 GLS 基因座, 而 bacm.pk022.b8 和 PHM 7245 侧接另一 侧。
实施例 3
开发 PHJEP
选择来源于 BC4 世代的子代个体, 所述 BC4 世代具有 QTL 区域、 最像 PHN46 的表 型、 以及良好的抗性表型。该个体进行自交以确保高度纯合的基因组。将所得自交体命名 为 PHJEP。GLS QTL 的基因渗入导致 PHJEP 的病害抗性评分为 4( 评分等级 1-9), 与之相比 cPHN46 的评分为 1 或 2。图 6 显示用玉米灰叶斑病菌接种后的 PHN46 和 PH14T 间的表型差 异。
将 QTL 进一步回交到 PHN46 中。 选择来源于 BC7(dose 8) 世代的子代个体, 它们具 有新限定的 QTL 区域, 并且该区域中较小的供体片段紧接 QTL。 该个体进行自交以确保高度 纯合的基因组。将所得自交体编码为 PHW6N 和 PHW6M。发现这些自交体具有等同于 PH14T 和 PHJEP 的 GLS 耐受性水平。因为 PHJEP 被首先开发并且不表现出由于 QTL 渗入导致的连 锁累赘或者其他有害效应, 选择 PHJEP 作为 GLS 耐受性 QTL 对 PHW6N 和 PHW6M 的主要供体。
实施例 4
PHJEP 中的唯一单倍型
PH14T 中的供体区域在 PHM 00045-01 和 PHM 00043-01 分别具有 SNP 核苷酸 A 和 A。轮回亲本 PHN46 在这些相同的标记座位具有核苷酸 G 和 G。将 GLS QTL 从 PH14T 渗入 PHN46 并且随后经多个 BC 世代选择 QTL, 同时在侧接区域选择轮回亲本, 导致恰好在 GLS QTL 上的重组以及 PHJEP 中的 PHM 00045-01 和 PHM 00043-01 的核苷酸分别为 G(PHN46 等 位基因 ) 和 A(PH14T 等位基因 )。GLS QTL 的位置靠近具有低重组频率区域中的染色体 4 着丝点。认为恰好发生在 PHJEP 中的 GLS 基因座上的重组是一个稀少的重组事件。在随后 的育种种群中, 在 PHJEP 和其他自交体之间保持了这个核苷酸模式或单倍型。在将 PHJEP GLS 供体区域多次渗入优良材料期间, 保持这一重组。限定罕见重组的一个单倍型是 : PHM 00045-01 : G; PHM 00043-01 : A; PHM15534-13 : A; PHM 04694-10 : G; PHM 01811-32 : T; PHM
01963-15 : T; PHM 01963-22 : C; PHM 05013-12 : T; PHM 00586-10 : T; 和 PHM00049-01 : A( 参 见表 5)。对公开和专有自交体的调查确定这个单倍型是对 PHJEP 唯一的。这个等位基因组 合在申请人的种质中是唯一的。
表5: 在包含 GLS QTL 的染色体 4 区域中的自交体 PH14T、 PHN46、 和 PHJEP 的单倍 型
PH14T PHM 00045-01 PHM 00043-01 PHM 15534-13 PHM 04694-10 PHM 01811-32 PHM 01963-15 PHM 01963-22 PHM 05013-12 PHM 00586-10 PHM 00049-01
PHN46 3, 3 3, 3 4, 4 4, 4 2, 2 2, 2 2, 2 4, 4 2, 2 4, 4PHJEP 3, 3 1, 1 1, 1 3, 3 4, 4 4, 4 2, 2 4, 4 4, 4 1, 11, 1 1, 1 1, 1 3, 3 4, 4 4, 4 2, 2 4, 4 4, 4 1, 11 = A, 2 = C, 3 = G, 4=T
实施例 5
PH14T、 PHN46、 和 PHJEP 的 GLS 分析
PH14T、 PHN46、 和 PHJEP 在 4 个位置生长, 每个位置重复 8 次。玉米植物的 GLS 评 分使用 1 至 9 的评分系统, 一代表 “差” 而 9 代表 “良好” 。
按照 1 至 9 的评分系统, PH14T、 PHN46、 和 PHJEP 的平均 GLS 评分分别是 5.4、 3.6、 和 5.3。自交体 PHJEP 的病害抗性与自交体 PHN46 相比提高了 1.5 倍 ( 按照 1-9 的评分系 统 ), 并且该差异是显著的, P 值≤ 0.05。自交体 PHJEP 和 GLS 耐受性品系 PH14T 具有相似 的 GLS 评分。
实施例 6
用 PHJEP 转化其他优良自交体
使用 PHJEP 作为供体转化超过 40 个不同自交体以具有 GLS 抗性。表 6 示出这三 个杂交体和从非 PHJEP 来源制备的三个杂交体之间的比较。表6 Exp 杂交体 PHP38/PHJEP PH705/PHJEP PH05F/PHJEP 3394(PHP38/PHN46) PH705/PHN46 PH05F/PHN46 CV% 2 项均值的 SED 优点 产量 (bu/a) 188.5 185.8 178.1 155.9 155.7 153.3 5.9 7 29±4.0 Stagrn 193 147 166 79 70 70 25.5 37 96±19 GLFSPT 6 6 7 3 5 5 13.6 1 2.0±0.5产量 (bu/a) 是产量 ( 蒲式耳 / 英亩 ), 即收获的谷物产量按每单位面积 ( 英亩 ) 重量或体积计 ( 蒲式耳 ), 有 15%的可调水分含量。Stagrn 是保绿度, 即接近黑层形成时 ( 生理成熟期 ) 植物健康的量度。高分指示季节晚期植物健康状态较好。GLFSPT 是灰叶斑 病, 即 1-9 的视觉评分指示对灰叶斑病的抗性。评分越高指示抗性越强。CV%是变异系数 ( 以百分比表示 )。SED 是差值的标准误差。
实施例 7
使用 QTL 选择 GLS 耐受性植物
在 连 续 回 交 期 间 使 用 SSR 标 记 PHI026[PHI079 或 GPC1 或 GAPC1 或 NC005] 、LGI145183[BNLG1937] 、LGI455751[BNLG1265] 、LGI135263[BNLG1755] 、 EST337321[UMC1175]、 LGI123864[BNLG1189] 和 UMC1346 选择来自 PH14T 的供体 QTL 区域。 表型分型也在 BC3(270 个个体 ) 和 BC4(110 个个体 ) 世代中进行以便能进一步验证 QTL 并 进一步限定位置。
在 BC4 种群中, 将 QTL 定位在由 BNLG1755 和 UMC1346( 图 2) 限定的区域内 ; 在 IBM2 2004 neighbors 图谱上的距离为 4.4cM。发现 GLS QTL 解释了 55.1%的总表型变异。QTL 的平均表型效应在 1-9 的 GLS 病害评分系统中大于 2。
实施例 8
杂交体中的功效
PHJEP、 PHW6N、 PHW6M、 和近等基因的自交体 PHN46 缺乏 GLSQTL, 使它们与 PHP38、 PH705、 和 PH05F 杂交进行测试。所得杂交体在 16 个产量测试位置进行比较, 每个位置重复
3-4 次。所述位置集中在东方玉米带区域。十四个位置提供了产量数据, 13 个位置提供了 GLS 耐受性数据。发现杂交体的 GLS 耐受性版本与非耐受性版本相比具有一致的产量优势 和提高的病害耐受性 ( 表 7)。在表 7 中, 3394 是通过自交体 PHP38 和 PHN46 间的杂交形成 的杂交体。
表7
例如具有 PHJEP 的杂交体具有介于 20.9 和 43.5bu/ 英亩之间的产量优势以及 1.7-2.7 的病害抗性提高 (1-9 的评分体系 )。图 7 显示杂交抗性的 GLS QTL 效应。
实施例 9
GLS 耐受性 QTL 的基于图谱的分析
使用标记 BNLG1755 和 UMC1346 鉴定 QTL 区域下的 B73 重叠群 4022、 4023 和 4024。 通过设计 BAC 末端序列的引物并酶切所得扩增子来设计三个 CAPs( 酶切扩增多态性 ) 标记 用于 BAC bacm.pk040.o17( 标记 PHM 00045)、 bcb.pk0333.o19(PHM 00043) 和 bacm.pk022. b8(PHM 00049)( 参见图 3)。 使用相同 BAC 末端序列设计应用于高通量分子育种的 Invader SNP 标记检测分析。生成 4,464 RI 个体的 BC7 种群, 并且使用 CAPs 标记鉴定区域中具有重 组体的子代个体。这些子代在田间进行 GLS 抗性表型分析, 也进行自交以生成更多子代并 能够进行更精确的表型分型。使用组合的标记和表型数据以将 QTL 定位到重叠群 4024。开 发 BAC 的附加标记 (bacm2.pk065.b22.f、 bacc.pk0267.m12.f、 bacb.pk0241.h17.f、 chp2. pk0007.d2、 bacc.pk0530.f13.f、 bacb.pk0269.n19、 bacb.pk0009.b21.f、 bacb.pk0117. i09.f、 bacc.pk0280.n12、 bacb.pk0219.j20、 bacc.pk0132.b16.f、 bacb.pk0221.o22、 bacb. pk0544.j18 和 bacb.pk0540.c18.f) 以及在此重叠群中的 EST 横穿探针 (cl33021_1)。使 用这些附加的 CAPs 标记辅助精细作图和基于作图的克隆。
在精细作图过程中, 启动一个方案以对 QTL 区域中的 EST 和 BAC 测序, 测序使用来 自 Life Sciences 的高通量 454 测序技术。收集二十五个重叠的 B73 BAC 克隆, 它们覆盖 bcb.pk0333.o19 和 p0094.csstg88 之间的区间, 并且通过 454 Life Sciences 测序。短序
列读取意味着该序列不能进行装配以产生并列途径, 但是 BAC 克隆的深序列采样 ( 平均 20X 覆盖率 ) 指示该区域进行了完全测序。序列注解未能鉴定类似该区间中病害抗性基因的序 列。
在此期间, 使用在该区域内的附加 CAPs 标记进一步将 QTL 定位到 EST cl33021_1 和 BAC 末端 bacb.pk0009.b21.f 之间的区域中。这在表 8 中示出, 其中重组体栏的数字描 述了 4,464 个子代个体中在对应标记和 QTL 之间具有重组体的植物数目。重组体数目为零 表示该标记非常接近引起表型的基因, 使得重组不能中断表型 ( 以及导致该表型的基因 ) 和标记间的牢固连锁。4,464 个子代中有零个重组体代表重组距离小于 0.02cM。
表 8. 用 4,464 个子代个体和对 BAC 末端序列开发的标记对 GLSQTL 精细作图
两 个 附 加 的 BAC 克 隆 ; bacb.pk0269.n19 和 bacb.pk0009.b21.f,使 用 双 链 随 机 鸟 枪 法 进 行 测 序 (Bodenteich 等 人, “Automated DNAsequencing and analysis techniques” ( 编辑 : Adams 等人 ), 第 42-50 页, Academic Press, London, UK(1994))。简 言之, 在经由双乙酸澄清裂解液规程分离每个 BAC 后, 通过雾化作用剪切克隆, 所得片段进 行末端修补并被亚克隆到 pBluescript II SK(+) 中。在经由电穿孔转化到 DH-10B 电感受 态大肠杆菌细胞 (In Vitrogen) 中后, 用自动 Q-Bot 菌落挑取仪 (Genetix) 采集菌落并将
其贮存在 -80℃下, 冷冻培养基包含 6%甘油和 100μg/mL 氨苄青霉素。
为了进行测序, 从贮藏的甘油培养物中回收克隆, 甘油培养物生长 / 冷冻在 384- 孔冷冻培养基板中, 克隆用无菌 384 针复制仪 (Genetix) 在 384 孔微滴定板中复制, 所 述微滴定板包含 LB+100μg/mL 的氨苄青霉素 ( 平行测定板 )。然后使用 Templiphi DNA 测 序模板扩增试剂盒方法 (Amersham Biosciences) 分离质粒。简而言之, Templiphi 方法通 过等温滚环扩增, 使用噬菌体 DNA 聚合酶扩增环状单链或双链 DNA(Dean 等人, Genome Res.11 : 1095-99(2001) ; Nelson 等 人, Biotechniques 32 : S44-S47(2002) ; Reagin 等 人, J.Biomol.Tech.14 : 143-148(2003))。将细胞加入 5μL 稀释缓冲液中, 并且在 95 ℃下部 分地溶解 3 分钟以释放变性模板。然后加入 5μL Templiphi 预混物到每个样品中, 所得 反应混合物在 30℃下培养 16 小时, 然后在 65℃下放置 10 分钟以灭活 性。DNA 定量在用蒸馏水 1 ∶ 3 稀释扩增样品后, 使用 DNA 聚合酶活 dsDNA Quantitati onReagent(Molecular Probes) 进行。然后在 95℃下变性扩增产物 10 分钟, 在 384 孔板中进 行末端测序, 测序使用载体引导的 M13 寡核苷酸和 ABIBigDye 3.1 版 Prism 测序试剂盒。 在 用乙醇清洗后, 溶解循环测序反应产物并在 Perkin-Elmer ABI 3730xl 自动测序仪上检测, 单个序列用公共领域的 Phred/Phrap/Consed 包装配。当 Phred 读取 DNA 测序追踪文件、 读取碱基、 分配质量值给每个读取碱基、 并且写下读取碱基和质量值以输出文件时, Phrap 使用基于 Phred 的测序文件汇集鸟枪 DNA 序列数据 ( 参见 Laboratory of Phil Green 网 站, Genome Sciences Department, University of Washington)。Consed 是一种用于查 Genome Res.8 : 看、 编辑、 和完成用 Phred and Phrap 生成的序列装配的工具 (Gordon 等人, 195-202(1998))。重叠群顺序用 Exgap(A.Hua, University ofOklahoma, 个人沟通 ) 察看 和确认, 这是一个局部图形工具, 它使用成对读取信息为由 Phred、 Phrap、 和 Consed 生成的 重叠群排序, 并且确认基于 Phrap 的装配的精确性。
装配序列包含注解的蛋白编码基因, 类似归类为 LRR 样蛋白激酶型的推定 R 基因。 注解的序列在 SEQ ID NO : 49 中示出 ( 翻译的氨基酸序列在 SEQ ID NO : 50 中示出 )。发现 bacb.pk0269.n19 的 CAPs 标记存在于推定 R 基因的 3′末端。55CN 101970669 A
序列表1/41 页
56CN 101970669 A序列表2/41 页
57CN 101970669 A序列表3/41 页
58CN 101970669 A序列表4/41 页
59CN 101970669 A序列表5/41 页
60CN 101970669 A序列表6/41 页
61CN 101970669 A序列表7/41 页
62CN 101970669 A序列表8/41 页
63CN 101970669 A序列表9/41 页
64CN 101970669 A序列表10/41 页
65CN 101970669 A序列表11/41 页
66CN 101970669 A序列表12/41 页
67CN 101970669 A序列表13/41 页
68CN 101970669 A序列表14/41 页
69CN 101970669 A序列表15/41 页
70CN 101970669 A序列表16/41 页
71CN 101970669 A序列表17/41 页
72CN 101970669 A序列表18/41 页
73CN 101970669 A序列表19/41 页
74CN 101970669 A序列表20/41 页
75CN 101970669 A序列表21/41 页
76CN 101970669 A序列表22/41 页
77CN 101970669 A序列表23/41 页
78CN 101970669 A序列表24/41 页
79CN 101970669 A序列表25/41 页
80CN 101970669 A序列表26/41 页
81CN 101970669 A序列表27/41 页
82CN 101970669 A序列表28/41 页
83CN 101970669 A序列表29/41 页
84CN 101970669 A序列表30/41 页
85CN 101970669 A序列表31/41 页
86CN 101970669 A序列表32/41 页
87CN 101970669 A序列表33/41 页
88CN 101970669 A序列表34/41 页
89CN 101970669 A序列表35/41 页
90CN 101970669 A序列表36/41 页
91CN 101970669 A序列表37/41 页
92CN 101970669 A序列表38/41 页
93CN 101970669 A序列表39/41 页
94CN 101970669 A序列表40/41 页
95CN 101970669 A序列表41/41 页