《一种棉花转录因子乙烯响应因子基因.pdf》由会员分享,可在线阅读,更多相关《一种棉花转录因子乙烯响应因子基因.pdf(24页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103305528 A (43)申请公布日 2013.09.18 CN 103305528 A *CN103305528A* (21)申请号 201310166217.5 (22)申请日 2013.05.07 C12N 15/29(2006.01) C12N 15/82(2006.01) A01H 5/00(2006.01) (71)申请人 南京农业大学 地址 211225 江苏省南京市溧水区白马镇国 家农业科技园南京农业大学基地 (72)发明人 张天真 刘春晓 陆可钰 郭旺珍 (74)专利代理机构 南京天华专利代理有限责任 公司 32218 代理人 徐冬涛 傅婷婷 。
2、(54) 发明名称 一种棉花转录因子乙烯响应因子基因 (57) 摘要 本发明属于生物技术应用领域, 涉及一种棉 花转录因子乙烯响应因子基因。乙烯响应因子 基因 Gh ERF7, 在陆地棉荆 8891 和四倍体陆地 棉 (G.hirsutum) TM-1 中该基因序列为 : SEQ ID NO.1, 在四倍体海岛棉 (G.barbadense) H7124 中 的序列为 : SEQ ID NO.2, 在非洲棉 (G.herbaceum) 和亚洲棉 (G.arboreum)基因组中的序列为 : SEQ ID NO.3。本发明的乙烯响应因子家族基因 (Gh ERF7) 对逆境的反应并不明显, 而是在。
3、棉花胚珠和 前期纤维的发育有关, 并且与棉花的产量相关 , 本发明基因在基因组中的存在显著地提高了棉花 的产量。该基因可能通过调控一些控制棉花产量 因子相关的基因的表达, 从而对提高棉花产量有 很大贡献, 过量表达本基因有望大幅提高棉花的 产量。 (51)Int.Cl. 权利要求书 1 页 说明书 12 页 序列表 7 页 附图 3 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书1页 说明书12页 序列表7页 附图3页 (10)申请公布号 CN 103305528 A CN 103305528 A *CN103305528A* 1/1 页 2 1. 乙烯响应因子基因。
4、 Gh ERF7, 其特征在于在陆地棉荆 8891 和四倍体陆地棉 (G.hirsutum) TM-1 中该基因序列为 : SEQ ID NO.1, 在四倍体海岛棉 (G.barbadense) H7124 中的序列为 : SEQ ID NO.2, 在非洲棉 (G.herbaceum) 和亚洲棉 (G.arboreum) 基因组中的序 列为 : SEQ ID NO.3。 2. 权利要求 1 所述的乙烯响应因子基因 Gh ERF7 在提高棉花产量中的应用。 3. 权利要求 1 所述的乙烯响应因子基因 Gh ERF7 在促进棉花纤维发育中的应用。 4.权利要求1所述的乙烯响应因子基因Gh ERF7。
5、在通过基因工程手段培育高产量的棉 花品种中的应用。 5. 权利要求 1 所述的乙烯响应因子基因 Gh ERF7 在区分高产量陆地棉品种中的应用。 权 利 要 求 书 CN 103305528 A 2 1/12 页 3 一种棉花转录因子乙烯响应因子基因 技术领域 0001 本发明属于生物技术应用领域, 涉及一种棉花转录因子乙烯响应因子基因。 技术背景 0002 棉花作为世界性的重要经济作物, 产生的天然纤维是重要的纺织工业原料。由于 纺织工业发展的不断加快, 要求适应各种需求的更整齐的棉纤维, 再加上人们保健意识的 增强和生活水平的提高, 对棉纤维品质改良的要求愈加迫切。 0003 近 10 年。
6、来, 棉花育种从侧重外在品质转变为侧重内在品质。目前, 国内外除了利 用常规育种手段外, 还逐步运用遗传工程对棉纤维品质进行遗传改良, 而此项工作的展开 首先依赖于对棉纤维发育相关基因及其调控元件的识别与分离。 0004 在植物的生长发育中 , 之所以各细胞之间出现了分化 , 就是因为细胞内基 因的表达存在着时间和空间的差异 , 导致这种差异的主要原因之一就是转录因子 (transcription factor, TF) 在转录水平上的调节作用。 0005 ERF 转录因子属于 AP2/ERF 转录因子家族。同其它转录因子一样, ERF 类转录因子 也主要由 DNA 结合域、 转录调控结构域、。
7、 核定位信号结构域 (NLS) 三个功能域组成 (图 8) 。 关于 AP2/ERF 转录因子最早的报道是 1994 年从拟南芥中分离得到 AP2 族基因, 并发现该类 基因具有调控拟南芥花组织和种子发育的作用 (Jofuku 等, 1994) ; 其主要特征为包含有两 个 AP2/ERF 保守域。随后 Ohme-Takagi 和 Shinshi (1995) 在烟草中发现了 AP2/ERF 族中的 ERF 类基因, 该亚族蛋白包含有一个保守的 AP2/ERF 保守域, 根据所结合的顺式作用组件的 不同将 ERF 族又分为 ERF 和 CBF/DREB 亚类。他们从烟草中分离到 4 个编码 G。
8、CC-box 结合 蛋白的 cDNA 基因, 命名为 EREBPs(ethylene-responsive element binding proteins, 乙 烯应答组件结合蛋白) 。对其编码的蛋白序列进行分析后发现它们都具有一个高度保守的 含有 58 或 59 个氨基酸的区域与 GCC-box 进行特异性结合, ERF 结构域具有 YRG 和 RAYD 两 个保守的结构域 (Okamuro 等, 1997 ; Rieclimann 和 Meyerowitz, 1998) , YRG 保守序列具有 保守的 YRG 基元, 由 19-22 个高度碱性的氨基酸组成, 可能与 DNA 结合有关。。
9、Hao 等 (1998) 将该区域称之为ERF结构域 (ERF domain) , 并将其中含有ERF结构域的蛋白称为ERF蛋白。 Ohme-Takagi 等 (2000) 又研究发现 : GCC-box 是一类乙烯应答组件序列, 相当多的乙烯应答 或 PR 基因的启动子都含有这个组件, 由此可以推 测 ERF 蛋白分子在启动 PR 基因过程中发 挥了重要作用。目前已经从包括棉花在内的多种植物中分离到了大量编码 ERF 蛋白的基因 (Sakuma 等, 2002) 。 0006 ERF 族转录因子都包含有一个由 5870 个氨基酸残基构成的 AP2/ERF 功能保守域 (Okamuro 等, 。
10、1997) 。该类保守域的 C- 端通常是一个由 18 个氨基酸残基组成的核心序列, 形成双亲性的 - 螺旋参与同 DNA 元件或其它转录因子间的相互作用, 提高基因表达调控 的效率和灵活性。此功能域 N- 端的碱性亲水区则是由 3 个反向平行的 - 折叠构成, 侧链 的疏水作用起到稳定此结构的作用。- 折叠沿着一段 - 螺旋缠绕, 二者的联系主要是 通过 - 螺旋中的 Ala(丙氨酸) 残基, - 折叠中的 Phe157(苯丙氨酸) 、 Phe176,Val171 说 明 书 CN 103305528 A 3 2/12 页 4 (撷氨酸) 和 Ile161(异亮氨酸) 则提供了更强的疏水作用。
11、, 在 4 个转角处夹住 - 螺旋。 N- 端第 2 个 - 折叠中位于第 14、 19 位的两个氨基酸残基的差异是 ERF 族中 ERF 和 DREB (dehydration responsive element binding) 亚族的主要区别, 一般的 ERF 亚族中是 A14 (丙氨酸) 和 D19(天冬氨酸) , DREB 亚族为 V14(撷氨酸) 和 E19(谷氨酸) (Allen 等, 1998) 。 有研究发现 ERF 的结合域和 AP2 结合域十分相近 (Riechmann 等, 2000 ; Okamuro 等, 1997) , 但也有研究表明两者的结合域可能属于不同的特。
12、异家族, 并对两个结构域的序列片段进行 了分析比较, 发现其氨基酸的同源性小于 30%, 而在各个家族内部序列的同源性则大于 60% (Buttner 等, 1997 ; Hao 等, 1998) 。ERF 结构域的一级结构表明与 GCC-box 直接作用的氨基 酸残基在 AP2 结构域中并不存在。目前还未有关于 AP2 结构域在这一方面的报道, 但是推 测在 AP2 结构域中可能存在一个与 ERF 结构域相似, 即存在一个不同于 ERF 结构域的 DNA 识别方式以及可能不同的 DNA 序列 (Ohme-Takagi 和 Shinshi, 2000) 。 0007 大多数 ERF 蛋白都是转。
13、录作用的激活因子, 但是也有一些是抑制因子。Fujimoto 等 (2000) 第一次报道了拟南芥中与GCC-box结合的ERF转录因子既可以成为目的基因表达 的促进因子, 又能成为目的基因表达的抑制因子。利用烟草细胞瞬间转化和酵母细胞转化 分析 ERF2 和 ERF4 的转录激活域, 发现 ERF2 的转录激活域位于其羧基末端, ERF4 的氨基末 端和羧基末端都具有转录激活的功能。酵母中, ERF2 和 ERF4 的氨基末端均有转录激活活 性, 而羧基末端都失去了转录激活活性 (Ohme-Takagi 等, 2000) 。另外, 研究也表明羧基末 端的13个氨基酸为Tsil发挥转录激活活性。
14、所必需 (Park等, 2001) 。 而NtERF3和AtERF3/4 则含有转录抑制域, 属于主动转录抑制蛋白。通过转录抑制域干扰其他转录激活因子的激 活能力或直接影响基本转录复合物的组分, 从而阻抑转录的起始 (Ohta 等, 2001) 。Ohta 等 (2001) 通过比较分析第类 ERF 阻抑蛋白的氨基酸序列, 发现一个保守序列 L/FDLNL/F(X) P。该基序发生突变失去阻抑活性, 说明该基序是阻抑作用所必不可少的, 他们将该基序命 名为 EAR 基序 (ERF-associated amphiphilic repressors motif) 。研究发现 ERF 除了能 调控。
15、GCC-box介导的基因表达外, 还可以调控由低温、 干旱引起的DRE介导的相应基因的表 达。 0008 转录因子必须进入细胞核内才能行使转录调节功能。Ohme-Takagi 等 (2000) 构建 了35S-ERF2-GFP, 35S-ERF3-GFP, 35S-ERF4-GFP三个GFP融合表达载体, 利用基因枪分别导 入烟草 BY-2 悬浮细胞, 结果只在细胞核位置观察到绿色荧光蛋白 GFP 的荧光, 而 35S-GFP 载体表达后, GFP 荧光弥漫整个细胞, 说明 ERF2/3/4 具有核定位信号区, 属于核定位蛋白。 Park 等 (1997) 还对推定的 Tsi1 蛋白进行了氨基。
16、酸序列分析, 发现其 N- 末端区域含有一个 碱性氨基酸结构 KKRR, 该结构被认为是猿猴病毒 SV40 一型的核定位信号。利用聚乙二醇 介导转化烟草 BY2 悬浮细胞, 证明了 Tsi1 蛋白的核定位能力。Gu 等 (2000) 对 Pti4/5/6 进 行序列分析, 发现它们都具有典型的核定位信号。与此类似, 番茄的 JERF1, JERF3, TERF1, TSRF1 也都具有核定位信号区, 属于核定位蛋白 (Zhang 等, 2004) 。另外, 有些 ERF 转录因子 还具有与其他蛋白相互作用的位点, 如烟草的 ERF4 和 AtERF5 的羧基末端可以找到脯氨酸 介导的蛋白激酶 。
17、(如 MAPK) 可能的磷酸化位点 (Solano 等, 1998) 。 0009 棉花中, 人们对 ERF 功能的研究已取得一定进展 : Duan 等 (2006) 利用酵母单杂交 的方法, 从海岛棉 cDNA 文库中筛选出两个 ERF 类转录因子命名为 EREBP2/3, 证实它们受 乙烯和茉莉酸的诱导。真核转录激活实验表明这两个 ERF 类转录因子可以和 GCC-box 特 说 明 书 CN 103305528 A 4 3/12 页 5 异性结合, 并分析认为该家族基因在生物胁迫信号途径中发挥了重要作用。Zuo 等 (2007) 以黄萎病菌侵染后的海岛棉为材料, 采用消减杂交的方法分离到。
18、了 ERF 族基因 GbERF1/2, 并发现其在植株中为组成性表达, 但受到黄萎病菌侵染后表达量会明显提高 ; 将 GbERF1/2 转入烟草中超表达后, 使病程相关蛋白基因 PR-1b, PR2a 和 PR4 等表达量明显增加, 从而 提高烟草对一些真菌病害的抗病能力。Huang(2007)等从陆地棉中分离出受低温、 高 盐和干旱诱导表达, 编码 DREB1/CBFs 类蛋白的 ERF 族基因 : GhDREB1L 和 GhDBP2/3, 分别 将这些基因在大肠杆菌中表达并分离纯化出表达蛋白后发现它们和 DRE 元件能够发生 特异性结合 ; 作者分析这些基因可能在棉花受到干旱、 高盐和低温。
19、胁迫时通过与 DRE 顺 式元件的结合发挥重要调控作用, 如 GhDBP2/3 基因在烟草细胞中瞬时表达可激活 LEA (late-embryogenesis-abundant protein) D113 基因 (Huang 和 Liu, 2006 ; Huang 等, 2007b) 。Qiao 等 (2008) 利用电子克隆和 RACE-PCR 的方法从陆地棉中分离出 ERF 类基因 GhERF1, 实验证实它受外源激素乙烯和 ABA 的诱导, 同时低温、 高盐和干旱也诱导其的表 达, 分析认为该基因在激素和环境胁迫途径中发挥了重要作用。Jin 等 (2007, 2009) 利用相 同的方法。
20、从陆地棉中分离出 ERF 类基因 GhERF4 和 GhERF5 和它们的启动子, 利用实验处理 得到了与 Qiao 等相似 的结果, 另外通过对它们启动子序列的分析发现, 启动子区域存在 有大量的受生理胁迫和环境诱导的顺式调控元件, 这也许更加解释和肯定了它们在激素及 环境胁迫途径中所发挥得重要作用。 0010 这些研究结果表明 : 棉花中含有大量 ERF 家族基因, 它们在乙烯信号途径中发挥 了重要调控作用, 棉花中的乙烯响应因子 ERF 转录因子能够通过与 GCC-box 的相互作用对 胞外信号产生应答反应, 从而发挥对 GCC box-mediated 基因的正向或负向调控作用 (Ha。
21、o 等, 1998) 。 发明内容 0011 本发明的目的是提供一种新的棉花乙烯响应因子家族基因。 0012 本发明的目的可通过如下技术方案实现 0013 乙烯响应因子基因 Gh ERF7, 在陆地棉荆 8891 和四倍体陆地棉 (G.hirsutum) TM-1 中该基因序列为 : SEQ ID NO.1, 在四倍体海岛棉 (G.barbadense) H7124中的序列为 : SEQ ID NO.2, 在非洲棉 (G.herbaceum) 和亚洲棉 (G.arboreum) 基因组中的序列为 : SEQ ID NO.3。 0014 所述的乙烯响应因子基因 Gh ERF7 在提高棉花产量中的。
22、应用。 0015 所述的乙烯响应因子基因 Gh ERF7 在促进棉花纤维发育中的应用。 0016 所述的乙烯响应因子基因Gh ERF7在通过基因工程手段培育高产量的棉花品种中 的应用。 0017 所述的乙烯响应因子基因 Gh ERF7 在区分高产量陆地棉品种中的应用。以此基因 为标记, 通过扩增该基因在基因组中的存在与否, 对两个陆地棉品种群体进行扩增, 将群体 分为两组, 对两组的产量构成因子进行分析发现, 两组之间的产量存在显著甚至极显著差 异, 存在该基因的群体其产量明显高于不存在该基因的群体。 0018 有益效果 0019 (1) 传统意义上, 乙烯响应因子家族转录因子是通过参与乙烯、。
23、 脱落酸、 茉莉酸和 水杨酸等信号传导途径, 调控下游基因的表达, 从而提高植物的抗性和耐受性。 但是本发明 说 明 书 CN 103305528 A 5 4/12 页 6 的乙烯响应因子家族基因 (Gh ERF7) 对逆境的反应并不明显, 而是与棉花的产量相关。该 基因可能通过调控一些控制棉花产量因子相关的基因的表达, 从而对提高棉花产量有很大 贡献。 0020 (2) 通过对不同年份和不同环境下的产量统计实验发现, 该基因的存在与否与棉 花产量有很大关系。而且通过数量性状位点 (Quantitative Trait Locus, QTL) 定位研究 表明, 以该基因为分子标记, 定位到一个。
24、与产量构成因子铃数的 QTL(附图 7) 。由此推断, 以本发明乙烯响应因子家族基因 (Gh ERF7) 作为靶基因进行基因表达调控机理研究, 有望 提高棉花产量。 0021 (3) 本发明基因全长序列是通过传统 mRNA 差异显示技术 (DDRT-PCR) 获得的, 该技 术由于 PCR 扩增技术的应用, 使得低丰度 mRNA 的鉴定成为可能, 可同时比较两种以上不同 来源的 mRNA 样品间基因表达的差异, 具有速度快, 较易操作且灵敏度高的优点。 0022 (4) 本发明所克隆的基因从结构上来看属于 AP2 结构域家族, 具有 AP2 共同结构 域, 与已报道的 Gh ERF1 基因 (。
25、Qiao 等, 2007) 具有最高的相似性 (在氨基酸水平上的相似性 达 94%, 图 5) , 在棉花中前人还未探讨过其功能。通过对祖先种和四倍体种中得到的序列进 行比对, Gh ERF7基因的差异主要在个别碱基上。 该基因结构首次得到全面的展示与分析。 0023 (5) 半定量反转录 PCR (RT-PCR) 结果表明, 该基因在不同组织及纤维发育不同时期 表达量有差异, 在根、 茎、 叶 (除子叶) 中都有表达, 其中在茎中的表达量较高 ; 纤维形成早期 及纤维快速伸长期都有表达 (0、 2、 4、 6 天) , 但是到了次生壁增厚及以后时期没有表达 (10、 15 天及 30 天种子。
26、) (图 1) , 这一结果突破了传统的 ERF 家族基因与逆境有关的研究结果, 证明了该基因与纤维发育过程及棉花产量的提高密切相关。 0024 (6) 以 GhERF7 基因作为标记, 对棉花栽培品种群体进行扩增分类, 对群体的产量 及其产量构成因子进行关联分析, 结果表明, 该基因在基因组中显著地增加了棉花的单株 铃数并且提高了棉花的产量 (表 2、 3) , 使得该基因与棉花产量相关的功能得到直接验证。 附图说明 0025 图 1 组织表达分析, 反转录 PCR 检测棉花乙烯响应因子家族基因 (Gh ERF7) 在棉 花不同组织表达特点。 0026 EF1 : 真核生物组成性表达基因, 。
27、本实验的内对照, 证明 RNA 模板的一致性 ; Gh ERF7 : 本发明基因 Gh ERF7 ; 11 个泳道从左到右依次表示 : 1, 2, 3, 4 为根、 茎、 子叶、 真叶 ; 5 为 0 天的胚珠 ; 6, 7, 8 为 2、 4、 6 天的胚珠和纤维混合体 ; 9, 10 为 10、 15 天的纤维 ; 11 为 30 天的种子 ; EF1 为组成性表达基因。 0027 图 2Southern 杂交, 经内切酶 HindIII, EcoRI 和 XbaI 酶切过的基因组 DNA 转移到 尼龙膜上, 以 GhERF7 的 cDNA 全长为探针进行杂交。分子量在左侧以 kb 标出。。
28、P1, P2 和 F1 分别表示母本 (中棉所 12) 父本 (荆 8891) 和杂交种 (湘杂棉 2) 。表明该基因在陆地棉中有 两个拷贝。 0028 图 3 同源关系树分析, 说明 Gh ERF7 与陆地棉 Gh ERF1 亲缘关系最近。棉花中 不同乙烯响应因子家族基因的聚类分析 : GhERF1(AY181251.1) ; GhERF2(AY781117.2) ; GhERF3(AY817134.1) ; GhERF4(AY781120.1) ; GhERF5(AY781118.2) ; GhERF6(AY781119.1) ; ERF-1(AY779339) ; ERF-2(AY779。
29、338) ; ERF3(DQ116447.1) ; GbERFB1(EF408086) ; GbERFB2 说 明 书 CN 103305528 A 6 5/12 页 7 (EU082108.1) ; GhERFB1(AY827548) ; GhERFB2(AY962571.1) ; GhERFB3(AY962572.1) ; GbERF1(AY572463.1) ; GbERF2(AY572462.1) 。 0029 图 4 基因组来源扩增分析, 对 GhERF7 的进行 PCR 扩增分析表明, GhERF7 来源于 A 亚组。 0030 GhERF7 的基因组来源分析。泳道 1-3 分别代。
30、表陆地棉栽培种荆 8891, 湘杂棉 2 和 中棉所 12, 泳道 4、 5 代表 A 组二倍体棉非洲棉 (A1) 和亚洲棉 (A2) , 泳道 6、 7 代表 D 组二倍 体棉雷蒙德氏棉 (D5) 和瑟伯氏棉 (D1) , M 代表 2kb plus marker。 0031 图 5GhERF7 与 GhERF1 在氨基酸序列上的差异 0032 图 6GhERF7 基因在中棉所 12 中不表达的原因分析 0033 经多次对中棉所 12 基因组中扩得的 GhERF7 测序发现, GhERF7 之所以在中棉所 12 中不表达, 是因为在中棉所 12 中, 该基因的序列发生了碱基突变, 在 ORF。
31、 第 121 位有一个 A 碱基的插入 (附图 2) 。 0034 图 7GhERF7 基因在在湘杂棉 2 号重组自交系群体的 QTL 定位 0035 把 GhERF7 基因作为一个分子标记在湘杂棉 2 号重组自交系群体中进行 QTL 定位, 结果定在了 A7 染色体上, 是一个与单株铃数相关的 QTL, 对棉花单株铃数有显著的提高作 用。 0036 图 8AP2/ERF 类转录因子结构示意图 具体实施方式 0037 实施例 1 乙烯响应因子基因 (Gh ERF7) 的获得 : 0038 利用 mRNA 差异显示 PCR 技术所获得的差显 EST 序列在 NCBI 中进行 Blastn 序列 。
32、比对, 发现此 EST 与已公布的一个棉花中的乙烯相应元素结合因子 (GhERF1) 3- 端的部分 区域有很高的相似性 (93%) 。根据 ERF 基因的特性, 以陆地棉荆 8891cDNA 为模板, 在其非常 保守的功能保守域设计正向简并引物 Y3954, 结合差显 EST RT-PCR 的反向引物 Y2232R 进 行 touch-down PCR 扩增。PCR 反应程序如下 : 94预变性 5min ; 30 个循环 touch-down 程 序, 94变性 30sec, 65退火 30sec, 以后每个循环退火温度降低 1, 直到 56, 72延 伸 45sec ; 最后 72延伸 。
33、7min。根据 touch-down PCR 扩增得序列再比对, 发现它 3 端完 整, 与 GhERF1 非常高的相似性, 但在个别碱基和 3- 非翻译区 (3 -UTR) 有很大差异, 利用 GhERF1 序列为模板在其 5- 非翻译区 (5 -UTR) 设计正向引物 Y3172F, 结合 Y2232R 进行 同源扩增得 GhERF7 的全长, 其与 GhERF1 在核苷酸水平的相似性达 97%, 在氨基酸水平上的 相似性达 94%。在四倍体陆地棉荆 8891 中获得基因组全长 SEQ ID NO.1) 。具体引物见表 1。利用上述引物, 分别在四倍体海 岛棉和四倍体棉可能祖先供体种非洲棉。
34、中扩增测序获 得基因全序列 (SEQ ID NO.2、 SEQ ID NO.3) 。 0039 表 1 0040 说 明 书 CN 103305528 A 7 6/12 页 8 0041 实施例 2 乙烯响应因子家族基因 (Gh ERF7) 的拷贝数、 结构及生物信息学初步分 析 0042 Southern blot 技术 ( 分子克隆 第二版, 科学出版社) 分析本发明基因在陆地棉 中存在 2 个拷贝 (图 2) , 为了分析 GhERF7 这两个基因的基因组来源, 我们以两个 A 组二倍 体原始种非洲棉 (G.herbaceum, A1) 和亚洲棉 (G.arboretum, A2) , 。
35、两个 D 组二倍体原始种 瑟伯氏棉 (G.thurberi, D1) 和雷蒙德氏棉 (G.raimondii, D5) , 以及四倍体陆地棉栽培种荆 8891、 湘杂棉 2 号和中棉所 12 (AADD) 的 DNA 为模板, 利用 GhERF7 的基因特异引物 (Y3172F/ Y2232R) 扩增了它们的基因组序列。结果显示 (图 4) , 在荆 8891、 湘杂棉 2 号及两个 A 组二 倍体中非洲棉 (G.herbaceum) 和亚洲棉 (G.arboreum) 中扩增出 808bp 的 GhERF7 基因, 但在 瑟伯氏棉 (G.thurberi) 和雷蒙德氏棉 (G.raimond。
36、ii) 中没有扩增出目的片断。这个结果表 明, GhERF7 基因在四倍体陆地棉 (AADD) 中的两个拷贝只来源于 A 亚组。 0043 基因结构分析, 该基因基因组序列与 cDNA 序列完全一致, 不包含内含子。 0044 同时做了生物信息学的初步分析。以此基因的最大 ORF 的推断氨基酸序列经 BLAST (http:/www.ncbi.nlm.nih.gov/blast) 比较, 发现其与 Gh ERF1 序列具有最高同源 性 (97%) 。 0045 用Expasy pI/Mw程序对其氨基酸序列进行了一级结构的预测, 其理论上的等电点 pI 5.90, 分子量 Mw 22.1K Da。
37、ltons。 0046 根据 NetPhos2.0 进行磷酸化位点预测, 得到 8 个磷酸化位点 : 三个丝氨酸磷 酸化位点, 五个苏氨酸结合位点。说明该蛋白翻译后修饰的主要方式之一是磷酸化。 NetNGlyc1.0 预测该蛋白没有糖基化位点。根据 NCBI CDS 进行保守区预测, 该蛋白包含一 个典型的 AP2/ERF DNA 结合域 (59 个氨基酸) , 位于 70128 个氨基酸之间。 0047 同源关系树分析, Gh ERF7 基因与已发现的棉花中其他的 ERF 家族基因处在不同 的分枝, 其中与 Gh ERF1 亲缘关系最近 (图 3) 。 0048 实施例 3 乙烯响应因子基因。
38、 Gh ERF7 的表达特性分析 0049 所用引物为全长引物 (Y3172F/Y2232R) : 0050 Y3172F:5 -ATGGCGATGGGATAGGGAGATT-3 0051 Y2232R:5 -CTCCCGTGATTTCTATTTGGTA-3 0052 进行半定量RT-PCR检测, 结果表明该基因在各组织 (根, 茎, 叶) 和纤维发育各不同 时期 (0 天、 开花后 2、 4、 6 天) 组成性表达 (图 1) , 但表达量有差异, 除幼苗子叶中不表达外, 说 明 书 CN 103305528 A 8 7/12 页 9 在纤维发育不同时期也有差异, 起始期的表达量较低 (0天。
39、) , 而纤维起始伸长期表达量较高 (2、 4、 6 天) , 但 10 天以后都没有检测到表达。这一结果反映了本发明基因与纤维的起始伸 长密切相关, 在控制棉纤维发育过程中起到了至关重要的作用。 0053 实施例 4 乙烯响应因子基因 Gh ERF7 在提高棉花产量上的作用 0054 1. 重组自交系群体的 QTL 定位及产量分析 0055 1.1 试验材料 0056 本实验的材料为湘杂棉 2 号 (XZM2) 亲本及其重组自交系群体。湘杂棉 2 号是由 湖南省棉花科学研究所选育的陆地棉杂交种, 具有很强的产量杂种优势, 曾在长江流域棉 区大面积推广应用。 其亲本为中棉所12和荆8891, 。
40、其中中棉所12是高产抗病的品种, 适于 黄河流域棉区种植 ; 荆8891适于长江流域棉区种植的非释放的商业棉种。 本试验中所用亲 本中棉所 12 和荆 8891 均经过多代自交, 并通过分子标记试验证明是纯合的。重组自交系 是本实验室于1998年开始以单粒传法构建的, 于2002年达到F6:8, 并开始用于图谱构建和 QTL 定位 (Wang 等, 2006) 。 0057 1.2 试验方法 0058 1.2.1 田间试验设计 0059 (中棉所 12 荆 8891) 重组自交系群体、 中棉所 12、 荆 8891 和湘杂棉 2 号于 2002、 2003 年分别种于南京农业大学江浦实验农场 。
41、(长江流域棉区) 和江苏省灌云棉花基地 (黄河 流域棉区) ; 并于 2007 种于南京农业大学江浦实验农场。田间试验采用完全随机区组设计, 单行区, 两次重复, 行长 5 米, 行距 0.8 米, 株距 0.3 米。采用育苗移栽技术, 当棉苗长至 45 片真叶时移栽至大田。每行选中间 5 株挂牌调查性状。田间管理同一般大田管理。 0060 1.2.2 性状调查 0061 2002、 2003 及 2007 年均对产量及产量构成因子性状进行了调查。调查的性状 包括单株籽棉产量 (Seed-cotton yield, SY) 、 单株皮棉产量 (Lint yield, LY) 、 单株铃 数 (。
42、Bolls/plant, BN) 、 铃重 (Boll weight, BW) 、 衣分 (Lint percentage, LP) 、 衣指 (Lint index, LI) 和籽指 (Seed index, SI) 。由于 2003 年江浦受到雨水过多的不正常生长条件, 产量大幅下降, 因而未进行产量调查, 仅收到一批考种样, 调查了品质性状。 0062 纤维品质由河南棉花质量检测中心测定 (HVI SPECTRUM4.05.01 版本, HVICC 校 准水平) 。检测的性状包括 : 纤维长度 (Fiber length, FL) 、 强力 (Fiber strength, FS) 、 。
43、麦克隆值 (Micronaire, FMic) 、 整齐度 (Fiber uniformity ratio, FU) 、 伸长率 (Fiber elongation, FE) 、 成 熟 度 (Fiber maturity, FMat) 、 反 射 率 (Reflectance, FRd) 、 黄 度 (Yellowness, FB) 、 短纤维指数 (Short fiber index, FSFI) 、 纺纱均匀性指数 (FSCI) , 回潮 率 (FM, %) 。 0063 1.2.3DNA 分子标记试验 0064 在 Wang 等 (2006)的基础上了筛选了 2675 对由本实验室构建。
44、的 EST-SSR 引物 (NAU4107-NAU6781) , 其中 GhERF7 基因 (Y2232) 也作为一个分子标记。PCR 反应共进行 30 个循环, 95预变性 3min, 94变性 30s, 55-57退火 30s, 72延伸 1min, 4保温 10min。 扩增产物经非变性聚丙烯酰胺凝胶电泳电泳进行分离 : 凝胶浓度为 9%, 电泳缓冲液为 0.5 倍 TBE, 180V 恒压电泳 1.5 小时。电泳结束后, 采用银染方法进行检测 (张军等, 2000) , 记录 标记基因型。对标记基因型进行 X2- 测验 (P0.05) , 以检验标记是否符合 1:1 的期望分离 说 明。
45、 书 CN 103305528 A 9 8/12 页 10 比例。 0065 1.2.4 遗传图谱构建 0066 使用 JoinMap 3.0(Van Ooijen and Voorrips, 2001)构建遗传连锁图, 采用 Kosambi 作图函数 (Kosambi, 1944) , 最大遗传距离为 50cM, LOD 3.0。对照本实验室的遗 传框架图 (Guo 等, 2007) 将连锁群与相应的染色体对应。 0067 1.2.5 数据分析和 QTL 定位 0068 对产量和纤维品质相关性状用 SPSS16.0 软件进行正态分布及性状之间的相关性 检验。应用 WinQTLCart2.5 。
46、的复合区间作图法 (Composite Interval Mapping, CIM) 进行 单位点QTL定位 (Basten等, 2001 ; Zeng, 1994) 。 QTL搜索采用模型6, 窗口大小为5cM, 应用 10个背景标记。 通过1000次排列测验估算各性状的显著性LOD值 (Churchill and Doerge 1994) 。由曲线峰顶两侧各下降 1 个 LOD 值来确定 90-95%QTL 置信区间。 0069 QTL 的命名参照 McCouch 等 (1997) : 以字母 “q” 开头表示 QTL, 后接性状名称的缩 写, 再接染色体或连锁群的编号, 最后是该染色体上。
47、控制此性状的 QTL 的序号。 0070 1.3 试验结果 0071 产量和产量因子性状的 QTL 定位结果见图 7 及表 6, GhERF7 作为一个分子标记, 定 位在了 A7 染色体上, 是一个与单株铃数相关的 QTL, qBP-A7-1(Y2232) , 其 LOD 值为 3.27, 解释表型变异的 7.15%, 来自中棉所 12 的等位基因, 对单株铃数起增效作用 ; 另外, 定位在 该染色体上的还有两个 QTL, 与衣指相关的 qLI-A7-1(NAU1043) , 其 LOD 值为 3.35, 贡献 率为 6.62%, 增效等位基因来自荆 8891 ; 与黄度有关的 qBP-A7。
48、-1(NAU3654) , 其 LOD 值为 4.08, 解释表型变异的 8.98%, 减效等位基因来自中棉所 12。三个 QTL 之间的遗传距离最大 为 12.1cM。这就说明, 本研究基因 GhERF7 确实与棉花的产量构成因子之间有着密切的关 系, 对棉花产量的提高有明显的作用。 0072 2. 品种群体产量分析 0073 另外, 本研究还分析了两个品种群体的产量表现, 一个是包含 299 个品种的陆地 棉群体 (表 4) , 一个是包含 281 个品种的陆地棉群体 (表 5) 。本实验中以 GhERF7 基因作为 一个标记, 首先对对包含 299 个品种的群体进行基因组 DNA 扩增,。
49、 以 GhERF7 的有无把该群 体分为两组, 并且对该群体的产量构成因子进行 T- 检验 (表 2、 3) , 结果表明, 基因组中存在 该基因的群体的籽棉和皮棉产量均显著或极显著高于不存在该基因的群体。 0074 为了进一步确定该基因对棉花产量的影响, 本实验增加了研究群体 (281 个品种 的品种群体) , 同时对该群体在不同年份、 不同环境下的产量因子调查结果 (2007 年、 2008 年、 2009 年安阳、 库尔勒和海南) 的进行 T- 检验, 结果显示, 该基因的存在确实对棉花的产 量有很大的贡献, 对单株铃数的增加有显著作用, 对籽棉、 皮棉、 衣分的提高有极显著作用, 对籽指的降低也有极显著作用 (表 3) 。 0075 表 2 有无 GhEF7 基因的产量构成因子在品种群 1 中的差异表现 0076 说 明 书 CN 103305528 A 10 9/12 页 。