用于鉴定控制基因转录物和产物水平的 调节基因座的基于作图的基因组开采方法 本发明涉及一种用于在任何生物体内鉴定控制基因表达的调节基因座的方法。更具体地讲,本发明涉及利用mRNA转录物和转录物水平的改变鉴定与一种生物体内需要的性状相关的定量性状基因座。
【发明背景】
在植物育种程序中,理想植物性状的筛选通常是基于一种或多种表型性状的选择。不过,很多重要的农艺性状是复杂的,并且受到环境的显著影响,受多基因控制,就是说一种表型性状是由多个基因调节的,而不是由一个基因所调节的。在受多基因或多个基因控制的性状中,在很多基因座上的等位基因的表达可能产生感兴趣的表型。
业已多次证实,有很多基因不能根据发育或环境线索表达。特别是在转基因生物中,对控制所述基因表达的因素的了解是重要的,例如,导入一个外源基因以便控制其在发育、组织或胁迫依赖型方式中的转录物水平。这种研究发现了存在于基因表达中控制的复杂性和多级冗余性。基因表达的控制机制在不同基因之间可能有很大差异(例如,参见Hirt H.1999 Trends Plant Sci.4:7-8)。在特定环境或发育条件下,与特定过程相关的基因并非总是以类似方式作出反应,它们也不是在相同的细胞类型或组织中积累,这表明它们能对不同的控制或信号机制作出反应。
使用现有的技术难于从整个事件级联中筛选出控制感兴趣的基因表达的关键调节基因。
业已用多种方法鉴定了差异表达的基因,如cDNA文库的差异筛选,基因组测序与基因库中同源性筛选的组合,基因剔除和互补,同源异型基因的突变,用高密度基因阵列对ESTs进行高通量筛选。这些方法尽管烦琐,但是业已偶尔被用于鉴定与基因表达调节相关的基因,不过,这些方法不是为了这种目的而专门设计的。用于鉴定控制基因表达的因素的基因剔除方法(突变体变异)适用于诸如拟南芥属的小型基因组。这种技术同样是烦琐的,不特异的,并且通常会导致无法检测或致死突变表现型。可以将诸如mRNA类型差异展示、扣除或统一化文库以及基因排列的技术组合用于挑选调节基因。不过,这种技术对于单一基因表达的分析没有特异性,并且浪费时间。另外,对于这些技术来说,感兴趣的调节基因的转录物必须存在于用于制备文库的样品中,以便鉴定该转录物。当涉及到不同步表达的多个调节基因时,所述任务就无法实现。
数量性状基因座(QTL)是基因组的一个区域,它编码一种或多种蛋白,并且解释可能由多个基因控制的特定表型的变异性的显著比例。通常,可以用一种或多种遗传标记鉴定需要的QTL。迄今为止,植物物种的大多数QTL研究都是观察总的形态学或农艺表型(例如,产量、抗病和抗胁迫性,开花时间等)。例如,在WO 2000/18963中,披露了包括与提高了的产量相关的QTL的大豆植物,以及用于筛选和培育这种植物的方法。该方法涉及能够与第二种核酸分子杂交的特殊标记核酸的使用,该标记作图于大豆特定部分,并且与提高了的产量相关。在US 5,948,953中,在大豆植物中鉴定了与褐茎腐病抗性(BSR)抗性相关的QTL。可以将与BSR抗性相关的QTL用于通过标记协助的筛选来筛选植物。WO 99/31964披露了将与一组63个特定的基因座遗传连锁的标记核酸用于植物筛选。所鉴定的多态性可用于DNA指纹分析,并用于对与抗虫或抗病相关的基因或QTLs进行作图。若干最新QTL研究业已揭示了特定代谢变化的数量变异之间的关系,包括代谢物的积累或酶活性的改变。例如,Byrne et al(Byrne,P.F.,McCulen,M.D.,Snook,M.E.,Musket,T.A.,Theuri,J.M.,Widstrom,N.W.,Wiseman,B.R.和E.H.Coe.1996.Proc.Natl.Acad.Sci.93:8820-8825)披露了控制maysin——一种起着抗玉米穗虫的宿主植物抗性因子作用的黄酮的浓度变异的58%的QTL的作图位置位于编码类黄酮途径一部分的转录激活物的基因座上。Prioul et.al.(Prioul,J.-L.,Quarrie,S.,Causse,M.and D.de Vienne.1997.J.Exp.Bot.48:1151-1163;Prioul,J.-L.,Pelleschi,S.,Sene M.,Thevenot,C.,Caus se,M.,de Vienne,D.和A.Leonardi.1999.J.Exp.Bot.50:1281-1288)。在QTL分析中使用已知生物合成途径中的酶活性、底物和产物水平作为数量性状。类似地,Pelleschi etal.(Pelleschi.S.,Guy,S.,Kim,J.-Y.,Pointe,C.,Mahe,A.,Barthes,L.,Leonardi,A.,and J.-L.Prioul.1999.Plant Mol.Biol.39:373-380)披露了将转化酶活性用作鉴定编码与玉米中的转化酶活性变异相关的QTLs的候选基因的标记。Damerval et al.(Damerval C.,Maurice,A.,Josse,J.M.和D.de Vienne.1994.Genetics 137:289-201)披露了利用2D-凝胶上的肽作为QTL作图的数量性状。
上述方法没有一种表明或暗示可以将QTL作图方法用于鉴定参与调节单一基因或一连串基因表达调节的基因,也没有暗示利用mRNA转录物作为表型性状进行QTL作图的用途。
Dumas et al.(Dumasp.,Sun Y.,Corbeil G,.Tremblay S.,Pausova Z.,ren V.,Krenova D.,Pravenec M.,Hamet P.,和J.Tremblay 2000,J.Hypertens 18:545-551)披露了使用mRNA作为表型标记,对大鼠体内与应激基因表达相关的QTL进行作图。Cicila和Lee(Cicila G T.和S J Lee 1998 Hypertens Res 21:289-296)提出了一种相关的方法,使用差异基因表达对大鼠体内与血压相关的QTL进行作图。这些文献都没有暗示QTL方法可用于鉴定参与决定控制转录物水平的单一基因或复杂的调节级联的基因。另外,也没有讨论在以具有高于二倍体的倍性水平为特征的生物中对差异基因表达进行QTL作图,也没有讨论在非动物宿主中鉴定与差异基因表达相关的QTLs。
本发明涉及鉴定参与和所需性状相关的感兴趣的一个或多个基因表达的遗传调节的基因组区。通过使用基于QTL作图的基因组分析,鉴定了与转录物或基因产物的差异积累相关的调节基因的基因座。
本发明的目的是克服现有技术的缺陷。
上述目的是通过综合独立权利要求的特征而实现的,从属权利要求披露了本发明的其他优选实施方案。
发明概述
本发明涉及使用mRNA转录物、转录物水平的变异在一种生物体内鉴定与所需的性状相关的数量性状基因座。更具体地讲,本发明涉及用于在任何生物中鉴定控制特定性状的基因表达的调节基因基因座的方法。最后,本发明涉及一种在所述生物体内鉴定控制表达性状的基因和调节级联的基因和基因序列的方法。
根据本发明,提供了一种在感兴趣的生物的基因组中鉴定能介导一个或多个感兴趣基因表达的一个或多个区的方法,包括:
i)鉴定第一种感兴趣的生物,其特征在于感兴趣的第一种生物能对环境刺激表现出可测定的反应,或者表现出与相关于感兴趣的过程的差异基因表达相关的表型;
ii)鉴定第二种感兴趣的生物,其特征在于第二种感兴趣的生物:
a)对所述刺激缺乏或不具有像第一种感兴趣的生物那样强的反应;
b)与第一种感兴趣的生物相比具有不同的表型,这种不同的表型与所述感兴趣的过程相关;
c)表现出一种感兴趣的表型,该表型在通过与第一种感兴趣的生物杂交得到的群体中分离;
d)或上述a)、b)、c)和d)中的两种或两种以上的组合;
iii)使第一种和第二种感兴趣的生物杂交,以便生产一个分离的后代群体;
iv)从每一个分离的后代中提取RNA,并且对一个或多个感兴趣的基因的基因表达水平进行定量,所述感兴趣的一个或多个基因与对环境刺激或感兴趣的过程的反应相关;
v)使用一种或多种标记制备分离后代的连锁图;
vi)确定所述连锁图上一种或多种标记和一个或多个感兴趣的基因的基因表达之间的关系,并且鉴定一个或多个数量性状基因座(QTL)。
本发明还包括如上文所定义的方法,其中,在杂交步骤(步骤iii)之后,在提取RNA的步骤之前,分离的后代接受需要的环境刺激,或者表征为处在特定的发育阶段。
可以将如上文所述的本发明的方法,用于鉴定相应于转录因子或任何控制一种或多种感兴趣的基因表达的因子的一种或多种QTLs。
另外,本发明涉及上文所述的方法,其中,在测定步骤(步骤vi)之后,分离并表征位于一个或多个QTL上的一个或多个基因。
本发明还涉及上文所述的方法,其中,在测定步骤(步骤vi)中,鉴定了位于QTL上的一个标记。另外,该标记可用于:
-跟踪一种生物的后代;
-测定一种生物的杂合性;
-鉴定连锁的表型性状、表达性状或表型性状和表达性状的变异;
-构建一种遗传图谱;
-鉴定来自一种杂交的各个后代;
-分离一种基因编码或非编码DNA序列周围的基因组DNA序列;
-标记辅助的筛选,基于作图的克隆,杂种验证,指纹分析,基因型分析,作为等位基因特异性标记,或其组合。
本发明还包括一种用于鉴定能介导感兴趣的基因表达的调节基因的方法(B),包括:
i)鉴定一个或多个数量性状基因座(QTLs),它解释一个或多个感兴趣基因表达变异的显著比例;
ii)对一个或多个调节基因进行作图;
iii)测定所述一个或多个调节基因是否作图于一个或多个QTLs内;
iv)分离一个或多个QTLs内的一个或多个调节基因;
v)对在步骤iv)中分离的一个或多个调节基因进行测序。
本发明还包括一种介导感兴趣的生物对环境刺激的反应的方法,包括:用通过上述方法(B)鉴定的调节基因转化所述感兴趣的生物。
另外,本发明涉及一种介导感兴趣的生物的发育的方法,包括:用通过上述方法(B)鉴定的调节基因转化所述感兴趣的生物。
本发明还包括一种用于鉴定介导感兴趣的基因表达的调节序列的方法(C),包括:
i)鉴定一个或多个数量性状基因座(QTL),它解释一个或多个感兴趣基因的表达变异的显著比例;
ii)对所述一个或多个调节基因进行作图;
iii)测定所述一个或多个调节基因是否作图于一个或多个QTLs内;
iv)分离一个或多个QTLs内的一个或多个调节基因;和
v)对在步骤iv)中分离的所述一个或多个调节基因的调节序列进行测序。
本发明涉及介导一种感兴趣的生物对环境刺激的反应的方法,包括:用与感兴趣的基因融合的调节序列转化所述感兴趣的生物,所述调节序列是用上述方法(C)鉴定的。
另外,本发明包括一种介导所述感兴趣的生物发育的方法,包括:用与感兴趣的基因融合的调节序列转化所述感兴趣的生物,所述调节序列是用上述方法(C)鉴定的。
本发明可以鉴定拥有共同的调节基因座或受相同的调节的基因。对于很多声称的用途来说,这可能具有重大意义,例如,但不局限于标记辅助的筛选,表型分析,途径作图级联分析,基因调节相互作用,基因流通分析等。
可以通过QTL作图分析鉴定与基因表达水平相关的基因组区。该方法使用基因表达水平作为数量性状,可以通过将对所述调节基因和调节序列的检索缩小到特定的基因组区鉴定基因表达控制机制。本发明所鉴定的重要的QTLs,以及它们所解释的出乎意料的高水平的变异,表明了通过基因表达的QTL分析定位负责胁迫诱导的基因表达的重要调节因子的潜力。对由相同的外部刺激诱导的多个基因进行比较性QTL分析,还能够解释调节基因表达的复杂途径,并且对拥有共同调节因子的基因进行重新分组。
本发明的技术可应用于其表达是通过任何因素调节的感兴趣的基因,使用分离所述基因的表达水平的群体。这样可以鉴定基因组区。一旦鉴定了这些基因组区,就可以用于鉴定特定的基因型,而没有基于基因表达的技术所固有的环境或发育的干扰。
通过鉴定由环境刺激(例如,但不限于温度胁迫)诱导的或与特定过程(例如,但不限于产量确定)相关的多基因性状的一个或多个QTLs,本发明的技术还可以鉴定与被分析的表型性状通常相关的一个或多个QTLs,和对特定性状具有重要的适应价值的基因的表达。出现在所述基因座上的调节基因和调节序列,可能对于所述多基因性状的改良具有重要价值。
可以理解的是,本发明的技术可应用于任何宿主生物,不过,就本发明技术的应用而言,有若干种生物,例如,但不限于单细胞生物或植物相对其他真核系统而言具有独特的优点。例如,在某些植物物种中,由花粉产生加倍的单倍体,其中每一个基因座是纯合的,自交或与Fls的一个或另一个亲本系回交,以便产生分离的F2或回交群体,可以对各个F2植株重复进行自花传粉若干世代(F6-F10),以便产生一系列重组自交系的可能性,可以通过克隆繁殖扩增每一种基因型以便对相同的遗传物质进行多次破坏性分析,以及可以让遗传上相同的物质接受各种环境刺激或其他过程的可能性。另外,所述类型的克隆物质可以在各种环境条件下繁殖,其中可以研究基因型、环境或基因型和环境对表现型的相互作用影响。
本发明的概述并不是必须披露本发明的所有必要特征,但是本发明还存在于所述特征的亚组合中。
附图的简要说明
通过以下说明可以更好地理解本发明的上述和其他特征,其中,说明是结合附图进行的,其中:
图1表示二倍体苜蓿的连锁图。基因座在右侧列出,而重组距离(cM)在每一个连锁群的左侧列出。连锁群右侧的线条表示基因座的大体位置。对低温调节的(msaCI)基因加双框,并且与具有调节功能的基因同源的基因加框。对作为多基因家族成员的基因通过编号加以区分,例如C3358.1和C3358.3。
图2表示LT50和低温调节的msaCI基因表达的QTLs的位置和统计学显著性(LOD得分)。对msaCI基因加双框,而对与具有调节功能的基因同源的基因加框。当在冠组织和叶组织中都检测到基因表达QTLs时,在冠组织中表达的LOD得分的曲线在顶部示出,而在叶组织中表达的LOD得分的曲线在底部示出。将LT50 QTLs应用于全植株,并且独立于组织类型。对作为多基因家族成员的基因通过编号加以区分,例如C3358.1和C3358.3。
图3表示感兴趣基因表达的斑点印迹分析的一种例子,在这里它是分离中的二倍体苜蓿F2后代的msaCIA基因。每一个斑点相当于一种独特的基因型,最后一栏除外,其中将一种对照重复点斑3次。通过密度测定对转录物的含量进行定量,并且用作QTL分析的数量性状。示出了每一种基因型和对照的最佳光密度值。
优选实施方案的说明
本发明涉及一种用于在任何生物体内鉴定控制基因表达的调节基因座的方法。更具体地讲,本发明涉及利用mRNA转录物和转录物水平的变异在一种生物体内鉴定与理想性状相关的数量性状基因座的用途。
以下说明只是对一种优选实施方案的举例性说明,而不是对将本发明付诸实施所必需的特征的组合的限定。
数量性状基因座(QTL)是基因组的一个区域,它解释由多个基因控制的特定表型变异性的显著比例,例如,但不限于与提高了的产量、抗冻性和耐旱性等相关的性状。在所述区域内存在一个或多个编码对所述生物的表型具有显著影响的因素。
正如本文所披露的,用例如基于形态学、同工酶或DNA的标记的任何类型的标记构建的连锁图谱,可用于将每一个感兴趣的基因定位于该图谱上的特定位点。感兴趣的单个基因的表达被认为是数量性状。并不希望受理论的约束,如果感兴趣的基因的表达的变异性是由于基因本身的差异所导致的话,例如,由于该基因的各种等位形式所导致的,那么主要数量性状基因座就应该定位于结构基因的位置附近。不过,正如下文所披露的,业已发现所述感兴趣的基因表达的变异在很大程度上可以通过位于该基因组的其他部位的QTLs进行解释(参见图1)。因此,由位于距离感兴趣的基因一定距离位置上的基因组区控制或调节感兴趣的基因的表达。可以利用所述连锁图谱鉴定所述基因组区,然后使用本领域技术人员所公知的技术鉴定编码控制所述感兴趣的基因表达的因子的调节基因。
“感兴趣的基因”表示可以被用作通过本发明方法鉴定的数量性状的一个或多个已知基因,并且可以包括上游和下游调节区、内含子和外显子。感兴趣的基因通常是,但并非总是在用于确定调节基因对感兴趣的基因的表达或抑制的作用的条件下表达的。可以使用本领域任何已知方法测定感兴趣的基因的表达,例如Northern分析,RNA酶保护,阵列分析和PCR等。感兴趣的基因或其转录物的水平是一种数量性状,该性状被用于进一步鉴定与所述感兴趣的基因表达相关的一种或多种QTLs。可以将一个或多个感兴趣的基因用于本发明的方法中,用于分析对本文所定义的环境刺激或其他感兴趣的过程的反应。通过增加在所述分析中使用的感兴趣的基因的数量,可以鉴定负责若干感兴趣的基因的调节的一种或多种QTLs,所述感兴趣的基因与对环境的刺激或植物体内感兴趣的其他过程的反应相关,可能突出了QTLs的重要性。在下文以及实施例中披露了这种方法。
“调节基因”表示其产物直接或间接影响一种感兴趣的基因表达的基因,包括编码区、上游(5′)和下游(3′)非编码区和调节区,以及内含子。通常,调节基因是根据刺激进行差异表达的,例如,但不限于环境刺激,如热激或温度胁迫。调节基因的例子包括,但不限于编码转录因子的基因,或编码以某种方式调节另一种基因表达的其他蛋白因子的基因。由调节基因所编码的产物能直接影响感兴趣的基因的表达,例如(并不是要以任何方式进行限定),通过结合感兴趣的基因的编码区的调节区上游(5′)或下游(3′),或结合在内含子内部,正如本领域所公知的,并且增强感兴趣的基因的表达或使该基因的表达沉默。调节基因还可以编码一种能影响感兴趣的基因的转录物的稳定性,或感兴趣的基因转录物的翻译速度、稳定性,或与感兴趣的基因的表达相关的转录后和翻译后事件。还涉及一种能间接实现感兴趣的基因的差异表达的调节基因,这是通过介导一种或多种第二基因的表达,使其产物与感兴趣的基因的表达相互作用。同样可能的是,让一个或多个调节基因协同发挥作用,以便介导感兴趣的基因的差异表达。
本发明的方法可用于鉴定拥有共同的调节基因座或者受相同的调节的基因。这对于很多用途来说具有重大意义,例如,但不限于标记辅助的筛选、表型分析、途径作图级联分析、基因调节相互作用、基因流通分析、或对多基因性状具有显著影响的调节基因的鉴定。
“环境刺激”表示在感兴趣的生物体内实施并产生可测定的反应的任何刺激。例如(并非要以任何方式进行限定),所述感兴趣的生物可以是植物、植物器官、组织或细胞,而环境刺激可以是,例如,但不限于生物刺激,包括病毒、细菌、真菌、昆虫、线虫或其他食草动物的侵袭,或非生物刺激,例如,但不限于与低温、霜冻、水、干旱、渗透压、热、盐、氧化剂或污染物相关的胁迫。环境刺激还可以包括矿物营养、光照、内源或外源化合物对感兴趣的生物或其器官、组织或细胞的影响。
“感兴趣的过程”表示能够在感兴趣的生物或其器官、组织或细胞内产生可测定的影响的任何过程,例如(并非要以任何方式进行限定)植物。感兴趣的过程可以包括,但不限于,对于一种植物的非限定性例子来说,在胚胎发生,花、种籽、根或叶发育,器官发生,或昼夜节律、亚昼夜节律和其他内部节律期间,对基因表达的发育、化学或环境控制。其他感兴趣的过程可以包括,但不限于可收获的产量、光合产物转运、储存和资源(sink and source)、叶面积指数、根茎比、收获物质的营养价值、植物形态学、细胞循环速度、细胞分化速度、细胞大小、植物生命周期、衰老、成熟、休眠、发芽、或基因组重排,例如,由于转座子激活而导致的重排。不过,应当理解的是,可以用本文所披露的方法在任何感兴趣的生物体内鉴定类似的或其他特殊的过程。
“感兴趣的生物”表示在其中鉴定并表征了一种或多种QTLs的任何生物,例如,但不限于植物(藻类、苔藓植物、蕨类植物、被子植物或裸子植物),动物,单细胞生物,细菌,浮游植物,酵母,真菌,并且还包括所述生物的细胞或组织培养物。
本发明的方法还可用于鉴定作图于基因组的特定位置上的基因的转录物水平,并且用于确定所编码的转录物或蛋白的积累是否是由位于该基因组的其他位置的基因座上的基因调节的。通过对所述基因组进行基于QTL(数量性状基因座)作图的分析,可以鉴定与转录物或基因产物差异积累相关的基因座。因此,存在于所述QTLs中的基因能够编码受不同转录控制(例如携带重要的顺式调节序列,该序列又影响转录的调节或者对增强翻译或mRNA稳定性所必需的上游或下游序列产生作用)的多基因家族的成员,转录因子(包括增强子和阻抑物)、信号转导途径蛋白(例如蛋白激酶,蛋白磷酸酶,14-3-3蛋白等),外部信号受体、参与第二信使水平(Ca2+,IP3,cAMP等)调节的蛋白,参与转录物降解的核酸酶、蛋白酶和蛋白酶抑制剂、新的转录调节因子。
一种用于鉴定控制、介导或影响一种或多种感兴趣的基因表达,例如,但不限于反应于环境刺激或感兴趣的生物体内的能导致差异基因表达的任何事件进行差异表达的调节基因的方法的例子包括:
i)鉴定第一种感兴趣的亲本生物,该生物能对环境刺激作出反应,或者具有与相关于感兴趣的过程的差异基因表达相关的表型,以及鉴定第二种感兴趣的亲本生物,该生物缺乏或不能对所述刺激作出强的反应,或者表现出相关于所述感兴趣的过程的差异基因表达相关的不同表型,无论这种差异是天然存在的或者是通过基因突变、基因破坏或基因插入而诱导的。理想(但并非必须)的是,所述第一种和第二种亲本对所述刺激的反应不同或与所述感兴趣的过程相关的差异基因表达有所不同,只要对所述刺激的反应或差异基因表达在后代中分离就行;
ii)让所述第一种和第二种亲本杂交,以便产生分离的后代群体。群体的类型可以包括,但不限于F1(来自杂合亲本)、F2或F3家族,重组自交系,加倍的单倍体,回交系,测交系,和裸子植物分离的大配子体;
iii)如果需要,对该杂交的后代进行需要的环境刺激;
iv)从一种或多种类型的器官、组织或细胞中提取RNA,例如,对于作为感兴趣的生物的植物来说,可以从花、原基、叶、茎或根组织、或细胞中获得RNA;
v)用任何合适的方法测定一种或多种感兴趣的基因的转录物水平,例如,但不限于斑点印迹或Northern杂交,阵列分析,或定量PCR,对每一种后代的基因表达水平进行阵列分析和定量;
vi)使用任何合适的方法制备分离群体的遗传连锁图,例如,但不限于使用基于DNA的标记,如RFLP(限制片段长度多态性),AFLP(扩增片段长度多态性),RAPD(随机扩增的多态性DNA),微卫星,IMP(MITE间多态性),或SNPs(单核苷酸多态性),蛋白标记,或形态学标记,鉴定作图群体的个体,并且由通过上述一种或多种技术获得的数据获得两点和多点连锁分析,用于构建连锁图。
vii)确定所述连锁图上的标记和一个或多个感兴趣的基因反应于环境刺激或与相关于一种感兴趣的过程的表达水平之间的关系,以便鉴定统计学上显著的QTLs。这种关系可以通过本领域技术人员已知的任何方法确定,例如,但不限于单点ANOVAs、简单回归、区间映射、复合区间映射。所述分析可以用MAPMAKER/QTL,MQTL,QTLCartographer或其他类似软件进行。还计算了每一个QTL的统计学显著性和变异百分比。
本文所披露的方法提供了一种大量鉴定很多(如果不是全部的话)参与感兴趣的基因表达控制的调节因子(基因)的有效方法,并且提供了对每一种因子在所观察到的所述感兴趣的基因表达变异性方面的相对作用的估算,以及鉴定所述调节基因的基因组定位和可用于传统植物育种的相关标记。另外,在分析由特定的环境刺激诱导或者与一种特定过程相关的多个基因的同时,可以鉴定影响多种基因表达,如级联中的基因表达的“主开关”调节基因。
一旦鉴定了与所述感兴趣的基因表达显著相关的一个或多个QTLs,就可以将上述每一个基因座以及连接的标记直接用作标记,例如,但不限于用于育种和筛选目的,包括植物育种,或者作进一步的鉴定,以便确定与所述感兴趣的基因表达相关的基因,其中使用本领域技术人员所公知的基于作图的克隆方法。例如,可以对一个或多个已知的调节基因进行作图,以便确定这些基因的遗传位点是否与控制所述感兴趣的基因的mRNA表达的QTLs重合。可以通过本领域的标准技术证实这种重合的调节基因影响一个或多个感兴趣的基因表达,例如,但不限于基因转化,以及基因互补或基因剔除技术,或超量表达。还可将所述遗传连锁图用于分离所述调节基因,包括所有新的调节基因,通过本领域公知的基于作图的克隆方法,使用大的插入基因组克隆的重叠群将定位于QTL上的标记用于步移到所述感兴趣的基因。定位克隆是这样一种方法,可将它用于分离一种或多种调节基因,正如Martin et.al.(Martin,G.B.,Brommonschenkel,S.H.,Chungwongse,J.,Frary,A.,Ganal,M.W.,Spivey,R.,Wu,T.Earle,E.D.和S.D.Tanksley,1993,Science 262:1432-1436;被收作本文参考)所披露的,不过,还可以使用本领域技术人员所认可的其他合适方法。同样,证实这种重合的调节基因影响一个或多个感兴趣的基因表达,可以通过基因转化和互补或通过下面所披露的剔除技术完成。
因此,本发明涉及鉴定植物基因组内参与反应于环境刺激或与感兴趣的过程中的差异基因表达相关的过程而介导一种或多种感兴趣的基因表达的区域。本发明还涉及对所限定的QTL进行表征,以便鉴定位于所述基因座上的一个或多个调节基因和调节序列。
本发明的方法还被用于鉴定与相关于控制或介导感兴趣的基因在感兴趣的生物体内表达的因子(由调节基因编码)相应的基因座。该方法还可被用于鉴定控制和调节一种或多种感兴趣的基因的mRNA转录物含量的调节基因,这种变异是天然出现的还是由基因突变、基因破坏、或基因插入所诱导的,例如,但不限于由与以下过程相关的因素调节的感兴趣的基因:
-生物胁迫,例如,但不限于病毒、细菌、真菌、昆虫或线虫;
-非生物胁迫,包括,但不限于低温、霜冻、水、干旱、渗透压、热、盐、氧化剂、污染物;
-发育、化学和环境控制的基因表达;
-胚胎发生,例如,但不限于组织、或器官发育,对于植物来说,可以包括种子发育、器官形成,花发育;
-矿物营养,包括宏观和微观养分;
-光照(辐射水平和光量);
-昼夜节律、亚昼夜节律以及其他内部节律;
-化学诱导物,包括天然生长调节剂,例如当感兴趣的生物是植物时,包括生长素、赤霉素、ABA、细胞分裂素、乙烯、及其类似物,合成激素、除草剂、水杨酸、茉莉酸;
或对以下生物学过程等有显著影响的感兴趣的基因;
-决定产量,例如(不局限于此),在植物中,通过调节基因对生物量、结实(数量和大小)、光合产物转运、储存和资源、叶面积指数、根芽比的影响决定可收获的产量;
-生物量的营养价值,例如,但不限于收获的物质和对质量因素水平的相关作用,所述质量因素如辅因子、维生素、蛋白、抗氧化剂、高度可消化的纤维;
-形态学,例如,但不限于在植物中包括调节基因对花色(例如与花青甙合成相关的基因)、植株高度(例如与赤霉素合成相关的基因、节间长度、叶片着生处的影响;
-细胞周期速度,例如,但不限于细胞周期蛋白;
-细胞分化速度,例如,但不限于同源域蛋白;
-细胞大小,例如,但不限于在植物中包括与生长素合成、生长素受体、生长素诱导的基因相关的基因;
-生物生命周期,例如通过调节基因对衰老、成熟、休眠、发芽的影响;
-基因组重排,例如转座子激活。
除了将本发明的方法用于鉴定与转录相应的基因座或任何控制感兴趣的生物中编码各种需要的性状的基因表达的任何因子之外,位于所述QTL上的标记还可应用于育种。例如,所鉴定的与位于基因座(QTL)上的一个或多个鉴定的遗传标记相关的鉴定的多态性可用于:进行基于基因组的诊断和筛选技术:
-跟踪一种生物的后代;
-测定一种生物的杂合性;
-鉴定连锁的表型性状、mRNA表达性状或表型性状和mRNA表达性状的变异;
-作为用于构建遗传连锁图的遗传标记;
-鉴定由杂交获得的各个后代,其中,所述后代具有来自亲本供体、受体亲本或亲本供体和受体亲本的需要的遗传学贡献;
-分离基因编码或非编码DNA序列周围的基因组DNA序列,例如,但不限于启动子或调节序列;
-标记辅助的筛选,基于作图的克隆,杂种验证,指纹分析,基因型分析和等位基因特异性标记;和
-作为一种感兴趣的生物的标记。
通过本文所披露的基于QTL作图的分析,还可以鉴定在完整生物、器官、组织或细胞特异性水平上与对环境刺激有反应的一种感兴趣的基因表达相关的调节基因座,或与相关于一种感兴趣的过程的差异基因表达相关的表型相关的调节基因座。例如(并非要以任何方式进行限定),可以评估能调节mRNA表达的候选调节基因,如(还可参见表2,实施例2):
-转录因子(锌指和AP2蛋白);
-促细胞分裂剂激活的蛋白激酶(MMK4,MMK3,MMK2,MMK1);
-钙依赖型蛋白激酶;
-丝氨酸-苏氨酸蛋白激酶;
-钙离子转运ATP酶;
-GTP结合蛋白;
-RNA结合蛋白;
-蛋白磷酸酶(2A和2C型);
-Ca2+-结合蛋白,例如钙调蛋白;
-14-3-3蛋白;
-GTP酶激活蛋白;
-腺苷酸环化酶;
-磷酸脂酶C;
-脂加氧酶;
-组蛋白脱酰酶;
-受体激酶;或
-磷脂酰肌醇3-激酶
以便确定它们是否作图于能够解释植物中低温调节基因的大比例表达的基因组区(QTL),例如,但不限于苜蓿(Medicago falcataL.)。
本文所披露的方法可用于补充基于DNA芯片或格栅阵列或任何能够测定基因表达的其他系统的高通量基因组分析研究。使用分离的群体,可以定位调节基因的转录物水平的QTLs,所述基因的表达与感兴趣的表型相关(例如抗胁迫和抗病性,生物化学生产,形态学变异等)。对来自EST中心的候选基因进行作图,确定了重要QTLs的潜在的共同定位,并且可以鉴定等位基因多态性和开发等位基因特异性标记。所述QTLs和相关调节基因的鉴定可用于基于基因组的诊断和筛选技术中,用于评估在特定发育或环境条件下的基因表达,以及以发育、组织或环境方式协调基因表达。
可以通过QTL作图分析鉴定与基因表达水平相关的基因组区,例如,但不限于由低温诱导的基因组区。这种使用基因表达水平作为数量性状的方法能够通过将对所述调节基因的检索范围缩小在特定的基因组区而鉴定基因表达控制机制。决定基因表达变异的DNA序列也有可能存在于该区域内。由于完整基因组序列的获得以及数量越来越多的ESTs常规整合在高密度图谱上,或者通过利用比较性遗传学作图中沿相关物种的染色体的大量的基因区块的共线性,可以使本文所披露的基因鉴定方法更容易和更快速。
在本文的实施例中所鉴定的非常重要的QTLs,以及它们所表现出来的出人意料的高度变异性,表明了通过基因表达的QTLs分析定位负责胁迫诱导的基因表达的重要调节因子的可能性。对通过相同的环境刺激或与一种特定过程相关的刺激诱导的多个基因进行比较性QTL分析,能够说明调节基因表达的复杂途径,并且对拥有类似调节因子的基因进行重新分组。
本发明的技术可用于其表达是通过任何因子调节的基因,该技术使用分离所述基因表达水平的群体。该方法可用于鉴定能够用于表征特定基因型的基因组区,而不存在基于基因表达的技术所固有的环境或发育干扰。
为了鉴定可以定位于一个或多个QTLs上的调节基因,这些基因解释了一种或多种感兴趣的基因表达的变异的显著比例,由已知调节基因获得探针,例如,但不限于上文所列举的,以及在实施例2的表2中所示出的调节基因,并且将所述调节基因或其表达产物在连锁图上作图。所述探针可以包括用于检测DNA或RNA的核苷酸片段或完整长度的基因,或用于检测调节基因的表达产物的抗体。可以理解的是,还可以通过本领域技术人员所公知的方法鉴定位于一个或多个QTLs上的未知调节基因,例如,但不限于对被测序的DNA部分定位克隆并作图,以便确定所克隆的DNA是否与所述一个或多个QTLs拥有共同的位置(图位)。优选证实候选调节基因在一个或多个QTLs上的定位,例如,通过在所述连锁图上对来自每一个推测的调节基因的上游或下游区进行作图。这样,只有具有与相同的QTLs拥有共同位置的5′或3′区的调节基因被用于进一步表征。
然后可以分离并表征位于一个或多个QTLs内的与一种或多种感兴趣的基因相关的调节基因,及其在诸如,但不限于诸如苜蓿的转基因植物中的受到调节的表达,以便评估其对感兴趣的基因表达的作用,并且,如果需要的话,评估它们对感兴趣的生物对一种环境胁迫的反应的作用。所述分析可以包括,但不限于互补或基因剔除,以及基因激活,涉及分别用所述调节基因或增强子序列的有义或反义构建体转化感兴趣的生物的研究。用所述调节基因的有义构建体转化缺乏对环境刺激或感兴趣的过程的反应或表现出弱的反应的感兴趣的生物,而用所述调节基因的反义构建体转化缺乏对感兴趣的过程的反应表现出强的反应或正得分的感兴趣的生物,或者将诸如T-DNA的外源DNA插入所述基因的编码区破坏所述基因,或者通过插入所述感兴趣的基因的5′或3′增强子序列激活该基因。然后可以监测一个或多个感兴趣的基因和所述调节基因的表达,以便确定所述有义、反义、剔除或增强子插入调节基因对所述生物对环境刺激或感兴趣的过程的反应的影响。还可以测定所述有义、反义、剔除或增强子插入构建体对针对一种环境胁迫的生理学反应的影响。
同样可以理解的是,位于特定QTLs或一组QTLs上的调节基因还可被用作在育种过程中一个或多个QTLs的标记。
因此,本发明还涉及一种用于鉴定能介导一种感兴趣的基因表达的调节基因的方法,包括:
i)制备所述感兴趣的生物的连锁图;
ii)鉴定解释一种或多种感兴趣的基因的表达变异的显著比例的一个或多个QTLs;和
iii)分离一个或多个调节基因,并对其进行作图,以便确定该调节基因是否作图于所鉴定的一个或多个QTLs内。
本发明还涉及介导一种感兴趣的生物对环境胁迫的反应,或表征一种鉴定的和分离的调节基因的体内作用,包括将所述调节基因导入感兴趣的生物体内,并且任选测定该调节基因对一种或多种感兴趣的基因表达的作用,或其对一种感兴趣的生物对环境刺激反应的影响。
上述说明并非以任何方式限定所披露的发明,另外,所讨论过的特征的组合可能并非是本发明方案所绝对必须的。
在以下实施例中将对本发明作进一步的说明。不过,应当理解的是,这些实施例仅仅是用于说明目的的,而不应当以任何方式用于限定本发明的范围。
实施例1:鉴定与低温调节基因表达相关的QTLs
实验方法的一般性说明
将低温调节(msaCI)基因的表达和LT50表型用作二倍体苜蓿的F2基因型的无性繁殖体内的数量性状的一个例子。将所述表型(msaCI基因表达和LT50)的分离形式用于在二倍体苜蓿基因组的连锁图上查找数量性状基因座(QTL)。
植物材料
通过使具有不同耐低温性的二倍体亲本杂交(野苜蓿x紫苜蓿)构建F1群体。所述F1品系是通过来自二倍体水平组的栽培苜蓿的作为母本的低温敏感型紫苜蓿基因型(Bingham,E.T.和T.J.McCoy.1979.Crop Sci.19:97-100)与来自M.falcata cv.Anik的作为父本的耐寒二倍体基因型(Pankiw,P.and Siemens,B.1976.Can.J.Plant Sci.56:203-205)之间的异花授粉而产生的。将花去雄,并且手工授粉。通过手工授粉使随机选择的F1基因型自交。并且将由该杂交所产生的F2后代用于产生连锁图和QTL分析。
生长条件
无性繁殖来自117 F2基因型的切穗,并且在开始长根之后移植到深的移栽钵中。然后在环境受控制的条件下生长无性繁殖体:温度为21℃和17℃(分别为白天和夜间温度),光照周期为16小时,辐射强度为大约225μmol m-2 s-1光合光子通亮密度。
低温驯化条件
在2℃下,在生长箱中对植物进行2周的低温驯化,提供8小时的光照期,光照强度为大约125μmol m-2 s-1光合光子通亮密度。
LT50测定
按照Castonguay et al(Cas tonguay,Y.,Nadeau,P.,和S.Laberge 1993.Plant Cell Physiol.34:31-38)所披露的方法对来自分离的群体的每一种基因型和亲本基因型的无性繁殖体进行冷冻实验。让植物接触逐渐降低的环境温度,在此期间以一定的时间间隔恢复各个植株,并且让它在原始生长条件(昼夜温度分别为21/17℃)下再生长3周时间,然后评估植物的存活率。通过SASTM Probit方法(Statistical Analysis System,Cary,NC)测定50%杀伤温度(LT50)。进行3次重复的具有循环置换的(12个区组)的不完全区组设计,以便统计比较用于本研究的大量生态型。
msaCI基因的说明
将从来自低温驯化的四倍体苜蓿冠的cDNA文库中分离的7种msaCI基因(M.sativa cv.Apica;Laberge,S,Castonguay,Y.和Vezina,L.-P.1993.Plant Physiol 101,1411-1412;Castonguay,Y.,S.Laberge,P.Nadeau,和L.-P.Vezina.1997.p.175-202.In B.D.McKersie和D.W.Brown(ed.).饲用豆科植物的生物技术和改良:CAB International,Wallingford,UK)用于本研究中:
msaCIA 富含甘氨酸 Laberge et al.(1993)
msaCIB 推测的核蛋白 Monroy et al.(1993)
msaCIC 双模式蛋白 Castonguay et al.(1994)
msaCID 病理相关蛋白 未发表
msaCIE 甘油醛-3P-脱氢酶 未发表
msaCIF 半乳糖醇合成酶 未发表
msaCIG Dehydrin样 未发表
*Laberge,S,Castonguay,Y.和Vezina,L.-P.1993.PlantPhysiol.101,1411-1412.
**Monroy,A.F.,Castonguay,Y.,Laberge,S.,Sarhan,F.,Vezina,L.-P.和Dhindsa,R.S.1993.Plant Physiol.102,873-879.
***Castonguay,Y.,Laberge,S.,Nadeau,P.和Vézina,L.-P.1994.Plant Mol.Biol.24,799-804。
RNA提取
用研钵和研棒在液氮中将来自每一种低温驯化基因型的大约0.5克(鲜重)叶组织研磨成细粉,并且用以前披露的标准方法提取总RNA(Castonguay et al.1994.Plant Mol.Biol.24,799-804)。通过在260纳米下的UV吸收定量总RNA(Fourney,R.M.,J.Miyakoshi,R.S.Day m,和M.C.Paterson.1988.Focus 10:1)。
斑点印迹定量
对于每一种亲本基因型和每一种分离群体的基因型来说,使用Bio-DotTM装置(Bio-Rad,Mississauga,ON)将5微克总RNA真空转移到尼龙膜(Hybond N+,Amersham Pharmacia Biotech,Oakville,ON)上,并且通过在紫外光下交联3分钟固定。按照标准方法(Sambrook,J.,Maniatis,T.和Fritsch.1989.Molecular cloning:Alaboratorymanual.Cold Spring HarborLaboratory Press,Cold SpringHarbor,New York)用由纯化的低温调节基因的插入片段制备的[32P]dCTP标记的探针在68℃下,在2X SSC,0.25%(W/V)低脂奶粉、1%SDS中与所述尼龙膜杂交过夜。在-80℃下用所述尼龙膜对Kodak X-OmatAR5 X-光胶片进行曝光,并且通过使用OneD ScanTM软件(Scanalyticsinc.,Billerica,MA)对放射自显影进行密度分析以定量转录物的水平。有关用msaCIA基因作探针获得的这种斑点印迹的一种例子可以参见图3。将每一个膜上所有样品的平均转录物水平用于将不同膜之间的杂交信号标准化。
连锁图谱
根据AFLP和RFLP构建遗传连锁图。从来自4-6周大的无性繁殖体的1-2克新鲜叶片组织中提取DNA。提取方法大体上如Doyle和Doyle(Doyle,J.J.,和Doyle,J.L.1990.Isolation of plantDNA from fresh tissue.FOCUS 12,13-15)所述,所不同的是,是在室温下在不使用液氮的情况下研磨叶片组织。
为了揭示RFLP标记,分别用限制酶DraI和EcoRV消化从169种F2基因型中纯化的DNA。在水平凝胶(0.9%琼脂糖,1 XTAE)上分离每一种消化过的DNA样品(每一种基因型6微克),并且通过毛细吸印将分离的片段转移到尼龙膜上(Hybond N+,Amersham PharmaciaBiotech,Oakville,ON)。制备10个重复拷贝的膜,以便用多种探针进行同时的分离分析。让膜在65℃下与用[32P]-dCTP标记过的探针杂交过夜。DNA探针包括随机挑选的cDNAs和根据与调节基因的同源性挑选的cDNAs。所述调节基因是从紫苜蓿cDNA文库和上述7种msaCIcDNAs获得的。首先通过PCR特异性扩增cDNA插入片段,并且用T7QuickPrime试剂盒(Amersham Pharmacia Biotech,Oakville,ON)通过随机六聚体标记进行标记。预杂交、杂交和探针标记是按标准方法进行的(Sambrook,J.,Maniatis,T.和Fritsch.1989.Molecular cloning:A laboratory manual.Cold Spring HarborLaboratory Press,Col Spring Harbor,New York)。
为了鉴定AFLP标记,用EcoRI和MseI限制酶消化F2 DNAs,连接到Eco-和Mse-特异性引物接头上,然后通过预先选择的Eco和MsePCR引物进行扩增(Vos.P.,Hogers,R.,Bleeker,M.,Reijans,M.,van der Lee,T.,Hornes,M.,Frijters,A.,Pot,J.,Pelerman,J.,Kuiper,M,和Zabeau,M.1995,Nucleic Acids Res.23,4407-4414)。将预先选择的扩增子稀释20倍,以便用作选择性扩增的材料。用于选择性扩增的Eco和Mse引物包括位于3′末端的3个选择性核苷酸。Eco引物是用IRD染料标记的,它可以通过LI-COR自动测序仪(LI-COR,Inc.Lincoln,Neb,USA)的红外线激光检测扩增子。选择性扩增是按照Vos等所披露的“降落”(touch down)方法进行的(1995,Nucleic Acids Res.23,4407-4414)。在选择性扩增之后,在由7%Long Ranger丙烯酰胺,7 M尿素和0.6 X TBE组成的25厘米的凝胶上,用LI-COR自动DNA测序仪4000L型分离扩增子。
使用来自112个RFLP和117个AFLP分离标记的分离数据构建所述二倍体杂种的遗传图谱。用MAPMAKER/EXP v 3.0软件(Lander,E.S.,Green,P.,Albertson,J.,Barlow,A.,Daly,M.J.,Lincoln,S.E.,和Newburg,L 1987.Genomics 1,174-181)进行共同分离分析,以便确定每一种标记的连锁群分配,以及每一种分子标记在每一种连锁群中的定位。通过两点分离获得各个连锁群,最低LOD得分为15,最大重组水平为30%。然后通过LOD阈值为2.0的多点分析确定基因座在连锁群中的顺序。所得到的图谱(图1)覆盖大约1400cM,并且平均标记间隔大约为8cM。有15个标记仍然是不连锁的。
鉴定与msaCI基因表达和抗冻性相关的QTL
使用MAPMAKER/QTL v 1.1.鉴定与msaCI基因表达相关的QTLs(Lander,E.S.,and Boststein,D.1989,Genetics121,185199)。用每一种基因的表达作为一种数量性状筛选所述连锁图,寻找QTLs在该基因组特定区域的存在。测定每一种QTL相对其他QTL的作用,以及由每一种QTL所解释的msaCI基因表达的差异。将2.0的LOD阈值用于鉴定QTL。
分析低温调节的7种msaCI基因中的每一种的转录物的积累,发现了其表达的大的基因型变异性,在某些场合下,基因型之间的表达有10-40倍的差异(例如,参见图3)。
发现了所有7种msaCI基因和LT50表型的与在基因型之间出现的msaCI基因转录物水平变异性相关的QTLs(表1)。在这些QTLs中发现了在msaCI基因表达中起着重要调节作用的基因。与msaCI基因的表达相关的QTLs的数量在1(msaCIF)至5(msaCIC)之间变化。在大多数场合下,其LODs是高度显著的。由QTLs导致的表型变异在10-60%之间。在大多数场合下,表达和抗冻性的增强是由来自耐低温野苜蓿亲本的等位基因造成的。
鉴定了三个与抗冻(LT50)相关的QTLs。其中的两个QTLs位于同样与msaCIB和msaCID的表达相关的基因组区中的连锁群E中。
发现控制msaCI基因表达的QTLs与msaCIA(参见连锁群D,图2),msaCID(参见连锁群E,图2)和msaCIG(连锁群F,图2)的相应的结构基因的位置相关。
对于msaCID来说,RFLP基因座与三个基因:msaCID基因本身,msaCIA和msaCIB(参见连锁群E,图2)的表达QTLs重合。这表明msaCID要么是一种调节基因,要么有一个调节基因位于它的附近。
观察到了msaCIA(在120-130cm之间,图2,连锁群E)和msaCID(参见连锁群E,图2)的位于相同基因组区上的控制在冠组织和叶组织中表达的QTLs。不同的是,影响每一种类型组织中的表达的基因座不同。控制若干种msaCI基因的表达的QTLs位于连锁群B和E中,表示具有共同的调节机制。一个特别突出的例子是位于连锁群B上的QTL,它能影响所研究的5种msaCI基因在叶组织中的表达(图2,表1)。
表1:在二倍体苜蓿中与低温调节基因的mRNA表达和抗冻性相关的QTL。提供了与叶或冠中基因表达相关或与抗冻性(LT50)相关的连锁群,以及LOD得分。鉴定了作图在这些基因区的调节基因。突出显示的基因C4494和C2186表示与分别来自拟南芥属的CBF1-基因和来自大豆的SCOF-1基因的同源性,业已证实了所述基因与抗冻性相关(*数据没有在图2中示出)。基因/性状 连锁群 LOD 候选 与编码以下物质的 调节基因 基因同源 冠叶 冠叶 冠叶msaCIA D D D D EB 11 9 9 9 43 msaCLA C2314 C5047 C2250 msaCIDC2784 丝氨酸/苏氨酸蛋白 激酶 磷酸酶2C 富含亮氨酸的重复 (LRR)受体样蛋白激酶 GTP结合蛋白 (与Ras相关) EmsaCIB E EE 4EEEB 4 45 C43204443 msaCID C3283C4320 促细胞分裂剂激活的 蛋白激酶C271 丝氨酸蛋白激酶C948 酪蛋白激酶IC3749 CDC2+/CDC28相关 蛋白激酶R2- 乙醇胺激酶基因/性状 连锁群 LOD 候选 与编码以下物质的 调节基因 基因同源 冠叶 冠叶 冠叶msaCIC A B G G GF 4AAAA 6B 6 5 55 C4546553 C168 C2420 C374C4494 AP2结构域转录因子 (CBF1同系物) 促细胞分裂剂激活的 蛋白激酶(MAP3K)C2595 钙网蛋白C374 肽基-脯氨酰基顺- 反异构酶C3358 腺苷激酶C2886 环化酶相关蛋白(CAP)- 转录因子 Ca2+-转运ATP酶样 蛋白 肽基-脯氨酰基顺- 反异构酶 I* J*msaCID E E E 5 6K*BE 14E 10E 12558 msaCID5 C52378 C3346C2784 丝氨酸/苏氨酸蛋白 激酶msaCIDC5237 细胞分裂周期蛋白48C3346 烯反应性元件 转录因子基因/性状 连锁群 LOD 候选 与编码以下物质的 调节基因 基因同源 冠叶 冠叶 冠叶 E J* L*msaCIE H*E 7 5 6B 54 C32838C3283 乙醇胺激酶C2784 丝氨酸/苏氨酸蛋白 激酶msaCIFI*3msaCIG FLT50 C CB 6 6 44 msaCIG C2456 C2186C2784 丝氨酸/苏氨酸蛋白 激酶 GTP-结合核蛋白 (RAN1A) 锌指转录因子 (SCOF-1同系物) E E 4 4 C5237 C3283 细胞分裂周期蛋白48 乙醇胺激酶
实施例2:分离与感兴趣的QTLs相关的调节基因和调节序列
实验方法的一般性说明
解释msaCI基因的表达变异的显著比例的QTLs的检测,表明调节基因可能位于这些基因座上。对来自低温驯化苜蓿编码基因的在基因表达调节中具有已知功能的多种已表达序列标志(EST)作图。分离并表征位于与msaCI基因表达相关的QTL中的候选调节基因,并且检查其在转基因苜蓿中的表达,以便评估其对低温调节基因表达的作用。
候选调节基因的说明
从λgt10 cDNA文库中分离与具有已知调节功能的基因有同源性的一系列ESTs,所述文库是用从四倍体苜蓿的冠中分离的mRNA制备的(M.sativa L.cv.Apica;R.Michaud,C.Richard,C.Willemot和H.Gasser 1983.Can.J.Plant Sci.63:547-549):
转录因子(锌-指和AP2蛋白)
促细胞分裂剂激活的蛋白激酶(MMK4,MMK3,MMK2,MMK1)
钙依赖型蛋白激酶
丝氨酸-苏氨酸蛋白
Ca2+转运ATP酶
GTP结合蛋白
RNA结合蛋白
蛋白磷酸酶(2A和2C型)
钙调蛋白
14-3-3蛋白
GTP酶激活蛋白
腺苷酰环化酶蛋白
磷酸脂酶C
脂加氧酶
Ca2+-结合蛋白
组蛋白脱乙酰酶
受体激酶
磷脂酰肌醇3-激酶
候选调节基因的遗传作图
通过PCR扩增制备在表2中列举的特定调节基因的探针,在Sephacryl S-200 MicroSpin柱(Amersham Pharmacia Biotech,Oakville,ON)上纯化,并且在-20℃下保存。将所述探针用于Southern杂交,以便限制来自在实施例1中披露的杂交后代的F2二倍体基因型的DNA。通过随机六聚体标记将纯化的探针标记成具有高的比活性,并且对RFLPs来说按照实施例1所披露的标准方法与DNA印迹杂交(Sambrook,J.,Maniatis,T.和Fritsch.1989.Molecular cloning:Alaboratory manual.Cold Spring HarborLaboratory Press,Cold Spring Harbor,New York)。在表2中提供了多态性并且被作图的调节基因,以及根据其与GENBANK/EMBL数据库中的序列的同源性推测的功能。
表2:多态性调节基因及其推测的功能。突出显示的克隆表示与msaCI基因调节或抗冻性(LT50)相关的潜在候选基因克隆 同源于C102 抗细胞凋亡-1防御蛋白C103 Pumilio RNA结合蛋白C113 核仁蛋白C123 EF-手钙结合蛋白C127 MADS转录因子C157 ABA诱导的蛋白B166 GTP结合蛋白A168 转录因子C183 GTP结合蛋白B187 G-框结合蛋白A207 蛋白激酶C(底物)C221 酪氨酸磷酸A271 丝氨酸蛋白激酶C343 同源框蛋白(结-1)C374 肽基-脯氨酰基顺-反异构酶C389 ABA反应增强子C532 螺旋-环-螺旋转录因子C571 GTP结合蛋白C834 P72 DEAD框蛋白C948 酪蛋白激酶C973 促细胞分裂剂激活的蛋白激酶(MMK4)C2105 WRKY3 DNA结合蛋白C2186 锌指转录因子(SCOF-1同系物)C2250 GTP结合蛋白(与Ras相关)C2314 磷酸酶2CC2352 孕酮结合同系物C2420 C2+转运ATP酶样蛋白C2426 乙烯反应性小型GTP结合蛋白C2456 GTP结合蛋白(RAN1A)C2595 钙网蛋白C2658 钙调蛋白结构域蛋白激酶(CDPK)C2784 丝氨酸/苏氨酸蛋白激酶C2886 环化酶相关蛋白(CAP)C2939 AP2结构域转录因子(TINY样)C2988 富含亮氨酸的重复(LRR)受体样蛋白激酶C3050 蛋白激酶C3125 核酸结合蛋白C3253 受体激酶C3268 丝氨酸-苏氨酸蛋白激酶C3283 乙醇胺激酶C3291 IAA诱导的ARG-2蛋白C3346 乙烯反应性转录因子C3358 腺苷激酶C3367 RNA结合蛋白C3506 蛋白激酶C3520 核苷酸结合蛋白C3601 环-H2指蛋白C3604 转录因子C3626 DNA结合蛋白C3749 CDC2+/CDC28-相关的蛋白激酶R2C3843 磷脂酰肌醇3-激酶C3844 GTP结合蛋白(RAB型)C4050 丝氨酸/苏氨酸磷酸酶2A型C4266 RAC样蛋白(RHO同系物)C4320促细胞分裂剂激活的蛋白激酶C443814-3-3蛋白C4494AP2结构域转录因子(CBF1同系物)C4546促细胞分裂剂激活的蛋白激酶(MAP3K)C4622钙调蛋白结构域蛋白激酶(CDPK)C5047富含亮氨酸的重复(LRR)受体样蛋白激酶C5206同源框蛋白(结-1)C5237细胞分裂周期蛋白48
EST序列还被用于设计用来扩增所鉴定的基因座的引物,如来自分离群体的个体的DNA的STS(序列标记位点)。当所得到的PCR产物在所述群体的个体之间具有单一形态时,用各种酶限制所述PCR产物,以便检测多态性。如果没有检测到多态性,就对从两种亲本获得的PCR产物分别进行测序,并且检索SNPs(单核苷酸多态性)。
按实施例1所述方法将上述候选调节基因作为F2后代中的RFLPs作图,以便评估其是否位于msaCI基因的低温诱导表达的变异相关的QTLs内。所述QTLs是在实施例1中鉴定的。
在表1中所列举的所有基因以及在表2中突出显示的基因位于含有QTLs的基因组区内,因此是用于msaCI基因表达,LT50性状或其组合的推测的候选调节基因。其中的两个基因C4494和C2186表现出分别与来自拟南芥属的CBF1基因和来自大豆的SCOF-1基因的同源性,业已证实了所述基因参与耐低温性(Jaglo-Ottosen,K.R.,Gilmour,S.J.,Zarka,D.G.,Schabenberger,O.,和Thomashow,M.F.1998。拟南芥属CBF1过量表达能诱导COR基因并增强抗冻性。Science 280:104-106.Kim,J.C.,Lee,S.H.,Chsong,Y.H.,Yoo,C.-M.,Lee,S.I.,Chun,H.J.,Yun,D.J.,Hong,J.C.,Lee,S.Y.,Lim,C.O.,和Cho,M.J.,2001。来自大豆的一种新型低温诱导型锌指蛋白SCOF-1能增强转基因植物的抗低温性。ThePlant Journal 25:247-259)。C4494(CBF1同系物)位于与msaCIB在叶片中表达相关的QTL上(连锁群F,图2),而C2186(SCOF-1同系物)作图于含有LT50的QTL的区域(连锁群C,图2)。所述基因所编码的低温诱导转录因子被确切证实能启动COR(msaCI)基因在转基因植物中的组成型表达,并且提高在非驯化条件下的抗冻性。
以上结果还表明,有多种有趣的新型候选调节基因参与了低温抗性表达和msaCI基因表达(表1,图2)。例如,与丝氨酸/苏氨酸蛋白激酶具有同源性的克隆C2784作图于连锁群B上的一个位点,其中,存在控制msaCIA,msaCID,msaCIE和msacIG在叶中表达的QTLs。在苜蓿细胞中,渗透压胁迫会导致两种蛋白激酶的迅速激活。其中的一种激酶似乎是源于拟南芥属ASK1的丝氨酸/苏氨酸激酶1的同系物(Munnik,T.and H.J.G.Meijer.2001.FEBS Letters 498:172-178)。可以通过下文所披露的方法证实所述候选调节基因的作用。
对候选调节基因和候选调节序列的基因组克隆进行测序
使用源于上述两种亲本的DNA从在EMBL3噬菌体(Sambrook,J.,Maniatis,T.和Fritsch.1989.Molecular cloning:Alaboratory manual.Cold Spring Harbor Laboratory Press,ColdSpring Harbor,New York)中构建的基因组文库中分离作图于一个或多个与msaCIA基因表达变异相关的QTLs上的候选调节基因的ESTs。通过双脱氧核苷酸链终止法对每一个候选调节基因进行整体测序,包括编码区的上游和下游区(Sambrook,J.,Maniatis,T.and Fritsch.1989.Molecular cloning:A laboratory manual.Cold SpringHarbor Laboratory Press,Cold Spring Harbor,New York)。还比较了每一个亲本的等位基因形式,以便鉴定决定QTL的突变。通过在上述制备的连锁图上对每一个调节基因的上游或下游区进行作图证实候选调节基因的定位。只有以具有与相同的一个或多个QTLs处在共同作图位置的5′或3′区的调节基因被用于在互补或基因剔除研究中进行进一步的表征。
候选基因在转基因植物中改变了的表达(互补和剔除研究)
按Desgagns等以前所披露的方法(Desgagnes R.,S.Laberge,G.Allard,H.Khoudi,Y.Castonguay,J.Lapointe,R.Michaud和L.-P.Vezina.1994.Plant Cell Tissue Organ Cult 42:129-140)用根癌农杆菌进行苜蓿转化。采用两种方法:1)使用与组成型启动子,例如,但不限于35S融合的基因使所述候选基因进行组成型表达;和诱导型表达。将候选基因的编码区在框内融合在完整长度3 5S启动子上,并且将所得到的构建体克隆到二元表达载体pGA482上。将完整长度的候选调节基因(即具有周围的5′和3′区的候选调节基因,它作图于上文所述的一个或多个QTLs上)连同大约1kb的5′和1kb的3′非编码区克隆到二元表达载体pGA482上。将有义方向的用于组成型和诱导型表达的构建体用于转化缺乏在与感兴趣的性状表达(例如,但不限于msaCI基因表达)相关的QTL上的等位基因的植物,而将反义方向构建体用于转化具有在QTL上的等位基因的植物。生长所述转基因植物,并且根据需要接触低温驯化条件,以便确定所导入的有义或反义基因对多个msaCI基因和LT50表达的作用,从而证实所述候选基因是位于QTL上的控制msaCI基因的mRNA表达的调节因子。
所有引用文献都被收作本文参考。
业已结合优选实施方案对本发明进行了说明。不过,对本领域技术人员来说显而易见的是,在不超出本文所披露的发明范围的前提下可以进行多种改变和改进。