植物反式激活互作基序及其用途.pdf

摘要
申请专利号：	CN201380017031.1	申请日：	2013.02.01
公开号：	CN104202966A	公开日：	2014.12.10
当前法律状态：	授权	有效性：	有权
法律详情：	授权\|\|\|实质审查的生效IPC(主分类):A01H 5/00申请日:20130201\|\|\|公开
IPC分类号：	A01H5/00; C07K19/00; C12N15/62; C12N15/82	主分类号：	A01H5/00
申请人：	陶氏益农公司
发明人：	J·皮托利诺; J·李; S·L·伊文思; R·C·布卢
地址：	美国印第安纳州
优先权：	2012.02.02 US 61/594,245
专利代理机构：	北京市嘉元知识产权代理事务所(特殊普通合伙) 11484	代理人：	张永新
PDF下载：	PDF下载

内容摘要

本公开涉及用于提高感兴趣的多核苷酸的表达的组合物和方法。一些实施方案涉及已经在植物中被鉴定的新型反式激活多肽及其变异体，和使用它们的方法。具体的实施方案涉及在融合蛋白中使用至少一个DNA结合多肽，用于将至少一个反式激活多肽或其变异体靶定在包含感兴趣的多核苷酸的核酸的特定结合位点上，从而提高其表达。

权利要求书

1.  一种人造转录激活物融合蛋白，其包含：
DNA结合多肽；和
选自SEQ ID NO:10-58的反式激活结构域互作基序多肽。

2.  权利要求1的人造转录激活物融合蛋白，其中所述DNA结合多肽选自：锌指DNA结合结构域；来自AVRBS3-可诱导基因的共有结合序列或从其工程化的人造结合序列；GAL4；TAL；LexA；Tet阻遏物；LacR；和类固醇激素受体。

3.  权利要求1的人造转录激活物融合蛋白，其中该融合蛋白包括至少一个额外的DNA结合多肽。

4.  权利要求1的人造转录激活物融合蛋白，其中该转录激活物融合蛋白包含选自SEQ ID NO:2-8和SEQ ID NO:100-120的氨基酸序列。

5.  权利要求1的人造转录激活物融合蛋白，其中所述反式激活结构域互作基序多肽选自SEQ ID NO:10-16,SEQ ID NO:22,SEQ ID NO:28,SEQ ID NO:34,SEQ ID NO:40,SEQ ID NO:46,SEQ ID NO:52,和SEQ ID NO:58。

6.  权利要求1的人造转录激活物融合蛋白，其中所述反式激活结构域互作基序多肽选自SEQ ID NO:17,SEQ ID NO:23,SEQ ID NO:29,SEQ ID NO:35,SEQ ID NO:41,SEQ ID NO:47,和SEQ ID NO:53。

7.  权利要求1的人造转录激活物融合蛋白，其中该反式激活结构域互作基序多肽选自SEQ ID NO:18,SEQ ID NO:24,SEQ ID NO:30,SEQ ID NO:36,SEQ ID NO:42,SEQ ID NO:48,和SEQ ID NO:54。

8.  权利要求1的人造转录激活物融合蛋白，其中该反式激活结构域互作基序多肽选自SEQ ID NO:19,SEQ ID NO:25,SEQ ID NO:31,SEQ ID NO:37,SEQ ID NO:43,SEQ ID NO:49,和SEQ ID NO:55。

9.  权利要求1的人造转录激活物融合蛋白，其中该反式激活结构域互作基序多肽选自SEQ ID NO:20,SEQ ID NO:26,SEQ ID NO:32,SEQ ID NO:38,SEQ ID NO:44,SEQ ID NO:50,和SEQ ID NO:56。

10.  权利要求1的人造转录激活物融合蛋白，其中该反式激活结构域互作基序多肽选自SEQ ID NO:21,SEQ ID NO:27,SEQ ID NO:33,SEQ ID NO:39,SEQ ID NO:45,SEQ ID NO:51,和SEQ ID NO:57。

11.  权利要求1的人造转录激活物融合蛋白，其中该融合蛋白含有至少一个额外的反式激活结构域互作基序多肽。

12.  一种人造转录激活物融合蛋白，当感兴趣的核苷酸序列与第二个核苷酸序列可操作地连接时，该融合蛋白增加该感兴趣的核苷酸序列的表达，该融合蛋白包括：
DNA结合多肽，其特异性结合所述第二核苷酸序列；和
选自下组的蛋白反式激活结构域互作基序多肽：SEQ ID NO:10-16,SEQ ID NO:22,SEQ ID NO:28,SEQ ID NO:34,SEQ ID NO:40,SEQ ID NO:46,SEQ ID NO:52,和SEQ ID NO:58。

13.  一种合成的转录激活物融合蛋白，其包含：
DNA结合多肽；和
与选自下组的氨基酸序列具有至少80％序列同一性的反式激活结构域互作基序多肽：SEQ ID NO:10-16,SEQ ID NO:22,SEQ ID NO:28,SEQ ID NO:34,SEQ ID NO:40,SEQ ID NO:46,SEQ ID NO:52,和SEQ ID NO:58。

14.  权利要求13的人造转录激活物融合蛋白，其中所述反式激活结构域互作多肽与选自下组的氨基酸序列具有至少85％序列同一性：SEQ ID NO:10-16,SEQ ID NO:22,SEQ ID NO:28,SEQ ID NO:34,SEQ ID NO:40,SEQ ID NO:46,SEQ ID NO:52,和SEQ ID NO:58。

15.  权利要求13的人造转录激活物融合蛋白，其中所述反式激活结构域互作多肽与选自下组的氨基酸序列具有至少90％序列同一性：SEQ ID NO:10-16,SEQ ID NO:22,SEQ ID NO:28,SEQ ID NO:34,SEQ ID NO:40,SEQ ID NO:46,SEQ ID NO:52,和SEQ ID NO:58。

16.  权利要求13的人造转录激活物融合蛋白，其中所述反式激活结构域互作多肽与选自下组的氨基酸序列具有至少95％序列同一性：SEQ ID NO:10-16,SEQ ID NO:22,SEQ ID NO:28,SEQ ID NO:34,SEQ ID NO:40,SEQ ID NO:46,SEQ ID NO:52,和SEQ ID NO:58。

17.  一种编码人造转录激活物融合蛋白的核酸，该核酸包含：
编码DNA结合多肽的第一多核苷酸序列；和
编码选自SEQ ID NO:10-58的反式激活结构域互作基序多肽的第二多核苷酸序列，其中所述第一和第二多核苷酸序列自该核酸合框地表达为单一转录本。

18.  权利要求17的核酸，其中该核酸包含至少一个额外的编码DNA结合多肽的多核苷酸序列。

19.  权利要求17的核酸，其中该核酸包含至少一个额外的编码选自SEQ ID NO:10-58的反式激活结构域互作多肽的多核苷酸序列。

20.  权利要求17的核酸，其中所述第一和第二多核苷酸序列与基因调节元件可操作地连接。

21.  权利要求17的核酸，其中所述第一和第二多核苷酸序列与第三多核苷酸序列可操作地连接。

22.  权利要求17的核酸，其中该核酸整合到宿主细胞的基因组中。

23.  权利要求22的核酸，其中所述宿主细胞是植物细胞。

24.  权利要求17的核酸，其中所述DNA结合多肽选自：锌指DNA结合结构域；来自AVRBS3-可诱导基因的共有结合序列或从其工程构建的人造结合序列；GAL4；TAL；LexA；Tet阻遏物；LacR；和类固醇激素受体。

25.  权利要求24的核酸，其中所述DNA结合多肽与选自SEQ ID NO:67、SEQ ID NO:68和SEQ ID NO:99的序列特异性结合。

26.  包含权利要求17的核酸的载体。

27.  权利要求26的载体，其中该载体包含选择标志物或筛选标志物。

28.  权利要求26的载体，其中该载体是植物表达载体。

29.  一种编码人造转录激活物融合蛋白的核酸，该核酸包含：
编码DNA结合多肽的第一多核苷酸序列；和
编码与选自下组的氨基酸序列具有至少80％序列同一性的反式激活结构域互作基序多肽的第二多核苷酸序列：SEQ ID NO:2-8,SEQ ID NO:10-16,SEQ ID NO:22,SEQ ID NO:28,SEQ ID NO:34,SEQ ID NO:40,SEQ ID NO:46,SEQ ID NO:52,SEQ ID NO:58,和SEQ ID NO:100-120，其中第一和第二多核苷酸序列从该核酸合框地表达为单一转录本。

30.  权利要求29的核酸，其中该核酸包含与选自SEQ ID NO:80-93的核苷酸序列具有至少80％同一性的核苷酸序列。

31.  权利要求29的核酸，其中该核酸包含与选自SEQ ID NO:80-93的核苷酸序列具有至少85％同一性的核苷酸序列。

32.  权利要求29的核酸，其中该核酸包含与选自SEQ ID NO:80-93的核苷酸序列具有至少90％同一性的核苷酸序列。

33.  权利要求29的核酸，其中该核酸包含与选自SEQ ID NO:80-93的核苷酸序列具有至少95％同一性的核苷酸序列。

34.  权利要求29的核酸，其中该核酸包含与选自SEQ ID NO:80-93的核苷酸序列具有至少97％同一性的核苷酸序列。

35.  权利要求29的核酸，其中该核酸包含与选自SEQ ID NO:80-93的核苷酸序列具有至少98％同一性的核苷酸序列。

36.  权利要求29的核酸，其中该核酸包含选自SEQ ID NO:80-93的核苷酸序列。

37.  权利要求29的核酸，其中该DNA结合多肽选自：锌指DNA结合结构域、来自AVRBS3-可诱导基因的共有结合序列或从其工程构建的人造结合序列；GAL4；TAL；LexA；Tet阻遏物；LacR；和类固醇激素受体。

38.  一种编码人造转录激活物融合蛋白的核酸，该核酸包括至少一个选自下组的核苷酸序列：
SEQ ID NO:80-93；
与SEQ ID NO:80-93中之一基本上相同的核苷酸序列；
能够与SEQ ID NO:80-93中的至少一个特异性杂交的多核苷酸的互补物；和
能够与SEQ ID NO:80-93中的至少一个特异性杂交的多核苷酸的反向互补物。

39.  一种包含权利要求17的核酸的细胞。

40.  权利要求39的细胞，其中该细胞是植物细胞或酵母细胞。

41.  一种包含权利要求29的核酸的细胞。

42.  权利要求41的细胞，其中该细胞是植物细胞或酵母细胞。

43.  包含权利要求39的细胞的植物组织、植物部分、植物商业产品或全植物。

44.  包含权利要求41的细胞的植物组织、植物部分、植物商业产品或全植物。

45.  一种用于增加感兴趣的核苷酸序列在宿主细胞中的表达的方法，该方法包括：
向包含感兴趣的核苷酸序列的宿主细胞中导入权利要求17的核酸，其中所述感兴趣的核苷酸序列与特异性结合DNA结合多肽的第二核苷酸序列可操作地连接，
从而增加该感兴趣的核苷酸序列在该宿主细胞中的表达。

46.  根据权利要求45的方法，其中将核酸导入到宿主细胞中包括将含有该核酸的载体导入到宿主细胞中。

47.  根据权利要求45的方法，其中所述核酸稳定整合到所述宿主细胞的基因组中。

48.  根据权利要求45的方法，其中所述感兴趣的核苷酸序列是外源核苷酸序列。

49.  根据权利要求45的方法，其中所述感兴趣的核苷酸序列是内源核苷酸序列。

50.  根据权利要求45的方法，其中将核酸导入到宿主细胞中包括使包含该核酸的植物与包含宿主细胞的植物杂交。

51.  一种用于增加感兴趣的核苷酸序列在宿主细胞中的表达的方法，该方法包括：
向包含权利要求17的核酸的宿主细胞导入感兴趣的核苷酸序列，其中所述感兴趣的核苷酸序列与特异性结合DNA结合多肽的第二核苷酸序列可操作地连接，
从而增加该感兴趣的核苷酸序列在该宿主细胞内的表达。

52.  根据权利要求51的方法，其中将感兴趣的核苷酸序列导入到宿主细胞中包括将包含所述感兴趣的核苷酸序列的载体导入到所述宿主细胞中。

53.  根据权利要求51的方法，其中所述核酸稳定整合到所述宿主细胞的基因组中。

54.  根据权利要求51的方法，其中与所述第二核苷酸序列可操作地连接的所述感兴趣的核苷酸序列稳定整合到宿主细胞的基因组中。

55.  根据权利要求51的方法，其中将感兴趣的核苷酸序列导入到宿主细胞中包括使包含感兴趣的核苷酸序列的植物与含有宿主细胞的植物杂交。

56.  一种用于增加感兴趣的核苷酸序列在宿主细胞内的表达的方法，该方法包括：
将权利要求17的核酸导入到包含感兴趣的核苷酸序列的宿主细胞中，其中感兴趣的核苷酸序列与特异性结合DNA结合多肽的第二核苷酸序列可操作地连接，
从而增加该感兴趣的核苷酸序列在该宿主细胞中的表达。

57.  一种编码人造转录激活物融合蛋白的核酸，该核酸包括：
编码DNA结合多肽的第一多核苷酸序列；和
编码用于反式激活植物基因表达的手段的第二多核苷酸序列，
其中所述第一和第二多核苷酸序列从该核酸合框地表达为单一转录本。

58.  一种用于增加感兴趣的核苷酸序列在宿主细胞中的表达的方法，该方法包括：
将权利要求57的核酸导入到包含感兴趣的核苷酸序列的宿主细胞中，其中所述感兴趣的核苷酸序列与特异性结合DNA结合多肽的第二核苷酸序列可操作地连接，
从而增加该感兴趣的核苷酸序列在该宿主细胞中的表达。

59.  一种用于增加感兴趣的核苷酸序列在宿主细胞中的表达的方法，该方法包括：
向包含权利要求57的核酸的宿主细胞中导入感兴趣的核苷酸序列，其中所述感兴趣的核苷酸序列与特异性结合DNA结合多肽的第二核苷酸序列可操作地连接，
从而增加该感兴趣的核苷酸序列在该宿主细胞内的表达。

60.  一种核酸，其包含编码选自SEQ ID NO:121-127的反式激活结构域互作基序多肽的核苷酸序列。

61.  能够与权利要求60的核酸特异性杂交的核酸的互补物。

62.  能够与权利要求60的核酸特异性杂交的核酸的反向互补物。

63.  权利要求60的核酸，其中该反式激活结构域互作基序多肽选自：SEQ ID NO:22；SEQ ID NO:28；SEQ ID NO:34；SEQ ID NO:40；SEQ ID NO:46；SEQ ID NO:52；和SEQ ID NO:58。

64.  一种多肽，包括选自SEQ ID NO:121-127的反式激活结构域互作基序多肽。

65.  权利要求64的多肽，其中所述反式激活结构域互作基序多肽选自：SEQ ID NO:22；SEQ ID NO:28；SEQ ID NO:34；SEQ ID NO:40；SEQ ID NO:46；SEQ ID NO:52；和SEQ ID NO:58。

说明书

植物反式激活互作基序及其用途
优先权声明
本申请要求获得2012年2月2日提出的系列号为61/594,245、标题为“植物反式激活互作基序及其用途(Plant Transactivation Interaction Motifs and Uses Thereof)”美国临时专利申请的利益。
技术领域
本公开涉及植物技术。实施方案涉及多肽(例如融合蛋白)，其包含来自植物反式激活物的新的或人造的转录因子互作基序。一些实施方案涉及这样的蛋白用来表达感兴趣的核酸或增加感兴趣的核酸的表达的用途。一些实施方案涉及编码含有来自植物反式激活物的新的或合成的转录因子互作基序的蛋白的多核苷酸。具体的实例涉及含有本发明多肽或多核苷酸的宿主细胞、组织和/或生物体。
背景
将克隆和分离的基因导入到植物细胞中(遗传转化)并随后再生转基因植物被广泛地用于对植物和植物材料进行遗传修饰。对植物进行遗传转化以导入期望的性状(例如提高营养品质；增加产量；害虫或疾病抗性；胁迫耐受性；和除草剂抗性)，现在已经普遍用于产生可表达期望性状的新的或改良的转基因植物。通常将DNA随机导入到真核植物细胞的细胞核DNA或质体DNA中，然后分离含有整合到细胞DNA中的该DNA的细胞，并用该细胞产生稳定转化的植物细胞。通常，希望通过在单一植物品种中导入多个编码序列，这些编码序列可能含有相似(或相同)的调节元件，来对该植物品种加以遗传工程构建，使之表达多于一种导入性状。
转基因(内源基因也是如此)的表达由涉及多个蛋白质-DNA和蛋白质-蛋白质互作的机制控制。通过这些互作，核酸调节元件(例如启动子和增强子)能够赋予编码序列以组成型或特异性的表达模式。例如，启动子可以导致编码序列在特定组织中、在特定发育时期期间、或应答于环境刺激转录增加。不幸的是，用于转基因表达的常规启动子的固有属性限制了它们可以用于在宿主细胞中发挥表达控制作用的范围。常规的启动子的一个实际限制是难以精细地调节所引入基因的表达水平，原因是由于启动子强度的限制，以及由于启动子特别强或在相同细胞中同时使用同一启动子的多个拷贝，而导致转基因表达沉默。起始或增强内源或自身基因的表达也可能是理想的。
反式激活物是这样的蛋白质，它们藉由蛋白质-蛋白质相互作用招募许多不同的参与DNA转录的蛋白质(例如核小体重塑复合物(nucleosome-remodeling complexes)；中介复合物(mediator complex)；和通用转录因子，如TFIIB,TBP,和TFIIH)，通过影响核小体组装/拆卸、前起始复合物的形成、启动子清除、和/或延伸速度来发挥功能。反式激活物与其结合伙伴的蛋白质-蛋白质互作涉及反式激活物中称作“反式激活结构域(TADs)”的离散的内部结构元件。TAD被认为一级序列同源性(primary sequence homology)极小，并且只有在与靶物结合时才采取限定的结构。Sigler(1988)Nature 333:210-2。虽然TAD内的酸性和疏水性残基被认为是重要的(见例如Cress and Triezenberg(1991)Science 251(4989):87-90)，但是认为单个残基对活性的贡献不大。Hall and Struhl(2002)J.Biol.Chem.277:46043-50。
单纯疱疹病毒体蛋白质16(VP16)是一种反式激活物，其功能是刺激病毒立即早期基因在被HSV感染的细胞内的转录。与其他反式激活物一样，VP16通过一系列涉及其高度酸性TAD的蛋白质-蛋白质相互作用激活转录。VP16的酸性TAD已经显示与多种伙伴蛋白质在体外和体内相互作用。例如，VP16的TAD包含一个互作基序，其与TFIIH的Tfb1亚基直接相互作用(Langlois et al.(2008)J.Am.Chem.Soc.130:10596-604)，并且这种相互作用与VP16同时激活病毒立即早期基因的引发和延伸阶段的能力有关。
公开
本文描述了已经从植物反式激活物蛋白质中分离出的新型TAD蛋白质-蛋白质互作基序，和编码它们的核酸。这些新型互作基序可以用在人造的TAD中为包含该TAD的多肽提供基因调节性能。例如，一些实施方案包括一种转录激活物融合蛋白，其包含DNA结合结构域和这样的TAD多肽。依赖于转录激活物融合蛋白中与TAD融合的具体DNA结合结构域，反式激活可以用于提高感兴趣的基因的表达。例如，可以将与DNA结合结构域结合的异源多核苷酸和感兴趣的基因可操作地连接，从而使该融合蛋白(和其功能性TAD)导向，该融合蛋白(和其功能性TAD)的结合将会提高感兴趣的基因的表达。或者，可以工程构建DNA结合结构域使其结合与感兴趣的基因可操作地连接的、或与之最接近的内源多核苷酸。一旦转录激活物融合蛋白与靶DNA结合位点结合，可能刺激与靶DNA结合位点可操作地连接的基因的转录。
本文还介绍了人造的变体TAD蛋白质-蛋白质互作基序，和编码它们的核酸。在一些实例中，通过在反式激活物(例如植物反式激活物)的TAD中引入一个或多个突变(例如，保守突变，或者在互作基序的直系同源体中鉴定的突变)，对人造的变体TAD蛋白质-蛋白质互作基序进行工程构建。令人惊讶的是，以这种方式产生的包含变体互作基序的人造变体TAD在与转录激活物融合蛋白内的DNA结合结构域偶联时，可能提供与未经修饰的TAD不同的基因调节性能。例如，特定的包含变体互作基序的人造变体TAD当在包含DNA结合结构域的融合蛋白中的相同位置表达时，可能提高由天然存在的TAD互作基序赋予的转录激活水平。
一些实施方案包括人造的转录激活物融合蛋白。在具体的实施方案中，融合蛋白可以增加感兴趣的基因的转录，其中该融合蛋白包含含有DNA结合结构域的第一多肽，第一多肽与包含TAD互作基序的第二多肽可操作地连接。在一些实例中，TAD互作基序可以选自下列TAD互作基序：SEQ ID NO:10-16。例如但不限于，TAD互作基序可以包含在含有选自下组的氨基酸序列的TAD中：SEQ ID NO:2-8和SEQ ID NO:100-106。在一些实例中，TAD互作基序可以是变体TAD互作基序，其具有，例如但无限制，选自下组的氨基酸序列：SEQ ID NO:17-58。例如但不限于，这样的变体TAD互作基序可以包含在含有选自下组的氨基酸序列的TAD中：SEQ ID NO:107-120。
一些实施方案包括一种多核苷酸，其编码人造的转录激活物融合蛋白，该融合蛋白包含含有DNA结合结构域的第一多肽，第一多肽与包含TAD互作基序的第二多肽可操作地连接。DNA结合结构域多肽可以是任何特异性结合特定靶DNA结合位点的DNA结合结构域。例如但不限于，DNA结合结构域多肽可以是选自下组的多肽：锌指DNA结合结构域；UPA DNA结合结构域；GAL4；TAL；LexA；Tet阻遏物；LacR；和类固醇激素受体。在特定实例中，DNA结合结构域编码序列可以选自下组：SEQ ID NO:67；SEQ ID NO:68；和SEQ ID NO:99。在特定实例中，该多核苷酸可以包含DNA结合性蛋白质编码序列，其与选自SEQ ID NO:67、SEQ ID NO:68和SEQ ID NO:99的序列至少80％，85％，90％，95％，98％，或100％相同。
在一些实例中，所述多核苷酸可以包含TAD互作基序编码序列，其编码TAD互作基序或变体TAD互作基序，例如，具有选自下组的序列：SEQ ID NO:10-58。特定实施方案包括这样的多核苷酸，其编码转录激活物融合蛋白，该融合蛋白包含至少一个TAD互作基序。特定实施方案包括这样的多核苷酸，其编码含有至少一个DNA结合结构域的转录激活物融合蛋白。
编码根据本发明一些实施方案的人造转录激活物融合蛋白的多核苷酸的实例包括这样的多核苷酸，其含有至少一个编码DNA结合结构域的核苷酸序列，和至少一个编码TAD互作基序(或其变体)的核苷酸序列，其中该多核苷酸包括，例如但不限于，至少选自下组的核苷酸序列：SEQ ID NO:79-93；与SEQ ID NO:79-93其中之一基本上相同的核苷酸序列；与SEQ ID NO:79-93其中之一具有至少80％序列同一性的核苷酸序列；与SEQ ID NO:79-93其中之一具有至少85％序列同一性的核苷酸序列；与SEQ ID NO:79-93其中之一具有至少90％序列同一性的核苷酸序列；与SEQ ID NO:79-93其中之一具有至少95％序列同一性的核苷酸序列；与SEQ ID NO:79-93其中之一具有至少97％序列同一性的核苷酸序列；与SEQ ID NO:79-93其中之一具有至少98％序列同一性的核苷酸序列；与SEQ ID NO:79-93其中之一具有至少99％序列同一性的核苷酸序列；能够与SEQ ID NO:79-93中的至少一个特异性杂交的多核苷酸的互补物；和能够与SEQ ID NO:79-93中的至少一个特异性杂交的多核苷酸的反向互补物。
在一些实施方案中，编码转录激活引子融合蛋白的多核苷酸可以纳入重组载体中，目的是例如在宿主细胞中提供蛋白质的表达。因此，一些实例包括含有至少一个本发明多核苷酸的载体，和/或在其中已导入了这种载体的宿主细胞。
本文还描述了用于植物基因表达的反式激活的手段(means)。如本文所使用的，“用于植物基因表达的反式激活的手段”包括选自下组的多肽：SEQ ID NO:10；SEQ ID NO:11；SEQ ID NO:14；SEQ ID NO:15；SEQ ID NO:22；SEQ ID NO:28；SEQ ID NO:46；和SEQ ID NO:52。在一些实施方案中，含有至少一种用于反式激活植物基因表达的手段的人造蛋白质，可以用于调节植物细胞内的感兴趣的基因的表达。
此外，本文描述了来源于ERF2的用于增加基因表达的手段。如本文所使用的，“来源于ERF2的用于增加基因表达的手段”包括选自下组的多肽：SEQ ID NO:17-22和SEQ ID NO:121。另外还描述了来源于PTI4的用于提高基因表达的手段。如本文所使用的，“来源于PTI4的用于增加基因表达的手段”包括选自下组的多肽：SEQ ID NO:23-28和SEQ ID NO:122。另外还描述了来源于AtERF1的用于增加基因表达的手段。如本文所使用的，“来源于AtERF1的用于增加基因表达的手段”包括选自下组的多肽：SEQ ID NO:29-34和SEQ ID NO:123。另外还描述了来源于ORCA2的用于增加基因表达的手段。如本文所使用的，“来源于ORCA2的用于增加基因表达的手段”包括选自下组的多肽：SEQ ID NO:35-40和SEQ ID NO:124。另外还描述了来源于DREB1A的用于增加基因表达的手段。如本文所使用的，“来源于DREB1A的用于增加基因表达的手段”包括选自下组的多肽：SEQ ID NO:41-46和SEQ ID NO:125。另外还描述了来源于CBF1的用于增加基因表达的手段。如本文所使用的，“来源于CBF1的用于增加基因表达的手段”包括选自下组的多肽：SEQ ID NO:47-52和SEQ ID NO:126。另外还描述了来源于DOF1的用于增加基因表达的手段。如本文所使用的，“来源于DOF1的用于增加基因表达的手段”包括选自下组的多肽：SEQ ID NO:53-58和SEQ ID NO:127。
本文还描述了利用人造的转录激活物融合蛋白增加基因表达的方法。在实例中，可以将含有编码人造的转录激活物融合蛋白的多核苷酸的表达载体引入到宿主细胞(例如植物细胞、酵母细胞、哺乳动物细胞和永生细胞)中，该宿主细胞包含与该融合蛋白的靶DNA结合位点可操作地连接的感兴趣的基因。宿主细胞中融合蛋白的表达，和随后融合蛋白与可操作地连接的靶DNA结合位点的结合，可导致感兴趣的基因的转录起始或转录增加。在特定实例中，可以引入靶DNA结合位点到宿主细胞中，使得该靶DNA结合位点与感兴趣的基因可操作地连接。在进一步的实例中，人造的转录激活物融合蛋白可以包含DNA结合结构域多肽，该多肽被工程构建而与可操作地连接于感兴趣的基因的靶DNA结合位点结合。
在一些实施方案中，可以将包含编码人造转录激活物融合蛋白的多核苷酸的载体导入到宿主细胞中，从而使该多核苷酸随后整合到宿主细胞的基因组DNA中(例如，通过同源重组)。这样，人造的转录激活物融合蛋白，以及编码它的核酸，可以被包含在转基因生物体(例如，转基因植物)中。因此，本文还记载了这样的转基因生物体。在实例中，编码人造转录激活物融合蛋白的核酸可以在转基因生物体细胞的基因组中随机整合，或者整合在转基因生物体细胞的基因组中的预定位置。
进一步记载了使用人造转录激活物融合蛋白和/或编码它的核酸表达感兴趣的基因的方法。在一些实施方案中，可以将包含编码人造转录激活物融合蛋白的多核苷酸的载体引入到宿主细胞中，该宿主细胞包含与该融合蛋白的靶DNA结合位点可操作地连接的感兴趣的基因。在一些实例中，人造的转录激活物融合蛋白包含用于反式激活植物基因表达的手段。当载体被导入到宿主细胞内之后，感兴趣的基因的表达可以起始或增加，从而在宿主细胞中产生感兴趣的基因的表达产物，例如，其表达的量根据融合蛋白的调节控制。这样的表达产物可以根据本领域中已知的任何方法从宿主细胞分离和/或纯化。
从如下参照附图进行的对一些实施方案的详细说明，前述的特征和其它的特征将更加不言自明。
附图简述
图1包括一种已经被鉴定的VP16反式激活结构域(TAD)，亚结构域II(SEQ ID NO:9)的互作基序。星号指示VP16反式激活结构域，亚结构域II中被人提出与TFIIH的Tfb1亚单位直接接触的氨基酸，如Langlois et al.(2008)J.Am.Chem.Soc.130:10596-604所提出的。
图2包括VP16反式激活亚结构域II与已经鉴定的植物TAD的比对。
所列出的植物TAD含有一个互作基序。对齐的互作基序被突出显示。来自VP16的亚结构域II的互作基序中被提出与转录因子接触的残基用星号(*)标示。
图3包括了比对结果，显示了可以引入到ERF2的TAD互作基序中以产生变体ERF2互作基序的修饰。列出了天然ERF2和VP16互作基序的序列用于比较。直接接触被突出显示。
图4包括了比对结果，显示了可以被引入到PTI4的TAD互作基序中以产生变体PTI4互作基序的修饰。列出了天然PTI4和VP16互作基序的序列用于比较。直接接触被突出显示。
图5包括了比对结果，显示了可以被引入到AtERF1的TAD互作基序中以产生变体AtERF1互作基序的修饰。列出了天然AtERF1和VP16互作基序的序列用于比较。直接接触被突出显示。
图6包括了比对结果，显示了可以被引入到ORCA2的TAD互作基序中以产生变体ORCA2互作基序的修饰。列出了天然ORCA2和VP16互作基序的序列用于比较。直接接触被突出显示。
图7包括了比对结果，显示了可以被引入到DREB1A的TAD互作基序中以产生变体DREB1A互作基序的修饰。列出了天然DREB1A和VP16互作基序的序列用于比较。直接接触被突出显示。
图8包括了比对结果，显示了可以被引入到CBF1的TAD互作基序中以产生变体CBF1互作基序的修饰。列出了天然CBF1和VP16互作基序的序列用于比较。直接接触被突出显示。
图9包括了比对结果，显示了可以被引入到DOF1的TAD互作基序中以产生变体DOF1互作基序的修饰。列出了天然DOF1和VP16互作基序的序列用于比较。直接接触被突出显示。
图10包括一个酵母整合载体pHO-zBG-MEL1的图谱，其含有位于MEL1报告基因上游的HAS(高亲和性位点)ZFP结合位点。该载体被定向到酿酒酵母HO座位，并含有一个用于在酵母和细菌中选择的KanMX抗性基因。
图11包括了酵母中Mel1报告基因的表达水平的图示，其是由不同植物反式激活互作基序的激活所导致的。
图12包括质粒pDAB9897的图谱：拟南芥肌动蛋白-2启动子，含有8个串联锌指(Z6)结合位点，位于转录起始位点上游548-749个碱基对，驱动用于测试植物反式激活互作基序锌指融合蛋白的gus报告基因。双元载体也包含拟南芥泛素-10启动子，其驱动用于目标报告植物事件产生的pat选择标志物。
图13包括质粒pDAB107881的图谱。
图14包括质粒pDAB107882的图谱。
图15包括质粒pDAB107883的图谱。
图16包括质粒pDAB107884的图谱。
图17包括质粒pDAB107885的图谱。
图18包括质粒pDAB107886的图谱。
图19包括质粒pDAB107887的图谱。
图20包括质粒pDAB106272的图谱。
图21包括质粒pDAB106238的图谱。
图22包括质粒pDAB106273的图谱。
图23包括质粒pDAB106274的图谱。
图24包括质粒pDAB106275的图谱。
图25包括质粒pDAB106276的图谱。
图26包括质粒pDAB106277的图谱。
图27包括质粒pDAB106278的图谱。
图28包括质粒pDAB106279的图谱。
图29针对不同植物反式激活互作基序的处理，以内源基因表达水平标准化的gus转录水平的平均值和标准差(菱形)和四分位数(直线和框)的图示。将不同植物反式激活互作基序对gus报告基因的激活与空载体对照以及VP16蛋白质结构域II亚单位的激活进行比较。
图30包括质粒pGalGUS的图谱：6个串联Gal4结合位点与驱动gus报告基因的拟南芥肌动蛋白-2启动子融合，用于测试与Gal4结合蛋白质融合的植物反式激活因互作基序。双元载体还含有拟南芥泛素-10启动子，其驱动的pat选择标志物，用于目标报告植物事件的产生。
图31包括质粒pTALGUS的图谱：8个串联UPA-Box共有结合位点与驱动gus报告基因的拟南芥肌动蛋白-2启动子融合，用于测试与TAL结合蛋白质融合的植物反式激活因互作基序。双元载体还还有拟南芥泛素-10启动子，其驱动的pat选择标志物，用于目标报告植物事件的产生。
序列列表
在随附的序列表中列出的核酸序列用标准字母缩写的核苷酸碱基显示，如在37C.F.R.§1.822中定义的。每个核酸序列显示仅一条链，但是可以理解，通过任意参考所显示的链，互补链亦包含在其中。在随附的序列表中：
SEQ ID NO:1显示了含有互作基序(下划线)的VP16植物反式激活结构域：GMTHDPVSYGALDVDDFEFEQMFTDALGIDDFGG
SEQ ID NO:2显示了含有互作基序(下划线)的ERF2植物反式激活结构域：NDSEDMLVYGLLKDAFHFDTSSSDLSCLFDFPA
SEQ ID NO:3显示了含有互作基序(下划线)的PTI4植物反式激活结构域：CLTETWGDLPLKVDDSEDMVIYGLLKDALSVGWSPFSFTAG
SEQ ID NO:4显示了含有互作基序(下划线)的AtERF1植物反式激活结构域：CFTESWGDLPLKENDSEDMLVYGILNDAFHGG
SEQ ID NO:5显示了含有互作基序(下划线)的ORCA2植物反式激活结构域：FNENCEEIISPNYASEDLSDIILTDIFKDQDNYEDE
SEQ ID NO:6显示了含有互作基序(下划线)的DREB1A植物反式激活结构域：GFDMEETLVEAIYTAEQSENAFYMHDEAMFEMPSLLANMAEGM
SEQ ID NO:7显示了含有互作基序(下划线)的CBF1植物反式激活结构域：EQSEGAFYMDEETMFGMPTLLDNMAEG
SEQ ID NO:8显示了含有互作基序(下划线)的DOF1植物反式激活结构域：SAGKAVLDDEDSFVWPAASFDMGACWAGAGFAD
SEQ ID NO:9显示了VP16反式激活结构域的亚结构域II，其是SEQ ID NO:1中的互作基序：DDFEFEQMFTD
SEQ ID NO:10显示了ERF2植物反式激活结构域互作基序：DAFHFDTSSSD
SEQ ID NO:11显示了PTI4植物反式激活结构域互作基序：DDSEDMVIYGLLKD
SEQ ID NO:12显示了AtERF1植物反式激活结构域互作基序：ENDSEDMLV
SEQ ID NO:13显示了ORCA2植物反式激活结构域互作基序：EDLSDIILTD
SEQ ID NO:14显示了DREB1A植物反式激活结构域互作基序：ENAFYMHDEAMFEMP
SEQ ID NO:15显示了CBF1植物反式激活结构域互作基序：DEETMFGMP
SEQ ID NO:16显示了DOF1植物反式激活结构域互作基序：EDSFVWPAASFD
SEQ ID NO:17-22显示了变体ERF2植物反式激活结构域互作基序序列。
SEQ ID NO:23-28显示了变体PTI4植物反式激活结构域互作基序序列。
SEQ ID NO:29-34显示了变体AtERF1植物反式激活结构域互作基序序列。
SEQ ID NO:35-40显示了变体ORCA2植物反式激活结构域互作基序序列。
SEQ ID NO:41-46显示了变体DREB1A植物反式激活结构域互作基序序列。
SEQ ID NO:47-52显示了变体CBF1植物反式激活结构域互作基序序列。
SEQ ID NO:53-58显示了变体DOF1植物反式激活结构域互作基序序列。
SEQ ID NO:59-66显示了用于构建质粒pHO-zBG-MEL1的引物。
SEQ ID NO:67显示了Z6DNA结合结构域多核苷酸序列：TGTGGTGGGAGAGGAGGGTGG
SEQ ID NO:68显示了Z6DNA结合结构域的8x串联重复序列：GGTGTGGTGGGAGAGGAGGGTGGGAGTGTGGTGGGAGAGGAGGGTGGCTCTGTGGTGGGAGAGGAGGGTGGAGATGTGGTGGGAGAGGAGGGTGGTCTTGTGGTGGGAGAGGAGGGTGGGGATGTGGTGGGAGAGGAGGGTGGCCTTGTGGTGGGAGAGGAGGGTGGAGGTGTGGTGGGAGAGGAGGGTGGCTTAAGCCGC
SEQ ID NO:69-74显示了在pat和pal HP测定中使用的引物和探针。
SEQ ID NO:75-78显示了用于烟草中PTU的PCR分析的引物。
SEQ ID NO:79显示了编码与Z6锌指结合蛋白融合的、来自VP16的天然植物反式激活结构域互作基序的人造核苷酸序列：GGCATGACCCATGATCCTGTGTCTTATGGAGCCTTGGATGTTGATGACTTTGAGTTTGAGCAGATGTTCACAGATGCACTGGGCATCGATGACTTTGGTGGA
SEQ ID NO:80显示了编码与Z6锌指结合蛋白融合的、来自ERF2的天然植物反式激活结构域互作基序的人造核苷酸序列(v3)：AATGACTCTGAGGACATGCTGGTGTATGGTTTGCTCAAGGATGCCTTTCACTTTGACACCTCCAGCTCAGACCTCTCCTGCCTCTTTGACTTCCCAGCC
SEQ ID NO:81显示了编码与Z6锌指结合蛋白融合的、来自PTI4的天然植物反式激活结构域互作基序的人造核苷酸序列(v3)： TGCCTGACAGAAACTTGGGGAGACTTGCCTCTCAAGGTTGATGACTCTGAGGACATGGTGATCTATGGTCTGTTGAAGGATGCACTCTCAGTGGGGTGGTCCCCATTCTCTTTCACGGCTGGT
SEQ ID NO:82显示了编码与Z6锌指结合蛋白融合的、来自AtERF1的天然植物反式激活结构域互作基序的人造核苷酸序列(v3)：TGCTTCACGGAATCCTGGGGAGACCTTCCTTTGAAGGAGAATGACTCTGAGGACATGTTGGTGTACGGAATCCTCAATGATGCTTTTCATGGTGGC
SEQ ID NO:83显示了编码与Z6锌指结合蛋白融合的、来自ORCA2的天然植物反式激活结构域互作基序的人造核苷酸序列(v3)：TTCAATGAGAATTGTGAAGAAATCATCTCTCCAAACTACGCATCAGAGGACTTGTCTGACATCATCTTGACGGACATCTTCAAGGACCAAGACAACTATGAGGATGAG
SEQ ID NO:84显示了编码与Z6锌指结合蛋白融合的、来自DREB1A的天然植物反式激活结构域互作基序的人造核苷酸序列(v3)：GGCTTTGACATGGAAGAAACATTGGTGGAGGCCATCTACACTGCTGAACAGAGCGAGAATGCCTTCTACATGCATGATGAGGCAATGTTTGAGATGCCATCTCTTCTGGCCAACATGGCTGAGGGAATG
SEQ ID NO:85显示了编码与Z6锌指结合蛋白融合的、来自CBF1的天然植物反式激活结构域互作基序的人造核苷酸序列(v3)：GAACAGTCAGAAGGTGCTTTCTACATGGATGAAGAGACCATGTTTGGGATGCCAACCCTTCTGGATAACATGGCAGAGGGA
SEQ ID NO:86显示了编码与Z6锌指结合蛋白融合的、来自DOF1的天然植物反式激活结构域互作基序的人造核苷酸序列(v3)：TCAGCTGGGAAGGCAGTCTTGGATGATGAGGACAGCTTTGTTTGGCCTGCTGCATCCTTTGACATGGGTGCCTGCTGGGCTGGAGCTGGCTTTGCTGAC
SEQ ID NO:87显示了编码与Z6锌指结合蛋白融合的、来自ERF2的示例变体植物反式激活结构域互作基序的人造核苷酸序列(v2)：AATGACTCTGAGGACATGCTGGTGTATGGTTTGCTCAAGGATGATTTCCACTTTGAGACAATGTTCTCAGACCTGTCCTGCCTCTTTGACTTCCCAGCC
SEQ ID NO:88显示了编码与Z6锌指结合蛋白融合的、来自PTI4的示例变体植物反式激活结构域互作基序的人造核苷酸序列(v2)：TGCCTGACAGAAACTTGGGGAGACTTGCCTCTCAAGGTTGATGACTTTGAGTTTGAGATGATGTTCACAGATGCACTCTCAGTGGGGTGGTCCCCATTCTCTTTCACGGCTGGT
SEQ ID NO:89显示了编码与Z6锌指结合蛋白融合的、来自AtERF1的示例变体植物反式激活结构域互作基序的人造核苷酸序列(v2)：TGCTTCACGGAATCCTGGGGAGACCTTCCTTTGAAGGAGAATGACTTTGAGTTTGAAATGTTCACAGATTACGGAATCCTCAATGATGCTTTTCATGGTGGC
SEQ ID NO:90显示了编码与Z6锌指结合蛋白融合的、来自ORCA2的示例变体植物反式激活结构域互作基序的人造核苷酸序列(v2)：TTCAATGAGAATTGTGAAGAAATCATCTCTCCAAACTACGCATCAGAGGACTTTGATCTTGAGATGTTGACGGACATCTTCAAGGACCAAGACAACTATGAGGATGAG
SEQ ID NO:91显示了编码与Z6锌指结合蛋白融合的、来自DREB1A的示例变体植物反式激活结构域互作基序的人造核苷酸序列(v2)：GGCTTTGACATGGAAGAAACATTGGTGGAGGCCATCTACACTGCTGAACAGAGCGAGGACTTTGAGTTTGAAGCAATGTTCATGGATTCTCTTCTGGCCAACATGGCTGAGGGAATG
SEQ ID NO:92显示了编码与Z6锌指结合蛋白融合的、来自CBF1的示例变体植物反式激活结构域互作基序的人造核苷酸序列(v2)：GAACAGTCAGAAGGTGCTTTCTACATGGATGACTTTGAGTTCGAGACAATGTTCATGGACACCCTTCTGGATAACATGGCAGAGGGA
SEQ ID NO:93显示了编码与Z6锌指结合蛋白融合的、来自DOF1的示例变体植物反式激活结构域互作基序的人造核苷酸序列(v2)：TCAGCTGGGAAGGCAGTCTTGGATGATGAGGACTTTGAGTTTGAAGCCATGTTCACGGACATGGGTGCCTGCTGGGCTGGAGCTGGCTTTGCTGAC
SEQ ID NO:94-98显示了在gus和BYEEF HP测定中使用的引物和探针。
SEQ ID NO:99显示了取自AVRBS3-可诱导基因的共有结合序列的串联重复序列，并称为UPA DNA结合结构域：TATATAAACCTNNCCCTCT
SEQ ID NO:100显示了包含ERF2植物反式激活结构域互作基序(下划线)的示例人造反式激活结构域：GMTHDPVSYGALDVDAFHFDTSSSDALGIDDFGG
SEQ ID NO:101显示了包含PTI4植物反式激活结构域互作基序(下划线)的示例人造反式激活结构域：GMTHDPVSYGALDVDDSEDMVIYGLLKDALGIDDFGG
SEQ ID NO:102显示了包含AtERF1植物反式激活结构域互作基序(下划线)的示例人造反式激活结构域：GMTHDPVSYGALDVENDSEDMLVALGIDDFGG
SEQ ID NO:103显示了包含ORCA2植物反式激活结构域互作基序(下划线)的示例人造反式激活结构域：GMTHDPVSYGALDVEDLSDIILTDALGIDDFGG
SEQ ID NO:104显示了包含DREB1A植物反式激活结构域互作基序(下划线)的示例人造反式激活结构域：GMTHDPVSYGALDVENAFYMHDEAMFEMPALGIDDFGG
SEQ ID NO:105显示了包含CBF1植物反式激活结构域互作基序(下划线)的示例人造反式激活结构域：GMTHDPVSYGALDVDEETMFGMPALGIDDFGG
SEQ ID NO:106显示了包含DOF1植物反式激活结构域互作基序(下划线)的示例人造反式激活结构域：GMTHDPVSYGALDVEDSFVWPAASFDALGIDDFGG
SEQ ID NO:107显示了包含变体ERF2植物反式激活结构域互作基序(下划线)的示例人造反式激活结构域：GMTHDPVSYGALDVDDFHFETMFSDALGIDDFGG
SEQ ID NO:108显示了包含变体ERF2植物反式激活结构域互作基序(下划线)的另一个示例人造反式激活结构域：NDSEDMLVYGLLKDDFHFETMFSDLSCLFDFPA
SEQ ID NO:109显示了包含变体PTI4植物反式激活结构域互作基序(下划线)的示例人造反式激活结构域：GMTHDPVSYGALDVDDFEFEMMFTDALGIDDFGG
SEQ ID NO:110显示了包含变体PTI4植物反式激活结构域互作基序(下划线)的另一个示例人造反式激活结构域：CLTETWGDLPLKVDDFEFEMMFTDALSVGWSPFSFTAG
SEQ ID NO:111显示了包含变体AtERF1植物反式激活结构域互作基序(下划线)的示例人造反式激活结构域：GMTHDPVSYGALDVENDFEFEMFTDALGIDDFGG
SEQ ID NO:112显示了包含变体AtERF1植物反式激活结构域互作基序(下划线)的另一个示例人造反式激活结构域：CFTESWGDLPLKENDFEFEMFTDYGILNDAFHGG
SEQ ID NO:113显示了包含变体ORCA2植物反式激活结构域互作基序(下划线)的示例人造反式激活结构域：GMTHDPVSYGALDVEDFDLEMLTDALGIDDFGG
SEQ ID NO:114显示了包含变体ORCA2植物反式激活结构域互作基序(下划线)的另一个示例人造反式激活结构域：FNENCEEIISPNYASEDFDLEMLTDIFKDQDNYEDE
SEQ ID NO:115显示了包含变体DREB1A植物反式激活结构域互作基序(下划线)的示例人造反式激活结构域：GMTHDPVSYGALDVEDFEFEAMFMDALGIDDFGG
SEQ ID NO:116显示了包含变体DREB1A植物反式激活结构域互作基序(下划线)的另一个示例人造反式激活结构域：GFDMEETLVEAIYTAEQSEDFEFEAMFMDSLLANMAEGM
SEQ ID NO:117显示了包含变体CBF1植物反式激活结构域互作基序(下划线)的示例人造反式激活结构域：GMTHDPVSYGALDVDDFEFETMFMDALGIDDFGG
SEQ ID NO:118显示了包含变体CBF1植物反式激活结构域互作基序(下划线)的另一个示例人造反式激活结构域：EQSEGAFYMDDFEFETMFMDTLLDNMAEG
SEQ ID NO:119显示了包含变体DOF1植物反式激活结构域互作基序(下划线)的示例人造反式激活结构域：GMTHDPVSYGALDVEDFEFEAMFTDALGIDDFGG
SEQ ID NO:120显示了包含变体DOF1植物反式激活结构域互作基序(下划线)的另一个示例人造反式激活结构域： SAGKAVLDDEDFEFEAMFTDMGACWAGAGFAD
SEQ ID NO:121-127显示了变体植物反式激活结构域互作基序序列。
实施本发明的模式
I.多个实施方案的概览
本文公开了新型植物反式激活结构域(TAD)、TAD互作基序、和可以用作转录激活物、和前述者的人造变体，此类变体可以用作转录激活物，且可以与DNA结合多肽融合在人造转录激活物融合蛋白中用于感兴趣的基因的转录激活。本文公开的特定新型植物TAD和TAD互作基序已经从下述植物蛋白质中得以分离：ERF2；PTI4；AtERF1；ORCA2；DREB1A；CBF1；和DOF1。包含如这里所述新型植物TAD和/或TAD互作基序的人造转录激活物融合蛋白在具体的实施方案中可以用于增加(例如，引发)几乎任何基因在多种多样的细胞(例如酵母细胞和植物细胞)中的基因表达。
反式激活结构域在功能上是自主的；即当与许多不同异源DNA结合结构域中的一种融合，以及当固定在启动子区域的不同位置时，单个TAD即能够调节转录。Hall and Struhl(2002)，同上文。TAD被认为共享很少的一级序列同源性，并且只有在与靶物结合时才采取确定的结构。Sigler(1988)，同上文。尽管TAD中的酸性和疏水性残基被认为是重要的(见例如Cress and Triezenberg(1991)，同上文)，但是单个残基对活性的贡献被认为是很小的。Hall and Struhl(2002)，同上文。
难以事先预测某一人造的反式激活结构域互作基序是否会在植物细胞内发挥功能从而引发或提高表达。这种不可预测性至少部分地是如下事实的结果：某些TAD是非常强的反式激活物，依赖于其在细胞内的浓度和其TAD的强度可能导致“压制(squelching)”(例如通过滴定(titrating)细胞转录机构的组分)。见例如美国专利6,271,341(具有降低的基因调节的突变体VP16TAD(mutant VP16TADs with graded gene regulation))。
本文公开了如下的意外发现，即某些与VP16TAD具有序列同源性的新型植物TAD和TAD互作基序可以赋予受其控制的基因以非常不同水平的调节。在使用一种“交换”TAD的可推广策略产生人造的转录激活物融合蛋白的情况下，令人惊讶地发现，从PTI4,DREB1A,ERF2,和CBF1分离的新型TAD和TAD互作基序在植物细胞中能够提供的基因转录水平增加比VP16——本领域中公认的一种极好的反式激活物——所提供的更大。还发现，来自AtERF1,ORCA2,和DOF1的新型TAD和TAD互作基序提供更小的基因转录水平增加。
本文还公开了如下的意外发现，即与天然序列相比含有非常少和次要的氨基酸变化的变体TAD和TAD互作基序可进一步提高或调整天然TAD所展示的基因调节性质。例如，令人惊讶的发现，变体ERF2和CBF1TAD互作基序与植物中相应的天然互作基序相比，可导致受其控制的基因发生显著更大的转录。
II.缩写
chs    查尔酮合酶基因
HAS    高亲和性位点
HP     水解探针
HSV    单纯疱疹病毒
MS     Murashige和Skoog
PNPG   对硝基苯基-α-D-吡喃葡萄糖苷
PTU    植物转录单元
SSC    柠檬酸钠盐
TAD    反式激活结构域
TBP    TATA-结合蛋白质
T-DNA  转运DNA
TFIIB  转录因子IIB
TFIIH  转录因子IIH
Ti     肿瘤诱导性(来自根癌土壤杆菌的质粒)
UAS   上游激活序列
VP16   单纯疱疹病毒蛋白质16
III.术语
为了便于审阅本公开的各种实施方案，下面提供了特定术语的解释：
内源的：如本文所使用的，术语“内源的”是指源自于特定生物体、组织或细胞的物质(例如，核酸分子和多肽)。例如，植物细胞内表达的“内源”多肽可以指这样的多肽，其通常在来自相同物种的非遗传工程化植物的相同类型的细胞内表达。类似地，包含在植物细胞内的“内源”核酸可以指这样的核酸(例如基因组DNA)，其通常在来自相同物种的非遗传工程化植物的相同类型的细胞内被发现。
表达：如本文所使用的，编码序列(例如基因或转基因)的“表达”是指核酸转录单元(包括例如基因组DNA或cDNA)的编码信息转变成细胞的运作性(operational)、非运作性或结构性部分的过程，往往包括蛋白质的合成。基因表达可能受到外部信号(例如，细胞、组织或生物体暴露于可以增加或降低基因表达的作用剂)的影响。基因的表达还可以在从DNA到RNA到蛋白的通路中的任何地方被调节。基因表达的调节可以通过例如下述方式发生：对转录、翻译、RNA转运和加工、中间分子如mRNA的降解等的控制，或者通过在特定蛋白分子产生后使其活化、失活、区室化(compartmentalization)或降解，或者通过前述的任何组合。基因表达可以通过本领域已知的方法在RNA水平或蛋白水平进行测量，这些方法包括但不限于Northern印迹、RT-PCR、Western印迹，和体外、原位或体内蛋白活性测定。
增加表达：如本文所使用的，术语“增加表达”是指表达的起始，以及在数量上增加从模板构建体产生的表达产物的量。在一些实施方案中，包含TAD的多肽可用于“增加”来自核酸的表达。在这些实施方案中，表达的增加可以通过与对照中产生的表达产物的量(例如，来自没有该包含植物反式激活结构域的蛋白质的构建体)进行比较来加以确定。
融合蛋白：如本文所使用的，术语“融合蛋白”是指包含至少两个可操作地连接的多肽的分子。在某些实施方案中，两个可操作地连接的多肽可能在通常情况下作为不同基因产物的一部分表达(例如在不同生物体中表达)。在进一步的实例中，该至少两个可操作地连接的多肽可以来源于通常被表达为不同基因产物的一部分的多肽。在本文所述的融合蛋白中存在的可操作地连接的多肽通常与表达该融合蛋白的细胞内的至少一个靶蛋白质或核酸互作。例如，可操作地连接的多肽可以和细胞转录机构的一个或多个转录因子或蛋白质元件互作，或者可以与特定的多核苷酸或核酸的结构元件互作。
异源的：如本文所使用的，术语“异源的”是指并非源自于特定生物体、组织或细胞的内部的物质(例如核酸分子和多肽)。例如，在植物细胞内表达的“异源”多肽可以指通常不在来自相同物种的非遗传工程化植物的相同类型细胞中表达的多肽(例如，在相同生物体的不同细胞中，或者在不同生物体的细胞中表达的多肽)。
分离的：如本文所使用的，术语“分离的”生物组分(例如，核酸分子或多肽)已与天然存在该组分的生物体细胞内通常与该组分伴随的其它生物组分(例如其它染色体和染色体外DNA和RNA，以及蛋白质)，同时在该组分中产生化学上或功能上的改变(例如可以通过打断核酸与染色体中其余DNA连接的化学键来从染色体分离核酸)。已经被“分离”的核酸分子和蛋白质可包括通过通用纯化方法纯化的核酸分子和蛋白质。该术语涵盖通过在宿主细胞中重组表达产生的核酸和蛋白质，以及化学合成的核酸分子、蛋白质、和肽。
核酸分子：如本文所使用的，术语“核酸分子”可以指聚合物形式的核苷酸，其可以同时包括RNA、cDNA、基因组DNA、和合成形式的上述混合聚合物的有义和反义链。核苷酸可以指核糖核苷酸、脱氧核糖核苷酸，或两者任一类型核苷酸的修饰形式。如本文所使用的，“核酸分子”与“核酸”和“多核苷酸”同义。除非另有说明，核酸分子的长度通常为至少10个碱基。该术语包括单链和双链形式的DNA。核酸分子可包括天然存在的和/或经过修饰的核苷酸，其中核苷酸通过天然存在的和/或非天然存在的核苷酸连接键连接在一起。
“外源”分子是指如下的分子，就多核苷酸的核苷酸序列和/或基因组定位以及在多肽的氨基酸序列和/或细胞定位而言，它不是特定系统(例如种质、品种、优良品种和/或植物)所固有的。在实施方案中，外源或异源的多核苷酸或多肽可以是如下的分子，其已经被人为地提供给生物系统(例如，植物细胞、植物基因、特定的植物物种或品种、和/或植物染色体)，并且不是该特定生物系统固有的。因此，将核酸指定为“外源的”，可能表明该核酸来源于其天然存在的来源之外的来源，或者可能表明该核酸具有非天然的构型、基因定位、或元件布置。
相反，例如，“天然”或“内源”核酸是指如下的核酸(例如，基因)，其除了包含在该核酸在自然界中通常被发现的染色体或其它遗传材料上存在的那些核酸元件之外，不含有其它的核酸元件。内源的基因转录本是由天然染色体座位处的核苷酸序列编码的，并且不是被人为提供到细胞内的。
核酸分子可以被化学或生物化学修饰，或者可以含有非天然的或衍生化的核苷酸碱基，如本领域技术人员所容易理解的。这些修饰包括，例如，标签、甲基化、用类似物取代一个或多个天然存在的核苷酸、核苷酸间修饰(例如，不带电的连接键：例如，甲基膦酸酯、磷酸三酯、氨基磷酸酯、氨基甲酸酯等；带电荷的连接键：例如，硫代磷酸酯、二硫代磷酸酯等；侧基部分：例如，肽；嵌入剂：例如，吖啶、补骨脂素等；螯合剂；烷化剂；和经过修饰的连接键：例如，α异头核酸等)。术语“核酸分子”也包括任何拓扑构象，包括单链、双链、部分双联体化(duplexed)、三联体化(triplexed)、发夹针(hairpinned)、圆形、和挂锁构象。
一些实施方案使用特定形式的核酸——寡核苷酸。寡核苷酸是相对短的核酸分子，通常包含50个或更少的核碱基(虽然一些寡核苷酸可包含多于50个)。寡核苷酸可通过切割一个较长的包含该寡核苷酸序列的核酸(例如限制性消化)来形成，或者可以被化学合成，以序列特异性的方式从个别的核苷亚磷酰胺形成。
寡核苷酸可以用作探针序列，用于检测包含特定核苷酸序列的核酸分子。根据前述，寡核苷酸可以合成制备或通过克隆加以制备。合适的克隆载体是本领域技术人员已知的。寡核苷酸探针可以是被标记或无标记的。现有多种多样的技术用于标记核酸分子，包括例如但不限于，切口平移(nick translation)进行放射性标记；随机引发；和用末端脱氧核苷酸转移酶加尾(tailing)，其中所用的核苷酸用例如放射性³²P标记。可以使用的其它标记物包括，例如但不限于：荧光团；酶；酶底物；酶的辅助因子；和酶抑制剂。或者，自身提供可检测信号、或与其它反应活性试剂一起提供可检测信号的标记物的使用，可以用与受体结合的配体所替代，其中该受体被标记(例如，用上面指出的标记物)，从而可自身提供可检测的信号或者与其它试剂一起提供可检测的信号。见例如，Leary et al.(1983)Proc.Natl.Acad.Sci.USA80:4045-9。
本发明的一些实施方案包括一种多核苷酸，其与核苷酸靶序列“能够特异性杂交”或“特异性互补”。术语“能够特异性杂交”和“特异性互补”是指具有足够程度的互补性，从而在多核苷酸与包含该特定核苷酸靶序列的核酸分子之间发生稳定而特异的结合。核酸分子能够特异性杂交不需要与靶序列100％互补。当存在足够程度的互补性从而在期望的特异结合条件下，例如在严格杂交条件下，避免核酸分子与非靶序列的非特异性结合时，核酸分子能够特异性杂交。
产生特定程度的严格性的杂交条件会随着所选杂交方法的性质和杂交核酸序列的组成和长度的不同而改变。一般地，杂交温度和杂交缓冲液的离子强度(尤其是Na+和/或Mg++浓度)将决定杂交的严格性，虽然清洗时间也会影响严格性。关于为获得特定程度严格性所需的杂交条件的计算是本领域普通技术人员众所周知的，并且在例如Sambrook等人(编辑)，分子克隆：实验室手册(Molecular Cloning:A Laboratory Manual),2nd Ed.,vol.1-3,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,1989,chapters 9and 11；和Hames和Higgins(编辑)Nucleic Acid Hybridization,IRL Press,Oxford,1985中有讨论。有关核酸杂交的更详细的说明和指导可以参见，例如，《Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes》，第一部分，第2章，Elsevier,NY,1993中的Tijssen,“Overview of principles of hybridization and the strategy of nucleic acid probe assays”一文，以及Ausubel等编辑,Current Protocols in Molecular Biology,第2章,Greene Publishing and Wiley-Interscience,NY,1995。
如本文所使用的，“严格条件”包括在其中只有当杂交分子与DNA靶标之间的错配小于25％时才发生杂交的条件。“严格条件”包括进一步特定水平的严格性。因此，如本文所使用的，“温和(moderate)严格”条件是指在其中序列错配超过25％的分子将会不杂交的条件；“中等(medium)严格”条件是指在其中序列错配超过15％的分子将会不杂交的条件；和“高严格”条件是指在其中序列错配超过10％的分子将会不杂交的条件。“极高严格”条件是指在其中序列错配超过6％的分子将会不杂交的条件。
在特定实施方案中，严格条件是在PerfectHyb^TMplus杂交缓冲液中(Sigma-Aldrich)在65℃杂交1小时，随后用65℃的0.1X SSC/0.1％SDS继续清洗40分钟的条件。
可操作地连接的核苷酸序列：当第一核苷酸序列与第二核苷酸序列处于功能上的关系中时，则该第一核苷酸序列与或者和该第二核苷酸序列“可操作地连接”。例如，如果启动子影响编码序列的转录或表达，则启动子与该编码序列可操作地连接。当重组地产生时，可操作地连接的多个核苷酸序列通常是连续的，并且需要将两个蛋白质编码区连接时，在同一个阅读框内。然而，可操作地连接的核苷酸序列不一定是连续的。
术语“可操作地连接的”，在指示用于基因调节序列和编码序列时，其意思是调节序列可影响所连接的编码序列的表达。“调节序列”或“控制元件”是指影响转录的时机和水平/量，RNA加工或稳定性，或相关编码序列的翻译。常规的调节序列可以包括5'非翻译区；启动子；翻译前导序列；内含子；增强子；茎环结构；阻遏物结合序列；终止序列；多聚腺苷酸化识别序列；等。具体的调节序列可位于与之可操作地连接的编码序列的上游和/或下游。此外，与编码序列可操作地连接的特定调控序列可位于双链核酸分子的相关互补链上。可以和编码序列“可操作地连接的”元件不限于启动子或其它常规的调节序列。例如，在一些实施方案中，反式激活蛋白质的DNA结合结构域可以和位于启动子或其它调节区域最邻近的核苷酸序列结合，使得该反式激活蛋白质可能与该启动子或其它调控区域、或与之结合的分子(例如转录因子)互作，从而影响转录。在这些实例中，通过其DNA结合结构域与反式激活蛋白质可操作地连接的核苷酸序列是“可操作地连接”于与受启动子或其它调节序列控制的编码序列的。
可操作地连接的多肽：如本文关于多肽所使用的，术语“可操作地连接的”是指被连接在单个分子(例如融合蛋白)中的至少两个多肽，它们的连接方式使得每个多肽发挥其预期的功能。典型地，该至少两个多肽通过肽键共价连接。包含可操作地连接的多肽的融合蛋白可以通过标准的重组DNA技术来生产。例如，可以将编码第一多肽的DNA分子和编码第二多肽的另一个DNA分子连接，并且可以在宿主细胞中表达所得的杂交DNA分子，产生包含第一和第二多肽的融合蛋白。在特定实例中，两个DNA分子可以沿着5'至3'方向彼此连接，从而在连接后，所编码的多肽的翻译框不会改变(即，DNA分子彼此对框连接)。
启动子：如本文所使用的，术语“启动子”是指一种DNA区域，其可以位于转录起点的上游，并参与RNA聚合酶和其它影响转录的蛋白质的识别和结合。启动子可以和用于在细胞内表达的编码序列可操作地连接，或者启动子可以和编码信号序列的核苷酸序列可操作地连接，其中该信号序列和用于在细胞内表达的编码序列可操作地连接。“植物启动子”可以是能够起始植物细胞中的转录的启动子。
处于发育控制之下的启动子的实例包括：优先在某些组织中启动转录的的启动子，例如但不限于，叶、根、种子、纤维、木质部导管、管胞或厚壁组织。这些启动子被称为“组织优选的”。仅在某些组织中启动转录的启动子被称为“组织特异的”。“细胞类型特异的”启动子主要影响一个或多个器官中的特定细胞类型中的转录，例如但不限于，根或叶的导管细胞。示例性组织特异的或组织优选的启动子包括，但不限于：根优选的启动子，例如来自菜豆蛋白质基因的启动子；叶特异性的和光诱导的启动子，例如来自cab或核酮糖-1,5-二磷酸羧化酶/加氧酶的启动子；花药特异性启动子，例如来自LAT52的启动子；花粉特异的启动子，例如来自Zm13的启动子；和小孢子优选的启动子，例如如来自apg的启动子。
“可诱导的”启动子可以是受环境控制的启动子。见Ward et al.(1993)Plant Mol.Biol.22:361-366。可能通过可诱导的启动子触发转录的环境条件的实例包括，例如但不限于，缺氧条件和光的存在。利用可诱导的启动子，转录速度响应诱导剂而提高。可诱导的启动子的实例包括，但不限于：来自ACEI系统并对铜响应的启动子；来自玉米并对苯磺酰胺除草剂安全剂响应的In2基因；来自Tn10的Tet阻遏物；和来自类固醇激素基因的可诱导启动子，其转录活性可以被糖皮质激素诱导(Schena et al.(1991)Proc.Natl.Acad.Sci.USA 88:0421)。
组织特异的、组织优选的、细胞类型特异的、和可诱导的启动子构成了“非组成型”启动子类型。“组成型”启动子是可以在大多数环境条件下有活性的启动子。示例的组成型启动子包括，但不限于：来自植物病毒的启动子，如来自CaMV的启动35S启动子；来自水稻肌动蛋白基因的启动子；泛素启动子；pPEMU；MAS；玉米H3组蛋白启动子；和ALS启动子，欧洲油菜ALS3结构基因5'端的Xba1/NcoI片段(或与所述Xba1/NcoI片段相似的核苷酸序列)(国际PCT公开No.WO 96/30530)。
任何前述组成型和非组成型启动子均可用在本发明的一些实施方案中。例如，可以提供(例如在宿主细胞内)要受到人造转录激活物融合蛋白的活性调节的基因，其中该基因与启动子可操作地连接。
序列同一性：术语“序列同一性”或“同一性”，如本文在两个核酸或多肽序列的内容中所使用的，可以指当在特定比较窗口上以对应性最大的方式对准时，两个序列中相同的残基。
如本文所使用的，术语“百分比序列同一性”可以指通过比较两个在比较窗口上最佳对齐的序列(例如，核酸序列和氨基酸序列)确定的数值，其中为了实现两个序列的最佳对齐，比较窗口中的序列部分与参考序列(其不含添加或缺失)相比可以包括添加或缺失(例如缺口)。百分比的计算是通过确定在两个序列中均出现的相同核苷酸或氨基酸的位置的数目，从而产生匹配位置数，并用匹配位置数除以比较窗中的位置总数，并将结果乘以100，得到百分比序列同一性。
用于比对所比较序列的方法是本领域众所周知的。在例如下列文献中描述了各种程序和比对算法：Smith and Waterman(1981)Adv.Appl.Math.2:482；Needleman and Wunsch(1970)J.Mol.Biol.48:443；Pearson and Lipman(1988)Proc.Natl.Acad.Sci.U.S.A.85:2444；Higgins and Sharp(1988)Gene 73:237-44；Higgins and Sharp(1989)CABIOS 5:151-3；Corpet et al.(1988)Nucleic Acids Res.16:10881-90；Huang et al.(1992)Comp.Appl.Biosci.8:155-65；Pearson et al.(1994)Methods Mol.Biol.24:307-31；Tatiana et al.(1999)FEMS Microbiol.Lett.174:247-50。在例如Altschul et al.(1990)J.Mol.Biol.215:403-10中可以找到一种序列对齐方法和同一性计算的详细论述。
美国国家生物技术信息中心(National Center for Biotechnology Information)(NCBI)基础本地比对搜索工具(Basic Local Alignment Search Tool)(BLAST^TM；Altschul等(1990))可从几个来源获得，包括美国国家生物技术信息中心(Bethesda,MD)和在因特网上，与几个序列分析程序联合使用。关于如何使用该程序来测定序列同一性的描述可在因特网上BLAST^TM的“帮助”部分获得。对于核酸序列的比较，可使用缺省参数来采用BLAST^TM(Blastn)程序的“Blast 2sequences”函数。在通过此方法评估时，与参照序列具有越大的相似性的核酸序列将显示越高的序列同一性。
如本文关于核苷酸序列所使用的，术语“基本上相同的”可以指具有超过85％相同的序列。例如，基本上相同的核苷酸序列可以与参考序列至少85.5％；至少86％；至少87％；至少88％；至少89％；至少90％；至少91％；至少92％；至少93％；至少94％；至少95％；至少96％；至少97％；至少98％；至少99％；或至少99.5％相同。
保守取代：如本文所使用的，术语“保守取代”是指氨基酸残基被相同类型的另一氨基酸代替的取代。非保守氨基酸取代是指不属于相同类型的残基的取代，例如碱性氨基酸取代中性或非极性氨基酸。为实施保守取代目的而被定义的氨基酸类型是本领域已知的。
在一些实施方案中，保守取代包括用第一个脂肪族氨基酸代替第二个不同的脂肪族氨基酸。例如，如果第一氨基酸是下述者中之一：Gly；Ala；Pro； Ile；Leu；Val；和Met，则第一氨基酸可以用选自Gly；Ala；Pro；Ile；Leu；Val；和Met的不同的第二氨基酸代替。在特定实例中，如果第一氨基酸是Gly；Ala；Pro；Ile；Leu；和Val中之一，则第一氨基酸用选自Gly；Ala；Pro；Ile；Leu；和Val的不同的第二氨基酸代替。在涉及疏水性脂肪族氨基酸取代的特定实例中，如果第一氨基酸是Ala；Pro；Ile；Leu；和Val中之一，则第一氨基酸可以用选自Ala；Pro；Ile；Leu；和Val的不同的第二氨基酸代替。
在一些实施方案中，保守取代包括用第一芳香族氨基酸取代第二个不同的芳香族氨基酸。例如，如果第一氨基酸是His；Phe；Trp；和Tyr其中之一，则第一氨基酸可以用从His；Phe；Trp；和Tyr中选出的不同的第二氨基酸代替。在涉及不带电芳香族氨基酸取代的特定实例中，如果第一氨基酸是Phe；Trp；和Tyr其中之一，则第一氨基酸可以用从Phe；Trp；和Tyr中选出的不同的第二氨基酸代替。
在一些实施方案中，保守取代包括用第一疏水性氨基酸取代第二个不同的疏水性氨基酸。例如，如果第一氨基酸是Ala；Val；Ile；Leu；Met；Phe；Tyr；和Trp其中之一，则第一氨基酸可以用从Ala；Val；Ile；Leu；Met；Phe；Tyr；和Trp中选出的不同的第二氨基酸代替。在涉及非芳香族疏水氨基酸取代的特定实例中，如果第一氨基酸是Ala；Val；Ile；Leu；和Met其中之一，则第一氨基酸可以用从Ala；Val；Ile；Leu；和Met中选出的不同的第二氨基酸代替。
在一些实施方案中，保守取代包括用第一极性氨基酸取代第二个不同的极性氨基酸。例如，如果第一氨基酸是Ser；Thr；Asn；Gln；Cys；Gly；Pro；Arg；His；Lys；Asp；和Glu其中之一，则第一氨基酸可以用从Ser；Thr；Asn；Gln；Cys；Gly；Pro；Arg；His；Lys；Asp；和Glu中选出的不同的第二氨基酸代替。在涉及不带电极性氨基酸取代的特定实例中，如果第一氨基酸是Ser；Thr；Asn；Gln；Cys；Gly；和Pro其中之一，则第一氨基酸可以用从Ser；Thr；Asn；Gln；Cys；Gly；和Pro中选出的不同的第二氨基酸代替。在涉及带电极性氨基酸取代的特定实例中，如果第一氨基酸是His；Arg；Lys；Asp；和Glu其中之一，则第一氨基酸可以用从His；Arg；Lys；Asp；和Glu中选出的不同的第二氨基酸代替。在进一步的涉及带电极性氨基酸取代的特定实例中，如果第一氨基酸是Arg；Lys；Asp；和Glu其中之一，则第一氨基酸可以用从Arg；Lys；Asp；和Glu中选出的不同的第二氨基酸代替。在涉及带正电(碱性)极性氨基酸取代的特定实例中，如果第一氨基酸是His；Arg和Lys其中之一，则第一氨基酸可以用从His；Arg和Lys中选出的不同的第二氨基酸代替。在进一步的涉及带正电极性氨基酸取代的特定实例中，如果第一氨基酸是Arg或Lys，则第一氨基酸可以Arg和Lys中的另一个氨基酸代替。在涉及带负电(酸性)极性氨基酸取代的特定实例中，如果第一氨基酸是Asp或Glu，则第一氨基酸可以被Asp和Glu中的另一个氨基酸代替。在涉及除带正电极性氨基酸之外的极性氨基酸取代的特定实例中，如果第一氨基酸是Ser；Thr；Asn；Gln；Cys；Gly；Pro；Asp；和Glu其中之一，则第一氨基酸可以用从Ser；Thr；Asn；Gln；Cys；Gly；Pro；Asp；和Glu中选出的不同的第二氨基酸代替。在涉及除带负电极性氨基酸之外的极性氨基酸取代的特定实例中，如果第一氨基酸是Ser；Thr；Asn；Gln；Cys；Gly；Pro；Arg；His；和Lys其中之一，则第一氨基酸可以用从Ser；Thr；Asn；Gln；Cys；Gly；Pro；Arg；His；和Lys中选出的不同的第二氨基酸代替。
在一些实施方案中，保守取代包括用第一电中性氨基酸取代第二个不同的电中性氨基酸。例如，如果第一氨基酸是Gly；Ser；Thr；Cys；Asn；Gln；和Tyr其中之一，则第一氨基酸可以用从Gly；Ser；Thr；Cys；Asn；Gln；和Tyr中选出的不同的第二氨基酸代替。
在一些实施方案中，保守取代包括用第一非极性氨基酸取代第二个不同的非极性氨基酸。例如，如果第一氨基酸是Ala；Val；Leu；Ile；Phe；Trp；Pro；和Met其中之一，则第一氨基酸可以用从Ala；Val；Leu；Ile；Phe；Trp；Pro；和Met中选出的不同的第二氨基酸代替。
在许多实例中，可以选择用于在保守取代中代替第一氨基酸的特定第二氨基酸，使得前述的类型中第一氨基酸和第二氨基酸同时归属的类型数最大。因此，如果第一氨基酸是Ser(一种极性、非芳香族、并且电中性的氨基酸)，则第二氨基酸可以是另一种极性氨基酸(即，Thr；Asn；Gln；Cys；Gly；Pro；Arg；His；Lys；Asp；或Glu)；另一种非芳香族氨基酸(即，Thr；Asn；Gln；Cys；Gly；Pro；Arg；His；Lys；Asp；Glu；Ala；Ile；Leu；Val；或Met)；或另一种电中性氨基酸(即，Gly；Thr；Cys；Asn；Gln；或Tyr)。然而，优选地，在这种情况下，第二氨基酸是Thr；Asn；Gln；Cys；和Gly其中之一，因为这些氨基酸根据极性、非芳香族和电中性的分类全都相同。其他可任选用于选择在保守取代中使用的特定第二氨基酸的标准在本领域是已知的。例如，当在保守取代中可以使用Thr；Asn；Gln；Cys；和Gly取代Ser时，Cys可以从选择中剔除，以避免形成不良的交联和/或二硫键。类似地，Gly可以从选择中剔除，因为它缺少烷基侧链。在这种情况下，为了例如保持侧链羟基的功能性，可以选择Thr。然而，可以在保守取代中使用的特定第二氨基酸的选择最终取决于技术人员的自由裁量。
如本文关于氨基酸序列使用的，术语“衍生物”是指本发明融合蛋白的化学修饰。
反式激活蛋白质：如本文所使用的，术语“反式激活蛋白质”(或“反式激活物”或“反式激活物蛋白质”或“转录激活物融合蛋白”)是指一种多肽，其与核酸元件结合，并起始或提高与该核酸元件可操作地连接的多核苷酸(例如，感兴趣的基因)的转录。对特定生物体而言为天然的反式激活蛋白质包括，例如但不限于，锌指DNA结合蛋白质；UPA DNA结合结构域；GAL4；和TAL。本发明的特定实施方案包括含有至少一个来自DNA结合蛋白质的DNA结合结构域和一个来自植物反式激活结构域的互作基序的人造融合蛋白反式激活物。
特异性结合：如本文关于多肽和蛋白质结构域所使用的，术语“特异性结合”是指，多肽或蛋白质结构域与其结合伙伴(例如含有特定氨基酸序列的多肽，或含有特定核苷酸序列的核酸)之间足够强的互作，从而与结合伙伴形成稳定并且特异的结合，但与缺少被该特异性结合多肽识别的特定氨基酸序列或特定核苷酸序列的其它分子不会产生稳定而特异的结合。稳定而特异的结合可以通过本领域的常规技术进行评估；例如“拉下(pulldown)”测定(例如，GST拉下)、酵母双杂交测定、酵母三杂交测定、ELISA等。彼此具有“特异性结合”性质的分子可以被称为彼此“特异性结合”。
转化：如本文所使用的，术语“转化”是指将一个或多个核酸分子转移到细胞内。当被转移到细胞内的核酸分子被细胞稳定复制时(无论是通过该核酸分子整合到细胞基因组中，还是通过附加体型复制)，则称细胞被转移到细胞内的核酸分子“转化”。如本文所使用的，术语“转化”包括所有可以将核酸分子引入到这种细胞内的技术。实例包括但不限于：用病毒载体转染；用脂质体载体转化；电穿孔(Fromm et al.(1986)Nature 319:791-3)；脂质转染 (Felgner et al.(1987)Proc.Natl.Acad.Sci.USA 84:7413-7)；显微注射(Mueller et al.(1978)Cell 15:579-85)；土壤杆菌介导的转移(Fraley et al.(1983)Proc.Natl.Acad.Sci.USA 80:4803-7)；DNA直接摄取；和微粒轰击(Klein et al.(1987)Nature 327:70)。
转基因：一种外源核酸序列。在一些实例中，转基因可以是编码包含至少一个人造转录激活物融合蛋白的多肽的序列。在一些实例中，转基因可以编码包含至少一个植物TAD和/或至少一个变体TAD的人造转录激活物融合蛋白。在一些实例中，转基因可以编码感兴趣的基因(例如，报告基因；赋予除草剂抗性的基因；对农艺学上重要的植物性状有贡献的基因)。在这些和其它的实例中，转基因可以含有一个或多个与转基因的编码序列可操作地连接的调节序列(例如启动子)。为本公开的目的，术语“转基因”在用于指示生物体(例如植物)时，是指包含外源核酸序列的生物体。在一些实例中，包含外源核酸序列的生物体可以是其中通过分子转化技术引入了所述核酸分子的生物体。在其它实施例中，包含外源核酸序列的生物体可以是其中通过，例如，基因渗入或植物异花授粉被引入了所述核酸序列的生物体。
载体：如本文所使用的，术语“载体”是指可以被引入到细胞内(例如为了产生转化细胞)的核酸分子。载体可以包括允许它在宿主细胞中复制的核酸序列，例如复制起点。载体的实例包括，但不限于：携带外源DNA进入细胞的质粒；粘粒；噬菌体；和病毒。载体还可以包括一个或多个基因、反义分子、和/或选择标志物基因，以及其它本领域已知的遗传元件。载体可以转导、转化或感染细胞，借此导致细胞表达由该载体编码的核酸分子和/或蛋白质。载体任选地包括可帮助核酸分子进入细胞的材料(例如脂质体、蛋白质衣壳等)。
除非特别说明或暗示，如本文所用的，术语“一”，“一个”和“所述”意味着“至少一个”。
除非另有具体说明，否则本文所用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常理解的相同的含义。分子生物学中常见术语的定义可见，例如Lewin B.,Genes V,Oxford University Press,1994(ISBN0-19-854287-9)；Kendrew et al.(eds.),The Encyclopedia of Molecular Biology,Blackwell Science Ltd.,1994(ISBN 0-632-02182-9)；和Meyers R.A.(编辑),Molecular Biology and Biotechnology:A Comprehensive Desk Reference,VCH Publishers,Inc.,1995(ISBN 1-56081-569-8)。
IV.来自植物反式激活结构域的互作基序
本公开提供了新型植物TAD和来自它的蛋白质-蛋白质互作基序，以及编码它们的核酸。在一些实施方案中，利用从植物蛋白质ERF2(拟南芥)；PTI4(马铃薯)；AtERF1(拟南芥)；ORCA2(长春花)；DREB1A(拟南芥)；CBF1(拟南芥)；和DOF1(玉米)鉴定和分离的TAD来鉴定植物TAD互作基序，这些基序在某些实施方案中可以被“交换”到异源TAD中，或用于产生变体TAD互作基序。这些新鉴定的植物TAD、其中的互作基序、和其变体TAD可以在特定的实施方案中(例如，通过包含在人造的转录激活物蛋白质中)对感兴趣的基因赋予新的并且理想的表达调节控制。
VP16的TAD(V16TAD)已经被表征，通过类比VP16TAD中的相应结构来指称前述的新型植物TAD和互作结构域的结构区域。VP16TAD可以分成两个亚结构域，每个亚结构域当与DNA结合结构域绑定(tether)时，都能够独立地并且自主地激活转录。VP16亚结构域有时被称为氨基亚结构域(或“VP16反式激活亚结构域I”或“VP16_412-456”)和羧基亚结构域(或“VP16反式激活亚结构域II”或“VP16_456-490”)。VP16通过其互作结构域与多个参与转录的靶蛋白质互作，这些蛋白质包括转录因子IIB(TFIIB)的p62/Tfb1亚基。
VP16的活性不仅依赖于TAD内的酸性残基，还依赖于疏水和芳香族氨基酸。见例如，Cress and Triezenberg(1991)Science 251(4989):87-90。然而，酸性VP16TAD可能比许多其它多肽序列更耐受诱变，因为在酸性TAD中缺少常规的二级结构。Sigler(1988)Nature 333:210-2。VP16TAD亚结构域的非结构化性质可能有助于TAD介导与不同结合伙伴的多种蛋白质/蛋白质互作(Dyson and Wright(2002)Curr.Opin.Struct.Biol.12(1):54-60)，并且当它们与靶蛋白质结合而不是游离在溶液中时，TAD亚结构域可采取更有序的结构(例如，短α-螺旋(Langlois et al.(2008)，同上)。见例如Garza et al.(2009)Life Sci.84(7-8):189-93；Jonker et al.(2005)Biochemistry 44(3):827-39；Langlois et al.(2008)，同上。
一些实施方案包括含有植物TAD互作基序的人造转录激活物蛋白质，其中植物TAD互作基序选自下组：SEQ ID NO:10-16。一些示例的人造转录激活物蛋白质包含含有植物TAD互作基序的TAD，并且这些蛋白质可以具有包括但不限于如下的序列：SEQ ID NO:2-8和SEQ ID NO:100-106。此外，包含植物TAD互作基序的示例TAD包括用SEQ ID NO:10-16其中之一代替天然反式激活物TAD中含有的天然TAD互作基序序列而工程构建的TAD。
本发明的一些实施方案利用了一个令人惊奇的发现，即变体TAD互作基序，包括保守氨基酸取代和/或用在同源互作基序中的类似位置处发现的氨基酸的取代(例如来自包含参考TAD互作基序的天然蛋白质的直向同源物)，可以产生新型并且具体的基因调控性质。这些具体的性能对于表达多核苷酸，其中期望特定水平的表达，可能是理想的。例如，相比于自身可提高表达的天然参考TAD基序，变体TAD互作基序可以提供更高的表达，因此在蛋白质合成和纯化反应中——这些情况下最大化的表达往往是目标——可能是理想的。在其它期望获得比最大表达更少的表达的实例中，变体TAD互作基序可以提供比天然参考TAD基序更少的表达。
因此，一些实施方案包括含有变体TAD互作基序的人造转录激活物蛋白质。在一些实例中，变体TAD互作基序可以是SEQ ID NO:10-16其中之一的变体。变体TAD互作基序包括这样的多肽，其具有天然TAD互作序列的氨基酸序列，但是其中该序列中的一个或多个氨基酸已被改变为在不同的同源TAD的相应位置处发现的氨基酸。变体TAD互作基序还包括这样的多肽，其具有天然TAD互作序列的氨基酸序列，但是其中该序列中的一个或多个氨基酸已经发生了保守取代。变体TAD互作基序与参考TAD互作基序序列(例如选自SEQ ID NO:10-16的序列)可以例如但不限于，至少95％相同；与参考序列至少90％相同；与参考序列至少85％相同；与参考序列至少80％相同；与参考序列至少75％相同；与参考序列至少70％相同；与参考序列至少65％相同；与参考序列至少60％相同；与参考序列至少55％相同；与参考序列至少50％相同；或与参考序列少于50％相同。
变体TAD互作基序包括，例如但不限于，SEQ ID NO:17-22(示例变体ERF2TAD互作基序)；SEQ ID NO:23-28(示例变体PTI4TAD互作基序)；SEQ ID NO:29-34(示例变体AtERF1TAD互作基序)；SEQ ID NO:35-40(示例变体ORCA2TAD互作基序)；SEQ ID NO:41-46(示例变体DREB1A TAD互作基序)；SEQ ID NO:47-52(示例变体CBF1TAD互作基序)；和SEQ ID NO:53-58(示例变体DOF1TAD互作基序)。含有变体TAD互作基序的示例 TAD包括通过用选自SEQ ID NO:17-58的变体TAD代替天然反式激活物TAD中含有的TAD互作基序序列而工程化的那些TAD。例如，含有变体TAD互作基序的示例TAD包括SEQ ID NO:107-120。
编码任一个或全部前述多肽的核酸可以从多肽的氨基酸序列直接鉴定。例如，TAD或TAD互作基序可以由天然多核苷酸编码，多核苷酸被转录产生mRNA，mRNA随后翻译成TAD或TAD互作基序的氨基酸。然而，本领域技术人员会意识到，由于遗传密码的简并性，存在许多其他等同的多核苷酸，这些等同的多核苷酸将编码相同的多肽。变体TAD互作基序(例如，SEQ ID NO:17-58)可以由这样的多核苷酸编码：可以通过参考来自期望特定变体的氨基酸序列的RNA密码子表而容易地确定的多核苷酸。在具体的实施方案中，可能期望编码TAD互作基序(或其变体)的多核苷酸的核苷酸序列根据宿主细胞的密码子用法进行组装，以便例如，最大化或最优化包含该TAD互作基序的蛋白质(例如融合蛋白)的表达。
V.融合蛋白转录活性
本公开还提供了包含植物TAD互作基序和/或变体TAD互作基序的人造转录激活物融合蛋白。在一些实施方案中，人造的转录激活物融合蛋白还包含至少一个DNA结合结构域。还提供了编码这些人造转录激活物融合蛋白的核酸(例如DNA)
在一些实施方案中，人造的转录激活物融合蛋白至少包含以序列特异性的方式结合DNA的第一多肽(即“DNA结合结构域”)。人造转录激活物融合蛋白的第一DNA结合结构域多肽可以至少与含有植物TAD互作基序或变体TAD互作基序的第二多肽可操作地连接。在一些实例中，人造的转录激活物融合蛋白可以包含额外的多肽，例如位于融合蛋白中的第一和第二多肽之间的间隔序列；前导肽；将融合蛋白导向到细胞器(例如细胞核)的肽；被细胞酶切割的多肽；肽标签；和其它不会干扰可操作地连接的第一和第二多肽的功能的氨基酸序列。
在一些实施方案中，人造转录激活物融合蛋白的第一和第二多肽可以通过如下方式可操作地连接：从编码彼此合框连接的该第一和第二多肽的单个多核苷酸表达该第一和第二多肽，从而产生编码融合蛋白的嵌合基因。编码含有DNA结合结构域和TAD互作基序的转录激活物融合蛋白的多核苷酸的实例包括，但不限于，SEQ ID NO：79-93。在备选的实施方案中，人造转录激活物融合蛋白的第一和第二多肽可以通过其它手段可操作地连接，例如通过独立表达的第一和第二多肽的交联(cross-linkage)。
可以包含在人造转录激活物融合蛋白中的植物TAD互作基序和变体TAD互作基序包括在上文部分IV中描述的那些TAD互作基序和其变体。例如，人造的转录激活物融合蛋白可以包含选自下组的多肽：SEQ ID NO:10-58。
可以包含在人造转录激活物融合蛋白内的DNA结合结构域包括来自锌指蛋白的锌指DNA结合结构域(例如，Z6DNA结合结构域)。单个锌指DNA结合结构域可以被设计成靶向并结合到多种多样的DNA位点。参见，例如，Wu et al.(2007)Cell.Mol.Life Sci.64:2933-44。典型的(canonical)Cys₂His₂，以及非典型的Cys₃His锌指蛋白，通过在双螺旋的大沟中插入α-螺旋而与DNA结合。锌指结构域对DNA的识别是模块性的；每个指头(finger)主要与靶标中的连续三个碱基对接触，而蛋白质中的少数关键残基介导识别。通过在人造转录激活物融合蛋白中纳入多个锌指DNA-结合结构域，可以进一步增加融合蛋白的DNA结合特异性(因此也可以增加由其提供的任何基因调节效应的特异性)。见例如Urnov et al.(2005)Nature 435:646-51。因此，可以工程构建并使用一个或多个锌指DNA-结合结构域，使得被引入到宿主细胞内的人造转录激活物融合蛋白与宿主细胞基因组内的独特DNA序列互作。
在一些实例中，人造的转录激活物融合蛋白包含来自GAL4的DNA结合结构域，GAL4是酿酒酵母中的一种模块性反式激活物，但是其也在许多其它生物体中发挥反式激活物的作用。见例如Sadowski et al.(1988)Nature335:563-4。在这个调节系统中，编码酿酒酵母中半乳糖代谢途径酶的基因的表达受到可用碳源的严格调节。Johnston(1987)Microbiol.Rev.51:458-76。这些代谢酶的转录控制是由正调节蛋白质GAL4与GAL4特异性结合的一个17bp对称DNA序列(在UAS)之间的互作介导的。
天然的GAL4由881个氨基酸残基构成，分子量为99kDa。GAL4包括多个功能自主的结构域，这些结构域的活性组合是GAL4的体内活性的缘由。Ma&Ptashne(1987)Cell 48:847-53)；Brent&Ptashne(1985)Cell 43(3Pt2):729-36。GAL4的N-末端65个氨基酸构成了GAL4DNA-结合结构域。Keegan et al.(1986)Science 231:699-704；Johnston(1987)Nature 328:353-5。序列特异性结合要求存在被DNA结合结构域中存在6个Cys残基配位(coordinate)的二价阳离子。被配位的含阳离子的结构域通过与DNA螺旋的大沟直接接触而识别17bp UAS每个末端的保守CCG三联体(triplet)并与之互作。Marmorstein et al.(1992)Nature 356:408-14。蛋白质的DNA结合功能将C-末端转录激活结构域定位在启动子的附近，使这些激活结构域能够指导转录。
可以包含在人造转录激活物融合蛋白内的其他DNA结合结构域包括，例如但不限于，来自AVRBS3可诱导基因的结合序列；来自AVRBS3可诱导基因的共有结合序列，或从其工程化的人造结合序列(例如，UPA DNA结合结构域；SEQ ID NO:89)；TAL；LexA(参见，例如，Brent&Ptashne(1985)同上)；LacR(见例如，Labow et al.(1990)Mol.Cell.Biol.10:3343-56；Baim et al.(1991)Proc.Natl.Acad.Sci.USA 88(12):5072-6)；类固醇激素受体(Ellliston et al.(1990)J.Biol.Chem.265:11517-121)；Tet阻遏物(美国专利6,271,341)和突变的Tet阻遏物，其在四环素(Tc)的存在下与tet操纵子序列结合，但在没有四环素时则不结合；以及Wang et al.(1994)Proc.Natl.Acad.Sci.USA91(17):8180-4所述的调节系统组分，其利用一种GAL4、激素受体和VP16的融合物。
在一些实例中，人造的转录激活物融合蛋白包含多于一个TAD互作基序。例如但不限于，人造的转录激活物融合蛋白可以包含2，3，4或更多个TAD互作结构域。在一些实例中，人造的转录激活物融合蛋白包含多于一个DNA结合结构域。例如但不限于，人造的转录激活物融合蛋白可以包含2，3，4，5，6，7，8，9，10，或更多个DNA结合结构域。
VI.包含编码融合蛋白转录激活物的多核苷酸的核酸分子
在一些实施方案中，本公开提供了一种核酸分子，其包含编码植物TAD互作基序、变体TAD互作基序、植物TAD或变体TAD的至少一个多核苷酸序列。这样的核酸分子可以进一步包含至少一个编码DNA结合结构域的多核苷酸序列。例如，在一些实施方案中，核酸包含编码植物TAD互作基序、变体TAD互作基序、植物TAD或变体TAD的第一多核苷酸序列，其与编码DNA结合结构域的第二多核苷酸序列合框融合，从而使这两个多核苷酸序列作为单个融合蛋白的一部分被转录。
在本发明一些实施方案中提供的核酸分子中，编码植物TAD互作基序、变体TAD互作基序、植物TAD或变体TAD的第一多核苷酸序列的最后一个密码子，与编码DNA结合结构域的第二多核苷酸序列的第一个密码子，可以被任意数目的核苷酸三联体所分隔，例如不编码内含子或“终止”(“STOP”)。类似地，编码DNA结合结构域的第一多核苷酸序列的最后一个密码子和编码植物TAD互作基序、变体TAD互作基序、植物TAD或变体TAD的第二多核苷酸序列的第一个密码子可以被任意数目的核苷酸三联体所分隔。在这些和更进一步的实施方案中，编码植物TAD互作基序、变体TAD互作基序、植物TAD或变体TAD的第一多核苷酸序列和编码DNA结合结构域的第二多核苷酸序列中的最后一个(即，核酸序列的最3’端的)密码子，可以进一步和与之直接邻接或与之间隔不超过一个短肽序列的其他多核苷酸编码序列的第一个密码子相位对准(phase-register)地融合，所述其他多核苷酸编码序列例如是由人造的核苷酸接头编码的(例如，可能已经用于实现融合的核苷酸接头)。这些其他多核苷酸序列的实例包括，例如但不限于，标签、标签肽、和酶切割位点。类似地，第一和第二多核苷酸序列中的最5’端(在核酸序列中)的第一个密码子，可以和与之直接临界或与之间隔不超过一个短肽序列的其他多核苷酸编码序列的最后一个密码子相位对准地(phase-register)融合。
将编码植物TAD互作基序、变体TAD互作基序、植物TAD或变体TAD的多核苷酸的序列与编码DNA结合结构域的多核苷酸序列分隔开的序列可以由，例如，任何序列构成，从而使所编码的氨基酸序列不会显著影响融合蛋白的翻译。由于本文公开的TAD互作基序(和其变体)和已知DNA结合结构域的自主性质，居间序列在实例中不会干扰这些结构的各自功能。
本发明的一些实施方案还包括含有编码植物TAD互作基序、变体TAD互作基序、植物TAD或变体TAD的多核苷酸序列的核酸分子，其中该核酸分子不包含编码DNA结合域的多核苷酸序列。此类核酸分子可用于，例如，在分子生物学技术中帮助对TAD互作基序编码序列的操作。例如，在一些实施方案中，TAD互作基序编码序列可以引入到合适的载体中，以便将该序列亚克隆到表达载体中，或者可以将TAD互作基序编码序列引入到这样的核酸分子中，该核酸分子帮助产生其他的含有与感兴趣的核苷酸序列可操作地连接的TAD互作基序编码序列的核酸分子。
可以本领域技术人员能够立刻识别所有编码，例如，含有至少一个特定植物TAD互作基序、变体TAD互作基序、植物TAD或变体TAD、并进一步含有至少一个特定DNA结合结构域的融合蛋白的核苷酸序列。遗传密码的简并性为一个特定氨基酸序列提供了数目有限的编码序列。编码根据本发明实施方案的融合蛋白的特定序列的选择在从业者的自由裁量范围内。在不同应用中可能期望不同的编码序列。
在一些实施方案中，可能期望对编码植物TAD互作基序、变体TAD互作基序、植物TAD或变体TAD的核苷酸序列的核苷酸(和/或DNA结合结构域编码序列的核苷酸)进行修饰，以便例如提高该多核苷酸序列在特定宿主中的表达。遗传密码是冗余的，具有64个可能的密码子，但是大多数生物体优先使用这些密码子中的一个子集。在某一物种中最经常使用的密码子被称为最优密码子，而那些不经常使用的被归类为稀有或低使用率密码子。Zhang et al.(1991)Gene 105:61-72。可以对密码子进行替换以反映特定宿主的优先密码子使用率，这个过程有时被称作“密码子优化”。可以制备含有原核或真核宿主优选的密码子的优化密码子序列，以便，例如，增加翻译速度或者产生具有期望性质(例如，与从非优化序列产生的转录本相比具有更长的半衰期)的重组RNA转录本。
VII.融合蛋白转录激活物的表达
在一些实施方案中，可以将至少一个编码融合蛋白的核酸分子引入到细胞、组织或生物体中以便在其中表达融合蛋白，所述核酸分子包含至少一个编码植物TAD互作基序(或变体TAD互作基序、植物TAD或变体TAD)和至少一个编码DNA结合结构域的多核苷酸序列。
在一些实施方案中，这样的核酸分子可以是，例如，载体系统，其包括，例如但不限于，线性质粒和闭合环状质粒。在具体的实例中，该载体可以是表达载体。根据特定实施方案的核酸序列可以，例如，被插入到载体中，使该核酸序列可操作地连接于一个或多个调节序列。许多载体可用于该目的，并且特定载体的选择可以取决于，例如，待插入到载体内的核酸的大小，待用载体转化的特定宿主细胞，和/或期望被表达的融合蛋白的量。载体通常含有多种组分，这些组分的身份依赖于载体的功能(例如，DNA扩增和DNA表达)以及与载体相容的特定宿主细胞。
某些实施方案可以包括植物转化载体，其包含这样的核苷酸序列，该核苷酸序列包含至少一个调节序列，所述调节序列与一个或多个编码融合蛋白的核苷酸序列可操作地连接，所述融合蛋白含有与至少一个DNA结合结构域可操作地连接的至少一个植物TAD互作基序、变体TAD互作基序、植物TAD或变体TAD。所述一个或多个核苷酸序列可以在该调节序列的控制下在植物细胞、组织或生物体中表达，从而产生该融合蛋白。
在一些实施方案中，与一个或多个编码融合蛋白的核苷酸序列(所述融合蛋白含有与至少一个DNA结合结构域可操作地连接的至少一个植物TAD互作基序、变体TAD互作基序、植物TAD或变体TAD)可操作地连接的调节序列可以是启动子序列，其可以在要在其中扩增该核酸分子的宿主细胞，例如细菌细胞，或者在要在其中表达该核酸分子的植物细胞中发挥功能。
适用于根据一些实施方案的核酸分子的启动子包括诱导型、病毒、人造、或组成型启动子，所有这些都是本领域中众所周知的。可用于本发明实施方案的启动子的非限制性实例在下列文献中提供：美国专利Nos.6437217(玉米RS81启动子)；5,641,876(水稻肌动蛋白启动子)；6,426,446(玉米RS324启动)；6,429,362(玉米PR-1启动子)；6,232,526(玉米A3启动)；6,177,611(组成型玉米启动子)；5,322,938,5,352,605,5,359,142和5,530,196(35S启动子)；6,433,252(玉米L3的油质蛋白质启动子)；6,429,357(水稻肌动蛋白2启动子和稻肌动蛋白内含子2)；6,294,714(光诱导型启动子)；6,140,078(盐诱导型启动子)；6,252,138(病原体诱导型启动子)；6,175,060(磷缺乏诱导的启动子)；6,388,170(双向启动子)；6,635,806(γ-coixin启动子)；和美国专利申请序列No.09/757,089(玉米叶绿体醛缩酶启动子)。
其它示例性启动子包括，胭脂碱合成酶(NOS)启动子(Ebert et al.(1987)Proc.Natl.Acad.Sci.USA 84(16):5745-9)；章鱼碱合成酶(OCS)启动子(其被携带于根瘤土壤杆菌的肿瘤诱导型质粒上)；花椰菜花叶病毒启动子，例如花椰菜花叶病毒(CaMV)19S启动子(Lawton et al.(1987)Plant Mol.Biol.9:315-24)；CaMV 35S启动子(Odell et al.(1985)Nature 313:810-2)；玄参花叶病毒35S启动子(Walker et al.(1987)Proc.Natl.Acad.Sci.USA 84(19):6624-8)，蔗糖合成酶启动子(Yang and Russell(1990)Proc.Natl.Acad.Sci.USA87:4144-8)；R基因复合体启动子(Chandler et al.(1989)Plant Cell 1:1175-83)；叶绿素a/b结合蛋白质基因启动子；CaMV35S(美国专利Nos.5,322,938, 5,352,605,5,359,142,和5,530,196)；FMV35S(美国专利Nos.6,051,753,和5,378,619)；PC1SV启动子(美国专利No.5,850,019)；SCP1启动子(美国专利No.6,677,503)，以及AGRtu.nos启动子(GenBank登录号V00087；Depicker et al.(1982)J.Mol.Appl.Genet.1:561-73；Bevan et al.(1983)Nature304:184-7)。
在具体的实施方案中，本发明的核酸分子可以包含组织特异性启动子。组织特异性启动子是这样的核苷酸序列，与生物体的其它组织相比，其在启动子特异的组织中导致可操作地连接的核苷酸序列的转录水平更高。组织特异性启动子的实例包括但不限于：绒毡层特异性启动子；花药特异性启动子；花粉特异性启动子(参见，例如，美国专利No.7,141,424，和国际PCT公开No.WO 99/042587)；胚珠特异性启动子；(参见，例如，美国专利申请No.2001/047525A1)；果实特异性启动子(参见，例如，美国专利Nos.4,943,674,和5,753,475)；和种子特异性启动子(参见，例如，美国专利Nos.5,420,034,和5,608,152)。在一些实施方案中，发育阶段特异的启动子(例如，在发育晚期活跃的启动子)可以在本发明的组合物或方法中使用。
其他可在一些实施方案中与核酸分子可操作地连接的调节序列，包括位于启动子序列和充当翻译前导序列的编码序列之间的5’UTR。翻译前导序列存在于完全加工的mRNA中，并且它可能影响初级转录物的加工，和/或RNA稳定性。翻译前导序列的实例包括玉米和矮牵牛热休克蛋白前导序列(美国专利No.5,362,865)，植物病毒外壳蛋白质前导序列，植物核酮糖-1,5-二磷酸羧化酶/加氧酶(rubisco)前导序列，及其他。参见，例如，Turner and Foster(1995)Molecular Biotech.3(3):225-36。下列文献中提供了5’UTR的非限制性实例：GmHsp(美国专利No.5,659,122)；PhDnaK(美国专利No.5,362,865)；AtAnt1；TEV(Carrington and Freed(1990)J.Virol.64:1590-7)；和AGRtunos(GenBank登录号V00087；和Bevan et al.(1983)，同上)。
其他可在一些实施方案中与核酸分子可操作地连接的调节序列还包括3’非翻译序列、3’转录终止区或多聚腺苷酸区。这些都是位于核苷酸序列下游的遗传元件，并包括提供多聚腺苷酸化信号，和/或其它能够影响转录或mRNA加工的调控信号的多核苷酸。多聚腺苷酸化信号在植物中发挥功能，导致在mRNA前体的3’端添加多聚腺苷酸核苷酸。多聚腺苷酸序列可以来自于各种植物基因，或T-DNA基因。3’转录终止区的一个非限制性实例是胭脂碱合成酶3'区(nos 3’；Fraley et al.(1983)Proc.Natl.Acad.Sci.USA80:4803-7)。在Ingelbrecht et al.(1989)Plant Cell 1:671-80中提供了一个使用不同3'非翻译区的实例。多聚腺苷酸信号的非限制性实例包括来自豌豆RBCS2基因的多聚腺苷酸信号(Ps.RbcS2-E9；Coruzzi et al.(1984)EMBO J.3:1671-9)和AGRtu.nos(GenBank登录号No.E01312)。
其他关于可用于特定实施方案的调节序列的信息在例如Goeddel(1990)“Gene Expression Technology,”Methods Enzymol.185,Academic Press,San Diego,CA中有描述。
本发明的重组核酸分子或载体可包含选择标志物，其赋予被转化细胞(例如植物细胞)可选择的表型。选择标志物也可以用于选择包含本发明核酸分子的植物或植物细胞。该标记可以编码杀生物剂抗性、抗生素抗性(例如，卡那霉素、遗传霉素(G418)、博来霉素，和潮霉素)或除草剂抗性(例如草甘膦)。选择标志物的实例包括，但不限于：neo基因，其赋予卡那霉素抗性并可用例如卡那霉素和G418进行筛选；bar基因，其赋予双丙氨磷抗性；突变的EPSP合酶基因，其赋予草甘膦抗性；腈水解酶基因，其赋予溴苯腈抗性；突变的乙酰乳酸合酶基因(ALS)，其赋予咪唑啉酮或磺酰脲抗性；和氨甲喋呤抗性DHFR基因。存在多种选择标志物，其可赋予对化学试剂的抗性，包括例如但不限于，氨苄青霉素；博来霉素；氯霉素；庆大霉素；潮霉素；卡那霉素；林可霉素；甲氨蝶呤；膦；嘌呤霉素；大观霉素；利福平；链霉素；和四环素。这些选择标志物的实例在，例如，美国专利5,550,318；5,633,435；5,780,708和6,118,047中有举例。
作为附加或替代手段，本发明的核酸分子或载体还可以包含筛选标志物。筛选标志物可用于检测表达。筛选标志物的实例包括β-葡糖醛酸糖苷酶或uidA基因(GUS)，其编码一种其各种发色底物已知的酶(Jefferson et al.(1987)Plant Mol.Biol.Rep.5:387-405)；R-座位基因，其编码的产物可调节植物组织中花青素色素(红色)的产生(Dellaporta et al.(1988)“Molecular cloning of the maize R-nj allele by transposon tagging with Ac.”见18th Stadler Genetics Symposium,P.Gustafson and R.Appels,编辑,Plenum,NY(第263-82页)；β-内酰胺酶基因(Sutcliffe et al.(1978)Proc.Natl.Acad.Sci.USA 75:3737-41)；一种编码其各种发色底物已知的酶的基因(例如，PADAC，一种发色头孢菌素)；荧光素酶基因(Ow et al.(1986)Science 234:856-9)；xylE基因，其编码一种儿茶酚双加氧酶，该酶转换发色的儿茶酚(Zukowski et al.(1983)Gene46(2-3):247-55)；淀粉酶基因(Ikatu et al.(1990)Bio/Technol.8:241-2)；酪氨酸酶基因，其编码的酶能够氧化酪氨酸为DOPA多巴醌，后者进一步缩合成黑色素(Katz et al.(1983)J.Gen.Microbiol.129:2703-14)；和α-半乳糖苷酶。
适用于转化宿主细胞的方法包括任何能够将DNA引入到细胞内的方法，例如但不限于：通过原生质体转化(参见，例如，美国专利5,508,184)；干燥/抑制介导的DNA摄取(desiccation/inhibition-mediated DNA uptake)(参见，例如Potrykus et al.(1985)Mol.Gen.Genet.199:183-8)；电穿孔(参见，例如，美国专利5,384,253)；用碳化硅纤维搅拌(参见，例如，美国专利5,302,523和5,464,765)；土壤杆菌介导的转化(参见，例如，美国专利5,563,055,5,591,616,5,693,512,5,824,877,5,981,840,和6,384,301)；和DNA涂覆颗粒的加速(acceleration of DNA-coated particles)(参见，例如，美国专利5,015,580,5,550,318,5,538,880,6,160,208,6,399,861,和6,403,865)。通过诸如这些技术的应用，几乎任何物种的细胞均可以被稳定地转化。在一些实施方案中，转化DNA整合到宿主细胞的基因组中。在多细胞物种的情况下，转基因细胞可以再生为转基因生物。任何这些技术均可用于产生转基因植物，例如，在转基因植物的基因组中包含一个或多个本发明的核酸序列。
最广泛使用的将表达载体导入到植物中的方法是基于土壤杆菌的天然转化系统。根癌土壤杆菌和发根土壤杆菌是可遗传转化植物细胞的植物致病性土壤细菌。根癌土壤杆菌和发根土壤杆菌的Ti和Ri质粒分别携带负责植物遗传转化的基因。Ti(肿瘤诱导)质粒含有一大段被称为T-DNA的片段，其转移到被转化的植物中。Ti质粒的另一个片段，vir区，负责T-DNA转移。T-DNA区域由左手和右手边界所界定，左手和右手边界均由末端重复核苷酸序列构成。在某些修改的双元载体中，肿瘤诱导的基因已被删除，并且vir区的功能被利用来转移被T-DNA边界序列界定的外源DNA。T-区还可以包括，例如，用于高效回收转基因植物和细胞的选择标志物，和用于插入供转移的序列，例如编码本发明融合蛋白的核酸，的多克隆位点。
因此，在一些实施方案中，植物转化载体来源于根癌土壤杆菌的Ti质粒(参见，例如，美国专利Nos.4,536,475,4,693,977,4,886,937和5,501,967，以及欧洲专利EP 0122791)或发根土壤杆菌的Ri质粒。其他的植物转化载体包括，例如但不限于，在下列文献中描述的那些：Herrera-Estrella et al.(1983) Nature 303:209-13；Bevan et al.(1983),同上；Klee et al.(1985)Bio/Technol.3:637-42；和欧洲专利EP 0120516，以及从前述任一种衍生的那些。也可以修饰其它天然与植物互作的细菌，例如中华根瘤菌属、根瘤菌、和慢生根瘤菌属，使之介导将基因转移到多种多样的不同植物中。这些植物相关的共生菌可以通过获取卸甲(disarmed)的Ti质粒和合适的双元载体而具备基因转移能力。
提供外源DNA到受体细胞之后，一般对被转化的细胞进行鉴定，用于进一步的培养和植株再生。为了提高识别被转化细胞的能力，可能期望与用于产生转化体的载体一起使用如先前阐述的可选择或筛选的标志物基因。在使用选择标志物的情况下，通过使细胞暴露于选择试剂，在潜在的被转化细胞群体中鉴定被转化的细胞。在使用选择标志物的情况下，可以通过期望的标记基因性状对细胞进行筛选。
对于暴露于选择试剂时存活的细胞，或在筛选试验中具有阳性得分的细胞，可以在支持植株再生的培养基中培养。在一些实施方案中，对任何合适的植物组织培养基(例如，MS和N6培养基)均可加以修饰使其包含更多的物质，如生长调节剂。组织可以保持在含有生长调节剂的基本培养基中，直到获得足够的组织用于开始植物再生，或者进行多轮重复的人工选择，直到组织的形态适合于再生(例如，至少2周)，然后转移到有利于芽形成的培养基中。培养被周期性转移，直到形成足够的芽。一旦芽形成，即将它们转移到有利于根形成的培养基中。一旦有足够的根部形成，可以将植物转移到土壤中进一步生长和成熟。
为了确认再生植物中感兴趣的核酸分子(例如编码含有至少一个本发明融合蛋白的多肽的核苷酸序列)的存在，可以实施多种测定。这些测定包括，例如：分子生物学测定，如Southern和Northern杂交、PCR和核酸测序；生物化学测定，例如通过如免疫学方法(ELISA和/或Western印迹)或通过酶促作用检测蛋白质产物的存在；植物部分测定，如叶或根测定；和再生的全植物的表型分析。
整合事件可以通过例如PCR扩增进行分析，其中PCR扩增使用，例如，特异针对感兴趣的核苷酸序列的寡核苷酸引物。PCR基因分型可以理解包括，但不限于，来源于预测为含有整合到基因组中的感兴趣的核酸分子的分离宿主植物的基因组DNA的聚合酶链反应(PCR)扩增，随后进行标准克隆和PCR扩增产物序列分析。PCR基因分型的方法已经有很多描述(参见，例如，Rios,G.et al.(2002)Plant J.32:243-53)，并可用于来源于任何植物物种或组织类型(包括细胞培养物)的基因组DNA。
使用土壤杆菌依赖的转化方法形成的转基因植物通常含有被插入到一个染色体上的单一重组DNA序列。该单一重组DNA序列被称作“转基因事件”或“整合事件”。这样的转基因植物对于所插入的DNA序列而言是杂合的。在一些实施方案中，可以获得对转基因而言为纯合的转基因植物，这是通过使含有单个外源基因序列的独立分离的转基因植物与自身(例如F₀植物)有性交配(自交)产生F_l种子。所产生的F_l种子中四分之一对转基因而言是纯合的。萌发F_l种子产生能够用于杂合性测试的植物，其中杂合性测定通常使用允许区分杂合子和纯合子的SNP测定或热扩增测定法(即，合子型测定)。
在具体的实施方案中，在被引入了至少一个包含编码至少一种人造转录激活物融合蛋白的核苷酸序列的核酸分子的细胞内产生包含至少一个植物TAD互作基序(和/或变体TAD互作基序)和至少一个DNA结合结构域的至少一种人造转录激活物融合蛋白的多个拷贝。每个人造的转录激活物融合蛋白可以由多个引入到不同转化事件中的核酸序列表达，或者由引入到单个转化事件中的单个核酸序列表达。在一些实施方案中，多个这样的融合蛋白可以在单个启动子的控制下表达。在其它实施方案中，多个这样的融合蛋白可以在多个启动子的控制下表达。
除了用本发明的核酸分子介导植物或植物细胞的转化之外，在一些实施方案中，可以通过将具有至少一个转基因事件的第一植物与缺少这种事件的第二植物杂交来制备转基因植物。例如，可以将含有编码人造转录激活物融合蛋白的核苷酸序列的核酸分子，其中该融合蛋白包含至少一个植物TAD互作基序(和/或变体TAD互作基序)和至少一个DNA结合结构域，引入到适于转化的第一植物品系内，从而产生转基因植物，其中转基因植物可以和第二植物品系杂交，从而将编码该人造转录激活物融合蛋白的核苷酸序列渗入到该第二植物品系内。
VIII.含有融合蛋白转录激活物的植物材料
在一些实施方案中，提供了植物，所述植物包括含有编码人造转录激活物融合蛋白的核苷酸序列的植物细胞，其中该融合蛋白包含至少一个植物 TAD互作基序(和/或变体TAD互作基序)和至少一个DNA结合结构域。在具体的实施方案中，这样的植物可以通过转化植物组织或植物细胞，并再生全植物来产生。在进一步的实施方案中，这样的植物可以通过将含有编码人造转录激活物融合蛋白的核苷酸序列的核酸渗入到种质中而获得。还提供了包含这样的植物细胞的植物材料。这样的植物材料可以从包含该植物细胞的植物中获得。
在一些实施方案中，包含编码人造转录激活物融合蛋白的核苷酸序列的转基因植物或植物材料，其中该融合蛋白包含至少一个植物TAD互作基序(和/或变体TAD互作基序)和至少一个DNA结合结构域，表现出一个或多个以下的特征：在植物的细胞内表达融合蛋白；在植物细胞的原生质体内表达融合蛋白；在植物细胞的细胞核内表达融合蛋白；将融合蛋白定位在植物的细胞内；将核苷酸序列整合到植物细胞的基因组中；在植物细胞的染色体外DNA中存在核苷酸序列；和/或在植物细胞中存在相应于核苷酸序列的RNA转录本。除了表达编码的融合蛋白之外，这样的植物可以额外具有一个或多个期望的性状。这些性状可以包括由于内源或转基因核苷酸序列的表达产生的性状，所述内源或转基因核苷酸序列表达在植物细胞内受到该融合蛋白的调节，例如但不限于：抗昆虫等害虫以及致病剂；抗除草剂；增强稳定性、产量或保质期；环境耐受性；药物生产；工业产品生产；和营养强化。
根据本发明的转基因植物可以是任何能够被本发明核酸分子转化的植物。因此，该植物可以是双子叶植物或单子叶植物。本发明方法中可以使用的双子叶植物的非限制性实例包括：拟南芥，紫花苜蓿，豆类，西兰花，卷心菜，加拿大油菜，胡萝卜，花椰菜，芹菜，大白菜，棉花，黄瓜，茄子，莴苣，甜瓜，豌豆，胡椒，花生，马铃薯，南瓜，萝卜，油菜，菠菜，大豆，倭瓜(squash)，甜菜，向日葵，烟草，番茄，和西瓜。本发明方法中可以使用的单子叶植物的非限制性实例包括：玉米，洋葱，水稻，高粱，小麦，黑麦，黍，甘蔗，燕麦，黑小麦，稷，以及草坪草。根据本发明的转基因植物可以按照任何方式使用或栽培。
一些实施方案还提供了含有一个或多个编码人造转录激活物融合蛋白的核苷酸序列的商业产品，例如从含有一个或多个这类核苷酸序列的重组植物或种子中产生的商业产品，其中所述融合蛋白包含至少一个植物TAD互作基序(和/或变体TAD互作基序)和至少一个DNA结合结构域。含有一个或多个编码人造转录激活物融合蛋白的核苷酸序列的商业产品，其中该融合蛋白包含至少一个植物TAD互作基序(和/或变体TAD互作基序)和至少一个DNA结合结构域，包括例如但不限于：含有一个或多个编码这种人造转录激活物融合蛋白的核苷酸序列的植物的食品、粕、油、压碎的或完整的颗粒或种子。在一个或多个商品或商业产品中检测到一个或多个编码本发明人造转录激活物融合蛋白的核苷酸序列，是事实上的证据，证明该商品或商业产品至少部分是由包含一个或多个编码本发明人造转录激活物融合蛋白的核苷酸序列的植物产生的。在具体的实施方案中，本发明的商品产品包括可检测量的、编码人造转录激活物融合蛋白的核酸序列，其中该融合蛋白含有至少一个植物TAD互作基序(和/或变体TAD互作基序)和至少一个DNA结合域。在一些实施方案中，这种商品产品可以通过，例如，获得转基因植物并从该转基因植物制备食物或饲料来生产。
在一些实施方案中，含有包含编码本发明人造转录激活物融合蛋白的核苷酸序列的转基因的转基因植物或种子在其基因组中还可以包含至少一个其它的转基因事件，包括但不限于：从其转录出RNAi分子的转基因事件；编码杀虫蛋白质的基因(例如，苏云金芽孢杆菌杀虫蛋白质)；除草剂耐受性基因(例如，提供对草甘膦耐受性的基因)；和有助于在转基因植物中产生期望表型的基因(例如，增加产量，改变脂肪酸代谢，或恢复细胞质雄性不育)。
在一些实施方案中，含有编码本发明人造转录激活物融合蛋白的核苷酸序列的转基因的转基因植物或种子，在转基因植物的基因组内可以包含内源或天然基因靶标，包括但不限于：用于改变脂肪酸代谢性状的内源基因靶标，用于干旱耐受性性状的内源基因靶标，用于氮利用效率性状的内源基因靶标，或任何其他有助于转基因植物产生期望表型的内源基因靶标(例如，增加产量，或恢复细胞质雄性不育)。内源或天然基因靶标可以和这样的核苷酸序列可操作地连接，其中该核苷酸序列特异结合该人造的转录激活物融合蛋白，从而影响靶基因的转录。
IX.通过融合蛋白转录激活物进行表达调节
在一些实施方案中，可以使用人造的转录激活物融合蛋白增加(例如，引发)细胞内感兴趣的核苷酸序列(例如，感兴趣的基因)的表达，其中该融合蛋白包括至少一个植物TAD互作基序(和/或变体TAD互作基序)和至少一个DNA结合结构域。在一些实施方案中，感兴趣的核苷酸序列可以是对于细胞基因组而言内源性的。在其它实施方案中，包含感兴趣的核苷酸序列的至少一个外源核酸分子被引入到细胞中。一般地，与感兴趣的核苷酸序列可操作地连接的第二核苷酸序列可以被融合蛋白的DNA结合结构域识别，从而可以在第二核苷酸序列与融合蛋白之间产生稳定而特异的结合。在一些实例中，所述至少一个含有感兴趣的核苷酸序列的核酸分子还包含这样的第二核苷酸序列。在一些实例中，所述至少一个含有感兴趣的核苷酸序列的核酸分子被引入到宿主细胞中，从而使感兴趣的核苷酸序列与宿主细胞内源的第二核苷酸序列可操作地连接。例如，包含感兴趣的核苷酸序列的核酸分子可以促进同源重组，将感兴趣的核苷酸序列插入到宿主细胞的基因组中，从而使感兴趣的核苷酸序列与一个被DNA结合结构域识别的内源序列可操作地连接。在一些实例中，所述至少一个含有感兴趣的核苷酸序列的核酸分子对于宿主细胞而言是内源的或天然的，从而使感兴趣的核苷酸序列与对宿主细胞而言为内源的第二核苷酸序列可操作地连接。
在一些实例中，在不同转化事件中被引入的多个感兴趣的核苷酸序列可以在单个融合蛋白的调节控制下表达。在其他实例中，单个感兴趣的核苷酸序列(例如，单一的整合事件)被调节和表达。在一些实施方案中，多个感兴趣的核苷酸序列可以被本发明的融合蛋白与单一核酸结合位点的结合所调节；例如，所述多个感兴趣的核苷酸序列可以全部与同一第二核苷酸序列可操作地连接，而融合蛋白的DNA结合结构域结合该第二核苷酸序列。在某些实例中，组成这样多个核苷酸序列的感兴趣的核苷酸序列不必是相同的。因此，在单个融合蛋白的调节控制下可以表达出多个不同的基因产物。
在特定实施方案中，处于本发明融合蛋白调节控制之下的感兴趣的核苷酸序列的表达产物可以是标志基因产物；例如但不限于，荧光分子。关于这种表达产物的表达的定量和定性观察可以提供用以评估特定TAD互作基序或TAD互作基序变体的特定调节性能的系统。
在包含至少一个植物TAD互作基序(和/或变体TAD互作基序)和至少一个DNA结合结构域的人造转录激活物融合蛋白的调节控制下，可以表达任何表达产物(例如，蛋白质、前体蛋白质和抑制性RNA分子)。在具体的实例中，处于人造转录激活物融合蛋白调节控制下的表达产物可以是，但不限于，在编码融合蛋白的核酸所引入的宿主细胞中通常表达的内源或天然多肽。在其它实例中，处于人造转录激活物融合蛋白调节控制下的表达产物可以是通常不在宿主细胞中表达的异源多肽。例如但不限于，处于人造转录激活物融合蛋白调节控制下的表达产物可以是这样的多肽，其参与除草剂抗性、病毒抗性、细菌性病原体抗性、昆虫抗性、线虫抗性、或真菌抗性。参见，例如，美国专利5,569,823；5,304,730；5,495,071；6,329,504；和6,337,431。处于人造转录激活物融合蛋白调节控制下的表达产物可以是，例如但不限于，参与植物活力或产量的多肽(包括参与极端温度耐受、土壤条件、光照水平、水位、和化学环境的多肽)，或者可以用作鉴定含有感兴趣的性状的植物的标记的多肽(例如，选择标志物基因产物，和参与种子颜色的多肽)。
在本发明的一些实施方案中，可以处于人造转录激活物融合蛋白(该融合蛋白包含至少一个植物TAD互作基序(和/或变体TAD互作基序)和至少一个DNA结合结构域)调节控制之下的多肽的非限制性实例包括：乙酰乳酸合酶(ALS)、突变的ALS和ALS的前体(例如，见美国专利5,013,659)；EPSPS(见，例如，美国专利4,971,908和6,225,114)，例如CP4EPSPS或III类EPSPS；可改变质体中发生的生理过程的酶，所述生理过程包括例如但不限于，光合作用和脂肪酸、氨基酸、油、类胡萝卜素(carotenoids)、萜类和淀粉的合成。在特定实施方案中，可以处于人造转录激活物融合蛋白调节控制之下的多肽的其它非限制性实例包括：玉米黄素环氧酶，胆碱单加氧酶，亚铁螯合酶，ω-3脂肪酸去饱和酶，谷氨酰胺合成酶，淀粉修饰酶，参与必需氨基酸、维生素A、激素、Bt毒素和蛋白质合成的多肽。编码上述多肽的核苷酸序列在本领域中是可得的，这些核苷酸序列可以与DNA结合结构域的特异结合位点可操作地连接，从而在人造转录激活物融合蛋白(该融合蛋白包含至少一个植物TAD互作基序(和/或变体TAD互作基序)和至少一个特异结合该可操作地连接位点的DNA结合结构域)的调节控制下得以表达。
此外，要置于调节控制之下的、编码任何前述的多肽感兴趣的变体核苷酸序列，可以由本领域的技术人员鉴定(例如，通过克隆与其它编码特定多肽的基因高度同源的基因，或者通过考虑DNA密码子的简并性在计算机(in silico)上生成序列)。这些变体在具体的实施方案中可能是理想的，例如，符合宿主生物体的优化密码子使用。一旦鉴定了这种感兴趣的变体核苷酸序列，便可以设计核酸分子，通过本发明的人造转录激活物多肽对该序列进行调节控制，例如通过将核酸分子中的感兴趣的变体核苷酸序列与待使用的人造转录激活物融合蛋白中所含的DNA结合结构域的已知结合位点可操作地连接。在本文所述的实施方案中，当宿主细胞中同时存在核酸分子和本文所述的特定人造转录激活物融合蛋白其中一种时，可以观察到这种感兴趣的变体核苷酸序列的表达令人惊讶地增加(例如在宿主植物细胞内)。
本文讨论的参考文献仅仅是由于它们公开于本专利申请提交日之前。本文中的任何内容不应被理解为，由于先前的发明，本发明人承认没有资格早于这些公开。
下面提供的实施例用于例证某些具体的特征和/或实施方案。这些实施例不应被看作将本公开限制在所例证的这些特定特征或实施方案中。
实施例
实施例1：植物反式激活互作基序的鉴定
七种蛋白质被鉴定为VP16反式激活结构域(SEQ ID NO:1)的同源体：PTI4(GenBank登录号No.ACF57857.1),ERF2(GenBank登录号No.NP_199533.1),AtERF1(GenBank登录号No.NP_567530.4),ORCA2(GenBank登录号No.CAB93940.1),DREB1A(GenBank登录号No.NP_567720.1),CBF1(GenBank登录号No.NP_567721.1),和DOF1(GenBank登录号No.NP_001105709.1)。VP16反式激活结构域(SEQ ID NO:1)的氨基酸序列与这些推定的植物转录激活物中的区域具有序列相似性，并且使用VP16序列在每种激活因子中定位了反式激活结构域。鉴定出的这些植物激活因子蛋白质的反式激活结构域是：SEQ ID NO:2(PTI4),SEQ ID NO:3(ERF2),SEQ ID NO:4(AtERF1),SEQ ID NO:5(ORCA2),SEQ ID NO:6(DREB1A),SEQ ID NO:7(CBF1),和SEQ ID NO:8(DOF1)。接下来，使用VP16反式激活亚结构域II的互作基序(图1；SEQ ID NO:9)来从植物反式激活结构域中定位互作基序。图2显示了VP16与植物反式激活结构域的比对结果，其中突出显示的是新的互作基序。
实施例2：鉴定得到的植物反式激活结构域中的互作基序的修饰
对鉴定出的植物反式激活结构域中的互作基序进行修饰。产生了下述基序的新变体：此类基序含有VP16反式激活结构域的亚结构域II的互作基序的氨基酸接触残基。Langlois et al.(2008)J.Am.Chem.Soc.130:10596。VP16反式激活结构域的6个氨基酸接触残基被认为与Tfb1(转录因子TFIIH的一个亚单位)直接互作。图1.将氨基酸引入到新鉴定的植物反式激活结构域的互作基序中，产生变体序列。
我们假设，修饰互作基序使之含有从亚结构域II的VP16互作基序中鉴定出的6个氨基酸接触残基，会产生能够与更多不同转录因子互作、借此导致更高水平蛋白质表达的修饰植物激活因子互作基序。
ERF2修饰
ERF2中Asn53到Ala85的区域与VP16反式激活结构域的亚结构域II对齐(图2)，将该区域鉴定为ERF2的植物反式激活结构域。找到对应于VP16反式激活结构域的亚结构域II的区域，从Asp66到Asp76，向该区域中引入修饰。对与VP16反式激活结构域的亚结构域II的互作基序的6个接触残基不同的氨基酸残基进行修饰。这些改变产生了示例性的ERF2修饰互作基序序列(即变体互作基序序列)，其与VP16反式激活结构域的亚结构域II的相似。图3。
对PTI4,AtERF1,ORCA2,DREB1A,CBF1,和DOF1互作基序的修饰
向PTI4,AtERF1,ORCA2,DREB1A,CBF1,和DOF1互作基序中引入与向ERF2中引入的修饰相似的修饰。对天然序列中与VP16反式激活结构域的亚结构域II的互作基序的6个直接接触残基不同的氨基酸残基进行修饰，从而产生示例性变体互作基序。引入这些变化是为了使植物变体互作基序与VP16反式激活结构域的亚结构域II的互作基序相似(例如，功能相似)。图4-9列出了这些变体或修饰互作基序的示例序列，并与VP16反式激活结构域的亚结构域II的天然互作基序序列进行比较。
实施例3：在酿酒酵母报告菌株中对植物激活结构域的互作基序进行测试
酿酒酵母报告菌株
产生酿酒酵母报告菌株用于测试含有天然或变体互作基序的植物激活结构域。通过一个三步克隆程序构建了酵母整合载体，pHO-zBG-MEL1(图10)。
首先，通过PCR扩增酵母SSA报告载体，pNorMEL1(Doyon et al.(2008)Nat.Biotechnol.26(6):702-8)，的两个分离片段。第一个片段含有一个酵母KanMX表达盒，它是用引物KanMX-For(SEQ ID NO:59)和KanMX-Rev(SEQ ID NO:60)从pNorMEL1扩增的，两个引物分别添加5’SpeI,BamHI,NheI,PacI,BglII,KpnI,和3’EcoRI限制位点。第二个片段含有伸向酵母HO座位的外向同源臂(Voth et al.(2001)Nucleic Acids Res.29(12):E59-9)，臂与臂之间被一个细菌复制起点分隔，用引物HO-For(SEQ ID NO:61)和HO-Rev(SEQ ID NO:62)对其进行扩增。将两个片段用EcoRI/SpeI消化，并连接产生一个KanMX可选择的HO-靶定载体。
接着，用MEL1-For(SEQ ID NO:63)和MEL1-Rev(SEQ ID NO:64)引物从pMEL1α2(Melcher et al.(2000)Gene 247(1-2):53-61)扩增MEL1表达盒，并克隆到上述KanMX可选择HO-靶定载体的KpnI位点中。
最后，通过外部供应商(DNA2.0,Menlo Park,CA)从头合成一个锌指蛋白(ZFP)结合位点(称作“HAS”，表示“高亲和位点”之意)。该位点含有靶定人CCR5基因的锌指蛋白(ZFP)的结合位点(Perez et al.(2008)Nat.Biotechnol.26:808-16)。使用引物HAS-For-F1(SEQ ID NO:65)和HAS-For-R1(SEQ ID NO:66)对HAS片段加以PCR扩增，并将其克隆到KanMX HO MEL1载体的BamHI-PacI位点中，位于MEL1报告基因的上游。所得的载体命名为pHO-zBG-MEL1(图10)。
将pHO-zBG-MEL1用NotI线性化以暴露侧翼的同源臂用于靶定到酵母HO座位，并使用制造商建议的方案将其转化入酿酒酵母菌株BY4741MATα(Invitrogen,Carlsbad,CA)。简而言之，离心沉降3mL对数期BY4741培养物，用TEL缓冲液(10mM Tris HCL,pH 8.0,1mM EDTA,100mM乙酸锂)清洗。将酵母细胞离心沉淀物重悬在含有3μg线性化pHO-zBG-MEL1的360μL酵母转化液(33.3％PEG-3350(Sigma-Aldrich,St.Louis,MO),0.1M乙酸锂(Sigma-Aldrich),和0.2mg/mL鲑鱼精子DNA(Stratagene,La Jolla,CA)，溶于1X TE)中，并在42℃热激40分钟。将酵母细胞沉淀、清洗、并在富培养基中生长2小时，随后在含有1mg/L(Life Technologies,Carlsbad,CA)的YPD平板上进行筛选。将抗性克隆在平板上重新划线，并用于随后的转化。
酵母ZFP-转录激活物表达盒构建
构建含有合框的CCR5锌指结合蛋白(CCR5-ZFP)-植物反式激活互作基序的DNA构建体。天然和SEQ ID NO:80-93中描述的变体植物反式激活互作基序作为BamHI/HindIII限制酶片段迁移(mobilize)，并克隆在编码CCR5-ZFP结构域的序列的直接下游(Perez et al.(2008),同上)。所得的ZFP转录激活表达盒使用GAL1,10启动子(West et al.(1987)Genes Dev.1:1118-31)和CYC1终止子(Osborne et al.(1988)Genes Dev.2:766-72)，并基于酵母pRS315系列载体。所得的载体含有与CCR5-ZFP合框融合的天然和变体植物反式激活互作基序。
此外，包含了数个对照。本研究中使用了一个空载体对照和两个不同的VP-16转录激活物表达盒，SGMO VP16-CCR5(SEQ ID NO:79)和VP16v2CCR5-CCR5。这两种VP-16转录激活物表达盒均由GAL1,10启动子驱动，并以CYC1终止子结束。空载体对照只含有CCR5-ZFP结构域，而不含有反式激活互作基序。
酵母活性测定
将BY4741报告系的过夜培养物培育在中，使用标准酵母转化方案以96孔板格式投递1μg含有ZFP转录激活物表达盒的载体。所有转化设置两个重复。在缺少亮氨酸的合成葡萄糖培养基(SD-Leu)中恢复被转化的酵母细胞，以选择含有ZFP转录激活物表达盒的载体。72小时后，通过用SD-Leu以1:10稀释富集酵母细胞，并进一步培育24小时。接着，将酵母细胞1:10稀释到缺少亮氨酸的合成棉籽糖培养基(SR-Leu)中，以解除对GAL1,10启动子的抑制。24小时后，离心沉降酵母细胞，并重悬浮在缺少亮氨酸的合成半乳糖培养基(SG-Leu)中。在半乳糖诱导0、3和6小时的时间点，收集110μL酵母细胞用于MEL1测定。
在MEL1测定中，将110μL酵母细胞中的100μL用100μL水稀释，并用分光光度计测量600nm吸光度(OD₆₀₀)。将剩余的10μL酵母细胞在90μLMEL1缓冲液(77mM Na₂HPO₄、61mM柠檬酸、2mg/mL PNPG(Sigma-Aldrich))中30℃温育1小时。通过添加100μL 1M Na₂CO₃终止反应。在OD₄₀₅下评估MEL1活性，并使用基于OD₄₀₅和OD₆₀₀测量比值的公式计算mU(Doyon et al.(2008)Nat.Biotechnol.26(6):702-8)。
由不同植物反式激活互作基序激活导致的Mel1报告基因的表达水平如图11所示。将由这些不同植物反式激活互作基序导致的MEL1蛋白质的表达，与空载体对照和由VP16反式激活结构域亚结构域II(SEQ ID NO:1)(VP16(v2)-CCR5)和SGMO VP16(SGMO VP16-CCR5)所致的Mel1激活进行比较。
与VP16对照相比，经过修饰的ERF2(v2)植物反式激活互作基序产生了出人意料的高水平表达。此外，使用该变体植物反式激活互作基序表达Mel1导致比天然形式的ERF2(v3)植物反式激活互作基序更高。
经过修饰的PTI4(v2)植物反式激活互作基序表达的MEL1蛋白质与VP16反式激活结构域对照相似。然而，与天然PTI4(v3)植物反式激活互作基序相比，在PTI4互作基序中引入的修饰导致了显著升高水平的Mel1表达。
与VP16对照相比，AtERF1(v3),AtERF1(v2),ORCA2(v3),ORCA2(v2),DOF1(v3),DOF1(v2),DREB1A(v3),DREB1A(v2),CBF1(v3)和CBF1(v2)植物反式激活互作基序在酵母测定中没有造成高水平的Mel1表达。然而，AtERF1、DREB1A、和CBF1植物反式激活互作基序确实驱动了酵母中的Mel1表达。只有ORCA2(v3)和DOF1(v2)植物反式激活互作基序在酵母测定中没有产生任何Mel1表达。
在Mel1酵母测定中，由经过修饰的变体(v2)植物反式激活互作基序的植物反式激活结构域产生的MEL1的水平，普遍高于比天然(v3)植物反式激活互作基序。在酵母测定中唯一一个没有驱动Mel1表达的修饰型植物反式激活互作基序是DOF1(v2)互作基序。该植物反式激活互作基序在酵母测定中没有产生任何MEL1表达。
实施例4：植物激活结构域的互作基序在含有包含锌指DNA结合结构域的报告构建体的烟草中的功能
报告物构建体pDAB9897
从头合成Z6DNA结合结构域多肽序列(SEQ ID NO:67；Yokoi et al.(2007)Mol Ther.15(11):1917-23)的8个串联重复，并在5’和3’端添加SacII位点，以方便克隆。随后，将整个8X-Z6结合结构域(SEQ ID NO:68)克隆到预先存在的含有期望植物表达元件的入门载体(Entry vector)中。将8X-Z6结合位点迁移到SacII片段上，并利用在骨架载体中发现的唯一SacII位点将其克隆到拟南芥肌动蛋白-2启动子(AtAct2启动子v2；An et al.(1996)Plant J.10:107-21)的直接上游。随后，使用唯一的NcoI/SacI位点，用NcoI位点的ATG密码子形成起始密码子，将gus基因(GUS；Jefferson(1989)Nature342:837-8)克隆到该载体中拟南芥肌动蛋白-2启动子的直接控制之下。使用Atu ORF233’UTR(根癌土壤杆菌(Agrobacterium tumefaciens)开放阅读框-23,3’非翻译序列；欧洲专利申请No.EP 222493A1)终止转录。
最终的转化载体，pDAB9897，是与含有下述选择标志物盒的目标载体进行连接的结果：用于植物选择的拟南芥泛素-10启动子(At Ubi10启动子v2(Callis et al.(1990)J.Biol.Chem.265:12486-93))::草丁膦乙酰转移酶基因(pat v3(Wohlleben et al.(1988)Gene 70:25-37))::根癌土壤杆菌开放阅读框-1,3’非翻译区(AtuORF13’UTR v3(Huang et al.(1990)J.Bacteriol.172:1814-22)(图12)。最终的转化载体通过测序进行确认，并转化到根癌土壤杆菌菌株LBA4404(Invitrogen,Carlsbad,CA)中。
通过土壤杆菌介导用pDAB9897转化烟草
为了制作转基因报告植物事件，将从Petit Havana烟草植株上切下的叶盘(1cm²)在含有质粒pDAB9897的根癌土壤杆菌菌株LBA4404的过夜培养物中温育，生长至OD₆₀₀～1.2nm，在无菌滤纸上吸干，然后置于含有30g/L蔗糖并添加了1mg/L吲哚乙酸和1mg/L苯胺嘌呤(benzyamino purine)的MS培养基(Phytotechnology Labs,Shawnee Mission,KS)上，置于60x 20mm皿内(每皿5个叶盘)，用(Karlan Research Products Corporation,Cottonwood,AZ)密封。共温育48小时后，将叶盘转移到含有250mg/L头孢噻肟和5mg/L的相同培养基中。3-4周后，将小植株转移到含有250mg/L头孢噻肟和10mg/L的MS培养基中，置于PhytaTrays^TM内，再培养2-3周，然后收集叶子，并进行分子分析。
报告事件的拷贝数和PTU分析
PCR DNA分离从新生长的小植株收集转基因烟草植物组织，并在96孔收集平板(Qiagen,Valencia,CA)内冻干(Labconco,Kansas City,MO)至少2天。然后使用DNEasy^TM96孔提取试剂盒(Qiagen)，根据制造商的使用说明分离DNA。使用2-96A型Kleco^TM组织粉碎机(Garcia Manufacturing,Visalia, CA)破坏组织。
Southern DNA分离从新生长的小植株收集转基因烟草植物组织，并在2mL锥形管(Eppendorf)中冻干(Labconco,Kansas City,MO)至少2天。然后使用DNEasy^TM平板微提取试剂盒(Qiagen)，根据制造商的使用说明分离DNA。使用2-96A型Kleco^TM组织粉碎机(Garcia Manufacturing)破坏组织。
DNA定量使用Quant-iT^TMDNA测定试剂盒(Molecular Probes,Invitrogen,Carlsbad,CA)对所得的基因组DNA进行定量。使用5个预定量的DNA标准，范围是20ng/μL-1.25ng/μL(系列稀释)，来生成标准曲线。样品首先以1:10或1:20稀释度稀释到测定的线性范围内，并根据制造商的规程测定基因组DNA的浓度。然后，使用Synergy2^TM酶标仪(Biotek,Winooski,VT)记录荧光。通过背景荧光校正后计算出的标准曲线估算基因组DNA浓度。使用Biorobot3000^TM-自动移液器(Qiagen)用TE或水将DNA稀释成10ng/μL的PCR通用浓度。用于Southern分析的DNA不进行稀释。
拷贝数估算使用类似测定(Applied Biosystems,Carlsbad,CA)的多重DNA水解探针测定法分析假定转基因事件的整合复杂度(integration complexity)。使用序列特异性引物和同时用于pat转基因和烟草内参基因pal(苯丙氨酸解氨酶；GenBank登录号No.AB008199)的探针，估算转基因插入物的拷贝数。使用探针设计软件2.0(Roche Applied Science,Indianapolis,IN)设计用于这两个基因的测定。使用480系统(Roche Applied Science)评估这两个基因的实时定量PCR。
为了扩增，在10μL体积的含有0.4μM每种引物和0.2μM每种探针的多重反应中以1X终浓度准备480Probe Master Mix(Roche Applied Science)。表1.实施两步扩增反应，58℃延伸38秒，并进行荧光获取。所有样品运行3个重复，使用平均Ct值分析每个样品。使用软件(Roche Applied Science)通过相对定量模块，并根据ΔΔCt方法，进行实时定量PCR数据的分析。实验中包括来自单拷贝校准品(calibrator)的gDNA样品，用于将结果标准化。单拷贝校准品事件先前通过Southern分析鉴定，被确认具有pat基因的单插入物。
表1.同时在pat和pal水解探针(HP)测定中使用的引物和探针序列。每个探针的荧光表位均不同，使得多个测定能够作为一个多重反应同时进行。

PTU PCR随后通过PCR在低拷贝事件中筛选完整的植物转录单元(PTU)。使用Blu636(SEQ ID NO:75)和Blu637(SEQ ID NO:76)引物，正确的扩增产生一个3.7kb产物，其由Z6-Act2/GUS/AtORF23PTU(3,771bp)构成。在如下的条件下使用GC Master Mix(New England Biolabs,Beverley,MA)：98℃30秒，接着30个循环的98℃10秒，67℃30秒，72℃2分钟，最后72℃延伸10分钟。除了上文详述的PTU PCR反应之外，还扩增一个内源基因，chs(查耳酮合成酶；Genbank登录号No.FJ969391.1)，用来确认基因组DNA模板的品质。反应中包含3'CHS正向(SEQ ID NO：77)和3'CHS反向(SEQ ID NO：78)引物，其产生一个350bp的扩增产物。使用20μL反应，含有终浓度0.5μM的转基因引物和0.2μM内源对照基因。
Southern分析对于每个样品，通过37℃过夜温育用限制酶AseI(New England Biolabs)完全消化5μg基因组DNA。将消化后的DNA用Quick Precip^TM溶液(Edge Biosystems,Gaithersburg,MD)根据生产商建议的方案沉淀浓缩。然后将基因组DNA重悬在25μL水中，65℃1小时。将重悬的样品上样到用1X TAE缓冲液制备的0.8％琼脂糖凝胶上，并在1X TAE中在1.1V/cm下电泳过夜。将凝胶浸没在变性缓冲液(0.2M NaOH/0.6M氯化钠)中30分钟，然后浸没在中和缓冲液(0.5M Tris-盐酸(pH 7.5)/1.5M氯化钠)中30分钟。
通过使用色谱纸捻(wick)和纸巾将20X SSC缓冲液过夜被动吸取(wicking)通过凝胶并到达经过处理的Immobilon^TM-NY+转移膜(Millipore, Billerica,MA)，将DNA片段转移到尼龙膜上。转移后，将膜短暂地用2XSSC清洗，用1800(Stratagene,LaJolla,CA)交联，并在80℃真空烘烤3小时。
使用Robbins Scientific Model 400杂交培养箱(Robbins Scientific,Sunnyvale,CA)在玻璃滚瓶中将印迹用预杂交液(PerfectHyb^TMplus,Sigma-Aldrich)65℃温育1小时。从含有完整编码序列的PCR片段制备探针。使用Qiaex凝胶提取试剂盒(Qiagen)纯化PCR扩增子，并用[α³²P]dCTP通过随机RT标记试剂盒(Stratagene,La Jolla,CA)进行标记。将印迹在65℃与变性探针杂交过夜，其中变性探针直接添加到预杂交液中，大约为200万个计数/印迹^-1mL^-1。杂交后，在65℃用0.1XSSC/0.1％SDS继续清洗40分钟。最后，将印迹暴露于存储荧光成像屏幕，并利用Molecular Dynamics^TMStorm^TM860成像系统成像。通过鉴定单一杂交条带而确认真正的单拷贝整合事件。
纯合T₂报告植物的产生
产生了总计51个抗性植物，根据拷贝数的水解探针分析，其中24个被发现是低复杂度的(1-2个pat拷贝)。PCR分析确定出，在这些低复杂度事件中，18个显示有完整的PTU。Southern印迹分析后，筛选出了2个单拷贝、完整PTU事件，并在温室中生长至成熟，在那里让它们自花授粉。然后收集T₁种子，表面灭菌(20％漂白剂中3min，随后进行两次灭菌、蒸馏水漂洗)，并在MS培养基(Phytotechnology Labs,Shawnee Mission,KS)和30g/L蔗糖的PhytaTrays^TM(Sigma,St.Louis,MO)中萌发。通过pat拷贝数分析进行合子型筛选后，选择纯合T₁植物，在温室中生长至成熟，并允许自花授粉。然后收集T₂种子，表面灭菌，并如前所述地萌发，并用于产生用于反式激活试验的报告植物。
植物ZFP-植物转录激活物表达构建体
构建了含有变体或天然植物反式激活互作基序的植物ZFP-转录激活物构建体。从头合成(DNA2.0,Menlo Park,CA)植物反式激活互作基序(天然的和修饰变体)，两侧为用于克隆的限制酶位点BamHI/SacI。使用在现有入门骨架载体中发现的唯一BamHI/SacI位点，在BamHI/SacI片段上移入植物反式激活互作基序，并克隆到Z6锌指DNA结合结构域(Yokoi et al.(2007),同上)的直接下游。此步骤完成时，将ZFP-转录激活物构建体(含有与植物反式激活互作基序融合的Z6锌指蛋白DNA结合结构域)置于组成型木薯叶脉花叶病毒启动子(CsVMV启动子v2；Verdaguer et al.(1996)Plant Mol.Biol.31:1129-39)的控制之下，并用来自根癌土壤杆菌的ORF233’UTR终止。最终的转化载体(表2)用含有用于植物筛选的拟南芥泛素-10启动子(At Ubi3启动子v2；Callis et al.(1995)Genetics,139(2):921-39))::潮霉素磷酸转移酶II(HPTII v1；Gritz et al.(1983)Gene 25(2-3):179-88)::根癌土壤杆菌开放阅读框-24，3’非翻译区(Atu ORF243’UTR v2)盒的目标载体进行介导的连接(Invitrogen,Carlsbad,CA)，产生了最终的转化载体(表2)。
表2.在烟草中测试的植物ZFP-转录激活物构建体。该序列标识(identifier)提供了与Z6锌指结合蛋白融合并在双元载体中表达的植物反式激活互作基序的DNA序列。

最终的双元载体通过DNA测序进行确认，并转化进入根癌土壤杆菌菌株LBA4404(Invitrogen)。此外，实验中包括对照载体pDAB106238(图21)，其含有锌指结合结构域，但不含有由反式激活互作基序构成的激活因子。在该构建体中，锌指结合结构域被置于组成型根癌土壤杆菌MAS启动子(AtuMas启动子v4；美国专利Nos.5,001,060；5,573,932和5,290,924)的控制下，并以来自癌土壤杆菌的ORF233’UTR为终止。此外，该载体含有用于植物筛选的拟南芥泛素-3启动子/潮霉素磷酸转移酶II/根癌土壤杆菌开放阅读框-24,3'非翻译区盒子。
为了产生含有植物ZFP转录激活物构建体的植物事件，将从T₂报告烟草植物切下的叶盘(1cm²)在携带表2所列16种质粒的其中之一的根癌土壤杆菌菌株LBA4404(Invitrogen,Carlsbad,CA)的过夜培养物中温育，生长至OD₆₀₀～1.2nm，用无菌滤纸吸干，然后置于含有30g/L蔗糖并添加了1mg/L吲哚乙酸和1mg/L苯胺嘌呤的MS培养基(Phytotechnology Labs,Shawnee Mission,KS)上，置于60x 20mm皿内(每皿5个叶盘)，用(Karlan Research Products Corporation,Cottonwood,AZ)密封。共温育48小时后，将叶盘转移到含有250mg/L头孢噻肟和10mg/L潮霉素的相同培养基中。3-4周后，将小植株转移到含有250mg/L头孢噻肟和10mg/L潮霉素的MS培养基中，置于PhytaTrays^TM内，再培养2-3周，然后收集叶子，并进行gus表达分析。为16种植物转录激活物构建体的每一种产生总共20-30个植物事件。
gus表达分析
mRNA分离从新生长的小植株收集转基因烟草植物组织到96孔收集板(Qiagen)中，在干冰上快速冷冻。然后使用孔提取试剂盒(Qiagen)根据制造商的说明分离RNA。使用2-96A型Kleco^TM组织粉碎机(Garcia Manufacturing)破坏组织。
RNA定量使用NanoDrop^TM8000分光光度计(Thermo Scientific,Wilmington,DE)对最终的mRNA进行定量。在加载并定量4μL未稀释的样品之前，用4μL不含RNA酶的水对各孔测空白。使用标准的RNA核酸测量方法由NanoDrop^TM8000软件估算mRNA的浓度。mRNA用无RNA酶的水手动稀释到～83ng/μL。
cDNA制备使用RT试剂盒(Qiagen,Carlsbad,CA)按照制造商的使用说明，从稀释的mRNA制备cDNA。每个反应使用1μg总mRNA。完成时，将cDNA保存于-20℃，直至分析完成。
RT-PCR使用两个DNA水解探针测定，它们均类似于测定，对在潮霉素上选出的事件进行gus基因转录水平分析。使用序列特异性引物和探针估计每个单独事件的gus mRNA的稳态水平。用一个烟草内参基因BYEEF(Genbank登录号No.GI:927382)的mRNA的稳态水平将mRNA标准化。使用探针设计软件2.0(Roche Applied Science)设计用于这两个基因的测定。使用系统(Roche Applied Science)实施这两个基因的实时定量PCR。为了gus扩增，在10μL体积的含有0.4μM每种引物和0.2μM每种探针的多重反应中以1X终浓度准备Probe Master Mix。表3。
实施两步扩增反应，56℃延伸40秒，并进行荧光获取。所有样品运行3个重复，使用平均Ct值分析每个样品。为了BYEEF扩增，在10μL体积的含有0.25μM每种引物(表3)和0.1μM UPL 119探针(Roche Applied Science)的多重反应中以1X终浓度准备Probe Master Mix。实施两步扩增反应，58℃延伸25秒，并进行荧光获取。所有样品以1:10稀释运行3个重复，使用平均Ct值分析每个样品。使用软件通过相对定量模块，并根据ΔΔCt方法，进行实时定量PCR数据的分析。然后比较不同植物转录激活物处理的相对表达水平。图29。
表3.同时在gus和BYEEF水解探针(HP)测定中使用的引物和探针的序列

结果
图29显示了用BYEEF内源基因表达水平标准化的、不同植物反式激活互作基序的gus转录本水平的最终比例。将来自这些不同植物反式激活互作基序对gus基因的活化与空载体对照和VP16反式激活结构域的亚结构域II的互作基序进行比较。与VP16反式激活物的亚结构域II相比，几种植物反式激活互作基序显示了出乎意料的高表达水平。例如，PTI4,DREB1A,ERF2,和CBF1植物反式激活互作基序比VP16转录激活结构域的亚结构域II表达更多的gus mRNA。
由植物反式激活互作基序产生的mRNA水平，就以修饰变体(v2)与天然版本(v3)相比较而言，在各种植物反式激活互作基序中有所不同。ERF2植物反式激活互作基序的修饰版本比ERF2天然序列互作基序产生显著更多的gus mRNA。类似地，经过修饰的CBF1植物反式激活互作基序比CBF1天然序列互作基序产生显著更多的gus mRNA。相反，在PTI4和DREB1A反式激活互作基序中引入的修饰导致所产生的gus mRNA水平比天然版本PTI4和DREB1A反式激活互作基序低。
实施例5：含有GAL4报告构建体的烟草中的互作基序功能
含有由GAL4结合结构域构成的报告构建体的烟草品系
使用下面描述的策略构建报告构建体pGalGUS。从头合成(IDT)酵母GAL4结合序列的6个串联重复和23bp的间隔区(如在Baleja et al.(1997)J.Biomol.NMR 10:397-401中所述)，并添加SacII位点以方便克隆。将6X Gal4结合位点迁移到SacII片段上，并用它代替来自预先存在的入门载体的Z6结合位点，入门载体同样用SacII消化过。此克隆步骤将GAL4结合位点置于驱动gus基因表达的拟南芥肌动蛋白2启动子的直接上游。使用含有用于植物选择的拟南芥泛素10启动子-pat基因表达盒的目的载体通过转化反应产生了最终的转化载体，pGalGUS(图30)。最终的转化载体通过测序确认，并转化到根癌土壤杆菌菌株LBA4404(Invitrogen)中。
通过土壤杆菌介导用pGALGUS转化烟草
使用上述的方案制作转基因报告植物。见“通过土壤杆菌介导用pDAB9897转化烟草”。
报告事件的拷贝数和PTU分析
利用拷贝数分析产生并鉴定低复杂度拷贝数、-抗性转基因植物。通过PCR分析确定，在低复杂度事件中有一个子集显示完整的PTU。通过Southern印迹分析对这些事件进行进一步的分析。在Southern印迹分析之后，选出至少一个单拷贝、完整PTU的事件，并在温室中生长至成熟，并让其自花授粉。收集T₁种子，表面灭菌，并萌发。通过pat拷贝数分析进行合子型筛选后，选出纯合的T₁植物，在温室中生长至成熟，并允许自花授粉。然后收集T₂种子，表面灭菌，并萌发(如前所述)，并使用这些种子产生用于激活因子试验的报告植物。
植物GAL4转录激活物表达构建体
构建了含有变体或天然植物反式激活互作基序的植物GAL4转录激活物构建体。对实施例4(“植物ZFP-植物转录激活物表达构建体”)中所述的植物ZFP-转录激活物表达构建体进行修饰，插入GAL4结合蛋白质的多核苷酸序列代替锌指结合蛋白的多核苷酸序列。插入为半子叶(hemicot)植物优化过的GAL4DNA结合结构域的多核苷酸序列(Keegan et al.(1986)Science231(4739):699-704)来代替锌指结合蛋白的多核苷酸序列，作为一个NcoI/BamHI片段。该步骤一旦完成，则GAL4转录激活物构建体被置于组成型木薯叶脉花叶病毒启动子的控制下，并用来自根癌土壤杆菌的ORF233’UTR终止。用含有用于植物筛选的拟南芥泛素3-HptII盒的目标载体通过转化，产生了最终的双元转化载体。最终的转化载体通过测序确认，并转化到根癌土壤杆菌菌株LBA4404(Invitrogen)中。
为了产生含有植物GAL4-转录激活物构建体的植物事件，使用如实施例4中所述的瞬时转化方案。为16个GAL4-转录激活物构建体的每一个产生了总共20-30个植物事件。
gus表达分析
使用DNA水解探针测定对用潮霉素选出的事件进行gus基因转录本水平分析。使用序列特异性引物和探针估计每个单独事件的gus mRNA的稳态水平。用烟草内参基因(例如BYEEF)的mRNA稳态水平将每个事件的mRNA标准化。使用实施例4中所述的方案为两个基因设计测定法。使用软件，利用相对定量模块，并根据ΔΔCt方法，对实时定量PCR数据进行分析。比较不同激活因子构建体的相对表达水平。这些结果表明，可以使用植物反式激活互作基序和这些植物反式激活互作基序的工程化变体作为转录激活物，并可以和GAL4结合蛋白质融合，用于基因的转录激活。
实施例6：互作基序在含有TAL报告构建体的烟草中的功能
含有由TAL结合结构域构成的报告构建体的烟草品系
使用下面描述的策略构建报告构建体pTalGUS。从头合成(IDT)从AVRBS3-可诱导基因的共有结合序列获得的8个串联重复序列(TATATAAACCTNNCCCTCT(SEQ ID NO:99))，称为UPA DNA结合结构域(Kay et al.(2009)Plant J.59(6):859-71)，添加SacII位点以方便克隆。将8X UPA结合位点迁移到SacII片段上，并用其代替来自预先存在的同样用SacII消化的入门载体的Z6结合位点。此克隆步骤将所述UPA结合位点置于驱动gus基因表达的拟南芥肌动蛋白2启动子的直接上游。最终的转化载体，pTalGUS，使用含有用于植物筛选的拟南芥泛素10启动子/pat基因表达盒的目的载体通过转化反应产生(图31)。最终的转化载体通过测序确认，并转化到根癌土壤杆菌菌株LBA4404(Invitrogen)中。
通过土壤杆菌介导用pTALGUS转化烟草
使用上述的规程制作转基因报告植物。见“通过土壤杆菌介导用pDAB9897转化烟草”。
报告事件的拷贝数和PTU分析
利用拷贝数分析来产生并鉴定低复杂度拷贝数、-抗性转基因植物。在低复杂度事件中，通过PCR分析，确定一个子集显示完整的PTU。通过Southern印迹分析对这些事件进行进一步的分析。Southern印迹分析之后，选出至少一个单拷贝、完整PTU的事件，并在温室中生长至成熟，并允许其自花授粉。收集T₁种子，表面灭菌，并萌发。通过pat拷贝数分析进行合子型筛选后，选出纯合的T₁植物，在温室中生长至成熟，并允许自花授粉。然后收集T₂种子，表面灭菌，并萌发(如前所述)，并用于产生用于激活因子测试的报告植物。
植物TAL4转录激活物表达构建体
构建了含有变体或天然植物反式激活互作基序的植物TAL4转录激活物构建体。对实施例4中所述的植物ZFP-转录激活物表达构建体进行修饰，插入一个TAL4结合蛋白质的多核苷酸序列来代替锌指结合蛋白的多核苷酸序列。从头合成DNA结合所需要的17.5TAL重复序列，并与玉米Opaque-2细胞核定位序列(Van Eenennaam et al.(2004)Metabolic Engineering 6:101-8)融合。与对UPA-框共有序列的预测一致，每个结构域的序列在可变残基(12和13位)处使用不同的氨基酸，以控制DNA结合。Boch et al.(2009)Science326(5959):1509-12。插入半子叶(hemicot)植物优化的TAL4DNA结合结构域的多核苷酸序列代替锌指结合蛋白的多核苷酸序列，作为一个NcoI/BamHI片段。当该步骤完成时，TAL4转录激活物构建体被置于组成型木薯叶脉花叶病毒启动子的控制下，并以来自根癌土壤杆菌的ORF233’UTR终止。用含有用于植物筛选的拟南芥泛素3-HptII盒的目标载体通过转化，产生了最终的双元转化载体。最终的转化载体通过测序确认，并转化到根癌土壤杆菌菌株LBA4404(Invitrogen)中。
为了产生含有植物TAL4-转录激活物构建体的植物事件，使用如实施例4中所述的瞬时转化方案。为16个GAL4-转录激活物构建体的每一个产生了总共20-30个植物事件。
gus表达分析
使用DNA水解探针测定对用潮霉素选出的事件进行gus基因转录本水平分析。使用序列特异性引物和探针估计每个单独事件的gus mRNA的稳态水平。用烟草内参基因(例如BYEEF)的mRNA稳态水平将每个事件的mRNA标准化。使用实施例4中所述的方案为两个基因设计测定方法。使用软件，利用相对定量模块，并根据ΔΔCt方法，对实时定量PCR数据进行分析。比较不同激活因子构建体的相对表达水平。

资源描述

《植物反式激活互作基序及其用途.pdf》由会员分享，可在线阅读，更多相关《植物反式激活互作基序及其用途.pdf（117页珍藏版）》请在专利查询网上搜索。

1、10申请公布号CN104202966A43申请公布日20141210CN104202966A21申请号201380017031122申请日2013020161/594,24520120202USA01H5/00200601C07K19/00200601C12N15/62200601C12N15/8220060171申请人陶氏益农公司地址美国印第安纳州72发明人J皮托利诺J李SL伊文思RC布卢74专利代理机构北京市嘉元知识产权代理事务所特殊普通合伙11484代理人张永新54发明名称植物反式激活互作基序及其用途57摘要本公开涉及用于提高感兴趣的多核苷酸的表达的组合物和方法。一些实施方案涉及已经在植。

2、物中被鉴定的新型反式激活多肽及其变异体，和使用它们的方法。具体的实施方案涉及在融合蛋白中使用至少一个DNA结合多肽，用于将至少一个反式激活多肽或其变异体靶定在包含感兴趣的多核苷酸的核酸的特定结合位点上，从而提高其表达。30优先权数据85PCT国际申请进入国家阶段日2014092686PCT国际申请的申请数据PCT/US2013/0244522013020187PCT国际申请的公布数据WO2013/116731EN2013080851INTCL权利要求书4页说明书41页序列表41页附图30页19中华人民共和国国家知识产权局12发明专利申请权利要求书4页说明书41页序列表41页附图30页10申请公。

3、布号CN104202966ACN104202966A1/4页21一种人造转录激活物融合蛋白，其包含DNA结合多肽；和选自SEQIDNO1058的反式激活结构域互作基序多肽。2权利要求1的人造转录激活物融合蛋白，其中所述DNA结合多肽选自锌指DNA结合结构域；来自AVRBS3可诱导基因的共有结合序列或从其工程化的人造结合序列；GAL4；TAL；LEXA；TET阻遏物；LACR；和类固醇激素受体。3权利要求1的人造转录激活物融合蛋白，其中该融合蛋白包括至少一个额外的DNA结合多肽。4权利要求1的人造转录激活物融合蛋白，其中该转录激活物融合蛋白包含选自SEQIDNO28和SEQIDNO100120的。

4、氨基酸序列。5权利要求1的人造转录激活物融合蛋白，其中所述反式激活结构域互作基序多肽选自SEQIDNO1016,SEQIDNO22,SEQIDNO28,SEQIDNO34,SEQIDNO40,SEQIDNO46,SEQIDNO52,和SEQIDNO58。6权利要求1的人造转录激活物融合蛋白，其中所述反式激活结构域互作基序多肽选自SEQIDNO17,SEQIDNO23,SEQIDNO29,SEQIDNO35,SEQIDNO41,SEQIDNO47,和SEQIDNO53。7权利要求1的人造转录激活物融合蛋白，其中该反式激活结构域互作基序多肽选自SEQIDNO18,SEQIDNO24,SEQIDNO。

5、30,SEQIDNO36,SEQIDNO42,SEQIDNO48,和SEQIDNO54。8权利要求1的人造转录激活物融合蛋白，其中该反式激活结构域互作基序多肽选自SEQIDNO19,SEQIDNO25,SEQIDNO31,SEQIDNO37,SEQIDNO43,SEQIDNO49,和SEQIDNO55。9权利要求1的人造转录激活物融合蛋白，其中该反式激活结构域互作基序多肽选自SEQIDNO20,SEQIDNO26,SEQIDNO32,SEQIDNO38,SEQIDNO44,SEQIDNO50,和SEQIDNO56。10权利要求1的人造转录激活物融合蛋白，其中该反式激活结构域互作基序多肽选自SE。

6、QIDNO21,SEQIDNO27,SEQIDNO33,SEQIDNO39,SEQIDNO45,SEQIDNO51,和SEQIDNO57。11权利要求1的人造转录激活物融合蛋白，其中该融合蛋白含有至少一个额外的反式激活结构域互作基序多肽。12一种人造转录激活物融合蛋白，当感兴趣的核苷酸序列与第二个核苷酸序列可操作地连接时，该融合蛋白增加该感兴趣的核苷酸序列的表达，该融合蛋白包括DNA结合多肽，其特异性结合所述第二核苷酸序列；和选自下组的蛋白反式激活结构域互作基序多肽SEQIDNO1016,SEQIDNO22,SEQIDNO28,SEQIDNO34,SEQIDNO40,SEQIDNO46,SEQ。

7、IDNO52,和SEQIDNO58。13一种合成的转录激活物融合蛋白，其包含DNA结合多肽；和与选自下组的氨基酸序列具有至少80序列同一性的反式激活结构域互作基序多肽SEQIDNO1016,SEQIDNO22,SEQIDNO28,SEQIDNO34,SEQIDNO40,SEQID权利要求书CN104202966A2/4页3NO46,SEQIDNO52,和SEQIDNO58。14权利要求13的人造转录激活物融合蛋白，其中所述反式激活结构域互作多肽与选自下组的氨基酸序列具有至少85序列同一性SEQIDNO1016,SEQIDNO22,SEQIDNO28,SEQIDNO34,SEQIDNO40,SE。

8、QIDNO46,SEQIDNO52,和SEQIDNO58。15权利要求13的人造转录激活物融合蛋白，其中所述反式激活结构域互作多肽与选自下组的氨基酸序列具有至少90序列同一性SEQIDNO1016,SEQIDNO22,SEQIDNO28,SEQIDNO34,SEQIDNO40,SEQIDNO46,SEQIDNO52,和SEQIDNO58。16权利要求13的人造转录激活物融合蛋白，其中所述反式激活结构域互作多肽与选自下组的氨基酸序列具有至少95序列同一性SEQIDNO1016,SEQIDNO22,SEQIDNO28,SEQIDNO34,SEQIDNO40,SEQIDNO46,SEQIDNO52,。

9、和SEQIDNO58。17一种编码人造转录激活物融合蛋白的核酸，该核酸包含编码DNA结合多肽的第一多核苷酸序列；和编码选自SEQIDNO1058的反式激活结构域互作基序多肽的第二多核苷酸序列，其中所述第一和第二多核苷酸序列自该核酸合框地表达为单一转录本。18权利要求17的核酸，其中该核酸包含至少一个额外的编码DNA结合多肽的多核苷酸序列。19权利要求17的核酸，其中该核酸包含至少一个额外的编码选自SEQIDNO1058的反式激活结构域互作多肽的多核苷酸序列。20权利要求17的核酸，其中所述第一和第二多核苷酸序列与基因调节元件可操作地连接。21权利要求17的核酸，其中所述第一和第二多核苷酸序列与。

10、第三多核苷酸序列可操作地连接。22权利要求17的核酸，其中该核酸整合到宿主细胞的基因组中。23权利要求22的核酸，其中所述宿主细胞是植物细胞。24权利要求17的核酸，其中所述DNA结合多肽选自锌指DNA结合结构域；来自AVRBS3可诱导基因的共有结合序列或从其工程构建的人造结合序列；GAL4；TAL；LEXA；TET阻遏物；LACR；和类固醇激素受体。25权利要求24的核酸，其中所述DNA结合多肽与选自SEQIDNO67、SEQIDNO68和SEQIDNO99的序列特异性结合。26包含权利要求17的核酸的载体。27权利要求26的载体，其中该载体包含选择标志物或筛选标志物。28权利要求26的载体。

11、，其中该载体是植物表达载体。29一种编码人造转录激活物融合蛋白的核酸，该核酸包含编码DNA结合多肽的第一多核苷酸序列；和编码与选自下组的氨基酸序列具有至少80序列同一性的反式激活结构域互作基序多肽的第二多核苷酸序列SEQIDNO28,SEQIDNO1016,SEQIDNO22,SEQIDNO28,SEQIDNO34,SEQIDNO40,SEQIDNO46,SEQIDNO52,SEQIDNO58,和SEQIDNO100120，其中第一和第二多核苷酸序列从该核酸合框地表达为单一转录本。30权利要求29的核酸，其中该核酸包含与选自SEQIDNO8093的核苷酸序列具有权利要求书CN104202966。

12、A3/4页4至少80同一性的核苷酸序列。31权利要求29的核酸，其中该核酸包含与选自SEQIDNO8093的核苷酸序列具有至少85同一性的核苷酸序列。32权利要求29的核酸，其中该核酸包含与选自SEQIDNO8093的核苷酸序列具有至少90同一性的核苷酸序列。33权利要求29的核酸，其中该核酸包含与选自SEQIDNO8093的核苷酸序列具有至少95同一性的核苷酸序列。34权利要求29的核酸，其中该核酸包含与选自SEQIDNO8093的核苷酸序列具有至少97同一性的核苷酸序列。35权利要求29的核酸，其中该核酸包含与选自SEQIDNO8093的核苷酸序列具有至少98同一性的核苷酸序列。36权利要。

13、求29的核酸，其中该核酸包含选自SEQIDNO8093的核苷酸序列。37权利要求29的核酸，其中该DNA结合多肽选自锌指DNA结合结构域、来自AVRBS3可诱导基因的共有结合序列或从其工程构建的人造结合序列；GAL4；TAL；LEXA；TET阻遏物；LACR；和类固醇激素受体。38一种编码人造转录激活物融合蛋白的核酸，该核酸包括至少一个选自下组的核苷酸序列SEQIDNO8093；与SEQIDNO8093中之一基本上相同的核苷酸序列；能够与SEQIDNO8093中的至少一个特异性杂交的多核苷酸的互补物；和能够与SEQIDNO8093中的至少一个特异性杂交的多核苷酸的反向互补物。39一种包含权利要。

14、求17的核酸的细胞。40权利要求39的细胞，其中该细胞是植物细胞或酵母细胞。41一种包含权利要求29的核酸的细胞。42权利要求41的细胞，其中该细胞是植物细胞或酵母细胞。43包含权利要求39的细胞的植物组织、植物部分、植物商业产品或全植物。44包含权利要求41的细胞的植物组织、植物部分、植物商业产品或全植物。45一种用于增加感兴趣的核苷酸序列在宿主细胞中的表达的方法，该方法包括向包含感兴趣的核苷酸序列的宿主细胞中导入权利要求17的核酸，其中所述感兴趣的核苷酸序列与特异性结合DNA结合多肽的第二核苷酸序列可操作地连接，从而增加该感兴趣的核苷酸序列在该宿主细胞中的表达。46根据权利要求45的方法，。

15、其中将核酸导入到宿主细胞中包括将含有该核酸的载体导入到宿主细胞中。47根据权利要求45的方法，其中所述核酸稳定整合到所述宿主细胞的基因组中。48根据权利要求45的方法，其中所述感兴趣的核苷酸序列是外源核苷酸序列。49根据权利要求45的方法，其中所述感兴趣的核苷酸序列是内源核苷酸序列。50根据权利要求45的方法，其中将核酸导入到宿主细胞中包括使包含该核酸的植物与包含宿主细胞的植物杂交。51一种用于增加感兴趣的核苷酸序列在宿主细胞中的表达的方法，该方法包括权利要求书CN104202966A4/4页5向包含权利要求17的核酸的宿主细胞导入感兴趣的核苷酸序列，其中所述感兴趣的核苷酸序列与特异性结合DN。

16、A结合多肽的第二核苷酸序列可操作地连接，从而增加该感兴趣的核苷酸序列在该宿主细胞内的表达。52根据权利要求51的方法，其中将感兴趣的核苷酸序列导入到宿主细胞中包括将包含所述感兴趣的核苷酸序列的载体导入到所述宿主细胞中。53根据权利要求51的方法，其中所述核酸稳定整合到所述宿主细胞的基因组中。54根据权利要求51的方法，其中与所述第二核苷酸序列可操作地连接的所述感兴趣的核苷酸序列稳定整合到宿主细胞的基因组中。55根据权利要求51的方法，其中将感兴趣的核苷酸序列导入到宿主细胞中包括使包含感兴趣的核苷酸序列的植物与含有宿主细胞的植物杂交。56一种用于增加感兴趣的核苷酸序列在宿主细胞内的表达的方法，该。

17、方法包括将权利要求17的核酸导入到包含感兴趣的核苷酸序列的宿主细胞中，其中感兴趣的核苷酸序列与特异性结合DNA结合多肽的第二核苷酸序列可操作地连接，从而增加该感兴趣的核苷酸序列在该宿主细胞中的表达。57一种编码人造转录激活物融合蛋白的核酸，该核酸包括编码DNA结合多肽的第一多核苷酸序列；和编码用于反式激活植物基因表达的手段的第二多核苷酸序列，其中所述第一和第二多核苷酸序列从该核酸合框地表达为单一转录本。58一种用于增加感兴趣的核苷酸序列在宿主细胞中的表达的方法，该方法包括将权利要求57的核酸导入到包含感兴趣的核苷酸序列的宿主细胞中，其中所述感兴趣的核苷酸序列与特异性结合DNA结合多肽的第二核苷。

18、酸序列可操作地连接，从而增加该感兴趣的核苷酸序列在该宿主细胞中的表达。59一种用于增加感兴趣的核苷酸序列在宿主细胞中的表达的方法，该方法包括向包含权利要求57的核酸的宿主细胞中导入感兴趣的核苷酸序列，其中所述感兴趣的核苷酸序列与特异性结合DNA结合多肽的第二核苷酸序列可操作地连接，从而增加该感兴趣的核苷酸序列在该宿主细胞内的表达。60一种核酸，其包含编码选自SEQIDNO121127的反式激活结构域互作基序多肽的核苷酸序列。61能够与权利要求60的核酸特异性杂交的核酸的互补物。62能够与权利要求60的核酸特异性杂交的核酸的反向互补物。63权利要求60的核酸，其中该反式激活结构域互作基序多肽选自。

19、SEQIDNO22；SEQIDNO28；SEQIDNO34；SEQIDNO40；SEQIDNO46；SEQIDNO52；和SEQIDNO58。64一种多肽，包括选自SEQIDNO121127的反式激活结构域互作基序多肽。65权利要求64的多肽，其中所述反式激活结构域互作基序多肽选自SEQIDNO22；SEQIDNO28；SEQIDNO34；SEQIDNO40；SEQIDNO46；SEQIDNO52；和SEQIDNO58。权利要求书CN104202966A1/41页6植物反式激活互作基序及其用途0001优先权声明0002本申请要求获得2012年2月2日提出的系列号为61/594,245、标题为“。

20、植物反式激活互作基序及其用途PLANTTRANSACTIVATIONINTERACTIONMOTIFSANDUSESTHEREOF”美国临时专利申请的利益。技术领域0003本公开涉及植物技术。实施方案涉及多肽例如融合蛋白，其包含来自植物反式激活物的新的或人造的转录因子互作基序。一些实施方案涉及这样的蛋白用来表达感兴趣的核酸或增加感兴趣的核酸的表达的用途。一些实施方案涉及编码含有来自植物反式激活物的新的或合成的转录因子互作基序的蛋白的多核苷酸。具体的实例涉及含有本发明多肽或多核苷酸的宿主细胞、组织和/或生物体。0004背景0005将克隆和分离的基因导入到植物细胞中遗传转化并随后再生转基因植物被广。

21、泛地用于对植物和植物材料进行遗传修饰。对植物进行遗传转化以导入期望的性状例如提高营养品质；增加产量；害虫或疾病抗性；胁迫耐受性；和除草剂抗性，现在已经普遍用于产生可表达期望性状的新的或改良的转基因植物。通常将DNA随机导入到真核植物细胞的细胞核DNA或质体DNA中，然后分离含有整合到细胞DNA中的该DNA的细胞，并用该细胞产生稳定转化的植物细胞。通常，希望通过在单一植物品种中导入多个编码序列，这些编码序列可能含有相似或相同的调节元件，来对该植物品种加以遗传工程构建，使之表达多于一种导入性状。0006转基因内源基因也是如此的表达由涉及多个蛋白质DNA和蛋白质蛋白质互作的机制控制。通过这些互作，核。

22、酸调节元件例如启动子和增强子能够赋予编码序列以组成型或特异性的表达模式。例如，启动子可以导致编码序列在特定组织中、在特定发育时期期间、或应答于环境刺激转录增加。不幸的是，用于转基因表达的常规启动子的固有属性限制了它们可以用于在宿主细胞中发挥表达控制作用的范围。常规的启动子的一个实际限制是难以精细地调节所引入基因的表达水平，原因是由于启动子强度的限制，以及由于启动子特别强或在相同细胞中同时使用同一启动子的多个拷贝，而导致转基因表达沉默。起始或增强内源或自身基因的表达也可能是理想的。0007反式激活物是这样的蛋白质，它们藉由蛋白质蛋白质相互作用招募许多不同的参与DNA转录的蛋白质例如核小体重塑复合。

23、物NUCLEOSOMEREMODELINGCOMPLEXES；中介复合物MEDIATORCOMPLEX；和通用转录因子，如TFIIB,TBP,和TFIIH，通过影响核小体组装/拆卸、前起始复合物的形成、启动子清除、和/或延伸速度来发挥功能。反式激活物与其结合伙伴的蛋白质蛋白质互作涉及反式激活物中称作“反式激活结构域TADS”的离散的内部结构元件。TAD被认为一级序列同源性PRIMARYSEQUENCEHOMOLOGY极小，并且只有在与靶物结合时才采取限定的结构。SIGLER1988NATURE3332102。虽然TAD内的酸性和疏水性残基被认为是重要的见例如CRESSANDTRIEZENBER。

24、G1991SCIENCE说明书CN104202966A2/41页725149898790，但是认为单个残基对活性的贡献不大。HALLANDSTRUHL2002JBIOLCHEM2774604350。0008单纯疱疹病毒体蛋白质16VP16是一种反式激活物，其功能是刺激病毒立即早期基因在被HSV感染的细胞内的转录。与其他反式激活物一样，VP16通过一系列涉及其高度酸性TAD的蛋白质蛋白质相互作用激活转录。VP16的酸性TAD已经显示与多种伙伴蛋白质在体外和体内相互作用。例如，VP16的TAD包含一个互作基序，其与TFIIH的TFB1亚基直接相互作用LANGLOISETAL2008JAMCHEMS。

25、OC13010596604，并且这种相互作用与VP16同时激活病毒立即早期基因的引发和延伸阶段的能力有关。0009公开0010本文描述了已经从植物反式激活物蛋白质中分离出的新型TAD蛋白质蛋白质互作基序，和编码它们的核酸。这些新型互作基序可以用在人造的TAD中为包含该TAD的多肽提供基因调节性能。例如，一些实施方案包括一种转录激活物融合蛋白，其包含DNA结合结构域和这样的TAD多肽。依赖于转录激活物融合蛋白中与TAD融合的具体DNA结合结构域，反式激活可以用于提高感兴趣的基因的表达。例如，可以将与DNA结合结构域结合的异源多核苷酸和感兴趣的基因可操作地连接，从而使该融合蛋白和其功能性TAD导向。

26、，该融合蛋白和其功能性TAD的结合将会提高感兴趣的基因的表达。或者，可以工程构建DNA结合结构域使其结合与感兴趣的基因可操作地连接的、或与之最接近的内源多核苷酸。一旦转录激活物融合蛋白与靶DNA结合位点结合，可能刺激与靶DNA结合位点可操作地连接的基因的转录。0011本文还介绍了人造的变体TAD蛋白质蛋白质互作基序，和编码它们的核酸。在一些实例中，通过在反式激活物例如植物反式激活物的TAD中引入一个或多个突变例如，保守突变，或者在互作基序的直系同源体中鉴定的突变，对人造的变体TAD蛋白质蛋白质互作基序进行工程构建。令人惊讶的是，以这种方式产生的包含变体互作基序的人造变体TAD在与转录激活物融合。

27、蛋白内的DNA结合结构域偶联时，可能提供与未经修饰的TAD不同的基因调节性能。例如，特定的包含变体互作基序的人造变体TAD当在包含DNA结合结构域的融合蛋白中的相同位置表达时，可能提高由天然存在的TAD互作基序赋予的转录激活水平。0012一些实施方案包括人造的转录激活物融合蛋白。在具体的实施方案中，融合蛋白可以增加感兴趣的基因的转录，其中该融合蛋白包含含有DNA结合结构域的第一多肽，第一多肽与包含TAD互作基序的第二多肽可操作地连接。在一些实例中，TAD互作基序可以选自下列TAD互作基序SEQIDNO1016。例如但不限于，TAD互作基序可以包含在含有选自下组的氨基酸序列的TAD中SEQIDN。

28、O28和SEQIDNO100106。在一些实例中，TAD互作基序可以是变体TAD互作基序，其具有，例如但无限制，选自下组的氨基酸序列SEQIDNO1758。例如但不限于，这样的变体TAD互作基序可以包含在含有选自下组的氨基酸序列的TAD中SEQIDNO107120。0013一些实施方案包括一种多核苷酸，其编码人造的转录激活物融合蛋白，该融合蛋白包含含有DNA结合结构域的第一多肽，第一多肽与包含TAD互作基序的第二多肽可操作地连接。DNA结合结构域多肽可以是任何特异性结合特定靶DNA结合位点的DNA结合结构域。例如但不限于，DNA结合结构域多肽可以是选自下组的多肽锌指DNA结合结构域；UPA说明。

29、书CN104202966A3/41页8DNA结合结构域；GAL4；TAL；LEXA；TET阻遏物；LACR；和类固醇激素受体。在特定实例中，DNA结合结构域编码序列可以选自下组SEQIDNO67；SEQIDNO68；和SEQIDNO99。在特定实例中，该多核苷酸可以包含DNA结合性蛋白质编码序列，其与选自SEQIDNO67、SEQIDNO68和SEQIDNO99的序列至少80，85，90，95，98，或100相同。0014在一些实例中，所述多核苷酸可以包含TAD互作基序编码序列，其编码TAD互作基序或变体TAD互作基序，例如，具有选自下组的序列SEQIDNO1058。特定实施方案包括这样的多核。

30、苷酸，其编码转录激活物融合蛋白，该融合蛋白包含至少一个TAD互作基序。特定实施方案包括这样的多核苷酸，其编码含有至少一个DNA结合结构域的转录激活物融合蛋白。0015编码根据本发明一些实施方案的人造转录激活物融合蛋白的多核苷酸的实例包括这样的多核苷酸，其含有至少一个编码DNA结合结构域的核苷酸序列，和至少一个编码TAD互作基序或其变体的核苷酸序列，其中该多核苷酸包括，例如但不限于，至少选自下组的核苷酸序列SEQIDNO7993；与SEQIDNO7993其中之一基本上相同的核苷酸序列；与SEQIDNO7993其中之一具有至少80序列同一性的核苷酸序列；与SEQIDNO7993其中之一具有至少85。

31、序列同一性的核苷酸序列；与SEQIDNO7993其中之一具有至少90序列同一性的核苷酸序列；与SEQIDNO7993其中之一具有至少95序列同一性的核苷酸序列；与SEQIDNO7993其中之一具有至少97序列同一性的核苷酸序列；与SEQIDNO7993其中之一具有至少98序列同一性的核苷酸序列；与SEQIDNO7993其中之一具有至少99序列同一性的核苷酸序列；能够与SEQIDNO7993中的至少一个特异性杂交的多核苷酸的互补物；和能够与SEQIDNO7993中的至少一个特异性杂交的多核苷酸的反向互补物。0016在一些实施方案中，编码转录激活引子融合蛋白的多核苷酸可以纳入重组载体中，目的是例如。

32、在宿主细胞中提供蛋白质的表达。因此，一些实例包括含有至少一个本发明多核苷酸的载体，和/或在其中已导入了这种载体的宿主细胞。0017本文还描述了用于植物基因表达的反式激活的手段MEANS。如本文所使用的，“用于植物基因表达的反式激活的手段”包括选自下组的多肽SEQIDNO10；SEQIDNO11；SEQIDNO14；SEQIDNO15；SEQIDNO22；SEQIDNO28；SEQIDNO46；和SEQIDNO52。在一些实施方案中，含有至少一种用于反式激活植物基因表达的手段的人造蛋白质，可以用于调节植物细胞内的感兴趣的基因的表达。0018此外，本文描述了来源于ERF2的用于增加基因表达的手段。。

33、如本文所使用的，“来源于ERF2的用于增加基因表达的手段”包括选自下组的多肽SEQIDNO1722和SEQIDNO121。另外还描述了来源于PTI4的用于提高基因表达的手段。如本文所使用的，“来源于PTI4的用于增加基因表达的手段”包括选自下组的多肽SEQIDNO2328和SEQIDNO122。另外还描述了来源于ATERF1的用于增加基因表达的手段。如本文所使用的，“来源于ATERF1的用于增加基因表达的手段”包括选自下组的多肽SEQIDNO2934和SEQIDNO123。另外还描述了来源于ORCA2的用于增加基因表达的手段。如本文所使用的，“来源于ORCA2的用于增加基因表达的手段”包括选自。

34、下组的多肽SEQIDNO3540和SEQIDNO124。另外还描述了来源于DREB1A的用于增加基因表达的手段。如本文所使用的，“来源于DREB1A的用于增加基因表达的手段”包括选自下组的多肽SEQIDNO4146和SEQ说明书CN104202966A4/41页9IDNO125。另外还描述了来源于CBF1的用于增加基因表达的手段。如本文所使用的，“来源于CBF1的用于增加基因表达的手段”包括选自下组的多肽SEQIDNO4752和SEQIDNO126。另外还描述了来源于DOF1的用于增加基因表达的手段。如本文所使用的，“来源于DOF1的用于增加基因表达的手段”包括选自下组的多肽SEQIDNO53。

35、58和SEQIDNO127。0019本文还描述了利用人造的转录激活物融合蛋白增加基因表达的方法。在实例中，可以将含有编码人造的转录激活物融合蛋白的多核苷酸的表达载体引入到宿主细胞例如植物细胞、酵母细胞、哺乳动物细胞和永生细胞中，该宿主细胞包含与该融合蛋白的靶DNA结合位点可操作地连接的感兴趣的基因。宿主细胞中融合蛋白的表达，和随后融合蛋白与可操作地连接的靶DNA结合位点的结合，可导致感兴趣的基因的转录起始或转录增加。在特定实例中，可以引入靶DNA结合位点到宿主细胞中，使得该靶DNA结合位点与感兴趣的基因可操作地连接。在进一步的实例中，人造的转录激活物融合蛋白可以包含DNA结合结构域多肽，该多肽。

36、被工程构建而与可操作地连接于感兴趣的基因的靶DNA结合位点结合。0020在一些实施方案中，可以将包含编码人造转录激活物融合蛋白的多核苷酸的载体导入到宿主细胞中，从而使该多核苷酸随后整合到宿主细胞的基因组DNA中例如，通过同源重组。这样，人造的转录激活物融合蛋白，以及编码它的核酸，可以被包含在转基因生物体例如，转基因植物中。因此，本文还记载了这样的转基因生物体。在实例中，编码人造转录激活物融合蛋白的核酸可以在转基因生物体细胞的基因组中随机整合，或者整合在转基因生物体细胞的基因组中的预定位置。0021进一步记载了使用人造转录激活物融合蛋白和/或编码它的核酸表达感兴趣的基因的方法。在一些实施方案中，。

37、可以将包含编码人造转录激活物融合蛋白的多核苷酸的载体引入到宿主细胞中，该宿主细胞包含与该融合蛋白的靶DNA结合位点可操作地连接的感兴趣的基因。在一些实例中，人造的转录激活物融合蛋白包含用于反式激活植物基因表达的手段。当载体被导入到宿主细胞内之后，感兴趣的基因的表达可以起始或增加，从而在宿主细胞中产生感兴趣的基因的表达产物，例如，其表达的量根据融合蛋白的调节控制。这样的表达产物可以根据本领域中已知的任何方法从宿主细胞分离和/或纯化。0022从如下参照附图进行的对一些实施方案的详细说明，前述的特征和其它的特征将更加不言自明。0023附图简述0024图1包括一种已经被鉴定的VP16反式激活结构域TA。

38、D，亚结构域IISEQIDNO9的互作基序。星号指示VP16反式激活结构域，亚结构域II中被人提出与TFIIH的TFB1亚单位直接接触的氨基酸，如LANGLOISETAL2008JAMCHEMSOC13010596604所提出的。0025图2包括VP16反式激活亚结构域II与已经鉴定的植物TAD的比对。0026所列出的植物TAD含有一个互作基序。对齐的互作基序被突出显示。来自VP16的亚结构域II的互作基序中被提出与转录因子接触的残基用星号标示。0027图3包括了比对结果，显示了可以引入到ERF2的TAD互作基序中以产生变体ERF2互作基序的修饰。列出了天然ERF2和VP16互作基序的序列用于。

39、比较。直接接触被突出显示。说明书CN104202966A5/41页100028图4包括了比对结果，显示了可以被引入到PTI4的TAD互作基序中以产生变体PTI4互作基序的修饰。列出了天然PTI4和VP16互作基序的序列用于比较。直接接触被突出显示。0029图5包括了比对结果，显示了可以被引入到ATERF1的TAD互作基序中以产生变体ATERF1互作基序的修饰。列出了天然ATERF1和VP16互作基序的序列用于比较。直接接触被突出显示。0030图6包括了比对结果，显示了可以被引入到ORCA2的TAD互作基序中以产生变体ORCA2互作基序的修饰。列出了天然ORCA2和VP16互作基序的序列用于比较。

40、。直接接触被突出显示。0031图7包括了比对结果，显示了可以被引入到DREB1A的TAD互作基序中以产生变体DREB1A互作基序的修饰。列出了天然DREB1A和VP16互作基序的序列用于比较。直接接触被突出显示。0032图8包括了比对结果，显示了可以被引入到CBF1的TAD互作基序中以产生变体CBF1互作基序的修饰。列出了天然CBF1和VP16互作基序的序列用于比较。直接接触被突出显示。0033图9包括了比对结果，显示了可以被引入到DOF1的TAD互作基序中以产生变体DOF1互作基序的修饰。列出了天然DOF1和VP16互作基序的序列用于比较。直接接触被突出显示。0034图10包括一个酵母整合载。

41、体PHOZBGMEL1的图谱，其含有位于MEL1报告基因上游的HAS高亲和性位点ZFP结合位点。该载体被定向到酿酒酵母HO座位，并含有一个用于在酵母和细菌中选择的KANMX抗性基因。0035图11包括了酵母中MEL1报告基因的表达水平的图示，其是由不同植物反式激活互作基序的激活所导致的。0036图12包括质粒PDAB9897的图谱拟南芥肌动蛋白2启动子，含有8个串联锌指Z6结合位点，位于转录起始位点上游548749个碱基对，驱动用于测试植物反式激活互作基序锌指融合蛋白的GUS报告基因。双元载体也包含拟南芥泛素10启动子，其驱动用于目标报告植物事件产生的PAT选择标志物。0037图13包括质粒P。

42、DAB107881的图谱。0038图14包括质粒PDAB107882的图谱。0039图15包括质粒PDAB107883的图谱。0040图16包括质粒PDAB107884的图谱。0041图17包括质粒PDAB107885的图谱。0042图18包括质粒PDAB107886的图谱。0043图19包括质粒PDAB107887的图谱。0044图20包括质粒PDAB106272的图谱。0045图21包括质粒PDAB106238的图谱。0046图22包括质粒PDAB106273的图谱。0047图23包括质粒PDAB106274的图谱。0048图24包括质粒PDAB106275的图谱。说明书CN1042029。

43、66A106/41页110049图25包括质粒PDAB106276的图谱。0050图26包括质粒PDAB106277的图谱。0051图27包括质粒PDAB106278的图谱。0052图28包括质粒PDAB106279的图谱。0053图29针对不同植物反式激活互作基序的处理，以内源基因表达水平标准化的GUS转录水平的平均值和标准差菱形和四分位数直线和框的图示。将不同植物反式激活互作基序对GUS报告基因的激活与空载体对照以及VP16蛋白质结构域II亚单位的激活进行比较。0054图30包括质粒PGALGUS的图谱6个串联GAL4结合位点与驱动GUS报告基因的拟南芥肌动蛋白2启动子融合，用于测试与GA。

44、L4结合蛋白质融合的植物反式激活因互作基序。双元载体还含有拟南芥泛素10启动子，其驱动的PAT选择标志物，用于目标报告植物事件的产生。0055图31包括质粒PTALGUS的图谱8个串联UPABOX共有结合位点与驱动GUS报告基因的拟南芥肌动蛋白2启动子融合，用于测试与TAL结合蛋白质融合的植物反式激活因互作基序。双元载体还还有拟南芥泛素10启动子，其驱动的PAT选择标志物，用于目标报告植物事件的产生。0056序列列表0057在随附的序列表中列出的核酸序列用标准字母缩写的核苷酸碱基显示，如在37CFR1822中定义的。每个核酸序列显示仅一条链，但是可以理解，通过任意参考所显示的链，互补链亦包含在。

45、其中。在随附的序列表中0058SEQIDNO1显示了含有互作基序下划线的VP16植物反式激活结构域GMTHDPVSYGALDVDDFEFEQMFTDALGIDDFGG0059SEQIDNO2显示了含有互作基序下划线的ERF2植物反式激活结构域NDSEDMLVYGLLKDAFHFDTSSSDLSCLFDFPA0060SEQIDNO3显示了含有互作基序下划线的PTI4植物反式激活结构域CLTETWGDLPLKVDDSEDMVIYGLLKDALSVGWSPFSFTAG0061SEQIDNO4显示了含有互作基序下划线的ATERF1植物反式激活结构域CFTESWGDLPLKENDSEDMLVYGILND。

46、AFHGG0062SEQIDNO5显示了含有互作基序下划线的ORCA2植物反式激活结构域FNENCEEIISPNYASEDLSDIILTDIFKDQDNYEDE0063SEQIDNO6显示了含有互作基序下划线的DREB1A植物反式激活结构域GFDMEETLVEAIYTAEQSENAFYMHDEAMFEMPSLLANMAEGM0064SEQIDNO7显示了含有互作基序下划线的CBF1植物反式激活结构域EQSEGAFYMDEETMFGMPTLLDNMAEG0065SEQIDNO8显示了含有互作基序下划线的DOF1植物反式激活结构域SAGKAVLDDEDSFVWPAASFDMGACWAGAGFAD0。

47、066SEQIDNO9显示了VP16反式激活结构域的亚结构域II，其是SEQIDNO1中的互作基序DDFEFEQMFTD0067SEQIDNO10显示了ERF2植物反式激活结构域互作基序DAFHFDTSSSD说明书CN104202966A117/41页120068SEQIDNO11显示了PTI4植物反式激活结构域互作基序DDSEDMVIYGLLKD0069SEQIDNO12显示了ATERF1植物反式激活结构域互作基序ENDSEDMLV0070SEQIDNO13显示了ORCA2植物反式激活结构域互作基序EDLSDIILTD0071SEQIDNO14显示了DREB1A植物反式激活结构域互作基序EN。

48、AFYMHDEAMFEMP0072SEQIDNO15显示了CBF1植物反式激活结构域互作基序DEETMFGMP0073SEQIDNO16显示了DOF1植物反式激活结构域互作基序EDSFVWPAASFD0074SEQIDNO1722显示了变体ERF2植物反式激活结构域互作基序序列。0075SEQIDNO2328显示了变体PTI4植物反式激活结构域互作基序序列。0076SEQIDNO2934显示了变体ATERF1植物反式激活结构域互作基序序列。0077SEQIDNO3540显示了变体ORCA2植物反式激活结构域互作基序序列。0078SEQIDNO4146显示了变体DREB1A植物反式激活结构域互作。

49、基序序列。0079SEQIDNO4752显示了变体CBF1植物反式激活结构域互作基序序列。0080SEQIDNO5358显示了变体DOF1植物反式激活结构域互作基序序列。0081SEQIDNO5966显示了用于构建质粒PHOZBGMEL1的引物。0082SEQIDNO67显示了Z6DNA结合结构域多核苷酸序列TGTGGTGGGAGAGGAGGGTGG0083SEQIDNO68显示了Z6DNA结合结构域的8X串联重复序列GGTGTGGTGGGAGAGGAGGGTGGGAGTGTGGTGGGAGAGGAGGGTGGCTCTGTGGTGGGAGAGGAGGGTGGAGATGTGGTGGGAGAGGAGGGTGGTCTTGTGGTGGGAGAGGAGGGTGGGGATGTGGTGGGAGAGGAGGGTGGCCTTGTGGTGGGAGAGGAGGGTGGAGGTGTGGTGGGAGAGGAGGGTGGCTTAAGCCGC0084SEQIDNO6974显示了在PAT和PALHP测定中使用的引物和探针。0085SEQIDNO7578显示了用于烟草中PTU的PCR分析的引物。0086SEQIDNO79显示了编码与Z6锌指结合蛋白融合的、来自VP16的天然植物反式激活结构域互作基序的人造核苷酸序列GGCATGACCCATGATCCTGTGTCTTA。

展开阅读全文