FAD3性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白.pdf

上传人:a3 文档编号:169687 上传时间:2018-01-31 格式:PDF 页数:130 大小:14.45MB
返回 下载 相关 举报
摘要
申请专利号:

CN201380058089.0

申请日:

2013.09.05

公开号:

CN105264067A

公开日:

2016.01.20

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):C12N 5/10申请日:20130905|||公开

IPC分类号:

C12N5/10

主分类号:

C12N5/10

申请人:

美国陶氏益农公司; 桑格摩生物科学股份有限公司

发明人:

N·科根; J·福斯特; M·海登; T·索布里奇; G·斯潘根伯格; S·R·韦布; M·古朴塔; W·M·安利; M·J·亨利; J·C·米勒; D·Y·古斯钦

地址:

美国印第安纳州

优先权:

61/697,854 2012.09.07 US; 61/820,260 2013.05.07 US

专利代理机构:

北京坤瑞律师事务所11494

代理人:

罗天乐

PDF下载: PDF下载
内容摘要

公开了一种在FAD3基因座中进行基因编辑或基因堆叠的方法,其是通过以定点的方式剪切细胞FAD3基因中的某一位置,从而在FAD3基因中产生断裂(break),然后在该断裂中连接入与一种或多种感兴趣性状相关的核酸分子。

权利要求书

1.一种修饰细胞的基因组的方法,该方法包括:
以位点特异性方式剪切细胞中的FAD3基因中的靶位点,从而在该FAD3
基因中产生断裂;
其中该FAD3基因在剪切之后被修饰。
2.权利要求1的方法,其中该方法进一步包括向该断裂中整合感兴趣的
核酸序列。
3.根据权利要求1或权利要求2的方法,其中所述FAD3基因是FAD3A,
FAD3A’,FAD3A”,FAD3C,FAD3C”,和/或FAD3C’基因。
4.根据权利要求1-3中任一项的方法,其中位点特异性方式的剪切包括
向细胞内引入融合蛋白或编码融合蛋白的多核苷酸,所述融合蛋白包含DNA
结合结构域以及剪切结构域或剪切半结构域,其中该融合蛋白与所述靶位点
特异性结合,并在靶位点处或其附近进行剪切,从而产生断裂。
5.根据权利要求4的方法,其中该DNA结合结构域选自下组:大范围
核酸酶DNA结合结构域,亮氨酸拉链DNA结合结构域,转录激活因子样
(TAL)DNA结合结构域,RNA指导的CRISPR-Cas9,重组酶,锌指蛋白DNA
结合结构域,和前述者的任何嵌合组合。
6.根据权利要求4或权利要求5的方法,其中该剪切结构域或剪切半结
构域选自下组:来自IIS型限制性核酸内切酶的剪切半结构域,来自FokI
核酸内切酶的剪切半结构域,来自StsI核酸内切酶的剪切半结构域,和归巢
核酸内切酶。
7.根据权利要求4-6中任一项的方法,其中该融合蛋白是锌指核酸酶。
8.根据权利要求7的方法,其中该锌指核酸酶包括3-6个锌指结构域,
每个锌指结构域包括识别螺旋区,其中该锌指蛋白包括在表3的单一行中排
序并显示的识别螺旋区。
9.根据权利要求1-8中任一项的方法,其中位点特异性方式的剪切是对
FAD3A,FAD3A’,FAD3A”,FAD3C,FAD3C”,和/或FAD3C’的一些但非所有
拷贝特异性的。
10.根据权利要求1-9中任一项的方法,其中该靶位点选自下组:SEQID
NO:20-23,SEQIDNO:25-38,SEQIDNO:40-45,SEQIDNO:47和SEQID
NO:49。
11.根据权利要求1-10中任一项的方法,其中该细胞是植物、真菌、细
菌或藻类细胞。
12.根据权利要求11的方法,其中该植物细胞是单子叶植物细胞或双子
叶植物细胞。
13.根据权利要求12的方法,其中该植物细胞选自下组:芸苔属
(Brassicasp.),欧洲油菜(Brassicanapus);芜菁(Brassicarapa);芥菜(Brassica
juencea);甘蓝(Brassicaoleracea);黑芥(Brassicanigra);玉米属(Zeasp.);
玉米(Zeamays);大豆属(Glycinesp.);大豆(Glycinemax);小麦属(Triticumsp);
普通小麦(Triticumaestivum);稻属(Oryzasp.);水稻(Oryzasativa);Triticaesp.;
Triticaetriticum;向日葵属(Heliantheaesp.);向日葵(Heliantheaehelianthus);
棉属(Gossypiumsp.);陆地棉(Gossypiumhirsutum);和大麦(Hordeumvulgar)。
14.根据权利要求2-13中任一项的方法,其中感兴趣的核酸序列选自下
组:包含DNA结合结构域结合靶位点的序列,一个或多个杀虫剂抗性基因,
一个或多个除草剂抗性基因,一个或多个氮使用效率基因,一个或多个水使
用效率基因,一个或多个营养品质基因,一个或多个DNA结合基因,一个
或多个可选择标志物基因,及其组合。
15.一种细胞、种子或植物,其包括根据权利要求1-14中任一项的方法
修饰的细胞。
16.根据权利要求15的细胞、种子或植物,其中该细胞、种子或植物是
转基因的细胞、种子或植物,其包含整合到FAD3A,FAD3A’,FAD3A”,
FAD3C,FAD3C”,和/或FAD3C’基因的一个或多个拷贝中的感兴趣核苷酸序
列。
17.权利要求16的细胞、种子或植物,其中所述核苷酸序列对所述细胞
而言是异源或同源的。
18.权利要求14的细胞、种子或植物,其中该同源序列包含至少一个单
核苷酸多态性。
19.根据权利要求16-18中任一项的细胞、种子或植物,其中该核酸序
列整合到选自下组的靶位点处或其附近:SEQIDNO:20-23,SEQIDNO:
25-38,SEQIDNO:40-45,SEQIDNO:47和SEQIDNO:49。
20.一种位点特异性锌指核酸酶,其在选自下组的核酸靶位点处或其附
近进行剪切:SEQIDNO:20-23,SEQIDNO:25-38,SEQIDNO:40-45,SEQ
IDNO:47和SEQIDNO:49。
21.权利要求20的锌指核酸酶,其中该锌指核酸酶包括3-6个锌指结构
域,每个锌指结构域包含识别螺旋区,其中该锌指蛋白包含在表3的单一行
中排序并显示的识别螺旋区。

说明书

FAD3性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白

相关申请交叉引用

本申请要求获得于2012年9月7日提交的美国临时专利申请No.
61/697,854的优先权,本文通过提述并入其全部内容,且要求获得2013年5
月7日提交的美国临时专利申请No.61/820,260的优先权,本文通过提述并
入其全部内容。

公开领域

本公开一般地涉及用于植物重组技术(例如,用于产生转基因植物)的组
合物和方法。更具体地,本公开涉及植物细胞和植物,它们的基因组中包含
可用于位点特异性地引入任何感兴趣核酸的基因座。

背景

许多植物被外源核酸(例如转基因)遗传转化以引入期望的性状,例如提
高农业价值。可以通过遗传转化提高农业价值的实例包括:提高营养品质,
提高产量,害虫或疾病抗性,干旱和胁迫耐受性,提高园艺品质(例如,改
善色素沉着和/或生长),除草剂抗性,从植物产生工业上有用的化合物和/
或材料,和/或生产药物。将克隆的基因引入到植物细胞中并回收稳定可育的
转基因植物,可用于制造在多个世代中稳定的植物遗传修饰,借此实现对作
物的遗传工程化。

在用于遗传转化和产生转基因植物的方法中,通常将外源DNA随机引
入到真核植物细胞的细胞核或质体DNA中,随后分离含有被整合的外源
DNA的细胞,然后再生被稳定转化的植物。转基因植物通常通过土壤杆菌
介导的转化技术产生。这些技术的成功刺激了其他用于将感兴趣核酸分子引
入到植物基因组内的方法的发展,例如PEG介导的原生质体DNA摄取,基
因枪(微粒轰击),和晶须硅介导的转化。

然而,在所有这些植物转化方法中,引入到植物基因组中的外源核酸被
随机整合到植物细胞的基因组中,并且拷贝数可不预测。Teradaetal.(2002)
NatBiotechnol20(10):1030;Teradaetal.(2007)PlantPhysiol144(2):846;
D'Halluinetal.(2008)PlantBiotechnologyJ.6(1):93。例如,转基因经常以重
复序列的形式被整合,或者是整个转基因或是其部分。这种复杂的整合模式
通常会对整合核酸的表达水平具有不利的影响(例如,由于转录后基因沉默
机制破坏转录的RNA,或者由于诱导整合DNA的甲基化)。同时,整合位
点的位置通常也会影响被整合核酸的表达水平。而且,外源DNA的整合可
能对发生整合的基因组区域产生破坏性影响,由此影响或干扰靶区域的正常
功能,从而产生不良的副作用。上述因素的组合导致转基因或外源DNA的
表达水平(和整体农艺品质)在不同的转基因植物细胞和植物系之间发生很
大的变异,即便是它们是通过相同方法创建的。因为整合是随机的,所以在
从业者试图产生具有期望特征的新植物时,这些影响不能够人为控制。

上述考虑因素致使人们无论在任何时候研究将特定的外源核酸引入到
植物中的效应时,都必须产生和分析大量的转基因植物品系以获得显著的结
果。类似地,在产生含有特定整合核酸的转基因植物以提供具有期望表型的
转基因植物时,必须创建独立创建的转基因植物品系的大群体,以便选择具
有最佳核酸表达并对转基因植物的整体表型和性能具有最小或者没有副作
用的植物品系。在通过插入多个外源核酸(即,基因堆叠)创建转基因植物
时,这些实际的考虑因素具有更大的重要性。在这样的植物中,转录后基因
沉默等现象会增多。

为了控制植物中的转基因插入,已经开发出了多种方法。见例如Kumar
andFladung(2001)TrendsPlantSci.6:155-9。这些方法依赖基于同源重组的
转基因整合,同源重组的转基因整合已经被成功地应用于原核生物和低等真
核生物。Paszkowskietal.(1988)EMBOJ.7:4021-6。然而,直到最近,在植
物中,转基因整合的主导机制仍然依赖于非常规重组(illegitimate
recombination),其几乎不涉及重组DNA链之间的同源性。因此,这个领域
中的主要挑战是检测和选择性产生罕见的同源重组事件,其会被效率高得多
的通过非常规重组实现的整合事件所掩盖。而且,即使实现了对靶向的同源
重组事件的选择性产生和检测,该事件也必须被靶向到宿主基因组的期望位
置处方可实现这一策略的最大利益。

例如,靶向遗传转化的一个推定的好处是,与通过随机整合获得的转化
事件相比,转基因表达在事件与事件之间的变异性降低。另一个推定的好处
是,显著减少在筛选引入核酸、分选转化构建体、和产生有助于在所得转基
因植物中获得期望整体特征的事件中所需的事件数目。实现这些好处所需要
的一个关键因素是鉴定基因组中这样的特定位置,在该位置上转基因性能是
一致的,并且如果可能的话,在该位置上对宿主植物的不利影响被消除或最
小化。

最近,已经有人描述了用于靶向剪切基因组DNA的方法和组合物。这
些靶向剪切事件能够用于,例如,诱导靶向突变,诱导细胞DNA序列的靶
向删除,和促进在预定染色体基因座处的靶向重组和整合。见例如,Urnovet
al.(2010)Nature435(7042):646-51;美国专利公开20030232410;
20050208489;20050026157;20050064474;20060188987;20090263900;
20090117617;20100047805;20110207221;20110301073;2011089775;
20110239315;20110145940;和国际公开WO2007/014275,本文通过提述并
入其全部内容用于所有目的。剪切可以通过使用特异性核酸酶,例如工程化
的锌指核酸酶(ZFN)、转录激活因子样效应物核酸酶(TALEN),或者使用
具有引导特异性剪切的工程化crRNA/tracrRNA(‘单向导RNA’(singleguide
RNA))的CRISPR/Cas系统而发生。美国专利公开No.20080182332描述了
使用非规范(non-canonical)的锌指核酸酶(ZFNs)靶向修饰植物基因组;美国专
利公开No.20090205083描述了植物EPSPS基因座的ZFN介导靶向修饰;
美国专利公开No.20100199389描述了靶向修饰植物Zp15基因座,美国专利
公开No.20110167521描述了靶向修饰参与脂肪酸生物合成的植物基因。此
外,Moehleetal.(2007)Proc.Natl.Acad,Sci.USA104(9):3055-3060描述了使
用设计的ZFN在特定的基因座处靶向添加基因。美国专利公开20110041195
描述了制造纯合二倍体生物的方法。

然而,仍然需要有用于修饰和/或调节植物FAD3基因表达的组合物和方
法,包括产生在FAD3基因座处靶向插入期望转基因的植物。

公开概述

本公开描述了用于调节FAD3基因表达(例如在植物、藻类和真菌中)的
组合物和方法,和这些基因座作为将感兴趣的核酸序列(例如外源核酸序列)
靶向整合到宿主细胞内的位点的用途。在一些实施方案中,宿主细胞可能含
有一个或多个基因组,所述基因组具有一个或多个FAD3序列(例如,同源
物和/或旁系同源物),其中任何一个或全部序列均可被选择性修饰和/或破坏。
在具体的实施例中,本公开描述了欧洲油菜(Brassicanapus)(即欧洲油菜品系
DH12075)中的FAD3A、FAD3A’、FAD3C和FAD3C’基因,以及相应的同源
物或旁系同源物,和它们作为靶向整合感兴趣核酸序列的基因座的用途。如
本文所述,尽管FAD3基因在宿主中参与脂肪酸生物合成,但是它们的修饰
或破坏(例如,通过在FAD3的编码序列中整合外源核酸)出人意料地可能对
所得的宿主生物体没有或者仅有极小的不利影响。

本文还描述了与能够造成FAD3基因座内特定核酸序列的剪切和/或整
合的多肽串联的一个或多个特定FAD3基因座的用途。与能够造成FAD3基
因座内特定核酸序列的剪切和/或整合的多肽串联的一个或多个特定FAD3
基因座的用途的实例包括选自下组的多肽:锌指蛋白,大范围核酸酶,TAL
结构域,RNA引导的CRISPR-Cas9,重组酶,亮氨酸拉链,CRISPr/Cas,和
其他本领域已知的序列。特定的实例包括含有位点特异性DNA结合结构域
多肽和剪切结构域多肽(例如核酸酶)的嵌合(“融合”)蛋白,例如含有锌指多肽
和FokI核酸酶多肽的ZFN蛋白。例如,本文描述了被设计用于结合和诱导
FAD3A,FAD3A’,FAD3C,FAD3C’及其组合中的双链断裂、但不剪切相应的同
源物或旁系同源物的特定ZFN在体外和体内的效力与特异性的演示。在一
些实施方案中,特定的FAD3基因座可以和任何前述多肽一起使用,以造成
感兴趣核酸的位点特异性整合,感兴趣核酸随后在宿主内表达,同时对宿主
的农艺性能的不利影响极小。

在某些方面中,本文描述包括与FAD3基因特异性结合的DNA结合结
构域的多肽。在一些实施方案中,这样的多肽还可以包含核酸酶(剪切)结构
域或半结构域(例如ZFN、重组酶、转座酶或归巢核酸内切酶,包括具有经
过修饰的DNA结合结构域、TAL结构域、TALEN、RNA引导的CRISPR-Cas9
的归巢核酸内切酶),和/或连接酶结构域,使该多肽可以诱导靶向双链断裂,
和/或易化感兴趣核酸在断裂位点的重组。在特定的实施方案中,靶向FAD3
基因座的DNA结合结构域可以是DNA剪切功能结构域。前述的多肽可以
在一些实施方案中用于将外源核酸引入到呈现同源重组的宿主生物体(例如
植物或动物物种)基因组的一个或多个FAD3基因座处。在某些实施方案中,
DNA结合结构域包括具有一个或多个锌指(例如2,3,4,5,6,7,8,9或更多个
锌指)的锌指蛋白,并可以被工程化(是非天然出现的),从而结合FAD3基因
内的任何序列。本文所述的任何锌指蛋白均可以结合靶基因编码序列内或相
邻序列内(例如启动子或其他表达元件)的靶位点。在某些实施方案中,锌指
蛋白结合FAD3基因内的靶位点,例如表4所示。示例FAD3-结合性锌指的
识别螺旋区如表3所示。锌指蛋白的一个或多个组分锌指结合结构域可以是
规范的(C2H2)锌指或非规范的(例如,C3H)锌指(例如,N端和/或C-端锌指可
以是非规范的指)。

本文还描述了用于破坏或编辑FAD3基因的方法。此外本文还描述了通
过根据本发明实施方案的方法产生的遗传修饰的宿主生物体(例如转基因植
物)。在特定的实施例中,通过根据本发明实施方案的方法产生的转基因生
物体可以是,但不限于,藻类、真菌、单子叶植物、双子叶植物,等。

通过参考附图对多个实施方案的详细描述,前述和其他的特征将变得更
加显而易见。

附图简述

图1,子图A-T,显示了使用生成的FAD3基因序列(SEQID
NO:7-12)的序列比对结果。

图2显示了使用Jalviewv2.3根据邻接距离生成的FAD3基因序列的系
统进化树。标记序列的对应如下:FAD3A’/A”在本专利申请全文中被描述为
FAD3A’;单倍型2在本专利申请全文中被描述为FAD3C’;单倍型1在本专
利申请全文中被描述为FAD3C”;单倍型3在本专利申请全文中被描述为
FAD3A”。

图3显示了pDAB107828的质粒图。

图4显示了pDAB107829的质粒图。

图5显示了pDAS000271的质粒图。

图6显示了pDAS000272的质粒图。

图7显示了pDAS000273的质粒图。

图8显示了pDAS000274的质粒图。

图9显示了pDAS000275的质粒图。

图10显示了pDAS000031的质粒图。

图11显示了pDAS000036的质粒图。

图12显示了pDAS000037的质粒图。

图13显示了pDAB107827的质粒图。

图14显示了pDAB107828的质粒图。

图15显示了pDAS000340的质粒图。

图16显示了pDAS000341的质粒图。

图17显示了pDAS000342的质粒图。

图18显示了pDAS000343的质粒图。

图19是显示引物的位置以及它们相对于Fad3C起始和终止密码子的方
位的示意图。子图A显示了用于野生型Fad3C基因座的引物位点位置。子
图B显示了用于确认供体整合的引物位点位置,以及供体在Fad3C基因座
内能够整合的可能方向。

图20,子图A和B,显示了用指示的ZFN和供体质粒修饰后的序列比
对结果。图20A显示了从由ZFN28051-2A-28052所识别的双链断裂处的
pDAS000341的tGFP盒与Fad3C的接点扩增的序列比对。“:”指示了位于
剪切位点处的缺失。SEQIDNO:300至SEQIDNO:313显示在该比对中。图
20B显示了从由ZFN28051-2A-28052和ZFN28053-2A-28054所识别的双链
断裂处的pDAS000343的tGFP盒与Fad3C的接点扩增的序列比对。“:”指
示了位于剪切位点处的缺失。SEQIDNO:314至SEQIDNO:327显示在该比
对中。

图21,子图A和B,显示了从由ZFN28051-2A-28052所识别的双链断
裂处的pDAS000340的hph盒与FAD3C的接点扩增的序列的序列比对。“样
品”是每个被测定的植物的唯一标识。“:”指示了位于剪切位点处的缺失。
图21A显示的是用于5’接点的序列,图21B显示的是用于3’接点的序列。
图21A的比对显示了SEQIDNO:368至SEQIDNO:375。图21B的比对显
示了SEQIDNO:376至SEQIDNO:377。

图22显示了从由ZFN28053-2A-28054所识别的双链断裂处的
pDAS000342的hph盒与FAD3C的接点扩增的序列的序列比对。“样品”是
每个被测定的植物的唯一标识。“:”指示了位于剪切位点处的缺失。图22
显示的是用于3’接点的序列。该比对中显示了SEQIDNO:378至SEQID
NO:379。

图23,子图A和B,显示了从由ZFN28051-2A-28052识别的双链断裂
处的pDAS000340的hph盒与FAD3C的接点扩增的序列的序列比对。“:”
指示了位于剪切位点处的缺失。图23A显示的是用于5’接点的序列,方框(B)
显示的是用于3’接点的序列。图23A的比对显示了SEQIDNO:328至SEQID
NO:334。图23B的比对显示了SEQIDNO:335至SEQIDNO:342。

图24,子图A和B,显示了从由ZFN28053-2A-28054所识别的双链断
裂处的pDAS000342的hph盒与FAD3C的接点扩增的序列的序列比对。“:”
指示了位于剪切位点处的缺失。图24A显示了用于5’接点的序列,图24(B)
显示的是用于3’接点的序列。图24A的比对显示了SEQIDNO:343至SEQID
NO:346。图24B的比对显示了SEQIDNO:347至SEQIDNO:351。

序列表

所示的核酸序列使用核苷酸碱基的标准字母缩写,如37C.F.R.§1.822
所定义的。仅显示了每个核酸序列的一条链,但是可以理解,当提到所示的
链时总是包括了互补链在内。

详细说明

1.若干实施方案的概述

本发明的实施方案建立了一种将外源核酸(例如转基因)靶向整合到宿主
基因组内的方法,该方法除了被整合的核酸所影响的表型之外不会严重不利
地影响宿主的其它表型。一些实施方案可用于将多个核酸“堆叠”在单个宿主
基因组中。这种方法利用了四种相互联系的技术的开发与部署:靶向技术,
其可以用来在特定的基因组DNA位置处引入双链断裂(见,例如Puchtaetal.
(1993)NucleicAcidsRes.21:5034-40;SiebertandPuchta(2002)PlantCell
14:1121-31;D'Halluinetal.(2008)PlantBiotechnol.J.6(1):93-102;Caietal.
(2009)PlantMol.Biol.69(6):699-709;Shuklaetal.(2009)Nature
459(7245):437-41);Shanetal.(2103)NatureBiotechnol.31:686-680;Leetal.
(2013)NatureBiotechnol31:688-691;Nekrasovetal.(2013)NatureBiotechnol.
31:691-693,Ainelyetal.(2013)PlantBiotechnol.J.(8月19日在线发表));递送
技术,其可以用来递送优化的外源(供体)核酸(Bibikovaetal.(2003)Science
300(5620):764);涉及修饰宿主基因(位于同源重组或NHEJ通路中)以增加靶
向供体DNA整合的HDR或NHEJ频率的整合技术;分析工具,用以富集和
表征靶向整合事件;和特定的期望宿主基因组位置(“性能基因座”),它们在
遗传上良好定义并支持基因跨世代的稳定表达,而不会严重不利影响被转化
的宿主生物体。另见美国专利公开20030232410;20050208489;20050026157;
20050064474;20060188987;20090263900;20090117617;20100047805;
20110207221;20110301073;2011089775;20110239315;20110145940;
20080182332;20090205083;20100199389;20110167521。例如,在植物中,
性能基因座是这样的基因座:对该基因座处插入了转基因的植物的农艺或品
质性质的不利影响可以忽略或者不存在。

本文所述的实施方案利用了如下的出人意料的发现,即植物FAD3基因
是靶向插入外源核酸(例如基因;非编码DNA序列,如工程化着陆垫
(EngineeredLandingPad)(ELPs)(美国专利申请12/011,735)和工程化转基因插
入平台(ETIP)(待审美国专利申请No:61/697882);和植物转化单元)的性能基
因座。FAD3基因座在植物中普遍存在的性质,以及在芥花(canola)、玉米、
向日葵、小麦、棉花和大豆中改变或敲除FAD3不会造成农艺学或品质损失
的证据,说明FAD3基因座是多种有商业意义的植物物种中的一大类性能基
因座。

一些实施方案利用FAD3基因座处的位点特异性双链DNA剪切,例如
通过递送并表达靶位点特异性DNA识别和剪切蛋白造成的。在具体的实施
方案中,这种FAD3特异性DNA识别和剪切蛋白可以是,例如但不仅限于,
ZFN;TALEN;RNA引导的CRISPR-Cas9系统,重组酶(例如Cre,Hin,RecA,
Tre,和FLP重组酶);大范围核酸酶,和源自上述任一种或其等同物的工程
化蛋白。剪切还可以使用CRISPR/Cas系统实现,其用工程化的crRNA/tracr
RNA(“单向导RNA”)来引导特异性剪切。在一些实施方案中,这种双链断裂
可以通过供体核酸整合在FAD3性能基因座内的剪切位点处,例如通过同源
介导的修复(HDR)或非同源末端连接(NHEJ),而被修复。

本公开举例说明了FAD3基因座作为性能基因座的用处,例如,通过描
述芥花(欧洲油菜)中的FAD3A或3C基因座,和可用于将外源核酸整合在
FAD3A或3C基因座处的相应的FAD3特异性ZFN。

本发明的实施方案致力于解决本领域许多尚未解决的问题。例如,本文
所述的靶向整合方法的选择性可以减少或者不需要用于消除不良转基因事
件所需要的重复田间试验,这些试验由于所涉及的资源和该区域中繁重的监
管要求而成本高昂。而且,本文所述的靶向DNA插入方法在转基因堆叠过
程中可能特别有益。

尽管可以利用内源FAD3基因座处的固有(native)核苷酸序列来直接靶定
感兴趣的核酸,但是在一些实施方案中,可以首先将核酸靶向到宿主的至少
一个FAD3基因座处,使得其他感兴趣的核酸分子整合到宿主中变得容易。
在其它实例中,可以使用这样的核苷酸序列:其与宿主生物体的位于DNA
识别位点(例如锌指识别位点)之侧翼的固有序列不同源(例如,基本上随机生
成的核酸序列)。

II.术语

如本申请,包括权利要求中使用的,除非上下文中清楚地另有说明,否
则单数和单数形式的术语,例如“一”、“一个”和“该”,包括复数指代物。因
此,例如,称“植物”、“该植物”或“一个植物”也指示多个植物。而且,根据
上下文,使用术语“植物”还指示该植物的在遗传上相似或相同的后代。类似
地,术语“核酸”可以指核酸分子的许多拷贝。类似地,术语“探针”可以指许
多相似或相同的探针分子。

数字范围包括限定该范围的数字,并明确地包括所限定的范围内的每个
整数和非整数分数。除非另外指出,否则本文所用的全部技术和科学术语具
有与本领域普通技术人员所普遍理解的相同的含义。

为了方便审阅本公开所述的各种实施方案,提供了具体术语的如下解释:

分离的:“分离的”生物组分(例如核酸或蛋白质)是与该组分天然存在的
生物体细胞中的其他生物组分(即其它染色体、染色体外DNA和RNA,和
蛋白质)实质分离的、与上述组分分开产生的、或者是从上述组分中纯化出
来的,同时导致组分的化学或功能变化(例如,可以通过断裂将核酸与染色
体的其余DNA连接在一起的化学键从染色体分离该核酸)。被“分离的”核酸
分子和蛋白质包括通过标准纯化方法纯化的核酸分子和蛋白质。该术语还包
括通过在宿主细胞中重组表达而制备的核酸和蛋白质,以及化学合成的核酸
分子、蛋白质和肽。

杂交:如本文关于植物使用的,术语“杂交”或“杂交的”是指通过授粉产
生后代(例如细胞、种子和植物)实现配子融合。该术语既包括有性杂交(即,
一个植物被另一个授粉)也包括自交(即,自花授粉,例如使用来自相同植物
的花粉和胚珠)。

回交:回交方法可用于将核酸序列引入到植物中。这种技术已经被广泛
使用了数十年,用于向植物中引入新的性状。Jensen,N.,Ed.PlantBreeding
Methodology,JohnWiley&Sons,Inc.,1988。在典型的回交方案中,感兴趣的
原始栽培品种(轮回亲本)与携带待转染的感兴趣核酸序列的第二栽培品种
(非回轮亲本)杂交。然后将此次杂交所得的后代再次与轮回亲本进行杂交,
重复这个过程,直至获得如下的植物,其中被转化的植物中除了从非轮回亲
本转移的核酸序列之外,还恢复了轮回植物几乎全部的期望形态和生理特征。

基因渗入:如本文所使用的,术语“(基因)渗入”是指等位基因(或者包含
外源核酸的经修饰等位基因)被传送到某个遗传背景的特定基因座处。在一
些实施方案中,可以通过相同物种的两个亲本之间的有性杂交,其中至少一
个亲本的基因组中具有特定的等位基因形式,来将该特定等位基因传送到至
少一个后代中,从而将该特定等位基因渗入基因座。包含该特定等位基因的
后代可以和具有期望遗传背景的品系反复回交。可以对回交后代选择特定等
位基因形式,从而产生新的品种,其中特定的等位基因形式已被固定在该遗
传背景中。在一些实施方案中,可以通过两个供体基因组之间的重组(例如,
在融合的原生质体中),其中至少一个供体基因组在其基因组中具有特定的
等位基因形式,来实现该特定等位基因的基因渗入。基因渗入可能涉及传送
特定的等位基因形式,其可以是,例如但不仅限于,被破坏的或经过修饰的
等位基因;转基因;PTU;和ELP。

种质:如本文所使用的,术语“种质”是指植物个体、植物群体(例如,植
物品系、品种和家族)、和来自植物或植物群体的克隆的遗传材料。种质可
以是生物体或细胞的一部分,或者它可以从生物体或细胞分出(例如,分离
的)。一般地,种质提供具有特定的分子组成(makeup)的遗传材料,这是植物
遗传性质的基础。如本文所用的,“种质”是指特定植物的细胞;种子;特定
植物的组织(例如,可以生长出新植物的组织);和特定植物的非种子部分(例
如,叶,茎,花粉,和细胞)。如本文所用的,术语“种质”与“遗传材料”同义,
并可用于指代可以繁殖出植物的种子(或其他植物材料)。“种质库”可以指代
不同种子或其它遗传材料(其中每种基因型被唯一地标识)的有序集合,从它
们可以培养出已知的栽培种或者可以产生新的栽培种。

基因:如本文所用的,术语“基因”(或“遗传元件”)可以指具有功能性意
义的可遗传的基因组DNA序列。基因可以是天然核酸,或者整合到基因组
中的核酸。术语“基因”也可用于指,例如但不仅限于,由可遗传的基因组
DNA序列编码的cDNA和/或mRNA。

核酸分子:如本文所用的,术语“核酸分子“可以指核苷酸(即,核糖核苷
酸,脱氧核糖核苷酸,和/或前述任一者的修饰形式)的聚合物形式。本文所
使用的“核酸分子”与“核酸”和“多核苷酸”是同义的。该术语包括RNA、cDNA、
基因组DNA的有义链和反义链,及其合成形式和混合聚合物。该术语包括
任何拓扑构象,包括单链,双链,部分双链体化,三链体化,发夹化,环形
和挂锁构象。核酸分子可以包括天然存在的和经过修饰的核苷酸的任一种或
两种。这样的核苷酸也可以通过天然存在的和/或非天然存在的核苷酸键连接
在一起。

核酸分子可以被化学或生物化学修饰,或者可以含有衍生的核苷酸碱基,
这是本领域技术人员容易理解的。这样的修饰包括,例如但不仅限于:标记;
甲基化;一个或多个天然存在的核苷酸被类似物取代;和核苷酸间修饰(例
如,不带电的连接,例如,甲基膦酸酯,磷酸三酯,氨基磷酸酯,和氨基甲
酸酯;带电荷的连接,例如硫代磷酸酯和二硫代磷酸酯;悬垂部分(pedant
moieties),例如,肽;插层剂,例如,吖啶和补骨脂;螯合剂;烷化剂;和
经过修饰的连接,例如,α-异头核酸)。

外源的:“外源的”分子是指这样的分子:就多核苷酸而言,其核苷酸
序列和/或基因组位置(即基因座)(且就多肽而言,其氨基酸序列和/或细胞定
位而言)不是规定的系统(例如种质、品种、优良品种、和/或植物)所固有的。
在实施方案中,外源的或异源的多核苷酸或多肽可以是人为提供给生物系统
(例如,植物细胞,植物基因,特定的植物物种或栽培品种,和/或植物染色
体)的分子,并且不是该特定生物系统固有的。因此,称某个核酸为“外源
的”,可以表示该核酸来自天然存在的来源之外的来源,或者可以表示该核
酸具有非天然的构型、遗传位置、或者元件布置。

相反,例如,“天然”或“内源”的核酸是这样的核酸(例如,基因),其不
包含除了该核酸通常天然出现的染色体或其他遗传材料中通常存在的那些
核酸元件之外的核酸元件。内源的基因转录本由处于天然染色体基因座处的
核苷酸序列编码,而不是人为提供给细胞的。

可操作地连接:当第一核酸序列与第二核酸序列处于功能关系中时,则
第一核酸序列与第二核酸序列可操作地连接。例如,当启动子影响编码序列
的转录或表达时,启动子与编码序列可操作地连接。当重组产生时,可操作
地连接的核酸序列一般是邻接的,并且在需要连接两个蛋白编码区时,处于
同一阅读框内。然而,可操作地连接的元件不必是邻接的。

启动子:启动子是DNA的某个区域,其一般位于核酸的上游(朝向5'
区域),可增强该核酸的转录。启动子允许适当地激活或抑制与之可操作地
连接的核酸。启动子含有被转录因子识别的特定的序列。这些因子与启动子
DNA序列结合,导致RNA聚合酶的招募,这种酶从核酸的编码区合成RNA。
转化:当载体将核酸分子转移到细胞内时,该载体“转化“或“转导”细胞。当
核酸分子被细胞稳定复制时,无论是通过将该核酸分子纳入到细胞的基因组
中还是通过游离型复制(episomalreplication),细胞被核酸分子“转化“。如本
文所使用的,术语”转化“包括所有能够将核酸分子引入到细胞内的技术。实
例包括但不仅限于:病毒载体转染;质粒载体转化;电穿孔(Frommetal.(1986)
Nature319:791-3);脂质体转染(Felgneretal.(1987)Proc.Natl.Acad.Sci.USA
84:7413-7);显微注射(Muelleretal.(1978)Cell15:579-85);土壤杆菌介导的
转移(Fraleyetal.(1983)Proc.Natl.Acad.Sci.USA80:4803-7);直接DNA摄
取;和微粒轰击(Kleinetal.(1987)Nature327:70)。

引入:如本文所使用的,术语“引入“在指外源核酸转位到细胞内时,是
指使用本领域可得的任何方法将核酸纳入到细胞内。该术语包括核酸引入方
法,包括例如但不仅限于,转染;转化;和转导。

转基因:如本文所使用的,术语“转基因“是指感兴趣的外源核酸编码序
列。例如,转基因可以编码工业上或药学上有用的化合物,或者有利于期望
农艺性状(例如除草剂抗性或害虫抗性)的表达产物。在进一步的实例中,转
基因可以是反义核酸,其中该反义核酸的表达会抑制靶核酸序列的表达。转
基因可以包括与该转基因可操作地连接的调节序列(例如,启动子)。在一些
实施方案中,通过位点特异性靶向引入到FAD3基因座处的感兴趣核酸分子
是转基因。然而,在其他实施方案中,感兴趣的核酸分子可以是PTU,ELP,
ETIP,或者内源核酸序列(例如,其中内源核酸序列的额外外源基因组拷贝
是期望的)。

元件还可以包括编码结构RNA,例如shRNA,的DNA。这种RNA能
够修饰外源或内源基因,包括但不仅限于,影响功能发挥(posting)或赋予除
草剂抗性。

重组:如本文所使用的,术语“重组”是指通过人为干预而改变的材料(例
如,核酸、基因、多核苷酸、和/或多肽)。例如,重组分子的部分或元件的
布置可能不是固有的布置,和/或重组分子的一级序列可能已自其固有序列被
改变,例如为了优化其表达和/或活性。材料可以被改变,从而产生处于其天
然环境或状态中或从其天然环境或状态脱离的重组材料。举一例子,如果某
个核酸的开放阅读框的核苷酸序列已经脱离其天然背景且被克隆到人工的
核酸分子(例如,载体)中,则该开放阅读框是重组的。用于产生重组分子(例
如,重组核酸)的方案和试剂是本领域常见的,并且被常规地使用。术语“重
组”在本文中还可以指包含重组材料的细胞或生物体(例如,含有重组核酸的
植物和/或植物细胞)。在一些实例中,重组生物体是转基因生物体。

载体:如本文所使用的,术语“载体”是指能够将至少一个核酸节段转移
到细胞内的多核苷酸或其他分子。载体可以任选地包含介导载体维持和/或实
现其预期用途的组分/元件(例如,复制必需的序列,赋予药物或抗生素抗性
的基因,多克隆位点,和/或可操作地连接的实现克隆基因表达的启动子/增
强子元件)。载体可以源自,例如质粒、噬菌体,或植物或动物病毒。“克隆
载体”、“穿梭载体”或“亚克隆载体”一般包括易化克隆或亚克隆步骤的可操作
地连接的元件(例如,含有多个限制性核酸内切酶位点的多克隆位点)。

表达载体:如本文所使用的,术语“表达载体”是指这样的载体,其包含
可以易化编码序列在特定宿主生物体中表达的可操作地连接的多核苷酸序
列。例如,细菌表达载体可以易化编码序列在细菌中的表达。类似地,植物
表达载体可以易化编码序列在植物细胞中的表达。易化在原核生物中表达的
多核苷酸序列可以包括,例如但不仅限于:启动子;操纵基因;和核糖体结
合位点。真核表达载体(例如,植物表达载体)可包括,例如,启动子;增强
子;终止信号;和多腺苷酸化信号(以及其它序列),它们一般与在原核表达
载体中所使用的不同。

序列同一性:如本文在两个核酸或多肽序列内容中所使用的,术语“序
列同一性”或“同一性”是指当经过比对两个序列从而在特定的比较窗口上获
得最大的对应度时,两个序列中相同的残基。序列同一性的数值可以通过比
较两个在比较窗口上最佳比对的序列(例如,核酸序列和氨基酸序列)加以确
定,其中与参考序列(其不含有添加或缺失)相比,序列在比较窗口中的部分
可以包含添加或缺失(即,缺口)以实现两个序列的最佳比对。序列同一性可
以被计算为百分比,通过确定两个序列中存在的相同核苷酸或氨基酸残基的
位置的数目,用匹配位置的数目除以比较窗口中的位置的总数,并将结果乘
以100,产生序列同一性的百分比。

用于比对比较序列的方法是本领域众所周知的。在下列文献中描述了各
种程序和比对算法,例如:SmithandWaterman(1981)Adv.Appl.Math.2:482;
NeedlemanandWunsch(1970)J.Mol.Biol.48:443;PearsonandLipman(1988)
Proc.Natl.Acad.Sci.U.S.A.85:2444;HigginsandSharp(1988)Gene73:237-44;
HigginsandSharp(1989)CABIOS5:151-3;Corpetetal.(1988)NucleicAcids
Res.16:10881-90;Huangetal.(1992)Comp.Appl.Biosci.8:155-65;Pearsonetal.
(1994)MethodsMol.Biol.24:307-31;Tatianaetal.(1999)FEMSMicrobiol.Lett.
174:247-50。序列比对方法和同源性计算的详细描述可以在Altschuletal.
(1990)J.Mol.Biol.215:403-10中找到。

美国国家生物技术信息中心(NCBI)的基本局部比对搜索工具(BLASTTM
Altschuletal.(1990))可以用于比对序列,它可以从多个来源获得,包括美国
国家生物技术信息中心(Bethesda,MD),和互联网上,用于和多种序列分析程
序联合使用。关于如何使用这一程序确定序列同一性的描述可以在互联网上
在BLASTTM的“帮助”一节中获得。对于核酸序列的比较,可以采用BLASTTM
(Blastn)程序的“Blast2sequences”功能,使用默认参数。当通过这一方法进行
评估时,与参考序列具有越大相似性的核酸序列将显示越高的百分比同一性。

如本文所使用的,术语“基本上相同的”可以指核苷酸序列超过80%相同。
例如,基本上相同的核苷酸序列可以和参考序列至少85%,至少86%;至少
87%;至少88%;至少89%;至少90%;至少91%;至少92%;至少93%;
至少94%;至少95%;至少96%;至少97%;至少98%;至少99%;或至
少99.5%相同。

基因座:如本文所使用的,术语“基因座“是指基因组上与可测量特征(例
如,性状)相应的位置。在一些实施方案中,特别感兴趣的基因座是FAD3
基因的基因组位置,在该处基因的破坏可降低或消除从野生型基因转录的
mRNA的表达。基因座可以用在Southern杂交或PCR中与该基因座中含有
的独特核苷酸序列杂交的探针来定义。

标志物:如本文所使用的,“标志物”是指这样的基因或核苷酸序列,其
能够用于鉴定可能具有特定等位基因和/或显示特定性状或表型的植物。标志
物可以被描述为给定基因组座位处的变异。遗传标志物可以是短DNA序列,
例如围绕单碱基对变化的序列(单核苷酸多态性,或“SNP”),或者是长序列,
例如微卫星/简单序列重复(“SSR”)。“标志物等位基因”是指特定植物中存在
的标志物版本。如本文所使用的,术语“标志物”可以指植物染色体DNA的
克隆节段(例如,包含FAD3基因座,或经过修饰和/或被破坏的FAD3基因
座的节段),还/或者可以指与植物染色体DNA克隆节段互补的DNA分子。
本领域的普通技术人员会认识到,可以将获得额外的连续核苷酸序列包含在
标志物中的过程重复几乎无限多次(仅受限于染色体的长度),借此沿着该染
色体鉴定其他的标志物。上述标志物的任何变化均可使用在本发明的某些实
施方案中。

在一些实施方案中,种质中转基因或标志物的存在(用“靶”序列表征)可
以通过使用核酸探针(例如寡核苷酸)进行检测。探针可以是DNA分子或
RNA分子。寡核苷酸探针可以合成制备或者通过克隆制备。合适的克隆载
体是本领域技术人员所熟知的。RNA探针可以通过本领域已知的手段合成,
例如使用DNA分子模板。

寡核苷酸探针可以是带标记的或者无标记的。用于标志物核酸分子的技
术有很多,包括例如但不仅限于,通过切口平移的放射标记;随机引发;和
用末端脱氧转移酶(terminaldeoxytransferase)加尾(tailing),其中所用的核苷酸
是带标记的,例如带放射性32P标记。其他可以使用的标记物包括,例如但
不仅限于,荧光团;酶;酶底物;酶的辅助因子;和酶抑制剂。或者,作为
使用自身提供或者与其它反应试剂联合提供可检测信号的标记物的替代手
段,可以使用能结合受体的配体,其中受体被标记(例如,被上述的标记物
所标记),从而自身提供或者与其他试剂一起提供可检测信号。参见,例如,
Learyetal.(1983)Proc.Natl.Acad.Sci.USA80:4045-9。

探针可以是被检测的转基因或标志物的精确拷贝。探针也可以是这样的
核酸分子,其包含与包含待检测的转基因或标志物的染色体DNA克隆节段
基本上相同的核苷酸序列,或者由这样的核苷酸序列构成。探针可以进一步
包括额外的核酸序列,例如启动子;转录信号;和/或载体序列。

探针可以包含靶核苷酸序列的全部或一部分和来自基因组的额外的邻
接核苷酸序列。这在本文中被称作“邻接探针”。上述额外的邻接核苷酸序列
是指原始靶的“上游”或“下游”,这取决于来自染色体的邻接核苷酸序列位于
原始靶的5’侧还是3’侧,如常规上所理解的。探针还可以包含不与原始靶邻
接的核苷酸序列;这种探针在本文中被称作“非邻接探针”。非邻接探针可以
定位于和染色体上的原始靶序列足够接近的位置,使得该非邻接探针与原始
标志物或转基因连接。

在一些实施方案中,探针是与待检测的靶的精确拷贝“能够特异性杂交”
或“特异性互补”的核酸分子。术语“能够特异性杂交”和“特异性互补”表示有
足够程度的互补性,使得核酸分子和靶之间发生稳定而特异的结合。核酸分
子不需要与其靶序列100%互补才能特异性杂交。当存在足够程度的互补性
从而避免在期望特异性结合的条件下,例如在严格的杂交条件下,发生核酸
与非靶序列的非特异性结合时,核酸分子是能够特异性杂交的。

导致特定严格度的杂交条件将随着所选杂交方法的性质和杂交核酸序
列的组成和长度而改变。一般地,杂交温度和杂交缓冲液的离子强度(尤其
是Na+和/或Mg++浓度)将决定杂交的严格度,尽管清洗时间也会影响严格
度。获得特定严格程度所需的杂交条件的计算是本领域普通技术人员已知的,
并且在下列文献中有讨论,例如,Sambrooketal.(ed.)MolecularCloning:A
LaboratoryManual,2nded.,vol.1-3,ColdSpringHarborLaboratoryPress,Cold
SpringHarborNY.,1989,第9和11章;和HamesandHiggins(eds.)Nucleic
AcidHybridization,IRLPress,Oxford,1985年。关于核酸杂交更详细的说明
和指导可以在下列文献中找到,例如,Tijssen,“Overviewofprinciplesof
hybridizationandthestrategyofnucleicacidprobeassays,”其汇编在
LaboratoryTechniquesinBiochemistryandMolecularBiology-Hybridization
withNucleicAcidProbes,第I部分,第2章中,Elsevier,NY,1993;和Ausubel
等人编辑,CurrentProtocolsinMolecularBiology,第2章,GreenePublishing
andWiley-Interscience,NY,1995。

如本文所使用的,“严格条件”包括只有当杂交分子与DNA靶之间的错
配小于25%时才会发生杂交的条件。“严格条件”包括更具体水平的严格度。
因此,如本文所使用的,“温和(moderate)严格”条件是序列错配超过25%的
分子不会杂交的条件;“中等(medium)严格”条件是序列错配超过15%的分子
不会杂交的条件;“高严格”条件是序列错配超过10%的分子不会杂交的条件。
“极高严格”条件是序列错配超过6%的分子不会杂交的条件。

在特定的实施方案中,严格条件是在如下条件下杂交:65℃于6x盐-
柠檬酸钠(SSC)缓冲液,5xDenhardt溶液,0.5%SDS和100μg剪切的鲑鱼
精DNA,接着在下列缓冲液中顺次清洗15-30分钟:65℃于2xSSC缓冲液
和0.5%SDS,随后是1xSSC缓冲液和0.5%SDS,最后是0.2xSSC缓冲液
和0.5%SDS。

连锁(不)平衡:如本文所使用的,术语“连锁平衡”是指这样的情况,其
中标志物和第二核酸(例如,转基因,PTU,和第二标志物)独立地分离;即,
标志物和第二核酸在后代中随机地组合(sort)。显示连锁平衡的核酸被认为是
不连锁的(无论它们是否位于同一染色体上)。如本文所使用的,术语“连锁不
平衡”是指如下情况,其中标志物和第二核酸以非随机的方式分离;即,核
酸的重组频率小于50%(因此,根据定义,在同一连锁群上的距离小于50cM)。
在一些实施例中,显示连锁不平衡的核酸被认为是连锁的。

连锁,紧密连锁,和极紧密连锁:如本文所使用的,标志物与第二核酸
(例如,转基因,PTU,和第二标志物)之间的连锁可以指这样的现象,其中
染色体上的核酸显示出可测量的一起传递到下一代的个体中的概率。因此,
一个标志物与第二核酸的连锁可以用重组频率来度量和/或表示。两个核酸越
彼此接近,这个概率越接近“1”。因此,术语“连锁”可以指一个或多个基因或
标志物与第二核酸以大于0.5的概率一起传递(这是根据标志物/基因在不同
染色体上的位置的自由组合(independentassortment)而预期的)。当基因(例如,
转基因)的存在有助于个体中的表型时,与该基因连锁的标志物可以被称作
与该表型连锁。因此,术语“连锁”可以指标志物和基因或者标志物和表型之
间的关系。

相对遗传距离(通过杂交频率确定,并以厘摩(cM))度量)通常与两个连
锁标志物或基因在染色体上彼此分离的物理距离(用碱基对度量)成比例。一
厘摩被定义为显示1%重组频率(即,两个标志物在每100次细胞分裂中发生
一次交换事件)的两个遗传标志物之间的距离。一般地,一个标志物与另一
个标志物或基因越接近(无论它们之间的距离是按照遗传距离还是物理距离
度量的),它们连锁得越紧密。因为染色体距离与性状间重组事件的频率大
致成比例,因此存在与重组频率相关的近似物理距离。在这种关联是众所周
知的,或者在主要作物和许多其他生物中可以容易地确定(Helentjarisand
Burr(eds.)(1989)DevelopmentandApplicationofMolecularMarkersto
ProblemsinPlantGenetics.ColdSpringHarborLaboratory,ColdSpring
Harbor,NY;Gresshoff(ed.)(1994)PlantGenomeAnalysis.CRCPress,Boca
Raton,FL;Landeretal.(1987)Genomics1:174-81;Tanksleyetal.(1988)
“Molecularmappingofplantchromosomes,”InChromosomeStructureand
Function.GustafsonandAppels(eds.)PlenumPress,NY,pp.157-73)。例如,1
cM在酵母中对应于大约2.5-3.0kb,在拟南芥中对应于大约140kb,在向日
葵中对应于大约400kb,在桉树中对应于约350kb。

术语“连锁的”在本文中可以指一个或多个显示重组频率小于50%(即,
小于50cM)的核酸。例如,“连锁”的核酸的重组频率可以为大约45%或更低,
大约40%或更低,大约35%或更低,大约30%或更低,大约25%或更低,
大约20%或更低,大约15%或更低,和大约10%或更低。这些核酸在同一染
色体上的物理距离(位于不同染色体上的核酸预期是连锁平衡的)对应于前述
的重组频率,依赖于宿主基因组,并且可以按照上文所提出的容易地进行计
算。

如本文所使用的,术语“紧密连锁”可以指显示大约20%或更低的重组频
率(即,大约20cM或更小)的一个或多个核酸。例如,“紧密连锁的”核酸可
以以22%或更低,大约18%或更低,大约16%或更低,大约14%或更低,
大约12%或更低,大约10%或更低,大约8%或更低,大约6%或更低,大
约4%或更低,和大约2%或更低的频率重组。

如本文所使用的,术语“极紧密连锁”可以指显示大约10%或更低的重组
频率(即,大约10cM或更小)的一个或多个核酸。例如,“极紧密连锁的”核
酸可以以11%或更低,大约9%或更低,大约8%或更低,大约7%或更低,
大约6%或更低,大约5%或更低,大约4%或更低,大约3%或更低,大约
2%或更低,和大约1%或更低的频率的重组。

特定核酸与编码贡献于特定表型的多肽的基因越接近(无论是用遗传距
离还是用物理距离测量),该特定核酸与该表型越紧密连锁。鉴于上述情况
可以理解,与特定基因或表型连锁的核酸包括那些与该基因或表型紧密连锁
的核酸,和那些与该基因或表型极紧密连锁的核酸。在一些实施方案中,特
定核酸与FAD3基因座(例如,经过修饰或被破坏的FAD3基因座)越接近,无
论是用遗传距离还是用物理距离测量,该特定核酸与由整合在该FAD3基因
座处的外源核酸所赋予的任何性状/表型(或者在基因座未修饰的情况下,与
野生型FAD3的表型)的连锁越紧密。因此,与包含整合的外源核酸的FAD3
基因座相连锁、紧密连锁、和/或极紧密连锁的遗传标志物可在MAS程序中
用于鉴定包含整合核酸的生物体(例如,植物或植物品种),鉴定包含由整合
核酸赋予的表型的生物体,和将这种整合核酸和/或由该整合核酸赋予的表型
培育到其他相容的生物体中。

标志物辅助育种:如本文所使用的,术语“标志物辅助育种”可以指直接
针对一个或多个性状(例如多基因性状)培育植物的方法。在当前的实践中,
植物育种者试图鉴定容易检测的性状,例如花的颜色,种皮外观,或者与农
艺上期望的性状相连锁的同工酶变体。然后,植物育种者通过跟踪该容易检
测的性状的分离,在分离和育种群体中跟踪农艺学性状。然而,只有非常少
的这些感兴趣性状与容易检测的性状之间的连锁关系可供用于植物育种。在
本发明的一些实施方案中,标志物辅助育种包括鉴定一个或多个与FAD3基
因座连锁的遗传标志物(例如,SNP,同工酶和/或SSR标志物),其中有利于
感兴趣性状的外源核酸整合在该FAD3基因座中,并通过跟踪该一个或多个
遗传标志物的分离,在分离的育种群体中跟踪感兴趣的性状。在一些实例中,
一个或多个遗传标志物的分离可以用该一个或多个遗传标志物的探针通过
测定来自后代植物的遗传样品中是否存在该一个或多个遗传标志物加以确
定。标志物辅助育种可以为植物栽培品种的改良提供时间上和成本上高效率
的过程。

性状或表型:术语“性状”和“表型”在本文中可互换使用。为本公开的目
的,特别感兴趣的性状包括农艺上重要的性状,例如可以在例如作物植物中
表达的,和转基因表达产物自靶向整合事件的产生。术语“分子表型”可以指
这样的表型,其可以在(一个或多个)分子的群体的水平上被检测到。在一些
实例中,该分子表型可以仅能在分子水平上被检测到。表型的可检测分子可
以是核酸(例如,基因组DNA或RNA);蛋白质;和/或代谢物。例如,分子
表型可以是一个或多个基因产物(例如,在植物发育的特定阶段、或响应于
环境条件或胁迫)的表达谱。

数量性状基因座:由于遗传(加性、显性和上位性)和环境影响而连续变
化的性状通常被称为“数量性状”。数量性状可以根据两个因素区别于“定性”
或“不连续”性状:对基因表达的环境影响,其导致表型的连续分布;和由多
基因遗传产生的复杂分离模式。与数量性状表达相连锁的一个或多个基因组
区域的鉴定将这样的区域定义为数量性状基因座(“QTL”)。

植物:如本文所使用的,术语“植物”是指全植物,来自植物的细胞或组
织培养物,和/或任一前述的任何部分。因此,术语“植物”包括,例如但不仅
限于,全植物;植物组分和/或器官(例如,叶、茎和根);植物组织;种子;
和植物细胞。植物细胞可以是,例如但不仅限于,植物中和/或属于植物的细
胞,从植物分离的细胞,和通过培养分离自植物的细胞而获得的细胞。

“转基因植物”是在其至少一个细胞中包含外源多核苷酸的植物。术语
“转基因”在本文中用于指任何基因型由于外源核酸的存在而被改变的细胞,
细胞系,愈伤组织,组织,植物部分或植物。因此,该术语包括最初被改变
从而包含外源多核苷酸的转基因生物体和细胞,和通过最初的转基因生物体
或细胞的杂交或无性繁殖产生的那些生物体和细胞。如本文所使用的,术语
“转基因”不包括通过常规植物育种方法(例如,单纯非转基因生物体的杂交)
或通过天然出现的事件(例如随机杂交授粉,非重组病毒感染,非重组细菌
转化,非重组转座,和自发突变)引入的基因组(染色体或染色体外)改变。

植物“品系”,“品种”或“株”是一群具有相同家系(parentage)的个体植物。
一个品系的植物在一定程度是近交的,并且一般在大多数遗传基因座(例如,
FAD3基因座)上是纯合的且均质的。“亚系”可以指来自共同祖先的后代的近
交子集,它们在遗传上与来自相同祖先的其他相似的近交子集的后代不同。
在一些实施方案中,“亚系”可以通过这样产生:使在F3-F5代选出的个体转
基因植物的种子近交,直至残余的分离中的基因座(segregatinglocus)在大多
数或全部基因座处均是纯合的。

“结合蛋白”是能够与另一个分子结合的蛋白。结合蛋白能够结合,例如,
DNA分子(DNA结合蛋白),RNA分子(RNA结合蛋白)和/或蛋白质分子(蛋
白质结合蛋白)。在蛋白质结合蛋白的情况下,它能够与自身结合(形成同二
聚体,同三聚体,等),和/或它能够与其他不同蛋白的一个或多个分子结合。
结合蛋白可以具有不止一种类型的结合活性。例如,锌指蛋白具有DNA结
合,RNA结合和蛋白结合活性。

“锌指DNA结合蛋白”(或结合结构域)是通过一个或多个锌指(这是结合
结构域内的氨基酸序列区,其结构通过锌离子配位加以稳定)以序列特异性
的方式结合DNA的蛋白质或较大蛋白内的结构域。术语锌指DNA结合蛋
白通常被缩写为锌指蛋白或ZFP。

“TALEDNA结合结构域”或“TALE”是包含一个或多个TALE重复结构
域/单元的多肽。该重复结构域参与TALE与其关联靶DNA序列的结合。单
一“重复单元”(也称为“重复”)通常长度为33-35个氨基酸,并与天然存在的
TALE蛋白内的其他TALE重复序列显示至少一些序列同源性。

锌指和TALE结合结构域可以被“工程化”以结合预定的核苷酸序列,例
如通过将天然存在的锌指或TALE蛋白的识别螺旋区工程化(改变一个或多
个氨基酸)。因此,工程化的DNA结合蛋白(锌指或TALE)是非天然存在的
蛋白质。用于工程化DNA结合蛋白的方法的非限制性实例是设计和选择。
设计的DNA结合蛋白不是天然存在的蛋白,其设计/组成主要来自合理的标
准。用于设计的合理标准包括采用替换规则和计算机化算法来处理现有ZFP
和/或TALE设计和结合数据的数据库分选信息中的信息。参见,例如,美国
专利6140081;6453242;和6534261;另见WO98/53058;WO98/53059;
WO98/53060;WO02/016536和WO03/016496和美国公开No.20110301073。

“选定的”锌指蛋白或TALE是未在自然界中发现的蛋白,其产生主要来
自经验性方法,例如噬菌体展示,相互作用捕获(interactiontrap)或杂交选择。
参加例如US5,789,538;US5,925,523;US6,007,988;US6,013,453;US
6,200,759;WO95/19431;WO96/06166;WO98/53057;WO98/54311;
WO00/27878;WO01/60970WO01/88197,WO02/099084和美国公开号
No.20110301073。

“剪切”是指DNA分子共价骨架的断裂。剪切可以通过多种方法触发,
包括但不仅限于,磷酸二酯键的酶或化学水解。单链剪切和双链剪切均是可
能的,并且双链剪切可以作为两个迥异的单链剪切事件的结果而发生。DNA
剪切可导致产生平末端或粘末端。在某些实施方案中,融合多肽被用于靶向
的双链DNA剪切。

“剪切半结构域”是这样的多肽序列,其与第二多肽(相同的或不同的)一
道形成具有剪切活性(优选地,双链剪切活性)的复合体。术语“第一和第二剪
切半结构域”、“+和-剪切半结构域”和“右和左剪切半结构域”可互换使用,指
示可二聚体化的剪切半结构域对。

“工程化的剪切半结构域”是指已经被修饰,使其与另一个剪切半结构域
(例如另一个被工程化的剪切半结构域)形成专性(obligate)异二聚体的剪切半
结构域。另见美国专利公开号2005/0064474,20070218528,2008/0131962
和2011/0201055,本文引用其全部内容作为参考。

用于产生双链DNA断裂的手段:如本文所使用的,术语“用于产生双链
DNA断裂的手段”意在援引美国法典第35编第112条(35U.S.C.§112)第六款
中美国国会授权的特殊权利要求规定。具体地,“用于产生双链DNA断裂的
手段”是指一种分子结构,其能够剪切双链DNA分子的两条链。这样的结构
包括在许多已知的核酸酶蛋白中含有的多肽结构域,例如,FokI核酸酶结构
域,选自下组蛋白的催化结构域:Mmel,大肠杆菌素-E7(CEA7_ECOLX),大
肠杆菌素-E9,APFL,EndA,EndoI(END1_EC0LI),人EndoG
(NUCG_HUMAN),牛EndoG(NUCG_BOVIN),R.HinPll,l-Basl,l-Bmol,
l-Hmul,l-Tevl,l-Tevll,l-Tevlll,l-Twol,R.Mspl,R.Mval,NucA,NucM,Vvn,
Vvn_CLS,葡萄球菌核酸酶(NUC_STAAU),葡萄球菌核酸酶(NUC_STAHY),
微球菌核酸酶(NUC_SHIFL),核酸内切酶yncB,脱氧核糖核酸内切酶
(Endodeoxyribonuclease)I(ENRN_BPT7),Metnase,Nb.BsrDI,BsrDIA,
Nt.BspD6l(R.BspD6l大亚基),ss.BspD6l(R.BspD6l小亚基),R.PIel,Mlyl,
Alwl,Mval269l,Bsrl,Bsml,Nb.BtsCI,Nt.BtsCI,Rl.Btsl,R2.Btsl,BbvCI亚基1,
BbvCI亚基2,BpulOIα亚基,BpulOIβ亚基,Bmrl,Bfil,l-Crel,hExol
(EX01JHUMAN),酵母Exol(EX01_YEAST),大肠杆菌Exol,人TREX2,小
鼠TREX1,人TREX1,牛TREX1,大鼠TREX1,人DNA2,酵母DNA2
(DNA2_YEAST)。

用于修复双链DNA断裂的手段:如本文所使用的,术语“修复双链DNA
断裂的装置”意在援引美国法典第35编第112条第六款中美国国会授权的
特殊权利要求规定。具体地,“修复双链DNA断裂的手段”是指一种分子结
构,其能够易化/催化双链DNA分子末端的接合,例如通过接合由单条双链
DNA分子剪切产生的末端,或者通过接合由单条双链DNA分子剪切产生的
一个末端与一个外源双链DNA分子的末端。这样的结构包括许多已知的连
接酶蛋白,例如Cre重组酶中含有的多肽结构域。在一些实例中,同一分子
结构可以同时作为用于产生双链DNA断裂的手段,又作为用于修复双链
DNA断裂的手段,其中同一结构既易化双链DNA分子的剪切,又易化双链
DNA分子的修复(例如,Hin重组酶)。

基因组中位点特异性双链断裂的诱发可诱导宿主植物细胞DNA修复通
路,其通过同源性介导的修复(HDR)或者非同源末端连接(NHEJ)修复恢复双
链断裂。在植物中,科学文献报道,基因或供体DNA到固有基因组位置中
或预先工程化的位置的精确整合涉及这样的输入(incoming)供体DNA构建
体,它们包含不同量的与靶定的双链断裂的侧翼序列同源的序列。此类供体
到特定的靶基因座中的整合可以认为是依赖HDR通路。植物中完全依赖
HDR方法的基因打靶可能是受限的,因为已有报道,与NHEJ相比,HDR
修复通路不是占主导地位的DNA修复通路。在已经出版的利用靶特异性
DNA断裂(ZFN,TALeN,或工程化的大范围核酸酶,等)的植物科学文献中,
NHEJ通路已经被报道用作向基因组中引入特定点突变(插入或删除)的方法。
本文中我们报道,在植物中,在设计为具有0到<10bp的各种同源区域的供
体DNA设计的存在下,可以通过NHEJ修复通路在靶断裂处特异性插入位
点特异性双链断裂(通过ZFN,TALeN等诱导)。多种不同的DNA供体设计具
有零同源性到小的1–10bp范围,从线性到环形,从单链到双链,均可以使
用NHEJ通路被靶向到特定的位置。基于NHEJ的供体DNA的植物基因组
靶向可以是基于“粘末端捕捉”,其中基因组中的由Fok1(或其它II型核酸内
切酶结构域)产生的靶向双链断裂和相应的粘末端在NHEJ供体DNA设计上。
粘末端供体DNA可以作为具有预定突出端的线性供体DNA被直接递送给
细胞。一种替代方法是通过共递送宿主靶ZFN和含有至少一个与靶识别位
点相同的ZFN识别位点的环形DNA供体分子,在体内产生供体DNA粘末
端。至少一个ZFN的表达会切割宿主基因组DNA(固有的或预先工程化的)
和环形供体DNA,从而产生粘末端,粘末端使用宿主的NHEJ修复通路解
析(resolve)。

在供体分子上可能具有一个或多个ZFN切割位点(单独一个ZFN切割位
点用来使整个供体分子线性化,2个同样的ZFN位点用来释放较小的供体
DNA片段,或者2个不同的ZFN位点用来从供体释放一个片段、并从宿主
基因组DNA释放一个对应的片段(DNA替换))。

因此,供体多核苷酸可以是DNA或RNA,单链和/或双链,并能够以
线性或环形形式被引入到细胞中。参见,例如,美国专利公开Nos.
20100047805和20110207221。在本发明的某些实施方案中,还可以包括线
性外源(供体)核酸,包含这些核酸的组合物,和用于制造和使用这些线性供
体分子的方法。在某些实施方案中,线性供体分子在引入线性供体分子的细
胞中稳定保持。在其它实施方案中,线性供体分子被修饰成抵抗外切性核酸
切割(exonucleolyticcleavage),例如通过在供体分子末端的一个或多个碱基对
之间放置一个或多个硫代磷酸酯磷酸二酯键。该线性外源核酸还可以包括单
链的特异DNA。

IV.FAD3性能基因座

命名为FAD3(脂肪酸去饱和酶3)的基因座包含在涉及植物中脂肪酸含
量复杂多基因性状遗传的QTL中。FAD3编码负责将亚油酸(18:2)去饱和为
亚麻酸(C18:3)的酶。Tanhuanpaaetal.(1998)Mol.Breed.4:543-50;Schierholt
etal.(2001)CropSci.41:1444-9。

在植物油生物合成通路中,脂肪酸去饱和酶(FAD)在植物脂质生物合成
中发挥关键作用,并且它们的活性显著影响脂肪酸组成。FAD在植物中丰富,
并且表达分析提示FADmRNA以过量丰度产生。而且,FAD基因在各种组
织和细胞类型,以及包括质体和内质网在内的亚细胞区室中表达。

植物的脂肪酸组成,以及由其产生的油在许多应用中的性能,是由主要
脂肪酸组分——油酸、亚油酸和亚麻酸(C18:3)的相对浓度决定的。这些脂肪
酸的浓度主要受到酶FAD2和FAD3的功能的调节。在植物中,油酸根据下
述过程被转变成亚油酸和亚麻酸:

C18:0→C18:1→C18:2→C18:3

FAD2FAD3

FAD3基因已经在主要植物和藻类物种中被鉴定,包括但不仅限于,玉
米、大豆、棉花、拟南芥、小麦、牧草、水稻、向日葵和芸苔属(Brassica),
并且FAD3表达的修饰可导致这些生物体中的脂肪酸谱的改变。而且,包含
经过修饰的FAD3基因的植物已经被商业化,并且已经有人显示,破坏FAD3
基因能够改良由宿主植物产生的油的营养和功能性质,但不会对宿主植物的
造成农艺学上的损失。例如,已经以商品名(DowAgroSciences,LLC)
被商业化的芥花(canola)和向日葵品种的特征在于,与野生型芥花和向日葵谱
相比,具有较高的油酸、较低的亚油酸和较低的亚麻酸(和较低的饱和脂肪
酸)组成。

在欧洲、北美和澳大利亚种植的主导芥花物种是欧洲油菜,它是一种被
认为是通过甘蓝(B.oleracea)(具有二倍体C基因组)与芜菁(B.rapa)(具有二
倍体A基因组)杂交产生的多倍体油菜物种。细胞基因组研究显示,AA和
CC基因组显示一定程度的亲缘性,彼此部分同源。A和C基因组均含有高
百分比的同源和/或旁系同源基因。因此,有人认为,AA和CC基因组来自
共同的祖先基因组。PrakashandHinata(1980)OperaBotanica55:1-57。尽管
两个祖先物种的基因组在技术上均被归类为二倍体,但是这些基因组含有高
百分比的彼此重复的区域。Songetal.(1991)Theor.Appl.Genet.82:296-304。
详细的细胞器和细胞核RFLP分析显示,芜菁的AA基因组向油菜贡献10
个染色体,而甘蓝从其作为母本供体的CC基因组贡献了9个染色体。Song
etal.(1992)Genome35:992-1001。通过两个祖先基因组中基因组重复的数目,
以及A、B和C基因组之间高百分比的相似性,已经出现了FAD2和FAD3
基因的数个拷贝。实际上,这个事实使得培育具有这些基因的修饰和/或破坏
拷贝的芥花以产生特定的脂肪酸谱变得具有挑战性。

芥花中FAD3的所有已知的功能性基因拷贝均位于A基因组的连锁群
N4上。Scheffleretal.(1997)TAG94(5):583-91;Schierholtetal.(2000)TAG
101(5-6):897-901。更近些时候,已经将芥花的高油酸性状与位于A基因组
上的修饰和破坏的FAD3基因联系起来。美国专利申请公开No.US
2006/0248611A1;Huetal.(2006)“IdentificationandMappingofFAD2and
FAD3MutationsandDevelopmentofAllele-specificMarkersforHighOleicand
LowLinolenicAcidContentsinCanola(BrassicanapusL.),”Plant&Animal
GenomesXIVConference,2006年1月14-18日,2006,SanDiego,CA。失活
性的FAD3等位基因通过减少亚油酸去饱和为亚麻酸而贡献于对油酸含量的
控制。这种高油酸和FAD3性状在欧洲油菜品种(DMS100)中被鉴定,其具有
大约77%的特征性油酸含量。见美国公开No.20060248611。进一步,已经
开发出了用于辅助将Fad3和高油酸性状基因渗入到芥花中的遗传标志物。

可以在植物中修饰和/或破坏FAD3基因座而不会不利地影响植物价值,
而且对于许多目的而言,实际上可以增加其价值,包括改变FAD3表达,改
变油含量/比例,和/或整合和表达期望的转基因。而且,根据FAD基因座在
植物中普遍存在的性质,可以为了至少某些目的在许多物种中修饰和/或破坏
FAD3基因座而不会造成损害,这些物种包括,例如但不仅限于:芥花;大
豆;玉米;小麦;牧草;芸苔属植物;水稻;番茄;大麦;燕麦;高粱;棉
花;和向日葵,以及真菌和藻类。本发明的实施方案包括FAD3基因座,及
其作为性能基因座用于整合外源核酸的用途。已经发现在FAD3基因用作性
能基因座的背景中有数种特征是理想的,在实例中FAD3基因表现出其中至
少一种,包括,例如但不限于:在宿主生物体整个生命周期中具有大体一致
的表达水平;以及,令人惊讶地,供体DNA插入FAD3基因座不会诱发宿
主的品质或健康(fitness)损失。

在本发明的一些实施方案中,至少一个FAD3基因座(例如,FAD3A和/
或FAD3C基因座)被用作外源核酸(例如,包含编码感兴趣多肽的核苷酸序列
的核酸)的位点特异性整合的靶位点。在特定的实施方案中,外源核酸的整
合产生修饰的基因座。例如,外源核酸的整合可以修饰基因座,从而产生被
破坏的(即,失活的)FAD3基因。

在一些实施方案中,FAD3基因座可以包括与选自下组的核苷酸序列的
互补物能够特异性杂交的核苷酸序列:SEQIDNO:20-23,SEQIDNO:25-38,
SEQIDNO:40-45,SEQIDNO:47和SEQIDNO:49。例如,FAD3基因座
可以包括选自下组的核苷酸序列:SEQIDNO:20-23,SEQIDNO:25-38,
SEQIDNO:40-45,SEQIDNO:47和SEQIDNO:49。在一些实施方案中,
FAD3基因座可以包括与选自下组的核苷酸序列基本上相同的核苷酸序列:
SEQIDNO:20-23,SEQIDNO:25-38,SEQIDNO:40-45,SEQIDNO:47和
SEQIDNO:49。例如,在一些实施方案中,FAD3基因座是包含与选自下组
的核苷酸序列具有至少大约85%的同一性的核苷酸序列的FAD3同源物(例
如,直系同源物或旁系同源物):SEQIDNO:20-23,SEQIDNO:25-38,SEQ
IDNO:40-45,SEQIDNO:47和SEQIDNO:49。FAD3同源物可包含这样
的核苷酸序列,其与选自下组的核苷酸序列例如但不仅限于至少80%;至少
85%;至少约90%;至少约91%;至少约92%;至少约93%;至少约94%;
至少约95%;至少约96%;至少约97%;至少约98%;至少约99%;至少
约99.5%;99.6%,99.7%,99.8%和/或至少约99.9%相同:SEQIDNO:20-23,
SEQIDNO:25-38,SEQIDNO:40-45,SEQIDNO:47和SEQIDNO:49。
这样的FAD3同源物对于多种生物而言,可以容易地识别并从本领域技术人
员容易获得的任何完整或部分基因组中分离。

IV.核酸在FAD3基因座处的靶向整合

外源核酸在FAD3基因座处的位点特异性整合可以通过本领域技术人员
已知的任何技术实现。在一些实施方案中,在FAD3基因座处整合外源核酸
包括使细胞(例如,分离的细胞或组织或生物体中的细胞)与包含外源核酸
的核酸分子接触。在实例中,这样的核酸分子可以包括位于外源核酸侧翼的、
易化该核酸分子与至少一个FAD3基因座之间的同源重组的核苷酸序列。在
特定实例中,位于外源核酸侧翼的易化同源重组的核苷酸序列可以和FAD3
基因座的内源核苷酸互补。在特定的实例中,位于外源核酸侧翼的易化同源
重组的核苷酸序列可以和既往整合的外源核苷酸互补。在一些实施方案中,
多个外源核酸可以被整合在一个FAD3基因座处,如在基因堆叠中。

在一些实施方案中,可以通过宿主细胞的内源细胞机构,例如但不仅限
于,内源DNA和内源重组酶,来易化(例如催化)FAD3基因座处的核酸整合。
在一些实施方案中,FAD3基因座处的核酸整合可以被一种或多种提供给宿
主细胞的因子(例如,多肽)所易化。例如,可以提供核酸酶,重组酶和/
或连接酶多肽(或是独立的,或是作为嵌合多肽的一部分),通过使该多肽
与宿主细胞接触或者通过在宿主细胞内表达该多肽来提供。因此,在一些实
例中,可以向宿主细胞中引入包含编码至少一种核酸酶,重组酶和/或连接酶
多肽的核苷酸序列的核酸,该核酸可以与要位点特异性整合到FAD3基因座
处的核酸同时或顺次引入,其中在宿主细胞中,该至少一种核酸酶,重组酶,
和/或连接酶多肽自该核苷酸序列表达。

A.DNA-结合多肽

在一些实施方案中,位点特异性整合可以利用能够识别并结合特定核苷
酸序列(例如宿主生物体基因组中的特定核苷酸序列)的因子来实现。例如,许
多蛋白质包含能够识别并以位点特异性的方式与DNA结合的多肽结构域。被
DNA结合多肽识别的DNA序列可被称为“靶”序列。能够识别DNA并以位
点特异性的方式与之结合的多肽结构域一般可正确折叠并独立地发挥功能,从
而以位点特异性的方式结合DNA,即使是当它表达在与最初分离出该结构域
的蛋白质不同的多肽中也是如此。类似地,被DNA结合多肽识别和结合的靶
序列一般能够被这样的多肽识别并结合,即使是存在于大DNA结构中(例如,
染色体)也是如此,特别是当靶序列所处的位点是已知可溶性细胞蛋白质可以
达到的位点(例如,基因)时。

尽管从自然界中存在的蛋白质中鉴定的DNA结合多肽通常与离散的核
苷酸序列或基序(例如,共有识别序列)结合,但是在本领域中存在并且知晓有
方法来修饰许多这样的DNA结合多肽从而识别不同的核苷酸序列或基序。
DNA结合多肽包括,例如但不仅限于:锌指DNA结合结构域;亮氨酸拉链;
UPADNA结合结构域;GAL4;TAL;LexA;Tet抑制子;LacR;和类固醇
激素受体。

在一些实例中,DNA结合多肽是锌指。单独的锌指基序可以被设计成
靶向并特异性结合多种多样的DNA位点中的任何种。规范的Cys2His2(以及
非规范的Cys3His)锌指多肽通过将α-螺旋插入到靶DNA双螺旋的大沟中来
结合DNA。锌指识别DNA是模块性的;每个指主要与靶中的三个连续碱基
对接触,并由多肽中的少数关键残基介导识别。通过在靶向性核酸内切酶中
包含多个锌指DNA结合结构域,靶向性核酸内切酶的DNA结合特异性可
以被进一步提高(因此,由其赋予的任何基因调节效应的特异性也被提高)。
见例如Urnovetal.(2005)Nature435:646-51。因此,可以工程构建并使用一个
或多个锌指DNA结合多肽,使得引入到宿主细胞中的靶向性核酸内切酶与宿
主细胞基因组内独特的DNA序列相互作用。

优选地,锌指蛋白是非天然存在的,即其是被工程构建为结合所选的靶
位点的。参见,例如Beerlietal.(2002)NatureBiotechnol.20:135-141;Paboet
al.(2001)Ann.Rev.Biochem.70:313-340;Isalanetal.(2001)NatureBiotechnol.
19:656-660;Segaletal.(2001)Curr.Opin.Biotechnol.12:632-637;Chooetal.
(2000)Curr.Opin.Struct.Biol.10:411-416;美国专利Nos.6,453,242;
6,534,261;6,599,692;6,503,717;6,689,558;7,030,215;6,794,136;7,067,317;
7,262,054;7,070,934;7,361,635;7,253,273;和美国专利公开Nos.
2005/0064474;2007/0218528;2005/0267061,本文引用其全部内容作为参考。

与天然存在的锌指蛋白相比,工程化的锌指结合结构域可以具有新的结
合特异性。工程化方法包括,但不仅限于,合理设计和各种类型的选择。合
理设计包括,例如,使用包含三链体(或四链体)核苷酸序列和单个锌指氨基
酸序列的数据库,其中每个三链体或四链体核苷酸序列与结合该特定三链体
或四链体序列的一个或多个锌指氨基酸序列相关。参见,例如共同拥有的美
国专利6,453,242和6,534,261,本文引用其全部内容作为参考。

示例性选择方法,包括噬菌体展示和双杂交系统,在下列文献中被公开:
美国专利5,789,538;5,925,523;6,007,988;6,013,453;6,410,248;6,140,466;
6,200,759;和6,242,568;以及WO98/37186;WO98/53057;WO00/27878;
WO01/88197和GB2,338,237。此外,例如,在共同拥有的WO02/077227
中描述了增强锌指结合结构域的结合特异性。

此外,如这些和其他参考文献所公开的,锌指结构域和/或多指
(multi-fingered)锌指蛋白可以使用任何合适的接头序列,包括例如,长度为5
个或更多个氨基酸的接头,连接在一起。示例性的长度为6个或更多个氨基
酸的接头序列可另见美国专利Nos.6,479,626;6,903,185;和7,153,949。本文
所述的蛋白质可以包含该蛋白的各个锌指之间的合适接头的任意组合。

靶位点的选择;ZFP和用于设计和构建融合蛋白(和编码它们的多核苷
酸)的方法是本领域技术人员已知的,并且在下列文献中有详述:美国专利
Nos.6,140,0815;789,538;6,453,242;6,534,261;5,925,523;6,007,988;
6,013,453;6,200,759;WO95/19431;WO96/06166;WO98/53057;
WO98/54311;WO00/27878;WO01/60970WO01/88197;
WO02/099084;WO98/53058;WO98/53059;WO98/53060;WO02/016536
和WO03/016496。

此外,如这些和其他参考文献所公开的,锌指结构域和/或多指锌指蛋白
可以使用任何合适的接头序列,包括例如长度为5个或更多个氨基酸的接头,
连接在一起。关于长度为6个或更多个氨基酸的示例性接头序列可另见美国
专利Nos.6,479,626;6,903,185;和7,153,949。本文所述的蛋白质可以包含
该蛋白的各个锌指之间的合适接头的任意组合。

在一些实例中,DNA结合多肽是来自GAL4的DNA结合结构域。GAL4
是酿酒酵母中的模块性反式激活因子,但它也可以在许多其他生物体中充当反
式激活因子。参见,例如Sadowskietal.(1988)Nature335:563-4。在这种调节
系统中,编码酿酒酵母半乳糖代谢通路中的酶的基因的表达受到可得的碳源的
严格调节。Johnston(1987)Microbiol.Rev.51:458-76。这些代谢酶的转录控制
由正调节蛋白GAL4和GAL4特异性结合的17bp对称DNA序列(UAS)之间
的相互作用介导。

天然的GAL4包括881个氨基酸残基,分子量为99kDa。GAL4包括功
能性的自主结构域,它们的总活性是GAL4的体内活性的原因。MaandPtashne
(1987)Cell48:847-53);BrentandPtashne(1985)Cell43(3Pt2):729-36。GAL4
的N端65个氨基酸包括GAL4DNA结合结构域。Keeganetal.(1986)Science
231:699-704;Johnston(1987)Nature328:353-5。序列特异性结合要求与DNA
结合结构域中的6个Cys残基配位的二价阳离子的存在。含有配位阳离子的
结构域通过与DNA螺旋的大沟直接接触与17bpUAS每端的保守CCG三链
体相互作用并识别。Marmorsteinetal.(1992)Nature356:408-14。该蛋白的DNA
结合功能使得C端转录激活结构域定位于启动子附近,从而使该激活结构域
能够指导转录。

其他在某些实施方案中可以使用的DNA结合多肽包括,例如但不仅限于,
来自AVRBS3可诱导基因的结合序列;来自AVRBS3可诱导基因或从其工程
化的合成结合序列的共有结合序列(例如UPADNA结合结构域);TAL;LexA
蛋白(见,例如,Brent&Ptashne(1985),同上);LacR(见,例如,Labowet
al.(1990)Mol.Cell.Biol.10:3343-56;Baimetal.(1991)Proc.Natl.Acad.Sci.
USA88(12):5072-6);类固醇激素受体(Elllistonetal.(1990)J.Biol.Chem.
265:11517-121);Tet抑制子(美国专利6271341)和突变的Tet抑制子,其
在四环素(Tc)存在下可结合tet操纵基因序列,但在没有四环素(Tc)时则不结合;
NF-κB的DNA结合结构域;和Wangetal.(1994)Proc.Natl.Acad.Sci.USA
91(17):8180-4中描述的调节系统的组分,其利用GAL4、激素受体以及VP16
的融合物。

在某些实施方案中,在本文所述的方法和组合物中使用的一种或多种核酸
酶的DNA结合结构域包括天然存在的或工程化的(非天然存在)TAL效应物
DNA结合结构域。参见,例如,美国专利公开号20110301073,本文引用其
全部内容作为参考。黄单胞菌属(Xanthomonas)的植物病原细菌已知会在重要
的作用植物中导致多种疾病。黄单胞菌的致病性取决于一个保守的III型分泌
(T3S)系统,该系统向植物细胞内注入超过25种不同的效应物蛋白。这些
注入的蛋白质包括转录激活因子样(TAL)效应物,其模拟植物转录激活因子并
操纵植物转录组(见Kayetal(2007)Science318:648-651)。这些蛋白质包含
DNA结合结构域和转录激活结构域。其中一种最良好表征的TAL效应物是来
自野油菜黄单胞菌叶斑致病亚型(Xanthomonascampestgrispv.Vesicatoria)的
AvrBs3(见Bonasetal(1989)MolGenGenet218:127-136和WO2010079430)。
TAL效应物含有一个由串联重复构成的集中(centralized)结构域,每个重复含
有大约34个氨基酸,其对于这些蛋白质的DNA结合特异性是关键的。此外,
它们含有核定位序列和酸性转录激活结构域(综述见SchornackS,etal(2006)
JPlantPhysiol163(3):256-272)。此外,在植物病原细菌青枯雷尔氏菌
(Ralstoniasolanacearum)中,两个被命名为brg11和hpx17的基因被发现与青
枯雷尔氏菌生物型1菌株GMI1000和生物型4菌株RS1000中的黄单胞菌
AvrBs3家族同源(见Heueretal(2007)ApplandEnvirMicro73(13):
4379-4384)。这些基因的核苷酸序列彼此具有98.9%相同,差异在于在hpx17
的重复结构域中有一个1,575bp的缺失。然而,这两种基因产物与黄单胞菌
AvrBs3家族蛋白的序列同一性小于40%。见例如美国专利Nos.,8,420,782
和8,440,431和美国专利公开No.20110301073。

在其他实施方案中,核酸酶包括CRISPR/Cas系统。CRISPR(成簇的、规
律间隔的短回文重复序列(clusteredregularlyinterspacedshortpalindromic
repeats))基因座编码系统的RNA组件,和cas(CRISPR-相关)基因座,其编码
蛋白质(Jansenetal.,2002.Mol.Microbiol.43:1565-1575;Makarovaetal.,
2002.NucleicAcidsRes.30:482-496;Makarovaetal.,2006.Biol.Direct1:7;
Haftetal.,2005.PLoSComput.Biol.1:e60),构成CRISPR/Cas核酸酶系统的
基因序列。微生物宿主中的CRISPR基因座含有CRISPR-相关(Cas)基因以及
能够编程CRISPR介导的核酸切割特异性的非编码RNA分子元件的组合。

II型CRISPR是最良好表征的系统之一,并以四个顺序的步骤实施靶向
DNA双链断裂。首先,从CRISPR基因座转录两个非编码RNA,前-crRNA
阵列和tracrRNA。第二,tracrRNA与前-crRNA的重复区域杂交,并且介导将
前-crRNA加工成含有单独间隔序列的成熟crRNAs。第三,成熟的
crRNA:tracrRNA复合体指导Cas9靶向DNA,其中靶向DNA通过crRNA上
的间隔子与靶DNA上紧邻前间隔子邻近基序(PAM)的原间隔子(protospacer)
之间的Wastson-Crick碱基配对来实现,这是靶向识别的额外要求。最后,
Cas9介导靶DNA的剪切,从而在前间隔子内产生双链断裂。CRISPR/Cas系
统的活性包括三个步骤:(i)外源DNA序列插入到CRISPR阵列中,以防止
将来的攻击,这个过程称作“适应”,(ii)相关蛋白质的表达,以及阵列的表
达和加工,随后是(iii)对外来核酸的RNA介导的干扰。这样,在细菌细胞中,
多个所谓的‘Cas’蛋白质参与CRISPR/Cas系统的天然功能,并在功能中发挥
作用,例如外源DNA的插入等。

在某些实施方案中,Cas蛋白质可以是天然存在的Cas蛋白的“功能性衍
生物”。天然序列多肽的“功能性衍生物”是指具有与天然序列多肽共同的定
性生物学性质的化合物。“功能性衍生物”包括,但不仅限于,天然序列的片
段,以及天然序列多肽及其片段的衍生物,只要它们具有与相应的天然序列多
肽一样的生物学活性即可。本文构想的生物学活性是功能衍生物将DNA底物
水解成片段的能力。术语“衍生物”涵盖多肽的氨基酸序列变异体、共价修饰、
及其融合体。Cas多肽或其片段的合适衍生物包括,但不仅限于:Cas多肽或
其片段的突变体、融合体、共价修饰。Cas蛋白,包括Cas蛋白质或其片段,
以及Cas蛋白或其片段的衍生物,可以从细胞获得或者化学合成或者通过这
两种方法的组合获得。细胞可以是天然产生Cas蛋白的细胞,或者天然产生
Cas蛋白并被遗传工程化从而以更高的表达水平产生内源Cas蛋白的细胞,或
者天然产生Cas蛋白并被遗传工程化从而从外源引入的核酸产生Cas蛋白的
细胞,其中该核酸编码与内源Cas相同或不同的Cas。在一些情况下,细胞不
天然产生Cas蛋白,并且被遗传工程化从而产生Cas蛋白。

在特定的实施方案中,DNA结合多肽特异性识别并结合包含在宿主生物
体基因组核酸内的靶核苷酸序列。在一些实例中,在宿主基因组中可以发现靶
核苷酸序列的任何数量的离散实例。靶核苷酸序列在生物体的基因组中可以是
罕见的(例如,在基因组中可能存在靶序列的小于约10,约9,约8,约7,
约6,约5,约4,约3,约2,或约1个拷贝)。例如,靶核苷酸序列可以位
于生物体基因组内的独特的位点。各靶核苷酸序列可以,例如但不仅限于,相
对于彼此随机分散在整个基因组中;位于基因组的不同连锁群中;位于相同连
锁群中;位于不同染色体上;位于相同染色体上;位于基因组中在生物体的相
似条件下表达(例如,在同一种,或者在功能上基本上相同的调节因子的控制
之下)的位点处;和位于在基因组中彼此紧邻的位置(例如,靶序列可以包含
在作为串联体被整合到基因座中的核酸内)。

B.靶向核酸内切酶

在特定的实施方案中,特异性识别并结合靶核苷酸序列的DNA结合多肽
可以包含在嵌合多肽中,从而赋予嵌合多肽对靶序列的特异性结合。在实例中,
这样的嵌合多肽可以包括,例如但不仅限于,核酸酶,重组酶,和/或连接酶
多肽,这些多肽如上文所述。包含DNA结合多肽与核酸酶,重组酶,和/或连
接酶多肽的嵌合多肽还可以包括其它的功能性多肽基序和/或结构域,例如但
不仅限于:位于嵌合蛋白中的功能性多肽之间的间隔子序列;前导肽;将融合
蛋白导向到细胞器(例如,细胞核)的肽;被细胞酶剪切的多肽;肽标签(例
如Myc,His等);和其它不干扰嵌合多肽功能的氨基酸序列。

嵌合多肽中的功能多肽(例如,DNA结合多肽和核酸酶多肽)可以是可操
作地连接的。在一些实施方案中,嵌合多肽的各个功能多肽可以通过从这样的
单个多核苷酸表达而可操作地连接,该多核苷酸至少编码彼此对框连接的各功
能多肽,从而产生编码嵌合蛋白的嵌合基因。在替代实施方案中,嵌合多肽的
各个功能多肽可以通过其它方式可操作地连接,例如通过各个独立表达的多肽
的交联。

在一些实施方案中,特异性识别并结合靶核苷酸序列的DNA结合多肽可
以包含在天然的分离的蛋白质(或其突变体)中,其中天然的分离的蛋白质或
其突变体还包括核酸酶多肽(并且还可以包括重组酶和/或连接酶多肽)。这样的
分离的蛋白质的实例包括TALEN,重组酶(例如,Cre,Hin,Tre,和FLP
重组酶),RNA指导的CRISPR-Cas9,和大范围核酸酶。

如本文所使用的,术语“靶向核酸内切酶”(targetingendonuclease)是指包
含DNA结合多肽与核酸酶多肽的分离的天然或工程化蛋白质及其突变体,以
及包含DNA结合多肽与核酸酶多肽的嵌合多肽。任何包含特异性识别并结合
FAD3基因座内包含的靶核苷酸序列(例如,或者是因为该靶序列包含在该基
因座处的天然序列中,或者是因为该靶序列被引入到该基因座中,例如,通过
重组)的DNA结合多肽的靶向核酸内切酶均可以在某些实施方案中使用。

可以在本发明的特定实施方案中使用的嵌合多肽的一些实例包括,但不仅
限于,下述多肽的组合:锌指DNA结合多肽;FokⅠ核酸酶多肽;TALE结
构域;亮氨酸拉链;转录因子的DNA结合基序;以及从例如但不仅限于下述
各项分离的DNA识别和/或剪切结构域:TALEN,重组酶(例如,Cre,Hin,RecA,
Tre,和FLP重组酶),RNA指导的CRISPR-Cas9,大范围核酸酶;和其他本
领域技术人员已知者。具体的实例包括嵌合蛋白,其包含位点特异性DNA结
合多肽和核酸酶多肽。嵌合多肽可以通过本领域技术人员已知的方法进行工程
化,从而改变该嵌合多肽内包含的DNA结合多肽的识别序列,以便将该嵌合
多肽靶向到感兴趣的特定核苷酸序列。

在某些实施方案中,嵌合多肽包含DNA结合结构域(例如,锌指,TAL-
效应物结构域,等)和核酸酶(剪切)结构域。剪切结构域可以是相对DNA
结合结构域为异源的,例如锌指DNA结合结构域与来自核酸酶的剪切结构域,
或者TALENDNA结合结构域与剪切结构域,或者大范围核酸酶DNA结合结
构域与来自不同核酸酶的剪切结构域。异源的剪切结构域可以从任何核酸内切
酶或核酸外切酶获得。可以衍生该剪切结构域的示例性核酸内切酶包括,但不
仅限于,限制性核酸内切酶和归巢核酸内切酶。参见,例如,2002-2003年目
录,NewEnglandBiolabs,Beverly,MA;和Belfortetal.(1997)NucleicAcids
Res.25:3379-3388。其他可切割DNA的酶是已知的(例如,S1核酸;绿豆核
酸酶;胰DNA酶I;微球菌核酸酶;酵母HO核酸内切酶;另见Linn等人(编
辑)Nucleases,ColdSpringHarborLaboratoryPress,1993)。这些酶(或其功能
片段)中的一种或多种可以用作剪切结构域和剪切半结构域的来源。

类似地,剪切半结构域可以从如上所述的任何其剪切活性需要二聚体化的
核酸酶或其部分产生。一般地,如果融合蛋白包含剪切半结构域,则需要两个
融合蛋白用于剪切。或者,可以使用包含两个剪切半结构域的单一蛋白。两个
剪切半结构域可以来自同一核酸内切酶(或其功能片段),或者每个剪切半结
构域可以来自不同的核酸内切酶(或其功能片段)。此外,两个融合蛋白的靶
位点优选地相对彼此如下布置,使得两个融合蛋白与其各自靶位点的结合将剪
切半结构域彼此置于一定的空间取向,该空间取向允许剪切半结构域形成功能
性的剪切结构域(例如通过二聚体化)。因此,在某些实施方案中,靶位点的邻
近边缘被5-8个核苷酸或者15-18个核苷酸所分开。然而,在两个靶位点之间
可以介入任意整数的核苷酸或核苷酸对(例如,2-50个核苷酸对或者更多)。
一般地,剪切位点位于靶位点之间。

限制性核酸内切酶(限制酶)存在于许多物种中,并且能够序列特异性结合
DNA(在识别位点处),并在结合位点处或其附近剪切DNA,从而例如使一个
或多个外源序列(供体/转基因)被整合在该结合(靶)位点处或其附近。某些限制
酶(例如,IIS型)在远离识别位点的地方剪切DNA,并具有可分开的结合和剪
切结构域。例如,IIS型酶FokⅠ催化DNA的双链剪切,剪切位点在一条链上
位于距其识别点位点达9个核苷酸处,而在另一条链上位于距其识别位点13
个核苷酸处。参见,例如,美国专利5,356,802;5,436,150和5,487,994;以及
Lietal.(1992)Proc.Natl.Acad.Sci.USA89:4275-4279;Lietal.(1993)Proc.
Natl.Acad.SciUSA90:2764-2768;Kimetal.(1994a)Proc.Natl.Acad.Sci.
USA91:883-887;Kimetal.(1994b)J.Biol.Chem.269:31,978-31,982。因此,在
一个实施方案中,融合蛋白包括来自至少一种IIS型限制酶的剪切结构域(或
剪切半结构域)和一个或多个锌指结合结构域,其可以是或者不是被工程化的。

具有可以分开的剪切结构域与结合结构域的示例性IIS型限制酶是FokI。
这种酶作为二聚体发挥作用。Bitinaiteetal.(1998)Proc.Natl.Acad.Sci.USA95:
10,570-10,575。因此,为本公开的目的,在被公开的融合蛋白中使用的FokI
酶的部分视为剪切半结构域。因此,对于使用锌指-FokI融合物的细胞序列的
靶向双链剪切和/或靶向替换,可以使用两个融合蛋白,每一个融合蛋白都包
含FokI剪切半结构域,来重建具有催化活性的剪切结构域。或者,也可以使
用含有DNA结合结构域和两个FokI剪切半结构域的单一多肽分子。

剪切结构域或剪切半结构域可以是蛋白质的保留剪切活性、或者保留多聚
体化形成功能性剪切结构域的能力的任何部分。

IIS型限制酶的实例在美国专利公开No.20070134796中有描述,本文引
用其全部内容作为参考。额外的限制酶也还有可分开的结合和剪切结构域,并
且是本公开所构想的。参见,例如,Robertsetal.(2003)NucleicAcids
Res.31:418-420。

在某些实施方案中,剪切结构域包括一个或多个工程化的剪切半结构域
(也称作二聚体化结构域突变体),其最小化或阻止同二聚体化
(homodimerization),如例如美国专利公开Nos.20050064474;20060188987和
20080131962所述,本文引用其全部内容作为参考。位于FokI位置446,447,
479,483,484,486,487,490,491,496,498,499,500,531,534,537,
和538的氨基酸残基均是供用于影响FokI剪切半结构域二聚体化的靶点。

可形成专性异二聚体的FokI的示例性工程化剪切半结构域包括这样的一
对,其中第一剪切半结构域在FokI的位置490和538的氨基酸残基处包括突
变,第二剪切半结构域在氨基酸残基486和499处包括突变。

因此,在一个实施方案中,490处的突变用Lys(K)代替Glu(E);538处
的突变用Lys(K)代替Iso(I);486处的突变用Glu(E)代替Gln(Q);499处的
突变用Lys(K)代替Iso(I)。具体地,本文所述的工程化剪切半结构域是通过
使一个剪切半结构域中的位置490(E→K)和538(I→K)突变产生命名为
“E490K:I538K”的工程化剪切半结构域,并将另一个剪切半结构域中的位置
486(Q→E)和499(I→L)突变产生命名为“Q486E:I499L”的工程化剪切半结构
域而制备的。本文所述的工程化剪切半结构域是专性异源二聚体突变体,其中
异常的剪切被最小化或消除。参见,例如美国专利公开号No.2008/0131962,
本文出于所有目的引用其全部公开内容作为参考。

在某些实施方案中,工程化的剪切半结构域包括位置486、499和496处
的突变(相对于野生型FokI编号),例如用Glu(E)残基代替位置486处的野生
型Gln(Q)残基的突变,用Leu(L)残基代替位置499处的野生型残基Iso(I)的
突变,用Asp(D)或Glu(E)残基代替位置496处的野生型Asn(N)残基的突变(亦
分别称作“ELD”和“ELE”结构域)。在其他实施方案中,工程化的剪切半
结构域包括位置490、538和537处的突变(相对于野生型FokI编号),例如用
Lys(K)残基代替位置490处的野生型Glu(E)残基的突变,用Lys(K)残基代替
位置538处的野生型Iso(I)残基的突变,用Lys(K)或Arg(R)残基代替位置537
处的野生型His(H)残基的突变(亦分别被称作“KKK”和“KKR”结构域)。
在其他实施方案中,工程化的剪切半结构域包括位置490和537处的突变(相
对于野生型FokI编号),例如用Lys(K)残基代替位置490处的野生型Glu(E)
残基的突变,用Lys(K)或Arg(R)残基代替位置537处的野生型His(H)残基
的突变(亦分别被称作“KIK”和“KIR”结构域)。(参见美国专利公开No.
20110201055)。本文所述的工程化剪切半结构域可以使用任何合适的方法制
备,例如通过野生型剪切半结构域(FokI)的定点诱变,如美国专利公开Nos.
20050064474;20080131962;和20110201055所述。

或者,可以使用所谓的“分割(split)-酶”技术(参见,例如美国专利公开
No.20090068164)在核酸靶位点处体内组装核酸酶。这样的分割酶的组分或
者可以在各别的表达构建体上表达,或者可以将它们连接在一个开放阅读框中,
其中各个组件被分隔开,例如,被自剪切性2A肽或IRES序列分隔开。组件
可以是单独的锌指结合结构域,或者是大范围核酸酶的核酸结合结构域的结构
域。

C.锌指核酸酶

在具体的实施方案中,嵌合多肽是定制设计的锌指核酸酶(ZFN),其可以
被设计成递送靶位点特异性的双链DNA断裂,该断裂中可以整合外源核酸或
供体DNA(见共同拥有的美国专利公开20100257638,本文引用其内容作为参
考)。ZFN是嵌合多肽,其包含来自限制性核酸内切酶(例如FokⅠ)的非特异性
剪切结构域,和锌指DNA结合结构域多肽。见,例如Huangetal.(1996)J.
ProteinChem.15:481-9;Kimetal.(1997a)Proc.Natl.Acad.Sci.USA94:3616-20;
Kimetal.(1996)Proc.Natl.Acad.Sci.USA93:1156-60;Kimetal.(1994)Proc
Natl.Acad.Sci.USA91:883-7;Kimetal.(1997b)Proc.Natl.Acad.Sci.USA
94:12875-9;Kimetal.(1997c)Gene203:43-9;Kimetal.(1998)Biol.Chem.
379:489-95;NahonandRaveh(1998)NucleicAcidsRes.26:1233-9;Smithetal.
(1999)NucleicAcidsRes.27:674-81。在一些实施方案中,ZFN包括非规范的
锌指DNA结合结构域(参见共同拥有的美国专利公开20080182332,本文引
用其内容作为参考)。FokⅠ限制性内切酶必须通过核酸酶结构域二聚体化,
以便切割DNA和引入双链断裂。因此,含有来自这类核酸内切酶的核酸酶结
构域的ZFN也需要核酸酶结构域的二聚体化,以便切割靶DNA。Manietal.
(2005)Biochem.Biophys.Res.Commun.334:1191-7;Smithetal.(2000)Nucleic
AcidsRes.28:3361-9。ZFN的二聚体化可以被两个相邻的、方向相反的DNA
结合位点所易化。同上。

ZFN系统的灵活性和特异性提供了先前通过已知的重组酶介导基因编辑
策略所不能实现的控制水平。作为一个实例,ZFN可以容易地工程化,以便,
例如,识别特定的核酸序列。Wuetal.(2007)Cell.Mol.LifeSci.64:2933-44。(见,
美国专利公开20090205083,20110189775,20110167521和20100199389,本文
引用其全部内容作为参考)。对锌指识别残基的密码子的随机化有助于选择对
任意选定的DNA序列具有高亲和性的新的指。而且,锌指是天然的DNA结
合分子,并且已经显示工程化的锌指可在活细胞中对其设计的靶具有作用。因
此,基于锌指的核酸酶可以靶向到特定的而非任意的识别位点。

在特定的实例中,用于将外源核酸位点特异性地整合到宿主的至少一个
FAD3性能基因座中的方法包括将ZFN引入到宿主的细胞中,其中该ZFN识
别并结合靶核苷酸序列,其中该靶核苷酸序列包含在宿主至少一个FAD3基因
座内。在某些实例中,靶核苷酸序列并非包含在宿主基因组除所述至少一个
FAD3基因座之外的任何其他位置处。例如,ZFN的DNA结合多肽可以被工
程化以识别并结合在所述至少一个FAD3基因座内被鉴定(例如通过测序
FAD3基因座)的靶核苷酸序列。对于包括将ZFN引入到宿主细胞中、用于
位点特异性地将外源核酸整合到宿主的至少一个FAD3性能基因座中的方法,
其还可以包括将外源核酸引入到细胞内,其中ZFN对靶序列的位点特异性识
别和结合(和随后对包含FAD3基因座的核酸的剪切)使得该外源核酸更容易重
组到宿主的包含所述至少一个FAD3基因座的核酸之中。

VI.用于整合在FAD3基因座处的外源核酸

本发明的实施方案可以包括一个或多个选自下组的核酸:用于位点特异性
整合在至少一个FAD3基因座处的外源核酸,例如但不仅限于,PTU,ELP,ETIP
或ORF;包含编码靶向核酸内切酶的核苷酸序列的核酸;和包含前述的至少
一者或两者的载体。因此,用于一些实施方案的特定核酸包括编码多肽的核苷
酸序列,结构核苷酸序列,和/或DNA结合多肽识别与结合位点。

A.用于位点特异性整合的外源核酸分子

如上文指出的,提供了外源序列(也称作“供体序列”或“供体”或“转
基因”)的插入,用于例如表达多肽,修正突变基因,或用于增加野生型基因
的表达。可以显见,供体序列通常与其被置于的基因组序列不相同。供体序列
可以包含非同源序列,其侧翼是两个具有同源性的区域,用于在感兴趣的位置
处实现高效的HDR。此外,供体序列可以包括载体分子,其含有与细胞染色
质中感兴趣的区域不同源的序列。供体分子可以包含多个不连续的与细胞染色
质具有同源性的区域。例如,为了靶向插入通常不存在于感兴趣区域内的序列,
所述序列可以存在于供体核酸分子中,并且被与感兴趣区域内的序列具有同源
性的序列所侧翼。

供体多核苷酸可以是DNA或RNA,单链或双链的,并且可以以线性或
环形形式引入到细胞内。见例如,美国专利公开Nos.20100047805,
20110281361,20110207221和美国专利申请No.13/889,162。如果以线性形式
引入,则供体序列的末端可以通过本领域技术人员已知的方法被保护(例如,
保护免于核酸外切酶降解)。例如,将一个或更多个双脱氧核苷酸残基添加
到线性分子的3'端和/或将自互补的寡核苷酸与一个或两个末端连接。参见,
例如,Changetal.(1987)Proc.Natl.Acad.Sci.USA84:4959-4963;Nehlsetal.
(1996)Science272:886-889。其它用于保护外源多核苷酸免于降解的方法包括,
但不仅限于,添加末端氨基和使用经过修饰的核苷酸间连接键,例如硫代磷
酸酯,氨基磷酸酯和O-甲基核糖或脱氧核糖残基。

多核苷酸可以作为具有额外序列(例如复制起点、启动子和编码抗生素
抗性的基因)的载体的一部分被引入到细胞内。而且,供体多核苷酸可以作
为裸核酸,作为与脂质体或泊洛沙姆等作用剂复合的核酸被引入,或者可以
通过病毒(例如,腺病毒,腺伴随病毒,疱疹病毒,逆转录病毒,慢病毒和
整合缺陷的慢病毒(IDLV))被递送。

供体一般被整合,使得其表达被整合位点处的内源启动子,即驱动整合
了该供体的内源基因(例如FAD3)的表达的启动子所驱动。然而,容易想到
的是,供体可以包含启动子和/或增强子,例如组成型启动子,或可诱导的或
组织特异性的启动子。

而且,尽管不是表达必需的,但是外源序列还可以包含转录或转录调节
序列,例如启动子、增强子、绝缘子(insulators)、内部核糖体进入位点、编
码2A肽和/或多腺苷酸化信号的序列。

可以在实施方案中位点特异性方式整合到至少一个FAD3基因座中从而
修饰该FAD3基因座的外源核酸包括,例如但不仅限于,包含编码感兴趣多
肽的核苷酸序列的核酸;包含农艺学基因的核酸;包含编码RNAi分子的核
苷酸序列的核酸;或破坏FAD3基因的核酸。

在一些实施方案中,外源核酸被整合在FAD3基因座处,以便修饰该
FAD3基因座,其中该核酸包括农艺学基因或编码感兴趣多肽的核苷酸序列,
使得该农艺学基因或核苷酸序列在宿主中从该FAD3基因座表达。在一些实
例中,感兴趣的多肽(例如,外来蛋白质)以商业量从编码该感兴趣多肽的核
苷酸序列表达。在这样的实例中,感兴趣的多肽可以从宿主细胞、组织或生
物量提取。在一些实施方案中,宿主是植物,并且被提供用于商业生产感兴
趣多肽的植物材料可以是植物,植物部分,植物组织或植物细胞。在一些实
例中,该植物部分可以是植物种子。从植物生物量提取蛋白质可以通过已知
的方法实现,其在例如HeneyandOrr(1981)Anal.Biochem.114:92-6中有讨
论。

类似地,农艺学基因可以在被转化的植物细胞、植物和/或其后代中表达。
例如,植物可以通过特定实施方案的方法被遗传工程化,从而从至少一个
FAD3基因座表达各种感兴趣的农艺学表型。

在一些实施方案中,包含农艺学基因或编码感兴趣多肽的核苷酸序列的
核酸可以包括,例如但不仅限于:赋予对害虫或疾病的抗性的基因(见例如,
Jonesetal.(1994)Science266:789(用于抵抗叶霉病菌的番茄Cf-9基因的克
隆);Martinetal.(1993)Science262:1432;Mindrinosetal.(1994)Cell78:1089
(用于丁香假单胞菌抗性的RSP2基因);PCT国际专利公开No.WO96/30517
(对大豆胞囊线虫的抗性);PCT国际专利公开No.WO93/19181);编码苏云
金芽孢杆菌蛋白的基因、其衍生物、或以其为模型的合成多肽(见例如Geiser
etal.(1986)Gene48:109(Btδ-内毒素基因的克隆和核苷酸序列;而且编码δ-
内毒素基因的DNA分子可以从美国典型培养物保藏中心(Manassas,VA)以
例如ATCC登录号Nos.40098;67136;31995;和31998购买));编码凝集素
的基因(见例如VanDammeetal.(1994)PlantMolec.Biol.24:25(多种君子兰
甘露糖结合凝集素基因的核苷酸序列);编码维生素结合蛋白的基因,例如
链霉亲和素(见PCR国际专利公开No.US93/06487(使用链霉亲和素和链霉亲
和素同系物作为针对昆虫害虫的杀幼虫剂));编码酶抑制剂,例如蛋白酶
(protease,proteinase)抑制剂、或淀粉酶抑制剂,的基因(见例如Abeetal.(1987)
J.Biol.Chem.262:16793(水稻半胱氨酸蛋白酶抑制剂的核苷酸序列);Huub
etal.(1993)PlantMolec.Biol.21:985(编码番茄蛋白酶抑制剂I的cDNA的核
苷酸序列);Sumitanietal.(1993)Biosci.Biotech.Biochem.57:1243(硝孢链霉
菌(Streptomycesnitrosporeus)α-淀粉酶抑制剂的核苷酸序列)和美国专利
5,494,813);编码昆虫特异性激素或信息素(pheromone)的基因,例如蜕皮激
素或保幼激素,其变异体,基于它的模拟物,或其拮抗剂或激动剂(见例如
Hammocketal.(1990)Nature344:458(杆状病毒表达克隆的保幼激素酯酶,
一种保幼激素去活剂);编码在表达时会破坏受影响害虫的生理的昆虫特异
性肽或神经肽的基因(见例如Regan(1994)J.Biol.Chem.269:9(表达克隆产
生编码昆虫利尿激素受体的DNA);Prattetal.(1989)Biochem.Biophys.Res.
Comm.163:1243(太平洋折翅蠊(Diplopterapuntata)中的咽侧体抑制素
(allostatin));和美国专利5,266,317(编码昆虫特异性瘫痪神经毒素的基因);
天然由蛇、黄蜂或其他生物产生的编码昆虫特异性毒液的基因(见例如Pang
etal.(1992)Gene116:165(在植物中异源表达编码蝎子昆虫毒性肽的基因));
编码负责单萜、倍半萜烯、类固醇、羟肟酸、苯丙衍生物(phenylproanoid
derivative)或其它具有杀虫活性的分子的超积累的酶的基因;编码参与生物
活性分子(例如糖酵解酶、蛋白水解酶、脂肪分解酶、核酸酶、环化酶、转
氨酶、酯酶、水解酶、磷酸酶、激酶、磷酸化酶、聚合酶、弹性蛋白酶、几
丁质酶或葡聚糖酶)的修饰(包括翻译后修饰)的酶的基因,无论是天然的还是
合成的(见,例如PCT国际专利公开No.WO93/02197(callase基因的核苷酸
序列);而且,含有几丁质酶编码序列的DNA分子可以从例如ATCC按照登
录号39637和67152获得;Krameretal.(1993)InsectBiochem.Molec.Biol.
23:691(编码烟草天蛾几丁质酶的cDNA的核苷酸序列);和Kawallecketal.
(1993)PlantMolec.Biol.21:673(欧芹ubi4-2多聚泛素基因的核苷酸序列));
编码刺激信号转导的分子的基因(见,例如Botellaetal.(1994)PlantMolec.
Biol.24:757(绿豆钙调蛋白cDNA克隆的核苷酸序列);和Griessetal.(1994)
PlantPhysiol.104:1467(玉米钙调蛋白cDNA克隆的核苷酸序列));编码疏水
性moment肽的基因(见例如PCT国际专利公开No.WO95/16776(抑制真菌
植物病原体的鲎素(Tachyplesin)的肽衍生物);和PCT国际专利公开No.WO
95/18855(赋予疾病抗性的合成抗微生物肽));编码膜通透酶、通道构成物
(former)或通道阻断剂的基因(见例如Jaynesetal.(1993)PlantSci89:43(异源
表达天蚕杀菌肽(cecropin)-β裂解肽类似物,赋予转基因烟草植物对青枯假单
胞菌的抗性));编码病毒侵入蛋白或从其衍生的复合体毒素的基因(见例如
Beachyetal.(1990)Ann.rev.Phytopathol.28:451);编码昆虫特异性抗体或从
其衍生的免疫毒素的基因(见例如,Tayloretal.,Abstract#497,SeventhInt'l
SymposiumonMolecularPlant-MicrobeInteractions(Edinburgh,Scotland)
(1994)(通过产生单链抗体片段在转基因烟草中的酶去活));编码病毒特异性
抗体的基因(见例如Tavladorakietal.(1993)Nature366:469(表达重组抗体基
因的转基因植物被保护免于病毒攻击));编码由病原体或寄生虫自然产生的
发育阻断蛋白的基因(见例如,Lambetal.(1992)Bio/Technology10:1436(真
菌内切α-1,4-D-多聚半乳糖醛酸酶通过溶解植物细胞壁均聚-α-1,4-D-半乳糖
醛酸而易化真菌定植(colonization)和植物营养素释放);Toubartetal.(1992)
PlantJ.2:367(克隆和表征编码豆类内切多聚半乳糖醛酸酶抑制蛋白的基因);
编码自然界中由植物产生的发育阻断蛋白的基因(见例如Logemannetal.
(1992)Bio/Technology10:305(表达大麦核糖体失活基因的转基因植物具有更
高的针对真菌疾病的抗性))。

在一些实施方案中,包含农艺学基因或编码感兴趣多肽的核苷酸序列的
核酸还可以和/或可选择地包括,例如但不仅限于:赋予对除草剂(例如抑制
生长点或分生组织的除草剂,例如咪唑啉酮或磺酰脲)的抗性的基因(这类示
例性基因编码突变的ALS和AHAS酶,例如分别如Leeetal.(1988)EMBOJ.
7:1241,和Mikietal.(1990)Theor.Appl.Genet.80:449所述);草甘膦抗性,
如由例如突变的5-烯醇式丙酮酰莽草酸-3-磷酸合酶(EPSP)所赋予的(通过引
入重组核酸和/或天然EPSP基因(包括但不仅限于CP4,DMMG,和DGT-28)
的各种形式的体内突变)、aroA基因、和草甘膦乙酰转移酶(GAT)基因);其
它膦化合物,例如来自链霉属物种,包括吸水链霉菌和Streptomyces
viridichromogenes的草铵膦膦丝菌素乙酰转移酶(PAT)基因;和吡啶氧基或
苯氧基丙酸和环己酮(ACC酶抑制剂编码基因)。见例如,美国专利4940835
和6248876(能够赋予植物草甘膦抗性的各种形式EPSP的核苷酸序列)。编
码突变体aroA基因的DNA分子能够根据ATCC登录号39256获得。另见
美国专利No.4,769,061(突变体aroA基因的核苷酸序列)。欧洲专利申请No.
0333033和美国专利No.4,975,374公开了谷氨酰胺合成酶基因的核苷酸序
列,其可以赋予对除草剂例如L-膦丝菌素的抗性。示例性PAT基因的核苷
酸序列在欧洲专利申请No.0242246,和DeGreefetal.(1989)
Bio/Technology7:61(产生表达编码PAT活性的嵌合bar基因的转基因植物)
中提供。赋予对苯氧基丙酸和环己酮(例如稀禾定和盖草)的抗性的示例性基
因包括ACC1-S1,ACC1-S2和ACC1-S3基因,如Marshalletal.(1992)Theor.
Appl.Genet.83:435所述。能够赋予草甘膦抗性的GAT基因在例如WO
2005012515中被描述。赋予对2,4-D、苯氧基丙酸和吡啶氧基生长素除草剂
抗性的基因在例如WO2005107437和WO2007053482中被描述。

包含农艺学基因或编码感兴趣多肽的核苷酸序列的核酸还可以包括,例
如但不仅限于:赋予对抑制光合作用的除草剂的抗性的基因,例如三嗪(psbA
和gs+基因)或苄腈(腈水解酶基因)。见例如Przibilaetal.(1991)PlantCell
3:169(用编码突变体psbA基因的质粒转化衣藻)。腈水解酶基因的核苷酸序
列在美国专利4,810,648中被公开,含有这些基因的DNA分子可以根据
ATCC登录号Nos.53435;67441;和67442获得。另见Hayesetal.(1992)
Biochem.J.285:173(克隆和表达编码谷胱甘肽S转移酶的DNA)。

在一些实施方案中,包含农艺学基因或编码感兴趣多肽的核苷酸序列的
核酸还可以和/或可选择地包括赋予或者有助于增值性状的基因,增值性状例
如但不仅限于:经过修饰的脂肪酸代谢,例如,通过用硬脂酰-ACP去饱和
酶的反义基因转化植物以增加植物的硬脂酸含量(见例如Knultzonetal.
(1992)Proc.Natl.Acad.Sci.U.S.A.89:2624);减少植酸盐/酯含量,例如,引
入植酸酶编码基因可以提高植酸盐/酯的裂解,向被转化植物增加更多的游离
磷酸盐(参见,例如,VanHartingsveldtetal.(1993)Gene127:87(黑曲霉植酸
酶基因的核苷酸序列);可以被引入到玉米中以降低植酸含量的基因,例如,
这可以通过克隆然后再次引入与可能负责低植酸水平的玉米突变体特征的
单等位基因相关的DNA实现(见Raboyetal.(1990)Maydica35:383));和经
过修饰的碳水化合物组成,其通过例如用编码可以改变淀粉分支模式的酶的
基因转化植物来实现(见例如Shirozaetal.(1988)J.Bacteol.170:810(链球菌
突变体果糖转移酶基因的核苷酸序列);Steinmetzetal.(1985)Mol.Gen.
Genet.20:220(果聚糖蔗糖酶基因);Penetal.(1992)Bio/Technology10:292
(α-淀粉酶);Elliotetal.(1993)PlantMolec.Biol.21:515(西红柿转化酶基因的
核苷酸序列);Sogaardetal.(1993)J.Biol.Chem.268:22480(大麦α-淀粉酶基
因);和Fisheretal.(1993)PlantPhysiol.102:1045(玉米胚乳淀粉分支酶II))。

在一些实施方案中,外源核酸被整合在FAD3基因座处以修饰FAD3基
因座,其中该核酸包括PTU或ELP,使得,例如,随后的第二外源核酸易
于位点特异性整合在PTU或ELP的位点处。另见美国专利No.13/889,162。

为了通过靶向整合在靶向性核酸内切酶的介导下将感兴趣的核酸分子
靶向整合到植物基因组中,需要递送靶向性核酸内切酶或者靶向性核酸内切
酶编码核酸分子,随后在宿主内表达功能性的靶向性核酸内切酶蛋白。在靶
向性核酸内切酶被递送到宿主细胞中或在宿主细胞中表达时,外源核酸也优
选地存在于宿主细胞中,从而使该功能性靶向性核酸内切酶蛋白在至少一个
FAD3基因座中的靶位点处诱导双链断裂,这些断裂随后被修复,例如通过
同源性驱动的外源核酸整合到基因座中而被修复。本领域的技术人员可以预
见,功能性靶向性核酸内切酶蛋白的表达可以通过数种方法实现,包括但不
仅限于,编码靶向性核酸内切酶的构建体的基因转移,和编码靶向性核酸内
切酶的构建体的瞬时表达。在这两种情况下,均可以同时实现宿主细胞中功
能性靶向性核酸内切酶的表达和外源核酸的递送,以便驱动FAD3基因座处
的靶向整合。

在利用ZFN作为靶向性核酸内切酶的实施方案中获得的一个特别优势
在于,对嵌合锌指核酸酶剪切结构域二聚体化的需要赋予高水平的序列特异
性,且因此赋予高水平的剪切特异性。因为每个3个指的组结合9个连续的
碱基对,所以如果每个锌指结构域具有完美的特异性,则2个嵌合核酸酶实
际上要求一个18bp的靶点。任何给定的这种长度的序列均可预期在单各基
因组(假定大约109bp)中是唯一的。Bibikovaetal.(2001)Mol.Cell.Biol.
21(1):289-97;Wuetal.(2007),前文。而且,额外的指可以提供更高的特异
性,Beerlietal.(1998)Proc.Natl.Acad.Sci.USA95:14628-33;KimandPabo
(1998)Proc.Natl.Acad.Sci.USA95:2812-7;Liuetal.(1997)Proc.Natl.Acad.
Sci.USA94:5525-30,因此可以增加每个DNA结合结构域中的锌指数目以
提供更高的特异性。例如,通过使用一对可识别24bp序列的4指、5指、6
指或更多指的ZFN,可以进一步提高特异性。Urnovetal.(2005)Nature
435:646-51。因此,可以使用ZFN,使得被引入到宿主植物基因组中的识别
序列在基因组中是唯一的。

B.包含编码靶向性核酸内切酶的核苷酸序列的核酸分子

在一些实施方案中,编码靶向性核酸内切酶的核苷酸序列可以通过操作
(例如连接)编码该靶向性核酸内切酶中包含的多肽的天然核苷酸序列而工程
化。例如,可以对编码包含DNA结合多肽的蛋白质的基因的核苷酸序列进
行检查,以鉴定对应于该DNA结合多肽的基因的核苷酸序列,并可以使用
该核苷酸序列作为编码包含该DNA结合多肽的靶向性核酸内切酶的核苷酸
序列的元件。或者,可以利用靶向性核酸内切酶的氨基酸序列来推导编码该
靶向性核酸内切酶的核苷酸序列,例如,根据遗传密码的简并性。

在包含编码靶向性核酸内切酶的核苷酸序列的示例性核酸分子中,编码
核酸酶多肽的第一多核苷酸序列的最后一个密码子与编码DNA结合多肽的
第二多核苷酸序列的第一个密码子可以相隔任意数量的核苷酸三联体,例如
不编码内含子或“停止(STOP)”。类似地,编码DNA结合多肽的第一多核
苷酸序列的最后一个密码子与编码核酸内切酶的第二多核苷酸序列的第一
个密码子可以相隔任意数量的核苷酸三联体。在这些和进一步的实施方案中,
编码核酸酶多肽的第一多核苷酸序列与编码DNA结合多肽的第二多核苷酸
序列的最后一个(即,核酸序列的最3’)的最后一个密码子可以和与之直接邻
接、或者仅相隔短肽序列(例如由合成的核苷酸接头(例如可能已被用于实现
融合的核苷酸接头)编码的短肽序列)的其他多核苷酸编码序列的第一个密码
子相位对准地(phase-register)融合。其他多核苷酸序列的实例包括,例如但不
仅限于,标签、靶向肽、和酶剪切位点。类似地,第一和第二多核苷酸序列
的最5’(在核酸序列中)的第一个密码子可以和与之直接邻接、或者仅相隔短肽
序列的其他多核苷酸编码序列的最后一个密码子相位对准地融合。

将编码靶向性核酸内切酶中的功能性多肽(例如,DNA结合多肽和核酸
酶多肽)的各多核苷酸序列分隔开来的序列可以,例如,由任何序列组成,
使得所编码的氨基酸序列不太可能显著改变靶向性核酸内切酶的翻译。由于
已知的核酸酶多肽和已知的DNA结合多肽的自主性质,在实例中,间插序
列不会干扰这些结构的各自功能。

C.载体和表达构建体

在一些实施方案中,可以将包含至少一个编码感兴趣多肽和/或靶向性核
酸内切酶的外源多核苷酸序列的至少一个核酸分子引入到细胞、组织、或生
物体中,用于在其中表达。例如,可以将包含编码特异性识别至少一个FAD3
基因座内包含的核苷酸序列的靶向性核酸内切酶的多核苷酸序列的核酸分
子引入到细胞中,使得编码该感兴趣多肽的多核苷酸序列整合到至少一个
FAD3基因座中(这可以通过例如被表达的靶向性核酸内切酶在该基因座处
引入双链断裂后进行同源重组而实现),并从整合的多核苷酸序列表达该感
兴趣的多肽。

在一些实施方案中,核酸分子,例如前述的其中一个,可以是例如载体
系统,其包括例如但不仅限于,线性质粒或闭环质粒。在特定的实例中,载
体可以是表达载体。根据特定实施方案的核酸序列可以,例如,被整合到载
体中,使得该核酸序列与一个或多个调节序列可操作地连接。可以获得许多
载体用于这一目的,并且特定载体的选择可能取决于,例如,待插入在载体
中的核酸的大小,待用该载体转化的特定宿主细胞,和/或任何编码多肽期望
被表达的量。载体通常包含各种组件,它们的身份取决于载体的功能(例如,
DNA扩增或DNA表达),和与载体相容的特定宿主细胞。

在一些实施方案中,与一个或多个编码序列可操作地连接的调节序列可
以是在宿主细胞中,如在细菌细胞、藻类细胞、真菌细胞或植物细胞中发挥
功能的启动子序列,在该细胞中该核酸分子被扩增或表达。一些实施方案可
以包括植物转化载体,其包括含有至少一个调节序列的核苷酸序列,该调节
序列与一个或多个编码感兴趣多肽或靶向性核酸内切酶的核苷酸序列可操
作地连接,其中该一个或多个核苷酸序列可以在该调节序列的控制下在植物
细胞、组织或生物体中表达,从而产生感兴趣的多肽或靶向性核酸内切酶。

根据一些实施方案,适用于核酸分子的启动子包括可诱导的、组织特异
性的、病毒、合成或组成型启动子,它们都是本领域众所周知的。可用于本
发明实施方案的启动子的非限制性实例在下列文献中提供:美国专利Nos.
6,437,217(玉米RS81启动子);5,641,876(水稻肌动蛋白启动子);6,426,446
(玉米RS324启动子);6,429,362(玉米PR-1启动子);6,232,526(玉米A3启动
子);6,177,611(组成型玉米启动子);5,322,938,5,352,605,5,359,142,和
5,530,196(35S启动子);6,433,252(玉米L3油质蛋白启动子);6,429,357(水稻
肌动蛋白2启动子,和水稻激动蛋白2内含子);6,294,714(光诱导的启动子);
6,140,078(盐诱导的启动子);6,252,138(病原体诱导的启动子);6,175,060(磷
缺乏诱导的启动子);6,388,170(双向启动子);6,635,806(γ-薏苡辛(coixin)启
动子);5,447,858(大豆热激蛋白启动子);和美国专利申请系列No.
09/757,089(玉米叶绿体醛缩酶启动子)。

额外的示例性启动子包括胭脂碱合成酶(NOS)启动子(Ebertetal.(1987)
Proc.Natl.Acad.Sci.USA84(16):5745-9);章鱼碱合成酶(OCS)启动子(其由根
癌土壤杆菌的肿瘤诱导质粒携带);花椰菜花叶病毒属启动子,例如花椰菜花
叶病毒(CaMV)19S启动子(Lawtonetal.(1987)PlantMol.Biol.9:315-24);
CaMV35S启动子(Odelletal.(1985)Nature313:810-2;玄参花叶病毒35S启动
子(Walkeretal.(1987)Proc.Natl.Acad.Sci.USA84(19):6624-8);蔗糖合酶启动
子(YangandRussell(1990)Proc.Natl.Acad.Sci.USA87:4144-8);R基因复合
物启动子(Chandleretal.(1989)PlantCell1:1175-83);叶绿素a/b结合蛋白基因
启动子;CaMV35S(美国专利Nos.5,322,938,5,352,605,5,359,142,和
5,530,196);FMV35S(美国专利Nos.6,051,753,和5,378,619);PC1SV启动子
(美国专利No.5,850,019);SCP1启动子(美国专利No.6,677,503);和
AGRtu.nos启动子(GenBank登录号No.V00087;Depickeretal.(1982)J.Mol.
Appl.Genet.1:561-73;Bevanetal.(1983)Nature304:184-7)。

在特定的实施方案中,核酸分子可以包括组织特异性启动子。组织特异性
启动子是指导可操作地连接的核苷酸序列在该启动子特异的组织中以相对于
生物体的其它组织更高的水平进行转录的核苷酸序列。组织特异性启动子的实
例包括,但不仅限于;绒毡层特异性启动子;花药特异性启动子;花粉特异性
启动子(见例如美国专利No.7,141,424和国际PCT公开No.WO99/042587);
胚珠特异性启动子;(见例如,美国专利申请No.2001/047525A1);果实特异
性启动子(见例如,美国专利Nos.4,943,674,和5,753,475);和种子特异性启动
子(见例如,美国专利Nos.5,420,034,和5,608,152)。在一些实施方案中,可以
使用发育阶段特异性启动子(例如,在发育晚期有活性的启动子)。

其他在一些实施方案中可以和核酸分子可操作地连接的调节序列包括位
于启动子序列和编码序列之间的5’UTR,其作为翻译前导序列。该翻译前导
序列存在于完全加工好的mRNA中,并且可以影响初级转录本的加工,和/
或RNA稳定性。翻译前导序列的实例包括玉米和矮牵牛热激蛋白前导(美国专
利No.5,362,865),植物病毒外被蛋白前导,植物核酮糖-1,5-二磷酸羧化酶/加
氧酶前导,和其他。参见,例如,TurnerandFoster(1995)MolecularBiotech.
3(3):225-36。下面提供了5’UTR的非限制性实例:GmHsp(美国专利
NO.5,659,122);PhDnaK(美国专利NO.5,362,865);AtAnt1;TEV(Carrington
andFreed(1990)J.Virol.64:1590-7);和AGRinos(GenBank登录号NO.V00087;
和Bevanetal.(1983),同上)。

其他在一些实施方案中可以和核酸分子可操作地连接的调节序列还包
括3’非翻译序列,3’转录终止区,或多腺苷酸化区。这些都是位于核苷酸序
列下游的遗传元件,并且包括这样的多核苷酸,其提供多腺苷酸化信号,和
/或其他能够影响转录或mRNA加工的调节信号。植物中多腺苷酸化信号的
功能是向mRNA前体的3'末端添加聚腺苷酸核苷酸。多腺苷酸化序列可以
来自多种植物基因或来自T-DNA的基因。3’转录终止区的非限制性实例是
胭脂碱合成酶3'区(nos3’;Fraleyetal.(1983)Proc.Natl.Acad.Sci.USA
80:4803-7)。在Ingelbrechtetal.(1989)PlantCell1:671-80中提供了使用不同
3’非翻译区的实例。多腺苷酸化信号的非限制性实例包括来自豌豆RbcS2基
因(Ps.RbcS2-E9;Coruzzietal.(1984)EMBOJ.3:1671-9)和AGRtu.nos
(GenBank登录号E01312)的多腺苷酸化信号。

关于可能用于特定实施方案的调节序列的额外信息在,例如Goeddel
(1990)“GeneExpressionTechnology,”MethodsEnzymol.185,AcademicPress,
SanDiego,CA中有描述。

重组核酸分子或载体可以包括可选择标志物,其给被转化的细胞,例如
植物细胞,赋予可选择的表型。可选择标志物还可用于选择包含含有可选择
标志物的核酸分子的细胞或生物体。标志物可以编码杀生物剂抗性,抗生素
抗性(例如,卡那霉素,遗传霉素(G418),博来霉素,和潮霉素),或除
草剂抗性(例如,草甘膦)。可选择标志物的实例包括,但不仅限于:neo
基因,其赋予卡那霉素抗性并可以使用例如卡那霉素和G418进行选择;bar
基因,其赋予双丙氨膦抗性;突变的EPSP合酶基因,其赋予草甘膦抗性;
腈水解酶基因,其赋予对溴苯腈的抗性;突变的乙酰乳酸合酶基因(ALS),
其赋予咪唑啉酮或磺酰脲抗性;和氨甲蝶呤抗性DHFR基因。可以获得多种
可选择标志物,其赋予对化学剂的抗性,包括例如但不仅限于,氨苄青霉素;
博莱霉素;氯霉素;庆大霉素;潮霉素;卡那霉素;林可霉素;甲氨蝶呤;膦
丝菌素;嘌呤霉素;壮观霉素;利福平;链霉素;和四环素。这样的可选择标
志物的实例在例如,美国专利5,550,318;5,633,435;5,780,708和6,118,04中
被举例。

核酸分子或载体还可以或者可选择地包括可筛选标志物。可筛选标志物
可用于监测表达。示例性的可筛选标志物包括β-葡糖醛酸酶或uidA基因
(GUS),其编码一种酶,该酶的各种生色底物已知的(Jeffersonetal.(1987)
PlantMol.Biol.Rep.5:387-405);R-基因座基因,其编码可调节植物组织中花
青素色素(红色)生产的产物(Dellaportaetal.(1988)“Molecularcloningofthe
maizeR-njallelebytransposontaggingwithAc.”In18thStadlerGenetics
Symposium,P.GustafsonandR.Appels,eds.,Plenum,NY(263-82页);β-内酰胺
酶基因(Sutcliffeetal.(1978)Proc.Natl.Acad.Sci.USA75:3737-41);编码各种
生色底物已知的酶的基因(例如,PADAC,发色头孢菌素);荧光素酶基因
(Owetal.(1986)Science234:856-9);xylE基因,其编码可以转化显色儿茶酚
的儿茶酚双加氧酶(Zukowskietal.(1983)Gene46(2-3):247-55);淀粉酶基因
(Ikatuetal.(1990)Bio/Technol.8:241-2);酪氨酸酶基因,其编码能够氧化酪
氨酸为DOPA和多巴醌的酶,其进一步可缩合成黑色素(Katzetal.(1983)J.
Gen.Microbiol.129:2703-14);和α-半乳糖苷酶。

编码例如感兴趣的特定多肽或特定靶向性核酸内切酶的所有核苷酸序
列,可以被本领域的技术人员立即识别。遗传密码子的简并性为特定的氨基
酸序列提供了有限数目的编码序列。根据本发明的实施方案选择编码多肽的
特定序列在从业者的判断力之内。在不同的应用中可能期望不同的编码序列。

在一些实施方案中,可能期望修饰核酸的核苷酸,例如提高该核酸中包
含的多核苷酸序列在特定宿主中的表达。遗传密码子是冗余的,具有64种
可能的密码子,但是大多数生物体优先使用这些密码子的子集。在物种中最
经常使用的密码子被称作最佳密码子,不是非常经常使用的密码子被归类为
稀有或低使用率密码子。Zhangetal.(1991)Gene105:61-72。密码子可以被
取代,以反映特定宿主的优选密码子使用,这个过程有时被称作“密码子优
化”。含有特定原始生物或真核生物宿主优选的密码子的优化编码序列可以
被制备,以提高翻译速度或产生具有期望性质的重组RNA转录本(例如,与
从非优化序列产生的转录本相比,具有更长的半衰期)。

在本发明的实施方案中,核酸可以用本领域技术人员已知的任何方法引
入到宿主细胞中,包括例如但不仅限于:原生质体转化(见例如美国专利
5,508,184);干燥/抑制介导的DNA摄取(见例如,Potrykusetal.(1985)Mol.Gen.
Genet.199:183-8);电穿孔(见例如,美国专利5,384,253);用碳化硅纤维搅拌
(见例如,美国专利5,302,523和5,464,765);土壤杆菌介导的转化(见例如,
美国专利5,563,055,5,591,616,5,693,512,5,824,877,5,981,840,和6,384,301);
并通过DNA涂覆的颗粒加速(见例如,美国专利5,015,580,5,550,318,5,538,880,
6,160,208,6,399,861,和6,403,865)。通过诸如这些技术的应用,几乎任何种类
的细胞均可以稳定地转化。在一些实施方案中,转化DNA被整合到宿主细胞
的基因组中。在多细胞物种的情况下,转基因细胞可以再生为转基因生物。任
何这些技术均可用于产生转基因植物,例如,在该转基因植物的基因组中包含
一个或多个本发明的核酸序列。

用于将表达载体导入到植物中的最广泛使用的方法是基于土壤杆菌的天
然转化系统。根癌土壤杆菌和发根土壤杆菌是植物致病性土壤细菌,其可以遗
传转化植物细胞。根瘤土壤杆菌和发根土壤杆菌的Ti和Ri质粒分别携带负责
植物遗传转化的基因。Ti(肿瘤诱导)质粒含有一个大片段,被称为T-DNA,
其可被转移到被转化的植物。Ti质粒的另一个片段,vir区域,负责T-DNA转
移。T-DNA区被左手和右手边界包围,其每一个由末端重复核苷酸序列构成。
在一些经过修饰的二元载体中,肿瘤诱导的基因已被删除,并使用vir区域的
功能转移被T-DNA边界序列包围的外源DNA。T区还可以含有,例如,用于
高效回收转基因植物和细胞的可选择标志物,用于插入转移序列的多克隆位点,
例如编码本发明融合蛋白的核酸。

因此,在一些实施方案中,植物转化载体来自根癌土壤杆菌的Ti质粒(见
例如,美国专利Nos.4,536,475,4,693,977,4,886,937,和5,501,967;和欧洲专
利EP0122791),或发根土壤杆菌的Ri质粒。额外的植物转化载体包括,例
如但不仅限于,下列文献中描述的那些:Herrera-Estrellaetal.(1983)Nature
303:209-13;Bevanetal.(1983),上文;Kleeetal.(1985)Bio/Technol.3:637-42;
和欧洲专利EP0120516,和从上述任意一种衍生的那些。其它细菌,例如中
华根瘤菌,根瘤菌,和中慢生根瘤菌,其与植物自然相互作用,可以被修饰从
而介导向大量不同植物转移基因。这些植物相关的共生细菌可以被制成感受态,
通过获取卸甲(disarmed)的Ti质粒和合适的二元载体进行基因转移。

向受体细胞提供外源DNA以后,一般对被转化细胞进行鉴定,用于进一
步的培养和植株再生。为了提高鉴定转化细胞的能力,可能期望在用于产生转
化体的载体中采用可选择或可筛选的标志物基因,如前所述。在使用可选择标
志物的情况下,通过将细胞暴露于一种或多种选择剂,在潜在的被转化细胞中
鉴定出被转化的细胞。在使用可筛选标志物的情况下,可以根据期望的标志物
基因性状对细胞进行筛选。

暴露于选择剂后存活的细胞或者在筛选试验中被评定为阳性的细胞,可以
在支持植物再生的培养基中进行培养。在一些实施方案中,可以通过包含其它
物质,例如生长调节剂,对任何合适的植物组织培养基(例如MS和N6培养
基)进行修饰。组织可以保持在具有生长调节剂的基本培养基中,直到获得足
够的组织来开始再生植物的工作,或者进行反复多轮的手动选择,直到组织的
形态适合于再生(例如,至少2周),然后转移到有利于芽(shoot)形成的培养
基中。培养物被周期性地转移,直到产生足够的芽苗。一旦芽苗形成,便将它
们转移到有利于根形成的培养基中。一旦形成足够的根,便将植物转移到土壤
中,用于进一步的生长和成熟。

为了确认在再生植物中存在感兴趣的核酸分子(例如,编码含有至少一个
本发明融合蛋白的多肽的核苷酸序列),可以执行各种测定。这样的测定包括,
例如:分子生物学测定,例如Southern和Northern印迹,PCR和核酸测序;
生物化学测定,例如检测蛋白质产物的存在,例如,通过免疫学手段(ELISA
和/或Western印迹)或通过酶促功能;植物部分测定,例如叶或根测定;和整
个再生植物的表型分析。

整合事件可以通过,例如,PCR扩增进行分析,使用例如特异针对感兴
趣核苷酸序列的寡核苷酸引物。PCR基因分型被理解为包括,但不仅限于,
对来自预测含有被整合到基因组内的感兴趣核酸分子的分离宿主植物组织的
基因组DNA进行聚合酶链反应(PCR),随后对PCR扩增产物进行标准克隆
和序列分析。PCR基因分型的方法已经得到了很好的描述(参见,例如,Rios,
G.etal.(2002)PlantJ.32:243-53),并且可应用于来自任何植物物种或组织类
型(包括细胞培养物)的基因组DNA。

使用土壤杆菌依赖的转化方法形成的转基因植物通常含有重组DNA的单
个到多个拷贝。单个重组DNA序列被称作一个“转基因事件”或“整合事件”。
这类转基因植物就插入的DNA序列而言是杂合的。在一些实施方案中,转基
因的转基因植物纯合子可以通过含有单个外源基因序列的独立分离的转基因
植物与自身(例如F0植物)的有性结合(自交)产生Fl种子而获得。四分之一的所
产Fl种子就转基因而言是纯合的。令Fl种子萌发可产生能够用于测试杂合性
的植物,这通常使用SNP测定或热扩增测定,其能够区分杂合子和纯合子(即,
接合性测定)。

除了在一些实施方案中用核酸分子直接转化植物或植物细胞之外,在特定
的实施方案中,可以通过使具有至少一个转基因事件的第一植物与缺少这种事
件的第二植物杂交,来制备转基因植物。例如,可以向适于转化的第一植物品
系中引入包含至少一个经过修饰的FAD3基因座的核酸,其中外源核酸已经以
位点特异性的方式被整合,从而产生转基因植物,该转基因植物可以和第二植
物品系杂交,从而将至少一个经过修饰的FAD3基因座(以及因此导致的外源
核酸)基因渗入到第二植物品系中。

为了确认在再生植物中存在感兴趣的核酸分子,可以实施多种测定。这样
的测定包括,例如:分子生物学测定,例如Southern和Northern印迹和PCR;
生物化学测定,例如检测蛋白质产物的存在,例如,通过免疫学手段(ELISA
和/或Western印迹)或通过酶促功能;植物部分测定,例如叶或根测定;和
整个再生植物的表型分析。

靶向整合事件可以通过例如PCR扩增进行筛选,使用例如特异针对感兴
趣核酸分子的寡核苷酸引物。PCR基因分型被理解为包括,但不仅限于,对
来自预测含有被整合到基因组内的感兴趣核酸的分离宿主植物愈伤组织的基
因组DNA进行聚合酶链反应(PCR)扩增,随后对PCR扩增产物进行标准克隆
和序列分析。PCR基因分型的方法已经有很多描述(例如,Rios,G.etal.(2002)
PlantJ.32:243-53),并且可以应用于来自任何植物物种或组织类型(包括细胞
培养物)的基因组DNA。结合靶序列和被引入的序列二者的寡核苷酸引物的组
合可以顺次使用或复用于PCR扩增反应。设计成退火至靶位点、引入的核酸
序列、和/或两者的组合的寡核苷酸引物是可行的。因此,PCR基因分型策略
可以包括(但不仅限于)扩增植物基因组中的特定序列,扩增植物基因组中的
多个特定序列,扩增植物基因组中的非特异性的序列,或其组合。本领域的技
术人员可以设计出额外的引物和扩增反应的组合来查询基因组。例如,一组正
向和反向寡核苷酸引物可以被设计为与被引入的核酸序列的边界之外的靶标
所特有的核酸序列退火。

正向和反向寡核苷酸引物可以被设计成与引入的感兴趣核酸分子特异性
退火,例如,与对应于感兴趣核酸分子编码区的序列或感兴趣核酸分子其它部
分的序列退火。这些引物可以和上述的引物一起使用。寡核苷酸引物可以根据
期望的序列来合成,并且可以商购获得(例如,从IntegratedDNATechnologies,
Inc.,Coralville,IA)。扩增之后可以进行克隆和测序,或者对扩增产物进行直
接序列分析。本领域技术人员可以想到替代方法,用于对在PCR基因分型期
间产生的扩增产物进行分析。在一个实施方案中,在PCR扩增中使用特异针
对靶基因的寡核苷酸引物。

VI.包含整合在FAD3性能基因座处的核酸的转基因植物和植物材料

在一些实施方案中,提供了转基因植物,其中该植物包括含有至少一个经
过修饰的FAD3基因座(例如,被破坏和/或靶向整合了外源序列的FAD3基因
座)。在特定的实施方案中,这样的植物可以通过转化植物组织或植物细胞,
然后再生整株植物来产生。在进一步的实施方案中,这样的植物可以通过以位
点特异性的方式在至少一个FAD3基因座处引入外源核酸,或者通过将经过修
饰的FAD3基因座基因渗入到种质中而获得。还提供了包含这样的植物细胞的
植物材料。这样的植物材料可从从包含该植物细胞的植物获得。

在一些实施方案中,包含含有至少一个经过修饰的FAD3基因座的植物细
胞的转基因植物或植物材料可以表现出这样的一个或多个特征:在植物细胞内
表达靶向性核酸内切酶;在植物细胞内(或者在其中的质体内)表达感兴趣的多
肽;在植物细胞的细胞核内表达靶向性核酸内切酶;靶向性核酸内切酶定位在
植物细胞内;整合在植物细胞基因组中的FAD3基因座处;编码感兴趣多肽的
核苷酸序列或农艺学基因整合在植物细胞基因组中的FAD3基因座处;和/或
存在与整合在植物细胞基因组FAD3基因座处的编码序列对应的RNA转录本。
这样的植物可以额外具有一个或多个期望的性状,包括例如但不仅限于,通过
内源或转基因核苷酸序列表达产生的性状,表达受到感兴趣多肽或整合在植物
细胞基因组FAD3基因座处的农艺学基因调节的性状;抗昆虫、其它害虫和致
病剂;抗除草剂;增加稳定性、产量或保质期;环境耐受;药物生产;工业产
品生产;和营养增强。

根据本发明的转基因植物可以是任何能够根据本文所述的方法被核酸转
化、该核酸随后整合到至少一个FAD3基因座中的植物。因此,植物可以是双
子叶植物或单子叶植物。可用于本方法的双子叶植物的非限制性实例包括拟南
芥,紫花苜蓿,豆类,西兰花(broccoli),卷心菜,芥花,胡萝卜,花椰菜
(cauliflower),芹菜,大白菜,棉花,黄瓜,茄子,莴苣,甜瓜,豌豆,胡椒,
花生,马铃薯,南瓜(pumpkin),萝卜,油菜,菠菜,大豆,倭瓜(squash),甜
菜,向日葵,烟草,番茄,和西瓜。可用于本方法的单子叶植物的非限制性实
例包括玉米,大麦,洋葱,水稻,高粱,小麦,黑麦,粟,甘蔗,燕麦,黑小
麦,稷,和草坪草。根据本发明的转基因植物可以用任何方式使用或培养。

一些实施方案还提供了由本发明的转基因植物生产的商业产品。商业产品
包括,例如但不仅限于:含有一个或多个整合在至少一个FAD3基因座处的核
苷酸序列的植物的食品、谷物粗粉(meal)、油,或压碎的或全谷粒或种子。在
一种或多种商品或商业产品中检测到一个或多个这样的核苷酸序列事实上证
明该商品或商品产物的至少一部分是由根据本发明的实施方案产生的转基因
植物产生的。在一些实施方案中,包含在基因组中含有至少一个经过修饰的
FAD3基因座的植物细胞的转基因植物或种子,可能在其基因组中含有至少一
个其它的转基因事件,包括但不限于:RNAi分子被转录的转基因事件;编码
杀虫蛋白(例如,苏云金芽孢杆菌杀虫蛋白)的基因;除草剂抗性基因(例如,
提供对草甘膦抗性的基因);和有助于转基因植物的期望表型的基因(例如,
增加产量,改变脂肪酸代谢,或恢复细胞质雄性不育)。

包含含有至少一个经过修饰的FAD3基因座的植物细胞的转基因植物可
以具有一种或多种期望的性状。这样的性状可以包括,例如:抗昆虫、其它害
虫和致病剂;抗除草剂;增加稳定性、产量或保质期;环境耐受;药物生产;
工业产品生产;和营养增强。期望的性状可以由一个或多个通过靶向重组被整
合在FAD3基因座处的核酸分子赋予,这些核酸分子在显示该期望表型的植物
中表达。因此,在一些实施方案中,期望的性状可能是由于植物中存在转基因,
该转基因被引入在植物基因组中至少一个经过修饰的FAD3基因座位置处。在
另外的实施方案中,期望的性状可以通过常规育种获得,该性状可以由一个或
多个通过靶向重组被整合在至少一个经过修饰的FAD3基因座处的核酸分子
赋予。

根据本发明的转基因植物可以按照任何方式加以使用和培养,其中至少一
个经过修饰的FAD3基因座的存在是期望的。因此,植物可以如下所述工程化
而(除其他事项外)具有一种或多种期望的性状:用核酸分子进行转化,该核酸
分子随后根据本发明以位点特异性的方式被整合在至少一个FAD3基因座处,
并按照本领域技术人员已知的任何方法进行种植(crop)和培养。

VII.包含整合在FAD3性能基因座处的核酸的转基因植物的标志物辅助
育种

提供了与芸苔属植物中的Fad2和Fad3连锁(例如,紧密连锁)的分子标志
物。例如,鉴定了含有涉及HO性状(fad3)的序列的DNA片段。这些片段位
于和基因连锁群中突变等位基因连锁(例如,紧密连锁)的标志物的周围和所述
标志物之间。因此,还提供了包含具有失活突变的突变体FAD3基因的核酸分
子。所鉴定的片段及其标志物被包含在本主题中,这部分是由于它们在欧洲油
菜基因组连锁群中的位置。

本文引用在这里引用的全部参考文献,包括出版物、专利和专利申请,的
内容作为参考,它们与本公开的具体细节没有冲突,因此在这里引用它们的内
容就如同每一篇参考文献被单独且具体地引用并且在本文中阐述了其全部内
容一样。提供本文所讨论的参考文献仅仅是由于它们在本申请的申请日期之前
被公开。本文的任何内容均不应被理解为由于先前发明而承认本发明人没有资
格先于这些公开内容。提供了这样的实施例以举例说明某些特定的特征和/或
实施方案。这些实施例不应被理解为将本公开限制于所举例的这些特定的特征
或实施方案。

实施例

实施例1:从细菌人工染色体文库鉴定FAD3靶序列

BAC文库构建

细菌人工染色体(BAC)文库来自商业供应商(AmpliconExpress,Pullman,
WA)。BAC文库包含110,592个BAC克隆,其含有从欧洲油菜L.var.DH10275
分离的高分子量基因组DNA(gDNA)片段。gDNA用BamHI或HindIII限
制酶消化。将大约135Kbp的分离gDNA片段连接到pCC1BAC载体
(Epicentre,Madison,WI)中,并转化进入大肠杆菌DH10B株(Invitrogen)。BAC
文库由相同数目的用两种不同限制酶构建的BAC克隆构成。这样,HindIII
构建的BAC文库包含在144个单独的384孔板中。类似地,BamHI构建的
BAC文库包含在144个单独的384孔板中。总共分离了110,592个BAC克
隆,并排列在288个单独的384孔板中。288个单独的384孔板的每一个均
由供应商作为用于快速PCR筛选的单个DNA提取体系提供。最终的BAC
文库覆盖大约15Gbp的gDNA,其对应于欧洲油菜L.var.DH10275基因组
的12倍基因组覆盖(欧洲油菜L.的基因组估计为大约1.132Gbp,如Johnston
etal.(2005)AnnalsofBotany95:229-235所述)。

从BAC文库分离的FAD3编码序列的序列分析

使用构建的BAC文库分离FAD3基因编码序列。进行测序实验从欧洲
油菜L.var.DH10275中鉴定6个FAD3基因同源和旁系同源物的特定基因序
列。

FAD3基因序列最初是在模式物种拟南芥中被鉴定的。该基因序列收录
在Genbank中,基因座标签为At2g29980。模式植物物种拟南芥与二倍体芜
菁(其是四倍体欧洲油菜的一个祖先)之间的比较基因组关系先前已有描述
(Schranzetal.(2006)TrendsinPlantScience11(11):535-542)。具体就FAD基
因而言,比较分析预测在二倍体欧洲油菜基因组中可能存在该基因的3-4个
拷贝。Scheffleretal.(1997)TheoreticalandAppliedGenetics94;583-591完成
了进一步的基因定位研究。这些基因定位研究的结果表明,欧洲油菜中存在
FAD3基因的6个拷贝。

先前聚焦于欧洲油菜FAD3基因的测序工作已经鉴定出了A和C基因
组的特定拷贝并加以基因定位(Huetal.,(2006)TheoreticalandApplied
Genetics,113(3):497-507)。先前已经由AndrewSharpe(Agricultureand
Agri-foodCanada,107SciencePlace,Saskatoon,Saskatchewan)从植物品系
DH12075构建了来自种子特异性cDNA文库的EST序列的集合并进行了测
序。由于来自双单倍体芥花植物DH12075的全长基因序列的EST集合不可
得,而且也不能获得关于序列质量和正确读出的核苷酸的置信度的指示。因
此,不同FAD基因序列读取之间的序列变异不能被明确地归因于FAD3基
因家族的各种同源物和旁系同源物的不同基因拷贝,也不能获得基因组序列。
然而,当对Huetal.,(2006)所述的EST以及两个FAD3A和FAD3C全长基
因序列进行合并序列分析时,鉴定了与两者基因均匹配的EST以及额外的4
种单倍型。结果,总共鉴定了FAD3的6种独特的单倍型。在组装了各种FAD3
单倍型的全部可得数据之后,鉴定了外显子1中的高水平外显子序列变异。
外显子1中的FAD3序列变异被认定为设计基因/等位基因特异性PCR引物
提供了机会。此外,鉴定了在单倍型之间具有最小差异的外显子(例如外显
子5,6,7和8在FAD3A和FAD3C之间有1-3bp的差异)或者没有序列变
异的外显子(例如,外显子2和3)。

从欧洲油菜L.var.DH10275构建的BAC文库的测序分析结果分离了6
个BAC序列(SEQIDNO:1,SEQIDNO:2,SEQIDNO:3,SEQIDNO:4,SEQ
IDNO:5,和SEQIDNO:6),从中确定了FAD3A(SEQIDNO:7),FAD3A’
(SEQIDNO:8),FAD3A”(SEQIDNO:9),FAD3C(SEQIDNO:10),FAD3C”
(SEQIDNO:11),和FAD3C’(SEQIDNO:12)基因的编码序列。FAD3A,
FAD3A’,FAD3A”,FAD3C,FAD3C”,和FAD3C’的基因序列被鉴定和基因定
位。

6个FAD3基因的序列分析使用序列比对程序和邻接树利用同一性百分
比加以实施。序列比对使用VectorNTIAdvance11.0计算机程序(Life
Technologies,Carlsbad,CA)的程序实施,如图1所示。使
用经过修改的ClustalW算法生成蛋白质或核酸序列的多个序列比对结果,
用于相似性比较和注释。邻接树用Jalview软件产生,并如图2所示。
(Waterhouseetal.(2009)Bioinformatics25(9)1189-1191)。使用被鉴定含有
FAD3基因的重叠群(contig)作为BLASTn查询(queries),检索拟南芥基因数
据库。通过与拟南芥FAD3基因(Genbank登录号No:At2g29980)进行比较而
鉴定了6个的重叠群中每一个的含有FAD3基因的区域。然后,将FAD3重
叠群进行定向,使得所有FAD3基因均沿着5’到3’方向。在可能的情况下,
FAD3重叠群被修改成含有多达2个上游(5’)和1个下游(3’)拟南芥基因。一
旦定向,从每个重叠群中提取FAD3基因的完整编码区并用于生成邻接树,
以显示不同FAD3基因家族成员之间的关系。将6个FAD3家族成员比对成
3对FAD3基因(图2)。

基于PCR的筛选

设计了一系列PCR引物用于筛选前述的BAC文库。引物或者被设计成
通用引物,其能够扩增该基因家族的所有成员,或者被设计成基因特异性引
物,用于靶向等位基因扩增。PCR引物被设计成20bp长度(+/-1bp),并且
G/C含量为50%(+/-8%)。表1列举了设计并合成的引物。汇集BAC文库的
克隆,并通过聚合酶链式反应(PCR)进行筛选。

表1:用于PCR扩增FAD3序列的引物序列

引物名称:
SEQ ID NO:
序列
D_uni_F3_F1
SEQ ID NO:13
GAATAAGCCATCGGACACAC
D_spec_F3_F2
SEQ ID NO:14
ATGCGAACGGAGACGAAAGG
D_spec_F3_F3
SEQ ID NO:15
TGTTAACGGAGATTCCGGTG
D_spec_F3_F4
SEQ ID NO:16
GTAGCAATGTGAACGGAGAT






D_uni_F3_R1
SEQ ID NO:17
CAGTGTATCTGAGCATCCG
D_spec_F3_R2
SEQ ID NO:18
GTGGCCGAGTACGAAGATAG
D_spec_F3_R3
SEQ ID NO:19
CAGTAGAGTGGCCAGAGGA

使用两组不同的条件进行聚合酶链式反应(PCR)。第一组PCR反应条件
包括:1XPCR缓冲液(含有dNTPs);1.5mMMgCl2;200μM的0.25U
DNA聚合酶(Bioline,London,UK);250nM每种引物;和大约
5-10ng模板DNA。第二组PCR反应条件被开发用于扩增基因组DNA,并
且包括:5-10ng基因组DNA,1XPCR缓冲液,2mMdNTPs,0.4μM正向和
反向引物,和0.25UDNA聚合酶(Bioline,London,UK)。将试剂
汇集至终体积为13μL,并使用MJ热循环仪(BioRad,Hercules,CA)
或ABI9700GeneAmp(LifeTechnologies,Carlsbad,CA)进行扩增。
对特定平板的基于PCR的筛选使用4维筛选方法实施,其是基于Bryan等
人(ScottishCropsResearchInstituteannualreport:2001-2002)所述的系统并使
用上述PCR条件。在对汇集的BAC文库进行基于PCR的筛选之后,使用
直接Sanger测序方法对扩增的PCR产物进行测序。扩增的产物用乙醇、乙
酸钠和EDTA按照v3.1方案(AppliedBiosystems)进行纯化,并在
自动毛细管电泳平台上进行电泳。

在基于PCR的筛选和构象Sanger测序之后,鉴定含有各种不同FAD3
基因家族成员的平板集合。总共鉴定了6个独特的FAD3同源物和旁系同源
基因序列(表2)。每个FAD3基因序列的总共2个平板被选择进行平板筛选,
以鉴定平板内含有FAD3基因的特定孔和克隆(表2)。为两个平板均鉴定特
定的孔,并为FAD3基因家族的每个成员选择一个单独的克隆(表2)。

表2:鉴定与精细(detailed)PCR引物组合具有阳性反应的BAC克隆平板和继
续用于在平板内进行克隆鉴定的两个平板的身份


通过测序对每个已鉴定的FAD基因家族成员的单个BAC克隆进行进一
步的分析。使用LargeConstruct试剂盒(Qiagen,Valencia,CA)按照制造商
的使用说明为BAC克隆分离DNA并准备用于测序。使用GS-FLXTitanium
(Roche,Indianapolis,IN)按照制造商的使用说明准备用于测序
的提取BACDNA。测序反应使用物理分区的(sectored)GS-FLXTIPico-滴定
利用成对收集的BAC实施,用于优化数据输出。成对合并BAC,其中
FAD3基因与FAD3基因配对。产生的全部序列数据用Newbler
(454LifeSciences,Branford,CT)组装。组装的重叠群(contig)使用Sequencher
(GeneCodes,AnnArbor,MI)手动分析相应FAD基因的存在。

在鉴定并完全表征了所有6个FAD3基因的全基因组序列之后,设计锌
指核酸酶用于结合每个特定基因家族成员的序列。

实施例2:特异针对FAD3基因的锌指结合结构域的设计

针对编码FAD3基因座各种功能序列的DNA序列的锌指蛋白的设计如
前所述。参见例如Urnovetal.(2005)Nature435:646-651。示例性靶序列和识
别螺旋如表3(识别螺旋区设计)和表4(靶位点)所示。在表4中,与ZFP识别
螺旋接触的靶位点的核苷酸用大写字母指示;非接触的核苷酸用小写字母指
示。锌指核酸酶(ZFN)靶位点被设计成结合FAD3的7个靶位点。FAD3锌指
设计被合并在锌指表达载体中,其编码具有至少一个具有CCHC结构的锌指
的蛋白质。参见,美国专利公开No.2008/0182332。特别地,每个蛋白的最
后一个指具有用于识别螺旋的CCHC骨架。非规范的锌指编码序列通过一个
四氨基酸ZC接头和来自玉米的opaque-2核定位信号与IIS型限制酶FokI
的核酸酶结构域(Wahetal.,(1998)Proc.Natl.Acad.Sci.USA95:10564-10569
的序列的氨基酸384-579)融合,形成FAD3锌指核酸酶(ZFNs)。融合蛋白的
表达受到相对较强的组成型启动子驱动,例如来自木薯脉花叶病毒(CsVMV)
启动子的启动子,并且侧翼是根癌土壤杆菌ORF233’非翻译区(AtuORF23
3’UTRv1)。在克隆到构建体中的两个ZFN之间添加来自明脉扁刺蛾(Thosea
asigna)病毒的自水解2A编码核苷酸序列(Szymczaketal.,2004)。示例性载体
如下文所述。

使用先前显示用于鉴定活性核酸酶的基于出芽酵母的系统验证最优的
锌指的剪切活性。参见例如美国专利公开No.20090111119;Doyonetal.(2008)
NatBiotechnol.26:702–708;Geurtsetal.(2009)Science325:433。用于多种功
能性结构域的锌指被选择用于体内使用。在被设计、产生和测试与假定FAD
基因组多核苷酸靶位点结合的大量ZFN中,有15个ZFN被鉴定具有高水平
的体内活性,并被选择用于进一步的实验。这些ZFN被表征为能够高效结
合和剪切植物内的独特FAD3基因组多核苷酸靶位点。

表3:FAD3锌指设计




表4:FAD3锌指的靶位点

ZFP
靶位点(5’到3’)
SEQ ID NO:
27961
cgCCGGAGAAAGAGAGAGAGctttgagg
SEQ ID NO:20
27962
tgGTTGTCGCTATGGACcagcgtagcaa
SEQ ID NO:21
27969
tcTCCGTTcGCATTGcTACGCTggtcca
SEQ ID NO:22
27970
gaAAGGTTtGATCCGAGCGCAcaaccac
SEQ ID NO:23
27973
tcTCCGTTcGCATTGcTACGCTggtcca
SEQ ID NO:22
27974
tcGGAGATATAAGGGCGGCCattcctaa
SEQ ID NO:25
27987
taGCCCAGAACAGGGTTccttgggcggc
SEQ ID NO:26
27988
ctTCGTACTCGGCCACGactggtaattt
SEQ ID NO:27

27989
ttGAAGTTGCAaTAAGCTttctctcgct
SEQ ID NO:28
27990
acTTGCTGGTCGATCATGTTggccactc
SEQ ID NO:29
27991
aaGTAGTTGAAGTTGCAataagctttct
SEQ ID NO:30
27992
tgGTCGATCATGTTGGCcactcttgttt
SEQ ID NO:31
28004
aaCGAGAATGAAGGAATGAAgaatatga
SEQ ID NO:32
28005
atACCATGGTTGGTAAGtcatttatttt
SEQ ID NO:33
28021
ccAACGAGgAATGATAGAtaaacaagag
SEQ ID NO:34
28022
caGTCACAGTTcTAAAAGtctatggtgt
SEQ ID NO:35
28023
tgTGACTGGACcAACGAGgaatgataga
SEQ ID NO:36
28024
tcTAAAAGTCTATGGTGttccttacatt
SEQ ID NO:37
28025
cgCCGGAGAAAGAGAGAGCTttgaggga
SEQ ID NO:38
28026
tgGTTGTCGCTATGGACcagcgtagcaa
SEQ ID NO:21
28035
ctTAAACGGTGGTTgTGCGCTcggatca
SEQ ID NO:40
28036
tcGGAGATATAAGGGCTGCGattcctaa
SEQ ID NO:41
28039
tcTCCGATctTAAACGGTGGTTgtgcgc
SEQ ID NO:42
28040
atAAGGGCTGCGATTCCtaagcattgtt
SEQ ID NO:43
28051
agATGGCCCAGAAAAGGgttccttgggc
SEQ ID NO:44
28052
cgTACTCGGCCACGactggtaatttaat
SEQ ID NO:45
28053
ttGAAGTTGCAaTAAGCTttctctcgct
SEQ ID NO:28
28054
acTTGCTGGTCGATCGTGTTggccactc
SEQ ID NO:47
28055
aaGTAGTTGAAGTTGCAataagctttct
SEQ ID NO:30
28056
tgGTCGATCGTGTTGGCcactcttgttt
SEQ ID NO:49

实施例3:锌指核酸酶剪切FAD3基因的评估

构建体组装

含有使用如实施例2所述的酵母测定法而鉴定的示例性锌指核酸酶的
ZFN表达构建体的质粒载体使用本领域公知的技术设计并制成。每个锌指编
码序列与位于锌指核酸酶的上游的编码opaque-2核定位信号(Maddalonietal.
(1989)Nuc.AcidsRes.17(18):7532)的序列融合。

接着,将opaque-2核定位信号::锌指核酸酶融合序列与互补的opaque-2
核定位信号::锌指核酸酶融合序列配对。这样,每个构建体含有由两个
opaque-2核定位信号::锌指核酸酶融合序列构成的单个开放阅读框,两个融
合序列被来自明脉扁刺蛾(Thoseaasigna)病毒的2A序列(Mattionetal.(1996)
J.Virol.70:8124-8127)分隔。融合蛋白的表达受到相对较强的组成型启动子
驱动,例如来自木薯叶脉花叶病毒(CsVMV)启动子的启动子,并且侧翼是根
癌土壤杆菌ORF233’非翻译区(AtuORF233’UTR)。

载体用IN-FUSIONTMAdvantageTechnology(Clontech,MountainView,
CA)组装。限制性核酸内切酶从NewEnglandBioLabs(NEB;Ipswich,MA)获
得,并使用T4DNA连接酶(Invitrogen)进行DNA连接。质粒制备使用
质粒试剂盒(Macherey-NagelInc.,Bethlehem,PA)或Plasmid
Midi试剂盒(Qiagen)按照制造商的使用说明进行。DNA片段在琼脂糖Tris-
乙酸凝胶电泳之后使用QIAquick凝胶提取试剂盒TM(Qiagen)进行分离。所有
已组装质粒的菌落通过微量制备的DNA的限制性消化进行最初筛选。对选
出的克隆的质粒DNA通过商业测序载体(EurofinsMWGOperon,Huntsville,
AL)进行测序。序列数据使用SEQUENCHERTM软件(GeneCodesCorp.,Ann
Arbor,MI)进行组装和分析。在递送到欧洲油菜原生质体之前,使用PureYield
PlasmidMaxiprep(PromegaCorporation,Madison,WI)或Plasmid
Maxi(Qiagen,Valencia,CA)按照供应商的使用说明从大肠杆菌培养物
制备质粒DNA。

所得的11个质粒构建体通过限制酶消化和并DNA测序得到了确认:
pDAB107824(ZFNs28025-2A-28026),pDAB107815(ZFNs27961-2A-27962),
pDAB107816(ZFNs27969-2A-27970),pDAB107817(ZFNs27973-2A-27974),
pDAB107825(ZFNs28035-2A-28036),pDAB107826(ZFNs28039-2A-28040),
pDAB107818(ZFNs27987-2A-27988),pDAB107827(ZFNs28051-2A-28052),
pDAB107821(ZFNs28004-2A-28005),pDAB107819(ZFNs27989-2A-27990),
pDAB107828(ZFNs28053-2A-28054)(图3),pDAB107829(ZFNs
28055-2A-28056)(图4),pDAB107820(ZFNs27991-2A-27992),pDAB107822
(ZFNs28021-2A-28022)和pDAB107823(ZFNs28023-2A-28024)。

用于转染的DNA的制备

上述载体的质粒DNA通过沉淀,在100%(v/v)乙醇中清洗,并在层流
净化罩内干燥进行灭菌。将DNA沉淀(pellet)重悬于30μL无菌双蒸水中,
终浓度为0.7μg/μl,用于如下所述地转染进入原生质体细胞中。进行质粒
DNA制备,产生用于瞬时转染的超螺旋质粒DNA和用于稳定转染的线性化
质粒DNA。对于原生质体细胞的瞬时转染,不需要向转化质粒中添加载体
DNA(例如,鱼精DNA)。对于瞬时研究,每次转染中,每106个原生质体使
用大约30μg质粒DNA。

转染

欧洲油菜L.var.DH10275的转染如Spangenbergetal.,(1986)Plant
Physiology66:1-8所述实施,培养基配方如pangenbergG.andProtrykusI.
(1995)PolyethyleneGlycol-MediatedDirectGeneTransferinTobacco
Protoplasts,其集录于:GeneTransfertoPlants.(ProtrykusI.andSpangenbergG.
Eds.)Springer-Verlag,Berlin所述。欧洲油菜的种子用70%乙醇表面灭菌。将
种子浸没在12mL70%乙醇溶液中,并通过轻柔摇动该混合物(cocktail)10分
钟进行混合。通过倾倒溶液除去70%乙醇溶液,并用1%w/v次氯酸钙和0.1%
v/v吐温-20的种子灭菌溶液进行交换。将种子浸没在种子灭菌溶液中,并通
过轻柔摇动该混合物(cocktail)25分钟进行混合。倾倒种子灭菌溶液,并将经
过灭菌的种子在50mL无菌水中漂洗3次。最后,将种子转移到无菌80mm
Whatman滤纸盘(Fisher-Scientific,St.Louis,MO)上,其置于培养皿(Petri
dish)中,并用无菌水将种子稍微饱和。培养皿用(Fisher-Scientific,
St.Louis,MO)密封,并将平板在25℃下完全黑暗温育1-2天。在可以从种
子观察到幼苗萌发迹象之后,将幼苗转移到含有凝固的GEM培养基的培养
皿中,以易化进一步的种子萌发。幼苗在GEM培养基上25℃温育4-5天。

向无菌培养皿中倾倒一定体积的液体PS培养基(大约10mL)。使用无
菌镊子和手术刀除去并丢弃处于生长和发育4叶期的4-5日龄幼苗的地上部
分。确定长度为20-40mm的下胚轴节段产生的富含细胞质的小原生质体的
群体最高。将下胚轴节段无菌切下并转移到液体PS培养基中。将切下的下
胚轴节段合在一起,横切成5-10mm节段。接着,将下胚轴节段转移到新鲜
PS培养基中,并在室温下温育1小时。将质壁分离的下胚轴转移到含有酶
溶液的培养皿中。将全部下胚轴节段小心地浸没在溶液中。用
封培养皿,并在轻柔摇动下20-22℃过夜温育16-18小时。

原生质体细胞从下胚轴节段释放。轻轻搅拌下胚轴的过夜消化物,使原
生质体释放到酶溶液中。将培养皿略微倾斜,以帮助转移酶溶液和植物碎片
的消化悬液。使用10mL移液管将消化悬液转移到无菌的原生质体过滤单元
(100微米网筛滤器)中,进一步分离原生质体和植物碎片。轻扣过滤单元,
以释放被筛网捕获的多余液体。轻柔混合大约8-9mL的原生质体悬液,并
分配到14mL无菌塑料圆底离心管中。每个悬液用1.5mLW5溶液覆盖。将
W5溶液小心置于原生质体悬液上,以一定的角度并逐滴添加,以便使扰动
最小化。向原生质体悬液添加W5溶液导致产生富含原生质体的界面。这个
界面用移液管进行收集。接着,将收集的原生质体转移到一个新的14mL离
心管中,并轻轻混合。将所产生或获得的原生质体用血细胞计数器进行检测,
以确定每毫升中原生质体的数量。重复本方法,其中消化叶片组织以产生叶
肉原生质体。

接着,添加W5溶液到10mL的体积,并在70g离心原生质体,然后除
去W5溶液。通过轻轻摇晃将剩余的原生质体悬浮液重新悬浮。含有原生质
体悬浮液的每个管中填充5mLW5溶液,并在室温下温育1-4小时。在70g
离心原生质体悬液,并除去全部的W5溶液。接着,向每个含有分离的原生
质体的沉淀原生质体悬液中添加300μL转化缓冲液。向每个管中添加10μg
质粒DNA到原生质体悬液中。质粒DNA含有如上所述的锌指核酸酶构建
体。接着,向原生质体悬液中添加300μL预热的PEG4000溶液,并轻轻叩
击管。将原生质体悬液和转化混合物在室温下温育15分钟,不进行任何搅
拌。以每份1mL,1mL,1mL,2mL,2mL和3mL的量向每个管中顺序添加
额外的10mLW5溶液,并在每次添加W5溶液之间将管轻轻颠倒。通过70g
离心沉淀原生质体。除去全部的W5溶液,留下纯的原生质体悬液。

接着,向离心沉淀的原生质体细胞添加0.5mLK3培养基,并将细胞重
悬浮。将重悬的原生质体细胞置于培养皿的中心,和1:1浓度的5mLK3和
0.6mLSeaPlaqueTM琼脂糖(Cambrex,EastRutherford,NJ)。单次轻柔涡旋运动
摇动培养皿,并在室温下温育20-30分钟。培养皿用密封,并将原
生质体在完全黑暗下培养24小时。在黑暗中温育后,将培养皿在昏暗光
(OsramL36W/21Lumilux日光灯(whitetube),5μMolm-2s-1)下培养6天。在
培养步骤后,使用无菌刮刀将含有原生质体的琼脂糖切分成四份。将分离的
四等分物置于含有20mLA培养基的250毫升塑料培养容器中,并在旋转摇
床上以80rpm和1.25cm冲程(throw)在24℃下在连续昏暗的灯光下温育14
天,然后分析确定每个ZFN构建体的活性水平。

从芥花原生质体分离基因组DNA

将经转染的原生质体置于在单独的1.5或2.0mL微离心管中。将细胞离
心沉淀在含有缓冲溶液的管的底部。DNA提取如下实施:将细胞在液氮中
速冻,然后在LabconcoFreezone(Labconco,KansasCity,MO)中在-40℃
和大约133x10-3mBar压强下冷冻干燥细胞大约48小时。使用
(QIAGEN,Carlsbad,CA)植物试剂盒对冻干的细胞进行DNA提取,按照制造
商的使用说明进行,只是不需要组织破坏,而是将原生质体细胞直接添加到
裂解缓冲液中。

用于在芥花原生质体中进行基因组DNA序列剪切的FAD3A和FAD3C
ZFN的测试

将FAD3A和FAD3C基因座中的ZFN靶位点的设计进行聚类,从而设
计出覆盖靶位点的多对ZFN。ZFN靶位点的聚类使得人们能够设计PCR引
物,使之能够从所有FAD3A和FAD3C基因家族成员扩增100bp窗口内的
侧翼基因组序列,从而涵盖全部的覆盖ZFN靶位点。这样,Illumina短读取
序列技术可用于评估被转染的原生质体中靶ZFN位点的完整性。此外,设
计的PCR引物需要包括这样的特定核苷酸碱基,其可将序列读取归结于
FAD3A和FAD3C家族的特定基因成员。因此,需要全部的PCR引物在距
离任何ZFN靶切割位点5-10个核苷酸处结合,因为已知非同源末端连接
(NHEJ)活性可导致小的缺失,这些小的缺失能够除去引发位点,抑制扩增,
从而干扰NHEJ活性的评估。

引物被设计成结合FAD3A和FAD3C基因家族全部的ZFN靶基因座(表
5),并通过对PCR扩增产物进行基于Sanger的测序,经验性地测试它们对
全部基因家族成员的扩增。在若干情况下,无法建立能够区分全部基因家族
成员的引物(表6),然而,在所有情况下,FAD3A和FAD3C的靶基因序列
可以被区分。在PCR引物设计之后,将定制的DNA条码(barcode)序列纳入
到PCR引物中,这些条码序列可用于区分不同的ZFN靶基因座,并鉴定对
转染和ZFN的特定序列读取(表5和6)。

表5:所设计的PCR引物对FAD3基因家族的扩增性能。“X”表示基因拷
贝检测特异性,灰色阴影和“+”表示在讨论的特定基因座由两个引物设计
的序列读取无法区分,“N/A”表示基因座不能从这些特定的基因拷贝扩增


表6:设计用于评估FAD3ZFN活性的引物序列。引物包括定制的条码,连
同两个必要的用于构建供测序合成分析的Illumina文库的Illumina衔接子
序列。所购引物是所给出的全部三个列的总和。



在对被ZFN转染的芥花原生质体进行DNA提取之后,对靶ZFN基因
座进行PCR扩增,以便以正确的格式产生必需的基因座特异性DNA分子,
用于通过合成技术的基于Illumina的测序。每个测定经过优化以便在25ng
起始DNA(欧洲油菜基因组的大约12,500个细胞的当量)上工作。为每个样
品进行多个反应,以提供以合适的水平评估NHEJ效率和特异性所需的覆盖
率,大约16个PCR反应相当于从单个原生质体获得的欧洲油菜基因组的
200,000个拷贝。为所有使用相同的测定的待测试的样品制备PCR扩增主预
混物(master-mixes);用曾被用于确定要对靶组织实施的最佳循环数的定量
PCR方法测定一个3个重复的反应,以确保PCR扩增未受到试剂限制,并
且仍然处于指数扩增阶段。实验以及必要的阴性对照反应以96孔格式使用
MX3000P(Stratagene,LaJolla,CA)实施。

根据从定量PCR平台收集的输出对荧光的逐循环相对增加描点作图,
并为每个测定确定能够输送足够的扩增同时又不会使反应受到试剂限制的
循环数,以试图减少过度循环和共有转录本或分子的扩增。将未使用的主预
混物保持在冰上直至定量PCR分析完成且循环数得以确定,然后分装到期
望数目的反应管中(每个ZFN测定大约16个),并进行PCR反应。

扩增后,将单个ZFN基因座的样品汇集在一起,并使用MinElutePCR
纯化试剂盒(Qiagen)按照制造商的使用说明对每个ZFN的200μL汇集产
物进行清洁。为了使样品能够用Illumina短读取技术进行测序,需要通过扩
增将额外的配对末端引物附接到已产生的片段上。这通过PCR扩增实现,
PCR扩增使用的引物与在第一轮扩增中添加的序列部分互补,但还含有所需
的配对末端序列。使用经过了如前所述的定量PCR循环分析的样品,再次
确定要实施的PCR循环的最佳数目,PCR循环的最佳数目能够向模板添加
配对末端引物但不会过度扩增共有片段。

在PCR扩增之后,使用MinElute柱(Qiagen)按照制造商的使用说明
对所产生的产物进行清洁,并在2.5%琼脂糖凝胶上进行分离。DNA片段用
Safe(LifeTechnologies,Carlsbad,CA)可视化,对具有正确大小的条带
进行凝胶提取,除去任何残余的PCR产生的引物二聚体和其它假片段,使
用MinElute凝胶提取试剂盒(Qiagen)按照制造商的使用说明从凝胶片提
取DNA。在完成凝胶提取后,使用AMPure磁珠(Beckman-Coulter,Brea,CA)
对DNA进行额外的清洁,DNA与珠子比例为1:1.7。然后,使用基于定量
PCR的文库定量试剂盒估测DNA浓度,以1/40,000和1/80,000稀释用于
Illumina测序(KAPA),反应实施三个重复。根据定量PCR结果,将DNA稀
释成2nM的标准浓度,并合并所有的文库用于DNA测序。使用cBotcluster
generation(Illumina,SanDiego,CA)制备用于测序的样品,并在Illumina
上按照制造商的使用说明进行测序,实施100bp配对末端测序读取。

用于检测靶锌指位点处非同源末端连接的数据分析方法

在完成测序反应并使用用于碱基识别(basecalling)的Illumina生物信息
管道(pipeline)进行原始数据读出之后,实施完全分析来鉴定每种情况下靶
ZFN位点处缺失的碱基。设计定制的PERL脚本(script)从DNA序列中根据
一系列输入序列用计算机提取和分选条码。条码必须以大于30的Phred得
分与参考序列相匹配,以减少错误指认(misattributing)的序列读取。在序列读
取被分选到所用的不同条码组中之后,对所有序列进行质量过滤。质量过滤
是第二种定制开发的PERL脚本。如果有三个碱基被读出为“N”,或者如果
中位数Phred得分小于20,或者有三个连续碱基的Phred得分小于20,或者
序列读取的长度小于40bp,则排除该序列读取。使用
(SoftGenetics,StateCollege,PA)软件包合并剩余的序列,其中两个配对序列
读取均可获得。然后,使用第三种定制的PERL脚本将剩余的合并序列读取
减小为一组唯一的序列读取,将被鉴定的冗余序列的数目计数记录在剩余序
列识别器的末端。然后,使用软件将唯一的序列读取与FAD3
参考序列进行比对,产生有缺口的FASTA比对文件。

使用该带缺口的FASTA文件,使用第四种定制的PERL脚本将有缺口
的碱基位置编号转换成输入参考。这能够在组装的数据中鉴定这样的碱基,
其可以区分不同的基因家族成员(不同基因家族成员之间的同源或旁系同源
序列变异)。一旦实施了碱基编号的转换,便有可能为每个唯一的序列读取
产生单倍型报告,并将该读取指派到特定的基因家族成员。一旦读取被基因
分组,便可以在ZFN靶位点周围鉴定并评估一个10bp的窗口。记录每个基
因具有缺失的序列数目和错配碱基的数目。

然后,将数据图形显示为多线图,图上有每10,000个序列读取中在靶
ZFN位点处具有1-10个碱基缺失的序列的数目。为所有ZFN转染以及对照
转染实施这种分析。在几种情况下,天然DNA序列中的重复导致靶ZFN位
点中的测序错误增加,这种错误可以一般性地视为在所有样品中(包括被
ZFN转染的和被对照转染的)被报告的单碱基缺失的普遍增加。

从这些结果,在FAD3A和FAD3C靶位点处观察到了最高水平的ZFN
活性,如根据更大的NHEJ活性确定的。选择质粒pDAB107828(即ZFN28053
和28054)和pDAB107829(即ZFN28055和28056)上编码的ZFN用于在植
物内靶向工程化的转基因整合平台(ETIP),这是考虑到它们具有显著的基因
组DNA剪切活性和最小的非靶活性等特征。

实施例4:用于工程化的转基因整合平台(ETIP)芥花植物品系的DNA构
建体

下面描述的质粒载体是使用本领域技术人员公知的方法和技术构建的。
本段所描述的具体试剂和技术的应用是本领域技术人员容易知道的,并且容
易和其它试剂和技术交换,以实现构建质粒载体构建体的理想目的。限制性
核酸内切酶从NewEnglandBioLabs(NEB;Ipswich,MA)获得。连接用T4
DNA连接酶(Invitrogen,Carlsbad,CA)完成。Gateway反应使用
LR酶预混物(Invitrogen)实施,用于将一个进入载体
(entryvector)组装到单个目的载体中。IN-FUSIONTM反应使用IN-FUSIONTM
AdvantageTechnology(Clontech,MountainView,CA)实施,用于将一个进入
载体组装到单个目的载体中。质粒制备使用质粒试剂盒
(Macherey-NagelInc.,Bethlehem,PA)或PlasmidMidi(Qiagen)按照供应
商的使用说明实施。DNA片段在琼脂糖Tris-乙酸凝胶电泳之后使用
QIAquick凝胶提取试剂盒TM(Qiagen)提取。所选克隆的质粒DNA通过商业
测序供应商(EurofinsMWGOperon,Huntsville,AL)进行测序。序列数据用
SEQUENCHERTM软件(GeneCodesCorp.,AnnArbor,MI)组装和分析。

对照载体

使用对照载体开发基于荧光激活细胞分选(FACS)的细胞分选方法。使用
标准克隆方法构建包含两个基因表达盒的对照质粒pDAS000031(图10:T-链
插入物为SEQIDNO:85)。第一个基因表达盒包含花椰菜花叶病毒19S启动
子(CaMV19S启动子;Shillito,etal.,(1985)Bio/Technology3;1099-1103)::
潮霉素抗性基因(hph(HygR);美国专利No.4,727,028)::和根癌土壤杆菌开放
阅读框1的3'非翻译区(AtORF1终止子;Huangetal.,(1990)J.Bacteriol.
1990172:1814-1822)。第二个基因表达盒包含拟南芥泛素10启动子(AtUbi10
启动子;Callis,etal.,(1990)J.Biol.Chem.,265:12486-12493)::dsRED
(dsRED(D);美国专利No.6,852,849)和来自拟南芥的内含子(内含子#1;
GenBank:AB025639.1)::根癌土壤杆菌开放阅读框23的3'非翻译区(AtORF23
终止子;美国专利No.5,428,147),以反方向(例如,头对头方向)对框融合。
质粒载体的组装使用IN-FUSIONTMAdvantage技术(Clontech,MountainView,
CA)。

实施例5:ETIP芥花植物品系的产生

欧洲油菜的转化

用于FAD3A和FAD3C位点特异性构建体的ETIP构建体
(pDAS000271-pDAS000275)和附加的ZFN(pDAB107828和107829),和对照
物DS-Red对照构建体(pDAS000031)如前文实施例4所述。将这些二元载体
转化到根癌土壤杆菌菌株GV3101:PM90中。欧洲油菜原生质体细胞的转化
使用实施例3所述的转染方法完成,并具有一些修改。

该方案的修改包括使用海藻酸钠代替SeaPlaqueTM琼脂糖。将ZFN构建
体和ETIP构建体共递送到欧洲油菜原生质体细胞内的转染实验,用质粒
DNA摩尔比为5:1的DNA浓度完成。其它ETIP和对照质粒构建体用30μg
质粒DNA的浓度转化。

该方案的其他修改包括在含有1.5mg/mL潮霉素的培养基中从被转化
的原生质体细胞繁殖整株植物。整株植物的繁殖要求每2周更换一次A培养
基,并对原生质体来源的集落的生长进行监视。在原生质体来源的集落生长
至直径大约2-3mm后,将集落转移到含有凝固MSmorpho培养基的12孔
平板(FisherScientific,St.Louis,MO)的各个孔中。平板在连续的昏暗
光下24℃温育1-2周,直至愈伤组织的尺寸扩增到直径为8-10mm。在原
生质体细胞达到直径1-2cm后,将原生质体细胞转移到含有MSmorpho培
养基的单个250mL培养容器中。该容器在16小时光照(20μMolm-2s-1,Osram
L36W/21Lumilux白光灯管)和8小时黑暗的条件下24℃温育。在1-2周内,
可以见到多个芽。在芽长度达到3-4cm后,将芽转移到含有MS培养基的
250mL培养容器中。将250mL培养容器在16小时光照(20μMolm-2s-1
OsramL36W/21Lumilux白光灯管)和8小时黑暗的条件下24℃温育。芽保
持在该培养容器中,直至它们发育成小植株,此时将它们转移到温室中生长
至成熟。

实施例6:含有ETIP的T-DNA整合在芥花中的分子确认

使用DNeasy96PlantDNAextractionkitTM或DNeasyPlantMiniKitTM
(Qiagen)从所有推定的转基因植物叶片组织中提取基因组DNA。通过PCR
使用如下引物对每株植物的基因组DNA进行分析,即设计用于扩增virC以
检测根癌土壤杆菌的保留的引物,pTiC58正向(SEQIDNO:88
CGAGAACTTGGCAATTCC)和pTiC58反向(SEQIDNO:89
TGGCGATTCTGAGATTCC),设计用于从欧洲油菜扩增肌动蛋白以检查基因
组DNA质量的引物,肌动蛋白正向(SEQIDNO:90
GACTCATCGTACTCTCCCTTCG)和肌动蛋白反向(SEQIDNO:91
GACTCATCGTACTCTCCCTTCG),设计用于扩增由ETIP编码的hph基因
的引物,HPH正向(SEQIDNO:92TGTTGGTGGAAGAGGATACG)和HPH
反向(SEQIDNO:93ATCAGCAGCAGCGATAGC)。没有给出来自virC引物
的产物,并且在用针对肌动蛋白和hph的引物进行扩增时产生了具有正确大
小的扩增子的植物,被确认为转基因。

完成第二次筛选,其中通过PCR使用5组设计用于扩增T-DNA区之外
的二元载体的引物对每个转基因植物的gDNA进行分析[(1FSEQIDNO:94
ATGTCCACTGGGTTCGTGCC;1RSEQIDNO:95
GAAGGGAACTTATCCGGTCC)(2FSEQIDNO:96
TGCGCTGCCATTCTCCAAAT;2RSEIDNO:97
ACCGAGCTCGAATTCAATTC)(3FSEQIDNO:98
CCTGCATTCGGTTAAACACC;3RSEQIDNO:99
CCATCTGGCTTCTGCCTTGC)(4FSEQIDNO:100
ATTCCGATCCCCAGGGCAGT;4RSEQIDNO:101
GCCAACGTTGCAGCCTTGCT)(5FSEQIDNO:102
GCCCTGGGATGTTGTTAAGT;5RSEQIDNO:103
GTAACTTAGGACTTGTGCGA)]。用引物组3和4扩增出了具有正确预期大
小的PCR产物的植物被认为具有骨架整合(backboneintegration)。

使用改良的CTAB法(Maguireetal,.(1994)PlantMolecularBiology
Reporter,12(2):106-109)从没有骨架整合的植物的20g叶组织纯化DNA。分
离的gDNA用几种限制性酶进行消化,并将10μggDNA在琼脂糖凝胶上通
过电泳分离,并使用标准Southern印迹方案转移到膜上。使用DIGEasyHyb
SystemTM(Roche,SouthSanFrancisco,CA)按照制造商的使用说明对膜进行
探测。使用下列引物从ETIP构建体扩增针对每个表达盒,ELP,和内源对
照基因肌动蛋白的探针:(IPT-FSEQIDNO:104TCTCTACCTTGATGATCGG;
IPT-RSEQIDNO:105AACATCTGCTTAACTCTGGC;dsRED-FSEQID
NO:106ATGGCTTCATCTGAGAACG;dsRED-RSEQIDNO:107
TTCCGTATTGGAATTGAGG;PAT-FSEQIDNO:108
TTGCTTAAGTCTATGGAGGCG;PAT-RSEQIDNO:109
TGGGTAACTGGCCTAACTGG;ELP-FSEQIDNO:110
ATGATATGTAGACATAGTGGG;ELP-RSEQIDNO:111
AGGGTGTAAGGTACTAGCC;Hph-FSEQIDNO:112
TGTTGGTGGAAGAGGATACG;Hph-RSEQIDNO:113,
ATCAGCAGCAGCGATAGC;actin-FSEQIDNO:114
GTGGAGAAGAACTACGAGCTACCC;actin-RSEQIDNO:115
GACTCATCGTACTCTCCCTTCG)。

从所有仅含有单拷贝ETIP的植物扩增ETIP序列并测序。使用
ABI3730xITM(AppliedBiosystems,LifeTeachnologies)通过PCR产物直接测
序分析每个T-DNA插入物的序列。使用PhusionHotStartIIPolymeraseTM
(Finnzymes,ThermoFisherScientific)从基因组DNA扩增T-DNA插入物。
T-DNA的扩增反应使用多个引物对完成,以扩增长度为大约2Kbp的重叠序
列。每个PCR产物用多个引物进行测序,以确保完全覆盖。在对PCR反应
进行测序之前,用虾碱性磷酸酶和核酸外切酶I(AppliedBiosystems,Life
Technologies)处理PCR反应,使过量的引物失活。通过用8种限制性核酸内
切酶消化纯化的基因组DNA,随后用特异针对由限制性核酸内切酶产生的
悬臂的双链衔接头(adapter)进行连接,来鉴定每个单拷贝ETIP系的T-DNA
插入物的侧翼序列。在此连接步骤之后,用针对ETIP3'或5'端的生物素化引
物和针对每个接头的引物进行PCR。用Ampure固相可逆免疫(SPRI)微球
TM(AmpureSolidPhaseReversibleImmobilization(SPRI)beadsTM)(Agencourt
BioscienceCorporation,BeckmanCoulterCompany)捕获并净化PCR产物。实
施巢式PCR,所有产物用ABISanger测序和BigDyeTerminatorv3.1cycleTM
测序方案(AppliedBiosystems,LifeTechnologies)进行测序。序列数据的组装
和分析使用SEQUENCHERTM软件(GeneCodesCorp.,AnnArbor,MI)。

用锌指核酸酶和PDAS000271-PDAS000275ETIP构建体转化的ETIP转基因
芥花的结果

通过ETIP和ZFN构建体转化产生的转基因欧洲油菜事件导致来自
pDAS000273或pDAS275的ETIP多核苷酸序列的单拷贝、全长T链插入物
被整合在FAD3A基因座内,而来自pDAS000271,pDAS000272或
pDAS000274的被整合在FAD3C基因座内。对3-4个事件进行了完全表征,
并确认了其含有整合的ETIP。确认使用入-出(in-out)PCR扩增方法,并进一
步通过Southern印迹进行验证。将所选T0事件生长至T1发育阶段。对T1
植物进行再次筛选,以确定所整合T-链的接合性。将所筛选的事件分类为纯
合、半合或空(null)。

通过前述的方法使用纯合子事件产生原生质体。原生质体随后用ZFN
和供体质粒共转染,该ZFN被设计成靶向ETIP序列内纳入的锌指结合位点,
该供体质粒与ETIP的特定区域具有同源性。该ZFN剪切ETIP基因座,并
且该供体质粒通过同源性介导的修复被整合在欧洲油菜细胞的基因组内。作
为该供体质粒整合的结果,部分DS-red转基因被修复成全长DS-red转基因。
利用此时功能齐全DS-red转基因的表达来在FACS方法中分选原生质体细胞。
用实施例7中所述的FACS方法分选推定的转基因植株,并将分离的原生质
体再生成成熟植株。使用分子确认方法,确认供体质粒被整合在ETIP靶向
的植株中。这样,ETIP基因座发挥位点特异性基因座的作用,用于供体多
核苷酸序列的基因靶向整合。

实施例7:基于FACS的原生质体细胞分选

对于用DS-Red对照构建体pDAS000031转染的欧洲油菜原生质体,使
用BDBiosciencesInflux-CellsorterTM(SanJose,CA),通过FACS介导的细胞
分选法进行分选。原生质体细胞的分离和转染如实施例3所述。在细胞用
pDAS000031转染之后,使用FACS分选器利用表7所述的条件对细胞进行
分选。

表7:用于分选被pDAS000031转染的原生质体细胞的条件



分选和分离表达DS-red转基因的原生质体。FACS分离的原生质体用分
选器进行计数。在FACS分离后的第一天,将大约1x105-1.8x105个细胞置于
24孔微滴定板的孔内。将细胞转移至珠子培养历时5-20天。测试相似的条
件,其中在FACS分离后的第二天,将大约1x104个细胞置于24孔微滴定板
的孔内。测试的各种条件导致回收了具有一定活力的细胞,或者95-98%的
总分离原生质体细胞。将FACS分选的原生质体细胞转移到珠子培养历时
3-20天。在含有1.5mg/mL潮霉素的培养基上使用上述的实验方案将FACS
分选的原生质体细胞再生成植株。推定的转基因植株通过分子确认方案被确
认含有来自pDAS000031的完整T链插入物。

FACS分选方法可直接用于筛选任何荧光转基因序列,并用于分离一部
分被用荧光转基因打靶的欧洲油菜原生质体细胞,所述荧光转基因通过同源
性介导的修复被靶向在基因组基因座中ETIP区的特定位点内。

实施例8:欧洲油菜ω-3脂肪酸去饱和酶(FAD3)的介由NHEJ进行的
靶向整合和破坏

特异针对FAD3C和FAD3A的锌指结合结构域的选择

鉴定并表征了同源Fad3基因的被转录区域,设计结合并剪切这些位点
的锌指核酸酶用于供体序列的NHEJ介导的打靶。如上所述地设计针对来自
Fad3序列同源物的DNA序列的锌指蛋白(ZFN)并进行测试。从显示中靶(on
-target)活性的ZFN中,选择2个可高效切割Fad3靶标的锌指蛋白:ZFP2
8051-2A-28052识别SEQIDNO:2555’-gcccaaggaacCCTTTTCTGGGCCAT
cttcgTACTCGGCCACGactggtaatttaat-3’,并显示可特异性结合并剪切Fad3A
基因组基因座。类似地,锌指蛋白28053-2A-28054识别SEQIDNO:2565’
-agcgagagaaAGCTTAtTGCAACTTCaactacTTGCTGGTCGATCGTGTTggccact
c-3’,并显示特异性结合并剪切Fad3A和Fad3C基因组基因座。示例性靶位
点如表8所示;被ZFN识别螺旋接触的靶位点中的核苷酸用大写字母指示,
非接触的核苷酸用小写字母指示。与Fad3C不同的Fad3拷贝的核苷酸用下
划线指示。靶位点中被ZFN识别螺旋接触的核苷酸如表8所示。

表8:特异针对Fad3C(28051-2A-28052)或Fad3A和Fad3C
(28053-2A-28054)的锌指蛋白结合位点



编码特异针对FAD3C和FAD3A的锌指核酸酶的表达载体的设计和构建

将Fad3锌指设计纳入到编码具有至少一个具有CCHC结构的指的蛋白
质的锌指表达载体中(美国专利公开No.2008/0182332)。特别地,每个蛋白
中的最后一个指具有用于识别螺旋的CCHC骨架。通过4氨基酸ZC接头和
sop2核定位信号将非规范的锌指编码序列与IIS型限制性酶FokI的核酸酶结
构域(Wahetal.,(1998)Proc.Natl.Acad.Sci.USA95:10564-10569的序列的氨
基酸384-579)融合。在两个ZFN融合蛋白之间添加来自明脉扁刺蛾病毒
(Thoseaasignavirus)的自水解2A编码核苷酸序列。ZFN的表达由来自木薯
叶脉花叶病毒的强组成型启动子和5'非翻译区(UTR)驱动(Verdagueretal,
PlantMolecularBiology1996,31(6);1129-1139),且侧翼有来自根癌土壤杆菌
pTi15955开放阅读框23(ORF23)的3'UTR(Barkeretal.,PlantMolecular
Biology1983,2(6);335-50)(包括转录终止子和聚腺苷酸化位点)。

载体使用IN-FUSIONTMAdvantageTechnology(Clontech,MountainView,
CA)组装。限制性内切酶购自NewEnglandBioLabs(NEB;Ipswich,MA),并
使用T4DNA连接酶(Invitrogen)进行DNA连接。质粒的制备使用
质粒试剂盒(Macherey-NagelInc.,Bethlehem,PA)或Plasmid
MidiKitTM(Qiagen)按照供应商的使用说明实施。在琼脂糖Tris-乙酸凝胶电
泳之后,用QIAquickGelExtractionKitTM(Qiagen)分离DNA片段。对于组
装质粒的菌落,通过微量制备DNA的限制性消化进行初始筛选。选出的克
隆的质粒DNA由商业测序供应商(EurofinsMWGOperon,Huntsville,AL)进
行测序。序列数据的组装和分析使用SEQUENCHERTM软件(GeneCodes,Ann
Arbor,MI)。所得质粒构建体:pDAB107827(ZFN28051-2A-28052,图13,
SEQIDNO:273)和pDAB107828(ZFN28053-2A-28054,图14,SEQID
NO:274)通过限制酶消化并通过DNA测序进行确认。

用于NHEJ介导的DNA修复的“供体”载体的设计和构建

采用两种策略将DNA整合到Fad3中:基因剪接,其中表达盒被整合到
单个ZFN诱导的双链断裂中,和基因编辑,其中通过使用两个ZFN诱导的
双链断裂除去基因的一部分,并插入表达盒以修复该缺口。

为每种整合方法,基因剪接或基因编辑,构建了两个载体。第一个编码
turboGFP(tGFP)基因表达盒,第二个编码赋予对抗生素潮霉素抗性的基因表
达盒。tGFP表达盒包括启动子、5'非翻译区和来自拟南芥多泛素(polyubiquitin)
10(UBQ10)基因的内含子(Norrisetal,PlantMolecularBiology1993,21(5),
895-906),随后是tGFP编码序列(Evrogen,Moscow,Russia)。tGFP编码序列
被密码子优化,用于在双子叶植物中表达,并且3'非翻译区(UTR)包括根癌
土壤杆菌pTi15955开放阅读框23(ORF23)的转录终止子和聚腺苷酸化位点
(Barkeretal,PlantMolecularBiology1983,2(6),335-50)。潮霉素抗性基因表
达盒包括19S启动子,包括来自花椰菜花叶病毒(CaMV)的5'UTR(Cookand
PenonPlantMolecularBiology199014(3),391-405),随后是潮霉素磷酸转移
酶(hph)基因(KasteretalNucleicAcidsResearch198311(19),6895-6911)。hph
基因被密码子优化用于在双子叶植物中表达,并且侧翼是3’UTR,包括来自
根癌土壤杆菌pTi15955开放阅读框1(ORF1)的转录终止子和聚腺苷酸化位
点(Barkeretal,PlantMolecularBiology1983,2(6),335-50)。两个盒子均由商
业基因合成供应商(GeneArt,LifeTechnologies,Regensberg,Germany)合成。

用于基因剪接实验的载体通过克隆被载体pDAB10782所编码的ZFN所
靶向的ZFN识别序列的两个串联拷贝来构建。用于基因编辑实验的载体通
过克隆被载体pDAB107827和pDAB107828所编码的ZFN所靶向的每个
ZFN识别序列的一个拷贝来构建。在两种情况下,两个ZFN识别序列均被
BamHI和NotI限制性核酸酶内切酶的识别序列分隔。将tGFP和HPH盒克
隆到每个载体的BamHI和NotI位点中,产生4个“供体”载体:pDAS000340
(潮霉素抗性基因-剪接供体:SEQIDNO:275,图15),pDAS000341(tGFP报
告基因剪接供体:SEQIDNO:276,图16),pDAS00342(潮霉素抗性基因-编
辑供体:SEQIDNO:277,图17)和pDAS000343(tGFP报告基因编辑供体:
SEQIDNO:278,图18)。

如下所述对组装质粒的菌落进行初始筛选:对从大肠杆菌过夜培养物纯
化的DNA进行限制性核酸内切酶消化。限制性核酸内切酶从NewEngland
BioLabsTM(NEB,Ipswich,MA)和PROMEGATM(PROMEGA
CORPORATION,WI)获得。质粒制备使用QIAPREPSPINMINIPREP
KITTM(Qiagen,Hilden,Germany)或PUREYIELDPLASMIDMAXIPREP
SYSTEMTM(PromegaCorporation,WI)按照供应商的使用说明进行。在通过对
所得片段的琼脂糖凝胶电泳确认了限制性片段之后,使用ABISanger测序和
BIGDYETERMINATORV3.1TM循环测序方案(AppliedBiosystems,Life
Technologies)对所选的克隆的质粒DNA进行测序。使用SEQUENCHERTM
件(GeneCodes,AnnArbor,MI)组装和分析序列数据。

用于原生质体分离的植物材料的保持

叶肉来源的原生质体从欧洲油菜(DH10275)3周龄无菌芽培养物中分离。
相应的种子按照本文所述的方法使其萌发。种子用70%乙醇表面灭菌1分钟,
温柔震荡,随后在无菌双蒸水中漂洗3-4次。种子随后用20%漂白剂和10μl
吐温20进行灭菌。种子进一步在台式旋转摇床上以大约100RPM用漂白剂
处理15分钟,然后在无菌双蒸水中漂洗3-4次。将种子小心转移到无菌滤
纸上,以除去多余的水分,并铺在种子萌发培养基上(1/2强度的MS/B5维生
素+1%蔗糖+0.8%琼脂;pH5.8。

每个PetriTM培养皿(15X100mm)倾倒50-60ML培养基,用支撑物将平
板以微小的角度放置)。每个平板上放置大约50粒种子。将平板在16h/d光
照(20μmolm-2s-1)下的22℃直立温育6天。从6天龄幼苗切下0.5cm大小
的下胚轴段,并培养在芽诱导培养基上(MS/B5维生素+3%蔗糖+500mg/L
MES+BAP(13μm)+玉米素(5μm)+硝酸银(5mg/L)+0.8%琼脂(pH5.8)。将
培养基倾倒到100x20mm无菌PETRITM培养皿内,在每个平板的培养基上
放置大约20个外植体。将3-4周后出现的芽分生组织转移到芽伸长培养基
上(MS/B5维生素+2%蔗糖+500mg/LMES+BAP(2μm)+GA-3(0.1μm)+
0.8%琼脂(pH5.8),并倾倒在250mL培养容器中),在一轮亚培养期间,将
培养物保持在这一培养基中达4周。然后,将2-3cm高的芽转移到发根培
养基上(1/2强度MS/B5维生素+1%蔗糖+500mg/LMES+IBA(2.5μm)+
0.6%琼脂(pH5.8),并倾倒在700mL培养容器中),用于根系发育。将发根
的芽亚培养在新鲜的发根培养基中,以3-4周间隔进行枝条扦插,经过2-3
轮后使用。在整个期间,将培养物保持在22℃,16h/d光照(30μmolm-2s-1)。
叶肉原生质体的分离和纯化

体外生长的DH12075欧洲油菜植株用作分离叶肉原生质体的外植体源。
为了分离原生质体,使用锋利的手术刀将3-4周龄小植株的上面第3-第4片
完全伸展的叶片切成小条(0.5-1mm)。酶消化如下实施:用25mL消化缓冲
液(1.2%(w/v)纤维素酶"OnozukaTM"R10和0.2%(w/v)R10溶
于K4培养基(Spangenbergetal.1998)中)处理250-500mg叶片材料。用
ParafilmTM密封含有叶片材料和消化缓冲液的PETRITM培养皿,并在室温下
黑暗温育12-15h。过夜温育后,通过细胞过滤网(网眼尺寸为70μm)
过滤消化物。将原生质体悬液(5-6mL)收集在14mL圆底管中,并用1mL
清洗液W5缓冲液(154mMNaCl,125mMCaCl2,5mMKCl和5mM蔗糖;
pH5.8Menzeletal.1981)覆于上层。

将原生质体悬液进一步以400RPM离心10min。离心后,取出浮在中
间相中的原生质体,并通过400RPM离心10min用10mLW5缓冲液进行
清洗。最后一次清洗后,将分离的原生质体重悬,密度为每毫升W5缓冲1X
106个原生质体,并在转染之前温育1小时。

原生质体产量和活力的评估

原生质体产量用血细胞计数仪按照SambrookandRussel,2006的方法进
行评估。细胞活力用埃文斯蓝染色(400mg/L埃文斯蓝染料溶解于0.5M甘露
醇中)按照Huangetal.1996所述进行测试,对其方案进行了很少的次要修改。
PEG4000介导的稳定DNA递送

在递送到欧洲油菜原生质体之前,使用PureYieldPlasmidMaxiprep
SystemTM(PromegaCorporation,WI)按照供应商的使用说明从大肠杆菌培养
物中制备每种供体和ZFN构建体的质粒DNA。按照三个摩尔比制备供体和
ZFN质粒DNA的等份:1:1(30μg每种质粒),5:1(供体质粒比ZFN质粒,
总共30μg质粒DNA)和10:1(供体质粒比ZFN质粒,总共30μg质粒DNA)。
此外,制备仅有供体和仅有ZFN的等份(30μg)作为对照。通过PEG4000介
导的转化递送到欧洲油菜原生质体的DNA的量如表9所总结。

表9:递送到原生质体的ZFN和供体DNA的量


向100万个原生质体(活力≥95%)施加每个等份的质粒DNA,其中原生
质体悬浮在100μl转化缓冲液中(15mMMgCl2,0.1%(w/v)吗啉代乙磺酸
(MES)和0.5M甘露醇;pH5.8),随后是150μlPEG溶液(40%(w/v)PEG4000
溶于0.4M甘露醇和0.1MCa(NO3)2(pH6-7),Spangenberg和Potrykus
(1995))。在室温下温育10-15分钟后,逐滴加入5mlW5缓冲液,轻轻混合
原生质体。再缓慢流加5mLW5缓冲液到原生质体悬液中。轻轻混合原生质
体,并以400RPM离心10分钟,小心除去W5上清液,留下沉淀饼形式的
原生质体。然后将被转染的原生质体在1mLW5缓冲液中在室温下温育,直
至将它们包埋在珠子型培养物中。按照如下文所述的海藻酸钠法包埋被转染
的原生质体。

培养叶肉来源的原生质体回收活的微愈伤组织(microcalli)

在包埋在培养基内之前,将被转染的原生质体以400RPM离心10min,
并小心除去W5缓冲液。然后,将原生质体重悬浮在1.0mL0.5M甘露醇中,
并在冰上温育。向原生质体溶液添加等体积的1.0%海藻酸钠,并轻轻混合。
将原生质体悬液在冰上温育,直至其被包埋。用血清吸管将成珠溶液(0.4M
甘露醇+50mMCaCl2(pH5.8))转移到无菌的6孔板中(每孔3-4mL)。使用1
mL移液管将精确的1.0mL原生质体悬液逐滴添加到成珠溶液中,并且每个
孔包埋每一个被转染样品(大约5x105个原生质体)。原生质体悬液在室温下
温育1-2小时以形成海藻酸钠珠子。温育期之后,小心除去成珠溶液,并更
换为补充有1.5mg/L潮霉素的4-5mLK3+H:A培养基(Spangenbergetal.
1998)的1:2混合物。将原生质体在摇床上(50RPM)22℃黑暗培养3-4周。
3-4周后,用解聚缓冲液(0.3M甘露醇+20mM柠檬酸钠(pH5.8))处理来释
放抗性的微愈伤组织(0.5-1.0mm)。除去液体培养基之后,向含有珠子型培养
物的每个孔添加3-4mL解聚缓冲液,并在室温下温育2小时。使用无菌镊
子轻轻混合珠子,以提高微愈伤组织的高效释放。然后使用无菌的1.0mL
移液管轻轻混合并随后除去在解聚缓冲液中释放的胶凝剂(gellingagent)。微
愈伤组织用5mL液体A培养基清洗2次,并将微愈伤组织重悬浮在足量的
液体A中(50mL液体A用于1毫升沉降细胞体积(SCV:这是在将全部释放
的愈伤组织转移到50或15mLfalcon管中并使之沉降5min之后测量的)。
在将微愈伤组织均匀混合后,将0.5mL悬浮在液体A培养基中的微愈伤组
织转移到B1培养基(MS/MS维生素+3.5%蔗糖+500mg/LMES+BAP
(5μm)+NAA(5μm)+2,4-D(5μm)+1.5mg/L潮霉素+0.7%I型琼脂糖
(pH6.0),并倾倒在100x20mm无菌PETRITM培养皿中),并使用1-2mL额
外的液体A培养基将微愈伤组织均匀分布在B1培养基中,并从每个平板小
心除去多余的液体A培养基。平板用微孔胶带密封,其可增强胚成熟。将培
养物保持在22℃,16h/d光照(30μmolm-2s-1)。

从叶肉来源的原生质体增殖和再生芽

在温育2-3周后,从B1培养基拾取潮霉素抗性集落(通过SA和SP法产
生的微愈伤组织),并转移到B2培养基中(MS/MS维生素+3.0%蔗糖+
500mg/LMES+500mg/LPVP+5mg/L硝酸银+5mg/L2iP+NAA(0.5μm)+
GA-3(0.3μm)+1.5mg/L潮霉素+0.7%I型琼脂糖(pH5.8),并倾倒在100x
20mm无菌PETRITM培养皿中)。每个平板植入大约25-30个愈伤组织,用
ParafilmTM密封平板,并在16h/d光照(30μmolm-2s-1)下22℃温育。随后在
以2周的时间间隔在B2培养基中进行5-6轮亚培养之后,回收潮霉素抗性
集落。在第三轮亚培养之后,将每个平板的愈伤组织数目减少到12-15个。
将在10-12周出现的芽原基(primordias)与残余愈伤组织一起小心地回收,并
转移到芽伸长培养基中(MS/B5维生素+2%蔗糖+500mg/LMES+BAP
(2μm)+GA-3(0.1μm)+300mg/L特美汀+1.5mg/L潮霉素+0.8%琼脂(pH
5.8),并倾倒在250mL培养容器中)。将经过2-3轮潮霉素选择后仍存活的
芽转移到发根培养基中(1/2强度MS/B5维生素+1%蔗糖+500mg/LMES+
IBA(2.5μm)+1.5mg/L潮霉素+0.6%琼脂(pH5.8),并倾倒在700mL培养
容器中)。

从叶肉原生质体分离基因组DNA

将被转染的原生质体从3cmPETRITM皿转移到2mL微离心管中。通过
70g离心沉淀细胞,并除去上清液。为了最大限度回收被转染的原生质体,
PETRITM皿用1mL清洗缓冲液漂洗3次。每次漂洗将PETRITM皿中的清洗
缓冲液涡旋1分钟,随后将液体转移到相同的2mL微离心管中。在每次漂
洗结束时,通过70g离心沉淀细胞,并除去上清液。将沉淀的原生质体在液
氮中速冻,随后在LABCONCOFREEZONE(Labconco,KansasCity,MO)
中在-40℃和133x10-3mBar压力下进行冷冻干燥24h。使用
物DNA微量提取试剂盒(Qiagen)按照制造商的说明对冻干细胞进行DNA提
取,只是不要求组织破坏而是将原生质体细胞直接加入到裂解缓冲液中。

从愈伤组织分离基因组DNA

将单个愈伤组织在液氮中速冻,随后在LABCONCOFREEZONE
(Labconco,KansasCity,MO)中在-40℃和133x10-3mBar压力下进行冷冻干
燥24h。使用植物DNA微量提取试剂盒(Qiagen,Hilden,Germany)
按照制造商的说明对冻干的愈伤组织进行DNA提取。

从叶片组织分离基因组DNA

将来自再生植物的三十(30)mg嫩叶组织在液氮中速冻,然后在
LabconcoFreezone(Labconco,KansasCity,MO)中在-40℃和133x10-3
mBar压力下冷冻干燥24h。使用植物DNA大量提取试剂盒(Qiagen,
Hilden,Germany)按照制造商的使用说明对冻干的愈伤组织进行DNA提取。

用于NHEJ介导的FAD3C剪接和编辑的基因组DNAPCR测定

通过一系列PCR检测供体DNA向欧洲油菜Fad3C基因的整合,其中至
少一个引物特异性针对Fad3C基因座(表10),第二个引物特异性针对gfp盒
的启动子或终止子(表10和图19A)。特异性的获得是通过设计这样的寡核苷
酸:其中最后一个碱基对与可以区分Fad3C基因组序列与Fad3C基因的其
它拷贝的SNP对齐;并在该碱基对之前包含一个硫代磷酸酯核苷酸间键,
用星号[*]指示。这样的设计,结合使用具有校对活性的聚合酶,指导了每个
Fad3C或Fad3A等位基因的特异性扩增,并排除了所指出的其它Fad3拷贝。
通过对从野生型欧洲油菜获得的PCR扩增产物进行基于Sanger的测序,经
验性地测试每个引物组是否扩增正确的基因拷贝。

表10:用于检测DNA整合进入ZFN诱导的双链断裂的寡核苷酸序列



*指示硫代磷酸酯核苷酸间键,用于指导Fad3C或Fad3A的特异性扩增(使用具有校对活性的聚合酶)
以排除所指出的Fad3其它拷贝。通过对从野生型欧洲油菜获得的PCR扩增产物进行基于Sanger的测
序,经验性地测试每个引物组是否扩增正确的基因拷贝。

在原生质体中检测通过非同源末端连接添加基因到FAD3C

从原生质体池(每个池含有100万个原生质体)提取基因组DNA,其中在
24小时前已经向原生质体池投送了编码功能性tGFP报告盒(pDAS000341或
pDAS000343)的供体DNA,ZFNDNA(pDAB107827或pDAB107828),或供
体和ZFNDNA的混合物。用于转化的DNA投送量如上文所述。将PCR产
物克隆到质粒载体中。在每个细胞中独立发生基因组编辑,产生若干不同的
插入事件,通过克隆到质粒载体中,可以对每个基因组编集进行无歧义的测
序。将几个克隆在自动毛细管电泳平台上测序。基因序列分析
使用SEQUENCHERSOFTWAREV5.0TM(GeneCodes,AnnArbor,MI)完成。

使用表10所述的引物从提取自原生质体的基因组DNA中同时扩增出
5'和3'Fad3C盒接点,可以提供基因通过编辑或剪接被添加到Fad3C基因座
中的证据。用引物“FAD3CNHEJ-L4-F2”和“AtUbiNHEJ-R1”进行产物PCR扩
增,以扩增tGFP盒和Fad3C的5'接点。用引物“FAD3CNHEJ-L4-R2”和
“AtORF23tNHEJ-F1”进行PCR扩增,以扩增tGFP盒和Fad3C的3'接点。用
引物“FAD3CNHEJ-L4-F2”和“FAD3CNHEJ-L4-R2”进行PCR扩增,以扩增跨
越被ZFN28051-2A-28052诱导的双链断裂。没有观察到来自单独投送了ZFN
质粒或供体质粒的原生质体的扩增。所有接点序列均可指示tGFP盒通过
NHEJ介导的修复途径插入到Fad3C基因座处。观察到了基因组和/或盒子的
不同长度的缺失,以及来自载体骨架(来自供体或ZFN)的添加序列被插入在
基因组和盒子之间(图20A和图20B)。

在从原生质体再生的愈伤组织中检测基因通过非同源末端连接添加到
FAD3C

从自受选择的原生质体(1.5mg/L潮霉素,如上文所述)再生的愈伤组织
获得了Fad3C基因座剪接和编辑的进一步的证据,其中向该原生质体投送了
编码hph盒(pDAS000340或pDAS000342)的供体DNA,仅ZFNDNA
(pDAB107827或pDAB107828),或供体和ZFNDNA(DNA投送量如表9所
示)。在原生质体转染4周后,对于每个比例从大约80个愈伤组织中提取了
DNA,但是编辑1:1:1除外,因为没有愈伤组织存活。

通过TaqmanTMqPCR使用特异针对hph基因的引物(SEQIDNO:294;F-
5'CTTACATGCTTAGGATCGGACTTG3',SEQIDNO:295;R-5'
AGTTCCAGCACCAGATCTAACG3')和探针(SEQIDNO:296;5'
CCCTGAGCCCAAGCAGCATCATCG3')确认了hph盒在欧洲油菜基因组中
的整合(定向(fwat)Fad3C或随机地)。这些引物-探针对在二重(duplex)反应中
使用,引物(SEQIDNO:297;F-5'CGGAGAGGGCGTGGAAGG3',SEQID
NO:298;R-5'TTCGATTTGCTACAGCGTCAAC3')和探针(SEQIDNO:299;
5'AGGCACCATCGCAGGCTTCGCT3')特异针对欧洲油菜高迁移率族蛋白
I/I(HMGI/Y),其在A基因组中以单拷贝存在(Wengetal.,2004,Plant
MolecularBiologyReporter)。扩增在C1000热循环仪上实施,使用CFX96
或CF384实时PCR检测系统TM(BioRad,Hercules,CA)。结果分析使用CFX
ManagerTM(BioRad)软件包。相对定量的计算按照2-ΔΔCt方法(Livakand
Schmittgen,2001),其可提供插入到基因组中的hph盒的拷贝数估计。

通过用一个特异针对Fad3C的引物,和特异针对hph盒启动子或终止子
的第二引物(表9和图19B)进行PCR测定,获得了NHEJ介导的Fad3C剪接
和编辑的证据。由于从愈伤组织获得的DNA量有限,仅测定了沿着有义方
向的整合。PCR产物用QiaQuickMiniElutePCR纯化试剂盒TM(Qiagen)进行
凝胶纯化,并用直接Sanger测序法进行测序。测序产物用乙醇、乙酸钠和
EDTA按照v3.1方案(AppliedBiosystems)进行纯化,并如上所述地
进行测序和分析。

表11给出了每个实验中含有供体盒的愈伤组织的数目。通过跨越ZFN
剪切位点和5'和3'Fad3C-hph盒接点的PCR扩增(使用表10所示的引物),
提供了供体基因通过编辑和/或剪接添加到Fad3C基因座的证据。从对照原
生质体回收的愈伤组织分离的基因组DNA所进行的PCR扩增没有产生PCR
扩增产物,其中对照原生质体仅用hph质粒(pDAS000340和pDAS000342)
或者仅用ZFN质粒(pDAB107827和pDAB107828)转化。

从琼脂糖凝胶纯化从5'和3'Fad3C-hph盒接点扩增产生的PCR扩增子,
并测序以确认整合在Fad3C基因组基因座内的特异性。PCR产物测序分析
结果表明,从各个被转化原生质体产生的每个分离的愈伤组织仅产生单个
PCR扩增产物,并且不含有混合基因型的细胞。

在NHEJ介导的供体序列整合到Fad3C基因组基因座实验中,添加到靶
基因座(定义为从靶基因座扩增出供体DNA载体的任何部分)的频率对于1:1,
5:1,和10:1(供体DNA:ZFNDNA)的DNA浓度分别为42%,46%和32%。
见表12。通过测定两个盒接点是否都可以被扩增,并通过PCR产物测序,
来确定中靶(on-target)剪接频率。这些结果证实,盒以正确方向被插入在靶基
因座处。对于1:1,5:1和10:1的供体质粒DNA:ZFN质粒DNA浓度,整合
频率分别计算为4%,3%和3%。在基因编辑实验中,添加到靶基因座(定义
为从靶基因座扩增出供体DNA载体的任何部分)的频率对于供体质粒DNA:
ZFN质粒DNA浓度5:1:1和10:1:1分别是66%和65%。见表13。中靶编
辑的频率通过盒的两个接点均可以被扩增并产生PCR产物序列来确定。这
些结果证实,盒以正确方向被插入在靶基因座处,供体质粒DNA:ZFN质粒
DNA的浓度为5:1:1和10:1:1时,插入频率分别为3%和6%。如在原生质体
测定中观察到的,由于ZFN对基因组基因座的剪切,或者缺失碱基对,或
者在基因组和盒之间插入了额外的碱基(图21-22)。

在某些情况下,PCR产物导致在靶基因座内添加核苷酸序列,但没有
PCR产物,或者比野生型样品所见更大的PCR产物。这些结果是通过使用
侧翼于切割位点的引物进行PCR扩增产生的,表明两对染色体中的基因座
均被破坏(图21-22)。在一些情况下,在剪接接点扩增出了超过一条条带(图
21-22),表明在基因组的每个拷贝中独立地发生了不同的插入。

表11:在选择4周后hph存在呈阳性的愈伤组织的数目


表12:在ZFN28051-2A-28052诱导的DSB处具有通过剪接插入FadC基因
座的hph的愈伤组织的数目


*剪切位点处被删除的碱基对数或添加的碱基对数

表13:在ZFN28051-2A-28052和ZFN28053-2A-28054诱导的剪切位点处具
有通过编辑插入FadC基因座的hph的愈伤组织的数目



*剪切位点处被删除的碱基对数或添加的碱基对数

植物中通过非同源末端连接添加到FAD3C的基因的检测

从原生质体再生并转移到盘栽培养基中的植物中提取DNA(如上所述)。
回收的大部分植物被估计仅含有由供体DNA编码的hph盒的1-2个拷贝。使
用就愈伤组织描述过的同一套测定法,以及用于确定盒子是否沿着反义方向
插入或者确定在Fad3A基因座处的供体整合的测定法,对植物进行了分析。

表14:从原生质体再生的植物的拷贝数估计。对于每个比例,对100万个原

生质体进行三次转染


线性供体设计构建体的中靶剪接(其中hph盒沿着任一方向插入到Fad3C
中)的频率,对于供体DNA:ZFNDNA浓度为1:1,5:1和10:1的情况,分别
为51%,32%和56%(表15)。这些结果中,35%32%和50%(1:1,5:1和10:1)
是沿着正向插入的(表15)。

中靶编辑(其中hph盒沿着任一方向插入到Fad3C中并替换基因座4至
基因座6的区域)的频率对于供体DNA:ZFNDNA:ZFNDNA浓度为5:1:1和
10:1:1的情况,分别为2%和0%(表16)。此外,当两种ZFN以5:1:1投送时,
2%被剪接在基因座4中,10%被剪接在基因座6中,当两种ZFN以10:1:1
投送时,10%被剪接在基因座4中,15%被剪接在基因座6中。获得了PCR
扩增子并测序,以确定插入连接序列。对于特异性标志物的植物的所得序列
如表17所述。

表15:在FadC基因座ZFN28051-2A-28052诱导的DSB处具有通过剪
接插入的hph的植物的数目


表16:在ZFN28051-2A-28052和ZFN28053-2A-28054诱导的切割位点
处具有通过FadC基因座编辑插入的hph的植物的数目


表17:在Fad3C基因座处ZFN28051-2A-28052和ZFN28053-2A-28054
诱导的切割位点处单拷贝hph靶插入的植物详情

植物条码
PCR/序列信息
序列ID号
349711
基因座4上游
353
349685
基因座4上游
354
346258
基因座4上游
355
348918
基因座4上游
356
359900
基因座4上游
357
346125
基因座4上游
358
348919
基因座4上游
359

349215c
基因座4上游
360
349216c
基因座4上游
361
346102
基因座4下游
362
346175
基因座4下游
363
345888
基因座6下游
364
356731
基因座6下游
365
346128
基因座4下游反义方向
366
347359
基因座6下游反义方向
367

靶向剪切(其中对于环状供体,hph盒沿着任一方向插入到Fad3C中)的
频率对于浓度为1:1,5:1和10:1分别为51%,32%和56%(表18,图23)。这
些中,35%,32%和50%(1:1,5:1和10:1)沿着正向插入(表18)。

靶向编辑(其中hph盒沿着任一方向插入到Fad3C中并替换基因座4-基
因座6的区域)的频率对于5:1:1和10:1:1分别为2%和0%(表19;图24)。
此外,当两种ZFN以5:1:1投送时,2%被剪接在基因座4中,10%被剪接在
基因座6中,当两种ZFN以10:1:1投送时,10%被剪接在基因座4中,15%
被剪接在基因座6中。

表18:在FadC基因座ZFN28051-2A-28052诱导的DSB处具有通过剪
接插入的hph的植物的数目


*剪切位点处没有被删除的碱基对或额外的碱基对

表19:在FadC基因座的ZFN28051-2A-28052和ZFN28053-2A-28054
诱导的切割位点处具有通过编辑插入的hph的植物的数目



*剪切位点处没有被删除的碱基对或额外的碱基对

欧洲油菜ω-3脂肪酸去饱和酶通过HDR的靶向整合

含有tGFP和HPH盒的供体载体被修饰成包含1kb的FAD3上游和下游
供体序列。FAD3上游和下游供体序列与天然FAD3序列100%相同,并从F
AD3锌指结合位点获得:GCCCAAGGAACCCTTTTCTGGGCCATCTTCGT
ACTCGGCCACGACTGGTAATTTAAT(SEQIDNO:255)或AGCGAGAGA
AAGCTTATTGCAACTTCAACTACTTGCTGGTCGATCGTGTTGGCCACTC
(SEQIDNO:256)。所得的4个“供体”载体与pDAS000340(潮霉素抗性
基因剪接供体),pDAS000341(tGFP报告基因剪接供体),pDAS00342(潮霉
素抗性基因编辑供体)和pDAS000343(tGFP报告基因编辑供体)相似,其中
唯一的修改是包含1kb的FAD3基因组上游和下游供体序列。使用先前对N
HEJ介导的整合所描述的锌指核酸酶质粒(pDAB107827和pDAB107828)进行
HDR介导的整合。

欧洲油菜的转化

如上所述地从欧洲油菜(DH10275)植株分离和制备叶肉来源的原生质体。
原生质体用纯合的质粒DNA转染。等份的供体和ZFN质粒DNA制备成三
个摩尔比:1:1(30μg每种质粒),5:1(供体质粒与ZFN质粒,总共30μg质
粒DNA)和10:1(供体质粒与ZFN质粒,总共30μg质粒DNA)。此外,制
备仅有供体和仅有ZFN的等份(30μg)作为对照。表20总结了通过PEG4000
介导的转化被投送到欧洲油菜原生质体中的DNA的量。被转化的原生质体
细胞被如前所述地培养,其中选择培养基是草铵膦选择培养基,对推定的转
化子通过qPCR分析测定转基因插入。

表20:投送到原生质体的ZFN和供体DNA的量


在原生质体中检测通过HDR添加到FAD3的基因

从原生质体池(每个池含有100万个原生质体)提取基因组DNA,其中在
24小时前已经向原生质体池投送了编码功能性报告盒或可选择标志物盒的
供体DNA,ZFNDNA,或供体与ZFNDNA的混合物。用于转化的DNA投
送量如上文所述。将PCR产物克隆到质粒载体中。在每个细胞中独立发生
基因组编辑,产生若干不同的插入事件,通过克隆到质粒载体中,可以对每
个基因组编码进行无歧义测序。就几个克隆在自动毛细管电泳
平台上被测序。基因序列分析使用SEQUENCHERSOFTWAREV5.0TM
(GeneCodes,AnnArbor,MI)完成。

从提取自原生质体的基因组DNA中扩增出5'和3'FAD3-盒接点二者,
提供了基因通过编辑或剪切被添加到FAD3基因座中的证据。从单独投送了
ZFN质粒或供体质粒的原生质体中没有观察到扩增。所有接点序列均可指示
盒通过HDR介导的修复途径插入到FAD3基因座处。观察到基因组和盒子
中任一个或两个的各种长度的缺失,以及来自载体骨架(来自供体或ZFN)的
序列被添加插入到基因组和盒子之间。

在从原生质体再生的愈伤组织中检测通过HDR添加到FAD3的基因

从自接受选择的原生质体再生的愈伤组织获得了FAD3基因座被剪切和
编辑的进一步的证据,其中向原生质体中投送了编码盒的供体DNA,仅ZFN
DNA,或供体和ZFNDNA。对于每个比例,从大约80个愈伤组织中提取了
DNA。

通过TAQMANTMqPCR使用特异针对供体插入物和基因组侧翼序列的
引物和探针确认了盒被整合到欧洲油菜基因组中。相对定量的计算是根据
2-ΔΔCt方法(LivakandSchmittgen,2001),其估算被插入到基因组中的盒的拷贝
数。通过用一个特异针对FAD3的引物和特异针对盒的启动子或终止子的第
二引物进行PCR测定,获得了FAD3被NHEJ介导的剪切和编辑的证据。
PCR产物用QIAQUICKMINIELUTEPCRPURIFICATIONKITTM(Qiagen)
进行凝胶纯化,并用直接Sanger测序方法进行测序。测序产物用乙醇、乙酸
钠和EDTA按照v3.1方案(AppliedBiosystems)进行纯化,并如上
所述地进行测序和分析。

确定了每个实验中含有供体盒的愈伤组织的数目。通过跨越ZFN切割
位点和5'和3'FAD3盒接点的PCR扩增,提供了供体基因通过编辑和/或剪
切添加到FAD3基因座的证据。对从仅用质粒或仅用ZFN质粒转化的对照
原生质体回收的愈伤组织中分离的基因组DNA进行PCR扩增,没有产生
PCR扩增产物。

从琼脂糖凝胶纯化从5'和3'FAD3盒接点扩增产生的PCR扩增子,并测
序以确认FAD3基因组基因座内的整合特异性。PCR产物测序分析结果表明,
从各个被转化原生质体产生的每个分离愈伤组织仅产生了单一PCR扩增产
物,不含有具有混合基因型的细胞。

植物中通过HDR添加到FAD3的基因的检测

从自原生质体再生并转移到盆栽培养基(pottingmedium)中的植株提取
DNA。估计所回收的大部分植株仅含有供体DNA编码的盒的1-2个拷贝。
使用与愈伤组织所述相同序列的测定对植株进行分析,并通过测定确定盒子
是否已经插入在FAD3基因座中。

使用上述的PCR测定确定中靶剪接(其中盒被插入在FAD3基因座中)
的频率。对所得扩增子条带进行测序,以确定侧翼序列。此外,筛选植株的
脱靶插入,以确定盒整合在FAD3之外的位点处的频率。

实施例9:用农艺学重要基因对欧洲油菜Ω-3脂肪酸去饱和酶(FAD3)的靶向
整合

设计并构建含有赋予对除草剂草甘膦的抗性的DGT-28转基因的构建体
(国际专利申请No.WO/2013/116700,本文引用其内容作为参考)用于整合在
欧洲油菜的FAD3基因组基因座中。将构建体和相关锌指核酸酶构建体(例
如,pDAB107827和pDAB107828)转化到欧洲油菜细胞中,如上所述。通过
如前文所述的分子确认测定对转化子进行鉴定和确认。分离包含被整合
dgt-28转基因的FAD3染色体整合子。dgt-28转基因整合在FAD3基因座内
的实例是通过NHEJ介导的整合和HDR介导的整合。整合在FAD3基因座
内可以被导向到FAD3内源序列中,或者导向到先前所述的、被稳定整合在
FAD3基因座内的ETIP(pDAS000271–pDAS000275)中。通过NHEJ介导的
机制整合在FAD3基因座内,能够使用线性化供体或环状供体DNA设计实
现。获得被转化的DGT-28欧洲油菜事件,并测试DGT-28的强表达和因此
导致的对除草剂草甘膦的抗性。

尽管本文描述了某些示例性实施方案,但是本领域普通技术人员将认识
并意识到,可以在不背离下述权利要求的范围下对示例性实施方案进行许多
添加、缺失和修改。此外,来自一个实施方案的特征可以和另一个实施方案
的特征相结合。

FAD3性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白.pdf_第1页
第1页 / 共130页
FAD3性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白.pdf_第2页
第2页 / 共130页
FAD3性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白.pdf_第3页
第3页 / 共130页
点击查看更多>>
资源描述

《FAD3性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白.pdf》由会员分享,可在线阅读,更多相关《FAD3性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白.pdf(130页珍藏版)》请在专利查询网上搜索。

公开了一种在FAD3基因座中进行基因编辑或基因堆叠的方法,其是通过以定点的方式剪切细胞FAD3基因中的某一位置,从而在FAD3基因中产生断裂(break),然后在该断裂中连接入与一种或多种感兴趣性状相关的核酸分子。 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 化学;冶金 > 生物化学;啤酒;烈性酒;果汁酒;醋;微生物学;酶学;突变或遗传工程


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1