用于修饰预定的靶核酸序列的组合物和方法.pdf

上传人:a3 文档编号:59711 上传时间:2018-01-22 格式:PDF 页数:217 大小:52.83MB
返回 下载 相关 举报
摘要
申请专利号:

CN201280062262.X

申请日:

2012.12.16

公开号:

CN104080462A

公开日:

2014.10.01

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):A61K 31/7105申请日:20121216|||公开

IPC分类号:

A61K31/7105; A61K48/00; A61K31/711; A61K31/7115; A61K31/712; A61K31/7125; A61K31/713; C12N5/10; C12N15/62

主分类号:

A61K31/7105

申请人:

塔尔盖特基因生物技术有限公司

发明人:

约尔·摩西·希博莱斯; 丹·迈克尔·温萨尔

地址:

以色列黑费尔

优先权:

2011.12.16 US 61/576,423

专利代理机构:

北京安信方达知识产权代理有限公司 11262

代理人:

王思琪;郑霞

PDF下载: PDF下载
内容摘要

本文提供了用于修饰预定的核酸序列的组合物和方法。提供了包含多肽部分和赋予特异性的核酸(SCNA)的可编程核蛋白分子复合物,其在靶细胞中体内组装,并能够与预定的靶核酸序列相互作用。可编程核蛋白分子复合物能够特异性修饰和/或编辑靶核酸序列内的靶位点,和/或修饰靶核酸序列的功能。

权利要求书

1.  一种核蛋白组合物,所述核蛋白组合物用于修饰靶细胞中靶核酸序列中的预定的靶位点,所述组合物包括:
(a)编码嵌合多肽的多核苷酸分子,所述多肽包括:
(i)能够修饰所述靶位点的功能域,所述功能域缺乏特定的核酸结合位点;和
(ii)能够与赋予特异性的核酸相互作用的连接域,所述连接域缺乏特定的靶核酸结合位点;
以及;
(b)赋予特异性的核酸(SCNA),所述赋予特异性的核酸(SCNA)包括:
(i)与所述靶位点侧翼的靶核酸区域互补的核苷酸序列;和
(ii)能够特异性附着至所述多肽的所述连接域的识别区域;
由此,所述多肽和所述SCNA在所述靶细胞内的组装形成能够特异性在所述靶位点处修饰所述靶核酸的功能核蛋白复合物。

2.
  如权利要求1所述的组合物,其中所述功能域包含催化结构域。

3.
  如权利要求1所述的组合物,其中所述修饰所述靶核酸选自:突变、缺失、插入、置换、结合、消化、双链断裂创建、产生切口、甲基化、乙酰化、连接、重组、螺旋解旋、化学修饰、标记、激活和失活。

4.
  如权利要求1所述的组合物,其中所述嵌合多肽还包括亚细胞定位结构域。

5.
  如权利要求1所述的组合物,其中所述SCNA包括选自由以下组成的组的核酸:单链DNA、单链RNA、双链RNA、修饰的DNA、修饰的RNA、锁核酸(LNA)和肽核酸(PNA)或其组合。

6.
  如权利要求1所述的组合物,其中所述靶核酸为DNA。

7.
  如权利要求1所述的组合物,其中所述SCNA的所述识别区域包括 选自由以下组成的组的化学修饰:5’-端修饰、3’-端修饰、和内部修饰。

8.
  如权利要求7所述的组合物,其中所述化学修饰选自由以下组成的组:核苷酸修饰、和非核苷酸部分的添加。

9.
  如权利要求8所述的组合物,其中所述非核苷酸部分选自:生物素、荧光素、胺-接头、寡肽、氨基烯丙基、染料分子、荧光团、地高辛、Acrydite、腺苷酸化物、叠氮化物、NHS-酯、胆固醇基-TEG、炔烃、可光裂解的生物素、硫醇、二硫醇。

10.
  如权利要求8所述的组合物,其中所述核苷酸修饰选自由以下组成的组:磷酸酯、2-氨基嘌呤、三聚体-20、2,6-二氨基嘌呤、5-溴-脱氧尿苷、脱氧尿苷、反向dT、双脱氧核苷酸、5-甲基脱氧胞苷、脱氧肌苷、5-硝基吲哚、2-O-甲基RNA碱基、Iso-dC、Iso-dG、氟修饰的碱基和硫代磷酸酯键。

11.
  如权利要求1所述的组合物,其中所述修饰和所述连接域之间的附着为选自以下的结合对:蛋白-蛋白;农杆菌VirD2-VirD2结合蛋白;抗体-抗原;单链抗体-抗原相互作用;抗荧光素单链可变区片段抗体(抗-FAM ScFV)-荧光素;抗DIG单链可变区片段(scFv)免疫球蛋白(DIG-ScFv)-地高辛(DIG)和IgG-蛋白A。

12.
  如权利要求1所述的组合物,其中所述SCNA的所述识别区域包括能够特异性附着至所述嵌合蛋白的所述连接域的核苷酸基序。

13.
  如权利要求12所述的组合物,其中所述核苷酸基序和所述连接域之间的附着选自:螺旋环螺旋与E盒结构域相互作用;单链DNA与VirE2相互作用、StickyC与dsDNA、病毒外壳蛋白与核酸、牛免疫缺陷病毒(BIV)Tat主要结合域与BIV反式作用反应元件(TAR)序列的环1相互作用;噬菌体λphi21蛋白与N-利用(nut)位点中的盒B环发夹结构相互作用;噬菌体λP22N蛋白与所述N-利用(nut)位点中的盒B环发夹结构相互作用;和HIV-rev蛋白与HIV rev反应元件(RRE)的茎IIB相互作用。

14.
  如权利要求12所述的组合物,其中所述连接域包括选自由以下组成的组的多肽:农杆菌VirD2蛋白、微小核糖核酸病毒VPg、拓扑异构酶、 PhiX174噬菌体A蛋白、PhiX A*蛋白,以及其任何变体。

15.
  一种用于通过可编程核蛋白分子复合物修饰靶核酸序列内的预定的靶位点的方法,所述方法包括以下步骤:
a.将编码可编程嵌合多肽的核酸序列递送至宿主细胞,所述嵌合多肽包含:
(i)能够修饰所述靶位点的功能域,所述功能域缺乏特定的核酸结合位点;以及
(ii)能够与赋予特异性的核酸相互作用的连接域,所述连接域缺乏特定的靶核酸结合位点;
b.将赋予特异性的核酸(SCNA)分子或编码所述SCNA的核酸递送至所述宿主细胞,所述SCNA分子包括:
(i)与所述靶位点侧翼的靶核酸区域互补的核苷酸序列;以及
(ii)能够以高结合亲和力特异性附着至所述多肽的所述连接域的识别区域;
其中所述多肽在包含所述SCNA的细胞中的表达使所述嵌合多肽能够附着至所述SCNA,形成有活性的编程的核蛋白复合物,从而将所述嵌合多肽靶向所述宿主细胞内的所述预定的靶核酸序列,使通过所述有活性的编程的核蛋白分子复合物修饰所述靶核酸序列的所述预定的靶位点成为可能。

16.
  如权利要求15所述的方法,其中所述靶核酸为DNA。

17.
  如权利要求16所述的方法,其中所述靶DNA为基因组DNA。

18.
  如权利要求17所述的方法,其中所述靶基因组DNA是真核起源的。

19.
  如权利要求15所述的方法,其中所述靶核酸序列是选自由以下组成的组的染色体外的核酸序列:线粒体、叶绿体、造粉体和色质体。

20.
  如权利要求15所述的方法,其中所述靶核酸序列选自:病毒核酸序列、原核核酸序列和合成的核酸序列。

21.
  如权利要求15所述的方法,其中所述修饰选自由以下组成的组:突变、缺失、插入、置换、结合、消化、双链断裂创建、产生切口、甲基化、乙酰化、连接、重组、螺旋解旋、化学修饰、标记、激活和失活。

22.
  如权利要求15所述的方法,其中所述嵌合蛋白包括具有核酸功能修饰剂的蛋白部分,其中所述功能修饰选自由以下组成的组:转录激活、转录失活、RNA转录本沉默、可变RNA剪接、染色质重排、细胞寄生物和病毒失活以及所述靶核酸序列的细胞定位或区室化中的变化。

23.
  如权利要求15所述的方法,其中所述SCNA包括选自由以下组成的组的核酸分子:单链DNA、单链RNA、双链RNA、修饰的DNA、修饰的RNA、锁核酸(LNA)和肽核酸(PNA)或其组合。

24.
  如权利要求15所述的方法,其中所述SCNA与所述靶核酸之间的相互作用是通过选自由以下组成的组的碱基配对:完全双螺旋碱基配对、部分双螺旋碱基配对、完全三螺旋碱基配对、部分三螺旋碱基配对、和通过所述配对形成的D-环或支链的形式。

25.
  如权利要求15所述的方法,其中所述SCNA的所述识别区域包括选自由以下组成的组的修饰:5’-端修饰、3’-端修饰、和内部修饰。

26.
  如权利要求25所述的方法,其中所述修饰选自由以下组成的组:核苷酸修饰、生物素、荧光素、胺-接头、寡肽、氨基烯丙基、染料分子、荧光团、地高辛、Acrydite、腺苷酸化物、叠氮化物、NHS-酯、胆固醇基-TEG、炔烃、可光裂解的生物素、硫醇、二硫醇、修饰的碱基、磷酸酯、2-氨基嘌呤、三聚体-20、2,6-二氨基嘌呤、5-溴-脱氧尿苷、脱氧尿苷、反向dT、双脱氧核苷酸、5-甲基脱氧胞苷、脱氧肌苷、5-硝基吲哚、2-O-甲基RNA碱基、Iso-dC、Iso-dG、氟修饰的碱基和硫代磷酸酯键。

27.
  如权利要求25所述的方法,其中所述修饰和所述连接域之间的缔合为选自以下的结合对的相互作用:蛋白-蛋白、农杆菌VirD2-VirD2结合蛋白、抗体-抗原;单链抗体-抗原、抗荧光素单链可变区片段抗体(抗-FAM ScFV)-荧光素;抗DIG单链可变区片段(scFv)免疫球蛋白(DIG-ScFv)-地高辛(DIG)、和IgG-蛋白A。

28.
  如权利要求15所述的方法,其中所述SCNA的所述识别区域包括能够与所述嵌合蛋白的所述连接域相互作用的核苷酸基序。

29.
  如权利要求28所述的方法,其中所述核苷酸基序和所述连接域之间的相互作用选自:螺旋环螺旋与E盒结构域相互作用;单链DNA与VirE2相互作用、StickyC与dsDNA、病毒外壳蛋白与核酸、牛免疫缺陷病毒(BIV)Tat主要结合域与BIV反式作用反应元件(TAR)序列的环1相互作用;噬菌体λphi21蛋白与N-利用(nut)位点中的盒B环发夹结构相互作用;噬菌体λP22N蛋白与N-利用(nut)位点中的盒B环发夹结构相互作用;HIV-rev蛋白与HIV rev反应元件(RRE)的茎IIB相互作用、和农杆菌VirD2-右边界序列。

30.
  如权利要求28所述的方法,其中所述连接域包括选自由以下组成的组的多肽:农杆菌VirD2蛋白、微小核糖核酸病毒VPg、拓扑异构酶、PhiX174噬菌体A蛋白、PhiX A*蛋白,以及其变体。

31.
  一种通过如权利要求15所述的方法形成的核蛋白复合物,其中所述蛋白部分的所述连接域和所述赋予特异性的核酸部分的所述识别区域之间的物理缔合在所述靶细胞内形成编程的功能复合物。

32.
  如权利要求31所述的核蛋白复合物,其中所述蛋白部分的所述连接域和所述赋予特异性的核酸部分之间的物理缔合为选自由以下组成的组的亲和相互作用:配体-受体、配体-底物、氢键、范德华键、离子键和疏水相互作用。

33.
  一种宿主细胞,所述宿主细胞具有通过如权利要求15所述的方法创建的预定的靶位点中的预定的基因修饰。

34.
  如权利要求33所述的宿主细胞,所述宿主细胞选自由以下组成的组:脊椎动物细胞、哺乳动物细胞、人细胞、动物细胞、植物细胞、无脊椎动物细胞、线虫细胞、昆虫细胞和干细胞。

35.
  一种转基因生物体或敲除生物体,所述转基因生物体或敲除生物体具有通过如权利要求15所述的方法形成的预定的基因修饰。

36.
  一种治疗生物体中的遗传疾病的方法,所述方法包括在所述生物 体的细胞中表达如权利要求1所述的核蛋白可编程分子复合物。

37.
  一种宿主细胞,所述宿主细胞包括:
a)多肽,所述多肽包括:
(i)能够修饰所述细胞中靶核酸序列中的靶位点的功能域,所述功能域缺乏特定的核酸结合位点;和
(ii)能够与赋予特异性的核酸相互作用的连接域,所述连接域缺乏特定的靶核酸结合位点;
以及;
(b)赋予特异性的核酸(SCNA),所述赋予特异性的核酸(SCNA)包括:
(i)与所述靶位点侧翼的靶核酸区域互补的核苷酸序列;和
(ii)能够特异性附着至所述多肽的所述连接域的识别区域;
由此,所述多肽和所述SCNA在所述宿主细胞内的组装形成能够在所述靶位点处特异性修饰所述靶核酸的功能核蛋白复合物。

38.
  如权利要求37所述的宿主细胞,所述宿主细胞选自由以下组成的组:脊椎动物细胞、哺乳动物细胞、人细胞、动物细胞、植物细胞、无脊椎动物细胞、线虫细胞、昆虫细胞和干细胞。

说明书

用于修饰预定的靶核酸序列的组合物和方法
发明领域
本发明涉及用于利用可编程分子复合物(programmable molecular complex)靶向并修饰核酸序列的组合物和方法。
发明背景
生物学和医学中主要的感兴趣领域是基因组核苷酸序列的靶向改变。此类改变包括内源染色体核酸序列的插入、缺失和置换。过去他人进行尝试以通过不同的技术改变基因组序列。
基因靶向(gene targeting)是用于基因组操作或基因组功能修饰的理想的生物技术工具。基因靶向可诱导可以涉及或可以不涉及编码序列的特定基因组位置中的改变。
在基因靶向事件中,预先定义的内源基因或另一个预先定义的内源核酸序列,通过靶向的基因功能修饰被靶向用于裂解,导致缺失、突变、插入或置换,或被靶向用于化学修饰。相对于非靶向的转基因生物体生产(untargeted transgenic organism prodution),基因靶向的一个优势是修饰或缺失现有基因组序列而不插入外源DNA的可能性,或可选地,通过插入或置换将外源供体DNA放置在预先定义的基因座中的可能性。因此,能够操作序列而无多余序列(superfluous sequence)是有利的,因为多余序列是育种者、农民、消费者和监管机构不期望的,并且同时已提出了用于避免此类序列的许多技术,每一种技术都具有其自身的缺点。
用于真核细胞中基因靶向的策略取决于两个细胞dsDNA断裂修复机制:同源重组(HR)修复通路和非同源末端连接(NHEJ)修复通路。在NHEJ中,基因插入取决于可随机出现的(例如,通过辐射或氧化损伤)或由核酸酶诸如TALE核酸酶(TALEN)、大范围核酸酶或锌指核酸酶 (ZFN)指导的dsDNA断裂的存在。HR可通过dsDNA断裂引起。在HR中,dsDNA断裂不是必需的,但如果位于重组位点附近则可提高效率。
已进行了关于HR介导的基因靶向的大量研究,其在许多生物体诸如细菌、酵母和原始植物、苔藓中有益地运转良好。HR还被用于高等生物体诸如果蝇、小鼠和人类。HR在这些生物体中的比率为约10^-6,且通过创建基因特异性DSB在辅助的HR中该比率可被提高至超过10^-2。低比率的转化子是这些方法未在基因治疗或育种项目中盛行的一个原因。
已提出了用于体内修饰核酸的多种技术并可被分为基于酶的方法或基于核苷酸的方法。一般而言,基于酶的方法使用DNA-结合蛋白,其同时具有期望的催化活性和以与限制性内切酶相似的方式通过蛋白-核酸相互作用结合期望的靶序列的能力。实例包括天然存在的或被工程化的稀有序列切割酶(rare sequence cutting enzyme)的大范围核酸酶、锌指核酸酶(ZFN)或包含与修饰的DNA结合域连接的FokI核酸酶催化亚基并可切割每一个预定序列的转录激活因子样核酸酶(TALEN)。在ZFN中,结合域由折叠成专门的锌指结构域的氨基酸链组成。类似地,在TALEN中,源自转录因子的34个氨基酸重复折叠成巨大的DNA结合域。在基因靶向事件中,这些酶可裂解(cleave)基因组DNA,以形成双链断裂(DSB)或创建可被两种修复通路非同源末端连接(NHEJ)或同源重组(HR)之一修复的切口(nick)。NHEJ通路可潜在地导致特定突变、缺失、插入或置换事件。HR通路导致被靶向的序列被提供的供体序列置换。这些仅基于蛋白的方法的一个缺点是针对每个期望的靶序列设计和提供不同蛋白的长期和艰苦的必要性。其他缺点包括分别由ZFN和大范围核酸酶识别的某种程度上有限亚组的核酸三联体或序列。此外,即使是非常难以构建的六锌指ZFN也局限于仅18个核苷酸的结合位点,并且由于18个核苷酸在统计学上不足以赋予全基因组的序列空间中的序列特异性或复杂性,这些必须作为异二聚体被提供。此外,ZFN和TALEN的性质要求功能性筛选,并且即使是成功的核酸酶也可显示差的基因靶向效率。
对于基于核苷酸的方法,将核酸提供至生物体,并且内源性加工通过非辅助的同源重组或将寡核苷酸整合到基因组引起DNA修复或基因靶向。 这些核酸可使用病毒载体、质粒载体、T-DNA载体和双链DNA寡核苷酸来提供。称为三螺旋形成寡核苷酸(Triple-helix forming oligonucleotide,TFO)的较短核苷酸被用于基于寡核苷酸的错配修复,并可实现点突变的修复或直至4个核苷酸的修复。存在这些方法也依赖于DSB的形成的充足证据,该DSB的形成可以是随机的、随机诱导的或由通过共价结合至提供的核酸的酶或反应性化学物质的酶促或化学修饰局部诱导的。DNA中的双链断裂(DSB)是HR必需的。特定的预先存在的DSB不是必需的,但提高了效率。DNA中的天然断裂随机分布并且是罕见的,并因此效率,因此肯定是低的(10^-6)。DSB可通过以遗传毒性为代价来提高效率的电离辐射或氧化化学物质被随机诱导。在该系统的改进中,过去使用由核酸末端的化学修饰辅助的非酶促DNA裂解进行了辅助的HR或修复。这些修饰包括EDTA-Fe或可光活化的补骨脂素,并可被用于当被体外掺入以形成三螺旋时产生dsDNA中的序列特异性DSB。另外的方法使用了源自单链DNA(ssDNA)的寡核苷酸、或修饰的寡核苷酸,也被称为“小合成单链寡脱氧核苷酸(ODN或ssODN)。然而,尽管基于寡核苷酸的方法可导致哺乳动物细胞基因组中相对有效的点突变,但这些方法受限于该编辑模式。
寡核苷酸-酶缀合物是两种方法的组合,包括在将缀合物提供给生物体之前体外共价结合至催化酶的核酸。与仅酶的方法相比,这些方法是模块化的,允许制备针对多种靶序列的缀合物。寡核苷酸-酶缀合物的主要缺点是,它们在体内不能自组装,从而严重地限制了其用于体内编辑基因组的有效性。本领域已知的此类系统的另外的关键缺点是,在这些缀合物的使用中,酶组分作为单体是有活性的,并因此酶与核酸的任何结合,特异性的或非特异性的,将导致裂解。此类非特异性裂解严重降低此类系统的安全性,因为它们可在不希望的位置引入不希望的改变/突变。
非缀合的寡核苷酸-蛋白系统也已被用于裂解ssDNA底物。在该系统中,在其识别位点外裂解的IIS型限制性内切酶FokI与以下在体外联合使用:重建FokI识别序列的形成发夹结构的寡核苷酸,创建待被裂解的由寡核苷酸引发(prime)的DNA的双链部分的PolIk酶和dNTP。在该系统中, 不仅期望的序列被裂解,而且任何天然存在的FokI位点将被识别,且邻近其的序列将被裂解。由于FokI具有仅5个核苷酸识别位点,这暗示了全基因组中存在数以千计的潜在裂解位点,使得该系统对于基因组编辑是无用的。
与其中HR可被用于基因靶向的其他生物体相比,在高等植物和人中,NHEJ通路是主要的内源性机制。植物DNA修复机制不允许在供体和染色体DNA之间的有效的HR。事实上,已广泛接受的是,通常由农杆菌介导的遗传转化递送的外源供体DNA分子,被植物的非同源末端连接(NHEJ)通路识别,其导致外源供体DNA分子在整个宿主基因组中的随机整合。因此,大多数现有植物转化方法都不被认为是基因靶向的,因为在这些方法中,序列随机插入基因组,并且作为不良副作用,可破坏现有基因,并且通常以多拷贝插入,或包含不期望的质粒、标志物或细菌序列残余。
可用于辅助的HR和定向的NHEJ的用于诱导特定dsDNA断裂的方法,利用体内核酸酶的表达。这些核酸酶包括稀有序列切割核酸酶(稀有切割物(cutter))诸如源自归巢内切核酸酶的大范围核酸酶或嵌合大范围核酸酶、定制的重组锌指核酸酶(ZFN)、或定制的重组TAL效应器核酸酶。在这些方法中,裂解的靶位点的识别,由天然识别特定核苷酸序列或被具体工程化以识别特定核苷酸序列的蛋白结构域或亚基的相互作用来实现,并且不基于多核苷酸-多核苷酸杂交或碱基配对。例如,锌指核酸酶是被构建作为FokI核酸酶亚基和合成的锌指(ZF)结构域之间的杂合体的嵌合蛋白。锌指核酸酶不包含核酸组分。ZFN旨在通过几个ZF基序的组合特异性识别核苷酸三联体。由于其仅识别有限亚组的核苷酸三联体的固有能力,未能够构建识别所有序列的ZFN。使用ZFN异二聚体,借以作为单体是无活性的两个不同的ZFN被伴随递送,具有对特异性的积极影响,尽管这使设计进一步复杂化,并降低了靶序列的选择。ZFN还被用于创建既用于基因的激活又用于基因的抑制的人工转录因子,用于改变基因调控。然而,此类基于锌指的转录因子受限于识别位点的长度并受限于几个特定三核苷酸基序,不能结合所有序列,并且因此不能被用于激活或抑制所有可能的基因。
例如,Schierling等人公开了具有特定序列裂解模块的新颖的锌指核酸酶平台。例如,Eisenschmidt K等人公开了用于高度特异性DNA裂解的编程的限制性内切核酸酶。例如,WO2006/027099涉及具有可编程特异性的酶缀合物,其以高度特异性方式与DNA反应。
例如,Kubo等人公开了通过信号肽和遗传表达控制寡核苷酸在人细胞中的细胞内递送。Jinek等人公开了适应性细菌免疫中可编程的双RNA-引导的DNA内切核酸酶(programmable Dual-RNA-Guided DNA endonuclease)。
例如,WO2012/129373涉及用于制备复杂的转基因性状基因座的方法。
然而,本领域对允许体内特异性靶向和修饰靶核酸序列的安全、可靠、模块化和廉价的组合物和方法仍然存在未满足的需要。
发明概述
本发明提供了用于在体内或体外靶向和修饰核酸序列的组合物和方法。根据一些实施方案,本文提供的新的复合的可编程分子复合物(核蛋白复合物(nucleo-protein complex))被用于精确、可靠和成本有效地编辑或功能修饰预定的核酸序列靶。
在一些实施方案中,本文公开的分子复合物被用于基因靶向和/或靶向基因功能修饰,包括,但不限于,在靶核酸的一条或两条链中产生断裂以引发基因突变、缺失、基因置换和外源核酸分子的整合,或用于其化学、构象或生物功能的修饰。
根据一些实施方案,本文公开的分子复合物包括a)嵌合多肽(其可由多核苷酸分子编码),该嵌合多肽包含:(i)能够修饰靶位点的功能(效应器)域(FD);和(ii)连接域(LD);以及(b)赋予特异性的核酸(specificity conferring nucleic acid,SCNA),该SCNA包括:(i)与靶位点侧翼的靶核酸区域互补的核苷酸序列;和(ii)能够特异性附着至多肽的连接域的识别区域;从而,多肽和SCNA在宿主/靶细胞中的组装形成能够在靶位点特 异性修饰靶核酸的功能性、可编程的核蛋白分子复合物。
在一些实施方案中,本发明提供了有利的组合物,该组合物包含蛋白效应器模块(或编码蛋白效应器模块的核酸分子)和编程/靶向核酸模块(programming/targeting nucleic-acid module),其可体内自组装为特异性的、有活性的修饰核酸的分子核蛋白复合物。在该复合物中,在本文中也被称为“编程部分”、“编程寡核苷酸”或“赋予特异性的核酸”(SCNA)的核酸,通过所述赋予特异性的核酸和靶核酸的碱基配对提供了分子复合物对靶核酸的特异性和结合能力。该复合物的蛋白效应器组分或模块旨在通过附着至寡核苷酸的化学部分、寡核苷酸上的一个或多个核苷酸的修饰、寡核苷酸上的特定识别序列、等,或其组合,结合/连接/附着至决定特异性的核酸。有利地,本文公开的组合物和方法赋予了对宽范围的期望的靶序列的较高特异性,是较少遗传毒性的,在其组装中是模块化的,可靠的,利用单个平台而无需定制,对在专门的核心设备之外独立使用是实用的,并且具有较短的开发时间帧和降低的成本。
蛋白模块的活性可导致靶核酸序列的修饰和/或靶核酸的功能修饰。靶核酸修饰可包括,但不限于:突变、缺失、插入、置换、结合、消化、产生切口(nicking)、甲基化、乙酰化、连接(ligation)、重组、螺旋解旋、化学修饰、标记、活化和失活或其任何组合。靶核酸功能修饰可导致,但不限于:在转录激活、转录失活、可变剪接、染色质重排、病原体失活、病毒失活中的变化、细胞定位、核酸的区室化中的变化,等,或其组合。由蛋白部分产生的任何编辑作用或其他修饰通过其与赋予特异性的核酸的连接被定向或指导至预期的(预先定义的)特定靶核酸。有利地,各单个类型的蛋白组分的使用可与决定特异性的核酸的核苷酸序列的非限制的分类伴随或单独组合,以允许对期望的靶核酸的不同部分有类似作用。这允许通过提供用于修饰预定的核酸序列靶的通用的、可靠的和成本有效的方法和组合物克服现有技术方法的缺点。因此,如果被用于一种受体(receptacle)或生物体,对于决定特异性的核酸类型的任何组合或多样性,仅一种类型的蛋白待被提供。这还包括伴随使用不止一种类型的蛋白组分与不止一种类型的决定特异性的核酸的可能性。
根据一些实施方案,本文公开的复合物是模块化的,并可在体内或体外的靶细胞内自组装,允许每次伴随地提供一种类型的蛋白部分和一个或多个决定特异性的寡核苷酸。此外,在一些实施方案中,可将蛋白组分递送至期望的细胞并在体内表达,等待任何适合的SCNA在后来的时间的递送。在一些实施方案中,蛋白组分和SCNA可同时或基本上同时被递送。因此,蛋白组分和SCNA的组合,优选地在期望的靶细胞内的组合,可实现特定基因组双链断裂(DSB)的诱导,或体内任何其他期望的核酸修饰。本发明的方法不限于将点突变引入靶核酸,因为分子复合物可靶向任何核酸序列或序列对,在非常靠近它们的位置处切割/限制(restrict)/裂解,并由此缺失小的或大的核酸部分,或切割/限制/裂解序列,以启动任何核酸序列的去除或插入,或置换。
有利地,本发明在其实施方案中首次公开了蛋白组分的体内表达,以及其通过体内自组装结合/附着至SCNA以体内形成分子复合物,而无需蛋白部分和靶向核酸之间事先的共价/化学连接。根据本发明的实施方案,与本领域已知的基于寡核苷酸的系统相比,结合到蛋白的SCNA并非旨在用作供体,而是作为赋予特异性的部分,并且不会成为修饰的核酸的部分。此外,在本发明的一些实施方案中,SCNA可以以引起单次递送事件的分子复合物的所有组分的组装的方式在体内表达。此外,根据一些实施方案,效应器蛋白可被设计仅当其二聚化时是有活性的(即,其必须形成二聚体才是有活性的),由此可控制二聚化以使得活性二聚体仅可当其被SCNA靶向/编程并结合至其靶位点时形成,例如,当二聚体的单体配偶体(蛋白)之间的分子距离足够精确时形成。因此,有利地,分子复合物仅在其预期的靶位点被活化,从而提高特异性和可靠性。根据另外的实施方案,可表达一种蛋白组分以形成/产生同源二聚体,每一个由赋予特异性的不同寡核苷酸编程/靶向。另外,作为本领域已知的用于体内蛋白表达的病毒表达系统,由于大小的约束,通常限于产生一种蛋白,并且由于交叉保护通常专用于类似的病毒,因此,对于该递送模式,使用一个蛋白组分具有关键优势。此外,与本领域已知的具有有限亚组的识别序列的其他方法(诸如ZFN和大范围核酸酶)相比,本文公开的编程寡核苷酸(SCNA),具有无限的序列库(an infinite repertoire of sequences),因此在高度复杂的基因组中令人 信服地实现极端序列特异性。此外,由于许多编程寡核苷酸与单个蛋白效应器部分伴随地被提供,同时修饰不止一个靶是可能的,提供了相对于本领域已知的方法的另外的优势。例如,这可有助于快速敲除多个基因,或用于在不同的位置插入多个不同的性状,或用于用一个供体核苷酸标签给几个不同的位置加标签。
根据一些实施方案,由于非编程的蛋白组分(即未附着/连接到编程寡核苷酸的蛋白)对靶核酸没有亲和力或具有非常低的亲和力,有利地获得了改善的特异性和安全性和降低的遗传毒性。如以上详述的,蛋白组分的效应器或催化结构域仅当二聚化时是有活性的,由此至少两个编程寡核苷酸(SCNA)必须结合靶侧翼序列以引起蛋白二聚化和激活。两个足够长的编程寡核苷酸可通过创建与结合位点的广泛互补性给予高度复杂的基因组中需要的非常高的理论特异性。由于非编程的表达的蛋白对靶核酸不具有亲和力,其不会结合和/或修饰靶核酸。因此,在其中例如将编程寡核苷酸单独递送/提供到靶细胞(其已表达非编程的蛋白组分)的应用中,或在其中将寡核苷酸从靶细胞耗尽(例如,通过稀释或降解)的条件下,不可能发生非特异性裂解,从而提高了安全性并减少遗传毒性。
因此,根据本发明的实施方案,可具体地并以可编程的方式使用定向的非同源末端连接(NHEJ)和辅助的同源重组(HR)两者,以实现以下的一种或多种:
1)突变DNA序列:通过在DNA序列内部裂解、创建双链断裂(DSB)、在某种程度上被内源核酸酶降解、并通过内源NHEJ DNA修复机制再连接以创建DNA的符合读框的(in-frame)缺失和/或移码(frame-shift)突变。相对于植物中的T-DNA或转座子插入系,缺失或突变内源基因的这种方法不会留下外源DNA并且根据一些定义植物可被称为非转基因植物。在NHEJ中,还可将一个或多个核苷酸以仍未知的内源性机制加入DSB中,基本上实现移码或突变的相同效应。
2)缺失一段DNA序列:通过裂解其侧翼的两个序列、通过内源性NHEJ DNA修复机制再连接,或通过辅助的HR,通过在待缺失的序列内或附近裂解并提供供体DNA,随后将该供体DNA重组进入靶,并且该供 体DNA含有靶中待被缺失的序列的侧翼序列。
3)将供体核酸插入DSB:通过裂解靶核酸并提供通过NHEJ机制直接被连接到缺口(gap)的供体DNA,或优选地提供与待被重组的缺口的末端具有同源性并通过辅助的HR被连接入缺口的供体。
4)置换靶核酸序列:通过裂解其侧翼序列,并提供通过NHEJ待被插入、待连接在靶点侧翼序列内的供体核酸,或优选地通过HR重组并连接的供体核酸,通过在供体的末端上添加与靶核酸或其侧翼序列相似的序列。
根据一些实施方案,并且不希望被理论或机制束缚,本文公开的组合物和方法的优势包括:创建通用的酶复合物构建方案,其可靶向无限选择的序列。在蛋白组分被优化用于特定目的(例如,dsDNA裂解)之后,该相同的蛋白与无限选择的编程核酸(SCNA)序列一起被使用。因此,待被影响的靶序列的多样性通过SCNA的设计来实现,而没有蛋白重新设计和优化的困难和费时的必要性,所述蛋白重新设计和优化的困难和费时的必要性是本领域中已知的其他方法诸如TALEN、ZFN和大范围核酸酶中固有的,其中蛋白自身必须被改变和调整以用于每个靶序列。设计和制备合成的SCNA是相对简单、快速且相对便宜的。在本发明的一些实施方案中,绕过将化学合成的SCNA递送至细胞的必要性,在体内产生SCNA也是可能的。此外,SCNA可被设计成针对几乎任何期望的靶序列的碱基对,并因此,可将分子复合物定向到几乎任何靶序列。此外,几个靶序列可在相同的细胞中伴随使用。例如,在需要不止一个裂解位点的编辑功能诸如缺失或置换核酸的特定段中,通过简单地提供四种不同的SCNA和一个蛋白部分。
根据一些实施方案,因此,提供了用于修饰靶细胞中的靶核酸序列中的预定的靶位点的核蛋白组合物,该组合物包括:编码多肽的多核苷酸分子,或多肽,所述多肽包括:(i)能够修饰所述靶位点的功能(效应器)域(FD),该功能域缺乏特定核酸结合位点;和(ii)能够与赋予特异性的核酸(SCNA)相互作用的连接域(LD),其中连接域缺乏特定靶核酸结合位点;以及;(b)赋予特异性的核酸(SCNA)或编码SCNA的核酸,SCNA 包括:(i)与靶位点侧翼的靶核酸区域互补的核苷酸序列;和(ii)能够以高结合亲和力特异性附着至多肽的连接域的识别区域;由此多肽和SCNA在靶细胞内的组装形成能够在靶位点特异性修饰所述靶核酸的功能核蛋白复合物。
在一些实施方案中,功能域包括催化结构域。在一些实施方案中,多肽还包含亚细胞定位结构域。
在一些实施方案中,修饰靶核酸选自:突变、缺失、插入、置换、结合、消化、双链断裂创建(double-strand-break creation)、产生切口、甲基化、乙酰化、连接、重组、螺旋解旋、化学修饰、标记、活化和失活。
根据一些实施方案,SCNA包括选自由以下组成的组的核酸分子:单链DNA、单链RNA、双链RNA、修饰的DNA、修饰的RNA、锁核酸(locked-nucleic acid,LNA)和肽核酸(PNA)或其组合。
在一些实施方案中,SCNA的识别区域包括选自以下的修饰:5’-端修饰、3’-端修饰、和内部修饰。在一些实施方案中,化学修饰选自由以下组成的组:核苷酸修饰,和非核苷酸部分的添加。在一些实施方案中,非核苷酸部分选自:生物素、荧光素、胺-接头(Amine-linker)、寡肽、氨基烯丙基(aminoallyl)、染料分子、荧光团、地高辛、Acrydite、腺苷酸化物(Adenylation)、叠氮化物、NHS-酯、胆固醇基-TEG、炔烃、可光裂解的生物素、硫醇、二硫醇。在一些实施方案中,核苷酸修饰选自由以下组成的组:磷酸酯、2-氨基嘌呤、三聚体-20(Trimer-20)、2,6-二氨基嘌呤、5-溴-脱氧尿苷(5-Bromo-deoxiUridine)、脱氧尿苷(DeoxiUridine)、反向dT、双脱氧核苷酸(dideoxi-nucleotides)、5-甲基脱氧胞苷、脱氧肌苷、5-硝基吲哚、2-O-甲基RNA碱基、Iso-dC、Iso-dG、氟修饰的碱基和硫代磷酸酯键。在一些实施方案中,修饰选自由以下组成的组:核苷酸修饰、生物素、荧光素、胺-接头、寡肽、氨基烯丙基、染料分子、荧光团、地高辛、Acrydite、腺苷酸化物、叠氮化物、NHS-酯、胆固醇基-TEG、炔烃、可光裂解的生物素、硫醇、二硫醇、修饰的碱基、磷酸酯、2-氨基嘌呤、三聚体-20、2,6-二氨基嘌呤、5-溴-脱氧尿苷、脱氧尿苷、反向dT、双脱氧核苷酸、5-甲基脱氧胞苷、脱氧肌苷、5-硝基吲哚、2-O-甲基RNA碱基、Iso-dC、Iso-dG、 氟修饰的碱基和硫代磷酸酯键,和通过其与特定核苷酸序列的相互作用共价结合的蛋白。在一些实施方案中,通过其与特定核苷酸序列的相互作用共价结合的蛋白可选自,但不限于:农杆菌VirD2蛋白、微小核糖核酸病毒VPg、拓扑异构酶、PhiX174噬菌体A蛋白、PhiX A*蛋白,以及其任何变体。
在一些实施方案中,SCNA上的修饰和连接域之间的附着/结合/缔合由从选自但不限于以下的结合对的非共价相互作用中选择的结合对引起:生物素-亲和素;生物素-链霉亲和素;生物素-修饰形式的亲和素;蛋白-蛋白;蛋白-核酸相互作用;配体-受体相互作用;配体-底物相互作用;抗体-抗原;单链抗体-抗原;抗体或单链抗体-半抗原;激素-激素结合蛋白;受体-激动剂;受体-受体拮抗剂;IgG-蛋白A;酶-酶辅因子;酶-酶抑制剂;单链DNA-VirE2;StickyC-dsDNA;RISC-RNA;病毒外壳蛋白-核酸;抗荧光素单链可变区片段抗体(抗-FAM ScFV)-荧光素;抗DIG单链可变区片段(scFv)免疫球蛋白(DIG-ScFv)-地高辛(DIG)和农杆菌VirD2-VirD2结合蛋白;以及其任何变体。
在一些实施方案中,SCNA的识别区域包括能够特异性附着/结合/缔合至嵌合蛋白的连接域的核苷酸基序。在一些实施方案中,核苷酸基序和连接域之间的附着/缔合/结合选自但不限于:锌指蛋白-锌指基序;限制性内切酶识别域-限制性内切酶识别序列;转录因子的DNA结合域-DNA基序;阻抑物-操纵基因;亮氨酸拉链-启动子;螺旋环螺旋-E盒结构域;包括富含精氨酸的基序结构域的RNA结合基序、αβ蛋白结构域、RNA识别基序(RRM)结构域、K-同源结构域、双链RNA结合基序、RNA结合锌指、和靶向RNA的酶-相关的特定RNA序列;HIV-rev蛋白-HIV rev反应元件(RRE)的茎IIB;牛免疫缺陷病毒(BIV)Tat主要结合域-BIV反式作用反应元件(TAR)序列的环1;λ噬菌体、phi21、和P22N蛋白-在其各自RNA中的N-利用(N-utilization,nut)位点中的盒B环发夹结构。
根据一些实施方案,提供了用于通过可编程的核蛋白分子复合物修饰靶核酸序列内的预定的靶位点的方法,该方法包括以下步骤:a)将编码可编程的嵌合蛋白(多肽)或蛋白(多肽)的核酸序列递送至宿主细胞;b) 将赋予特异性的核酸(SCNA)分子,或编码SCNA的核酸递送至所述宿主细胞;c)所述嵌合蛋白与SCNA结合,从而将嵌合蛋白靶向宿主细胞内的预定的靶核酸序列,以形成有活性的编程的核蛋白复合物(active programmed nucleoprotein complex);以及d)允许通过所述有活性的编程的核蛋白分子复合物修饰靶核酸序列的预定的靶位点。
在一些实施方案中,提供了用于通过可编程的核蛋白分子复合物修饰靶核酸序列内的预定的靶位点的方法,该方法包括以下步骤:
a.将编码可编程的嵌合多肽的核酸序列递送至宿主细胞,所述嵌合多肽包含:
(i)能够修饰所述靶位点的功能域,该功能域缺乏特定核酸结合位点;以及
(ii)能够与赋予特异性的核酸相互作用的连接域,其中该连接域缺乏特定靶核酸结合位点;
b.将赋予特异性的核酸(SCNA)分子或编码SCNA的核酸递送至所述宿主细胞,所述SCNA分子包括:
(i)与靶位点侧翼的靶序列的区域互补的核苷酸序列;以及
(ii)能够以高结合亲和力特异性附着至多肽的连接域的识别区域;
其中多肽在包含SCNA的细胞中的表达使所述嵌合多肽能够附着至SCNA,形成有活性的编程的核蛋白复合物,从而将嵌合多肽靶向宿主细胞内的预定的靶核酸序列,使通过所述有活性的编程的核蛋白分子复合物修饰靶核酸序列的预定的靶位点成为可能。
在一些实施方案中,靶核酸是DNA。在一些实施方案中,靶DNA是基因组DNA。在一些实施方案中,靶核酸序列是染色体外的核酸序列。在一些实施方案中,染色体外的靶核酸序列位于选自由以下组成的组的细胞器中:线粒体、叶绿体、造粉体和色质体。在一些实施方案中,靶核酸序列是病毒核酸序列。在一些实施方案中,靶核酸序列是原核核酸序列。在一些实施方案中,靶核酸序列是合成的核酸序列。
在一些实施方案中,修饰选自:突变、缺失、插入、置换、结合、消化、双链断裂创建、产生切口、甲基化、乙酰化、连接、重组、螺旋解旋、化学修饰、标记、激活和失活。
在一些实施方案中,嵌合蛋白(多肽)包括具有核酸修饰活性的蛋白部分。在一些实施方案中,嵌合蛋白包括具有核酸功能修饰剂的蛋白部分,其中功能修饰选自由以下组成的组:转录激活、转录失活、RNA转录沉默、可变RNA剪接、染色质重排、细胞寄生物和病毒失活、和所述靶核酸序列的细胞定位或区室化中的变化。
在一些实施方案中,SCNA包括选自由以下组成的组的分子:单链DNA、单链RNA、双链RNA、修饰的DNA、修饰的RNA、锁核酸(LNA)和肽核酸(PNA)或其组合。在一些实施方案中,SCNA包括被配置以与靶核酸特异性相互作用的特异性限定的序列。SCNA与靶核酸之间的相互作用为通过选自由以下组成的组的碱基配对:完全双螺旋碱基配对、部分双螺旋碱基配对、完全三螺旋碱基配对、部分三螺旋碱基配对、和通过所述碱基配对形成的D环或支链的形式。
在另外的实施方案中,SCNA包括被配置以与嵌合蛋白的连接域缔合/结合/附着的识别区域。在一些实施方案中,识别区域包括选自由以下组成的组的修饰:5’-端修饰、3’-端修饰、和内部修饰。修饰可选自,但不限于:核苷酸修饰、生物素、荧光素、胺-接头、寡肽、氨基烯丙基、染料分子、荧光团、地高辛、Acrydite、腺苷酸化物、叠氮化物、NHS-酯、胆固醇基-TEG、炔烃、可光裂解的生物素、硫醇、二硫醇、修饰的碱基、磷酸酯、2-氨基嘌呤、三聚体-20、2,6-二氨基嘌呤、5-溴-脱氧尿苷、脱氧尿苷、反向dT、双脱氧核苷酸、5-甲基脱氧胞苷、脱氧肌苷、5-硝基吲哚、2-O-甲基RNA碱基、Iso-dC、Iso-dG、氟修饰的碱基和硫代磷酸酯键,和通过其与特定核苷酸序列的相互作用共价结合的蛋白。通过其与特定核苷酸序列的相互作用共价结合的蛋白选自:农杆菌VirD2蛋白、微小核糖核酸病毒VPg、拓扑异构酶、PhiX174噬菌体A蛋白、PhiX A*蛋白,以及其任何变体。
在一些实施方案中,对SCNA的修饰和连接域之间的缔合/结合/附着 由选自以下的结合对的非共价相互作用引起:生物素-亲和素;生物素-链霉亲和素;生物素-修饰形式的亲和素;蛋白-蛋白相互作用;蛋白-核酸相互作用;配体-受体相互作用;配体-底物相互作用;抗体-抗原相互作用;单链抗体-抗原;抗体或单链抗体-半抗原相互作用;激素-激素结合蛋白;受体-激动剂;受体-受体拮抗剂;抗荧光素单链可变区片段抗体(抗-FAM ScFV)-荧光素;抗DIG单链可变区片段(scFv)免疫球蛋白(DIG-ScFv)-地高辛(DIG);IgG-蛋白A;酶-酶辅因子;酶-酶抑制剂;单链DNA-VirE2;StickyC-dsDNA;RISC-RNA;病毒外壳蛋白-核酸和农杆菌VirD2-VirD2结合蛋白;以及其任何变体。
在一些实施方案中,赋予特异性的核酸序列和蛋白部分的连接域之间的结合/缔合在体内共价进行。在一些实施方案中,连接域和SCNA的共价缔合由农杆菌VirD2-右边界序列或其任何变体的生物相互作用引起,并在包括农杆菌的细菌中进行。
在一些实施方案中,识别区域包括能够与嵌合蛋白的连接域相互作用/附着/结合的核苷酸基序。在一些实施方案中,相互作用对选自:锌指蛋白-锌指基序;限制性内切酶识别域-限制性内切酶识别序列;转录因子的DNA结合域-DNA基序;阻抑物-操纵基因;亮氨酸拉链-启动子;螺旋环螺旋-E盒结构域;包括富含精氨酸的基序结构域的RNA结合基序、αβ蛋白结构域、RNA识别基序(RRM)结构域、K-同源结构域、双链RNA结合基序、RNA结合锌指、和靶向RNA的酶-相关的特定RNA序列;HIV-rev蛋白-HIV rev反应元件(RRE)的茎IIB;牛免疫缺陷病毒(BIV)Tat主要结合域-BIV反式作用反应元件(TAR)序列的环1;λ噬菌体、phi21、和P22N蛋白-在其各自RNA中的N利用(nut)位点中的盒B环发夹结构。
根据一些实施方案,预定的靶核酸序列参与遗传性状,且修饰通过选自由以下组成的组的技术过程导致遗传因子(genetic element)的转录或翻译的变化:永久置换、敲除、暂时或永久地增强、切断(shutting-off)、敲低、和移码。在一些实施方案中,遗传性状通过编辑遗传因子序列本身、其调节序列、调节感兴趣的基因的基因或其在事件的调节链中的调节序列被修饰。
根据另外的实施方案,提供了核蛋白复合物,其中蛋白部分和赋予特异性的核酸部分之间的物理缔合形成编程的功能复合物。在一些实施方案中,蛋白部分的连接域和SCNA之间的物理缔合基于选自由以下组成的组的亲和相互作用:配体-受体、配体-底物、氢键、范德华键、离子键和疏水相互作用。
根据一些实施方案,提供了具有通过本文公开的方法产生的预定的靶位点中的预定的基因修饰的宿主细胞。在一些实施方案中,宿主细胞可以是任何类型的细胞,诸如,但不限于:脊椎动物细胞、哺乳动物细胞、人细胞、动物细胞、植物细胞、无脊椎动物细胞、线虫细胞、昆虫细胞和干细胞。
根据一些实施方案,提供了具有通过本文描述的方法形成的预定的基因修饰的转基因生物体或敲除生物体。在一些实施方案中,生物体是植物或动物。
根据一些实施方案,提供了治疗生物体中的遗传疾病的方法,该方法包括向生物体的细胞中引入核蛋白可编程分子复合物。
根据一些实施方案,提供了宿主细胞,该宿主细胞包括:
a)多肽,该多肽包括:(i)能够修饰细胞中靶核酸序列中的靶位点的功能域,该功能域缺乏特定的核酸结合位点;和(ii)能够与赋予特异性的核酸相互作用、并缺乏特定的靶核酸结合位点的连接域;以及;
(b)赋予特异性的核酸(SCNA),包括:
(i)与靶位点侧翼的靶核酸区域互补的核苷酸序列;和(ii)能够特异性附着至多肽的连接域的识别区域;
由此,多肽和SCNA在宿主细胞内的组装形成能够特异性修饰靶位点的靶核酸的功能核蛋白复合物。
在一些实施方案中,提供了包含以下的宿主细胞:(a)编码多肽的多核苷酸分子,该多肽包括:(i)能够修饰细胞中靶核酸序列中的靶位点的功能域,该功能域缺乏特定的核酸结合位点;和(ii)能够与赋予特异性的核酸相互作用、并缺乏特定的靶-核酸结合位点的连接域;以及(b)赋 予特异性的核酸(SCNA),包括:(i)与靶位点侧翼的靶核酸区域互补的核苷酸序列;和(ii)能够特异性附着至多肽的连接域的识别区域;由此,多肽和SCNA在宿主细胞内的组装形成能够特异性修饰靶位点的靶核酸的功能核蛋白复合物。
附图简述
图1A-B是显示根据一些实施方案,可编程分子复合物的元件/组件的示意图;
图2A-B是显示根据一些实施方案,可编程分子复合物的组装的示意图;
图3展示根据一些实施方案,被设计用于裂解预先定义的核dsDNA靶序列的分子复合物的3D建模实例;
图4A-B是根据一些实施方案,可编程分子复合物的组件组装到靶核酸上的示例性模式的示意图(不按比例)。
图5是展示根据一些实施方案,使用体外产生的SCNA将可编程分子复合物递送至细胞的示意性方案;
图6是展示根据一些实施方案,使用体内产生的SCNA将可编程分子复合物递送至细胞的一般方案;
图7A-B是显示根据一些实施方案,使用在农杆菌(图7A)和细菌分泌系统(图7B)中产生的单链DNA SCNA将分子复合物的编程核酸部分递送至细胞的非限制性实例的方案;
图8A-B是展示根据一些实施方案,使用由农杆菌(图8A)或通过自主复制载体诸如病毒(图8B)产生的RNA SCNA将可编程分子复合物的编程部分递送至细胞的示意图;
图9显示根据一些实施方案,用于在单次递送事件中将包含可编程分子复合物组装必需的组分的组合物伴随递送至易感的靶真核细胞的递送媒介物(vehicle)或载体的非限制性实例的示意图(不按比例);
图10是展示根据一些实施方案,使用编程的分子复合物在靶核酸中创建突变的示意图(不按比例)。
图11是展示根据一些实施方案,使用编程的分子复合物以使用提供的供体核酸将一个或多个核苷酸插入靶核酸的示意图(不按比例)。
图12是展示根据一些实施方案,使用编程的分子复合物以使用提供的供体核酸置换靶核酸中的一个或多个核苷酸的示意图(不按比例)
图13是展示根据一些实施方案,使用编程的分子复合物以创建靶核酸中的一个或连续多个核苷酸的缺失的示意图(不按比例)。
图14是展示根据一些实施方案,使用编程的分子复合物以使用提供的供体核酸置换靶核酸中的一个或多个核苷酸的示意图(不按比例)。
图15显示根据一些实施方案并如实施例10中详述的用于将可编程分子复合物蛋白(PMCP)与靶序列一起伴随递送至易感的靶真核细胞以测试其活性的递送媒介物或载体的非限制性实例的示意图(不按比例)。
图16显示如实施例12中详述的经验性确定SCNA对之间的最佳距离和测试不同类型的编程的分子复合物特异性裂解靶DNA的能力的参数的示意图(不按比例)。
发明详述
根据一些实施方案,提供了用于修饰预定的靶核酸的组合物和方法。具体公开了用于使用包含可编程分子复合物的组合物体内修饰靶序列的方法。可编程分子复合物(本文还称为“核蛋白复合物”)包含蛋白部分,(本文还称为“可编程部分”),和核酸部分(本文还称为“赋予特异性的核酸”(SCNA)或“编程核酸”)。根据一些实施方案,分子复合物的组件在靶核酸序列存在下,在活细胞、生物体、组织、愈伤组织、器官或其部分,无论分化的或未分化的,中体内自组装以形成有活性的编程的功能分子复合物。
应当理解的是,本文使用的术语仅用于描述特定实施方案的目的,并 不预期进行限制。必须指出的是,如在说明书和所附权利要求中使用的,单数形式“一(a)”、“一(an)”和“该(the)”包括复数指代,除非上下文另有明确规定。
对于本文数值范围的引用,明确地包含具有相同精确程度的介于其间的每一个数。例如,对于6-9的范围,除了6和9之外,还包括了数字7和8,且对于范围6.0-7.0,则明确包括了数字6.0、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9和7.0。
定义

如本文所用,术语“约”是指+/-10%。
施用
“施用”指向受试者提供药剂(pharmaceutical agent)或药物组合物,并且包括,但不限于,通过医疗专家的施用或自施用。
“肠胃外施用”意指不通过肠道的施用。肠胃外施用包括,但不限于,皮下施用、静脉施用或肌内施用。
“皮下施用”意指仅在皮肤下的施用。
“静脉施用”意指进入静脉的施用。
“瘤内施用”意指肿瘤内的施用。
“化疗栓塞(Chemoembolization)”意指其中外科手术或机械地阻断向肿瘤的血液供应并将化学治疗剂直接施用进入肿瘤的过程。
反义(antisense)
如本文使用的术语“反义”,是指与特定DNA或RNA序列互补的核苷酸序列。使用术语“反义链”涉及与“有义”链互补的核酸链。反义分子可通过允许合成互补链的任何方法制备,包括通过将感兴趣的基因反向连接至病毒启动子的合成来制备。被引入细胞之后,该转录的链与由细胞产生的天然序列结合以形成双链体。然后,这些双链体阻断进一步转录或翻译。在这种方式中,可产生突变表型。
自主复制载体
“自主复制载体”在此被定义为包括能够在宿主内复制的任何天然或非天然的核酸序列,包括但不限于病毒、修饰的病毒、某些重组载体和质粒、复制子和细胞内寄生物。
细胞
“细胞”在此被定义为包括任何类型的细胞,原核细胞或真核细胞、分离的或未分离的细胞、培养的或非培养的细胞、分化的或未分化的细胞,并且还包括细胞的更高级别的组织,诸如组织、器官、愈伤组织、生物体或其部分。示例性的细胞包括,但不限于:脊椎动物细胞、哺乳动物细胞、人细胞、植物细胞、动物细胞、无脊椎动物细胞、线虫细胞、昆虫细胞、干细胞等。
互补(complement)
如本文使用的“互补”或“互补的”意指核酸分子的核苷酸或核苷酸类似物之间的沃森-克里克(Watson-Crick)(例如,A-T/U和C-G)或胡斯坦(Hoogsteen)碱基配对。全长互补或完全互补的可意指,核酸分子的核苷酸或核苷酸类似物之间的100%互补的碱基配对。部分互补的可意指低于100%的互补性,例如80%的互补性。
递送载体
“递送载体(delivery vector)”或“递送载体(delivery vectors)”指可被用于本发明以使本发明需要的剂/化学物质和分子(蛋白或核酸)与细胞接触或递送其至细胞或亚细胞区室内的任何递送载体。其包括,但不限于,转导载体、脂质体递送载体、质粒递送载体、病毒递送载体、细菌递送载体、药物递送载体、化学运载体(carrier)、聚合物运载体、脂质复合物(lipoplex)、聚合复合物(polyplex)、树枝状大分子(dendrimer)、微泡(超声造影剂)、纳米粒子、乳剂或其他适当的转移载体。这些递送载体允许递送分子、化学物质、大分子(基因、核酸、蛋白)、或其他载体诸如质粒和T-DNA。这些递送载体为分子运载体。
剂量
本文所用的“剂量”意指在单次施用中提供的药剂的指定的量。在某些实施方案中,剂量可以以两次或多次大丸剂、片剂、或注射剂被施用。例如,在其中需要皮下施用的某些实施方案中,所需的剂量需要单次注射难以容纳的体积。在此类实施方案中,两次或多次注射可被用于实现所需的剂量。在某些实施方案中,剂量可以以两次或多次注射被施用,以最小化个体中注射部位的反应。
剂量单位
如本文所用的“剂量单位”意指其中提供药剂的形式。在某些实施方案中,剂量单位是含有冻干的寡核苷酸的小瓶。在某些实施方案中,剂量单位是含有重构的寡核苷酸(reconstituted oligonucleotide)的小瓶。
供体核酸
“供体核酸”在此被定义为提供给生物体或受体以通过DNA修复机制、同源重组(HR)、或通过非同源末端连接(NHEJ)全部或部分插入或重组进入靶序列的任何核酸。
持续时间(duration)
本文使用的“持续时间”意指活性或事件持续的时间段。在某些实施方案中,治疗的持续时间是施用药剂或药物组合物的剂量的时间段。
表达载体
本文使用的“表达载体”意指被设计在宿主细胞中人工编码一种或多种外源性蛋白的任何核酸。表达载体的实例包括质粒DNA、T-DNA、病毒-RNA、ssDNA或dsDNA、复制子、自主复制载体、线性ssDNA、线性dsDNA、聚合酶产物、RNA转录本、环状RNA,以及在本发明的一些应用中被转移进入宿主细胞中的基因组和细胞器DNA。
片段
“片段”在本文被用于表示核酸或多肽的非全长部分。因此,片段本身还分别是核酸或多肽。
基因
如本文所用的“基因”可以是天然的(例如,基因组)或合成的基因,包括转录和/或翻译调节序列和/或编码区和/或非翻译序列(例如,内含子、5’-和3’-非翻译序列)。基因的编码区可以是编码氨基酸序列的核苷酸序列或功能性RNA,诸如tRNA、rRNA、催化RNA、siRNA、miRNA或反义RNA。基因还可以是相应于编码区的mRNA或cDNA(例如,外显子和miRNA),任选地包含与其连接的5’-或3’-非翻译序列。基因还可以是体外产生的扩增的核酸分子,包括全长或部分编码区和/或与其连接的5’-或3’-非翻译序列。
基因靶向
“基因靶向”在本文被用作诱导靶核酸序列的永久性改变包括靶序列中核苷酸的缺失、插入、突变和置换的任何基因技术。
基因组修饰
“基因组修饰”在本文被用作生物体的基因组或染色体或染色体外DNA或细胞器DNA中产生的作为基因靶向或基因功能修饰的结果的任何修饰。
宿主细胞
本文使用的“宿主细胞”可以是天然存在的细胞或可含有载体的转化细胞。宿主细胞可以是培养的细胞、外植体、体内细胞,等。宿主细胞可以是原核细胞诸如大肠杆菌(E.coli),或真核细胞诸如植物、酵母、昆虫、两栖动物或哺乳动物细胞,诸如CHO和HeLa。
根据一些实施方案,所述宿主细胞是生物体、器官、组织或愈伤组织中的全部或部分、分化或未分化的细胞。
同一性
如本文在两个或多个核酸或多肽序列的情况下使用的“相同的”或“同一性”意指该序列具有特定百分比的跨特定区域相同的残基。百分比可通过以下计算:最佳比对两条序列、跨特定区域比较两条序列、确定两条序列中存在相同残基的位置的数目以产生匹配的位置的数目,将匹配的位置的数目除以特定区域中位置的总数,并将结果乘以100以产生序列同一性 的百分比。在其中两条序列具有不同的长度或比对产生一个或多个交错末端、以及比较的特定区域仅包括单个序列的情况下,单个序列的残基被包括在计算的分母中而非分子中。当比较DNA和RNA时,可认为胸腺嘧啶(T)与尿嘧啶(U)是等同的。同一性可手工地或通过使用计算机序列算法诸如BLAST或BLAST2.0进行。
抑制(inhibit)
如本文中使用的“抑制”可意指阻止(prevent)、压制(suppress)、阻遏(repress)、减少或消除。
体外
“体外”在本文被定义为在全部或部分、分化或未分化的活生物体、器官、组织、愈伤组织或细胞的膜外的人工环境。在一些实施方案中,术语体外不是在有活力的细胞内。
体内
“体内”在本文被定义为在全部或部分、分化或未分化的生物体、器官、组织、愈伤组织或细胞内。
试剂盒
如本文使用的试剂盒可包括本文描述的组合物与以下的任一种或全部:测定试剂、缓冲液、探针和/或引物、和无菌盐水或另一种药学上可接受的乳剂和悬液基底(base)。此外,试剂盒可包括含有用于实践本文描述的方法的用法说明(例如,操作方案)的说明性材料。
标记物
如本文使用的“标记物”意指可通过光谱学、光化学、生物化学、免疫化学、化学或其他物理手段是可检测的组合物。例如,有用的标记物包括32P、荧光染料、电子致密试剂、酶(例如,在ELISA中常用的)、生物素、地高辛、或半抗原和可使其是可检测的其他实体。标记物可被掺入核酸和蛋白的任何位置处。
错配
“错配”意指未能与第二核酸的相应位置处的核碱基配对的第一核酸的核碱基。
修饰的寡核苷酸
如本文使用的“修饰的寡核苷酸”意指具有相对于天然存在的末端、糖、核碱基和/或核苷间连键的一个或多个修饰的寡核苷酸。
调节(modulation)
如本文使用的“调节”意指功能和/或活性和/或结构的扰动(perturbation)。在某些实施方案中,调节意指增加基因表达。在某些实施方案中,调节意指减少基因表达。
突变体
如本文使用的“突变体”是指其中序列的至少部分功能已丢失的序列,例如,在启动子或增强子区域中序列的变化将至少部分地影响生物体中编码序列的表达。如本文使用的,术语“突变”是指可由诸如缺失、添加、取代或重排引起的核酸序列中序列的任何变化。突变还可影响该序列参与的一个或多个步骤。例如,DNA序列中的变化可导致有活性的、有部分活性的或无活性的改变的mRNA和/或蛋白的合成。
核酸
如本文使用的“核酸序列”或“寡核苷酸”或“多核苷酸”意指共价连接在一起的至少两个核苷酸。单链的描绘还定义了互补链的序列。因此,核酸还包含了描绘的单链的互补链。核酸的许多变体可被用于与给定的核酸相同的目的。因此,核酸还包含了基本相同的核酸和其互补物。单链提供了可在严格杂交条件下与靶序列杂交的探针。因此,核酸还包含在严格杂交条件下杂交的探针。
核酸可以是单链或双链的,或可包含双链和单链序列两种部分。核酸可以是DNA,基因组和cDNA两者,RNA,或杂合体(bybrid),其中核酸可含有脱氧核糖核苷酸和核糖核苷酸的组合,和包括尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、肌苷、黄嘌呤次黄嘌呤、异胞嘧啶和异鸟嘌呤的碱基组合。核酸可通过化学合成方法或通过重组方法获得。
核酸通常将含有磷酸二酯键,虽然可具有至少一个不同连键例如,氨基磷酸酯、硫代磷酸酯、二硫代磷酸酯或O-甲基亚磷酰胺(O-methylphosphoroamidite)连键和肽核酸骨架和连键的核酸类似物也可被包括。其他类似物核酸包括具有正电荷骨架(positive backbone);非离子骨架和非核糖骨架的类似物核酸,包括描述于美国专利号5,235,033和5,034,506中的那些,其通过引用并入本文。含有一个或多个非天然存在的或修饰的核苷酸的核酸也被包括在核酸的一种定义中。修饰的核苷酸类似物可位于例如核酸分子的5’-端和/或3’-端。核苷酸类似物的代表性实例可选自糖-或骨架-修饰的核糖核苷酸。然而,应注意的是,核碱基修饰的核糖核苷酸,即含有非天然存在的核碱基而不是天然存在的核碱基的核糖核苷酸,诸如在5-位置处修饰的尿苷或胞苷,例如,5-(2-氨基)丙基尿苷、5-溴尿苷;在8-位置处修饰的腺苷和鸟苷,例如8-溴鸟苷;脱氮核苷酸(deaza nucleotide),例如7-脱氮腺苷;O-和N-烷基化的核苷酸,例如N6-甲基腺苷也是适合的。2’-OH-基团可由选自以下的基团置换:H、OR、R、卤素、SH、SR、NH2、NHR、NR2或CN,其中R为C1-C6烷基、烯基或炔基,并且卤素是F、Cl、Br或I。修饰的核苷酸还包括通过例如羟脯氨酸醇连键(hydroxyprolinol linkage)与胆固醇缀合的核苷酸。可进行核糖-磷酸骨架的修饰用于以下多种原因:例如,以增加此类分子在生理环境中的稳定性和半衰期、以增强穿过细胞膜的扩散、或作为生物芯片上的探针。骨架修饰还可增强诸如在细胞的苛刻内吞作用环境中对降解的耐受性。骨架修饰还可减少通过诸如肝中的肝细胞的核酸清除(nucleic acid clearance)。可制备天然存在的核酸和类似物的混合物;可选地,可制备不同核酸类似物的混合物、以及天然存在的核酸和类似物的混合物。
可操作地连接(operably linked)
本文使用的“可操作地连接”可意指,基因的表达受与其空间上连接的启动子的控制。启动子可被放置在受其控制的基因的5’(上游)或3’(下游)。启动子和基因之间的距离可与该启动子与该启动子源自的基因中受其控制的基因之间的距离近似相同。如本领域已知的,可调节该距离的变化而不损失启动子功能。
启动子
如本文使用的“启动子”可意指能够赋予、激活或增强细胞中的核酸表达的合成或天然来源的分子。启动子可包括一个或多个特定的转录调节序列,以进一步增强核酸表达和/或改变核酸的空间表达和/或时间表达。启动子还可包括远端增强子或抑制子元件,其可位于距离转录起始位点多达数千个碱基对。启动子可源自包括病毒、细菌、真菌、植物、昆虫和动物的来源。启动子可调节基因组分的组成型表达,或关于其中表达存在的细胞、组织或器官中的差别表达,或关于其中表达存在的发育阶段的差别表达,或响应外界刺激诸如生理应激、病原体、金属离子或诱导剂的差别表达。启动子的代表性实例包括噬菌体T7启动子、噬菌体T3启动子、SP6启动子、lac操纵子-启动子、tac启动子、SV40晚期启动子、SV40早期启动子、RSV-LTR启动子、CMV IE启动子、CaMV35S启动子、NOS启动子、热休克启动子、类固醇调节的启动子、金属调节的启动子、种子启动子和植物泛素启动子。
重组宿主细胞
“重组宿主细胞”是指已转化了使用重组DNA技术构建的载体的细胞。
可选择的标志物
本文中使用的“可选择的标志物”可意指赋予宿主细胞、组织、器官、愈伤组织或生物体表型的任何基因,其中其被表达以便于转染或转化有基因构建体的宿主细胞、组织、器官、愈伤组织或生物体的鉴定和/或选择。可选择标志物的代表性实例包括氨苄青霉素抗性基因(AmpR)、四环素抗性基因(TcR)、细菌卡那霉素抗性基因(KanR)、博来霉素(zeocin)抗性基因、赋予对抗生素金担子素A抗性的AURI-C基因、草铵膦(phosphinothricin)抗性基因(Bar)、新霉素磷酸转移酶基因(nptII)、潮霉素抗性基因、β-葡糖苷酸酶(GUS)基因、氯霉素乙酰转移酶(CAT)基因、绿色荧光蛋白(GFP)编码基因和荧光素酶基因。在本发明的一些实施方案中,可选择的标志物可从内源基因的修饰来制备,例如,当该基因的突变产生移码突变时,细胞表面表达和展示的趋化因子受体的废除,且然后可用抗体进 行阴性选择,或例如,烟草乙酰乳酸合酶基因中的W568L突变,其导致抗除草剂氯磺隆和灭草喹。
严格杂交条件
如本文使用的“严格杂交条件”意指诸如在核酸的复杂混合物中的第一核酸序列(例如,探针)将与第二核酸序列(例如,靶)杂交所处的条件。严格条件是序列依赖性的并且将在不同的情况下是不同的。严格条件可被选择为比在限定的离子强度和pH下的特定序列的热解链点(Tm)低约5-10℃。Tm可以是(在限定的离子强度、pH和核酸浓度下)处于平衡时与靶互补的50%的探针与靶序列杂交时的温度(由于靶序列过量存在,在Tm下,处于平衡时,50%的探针被占用)。
严格条件可以是其中在pH7.0至8.3时盐浓度小于约1.0M钠离子,诸如约0.01-1.0M钠离子浓度(或其他盐),并且对于短探针(例如,约10-50个核苷酸)温度为至少约30℃以及对于长探针(例如,大于约50个核苷酸)温度为至少约60℃的条件。严格条件还可通过加入去稳定剂诸如甲酰胺来实现。对于选择性或特异性杂交,阳性信号可以是背景杂交的至少2至10倍。示例性严格杂交条件包括以下:50%甲酰胺、5×SSC和1%SDS、42℃下温育,或5×SSC、1%SDS、65℃下温育,以0.2×SSC和0.1%SDS在65℃下洗涤。
互补的
本文使用的“互补的”意指,第一序列跨越8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个、100个或更多个核苷酸的区域与第二序列的互补序列至少60%、65%、70%、75%、80%、85%、90%、95%、97%、98%或99%相同,或意指两条序列在严格杂交条件下杂交。
基本上相同
如本文使用的“基本上相同”意指,第一和第二序列跨越8个、9个、 10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、35个、40个、45个、50个、55个、60个、65个、70个、75个、80个、85个、90个、95个、100个或更多个核苷酸或氨基酸的区域至少60%、65%、70%、75%、80%、85%、90%、95%、97%、98%或99%相同,或对于核酸而言,如果第一序列与第二序列的互补序列基本上互补。
靶核酸
如本文使用的“靶核酸”或“靶序列”是待被作用的任何期望的预定的核酸序列,包括但不限于编码或非编码序列、基因、外显子或内含子、调节序列、基因间序列、合成序列和细胞内寄生物序列。在一些实施方案中,靶核酸存在于靶细胞、组织、器官或生物体内。靶核酸包括靶位点,其包括靶序列内的一个或多个核苷酸,其通过本文公开的方法和组合物被修饰至任何程度。例如,靶位点可包含一个核苷酸。例如,靶位点可包含1-300个核苷酸。例如,靶位点可包含约1-100个核苷酸。例如,靶位点可包含约1-50个核苷酸。例如,靶位点可包含约1-35个核苷酸。在一些实施方案中,靶核酸可包括不止一个靶位点,其可以是相同的或不同的。
靶向的基因功能修饰
“靶向的基因功能修饰”和“靶基因修饰”是指导致靶核酸中永久或临时改变的任何基因技术,包括但不限于缺失、插入、突变、置换、切口、甲基化、乙酰化、连接、重组、螺旋解旋、化学修饰、标记、活化、失活和靶序列中一个或多个核苷酸的抑制。
疗法
如本文使用的“疗法”意指疾病治疗方法。在某些实施方案中,疗法包括,但不限于,化疗、手术切除、移植和/或化疗栓塞。
转基因生物体
该术语指具有通过本文公开的组合物和方法在其基因组中引入的一个或多个靶基因修饰的生物体。例如,修饰选自:一个或多个核苷酸的插入、突变、置换、切口、甲基化、乙酰化、连接、重组、螺旋解旋、化学 修饰、标记、激活、失活和/或抑制。生物体可以是任何类型的生物体,诸如,人、动物、植物,等。
瞬时表达
本文使用的“瞬时表达(transient expression)”或“瞬时表达(transient expressing)”可指在全部或部分、分化或未分化的生物体、器官、组织、愈伤组织或细胞中从提供的核酸的转录、或翻译,所述表达限于归因于提供的核酸未整合进入含有基因组或细胞器核酸的生物体、器官、组织、愈伤组织或细胞的稳定核酸中。用于瞬时表达的载体包括提供的线性或环状ssDNA、dsDNA或RNA、质粒、自主复制载体、病毒、体外转录本、T-DNA、合成的核酸和其经修饰的衍生物。因此,尽管根据定义瞬时表达是不可遗传的,但由于在染色体或细胞器基因组之外的核酸复制,其可在细胞谱系中连续地表达并在细胞间自主地转移。
治疗
在本文当提及保护受试者免受病症时使用的“治疗(treat)”或“治疗(treating)”意指,预防(preventing)、抑制(suppressing)、阻止(repressing)或消除病症。预防病症包括在病症发作前向受试者施用本文描述组合物。抑制病症包括在引起病症之后但在其临床表现之前向受试者施用组合物。阻止病症包括在病症的临床表现之后向受试者施用组合物以使得减少或预防病症恶化。消除病症包括在病症的临床表现之后向受试者施用组合物以使得受试者不再罹患病症。
变体
如本文提及核酸使用的“变体”意指:(i)参考的核苷酸序列的部分;(ii)参考的核苷酸序列的互补序列或其部分;(iii)与参考的核酸或其互补序列基本上相同的核酸;或(vi)在严格条件下与参考的核酸、其互补序列、或与其基本上相同的序列杂交的核酸。
载体
如本文使用的“载体”意指用于核酸递送目的的核酸序列。载体可被用于本发明以引起遗传转化、蛋白的表达、RNA的转录、或被直接用作用 于同源重组或非同源末端连接的供体。载体可以为质粒DNA、T-DNA、病毒-RNA、ssDNA或dsDNA、复制子、自主复制载体、线性或环状ssDNA、线性或环状dsDNA、支链的聚合酶产物、核酸树枝状大分子、RNA转录本、环状RNA、噬菌体、细菌人工染色体或酵母人工染色体,以及在本发明的一些应用中,被转移进入宿主细胞的基因组和细胞器DNA。载体可以为非复制、自我复制的染色体外载体或整合到宿主基因组中的载体。
野生型
如本文使用的,术语“野生型”序列是指执行该序列的自然或正常功能的序列的等位基因形式的编码、非编码或交界序列(interface sequence)。野生型序列包括相关序列(cognate sequence)的多个等位基因形式,例如,野生型序列的多个等位基因可编码针对编码序列编码的蛋白序列的沉默或保守变化。
根据一些实施方案,包含包括蛋白(多肽)部分和核酸部分的可编程分子复合物的组合物,在靶核酸序列存在下,在活细胞、生物体、组织、愈伤组织、器官或其部分中体内自组装以形成有活性的编程的功能分子复合物。
根据一些实施方案,多种编程的分子复合物可被构建以永久地或瞬时修饰现有的或即将发生的真核的、原核的、合成的、细胞内寄生物或病毒的靶序列,诸如,在基因组、细胞核、染色体、细胞质、细胞器、或染色体外核酸中发现的靶序列。通过分子复合物的作用进行的靶修饰包括可遗传的和非可遗传的、永久性和暂时的基因改变/修饰。在一些实施方案中,靶包括参与感兴趣的遗传性状的核酸,其被改变将是有利的。靶向的序列中的改变包括,例如,但不限于:核酸的永久缺失、突变、插入,以及将靶向的序列置换为另一个核酸序列、事件的调节链中的基因、其调节序列、调节感兴趣的基因或其调节序列的基因的转录或翻译的任何方式的敲除、移码或任何变化。对靶核酸的永久性改变包括,例如,遗传物质编辑或序列改变,诸如核酸突变、缺失、插入、置换和重组。对靶序列的瞬时改变包括,例如,靶核酸的结合、消化、产生切口、螺旋解旋、激活、失活、化学修饰、甲基化、乙酰化和标记。靶修饰包括,例如,靶功能修饰,其 可在细胞中导致转录激活、转录失活、RNA沉默、可变RNA剪接、染色质重排、细胞内寄生物失活中的变化,以及靶核酸的细胞定位或区室化中的变化。
根据一些实施方案,并且不希望被任何理论或机理束缚,可编程分子复合物的设计基于其自组装的能力、其靶向靶核酸上预先定义的期望的序列的能力、以及其以预定的方式作用于靶序列的能力。复合物的组分是模块化的并且是可调整的以适于1)所需的分子作用的特定类型,2)靶,以及3)用于其体内表达的期望的核酸的递送方法。本公开内容的方法和组合物相对于现有技术中已知的其他系统具有数个优势。例如,复合物的蛋白部分作为单体是无活性的,并且只有在有限范围内在预定的序列处结合靶核酸的两个SCNA寡核苷酸的正确间隔,才将导致蛋白部分的效应器结构域的配置(placement),使得其二聚化,并能够特异性作用于期望的预定的靶位点。这样的设定,借以只有编程的分子复合物的二聚体(即包含与SCNA连接的蛋白部分的复合物,其与靶核酸结合),才减少或完全消除了潜在的位点外(off-site)或非特异性裂解,由于蛋白部分本身不会结合靶核酸并且作为单体不起作用。
根据一些实施方案,将分子复合物的活性部分(功能域)设计为仅当蛋白部分的功能域二聚化时被激活。将非编程的蛋白组分设计为对核酸序列并对靶位点具有低的或几乎没有非特异性亲和力。因此,虽然对于所有类型的修饰,单一类型的蛋白部分的单体需要被表达,对于点修饰的最小功能,诸如,例如,由核酸酶结构域介导的点突变,或可选地,由甲基化酶结构域介导的点甲基化,应存在被设计为结合靶位点侧翼序列的两个SCNA以影响蛋白的正确间隔并允许它们的彼此结合和它们的二聚化。这有利地增强了复合物的序列特异性。在一些实施方案中,对于缺失和置换的编辑功能,感兴趣区域侧翼的两个不同位点,可需要被伴随裂解。在此实施方案中,即使在这种情况下,只有一个外源蛋白组分连同4个SCNA一起需要被表达。当通过稀释或通过降解将寡核苷酸耗尽时,非编程的表达的蛋白对靶核酸不具有亲和力,并且将停止作用于它(即,在这种情况下,停止裂解靶核酸)。
根据一些实施方案,蛋白(多肽)部分可被表达为单独的多肽或被表达作一个连续的蛋白(多肽)。在一些实施方案中,蛋白部分(组分)可具有根据结构和/或功能(效用)是可识别的一个或多个可识别结构域(identifiable domain)。在一些实施方案中,一个结构域可具有不止一个效用域(utility domain),即,单独的结构域可具有数种功能。根据一些实施方案,蛋白部分可包含以下结构和/或效用域中的一个或多个:a)“效应器结构域”(功能域),其可与靶核酸相互作用并因而影响靶核酸;和/或b)“连接域”,其可直接或间接地特异性结合SCNA;和/或c)“细胞定位域”;和/或d)域间连接体(connector)或间隔区(spacer);及其任何组合。
根据一些实施方案,“效应器结构域”(在本文中还称为“功能域”),在分子复合物组装后与靶核酸相互作用并对靶序列发挥期望的作用。在一些示例性实施方案中,该结构域具有包括核酸修饰活性的酶促或催化功能。在一些实施方案中,该结构域可源自活性结构域,该活性结构域源自诸如以下的已知功能的蛋白的整体、或部分、或修饰的部分:DNA结合蛋白、核酸酶、甲基化酶、甲基化的DNA结合因子、转录因子、染色质重塑因子、聚合酶、脱甲基酶、乙酰基转移酶、脱乙酰基酶、激酶、磷酸酶、整合酶、重组酶、连接酶、拓扑异构酶、旋转酶(girase)和解旋酶。在一些实施方案中,功能域可通过融合活性结构域的氨基酸序列来构建,所述活性结构域源自包括以下的已知功能的蛋白的整体、或部分、或修饰的部分:DNA结合蛋白、核酸酶、甲基化酶、甲基化的DNA结合因子、转录因子、染色质重塑因子,聚合酶、脱甲基酶、乙酰基转移酶、脱乙酰基酶、激酶、磷酸酶、整合酶、重组酶、连接酶、拓扑异构酶、旋转酶和解旋酶。在一些实施方案中,对于是核酸酶或源自核酸酶的效应器结构域,可去除核酸酶的DNA结合识别结构域。例如,当效应器结构域源自FokI核酸酶时,FokI位点识别和结合域在蛋白部分的效应器结构域中是不存在的。在一些实施方案中,效应器结构域缺乏特定的靶核酸结合位点,即,其不能够特异性结合特定的靶序列。
根据一些实施方案,将“连接域”设计成直接或间接地特异性结合/附着SCNA(并且特别地,与SCNA识别区域结合)。在连接域和SCNA 之间的结合/附着可直接或间接通过例如SCNA上的修饰。在连接域和SCNA之间的附着/结合/连接使SCNA与蛋白部分能够体内组装。在一些实施方案中,连接域通过将蛋白部分的氨基酸序列融合到掺入特异性结合赋予特异性的核酸上的核苷酸序列或化学或生物学元件的结构域的氨基酸来构建。在连接域和赋予特异性的核酸之间的物理相互作用可归因于,但不限于,归因于以下类型的相互作用的一种或多种的亲和力:配体-受体、配体-底物、氢键、范德华键、体内形成的共价键、离子键和疏水相互作用。非共价结合实例包括以下或以下的片段或部分或修饰的形式的一种或多种:结合对实例:生物素-亲和素;生物素-链霉亲和素;生物素-亲和素的修饰形式;蛋白-蛋白;核酸-蛋白;配体-受体;底物-配体;抗原-抗体;抗原-单链抗体;半抗原-抗体或-单链抗体;激素-激素结合蛋白;激动剂-受体;受体拮抗剂-受体;蛋白A-IgG;酶辅因子-酶;酶抑制剂-酶;单链DNA-VirE2;dsDNA-StickyC;RNA-Argonaute家族蛋白;dsRNA-核糖核酸酶III家族蛋白;核酸-病毒外壳蛋白和农杆菌VirD2或其部分-VirD2结合蛋白,由此赋予特异性的核酸和连接域的每一个都包括成对成员之一。在示例性实施方案中,连接域含有能够结合经由接头进而化学连接到赋予特异性的核酸的5’-末端或3’-末端的染料荧光素的单链抗体ScFV,因此使可编程复合物的蛋白部分和核酸部分能够缔合。在一些实施方案中,连接域源自秀丽隐杆线虫(C.Elegans)PUF5结合元件8个三螺旋重复,并且赋予特异性的核酸(SCNA)在其末端之一或足够接近其末端之一处含有如SEQ ID NO:1中列出的RNA序列(CUCUGUAUCUUGU)。在该实施方案中,直接使蛋白和SCNA在一起,而不需要对SCNA的化学修饰,允许其在体内生物合成为转录本,并因此使可编程复合物的蛋白部分和核酸部分的体内缔合成为可能。在一些示例性实施方案中,位于SCNA内的能够形成二级或三级结构(诸如发夹环)的RNA序列/分子,与蛋白部分的连接域相互作用,该蛋白部分的连接域为源自病毒TAT蛋白(诸如,HIV、BIV,等)的RNA-基序-结合连接域。在一些示例性实施方案中,来自噬菌体Phi21的20-mer盒B RNA发夹结构结合序列位于SCNA上并能够结合/附着其在蛋白部分上的对应连接域,该蛋白部分源自RNA结合蛋白(RBP)噬菌体Phi21N蛋白。在允许体内产生SCNA的另一个示例性实施方案中,连 接域源自结合农杆菌VirD2蛋白的蛋白,包括在细菌中发现的VirD2-结合蛋白包括VBP1、VBP2和VBP3以及设计为结合VirD2的人工单链抗体。在该实施方案中,从来自农杆菌中的T-DNA将SCNA制备为ssDNA,其中其在其5’-末端与共价缔合所需的VirD2的酪氨酸29共价结合,由此共价结合在体内发生。催化在细菌中发生且随后复合物通过细菌分泌系统从细菌输出进入真核细胞,包括全部或部分植物-、动物-和人-细胞、组织、愈伤组织和器官。在该实施方案中,连接域中的VirD2-结合域结合附着到SCNA的VirD2蛋白,从而使可编程复合物的蛋白部分和核酸部分缔合成为可能。在该实施方案中,可设计对在细菌中表达的VirD2的修饰,将减少DNA整合并可有益于避免非特异性DNA整合。靶生物体内形成的共价结合的实例分别包括,在SCNA的识别区域上和在连接域中的但不限于以下由破折号配对的结合对实例或其片段或部分或修饰的形式中的一个或多个:T-DNA的RB序列GTTTACCCGCCAATATATCCTGTCA(SEQ ID NO:2)-农杆菌VirD2;微小核糖核酸病毒RNA-VPg;DNA-拓扑异构酶;ssDNA上的PhiX174噬菌体起点序列-PhiX174噬菌体A蛋白或PhiX A*蛋白,等。在此类体内SCNA-连接域附着的一个示例性实施方案中,将在其5’-末端或靠近其5’-末端处含有RB序列的合成ssDNA寡核苷酸递送至其中其遇到蛋白部分的细胞中。蛋白含有能够裂解RB序列的VirD2的部分,并且随后结合含有在其5’端的序列TCA、适当的间隔区和靶-碱基-配对序列的寡核苷酸的剩余部分,因此在体内有效“编程”分子复合物。在一些实施方案中,连接域缺乏特定的靶核酸结合位点,即,它不能够特异性结合特定的靶序列。
根据一些实施方案,“细胞定位结构域”可任选地是蛋白部分的部分,细胞定位结构域可将蛋白部分或编程的蛋白部分或组装的复合物定位至活细胞中特定细胞或亚细胞定位。细胞定位结构域可通过将蛋白部分的氨基酸序列融合到掺入包括以下的结构域的氨基酸来构建:核定位信号(NLS);线粒体前导序列(MLS);叶绿体前导序列;和/或被设计以将蛋白运输或引导或定位至含有核酸的细胞器、细胞区室或细胞的任何细分部分的任何序列。在一些示例性实施方案中,生物体是真核生物,且细胞定位结构域包括允许蛋白进入细胞核和基因组DNA内的核定位结构域 (NLS)。所述NLS的序列可包括带正电荷序列的任何功能NLS,包括,例如,SV40NLS序列PKKKRKV(SEQ ID NO:3)。在另一个示例性实施方案中,该结构域包括使蛋白部分或编程的核蛋白进入细胞器的前导序列,使细胞器DNA通过复合物的期望的修饰成为可能。在另一个示例性实施方案中,源自酵母线粒体Cox4p的序列(MLSLRQSIRFFKPATRTLCSSRYLL(SEQ ID NO:4))或源自人苹果酸脱氢酶线粒体前导序列(MLS)的序列(MLSALARPASAALRRSFSTSAQNNAKVAVLGAS(SEQ ID NO:5))或源自拟南芥硫辛酸合酶的序列(NCBI Ref.Seq.ID:NP_179682.1,本文指定为SEQ ID NO:6:MHSRSALLYRFLRPASRCFSSSS)可被用于将复合物定位在线粒体基质中以修饰线粒体DNA。该应用的一个用途可包括治愈多种真核生物中母系遗传的线粒体DNA缺陷,诸如人中的慢性进行性眼外肌麻痹综合征。另一个实例是诱导缺陷,以在用于杂交植物产生的植物中引起雄性不育。在一个实施方案中,线粒体靶是ATP酶并重建矮牵牛中pcf基因座的功能。
根据另外的实施方案,任选的各种域间连接体或间隔区旨在允许复合物通过作为分子衔接子或铰链的期望的功能。许多此类连接体可被本领域技术人员所预见。连接体的选择可通过影响靶核酸到达功能域活性位点的范围而影响编程的分子复合物的特异性。在一个示例性实施方案中,连接域的C’和功能域的N’用跨越约15埃的氨基酸GGSGG(SEQ ID NO:7)可变地连接。在另一个实施方案中,使用了具有跨越约16埃的氨基酸NIHHVTWHMDFP(SEQ ID NO:8)的刚性α-螺旋接头。在另一个实施方案中,使用了具有跨越约16.88埃的氨基酸PNSLIVP(SEQ ID NO:9)的刚性螺旋接头。在另一个实施方案中,使用了具有跨越约15.55埃的氨基酸TGLDSP(SEQ ID NO:10)的无序卷曲接头。可将由限制性内切酶位点编码的另外的氨基酸加入域间连接体以便于交换蛋白模块(例如,编码BamHI/XhoI的GSLE(SEQ ID NO:11))。
根据一些实施方案,本文称为“赋予特异性的核酸”(SCNA)或“编程核酸”的分子复合物的核酸部分包括一个或多个部分(区域)和功能。 一个部分(区域)限定了待被作用的靶区域,并含有限定特异性的序列。SCNA中限定特异性的序列通过碱基配对限定了其对靶核酸的特异性。该配对可形成,例如,但不限于:完全或部分双螺旋、完全或部分三螺旋、D-环和支链的形式,并且可以是氢键或胡斯坦氢键或其组合的结果。在一些实施方案中,限定特异性的序列能够在接近靶位点或靶位点侧翼的区域处与靶核酸相互作用。在一些实施方案中,SCNA的限定特异性的序列不与靶位点结合/相互作用。在一些实施方案中,限定特异性的序列可包括任何数目的核苷酸。例如,限定特异性的序列的长度可以是约3-200个核苷酸。例如,限定特异性的序列的长度可以是约10-100个核苷酸。例如,限定特异性的序列的长度可以是约15-50个核苷酸。例如,限定特异性的序列的长度可以是超过约18个核苷酸。
根据一些实施方案,SCNA的第二部分是识别区域(部分),其是可特异性结合/附着/识别蛋白部分的连接域的区域。在一些实施方案中,该识别区域可以是和/或包括修饰或连接域识别序列(在本文中还称为SCNA核苷酸基序或SCNA连接域结合核苷酸序列)。识别区域可以是整合的部分或可被(例如,共价地)连接到限定特异性的序列,并且可包括能够将SCNA结合至蛋白部分的连接域的序列或修饰,如以上描述的。
在一些实施方案中,SCNA包括但不限于以下类型的分子:单链DNA、单链RNA、双链RNA、修饰的DNA、修饰的RNA、锁核酸(LNA)、肽核酸(PNA),和以上的任何组合。在一些实施方案中,SCNA可另外包括一个或多个修饰,该一个或多个修饰可提高其稳定性、提高其对靶的特异性、修饰其对核酸的亲和力和/或使其结合到复合物的连接域。可将修饰放置在其5’端、在其3’端上作为间隔区和/或放置在SCNA内。示例性修饰包括,但不限于,核苷酸、生物素、荧光素、胺-接头、寡肽、氨基烯丙基、染料分子、荧光团、地高辛、Acrydite、腺苷酸化物、叠氮化物、NHS-酯、胆固醇基-TEG、炔烃、可光裂解的生物素、硫醇、二硫醇、修饰的碱基、磷酸酯、2-氨基嘌呤、三聚体-20、2,6-二氨基嘌呤、5-溴脱氧尿苷、脱氧尿苷、反向dT、双脱氧核苷酸、5-甲基脱氧胞苷、脱氧肌苷、5-硝基吲哚、2-O-甲基RNA碱基、Iso-dC、Iso-dG、氟修饰的碱基和硫代磷酸酯键和农 杆菌VirD2蛋白和所述VirD2的部分和VirD2的修饰。
根据一些实施方案,SCNA还可包括可被用于优化使连接域和靶核酸在一起必需的分子间隔和自由度的任选的间隔区序列。在一些实施方案中,间隔区序列的长度可以是约0-100个核苷酸。例如,间隔区的长度可以是约0-6个核苷酸。
根据一些实施方案,可在体外和体内化学和/或生物制备SCNA,并且修饰可以是预先合成的或在合成后添加。在一些示例性实施方案中,化学制备SCNA,并且SCNA包括硫代磷酸酯修饰的ssDNA,其通过连接C6-荧光染料分子在其末端的一端处被修饰。因此(例如,通过粒子轰击、聚乙二醇转染、脂质体法、病毒颗粒法、碳化硅晶须(silicon-carbide whiskers)和/或电穿孔)将该SCNA递送至其中其遇到分子复合物的两个蛋白组分的细胞,所述分子复合物包括包含能够结合染料荧光素的单链抗体ScFV的连接域,因此编程分子复合物并递送/靶向复合物至其预期的靶核苷酸序列。根据一些实施方案,SCNA不与靶位点结合/相互作用。
现在参考图1A-B,图1A-B是显示根据一些实施方案的可编程分子复合物的元件/组件的示意图(不按比例)。图1A-B的示意图(不按比例)显示了作为单体的可编程蛋白部分的一个分子,和赋予特异性的核酸(SCNA)的两个分子。如图1A-B中显示的,蛋白部分是排列成几种结构域/功能域的多肽(氨基酸的链):连接域(LD)、功能域或效应器结构域(FD);任选的细胞定位结构域(CLD)和任选的域间连接体(IDC),每一个都根据其在分子复合物中的作用来定义。连接域的功能是结合SCNA。效应器结构域的功能是与靶核酸相互作用并在结构上修饰靶位点和/或修饰其功能和/或整个靶向核酸的功能。任选的细胞定位结构域的功能是将蛋白复合物定位至与靶核酸相同的细胞或亚细胞区室。任选的域间连接体的功能是允许用于复合物的正常功能的域之间的优化分子距离和自由度。SCNA包括核酸链或修饰的核酸链(梳状),并且包括优选在其末端的一端处(图1A中所示为黑色椭圆形)用于结合蛋白部分的修饰,或序列(称为SCNA核苷酸基序,或连结域结合核苷酸序列或连接域识别序列或片段,图1B中所示的箭头标记的梳状),其可结合蛋白部分上的连接域。在图 1A-B中呈现的非限制性实例中,SCNA的决定特异性的部分是单链的。在一些实施方案中,SCNA可形成双链区段/区域(通过自退火,诸如形成发夹环)。SCNA对预定的靶核酸序列的特异性通过延伸的碱基配对核酸或修饰的核酸段(stretch)(靶核酸碱基配对,梳状),还称为可变序列来实现,其可包括任何数目的核苷酸,诸如3-200个核苷酸以及其任何范围。例如,长度可以是10-100个核苷酸。例如,长度可以是至少18个核苷酸。任选的间隔区序列(间隔区序列,梳状),可存在用于优化使连接域和靶核酸在一起必需的分子距离和自由度。在一些实施方案中,间隔区序列的长度可以是约0-100个核苷酸。例如,间隔区的长度可以是约0-6个核苷酸。当结合至SCNA连接域和二聚化以及其随后共定位于靶核酸时发生的蛋白部分的功能域的作用或效应,被描绘为闪电状符号(“作用/效应”)。
现在参考图2A-B,图2A-B是显示根据一些实施方案的可编程分子复合物的组装的示意图。图2A-B的示意图(不按比例)展示了可编程分子复合物的组件组装在靶核酸上的模式。在图2A-B所示的实例中,两个蛋白单体结合两个不同的SCNA,各自在其可变序列区域具有不同的特异性决定簇。这些SCNA碱基与靶核酸上预先定义的同源序列(图中标记为“靶核酸”)配对并结合。该碱基配对可与靶核酸形成双-螺旋或三-螺旋,这取决于靶是双链的还是单链的(这些图中展示为dsDNA)。两个SCNA可以在优化的距离内根据需要结合相同链或相反链。SCNA可通过其末端上修饰(图2A)或通过SCNA核苷酸基序(图2B)结合蛋白连接域。当组装时,功能域促使其对靶核酸上的预定的靶位点(标记为“靶位点”)的作用。
现在参考图3,图3展示了根据一些实施方案被设计成裂解预先定义的核dsDNA靶序列的分子复合物的3D建模实例。编程的二聚化蛋白部分显示与其靶dsDNA(A,部分显示)缔合。蛋白部分的每个单体都包括源自FokI核酸酶亚基的功能域(B);源自SV40NLS的细胞定位结构域(C);源自抗荧光素单链可变区片段抗体的连接域(抗-FAM ScFV,D)和域间连接体(E)。每个连接域(D)都显示通过其修饰剂6-羧基荧光素分子(G)结合至赋予特异性的核酸SCNA ssDNA(F,部分显示),修饰剂共价结合 至每个SCNA的末端。靶dsDNA的预期的裂解位点(靶位点)(显示为螺旋骨架上的球形)标记有箭头300A-B。在此将每个SCNA描绘为形成占据dsDNA靶侧翼序列的大沟的部分三-螺旋。
现在参考图4A-B,图4A-B是根据一些实施方案的可编程分子复合物的组件组装在靶核酸上的示例性模式的示意图(不按比例)。如图4A-B中呈现的非限制性实例中显示的,蛋白部分的两个单体结合两个不同的SCNA(SCNA1、SCNA2),各自都在可变序列区域具有不同的特异性决定簇。如图中所示,两个SCNA位于单个核酸上,并与本文称为“SCNA连接体”的不与靶碱基配对的非确定的序列或长度的序列(a sequence of undetermined sequence or length)连接。SCNA连接体可包括任何长度(X(n))的任何核苷酸序列。在一些实施方案中,X(n)表示将两个赋予特异性的区域彼此连接的非确定长度的RNA核苷酸。在一些实施方案中,对于线性DNA,预期的最佳长度(n)是,例如,在约10-100个核苷酸之间。例如,长度为约35-73个核苷酸(nt)。例如,长度为超过约70个核苷酸。例如,长度短于约35个核苷酸。这些SCNA与靶核酸上预先定义的同源(对应)序列碱基配对并结合。该碱基配对可与靶核酸形成双-螺旋或三-螺旋,这取决于靶是双链的还是单链的(图4A-B示出的实施例中为dsDNA)。在一些实施方案中,两个SCNA可根据需要在优化以实现期望的结果的距离与靶核酸结合相同链或相反链,。在一些实施方案中,仅需要一个双重连接的含有SCNA的核酸以通过位于靶位点的两个末端的侧翼靶向靶位点。在一些实施方案中,SCNA可经由两个SCNA上的SCNA-核苷酸基序(连接域结合位点中标记为树状,图4A)或通过两个末端上的修饰(连接域结合位点中黑色椭圆形,图4B)结合蛋白部分的连接域的结合位点(连接域中的凹陷(indentation))。当组装时,功能域可促使其对靶核酸中的靶位点的作用。
根据一些实施方案,用于将SCNA递送进入生物体或细胞的方法包括本领域技术人员已知的多种方法,并且通常是用于在相关情形中使用的生物体或细胞类型是最佳的那些方法。这些可包括通过以下的生物方法递送核酸:使用自主复制载体的感染,转基因病毒感染或转导,包括使用解构 病毒(deconstructed virus)或部分病毒、接种、农杆菌T-DNA递送、培育(breeding)、杂交、移植、细胞器转移、染色体转移、细胞融合;以下的化学介导的摄取方法:使用转染剂、DEAE-葡聚糖、磷酸钙、人工脂质、树枝状大分子、聚合物(PEG等)、蛋白/肽、病毒样颗粒;以下的机械方法:轰击、注射/显微注射、压力、晶须;和电穿孔的电方法,以及改变细胞质膜,允许核酸主动或被动地进入细胞的任何方法。
根据一些实施方案,将编码蛋白模块的核酸递送进入生物体或细胞的方法包括本领域技术人员已知的多种方法,并且通常是用于在相关情形中使用的生物体或细胞类型是最佳的那些方法。这些可包括通过将生物体与携带基因的转基因生物体杂交或培育或通过以下的生物方法递送核酸:使用自主复制载体的感染,转基因病毒感染或转导,包括使用解构病毒或部分病毒、接种、农杆菌T-DNA递送、移植、细胞器转移、染色体转移、细胞融合;以下的化学介导的摄取方法:使用转染剂、DEAE-葡聚糖、磷酸钙、人工脂质、树枝状大分子、聚合物(PEG等)、蛋白/肽、病毒样颗粒;以下的机械方法:轰击、注射/显微注射、压力、晶须;和电穿孔的电方法,以及改变细胞质膜,允许核酸主动或被动地进入细胞的任何方法。
根据一些实施方案,在需要此类包括基因插入或基因置换的DNA的用途的亚组(subgroup)中,用于递送“供体DNA”的方法,包括与描述用于递送编码蛋白模块的核酸的那些方法类似的方法。该DNA可以是单链的、双链的或部分双链的、线性的或环状的。该DNA可在单个载体或数个载体上与编码分子复合物的蛋白组分的核酸以及与决定特异性的编程核酸同时地或单独地被提供。因此,核酸可通过选自上述适当的递送方法被递送至植物或植物的部分,被递送至植物组织或器官诸如胚、花粉、卵细胞、花药、柱头、整朵花、子叶、叶、根、茎、叶柄,被递送至分离的植物细胞诸如原生质体,或被递送至分化的或未分化的培养的植物组织、愈伤组织、或细胞。在一些实施方案中,核酸可被递送至真菌包括单细胞真菌和多细胞真菌,以及被递送至动物界成员包括无脊椎动物(诸如节肢动物和线虫)、脊椎动物(诸如鸟类、鱼类、哺乳动物、爬行动物、和两栖动物),以及被递送至这些生物体的部分包括器官、培养的器官、组织、 培养的组织、分离的细胞、细胞培养物、细胞系和干细胞诸如人胚胎干细胞或人造血干细胞。
现在参考图5,图5显示了根据一些实施方案的示意图,展示了使用体外制备的SCNA将可编程分子复合物递送至细胞的选项。显示了用于选择适当的递送方法的一般方案。编码蛋白部分的核酸分子选自左手栏,并使用选自邻近的两栏的适用方法被递送。合成的SCNA通过选自两个右手栏中显示的那些方法被提供。在靶细胞内,编码蛋白的核酸通过其在体内从模板RNA分子的翻译引起蛋白的表达。如果递送的核酸分子包括dsDNA,则其(通过指定的启动子)可首先转录为RNA。如果递送的核酸分子包括ssDNA,则其可首先被互补成dsDNA,且随后被转录。如果递送的核酸分子包括RNA,诸如编码病毒或另外自主复制载体的RNA,则其可在翻译之前通过经由负链的复制继续进行。然后,翻译的蛋白可根据其定位信号(如果存在的话)定位至期望的亚细胞区室。SCNA可通过相同的或不同的递送方法与编码蛋白部分的核酸分子伴随地或单独地被递送。当SCNA、蛋白部分和靶核酸共定位在细胞内之后,它们可组装以形成活性分子二聚复合物。如果需要,供体DNA也可单独地或同时地被递送。
现在参考图6,图6是展示根据一些实施方案使用体内产生的SCNA将可编程分子复合物递送至细胞的一般方案。编码蛋白部分的核酸分子选自左手栏,并使用选自邻近的三栏的适用方法被递送。体内产生的SCNA由为了该目的提供的核酸分子编码,并使用这些相同的方法被引入细胞。编码蛋白部分和/或SCNA的核酸分子可单独地或同时地被递送。在细胞中,编码SCNA的核酸通过转录或核酸裂解表达该SCNA。如果递送的核酸分子包括dsDNA,则其可首先通过指定的启动子转录成RNA。如果递送的核酸分子包括ssDNA,则其可首先被互补成dsDNA,且随后被转录。如果递送的核酸分子包括RNA,诸如编码病毒或另外自主复制载体的RNA,则其可通过经由负链的复制继续进行。在细胞内,编码蛋白的核酸通过其以类似于描述用于SCNA的方式在体内从产生的RNA分子的翻译来表达。然后,翻译的蛋白可根据其定位信号(如果存在的话)定位至期 望的亚细胞区室。编码蛋白部分的核酸分子和/或编码SCNA的核酸分子可以通过相同的或不同的递送方法伴随地(在同一时间)或单独地被递送。在SCNA、蛋白部分和靶核酸共定位在细胞内之后,它们可组装以形成活性分子二聚复合物。如果需要,供体DNA也可单独地或同时地被递送。
根据一些实施方案,SCNA的体内生物合成可通过诸如但不限于以下的几种途径进行:(a)使用农杆菌合成核酸和连接域结合部分二者,在该实施例中为VirD2,其还催化它们的共价连接。随后,农杆菌有利于将共价结合至VirD2的ssDNA转移至细胞,(b)使用农杆菌将T-DNA转移到细胞中,所述T-DNA包括在细胞中驱动具有RNA结构域的RNA SCNA合成的启动子,所述RNA结构域在与复合物的连接域会聚时结合复合物的连接域。因此,在靶细胞中表达的复合物,通过RNA-蛋白相互作用组装,(c)使用自主复制载体包括病毒和基于病毒的表达载体将复制子递送至细胞,所述复制子包括驱动具有RNA结构域的RNA SCNA合成的亚基因组启动子,所述RNA结构域在与复合物的连接域会聚时结合复合物的连接域。因此,在靶细胞中表达的复合物,通过RNA-蛋白相互作用组装。
现在参考图7A-B,图7A-B是显示使用农杆菌中产生的单链DNA将SCNA递送至细胞的非限制性实例的示意图(不按比例)。图7A中显示使用农杆菌制备与蛋白VirD2在其5’端体内结合的ssDNA SCNA的非限制性实例。如该实例中所示,将靶向可变SCNA序列插入到能够在农杆菌中复制的质粒中的多克隆位点(MCS)。然后,用该质粒转化农杆菌。裂解质粒上的Ti质粒右边界(RB)序列并且ssDNA被细菌中的VirD2结合。裂解后在序列的5’处留下RB序列的3个核苷酸,并且裂解后在序列的3’处留下Ti质粒左边界(LB)序列的21个核苷酸。LB序列还可辅助SCNA稳定和筛选不想要的整合事件。农杆菌的突变形式(例如,缺失VirE1或virE2或具有部分VirD2功能的那些农杆菌)有助于抑制不想要的整合事件。然后,农杆菌将包含结合到VirD2的SCNA的T-DNA输出进入细胞。图7B中显示使用细菌分泌系统将SCNA递送至宿主细胞的非限制性实例。使用一个或多个转化有编码不同SCNA序列的不同T-DNA的农杆菌感染一个细胞。因此在细菌中创建并输出至宿主细胞的结合了VirD2的ssDNA  SCNA然后可在宿主细胞中相遇并通过VirD2蛋白和连接域中的VirD2结合域之间的相互作用结合蛋白部分的连接域。关于此VirD2-结合连接域的实例包括针对VirD2产生的抗体的人工单链可变区片段(scFv)。因此,SCNA可引起分子复合物组装到靶核酸上。
现在参考图8A-B,图8A-B是展示使用在宿主细胞内由农杆菌递送的T-DNA(图8A)或由通过自主复制载体诸如病毒递送的核酸(图8B)产生的RNA SCNA将SCNA递送至细胞的示意图。这些图中呈现的RNA SCNA包括可结合蛋白部分的连接域的相应的RNA结合基序的SCNA-RNA基序(标记的梳状)。如图8A中所示,将SCNA序列插入到能够在农杆菌中复制并含有用于在感染的细胞中转录一个或多个RNA SCNA的适当真核启动子的质粒中的多克隆位点(MCS)。图8B:将一个或多个SCNA序列插入到病毒的基因组中或源自病毒的自主复制载体中,各自都在亚基因组(sg)启动子的控制下用于在感染的细胞中转录一个或多个RNA SCNA。在图8A-B中所示的非限制性实例中,预先、与编码核酸分子的SCNA递送一起(伴随地)或在编码核酸分子的SCNA递送之后,可将编码蛋白-部分编码的核酸分子递送至靶细胞。当蛋白部分和SCNA在细胞中表达时,发生分子复合物在靶核酸上的组装。
现在参考图9,图9显示根据一些实施方案在单次递送事件中用于伴随递送包含用于组装可编程分子复合物必需的组分的组合物至易感的靶真核细胞的递送媒介物或载体的非限制性实例的示意图(不按比例)。对于图9中所示的非限制性实例,期望的作用是用预定的序列“供体盒(Donor cassette)”置换基因组DNA段(靶核酸)。因此,蛋白部分的结构域包括:源自核酸酶并具有核酸裂解活性的功能域;作为核定位信号(NLS)的细胞定位结构域;和能够识别并结合SCNA上的RNA基序的连接域。在图9中显示的实例中,使用生物递送系统。农杆菌转化有质粒载体,诸如质粒(800),其含有多种功能/结构序列,诸如,细菌可选择标志物、多个复制起点位点(E.Coli-ori、pSa Ori)、LB序列、启动子区域(指定为(P))、表达蛋白部分的序列(包括ATG起始密码子和符合读框的终止密码子)、终止子位点(T)、多个SCNA转录盒(显示为四个SCNA转录盒,各自包 含启动子和终止子序列)、供体盒和RB位点。然后,使质粒载体(转染的农杆菌)与靶生物体细胞接触。然后,农杆菌从右边界(RB)和左边界(LB)序列之间的区域形成T-DNA,并将其分泌进入真核细胞。将T-DNA的ssDNA递送至细胞核中,体内互补成为dsDNA,并从质粒上相容的启动子(P)转录成RNA。因此形成的蛋白部分的转录本翻译以形成指定的蛋白。来自SCNA盒的包含RNA基序序列的转录本被蛋白部分中的特定RNA序列结合域结合。供体盒含有足够长的序列,该序列可在与重组位点相邻的形成的双链断裂(DSB)的存在下与靶核酸重组。将SCNA设计为靶向并与待被置换的序列的侧翼序列杂交。在一些实施方案中,缺乏边界序列的类似质粒,或类似结构的线性DNA,也可被用于在非生物学递送系统中以同样的效果转染细胞。
根据一些实施方案,并如以上详述的,靶向的序列中的改变/修饰包括,例如,但不限于:核酸的永久缺失、突变、插入,以及将靶向的序列置换为另一个核酸序列,事件的调节链中的基因、其调节序列、调节感兴趣的基因或其调节序列的基因的转录或翻译的任何方式中的敲除、移码或任何变化。
现在参考图10,图10是展示根据一些实施方案使用编程的分子复合物以在靶核酸中创建突变的示意图(不按比例)。如图10中呈现的非限制性实例中显示的,蛋白部分的功能域源自核酸酶,并且靶核酸上靶位点的突变通过在靶核酸中预先定义的位置中创建dsDNA断裂(DSB)来实现。SCNA编程的分子复合物通过SCNA与靶核酸上相应的靶序列碱基配对而自组装。当复合物的组件组装时,功能域二聚化并且核酸酶被激活,裂解在该实例中位于两个SCNA分子之间的中点处或附近的靶位点,从而创建DSB(例如,DSB可具有4个核苷酸的5’-突出端,诸如由限制性内切酶FokI创建的那些突出端)。细胞非同源末端连接(NHEJ)修复机制试图修复DSB并且当这样做时可:1)进行完全的连接-同时复合物可继续再裂解相同序列以重复尝试突变,直到耗尽复合物组分,2)添加一个或多个核苷酸,因此加宽SCNA之间的距离并废除功能域二聚化,从而终止复合物的作用,或3)去除一个或多个核苷酸(“pacman”图),因此缩小SCNA 之间的距离,并废除了功能域二聚化,从而终止了复合物的作用。当选项2或3的任一种在细胞内发生时,实现基因突变。
现在参考图11,图11是展示根据一些实施方案使用编程的分子复合物以使用提供的供体核酸将一个或多个核苷酸插入靶核酸的示意图(不按比例)。如图11中呈现的非限制性实例中显示的,蛋白部分的功能域源自核酸酶,并且靶核酸中预先定义的位置处(靶位点)的dsDNA断裂(DSB)促进同源重组(HR)的过程。SCNA编程的分子复合物通过SCNA与相应的靶序列碱基配对而自组装。当复合物的组件组装时,功能域二聚化并且核酸酶被激活,从而裂解可位于例如两个SCNA分子之间的中点处或附近的靶位的靶核酸,从而创建DSB。供体DNA含有待被插入的序列和该序列侧翼的核苷酸的足够长的段,其本质上与预期的DSB点侧翼的靶序列相同。然后,这些侧翼序列可通过细胞的HR过程与靶核酸重组(X),因此置换靶核酸中预定的核苷酸段,并且有效实现了期望的序列的插入。当预定的供体序列的重组和插入时,SCNA之间的距离变宽,因此干扰功能域的二聚化,从而终止复合物的作用。在有些情况下,当发生通过NHEJ的完全再连接时,激活的编程的复合物可继续再裂解相同序列用于重复的尝试插入。
现在参考图12,图12是展示根据一些实施方案在使用提供的供体核酸置换、插入和/或缺失靶核酸中的一个或多个核苷酸中使用编程的分子复合物的示意图(不按比例)。如图12中呈现的非限制性实例中显示的,蛋白部分的功能域源自核酸酶,并且靶核酸中的预先定义的位置处(靶位点)的dsDNA断裂(DSB)促进同源重组(HR)的过程。SCNA编程的分子复合物通过SCNA与预定的靶序列碱基配对而自组装。当复合物的组件组装时,功能域二聚化并且核酸酶被激活,裂解可位于例如两个SCNA分子之间的中点处或附近的靶位处的靶核酸,从而创建DSB。供体DNA含有待被插入的代替待被去除的内源靶序列的外源序列,以及该外源序列侧翼的核苷酸的足够长的段,其本质上与待被去除的预期的序列的侧翼靶序列相同。然后,这些侧翼序列可通过细胞的HR过程与靶DNA重组(X),因此置换靶DNA中的DNA段,并且有效实现通过期望的外源序列置换不 期望的内源序列。当期望的外源序列成功重组并置换时,靶核酸上的SCNA结合位点可被设计为被废除,因此终止复合物的作用。在有些情况下,当发生通过NHEJ的完全再连接时,复合物可继续再裂解相同序列用于重复尝试重组。
现在参考图13,图13是显示根据一些实施方案使用编程的分子复合物以创建一个或连续多个核苷酸从靶核酸缺失的示意图(不按比例)。如图13中呈现的非限制性实例中显示的,蛋白部分的功能域源自核酸酶,并且缺失通过在靶核酸中的两个预先定义的位置处创建两个dsDNA断裂(DSB)来实现。SCNA编程的分子复合物通过SCNA与相应的靶序列碱基配对而自组装。当复合物的组件组装时,功能域二聚化并且核酸酶被激活,裂解可位于SCNA分子的每一对之间的中点处或附近的靶位处的靶核酸,创建DSB。两个位点的伴随或连续裂解基本上消除或缺失其间的序列。细胞非同源末端连接(NHEJ)修复机制试图修复DSB且同时这样做可:1)进行缺失的序列侧翼的靶DNA的完全连接,同时激活的复合物可继续再裂解相同序列直到耗尽复合物组分(左侧图),2)进行每个单独的DSB的完全再连接,同时复合物可继续再裂解相同序列用于重复尝试缺失,直到耗尽复合物组分;3)去除DSB缺口中的一个或多个核苷酸(“pacman”图,右侧图),因此缩小SCNA之间的距离,并废除功能域二聚化,从而终止复合物的作用;或4)在DSB缺口中添加一个或多个核苷酸,因此加宽SCNA之间的距离并废除功能域二聚化,从而终止复合物的作用。
现在参考图14,图14是展示根据一些实施方案使用编程的分子复合物以使用提供的供体核酸置换靶核酸中的一个或多个核苷酸的示意图。如图14中呈现的非限制性实例中显示的,蛋白部分的功能域源自核酸酶,并且置换通过在靶核酸中两个预先定义的位置处创建两个dsDNA断裂(DSB)、创建缺失、并提供线性或线性化的DNA供体以填补缺口来实现。SCNA编程的分子复合物通过SCNA与相应的靶序列碱基配对而自组装。当复合物的组件组装时,功能域二聚化并且核酸酶被激活,裂解SCNA分子的每一对之间的中点处或附近的靶,从而创建DSB。两个位点的伴随或连续裂解基本上消除或缺失了其间的序列区域。细胞非同源末端连接 (NHEJ)修复机制试图修复DSB并且同时这样做可:1)进行供体进入靶的连接的完全对(perfect pair),废除功能域二聚化,从而终止复合物的作用;2)进行缺失的序列侧翼的靶核酸序列的完全连接-而复合物可继续再裂解相同序列用于重复尝试置换,直到耗尽复合物组分;3)进行每一个单独的DSB的完全再连接,而复合物可继续再裂解相同序列用于重复尝试置换,直到耗尽复合物组分;4)去除DSB缺口中的一个或多个核苷酸,因此缩小SCNA之间的距离,并废除功能域二聚化,从而终止复合物的作用;或5)在DSB缺口中添加一个或多个核苷酸,因此加宽SCNA之间的距离并废除功能域二聚化,从而终止复合物的作用。
遗传性疾病
根据一些实施方案,本发明的组合物和方法可被用于用同源的、非相同序列置换任何基因组序列。例如,突变的基因组序列可被其野生型对应物(counterpart)置换,从而提供了用于治疗,例如,遗传性疾病、遗传性病患、癌症和自身免疫性疾病的方法。以类似的方式,基因的一个等位基因可使用本文公开的方法被不同的等位基因置换。示例性的遗传性疾病包括,但不限于,软骨发育不全症、全色盲、酸性麦芽糖酶缺乏症、获得性免疫缺陷、腺苷脱氨酶缺乏症(OMIM号102700)、肾上腺脑白质营养不良、艾卡迪综合征(aicardi syndrome)、α-I抗胰蛋白酶缺乏症、α-地中海贫血、雄激素不敏感综合征、阿佩尔综合征、致心律失常性右心室发育不良、共济失调毛细管扩张、巴氏综合征、β-地中海贫血、蓝色橡皮泡痣综合征、卡纳万病、慢性肉芽肿病(CGD)、累若纳氏综合征、囊性纤维化、德尔肯氏病、外胚层发育不良、范可尼贫血、进行性骨化性纤维发育不良(fibrodysplasia ossificans progressive)、脆性X综合征、半乳糖血症、高歇氏病、全身性神经节苷脂沉积病(例如,GM1)、血色病、血红蛋白病(例如,镰状细胞性贫血、β-珠蛋白的第6个密码子中的血红蛋白C突变、α-地中海贫血、β-地中海贫血)、血友病、亨延顿氏病、赫尔利综合征、低磷酸酯酶症、Klinefleter综合征、克拉伯病、兰格吉恩综合征、白细胞粘附缺陷病(LAD、OMIM号116920)、脑白质营养不良、长QT综合征、溶酶体贮积病(例如,高歇氏病、GM1、法布里病和泰-萨克斯病)、马凡氏 综合征、Mobius综合征、粘多糖病(mucopolysaccahidosis)(例如亨特氏病、胡尔勒氏病)、指甲髌骨综合征、肾性尿崩症(nephrogenic diabetes insipdius)、神经纤维瘤病、尼曼-皮克病(Neimann-Pick disease)、成骨不全症、卟啉症、普拉德-威利综合征、早衰症、普罗特斯综合征、视网膜母细胞瘤、Rett综合征、鲁宾斯坦-泰比综合征、Sanfilippo综合征、严重联合免疫缺陷(SCID)、Shwachman综合征、镰状细胞病(镰状细胞性贫血)、史密斯-马盖尼斯综合征、斯蒂克勒综合征、泰-萨克斯病、血小板减少症缺席半径(TAR)综合征、特雷彻柯林斯综合征、三体性、结节性硬化症、特纳氏综合征、尿素循环障碍、希普尔病(von Hippel-Landau disease)、Waardenburg综合征、威廉姆斯综合征、威尔森氏症、威斯科特-奥尔德里奇综合征、X连锁淋巴组织增生综合征(XLP、OMIM号308240)。
展示以下实施例以更充分地阐述本发明的一些实施方案。然而,它们不应以任何方式理解为限制本发明的宽广范围。
实施例
实施例1-作为用于调整分子复合物的组分的生物测定的体内系统:
本实施例描述了适于测试和优化可编程分子复合物的设计和使用中的排列(permutation)的生物测定,诸如,用于测试其在不同生物体或细胞中的活性、用于测试不同的递送方法、以及用于测试突变、置换、缺失和插入的编辑功能。
以下实施例中所示的实验是用于检测通过可编程分子复合物的组合物的基因靶向和特异性裂解,该可编程分子复合物包括修饰的核酸酶作为蛋白部分的效应器结构域。
使用了基于放置在报告物编码序列内的终止密码子(STOP codon)的修复的视觉报告物(reporter)系统。这些实施例中的报告物是绿色荧光蛋白(GFP)。当被靶向时,由激活的复合物形成的双链断裂(DSB)被修复,(假定通过如图10中示例性示出的NHEJ途径),废除了终止密码子并恢复GFP活性。因此,该测定可给出基因靶向效力的良好指示。该测定还被 称为“STOP GFP”测定。将该视觉测定设计为靶向质粒或体内基因组DNA。在以下实施例中,使用基于拟南芥原生质体的生物测定。在描述的生物测定中,上述提及的报告物系统在质粒上被递送进入原生质体中,与体内表达分子复合物的蛋白部分的质粒一起被共递送,并与修饰的赋予特异性的核酸(SCNA)ssDNA对,在本实施例中为用末端(NHS-酯-)-地高辛(DIG)修饰的赋予特异性的核酸(SCNA)ssDNA对一起被共递送。将用于核酸外切酶保护的第二修饰,(硫代磷酸酯),添加在相对的末端处(在此用星号标记)。本文中使用的质粒载体包括植物启动子。
蛋白序列和属性
设计用于本申请的分子复合物包括两条用于决定特异性的同源核酸序列(SCNA)和含有体内结合SCNA的核酸酶的嵌合蛋白组分。产生的靶核酸(GFP编码序列)的预定的靶位点(终止密码子)的裂解通过内源过程导致其期望的突变。本实施例中的可编程分子复合物由2个相同的蛋白部分单体和两种不同SCNA分子组成(如图1A和2A中示意性示出的)。在本实施例中,蛋白部分包含由FokI核酸酶结构域修饰而成的氨基酸序列作为功能域;根据与(Huston等人,1988)中描述的类似的抗-DIG(地高辛)单链可变区片段(scFv)免疫球蛋白(DIG-ScFv)改造而成的氨基酸序列作为连接域;SV40NLS(SEQ ID NO:3,PKKKRKV)作为核定位结构域和域间连接体(SEQ ID NO:7,GGSGG)。将编码蛋白部分的核酸序列插入包括NOS或35S启动子的适合表达载体(基于pUC的载体(pSAT))。
在本实施例中,赋予特异性的核酸和蛋白部分的连接域之间的体内结合是可被描述为抗体-抗原相互作用、单链抗体-抗原、抗体或单链抗体-半抗原相互作用的非共价相互作用的结果。
在本实施例中,SCNA的核酸末端修饰是NHS-酯连接的地高辛(DIG),其附着至SCNA寡核苷酸的5’或3’位置。
分子复合物的蛋白部分的氨基酸序列(单字母代码)(具有地高辛ScFv的NLS-FokI-核酸酶序列)是如SEQ ID NO:12中指定的,并且由如SEQ ID NO:13中列出的序列编码。
SCNA属性和序列
互补的靶碱基配对的寡核苷酸的SCNA的长度优选是至少18个碱基。SCNA还可包含作为DIG-NHS末端修饰物和靶互补核苷酸之间的间隔区的任何序列组成的少数(例如1-6个,在一个实施例中为6个,在另一个实施例中,为2个)非靶碱基配对的核苷酸(N)。如以上详述的,由于组蛋白占据染色体DNA中的DNA小沟,可存在SCNA间隔上的一些限制(constraint)。因此,SCNA优选地被设计为通过调节SCNA之间的距离适合于靶DNA大沟,以使允许二聚化的可编程分子复合物的连接域结合的靶螺旋的方向成为可能。球状功能域和连接域之间的域间连接体的选择(此处显示的实施例中为GSLEGGSGG(SEQ ID NO:14))还影响最佳SCNA距离,因为其限制或允许在这两个域之间的“铰链”中的运动。非靶碱基配对的核苷酸(“N”)的添加改变了SCNA之间的距离和靶螺旋的旋转方向两者,因为其改变了SCNA相对于蛋白和螺旋的灵活性。这些未配对的核苷酸不受限于靶DNA大沟。
从用于如本实施例中显示的具有GSLEGGSGG(SEQ ID NO:14)域间接头的抗-DIG-ScFv-NHS-酯-DIG系统的计算机化的3D模型采集的空间测量的结果产生了,在SCNA中存在2个N时SCNA之间的期望的最佳距离为约23-26个核苷酸。从与任一侧的SCNA杂交的最后的核苷酸之后计数,考虑由通过二聚化的构建体的dsDNA裂解创建的4个碱基的5’突出端,预测裂解发生在第11个、第12个或第13个核苷酸的左侧和右侧约±2个核苷酸处。该标准表明,如果靶向的序列是,以24个核苷酸为例:AAAAAAAAAAYYYYYYYYYXXXXXXYYYYYYYYYCCCCCCCCCC,其中Y+X表示SCNA碱基配对位点之间的核苷酸的数目,则设计的SCNA与区域A和C碱基配对且在DSB中产生的裂解在X区域内或与之相邻。SCNA可与有义链或反义链互补,但优选地被选择与有义(非转录的)序列碱基配对。当蛋白部分的位置位于SCNA的“近端”时,如由在“近端”处的引物的5’或3’修饰限定的,两个SCNA可与相同链碱基配对(如图2A中示出的)。SCNA之间的距离优化、以及优选的链,是该生物测定中测试的几种标准之一。
含有靶位点(终止密码子,(TAG))的靶核酸(GFP编码序列)包括在SEQ ID NO:15中列出的核苷酸序列:(“STOP-GFP”),其中TAG终止密码子位于核苷酸878处:
用于实施例1B和1C的mCherry供体包括在SEQ ID NO:16中列出的缺少启动子(promoter-less)和缺少终止子(terminator-less)的编码序列:
以下靶位点序列在实施例1A至1C中被靶向:
实施例1A-C“第一靶”序列:
GTCGACAACTAGTCCAGATCT(SEQ ID NO:17)
SCNA序列
修饰符号为:硫代磷酸酯键=*;5’DIG=/5DigN/;3’DIG=/3DigN/)。
用于1A-1C“第一靶”的测试的成对的SCNA组合
有义SCNA:
GFP_918_SR1:/5DigN/NNNNNNGTGTCCAAGGGCGAGGAGCTG*T;(只有核酸在本文被指定为SEQ ID NO:18)
CFP_896_SL1:T*TTACGAACGATAGCCATGGCCNNNNNN/3DigN/(只有核酸在本文被指定为SEQ ID NO:19)
根据预测结果,采用24bp靶缺口和较短SCNA接头的第二个有义配对的组合:
GFP_920_SR1:/5DigN/NNGTCCAAGGGCGAGGAGCTGTT*C(只有核酸在本文被指定为SEQ ID NO:20)
GFP_895_SL1:A*TTTACGAACGATAGCCATGGCNN/3DigN/(只有核酸在本文被指定为SEQ ID NO:21)
反义SCNA:
GFP_918_ASR1:C*AGCTCCTCCCCCTTGGAGACNNNNNN/3DIGN/(只有核酸在本文被指定为SEQ ID NO:22)
GTP_896_ASL1:/5DICN/NNNNNNGGCCATGGCTATCGTTCCTA*A(只有核酸 在本文被指定为SEQ ID NO:23)
根据预测结果,采用24bp靶缺口和较短SCNA接头的第二个反义配对的组合:
GFP_920_ASR1:G*AACAGCTCCTCGCCCTTGGACNN/3DIGN/(只有核酸在本丈被指定为SEQ ID NO:24)
GFP_895_ASL1:/5DIGN/NNGCCATGGCTATCGTTCGTAAA*T(只有核酸在本文被指定为SEQ ID NO:25)
有义和反义对的组合:
GFP_918_SR1:/5DigN/NNNNNNGTGTCCAAGGGCGAGGAGCTG*T(只有核酸在本文被指定为SEQ ID NO:18)
GFP_896_ASL1:/5DIGN/NNNNNNGGCCATGGCTATCGTTCGTA*A(只有核酸在本文被指定为SEQ ID NO:23)
根据预测结果,采用24bp靶缺口和较短SCNA接头的第二个反义配对的组合:
GFP_920_SR1:/5DigN/NNGTCCAAGGGCGAGGAGCTGTT*C(只有核酸在本文被指定为SEQ ID NO:20)
GFP_895_ASL1:/5D1GN/NNGCCATGGCTATCGTTCGTAAA*T(只有核酸在本文被指定为SEQ ID NO:25)
GFP_918_ASR1:C*AGCTCCTCGCCCTTGGAGACNNNNNN/3DIGN/(只有核酸在本文被指定为SEQ ID NO:22)
GFP_896_SL1:T*TTACGAACGATAGCCATGGCCNNNNNN/3DigN/(只有核酸在本文被指定为SEQ ID NO:19)
根据预测结果,采用24bp靶缺口和较短SCNA接头的第二个反义配对的组合:
GFP_920_SL1:A*TTTACGAACGATAGCCATGGCNN/3DigN/(只有核酸在本文被指定为SEQ ID NO:21)
GFP_895ASK1:G*AACAGCTCCTCGCCCTTGGACNN/3DIGN/(只有核酸在本文被指定为SEQ ID NO:24)
用于实施例1C的“第一靶”与1A和1B靶相同。
用于实施例1C的“第二靶”:GACTCTAAGCTTGGGTCTAGA(SEQ ID NO:26)
用于实施例1C的SCNA:
使用24bp靶缺口和短SCNA接头的组合:
有义:
GFP_1648_SR:/5DIGN/NNTCCGCAAAAATCACCAGTCTC*T(只有核酸在本文被指定为SEQ ID NO:27)
GFP1633SL:G*CATGGACGAGCTGTACAACTCNN/3DIGN/(只有核酸在本文被指定为SEQ ID NO:28)
反义:
GFP_1658_ASR:A*GAGACTGGTGATTTTTGCGGANN/3DIGN/(只有核酸在本文被指定为SEQ ID NO:29)
GFP1633ASL:/5DIGNiNNCACTTGTACAGCTCCTCCATC*C(只有核酸在本文被指定为SEQ ID NO:30)
如实施例1A-C中“第一靶”SCNA,这四个实施例1C“第二靶”SCNA可使用来自以上列表的一个“左”(L)SCNA和一个“右”(R)SCNA来配对。
递送
生物测定设置:拟南芥原生质体的制备基于Wu等人(Wu等人,2009):
植物材料:拟南芥于22摄氏度生长在16小时日最佳光照下(150microEinstein·m-2·s-1)。
叶:3-5周龄的植株(W~2cm L~5cm)。
工作溶液:
酶溶液:1%纤维素酶、0.25%离析酶、0.4M甘露醇、10mM CaCl2、 20mM KCl、0.1%BSA、20mM MES pH5.7。50-55摄氏度加热10分钟灭活蛋白酶,并且然后过滤。使用新鲜制备的。10ml/7-10片去皮的叶(1-5gr)/皿。
修改的W5溶液:154mM NaCl、125mM CaCl2、5mM KCl、5mM葡萄糖、2mM MES pH5.7。用25ml/板洗涤两次,+两次3ml用于转染洗涤+1ml重悬。
修改的MMg溶液:(重悬溶液)0.4M甘露醇、15mM MgCl2、4mM MES pH5.7。
修改的TEAMP转染缓冲液(PEG溶液):40%PEG MW4000、0.1M CaCl2、0.2M甘露醇体积=1:1的MMg中200微升原生质体+DNA的体积
BSA:1%BSA
工作方案
1.将水浴预热到50-55摄氏度,使水平(swing-out)离心机冷却,冷却W5和MMg,并切割吸头。
2.制备新鲜BSA涂覆的板(在水中1.25ml1%BSA/孔,在工作台上温育直到准备完毕)
3.制备新鲜酶溶液10ml/处理。
4.挑选7-10片叶片,不得受潮。10片叶片应产生~4-5次转化。
5.将上表皮贴上时间带(Time-tape),下表皮贴上魔术带(Magic tape)。不带手套较容易。如果仅叶柄卡在时间带,则较容易剥离。
6.用0.22μm过滤器过滤10ml新鲜酶溶液进入每个培养皿
7.剥离并丢弃魔术带。将时间带侧转移至培养皿
8.于光下在台式振荡器上40rpm温和振荡20-60min,直到原生质体释放(根据经验查验)
9.在50ml管中以水平转子100xg离心3min
10.用25ml冷的W5溶液洗涤两次。
11.冰上30min,在此期间,使用光学显微镜在血细胞计数器中计数
12.离心,并重悬在MMg溶液中至2-5×10^5个细胞/ml(约1ml)。
转染
1.制备新鲜PEG溶液用于在2ml管中转染
2.从6-孔板中倒掉BSA,并干燥
3.于RT在15ml圆底(扣盖)管中将0.2ml MMg溶液中的~5x10^4个原生质体(2x10^4-1x10^5)与总计30-40微克的靶质粒DNA、表达蛋白部分的质粒DNA和SCNA ssDNA的混合物混合。
4.加入等体积(0.2ml原生质体+中量质粒提取体积(midiprep vol.))的新鲜PEG溶液
5.RT温育5min
6.通过缓慢加入3ml W5溶液,每次1ml,并搅拌洗涤
7.以100xg水平离心1min
8.重复洗涤并沉淀
9.重悬于1ml W5溶液
10.倒入BSA涂覆的板
11.于22摄氏度在16小时日最佳光照(150microEinstein·m^-2·s^-1)下培养原生质体,根据需要更换培养基。
转染后3天使用自动流式细胞仪(FACS)筛选W5溶液中悬浮的原生质体的GFP/mCherry活性。GFP通过在488nm处被激发并通过用530/30滤波器检测发射来检测。mCherry的激发和发射为561nm和610/20滤波器。设置阈值和补偿因素以排除任何假阳性。
实施例1A:通过诱导的DSB的点突变。
在本实施例中,靶的裂解导致质粒DNA靶中的双链断裂(DSB)。将该DSB设计为在终止密码子位点中被创建,该DSB被消化,并通过NHEJ 修复机制被修复,如图10的示例性说明中列出的(突变)。NHEJ容易突变,并且这些突变中的一些可废除终止密码子并恢复开放阅读框,产生活性GFP开放阅读框(ORF)。然后,GFP通过显微镜或流式细胞仪(FACS)来检测,使测量系统效率和在变量之间进行比较以确认其改善成为可能。
当靶向先前稳定引入拟南芥基因组的STOP-GFP转基因(而不是质粒)时,可从表达GFP的原生质体再生基因组修饰的植株。
实施例1B:特定整合入诱导的基因组DSB。
与实施例1A类似,用编程的分子复合物靶向符合读框的GFP终止密码子。在这一应用中,加入线性dsDNA供体,其包括仅含有CDS的缺少启动子、缺少终止子的mCherry报告物基因。在如描述的转染之后,表达mCherry的原生质体通过显微镜或流式细胞仪(FACS)由红色荧光来检测,使测量系统效率和在变量之间进行比较以确认其改善成为可能。mCherry激发和发射为561nm和610/20滤波器。由于供体DNA含有缺少启动子的mCherry,其活性可通过启动子捕获来实现。因此,裂解靶向的GFP盒以形成DSB,其中可连接入任何线性DNA。因为提供了过量的mCherry CDS线性dsDNA,其被捕获在DSB中,在某些情况下导致,mCherry蛋白的符合读框的翻译。具有mCherry至GFP靶向的序列的此特定插入的靶向的质粒用以下引物通过PCR进一步分析:一个结合靶质粒的DNA序列,且一个结合插入的DNA:
35SF:CTATCCTTCGCAAGACCCTTCC(SEQ ID NO:31)
mCherryR:TTATCTTGTACAGCTCGTCCAT(SEQ ID NO:32)
类似地,将细菌抗生素抗性(NPT-II编码盒,没有复制起点)作为线性dsDNA提供至原生质体中。该DNA被插入代替实施例1B和1C的mCherry CDS,并通过从原生质体提取总DNA、转化包含DNA的具有或没有插入的质粒进入大肠杆菌并使这些大肠杆菌生长在含有卡那霉素的培养基上来筛选。抗性细菌具有捕获NPT-II盒的质粒。为了评价插入预定的GFP靶位点的特异性,GFP-靶位点用跨越预期的插入位点的引物进行PCR扩增。特异性插入导致在琼脂糖凝胶中PCR产物大小的显著移位。插入的效率通过在重复铺板实验中将卡那霉素抗性菌落的数目除以氨苄 青霉素抗性菌落(氨苄青霉素抗性在靶质粒上编码)的数目来计算。特异性通过重复省略或置换可编程分子复合物的组分(例如,GFP-靶向SCNA)的实验,并与未修饰的实验比较来计算。
实施例1C:通过NHEJ修复机制的基因置换。
在本实施例中,编码GFP的序列通过内源性NHEJ被置换为mCherry CDS。为了通过NHEJ策略缺失靶DNA的外延部分,创建了两个DSB。为了靶向GFP CDS的起点和终点,将两组SCNA与mCherry线性dsDNA供体联合使用。由于供体DNA含有缺少启动子的mCherry,其活性可通过启动子捕获来实现。因此,靶向的GFP盒可捕获mCherry CDS。mCherry分别通过FACS或通过显微镜在561nm处和610/20滤波器检测激发和发射来分析。
mCherry阳性原生质体通过FACS分选并随后经受DNA提取、将包含质粒的总DNA直接转化进入大肠杆菌、在含有抗生素的培养基上生长、并用两个引物组针对每个菌落进行两个菌落PCR反应:
3SSF:CTATCCTTCGCAAGACCCTTCC(SEQ ID NO:31)
mChcrryR:TTATCTTGTACAGCTCGTCCAT(SEQ ID NO:32)

35s-T-R-sEQ:CCCTATAAGAACCCTAATTCCC(SEQ ID NO:33)
mCherryF:ATGGTGAGCAAGGGCGAGGA(SEQ ID NO:34)
在两个PCR反应中产生扩增产物的菌落含有在拟南芥原生质体中已被靶向以通过NHEJ修复通路产生正确定向的置换事件的质粒,并进一步测序验证。
当靶向先前稳定地引入拟南芥基因组的GFP转基因(而不是质粒)时,不进行此类大肠杆菌的直接转化。相反,基因组DNA使用所述引物通过PCR从单个原生质体直接被扩增。可选地,基因组修饰的植物可从不表达GFP、表达mCherry的原生质体再生,其部分可被类似地分析。
实施例2.单子叶植物谷类植物基因组中的DNA双链断裂诱导、突变和插入
靶向玉米中的IPK1以敲除。
IPK1基因,编码肌醇-1,3,4,5,6-戊基磷酸2-激酶,其参与玉米种子中肌醇六磷酸盐(phytate)生物合成。当向非反刍家畜喂食时,肌醇六磷酸盐是促成环境磷污染的抗营养组分。靶向IPK1可将种子磷减少75%。共享98%序列同一性的两个旁系同源玉米IPK基因存在于玉米基因组中。在本实施例中,基于Genbank登录号:EF447274的IPK1序列被靶向。
靶核苷酸序列中的靶位点:
IPK1中外显子2:TTCTCAAGTCATGAGCAACTC(SEQ ID NO:35)
蛋白序列和属性
由编程的分子复合物造成的预定的靶位点IPK1的裂解,导致其突变或导致供体DNA插入由编程的复合物创建的DSB,根据需要,通过内源性过程辅助。此处可编程分子复合物由2个蛋白部分的相同单体和两种不同SCNA分子组成。在本实施例中,蛋白部分与实施例1中的相同。
在本实施例中,SCNA的核酸末端修饰是附着至寡核苷酸的5’或3’位置的NHS-酯连接的地高辛(DIG)。
SCNA属性和序列
SCNA的合理设计基本上如实施例1所述。互补的、靶碱基配对寡核苷酸的SCNA的长度优选是至少18个碱基。SCNA还可包含用作DIG-NHS末端修饰剂和靶互补的核苷酸之间的间隔区的任何序列组成的少数(例如1-6个,在一个实施例中为6个,在另一个实施例中,为2个)非靶碱基配对核苷酸(N)。
IPK1靶位点侧翼的SCNA核苷酸序列
测试了以下采用21bp靶缺口的“R”和“L”SCNA的组合:
IPK1-SR-1710:/5DIGN/NNNNNNCTGTGGGGCCATATCCCAGAA*C(只有核酸在本文被指定为SEQ ID NO:36)
IPK1-SL-1688:G*CGGGCACCGAGTTGTATTGTANNNNNN/3DIGN/(只有核酸在本文被指定为SEQ ID NO:37)
IPK1-ASR-1710:G*TTCTGGGATATGGCCCCACAGNNNNNN/3DIGN/(只有核酸在本文被指定为SEQ ID NO:38)
IPK1-ASL-1688:/5DIGN/NNNNNNTACAATACAACTCGGTGCCCG*C(只有核酸在本文被指定为SEQ ID NO:39)
根据预测结果,采用24bp靶缺口和较短SCNA接头的第二组配对的“R”和“L”SCNA组合:
IPK1-SR-1712:/5DigN/NNGTGGGGCCATATCCCAGAAC*T(只有核酸在本文被指定为SEQ ID NO:40)
IPK1-SL-1687:A*GCGGGCACCGAGTTGTATTGTNN/3DigN/(只有核酸在本文被指定为SEQ ID NO:41)
IPK1-ASL-1687:/5DigN/NNACAATACAACTCGGTGCCCGC*T(只有核酸在本文被指定为SEQ ID NO:42)
IPK1-ASR-1712:A*GTTCTGGGATATGGCCCCACNN/3DigN/(只有核酸在本文被指定为SEQ ID NO:43)
SCNA包括修饰的ssDNA。修饰符号为:硫代磷酸酯键=*;5’DIG=/5DigN/;3’DIG=/3DigN/。
实施例2A:原生质体中的IPK1敲除和GFP表达
在本实验中,测试了玉米植株中的基因组DSB和GFP序列整合进入IPK1基因形成敲除突变以及IPK1基因座中GFP的表达。编程的分子复合物在IPK1序列中形成基因组DSB,通过同源重组启动供体DNA整合进入IPK1序列。
本实施例,2A,在玉米原生质体上进行,其通过FACS分析GFP活性。
工作方案
原生质体制备:
使用玉米叶肉原生质体的瞬时表达测定(Sheen,2001)被用于除了聚凝胺诱导的递送方案(Polybrene-induced delivery protocol)之外或作为聚凝胺诱导的递送方案的替代的电穿孔-诱导的核酸递送:
基于(Antonelli & Stadler,1989)的转染:
将新鲜分离的原生质体(约2×10^6)与约20-50微克的转染DNA包括修饰的ssDNA SCNA、编码蛋白部分的质粒、供体DNA(在适用的情况下),以及30微克的聚阳离子聚凝胺(溴化己二甲铵)温育约6至12h。在温育期结束时,转染混合物通过加入生长培养基被稀释,并然后,在测定瞬时基因表达之前将细胞温育另外的约30h:
1.制备原生质体,并将2×10^6个细胞重悬在0.5ml具有8%甘露醇的基于Murashige Skoog的生长培养基(MS2D8M)中。
2.对于每个实验,制备新鲜聚凝胺(Aldrich)原液(stock solution)(10mg/ml,在磷酸盐缓冲盐水中,pH7.0)。这是一种非常吸湿的化学药品,并且必须严格应用制造商的安全说明。然后,将原液稀释以产生0.1mlMS2D8M中30微克聚凝胺的终浓度。
3.将所需浓度的转染DNA—质粒DNA和修饰的ssDNA-SCNA—重悬于0.4ml MS2D8M中。
4.将0.1ml(30微克)聚凝胺溶液与重悬的原生质体混合,并转移到60mm培养皿中。
5.立即加入(逐滴)0.4ml DNA混悬液。将原生质体/聚凝胺/DNA混合物(总体积1.0ml)在旋转振荡器(gyrotary shaker)上温和(25rpm)旋转15min,且然后于28℃温育(静止)6h。
6.在6h温育后,用4.0ml MS2D8M稀释上述混合物,密封培养皿,并遵循用于测定瞬时基因表达或用于选择稳定转染子的方法。
检测:
用聚凝胺转染后3天,悬浮于MS2D8M溶液中的转染的玉米原生质体通过流式细胞仪使用荧光激活细胞分选术(FACS)被分析。GFP通过在488nm处激发并用530/30滤波器检测发射来检测。设置阈值和补偿因素以排除任何假阳性。FACS被用于分离靶向的细胞用于进一步分析。
原生质体经受以下的分析:通过基因组DNA的提取、并使用以下引 物1F和1R其通过PCR的扩增、以及随后用BspHI消化PCR产物。或多或少与野生型大小类似的BspHI不可裂解的产物由精确靶向事件和不精确的再连接联合造成,较大尺寸的PCR产物由插入如期望的靶位点造成。
引物1F:GAGCTAGATAGCAGATGCAGAT(SEQ ID NO:44)
引物2R:CTCCAGAAAATCCCTAGAAACA(SEQ ID NO:45)
可选地,将PCR产物根据SURVEYOR突变检测试剂盒(Transgenomics,USA)的说明书经受CEL I酶促突变检测测定。该测定被用于评价IPK1DNA通过由编程的分子复合物的基因靶向的突变的有效性。
用于实验2A的供体序列:将GFP融合到IPK1序列,并因此GFP的表达仅可通过精确的同源重组(HR)发生。全部供体序列的序列如SEQ ID NO:46中列出的。与重组必要的IPK1同源的序列是SEQ ID NO:46的核苷酸1-621和1960-2610,且GFP盒由核苷酸622-1959编码。
实验2B:IPK敲除和Bar插入,递送至愈伤组织
在本实验中,测试了玉米植株中基因组DSB、和将赋予双丙氨磷(草胺膦(Phosphinothricin);草铵膦(Glufosinate-Ammonium);其类似物或商业除草剂诸如Basta,Bayer Crop Science)抗性的除草剂bar抗性基因特定整合入IPK1基因形成敲除突变以及bar在IPK1基因座中的表达。编程的分子复合物在IPK1序列中形成基因组DSB,通过同源重组启动供体DNA整合入IPK1序列。本实施例针对玉米愈伤组织进行,其通过DNA轰击被转染并然后在双丙氨磷(Basta)选择下生长。
工作方案
1.形成胚性愈伤组织:未成熟的胚1.6mm至1.8mm(植株A188XB73或A188XB84),生长条件:在24摄氏度10microEinstein/m^2/sec光照下生长在pH5.8含有2mg/L甘氨酸、2.9g/L L-脯氨酸、100mg/L酪蛋白水解物、13.2mg/L二氯甲氧苯酸或1mg/L2,4D、20g/L蔗糖的N6培养基上。以2g/L Gelgro凝固化。
2.基于由(Gordon-Kamm等人,1990)使用的方法将质粒DNA和修饰 的ssDNA-SCNA轰击入愈伤组织。
3.将愈伤组织转移至如实施例2A中描述的生长条件下,具有培养基中2.5mg/L双丙氨磷的终浓度(B0178Gold Biotechnology,1328Ashby Rd.,St.Louis,MO63132U.S.A.)。
4.每2周将愈伤组织移动至新培养基中。
5.在双丙氨磷上生长2个月的愈伤组织具有除草剂抗性,并可经受PCR分析或再生。
6.再生的植株既具有Basta抗性还具有降低的肌醇六磷酸盐水平。
检测及分析:
用修饰的ssDNA-SCNA、编码可编程分子复合物蛋白部分的质粒和含有bar抗性CDS表达盒的供体DNA轰击的愈伤组织生长在含有2.5mg/L双丙氨磷的再生培养基上。只有包含其中bar基因编码序列通过HR整合入IPK1基因座的细胞的愈伤组织才能够在这些条件下生长,因此,在该培养基上1个月后仍然增殖的植物材料被视为如期望的基因组修饰的。
通过该设计,当bar抗性盒通过HR整合进入基因组以适当行使功能时,白喉棒状杆菌毒素A(DT-A)盒为在热休克(HS)条件(42摄氏度)下表达DT-A的自主盒。因此,对于进一步分析,将愈伤组织分为HS诱导的愈伤组织和未诱导的愈伤组织。只有包含完全HR事件的愈伤组织才不会表达DT-A。含有随机整合的质粒的愈伤组织,其含有供体DNA和DT-A盒,表达DT-A并因此死亡。
此外,愈伤组织经受使用实施例2A中显示的引物1F和1R的PCR分析,随后用BspHI消化产物,如上述的。
用于实验2B的供体序列
供体质粒含有待被插入IPK1裂解位点的bar抗性盒和不应重组进入IPK1基因座的作为非特异性整合事件标志物的DT-A盒二者:bar抗性盒侧翼为HR必需的与IPK1同源的序列(SEQ ID NO:47的核苷酸1-621和2338-2988),而DT-A盒位于同源序列侧翼的位点外。bar盒(SEQ ID NO: 47的核苷酸622-2337)含有CaMv35S组成型启动子;用于赋予草铵膦抗性的草丁膦乙酰转移酶(phosphinothricin acetyl transferase)的吸水链霉菌bar基因CDS(SEQ ID NO:47的核苷酸1526-2078);和NOS终止子—在bar CDS的下游。—整个2B供体序列在SEQ ID NO:47中列出。
在相同质粒上,在热休克诱导型启动子(来自GenBank:X17295.1的拟南芥HSP18.2的HS-启动子)控制下编码白喉毒素A,DT-A(来自GenBank:AB535096.1),并被NOS终止子终止的第二个盒具有如在SEQ ID NO:48中列出的序列。
实施例3.在拟南芥的活细胞中诱导预定的染色体双链断裂(DSB).
酶八氢番茄红素去饱和酶(PDS)参与类胡萝卜素生物合成中的八氢番茄红素向ζ-胡萝卜素的转化。破坏拟南芥八氢番茄红素去饱和酶导致白化和矮小的表型。该表型被解释为受损的叶绿素、类胡萝卜素、和赤霉素生物合成。因此,该基因中的突变是表型上可检测的。
实验3A
在本实施例中,特定诱导内源PDS基因中的染色体双链断裂(DSB),以通过移码创建点突变,因此通过利用NHEJ内源性途径敲除该基因的功能。
实验3B
在本实施例中,在内源PDS基因中特定诱导染色体双链断裂(DSB)以创建将mCherry供体序列插入内源性PDS序列以使用可编程分子复合物通过辅助的同源重组敲除PDS。
对于实施例3A-3B,使用基于拟南芥原生质体的生物测定。在该生物测定中,将体内表达分子复合物的蛋白部分的质粒递送至原生质体,并将在本实施例中用末端荧光素(6-羧基-荧光素,6-FAM)修饰的赋予特异性的核酸(SCNA)ssDNA对共递送至原生质体,每个SCNA在3’末端或5’末端都具有这样的修饰(分别为/36-FAM/和/56-FAM/)。将用于核酸外切酶保护的第二修饰,诸如硫代磷酸酯,添加在相对的末端,内部硫代磷酸酯键的内切核酸酶保护也一样。在本实施例中,使用PEG转染方案(Wu等 人,2009)在单个质粒上伴随递送用于蛋白部分的编码序列和供体DNA。修饰的ssDNA SCNA被合成地制备,并使用如上述的PEG与质粒一起被递送。
蛋白序列和属性
在本实施例中,在质粒上编码的蛋白部分含有由FokI核酸酶结构域改造而成的氨基酸序列作为功能域;由抗荧光素单链可变区片段(scFv)免疫球蛋白(蛋白质数据库登录码1X9Q,1FLR_H)改造而成的氨基酸序列作为连接域;SV40NLS(PKKKRKV:SEQ ID NO:3)作为核定位结构域和域间连接体(GGSGG:SEQ ID NO:7)。
因此,在本实施例中描述的分子复合物的蛋白部分具有如SEQ ID NO:49中列出的氨基酸序列并由如SEQ ID NO:50中列出的核苷酸序列编码。
本实施例的赋予特异性的核酸(SCNA)通过添加包含C6-接头的荧光素-ScFv/6-FAM,6-羧基荧光素-荧光素dT至每个SCNA的一端被修饰。
SCNA属性和序列
SCNA的设计基本上如实施例1中所述。互补的、靶碱基配对寡核苷酸的SCNA的长度优选是至少18个碱基。SCNA还可包含用作6-FAM末端修饰剂和靶互补核苷酸之间的间隔区的任何序列组成的少数(例如1-6个,在一个实施例中为6个,在另一个实施例中,为2个)非靶碱基配对核苷酸(N)。
靶序列:
靶序列为:GTCCTGCTAAGCCTTTGAAAG(SEQ ID NO:51),位于拟南芥PDS序列的外显子2(GI:5280985,基因dl3145c,蛋白id=″CAB10200.1)上。
SCNA序列选项:
SCNA可被靶向任一链,因此,对于显示的靶,存在4个SCNA配对选项:
有义(S)SCNA:
PDS-SL1-846:GCATCCTTCCGTAGTGCTCCTCMNNNNN/36-FAM/(只有核酸在本文被指定为SEQ ID NO:52)
PDS-SR1-868:/56-FAM/NNNNNNTTGTAATTGCTGGTGCTGGTAT(只有核酸在本文被指定为SEQ ID NO:53)
反义(AS)SCNA:
PDS-ASL1-846:/56-FAM/NNNNNNGAGGAGCACTACGGAAGGATGC(只有核酸在本文被指定为SEQ ID NO:54)
PDS-ASR1-868:ATACCACCACCACCAATTACAANNNNNN/36-FAM/(只有核酸在本文被指定为SEQ ID NO:217)
混合的链SCNA:
PDS-SL1-846:GCATCCTTCCGTAGTGCTCCTCNNNNNN/36-FAM/(只有核酸在本文被指定为SEQ ID NO:52)
PDS-ASR1-868:ATACCAGCACCAGCAATTACAANNNNNN/36-FAM/(只有核酸在本文被指定为SEQ ID NO:217)
PDS-SR1-868:/56-FAM/NNNNNNTTGTAATTGCTGGTGCTGGTAT(只有核酸在本文被指定为SEQ ID NO:53)
PDS-ASL1-846:/56-FAM/NNNNNNGAGGAGCACTACGGAACCATGC(只有核酸在本文被指定为SEQ ID NO:54)
根据预测结果,采用24bp靶缺口和较短SCNA接头的第二组配对的“R”和“L”SCNA组合:
PDS-SL2-845:TGCATCCTTCCGTAGTGCTCCTNN/36-FAM/(只有核酸在本文被指定为SEQ ID NO:55)
PDS-SR2-870:/56-FAM/NNGTAATTGCTGGTGCTGGTATGT(只有核酸在本文被指定为SEQ ID NO:56)
PDS-ASL2-845:/56-FAM/NNAGGAGCACTACGGAAGGATGCA(只有核酸在本文被指定为SEQ ID NO:57)
PDS-ASR2-870:ACATACCAGCACCAGCAATTACNN/36-FAM/(只有核酸在本文被指定为SEQ ID NO:58)
PDS-SL2-845:TGCATCCTTCCGTAGTCCTCCTNN/36-FAM/(只有核酸在本文被指定为SEQ ID NO:55)
PDS-ASR2-870:ACATACCAGCACCAGCAATTACNN/36-FAM/(只有核酸在本文被指定为SEQ ID NO:58)
PDS-SR2-870:/56-FAM/NNGTAATTGCTGGTGCTGGTATGT(只有核酸在本文被指定为SEQ ID NO:56)
PDS-ASL2-845:/56-FAM/NNAGGAGCACTACGGAAGGATGCA(只有核酸在本文被指定为SEQ ID NO:57)
/56-FAM/代表SCNA ssDNA上的包括6-FAM(6-羧基-荧光素)的5’-修饰。/36-FAM/代表SCNA ssDNA上的包括6-FAM(6-羧基-荧光素)的3’-修饰。N代表任何核苷酸。
供体序列为DONOR PD-MCHERRY-S,具有如在SEQ ID NO:59中列出的序列(编码mCherry的ORF为SEQ ID NO:59的核苷酸662-1372)。
递送
生物测试设置:拟南芥原生质体制备基于(Wu等人,2009)并且与实施例1的类似,具有不同的转染步骤:
转染
1.制备新鲜PEG溶液用于在2ml管中转染
2.从6-孔板中倒掉BSA,并干燥
3.于RT在15ml圆底(扣盖)管中将0.2ml MMg中的~5x10^4个原生质体(2x10^4-1x10^5)与总计30-40微克的供体质粒DNA(在相关的情况下)、表达蛋白部分的质粒DNA和SCNA ssDNA的混合物混合。可选地,将供体DNA和表达蛋白部分的DNA构建在单个质粒上并递送。
4.加入等体积(0.2ml原生质体+中量质粒提取体积)的新鲜PEG溶液
5.RT温育5min
6.通过缓慢加入3ml W5,每次1ml,并且搅拌洗涤
7.以100xg水平离心1min
8.重复洗涤并沉淀
9.重悬于1ml W5溶液
10.倒入BSA涂覆的板中
11.于22摄氏度在16小时日最佳光照(150microEinstein·m^-2·s^-1)下培养原生质体,根据需要更换培养基。
分析
在实验3A中,来自汇集的(pooled)原生质体的DNA,通过PCR以及PCR产物的限制性片段分析被分析。
用以下引物进行PCR:
PCR引物2F:TGGTTGTGTTTGGGAATGTTTCT(SEQ ID NO:60);和
PCR引物2R:TATCCAAAAGATATCTTCCAGTAAAC(SEQ ID NO:61)
至少部分扩增的DNA中限制性内切酶DdeI裂解的废除,表明基因组模板的至少一些成功的基因靶向和定向的突变。
在实验3B中,将编码mCherry的供体DNA符合读框地融合于内源PDS基因。由该基因产生的mRNA编码融合到完整mCherry的断裂的PDS,断裂的PDS之后紧跟终止密码子(“PD-mCherry”)。悬浮于W5溶液中的原生质体在转染后3天使用自动流式细胞仪(FACS)机器筛选mCherry活性。PDS-修饰的原生质体通过FACS分析被检测,其中mCherry供体的插入通过使用561nm激发波长和检测590-630nm发射的mCherry荧光是可检测的。设置阈值和补偿因素以排除任何假阳性。
两个实验中的进一步表征通过在适合的培养基上再生原生质体并检查其随后的表型性状来实现,其中漂白的植株或愈伤组织表示成功的基因靶向。
实施例4.在双子叶植物烟草中的体内基因组DNA靶向和基因置换.
置换烟草中的ALS基因并产生除草剂抗性植株:乙酰乳酸合酶(ALS)是植物中缬氨酸、亮氨酸和异亮氨酸的生物合成途径中的酶。该基因的突变导致抗几种除草剂。例如,已证明了烟草中SuRB基因中的突变提供以下除草剂抗性:S647T-灭草喹、P191A-氯磺隆、W568L-绿黄隆和灭草喹。
在本实施例中,烟草ALS被靶向,以通过辅助的同源-重组介导的基因置换用除草剂耐受的突变的版本来置换野生型基因。
编程的分子复合物在烟草植物中的表达和组装,此处在两个步骤中进行。蛋白部分的递送通过用用于在植物中递送和表达可编程蛋白部分的基于烟草脆裂病毒(Tobacco Rattle Virus,TRV)的病毒蛋白表达载体诸如从pTRV2(Vainstein等人,2011)修饰而来的载体感染烟草植株来实现。
将SCNA递送进入表达蛋白部分的植株通过用携带编码RNA-SCNA对和供体序列二者的T-DNA的农杆菌感染植物来实现。
本实施例中的RNA-SCNA使用来自噬菌体Phi21的20-mer盒B RNA发夹结构结合序列(SEQ ID NO:62:5’-UUCACCUCUAACCGGGUGAG-3’)作为图1B中示意性例示的“SCNA核苷酸基序”结合分子复合物的蛋白部分的连接域。
本实施例中的连接域源自RNA结合蛋白(RBP)噬菌体Phi21N蛋白(SEQ ID NO:63:N’-GTAKSRYKARRAELIAER-C’)。在本实施例中,此处显示的发夹结构不在靶上,而在SCNA上,并因此结合蛋白的作用不限于靶RNA本身的特定识别位点,而可被用于靶向任何序列,包括DNA,唯一取决于与恒定的RBP-结合发夹结构相邻的可变SCNA靶碱基-配对序列。
本实施例中的靶核酸(基因)是SuRB(GenBank登录GI:19778)且期望的氨基酸突变是P191A-赋予氯磺隆抗性。因此:
未改变的原始序列:GGTCAACTGCCACGTAGCATG(SEQ ID NO:64)
诱导的突变:GGTCAAGTGGCGCGCAGGATG(SEQ ID NO:65)
蛋白部分的组分的序列:
组分:
1.在N’末端处或附近的噬菌体Phi21N蛋白(SEQ ID NO:63:GTAKSRYKARRAELIAER),与全长N-蛋白中一样,该RNA-结合肽位于N-末端。
2.FokI核酸酶
(VKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADFMQRYVFENQTRNKHINPUEWWKVYPSSVTFFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEFLLIGGFMIKAGTLTLFFVRRKFNNGEINF)(SFQ ID NO:66)
3.SV40-NLS:(SEQ ID NO:67:MPKKKRKV)
4.域间连接体:测试了多种聚-氨基酸接头,用于编程的分子复合物的优化的功能。
本实施例中测试了蛋白组装的两个选项:
1.第一个选项,(如SEQ ID NO:68中列出的),其中将Phi21N蛋白组装在可编程分子构建体的蛋白部分的N’末端,且核定位信号SV40NLS位于C’末端,并且域间接头为GGSGG(SEQ ID NO:7)。该组装蛋白由如SEQ ID NO:69中列出的核酸序列编码。
从用于如本实施例中显示的C’Phi21NP版本连同盒B RNA发夹结构系统和GGSGGESK(SEQ ID NO:74)域间连接体一起的计算机化的3D模型采集的空间测量产生了,在SCNA中单个“N”存在下的SCNA之间的期望的最佳距离为约26-30个核苷酸。从与任一侧的SCNA杂交的最后的核苷酸之后开始计数,考虑通过二聚化的构建体的dsDNA裂解创建的4个碱基的5’突出端,预测裂解发生在第13-17个核苷酸的左侧和右侧约±2个核苷酸处。这个标准表明,如果本实施例中靶向的序列是28个核苷酸:AAAAAAAAAAYYYYYYYYYYXXXXXXXYYYYYYYYYYCCCCCCCCCC,
其中Y+X表示在SCNA碱基配对位点之间的核苷酸的数目,则设计的SCNA与区域A和C碱基配对并且导致DSB的裂解在X区域内或与之 相邻。SCNA可与有义链或反义链互补,但优选地被选择与有义(非转录的)序列的碱基配对。当蛋白部分的位置位于SCNA的“近端”时,如由在“近端”处的引物的5’或3’修饰限定的,两个SCNA可与相同链碱基配对。
SCNA序列选项:
SCNA与任一链上待被裂解的靶位点侧翼序列碱基配对,因此,对于显示的靶,使用28bp靶缺口:存在4个SCNA配对选项:
有义(S)SCNA对:
SuRB_P191_SR1 586:
UUCACCUCUAACCGGGUGAGNGGUACUGAUGCUUUUCAGGAAA(SEQ ID NO:70)
SuRB_P191_SL1 557:
AUAGCGUCCCCAUUGUUGCUAUNUUCACCUCUAACCGGGUGAG(SEQ ID NO:71)
反义(AS)SCNA对:
SuRB_P191_ASR1 586:
UUUCCUCAAAAGCAUCACUACCNUUCACCUCUAACCGGGUGAG(SEQ ID NO:72)
SuRB_P191_ASL1 557:
UUCACCUCUAACCGGGUGAGUAUAGCAACAAUGGGGACGCUAU(SEQ ID NO:73)
且所有有义和反义对的组合总是选择一个右(R)和一个左(L)SCNA:
本实施例中测试的蛋白组装的第二个选项将蛋白的C’处的Phi21n蛋白和蛋白部分的N’处的SV40NLS组装。在该构建体中,使用序列:GGSGGESK(SEQ ID NO:74)的域间连接体:
本实施例的基于组装的Phi21 NP的可编程蛋白部分具有如SEQ ID NO:75中列出的氨基酸序列,并由如SEQ ID NO:76中列出的核酸序列编码。
从用于如本实施例中使用的C’Phi21NP版本连同盒B RNA发夹结构 系统和GGSGGESK(SEQ ID NO:74)域间接头一起的计算机化的3D模型采集的空间测量结果产生了,在SCNA中1个N的存在下SCNA之间的期望的最佳距离为约22-24个核苷酸。从与任一侧的SCNA杂交的最后的核苷酸之后计数,考虑通过二聚化的构建体的dsDNA裂解创建的4个碱基的5’突出端,预测裂解发生在第11个、第12个或第13个核苷酸的左侧和右侧约±2个核苷酸处。这个标准表明,如果被靶向的序列为,以该23个核苷酸为例:AAAAAAAAAAYYYYYYYYXXXXXXXYYYYYYYYCCCCCCCCCC,其中Y+X表示在SCNA碱基配对位点之间的核苷酸的数目,则设计的SCNA与区域A和C碱基配对并且导致DSB的裂解在X区域内或与之相邻。SCNA可与有义链或反义链互补,但优选地被选择与有义(非转录的)序列碱基配对。当蛋白部分的位置位于SCNA的“近端”时,如由在“近端”处的引物的5’或3’修饰限定的,两个SCNA可与相同链碱基配对。
SCNA序列选项:
SCNA与任一链上待被裂解的靶位点侧翼序列碱基配对,使用31bp靶缺口,产生4个SCNA配对选项:
有义(S)SCNA对:
SuRB_P191_SR1-588:
UUCACCUCUAACCGCGUGAGUACUGAUGCUUUUCAGCAAACU(SEQ ID NO:77)
SuRB_P191_SL1-556:
GAUAGCGUCCCCAUUGUUGCUAUUCACCUCUAACCGGGUGAG(SEQ ID NO:78)
反义(AS)SCNA对
SuRB_P191_ASR1-588:
AGUUUCCUGAAAAGCAUCAGUAUUCACCUCUAACCGGGUGAG(SEQ ID NO:79)
SuRB_P191_ASL1-556:
UUCACCUCUAACCGGGUGAGUAGCAACAAUGGGGACGCUAUC(SEQ ID NO:80)
有义和反义对的组合:
SuRB_P191_SR1-588:
UUCACCUCUAACCGGGUGAGUACUGAUGCUUUUCAGGAAACU(SEQ ID NO:77)
SuRB_P191_ASL1-556:
UUCACCUCUAACCGGGUGAGUAGCAACAAUGGGGACGCUAUC(SEQ ID NO:80)
SuRB_P191_SL1-556:
GAUAGCGUCCCCAUUGUUGCUAUUCACCUCUAACCGGGUGAG(SEQ ID NO:78)
SuRB_P191_ASR1-588:
AGUUUCCUGAAAAGCAUCAGUAUUCACCUCUAACCGGGUGAG(SEQ ID NO:79)
根据预测结果,采用23bp靶缺口和较短(单个N)SCNA接头的第二组配对的“R”和“L”SCNA组合:
有义(S):
SURB_P191_SR2-584:
UUCACCUCUAACCGGGUGAGNUCGGUACUGAUGCUUUUCAGGA(SEQ ID NO:81)
SURR_P191_SL2-560:
GCGUCCCCAUUGUUGCUAUAACNUUCACCUCUAACCGGGUGAG(SFQ ID NO:82)
反义(AS):SuRB_P191_ASR2-584:
UCCUGAAAAGCAUCAGUACCGAUUUCACCUCUAACCGGGUGAG(SEQ ID NO:83)
SuRB_P191_A5L2-560:
UUCACCUCUAACCGGGUGAGNGUUAUAGCAACAAUGGGGACGC(SEQ ID NO:84)
或来自第二组的“R”和“L”SCNA的组合。
UUCACCUCUAACCGGGUGAG(SCQ ID NO:62)是来自噬菌体Phi21的20-mer盒B RNA发夹结构结合序列的序列,并行使SCNA的连接域结合区段的功能(图1B中示意性标记为“SCNA核苷酸基序”)。
ALS SURB CDS的编码序列(未改变的)列于SEQ ID NO:85。
供体1P191A:供体具有改变的核苷酸序列以创建脯氨酸至丙氨酸(P191A)的突变,并使限制性内切酶分析成为可能。该供体的序列如SEQ ID NO:86列出的。改变的序列如SEQ ID NO:86的核苷酸544-591中列出的。
方法
在本实施例中,首先用基于pTRV的载体或基于pTRVdelta2b的载体接种天然宿主植物矮牵牛、烟草(Nicotiana tabacum)或本生烟草(N.benthamiana)植株(Vainstein等人,2011),该载体在本实施例中被设计为在病毒亚基因组启动子的控制下表达可编程分子构建体。在感染后约5-21天,收集植物叶片且在此处被用作接种物(inoculum)的植物汁液通过在任选地补充了非离子润湿剂(wetting agent)诸如Silwet L-77(约0.015%)的磷酸盐缓冲液(20mM,pH6.8)中粉碎叶片来提取。通过离心和/或粗棉布(cheesecloth)任选地随后通过0.22μm过滤来澄清溶液。过滤对于注射进入组织培养生长的植物是必要的。伴随地,对叶片的部分通过以下分析病毒构建体的稳定性:提取RNA、使用来自外来基因插入位点的引物3’逆转录RNA、使用跨越外来基因插入位点的引物通过PCR扩增cDNA、并与相似地PCR扩增的最初用于接种的pTRV质粒并排电泳。随后,约1个月龄的靶烟草植株,通过用金刚砂轻轻打磨其叶片并在叶片表面摩擦汁液被感染。这些植物可在体外或以其他方式生长。携带可编程分子复合物的基于TRV的自我复制载体感染植物,并系统系扩散至叶片、分生组织和未接种的组织和器官。当仍然是未编程的时候,所述复合物作为核酸酶是无活性的。
基于TRV的自我复制载体已全身性扩散遍及整个植株(约5-7天),因此,表达分子复合物的可编程蛋白部分之后,将叶盘在无菌条件下切离。叶盘瞬时表达以类似于(Gallois & Marinho,1995)的方式进行。简言之,用预先转化有一个双元质粒(例如pRCS、pSOUP+pGreen、或其他适合的双元载体)的适当菌株的农杆菌(例如EHA105)真空渗透叶盘,所述双元质粒在其RB和LB序列之间在两个相同或不同的组成型植物启动子诸如CaMV35S或NOS或OCS的控制下编码以上显示的两个SuRB_P191SCNA转录本的组合之一(还参见图9和图8A的示意性说明),并且还携带供体P191A序列。当T-链输入细胞时,SCNA被转录,与可编程蛋白组装以形成编程的分子复合物,其然后被输入至细胞核中,在细胞中,该编程的分子复合物特异性裂解烟草基因组DNA中SurB基因座中的DSB。然 后,来自T-DNA的供体DNA与该DSB附近的SurB基因重组,产生期望的突变。将叶盘放置在含有420nM氯磺隆的选择培养基上,如由Kochevenko(Kochevenko & Willmitzer,2003)描述的并如以下详细描述的方案中的。用适合的抗生素(羧苄青霉素250ug/ml+万古霉素250ug/ml)杀死农杆菌,并且允许从叶盘形成的愈伤组织形成生长为除草剂抗性基因组修饰的植株的芽。在含有420nM氯磺隆的Murashige和Skoog培养基上筛选氯磺隆抗性的再生植株,如由Kochevenko等人描述的。只有在氯磺隆上生长的植株才具有改变的ALS基因,表明ALS被编程的分子复合物靶向,并且表明供体适当地重组到正确的位置。
使能够解析成功的基因置换事件的分析通过针对从烟草再生体的部分提取的基因组DNA进行PCR来实现。在改变的序列上,废除了AgeI限制性内切酶位点,并添加了BssHII和KpnI位点。因此,扩增含有SuRB基因中的置换位点的PCR片段并用AgeI、BssHII和KpnI消化PCR片段,提供了使能够识别成功的基因置换的诊断模式。这些植株被进一步筛选,以通过DNA提取和编码SCNA的T-DNA的非SuRB区域的PCR扩增排除具有不想要的整合的T-DNA的那些植株。
详细的农杆菌转化方案:
1.收集2ml过夜的农杆菌培养物(转化有编码SCNA转录本并携带供体DNA的双元质粒)。
2.重悬于4ml诱导培养基(1L:10.5g K2HPO4、4.5g KH2PO4、1g(NH4)2SO4、0.5g柠檬酸钠、1g葡萄糖、4g果糖、4g甘油、0.12g MgSO4、1.95g MES,pH5.6),添加乙酰丁香酮至100μM的最终浓度。
3.在30摄氏度下生长6h。
4.通过3000g离心5min收集细菌。
5.重悬于含有200μM乙酰丁香酮的渗透培养基(10mM MgSO4、10mM MES,pH5.6)至终OD6000.4。
6.取4-12mm直径的叶盘,并在细菌渗透溶液(步骤5)中培养30min。
7.将叶盘放置在再生培养基(1L:4.3g MS、30g蔗糖、100mg肌醇, pH5.6,10g琼脂,添加NAA和BA至终浓度-100微克/L NAA和3mg/LBA)上。于20-25摄氏度培养48h。
8.将叶盘移动至含有抗生素羧苄青霉素(0.3mg)和除草剂氯磺隆(420nM)的新的再生培养基。每21天移动至新的培养基。
9.切割10mm以上的芽,并移动至1/2MS培养基(1L:2.15g MS、10g蔗糖、0.5g MES,用KOH调pH=5.7,10g琼脂)上生根。
实施例5.使用编程的分子复合物的DNA的靶向的化学修饰.
在该实施例中,测试了预定的位置中DNA的特异性甲基化。
DNA甲基化由DNA甲基转移酶催化,其将甲基(-CH3)从S-腺苷-L-甲硫氨酸转移至胞嘧啶残基的C-5位置上。在人和小鼠中已鉴定了三种活性DNA甲基转移酶,DNMT1、DNMT3A和DNMT3B。在这些实施例中的甲基化是CpG序列的胞嘧啶上的DNA。这些酶属于S-腺苷甲硫氨酸依赖性甲基转移酶(SAM或AdoMet-MT酶)的类,I类;AdoMet-MT酶是使用S-腺苷-L-甲硫氨酸(SAM或AdoMet)作为底物用于甲基转移的酶,创建了产物S-腺苷-L-高半胱氨酸(AdoHcy)。
DNMT3A
甲基转移酶的DNMT1和DNMT3家族两者在其C末端包含高度保守的C-5甲基转移酶基序,但它们在其N-末端区域未显示序列相似性。DNMT3A还结合脱乙酰基酶,并被序列特异性抑制因子招募以使转录沉默。DNMT3A使用其ATRX同源结构域与组蛋白脱乙酰基酶HDAC1缔合。DNMT3A的该结构域代表独立的转录抑制因子结构域,其沉默功能需要HDAC活性。DNMT3A作为携带脱乙酰基酶活性的共抑制因子蛋白起作用,并可通过其与DNA结合转录缔合被靶向至特定的调节焦点(regulatory foci)。DNMT3A还与RP58配合以不依赖甲基化的方式抑制转录。在本实施例中,使用SCNA将甲基转移酶活性定位在特定的基因座。
在本实施例中,DNMT3A的C’的部分被用于构建基于甲基转移酶的可编程分子复合物。去除将DNMT3A靶向臂间异染色质的PWWP结构域、锌指结构域、ADD结构域、引起其缔合组蛋白脱乙酰基酶HDAC1的ATRX 区域、和蛋白的整个调节N’-部分,保留包含AdoMet_MTase区域的区域(www.uniprot.org Q9Y6K1)。DNMT3A和B的C-末端包含催化结构域。在DNMT3A中,活性位点是C710(编号基于翻译的GenBank登录号AF067972.2)。
DNMT3A形成DNMT3L:DNMT3A:DNMT3A:DNMT3L异四聚体复合物。DNMT3L作为甲基化酶是无活性的,而DNMT3A可二聚化并且在没有DNMT3L的情况下是有活性的。DNMT3A呈同型二聚体的形式是有功能的。复合物显示在DNMT3A同型二聚体界面(二聚体界面)处特定接触,并且二聚化产生被B型DNA中一个近似螺旋转角(helical turn)分离的两个酶活性位点。因此,通过SCNA将编程的分子复合物二聚体定位在特定基因座,可引起相距约10-11个碱基对的CpG位点处的胞嘧啶的甲基化。为了进一步限制DNMT3A与DNMT的相互作用,在本实施例中使用了C’末端AdoMet_MTase区域中的突变R729A。DNA上的形成二聚体而不是四聚体的DNMT3A突变是R771A、E733A、R729A、F732A和Y735A。
为了测试本实施例的分子复合物针对预定的DNA序列进行定向特异性甲基化的能力,使用质粒作为靶核酸。编码mCherry基因的两条链上不同位置的定向甲基化,在pSAT6-mCherry质粒上通过甲基化敏感的限制性分析被测试。
转染的细胞的检测,通过FACS分析在波长561nm处激发以及通过610/20滤波器检测发射来进行。
蛋白部分构建
在本实施例中,在递送的质粒上编码的蛋白包含从包含基于人DNA(胞嘧啶-5)-甲基转移酶3A的甲基转移酶的催化位点的AdoMet_MTase区域改造而来的氨基酸序列(DNMT3A PDB登录号2QRV用于阐明3D结构)。添加突变R729或R771(基于翻译的GenBank AF067972.2编号)以调节DNMTL废除四聚体化而不扰乱DNMT3A二聚化或减少Kcat。本实施例的甲基转移酶区域的氨基酸序列(根据GenBank AF067972.2翻译)列于SEQ ID NO:87(DNMT3A AdoMet_MTase区域R729A)。
从抗荧光素单链可变区片段(scFv)免疫球蛋白(蛋白质数据库登录代码1X9Q、1FLR_H)改造而来的氨基酸序列,在本实施例中用作连接域;SV40NLS(PKKKRKV:SEQ ID NO:3)被用作核定位结构域,并且在本实施例中使用域间连接体诸如柔性域间连接体(SEQ ID NO.14:GSLEGGSGG)用于它们的附着。蛋白部分具有在SEQ ID NO:88中列出的氨基酸序列,由如SEQ ID NO:89列出的核酸序列编码:
用于甲基化测定的靶序列基于克隆到pSAT6-MCS(AY818383.1GI:56553596)的MCS位点的mCherry编码盒,并包括如在SEQ ID NO:90中列出的核苷酸序列。mCherry编码序列(cds)如在SEQ ID NO:90的核苷酸952-1671中列出的。
本实验中使用的SCNA序列:
SL898:TCCACCTCAACCTTCCAATTCTNNNNNN/36-FAM/(只有核酸在本文被指定为SEQ ID NO:91)。
SR951:/56-FAM/NNNNNNGATGGTGAGCAAGGGCGAGGAG(只有核酸在本文被指定为SEQ ID NO:92)。
3’-和5’-6FAM(6羧基荧光素)连接域结合-位点分别标记为/36-FAM/和/56-FAM/。虽然一个SCNA足以用于DNA甲基化,但使用不止一个被正确地间隔开的SCNA,以允许蛋白二聚化以提高特异性是可能的。
实验方法
使用双转染策略以允许在引入SCNA和靶DNA之前表达分子复合物的蛋白部分。
拟南芥原生质体制备基于Wu(Wu等人,2009)并且与实施例1的类似,具有不同的转染步骤:
转染:
1.制备新鲜PEG溶液用于在2ml管中转染
2.从6-孔板中倒掉BSA,并干燥
3.于RT在15ml圆底(扣盖)管中将0.2ml MMg中~5x10^4个原 生质体(2x10^4-1x10^5)与约20微克表达蛋白部分的质粒DNA混合。
4.加入等体积(0.2ml原生质体+中量质粒提取体积)的新鲜PEG溶液
5.于RT温育5min
6.通过缓慢加入3ml W5,每次1ml,并且搅拌洗涤
7.以100xg水平离心1min
8.重复洗涤并沉淀
9.重悬于1ml W5
10.倒入BSA涂覆的板中
11.于22摄氏度在16小时日最佳光照(150microEinstein·m^-2·s^-1)下培养原生质体,根据需要更换培养基。
12.约16小时之后,通过重复步骤1-11用编码mCherry靶和相关SCNA的质粒(总计约20微克)替换步骤3的质粒,进行这些细胞的再转染。
13.48小时后分析提取的质粒的mCherry表达和甲基化状态。
分析
通过两种方法进行靶DNA的CpG甲基化状态分析:
A)来自汇集的原生质体的消化的DNA通过PCR扩增分析。使用甲基化敏感的限制性内切酶SmaI(CCCGGG)、SalI(GTCGAC)或SacII(CCGCGG)进行消化。SmaI、SalI、SacII簇用作甲基化酶的CpG位点。CpG二核苷酸加有下划线。甲基化的DNA不会被这些酶裂解。因此,扩增跨越这些酶的裂解位点的MCS序列,并通过定量PCR测量的产物对比由于非甲基化引起的完全裂解而几乎未被扩增的缺乏分子复合物的组分或有意地包含非特异性SCNA的样品,返回甲基化效率的测量。
B)来自汇集的原生质体的DNA在PCR扩增、克隆并测序之前被亚硫酸氢盐转化,以分析许多靶和非靶对照序列的甲基化状态。如适于甲基化的DNA检测的EZ DNA甲基化-金试剂盒(ZYMO,USA)中描述的进 行亚硫酸氢盐测序并被用于进一步分析。
实施例6.人中靶向的基因组修饰:人造血干细胞中CCR5基因缺失.
C-C趋化因子受体5型(CCR5,GenBank登录号NT_022517.18)是在T细胞、巨噬细胞、树突细胞和小胶质细胞的表面表达并展示的趋化因子受体。该基因的突变—CCR5-Δ32,其由32个碱基缺失组成,导致在截短的蛋白的C’-末端引入31个新的氨基酸的移码突变,并赋予对天花和一些类型的人类免疫缺陷病毒(HIV)的抗性。该等位基因发现于约10%的欧洲人中,但在其他群体中则是罕见的。
在以下实施例中,将CCR5或该基因的部分从提取自不具有Δ32等位基因的HIV感染的患者的造血干细胞(HSC)中缺失。
蛋白部分包括基于核酸酶的功能域(修饰的FokI核酸酶结构域,如上述的)和RNA-基序-结合连接域(源自BIV TAT蛋白最小BIV TAT肽SGPRPRGTRGKGRRIRR(SEQ ID NO:93)结构域,其中蛋白部分的连接域结合特定RNA序列UUCAGCUCGUGUAGCUCAUUAGCUCCGAGCU(SEQ ID NO:94),其是BIV TAT环1。编码蛋白部分的核酸的递送,与赋予特异性的核酸(SCNA)的递送通过用于其瞬时表达的腺病毒载体伴随地进行。腺病毒不会整合进入宿主基因组中。
当引入并在靶细胞(HSC)中表达时,分子复合物在CCR5靶基因上自组装,允许蛋白部分二聚化并裂解CCR5序列,以如预期的造成该基因部分的缺失。遵循这种基因修饰,将由此创建的基因修饰的HSC、或其后代自体同源地再移植至患者。已被修饰的细胞在移植前通过去除展示CCR5的细胞的选择被富集。从这些HSC发育的CCR5突变的T细胞和巨噬细胞成为抗HIV感染的。已完成其功能的大多数腺病毒和分子复合物组分在移植前从HSC中被清除。
功能性预防CCR5的展示可以以几种不同的方式,使用不同的SCNA类型和位置通过该系统来实现,如以下详述的:
在Δ32等位基因中,CCR5CDS的3’的32个核苷酸缺失,导致移码缺失。缺失的序列是:TTCCATACAGTCAGTATCAATTCTGGAAGAA(SEQ ID NO:95)。 为了从表达CCR5的细胞中缺失该序列,使用了源自以下序列的SCNA(显示的不含连接域-结合修饰):
ATCAATTCTGGAAGAATTTCCA(SEQ ID NO:96);
TCATTACACCTGCAGCTCTCAT(SEQ ID NO:97)。
在本实施例中,在转录的SCNA上的连接域-结合修饰利用了BIV TAR的情况下,SCNA序列的完整序列为:
SCNA距离选项1,利用16bp缺口,并且无SCNA内部“N”接头:
CCR5_D32_SR_3321:
UUCAGCUCGUGUAGCUCAUUAGCUCCGAGCUAUCAAUUCUGGAAGAAULUCCA(SEQ ID NO:98)
CCR5_D32_SL_3304:
UCAUUACACCUGCAGCUCUCAUUUCAGCUCGUCUAGCUCALLAGCUCCGAGCU(SEQ ID NO:99)
SCNA距离选项2,应用27bp靶缺口和2“N”接头
核苷酸:CCR5_D32_SR_3319:
UUCAGCUCGUGUAGCUCAUUAGCUCCGAGCUNNGUAUCAAUUCUGGAAGAAUUUC(SFQ ID NO:100)
CCR5_D32_SL_3291:
CAAAAAGAAGGUCUUCAUUACACNNUUCAGCUCGUGUAGCCCAUUAGCUCCGAGCU(SEQ ID NO:101)
这些SCNA旨在允许TTTCCATACAGTCAGTATCAATTCTGGAAGAA靶序列(SEQ ID NO:102)中的修饰/裂解。在某些情况下,由单独的这些对介导的裂解和DSB形成,可通过内源性机制引起可导致移码的突变。为了在CCR5基因中进行更广泛的缺失,使用了靶向CCR5上至少两个靶的SCNA对:
几乎所有CCR5编码序列的缺失都通过伴随地使用结合CCR5-ATG区域的SCNA和结合CCR5-终止密码子区域的SCNA被诱导。
ATG SCNA
SCNA之间靶向的区域(对ATG加下划线):
CAGGGTGGAACAAGATGGATTATCAAGTGTC(SEQ ID NO:103)。
SCNA距离选项1,使用31bp靶缺口并无SCNA内部“N”接头:
CCR5_SR_2779:
UUCAGCUCGUGUAGCUCAUUAGCUCCGAGCUAAGTCCAATCTATGACATCAAT(SEQ ID NO:104);
CCR5_SL_2747:
AAGATCACTTTTTATTTATGCAUUCAGCUCGUGUACCUCAUUAGCUCCGAGCU.(SEQ ID NO:105).
SCNA距离选项2,基于计算结果,应用27bp靶缺口和2个“N”接头核苷酸:
CCR5_SR_2777:
UUCAGCUCGUGUAGCUCAUUAGCUCCGAGCUNNUCAAGUCCAAUCUAUGACAUCA(SEQ ID NO:106)
CCR5_SL_2749:
GAUCACUUUUUAUUUAUGCACANNUUCAGCUCGUGUAGCUCAUUAGCUCCGAGCU(SEQ ID NO:107)
终止SCNA
SCNA之间靶向的区域(对终止密码子加下划线):
ATATCTGTGGGCTTGTGACACGGACTCAAGT(SEQ ID NO:108)
SCNA距离选项1,使用31bp靶缺口并且无SCNA内部“N”接头:
CCR5_SR_3884:
UUCAGCUCGUGUAGCUCAUUAGCUCCGAGCUGGGCTGGTGACCCAGTCAGACT(SEQ ID NO:109);
CCR5_SL_3802:
CCGATCCACTGGGGAGCAGGAAUUCAGCUCGUGUAGCUCAUUAGCUCCGAGCU(SEQ ID NO:110)
SCNA距离选项2,基于计算结果,应用27bp靶缺口和2个“N”接头核苷酸:
CCR5_SR_3833:
UUCACCUCGUGUAGCUCAUUAGCUCCGAGCUNNUGGGCUGGUGACCCAGUCAGAC(SEQ ID NO:111)
CCR5_SL_3805:
AUCCACUGGGGAGCAGGAAAUANNUUCAGCUCGUGUAGCUCAUUAGCUCCGAGCU(SFQ ID NO:112)
分子复合物的蛋白部分通过基于腺病毒的表达系统诸如Adeno-XTM腺病毒系统3(Clontech Laboratories(CA,USA))中携带的并根据制造商的说明使用的核苷酸序列来表达。可选地,蛋白部分通过裸露的RNA转染被递送。
用于本实施例的蛋白部分氨基酸序列
功能域:源自FokI核酸酶亚基(如上述的)。
连接域:最小BIV TAT肽SGPRPRGTRGKGRRIRR(SEQ ID NO:93)结构域。
细胞定位结构域:SV40的核定位信号(NLS)结构域(SV40NLS)。
FokI核酸酶亚基:
VKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILCMKVMCTTMKVYGYRCXHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSCGYNLPIGQADEMQRYVECNQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNCAVLSVEELLIGGEMIKAGTLTLFFVRRKFUUGFINF(SFQ ID NO:66);
SV40ULS:MPKKKRKV(SEQ ID NO:67);
BIV TAT肽:SGPRPRGTRGKGRRIRR(SFQ ID NO:93)。
域间连接体:GSGGSGP(SEQ ID NO:113)
本实施例的组装的基于BIV TAT的可编程蛋白部分具有在SEQ ID NO:114中列出的氨基酸序列,其由在SEQ ID NO:115中列出的核酸序列编码。
从用于如本实施例中使用的具有GGSGGGP(SEQ ID NO:116)域间接头的BIV-TAT-TAR系统的计算机化的3D模型采集的空间测量产生了,在SCNA中2个N的存在下SCNA之间的期望的最佳距离为约26-28个核苷酸。从与任一侧的SCNA杂交的最后的核苷酸后开始计数,考虑由通过二聚化的构建体的dsDNA裂解创建的4个碱基的5’突出端,预测裂解发生在第12个、第13个或第14个核苷酸的左侧和右侧约±2个核苷酸处。这个标准表明,如果如在本实施例中的靶向的序列是27个核苷酸:AAAAAAAAAAYYYYYYYYYYXXXXXXXYYYYYYYYYYCCCCCCCCCC,其中Y+X 表示SCNA碱基配对位点之间的核苷酸的数目,则设计的SCNA与区域A和C碱基配对并且导致DSB的裂解是在X区域(靶位点)内或与之相邻。SCNA可与有义链或反义链互补,但优选地被选择与有义(非转录的)序列碱基配对。当蛋白部分的位置位于SCNA的“近端”时,如由在“近端”处的引物的5’或3’修饰限定的,两个SCNA可与相同链碱基配对。
不表达/展示CCR5的细胞对比表达野生型CCR5的细胞的检测和选择,使用单克隆小鼠抗人CCR5抗体(R&D系统目录号FABSP1)通过FACS分析来进行。
实施例7.与靶向的转录激活因子(transcriptional activator)碱基配对的可编程核酸
在本实施例中,将单子叶植物玉米中的原生质体系统(Marrs & Urioste,1995;Rhodes等人,1988)用作生物测定。在该系统中,玉米原生质体被电穿孔以引入质粒用于瞬时表达。如果需要,随后这些原生质体可被再生。
在本实施例中,包括不包含UAS结合域的Gal4转录激活因子结构域,和包括抗荧光素ScFV的连接域的蛋白部分连同荧光素修饰的SCNA一起被用于激活报告物基因的表达。在本实施例中,此处使用的,Gal4的DNA结合域被去除并被替换为蛋白部分的连接域。
在第一个实施例中,使用两个报告物质粒,其只有在转录激活因子结合至来自TATA盒上游的序列时,才能够表达GFP(选项1)或β-葡糖苷酸酶(GUS,选项2)。在本实施例中,该序列是已知被Gal4蛋白激活的6X-UAS。
在第二个实施例中,将UAS序列从靶核酸去除,并且SCNA结合在负62(TATA盒下游62nt)处,因此基本上实现相同的结果,而无任何天然启动子。在玉米原生质体生物测定系统中,如下所示的蛋白部分和SCNA可使用电穿孔被共转染。
蛋白部分氨基酸序列:包含经由域间连接体融合至抗荧光素ScFv的N’核靶向的Gal4激活功能域,在本文被指定为SEQ ID NO:132,并且由SEQ ID NO:157中列出的核苷酸序列编码。
第一个实施例利用具有6个UAS重复的靶质粒:
靶质粒含有,按以下顺序(5'->3'),6UAS启动子区域,随后为TATA盒,并且在本文被指定在SEQ ID NO:180中:
GGACTGTAGAGGTTCCGGGTGACAGCCCTCCGACGGGTGACAGCCCTCCGACGGGTGACAGCCCTCCGAATTCTAGAGGATCCGGGTGACAGCCCTCCGACGGGTGACAGCCCTCCGACGGGTGACAGCCCTCCGAATTCGAGCTCGGTACCCGGGGATCTGTCGACCTCGATCGAGATCTTCGCAAGACCCTTCCTCTATATA;
具有以下序列的间隔区
AGGAAGTTCATTTCATTTGGRGAGGACACGCTGAACC(SEQ ID NO:192);
选项1:在SEQ ID NO:193中列出的GFP编码序列。
选项2:在SEQ ID NO:194中列出的β-葡糖苷酸酶(GUS)编码序列。
35S-终止子序列:
GTCCGCAAAAATCACCAGTCTCTCTCTACAAATCTATCTCTCTCTATTTTTCTCCAGAATAATGTGTGAGTAGTTCCCAGATAAGGGAATTAGGGTTCTTATAGGGTTTCGCTCATGTGTTGAGCATATAAGAAACCCTTAGTATGTATTTGTATTTGTAAAATACTTCTATCAATAAAATTTCTAATTCCTAAAACCAAAATCCAGTGAC(SEQ ID NO:195)
在单独的实验中提供了SCNA的两个不同的方向,以选择二者中更有效的:结合UAS-序列的SCNA
有义:CGGGTGACAGCCCTCCGANNNNNN/36-FAM/(只有核酸在本文的SEQ ID NO:196中被列出)
反义:/5-6FAM/NNNNNTCGGAGGGCTGTCACCCG(只有核酸在本文的SEQ ID NO:197中被列出)
SCNA的末端修饰为6-羧基荧光素(6FAM)。5’或3’修饰分别显示为/5-6FAM/或/3-6FAM/。N代表任何核苷酸。
第二个实施例利用缺乏用于控制报告的基因的表达的启动子的靶质粒:
靶质粒含有,按下列顺序,质粒骨架序列,随后为TATA盒:
TCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGCCACCCATAATACCCATAATAGCTGTTTGCCAACCGGTTCTATATA(SEQ ID NO:198);
间隔区序列(SEQ ID NO:199)
AGGAAGTTCATTTCATTTGGRGAGGACACGCTGAACC;
选项1:如在SEQ ID NO:200中列出的GFP ORF。
选项2:如在SEQ ID NO:201中列出的β-葡糖苷酸酶(GUS)编码序列。
35S-终止子序列(SEQ ID NO:202)
使用了SCNA的两个不同的方向:
SCNA:选项(负62):
GCCAGGGTTTTCCCAGTCACGANNNNNN/36-FAM/(只有核酸在本文的SEQ ID NO:203中被列出)
/5-6FAM/NNNNNNTCGTGACTGGGAAAACCCTGGC(只有核酸在本文的SEQ ID NO:204中被列出)
使用显微术或流式细胞术的方法来测试玉米原生质体的GFP表达(选项1)。GFP阳性细胞表示编程的复合物行使功能。GFP阳性细胞的百分比允许在进行的实验之间的相对效率的计算以改善系统的不同参数。缺少该复合物的适当组分的细胞(例如,通过使用对照非特异性SCNA)中GFP的不存在,允许测量特异性的限度(limits of specificity)。
通过用0.45M甘露醇中的X-Gluc染色细胞并于37℃温育过夜来测试玉米原生质体的GUS表达(选项2),并使用显微镜检测。GUS阳性细胞(染成蓝色的)指示编程的复合物行使功能。GUS阳性细胞的百分比允许我们计算进行的实验之间的相对效率以改善系统的不同参数。缺少该复合物的适当组分的细胞(例如,通过使用对照非特异性SCNA)中GUS的不存在允许我们测量特异性的限度。
实施例8:细胞器DNA中的基因靶向。
在真核生物中,细胞器诸如线粒体和质体含有其自己的基因组。此外, 在植物中,它们还可含有亚基因组环状DNA。修饰线粒体DNA,除了其它的以外,可对人类疾病的治疗和农业用途具有影响。这些修饰的挑战包括,除了其它的以外,基因编辑必需的合理有效的、序列特异性系统递送进入细胞器并激活的技术障碍。
矮牵牛中的PCF
细胞质雄性不育(CMS)是由商业种子公司广泛使用作为保护他们的种系(seed line)的方法的有价值的植物性状。因此,修复现有系中的CMS或在新系中创建CMS是有利的。细胞质雄性不育可归因于植物由于特定核和线粒体相互作用而不能产生功能性花药、花粉或雄性配子。在此处显示的实施例中,使用了由编码ATP酶的亚基9的线粒体DNA中的atp9基因中组合的缺失和插入引起的矮牵牛中特征性的细胞质雄性不育性状。这导致线粒体ATP酶多蛋白复合物的质子转位功能的破坏,导致雄性不育。
本实施例的可编程分子复合物的蛋白部分被设计为含有线粒体定位信号以确保编程的分子复合物定位在线粒体内。将核酸转移到线粒体中的其他方法包括使用脂质体或电穿孔。植物线粒体,且特别是来自茄科包括矮牵牛的植物中的线粒体,通过通透性转换孔复合物主动输入DNA。该过程限于双链DNA,但没有明显的序列特异性。取决于递送的方法,供体序列可,例如,作为线性纯化的PCR片段、线性化的质粒、或作为环状质粒被递送。来自电穿孔进入分离的小麦线粒体的质粒的表达,例如,当使用线粒体相容的启动子诸如含有由(Hanic-Joyce和Gray,1991)描述的起始区的882bp的提莫非维小麦(T.timopheevi)cox II线粒体启动子时是非常有效的。
含有置换或插入事件的细胞的选择可通过在供体DNA中编码的氯霉素抗性操纵子来实现。
在以下实施例中(8A-8C),蛋白部分包含:
源自BIV TAT肽的连接域,包含氨基酸序列SGPRPRGTRGKGRRIRR(SEQ ID NO:93);
源自FokI核酸酶的功能域,包含氨基酸序列
VKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINF(SEQ ID NO:66);
源自拟南芥硫辛酸合酶的细胞定位域,并包含氨基酸序列MHSRSALLYRFLRPASRCFSSSS(SEQ ID NO:6),其是线粒体定位信号(MLS)。
域间连接体:GSGGSGP(SEQ ID NO:113)
本实施例的组装的基于BIV TAT的可编程蛋白部分具有在SEQ ID NO:205中列出的氨基酸序列,其由在SEQ ID NO:206中列出的核苷酸序列编码。
从用于本实施例的具有GGSGGGP(SEQ ID NO:116)域间接头的BIV-TAT-TAR系统的计算机化的3D模型采集的空间测量的结果显示了,在SCNA中2个N存在下,SCNA之间的期望的最佳距离为约26-28个核苷酸。从与任一侧的SCNA杂交的最后的核苷酸后开始计数,考虑由通过二聚化的构建体的dsDNA裂解创建的4个碱基的5’突出端,预测裂解发生在第12个、第13个或第14个核苷酸的左侧和右侧约±2个核苷酸处。这个标准表明,如果靶向的序列是,例如,以下的27个核苷酸:AAAAAAAAAAYYYYYYYYYYXXXXXXXYYYYYYYYYYCCCCCCCCCC,其中Y+X表示SCNA碱基配对位点之间的核苷酸的数目,则设计的SCNA与区域A和C碱基配对并且导致DSB的裂解在X区域内或与之相邻。SCNA可与有义链或反义链互补,但优选地被选择与有义(非转录的)序列碱基配对。当蛋白部分的位置位于SCNA的“近端”时,如由在“近端”处的引物的5’或3’修饰限定的,两个SCNA可与相同链碱基配对。
本实施例中使用的SCNA连接域-结合RNA序列源自BIV TAR环1,包括核酸序列UUCAGCUCGUGUAGCUCAUUAGCUCCGAGCU(SEQ ID NO:117)。因此,SCNA可(在细菌启动子控制下在编码SCNA的DNA的存在下通过线粒体的电穿孔)被直接递送至分离的线粒体或(通过农杆菌介导的瞬时转录)被递送至细胞质并通过与其结合并含有MLS的蛋白部分被“拉” 入线粒体。
可编程分子复合物的表达后,分离线粒体并将供体DNA转染进入分离的线粒体。
进行了以下的实施例,每一个都具有用于SCNA距离的2个选项:
1.形成不含供体DNA的CMS表型(8A)。
2.靶向atp9以使用具有氯霉素抗性的供体DNA形成pcf-样突变体(8B)。
3.修复pcf(CMS)表型,重组(reform)ATP9并恢复育性且伴随地使用具有氯霉素抗性的供体DNA(8C)。
用于这些实施例的靶核酸序列包括:
“ATP9”:矮牵牛腋花矮牵牛亚种parodii(Petunia x hybrid X Petunia axillaris subsp.parodii)线粒体ATP合酶亚基9,GenBank登录号Y00609.1GI:297475。
“pcf”:腋花矮牵牛亚种parodii中的细胞质雄性不育(CMS),CMS相关的融合蛋白(CMS-afp),NADH脱氢酶亚基3(nad3)和核糖体蛋白S12(rps12)基因,完整的CDS;线粒体,GenBank登录号M16770.1GI:1256946。
实施例8A.不分离细胞器的情况下细胞器DNA中的定向DNA突变.
靶向ATP9以形成通过创建非功能性蛋白ATP9蛋白引起CMS的突变。
设计SCNA以在靶位点中形成单个DSB,其通过内源NHEJ修复途径被修复,创建编码序列的部分中的移码。
ATP9靶位点:GCAAAACAATTATTTGGTTATGCCATTTTGG(SCQ ID NO:118)。
SCNA距离选项1,31bp靶缺口:
SCNA侧翼的ATP9靶位点:
ATP9_ASL_705:
UUCAGCUCGUGUAGCUCAUUAGCUCCGAGCUCAAUGALGGAUUUCGCGCCACG(SFQ ID NO:119)
ATP9_ASR_737:
UUAGCUUCGGUUAGAGCAAAGCUUCAGCUCGUGUAGCUCAUUAGCUCCGAGCU(SEQ ID NO:120)
SCNA距离选项2,应用27bp靶缺口:
ATP9_ASL_707:
UUCAGCUCGUGUAGCUCAUUAGCUCCGAGCUGCCAAUGAUGGAUUUCGCGCCA(SEQ_ID_NO:121)
ATP9_ASR_735:
AGCUUCGGUUAGAGCAAAGCCCUUCAGCUCGUGUAGCUCAUUAGCCCCGAGCU(SEQ ID NO:122)
使用本领域已知的标准叶片渗透方法,用具有源自编码蛋白部分和RNA-SCNA的双元载体质粒的T-DNA的农杆菌接种矮牵牛叶片(如图8A中示意性示出的)。转染后,编程的分子复合物的组分在细胞质中表达,自组装,并然后通过线粒体输入机制经由展示在蛋白部分表面的MLS定位于线粒体。然后,编程的分子复合物(包括蛋白质部分和靶向SCNA)靶向线粒体DNA中的ATP9基因,因此形成突变的线粒体。
对于分析,转染后48小时,从植物纯化DNA并使用以下引物通过PCR扩增ATP9序列:
ATP9atgF:ATGTTAGAAGGTGCAAAATCAA(SEQ ID NO:123)
ATP9p2R:CTAACGGACTTGGAATACGAAT(SEQ ID NO:124)
然后,PCR产物经受CEL I酶促突变检测测定(SURVEYOR突变检测试剂盒(Transgenomics,USA))。该测定被用于评价用编程的分子复合物通过基因靶向突变线粒体DNA的有效性。
实施例8B.细胞器DNA中定向DNA插入.
在本实施例中,ATP9被靶向以通过将含有选择标志物氯霉素的供体DNA插入ATP9基因座形成pcf-样突变体。
方法:如实施例8A中,使用标准叶片渗透法,用具有源自编码编程 的分子复合物的蛋白部分和SCNA的双元载体质粒的T-DNA的农杆菌接种矮牵牛叶片。转染后,编程的分子复合物的组分在细胞质中表达,自组装,并然后通过线粒体输入机制经由展示在蛋白部分表面的MLS定位于线粒体中。约12-72小时后,渗透的叶片被用于线粒体制备。包括本实施例的供体DNA的质粒载体或线性PCR产物,通过电穿孔被递送进入分离的线粒体中。然后,将电穿孔的线粒体通过显微注射移植进入新鲜的矮牵牛原生质体中。经注射的原生质体在氯霉素选择培养基上再生,仅允许PCF样线粒体在细胞中存活。
8B供体DNA(将atp9改变为pcf-样)在SEQ ID NO:125中列出:
结果和分析
编程的分子复合物裂解与pcf同源的区域的下游的atp9基因的编码序列。这导致pcf-样供体和裂解的atp9基因之间的同源重组(HR)。因此,在线粒体基因组中重建了pcf雄性不育基因型。此外,供体含有氯霉素抗性盒,允许选择抗氯霉素的线粒体。经注射的能够在含有氯霉素的选择培养基上再生的原生质体包含DNA修饰的靶向的线粒体。从这些原生质体产生的愈伤组织能够芽分化,并最终形成完整植株,产生仅含有靶向的线粒体的再生的植株。因此,雄性不育的矮牵牛通过从含有氯霉素抗性的线粒体的愈伤组织再生的植株实现。
实施例8C.细胞器DNA中定向DNA置换.
在本实施例中,pcf突变体被靶向以使用含有氯霉素抗性的供体DNA形成有活性的修复的ATP9序列。
在本实施例中,供体DNA被设计以通过HR整合进入pcf基因座,创建终止密码子以重建缺乏引起pcf障碍的冗余的氨基酸序列的完整的ATP9蛋白。供体DNA中的氯霉素抗性盒(AY230218.1GI:30267504)被用于选择修复的线粒体。供体上的CDS为基于操纵子的设计。氯霉素序列以加下划线的小写字母显示。
方法:在本实施例中,包含本实施例的供体DNA的质粒载体、实施例8C中显示的SCNA和实施例8A的蛋白部分,通过电穿孔在与图9中 示意性显示的质粒类似设计的单一质粒上被递送至分离的线粒体。
类似于实施例8B,将电穿孔的线粒体通过显微注射移植进入矮牵牛原生质体。将原生质体接种在氯霉素选择培养基上。从这些原生质体产生的愈伤组织能够芽分化(Frearson等人,1973),并最终形成完整植株,产生仅含有靶向的线粒体的再生的植株。筛选这些矮牵牛植株的雄性育性。
8C序列
pcf中的靶位点:AGACTTACATCACGATGTCTTTTTCTTCGTT(SEQ ID NO:126)
靶位点侧翼的SCNA:
SCNA距离选项1,31bp靶缺口:
CMS_ASL_704:
UUCAGCUCGUGUAGCUCAUUAGCUCCGAGCUGUUAUUUGUAUACCUAACACGG(SEQ ID NO:127).
CMS_ASR_736:
AUACGAAAACCAAAAUCAGAAUUUCAGCUCGUGUAGCUCAUUAGCUCCGAGCU(SFQ ID NO:128).
SCNA距离选项2,基于计算结果,应用27bp靶缺口:
CMS_ASL_706
uucagcuCGUGUAGCUCAUUAGCUCCGagcuCUGUUAUUUGUAUACCUAACAC(SEQ ID NO:129)
CMS_ASR_734
ACGAAAACCAAAAUCAGAAUAAUUCAGCUCGUCUAGCUCAUUAGCUCCGAGCU(SEQ ID NO:130)
8C供体的序列如SEQ ID NO:131中列出的。
实施例9:哺乳动物细胞的基因组修饰:预防FAS受体介导的死亡.
还被称为细胞凋亡抗原1(APO-1、APT、TNFRSF6、CD95)的FAS受体(FasR),是在人中由位于人第10号染色体上的TNFRSF6基因(GenBank登录号NC_000010区域:90750288..90775542GPC_000000034VERSION NC_000010.10GI:224589801)编码的蛋白。Fas受体是在细胞表面展示的死亡受体,其通过当结合配体时形成诱导死亡的信号复合物(DISC)导致编程的细胞死亡(细胞凋亡)。相邻细胞表面的膜锚定的Fas 配体三聚体引起Fas受体的三聚化(trimerization)。Fas配体或FasL(CD95L)是同源三聚体II型跨膜蛋白。可溶性FasL比其膜结合的对应物具有较少的活性,并且不会引起受体三聚化和DISC形成。当确保死亡结构域(DD)聚集时,受体复合物被内在化并通过半胱天冬酶(caspase)启动级联事件,最终导致DNA降解、膜出泡和细胞凋亡的其他特点。该事件也可通过结合此处实施例中使用的激动Fas抗体被模拟。
FasR八种剪接变体是已知的,其翻译成蛋白的七个同种型。诱导细胞凋亡的Fas受体被称为同种型1,并且是1型跨膜蛋白。Fas蛋白具有319个氨基酸,分为3个结构域:胞外结构域、跨膜结构域和胞质结构域。胞外结构域具有157个氨基酸,并且富含半胱氨酸残基。跨膜结构域和胞质结构域分别具有17和145个氨基酸。外显子1至5编码可与FasR三聚体相互作用的胞外区。外显子6编码跨膜区。外显子7-9编码胞内区。
蛋白序列和属性
蛋白部分如实施例3中描述的。
因此,在本实施例中描述的分子复合物的蛋白部分具有在SEQ ID NO:49中列出的氨基酸序列。
本实施例的赋予特异性的核酸(SCNA)通过添加包含C6-接头的荧光素-ScFv/6-FAM,6-羧基荧光素-荧光素dT至每个SCNA的一端被修饰。
SCNA属性和序列
互补的、靶碱基配对的寡核苷酸的SCNA的长度优选是至少18个碱基。SCNA还可包含用作6-FAM末端修饰剂和靶互补的核苷酸之间的间隔区的任何序列组成的少数(例如0-6个,在本实施例中为6个)非靶碱基配对核苷酸(N)。
从用于如本实施例中使用的具有GGSGG(SEQ ID NO:7)域间接头的抗荧光素-ScFv-6-FAM系统的计算机化的3D模型采集的空间测量的结果产生了,在SCNA中2个N的存在下,SCNA之间的期望的最佳距离为约23-26个核苷酸。从与任一侧的SCNA杂交的最后的核苷酸后计数,考虑由通过二聚化的构建体的dsDNA裂解创建的4个碱基的5’突出端,预测 裂解发生在第11个、第12个或第13个核苷酸的左侧和右侧约±2个核苷酸处。这个标准表明,如果靶向的序列是,以该24个核苷酸为例:AAAAAAAAAAYYYYYYYYYXXXXXXYYYYYYYYYCCCCCCCCSC,其中Y+X表示SCNA碱基配对位点之间的核苷酸的数目,则设计的SCNA与区域A和C碱基配对并且导致DSB的裂解在X区域内或与之相邻。SCNA可与有义链或反义链互补,但优选地被选择与有义(非转录的)序列碱基配对。当蛋白部分的位置位于SCNA的“近端”时,如由在“近端”处的引物的5’或3’修饰限定的,两个SCNA可与相同链碱基配对。
靶位点序列:
靶序列实例是:
A)外显子1起始于347处,靶序列是:GGGCATCTGGACCCTCCTACC(SEQ ID NO:133)
SCNA:
SCNA距离选项1,21bp靶缺口SL351:
A*GGATTGCTCAACAACCATGCTNNNNNN/36-FAM/(只有核酸在本文的SEQ ID NO:134中被列出)
SR373:/56-FAM/NNNNNNTCTGGTGAGCCCTCTCCTGCC*C(只有核酸在本文的SEQ ID NO:135中被列出)
SCNA距离选项2,基于计算结果,应用24bp靶缺口和较短的SCNA“N”接头:
SL349:G*GAGGATTGCTCAACAACCATGNN/36-FAM/(只有核酸在本文的SEQ ID NO:136中被列出)
SR374:/56-FAM/NNCTGGTGAGCCCTCTCCTGCCC*G(只有核酸在本文的SEQ ID NO:137中被列出)
外显子2起始于12499处,靶序列为:TACGTCTGTTGCTAGATTATC(SEQ ID NO:138)
B)
SCNA:
SCNA距离选项1,21bp靶缺口:
SL125503:A*TGCTTTTATTTTACAGGTTCTNNNNNN/36-FAM/(只有核酸在本文的SEQ ID NO:139中被列出)
SR12525:/56-FAM/NNNNNNGTCCAAAAGTGTTAATGCCCA*A(只有核酸在本文的SEQ ID NO:140中被列出)
SCNA距离选项2,基于计算结果,应用24bp靶缺口和较短的SCNA“N”接头:
SL12501:TCATGCTTTTATTTTACAGGTTNN/36-FAM/(只有核酸在本文的SEQ ID NO:141中被列出)
SR12526:/56-FAM/NNTCCAAAAGTGTTAATGCCCAA*G(只有核酸在本文的SEQ ID NO:142中被列出)
用于限制性分析的外显子2靶:CAGTTGAGACTCAGAACTTGG(SEQ ID NO:143)
C)
SCNA:
SCNA距离选项1,21bp靶缺口
SL12595:G*GAATTGAGGAAGACTGTTACTANNNNNN/36-FAM/(只有核酸在本文的SEQ ID NO:144中被列出)
SR12617:/56-FAM/NNNNNNAAGGCCTGCATCATGATCGCCAATTCT*C(只有核酸在本文的SEQ ID NO:145中被列出)
SCNA距离选项2,基于计算结果,应用24bp靶缺口和较短的SCNA“N”接头:
SL12594:G*GAATTGAGGAAGACTGTTACTNN/36-FAM/(只有核酸在本文的SEQ ID NO:146中被列出)
SR12619:/56-TAM/NNGGCCTGCATCATGATGGCCAA*T(只有核酸在本 文的SEQ ID NO:147中被列出)
用于分析实施例C的引物:
FAS_E2F:CATGCTTTTATTTTACAG;(SFQ ID NO:148)
FAS_E2R:CTGTGACTTTCACTGTAATC(SFQ In NO:149)
用这些引物PCR扩增靶,形成(在未修饰的DNA中)227bp PCR产物,该PCR产物用DdeI消化形成127bp和100bp的片段。DdeI消化通过准确靶向被废除。
外显子9靶:CAATTGTGAATTCACATAGAA(SEQ ID NO:150)
D)
SCNA:
SCNA距离选项1,21bp靶缺口
SL24524:G*GTGTCATATTATACAATATTTNNNNNN/36-FAM/(只有核酸在本文的SEQ ID NO:151中被列出)
SR24546:/56-FAM/NNNNNNAACATTAAATTATAATGTTTG*A(只有核酸在本文的SEQ ID NO:152中被列出)
SCNA距离选项2,基于计算结果,应用24bp靶缺口和较短的SCNA“N”接头:
SL24522:T*TGGTGTCATATTATACAATATNN/36-FAM/(只有核酸在本文的SEQ ID NO:153中被列出)
SR24547:/56-FAM/NNACATTAAATTATAATGTTTGA*C(只有核酸在本文的SEQ ID NO:154中被列出)
用于分析实施例D的引物:
FAS_E9F CTTTGTITATAACTCTGAGAAG(SEQ ID NO:155)
FAS_E9R TCAAAATGCTTTTGATGCCTGA(只有核酸在本文的SEQ ID NO:156中被列出)
用这些引物PCR扩增靶,形成(在未修饰的DNA中)240bp PCR产 物,该240bp PCR产物用EcoRI消化形成134bp和106bp的片段。EcoRI消化通过准确靶向被废除。
/56-FAM/和/36-FAM/分别表示SCNA ssDNA上的包含6-FAM(6-羧基-荧光素)的5’-修饰或3’-修饰。N表示任何核苷酸。硫代磷酸酯键由星号(*)表示。
虽然每个SCNA对都可引起敲除FAS受体的突变,但由靶向基因中不止一个位点产生的整段DNA的缺失可使FASR活性完全丧失。因此,例如,在实施例A-C中使用SCNA可导致废除FasR活性的突变,而使用这些SCNA中的任何一项连同实施例D的SCNA一起则导致废除FasR活性的主要基因组缺失。
测定:
用于检测人基因组DNA中诱导的特定突变的生物测定如下:使用用于配制质粒DNA的转染剂(Mirus,USA)TransIT-HeLaMONSTER或TransIT-LT1和用于配制SCNA ssDNA的TransIT-Oligo,用编码可编程分子复合物的蛋白部分的质粒连同相关ssDNA SCNA一起转染HeLa细胞和Jurkat细胞。温育指定的时间之后,这两组配制的DNA转染剂混合物被同时提供至细胞,以靶向染色体FasR。为确定基因靶向效率,以从(Kotlo等人,2003)修改而来的方案测试了细胞以确认其对FasL的敏感性:在用200ng/ml抗FasR激动性抗体(抗-Fas mAb,克隆2R2目录号:MC-121,Kamiya Biomedical Company,或单克隆抗CD95克隆7C11,目录号:PNIM2387Beckman-Coulter)和任选的敏化剂诸如双香豆素100微摩尔的组合处理之前20-24h,一式两份涂覆转染的细胞。处理后十七个小时,用PBS冲洗后保持附着在板上的有活力的、台盼蓝拒染细胞的数目被确定或可选地进行碘化丙啶排除染色以通过流式细胞术(FACS)评价完整的活细胞。其中FAS基因被靶向的并失活的细胞,不会经过诱导死亡的过程,不会染色,而是繁殖。因此,诱导的特定被靶向的细胞与非特定被靶向的细胞(例如,无SCNA或非FAS SCNA)之间的比较,评价了人细胞中基因靶向的成功。存活的或FACS分选的细胞系通过以下被分析:PCR扩增基因组DNA中被靶向的FasR区域,随后为限制性片段分析和测序,以鉴定 诱导的突变。
实施例10:体内编辑质粒DNA序列.抗生素抗性修饰.
本实施例是关于适用于测试和微调可编程分子复合物的基本设计中的排列;测试其在不同生物体或细胞中的应用;测试不同的递送方法;以及测试突变、置换、缺失和插入的编辑功能的生物测定。
当靶向质粒DNA时,细菌可选择的标志物基因被用于确定基因靶向效率。
在这些实施例中,使用基于拟南芥原生质体的生物测定。在本生物测定中,用与末端地高辛(NHS酯)(DIG)修饰的成对的ssDNA SCNA,一个SCNA在3’末端具有此修饰且另一个在5’末端具有此修饰,共递送的报告物系统和质粒上的分子复合物递送原生质体。用于外切核酸酶保护的第二修饰,诸如硫代磷酸酯,可被添加在相对的末端。
蛋白序列和属性
蛋白部分为如在实施例1中描述的。
在本实施例中,SCNA的核酸末端修饰为附着至寡核苷酸的5’或3’位置的NHS-酯连接的地高辛(DIG)。
分子复合物的蛋白部分的氨基酸序列(单字母代码)(具有地高辛ScFv的NLS-FokI-核酸酶序列)在(SEQ ID NO:12)中列出:
SCNA属性和序列
互补的、靶碱基配对的寡核苷酸的SCNA的长度优选是至少18个碱基。SCNA还可包含用作DIG-NHS末端修饰剂和靶互补的核苷酸之间的间隔区的任何序列组成的少数(例如1-6个,在一个实施例中为6个,在另一个实施例中,为2个)非靶碱基配对的核苷酸(”N”)。
从用于如本实施例中显示的具有GSLEGGSGG(SEQ ID NO:14)域间接头的抗-DIG-ScFv-NHS-酯-DIG系统的计算机化的3D模型采集的空间测量的结果产生了,在SCNA中2个N存在下SCNA之间的期望的最佳距离为约23-26个核苷酸。从与任一侧的SCNA杂交的最后的核苷酸后计数, 考虑由通过二聚化的构建体的dsDNA裂解创建的4个碱基的5’突出端,预测裂解发生在第11个、第12个或第13个核苷酸的左侧和右侧约±2个核苷酸处。这个标准表明,如果靶向的序列是,以该24个核苷酸为例:AAAAAAAAAAYYYYYYYYYXXXXXXYYYYYYYYYCCCCCCCCCC,其中Y+X表示SCNA碱基配对位点之间的核苷酸的数目,则设计的SCNA与区域A和C碱基配对并且导致DSB的裂解在X区域内或与之相邻。SCNA可与有义链或反义链互补,但优选地被选择与有义(非转录的)序列的碱基配对。当蛋白部分的位置位于SCNA的“近端”时,如由在“近端”处的引物的5’或3’修饰限定的,两个SCNA可与相同链碱基配对。
检测测定:
靶质粒pTGD(图15中示意性示出的)包括4个主要部分:
1.靶氨苄青霉素抗性盒(AmpR)。
2.组成型选择卡那霉素(Km)抗性盒(KanR)。
3.复制起点(ori)。
4.编码可编程分子复合物蛋白部分的序列盒(PMCP),包括适合于测试生物体,在本实施例中为植物的启动子。
5.T1和T2-靶序列1和2。
该质粒在细菌细胞诸如大肠杆菌细胞中繁殖。在本实施例中,将SCNA、编码可编程分子复合物蛋白部分的靶质粒pTGD和供体DNA(在实施例10B、10C中)递送进入拟南芥原生质体。转染48小时后,从转染的原生质体提取DNA(Kit A1120Promega Corp.),并转化进入大肠杆菌细菌感受态细胞(Kit L3002Promega Corp.)。将转染的细菌涂布在以100微克/ml的浓度包含卡那霉素的LB培养基上。菌落在37摄氏度下生长约16h。然后将菌落以副本(in replica)转移至氨苄青霉素(100微克/ml)或四环素(100微克/ml)LB平板上,并在37摄氏度下生长另外的16h。
分析:
计数来自每个副本的菌落。卡那霉素抗性菌落的总数表明总质粒数, 其还表示总靶数。不抗氨苄青霉素的菌落是包含被成功靶向的质粒的菌落,验证了“突变”或“缺失”的编辑功能。抗四环素而不抗氨苄青霉素的菌落表示供体DNA通过NHEJ整合进入靶质粒,验证了“置换”的编辑功能。抗氨苄青霉素和四环素两者的菌落是包含被靶向、具有整合进入氨苄青霉素靶序列但并没有置换其的供体的质粒,验证了“插入”的编辑功能。
然后,质粒经受用以下引物的PCR和序列分析用于验证结果:
A96IF:TAGGGCGCTGGCAAGTGTAG(SEQ ID NO:158)
A2161R:CATAACACCCCTTGTATTAC(SEQ ID NO:159)
实验
实施例10A-AMPR盒中的靶向突变.
检测测定基本上如以上描述的进行(“检测测定”),具有以下另外的详细信息:将pTGD质粒连同靶序列1(SEQ ID NO:161)侧翼的SCNA一起转染至拟南芥原生质体。纯化DNA并转化进入大肠杆菌感受态细胞,其被涂布在LB Kan培养基上。在LB AMP平板上制作副本。失去AMP抗性的菌落含有靶向的质粒。
实施例10B
检测测定基本上如以上描述的进行(“检测测定”),具有以下另外的详细信息:将pTGD质粒连同靶序列1侧翼的SCNA以及作为PCR产物产生的线性dsDNA四环素(Tet)供体一起转染进入拟南芥原生质体。纯化DNA并转化进入大肠杆菌感受态细胞,其涂布在LB Km培养基上。在LB AMP平板和LB Tet平板两者上制作副本。失去AMP抗性的菌落含有靶向的质粒。抗Tet的菌落表示含有特定整合的供体DNA的质粒。
实施例10C
检测测定基本上如以上描述的进行(“检测测定”),具有以下另外的详细信息:将pTGD质粒以及针对靶序列1的SCNA和针对靶序列2(SEQ ID NO:170)的SCNA连同四环素(Tet)供体DNA一起被转染至拟南芥原生质体。纯化DNA并转化进入大肠杆菌感受态细胞,其涂布在LB Km 培养基上。在LB AMP平板和LB Tet平板上制作副本。失去AMP抗性的菌落包含靶向的质粒。Tet抗性菌落表示特定整合的供体DNA。AMP敏感的菌落经受用引物A961F和A2161R的PCR分析。
含有掺入Tet供体(ca.1.9Kb)而不是AMP(ca.860bp)靶序列的质粒的菌落显示基因置换事件。
对AMP和Tet两者均敏感的菌落显示通过NHEJ的基因缺失。
抗Tet和AMP两者的菌落含有掺入TetR供体而无Amp抗性盒缺失的质粒并显示靶向的供体整合或“插入”。
递送
生物测定设置:拟南芥原生质体制备基于Wu等人(2009),并且与实施例1的类似,具有不同的转染步骤:
转染:
1.制备新鲜PEG溶液用于在2ml管中转染
2.从6-孔板中倒掉BSA,并干燥
3.于室温,在15ml圆底(扣盖)管中将0.2ml MMg中的~5x10^4个原生质体(2x10^4-1x10^5)与包含总计30-40微克的靶质粒DNA和表达蛋白部分的DNA、ssDNA SCNA和线性dsDNA供体的质粒的混合物混合。
4.加入等体积(0.2ml原生质体+中量质粒提取体积)的新鲜PEG溶液
5.RT°温育5min
6.通过缓慢加入3ml W5溶液,每次1ml,并且搅拌洗涤
7.以100xg水平离心1min
8.重复洗涤并沉淀
9.重悬于1ml W5溶液
10.倒入BSA涂覆的板中
11.于22摄氏度在16小时日最佳光照(150microEinstein·m^-2·s^-1)下培养原生质体,根据需要更换培养基。
然后,使原生质体经受DNA提取,如在检测测定中描述的。
靶向的AmpR盒如在SEQ ID NO:160中列出的。
SCNA对被选择,一个左(L)且一个右(R),不论有义(S)或反义(AS)链:SCNA对组合的选择是本实验中测试的参数。
AMPR盒上的靶序列T1:TATGAGTATTCAACATTTCCG(SEQ ID NO:161)(将ATG起始密码子加下划线)
靶向AMP的SCNA的组1
选项1-利用21bp靶缺口:
pTGD_130_5L:A*ATAATATTGAAAAAGGAAGAGNNNNNN/3DIGN/(只有核酸在本文的SEQ ID NO:162中被列出)
pTGD_152_SR:/5DIGN/NNNNNNTGTCGCCCTTATTCCCTTTTT*T(只有核酸在本文的SEQ ID NO:163中被列出)
pTGD_130_ASL:/5DIGN/NNNNNNCTCTTCCTTTTTCAATATTAT*T(只有核酸在本文的SEQ ID NO:164中被列出)
pTGD_152_ASR:A*AAAAAGGGAATAAGGGCGACANNNNNN/3DIGN/(只有核酸在本文的SEQ ID NO:165中被列出)
选项2-配对的组合,根据预测结果,采用24bp靶缺口和较短SCNA接头:AMP_129_SL:
C*AATAATATTGAAAAAGGAAGANN/3DIGN/(只有核酸在本文的SEQ ID NO:166中被列出)
AMP_154_SR:/5DIGN/NNTCGCCCTTATTCCCTTTTTTG*C(只有核酸在本文的SEQ ID NO:167中被列出)
AMP_129_ASL:/5DIGN/NNTCTTCCTTTTTCAATATTATT*G(只有核酸在本文的SEQ ID NO:168中被列出)
AMP_154_ASR:G*CAAAAAAGGGAATAAGGGCGANN/3DIGN/(只有核酸在本文的SEQ ID NO:169中被列出)
AMPR盒上的靶序列T2:AGCATTGGTAACTGTCAGACC(SEQ ID NO:170)
靶向AMP的SCNA的组2
选项1,利用21bp靶缺口
pTGD_981_SL:G*AGATAGGTGCCTCACTGATTANNNNNN/3DIGN/(只有核酸在本文的SEQ ID NO:171中被列出)
pTGD_1003_SR:/5DIGN/NNNNNNAAGTTTACTCATATATACTTT*A(只有核酸在本文的SEQ ID NO:172中被列出)
pTGD_981_ASL:/5DIGN/NNNNNNTAATCAGTGAGGCACCTATCT*C(只有核酸在本文的SEQ ID NO:173中被列出)
pTGD_1003_ASR:T*AAAGTATATATGAGTAAACTTNNNNNN/3DIGN/(只有核酸在本文的SEQ ID NO:174中被列出)
选项2配对的组合,根据预测结果采用24bp靶缺口和较短的SCNA接头:
AMP_980_SL:T*GAGATAGGTGCCTCACTGATTNN/3DIGN/(只有核酸在本文的SEQ ID NO:175中被列出)
AMP_1005_SR:/5DIGN/NNGTTTACTCATATATACTTTAG*A(只有核酸在本文的SEQ ID NO:176中被列出)
AMP_980_ASL:/5DIGN/NNAATCAGTGAGGCACCTATCTC*A(只有核酸在本文的SEQ ID NO:177中被列出)
AMP_1005_ASR:T*CTAAAGTATATATGAGTAAACNN/3DIGN/(只有核酸在本文的SEQ ID NO:178中被列出)
供体
编码来自克隆载体pSoup,EU048870.1GI:155733614的四环素抗性的供体序列如在SEQ ID NO:179中列出的。
实施例11:与连接的SCNA序列对一起起作用的可编程分子复合物的构建.
在本实施例中,可编程分子复合物被设计成与掺入结合核酸序列的双靶序列的单个核酸分子,此处指定为连接的赋予特异性的核酸序列(SCNA序列)对一起起作用,如图4A和4B中示意性示出的。
在本实施例中,中断的GFP靶序列通过去除或突变终止密码子来修复。预定的靶GFP的所得裂解导致可恢复GFP活性的点突变。
在这些实施例中,基于拟南芥原生质体的生物测定,其中将与以下任一项共递送的报告物系统(靶质粒)、表达蛋白部分的质粒递送至原生质体:关于实施例12A(图4A中示意性示出的)-编码RNA的核酸、包含两个修饰的SCNA序列的RNA,在本实施例中,通过来自噬菌体Phi21的20-mer盒B RNA发夹结合序列(SEQ ID NO:62:5’-UUCACCUCUAACCGGGUGAG-3’)和“SCNA连接体”、一种非定义的序列或长度的核苷酸的非靶杂交段。一个SCNA在RNA分子的3’-末端具有此修饰且另一个在RNA分子的5’末端具有此修饰。在本实施例中,RNA-SCNA使用来自噬菌体Phi21的20-mer盒B RNA发夹结合序列(5'-UUCACCUCUAACCGGGUGAG-3'(SLQ ID NO:62),或:实施例11B中(图4B中示意性示出的)包含修饰的ssDNA SCNA序列结合两个分子复合物的蛋白部分的连接域,在实施例11B中,所述SCNA序列通过添加末端地高辛(NHS酯)(DIG)分子和“SCNA连接体”,一种非定义的序列或长度的核苷酸的非靶杂交段在5’和3’末端被修饰。
蛋白序列和属性
在实施例11A中,蛋白部分包含源自FokI核酸酶结构域的氨基酸序列作为功能域、源自RNA-结合蛋白(RBP)噬菌体Phi21N蛋白的连接域(SEQ ID NO:63:N’-GTAKSRYKARRAELIAER-C’)、SV40NLS(PKKKRKV:SEQ ID NO:3)作为核定位结构域和域间连接体(SEQ ID NO:14:GSLEGGSGG)。
在实施例11B中,蛋白部分包含从FokI核酸酶结构域改造而来的氨 基酸序列作为功能域;从与(Huston等人,1988)中描述的类似的抗DIG单链可变区片段(scFv)免疫球蛋白(DIG-ScFv)改造而来的氨基酸序列作为连接域;SV40NLS(PKKKRKV:SEQ ID NO:3)作为核定位结构域和域间连接体(SEQ ID NO:14:GSLEGGSGG)。
SCNA的核酸末端修饰为NHS-酯连接的地高辛(DIG)并附着至寡核苷酸的5’和3’位置。
实施例11A:基于Phi21NP的可编程分子复合物蛋白部分序列:
组分:
噬菌体Phi21N蛋白(SEQ ID NO:63:GTAKSRYKARRAELTAER),在N’末端处或邻近N’末端,如同在全长N-蛋白中,RNA-结合肽位于N-末端。
FokI核酸酶:
VKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRCKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVEENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAVLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGETNF(SEQ ID NO:66)
SV40-NLS:(PKKKRKV:SEQ ID NO:3)
域间连接体:为了编程的分子复合物的最佳功能,测试了多种聚-氨基酸接头。
分子复合物的蛋白部分的氨基酸序列:在本实施例中,将Phi21N蛋白(如在SEQ ID NO:68中列出的氨基酸序列)组装在可编程分子构建体的蛋白部分的N’末端,且核定位信号,SV40NLS,位于C’末端,且域间接头为GGSGG(SEQ ID NO:7)。
实施例11B:分子复合物的蛋白部分的氨基酸序列(单字母代码)(具有地高辛ScFv的NLS-FokI核酸酶,在SEQ ID NO:12中列出)。
SCNA属性和序列
互补的、靶碱基配对的寡核苷酸的SCNA长度可以是任何预定的长度。例如,长度为至少18个碱基。SCNA还可包含用作A)在实施例11A中 的Phi21盒B RNA发夹末端修饰剂或B)在实施例12B中的DIG-NHS末端-修饰剂与互补核苷酸之间的间隔区的任何序列组成的少数(优选地0-6个,更优选地1-2个)非靶碱基配对核苷酸(N)。在这些实施例中,SCNA通过图14中指定为“SCNA连接体”或本实施例的序列中的X(n)的非靶碱基配对序列被连接。X(n)表示将两个赋予特异性的区域彼此连接的非确定长度的RNA核苷酸。对于线性DNA,预期的最佳长度(n)为约35-73个核苷酸(nts),而较长(73个核苷酸以上)和较短(4-34个核苷酸)的SCNA连接体都是可适用的。在该实施例中,此处给定n=40个核苷酸。
SCNA可与有义链或反义链互补,尽管本文显示了用于每一个实施例的两个选项,但是SCNA优选地被选择与有义(非转录的)序列碱基配对。当蛋白部分的位置位于SCNA的“近端”时,如由在“近端”处的引物的5’或3’修饰限定的,两个SCNA序列可与相同链碱基配对。
用于实施例11A和11B的测定的包含靶“STOP GFP”的质粒含有如在(SEQ ID NO:181)中列出的核酸序列。
实施例11A:(基于Phi21NP的)
构建了有义或反义杂交双SCNA:
有义连接的SCNA
GFP-921SR-X(n)-892SL BOXBPHI
UUCACCUCUAACCGGGUGAGNUCCAAGGGCGAGGAGCUGUUCA(SEQ ID NO:
207)-X(n)-ACCAUUUACGAACGAUAGCCAUNUUCACCUCUAACCGGGUGAG
(指定为SEQ ID NO:208)。
反义连接的SCNA
GFP-921ASR-X(n)-892ASL BOXBPHI
UUCACCUCUAACCGGGUGAGNAUGGCUAUCGUUCGUAAAUGGU(SEQ ID NO:
209)-X(n)-UGAACAGCUCCUCGCCCUUGGANUUCACCUCUAACCGGGUGAG(SEQ ID NO:210)
将20-mer盒B PHI序列5'-UUCACCUCUAACCGGGUGAG-3'(SEQ ID NO:62)加下划线。双SCNA上赋予特异性的序列在图4A-B的示意图中 被标记为SCNA1和SCNA2。N表示任何核苷酸的小段(0-6),X(n)表示非定义的序列或长度的核苷酸的非靶杂交段(SCNA连接体)。
实施例11B:
构建了有义或反义杂交双SCNA:
有义连接的SCNA
GFP-919SR-X(n)-894SL-DIG
/5DigN/NNTGTCCAAGGGCGAGGAGCTGTT(只有核酸被指定为SEQ ID NO:211)
-X(n)-CATTTACGAACGATAGCCATGGNN/3DigN/(只有核酸被指定为SEQ ID NO:212)
反义连接的SCNA
GFP-919ASR-X(n)-894ASL-DTG
/5DigN/NNCCATGGCTATCGTTCGTAAATG(只有核酸被指定为SEQ ID NO:213)-X(n)-AACAGCTCCTCGCCCTTGGACANN/3DigN/(只有核酸被指定为SEQ ID NO:214)
修饰符号为整合的DNA技术(IDT)网站中使用的那些(5’DIG=/5DigN/;3’DIG=/3DigN/),X(n)表示非定义的序列或长度的核苷酸的非靶杂交段(SCNA连接体)。
递送
生物测定设置:拟南芥原生质体制备基于Wu等人(Wu等人,2009)并且与实施例1的类似,具有不同的转染步骤:
转染:
1.制备新鲜PEG溶液用于在2ml管中转染
2.从6-孔板中倒掉BSA,并干燥
3.于RT°下在15ml圆底(扣盖)管中将0.2ml MMg中的~5x104个原生质体(2x104-1x105)与总计30-40μg的包含靶质粒DNA和表达蛋白部分的DNA和表达双-SCNA的质粒(对于实施例12A)或含有双SCNA 的ssDNA(对于实施例12B)的质粒的混合物混合。
4.加入等体积(0.2ml原生质体+中量质粒提取体积)的新鲜PEG溶液
5.RT°温育5min
6.通过缓慢加入3ml W5,每次1ml,并且搅拌洗涤
7.以100xg水平离心1min
8.重复洗涤并沉淀
9.重悬于1ml W5溶液
10.倒入BSA涂覆的板中
11.于22℃在16小时日最佳光照(150μE·m-2·s-1)下培养原生质体,根据需要更换培养基。
然后,原生质体经受FACS或DNA提取,如下文详细描述的。
结果:通过诱导的DSB的点突变.
在本实施例中,通过分子复合物的靶裂解导致质粒DNA靶中的双链断裂(DSB)。该DSB被创建在终止密码子位点处,其被消化并通过内源NHEJ修复机制被修复。NHEJ易于突变,并且这些突变中的一些可废除终止密码子并修复开放阅读框,产生有活性的GFP开放阅读框(ORF)。然后,GFP通过显微镜或流式细胞仪(FACS)来检测,使测量系统效率和在变量之间进行比较以确认其改善成为可能。
分析:
基因靶向效率被确定为阳性GFP细胞的百分比。在转染后3天,使用自动流式细胞仪(FACS)筛选悬浮于W5溶液中的原生质体的GFP活性。GFP通过在488nm处的激发并用530/30滤波器检测发射来检测。设置阈值和补偿因素以排除任何假阳性。
靶序列是编码GFP的序列中与诊断限制性位点连接的终止密码子(SpeI ACTAGT,将终止密码子加下划线)。当成功被靶向时,终止密码子和诊断限制性位点通过缺失、插入或点突变事件被废除。在特定框中的 修复还可恢复GFP表达。测定通过如下文描述的FACS被分析,或通过使用质粒小量制备试剂盒(Bioneer K3030)根据以下步骤从原生质体中纯化质粒DNA被分析:沉淀W5溶液中的原生质体,并通过加入250ul缓冲液1裂解并且根据制造商的说明中用于细菌沉淀物的方案继续进行。通过PCR从所得质粒制品扩增SCNA之间的区域。用SpeI彻底裂解PCR产物。电泳后,将未裂解的产物从凝胶切出,克隆到T/A克隆载体(pUC57/T Fermentas)并测序单克隆以检测不同的突变事件。
实施例12.用于确定最佳SCNA距离的生物测定.
为确定每一种不同的靶类型或可编程分子复合物类型的SCNA与潜在靶位点之间的最佳距离,创建了一组含有中断的GFP报告物编码序列(STOP-GFP)的靶质粒(pTARGET-STOPGFP(n),图16)。将两个SCNA结合序列(SCNAb)插入人工N’前导序列和GFP编码序列(CDS)中,这两个SCNA结合序列(SCNAb)以可变的长度在靶序列的侧翼,形成被指定为pTARGET-STOPGFP(1-8)的质粒系列(图16)。如图16中概述的,使用限制性内切酶NcoI和MscI将插入片段插入。靶序列是人工N’前导序列中与诊断限制性位点偶联的终止密码子(SpeI ACTAGT(SEQ ID NO:215)或BclI TGATCA(SEQ ID NO:216),将终止密码子加下划线)。
质粒的其他组分包括:1)可操作地连接至GFP序列的启动子。测定可在不同的真核细胞中进行。在本实施例中,植物启动子诸如NosP被用于进行拟南芥原生质体中的实验。2)一对SCNA结合位点(SCNA1b和SCNA2b);3)含有终止密码子的靶位点;4)GFP编码序列和5)转录终止子序列,在本实施例中为NosT。
图16中显示的示意图(不按比例),示出在一组含有中断的绿色荧光蛋白(GFP)报告物编码序列(STOPGFP)的质粒pTarget-STOPGFP(n)中的一组八个示例性构建体,其中“n”表示如图16中的表中显示的序列号。可变长度和组成的插入片段的组通过包含起始密码子的NcoI限制性位点和在其相对端的MscI位点来描绘。SCNA1b位于GFP-人工N’前导序列中且SCNA2b位于GFP编码序列中。靶序列是人工N’前导序列中与诊断限制性位点(SpeI ACTAGT(SEQ ID NO:215)或BclI TGATCA(SEQ ID  NO:216),将终止密码子加下划线)和移码(除了在n=5的情况下)偶联的终止密码子。靶位点间隔区的序列在实施例12中显示。在表中,“n”表示该质粒的序列号。以碱基对(bp)计,SCNAb之间的距离被示出,随后为括号中的相关诊断限制性位点。由于预期的4bp的5’突出端,顶链和底链上的期望的裂解位置被显示,其中由于由核苷酸“上”而不是核苷酸之间的催化位置的定位引起的不确定性,±2数值在偶数插入片段中且±3数值在奇数插入片段中。在一些裂解事件中,内源修复机制可引起导致缺失、突变或非模板的核苷酸的添加的不完全修复。这些修复的序列的一些可导致终止密码子和与移码偶联的诊断限制性位点的废除,恢复GFP表达。最小的恢复事件,核苷酸的添加或缺失或点突变,在表的最右列中显示。
插入片段中结合SCNA1的识别序列
ATCTCAAGTCTCTAGGACTGGT(SEQ ID NO:182)
GFP序列中结合SCNA2的识别序列
ATCTGTGAGCAAAGGCGAGGAG(SEQ ID NO:183)
如图16中概述的:
n=1的NcoI/MscI插入片段:
CCATGGGATCTCAAGTCTCTAGGACTGGTCTTCAAAATCTTTCTCACTAGTTTCTACGATCTTGGCCA(SEQ ID NO:184)
n=2的NcoI/MscI插入片段:
CCATGGGATCTCAAGTCTCTAGGACTGGTCAAAATCTTTCTCACTAGTTTCTACGCTGGCCA(SEV ID NO:185)
n=3的NcoI/MscI插入片段:
CCATGGGATCTCAAGTCTCTAGGACTGGTAATCTTTCTCACTAGTTACGCTGGCCA(SEQ ID NO:186)
n=4的NcoI/MscI插入片段:
CCATGGGATCTCAAGTCTCTAGGACTGGTAATCTTTCTTGATCAGTCTGGCCA(SEQ ID NO:187)
n=5的NcoI/MscI插入片段:
CCATGGGATCTCAAGTCTCTAGGACTGGTAATCTTTCTTGATCACCTGGCCA(SEQ ID NO:188)
n=6的NcoI/MscI插入片段:
CCATGGGATCTCAAGTCTCTAGGACTGGTAATCTTTCTTGATCACTGGCCA(SEQ ID NO:189)
n=7的NcoI/MscI插入片段
CCATGGGATCTCAAGTCTCTAGGACTGGTCTTTCTCACTAGTTCTGGCCA(SRQ ID NO:190)
n=8的NcoI/MscI插入片段:
CCATGGGATCTCAAGTCTCTAGGACTGGTCTTCACTAGTGGCCA(SEQ ID NO:191)将每个分子复合物都共转染进入拟南芥原生质体,如下文所述的:
递送
生物测定设置:拟南芥原生质体制备基于(Wu等人)并与实施例1的类似,具有不同的转染步骤:
转染:
1.制备新鲜PEG溶液用于在2ml管中转染
2.从6-孔板中倒掉BSA,并干燥
3.于RT°下在15ml圆底(扣盖)管中将0.2ml MMg中的~5x10^4个原生质体(2x10^4-1x10^5)与总计30-40微克的供体质粒DNA(在相关的情况下)、表达蛋白部分的质粒DNA和SCNA ssDNA的混合物混合。可选地,将供体DNA和表达蛋白部分的DNA构建在单个质粒上并递送。
4.加入等体积(0.2ml原生质体+中量质粒提取体积)的新鲜PEG溶液
5.RT°温育5min
6.通过缓慢加入3ml W5,每次1ml,并且搅拌洗涤
7.以100xg水平离心1min
8.重复洗涤并沉淀
9.重悬于1ml W5溶液
10.倒入BSA涂覆的板中
11.于22摄氏度在16小时日最佳光照(150microEinstein·m-2·s-1)下培养原生质体,根据需要更换培养基。
分析:
针对pTARGET-STOPGFP(n)质粒系列测试了每种形式的分子复合物的基因靶向效率。
当成功被靶向时,终止密码子和诊断限制性位点通过缺失、插入或点突变事件被废除(图16)。在特定框中的修复还可恢复GFP表达(图16)。测定通过FACS被分析,或通过使用质粒小量制备试剂盒(Bioneer K3030)根据以下步骤从原生质体中纯化质粒DNA被分析:沉淀W5溶液中的原生质体,并通过加入250ul缓冲液1裂解并且根据制造商的说明中用于细菌沉淀物的方案继续进行。通过PCR从所得质粒制品扩增“间隔区”区域。PCR产物视情况而定用SpeI(37℃)或BcII(50℃)被彻底裂解。电泳后,将未裂解的产物从凝胶切出,克隆进入T/A克隆载体(pUC57/T Fermentas)并测序单克隆以检测不同突变事件。
然后,基因靶向效率被确定为阳性GFP细胞的百分比。在转染后3天使用自动流式细胞仪(FACS)筛选悬浮于W5溶液的原生质体的GFP活性。GFP通过在488nm处的激发并用530/30滤波器检测发射来检测。设置阈值和补偿因素以排除任何假阳性。
本实验中包括的对照为1)使用不正规(illegitimate)(非碱基配对)的SCNA作为非特异性裂解的对照,2)使用缺少一个靶结合位点的pTARGET-STOPGFP作为非二聚体作用的对照,3)使用不含中断GFP的终止密码子并具有符合读框的GFP的类似质粒pTARGET-GFP作为阳性对照,4)使用与pTARGET-STOPGFP类似的但在中断GFP的终止密码子附近含有I-SceI限制性酶切位点的质粒pTARGET-STOP-I-SceI-GFP,联合在植物细胞中表达核定位的I-SceI限制性内切酶的质粒pSAT4-NLS-I-SceI一起,作为比较异源系统对照。
具体实施方案的上述描述将如此充分地揭示了本发明的总体性质,使得其他人可以通过应用现有知识,容易地修改和/或调整此类具体实施方案用于各种应用,而无需过度实验且不偏离一般概念,并因此,此类调整和修改应该并且预期被包括在所公开的实施方案的等同物的含义和范围内。尽管本发明已结合其具体实施方案被描述,明显的是,许多替代形式、修改和变化对本领域技术人员将是明显的。因此,预期包括落入所附权利要求的精神和宽广范围内的所有此类替代形式、修改和变化。
参考文献
1.Schierling B,Dannemann N,Gabsalilow L,Wende W,Cathomen T,Pingoud A.(2012).A novel zinc-finger nuclease platform with a sequence-specific cleavage module.Nucleic Acids Res.2012Mar;40(6):2623-38.
2.Eisenschmidt K,Lanio T,Simoncsits A,Jeltsch A,Pingoud V,Wende W,Pingoud A.(2005).Developing a programmed restriction endonuclease for highly specific DNA cleavage.Nucleic Acids Res.2005Dec14;33(22):7039-47.
3.Kubo T,Kanno K,Ohba H,Rumiana B,Fujii M.(2004).Control of intracellular delivery of oligonucleotides by signal peptides and genetic expression in human cells.Nucleic Acids Symp Ser(Oxf).2004;(48):303-4.
4.Jinek M,Chylinski K,Fonfara I,Hauer M,Doudna JA,Charpentier E.(2012).A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.Science.2012Aug17;337(6096):816-21.
5.Hanic-Joyce PJ,Gray MW(1991)Accurate transcription of a plant mitochondrial gene in vitro.Mol Cell Biol11:2035-2039
6.Vainstein A,Marton I,Zuker A,Danziger M,Tzfira T(2011)Permanent genome modifications in plant cells by transient viral vectors.Trends in Biotechnology29:363-369
7.Gallois P,Marinho P(1995)Leaf disk transformation using Agrobacterium tumefaciens-expression of heterologous genes in tobacco.Methods Mol Biol49:39-48
8.Kochevenko A,Willmitzer L(2003)Chimeric RNA/DNA oligonucleotide-based site-specific modification of the tobacco acetolactate syntase gene.Plant Physiol132: 174-184
9.Marrs KA,Urioste JC(1995)Transient Gene Expression Analysis in Electroporated Maize Protoplasts.卷55,第133-145页.
10.Kotlo KU,Yehiely F,Efimova E,Harasty H,Hesabi B,Shchors K,Einat P,Rozen A,Berent E,Deiss LP(2003)Nrf2is an inhibitor of the Fas pathway as identified by Achilles'Heel Method,a new function-based approach to gene identification in human cells.Oncogene22:797-806
11.Huston JS,Levinson D,Mudgett-Hunter M,Tai MS,Novotny J,Margolies MN,Ridge RJ,Bruccoleri RE,Haber E,Crea R,等人(1988)Protein engineering of antibody binding sites:recovery of specific activity in an anti-digoxin single-chain Fv analogue produced in Escherichia coli.Proc Natl Acad Sci U S A85:5879-5883
12.Wu FH,Shen SC,Lee LY,Lee SH,Chan MT,Lin CS(2009)Tape-Arabidopsis Sandwich-a simpler Arabidopsis protoplast isolation method.Plant Methods5:16.
13.Antonelli NM,Stadler J(1989)Chemical methods for direct gene transfer to maize protoplasts:I.Efficient transient expression after treatment with the polycation Polybrene Maize News letter63:21-22
14.Sheen J(2001)Signal transduction in maize and Arabidopsis mesophyll protoplasts.Plant Physiol127:1466-1475
15.Gordon-Kamm WJ,Spencer TM,Mangano ML,Adams TR,Daines RJ,Start WG,O'Brien JV,Chambers SA,Adams WR,Jr.,Willetts NG,Rice TB,Mackey CJ,Krueger RW,Kausch AP,Lemaux PG(1990)Transformation of Maize Cells and Regeneration of Fertile Transgenic Plants.Plant Cell2:603-618.


























































































































用于修饰预定的靶核酸序列的组合物和方法.pdf_第1页
第1页 / 共217页
用于修饰预定的靶核酸序列的组合物和方法.pdf_第2页
第2页 / 共217页
用于修饰预定的靶核酸序列的组合物和方法.pdf_第3页
第3页 / 共217页
点击查看更多>>
资源描述

《用于修饰预定的靶核酸序列的组合物和方法.pdf》由会员分享,可在线阅读,更多相关《用于修饰预定的靶核酸序列的组合物和方法.pdf(217页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN104080462A43申请公布日20141001CN104080462A21申请号201280062262X22申请日2012121661/576,42320111216USA61K31/7105200601A61K48/00200601A61K31/711200601A61K31/7115200601A61K31/712200601A61K31/7125200601A61K31/713200601C12N5/10200601C12N15/6220060171申请人塔尔盖特基因生物技术有限公司地址以色列黑费尔72发明人约尔摩西希博莱斯丹迈克尔温萨尔74专利代理机构北京安信方。

2、达知识产权代理有限公司11262代理人王思琪郑霞54发明名称用于修饰预定的靶核酸序列的组合物和方法57摘要本文提供了用于修饰预定的核酸序列的组合物和方法。提供了包含多肽部分和赋予特异性的核酸SCNA的可编程核蛋白分子复合物,其在靶细胞中体内组装,并能够与预定的靶核酸序列相互作用。可编程核蛋白分子复合物能够特异性修饰和/或编辑靶核酸序列内的靶位点,和/或修饰靶核酸序列的功能。30优先权数据85PCT国际申请进入国家阶段日2014061686PCT国际申请的申请数据PCT/IL2012/0505282012121687PCT国际申请的公布数据WO2013/088446EN2013062051INT。

3、CL权利要求书4页说明书69页序列表123页附图20页19中华人民共和国国家知识产权局12发明专利申请权利要求书4页说明书69页序列表123页附图20页10申请公布号CN104080462ACN104080462A1/4页21一种核蛋白组合物,所述核蛋白组合物用于修饰靶细胞中靶核酸序列中的预定的靶位点,所述组合物包括A编码嵌合多肽的多核苷酸分子,所述多肽包括I能够修饰所述靶位点的功能域,所述功能域缺乏特定的核酸结合位点;和II能够与赋予特异性的核酸相互作用的连接域,所述连接域缺乏特定的靶核酸结合位点;以及;B赋予特异性的核酸SCNA,所述赋予特异性的核酸SCNA包括I与所述靶位点侧翼的靶核酸区。

4、域互补的核苷酸序列;和II能够特异性附着至所述多肽的所述连接域的识别区域;由此,所述多肽和所述SCNA在所述靶细胞内的组装形成能够特异性在所述靶位点处修饰所述靶核酸的功能核蛋白复合物。2如权利要求1所述的组合物,其中所述功能域包含催化结构域。3如权利要求1所述的组合物,其中所述修饰所述靶核酸选自突变、缺失、插入、置换、结合、消化、双链断裂创建、产生切口、甲基化、乙酰化、连接、重组、螺旋解旋、化学修饰、标记、激活和失活。4如权利要求1所述的组合物,其中所述嵌合多肽还包括亚细胞定位结构域。5如权利要求1所述的组合物,其中所述SCNA包括选自由以下组成的组的核酸单链DNA、单链RNA、双链RNA、修。

5、饰的DNA、修饰的RNA、锁核酸LNA和肽核酸PNA或其组合。6如权利要求1所述的组合物,其中所述靶核酸为DNA。7如权利要求1所述的组合物,其中所述SCNA的所述识别区域包括选自由以下组成的组的化学修饰5端修饰、3端修饰、和内部修饰。8如权利要求7所述的组合物,其中所述化学修饰选自由以下组成的组核苷酸修饰、和非核苷酸部分的添加。9如权利要求8所述的组合物,其中所述非核苷酸部分选自生物素、荧光素、胺接头、寡肽、氨基烯丙基、染料分子、荧光团、地高辛、ACRYDITE、腺苷酸化物、叠氮化物、NHS酯、胆固醇基TEG、炔烃、可光裂解的生物素、硫醇、二硫醇。10如权利要求8所述的组合物,其中所述核苷酸。

6、修饰选自由以下组成的组磷酸酯、2氨基嘌呤、三聚体20、2,6二氨基嘌呤、5溴脱氧尿苷、脱氧尿苷、反向DT、双脱氧核苷酸、5甲基脱氧胞苷、脱氧肌苷、5硝基吲哚、2O甲基RNA碱基、ISODC、ISODG、氟修饰的碱基和硫代磷酸酯键。11如权利要求1所述的组合物,其中所述修饰和所述连接域之间的附着为选自以下的结合对蛋白蛋白;农杆菌VIRD2VIRD2结合蛋白;抗体抗原;单链抗体抗原相互作用;抗荧光素单链可变区片段抗体抗FAMSCFV荧光素;抗DIG单链可变区片段SCFV免疫球蛋白DIGSCFV地高辛DIG和IGG蛋白A。12如权利要求1所述的组合物,其中所述SCNA的所述识别区域包括能够特异性附着。

7、至所述嵌合蛋白的所述连接域的核苷酸基序。13如权利要求12所述的组合物,其中所述核苷酸基序和所述连接域之间的附着选自螺旋环螺旋与E盒结构域相互作用;单链DNA与VIRE2相互作用、STICKYC与DSDNA、病权利要求书CN104080462A2/4页3毒外壳蛋白与核酸、牛免疫缺陷病毒BIVTAT主要结合域与BIV反式作用反应元件TAR序列的环1相互作用;噬菌体PHI21蛋白与N利用NUT位点中的盒B环发夹结构相互作用;噬菌体P22N蛋白与所述N利用NUT位点中的盒B环发夹结构相互作用;和HIVREV蛋白与HIVREV反应元件RRE的茎IIB相互作用。14如权利要求12所述的组合物,其中所述连。

8、接域包括选自由以下组成的组的多肽农杆菌VIRD2蛋白、微小核糖核酸病毒VPG、拓扑异构酶、PHIX174噬菌体A蛋白、PHIXA蛋白,以及其任何变体。15一种用于通过可编程核蛋白分子复合物修饰靶核酸序列内的预定的靶位点的方法,所述方法包括以下步骤A将编码可编程嵌合多肽的核酸序列递送至宿主细胞,所述嵌合多肽包含I能够修饰所述靶位点的功能域,所述功能域缺乏特定的核酸结合位点;以及II能够与赋予特异性的核酸相互作用的连接域,所述连接域缺乏特定的靶核酸结合位点;B将赋予特异性的核酸SCNA分子或编码所述SCNA的核酸递送至所述宿主细胞,所述SCNA分子包括I与所述靶位点侧翼的靶核酸区域互补的核苷酸序列。

9、;以及II能够以高结合亲和力特异性附着至所述多肽的所述连接域的识别区域;其中所述多肽在包含所述SCNA的细胞中的表达使所述嵌合多肽能够附着至所述SCNA,形成有活性的编程的核蛋白复合物,从而将所述嵌合多肽靶向所述宿主细胞内的所述预定的靶核酸序列,使通过所述有活性的编程的核蛋白分子复合物修饰所述靶核酸序列的所述预定的靶位点成为可能。16如权利要求15所述的方法,其中所述靶核酸为DNA。17如权利要求16所述的方法,其中所述靶DNA为基因组DNA。18如权利要求17所述的方法,其中所述靶基因组DNA是真核起源的。19如权利要求15所述的方法,其中所述靶核酸序列是选自由以下组成的组的染色体外的核酸序。

10、列线粒体、叶绿体、造粉体和色质体。20如权利要求15所述的方法,其中所述靶核酸序列选自病毒核酸序列、原核核酸序列和合成的核酸序列。21如权利要求15所述的方法,其中所述修饰选自由以下组成的组突变、缺失、插入、置换、结合、消化、双链断裂创建、产生切口、甲基化、乙酰化、连接、重组、螺旋解旋、化学修饰、标记、激活和失活。22如权利要求15所述的方法,其中所述嵌合蛋白包括具有核酸功能修饰剂的蛋白部分,其中所述功能修饰选自由以下组成的组转录激活、转录失活、RNA转录本沉默、可变RNA剪接、染色质重排、细胞寄生物和病毒失活以及所述靶核酸序列的细胞定位或区室化中的变化。23如权利要求15所述的方法,其中所述。

11、SCNA包括选自由以下组成的组的核酸分子单链DNA、单链RNA、双链RNA、修饰的DNA、修饰的RNA、锁核酸LNA和肽核酸PNA或其组合。24如权利要求15所述的方法,其中所述SCNA与所述靶核酸之间的相互作用是通过选权利要求书CN104080462A3/4页4自由以下组成的组的碱基配对完全双螺旋碱基配对、部分双螺旋碱基配对、完全三螺旋碱基配对、部分三螺旋碱基配对、和通过所述配对形成的D环或支链的形式。25如权利要求15所述的方法,其中所述SCNA的所述识别区域包括选自由以下组成的组的修饰5端修饰、3端修饰、和内部修饰。26如权利要求25所述的方法,其中所述修饰选自由以下组成的组核苷酸修饰、。

12、生物素、荧光素、胺接头、寡肽、氨基烯丙基、染料分子、荧光团、地高辛、ACRYDITE、腺苷酸化物、叠氮化物、NHS酯、胆固醇基TEG、炔烃、可光裂解的生物素、硫醇、二硫醇、修饰的碱基、磷酸酯、2氨基嘌呤、三聚体20、2,6二氨基嘌呤、5溴脱氧尿苷、脱氧尿苷、反向DT、双脱氧核苷酸、5甲基脱氧胞苷、脱氧肌苷、5硝基吲哚、2O甲基RNA碱基、ISODC、ISODG、氟修饰的碱基和硫代磷酸酯键。27如权利要求25所述的方法,其中所述修饰和所述连接域之间的缔合为选自以下的结合对的相互作用蛋白蛋白、农杆菌VIRD2VIRD2结合蛋白、抗体抗原;单链抗体抗原、抗荧光素单链可变区片段抗体抗FAMSCFV荧光。

13、素;抗DIG单链可变区片段SCFV免疫球蛋白DIGSCFV地高辛DIG、和IGG蛋白A。28如权利要求15所述的方法,其中所述SCNA的所述识别区域包括能够与所述嵌合蛋白的所述连接域相互作用的核苷酸基序。29如权利要求28所述的方法,其中所述核苷酸基序和所述连接域之间的相互作用选自螺旋环螺旋与E盒结构域相互作用;单链DNA与VIRE2相互作用、STICKYC与DSDNA、病毒外壳蛋白与核酸、牛免疫缺陷病毒BIVTAT主要结合域与BIV反式作用反应元件TAR序列的环1相互作用;噬菌体PHI21蛋白与N利用NUT位点中的盒B环发夹结构相互作用;噬菌体P22N蛋白与N利用NUT位点中的盒B环发夹结构。

14、相互作用;HIVREV蛋白与HIVREV反应元件RRE的茎IIB相互作用、和农杆菌VIRD2右边界序列。30如权利要求28所述的方法,其中所述连接域包括选自由以下组成的组的多肽农杆菌VIRD2蛋白、微小核糖核酸病毒VPG、拓扑异构酶、PHIX174噬菌体A蛋白、PHIXA蛋白,以及其变体。31一种通过如权利要求15所述的方法形成的核蛋白复合物,其中所述蛋白部分的所述连接域和所述赋予特异性的核酸部分的所述识别区域之间的物理缔合在所述靶细胞内形成编程的功能复合物。32如权利要求31所述的核蛋白复合物,其中所述蛋白部分的所述连接域和所述赋予特异性的核酸部分之间的物理缔合为选自由以下组成的组的亲和相互。

15、作用配体受体、配体底物、氢键、范德华键、离子键和疏水相互作用。33一种宿主细胞,所述宿主细胞具有通过如权利要求15所述的方法创建的预定的靶位点中的预定的基因修饰。34如权利要求33所述的宿主细胞,所述宿主细胞选自由以下组成的组脊椎动物细胞、哺乳动物细胞、人细胞、动物细胞、植物细胞、无脊椎动物细胞、线虫细胞、昆虫细胞和干细胞。35一种转基因生物体或敲除生物体,所述转基因生物体或敲除生物体具有通过如权利要求15所述的方法形成的预定的基因修饰。36一种治疗生物体中的遗传疾病的方法,所述方法包括在所述生物体的细胞中表达权利要求书CN104080462A4/4页5如权利要求1所述的核蛋白可编程分子复合物。

16、。37一种宿主细胞,所述宿主细胞包括A多肽,所述多肽包括I能够修饰所述细胞中靶核酸序列中的靶位点的功能域,所述功能域缺乏特定的核酸结合位点;和II能够与赋予特异性的核酸相互作用的连接域,所述连接域缺乏特定的靶核酸结合位点;以及;B赋予特异性的核酸SCNA,所述赋予特异性的核酸SCNA包括I与所述靶位点侧翼的靶核酸区域互补的核苷酸序列;和II能够特异性附着至所述多肽的所述连接域的识别区域;由此,所述多肽和所述SCNA在所述宿主细胞内的组装形成能够在所述靶位点处特异性修饰所述靶核酸的功能核蛋白复合物。38如权利要求37所述的宿主细胞,所述宿主细胞选自由以下组成的组脊椎动物细胞、哺乳动物细胞、人细胞。

17、、动物细胞、植物细胞、无脊椎动物细胞、线虫细胞、昆虫细胞和干细胞。权利要求书CN104080462A1/69页6用于修饰预定的靶核酸序列的组合物和方法发明领域0001本发明涉及用于利用可编程分子复合物PROGRAMMABLEMOLECULARCOMPLEX靶向并修饰核酸序列的组合物和方法。0002发明背景0003生物学和医学中主要的感兴趣领域是基因组核苷酸序列的靶向改变。此类改变包括内源染色体核酸序列的插入、缺失和置换。过去他人进行尝试以通过不同的技术改变基因组序列。0004基因靶向GENETARGETING是用于基因组操作或基因组功能修饰的理想的生物技术工具。基因靶向可诱导可以涉及或可以不涉。

18、及编码序列的特定基因组位置中的改变。0005在基因靶向事件中,预先定义的内源基因或另一个预先定义的内源核酸序列,通过靶向的基因功能修饰被靶向用于裂解,导致缺失、突变、插入或置换,或被靶向用于化学修饰。相对于非靶向的转基因生物体生产UNTARGETEDTRANSGENICORGANISMPRODUTION,基因靶向的一个优势是修饰或缺失现有基因组序列而不插入外源DNA的可能性,或可选地,通过插入或置换将外源供体DNA放置在预先定义的基因座中的可能性。因此,能够操作序列而无多余序列SUPERFLUOUSSEQUENCE是有利的,因为多余序列是育种者、农民、消费者和监管机构不期望的,并且同时已提出了。

19、用于避免此类序列的许多技术,每一种技术都具有其自身的缺点。0006用于真核细胞中基因靶向的策略取决于两个细胞DSDNA断裂修复机制同源重组HR修复通路和非同源末端连接NHEJ修复通路。在NHEJ中,基因插入取决于可随机出现的例如,通过辐射或氧化损伤或由核酸酶诸如TALE核酸酶TALEN、大范围核酸酶或锌指核酸酶ZFN指导的DSDNA断裂的存在。HR可通过DSDNA断裂引起。在HR中,DSDNA断裂不是必需的,但如果位于重组位点附近则可提高效率。0007已进行了关于HR介导的基因靶向的大量研究,其在许多生物体诸如细菌、酵母和原始植物、苔藓中有益地运转良好。HR还被用于高等生物体诸如果蝇、小鼠和人。

20、类。HR在这些生物体中的比率为约106,且通过创建基因特异性DSB在辅助的HR中该比率可被提高至超过102。低比率的转化子是这些方法未在基因治疗或育种项目中盛行的一个原因。0008已提出了用于体内修饰核酸的多种技术并可被分为基于酶的方法或基于核苷酸的方法。一般而言,基于酶的方法使用DNA结合蛋白,其同时具有期望的催化活性和以与限制性内切酶相似的方式通过蛋白核酸相互作用结合期望的靶序列的能力。实例包括天然存在的或被工程化的稀有序列切割酶RARESEQUENCECUTTINGENZYME的大范围核酸酶、锌指核酸酶ZFN或包含与修饰的DNA结合域连接的FOKI核酸酶催化亚基并可切割每一个预定序列的转。

21、录激活因子样核酸酶TALEN。在ZFN中,结合域由折叠成专门的锌指结构域的氨基酸链组成。类似地,在TALEN中,源自转录因子的34个氨基酸重复折叠成巨大的DNA结合域。在基因靶向事件中,这些酶可裂解CLEAVE基因组DNA,以形成双链断裂DSB或创建可被两种修复通路非同源末端连接NHEJ或同源重组HR之一修复的切口NICK。NHEJ通路可潜在地导致特定突变、缺失、插入或置换事件。HR通路导致被靶向的序说明书CN104080462A2/69页7列被提供的供体序列置换。这些仅基于蛋白的方法的一个缺点是针对每个期望的靶序列设计和提供不同蛋白的长期和艰苦的必要性。其他缺点包括分别由ZFN和大范围核酸酶。

22、识别的某种程度上有限亚组的核酸三联体或序列。此外,即使是非常难以构建的六锌指ZFN也局限于仅18个核苷酸的结合位点,并且由于18个核苷酸在统计学上不足以赋予全基因组的序列空间中的序列特异性或复杂性,这些必须作为异二聚体被提供。此外,ZFN和TALEN的性质要求功能性筛选,并且即使是成功的核酸酶也可显示差的基因靶向效率。0009对于基于核苷酸的方法,将核酸提供至生物体,并且内源性加工通过非辅助的同源重组或将寡核苷酸整合到基因组引起DNA修复或基因靶向。这些核酸可使用病毒载体、质粒载体、TDNA载体和双链DNA寡核苷酸来提供。称为三螺旋形成寡核苷酸TRIPLEHELIXFORMINGOLIGONU。

23、CLEOTIDE,TFO的较短核苷酸被用于基于寡核苷酸的错配修复,并可实现点突变的修复或直至4个核苷酸的修复。存在这些方法也依赖于DSB的形成的充足证据,该DSB的形成可以是随机的、随机诱导的或由通过共价结合至提供的核酸的酶或反应性化学物质的酶促或化学修饰局部诱导的。DNA中的双链断裂DSB是HR必需的。特定的预先存在的DSB不是必需的,但提高了效率。DNA中的天然断裂随机分布并且是罕见的,并因此效率,因此肯定是低的106。DSB可通过以遗传毒性为代价来提高效率的电离辐射或氧化化学物质被随机诱导。在该系统的改进中,过去使用由核酸末端的化学修饰辅助的非酶促DNA裂解进行了辅助的HR或修复。这些修。

24、饰包括EDTAFE或可光活化的补骨脂素,并可被用于当被体外掺入以形成三螺旋时产生DSDNA中的序列特异性DSB。另外的方法使用了源自单链DNASSDNA的寡核苷酸、或修饰的寡核苷酸,也被称为“小合成单链寡脱氧核苷酸ODN或SSODN。然而,尽管基于寡核苷酸的方法可导致哺乳动物细胞基因组中相对有效的点突变,但这些方法受限于该编辑模式。0010寡核苷酸酶缀合物是两种方法的组合,包括在将缀合物提供给生物体之前体外共价结合至催化酶的核酸。与仅酶的方法相比,这些方法是模块化的,允许制备针对多种靶序列的缀合物。寡核苷酸酶缀合物的主要缺点是,它们在体内不能自组装,从而严重地限制了其用于体内编辑基因组的有效性。

25、。本领域已知的此类系统的另外的关键缺点是,在这些缀合物的使用中,酶组分作为单体是有活性的,并因此酶与核酸的任何结合,特异性的或非特异性的,将导致裂解。此类非特异性裂解严重降低此类系统的安全性,因为它们可在不希望的位置引入不希望的改变/突变。0011非缀合的寡核苷酸蛋白系统也已被用于裂解SSDNA底物。在该系统中,在其识别位点外裂解的IIS型限制性内切酶FOKI与以下在体外联合使用重建FOKI识别序列的形成发夹结构的寡核苷酸,创建待被裂解的由寡核苷酸引发PRIME的DNA的双链部分的POLIK酶和DNTP。在该系统中,不仅期望的序列被裂解,而且任何天然存在的FOKI位点将被识别,且邻近其的序列将。

26、被裂解。由于FOKI具有仅5个核苷酸识别位点,这暗示了全基因组中存在数以千计的潜在裂解位点,使得该系统对于基因组编辑是无用的。0012与其中HR可被用于基因靶向的其他生物体相比,在高等植物和人中,NHEJ通路是主要的内源性机制。植物DNA修复机制不允许在供体和染色体DNA之间的有效的HR。事实上,已广泛接受的是,通常由农杆菌介导的遗传转化递送的外源供体DNA分子,被植物的非同源末端连接NHEJ通路识别,其导致外源供体DNA分子在整个宿主基因组中的随机整合。因此,大多数现有植物转化方法都不被认为是基因靶向的,因为在这些方法中,序列随说明书CN104080462A3/69页8机插入基因组,并且作为。

27、不良副作用,可破坏现有基因,并且通常以多拷贝插入,或包含不期望的质粒、标志物或细菌序列残余。0013可用于辅助的HR和定向的NHEJ的用于诱导特定DSDNA断裂的方法,利用体内核酸酶的表达。这些核酸酶包括稀有序列切割核酸酶稀有切割物CUTTER诸如源自归巢内切核酸酶的大范围核酸酶或嵌合大范围核酸酶、定制的重组锌指核酸酶ZFN、或定制的重组TAL效应器核酸酶。在这些方法中,裂解的靶位点的识别,由天然识别特定核苷酸序列或被具体工程化以识别特定核苷酸序列的蛋白结构域或亚基的相互作用来实现,并且不基于多核苷酸多核苷酸杂交或碱基配对。例如,锌指核酸酶是被构建作为FOKI核酸酶亚基和合成的锌指ZF结构域之。

28、间的杂合体的嵌合蛋白。锌指核酸酶不包含核酸组分。ZFN旨在通过几个ZF基序的组合特异性识别核苷酸三联体。由于其仅识别有限亚组的核苷酸三联体的固有能力,未能够构建识别所有序列的ZFN。使用ZFN异二聚体,借以作为单体是无活性的两个不同的ZFN被伴随递送,具有对特异性的积极影响,尽管这使设计进一步复杂化,并降低了靶序列的选择。ZFN还被用于创建既用于基因的激活又用于基因的抑制的人工转录因子,用于改变基因调控。然而,此类基于锌指的转录因子受限于识别位点的长度并受限于几个特定三核苷酸基序,不能结合所有序列,并且因此不能被用于激活或抑制所有可能的基因。0014例如,SCHIERLING等人公开了具有特定。

29、序列裂解模块的新颖的锌指核酸酶平台。例如,EISENSCHMIDTK等人公开了用于高度特异性DNA裂解的编程的限制性内切核酸酶。例如,WO2006/027099涉及具有可编程特异性的酶缀合物,其以高度特异性方式与DNA反应。0015例如,KUBO等人公开了通过信号肽和遗传表达控制寡核苷酸在人细胞中的细胞内递送。JINEK等人公开了适应性细菌免疫中可编程的双RNA引导的DNA内切核酸酶PROGRAMMABLEDUALRNAGUIDEDDNAENDONUCLEASE。0016例如,WO2012/129373涉及用于制备复杂的转基因性状基因座的方法。0017然而,本领域对允许体内特异性靶向和修饰靶核。

30、酸序列的安全、可靠、模块化和廉价的组合物和方法仍然存在未满足的需要。0018发明概述0019本发明提供了用于在体内或体外靶向和修饰核酸序列的组合物和方法。根据一些实施方案,本文提供的新的复合的可编程分子复合物核蛋白复合物NUCLEOPROTEINCOMPLEX被用于精确、可靠和成本有效地编辑或功能修饰预定的核酸序列靶。0020在一些实施方案中,本文公开的分子复合物被用于基因靶向和/或靶向基因功能修饰,包括,但不限于,在靶核酸的一条或两条链中产生断裂以引发基因突变、缺失、基因置换和外源核酸分子的整合,或用于其化学、构象或生物功能的修饰。0021根据一些实施方案,本文公开的分子复合物包括A嵌合多肽。

31、其可由多核苷酸分子编码,该嵌合多肽包含I能够修饰靶位点的功能效应器域FD;和II连接域LD;以及B赋予特异性的核酸SPECICITYCONFERRINGNUCLEICACID,SCNA,该SCNA包括I与靶位点侧翼的靶核酸区域互补的核苷酸序列;和II能够特异性附着至多肽的连接域的识别区域;从而,多肽和SCNA在宿主/靶细胞中的组装形成能够在靶位点特异性修饰靶核酸的功能性、可编程的核蛋白分子复合物。说明书CN104080462A4/69页90022在一些实施方案中,本发明提供了有利的组合物,该组合物包含蛋白效应器模块或编码蛋白效应器模块的核酸分子和编程/靶向核酸模块PROGRAMMING/TAR。

32、GETINGNUCLEICACIDMODULE,其可体内自组装为特异性的、有活性的修饰核酸的分子核蛋白复合物。在该复合物中,在本文中也被称为“编程部分”、“编程寡核苷酸”或“赋予特异性的核酸”SCNA的核酸,通过所述赋予特异性的核酸和靶核酸的碱基配对提供了分子复合物对靶核酸的特异性和结合能力。该复合物的蛋白效应器组分或模块旨在通过附着至寡核苷酸的化学部分、寡核苷酸上的一个或多个核苷酸的修饰、寡核苷酸上的特定识别序列、等,或其组合,结合/连接/附着至决定特异性的核酸。有利地,本文公开的组合物和方法赋予了对宽范围的期望的靶序列的较高特异性,是较少遗传毒性的,在其组装中是模块化的,可靠的,利用单个平。

33、台而无需定制,对在专门的核心设备之外独立使用是实用的,并且具有较短的开发时间帧和降低的成本。0023蛋白模块的活性可导致靶核酸序列的修饰和/或靶核酸的功能修饰。靶核酸修饰可包括,但不限于突变、缺失、插入、置换、结合、消化、产生切口NICKING、甲基化、乙酰化、连接LIGATION、重组、螺旋解旋、化学修饰、标记、活化和失活或其任何组合。靶核酸功能修饰可导致,但不限于在转录激活、转录失活、可变剪接、染色质重排、病原体失活、病毒失活中的变化、细胞定位、核酸的区室化中的变化,等,或其组合。由蛋白部分产生的任何编辑作用或其他修饰通过其与赋予特异性的核酸的连接被定向或指导至预期的预先定义的特定靶核酸。。

34、有利地,各单个类型的蛋白组分的使用可与决定特异性的核酸的核苷酸序列的非限制的分类伴随或单独组合,以允许对期望的靶核酸的不同部分有类似作用。这允许通过提供用于修饰预定的核酸序列靶的通用的、可靠的和成本有效的方法和组合物克服现有技术方法的缺点。因此,如果被用于一种受体RECEPTACLE或生物体,对于决定特异性的核酸类型的任何组合或多样性,仅一种类型的蛋白待被提供。这还包括伴随使用不止一种类型的蛋白组分与不止一种类型的决定特异性的核酸的可能性。0024根据一些实施方案,本文公开的复合物是模块化的,并可在体内或体外的靶细胞内自组装,允许每次伴随地提供一种类型的蛋白部分和一个或多个决定特异性的寡核苷酸。

35、。此外,在一些实施方案中,可将蛋白组分递送至期望的细胞并在体内表达,等待任何适合的SCNA在后来的时间的递送。在一些实施方案中,蛋白组分和SCNA可同时或基本上同时被递送。因此,蛋白组分和SCNA的组合,优选地在期望的靶细胞内的组合,可实现特定基因组双链断裂DSB的诱导,或体内任何其他期望的核酸修饰。本发明的方法不限于将点突变引入靶核酸,因为分子复合物可靶向任何核酸序列或序列对,在非常靠近它们的位置处切割/限制RESTRICT/裂解,并由此缺失小的或大的核酸部分,或切割/限制/裂解序列,以启动任何核酸序列的去除或插入,或置换。0025有利地,本发明在其实施方案中首次公开了蛋白组分的体内表达,以。

36、及其通过体内自组装结合/附着至SCNA以体内形成分子复合物,而无需蛋白部分和靶向核酸之间事先的共价/化学连接。根据本发明的实施方案,与本领域已知的基于寡核苷酸的系统相比,结合到蛋白的SCNA并非旨在用作供体,而是作为赋予特异性的部分,并且不会成为修饰的核酸的部分。此外,在本发明的一些实施方案中,SCNA可以以引起单次递送事件的分子复合物的所有组分的组装的方式在体内表达。此外,根据一些实施方案,效应器蛋白可被设计仅当其二聚化时是有活性的即,其必须形成二聚体才是有活性的,由此可控制二聚化以使得说明书CN104080462A5/69页10活性二聚体仅可当其被SCNA靶向/编程并结合至其靶位点时形成,。

37、例如,当二聚体的单体配偶体蛋白之间的分子距离足够精确时形成。因此,有利地,分子复合物仅在其预期的靶位点被活化,从而提高特异性和可靠性。根据另外的实施方案,可表达一种蛋白组分以形成/产生同源二聚体,每一个由赋予特异性的不同寡核苷酸编程/靶向。另外,作为本领域已知的用于体内蛋白表达的病毒表达系统,由于大小的约束,通常限于产生一种蛋白,并且由于交叉保护通常专用于类似的病毒,因此,对于该递送模式,使用一个蛋白组分具有关键优势。此外,与本领域已知的具有有限亚组的识别序列的其他方法诸如ZFN和大范围核酸酶相比,本文公开的编程寡核苷酸SCNA,具有无限的序列库ANINNITEREPERTOIREOFSEQU。

38、ENCES,因此在高度复杂的基因组中令人信服地实现极端序列特异性。此外,由于许多编程寡核苷酸与单个蛋白效应器部分伴随地被提供,同时修饰不止一个靶是可能的,提供了相对于本领域已知的方法的另外的优势。例如,这可有助于快速敲除多个基因,或用于在不同的位置插入多个不同的性状,或用于用一个供体核苷酸标签给几个不同的位置加标签。0026根据一些实施方案,由于非编程的蛋白组分即未附着/连接到编程寡核苷酸的蛋白对靶核酸没有亲和力或具有非常低的亲和力,有利地获得了改善的特异性和安全性和降低的遗传毒性。如以上详述的,蛋白组分的效应器或催化结构域仅当二聚化时是有活性的,由此至少两个编程寡核苷酸SCNA必须结合靶侧翼。

39、序列以引起蛋白二聚化和激活。两个足够长的编程寡核苷酸可通过创建与结合位点的广泛互补性给予高度复杂的基因组中需要的非常高的理论特异性。由于非编程的表达的蛋白对靶核酸不具有亲和力,其不会结合和/或修饰靶核酸。因此,在其中例如将编程寡核苷酸单独递送/提供到靶细胞其已表达非编程的蛋白组分的应用中,或在其中将寡核苷酸从靶细胞耗尽例如,通过稀释或降解的条件下,不可能发生非特异性裂解,从而提高了安全性并减少遗传毒性。0027因此,根据本发明的实施方案,可具体地并以可编程的方式使用定向的非同源末端连接NHEJ和辅助的同源重组HR两者,以实现以下的一种或多种00281突变DNA序列通过在DNA序列内部裂解、创建。

40、双链断裂DSB、在某种程度上被内源核酸酶降解、并通过内源NHEJDNA修复机制再连接以创建DNA的符合读框的INFRAME缺失和/或移码FRAMESHIFT突变。相对于植物中的TDNA或转座子插入系,缺失或突变内源基因的这种方法不会留下外源DNA并且根据一些定义植物可被称为非转基因植物。在NHEJ中,还可将一个或多个核苷酸以仍未知的内源性机制加入DSB中,基本上实现移码或突变的相同效应。00292缺失一段DNA序列通过裂解其侧翼的两个序列、通过内源性NHEJDNA修复机制再连接,或通过辅助的HR,通过在待缺失的序列内或附近裂解并提供供体DNA,随后将该供体DNA重组进入靶,并且该供体DNA含有。

41、靶中待被缺失的序列的侧翼序列。00303将供体核酸插入DSB通过裂解靶核酸并提供通过NHEJ机制直接被连接到缺口GAP的供体DNA,或优选地提供与待被重组的缺口的末端具有同源性并通过辅助的HR被连接入缺口的供体。00314置换靶核酸序列通过裂解其侧翼序列,并提供通过NHEJ待被插入、待连接在靶点侧翼序列内的供体核酸,或优选地通过HR重组并连接的供体核酸,通过在供体的末端上添加与靶核酸或其侧翼序列相似的序列。说明书CN104080462A106/69页110032根据一些实施方案,并且不希望被理论或机制束缚,本文公开的组合物和方法的优势包括创建通用的酶复合物构建方案,其可靶向无限选择的序列。在蛋。

42、白组分被优化用于特定目的例如,DSDNA裂解之后,该相同的蛋白与无限选择的编程核酸SCNA序列一起被使用。因此,待被影响的靶序列的多样性通过SCNA的设计来实现,而没有蛋白重新设计和优化的困难和费时的必要性,所述蛋白重新设计和优化的困难和费时的必要性是本领域中已知的其他方法诸如TALEN、ZFN和大范围核酸酶中固有的,其中蛋白自身必须被改变和调整以用于每个靶序列。设计和制备合成的SCNA是相对简单、快速且相对便宜的。在本发明的一些实施方案中,绕过将化学合成的SCNA递送至细胞的必要性,在体内产生SCNA也是可能的。此外,SCNA可被设计成针对几乎任何期望的靶序列的碱基对,并因此,可将分子复合物。

43、定向到几乎任何靶序列。此外,几个靶序列可在相同的细胞中伴随使用。例如,在需要不止一个裂解位点的编辑功能诸如缺失或置换核酸的特定段中,通过简单地提供四种不同的SCNA和一个蛋白部分。0033根据一些实施方案,因此,提供了用于修饰靶细胞中的靶核酸序列中的预定的靶位点的核蛋白组合物,该组合物包括编码多肽的多核苷酸分子,或多肽,所述多肽包括I能够修饰所述靶位点的功能效应器域FD,该功能域缺乏特定核酸结合位点;和II能够与赋予特异性的核酸SCNA相互作用的连接域LD,其中连接域缺乏特定靶核酸结合位点;以及;B赋予特异性的核酸SCNA或编码SCNA的核酸,SCNA包括I与靶位点侧翼的靶核酸区域互补的核苷酸。

44、序列;和II能够以高结合亲和力特异性附着至多肽的连接域的识别区域;由此多肽和SCNA在靶细胞内的组装形成能够在靶位点特异性修饰所述靶核酸的功能核蛋白复合物。0034在一些实施方案中,功能域包括催化结构域。在一些实施方案中,多肽还包含亚细胞定位结构域。0035在一些实施方案中,修饰靶核酸选自突变、缺失、插入、置换、结合、消化、双链断裂创建DOUBLESTRANDBREAKCREATION、产生切口、甲基化、乙酰化、连接、重组、螺旋解旋、化学修饰、标记、活化和失活。0036根据一些实施方案,SCNA包括选自由以下组成的组的核酸分子单链DNA、单链RNA、双链RNA、修饰的DNA、修饰的RNA、锁核。

45、酸LOCKEDNUCLEICACID,LNA和肽核酸PNA或其组合。0037在一些实施方案中,SCNA的识别区域包括选自以下的修饰5端修饰、3端修饰、和内部修饰。在一些实施方案中,化学修饰选自由以下组成的组核苷酸修饰,和非核苷酸部分的添加。在一些实施方案中,非核苷酸部分选自生物素、荧光素、胺接头AMINELINKER、寡肽、氨基烯丙基AMINOALLYL、染料分子、荧光团、地高辛、ACRYDITE、腺苷酸化物ADENYLATION、叠氮化物、NHS酯、胆固醇基TEG、炔烃、可光裂解的生物素、硫醇、二硫醇。在一些实施方案中,核苷酸修饰选自由以下组成的组磷酸酯、2氨基嘌呤、三聚体20TRIMER2。

46、0、2,6二氨基嘌呤、5溴脱氧尿苷5BROMODEOXIURIDINE、脱氧尿苷DEOXIURIDINE、反向DT、双脱氧核苷酸DIDEOXINUCLEOTIDES、5甲基脱氧胞苷、脱氧肌苷、5硝基吲哚、2O甲基RNA碱基、ISODC、ISODG、氟修饰的碱基和硫代磷酸酯键。在一些实施方案中,修饰选自由以下组成的组核苷酸修饰、生物素、荧光素、胺接头、寡肽、氨基烯丙基、染料分子、荧光团、地高辛、ACRYDITE、腺苷酸化物、叠氮化物、NHS酯、胆说明书CN104080462A117/69页12固醇基TEG、炔烃、可光裂解的生物素、硫醇、二硫醇、修饰的碱基、磷酸酯、2氨基嘌呤、三聚体20、2,6二。

47、氨基嘌呤、5溴脱氧尿苷、脱氧尿苷、反向DT、双脱氧核苷酸、5甲基脱氧胞苷、脱氧肌苷、5硝基吲哚、2O甲基RNA碱基、ISODC、ISODG、氟修饰的碱基和硫代磷酸酯键,和通过其与特定核苷酸序列的相互作用共价结合的蛋白。在一些实施方案中,通过其与特定核苷酸序列的相互作用共价结合的蛋白可选自,但不限于农杆菌VIRD2蛋白、微小核糖核酸病毒VPG、拓扑异构酶、PHIX174噬菌体A蛋白、PHIXA蛋白,以及其任何变体。0038在一些实施方案中,SCNA上的修饰和连接域之间的附着/结合/缔合由从选自但不限于以下的结合对的非共价相互作用中选择的结合对引起生物素亲和素;生物素链霉亲和素;生物素修饰形式的亲。

48、和素;蛋白蛋白;蛋白核酸相互作用;配体受体相互作用;配体底物相互作用;抗体抗原;单链抗体抗原;抗体或单链抗体半抗原;激素激素结合蛋白;受体激动剂;受体受体拮抗剂;IGG蛋白A;酶酶辅因子;酶酶抑制剂;单链DNAVIRE2;STICKYCDSDNA;RISCRNA;病毒外壳蛋白核酸;抗荧光素单链可变区片段抗体抗FAMSCFV荧光素;抗DIG单链可变区片段SCFV免疫球蛋白DIGSCFV地高辛DIG和农杆菌VIRD2VIRD2结合蛋白;以及其任何变体。0039在一些实施方案中,SCNA的识别区域包括能够特异性附着/结合/缔合至嵌合蛋白的连接域的核苷酸基序。在一些实施方案中,核苷酸基序和连接域之间的。

49、附着/缔合/结合选自但不限于锌指蛋白锌指基序;限制性内切酶识别域限制性内切酶识别序列;转录因子的DNA结合域DNA基序;阻抑物操纵基因;亮氨酸拉链启动子;螺旋环螺旋E盒结构域;包括富含精氨酸的基序结构域的RNA结合基序、蛋白结构域、RNA识别基序RRM结构域、K同源结构域、双链RNA结合基序、RNA结合锌指、和靶向RNA的酶相关的特定RNA序列;HIVREV蛋白HIVREV反应元件RRE的茎IIB;牛免疫缺陷病毒BIVTAT主要结合域BIV反式作用反应元件TAR序列的环1;噬菌体、PHI21、和P22N蛋白在其各自RNA中的N利用NUTILIZATION,NUT位点中的盒B环发夹结构。0040根据一些实施方案,提供了用于通过可编程的核蛋白分子复合物修饰靶核酸序列内的预定的靶位点的方法,该方法包括以下步骤A将编码可编程的嵌合蛋白多肽或蛋白多肽的核酸序列递送至宿主细胞;B将赋予特异性的核酸SCNA分子,或编码SCNA的核酸递送至所述宿主细胞;C所述嵌合蛋白与SCNA结合,从而将嵌合蛋白靶向宿主细胞内的预定的靶核酸序列,以形成有活性的编程的核蛋白复合物ACTIVEPROGRAMMEDNUCLEOPROTEINCOMPLEX;以及D允许通过所述有活性的编程的核蛋白分子复合物修饰靶核酸序列的预定的靶位点。0041在一些实施方案中,提供了用于通过可编程的核蛋白分子。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 人类生活必需 > 医学或兽医学;卫生学


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1