《用于修饰预定的靶核酸序列的组合物和方法.pdf》由会员分享,可在线阅读,更多相关《用于修饰预定的靶核酸序列的组合物和方法.pdf(217页珍藏版)》请在专利查询网上搜索。
1、10申请公布号CN104080462A43申请公布日20141001CN104080462A21申请号201280062262X22申请日2012121661/576,42320111216USA61K31/7105200601A61K48/00200601A61K31/711200601A61K31/7115200601A61K31/712200601A61K31/7125200601A61K31/713200601C12N5/10200601C12N15/6220060171申请人塔尔盖特基因生物技术有限公司地址以色列黑费尔72发明人约尔摩西希博莱斯丹迈克尔温萨尔74专利代理机构北京安信方。
2、达知识产权代理有限公司11262代理人王思琪郑霞54发明名称用于修饰预定的靶核酸序列的组合物和方法57摘要本文提供了用于修饰预定的核酸序列的组合物和方法。提供了包含多肽部分和赋予特异性的核酸SCNA的可编程核蛋白分子复合物,其在靶细胞中体内组装,并能够与预定的靶核酸序列相互作用。可编程核蛋白分子复合物能够特异性修饰和/或编辑靶核酸序列内的靶位点,和/或修饰靶核酸序列的功能。30优先权数据85PCT国际申请进入国家阶段日2014061686PCT国际申请的申请数据PCT/IL2012/0505282012121687PCT国际申请的公布数据WO2013/088446EN2013062051INT。
3、CL权利要求书4页说明书69页序列表123页附图20页19中华人民共和国国家知识产权局12发明专利申请权利要求书4页说明书69页序列表123页附图20页10申请公布号CN104080462ACN104080462A1/4页21一种核蛋白组合物,所述核蛋白组合物用于修饰靶细胞中靶核酸序列中的预定的靶位点,所述组合物包括A编码嵌合多肽的多核苷酸分子,所述多肽包括I能够修饰所述靶位点的功能域,所述功能域缺乏特定的核酸结合位点;和II能够与赋予特异性的核酸相互作用的连接域,所述连接域缺乏特定的靶核酸结合位点;以及;B赋予特异性的核酸SCNA,所述赋予特异性的核酸SCNA包括I与所述靶位点侧翼的靶核酸区。
4、域互补的核苷酸序列;和II能够特异性附着至所述多肽的所述连接域的识别区域;由此,所述多肽和所述SCNA在所述靶细胞内的组装形成能够特异性在所述靶位点处修饰所述靶核酸的功能核蛋白复合物。2如权利要求1所述的组合物,其中所述功能域包含催化结构域。3如权利要求1所述的组合物,其中所述修饰所述靶核酸选自突变、缺失、插入、置换、结合、消化、双链断裂创建、产生切口、甲基化、乙酰化、连接、重组、螺旋解旋、化学修饰、标记、激活和失活。4如权利要求1所述的组合物,其中所述嵌合多肽还包括亚细胞定位结构域。5如权利要求1所述的组合物,其中所述SCNA包括选自由以下组成的组的核酸单链DNA、单链RNA、双链RNA、修。
5、饰的DNA、修饰的RNA、锁核酸LNA和肽核酸PNA或其组合。6如权利要求1所述的组合物,其中所述靶核酸为DNA。7如权利要求1所述的组合物,其中所述SCNA的所述识别区域包括选自由以下组成的组的化学修饰5端修饰、3端修饰、和内部修饰。8如权利要求7所述的组合物,其中所述化学修饰选自由以下组成的组核苷酸修饰、和非核苷酸部分的添加。9如权利要求8所述的组合物,其中所述非核苷酸部分选自生物素、荧光素、胺接头、寡肽、氨基烯丙基、染料分子、荧光团、地高辛、ACRYDITE、腺苷酸化物、叠氮化物、NHS酯、胆固醇基TEG、炔烃、可光裂解的生物素、硫醇、二硫醇。10如权利要求8所述的组合物,其中所述核苷酸。
6、修饰选自由以下组成的组磷酸酯、2氨基嘌呤、三聚体20、2,6二氨基嘌呤、5溴脱氧尿苷、脱氧尿苷、反向DT、双脱氧核苷酸、5甲基脱氧胞苷、脱氧肌苷、5硝基吲哚、2O甲基RNA碱基、ISODC、ISODG、氟修饰的碱基和硫代磷酸酯键。11如权利要求1所述的组合物,其中所述修饰和所述连接域之间的附着为选自以下的结合对蛋白蛋白;农杆菌VIRD2VIRD2结合蛋白;抗体抗原;单链抗体抗原相互作用;抗荧光素单链可变区片段抗体抗FAMSCFV荧光素;抗DIG单链可变区片段SCFV免疫球蛋白DIGSCFV地高辛DIG和IGG蛋白A。12如权利要求1所述的组合物,其中所述SCNA的所述识别区域包括能够特异性附着。
7、至所述嵌合蛋白的所述连接域的核苷酸基序。13如权利要求12所述的组合物,其中所述核苷酸基序和所述连接域之间的附着选自螺旋环螺旋与E盒结构域相互作用;单链DNA与VIRE2相互作用、STICKYC与DSDNA、病权利要求书CN104080462A2/4页3毒外壳蛋白与核酸、牛免疫缺陷病毒BIVTAT主要结合域与BIV反式作用反应元件TAR序列的环1相互作用;噬菌体PHI21蛋白与N利用NUT位点中的盒B环发夹结构相互作用;噬菌体P22N蛋白与所述N利用NUT位点中的盒B环发夹结构相互作用;和HIVREV蛋白与HIVREV反应元件RRE的茎IIB相互作用。14如权利要求12所述的组合物,其中所述连。
8、接域包括选自由以下组成的组的多肽农杆菌VIRD2蛋白、微小核糖核酸病毒VPG、拓扑异构酶、PHIX174噬菌体A蛋白、PHIXA蛋白,以及其任何变体。15一种用于通过可编程核蛋白分子复合物修饰靶核酸序列内的预定的靶位点的方法,所述方法包括以下步骤A将编码可编程嵌合多肽的核酸序列递送至宿主细胞,所述嵌合多肽包含I能够修饰所述靶位点的功能域,所述功能域缺乏特定的核酸结合位点;以及II能够与赋予特异性的核酸相互作用的连接域,所述连接域缺乏特定的靶核酸结合位点;B将赋予特异性的核酸SCNA分子或编码所述SCNA的核酸递送至所述宿主细胞,所述SCNA分子包括I与所述靶位点侧翼的靶核酸区域互补的核苷酸序列。
9、;以及II能够以高结合亲和力特异性附着至所述多肽的所述连接域的识别区域;其中所述多肽在包含所述SCNA的细胞中的表达使所述嵌合多肽能够附着至所述SCNA,形成有活性的编程的核蛋白复合物,从而将所述嵌合多肽靶向所述宿主细胞内的所述预定的靶核酸序列,使通过所述有活性的编程的核蛋白分子复合物修饰所述靶核酸序列的所述预定的靶位点成为可能。16如权利要求15所述的方法,其中所述靶核酸为DNA。17如权利要求16所述的方法,其中所述靶DNA为基因组DNA。18如权利要求17所述的方法,其中所述靶基因组DNA是真核起源的。19如权利要求15所述的方法,其中所述靶核酸序列是选自由以下组成的组的染色体外的核酸序。
10、列线粒体、叶绿体、造粉体和色质体。20如权利要求15所述的方法,其中所述靶核酸序列选自病毒核酸序列、原核核酸序列和合成的核酸序列。21如权利要求15所述的方法,其中所述修饰选自由以下组成的组突变、缺失、插入、置换、结合、消化、双链断裂创建、产生切口、甲基化、乙酰化、连接、重组、螺旋解旋、化学修饰、标记、激活和失活。22如权利要求15所述的方法,其中所述嵌合蛋白包括具有核酸功能修饰剂的蛋白部分,其中所述功能修饰选自由以下组成的组转录激活、转录失活、RNA转录本沉默、可变RNA剪接、染色质重排、细胞寄生物和病毒失活以及所述靶核酸序列的细胞定位或区室化中的变化。23如权利要求15所述的方法,其中所述。
11、SCNA包括选自由以下组成的组的核酸分子单链DNA、单链RNA、双链RNA、修饰的DNA、修饰的RNA、锁核酸LNA和肽核酸PNA或其组合。24如权利要求15所述的方法,其中所述SCNA与所述靶核酸之间的相互作用是通过选权利要求书CN104080462A3/4页4自由以下组成的组的碱基配对完全双螺旋碱基配对、部分双螺旋碱基配对、完全三螺旋碱基配对、部分三螺旋碱基配对、和通过所述配对形成的D环或支链的形式。25如权利要求15所述的方法,其中所述SCNA的所述识别区域包括选自由以下组成的组的修饰5端修饰、3端修饰、和内部修饰。26如权利要求25所述的方法,其中所述修饰选自由以下组成的组核苷酸修饰、。
12、生物素、荧光素、胺接头、寡肽、氨基烯丙基、染料分子、荧光团、地高辛、ACRYDITE、腺苷酸化物、叠氮化物、NHS酯、胆固醇基TEG、炔烃、可光裂解的生物素、硫醇、二硫醇、修饰的碱基、磷酸酯、2氨基嘌呤、三聚体20、2,6二氨基嘌呤、5溴脱氧尿苷、脱氧尿苷、反向DT、双脱氧核苷酸、5甲基脱氧胞苷、脱氧肌苷、5硝基吲哚、2O甲基RNA碱基、ISODC、ISODG、氟修饰的碱基和硫代磷酸酯键。27如权利要求25所述的方法,其中所述修饰和所述连接域之间的缔合为选自以下的结合对的相互作用蛋白蛋白、农杆菌VIRD2VIRD2结合蛋白、抗体抗原;单链抗体抗原、抗荧光素单链可变区片段抗体抗FAMSCFV荧光。
13、素;抗DIG单链可变区片段SCFV免疫球蛋白DIGSCFV地高辛DIG、和IGG蛋白A。28如权利要求15所述的方法,其中所述SCNA的所述识别区域包括能够与所述嵌合蛋白的所述连接域相互作用的核苷酸基序。29如权利要求28所述的方法,其中所述核苷酸基序和所述连接域之间的相互作用选自螺旋环螺旋与E盒结构域相互作用;单链DNA与VIRE2相互作用、STICKYC与DSDNA、病毒外壳蛋白与核酸、牛免疫缺陷病毒BIVTAT主要结合域与BIV反式作用反应元件TAR序列的环1相互作用;噬菌体PHI21蛋白与N利用NUT位点中的盒B环发夹结构相互作用;噬菌体P22N蛋白与N利用NUT位点中的盒B环发夹结构。
14、相互作用;HIVREV蛋白与HIVREV反应元件RRE的茎IIB相互作用、和农杆菌VIRD2右边界序列。30如权利要求28所述的方法,其中所述连接域包括选自由以下组成的组的多肽农杆菌VIRD2蛋白、微小核糖核酸病毒VPG、拓扑异构酶、PHIX174噬菌体A蛋白、PHIXA蛋白,以及其变体。31一种通过如权利要求15所述的方法形成的核蛋白复合物,其中所述蛋白部分的所述连接域和所述赋予特异性的核酸部分的所述识别区域之间的物理缔合在所述靶细胞内形成编程的功能复合物。32如权利要求31所述的核蛋白复合物,其中所述蛋白部分的所述连接域和所述赋予特异性的核酸部分之间的物理缔合为选自由以下组成的组的亲和相互。
15、作用配体受体、配体底物、氢键、范德华键、离子键和疏水相互作用。33一种宿主细胞,所述宿主细胞具有通过如权利要求15所述的方法创建的预定的靶位点中的预定的基因修饰。34如权利要求33所述的宿主细胞,所述宿主细胞选自由以下组成的组脊椎动物细胞、哺乳动物细胞、人细胞、动物细胞、植物细胞、无脊椎动物细胞、线虫细胞、昆虫细胞和干细胞。35一种转基因生物体或敲除生物体,所述转基因生物体或敲除生物体具有通过如权利要求15所述的方法形成的预定的基因修饰。36一种治疗生物体中的遗传疾病的方法,所述方法包括在所述生物体的细胞中表达权利要求书CN104080462A4/4页5如权利要求1所述的核蛋白可编程分子复合物。
16、。37一种宿主细胞,所述宿主细胞包括A多肽,所述多肽包括I能够修饰所述细胞中靶核酸序列中的靶位点的功能域,所述功能域缺乏特定的核酸结合位点;和II能够与赋予特异性的核酸相互作用的连接域,所述连接域缺乏特定的靶核酸结合位点;以及;B赋予特异性的核酸SCNA,所述赋予特异性的核酸SCNA包括I与所述靶位点侧翼的靶核酸区域互补的核苷酸序列;和II能够特异性附着至所述多肽的所述连接域的识别区域;由此,所述多肽和所述SCNA在所述宿主细胞内的组装形成能够在所述靶位点处特异性修饰所述靶核酸的功能核蛋白复合物。38如权利要求37所述的宿主细胞,所述宿主细胞选自由以下组成的组脊椎动物细胞、哺乳动物细胞、人细胞。
17、、动物细胞、植物细胞、无脊椎动物细胞、线虫细胞、昆虫细胞和干细胞。权利要求书CN104080462A1/69页6用于修饰预定的靶核酸序列的组合物和方法发明领域0001本发明涉及用于利用可编程分子复合物PROGRAMMABLEMOLECULARCOMPLEX靶向并修饰核酸序列的组合物和方法。0002发明背景0003生物学和医学中主要的感兴趣领域是基因组核苷酸序列的靶向改变。此类改变包括内源染色体核酸序列的插入、缺失和置换。过去他人进行尝试以通过不同的技术改变基因组序列。0004基因靶向GENETARGETING是用于基因组操作或基因组功能修饰的理想的生物技术工具。基因靶向可诱导可以涉及或可以不涉。
18、及编码序列的特定基因组位置中的改变。0005在基因靶向事件中,预先定义的内源基因或另一个预先定义的内源核酸序列,通过靶向的基因功能修饰被靶向用于裂解,导致缺失、突变、插入或置换,或被靶向用于化学修饰。相对于非靶向的转基因生物体生产UNTARGETEDTRANSGENICORGANISMPRODUTION,基因靶向的一个优势是修饰或缺失现有基因组序列而不插入外源DNA的可能性,或可选地,通过插入或置换将外源供体DNA放置在预先定义的基因座中的可能性。因此,能够操作序列而无多余序列SUPERFLUOUSSEQUENCE是有利的,因为多余序列是育种者、农民、消费者和监管机构不期望的,并且同时已提出了。
19、用于避免此类序列的许多技术,每一种技术都具有其自身的缺点。0006用于真核细胞中基因靶向的策略取决于两个细胞DSDNA断裂修复机制同源重组HR修复通路和非同源末端连接NHEJ修复通路。在NHEJ中,基因插入取决于可随机出现的例如,通过辐射或氧化损伤或由核酸酶诸如TALE核酸酶TALEN、大范围核酸酶或锌指核酸酶ZFN指导的DSDNA断裂的存在。HR可通过DSDNA断裂引起。在HR中,DSDNA断裂不是必需的,但如果位于重组位点附近则可提高效率。0007已进行了关于HR介导的基因靶向的大量研究,其在许多生物体诸如细菌、酵母和原始植物、苔藓中有益地运转良好。HR还被用于高等生物体诸如果蝇、小鼠和人。
20、类。HR在这些生物体中的比率为约106,且通过创建基因特异性DSB在辅助的HR中该比率可被提高至超过102。低比率的转化子是这些方法未在基因治疗或育种项目中盛行的一个原因。0008已提出了用于体内修饰核酸的多种技术并可被分为基于酶的方法或基于核苷酸的方法。一般而言,基于酶的方法使用DNA结合蛋白,其同时具有期望的催化活性和以与限制性内切酶相似的方式通过蛋白核酸相互作用结合期望的靶序列的能力。实例包括天然存在的或被工程化的稀有序列切割酶RARESEQUENCECUTTINGENZYME的大范围核酸酶、锌指核酸酶ZFN或包含与修饰的DNA结合域连接的FOKI核酸酶催化亚基并可切割每一个预定序列的转。
21、录激活因子样核酸酶TALEN。在ZFN中,结合域由折叠成专门的锌指结构域的氨基酸链组成。类似地,在TALEN中,源自转录因子的34个氨基酸重复折叠成巨大的DNA结合域。在基因靶向事件中,这些酶可裂解CLEAVE基因组DNA,以形成双链断裂DSB或创建可被两种修复通路非同源末端连接NHEJ或同源重组HR之一修复的切口NICK。NHEJ通路可潜在地导致特定突变、缺失、插入或置换事件。HR通路导致被靶向的序说明书CN104080462A2/69页7列被提供的供体序列置换。这些仅基于蛋白的方法的一个缺点是针对每个期望的靶序列设计和提供不同蛋白的长期和艰苦的必要性。其他缺点包括分别由ZFN和大范围核酸酶。
22、识别的某种程度上有限亚组的核酸三联体或序列。此外,即使是非常难以构建的六锌指ZFN也局限于仅18个核苷酸的结合位点,并且由于18个核苷酸在统计学上不足以赋予全基因组的序列空间中的序列特异性或复杂性,这些必须作为异二聚体被提供。此外,ZFN和TALEN的性质要求功能性筛选,并且即使是成功的核酸酶也可显示差的基因靶向效率。0009对于基于核苷酸的方法,将核酸提供至生物体,并且内源性加工通过非辅助的同源重组或将寡核苷酸整合到基因组引起DNA修复或基因靶向。这些核酸可使用病毒载体、质粒载体、TDNA载体和双链DNA寡核苷酸来提供。称为三螺旋形成寡核苷酸TRIPLEHELIXFORMINGOLIGONU。
23、CLEOTIDE,TFO的较短核苷酸被用于基于寡核苷酸的错配修复,并可实现点突变的修复或直至4个核苷酸的修复。存在这些方法也依赖于DSB的形成的充足证据,该DSB的形成可以是随机的、随机诱导的或由通过共价结合至提供的核酸的酶或反应性化学物质的酶促或化学修饰局部诱导的。DNA中的双链断裂DSB是HR必需的。特定的预先存在的DSB不是必需的,但提高了效率。DNA中的天然断裂随机分布并且是罕见的,并因此效率,因此肯定是低的106。DSB可通过以遗传毒性为代价来提高效率的电离辐射或氧化化学物质被随机诱导。在该系统的改进中,过去使用由核酸末端的化学修饰辅助的非酶促DNA裂解进行了辅助的HR或修复。这些修。
24、饰包括EDTAFE或可光活化的补骨脂素,并可被用于当被体外掺入以形成三螺旋时产生DSDNA中的序列特异性DSB。另外的方法使用了源自单链DNASSDNA的寡核苷酸、或修饰的寡核苷酸,也被称为“小合成单链寡脱氧核苷酸ODN或SSODN。然而,尽管基于寡核苷酸的方法可导致哺乳动物细胞基因组中相对有效的点突变,但这些方法受限于该编辑模式。0010寡核苷酸酶缀合物是两种方法的组合,包括在将缀合物提供给生物体之前体外共价结合至催化酶的核酸。与仅酶的方法相比,这些方法是模块化的,允许制备针对多种靶序列的缀合物。寡核苷酸酶缀合物的主要缺点是,它们在体内不能自组装,从而严重地限制了其用于体内编辑基因组的有效性。
25、。本领域已知的此类系统的另外的关键缺点是,在这些缀合物的使用中,酶组分作为单体是有活性的,并因此酶与核酸的任何结合,特异性的或非特异性的,将导致裂解。此类非特异性裂解严重降低此类系统的安全性,因为它们可在不希望的位置引入不希望的改变/突变。0011非缀合的寡核苷酸蛋白系统也已被用于裂解SSDNA底物。在该系统中,在其识别位点外裂解的IIS型限制性内切酶FOKI与以下在体外联合使用重建FOKI识别序列的形成发夹结构的寡核苷酸,创建待被裂解的由寡核苷酸引发PRIME的DNA的双链部分的POLIK酶和DNTP。在该系统中,不仅期望的序列被裂解,而且任何天然存在的FOKI位点将被识别,且邻近其的序列将。
26、被裂解。由于FOKI具有仅5个核苷酸识别位点,这暗示了全基因组中存在数以千计的潜在裂解位点,使得该系统对于基因组编辑是无用的。0012与其中HR可被用于基因靶向的其他生物体相比,在高等植物和人中,NHEJ通路是主要的内源性机制。植物DNA修复机制不允许在供体和染色体DNA之间的有效的HR。事实上,已广泛接受的是,通常由农杆菌介导的遗传转化递送的外源供体DNA分子,被植物的非同源末端连接NHEJ通路识别,其导致外源供体DNA分子在整个宿主基因组中的随机整合。因此,大多数现有植物转化方法都不被认为是基因靶向的,因为在这些方法中,序列随说明书CN104080462A3/69页8机插入基因组,并且作为。
27、不良副作用,可破坏现有基因,并且通常以多拷贝插入,或包含不期望的质粒、标志物或细菌序列残余。0013可用于辅助的HR和定向的NHEJ的用于诱导特定DSDNA断裂的方法,利用体内核酸酶的表达。这些核酸酶包括稀有序列切割核酸酶稀有切割物CUTTER诸如源自归巢内切核酸酶的大范围核酸酶或嵌合大范围核酸酶、定制的重组锌指核酸酶ZFN、或定制的重组TAL效应器核酸酶。在这些方法中,裂解的靶位点的识别,由天然识别特定核苷酸序列或被具体工程化以识别特定核苷酸序列的蛋白结构域或亚基的相互作用来实现,并且不基于多核苷酸多核苷酸杂交或碱基配对。例如,锌指核酸酶是被构建作为FOKI核酸酶亚基和合成的锌指ZF结构域之。
28、间的杂合体的嵌合蛋白。锌指核酸酶不包含核酸组分。ZFN旨在通过几个ZF基序的组合特异性识别核苷酸三联体。由于其仅识别有限亚组的核苷酸三联体的固有能力,未能够构建识别所有序列的ZFN。使用ZFN异二聚体,借以作为单体是无活性的两个不同的ZFN被伴随递送,具有对特异性的积极影响,尽管这使设计进一步复杂化,并降低了靶序列的选择。ZFN还被用于创建既用于基因的激活又用于基因的抑制的人工转录因子,用于改变基因调控。然而,此类基于锌指的转录因子受限于识别位点的长度并受限于几个特定三核苷酸基序,不能结合所有序列,并且因此不能被用于激活或抑制所有可能的基因。0014例如,SCHIERLING等人公开了具有特定。
29、序列裂解模块的新颖的锌指核酸酶平台。例如,EISENSCHMIDTK等人公开了用于高度特异性DNA裂解的编程的限制性内切核酸酶。例如,WO2006/027099涉及具有可编程特异性的酶缀合物,其以高度特异性方式与DNA反应。0015例如,KUBO等人公开了通过信号肽和遗传表达控制寡核苷酸在人细胞中的细胞内递送。JINEK等人公开了适应性细菌免疫中可编程的双RNA引导的DNA内切核酸酶PROGRAMMABLEDUALRNAGUIDEDDNAENDONUCLEASE。0016例如,WO2012/129373涉及用于制备复杂的转基因性状基因座的方法。0017然而,本领域对允许体内特异性靶向和修饰靶核。
30、酸序列的安全、可靠、模块化和廉价的组合物和方法仍然存在未满足的需要。0018发明概述0019本发明提供了用于在体内或体外靶向和修饰核酸序列的组合物和方法。根据一些实施方案,本文提供的新的复合的可编程分子复合物核蛋白复合物NUCLEOPROTEINCOMPLEX被用于精确、可靠和成本有效地编辑或功能修饰预定的核酸序列靶。0020在一些实施方案中,本文公开的分子复合物被用于基因靶向和/或靶向基因功能修饰,包括,但不限于,在靶核酸的一条或两条链中产生断裂以引发基因突变、缺失、基因置换和外源核酸分子的整合,或用于其化学、构象或生物功能的修饰。0021根据一些实施方案,本文公开的分子复合物包括A嵌合多肽。
31、其可由多核苷酸分子编码,该嵌合多肽包含I能够修饰靶位点的功能效应器域FD;和II连接域LD;以及B赋予特异性的核酸SPECICITYCONFERRINGNUCLEICACID,SCNA,该SCNA包括I与靶位点侧翼的靶核酸区域互补的核苷酸序列;和II能够特异性附着至多肽的连接域的识别区域;从而,多肽和SCNA在宿主/靶细胞中的组装形成能够在靶位点特异性修饰靶核酸的功能性、可编程的核蛋白分子复合物。说明书CN104080462A4/69页90022在一些实施方案中,本发明提供了有利的组合物,该组合物包含蛋白效应器模块或编码蛋白效应器模块的核酸分子和编程/靶向核酸模块PROGRAMMING/TAR。
32、GETINGNUCLEICACIDMODULE,其可体内自组装为特异性的、有活性的修饰核酸的分子核蛋白复合物。在该复合物中,在本文中也被称为“编程部分”、“编程寡核苷酸”或“赋予特异性的核酸”SCNA的核酸,通过所述赋予特异性的核酸和靶核酸的碱基配对提供了分子复合物对靶核酸的特异性和结合能力。该复合物的蛋白效应器组分或模块旨在通过附着至寡核苷酸的化学部分、寡核苷酸上的一个或多个核苷酸的修饰、寡核苷酸上的特定识别序列、等,或其组合,结合/连接/附着至决定特异性的核酸。有利地,本文公开的组合物和方法赋予了对宽范围的期望的靶序列的较高特异性,是较少遗传毒性的,在其组装中是模块化的,可靠的,利用单个平。
33、台而无需定制,对在专门的核心设备之外独立使用是实用的,并且具有较短的开发时间帧和降低的成本。0023蛋白模块的活性可导致靶核酸序列的修饰和/或靶核酸的功能修饰。靶核酸修饰可包括,但不限于突变、缺失、插入、置换、结合、消化、产生切口NICKING、甲基化、乙酰化、连接LIGATION、重组、螺旋解旋、化学修饰、标记、活化和失活或其任何组合。靶核酸功能修饰可导致,但不限于在转录激活、转录失活、可变剪接、染色质重排、病原体失活、病毒失活中的变化、细胞定位、核酸的区室化中的变化,等,或其组合。由蛋白部分产生的任何编辑作用或其他修饰通过其与赋予特异性的核酸的连接被定向或指导至预期的预先定义的特定靶核酸。。
34、有利地,各单个类型的蛋白组分的使用可与决定特异性的核酸的核苷酸序列的非限制的分类伴随或单独组合,以允许对期望的靶核酸的不同部分有类似作用。这允许通过提供用于修饰预定的核酸序列靶的通用的、可靠的和成本有效的方法和组合物克服现有技术方法的缺点。因此,如果被用于一种受体RECEPTACLE或生物体,对于决定特异性的核酸类型的任何组合或多样性,仅一种类型的蛋白待被提供。这还包括伴随使用不止一种类型的蛋白组分与不止一种类型的决定特异性的核酸的可能性。0024根据一些实施方案,本文公开的复合物是模块化的,并可在体内或体外的靶细胞内自组装,允许每次伴随地提供一种类型的蛋白部分和一个或多个决定特异性的寡核苷酸。
35、。此外,在一些实施方案中,可将蛋白组分递送至期望的细胞并在体内表达,等待任何适合的SCNA在后来的时间的递送。在一些实施方案中,蛋白组分和SCNA可同时或基本上同时被递送。因此,蛋白组分和SCNA的组合,优选地在期望的靶细胞内的组合,可实现特定基因组双链断裂DSB的诱导,或体内任何其他期望的核酸修饰。本发明的方法不限于将点突变引入靶核酸,因为分子复合物可靶向任何核酸序列或序列对,在非常靠近它们的位置处切割/限制RESTRICT/裂解,并由此缺失小的或大的核酸部分,或切割/限制/裂解序列,以启动任何核酸序列的去除或插入,或置换。0025有利地,本发明在其实施方案中首次公开了蛋白组分的体内表达,以。
36、及其通过体内自组装结合/附着至SCNA以体内形成分子复合物,而无需蛋白部分和靶向核酸之间事先的共价/化学连接。根据本发明的实施方案,与本领域已知的基于寡核苷酸的系统相比,结合到蛋白的SCNA并非旨在用作供体,而是作为赋予特异性的部分,并且不会成为修饰的核酸的部分。此外,在本发明的一些实施方案中,SCNA可以以引起单次递送事件的分子复合物的所有组分的组装的方式在体内表达。此外,根据一些实施方案,效应器蛋白可被设计仅当其二聚化时是有活性的即,其必须形成二聚体才是有活性的,由此可控制二聚化以使得说明书CN104080462A5/69页10活性二聚体仅可当其被SCNA靶向/编程并结合至其靶位点时形成,。
37、例如,当二聚体的单体配偶体蛋白之间的分子距离足够精确时形成。因此,有利地,分子复合物仅在其预期的靶位点被活化,从而提高特异性和可靠性。根据另外的实施方案,可表达一种蛋白组分以形成/产生同源二聚体,每一个由赋予特异性的不同寡核苷酸编程/靶向。另外,作为本领域已知的用于体内蛋白表达的病毒表达系统,由于大小的约束,通常限于产生一种蛋白,并且由于交叉保护通常专用于类似的病毒,因此,对于该递送模式,使用一个蛋白组分具有关键优势。此外,与本领域已知的具有有限亚组的识别序列的其他方法诸如ZFN和大范围核酸酶相比,本文公开的编程寡核苷酸SCNA,具有无限的序列库ANINNITEREPERTOIREOFSEQU。
38、ENCES,因此在高度复杂的基因组中令人信服地实现极端序列特异性。此外,由于许多编程寡核苷酸与单个蛋白效应器部分伴随地被提供,同时修饰不止一个靶是可能的,提供了相对于本领域已知的方法的另外的优势。例如,这可有助于快速敲除多个基因,或用于在不同的位置插入多个不同的性状,或用于用一个供体核苷酸标签给几个不同的位置加标签。0026根据一些实施方案,由于非编程的蛋白组分即未附着/连接到编程寡核苷酸的蛋白对靶核酸没有亲和力或具有非常低的亲和力,有利地获得了改善的特异性和安全性和降低的遗传毒性。如以上详述的,蛋白组分的效应器或催化结构域仅当二聚化时是有活性的,由此至少两个编程寡核苷酸SCNA必须结合靶侧翼。
39、序列以引起蛋白二聚化和激活。两个足够长的编程寡核苷酸可通过创建与结合位点的广泛互补性给予高度复杂的基因组中需要的非常高的理论特异性。由于非编程的表达的蛋白对靶核酸不具有亲和力,其不会结合和/或修饰靶核酸。因此,在其中例如将编程寡核苷酸单独递送/提供到靶细胞其已表达非编程的蛋白组分的应用中,或在其中将寡核苷酸从靶细胞耗尽例如,通过稀释或降解的条件下,不可能发生非特异性裂解,从而提高了安全性并减少遗传毒性。0027因此,根据本发明的实施方案,可具体地并以可编程的方式使用定向的非同源末端连接NHEJ和辅助的同源重组HR两者,以实现以下的一种或多种00281突变DNA序列通过在DNA序列内部裂解、创建。
40、双链断裂DSB、在某种程度上被内源核酸酶降解、并通过内源NHEJDNA修复机制再连接以创建DNA的符合读框的INFRAME缺失和/或移码FRAMESHIFT突变。相对于植物中的TDNA或转座子插入系,缺失或突变内源基因的这种方法不会留下外源DNA并且根据一些定义植物可被称为非转基因植物。在NHEJ中,还可将一个或多个核苷酸以仍未知的内源性机制加入DSB中,基本上实现移码或突变的相同效应。00292缺失一段DNA序列通过裂解其侧翼的两个序列、通过内源性NHEJDNA修复机制再连接,或通过辅助的HR,通过在待缺失的序列内或附近裂解并提供供体DNA,随后将该供体DNA重组进入靶,并且该供体DNA含有。
41、靶中待被缺失的序列的侧翼序列。00303将供体核酸插入DSB通过裂解靶核酸并提供通过NHEJ机制直接被连接到缺口GAP的供体DNA,或优选地提供与待被重组的缺口的末端具有同源性并通过辅助的HR被连接入缺口的供体。00314置换靶核酸序列通过裂解其侧翼序列,并提供通过NHEJ待被插入、待连接在靶点侧翼序列内的供体核酸,或优选地通过HR重组并连接的供体核酸,通过在供体的末端上添加与靶核酸或其侧翼序列相似的序列。说明书CN104080462A106/69页110032根据一些实施方案,并且不希望被理论或机制束缚,本文公开的组合物和方法的优势包括创建通用的酶复合物构建方案,其可靶向无限选择的序列。在蛋。
42、白组分被优化用于特定目的例如,DSDNA裂解之后,该相同的蛋白与无限选择的编程核酸SCNA序列一起被使用。因此,待被影响的靶序列的多样性通过SCNA的设计来实现,而没有蛋白重新设计和优化的困难和费时的必要性,所述蛋白重新设计和优化的困难和费时的必要性是本领域中已知的其他方法诸如TALEN、ZFN和大范围核酸酶中固有的,其中蛋白自身必须被改变和调整以用于每个靶序列。设计和制备合成的SCNA是相对简单、快速且相对便宜的。在本发明的一些实施方案中,绕过将化学合成的SCNA递送至细胞的必要性,在体内产生SCNA也是可能的。此外,SCNA可被设计成针对几乎任何期望的靶序列的碱基对,并因此,可将分子复合物。
43、定向到几乎任何靶序列。此外,几个靶序列可在相同的细胞中伴随使用。例如,在需要不止一个裂解位点的编辑功能诸如缺失或置换核酸的特定段中,通过简单地提供四种不同的SCNA和一个蛋白部分。0033根据一些实施方案,因此,提供了用于修饰靶细胞中的靶核酸序列中的预定的靶位点的核蛋白组合物,该组合物包括编码多肽的多核苷酸分子,或多肽,所述多肽包括I能够修饰所述靶位点的功能效应器域FD,该功能域缺乏特定核酸结合位点;和II能够与赋予特异性的核酸SCNA相互作用的连接域LD,其中连接域缺乏特定靶核酸结合位点;以及;B赋予特异性的核酸SCNA或编码SCNA的核酸,SCNA包括I与靶位点侧翼的靶核酸区域互补的核苷酸。
44、序列;和II能够以高结合亲和力特异性附着至多肽的连接域的识别区域;由此多肽和SCNA在靶细胞内的组装形成能够在靶位点特异性修饰所述靶核酸的功能核蛋白复合物。0034在一些实施方案中,功能域包括催化结构域。在一些实施方案中,多肽还包含亚细胞定位结构域。0035在一些实施方案中,修饰靶核酸选自突变、缺失、插入、置换、结合、消化、双链断裂创建DOUBLESTRANDBREAKCREATION、产生切口、甲基化、乙酰化、连接、重组、螺旋解旋、化学修饰、标记、活化和失活。0036根据一些实施方案,SCNA包括选自由以下组成的组的核酸分子单链DNA、单链RNA、双链RNA、修饰的DNA、修饰的RNA、锁核。
45、酸LOCKEDNUCLEICACID,LNA和肽核酸PNA或其组合。0037在一些实施方案中,SCNA的识别区域包括选自以下的修饰5端修饰、3端修饰、和内部修饰。在一些实施方案中,化学修饰选自由以下组成的组核苷酸修饰,和非核苷酸部分的添加。在一些实施方案中,非核苷酸部分选自生物素、荧光素、胺接头AMINELINKER、寡肽、氨基烯丙基AMINOALLYL、染料分子、荧光团、地高辛、ACRYDITE、腺苷酸化物ADENYLATION、叠氮化物、NHS酯、胆固醇基TEG、炔烃、可光裂解的生物素、硫醇、二硫醇。在一些实施方案中,核苷酸修饰选自由以下组成的组磷酸酯、2氨基嘌呤、三聚体20TRIMER2。
46、0、2,6二氨基嘌呤、5溴脱氧尿苷5BROMODEOXIURIDINE、脱氧尿苷DEOXIURIDINE、反向DT、双脱氧核苷酸DIDEOXINUCLEOTIDES、5甲基脱氧胞苷、脱氧肌苷、5硝基吲哚、2O甲基RNA碱基、ISODC、ISODG、氟修饰的碱基和硫代磷酸酯键。在一些实施方案中,修饰选自由以下组成的组核苷酸修饰、生物素、荧光素、胺接头、寡肽、氨基烯丙基、染料分子、荧光团、地高辛、ACRYDITE、腺苷酸化物、叠氮化物、NHS酯、胆说明书CN104080462A117/69页12固醇基TEG、炔烃、可光裂解的生物素、硫醇、二硫醇、修饰的碱基、磷酸酯、2氨基嘌呤、三聚体20、2,6二。
47、氨基嘌呤、5溴脱氧尿苷、脱氧尿苷、反向DT、双脱氧核苷酸、5甲基脱氧胞苷、脱氧肌苷、5硝基吲哚、2O甲基RNA碱基、ISODC、ISODG、氟修饰的碱基和硫代磷酸酯键,和通过其与特定核苷酸序列的相互作用共价结合的蛋白。在一些实施方案中,通过其与特定核苷酸序列的相互作用共价结合的蛋白可选自,但不限于农杆菌VIRD2蛋白、微小核糖核酸病毒VPG、拓扑异构酶、PHIX174噬菌体A蛋白、PHIXA蛋白,以及其任何变体。0038在一些实施方案中,SCNA上的修饰和连接域之间的附着/结合/缔合由从选自但不限于以下的结合对的非共价相互作用中选择的结合对引起生物素亲和素;生物素链霉亲和素;生物素修饰形式的亲。
48、和素;蛋白蛋白;蛋白核酸相互作用;配体受体相互作用;配体底物相互作用;抗体抗原;单链抗体抗原;抗体或单链抗体半抗原;激素激素结合蛋白;受体激动剂;受体受体拮抗剂;IGG蛋白A;酶酶辅因子;酶酶抑制剂;单链DNAVIRE2;STICKYCDSDNA;RISCRNA;病毒外壳蛋白核酸;抗荧光素单链可变区片段抗体抗FAMSCFV荧光素;抗DIG单链可变区片段SCFV免疫球蛋白DIGSCFV地高辛DIG和农杆菌VIRD2VIRD2结合蛋白;以及其任何变体。0039在一些实施方案中,SCNA的识别区域包括能够特异性附着/结合/缔合至嵌合蛋白的连接域的核苷酸基序。在一些实施方案中,核苷酸基序和连接域之间的。
49、附着/缔合/结合选自但不限于锌指蛋白锌指基序;限制性内切酶识别域限制性内切酶识别序列;转录因子的DNA结合域DNA基序;阻抑物操纵基因;亮氨酸拉链启动子;螺旋环螺旋E盒结构域;包括富含精氨酸的基序结构域的RNA结合基序、蛋白结构域、RNA识别基序RRM结构域、K同源结构域、双链RNA结合基序、RNA结合锌指、和靶向RNA的酶相关的特定RNA序列;HIVREV蛋白HIVREV反应元件RRE的茎IIB;牛免疫缺陷病毒BIVTAT主要结合域BIV反式作用反应元件TAR序列的环1;噬菌体、PHI21、和P22N蛋白在其各自RNA中的N利用NUTILIZATION,NUT位点中的盒B环发夹结构。0040根据一些实施方案,提供了用于通过可编程的核蛋白分子复合物修饰靶核酸序列内的预定的靶位点的方法,该方法包括以下步骤A将编码可编程的嵌合蛋白多肽或蛋白多肽的核酸序列递送至宿主细胞;B将赋予特异性的核酸SCNA分子,或编码SCNA的核酸递送至所述宿主细胞;C所述嵌合蛋白与SCNA结合,从而将嵌合蛋白靶向宿主细胞内的预定的靶核酸序列,以形成有活性的编程的核蛋白复合物ACTIVEPROGRAMMEDNUCLEOPROTEINCOMPLEX;以及D允许通过所述有活性的编程的核蛋白分子复合物修饰靶核酸序列的预定的靶位点。0041在一些实施方案中,提供了用于通过可编程的核蛋白分子。