新的锌指核酸酶及其用途 技术领域 本发明涉及用于靶向切割和改变基因组序列、 靶向切割后在外源多核苷酸和基因 组序列之间发生同源重组, 或者靶向切割后发生非同源性末端连接的方法和组合物。
背景技术 限制性酶是基因工程和分子生物学中不可或缺的工具。致力于创造识别并切割 9 个或更多个碱基对 (bp) 的特定 DNA 序列的、 被称为 “稀有切点酶 (rare cutter)” 的新的限 制性酶。其中, 锌指核酸酶技术的作用为利用限制性酶来识别并切割多种 DNA 碱基序列, 该 限制性酶是由锌指 DNA- 识别结构域和 DNA- 切割结构域组成的嵌合核酸酶。锌指核酸酶可 用来在在哺乳动物、 植物或其它生物中进行有效的遗传修饰, 这是因为当将这种酶导入细 胞中时, 它能在基因组 DNA 中产生定向的双链断裂 (DSB)。当细胞发生双链断裂时, 受损的 区域由细胞的自我修复系统进行修复。此时, 将与受损区域具有相似 DNA 序列的供体 DNA 导入细胞中, 能导致受损 DNA 和供体模板之间发生同源重组 (HR)。为了对基因组的特定位 点进行所需的修饰, 将靶碱基序列并入供体 DNA 中。同时, 在不存在供体 DNA 的情况下, 受 损细胞可以通过非同源性末端连接 (NHEJ) 来修复。非同源性末端连接 (NHEJ) 通过将两个 断裂末端连接到一起来修复受损的 DNA, 并且通常不会产生突变。 然而, 在某些情况下, 修复 易于出错, 导致断裂的 DNA 末端处发生碱基对的插入或缺失。总的来说, 由锌指核酸酶导致 的特定碱基序列的双链断裂引起非同源性末端连接, 因此所得的 DNA 含有突变, 进而产生 敲除细胞系。
真核生物基因组所编码的最丰富的 DNA- 结合基序 —— 锌指 (ZF), 提供了可能 是 最 好 理 解 的 蛋 白 质 -DNA 结 合 机 制 中 的 一 种 (Wolfe, S.A.et al., (2000)Annu.Rev. Biophys.Biomol.Struct., 29, 183-212 ; Pabo, C.O.et al., (2001)Annu.Rev.Biochem., 70, 313-340 ; Moore, M.et al., (2003)BriefFunct.Genomic.Proteomic., 1, 342-355 和 Klug, A.et al., (2005)FEBS Lett., 579, 892-894)。工程锌指蛋白 (ZFP) 极可能作为基因调控和 基因组修饰的工具, 因为它们可以用于靶向几乎在任何基因组的任何期望位置的功能性结 构域。锌指蛋白为设计具有新 DNA- 结合特异性的蛋白质提供了通用框架, 这是由于它们具 有模块结构特征, 并且当识别 DNA 碱基序列时, 在碱基与氨基酸残基之间具有碱基特异的 相互作用。
有效锌指核酸酶的构建需要制备识别基因组中期望的靶 DNA 序列的锌指蛋白, 目前可通过多种体外和体内选择方法来实现, 包括通过定点诱变 (SMD) 替换每个对应氨 基酸或者大规模的筛查方法、 噬菌体展示 ( 参见美国专利第 5,789,538 号、 第 5,925,523 号、 第 6,007,988 号、 第 6,013,453 号和第 6,200,759 号 ; WO 95/19431、 WO 96/06166、 WO 98/53057、 WO 98/54311、 WO 00/27878、 WO 01/60970、 WO 01/88197 和 WO 02/099084)。然 而, 这些基于选择的方法是高度劳动密集且耗时的, 并且需要高级技术人才。制备 ZFN 的 备选方法是通过标准重组 DNA 技术将预表征的单个锌指模块组装成具有所需特异性的锌 指阵列。每个锌指模块识别 3bp( 碱基对 ) 的 DNA, 并且当合适地连接到一起时, 所得的
锌指阵列能特异地识别较长的 DNA 序列基序。利用本方法, 可以容易地构建能识别特定 碱基序列的锌指核酸酶。某些研究小组已经描述并表征了用于构建多指阵列的锌指模块 的单独档案。第一, Barbas 模块, 由斯克利普斯研究所 (Scripps Research Institute) Barbas 实验室利用噬菌体展示和合理的设计方法开发的, 可用来识别所有的 GNN 三联体, 大多数 ANN 和 CNN 三联体和少量 TNN 三联体。在单个锌指模块几乎具有完全的位置独立 性, 即它们的识别特性不受它们在阵列中的位置或邻近锌指的性质的显著影响的假设下, 开发出了这些 Barbas 模块。第二, 由 Sangamo BioSciences Inc. 设计的 Sangamo 模块, 其目前可用于所有的 GNN 三联体和少量的 ‘非 -GNN’ 三联体。在模块在 3- 指阵列中的位 置可以影响其识别特性的假设下开发出了 Sangamo 模块。3- 指阵列中三个位置中的每一 个都具有为该位置的给定三联体开发出的不同的锌指模块。然而, 由于这些模块不是天然 存在的而是人工模块, 因此不容易使用它们来构建锌指核酸酶, 并且它们在实际应用中的 效率非常低。特别是, 这些模块的特征为靶向于 GNN- 重复序列。然而, 问题是给定目的基 因中这些序列仅极少存在。例如, 可以将 3- 指 ZFN 对设计成靶向于 GNN- 重复的 DNA 序列 5’ -NNCNNCNNCNNNNNNGNNGNNGNN-3’ , 其平均在 4096bp( = 46) 的序列中仅出现一次。4- 指 ZFN 的 GNN- 重复位点更加罕见, 平均在 65,536bp( = 48) 的序列中仅出现一次。因此, 可能 在多数目的基因中根本不存在这种位点。关于这点, 本发明的锌指核酸酶的优点在于它们 大多数均在不识别 GNN- 重复序列的情况下起作用。 发明的公开内容
技术问题
鉴于此, 允许进行靶向基因组编辑的锌指核酸酶技术的广泛应用受缺少方便的、 快速的和公众可利用的合成功能性锌指核酸酶的方法所限。因此, 本发明人试图开发出一 种高效且易操作的模块组装方法, 利用公众可获得的锌指来制备能修饰人类细胞中数个不 同基因组位点的 DNA 序列的锌指核酸酶。他们发现, 与已知方法相比, 组装的锌指核酸酶对 于靶向切割和修饰基因组来说是更有效的工具。
技术方案
本发明的目的是提供包含锌指结构域和切割结构域的融合蛋白——锌指核酸酶, 其中所述锌指结构域包含三个或更多个锌指模块, 一个或多个所述锌指模块来源于天然存 在的、 野生型的锌指模块, 并且所述融合蛋白识别并切割细胞染色质中包含目的区域的核 苷酸序列。
本发明的另一个目的是提供利用所述锌指核酸酶来切割目的区域中的细胞染色 质的方法。
本发明的另一个目的是提供利用所述锌指核酸酶来替换细胞染色质目的区域中 的第一核苷酸序列的方法。
本发明的另一个目的是提供利用所述锌指核酸酶来修饰细胞染色质目的区域中 的第一核苷酸序列的方法。
本发明的另一个目的是提供利用所述锌指核酸酶的基因治疗方法。
发明的有益效果
本发明的锌指核酸酶容易制备, 并且因此对于在多种基因治疗应用中产生基因敲 除的靶向切割和修饰基因组序列是非常有用的。
附图简要说明
图 1 显示用于构建本发明锌指核酸酶的锌指的来源、 氨基酸序列和靶亚位点。
图 2 显示本发明人合成的锌指核酸酶中有代表性的 ZFN 对的氨基酸序列 ; 所包含 的用于检测它们在细胞中表达的 HA 标签和核定位信号序列用下划线标示出, 并且用粗体 指出预期与靶碱基序列结合的锌指 α 螺旋区。
图 3 是 CCR5 编码区中 ZFN 靶位点的示意图 ; 用盒表示 ZFN 靶位点, 数字指示 ZFN 靶位点相对于起始密码子的位置, 用交叉线画出阴影的盒指示 Δ32 突变的座位。
图 4 是利用体外转录和翻译系统制备的 ZFN 进行 DNA 切割测定的示意图。
图 5 是显示 DNA 切割测定的琼脂糖凝胶电泳结果的照片。
图 6 是用于评估 ZFN 活性的基于细胞的单链退火 (SSA) 的示意图 ; 将 ZFN 表达质 粒转染进 HEK293 细胞中, HEK293 细胞的基因组包含无活性的、 部分复制的且中断的萤光素 酶基因。如果 ZFN 切割细胞中的靶位点, 则 DNA 可被 SSA 机制有效修复, 并且能恢复功能性 的萤光素酶基因。
图 7 是用于评估 ZFN 活性的基于细胞的单链退火 (SSA) 的示意图 ; 细胞的萤光素 酶活性指示多种 ZFN 的表达。p3 是用作阴性对照的空质粒。靶序列含有用作阳性对照的 I-SceI 的识别位点。将每对 ZFN 的活性报告为相对于 I-SceI 对照的百分比。指出了 ZFN 对及其组成单体。用三角形标示出用于进一步研究的 ZFN 对。显示至少 3 次独立实验的平 均值和标准差 ( 误差棒 )。 图 8 是利用 T7E1 测定检测人细胞中 ZFN 介导的基因组编辑错配的示意图 ; 从用编 码 ZFN 的质粒转染的细胞纯化基因组 DNA。通过 PCR 扩增出包含 ZFN 识别位点的 DNA 片段, 并使该 DNA 扩增子解链并退火。如果该 DNA 扩增子包含野生型和突变的 DNA 序列, 则形成 异源双螺旋。T7E1 识别并切割异源双螺旋, 而不是同源双螺旋。通过琼脂糖凝胶电泳评估 DNA 片段。
图 9 显示利用 T7E1 测定揭示 ZFN 介导的基因组修饰 ; ZFN 对显示在琼脂糖凝胶的 上端。在凝胶图的左侧用箭头 ( 未切割 ) 和括弧 ( 切割 ) 指示所得的 DNA 条带的预期位 置。p3 是用作阴性对照的空质粒。本测定中包括 Sangamo 的靶向 CCR5 的 ZFN 对 (Sangamo CCR5)。
图 10 显示 Z836 ZFN 对所靶向的基因组位点的 DNA 序列 ; ZFN 识别元件用下划线 标示出。用破折号指示缺失, 用小写字母表示插入的碱基。如果检测出突变多于一次, 则在 括号内指出出现的次数。Wt 代表野生型。
图 11 显示 Z30 和 Z266 ZFN 对所靶向的基因组位点的 DNA 序列 ; ZFN 识别元件用 下划线标示出。用破折号指示缺失, 用小写字母表示插入的碱基。如果检测出突变多于一 次, 则在括号内指出出现的次数。
图 12 显示 Z360 和 Z411 ZFN 对所靶向的基因组位点的 DNA 序列 ; ZFN 识别元件用 下划线标示出。用破折号指示缺失, 用小写字母表示插入的碱基。如果检测出突变多于一 次, 则在括号内指出出现的次数。
图 13 显示 Z426 和 Z430 ZFN 对所靶向的基因组位点的 DNA 序列 ; ZFN 识别元件用 下划线标示出。用破折号指示缺失, 用小写字母表示插入的碱基。如果检测出突变多于一 次, 则在括号内指出出现的次数。
图 14 显示 Z891 ZFN 对所靶向的基因组位点的 DNA 序列 ; ZFN 识别元件用下划线 标示出。用破折号指示缺失, 用小写字母表示插入的碱基。如果检测出突变多于一次, 则在 括号内指出出现的次数。
图 15 显示若干 ZFN 靶位点处的突变类型 ; 对每对 ZFN 的缺失、 插入和混合突变的 数量进行计数, 并绘制出这些事件的百分比。
图 16 是野生型和强制型异二聚 ZFN 的时间进程分析结果 ; 在不同的时间点对从 细胞分离的 DNA 进行 T7E1 错配检测测定, 所述细胞用不同形式的 FokI 核酸酶结构域处理。 (WT, 野生型核酸酶结构域 ; RR/DD 或 KK/EL, 强制型异二聚核酸酶结构域 )
图 17 是 53BP1 染 色 的 结 果 ; 将 野 生 型 和 强 制 型 异 二 聚 Z891 ZFN 对 转 染 进 HEK293T/17 细胞, 并在转染后第 2 天时, 通过免疫荧光检测细胞内 53BP1 的位置。 依托泊苷 (1μM) 用作阳性对照。
图 18 是图 16 结果的图表。绘制出 53BP1 位置的数量分布。对于每个处理, 两次 独立的测定中分析至少 100 个细胞。
图 19 显示突变克隆的 DNA 序列 ; 通过有限稀释从 RR/DD ZFN 二聚体处理的细胞分 离了 7 个突变克隆。显示了这些克隆细胞中靶位点的 DNA 序列。用破折号指示缺失, 用小 写字母表示插入的碱基。克隆 1a 和 1b 指示由单克隆中的双等位基因修饰所产生的 DNA 序 列。
图 20 显示在 CCR2 位点进行的 T7E1 测定 ; 分析通过 PCR 从 ZFN 对处理的细胞扩 增的与 CCR2 编码区对应的 DNA( 在凝胶图的上端显示 )。用 “+” 标记在 CCR2 位点产生修 饰的 ZFN 对。p3 是用作阴性对照的空质粒。本测定中包括 Sangamo 的靶向 CCR5 的 ZFN 对 (Sangamo CCR5)。
图 21 显示 ZFN 在 CCR2 基因座的脱靶效应, 以及 CCR5 和 CCR2 基因座的 ZFN 识别 元件。指出的 ZFN 对位于 DNA 序列的左侧。用括号标出 CCR5 和 CCR2 基因座之间的匹配碱 基的数量, 用小写的黑体字母指示错配的碱基。半位点 ZFN 识别元件用下划线标示出。
图 22 显示用于模块交换实验的锌指。
图 23 是模块交换分析中利用基于细胞的 SSA 系统来检验这些新的 ZFN 是否能功 能性地替代本发明的识别相同序列的 ZFN 的结果 ; 名称由 “B” 开头的诸如 “BR4” 的 ZFN 单 体仅由 Barbas 模块组成, 以及由 “S” 开头的诸如 “SR4” 的那些 ZFN 单体仅由 Sangamo 模块 组成。细胞的萤光素酶活性指示多种 ZFN 的表达。p3 是用作阴性对照的空质粒。靶序列含 有用作阳性对照的 I-SceI 的识别位点。将每对 ZFN 的活性表示为相对于 I-SceI 对照的百 分比。指出了 ZFN 对及其组成单体。显示至少 3 次独立实验的平均值和标准差 ( 误差棒 )。
图 24 显示模块交换分析中利用 T7E1 测定的 ZFN 介导的基因组修饰来检验这些新 的 ZFN 是否能功能性地替代本发明的识别相同序列的 ZFN ; 在琼脂糖凝胶的上端显示 ZFN 对及其组成单体。用 “+” 标记产生阳性基因靶向事件的 ZFN 对。
图 25 概括 ZFN 分析 ; 显示出在每次测定中产生阳性结果的 ZFN 对或靶位点的数 量。
图 26 显示不同类型的 ZFN 的成功率 ; 将成功的 ZFN 对或靶位点定义为在 T7E1 错 配检测测定中产生阳性结果的那些。
实施本发明的最佳方式按照一方面, 本发明涉及包含锌指结构域和核苷酸切割结构域的融合蛋白——锌 指核酸酶 (ZFN), 其中所述锌指结构域包含三个或更多个锌指模块, 两个或更多个所述锌指 模块来源于天然存在的、 野生型的锌指模块, 并且所述融合蛋白识别并切割包含染色质特 定区域的核苷酸序列。
本发明的锌指结构域是指通过一个或多个锌指模块以序列特异的方式与核苷酸 结合的蛋白质。所述锌指结构域包含至少三个锌指模块。通常将所述锌指结构域缩写为锌 指蛋白或 ZFP。
本发明的锌指模块是结合结构域中的氨基酸序列区, 通过配位锌离子来稳定该结 合结构域的结构。 本发明的锌指模块的序列与天然存在的、 野生型的锌指模块的序列一致, 或者与通过其它氨基酸对野生型序列中的任何氨基酸的取代而修饰的序列一致。 所述野生 型的锌指模块可以来源于任何真核细胞, 例如真菌细胞 ( 例如酵母 )、 植物或动物细胞 ( 例 如诸如人或小鼠的哺乳动物细胞 )。 优选地, 本发明的锌指模块包含图 1 所代表的来源于人 或类似物的氨基酸序列。
锌指核酸酶的锌指结构域由 3 个或更多个串联排列的锌指模块组成, 每个锌指模 块识别 3bp( 碱基对 ) 的亚位点。由于每个模块独立地识别 DNA 序列, 因此由 3 或 4 个模块 组成的锌指结构域能结合 9-bp 或 12-bp 的序列。锌指核酸酶以二聚体的形式发挥功能, 因 此, 一对由 3 或 4 个模块组成的锌指核酸酶能特异地识别 18-bp 至 24-bp 的序列。在具体 的实例中, 本发明的锌指核酸酶的锌指结构域由 3 或 4 个模块, 优选由 4 个锌指模块组成。 此外, 在一个优选的实施方案中, 本发明的锌指核酸酶所包含的锌指结构域优选包含锌指 模块。 在具体的实例中, 含有 4 个锌指模块的锌指核酸酶成功地靶向 26%的可能切割位点, 而含有 3 个锌指模块的锌指核酸酶仅靶向 9.1%的可能位点。 可以将锌指结构域工程改造为与预定的核苷酸序列结合。 工程改造锌指结构域的 方法的非限制性实例是设计和选择。设计的锌指蛋白是非天然存在的蛋白质, 其设计 / 组 成主要来自合理的标准。设计的合理标准包括应用取代原则和计算机算法对存储现存的 ZFP 设计和结合数据信息的数据库中的信息进行处理 ( 参见韩国专利第 0766952 号 )。选 择的锌指蛋白是并非在自然中所发现的蛋白质, 其产生主要来自诸如噬菌体展示、 相互捕 获或杂交选择的实验过程。
组成加工的锌指结构域中的至少 2 个或更多个锌指模块优选是野生型锌指模块, 更优选 3 个或更多个是野生型锌指模块。在一个具体的实例中, 本发明人进行了模块交换 分析, 其中用噬菌体展示或点突变进行工程改造和分离的锌指核酸酶来替代本发明的锌指 核酸酶。发现本发明的锌指核酸酶在 SSA 系统和 T7E1 测定中表现出显著的活性。因此, 优 选地, 本发明锌指核酸酶由天然存在的、 野生型的锌指模块组成。更优选地, 本发明的锌指 核酸酶由表 2 所示的锌指结构域组成。此外, 本发明的锌指核酸酶并非靶向 GNN- 重复序 列, 这与已知的工程锌指核酸酶不同。在具体的实例中, 在对 CCR5 序列进行成功修饰的 16 个锌指核酸酶中, 只有 2 个 (Z426F3 和 Z360R4) 识别 GNN- 重复位点, 而有 2 个 (Z430R3 和 Z30F4) 识别无 GNN 基序的半位点元件, 12 个识别由 GNN 和非 GNN 基序组成的位点, 如以下 的表 2 所示。靶向除 GNN- 重复序列以外的位点的能力极大地扩展了 ZFN 技术的实用性。
本文所用的术语 “切割” 是指破坏 DNA 分子的共价主链, 术语 “切割结构域” 是指 具有催化 DNA 切割活性的多肽序列。
所述切割结构域可以获自任何内切核酸酶或外切核酸酶。 可以产生切割结构域的 示例性的内切核酸酶包括但不限于, 限制性内切核酸酶和归巢内切核酸酶。这些酶可以作 为切割结构域的来源。 此外, 单链切割和双链切割均是可能的, 其中双链切割的发生可以取 决于切割结构域的来源。 在这方面, 具有双链切割活性的切割结构域可用作切割半结构域。 本文的切割结构域可以与单链切割和双链切割交替使用。
切割结构域可以来源于任何核酸酶或其一部分。通常, 如果融合蛋白包含具有双 链切割活性的切割半结构域, 则切割需要两个融合蛋白。两个切割半结构域可以来源于相 同的内切核酸酶 ( 或其功能性片段 ), 或者每个切割半结构域可以来源于不同的内切核酸 酶 ( 或其功能性片段 )。此外, 两个融合蛋白与其各自靶位点的结合使所述切割半结构域 以彼此相对的空间方向定位, 这允许所述切割半结构域例如通过二聚形成功能性切割结构 域。因此, 两个靶位点之间可以有任何整数的核苷酸或核苷酸对 ( 例如 2 至 50 个核苷酸对 或更多 )。
通常, 如果使用的两个融合蛋白中的每个都包含切割半结构域, 则每个融合蛋白 的锌指部分的主要接触链将在不同的 DNA 链上, 并且在相反的方向中。即对于一对 ZFP/ 切 割半结构域融合体而言, 靶序列位于相反的链上, 并且两种蛋白质以相反的方向结合。 限制性内切核酸酶存在于多种物种中, 并能序列特异地与 DNA( 在识别位点处 ) 结 合, 并在结合位点或者邻近结合位点处切割 DNA。某些限制性酶 ( 例如 IIS 型 ) 在远离识别 位点的位点处切割 DNA, 并具有可分的结合和切割结构域。例如, IIS 型酶 FokI 在离其一条 链上的识别位点 9 个核苷酸和离另一链上的识别位点 13 个核苷酸处催化 DNA 的双链切割。 因此, 在一个实施方案中, 融合蛋白包含来自至少一种 IIS 型限制性酶的切割结构域 ( 或切 割半结构域 ) 和一个或多个锌指结合结构域。
IIS 型限制性酶的实例包括包括 FokI、 AarI、 AceIII、 AciI、 AloI、 BaeI、 Bbr7I、 CdiI、 CjePI、 EciI、 Esp3I、 FinI、 MboI、 sapI、 和 SspD51, 但并不限于这些, 更具体的参见 Roberts et al.(2003)Nucleic Acid Res.31 : 418-420。 在具体的实施方案中, 将从 IIS 型 限制性酶 FokI 分离 DNA 结合结构域所获得的 FokI 切割结构域用作切割结构域 ( 或半切割 结构域 )。
本发明的融合蛋白是指两个或更多个不同的多肽通过肽键连接形成的多肽。 所述 多肽包含锌指结构域和能切割核苷酸序列中的任何靶位点的核苷酸切割结构域。 本文中的 融合蛋白与锌指核酸酶或 ZFN 交替使用。
设计和构建融合蛋白 ( 或者编码融合蛋白的多核苷酸 ) 的方法在本领域是公知 的。 在一个具体的实施方案中, 构建的是编码融合蛋白的多核苷酸, 所述融合蛋白包含锌指 结构域和切割结构域。可以将所述多核苷酸插入载体中, 并可将所述载体导入细胞。通常, 融合蛋白 ( 例如 ZFP-FokI 融合体 ) 成分的排列使得锌指结构域距所述融合蛋白的氨基末 端 (N- 末端 ) 最近, 切割半结构域距羧基末端 (C- 末端 ) 最近。这反映了诸如来源于 FokI 酶的天然存在的二聚化切割结构域中的切割结构域的相对方向, 其中 DNA 结合结构域距氨 基末端最近, 切割半结构域距羧基末端最近。
本文所用的术语 “序列” 是指任何长度的核苷酸序列, 可以为 DNA 或 RNA ; 可以为线 状、 环状或分枝的并且可以为单链或双链。
本文所用的术语 “结合” 是指巨分子之间 ( 例如蛋白质和核酸之间 ) 序列特异的
或非共价的相互作用。只要相互作用作为整体是序列特异性的, 而不需要结合相互作用的 所有成分均是序列特异性的 ( 例如与 DNA 主链中的磷酸残基接触 )。这种相互作用的特征 通常为解离常数 (Kd) 为 10-6M-1 或更小。术语 “亲和力” 是指结合的强度 : 结合亲和力的提 高与 Kd 降低相关。
按照另一方面, 本发明涉及用于切割、 替换或修饰靶区中的 DNA 序列的试剂盒, 所 述试剂盒包含一对或多对锌指核酸酶。
通常, 由于锌指核酸酶 (ZFN) 以二聚体的形式发挥作用, 因此针对单个 DNA 位点需 要制备两个 ZFN 单体。构成 ZFN 对的两个单体 ZFN 的中的每个与两个 9-bp 或 12-bp 的半 位点中的一个结合, 所述两个 9-bp 或 12-bp 的半位点由 5-bp 或 6-bp 的间隔序列分开。对 于单个半位点, 可以设计多个由不同的 ZF 组构成的单体 ZFN, 该不同的 ZF 组具有相同或相 似 DNA 结合特异性。在具体的实施方案中, 由相同或相似锌指结构域构成的 ZFN 对显示在 表 2 中, 但并不限于这些。多个组合 ZFN 对可以针对单个位点。
可以将本文所用的术语 “替换” 理解为表示一条核苷酸序列被另一条核苷酸序列 替换 ( 即信息层面的序列替换 ), 而并不必然需要用另一个多核苷酸物理或化学替换一个 多核苷酸。本文所用的术语 “修饰” 表示通过突变或非同源性末端连接而发生的 DNA 序列 中的改变。所述突变包括点突变、 取代、 缺失、 插入等。所述替换或修饰可以是用遗传信息 完全的核苷酸取代或改变遗传信息不完全的核苷酸。 由核苷酸序列所编码的肽也可以通过 突变而被功能失活。通过这种方式, 可以将锌指核酸酶用作基因治疗的工具。在一个具体 的实施方案中, 证实了针对敲除编码 CCR5 蛋白的人趋化因子 (C-C 基序 ) 受体 5(CCR5) 基 因的 ZFN, 该 CCR5 蛋白是人类免疫缺陷病毒 (HIV) 感染靶细胞所用的主要共受体。 当结合例如细胞、 核酸、 蛋白质或载体使用时, 术语 “重组体” 表示所述细胞、 核酸、 蛋白质或载体通过导入异源核酸或蛋白质或改变天然的核酸或蛋白质而被修饰, 或者表示 该细胞来源于进行这种修饰的细胞。因此, 例如, 重组细胞表达在天然的 ( 天然存在的 ) 细 胞形式中未被发现的基因, 或者表达以其它方式正常表达或非正常表达的、 低表达或根本 不表达的第二拷贝的天然基因。
按照另一方面, 本发明涉及产生锌指核酸酶的方法, 所述方法包括 : (a) 在目的区 域中选择核苷酸序列 ; (b) 选择与所述序列结合的锌指模块并工程改造锌指结构域, 其中 所述锌指结构域包含三个或更多个锌指模块, 两个或更多个所述锌指模块来源于天然存在 的、 野生型的锌指模块, 以及 (c) 表达包含工程锌指结构域和核苷酸切割结构域的融合蛋 白。
在产生本发明的锌指核酸酶的方法中, 步骤 (a) 是选择目的区域中的核苷酸序列 的步骤。所述核苷酸序列可以存在于细胞内或细胞外, 长度是不受限制的。核苷酸可以为 线状或环状的、 单链或双链的。
步骤 (b) 是选择与目的区域中的核苷酸序列结合的锌指模块并工程改造锌指结 构域的步骤。 优选地, 所述锌指结构域包含三个或更多个锌指模块, 两个或更多个所述锌指 模块来源于天然存在的、 野生型的锌指模块, 更优选图 1 所示的锌指模块, 甚至更优选图 2 所示的锌指模块。
步骤 (c) 是表达包含锌指结构域和核苷酸切割结构域的融合蛋白的步骤。所述表 达包括体内和离体表达。可以通过本领域内已知的方法进行体内表达, 例如利用载体。载
体的实例包括但不限于质粒、 黏粒、 噬菌体和病毒载体, 但是并不限于这些。可以根据用途 通过包含分泌信号序列以及调控元件来制备合适的表达载体, 所述调控元件元件例如启动 子、 操纵子、 起始密码子、 终止密码子、 多腺苷酸化信号和增强子。
按照另一方面, 本发明涉及利用锌指核酸酶来切割目的区域中的细胞染色质的方 法。
在一个具体的实施方案中, 本发明提供了切割目的区域中的细胞染色质的方法, 包括以下步骤 : (a) 在目的区域中选择第一核苷酸序列 ; (b) 选择与第一核苷酸序列结合 的第一锌指核酸酶 ; (c) 在包含所述核苷酸序列的细胞内或细胞外表达所述第一锌指核酸 酶, 从而将所述核酸酶导入所述细胞中, ; 以及 (d) 使所述第一锌指核酸酶 ( 其在细胞内表 达或被导入细胞 ) 与所述序列结合, 以便切割目的区域中的细胞染色质。
本发明的第一锌指核酸酶包括三个或更多个锌指模块, 两个或更多个所述锌指模 块来源于天然存在的、 野生型的锌指模块。
在另一个具体的实施方案中, 本发明提供了切割目的区域中的细胞染色质的方 法, 包括以下步骤 : (a) 在目的区域中选择第一核苷酸序列 ; (b) 选择与第一核苷酸序列结 合的包含本发明的第一锌指结构域和第一核苷酸切割结构域的第一锌指核酸酶 ; (c) 在包 含所述核苷酸序列的细胞内或细胞外表达所述第一锌指核酸酶, 用于将所述核酸酶导入所 述细胞 ; 以及 (d) 使第一锌指核酸酶 ( 其在细胞内表达或被导入细胞 ) 与所述序列结合, 以 便切割目的区域中的细胞染色质 ; (e) 在包含所述核苷酸序列的细胞内或细胞外选择并表 达第二锌指核酸酶, 从而将所述核酸酶导入所述细胞中, 其中所述第二锌指核酸酶包含第 二锌指结构域和第二核苷酸切割结构域 ; 以及 (f) 使所述第二锌指核酸酶 ( 其在细胞内表 达或被导入细胞 ) 与目的区域中的所述第二核苷酸序列结合, 其中所述第二序列与所述第 一锌指核酸酶所结合的所述第一核苷酸序列之间的距离为 2-50 个核苷酸。
本文所用的 “染色质” 是指包含细胞基因组的核蛋白质结构。细胞染色质包含核 酸、 主要的 DNA 和蛋白质, 所述蛋白质包括组蛋白和非组蛋白染色体蛋白质。细胞染色质 可存在于任何类型的细胞中, 包括原核和真核细胞、 例如真菌、 植物、 动物、 哺乳动物、 灵长 类动物和人类细胞。大多数真核细胞染色质以核小体的形式存在, 其中核小体中心包含约 150 个碱基对的 DNA 和连接的包含组蛋白 H2A、 H2B、 H3 和 H4 每种两个的八聚体 ; 并且连接 物 DNA( 取决于有机体长度可变 ) 在核小体中心间延伸。组蛋白 H1 分子通常与连接物 DNA 连接。 为了公开本发明的目的, 术语 “染色质” 意图包括所有的细胞核蛋白质类型, 原核生物 的和真核生物的。细胞染色质包括染色体染色质和附加体染色质。 “染色体” 是包含所有或 部分细胞基因组的染色质复合物。 “附加体” 是复制中的核酸、 核蛋白质复合物或包含的核 酸不是细胞染色体组型的一部分的其它结构。附加体的实例包括质粒和某些病毒基因组。
在另一个具体的实施方案中, 本发明提供了切割目的区域中的细胞染色质的方 法, 包括以下步骤 : (a) 选择目的区域 ; (b) 提供与所述目的区域中的第一核苷酸序列结合 的第一锌指结构域 ; (c) 提供与所述目的区域中的第二核苷酸序列结合的第二锌指结构 域, 其中所述第二序列与所述第一序列之间的距离为 2-50 个核苷酸 ; (d) 在细胞中同时或 相继表达所述第一锌指核酸酶和所述第二锌指核酸酶, 其中所述第一锌指核酸酶包含第一 锌指结构域和第一核苷酸切割结构域, 所述第二锌指核酸酶包含第二锌指结构域和第二核 苷酸切割结构域 ;其中所述第一和第二锌指结构域包含三个或更多个锌指模块, 两个个或更多个所 述锌指模块来源于天然存在的锌指模块, 以及
所述第一锌指结构域与所述第一核苷酸序列结合, 所述第二锌指结构域与所述第 二核苷酸序列结合, 而且其中所述结合定位了核苷酸切割结构域, 使得所述目的区域中的 细胞染色质被切割。
对于利用本发明锌指核酸酶进行靶向切割, 锌指结构域的结合位点可以包括切割 位点, 或者接近结合位点的边缘可以离所述切割位点 1 至 50 个核苷酸。绘制切割位点的方 法是本领域技术人员已知的。
切割 DNA 的位点通常位于两个融合蛋白的结合位点之间。DNA 的双链断裂通常由 两处单链断裂产生, 或者由错移 1、 2、 3、 4、 5、 6 或更多个核苷酸的 “缺口” 产生, 例如, 天然 FokI 切割的双链 DNA 由错移 4 个核苷酸的单链断裂产生。因此, 切割并非必然在每条 DNA 链上的完全相对的位点处发生。此外, 融合蛋白的结构和靶位点间的距离可以影响切割是 临近单核苷酸对发生还是切割在数个位点处发生。
本文所用的 “靶位点” 是锌指结构域所识别的核酸序列。单一的靶位点通常具有 约 6 至约 12 个碱基对。通常, 具有 3 个锌指模块的锌指蛋白识别两个相邻的 6 至 10 个碱 基对的靶位点, 并且具有 4 个锌指模块的锌指蛋白识别两个相邻的 9 至 12 个碱基对的靶位 点。术语 “相邻的靶位点” 表示相隔 0 至约 5 个碱基对的不重叠的靶位点。
如上文所指出的, 融合蛋白可以以多肽和 / 或多核苷酸的形式被导入。例如, 可以 将两条多核苷酸 ( 每条所包含的序列均编码上文提到的多肽中的一种 ) 导入细胞, 在靶序 列或靶序列附近发生切割。 可选地, 将包含编码两段多肽的序列的单一多核苷酸导入细胞。 多核苷酸可以是 DNA、 RNA 或 DNA 和 / 或 RNA 的任何修饰形式或同源物。
按照另一方面, 本发明涉及利用锌指核酸酶来替换细胞染色质中目的区域的第一 核苷酸序列的方法。
在具体的实施方案中, 本发明提供了替换细胞染色质中目的区域的第一核苷酸序 列的方法, 包括以下步骤 : (a) 工程改造出与所述目的区域中的第二核苷酸序列结合的第 一锌指结构域, 其中所述第二序列包含至少 9 个核苷酸 ; (b) 提供与第三核苷酸序列结合的 第二锌指结构域, 其中所述第三序列包含至少 9 个核苷酸, 并且与所述第二序列之间的距 离为 2-50 个核苷酸 ; (c) 在细胞中表达第一锌指核酸酶和第二锌指核酸酶, 其中所述第一 锌指核酸酶包含第一锌指结构域和第二核苷酸切割结构域, 所述第二锌指核酸酶包含第二 锌指结构域和第三核苷酸切割结构域 ; 以及 (d) 将所述细胞暴露于包含第四核苷酸序列的 多核苷酸, 其中所述第四核苷酸序列与所述第一核苷酸序列是同源的但并非一致的 ;
其中所述第一和第二锌指结构域包含三个或更多个锌指模块, 一个个或多个所述 锌指模块来源于天然存在的锌指模块, 以及
所述第一锌指核酸酶与所述第二序列的结合, 和所述第二锌指核酸酶与所述第三 序列结合定位了切割结构域, 使得所述目的区域中的细胞染色质被切割, 进而促进所述第 一核苷酸序列和所述第四核苷酸序列之间的同源重组, 导致所述第一核苷酸序列被所述第 四核苷酸序列替换。
本公开提供了特征为更高的靶向重组效率和更低的非特异的插入事件的靶向序 列改变方法。由于细胞 DNA 中的双链断裂刺激切割位点附近的同源重组提高数千倍, 因此这种靶向切割允许改变或替换 ( 通过同源重组 ) 基因组中几乎任何位点处的序列。
除了融合蛋白 ( 锌指核酸酶 ) 之外, 所选的基因组序列的靶向替换还需要供体序 列。可以在表达融合蛋白之前、 同时或之后将所述供体序列导入细胞中。很明显, 所述供体 序列通常与其所替换的基因组序列不同。例如, 供体多核苷酸序列与基因组序列相比可以 包含一个或多个单碱基改变、 插入、 缺失、 倒位或重排, 但是要存在足够的同源性来支持同 源重组。可选地, 供体序列可以包含由两个同源区侧翼连接的非同源序列。此外, 供体序列 可以包含与细胞染色质的目的区域非同源的序列。
此外, 在本方法中, 所述第一核苷酸序列可以优选基因中包含突变的序列, 在这种 情况下, 供体序列, 尤其是第四序列优选是基因的野生型序列。所述突变可以包括点突变、 取代、 缺失或插入。
此外, 在另一个具体的实施方案中, 本发明提供了利用锌指核酸酶来改变细胞染 色质中目的区域的第一核苷酸序列的方法。
具体地, 本发明提供了改变细胞染色质中目的区域的第一核苷酸序列的方法, 包 括以下步骤 : (a) 工程改造出与所述目的区域中的第二核苷酸序列结合的第一锌指结构 域, 其中所述第二序列包含至少 9 个核苷酸 ; (b) 提供与第三核苷酸序列结合的第二锌指结 构域, 其中所述第三序列包含至少 9 个核苷酸, 并且与所述第二序列之间的距离为 2-50 个 核苷酸 ; (c) 在细胞中表达第一锌指核酸酶和第二锌指核酸酶, 其中所述第一锌指核酸酶 包含第一锌指结构域和第二核苷酸切割结构域, 所述第二锌指核酸酶包含第二锌指结构域 和第三核苷酸切割结构域 ; 其中所述第一和第二锌指结构域包含三个或更多个锌指模块, 一个或多个所述锌指模块来源于天然存在的、 野生型的锌指模块, 以及所述第一锌指核酸 酶与所述第二序列的结合, 和所述第二锌指核酸酶与所述第三序列的结合定位了切割结构 域, 使得所述目的区域中的细胞染色质被切割, 导致所述第一核苷酸序列在切割位点发生 改变。 本发明中, 通常可以将编码一种或多种 ZFP 或 ZFP 融合蛋白的核酸克隆进载体中, 转化进原核或真核细胞中来复制和表达。 载体通常是原核或真核载体, 例如质粒、 穿梭载体 或昆虫载体。还通常将编码 ZFP 的核酸克隆进表达载体中, 用来给予植物细胞、 动物细胞, 优选哺乳动物细胞或人类细胞、 真菌细胞、 细菌细胞或原生动物细胞。
表达载体是用一系列指定的核酸元件重组或合成产生的核酸构建体, 所述核酸元 件允许特定的核酸在宿主细胞中转录, 并且任选地允许表达载体在宿主细胞中整合或复 制。表达载体可以是质粒、 病毒或病毒或非病毒来源的核酸片段的一部分。通常, 表达载体 包含 “表达盒” , 表达盒包含可操作地连接于启动子的待转录的核酸。术语表达载体还包括 可操作地连接于启动子的裸露的 DNA。
为了表达克隆的基因或核酸, 通常将编码 ZFP 或 ZFP 融合蛋白的序列亚克隆进含 有指导转录的启动子的表达载体中。合适的细菌和原核启动子在本领域内是公知的。
术语 “可操作地连接” 是指核酸表达调控序列 ( 例如启动子或转录因子结合位点 的排列 ) 和第二核酸序列之间的功能性连接。
本发明中, “宿主细胞” 表示含有锌指核酸酶、 或表达载体或核酸的细胞, 所述表达 载体或核酸两者任选地编码锌指核酸酶。所述宿主细胞通常支持表达载体的复制或表达。 宿主细胞可以是诸如大肠杆菌的原核细胞或真核生物细胞 ( 例如, 酵母、 真菌、 原生动物、
高等植物和昆虫细胞或两栖动物细胞 ) 或哺乳动物细胞 ( 例如, CHO、 HeLa 293、 COS-1 和 HEK, 例如培养的细胞 ( 体外 ))、 外植体和原始培养物 ( 体外和离体 ) 和体内细胞。
术语 “核酸” 是指脱氧核糖核苷酸或核糖核苷酸和其单链或双链形式的聚合物。 该 术语包括含有已知核苷酸类似物或修饰的主链残基或连接物的核酸, 这些核酸是合成的、 天然存在的和非天然存在的, 具有与参考核酸相似的结合特性。这些类似物的实例包括而 不限于, 硫代磷酸酯、 氨基磷酸酯、 膦酸甲酯、 手性膦酸甲酯、 2-O- 甲基核糖核苷酸、 肽核酸 (PNA)。
本文所用的术语 “多肽” 、 “肽” 和 “蛋白质” 是可交替使用的, 是指氨基酸残基的聚 合物。该术语也适用于其中一个或多个氨基酸残基是相应天然存在的氨基酸的人工化学 模拟物的氨基酸聚合物、 以及适用于天然存在的氨基酸聚合物和非天然存在的氨基酸聚合 物。
术语 “氨基酸” 是指天然存在的和合成的氨基酸, 以及以与天然存在的氨基酸相似 的方式起作用的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸是由遗传密码编码的 那些氨基酸、 以及以后进行修饰的那些氨基酸, 例如羟脯氨酸、 γ- 羧基谷氨酸和 O- 磷酸丝 氨酸。氨基酸类似物是指与天然存在的氨基酸具有相同基本化学结构的化合物, 即 α 碳与 氢、 羧基、 氨基和 R 基结合, 例如高丝氨酸、 正亮氨酸、 蛋氨酸亚砜、 蛋氨酸甲基锍。这种类似 物具有修饰的 R 基 ( 例如正亮氨酸 ) 或修饰的肽主链, 但是保留了与天然存在的氨基酸相 同的基本化学结构。氨基酸模拟物是指结构不同于氨基酸一般化学结构, 但是以与天然存 在的氨基酸相似的方式起作用的化合物。可以通过公知的三字母符号或通过 IUPAC-IUB 生 化命名委员会 (Biochemical Nomenclature Commission) 所推荐的单字母符号来表示本文 的氨基酸, 同样可以通过通常所接受的单字母密码来表示核苷酸。 下文将结合实施例对本发明进行详细的描述。然而, 这些实施例仅为示例性的目 的, 并且本发明不受这些实施例所限。
本发明的实施方式
实施例 1 : ZFN 设计和含 ZFN 的质粒的构建
按 “Human zinc fingers as building blocks in the construction of artificial transcription factor( 人类锌指作为构建人工转录因子的构件 ).” (Bae, K.H.et al.Nat Biotechnol 21, 275-280(2003)) 中所描述来组装编码 3- 指或 4- 指阵列的 DNA 片段。在 3- 指或 4- 指阵列中, 选择了具有不同 DNA 结合特异性的 54 种锌指模块 ( 下 文称为 ZF 模块 )。图 1 和 2 中显示了所选的 ZF 模块及其氨基酸序列。在这 54 种 ZF 模块 中, 31 种来源于人类基因组的 DNA 序列, 2 种来源于果蝇基因组的 DNA 序列 ( 图 1)。为了 方便, 将来自人类和果蝇基因组 DNA 序列的 ZF 模块称为 ToolGen 模块。其余的 21 种 ZF 模 块或者选自利用噬菌体展示的 ZF 变体库 (Barbas 模块 ) 或者由定点诱变产生 (Sangamo 模 块 )。
然后, 为了设计多指 ZFN, 我们利用在 ToolGen 开发出的计算机算法来鉴定人类趋 化因子 (C-C 基序 ) 受体 5(CCR5) 编码区的 DNA 序列中的潜在 ZFN 靶位点。基于该结果, 本 发明人通过 54 种 ZF 模块的组合合成了 208 种 ZFN 单体, 并且图 2 中显示了代表性 ZFN 对 的氨基酸序列。这 315 种 ZFN 对一共意图靶向于 CCR5 基因中的 33 个位点 ( 参见图 3)。
将 由 3 或 4 个 ZF 模 块 组 成 的 锌 指 结 构 域 整 合 进 来 源 于 海 床 黄 杆 菌
(flavobacterium okeanokoites) 基因组 DNA 的 FokI 内切核酸酶结构域, 并将整合的序列 克隆进 p3 中, p3 是 pcDNA3.0 质粒 (Invitrogen) 的改良版。
实施例 2 : 体外和体内测定 ZFN 活性
2-1. 体外消化测定
首先, 利用体外转录和翻译 (IVTT) 系统制备 ZFN, 并与包含 CCR5 编码序列的 DNA 片段一起孵育, 以评价其体外 DNA 限制性活性。具体而言, 利用 TnT 快速偶联的转录 / 翻译 系统 (Promega) 按照生产商的描述 ( 体外转录和翻译 ; IVTT) 使实施例 1 中设计的 ZFN 在 体外被转录和翻译。简而言之, 将编码 ZFN 的质粒 ( 每种 0.5μl) 加至 TnT Quick master mix(20μl) 和 1mM 蛋氨酸 (0.5μl) 中, 并于 30℃孵育 90 分钟。首先用限制性酶消化含有 CCR5 编码序列的靶质粒, 使之为线性。然后与一对 ZFN IVTT 裂解物 ( 每种 1μl) 在 37℃ 在 NEBuffer 4(New England Biolabs) 中孵育 2 小时来消化该靶质粒 (1μg)。通过加热 (65℃ ) 使反应混合物失活, 然后于 13,000rpm 离心。上清用于琼脂糖凝胶分析。图 4 是该 测定的示意图, 结果显示在图 5 中。
如图 5 所示, 多种 ZFN 对 (44% ) 表现出对靶 DNA 有效的位点特异性切割。
2-2 : 单链退火系统
然后本发明人利用基于哺乳动物细胞的单链退火 (SSA) 系统来检验这些 ZFN 是否 能在人体细胞中诱导同源重组。
2-2-1. 基于细胞的测定中所用的报告质粒
利用以下表 1 中的引物 1 和 2 从 pGL3-control(Promega) 扩增出萤火虫荧光素酶 基因的 3’ 部分, 并将该扩增产物克隆进 pcDNA5/FRT/TO(Invitrogen) 的 BamHI 和 XhoI 位 点。接下来将用以下表 1 中的引物 3 和 4 扩增出的荧光素酶基因的 5’ 部分克隆进上述得 到的质粒的 HindIII 和 BamHI 位点。利用以下表 1 中的引物 5 和 6 将 I-SceI 结合位点克 隆进该报告质粒的 BamHI 位点。将利用引物 7 和 8 扩增出的 CCR5 编码序列克隆进该报告 质粒的 BamHI 位点。
表1
2-2-2. 细胞培养和报告细胞系的建立
用含实施例 1 中的 ZFN 编码序列的质粒转化 HEK293T/17(ATCC, CRL-11268TM) 细胞 和 Flp-InTM T-RExTM 293 细胞 (Invitrogen), 将该转化的细胞在补有 100 单位 /ml 青霉素、 100μg/ml 链霉素、 0.1mM 非必需氨基酸和 10%胎牛血清 (FBS) 的达尔伯克氏改良伊格尔培 养基 (DMEM) 中维持。按照生厂商的说明书将编码断裂的荧光素酶基因的报告质粒稳定整 合进 Flp-InTM T-RExTM 293 细胞中。 简单而言, 用所述报告质粒和 pOG44(Flp 重组酶表达载 体 ) 共转染该细胞, 并用潮霉素 B 进行选择。鉴定携带断裂的荧光素酶基因的克隆细胞系, 用于 SSA 测定。
2-2-3. 利用 SSA 系统进行基于细胞的测定
用 Lipofectamine 2000(Invitrogen) 将每对 ZFN 表达质粒 ( 每种 100ng) 转染进 30,000 报告细胞 / 孔的 96 孔板中。48 小时后, 通过与强力霉素 (1μg/ml) 一起孵育来诱 导荧光素酶基因。孵育 24 小时后, 将细胞在 20μl 的 1× 裂解缓冲液 (Promega) 中裂解, 并用 10μl 荧光素酶测定剂 (Promega) 加 2μl 细胞裂解物来测定荧光素酶活性。
2-2-4. 结果
用表达 ZFN 的质粒转染人胚肾细胞 (HEK 细胞 ), 该细胞的基因组含有稳定整合的、 通过插入 CCR5 序列而被中断的部分复制的萤火虫荧光素酶基因。有效的 ZFN 能在 CCR5 序 列中产生双链断裂 (DSB), 这应该允许经由 SSA 恢复功能性荧光素酶基因。可以通过检测 荧光素酶酶活性来估计 ZFN 的 DNA 切割效率。高效的大范围核酸酶 I-SceI 用作阳性对照。 实验步骤的示意图如图 6 所示, 结果显示在图 7 中。
如图 7 所示, 本测定中, 多对 ZFN 产生了显著的荧光素酶活性。 在 315 对 ZFN 当中, 与阳性对照 I-SceI 相比, 23 对表现出 15% -57%的荧光素酶活性。表现出小于 15%的活 性的 ZFN 对仍可能在细胞中诱导双链断裂, 但是本发明人集中于高活性的 23 对, 用于进一 步的研究。当这 23 对 ZFN 二聚体使用无靶标的报告细胞时, 它们没有产生显著的荧光素酶
活性, 所述无靶标的报告细胞的基因组所包含的部分复制的荧光素酶基因由与 CCR5 无关 的 DNA 序列中断 ( 数据未显示 )。这些结果提示 ZFN 介导的 DNA 修复是 CCR5 特异的。
实施例 3 : 在 ZFN 处理的 HEK293 细胞中检测突变
发明人研究了既在 IVTT 测定中表现出内切核酸酶活性又在基于细胞的测定中诱 导萤光素酶活性的 ZFN 是否能修饰细胞中的内源靶序列。由 ZFN 诱导的双链断裂可以通过 易出错的非同源性末端连接 (NHEJ) 来修复。产生的 DNA 通常在 DSB 位点附近含有小的插 入或缺失 ( 插入 / 缺失突变 )。可以通过用错配敏感的 T7 内切核酸酶 I(T7E1) 处理扩增的 DNA 片段来体外检测这些插入 / 缺失突变 ( 参见图 8)。
具体而言, 利用 Lipofectamine 2000(Invitrogen) 用两种编码 ZFN 对的质粒 ( 每 种 100ng) 转染于 96 孔板中预培养的 HEK293T/17 细胞。孵育 72 小时后, 利用 G-spinTM 基 因组 DNA 提取试剂盒 (iNtRON BIOTECHNOLOGY) 按照生厂商的描述从 ZFN 转染的细胞提取 基因组 DNA。扩增包含所述 ZFN 靶位点的基因组区, 解链并退火形成异源双螺旋 DNA。引物 9 和 12 用于 Z30 位点、 引物 10 和 12 用于 Z266 和 Z360 位点、 引物 11 和 12 用于 Z410、 Z426 和 Z430 位点、 并且引物 13 和 14 用于 Z836 和 Z891 位点 ( 参见表 1)。用 5 单位 T7 内切核 酸酶 1(New England BioLabs) 对退火的 DNA 于 37℃处理 15 分钟, 然后通过加入 2.5 倍体 积的乙醇来沉淀。通过琼脂糖凝胶电泳分析沉淀的 DNA。结果显示在图 9 中。
如图 9 所示, 从 ZFN 处理的细胞扩增出的 DNA 的小部分被 T7E1 切割。每对 ZFN 产 生不同的切割模式, 反映出这些 ZFN 靶向于 8 个不同的位点的事实。此外, 得到的 DNA 条带 的大小同预期一样。在 T7E1 测定中测试的 23 对 ZFN 中, 21 对表现出可检测到具有预期大 小的 DNA 条带 ( 数据未显示 )。
本发明人还利用 T7E1 测定来检测这种代表性的 ZFN 对 : 或者在 IVTT 测定中未表 现出显著的内切核酸酶活性或者在基于细胞的 SSA 系统中未引起显著的萤光素酶活性但 是通过 IVTT 检验的 ZFN 对。T7E1 测定结果显示, 这些 ZFN 对中没有一个能诱导出可检测水 平的 DNA 突变。
实施例 4 : 对 ZFN 诱导的突变进行 DNA 序列分析
本发明人选择用于进一步研究的 8 对有代表性的 ZFN 对, 每一对均靶向于 CCR5 基 因的不同位点 ( 参见表 2)。他们首先检验这 8 种单独的 ZFN 中的任一种是否能以同二聚体 的形式发挥作用。利用 T7E1 测定来分析单独的每种 ZFN 单体的基因靶向活性。同预期一 样, 没有一种 ZFN 单体能产生可检测的 DNA 切割 ( 数据未显示 )。
表2
然后本发明人测定靶区的 DNA 序列, 以证实 ZFN 诱导的突变并估计诱变率。对 从 8 对 ZFN 中的每一对所转染的细胞扩增出的 DNA 进行克隆并测序。在 DSB 位点附近 观察到多种缺失和插入 ( 参见图 10-14)。这些诱变模式是易错 NHEJ 相关诱变的标志, 并且其它文献中已报道了相似的模式 (Bibikova, M., Golic, M., Golic, K.G.& Carroll, D.Targeted chromosomal cleavage and mutagenesis in Drosophila using zinc-finger nucleases( 利用锌指核酸酶在果蝇中进行定向染色体切割和定向诱变 )Genetics 161, 1169-1175(2002) ; Morton, J., Davis, M.W., Jorgensen, E.M.& Carroll, D.Induction and repair of zinc-finger nuclease-targeted double-strand breaks in Caenorhabditis elegans somatic cells( 对秀丽隐杆线虫 (Caenorhabditis elegans) 体细胞中锌指核酸 酶引起的双链断裂的诱导和修复 ).Proc Natl Acad Sci U S A 103, 16370-16375(2006) ; Santiago, Y.et al.Targeted gene knockout in mammalian cells by using engineered zinc-finger nucleases( 利用工程锌指核酸酶在哺乳动物细胞中定向敲除基因 ).Proc Natl Acad Sci U S A 105, 5809-5814(2008))。除了小的 indel 突变和取代之外, 本发明 人还观察到两对 ZFN( 参见图 11 中的 Z30 和图 12 中的 Z360) 引起的相对大的插入 ( 每对 插入不同的 81 个核苷酸 )。DNA 序列分析揭示, 插入的序列来自编码 ZFN 的质粒。
靶向于不同位点的 8 对 ZFN 显示出 2.4% -17%的诱变率 ( 参见图 15), 这是通过 突变克隆数除以被分析的总克隆数计算得出的。这些高效的 ZFN 诱导的突变作用提示, 仅 筛选 10-100 个来源于单细胞的集落就可以分离出克隆的突变细胞。
实施例 5 : ZFN 处理后克隆细胞的分离
5-1. 本发明 ZFN 的脱靶效应
据了解, 当在哺乳动物细胞中表达时, 某些 ZFN 具有脱靶效应, 并且是细胞毒性 的 (Szczepek, M.et al.Structure-based redesign of the dimerization interface reduces the toxicity of zinc-finger nucleases( 对 二 聚 界 面 基 于 结 构 的 重 新 设 计 降 低 了 锌 指 核 酸 酶 的 毒 性 ).Nat Biotechnol 25, 786-793(2007) ; Miller, J.C.et al.An improved zinc-finger nuclease architecture for highly specific genome editing( 改 善 锌 指 核 酸 酶 结 构 用 于 高 特 异 性 的 基 因 组 编 辑 ).Nat Biotechnol 25, 778-785(2007))。本发明人观察到本发明 ZFN 转染的 HEK293 细胞生长没有显著迟缓。然 而, 当他们最初筛选有限数量的单细胞集落时, 他们无法分离基因组序列被 ZFN 处理所修 饰的克隆的突变细胞, 这表明携带 ZFN 诱导突变的哺乳动物细胞随着生长而减少。
因此, 为了研究携带 ZFN 诱导突变的哺乳动物细胞是否随着生长而减少, 并因此 被非修饰的细胞所超越, 本发明人用从 ZFN 转染后第 3、 6 和 9 天时的细胞所分离的 DNA 进 行 T7E1 测定。对于本次分析他们选择了 Z891 对, 并且如图 16 所示, 与第 3 天相比, 在第 6 天时切割的 DNA 片段明显减少, 并且在 ZFN 处理后第 9 天时, 几乎检测不到切割的 DNA 片段。 这些结果提示 ZFN 介导的诱变作用确实对细胞生长具有细胞毒效应。
5-2. 本发明异二聚 ZFN 的脱靶效应
ZFN 的脱靶效应主要由形成同二聚或异二聚的 ZFN 单体的活性引起。通过利用能 形成异二聚体但不能形成同二聚体的 FokI 核酸酶变体可以显著降低这些效应。因此, 为了 降低 ZFN 的细胞毒效应, 本发明人在 T7E1 测定中制备并检验了两种不同类型的所谓的强制 型异二聚体 ( 表示为图 16 中的 “RR/DD” 二聚体和 “KK/EL” 二聚体 )。T7E1 测定表明, 当细 胞用 RR/DD ZFN 对转染时, 甚至在 ZFN 处理后第 9 天时仍存在切割的 DNA 片段。 为了证实该 强制型异二聚 ZFN 的细胞毒性的降低是由其在细胞中 DNA 切割的特异性增强引起, 本发明 人利用抗 53BP1( 被吸引至 DSB 的蛋白质 ) 的抗体分析 ZFN 处理细胞中的 DSB 的数量。 具体 而言, 用 HEK293T/17 细胞进行 53BP1 的核内染色。用带盖的 Lab-Tek 腔室玻片 (NUNC) 附 着细胞, 并用 3.7%的甲醛来固定该细胞来制备玻片。然后通过用 0.2% Triton X-100 的 磷酸盐缓冲盐水 (PBS) 的处理使该细胞于室温 (RT) 渗透 10 分钟。然后将细胞与抗 53BP1 的兔多克隆抗体 (Bethyl Laboratories) 孵育, 存在 5%牛血清白蛋白 (BSA) 以封闭非特 异性着色, 接下来与 Alexa Fluor 488 偶联的二抗 (Invitrogen-Molecular Probes) 孵育。 将玻片置于 DAPI(Sigma) 中来复染细胞核, 并在免疫荧光显微镜 (Carl Zeiss-LSM510) 下 检查。结果显示在图 17 和 18 中。如图 17 和 18 所示, 当与用对应的野生型 ZFN 对处理的 细胞相比, 用 RR/DD ZFN 对处理的细胞中 53BP1 位点的数量显著减少。
5-3. 在用 ZFN 处理的基因组中检测突变
接下来, 在筛查分别在 96 孔板上生长的 225 个单细胞集落之后, 随即分离出了利 用 Z891 RR/DD ZFN 对的 7 种不同的突变的克隆 HEK293 细胞。本发明人检验这些克隆细胞 中 CCR5 区的 DNA 序列, 以确认 ZFN 诱导的基因组修饰。对修饰细胞基因组的 DNA 序列的分 析表明, 7 个克隆中有 6 个表现为单等位基因的缺失或插入, 以及 1 个表现为 CCR5 基因的双 等位基因修饰 ( 参见图 19)。由于有一部分三体细胞, 因此 HEK293 细胞在其基因组中携带 三个 CCR5 基因拷贝。在表现为双等位基因修饰的克隆中, 观察到一段未修饰的、 野生型序列 ( 参见图 19)。 这种由 ZFN 处理引起的双等位基因修饰提示, 仅在一个不用选择标记的步 骤中, 就可以分离纯合的敲除细胞。
实施例 6 : 靶向于 CCR5 的 ZFN 在同源的 CCR2 位点处的脱靶效应
CCR2 基因与 CCR5 基因是高度同源的, 并且多个 CCR5 ZFN 识别元件在 CCR2 基因 座中是保守的。因此, 本发明人研究为 CCR5 位点所设计的 8 对 ZFN 是否也能修饰 CCR2 基 因座处的同源或一致的序列。在 CCR2 基因中具有相同识别元件的三对 ZFN(Z360、 Z410 和 Z430) 能在 T7E1 测定中诱导有效的基因组修饰 ( 参见图 20)。在 CCR2 基因中, Z891 对的识 别元件由与 CCR5 基因的对应位点完美匹配的 12-bp 半位点和携带一个碱基的错配的 12-bp 的半位点组成。同预期一样, 该 Z891 对也在 CCR2 位点处表现出显著的基因靶向活性。本 发明人还检验了 Sangamo 的靶向于 CCR5 的 ZFN 对, 其在 CCR2 基因座中的识别元件在每个 12-bp 半位点中含有一个碱基的错配, 并且证实该 ZFN 在同源的 CCR2 位点处表现出脱靶基 因组修饰 ( 参见图 20)。相反, 对于 ZFN 对 (Z30、 Z266 和 Z836) 没有观察到可检测的 ZFN 活 性, 这些 ZFN 对在 CCR2 基因座的识别元件显示出至少两个错配。
本发明人还检验了通过 Z891 对转染的 HEK293 细胞所获得的 7 种突变的克隆细胞 除了在预期的 CCR5 位点诱导突变之外, 在高度同源的 CCR2 位点的 DNA 序列中是否诱导突 变。结果显示在图 21 中。尽管如图 20 所描述, Z891 对在 T7E1 测定中在 CCR2 位点以及在 CCR5 位点均表现出显著的基因靶向活性, 但是这些克隆细胞系的 CCR2 基因座没有被突变。 这些结果表明, 可能分离出克隆细胞, 其中 ZFN 处理之后通过筛查细胞仅在预期的靶位点, 而不在同源的位点被突变。 实施例 7 : 模块交换分析
本发明人随后研究了为什么我们经由模块组装来制备 ZFN 的方法能导致高成功 率的基因组编辑。具体而言, 他们进行了模块交换实验, 其中用从 Barbas 或 Sangamo 模块 产生的表现出相同 DNA- 结合特异性的那些 ZFN 替代本发明的 ZFN。
为此, 本发明人制备了 8 种新的仅由 Barbas 或 Sangamo 模块组成的 ZFN 单体, 并 用它们来替代 6 种不同的仅由 ToolGen 模块组成的 ZFN 单体 ( 参见表 3 和图 22)。将这些 新的 ZFN 单体中的每一种与合适的伴侣 ZFN 单体配对, 并在 SSA 和 T7E1 测定中检验得到的 ZFN 对。如图 23 和 24 所示, 由至少一种这些新合成的 ZFN 单体所组成的 ZFN 对中, 没有一 种在 SSA 系统中表现出任何显著的活性 ( 参见图 23)。此外, 这些 ZFN 中没有一种在 T7E1 测定中表现出任何基因靶向活性 ( 参见图 24)。
表3
这些结果强有力地支持这种观点 : 对于功能性 ZF 阵列的模块式组装, 天然存在的 ZF 比工程 ZF 能构成更可靠的框架。
实施例 8 : 对本发明 ZF 模块的评价
对本发明人产生的 315 对 ZFN 的统计学分析可以为新 ZFN 的设计提供基础, 该新 ZFN 可用来定向诱变其它感兴趣的内源基因。为此, 本发明人计算出在 SSA 系统中为阳性 评分的 23 对 ZFN 中每种 ZF 的出现次数。然后他们用该次数除以所有 208 种 ZFN 单体中 该模块出现的次数来确定每种 ZF 的 “活性评分” ( 参见图 1 和 2)。某些高活性的 ZF, 例如 “QNTQ” 和 “RSHR” 分别具有 50%和 38%的活性评分 ; 这些高活性评分提示, 就预测体内位 点特异的核酸酶活性而言, 这些模块是可靠的。 其它 ZF, 例如在本测定中表现为无效模块的 “QSNK” 和 “rdae” , 显示的活性评分为 0。这两种 ZF 都用了 15 次, 但是含有这些模块的 ZFN 中, 没有一种在我们的测定中是有活性的。本发明人还比较了具有相同 DNA 识别特异性的 ZF 的活性评分。某些 ZF 明显比其它相同靶标的模块好, 例如, “DSNR” 和 “HSNK” 识别相同 的 GAC 序列。在构建 ZFN 中用 “DSNR” 产生了多种活性核酸酶 ( 活性评分= 35% ), 而并入 “HSNK” 只产生了非活性的 ZFN( 活性评分= 0% )。
基于统计学分析, 本发明人暂时推荐了 37 种 ZF(24 种 ToolGen 模块、 1 种 Sangamo
模块和 12 种 Barbas 模块 ), 用于将来的基因编辑研究中 ( 参见图 1 和 2)。如果本发明 人在实验中仅使用这 37 种模块, 总成功率应该是 53%, 这显著优于现在的成功率 (24% ) ( 参见图 26)。这 37 种模块均在活性 ZFN 中出现至少一次。当有两个或更多个相同靶标 的 ZF 时, 他们选择具有较高活性评分的那些 ZF。37 种 ZF 共识别 64 个 3-bp 亚位点中的 38 个。对于给定的 1-kbp 的随机 DNA 序列, 他们预测, 对于 3 指 ZFN 二聚体有 88 个 [ = 6 (38/64) ×1000×2] 潜在靶位点 ( 在半位点之间包含 5 或 6 个碱基的间隔 ), 并且对于 4 指 ZFN 二聚体有 31 个位点。假设本发明有 9.1%至 26%的成功率 ( 如果我们使用 37 种 ZF 而 不是其它的无效模块, 则实际成功率将显著提高 ), ZFN 介导的基因组编辑在 1-kbp 的靶序 列中平均可能有 8 个位点。这提示, 利用本发明的 ZFN 组装方法, 应该 “可靶向” 即使不是 全部也是大多数的真核生物基因。
工业实用性
背景技术 限制性酶是基因工程和分子生物学中不可或缺的工具。致力于创造识别并切割 9 个或更多个碱基对 (bp) 的特定 DNA 序列的、 被称为 “稀有切点酶 (rare cutter)” 的新的限 制性酶。其中, 锌指核酸酶技术的作用为利用限制性酶来识别并切割多种 DNA 碱基序列, 该 限制性酶是由锌指 DNA- 识别结构域和 DNA- 切割结构域组成的嵌合核酸酶。锌指核酸酶可 用来在在哺乳动物、 植物或其它生物中进行有效的遗传修饰, 这是因为当将这种酶导入细 胞中时, 它能在基因组 DNA 中产生定向的双链断裂 (DSB)。当细胞发生双链断裂时, 受损的 区域由细胞的自我修复系统进行修复。此时, 将与受损区域具有相似 DNA 序列的供体 DNA 导入细胞中, 能导致受损 DNA 和供体模板之间发生同源重组 (HR)。为了对基因组的特定位 点进行所需的修饰, 将靶碱基序列并入供体 DNA 中。同时, 在不存在供体 DNA 的情况下, 受 损细胞可以通过非同源性末端连接 (NHEJ) 来修复。非同源性末端连接 (NHEJ) 通过将两个 断裂末端连接到一起来修复受损的 DNA, 并且通常不会产生突变。 然而, 在某些情况下, 修复 易于出错, 导致断裂的 DNA 末端处发生碱基对的插入或缺失。总的来说, 由锌指核酸酶导致 的特定碱基序列的双链断裂引起非同源性末端连接, 因此所得的 DNA 含有突变, 进而产生 敲除细胞系。
真核生物基因组所编码的最丰富的 DNA- 结合基序 —— 锌指 (ZF), 提供了可能 是 最 好 理 解 的 蛋 白 质 -DNA 结 合 机 制 中 的 一 种 (Wolfe, S.A.et al., (2000)Annu.Rev. Biophys.Biomol.Struct., 29, 183-212 ; Pabo, C.O.et al., (2001)Annu.Rev.Biochem., 70, 313-340 ; Moore, M.et al., (2003)BriefFunct.Genomic.Proteomic., 1, 342-355 和 Klug, A.et al., (2005)FEBS Lett., 579, 892-894)。工程锌指蛋白 (ZFP) 极可能作为基因调控和 基因组修饰的工具, 因为它们可以用于靶向几乎在任何基因组的任何期望位置的功能性结 构域。锌指蛋白为设计具有新 DNA- 结合特异性的蛋白质提供了通用框架, 这是由于它们具 有模块结构特征, 并且当识别 DNA 碱基序列时, 在碱基与氨基酸残基之间具有碱基特异的 相互作用。
有效锌指核酸酶的构建需要制备识别基因组中期望的靶 DNA 序列的锌指蛋白, 目前可通过多种体外和体内选择方法来实现, 包括通过定点诱变 (SMD) 替换每个对应氨 基酸或者大规模的筛查方法、 噬菌体展示 ( 参见美国专利第 5,789,538 号、 第 5,925,523 号、 第 6,007,988 号、 第 6,013,453 号和第 6,200,759 号 ; WO 95/19431、 WO 96/06166、 WO 98/53057、 WO 98/54311、 WO 00/27878、 WO 01/60970、 WO 01/88197 和 WO 02/099084)。然 而, 这些基于选择的方法是高度劳动密集且耗时的, 并且需要高级技术人才。制备 ZFN 的 备选方法是通过标准重组 DNA 技术将预表征的单个锌指模块组装成具有所需特异性的锌 指阵列。每个锌指模块识别 3bp( 碱基对 ) 的 DNA, 并且当合适地连接到一起时, 所得的
有效锌指核酸酶的构建需要制备识别基因组中期望的靶 DNA 序列的锌指蛋白, 目前可通过多种体外和体内选择方法来实现, 包括通过定点诱变 (SMD) 替换每个对应氨 基酸或者大规模的筛查方法、 噬菌体展示 ( 参见美国专利第 5,789,538 号、 第 5,925,523 号、 第 6,007,988 号、 第 6,013,453 号和第 6,200,759 号 ; WO 95/19431、 WO 96/06166、 WO 98/53057、 WO 98/54311、 WO 00/27878、 WO 01/60970、 WO 01/88197 和 WO 02/099084)。然 而, 这些基于选择的方法是高度劳动密集且耗时的, 并且需要高级技术人才。制备 ZFN 的 备选方法是通过标准重组 DNA 技术将预表征的单个锌指模块组装成具有所需特异性的锌 指阵列。每个锌指模块识别 3bp( 碱基对 ) 的 DNA, 并且当合适地连接到一起时, 所得的
锌指阵列能特异地识别较长的 DNA 序列基序。利用本方法, 可以容易地构建能识别特定 碱基序列的锌指核酸酶。某些研究小组已经描述并表征了用于构建多指阵列的锌指模块 的单独档案。第一, Barbas 模块, 由斯克利普斯研究所 (Scripps Research Institute) Barbas 实验室利用噬菌体展示和合理的设计方法开发的, 可用来识别所有的 GNN 三联体, 大多数 ANN 和 CNN 三联体和少量 TNN 三联体。在单个锌指模块几乎具有完全的位置独立 性, 即它们的识别特性不受它们在阵列中的位置或邻近锌指的性质的显著影响的假设下, 开发出了这些 Barbas 模块。第二, 由 Sangamo BioSciences Inc. 设计的 Sangamo 模块, 其目前可用于所有的 GNN 三联体和少量的 ‘非 -GNN’ 三联体。在模块在 3- 指阵列中的位 置可以影响其识别特性的假设下开发出了 Sangamo 模块。3- 指阵列中三个位置中的每一 个都具有为该位置的给定三联体开发出的不同的锌指模块。然而, 由于这些模块不是天然 存在的而是人工模块, 因此不容易使用它们来构建锌指核酸酶, 并且它们在实际应用中的 效率非常低。特别是, 这些模块的特征为靶向于 GNN- 重复序列。然而, 问题是给定目的基 因中这些序列仅极少存在。例如, 可以将 3- 指 ZFN 对设计成靶向于 GNN- 重复的 DNA 序列 5’ -NNCNNCNNCNNNNNNGNNGNNGNN-3’ , 其平均在 4096bp( = 46) 的序列中仅出现一次。4- 指 ZFN 的 GNN- 重复位点更加罕见, 平均在 65,536bp( = 48) 的序列中仅出现一次。因此, 可能 在多数目的基因中根本不存在这种位点。关于这点, 本发明的锌指核酸酶的优点在于它们 大多数均在不识别 GNN- 重复序列的情况下起作用。 发明的公开内容
技术问题
鉴于此, 允许进行靶向基因组编辑的锌指核酸酶技术的广泛应用受缺少方便的、 快速的和公众可利用的合成功能性锌指核酸酶的方法所限。因此, 本发明人试图开发出一 种高效且易操作的模块组装方法, 利用公众可获得的锌指来制备能修饰人类细胞中数个不 同基因组位点的 DNA 序列的锌指核酸酶。他们发现, 与已知方法相比, 组装的锌指核酸酶对 于靶向切割和修饰基因组来说是更有效的工具。
技术方案
本发明的目的是提供包含锌指结构域和切割结构域的融合蛋白——锌指核酸酶, 其中所述锌指结构域包含三个或更多个锌指模块, 一个或多个所述锌指模块来源于天然存 在的、 野生型的锌指模块, 并且所述融合蛋白识别并切割细胞染色质中包含目的区域的核 苷酸序列。
本发明的另一个目的是提供利用所述锌指核酸酶来切割目的区域中的细胞染色 质的方法。
本发明的另一个目的是提供利用所述锌指核酸酶来替换细胞染色质目的区域中 的第一核苷酸序列的方法。
本发明的另一个目的是提供利用所述锌指核酸酶来修饰细胞染色质目的区域中 的第一核苷酸序列的方法。
本发明的另一个目的是提供利用所述锌指核酸酶的基因治疗方法。
发明的有益效果
本发明的锌指核酸酶容易制备, 并且因此对于在多种基因治疗应用中产生基因敲 除的靶向切割和修饰基因组序列是非常有用的。
技术问题
鉴于此, 允许进行靶向基因组编辑的锌指核酸酶技术的广泛应用受缺少方便的、 快速的和公众可利用的合成功能性锌指核酸酶的方法所限。因此, 本发明人试图开发出一 种高效且易操作的模块组装方法, 利用公众可获得的锌指来制备能修饰人类细胞中数个不 同基因组位点的 DNA 序列的锌指核酸酶。他们发现, 与已知方法相比, 组装的锌指核酸酶对 于靶向切割和修饰基因组来说是更有效的工具。
技术方案
本发明的目的是提供包含锌指结构域和切割结构域的融合蛋白——锌指核酸酶, 其中所述锌指结构域包含三个或更多个锌指模块, 一个或多个所述锌指模块来源于天然存 在的、 野生型的锌指模块, 并且所述融合蛋白识别并切割细胞染色质中包含目的区域的核 苷酸序列。
本发明的另一个目的是提供利用所述锌指核酸酶来切割目的区域中的细胞染色 质的方法。
本发明的另一个目的是提供利用所述锌指核酸酶来替换细胞染色质目的区域中 的第一核苷酸序列的方法。
本发明的另一个目的是提供利用所述锌指核酸酶来修饰细胞染色质目的区域中 的第一核苷酸序列的方法。
本发明的另一个目的是提供利用所述锌指核酸酶的基因治疗方法。
发明的有益效果
本发明的锌指核酸酶容易制备, 并且因此对于在多种基因治疗应用中产生基因敲 除的靶向切割和修饰基因组序列是非常有用的。
附图简要说明
图 1 显示用于构建本发明锌指核酸酶的锌指的来源、 氨基酸序列和靶亚位点。
图 2 显示本发明人合成的锌指核酸酶中有代表性的 ZFN 对的氨基酸序列 ; 所包含 的用于检测它们在细胞中表达的 HA 标签和核定位信号序列用下划线标示出, 并且用粗体 指出预期与靶碱基序列结合的锌指 α 螺旋区。
图 3 是 CCR5 编码区中 ZFN 靶位点的示意图 ; 用盒表示 ZFN 靶位点, 数字指示 ZFN 靶位点相对于起始密码子的位置, 用交叉线画出阴影的盒指示 Δ32 突变的座位。
图 4 是利用体外转录和翻译系统制备的 ZFN 进行 DNA 切割测定的示意图。
图 5 是显示 DNA 切割测定的琼脂糖凝胶电泳结果的照片。
图 6 是用于评估 ZFN 活性的基于细胞的单链退火 (SSA) 的示意图 ; 将 ZFN 表达质 粒转染进 HEK293 细胞中, HEK293 细胞的基因组包含无活性的、 部分复制的且中断的萤光素 酶基因。如果 ZFN 切割细胞中的靶位点, 则 DNA 可被 SSA 机制有效修复, 并且能恢复功能性 的萤光素酶基因。
图 7 是用于评估 ZFN 活性的基于细胞的单链退火 (SSA) 的示意图 ; 细胞的萤光素 酶活性指示多种 ZFN 的表达。p3 是用作阴性对照的空质粒。靶序列含有用作阳性对照的 I-SceI 的识别位点。将每对 ZFN 的活性报告为相对于 I-SceI 对照的百分比。指出了 ZFN 对及其组成单体。用三角形标示出用于进一步研究的 ZFN 对。显示至少 3 次独立实验的平 均值和标准差 ( 误差棒 )。 图 8 是利用 T7E1 测定检测人细胞中 ZFN 介导的基因组编辑错配的示意图 ; 从用编 码 ZFN 的质粒转染的细胞纯化基因组 DNA。通过 PCR 扩增出包含 ZFN 识别位点的 DNA 片段, 并使该 DNA 扩增子解链并退火。如果该 DNA 扩增子包含野生型和突变的 DNA 序列, 则形成 异源双螺旋。T7E1 识别并切割异源双螺旋, 而不是同源双螺旋。通过琼脂糖凝胶电泳评估 DNA 片段。
图 9 显示利用 T7E1 测定揭示 ZFN 介导的基因组修饰 ; ZFN 对显示在琼脂糖凝胶的 上端。在凝胶图的左侧用箭头 ( 未切割 ) 和括弧 ( 切割 ) 指示所得的 DNA 条带的预期位 置。p3 是用作阴性对照的空质粒。本测定中包括 Sangamo 的靶向 CCR5 的 ZFN 对 (Sangamo CCR5)。
图 10 显示 Z836 ZFN 对所靶向的基因组位点的 DNA 序列 ; ZFN 识别元件用下划线 标示出。用破折号指示缺失, 用小写字母表示插入的碱基。如果检测出突变多于一次, 则在 括号内指出出现的次数。Wt 代表野生型。
图 11 显示 Z30 和 Z266 ZFN 对所靶向的基因组位点的 DNA 序列 ; ZFN 识别元件用 下划线标示出。用破折号指示缺失, 用小写字母表示插入的碱基。如果检测出突变多于一 次, 则在括号内指出出现的次数。
图 12 显示 Z360 和 Z411 ZFN 对所靶向的基因组位点的 DNA 序列 ; ZFN 识别元件用 下划线标示出。用破折号指示缺失, 用小写字母表示插入的碱基。如果检测出突变多于一 次, 则在括号内指出出现的次数。
图 13 显示 Z426 和 Z430 ZFN 对所靶向的基因组位点的 DNA 序列 ; ZFN 识别元件用 下划线标示出。用破折号指示缺失, 用小写字母表示插入的碱基。如果检测出突变多于一 次, 则在括号内指出出现的次数。
图 14 显示 Z891 ZFN 对所靶向的基因组位点的 DNA 序列 ; ZFN 识别元件用下划线 标示出。用破折号指示缺失, 用小写字母表示插入的碱基。如果检测出突变多于一次, 则在 括号内指出出现的次数。
图 15 显示若干 ZFN 靶位点处的突变类型 ; 对每对 ZFN 的缺失、 插入和混合突变的 数量进行计数, 并绘制出这些事件的百分比。
图 16 是野生型和强制型异二聚 ZFN 的时间进程分析结果 ; 在不同的时间点对从 细胞分离的 DNA 进行 T7E1 错配检测测定, 所述细胞用不同形式的 FokI 核酸酶结构域处理。 (WT, 野生型核酸酶结构域 ; RR/DD 或 KK/EL, 强制型异二聚核酸酶结构域 )
图 17 是 53BP1 染 色 的 结 果 ; 将 野 生 型 和 强 制 型 异 二 聚 Z891 ZFN 对 转 染 进 HEK293T/17 细胞, 并在转染后第 2 天时, 通过免疫荧光检测细胞内 53BP1 的位置。 依托泊苷 (1μM) 用作阳性对照。
图 18 是图 16 结果的图表。绘制出 53BP1 位置的数量分布。对于每个处理, 两次 独立的测定中分析至少 100 个细胞。
图 19 显示突变克隆的 DNA 序列 ; 通过有限稀释从 RR/DD ZFN 二聚体处理的细胞分 离了 7 个突变克隆。显示了这些克隆细胞中靶位点的 DNA 序列。用破折号指示缺失, 用小 写字母表示插入的碱基。克隆 1a 和 1b 指示由单克隆中的双等位基因修饰所产生的 DNA 序 列。
图 20 显示在 CCR2 位点进行的 T7E1 测定 ; 分析通过 PCR 从 ZFN 对处理的细胞扩 增的与 CCR2 编码区对应的 DNA( 在凝胶图的上端显示 )。用 “+” 标记在 CCR2 位点产生修 饰的 ZFN 对。p3 是用作阴性对照的空质粒。本测定中包括 Sangamo 的靶向 CCR5 的 ZFN 对 (Sangamo CCR5)。
图 21 显示 ZFN 在 CCR2 基因座的脱靶效应, 以及 CCR5 和 CCR2 基因座的 ZFN 识别 元件。指出的 ZFN 对位于 DNA 序列的左侧。用括号标出 CCR5 和 CCR2 基因座之间的匹配碱 基的数量, 用小写的黑体字母指示错配的碱基。半位点 ZFN 识别元件用下划线标示出。
图 22 显示用于模块交换实验的锌指。
图 23 是模块交换分析中利用基于细胞的 SSA 系统来检验这些新的 ZFN 是否能功 能性地替代本发明的识别相同序列的 ZFN 的结果 ; 名称由 “B” 开头的诸如 “BR4” 的 ZFN 单 体仅由 Barbas 模块组成, 以及由 “S” 开头的诸如 “SR4” 的那些 ZFN 单体仅由 Sangamo 模块 组成。细胞的萤光素酶活性指示多种 ZFN 的表达。p3 是用作阴性对照的空质粒。靶序列含 有用作阳性对照的 I-SceI 的识别位点。将每对 ZFN 的活性表示为相对于 I-SceI 对照的百 分比。指出了 ZFN 对及其组成单体。显示至少 3 次独立实验的平均值和标准差 ( 误差棒 )。
图 24 显示模块交换分析中利用 T7E1 测定的 ZFN 介导的基因组修饰来检验这些新 的 ZFN 是否能功能性地替代本发明的识别相同序列的 ZFN ; 在琼脂糖凝胶的上端显示 ZFN 对及其组成单体。用 “+” 标记产生阳性基因靶向事件的 ZFN 对。
图 25 概括 ZFN 分析 ; 显示出在每次测定中产生阳性结果的 ZFN 对或靶位点的数 量。
图 26 显示不同类型的 ZFN 的成功率 ; 将成功的 ZFN 对或靶位点定义为在 T7E1 错 配检测测定中产生阳性结果的那些。
实施本发明的最佳方式按照一方面, 本发明涉及包含锌指结构域和核苷酸切割结构域的融合蛋白——锌 指核酸酶 (ZFN), 其中所述锌指结构域包含三个或更多个锌指模块, 两个或更多个所述锌指 模块来源于天然存在的、 野生型的锌指模块, 并且所述融合蛋白识别并切割包含染色质特 定区域的核苷酸序列。
本发明的锌指结构域是指通过一个或多个锌指模块以序列特异的方式与核苷酸 结合的蛋白质。所述锌指结构域包含至少三个锌指模块。通常将所述锌指结构域缩写为锌 指蛋白或 ZFP。
本发明的锌指模块是结合结构域中的氨基酸序列区, 通过配位锌离子来稳定该结 合结构域的结构。 本发明的锌指模块的序列与天然存在的、 野生型的锌指模块的序列一致, 或者与通过其它氨基酸对野生型序列中的任何氨基酸的取代而修饰的序列一致。 所述野生 型的锌指模块可以来源于任何真核细胞, 例如真菌细胞 ( 例如酵母 )、 植物或动物细胞 ( 例 如诸如人或小鼠的哺乳动物细胞 )。 优选地, 本发明的锌指模块包含图 1 所代表的来源于人 或类似物的氨基酸序列。
锌指核酸酶的锌指结构域由 3 个或更多个串联排列的锌指模块组成, 每个锌指模 块识别 3bp( 碱基对 ) 的亚位点。由于每个模块独立地识别 DNA 序列, 因此由 3 或 4 个模块 组成的锌指结构域能结合 9-bp 或 12-bp 的序列。锌指核酸酶以二聚体的形式发挥功能, 因 此, 一对由 3 或 4 个模块组成的锌指核酸酶能特异地识别 18-bp 至 24-bp 的序列。在具体 的实例中, 本发明的锌指核酸酶的锌指结构域由 3 或 4 个模块, 优选由 4 个锌指模块组成。 此外, 在一个优选的实施方案中, 本发明的锌指核酸酶所包含的锌指结构域优选包含锌指 模块。 在具体的实例中, 含有 4 个锌指模块的锌指核酸酶成功地靶向 26%的可能切割位点, 而含有 3 个锌指模块的锌指核酸酶仅靶向 9.1%的可能位点。 可以将锌指结构域工程改造为与预定的核苷酸序列结合。 工程改造锌指结构域的 方法的非限制性实例是设计和选择。设计的锌指蛋白是非天然存在的蛋白质, 其设计 / 组 成主要来自合理的标准。设计的合理标准包括应用取代原则和计算机算法对存储现存的 ZFP 设计和结合数据信息的数据库中的信息进行处理 ( 参见韩国专利第 0766952 号 )。选 择的锌指蛋白是并非在自然中所发现的蛋白质, 其产生主要来自诸如噬菌体展示、 相互捕 获或杂交选择的实验过程。
组成加工的锌指结构域中的至少 2 个或更多个锌指模块优选是野生型锌指模块, 更优选 3 个或更多个是野生型锌指模块。在一个具体的实例中, 本发明人进行了模块交换 分析, 其中用噬菌体展示或点突变进行工程改造和分离的锌指核酸酶来替代本发明的锌指 核酸酶。发现本发明的锌指核酸酶在 SSA 系统和 T7E1 测定中表现出显著的活性。因此, 优 选地, 本发明锌指核酸酶由天然存在的、 野生型的锌指模块组成。更优选地, 本发明的锌指 核酸酶由表 2 所示的锌指结构域组成。此外, 本发明的锌指核酸酶并非靶向 GNN- 重复序 列, 这与已知的工程锌指核酸酶不同。在具体的实例中, 在对 CCR5 序列进行成功修饰的 16 个锌指核酸酶中, 只有 2 个 (Z426F3 和 Z360R4) 识别 GNN- 重复位点, 而有 2 个 (Z430R3 和 Z30F4) 识别无 GNN 基序的半位点元件, 12 个识别由 GNN 和非 GNN 基序组成的位点, 如以下 的表 2 所示。靶向除 GNN- 重复序列以外的位点的能力极大地扩展了 ZFN 技术的实用性。
本文所用的术语 “切割” 是指破坏 DNA 分子的共价主链, 术语 “切割结构域” 是指 具有催化 DNA 切割活性的多肽序列。
所述切割结构域可以获自任何内切核酸酶或外切核酸酶。 可以产生切割结构域的 示例性的内切核酸酶包括但不限于, 限制性内切核酸酶和归巢内切核酸酶。这些酶可以作 为切割结构域的来源。 此外, 单链切割和双链切割均是可能的, 其中双链切割的发生可以取 决于切割结构域的来源。 在这方面, 具有双链切割活性的切割结构域可用作切割半结构域。 本文的切割结构域可以与单链切割和双链切割交替使用。
切割结构域可以来源于任何核酸酶或其一部分。通常, 如果融合蛋白包含具有双 链切割活性的切割半结构域, 则切割需要两个融合蛋白。两个切割半结构域可以来源于相 同的内切核酸酶 ( 或其功能性片段 ), 或者每个切割半结构域可以来源于不同的内切核酸 酶 ( 或其功能性片段 )。此外, 两个融合蛋白与其各自靶位点的结合使所述切割半结构域 以彼此相对的空间方向定位, 这允许所述切割半结构域例如通过二聚形成功能性切割结构 域。因此, 两个靶位点之间可以有任何整数的核苷酸或核苷酸对 ( 例如 2 至 50 个核苷酸对 或更多 )。
通常, 如果使用的两个融合蛋白中的每个都包含切割半结构域, 则每个融合蛋白 的锌指部分的主要接触链将在不同的 DNA 链上, 并且在相反的方向中。即对于一对 ZFP/ 切 割半结构域融合体而言, 靶序列位于相反的链上, 并且两种蛋白质以相反的方向结合。 限制性内切核酸酶存在于多种物种中, 并能序列特异地与 DNA( 在识别位点处 ) 结 合, 并在结合位点或者邻近结合位点处切割 DNA。某些限制性酶 ( 例如 IIS 型 ) 在远离识别 位点的位点处切割 DNA, 并具有可分的结合和切割结构域。例如, IIS 型酶 FokI 在离其一条 链上的识别位点 9 个核苷酸和离另一链上的识别位点 13 个核苷酸处催化 DNA 的双链切割。 因此, 在一个实施方案中, 融合蛋白包含来自至少一种 IIS 型限制性酶的切割结构域 ( 或切 割半结构域 ) 和一个或多个锌指结合结构域。
IIS 型限制性酶的实例包括包括 FokI、 AarI、 AceIII、 AciI、 AloI、 BaeI、 Bbr7I、 CdiI、 CjePI、 EciI、 Esp3I、 FinI、 MboI、 sapI、 和 SspD51, 但并不限于这些, 更具体的参见 Roberts et al.(2003)Nucleic Acid Res.31 : 418-420。 在具体的实施方案中, 将从 IIS 型 限制性酶 FokI 分离 DNA 结合结构域所获得的 FokI 切割结构域用作切割结构域 ( 或半切割 结构域 )。
本发明的融合蛋白是指两个或更多个不同的多肽通过肽键连接形成的多肽。 所述 多肽包含锌指结构域和能切割核苷酸序列中的任何靶位点的核苷酸切割结构域。 本文中的 融合蛋白与锌指核酸酶或 ZFN 交替使用。
设计和构建融合蛋白 ( 或者编码融合蛋白的多核苷酸 ) 的方法在本领域是公知 的。 在一个具体的实施方案中, 构建的是编码融合蛋白的多核苷酸, 所述融合蛋白包含锌指 结构域和切割结构域。可以将所述多核苷酸插入载体中, 并可将所述载体导入细胞。通常, 融合蛋白 ( 例如 ZFP-FokI 融合体 ) 成分的排列使得锌指结构域距所述融合蛋白的氨基末 端 (N- 末端 ) 最近, 切割半结构域距羧基末端 (C- 末端 ) 最近。这反映了诸如来源于 FokI 酶的天然存在的二聚化切割结构域中的切割结构域的相对方向, 其中 DNA 结合结构域距氨 基末端最近, 切割半结构域距羧基末端最近。
本文所用的术语 “序列” 是指任何长度的核苷酸序列, 可以为 DNA 或 RNA ; 可以为线 状、 环状或分枝的并且可以为单链或双链。
本文所用的术语 “结合” 是指巨分子之间 ( 例如蛋白质和核酸之间 ) 序列特异的
或非共价的相互作用。只要相互作用作为整体是序列特异性的, 而不需要结合相互作用的 所有成分均是序列特异性的 ( 例如与 DNA 主链中的磷酸残基接触 )。这种相互作用的特征 通常为解离常数 (Kd) 为 10-6M-1 或更小。术语 “亲和力” 是指结合的强度 : 结合亲和力的提 高与 Kd 降低相关。
按照另一方面, 本发明涉及用于切割、 替换或修饰靶区中的 DNA 序列的试剂盒, 所 述试剂盒包含一对或多对锌指核酸酶。
通常, 由于锌指核酸酶 (ZFN) 以二聚体的形式发挥作用, 因此针对单个 DNA 位点需 要制备两个 ZFN 单体。构成 ZFN 对的两个单体 ZFN 的中的每个与两个 9-bp 或 12-bp 的半 位点中的一个结合, 所述两个 9-bp 或 12-bp 的半位点由 5-bp 或 6-bp 的间隔序列分开。对 于单个半位点, 可以设计多个由不同的 ZF 组构成的单体 ZFN, 该不同的 ZF 组具有相同或相 似 DNA 结合特异性。在具体的实施方案中, 由相同或相似锌指结构域构成的 ZFN 对显示在 表 2 中, 但并不限于这些。多个组合 ZFN 对可以针对单个位点。
可以将本文所用的术语 “替换” 理解为表示一条核苷酸序列被另一条核苷酸序列 替换 ( 即信息层面的序列替换 ), 而并不必然需要用另一个多核苷酸物理或化学替换一个 多核苷酸。本文所用的术语 “修饰” 表示通过突变或非同源性末端连接而发生的 DNA 序列 中的改变。所述突变包括点突变、 取代、 缺失、 插入等。所述替换或修饰可以是用遗传信息 完全的核苷酸取代或改变遗传信息不完全的核苷酸。 由核苷酸序列所编码的肽也可以通过 突变而被功能失活。通过这种方式, 可以将锌指核酸酶用作基因治疗的工具。在一个具体 的实施方案中, 证实了针对敲除编码 CCR5 蛋白的人趋化因子 (C-C 基序 ) 受体 5(CCR5) 基 因的 ZFN, 该 CCR5 蛋白是人类免疫缺陷病毒 (HIV) 感染靶细胞所用的主要共受体。 当结合例如细胞、 核酸、 蛋白质或载体使用时, 术语 “重组体” 表示所述细胞、 核酸、 蛋白质或载体通过导入异源核酸或蛋白质或改变天然的核酸或蛋白质而被修饰, 或者表示 该细胞来源于进行这种修饰的细胞。因此, 例如, 重组细胞表达在天然的 ( 天然存在的 ) 细 胞形式中未被发现的基因, 或者表达以其它方式正常表达或非正常表达的、 低表达或根本 不表达的第二拷贝的天然基因。
按照另一方面, 本发明涉及产生锌指核酸酶的方法, 所述方法包括 : (a) 在目的区 域中选择核苷酸序列 ; (b) 选择与所述序列结合的锌指模块并工程改造锌指结构域, 其中 所述锌指结构域包含三个或更多个锌指模块, 两个或更多个所述锌指模块来源于天然存在 的、 野生型的锌指模块, 以及 (c) 表达包含工程锌指结构域和核苷酸切割结构域的融合蛋 白。
在产生本发明的锌指核酸酶的方法中, 步骤 (a) 是选择目的区域中的核苷酸序列 的步骤。所述核苷酸序列可以存在于细胞内或细胞外, 长度是不受限制的。核苷酸可以为 线状或环状的、 单链或双链的。
步骤 (b) 是选择与目的区域中的核苷酸序列结合的锌指模块并工程改造锌指结 构域的步骤。 优选地, 所述锌指结构域包含三个或更多个锌指模块, 两个或更多个所述锌指 模块来源于天然存在的、 野生型的锌指模块, 更优选图 1 所示的锌指模块, 甚至更优选图 2 所示的锌指模块。
步骤 (c) 是表达包含锌指结构域和核苷酸切割结构域的融合蛋白的步骤。所述表 达包括体内和离体表达。可以通过本领域内已知的方法进行体内表达, 例如利用载体。载
体的实例包括但不限于质粒、 黏粒、 噬菌体和病毒载体, 但是并不限于这些。可以根据用途 通过包含分泌信号序列以及调控元件来制备合适的表达载体, 所述调控元件元件例如启动 子、 操纵子、 起始密码子、 终止密码子、 多腺苷酸化信号和增强子。
按照另一方面, 本发明涉及利用锌指核酸酶来切割目的区域中的细胞染色质的方 法。
在一个具体的实施方案中, 本发明提供了切割目的区域中的细胞染色质的方法, 包括以下步骤 : (a) 在目的区域中选择第一核苷酸序列 ; (b) 选择与第一核苷酸序列结合 的第一锌指核酸酶 ; (c) 在包含所述核苷酸序列的细胞内或细胞外表达所述第一锌指核酸 酶, 从而将所述核酸酶导入所述细胞中, ; 以及 (d) 使所述第一锌指核酸酶 ( 其在细胞内表 达或被导入细胞 ) 与所述序列结合, 以便切割目的区域中的细胞染色质。
本发明的第一锌指核酸酶包括三个或更多个锌指模块, 两个或更多个所述锌指模 块来源于天然存在的、 野生型的锌指模块。
在另一个具体的实施方案中, 本发明提供了切割目的区域中的细胞染色质的方 法, 包括以下步骤 : (a) 在目的区域中选择第一核苷酸序列 ; (b) 选择与第一核苷酸序列结 合的包含本发明的第一锌指结构域和第一核苷酸切割结构域的第一锌指核酸酶 ; (c) 在包 含所述核苷酸序列的细胞内或细胞外表达所述第一锌指核酸酶, 用于将所述核酸酶导入所 述细胞 ; 以及 (d) 使第一锌指核酸酶 ( 其在细胞内表达或被导入细胞 ) 与所述序列结合, 以 便切割目的区域中的细胞染色质 ; (e) 在包含所述核苷酸序列的细胞内或细胞外选择并表 达第二锌指核酸酶, 从而将所述核酸酶导入所述细胞中, 其中所述第二锌指核酸酶包含第 二锌指结构域和第二核苷酸切割结构域 ; 以及 (f) 使所述第二锌指核酸酶 ( 其在细胞内表 达或被导入细胞 ) 与目的区域中的所述第二核苷酸序列结合, 其中所述第二序列与所述第 一锌指核酸酶所结合的所述第一核苷酸序列之间的距离为 2-50 个核苷酸。
本文所用的 “染色质” 是指包含细胞基因组的核蛋白质结构。细胞染色质包含核 酸、 主要的 DNA 和蛋白质, 所述蛋白质包括组蛋白和非组蛋白染色体蛋白质。细胞染色质 可存在于任何类型的细胞中, 包括原核和真核细胞、 例如真菌、 植物、 动物、 哺乳动物、 灵长 类动物和人类细胞。大多数真核细胞染色质以核小体的形式存在, 其中核小体中心包含约 150 个碱基对的 DNA 和连接的包含组蛋白 H2A、 H2B、 H3 和 H4 每种两个的八聚体 ; 并且连接 物 DNA( 取决于有机体长度可变 ) 在核小体中心间延伸。组蛋白 H1 分子通常与连接物 DNA 连接。 为了公开本发明的目的, 术语 “染色质” 意图包括所有的细胞核蛋白质类型, 原核生物 的和真核生物的。细胞染色质包括染色体染色质和附加体染色质。 “染色体” 是包含所有或 部分细胞基因组的染色质复合物。 “附加体” 是复制中的核酸、 核蛋白质复合物或包含的核 酸不是细胞染色体组型的一部分的其它结构。附加体的实例包括质粒和某些病毒基因组。
在另一个具体的实施方案中, 本发明提供了切割目的区域中的细胞染色质的方 法, 包括以下步骤 : (a) 选择目的区域 ; (b) 提供与所述目的区域中的第一核苷酸序列结合 的第一锌指结构域 ; (c) 提供与所述目的区域中的第二核苷酸序列结合的第二锌指结构 域, 其中所述第二序列与所述第一序列之间的距离为 2-50 个核苷酸 ; (d) 在细胞中同时或 相继表达所述第一锌指核酸酶和所述第二锌指核酸酶, 其中所述第一锌指核酸酶包含第一 锌指结构域和第一核苷酸切割结构域, 所述第二锌指核酸酶包含第二锌指结构域和第二核 苷酸切割结构域 ;其中所述第一和第二锌指结构域包含三个或更多个锌指模块, 两个个或更多个所 述锌指模块来源于天然存在的锌指模块, 以及
所述第一锌指结构域与所述第一核苷酸序列结合, 所述第二锌指结构域与所述第 二核苷酸序列结合, 而且其中所述结合定位了核苷酸切割结构域, 使得所述目的区域中的 细胞染色质被切割。
对于利用本发明锌指核酸酶进行靶向切割, 锌指结构域的结合位点可以包括切割 位点, 或者接近结合位点的边缘可以离所述切割位点 1 至 50 个核苷酸。绘制切割位点的方 法是本领域技术人员已知的。
切割 DNA 的位点通常位于两个融合蛋白的结合位点之间。DNA 的双链断裂通常由 两处单链断裂产生, 或者由错移 1、 2、 3、 4、 5、 6 或更多个核苷酸的 “缺口” 产生, 例如, 天然 FokI 切割的双链 DNA 由错移 4 个核苷酸的单链断裂产生。因此, 切割并非必然在每条 DNA 链上的完全相对的位点处发生。此外, 融合蛋白的结构和靶位点间的距离可以影响切割是 临近单核苷酸对发生还是切割在数个位点处发生。
本文所用的 “靶位点” 是锌指结构域所识别的核酸序列。单一的靶位点通常具有 约 6 至约 12 个碱基对。通常, 具有 3 个锌指模块的锌指蛋白识别两个相邻的 6 至 10 个碱 基对的靶位点, 并且具有 4 个锌指模块的锌指蛋白识别两个相邻的 9 至 12 个碱基对的靶位 点。术语 “相邻的靶位点” 表示相隔 0 至约 5 个碱基对的不重叠的靶位点。
如上文所指出的, 融合蛋白可以以多肽和 / 或多核苷酸的形式被导入。例如, 可以 将两条多核苷酸 ( 每条所包含的序列均编码上文提到的多肽中的一种 ) 导入细胞, 在靶序 列或靶序列附近发生切割。 可选地, 将包含编码两段多肽的序列的单一多核苷酸导入细胞。 多核苷酸可以是 DNA、 RNA 或 DNA 和 / 或 RNA 的任何修饰形式或同源物。
按照另一方面, 本发明涉及利用锌指核酸酶来替换细胞染色质中目的区域的第一 核苷酸序列的方法。
在具体的实施方案中, 本发明提供了替换细胞染色质中目的区域的第一核苷酸序 列的方法, 包括以下步骤 : (a) 工程改造出与所述目的区域中的第二核苷酸序列结合的第 一锌指结构域, 其中所述第二序列包含至少 9 个核苷酸 ; (b) 提供与第三核苷酸序列结合的 第二锌指结构域, 其中所述第三序列包含至少 9 个核苷酸, 并且与所述第二序列之间的距 离为 2-50 个核苷酸 ; (c) 在细胞中表达第一锌指核酸酶和第二锌指核酸酶, 其中所述第一 锌指核酸酶包含第一锌指结构域和第二核苷酸切割结构域, 所述第二锌指核酸酶包含第二 锌指结构域和第三核苷酸切割结构域 ; 以及 (d) 将所述细胞暴露于包含第四核苷酸序列的 多核苷酸, 其中所述第四核苷酸序列与所述第一核苷酸序列是同源的但并非一致的 ;
其中所述第一和第二锌指结构域包含三个或更多个锌指模块, 一个个或多个所述 锌指模块来源于天然存在的锌指模块, 以及
所述第一锌指核酸酶与所述第二序列的结合, 和所述第二锌指核酸酶与所述第三 序列结合定位了切割结构域, 使得所述目的区域中的细胞染色质被切割, 进而促进所述第 一核苷酸序列和所述第四核苷酸序列之间的同源重组, 导致所述第一核苷酸序列被所述第 四核苷酸序列替换。
本公开提供了特征为更高的靶向重组效率和更低的非特异的插入事件的靶向序 列改变方法。由于细胞 DNA 中的双链断裂刺激切割位点附近的同源重组提高数千倍, 因此这种靶向切割允许改变或替换 ( 通过同源重组 ) 基因组中几乎任何位点处的序列。
除了融合蛋白 ( 锌指核酸酶 ) 之外, 所选的基因组序列的靶向替换还需要供体序 列。可以在表达融合蛋白之前、 同时或之后将所述供体序列导入细胞中。很明显, 所述供体 序列通常与其所替换的基因组序列不同。例如, 供体多核苷酸序列与基因组序列相比可以 包含一个或多个单碱基改变、 插入、 缺失、 倒位或重排, 但是要存在足够的同源性来支持同 源重组。可选地, 供体序列可以包含由两个同源区侧翼连接的非同源序列。此外, 供体序列 可以包含与细胞染色质的目的区域非同源的序列。
此外, 在本方法中, 所述第一核苷酸序列可以优选基因中包含突变的序列, 在这种 情况下, 供体序列, 尤其是第四序列优选是基因的野生型序列。所述突变可以包括点突变、 取代、 缺失或插入。
此外, 在另一个具体的实施方案中, 本发明提供了利用锌指核酸酶来改变细胞染 色质中目的区域的第一核苷酸序列的方法。
具体地, 本发明提供了改变细胞染色质中目的区域的第一核苷酸序列的方法, 包 括以下步骤 : (a) 工程改造出与所述目的区域中的第二核苷酸序列结合的第一锌指结构 域, 其中所述第二序列包含至少 9 个核苷酸 ; (b) 提供与第三核苷酸序列结合的第二锌指结 构域, 其中所述第三序列包含至少 9 个核苷酸, 并且与所述第二序列之间的距离为 2-50 个 核苷酸 ; (c) 在细胞中表达第一锌指核酸酶和第二锌指核酸酶, 其中所述第一锌指核酸酶 包含第一锌指结构域和第二核苷酸切割结构域, 所述第二锌指核酸酶包含第二锌指结构域 和第三核苷酸切割结构域 ; 其中所述第一和第二锌指结构域包含三个或更多个锌指模块, 一个或多个所述锌指模块来源于天然存在的、 野生型的锌指模块, 以及所述第一锌指核酸 酶与所述第二序列的结合, 和所述第二锌指核酸酶与所述第三序列的结合定位了切割结构 域, 使得所述目的区域中的细胞染色质被切割, 导致所述第一核苷酸序列在切割位点发生 改变。 本发明中, 通常可以将编码一种或多种 ZFP 或 ZFP 融合蛋白的核酸克隆进载体中, 转化进原核或真核细胞中来复制和表达。 载体通常是原核或真核载体, 例如质粒、 穿梭载体 或昆虫载体。还通常将编码 ZFP 的核酸克隆进表达载体中, 用来给予植物细胞、 动物细胞, 优选哺乳动物细胞或人类细胞、 真菌细胞、 细菌细胞或原生动物细胞。
表达载体是用一系列指定的核酸元件重组或合成产生的核酸构建体, 所述核酸元 件允许特定的核酸在宿主细胞中转录, 并且任选地允许表达载体在宿主细胞中整合或复 制。表达载体可以是质粒、 病毒或病毒或非病毒来源的核酸片段的一部分。通常, 表达载体 包含 “表达盒” , 表达盒包含可操作地连接于启动子的待转录的核酸。术语表达载体还包括 可操作地连接于启动子的裸露的 DNA。
为了表达克隆的基因或核酸, 通常将编码 ZFP 或 ZFP 融合蛋白的序列亚克隆进含 有指导转录的启动子的表达载体中。合适的细菌和原核启动子在本领域内是公知的。
术语 “可操作地连接” 是指核酸表达调控序列 ( 例如启动子或转录因子结合位点 的排列 ) 和第二核酸序列之间的功能性连接。
本发明中, “宿主细胞” 表示含有锌指核酸酶、 或表达载体或核酸的细胞, 所述表达 载体或核酸两者任选地编码锌指核酸酶。所述宿主细胞通常支持表达载体的复制或表达。 宿主细胞可以是诸如大肠杆菌的原核细胞或真核生物细胞 ( 例如, 酵母、 真菌、 原生动物、
高等植物和昆虫细胞或两栖动物细胞 ) 或哺乳动物细胞 ( 例如, CHO、 HeLa 293、 COS-1 和 HEK, 例如培养的细胞 ( 体外 ))、 外植体和原始培养物 ( 体外和离体 ) 和体内细胞。
术语 “核酸” 是指脱氧核糖核苷酸或核糖核苷酸和其单链或双链形式的聚合物。 该 术语包括含有已知核苷酸类似物或修饰的主链残基或连接物的核酸, 这些核酸是合成的、 天然存在的和非天然存在的, 具有与参考核酸相似的结合特性。这些类似物的实例包括而 不限于, 硫代磷酸酯、 氨基磷酸酯、 膦酸甲酯、 手性膦酸甲酯、 2-O- 甲基核糖核苷酸、 肽核酸 (PNA)。
本文所用的术语 “多肽” 、 “肽” 和 “蛋白质” 是可交替使用的, 是指氨基酸残基的聚 合物。该术语也适用于其中一个或多个氨基酸残基是相应天然存在的氨基酸的人工化学 模拟物的氨基酸聚合物、 以及适用于天然存在的氨基酸聚合物和非天然存在的氨基酸聚合 物。
术语 “氨基酸” 是指天然存在的和合成的氨基酸, 以及以与天然存在的氨基酸相似 的方式起作用的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸是由遗传密码编码的 那些氨基酸、 以及以后进行修饰的那些氨基酸, 例如羟脯氨酸、 γ- 羧基谷氨酸和 O- 磷酸丝 氨酸。氨基酸类似物是指与天然存在的氨基酸具有相同基本化学结构的化合物, 即 α 碳与 氢、 羧基、 氨基和 R 基结合, 例如高丝氨酸、 正亮氨酸、 蛋氨酸亚砜、 蛋氨酸甲基锍。这种类似 物具有修饰的 R 基 ( 例如正亮氨酸 ) 或修饰的肽主链, 但是保留了与天然存在的氨基酸相 同的基本化学结构。氨基酸模拟物是指结构不同于氨基酸一般化学结构, 但是以与天然存 在的氨基酸相似的方式起作用的化合物。可以通过公知的三字母符号或通过 IUPAC-IUB 生 化命名委员会 (Biochemical Nomenclature Commission) 所推荐的单字母符号来表示本文 的氨基酸, 同样可以通过通常所接受的单字母密码来表示核苷酸。 下文将结合实施例对本发明进行详细的描述。然而, 这些实施例仅为示例性的目 的, 并且本发明不受这些实施例所限。
本发明的实施方式
实施例 1 : ZFN 设计和含 ZFN 的质粒的构建
按 “Human zinc fingers as building blocks in the construction of artificial transcription factor( 人类锌指作为构建人工转录因子的构件 ).” (Bae, K.H.et al.Nat Biotechnol 21, 275-280(2003)) 中所描述来组装编码 3- 指或 4- 指阵列的 DNA 片段。在 3- 指或 4- 指阵列中, 选择了具有不同 DNA 结合特异性的 54 种锌指模块 ( 下 文称为 ZF 模块 )。图 1 和 2 中显示了所选的 ZF 模块及其氨基酸序列。在这 54 种 ZF 模块 中, 31 种来源于人类基因组的 DNA 序列, 2 种来源于果蝇基因组的 DNA 序列 ( 图 1)。为了 方便, 将来自人类和果蝇基因组 DNA 序列的 ZF 模块称为 ToolGen 模块。其余的 21 种 ZF 模 块或者选自利用噬菌体展示的 ZF 变体库 (Barbas 模块 ) 或者由定点诱变产生 (Sangamo 模 块 )。
然后, 为了设计多指 ZFN, 我们利用在 ToolGen 开发出的计算机算法来鉴定人类趋 化因子 (C-C 基序 ) 受体 5(CCR5) 编码区的 DNA 序列中的潜在 ZFN 靶位点。基于该结果, 本 发明人通过 54 种 ZF 模块的组合合成了 208 种 ZFN 单体, 并且图 2 中显示了代表性 ZFN 对 的氨基酸序列。这 315 种 ZFN 对一共意图靶向于 CCR5 基因中的 33 个位点 ( 参见图 3)。
将 由 3 或 4 个 ZF 模 块 组 成 的 锌 指 结 构 域 整 合 进 来 源 于 海 床 黄 杆 菌
(flavobacterium okeanokoites) 基因组 DNA 的 FokI 内切核酸酶结构域, 并将整合的序列 克隆进 p3 中, p3 是 pcDNA3.0 质粒 (Invitrogen) 的改良版。
实施例 2 : 体外和体内测定 ZFN 活性
2-1. 体外消化测定
首先, 利用体外转录和翻译 (IVTT) 系统制备 ZFN, 并与包含 CCR5 编码序列的 DNA 片段一起孵育, 以评价其体外 DNA 限制性活性。具体而言, 利用 TnT 快速偶联的转录 / 翻译 系统 (Promega) 按照生产商的描述 ( 体外转录和翻译 ; IVTT) 使实施例 1 中设计的 ZFN 在 体外被转录和翻译。简而言之, 将编码 ZFN 的质粒 ( 每种 0.5μl) 加至 TnT Quick master mix(20μl) 和 1mM 蛋氨酸 (0.5μl) 中, 并于 30℃孵育 90 分钟。首先用限制性酶消化含有 CCR5 编码序列的靶质粒, 使之为线性。然后与一对 ZFN IVTT 裂解物 ( 每种 1μl) 在 37℃ 在 NEBuffer 4(New England Biolabs) 中孵育 2 小时来消化该靶质粒 (1μg)。通过加热 (65℃ ) 使反应混合物失活, 然后于 13,000rpm 离心。上清用于琼脂糖凝胶分析。图 4 是该 测定的示意图, 结果显示在图 5 中。
如图 5 所示, 多种 ZFN 对 (44% ) 表现出对靶 DNA 有效的位点特异性切割。
2-2 : 单链退火系统
然后本发明人利用基于哺乳动物细胞的单链退火 (SSA) 系统来检验这些 ZFN 是否 能在人体细胞中诱导同源重组。
2-2-1. 基于细胞的测定中所用的报告质粒
利用以下表 1 中的引物 1 和 2 从 pGL3-control(Promega) 扩增出萤火虫荧光素酶 基因的 3’ 部分, 并将该扩增产物克隆进 pcDNA5/FRT/TO(Invitrogen) 的 BamHI 和 XhoI 位 点。接下来将用以下表 1 中的引物 3 和 4 扩增出的荧光素酶基因的 5’ 部分克隆进上述得 到的质粒的 HindIII 和 BamHI 位点。利用以下表 1 中的引物 5 和 6 将 I-SceI 结合位点克 隆进该报告质粒的 BamHI 位点。将利用引物 7 和 8 扩增出的 CCR5 编码序列克隆进该报告 质粒的 BamHI 位点。
表1
2-2-2. 细胞培养和报告细胞系的建立
用含实施例 1 中的 ZFN 编码序列的质粒转化 HEK293T/17(ATCC, CRL-11268TM) 细胞 和 Flp-InTM T-RExTM 293 细胞 (Invitrogen), 将该转化的细胞在补有 100 单位 /ml 青霉素、 100μg/ml 链霉素、 0.1mM 非必需氨基酸和 10%胎牛血清 (FBS) 的达尔伯克氏改良伊格尔培 养基 (DMEM) 中维持。按照生厂商的说明书将编码断裂的荧光素酶基因的报告质粒稳定整 合进 Flp-InTM T-RExTM 293 细胞中。 简单而言, 用所述报告质粒和 pOG44(Flp 重组酶表达载 体 ) 共转染该细胞, 并用潮霉素 B 进行选择。鉴定携带断裂的荧光素酶基因的克隆细胞系, 用于 SSA 测定。
2-2-3. 利用 SSA 系统进行基于细胞的测定
用 Lipofectamine 2000(Invitrogen) 将每对 ZFN 表达质粒 ( 每种 100ng) 转染进 30,000 报告细胞 / 孔的 96 孔板中。48 小时后, 通过与强力霉素 (1μg/ml) 一起孵育来诱 导荧光素酶基因。孵育 24 小时后, 将细胞在 20μl 的 1× 裂解缓冲液 (Promega) 中裂解, 并用 10μl 荧光素酶测定剂 (Promega) 加 2μl 细胞裂解物来测定荧光素酶活性。
2-2-4. 结果
用表达 ZFN 的质粒转染人胚肾细胞 (HEK 细胞 ), 该细胞的基因组含有稳定整合的、 通过插入 CCR5 序列而被中断的部分复制的萤火虫荧光素酶基因。有效的 ZFN 能在 CCR5 序 列中产生双链断裂 (DSB), 这应该允许经由 SSA 恢复功能性荧光素酶基因。可以通过检测 荧光素酶酶活性来估计 ZFN 的 DNA 切割效率。高效的大范围核酸酶 I-SceI 用作阳性对照。 实验步骤的示意图如图 6 所示, 结果显示在图 7 中。
如图 7 所示, 本测定中, 多对 ZFN 产生了显著的荧光素酶活性。 在 315 对 ZFN 当中, 与阳性对照 I-SceI 相比, 23 对表现出 15% -57%的荧光素酶活性。表现出小于 15%的活 性的 ZFN 对仍可能在细胞中诱导双链断裂, 但是本发明人集中于高活性的 23 对, 用于进一 步的研究。当这 23 对 ZFN 二聚体使用无靶标的报告细胞时, 它们没有产生显著的荧光素酶
活性, 所述无靶标的报告细胞的基因组所包含的部分复制的荧光素酶基因由与 CCR5 无关 的 DNA 序列中断 ( 数据未显示 )。这些结果提示 ZFN 介导的 DNA 修复是 CCR5 特异的。
实施例 3 : 在 ZFN 处理的 HEK293 细胞中检测突变
发明人研究了既在 IVTT 测定中表现出内切核酸酶活性又在基于细胞的测定中诱 导萤光素酶活性的 ZFN 是否能修饰细胞中的内源靶序列。由 ZFN 诱导的双链断裂可以通过 易出错的非同源性末端连接 (NHEJ) 来修复。产生的 DNA 通常在 DSB 位点附近含有小的插 入或缺失 ( 插入 / 缺失突变 )。可以通过用错配敏感的 T7 内切核酸酶 I(T7E1) 处理扩增的 DNA 片段来体外检测这些插入 / 缺失突变 ( 参见图 8)。
具体而言, 利用 Lipofectamine 2000(Invitrogen) 用两种编码 ZFN 对的质粒 ( 每 种 100ng) 转染于 96 孔板中预培养的 HEK293T/17 细胞。孵育 72 小时后, 利用 G-spinTM 基 因组 DNA 提取试剂盒 (iNtRON BIOTECHNOLOGY) 按照生厂商的描述从 ZFN 转染的细胞提取 基因组 DNA。扩增包含所述 ZFN 靶位点的基因组区, 解链并退火形成异源双螺旋 DNA。引物 9 和 12 用于 Z30 位点、 引物 10 和 12 用于 Z266 和 Z360 位点、 引物 11 和 12 用于 Z410、 Z426 和 Z430 位点、 并且引物 13 和 14 用于 Z836 和 Z891 位点 ( 参见表 1)。用 5 单位 T7 内切核 酸酶 1(New England BioLabs) 对退火的 DNA 于 37℃处理 15 分钟, 然后通过加入 2.5 倍体 积的乙醇来沉淀。通过琼脂糖凝胶电泳分析沉淀的 DNA。结果显示在图 9 中。
如图 9 所示, 从 ZFN 处理的细胞扩增出的 DNA 的小部分被 T7E1 切割。每对 ZFN 产 生不同的切割模式, 反映出这些 ZFN 靶向于 8 个不同的位点的事实。此外, 得到的 DNA 条带 的大小同预期一样。在 T7E1 测定中测试的 23 对 ZFN 中, 21 对表现出可检测到具有预期大 小的 DNA 条带 ( 数据未显示 )。
本发明人还利用 T7E1 测定来检测这种代表性的 ZFN 对 : 或者在 IVTT 测定中未表 现出显著的内切核酸酶活性或者在基于细胞的 SSA 系统中未引起显著的萤光素酶活性但 是通过 IVTT 检验的 ZFN 对。T7E1 测定结果显示, 这些 ZFN 对中没有一个能诱导出可检测水 平的 DNA 突变。
实施例 4 : 对 ZFN 诱导的突变进行 DNA 序列分析
本发明人选择用于进一步研究的 8 对有代表性的 ZFN 对, 每一对均靶向于 CCR5 基 因的不同位点 ( 参见表 2)。他们首先检验这 8 种单独的 ZFN 中的任一种是否能以同二聚体 的形式发挥作用。利用 T7E1 测定来分析单独的每种 ZFN 单体的基因靶向活性。同预期一 样, 没有一种 ZFN 单体能产生可检测的 DNA 切割 ( 数据未显示 )。
表2
然后本发明人测定靶区的 DNA 序列, 以证实 ZFN 诱导的突变并估计诱变率。对 从 8 对 ZFN 中的每一对所转染的细胞扩增出的 DNA 进行克隆并测序。在 DSB 位点附近 观察到多种缺失和插入 ( 参见图 10-14)。这些诱变模式是易错 NHEJ 相关诱变的标志, 并且其它文献中已报道了相似的模式 (Bibikova, M., Golic, M., Golic, K.G.& Carroll, D.Targeted chromosomal cleavage and mutagenesis in Drosophila using zinc-finger nucleases( 利用锌指核酸酶在果蝇中进行定向染色体切割和定向诱变 )Genetics 161, 1169-1175(2002) ; Morton, J., Davis, M.W., Jorgensen, E.M.& Carroll, D.Induction and repair of zinc-finger nuclease-targeted double-strand breaks in Caenorhabditis elegans somatic cells( 对秀丽隐杆线虫 (Caenorhabditis elegans) 体细胞中锌指核酸 酶引起的双链断裂的诱导和修复 ).Proc Natl Acad Sci U S A 103, 16370-16375(2006) ; Santiago, Y.et al.Targeted gene knockout in mammalian cells by using engineered zinc-finger nucleases( 利用工程锌指核酸酶在哺乳动物细胞中定向敲除基因 ).Proc Natl Acad Sci U S A 105, 5809-5814(2008))。除了小的 indel 突变和取代之外, 本发明 人还观察到两对 ZFN( 参见图 11 中的 Z30 和图 12 中的 Z360) 引起的相对大的插入 ( 每对 插入不同的 81 个核苷酸 )。DNA 序列分析揭示, 插入的序列来自编码 ZFN 的质粒。
靶向于不同位点的 8 对 ZFN 显示出 2.4% -17%的诱变率 ( 参见图 15), 这是通过 突变克隆数除以被分析的总克隆数计算得出的。这些高效的 ZFN 诱导的突变作用提示, 仅 筛选 10-100 个来源于单细胞的集落就可以分离出克隆的突变细胞。
实施例 5 : ZFN 处理后克隆细胞的分离
5-1. 本发明 ZFN 的脱靶效应
据了解, 当在哺乳动物细胞中表达时, 某些 ZFN 具有脱靶效应, 并且是细胞毒性 的 (Szczepek, M.et al.Structure-based redesign of the dimerization interface reduces the toxicity of zinc-finger nucleases( 对 二 聚 界 面 基 于 结 构 的 重 新 设 计 降 低 了 锌 指 核 酸 酶 的 毒 性 ).Nat Biotechnol 25, 786-793(2007) ; Miller, J.C.et al.An improved zinc-finger nuclease architecture for highly specific genome editing( 改 善 锌 指 核 酸 酶 结 构 用 于 高 特 异 性 的 基 因 组 编 辑 ).Nat Biotechnol 25, 778-785(2007))。本发明人观察到本发明 ZFN 转染的 HEK293 细胞生长没有显著迟缓。然 而, 当他们最初筛选有限数量的单细胞集落时, 他们无法分离基因组序列被 ZFN 处理所修 饰的克隆的突变细胞, 这表明携带 ZFN 诱导突变的哺乳动物细胞随着生长而减少。
因此, 为了研究携带 ZFN 诱导突变的哺乳动物细胞是否随着生长而减少, 并因此 被非修饰的细胞所超越, 本发明人用从 ZFN 转染后第 3、 6 和 9 天时的细胞所分离的 DNA 进 行 T7E1 测定。对于本次分析他们选择了 Z891 对, 并且如图 16 所示, 与第 3 天相比, 在第 6 天时切割的 DNA 片段明显减少, 并且在 ZFN 处理后第 9 天时, 几乎检测不到切割的 DNA 片段。 这些结果提示 ZFN 介导的诱变作用确实对细胞生长具有细胞毒效应。
5-2. 本发明异二聚 ZFN 的脱靶效应
ZFN 的脱靶效应主要由形成同二聚或异二聚的 ZFN 单体的活性引起。通过利用能 形成异二聚体但不能形成同二聚体的 FokI 核酸酶变体可以显著降低这些效应。因此, 为了 降低 ZFN 的细胞毒效应, 本发明人在 T7E1 测定中制备并检验了两种不同类型的所谓的强制 型异二聚体 ( 表示为图 16 中的 “RR/DD” 二聚体和 “KK/EL” 二聚体 )。T7E1 测定表明, 当细 胞用 RR/DD ZFN 对转染时, 甚至在 ZFN 处理后第 9 天时仍存在切割的 DNA 片段。 为了证实该 强制型异二聚 ZFN 的细胞毒性的降低是由其在细胞中 DNA 切割的特异性增强引起, 本发明 人利用抗 53BP1( 被吸引至 DSB 的蛋白质 ) 的抗体分析 ZFN 处理细胞中的 DSB 的数量。 具体 而言, 用 HEK293T/17 细胞进行 53BP1 的核内染色。用带盖的 Lab-Tek 腔室玻片 (NUNC) 附 着细胞, 并用 3.7%的甲醛来固定该细胞来制备玻片。然后通过用 0.2% Triton X-100 的 磷酸盐缓冲盐水 (PBS) 的处理使该细胞于室温 (RT) 渗透 10 分钟。然后将细胞与抗 53BP1 的兔多克隆抗体 (Bethyl Laboratories) 孵育, 存在 5%牛血清白蛋白 (BSA) 以封闭非特 异性着色, 接下来与 Alexa Fluor 488 偶联的二抗 (Invitrogen-Molecular Probes) 孵育。 将玻片置于 DAPI(Sigma) 中来复染细胞核, 并在免疫荧光显微镜 (Carl Zeiss-LSM510) 下 检查。结果显示在图 17 和 18 中。如图 17 和 18 所示, 当与用对应的野生型 ZFN 对处理的 细胞相比, 用 RR/DD ZFN 对处理的细胞中 53BP1 位点的数量显著减少。
5-3. 在用 ZFN 处理的基因组中检测突变
接下来, 在筛查分别在 96 孔板上生长的 225 个单细胞集落之后, 随即分离出了利 用 Z891 RR/DD ZFN 对的 7 种不同的突变的克隆 HEK293 细胞。本发明人检验这些克隆细胞 中 CCR5 区的 DNA 序列, 以确认 ZFN 诱导的基因组修饰。对修饰细胞基因组的 DNA 序列的分 析表明, 7 个克隆中有 6 个表现为单等位基因的缺失或插入, 以及 1 个表现为 CCR5 基因的双 等位基因修饰 ( 参见图 19)。由于有一部分三体细胞, 因此 HEK293 细胞在其基因组中携带 三个 CCR5 基因拷贝。在表现为双等位基因修饰的克隆中, 观察到一段未修饰的、 野生型序列 ( 参见图 19)。 这种由 ZFN 处理引起的双等位基因修饰提示, 仅在一个不用选择标记的步 骤中, 就可以分离纯合的敲除细胞。
实施例 6 : 靶向于 CCR5 的 ZFN 在同源的 CCR2 位点处的脱靶效应
CCR2 基因与 CCR5 基因是高度同源的, 并且多个 CCR5 ZFN 识别元件在 CCR2 基因 座中是保守的。因此, 本发明人研究为 CCR5 位点所设计的 8 对 ZFN 是否也能修饰 CCR2 基 因座处的同源或一致的序列。在 CCR2 基因中具有相同识别元件的三对 ZFN(Z360、 Z410 和 Z430) 能在 T7E1 测定中诱导有效的基因组修饰 ( 参见图 20)。在 CCR2 基因中, Z891 对的识 别元件由与 CCR5 基因的对应位点完美匹配的 12-bp 半位点和携带一个碱基的错配的 12-bp 的半位点组成。同预期一样, 该 Z891 对也在 CCR2 位点处表现出显著的基因靶向活性。本 发明人还检验了 Sangamo 的靶向于 CCR5 的 ZFN 对, 其在 CCR2 基因座中的识别元件在每个 12-bp 半位点中含有一个碱基的错配, 并且证实该 ZFN 在同源的 CCR2 位点处表现出脱靶基 因组修饰 ( 参见图 20)。相反, 对于 ZFN 对 (Z30、 Z266 和 Z836) 没有观察到可检测的 ZFN 活 性, 这些 ZFN 对在 CCR2 基因座的识别元件显示出至少两个错配。
本发明人还检验了通过 Z891 对转染的 HEK293 细胞所获得的 7 种突变的克隆细胞 除了在预期的 CCR5 位点诱导突变之外, 在高度同源的 CCR2 位点的 DNA 序列中是否诱导突 变。结果显示在图 21 中。尽管如图 20 所描述, Z891 对在 T7E1 测定中在 CCR2 位点以及在 CCR5 位点均表现出显著的基因靶向活性, 但是这些克隆细胞系的 CCR2 基因座没有被突变。 这些结果表明, 可能分离出克隆细胞, 其中 ZFN 处理之后通过筛查细胞仅在预期的靶位点, 而不在同源的位点被突变。 实施例 7 : 模块交换分析
本发明人随后研究了为什么我们经由模块组装来制备 ZFN 的方法能导致高成功 率的基因组编辑。具体而言, 他们进行了模块交换实验, 其中用从 Barbas 或 Sangamo 模块 产生的表现出相同 DNA- 结合特异性的那些 ZFN 替代本发明的 ZFN。
为此, 本发明人制备了 8 种新的仅由 Barbas 或 Sangamo 模块组成的 ZFN 单体, 并 用它们来替代 6 种不同的仅由 ToolGen 模块组成的 ZFN 单体 ( 参见表 3 和图 22)。将这些 新的 ZFN 单体中的每一种与合适的伴侣 ZFN 单体配对, 并在 SSA 和 T7E1 测定中检验得到的 ZFN 对。如图 23 和 24 所示, 由至少一种这些新合成的 ZFN 单体所组成的 ZFN 对中, 没有一 种在 SSA 系统中表现出任何显著的活性 ( 参见图 23)。此外, 这些 ZFN 中没有一种在 T7E1 测定中表现出任何基因靶向活性 ( 参见图 24)。
表3
这些结果强有力地支持这种观点 : 对于功能性 ZF 阵列的模块式组装, 天然存在的 ZF 比工程 ZF 能构成更可靠的框架。
实施例 8 : 对本发明 ZF 模块的评价
对本发明人产生的 315 对 ZFN 的统计学分析可以为新 ZFN 的设计提供基础, 该新 ZFN 可用来定向诱变其它感兴趣的内源基因。为此, 本发明人计算出在 SSA 系统中为阳性 评分的 23 对 ZFN 中每种 ZF 的出现次数。然后他们用该次数除以所有 208 种 ZFN 单体中 该模块出现的次数来确定每种 ZF 的 “活性评分” ( 参见图 1 和 2)。某些高活性的 ZF, 例如 “QNTQ” 和 “RSHR” 分别具有 50%和 38%的活性评分 ; 这些高活性评分提示, 就预测体内位 点特异的核酸酶活性而言, 这些模块是可靠的。 其它 ZF, 例如在本测定中表现为无效模块的 “QSNK” 和 “rdae” , 显示的活性评分为 0。这两种 ZF 都用了 15 次, 但是含有这些模块的 ZFN 中, 没有一种在我们的测定中是有活性的。本发明人还比较了具有相同 DNA 识别特异性的 ZF 的活性评分。某些 ZF 明显比其它相同靶标的模块好, 例如, “DSNR” 和 “HSNK” 识别相同 的 GAC 序列。在构建 ZFN 中用 “DSNR” 产生了多种活性核酸酶 ( 活性评分= 35% ), 而并入 “HSNK” 只产生了非活性的 ZFN( 活性评分= 0% )。
基于统计学分析, 本发明人暂时推荐了 37 种 ZF(24 种 ToolGen 模块、 1 种 Sangamo
模块和 12 种 Barbas 模块 ), 用于将来的基因编辑研究中 ( 参见图 1 和 2)。如果本发明 人在实验中仅使用这 37 种模块, 总成功率应该是 53%, 这显著优于现在的成功率 (24% ) ( 参见图 26)。这 37 种模块均在活性 ZFN 中出现至少一次。当有两个或更多个相同靶标 的 ZF 时, 他们选择具有较高活性评分的那些 ZF。37 种 ZF 共识别 64 个 3-bp 亚位点中的 38 个。对于给定的 1-kbp 的随机 DNA 序列, 他们预测, 对于 3 指 ZFN 二聚体有 88 个 [ = 6 (38/64) ×1000×2] 潜在靶位点 ( 在半位点之间包含 5 或 6 个碱基的间隔 ), 并且对于 4 指 ZFN 二聚体有 31 个位点。假设本发明有 9.1%至 26%的成功率 ( 如果我们使用 37 种 ZF 而 不是其它的无效模块, 则实际成功率将显著提高 ), ZFN 介导的基因组编辑在 1-kbp 的靶序 列中平均可能有 8 个位点。这提示, 利用本发明的 ZFN 组装方法, 应该 “可靶向” 即使不是 全部也是大多数的真核生物基因。
工业实用性
在许多基因治疗应用中, 这些锌指核酸酶都可以用来敲除 CCR5 基因, 以在 AIDS 患 者中产生抗 HIV 感染的 T 细胞。24102333864 A CN 102333879
序列表1/32 页
25102333864 A CN 102333879序列表2/32 页
26102333864 A CN 102333879序列表3/32 页
27102333864 A CN 102333879序列表4/32 页
28102333864 A CN 102333879序列表5/32 页
29102333864 A CN 102333879序列表6/32 页
30102333864 A CN 102333879序列表7/32 页
31102333864 A CN 102333879序列表8/32 页
32102333864 A CN 102333879序列表9/32 页
33102333864 A CN 102333879序列表10/32 页
34102333864 A CN 102333879序列表11/32 页
35102333864 A CN 102333879序列表12/32 页
36102333864 A CN 102333879序列表13/32 页
37102333864 A CN 102333879序列表14/32 页
38102333864 A CN 102333879序列表15/32 页
图 1 显示用于构建本发明锌指核酸酶的锌指的来源、 氨基酸序列和靶亚位点。
图 2 显示本发明人合成的锌指核酸酶中有代表性的 ZFN 对的氨基酸序列 ; 所包含 的用于检测它们在细胞中表达的 HA 标签和核定位信号序列用下划线标示出, 并且用粗体 指出预期与靶碱基序列结合的锌指 α 螺旋区。
图 3 是 CCR5 编码区中 ZFN 靶位点的示意图 ; 用盒表示 ZFN 靶位点, 数字指示 ZFN 靶位点相对于起始密码子的位置, 用交叉线画出阴影的盒指示 Δ32 突变的座位。
图 4 是利用体外转录和翻译系统制备的 ZFN 进行 DNA 切割测定的示意图。
图 5 是显示 DNA 切割测定的琼脂糖凝胶电泳结果的照片。
图 6 是用于评估 ZFN 活性的基于细胞的单链退火 (SSA) 的示意图 ; 将 ZFN 表达质 粒转染进 HEK293 细胞中, HEK293 细胞的基因组包含无活性的、 部分复制的且中断的萤光素 酶基因。如果 ZFN 切割细胞中的靶位点, 则 DNA 可被 SSA 机制有效修复, 并且能恢复功能性 的萤光素酶基因。
图 7 是用于评估 ZFN 活性的基于细胞的单链退火 (SSA) 的示意图 ; 细胞的萤光素 酶活性指示多种 ZFN 的表达。p3 是用作阴性对照的空质粒。靶序列含有用作阳性对照的 I-SceI 的识别位点。将每对 ZFN 的活性报告为相对于 I-SceI 对照的百分比。指出了 ZFN 对及其组成单体。用三角形标示出用于进一步研究的 ZFN 对。显示至少 3 次独立实验的平 均值和标准差 ( 误差棒 )。 图 8 是利用 T7E1 测定检测人细胞中 ZFN 介导的基因组编辑错配的示意图 ; 从用编 码 ZFN 的质粒转染的细胞纯化基因组 DNA。通过 PCR 扩增出包含 ZFN 识别位点的 DNA 片段, 并使该 DNA 扩增子解链并退火。如果该 DNA 扩增子包含野生型和突变的 DNA 序列, 则形成 异源双螺旋。T7E1 识别并切割异源双螺旋, 而不是同源双螺旋。通过琼脂糖凝胶电泳评估 DNA 片段。
图 9 显示利用 T7E1 测定揭示 ZFN 介导的基因组修饰 ; ZFN 对显示在琼脂糖凝胶的 上端。在凝胶图的左侧用箭头 ( 未切割 ) 和括弧 ( 切割 ) 指示所得的 DNA 条带的预期位 置。p3 是用作阴性对照的空质粒。本测定中包括 Sangamo 的靶向 CCR5 的 ZFN 对 (Sangamo CCR5)。
图 10 显示 Z836 ZFN 对所靶向的基因组位点的 DNA 序列 ; ZFN 识别元件用下划线 标示出。用破折号指示缺失, 用小写字母表示插入的碱基。如果检测出突变多于一次, 则在 括号内指出出现的次数。Wt 代表野生型。
图 11 显示 Z30 和 Z266 ZFN 对所靶向的基因组位点的 DNA 序列 ; ZFN 识别元件用 下划线标示出。用破折号指示缺失, 用小写字母表示插入的碱基。如果检测出突变多于一 次, 则在括号内指出出现的次数。
图 12 显示 Z360 和 Z411 ZFN 对所靶向的基因组位点的 DNA 序列 ; ZFN 识别元件用 下划线标示出。用破折号指示缺失, 用小写字母表示插入的碱基。如果检测出突变多于一 次, 则在括号内指出出现的次数。
图 13 显示 Z426 和 Z430 ZFN 对所靶向的基因组位点的 DNA 序列 ; ZFN 识别元件用 下划线标示出。用破折号指示缺失, 用小写字母表示插入的碱基。如果检测出突变多于一 次, 则在括号内指出出现的次数。
图 9 显示利用 T7E1 测定揭示 ZFN 介导的基因组修饰 ; ZFN 对显示在琼脂糖凝胶的 上端。在凝胶图的左侧用箭头 ( 未切割 ) 和括弧 ( 切割 ) 指示所得的 DNA 条带的预期位 置。p3 是用作阴性对照的空质粒。本测定中包括 Sangamo 的靶向 CCR5 的 ZFN 对 (Sangamo CCR5)。
图 10 显示 Z836 ZFN 对所靶向的基因组位点的 DNA 序列 ; ZFN 识别元件用下划线 标示出。用破折号指示缺失, 用小写字母表示插入的碱基。如果检测出突变多于一次, 则在 括号内指出出现的次数。Wt 代表野生型。
图 11 显示 Z30 和 Z266 ZFN 对所靶向的基因组位点的 DNA 序列 ; ZFN 识别元件用 下划线标示出。用破折号指示缺失, 用小写字母表示插入的碱基。如果检测出突变多于一 次, 则在括号内指出出现的次数。
图 12 显示 Z360 和 Z411 ZFN 对所靶向的基因组位点的 DNA 序列 ; ZFN 识别元件用 下划线标示出。用破折号指示缺失, 用小写字母表示插入的碱基。如果检测出突变多于一 次, 则在括号内指出出现的次数。
图 13 显示 Z426 和 Z430 ZFN 对所靶向的基因组位点的 DNA 序列 ; ZFN 识别元件用 下划线标示出。用破折号指示缺失, 用小写字母表示插入的碱基。如果检测出突变多于一 次, 则在括号内指出出现的次数。
图 14 显示 Z891 ZFN 对所靶向的基因组位点的 DNA 序列 ; ZFN 识别元件用下划线 标示出。用破折号指示缺失, 用小写字母表示插入的碱基。如果检测出突变多于一次, 则在 括号内指出出现的次数。
图 15 显示若干 ZFN 靶位点处的突变类型 ; 对每对 ZFN 的缺失、 插入和混合突变的 数量进行计数, 并绘制出这些事件的百分比。
图 16 是野生型和强制型异二聚 ZFN 的时间进程分析结果 ; 在不同的时间点对从 细胞分离的 DNA 进行 T7E1 错配检测测定, 所述细胞用不同形式的 FokI 核酸酶结构域处理。 (WT, 野生型核酸酶结构域 ; RR/DD 或 KK/EL, 强制型异二聚核酸酶结构域 )
图 17 是 53BP1 染 色 的 结 果 ; 将 野 生 型 和 强 制 型 异 二 聚 Z891 ZFN 对 转 染 进 HEK293T/17 细胞, 并在转染后第 2 天时, 通过免疫荧光检测细胞内 53BP1 的位置。 依托泊苷 (1μM) 用作阳性对照。
图 18 是图 16 结果的图表。绘制出 53BP1 位置的数量分布。对于每个处理, 两次 独立的测定中分析至少 100 个细胞。
图 19 显示突变克隆的 DNA 序列 ; 通过有限稀释从 RR/DD ZFN 二聚体处理的细胞分 离了 7 个突变克隆。显示了这些克隆细胞中靶位点的 DNA 序列。用破折号指示缺失, 用小 写字母表示插入的碱基。克隆 1a 和 1b 指示由单克隆中的双等位基因修饰所产生的 DNA 序 列。
图 20 显示在 CCR2 位点进行的 T7E1 测定 ; 分析通过 PCR 从 ZFN 对处理的细胞扩 增的与 CCR2 编码区对应的 DNA( 在凝胶图的上端显示 )。用 “+” 标记在 CCR2 位点产生修 饰的 ZFN 对。p3 是用作阴性对照的空质粒。本测定中包括 Sangamo 的靶向 CCR5 的 ZFN 对 (Sangamo CCR5)。
图 21 显示 ZFN 在 CCR2 基因座的脱靶效应, 以及 CCR5 和 CCR2 基因座的 ZFN 识别 元件。指出的 ZFN 对位于 DNA 序列的左侧。用括号标出 CCR5 和 CCR2 基因座之间的匹配碱 基的数量, 用小写的黑体字母指示错配的碱基。半位点 ZFN 识别元件用下划线标示出。
图 22 显示用于模块交换实验的锌指。
图 23 是模块交换分析中利用基于细胞的 SSA 系统来检验这些新的 ZFN 是否能功 能性地替代本发明的识别相同序列的 ZFN 的结果 ; 名称由 “B” 开头的诸如 “BR4” 的 ZFN 单 体仅由 Barbas 模块组成, 以及由 “S” 开头的诸如 “SR4” 的那些 ZFN 单体仅由 Sangamo 模块 组成。细胞的萤光素酶活性指示多种 ZFN 的表达。p3 是用作阴性对照的空质粒。靶序列含 有用作阳性对照的 I-SceI 的识别位点。将每对 ZFN 的活性表示为相对于 I-SceI 对照的百 分比。指出了 ZFN 对及其组成单体。显示至少 3 次独立实验的平均值和标准差 ( 误差棒 )。
图 24 显示模块交换分析中利用 T7E1 测定的 ZFN 介导的基因组修饰来检验这些新 的 ZFN 是否能功能性地替代本发明的识别相同序列的 ZFN ; 在琼脂糖凝胶的上端显示 ZFN 对及其组成单体。用 “+” 标记产生阳性基因靶向事件的 ZFN 对。
图 25 概括 ZFN 分析 ; 显示出在每次测定中产生阳性结果的 ZFN 对或靶位点的数 量。
图 26 显示不同类型的 ZFN 的成功率 ; 将成功的 ZFN 对或靶位点定义为在 T7E1 错 配检测测定中产生阳性结果的那些。
实施本发明的最佳方式按照一方面, 本发明涉及包含锌指结构域和核苷酸切割结构域的融合蛋白——锌 指核酸酶 (ZFN), 其中所述锌指结构域包含三个或更多个锌指模块, 两个或更多个所述锌指 模块来源于天然存在的、 野生型的锌指模块, 并且所述融合蛋白识别并切割包含染色质特 定区域的核苷酸序列。
本发明的锌指结构域是指通过一个或多个锌指模块以序列特异的方式与核苷酸 结合的蛋白质。所述锌指结构域包含至少三个锌指模块。通常将所述锌指结构域缩写为锌 指蛋白或 ZFP。
本发明的锌指模块是结合结构域中的氨基酸序列区, 通过配位锌离子来稳定该结 合结构域的结构。 本发明的锌指模块的序列与天然存在的、 野生型的锌指模块的序列一致, 或者与通过其它氨基酸对野生型序列中的任何氨基酸的取代而修饰的序列一致。 所述野生 型的锌指模块可以来源于任何真核细胞, 例如真菌细胞 ( 例如酵母 )、 植物或动物细胞 ( 例 如诸如人或小鼠的哺乳动物细胞 )。 优选地, 本发明的锌指模块包含图 1 所代表的来源于人 或类似物的氨基酸序列。
锌指核酸酶的锌指结构域由 3 个或更多个串联排列的锌指模块组成, 每个锌指模 块识别 3bp( 碱基对 ) 的亚位点。由于每个模块独立地识别 DNA 序列, 因此由 3 或 4 个模块 组成的锌指结构域能结合 9-bp 或 12-bp 的序列。锌指核酸酶以二聚体的形式发挥功能, 因 此, 一对由 3 或 4 个模块组成的锌指核酸酶能特异地识别 18-bp 至 24-bp 的序列。在具体 的实例中, 本发明的锌指核酸酶的锌指结构域由 3 或 4 个模块, 优选由 4 个锌指模块组成。 此外, 在一个优选的实施方案中, 本发明的锌指核酸酶所包含的锌指结构域优选包含锌指 模块。 在具体的实例中, 含有 4 个锌指模块的锌指核酸酶成功地靶向 26%的可能切割位点, 而含有 3 个锌指模块的锌指核酸酶仅靶向 9.1%的可能位点。 可以将锌指结构域工程改造为与预定的核苷酸序列结合。 工程改造锌指结构域的 方法的非限制性实例是设计和选择。设计的锌指蛋白是非天然存在的蛋白质, 其设计 / 组 成主要来自合理的标准。设计的合理标准包括应用取代原则和计算机算法对存储现存的 ZFP 设计和结合数据信息的数据库中的信息进行处理 ( 参见韩国专利第 0766952 号 )。选 择的锌指蛋白是并非在自然中所发现的蛋白质, 其产生主要来自诸如噬菌体展示、 相互捕 获或杂交选择的实验过程。
组成加工的锌指结构域中的至少 2 个或更多个锌指模块优选是野生型锌指模块, 更优选 3 个或更多个是野生型锌指模块。在一个具体的实例中, 本发明人进行了模块交换 分析, 其中用噬菌体展示或点突变进行工程改造和分离的锌指核酸酶来替代本发明的锌指 核酸酶。发现本发明的锌指核酸酶在 SSA 系统和 T7E1 测定中表现出显著的活性。因此, 优 选地, 本发明锌指核酸酶由天然存在的、 野生型的锌指模块组成。更优选地, 本发明的锌指 核酸酶由表 2 所示的锌指结构域组成。此外, 本发明的锌指核酸酶并非靶向 GNN- 重复序 列, 这与已知的工程锌指核酸酶不同。在具体的实例中, 在对 CCR5 序列进行成功修饰的 16 个锌指核酸酶中, 只有 2 个 (Z426F3 和 Z360R4) 识别 GNN- 重复位点, 而有 2 个 (Z430R3 和 Z30F4) 识别无 GNN 基序的半位点元件, 12 个识别由 GNN 和非 GNN 基序组成的位点, 如以下 的表 2 所示。靶向除 GNN- 重复序列以外的位点的能力极大地扩展了 ZFN 技术的实用性。
本文所用的术语 “切割” 是指破坏 DNA 分子的共价主链, 术语 “切割结构域” 是指 具有催化 DNA 切割活性的多肽序列。
所述切割结构域可以获自任何内切核酸酶或外切核酸酶。 可以产生切割结构域的 示例性的内切核酸酶包括但不限于, 限制性内切核酸酶和归巢内切核酸酶。这些酶可以作 为切割结构域的来源。 此外, 单链切割和双链切割均是可能的, 其中双链切割的发生可以取 决于切割结构域的来源。 在这方面, 具有双链切割活性的切割结构域可用作切割半结构域。 本文的切割结构域可以与单链切割和双链切割交替使用。
切割结构域可以来源于任何核酸酶或其一部分。通常, 如果融合蛋白包含具有双 链切割活性的切割半结构域, 则切割需要两个融合蛋白。两个切割半结构域可以来源于相 同的内切核酸酶 ( 或其功能性片段 ), 或者每个切割半结构域可以来源于不同的内切核酸 酶 ( 或其功能性片段 )。此外, 两个融合蛋白与其各自靶位点的结合使所述切割半结构域 以彼此相对的空间方向定位, 这允许所述切割半结构域例如通过二聚形成功能性切割结构 域。因此, 两个靶位点之间可以有任何整数的核苷酸或核苷酸对 ( 例如 2 至 50 个核苷酸对 或更多 )。
通常, 如果使用的两个融合蛋白中的每个都包含切割半结构域, 则每个融合蛋白 的锌指部分的主要接触链将在不同的 DNA 链上, 并且在相反的方向中。即对于一对 ZFP/ 切 割半结构域融合体而言, 靶序列位于相反的链上, 并且两种蛋白质以相反的方向结合。 限制性内切核酸酶存在于多种物种中, 并能序列特异地与 DNA( 在识别位点处 ) 结 合, 并在结合位点或者邻近结合位点处切割 DNA。某些限制性酶 ( 例如 IIS 型 ) 在远离识别 位点的位点处切割 DNA, 并具有可分的结合和切割结构域。例如, IIS 型酶 FokI 在离其一条 链上的识别位点 9 个核苷酸和离另一链上的识别位点 13 个核苷酸处催化 DNA 的双链切割。 因此, 在一个实施方案中, 融合蛋白包含来自至少一种 IIS 型限制性酶的切割结构域 ( 或切 割半结构域 ) 和一个或多个锌指结合结构域。
IIS 型限制性酶的实例包括包括 FokI、 AarI、 AceIII、 AciI、 AloI、 BaeI、 Bbr7I、 CdiI、 CjePI、 EciI、 Esp3I、 FinI、 MboI、 sapI、 和 SspD51, 但并不限于这些, 更具体的参见 Roberts et al.(2003)Nucleic Acid Res.31 : 418-420。 在具体的实施方案中, 将从 IIS 型 限制性酶 FokI 分离 DNA 结合结构域所获得的 FokI 切割结构域用作切割结构域 ( 或半切割 结构域 )。
本发明的融合蛋白是指两个或更多个不同的多肽通过肽键连接形成的多肽。 所述 多肽包含锌指结构域和能切割核苷酸序列中的任何靶位点的核苷酸切割结构域。 本文中的 融合蛋白与锌指核酸酶或 ZFN 交替使用。
设计和构建融合蛋白 ( 或者编码融合蛋白的多核苷酸 ) 的方法在本领域是公知 的。 在一个具体的实施方案中, 构建的是编码融合蛋白的多核苷酸, 所述融合蛋白包含锌指 结构域和切割结构域。可以将所述多核苷酸插入载体中, 并可将所述载体导入细胞。通常, 融合蛋白 ( 例如 ZFP-FokI 融合体 ) 成分的排列使得锌指结构域距所述融合蛋白的氨基末 端 (N- 末端 ) 最近, 切割半结构域距羧基末端 (C- 末端 ) 最近。这反映了诸如来源于 FokI 酶的天然存在的二聚化切割结构域中的切割结构域的相对方向, 其中 DNA 结合结构域距氨 基末端最近, 切割半结构域距羧基末端最近。
本文所用的术语 “序列” 是指任何长度的核苷酸序列, 可以为 DNA 或 RNA ; 可以为线 状、 环状或分枝的并且可以为单链或双链。
本文所用的术语 “结合” 是指巨分子之间 ( 例如蛋白质和核酸之间 ) 序列特异的
或非共价的相互作用。只要相互作用作为整体是序列特异性的, 而不需要结合相互作用的 所有成分均是序列特异性的 ( 例如与 DNA 主链中的磷酸残基接触 )。这种相互作用的特征 通常为解离常数 (Kd) 为 10-6M-1 或更小。术语 “亲和力” 是指结合的强度 : 结合亲和力的提 高与 Kd 降低相关。
按照另一方面, 本发明涉及用于切割、 替换或修饰靶区中的 DNA 序列的试剂盒, 所 述试剂盒包含一对或多对锌指核酸酶。
通常, 由于锌指核酸酶 (ZFN) 以二聚体的形式发挥作用, 因此针对单个 DNA 位点需 要制备两个 ZFN 单体。构成 ZFN 对的两个单体 ZFN 的中的每个与两个 9-bp 或 12-bp 的半 位点中的一个结合, 所述两个 9-bp 或 12-bp 的半位点由 5-bp 或 6-bp 的间隔序列分开。对 于单个半位点, 可以设计多个由不同的 ZF 组构成的单体 ZFN, 该不同的 ZF 组具有相同或相 似 DNA 结合特异性。在具体的实施方案中, 由相同或相似锌指结构域构成的 ZFN 对显示在 表 2 中, 但并不限于这些。多个组合 ZFN 对可以针对单个位点。
可以将本文所用的术语 “替换” 理解为表示一条核苷酸序列被另一条核苷酸序列 替换 ( 即信息层面的序列替换 ), 而并不必然需要用另一个多核苷酸物理或化学替换一个 多核苷酸。本文所用的术语 “修饰” 表示通过突变或非同源性末端连接而发生的 DNA 序列 中的改变。所述突变包括点突变、 取代、 缺失、 插入等。所述替换或修饰可以是用遗传信息 完全的核苷酸取代或改变遗传信息不完全的核苷酸。 由核苷酸序列所编码的肽也可以通过 突变而被功能失活。通过这种方式, 可以将锌指核酸酶用作基因治疗的工具。在一个具体 的实施方案中, 证实了针对敲除编码 CCR5 蛋白的人趋化因子 (C-C 基序 ) 受体 5(CCR5) 基 因的 ZFN, 该 CCR5 蛋白是人类免疫缺陷病毒 (HIV) 感染靶细胞所用的主要共受体。 当结合例如细胞、 核酸、 蛋白质或载体使用时, 术语 “重组体” 表示所述细胞、 核酸、 蛋白质或载体通过导入异源核酸或蛋白质或改变天然的核酸或蛋白质而被修饰, 或者表示 该细胞来源于进行这种修饰的细胞。因此, 例如, 重组细胞表达在天然的 ( 天然存在的 ) 细 胞形式中未被发现的基因, 或者表达以其它方式正常表达或非正常表达的、 低表达或根本 不表达的第二拷贝的天然基因。
按照另一方面, 本发明涉及产生锌指核酸酶的方法, 所述方法包括 : (a) 在目的区 域中选择核苷酸序列 ; (b) 选择与所述序列结合的锌指模块并工程改造锌指结构域, 其中 所述锌指结构域包含三个或更多个锌指模块, 两个或更多个所述锌指模块来源于天然存在 的、 野生型的锌指模块, 以及 (c) 表达包含工程锌指结构域和核苷酸切割结构域的融合蛋 白。
在产生本发明的锌指核酸酶的方法中, 步骤 (a) 是选择目的区域中的核苷酸序列 的步骤。所述核苷酸序列可以存在于细胞内或细胞外, 长度是不受限制的。核苷酸可以为 线状或环状的、 单链或双链的。
步骤 (b) 是选择与目的区域中的核苷酸序列结合的锌指模块并工程改造锌指结 构域的步骤。 优选地, 所述锌指结构域包含三个或更多个锌指模块, 两个或更多个所述锌指 模块来源于天然存在的、 野生型的锌指模块, 更优选图 1 所示的锌指模块, 甚至更优选图 2 所示的锌指模块。
步骤 (c) 是表达包含锌指结构域和核苷酸切割结构域的融合蛋白的步骤。所述表 达包括体内和离体表达。可以通过本领域内已知的方法进行体内表达, 例如利用载体。载
体的实例包括但不限于质粒、 黏粒、 噬菌体和病毒载体, 但是并不限于这些。可以根据用途 通过包含分泌信号序列以及调控元件来制备合适的表达载体, 所述调控元件元件例如启动 子、 操纵子、 起始密码子、 终止密码子、 多腺苷酸化信号和增强子。
按照另一方面, 本发明涉及利用锌指核酸酶来切割目的区域中的细胞染色质的方 法。
在一个具体的实施方案中, 本发明提供了切割目的区域中的细胞染色质的方法, 包括以下步骤 : (a) 在目的区域中选择第一核苷酸序列 ; (b) 选择与第一核苷酸序列结合 的第一锌指核酸酶 ; (c) 在包含所述核苷酸序列的细胞内或细胞外表达所述第一锌指核酸 酶, 从而将所述核酸酶导入所述细胞中, ; 以及 (d) 使所述第一锌指核酸酶 ( 其在细胞内表 达或被导入细胞 ) 与所述序列结合, 以便切割目的区域中的细胞染色质。
本发明的第一锌指核酸酶包括三个或更多个锌指模块, 两个或更多个所述锌指模 块来源于天然存在的、 野生型的锌指模块。
在另一个具体的实施方案中, 本发明提供了切割目的区域中的细胞染色质的方 法, 包括以下步骤 : (a) 在目的区域中选择第一核苷酸序列 ; (b) 选择与第一核苷酸序列结 合的包含本发明的第一锌指结构域和第一核苷酸切割结构域的第一锌指核酸酶 ; (c) 在包 含所述核苷酸序列的细胞内或细胞外表达所述第一锌指核酸酶, 用于将所述核酸酶导入所 述细胞 ; 以及 (d) 使第一锌指核酸酶 ( 其在细胞内表达或被导入细胞 ) 与所述序列结合, 以 便切割目的区域中的细胞染色质 ; (e) 在包含所述核苷酸序列的细胞内或细胞外选择并表 达第二锌指核酸酶, 从而将所述核酸酶导入所述细胞中, 其中所述第二锌指核酸酶包含第 二锌指结构域和第二核苷酸切割结构域 ; 以及 (f) 使所述第二锌指核酸酶 ( 其在细胞内表 达或被导入细胞 ) 与目的区域中的所述第二核苷酸序列结合, 其中所述第二序列与所述第 一锌指核酸酶所结合的所述第一核苷酸序列之间的距离为 2-50 个核苷酸。
本文所用的 “染色质” 是指包含细胞基因组的核蛋白质结构。细胞染色质包含核 酸、 主要的 DNA 和蛋白质, 所述蛋白质包括组蛋白和非组蛋白染色体蛋白质。细胞染色质 可存在于任何类型的细胞中, 包括原核和真核细胞、 例如真菌、 植物、 动物、 哺乳动物、 灵长 类动物和人类细胞。大多数真核细胞染色质以核小体的形式存在, 其中核小体中心包含约 150 个碱基对的 DNA 和连接的包含组蛋白 H2A、 H2B、 H3 和 H4 每种两个的八聚体 ; 并且连接 物 DNA( 取决于有机体长度可变 ) 在核小体中心间延伸。组蛋白 H1 分子通常与连接物 DNA 连接。 为了公开本发明的目的, 术语 “染色质” 意图包括所有的细胞核蛋白质类型, 原核生物 的和真核生物的。细胞染色质包括染色体染色质和附加体染色质。 “染色体” 是包含所有或 部分细胞基因组的染色质复合物。 “附加体” 是复制中的核酸、 核蛋白质复合物或包含的核 酸不是细胞染色体组型的一部分的其它结构。附加体的实例包括质粒和某些病毒基因组。
在另一个具体的实施方案中, 本发明提供了切割目的区域中的细胞染色质的方 法, 包括以下步骤 : (a) 选择目的区域 ; (b) 提供与所述目的区域中的第一核苷酸序列结合 的第一锌指结构域 ; (c) 提供与所述目的区域中的第二核苷酸序列结合的第二锌指结构 域, 其中所述第二序列与所述第一序列之间的距离为 2-50 个核苷酸 ; (d) 在细胞中同时或 相继表达所述第一锌指核酸酶和所述第二锌指核酸酶, 其中所述第一锌指核酸酶包含第一 锌指结构域和第一核苷酸切割结构域, 所述第二锌指核酸酶包含第二锌指结构域和第二核 苷酸切割结构域 ;其中所述第一和第二锌指结构域包含三个或更多个锌指模块, 两个个或更多个所 述锌指模块来源于天然存在的锌指模块, 以及
所述第一锌指结构域与所述第一核苷酸序列结合, 所述第二锌指结构域与所述第 二核苷酸序列结合, 而且其中所述结合定位了核苷酸切割结构域, 使得所述目的区域中的 细胞染色质被切割。
对于利用本发明锌指核酸酶进行靶向切割, 锌指结构域的结合位点可以包括切割 位点, 或者接近结合位点的边缘可以离所述切割位点 1 至 50 个核苷酸。绘制切割位点的方 法是本领域技术人员已知的。
切割 DNA 的位点通常位于两个融合蛋白的结合位点之间。DNA 的双链断裂通常由 两处单链断裂产生, 或者由错移 1、 2、 3、 4、 5、 6 或更多个核苷酸的 “缺口” 产生, 例如, 天然 FokI 切割的双链 DNA 由错移 4 个核苷酸的单链断裂产生。因此, 切割并非必然在每条 DNA 链上的完全相对的位点处发生。此外, 融合蛋白的结构和靶位点间的距离可以影响切割是 临近单核苷酸对发生还是切割在数个位点处发生。
本文所用的 “靶位点” 是锌指结构域所识别的核酸序列。单一的靶位点通常具有 约 6 至约 12 个碱基对。通常, 具有 3 个锌指模块的锌指蛋白识别两个相邻的 6 至 10 个碱 基对的靶位点, 并且具有 4 个锌指模块的锌指蛋白识别两个相邻的 9 至 12 个碱基对的靶位 点。术语 “相邻的靶位点” 表示相隔 0 至约 5 个碱基对的不重叠的靶位点。
如上文所指出的, 融合蛋白可以以多肽和 / 或多核苷酸的形式被导入。例如, 可以 将两条多核苷酸 ( 每条所包含的序列均编码上文提到的多肽中的一种 ) 导入细胞, 在靶序 列或靶序列附近发生切割。 可选地, 将包含编码两段多肽的序列的单一多核苷酸导入细胞。 多核苷酸可以是 DNA、 RNA 或 DNA 和 / 或 RNA 的任何修饰形式或同源物。
按照另一方面, 本发明涉及利用锌指核酸酶来替换细胞染色质中目的区域的第一 核苷酸序列的方法。
在具体的实施方案中, 本发明提供了替换细胞染色质中目的区域的第一核苷酸序 列的方法, 包括以下步骤 : (a) 工程改造出与所述目的区域中的第二核苷酸序列结合的第 一锌指结构域, 其中所述第二序列包含至少 9 个核苷酸 ; (b) 提供与第三核苷酸序列结合的 第二锌指结构域, 其中所述第三序列包含至少 9 个核苷酸, 并且与所述第二序列之间的距 离为 2-50 个核苷酸 ; (c) 在细胞中表达第一锌指核酸酶和第二锌指核酸酶, 其中所述第一 锌指核酸酶包含第一锌指结构域和第二核苷酸切割结构域, 所述第二锌指核酸酶包含第二 锌指结构域和第三核苷酸切割结构域 ; 以及 (d) 将所述细胞暴露于包含第四核苷酸序列的 多核苷酸, 其中所述第四核苷酸序列与所述第一核苷酸序列是同源的但并非一致的 ;
其中所述第一和第二锌指结构域包含三个或更多个锌指模块, 一个个或多个所述 锌指模块来源于天然存在的锌指模块, 以及
所述第一锌指核酸酶与所述第二序列的结合, 和所述第二锌指核酸酶与所述第三 序列结合定位了切割结构域, 使得所述目的区域中的细胞染色质被切割, 进而促进所述第 一核苷酸序列和所述第四核苷酸序列之间的同源重组, 导致所述第一核苷酸序列被所述第 四核苷酸序列替换。
本公开提供了特征为更高的靶向重组效率和更低的非特异的插入事件的靶向序 列改变方法。由于细胞 DNA 中的双链断裂刺激切割位点附近的同源重组提高数千倍, 因此这种靶向切割允许改变或替换 ( 通过同源重组 ) 基因组中几乎任何位点处的序列。
除了融合蛋白 ( 锌指核酸酶 ) 之外, 所选的基因组序列的靶向替换还需要供体序 列。可以在表达融合蛋白之前、 同时或之后将所述供体序列导入细胞中。很明显, 所述供体 序列通常与其所替换的基因组序列不同。例如, 供体多核苷酸序列与基因组序列相比可以 包含一个或多个单碱基改变、 插入、 缺失、 倒位或重排, 但是要存在足够的同源性来支持同 源重组。可选地, 供体序列可以包含由两个同源区侧翼连接的非同源序列。此外, 供体序列 可以包含与细胞染色质的目的区域非同源的序列。
此外, 在本方法中, 所述第一核苷酸序列可以优选基因中包含突变的序列, 在这种 情况下, 供体序列, 尤其是第四序列优选是基因的野生型序列。所述突变可以包括点突变、 取代、 缺失或插入。
此外, 在另一个具体的实施方案中, 本发明提供了利用锌指核酸酶来改变细胞染 色质中目的区域的第一核苷酸序列的方法。
具体地, 本发明提供了改变细胞染色质中目的区域的第一核苷酸序列的方法, 包 括以下步骤 : (a) 工程改造出与所述目的区域中的第二核苷酸序列结合的第一锌指结构 域, 其中所述第二序列包含至少 9 个核苷酸 ; (b) 提供与第三核苷酸序列结合的第二锌指结 构域, 其中所述第三序列包含至少 9 个核苷酸, 并且与所述第二序列之间的距离为 2-50 个 核苷酸 ; (c) 在细胞中表达第一锌指核酸酶和第二锌指核酸酶, 其中所述第一锌指核酸酶 包含第一锌指结构域和第二核苷酸切割结构域, 所述第二锌指核酸酶包含第二锌指结构域 和第三核苷酸切割结构域 ; 其中所述第一和第二锌指结构域包含三个或更多个锌指模块, 一个或多个所述锌指模块来源于天然存在的、 野生型的锌指模块, 以及所述第一锌指核酸 酶与所述第二序列的结合, 和所述第二锌指核酸酶与所述第三序列的结合定位了切割结构 域, 使得所述目的区域中的细胞染色质被切割, 导致所述第一核苷酸序列在切割位点发生 改变。 本发明中, 通常可以将编码一种或多种 ZFP 或 ZFP 融合蛋白的核酸克隆进载体中, 转化进原核或真核细胞中来复制和表达。 载体通常是原核或真核载体, 例如质粒、 穿梭载体 或昆虫载体。还通常将编码 ZFP 的核酸克隆进表达载体中, 用来给予植物细胞、 动物细胞, 优选哺乳动物细胞或人类细胞、 真菌细胞、 细菌细胞或原生动物细胞。
表达载体是用一系列指定的核酸元件重组或合成产生的核酸构建体, 所述核酸元 件允许特定的核酸在宿主细胞中转录, 并且任选地允许表达载体在宿主细胞中整合或复 制。表达载体可以是质粒、 病毒或病毒或非病毒来源的核酸片段的一部分。通常, 表达载体 包含 “表达盒” , 表达盒包含可操作地连接于启动子的待转录的核酸。术语表达载体还包括 可操作地连接于启动子的裸露的 DNA。
为了表达克隆的基因或核酸, 通常将编码 ZFP 或 ZFP 融合蛋白的序列亚克隆进含 有指导转录的启动子的表达载体中。合适的细菌和原核启动子在本领域内是公知的。
术语 “可操作地连接” 是指核酸表达调控序列 ( 例如启动子或转录因子结合位点 的排列 ) 和第二核酸序列之间的功能性连接。
本发明中, “宿主细胞” 表示含有锌指核酸酶、 或表达载体或核酸的细胞, 所述表达 载体或核酸两者任选地编码锌指核酸酶。所述宿主细胞通常支持表达载体的复制或表达。 宿主细胞可以是诸如大肠杆菌的原核细胞或真核生物细胞 ( 例如, 酵母、 真菌、 原生动物、
高等植物和昆虫细胞或两栖动物细胞 ) 或哺乳动物细胞 ( 例如, CHO、 HeLa 293、 COS-1 和 HEK, 例如培养的细胞 ( 体外 ))、 外植体和原始培养物 ( 体外和离体 ) 和体内细胞。
术语 “核酸” 是指脱氧核糖核苷酸或核糖核苷酸和其单链或双链形式的聚合物。 该 术语包括含有已知核苷酸类似物或修饰的主链残基或连接物的核酸, 这些核酸是合成的、 天然存在的和非天然存在的, 具有与参考核酸相似的结合特性。这些类似物的实例包括而 不限于, 硫代磷酸酯、 氨基磷酸酯、 膦酸甲酯、 手性膦酸甲酯、 2-O- 甲基核糖核苷酸、 肽核酸 (PNA)。
本文所用的术语 “多肽” 、 “肽” 和 “蛋白质” 是可交替使用的, 是指氨基酸残基的聚 合物。该术语也适用于其中一个或多个氨基酸残基是相应天然存在的氨基酸的人工化学 模拟物的氨基酸聚合物、 以及适用于天然存在的氨基酸聚合物和非天然存在的氨基酸聚合 物。
术语 “氨基酸” 是指天然存在的和合成的氨基酸, 以及以与天然存在的氨基酸相似 的方式起作用的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸是由遗传密码编码的 那些氨基酸、 以及以后进行修饰的那些氨基酸, 例如羟脯氨酸、 γ- 羧基谷氨酸和 O- 磷酸丝 氨酸。氨基酸类似物是指与天然存在的氨基酸具有相同基本化学结构的化合物, 即 α 碳与 氢、 羧基、 氨基和 R 基结合, 例如高丝氨酸、 正亮氨酸、 蛋氨酸亚砜、 蛋氨酸甲基锍。这种类似 物具有修饰的 R 基 ( 例如正亮氨酸 ) 或修饰的肽主链, 但是保留了与天然存在的氨基酸相 同的基本化学结构。氨基酸模拟物是指结构不同于氨基酸一般化学结构, 但是以与天然存 在的氨基酸相似的方式起作用的化合物。可以通过公知的三字母符号或通过 IUPAC-IUB 生 化命名委员会 (Biochemical Nomenclature Commission) 所推荐的单字母符号来表示本文 的氨基酸, 同样可以通过通常所接受的单字母密码来表示核苷酸。 下文将结合实施例对本发明进行详细的描述。然而, 这些实施例仅为示例性的目 的, 并且本发明不受这些实施例所限。
本发明的实施方式
实施例 1 : ZFN 设计和含 ZFN 的质粒的构建
按 “Human zinc fingers as building blocks in the construction of artificial transcription factor( 人类锌指作为构建人工转录因子的构件 ).” (Bae, K.H.et al.Nat Biotechnol 21, 275-280(2003)) 中所描述来组装编码 3- 指或 4- 指阵列的 DNA 片段。在 3- 指或 4- 指阵列中, 选择了具有不同 DNA 结合特异性的 54 种锌指模块 ( 下 文称为 ZF 模块 )。图 1 和 2 中显示了所选的 ZF 模块及其氨基酸序列。在这 54 种 ZF 模块 中, 31 种来源于人类基因组的 DNA 序列, 2 种来源于果蝇基因组的 DNA 序列 ( 图 1)。为了 方便, 将来自人类和果蝇基因组 DNA 序列的 ZF 模块称为 ToolGen 模块。其余的 21 种 ZF 模 块或者选自利用噬菌体展示的 ZF 变体库 (Barbas 模块 ) 或者由定点诱变产生 (Sangamo 模 块 )。
然后, 为了设计多指 ZFN, 我们利用在 ToolGen 开发出的计算机算法来鉴定人类趋 化因子 (C-C 基序 ) 受体 5(CCR5) 编码区的 DNA 序列中的潜在 ZFN 靶位点。基于该结果, 本 发明人通过 54 种 ZF 模块的组合合成了 208 种 ZFN 单体, 并且图 2 中显示了代表性 ZFN 对 的氨基酸序列。这 315 种 ZFN 对一共意图靶向于 CCR5 基因中的 33 个位点 ( 参见图 3)。
将 由 3 或 4 个 ZF 模 块 组 成 的 锌 指 结 构 域 整 合 进 来 源 于 海 床 黄 杆 菌
(flavobacterium okeanokoites) 基因组 DNA 的 FokI 内切核酸酶结构域, 并将整合的序列 克隆进 p3 中, p3 是 pcDNA3.0 质粒 (Invitrogen) 的改良版。
实施例 2 : 体外和体内测定 ZFN 活性
2-1. 体外消化测定
首先, 利用体外转录和翻译 (IVTT) 系统制备 ZFN, 并与包含 CCR5 编码序列的 DNA 片段一起孵育, 以评价其体外 DNA 限制性活性。具体而言, 利用 TnT 快速偶联的转录 / 翻译 系统 (Promega) 按照生产商的描述 ( 体外转录和翻译 ; IVTT) 使实施例 1 中设计的 ZFN 在 体外被转录和翻译。简而言之, 将编码 ZFN 的质粒 ( 每种 0.5μl) 加至 TnT Quick master mix(20μl) 和 1mM 蛋氨酸 (0.5μl) 中, 并于 30℃孵育 90 分钟。首先用限制性酶消化含有 CCR5 编码序列的靶质粒, 使之为线性。然后与一对 ZFN IVTT 裂解物 ( 每种 1μl) 在 37℃ 在 NEBuffer 4(New England Biolabs) 中孵育 2 小时来消化该靶质粒 (1μg)。通过加热 (65℃ ) 使反应混合物失活, 然后于 13,000rpm 离心。上清用于琼脂糖凝胶分析。图 4 是该 测定的示意图, 结果显示在图 5 中。
如图 5 所示, 多种 ZFN 对 (44% ) 表现出对靶 DNA 有效的位点特异性切割。
2-2 : 单链退火系统
然后本发明人利用基于哺乳动物细胞的单链退火 (SSA) 系统来检验这些 ZFN 是否 能在人体细胞中诱导同源重组。
2-2-1. 基于细胞的测定中所用的报告质粒
利用以下表 1 中的引物 1 和 2 从 pGL3-control(Promega) 扩增出萤火虫荧光素酶 基因的 3’ 部分, 并将该扩增产物克隆进 pcDNA5/FRT/TO(Invitrogen) 的 BamHI 和 XhoI 位 点。接下来将用以下表 1 中的引物 3 和 4 扩增出的荧光素酶基因的 5’ 部分克隆进上述得 到的质粒的 HindIII 和 BamHI 位点。利用以下表 1 中的引物 5 和 6 将 I-SceI 结合位点克 隆进该报告质粒的 BamHI 位点。将利用引物 7 和 8 扩增出的 CCR5 编码序列克隆进该报告 质粒的 BamHI 位点。
表1
2-2-2. 细胞培养和报告细胞系的建立
用含实施例 1 中的 ZFN 编码序列的质粒转化 HEK293T/17(ATCC, CRL-11268TM) 细胞 和 Flp-InTM T-RExTM 293 细胞 (Invitrogen), 将该转化的细胞在补有 100 单位 /ml 青霉素、 100μg/ml 链霉素、 0.1mM 非必需氨基酸和 10%胎牛血清 (FBS) 的达尔伯克氏改良伊格尔培 养基 (DMEM) 中维持。按照生厂商的说明书将编码断裂的荧光素酶基因的报告质粒稳定整 合进 Flp-InTM T-RExTM 293 细胞中。 简单而言, 用所述报告质粒和 pOG44(Flp 重组酶表达载 体 ) 共转染该细胞, 并用潮霉素 B 进行选择。鉴定携带断裂的荧光素酶基因的克隆细胞系, 用于 SSA 测定。
2-2-3. 利用 SSA 系统进行基于细胞的测定
用 Lipofectamine 2000(Invitrogen) 将每对 ZFN 表达质粒 ( 每种 100ng) 转染进 30,000 报告细胞 / 孔的 96 孔板中。48 小时后, 通过与强力霉素 (1μg/ml) 一起孵育来诱 导荧光素酶基因。孵育 24 小时后, 将细胞在 20μl 的 1× 裂解缓冲液 (Promega) 中裂解, 并用 10μl 荧光素酶测定剂 (Promega) 加 2μl 细胞裂解物来测定荧光素酶活性。
2-2-4. 结果
用表达 ZFN 的质粒转染人胚肾细胞 (HEK 细胞 ), 该细胞的基因组含有稳定整合的、 通过插入 CCR5 序列而被中断的部分复制的萤火虫荧光素酶基因。有效的 ZFN 能在 CCR5 序 列中产生双链断裂 (DSB), 这应该允许经由 SSA 恢复功能性荧光素酶基因。可以通过检测 荧光素酶酶活性来估计 ZFN 的 DNA 切割效率。高效的大范围核酸酶 I-SceI 用作阳性对照。 实验步骤的示意图如图 6 所示, 结果显示在图 7 中。
如图 7 所示, 本测定中, 多对 ZFN 产生了显著的荧光素酶活性。 在 315 对 ZFN 当中, 与阳性对照 I-SceI 相比, 23 对表现出 15% -57%的荧光素酶活性。表现出小于 15%的活 性的 ZFN 对仍可能在细胞中诱导双链断裂, 但是本发明人集中于高活性的 23 对, 用于进一 步的研究。当这 23 对 ZFN 二聚体使用无靶标的报告细胞时, 它们没有产生显著的荧光素酶
活性, 所述无靶标的报告细胞的基因组所包含的部分复制的荧光素酶基因由与 CCR5 无关 的 DNA 序列中断 ( 数据未显示 )。这些结果提示 ZFN 介导的 DNA 修复是 CCR5 特异的。
实施例 3 : 在 ZFN 处理的 HEK293 细胞中检测突变
发明人研究了既在 IVTT 测定中表现出内切核酸酶活性又在基于细胞的测定中诱 导萤光素酶活性的 ZFN 是否能修饰细胞中的内源靶序列。由 ZFN 诱导的双链断裂可以通过 易出错的非同源性末端连接 (NHEJ) 来修复。产生的 DNA 通常在 DSB 位点附近含有小的插 入或缺失 ( 插入 / 缺失突变 )。可以通过用错配敏感的 T7 内切核酸酶 I(T7E1) 处理扩增的 DNA 片段来体外检测这些插入 / 缺失突变 ( 参见图 8)。
具体而言, 利用 Lipofectamine 2000(Invitrogen) 用两种编码 ZFN 对的质粒 ( 每 种 100ng) 转染于 96 孔板中预培养的 HEK293T/17 细胞。孵育 72 小时后, 利用 G-spinTM 基 因组 DNA 提取试剂盒 (iNtRON BIOTECHNOLOGY) 按照生厂商的描述从 ZFN 转染的细胞提取 基因组 DNA。扩增包含所述 ZFN 靶位点的基因组区, 解链并退火形成异源双螺旋 DNA。引物 9 和 12 用于 Z30 位点、 引物 10 和 12 用于 Z266 和 Z360 位点、 引物 11 和 12 用于 Z410、 Z426 和 Z430 位点、 并且引物 13 和 14 用于 Z836 和 Z891 位点 ( 参见表 1)。用 5 单位 T7 内切核 酸酶 1(New England BioLabs) 对退火的 DNA 于 37℃处理 15 分钟, 然后通过加入 2.5 倍体 积的乙醇来沉淀。通过琼脂糖凝胶电泳分析沉淀的 DNA。结果显示在图 9 中。
如图 9 所示, 从 ZFN 处理的细胞扩增出的 DNA 的小部分被 T7E1 切割。每对 ZFN 产 生不同的切割模式, 反映出这些 ZFN 靶向于 8 个不同的位点的事实。此外, 得到的 DNA 条带 的大小同预期一样。在 T7E1 测定中测试的 23 对 ZFN 中, 21 对表现出可检测到具有预期大 小的 DNA 条带 ( 数据未显示 )。
本发明人还利用 T7E1 测定来检测这种代表性的 ZFN 对 : 或者在 IVTT 测定中未表 现出显著的内切核酸酶活性或者在基于细胞的 SSA 系统中未引起显著的萤光素酶活性但 是通过 IVTT 检验的 ZFN 对。T7E1 测定结果显示, 这些 ZFN 对中没有一个能诱导出可检测水 平的 DNA 突变。
实施例 4 : 对 ZFN 诱导的突变进行 DNA 序列分析
本发明人选择用于进一步研究的 8 对有代表性的 ZFN 对, 每一对均靶向于 CCR5 基 因的不同位点 ( 参见表 2)。他们首先检验这 8 种单独的 ZFN 中的任一种是否能以同二聚体 的形式发挥作用。利用 T7E1 测定来分析单独的每种 ZFN 单体的基因靶向活性。同预期一 样, 没有一种 ZFN 单体能产生可检测的 DNA 切割 ( 数据未显示 )。
表2
然后本发明人测定靶区的 DNA 序列, 以证实 ZFN 诱导的突变并估计诱变率。对 从 8 对 ZFN 中的每一对所转染的细胞扩增出的 DNA 进行克隆并测序。在 DSB 位点附近 观察到多种缺失和插入 ( 参见图 10-14)。这些诱变模式是易错 NHEJ 相关诱变的标志, 并且其它文献中已报道了相似的模式 (Bibikova, M., Golic, M., Golic, K.G.& Carroll, D.Targeted chromosomal cleavage and mutagenesis in Drosophila using zinc-finger nucleases( 利用锌指核酸酶在果蝇中进行定向染色体切割和定向诱变 )Genetics 161, 1169-1175(2002) ; Morton, J., Davis, M.W., Jorgensen, E.M.& Carroll, D.Induction and repair of zinc-finger nuclease-targeted double-strand breaks in Caenorhabditis elegans somatic cells( 对秀丽隐杆线虫 (Caenorhabditis elegans) 体细胞中锌指核酸 酶引起的双链断裂的诱导和修复 ).Proc Natl Acad Sci U S A 103, 16370-16375(2006) ; Santiago, Y.et al.Targeted gene knockout in mammalian cells by using engineered zinc-finger nucleases( 利用工程锌指核酸酶在哺乳动物细胞中定向敲除基因 ).Proc Natl Acad Sci U S A 105, 5809-5814(2008))。除了小的 indel 突变和取代之外, 本发明 人还观察到两对 ZFN( 参见图 11 中的 Z30 和图 12 中的 Z360) 引起的相对大的插入 ( 每对 插入不同的 81 个核苷酸 )。DNA 序列分析揭示, 插入的序列来自编码 ZFN 的质粒。
靶向于不同位点的 8 对 ZFN 显示出 2.4% -17%的诱变率 ( 参见图 15), 这是通过 突变克隆数除以被分析的总克隆数计算得出的。这些高效的 ZFN 诱导的突变作用提示, 仅 筛选 10-100 个来源于单细胞的集落就可以分离出克隆的突变细胞。
实施例 5 : ZFN 处理后克隆细胞的分离
5-1. 本发明 ZFN 的脱靶效应
据了解, 当在哺乳动物细胞中表达时, 某些 ZFN 具有脱靶效应, 并且是细胞毒性 的 (Szczepek, M.et al.Structure-based redesign of the dimerization interface reduces the toxicity of zinc-finger nucleases( 对 二 聚 界 面 基 于 结 构 的 重 新 设 计 降 低 了 锌 指 核 酸 酶 的 毒 性 ).Nat Biotechnol 25, 786-793(2007) ; Miller, J.C.et al.An improved zinc-finger nuclease architecture for highly specific genome editing( 改 善 锌 指 核 酸 酶 结 构 用 于 高 特 异 性 的 基 因 组 编 辑 ).Nat Biotechnol 25, 778-785(2007))。本发明人观察到本发明 ZFN 转染的 HEK293 细胞生长没有显著迟缓。然 而, 当他们最初筛选有限数量的单细胞集落时, 他们无法分离基因组序列被 ZFN 处理所修 饰的克隆的突变细胞, 这表明携带 ZFN 诱导突变的哺乳动物细胞随着生长而减少。
因此, 为了研究携带 ZFN 诱导突变的哺乳动物细胞是否随着生长而减少, 并因此 被非修饰的细胞所超越, 本发明人用从 ZFN 转染后第 3、 6 和 9 天时的细胞所分离的 DNA 进 行 T7E1 测定。对于本次分析他们选择了 Z891 对, 并且如图 16 所示, 与第 3 天相比, 在第 6 天时切割的 DNA 片段明显减少, 并且在 ZFN 处理后第 9 天时, 几乎检测不到切割的 DNA 片段。 这些结果提示 ZFN 介导的诱变作用确实对细胞生长具有细胞毒效应。
5-2. 本发明异二聚 ZFN 的脱靶效应
ZFN 的脱靶效应主要由形成同二聚或异二聚的 ZFN 单体的活性引起。通过利用能 形成异二聚体但不能形成同二聚体的 FokI 核酸酶变体可以显著降低这些效应。因此, 为了 降低 ZFN 的细胞毒效应, 本发明人在 T7E1 测定中制备并检验了两种不同类型的所谓的强制 型异二聚体 ( 表示为图 16 中的 “RR/DD” 二聚体和 “KK/EL” 二聚体 )。T7E1 测定表明, 当细 胞用 RR/DD ZFN 对转染时, 甚至在 ZFN 处理后第 9 天时仍存在切割的 DNA 片段。 为了证实该 强制型异二聚 ZFN 的细胞毒性的降低是由其在细胞中 DNA 切割的特异性增强引起, 本发明 人利用抗 53BP1( 被吸引至 DSB 的蛋白质 ) 的抗体分析 ZFN 处理细胞中的 DSB 的数量。 具体 而言, 用 HEK293T/17 细胞进行 53BP1 的核内染色。用带盖的 Lab-Tek 腔室玻片 (NUNC) 附 着细胞, 并用 3.7%的甲醛来固定该细胞来制备玻片。然后通过用 0.2% Triton X-100 的 磷酸盐缓冲盐水 (PBS) 的处理使该细胞于室温 (RT) 渗透 10 分钟。然后将细胞与抗 53BP1 的兔多克隆抗体 (Bethyl Laboratories) 孵育, 存在 5%牛血清白蛋白 (BSA) 以封闭非特 异性着色, 接下来与 Alexa Fluor 488 偶联的二抗 (Invitrogen-Molecular Probes) 孵育。 将玻片置于 DAPI(Sigma) 中来复染细胞核, 并在免疫荧光显微镜 (Carl Zeiss-LSM510) 下 检查。结果显示在图 17 和 18 中。如图 17 和 18 所示, 当与用对应的野生型 ZFN 对处理的 细胞相比, 用 RR/DD ZFN 对处理的细胞中 53BP1 位点的数量显著减少。
5-3. 在用 ZFN 处理的基因组中检测突变
接下来, 在筛查分别在 96 孔板上生长的 225 个单细胞集落之后, 随即分离出了利 用 Z891 RR/DD ZFN 对的 7 种不同的突变的克隆 HEK293 细胞。本发明人检验这些克隆细胞 中 CCR5 区的 DNA 序列, 以确认 ZFN 诱导的基因组修饰。对修饰细胞基因组的 DNA 序列的分 析表明, 7 个克隆中有 6 个表现为单等位基因的缺失或插入, 以及 1 个表现为 CCR5 基因的双 等位基因修饰 ( 参见图 19)。由于有一部分三体细胞, 因此 HEK293 细胞在其基因组中携带 三个 CCR5 基因拷贝。在表现为双等位基因修饰的克隆中, 观察到一段未修饰的、 野生型序列 ( 参见图 19)。 这种由 ZFN 处理引起的双等位基因修饰提示, 仅在一个不用选择标记的步 骤中, 就可以分离纯合的敲除细胞。
实施例 6 : 靶向于 CCR5 的 ZFN 在同源的 CCR2 位点处的脱靶效应
CCR2 基因与 CCR5 基因是高度同源的, 并且多个 CCR5 ZFN 识别元件在 CCR2 基因 座中是保守的。因此, 本发明人研究为 CCR5 位点所设计的 8 对 ZFN 是否也能修饰 CCR2 基 因座处的同源或一致的序列。在 CCR2 基因中具有相同识别元件的三对 ZFN(Z360、 Z410 和 Z430) 能在 T7E1 测定中诱导有效的基因组修饰 ( 参见图 20)。在 CCR2 基因中, Z891 对的识 别元件由与 CCR5 基因的对应位点完美匹配的 12-bp 半位点和携带一个碱基的错配的 12-bp 的半位点组成。同预期一样, 该 Z891 对也在 CCR2 位点处表现出显著的基因靶向活性。本 发明人还检验了 Sangamo 的靶向于 CCR5 的 ZFN 对, 其在 CCR2 基因座中的识别元件在每个 12-bp 半位点中含有一个碱基的错配, 并且证实该 ZFN 在同源的 CCR2 位点处表现出脱靶基 因组修饰 ( 参见图 20)。相反, 对于 ZFN 对 (Z30、 Z266 和 Z836) 没有观察到可检测的 ZFN 活 性, 这些 ZFN 对在 CCR2 基因座的识别元件显示出至少两个错配。
本发明人还检验了通过 Z891 对转染的 HEK293 细胞所获得的 7 种突变的克隆细胞 除了在预期的 CCR5 位点诱导突变之外, 在高度同源的 CCR2 位点的 DNA 序列中是否诱导突 变。结果显示在图 21 中。尽管如图 20 所描述, Z891 对在 T7E1 测定中在 CCR2 位点以及在 CCR5 位点均表现出显著的基因靶向活性, 但是这些克隆细胞系的 CCR2 基因座没有被突变。 这些结果表明, 可能分离出克隆细胞, 其中 ZFN 处理之后通过筛查细胞仅在预期的靶位点, 而不在同源的位点被突变。 实施例 7 : 模块交换分析
本发明人随后研究了为什么我们经由模块组装来制备 ZFN 的方法能导致高成功 率的基因组编辑。具体而言, 他们进行了模块交换实验, 其中用从 Barbas 或 Sangamo 模块 产生的表现出相同 DNA- 结合特异性的那些 ZFN 替代本发明的 ZFN。
为此, 本发明人制备了 8 种新的仅由 Barbas 或 Sangamo 模块组成的 ZFN 单体, 并 用它们来替代 6 种不同的仅由 ToolGen 模块组成的 ZFN 单体 ( 参见表 3 和图 22)。将这些 新的 ZFN 单体中的每一种与合适的伴侣 ZFN 单体配对, 并在 SSA 和 T7E1 测定中检验得到的 ZFN 对。如图 23 和 24 所示, 由至少一种这些新合成的 ZFN 单体所组成的 ZFN 对中, 没有一 种在 SSA 系统中表现出任何显著的活性 ( 参见图 23)。此外, 这些 ZFN 中没有一种在 T7E1 测定中表现出任何基因靶向活性 ( 参见图 24)。
表3
这些结果强有力地支持这种观点 : 对于功能性 ZF 阵列的模块式组装, 天然存在的 ZF 比工程 ZF 能构成更可靠的框架。
实施例 8 : 对本发明 ZF 模块的评价
对本发明人产生的 315 对 ZFN 的统计学分析可以为新 ZFN 的设计提供基础, 该新 ZFN 可用来定向诱变其它感兴趣的内源基因。为此, 本发明人计算出在 SSA 系统中为阳性 评分的 23 对 ZFN 中每种 ZF 的出现次数。然后他们用该次数除以所有 208 种 ZFN 单体中 该模块出现的次数来确定每种 ZF 的 “活性评分” ( 参见图 1 和 2)。某些高活性的 ZF, 例如 “QNTQ” 和 “RSHR” 分别具有 50%和 38%的活性评分 ; 这些高活性评分提示, 就预测体内位 点特异的核酸酶活性而言, 这些模块是可靠的。 其它 ZF, 例如在本测定中表现为无效模块的 “QSNK” 和 “rdae” , 显示的活性评分为 0。这两种 ZF 都用了 15 次, 但是含有这些模块的 ZFN 中, 没有一种在我们的测定中是有活性的。本发明人还比较了具有相同 DNA 识别特异性的 ZF 的活性评分。某些 ZF 明显比其它相同靶标的模块好, 例如, “DSNR” 和 “HSNK” 识别相同 的 GAC 序列。在构建 ZFN 中用 “DSNR” 产生了多种活性核酸酶 ( 活性评分= 35% ), 而并入 “HSNK” 只产生了非活性的 ZFN( 活性评分= 0% )。
基于统计学分析, 本发明人暂时推荐了 37 种 ZF(24 种 ToolGen 模块、 1 种 Sangamo
模块和 12 种 Barbas 模块 ), 用于将来的基因编辑研究中 ( 参见图 1 和 2)。如果本发明 人在实验中仅使用这 37 种模块, 总成功率应该是 53%, 这显著优于现在的成功率 (24% ) ( 参见图 26)。这 37 种模块均在活性 ZFN 中出现至少一次。当有两个或更多个相同靶标 的 ZF 时, 他们选择具有较高活性评分的那些 ZF。37 种 ZF 共识别 64 个 3-bp 亚位点中的 38 个。对于给定的 1-kbp 的随机 DNA 序列, 他们预测, 对于 3 指 ZFN 二聚体有 88 个 [ = 6 (38/64) ×1000×2] 潜在靶位点 ( 在半位点之间包含 5 或 6 个碱基的间隔 ), 并且对于 4 指 ZFN 二聚体有 31 个位点。假设本发明有 9.1%至 26%的成功率 ( 如果我们使用 37 种 ZF 而 不是其它的无效模块, 则实际成功率将显著提高 ), ZFN 介导的基因组编辑在 1-kbp 的靶序 列中平均可能有 8 个位点。这提示, 利用本发明的 ZFN 组装方法, 应该 “可靶向” 即使不是 全部也是大多数的真核生物基因。
工业实用性
在许多基因治疗应用中, 这些锌指核酸酶都可以用来敲除 CCR5 基因, 以在 AIDS 患 者中产生抗 HIV 感染的 T 细胞。24102333864 A CN 102333879
序列表1/32 页
25102333864 A CN 102333879序列表2/32 页
26102333864 A CN 102333879序列表3/32 页
27102333864 A CN 102333879序列表4/32 页
28102333864 A CN 102333879序列表5/32 页
29102333864 A CN 102333879序列表6/32 页
30102333864 A CN 102333879序列表7/32 页
31102333864 A CN 102333879序列表8/32 页
32102333864 A CN 102333879序列表9/32 页
33102333864 A CN 102333879序列表10/32 页
34102333864 A CN 102333879序列表11/32 页
35102333864 A CN 102333879序列表12/32 页
36102333864 A CN 102333879序列表13/32 页
37102333864 A CN 102333879序列表14/32 页
38102333864 A CN 102333879序列表15/32 页
39102333864 A CN 102333879序列表16/32 页
40102333864 A CN 102333879序列表17/32 页
41102333864 A CN 102333879序列表18/32 页
42102333864 A CN 102333879序列表19/32 页
43102333864 A CN 102333879序列表20/32 页
44102333864 A CN 102333879序列表21/32 页
45102333864 A CN 102333879序列表22/32 页
46102333864 A CN 102333879序列表23/32 页
47102333864 A CN 102333879序列表24/32 页
48102333864 A CN 102333879序列表25/32 页
49102333864 A CN 102333879序列表26/32 页
50102333864 A CN 102333879序列表27/32 页
51102333864 A CN 102333879序列表28/32 页
52102333864 A CN 102333879序列表29/32 页
图 15 显示若干 ZFN 靶位点处的突变类型 ; 对每对 ZFN 的缺失、 插入和混合突变的 数量进行计数, 并绘制出这些事件的百分比。
图 16 是野生型和强制型异二聚 ZFN 的时间进程分析结果 ; 在不同的时间点对从 细胞分离的 DNA 进行 T7E1 错配检测测定, 所述细胞用不同形式的 FokI 核酸酶结构域处理。 (WT, 野生型核酸酶结构域 ; RR/DD 或 KK/EL, 强制型异二聚核酸酶结构域 )
图 17 是 53BP1 染 色 的 结 果 ; 将 野 生 型 和 强 制 型 异 二 聚 Z891 ZFN 对 转 染 进 HEK293T/17 细胞, 并在转染后第 2 天时, 通过免疫荧光检测细胞内 53BP1 的位置。 依托泊苷 (1μM) 用作阳性对照。
图 18 是图 16 结果的图表。绘制出 53BP1 位置的数量分布。对于每个处理, 两次 独立的测定中分析至少 100 个细胞。
图 19 显示突变克隆的 DNA 序列 ; 通过有限稀释从 RR/DD ZFN 二聚体处理的细胞分 离了 7 个突变克隆。显示了这些克隆细胞中靶位点的 DNA 序列。用破折号指示缺失, 用小 写字母表示插入的碱基。克隆 1a 和 1b 指示由单克隆中的双等位基因修饰所产生的 DNA 序 列。
图 20 显示在 CCR2 位点进行的 T7E1 测定 ; 分析通过 PCR 从 ZFN 对处理的细胞扩 增的与 CCR2 编码区对应的 DNA( 在凝胶图的上端显示 )。用 “+” 标记在 CCR2 位点产生修 饰的 ZFN 对。p3 是用作阴性对照的空质粒。本测定中包括 Sangamo 的靶向 CCR5 的 ZFN 对 (Sangamo CCR5)。
图 21 显示 ZFN 在 CCR2 基因座的脱靶效应, 以及 CCR5 和 CCR2 基因座的 ZFN 识别 元件。指出的 ZFN 对位于 DNA 序列的左侧。用括号标出 CCR5 和 CCR2 基因座之间的匹配碱 基的数量, 用小写的黑体字母指示错配的碱基。半位点 ZFN 识别元件用下划线标示出。
图 22 显示用于模块交换实验的锌指。
图 23 是模块交换分析中利用基于细胞的 SSA 系统来检验这些新的 ZFN 是否能功 能性地替代本发明的识别相同序列的 ZFN 的结果 ; 名称由 “B” 开头的诸如 “BR4” 的 ZFN 单 体仅由 Barbas 模块组成, 以及由 “S” 开头的诸如 “SR4” 的那些 ZFN 单体仅由 Sangamo 模块 组成。细胞的萤光素酶活性指示多种 ZFN 的表达。p3 是用作阴性对照的空质粒。靶序列含 有用作阳性对照的 I-SceI 的识别位点。将每对 ZFN 的活性表示为相对于 I-SceI 对照的百 分比。指出了 ZFN 对及其组成单体。显示至少 3 次独立实验的平均值和标准差 ( 误差棒 )。
图 24 显示模块交换分析中利用 T7E1 测定的 ZFN 介导的基因组修饰来检验这些新 的 ZFN 是否能功能性地替代本发明的识别相同序列的 ZFN ; 在琼脂糖凝胶的上端显示 ZFN 对及其组成单体。用 “+” 标记产生阳性基因靶向事件的 ZFN 对。
图 25 概括 ZFN 分析 ; 显示出在每次测定中产生阳性结果的 ZFN 对或靶位点的数 量。
图 26 显示不同类型的 ZFN 的成功率 ; 将成功的 ZFN 对或靶位点定义为在 T7E1 错 配检测测定中产生阳性结果的那些。
实施本发明的最佳方式按照一方面, 本发明涉及包含锌指结构域和核苷酸切割结构域的融合蛋白——锌 指核酸酶 (ZFN), 其中所述锌指结构域包含三个或更多个锌指模块, 两个或更多个所述锌指 模块来源于天然存在的、 野生型的锌指模块, 并且所述融合蛋白识别并切割包含染色质特 定区域的核苷酸序列。
本发明的锌指结构域是指通过一个或多个锌指模块以序列特异的方式与核苷酸 结合的蛋白质。所述锌指结构域包含至少三个锌指模块。通常将所述锌指结构域缩写为锌 指蛋白或 ZFP。
本发明的锌指模块是结合结构域中的氨基酸序列区, 通过配位锌离子来稳定该结 合结构域的结构。 本发明的锌指模块的序列与天然存在的、 野生型的锌指模块的序列一致, 或者与通过其它氨基酸对野生型序列中的任何氨基酸的取代而修饰的序列一致。 所述野生 型的锌指模块可以来源于任何真核细胞, 例如真菌细胞 ( 例如酵母 )、 植物或动物细胞 ( 例 如诸如人或小鼠的哺乳动物细胞 )。 优选地, 本发明的锌指模块包含图 1 所代表的来源于人 或类似物的氨基酸序列。
锌指核酸酶的锌指结构域由 3 个或更多个串联排列的锌指模块组成, 每个锌指模 块识别 3bp( 碱基对 ) 的亚位点。由于每个模块独立地识别 DNA 序列, 因此由 3 或 4 个模块 组成的锌指结构域能结合 9-bp 或 12-bp 的序列。锌指核酸酶以二聚体的形式发挥功能, 因 此, 一对由 3 或 4 个模块组成的锌指核酸酶能特异地识别 18-bp 至 24-bp 的序列。在具体 的实例中, 本发明的锌指核酸酶的锌指结构域由 3 或 4 个模块, 优选由 4 个锌指模块组成。 此外, 在一个优选的实施方案中, 本发明的锌指核酸酶所包含的锌指结构域优选包含锌指 模块。 在具体的实例中, 含有 4 个锌指模块的锌指核酸酶成功地靶向 26%的可能切割位点, 而含有 3 个锌指模块的锌指核酸酶仅靶向 9.1%的可能位点。 可以将锌指结构域工程改造为与预定的核苷酸序列结合。 工程改造锌指结构域的 方法的非限制性实例是设计和选择。设计的锌指蛋白是非天然存在的蛋白质, 其设计 / 组 成主要来自合理的标准。设计的合理标准包括应用取代原则和计算机算法对存储现存的 ZFP 设计和结合数据信息的数据库中的信息进行处理 ( 参见韩国专利第 0766952 号 )。选 择的锌指蛋白是并非在自然中所发现的蛋白质, 其产生主要来自诸如噬菌体展示、 相互捕 获或杂交选择的实验过程。
组成加工的锌指结构域中的至少 2 个或更多个锌指模块优选是野生型锌指模块, 更优选 3 个或更多个是野生型锌指模块。在一个具体的实例中, 本发明人进行了模块交换 分析, 其中用噬菌体展示或点突变进行工程改造和分离的锌指核酸酶来替代本发明的锌指 核酸酶。发现本发明的锌指核酸酶在 SSA 系统和 T7E1 测定中表现出显著的活性。因此, 优 选地, 本发明锌指核酸酶由天然存在的、 野生型的锌指模块组成。更优选地, 本发明的锌指 核酸酶由表 2 所示的锌指结构域组成。此外, 本发明的锌指核酸酶并非靶向 GNN- 重复序 列, 这与已知的工程锌指核酸酶不同。在具体的实例中, 在对 CCR5 序列进行成功修饰的 16 个锌指核酸酶中, 只有 2 个 (Z426F3 和 Z360R4) 识别 GNN- 重复位点, 而有 2 个 (Z430R3 和 Z30F4) 识别无 GNN 基序的半位点元件, 12 个识别由 GNN 和非 GNN 基序组成的位点, 如以下 的表 2 所示。靶向除 GNN- 重复序列以外的位点的能力极大地扩展了 ZFN 技术的实用性。
本文所用的术语 “切割” 是指破坏 DNA 分子的共价主链, 术语 “切割结构域” 是指 具有催化 DNA 切割活性的多肽序列。
所述切割结构域可以获自任何内切核酸酶或外切核酸酶。 可以产生切割结构域的 示例性的内切核酸酶包括但不限于, 限制性内切核酸酶和归巢内切核酸酶。这些酶可以作 为切割结构域的来源。 此外, 单链切割和双链切割均是可能的, 其中双链切割的发生可以取 决于切割结构域的来源。 在这方面, 具有双链切割活性的切割结构域可用作切割半结构域。 本文的切割结构域可以与单链切割和双链切割交替使用。
切割结构域可以来源于任何核酸酶或其一部分。通常, 如果融合蛋白包含具有双 链切割活性的切割半结构域, 则切割需要两个融合蛋白。两个切割半结构域可以来源于相 同的内切核酸酶 ( 或其功能性片段 ), 或者每个切割半结构域可以来源于不同的内切核酸 酶 ( 或其功能性片段 )。此外, 两个融合蛋白与其各自靶位点的结合使所述切割半结构域 以彼此相对的空间方向定位, 这允许所述切割半结构域例如通过二聚形成功能性切割结构 域。因此, 两个靶位点之间可以有任何整数的核苷酸或核苷酸对 ( 例如 2 至 50 个核苷酸对 或更多 )。
通常, 如果使用的两个融合蛋白中的每个都包含切割半结构域, 则每个融合蛋白 的锌指部分的主要接触链将在不同的 DNA 链上, 并且在相反的方向中。即对于一对 ZFP/ 切 割半结构域融合体而言, 靶序列位于相反的链上, 并且两种蛋白质以相反的方向结合。 限制性内切核酸酶存在于多种物种中, 并能序列特异地与 DNA( 在识别位点处 ) 结 合, 并在结合位点或者邻近结合位点处切割 DNA。某些限制性酶 ( 例如 IIS 型 ) 在远离识别 位点的位点处切割 DNA, 并具有可分的结合和切割结构域。例如, IIS 型酶 FokI 在离其一条 链上的识别位点 9 个核苷酸和离另一链上的识别位点 13 个核苷酸处催化 DNA 的双链切割。 因此, 在一个实施方案中, 融合蛋白包含来自至少一种 IIS 型限制性酶的切割结构域 ( 或切 割半结构域 ) 和一个或多个锌指结合结构域。
IIS 型限制性酶的实例包括包括 FokI、 AarI、 AceIII、 AciI、 AloI、 BaeI、 Bbr7I、 CdiI、 CjePI、 EciI、 Esp3I、 FinI、 MboI、 sapI、 和 SspD51, 但并不限于这些, 更具体的参见 Roberts et al.(2003)Nucleic Acid Res.31 : 418-420。 在具体的实施方案中, 将从 IIS 型 限制性酶 FokI 分离 DNA 结合结构域所获得的 FokI 切割结构域用作切割结构域 ( 或半切割 结构域 )。
本发明的融合蛋白是指两个或更多个不同的多肽通过肽键连接形成的多肽。 所述 多肽包含锌指结构域和能切割核苷酸序列中的任何靶位点的核苷酸切割结构域。 本文中的 融合蛋白与锌指核酸酶或 ZFN 交替使用。
设计和构建融合蛋白 ( 或者编码融合蛋白的多核苷酸 ) 的方法在本领域是公知 的。 在一个具体的实施方案中, 构建的是编码融合蛋白的多核苷酸, 所述融合蛋白包含锌指 结构域和切割结构域。可以将所述多核苷酸插入载体中, 并可将所述载体导入细胞。通常, 融合蛋白 ( 例如 ZFP-FokI 融合体 ) 成分的排列使得锌指结构域距所述融合蛋白的氨基末 端 (N- 末端 ) 最近, 切割半结构域距羧基末端 (C- 末端 ) 最近。这反映了诸如来源于 FokI 酶的天然存在的二聚化切割结构域中的切割结构域的相对方向, 其中 DNA 结合结构域距氨 基末端最近, 切割半结构域距羧基末端最近。
本文所用的术语 “序列” 是指任何长度的核苷酸序列, 可以为 DNA 或 RNA ; 可以为线 状、 环状或分枝的并且可以为单链或双链。
本文所用的术语 “结合” 是指巨分子之间 ( 例如蛋白质和核酸之间 ) 序列特异的
或非共价的相互作用。只要相互作用作为整体是序列特异性的, 而不需要结合相互作用的 所有成分均是序列特异性的 ( 例如与 DNA 主链中的磷酸残基接触 )。这种相互作用的特征 通常为解离常数 (Kd) 为 10-6M-1 或更小。术语 “亲和力” 是指结合的强度 : 结合亲和力的提 高与 Kd 降低相关。
按照另一方面, 本发明涉及用于切割、 替换或修饰靶区中的 DNA 序列的试剂盒, 所 述试剂盒包含一对或多对锌指核酸酶。
通常, 由于锌指核酸酶 (ZFN) 以二聚体的形式发挥作用, 因此针对单个 DNA 位点需 要制备两个 ZFN 单体。构成 ZFN 对的两个单体 ZFN 的中的每个与两个 9-bp 或 12-bp 的半 位点中的一个结合, 所述两个 9-bp 或 12-bp 的半位点由 5-bp 或 6-bp 的间隔序列分开。对 于单个半位点, 可以设计多个由不同的 ZF 组构成的单体 ZFN, 该不同的 ZF 组具有相同或相 似 DNA 结合特异性。在具体的实施方案中, 由相同或相似锌指结构域构成的 ZFN 对显示在 表 2 中, 但并不限于这些。多个组合 ZFN 对可以针对单个位点。
可以将本文所用的术语 “替换” 理解为表示一条核苷酸序列被另一条核苷酸序列 替换 ( 即信息层面的序列替换 ), 而并不必然需要用另一个多核苷酸物理或化学替换一个 多核苷酸。本文所用的术语 “修饰” 表示通过突变或非同源性末端连接而发生的 DNA 序列 中的改变。所述突变包括点突变、 取代、 缺失、 插入等。所述替换或修饰可以是用遗传信息 完全的核苷酸取代或改变遗传信息不完全的核苷酸。 由核苷酸序列所编码的肽也可以通过 突变而被功能失活。通过这种方式, 可以将锌指核酸酶用作基因治疗的工具。在一个具体 的实施方案中, 证实了针对敲除编码 CCR5 蛋白的人趋化因子 (C-C 基序 ) 受体 5(CCR5) 基 因的 ZFN, 该 CCR5 蛋白是人类免疫缺陷病毒 (HIV) 感染靶细胞所用的主要共受体。 当结合例如细胞、 核酸、 蛋白质或载体使用时, 术语 “重组体” 表示所述细胞、 核酸、 蛋白质或载体通过导入异源核酸或蛋白质或改变天然的核酸或蛋白质而被修饰, 或者表示 该细胞来源于进行这种修饰的细胞。因此, 例如, 重组细胞表达在天然的 ( 天然存在的 ) 细 胞形式中未被发现的基因, 或者表达以其它方式正常表达或非正常表达的、 低表达或根本 不表达的第二拷贝的天然基因。
按照另一方面, 本发明涉及产生锌指核酸酶的方法, 所述方法包括 : (a) 在目的区 域中选择核苷酸序列 ; (b) 选择与所述序列结合的锌指模块并工程改造锌指结构域, 其中 所述锌指结构域包含三个或更多个锌指模块, 两个或更多个所述锌指模块来源于天然存在 的、 野生型的锌指模块, 以及 (c) 表达包含工程锌指结构域和核苷酸切割结构域的融合蛋 白。
在产生本发明的锌指核酸酶的方法中, 步骤 (a) 是选择目的区域中的核苷酸序列 的步骤。所述核苷酸序列可以存在于细胞内或细胞外, 长度是不受限制的。核苷酸可以为 线状或环状的、 单链或双链的。
步骤 (b) 是选择与目的区域中的核苷酸序列结合的锌指模块并工程改造锌指结 构域的步骤。 优选地, 所述锌指结构域包含三个或更多个锌指模块, 两个或更多个所述锌指 模块来源于天然存在的、 野生型的锌指模块, 更优选图 1 所示的锌指模块, 甚至更优选图 2 所示的锌指模块。
步骤 (c) 是表达包含锌指结构域和核苷酸切割结构域的融合蛋白的步骤。所述表 达包括体内和离体表达。可以通过本领域内已知的方法进行体内表达, 例如利用载体。载
体的实例包括但不限于质粒、 黏粒、 噬菌体和病毒载体, 但是并不限于这些。可以根据用途 通过包含分泌信号序列以及调控元件来制备合适的表达载体, 所述调控元件元件例如启动 子、 操纵子、 起始密码子、 终止密码子、 多腺苷酸化信号和增强子。
按照另一方面, 本发明涉及利用锌指核酸酶来切割目的区域中的细胞染色质的方 法。
在一个具体的实施方案中, 本发明提供了切割目的区域中的细胞染色质的方法, 包括以下步骤 : (a) 在目的区域中选择第一核苷酸序列 ; (b) 选择与第一核苷酸序列结合 的第一锌指核酸酶 ; (c) 在包含所述核苷酸序列的细胞内或细胞外表达所述第一锌指核酸 酶, 从而将所述核酸酶导入所述细胞中, ; 以及 (d) 使所述第一锌指核酸酶 ( 其在细胞内表 达或被导入细胞 ) 与所述序列结合, 以便切割目的区域中的细胞染色质。
本发明的第一锌指核酸酶包括三个或更多个锌指模块, 两个或更多个所述锌指模 块来源于天然存在的、 野生型的锌指模块。
在另一个具体的实施方案中, 本发明提供了切割目的区域中的细胞染色质的方 法, 包括以下步骤 : (a) 在目的区域中选择第一核苷酸序列 ; (b) 选择与第一核苷酸序列结 合的包含本发明的第一锌指结构域和第一核苷酸切割结构域的第一锌指核酸酶 ; (c) 在包 含所述核苷酸序列的细胞内或细胞外表达所述第一锌指核酸酶, 用于将所述核酸酶导入所 述细胞 ; 以及 (d) 使第一锌指核酸酶 ( 其在细胞内表达或被导入细胞 ) 与所述序列结合, 以 便切割目的区域中的细胞染色质 ; (e) 在包含所述核苷酸序列的细胞内或细胞外选择并表 达第二锌指核酸酶, 从而将所述核酸酶导入所述细胞中, 其中所述第二锌指核酸酶包含第 二锌指结构域和第二核苷酸切割结构域 ; 以及 (f) 使所述第二锌指核酸酶 ( 其在细胞内表 达或被导入细胞 ) 与目的区域中的所述第二核苷酸序列结合, 其中所述第二序列与所述第 一锌指核酸酶所结合的所述第一核苷酸序列之间的距离为 2-50 个核苷酸。
本文所用的 “染色质” 是指包含细胞基因组的核蛋白质结构。细胞染色质包含核 酸、 主要的 DNA 和蛋白质, 所述蛋白质包括组蛋白和非组蛋白染色体蛋白质。细胞染色质 可存在于任何类型的细胞中, 包括原核和真核细胞、 例如真菌、 植物、 动物、 哺乳动物、 灵长 类动物和人类细胞。大多数真核细胞染色质以核小体的形式存在, 其中核小体中心包含约 150 个碱基对的 DNA 和连接的包含组蛋白 H2A、 H2B、 H3 和 H4 每种两个的八聚体 ; 并且连接 物 DNA( 取决于有机体长度可变 ) 在核小体中心间延伸。组蛋白 H1 分子通常与连接物 DNA 连接。 为了公开本发明的目的, 术语 “染色质” 意图包括所有的细胞核蛋白质类型, 原核生物 的和真核生物的。细胞染色质包括染色体染色质和附加体染色质。 “染色体” 是包含所有或 部分细胞基因组的染色质复合物。 “附加体” 是复制中的核酸、 核蛋白质复合物或包含的核 酸不是细胞染色体组型的一部分的其它结构。附加体的实例包括质粒和某些病毒基因组。
在另一个具体的实施方案中, 本发明提供了切割目的区域中的细胞染色质的方 法, 包括以下步骤 : (a) 选择目的区域 ; (b) 提供与所述目的区域中的第一核苷酸序列结合 的第一锌指结构域 ; (c) 提供与所述目的区域中的第二核苷酸序列结合的第二锌指结构 域, 其中所述第二序列与所述第一序列之间的距离为 2-50 个核苷酸 ; (d) 在细胞中同时或 相继表达所述第一锌指核酸酶和所述第二锌指核酸酶, 其中所述第一锌指核酸酶包含第一 锌指结构域和第一核苷酸切割结构域, 所述第二锌指核酸酶包含第二锌指结构域和第二核 苷酸切割结构域 ;其中所述第一和第二锌指结构域包含三个或更多个锌指模块, 两个个或更多个所 述锌指模块来源于天然存在的锌指模块, 以及
所述第一锌指结构域与所述第一核苷酸序列结合, 所述第二锌指结构域与所述第 二核苷酸序列结合, 而且其中所述结合定位了核苷酸切割结构域, 使得所述目的区域中的 细胞染色质被切割。
对于利用本发明锌指核酸酶进行靶向切割, 锌指结构域的结合位点可以包括切割 位点, 或者接近结合位点的边缘可以离所述切割位点 1 至 50 个核苷酸。绘制切割位点的方 法是本领域技术人员已知的。
切割 DNA 的位点通常位于两个融合蛋白的结合位点之间。DNA 的双链断裂通常由 两处单链断裂产生, 或者由错移 1、 2、 3、 4、 5、 6 或更多个核苷酸的 “缺口” 产生, 例如, 天然 FokI 切割的双链 DNA 由错移 4 个核苷酸的单链断裂产生。因此, 切割并非必然在每条 DNA 链上的完全相对的位点处发生。此外, 融合蛋白的结构和靶位点间的距离可以影响切割是 临近单核苷酸对发生还是切割在数个位点处发生。
本文所用的 “靶位点” 是锌指结构域所识别的核酸序列。单一的靶位点通常具有 约 6 至约 12 个碱基对。通常, 具有 3 个锌指模块的锌指蛋白识别两个相邻的 6 至 10 个碱 基对的靶位点, 并且具有 4 个锌指模块的锌指蛋白识别两个相邻的 9 至 12 个碱基对的靶位 点。术语 “相邻的靶位点” 表示相隔 0 至约 5 个碱基对的不重叠的靶位点。
如上文所指出的, 融合蛋白可以以多肽和 / 或多核苷酸的形式被导入。例如, 可以 将两条多核苷酸 ( 每条所包含的序列均编码上文提到的多肽中的一种 ) 导入细胞, 在靶序 列或靶序列附近发生切割。 可选地, 将包含编码两段多肽的序列的单一多核苷酸导入细胞。 多核苷酸可以是 DNA、 RNA 或 DNA 和 / 或 RNA 的任何修饰形式或同源物。
按照另一方面, 本发明涉及利用锌指核酸酶来替换细胞染色质中目的区域的第一 核苷酸序列的方法。
在具体的实施方案中, 本发明提供了替换细胞染色质中目的区域的第一核苷酸序 列的方法, 包括以下步骤 : (a) 工程改造出与所述目的区域中的第二核苷酸序列结合的第 一锌指结构域, 其中所述第二序列包含至少 9 个核苷酸 ; (b) 提供与第三核苷酸序列结合的 第二锌指结构域, 其中所述第三序列包含至少 9 个核苷酸, 并且与所述第二序列之间的距 离为 2-50 个核苷酸 ; (c) 在细胞中表达第一锌指核酸酶和第二锌指核酸酶, 其中所述第一 锌指核酸酶包含第一锌指结构域和第二核苷酸切割结构域, 所述第二锌指核酸酶包含第二 锌指结构域和第三核苷酸切割结构域 ; 以及 (d) 将所述细胞暴露于包含第四核苷酸序列的 多核苷酸, 其中所述第四核苷酸序列与所述第一核苷酸序列是同源的但并非一致的 ;
其中所述第一和第二锌指结构域包含三个或更多个锌指模块, 一个个或多个所述 锌指模块来源于天然存在的锌指模块, 以及
所述第一锌指核酸酶与所述第二序列的结合, 和所述第二锌指核酸酶与所述第三 序列结合定位了切割结构域, 使得所述目的区域中的细胞染色质被切割, 进而促进所述第 一核苷酸序列和所述第四核苷酸序列之间的同源重组, 导致所述第一核苷酸序列被所述第 四核苷酸序列替换。
本公开提供了特征为更高的靶向重组效率和更低的非特异的插入事件的靶向序 列改变方法。由于细胞 DNA 中的双链断裂刺激切割位点附近的同源重组提高数千倍, 因此这种靶向切割允许改变或替换 ( 通过同源重组 ) 基因组中几乎任何位点处的序列。
除了融合蛋白 ( 锌指核酸酶 ) 之外, 所选的基因组序列的靶向替换还需要供体序 列。可以在表达融合蛋白之前、 同时或之后将所述供体序列导入细胞中。很明显, 所述供体 序列通常与其所替换的基因组序列不同。例如, 供体多核苷酸序列与基因组序列相比可以 包含一个或多个单碱基改变、 插入、 缺失、 倒位或重排, 但是要存在足够的同源性来支持同 源重组。可选地, 供体序列可以包含由两个同源区侧翼连接的非同源序列。此外, 供体序列 可以包含与细胞染色质的目的区域非同源的序列。
此外, 在本方法中, 所述第一核苷酸序列可以优选基因中包含突变的序列, 在这种 情况下, 供体序列, 尤其是第四序列优选是基因的野生型序列。所述突变可以包括点突变、 取代、 缺失或插入。
此外, 在另一个具体的实施方案中, 本发明提供了利用锌指核酸酶来改变细胞染 色质中目的区域的第一核苷酸序列的方法。
具体地, 本发明提供了改变细胞染色质中目的区域的第一核苷酸序列的方法, 包 括以下步骤 : (a) 工程改造出与所述目的区域中的第二核苷酸序列结合的第一锌指结构 域, 其中所述第二序列包含至少 9 个核苷酸 ; (b) 提供与第三核苷酸序列结合的第二锌指结 构域, 其中所述第三序列包含至少 9 个核苷酸, 并且与所述第二序列之间的距离为 2-50 个 核苷酸 ; (c) 在细胞中表达第一锌指核酸酶和第二锌指核酸酶, 其中所述第一锌指核酸酶 包含第一锌指结构域和第二核苷酸切割结构域, 所述第二锌指核酸酶包含第二锌指结构域 和第三核苷酸切割结构域 ; 其中所述第一和第二锌指结构域包含三个或更多个锌指模块, 一个或多个所述锌指模块来源于天然存在的、 野生型的锌指模块, 以及所述第一锌指核酸 酶与所述第二序列的结合, 和所述第二锌指核酸酶与所述第三序列的结合定位了切割结构 域, 使得所述目的区域中的细胞染色质被切割, 导致所述第一核苷酸序列在切割位点发生 改变。 本发明中, 通常可以将编码一种或多种 ZFP 或 ZFP 融合蛋白的核酸克隆进载体中, 转化进原核或真核细胞中来复制和表达。 载体通常是原核或真核载体, 例如质粒、 穿梭载体 或昆虫载体。还通常将编码 ZFP 的核酸克隆进表达载体中, 用来给予植物细胞、 动物细胞, 优选哺乳动物细胞或人类细胞、 真菌细胞、 细菌细胞或原生动物细胞。
表达载体是用一系列指定的核酸元件重组或合成产生的核酸构建体, 所述核酸元 件允许特定的核酸在宿主细胞中转录, 并且任选地允许表达载体在宿主细胞中整合或复 制。表达载体可以是质粒、 病毒或病毒或非病毒来源的核酸片段的一部分。通常, 表达载体 包含 “表达盒” , 表达盒包含可操作地连接于启动子的待转录的核酸。术语表达载体还包括 可操作地连接于启动子的裸露的 DNA。
为了表达克隆的基因或核酸, 通常将编码 ZFP 或 ZFP 融合蛋白的序列亚克隆进含 有指导转录的启动子的表达载体中。合适的细菌和原核启动子在本领域内是公知的。
术语 “可操作地连接” 是指核酸表达调控序列 ( 例如启动子或转录因子结合位点 的排列 ) 和第二核酸序列之间的功能性连接。
本发明中, “宿主细胞” 表示含有锌指核酸酶、 或表达载体或核酸的细胞, 所述表达 载体或核酸两者任选地编码锌指核酸酶。所述宿主细胞通常支持表达载体的复制或表达。 宿主细胞可以是诸如大肠杆菌的原核细胞或真核生物细胞 ( 例如, 酵母、 真菌、 原生动物、
高等植物和昆虫细胞或两栖动物细胞 ) 或哺乳动物细胞 ( 例如, CHO、 HeLa 293、 COS-1 和 HEK, 例如培养的细胞 ( 体外 ))、 外植体和原始培养物 ( 体外和离体 ) 和体内细胞。
术语 “核酸” 是指脱氧核糖核苷酸或核糖核苷酸和其单链或双链形式的聚合物。 该 术语包括含有已知核苷酸类似物或修饰的主链残基或连接物的核酸, 这些核酸是合成的、 天然存在的和非天然存在的, 具有与参考核酸相似的结合特性。这些类似物的实例包括而 不限于, 硫代磷酸酯、 氨基磷酸酯、 膦酸甲酯、 手性膦酸甲酯、 2-O- 甲基核糖核苷酸、 肽核酸 (PNA)。
本文所用的术语 “多肽” 、 “肽” 和 “蛋白质” 是可交替使用的, 是指氨基酸残基的聚 合物。该术语也适用于其中一个或多个氨基酸残基是相应天然存在的氨基酸的人工化学 模拟物的氨基酸聚合物、 以及适用于天然存在的氨基酸聚合物和非天然存在的氨基酸聚合 物。
术语 “氨基酸” 是指天然存在的和合成的氨基酸, 以及以与天然存在的氨基酸相似 的方式起作用的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸是由遗传密码编码的 那些氨基酸、 以及以后进行修饰的那些氨基酸, 例如羟脯氨酸、 γ- 羧基谷氨酸和 O- 磷酸丝 氨酸。氨基酸类似物是指与天然存在的氨基酸具有相同基本化学结构的化合物, 即 α 碳与 氢、 羧基、 氨基和 R 基结合, 例如高丝氨酸、 正亮氨酸、 蛋氨酸亚砜、 蛋氨酸甲基锍。这种类似 物具有修饰的 R 基 ( 例如正亮氨酸 ) 或修饰的肽主链, 但是保留了与天然存在的氨基酸相 同的基本化学结构。氨基酸模拟物是指结构不同于氨基酸一般化学结构, 但是以与天然存 在的氨基酸相似的方式起作用的化合物。可以通过公知的三字母符号或通过 IUPAC-IUB 生 化命名委员会 (Biochemical Nomenclature Commission) 所推荐的单字母符号来表示本文 的氨基酸, 同样可以通过通常所接受的单字母密码来表示核苷酸。 下文将结合实施例对本发明进行详细的描述。然而, 这些实施例仅为示例性的目 的, 并且本发明不受这些实施例所限。
本发明的实施方式
实施例 1 : ZFN 设计和含 ZFN 的质粒的构建
按 “Human zinc fingers as building blocks in the construction of artificial transcription factor( 人类锌指作为构建人工转录因子的构件 ).” (Bae, K.H.et al.Nat Biotechnol 21, 275-280(2003)) 中所描述来组装编码 3- 指或 4- 指阵列的 DNA 片段。在 3- 指或 4- 指阵列中, 选择了具有不同 DNA 结合特异性的 54 种锌指模块 ( 下 文称为 ZF 模块 )。图 1 和 2 中显示了所选的 ZF 模块及其氨基酸序列。在这 54 种 ZF 模块 中, 31 种来源于人类基因组的 DNA 序列, 2 种来源于果蝇基因组的 DNA 序列 ( 图 1)。为了 方便, 将来自人类和果蝇基因组 DNA 序列的 ZF 模块称为 ToolGen 模块。其余的 21 种 ZF 模 块或者选自利用噬菌体展示的 ZF 变体库 (Barbas 模块 ) 或者由定点诱变产生 (Sangamo 模 块 )。
然后, 为了设计多指 ZFN, 我们利用在 ToolGen 开发出的计算机算法来鉴定人类趋 化因子 (C-C 基序 ) 受体 5(CCR5) 编码区的 DNA 序列中的潜在 ZFN 靶位点。基于该结果, 本 发明人通过 54 种 ZF 模块的组合合成了 208 种 ZFN 单体, 并且图 2 中显示了代表性 ZFN 对 的氨基酸序列。这 315 种 ZFN 对一共意图靶向于 CCR5 基因中的 33 个位点 ( 参见图 3)。
将 由 3 或 4 个 ZF 模 块 组 成 的 锌 指 结 构 域 整 合 进 来 源 于 海 床 黄 杆 菌
(flavobacterium okeanokoites) 基因组 DNA 的 FokI 内切核酸酶结构域, 并将整合的序列 克隆进 p3 中, p3 是 pcDNA3.0 质粒 (Invitrogen) 的改良版。
实施例 2 : 体外和体内测定 ZFN 活性
2-1. 体外消化测定
首先, 利用体外转录和翻译 (IVTT) 系统制备 ZFN, 并与包含 CCR5 编码序列的 DNA 片段一起孵育, 以评价其体外 DNA 限制性活性。具体而言, 利用 TnT 快速偶联的转录 / 翻译 系统 (Promega) 按照生产商的描述 ( 体外转录和翻译 ; IVTT) 使实施例 1 中设计的 ZFN 在 体外被转录和翻译。简而言之, 将编码 ZFN 的质粒 ( 每种 0.5μl) 加至 TnT Quick master mix(20μl) 和 1mM 蛋氨酸 (0.5μl) 中, 并于 30℃孵育 90 分钟。首先用限制性酶消化含有 CCR5 编码序列的靶质粒, 使之为线性。然后与一对 ZFN IVTT 裂解物 ( 每种 1μl) 在 37℃ 在 NEBuffer 4(New England Biolabs) 中孵育 2 小时来消化该靶质粒 (1μg)。通过加热 (65℃ ) 使反应混合物失活, 然后于 13,000rpm 离心。上清用于琼脂糖凝胶分析。图 4 是该 测定的示意图, 结果显示在图 5 中。
如图 5 所示, 多种 ZFN 对 (44% ) 表现出对靶 DNA 有效的位点特异性切割。
2-2 : 单链退火系统
然后本发明人利用基于哺乳动物细胞的单链退火 (SSA) 系统来检验这些 ZFN 是否 能在人体细胞中诱导同源重组。
2-2-1. 基于细胞的测定中所用的报告质粒
利用以下表 1 中的引物 1 和 2 从 pGL3-control(Promega) 扩增出萤火虫荧光素酶 基因的 3’ 部分, 并将该扩增产物克隆进 pcDNA5/FRT/TO(Invitrogen) 的 BamHI 和 XhoI 位 点。接下来将用以下表 1 中的引物 3 和 4 扩增出的荧光素酶基因的 5’ 部分克隆进上述得 到的质粒的 HindIII 和 BamHI 位点。利用以下表 1 中的引物 5 和 6 将 I-SceI 结合位点克 隆进该报告质粒的 BamHI 位点。将利用引物 7 和 8 扩增出的 CCR5 编码序列克隆进该报告 质粒的 BamHI 位点。
表1
2-2-2. 细胞培养和报告细胞系的建立
用含实施例 1 中的 ZFN 编码序列的质粒转化 HEK293T/17(ATCC, CRL-11268TM) 细胞 和 Flp-InTM T-RExTM 293 细胞 (Invitrogen), 将该转化的细胞在补有 100 单位 /ml 青霉素、 100μg/ml 链霉素、 0.1mM 非必需氨基酸和 10%胎牛血清 (FBS) 的达尔伯克氏改良伊格尔培 养基 (DMEM) 中维持。按照生厂商的说明书将编码断裂的荧光素酶基因的报告质粒稳定整 合进 Flp-InTM T-RExTM 293 细胞中。 简单而言, 用所述报告质粒和 pOG44(Flp 重组酶表达载 体 ) 共转染该细胞, 并用潮霉素 B 进行选择。鉴定携带断裂的荧光素酶基因的克隆细胞系, 用于 SSA 测定。
2-2-3. 利用 SSA 系统进行基于细胞的测定
用 Lipofectamine 2000(Invitrogen) 将每对 ZFN 表达质粒 ( 每种 100ng) 转染进 30,000 报告细胞 / 孔的 96 孔板中。48 小时后, 通过与强力霉素 (1μg/ml) 一起孵育来诱 导荧光素酶基因。孵育 24 小时后, 将细胞在 20μl 的 1× 裂解缓冲液 (Promega) 中裂解, 并用 10μl 荧光素酶测定剂 (Promega) 加 2μl 细胞裂解物来测定荧光素酶活性。
2-2-4. 结果
用表达 ZFN 的质粒转染人胚肾细胞 (HEK 细胞 ), 该细胞的基因组含有稳定整合的、 通过插入 CCR5 序列而被中断的部分复制的萤火虫荧光素酶基因。有效的 ZFN 能在 CCR5 序 列中产生双链断裂 (DSB), 这应该允许经由 SSA 恢复功能性荧光素酶基因。可以通过检测 荧光素酶酶活性来估计 ZFN 的 DNA 切割效率。高效的大范围核酸酶 I-SceI 用作阳性对照。 实验步骤的示意图如图 6 所示, 结果显示在图 7 中。
如图 7 所示, 本测定中, 多对 ZFN 产生了显著的荧光素酶活性。 在 315 对 ZFN 当中, 与阳性对照 I-SceI 相比, 23 对表现出 15% -57%的荧光素酶活性。表现出小于 15%的活 性的 ZFN 对仍可能在细胞中诱导双链断裂, 但是本发明人集中于高活性的 23 对, 用于进一 步的研究。当这 23 对 ZFN 二聚体使用无靶标的报告细胞时, 它们没有产生显著的荧光素酶
活性, 所述无靶标的报告细胞的基因组所包含的部分复制的荧光素酶基因由与 CCR5 无关 的 DNA 序列中断 ( 数据未显示 )。这些结果提示 ZFN 介导的 DNA 修复是 CCR5 特异的。
实施例 3 : 在 ZFN 处理的 HEK293 细胞中检测突变
发明人研究了既在 IVTT 测定中表现出内切核酸酶活性又在基于细胞的测定中诱 导萤光素酶活性的 ZFN 是否能修饰细胞中的内源靶序列。由 ZFN 诱导的双链断裂可以通过 易出错的非同源性末端连接 (NHEJ) 来修复。产生的 DNA 通常在 DSB 位点附近含有小的插 入或缺失 ( 插入 / 缺失突变 )。可以通过用错配敏感的 T7 内切核酸酶 I(T7E1) 处理扩增的 DNA 片段来体外检测这些插入 / 缺失突变 ( 参见图 8)。
具体而言, 利用 Lipofectamine 2000(Invitrogen) 用两种编码 ZFN 对的质粒 ( 每 种 100ng) 转染于 96 孔板中预培养的 HEK293T/17 细胞。孵育 72 小时后, 利用 G-spinTM 基 因组 DNA 提取试剂盒 (iNtRON BIOTECHNOLOGY) 按照生厂商的描述从 ZFN 转染的细胞提取 基因组 DNA。扩增包含所述 ZFN 靶位点的基因组区, 解链并退火形成异源双螺旋 DNA。引物 9 和 12 用于 Z30 位点、 引物 10 和 12 用于 Z266 和 Z360 位点、 引物 11 和 12 用于 Z410、 Z426 和 Z430 位点、 并且引物 13 和 14 用于 Z836 和 Z891 位点 ( 参见表 1)。用 5 单位 T7 内切核 酸酶 1(New England BioLabs) 对退火的 DNA 于 37℃处理 15 分钟, 然后通过加入 2.5 倍体 积的乙醇来沉淀。通过琼脂糖凝胶电泳分析沉淀的 DNA。结果显示在图 9 中。
如图 9 所示, 从 ZFN 处理的细胞扩增出的 DNA 的小部分被 T7E1 切割。每对 ZFN 产 生不同的切割模式, 反映出这些 ZFN 靶向于 8 个不同的位点的事实。此外, 得到的 DNA 条带 的大小同预期一样。在 T7E1 测定中测试的 23 对 ZFN 中, 21 对表现出可检测到具有预期大 小的 DNA 条带 ( 数据未显示 )。
本发明人还利用 T7E1 测定来检测这种代表性的 ZFN 对 : 或者在 IVTT 测定中未表 现出显著的内切核酸酶活性或者在基于细胞的 SSA 系统中未引起显著的萤光素酶活性但 是通过 IVTT 检验的 ZFN 对。T7E1 测定结果显示, 这些 ZFN 对中没有一个能诱导出可检测水 平的 DNA 突变。
实施例 4 : 对 ZFN 诱导的突变进行 DNA 序列分析
本发明人选择用于进一步研究的 8 对有代表性的 ZFN 对, 每一对均靶向于 CCR5 基 因的不同位点 ( 参见表 2)。他们首先检验这 8 种单独的 ZFN 中的任一种是否能以同二聚体 的形式发挥作用。利用 T7E1 测定来分析单独的每种 ZFN 单体的基因靶向活性。同预期一 样, 没有一种 ZFN 单体能产生可检测的 DNA 切割 ( 数据未显示 )。
表2
然后本发明人测定靶区的 DNA 序列, 以证实 ZFN 诱导的突变并估计诱变率。对 从 8 对 ZFN 中的每一对所转染的细胞扩增出的 DNA 进行克隆并测序。在 DSB 位点附近 观察到多种缺失和插入 ( 参见图 10-14)。这些诱变模式是易错 NHEJ 相关诱变的标志, 并且其它文献中已报道了相似的模式 (Bibikova, M., Golic, M., Golic, K.G.& Carroll, D.Targeted chromosomal cleavage and mutagenesis in Drosophila using zinc-finger nucleases( 利用锌指核酸酶在果蝇中进行定向染色体切割和定向诱变 )Genetics 161, 1169-1175(2002) ; Morton, J., Davis, M.W., Jorgensen, E.M.& Carroll, D.Induction and repair of zinc-finger nuclease-targeted double-strand breaks in Caenorhabditis elegans somatic cells( 对秀丽隐杆线虫 (Caenorhabditis elegans) 体细胞中锌指核酸 酶引起的双链断裂的诱导和修复 ).Proc Natl Acad Sci U S A 103, 16370-16375(2006) ; Santiago, Y.et al.Targeted gene knockout in mammalian cells by using engineered zinc-finger nucleases( 利用工程锌指核酸酶在哺乳动物细胞中定向敲除基因 ).Proc Natl Acad Sci U S A 105, 5809-5814(2008))。除了小的 indel 突变和取代之外, 本发明 人还观察到两对 ZFN( 参见图 11 中的 Z30 和图 12 中的 Z360) 引起的相对大的插入 ( 每对 插入不同的 81 个核苷酸 )。DNA 序列分析揭示, 插入的序列来自编码 ZFN 的质粒。
靶向于不同位点的 8 对 ZFN 显示出 2.4% -17%的诱变率 ( 参见图 15), 这是通过 突变克隆数除以被分析的总克隆数计算得出的。这些高效的 ZFN 诱导的突变作用提示, 仅 筛选 10-100 个来源于单细胞的集落就可以分离出克隆的突变细胞。
实施例 5 : ZFN 处理后克隆细胞的分离
5-1. 本发明 ZFN 的脱靶效应
据了解, 当在哺乳动物细胞中表达时, 某些 ZFN 具有脱靶效应, 并且是细胞毒性 的 (Szczepek, M.et al.Structure-based redesign of the dimerization interface reduces the toxicity of zinc-finger nucleases( 对 二 聚 界 面 基 于 结 构 的 重 新 设 计 降 低 了 锌 指 核 酸 酶 的 毒 性 ).Nat Biotechnol 25, 786-793(2007) ; Miller, J.C.et al.An improved zinc-finger nuclease architecture for highly specific genome editing( 改 善 锌 指 核 酸 酶 结 构 用 于 高 特 异 性 的 基 因 组 编 辑 ).Nat Biotechnol 25, 778-785(2007))。本发明人观察到本发明 ZFN 转染的 HEK293 细胞生长没有显著迟缓。然 而, 当他们最初筛选有限数量的单细胞集落时, 他们无法分离基因组序列被 ZFN 处理所修 饰的克隆的突变细胞, 这表明携带 ZFN 诱导突变的哺乳动物细胞随着生长而减少。
因此, 为了研究携带 ZFN 诱导突变的哺乳动物细胞是否随着生长而减少, 并因此 被非修饰的细胞所超越, 本发明人用从 ZFN 转染后第 3、 6 和 9 天时的细胞所分离的 DNA 进 行 T7E1 测定。对于本次分析他们选择了 Z891 对, 并且如图 16 所示, 与第 3 天相比, 在第 6 天时切割的 DNA 片段明显减少, 并且在 ZFN 处理后第 9 天时, 几乎检测不到切割的 DNA 片段。 这些结果提示 ZFN 介导的诱变作用确实对细胞生长具有细胞毒效应。
5-2. 本发明异二聚 ZFN 的脱靶效应
ZFN 的脱靶效应主要由形成同二聚或异二聚的 ZFN 单体的活性引起。通过利用能 形成异二聚体但不能形成同二聚体的 FokI 核酸酶变体可以显著降低这些效应。因此, 为了 降低 ZFN 的细胞毒效应, 本发明人在 T7E1 测定中制备并检验了两种不同类型的所谓的强制 型异二聚体 ( 表示为图 16 中的 “RR/DD” 二聚体和 “KK/EL” 二聚体 )。T7E1 测定表明, 当细 胞用 RR/DD ZFN 对转染时, 甚至在 ZFN 处理后第 9 天时仍存在切割的 DNA 片段。 为了证实该 强制型异二聚 ZFN 的细胞毒性的降低是由其在细胞中 DNA 切割的特异性增强引起, 本发明 人利用抗 53BP1( 被吸引至 DSB 的蛋白质 ) 的抗体分析 ZFN 处理细胞中的 DSB 的数量。 具体 而言, 用 HEK293T/17 细胞进行 53BP1 的核内染色。用带盖的 Lab-Tek 腔室玻片 (NUNC) 附 着细胞, 并用 3.7%的甲醛来固定该细胞来制备玻片。然后通过用 0.2% Triton X-100 的 磷酸盐缓冲盐水 (PBS) 的处理使该细胞于室温 (RT) 渗透 10 分钟。然后将细胞与抗 53BP1 的兔多克隆抗体 (Bethyl Laboratories) 孵育, 存在 5%牛血清白蛋白 (BSA) 以封闭非特 异性着色, 接下来与 Alexa Fluor 488 偶联的二抗 (Invitrogen-Molecular Probes) 孵育。 将玻片置于 DAPI(Sigma) 中来复染细胞核, 并在免疫荧光显微镜 (Carl Zeiss-LSM510) 下 检查。结果显示在图 17 和 18 中。如图 17 和 18 所示, 当与用对应的野生型 ZFN 对处理的 细胞相比, 用 RR/DD ZFN 对处理的细胞中 53BP1 位点的数量显著减少。
5-3. 在用 ZFN 处理的基因组中检测突变
接下来, 在筛查分别在 96 孔板上生长的 225 个单细胞集落之后, 随即分离出了利 用 Z891 RR/DD ZFN 对的 7 种不同的突变的克隆 HEK293 细胞。本发明人检验这些克隆细胞 中 CCR5 区的 DNA 序列, 以确认 ZFN 诱导的基因组修饰。对修饰细胞基因组的 DNA 序列的分 析表明, 7 个克隆中有 6 个表现为单等位基因的缺失或插入, 以及 1 个表现为 CCR5 基因的双 等位基因修饰 ( 参见图 19)。由于有一部分三体细胞, 因此 HEK293 细胞在其基因组中携带 三个 CCR5 基因拷贝。在表现为双等位基因修饰的克隆中, 观察到一段未修饰的、 野生型序列 ( 参见图 19)。 这种由 ZFN 处理引起的双等位基因修饰提示, 仅在一个不用选择标记的步 骤中, 就可以分离纯合的敲除细胞。
实施例 6 : 靶向于 CCR5 的 ZFN 在同源的 CCR2 位点处的脱靶效应
CCR2 基因与 CCR5 基因是高度同源的, 并且多个 CCR5 ZFN 识别元件在 CCR2 基因 座中是保守的。因此, 本发明人研究为 CCR5 位点所设计的 8 对 ZFN 是否也能修饰 CCR2 基 因座处的同源或一致的序列。在 CCR2 基因中具有相同识别元件的三对 ZFN(Z360、 Z410 和 Z430) 能在 T7E1 测定中诱导有效的基因组修饰 ( 参见图 20)。在 CCR2 基因中, Z891 对的识 别元件由与 CCR5 基因的对应位点完美匹配的 12-bp 半位点和携带一个碱基的错配的 12-bp 的半位点组成。同预期一样, 该 Z891 对也在 CCR2 位点处表现出显著的基因靶向活性。本 发明人还检验了 Sangamo 的靶向于 CCR5 的 ZFN 对, 其在 CCR2 基因座中的识别元件在每个 12-bp 半位点中含有一个碱基的错配, 并且证实该 ZFN 在同源的 CCR2 位点处表现出脱靶基 因组修饰 ( 参见图 20)。相反, 对于 ZFN 对 (Z30、 Z266 和 Z836) 没有观察到可检测的 ZFN 活 性, 这些 ZFN 对在 CCR2 基因座的识别元件显示出至少两个错配。
本发明人还检验了通过 Z891 对转染的 HEK293 细胞所获得的 7 种突变的克隆细胞 除了在预期的 CCR5 位点诱导突变之外, 在高度同源的 CCR2 位点的 DNA 序列中是否诱导突 变。结果显示在图 21 中。尽管如图 20 所描述, Z891 对在 T7E1 测定中在 CCR2 位点以及在 CCR5 位点均表现出显著的基因靶向活性, 但是这些克隆细胞系的 CCR2 基因座没有被突变。 这些结果表明, 可能分离出克隆细胞, 其中 ZFN 处理之后通过筛查细胞仅在预期的靶位点, 而不在同源的位点被突变。 实施例 7 : 模块交换分析
本发明人随后研究了为什么我们经由模块组装来制备 ZFN 的方法能导致高成功 率的基因组编辑。具体而言, 他们进行了模块交换实验, 其中用从 Barbas 或 Sangamo 模块 产生的表现出相同 DNA- 结合特异性的那些 ZFN 替代本发明的 ZFN。
为此, 本发明人制备了 8 种新的仅由 Barbas 或 Sangamo 模块组成的 ZFN 单体, 并 用它们来替代 6 种不同的仅由 ToolGen 模块组成的 ZFN 单体 ( 参见表 3 和图 22)。将这些 新的 ZFN 单体中的每一种与合适的伴侣 ZFN 单体配对, 并在 SSA 和 T7E1 测定中检验得到的 ZFN 对。如图 23 和 24 所示, 由至少一种这些新合成的 ZFN 单体所组成的 ZFN 对中, 没有一 种在 SSA 系统中表现出任何显著的活性 ( 参见图 23)。此外, 这些 ZFN 中没有一种在 T7E1 测定中表现出任何基因靶向活性 ( 参见图 24)。
表3
这些结果强有力地支持这种观点 : 对于功能性 ZF 阵列的模块式组装, 天然存在的 ZF 比工程 ZF 能构成更可靠的框架。
实施例 8 : 对本发明 ZF 模块的评价
对本发明人产生的 315 对 ZFN 的统计学分析可以为新 ZFN 的设计提供基础, 该新 ZFN 可用来定向诱变其它感兴趣的内源基因。为此, 本发明人计算出在 SSA 系统中为阳性 评分的 23 对 ZFN 中每种 ZF 的出现次数。然后他们用该次数除以所有 208 种 ZFN 单体中 该模块出现的次数来确定每种 ZF 的 “活性评分” ( 参见图 1 和 2)。某些高活性的 ZF, 例如 “QNTQ” 和 “RSHR” 分别具有 50%和 38%的活性评分 ; 这些高活性评分提示, 就预测体内位 点特异的核酸酶活性而言, 这些模块是可靠的。 其它 ZF, 例如在本测定中表现为无效模块的 “QSNK” 和 “rdae” , 显示的活性评分为 0。这两种 ZF 都用了 15 次, 但是含有这些模块的 ZFN 中, 没有一种在我们的测定中是有活性的。本发明人还比较了具有相同 DNA 识别特异性的 ZF 的活性评分。某些 ZF 明显比其它相同靶标的模块好, 例如, “DSNR” 和 “HSNK” 识别相同 的 GAC 序列。在构建 ZFN 中用 “DSNR” 产生了多种活性核酸酶 ( 活性评分= 35% ), 而并入 “HSNK” 只产生了非活性的 ZFN( 活性评分= 0% )。
基于统计学分析, 本发明人暂时推荐了 37 种 ZF(24 种 ToolGen 模块、 1 种 Sangamo
模块和 12 种 Barbas 模块 ), 用于将来的基因编辑研究中 ( 参见图 1 和 2)。如果本发明 人在实验中仅使用这 37 种模块, 总成功率应该是 53%, 这显著优于现在的成功率 (24% ) ( 参见图 26)。这 37 种模块均在活性 ZFN 中出现至少一次。当有两个或更多个相同靶标 的 ZF 时, 他们选择具有较高活性评分的那些 ZF。37 种 ZF 共识别 64 个 3-bp 亚位点中的 38 个。对于给定的 1-kbp 的随机 DNA 序列, 他们预测, 对于 3 指 ZFN 二聚体有 88 个 [ = 6 (38/64) ×1000×2] 潜在靶位点 ( 在半位点之间包含 5 或 6 个碱基的间隔 ), 并且对于 4 指 ZFN 二聚体有 31 个位点。假设本发明有 9.1%至 26%的成功率 ( 如果我们使用 37 种 ZF 而 不是其它的无效模块, 则实际成功率将显著提高 ), ZFN 介导的基因组编辑在 1-kbp 的靶序 列中平均可能有 8 个位点。这提示, 利用本发明的 ZFN 组装方法, 应该 “可靶向” 即使不是 全部也是大多数的真核生物基因。
工业实用性
在许多基因治疗应用中, 这些锌指核酸酶都可以用来敲除 CCR5 基因, 以在 AIDS 患 者中产生抗 HIV 感染的 T 细胞。24102333864 A CN 102333879
序列表1/32 页
25102333864 A CN 102333879序列表2/32 页
26102333864 A CN 102333879序列表3/32 页
27102333864 A CN 102333879序列表4/32 页
28102333864 A CN 102333879序列表5/32 页
29102333864 A CN 102333879序列表6/32 页
30102333864 A CN 102333879序列表7/32 页
31102333864 A CN 102333879序列表8/32 页
32102333864 A CN 102333879序列表9/32 页
33102333864 A CN 102333879序列表10/32 页
34102333864 A CN 102333879序列表11/32 页
35102333864 A CN 102333879序列表12/32 页
36102333864 A CN 102333879序列表13/32 页
37102333864 A CN 102333879序列表14/32 页
38102333864 A CN 102333879序列表15/32 页
39102333864 A CN 102333879序列表16/32 页
40102333864 A CN 102333879序列表17/32 页
41102333864 A CN 102333879序列表18/32 页
42102333864 A CN 102333879序列表19/32 页
43102333864 A CN 102333879序列表20/32 页
44102333864 A CN 102333879序列表21/32 页
45102333864 A CN 102333879序列表22/32 页
46102333864 A CN 102333879序列表23/32 页
47102333864 A CN 102333879序列表24/32 页
48102333864 A CN 102333879序列表25/32 页
49102333864 A CN 102333879序列表26/32 页
50102333864 A CN 102333879序列表27/32 页
51102333864 A CN 102333879序列表28/32 页
52102333864 A CN 102333879序列表29/32 页
53102333864 A CN 102333879序列表30/32 页
54102333864 A CN 102333879序列表31/32 页
55102333864 A CN 102333879序列表32/32 页