用于GNN的锌指结合结构域.pdf

摘要
申请专利号：	CN99814340.5	申请日：	1999.10.14
公开号：	CN1330713A	公开日：	2002.01.09
当前法律状态：	终止	有效性：	无权
法律详情：	未缴年费专利权终止IPC(主分类):C12N 15/10申请日:19991014授权公告日:20060816终止日期:20141014\|\|\|授权\|\|\|专利申请权、专利权的转移(专利申请权的转移)变更项目:申请人变更前权利人:诺瓦蒂斯有限公司变更后权利人:斯克里普斯研究学院变更项目:地址变更前:瑞士巴塞尔变更后:美国加利福尼亚州变更项目:共同申请人变更前权利人:斯克里普斯研究学院变更后权利人:登记生效日:2005.8.12\|\|\|公开\|\|\|实质审查的生效
IPC分类号：	C12N15/10; C07K14/47	主分类号：	C12N15/10; C07K14/47
申请人：	诺瓦蒂斯有限公司; 斯克里普斯研究学院
发明人：	C·F·巴巴斯
地址：	瑞士巴塞尔
优先权：	1998.10.16 US 09/173,941
专利代理机构：	中国专利代理(香港)有限公司	代理人：	谭明胜
PDF下载：	PDF下载

内容摘要

提供与含有一个三联体或GNN三联体的靶核苷酸具有结合特异性的锌指核苷酸结合多肽。还提供含有所述多肽的组合物以及这类多肽和组合物用于调节核苷酸功能的用途。

权利要求书

1.一种分离并纯化的锌指-核苷酸结合多肽，它包含具有SEQ ID
NO：1-16中任一序列的核苷酸结合区。
2.一种组合物，它包含2至约12种权利要求1所述多肽。
3.权利要求2的组合物，它包含2至约6种多肽。
4.权利要求2或3的组合物，其中所述多肽是有效连接的多肽。
5.权利要求2-4任一项的组合物，其中所述多肽利用具有SEQ ID
NO 111序列的接头连接。
6.权利要求2-5任一项的组合物，其中各所述多肽与不同核苷酸
序列结合。
7.权利要求2-6任一项的组合物，它与包含序列5’-(GNN)n-3’的
的核苷酸结合，其中各个N为A、C、G或T，前提是所有N不能
均为C而其中n为2-6。
8.权利要求1的多肽，它还与一种或多种转录调节因子有效连
接。
9.权利要求2-7任一项的组合物，它还与一种或多种转录调节因
子有效连接。
10.一种分离并纯化的多核苷酸，它编码权利要求1的所述多
肽。
11.一种分离并纯化的多核苷酸，它编码权利要求2-7任一项的
组合物。
12.一种表达载体，它含有权利要求10的多核苷酸。
13.一种表达载体，它含有权利要求11的多核苷酸。
14.一种调节包含序列5’-(GNN)n-3’的核苷酸序列的方法，其中n
为1-6的整数，所述方法包括使所述核苷酸序列与有效量的 2-7任一项的组合物接触。
15.权利要求14的方法，其中所述序列5’-(GNN)n-3’位于所述核
苷酸序列的转录区中。
16.权利要求14的方法，其中所述序列5’-(GNN)n-3’位于所述核
苷酸序列的启动子区中。
17.权利要求14的方法，其中所述序列5’-(GNN)n-3’位于表达的
序列标记中。
18.权利要求14的方法，其中所述组合物与一种或多种转录调节
因子有效连接。
19.一种药物，它包括权利要求2-7任一项的组合物。
20.权利要求2-7任一项的组合物的用途，用于生产用于人类治
疗的药物。
21.权利要求2-7任一项的组合物的用途，用于生产用于治疗癌
症的药物。

说明书

用于GNN的锌指结合结构域

本发明技术领域

本发明领域为结合靶核苷酸的锌指蛋白。更具体地说，本发明涉
及特异性结合式5’-(GNN)-3’靶核苷酸的锌指α螺旋域中的氨基酸残基
序列。

发明背景

1967年确立了控制基因表达的主要机制涉及以序列特异性方式
结合DNA的蛋白质开关模式(Ptashne，M.(1967)Nature(London)214，
323-4)。已描述了各种结构家族的DNA结合蛋白。尽管存在大量的结
构多样性，但是在真核生物中Cys2-His2锌指基元是最常用的核酸结合
基元。在酵母和人类均观测到这样的相同结果。最早在DNA和RNA
结合转录因子TFIIIA中鉴定了Cys2-His2锌指基元(Miller，J.，McLachlan，
A.D.& Klug，A.(1985)Embo J4，1609-14)，它可能是构建序列特异性
蛋白的理想结构支架。一个锌指域包括约30个氨基酸，它具有由疏水
性相互作用和一个锌离子的螯合作用稳定的简单ββα折叠(Miller，J.，
McLachlan，A.D.& Klug，A.(1985)Embo J4，1609-14，Lee，M.S.，
Gippert，G.P.，Soman，K.V.，Case，D.A.& Wright，P.E.(1989)Science
245，635-7)。锌指域α螺旋插入(presentation)DNA大沟使得允许发生序
列特异性的碱基接触。每个锌指域通常识别DNA的三个碱基对
(Pavletich，N.P.& Pabo，C.O.(1991)Science(Washington，D.C.，1883-)
252，809-17，Elrod-Erickson，M.，Rould，M.A.，Nekludova，L.& Pabo，C.
O.(1996)Structure (London)4，1171-1180，Elrod-Erickson，M.，Benson，T.
E，& Pabo，C.O.(1998)Structure (London)6，451-464，Kim，C.A.&
Berg，J.M.(1996)Natrue Structural Biology 3，940-945)，虽然螺旋插入
变化使得可以识别更长的位点(Pavletich，N.P.& Pabo，C.O.(1993)
Science(Washington，D.C.，18833-)261，1701-7，Houbaviy，H.B.，Usheva，
A.，Shenk，T.& Burley，S.K.(1996)Proc Natl Acad Sci USA 93，13577-
82，Fairall，L.，Schwabe，J.W.R.，Chapman，L.，Finch，J.T.& Rhodes，D.
(1993)Nature (London)366，483-7，Wuttke，D.S.，Foster，M.P.，Case，D.
A.，Gottesfeld，J.M.& Wright，P.E.(1997)，Mol.Biol.273，183-206)。
大多数转录因子依赖于蛋白域的二聚作用以增加对更长DNA序列或
位置(address)的蛋白-DNA接触，与此不同，锌指域的简单共价串联重
复使得该基元可以识别更长的非对称性DNA序列。

我们最近描述了含有6个锌指结构域而且结合18个碱基对连续
DNA序列的多指锌指蛋白(Liu，Q.，Segal，D.J.，Ghiara，J.B.& Barbas
III，C.F.(1997)PNAS 94，5525-5530)。识别18bps DNA足以描述所有
已知基因组中的独特DNA位置(address)，这种独特的DNA位置是使
用多指蛋白作高度特异性基因开关的要求。实际上在模型系统中采用
这些多指蛋白已经证实对基因激活和抑制的控制(Liu，Q.，Segal，D.J.，
Ghiara，J.B.& BarbasIII，C.F.(1997)PNAS 94，5525-5530)。

因为每个锌指结构域通常结合3个碱基对序列，所以一个完整识
别表(alphabet)需要特征鉴定64个结构域。可指导构建这些结构域的现
存资料得自以下3种类型的研究：结构测定(Pavletich，N.P.& Pabo，C.
O.(1991)Science(Washington，D.C.，1883-)252，809-17，Elrod-Erickson，
M.，Rould，M.A.，Nekludova，L.& Pabo，C.O.(1996)Structure(London)
4，1171-1180，Elrod-Erickson，M.，Benson，T.E.& Pabo，C.O.(1998)
Structure(London)6，451-464，Kim，C.A.& Berg，J.M.(1996)Nature
Structural Biology 3，940-945，Pavletich，N.P.& Pabo，C.O.(1993)
Science(Washington，D.C.，1883-)261，1701-7，Houbaviy，H.B.，Usheva，
A.，Shenk，T.& Burley，S.K.(1996)Proc Natl Acad Sci USA 93，13577-
82，Fairall，L.，Schwabe，J.W.R.，Chapman，L.，Finch，J.T.& Rhodes，D.
(1993)Nature(London)366，483-7.，11，Wuttke，D.S.，Foster，M.P.，Case，
D.A.，Gottesfeld，J.M.& Wright，P.E.(1997)J.Mol.Biol.273，183-206.，
Nolte，R.T.，Conlin，R.M.，Harrison，S.C.& Brown，R.S.(1998)Proc.
Natl.Acad.Sci.U.S.A.95，2938-2943，Narayan，V.A.，Kriwacki，R.W.&
Caradonna，J.P.(1997)J.Biol.Chem.272，7801-7809)、定点诱变(Isalan，
M.，Choo，Y.& Klug，A.(1997)Proc.Natl.Acad Sci U.S.A.94，5617-
5621，Nardelli，J.，Gibson，T.J.，Vesque，C.& Chamay，P.(1991)Nature
349，175-178，Nardelli，J.，Gibson，T.& Charnay，P.(1992)Nucleic Acids
Res.20，4137-44，Taylor，W.E.，Suruki，H.K.，Lin，A.H.T.，Naraghi-
Arani，P.，Igarashi，R.Y.，Younessian，M.，Katkus，P.& Vo，N.V.(1995)
Biochemistry 34，3222-3230，Desjarlais，J.R.& Berg，J.M.(1992)
Proteins：Struct.，Funct.，Genet.12，101-4，Desjarlais，J.R.& Berg，J.M.
(1992)Proc Natl Acad Sci USA 89，7345-9)以及噬菌体展示选择(Choo，
Y.& Klug，A.(1994)Proc Natl Acad Sci USA 91，11163-7，Greisman，H.
A.& Pabo，C.O.(1997)Science(Wahington，D.C.)275，657-661.23，
Rebar，E.J.& Pabo，C.O.(1994)Science(Washington，D.C.，1883-)263，
671-3，Jamieson，A.C.，Kim，S.-H.& Wells，J.A.(1994)Biochemistry 33，
5689-5695，Jamieson，A.C.，Wang，H.& Kim，S.-H.(1996)PNAS 93，
12834-12839，Isalan，M.，Klug，A& Choo，Y.(1998)Biochemistry 37，
12026-33，Wu，H.，Yang，W.-P.& Barbas III，C.F.(1995)PNAS 92，344-
348)。所有这些研究明显有助于我们了解锌指/DNA识别，但是每一种
研究均有其局限性。结构研究鉴定了各种各样的蛋白/DNA相互作用，
但是还不能解释是否其它相互作用可能更好。此外，尽管观测到允许
序列特异性识别的相互作用，但是关于其它序列如何排除在识别之外
知之甚少。对现有蛋白的诱变已经部分阐明了这些问题，但是所述资
料总是受限于可特征鉴定的突变体数目。随机文库的噬菌体展示以及
选择克服了一定的突变体数量限制，但是提供确保特异性和亲和性均
驱动选择的合适选择压力是困难的。几个实验室的实验研究(Choo，Y.
& Klug，A.(1994)Proc Natl Acad Sci USA 91，1113-7，Greisman，H.A.&
Pabo，C.O.(1997)Science(Washington，D.C.)275，657-661，Rebar，E.J.
& Pabo，C.O.(1994)Science(Washington，D.C.，1883-)263，671-3，
Jamieson，A.C.，Kim，S.-H.& Wells，J.A.(1 994)Biochemistry33，5689-
5695.25，Jamieson，A.C.，Wang，H.& Kim，S.-H(1996)PNAS 93，12834-
12839，Isalan，M.，Klug，A.& Choo，Y.(1 998)Biochemistry 37，12026-
33)，包括我们自己的实验(Wu，H.，Yang，W.-P.& Barbas III，C.F.(1995)
PNAS 92，344-348)证实可以设计或选择该识别表的几种成员。然而，
在这些早期研究中几乎没有以严格而系统的方式研究这些结构域与其
靶DNA的特异性和亲和性。

自从Jacob和Monod研究了阻抑物的化学性质，而且提出用其可
以刺激或抑制细胞内各种蛋白的合成的方案，具体的实验性控制基因
表达成为一个令人感兴趣的课题(Jacob，F.& Monod，J.(1961)，Mol.
Biol.3，318-356)。目前已经确证，主要通过称为转录因子的蛋白作用
在转录水平调节基因组，转录因子以序列特异性方式结合DNA。通常
这些蛋白因子以复杂的联合方式起作用，使得可以对基因表达进行时
序控制、空间控制以及环境应答性控制(Ptashne，M.(1997)Nature
Medicine 3，1069-1072)。转录因子常常既通过将蛋白定位到基因组特
定位点的DNA结合域发挥作用，又通过在所述位点或其附近刺激(激
活)或抑制转录的辅助效应结构域发挥作用(Cowell，I.G.(1994)Trends
Biochem.Sci.19，38-42)。效应结构域如激活域VP16(Sadowski，I.，Ma，
J.，Triezenberg，S.& Ptashne，M.(1988)Nature 335，563-564)和阻抑结构
域KRAB(Margolin，J.F.，Fredman，J.R.，Meyer，W.，K.-H.，Vissing，H.，
Thiesen，H.-J.& Rauscher III，F.J.(1994)Proc.Natl.Acad.Sci.USA 91，
4509-4513)通常是模块式的，而且当它们与其它DNA结合蛋白融合时
仍然保持其活性。鉴于通过将转录因子导向基因组的特定位点可容易
地控制基因，所以设计适合结合任何特定序列的DNA结合蛋白成为使
人畏惧的挑战。

本发明公开内容基于对Cys2-His2类结合核酸锌指蛋白的独特结
构特征的认识。Cys2-His2锌指结构域由约30个氨基酸长度的简单ββα
折叠组成。通过疏水性相互作用以及保守的Cys2-His2残基对一个锌离
子的螯合作用获得该折叠的线构稳定性(Lee，M.S.，Gippert，G.P.，
Soman，K.V.，Case，D.A.& Wright，P.E.(1989)Science 245，635-637)。
通过源自所述结构域的α螺旋的特定氨基酸侧链的接触达到识别核
酸，所述接触通常结合3个碱基对的DNA序列(Pavletich，N.P.& Pabo，
C.O.(1991)Science 252，809-17，Elrod-Erickson，M.，Rould，M.A.，
Nekludova，L.& Pabo，C.O.(1996)Structure 4，1171-1180)。与其它核酸
识别基元不同，多锌指结构域的简单共价键连接使得可以识别更长的
非对称DNA序列。对天然锌指蛋白的研究表明，3个锌指结构域可结
合9bp连续DNA序列(Pavletich，N.P.& Pabo，C.O.(1991)Science 252，
809-17.，Swirnoff，A.H.& Milbrandt，J.(1995)Mol.Cell.Biol.15，2275-
87)。尽管识别9bp序列不足以指定(specify)甚至大肠杆菌这样的小基
因组内的独特位点，但是含有6个锌指结构域的多指蛋白可指定对
18-bp的识别(Liu，Q.，Segal，D.J.，Ghiara，J.B.& Barbas III，C.F.(1997)
Proc.Natl.Acad.Sci.USA 94，5525-5530)。就开发基因控制通用系统而
言，18-bp位置足以指定在所有已知基因组中的单一位点。尽管本质
上还不了解这类多指蛋白，但是最近已经证实其在活的人体细胞中的
基因活化和抑制中的效能(Liu，Q.，Segal，D.J.，Ghiara，J.B.& Barbas III，
C.F.(1997)Proc.Natl.Acad.Sci.USA 94，5525-5530)。

发明概述

一方面，本发明提供分离纯化的锌指-核苷酸的结合多肽，它包括
SEQ ID NO：1-16中任一种的氨基酸残基序列。在一个相关方面，本发
明进一步提供含有2至约12个这种锌指-核苷酸结合多肽的组合物。
所述组合物优选包含2至约6个多肽。在一个优选的实施方案中，所
述锌指-核苷酸结合多肽最好通过具有SEQ ID NO 111序列的氨基酸
残基接头有效连接。本发明组合物特异性结合含有序列5’-(GNN)n-3’
的核苷酸靶，其中在所有N不能是C的条件下每个N均为A、C、
G或T，而且n优选为2-6。多肽或组合物可进一步有效链接一种或
多种转录调节因子例如转录激活剂或转录抑制剂或阻抑物。本发明还
提供分离纯化的编码本发明多肽或组合物的多核苷酸以及含有所述多
核苷酸的表达载体。

再一方面，本发明提供调节核苷酸序列功能的方法，所述核苷酸
序列含有序列5’-(GNN)n-3’，其中n为1-6的整数，所述方法包括所述
核苷酸序列暴露于有效量的本发明组合物，该组合物与一种或多种转
录调节因子有效连接。5’-(GNN)n-3’序列可见于所述核苷酸的转录区
或启动子区或见于表达的序列标记。

本发明公开的内容证实简单有效的快速产生基因开关的通用策
略。构建并特征鉴定特异性识别新的9-bp序列或者18-bp(首次)序列
的多指蛋白，该多指蛋白含有一系列识别64成员锌指表的5’-
(GNN)n-3’亚组序列的已知锌指结构域。制备并证实有效的转录因子既
控制基因活化又控制基因抑制。采用单纯疱疹病毒VP16活化域
(Sadowski，I.，Ma，J.，Triezenberg，S.& Ptashne，M.(1988)Nature 335，
563-564)和其基本活化域的重组四聚体重复实现基因活化。采用以下3
个人源效应子域可实现基因阻抑或沉默：krüppel结合盒
(KRAB)(Margolin，J.F.，Friedman，J.R.，Meyer，W.，K.-H.，Vissing，H.，
Thiesen，H.-J.& Rauscher III，F.J.(1994)Proc.Natl.Acad.Sci.USA 91，
4509-4513)、ERF阻抑结构域(ERD)(Sgouras，D.N.，Athanasiou，M.A，
Beal，G.J.，Jr.，Fisher，R.J.，Blair，D.G.& Mavrothalassitis，G.J.(1995)
EMBO J.14，4781-4793)和mSIN3相互作用结构域(SID)(Ayer，D.E.，
Laherty，C.D.，Lawrence，Q.A.，Armstrong，A.P.& Eisenman，R.N.
(1996)Mol.Cell.Biol.16，5772-5781)。在人上皮细胞中利用荧光素酶报
道基因测定，数据表明设计用于靶向原癌基因erbB-2/HER-2的启动子
的人工转录调节剂可以特异性方式消除或激活基因表达。通过对基因
转录物的寻靶首次实现基因活化或抑制，说明从表达的序列标记(EST)
获得的信息足以构建基因开关。本文所述的新方法和材料有希望在基
因治疗、转基因生物、功能基因组学(functional genomics)以及细胞生物
学和分子生物学的其它领域具有各种用途。

附图简述

在构成本说明书的一部分的附图中，

图1(以6个为一组显示)显示本发明锌指-核苷酸结合多肽各区的
结合特异性。

发明详述
I.发明

本发明提供锌指-核苷酸结合多肽、含有一种或多种这种多肽的组
合物以及应用这种多肽和组合物调节基因表达。
II.化合物

本发明化合物是分离的锌指-核苷酸结合多肽，该多肽结合 GNN
核苷酸序列并调节所述核苷酸序列的功能。所述多肽可增强或抑制基
因转录并可结合到DNA或RNA。锌指-核苷酸结合多肽是指衍生形式
的野生型锌指蛋白多肽或重组产生的锌指蛋白多肽。多肽可以是一种
杂种多肽，例如它含有一种蛋白的锌指结构域和与其连接的第二种蛋
白的锌指结构域。所述结构域可以是野生型或突变型结构域。多肽包
括截短形式的野生型锌指蛋白。可由其产生多肽的锌指蛋白实例包括
TFIIIA和zif268。

本发明锌指-核苷酸结合多肽在所述多肽的α螺旋结构域中含有
一个独特的七聚体(7个氨基酸残基的连续序列)，该七聚体序列决定与
靶核苷酸的结合特异性。该七聚体序列可位于α螺旋结构域的任何位
置，但是按本领域常规残基编码所述七聚体优选从位置-1延伸至位置
6。本发明多肽可包括本领域已知的任何β折叠和构架序列以构成锌指
蛋白的一部分。制备了许多锌指-核苷酸结合多肽并测试了它们对含有
GNN三联体的靶核苷酸的结合特异性。研究结果总结于图1。在图1
中，右侧栏表示每种肽的GNN三联体结合特异性，最高的特异性列
于第一个并以粗体表示。在图1中，括号内表示SEQ ID NO。对于每
种具体GNN(例如示于图1右侧栏的 GAA)靶，所述序列按与所述三
联体的特异性降低的顺序排列。

如图1所示，所述数据表明，实际上在特定靶的所有克隆中观测
到明显保守的全部3个主要DNA接触位置(-1，3和6)。尽管以前选择
小得多的全文库后在这些位置上观测到其中许多残基，但是本文所观
测到保守程度明显高于以前的研究(Choo，Y.& Klug，A.(1994)Proc
Natl Acad Sci USA 91，11163-7，Greisman，H.A.& Pabo，C.O.(1997)
Science(Wahington，D.C.)275，657-661，Rebar，E.J.& Pabo，C.O.
(1994)Science(Washington，D.C.，1883-)263，671-3，Jamieson，A.C.，
Kim，S.-H.& Wells，J.A.(1994)Biochemistry 33，5689-5695，Jamieson，A.
C.，Wang，H.& Kim，S.-H.(1996)PNAS 93，12834-12839，Wu，H.，Yang，
W.-P.& Barbas III，C.F.(1995)PNAS 92，344-348)。本发明揭示，锌指
结构域的-1、3和6的3个螺旋位置足以详细描述所述结构域的DNA
结合特异性的现有技术的观点是不正确的。

已经证实噬菌体选择通常只在这些位置中的1个或2个位置显示
共有选择。最大序列变异发生于位置1和5的残基，所述残基不会在
Zif268/DNA结构中产生碱基接触，而且以前预期它们并不明显协助识
别(Pavletich，N.P.& Pabo，C.O.(1991)Science(Washington，D.C.，
1883-)252，809-17，Elrod-Erickson，M.，Rould，M.A.，Nekludova，L.&
Pabo，C.O.(1996)Structure(London)4，1171-1180)。位置1和5的变异
还预示着，其它位置的保守性是因为其与所述DNA的相互作用而不是
简单地因为其它原因所引起的偶然性扩增单一克隆所致。还观测到位
置2的保守性残基同一性。位置-2的保守作用多少有点人为原因；
NNK文库的该残基恒定为丝氨酸。该残基在Zif268结构中与DNA主
链接触。两个文库均在位置4含有恒定的亮氨酸，亮氨酸是稳定该结
构域折叠的疏水核心中的一个重要残基。

给人们留下深刻印象的是，观测到保守氨基酸识别不同靶的相同
的核苷酸。例如实际上总是选择位置3的Asn(Asn3)识别中间位置的
腺嘌呤，无论是在GAG、GAA、GAT还是在GAC的序列中。无论
邻近位置如何，总是分别选择Gln-1和Arg-1识别3’位置的腺嘌呤或
鸟嘌呤。大量结构研究文献证明Gln或Asn是以酰胺侧链为基础识别
腺嘌呤，同样识别鸟嘌呤的Arg胍侧链接触3’或5’鸟嘌呤(Elrod-
Erickson，M.，Benson，T.E.& Pabo，C.O.(1998)Structure (London)6，
451-464，Kim，C.A.& Berg，J.M.(1996)Nature Structural Biology 3，
940-945.，Fairall，L.，Schwabe，J.W.R.，Chapman，L.，Finch，J.T.&
Rhodes，D.(1993)Nature (London)366，483-7)。然而更常见的是，选择
2个或3个氨基酸识别核苷酸。选择His3或Lys3(在较低程度上为Gly3)
识别中间的鸟嘌呤。选择Ser3和Ala3识别中间的胸腺嘧啶。选择
Thr3、Asp3和Glu3识别中间的胞嘧啶。在位置-1选择Asp和Glu识
别3’胞嘧啶，而选择Thr-1和Ser-1识别3’胸腺嘧啶。

将选定的Zif268变异体亚克隆入细菌表达载体，而且过量表达所
述蛋白(锌指-2蛋白，此后用淘选它们的亚位点表示)。重要的是研究
可溶性蛋白而不是噬菌体融合蛋白，因为已知这两种蛋白在其结合特
性方面可能明显不同(Crameri，A.，Cwirla，S.& Stemmer，W.P.(1996)
Nat.Med.2，100-102)。使用多靶ELISA测定方法测试所述蛋白识别16
个5’-GNN-3’锌指-2亚位点中每一个的能力。该测定法提供极其严格
的特异性测试，因为总是存在6个“非特异性”位点，它们只是由于9
核苷酸靶中的一个核苷酸而不同于所述“特异性”位点。许多噬菌体
选择的锌指-2蛋白具有高度特异性，而其它蛋白显示不同程度的交叉
反应性。某些多肽实际上与亚位点结合更佳，而不是选定的位点。

试图利用定点诱变修饰识别螺旋以提高结合特异性。用我们的选
择数据和结构资料指导突变设计。作为迄今进行的最全面的研究，对
100多个突变蛋白进行了特征鉴定，试图努力增强我们对DNA识别规
律的认识。尽管预测螺旋位置1和5在DNA识别中不起直接作用，但
是最好的特异性改善总是涉及这些位置的修饰。观测到这些残基与磷
酸主链接触，以非序列特异性方式产生结合。去除非特异性接触提高
特异性接触对所述复合物总体稳定性的重要性，由此增强特异性。例
如，用较小的不带电荷残基取代位置1和5的非典型电荷残基就可提
高多肽与靶三联体GAC、GAA和GAG的特异性。

另一类修饰涉及同时改变结合残基和非结合残基。通过修饰
His3Lys和Thr5Val消除多肽与GGG和锌指-2亚位点GAG的交叉反
应性。值得注意的是，淘选期间一致选择His3识别中间的鸟嘌呤，即
使Lys3更好地区别A和G。提示该蛋白的淘选条件可能通过参数如
亲和力较通过特异性选择更佳。在Zif268结构中，His3与中间鸟嘌呤
的N7产生一个氢键(Pavletich，N.P.& Pabo，C.O.(1991)Science
(Washington，D.C.，1883-)252，809-17，Elrod-Erickson，M.，Rould，M.A.，
Nekludova，L.& Pabo，C.O.(1996)Structure (London)4，1171-1180)。也
可以与腺嘌呤的N7产生此氢键，而且实际上Zif268不能区别该位置
的G和A(Swirnoff，A.H.& Milbrandt，J.(1995)Mol.Cell.Biol.15，
2275-87)。在靶向GGA，GGC和GGT的多肽中，发现His3只指定中
间的鸟嘌呤，虽然淘选GGC和GGT时选择Lys3。同样，通过修饰
LyslSer和Ser3Glu降低靶向GTG的多肽的多重交叉反应性，使亲和
力降低5倍。已经在Zif268的结合位点选择研究中证实，Glu3与胞嘧
啶的特异性非常高(Swirnoff，A.H.& Milbrandt，J.(1995)Mol.Cell.Biol.
15，2275-87)。没有结构研究表明Glu3与中间胸腺嘧啶相互作用，在我
们的研究或任何其它研究中从未选择Glu3识别中间的胸腺嘧啶(Choo，
Y.& Klug，A.(1994)Proc Natl Acad Sci USA 91，11163-7，Greisman，H.
A.& Pabo，C.O.(1997)Science(Washigton，D.C.)275，657-661，Rebar，
E.J.& Pabo，C.O.(1994)Science(Washington，D.C.，1883-)263，671-3，
Jamieson，A.C.，Kim，S.-H.& Wells，J.A.(1994)Biochemistry 33，5689-
5695，Jamieson，A.C.，Wang，H.& Kim，S.-H.(1996)PNAS 93，12834-
12839，Isalan，M.，Klug，A.& Choo，Y.(1998)Biochemistry 37，12026-33，
Wu，H.，Yang，W.-P.& Barbas III，C.F.(1995)PNAS 92，344-348)。尽管
如此，Ser3Glu修饰有利于识别中间胸腺嘧啶而不是胞嘧啶。这些实
例说明了依赖以前的结构和选择数据了解构成特异性的基础的结构因
素的局限性。还应该强调的是，不能通过现有的“识别密码”预测涉
及位置1和5的修饰性改进(Desjarlais，J.R.& Berg，J.M.(1992)Proc
Natl Acad Sci USA 89，7345-9.Suzuki，M.，Gerstein，M.& Yagi，N.(1994)
Nucleic Acids Res.22，3397-405，Choo，Y.& Klug，A.(1994)Proc.Natl.
Acad.Sci.U.S.A.91，11168-72，Choo，Y.& Klug，A.(1997)Curr.Opin.
Struct.Biol.7，117-125)，所述“识别密码”通常只考虑位置-1、2、3
和6。只有通过联合选择和定点诱变，我们才能开始充分了解锌指
/DNA识别的复杂性。

从选择和诱变组合的资料来看，对多数核苷酸的特异性识别最好
利用基元而不是一个氨基酸完成。例如联合采用Arg-1、Ser1和Asp2
(RSD基元)可实现对3’鸟嘌呤的最佳指定。通过利用Val5和Arg6指
定5’鸟嘌呤，可用仅在3位残基不同(Lys3与GGG、Asn3与GAG、
Glu3与GTG以及Asp3与GGG)的通用螺旋结构(SRSD-X-LVR)实现对
亚位点GGG、GAG、GTG和GCG的识别。同样，用最终克隆的
Thr-1、Ser1和Gly2(TSG基元)指定3’胸腺嘧啶。此外，可用Asp-1、
Pro1和Gly2(DPG基元)指定3’胞嘧啶，除亚位点为GCC外；该亚位
点不能接受Pro1。在2个克隆中用Gln-1、Ser1、Ser2(QSS基元)
指定3’腺嘌呤。研究所述基元位置1和2的残基与各3’碱基的关系，
如本文所述发现它们对特定3’碱基提供最佳特异性。

多靶ELISA测定法假定，所有蛋白优选5’位置的鸟嘌呤，因为所
有蛋白含有Arg6，而且由结构研究已知该残基接触该位置的鸟嘌呤
(Pavletich，N.P.& Pabo，C.O.(1991)Science(Washington，D.C.，1883-)
252，809-17，Elrod-Erickson，M.，Rould，M.A.，Nekludova，L.& Pabo，C.
O.(1996)Structure (London)4，1171-1180，Elrod-Erickson，M.，Benson，T.
E.& Pabo，C.O.(1998)Structure (London)6，451-464，Kim，C.A.&
Berg，J.M.(1996)Nature Structural Biology 3，940-945，Pavletich，N.P.
& Pabo，C.O.(1993)Science(Washington，D.C，1883-)261，1701-7，
Houbaviy，H.B.，Usheva，A.，Shenk，T.& Burley，S.K.(1996)Proc Natl
Acad Sci USA 93，13577-82，Fairall，L.，Schwabe，J.W.R.，Chapman，L.，
Finch，J.T.& Rhodes，D.(1993)Nature (London)366，483-7，Wuttke，D.
S.，Foster，M.P.，Case，D.A.，Gottesfeld，J.M.& Wright，P.E.(1997)，
Mol.Biol.273，183-206，Nolte，R.T.，Conlin，R.M.，Harrison，S.C.&
Brown，R.S.(1998)Proc.Natl.Acad.Sci.U.S.A.95，2938-2943)。本文利
用5’结合位点特征测定证实该相互作用((Choo，Y.& Klug，A.(1994)
Proc.Natl.Acad.Sci.U.S.A.91，11168-72)；图2，白色条框)。将每种蛋
白用于16种寡核苷酸靶的合并物，其中锌指-2亚位点的5’核苷酸固定
为G、A、T或C，中间核苷酸和3’核苷酸是随机的。所有蛋白优
选GNN合并物，基本上无交叉反应。

纯化蛋白的亲和力研究证实多靶ELISA测定的结果。如果交叉反
应性在ELISA测定中最小，则单个核苷酸错配通常导致亲和力降低100
倍以上。还需要用锌指蛋白证实特异性的此程度。一般来说，选择或
设计结合中间位置和3’位置含有G或A的亚位点的蛋白的亲和力最
高，其次为结合在中间位置或3’位置只有一个G或A的亚位点的蛋
白，再次为结合仅含有T或C的亚位点的蛋白。前面一组与其靶的亲
和力较Zif268高(10nM)，后一组与其靶的亲和力多少有点降低，而且
几乎所有蛋白的亲和力低于亲代C7蛋白的亲和力。结合亲和力和结
合特异性并没有相关性，说明特异性不仅源自特异性蛋白-DNA接触，
而且源自仅包括正确核苷酸的相互作用。

在靶亚位点为GNG的所有蛋白中，Asp2总是与Arg-1共选择。
现在应该知道的是，对此存在2个原因。根据对Zif268的结构研究
(Pavletich，N.P.& Pabo，C.O.(1991)Science(Washington，D.C.，1883-)
252，809-17，Elrod-Erickson，M.，Rould，M.A.，Nekludova，L.& Pabo，C.
O.(1996)Structure (London)4，1171-1180)，已知锌指2的Asp2与Arg-1
产生一对支柱性氢键以及一定的水性接触，所述氢键稳定Arg-1/3’鸟
嘌呤相互作用。然而，Asp2的羧酸盐还与胞嘧啶的N4产生一个氢
键，所述胞嘧啶与锌指-1亚位点的5’鸟嘌呤进行碱基配对。与该位置
的T配对的腺嘌呤碱基可产生针对胞嘧啶观测到的类似接触。这种相
互作用特别重要，因为它使锌指2的识别亚位点从3个核苷酸(GNG)
扩展为4个核苷酸(GNG(G/T))(Isalan，M.，Choo，Y.& Klug，A.(1997)
Proc.Natl.Acad.Sci.U.S.A.94，5617-5621.，Jamieson，A.C.，Wang，H.&
Kim，S.-H.(1996)PNAS 93，12834-12839，Isalan，M.，Klug，A.& Choo Y.
(1998)Biohemistry 37，12026-33)。这种现象称为“靶位点重叠”，而
且具有3个重要结果。首先，因为我们的锌指-1亚位点含有5’鸟嘌呤，
所以当锌指-2亚位点为GNG时，选择我们的文库优选Asp2。第二，
它可限制在该研究中使用的文库用于对GNN或TNN锌指-2亚位点的
选择，因为这些文库的指3含有一个Asp2，它可帮助指定锌指-25’
核苷酸为G或T。在指2含有Thr6的Zif268和C7中，指3的Asp2
增强识别5’位置(T/G)GG的对G或T的识别。这种相互作用还可以解
释为什么以前的噬菌体展示研究(都使用基于Zif268的文库)发现选择
主要限于GNN识别(Choo，Y.& Klug，A.(1994)Proc Natl Acad Sci USA
91，11163-7.，Rebar，E.J.& Pabo，C.O.(1994)Science(Washington，D.
C.，1883-)263，671-3，Jamieson，A.C.，Kin，S.-H & Wells，J.A.(1994)
Biochemistry 33，5689-5695，Jamieson，A.C.，Wang，H.& Kim，S.-H.
(1996)PNAS 93，12834-12839，Isalan，M.，Klug，A.& Choo，Y.(1998)
Biochemistry 37，12026-33，Wu，H.，Yang，W.-P & Barbas III，C.F.(1995)
PNAS 92，344-348)。

最后，靶位点重叠潜在地限制这些锌指用作模块构件(modular
building blocks)。由结构资料已知，存在其中靶位点重叠非常广泛的某
些锌指，例如GLI和YY1中的锌指以及类似于Zif268而且仅具有中
度重叠的其它锌指。在我们的最后一组蛋白中，结合GGG、GAG、
GTG和GCG的多肽中发现Asp2。见于位置2的其它残基的重叠潜力
大部分是未知的，然而结构研究提示，见于该位置的其它许多残基可
能参与这样的亚位点交叉的接触。含有Asp2的指可能限制模块性，因
为它们要求每个GNG亚位点后为T或G。

下表1总结了对GNN靶三联体16个实施方案具有最高选择性的
序列(SEQ ID NO；1-16)。
表1
      靶
    特异性
             氨基酸位置
           -1 1 2 3 4 5 6
   SEQ ID NO：

    GAA
            Q S S N L V R
      1
    GAC
            D P G N L V R
      2
    GAG
            R S D N L V R
      3
    GAT
            T S G N L V R
      4
    GCA
            Q S G D L R R
      5
    GCC
            D C R D L A R
      6
    GCG
            R S D D L V K
      7
    GCT
            T S G E L V R
      8
    GGA
            Q R A H L E R
      9
    GGC
            D P G H L V R
      10
    GGG
            R S D K L V R
      11
    GGT
            T S G H L V R
      12
    GTA
            Q S S S L V R
      13
    GTC
            D P G A L V R
      14
    GTG
            R S D E L V R
      15
    GTT
            T S G S L V R
      16

上表数据显示，锌指结构域能够以精确特异性识别所有可能的
GNN三联体序列。优化的锌指结构域能够通过亲和力降低100倍以上
区别单个碱基不同。尽管见于优化蛋白的关键接触位置-1、3和6的
许多氨基酸是与简单识别密码一致的氨基酸，但是发现优化的特异性
识别对这些残基的邻近位置残基敏感。发现位置1、2和5的残基对
特异性识别是重要的。此外，所述数据首次证实，对3’碱基的高度特
异性识别要求位置-1、1和2的序列基元而不是位置1残基的简单相
同。这些残基可能为所述螺旋在识别特异性碱基和排除其它碱基方面
的相互作用提供合适的立体化学环境，最终结果是高度特异性的相互
作用。如果这些结构域在其与DNA和其它锌指结构域相互作用中是模
块式的，则它们具有广泛的用途。利用靶位点重叠的可能限制作用可
达到此目的，即应该靶向5’-(GNN)n-3’型序列。此外，所公开的结构
域的现成重组可产生具有已知特异性的多指蛋白，而不需要在其制备
中产生噬菌体展示文库。这些多指蛋白已用于激活和阻抑人erbB-2启
动子在活细胞中驱动的转录。本文所述锌指结构域家族可能足以构建
166或17×106种结合5’-(GNN)6-3’型DNA序列的新型蛋白。

通过截短或延长野生型锌指蛋白，或通过定点诱变作为野生型衍
生多肽的变异体或组合上述程序以衍生或产生锌指-核苷酸结合多肽
衍生物。术语“截短的”是指含有的锌指数少于天然锌指结合蛋白总
锌指数的锌指-核苷酸结合多肽或缺失非需要序列的锌指-核苷酸结合
多肽。例如天然TFIIIA含有9个锌指，截短的锌指-核苷酸结合蛋白
TFIIIA可以为只有1-3个锌指的多肽。延长是指其上加有额外锌指模
块的锌指多肽。例如TFIIIA可以通过添加3个锌指结构域扩展至12
个指。此外，截短的锌指-核苷酸结合多肽可以含有一个以上的野生型
多肽的锌指模块，因此产生“杂种”锌指-核苷酸结合多肽。

术语“诱变的”是指利用任何已知方法对编码所述蛋白的DNA
进行的随机或定点诱变获得的锌指衍生的核苷酸结合多肽。例如可对
TFIIIA进行诱变以取代一个或多个重复共有序列的非保守残基。也可
以诱变截短的锌指-核苷酸结合蛋白。

可以按照本发明截短、延长和/或诱变以抑制含有锌指-核苷酸结
合基元的核苷酸序列的功能的已知锌指-核苷酸结合多肽的实例包括
TFIIIA和Zif268。其它锌指-核苷酸结合蛋白是本领域技术人员周知
的。

可用本领域周知的各种标准技术制备本发明多肽(参见例如1995
年1月18日提交的美国专利申请第08/676,318号，其全部内容通过引
用结合到本文中)。在有利于富集序列特异性蛋白的条件下制备并选择
锌指蛋白的噬菌体展示文库。识别许多序列的锌指结构域需要噬菌体
选择资料和结构信息指导的定点诱变进行精确定位(refinement)。

鼠Cys2-His2锌指蛋白Zif268用于构建噬菌体展示文库(Wu，H.，
Yang，W.-P.& Barbas III，C.F.(1995)PNAS 92，344-348)。Zif268是在
结构上最充分特征鉴定的锌指蛋白(Pavletich，N.P.& Pabo，C.O.(1991)
Science(Washinton，D.C.，1883-)252，809-17，Elrod-Erickson，M.，Rould，
M.A.，Nekludova，L.& Pabo，C.O.(1996)Structure (London)4，1171-
1180，Swirnoff，A.H.& Milbrandt，J.(1995)Mol.Cell.Biol.15，2275-
87)。主要接触所述DNA的单链上的3个核苷酸的α螺旋N末端残基
介导该蛋白3个锌指结构域中每个结构域的DNA识别。该3指蛋白的
操纵基因结合位点(operator binding site)是5’-GCGTGGGCG-3’(下划线
是指-2亚位点)。Zif268和其它相关锌指-DNA复合物的结构研究
(Elrod-Erickson，M.，Benson，T.E.& Pabo，C.O.(1998)Structure
(London)6，451-464，Kim，C.A.& Berg，J.M.(1996)Nature Structural
Biology 3，940-945，Pavletich，N.P.& Pabo，C.O.(1993) Science
(Washington，D.C.，1883-)261，1701-7，Houbaviy，H.B.，Usheva，A.，
Shenk，T.& Burley，S.K.(1996)Proc Natl Acad Sci USA 93，13577-82，
Fairall，L.，Schwabe，J.W.R.，Chapman，L.，Finch，J.T.& Rhodes，D.
(1993)Nature (London)366，483-7，Wuttke，D.S.，Foster，M.P.，Case，D.
A.，Gottesfeld，J.M.& Wright，P.E.(1997)J.Mol. Biol.273，183-206.，
Nolte，R.T.，Conlin，R.M.，Harrison，S.C.& Brown，R.S.(1998)Proc.
Natl.Acad.Sci.U.S.A.95，2938-2943，Narayan，V.A.，Kriwacki，R.W.&
Caradonna，J.P.(1997)J.Biol.Chem.272，7801-7809)表明，α螺旋3个
主要位置-1、3和6的残基参与特异性碱基接触。通常α螺旋位置-1
的残基接触所述指亚位点的3’碱基，而位置3和6的残基分别接触中
间的碱基和5’碱基。

为了选择识别5’-GNN-3’亚组序列的一系列锌指结构域，以噬菌
体展示载体pComb3H构建2个高度不同的锌指文库(Barbas III，C.F.，
Kang，A.S.，Lemer，R.A.& Benkovic，S.J.(1991)Proc.Natl.Acad.Sci.
USA 88，7978-7982.，Rader，C.& Barbas III，C.F.(1997)Curr.Opin.
Biotechnol.8，503-508)。2个文库均涉及Zif268变异体C7指2的α螺
旋中的残基随机化作用(Wu，H.，Yang，W.-P.& Barbas III，C.F.(1995)
PNAS 92，344-348)。用NNK掺杂策略通过随机化位置-1、1、2、3、
5、6构建文库1，而采用随机化位置-2、-1、1、2、3、5、6
的VNS掺杂策略构建文库2。NNK掺杂策略允许所有氨基酸组合在
32个密码子中，而VNS策略在其24个密码子组中排除了Tyr、Phe、
Cys和所有终止密码子。所述文库分别包括4.4×109和3.5×109成
员，每个文库均能识别5’-GCGNNNGCG-3’型序列。NNK文库的大小
保证它能够以99％置信度进行研究，而VNS文库高度多样性，但是多
少有点不完整。然而这些文库明显大于以前报道的锌指文库(Choo，Y.
& Klug，A.(1994)Proc Natl Acad Sci USA 91，11163-7，Greisman，H.A.
& Pabo，C.O.(1997)Science(Washington，D.C.)275，657-661，Rebar，E.
J.& Pabo，C.O.(1994)Science(Washington，D.C.，1883-)263，671-3，
Jamieson，A.C.，Kim，S.-H.& Wells，J.A.(1994)Biochemistry 33，5689-
5695，Jamieson，A.C.，Wang，H.& Kim，S.-H.(1996)PNAS 93，12834-
12839，Isalan，M.，Klug，A.& Choo，Y.(1998)Biochemiry 37，12026-
33)。用溶液结合方案以16个5’-GCGGNNGCG-3’生物素化发夹DNA
靶对锌指展示-噬菌体进行7轮选择。通过加入竞争DNA增加每轮的
严格性。提供剪切的鲱鱼精子DNA，以对与DNA非特异性结合的噬
菌体进行选择。通过提供5’-GCGNNNGCG-3’型DNA作特异性竞争物
获得序列特异性的严格选择压力。加入过量的5’-GCGGNNGCG-3’型
DNA以对一个或两个碱基改变的DNA的结合提供更严格的选择，与
生物素化靶相比。用链霉抗生物素蛋白包被珠回收结合单个生物素化
DNA靶序列的噬菌体。在某些情况下重复所述选择过程。本发明资料
表明，这些结构域是功能模块，而且可与另一个模块重组产生多指蛋
白，所述多指蛋白能够能够以亚纳摩尔亲和力结合18-bp序列。本文
所述锌指结构域家族足以构建17×106结合5’-(GNN)6-3’DNA序列家
族的新型蛋白。

本发明包括编码锌指-核苷酸结合多肽的核苷酸序列。可以通过几
种方法获得编码本发明锌指-核苷酸结合多肽(包括天然、截短和延长
的多肽)的DNA序列。例如可用本领域周知的杂交方法分离所述
DNA。所述方法包括但不限于：(1)用探针与基因组文库或cDNA文
库杂交，检测共有的核苷酸序列；(2)用抗体筛选表达文库，检测共
同结构特征；和(3)用聚合酶链反应(PCR)合成。可用本领域已知的方
法获得本发明的RNA序列(参见例如Current Protocols in Molecular
Biology，Ausubel等编辑，1989)。

用以下方法可获得编码本发明的锌指-核苷酸结合多肽的特异性
DNA序列：(1)从基因组DNA分离双链DNA序列；(2)化学制备提
供目的多肽必需密码子的DNA序列；和(3)通过对分离自真核供体细
胞的mRNA进行逆转录，体外合成双链DNA序列。在后一种情况下，
最后制得mRNA的双链DNA互补物，一般称为cDNA。在制备用于
重组方法的特异性DNA序列的这3种方法中，最少用分离基因组
DNA。当因为存在内含子最好是微生物表达哺乳动物多肽时，尤其如
此。

为了获得锌指衍生-DNA结合多肽，当已知目的多肽产物的完整
氨基酸残基序列时，通常合成DNA序列是优选方法。当目的多肽的完
整氨基酸残基序列未知时，直接合成DNA序列是不可能的，优选方法
是制备cDNA序列。分离目的cDNA序列的标准方法有制备质粒携带
的cDNA文库，反转录mRNA获得cDNA文库，所述mRNA在高水
平遗传表达的供体细胞中是丰余的。当联合使用聚合酶链反应技术
时，甚至可以克隆表达极少的产物。在已知所述多肽氨基酸序列的重
要部分时，在对变性为单链形式的克隆拷贝cDNA进行DNA/DNA杂
交方法中，可制备标记的单链或双链DNA或RNA探针序列，该探针
序列与推测存在于靶cDNA中的序列相同(Jay等，Nucleic Acid
Research 11：2325，1983)。

另一方面，本发明提供的包含治疗有效量锌指-核苷酸结合多肽或
治疗有效量编码锌指-核苷酸结合多肽的核苷酸序列和药学上可接受
的载体的药用组合物。

本文使用的术语“药学上可接受的”、“生理上可耐受的”及其
符合语法规则的不同表述，当它们是指组合物、载体、稀释剂和试剂
时，它们可以交换使用，而且表示所述物质可以给予人类或而不会产
生妨碍给予所述组合物程度的不需要的生理作用，例如恶心、头晕、
肠胃不适等。

含有溶解或分散其中的活性成分的药用组合物制剂是本领域周
知的。通常这类组合物制成可无菌注射的液体溶液或悬浮液、水溶液
或非水溶液，也可制成适用于使用前配制成溶液或悬浮液、液体的固
体形式。所述制剂也可以是乳化制剂。

以适用于本文所述治疗法的量将所述活性成分与赋形剂混合，所
述赋形剂是药学上可接受的而且与所述活性成分亲和。合适的赋形剂
例如水、盐水、葡萄糖、甘油、乙醇等以及它们的组合。此外，如果
需要的话，所述组合物可以含有少量辅助物质，例如湿润剂或乳化剂，
以及增强所述活性成分疗效的pH缓冲剂等。

本发明治疗性药用组合物可以包含其中组分的药学上可接受的
盐。药学上可接受的盐包括与无机酸(例如盐酸或磷酸)或有机酸(例如
乙酸、酒石酸、扁桃酸等)形成的酸加成盐(与所述多肽的游离氨基形
成)。与游离羧基形成的盐也可以衍生自无机碱，例如氢氧化钠、氢氧
化钾、氢氧化铵、氢氧化钙或氢氧化铁，以及也可以衍生自有机碱，
例如异丙胺、三甲胺、2-乙氨基乙醇、组氨酸、普鲁卡因等。

生理学上耐受的载体是本领域周知的。典型的液体载体为无菌水
溶液，除了所述活性成分和水之外它不含任何其它物质，或者它含有
生理pH的缓冲剂，例如磷酸钠或生理盐水或此二者如磷酸缓冲盐溶
液。水溶液载体还可以含有一种以上的缓冲盐以及盐，例如氯化钠和
氯化钾、葡萄糖、丙二醇、聚乙二醇以及其它溶质。液体组合物除了
水相之外还可以含有液体相。这样的其它典型液体相为甘油、植物油
如棉籽油、有机酯如油酸乙酯以及水-油乳液。
III。组合物

另一方面，本发明提供多种锌指-核苷酸结合多肽，其有效结合方
式使得可以特异性结合定义为5’-(GNN)n-3’的核苷酸靶基元，其中n
是大于1的整数。最好n是2至6左右的整数。

下文的实施例和1995年1月18日提交的美国专利申请第
08/676，318号描述了锌指-核苷酸结合多肽的连接方法。优选用寡肽接
头连接各个多肽。这样的接头最好类似于见于天然锌指蛋白的接头。
用于本发明的优选接头为氨基酸残基序列TGEKP(SEQ ID NO：111)。

为了检测制备这样的组合物及其用于基因控制的效能，选择人
erbB-2基因作模型。特异性识别该基因5’非翻译区的18bp序列的多指
蛋白与KRAB、ERD或SID阻抑结构域融合转化为转录阻抑物。通
过与单纯疱疹VP16激活结构域或称为VP64的VP16基本激活结构域
的四聚体重复融合制备转录激活物。该资料首次表明，使设计蛋白导
向基因转录区的单一位点可以实现基因阻抑和基因活化。

选择人类erbB-2基因作为模型靶，以开发锌指为基础的转录开
关。ErbB受体家族成员在人类恶性肿瘤发生中起作重要的作用。具体
来说，在多个部位(包括乳腺、卵巢、肺、胃和唾液腺)发病率高的人
类腺癌中，由于基因扩增和/或转录失调引起erbB-2过量表达(Hynes，N.
E.& Stern，D.F.(1994)Biochim.Biophys.Acta 1198，165-184)。ErbB-2
的表达增加导致组成型激活其固有的酪氨酸激酶，而且已经证实
erbB-2表达增加使培养细胞转化。许多临床研究表明，患有ErbB-2表
达水平增高的肿瘤的患者的预后较差(Hynes，N.E.& Stern，D.F.(1994)
Biochim.Biophys.Acta 1198，165-184)。erbB-2除了涉及人类癌症之
外，它在成年哺乳动物以及哺乳动物胚胎发育中均起作重要的生物学
作用(Hynes，N.E.& Stern，D.F.(1994)Biochim.Biophys.Acta 1198，
165-184，Altiok，N.，Bessereau，J.-L.& Changeux，J.-P.(1995)EMBO J.
14，4258-4266，Lee，K.-F.，Simon，H.，Chen，H.，Bates，B.，Hung，M.-C.&
Hauser，C.(1995)Nature 378，394-398)。

所以erbB-2启动子是开发人工转录调节物的有趣实验案例。已经
详细特征鉴定了该启动子，并证实它较复杂，它含有TATA依赖性和
TATA非依赖性转录起始位点(Ishii，S.，Imamoto，F.，Yamanashi，Y.，
Toyoshima，K.& Yamamoto，T.(1987)Proc.Natl.Acad.Sci.USA 84，
4374-4378)。尽管早期的研究表明多指蛋白可用作特异性激活或抑制
转录的转录调节物，但是这些蛋白结合人工启动子上游至蛋白结合位
点的6个串联重复序列(Liu，Q.，Segal，D.J.，Ghiara，J.B.& Barbas III，C.
F.(1997)Proc.Natl.Acad.Sci.USA 94，5525-5530)。此外，该研究应用
其结合特异性未提高的多指蛋白。在本文中，我们测试了由预定构件
装配的多指蛋白结合天然erbB-2启动子单一位点的效能。如上所述制
备并特征鉴定结合16个5’-GNN-3’三联体中每一个的锌指结构域家
族。我们关注产生此识别结构域家族的一个原因是，大多数生物的启
动子区的碱基组成相对富含GC。因此，如果用这组明确的锌指结构
域易于装配成识别5’-(GNN)x-3’位点的蛋白，则能够快速并特异地对
许多基因进行调节。含有6个锌指结构域并识别18bp DNA的蛋白应
该足以界定所有已知基因组中的单一位置。erbB-2启动子区的检测显
示2个5’-(GNN)6-3’位点和1个5’-(GNN)9-3’位点。其中一个位点本文
鉴定为e2c，它属于erbB-2基因的5’非翻译区，将其选择为制备基因
特异性转录开关的靶位点。对GenBank数据库的BLAST序列相似性
检索证实，该序列是erbB-2独特序列。e2c靶序列位于2个主要转录
起始位点下游邻近区域，使得可以通过抑制转录起始或延长检测阻抑
作用。e2c靶位点的有趣特征是，它存在于一段短的序列中，该序列
在人类、大鼠和小鼠erbB-2基因之间是保守的(White，M.R.-A.& Hung，
M.-C.(1992)Oncogene 7，677-683)。所以，对该位点的寻靶使得可以在
用于人类疾病之前用动物模型研究此策略。

为了制备具有需要DNA-结合特异性的多指蛋白，本研究集中于
装配预定锌指结构域，它与Greisman和Pabo提出的序贯选择策略相
反(Greisman，H.A.& Pabo，C.O.(1997)Science 275，657-661)。这种策
略需要对各个需要蛋白序贯制备和选择6个锌指文库，使大多数实验
室无法利用这种实验方法而且极其费时。此外，因为在此策略中难以
应用特异性负选择以排除结合其它可选序列，所以可能产生相对非特
异的蛋白，见最近的报道(Kim，J.-S.& Pabo，C.O.(1997)J.Biol.Chem.
272，29795-29800)。

研究制备识别9bp DNA序列的3指蛋白的2种不同策略的一般
适用性。每个策略均以锌指结构域的模块性质为基础，而且利用识别
5’-GNN-3’三联体的锌指结构域家族。在第一个策略中，用PCR装配
策略将预定的指2(F2)结构域变异体融合在一起，从而制备识别5’-
(GNN)6-3’erbB-2靶位点e2c的半位点(HS)1和2的2种三指蛋白。为
了检测该方法的普遍性，用相同的方法制备3种另外的识别5’-
(GNN)3-3’型序列的三指蛋白。以与麦芽糖结合蛋白(MBP)的融合物制
备纯化锌指蛋白。ELISA分析提示，顺序连接的F2蛋白能够协调作
用以特异性识别需要的9-bp DNA靶序列。所示5种蛋白中的每种蛋
白能够区分靶和非靶5’-(GNN)3-3’序列。

通过电泳迁移率变动分析测定每种蛋白对其靶的亲和力。这些研
究证实所述锌指肽与Zif268和Kd值3-70nM的其它天然转录因子具
有相当的亲和力。在本文中，Zif268与其操纵基因的Kd是10nM。
必须注意的是，因为仍待解释的原因，一个研究小组报道天然Zif268
蛋白的Kd值范围为6nM-10 pM，有600倍的变化(Pavletich，N.P.&
Pabo，C.O.(1991)Science 252，809-17.，Greisman，H.A.& Pabo，C.O.
(1997)Science 275，657-661)。大多数研究报道Zif268-DNA相互作用的
Kd值为3-10nM，Choo，Y.& Klug，A.(1994)Proc.Natl.Acad.Sci.
USA 91，11163-11167，Hamilton，T.B.，Borel，F.& Romaniuk，P.J.(1998)
Biochemistry 37，2051-2058)。因此，为了比较本文报道的结果与其它
报道结果，应该比较相对Kds，即(突变体Kd)/(Zif268 Kd)，其中2个
值均来自相同报道。现有资料相对优于用噬菌体展示制备的新型三指
蛋白的其它研究，其中报道所述三指蛋白的亲和力比Zif268弱10-200
倍(Greisman，H.A.& Pabo，C.0.(1997)Science 275，657-661，Choo，Y.，
Sanchez-Garcia，I.& Klug，A(1994)Nature 372，642-5)。

在第二种策略中，作为顺序连接F2结构域变异体的替代方法，
通过“螺旋嫁接(helix grafting)”制备对2个e2c 5’-(GNN)3-3’半位点特
异性的三指蛋白。锌指结构域的构架残基，即那些支持识别螺旋形式
的残基在不同蛋白中是不同的。我们预测构架残基在亲和性和特异性
方面具有作用。为了嫁接螺旋，将DNA识别螺旋的位置-2到6的氨
基酸嫁接入Zif268(Pavletich，N.P.& Pabo，C.O.(1991)Science 252，
809-17)或Sp1C构架(Desjarlais，J.R.& Berg，J.M.(1993)Proc.Natl.
Acad.Sci.USA 90，2256-60)。Sp1C蛋白是设计的共有蛋白，其对螯合
剂的稳定性提高。通过基于PCR的快速基因装配策略制备DNA模板，
由此模板表达所述蛋白。在每种情况下，对MBP融合蛋白的ELISA
分析表明，保有用F2构架构建物观测到的DNA结合特异性和亲和
性。

如上所述，识别9bp DNA序列不足以指定复杂基因组中的独特
位点。相反，识别18bp连续DNA序列的6指蛋白能够确定人类基因
组中的单一位点，因此实现了产生基因特异性转录开关的重要先决条
件。通过简单的限制酶消化并用F2、Zif268和Sp1C构架模板DNA
克隆，由三指构建物制备结合erbB-2靶序列e2c的六指蛋白。对纯化
MBP融合蛋白的ELISA分析表明，各六指蛋白能够识别特异性靶序
列，与非靶5’-(GNN)6-3’位点或串联重复的Zif268靶位点几乎没有交
叉反应性。

用凝胶移位分析测定每种蛋白对e2c DNA靶位点的亲和性。用F2
构架构建的E2C(F2)六指蛋白观测到中等大小的Kd值25nM，仅为其
组成成分三指蛋白2-3倍。在我们先前对六指蛋白的研究中，我们观
测到六指蛋白对其DNA配体的亲和力与其三指组成成分相比，增强约
70倍(Lir，Q.，Segal，D.J.，Ghiara，J.B.& Barbas III，C.F.(1997)Proc.
Natl.Acad.Sci.USA 94，5525-5530)。E2C(F2)肽亲和力没有明显增加
提示串联连接的F2结构域不理想。可能六指蛋白的F2结构域周期性
在延长序列上与DNA的周期性不匹配，而且该蛋白的主要结合能部分
可能用于解旋DNA(Shi，Y.& Berg，J.M.(1996)Biochemistry 35，3845-
8)。与F2结构域蛋白相反，与其原三指蛋白组分相比，E2C(Zif)和
E2C(Sp1)六指蛋白的亲和力增加40-70倍，Kd值分别为1.6nM和0.5
nM。重要的是，这些蛋白的2个三指蛋白均参与结合，因为任何一个
半位点突变均导致亲和力降低约100倍。多数已知转录因子以纳摩尔
亲和力结合其特异性DNA配体，提示正常生存期的蛋白/DNA复合物
控制基因表达。因此，不需要亲和力增加的锌指蛋白，而且锌指蛋白
亲和力增加可能是不利的，尤其是还增加与非特异性DNA的结合时。

一般认为锌指结构域本质上是模块性的，每个锌指识别3-bp亚位
点(Pavletich，N.P.& Pabo，C.O.(1991)Science 252，809-17)。我们能够
重组锌指结构域成为任何需要序列，获得识别结构5’-(GNN)x-3’延长
序列的多指蛋白，就支持这种观点。然而，应该指出的是，至少在某
些情况下，锌指结构域似乎可指定重叠的4bp位点而不是单独的3bp
位点。在Zif268时，除了位于螺旋位置-1、3和6残基之外其它残基
也参与接触DNA(Elrod-Erickson，M.，Rould，M.A.，Nekludova，L.&
Pabo，C.O.(1996)Structure 4，1171-1180)。具体来说，F2的螺旋位置
2的天冬氨酸在识别中起作几种作用，并产生多种接触。天冬氨酸侧
链的羧基与位置-1的精氨酸形成氢键结合，稳定其与靶位点的3’-鸟嘌
呤的相互作用。该天冬氨酸还参加与鸟嘌呤的互补胞嘧啶的水介导性
接触。此外，观测到所述羧基直接接触指1结合位点5’-鸟嘌呤碱基的
互补链上胞嘧啶碱基的N4。正是这种相互作用形成靶位点重叠的化
学基础。事实上，对4个5’-GCG GNG GCG-3’序列选择Zif268 F2文
库时，得到位置-1为精氨酸，位置2为天冬氨酸，类似于天然Zif268
的残基。因为e2c靶序列(5’-GGG GCC GGA GCC GCA GTG-3’)(SEQ
ID NO：112)后面是A而不是G，所以预期对于e2c特异性六指蛋白的
指1存在潜在的靶位点重叠问题。但是在Zif-和Sp1C-构架的六指蛋白
中，根据其与靶位点e2c-a和e2c-g的亲和力非常相似指示，似乎在位
置2上含有天冬氨酸的GTG-特异性指1同样好地识别序列5’-GTGA-
3’和5’-GTGG-3’。

上述本发明多核苷酸或组合物能够与一种或多种转录调节因子
有效连接。调节因子例如转录激活物或转录抑制物或阻抑物是本领域
周知的。有效连接多肽与这类因子的方法也是本领域周知的。下文详
细讨论典型优选的这类因子及其调节基因表达的应用。
II.用途

在一个实施方案中，本发明方法包括调节(抑制)含锌指核苷酸结
合基元的核苷酸序列的作用的方法，该方法包括使锌指核苷酸结合基
元与有效量结合所述基元的锌指核苷酸结合多肽接触。在所述核苷酸
序列是启动子时，所述方法包括抑制转录反式激活含锌指-DNA结合
基元的启动子。术语“抑制”是指例如抑制与启动子有效连接的结构
基因的转录激活水平，所述启动子含有锌指-核苷酸结合基元。另外，
锌指-核苷酸结合多肽衍生物可结合结构基因或RNA序列中的基元。

术语“有效量”包括使先前激活的启动子失活的量或使含锌指-
核苷酸结合基元启动子失活的量，或阻断结构基因转录或RNA翻译的
量。锌指衍生-核苷酸结合多肽需要量为替代现成蛋白/启动子复合物中
的天然锌指-核苷酸结合蛋白的必需量，或与天然锌指-核苷酸结合蛋
白竞争而本身与启动子形成复合物的必需量。同样，阻断结构基因或
RNA的需要量分别为结合并阻止RNA聚合酶从所述基因阅读的量或
抑制翻译的量。所述方法最好在细胞内进行。通过功能性失活启动子
或结构基因抑制转录或翻译。通过本文所述的机理之一例如逆转录病
毒载体或脂质体、或本领域周知的其它方法能够传递有效量抑制蛋
白，使其结合或“接触”含锌指-核苷酸结合蛋白基元的细胞核苷酸序
列。

术语“调节”是指抑制、增强或诱导一种功能。例如本发明的锌
指-核苷酸结合多肽可通过结合启动子内的基元，因此增强或抑制与该
启动子核苷酸序列有效连接的基因转录，从而调节启动子序列。或者
调节可以包括抑制基因转录，其中锌指-核苷酸结合多肽结合结构基
因，并阻止DNA依赖性RNA聚合酶从该基因开始阅读，由此抑制基
因转录。结构基因可以例如是正常细胞基因或癌基因。另一方面，调
节可以包括抑制转录物的翻译。

基因启动子区包括通常位于结构基因5’的调节元件。如果需要激
活基因，称为转录因子的蛋白结合到该基因的启动子区。该装配类似
于“开”，使酶能够从DNA转录第二个遗传区段为RNA。在多数情
况下，产生的RNA分子用作合成特定蛋白质的模板；有时RNA本身
就是终产物。

所述启动子区可以是正常细胞启动子或例如癌启动子(onco-
promoter)。癌启动子一般是病毒性启动子。例如逆转录病毒的长末端
重复序列(LTR)是可以成为本发明锌指结合多肽变异体的靶的启动子
区。慢病毒组成员的启动子是病毒启动子区实例，所述慢病毒组成员
包括病原体如人嗜T淋巴细胞病毒(HTLV)1和2或人类免疫缺陷病毒
(HIV)1或2，本发明锌指结合多肽可以靶向所述病毒启动子区进行转
录调节。

为了测试应用锌指蛋白作基因特异性转录调节物的原理，使
E2C(Sp1)六指蛋白与多个效应结构域融合。使3个人源阻抑物结构域
中任何一个与锌指蛋白连接产生转录阻抑物。用ERF阻抑结构域(ERD)
制备第一种阻抑蛋白(Sgouras，D.N.，Athanasiou，M.A，Beal，G.J.，Jr.，
Fisher，R.J.，Blair，D.G.& Mavrothalassitis，G.J.(1995)EMBO J.14，
4781-4793)，ERF阻抑结构域定义为ets2阻抑因子(ERE)的氨基酸
473-530。该结构域介导ERF对ets家族转录因子活性的拮抗作用。将
该结构域与锌指蛋白的C末端融合构建合成阻抑物。用Krüppel-结合
盒(Krüppel-associated box，KRAB)结构域制备第二种阻抑蛋白
(Margolin，J.F.，Friedman，J.R.，Meyer，W.，K.-H.，Vissing，H.，Thiesen，
H.-J.& Rauscher III，F.J.(1994)Proc.Natl.Acad.Sci.USA 91，4509-
4513)。该阻抑结构域通常见于锌指蛋白的N末端，而且推测它通过与
RING指蛋白KAP-1相互作用(Friedman，J.R.，Fredericks，W.J.，Jensen，
D.E.，Speicher，D.W.，Huang，X.-P，Neilson，E.G.& Rauscher III，F.J.
(1996)Genes & Dev.10，2067-2078)，以不依赖于距离和方向的方式对
TATA依赖性转录发挥阻抑作用(Pengue，G.& Lania，L.(1996)Proc.
Natl.Acad.Sci.USA 93，1015-1020)。我们利用位于锌指蛋白KOX1的
氨基酸1-97的KRAB结构域(Margolin，J.F.，Friedman，J.R.，Meyer，W.，
K.-H.，Vissing，H.，Thiesen，H.-J.& Rauscher III，F.J.(1994)Proc.Natl.
Acad.Sci USA 91，4509-4513)。在这种情况下，构建与六指蛋白的N末
端融合物。最后，为了探索组蛋白去乙酰化用于阻抑的作用，将Mad
mSIN3相互作用结构域(SID)的氨基酸1-36与锌指蛋白N末端融合
(Ayer，D.E.，Laherty，C.D.，Lawrence，Q.A.，Armstrong，A.P.&
Eisenman，R.N.(1996)Mol.Cell..Biol.16，5772-5781)。这种小结构域位
于转录因子Mad的末端，它作用于mSIN3，mSIN3再作用于辅阻抑
物N-CoR和组蛋白去乙酰化酶mRPD1，从而介导其转录抑制作用
(Heinzel，T.，Lavinsky，R.M.，Mullen，T.-M.，Ssderstrsm，M.，Laherty，C.
D.，Torchia，J.，Yang，W.-M.，Brard，G.，Ngo，S.D.&其他人，e.(1997)
Nature 387，43-46)。为了检测基因特异性激活，将锌指蛋白与单纯疱
疹病毒VP16蛋白的氨基酸413-489(Sadowski，I.，Ma，J.，Triezenberg，S.
& Ptashne，M.(1988)Nature 335，563-564)或VP16基本活化结构域
DALDDFDLDNL(SEQ ID NO：113)的人工四聚体重复(Seipel，K.，
Georgiev，O.& Schaffner，W.(1992)EMBO J.11，4961-4968)(称为VP64)
融合制备转录激活物。

制备包含与荧光素酶报道基因连接的erbB-2启动子片段的报道
构建物以测试我们设计的转录调节物的比活。靶报道质粒含有自ATG
起始密码子的核苷酸-758至-1，而对照报道质粒含有核苷酸-1571至-
24，因此仅保留了包括在位置-24至-7内的E2C结合位点的一个核苷
酸。当瞬时转染入HeLa细胞时，两个启动子片段均具有相似活性，
与以前的观测结果一致(Hudson，L.G.，Ertl，A.P.& Gill，G.N.(1990)J.
Biol.Chem.265，4389-4393)。为了测试锌指-阻抑结构域融合构建物对
erbB-2启动子活性的影响，用各锌指表达载体和荧光素酶报道构建物
瞬时共转染HeLa细胞(图5A)。观测到每个构建物的明显阻抑作用。
ERD和SID融合蛋白分别产生约50％和80％的阻抑作用。最有效的阻
抑物是KRAB融合蛋白。该蛋白完全阻抑erbB-2启动子活性。所观测
到的残余活性为弱启动子pGL3报道物(promoter-less pGL3 reporter)的
背景水平。相反，没有一种蛋白明显抑制缺乏E2C靶位点的对照erbB-2
报道构建物，证实E2C(Sp1)蛋白与其靶位点特异性结合才真正介导阻
抑作用。缺乏任何效应子结构域的锌指蛋白表达产生弱阻抑，约30％
的阻抑，说明于SID和KRAB构建物观测到阻抑作用主要由其效应子
结构域产生，而不是单纯的DNA-结合。此观测结果强有力地说明，
阻抑机制是有效抑制了转录起始而不是延长。RNA聚合酶II一旦开
始转录，似乎聚合酶作用可容易地从DNA移去锌指蛋白。

应用2个相同报道构建物研究基因特异性多指蛋白用于介导转录
激活的效用。发现VP16融合蛋白刺激转录增加至约5倍，而VP64融
合蛋白产生27倍激活。鉴于锌指蛋白结合基因转录区的事实，基于单
一VP16的转录激活物对启动子活性的明显刺激作用是例外情况。这
又再次证实，在RNA聚合酶II途径中锌指蛋白仅仅是结合、即使亚
纳摩尔亲和力的锌指蛋白的结合也不一定负面影响基因表达。

本文资料表明，用识别5’-GNN-3’位点的预定结构域能够快速制
备可结合新型9-和18-bp DNA靶位点的锌指蛋白。该信息足以制备166
或17×106新型六指蛋白，每个锌指蛋白均能结合18 bp DNA序列。
构建新型锌指蛋白的这种快速方法学优于其它学者提出的序贯产生并
选择锌指结构域(Greisman，H.A.& Pabo，C.O.(1997)Science 275，
657-661)，该方法利用提示在靶向5’-GNN-3’位点的蛋白中可避免可能
的上述靶重叠问题的结构信息。应用复杂而充分研究的erbB-2启动子
和活的人体细胞的资料证实，当这些蛋白提供合适效应结构域时，在
这些实验中它们可用于刺激或激活表达以及产生各级水平的阻抑至背
景水平。这些研究提示，作为转录抑制物的KRAB结构域明显强于ERD
或SID结构域，既能够抑制该启动子的TATA依赖性转录起始又能够
抑制TATA非依赖性转录起始。以前没有直接比较过这些阻抑结构
域。利用预定锌指结构域构建与效应结构域连接的多指蛋白的本发明
策略明显优于试图仅通过竞争或干扰参与转录复合物的蛋白抑制转录
的策略(Kim，J.-S.& Pabo，C.O.(1997)J.Biol.Chem.272，29795-29800，
Kim，J.-S.，Kim，J.，Cepek，K.L.，Sharp，P.A.& Pabo，C.O.(1997)Proc.
Natl.Acad.Sci.USA 94，3616-3620)。使用具有远距离作用潜力的效应
结构域使得可以将这些基因开关用于调节未特征鉴定的基因和启动
子。因为可用我们的PCR装配策略以高通量方式制备这些转录调节
物，所以我们认为评价其潜在实际用途是适当的。以这种方式制备的
新型DNA结合蛋白在基于DNA的诊断应用中具有潜在效用。为了研
究基因功能，我们认为既能激活基因转录又能阻抑基因转录、必要的
话能够以阶梯水平激活以及阻抑基因转录，有助于鉴定基因功能。因
为这些蛋白通过反式作用发挥其控制作用，所以可以在杂合转基因动
物使功能性基因失活或激活。这可以使在整体动物使基因失活需要的
时间明显减少，而且可以扩大失活技术适用的生物类型。这些蛋白也
可用于基因治疗以抑制产生病毒基因产物或激活参与抗病的基因。有
意义的是，制备这些蛋白的简便性将有助于科学团体研究这些设想。

以下实施例举例说明本发明的优选实施方案，而不是以任何方式
限制本说明书或权利要求书。
实施例1：利用噬菌体展示进行选择

基本上按以前方法(Shi，Y.& Berg，J.M.(1996)Biochemistry 35，
3845-8)通过PCR重叠延伸构建锌指文库。如前所述(Pengue，G.& Lania，
L.(1996)Proc.Natl.Acad.Sci.USA 93，1015-1020，Friedman，J.R.，
Fredericks，W.J.，Jensen，D.E.，Speicher，D.W.，Huang，X.-P.，Neilson，E.
G.& Rauscher III，F.J.(1996)Genes & Dev.10，2067-2078)培养以及沉
淀噬菌体，不同的是用ER2537细胞(New England Biolabs)繁殖噬菌
体，并在生长培养基中加入90μM氯化锌。将沉淀的噬菌体再悬浮于
锌缓冲液A(ZBA；10mM Tris，pH 7.5/90 mM KCl，1mM氯化镁，90μM
氯化锌)/1％BSA/5mM DTT中。加入72nM生物素化发夹靶寡核苷酸
之前，使结合反应物(500μl：ZBA/5mM DTT/1％Blotto(BioRad)/寡核
苷酸竞争物/4μg剪切鲱鱼精DNA(Sigma)/100μl过滤的噬菌体(约1013
集落形成单位)在室温下温育30分钟。再在恒速轻轻混合下继续温育
3.5小时。用500μl ZBA/1％BSA洗涤链霉抗生物素蛋白包被的磁珠(50
μl；Dynal)2次，然后用500μl ZBA/5％Blotto/抗体-展示(不相关)的噬菌
体(约1012集落形成单位)在室温下封闭约4小时。结合结束时，用结
合反应物置换封闭溶液，并在室温下温育1小时。用500μl ZBA/5mM
DTT/2％吐温20在1小时内将珠子洗涤10次，然后用不含吐温20的
该溶液洗涤1次。用10μg/μl胰蛋白酶洗脱结合噬菌体30分钟。

发夹靶核苷酸的序列为5’-生物素-
GGACGCN’N’N’CGCGGGTTTTCCCGCGNNNGCGTCC-3’(SEQ ID
NO：114)，其中NNN是3-核苷酸指2-靶序列，而N’N’N’为其互补碱
基。每轮选择包含7.2nM的相似非生物素化寡核苷酸(其中靶序列是
TGG(compTGG))，以对污染的亲本噬菌体进行选择。此外，非生物素
化寡核苷酸的2个合并物用作竞争物：一个含有全部64种可能的3-
核苷酸靶序列(compNNN)，另一个除了目前的选择靶(compGNN)之外
包含所有GNN靶序列。通常如下使用这些合并物：第一轮，无
compNNN或compGNN；第二轮，7.2 nM compGNN；第三轮，10.8
nM compGNN；第四轮，1.8μM compNNN，25nM compGNN；第五
轮，2.7μM compNNN，90nM compGNN；第六轮，2.7μM compNNN，
250nM compGNN；第七轮，3.6μM compNNN，250nM compGNN。
实施例2：多靶特异性测定

将含锌指编码序列的pComb3H(Pengue，G.& Lania，L.(1996)
Proc.Natl.Acad.Sci.USA 93，1015-1020，Heinzel，T.，Lavinsky，R.M.，
Mullen，T.-M.，Ssderstrsm，M.，Laherty，C.D.，Torchia，J.，Yang，W.-M.，
Brard，G.，Ngo，S.D.&其他人，e.(1997)Nature 387，43-46)噬菌粒RF
DNA的片段亚克隆入修饰的pMAL-c2(New England Biolabs)细菌表达
载体，并将其转化入XL1-Blue(Stratagene)中。用蛋白融合及纯化系统
(New England Biolabs)由IPTG诱导的培养物制备含过量表达的麦芽糖
结合蛋白-锌指融合蛋白的冻融提取物。在96孔ELISA板的各孔中加
入0.2μg链霉抗生物素蛋白(Pierce)，以37℃温育1小时，然后用水
洗涤2次。同样加入生物素化靶寡核苷酸(0.025μg)。加入ZBA/3％BSA
封闭，但是在温育后不洗涤各孔。之后所有温育在室温下进行。用1
×结合缓冲液(ZAB/1％BSA/5mM DTT/0.12μg/μl剪切鲱鱼精子DNA)
连续2倍稀释提取物8次。将样品温育1小时，然后用水洗涤10次。
将小鼠抗麦芽糖结合蛋白单克隆抗体(Sigma)的ZBA/1％BSA加于各
孔处理30分钟，然后用水洗涤10次。将缀合碱性磷酸酶的山羊抗小
鼠IgG单克隆抗体(Sigma)加于各孔处理30分钟，然后用水洗涤10次。
加入碱性磷酸酶底物(Sigma)，用SOFTmax 2.35(Molecular Devices)定
量OD405。
实施例3：凝胶迁移率变动分析

用蛋白融合及纯化系统(New England Biolabs)将融合蛋白纯化至
90％以上的均一性，其中例外的是ZAB/5mMDTT用作柱缓冲液。根
据考马斯亮蓝染色的15％SDS-PAGE凝胶，与BSA标准品比较，确
定蛋白纯度和浓度。用[32P]于其5’或3’端标记靶寡核苷酸，并凝胶纯
化。连续3倍稀释11次的蛋白在20μl结合反应物(1×结合缓冲液/10％
甘油/约1pM靶寡核苷酸)中于室温下温育3小时，然后用0.5×TBE
缓冲液在5％聚丙烯酰胺凝胶上分离。用PhosphorImager和ImageQuant
软件(Molecular Dynamics)定量干燥凝胶，通过斯卡查德分析确定KD。
实施例4：利用需要的DNA结合特异性制备多指蛋白

本文报道的研究应用附图(accompanying manuscript)中定义的指
2(F2)变异体pmGAC、pmGAG、pGCA、pGCC、pmGGA、
pmGGC、pmGGG和pGTG(Hudson，L.G.，Ertl，A.P.& Gill，G.N.
(1990)J.Biol.Chem.265，4389-4393)。为了制备编码多指蛋白的
DNA，用PCR从选定或设计的F2变异体扩增F2编码区，并通过PCR
重叠延伸装配。或者分别由8或6个重叠寡核苷酸合成编码具有Zif268
或Sp1C构架的三指蛋白的DNA。Sp1C构架构建物用于本报道所述
的所有报道分析，其制备如下：如果为E2C-HS1(Sp1)时，将寡核苷酸
SPE2-3(5’-GCG AGC AAG GTC GCG GCA GTC ACT AAA AGA TTT
GCC GCA CTC TGG GCA TTT ATA CGG TTT TTC ACC-3’)(SEQ ID
NO：115)和SPE2-4(5’-GTG ACT GCC GCG ACC TTG CTC GCC ATC
AAC GCA CTC ATA CTG GCG AGA AGC CAT ACA AAT GTC CAG
AAT GTG GC-3’)(SEQ ID NO：116)各0.4pmole与寡核苷酸SEP2-2
(5’-GGT AAG TCC TTC TCT CAG AGC TCT CAC CTG GTG CGC
CAC CAG CGT ACC CAC ACG GGT GAA AAA CCG TAT AAA TGC
CCA GAG-3’)(SEQ ID NO：117)和SPE2-5(5’-ACG CAC CAG CTT
GTC AGA GCG GCT GAA AGA CTT GCC ACA TTC TGG ACA TTT
GTA TGG C-3’)(SEQ ID NO：118)各40pmole按标准PCR混合物混
合，循环25次(94℃30秒，60℃30秒，72℃30秒)。然后利用相
同的循环条件以引物SPE2-1(5’-GAG GAG GAG GAG GTG GCC
CAG GCG GCC CTC GAG CCC GGG GAG AAG CCC TAT GCT TGT
CCG GAA TGT GGT AAG TCC TTC TCT CAG AGC-3’)(SEQ ID NO：
119)和SPE2-6(5’-GAG GAG GAG GAG CTG GCC GGC CTG GCC
ACT AGT TTT TTT ACC GGT GTG AGT ACG TTG GTG ACG CAC
CAG CTT GTC AGA GCG－3’)(SEQ ID NO：120)各40pmole扩增等份
此预装配反应物。应用仅在识别螺旋编码区不同的一组类似的寡核苷
酸以相同方式制备E2C-HS2(Sp1)DNA。所有装配的三指编码区用限
制性内切核酸酶Sfi1消化，并将其克隆入pMal-CSS中，pMal-CSS是
细菌表达载体pMal-C2的衍生物(New Englnd Biolabs)。利用三指编码
区侧翼序列包含的Xma1和BsrF1限制性位点将编码具有各不同构架
的六指蛋白的DNA装配在pMal-CSS中。用大肠杆菌菌株XL1-blue
表达各锌指蛋白，用附图所述的ELISA和凝胶变动分析(Hudson，L.G.，
Ertl，A.P.& Gill，G.N.(1990)，Biol.Chem.265，4389-4393)研究结合
性质。
实施例5：构建锌指效应结构域融合蛋白

为了构建锌指效应结构域融合蛋白，用Taq DNA聚合酶由重叠寡
核苷酸装配编码ets阻抑因子(ERF)阻抑结构域(ERD)的氨基酸473-
530(Sgouras，D.N.，Athanasiou，M.A.，Beal，G.J.，Jr.，Fisher，R.J.，Blair，
D.G.& Mavrothalassitis，G.J.(1995)EMBO J.14，4781-4793)、KOX1
的KRAB结构域的氨基酸1-97(Margolin，J.F.，Friedman，J.R.，Meyer，
W.，K.-H.，Vissing，H.，Thiesen，H.-J.&Rauscher III，F.J.(1994)Proc.
Natl.Acad.Sci USA 91，4509-4513)或Mad mSIN3作用结构域(SID)的氨
基酸1-36(Ayer，D.E.，Laherty，C.D.，Lawrence，Q.A.，Armstrong，A.P.
& Eisenman，R.N.(1996)Mol.Cell.Biol.16，5772-5781)的DNA。利用
PCR由pcDNA3/C7-C7-VP16(10)扩增VP16转录活化结构域的氨基酸
413-489的编码区(Sadowski，I.，Ma，J.，Triezenberg，S.& Ptashne，M.
(1988)Nature 335，563-564)。用2对互补寡核苷酸制备VP64 DNA，
VP64 DNA编码VP16基本活化结构域的四聚体重复，其中VP16基本
活化结构域包含氨基酸437-447(Seipel，K.，Georgiev，O.& Schaffner，W.
(1992)EMBO J.11，4961-4968)。用标准克隆方法将所得的片段与锌指
编码区融合，这样所获得的每个构建物含有内部SV40核定位信号以
及C末端HA十肽标记。将融合构建物克隆在原核表达载体pcDNA3
(Invitrogen)中。
实施例6：构建荧光素酶报道质粒

用TaqExpand DNA聚合酶混合物(Boehringer Mannheim)通过
PCR从人骨髓基因组DNA扩增包含自ATG起始密码子的核苷酸-758
至-1的erbB-2启动子片段，并于萤火虫荧光素酶基因上游将其克隆入
pGL3basic(Promega)中。通过Hind3消化从pSVOALΔ5’/erbB-2(N-N)
(Hudson，L.G.，Ertl，A.P.& Gill，G.N.(1990)J.Biol.Chem.265，4389-
4393)切下包含核苷酸-1571至-24的人erbB-2启动子片段，并将其于
萤火虫荧光素酶基因上游亚克隆入pGL3basic中。
实施例7：荧光素酶测定

融合40-60％的HeLa细胞用于所有转染。一般来说，用脂质转染
胺试剂(Gibco BRL)在6孔板的孔内，用400 ng报道质粒(pGL3-启动子
构建物或用作阴性对照的pGL3basic)、50ng效应质粒(pcDNA3中的
锌指构建物或用作阴性对照的空pcDNA3)和200 ng内标质粒(phrAct-
βGal)转染细胞。转染后约48小时制备细胞提取物。用MicroLumat
LB96P发光计(EG&G Berthold)以荧光素酶检测试剂(Promega)检测荧
光素酶活性、用Galacto-Light(Tropix)检测βGal活性。荧光素酶活性根
据βGal活性归一化。
实施例8：HeLa细胞erbB-2基因的调节

对erbB-2基因施以调节。erbB-2基因通常在人类癌症、尤其是乳
腺癌和卵巢癌中过量表达，ErbB-2水平升高与患者的预后较差相关
(N.E.Hynes和D.F.Stern，Biochim.Biophys.Acta 1198，165(1994))。为
了调节天然erbB-2基因，使用称为E2C-KRAB的合成阻抑蛋白和称为
E2C-VP64的反式激活蛋白(R.R.Beerli，D.J.Segal，B.Dreier，C.F.
Barbas，III，Proc.Natl.Acad.Sci.USA 95，14628(1998))。两种蛋白均含
有相同设计的锌指蛋白E2C，识别原癌基因erbB-2 5’非翻译区中的
18-bp DNA序列5’-GGG GCC GGA GCC GCA GTG-3’(SEQ ID NO：
121)。由6个预定模块锌指结构域构建这种DNA-结合蛋白(D.J.Segal，
B.Dreier，R.R.Beerli，C.F.Barbas，III，Proc.Natl.Acad.Sci.USA 96，
2758(1999))。阻抑蛋白含有Kox-1 KRAB结构域(J.F.Margolin等，
Proc.Natl.Acad.Sci.USA 91，4509(1994))，而反式激活物VP64含有衍
生自单纯疱疹病毒蛋白VP16的基本活化结构域的四聚体重复(K.
Seipel，O.Georgiev，W.Schaffner，EMBO J.11，4961(1992))，。

使用人宫颈癌细胞系HeLa衍生物HeLa/tet-off(M.Gossen和H.
Bujard，Proc.Natl.Acad.Sci.USA 89，5547(1992))。因为HeLa细胞是
上皮来源，所以它们表达ErbB-2而且非常适用于研究erbB-2基因寻
靶。HeLa/tet-off细胞产生四环素控制的反式激活物，从而可以通过从
生长培养基去除四环素或其衍生物多西环素(Dox)诱导四环素反应元
件(TRE)控制的目的基因。我们应用该系统将我们的转录因子置于化学
控制之下。因此，构建pRevTRE/E2C-SKD和pRevTRE/E2C-VP64质
粒(由pcDNA3为基础的表达质粒经PCR扩增E2C(Sp1)-KRAB和
E2C(Sp1)-VP64编码区(R.R.Beerli，D.J.Segal，B.Dreier，C.F.Barbas，
III，Proc.Natl.Acad.Sci.USA 95，14628(1998))，并利用BamH1和Clal
限制位点将其亚克隆入pRevTRE(Clontech)以及利用BamH1和Not1
限制位点亚克隆入pMX-IRES-GFP[X.Liu等，Proc.Natl.Acad.Sci.
USA 94，10669(1997)]。通过测序证实PCR扩增的保真性)，将其转染
入HeLa/tet-off细胞，独立分离20个稳定克隆并各自分析Dox依赖性
靶基因调节(利用Lipofectamine Plus试剂(Gibco BRL)将
pRevTRE/E2C-KRAB和pRevTRE/E2C-VP64构建物转染入HeLa/tet-off
细胞系(M.Gossen和H.Bujard，Proc.Natl.Acad.Sci.USA 89，5547
(1992))。在存在2μg/ml Dox下于含潮霉素的培养基中选择2周后，分
离稳定克隆并分析对ErbB-2表达的Dox依赖性调节。基本上按所述[D.
Graus-Porta，R.R.Beerli，N.E.Hynes，Mol.Cell.Biol.15，1182(1995)]进
行蛋白质印迹分析、免疫沉淀、RNA印迹分析和流式细胞分析)。用
蛋白质印迹分析初步分析ErbB-2蛋白水平，作为erbB-2启动子活性的
结果。其中相当部分克隆表明，去除Dox4天时存在对ErbB-2表达的
调节，即在E2C-KRAB克隆中向下调节ErbB-2表达而在E2C-VP64
克隆中向上调节ErbB-2表达。ErbB-2蛋白水平与其特定mRNA变化
水平有关，说明对ErbB-2表达的调节是由于阻抑或激活转录所致。在
E2C-VP64克隆中额外表达的ErbB-2蛋白与天然表达蛋白无法区分并
且具有生物活性，因为表皮生长因子(EGF)容易诱导其酪氨酸磷酸化。
因为其EGF诱导的酪氨酸磷酸化，在没有Dox的情况下，E2C-KRAB
克隆#27的ErbB-2水平低于检测水平。所以，还用流式细胞仪分析
ErbB-2表达，提示在E2C-KRAB克隆#27未检测到ErbB-2表达，与
ErbB-2在E2C-VP64克隆#18中的明显向上调节(5.6倍)形成鲜明的
对比。因此，对erbB-2基因的调节程度为从完全阻抑(E2C-KRAB克
隆#27)至差不多6倍的激活(E2C-VP64克隆#18)。未观测到对相关
的ErbB-1蛋白表达的明显作用，说明对ErbB-2表达的调节不是因为
一般的向下或向上调节转录的所致。与这些利用6个锌指结构域靶向
18bp DNA序列的转录因子的效能相比，用3个锌指结构域制备的结
合E2C靶序列的任一9bp半位点的转录激活物不能激活ebrB-2荧光
素酶报道物的转录。这些结果提示，需要特异性和亲和力提高的六指
蛋白以对基因调节产生明显作用。
实施例9：在逆转录病毒载体pMX-IRES-GFP中导入E2C-KRAB和
E2C-VP64蛋白编码区

为了在几种其它细胞系中表达E2C-KRAB和E2C-VP64蛋白，将
其编码区导入逆转录病毒载体pMX-IRES-GFP中。由pcDNA3为基础
的表达质粒经PCR扩增E2C(Sp1)-KRAB和E2C(Sp1)-VP64编码区(R.
R.Beerli，D.J.Segal，B.Dreier，C.F.Barbas，III，Proc.Natl.Acad.Sci.
USA 95，14628(1998))，并利用BamH1和Cla1限制位点将其亚克隆入
pRevTRE(Clontech)以及利用BamH1和Not1限制位点亚克隆入
pMX-IRES-GFP[X.Liu等，Proc.Natl.Acad.Sci.USA 94，10669
(1997)]。通过测序证实PCR扩增的保真性。此载体表达一个双顺反子
信使用于翻译锌指蛋白以及从内核糖体结合位点(IRES)翻译绿色荧光
蛋白(GFP)。因为两个编码区共有同一个mRNA，所以其表达彼此密
切相关，GFP表达是锌指蛋白表达的一个指标。然后应用由这些质粒
制备的病毒感染人类癌细胞系A431(用脂质转染胺Plus试剂(Gibco
BRL)将pMX-IRES-GFP/E2C-KRAB和pMX-IRES-GFP/E2C-VP64质粒
瞬时转染入兼性包装细胞系Phoenix Ampho中，2天后，在存在8μg/ml
聚凝胺(polybrene)的情况下用培养上清液感染靶细胞。感染3天后收获
细胞用于分析)。感染3天后，用流式细胞仪测量ErbB-2表达。重要
的是，约59％E2C-KRAB病毒处理细胞基本上为ErbB-2阴性，而约
27％E2C-VP64病毒处理细胞中的ErbB-2水平升高。GFP荧光对
ErbB-2荧光作图提示存在2个细胞群，一个细胞群为GFP阴性的正常
ErbB-2水平的细胞群，另一个为GFP阳性的ErbB-2水平改变的细胞
群。通过检测相关ErbB-1和ErbB-3蛋白的表达水平研究基因寻靶的
特异性。未检测到这些蛋白的明显改变，说明erbB-2基因寻靶是特异
性的，而不是基因表达的一般变化或效应结构域的过量表达的非特异
性结果。尤其值得注意的是，对erbB-3缺乏任何明显的调节作用，这
是因为其5’-UTR含有18bp序列5’-GGa GCC GGA GCC GgA GTc-3’
(SEQ ID NO：122)，该序列与设计的E2C靶序列只有3个碱基不匹配(15
bp相同-小写字母表示不同)(M.H.Kraus，W.Issing，T.Miki，N.C.
Popescu，S.A.Aaronson，Proc.Natl.Acad.Sci.USA 86，9193(1989))。
实施例10：对非人类灵长类细胞erbB-2基因的调节作用

erbB-2的5’-UTR中的锌指靶序列位于在许多物种中保守的28bp
序列段中。为了研究对erbB-2基因在非人类灵长类细胞中表达的调节
作用，用双顺反子E2C-KRAB逆转录病毒感染COS-7成纤维细胞，并
用流式细胞仪进行分析。与在人类细胞中一样，以GFP标记指示的阻
抑蛋白表达与缺失EbrB-2蛋白密切相关。同样，通过用编码E2C-KRAB
和E2C-VP64的逆转录病毒感染NIH/3T3细胞评价在小鼠细胞中的基
因寻靶。然后用蛋白质印迹分析而不是流式细胞仪(因为单克隆抗体缺
乏与鼠ErbB-2胞外结构域的反应性)监测ErbB-2表达水平。在此再次
观测到用E2C-KRAB校正感染细胞时完全没有转录。然而，与人类细
胞系不同的是，E2C-VP64诱导的ErbB-2向上调节在NIH/3T3细胞中
非常温和，校正感染效率时约为1.8倍。这种差异的可能解释是人和
小鼠启动子的结构不同。小鼠erbB-2启动子与人的启动子不同，它没
有TATA盒(M.R.White和M.C.Hung，Oncogene 7，677(1992))。VP16
激活的转录至少部分是其与TFIID相互作用介导的，TFIID是也含有
TATA-结合蛋白的多蛋白复合物(C.J.Ingles，M.Shales，W.D.Cress，S.
J.Triezenberg，J.Greenblatt，Nature 351，588(1991))。似乎原因是缺乏
TATA盒时E2C-VP64蛋白激活转录的效率较低。这些资料提示，虽
然DNA结合位点就序列和在靶细胞中的相对位置而言是可能保守
的，但是由于邻近序列效应可能需要优化效应结构域以使效率最大
化。尽管如此，虽然本文所述的人工转录因子的效力可能不同，但是
它们能够在衍生自不同物种的细胞中对erbB-2基因的转录加以调节，
为研究基因在各种生物中的作用提供策略。
实施例11：特异性诱导ErbB-2过量表达肿瘤细胞的G1累积

ErbB-2过量表达导致组成型激活其本身酪氨酸激酶活性(P.P.Di
Fiore等，Science 237，178(1987))，而且证实ErbB-2在过量表达所述
受体的肿瘤细胞中的向下调节导致生长抑制(R.M.Hudziak等，Mol.
Cell.Biol.9，1165(1989)；J.Deshane等，Gene Ther.1，332(1994)；J.M.
Daly等，Cancer Res.57，3804(1997))。看来生长抑制的机制是阻止所
述细胞从细胞周期的G1期进入S期(R.M.Neve，H.Sutterluty，N.Pullen，
H.A.Lane，J.M.Daly，W.Krek，N.E.Hynes，出版中)。因此，我们研
究了我们设计的转录阻抑物在erbB-2过量表达的肿瘤细胞中的表达是
否导致G1期阻滞。因此用E2C-KRAB逆转录病毒感染SKBR3乳腺癌
细胞，并用流式细胞仪分析与ErbB-2表达水平有关的细胞周期分布
(22)。观测到2个细胞群：约40％细胞未感染而且其ErbB-2水平正常，
而感染细胞约60％，3天后的受体水平降低约7倍。与正常受体水平
的细胞相比，绝大部分ErbB-2表达水平降低的细胞处于细胞周期的
G1期。为了确定于SKBR3细胞观测到的G1累积是ErbB-2过量表达
肿瘤细胞特异性的，用其ErbB-2水平不高的T47D乳腺癌细胞系进行
了相似的分析(图4B)。事实上，用E2C-KRAB逆转录病毒感染T47D
细胞并使其进行流式细胞分析时，发现ErbB-2水平正常的细胞群和
ErbB-2水平降低的细胞群的DNA含量没有差别。所以，我们设计的
阻抑蛋白能够特异性诱导ErbB-2过量表达肿瘤细胞的G1累积。能够
抑制细胞周期过程，因此抑制ErbB-2过量表达肿瘤细胞生长的能力说
明，我们所设计的转录因子具有用于基因治疗癌症的潜力。

序列表
<110>Novartis AG
<120>用于GNN的锌指结合结构域
<130>30746/A
<140>
<141>
<160>122
<170>PatentIn Ver.2.1
<210>1
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>1
Gln Ser Ser Asn Leu Val Arg
  1               5
<210>2
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>2
Asp Pro Gly Asn Leu Val Arg
  1               5
<210>3
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>3
Arg Ser Asp Asn Leu Val Arg
  1               5
<210>4
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>4
Thr Ser Gly Asn Leu Val Arg
  1               5
<210>5
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>5
Gln Ser Gly Asp Leu Arg Arg
  1               5
<210>6
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>6
Asp Cys Arg Asp Leu Ala Arg
  1               5
<210>7
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>7
Arg Ser Asp Asp Leu Val Lys
  1               5
<210>8
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>8
Thr Ser Gly Glu Leu Val Arg
  1               5
<210>9
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>9
Gln Arg Ala His Leu Glu Arg
  1               5
<210>10
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>10
Asp Pro Gly His Leu Val Arg
  1               5
<210>11
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>11
Arg Ser Asp Lys Leu Val Arg
  1               5
<210>12
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>12
Thr Ser Gly His Leu Val Arg
  1               5
<210>13
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>13
Gln Ser Ser Ser Leu Val Arg
  1               5
<210>14
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>14
Asp Pro Gly Ala Leu Val Arg
  1               5
<210>15
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>15
Arg Ser Asp Glu Leu Val Arg
  1               5
<210>16
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>16
Thr Ser Gly Ser Leu Val Arg
  1               5
<210>17
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>17
Gln Arg Ser Asn Leu Val Arg
  1               5
<210>18
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>18
Gln Ser Gly Asn Leu Val Arg
  1               5
<210>19
<211>7
<212>PRT
<223>人工序列说明：核苷酸结合多肽
<400>22
Lys Ser Ala Asn Leu Val Arg
  1               5
<210>23
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>23
Arg Ser Asp Asn Leu Val Lys
  1               5
<210>24
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>24
Lys Ser Ala Gln Leu Val Arg
  1               5
<210>25
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>19
Gln Pro Gly Asn Leu Val Arg
  1               5
<210>20
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>20
Asp pro Gly Asn Leu Lys Arg
  1               5
<210>21
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>21
Arg Ser Asp Asn Leu Arg Arg
  1               5
<210>22
<211>7
<212>PRT
<213>人工序列
<220>
<400>25
Gln Ser Ser Thr Leu Val Arg
  1               5
<210>26
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>26
Gln Ser Gly Thr Leu Arg Arg
  1               5
<210>27
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>27
Gln Pro Gly Asp Leu Val Arg
  1               5
<210>28
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>28
Gln Gly Pro Asp Leu Val Arg
  1               5
<210>29
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>29
Gln Ala Gly Thr Leu Met Arg
  1               5
<210>30
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>30
Gln Pro Gly Thr Leu Val Arg
  1               5
<210>31
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>31
Gln Gly Pro Glu Leu Val Arg
  1               5
<210>32
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>32
Gly Cys Arg Glu Leu Ser Arg
  1               5
<210>33
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>33
Asp Pro Ser Thr Leu Lys Arg
  1               5
<210>34
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>34
Asp Pro Ser Asp Leu Lys Arg
  1               5
<210>35
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>35
Asp Ser Gly Asp Leu Val Arg
1               5
<210>36
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>36
Asp Ser Gly Glu Leu Val Arg
  1               5
<210>37
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>37
Asp Ser Gly Glu Leu Lys Arg
  1               5
<210>38
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>38
Arg Leu Asp Thr Leu Gly Arg
  1               5
<210>39
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>39
Arg Pro Gly Asp Leu Val Arg
  1               5
<210>40
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>40
Arg Ser Asp Thr Leu Val Arg
  1               5
<210>41
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>41
Lys Ser Ala Asp Leu Lys Arg
  1               5
<210>42
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>42
Arg Ser Asp Asp Leu Val Arg
  1               5
<210>43
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>43
Arg Ser Asp Thr Leu Val Lys
  1               5
<210>44
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>44
Lys Ser Ala Glu Leu Lys Arg
  1               5
<210>45
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>45
Lys Ser Ala Glu Leu Val Arg
  1               5
<210>46
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>46
Arg Gly Pro Glu Leu Val Arg
  1               5
<210>47
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>47
Lys Pro Gly Glu Leu Val Arg
  1               5
<210>48
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>48
Ser Ser Gln Thr Leu Thr Arg
  1               5
<210>49
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>49
Thr Pro Gly Glu Leu Val Arg
  1               5
<210>50
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>50
Thr Ser Gly Asp Leu Val Arg
  1               5
<210>51
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>51
Ser Ser Gln Thr Leu Val Arg
  1               5
<210>52
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>52
Thr Ser Gln Thr Leu Thr Arg
  1               5
<210>53
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>53
Thr Ser Gly Glu Leu Lys Arg
  1               5
<210>54
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>54
Gln Ser Ser Asp Leu Val Arg
  1               5
<210>55
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>55
Ser Ser Gly Thr Leu Val Arg
  1               5
<210>56
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>56
Thr Pro Gly Thr Leu Val Arg
  1               5
<210>57
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>57
Thr Ser Gln Asp Leu Lys Arg
  1               5
<210>58
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>58
Thr Ser Gly Thr Leu Val Arg
  1               5
<210>59
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>59
Gln Ser Ser His Leu Val Arg
  1               5
<210>60
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>60
Gln Ser Gly His Leu Val Arg
  1               5
<210>61
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>61
Gln Pro Gly His Leu Val Arg
  1               5
<210>62
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>62
Glu Arg Ser Lys Leu Ala Arg
  1               5
<210>63
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>63
Asp Pro Gly His Leu Ala Arg
  1               5
<210>64
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>64
Gln Arg Ala Lys Leu Glu Arg
  1               5
<210>65
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>65
Gln Ser Ser Lys Leu Val Arg
  1               5
<210>66
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>66
Asp Arg Ser Lys Leu Ala Arg
  1               5
<210>67
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>67
Asp Pro Gly Lys Leu Ala Arg
  1               5
<210>68
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>68
Arg Ser Asp Lys Leu Thr Arg
  1               5
<210>69
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>69
Arg Ser Asp His Leu Thr Arg
  1               5
<210>70
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>70
Lys Ser Ala Lys Leu Glu Arg
  1               5
<210>71
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>71
Thr Ala Asp His Leu Ser Arg
  1               5
<210>72
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>72
Thr Ala Asp Lys Leu Ser Arg
  1               5
<210>73
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>73
Thr Pro Gly His Leu Val Arg
  1               5
<210>74
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>74
Thr Ser Ser His Leu Val Arg
  1               5
<210>75
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>75
Thr Ser Gly Lys Leu Val Arg
  1               5
<210>76
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>76
Gln Pro Gly Glu Leu Val Arg
  1           5
<210>77
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>77
Gln Ser Gly Glu Leu Val Arg
  1               5
<210>78
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>78
Gln Ser Gly Glu Leu Arg Arg
  1               5
<210>79
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>79
Asp Pro Gly Ser Leu Val Arg
  1               5
<210>80
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>80
Arg Lys Asp Ser Leu Val Arg
  1               5
<210>81
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>81
Arg Ser Asp Val Leu Val Arg
  1               5
<210>82
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>82
Arg His Asp Ser Leu Leu Arg
  1               5
<210>83
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>83
Arg Ser Asp Ala Leu Val Arg
  1               5
<210>84
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>84
Arg Ser Ser Ser Leu Val Arg
  1               5
<210>85
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>85
Arg Ser Ser Ser His Val Arg
  1               5
<210>86
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>86
Arg Ser Asp Glu Leu Val Lys
  1               5
<210>87
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>87
Arg Ser Asp Ala Leu Val Lys
  1               5
<210>88
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>88
Arg Ser Asp Val Leu Val Lys
  1               5
<210>89
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>89
Arg Ser Ser Ala Leu Val Arg
  1               5
<210>90
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>90
Arg Lys Asp Ser Leu Val Lys
  1               5
<210>91
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>91
Arg Ser Ala Ser Leu Val Arg
  1               5
<210>92
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>92
Arg Ser Asp Ser Leu Val Arg
  1               5
<210>93
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>93
Arg Ile His Ser Leu Val Arg
  1               5
<210>94
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>94
Arg Pro Gly Ser Leu Val Arg
  1               5
<210>95
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>95
Arg Gly Pro Ser Leu Val Arg
  1               5
<210>96
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>96
Arg Pro Gly Ala Leu Val Arg
  1               5
<210>97
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>97
Lys Ser Ala Ser Leu Val Arg
  1               5
<210>98
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>98
Lys Ser Ala Ala Leu Val Arg
  1               5
<210>99
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>99
Lys Ser Ala Val Leu Val Arg
  1               5
<210>100
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>100
Thr Ser Gly Ser Leu Thr Arg
  1               5
<210>101
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>101
Thr Ser Gln Ser Leu Val Arg
  1               5
<210>102
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>102
Thr Ser Ser Ser Leu Val Arg
  1               5
<210>103
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>103
Thr Pro Gly Ser Leu Val Arg
  1               5
<210>104
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>104
Thr Ser Gly Ala Leu Val Arg
  1               5
<210>105
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>105
Thr Pro Gly Ala Leu Val Arg
  1               5
<210>106
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>106
Thr Gly Gly Ser Leu Val Arg
  1               5
<210>107
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>107
Thr Ser Gly Glu Leu Val Arg
  1               5
<210>108
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>108
Thr Ser Gly Glu Leu Thr Arg
  1               5
<210>109
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>109
Thr Ser Ser Ala Leu Val Lys
  1               5
<210>110
<211>7
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：核苷酸结合多肽
<400>110
Thr Ser Ser Ala Leu Val Arg
  1               5
<210>111
<211>5
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：肽接头
<400>111
Thr Gly Glu Lys Pro
  1               5
<210>112
<211>18
<212>DNA
<213>人工序列
<220>
<223>人工序列说明：e2c靶序列
<400>112
ggggccggag ccgcagtg         18
<210>113
<211>11
<212>PRT
<213>人工序列
<220>
<223>人工序列说明：VP16基本活化结构域
<400>113
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
  1               5                  10
<210>114
<211>34
<212>DNA
<213>人工序列
<220>
<223>人工序列说明：发夹靶寡核苷酸
<400>114
ggacgcnnnc gcgggttttc ccgcgnnngc gtcc    34
<210>115
<211>66
<212>DNA
<213>人工序列
<220>
<223>人工序列说明：寡核苷酸SPE2-3
<400>115
gcgagcaagg tcgcggcagt cactaaaaga tttgccgcac tctgggcatt tatacggttt 60
ttcacc                                                            66
<210>116
<211>74
<212>DNA
<213>人工序列
<220>
<223>人工序列说明：寡核苷酸SPE2-4
<400>116
gtgactgccg cgaccttgct cgccatcaac gcactcatac tggcgagaag ccatacaaat 60
gtccagaatg tggc                                                   74
<210>117
<211>81
<212>DNA
<213>人工序列
<220>
<223>人工序列说明：寡核苷酸SPE2-2
<400>117
ggtaagtcct tctctcagag ctctcacctg gtgcgccacc agcgtaccca cacgggtgaa 60
aaaccgtata aatgcccagag                                            81
<210>118
<211>58
<212>DNA
<213>人工序列
<220>
<223>人工序列说明：寡核苷酸SPE2-5
<400>118
acgcaccagc ttgtcagagc ggctgaaaga cttgccacat tctggacatt tgtatggc    58
<210>119
<211>87
<212>DNA
<213>人工序列
<220>
<223>人工序列说明：寡核苷酸SPE2-1
<400>119
gaggaggagg aggtggccca ggcggccctc gagcccgggg agaagcccta tgcttgtccg 60
gaatgtggta agtccttctc tcagagc                                     87
<210>120
<211>81
<212>DNA
<213>人工序列
<220>
<223>人工序列说明：寡核苷酸SPE2-6
<400>120
gaggaggagg agctggccgg cctggccact agttttttta ccggtgtgag tacgttggtg 60
acgcaccagc ttgtcagagc g                                           81
<210>121
<211>18
<212>DNA
<213>人工序列
<220>
<223>人工序列说明：部分erbB-2 5’UTR
<400>121
ggggccggag ccgcagtg                                               18
<210>122
<211>18
<212>DNA
<213>人工序列
<220>
<223>人工序列说明：部分erbB-3 5’UTR
<400>122
ggagccggag ccggagtc                                               18