《肽微阵列及使用方法.pdf》由会员分享,可在线阅读,更多相关《肽微阵列及使用方法.pdf(86页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 103122486 A (43)申请公布日 2013.05.29 CN 103122486 A *CN103122486A* (21)申请号 201210427378.0 (22)申请日 2012.10.31 61/555,778 2011.11.04 US C40B 40/10(2006.01) G01N 33/68(2006.01) (71)申请人 加利福尼亚大学董事会 地址 美国加利福尼亚州 (72)发明人 王巍 许峥 (74)专利代理机构 北京安信方达知识产权代理 有限公司 11262 代理人 申基成 郑霞 (54) 发明名称 肽微阵列及使用方法 (57) 摘。
2、要 一种包含多种预测的独特结合肽的肽微阵 列, 所述独特结合肽通过与目标蛋白质或其结构 域相互作用的计算预测而被选出。所选出的独特 结合肽被预合成, 随后被印刷和/或经由N端用接 头固定在固体载体表面上。还提供使用本发明肽 微阵列用于蛋白质 - 肽相互作用、 表位定位以及 药物筛选的定量测定的方法。 (30)优先权数据 (51)Int.Cl. 权利要求书 2 页 说明书 41 页 序列表 35 页 附图 7 页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书41页 序列表35页 附图7页 (10)申请公布号 CN 103122486 A CN 1031224。
3、86 A *CN103122486A* 1/2 页 2 1. 一种包含固体载体表面和多种预测的独特结合肽的肽微阵列, 所述结合肽被预合成 并且通过接头固定在所述固体载体表面上, 其中所述预测的独特结合肽通过与目标蛋白质 或其结构域相互作用的计算预测而被选出以用于所述微阵列。 2.如权利要求1所述的肽微阵列, 其中100个与1000个之间的预测的独特结合肽被固 定在所述固体载体表面上。 3.如权利要求1所述的肽微阵列, 其中所述接头是氨基己酸(Ahx)或聚乙二醇(PEG)。 4. 如权利要求 1 所述的肽微阵列, 其中至少一种预测的独特结合肽被甲基化或乙酰 化。 5. 如权利要求 1 所述的肽微。
4、阵列, 其中所述预测的独特结合肽在每一端用丙氨酸加 帽。 6. 如权利要求 1 所述的肽微阵列, 其中所述计算预测包括至少三种分析途径的组合, 所述分析途径选自由以下组成的组 : 结构信息、 所述肽 - 蛋白质相互作用的能量模式、 分子 动力学模拟、 进化过程中的保守、 突变、 亚细胞定位、 功能性过滤过程、 蛋白质组扫描以及质 谱证据。 7. 一种鉴定与目标蛋白质或其结构域相互作用的一种或多种结合肽的方法, 所述方法 包括 : a) 为针对所述目标蛋白质或其结构域的预测的独特结合肽提供计算预测 ; b) 基于所述计算预测选择多种预测的独特结合肽 ; c) 产生包含所述多种预测的独特结合肽的肽。
5、微阵列, 所述结合肽被预合成并且通过接 头固定在固体载体表面上 ; d) 将所述微阵列暴露于所述目标蛋白质或其结构域 ; 以及 e) 在所述微阵列上检测预测的结合肽与所述目标蛋白质或其结构域的相互作用, 从而 鉴定与目标蛋白质或其结构域相互作用的一种或多种结合肽。 8. 如权利要求 7 所述的方法, 其中所述计算预测包括至少三种分析途径的组合, 所述 分析途径选自由以下组成的组 : 结构信息、 所述肽 - 蛋白质相互作用的能量模式、 分子动力 学模拟、 进化过程中的保守、 突变、 亚细胞定位、 功能性过滤过程、 蛋白质组扫描以及质谱证 据。 9.如权利要求7所述的方法, 其中100个与1000。
6、个之间的预测的独特结合肽被固定在 所述固体载体表面上。 10. 如权利要求 7 所述的方法, 其中所述接头是氨基己酸 (Ahx) 或聚乙二醇 (PEG)。 11. 如权利要求 7 所述的方法, 其中至少一种预测的独特结合肽被甲基化或乙酰化。 12. 如权利要求 7 所述的方法, 其中所述预测的结合肽在每一端用丙氨酸加帽以便稳 定在所述固体载体表面上的固定。 13. 如权利要求 7 所述的方法, 其中所述目标蛋白质或其结构域被甲基化或乙酰化。 14. 如权利要求 7 所述的方法, 其中所述检测包括荧光信号的检测, 所述荧光信号与结 合亲和力相关并且提供所述结合肽与所述目标蛋白质或其蛋白质结构域之。
7、间相互作用的 定量测量。 15. 如权利要求 7 所述的方法, 其中所述结合肽 - 蛋白质相互作用是瞬时相互作用。 16. 如权利要求 1 所述的肽微阵列的用途, 其用于表位定位。 权 利 要 求 书 CN 103122486 A 2 2/2 页 3 17. 如权利要求 1 所述的肽微阵列的用途, 其用于药物筛选或疫苗开发。 18. 如权利要求 1 所述的肽微阵列的用途, 其与多种计算预测组合用于鉴定修饰肽。 19. 如权利要求 18 所述的肽微阵列的用途, 其中所述修饰肽是甲基化的或乙酰化的 肽, 这些肽对应于调节赖氨酸甲基化的翻译后修饰 (PTM) 蛋白质。 权 利 要 求 书 CN 10。
8、3122486 A 3 1/41 页 4 肽微阵列及使用方法 0001 相关申请的交叉引用 0002 本申请要求于 2011 年 11 月 4 日提交的美国临时申请序列号 61/555,778 的优先 权, 所述临时申请以引用的方式整体并入本文。 0003 相关政府声明 0004 本发明在美国国立卫生研究院(NIH)授予的批准号GM085188下受到政府支持。 政 府在本发明中具有一定权利。 发明领域 0005 本发明涉及用于鉴定蛋白质 - 蛋白质相互作用的肽微阵列及其使用方法。 0006 发明背景 0007 肽微阵列(一般也称为肽芯片或肽表位微阵列)是陈列在通常为玻璃或塑料芯片 的固体表面上。
9、的肽的集合。科学家在生物学、 医学以及药理学中使用肽芯片来总体上研究 蛋白质 - 蛋白质相互作用的结合性质和功能以及动力学。在基础研究中, 肽微阵列常常被 用来剖析酶 ( 如激酶、 磷酸酶、 蛋白酶、 乙酰转移酶、 组蛋白脱乙酰基酶等 )、 定位抗体表位 或找到蛋白质结合的关键残基。实际应用包括发现血清标记、 剖析个别患者在疾病恶化期 间的变化的体液免疫反应、 监测治疗干预、 患者分层以及诊断工具和疫苗的开发。 0008 肽微阵列的测定准则类似于酶联免疫吸附测定 (ELISA) 方案。所述肽 ( 数以千计 的几种副本 ) 被连接至玻璃芯片的表面。这个肽芯片可以直接用各种不同的生物样品来培 育,。
10、 所述生物样品如纯化的酶或抗体、 患者或动物血清、 细胞溶解物等。在一些清洗步骤之 后, 采用有所需要的特异性 ( 例如, 人 / 小鼠抗 IgG 或抗磷酸酪氨酸或抗 myc) 的二级抗体。 典型地, 用能够被荧光扫描仪检测到的荧光标签来标记所述二级抗体。其它检测方法包括 化学发光法或放射自显影法。 0009 因此, 肽微阵列是上面散布有肽或表面上直接组装有肽的平面载玻片。虽然用当 前技术散布肽可能在散布之前经受质量控制并且由单一合成批料产生, 但是在所述表面上 直接合成的肽可能受到不同批料之间的变化和有限的质量控制选择方案的影响。然而, 现 在将肽散布在载体表面上仍具有明显的限制。一个限制是。
11、所需要的肽阵列的大尺寸, 所述 大尺寸约束所述肽阵列用于蛋白质组测量的被成比例扩大的能力。 第二个限制是肽散布输 出常常是定性而不是定量的。第三个限制是肽合成的高成本和缺乏必要的仪器, 这妨碍作 为常规技术来实施所述肽微阵列。在当前技术中存在其它限制。 0010 因此, 需要开发出一种改善先前技术的肽微阵列技术。 0011 发明概述 0012 本发明提供一种包括固体载体表面和多种预测的独特结合肽的肽微阵列, 所述结 合肽被预合成并且通过接头固定在所述固体载体表面上, 其中所述预测的独特结合肽通过 与目标蛋白质或其结构域相互作用的计算预测而被选出以用于所述微阵列。 在某些实施方 案中, 本发明的。
12、所述肽微阵列含有固定在所述固体载体表面上的10个至10,000个、 50个至 5,000 个、 100 个至 1,000 个、 200 个至 900 个、 300 个至个 800 个, 或 400 个至 700 个之间, 说 明 书 CN 103122486 A 4 2/41 页 5 包括之间的任何数量的预测的独特结合肽或其结构域。在某些实施方案中, 所述目标肽或 其结构域或所述预测的结合肽被修饰, 所述修饰包括但不限于甲基化或乙酰化。在某些实 施方案中, 各预测的独特结合肽的多个副本被固定在所述固体载体上。 0013 在某些实施方案中, 用于将肽固定在所述微阵列的所述固体载体表面上的附接至 。
13、所述预测的结合肽的接头包括但不限于氨基己酸 (Ahx) 或聚乙二醇 (PEG)。在某些实施方 案中, 所述预测的结合肽在每一端用丙氨酸加帽。本发明涵盖本技术领域现在已知或以后 开发的用于任何类型的微阵列技术的任何合适的接头或加帽分子。 0014 本发明提供通过计算预测来选择用于微阵列的所述预测的独特结合肽。 在某些实 施方案中, 所述计算预测包括至少三种分析途径的组合, 所述分析途径选自由以下组成的 组 : 结构信息、 所述肽 - 蛋白质相互作用的能量模式 ( 例如, 范德华 (van der Waals)、 静电 和反溶剂能量 )、 分子动力学模拟、 进化过程中的保守、 突变、 亚细胞定位、。
14、 功能性过滤过程、 蛋白质组扫描以及质谱证据。在某些实施方案中, 所述计算预测包括本技术领域现在已知 或以后开发的用于选择预测的结合肽的至少四种、 五种、 六种、 七种、 八种、 九种、 十种或更 多种结构性和 / 或功能性计算途径的组合。 0015 本发明进一步提供一种鉴定与目标蛋白质或其结构域相互作用的一种或多种结 合肽的方法, 所述方法包括以下步骤 : a) 为针对所述目标蛋白质或其结构域的结合肽提供 计算预测 ; b) 基于所述计算预测选择多种所述预测的独特结合肽 ; c) 产生包括所述多种预 测的独特结合肽的肽微阵列, 所述结合肽被预合成并且通过接头固定在固体载体表面上 ; d) 将。
15、所述微阵列暴露于所述目标蛋白质或其结构域中 ; 以及 e) 在所述微阵列上检测一种 或多种预测的独特结合肽与所述目标蛋白质或其结构域的相互作用, 从而鉴定与目标蛋白 质或其结构域相互作用的一种或多种结合肽。 0016 在某些实施方案中, 当所述结合肽和 / 或所述目标蛋白质或其结构域未被修饰或 被修饰 ( 所述修饰包括但不限于甲基化或乙酰化 ) 时, 本发明的方法能够鉴定结合肽 - 蛋 白质相互作用。因此, 本发明提供一种肽微阵列结合计算预测用于鉴定未修饰和 / 或修饰 的结合肽、 目标蛋白质或其结构域或基序的用途。在某些实施方案中, 所述修饰的结合肽、 目标蛋白质或其结构域或基序包括调节赖氨。
16、酸甲基化的翻译后修饰 (PTM) 蛋白质。 0017 在其它实施方案中, 本发明的方法也能够鉴定和 / 或检测并且量化结合肽与目标 蛋白质或其结构域之间的瞬时相互作用。在某些实施方案中, 所述结合肽与所述目标蛋白 质或其结构域之间的相互作用经由荧光信号被检测到, 所述荧光信号与结合亲和性相关并 且提供所述结合肽与目标蛋白质或其结构域之间的相互作用的定量测量。 本发明也涵盖本 技术领域现在已知或以后开发的用于任何类型的微阵列技术的任何其它检测方法。 也提供 作为非限制性实例的用于表位定位和药物筛选或疫苗开发的本发明的肽微阵列的用途。 0018 附图简述 0019 图1示出用于鉴定人类蛋白质组中A。
17、bl1SH3结构域的潜在结合肽的计算预测分析 的示例性流程图。右侧的数字指示在左侧的步骤之后残余的肽的数量。(1) 用含有人类蛋 白质组中的 PxxP 基序的 69,404 个肽开始。所有的肽按文献 (8) 中确定的 PSSM 来排序。这 个 PSSM 是通过将在各位置的肽残基突变成所有其它 19 种氨基酸来产生。计算出野生型与 突变的肽之间的结合自由能量差来表示在特定的肽的位置的氨基酸的优先性。 用所述PSSM 排序的前 10,000 个肽被选择用于进一步分析。(2) 因为所述 Abl1SH3 结构域在 7 个物种 说 明 书 CN 103122486 A 5 3/41 页 6 中被完全保守。
18、, 所以所述结合肽也有可能被保守。采用保守过滤程序来鉴定 Abl1 的最稳 定的相互作用配偶体并且 4,981 个肽通过这个过滤程序。(3) 连续采用一种称为 MIEC-SVM 的分类模型来删除假阳性 (falsepositive)。在先前研究 (12) 中, 这个 MIEC-SVM 模型基 于 SH3- 肽相互作用界面的能量表征并且在 18SH3 结构域上培养。所述 MIEC-SVM 模型预测 1,394 个肽为结合剂。(4) 所述 1,394 个肽中的前 700 个 ( 用所述 PSSM 排序 ) 被合成并且 被印刷 / 固定在微阵列上。237 个肽显示出明显的结合强度并且被认为是所述 A。
19、bl1SH3 结 构域的潜在结合配偶体。 0020 图 2 示出将所述 Abl1SH3 结构域结合至所述微阵列上的十个测试肽。十个肽包括 4 个已知的结合剂和 6 个非结合剂 ( 所述 6 个非结合剂包括 4 个结合至其它 SH3 结构域但 不是 Abl1 的肽, 以及 2 个没有 PxxP 基序的肽 )。左上图示出两个微阵列上的受测试肽的 荧光信号, 所述两个微阵列上有两种印刷量的肽。左下图示出所述微阵列上的所述肽位置 ( 黑色 : 小印刷点 ; 红灰色范围 : 大印刷点 )。在所述微阵列上测到两种印刷尺寸的肽并且 在这些附接至所述玻璃表面 ( 右图 ) 的肽的 N 端测到两种接头 ( 氨基。
20、己酸 Ahx 和聚乙二醇 PEG)。图 2 以出现的顺序分别公开 SEQ ID NOS 107 至 126。 0021 图 3 示出所述 Abl SH3 结构域与 100 个对照 (50 个阳性和 50 个阴性 ) 肽和所述 前 700 个预测的结合剂的结合。各肽被印刷在所述微阵列上三次。 0022 图 4 提供肽微阵列实验中荧光强度的分布的建模。左侧和右侧 : 在所述微阵列上 的高和低印刷量的肽。 0023 图 5 示出所述 100 个对照肽的微阵列结合测量。X 轴是实验上确定的 Kd并且单位 是 M。Y 轴是微阵列的荧光强度。前 38 个结合肽的 Kd是已知的。剩下的 12 个已知结合 肽。
21、不具有测量过的 Kd。为达到图示目的, 这 12 个结合剂和所述 50 个非结合剂的 Kd 分别被 人工指定为 180M 和 200M。这些肽的荧光强度是三次高印刷浓度的平均数。 0024 图 6 提供所述 700 个肽中的所述结合剂和非结合剂的 PSSM 评分的分布。 0025 图 7 提供多梳 (Polycomb)/H3K27me3 复合体。(a, 正视图 ; b, 后视图 ) 只显示出多 梳中对结合至 H3 重要的残基。疏水残基以灰度级显示为褐色, 酸性残基呈橙色, 碱性残基 呈蓝绿色, 并且极性残基呈紫罗兰色。多梳的残余物的主链显示为绿色带状, 并且 H3 显示 为甘草模型。 H3R2。
22、6显示呈红色, H3K27me3呈橙色, H3S28呈黄色, H3A24和H3A25呈品红色, 并且 H3L20 至 H3K23 呈淡蓝色。(c) 多梳 /H3K27me3 复合体的正交图。通过分子表面渲染 来显示所述多梳蛋白质, 并且除了灰度级分别为石灰绿、 海绿色以及橄榄绿的 Tyr26、 Trp47 以及 Trp50, 所有残基呈绿色。H3 显示为甘草模型 ; H3R26 呈橙色而 H3K27me3 呈黄色, 并且 剩余的 H3 呈灰色。通过 VMD66产生图像。图 7 公开 “Asp23 至 Glu29” 为 SEQ ID NO : 127。 0026 图8示出结合至组蛋白H3/H4肽。
23、的多梳蛋白质染色质结构域的微阵列数据的混合 高斯拟合 (gaussian fit)( 黑色 ; 总体 ; 蓝色 : 非结合背景分布 ; 红色 : 结合分布 )。颜色以 灰度级显示。 0027 图 9 示出针对多梳结合和非多梳结合组蛋白肽的 ROC 曲线。 0028 图 10 示出蛋白质组扫描流程图。图 10 公开 “L20 至 R26” 为 SEQID NO : 130。 0029 发明详述 0030 本发明提供一种包括固体载体表面的肽微阵列, 所述表面上通过接头固定有多种 预测的独特结合肽。所述预测的独特结合肽已通过与目标蛋白质或其结构域相互作用的 说 明 书 CN 103122486 A 。
24、6 4/41 页 7 计算预测被预先选出以用于微阵列。在所述计算预测选择之后, 在被固定在所述微阵列的 所述固体载体表面上之前合成所述预测的独特结合肽。本发明涵盖现在已知或以后开发 的能够用于任何类型的微阵列技术的任何合适的固体载体表面。在某些实施方案中, 所述 肽微阵列的所述固体载体表面是玻璃表面。如本文所使用, 术语 “微阵列” 和 / 或 “肽微阵 列” ( 或 “肽芯片” ) 在本技术领域中众所周知, 并且是指陈列在通常为玻璃或塑料芯片的固 体表面上的肽的集合, 并且总体上被用于研究蛋白质 - 蛋白质相互作用的结合性质和功能 性以及动力学。 0031 有预合成并且然后印刷在玻璃表面上的。
25、预测的独特结合肽的本发明的肽微阵列 明显减小阵列的尺寸。由于计算预测分析, 本发明的肽微阵列比传统肽微阵列需要更少的 肽。 使用本发明的所述肽微阵列, 也需要很少量的蛋白质用于分析, 这在患者样品的量通常 是有限的疾病诊断中特别有用。 本发明的肽微阵列及其使用方法明显降低生产和采用肽微 阵列的成本。 0032 在某些实施方案中, 本发明的所述肽微阵列含有固定在所述固体载体表面上的 10 个至 10,000 个、 50 个至 5,000 个、 100 个至 1,000 个、 200 个至 900 个、 300 个至 800 个, 或 个 400 至 700 个, 包括之间的任何数量的预测的独特结。
26、合肽或其结构域。在某些实施方案 中, 所述微阵列含有少于 1,000 个独特预测的结合肽。在某些实施方案中, 所述预测的结合 肽或其结构域被修饰, 所述修饰包括但不限于甲基化或乙酰化。如本文所使用, 术语 “肽” 和 / 或 “蛋白质” 可以交换使用, 通常是指用肽键连接的氨基酸单体的短聚合物链, 所述肽 键是在一个分子的羧基与另一个分子的氨基发生反应时, 在两个分子之间形成的共价化学 键。术语 “肽” 通常是指典型地含有少于 50 个单体单位的较短的链, 而 “蛋白质” 通常是指 典型地含有超过数百个氨基酸单体的较长的链。 0033 如本文所使用,“肽” 或 “多肽” 包括两个或更多个亚单位。
27、氨基酸、 氨基酸类似物或 拟肽物的化合物。所述亚单位可以用肽键连接。在另一个实施方案中, 所述亚单位可以用 例如酯、 醚等的其它键来连接。如本文所使用, 术语 “氨基酸” 包括天然和 / 或非天然或合 成氨基酸 ( 包括 D 或 L 光学异构体 ) 以及氨基酸类似物和拟肽物。本文所提及的 “蛋白质” 通常在长度上为 50 个氨基酸或更长。本发明的所述肽可以在长度上从大于 2 个和少于 50 个氨基酸之间变化, 或在 3 个至 30 个、 4 个至 20 个、 5 个至 15 个之间或为 6 个、 7 个、 8 个、 9 个、 10 个、 11 个或 12 个氨基酸。 0034 如本文所使用, 。
28、蛋白质和 / 或结合肽可以包含修饰的氨基酸, 所述修饰的氨基酸 包括但不限于甲基化或乙酰化氨基酸和 / 或氨基酸类似物。如果存在氨基酸结构的修饰, 可以在聚合物的组装之前或之后使氨基酸结构修饰。 氨基酸的序列可以用非氨基酸组分来 中断。可以在聚合反应之后使肽链进一步修饰, 如通过与标签组分、 接头和 / 或位于 C 端和 N端的一端或两端的加帽分子共轭。 本发明的蛋白质和/或结合肽可以是天然存在的、 合成 的、 重组的、 嵌合的或其任何组合。 本发明涵盖来自任何物种或资源, 包括但不限于人、 哺乳 动物、 动物、 植物、 细菌、 真菌、 病毒等的蛋白质和 / 或结合肽。本技术领域众所周知隔离和。
29、 纯化蛋白质或肽的方法以及合成或制造重组和 / 或嵌合蛋白质的方法。 0035 如本文所使用, 术语 “结构域” 或 “基序” 可以交换使用, 并且是指可以独立于所述 蛋白质链的其余部分进行进化、 起作用并且存在的给定蛋白质序列和结构的结构性或功能 性片段或部分。 “结构域” 或 “基序” 或 “片段” 的长度可以发生变化并且在长度上通常在约 说 明 书 CN 103122486 A 7 5/41 页 8 25 个氨基酸达 500 个氨基酸之间。 0036 所述预测的独特结合肽在被固定在所述微阵列中的固体载体表面上之前, 被原位 合成并且然后被附接至用于稳定所述固定的接头。在某些实施方案中, 。
30、所述附接至所述预 测的结合肽的接头包括但不限于氨基己酸(Ahx)或聚乙二醇(PEG)。 在某些实施方案中, 所 述预测的结合肽的每一端也用丙氨酸加帽。 本发明涵盖本技术领域现在已知或以后开发的 可以用于任何类型的微阵列技术的任何合适的接头或加帽分子。 0037 整篇本说明书引用包括专利、 公布的申请、 技术论文以及学术期刊的各种公布。 这 些引用的公布中的每一个以引用的方式整体并入本文。 0038 本发明提供通过计算预测而选出以用于微阵列的所述预测的独特结合肽, 所述计 算预测如 Hou 等的 (2006 年的公共科学图书馆计算生物学 (PLoSComput.Biol.) : 0046-005。
31、 和 2009 年的分子细胞蛋白质组学 (Mol.Cell Proteomics)8 : 639-649)( 各自的整体内容 以引用的方式并入本文 ) 所讨论。如本文所使用, 术语 “计算预测” 是指利用计算机的中 央处理器的任何方法和 / 或分析途径, 所述中央处理器能够测定一级、 二级以及三级蛋白 质结构和功能以及蛋白质 - 蛋白质相互作用。在某些实施方案中, 所述计算预测包括至少 三种分析途径的组合, 所述分析途径选自由以下组成的组 : 结构信息、 所述肽 - 蛋白质相 互作用的能量模式 ( 例如, 范德华、 静电和反溶剂能量 )、 分子动力学模拟、 进化过程中的 保守、 突变、 亚细胞。
32、定位、 功能性过滤过程、 蛋白质组扫描以及质谱证据。在某些实施方案 中, 所述计算预测包括本技术领域现在已知或以后开发的用于选择预测的结合肽的至少四 种或更多种结构性和 / 或功能性途径的组合。例如, 可以从 PRIDE(Vizcaino 等, 蛋白质 组鉴定数据库蛋白质组数据存储库指南 (A guide to theProteomics Identifications Database proteomics data repository), Proteomics 2009, 9, 4276-4283) 和 肽 数 据 集 (Peptide Atlas)(Deutsch 等人, 肽数据集 :。
33、 用于新兴定向蛋白质组工作流程的定 向 选 择 的 资 源 (Peptide Atlas : a resource for target selection for emerging targetedproteomics workflows), EMBO Rep 2008, 9, 429-434) 的 数 据 库 中 下 载 质 谱 数据并且可以使用软件 X ! TANDEM(Craig 和 Beavis, 串联 : 用串联式质谱图匹配蛋白 质 (TANDEM : matching proteins with tandemmass spectra), Bioinformatics, 2004,。
34、 20, 1466-1467) 和 INSPECT(Tanner 等, 检验 : 鉴定来自串联式质谱图的翻译后修饰肽 (InsPecT : identification of posttranslationally modified peptides from tandem massspectra), Anal Chem 2005, 77, 4626-4639) 来执行分析, 可以用 PSI-PRED3.0(Jones, 基于位置特异性评分矩阵的蛋白质二级结构预测 (Protein secondary structure prediction based on position-specifi。
35、cscoring matrices), JMol Biol 1999, 292, 195-202) 和 SSpro4.0(Chenget 等, 划痕 : 蛋白质结构和结构特点预测服务器 (SCRATCH : a proteinstructure and structural feature prediction server), Nucleic AcidsRes 2005, 33, W72-76) 来预测二级结构 ; 可以使用 DSSP(Kabsch 和 Sander, 蛋白质二级结构词 典 : 氢键和几何特点的图式识别 (Dictionary ofproteinsecondary struc。
36、ture : pattern recognition of hydrogen-bonded andgeometrical features), Biopolymers 1983, 22, 2577-2637) 来计算溶剂可达表面面积 (SASA) ; 可以用 BLAST(Altschul 等, 基础局部比 对搜索工具 (Basic local alignment search tool), JMol Biol 1990, 215, 403-410) 和 CLUSTALW2(Larkin 等, 数据模式 W 和数据模式 X 版本 2.0(ClustalW and Clustal X 说 明 书 。
37、CN 103122486 A 8 6/41 页 9 version 2.0), Bioinformatics 2007, 23, 2947-2948) 来评估多序列比对和保守。 0039 本发明进一步提供一种鉴定与目标蛋白质或其结构域相互作用的一种或多种结 合肽的方法, 所述方法包括以下步骤 : a) 为针对所述目标蛋白质或其结构域的结合肽提供 计算预测 ; b) 基于所述计算预测选择多种所述预测的独特结合肽 ; c) 产生包含所述多种预 测的独特结合肽的肽微阵列, 所述结合肽被预合成并且通过接头固定在固体载体表面上 ; d) 将所述微阵列暴露于所述目标蛋白质或其结构域中 ; 以及 e) 在所。
38、述微阵列上检测一种 或多种预测的独特结合肽与所述目标蛋白质或其结构域的相互作用, 从而鉴定与目标蛋白 质或其结构域相互作用的一种或多种结合肽。 0040 一方面, 本发明提供涉及化学合成肽和在具有 DNA 微阵列尺寸的玻璃载片上印刷 肽的肽微阵列技术。用目标蛋白质, 随后通过识别所述蛋白质的一级抗体并且然后通过有 荧光标签的二级抗体来培育所述载玻片。用标准 DNA 微阵列扫描仪扫描所述载玻片并且测 量每个肽点的荧光强度。 将蛋白质结合至肽产生荧光信号并且所述信号强度与它们的结合 亲和性相关, 这提供蛋白质 - 肽相互作用的定量测量。在其它实施方案中, 本发明的方法也 能够鉴定和 / 或检测结合。
39、肽与所述目标蛋白质或其结构域之间的瞬时相互作用。本发明也 涵盖本技术领域现在已知或以后开发的用于任何类型的微阵列技术的任何其它检测方法。 0041 在一个实施方案中, 本发明提供如融合至 GST 的 c-Abl 的 SH3 结构域的重组蛋白 质以及一组测试肽。这个 SH3 结构域的已知肽结合剂显示荧光信号, 而其它 SH3 结构域的 不规则肽和肽结合剂没有信号。实施例 1 进一步提供最优化肽微阵列技术和测定条件, 以 及荧光信号的强度和蛋白质 - 肽结合亲和性是否显示线性相关的测定。 0042 在另外的实施方案中, 本发明提供将计算机建模与肽微阵列技术结合以鉴定人类 蛋白质组中酪氨酸激酶 Ab。
40、l1 的 SH3 结构域的结合肽的系统途径。本发明提供针对 Abl1 蛋 白质的候选相互作用配偶体的综合列表, 其中许多甲基转移酶和 RNA 切片蛋白质的存在可 以表明 Abl1 在染色质重塑和 RNA 加工中的新功能。本发明的这个实施方案示出将计算和 实验方法结合的有力途径, 所述计算和实验方法使用肽微阵列技术来检测由结构域 - 肽识 别介导的蛋白质相互作用。 0043 本发明进一步提供肽微阵列和本发明的方法结合计算预测能够被用于在所述结 合肽和 / 或所述目标蛋白质或其结构域或基序未被修饰或被修饰 ( 所述修饰包括但不限 于甲基化或乙酰化 ) 时鉴定结合肽 - 蛋白质相互作用。在某些实施方。
41、案中, 所述修饰的结 合肽、 目标蛋白质或其结构域或基序是包括但不限于调节赖氨酸甲基化的翻译后修饰修饰 (PTM) 蛋白质的甲基化的或乙酰化的肽或蛋白质。 0044 一方面, 本发明提供将计算预测与肽微阵列结合的系统途径来用多梳染色质域蛋 白质识别甲基化肽, 并且鉴定来自苍蝇蛋白质组的含有甲基赖氨酸的肽, 所述计算预测包 括生物信息管道证据, 如保守、 亚细胞定位以及质谱数据。下文的实施例 2 提供这些实施方 案的更详细的讨论。 0045 因此, 本发明提供一种能够定量测定微阵列上的肽与目标蛋白质的结合亲和性的 肽微阵列技术, 并且因此, 提供进行蛋白质组的测量的定量、 高通量以及划算的方法。。
42、通过 在微阵列上印刷不同组的肽, 本发明的肽微阵列技术能够用于定义蛋白质结合特异性、 示 出蛋白质 - 蛋白质相互作用、 测定抗体识别的表位以及鉴定各种酶的底物。本发明的肽微 阵列技术的商业应用还包括但不限于 : 1) 以定量的方式同时研究一种或多种目标蛋白质 说 明 书 CN 103122486 A 9 7/41 页 10 与上千种肽的相互作用的研究用途, 和 2) 用于疾病诊断 ( 例如, 自身免疫疾病和过敏 ) 和 药物筛选 ( 例如, 疫苗开发 ) 的表位定位。 0046 以下实施例进一步说明本发明, 所述以下实施例不以任何方式被解释为对本发明 的范围施加限制。 本领域技术人员显而易见。
43、各种修改和变化是有可能的并且涵盖于本发明 的范围内。 实施例 0047 实施例 1 0048 通过将计算预测与肽微阵列结合来对 Abl1SH3 0049 结合肽进行全蛋白质组检测 0050 引言 0051 人类酪氨酸激酶 Abl1 在信号转导中起着重要作用并且与多种细胞蛋白质 (1, 2) 相互作用。 断裂点簇集区(BCR)与ABL基因的融合形成致癌BCR-ABL, 其会导致某些人类白 血病 (3)。Abl1 蛋白由几个模块化结构域组成, 包括形成分子内和分子间相互作用以便调 节其激酶活性 (1, 2) 的一个 SH3 结构域以及一个 SH2 结构域。虽然已报告 Abl1 的许多相 互作用配偶。
44、体, 如 Abi1、 Abi2 以及 Rin1(2), 由弱及瞬时 SH3 肽相互作用介导的配偶体的全 蛋白质组鉴定仍是不完全的并且仍是具有挑战性的问题。 0052 高通量技术如酵母双杂交以及蛋白复合物纯化连同质谱分析法极大地促进了蛋 白质 - 蛋白质相互作用的鉴定。然而, 因为它们未进行优化设计以便检测弱及瞬时结构 域 - 肽相互作用, 此类相互作用经常在蛋白质组学筛选 (4, 5) 中未被充分代表。另一方面, 经常使用体外结合测定如噬菌体展示、 肽阵列以及蛋白质阵列以便确定模块化结构域的结 合特异性。这些技术各具有优点以及局限性。噬菌体展示与肽阵列是互补技术 : 前者可以 针对给定域测试大。
45、量随机肽的结合而后者可以确定一组特定目标肽的结合。 与这两种技术 相比, 蛋白质阵列经常在表面存在相对较小数量的蛋白质以便测试合成肽或纯化蛋白质的 结合。计算分析对于这些体内或体外实验测量是至关重要的, 因为它 1) 去除体内数据的假 阳性并且恢复体内数据的假阴性 ; 2) 基于由体外实验确定的结合基序预测全蛋白质组相 互作用配偶体以便指导进一步实验研究。 0053 在此提出综合法以便鉴定人类蛋白质组中 Abl1 的相互作用配偶体 : 计算预测通 过结合多种来源的数据进行, 包括结构信息、 SH3- 肽相互作用的能量模式以及在进化过程 中的保守性 ; 然后使用肽微阵列技术测试所预测的相互作用。。
46、不同于在纤维素膜上合成肽 (6) 的普及 SPOT 技术, 预合成以及质量控制肽被印刷并且固定在玻璃表面上以便与纯化的 Abl1SH3 结构域杂交, 这样证实了 237 个预测相互作用。由 SH3- 肽相互作用介导的 Abl1 的 推定相互作用配偶体的全蛋白质组鉴定揭示Abl1在染色质重塑以及RNA加工中的新功能。 它也极大地增强了对 Abl1 调节机制的了解。 0054 方法 0055 I. Abl SH3 结合肽的计算预测 0056 1. 使用源于自由能计算的位置特异性评分矩阵 (PSSM) 筛选数据库 0057 使用我们在之前的研究 (8) 中开发的 PSSM 对 UniProt 数据库。
47、 (7) 中的所有 10 个 残基长度的肽进行评分。所述 PSSM 是 10x20 矩阵, 其表示突变肽与模板肽之间的结合自由 说 明 书 CN 103122486 A 10 8/41 页 11 能的差异 ( 详见 (8)。简单来说, 使用 MM/PBSA 基于晶体结构 (PDB 项 1bbz) 计算所述模板 肽的结合自由能。然后将所述肽中对于其它 19 个氨基酸的各残基进行突变并且计算结合 自由能的变化。这一变化反映了在各肽残基上的氨基酸的优先性并且在 10x20 矩阵中进行 编码以便用作 PSSM 来评分肽序列。所述肽评分如下计算 :其中 Ms, i为氨基酸 S 在 PSSM 中第 i 个。
48、位置的评分并且 Si为在所述肽的第 i 个位置的氨基酸。前 10,000 个具 有 PxxP 基序的肽 (x 表示任何氨基酸 ) 被保存用于进一步分析。 0058 2. 七个物种之间的保守性分析 0059 对七个物种进行保守性分析 : 智人 (Homo sapiens)( 人类 )、 黑猩猩 (Pan troglodytes)(黑猩猩(chimpanzee)、 猕猴(Macaca mulatta)(猕猴(rhesus macaque)、 小 家 鼠 (Mus musculus)( 小 鼠 )、 褐 家 鼠 (Rattusnorvegicus)( 大 鼠 )、 家 犬 (Canis famili。
49、aris)( 犬 ) 以及牛 (Bos taurus)( 母牛 )。这七个物种的蛋白质序列是取自 NCBI BLAST服务器中的非冗余蛋白质序列数据库。 对于含有推定结合肽的各蛋白质, 如果其E值 10-10, 由 PSI-BLAST(33) 在各物种中发现的最佳匹配被视为同系物 ; 否则, 则视为非同系 物。然后使用 ClustalW 1.7(34) 比对所述人类蛋白质以及其同系物。接着, 对于所述 10 个残基长度的推定结合肽, 计算成对相似性评分 :其中 SAiBi是 PAM500 变异矩 阵中人类肽中的第 i 个位置上的残基 A 与其它物种中的第 i 个位置上的残基 B 之间的氨基 酸相似性评分。如果在任何物种的相应肽中发现间隙, 则此肽不被视为同系物。如果未发 现同系物, 则所述保守性分析不具有信息性并且序列相似性被设置为1.0。 只有成对相似性 等于或大于 0.9, 该肽才是保守的。此外, 只有人类肽在至少四种其它物种中是保守的情况 下, 它才会包括于列表中。 0060 3. 使用 MIEC-SVM 模型区分结。