质量标记物.pdf

上传人:le****a 文档编号:5773923 上传时间:2019-03-17 格式:PDF 页数:123 大小:7.55MB
返回 下载 相关 举报
摘要
申请专利号:

CN201480021462.X

申请日:

2014.05.15

公开号:

CN105209921A

公开日:

2015.12.30

当前法律状态:

撤回

有效性:

无权

法律详情:

发明专利申请公布后的视为撤回IPC(主分类):C07D 403/00申请公布日:20151230|||著录事项变更IPC(主分类):C07D 403/00变更事项:申请人变更前:电泳有限公司变更后:电泳有限公司变更事项:地址变更前:英国萨里郡变更后:英国伦敦|||实质审查的生效IPC(主分类):G01N 33/68申请日:20140515|||公开

IPC分类号:

G01N33/68; C07D403/00

主分类号:

G01N33/68

申请人:

电泳有限公司

发明人:

A·H·汤普森; C·劳布纳; K·库恩

地址:

英国萨里郡

优先权:

2013.05.15 GB 1308765.5

专利代理机构:

上海专利商标事务所有限公司 31100

代理人:

郭辉;江磊

PDF下载: PDF下载
内容摘要

本发明提供两种或多种质量标记物的集合,其中所述集合中的各质量标记物与所述集合中每个其它的标记物的整体质量相同,且所述集合中的各质量标记物的精确质量与所述集合中每个其它质量标记物的精确质量不同,从而所述集合中的所有质量标记物可通过质谱相互区分。

权利要求书

权利要求书
1.  两种或多种质量标记物的集合,其中所述集合中的各质量标记物与所述集合中每个其它的标记物的整体质量相同,且所述集合中的各质量标记物的精确质量与所述集合中所有其它质量标记物的精确质量不同,从而所述集合中的所有质量标记物可通过质谱相互区分。

2.  如权利要求1所述的两种或多种质量标记物的集合,其特征在于,各质量标记物包含报告物部分,且所述集合中的各质量标记物具有报告物部分,该报告物部分的精确质量不同于所述集合中每个其它的标记物的报告物部分的精确质量,从而所述报告物部分可通过质谱区分。

3.  如权利要求1所述的两种或多种质量标记物的集合,其特征在于,各质量标记物包含报告物部分,且所述集合中的各质量标记物具有报告物部分,该报告物部分的整体质量不同于所述集合中每个其它的标记物的报告物部分的整体质量,从而所述报告物部分可通过质谱区分。

4.  如权利要求1或权利要求2所述的两种或多种质量标记物的集合,其特征在于,所述质量标记物中至少两种之间的精确质量差异小于100毫道尔顿,优选地小于50毫道尔顿。

5.  如前述权利要求中任一项所述的两种或多种质量标记物的集合,其特征在于,所述集合中各质量标记物是所述集合中每个其它的质量标记物的同位素异数体。

6.  如前述权利要求中任一项所述的两种或多种质量标记物的集合,其特征在于,通过不同数目或种类的一种或多种重同位素替代物来提供所述精确质量差异。

7.  如前述权利要求中任一项所述的两种或多种质量标记物的集合,其特征在于,所述集合包含n种质量标记物,其中第m种质量标记物包含(n-m)个原子的第一重同位素和(m-1)个原子的第二重同位素,该第二重同位素不同于第一重同位素,其中m的数值是1到n。

8.  如权利要求7所述的集合,其特征在于,所述重同位素是2H、13C或15N。

9.  如权利要求7或8所述的集合,其特征在于,第一重同位素是13C和第二重同位素是15N。

10.  如权利要求1-6中任一项所述的两种或多种质量标记物的集合,其特征在于,所述集合包含n种质量标记物,其中第m种质量标记物包含(n-m)个原子的选自18O或34S的第一重同位素和(2m-2)个原子的选自2H或13C或15N的第二重同位素,该第二重同位素不同于第一重同位素,其中m的数值是1到n。

11.  如前述权利要求中任一项所述的两种或多种质量标记物的集合,其特征在于,各标记物包含下述结构式:
X-L-M
其中X是报告物部分,L是通过质谱仪中的碰撞可劈裂的接头,和M是质量调节部分,其中各质量标记物还包含反应性官能团Re,用于将所述质量标记物连接到分析物。

12.  如权利要求11所述的两种或多种质量标记物的集合,其特征在于,各质量标记物的所述报告物部分不包含重同位素。

13.  如权利要求11或权利要求12所述的两种或多种质量标记物的集合,其特征在于,各质量标记物包含通式:
X-(L)k1-M-(L)k2-Re或M-(L)k1-X-(L)k2-Re;
其中k1和k2独立地是0-10之间的整数。

14.  如权利要求11-13中任一项所述的两种或多种质量标记物的集合,其特征在于,所述接头L包含酰胺键。

15.  如权利要求11-14中任一项所述的两种或多种质量标记物的集合,其特征在于,所述报告物部分是质量指示部分,所述质量调节部分是质量归一化部分,其中,所述质量归一化部分确保各质量标记物具有所需的整体或精确质量。

16.  如权利要求11-15中任一项所述的两种或多种质量标记物的集合,其特征在于,所述集合中的各质量标记物具有下述一种的通用结构:


其中,*表示氧是18O,碳是13C,氮是15N或氢是2H;其中所述集合中各标记物包含一个或多个*,从而在n个标签的所述集合中,第m种标签包含(n-m)个原子的第一重同位素和(m-1)个原子的第二重同位素,该第二重同位素不同于第一重同位素,m是1到n,n是2或更大;以及其中环状单元是芳族或脂族并在任意两个毗邻原子之间独立含有0-3个双键;各Z独立地为N、N(R1)、C(R1)、CO、CO(R1)(即–O-C(R1)-或–C(R1)-O-)、C(R1)2、O或S;X是N、C或C(R1);各R1独立地为H,取代或未取代的直链或支链C1-C6烷基,取代或未取代的脂环族基团,取代或未取代的芳基或取代或未取代的杂环基或氨基酸侧链;以及a是0-10的整数;和b是至少1,其中c是至少1。

17.  如权利要求16所述的两种或多种质量标记物的集合,其特征在于,所述集合中的各质量标记物具有下述中一种的结构:



其中*表示氧是O18,碳是C13或氮是N15或该位点的杂原子被氢化,*可表示H2和其中所述集合中的各标记物包含一个或多个*,从而在n种质量标记物的所述集合中,第m种质量标记物包含(n-m)个原子的第一重同位素和(m-1)个原子的第二重同位素,该第二重同位素不同于第一重同位素,其中m的数值是1到n,n是2或更大。

18.  如前述权利要求中任一项所述的两种或多种质量标记物的集合,其特征在于,所述集合包含下述质量标记物:



19.  如权利要求1-17中任一项所述的质量标记物的集合,其特征在于,所述集合包含下述质量标记物:



20.  如权利要求1-17中任一项所述的质量标记物的集合,其特征在于,所述集合包含下述质量标记物:


21.  如权利要求1-17中任一项所述的质量标记物的集合,其特征在于,所述集合包含下述质量标记物:


22.  如权利要求1-17中任一项所述的质量标记物的集合,其特征在于,所述集合包含下述质量标记物:


23.  如权利要求1-17中任一项所述的质量标记物的集合,其特征在于,所述集合包含下述质量标记物:


24.  如权利要求1-17中任一项所述的质量标记物的集合,其特征在于,所述集合包含下述质量标记物:



25.  如权利要求1-17中任一项所述的质量标记物的集合,其特征在于,所述集合包含下述质量标记物:


26.  如权利要求1-17中任一项所述的质量标记物的集合,其特征在于,所述集合包含下述质量标记物:


27.  如权利要求1-15中任一项所述的两种或多种质量标记物的集合,其特征在于,所述集合中的各质量标记物具有下述中一种的通用结构:


28.  一种质量标记物的阵列,其包含两个或多个如前述权利要求中任一项所限定的质量标记物的集合。

29.  如权利要求28所述的质量标记物的阵列,其特征在于,所述阵列中任意一种集合的各质量标记物的整体质量不同于所述阵列中每个其它的集合的各质量标记物的整体质量。

30.  如权利要求28或权利要求29所述的阵列,其特征在于,所述集合中的各质量标记物与所述集合的每个其它的成员是化学相同的,但与所述阵列的每个其它的集合中的各质量标记物不是化学相同的。

31.  如权利要求29或权利要求30所述的阵列,其特征在于,通过存在质量系列改性基团来提供整体质量的差异。

32.  如权利要求29-31任一项所述的阵列,其特征在于,所述阵列中的各质量标记物的集合具有不同的k1+k2数值。

33.  如权利要求29所述的阵列,其特征在于,通过不同数目或种类的一种或多种重同位素替代物来提供整体质量的差异。

34.  如权利要求33所述的质量标记物的阵列,其特征在于,其包含第一质量标记物的集合和第二质量标记物的集合,其中第一质量标记物的集合中第m种质量标记物和第(m+1)种质量标记物之间的精确质量的差异是d1,第二质量标记物的集合中第m种质量标记物和第(m+1)种质量标记物之间的精确质量的差异是d2,且d1不等于d2。

35.  如权利要求28-34中任一项所述的阵列,其特征在于,所述阵列包含第一质量标记物的集合和第二质量标记物的集合,第一集合中的各质量标记物包含能与分析物的第一反应性基团反应的第一反应性官能团,第二集合中的各质量标记物包含能与该分析物中的第二反应性基团反应的第二反应性官能团。

36.  如前述权利要求中任一项所述的质量标记物的集合或阵列,其特征在于,所述质量标记物在离子阱质谱仪中可区分,优选地在分辨率大于60,000且质荷比为400的离子阱质谱仪中,更优选地在分辨率大于100,000且质荷比为400的质谱仪中。

37.  一种质谱分析方法,所述方法包含通过使用质谱识别与分析物相关的质量标记物或质量标记物的组合来检测分析物,其中所述质量标记物是来自如前述权利要求中任一项所限定的质量标记物的集合或阵列的质量标记物。

38.  如权利要求37所述的质谱分析方法,其特征在于,所述方法包括下述步骤:
a.提供多个样品,其中使用质量标记物或质量标记物的组合差异化地标记各样品,其中所述质量标记物来自如前述权利要求中任一项所限定的质量标记物的集合或阵列;
b.混合所述多个标记的样品以形成包含标记的分析物的分析混合物;
c.任选地,在质谱仪中检测所述标记的分析物;
d.在质谱仪中解离所述标记的分析物以形成质量标记物和/或包含完整的质量标记物的分析物片段;
e.检测所述质量标记物和/或包含完整的质量标记物的分析物片段;
f.任选地,在质谱仪中解离所述质量标记物来释放报告物部分,并检测所述报告物部分;
g.任选地,解离在步骤f中形成的所述报告物部分以形成片段,并检测所述片段;
h.基于所述标记的分析物的质谱,和/或所述质量标记物和/或包含完整的质量标记物的分析物片段的质谱,和/或所述报告物部分或报告物部分的片段的质谱,来识别所述分析物。

39.  如权利要求38所述的质谱分析方法,其特征在于,基于所述标记的分析物的质谱来识别所述分析物。

40.  如权利要求38所述的质谱分析方法,其特征在于,基于所述质量标记物和/或包含完整的质量标记物的分析物片段的质谱来识别所述分析物。

41.  如权利要求40所述的质谱分析方法,其特征在于,所述包含完整的质量标记物的分析物片段是包含完整的质量标记物的b-系列离子,优选地是b1离子。

42.  如权利要求38所述的质谱分析方法,其特征在于,基于所述报告物部分或报告物部分的片段的质谱来识别所述分析物。

43.  如权利要求37所述的质谱分析方法,其特征在于,所述方法包括下述步骤:
a.提供多个样品,其中使用质量标记物或质量标记物的组合差异化地标记各样品,其中所述质量标记物来自如前述权利要求中任一项所限定的质量标记物的集合或阵列;
b.混合所述多个标记的样品以形成包含标记的分析物的分析混合物;
c.在质谱仪中检测所述标记的分析物;
d.在质谱仪中解离所述标记的分析物来释放所述报告物部分,并检测补足的离子,该补足的离子包含连接到所述分析物或分析物的片段的所述质量标记物的剩余物;
e.任选地,解离在步骤d中形成的所述补足的离子以形成片段并检测所述片段的一个或多个其它步骤;
f.基于所述标记的分析物的质谱和/或所述补足的离子和/或所述补足的离子的片段的质谱来识别所述分析物。

44.  如权利要求38-43中任一项所述的方法,其特征在于,所述解离是质谱仪中碰撞诱导的解离。

45.  如权利要求38-44中任一项所述的方法,其特征在于,在分辨率大于60,000且质荷比为400,优选地分辨率大于100,000且质荷比为400,更优选地分辨率大于250,000且质荷比为400的质谱仪中实施所述方法。

46.  如权利要求43-45中任一项所述的方法,其特征在于,步骤d中,通过来自接头L的一氧化碳的中性损失来形成所述补足的离子。

47.  如权利要求43-46中任一项所述的方法,其特征在于,所述质量标记物来自如权利要求6-35中任一项所定义的质量标记物的集合或阵列,其中对于各质量标记物,在所述报告物部分中不存在重同位素,以及各质量标记物的所有的所述重同位素存在于连接到所述分析物或分析物的片段的所述质量标记物的剩余物中。

48.  如权利要求38-47中任一项所述的方法,其特征在于,在步骤a)中,使用来自第一质量标记物的集合的质量标记物差异化地标记各样品,第一集合中的各质量标记物包含能与分析物中的第一反应性基团反应第一反应性官能团,其中在步骤a)中用使用来自第一集合的第m种质量标记物标记的分析物和使用来自第一集合的第(m+1)种质量标记物标记的分析物之间的精确质量的差异是所述分析物中第一反应性基团的数目的指示,其中对于具有单一第一反应性基团的分析物而言,质量差异是d1,对于具有n1个第一反应性基团的分析物而言,质量的差异是n1d1,其中n1是第一反应性基团的数目。

49.  如权利要求48所述的质谱分析方法,其特征在于,还包含使各样品与来自第二质量标记物的集合的质量标记物反应,第二集合中的各质量标记物包含能与所述分析物中的第二反应性基团反应的第二反应性官能团;其中使第二质量标记物的集合的第m种标记物和来自第一集合的第m种标记物与相同的样品反应,使用来自第一集合的第m种质量标记物和来自第二集合的第m种质量标记物标记的分析物与使用来自第一集合的第(m+1)种质量标记物和来自第二集合的第(m+1)种质量标记物标记的分析物之间的精确质量的差异是n1d1+n2d2,其中n1是第一反应性基团的数目,n2是第二反应性基团的数目,d1是只使用来自第一集合的第m种质量标记物标记的分析物和第(m+1)种质量标记物标记的分析物之间的精确质量的差异,和d2是只使用来自第二集合的第m种质量标记物标记的分析物和第(m+1)种质量标记物标记的分析物之间的精确质量的差异,且d1不等于d2。

50.  如权利要求49所述的质谱分析方法,其特征在于,第一反应性基团是游离的巯基,第二反应性基团是游离的氨基。

51.  如权利要求38-50中任一项所述的方法,其特征在于,识别所述分析物的步骤包含:
i.计算预计存在于样品中的一种或多种分析物的一系列取决于质量标记物、电荷和分析物质量的同位素分布模板,其中对于所述预计的分析物中存在的电荷状态、分析物的质量和质量标记物的数目的各种预计的组合,都存在模板;
ii.将取决于质量和电荷的同位素分布模板连续地应用到质谱中的离子,该质谱通过分析所述标记的分析物来形成,任选地从用于预期的最高质量标记物的数目和电荷状态的模板开始,从而寻找匹配所述同位素模板的质谱中的峰;
iii.任选地,将预期的同位素分布模型拟合到通过模板匹配过程识别的所述分析物离子,从而确认步骤ii中对分析物的初步识别,由此识别所述分析物的电荷状态和与所述分析物反应的质量标记物的数目。

52.  如权利要求38-51中任一项所述的方法,其特征在于,所述分析物选自蛋白质、多肽、肽、多糖、多核苷酸、氨基酸和核酸。

53.  如权利要求38-52中任一项所述的方法,其特征在于,所述分析物是肽,该肽通过酶消化蛋白质或蛋白质的混合物来制备。

54.  如权利要求53所述的方法,其特征在于,所述酶是LysC或胰蛋白酶。

55.  如权利要求51-54中任一项所述的方法,其特征在于,通过下述来确定用于肽的所述同位素分布模板:获得蛋白质的氨基酸序列,实施计算机模拟的酶消化氨基酸序列来形成预计的肽的列表和它们的相应的质量,根据质量对预计的肽进行分类,基于这些质量和已知的电荷状态和质量标记物的数目来制备同位素分布。

说明书

说明书质量标记物
本发明涉及可用于标记肽的反应性标记物,以及涉及用于对质谱进行解卷积(deconvoluting)或简化来识别和定量肽的方法。具体来说,本发明涉及下述方法:识别光谱中来自被研究的样品的离子的峰以及来自背景辐射、噪音或其它非数据来源的峰。具体来说,所述方法识别具有特殊的同位素变体分布的峰。因此,通过将特征同位素分布与预定的同位素分布模板进行比较,所述方法能快速识别离子。对于分析通过高分辨率和高的质量精确性质量分析仪如轨道阱和飞行时间质量分析仪获得的数据而言,这些方法特别有价值。
背景:
质谱兴起成为用于分析生物大分子的有利工具,特别是用于分析肽和蛋白质。例如,曼妮(Mann)和其同事已表明单一肽的质量以及部分的序列信息可足以识别母蛋白质(1),这可通过碰撞诱导的肽的解离来测定。结果,开发了新方法,其中将具体的肽以混合物的方式从各蛋白质分离。理论上来说,分析复杂的多肽混合物的最简单的方法是MudPIT步骤,其中使用蛋白酶消化多肽混合物并通过液相色谱质谱(LC-MS)分析所有的消化肽(2,3)。MudPIT方法通过尝试使用高分辨率多维色谱分离所有的这些肽,克服了样品的复杂性问题,但许多肽同时从色谱柱流出是很常见的。液相色谱分离通常通过电喷射离子化来源与质谱仪界面连接。电喷射离子化是一种非常“温和”的用于将液相离子变成气相的技术,但生物大分子的离子化趋于得到以多种电荷状态存在的离子,这使所得质谱变复杂(4)。因此,来自MudPIT和电喷射质谱仪的组合的质谱非常复杂。
此外,在过去的15年中,开发了多种具有重同位素替代物的化学质量标签,从而使得能实施并改善通过质谱定量分析生物分子。取决于标签设计,标签集合的成员要么是具有相同的化学结构和不同绝对质量的化学相同的(isochemic),或同时具有相同的结构和绝对质量的同量异位素的(isobaric)。化学相同的标签通常用于MS模式的定量,而同量异位素的标签在MS/MS模式中必须片段化来释放具有独特质量的报告物片段。到目前位置,同位素掺杂的质量标签主要用于分析蛋白质和核酸。
化学相同的质量标签的一种早期示例是同位素-编码的亲和性标签(ICAT)(5)。ICAT反应物是一对质量标签,其差异化地在一种(重)标签中包括重同位素,但在另一种(轻)标签中没有替代物。用重或轻标签标记两个样品,然后在用LC-MS分析之前进行混合。两样品中存在的肽将得到一对前体离子,其质量差异与重同位素原子替代物的数目成比例。
ICAT方法还显示了“取样”方法,这可用作调解处理少量肽来降低形成的质谱复杂性的需求且同时保留充分的关于原始样品的信息来识别该样品的组分的方式。ICAT过程所用的“同位素编码的亲和性标签”包含一对生物素接头同位素,其可与巯基反应,并用于捕集它们中具有半胱氨酸的肽。通常,蛋白质组中90-95%或蛋白质具有至少一种含半胱氨酸的肽,且通常含半胱氨酸的肽约表示所有肽的1/10,因此分析含半胱氨酸的肽显著降低了样品的复杂性,却不显著损失关于样品的信息。因此,在ICAT方法中,使来自一种来源的蛋白质的样品与“轻”同位素生物素接头反应,而使来自第二来源的蛋白质的样品与“重”同位素生物素接头反应,其通常比轻同位素更重4-8道尔顿。然后,合并两个样品,并使用肽链内切酶劈裂。然后,可在抗生物素蛋白化的珠子上分离生物素化的含半胱氨酸的肽,用于后续的通过质谱进行分析。可比较地定量两个样品:相应的肽对用作相互的标准物,使得能定量它们的比例。ICAT取样过程形成代表来源样品的肽混合物,其没有MudPIT那么复杂,但仍然分离大量肽且它们LC-MS/MS的分析形成复杂的光谱。与不含标记物的分析相比,使用2个ICAT标签时,质谱中肽离子数目增加一倍。化学相同的标签的其它示例包含提供最高达4种不同反应物的ICPL反应物,且与不含标记物的分析相比,使用ICPL时质谱中肽离子数目变成四倍。因此,使用简单的重同位素标签设计不太可能开发出可行的非常高水平的多路技术。
虽然化学相同的标签使得在蛋白组研究中进行量化并有助于实验重现性,但代价是增加质谱的复杂性。为了克服这个限制,和为了利用串联质谱的特殊性,开发了同量异位素的质量标签。自从在2000年(WO01/68664)引入之后,通过在混合之前统一标记蛋白质和肽中的胺官能度和同时分析多个样品,同量异位素的质量标签已提供改善的蛋白组表达轮廓化的方式。因为这些标签是同量异位素的并具有相同的质量,它们不会增加质谱的复杂性,因为在色谱分离中,相同的肽的所有前体精确地在相同的点出现并具有相同的聚集质量。只有当在串联质谱之前片段化分子时,才释放独特质量报告物,由此使得能计算各原始样品中存在的肽的相对或绝对量。
US7,294,456提出了同量异位素的质量标签的基本原理,并提供了合适的标签的具体示例,其中用分别包含13C和15N的重同位素形式取代分子中的不同具体的原子。US7,294,456还描述了使用抵销质量来制备多种同量异位素的集合,从而增加可用的总体通道(plexing)速率,且不过度地增加单个标签的尺寸。WO2004/070352描述了同量异位素的质量标签的其它集合。WO2007/012849描述其它的同量异位素的质量标签的集合,其包含3-[2-(2,6-二甲基-哌啶-1-基)-乙酰基氨基]-丙酸-(2,5-二氧代-吡咯烷-1-基)-酯(DMPip-βAla-OSu)。
尽管之前批露的同量异位素的质量标签带来显著的益处,但这些同量异位素的质量标签需要MS/MS分析来定量肽和肽通常单独地进行分析,这意味着在给定的时间内,可在能实施MS/MS的单一机器中分析的肽数目存在有限的限制。在典型的分析中,希望分析的肽数目通常超出仪器的通量。
肽的MS-模式分析是有用的,因为可同时分析多个肽,增加通量。此外,通过所谓的精确质量标签(AMT)分析(6,7),可使用高质量精确性仅仅通过它们的质量识别许多肽。因此,使用高质量精确性MS-模式分析时,能较快速地识别非常显著比例的任意给定蛋白质组。但是,通常不认为使用MS-模式标签和AMT方法能识别和定量蛋白质组,因为MS-模式标签给AMT数据库搜索带来额外的复杂性和模糊性。
最近,随着通过高质量分辨率质谱仪例如轨道阱(8,9)、傅立叶变换离子回旋加速器共振(FT-ICR)质谱仪(10)和高分辨率飞行时间(TOF)质谱仪(11)显著改善质量精确性和质量分辨率,已经可分辨离子质荷比之间的毫道尔顿差异。已将这种高分辨率能力探索用于增加同量异位素的串联质量标签的多路技术,使用用于15N的13C的重核子替代物导致在标称的同量异位素的报告物离子(12,13)中形成6.3毫道尔顿差异。类似地,已表明可通过高-分辨率质谱分辨使用包含毫道尔顿质量的差异的赖氨酸同位素标记的代谢物,这实现了酵母中样品的多路技术和相对定量(14)。作者提出了可使用用于肽MS-模式分析的包含毫道尔顿差异的化学标签,但没有暗示任何具体的标签。包含非常小的质量的差异的标签是有用的,因为相互相关的标记的离子(例如来自不同样品的相应的肽)将在相同的离子极限中紧密团簇,并具有非常独特和非天然的同位素图案,该图案易于认识且不太可能干扰识别其它不同的肽,标记的肽的离子团簇包含离子极限,其在质谱中占据的空间与未标记的物质所占据的空间基本上相同。
因此,本发明的目的之一是提供化学相同的反应性标签的集合,目的是用于标记肽和其它生物分子,其中通过非常小的质量的差异来差异化集合中的标签。
此外,虽然包含非常小质量的差异的化学相同的标签形成高度不同的质谱,但手动分析这种谱图是非常耗时的,尤其对于复杂的样品而言。因此,本领域需要软件来快速和自动地解卷积这些复杂的谱图,尤其是通过肽混合物的电喷射离子化形成的那些图谱,从而识别谱图中具体的离子类型。因为肽的相对可预计的碳、氮、氧和氢分布,肽具有特征同位素分布。有些元素通常不存在于肽中,例如卤素原子,而其它元素例如硫和磷偶尔存在。因为通常构成肽的元素的同位素丰度天然的变化,这些不同原子组成形成用于肽的特征同位素组成。理论上,可在质谱数据中检测这种分布,但没有方便可用的用于该目的的有效软件。类似地,可通过使用本发明的标签标记肽来构建改变的分布,该标签通过非常小的质量的差异来分离。但是,没有方便可用的用于自动加工谱图来识别复杂的谱图中具有特征同位素丰度分布的离子的软件。
因此,本发明的另一目标是提供一种用于区分质谱中来自使用包含非常小的质量的差异的同位素异数体质量标记物标记的生物分子的峰以及没有进行标记的峰,从而解卷积和/或简化谱图的方法。具体来说,本发明的目的是提供识别质谱中具有特征同位素分布的离子的方法,即使离子可具有各种不同质量和可以多种电荷状态存在。
本发明的另一目的是自动化解释谱图来识别和定量谱图中存在的离子的方法。具体来说,目的之一是提供识别标记的肽的具体的特征来辅助识别肽的方法。
发明内容
本发明提供两种或多种质量标记物的集合,其中所述集合中的各质量标记物与所述集合中每个其它的标记物的整体质量相同,且所述集合中的各质量标记物的精确质量与所述集合中所有其它质量标记物的精确质量不同,从而所述集合中的所有质量标记物可通过质谱相互区分。
在本发明的语境中,术语质量标记物用来指适于标记物分析物用于测定的部分。术语标记物与术语标签是同义词。
质量标记物的精确质量是质量标记物的理论质量,并且是分子的单个同位素的精确质量之和,例如12C=12.000000、13C=13.003355、H1=1.007825、16O=15.994915。该质量考虑了质量缺陷。整体质量也称为标称质量,且是构成分子的各原子核的各同位素的整体质量之和,例如12C=12,13C=13,1H=1,16O=16。同位素的整体质量是组成同位素的原子核的质子和中子之和,即12C包含6个质子和6个中子而13C包含6个质子和7个中子。这也常称为同位素的原子质量数目或核子数目。
在所述两种或多种质量标记物的集合一种实施方式中,各质量标记物包含报告物部分,且所述集合中的各质量标记物具有报告物部分,该报告物部分的精确质量不同于所述集合中每个其它的标记物的报告物部分的精确质量,从而所述报告物部分可通过质谱区分。
在所述两种或多种质量标记物的集合的另一种实施方式中,各质量标记物包含报告物部分,且所述集合中的各质量标记物具有报告物部分,该报告物部分的整体质量不同于所述集合中每个其它的标记物的报告物部分的整体质量,从而所述报告物部分可通过质谱区分。
至少两种质量标记物之间的精确质量的差异通常小于100毫道尔顿(millidalton),优选地小于50毫道尔顿,更优选地小于20毫道尔顿(mDa)。通常,因为下文表4所示的常见同位素替代物,所述集合中至少两种质量标记物之间的精确质量的差异是2.5mDa,2.9mDa,6.3mDa,8.3mDa,9.3mDa,或10.2mDa。例如,如果第一标记物包含13C同位素,第二标记物中该13C同位素被12C取代,和14N同位素被15N同位素取代,两种标记物之间的精确质量的差异是6.3mDa。
在所述两种或多种质量标记物的集合的优选的实施方式中,所述集合中各质量标记物是所述集合中每个其它的质量标记物的同位素异数体(isotopologue)。同位素异数体是只有分子的同位素组成不同的化学物质。例如,水具有3种氢相关的同位素异数体:HOH,HOD和DOD,其中D表示氘(2H)。同位素异数体与同位素异位体(isotopomer)(同位素异构体)不同,后者具有相同数目的各同位素但位置不同。本发明提供两种或更多种同位素异数体质量标记物的集合,其中标签具有相同的整体质量但通过非常小的质量的差异相互差异化,从而单个标签通常通过小于100毫道尔顿与最接近的标签差异化。
通常,通过不同数目或种类的一种或多种重同位素替代物来提供所述精确质量差异。
在优选的实施方式中,所述集合包含n种质量标记物,其中第m种质量标记物包含(n-m)个原子的第一重同位素和(m-1)个原子的第二重同位素,该第二重同位素不同于第一重同位素,其中m的数值是1到n。通常,所述重同位素是2H、13C或15N。优选地,第一重同位素是13C和第二重同位素是15N。
在另一种实施方式中,所述集合包含n种质量标记物,其中第m种质量标记物包含(n-m)个原子的选自18O或34S的第一重同位素和(2m-2)个原子的选自2H或13C或15N的第二重同位素,该第二重同位素不同于第一重同位素,其中m的数值是1到n。
在所述两种或多种质量标记物的集合的一种实施方式中,各标记物包含下述结构式:
X-L-M
其中X是报告物部分,L是通过质谱仪中的碰撞可劈裂的接头,和M是质量调节部分,其中各质量标记物还包含反应性官能团Re,用于将所述质量标记物连接到分析物。
术语报告物部分用于指独立地检测的部分(通常在通过质谱劈裂之后),但应理解,连接到分析物作为补足的离子的质量标记物的剩余物也可在本发明的方法中检测。质量调节部分是结合进入质量标记物以确保质量标记物具有所需精确质量的部分。有时,各质量标记物的报告物部分可不包含重同位素。
在一些实施方式中,反应性官能团Re可通过X基团连接,然在其它实施方式中,反应性官能团Re可通过M基团连接,如下所述:
X-M-Re或M-X-Re
通常各质量标记物包含下述通式:
X-(L)k1-M-(L)k2-Re或M-(L)k1-X-(L)k2-Re;
其中k1和k2独立地是0-10之间的整数。
可使用重同位素修饰所述部分X,M,L或Re中的一个或多个,来实现所需的精确和/或整体质量。
在优选的实施方式中,接头L包含酰胺键。
在最优选的实施方式中,报告物部分是质量指示部分,质量调节部分是质量归一化部分,其中质量归一化部分确保各质量标记物具有所需的整体或精确质量。在本发明的语境中,术语质量指示部分用来指要通过质谱检测的部分。
在本发明的语境中,术语质量归一化部分用来指不必通过质谱检测的部分,但该部分存在以确保质量标记物具有所需的聚集体质量。然而,质量归一化部分可作为部分的补足的离子检测(见下文)。没有特别地限定质量归一化部分结构,但只要作用于改变质量标记物的总质量。
在一种实施方式中,质量标记物是WO01/68664中所定义的串联质量标签的同位素异数体。
通常,所述集合中的各质量标记物具有下述中一种的通用结构:

其中*表示氧是18O,碳是13C,氮是15N或氢是2H和其中所述集合中各标记物包含一个或多个*,从而在n个标签的所述集合中,第m种标签包含(n-m)个原子的第一重同位素和(m-1)个原子的第二重同位素,该第二重同位素不同于第一重同位素,m是1到n,n是2或更大;以及其中环状单元是芳族或脂族并在任意两个毗邻原子之间独立含有0-3个双键;各Z独立地为N,N(R1),C(R1),CO,CO(R1)(即–O-C(R1)-或–C(R1)-O-),C(R1)2,O或S;X是N,C或C(R1);各R1独立地为H,取代或未取代的直链或支链C1-C6烷基,取代或未取代的脂环族基团,取代或未取代的芳基或取代或未取代的杂环基或氨基酸侧链;以及a是0-10的整数;和b是至少1,其中c是至少1。
在本发明的一种实施方式中,所述集合中的各质量标记物具有下述中一种的结构:

卤素


其中*表示氧是O18,碳是C13或氮是N15或该位点的杂原子被氢化,*可表示H2和其中所述集合中的各标记物包含一个或多个*,从而在n种质量标记物的所述集合中,第m种质量标记物包含(n-m)个原子的第一重同位素和(m-1)个原子的第二重同位素,该第二重同位素不同于第一重同位素,其中m的数值是1到n,n是2或更大。
根据本发明的质量标记物的集合可包含下述质量标记物:


质量标记物的集合可包含下述质量标记物:

质量标记物的集合可包含下述质量标记物:

质量标记物的集合可包含下述质量标记物:

质量标记物的集合可包含下述质量标记物:

质量标记物的集合可包含下述质量标
记物:


质量标记物的集合可包含下述质量标记物:

质量标记物的集合可包含下述质量标记物:


质量标记物的集合可包含下述质量标记物:

在本发明的另一方面中,提供一种质量标记物的阵列,其包含两个或多个如上所定义的质量标记物的集合。在一种实施方式中,所述阵列中任意一种集合的各质量标记物的整体质量不同于所述阵列中每个其它的集合的各质量标记物的整体质量。在一实施例中,所述集合中的各质量标记物与所述集合的每个其它的成员是化学相同的,但与所述阵列的每个其它的集合中的各质量标记物不是化学相同的。可通过存在质量系列改性基团来提供整体质量的差异。阵列中的各集合可具有不同数目的相同质量系列改性基团和/或不同种类的质量系列改性基团。没有特别限定质量系列改性基团化学结构,只要其确保质量标记物的集合具有所需的整体质量。质量系列改性基团的示例参见WO2011/036059。在一种实施方式中,阵列中各质量标记物的集合具有不同数目接头L,即具有不同k1+k2数值。
在阵列的另一种实施方式中,通过不同数目或种类的一种或多种重同位素替代物来提供整体质量的差异。
在本发明的其它实施方式中,质量标记物的阵列包含第一质量标记物的集合和第二质量标记物的集合,其中第一质量标记物的集合中第m种质量标记物和第(m+1)种质量标记物之间的精确质量的差异是d1,第二质量标记物的集合中第m种质量标记物和第(m+1)种质量标记物之间的精确质量的差异是d2,且d1不等于d2。例如,d1可为6.3mDa和d2可为9.3mDa。d1和d2的数值应使得可通过质谱区分使用不同组合的来自第一和第二集合的标记物标记的分析物的同位素图案。
所述阵列可包含第一质量标记物的集合和第二质量标记物的集合,第一集合中的各质量标记物包含能与分析物的第一反应性基团反应的第一反应性官能团,第二集合中的各质量标记物包含能与该分析物中的第二反应性基团反应的第二反应性官能团。
在如上所定义的质量标记物的集合或阵列中,所述质量标记物在分辨率大于60,000且质荷比为400的质谱仪,更优选地在分辨率大于100,000且质荷比为400的质谱仪中,最优选地在分辨率大于250,000且质荷比为400的质谱仪中可区分。质谱仪可为轨道阱质谱仪,例如轨道阱VelosPro质谱仪(美国加利福尼亚州桑乔斯的赛默飞世尔科技公司(ThermoFisherScientific))。
在另一方面中,本发明提供一种质谱分析方法,所述方法包含通过使用质谱识别与分析物相关的质量标记物或质量标记物的组合来检测分析物,其中所述质量标记物是来自如前述权利要求中任一项所限定的质量标记物的集合或阵列的质量标记物。
在一种实施方式中,所述方法包括:
a.提供多个样品,其中使用质量标记物或质量标记物的组合差异化地标记各样品,其中所述质量标记物来如上所定义的质量标记物的集合或阵列;
b.混合所述多个标记的样品以形成包含标记的分析物的分析混合物;
c.任选地,在质谱仪中检测所述标记的分析物;
d.在质谱仪中解离所述标记的分析物以形成质量标记物和/或包含完整的质量标记物的分析物片段;
e.检测所述质量标记物和/或包含完整的质量标记物的分析物片段;
f.任选地,在质谱仪中解离所述质量标记物来释放报告部分,并检测所述报告部分;
g.任选地,解离在步骤f中形成的所述报告部分以形成片段,并检测所述片段;
h.基于所述标记的分析物的质谱、和/或所述质量标记物和/或包含完整的质量标记物的分析物片段的质谱、和/或所述报告部分或报告部分的片段的质谱,来识别所述分析物。
可基于所述标记的分析物的质谱来识别所述分析物。随着高分辨率质谱仪的出现,可在步骤c的MS谱图中分辨使用质量标记物标记的分析物之间mDa质量的差异。还可在步骤d-g中的第n个MS实验中,在标记的分析物的解离产物中分辨这种质量的差异。通过同时在MS和第n种MS谱图识别质量标记物和它们导致的相应的分析物,可大大提高分析物识别的精确性。可基于质量标记物和/或包含完整的质量标记物的分析物片段的质谱来识别分析物。在优选的实施方式中,包含完整的质量标记物的分析物片段是包含完整的质量标记物的b-系列离子,优选地是b1离子。还可基于报告物部分或报告物部分的片段的质谱来识别分析物。
在另一种实施方式中,所述方法包括:
a.提供多个样品,其中使用质量标记物或质量标记物的组合差异化地标记各样品,其中所述质量标记物来自如前述权利要求中任一项所限定的质量标记物的集合或阵列;
b.混合所述多个标记的样品以形成包含标记的分析物的分析混合物;
c.在质谱仪中检测所述标记的分析物;
d.在质谱仪中解离所述标记的分析物来释放所述报告部分,并检测补足的离子,该补足的离子包含连接到所述分析物或分析物的片段的所述质量标记物的剩余物;
e.任选地,解离在步骤d中形成的所述补足的离子以形成片段并检测所述片段的一个或多个其它步骤;
f.基于所述标记的分析物的质谱和/或所述补足的离子和/或所述补足的离子的片段的质谱来识别所述分析物。
在优选的实施方式中,步骤d中,通过来自接头L的一氧化碳的中性损失来形成所述补足的离子。
在一种实施方式中,所述质量标记物来自如上所定义的质量标记物的集合或阵列,其中对于各质量标记物,在所述报告部分中不存在重同位素,以及各质量标记物的所有的所述重同位素存在于连接到所述分析物或分析物的片段的所述质量标记物的剩余物中。
通常,所述解离是质谱仪中碰撞诱导的解离。
通常在分辨率大于60,000且质荷比为400,优选地分辨率大于100,000且质荷比为400,更优选地分辨率大于250,000且质荷比为400的质谱仪中实施本发明的方法。
在本发明的优选的方法中,在步骤a)中,使用来自第一质量标记物的集合的质量标记物差异化地标记各样品,第一集合中的各质量标记物包含能与分析物中的第一反应性基团反应第一反应性官能团,其中在步骤a)中用使用来自第一集合的第m种质量标记物标记的分析物和使用来自第一集合的第(m+1)种质量标记物标记的分析物之间的精确质量的差异是所述分析物中第一反应性基团的数目的指示,其中对于具有单一第一反应性基团的分析物而言,质量差异是d1,对于具有n1个第一反应性基团的分析物而言,质量的差异是n1d1,其中n1是第一反应性基团的数目。
所述方法还可包含使各样品与来自第二质量标记物的集合的质量标记物反应,第二集合中的各质量标记物包含能与所述分析物中的第二反应性基团反应的第二反应性官能团;其中使第二质量标记物的集合的第m种标记物和来自第一集合的第m种标记物与相同的样品反应,使用来自第一集合的第m种质量标记物和来自第二集合的第m种质量标记物标记的分析物与使用来自第一集合的第(m+1)种质量标记物和来自第二集合的第(m+1)种质量标记物标记的分析物之间的精确质量的差异是n1d1+n2d2,其中n1是第一反应性基团的数目,n2是第二反应性基团的数目,d1是只使用来自第一集合的第m种质量标记物标记的分析物和第(m+1)种质量标记物标记的分析物之间的精确质量的差异,和d2是只使用来自第二集合的第m种质量标记物标记的分析物和第(m+1)种质量标记物标记的分析物之间的精确质量的差异,且d1不等于d2。
在优选的实施方式中,第一反应性基团是游离的巯基,第二反应性基团是游离的氨基。
识别分析物的步骤可包含:
i.计算预计存在于样品中的一种或多种分析物的一系列取决于质量标记物、电荷和分析物质量的同位素分布模板,其中对于所述预计的分析物中存在的电荷状态、分析物的质量和质量标记物的数目的各种预计的组合,都存在模板;
ii.将取决于质量和电荷的同位素分布模板连续地应用到质谱中的离子,该质谱通过分析所述标记的分析物来形成,任选地从用于预期的最高质量标记物的数目和电荷状态的模板开始,从而寻找匹配所述同位素模板的质谱中的峰;
iii.任选地,将预期的同位素分布模型拟合到通过模板匹配过程识别的所述分析物离子,从而确认步骤ii中对分析物的初步识别,由此识别所述分析物的电荷状态和与所述分析物反应的质量标记物的数目。
所述分析物可选自蛋白质、多肽、肽、多糖、多核苷酸、氨基酸和核酸。优选地,所述分析物通过酶消化蛋白质或蛋白质的混合物来制备的肽。本发明所用的常见的酶是LysC或胰蛋白酶。
可通过下述来确定用于肽的所述同位素分布模板:获得蛋白质的氨基酸序列,实施计算机模拟的酶消化氨基酸序列来形成预计的肽的列表和它们的相应的质量,根据质量对预计的肽进行分类,基于这些质量和已知的电荷状态和质量标记物的数目来制备同位素分布。
具体实施方式
下面结合附图更详细地描述本发明,其中:
图1显示流程图,其显示本发明的方法中所用的数据分析步骤。
图2显示用来制备用本发明的方法分析的谱图的典型的系列预处理步骤,其涉及谱图S,其由m/z=x和强度y等的峰组成,且峰的m/z比例是已知的;
图3显示流程图,其显示将同位素模板应用到质谱所用的一般步骤,表明用于逐渐降低电荷状态的迭代方法;
图4显示将用本发明的方法获得的多种电荷状态数据转化成对应于犹如所有离子以相同的电荷状态(优选地+1)存在所得图谱的数据的方法--因此该流程图显示用来解卷积具有已知质荷比和已知电荷状态的单同位素离子峰的命中目标列表中离子列表的电荷状态的一般步骤。
图5a显示用于具有中等质量且处于+1电荷状态的肽的肽同位素比例的理论分布。图5b显示用于具有3种不同质量的肽在多种不同电荷状态时的一些平均的预期同位素丰度分布,这使用飞行时间质谱仪中的离子到达时间的高斯模式来形成;
图6a显示不同肽同位素峰的强度比例如何随着肽的质量变化;和图6b显示如下所述的快速模板拟合过程的概念。
图7是示意图,显示使用来自实施例集合7的质量标记物1来标记小的肽,其随后在质谱仪中进行碰撞诱导的解离。
图8示意性地显示一种应用根据本发明的质量标记物的方法,其设计成在标记的肽的MS/MS/MS分析之后作为报告物离子检测。该图显示使用来自根据本发明的示例集合8的质量标记物1和2(在图8中分别指示为1和2)标记肽(序列:VATVSLPR)。
图9显示使用显示的MMT-NN和MMT-CC标记的肽VATVSLPR的1:1混合物的MS/MS谱图。标出了报告物离子。
图10a-10e分别显示用于b1、b2、b3、b4和b5离子的1:1比例肽混合物的放大的谱图。
图11a顶部显示用于具有比例1:1(MMT-NN:MMT-CC)的肽混合物的b1离子,而图11a底部显示用于相同的比例的126/127报告物离子。
图11b顶部显示用于具有比例2:1(MMT-NN:MMT-CC)的肽混合物的b1离子,而图11b底部显示用于相同的比例的126/127报告物离子。
图11c顶部显示用于具有比例4:1(MMT-NN:MMT-CC)的肽混合物的b1离子,而图11c底部显示用于相同的比例的126/127报告物离子。
图11d顶部显示用于具有比例8:1(MMT-NN:MMT-CC)的肽混合物的b1离子,而图11d底部显示用于相同的比例的126/127报告物离子。
图11e顶部显示用于具有比例16:1(MMT-NN:MMT-CC)的肽混合物的b1离子,而图11e底部显示用于相同的比例的126/127报告物离子。
图11f顶部显示用于具有比例1:2(MMT-NN:MMT-CC)的肽混合物的b1离子,而图11f底部显示用于相同的比例的126/127报告物离子。
图11g顶部显示用于具有比例1:4(MMT-NN:MMT-CC)的肽混合物的b1离子,而图11g底部显示用于相同的比例的126/127报告物离子。
图11h顶部显示用于具有比例1:8(MMT-NN:MMT-CC)的肽混合物的b1离子,而图11h底部显示用于相同的比例的126/127报告物离子。
图11i顶部显示用于具有比例1:16(MMT-NN:MMT-CC)的肽混合物的b1离子,而图11i底部显示用于相同的比例的126/127报告物离子。
图12a显示用于m/z为484.96的肽的MS-模式谱图。可清楚地分辨来自使用MMT-NN标记的肽样品的母离子,与来自使用MMT-CC标记的样品。来自使用MMT-NN标记的肽样品的肽看起来存在的丰度比使用MMT-CC标记的样品低5倍。可在对应于不含任何重同位素加上2标签的肽的离子(图12b)和对应于具有天然的结构中的1x13C原子核加上2标签的肽的离子峰(图12c)以及对应于具有天然的结构中的2x13C原子核加上2标签的肽的离子峰(图12d)中观察到比例。
图13显示通过用于图12所示肽离子的PQD所得的MS/MS谱图。将该谱图匹配到具有两种标签(MMT-NN或MMT-CC)的肽序列ENVQLQK,一个在N-末端氨基处和一个在赖氨酸ε(epsilon)氨基处,并对应于图12所示的母离子的质量。
图14显示用于哌嗪-增链的标签1的合成路线。
图15显示用于哌嗪-增链的标签2的合成路线。
图16显示使用哌嗪-增链的标签1标记的合成肽的MS-模式谱图,在m/z596.9处具有预期的双倍电荷。
图17显示使用哌嗪-增链的标签2标记的相同的合成肽的MS-模式谱图,在m/z603.9处具有预期的双倍电荷。
本发明的方法之一是一种用于分析复杂的多肽混合物的两种或多种样品的方法,所述方法包含下述步骤:
1.使用序列特异性的劈裂剂来消化复杂的多肽混合物的各样品,形成复杂的肽混合物;
2.使肽的复杂的混合物的各样品与根据本发明的不同质量标签反应,该标记具体地与那些肽中的一个或多个反应性官能团反应,其中标签导致在标记的肽的质荷比形成小的改变,从而来自肽的复杂的混合物的各样品的相应的肽具有独特的可分辨的质荷比;
3.任选地,使用不同或相同的化学相同的质量标签的集合重复步骤2,但使肽的复杂的混合物各样品与在标签上包含不同反应性基团的质量标签反应,以与肽中不同的官能团反应,从而用相同的顺序的标签质量标记各样品。
4.任选地,使用质量相互不同的一对化学相同的标签标记肽的复杂的混合物中的不同反应性基团,对于每一个不同样品使用相同的一对标签,以分裂峰,目的是识别具有被标记的反应性基团的肽。
5.将标记的样品合并在一起
6.任选地,用一种或多种色谱分离技术分离标记的和合并的肽样品。
7.通过质谱分析合并的肽样品,来测定用于标记的肽的高分辨率质谱。
8.分析质谱来检测和测定不同样品中相应的肽的同位素异数体的强度,该不同样品来自使用根据本发明的不同质量标签标记不同样品。
9.任选地,选定一个或多个离子和片段化该一个或多个离子来测定用于那些肽的序列信息。在该任选的步骤中,用于选定用于测序的离子的标准可基于标记的肽上存在的具体的标签,具体的标签的存在可通过步骤(8)中的分析推断得出。
在本发明的优选的实施方式中,分析质谱来检测和测定不同样品中相应的肽的同位素异数体的强度的步骤包含下述步骤:
i.计算用于谱图中的一种或多种离子的一系列取决于标签、电荷和质量的同位素分布模板,其中对于预期的肽中存在的电荷状态、质量范围和标签数目的各种组合,都存在模板;
ii.将取决于质量和电荷的同位素分布模板连续地应用到质谱中的离子,该质谱通过分析所述标记的肽来形成,从用于预期的最高标签的数目和电荷状态的模板开始,从而寻找匹配所述同位素模板的质谱中的区域;
iii.任选地,将预期的同位素分布模型拟合到通过模板匹配过程识别的肽离子,从而确认初步识别,由此识别肽的电荷状态和与肽反应的标签的数目。
在本发明的方面的优选的实施方式中,消化复杂的多肽混合物的步骤优选地使用序列序列特异性的内切蛋白酶例如胰蛋白酶或LysC来实施。内切蛋白酶LysC在邻近赖氨酸残基C-末端的酰胺键处劈裂,因此在使用LysC的实施方式中,大多数因劈裂导致的肽具有单一C-末端赖氨酸残基和单一αN-末端氨基,即可与胺-反应性标签反应的两个氨基。因此,使用胺-反应性标签时,LysC-劈裂的肽全部被两种标签标记。相反,胰蛋白酶同时在邻近精氨酸和赖氨酸C-末端的酰胺键处劈裂,因此在使用胰蛋白酶的实施方式中,有些肽具有被两种标签标记的C-末端赖氨酸,有些肽具有只有在α氨基处用单一标签标记的C-末端精氨酸。
此外,本发明提供一种用于处理来自一个或多个质谱的数据的方法,该质谱通过标记和合并两个或多个复杂的多肽混合物的样品形成,所述方法包含:
(a)在质谱中选定第一峰;
(b)选定具有第一电荷状态的第一单一同位素参比离子,该第一参比离子可形成第一峰;
(c)对于一种或多种其它同位素形式的第一参比离子,测定质谱中一个或多个其它预期的峰;
(d)将一个或多个测定的其它预期的峰与质谱比较,来确定谱图中是否存在匹配一个或多个测定的其它预期的峰的一个或多个峰;
(e)如果一个或多个测定的其它预期的峰匹配质谱中的一个或多个峰,将第一峰指定为数据峰,和任选地将谱图中存在的匹配一个或多个测定的其它预期的峰的一个或多个峰指定为数据峰;
(f)如果测定的其它预期的峰不匹配质谱中的峰,使用处于一种或多种其它电荷状态的一种或多种参比离子重复步骤(b)-(e);
(g)任选地,如果对于处于第一电荷状态的参比离子而言,或对于处于其它电荷状态的其它参比离子而言,第一峰不能指定为数据峰,则将第一峰指定为非数据峰;
(h)任选地,对于质谱中的一个或多个其它峰重复步骤(a)-(g)。
在步骤(a)中,选定或识别来自质谱的第一峰,用于研究。当实施该方法时,初始时可选定谱图中的任意峰。然而,优选地选择谱图中对应于最低质量和/或最高电荷状态的峰,因为通常这种峰是通过质谱仪最能精确地分辨的峰。优选地,所有质量/电荷比例与最高的m/z相关,从而保持最高的精确性。如有需要,可预处理谱图数据来辅助识别谱图中的峰,例如通过平滑。
在如上所述的预分析之后,如有需要,可将模型拟合到指定的数据峰。这些峰具有一些宽度和高度,赋予它们特征形状。该形状取决于多种因素,包括所使用的光谱仪的性质。因此,相同的离子不全是在精确相同的m/z值记录。在飞行时间分析仪中,相同离子中有些将比其它离子稍微更早或更晚地到达。正是如此赋予峰特征形状。可使用任意合适的函数对该形状进行建模,但如下所述,高斯、洛伦兹和沃伊特(Voigt)函数是优选的。从这种建模,可确定更精确的峰形状,这进而允许测定各峰的更精确的m/z数值。如下所述,这大大有助于后续的峰分析和图谱指派。
所选定的参比离子可为具有特定质量和电荷状态的任意离子,其在理论上可负责形成第一峰。参比离子可选自这种离子的数据库,或可在处理时计算。在该阶段中,优选的所选定的离子的各组成原子以其最常见的同位素存在,因为这些离子天然地在可能的同位素中是丰度最大的并因此为谱图提供最大的贡献。在本发明的语境中中,将这种离子称为单一同位素离子。在一些情况下,存在可负责形成第一峰的多于一种的单一同位素离子,有些处于相同的电荷状态和其它的处于不同电荷状态。在本发明中,优选地首先考虑处于相同的电荷状态(通常是最高的电荷状态)的单一同位素离子,并在所述方法的一种或多种其它迭代中独立地研究其它电荷状态。
在将第一离子选定为处于其单一同位素形式之后,可测定用于该离子的同位素分布。各组成原子的不同同位素天然地以不同丰度存在,这些丰度将影响存在的化学相同但同位素不同的所有可能的离子的数量。同位素的在单个离子中存在越不常见,与相应的单一同位素离子相比该离子将更少的存在。在本发明的语境中,将化学相同但同位素分布不同的各离子称为处于相同的离子家族。
因为构成离子家族的同位素的不同质量,离子家族将在质谱中形成多种峰,团簇在最强的(强度最大的)峰周围。对于更小的分子,最低质量的峰,即‘轻峰’其中分子中所有原子核的组分原子处于最轻的稳定形式,是离子同位素极限(envelope)中强度最大的离子,且称为单一同位素峰。然而,随着分子中原子数目增加,任意给定的原子是重同位素的可能性增加,直到该轻峰不再是强度最大的峰。对于肽而言,一旦肽是约20氨基酸常,最丰富的峰是对应于具有至少一种重原子核的分子的峰,其通常是13C,因为15N和氘同位素具有较低的天然丰度。在约30个氨基酸时,对应于至少2个重原子核的离子变成与具有1个重原子核的离子一样丰富。
因为它们的丰度变化,其它峰应具有相对于它们的天然同位素的丰度的强度,且是可计算的,因为天然同位素丰度是已知的。这些是光谱中测定的其它预期的峰。可通过与数据库中预先计算的信息进行比较,例如为用于离子的峰模板的形式来测定它们,或如有需要,可通过实时计算来测定它们。当多于一种单一同位素离子可能负责形成峰时,可将认为存在的各离子的相对比例用于构建用于各离子同位素的重均峰强度。例如,如果可存在两种单一同位素离子(两个离子家族),可假定它们以相等数量存在(50:50比例),在这种情况下,与其中只存在单一离子家族的峰相比,用于各家族的计算的其它预期的峰的强度将下降一半。对于60:40比例,1个家族是3/5强度,另一个是2/5强度等等。这些比例可基于样品的来源来估算-与其它样品相比有些化合物更可能存在于生物样品中。
如上所述,计算可实时地计算,或者可预先进行。在其中离子首先选自数据库的情况下,可使用用于离子家族的预先计算的模板,该模板包含处于它们的计算的分布的同位素峰。对于多于一种离子家族,模板可以据信该离子存在的任意比例叠加。
然后,将计算的峰和/或模板与谱图比较,观察谱图中是否存在匹配它们的任何峰。在“真”峰周围的同位素分布是真数据的特征,而来自噪音、宇宙射线、设备伪影或其它干扰的的假峰不显示这种分布。可将“数据”峰与“非数据”峰分离。匹配过程可优选地将预期的峰之间的分离和/或预期的峰的相对强度与谱图中的峰进行比较,如果达到一定的阈值则记录匹配。阈值可取决于用户要求该方法有多敏感。如有需要,可将其它参数例如峰宽度或形状用于比较。用于对这种参数建模的函数是本技术领域所公知的,并如下所述。
在本发明的语境中,下文所述的模板匹配过程指一种方法,其将从真质谱仪中记录的谱图的峰测定的一系列参数与已知离子类型的预期的峰参数进行匹配,其中在匹配过程中没有自由参数。
还在本发明的语境中中,模型拟合过程指一种方法,其中通过估算一系列的自由参数来寻找模型和真数据之间的具备最小误差,尝试将衍生自已知离子类型的模型拟合到来自质谱的一系列峰,其中使用成本函数测定误差。选定成本函数,以确保数据尽可能紧密地拟合模型。
这些数学方法是本技术领域所公知的,并在信号处理文章中广泛讨论。
可重复用于第一峰的过程,直到其识别为真数据峰,或直到没有发现匹配,在这种情况下,当指派光谱时可不考虑这种峰。重复通常涉及选自处于下一电荷状态的新的参比离子,直到已测试所有的电荷状态。一旦进行这个,那么结束用于该第一峰的迭代。然后,可对没有指定为数据峰的峰重复整个步骤,例如用于第二峰、第三峰、第四峰等,直到已经测试所有的峰或者已进行所需的测试次数。优选地,首先使用光谱仪中可分辨的最高的常见电荷状态,以及最低的质量峰。因为将峰测定为质量/电荷比例(m/z),这涉及从最小的m和最大的z开始,然后使用z进行迭代,每次更低一个单元直到达到最小的z数值。然后,选择谱图中的下一个峰,并重复步骤。通常,对于飞行时间(TOF)光谱仪,可分辨的最高的电荷状态是+6,但在一些情况下,+8也是可能的。因此,优选地该方法开始于+8的电荷状态并降低到+1。更优选地,该方法开始于+6的电荷状态并降低到+1。或者,可使用负离子构造。在这种情况下,该方法起始于-8并进行到-1,或者从-6进行到-1。
一旦处理了谱图并识别了数据峰,可需要将谱图转化成表示离子处于相同的电荷状态的谱图,优选地+1或-1状态。因此,在本发明的一些实施方式中,所述方法包含其它步骤:确定谱图中是否存在不同电荷状态的相同的分子物质,并将由这些多种电荷状态形成的峰减少到犹如由单一电荷状态导致的峰。新形成的峰的强度是用于该分子物质的单个电荷状态的贡献的强度之和。这样,大大减少了谱图中的峰的数目,促进峰的指派。就来自相同离子的多种同位素异位体的峰而言,也可进行类似的方法。这些降低使得可直接比较存在的各化学物质的数量,而与从化学和生物角度看不重要的电荷或同位素差异无关。
一旦确定了数据峰,可以显著简化的方式实时谱图的最终指派。
本发明可利用计算机程序来处理来自质谱的数据,该计算机程序实施下述步骤:
(a)选定具有第一电荷状态的第一单一同位素参比离子,该第一参比离子可贡献于质谱中的第一峰;
(b)对于一种或多种其它同位素形式的第一参比离子,测定质谱中一个或多个其它预期的峰;
(c)将一个或多个测定的其它预期的峰与质谱比较,来确定谱图中是否存在匹配一个或多个测定的其它预期的峰的一个或多个峰;
(d)如果一个或多个测定的其它预期的峰匹配质谱中的一个或多个峰,将第一峰指定为数据峰,和任选地将谱图中存在的匹配一个或多个测定的其它预期的峰的一个或多个峰指定为数据峰。
优选地,计算机程序包含使数据处理装置实施上述步骤中的一些或全部的指令。
本发明还包含一种解释由样品形成的质谱的方法,该方法包含:
(a)根据如上所定义的方法,处理来自质谱的数据;和
(b)只基于数据峰解释谱图。
此外,本发明提供一种用于实施依赖于数据的分析过程的方法,其包含一种如上所定义的解释质谱的方法;和一种用于实施不依赖于数据的分析过程的方法,其包含一种如上所定义的解释质谱的方法。
此外,本发明提供一种用于分析复杂的多肽混合物的试剂盒(kit),其包含,
1)根据本发明的一个或多个质量标记物的集合
2)在计算机可读介质上的软件,其用于分析由将本发明的方法施加到复杂的多肽混合物集合形成的质谱。
本发明提供一种识别离子家族的方法,该离子家族对应于使用本发明的质量标签标记的分子物质,其在质谱中具有特征同位素丰度分布,其中质谱包含识别的峰的列表,该识别的峰对应于具有已知质荷比的离子,其中所述方法包含下述步骤:
1.计算不同预定的离子类型所特征性并用于图谱中一个或多个峰的取决于电荷、标签和质量的同位素丰度分布模板,以用于识别大于约那些预定类型的离子的峰;
2.连续地施加计算的一系列的取决于质量和电荷的同位素分布模板,起始于对应于谱图中各标记的离子的模板并从预期的最高的电荷状态开始,从而快速识别质谱中匹配同位素模板的区域,其中所述一系列模板包含用于预定离子类型的单个模板;
3.将预期的同位素分布的模型拟合到通过模板匹配过程识别的离子,以确认预先识别;和
4.任选地,将对应于不同电荷状态的单一标记的离子物质的峰减少到单一电荷状态,并记录标记的离子物质的不同同位素异数体的强度。
5.任选地,确定图谱中是否存在不同电荷状态的相同的分子物质,并将这些减少到单一电荷状态,其强度是用于该分子物质的组合的电荷状态的强度之和。
在本发明的典型的实施方式,提供一种识别生物分子离子的方法,该生物分子离子使用根据本发明的质量标签标记从而标记的生物分子离子在高分辨率质量分析仪数据中具有特征同位素分布,所述方法包含下述步骤:
1.从高分辨率质量分析仪获取数据,来制备至少一种观察的质谱,该质谱包含表示具有特定质荷比的标记的生物分子离子的数目的数据;
2.在所述观察的质谱中,确认对应于质量峰的所述数据的部分;
3.使用通过本发明的标签标记的生物分子离子所特有的、预定的取决于电荷和质量的同位素分布模板,来识别预定类型的标记的离子;
4.将预期的同位素分布的模型拟合到通过模板匹配过程识别的标记的离子,以确认预先识别;
5.任选地,将对应于单一离子的多种同位素异位体的峰减少到同一单一同位素峰。
6.任选地,确定图谱中是否存在不同电荷状态的相同的分子物质,并将这些减少到单一电荷状态,其强度是用于该分子物质的组合的电荷状态的强度之和。
本发明可提供多个备份的在计算机可读存储介质上的用于解释质谱的计算机程序,其中各计算机可读存储介质连接到一组处理器,其中各处理器通过通讯装置连接到该组中的每个其它处理器。该组中的所有处理器还通过网络连接到主处理器。主处理器也连接到计算机可读存储介质,该计算机可读存储介质上存在用于将质谱分裂成子谱图并将这些子谱图分配给团簇中的计算机的程序。此外,在通过上述一组处理其分析子光谱之后,在连接到主处理器的计算机可读存储介质上的程序还能再次组装解释的子光谱。
此外,本发明可提供一种用于识别肽的方法,其在质谱中包含具体的氨基酸,所述方法包含下述步骤:
1.任选地,使用序列特异性的劈裂剂来消化复杂的多肽混合物,形成复杂的肽混合物;
2.使肽的复杂的混合物与根据本发明的标签反应,该标签具体地与那些肽中的一个或多个反应性官能团反应,其中该标签导致被标记的肽的同位素分布发生变化;
3.计算用于谱图中的一种或多种离子的一系列取决于标签、电荷和量的同位素分布模板,其中对于预期的肽中存在的电荷状态、质量范围和标签数目的各种组合,都存在一个模板;
4.将取决于质量和电荷的同位素分布模板连续地应用到质谱中的离子,该质谱通过分析所述标记的肽来形成,从用于最高预期的标签的数目和电荷状态的模板开始,从而寻找匹配所述同位素模板的质谱中的区域;
任选地,将预期的同位素分布模型拟合到通过模板匹配过程识别的肽离子,从而确认初步识别,由此识别肽的电荷状态和与肽反应的标签的数目。
使用毫道尔顿差异化的标签标记肽:
为了阐述本发明的一些特征,考虑一种想象的肽,其精确质量为700.00000,包含单一赖氨酸和游离的α氨基。还考虑4个多肽的复杂的混合物的样品,其中存在肽,且肽被4种胺-反应性质量标签的集合标记,其中最轻的标签的反应的残基质量(即当将标记物与肽共轭时,施加到肽的质量变化)是300.00000道尔顿,且所述集合中的标签相差6.3毫道尔顿。因此,预期使用施加的胺-反应性质量标签将该肽标记两次,一次在ε氨基处,一次在α-氨基处。
使用上述300.00000道尔顿标签双重标记的物质的质量是1300.00000,且+1离子的质荷比是1301.00867(1个质子–质子质量=1.00867)。类似地,如果可以形成,处于+6电荷状态的双重标记的物质的质荷比是217.67534(且6个质子–质子质量=1.00867)。对于6+离子,使用最轻的标签标记的整个肽主要的第二天然同位素对应于在肽结构中存在单一13C(13C和12C的质量差异是1.00336Da),出现在217.84256。该同位素异数体相对于更轻的同位素异数体的丰度或强度取决于肽中碳原子的数目,这可从其序列中得知。还可计算对应于肽中存在单一15N的重同位素异数体和对应于结构中存在单一氘的重同位素异数体,但它们通常以比13C同位素异数体低得多的丰度存在,如有需要可忽略不计。类似地,使用最轻的标签标记的整个肽第三天然同位素对应于在肽结构中存在2个13C原子核,出现在218.00979。同样地,对于第三天然同位素,存在对应于肽结构中存在两个15N原子核的或在肽结构中存在1x15N和1x13C原子核或或在肽结构中存在单一18O原子核的或相应的氘和/或硫的组合的重同位素异数体。大多数的可能性以非常低的丰度出现,对于大多数情况可忽略,但对于最高的可能的精确性目的,如果质谱仪的质量分辨率足以分辨它们,可包含这些物质。
类似地,使用接下来的最重的标签标记的相应的肽离子将更重12.6毫道尔顿,且+6离子的质荷比是217.67744,相应的第二天然13C同位素异数体的质荷比是217.84466,其第三天然13C同位素异数体的质荷比是218.01189。表1列出了计算的用于想象的700道尔顿肽的双重标记的物质的最初3种13C天然同位素的开始的6个电荷状态的质荷比,该肽结合到4-通道的化学相同的质量标签集合,其中最轻的质量标签的反应的残基质量是300道尔顿,标签通过它们之间的6.3毫道尔顿的质量的差异进行分离。应注意,第一13C天然同位素对应于轻肽,即没有13C原子核,而第二同位素具有1x13C原子核和第三同位素具有2x13C原子核。


表1
应注意,各标记的物质的第一、第二和第三13C天然同位素的相对强度由肽中的碳原子数目决定(不包含标签),用于各标记的物质的天然同位素的相对强度(即表1中的各行)应与每个其它行大致相同(尽管根据重原子核自身的丰度,各标签自身将稍微改变相对丰度)。然而,在实验之前测定重原子核的标签丰度,并可用来计算各标记的物质的预期的第一、第二和第三13C天然同位素的相对强度。
质量标签:
因此,在第一方面中,本发明提供两种或更多种质量标记物的集合,其中标签具有相同的整体质量但通过非常小的质量的差异相互差异化,从而单个标签通过小于100毫道尔顿与最接近的标签差异化,即质量标记物具有不同的精确质量。
在优选的实施方式中,本发明的化学相同的标签集合包含n种标签,其中第x种标签包含(n-x)个原子的第一重同位素和(x-1)个原子的第二重同位素,该第二重同位素不同于第一重同位素。在该优选的实施方式中,x的数值是1到n,优选地重同位素包含2H或13C或15N。
在其它优选的实施方式中,本发明的化学相同的标签集合包含n种标签,其中第x种标签包含(n-x)个原子的选自18O或34S的第一重同位素和(2x-2)个原子的选自2H或13C或15N的第二重同位素,该第二重同位素不同于第一重同位素。在该优选的实施方式中,x的数值是1到n。
在本发明的优选的实施方式中,化学相同的集合中的质量标签通过小于50毫道尔顿差异化。
在一些实施方式中,一起使用两种或更多种化学相同的质量标签的集合的阵列,其中各集合的每个集合包含n种标签,其中n如上所定义,并且对于阵列中的各集合可具有独立的数值,以及通过将p个其它重原子核添加到化学相同的结构以及用来在标签中形成如上所定义的小的质量变化的n-1原子核,各标签的集合具有不同于阵列中其它集合的整体质量,其中对于阵列中的各集合p可具有独立的数值。
在一些实施方式中,一起使用两种或更多种化学相同的质量标签的集合的阵列,其中各标签集合的成员与该集合的其它成员是化学相同的,但与阵列中其它的集合不是化学相同的。这可通过改变不同质量标签集合之间的如上所定义的接头基团L的数目来实现。
接头基团
在上下文中,参考了接头基团,其可用于将感兴趣的分子连接到本发明的质量标记物化合物。可在本发明的质量标记物以及它们的共价地结合的分析物之间引入本技术领域所公知多种接头。有些接头可为可劈裂的。可将低聚乙二醇或聚乙二醇或它们的衍生物用作接头,例如在马斯库斯U.(Maskos,U.)和桑特纳E.M.(Southern,E.M.)《核酸研究(NucleicAcidsResearch)》20:1679-1684,1992所批露的那些。还广泛使用基于琥珀酸的接头,但对于涉及标记低聚核苷酸的应用它们是更不优选的,因为它们通常是碱不稳定的,因此与在许多低聚核苷酸合成器中所用的碱介导的去保护步骤不兼容。
炔丙醇是双官能度接头,其提供在低聚核苷酸合成条件下稳定的连接,是用于本发明的涉及低聚核苷酸应用的优选的接头。类似地,6-氨基己醇是有用的双官能度试剂,用于连接适当功能化的分子,也是优选的接头。
WO00/02895批露了将乙烯基砜作为可劈裂的接头,其可在质谱仪中劈裂,这也适用于本发明,尤其是涉及标记多肽、肽和氨基酸的应用中。该文的全部内容通过引用纳入本文。
WO00/02895批露使用贵化合物作为接头,其在气相时可通过碱劈裂。这些接头也适用于本发明,尤其是在涉及标记低聚核苷酸的应用中。该文的全部内容通过引用纳入本文。
反应性官能团:
在下面的讨论中,将参考反应性官能团Re,来允许本发明的化合物连接到其它化合物,不管是报告物基团还是分析物分子。可将各种反应性官能团引入本发明的质量标记物。
下文的表2列出一些反应性官能团,其可与分析物(通常是生物分子)中发现的通常是亲核官能团的反应性基团反应,从而在两个部分之间形成共价地连接。对于涉及合成的低聚核苷酸的应用,常常在分子的末端引入伯胺或巯基来允许标记。可将下述的任意官能团引入到本发明的化合物,以允许质量指示物连接到感兴趣的分子。如有需要,反应性官能团可用来引入具有其它反应性官能团的其它接头基团。表2无意于穷举,本发明也不限于仅仅使用所列的官能团。
表2

应指出,在涉及使用本发明的质量指示物标记低聚核苷酸的应用中,在引入低聚核苷酸合成器之前,有些上述反应性官能团或它们的所得连接基团可能必须保护。优选地避免不受保护的酯、硫醚和硫酯、胺和酰胺键,因为这些在低聚核苷酸合成器中通常是不稳定的。可使用本技术领域所公知的许多保护基团来保护接头,以免发生不想要的副反应。
下面的讨论参考“携带电荷的官能团”和增溶基团。可将这些基团引入质量标记物例如在报告物部分中,例如本发明的质量指示物部分,来促进离子化和溶解度。指示物的选择取决于要使用的是正离子或负离子检测。下文的表3列出一些官能团,其可引入质量指示物来促进正离子化或负离子化。该表无意于穷举,本发明也不限于仅仅使用所列的官能团。
表3

WO00/02893批露将金属离子结合部分例如冠醚或卟啉用于改善质量指示物的离子化。这些部分也适于和本发明的质量指示物一起使用。
在本发明的一些实施方式中,本发明的质量指示物的组分优选地是耐片段化的,从而可通过引入易于被碰撞诱导的解离破坏的接头来控制指示物的片段化位点。芳基醚是一种示例类型的耐片段化的化合物,其可用于本发明中。这些化合物也是化学惰性和热稳定的。WO99/32501更加详细地讨论了在质谱中使用多醚,该文的全部内容通过引用纳入本文。
过去,用于合成芳基醚的一般方法基于在铜粉存在下,在约200℃下的芳基溴与苯酚的乌曼(Ullmann)偶合(代表性参考文献是H.斯特特尔(H.Stetter),G.杜夫(G.Duve),ChemischeBerichte87(1954)1699)。使用不同的金属催化剂开发了用于合成芳基醚的更温和的方法,但反应温度仍然在100-120℃。(M.伊奥多(M.Iyoda),M.萨卡塔尼(M.Sakaitani),H.奥兹卡(H.Otsuka),M.奥达(M.Oda),《四面体快讯(TetrahedronLetters)》26(1985)477)。这是用于制备聚醚质量标记物的优选的路线。另一种公开的方法提供最优选的用于制备聚醚质量标记物的路线,因为它在比早期方法低得多的温度下进行(D.E.伊万斯(D.E.Evans),J.L.卡特兹(J.L.Katz),J.L.维斯特(T.R.West),《四面体快讯(TetrahedronLett.)》39(1998)2937).
优选地,质量标记物的集合具有下述通用结构中的一种:


其中*是同位素质量调节部分,*表示氧是18O,碳是13C或氮是15N或存在氢的位点,*可表示2H和其中集合中的各标记物包含一个或多个*从而在n种标签的集合,第m种标签包含(n-m)个原子的第一重同位素和(m-1)个原子的第二重同位素,该第二重同位素不同于第一重同位素。在该优选的实施方式中,m的数值是1到n,n是2或更大;
以及其中环状单元是芳族或脂族并在任意两个毗邻原子之间独立含有0-3个双键;各Z独立地为N,N(R1),C(R1),CO,CO(R1)(即–O-C(R1)-或–C(R1)-O-),C(R1)2,O或S;X是N、C或C(R1);各R1独立地为H,取代或未取代的直链或支链C1-C6烷基,取代或未取代的脂环族基团,取代或未取代的芳基或取代或未取代的杂环基或氨基酸侧链;和a是0-10的整数;和b是至少1,和其中c是至少1;和Re是用于将质量标记物连接到生物分子的反应性官能团。
在上述通式中,当Z是C(R1)2时,碳原子上的各R1可相同或不同(即各R1是相互独立的)。因此,C(R1)2基团包含例如CH(R1)的基团,其中一个R1是H,另一个R1是选自R1的上述定义的另一基团。
在上述通式中,取决于在该位置所选择的X和Z基团,X和非环状Z之间的键可为单键或双键。例如,当X是N或C(R1)时,X与非环状Z的键必须是单键。当X是C时,取决于所选择的非环状Z基团和环状Z基团,X与非环状Z的键可为单键或双键。当非环状Z基团是N或C(R1)时,取决于所选择的X基团和与非环状Z连接的基团,非环状Z与X的键是单键,或者如果y是0时可为双键。当非环状Z是N(R1),CO(R1),CO,C(R1)2,O或S时,与X的键必须是单键。根据上述结构式,本领域普通技术人员可容易地选择具有正确价态(单键或双键连接)的合适的X,Z和(CR12)a基团。
没有特别限定质量指示部分的取代基,其可包含任意有机基团和/或来自元素周期表的IIIA族,IVA族,VA族,VIA族或VIIA族的任一族的一个或多个原子,例如B,Si,N,P,O,或S原子或卤素原子(例如F,Cl,Br或I)。
当取代基包含有机基团时,有机基团优选地包含烃基团。烃基团可包含直链、支链或环状基团。独立地,烃基团可包含脂肪族基团或芳基。此外,烃基团可独立地包含饱和的或不饱和基团。
当烃包含不饱和基团时,其可包含一个或多个烯烃官能团和/或一个或多个炔烃官能团。当烃包含直链或支链基团时,其可包含一个或多个伯、仲和/或叔烷基。当烃包含环状基团时,其可包含芳香环、脂肪族环、杂环基,和/或这些基团的稠环衍生物。因此,环状基团可包含苯、萘、蒽、茚、芴、吡啶、喹啉、噻吩、苯并噻吩、呋喃、苯并呋喃、吡咯、吲哚、咪唑、噻唑、和/或恶唑基团,以及上述基团的结构异构体(regioisomer)。
没有特别限定烃基团中的碳原子数目,但优选地烃基团包含1-40个C原子。因此,烃基团可为较低的烃(1-6个C原子)或更高的烃(7个C原子或更多,例如7-40个C原子)。没有特别限定环状基团的环中的原子数目,但优选地环状基团的环包含3-10个原子,例如3,4,5,6或7个原子。
如上所述的包含杂原子的基团,以及如上所述的任意其它基团,可包含来自元素周期表的IIIA族,IVA族,VA族,VIA族或VIIA族任一族的一个或多个杂原子,例如B,Si,N,P,O,或S原子或卤素原子(例如F,Cl,Br或I)。因此,取代基可包含有机化学中的一种或多种任意常见的官能团,例如羟基、羧酸基、酯基、醚基、醛基、酮基、胺基、酰胺基、亚胺基、巯基、硫醚基、硫酸盐基、磺酸基和磷酸盐基等。取代基还可包含这些基团的衍生物,例如羧酸酸酐和羧酸卤化物。
此外,任意取代基可包含如上所定义的两种或多种取代基和/或官能团的组合。
在上述结构中,反应性官能团优选地选自:


优选地,反应性化学相同的质量标签的集合包含n种质量标记物,该质量标记物选自下述结构中的任一种:



其中*表示氧是18O,碳是13C或氮是15N或杂原子被氢化的位点,*可表示2H和其中集合中的各标记物包含一个或多个*,从而在n种标签的集合中,第m种标签包含(n-m)个原子的第一重同位素和(m-1)个原子的第二重同位素,该第二重同位素不同于第一重同位素。在该优选的实施方式中,m的数值是1到n,n是2或更大。
当使用根据本发明的同位素替代物设计质量标签集合,值得考虑当一种特定重同位素被另一种重同位素替代时所形成的质量的差异。表4列出了不同重同位素的替代导致的质量的差异。
同位素1 同位素2 替代质量的差异(毫道尔顿) 13C 15N 6.3 13C 2H 2.9 2x13C 18O 2.5 15N 2H 9.3 2x15N 18O 10.2 2x2H 18O 8.3
表4
在根据本发明的质量标签的化学相同的集合具体的优选的实施方式中,质量调节部分*是13C或15N,且该集合包含n=4种具有下述结构的氨基-反应性质量标记物:
示例集合1:

标签1,精确质量=413.22660

标签2,精确质量=413.22028

标签3,精确质量=413.21396

标签4,精确质量=413.20764
在上述示例集合中,在第一标签中,m(如上所定义)是1,(n-m)=3和(m-1)=0。因此,存在3个原子的第一重同位素13C,其结合进入标签,以及0个原子的第二重同位素15N。在第二标签中,m=2,(n-m)=2和(m-1)=1,因此标签中存在2x13C和1x15N。在第三标签中,m=3,(n-m)=1和(m-1)=2,因此标签中存在1x13C和2x15N,而在第四标签中,m=4,(n-m)=0和(m-1)=3,因此标签中存在0x13C和3x15N。从计算的精确质量可知,各标签与相邻的标签相差6.32毫道尔顿。
在根据本发明的质量标签的化学相同的集合的其它具体的实施方式中,质量调节部分*是13C或15N,且该集合包含n=4种具有下述结构的氨基-反应性质量标记物:
示例集合2:

标签1,精确质量=415.23331

标签2,精确质量=415.22699

标签3,精确质量=415.22067

标签4,精确质量=415.21435
在上述示例集合中,在各标签中互换(n-1)=3原子核,得到集合中各标签的毫道尔顿质量变化。此外,整体质量为415道尔顿的上述集合可与整体质量为413道尔顿的之前的集合一起使用,来形成如上所述的标签的集合的阵列。在这种阵列中,对于413道尔顿化学相同的集合,p(如上所定义)现在的数值是零,因为没有将额外的重原子核添加到基础的标签结构,然在415道尔顿化学相同的集合中,p是2,因为已将2个额外的13C原子核结合进入415道尔顿化学相同的标签集合的每一个标签。
在根据本发明的质量标签的化学相同的集合的其它具体的实施方式中,质量调节部分*是13C或15N,且该集合包含n=4种具有下述结构的氨基-反应性质量标记物:
示例集合3:

标签1,精确质量=486.27042

标签2,精确质量=486.26410

标签3,精确质量=486.25778

标签4,精确质量=486.25146
在上述示例集合中,在各标签中互换(n-1)=3原子核,得到集合中各标签的毫道尔顿质量变化。此外,整体质量为486道尔顿且与之前两种标签集合相比包含额外的β-丙氨酸接头的上述集合,可与整体质量分别为413和415道尔顿的之前两种集合一起使用,来构建如上所述的非化学相同的标签的集合的阵列。上述示例集合包含p=2额外的重13C原子核,其以添加到化学相同的集合中的每一种标签。可合成其中p=0的相应的标签集合,得到整体质量为484的标签集合。如有需要,如果构建484和486标签,它们可一起使用来构建化学相同的集合的阵列。
在根据本发明的质量标签的化学相同的集合的其它具体的实施方式中,质量调节部分*是13C或2H,且该集合包含n=4种具有下述结构的氨基-反应性质量标记物:
示例集合4:

在示例集合4中,在各标签中互换(n-1)=3原子核,得到集合中各标签的毫道尔顿质量变化。此外,整体质量为413道尔顿的上述集合可与通过将13C与15N交换形成的整体质量也为413道尔顿的示例集合1一起使用,来形成4种标签的非化学相同的集合的阵列,因为除了两个集合中具有3x15N原子核的标签(因为这些标签是完全同量异位素的)以外,该集合中各标签精确质量不同。类似地,上述化学相同的质量标签集合可与上述415道尔顿标签集合组合,来形成化学相同的集合的阵列,或者上述标签集合可与486道尔顿标签集合组合来构建非化学相同的标签集合。应指出的是,如果应用需要这种标记集合的组合,本领域普通技术人员可以不同的标签组合来组合这些和其它标签。
在根据本发明的质量标签的化学相同的集合的其它具体的实施方式中,*是13C或15N,且该集合包含n=4种具有下述结构的氨基-反应性质量标记物:
示例集合5:

在示例集合5中,在各标签中互换(n-1)=3原子核,得到集合中各标签的毫道尔顿质量变化。此外,整体质量为413道尔顿的上述示例集合5可与示例集合4一起使用,以形成单一大的7-通道集合,其可使用足够的质量分辨率和质量精确性来分辨(两个集合中的标签4是相同的,因此酯能分辨7种标签)。还应指出,示例集合5的标签1的质量与示例集合4的标签2的质量极其相似,因此可能不太实际将那些标签一起使用,因此当组合示例集合4和5是,将得到可分辨的6-通道集合。应指出,本领域普通技术人员能组合根据本发明设计的这些和其它标签化学相同的标签集合,例如具有相同的化学相同的结构但具有18O替代物的标签集合。在用于分析标签集合的质谱仪分辨率极限之内,这种化学相同的集合可组合以形成更大的化学相同的集合。
在根据本发明的质量标签的化学相同的集合的其它具体的实施方式中,质量调节部分*是2H或15N,且该集合包含n=4种具有下述结构的巯基-反应性质量标记物:
示例集合6:

标签1,精确质量=526.18438

标签2,精确质量=526.17514

标签3,精确质量=526.16589

标签4,精确质量=526.15665
又在根据本发明的质量标签的化学相同的集合的其它具体的实施方式中,质量调节部分*是13C或15N,且该集合包含n=4种具有下述结构的胺-反应性质量标记物。
示例集合7:

标签1,精确质量=525.32665

标签2,精确质量=525.32033

标签3,精确质量=525.31401

标签4,精确质量=525.30769
在示例集合7中,标签能在用虚线指示的键处经历具体的片段化。这如图7所显示,其中已将来自示例集合7的标签1用于标记小的肽,且该肽已进行碰撞诱导的解离。
又在根据本发明的质量标签的化学相同的集合的其它具体的实施方式中,质量调节部分*是13C或15N,且该集合包含n=4种具有下述结构的胺-反应性质量标记物:
示例集合8:

标签1,精确质量=269.13934

标签2,精确质量=269.14566
将模板拟合到图谱:
根据本发明的第二和第三方面,将用于标记的肽的预计的同位素模板用来识别那些标记的肽的质谱中的标记的物质,其中可存在未标记的离子的复杂的背景。本发明的毫道尔顿标签导致高度非天然的同位素差异(见上文表1),且可使用自动化方法容易地识别。
如果根据本发明的4种随意的化学相同的质量标签相互相差6.3毫道尔顿,且最低的质量标签的反应质量是300.00000道尔顿,并将它们用于标记Lys-C劈裂的多肽混合物,那么对于在α-氨基和在ε氨基标记的典型的肽,且对于单价带电物质而言,模板将预期在大于未标记的离子600.00000道尔顿的m/z处发现第一标记的物质,即肽的质量增加2种质量标签的质量(2x300.00000)。类似地,对于单价带电物质而言,在大于未标记的物质的600.01260,600.02520和600.03780道尔顿的m/z数值处存在标记的离子峰(见上文的表1)。
通常,不将模板拟合到谱图的非常低质量的端部,因为这里存在可观的片段化噪音和高丰度的低质量离子例如溶剂离子和低质量离子团簇。在实际情况中,模板拟合可从200道尔顿开始。因此,从质谱S(x,y)的峰的分类列表开始,将选择质谱列表中的第一个峰,如果其质荷比超过预定的阈值(例如200道尔顿)。在其它实施方式中,如有需要,可使用更低的阈值,例如100道尔顿。
有两种方式来确定用于所测谱图(x,y)的第一峰的模板。在第一方法中,算法起始于已知和相关的肽序列的数据库,例如如果使用本发明的标签和方法分析人类癌症样品,那么可使用人类蛋白质组的预期的消化物的数据库来计算模板,从而拟合到根据本发明形成的质谱。
或者,在本发明的一些实施方式中,在测定用于相同的肽的高分辨率MS-模式谱图的同时或之后,测定样品中肽的序列数据。在这些“已知序列”实施方式中,模板的应用与本发明的数据库实施方式略有不同。
本发明的第三方面的这两种总体实施方式如下文所更加详细描述。
使用肽数据库计算模板和将模板拟合到质谱:
根据本发明的第三方面的第一典型的实施方式,计算取决于质量和取决于电荷的模板。在本发明的一些具体的实施方式中,可通过测定具有不同质量和电荷状态的大量不同肽的同位素丰度或强度的平均分布来计算模板。肽的同位素丰度分布由下述决定:组成肽的原子的天然同位素的丰度,以及不同天然同位素可在大量分子中分布的方式的数目。可通过计算肽的原子组成,然后应用组合概率模型(combinatorialprobabilitymodel)来测定预期包含不同同位素变体的肽分子数量的比例,来测定肽的同位素丰度分布。加伊(Gay)等(15)描述了一种使用这种模型从肽原子组成和已知天然同位素丰度来计算肽同位素丰度分布的方法。为了测定用于给定单一同位素质量的肽的平均同位素丰度分布,需要测定具有该质量的大量不同肽的同位素分布。给定质量的大量肽序列可通过下述来形成:随机地构建序列和计算它们的单一同位素质量,然后将序列分类成具有相同质量的组。然后,这个计算的各质量的肽列表可用于测定平均肽同位素分布。
或者,在本发明的优选的实施方式中,因为肽通常通过酶消化具有已知来源的样品从蛋白质制备,可通过下述来形成大量肽:通过使用给定的蛋白酶例如LysC或胰蛋白酶进行模拟消化,从为感兴趣的组织测定的公开的蛋白质序列数据库例如SWISS-PROT(16-18)或蛋白质信息资源(19,20)计算预期的肽序列。可根据质量对预计的片段分类,并可计算这些肽的预期的同位素分布。后一种方法是优选的,因为公开数据库反应了天然氨基酸丰度和序列。可通过组织来搜索数据库,从而提供用于给定组织的蛋白质,可从该蛋白质确定肽,由此反应组织所特有的氨基酸分布。类似地,标记的生物分子的原子组成的数据库可方便地衍生自现有数据库,例如可通过将预期的标记的氨基酸的原子组成取代进入未改性的肽的序列来确定标记的肽的原子组成。应指出,还应测定数据库中预计的给定质荷比的离子的同位素强度变化范围,因为这对于定义同位素模板非常重要。类似地,在计算模板时,也可考虑通过与本发明一起使用的质谱仪记录的同位素强度变化范围。
肽的质量决定同位素分布的形状。图5a和5b显示衍生自公开可用数据库的肽的典型的平均同位素分布,由图可知肽的质量和电荷状态对分布的形状具有显著影响。显然,随着电荷状态增加,同位素变体之间的质荷比差异相应地变小,对于2+状态,第一和第二同位素峰之间的m/z差异变成半个m/z单位,而对于3+状态,第一和第二同位素峰之间的差异是三分之一的m/z单位。此外,随着肽质量增加,更多大量同位素变体的单侧性优势(dominance)增加。为了筛选质谱,已发现因为受限于仪器分辨率以及基于预期的胰蛋白酶或LysC消化的肽尺寸形成可能性,在TOF或轨道阱质量分析仪中通常观察不到大于+6的电荷状态,因此,需要计算的模板数目由仪器能力决定,且需要计算的量可因此进行调节。
通过测定不同同位素峰高度极大值的强度与第一峰高度的比例,从平均同位素分布测定实际模板。
增加肽质量对第一峰的强度和更高同位素物质的强度之间的比例的影响见图6a。该图还显示另一重要方面,即还应测定预期的同位素强度的范围。同位素强度的变化范围也见图6a。因此,用于各电荷状态和质量的模板实际包含预期的同位素峰分离和同位素丰度比例差异,其具有应该允许的这些丰度与平均值的预期的偏差,并结合了用于各同位素峰的质荷比的预期的差异。考虑到进行实际测量师的随机扰动,应允许比计算的同位素强度偏差稍大的偏差。类似地,在确定各同位素峰相对于彼此的位置时,必须考虑仪器的质量精确性。模板构思和允许的误差如图6b图形化显示。
图3提供流程图,其显示如何将从数据库测定的取决于质量和电荷的模板应用到质谱S(x,y)。谱图(x,y)包含具有质荷比x和强度y的离子列表,按照它们所测的质荷比分类。对于图谱中的各离子峰,使用测量的质荷比,计算一系列模板,其中该系列包含用于具有测量的质荷比的离子的各不同可能的电荷状态的模板;在根据本发明的标记的肽这种情况下,计算用于各种可能的标记的物质的模板,并考虑不同数目的标签。在使用数据库时,使用数据库中所有可形成处于给定电荷状态并具有测量的质荷比的离子的条目(entries)(且对于标记的肽而言具有给定数目标签)来计算各模板,这代表了用于可形成给定峰的离子的预期的同位素丰度分布,并具有如上所述的预期的强度和峰分离变化。首先将对应于最高的预期的电荷状态的模板应用到谱图。从质谱S(x,y)选择离子,并从具有最低的记录的质荷比的离子开始。
为了比较给定的离子和模板,检查谱图(x,y)来确定下一个离子是否具有对应于用于模板中第二同位素峰差异的质荷比差异(在允许的误差之内)。如果S(x,y)中的下一个离子具有适当的质荷比,计算第一峰和第二峰强度的比例。如果这落在模板容忍的范围之内,以相同的方式针对模板测试来自S(x,y)的下一个离子,以确定其是否对应于第三同位素峰。通常,只需检查前3个同位素峰的强度的比例,但如有需要,也可使用更多的峰。因此,如果前三个离子满足模板的标准,将它们添加到初步命中目标列表(HitList)(Hp)。然后,对S(x,y)中的下一个离子重复该过程,直到所有的离子都已经针对第一模板进行检测。这样,谱图(x,y)可快速地筛选包含具有预定特征的离子的区域。
然后可通过应用更复杂的同位素分布模型来确认命中目标列表Hp中潜在的离子家族,其考虑了记录的用于各离子的峰的测量的偏差。这种建模步骤是更耗时的,因此需要更快的如上所述的模板扫描过程。然而,精确的建模非常重要,因为拟合的模型用来测定用于谱图中各拟合的峰的关键参数,例如测量的峰的质荷比和峰面积,这对定量图谱中存在的相应的离子的量至关重要。例如,TOF图谱中的各峰假定为包含具有相同的原子组成的离子。它们在检测器处的到达时间根据赋予到离子的能量变化,这导致到达时间铺展。离子能的分布可通过高斯密度函数来近似。或者,洛伦兹或沃伊特函数可用来模拟离子峰形状。类似地,不同仪器构造将产生具有特征形状的离子峰,其通常随着离子能分布而变化。离子能分布是复杂的函数,其来自离子化方法和质量分析激励的相互作用。在大多数情况下,这些离子峰形状可通过估算用于高斯、落伦兹或沃伊特函数的参数来模拟。因此,在使用如上所述的模板识别可对应于感兴趣的离子的谱图区域之后,使用更精确的离子峰形状模型来确认这些初步识别。
在本发明的优选的实施方式中,将同位素分布的高斯模型拟合到谱图(x,y)中的各峰(从初步命中目标列表Hp识别),并计算最小平方误差来测定测量的数据拟合模型的良好程度。这些精确的模型的图片见图5b。如果误差小于预定阈值,则接受初步命中目标(hit)。然后,将来自Hp并满足更复杂的建模标准的峰移动到第二确认命中目标列表Hc。还从谱图(x,y)去除用于添加到Hc的峰的数据。将Hc中更高同位素峰的面积添加到第一同位素,从而Hc只记录用于各峰的单一同位素质量和同位素强度之和。使用Hc中的单一同位素离子记录参数,例如通过拟合用于各峰的模型测定的质荷比和峰面积。此外,使用单一同位素强度记录电荷状态,其通过同位素峰匹配的模板或模型来测定。
一旦测试了给定电荷状态的模板,将下一个最低的电荷状态的模板连续地应用到质谱,直到已经检测了+1电荷状态模板。将通过模板识别的确认的离子家族添加到确认的命中目标列表Hc,并从谱图(x,y)去除对应于该离子家族的峰。一旦已经测试了给定离子的所有模板,以相同的方式分析谱图中下一个离子。该过程的最后结果是确认的单一同位素离子列表,其具有已知的质荷比、电荷状态和强度。
在本发明的一些实施方式中,分析识别的单同位素离子物质的谱图来确定图谱中是否存在多种电荷状态的任意分子物质。进行如图4的流程图所示的方法,从通过本发明的第一方面的模板匹配过程形成的确认的单同位素离子峰的命中目标列表Hc开始。使用Hc初始化最终质量列表M。使用来自Hc的离子初始化最终质量列表,其处于+1的电荷状态。将离子数据添加到M,并从Hc去除。然后,方法起始于Hc中具有最高的检测电荷状态的离子。对于处于最高的电荷状态的各离子,计算处于+1状态的相同离子的预期的质荷比。然后,搜索来确定最终质量列表中是否存在对应于该+1电荷状态的离子(在测定更低离子质量的质荷比时,在预定的误差之内)。如果在最终质量列表M发现这种离子,假定其作为更高电荷状态对应于相同的分子物质。测定更高电荷状态物质的离子强度,然后添加到匹配M中的+1物质,并将更高电荷状态物质从命中目标列表Hc去除。
测定离子强度取决于仪器,例如在四极子中,强度仅仅是用于各栅化物质的离子计数,而在TOF或轨道阱质量分析仪中,必须对各离子的峰面积进行积分。如果没有发现+1状态,将未匹配的物质的电荷状态改变到+1状态,并从Hc去除更高状态,即用添加到M的具有相同的强度且处于+1状态的离子的物质来替换高电荷状态物质。使用来自谱图的下一个更低电荷状态的离子列表重复该过程,直到具有+2电荷状态的离子。最后的结果是最终质量列表M,其包含全部处于+1电荷状态的单一同位素物质,它们的强度对应于包含用于该离子的电荷状态极限的所有离子的强度之和。这个电荷状态解卷积过程为表征离子提供额外的信息,在一些实施方式中,使用处于+1电荷状态的解卷积的单一同位素物质,记录给定离子的各电荷状态的强度。这种电荷状态极限数据可用来比较谱图,尤其是在液相色谱分析中,其中由从色谱分离洗脱的样品材料形成多种谱图。在质谱仪中可能更精确地测量给定离子的更高电荷状态的质荷比,因为大多数仪器对具有更低质荷比的物质的质量精确性更大。因此,小心的电荷状态解卷积可改善+1状态的质荷比的测定。
在本发明的一些实施方式中,“真时(on-the-fly)”计算同位素丰度分布模板,即当需要它们时进行计算。在其它实施方式中,可预先计算模板,并以当需要时可以访问该模板的形式来储存。例如,当分析肽并从肽序列数据库计算模板时,这时可能的,因为数据库中只存在固定数目的物质可形成具有给定质荷比的离子。因此,可提前计算对应于肽数据库中每一个条目的所有预期的电荷状态的模板。
在怎样实施本发明的实施例中,考虑虚构的肽,其中在谱图(x,y)中测量到精确测定的质荷比是326.00867,且其是S(x,y)离子的分类列表中的第一离子。在本实施例中,还考虑4个多肽的样品,从其衍生肽,且肽被4种胺-反应性质量标签的集合标记,其中最轻的标签的反应的残基质量(即当将标记物与肽共轭时,施加到肽的质量变化)是300.00000道尔顿,且所述集合中的标签相差6.3毫道尔顿。考虑肽的数据库,其中已经计算用于不同标记的肽序列的预计的同位素。针对数据库搜索326.00867的质荷比,来寻找具有匹配质量(在仪器的预期的测量误差之内)任意离子。表1可认为是该肽数据库中用于虚构的肽的条目,其质量精确地为700.00000并包含单一赖氨酸和游离的α氨基。在上述实施例中,预期已经使用施加的质量标签将该肽标记两次。这样,使用上述300.00000道尔顿标签双重标记的物质的质量是1300.00000,且用集合中最轻的标签标记的用于该物质的+4离子具有预期的326.00867质荷比,这匹配S(x,y)中测定的质量。因此,用于不同标记形式的700.00000道尔顿肽的离子峰的计算的数据库中的该条目是匹配S(x,y)中记录的离子的候选者。在表1中可知,匹配质量对应于双重标记的肽的第一天然13C同位素的4+电荷状态。因此,根据本发明的模板拟合算法预期发现对应于质荷比为326.25951的第二天然13C同位素的另一离子,以及对应于质荷比为326.51035的第三天然13C同位素的第三离子。类似地,因为已知使用4种标签标记肽,预期对应于其它标记的形式的这种肽的4+电荷状态的9种离子将存在于S(x,y)中,并搜索S(x,y)来寻找这些相应的离子,从而确认预计的这些质荷比的肽是否真正匹配S(x,y)中记录的峰。类似地,各标记的物质的第一、第二和第三13C天然同位素的相对强度由肽中的碳原子数目决定(不包含标签),用于各标记的物质的天然同位素的相对强度(即表1中的各行)应与每个其它行大致相同(尽管根据重原子核自身的丰度,各标签自身将稍微改变相对丰度)。然而,在实验之前测定重原子核的标签丰度,并可使用已知方法加一(Gay)(15),将其用来计算各标记的物质的预期的第一、第二和第三13C天然同位素的相对强度。因此,借助S(x,y)中的一组峰,各标记的物质的各天然同位素的相对丰度可用来提供额外的确认来自数据库的肽匹配的匹配。
应指出,本发明的质量标签用来定量衍生自复杂的多肽混合物的不同样品的相应的肽的量。因此,如果某些肽的母多肽没有在母样品中表达,有些样品中可不存在某些肽。因此针对谱图(x,y)计数(scoring)模板时,必须考虑有些离子不存在。如果存在对应于全部大多数离子的预期的峰,则可将记录的离子记为具有潜在的命中数据库中的匹配离子。
然后,可测定模板和被分析的真谱图(x,y)的区域之间的相似性。可使用各种方法来实施将计数模板到谱图的拟合。通常,这可通过将模板T(x,y)与S(x,y)(21)相互关联来实施。
一旦在数据库中发现潜在的匹配,预期图谱中存在其它电荷状态的肽,因此再次使用表1,算法可寻找对应于4+离子的3+离子,即针对S(x,y)交叉检测表1中质荷比为434.34200-435.02351的12种3+离子物质。它们的存在将提供肽识别的额外的确认。类似地,还可匹配2+和1+离子。然后,将用于各电荷状态的离子从S(x,y)去除,并添加到潜在的命中目标列表Hp。
或者,当从S(x,y)中的分类离子列表提取离子时,可针对数据库搜索在S(x,y)中的各峰。在这种情况下,如果它们在S(x,y)中记录质荷比匹配相应的数据库条目,预期不同电荷状态的离子将命中数据库中相同的条目。将这些命中目标添加到Hp,从而可针对数据库来搜索它们。
在分析的次末级,分析Hp来为各物质连接不同的同位素峰,即将各天然同位素的强度添加在一起并记录为单一条目,其对应于第一天然同位素的质荷比,即将谱图Hp(x,y)进行去同位素化。取决于数据种类,可使用合适的模型例如高斯模型对用于这些同位素的各个峰进行拟合,然后如上所述积分峰面积得到该峰的更精确的强度数值。在模型拟合和积分之后,将处于给定电荷状态的各天然同位素的强度添加在一起,并将各标记的物质的各电荷状态的不同同位素的求和信号记录在新的确认的命中目标谱图Hc(x,y)中,其中只记录各标记的离子的各电荷状态的最低的单同位素物质。
在分析的最终阶段,分析Hc来将相同的肽的不同电荷状态连接成单一单一同位素不带电荷的肽离子,将各标记的物质的各电荷状态的离子计数之和记录为单一数值,并记录在最终质量列表M(x,y)中。
计算模板和将模板拟合到质谱,其中经验地确定肽序列:
在将模板拟合谱图(x,y)的第二种方法中,算法起始于已知的离子序列。如果峰也选择用于MS/MS分析,峰的序列可能是已知的,其中将离子片段化,且从序列确定肽的序列。用于同时测定复杂的肽的混合物的MS-模式和MS/MS模式数据的典型的方法如下所述,且包含复杂的肽混合物的依赖于数据的分析(DDA)或复杂的肽混合物的不依赖于数据的分析(DIA)。因此,使用如下所述的DDA数据集合或DIA数据集合,质谱S(x,y)中的许多峰可具有与其关联的已经通过MS/MS分析经验测定的肽序列。在这种情况下,肽的精确组成是已知的,并可计算对应于使用本发明的不同质量标签标记的标记的序列的预期的谱图。
在这种情况下,首先使用测序的离子分析S(x,y)。因此,分析的第一离子是具有最低的质荷比的离子,且其序列数据已经测定。因此,从来自S(x,y)的第一测序离子的序列计算第一模板。因此,还通过测定的序列来确定标签的电荷状态和数目。例如,再次将表1作为示例,如果来自来自S(x,y)的离子具有434.34200的质荷比并包括具有与其结合的序列(例如来自DDA分析),且已经为预期的标记的物质计算相应的预期的离子质荷比。
因此,对于4种不同质量标记的肽物质,拟合到S(x,y)中的第一离子的第一模板将对应于处于+3电荷状态的天然同位素的12种质荷比。这些质荷比差异是高度非天然的,因此是标记的离子的显著特征。类似地,各标记的物质的第一、第二和第三13C天然同位素的相对强度由肽中的碳原子数目决定(不包含标签),用于各标签的天然同位素的相对强度应相同(尽管根据重原子核自身的丰度,各标签自身将稍微改变相对丰度)。然而,在提前的实验中测定重原子核的标签丰度,并可因素化进入模板。因此,用于3+离子的模板预期发现12种离子来自表1的可能的3+离子,各标记的物质在各天然同位素之间具有特征相对强度。
然后,可测定模板和被分析的真谱图(x,y)的区域之间的相似性。可使用各种方法来实施将计数模板到谱图的拟合。通常,这可通过将模板T(x,y)与S(x,y)(21)相互关联来实施(参见史密斯S.W.(Smith,S.W.)《科学家和工程师数字信号处理手册(TheScientistandEngineer'sGuidetoDigitalSignalProcessing)》:加利福尼亚技术出版社(CaliforniaTechnicalPublishing),1997)。如果S(x,y)中的离子匹配模板,那么从S(x,y)去除离子,并指派到新的潜在的命中谱图Hp(x,y)。
然后,可搜索S(x,y)来寻找第一测序肽的其它电荷状态,并可将这些从S(x,y)去除并添加到Hp。然后,针对模板计数MS-模式谱图(x,y)中的第一测序离子,并将其全部的相应的电荷状态从S(x,y)去除,分析S(x,y)中的下一个测序离子,且算法将尝试将模板拟合到该测序离子。继续该过程,直到谱图(x,y)中所有的测序离子都已经从S(x,y)去除。
在一些实施方式中,只分析S(x,y)中的测序离子,例如当不存在可用的用于组织的蛋白质组数据时。或者,一旦分析全部的测序离子之后,可如上所述针对备选模板的数据库搜索S(x,y)。
然后分析Hp来形成如上针对数据库搜索S(x,y)所述的Hc。类似地,如上针对数据库搜索S(x,y)所述分析Hc,以形成最终质量列表M,其具有各标记的物质的求和强度。
HPLC-分离的标记的肽的洗脱分布:
在本发明的优选的实施方式中,通过首先施加一种或多种色谱分离分离那些肽来分析标记的肽的复杂的混合物。通常,最终分离是反相高效液相色谱(RP-HPLC),其可与来自HPLC柱的洗脱材料的质谱检测在线实施。通常,将HPLC洗脱物直接喷涂进入电喷射离子来源,其中洗脱肽离子化并传输进入质谱仪,以收集MS-模式和MS/MS-模式谱图。然后,通过MS仪器对洗脱进入质谱仪的分离肽的连续流动进行取样,该MS仪器在从HPLC洗脱的离散时间点收集谱图。因此,收集一系列谱图,提供在任何时间从HPLC柱洗脱的东西的快照。柱上的肽分离不是完全离散的,任意给定肽在一定时间范围洗脱并具有洗脱分布,即随时间变化的洗脱的质量的量,通常采用高斯形式,当肽从HPLC柱洗脱时肽的信号逐渐增加然后降低。通常,在更低分辨率HPLC上,洗脱可进行30秒到1分钟,而在更高分辨率仪器上,肽可在小于或等于20秒内洗脱。取决于仪器,MS仪器可每10毫秒或每100毫秒收集谱图,但通常在任意给定肽进行洗脱时MS-仪器将收集多种谱图。这意味着任意给定肽将存在于多种连续的谱图中,且离子的强度将反应当其从HPLC柱洗脱时的浓度。因此,在一系列连续的质谱中,离子强度将增加到峰然后下降,遵循高斯分布。
在本发明的方法其它实施方式中,在将模板应用到MS-模式谱图来寻找标记的离子之后,可分析从分析标记的肽的复杂的混合物形成的连续谱图来识别连续谱图中的相同的物质。如果离子存在于多种连续谱图且如果它的洗脱分布是高斯的,那么这种数据提供识别离子的额外的确认。
在本发明的其它实施方式中,其中如下所述例如使用MSE来交替地收集MS-模式和MS/MS-模式谱图,标记的肽的洗脱分布将用来将MS/MS谱图中的片段连接回它们在MS-模式谱图中的完整的母离子,因为片段谱图应具有与完整的母离子相同的洗脱分布。例如,用于指派片段或产物离子到前体离子的方法参加US6,717,130。
用质谱分析肽离子的方法:
依赖于数据的分析肽:
在本发明的优选的实施方式中,使用来自合并的一系列多肽的复杂的混合物样品的标记的肽的依赖于数据的分析(DDA),来分析使用本发明的质量标签标记的肽。DDA也称作肽的鸟枪法测序。DDA通过多维蛋白质识别技术(MUDPIT;(2))来示例化。在测定样品中蛋白质表达的典型的DDA或鸟枪法测序方法中,在变性条件下还原和烷基化来自生物来源的蛋白质样品。然后,用胰蛋白酶处理蛋白质来制备胰蛋白酶消化物。然后,对该胰蛋白酶消化物进行两种或多种色谱分离。通常,使用离子交换色谱将肽分离成预定数目的片段。然后,用反相高效液相色谱(RP-HPLC)单独地分析这些片段,其具有通过电喷射离子化串联质谱(ESI-MS/MS)的在线分析,即肽在从RP-HPLC分离洗脱时喷涂进入质谱仪(在MUDPIT中,将离子交换树脂直接堆积在HPLC树脂上,以连接分离)。
为了测序尽可能多的肽,将质谱仪编程为用MS-模式交替地分析混合物以检测离子,然后在MS-模式谱图中选择离子,用于后续的MS/MS-模式测序。典型的‘取决于数据的’选择离子策略初始地基于丰度和质量。例如,对于给定的MS-模式图谱,质谱仪选择具有最高的强度的3种离子,其中该离子必须还超过具体的m/z阈值和必须不同于在分析的上一次循环中分析的离子或不同于上两次循环、上三次循环或更多次循环中分析的离子。因此,将分析样品中存在的离子的相对随机的子集,且过度表达形成丰度最大的离子的蛋白质。
在本发明的语境中,使用胰蛋白酶或LysC消化一系列的多肽的复杂的混合物的样品,并在任何片段化之前,使用本发明的质量标签进行标记。然后,可使用任意标准的DDA协议来分析标记的肽,但MS-模式检测离子必须在合适的仪器例如轨道阱精英(OrbitrapElite)(赛默飞科技公司(ThermoScientific))上,使用非常高分辨率和质量精确性检测来实施。对于实施本发明轨道阱精英是优选的,因为轨道阱精英仪器包含贝洛斯(Velos)线性离子阱(LIT),其具有与轨道阱质量分析仪在线的一组独立的检测器。因此,该仪器能在轨道阱中实施高精确性MS-模式质量分析,同时LIT实施MS/MS分析来测定单个离子的序列。
为了DDA,轨道阱实施如下所述的分析循环:1)将从反相HPLC柱片段化的离子喷涂进入LIT,其中它们被冷却和送到C-阱来进一步冷却,然后将离子注入轨道阱用于精确的质量分析,以测定第一精确的MS-模式质谱。2)在用轨道阱测定第一精确的MS-模式质谱之后,将第二批离子注入轨道阱用于高精确性质量分析。3)当轨道阱分析第二批离子时,LIT收集其它批的离子,选择使用DDA选择离子方法确定的离子,其基于来自第一精确的MS-模式质谱的数据。4)将选择的离子片段化来测定序列信息和识别离子。5)LIT可选择使用DDA选择离子方法确定的一个或多个其它离子,其基于来自用于测序的第一精确的MS-模式质谱的数据。6)然后,LIT通过C-阱收集、冷却其它批离子并将其注入轨道阱,并开始测序离子,其基于来自注入轨道阱的第二批离子的精确的MS-模式质谱的DDA选择。7)继续该过程,直到不存在其它肽片段化进入仪器。在典型的分析中,将来自HPLC柱的片段收集90分钟-2小时。
可知使用DDA方法时,能同时获得用于复杂的肽混合物的精确的MS-模式数据来测定使用本发明的标签和方法的肽的相对含量以及MS/MS数据来测定识别混合物中肽的至少一个子集。
值得一提的是,虽然单一DDA或鸟枪法分析样品只可识别样品中肽的一个子集,但使用高质量精确性分析和可重复的色谱法,序列数据将精确地指派到肽的测定MS-模式质量。在本发明的语境中,MS-模式数据也将具有高度非天然MS-模式谱图,其易于识别和易于与未标记的材料区分。因此,如果在一系列DDA分析中分析类似的样品例如大量研究的人类癌症活检组织,很可能在各样品识别不同肽子集,并可使用精确的质量标签将来自独立的分析的相应的离子相互比较,从而允许已识别为标记的离子但尚未在一DDA分析中测序的离子与相应的离子结合,该相应的离子具有相同的质量和洗脱时间且其序列数据已在不同DDA分析中测定。
在其中实施多种DDA分析的大量研究中,可需要通过DDA分析第一组样品,然后在后续样品中应用‘排除列表’。排除列表是已经测序的肽的列表,从而它们在后续DDA分析中无需再次测序,因此在第一分析或第二分析中没有测序的肽可在后面的DDA分析中测序。因此,随着测序更多的样品,可放大‘排除列表’直到测序样品中基本上所有的肽。如果在各DDA分析中存在使用的参比样品来确保来自各样品的相应的离子被适当指派,这种方法特别有效。
不依赖于数据的分析肽:
在本发明的其它实施方式中,使用来自合并的一系列多肽的复杂的混合物样品的标记的肽的不依赖于数据的分析(DIA),来分析使用本发明的质量标签标记的肽。DIA是蛋白组分析中用于分析复杂的蛋白质样品的新兴方法,其潜在地改善如上所述的鸟枪法方法或DDA方法。所谓的“不依赖于数据的采集”方法解决了鸟枪法分析的一些限制。
用于测序肽的方法已随时间而改进,具体来说,质谱仪的质量精确性已非常显著地改善,使得更容易从片段识别肽。现在,质量精确性的改善足以允许同时测序多种肽,即可同时选择多种肽并可一起片段化。一起分析多种肽使得能开发新的“不依赖于数据的分析”方法,其中现在潜在地可通过MS/MS分析注入质谱仪的每一个离子,而不是如DDA中所限定的窄的子集,这大大改善了蛋白质组的“覆盖率”,尽管低丰度离子仍然难以可靠地检测。
这种同时分析肽取决于成功地将片段离子指派到它们相应的前体离子,且这仍然是非常具有挑战性的。公开了两种方法来实现这个。在所谓的MSE方法(希尔法JC(SilvaJC)等,《分子细胞蛋白组(MolCellProteomics)》.5(1):144-56.Epub2005,10月11日,“用LC-MSE绝对定量蛋白质:平行MS采集的优点(AbsolutequantificationofproteinsbyLC-MSE:avirtueofparallelMSacquisition)”2006)中,使用由“升高的MS”(MSE)交替地收集的MS-模式数据连续地分析洗脱肽,其中将进入机器的所有离子暴露于升高片段化能来从进入机器的全部数量的离子形成片段离子,即越过几乎进入质谱仪的离子的全部质量范围收集低碰撞能图谱和高碰撞能谱图。收集用于整个分析的数据,并储存用于分析。基于它们在色谱分离时的共洗脱,将来自MSE谱图的片段离子暂时指派到来自MS-模式数据的前体离子,即片段应具有与它们的相应的前体相同的洗脱分布。然后,过滤暂时指派离子,并针对用于各前体离子的预计的序列进行比较,以寻找最可能的匹配。
在本发明的语境中,使用胰蛋白酶或LysC消化一系列的多肽的复杂的混合物的样品,并在任何片段化之前,使用本发明的质量标签进行标记。然后可分析标记的肽,进行MSE分析,其中通过交替地收集MS-模式和升高的片段化能模式谱图来分析从HPLC柱片段化的肽。然后,可使用本发明的方法分析MS-模式数据,以识别标记的离子和定量那些标记的离子,而MS/MS数据用来识别肽。
在替代的方法即所谓的SWATH方法(基力特LC(GilletLC)等,《分子细胞蛋白组(MolCellProteomics)》.11(6):O111.016717.“由不依赖于数据的采集形成的MS/MS谱图的目标数据提取:用于一致和精确的蛋白质组分析的新概念(TargeteddataextractionoftheMS/MSspectrageneratedbydata-independentacquisition:anewconceptforconsistentandaccurateproteomeanalysis)”doi:10.1074/mcp.O111.016717.Epub2012,2012年1月18日)中,洗脱进入质谱仪的肽交替地进行下述分析:具有快速扫描的MS-模式,在升高的碰撞能下的MS/MS分析,通常整个m/z范围存在32个约25道尔顿的窄的重叠窗口来,从而在升高的碰撞能下分析在400-1200道尔顿之内的基本上所有的肽。同样地,任何给定碰撞能窗口中可存在多种肽,因此片段离子必须指派到前体离子。在SWATH方法中,通过将各碰撞能窗口中存在的片段离子与MS-模式数据中已知的可能的前体离子谱图进行比较来实施上述指派。
在本发明的语境中,使用胰蛋白酶或LysC消化一系列的多肽的复杂的混合物的样品,并在任何片段化之前,使用本发明的质量标签进行标记。然后可分析标记的肽,进行SWATH分析,其中通过交替地收集MS-模式和用于预定的碰撞能窗口的一系列升高的片段化能模式谱图来分析从HPLC柱片段化的肽。然后,可使用本发明的方法分析MS-模式数据来识别和定量离子。
可知使用DIA方法时,能同时获得用于复杂的肽混合物的精确的MS-模式数据来测定使用本发明的标签和方法的肽的相对含量以及MS/MS数据来测定识别混合物中肽的至少一个子集。理论上DIA方法应允许识别混合物中基本上全部的肽,假定可分辨低丰度离子。
在MS-模式谱图中的抑制基础峰和增加更低丰度离子:
当收集用于标记的肽的复杂的混合物的MS-模式谱图时,常常有些离子的丰度比其它离子的丰度更大。在一些仪器特别是TOF仪器中,更高丰度的离子限制检测更低丰度的离子。因此,可需要收集第一MS-模式图谱,识别丰度最大离子,并引导仪器来在不存在丰度最大离子的情况下收集其它MS-模式谱图。可将该过程迭代地用于下一个丰度最大离子等。在四极子飞行时间仪器(Q-TOF)上,TOF通过收集多种TOF谱图(10次-100次)和对它们进行平均,来形成全MS-模式谱图。在Q-TOF上,借助一些形式的实时检测,可使用第一四极子作为宽带离子指导来将基本上全部离子从来源输送到检测器,收集用于整个质量范围的初始的一些谱图。在收集一点数量(10-20)谱图之后,可识别丰度最大离子,然后可将四极子设定为收集其它离子。因此,如果在收集20谱图之后,发现质荷比为800的单一带电离子是基础峰,可将Q-TOF上的第一四极子设定为以1-799的范围将离子传输到TOF用于一个图谱,并以大于或等于803(以避免800离子的同位素极限)的范围将离子传输到TOF用于第二图谱。第一四极子可交替地在这两个范围中传输离子,并收集其它20谱图,因此避免800处的离子。然后,可识别下一个丰度最大离子,并可将四极子设定为传输一定范围的离子,该范围同时避免丰度最大和丰度第二大的离子。可迭代该过程,来收集有利于更低丰度离子的谱图,因此改善MS-模式检测的动态范围。或者,第一四极子可在全部质量范围的一系列重叠的子范围中循环传输,即仪器可传输1-100,然后90-200,然后190-300等来覆盖整个质量范围,这同样降低MS-模式图谱中更低丰度离子被抑制的可能性。
用MS/MS分析标记的肽:
图7显示使用来自根据本发明的示例集合7的标签1(在图7中指示为1)标记肽(序列:VATVSLPR)。天然的未质子化的VATVSLPR肽(图7中指示为2)的质量是841.50215道尔顿。在与来自示例集合7的标签1结合之后,随后在质谱仪中离子化和检测,标记的肽处于2+电荷状态(图7中指示为3),且质荷比为626.90821。使用来自示例集合7的标签2,3和4标记的相同的肽的相应的质荷比分别是626.905045,626.901885和626.898725。具有高质量分辨率的MS-模式测量应可分辨这些离子,因此可标记含肽VATVSLPR的4个样品,并可测定该4样品的相对数量。然而,在一些情况下,质谱仪的质量分辨率可能不足以分辨相差3.16毫道尔顿的离子,或者处于不同电荷状态的另一种不同标记的肽离子可巧合地与标记形式的VATVSLPR从HPLC分离共洗脱且可巧合地具有处于一电荷状态下的同位素极限,其与VATVSLPR的2+电荷状态重叠,使得难以解卷积MS-模式中的离子信号。不管哪种情况,可通过MS/MS来进行测量。在标记的肽VATVSLPR的MS/MS分析中,选择标记的离子,如果4-样品已经用来自示例集合7的4种不同质量标签标记,则这些离子可共选择用于碰撞诱导的解离(CID)。在本发明的标签集合中的小的质量的差异,使得非常方便进行用于MS/MS的共选择离子。就这方面而言,本发明的标签非常类似于同量异位素的质量标签,因为甚至当使用小的选择窗口来排除不需要的离子以用于进一步分析时,它们也是可共选择的。
在图7中显示了一种预期的通过CID导致的来自图7的标记的物质3的片段化路径。标记的物质3将损失单一带电的二甲基哌啶片段(指示为物质4),中性损失一氧化碳(指示为物质5),留下包含全部重同位素标签的标记的肽离子(图7中指示为6)。肽的其它片段化也可能发生,尤其是在给出关于肽的序列信息的肽之内。物质7可称为伪同量异位素的补足的离子,其类似于乌荷(Wuhr)等(22)在文献中讨论的从同量异位素的质量标签的CID形成的补足的离子。与在MS-模式中测量的标记的物质3相比,使用示例集合7的标签1标记的肽VATVSLPR的补足的离子7损失单一电荷,现在其质荷比为1099.69377。使用来自示例集合7的标签2,3和4标记的相同的肽的补足的离子相应的质荷比分别是1099.68745,1099.68113和1099.67481。与图7中的物质3相比,物质7的电荷状态发生改变,这意味着使用来自示例集合7的4种标签标记的离子现在的质荷比相差6.32道尔顿,因此使得更容易分辨离子,因为此时离子之间的间隔是如果在MS-模式中进行测量时的间隔的两倍。类似地,如果具有不同电荷状态的两种离子在MS-模式中具有重叠的同位素极限,片段化时电荷状态的改变将在MS/MS谱图中分离离子,同样地使得能分辨那些离子。
如果将本发明的模板拟合方法实时在收集MS-模式谱图时应用到该MS-模式谱图,可识别在MS-模式中没有适当分辨的离子,且随后可以改性的依赖于数据的选择离子策略将这些离子选择用于MS/MS。
类似地,还设想了不依赖于数据的分析技术例如如上所述的MSE,其中在低碰撞能和然后在高碰撞能下交替地分析离子,这将从相同的标记的肽收集两个数据集合。如果因为离子重叠或由仪器在其分辨率极限操作不良地分辨,所以难以在低能图谱即MS-模式图谱中分析肽,可通过使用本发明的模板拟合方法分析高能谱图,从而分辨在低能图谱中具有挑战性的一些离子。
因此,应明确根据本发明的质量标签是可解离的,且其中它们被设计成解离从而在CID之后用来差异化不同标签的全部重同位素仍然在完整的肽上(见图7),使得MS/MS分析标记的片段离子极其有用。
用MS/MS/MS分析标记的肽:
图8显示使用来自根据本发明的示例集合8的标签1和2(在图8中分别指示为1和2)标记肽(序列:VATVSLPR)。天然的未质子化的VATVSLPR肽(图7中指示为3)的质量是841.50215道尔顿。在与来自示例集合8的标签1结合之后,随后在质谱仪中离子化和检测,标记的肽VATVSLPR处于2+电荷状态(图8中指示为5),且质荷比为498.310915。用来自示例集合8的标签2标记的相同的肽的(图8中指示为6)相应的质荷比是498.314075。
具有高质量分辨率的MS-模式测量应可分辨这些离子,因此可标记含肽VATVSLPR的2个样品,并可测定该2样品的相对数量。然而,如上所述,一些仪器上的质量分辨率限制,特别是对于较大的肽,或重叠同位素极限,可使得希望通过MS/MS/MS分析标记的肽。
在标记的肽VATVSLPR的MS/MS/MS分析的第一阶段中,选择标记的离子,同时共选择标记的离子(5和6)用于碰撞诱导的解离(CID)。如上所述,在本发明的标签集合中的小的质量的差异,使得非常方便进行用于MS/MS/MS的共选择离子。
在图8中显示了一种预期的通过CID导致的来自图8的标记的物质5和6的片段化路径。标记的物质5和6预期的经历方便的肽序列中的脯氨酸残基和靠近N-末端亮氨酸残基之间的片段化,形成包含脯氨酸和精氨酸的单一带电的y-离子(图8中指示为9)和一对具有包含完整的标签的肽的剩余物的单一带电的b-离子(图8中指示为7和8)。很可能这些b-和y-离子在标记的肽的片段化谱图中易于观察到。然后,可选择指示为7和8的具有完整的标签的物质用于在能进行MS/MS/MS的仪器例如离子阱上进行进一步分析。用于此目的的合适的仪器是轨道阱精英,其包含连接到轨道阱高质量分辨率质量分析仪的离子阱。因为7和8具有非常类似的质量,同样它们可方便地进行共选择,同时排除基本上全部其它离子。一旦与其它离子分离,7和8可进一步片段化。在这种情况下,将形成图8中指示为10和13的两种报告物离子,其可方便地通过高质量分辨率分析来区分。物质10形成质荷比为127.12476的离子,而物质13形成质荷比为127.13108的离子。至于标记的肽的MS/MS分析,可通过MS/MS/MS实施对较低质量的单一带电的报告物离子10和13的分辨,这比在MS-模式中分辨双重带电的标记的肽物质5和6更容易,因为大多数的质谱仪能对更低质荷比离子实现更高的分辨率,此外1+报告物离子的质荷比差异是2+标记的母离子之间差异的2倍,对于3+和4+离子而言则更大。因此,通过MS/MS/MS检测报告物离子,将允许相对定量含肽VATVSLPR的两种样品,而且MS/MS/MS方法将促进分辨仅仅通过MS-模式分析难以分辨的更大、更高电荷状态的离子。
应指出,报告物离子10和13也存在于由物质5和6的碰撞诱导的解离形成的MS/MS谱图中。在本发明的一些实施方式中,那些报告物离子可用来提供相对定量来源样品中的肽VATVSLPR,但如果存在与标记的肽VATVSLPR重叠的标记的离子同位素极限,那么重叠标记的肽将与VATVSLPR共选择并得到相同的报告物离子,因此干扰用于VATVSLPR的测量的定量。使用同量异位素的质量标签时已经注意到这个问题(23),且报道MS/MS/MS分析来自MS/MS谱图的片段离子,其中片段离子仍然包含完整的标签来解决定量同量异位素的标签时的不精确性。类似地,本发明提供的伪同量异位素的标签在MS/MS中和在MS/MS/MS中将以非常类似的方式进行,因此MS/MS/MS分析来自MS/MS谱图的片段离子,其中片段离子仍然包含完整的标签将提供高精确性定量仅仅用MS-模式检测难以分辨的离子。
处理高分辨率质谱数据
为了将本发明的第一方面中提供的方法应用到质谱数据,数据必须处于对于该方法有意义的形式。数据需包含具有已知质荷比的离子强度的列表。不同种类的质量分析仪形成不同形式的元素数据,其必须处理来形成离子强度与它们的质荷比的列表。
飞行时间质谱仪是示例种类的质谱仪,从其可获得高分辨率、高质量精确性的数据。类似地,轨道阱质谱仪是高分辨率质谱仪,如傅立叶变换离子旋风分离器共振质谱仪。
轨道阱质谱仪由外部桶状电极和共轴的内部纺锤状电极组成,其形成具有方形对数(quadro-logarithmic)电势分布的静电场(8,9)。检测来自动态捕集的离子的图象电流,数字化并使用傅立叶变换转化成频率结构域数据,然后转化成质谱。将离子注入轨道阱,其中它们沉降进入绕着内部电极的轨道路径。绕着内部电极的轨道振荡频率记录为图象电流,可对其施加傅立叶变换算法,将频率结构域信号转化成具有非常高分辨率的质谱。
在傅立叶变换离子旋风分离器共振(FTICR)质谱法中,离子样品保留在空腔状的离子阱中,但在FTICRMS中通过交叉电场和磁场在高真空腔室中捕集离子(10,24)。由形成箱子两侧的一对板电极形成电场。在超导磁体的场中包括该箱子,其与两块板连接,捕集板将注入的离子限制到捕集板之间的圆形轨迹,与施加的磁场垂直。通过向两片“传输器板”施加射频脉冲,将离子激发到更大的轨道,其形成箱子的其它两个相对的侧面。离子的摆线(cycloidal)运动在包含“接收器板”的箱子的剩余的两个相对的侧面形成相应的电场。激发脉冲将离子激发到更大的轨道,其逐渐衰减因为离子的相干运动通过碰撞损失。使用傅立叶变换(FT)分析,将通过接收器板检测的相应的信号转化成质谱。FTICR仪器的质量分辨率随着施加的磁场的强度增加,可实现非常高分辨率分析(25)。
为了进行诱导的片段化实验,FTICR仪器可以类似于离子阱的方式实施,可将除了感兴趣的单一物质以外的所有离子射出FTICR空腔。可将碰撞气体引入FTICR空腔,并可诱导片段化。可后续地分析片段离子。如果用由“接收器板”检测的信号的FT分析进行分析,通常片段化产物和浴气体组合形成不良的分辨,然而可将片段离子射出空腔和在例如具有四极子或飞行时间仪器的串联构造中分析。
在飞行时间质谱仪中,使具有窄动力学能分布的离子脉冲进入不含场的游离的漂移区域。在仪器的漂移区域中,具有不同质荷比的离子在各脉冲中以不同速度移动,因此在不同时间到达设置在漂移区域端部的离子检测器。即刻通过时间-到-数字转换器数字化由检测器响应到达的离子形成的类似信号。测量离子飞行时间测定各到达离子的质荷比。对于飞行时间仪器,存在多种不同设计。在某种程度上,设计由离子来源的性质决定。在矩阵辅助的激光脱附离子化飞行时间(MALDITOF)质谱仪中,通过激光激发在金属靶上结晶的样品材料来形成离子脉冲。这些脉冲在飞行管的一端形成,并从那加速它们。
为了从电喷射离子来源采集质谱,使用正交轴线TOF(oaTOF)几何形貌。通过“推进器”板从连续的流中取样在电喷射离子来源中形成的离子脉冲。推进器板通过使用短暂的电势差异将离子注入飞行时间质量分析仪,其将离子从来源加速进入正交设置的飞行管。记录从推进器板到检测器的飞行时间来形成到达离子的数目针对质荷比的柱状图。使用时间-到-数字转换器,数字化地记录该数据。
在MALDI-TOF和ESI-oaTOF中,都通常在约100毫秒的时间中分析约1,000离子脉冲来获得完整的谱图。将来自各脉冲的信号添加到柱状图,由此形成原始的数字化的TOF图谱。
本发明的第三方面提供一种处理由高分辨率质谱仪例如轨道阱或飞行时间质谱仪形成的质谱数据以将数据减少到感兴趣的离子列表的方法。图1显示提供的总体过程的流程图。在原始数字化的飞行时间数据上操作分析方法。在处理原始TOF图谱的方法中存在三个一般步骤。预处理图谱使谱图与第二步骤兼容,其中使用预定的同位素图案和电荷状态识别谱图中的离子。处理的最终步骤识别谱图中以多种电荷状态存在的离子,并将这些状态解卷积到单一的+1电荷状态。该分析处理的最后结果是包含+1电荷状态的单一同位素离子强度列表的谱图,其中离子全部满足应用到图谱的同位素分布模板的标准。
预处理飞行时间数据通常由仪器制造商提供的软件来实施,例如由麦克罗马斯公司(Micromass)(英国曼彻斯特)的提供的MassLynx软件,以操作它们的ESI-TOF和Q-TOF仪表化。然而,有时优选地需要能直接处理数据,且处理TOF数据使其与本发明的方法兼容所需的一般步骤见图中2。为了审阅如下所述的一些标准数字信号处理技术,参见例如《科学家和工程师数字信号处理手册(TheScientistandEngineer'sGuidetoDigitalSignalProcessing)》(21)。
通常,来自TOF质量分析仪的数字信号被低水平的随机噪音污染。优选地,在其它分析之前去除该噪音。去除噪音的各种方法都可适用。通常,与离子信号相比,噪音水平非常低。因此,消除噪音的最简单方法是设定阈值强度,忽略(或去除)小于该阈值的信号。然而,发现飞行时间质量分析仪的噪音水平随着质荷比增加而变化,因此最好对不同质荷比采用不同阈值阈值。对于给定给定仪器,可测定标准阈值函数,使噪音与质荷比相关,且这可用来消除低于强度的阈值水平的信号。然而,一种更优选的方法是为各图谱的不同质荷比制备依赖于数据的噪音估算,因为这允许在要考虑的特定仪器上的分析之间随机变化,使得该方法不依赖于所用的仪器。这可通过下述来进行:将原始谱图分裂成区间(bins)并估算各区间中的噪音。然后,可将描述适当曲线的插值或样条函数拟合到用于各区间的噪音估算,从而提供适应性阈值,其在图谱的全部质荷比范围中变化。然后,将低于计算的阈值的信号从图谱去除。
在去除随机背景噪音之后,于尝试在数据中寻找离子峰之前,必须平滑数字信号。平滑可通过各种方法来实现。通常,用低带通滤波卷积(convoluted)数字质谱数据。低带通滤波通常通过有效地测定信号的移动平均来平滑数字信号。这从数据去除非常高频的信号,其对应于各离子的数字化信号强度中小的随机变化。可使用多种不同的具有平滑效果的滤波核函数例如简单平方函数来卷积数字信号,其形成改性的图谱,其中应用了移动平均,其中在移动平均中每一点具有相同的权重。一种更优选地滤波核函数向移动平均的中点施加更高的权重。合适的滤波核函数包含衍生自窗口化辛格(sinc)函数,布拉克曼(Blackman)窗口和汉明(Hamming)窗口。在更优选的实施方式中,通过使用衍生自高斯函数的滤波核函数卷积来平滑TOF谱图。
数字信号中的峰识别与用于连续信号中的基本上相同。使用连续信号时,计算信号的一阶微分和二阶微分(differential);识别信号的极大值和极小值即峰和谷,其中一阶微分是零,识别极大值其中二阶微分是负的。对于离散的信号,拉普拉斯(Laplacian)滤波测定相应的差异公式,其促进检测数字信号中的峰。
一旦从TOF数据识别具有相应的质荷比的峰的列表,可将本发明的第一方面提供的方法应用到该峰的列表。该过程的最后结果是确认的单一同位素离子列表,其具有已知的质荷比、电荷状态和强度。
在处理TOF数据的最终步骤中(见图1),分析识别的单同位素离子物质的谱图来确定图谱中是否存在多种电荷状态的任意分子物质。进行如图4的流程图所示的方法,从通过本发明的第一方面的模板匹配过程形成的确认的单同位素离子峰的目标列表Hc开始。使用Hc初始化最终质量列表M。使用来自Hc的离子初始化最终质量列表,其处于+1的电荷状态。将离子数据添加到M,并从Hc去除。然后,方法起始于Hc中具有最高的检测电荷状态的离子。对于处于最高的电荷状态的各离子,计算处于+1状态的相同离子的预期的质荷比。然后,搜索来确定最终质量列表中是否存在对应于该+1电荷状态的离子(在测定更低离子质量的质荷比时,在预定的误差之内)。如果在最终质量列表M发现这种离子,假定其作为更高电荷状态对应于相同的分子物质。通过积分来自TOF数据的离子的峰面积来测定更高电荷状态物质的离子强度。然后,将该积分的峰强度添加到匹配M中的+1物质,从目标列表H去除更高电荷状态物质。如果没有发现+1状态,将未匹配的物质的电荷状态改变到+1状态,并从H去除更高的状态,即用添加到M的包括具有相同的强度且处于+1状态的离子的物质取代高电荷状态物质。使用来自谱图的下一个更低电荷状态的离子列表重复该过程,直到具有+2电荷状态的离子。最后的结果是最终质量列表M,其包含全部处于+1电荷状态的单一同位素物质,它们的强度对应于包含用于该离子的电荷状态极限的所有离子的强度之和。
在电荷状态解卷积过程中,可需要记录给定分子离子物质的各电荷状态的强度,因为这些数据可用于表征离子或重构原始的图谱。
其它质量分析仪
本发明的方法等效地适用于在不包含飞行时间质量分析仪的各种仪器上形成的谱图,然而TOF质量分析仪是优选的,因为它具有高质量分辨率,使得可分辨具有更高电荷(>+4)的离子。基于四极子的仪器通常具有比基于TOF的仪器更低的质量分辨率和质量精确性,但原始数据可用本发明的方法分析,尽管在这些仪器上不能很好的分辨更高电荷状态物质。四极子数据的优势在于它的谱图通常无需平滑。去噪音的方法类似于关于TOF所述的那些方法。扇形仪器也可具有高质量分辨率,但灵敏度趋于比相应的TOF质量分析仪更低。傅立叶变换离子旋风分离器共振(FT-ICR)质谱和轨道阱质谱也可使用本发明的方法来分析。这些仪器可形成非常高分辨率数据,使得可分辨高电荷状态,也优选的与本发明一起使用。在轨道阱和FT-ICR数据中,峰形状也通常采用高斯形式,因为在感兴趣的两种中,通过测量在某种轨道中的离子形成的图象电流来测定离子质荷比。在两种仪器中,给定质荷比的离子将以速度分布轨道运行,其通常是正态分布,因此得到高斯峰形状。这意味着针对TOF数据所讨论的峰拟合等效地适用于轨道阱和FTICR数据。类似地,所有检测系统遭受随机电子噪音,因此如上所述的噪音减少策略也等效地适用于轨道阱和FTICR谱图数据。
软件
在本发明的优选的实施方式中,以在计算机可读介质上的计算机程序的形式提供用于解释质谱的方法,从而允许计算机自动化地实施本发明的方法。
同位素模板匹配软件的并行处理(Parallelisation)
如上所述,本发明的方法可实施为在计算机可读介质上的程序,其通过计算机处理器来执行。已在单一处理器计算机上运行,完成实施这种算法。这样实施软件中的算法是完全有用的,但相对较慢,花费约1分钟/图谱来处理肽样品的典型的液相色谱分析,其可形成几千个独立的TOF谱图。因此,希望有方法来增加分析速度,从而分析时间不是质谱分析系统的通量的限制因素。模板匹配过程将各离子物质当作独立的条目,尽管图谱中可存在许多电荷状态的相同的来源分子,因此这意味着算法可容易地并行地应用到多台处理器,来处理待处理的各谱图的不同的子谱图。等效地,可将不同谱图分配到各处理器。在一种实施方式中,将软件搭载到LINUX群(cluster)上,其通常包含在网络例如以太网交换机(Ethernetswitch)上连接的多台不同计算机“节点”,并连接到称为前端的特殊的节点计算机(有时将“节点”称为“附属”,将“前端”称为“主机”)。前端通常包含连接到前端计算机的键盘、显示器、和鼠标,允许人类与群互动。因此,通过前端控制群。前端计算机负责将待处理的各质谱分割成包含小范围质荷比的子谱图。在网络连接上,将各子谱图发送到不同计算机,其将本发明的软件引用到数据。一旦各计算机完成运行算法,将结果通过网络返回到主机计算机,再次组装成单一谱图,其中在全部质谱上识别满足模板匹配软件条件的所有离子。然后,主机计算机将实施任何额外的处理例如电荷状态解卷积,这必须在整个再次组装的图谱上实施。
在基于UNIX的并行处理系统例如LINUX群集中,可以简单的方式进行并行处理:在群集的各节点安装用于处理质谱的本发明的软件备份。在前端计算机上安装额外的程序。该额外的程序将质谱分割成子谱图,将子谱图分配到节点并指令节点来执行质谱处理软件,并指令节点将数据返回到前端。在这些这些第一步骤之后,前端上的程序等待这些待返回的数据并随后将返回的数据合成为单一图谱。
在本发明的这方面的另一种实施方式中,可用语言例如C编码用于离子检测的软件,其受到公开可用的并行虚拟机软件封装件的支持(26)。该软件封装件首先由橡树岭国家实验室(OakRidgeNationalLaboratory)(美国田纳西州)开发,其使得能将在网络上连接的Unix和/或Windows计算机的多样化收集作为单一大的并行计算机来使用。
本发明的质量标签的应用
本发明提供一种用于分析多肽的复杂的混合物的两种或多种样品的方法,所述方法包含下述步骤:
1.使用序列特异性的劈裂剂来消化复杂的多肽混合物的各样品,形成复杂的肽混合物;
2.使复杂的肽的混合物的各样品与根据本发明的不同质量标签反应,该标记具体地与那些肽中的一个或多个反应性官能团反应,其中标签导致在标记的肽的质荷比形成小的改变,从而来自复杂的肽的混合物的各样品的相应的肽具有独特的可分辨的质荷比;
3.任选地,使用不同或相同的化学相同的质量标签的集合重复步骤2,但标签上具有不同反应性基团来与肽的不同官能团反应,从而用相同的顺序的标签质量标记各样品。
4.任选地,使用质量相互不同的一对化学相同的标签标记复杂的肽的混合物中的不同反应性基团,对于每一个不同样品使用相同的一对标签,以分裂峰,目的是识别具有被标记的反应性基团的肽。
5.将标记的样品合并在一起。
6.任选地,用一种或多种色谱分离技术分离标记的和合并的肽样品。
7.通过质谱分析合并的肽样品,来测定用于标记的肽的高分辨率质谱。
8.分析质谱来检测和测定不同样品中相应的肽的同位素异数体的强度,该不同样品来自使用根据本发明的不同质量标签标记不同样品。
9.任选地,选定一个或多个离子和片段化该一个或多个离子来测定用于那些肽的序列信息。
在本发明的一些实施方式中,如有需要,标记反应性基团的任选的步骤3或4可在消化之前进行。
使用胺-反应性质量标签标记肽:
在本发明的第二方面的优选的实施方式中,消化复杂的多肽混合物的步骤优选地使用序列特异性的内切蛋白酶例如胰蛋白酶或LysC来实施。内切蛋白酶LysC在邻近赖氨酸残基C-末端的酰胺键处劈裂,因此在使用LysC的实施方式中,大多数因劈裂导致的肽具有单一C-末端赖氨酸残基和单一αN-末端氨基,即可与胺-反应性标签反应的两个氨基。因此,使用胺-反应性标签时,LysC-劈裂的肽大多数被两种标签标记。这个规则存在一些例外:
·多肽的C-末端肽不具有赖氨酸,除非赖氨酸是多肽的C-末端氨基酸,或者
·LysC不在脯氨酸-赖氨酸键处劈裂,从而包含脯氨酸赖氨酸连接的肽具有多于一个赖氨酸。脯氨酸-赖氨酸连接也可出现在多肽的C-末端肽,或者
·多肽的α-氨基通常被阻断,通常乙酰基化,因此多肽的N-末端肽通常只具有一个赖氨酸(除非存在脯氨酸-赖氨酸连接)。
使用N-羟基琥珀酰亚胺(NHS)酯活化示例集合1中的标签,其容易与氨基反应。因此,如果将上述示例集合1用来标记来自Lys-C消化4种不同复杂的多肽混合物的4种不同肽样品,大多数肽将被两种标签标记。在示例集合1中,单个标签相互间质量相差6.3毫道尔顿。这意味着来自使用来自示例集合1的不同标签标记的样品的肽在各肽之间的质量的差异是12.6毫道尔顿,该各肽连接有两个质量标签。只具有单一游离的氨基的标记的肽的质量的差异是6.3毫道尔顿,而具有脯氨酸-赖氨酸连接的肽可具有3个或多个标记的氨基。这些肽在不同样品之间的质量的差异是6.3x可用的氨基的数目)。类似地,有LysC不完全消化导致的肽也可具有多于2个可用的氨基来标记。因此,应明确当通过根据本发明的方法通过质谱法测定合并的样品的质量时,从使用2种标签标记的肽导致的质谱在标记的肽峰之间具有差异间隔。因此,使用来自示例集合1的标签标记的、处于+1电荷状态且具有两个质量标签的肽离子将间隔12.6毫道尔顿,而单一标记的离子将间隔6.3道尔顿,其它离子根据被本发明的质量标签标记的可用的氨基数目隔开。
使用本发明的方法,可通过计算适当的同位素模板来识别不同类型的肽和使用质谱卷积这些来识别标记的离子。因此,可计算用于检测具有两种标签的肽的模板,使得从MS-模式数据选择性地识别这些肽。然后,可针对具有两种可用的胺的肽的数据库搜索这些肽的质量,即与整个蛋白质组相比减少了要搜索的数据库。如有需要,可忽略包含3个或多个氨基的肽,因此可能存在许多通过LysC不完全消化的肽,或可针对含3个或多个可用的氨基的物质的具体的数据库搜索这些肽,该含3个或多个可用的氨基的物质包含具有脯氨酸-赖氨酸连接的肽、不完全的劈裂和可能的任意其它多种标记。
值得一提的是,在有效质谱仪上,6.3毫道尔顿的间隔可能太小以至于不能用来分辨肽离子,因此在一些情况下,只可分辨具有2个或多个标签的肽。因此,在许多情况下,使用LysC来确保大多数的肽具有至少两种标签是优选的。
相反,胰蛋白酶同时在邻近精氨酸和赖氨酸C-末端的酰胺键处劈裂,因此在使用胰蛋白酶的实施方式中,有些肽具有被两种标签标记的C-末端赖氨酸,有些肽具有只有在α氨基处用单一标签标记的C-末端精氨酸。与LysC类似,这个规则存在一些例外:
·多肽的C-末端肽不具有赖氨酸或精氨酸,除非赖氨酸或精氨酸是多肽的C-末端氨基酸,或者
·胰蛋白酶不在脯氨酸-赖氨酸或脯氨酸-精氨酸连接处劈裂,因此包含脯氨酸赖氨酸连接的肽具有多于一种赖氨酸和因此具有多于一种可用的氨基。脯氨酸-赖氨酸连接也可出现在多肽的C-末端肽,或者
·多肽的α-氨基通常被阻断,通常乙酰基化,因此多肽的N-末端肽通常只具有一个赖氨酸(除非存在脯氨酸-赖氨酸连接)。
如果使用来自示例集合1的4种标签在氨基上标记来自4个不同胰蛋白酶消化物样品的肽,具有赖氨酸的肽大多数具有2个标签,含精氨酸的肽只具有1个标签。
同样,使用本发明的方法,可通过计算适当的同位素模板来识别不同类型的肽和使用质谱卷积这些来识别标记的离子。因此,可计算用于检测具有两种标签的肽的模板,使得从MS-模式数据选择性地识别这些肽。然后,可针对具有两种可用的胺的肽的数据库搜索这些肽的质量,即与整个蛋白质组相比减少了要搜索的数据库,因为原来将搜索具有单一赖氨酸和游离的N-末端α氨基的肽。类似地,可从原始质谱过滤具有1个标签的肽,并针对来自预期的蛋白质组的肽的子集搜索,该预期的蛋白质组现在包含具有单一游离的氨基的肽,其原来是含精氨酸的胰蛋白酶肽。同样,如有需要,可忽略具有3个或多个标签的肽,或者可针对适当的数据库进行搜索。
使肽中的多种反应性基团与多于1种的质量标签反应:
在本发明的一些实施方式中,使用本发明的标签标记肽中多于一种反应性基团。例如,当分析多个复杂的多肽混合物的样品来测定那些样品中的多肽的相对数量时,可期望于在不同复杂的多肽混合物的样品中消化多肽之前,使用还原剂例如三羧甲基磷酸(TCEP)来还原那些样品。TCEP还原半胱氨酸残基之间的二硫键,在半胱氨酸残基处留下游离的巯基。通常,这些游离的巯基被一种实际阻断,使它们对于发生其它反应成惰性,在本发明的一些实施方式中,可期望如此,例如碘乙酰胺的试剂适用于该目的。然而,使用根据本发明的巯基-反应性质量标签标记半胱氨酸巯基,可增强复杂的肽混合物中肽的精确的质量标签分析。
例如,如果来自TCEP还原的胰蛋白酶消化物的4种不同样品的肽在半胱氨酸基团上使用来自示例集合6的4种巯基-反应性标签的集合来标记,各样品的含半胱氨酸的肽被不同标签的标记。如果肽后续地使用来自示例集合1的氨-反应性标签以相同质量顺序标记,即使用来自示例集合6的标签1标记的样品应使用来自示例集合1的标签1标记等,那么将标记在这些肽以及任何半胱氨酸残基中的赖氨酸ε氨基和N-末端α-氨基。该标记得到各种不同类别标记的肽,见下文的表5:



表5
从表5可知,用在标签集合的成员之间具有不同质量的差异的两个不同集合的化学相同的标签标记一系列肽样品得到的标记的肽可分类成多种不同类别,各类别的肽能通过来自不同样品的标记的肽之间的特征质量的差异来识别。
同样,使用本发明的方法,可通过计算适当的同位素模板来识别不同类型的肽和使用质谱卷积这些来识别标记的离子。因此,可计算用于检测具有2个氨-反应性标签和1个半胱氨酸-反应性标签的模板,使得从MS-模式数据选择性地识别这些肽。然后,可针对具有两个可用的胺和1个半胱氨酸残基的肽的数据库搜索这些肽的质量,即与整个蛋白质组相比大大减少了要搜索的数据库,因为原来将搜索具有单一赖氨酸、游离的N-末端α氨基和单一半胱氨酸残基的肽。类似地,可从原始质谱过滤具有1个氨标签和单一半胱氨酸的肽,并针对来自预期的蛋白质组的肽的子集搜索,该预期的蛋白质组现在包含具有单一游离的氨基的肽,其原来是具有单一半胱氨酸残基的含精氨酸的胰蛋白酶肽。此外,具有两个或多个半胱氨酸残基的肽的丰度小于具有单一半胱氨酸的肽,这些肽的质量很可能容易与它们相应的肽序列匹配。同样,如有需要,可忽略具有3个或多个标签的肽,或者可针对适当的数据库进行搜索。
因此,应明确本发明的质量标签和方法可大大增强肽识别的精确的质量标签方法。
磷酸肽:
磷酸肽对于研究者和药物开发者都带来极大兴趣,因为磷酸化是关键过程,通过该过程在细胞内告知信息。因此,检测磷酸肽的方法是极其有价值的。
本技术领域公知磷酸盐的氢氧化钡催化的β-消除反应以及所得麦克尔(Michael)中心的后续反应作为标记丝氨酸和苏氨酸磷酸酯的一种方式(27,28)。β-消除麦克尔加成(BEMA)反应可用于将磷酸盐基团交换成可有益于质谱的替代的基团。用脂肪族基团取代丝氨酸和苏氨酸中的磷酸酯意味着可使用标准阳离子交换和/或反相色谱方法来分离磷酸肽,如用于未改性的肽(29)。还报道取代磷酸肽中的磷酸酯基团来增强检测磷酸肽,尤其是在磷酸肽的矩阵辅助激光脱附离子化(MALDI)分析时(27,29-31)。
在各种实施方式中,钡催化的BEMA反应可与本发明的标签一起使用。
在本发明的一般磷酸酯-标记实施方式中,在一种方法中分析已知包括磷酸肽的一系列多肽复杂的混合物的样品,所述方法包含下述步骤:
1.任选地,变性、还原和烷基化各样品中的任何半胱氨酸残基。
2.使用序列特异性的内切蛋白酶消化来自各样品的多肽混合物
3.任选地,使用质量标签标记各样品中任何游离的氨基,从而用独特的可分辨质量标签标记每一个样品
4.β-消除来自各样品中肽的任何磷酸酯基团
5.使由磷酸丝氨酸和磷酸苏氨酸磷酸酯基团的的β-消除导致的麦克尔中心与大量过量的二巯基接头反应,从而麦克尔中心与二巯基接头的一个巯基反应,且二巯基接头的剩余巯基仍然是未反应的。
6.对于各样品,使具有来自二巯基接头的游离的巯基的肽与根据本发明的巯基-反应性质量标签反应,从而用独特地可分辨质量标签标记每一个样品
7.将标记的样品合并在一起
8.任选地,用一种或多种色谱分离技术分离标记的和合并的肽样品。
9.通过质谱分析合并的肽样品,来测定用于标记的肽的高分辨率质谱。
10.分析质谱来检测和测定不同样品中相应的肽的同位素异数体的强度,该不同样品来自使用根据本发明的不同质量标签标记不同样品。
11.任选地,选定一个或多个离子和片段化该一个或多个离子来测定用于那些肽的序列信息。
在本发明的一些具体的磷酸酯-标记实施方式中,β-消除使用氢氧化钡进行催化。在用于β-消除麦克尔加成的优选的方法中,在疏水性树脂上反相固定来自复杂的肽混合物的肽,如文献(32)所述,当在固体载体上固定肽时进行β-消除麦克尔加成。
在本发明的一些具体的磷酸酯-标记实施方式中,与二巯基接头反应的巯基-反应性标签包含碘代乙酰亚胺基(iodoacetimidyl)接头。示例集合6提供一种可能的化学相同的标签的集合,其适于标记4组复杂的多肽混合物的样品。
在本发明的一些具体的磷酸酯-标记实施方式中,与肽的氨基反应的胺-反应性标签包含NHS-酯。示例集合1提供一种可能的化学相同的标签的集合,其适于标记4组复杂的多肽混合物的样品。在本发明的实施方式中,其中将本发明的质量标签用于引入小的质量变化,然后优选地以与巯基-反应性标记物相同的质量顺序在氨基上标记样品,该巯基-反应性标记物用于标记β-消除的磷酸酯位点。在本发明的优选的具体的磷酸酯-标记实施方式中,其中同时标记氨基和磷酸酯基团,用来标记氨基的化学相同的标签的集合所形成的肽之间的质量的差异应不同于通过巯基-反应性标签引入的质量的差异。这样,将形成类似于表5所示那些的具有独特质量分离的肽类别,使得基于不同样品中相应的标记的肽离子之间的质量分离识别不同种类的磷酸肽。
同位素丰度修改:
虽然肽具有特征同位素丰度分布,但常常值得修改肽的同位素丰度分布,以允许识别具体的特征。例如,ICAT方法(5)从生物材料分离包含半胱氨酸的肽,作为从混合物中各蛋白质获得少量具体的肽样品的方式。ICAT已表明利用分析含半胱氨酸的肽来表征复杂的肽混合物。识别含半胱氨酸的肽的另一种方式是使用标记物标记半胱氨酸,其形成具有特征同位素分布的肽。为此,已开发了多种标记物和标记过程(33-37)。这些论文中描述的方法全部似乎趋于手动解释MS数据。根据第四方面,本发明的方法可潜在的提供用于解释这种同位素标记的物质的质谱的自动化过程。因此,在本发明的第四方面的一种实施方式中,提供用于识别和定量一系列复杂的多肽混合物的样品中含半胱氨酸的肽的方法,所述方法包含下述步骤:
1.消化复杂的多肽混合物的各样品。
2.使用具有特征同位素分布的单一反应性标签标记各复杂的肽的混合物的样品中的非氨反应性官能团。
3.使用不同的根据本发明的胺-反应性标签标记各复杂的肽的混合物的样品中的氨基
4.计算用于含半胱氨酸的肽的模板,其衍生自要分析的组织的数据库,其中对于肽中存在的电荷状态、质量范围和标签数目的各种预期的组合都存在模板。
5.将取决于标签、质量和电荷的同位素分布模板连续地应用到包含标记的肽离子的质谱,从用于谱图中各离子的最高预期的标签的数目和电荷状态的模板开始,从而寻找匹配所述同位素模板的质谱中的区域。
6.将预期的同位素分布拟合到通过模板匹配过程识别的肽离子,从而确认预识别,由此识别肽的电荷状态和与肽反应的标签的数目。
因此,在上述方法中,将同位素标签引入肽中的非氨反应性基团,例如半胱氨酸残基或β-消除的磷酸酯基团或糖中存在的醛基。在这种情况下,选择同位素标签来改变标记的产物的同位素分布,使得在MS-模式分析中易于分辨它们。例如,半胱氨酸残基可用二氯苄基碘乙酰胺(34)标记。使标签具有特征同位素分布的简单方法是使用2种或更多种标签的同位素混合物,其同时与选择的反应性基团反应。根据本发明的两种标签的混合物可用于此目的,但标签之间的质量的差异可能太小。或者,标签常规的重和轻同位素与所需反应性基团反应,得到特征同位素信号。因此,对于半胱氨酸-标记,可使用碘乙酸的两种同位素,例如轻碘乙酸和重13C2-碘乙酸(西格玛奥德里奇公司(Sigma-Aldrich))可以预定比例例如50:50混合,并施加到半胱氨酸残基。使用一对同位素标签作为单一具有下述效果:将胺-标记的信号分裂成通过任何质量的差异分离的两个峰。
内标:
在本发明的一些优选的实施方式中,可期望将标记的内标添加到标记的复杂的多肽混合物的样品。内标通常是天然样品或人造肽或多肽混合物,其中关键多肽或肽的数量是提前已知的。这意味着可使记录的未表征的样品中的肽的强度与内标样品中测量的强度相关联,从而测定未表征的样品中肽的绝对数量。
在优选的实施方式中,可期望使用以不同预定的浓度存在的两种或更多种内标,从而允许计算用于样品的校准曲线,如WO2008/110581所述。
实施例:
用于合成大多数根据本发明的质量标记物的一般方法如上所述。(2,6-二甲基-哌啶-1-基)-乙酸的同位素和相应的N-羟基琥珀酰亚胺活性酯的合成参见本申请人前面的专利申请(WO2007012849)。类似地,β-丙氨酸延伸的结构的合成参见WO2007012849和我们后面的申请(WO2011036059)。
合成具有下述结构的一对标签:

精确质量:412.2106

精确质量:412.22324
未掺杂的(2,6-二甲基-哌啶-1-基)-乙酸和相应的具有单一13C取代的结构的合成分别参见WO2007012849的实施例,该具有单一13C取代的结构是制备MMT-NN和MMT-CC所需的:

β-丙氨酸同位素15N-β-丙氨酸和13C1-β丙氨酸是市售的(剑桥同位素实验室公司(CambridgeIsotopeLaboratories,Inc),美国马萨诸州图克斯布里(Tewksbury))。通过制备苄基酯,这些市售β-丙氨酸结构在羧酸处进行保护,如WO2007012849所述。然后,可将苄基酯保护的β-丙氨酸结合到(2,6-二甲基-哌啶-1-基)-乙酸并纯化,如WO2007012849所述。去除苄基酯保护基团,可借助通过HPLC的纯化,对具有苄基酯保护的β-丙氨酸的结构实施其它衍生循环。制备该分子的N-羟基琥珀酰亚胺酯形式,基本上如WO2007012849所述来实施。
用两15N同位素取代的MMT-NN标签也可在用虚线指示的键处片段化,得到整体质量为126道尔顿的报告物离子。
用两13C同位素取代的MMT-CC标签也可在用虚线指示的键处片段化,得到整体质量为127道尔顿的报告物离子。
将这些两种标签用来标记合成的肽(VATVSLPR)。以各种比例混合两种标记的形式的肽,见下文的表6:
MMT-NN(126报告物离子) MMT-CC(127报告物离子) 1 1 2 1 4 1 8 1 16 1 1 2 1 4 1 8 1 16
表6:以所示比例制备MMT-NN和MMT-CC-标记的肽的混合物
将500飞摩尔(fmol)的各混合物装载进入EasynLCII液相色谱系统,用于分离。在轨道阱VelosPro质谱仪(赛默飞科技(ThermoFisherScientific),美国加利福尼亚圣乔斯(SanJose))上,当将它们从色谱柱电喷射时以MS-模式,和在HCD片段化之后以MS/MS模式获得这些不同混合物的高分辨率质谱。使用约100,000的分辨率。
在MS/MS谱图中,可在质荷比为126和127处观察到报告物离子。用MMT-NN和MMT-CC标记的肽VATVSLPR的1:1的混合物的MS/MS谱图见图9。指示了报告物离子。此外,b-离子系列包含完整的标签,可从b-离子获得标签比例。在图9中不能看到这个,但图10a和图11a顶部显示放大部分的1:1标记的肽混合物的b1离子的MS/MS谱图。在图10a中,可在质谱的细结构中观察到1:1比例,其中来自各标记的形式的肽的b1离子的信号以预期的12毫道尔顿的间隔出现。发现可从b1,b2,b3,b4,b5离子获得比例。b6离子是不可检测的(图9),b7离子也非常弱,在现有分析的分辨率(100,000)下是不可分辨的。图10a-10e分别显示用于b1,b2,b3,b4和b5离子的1:1比例肽混合物的放大的谱图。
表6所示的比例的完整集合可从126/127报告物离子以及如图11a-11i所示的b1离子来获得。图11a顶部显示用于具有比例1:1(MMT-NN:MMT-CC)的肽混合物的b1离子,而图11a底部显示用于相同的比例的126/127报告物离子。图11b顶部显示用于具有比例2:1(MMT-NN:MMT-CC)的肽混合物的b1离子,而图11b底部显示用于相同的比例的126/127报告物离子。图11c顶部显示用于具有比例4:1(MMT-NN:MMT-CC)的肽混合物的b1离子,而图11c底部显示用于相同的比例的126/127报告物离子。图11d顶部显示用于具有比例8:1(MMT-NN:MMT-CC)的肽混合物的b1离子,而图11d底部显示用于相同的比例的126/127报告物离子。图11e顶部显示用于具有比例16:1(MMT-NN:MMT-CC)的肽混合物的b1离子,而图11e底部显示用于相同的比例的126/127报告物离子。图11f顶部显示用于具有比例1:2(MMT-NN:MMT-CC)的肽混合物的b1离子,而图11f底部显示用于相同的比例的126/127报告物离子。图11g顶部显示用于具有比例1:4(MMT-NN:MMT-CC)的肽混合物的b1离子,而图11g底部显示用于相同的比例的126/127报告物离子。图11h顶部显示用于具有比例1:8(MMT-NN:MMT-CC)的肽混合物的b1离子,而图11h底部显示用于相同的比例的126/127报告物离子。图11i顶部显示用于具有比例1:16(MMT-NN:MMT-CC)的肽混合物的b1离子,而图11i底部显示用于相同的比例的126/127报告物离子。
因此,使用MMT-NN和MMT-CC标签,可同时使用m/z为126和127的报告物离子测量比例,即使用具有单一道尔顿分辨率的MS2或MS3,以及在结构离子中使用具有高分辨率的MS1或MS2。
通过使得由多种离子平均信号,能测定多种离子的比例应用改善定量测量的牢固性。本发明的标签的另一有用特征在于,当标签出现在N-末端肽处时,它们常常制备强的b1离子,这使得b1离子称为用于常规扫描的有用的报告物离子。能测定来自其它片段离子的标签的比例也可用于处理共选择的问题,其目前是使用同量异位素的质量标签定量的问题,如文献(亭(Ting)等,NatMethods.8(11):937-40,“MS3消除在同量异位素的多通路定量蛋白组中的比例干扰(Tingetal,NatMethods8(11):937-40,“MS3eliminatesratiodistortioninisobaricmultiplexedquantitativeproteomics2011)”.2011),因为很可能在大多数肽的MS/MS谱图中存在可分辨的离子,这允许测定定量比例。
此外,MMT-NN和MMT-CC标记的肽还可通过亭(Ting)等和我们之前专利申请(WO2009141310)提出的MS3方法分析,该方法涉及选定一个或多个包含完整的标签的MS/MS片段离子,即用于VATVSLPR肽的b-离子,并分离该一个或多个离子,然后对该离子进行碰撞解离来在m/z为126和127处释放报告物离子。因为选择的具体的序列离子以及因为大大减少共选择来自MS2片段的干扰离子的可能性,可通过MS3方法测定精确的报告物数量。
实施例2:
在其它实施例中,用碘乙酰胺还原、烷基化两种不同的100微克的小鼠海马(MouseHippocampus)蛋白质的样品,并用胰蛋白酶消化过夜。干燥各消化的样品,并用MMT-NN或MMT-CC标记。将MMT反应物溶解于乙腈(ACN)中,然后在100mM三乙基碳酸氢铵(TEAB)中稀释,得到浓度为17.5mM的MMT和50mMTEAB的溶液。将100微升的各MMT溶液立刻用于标记消化的肽样品。在摇晃下,使标记反应在室温下运行30分钟。通过添加25微升的0.4%的羟胺来淬灭反应,其在室温下反应15分钟。
将样品在真空下过夜干燥。然后,将干燥的样品分别溶解于200微升的含0.1%甲酸的2%ACN(~1微克/微升总蛋白质/当量肽)。将相当数量的NN-MMT和CC-MMT标记的海马样品混合在一起。然后,将溶液稀释1:5,并使用5微升(~1微克当量样品)用于纳米HPLC-NSI-MS/MS分析(EASY-nLCIIOrbitrapVelosPro(赛默(Thermo)公司)系统)。
将样品装载在2厘米长(外径(OD):360μm,内径(ID):100μm)的毛细管柱上,其用5微米的ReproSil-PurC18-AQ(麦斯博士公司(Dr.MaischGmbH))填充,用于捕集和清洁。使用总计115分钟的梯度进行LC,其由90分钟的以300纳升/分钟在15厘米长(OD360μm,ID75μm)毛细管柱上的5-30%乙腈的分离梯度组成,该毛细管柱用3微米的ReproSil-PurC18-AQ(麦斯博士公司(Dr.MaischGmbH))填充,加上洗涤和再平衡。
在轨道阱分析仪中实施在300-1000Th的调查MS扫描,分辨率为100,000(自动化获取控制目标106离子,最大离子填充时间500毫秒)。
选择在MS调查扫描中强度最高的10种前体(使得能进行FT主机扫描预览模式,单一同位素前体选择,拒绝电荷状态1,所需最小信号:10000)用于后Q解离(PQD)片段化(隔离宽带2Th,标准化碰撞能40,活化Q0.7,活化时间0.1毫秒)和离子阱中的MS/MS扫描读出(正常扫描种类,预计的离子注入时间,最大离子填充时间100毫秒,AGC目标10000)。在采集时,将锁定质量m/z445.12用于校正最终的质量变化。使用动态排除列表来避免重复测序相同的分析物(重复/排除期间30秒,质量宽度20ppm)。
图12a显示用于m/z为484.96的肽的MS-模式谱图。可清楚地分辨来自使用MMT-NN标记的肽样品的母离子,与来自使用使用MMT-CC标记的样品。来自使用MMT-NN标记的肽样品的肽看起来存在的丰度比使用MMT-CC标记的样品低5倍。可在对应于不含任何重同位素加上2标签的肽的离子(图12b)和对应于具有天然的结构中的1x13C原子核加上2标签的肽的离子峰(图12c)以及对应于具有天然的结构中的2x13C原子核加上2标签的肽的离子峰(图12d)中观察到比例。
图13显示通过用于图12所示肽离子的PQD所得的MS/MS谱图。将该谱图匹配到具有两种标签(MMT-NN或MMT-CC)的肽序列ENVQLQK,一个在N-末端氨基处和一个在赖氨酸ε(epsilon)氨基处,并对应于图12所示的母离子的质量。
实施例3:
合成具有下述结构的两种标签:
哌嗪-增链的标签1:

哌嗪-增链的标签2:

制备哌嗪-增链的标签1和哌嗪-增链的标签2的合成路线分别参见图14和15。将纯化的标签用来标记与实施例1相同的合成的肽(VATVSLPR)。上述标签可在用虚线指示的键处片段化,得到m/z为126的报告物离子。图16显示使用哌嗪-增链的标签1标记的合成的肽的MS-模式谱图,其具有预期的在m/z为596.9处的双重-带电,而图17显示使用哌嗪-增链的标签2标记的相同的合成的肽MS-模式谱图,其具有预期的在m/z为603.9处的双重-带电。
参考文献:
1.Mann,M.和Wilm,M.(1994)通过肽序列标签在序列数据库中误差容忍地识别肽(Error-tolerantidentificationofpeptidesinsequencedatabasesbypeptidesequencetags).AnalChem,66,4390-4399.
2.Washburn,M.P.,Wolters,D.和Yates,J.R.(2001)通过多维蛋白质识别技术大规模分析酵母蛋白组(Large-scaleanalysisoftheyeastproteomebymultidimensionalproteinidentificationtechnology).NatBiotechnol,19,242-247.
3.Washburn,M.P.,Ulaszek,R.,Deciu,C.,Schieltz,D.M.和Yates,J.R.,第三版(2002)分析通过多维蛋白质识别技术形成的定量蛋白组数据(Analysisofquantitativeproteomicdatageneratedviamultidimensionalproteinidentificationtechnology).AnalChem,74,1650-1657.
4.Gaskell,S.(1997)电喷射:原理和实践(Electrospray:PrinciplesandPractice).《质谱学报(JournalofMassSpectrometry)》,32,677-688.
5.Gygi,S.P.,Rist,B.,Gerber,S.A.,Turecek,F.,Gelb,M.H.和Aebersold,R.(1999)使用同位素编码的亲和性标签定量分析复杂的蛋白质混合物(Quantitativeanalysisofcomplexproteinmixturesusingisotope-codedaffinitytags).NatBiotechnol,17,994-999.
6.Conrads,T.P.,Anderson,G.A.,Veenstra,T.D.,Pasa-Tolic,L.和Smith,R.D.(2000)将精确质量标签用于蛋白组-宽蛋白质识别(Utilityofaccuratemasstagsforproteome-wideproteinidentification).AnalChem,72,3349-3354.
7.Smith,R.D.,Anderson,G.A.,Lipton,M.S.,Pasa-Tolic,L.,Shen,Y.,Conrads,T.P.,Veenstra,T.D.和Udseth,H.R.(2002)用于定量和高通量蛋白组测量的精确质量标记策略(Anaccuratemasstagstrategyforquantitativeandhigh-throughputproteomemeasurements).《蛋白组学(Proteomics)》,2,513-523.
8.Hu,Q.,Noll,R.J.,Li,H.,Makarov,A.,Hardman,M.和GrahamCooks,R.(2005)轨道阱:新的质谱仪(TheOrbitrap:anewmassspectrometer).JMassSpectrom,40,430-443.
9.Makarov,A.(2000)静电轴向谐波轨道捕集:质量分析的高性能技术(Electrostaticaxiallyharmonicorbitaltrapping:ahigh-performancetechniqueofmassanalysis).AnalChem,72,1156-1162.
10.Marshall,A.G.,Hendrickson,C.L.和Jackson,G.S.(1998)傅立叶变换离子回旋加速共振质谱仪:初级读本(Fouriertransformioncyclotronresonancemassspectrometry:aprimer).MassSpectromRev,17,1-35.
11.Andrews,G.L.,Simons,B.L.,Young,J.B.,Hawkridge,A.M.和Muddiman,D.C.(2011)新的混合四极子飞行时间串联质谱仪(TripleTOF5600).的性能表征(Performancecharacteristicsofanewhybridquadrupoletime-of-flighttandemmassspectrometer(TripleTOF5600)).AnalChem,83,5442-5446.
12.McAlister,G.C.,Huttlin,E.L.,Haas,W.,Ting,L.,Jedrychowski,M.P.,Rogers,J.C.,Kuhn,K.,Pike,I.,Grothe,R.A.,Blethrow,J.D.等(2012)使用具有同量异位素的报告物离子同位素异数体增加TMT的多通道容量(IncreasingthemultiplexingcapacityofTMTsusingreporterionisotopologueswithisobaricmasses).AnalChem,84,7469-7478.
13.Werner,T.,Becher,I.,Sweetman,G.,Doce,C.,Savitski,M.M.和Bantscheff,M.(2012)高分别实现的TMT8-通道(High-resolutionenabledTMT8-plexing).AnalChem,84,7188-7194.
14.Hebert,A.S.,Merrill,A.E.,Bailey,D.J.,Still,A.J.,Westphall,M.S.,Strieter,E.R.,Pagliarini,D.J.和Coon,J.J.(2013)用于多通道蛋白组定量的中子编码的质量信号(Neutron-encodedmasssignaturesformultiplexedproteomequantification).NatMethods,10,332-334.
15.Gay,S.,Binz,P.A.,Hochstrasser,D.F.和Appel,R.D.(1999)使用肽的原子组成建模肽质量指纹数据(Modelingpeptidemassfingerprintingdatausingtheatomiccompositionofpeptides).《电泳(Electrophoresis),20,3527-3534.
16.Bairoch,A.和Apweiler,R.(2000)SWISS-PROT蛋白质序列数据及其补充的TrEMBL,2000年(TheSWISS-PROTproteinsequencedatabaseanditssupplementTrEMBLin2000).NucleicAcidsRes,28,45-48.
17.Boeckmann,B.,Bairoch,A.,Apweiler,R.,Blatter,M.C.,Estreicher,A.,Gasteiger,E.,Martin,M.J.,Michoud,K.,O'Donovan,C.,Phan,I.等(2003)SWISS-PROT蛋白质知识库及其补充的TrEMBL,2003年(TheSWISS-PROTproteinknowledgebaseanditssupplementTrEMBLin2003).NucleicAcidsRes,31,365-370.
18.Gasteiger,E.,Jung,E.和Bairoch,A.(2001)SWISS-PROT:通过蛋白质数据库连接生物分子知识(SWISS-PROT:connectingbiomolecularknowledgeviaaproteindatabase).CurrIssuesMolBiol,3,47-55.
19.Barker,W.C.,Garavelli,J.S.,Hou,Z.,Huang,H.,Ledley,R.S.,McGarvey,P.B.,Mewes,H.W.,Orcutt,B.C.,Pfeiffer,F.,Tsugita,A.等(2001)蛋白质信息资源:用于专家注释的蛋白质数据的社会资源(ProteinInformationResource:acommunityresourceforexpertannotationofproteindata).NucleicAcidsRes,29,29-32.
20.Barker,W.C.,Garavelli,J.S.,Huang,H.,McGarvey,P.B.,Orcutt,B.C.,Srinivasarao,G.Y.,Xiao,C.,Yeh,L.S.,Ledley,R.S.,Janda,J.F.等(2000)蛋白质信息资源(PIR)(Theproteininformationresource(PIR)).NucleicAcidsRes,28,41-44.
21.Smith,S.W.(1997)《科学家和工程师数字信号处理手册(TheScientistandEngineer'sGuidetoDigitalSignalProcessing)》,加利福尼亚技术出版社(CaliforniaTechnicalPublishing).
22.Wuhr,M.,Haas,W.,McAlister,G.C.,Peshkin,L.,Rad,R.,Kirschner,M.W.和Gygi,S.P.使用补足的报告物离子簇在MS2水平精确的多通道化的蛋白组学(AccuratemultiplexedproteomicsattheMS2levelusingthecomplementreporterioncluster).AnalChem,84,9214-9221.
23.Ting,L.,Rad,R.,Gygi,S.P.和Haas,W.在同量异位素的多通道化定量蛋白组学中的MS3消除比例偏离(MS3eliminatesratiodistortioninisobaricmultiplexedquantitativeproteomics).NatMethods,8,937-940.
24.Marshall,A.G.和Hendrickson,C.L.(2008)高分辨质谱仪(High-resolutionmassspectrometers).AnnuRevAnalChem(PaloAltoCalif),1,579-599.
25.Schaub,T.M.,Hendrickson,C.L.,Horning,S.,Quinn,J.P.,Senko,M.W.和Marshall,A.G.(2008)高性能质谱仪:在14.5特斯拉的傅立叶变换离子回旋加速共振(High-performancemassspectrometry:Fouriertransformioncyclotronresonanceat14.5Tesla).AnalChem,80,3985-3990.
26.Geist,A.,Beguelin,A.,Dongarra,J.,Jiang,W.,Manchek,R.和Sunderam,V.(1994)PVM:并行虚拟机,用于网络化并行计算的用户指南和教材(PVM:ParallelVirtualMachineAUsers'Guide和TutorialforNetworkedParallelComputing).MIT出版社.
27.Molloy,M.P.和Andrews,P.C.(2001)通过质谱法用磷酸肽衍生的信号来识别丝氨酸和苏氨酸磷酸化的肽(Phosphopeptidederivatizationsignaturestoidentifyserineandthreoninephosphorylatedpeptidesbymassspectrometry).AnalChem,73,5387-5394.
28.McLachlin,D.T.和Chait,B.T.(2003)用于磷酸肽富集的改善的基于β-消除的亲和性提纯策略(Improvedbeta-elimination-basedaffinitypurificationstrategyforenrichmentofphosphopeptides).AnalChem,75,6826-6836.
29.Arrigoni,G.,Resjo,S.,Levander,F.,Nilsson,R.,Degerman,E.,Quadroni,M.,Pinna,L.A.和James,P.(2006)化学衍生磷酸化含丝氨酸和磷酸化苏氨酸的肽来增加用于基于MALDI分析的和用于MS/MS分析选择性的灵敏度(ChemicalderivatizationofphosphoserineandphosphothreoninecontainingpeptidestoincreasesensitivityforMALDI-basedanalysisandforselectivityofMS/MSanalysis).《蛋白组学(Proteomics)》,6,757-766.
30.Klemm,C.,Schroder,S.,Gluckmann,M.,Beyermann,M.和Krause,E.(2004)用S-和N-亲核体衍生磷酸化肽来增加矩阵辅助的激光解吸/离子化质谱仪中离子化效率的(DerivatizationofphosphorylatedpeptideswithS-andN-nucleophilesforenhancedionizationefficiencyinmatrix-assistedlaserdesorption/ionizationmassspectrometry).《质谱快讯(RapidCommunMassSpectrom)》,18,2697-2705.
31.Ahn,Y.H.,Ji,E.S.,Lee,J.Y.,Cho,K.和Yoo,J.S.(2007)用胍基乙醇巯基标记的仿精氨酸来增加通过矩阵辅助的激光解吸/离子化飞行时间质谱仪的赖氨酸封端的磷酸肽的质量灵敏度(Arginine-mimiclabelingwithguanidinoethanethioltoincreasemasssensitivityoflysine-terminatedphosphopeptidesbymatrix-assistedlaserdesorption/ionizationtime-of-flightmassspectrometry).《质谱快讯(RapidCommunMassSpectrom)》,21,2204-2210.
32.Nika,H.,Lee,J.,Willis,I.M.,Angeletti,R.H.和Hawke,D.H.(2012)使用用于固相β消除/麦克尔加成的反相载体通过质谱仪来表征磷酸肽(Phosphopeptidecharacterizationbymassspectrometryusingreversed-phasesupportsforsolid-phasebeta-elimination/Michaeladdition).JBiomolTech,23,51-68.
33.Sechi,S.和Chait,B.T.(1998)通过烷基化修饰半胱氨酸残基:肽成像和蛋白质识别中的工具(Modificationofcysteineresiduesbyalkylation.Atoolinpeptidemappingandproteinidentification).AnalChem,70,5150-5158.
34.Goodlett,D.R.,Bruce,J.E.,Anderson,G.A.,Rist,B.,Pasa-Tolic,L.,Fiehn,O.,Smith,R.D.和Aebersold,R.(2000)使用单一精确的质量的含半胱氨酸的肽和受限的数据库搜索来识别蛋白质(Proteinidentificationwithasingleaccuratemassofacysteine-containingpeptideandconstraineddatabasesearching).AnalChem,72,1112-1118.
35.Goodlett,D.R.,Keller,A.,Watts,J.D.,Newitt,R.,Yi,E.C.,Purvine,S.,Eng,J.K.,vonHaller,P.,Aebersold,R.和Kolker,E.(2001)差异化肽的稳定的同位素标记用于定量和全程序列衍生(Differentialstableisotopelabelingofpeptidesforquantitationanddenovosequencederivation).《质谱快讯(RapidCommunMassSpectrom)》,15,1214-1221.
36.Sechi,S.(2002)识别和同时确定通过凝胶电泳分离的蛋白质的相对数量的方法(Amethodtoidentifyandsimultaneouslydeterminetherelativequantitiesofproteinsisolatedbygelelectrophoresis).《质谱快讯(RapidCommunMassSpectrom)》,16,1416-1424.
37.Adamczyk,M.,Gebler,J.C.和Wu,J.(1999)通过同位素标记和离子阱质谱仪识别半胱氨酸残基的简化方法(Asimplemethodtoidentifycysteineresiduesbyisotopiclabelingandiontrapmassspectrometry).《质谱快讯(RapidCommunMassSpectrom)》,13,1813-1817.

质量标记物.pdf_第1页
第1页 / 共123页
质量标记物.pdf_第2页
第2页 / 共123页
质量标记物.pdf_第3页
第3页 / 共123页
点击查看更多>>
资源描述

《质量标记物.pdf》由会员分享,可在线阅读,更多相关《质量标记物.pdf(123页珍藏版)》请在专利查询网上搜索。

本发明提供两种或多种质量标记物的集合,其中所述集合中的各质量标记物与所述集合中每个其它的标记物的整体质量相同,且所述集合中的各质量标记物的精确质量与所述集合中每个其它质量标记物的精确质量不同,从而所述集合中的所有质量标记物可通过质谱相互区分。。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 物理 > 测量;测试


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1