技术领域
本发明涉及预后方法和个性化疗法。
发明背景
肺癌是世界上最常见的癌症诊断,2007年有150万例新病例(Salomon 等,CritRevOncolHematol.,19:183-232,1995,SEER-数据库05.2010)。 高发病率和死亡率使得其成为癌症相关死亡的主要原因,每年有超过 975,000例死亡且5年存活率为15%(Salomon等人,同上)。肺癌可分类 为小细胞肺癌或非小细胞肺癌(NSCLC)。NSCLC占到约80%的病例。 NSCLC能进一步细分成数个组织学类型,最常见的是腺癌(40%)和鳞状 细胞癌(25%)。
当前的NSCLC治疗主要基于肿瘤形态学和以肿瘤淋巴结转移(TNM) 为基础的分期系统,所述系统将肿瘤分类成对应于肿瘤进展程度的分级类 别(IA、IB、IIA、IIB、IIIA、IIIB和IV期)。存在许多分期系统(例如 临床相对病理分期,以及多个版本的分期指南,如由国际肺癌研究会 (IASLC)发布的那些)(Goldstraw等,J.Thorac.Oncol.2,706-714,2007)。 例如,根据临床分期和IASLC第6版TNM分期建议,各期的频率为23%I 期、19%II期、37%III期和21%IV期(Goldstraw等人,同上)。相对比 例可能根据所述指南以及使用临床或是病理分期而显著改变。
手术是早期NSCLC(I期和II期)的标准治疗,然后是辅助治疗如放 射治疗、化疗(用于II期及以后)以及用于晚期NSCLC的贝伐单抗和表 皮生长因子受体(EGFR)酪氨酸激酶抑制剂(TKI)(Kutikova等,Lung Cancer;50(2):143-154,2005)。美国和欧洲的NSCLC治疗临床指南支持 这些治疗选择(Mendelssohn等,2000;NCCN-指南NSCLCV1,2010)。
根据目前用于早期肺癌的基于TNM的分期系统,I期NSCLC患者在 手术后5年内复发的概率为35%(SEER-数据库,2008)。目前的治疗指 南不建议对这些患者辅以化疗。而基于TNM的II期患者中有30%在没有 任何辅助化疗情况下不经历复发(SEER-数据库),这意味着根据当前治疗 指南(即,ESMO(D’Addario等,AnnalsofOncology.2009;20(增刊 4):iv68-iv70,2009)、NCCNV1-2010)这些患者经历过度治疗。与此类似 的是有报道指出60%的早期NSCLC患者在手术后无复发(Arriagada等, NEJM,350:351-360,2004)。根据当前临床数据,早期NSCLC的辅助化 疗提供证据显示辅助化疗的平均效益为4%(NSCLC荟萃分析协作组),5 年内从60%提高到64%。
根据现有缺陷,对NSCLC患者进行预后和/或预测基因组标签的需求是 具有医学合理性的。
发明概述
本发明(部分)涉及用本文所述一种或多种生物标志物确定个体内早 期肺癌预后的方法。这些发现可用于帮助为早期肺癌患者确定合适的治疗, 例如鉴定那些会通过接受辅助治疗而受益的患者。
一方面,本发明包括对患有非小细胞肺癌(NSCLC)的对象进行预后 或分类的方法,所述方法包括在手术切除后从患有NSCLC的对象获得测试 样品;测定表1、表2和/或表3中所鉴定的至少一种或多种生物标志物, 或表1、表2和/或表3所鉴定生物标志物的任何组合在所述测试样品中的 表达水平;分析该表达水平以产生风险评分,其中风险评分可用于提供预 后或分类对象。
另一方面,本发明包括对患有非小细胞肺癌(NSCLC)的对象进行预 后或分类的方法,所述方法包含:在手术切除后从患有NSCLC的对象获得 测试样品;测定表1、表2和表3中的至少一种生物标志物在所述测试样品 中的表达水平;分析该表达水平以产生风险评分,其中风险评分可用于提 供预后或分类对象。在一个实施方式中,表1、表2和表3中所鉴定的至少 一种生物标志物包括CBX7、STX1A和TPX2。在另一个实施方式中,表1、 表2和表3中所鉴定的至少一种生物标志物包括CBX7、TMPRSS2、STX1A、 KLK6、TPX2和UCK。在另一个实施方式中,表1、表2和表3中所鉴定 的至少一种生物标志物包括CBX7、TMPRSS2、GPR116、STX1A、KLK6、 SLC16A3、TPX2、UCK2、PHKA1。在另一个实施方式中,表1、表2和 表3中所鉴定的至少一种生物标志物包括CBX7、TMPRSS2、GPR116、 KCNJ15、STX1A、KLK6、SLC16A3、PYGL、TPX2、UCK2、PHKA1或 EIF4A3。在另一个实施方式中,表1、表2和表3所鉴定中的至少一种生 物标志物包括CBX7、TMPRSS2、GPR116、KCNJ15、PTPN13、STX1A、 KLK6、SLC16A3、PYGL、LDHA、TPX2、UCK2、PHKA1、EIF4A3或 TK1。在另一个实施方式中,表1、表2和表3中所鉴定的至少一种生物标 志物包括CBX7、TMPRSS2、GPR116、KCNJ15、PTPN13、CTSH、STX1A、 KLK6、SLC16A3、PYGL、LDHA、ITGA5、TPX2、UCK2、PHKA1、EIF4A3、 TK1或CCNA2。
在一个实施方式中,通过将对象对肺癌、距离转移或局部复发所致死 亡的时间特异性概率作附图,本发明的风险评分可用于预后。
在另一个实施方式中,风险评分可用于将对象分入将受益于接受辅助 化疗的高风险组或不会受益于接受辅助化疗的低风险组。
另一方面,本发明包括预测患有非小细胞肺癌(NSCLC)的对象在手 术切除后预后的方法,所述方法包含从肿瘤样品确定mRNA的表达谱,所 述样品来自新鲜冷冻(FF)或福尔马林固定石蜡包埋(FFPE)材料。所述 谱包含表1、表2和/或表3所列的一种或多种生物标志物,其中表2和/或 表3所列一种或多种生物标志物的表达相较对照的增加以及表1所列一种 或多种生物标志物的表达相较对照的减少可用于预测对象是否处于存活差 的高风险组或存活良好的低风险组。在本发明的方法中,高风险组的对象 被选定用于辅助化疗,而低风险组的对象不被选择用于辅助化疗和相应的 随后治疗。
在另一个实施方式中,本发明包括为NSCLC对象选择治疗方案的方 法,所述方法包括从已接受切除的患有NSCLC的对象获得测试样品;测定 表2所鉴定的至少二种或更多生物标志物在所述测试样品中的表达水平以 产生各基因的表达值;分析所述表达值以产生风险评分,其中风险评分可 用于分类是否选择该对象接受血管新生抑制剂如阿瓦斯丁。
在本发明的方法中,本发明包括测定表1、表2和/或表3中所鉴定的 至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8 种、至少9种、至少10种、至少11种、至少12种、至少13种、至少14 种或至少15种生物标志物或其任何组合的表达。例如,各从表1、表2和 表3选择至少任意5种生物标志物的表达(此实施方式中的标签会包括至 少15种生物标志物)。
在一个实施方式中,NSCLC是I期NSCLC、II期NSCLC或其组合。 NSCLC能在由鳞状细胞癌和/或腺癌组成的组中被鉴定。
在一个实施方式中,所述对象是人。在另一个实施方式中,所述测试 样品能是新鲜、冷冻、FFPE细胞。在另一个实施方式中,所述表达水平用 定量PCR或阵列测定。
在另一个实施方式中,通过统计学分析进行分析表达以产生风险评分, 所述统计学分析如Cox回归或参数存活预测因子。
另一方面,本发明包括选择性治疗有NSCLC癌症对象的方法,所述方 法包括在手术切除后从患有NSCLC的对象获得测试样品,测定表1、表2 和/或表3中所鉴定的至少一种或多种生物标志物,表1、表2和/或表3所 鉴定生物标志物的任何组合在所述测试样品中的表达水平以产生风险评 分;根据风险评分将对象分入高风险组或低风险组;对分类于高风险组的 对象给予辅助治疗或对分类于低风险组的对象不给予辅助治疗。
另一方面,本发明包括一种含多种试剂和使用说明书的试剂盒,所述 试剂用于测量表1、表2和/或表3所鉴定的一种或多种生物标志物的表达。 另一方面,本发明包括用于预测肺癌对象是否会受益于辅助治疗的试剂盒, 所述试剂盒包括多种用于测量表1、表2和/或表3所鉴定的一种或多种生 物标志物表达的试剂;以及包括分析所述表达和产生风险评分以预测患者 是否会受益于辅助治疗的工具。测量表达的试剂能包括与所鉴定生物标志 物的mRNA互补的多核苷酸阵列。测量表达的试剂能包括多种PCR探针和 /或qRT-PCR引物。所述试剂盒能包括测量表1、表2和表3所鉴定的至少 一种生物标志物如CBX7、STX1A或TPX2的试剂。
另一方面,本发明包括含一种或多种多核苷酸探针的阵列,所述探针 互补于表1、表2和/或表3所示至少两种生物标志物的表达产物并可与之 杂交。
另一方面,本发明包括一种含多种分离的核酸序列的组合物,其中各 分离的核酸序列可与表1所示生物标志物的RNA产物杂交,例如生物标志 物CBX7、STX1A和TPX2,其中所述组合物用于测量所述三种基因的RNA 表达水平。
另一方面,本发明包括一种预测NSCLC对象的预后或对其进行分类的 计算机产品,所述产品包括用于接收对应于NSCLC对象样品中一种或多种 生物标志物表达水平的数据的手段,其中所述一种或多种生物标志物鉴定 于表1、表2和/或表3,用于产生各基因表达值的手段;以及基于向数据库 输入表达值来产生风险评分的手段,所述数据库中包含与预后相关的对照 表达谱,其中风险评分预测所述对象的存活预后或者将其分入高风险组或 低风险组。
另一方面,本发明包括与上述任意方法一起使用的计算机产品。
“生物标志物”是可用作对象中生物学状态指示物的分子。关于本主 题,本文公开的生物标志物可以是显示表达变化且其存在可用于预后或预 测对象是否会受益于接受特定治疗的分子。感兴趣的生物标志物可通过检 测该生物标志物表达变化来确定。表达变化描述DNA基因序列信息向转录 RNA(初始未剪接的RNA转录本或成熟mRNA)或编码蛋白产物的转变。 本文公开的生物标志物包括表1、表2和表3所列生物标志物中的任何一种 或其任意组合,且可以是转录RNA或编码蛋白产物。
附附图简述
附图1描述模块1、2和3的标准化评分的成对散点附图,证实它们传 递关于肿瘤的不同信息。
附图2A-D描述Kaplan-Meier总体存活分析曲线,显示就手术后长至5 年的患者而言,3种标签(模块1、2和3)分别或组合应用时的预后性能。
附图3A-F描述Kaplan-Meier总体存活分析曲线,显示就手术后长至5 年的患者而言,模块1根据阶段、组织学、年龄分层的预后性能。
附图4A-F描述Kaplan-Meier存活分析曲线,显示就手术后长至5年 的患者而言,由模块2根据阶段、组织学、年龄分层的预后性能。
附图5A-F描述Kaplan-Meier存活分析曲线,显示就手术后长至5年 的患者而言,由模块3根据阶段、组织学、年龄分层的预后性能。
附图6A-F描述Kaplan-Meier存活分析曲线,显示就手术后长至5年 的患者而言,组合评分根据阶段、组织学、年龄分层的预后性能。
附图7A-F描述Kaplan-Meier存活分析曲线,显示构建为38-基因列表 之亚组的多个示例性标签的预后性能。
附图8A描述肺癌死亡百分率(等同于100%负存活)为所主张标签的 风险评分的函数,和显示在1、2、3、4和5年随访期的所述预后。附图8B 描述肺癌死亡百分率(等同于100%负存活)为所主张标签的风险评分的函 数,和显示5年死亡率为风险评分的函数,根据肿瘤1期和2期分层。
附图9描述Kaplan-Meier存活分析曲线,显示来自安德森癌症中心(M. D.AndersonCancerCenter)的可公开获得的数据集中的存活性能,所述数 据集获自FFPE材料。
附图10A-B描述成对散点附图,比较了FF/Affymetrix相对FFPE/qNPA, 以及FF/Affymetrix相对FFPE/nanoString。
发明详述
本发明(部分)基于可用于患早期肺癌个体预后或分类的方法。本发 明还包括鉴定疾病复发风险高并和可向其推荐辅助治疗的患者以及复发风 险低且可能不会受益于辅助治疗的患者。在一个示例中,本文所述预后和 预测方法是基于多种生物标志物在肺癌测试样品中的差异性表达。本发明 的生物标志物可包括38个基因(CBX7、TMPRSS2、GPR116、KCNJ15、 PTPN13、CTSH、PPFIBP2、CD302、SFTPB、HSD17B6、DLC1、ADRB2、 PARM1、KLRB1、MS4A1、STX1A、KLK6、SLC16A3、PYGL、LDHA、 ITGA5、VEGFC、EEF1A2、TPX2、UCK2、PHKA1、EIF4A3、TK1、CCNA2、 GGH、CCNB1、MELK、HMMR、EIF2S1、TEAD4、HMGA1、RIMS2、 H2AFZ)或其组合,所述生物标志物可根据包括生物学功能在内的标准拆 分成3个模块(表1、2和3)。表1(本文中也称为模块1)包括参与肿瘤 抑制的基因,表2(本文中也称为模块2)包括参与血管新生的基因,和表 3(本文中也称为模块3)包括参与增殖的基因。
据发现,与对照(例如这些基因在早期肺癌(I和II期)患者中的平 均表达)相比,一些生物标志物在早期肺癌中过表达,如参与血管新生或 增殖的标志物(分别为表2和表3),而其他参与肿瘤抑制的生物标志物表 达不足(表1)。
生物标志物
本发明的生物标志物包括表1、表2和/或表3所列的一种或多种生物 标志物,或其基因产物。本发明基于以下发现:表1、表2和/或表3所列 的生物标志物差异性表达。通过分析表1、表2和/或表3中所鉴定一种或 多种生物标志物的表达谱水平,有可能确定早期肺癌个体的预后。
在一个示例中,发明方法包括测量表1中的一种或多种生物标志物。 例如,本发明方法测量来自表1的至少1种、至少2种、至少3种、至少4 种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、 至少11种、至少12种、至少13种、至少14种或至少15种生物标志物。 在一个示例中,测量来自表1的一个基因CBX7的表达水平。在另一个示 例中,测量来自表1的两个生物标志物CBX7和TMPRSS2的表达水平。 在另一个示例中,测量来自表1的三个生物标志物CBX7、TMPRSS2和 GPR116的表达水平。在另一个示例中,测量来自表1的四个生物标志物 CBX7、TMPRSS2、GPR116和KCNJ15的表达水平。在另一个示例中,测 量来自表1的五个生物标志物CBX7、TMPRSS2、GPR116、KCNJ15和 PTPN13的表达水平。
表1
在另一个示例中,发明方法包括测量表2的一种或多种生物标志物。 例如,本发明方法测量来自表2的至少1种、至少2种、至少3种、至少4 种、至少5种、至少6种、至少7种或至少8种生物标志物的表达。在一 个示例中,测量来自表2的一个基因STX1A的表达水平。在一个示例中, 测量来自表2的两个生物标志物STX1A和KLK6的表达水平。在另一个示 例中,测量来自表2的三个生物标志物STX1A、KLK6和SLC16A3的表达 水平。在另一个示例中,测量来自表2的四个生物标志物STX1A、KLK6、 SLC16A3和PYGL的表达水平。在另一个示例中,测量来自表2的五个生 物标志物STX1A、KLK6、SLC16A3、PYGL和LDHA的表达水平。
表2
在另一个示例中,发明方法包括测量表3的一种或多种生物标志物。 例如,发明方法测量来自表3的至少1种、至少2种、至少3种、至少4 种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、 至少11种、至少12种、至少13种、至少14种或至少15种生物标志物。 在一个示例中,测量来自表3的一个基因TPX2的表达水平。在另一个示 例中,测量来自表3的两个生物标志物TPX2和UCK2的表达水平。在另 一个示例中,测量来自表3的三个生物标志物TPX2、UCK2和PHKA1的 表达水平。在另一个示例中,测量来自表3的四个生物标志物TPX2、UCK2、 PHKA1和EIF4A3的表达水平。在另一个示例中,测量来自表3的五个生 物标志物TPX2、UCK2、PHKA1、EIF4A3和TK1的表达水平。
表3
本发明的生物标志物还可包括表1、表2和表3所鉴定的任意生物标 志物组合,所述生物标志物的表达或基因产物水平用作早期肺癌个体预后 的预测标志物或生物标志物。在一个示例中,测量选自各表即表1、表2 和表3的一个基因表达水平,所述基因如CBX7、STX1A和TPX2。在另一 个示例中,测量选自各表即表1、表2和表3的两个生物标志物表达水平, 所述生物标志物如来自表1的CBX7和TMPRSS2,来自表2的STX1A和 KLK6,来自表3的TPX2和UCK2。表1、表2和表3中生物标志物的多 种组合示例参见下表4。表4所示组合不意在构成限制且可形成表1-3所示 生物标志物的任意组合。
表4
在另一个示例中,各从表1、表2和表3选择至少任意3、4、5、6、7、 8、9、10个基因。例如,在一个实施方式中,选择至少15种生物标志物, 其中从表1选择任意5种生物标志物(如CBX7、TMPRSS2、GPR116、 KCNJ15和PTPN13,或CBX7、TMPRSS2、CTSH、PPFIBP2和CD302; 或SFTPB、HSD17B6、DLC1、ADRB2和PARM1),从表2选择任意5 种生物标志物(如STX1A、KLK6、SLC16A3、PYGL和LDHA,或SLC16A3、 PYGL、ITGA5、VEGFC和EEF1A2,或STX1A、KLK6、SLC16A3、PYGL 和LDHA)和从表3选择任意5种生物标志物(如TPX2、UCK2、PHKA1、 EIF4A3和TK1,或CCNA2、GGH、CCNB1、MELK和HMMR,或EIF2S1、 TEAD4、HMGA1、RIMS2和H2AFZ)。
在另一个实施方式中,本发明的生物标志物包括任意一个下列基因或 其任意组合:CBX7、TMPRSS2、GPR116、KCNJ15、PTPN13、CTSH、 PPFIBP2、CD302、SFTPB、HSD17B6、DLC1、ADRB2、PARM1、KLRB1、 MS4A1、STX1A、KLK6、SLC16A3、PYGL、LDHA、ITGA5、VEGFC、 EEF1A2、TPX2、UCK2、PHKA1、EIF4A3、TK1、CCNA2、GGH、CCNB1、 MELK、HMMR、EIF2S1、TEAD4、HMGA1、RIMS2、H2AFZ。在另一个 实施方式中,本发明的生物标志物包括至少15、20、25、30、35、36、37 或38个下列基因:CBX7、TMPRSS2、GPR116、KCNJ15、PTPN13、CTSH、 PPFIBP2、CD302、SFTPB、HSD17B6、DLC1、ADRB2、PARM1、KLRB1、 MS4A1、STX1A、KLK6、SLC16A3、PYGL、LDHA、ITGA5、VEGFC、 EEF1A2、TPX2、UCK2、PHKA1、EIF4A3、TK1、CCNA2、GGH、CCNB1、 MELK、HMMR、EIF2S1、TEAD4、HMGA1、RIMS2、H2AFZ。在一个特 定实施方式中,选择下列37种生物标志物:CBX7、TMPRSS2、GPR116、 KCNJ15、PTPN13、CTSH、PPFIBP2、CD302、SFTPB、HSD17B6、DLC1、 ADRB2、PARM1、KLRB1、MS4A1、STX1A、KLK6、SLC16A3、PYGL、 LDHA、ITGA5、VEGFC、TPX2、UCK2、PHKA1、EIF4A3、TK1、CCNA2、 GGH、CCNB1、MELK、HMMR、EIF2S1、TEAD4、HMGA1、RIMS2、 H2AFZ。
在一个示例中,所述表达谱可以是表示表1、表2和/或表3所列一种 或多种生物标志物mRNA水平的一组值。在另一个示例中,所述表达谱可 包括表示表1、表2和/或表3所列生物标志物编码的一种或多种蛋白或多 肽的一组值。
样品制备
取自已接受手术切除的早期肺癌个体的任何合适测试样品均可用于测 定本发明的多种生物标志物的表达。早期肺癌的类型和分类可变化。肺癌 可以是I期和/或II期。所述测试样品可以是非小细胞肺癌(NSCLC),其 包括鳞状细胞癌、腺癌、大细胞癌以及与亚组无关的所有组织分型。
一般,细胞试样或组织样品会通过活检或手术切除从癌症对象获得。 手术切除可以是有疗效的或无疗效的/RO。细胞、组织或液体的样品可通过 细针抽吸活检移出。为此,将附于注射器的细针经皮肤插入并进入目的器 官或组织。所述针通常由超声或计算机断层扫描(CT)成像引导至目的区 域。一旦针插入组织,用注射器产生真空,从而细胞或液体可经针吸入并 收集于注射器中。细胞或组织的样品还可通过切开或空芯针活检移出。为 此,从目的区域移出一段锥形、圆柱形或少量组织。一般用CT成像、超声 或内窥镜引导此类活检。更特定地,完整癌病变可通过切除活检或手术切 除来移出。本发明中,所述测试样品通常是作为手术切除一部分移出的细 胞样品。
测试样品,例如组织,也可保存于例如RNAlater(安碧公司(Ambion); 得克萨斯州奥斯丁)或速冻并于-80℃保存,供以后使用。所述活检组织样 品还可用固定剂如甲醛、多聚甲醛或乙酸/乙醇固定。固定的组织样品可包 埋于蜡(石蜡)或塑料树脂。包埋的组织样品(或冷冻组织样品)可切成 薄切片。还可从固定或蜡包埋组织样品中提取RNA或蛋白。
癌症对象一般是哺乳动物对象,如灵长类动物。在一个示例性实施方 式中,所述对象是人。
一旦细胞样品或组织样品从癌症对象中移出,可使用本领域熟知的下 述技术对其处理以分离RNA或蛋白。
在一个示例中,可通过多种方法从组织或细胞样品中提取RNA,所述 方法例如硫氰酸胍裂解然后CsCl离心(Chirgwin等,Biochemistry 18:5294-5299,1979)。可按照从单细胞制备cDNA库的方法中所述获得来 自单细胞的RNA(参见例如Dulac,Curr.Top.Dev.Biol.36:245,1998;Jena 等,J.Immunol.Methods190:199,1996)。可就特定物种进一步富集所述 RNA样品。在一个实施方式中,例如,poly(A)+RNA可分离自RNA样品。 特别地,多聚T寡核苷酸可固定于固体支持物上以用作mRNA的亲和配体。 用于此目的的试剂盒市售可得,例如MessageMaker试剂盒(纽约格兰德岛 的美国生命技术公司(LifeTechnologies))。在一个实施方式中,可就如 表1-3所详述的感兴趣序列富集RNA群。例如,可通过引物特异性cDNA 合成或多轮基于cDNA合成和模板导向体外转录的线性扩增来完成富集 (参见例如Wang等,Proc.Natl.Acad.Sci.USA86:9717,1989)。
生物标志物表达的检测
在一个示例中,所述方法包括测定表1、表2和/或表3所列一种或多 种生物标志物或其基因产物在测试癌症患者的肿瘤样品中的表达。表1、表 2和/或表3所列各生物标志物的基因序列可用本领域已知方法检测,例如 可用于特异性检测所述基因或其基因产物的试剂。
示例性检测剂是核酸探针和抗体,所述核酸探针可与对应于本文所公 开基因的核酸杂交,所述抗体可结合这些基因的编码产物。表1、表2和/ 或表3所列生物标志物也意在包括,包含等位基因变体和其他家族成员在 内的天然产生的序列。本发明的生物标志物还包括,由密码子简并性产生 的与那些所列序列互补的序列,以及还包括有足够同源性的序列,和可在 严谨条件下与表1、表2和/或表3所列生物标志物杂交的序列。
在一个实施方式中,所述方法包括:提供含与表1、表2和/或表3所 列核酸序列的部分编码序列互补的核苷酸序列的核酸探针,所述核苷酸序 列为编码序列中的例如至少10、15、25或40个核苷酸,和多至全部或几 乎全部编码序列;从有癌细胞的哺乳动物获得组织样品;在严谨条件下将 核酸探针接触获自NSCLC患者活检的RNA(如在Northern印迹或原位杂 交试验中);和测定所述探针与RNA杂交的量。
杂交条件为本领域技术人员已知且可见于CurrentProt℃olsin MolecularBiology(《新编分子生物学实验指南》),纽约,约翰威利父子 出版公司(JohnWileyandSons)(1989),6.3.1-6.3.6。高度严谨杂交条件的 优选、非限制性示例是在约45摄氏度于6X氯化钠/柠檬酸钠(SSC)中杂 交,然后在50-65摄氏度于0.2XSSC,0.1%SDS中洗涤一次或多次。“足 够同源”指,某一生物标志物的氨基酸或核苷酸序列,其含有足够或最少 数目的与第二氨基酸或核苷酸序列相同或等同(如有相似侧链的氨基酸残 基)的氨基酸残基或核苷酸,从而第一和第二氨基酸或核苷酸序列具有共 同的结构域或基序和/或共同的功能活性。例如,有共同结构域的氨基酸或 核苷酸序列在结构域的氨基酸序列上有至少约50%同源性、至少约60%同 源性、至少约70%同源性、至少约80%同源性、和至少约90-95%同源性, 在本文中定义为足够同源。此外,有至少约50%同源性、至少约60-70%同 源性、至少约70-80%同源性、至少约80-90%同源性、和至少约90-95%同 源性且有共同功能活性的氨基酸或核苷酸序列在本文中定义为足够同源。
2种序列间的序列比较和百分比同源性测定可用数学算法完成。用于 序列比较的优选、非限制性数学算法示例是Karlin和Altschul(1990)Proc. Natl.Acad.Sci.USA87:2264-68的算法,在Karlin和Altschul(1993)Proc. Natl.Acad.Sci.USA90:5873-77被改良。将这种算法整合入Altschul等人, (1990)J.MoI.Biol.215:403-10的NBLAST和XBLAST程序(2.0版)。 BLAST核苷酸搜索可用NBLAST程序进行,评分=100,字长=12,以获得 与本发明TRL核酸分子同源的核苷酸序列。BLAST蛋白搜索可用XBLAST 程序进行,评分=50,字长=3,以获得与表1、表2和/或表3所列生物标志 物编码的蛋白序列同源的氨基酸序列。为了获得用于比较目的的缺口比对, 可使用如Altschul等,(1997)NucleicAcidsResearch25(17):3389-3402所述 的间隙BLAST(GappedBLAST)。使用BLAST和间隙BLAST程序时, 能使用各程序(如XBLAST和NBLAST)的默认参数。参见 http://www.ncbi.nlm.nih.gov。用于序列比较的另一优选、非限制性数学算法 示例是Myers和Miller,CABIOS(1989)的ALIGN算法。使用ALIGN程序 以比较氨基酸序列时,可使用PAMl20权重残基表,缺口长度罚分为12 且缺口罚分为4。
在RNA富集和/或扩增期间或之后,可标记核酸。例如,可在偶联可 检测标记的dNTP存在下完成逆转录,如荧光标记的dNTP。在另一个实施 方式中,cDNA或RNA探针能在没有可检测标记的情况下合成且能随后进 行标记,例如通过掺入生物素化dNTP或rNTP,或一些类似方式(如将生 物素化的补骨脂素衍生物与RNA光交联),然后加入经标记的链霉亲和素 (如藻红蛋白偶联链霉亲和素)或等价物。
感兴趣的荧光部分或标记包括香豆素和其衍生物(如7-氨基-4-甲基香 豆素、氨基香豆素);氟硼二吡咯(bodipy)类染料如BodipyFL和层叠蓝; 荧光素和其衍生物(如异硫氰酸荧光素、俄勒冈绿);若丹明染料(如德 克萨斯红、四甲基若丹明);曙红和赤藓红;花青染料(如Cy2、Cy3、Cy3.5、 Cy5、Cy5.5、Cy7);FluorX,镧系离子大环螯合物(如量子染料.TM.); 荧光能量转移染料如噻唑橙-乙啡啶异二聚体、TOTAB、丹酰等。还可使用 单独荧光化合物,所述化合物具有可用于连接能在本发明设备或试验中被 理想检测出的元素的官能团,或者其可经修饰从而整合进所述官能团(参 见例如Kricka,1992,NonisotopicDNAProbeTechniques(《非同位素DNA 探针技术》),加利福尼亚州圣地亚哥,学术出版社(AcademicPress))。 化学发光标记包括萤光素和2,3-二氢酞嗪二酮,例如发光胺。
生物标志物基因产物表达的检测
检测由表1、表2和/或表3所列一种或多种生物标志物编码的蛋白产 物的存在可用本领域已知的任何合适方法完成。例如,可使用感兴趣试剂 能检测感兴趣的特定蛋白,如使用抗体。可特异性结合可用于本发明的多 肽的多克隆和/或单克隆抗体的产生方法是本领域技术人员已知的,可见于 例如Dymecki等(J.Biol.Chem.267:4815,1992);Boersma和VanLeeuwen(J. Neurosci.Methods51:317,1994);Green等(Cell28:477,1982);和Arnheiter 等(Nature294:278,1981)。在一个实施方式中,可使用免疫测定来定量 细胞样品中的蛋白水平。本发明不限于特定检测方法程序,且由此,意在 包括均一和非均一程序。根据本发明可采用的示例性免疫测定包括荧光偏 振免疫分析法(FPIA)5、荧光免疫分析法(FIA)、酶免疫分析法(EIA)、 抑制免疫散射浊度分析法(NIA)、酶联免疫吸附试验(ELISA)和放射免 疫分析(RIA)。可在主体抗体上附着指示部分或标记基团并对其进行选择 以满足本方法各种不同用途的需求,所述需求通常由检测设备的可用性和 相容免疫分析程序决定的。用于完成上述各种不同免疫分析方法的一般技 术是本领域普通技术人员已知的。或者,也可以使用其他方法如Western 印迹分析,其包括在聚丙烯酰胺凝胶上电泳分离蛋白,和在染色分离的蛋 白后,通过评价其光密度来定量各蛋白的相对量。或者,可使用其他方法, 比如点印迹法、FACS或免疫组化。
通过使用如福尔马林、戊二醛、甲醇等这样的试剂处理来固定组织样 品。然后,将所述样品与对标志物多肽具有结合特异性的抗体(如单克隆 抗体)孵育。此抗体可与标记偶联以进行后续的结合检测。样品孵育时间 足以形成免疫复合体。随后凭借与该抗体偶联的标记来检测抗体的结合。 抗体未标记时,可使用第二标记抗体,例如所述第二标记抗体特异于抗标 志物多肽抗体的同种型。可使用的标记示例包括放射性核素、荧光剂、化 学发光剂、酶等。
使用酶时,可向样品添加该酶的底物以提供彩色的或荧光的产物。用 于偶联物的合适酶示例包括辣根过氧化物酶、碱性磷酸酶、苹果酸脱氢酶 等。这类抗体-酶偶联物市售不可得时,易通过本领域技术人员已知技术生 成。
在另一个实施方式中,本发明考虑使用针对本发明标志物多肽产生的 抗体组。
mRNA检测
本发明的一个重要方面是测量表1、表2和/或表3所鉴定一种或多种 生物标志物在取自手术切除后早期肺癌对象的肺癌肿瘤活检中的表达水 平。该表达水平可经过分析并用于产生风险评分。
在一个示例中,逆转录聚合酶链反应(RT-PCR)可用于基因表达谱分 析从而比较不同样品群中的mRNA水平。该方法包括用本领域已知的任何 技术分离mRNA,例如根据生产商说明书使用来自商业生产商如凯杰公司 (Qiagen)的纯化试剂盒、缓冲液组和蛋白酶,或完整DNA和RNA纯化 试剂盒(华盛顿麦迪逊,EPICENTRE(R))。逆转录步骤通常根据环境和表 达谱分析的目标用特异引物、随机六聚体或寡dT引物引发,之后所得cDNA 可用作后续PCR反应的模板。然后,TaqMan(R)RT-PCR可用例如市售可 得设备进行。
RT-PCR技术的最近变化是实时定量PCR,其通过双重标记荧光生成 的探针(如TaqMan(R)探针)来测量PCR产物累积。实时PCR与定量竞争 PCR和定量比较PCR都相容,前者中各靶序列的内部竞争物用于标准化, 后者利用样品中所含的标准化基因或用于RT-PCR的管家基因。更多详述 参见例如Held等,GenomeResearch6:986-994(1996)。
在另一个示例中,使用包括对应表1、表2和/或表3所鉴定一种或多 种生物标志物的一个或多个探针的微阵列。上述方法在阵列表面生成标记 靶核酸的杂交模式。所得的标记核酸杂交模式可通过多种方法可视化或检 测,特定检测方式根据靶核酸的特定标记进行选择。代表性检测方式包括 闪烁计数、放射自显影、荧光测量、热量测定、光发射测量、光散射等。
在一个示例中,检测方法采用市售可得的阵列扫描仪(加利福尼亚州 圣克拉拉,昂飞(Affymetrix)),例如417点样仪、418阵列扫描仪或安捷 伦(Agilent)基因阵列扫描仪。此扫描仪由系统带有界面和易用软件工具的 计算机。输出可通过多种软件应用来直接导入或直接读取。
如本文所用,用于比较的对照可由本领域技术人员确定。一方面,通 过选择某一值作为截止值来确定对照。例如,所述值能可以是可区分例如 以下的值:区分存活良好与存活差的测试样品;或区分个体将会受益于辅 助治疗与不会受益的测试样品;或区分个体会受益于给予特定药物如血管 新生抑制剂或增殖抑制剂的测试样品。可受益于辅助治疗的患者指,患者 状态任意量度的改善,包括本领域常用的那些量度如总体存活、长期存活、 无复发存活和远期无复发存活。
测定基因表达水平的其他方法包括西格诺公司(Sequenom,Inc.)(加 利福尼亚州圣地亚哥)开发的基于MassARRAY的基因表达谱分析方法和 基因表达系列分析(SAGE)(Velculescu等,Science270:484-487(1995); 和Velculescu等,Cell88:243-51(1997))。
测定FFPE材料中基因表达水平的其他方法是qNPATM技术(亚利桑那 州的HTG分子诊断公司(HTGMolecularDiagnostics,Inc.,))和nanoStringTM技术(西雅附图),其中既不需要RNA提取也不需要扩增。使用qNPA技 术,FFPE样品首先接触HTG裂解缓冲液,然后向所述溶液加入与本文所 述生物标志物mRNA互补的核酸酶保护探针。所述探针可与所有感兴趣的 RNA生物标志物杂交,可溶并交联。杂交后,添加S1核酸酶破坏所有非 特异性单链核酸,生成化学计算量的生物标志物-mRNA探针双联体。然后, 碱水解从所述双联体释放该探针。随后可将探针转至程序化ArrayPlate,加 入检测接头,探针和检测接头都捕获于所述阵列上。然后洗涤ArrayPlate 并加入HRP标记的检测探针,孵育。随后洗涤所述针列平板并加入化学发 光底物。最后,对ArrayPlate进行成像和测量所有孔中各生物标志物的表 达。利用Nanostring技术,每生物标志物mRNA使用2个至约50个可与 溶液中mRNA杂交的碱基探针。所述报道探针携带信号,所述捕获探针使 所述复合体能被固定以用于数据收集。杂交后,移出过量探针,并在计数 器芯中排列和固定所述探针/靶标复合体。
在本发明方法中,测量和分析上述一种或多种生物标志物的表达水平 并用于产生下述风险评分。表达阈值可预测性地用于,例如,选择存活良 好和存活差的个体。
有必要校正(标准化)所检测RNA的量以及所用RNA品质变化的差 异。因此,所述检测方法通常测量并纳入某些标准化基因的表达,包括熟 知的管家基因如GAPDH和Cypl。或者,可基于所有检测分析的生物标志 物或其大亚组的平均或中值信号(Ct)进行标准化(总体标准化法)。在 逐个基因的基础上,将所测的标准量患者肿瘤mRNA与肺癌组织对照组中 发现的量作比较。此对照组中肺癌组织的数目(N)应足够高以确保不同对 照组(整体上)以本质上相同的方式表现。如果满足此条件,存在于特定 组中的个体肺癌组织特性将不会对相对量的所检测生物标志物有显著影 响。
在发明方法中,测量各生物标志物的表达且通常转化成表达值。然后, 用这些表达值通过加权平均产生风险评分。通过参数公式或非参数、数据 驱动模型,风险评分经校正数据库与死亡、转移或复发的风险关联。该数 据库构建自有已知表达值、风险评分和临床随访的对照样品组。风险评分 校正可单独用于各模块(表1、2或3)或特异于以组织学、肿瘤分期或其 他特征如患者年龄所定义的特定疾病亚型。对于治疗响应预测,为采用特 异疗法治疗的患者(或无治疗)构建单独校正公式或数据库。还可使用混 合风险评分(用特定加权组合表1、2或3中的模块),其有自身的校正公 式或数据库。临床决策方案可如上述根据校准的风险评分或事件(复发或 转移)的预测存活或时间来完成。
风险评分一旦计算出来,还可用于为对象决定一个合适的治疗过程。 高危评分(即存活时间短或预后差)的对象可受益于接受辅助治疗。辅助 治疗可包括合适的化疗剂,如伯尔定(卡铂)、顺氯氨铂(顺铂)、泰素 帝(多烯紫杉醇)、阿霉素(亚德里亚霉素)、凡毕士(依托泊苷)、健 择(吉西他滨)、Ifex(异环磷酰胺)、Camptosar(伊立替康)、泰素 (紫杉醇)、爱宁达(培美曲塞)及美新(拓扑替康)和/或放疗。负风险 评分(即存活时间长或预后良好)的对象可能不受益于额外治疗。
在另一个示例中,用来自特定表的基因组产生的风险评分可用于确定 特异疗法的过程。例如,若个体基于表2生物标志物分析有高危评分,则 该个体可能受益于接受辅助治疗,所述治疗包括血管新生抑制剂如阿瓦斯 丁(avastin)、索拉非尼(srafinib)、舒尼替尼(sunitinib)或帕唑帕尼 (pazopanib)。或者,若个体基于表3生物标志物分析有高危评分,则该 个体可能受益于接受辅助治疗,所述治疗包括抗增殖剂如拓朴异构酶抑制 剂(I&II)、紫杉烷、蒽环霉素、抗细管素、抗代谢物或烷化剂。
数据分析
为利于样品分析操作,从装置读取器获得的数据可用数字计算机分析。 通常,所述计算机经过适当编程以接收和存储来自所述装置的数据,以及 分析和报道所收集的数据,例如去除背景、验证对照执行正确、标准化信 号、解读荧光数据以确定已杂交靶的量、标准化背景等。
试剂盒
本发明还提供用于确定本文所述生物标志物表达水平的试剂盒。所述 试剂盒可用于确定肺癌对象的预后。试剂盒可包括含探针和/或可附着所述 探针的任何其他固体支持物的微阵列,所述探针为表1-3所鉴定生物标志 物中任意一种或其任意组合的探针和/或探针,所述固体支持物可用于测量 测试样品的基因表达。在一个实施方式中,所述试剂盒包括计算机可读介 质,所述介质包括可被载入计算机系统内存并将所测表达值转变成风险评 分的表达谱分析软件。试剂盒还包括核酸对照、缓冲液和使用说明书。
本领域技术人员会认识到可用于实施本发明的许多与本文所述相似或 等同的方法和材料。事实上,本发明不以任何方式限制于所述方法和材料。 出于本发明目的,下列术语如下定义。
实施例
实施例1:
研究了来自肺癌患者群的诺华(Novartis)数据集和多种公开数据集的 组合。患者选择标准和临床特征的描述可参见公开数据集的各原始文章(见 下)。对于诺华数据集,从已接受手术切除的NSCLC患者收集了412份患 者样品。完成了包括CT扫描、可疑淋巴结(CT中>1cm)的FDG-PET和 MRI在内的标准分期程序。进行了NSCLC组织学分析以确定NSCLC是否 为鳞状细胞癌、腺癌或其他癌如BAC。还进行了基于TNM的分期以确定 NSCLC是I期还是II期。建立了新鲜冷冻组织库以用于基因组分析。主要 终点是总体存活。总体存活指从首次手术开始的时间(以年计),且可以 用比如至少3年这样的期间无复发或再发的时间段来定义,例如5年时间 段。
用于此实施例的公开数据集:
表5
数据集参考文献包括:
BhattacharjeeA等人,ProcNatlAcadSciUSA98:13790-5,2001; Takeuchi等人,(2006)JClinOncol24:1679-88;Raponi等人,(2006) CancerRes66:7466-72;Lu等人,(2006)PLoSMed3:e467;Shedden等 人,(2008)NatMed14:822-7;Hou等人,(2010)PLoSOne5:e10312; Wilkerson等人,(2010)ClinCancerRes16:4864-75;Zhu等人,(2010) JClinOncol28:4417-24。
加工公开数据集的基因表达微阵列
准备用于分析的数据集的过程与Wirapati等人,2008BreastCancer Research10:R65所述相似,简要概括如下:
1.对于基因表达数据,由原作者提供的标准化或预处理表达值不需修 改即使用
2.微阵列平台中的探针或探针集对同一对照序列数据库重作附图 (RefSeq39版)
3.本实施例中仅使用了早期(I期和II期)患者,来自所有数据集总 计n=834(n=571个I期,和n=263个II期)。包括了所有组织学 类型,尽管大部分是腺癌(n=585)或鳞状细胞癌(n=226),仅n=23 来自其他组织学类型。
通过大规模综合分析广泛基因表达和临床数据库鉴定了标签基因,所 述临床数据库由诺华新产生的肺癌数据集(2组总共412名患者,未发表) 和看公开获得的基因表达数据集组成。选择标签基因并根据标准将其分入3 个模块(表1、2和3),所述标准包括表达模式与其他癌症类型的相似性 和生物学功能。选择了公开可用的数据集,从而可用下述方法独立验证预 后性能。
应用生物标志物标签(如表1、2和/或3所指定的一组生物标志物) 时,忽略缺失的基因。通过对特定平台中所存在基因的表达值求平均,赋 予各标签一个原始评分。通过减去原始评分的平均值,再除以标准差,产 生标准化评分。各数据集分别确定平均值和标准差。就各患者生成3个不 同评分。我们将其称为模块1、2或3,分别对应表1、2和/或3的基因组。
为证明来自3个模块的评分不提供相似信息,我们在附附图1中绘制 了所述评分成对分布的散点附图。模块1与模块3以大致相反方向表现, 与其在肿瘤抑制(模块1)和增殖(模块3)中的生物学参与一致。尽管这 2个模块可提供极相似的预后信息,表达的相互性对于精确检测在技术上是 重要的。因此,来自一个模块的低值若伴有其他模块的高值,仅被解释为 低平均表达(而不是检测的技术失败)。模块2显示与模块1和3弱相关, 但有有趣的非对称模式:尽管有可能模块1和2均为低值,但不太可能同 时为高值。另一方面,模块2的高值似乎需要模块3的高值,尽管反之不 成立(即,模块3为高值的一些肿瘤可能具有模块2的低值)。
标签预后性能的评价
为显示各模块评分的临床效用,我们用Kaplan-Meier曲线作了存活分 析(Kaplan和MeierJ.Am.Statist.Ass℃.53:457-481,1953),该分析利用 定量评分将患者分为四等份(各组含25%的患者)。
附图2A-C显示所述三种标签(模块1、2和3)单独应用时的预后性 能,如手术后长达5年的患者总体存活的Kaplan-Meier存活分析所示。根 据评分的四分位数将患者分成4组,即Q1、Q2、Q3和Q4,分别对应于第 1、第2、第3和第4四分位数。此分类能检测随着评分变化的风险改变。 Cox回归分析用于比较选定曲线对,结果显示危害比(HR)及其95%置信 区间,和针对无效果的假设检验p值(HR=1)。各曲线右侧的数字是5 年存活百分率。前三幅附图显示各标签本身即有预后价值。附附图2D(“组 合”)显示通过所述3个模块(-模块1+模块2+模块3)简单组合获得的风 险评分结果。
附图2D还显示组合所述三种评分的一个预后系统示例。简单加和所述 评分,其中模块1乘以-1从而转变效果方向。尽管就一些个体模块未见显 著改善,风险的评分函数变化更平坦。
总之,各单个标签(模块1、2或3)以及其组合(模块1、2和3)显 示出区分患者亚组存活率(或等同地,疾病相关死亡率)的能力。在所有 病例中至少在末端四分位数之间观察到了大幅和统计学显著差异。
所述标签在临床病理因子背景下的性能
为显示所建议的标签可向已确立的因子如组织学、肿瘤分期和诊断时 的年龄增添预后信息,我们进行了与上述相似的分析,但将数据分层进入 各组。在此说明性示例中,仅显示了各因子的单独分层,将其分入2个主 要组以在各组中具有足够样品大小。所考虑的因子是:
·肿瘤分期:I期相对II期
·组织学:腺癌相对鳞状细胞癌
·诊断时的年龄:小于或等于65岁相对大于65岁(这是数据中患者 的中值年龄)
各标签(模块1、2和3)和组合分别单独示于附图3A-F、附图4A-F、 附图5A-F和附图6A-F。附图3A-F特定显示由分期、组织学和诊断时年龄 分层的模块1的预后性能。四分位数与附图2相同(即在分层前首先进行 分组)。在此,如所示,预后能力仍保持在各层内。附图4A-F显示由分期、 组织学和诊断时年龄分层的模块2的预后性能。附图5A-F显示由分期、组 织学和诊断时年龄分层的模块3的预后性能。附图6A-F显示由分期、组织 学和诊断时年龄分层的模块1、2和3综合评分的预后性能。
大部分情况中,仍观察到所述标签(单独或组合)的预后能力。这表 明所建议的标签提供超出传统因子的额外预后。即所述标签不仅是与现有 因子高度相关的替代标志物。特别地,肿瘤分期相同的患者能被进一步区 分进一个风险范围。这不仅仅是分期系统的改进,因为风险排序有可能被 逆转。例如,I期中风险最高的患者组实际上其存活率低于II期患者的平均 存活率。
在多种现有临床病理因子情况下的分析还强调了这些因子也能纳入所 述标签应用。例如,对于鳞状细胞癌,单独标签不显示显著风险区别,但 组合评分显示相比剩余部分顶部四分位数具有几乎最差的结果。
附图7A-F显示所述要求权利的标签的数个示例性变化的预后性能,所 述标签通过从表1、2和/或3选择基因亚组而获得。不具有完整组基因的情 况不包含根据存活率区分患者的能力。由三个基因(表1、2和3中各一个) 构成的最小标签已表现得相当好(图块A)。组间区分随着基因数目增加 而改进(图块B-D)。任意选择的15个基因表现良好(图块E和F)。
个体化治疗决策
风险预测系统会采用临床数据库和基因表达数据数据库,与本实施例 所用的相似,以允许在替代性治疗(不包括治疗)下预测风险。该系统类 似AdjuvantOnline(Ravdin等2001,J.Clin.Oncol.19:980),除了其还包 括来自本发明的评分。
实施例2:
表1、2和/或3公开的生物标志物就肺癌患者而言的典型应用。
1.诊断有肺癌的患者接受手术以移出病损,所述患者有小且可手术的 原发性肿瘤。部分肿瘤组织通过标准病理学程序检测,如测定肿瘤大小、 肿瘤组织学类型(如腺癌、鳞状细胞癌或其他类型)。根据肿瘤大小、存 在淋巴结转移或其他远端位点转移,用标准指南确定肿瘤分期。获自标准 临床病理测量的信息可改进和提高本发明的预后和预测应用,但不是必需 的,也不是组成部分。
2.部分肿瘤组织以或冷冻、石蜡包埋或新鲜组织的形式作为本发明的 源材料。对该组织进行全转录组RNA提取。
3.测量特定组的基因的相对量RNA(在本发明中要求权利),通过任 何这些方法进行:
·qNPA技术或nanoString技术
·特异基因的定量RT-PCR
·与含选定探针或全转录组的微阵列杂交
·高通量RNA测序(RNA-seq),然后计算选择并定量相关基因
4.各RNA的相对丰度按照以下方式之一校正:通过相对对照基因组 的计算标准化程序进行,所述对照基因预期在所有患者中有恒定表达 (Popovici等人,(2009)SelectingcontrolgenesforRT-QPCRusingpublic microarraydata(用公开微阵列数据选择RT-QPCR的对照基因).BMC Bioinformatics.2009年2月2日,10:42);或通过相对来自现有肺肿瘤的 相似测量数据库的标准化(McCall等人,(2010)Biostatistics.2010年4 月;11(2):242-53.Epub2010年1月22日)。
5.所述相对丰度进行对数转化,计算一组中多个基因的加权平均数。 权重可以简单如+1或-1(阳性或阴性信号,取决于基因表达变化对结果的 影响)(Sotiriou等人,(2006)JNatlCancerInst.2006年2月15日; 98(4):262-72)或其可以是就特定测量技术校准的数字。这些加权平均数被 视为用作输入后续风险计算的原始风险评分。各标签模块有其自身的风险 评分。
6.风险概况计算器提供就未来任意时间点而言(手术后数年内测量), 个体患者无疾病状态、无转移状态或存活概率的推测/预测。推测的可靠性 其特征为取决于对照数据库数量和质量的时间特异置信区间。近期推测通 常由更多数据支持,因此相较长期预测更可靠(如置信区间更窄所示)。 附图8A显示一个风险概况计算器图表示例,其中就特定患者测量的风险评 分被转化成肺癌死亡率(根据对照数据库,使用最近邻Kaplan-Meier估计)。
7.风险预测可通过本发明所提供风险评分以外的信息作调节,如患者 的年龄和性别、卡诺斯基评分、肿瘤大小和淋巴结状态。可用已建立的存 活回归方法将所有这些因子整合入给定患者的特异风险概况(Therneau TM,GrambschPM(2000),建模存活数据:延伸Cox模型(Modelling survivaldata:extendingtheCoxmodel),纽约,施普林格出版社 (Springer)),例如:
·参数回归模型(如使用指数或威布尔模型)
·半参数方法(Cox回归)
·比如Kaplan-Meier这样的经验存活曲线估计量,或可行因子的各种 可能组合的保险统计法
附图8B显示肿瘤分期如何调节风险预测的一个示例。如所预期,2期 患者显示5年死亡率高于1期患者。然而,风险评分高(高于零,采用标 准化风险评分单位)的1期患者亚组显示死亡率与平均2期患者(虚曲线) 极相似。这表明仅通过分期进行辅助化疗可能是不够的,因为一些1期患 者(在当前指南下未治疗)实际上与许多2期患者(在当前指南下治疗) 有相似的风险。
风险推测可根据对患者以往观察的数据库进行校正,所述数据库中记 录有疾病结果、临床病理变量和本发明的测量。所述数据库可用来自新患 者的信息定期更新。此系统类似AdjuvantOnline(Ravdin等人,(2001)JClin Oncol.2001年2月15日;19(4):980-91),AdjuvantOnline是一种广泛用于 预测癌症患者随多种临床病理变量变化的存活率的工具。我们将所述系统 延伸到包括来自基因组和转录组技术的多模态评分(multi-modalscores)。
8.输入风险计算器的调节因子可包括常用的辅助治疗(如基于铂的化 疗)或抗血管新生药物。在所述响应-预测应用情况下,呈现2个或更多风 险概况,对应替代性治疗或无治疗下结果的预测概率。
实施例3
所述标签在福尔马林固定石蜡包埋(FFPE)肿瘤材料中的应用。
在组织制备和适于各平台的原始数据预加工过程后,可将本发明所保 护的标签(基因套组和用于产生风险评分的公式)直接应用于来自技术平 台如Affymetrix、qNPA或nanoString的表达数据。
附图9显示来自安德森癌症中心的可公开获得数据集中的存活效能 (Xie等人,2011ClinCancerRes17:5705-14;基因表达综合数据库(Gene ExpressionOmnibus)登录GSE29013),所述数据集获自FFPE材料。在此, 仍观察到显著预后能力,尽管来自FFPE的Affymetrix数据一般质量较低(噪 音水平更高,表达值的缺失判定数更大)。
为评价所述标签风险评分是否能在FFPE的qNPA和nanoString数据中 提供与新鲜冷冻组织的Affymetrix中相同的预后值,对来自同一肺癌患者 的材料进行了比较(数据未发表)。附图10A-B显示成对散点附图,比较 了FF/Affymetrix与FFPE/qNPA,以及FF/Affymetrix与FFPE/nanoString。 观察到高相关性(分别为0.86和0.87),显示所要求保护的标签不依赖于 技术平台的选择,也不依赖于组织保存方法。