1、(10)授权公告号 CN 101603092 B (45)授权公告日 2012.11.07 CN 101603092 B *CN101603092B* (21)申请号 200910148967.3 (22)申请日 2003.03.29 60/368798 2002.03.29 US 03131205.5 2003.03.29 C12Q 1/68(2006.01) (73)专利权人 奥索临床诊断有限公司 地址 美国纽约州 (72)发明人 Y王 (74)专利代理机构 中国专利代理(香港)有限公 司 72001 代理人 梁谋 黄可峻 WO 0012702 A,2000.03.09, BO TH &
2、JONASSEN I.New feature subset selection procedures for classification of expression profiles. GENOME BIOLOGY .2002, 第 3 卷 ( 第 4 期 ),1-11. HEGDE, ET AL.Identification of tumor markers in models of human colorectal cancer using a 19200-element complementary DNA microarray.CANCER RESEARCH .2001, 第 61 卷
3、 ( 第 21 期 ),7792-7797. ZHANG L, ET A.Gene expression profiles in normal and cancer cells. SCIENCE .1997, 第 276 卷 1268-1272. (54) 发明名称 评估结肠直肠癌 (57) 摘要 通过分析一组基因的表达对相信患有结肠直 肠癌的患者的结肠直肠癌存在与否或其可能状态 进行评估的方法。 本发明还涉及多种媒介物, 如微 阵列中基因表达分布图, 也包括含有基因表达分 布图的试剂盒。 (30)优先权数据 (62)分案原申请数据 (51)Int.Cl. (56)对比文件 审查员 温庭江 权
4、利要求书 1 页 说明书 70 页 (19)中华人民共和国国家知识产权局 (12)发明专利 权利要求书 1 页 说明书 70 页 1/1 页 2 1. 包括 Seq.ID.No.46-49 的基因组合在制备用于评估结肠直肠癌状况方法的试剂中 的应用, 所述方法包括鉴定每个基因相对于正常种群的相同基因的表达的差异调节。 2. 权利要求 1 的应用, 其中被调节的基因表达存在至少 2 倍差异。 3. 权利要求 1 的应用, 其中表示差异调节的 p 值低于 0.05。 4. 权利要求 1 的应用, 进一步包括使用非遗传基础的结肠直肠癌诊断方法。 5. 权利要求 4 的应用, 其中在非遗传基础的结肠直
5、肠癌诊断方法中使用的非遗传基础 的癌症标记选自癌胚性抗原、 CA19-9、 CA125、 CK-BB 和鸟苷酸环化酶 C。 6. 一种诊断框架, 包括 Seq.ID.No.46-49 的基因组合的分离的核酸序列或其互补序 列。 7. 权利要求 6 的诊断框架, 其位于适合鉴定包含于其上的基因的差异表达的基片上。 8. 权利要求 7 的诊断框架, 其中所述的基片用于微阵列。 9. 权利要求 8 的诊断框架, 其中所述的微阵列是 cDNA 微阵列。 10. 权利要求 8 的诊断框架, 其中所述的微阵列是寡核苷酸微阵列。 11. 一种用于诊断结肠直肠癌的试剂盒, 其包含包括 Seq.ID.No.46
6、-49 的基因组合的 分离的核酸序列或其互补序列。 12. 权利要求 11 的试剂盒, 进一步包括进行微阵列分析的试剂。 13. 权利要求 11 的试剂盒, 进一步包括媒介物, 所述的核酸序列或其互补序列通过该 媒介物进行检测。 14. 包括 Seq.ID.No.46-49 的基因组合在制备用于评估结肠直肠癌疗效方法的试剂中 的应用, 所述方法包括鉴定每个基因相对于正常种群的相同基因的表达的差异调节。 15. 权利要求 14 的应用, 其中对疗效的评估包括确定患者是否好转, 非好转, 复发, 可 能好转或可能复发。 16. 评估结肠直肠癌状况的制品, 其包含包括 Seq.ID.No.46-49
7、 的基因组合中的分离 的核酸序列或其互补序列。 17. 评估结肠直肠癌状况的制品, 其包含包括 Seq.ID.No.46-49 的基因组合的分离的 核酸序列或其互补序列的表示物。 权 利 要 求 书 CN 101603092 B 2 1/70 页 3 评估结肠直肠癌 0001 本申请是以下申请的分案申请 : 申请日 : 2003 年 3 月 29 日 ; 申请号 : 03131205.5 ; 发明名称 : 同上。 0002 背景 0003 本申请要求 2002 年 3 月 29 日申请的序列号为 60/368,798 的美国临时申请的利 益。 0004 本发明涉及基于生物样本基因表达分布图的结
8、肠直肠癌的诊断和预测。 0005 结肠直肠癌是一种异源疾病, 由据认为是通过三种主要分子机制形成的肿瘤组 成 : 1) 与染色体不稳定性相结合的多发性结肠腺癌 (APC) 基因, 或 - 连环蛋白基因的突 变, 2) 与微卫星序列不稳定性相关的 DNA 错配修复基因如 MLH1, MSH2, PMS2 和 MSH6 的突 变, 和包含短重复序列基因的突变, 以及 3) 由肿瘤抑制基因启动子区的过甲基化诱导的基 因沉默。结肠直肠癌个体的遗传互补可能包括遗传不稳定性、 特异突变和基因沉默的不同 结合。染色体不稳定性 (CIN) 一般是癌症的普遍特征。它意味着其中所有的或大部分的染 色体丢失或增加了
9、的非整倍体表型。伴随短重复序列突变率的增加, 在二倍体肿瘤中发现 了微粒体不稳定性 (MIN)。这两种遗传不稳定性的形式在结肠直肠癌中很普遍。 0006 因此结肠直肠癌具有复杂的起源并且包括不同生物通路间大量的相互作用。 用于 协助提供诊断、 预测或治疗监测结果的血清标记、 组织学和细胞学检查通常不具有所期望 的可信度。同时, 使用单独的遗传标记 ( 例如一特殊基因的表达增加 ) 可能是有益的, 癌症 的多样性使遗传标记的组合可能成为最好的途径。 0007 发明概述 0008 本发明是评估结肠直肠癌存在或不存在, 或者被认为患有结肠直肠癌的患者其可 能状态的方法。在本方法中, 通过分析患者样本
10、的基因表达分布图确定患者是否得了结肠 直肠癌, 患者是否未得结肠直肠癌, 患者是否可能要得结肠直肠癌, 或正在接受治疗的结肠 直肠癌患者对治疗的反应。 0009 本发明的一个方面涉及用于实施该方法的制品。 这样的制品包括基因表达分布图 或固定于机器可读媒介如计算机可读媒介的基因表达分布图的表现物。 0010 用来鉴别基因表达分布图的制品也可以包括用于捕捉和 / 或显示基因表达存在 与否, 或表达程度的基片或平面, 如微阵列。 0011 发明详述 0012 很少发现组织样本中单纯的特定核苷酸序列的存在或缺失具有诊断或预测价值。 另一方面, 关于多种蛋白、 肽或 mRNA 表达的信息正越来越受到重
11、视。具有表达蛋白、 肽或 mRNA 的潜在可能的特定核苷酸序列 ( 这样的序列称为 “基因” ) 仅在给定细胞的基因组中 存在这一事实本身, 并不能确定该蛋白、 肽或 mRNA 是否会在给定的细胞中表达。能表达蛋 白、 肽或 mRNA 的给定基因是否表达以及表达到何种程度取决于多种复合因子。不考虑理解 和评估这些因子的困难程度, 检测基因表达可以为如肿瘤发生、 转移、 细胞凋亡以及其他临 床有关现象等重要事件的发生提供有用的信息。 通过基因表达分布图可以发现基因激活或 失活程度的相对指标。本发明的基因表达分布图可用于结肠直肠癌患者的诊断和治疗。 说 明 书 CN 101603092 B 3 2
12、/70 页 4 0013 样品制备需要收集患者样本。 本发明使用的病例样本是那些疑为含有患病细胞的 样本, 如取自结肠样本或外科切除样本的上皮细胞。获得可疑样本的一种有用技术是激光 捕捉微切片技术(LCM)。 激光捕捉微切片技术提供了一种选择需研究细胞的方法, 并最小化 由细胞种类的不均一性造成的易变性。因此, 正常细胞和癌细胞之间的基因表达中度或细 小的变化都可以被轻易检测到。在优选的方法中, 样本包括从外周血中提取的循环上皮细 胞。这可以按照多种方法获得, 但最优选的方法是 Immunivest 公司的美国专利 6,136,182 所描述的磁性分离技术, 该专利在此引入作为参考。 一旦得到
13、含有所关注细胞的样本, 就提 取其 RNA, 扩增, 并获得基因表达分布图, 优选的通过微阵列获得合适框架 (portfolio) 中 基因的表达分布图。 0014 确立基因表达分布图的优选方法包括, 确定一个能够编码蛋白质或肽的基因所产 生的 RNA 的量。这可通过逆转录酶 PCR(RT-PCR), 竞争性 RT-PCR, 实时 RT-PCR, 差异显示 RT-PCR, Northern 杂交分析和其他相关实验实现。尽管可能用单个 PCR 反应实施这些技 术, 但最好扩增来自 mRNA 的互补 DNA(cDNA) 或互补 RNA(cRNA) 并用微阵列对其分析。对 本领域的技术人员来说大量不
14、同的阵列构型及其生产方法是已知的, 并且也在如下的美 国专利中有描述 : 5,445,934 ; 5,532,128 ; 5,556,752 ; 5,242,974 ; 5,384,261 ; 5,405,783 ; 5,412,087 ; 5,424,186 ; 5,429,807 ; 5,436,327 ; 5,472,672 ; 5,527,681 ; 5,529,756 ; 5,545,531 ; 5,554,501 ; 5,561,071 ; 5,571,639 ; 5,593,839 ; 5,599,695 ; 5,624,711 ; 5,658,734 ; 和 5,700,637
15、 ; 这些专利披露的技术在此引入作为参考。 0015 微阵列技术允许同时检测数千基因的稳定状态的 mRNA 水平, 因此它为检测非控 制的细胞增殖效果, 如启动、 抑制或调节等提供了一个强有力的工具。 现在两种微阵列技术 正被广泛使用。第一种是 cDNA 阵列, 第二种是寡核苷酸阵列。尽管这些芯片在构造上存在 差异, 但其下游数据的分析和输出实质上是相同的。这些分析的结果典型地是对由标记探 针获得的信号强度的测定, 所述的探针用于检测与阵列上已知位点的核酸序列杂交的、 来 自样品的 cDNA 序列。典型地, 所述的信号强度与 cDNA 的含量, 或者说样本细胞中所表达的 mRNA的量成比例。
16、有许多这样的技术可以获得并且是有用的。 优选的检测基因表达的方法 可以在美国专利中找到, 如 Linsley 等人的专利 6,271002 ; Friend 等人的专利 6,218,122 ; Peck等人的专利6,218,114 ; Wang等人的专利6,004,755, 其所公开的内容均在此引入作为 参考。 0016 基因表达水平的分析通过比较强度进行。 最好是通过制备一种待测样品中基因表 达强度相对于对照样品中基因表达强度的比值矩阵进行。例如, 可以将疾病组织中基因表 达的强度与相同类型正常组织中的表达强度进行比较 ( 例如患病的结肠组织样本对正常 的结肠组织样本 )。这个表达强度的比值
17、显示出被测样本和对照样本中基因表达的倍数变 化。 0017 基因表达分布图也可以通过很多方法显示。 最普遍的方法是将原始的荧光强度或 矩阵系数处理成树状图, 其中列表示被测样品, 行表示基因。数据经这样的处理后那些具 有相似表达分布的基因就会相互邻近。每个基因的表达比率可用一种颜色显示。例如, 小 于一的比率 ( 表示下调 ) 可以出现在图谱的蓝色部分, 而大于一的比率 ( 表示上调 ) 可以 出现在图谱的红色部分。商业上可购买到的计算机软件程序很适合显示这样的数据, 包括 Silicon Genetics 有限公司的 “GENESPRING” , Partek 有限公司的 “DISCOVER
18、Y” 和 “INFER” 说 明 书 CN 101603092 B 4 3/70 页 5 软件。 0018 用于本发明的方法的受调节基因如表 1 所示。差异表达的基因表现为在患病细胞 中上调或下调。上调和下调是相对的术语, 表示可检测到的相对于某种基线的基因表达的 量的差异 ( 超出检测系统的噪音影响 )。在这种情况中, 基线是正常细胞测得的基因表达。 再使用同样的测量方法确定患病细胞中所关注的基因相对于基线水平是上调或下调。 上下 文中, 患病的, 是指伴随细胞非控制增殖而出现的机体状态的改变, 此种改变中断、 扰乱或 潜在的打乱机体功能的适当表现。 当某人基因型或表型的一些方面一致表现出存
19、在特定疾 病时, 他就被诊断为患有该种疾病。然而, 作出诊断或预测的行为包括确定疾病表象 / 状态 的情况, 如治疗监测。 在治疗监测中, 比较经过一段时间治疗后的基因表达确定基因表达分 布图是否有变化, 或其变化与正常组织的模式更为一致来考虑疗程的效果从而作出临床判 定。 0019 优选的, 上升或下降调节的水平是以杂交的微阵列探针测量强度的成倍变化来区 别的。2 倍差异或 p 值小于 0.5 对于作出这样的辨别是优选的。即当认为与在正常细胞中 相比一个基因在患病细胞中差异表达时, 患病细胞中的强度至少是正常细胞的 2 倍或 1/2。 倍数差异越大, 该基因就越优选用作诊断。本发明选择用作分
20、析表达分布图的基因具有产 生使该基因区别于正常基因或非调节基因的信号的表达水平, 该信号量超出使用临床实验 室检测设备的背景量。 0020 利用统计值可用于确定地使调节基因与非调节基因和噪音区别开。 通过统计检验 发现在不同样本组之间有最显著差异的基因。Student s T 检验就是一个发现两组之间显 著差异的有力的统计检验的例子。p 值越小, 不同组之间基因显示差异的证据就越有说服 力。然而既然微阵列可以同时检测多个基因, 那么就需要同时进行万次的统计检验。因此, 就存在偶尔看到极小 p 值的可能, 可以利用 Sidak 校正以及随机化 / 排列实验进行调整。T 检验中 p 值小于 .05
21、 就证明基因是差异显著的。更有说服力的证据是加入 Sidak 校正因子 后 p 值小于 .05。对于每组中的大量样品, 经过随机化 / 排列检验后 p 值小于 .05 是差异显 著的最有说服力的证据。 0021 另一个可用来选择产生强于非调节基因和噪音信号的基因的参数是绝对信号差 异测量值。优选的, 调节基因的表达形成的信号与正常基因或非调节基因 ( 以绝对值为基 础 ) 至少有 20的差异。更优选的, 调节基因形成的表达模式与正常基因或非调节基因至 少有 30的差异。 0022 将基因分组以便于通过获得一组基因中一套基因的信息为诊断、 预测或治疗选择 等相关临床判断提供可靠的基础。 这些套基
22、因构成了本发明的框架(portfolios)。 此例中, 由该框架支持的判断包括结肠直肠癌。基因表达分布图的框架包含实施例 3 中描述的基因 联合组合。对于大多数诊断标记物来说, 最好使用尽量少的标记物就足以充分作出一个正 确的医学判断。这就避免了使用那些悬而未决需作进一步分析的治疗措施带来的延误, 同 时又避免了时间和资源的不合理使用。此例中, 这样的最小量的框架包含实施例 4 中的基 因组合。 0023 优选的, 构建这样的框架以保证该框架中的基因组合相对于单个基因或随机选择 的基因组合显示出更好的灵敏度和特异性。在本发明中, 框架的灵敏度反映在一个基因在 疾病状态下相对于其在正常状态下所
23、表现出的基因表达的成倍差异中。 特异性可以反映在 说 明 书 CN 101603092 B 5 4/70 页 6 基因表达信号与所关注疾病相关性的统计测量中。 例如, 标准差就是这样一个有用的度量。 当考虑将一组基因掺入到某一框架中时, 表达测量值的标准差越小其特异性越大。其他检 测变量, 如相关系数也包括在使用范围内。 0024 最优选地, 建立基因表达框架的方法是运用优化算法, 如在确定股票投资中广泛 使用的平均方差算法的。这一方法在同日期的 Tim Jatkoe 等人标题为 “投资组合选择 (Portfolio Selection)” 的同时待审的专利申请中有详细表述。 该方法实质上要求
24、一套输 入值 ( 金融应用中的股票, 这里指通过强度测定的表达 ), 其可优化收到的回报率 ( 例如形 成的信号 ) 以进行应用, 同时最小化回报率的可变性。许多商业软件程序适合进行这样的 操作。在整个说明书中称为 “Wagner 软件” 的 “Wagner 联合均值 - 方差优化应用程序” 是 优选的。这个软件使用 “Wagner 联合均值 - 方差优化库” 中的功能, 来确定有效边界, 优选 Markowitz 意义上的优化框架。 0025 由于该软件用于金融分析目的, 因此使用这种类型的软件需要将微阵列数据进行 转换, 使数据以股票回报值和风险测量值的方式输入处理。例如, 当 Wagne
25、r 软件与微阵列 强度测定协同应用时, 要运用以下的数据转换方法。 0026 首先通过确定那些其表达至少显示出某种微小差异水平的基因, 对基因进行预选 择。优选的预选择过程如下所述。选择一个基线组。典型的基线组包含来自未患有所述疾 病的群体的基因。 例如, 在选择所用于诊断乳腺癌的基因框架时, 可以将未患乳腺癌患者的 样本用作制备基线组。一旦选择了基线组, 就可以计算出基线组样本中每个基因的表达指 标的算术平均值和标准差。典型的, 这个指标是微阵列记录的荧光强度。随后将通过计算 得到的统计学数据用于计算每个基因的基线值 (X* 标准差 + 均值 )。这就是基因的基线记 录, 其它所有样本都要与
26、其相比较。X 是由制定框架的人选择出来的严格变量。X 的数值越 大就越严格。优选的 X 数值范围是 0.5-3, 更优选的是 2-3, 最优选的是 3。 0027 随后计算每个实验样本 ( 那些表现出所关注疾病的样本 ) 与基线记录的比值。再 将这些比值转换成易于软件进行数据处理的底数为 10 的对数值。该方法使下调基因显示 为负值, 这是使用 Wagner 软件并按照 Markman 均值 - 方差算法进行优化所必需的。 0028 将包含这些转换比值的预处理数据作为输入, 替代用于金融分析目的的 Wagner 软件中通常使用的资产回报值。 0029 一旦制定出有效边界, 对于一个给定的输入水
27、平值 ( 回报率 ) 或对应于边界上的 一个点的方差, 就可以选择出一个优化框架。这些输入值或方差是制定框架的人预先确定 的标准数集。换句话说, 寻求最适框架的人决定一个可接受的输入水平 ( 表明灵敏度 ) 或 者一个给定的方差水平 ( 表明特异性 ), 选择位于该输入水平或方差相应的有效边界的基 因。当选定了输入水平或方差, Wagner 软件就能够选择出这样的基因。Wagner 软件可以像 对股票投资组合中每支股票所做的那样, 分配所述框架中每个基因一个权重。 0030 将患者样本框架中的基因的表达, 与用于构建所述框架的差异表达基因的计算值 相比较, 就可以确定该样本是否患有该框架所诊断
28、的疾病。 优选的, 首先通过将在选择框架 的过程中给每个基因分配的权重乘以框架中每个基因的强度值, 加和得到框架值。然后用 ( 基线组中框架的 Y* 标准差 + 均值 ) 计算边界值, 其中 Y 是一个严格数值, 具有与上述 X 相 同的含义。一个样本具有的框架值大于基线组的框架值, 则此样本就被归为患有该病。需 要时, 可以根据提高可信度水平的已知统计学方法重复上述过程。 说 明 书 CN 101603092 B 6 5/70 页 7 0031 任选的, 可以重复进行上述过程直到获得预期的最高准确度。 0032 框架选择的过程和未知量的表征过程概括如下 : 0033 1. 选择基线组 003
29、4 2. 计算基线组样本中每个基因的均值和标准差 0035 3. 计算每个基因的 (X* 标准差 + 均值 )。这就是基线记录, 其它所有的样本都要 与这个基线记录相比较。X 是一严格变量, X 数值越大就越严格。 0036 4. 计算每个实验样本对根据步骤 3 得到的基线记录的比值。 0037 5. 转换比值, 使值小于 1 的比值成为负数 ( 例如使用底数为 10 的对数 )。( 现在 下调的基因有正确的负值以符合 MV 优化的需要 )。 0038 6. 将这些转换的比值作为输入值, 替换软件应用中通常使用的资产回报值。 0039 7. 该软件将标绘出有效的边界线, 并且返回一组沿此有效边
30、界线上任意一点的优 化框架。 0040 8. 在此有效边界线上选择一个所需的回报率或者方差。 0041 9. 通过将在选择框架的算法中所给定的权重乘以每个基因的强度值, 加和计算每 个样本的框架值。 0042 10. 将基线组的框架值的均值加上 Y 与基线组的框架值的标准差的乘积, 计算出 边界值。大于该边界值的数值应被归为实验组。 0043 11. 任选的, 可以重复进行上述过程, 直到获得预期的最佳准确度。 0044 可选择的, 首先通过确定那些其表达显示出某种微小差异水平的基因, 对基因进 行预选择。在这个可选择的方法中, 预选择优选的以给出的阈值为基础, 其中 t 是已知患有该疾病或病
31、症的样本子集的均值, n是正常样本子集的均值, t+n表示联合 标准差。 通过根据如的关系式对数据的预选择, 也可在其中使用信噪比截止值。 这就确保基于差异调节进行预选择的基因具有临床上的显著差异。 即超过了适于测定各种 临床参数的仪器产生的噪音水平。对于根据这些标准预选的每个标记物建立一个矩阵, 其 中列表示样本, 行表示标记物, 并且每个元件都是根据对该标记物的表达进行标准 化后所得到的强度测量值, 其中 I 代表强度测量值。 0045 也可以通过设置附加的边界条件来定义优化框架。例如, 框架的大小可限定为固 定的值域或标记物的数目。这或者可以通过制定更为严格的预选标准 ( 例如以 代替)
32、 或通过使用程序特征如限制组合大小来实现。例如可以设置边界条件使 有效边界线从最优化的 10 个基因中选出。也可以使用所有的预选基因确定有效边界线后 再限定所选择基因的数目 ( 例如不超过 10 个 )。 0046 选择框架的过程也包括应用探索式的规则。优选的, 这样的规则是基于生物学和 对用于产生临床结果的技术理解的基础上制定的。更优选的是, 它们应用到优化方法的输 出数据中。例如, 选择框架的均方差法可以应用于乳腺癌样本中大量差异表达基因的微阵 说 明 书 CN 101603092 B 7 6/70 页 8 列数据。这种方法得到的输出数据将会是一套优化的基因, 包括既在外周血中表达也在患
33、病乳腺组织中表达的一些基因。如果这种检测方法用到的样本来自外周血, 并且某些基因 既在乳腺癌个例也在外周血中差异表达, 那么就可以应用探索式的规则, 从排除了那些在 外周血中差异表达的基因而得到的有效边界线上选择框架。当然, 这个规则可以在形成有 效边界线前应用, 例如, 将该规则应用到数据的预先选择中。 0047 可以应用其他与所考虑的生物学问题无必然联系的探索式规则。例如, 可以应用 只有给定百分比的框架可用特定的基因表示的规则。商业上可购买的软件如 Wagner 软件 就提供了这类型的探索式规则。这是非常有用的, 例如, 除了正确度和精密度等, 其他因素 ( 例如, 预期许可费 ) 也会
34、影响包括一个或多个基因的可用性。 0048 本发明的一个方法包括如上所述比较多种基因(或框架)的基因表达分布图以进 行诊断。将构成框架的每个基因的基因表达分布图固定于如计算机可读的媒介物上。这可 以采取很多形式。例如, 可以建立一个输入表示疾病的信号范围 ( 例如强度测定值 ) 的表 格。 可以将患者的实际数据与表格中的值进行比较以确定该患者的样品属于是正常的或患 病的。在一个改进的具体实例中, 表达信号的模式 ( 例如荧光强度 ) 以数字或图形方式记 录。再将与患者样本相结合使用的基因框架中的基因表达模式与上述表达模式比较。然后 利用模式比较软件确定该患者本是否具有表示所讨论的疾病的模式。
35、当然这些比较也可用 于确定该患者的结果是否正常。再将样本的表达分布图与正常或对照细胞的框架相比较。 如果样本表达模式与结肠直肠癌的表达模式一致, 那么 ( 无抵消性的医学理由 ) 该患者就 被诊断为结肠直肠癌阳性。如果样本表达模式与正常或对照细胞的表达模式一致, 那么该 患者就被诊断为结肠直肠癌阴性。 0049 许多公知的识别模式的方法是适用的。下列参考提供了一些例子 : 0050 加权阈值 Weighted Voting : 0051 Golub, TR., Sclonim, DK., Tamaya, P., Huard, C., Gaasenbeek, M., Mesirov, JP.,
36、Coller, H., Loh, L., Downing, JR., Caligiuri, MA., Bloomfield, CD., Lander, ES. 癌症的 分子分类 : 利用基因表达检测的分类发现和分类预测。科学 Science 286 : 531-537, 1999 0052 支持矢量机器 Support Vector Machine : 0053 Su, AI., Welsh, JB., Sapinoso, LM., Kern, SG., Dimitrov, P., Lapp, H., Schultz, PG., Powell, SM., Moskaluk, CA., Frie
37、rson, HF.Jr., Hampton, GM. 利用基因表达信号的人 类癌症的分子分类。癌症研究 Cancer Research 61 : 7388-93, 2001 0054 Ramaswamy, S., Tamayo, P., Rifkin, R., Mukherjee, S., Yeang, GH., Angelo, M., Ladd, C., Reich, M., Latulippe, E., Mesirov, JP., Poggio, T., Gerald, W., Loda, M., Lander, ES., Gould, TR. 利用肿瘤基因表达信号的多种类癌症诊断。美国国
38、家科学院院刊 Proceedingsof the National Academy of Sciences of the USA 98 : 15149-15154, 2001 0055 K- 最邻近值 K-nearest Neighbors : 0056 Ramaswamy, S., Tamayo, P., Rifkin, R., Mukherjee, S., Yeang, GH., Angelo, M., Ladd, C., Reich, M., Latulippe, E., Mesirov, JP., Poggio, T., Gerald, W., Loda, M., Lander, ES
39、., Gould, TR. 利用肿瘤基因表达信号的多种类癌症诊断。美国国家科学院院刊 Proceedingsof the National Academy of Sciences of the USA 98 : 15149-15154, 2001 0057 相关系数 Correlation Coefficients : 说 明 书 CN 101603092 B 8 7/70 页 9 0058 van t Veer LJ, Dai H, van de Vijver MJ, He YD, Hart AA, Mao M, Peterse HL, vander Kooy K, Marton MJ, W
40、itteveen AT, Schreiber GJ, Kerkhoven RM, Roberts C, LinsleyPS, Bernards R, Friend SH. 基因表达分布图预测乳腺癌的临床结果。自然 Nature.2002 Jan 31 : 415(6871) : 530-6 0059 本发明的基因表达分布图也可以与其他在癌症诊断、 预测、 或治疗监测中所使用 的非遗传的诊断方法联合使用。 例如, 在一些情况中, 将如上所述的基于基因表达诊断能力 的方法与从如血清蛋白标记(例如癌胚性抗原)的传统标记物中得到的数据结合使用是很 有益的。存在许多这样的标记物, 包括如 CA19-9,
41、 CA125, CK-BB 和鸟苷酸环化酶 C 的分析 物。 在这样的一个方法中, 对治疗患者周期性采血, 然后将血样作上述血清标记之一的酶联 免疫检测。当标记的浓度暗示了肿瘤复发或治疗失败时, 可以随后对样本源作基因表达分 析。如果存在所怀疑的肿块, 取细针吸取物并如上所述对取自肿块的细胞进行基因表达分 布图分析。可选择的, 组织样本可以取自先前摘取了肿瘤的组织的邻近区域。当其他检测 结果不确定时, 这种方式特别有用。 0060 当其它诊断的可靠性值得怀疑时, 联合使用遗传标记和其他诊断是最优选的。例 如, 众所周知 CEA 血清水平在相当程度上受到与患者癌症状态毫无关系的因子的影响。当 一
42、个患者被监测到在接受结肠癌治疗后显示常规 CEA 检测高水平时, 那联合进行基因表达 /CEA 检测是有益的。 0061 本发明的制品包括用于治疗、 诊断、 预测和其它疾病评估的基因表达分布图的表 示物。这些分布图表示物简化为可被机器自动可读的媒介物, 如计算机可读媒介 ( 磁性的, 光学的及类似的)。 制品也包括在这种媒介中评估基因表达分布图的指令说明。 例如, 制品 可能包括具有用于比较上述基因框架的基因表达分布图的计算机指令的 CD ROM。制品可 能也含有基因表达分布图的数字记录以用于与患者样本的基因表达数据进行比较。 可选择 的, 所述的分布图可以不同的表现格式记录。图形记录就是这样
43、的一种格式。上文提到的 “GENESPRING” 和 “DISCOVER” 计算机程序中整合的聚类算法就可很好的协助这些数据形象 化。 0062 根据本发明生产制造的不同类型的物品是指用于揭示基因表达分布图的媒介物 或格式化检测。这些可以包括, 例如微阵列, 其中将序列互补物或探针固定于基片上, 它与 表示所关注基因的序列联合建立一个有关其存在的易读行列式。可选择的, 根据本发明的 制品可以被制作成用于进行杂交、 扩增, 以及形成表示所关注的基因表达水平的信号以用 来检测结肠直肠癌的试剂盒。 0063 根据本发明制备的试剂盒包括确定基因表达分布图的格式化检测。 这就包括了进 行检测所需的如试剂
44、和说明指令等所有或部分材料。 0064 本发明进一步用下列非限定性的实施例说明。 0065 实施例 : 根据本发明分析的基因是通过参考 GenBank 数据库中的基因 ID 号鉴定 的。它们通常与编码产生蛋白质或肽的全长核苷酸序列相关。本领域的技术人员公认全长 核苷酸序列的鉴定不是一个分析观点所必需的。 即可以根据公知的为评估相关基因的基因 表达设计探针的原理进行部分序列或 ESTs 选择。 0066 实施例 1- 样品处理和 LCM 0067 收集接受结肠直肠肿瘤外科手术患者的 27 个新鲜冷冻组织样本。19 个样本是结 说 明 书 CN 101603092 B 9 8/70 页 10 肠直
45、肠恶性肿瘤样本, 8个样本是正常的结肠粘膜。 组织在获得后的20-30分钟内快速液氮 冷冻, 并随后贮存于 -80。为了激光捕捉, 将样本切片 (6m), 一切片封固于玻璃载片上, 另一切片封固于已被固定于玻璃载片 (Micro SlidesColorfrost, VWR Scientific, Media, PA) 上的膜 (P.A.L.M.) 上 . 封固于玻璃载片上的切片在冷的丙酮中固定, 并用 Mayer s 苏 木精 (Sigma, St.Louis, MO) 染色 . 病理学家为诊断和定级分析样本。使用 Dukes 分级, 由 附带的外科病理学和临床报告进行临床阶段评估。封固于膜上
46、的切片在 100乙醇中固定 5分钟, 在曙红/100乙醇(100g曙红溶于100ml脱水乙醇)中复染1分钟, 快速在100 乙醇中浸泡一次以除去未结合染料, 空气中干燥 10 分钟。 0068 结肠直肠腺癌中的两个为等级 1, 10 个为等级 2, 5 个为等级 3。一个恶性肿瘤样 本是盲肠的类癌瘤, 另一个是转移的黑色素瘤病变。 两个腺癌样本表现为粘蛋白状亚型, 一 个为章形细胞亚型。腺癌样本按 Dukes 分级划分如下 : DukesA : 2, Dukes B : 5, Dukes C : 7, Dukes D : 3。六个腺癌样本在手术前放疗过。 0069 在 LCM 中使用前, 膜
47、(LPC-MEMBERANE PEN FOIL 1.35mNo.8100, P.A.L.M.GmbH Mikrolaser Technologie, Bernried, Germany) 和载片经过预处理以除去 RNA 酶, 并且 增强组织样品在膜上的吸附。简要的, 载片用 DEPH2O 洗涤, 膜用 RNase AWAY(Molecular Bioproducts, Inc., San Diego, CA) 洗涤并用 DEP H2O 冲洗。膜粘附到玻璃载片上后, 载片 于 120烘烤 8 小时, 用 TI-SAD 处理 (Diagnostic Products Corporation, Lo
48、s Angeles, CA, 以 1 50 溶于 DEPH2O, 用脱脂棉过滤 ), +37孵育 30 分钟。临使用前, 将 10l 小份的 RNA酶抑制剂溶液(RNA酶蛋白质抑制剂2500U33U/l N211A, Promega GmbH, Mannheim, Germany, 0.5l溶于400l冷的含有0.15mol NaCl, 10mmol TrispH8.0, 0.25mmol二硫苏 糖醇的溶液 ) 铺展到待封固组织样本的膜上。 0070 封 固 于 膜 上 的 组 织 切 片 用 于 LCM。 利 用 PALM 自 动 微 光 束 技 术 (P.A.L.M.Microlaser
49、Technologie, Carl Zeiss, Inc., Thomwood, NY) 捕 捉 约 2000 个 上皮细胞样品, 并连接到 Zeiss Axiovert 135 显微镜中 (Carl Zeiss Jena GmbH, Jena, Germany)。正常粘膜的外周基质和癌症样本中偶然的干扰基质成分都包括在内。捕捉到的 细胞置于 100乙醇的小管中于 -80保存。 0071 实施例 2-RNA 提取和扩增 0072 利用 Zymo-Spin 柱 (Zymo Research, Orange, CA92867) 提取通过 LCM 捕捉的细胞 的总 RNA。将约 2ng 总 RNA 重悬于 10l 水并且利用 T7 RNA 聚合酶进行两轮扩增, 扩增的 RNA 产量约为 50g。 0073 实施例 3-cDNA 微阵列杂交和定量 0074 利用一套由约 20,000 个人 cDNA 克隆组成的 cDNA 微阵列检测样本。将约 30 个 植物基因印迹到微阵列上作为非特异杂交对照。利用 LCM 捕捉细胞的 5g aRNA 合成 Cy3 标记的 cDNA 探针。探针用 Qiagen s 核苷酸去除柱 (Nucleotide Removal Columns) 纯化 然后经 14-16 小时杂交到微阵列上。载片在扫描前经过洗涤并于空中干燥。扫描微阵列的 C
copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1