阿尔茨海默病进展的生物标记
技术领域
[01]本发明总体上涉及组织样品的体外分析检测,更具体地涉及用于诊断、预后或者预防性/治疗性治疗痴呆,例如阿尔茨海默病的遗传多态性的方面。
背景技术
[02]传统的疾病诊断和治疗方法基于单独的临床数据,或者与诊断检测联合构成。这样的传统实践经常导致对于所开的药物治疗处方的疗效并非是最佳的治疗选择,或者导致针对个体受试者的副作用的可能性不能最小化的治疗选择。治疗特异诊断学(又名治疗诊断学)是新兴的医学技术领域,为诊断疾病、选择正确的治疗方案和监控受试者的反应提供有用的检测。更确切地说,治疗诊断学对于预测和评估个体受试者的药物反应是有用的,即个体化医学。治疗诊断检测在选择治疗尤其可能从治疗中获益的受试者或在提供个体受试者的疗效早期客观指征方面也是有用的,从而可以改变治疗而最大限度地减少延迟。
[03]药物遗传学建立了个体患者的特定药物反应与遗传谱之间的相互联系,药物遗传学的进展是开发新的治疗诊断方法的基础。如此,本领域需要对患者间在基因序列和基因表达上的变化进行评估。遗传谱的常见形式依赖于鉴定称作单核苷酸多态性(“SNP”)的DNA序列变异,其是导致患者之间对个体药物反应不同的一类遗传突变。由此得出结论本领域需要对诸如SNP的遗传突变进行鉴定和表征,其对于鉴定与药物反应、副作用或最佳剂量相关的受试者基因型是有用的。
[04]痴呆是严重影响人们进行日常活动的能力的脑疾病。老年人中最常见的痴呆形式是阿尔茨海默病(AD),其最初涉及控制思维、记忆和语言的大脑部分。据估计有450万之多的美国人罹患AD。预期随着人口老龄化,到2050年该数字将翻两番。该病通常在60岁之后发病,随着年龄的增长而风险增加。尽管年轻人也可以患AD,但是不是很常见。大约百分之五的年龄为65至74的男人和女人患AD,并且那些年龄为85或者更老的人中的几乎一半可能患有这种疾病。AD不是正常老化的一部分。AD的病因还不完全知道并且仍不能被治愈。对于处于AD疾病的早期和中期阶段的人们,施用诸如他克林(盐酸他克林)、多奈哌齐(安理申)、利凡斯的明(艾斯能)或者加兰他敏(Razadyne,之前称为Reminyl)的药物可以暂时延缓AD症状的进展。
[05]轻度认知损害(MCI)是正常老化的认知改变与由阿尔茨海默病引起的更严重问题之间的过渡阶段。MCI即不同于AD也不同于正常的与年龄相关的记忆改变。患有MCI的人们具有进行性的记忆问题,但是他们不经历其它丧失,例如意识错乱、注意力问题以及语言困难。然而,MCI可以发展为阿尔茨海默病。因此,本领域需要鉴定和表征用于鉴定与痴呆,例如阿尔茨海默病的发生和/或进展相关的受试者基因型的遗传突变。
发明内容
[06]本发明提供新的遗传突变(即“AD相关突变”),其用作生物标记,鉴定与诸如阿尔茨海默病等痴呆的发生和/或进展相关联的受试者的基因型。本发明提供诺瓦提斯的化合物------利凡斯的明(艾斯能)在制备药物中的用途,该药物用于以降低的毒性或者增加的效力治疗给定患者群的阿尔茨海默病,其中患者群的选择基于本发明至少一种基因突变的存在。
[07]本发明还提供治疗受试者阿尔茨海默病的方法。获得受试者位于选自下述至少一种基因:AK5;BAI3;BBX;C18orf20;C5orf3;CACNA2D1;CCDC2;CD47;CNTNAP5;GRIA1;LAMA3;LOC131368;LRRC19;MGC27434;NFKBIZ;PIK3C3;SLC1A3;SPAG16;ST3GAL3;TEK和TNFSF11的遗传基因座的基因型或者单元型,结果是该基因型和/或单元型是阿尔茨海默病对药物反应的倾向的指示。然后向受试者施用抗阿尔茨海默病疗法,包括但不限于,例如他克林、多奈哌齐、利凡斯的明、加兰他敏,或者与AD相关的突变调节剂。
[08]本发明提供鉴定受试者罹患疾病的方法,本发明阿尔茨海默病相关突变是该疾病的预测。获得受试者位于选自:AK5;BAI3;BBX;C18orf20;C5orf3;CACNA2D1;CCDC2;CD47;CNTNAP5;GRIA1;LAMA3;LOC131368;LRRC19;MGC27434;NFKBIZ;PIK3C3;SLC1A3;SPAG16;ST3GAL3;TEK和TNFSF11的至少一种基因的遗传基因座的基因型或者单元型,并评估该基因型或单元型以确定本发明突变的存在,以鉴定受试者具有罹患阿尔茨海默病相关突变所预测的疾病的倾向。阿尔茨海默病相关突变所预测的疾病可以是阿尔茨海默病。
[09]本发明提供在开始治疗前,通过探询受试者位于至少一种基因的遗传基因座的基因型和/或单元型而确定哪一个受试者应该包含于治疗用或者研究用试剂的研究中的方法,其中该至少一种基因选自AK5;BAI3;BBX;C18orf20;C5orf3;CACNA2D1;CCDC2;CD47;CNTNAP5;GRIA1;LAMA3;LOC131368;LRRC19;MGC27434;NFKBIZ;PIK3C3;SLC1A3;SPAG16;ST3GAL3;TEK和TNFSF11,并且然后(i):如果基因型是受试者患阿尔茨海默病的倾向的指示,则将该受试者包含于研究中;(ii):如果基因型不是受试者患阿尔茨海默病的倾向的指示,则将该受试者排除出研究;或者(iii):(i)和(ii)两者。
[10]本发明提供确定患有疾病的受试者对治疗的反应性的方法,即通过获得受试者位于选自AK5;BAI3;BBX;C18orf20;C5orf3;CACNA2D1;CCDC2;CD47;CNTNAP5;GRIA1;LAMA3;LOC131368;LRRC19;MGC27434;NFKBIZ;PIK3C3;SLC1A3;SPAG16;ST3GAL3;TEK和TNFSF11的至少一种基因的遗传基因座的基因型或者单元型,并且然后评估基因型和/或单元型以确定本发明突变或者多态性的存在,其中突变或者多态性的存在是个体对疾病的治疗响应的指示,以鉴定受试者为对疾病的治疗有响应。
[11]本发明提供用于在治疗前确定哪一个受试者当使用化合物治疗时将发展为中毒的方法,即通过获得受试者位于选自AK5;BAI3;BBX;C18orf20;C5orf3;CACNA2D1;CCDC2;CD47;CNTNAP5;GRIA1;LAMA3;LOC131368;LRRC19;MGC27434;NFKBIZ;PIK3C3;SLC1A3;SPAG16;ST3GAL3;TEK和TNFSF1的至少一种基因的遗传基因座的基因型或单元型(即“本发明的基因型或单元型”),然后评估基因型和/或单元型以确定本发明的突变或者多态性的存在,其中突变或者多态性的存在是当治疗时受试者将发展为中毒的指示,以便鉴定该受试者为当治疗时将发展为中毒的受试者。
[12]本发明还提供检测试剂盒,用于(a)确定针对正在使用治疗用或者研究用试剂治疗的个体何时应该终止使用化合物;(b)确定哪一个个体将发展为中毒;(c)确定当使用化合物治疗时哪一个个体正发展为中毒;以及(d)确定当使用化合物治疗时哪一个个体将发展为中毒并且不应包含于该化合物的研究中。该试剂盒包含容纳于容器中适于与体液接触的试剂以及用于解释结果的说明书,该试剂用于检测由具有包含本发明突变的序列的基因编码的多核苷酸或者多肽。
[13]本发明提供监测正在使用化合物治疗的受试者中毒的进展或者发展的方法,即通过(a)提供来自受试者的第一检测生物样品;(b)提供来自受试者的第二检测生物样品,其在取样时间上晚于第一检测生物样品;(c)将检测生物样品与试剂接触,该试剂用于检测由具有包含本发明突变的序列的基因编码的多核苷酸或者多肽;(d)确定多肽或者多核苷酸在检测生物样品中的表达水平;以及(e)比较第一检测生物样品中多核苷酸或者多肽的水平与第二检测生物样品中多核苷酸或者多肽的水平,其中第二检测生物样品中多核苷酸或者多肽的水平相对于第一检测生物样品中多核苷酸或者多肽水平的增加或者降低指示正在使用化合物治疗的受试者中毒的进展或者发展。
[14]本发明提供用于在使用化合物治疗期间或者之后有中毒风险的受试者中确定何时应该终止使用化合物进行治疗的方法,即通过(a)提供检测生物样品和标准参考样品;(b)使检测生物样品与试剂接触,该试剂用于检测由具有包含本发明突变的序列的基因编码的多核苷酸或者多肽;(c)确定多肽或者多核苷酸在检测生物样品中的表达水平;以及(d)比较检测生物样品中的多核苷酸或者多肽的水平与标准参考样品中的多核苷酸或者多肽的水平,其中检测生物样品中多核苷酸或者多肽的水平与标准参考生物样品中多核苷酸或者多肽的水平之间的相似性指示受试者中毒的发展,并确定该化合物应该终止使用。
[15]本发明提供用于证实化合物作为治疗医学状况的候选靶标的方法,该医学状况被预测为与阿尔茨海默病或者MCI相关,即通过(a)比较第一和第二群体之间的本发明每个基因型或者单元型的频率,其中第一群体是具有医学状况的个体群,并且第二群体是缺乏医学状况的个体群;(b)对是否采用化合物治疗医学状况作出决定;其中如果第一群体中的至少一种单元型存在的频率在统计学的显著水平上不同于第二群体中的频率,那么则作出使用该化合物进行治疗的决定,以及如果在第一群体和第二群体之间没有发现在统计学的显著水平上存在不同频率的单元型,则作出不使用该化合物的决定。
[16]本发明也提供用于存储和分析基因多态性数据的计算机系统,具有(a)中央处理单元(CPU);(b)通讯接口;(c)显示装置;(d)输入装置;和(e)含有多态性数据的数据库,其中多态性数据包括本发明的单元型。
具体实施方式
[17]轻度认知损害,或MCI影响认知的许多方面,并且可以分为两个大概的亚型。一个亚型为遗忘性MCI,其显著地影响记忆。另一个类型为非遗忘性MCI,其不影响记忆。其它功能,例如语言、注意力和立体视觉能力在任何一种类型中都可能受损。估计MCI确切的普遍性高达年龄超过65岁的非痴呆人群的百分之二十。但是,这些病例的大约三分之一具有与阿尔茨海默病相关的遗忘性变化。遗忘性(记忆相关的)MCI每年以10%-15%的速率转化为阿尔茨海默病。
[18]本发明提供新的遗传突变(即“AD相关的突变”),其用于鉴定受试者与遗忘症(例如阿尔茨海默病)的发生和/或进展相关的基因型。具体地,使用Haploview的病例对照检测法在单一位点和推断的单元型区段上使用Affymetrix 100K基因型分型平台对来自InDDex(ENA713B IA07)临床试验的420名患者的样品进行基因分型并进行整个基因组的相关性分析(Barrett等人,Bioinformatics 21:263-265(2005))(大体上参见实施例1)。结果表型是从MCI向AD的转化或者未转化。
[19]本发明提供了25个AD相关突变(例如MUT-1至MUT-25),其总结于下表1中。表1中的AD相关突变之前并未与AD相关联,即便其中的一些处于与该疾病相关联的通路中。本发明的AD相关突变用于诊断、预后或者治疗性治疗诸如阿尔茨海默病的痴呆。一方面,本发明的AD相关突变用作AD的诊断性/预测性标记。另一方面,本发明的AD相关突变用作AD预防或者治疗中所使用试剂的靶标。
[20]应理解,本发明的某些方面、模式、实施方式、改变和特征在下述内容中作了不同程度的详细描述,以提供对本发明的本质理解。总体上讲,这类公开提供了用于诊断和治疗有需要的受试者的新的AD相关突变,包括SNP。因此,本发明的不同方面涉及编码本发明AD相关突变的多核苷酸,编码本发明AD相关突变多肽的表达载体,以及表达本发明AD相关突变多核苷酸和/或AD相关突变多肽的生物。本发明的不同方面还涉及诊断/治疗诊断方法和试剂盒,其使用本发明的AD相关突变来鉴定易患病个体或根据药物反应、副作用或最优药物剂量对个体进行分类。其它方面,本发明提供了用于验证化合物的方法和用于储存及分析与本发明AD相关突变有关的数据的计算机系统。因此,下面给出多种说明这些方面的具体实施方式。
[21]定义:下面给出了本说明书中使用的某些术语的定义。其它术语的定义可参见美国能源部科学办公室主持的人类基因组计划(http://www.ornl.gov/sci/techresources/Human Genome/glossary/)所提供的术语表。实践本发明时,使用许多分子生物学、微生物学和重组DNA技术的常规技术。这些技术是众所周知的并阐述于,例如:Current Protocols inMolecular Biology,第I-III卷,Ausubel编著(1997);Sambrook等人,Molecular Cloning:A Laboratory Manual,第二版(Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY,1989);DNA Cloning:APractical Approach,第I和II卷,Glover D编著(1985);OligonucleotideSynthesis,Gait编著(1984);Nucleic Acid Hybridization,Hames & Higgins编著(1985);Transcription and Translation,Hames & Higgins编著(1984);Animal Cell Culture,Freshney编著(1986);Immobilized Cells and Enzymes(IRL Press,1986);Perbal,A Practical Guide to Molecular Cloning;Methods in Enzymol.系列(Academic Press,Inc.,1984);Gene TransferVectors for Mammalian Cells,Miller & Calos编著(Cold Spring HarborLaboratory,NY,1987);和Methods in Enzymology,第154和155卷,分别由Wu和Grossman,以及Wu等人编著。
[22]本文所使用的术语“等位基因”指在特定染色体位置(基因座)处特定形式的基因或DNA序列。
[23]本文所使用的术语“抗体”包括但并不限于多克隆抗体、单克隆抗体、人源化或嵌合抗体及足以使抗体片段与蛋白质结合的生物功能性抗体片段。
[24]本文所使用的术语“临床反应”指下列的任一种或全部:反应的定量测量,无反应和不利反应(即副作用)。
[25]本文所使用的术语“临床试验”指任何设计用于收集对特定治疗的反应的临床数据的研究,且包括但不限于I期、II期、III期临床试验。使用标准方法定义患者群并招纳受试者。
[26]本文所使用的术语:化合物的“有效量”是足以实现期望的治疗和/或预防效果的量,例如,导致预防或减少与所治疗疾病相关的症状的量,所治疗疾病例如是与本发明鉴定的AD相关突变多核苷酸及突变多肽有关的疾病。施用于受试者的化合物的量要取决于疾病的类型和严重性以及个体的特征,如健康状况、年龄、性别、体重和药物耐受性。其还取决于疾病程度、严重性和类型。熟练技术人员将能够根据这些和其它因素确定适合的剂量。通常,足以达到治疗或预防效果的本发明化合物的有效量范围为从每天每千克体重约0.000001mg至每天每千克体重约10000mg。优选的剂量范围为每天每千克体重约0.0001mg至每天每千克体重约100mg。本发明化合物也可以彼此组合施用,或与一种或多种其它治疗化合物组合施用。
[27]本文所使用的术语“表达”包括但不限于下述一种或多种:基因转录为前体mRNA;前体mRNA经剪接和其它加工以产生成熟mRNA;mRNA稳定性;成熟mRNA翻译成蛋白质(包括密码子使用和tRNA的有效性);和(若正确的表达和功能需要的话)翻译产物的糖基化和/或其它修饰。
[28]本文所使用的术语“基因”指包含调控RNA产物生物合成的所有信息的DNA片段,包括启动子、外显子、内含子和其它调控表达的非翻译区。
[29]本文所使用的术语“基因型”指个体同源染色体对基因座上的一或多个多态性位点处发现的核苷酸对的不定型5’-3’序列。在此使用的基因型包括全基因型和/或亚基因型。
[30]本文所使用的术语“基因座”指与基因或物理或表型特征对应的染色体或DNA分子上的位置。
[31]本文所使用的术语“AD相关突变的调节剂”指与无AD相关突变的调节剂时AD相关突变多肽的表达水平或生物活性水平相比,改变(例如增加或降低)AD相关突变多肽的表达水平或生物活性水平的任何化合物。AD相关突变的调节剂可以是小分子、多肽、碳水化合物、脂类、核苷酸或其组合。AD相关突变的调节剂可以是有机化合物或无机化合物。
[32]本文所使用的术语“突变体”指由于突变造成的野生型的任何可遗传变异,如单核苷酸多态性(“SNP”)。在说明书通篇,术语“突变体”可与术语“标记”、“生物标记”、“靶标”互换使用。
[33]本文所使用的术语“医学状况”包括但不限于表现为需要治疗的一种或多种身体和/或心理症状的任何医学状况或疾病,还包括过去和最近鉴定的疾病或其它紊乱。
[34]本文所使用的术语“核苷酸对”指见于个体两拷贝染色体多态性位点上的核苷酸。
[35]本文所使用的术语“多态性位点”指在群体内的基因座中在该处发现至少两个可改变序列的位置,其中最频繁出现的有不超过99%的频率。
[36]本文所使用的术语“分型的”指当适用于基因座中两个或多个多态性位点的核苷酸对序列时,存在于基因座单拷贝上的那些多态性位点的核苷酸组合是已知的。
[37]本文所使用的术语“多态性”指个体中或者遗传变异中DNA序列的差异。认为在超过1%的群体中发生的遗传变异对于遗传连锁分析是有用的多态性。序列变体可以远大于1%的频率出现,如5%或10%或更大。同时,该术语还可用于指在个体多态性位点中观察到的序列变异。多态性包括核苷酸取代、插入、缺失和微卫星并且可能(但不必须)导致基因表达和蛋白质功能上可检测的差异。
[38]本文所使用的术语“多核苷酸”指任何RNA或DNA,其可以是修饰或非修饰的RNA或DNA。多核苷酸包括但不限于单链和双链DNA、为单链和双链区混合物的DNA、单链和双链RNA、为单链和双链区混合物的RNA、包括DNA和RNA的杂交分子(可能是单链,更普遍为双链,或者单链和双链区的混合物)。另外,多核苷酸指包括RNA或DNA或同时有RNA或DNA的三链区。术语多核苷酸还包括包含一或多个修饰碱基的DNA或RNA和为稳定性或其它原因骨架经修饰的DNA或RNA。
[39]本文所使用的术语“多肽”指包括由肽键或修饰的肽键(即肽键等构物)使之互相连接的两个或多个氨基酸的任意多肽。多肽既指短链也指长链,短链通常指肽、糖肽、寡肽,长链通常指蛋白质。多肽可包含除了20个基因编码氨基酸以外的氨基酸。多肽包括通过如翻译后加工的天然加工、或用本领域公知技术进行化学修饰的修饰氨基酸序列。这些修饰已在基础教科书和更为详尽的专题论文、大量研究文献中详细介绍。
[40]本文所使用的术语“单核苷酸多态性(SNP)”指在基因组中单一位置上的核苷酸可变性,其中在人群中两个可变碱基以可观的频率(即>1%)发生。SNP可发生在基因内或基因组的基因间区域内。本发明的SNP探针是与SNP及其侧翼核酸序列互补的寡核苷酸。
[41]本文所使用的术语“受试者”优选哺乳动物如人类,但也可以是动物,例如家养动物(如狗、猫等),农场动物(如牛、绵羊、猪、马等)及实验室动物(如猕猴、大鼠、小鼠、豚鼠等)。
[42]本文所使用的向受试者或患者施用试剂或药物包括自体施用和由他人施用。还应理解所述医学状况治疗或预防的多种模式旨在意味着“实质上的”,其包括了完全也包括并非完全的治疗或预防,其中得到了一些生物或医学相关的结果。
[43]预测性医学。一方面,本发明涉及预测性医学领域,其中出于预后(预测)目的使用诊断检测法、预后检测法、药物遗传学和监测临床试验,因而预防性地诊断和治疗受试者。因此,本发明的一方面涉及用于确定来自样品(例如血液、血清、细胞、组织)中的生物标记蛋白质和/或核酸表达(例如MUT-1至MUT-25蛋白质或者核酸)的诊断检测法,因而确定受试者是否有可能从MCI转化为AD。
[44]如在下文详细描述的,本发明的另一个方面涉及监测临床试验中试剂(例如药物、化合物)对生物标记的表达或者活性的影响。
[45]检测本发明生物标记蛋白质或者基因在样品中存在与否的示例性方法包括:从检测受试者获得样品,并将该样品与能够检测该蛋白质或者编码该生物标记蛋白质的核酸(例如mRNA、基因组DNA)的化合物或者试剂接触,以便在该样品中检测出生物标记蛋白质或者核酸的存在。用于检测相应于本发明生物标记基因或者蛋白质的mRNA或基因组DNA的优选试剂是能够杂交本发明mRNA或基因组DNA的经标记的核酸探针。用于本发明诊断检测中的合适的探针是本文公开的探针。
[46]用于检测生物标记蛋白质的优选的试剂是能够结合生物标记蛋白质的抗体,优选具有可检测标记的抗体。抗体可以是多克隆抗体,或者更优选单克隆抗体。可以使用完整的抗体,或者其片段(例如Fab或F(ab′)2)。涉及探针或者抗体的术语“标记的”旨在包括通过偶联(即物理连接)可检测物质于探针或者抗体上的探针或者抗体的直接标记,以及探针或者抗体的间接标记,即通过与另一个直接标记的试剂反应而实现。间接标记的实例包括使用荧光标记的二抗检测一抗,以及用生物素末端标记的DNA探针,以便其可由荧光标记的链霉抗生物素检测。
[47]术语“样品”旨在包括分离自受试者的组织、细胞和生物流体,以及存在于受试者体内的组织、细胞和流体。更确切地说,本发明的检测方法可以用于体内以及体外检测样品中的生物标记mRNA、蛋白质或者基因组DNA。例如体外检测生物标记mRNA的技术包括Northern杂交和原位杂交。体外检测生物标记蛋白质的技术包括酶联免疫吸附检测法(ELISA)、Western印迹、免疫沉淀和免疫荧光法。体外用于检测生物标记基因组DNA的技术包括Southern杂交。此外,用于体内检测生物标记蛋白质的技术包括将标记的抗生物标记抗体导入受试者。例如,可以使用放射性生物标记标记抗体,其在受试者体内的存在和定位可以通过标准的成像技术进行检测。
[48]一个实施方式中,样品含有来自测试受试者的蛋白质分子。作为选择,样品可以含有来自测试受试者的mRNA分子或者来自测试受试者的基因组DNA分子。优选的样品是通过常规方法从受试者分离的血清样品。
[49]方法还包括从对照受试者获得对照样品(例如来自显示无AD征兆的非痴呆受试者的样品),将对照样品与能够检测生物标记蛋白质、mRNA或者基因组DNA的化合物或者试剂接触,以便在样品中检测出生物标记蛋白质、mRNA或者基因组DNA的存在,以及比较对照样品中生物标记蛋白质、mRNA或者基因组DNA的存在和检测样品中生物标记蛋白质、mRNA或基因组DNA的存在。
[50]本文公开的诊断方法还可以用于鉴定具有与异常生物标记表达或者活性(即具有本发明一种或者多种AD相关突变/基因)相关的疾病或者紊乱的患者或者有发展成上述病症风险的患者。本文使用的术语“异常”包括偏离野生型生物标记表达或者活性的生物标记的表达或者活性。异常表达或者活性包括增加的或者降低的表达或者活性,以及未遵循野生型发育的表达模式或者亚细胞的表达模式的表达或者活性。例如,异常的生物标记表达或者活性旨在包括其中在生物标记基因中的突变引起生物标记基因低表达或者过表达的情况,以及其中这样的突变导致无功能生物标记蛋白质或者以非野生型方式发挥功能的蛋白质(例如不与生物标记配体相互作用的蛋白质,或者与非生物标记蛋白质配体相互作用的蛋白质)的情形。
[51]另外,本文公开的预后检测法可以用于确定受试者是否可以施用试剂(例如激动剂、拮抗剂、肽模拟物、蛋白质、肽、核酸、小分子或者其它药物候选物)以降低痴呆,例如AD的发生或者进展的风险。因此,本发明提供用于确定受试者是否可以使用试剂有效治疗疾病的方法,该疾病与本发明的一种或者多种AD相关突变/基因的增加或降低的基因表达或者活性相关。
[52]监测试剂(例如药物)对基因表达或者活性的影响不仅可以应用于基础药物筛选,而且可以用于临床试验。例如,如本文公开的筛选方法确定的试剂调节(即增加或者减少)生物标记基因表达、蛋白质水平或者上调活性的效力可以通过检测使用试剂治疗期间分子指征以及分子指征的任何变化而在表现阿尔茨海默病或者MCI相关症状的受试者的临床试验中进行监测。
[53]例如,但非限制,可以鉴定在细胞中通过使用调节基因活性的试剂(例如化合物、药物或者小分子)治疗而受到调节的基因及其编码的蛋白质。临床试验中,分离细胞并且制备RNA并分析暗示与痴呆相关的基因的表达水平。基因表达的水平(例如基因表达谱)可以通过如本文公开的Northern印迹分析或者RT-PCR方法定量检测,或者作为选择,通过本文公开的方法之一测量蛋白质产物的量而定量检测。这样,基因表达谱可以用作指示细胞对试剂生理学反应的分子指征。因此,可以在使用该试剂治疗受试者之前和治疗期间的多个时间点确定此反应的状态。
[54]优选的实施方式中,本发明提供监测使用试剂(例如激动剂、拮抗剂、肽模拟物、蛋白质、肽、核酸、小分子或者通过本文公开的筛选方法鉴定的其它药物候选物)治疗受试者的效力的方法,包括下述步骤(i)在施用试剂前获得来自受试者的给药前样品;(ii)检测给药前样品中基因或者基因组合,由该基因编码的蛋白质,mRNA或者基因组DNA的表达水平;(iii)从受试者获得一个或者多个给药后样品;(iv)确定给药后样品中生物标记蛋白质、mRNA或者基因组DNA的表达或者活性水平;(v)比较给药前样品中生物标记蛋白质、mRNA或者基因组DNA和给药后样品中的基因或者基因组合、该基因编码的蛋白质、mRNA或者基因组DNA的表达或活性水平;(vi)因此更改对受试者的试剂的施用。例如,可以期望增加施用的试剂以将基因的表达或者活性降低到较低的水平,即增加试剂的效力以防止AD的发生或者进展。作为选择,可以期望降低施用的试剂以将生物标记的表达或者活性降低到比检测到的水平低的水平,即降低试剂的效力,例如以避免中毒。根据此实施方式,可以将基因表达或者活性用作试剂效力的指示物,即使是在缺少可观察到的表型反应的情况中。
[55]基因序列变异的鉴定和表在。由于其普遍和广泛分布的特点,SNP有潜力成为定位人类疾病相关基因的重要工具。如参见Wang等人,Science280:1077-1082(1998)。虽然任何一个变体可能作用甚微,但越来越清楚的是许多常见疾病的发展风险和用于治疗这些病况的药物的代谢实质上受潜在的基因组变异的影响。
[56]由于多态性的存在,将SNP称为“等位基因的”SNP,物种的一些成员可以具有未突变序列(即原始等位基因),而其它成员可具有突变序列(即变体或突变等位基因)。
[57]SNP与特定表型间的相关性并不必然地表示或需要该SNP是该表型的致因。相反,这种关联可能仅仅归因于SNP和那些实际造成给定表型的遗传因子之间的基因组邻近性,以致SNP和所述遗传因子紧密连锁。换句话说,SNP可能与“真正的”功能性变体连锁不平衡(“LD”)。在位于基因组两个不同位置上的等位基因的关联比预期的高时,则存在LD(又名等位基因关联)。因此SNP由于其与引起特定表型的突变邻近可以做为有价值的标记。
[58]在描述本发明多态性位点时,为了方便以基因的正义链作为参照。然而,正如熟练的技术人员所理解的,包含基因的核酸分子可能是互补的双链分子,因而述及正义链上特定位点也指与之互补的反义链上的相应位点。也就是说,可参照任一链上相同的多态性位点,同时可以将寡核苷酸设计为和含有多态性位点的靶片段处的任一链特异杂交。因此,本发明还包括与此处所述基因组变体的正义链互补的多核苷酸单链。
[59]SNP的鉴定和特征描述。很多不同技术可以用来鉴定和表征SNP,包括单链构象多态性(SSCP)分析,变性高效液相色谱(DHPLC)进行的异源双链体分析及直接DNA测序和计算机方法。Shi等人,Clin.Chem.47:164-172(2001)。公共数据库中有很多序列信息。
[60]目前最常用的SNP分型方法包括杂交,引物延伸和切割法。每种方法都必须和适当的检测系统连接。检测技术包括荧光偏振(Chan等人,Genome Res.9:492-499(1999))、焦磷酸盐释放的发光检测(焦磷酸测序)(Ahmadiian等人,Anal.Biochem.280:103-10(2000))、基于荧光共振能量转移(FRET)的切割测试、DHPLC和质谱分析(Shi,Clin.Chem.47:164-172(2001);美国专利No.6,300,076 Bl)。美国专利No.6,297,018和No.6,300,063公开了其它检测和表征SNP的方法。
[61]多态性也可以用商品化产品来检测,如INVADERTM技术(获自Third Wave Technologies Inc.Madison,Wisconsin,USA)。这一检测中,当特定上游“侵入者”寡核苷酸和部分重叠的下游探针结合于互补DNA模板时,它们共同形成了特殊的结构。这个结构由裂解酶识别并在特定位点剪切,导致探针寡核苷酸5’侧翼的释放。这个片段继而作为涉及包含在反应混合物中的合成二级靶标和二级荧光标记信号探针的“侵入者”寡核苷酸。也见Ryan D等人,Molecular Diagnosis 4(2):135-144(1999)和Lyamichev V等人,Nature Biotechnology 17:292-296(1999),也参见美国专利No.5,846,717和6,001,567。
[62]也可用错配检测技术来确定多态性,其包括但不限于用核糖探针的RNA酶保护方法(Winter等人,Proc.Natl.Acad.Sci USA 82:7575(1985);Meyers等人,Science 230:1242(1985))和识别核酸错配的蛋白质,如E.coli mutS蛋白质(Modrich P,Ann Rev Genet 25:229-253(1991))。或者,变体等位基因可以通过单链构象多态性(SSCP)分析(Orita等人,Genomics 5:874-879(1989);Humphries等人,出自Molecular Diagnosis of Genetic Diseases,R.Elles编著,第321-340页(1996))或变性梯度凝胶电泳(DGGE)(Wartell等人,Nucl Acids.Res.18:2699-2706(1990);Sheffield等人,Proc.Natl.Acad.Sci.USA 86:232-236(1989))进行鉴定。聚合酶介导的引物延伸法也可用于鉴定多态性。几种此类方法已经在专利和科学文献中描述,并包括“遗传比特分析”方法(WO 92/15712)和连接酶/聚合酶介导的遗传比特分析(美国专利No.5,679,524)。相关方法公开在WO 91/02087、WO 90/09455、WO 95/17676和美国专利No.5,302,509和5,945,283中。如美国专利No.5,605,798所述,含有多态性的延伸引物可通过质谱检测。另一种引物延伸方法是等位基因特异性PCR(Ruafio等人,Nucl.Acids.Res.17:8392(1989);Ruafio等人,Nucl Acids.Res.19:6877-6882(1991);WO 93/22456;Turki等人,J.Clin.Invest.95:1635-1641(1995))。另外,可通过用PCT专利申请WO 89/10414所述的等位基因特异性引物组同时扩增多个核酸区来研究多个多态性位点。
[63]寡核苷酸的单元型分型和基因型分型。本发明提供对个体基因进行单元型分型和/或基因型分型的方法和组合物。如本文所使用,术语“基因型”和“单元型”指分别包含核苷酸对或核苷酸的基因型和单元型,所述核苷酸对或核苷酸出现在一或多个此处描述的多态性位点处,并也可以任选地包括出现在基因上一或多个其它多态性位点的核苷酸对或核苷酸。其它多态性位点可能是现在已知晓的多态性位点或随后将发现的位点。
[64]本发明的组合物包含寡核苷酸探针和引物,该寡核苷酸探针和引物设计为与一个或多个包含有或邻近于多态性位点的靶区域特异杂交。本发明的寡核苷酸组合物在个体基因的基因型分型和/或单元型分型的方法中是有用的。用于在本文描述的多态性位点建立个体的基因型或单元型的方法和组合物可用于研究多态性在受蛋白质表达和功能影响的疾病病因中的作用、研究靶向药物的效力、预测个体对受蛋白质表达和功能影响的疾病的易感性和预测个体对靶向基因产物的药物的反应性。
[65]本发明的基因型分型寡核苷酸可固定于或合成于如微芯片、珠、玻璃片等的固体表面上。参见例如,WO 98/20020和WO 98/20019。
[66]基因型分型寡核苷酸可与位于此处鉴定的多态性位点之一的下游一或多个核苷酸处的靶区域杂交。该寡核苷酸对检测此处所述多态性之一的聚合酶介导的引物延伸方法是有用的,因此这种基因型分型寡核苷酸在这里也称为“引物-延伸寡核苷酸”。
[67]本发明的直接基因型分型方法。本发明的基因型分型方法可包括从个体中分离包括目的基因或其片段的两个拷贝的核酸混合物,并确定在这两个拷贝中一或多个多态性位点上核苷酸对的特征。熟练的技术人员很容易理解,个体中基因的两个“拷贝”可能是相同的等位基因,或者可能是不同的等位基因。优选的具体实施方式中,基因型分型方法包括鉴定每个多态性位点处核苷酸对的特征。通常,核酸混合物分离自从个体获得的生物样品,比如血样或组织样品。合适的组织样品包括全血、精液、唾液、泪液、尿液、排泄物、汗液、口腔涂片、皮肤和毛发。
[68]本发明的直接单元型分型方法。本发明的单元型分型方法可包括从个体分离仅包含目的基因或其片段两个拷贝之一的核酸分子,并确定在该拷贝中一或多个多态性位点处的核苷酸的特征。直接单元型分型方法包括,如CLASPER SystemTM技术(美国专利No.5,866,404)或等位基因特异性长程PCR(Michalotos-Beloin等人,Nucl.Acids.Res.24:4841-4843(1996)。可使用任何能够分离基因或片段的两个拷贝的方法分离核酸。如本领域技术人员所容易理解的,任何单个克隆将只提供个体中两个基因拷贝之一的单元型信息。一个实施方式中,通过鉴定个体中存在基因的每个拷贝中一或多个多态性位点处分型的核苷酸序列来确定个体的单元型对。优选实施方式中,单元型分型方法包括鉴定基因每个拷贝中每个多态性位点处分型的核苷酸序列。
[69]在基因型分型和单元型分型方法中,可通过直接从基因或其片段的一或两个拷贝扩增包含有多态性位点的靶区域,并通过常规手段对扩增区域测序来确定核苷酸(或核苷酸对)在多态性位点处的特征。个体基因的基因型或单元型也可通过用含有一个或两个基因拷贝的核酸样品与核酸阵列或子阵列杂交来确定,例如公开的专利申请WO 95/11995所述。
[70]使用与靶多态性处于连锁不平衡的多态性位点的间接基因型分型方法。另外,出现在本发明任何多态性位点的等位基因的特征可通过对与那些目的位点处于连锁不平衡的其它多态性位点进行基因型分型而间接地鉴定。如上所述,如果在一个位点处存在的特异变体暗示在第二个位点处另一变体的存在,那么将这两个位点称为是连锁不平衡的。(Stevens JC,Mol.Diag.4:309-317(1999))。与本发明多态性位点处于连锁不平衡的多态性位点可位于同一基因区中或其它的基因组区中。
[71]靶基因区的扩增。可使用任何寡核苷酸-定向扩增方法,包括但不限于聚合酶链式反应(PCR)(美国专利No.4,965,188)、连接酶链式反应(LCR)(Barany等人,Proc.Natl.Acad.Sci USA 88:189-193(1991);公开的PCT专利申请WO 90/01069),和寡核苷酸连接试验(OLA)(Landegren等人,Science 241:1077-1080(1988))扩增靶基因区。在这些方法中用作引物或探针的寡核苷酸应该与包含或邻近于多态性位点的核酸区特异性杂交。通常,寡核苷酸长度介于10-35个核苷酸,优选地介于15-30个,最优选寡核苷酸长度介于20-25个核苷酸。寡核苷酸的精确长度将取决于熟练的技术人员通常考虑和使用的许多因素。
[72]其它已知的核酸扩增方法可用来扩增靶区域,包括基于转录的扩增体系(美国专利No.5,130,238;EP 329,822;美国专利No.5,169,766;公开的PCT专利申请WO 89/06700)和等温法(Walker等人,Proc.Natl.Acad.Sci USA.89:392-396(1992))。
[73]等位基因特异性寡核苷酸与靶基因的杂交。靶区域中的多态性可在扩增前或后用本领域已知的几种基于杂交的方法之一来检测。通常利用等位基因特异的寡核苷酸进行此类方法。等位基因特异的寡核苷酸可用作不同的标记探针对,其中该探针对的一个成员显示出完全匹配于靶序列的一个变体,而另外一个成员显示出完全匹配于不同变体。一些实施方式中,可使用一套等位基因-特异的寡核苷酸或寡核苷酸对一次检测一个以上的多态性位点。优选地,当与每个待检测的多态性位点杂交时,该套的成员互相之间的溶解温度在5℃内,更优选地在2℃内。
[74]可通过两者都在溶液中进行等位基因特异的寡核苷酸与靶多核苷酸杂交,或也可在寡核苷酸或靶多核苷酸以共价或非共价的方式结合于固相支持物而进行该杂交。例如,通过抗体-抗原相互作用、poly-L-Lys、链霉亲和素或亲和素-生物素、盐桥、疏水作用、化学连接、UV交联、烘烤等可介导附着。等位基因特异寡核苷酸可直接在固相支持物上合成或在合成后附着于固相支持物。适合用于本发明检测方法的固相支持物包括由硅、玻璃、塑料、纸等制成的基质,其可塑形成例如孔(如96孔板)、玻片、薄片、膜、纤维、芯片、盘和珠。可处理、涂覆、或衍生固相支持物以促进等位基因特异的寡核苷酸或靶核酸的固定。
[75]鉴定群体的基因型和单元型并将其与性状相关联。本发明提供鉴定人群基因型或单元型的频率的方法。该方法包括鉴定群体中每个成员存在的基因的基因型或单元型,其中所述基因型或单元型包括该基因中一个或多个遗传多态性位点处检测到的核苷酸对或核苷酸,并计算群体中发现的基因型或单元型的频率。该群体可以是参照群体,家族群体,同性群体,群体组,或性状群体(如展示出目的性状如医学状况或对治疗有反应的个体群组)。
[76]本发明的另一方面,将参照群体中发现的基因型和/或单元型的频率数据用于鉴定性状和基因型或单元型之间关联性的方法中。该性状可以是任何可检测的表型,包括但不限于对疾病的易感性或对治疗的反应。该方法包括在参照群体中获得目的基因型或单元型的频率数据,并将该数据与展现出该性状的群体的基因型或单元型频率数据进行比较。可使用上述方法之一通过对群体中每一个体进行基因型分型或单元型分型而获得参照和性状群体之一或两者的频率数据。性状群体的单元型可直接地或者可选地通过如上所述的预测基因型或单元型的方法而确定。
[77]通过访问之前确定的书面或电子形式的频率数据获得参照和/或性状群体的频率数据。例如,该频率数据可存在于计算机可及的数据库中。一旦获取了频率数据,就可以比较参照和性状群体中的目的基因型或单元型的频率。
[78]当分析多态性时,可进行计算来校正可能偶然发现的显著相关性。对于用于本发明的统计方法,参见Statistical Methods in Biology,第三版,Bailey NTJ,(Cambridge Univ.Press,1997);Waterman MS,Introduction to Computational Biology(CRC Press,2000)和Bioinformatics,Baxevanis AD & Ouellette BFF编著(John Wiley & Sons,Inc.,2001)。
[79]另一个实施方式中,检查不同组别的单元型频率数据以确定它们是否与哈迪-温伯格平衡一致(D.L.Hartl等,Principles of PopulationGenomics,第三版(Sinauer Associates,Sunderland,MA,1997)。
[80]另一个实施方式中,使用带有Bonferroni校正的标准ANOVA检测或多次模拟基因型表型相关性并计算显著性数值的bootstrap方法进行统计分析。ANOVA用于检测关于反应变量是否由可以被测量的一个或多个性状或变量所造成或与之关联的假说。LD Fisher和G vanBelle,Biostatistics:A Methodology for the Health Sciences,第10章(Wiley-lnterscience,New York,1993)。
[81]在预测单元型对的一个实施方式中,分析包含如下设定步骤:第一,将可能的单元型对中的每一个与参照群中的单元型对比较。通常,在参照群中只有一个单元型对与可能的单元型对匹配,并且将该单元型对分配给该个体。偶尔地,对于个体,仅有一个表现在参照单元型对中的单元型与个体可能的单元型对一致,而这种情况下,将包含这一已知单元型和从可能的单元型对中减去已知单元型得到的新单元型的单元型对分配给个体。
[82]另一个实施方式中,与目的基因型或单元型处于连锁不平衡的、可检测到的基因型或单元型可用作替代标记。当给定基因的特定基因型或单元型在也显示潜在代替标记基因型的群体中的频率比在参照群体中的频率高时,则表明该特定基因型或者单元型与另一基因型处于连锁不平衡。如果这种频率是统计学上显著的,那么该标记基因型是该基因型或单元型的预测,并且可以用作替代标记。
[83]另一发现单元型内容与临床反应之间相关性的方法使用基于错误-最小化的最优化算法(其中之一是遗传算法)的预测模型。参见RJudson,“Genetic Algorithms and Their Uses in Chemistry”出自Reviewsin Computational Chemistry,第十章,KB Lipkowitz & DB Boyd编著(VCHPublishers,New York,1997)第1-73页。模拟退火(Press等人,NumericalRecipes in C:The Art of Scientific Computing,第十章(CambridgeUniversity Press,Cambridge,1992)、神经网络(E Rich & K Knight,Artificial Intelligenc,第二版,第十章(McGraw-Hill,New York,1991)、标准梯度下降法(Press等人,见上文第十章),也可以使用其它整体或局部优化方法(见Judson的讨论,见上文)。
[84]将受试者基因型或单元型与治疗应答相关联。优选实施方式中,性状为疾病的易感性、疾病严重性、疾病阶段或药物反应。这些方法适用于开发用于所有药物遗传学(其中基因型和治疗结果间有潜在相关性)应用的诊断检测、治疗性治疗,包括功效测定、药物动力学测定和副作用测定。
[85]另一优选实施方式中,目的性状是患者表现出的对一些治疗性治疗的临床反应,如,对药物靶向的反应或对医学状况治疗性治疗的反应。
[86]为推导出治疗的临床反应与基因型或单元型之间的相关性,从接受治疗的个体群(即下文中的“临床群”)所表现的临床反应中获得基因型或单元型的数据。这一临床数据可通过分析已经在进行的临床试验的结果和/或通过设计并进行一或多种新临床试验而获得。
[87]包括在临床群中的个体通常按存在的目的医学状况而分级。这种潜在患者的分级可以使用标准的体检或者一项或多项实验室测试来进行。或者,当单元型对与疾病易感性或严重性之间有强相关时,可以使用单元型分型进行患者的分级。
[88]将目的治疗性治疗施用于试验群体中的每个个体,并且使用一或多种预定的标准测定每个个体对治疗的反应。预期在很多情况下,试验群体将表现出一系列的反应,且调查者将选择由多种反应组成的应答组的数目(如低、中、高)。另外,在施用治疗之前或之后,对试验群体中每个个体的基因进行基因型分型和/或单元型分型。
[89l然后分析这些结果以确定多态性组间临床反应中任何观察到的变异是否是统计学上显著的。可以用到的统计分析方法描述在L.D.Fisher& G.vanBelle,Biostatistics :A Methodology for the Health Sciences(Wiley-lnterscience,New York,1993)。这个分析也包括关于基因中的哪些多态性位点对表型的差异贡献最为显著的回归计算。
[90]在获得了临床和多态性数据后,创建个体反应与基因型或单元型内容之间的相关性。可通过许多方式产生相关性。一种方法中,个体根据其基因表型或单元型(或单元型对)而分组(也指作为多态性组),然后计算出每个多态性组中的成员所表现出的临床反应的平均值和标准偏差。
[91]从上面描述的分析中,预测临床反应作为基因型或单元型内容的函数的熟练技术人员可容易地建立数学模型。对临床反应和基因的基因型或单元型(或单元型对)之间的关联性的鉴定可作为设计诊断方法的基础,从而确定能或不能对治疗产生应答,或者将以较低水平应答从而可能需要更多治疗(即较大剂量的药物)的那些个体。诊断方法可采用多种方式中的一种:如,直接DNA测试(即对基因中一或多个多态性位点的基因型分型或单元型分型)、血清学检验或者体检测定。唯一的条件是在诊断检测结果与潜在基因型或单元型之间有良好的相关性。一个优选实施方式中,这一诊断方法使用上述预测性的单元型分型方法。
[92]将受试者归属于基因型组。本领域技术人员将理解,进行此归属决定将包括一定程度的不确定性。因此,将对照组水平的标准偏差用于做出概率确定并且本发明的方法可应用于很大范围基于概率的基因型组决定。因此,例如但不限于在一个实施方式中,如果测量到的基因表达产物水平落在任何对照组平均值的2.5标准偏差之内,那么该个体可归属于该基因型组。另一个实施方式中,如果测量到的基因表达产物水平落在任何对照组平均值的2.0标准偏差之内,那么该个体可以归属于该基因型组。又一个实施方式中,如果测量到的基因表达产物水平落在任何对照组平均值的1.5标准偏差之内,那么该个体可以归属于该基因型组。再一个实施方式中,如果测量到的基因表达产物水平落在任何对照组平均值的1.0或更低标准偏差之内,那么该个体可以归属于该基因型组。
[93]因此该方法允许以不同程度的概率确定应将特定受试者归入哪个组,而此类基因型群组的归属随之能够确定应将该个体归入何种风险范畴。
[94]临床反应与基因型或单倍型间的相关性。为了推导治疗的临床反应以及基因型或单元型之间的相关性,需要获得由接受治疗的个体群(下文中称作“临床群”)表现出的临床反应数据。可通过分析已经进行的临床试验的结果获得该临床数据和/或可通过设计并进行一或多种新临床试验获得临床数据。
[95]不同基因型或者单元型组中如此测定的基因表达产物的标准对照水平将随之与给定患者基因表达产物的测定水平进行比较。该基因表达产物可以是与特定基因型组相关的特征mRNA或该基因型或者单元型组的多肽基因表达产物。随后将根据测定水平与给定组的对照水平之间的相似程度将患者分类或归属于特定基因型组或单元型组。
[96]用于存储或显示多态性数据的计算机系统。本发明还提供用于存储和显示测定的基因多态性数据的计算机系统。该计算机系统包括计算机处理单元、显示器和含有多态性数据的数据库。多态性数据包括在参照群中对给定基因所鉴定的多态性、基因型和单元型。优选实施方式中,该计算机系统能够产生示出根据其进化关系组织的单元型的显示。计算机可执行任何或所有实践本发明方法所涉及的分析和数学运算。此外,计算机可执行产生显示在显示器上的视图(或影像)的程序,使用者借此可以互动观看并分析大量与基因及其基因组变异相关的信息,包括染色体定位、基因结构、以及基因家族、基因表达数据、多态性数据、遗传序列数据和临床群体数据(例如一个或多个群体的种族地理起源、临床反应、基因型和单元型的数据)。本文所述多态性数据可作为相关数据库的一部分而存储(例如Oracle数据库的一个进程或一组ASCII静态文档)。这些多态性数据可存储在计算机硬盘上或可例如存储在CD-ROM上或在一或多个计算机可读取的其它存储装置上。例如,数据可存储在通过网络与计算机通讯的一或多个数据库中。
[97]基于核酸的诊断。本发明提供用于根据受试者的遗传变异类型将其分类的SNP探针。本发明的SNP探针是寡核苷酸,其在传统等位基因识别检测中辨别SNP。某些优选的实施方式中,根据本发明这一方面的寡核苷酸与SNP的一个等位基因及其侧翼核酸序列互补,但与该SNP的任何其它等位基因及其侧翼核酸序列不互补。本发明这一实施方式的寡核苷酸可以以多种方式在SNP之间进行辨别区分。例如,在严谨杂交条件下,合适长度的寡核苷酸将与一个SNP杂交而不与任何其它的SNP杂交。可使用放射性标记或荧光分子标签来标记寡核苷酸。或者,合适长度的寡核苷酸能用作PCR引物,其中3’末端的核苷酸与含有SNP的一个等位基因而非任何其它等位基因互补。在此实施方式中,PCR扩增的有或无决定了该SNP的单元型。
[98]本发明的基因组和cDNA片段包括至少一个本文鉴定的多态性位点,长度至少为10个核苷酸,且范围可长至全长基因。优选地,本发明片段的长度为100至3000个核苷酸,且更优选长度为200至2000个核苷酸,并最优选长度为500至1000个核苷酸。
[99]本发明的试剂盒。本发明提供了用于对个体基因进行单元型分型和/或基因型分型的核酸和多肽检测试剂盒。该试剂盒出于对个体分类的目的而用于对个体进行分类。特别地,本发明包括检测生物样品中相应于本发明标记的多肽或核酸的存在的试剂盒,该生物样品例如是任何体液,包括但不限于血清、血浆、淋巴、囊液、尿液、大便、脑脊髓液、腹水或血液,还包括身体组织的活检样品。例如,试剂盒可以包括能够检测生物样品中相应于本发明标记的多肽或编码多肽的mRNA的标记的化合物或试剂,以及用于测定样品中多肽或mRNA量的工具,例如与多肽结合的抗体,或与编码多肽的DNA或mRNA结合的寡核苷酸探针。试剂盒还可以包括用于解释使用该试剂盒所获得的结果的说明书。
[100]另一个实施方式中,本发明提供包括至少两种包装在单独容器中的基因型分型寡核苷酸的试剂盒。该试剂盒也可含有其它组分,例如包装在单独容器中的杂交缓冲液(其中寡核苷酸用作探针)。或者,当寡核苷酸将用于扩增靶区域时,试剂盒可含有包装在单独容器中的聚合酶以及优化的用于该聚合酶介导的引物延伸的反应缓冲液,例如在PCR的情况中。优选的实施方式中,该试剂盒可还包括DNA样品收集工具。
[101]对于基于抗体的试剂盒,该试剂盒可以包括,例如(1)第一抗体,例如附着在固相支持物上,其结合对应于本发明标记的多肽;和任选地,(2)不同的第二抗体,其与该多肽或第一抗体结合且缀合有可检测标记。
[102]对于基于寡核苷酸的试剂盒,该试剂盒可以包括,例如(1)寡核苷酸,例如带有可检测标记的寡核苷酸,其与本发明标记所对应的多肽的编码核酸序列杂交;或(2)用于扩增对应于本发明标记的核酸分子的引物对。
[103]试剂盒也可以包括,例如缓冲剂、防腐剂或蛋白质稳定剂。试剂盒还可以包括用于检测可检测标记的必需组分,例如酶或底物。该试剂盒也可以含有一个对照样品或一系列对照样品,其能够进行测定并与检测样品相比较。试剂盒中的每个组分可以封闭在单个容器中且所有多个容器可以和用于解释使用该试剂盒进行检测的结果的说明书一起放在单个包装内。
[104]本发明的核酸序列。一方面,本发明包括一或多个分离的多核苷酸。本发明还包括其等位变体,也就是该分离多核苷酸的天然发生的可变形式,其编码与该多核苷酸所编码的那些多肽相同、同源或相关的突变多肽。或者,非天然发生的变体可由本领域已知的诱变技术或直接合成技术生产。
[105]因此,能够在低严谨性下与编码本发明突变多肽的任何核酸序列杂交的核酸序列也认为属于本发明的范围。标准分子生物克隆教科书中充分表征了标准严谨性条件。参见例如Molecular Cloning A LaboratoryManual第二版,Sambrook,Fritsch,& Maniatis编著(Cold Spring HarborLaboratory Press,1989);DNA Cloning,第一卷和第二卷,D.N.Glover编著(1985);Oligonucleotide Synthesis,M.J.Gait编著(1984);NucleicAcid Hybridization,B.D.Hames & S.J.Higgins编著(1984)。
[106]重组表达载体。本发明的另一个方面包括含有一种或者多种编码突变多肽的核酸序列的载体。在实践本发明的过程中,使用许多分子生物学、微生物学和重组DNA中的常规技术。这些技术是众所周知的并阐述于,例如:Current Protocols in Molecular Biology,第I-III卷,Ausubel编著(1997);Sambrook等人,Molecular Cloning:A Laboratory Manual,第二版(Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,1989);DNA Cloning:A Practical Approach,第I和II卷,Glover D编著(1985);Oligonucleotide Synthesis,Gait编著(1984);Nucleic AcidHybridization,Hames & Higgins编著(1985);Transcription andTranslation,Hames & Higgins编著(1984);Animal Cell Culture,Freshney编著(1986);Immobilized Cells and Enzymes(IRL Press,1986);Perbal,A Practical Guide to Molecular Cloning;Methods in Enzymol.系列(Academic Press,Inc.,1984);Gene Transfer Vectors for MammalianCells,Miller & Calos编著(Cold Spring Harbor Laboratory,NY,1987);和Methods in Enzymology,第154和155卷,分别由Wu & Grossman,以及Wu等人编著。
[107]为了重组表达本发明的一种或者多种多肽,通过本领域熟知的重组DNA技术将含有编码多肽的核苷酸序列的全部或者部分的核酸插入到合适的克隆载体中或者表达载体(即含有所插入的多肽编码序列转录和翻译必需元件的载体)中。
[108]说明书中“质粒”和“载体”可以互换使用,因为质粒是最常使用的载体形式。然而,本发明旨在包括发挥相同功能的其它形式的表达载体,其在技术上并非质粒,例如病毒载体(例如复制缺陷型反转录病毒、腺病毒和腺相关病毒)。此类病毒载体允许感染受试者并在该受试者中表达化合物。Becker等人,Meth.Cell Biol.43:161-89(1994)。重组表达载体中,“有效连接”旨在指目的核苷酸序列以允许表达该核苷酸序列(例如在体内和体外转录/翻译系统中或者在已导入载体的宿主细胞中表达)的方式连接到调控序列上。术语“调控序列”旨在包含启动子、增强子和其它表达调控元件(例如多聚腺苷酸化信号)。这样的调控序列例如公开在Goeddel,Gene Expression Technology:Methods In Enzymology(AcademicPress,San Diego,Calif.,1990)中。调控序列包含在许多类型的宿主细胞中指导核苷酸序列组成型表达的那些和仅在某些宿主细胞中指导核苷酸序列表达的那些(例如组织特异性调控序列)。本领域技术人员将理解表达载体的设计取决于这样的因素,例如待转化的宿主细胞的选择、期望的多肽的表达水平等等。本发明的表达载体可以被导入宿主细胞,从而生产由本文公开的核酸编码的多肽或肽,包括融合多肽(例如突变多肽和源自突变的融合多肽等等)。
[109]表达多肽的宿主细胞。本发明的另一方面涉及表达多肽的宿主细胞,其含有编码本发明一种或者多种突变多肽的核酸。术语“宿主细胞”和“重组宿主细胞”可以在本文互换使用。应理解这样的术语不仅指特定的受试者细胞还指该细胞的后代或者潜在后代。因为由于突变或者环境影响,在连续世代中可以发生某些修饰,事实上这样的后代与亲本细胞不完全相同,但是仍然包括在本发明使用的术语的范围中。宿主细胞可以是任何原核或者真核细胞Sambrook等人Molecular Cloning:A LaboratoryManual,第二版(Cold Spring Harbor Laboratory Press,Cold SpringHarbor,New York,1989)。
[110]可以通过常规的转化或者转染技术将载体DNA导入原核或者真核细胞中。如本文使用的,术语“转化”和“转染”旨在指多种本领域认可的用于将外源核酸(例如DNA)导入宿主细胞中的技术,包括磷酸钙或者氯化钙共沉淀、DEAE葡聚糖介导的转染、脂质转染法或者电穿孔法。转化或者转染宿主细胞的合适方法可以在Sambrook等人MolecularCloning:A Laboratory Manual,第二版(Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,New York,1989)和其它实验指南中找到。本领域已知诸如电穿孔、粒子轰击、磷酸钙共沉淀和病毒转导等用于将DNA导入细胞的方法,因此方法的选择依赖于熟练操作者的能力和喜好。
[111]为了制备本发明的重组细胞,可以载体的形式将期望的同源基因(isogene)导入宿主细胞,以便该同源基因仍然保留染色体外的形式。在这种情况下,细胞将从该染色体外的位置表达该基因。优选的实施方式中,同源基因以与存在于细胞中的内源基因重组的方式被导入细胞中。用来导入用于重组和用于染色体外维持的基因的载体是本领域已知的,并且任何合适的载体或者载体构建体可用于本发明。
[112]本发明的重组表达载体可以设计为在原核细胞或者真核细胞中表达突变多肽。例如,可以在诸如大肠杆菌(Escherichia coli)等细菌细胞中、昆虫细胞(使用杆状病毒表达载体)中、诸如酵母菌的真菌细胞中或哺乳动物细胞状表达突变多肽。合适的宿主细胞进一步在Goeddel,GeneExpression Technology:Methods In Enzymology(Academic Press,SanDiego,Calif.,1990)中讨论。
[113]在原核细胞中表达多肽最通常是在大肠杆菌中实现,该大肠杆菌包括含有指导融合或者非融合多肽表达的组成型或者诱导型启动子的载体。典型的融合表达载体包括pGEX(Pharmacia Biotech Inc;Smith &Johnson,Gene 67:3140(1988)),pMAL(New England Biolabs,Beverly,Mass.,USA)和pRIT5(Pharmacia,Piscataway,N.J.,USA),其分别将谷胱苷肽S转移酶(GST)、麦芽糖E结合多肽或者多肽A与靶标重组多肽融合。适当的可诱导型非融合大肠杆菌表达载体的实例包括pTrc(Amrann等人,Gene 69:301315(1988))和pET 11d(Studier等人,GeneExpression Technology:Methods In Enzymology(Academic Press,SanDiego,Calif.,1990)第60-89页。其他的策略公开于Gottesman,GeneExpression Technology:Methods In Enzymology(Academic Press,SanDiego,Calif.,1990)第119-128页和Wada,等人,Nucl.Acids Res.20:21112118(1992))。
[114]多肽表达载体可以是酵母菌表达载体。用于在酿酒酵母(Saccharomyces cerivisae)中表达的载体的实例包括pYepSec1(Baldari等人,EMBO J.6:229234(1987))、pMFa(Kurjan & Herskowitz,Cell 30:933-943(1982))、pJRY88(Schultz等人,Gene 54:113 123(1987))、pYES2(InVitrogen Corporation,San Diego,Calif.USA)和picZ(InVitrogenCorp,San Diego,Calif.,USA)。作为选择,突变多肽可以在使用杆状病毒表达载体的昆虫细胞中表达。在培养的昆虫细胞(例如SF9细胞)中可用于表达多肽的杆状病毒载体包括pAc系列(Smith等人,Mol.Cell.Biol.3:2156 2165(1983))和pVL序列(Lucklow & Summers,Virology 170:31 39(1989))。可以使用哺乳动物表达载体例如pCDM8(Seed,Nature 329:842 846(1987))或pMT2PC(Kaufman等人,EMBO J.6:187 195(1987))在哺乳动物细胞中表达本发明的核酸。用于原核细胞和真核细胞的其它合适的表达系统参见例如Sambrook等人,Molecular Cloning:A LaboratoryManual,第16和17章,第二版(Cold Spring Harbor Laboratory Press,Cold Spring Harbor,New York,1989)。组织特异性和调节发育的调控元件是本领域已知的。关于使用反义基因调控基因表达的讨论参见例如Weintraub等人,“Antisense RNA as a molecular tool for genetic analysis”,Trends in Genetics 1(1)(1986)。
[115]包含本发明化合物的宿主细胞,例如培养的原核细胞或者真核细胞,可以用于生产(即表达)重组突变多肽。重组多肽的纯化是本领域熟知的,并且包括离子交换纯化技术或者亲和纯化技术,例如使用化合物的抗体的亲和纯化。
[116]转基因动物。表达本发明不同的基因的重组生物,即转基因动物通过使用本领域已知的标准方法而制备。可以通过多种本领域技术人员已知的方法制备携带本发明构建体的转基因动物。参见例如美国专利No.5,610,053和“The Introduction of Foreign Genes into Mice”及其引用的参考文献,出自Recombinant DNA,J.D.Watson,M.Gilman,J.Witkowski & M.Zoller编著(W.H.Freeman and Company,New York),第254-272页。稳定表达人同源基因并生产人蛋白质的转基因动物可以用作生物模型,用于研究涉及异常表达和/或活性的疾病,以及用于筛选和检测降低这些疾病的症状或者作用的多种候选药物、化合物和治疗方案。
[117]基因表达水平的表征。检测和测量mRNA水平(即基因转录水平)和多肽基因表达产物水平(即基因翻译水平)的方法是本领域众所周知的且包括使用核苷酸微阵列和涉及质谱和/或抗体检测和定量技术的多肽检测方法。也参见Tom Strachan & Andrew Read,Human MolecularGenetics,第二版(John Wiley和Sons,Inc.Publication,New York,1999))。
[118]靶基因转录的测定。可能以多种方式进行生物样品(例如个体组织或体液)中基因表达产物的水平的测定。术语“生物样品”旨在包括分离自受试者的组织、细胞、生物液体和其分离物,以及存在于受试者中的组织、细胞和液体。许多表达检测方法使用分离的RNA。对于体外方法,可以使用任何不选择性抗mRNA分离的RNA分离技术从细胞中纯化RNA。参见例如Ausubel等人编著,Curr.Prot.Mol.Biol.(John Wiley &Sons,New York,1987-1999)。
[119]一个实施方式中,确定靶基因的mRNA表达产物水平。测定特定mRNA水平的方法是本领域众所周知的且包括Northern印迹分析、反转录PCR和实时定量PCR或通过与寡核苷酸阵列或微阵列杂交。其它更多优选实施方式中,可通过测定体液或组织样品(包括但不限于血液或血清)中基因蛋白质或多肽表达产物的水平进行表达水平的测定。可以使用本领域技术人员公知的技术容易地加工大量组织样品,例如,美国专利No.4,843,155的一步RNA分离方法。
[120]分离的mRNA可以用于杂交或扩增检测,其包括但不限于Southern或Northern分析、PCR分析和探针阵列。检测mRNA水平的一个优选诊断方法包括将分离的mRNA与核酸分子(探针)进行接触,该核酸分子可以与由待检测基因所编码的mRNA杂交。核酸探针可以是例如全长cDNA或其一部分,例如长度至少为7、15、30、50、100、250或500个核苷酸且足以在严谨条件下与编码本发明标记的mRNA或基因组DNA特异性杂交的寡核苷酸。本文描述了其它适合用于本发明诊断检测法的探针。mRNA与探针的杂交表明所讨论标记得以表达。
[121]一种形式,将探针固定到固体表面且mRNA与该探针接触,例如,在Affymetrix基因芯片阵列(Affymetrix,Calif.USA)中的探针。熟练技术人员很容易改造已知的mRNA检测法使之适用于检测由本发明标记编码的mRNA水平。
[122]测定样品中与本发明标记相应的mRNA水平的替代方法包括核酸扩增的方法,例如通过RT-PCR(美国专利No.4,683,202提出的实验性实施方式);连接酶链式反应(Barany等人,Proc.Natl.Acad.Sci.USA88:189-193(1991));自主持续序列复制(Guatelli等人,Proc.Natl.Acad.Sci.USA 87:1874-1878(1990));转录扩增体系(Kwoh等人,Proc.Natl.Acad.Sci.USA 86:1173-1177(1989));Q-Beta复制酶(Lizardi等人,Biol.Technology 6:1197(1988));滚环式复制(美国专利No.5,854,033);或任何其它核酸扩增方法,接着使用本领域技术人员公知的技术检测扩增的分子。当此类核酸分子以很低数目存在时,这些检测方案特别适用于检测核酸分子。如本文所使用的“扩增引物”定义为可以与基因(分别为正链和负链,或反之亦然)的5’或3’区退火且在两者间包括短的区域的核酸分子对。通常,扩增引物长度为约10-30个核苷酸并位于长度大约50-200核苷酸区域的两侧。
[123]实时定量PCR(RT-PCR)是评估基因(例如本发明的基因,例如含有目的SNP和多态性的那些)表达水平的一种方法。RT-PCR检测法利用RNA反转录酶催化从RNA链(包括mRNA链)合成DNA链。可特异性检测并定量产生的DNA并且这一方法可用于确定特定物种mRNA的水平。做这些的一种方法是
(PE Applied Biosystems,FosterCity,Calif,USA)以及在PCR反应期间利用AMPLITAQ GOLDTM DNA聚合酶的5’核酸酶活性来切割特异形式的探针。这被称作TAQMANTM探针。参见Luthra等人,Am.J.Pathol.153:63-68(1998);Kuimelis等人,Nucl.Acids Symp.Ser.37:255-256(1997);和Mullah等人,Nucl AcidsRes.26(4):1026-1031(1998))。反应期间,探针的切割将报告染料和淬灭染料分离,导致报告荧光的增加。通过监控报告染料荧光的增加直接检测PCR产物的累积。Heid等人,Genome Res.6(6):986-994(1996))。核酸靶标的起始拷贝数越高,越快地观察到荧光的显著增加。参见Gibson,Heid & Williams等人,Genome Res.6:995-1001(1996)。
[124]测量细胞转录状态的其他技术产生用于电泳分析的有限复杂度的限制性片段库,如组合限制性双酶切和分型引物的方法(见例如EP 0534858 A1),或具有最接近于指定mRNA末端位点的选择限制性片段的方法(见例如Prashar & Weissman,Proc.Natl.Acad.Sci.USA 93(2)659-663(1996))。
[125]其它方法统计学上取样cDNA库,例如通过对多个cDNA的每一个测序足够的碱基(例如20-50个碱基)来鉴定每个cDNA,或通过测序短标签(例如9-10个碱基),其在相对于限定的mRNA末端途径类型已知位置上产生。参见例如Velculescu,Science 270:484-487(1995)。定量样品中的cDNA水平并且使用本领域技术人员公知的标准统计学方法确定每个cDNA的平均值、平均偏差和标准变差(Norman T.J.Bailey,Statistical Methods In Biology,第三版(Cambridge University Press,1995))。
[126]多肽的检测:免疫学检测方法。可以通过可检测标记的或可以随后标记的探针检测本发明基因编码的蛋白质的表达。对于探针或抗体而言的术语“标记的”旨在包括通过偶联(即物理连接)可检测的物质到探针或抗体而直接标记探针或抗体,以及通过与直接标记的另一试剂反应而间接标记探针或抗体。间接标记的实例包括使用荧光标记的二抗检测一抗以及用生物素末端标记的DNA探针以便其可以用荧光标记的链霉亲和素进行检测。通常,探针是识别所表达蛋白质的抗体。可以使用多种形式来确定样品是否含有结合给定抗体的靶蛋白质。用于检测本发明的靶多肽的免疫检测法包括但不限于,例如,点印迹、Western印迹、蛋白质芯片、竞争性和非竞争性蛋白质结合检测法、酶联免疫吸附检测法(ELISA)、免疫组化、荧光活化细胞分选(FACS)和其它常用的及科学和专利文献中广泛描述的方法,以及许多商业使用的方法。熟练技术人员可以很容易利用已知的蛋白质/抗体检测方法确定细胞是否表达本发明的标记和该特定多肽表达产物在血液或其身体组织中的相对浓度。可以使用本领域技术人员公知的技术分离来自个体的蛋白质。所用的蛋白质分离方法可以是例如Harlow & Lane,Antibodies:A Laboratory Manual(Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY,1988))中所述的那些。
[127]为了生产由所公开基因之一编码的蛋白质的抗体,可通过注射多肽或其部分免疫多种宿主动物。该宿主动物可包括但不限于,兔、小鼠和大鼠。根据宿主种类,可使用多种佐剂来提高免疫反应,该佐剂包括但不限于(完全和不完全)福氏佐剂、矿物胶(例如氢氧化铝);表面活性剂例如溶血卵磷脂、普流罗尼克(pluronic)多元醇、聚阴离子、肽、油乳剂、匙孔血蓝蛋白和二硝基苯酚以及潜在可用的人类佐剂,例如卡介苗(BCG)和短小棒状杆菌(Corynebacterium parvum)。
[128]单克隆抗体(mAb)是特定抗原的均质抗体群,其可以利用供用于通过连续细胞系培养生产抗体分子的任何技术来获得。这些包括但不限于Kohler & Milstein,Nature 256:495-497(1975)的杂交瘤技术;和美国专利No.4,376,110;Kosbor等人,Immunol.Today 4:72(1983);Cole等人,Proc.Natl.Acad.Sci USA 80:2026-2030(1983)的人B细胞杂交瘤技术以及Cole等人,Monoclonal Antibodies and Cancer Therapy(Alan R.Liss,Inc.,1985)第77-96页的EBV杂交瘤技术。
[129]此外,可以使用开发用于生产“嵌合抗体”的技术(参见Morrison等人,Proc.Natl.Acad.Sci.USA 81:6851-6855(1984);Neuberger等人,Nature 312:604-608(1984);和Takeda等人,Nature 314:452-454(1985)),该嵌合抗体通过剪接具有合适抗原特异性的小鼠抗体分子的基因与具有合适生物学活性的人抗体分子基因而产生。嵌合抗体是这样的分子,其中不同部分来源于不同的动物物种,例如具有鼠单抗来源的可变区或高变区和人免疫球蛋白恒定区的那些抗体。
[130]或者,描述用于生产单链抗体的技术(美国专利No.4,946,778;Bird,Science 242:423-426(1988);Huston等人,Proc.Natl.Acad.Sci.USA 85:5879-5883(1988);和Ward等人,Nature 334:544-546(1989))可以改造而适于生产差异表达基因的单链抗体。
[131]用于生产“人源化抗体”的技术可改造而适于生产蛋白质、其片段或衍生物的抗体。该技术描述于美国专利No.5,932,448;5,693,762;5,693,761;5,585,089;5,530,101;5,569,825;5,625,126;5,633,425;5,789,650;5,661,016和5,770,429。
[132]可以在诸如Western印迹或免疫荧光技术等方法中使用抗体或抗体片段来检测表达的蛋白质。此种应用中,通常优选将抗体或蛋白质固定到固相支持物上。适合的固相支持物或载体包括任何能结合抗原或抗体的支持物。熟知的支持物或载体包括玻璃、聚苯乙烯、聚丙烯、聚乙烯、葡聚糖、尼龙、淀粉酶、天然和改良的纤维素、聚丙烯酰胺、辉长岩和磁铁石。
[133]易于检测的有用方法是夹心ELISA,其存在多种变通形式,所有都意欲用于本发明的方法和检测中。如本文所使用,“夹心检测”旨在包括基于两点技术的所有变通形式。免疫荧光和EIA技术都是本领域充分确立的技术。然而,也可使用其它报告分子,例如放射性同位素、化学发光或生物发光分子。如何改变程序以适合所需的应用对熟练技术人员来讲是显而易见的。
[134]通过构建微阵列可以进行蛋白质的全基因组(即蛋白质组)监控,微阵列中的结合位点包括,对多种由细胞基因组编码的蛋白质物质特异的固定抗体,优选单克隆抗体。优选地,对于编码蛋白质的大部分,或至少对于与检测或确认目的生物网络模型相关的那些蛋白质存在抗体。如上所指出,用于制造单克隆抗体的方法是众所周知的。参见例如Harlow &Lane,Antibodies:A Laboratory Manual(Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,New York,1988))。优选的实施方式中,针对基于细胞的基因组序列设计的合成肽片段产生单克隆抗体。用该抗体阵列,来自细胞的蛋白质与该阵列接触并且用本领域已知的检测法测定其结合。
[135]多肽检测:二维凝胶电泳。二维凝胶电泳是本领域众所周知的且通常包括沿第一方向的等电聚焦接着是沿第二方向的SDS-PAGE电泳。参见例如Hames等人,Gel Electrophoresis of Proteins:A Practical Approach(IRL Press,New York,1990);Shevchenko等人,Proc.Natl.Acad.Sci.USA 93:14440-14445(1996);Sagliocco等人,Yeast 12:1519-1533(1996)和Lander,Science 274:536-539(1996)。
[136]多肽检测:质谱分析。可以使用质谱分析技术(MS)确定靶多肽的特征以及表达水平。基于MS的分析方法学可用于分析分离的靶多肽以及分析生物样品中的靶多肽。用于分析靶多肽的MS形式包括电离(I)技术,例如但不限于基质辅助激光解吸(MALDI)、连续或脉冲电喷射电离(ESI)和相关方法,例如离子喷射或热喷射,以及massive cluster impact(MCI)。该离子源可以与检测形式相匹配,包括线性或非线性反射式飞行时间(TOF)、单极或多极、单或多个扇形磁场、傅里叶变换离子回旋共振(FTICR)、离子阱及其组合,例如离子阱/TOF。对于电离,可以使用多种基质/波长组合(例如基质辅助激光解吸(MALDI))或溶剂组合(例如ESI)。
[137]对于质谱(MS)分析,可以将靶多肽溶解在适合的溶液或试剂系统。溶液或试剂系统的选择(例如有机或无机溶剂)将取决于靶多肽的性质和所执行的MS类型,以及基于本领域众所周知的方法。例如对于MALDI参见Vorm等人,Anal.Chem.61:3281(1994);和对于ESI见Valaskovic等人,Anal.Chem.67:3802(1995)。肽的MS也描述于例如PCT国际申请No.WO 93/24834和美国专利No.5,792,664。选择使气化过程中引入的能量分解靶多肽的风险最小化的溶剂。例如,通过在基质中包埋样品可以实现靶多肽分解风险的降低。适合的基质可以是有机化合物,例如糖(例如戊糖或己糖)或多糖例如纤维素。该化合物热分解为CO2和H2O以便不形成可以导致化学反应的残留物。基质也可以是无机化合物,例如铵的硝酸盐,其分解后基本上无残留。这些和其它溶剂的使用是本领域技术人员已知的。参见例如美国专利No.5,062,935。电喷雾MS描述于:Fenn等人,J.Phys.Chem.88:4451-4459(1984);和PCT申请No.WO 90/14148;且当前的应用在综述中进行总结。参见Smith等人,Anal.Chem.62:882-89(1990);和Ardrey,Spectroscopy 4:10-18(1992)。
[138]由MS确定的靶多肽的质量可以与相应的已知多肽质量相比较。例如,当靶多肽是突变蛋白质时,相应的已知多肽可以是相应的非突变蛋白质,例如野生型蛋白质。用ESI确定飞摩尔量样品的分子量是很精确的,因为存在多个离子峰,其全部可以用于质量计算。例如已经使用ESl MS(Valaskovic等人,Science 273:1199-1202(1996))和MALDI MS(Li等人,J.Am.Chem.Soc.118:1662-1663(1996))检测了阿托摩尔水平的蛋白质。
[139]基质辅助激光解吸(MALDI)。生物样品(例如体液或组织样品)中的靶蛋白质水平可通过多种质谱(MS)方法进行测定,包括但不限于本领域已知的那些技术,如基质辅助激光解吸/离子化、飞行时间质谱(MALDI-TOF-MS)及下面进一步详细说明的表面增强的激光解吸/离子化、飞行时间质谱(SELDI-TOF-MS)。进行MALDI的方法是本领域众所周知的。参见例如Juhasz等人,Analysis,Anal.Chem.68:941-946(1996),并且也参见例如美国专利No.5,777,325;5,742,049;5,654,545;5,641,959;5,654,545和5,760,393描述了MALDI和延时提取方法。众多用于改善分辨率的方法也是已知的。Hillenkamp等人,Biological Mass Spectrometry,Burlingame & McCloskey编(Elsevier Science Publ.,Amsterdam,1990)第49-60页描述了MALDI-TOF-MS。
[140]可以使用多种用质谱检测标记的方法。参见Bordeaux MassSpectrometry Conference Report,Hillenkamp编著,第354-362页(1988);Bordeaux Mass Spectrometry Conference Report,Karas & Hillenkamp编著,第416-417页(1988);Karas & Hillenkamp,Anal.Chem.60:2299-2301(1988);和Karas等人,Biomed Environ.Mass Spectrum 18:841-843(1989)。激光束在TOF-MS中的应用示于,例如美国专利No.4,694,167;4,686,366;4,295,046和5,045,694,其在此通过整体引用作为参考。其它MS技术允许高分子量生物聚合物的成功挥发,而没有片段化,且使得可以通过质谱分析多种生物大分子。
[141]表面增强激光解吸/离子化(SELDI)。使用其它利用新型MS探针元件组成的技术,该组成具有允许探针元件活跃参与捕获和锚定特异分析物的表面,描述为亲和质谱(AMS)。参见SELDI专利U.S.专利No.5,719,060;5,894,063;6,020,208;6,027,942;6,124,137和美国专利申请No.U.S.2003/0003465。已设计几类新MS探针元件,具有针对亲和捕获(SEAC)的增强的表面。参见Hutchens & Yip,Rapid Commun.MassSpectrom.7:576-580(1993)。通过探究对于蛋白质表面结构和生物特异分子识别哪些是已知的,已将SEAC探针元件成功用于检索并锁定不同类的生物聚合物,尤其是蛋白质。MS探针元件表面的固定化亲和捕捉装置(即SEAC)决定了分析物在探针表面的位置和亲和性(特异性),从而随后的MS分析过程是有效的。
[142]通常的SELDI类型中有三个单独的亚类:(1)表面增强的整齐解吸(SEND),其中探针元件表面(即样品呈递工具)设计为含有能量吸收分子(EAM)而非“基质”,从而促进直接(整齐)加入到该表面的分析物的解吸/电离。(2)SEAC,其中探针元素表面(即样品呈递工具)设计为含有化学明确的和/或生物明确的亲和捕捉装置,以通过多种机制(主要是非共价的)促进分析物特异性或非特异性附着或吸附(所谓的锚定或锁定)到探针表面。(3)表面增强的光敏附着和释放(SEPAR),其中探针元件表面(即样品呈递工具)设计或修饰为含有一或多种化学明确的交联分子,用作共价锚定装置。决定SEPAR样品呈递工具(即探针元件表面)和分析物(例如蛋白质)之间光敏分子附着点的类型和数量的化学特异性可涉及分析物中许多不同残基或化学结构中的任何一或多种(例如在蛋白质和肽的情况下,His、Lys、Arg、Tyr、Phe和Cys残基)。
[143]使多肽官能化。也可以修饰目的多肽以促进与固相支持物的结合。也可以将化学的或者物理的部分在适当的位置合并入多肽。例如,可以通过添加适当的官能团到多肽的羧基端或者氨基端,或者到肽内部的氨基酸上(例如添加到反应的侧链或者肽骨架上)而修饰目的多肽。然而,技术人员将明白这样的修饰(例如合并入生物素部分)可能影响特定试剂与多肽特异性相互作用的能力,并因此将在选择如何最好修饰目的多肽时考虑此因素(如果相关)。通常存在于多肽中的天然氨基酸也可以含有适合将多肽结合到固相支持物上的官能团。例如可以使用存在于多肽中的半胱氨酸残基通过二硫键将多肽连接到含有巯基的支持物上,例如具有半胱氨酸残基结合于其上的支持物。两个氨基酸之间可以形成的其它键包括但不限于,例如两个羊毛硫氨酸残基之间的单硫键,羊毛硫氨酸是可以合并入多肽的非天然氨基酸;酸性氨基酸和碱性氨基酸的侧链之间通过转酰胺基反应形成的内酰胺键,例如Glu的γ羧基(或者Asp的α羧基)与Lys的氨基之间形成的内酰胺键;或者例如通过Ser的羟基和Glu的羧基(或者Asp的α羧基)之间通过交联产生的内酯键。因此,可以修饰固相支持物以使其含有所需的氨基酸残基,例如Glu残基,含有Ser残基,特别是位于N末端或者C末端的Ser残基的多肽可以通过形成内酯键而结合到固相支持物上。不必将支持物修饰为含有特定的氨基酸(例如期望与多肽中的Ser形成内酯样键的Glu),但是取而代之的可以将支持物修饰为含有易接近的羧基的支持物,因此提供对应于Glu的α羧基的功能。
[144]硫羟反应(thiol-reactive )的官能团。硫羟反应的官能团特别用于将多肽结合到固相支持物上。硫羟反应的官能团是能够迅速与亲核的硫羟部分反应以产生共价键(例如二硫键或者硫醚键)的化学基团。多种硫羟反应的官能团是本领域已知的,包括例如卤代乙酰基类,例如碘代乙酰基;重氮酮类;环氧酮类,α和β不饱和羰基类,例如α烯酮类和β烯酮类和其它反应性的迈克尔受体类,例如马来酰亚胺;酰基卤类;苄基卤类等等。参见Greene & Wuts,Protective Groups in Organic Synthesis,第二版(John Wiley & Sons,1991)。
[145]如果需要,可以使用光可裂解(photocleavable)的保护基团封闭硫羟基,该保护基团然后可以被选择性地例如通过光刻法裂解,以提供用于固定目的多肽的表面活化的部分。光可裂解保护基团是本领域已知的(参见例如公开的国际PCT申请WO 92/10092,以及McCray等人,Ann.Rev.Biophys.Biophys.Chem.18:239-270(1989)),并且可以使用例如光刻法的膜通过照射表面选定的面积而选择性地去封闭。
[146]连接体。目的多肽可以直接通过连接体而连接到支持物上。可以使用任何本领域技术人员已知的适合将肽或者氨基酸直接或者通过间隔区而连接到支持物上的连接体。例如,可以通过可变的间隔区的方式将多肽连接到诸如珠子的支持物上。连接体包括Rink酰胺连接体(参见例如Rink,Tetrahedron Lett.28:3787(1976));三苯甲基氯连接体(参见例如Leznoff,Ace Chem.Res.11:327(1978))和Merrifield连接体(参见例如Bodansky等人,Peptide Synthesis,第二版(Academic Press,New York,1976))。例如已知三苯甲基连接体。参见例如美国专利No.5,410,068和5,612,474。也已知氨基三苯甲基连接体。参见例如美国专利No.5,198,531。其它连接体包括可以合并入融合蛋白质并且在宿主细胞中表达的那些。这样的连接体可以是选定的氨基酸、酶底物或者任何合适的肽。连接体可以例如通过当分离核酸时选择合适的引物而制备。作为备选,其可以通过翻译后修饰目的蛋白质而添加。适合将肽化学连接到支持物上的连接体包括游离反应基团(例如胺和硫羟基)之间的二硫键、硫醚键、受阻二硫键和共价键。
[147]可裂解连接体。连接体可以提供可逆的连接,以便其在给定条件下被裂解。特别地,使用选择性可裂解连接体,包括光可裂解连接体(参见美国专利No.5,643,722),酸可裂解连接体(参见Fattom等人,Infect.Immun.60:584-589(1992))、酸敏感连接体(参见
等人,J.Biol.Chem.266:4309-4314(1991))和热敏感连接体。连接可以是例如巯基乙醇或者二硫代赤醇化学可裂解的二硫键、光可裂解的生物素/链霉生物素连接、三苯甲基醚基团的异二功能衍生物,其可以通过暴露于酸环境或者在MS环境下而被裂解(参见
等人,Tetrahedron Lett.31:7095(1990))、levulinyl介导的连接,其在几乎中性的条件下使用
/乙酸盐缓冲液可以被裂解、精氨酸-精氨酸或者赖氨酸-赖氨酸键,任何之一可以被内肽酶(例如胰蛋白酶)裂解、可以被焦磷酸酶裂解的焦磷酸键、或者核糖核苷酸键,其可以使用核糖核酸酶或者通过暴露于碱环境而被裂解。光敏交联连接体,例如3-氨基-(2-硝基苯基)丙酸可以用作从固相支持物上裂解多肽的手段。Brown等人,Mol Divers,第4-12页(1995);Rothschild等人,Nucl.Acids.Res.24:351-66(1996)和美国专利No.5,643,722。其它连接体包括可以被核酶和其它RNA酶裂解的RNA连接体,以及诸如来自人IgG1恒定区的不同结构域(例如CH1、CH2和CH3)的连接体,参见Batra等人,Mol Immunol30:379-396(1993)。
[148]本文还意欲包括任何连接体的组合。例如,在MS条件下可裂解的连接体(例如甲硅烷基连接或者光可裂解连接)可以与在这些条件下不裂解但是可以在其它条件下裂解的连接体(例如抗生物素生物素连接)组合。酸敏感的连接体是特别有用的用于质谱,特别是用于MALDI-TOF的化学可裂解连接体,因为在靶多肽一旦添加3-HPA基质溶液的条件中该酸敏感键被裂解。酸敏感键可以作为单独的连接体基团(例如酸敏感三苯甲基)而引入,或者可以通过使用二异丙基甲硅烷基引入一个或者多个甲硅烷基桥而合并入合成的连接体中,因此在多肽和固相支持物间形成二异丙基甲硅烷基连接。使用温和的酸条件,例如1.5%三氟乙酸(TFA)或者3-HPA/1%TFA MALDI-TOF基质溶液可以裂解二异丙基甲硅烷基连接。制备二异丙基甲硅烷基连接及其类似物的方法是本领域熟知的。例如参见Saha等人,J.Org.Chem.58:7827-7831(1993)。
[149]使用插头工具(Pin Tool)以固定多肽。使用插头工具将目的多肽固定在固相支持物上可以特别地有利。插头工具包含本文公开的那些或者其它本领域已知的。参见例如美国系列申请08/786,988和08/787,639以及国际PCT申请WO 98/20166。
[150]阵列(例如4×4阵列)中的插头工具可以适用于含有目的多肽的孔。在插头工具具有附着于每个插头顶部的官能团,或者具有固相支持物(例如附着于每个插头的官能化的珠子或者顺磁珠子)的情况下,孔中的多肽可以被捕获(1pmol的容量)。捕获步骤中,可以保持插头运动(垂直运动,1-2mm的距离)以增加捕获的效率。在诸如体外转录的反应在孔中进行的情况下,插头的运动可以增加反应的效率。而且通过向插头工具施加电场而可以获得固定。当将电压施加于插头工具时,多肽将视其静电荷而定附着到阳极或者阴极上。
[151]为了更高的特异性,可以修饰插头工具(有或者无电压)以使其具有缀合于其上的对目的多肽有特异性的试剂,以便插头仅结合目的多肽。例如插头可以具有附着的镍离子,以便仅含有聚组氨酸序列的多肽可以被结合。相似地,插头可以具有附着于其上的特异抗靶多肽的抗体,或者该抗体附着于珠子上,该珠子反过来附着于插头上,以便插头仅结合含有由该抗体识别的表位的靶多肽。
[152]捕获的多肽可以通过多种方法进行分析,包括例如光谱测定技术,例如UV/VIS,IR,荧光,化学发光,NMR分光术,MS或者其它本领域已知的方法,或者这些方法的组合。如果条件阻碍直接分析捕获的多肽,可以将多肽在使得样品浓度的优势不丧失的条件下从插头上释放或者转移。因此,可以使用最小体积的洗脱液将多肽从插头上移出,且不损失任何样品。在多肽结合于附着在插头的珠子上时,可以将含有多肽的珠子从插头上移出并从珠子上直接进行测量。
[153]插头工具可以用于将目的多肽以空间可定位的方式在阵列上固定。这样的空间可定位或者预定位阵列在多种操作(包括例如质量控制和氨基酸测序诊断学)中有用。美国申请08/786,988和08/787,639和国际PCT申请WO 98/20166公开的插头工具是连续且平行分配的工具,其可用于产生位于固相支持物表面上的多肽的多元阵列。阵列表面可以是具有珠子的平面,或者经过几何学改变以包括可以含有珠子的孔。另外,MS几何学也可以调整以容纳插头工具装置。
[154]生物状态的其它方面。本发明的多种实施方式中,可以测定生物活性状态的方面,或混合的方面,以便获得药物或途径反应。可以测量与细胞功能的特征相关的蛋白质活性,且本发明的实施方式可以基于此类测定。通过任何适合表征特定活性的功能的、生化或物理方法进行活性测定。当活性涉及化学转变时,可以将细胞蛋白质与天然底物接触,并测定转变率。当活性涉及多体单元的结合(例如活化的DNA结合复合物与DNA的结合)时,可以测定结合蛋白质的量或该结合的次生结果,例如转录的mRNA的量。另外,当只知道功能活性时(例如在细胞周期调控中),可以观察该功能的表现。不管已知的还是测定的,蛋白质活性的改变形成由本发明方法分析的反应数据。替代的且非限制性实施方式中,可由细胞生物状态的混合方面形成反应数据。可以由例如某些mRNA丰度变化,某些蛋白质丰度变化和某些蛋白质活性的改变组建反应数据。
[155]呈现下述实施例以便更全面地说明本发明优选的实施方式。这些实施例不应被理解为限制如所附权利要求所限定的本发明的范围。
实施例1.在来自InDDEx试验的患者中进行AFFYMETRIX 100K基因组扫描
[156]导言和概述。本实施例的目的是描述鉴定本发明25个AD相关突变的遗传关联性研究。在过去的两年,针对遗传关联性研究的基因组范围内的分析才仅仅变得可能。使用艾斯能延迟被诊断为阿尔茨海默病的调查研究(InDDex;ENA713B IA07)临床试验追踪罹患MCI的患者,并且向患者施用或者不同剂量的艾斯能(利凡斯的明)或者安慰剂,并追踪其向AD的转化。该试验任选地具有DNA收集的内容,其中收集到442份样品。
[157]为了鉴定促使MCI向AD转化的遗传变异,来自InDDex(ENA713B IA07)临床试验的420份患者样品使用Haploview的病例对照试验在单一位点和推定的单元型区段上使用Affymetrix 100K基因分型平台进行基因分型并且进行全基因组关联性分析。表型结果是从MCI向AD转化或者不转化。本研究公平、基因组范围内的方法导致鉴定出之前未与AD关联的突变和基因区。
[158]用于诊断遗忘性MCI的常用标准包括但不限于例如记忆缺陷;必要的正常判断、知觉和推理能力;日常生活中大多数正常的活动;相比较于其它相似年龄和教育背景的人在记忆测试中降低的性能;以及没有痴呆。遗忘性(记忆相关)MCI的风险因素与阿尔茨海默病的那些相同,并且包括家族历史、遗传学和年龄。MCI不同于AD,AD是足以干扰日常功能的严重的智力和社会能力的丧失。痴呆发生于患有阿尔茨海默病的人群,因为健康大脑组织退化,引起记忆和心智能力的稳定减退。
[159]方法。从收集的血样提取DNA。如针对100K平台的Affymetrix方法所述进行靶标的制备、与微阵列的杂交、扫描和获取数据。最终,442份DNA样品中的420份成功进行了基因型分型,由于DNA质量或者数量的原因,放弃其它的22份样品。
[160]基因型数据从芯片杂交装置中的GCOS上载给BMD服务器,并以Haploview.ped输入格式,以及匹配的.info格式注释文件输出给Linux服务器。从数据库(datasets)排除调用率(call rate)<90%的样品或者在重复的HindIII和XbaI试验间多于一个错配的样品。来自ENA713B IA07临床数据库的结果(转化/未转化)数据合并入基因型数据中,并且在每个染色体的基础上在Haploview中使用下述参数进行病例对照分析:“-nogui-check-assocCC-blockoutput GAB-hwcutoff 0.00001-maxDistance 200”。除此之外使用缺省设置。每个染色体的输出文件组装成单一的基因组范围的文件,输入Windows服务器并合并入SAS。
[161]单一位点和单元型区段的Top结果都通过提供的Haploview卡方值排列,且单一位点结果也通过Fisher氏确切检验进行排列,并且用来自Affymetrix数据库的试验数据进行解释。在对多重检验进行Bonferroni罚分(n=109780指示性检验(informative tests))后,没有单一位点的结果符合研究范围的显著性(p=0.05),在Haploviewd的排列检验中,任何组合的单一位点和单元型检测都不符合研究范围的显著性阈值(p=0.05)。
[162]结果。在整个基因组,与AD转化相关的等位基因或者单元型中进行单一标记和单元型的分析。结果通过性别、APOE E4状态和处理方法(treatment arm)进行分层。本研究中使用的Affymetrix 100K基因型分型芯片在机制上与用于表达谱的微阵列的相似。这些研究中使用的两个芯片的设置提供平均分布在基因组中的>100,000SNP的基因型数据。来自艾斯能InDDex试验的442份样品的420份样品成功地杂交于本研究所使用的基因型分型芯片。通过使用限制性酶消化以及扩增、杂交到芯片和扫描降低了基因组的复杂性。产生大约480万个基因型。
[163]基因型QC步骤。Affymetrix 100K阵列通过比较30个冗余的SNP和比较XbaI和HindIII对之间的性别而评估。排除存在多于一个错配的芯片。如果未命中的芯片>1个,则排除样品。分析中包括“每个样品调用率”≥90%的芯片。下表2A提供Affymetrix 100K阵列的性能的总结。
表2A Affymetrix 100K阵列的性能
首次通过实验 重复
患者数目:442
制备的DNA数目:884(2个芯片/患者)159
成功制备的DNA数目:793(89.70%) 136(85.5%)
装入芯片的DNA数目:793 124
通过芯片的数目:758(95.5%) 122(98%)
每个芯片的平均调用率:96% 96.6%
[164]有两个成功芯片的患者样品的数目是420(95%)。具有1次失败的检测/芯片的患者样品的数目是17(3.9%)。具有2次失败的检测/芯片的患者样品的数目是5(1.1%)。观察到的用于本发明研究的试验性能的再现性是99.9%。Affymetrix提供的阳性对照的8个样品也指示对于被调用的基因型有99.9%的精确率。
[165]如表2B所示,对于人口学特征、基数MMSE和AD转化率,完全的临床研究和基因组扫描研究之间没有显著差异。
[166]单元型分析。对于每一个单元型,评估病例和对照的所有单元型频率。检测每个单元型与AD转化的关联性。通过p值(卡方值)对所有的相关性排序以确定追踪的优先顺序。对于单元型区段评估,使用Gabriel等人,Science 296:2225-2229(2002)的方法在整个基因组中鉴定了16,858个单元型区段。
[167]下表3总结了通过单元型区段评估(即本发明单元型)观察到的15个高关联性。
[168]通过单一位点和单元型评估观察到的遗传关联性的组合结果,通过卡方值结果排序,总结于下表4中。
[169]如表5所示,高遗传关联性涉及的SNP位于GRIA1(谷氨酸受体,离子型,AMPA1),AK5(腺苷酸激酶5),SLC1A3(溶质载体蛋白家族1(胶质细胞高亲和性谷氨酸转运蛋白),成员3),BAI3(脑特异性血管发生抑制剂3)和CACNA2D1(钙通道,电压依赖型,α2/δ亚基1)中或者与其邻近。
[170]单一标记关联性。针对MCI向AD转化的单一遗传标记关联性在109,768个标记中进行评估。在72例病例和347例对照中比较等位基因的频率。表6中总结了鉴定为与MCI向AD转化关联的首要的25个单一位点基因突变(本发明的生物标记)。
等同方案
[171]本发明的一或多个实施方式的细节在上面所附的说明书中列出。尽管任何与本文所述方法和材料相似或相当的那些可以用于实践或检测本发明,但现在描述了优选的方法和材料。本发明的其它特征、目的和优点将从说明书和权利要求中显而易见。在说明书和所附权利要求中,除非上下文明确另行规定,否则单数形式包括复数对象。除非另有限定,本文使用的所有技术和科学术语具有与本领域技术人员通常所理解相同的含义。本文引用的所有参考通过整体引用在此作为参考,并且为了所有的目的以相同的程度在此引入,就如同每一单个出版物、专利或专利申请为了所有目的具体及单独地指示为以其整体引入作为参考一样。
[172]本发明不限于这一申请中所述的具体实施方式,这些实施方式仅作为本发明个别方面的举例说明。如本领域技术人员显而易见的是,可以对这一发明进行许多修改和改变而不背离其精神和范围。根据前面的说明,除了本文列举的那些以外,本发明范围内的功能性等效方法和工具对于本领域技术人员而言也是显而易见的。该修改和改变旨在落入所附权利要求的范围内。本发明只被所附权利要求的用语,以及与该权利要求所主张的全部范围等同体所限定。