技术领域
本发明涉及SCAP基因突变体及其应用。具体地,本发明涉及分离编码SCAP突变体 的核酸,分离的多肽,筛选易患早发心肌梗死的生物样品的方法,筛选遗憾早发心肌梗死的 生物样品的系统,用于筛选易患早发心肌梗死的生物样品的试剂盒,构建体以及重组细胞。
背景技术
心肌梗死(MyocardialInfarction,MI)是一种由于冠状动脉粥样硬化斑块的纤 维帽破裂而引起后续的血栓形成,从而使得血管堵塞并引起相应区域的心肌发生缺血缺 氧,最终引起心肌坏死的严重致猝死性疾病。其中,部分人群呈现出发病年龄早(男性<50, 女性<60)、家族聚集倾向等典型临床特点,称为早发心肌梗死(PrematureMyocardial Infarction,PMI)。有研究显示,早发心肌梗死的遗传度高达63%。由于这类患者的首发症 状即可表现为由急性心肌坏死引起的猝死,之前可无任何冠心病及其危险因素的相关症 状,因此相比非早发性心肌梗死,其危险度更高。这使得通过早期检测潜在患病者的遗传信 息,在出现致死性症状前提供风险预测、实现对早发心肌梗死的“初级预防”显得尤为重要。 而目前该病的发病机制尚未完全清楚,致病基因和致病突变仍不明确,且尚未有足够的用 于早期识别早发心梗患者的遗传标志物。
因而,目前对早发心肌梗死的致病基因和致病突变的研究仍有待深入。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明的一个目的 在于提出一种能够有效筛选易患早发心肌梗死的生物样品的方法。
本发明是基于发明人的下列工作完成的:发明人高通量外显子组测序联合候选基 因突变验证的方法确定了SCAP基因为早发心肌梗死的致病基因,并且SCAP基因18号外显子 上的c.3035C>T突变为早发心肌梗死的致病突变。
根据本发明的第一方面,本发明提出了一种分离的编码SCAP突变体的核酸。根据 本发明的实施例,所述核酸与SEQIDNO:1相比,具有c.3035C>T突变,即相对于野生型SCAP 基因,本发明的SCAP基因突变体的第3035位碱基从C突变为T。根据本发明的实施例,发明人 确定了SCAP基因以及该突变体与早发心肌梗死的发病密切相关,从而通过检测该突变体在 生物样品中是否存在,可以有效地检测生物样品是否易患早发心肌梗死。
根据本发明的第二方面,本发明提出了一种分离的多肽。根据本发明的实施例,与 SEQIDNO:2相比,所述分离的多肽具有p.A1012V突变,即该突变是由于c.3035C>T的无义 突变而引起的,具体地,该突变表示:该分离的多肽,由野生型SCAP的第1012位氨基酸A(丙 氨酸)突变为V(缬氨酸)。通过检测生物样品中是否表达该多肽,可以有效地检测生物样品 是否易患早发心肌梗死。
根据本发明的第三方面,本发明提出了一种筛选易患早发心肌梗死的生物样品的 方法。根据本发明的实施例,该方法包括以下步骤:从所述生物样品提取核酸样本;确定所 述核酸样本的核酸序列;所述核酸样本的核酸序列与SEQIDNO:1相比,具有c.3035C>T突 变是所述生物样品易患早发心肌梗死的指示。通过根据本发明实施例的筛选易患早发心肌 梗死的生物样品的方法,可以有效地筛选易患早发心肌梗死的生物样品。
根据本发明的第四方面,本发明提出了一种筛选易患早发心肌梗死的生物样品的 系统。根据本发明的实施例,该系统包括:核酸提取装置,所述核酸提取装置用于从所述生 物样品提取核酸样本;核酸序列确定装置,所述核酸序列确定装置与所述核酸提取装置相 连,用于对所述核酸样本进行分析,以便确定所述核酸样本的核酸序列;判断装置,所述判 断装置与所述核酸序列确定装置相连,以便基于所述核酸样本的核酸序列与SEQIDNO:1 相比,是否具有c.3035C>T突变,判断所述生物样品是否易患早发心肌梗死。利用该系统,能 够有效地实施前述筛选易患早发心肌梗死的生物样品的方法,从而可以有效地筛选易患早 发心肌梗死的生物样品。
根据本发明的第五方面,本发明提出了一种用于筛选易患早发心肌梗死的生物样 品的试剂盒。根据本发明的实施例,该试剂盒含有:适于检测SCAP基因突变体的试剂,其中 与SEQIDNO:1相比,该SCAP基因突变体具有c.3035C>T突变。利用根据本发明的实施例的 试剂盒,能够有效地筛选易患早发心肌梗死的生物样品。
根据本发明的第六方面,本发明还提出了一种构建体。根据本发明的实施例,该构 建体包含前面所述的分离的编码SCAP突变体的核酸。由此,利用本发明的构建体转化受体 细胞获得的重组细胞,能够有效地用于筛选治疗早发心肌梗死的药物。
根据本发明的第七方面,本发明还提出了一种重组细胞。根据本发明的实施例,该 重组细胞是通过前面所述的构建体转化受体细胞而获得的。根据本发明的一些实施例,利 用本发明的重组细胞,能够有效地筛选治疗早发心肌梗死的药物。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变 得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得 明显和容易理解,其中:
图1显示了根据本发明实施例的筛选易患早发心肌梗死的生物样品的系统及其组 成部分的示意图,其中,
图1A为根据本发明实施例的筛选易患早发心肌梗死的生物样品的系统的示意图,
图1B为根据本发明实施例的核酸提取装置的示意图,
图1C为根据本发明实施例的核酸序列确定装置的示意图;
图2显示了根据本发明一个实施例的早发心肌梗死患者家系的家系图;
图3显示了根据本发明的一个实施例,早发心肌梗死患者家系中患者、家系内正常 人以及家系外正常人的SCAP基因c.3035C>T突变位点的代表性Sanger测序验证峰图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终 相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附 图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
SCAP基因突变体
根据本发明的第一方面,本发明提出了一种分离的编码SCAP突变体的核酸。根据 本发明的实施例,所述核酸与SEQIDNO:1相比,具有c.3035C>T突变。在本文中所使用的表 达方式“编码SCAP突变体的核酸”,是指与编码SCAP突变体的基因相对应的核酸物质,即核 酸的类型不受特别限制,可以是任何包含与SCAP突变体的编码基因相对应的脱氧核糖核苷 酸和/或核糖核苷酸的聚合物,包括但不限于DNA、RNA或cDNA。根据本发明的一个具体示例, 前面所述的编码SCAP突变体的核酸为DNA。根据本发明的实施例,发明人确定了SCAP基因的 及该突变体与早发心肌梗死的发病密切相关,从而通过检测该突变体在生物样品中是否存 在,可以有效地检测生物样品是否易患早发心肌梗死,也可以通过检测该突变体在生物体 中是否存在,可以有效地预测生物体是否易患早发心肌梗死。
对于本发明说明书和权利要求书中,提及核酸,本领域技术人员应当理解,实际包 括互补双链的任意一条,或者两条。为了方便,在本说明书和权利要求书中,虽然多数情况 下只给出了一条链,但实际上也公开了与之互补的另一条链。例如,提及SEQIDNO:1,实际 包括其互补序列。本领域技术人员还可以理解,利用一条链可以检测另一条链,反之亦然。
该编码SCAP突变体的核酸,是本申请的发明人通过高通量外显子组测序联合候选 基因突变验证的方法确定的早发心肌梗死的致病基因SCAP上的致病突变。该突变位点在现 有技术中并未被提到。
其中,野生型SCAP基因的cDNA具有如下所示的核苷酸序列:
其编码的蛋白质具有如下所示的氨基酸序列:
发明人发现的该突变体与SEQIDNO:1相比,具有c.3035C>T突变,即相对于野生 型SCAP基因,本发明的SCAP基因突变体的第3035位碱基从C突变为T。由此,其所编码的产物 与野生型的SCAP相比,具有p.A1012V突变,即该突变是由于c.3035C>T的无义突变而引起 的,具体地,该突变表示:该分离的多肽,由野生型SCAP的第1012位氨基酸A(丙氨酸)突变为 V(缬氨酸)。
需要说明的是,SCAP基因位于3号染色体,由23个外显子组成,共包含1279个氨基 酸。它是哺乳动物脂质合成和摄入的“中心调节因子”,在细胞内胆固醇水平降低时,其可发 生构象改变,并通过其酶切作用激活SREBP基因、促进其进入细胞核完成一系列的转录调控 反应,进而上调包括LDLR、HMGCoA等一系列脂质代谢的关键酶,从而促进胆固醇的形成;相 反,当细胞内胆固醇水平增高时,SCAP基因则可感受细胞内过高的胆固醇水平,并停止发挥 其酶切作用。因此,SCAP是胆固醇代谢环节中的重要负反馈介质。有研究表明,位于SCAP基 因上的点突变可造成其对于细胞内胆固醇水平变化的敏感性下降,导致其不能为升高的胆 固醇水平抑制,进而使得细胞内胆固醇水平过度增高:当该过程发生于肝细胞等机体主要 的胆固醇合成组织时,则会导致机体出现高胆固醇血症;而当该过程发生于巨噬细胞及平 滑肌细胞时,则会导致其行为“泡沫细胞”,而“泡沫细胞”的形成,则是心肌梗死发生发展的 重要机制及细胞学标志。进而,本发明的发明人经过一系列的实验发现并验证了SCAP基因 为早发心肌梗死的致病基因,并进一步发现SCAP基因18号外显子上的c.3035C>T突变能够 引起早发心肌梗死,为早发心肌梗死的致病突变。但是,本发明的SCAP基因突变位点 c.3035C>T并未见报道。
根据本发明的第二方面,本发明提出了一种分离的多肽。根据本发明的实施例,与 野生型SCAP相比,该分离的多肽具有p.A1012V突变,即该突变是由于c.3035C>T的无义突变 而引起的,具体地,该突变表示:该分离的多肽,由野生型SCAP的第1012位氨基酸A(丙氨酸) 突变为V(缬氨酸)。根据本发明的一些具体示例,该多肽是由前述分离的编码SCAP突变体的 核酸编码的。通过检测生物样品中是否表达该多肽,可以有效地检测生物样品是否易患早 发心肌梗死,也可以通过检测这些多肽在生物体中是否存在,可以有效地预测生物体是否 易患早发心肌梗死。
根据本发明的第三方面,本发明提出了一种筛选易患早发心肌梗死的生物样品的 方法。根据本发明的实施例,该方法包括以下步骤:
从所述生物样品提取核酸样本。根据本发明的实施例,生物样品的类型并不受特 别限制,只要从该生物样品中能够提取到反映生物样品SCAP是否存在突变的核酸样本即 可。根据本发明的实施例,生物样品可以为选自人体血液、皮肤、皮下组织的至少一种,优选 外周血。由此,可以方便地进行取样和检测,从而能够进一步提高筛选易患早发心肌梗死的 生物样品的效率。根据本发明的实施例,这里所使用的术语“核酸样本”应做广义理解,其可 以是任何能够反映生物样品中SCAP是否存在突变的样本,例如可以是从生物样品中直接提 取的全基因组DNA,也可以是该全基因组中包含SCAP编码序列的一部分,可以是从生物样品 中提取的总RNA,也可以是从生物样品中提取的mRNA。根据本发明的一个实施例,所述核酸 样本为全基因组DNA。由此,可以扩大生物样品的来源范围,并且可以同时对生物样品的多 种信息进行确定,从而能够提高筛选易患早发心肌梗死的生物样品的效率。另外,根据本发 明的实施例,针对采用RNA作为核酸样本,从生物样品提取核酸样本可以进一步包括:从生 物样品提取RNA样本,优选RNA样本为mRNA;以及基于所得到的RNA样本,通过反转录反应,获 得cDNA样本,所得到的cDNA样本构成核酸样本。由此,可以进一步提高利用RNA作为核酸样 本筛选易患早发心肌梗死的生物样品的效率。
接下来,在得到核酸样本之后,可以对核酸样本进行分析,从而能够确定所得到核 酸样本的核酸序列。根据本发明的实施例,确定所得到核酸样本的核酸序列的方法和设备 并不受特别限制。根据本发明的具体实施例,可以通过测序方法,确定核酸样本的核酸序 列。根据本发明的实施例,可以用于进行测序的方法和设备并不受特别限制。根据本发明的 实施例,可以采用第二代测序技术,也可以采用第三代以及第四代或者更先进的测序技术。 根据本发明的具体示例,可以利用选自IlluminaHiSeq4000、SOLiD、454和单分子测序装置 的至少一种对核酸序列进行测序。由此,结合最新的测序技术,针对单个位点可以达到较高 的测序深度,检测灵敏度和准确性大大提高,因而能够利用这些测序装置的高通量、深度测 序的特点,进一步提高对核酸样本进行检测分析的效率。从而,能够提高后续对测序数据进 行分析时的精确性和准确度。由此,根据本发明的实施例,确定核酸样本的核酸序列可以进 一步包括:首先,针对所得到的核酸样本,构建核酸测序文库;以及对所得到的核酸测序文 库进行测序,以便获得由多个测序数据构成的测序结果。根据本发明的一些实施例,可以采 用选自IlluminaHiSeq4000、SOLiD、454和单分子测序装置的至少一种对所得到的核酸测 序文库进行测序。另外,根据本发明的实施例,可以对核酸样本进行筛选,富集SCAP外显子, 该筛选富集可以在构建测序文库之前,构建测序文库过程中,或者构建测序文库之后进行。 根据本发明的一个实施例,针对核酸样本,构建核酸测序文库进一步包括:利用SCAP外显子 特异性引物,对核酸样本进行PCR扩增;以及针对所得到的扩增产物,构建核酸测序文库。由 此,可以通过PCR扩增,富集SCAP外显子(尤其是第18号外显子),从而能够进一步提高筛选 易患早发心肌梗死的生物样品的效率。根据本发明的实施例,SCAP外显子特异性引物的序 列不受特别限制,根据本发明的优选实施例,这些SCAP外显子特异性引物(针对SCAP的18号 外显子)具有SEQIDNO:37和38所示的核苷酸序列:
SCAP-18F:gactccccaggctatgact(SEQIDNO:37);
SCAP-18R:acagcagttgaagagaaccag(SEQIDNO:38)。
发明人惊奇地发现,通过采用这些引物,可以在PCR反应体系中通过显著有效地完 成对SCAP外显子的扩增。需要说明的是,这些SEQIDNO:37和SEQIDNO:38所示的核苷酸 序列是本发明的发明人在付出了艰苦的劳动后,意外获得的。
关于针对核酸样本,构建测序文库的方法和流程,本领域技术人员可以根据不同 的测序技术进行适当选择,关于流程的细节,可以参见测序仪器的厂商例如Illumina公司 所提供的规程,例如参见Illumina公司MultiplexingSamplePreparationGuide(Part# 1005361;Feb2010)或Paired-EndSamplePrepGuide(Part#1005063;Feb2010),通过参 照将其并入本文。根据本发明的实施例,从生物样品提取核酸样本的方法和设备,也不受特 别限制,可以采用商品化的核酸提取试剂盒进行。
需要说明的是,在这里所使用的术语“核酸序列”应作广义理解,其可以是在对核 酸样本进行测序得到的测序数据进行组装后,得到的完整的核酸序列信息,也可以是直接 采用通过对核酸样本进行测序所得到的测序数据(reads)作为核酸序列,只要这些核酸序 列中含有对应SCAP的编码序列即可。
最后,在确定核酸样本的核酸序列之后,将所得到的核酸样本的核酸序列与SEQ IDNO:1的序列相比对。如果在所得到的核酸序列中具有c.3035C>T突变,则指示生物样品 易患早发心肌梗死。由此,通过根据本发明实施例的筛选易患早发心肌梗死的生物样品的 方法,可以有效地筛选易患早发心肌梗死的生物样品。根据本发明的实施例,对核酸序列与 SEQIDNO:1进行比对的方法和设备并不受特别限制,可以采用任意常规的软件进行操作, 根据本发明的具体实例,可以采用SOAP软件进行比对。
根据本发明的实施例,所述早发心肌梗死为常染色体遗传性心肌梗死。
需要说明的是,根据本发明实施例的“筛选易患早发心肌梗死的生物样品的方法” 的用途不受特别限制,例如可以用作非诊断目的的筛选方法。
筛选易患早发心肌梗死的生物样品的系统和试剂盒
根据本发明的第四方面,本发明提出了一种能够有效实施上述筛选易患早发心肌 梗死的生物样品的方法的系统。
参考图1,根据本发明的实施例,该筛选易患早发心肌梗死的生物样品的系统1000 包括核酸提取装置100、核酸序列确定装置200以及判断装置300。
根据本发明的实施例,核酸提取装置100用于从生物样品提取核酸样本。如前所 述,根据本发明的实施例,核酸样本的类型并不受特别限制,对于采用RNA作为核酸样本,则 核酸提取装置进一步包括RNA提取单元101和反转录单元102,其中,提取单元101用于从生 物样品提取RNA样本,反转录单元102与RNA提取单元101相连,用于对RNA样本进行反转录反 应,以便获得cDNA样本,所得到的cDNA样本构成核酸样本。
根据本发明的实施例,核酸序列确定装置200与核酸提取装置100相连,用于对核 酸样本进行分析,以便确定核酸样本的核酸序列。如前所示,可以采用测序的方法确定核酸 样本的核酸序列。由此,根据本发明的一个实施例,所述核酸序列确定装置200可以进一步 包括:文库构建单元201以及测序单元202。文库构建单元201用于针对核酸样本,构建核酸 测序文库;测序单元202与文库构建单元201相连,用于对核酸测序文库进行测序,以便获得 由多个测序数据构成的测序结果。如前所述,可以通过PCR扩增,富集SCAP外显子,进一步提 高筛选易患早发心肌梗死的生物样品的效率。由此,文库构建单元201可以进一步包括PCR 扩增模块(图中未示出),在该PCR扩增模块中设置有SCAP外显子特异性引物,以便利用SCAP 外显子特异性引物,对所述核酸样本进行PCR扩增,根据本发明的具体实施例,SCAP外显子 特异性引物(针对SCAP的18号外显子)具有如SEQIDNO:37和38所示的核苷酸序列。根据本 发明的实施例,测序单元202可以包括选自ILLUMINAHISEQ4000、SOLiD、454和单分子测序 装置的至少一种。由此,结合最新的测序技术,针对单个位点可以达到较高的测序深度,检 测灵敏度和准确性大大提高,因而能够利用这些测序装置的高通量、深度测序的特点,进一 步提高对核酸样本进行检测分析的效率。从而,提高后续对测序数据进行分析时的精确性 和准确度。
根据本发明的实施例,判断装置300与核酸序列确定装置200相连,适于将核酸样 本的核酸序列进行比对,以便基于核酸样本的核酸序列与SEQIDNO:1的区别判断生物样 品是否易患早发心肌梗死。具体地,基于核酸样本的核酸序列与SEQIDNO:1相比,是否具 有c.3035C>T突变,判断生物样品是否易患早发心肌梗死。如前所述,根据本发明的一个实 施例,核酸样本的核酸序列与SEQIDNO:1相比,具有c.3035C>T突变,是生物样品易患早发 心肌梗死的指示。如前所述,根据本发明的实施例,对核酸序列与SEQIDNO:1进行比对的 设备并不受特别限制,可以采用任意常规的软件进行操作,根据本发明的具体实例,可以采 用SOAP软件进行比对。
由此,利用该系统,能够有效地实施前述筛选易患早发心肌梗死的生物样品的方 法,从而可以有效地筛选易患早发心肌梗死的生物样品。
根据本发明的第五方面,本发明提出了一种用于筛选易患早发心肌梗死的生物样 品的试剂盒。根据本发明的实施例,该用于筛选易患早发心肌梗死的生物样品的试剂盒包 括:适于检测SCAP基因突变体的试剂,其中与SEQIDNO:1相比,该SCAP基因突变体具有 c.3035C>T突变。利用根据本发明的实施例的试剂盒,能够有效地筛选易患早发心肌梗死的 生物样品。在本文中,所使用的术语“适于检测SCAP基因突变体的试剂”应做广义理解,即可 以是检测SCAP编码基因的试剂,也可以是检测SCAP突变体多肽的试剂,例如可以采用识别 特异性位点的抗体。根据本发明的一个实施例,所述试剂为核酸探针或引物,优选地,所述 核酸探针或引物具有如SEQIDNO:37-38所示的核苷酸序列。由此,可以高效地筛选易患早 发心肌梗死的生物样品。
需要说明的是,在本文前面筛选易患早发心肌梗死的生物样品的方法部分中所描 述的特征和优点,同样适用于筛选易患早发心肌梗死的生物样品的系统或者试剂盒,在此 不再赘述。
构建体及重组细胞
根据本发明的第六方面,本发明还提出了一种构建体。根据本发明的实施例,该构 建体包含前面所述的分离的编码SCAP突变体的核酸,即本发明的SCAP基因突变体。由此,利 用本发明的构建体转化受体细胞获得的重组细胞,能够有效地用于筛选治疗早发心肌梗死 的药物。其中,所述受体细胞的种类不受特别限制,例如可以为大肠杆菌细胞、哺乳动物细 胞,优选该受体细胞来源于哺乳动物。
在本发明中所使用的术语“构建体”是指这样的一种遗传载体,其包含特定核酸序 列,并且能够将目的核酸序列转入宿主细胞中,以获得重组细胞。根据本发明的实施例,构 建体的形式不受特别限制。根据本发明的实施例,其可以为质粒、噬菌体、人工染色体、粘粒 (Cosmid)、病毒的至少一种,优选质粒。质粒作为遗传载体,具有操作简单,可以携带较大片 段的性质,便于操作和处理。质粒的形式也不受特别限制,既可以是环形质粒,也可以是线 性质粒,即可以是单链的,也可以是双链的。本领域技术人员可以根据需要进行选择。在本 发明中所使用的术语“核酸”可以是任何包含脱氧核糖核苷酸或者核糖核苷酸的聚合物,包 括但不限于经过修饰的或者未经修饰的DNA、RNA,其长度不受任何特别限制。对于用于构建 重组细胞的构建体,优选所述核酸为DNA,因为DNA相对于RNA而言,其更稳定,并且易于操 作。
根据本发明的第七方面,本发明还提出了一种重组细胞。根据本发明的实施例,该 重组细胞是通过前面所述的构建体转化受体细胞而获得的。从而,本发明的重组细胞能够 表达构建体所携带的SCAP基因突变体。根据本发明的一些实施例,利用本发明的重组细胞, 能够有效地筛选治疗早发心肌梗死的药物。根据本发明的实施例,受体细胞的种类不受特 别限制,例如可以为大肠杆菌细胞、哺乳动物细胞,优选所述受体细胞来源于非人哺乳动 物。
下面参考具体实施例,对本发明进行说明,需要说明的是,这些实施例仅仅是说明 性的,而不能理解为对本发明的限制。
若未特别指明,实施例中所采用的技术手段为本领域技术人员所熟知的常规手 段,可以参照《分子克隆实验指南》第三版或者相关产品进行,所采用的试剂和产品也均为 可商业获得的。未详细描述的各种过程和方法是本领域中公知的常规方法,所用试剂的来 源、商品名以及有必要列出其组成成分者,均在首次出现时标明,其后所用相同试剂如无特 殊说明,均以首次标明的内容相同。
实施例1确定PMI致病突变
1、样本收集
发明人收集到一个5代的中国早发心肌梗死(在本文中有时也简称为PMI)患者家系,其家系图见图2。如图2所示,如图2所示,●表示患病女性,■表示患病男性;○表示健康女性,□表示健康男性;表示已故女性,表示已故男性;箭头所指为先证者。该家系共有四代人存活,共19个成员,其中早发心肌梗死患者3人(男性2人,女性1人)。
发明人对所有患者均进行了全面的体格、血液生化及影像学检查。所有的临床诊 断或排除诊断均基于心肌梗死诊断的金标准,即:结合患者典型心肌梗死症状及心电图表 现的基础上,冠状动脉造影阳性确诊心肌梗死诊断,冠状动脉CT造影阴性作为排除心肌梗 死诊断标准。其中,先证者PMI1-1(如图2示),为一中年女性,于39岁发生急性心肌梗死;心 肌梗死发生前3年间,间断出现典型劳力性心绞痛症状,并呈进行性加重,于39岁时发生心 肌梗死,冠状动脉造影确诊为心肌梗死,后择期共植入支架4枚;既往有发现高血压、高血脂 4年,未规律服药;有高脂血症及早发冠心病家族史。
发明人收集获得上述PMI患者家系中尚在世的3个患者以及16个非早发心梗患病 者(即家系内正常人)的样本。
2、全外显子组测序
发明人利用AgilentSureSelectHumanAllExonV5试剂盒结合illumina HiSeq4000平台,采用PE150测序策略,对图2所示的PMI患者家系中的三名患者(PMI1-1、 PMI1-3及PMI1-8)和16个家系内正常人进行了全外显子组测序,具体步骤如下:
2.1DNA提取
采集图2所示PMI患者家系中的三名患者和16个家系内正常人的外周血,利用常规 盐析法从外周血样品中提取各家系成员的基因组DNA,并利用分光光度计测量DNA的浓度及 纯度,所得各基因组DNA的OD260/OD280均应位于1.7-2.0之间,浓度不少于200ng/微升,总量 不少于3微克。
2.2外显子捕获与测序
利用超声波仪(CovarisS2,Massachusetts,USA)将各基因组DNA样本随机打断成 150-200bp左右的片段,随后按照制造商提供的操作说明书,在片段两端分别连接上接头制 备DNA文库(可参见:http://www.illumina.com/提供的Illumina/Solexa标准建库说明书, 通过参照将其全文并入本文)。
然后,采用AgilentSureSelectHumanAllExonV5试剂盒,将上述制备获得的 DNA文库与生物素标记的RNA探针进行液相杂交(95℃5分钟,65℃24小时),再使用带链霉素 的磁珠将DNA-RNA混合物捕获下来,然后用Qiagen提纯试剂盒将DNA洗脱下来,再利用 AgilentPCR引物将捕获得到的DNA扩增12个循环,结果,50M区域的DNA序列,20,965个基因 的334,378个外显子被捕获下来。
进一步,利用安捷伦生物分析仪DNA芯片进行文库质检,合格后即可上机测序,以 便获得原始测序数据。其中,测序平台为IlluminaHiseq4000,读取长度为90bp,各样本的 平均测序深度最少为150×。
3、数据质控、变异检测、注释及变异过滤
3.1数据质控
Hiseq4000测序得到的原始图像数据rawdata,以fastq文件格式存储(文件名:* .fq)。Rawdata中会包含接头信息,低质量碱基,未测出的碱基(以N表示),这些信息会对后 续的信息分析造成很大的干扰,分析前需要将这些干扰信息去除掉,最终得到的数据即为 有效数据。
具体地,首先利用IlluminabasecallingSoftware1.7对上述获得的原始测序 数据进行处理,即按照以下条件进行过滤去污染:
A.过滤掉含有接头序列的reads;
B.当单端测序read中含有的N的含量超过该条read长度比例的10%时,需要去除 此对pairedreads;
C.当单端测序read中含有的低质量(碱基质量值小于5)碱基数超过该条read长度 比例的50%时,需要去除此对pairedreads。经过对测序数据的严格过滤,得到高质量的 cleandata。
进而,对产出数据进行统计,包括测序read数量,数据产量,测序错误率,Q20含量, Q30含量,GC含量等。
3.2序列比对
进一步,使用SOAPaligner/SOAP2(可参见:LiR,LiY,KristiansenK,etal, SOAP:shortoligonucleotidealignmentprogram.Bioinformatics2008,24(5):713- 714;LiR,YuC,LiY,eaal,SOAP2:animprovedultrafasttoolforshortread alignment.Bioinformatics2009,25(15):1966-1967,通过参照将其全文并入本文)比对 到UCSC人类参考基因组(hg19,build37.1,http://genome.ucsc.edu/),以便获得比对到 基因组上的唯一比对序列。
具体地,在制备文库的过程中,由于PCR扩增过程中会存在一些偏差,也就是说有 的序列会被过量扩增。这样,在比对的时候,这些过量扩增出来的完全相同的序列就会比对 到基因组的相同位置。而这些过量扩增的reads并不是基因组自身固有序列,不能作为变异 检测的证据,因此,要尽量去除这些由PCR扩增所形成的duplicates,这一步可以使用 picard来完成。对结果应该没有什么影响,GATK后期分析时可以忽略这一部分。并且,在 indel附近的比对会出现大量的碱基错配,对碱基质量值进行重新校正和检测变异不利。因 此,需要将比对到indel附近的reads进行局部重新比对,将比对的错误率降到最低。GATK分 析流程中,RealignerTargetCreator是用于确定要进行重新比对的区域,Indel Realigner是用于对这些区域内进行重新比对。
3.3变异检测和功能注释
然后利用SOAPsnp(可参见:LiR,LiY,FangX,YangH,etal,SNPdetection formassivelyparallelwhole-genomeresequencing.GenomeRes2009,19(6):1124- 1132,通过参照将其全文并入本文)确定靶区域的基因型。
具体地,最终的BAM文件用GATK的HaplotypeCaller模块进行SNP/INDEL检测。变异 结果利用ANNOVAR进行变异注释,其中,基于dbSNP和1000Genome数据库,进行突变位置,突 变类型,保守区域预测。而针对外显子区突变,则基于CDS、RefSeq、数据库和UCSC进行。
3.4变异过滤
随后通过dbSNP数据库(http://hgdownload.cse.ucsc.edu/goldenPath/hg19/ database/snp135.txt.gz.)、HapMap数据库(ftp://ftp.ncbi.nlm.nih.gov/hapmap)、千人 基因组数据库(ftp://ftp.1000genomes.ebi.ac.uk/vol1/ftp)、炎黄数据库(http:// yh.genomics.org.cn/)、1000Genome(1000GenomesProjectConsortium)等公共数据库的 过滤,去掉所有已知的变异以及与临床无关的位点;保留外显子区或剪切位点附近位点,可 能导致氨基酸改变;过滤同义突变,保留非同义突变;最后利用PolyPhen和SIFT软件预测氨 基酸保守性后,共得到249处SNP变异位点及361处插入/缺失变异位点。
进一步,基于变异位点的特征进行优先选择:(a)选择三个患者共有的同基因、同 位点、同突变类型的变异;(b)根据家系图中的疾病的常染色体显性遗传方式(不完全显性) 进行筛选;(c)基于文献检索及基因功能信息,进一步筛选经推断与心肌梗死的发生可能相 关的位点。
结果,最终发现位于SCAP基因18号外显子的点突变c.3035C>T(p.A1012V)为PMI的 潜在致病基因突变。其中,三个患者均携带上述突变(c.3035C>T),且都为杂合突变类型,而 家系内正常人在此位置均未发生突变。
随后,在图2所示的上述PMI患者家系中对SCAP基因进行突变排查,即针对SCAP基 因中的无义突变c.3035C>T进行Sanger测序验证,结果确认,该突变在家系中存在与疾病表 型共分离的现象。
由此,初步判定SCAP基因为早发心肌梗死的致病基因,无义突变c.3035C>T (p.A1012V)为该早发心肌梗死家系中患者的致病原因,也即SCAP基因的c.3035C>T (p.A1012V)突变为早发心肌梗死的致病突变。
实施例2Sanger法测序验证
分别对实施例1中所述的早发心肌梗死患者家系中的三名患者(PMI1-1、PMI1-3及 PMI1-8)和16个家系内正常人、70个中国汉族人群的早发心肌梗死患者、以及200名家系外 正常人的SCAP基因进行检测:针对SCAP基因的外显子设计引物,然后通过PCR扩增、产物纯 化和测序的方法获得SCAP有关序列,根据确定序列测定结果验证SCAP基因、SCAP基因的 c.3035C>T(p.A1012V)突变与早发心肌梗死之间的相关性。
具体方法步骤如下:
1、DNA提取
按照实施例1中所述的提取DNA的方法,分别提取制备受试者外周血中的基因组 DNA,备用。
2、引物设计及PCR反应
首先,参考人类基因组序列数据库GRCh38.p2,设计得到SEQIDNO:3-48所示的 SCAP基因外显子特异性引物,具体序列见下表:
接着,分别按照以下配比配制各基因组DNA样本的PCR反应体系以及进行PCR反应:
总反应体系体积为25ul,反应管为0.2ml的Eppendorf离心管,体系中含有ddH2O 9.5ul,Mix12.5ul,引物正向、反向各1ul,模板1ul(约50ng),混匀,迅速短暂离心。在PCR仪 上进行扩增。
所有引物均采用TouchdownPCR方法,具体如下:95℃预变性5分钟;95℃变性30 秒,68℃退火30秒,72℃延伸30秒,每个循环退火温度降1℃,10个循环降至58℃;然后95℃ 变性30秒,60℃退火30秒,72℃延伸30秒,30个循环。循环后72℃延伸10分钟。
由此,获得各样本的PCR扩增产物。
3、测序
针对步骤2中获得的各待测者的PCR产物,利用MultiScreen-PCRPlates (Millipore,Billerica,MA,USA)真空泵过膜纯化,然后利用BigDyeTerminatorDNA测序 试剂盒(version3.1)和3730XL测序仪(AppliedBiosystems,FosterCity,CA,USA)进行直 接测序(采用Sanger法进行)。且所有可疑突变均经反向测序确定。其中,纯化、测序过程由 北京六合华大基因科技股份有限公司完成。
其中,图3显示了上述早发心肌梗死患者家系中患者、家系内正常人以及家系外正 常人的SCAP基因c.3035C>T突变位点的代表性Sanger测序验证峰图。由图3可知,该早发心 肌梗死患者家系中患者都携带有SCAP基因18号外显子的c.3035C>T突变,而家系内正常人 以及家系外正常人都未携带该突变;而在70个早发心梗散发病例中,有一个患者携带位于 SCAP基因9号外显子的点突变p.V468A(c.1403T>C),该突变在早发心肌梗死患者家系中以 及家系外正常人中都未出现。
进一步的生物信息学分析显示,SCAP基因的c.3035C>T(p.A1012V)突变,以及 p.V468A(c.1403T>C)突变在28,000个东亚人群中为阴性,且在物种间高度保守。
综上,证明SCAP基因为早发心肌梗死的致病基因,SCAP基因的c.3035C>T (p.A1012V)突变为早发心肌梗死的致病突变。
实施例3检测试剂盒
制备一检测试剂盒,其包含能够检测SCAP基因的c.3035C>T突变(位于18号外显 子)的引物,用于筛选易患早发心肌梗死的生物样品,其中这些引物为SCAP基因外显子特异 性引物(针对SCAP基因18号外显子),其序列如实施例1中所述SEQIDNO:37-38所示。
利用上述试剂盒筛选易患早发心肌梗死的生物样品的具体步骤为:按照实施例2 的步骤1所述的方法提取待测者DNA,以所提取的DNA为模板与上述SCAP基因的外显子特异 性引物进行PCR反应,并按照本领域常规方法对PCR产物纯化,将纯化的产物进行测序,然后 通过观察测序所得到的序列是否具有c.3035C>T突变,能够有效地检测本发明的SCAP基因 突变体在待测者DNA中是否存在,从而能够有效地检测待测者是否易患早发心肌梗死,进一 步,能够从待测者中筛选出易患早发心肌梗死的生物样品。
具体地,利用上述试剂盒对实施例1中所述的早发心肌梗死患者家系中的三名患 者(PMI1-1、PMI1-3及PMI1-8)和16个家系内正常人,以及200名家系外正常人的SCAP基因进 行c.3035C>T突变检测,结果发现,该早发心肌梗死患者家系中患者都携带有c.3035C>T突 变,而家系内正常人以及家系外正常人都未携带该突变。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示 例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特 点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不 一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何 的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不 脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本 发明的范围由权利要求及其等同物限定。