一种全基因组DNA甲基化的导向测序技术.pdf

上传人:小*** 文档编号:8905039 上传时间:2021-01-11 格式:PDF 页数:17 大小:2.95MB
返回 下载 相关 举报
摘要
申请专利号:

CN201310572289.X

申请日:

20131115

公开号:

CN103555856B

公开日:

20150211

当前法律状态:

有效性:

有效

法律详情:

IPC分类号:

C12Q1/68

主分类号:

C12Q1/68

申请人:

复旦大学

发明人:

于文强,李岩,吴飞珍

地址:

200433 上海市杨浦区邯郸路220号

优先权:

CN201310572289A

专利代理机构:

上海专利商标事务所有限公司

代理人:

陈静

PDF下载: PDF下载
内容摘要

本发明涉及一种全基因组DNA甲基化的导向测序技术。本发明提供了一种新的核酸甲基化的测定方法。具体地说提供了一种核酸甲基化检测的“定位”理念,即测序时部分序列用来定位,另一部分序列用于甲基化的检测,从而彻底解决了全基因组甲基化检测及生物信息学分析时遇到的定位问题。

权利要求书

1.一种核酸甲基化的测定方法,其特征在于,所述的核酸是双链,所述方法包括:(1)针对核酸双链,利用具有3’→5’方向切割功能的聚合酶或3’→5’核酸外切酶处理,使两条链分别在3’端产生80-200个碱基缺失;(2)加入dNTP,其中的胞嘧啶为甲基化修饰的胞嘧啶,使双链3’端的缺失被补平且其中的胞嘧啶为甲基化修饰的胞嘧啶;(3)处理步骤(2)的双链,使未被甲基化修饰的胞嘧啶转变为尿嘧啶、甲基化修饰的胞嘧啶则不变;(4)PCR扩增,进行甲基化测序,其中一部分序列中未甲基化的胞嘧啶已转变为胸腺嘧啶,用于判断甲基化位点;另一部分序列因胞嘧啶发生甲基化而与原核酸序列相同,用于数据分析时的序列定位;将两部分序列比对,从而得知核酸的甲基化状况。 2.如权利要求1所述的方法,其特征在于,步骤(3)中,应用重硫酸盐、重亚硫酸盐、亚硫酸氢盐或重亚硫酸氢盐处理步骤(2)的双链。 3.如权利要求1所述的方法,其特征在于,所述的核酸是长度大于2kb的核酸或是全基因组,在步骤(1)之前,还包括:将核酸序列进行打断,形成长度为200-1000bp的双链片段。 4.如权利要求1所述的方法,其特征在于,应用于感兴趣的基因位点的检测,其中步骤(4)包括:设计用于扩增感兴趣的基因位点的PCR扩增引物,一条引物定位于胞嘧啶发生甲基化的序列位置;另一引物定位于未甲基化的胞嘧啶已转变为胸腺嘧啶的序列位置,进行PCR扩增,得到感兴趣的基因位点的序列并进行甲基化分析。 5.如权利要求1所述的方法,其特征在于,步骤(2)中,在进行补平之后,还包括:在步骤(2)的双链的两端加上测序接头,从而应用于高通量测序。 6.如权利要求5所述的方法,其特征在于,所述的测序接头如下连接:在双链的3’末端加上1个突出的A,应用带有3’末端含有一个突出的T的测序接头与之连接。 7.如权利要求6所述的方法,其特征在于,所述的测序接头是甲基接头,后续采用高通量测序方法测序。 8.如权利要求1所述的方法,其特征在于,所述的胞嘧啶的甲基化修饰包括:CpG甲基化,CHG甲基化或CHH甲基化。 9.如权利要求1所述的方法,其特征在于,所述的具有3’→5’方向切割功能的聚合酶包括:T4DNA聚合酶,T7DNA聚合酶,Klenow酶;所述的3’→5’核酸外切酶包括:核酸外切酶III。 10.如权利要求9所述的方法,其特征在于,当步骤(1)应用3’→5’核酸外切酶时,步骤(2)中还加入聚合酶。 11.如权利要求10所述的方法,其特征在于,所述的聚合酶包括:Taq酶,Pfu,逆转录酶。 12.如权利要求1所述的方法,其特征在于,步骤(4)中,与原核酸序列相同的序列为双端测序中的一个read,或是单端测序中一个read的一部分。 13.如权利要求12所述的方法,其特征在于,进行双端测序,测序结果中,一端核酸序列中未甲基化的胞嘧啶已转变为胸腺嘧啶,用于判断甲基化位点;另一端序列因胞嘧啶发生甲基化而与原核酸序列相同,用于序列定位;将双端序列进行比对,从而得知核酸的甲基化状况。 14.如权利要求1所述的方法,其特征在于,步骤(4)中,核酸序列的分析比对方法为双端测序,一端序列作初步定位,另一端序列在其附近检索,所述的方法包括:(a)将一端序列定位到基因组上,允许每个序列定位到基因组的多个位置;(b)为已定位到基因组上的序列匹配另一端序列;(c)根据在基因组中的初步定位,在其附近寻找另一端的位置;(d)若可获得多个比对位置,选取最佳比对位置;(e)去除PCR产生的扩增序列;(f)分析基因组的甲基化水平,统计甲基化率。

说明书

技术领域

本发明属分子生物学-表观遗传学领域;更具体地,本发明涉及全基因组 DNA甲基化的导向测序技术。

背景技术

DNA甲基化是表观遗传学的重要组成部分,其在维持正常细胞功能、胚胎 发育、疾病发生以及人类肿瘤中发挥着至关重要的作用。DNA甲基化的水平, 尤其是基因启动子区甲基化的水平直接影响着基因的转录活性,控制着基因的 表达,在生命过程中DNA甲基化扮演着重要的角色。因此DNA甲基化的研究 在表观遗传学,甚至在整个生命科学领域都是研究的重中之重。

DNA甲基化的检测方法很多,但根据其原理主要可以分为以下三类:

1.基于甲基化敏感限制性内切酶的方法

甲基化敏感的限制性内切酶(methylation-sensitive restriction endonucleases, MSREs)是一类对甲基化修饰敏感的内切酶。此类酶在其切割位点中含有一个甲 基化碱基就可以阻断该内切酶对DNA的切割,再通过Southern Blot或者PCR 来检测。这种方法中最常用的是HpaII和MspI这一对内切酶,HpaII和MspI 识别序列相同但HpaII对甲基化敏感而MspI对甲基化不敏感,此法的优点是操 作简单,缺点是因为受到内切酶酶切位点的限制,对于可研究的甲基化区域受 到很大的限制。

2.基于DNA甲基化抗体的方法

基于抗体的DNA甲基化研究方法是应用甲基胞嘧啶抗体或是甲基化结合 蛋白的抗体来研究DNA甲基化。其原理和操作都类似于ChIP,即将抗体亲和 的DNA片段进行芯片杂交或者测序。优点是可以在全基因组范围内研究DNA 甲基化的变化情况,但此方法缺乏精确性,无法知道单个碱基的甲基化情况, 而且该方法容易受到基因组中不同区域CG含量的影响,从而对于基因组中低 CG含量的区域缺乏敏感性。

3.基于亚硫酸氢钠的方法

DNA甲基化的检测方法中应用最广的是基于亚硫酸氢钠的方法。其优点在 于可以精确检测单碱基分辨率甲基化变化情况。这种方法的原理为DNA经过 亚硫酸氢钠处理后未被甲基化修饰的C(胞嘧啶)可转变为U(尿嘧啶),然而有甲 基化修饰的C则不会发生改变,经过PCR扩增后测序,再与原序列对比就可 以得到基因组中某段区域的甲基化修饰情况。

近年来随着人们对DNA甲基化研究的深入,这些传统的方法已经远远不 能满足研究的需要。随着高通量测序技术的发展,DNA甲基化检测也由单基因 水平逐渐向整个基因组水平发展。这样基于以上三种方法与高通量技术相结合 又衍生出了很多方法:如MeDIP,RRBS,HELP等,但其中应用最广,覆盖基 因组最多、最精确的方法为MethyIC-seq。其原理为基因组DNA经过亚硫酸氢 钠处理后直接进行高通量测序,从理论上讲,对测序结果进行分析后就可以得 到整个基因组单碱基分辨率的甲基化修饰情况。但是实际操作中对MethyIC-seq 的数据进行分析时却遇到了很大的问题:①由于亚硫酸氢钠处理后基因组中大 多数的胞嘧啶(C)都会转变为胸腺嘧啶(T),造成碱基不平衡,测序得到的结果 比对(map)到参考基因组上效率有限,有的位置即使增大测序通量也无法得到 DNA甲基化信息,所以到目前为止全世界还没有绘制出任何一张细胞完整甲基 化图谱。Felix Krueger等人在Nature Method(Nat Methods.2012Jan30; 9(2):145-51.)杂志上对于DNA甲基测序数据分析中遇到的问题进行了详细的论 述。②该检测方法的设计策略缺陷也使其存在很强的倾向性,容易检测出高甲 基化区域,对低甲基化、CG含量少以及一些重复序列缺乏敏感度。

总体来说,到目前为止MethyIC-seq是DNA甲基化研究比较好的方法, 但是其本身的设计缺陷和检测偏好性以及生物信息学分析时遇到的问题却极 大地阻碍了其应用。而本发明中所使用的定位理念可以彻底解决这些问题,把 人们对DNA甲基化的研究提高到了一个新的高度。

发明内容

本发明的目的在于提供一种全基因组DNA甲基化的导向测序技术。

在本发明的第一方面,提供一种核酸甲基化的测定方法,所述的核酸是双 链,所述方法包括:

(1)针对核酸双链,利用具有3’→5’方向切割功能的聚合酶或3’→5’核酸 外切酶处理,使两条链分别在3’端产生80-200个碱基(较佳地100-150个碱基) 缺失;

(2)加入dNTP,其中的胞嘧啶(C)为甲基化修饰的胞嘧啶(5mC),使双链3’ 端的缺失被补平且其中的胞嘧啶为甲基化修饰的胞嘧啶;

(3)处理步骤(2)的双链,使未被甲基化修饰的胞嘧啶转变为尿嘧啶(U)、甲 基化修饰的胞嘧啶则不变;

(4)PCR扩增(该过程中尿嘧啶转换为胸腺嘧啶(T)),进行甲基化测序,其 中一部分序列中未甲基化的胞嘧啶(C)已转变为胸腺嘧啶(T),用于判断甲基化 位点;另一部分序列因胞嘧啶发生甲基化而与原核酸序列相同,用于数据分析 时的序列定位;将两部分序列比对(如果检测的物种序列已知则不需要拼接;未 知序列的物种可以将用于定位的那一端进行拼接后再进行甲基化比对),从而得 知核酸的甲基化状况。

在本发明的另一方面,所述的核酸甲基化的测定方法同样可用于单个基因 位点的检测,其中步骤(4)包括:设计用于扩增感兴趣的基因位点的PCR扩增 引物,一条引物定位于胞嘧啶发生甲基化的序列位置;另一引物定位于未甲基 化的胞嘧啶已转变为胸腺嘧啶的序列位置,进行PCR扩增,得到感兴趣的基因 位点的序列并进行甲基化分析。

在一个优选例中,步骤(3)或步骤(b)中,应用重硫酸盐、重亚硫酸盐、亚硫 酸氢盐或重亚硫酸氢盐处理步骤(2)的双链。

在另一优选例中,所述的核酸是长度大于2kb(如大于3kb、5kb、10kb)的 核酸或是全基因组,在步骤(1)之前,还包括:将核酸序列进行打断(较佳地, 采用超声打断),形成长度为200-1000bp(较佳地400-700bp;更佳地500bp)的 双链片段。

在另一优选例中,步骤(2)中,在进行补平之后,还包括:在步骤(2)的双链 的两端加上测序接头,从而应用于高通量测序。

在另一优选例中,所述的测序接头如下连接:在双链的3’末端加上1个突 出的A),应用带有(3’末端含有一个突出的T)的测序接头与之连接;较佳地, 所述的测序接头是甲基接头(Methyl Adapter;如Illumina Methyl Adapter),后续 采用高通量测序方法测序,例如Illumina high seq2000,Illumina high seq2500、 ABI solid、Roche454。

在另一优选例中,所述的胞嘧啶的甲基化修饰包括:CpG甲基化,CHG 甲基化或CHH甲基化。

在另一优选例中,所述的具有3’→5’方向切割功能的聚合酶包括(但不限 于):T4DNA聚合酶,T7DNA聚合酶,Klenow酶;

所述的3’→5’核酸外切酶包括(但不限于):核酸外切酶III;较佳地,当步 骤(1)应用3’→5’核酸外切酶时,步骤(2)中还加入聚合酶;较佳地,所述的聚合 酶包括(但不限于):Taq酶,Pfu,逆转录酶。

在另一优选例中,所述的T4DNA聚合酶处理的时间为60-140分钟;较佳 地为80-120分钟。

在另一优选例中,所述的核酸是DNA或RNA。

在另一优选例中,步骤(4)或步骤(c)中,与原核酸序列相同的序列为双端测 序中的一个read,或是单端测序中一个read的一部分(如单端测序为100bp时 前50bp用于定位,后50bp用于甲基化检测);较佳地,进行双端测序,测序结 果中,一端(read1或read2)核酸序列中未甲基化的胞嘧啶(C)已转变为胸腺嘧啶 (T),用于判断甲基化位点;另一端(read2或read1)序列因胞嘧啶发生甲基化而 与原核酸序列相同,用于序列定位;将双端序列进行比对,从而得知核酸的甲 基化状况。

本发明的另一方面,提供一种核酸序列的分析比对方法,包括:序列为双 端测序,一端序列作初步定位,另一端序列在其附近检索,所述的方法包括:

(a)将一端序列定位到基因组上,允许每个序列定位到基因组的多个位置;

(b)为已定位到基因组上的序列匹配另一端序列;

(c)根据在基因组中的初步定位,在其附近寻找另一端的位置;

(d)若可获得多个比对位置,选取最佳比对位置;

(e)去除PCR产生的扩增序列;

(f)分析基因组的甲基化水平,统计甲基化率。

在另一优选例中,所述的双端序列是指在核酸序列5’端和3’分别作一定长 度的测序,如在Illumina Hiseq200,Illumina Hiseq2500,以及Illumina Analyzer  Genome IIx上的Pair-End的测序;

在另一优选例中,所述的一端序列初步定位到基因组的多个位置是指定位 到20个或50个以下的位置(但不限于如此)。

在另一优选例中,在初步定位的附近查找,是指根据测序文库的大小的1 至3倍作为查找的范围;查找的方法包括(但不限于):字符比对,正则表达式 检索,序列检索。

在另一优选例中,最佳比对位置的选取依据是:两端之间的总长度是否在 文库的范围之内;错配数是否最低。

本发明的其它方面由于本文的公开内容,对本领域的技术人员而言是显而 易见的。

附图说明

图1、本发明实施方案中所描述的实验流程图。

图2、本发明实施方案克隆测序的一个代表性read(SEQ ID NO:1)。

图3、本发明实施方案克隆测序结果在UCSC genome browser中比对的结 果。

图4、本发明实施例1中超声打断的基因组的电泳结果。

图5、本发明实施例5中胶回收去除多余接头的结果。

图6、本发明实施例7中PCR后的电泳结果,图中显示的DNA片段为 400-700bp。

图7、应用于单个基因位点的检测的实验流程图。

具体实施方式

本发明人经过研究和探索,提供了一种新的核酸(包括DNA和RNA)甲基 化的测定方法。具体地说提供了一种核酸甲基化检测的“定位”理念,即测序 时部分序列用来定位(与基因组序列相同),另一部分序列用于甲基化的检测(经 过亚硫酸盐处理后未甲基化的胞嘧啶变为尿嘧啶),从而彻底解决了甲基化检测 生物信息学分析时遇到的定位问题。在此基础上完成了本发明。

本发明是利用具有3’→5’方向切割功能的聚合酶或3’→5’核酸外切酶处理 核酸双链,使双链产生3’缺失,然后加入的dNTP(其中胞嘧啶(C)为甲基化修饰 的胞嘧啶(5mC)),以聚合酶会使双链上缺失部分产生5’向3’延伸,使核酸链的 3’缺失补平并将5mC掺入到3’端。这样经过亚硫酸氢盐(或其类似物)处理后进 行双端测序,测序的一端(read1)C就会变为T,而另一端(read2)由于C都为甲 基化的C则保持原基因组序列不变,这样read1可以对基因组的甲基化程度进 行分析,而read2就可以在基因组中进行map,这样就彻底解决了甲基化测序 中数据分析的问题。

使双链产生3’端缺失的酶可以是具有3’→5’方向切割功能的聚合酶或3’→ 5’核酸外切酶。其中,所述的具有3’→5’方向切割功能的聚合酶包括但不限于: T4DNA聚合酶,T7DNA聚合酶,Klenow酶。所述的3’→5’核酸外切酶包括 但不限于:核酸外切酶III。

作为本发明的优选方式,应用具有3’→5’方向切割功能的聚合酶,这样, 在需要使得双链产生3’端缺失时,其可发挥3’→5’方向切割功能;当需要使得 3’端在加入dNTP后延伸时,其可发挥聚合酶的作用。最优选地,所述的具有 3’→5’方向切割功能的聚合酶是T4DNA聚合酶。

当应用3’→5’核酸外切酶使得双链产生3’端缺失时,后续需要进一步加入 聚合酶来使得3’端在含有dNTP的情况下延伸。

亚硫酸氢盐处理后测序(bisulfite sequencing PCR,BSP)方法是检测基因甲 基化的经典方法,其原理为:用亚硫酸氢盐修饰处理基因组DNA,所有未发生 甲基化的胞嘧啶(C)被转化为尿嘧啶(U)而甲基化的胞嘧啶则不变。因而,经过 亚硫酸氢盐或重亚硫酸氢盐处理核酸后,甲基化的位点产生类似于一个C/T的 多核苷酸多态性(SNP)。基因组DNA经亚硫酸盐处理后,扩增目的片段,此时 尿嘧啶(U)全部转化为胸腺嘧啶(T),最后对PCR产物进行测序就可以判断是否 发生甲基化。

本发明的方法适用于长度较长的核酸,例如长度大于10kb的核酸或是全 基因组。本发明的方法也可以应用于短的核酸。对于不同长度的核酸,在核酸 打断时需要控制长度,例如可通过控制超声打断时的超声时间来控制长度。对 于较长的核酸,先进行核酸序列的打断,以有利于后续的操作。本发明对于将 核酸打断的方法没有特别的限制,可以应用本领域已知的各种方法;较佳地, 采用超声打断的方法。超声的条件主要取决于所应用的超声设备核酸的G+C含 量和所需片段的大小等。本实验应用BioRuptor公司生产的非接触式超声仪进 行超声打断一般来说如果基因组G+C含量在50%左右,最高功率超声6次, 每次30秒间歇30秒,可得到400-700bp左右的片段。应用不同的超声系统, 如要获得较佳的超声条件,可以根据电泳情况来获得超声打断后的序列片段的 大小。

作为本发明的优选方式,将长的核酸或基因组序列打断,以形成长度为 200-1000bp;较佳地400-700bp;更佳地500bp的双链片段。

当核酸序列较长时或针对全基因组序列进行测定时,需要采用高通量测序 技术。此时,在使双链3’端的缺失被补平且其中的胞嘧啶为甲基化修饰的胞嘧 啶后,还包括:被补平的双链的两端加上测序接头,从而应用于高通量测序。 本发明中,所述的测序接头是指配合一些高通量测序技术而涉及的核酸接头, 本领域技术人员清楚针对具体的测序技术所应用的测序接头,例如,Illumina 公司的测序技术为广大用户提供了强大的高通量测序方法,其提供商品化的测 序接头以便于待测序列与其测序仪器实现对接;Illumina测序技术以外的其它 测序技术及其测序接头也是商品化的或是本领域技术人员所了解的。

本发明的方法同样适用于起始于核酸单链的测序,通过在合成第二链时掺 入胞嘧啶(C)发生甲基化修饰的dNTP,使得后续的亚硫酸氢盐处理后,合成的 核酸双链的两条链中一条链后续碱基不转变,而未甲基化修饰的链胞嘧啶发生 转变。因此,测序时一条序列用来定位,另一条序列用于甲基化的检测。

本发明的方法不但可以直接检测整个基因组甲基化的水平,而且还可以与 其他方法联合使用,如RRBS,从而提高RRBS的map效率。此外本方法还可 以对未知物种进行测序,利用read2进行序列的拼接,而read1检测甲基化水平, 这样可以同时得到这个物种的基因组序列和基因组甲基化水平。本发明的甲基 化测序是指胞嘧啶上的甲基化,包括CpG甲基化,CHG甲基化和CHH甲基化。

本发明克服了现有甲基化检测技术的缺点,以高通量高分辨率为目的,可 以真正做到在全基因组范围内、单碱基分辨率研究DNA甲基化的分布情况, 得到表观基因组的同时也可得到基因组的信息。

下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说 明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方 法,通常按照常规条件如J.萨姆布鲁克等编著,分子克隆实验指南,第三版, 科学出版社,2002中所述的条件,或按照制造厂商所建议的条件。

以下实施例主要为检测组织及细胞中全基因组DNA甲基化情况,整个过 程包括超声打断DNA,T4DNA聚合酶处理,末端加“A”,接头连接,胶回 收去接头,重亚硫酸氢钠处理,PCR扩增等步骤,主要流程如图1。

实施例1、超声打断DNA

将提取好的人类细胞系293T基因组DNA3ug溶解于250ul超纯水中,使 用合适的超声条件将DNA打断至400-700bp左右的片段,使用QIAGEN公司 PCR回收试剂盒回收超声产物,具体的操作步骤为在超声产物中加入5倍体积 (1ml)缓冲液PB,轻弹充分混匀,瞬离,转至柱子中,13000rpm离心1min。 去除洗脱液体。加入750ul缓冲液PE(已加乙醇),13000rpm离心1min,同上 去除液体。再加入500ul bufferPE,再次洗涤一次,去除液体,盖上盖子,空转 2min,打开盖子,静置,晾干。加入170ul超纯水静置1-2min,13000rpm离心 1min,洗脱液备用。

超声打断的基因组进行电泳,结果如图4,从图中可以看出超声3min时 DNA已经超声到1000bp到200bp之间,且主要集中在500bp左右。

实施例2、T4DNA聚合酶处理

在回收产物中依次加入下列试剂:

10×NEB缓冲液2        20ul

T4DNA聚合酶           10ul

轻弹充分混匀,瞬离(1000g离心30秒时间),12℃酶切100min约切除3’ 端100-150个碱基;之后,加入终浓度为10mM的dNTP(其中胞嘧啶为甲基化 修饰胞嘧啶即5mC),轻弹充分混匀,瞬离(1000g离心30秒),37℃15min。PCR 回收(过程同上),最终用42ul超纯水洗脱备用。

实施例3、3’末端加1个“A”

在回收产物中依次加入下列试剂:

10×NEB缓冲液2                      5ul

10mM dATP                           1.5ul

缺失了3’到5’外切酶活性的Klenow    3ul

轻弹充分混匀,瞬离,37℃,1h,使用QIAGEN公司Mini Elute PCR回 收试剂盒回收,17.5ul超纯水洗脱备用。

实施例4、接头连接

在回收产物中依次加入下列试剂:

10×T4DNA连接缓冲液                        2.5ul

Illumina甲基接头(Illumina Methyl Adapter)  5ul

T4DNA连接酶                                1ul

轻弹充分混匀,瞬离,16℃连接过夜。其中,Illumina Methyl Adapter是 illumina公司生产的用于甲基化高通量测序的接头。

实施例5、胶回收去除多余接头

1.配胶

用80-90ml TAE配制2%(重量比)的琼脂糖(Invitrogen),在微波炉中煮熟沸 腾2-3次,待瓶子不烫时,加入EB3ul,充分混匀,倒板。

2.电泳

样品中加入5ul10×上样缓冲液,准备100bp marker,两边加marker,中 间加样品,注意不同样品间隔一个孔,防止污染。150V电泳40min。

3.割胶

先用纸蘸取TAE清洗紫外凝胶成像载物台,铺上保鲜膜。尽量减少胶在紫 外下照射的时间。15ml离心管称重,记录。割取400-700bp的凝胶片段,记 录胶在切割前后的照片,将胶放入管子中。称量,记录。

4.胶回收

使用QIAGEN公司Gel Extractionmini elute kit回收凝胶中的DNA, 100mg=100ul体积,加入3倍体积Buffer QG,42℃10min,每隔2-3min混匀 一次直至完全溶解。瞬离,加入一倍体积的异丙醇,瞬离,每次取750ul至Elute 柱,13000rpm离心1min,加入500ul BufferQG,离心1min。加入750uL Buffer PE,离心1min,再一次加入500ul buffer PE洗涤,空转2min,打开盖子,静 置,晾干,加入22ul超纯水,静置1-2min,13000rpm离心1min,回收备用。

胶回收去除多余接头的结果如图5,左图中400bp以上的大片段为超声后 的基因组DNA,200bp左右的小片段为要去除的接头DNA。右图中所示为切 较后凝胶图片,图中400-700bp大小的DNA已经切去并进行回收。

实施例6、重亚硫酸氢钠处理DNA

使用Zymo-Research公司甲基化试剂盒处理上述回收产物,将20ul回收产 物加入130ul CT转换试剂(CT Conversion Reagent)中,将瞬离后的样品放入PCR 仪,设定反应程序如下:98℃,10min;64℃,2.5h;4℃,∞;将Zymo柱 (Zymo-Spin(TM)IC Column)放入收集管(Collection Tube)中,加入600ul M-结合 液(M-Binding Buffer),然后加入反应后的样品,盖紧,颠倒混匀; 12,000rpm(<10,000g)离心30s;加入100ul M-清洗液(M-Wash Buffer),12,000rpm 离心30s;加入200ul M-脱磺化液(M-Desulphonation Buffer),室温(20~30℃) 静置15~20min,12,000rpm离心30s;加入200ul M-清洗液(M-Wash Buffer), 12,000rpm离心30s,去除收集管中的废液;重复清洗一次;将柱子移入干净 的1.5ml EP管中,在柱子底部加入10ul M-溶解液(M-Elution Buffer),12,000rpm 离心30s,洗脱液备用。

实施例7、PCR扩增

由于亚硫酸氢钠处理后的DNA片段中C转变为U,普通的高保真酶无法 识别U从而造成处理后的片段无法扩增,本实验中使用KAPA公司生产的2x KAPA mix进行扩增,可以克服这一问题。

在PCR管中加入下列试剂:

反应条件:

PCR产物经过电泳,电泳结果如图6,图中显示的DNA片段为400-700bp, 这与实施例5胶回收的大小一致。

电泳后,进行胶回收,定量后可进行高通量测序。

图2显示了基因组高通量测序的一个read。其中阴影区域为甲基化C掺入 的区域,即数据分析中用来定位的区域,结果可以看出在测序结果的5’端阴 影区域内C和G的碱基都存在(相当于高通量测序用于定位的那一端),而在测 序结果的3’端则只有C存在而没有G的存在(相当于高通量测序用于甲基化检 测的那一端)(由于克隆测序测的是反链,原结果应该是只有G而没有C),说明 该方法已经达到了高通量测序的要求。

图3显示了本发明实施方案克隆测序结果在UCSC genome browser中比对 的代表性结果,图的上半部分显示测序的结果与原基因组相同(即用于定位的部 分),图的下半部分显示所有非CG的G都变为了A(即用于甲基化检测的部分)。

本发明的方法同样可应用于单个基因位点的检测,其实验流程图如图7。 通过设计用于扩增感兴趣的基因位点的PCR扩增引物,一条引物定位于胞嘧啶 发生甲基化的序列位置;另一引物定位于未甲基化的胞嘧啶已转变为胸腺嘧啶 的序列位置,进行PCR扩增,得到感兴趣的基因位点的序列并进行甲基化分析。

在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献 被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后, 本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申 请所附权利要求书所限定的范围。

一种全基因组DNA甲基化的导向测序技术.pdf_第1页
第1页 / 共17页
一种全基因组DNA甲基化的导向测序技术.pdf_第2页
第2页 / 共17页
一种全基因组DNA甲基化的导向测序技术.pdf_第3页
第3页 / 共17页
点击查看更多>>
资源描述

《一种全基因组DNA甲基化的导向测序技术.pdf》由会员分享,可在线阅读,更多相关《一种全基因组DNA甲基化的导向测序技术.pdf(17页珍藏版)》请在专利查询网上搜索。

1、(10)授权公告号 CN 103555856 B (45)授权公告日 2015.02.11 CN 103555856 B (21)申请号 201310572289.X (22)申请日 2013.11.15 C12Q 1/68(2006.01) (73)专利权人 复旦大学 地址 200433 上海市杨浦区邯郸路 220 号 (72)发明人 于文强 李岩 吴飞珍 (74)专利代理机构 上海专利商标事务所有限公 司 31100 代理人 陈静 CN 101802223 A,2010.08.11, 全文 . CN 102329873 A,2012.01.25, 全文 . CN 103088433 A,2。

2、013.05.08, 全文 . CN 103103624 A,2013.05.15, 全文 . CN 102181943 B,2013.06.05, 全文 . 赵超等 .DNA 羟甲基化测序技术 .化学学 报 .2013,( 第 1 期 ), 第 26-35 页 . (54) 发明名称 一种全基因组 DNA 甲基化的导向测序技术 (57) 摘要 本发明涉及一种全基因组 DNA 甲基化的导向 测序技术。本发明提供了一种新的核酸甲基化的 测定方法。具体地说提供了一种核酸甲基化检测 的 “定位” 理念, 即测序时部分序列用来定位, 另一 部分序列用于甲基化的检测, 从而彻底解决了全 基因组甲基化检测。

3、及生物信息学分析时遇到的定 位问题。 (51)Int.Cl. (56)对比文件 审查员 李谦 权利要求书 2 页 说明书 8 页 序列表 1 页 附图 5 页 (19)中华人民共和国国家知识产权局 (12)发明专利 权利要求书2页 说明书8页 序列表1页 附图5页 (10)授权公告号 CN 103555856 B CN 103555856 B 1/2 页 2 1. 一种核酸甲基化的测定方法, 其特征在于, 所述的核酸是双链, 所述方法包括 : (1) 针对核酸双链, 利用具有 3 5 方向切割功能的聚合酶或 3 5 核酸外切酶处 理, 使两条链分别在 3 端产生 80-200 个碱基缺失 ; 。

4、(2) 加入 dNTP, 其中的胞嘧啶为甲基化修饰的胞嘧啶, 使双链 3 端的缺失被补平且其 中的胞嘧啶为甲基化修饰的胞嘧啶 ; (3) 处理步骤 (2) 的双链, 使未被甲基化修饰的胞嘧啶转变为尿嘧啶、 甲基化修饰的胞 嘧啶则不变 ; (4)PCR 扩增, 进行甲基化测序, 其中一部分序列中未甲基化的胞嘧啶已转变为胸腺嘧 啶, 用于判断甲基化位点 ; 另一部分序列因胞嘧啶发生甲基化而与原核酸序列相同, 用于数 据分析时的序列定位 ; 将两部分序列比对, 从而得知核酸的甲基化状况。 2. 如权利要求 1 所述的方法, 其特征在于, 步骤 (3) 中, 应用重硫酸盐、 重亚硫酸盐、 亚 硫酸氢盐。

5、或重亚硫酸氢盐处理步骤 (2) 的双链。 3.如权利要求1所述的方法, 其特征在于, 所述的核酸是长度大于2kb的核酸或是全基 因组, 在步骤(1)之前, 还包括 : 将核酸序列进行打断, 形成长度为200-1000bp的双链片段。 4. 如权利要求 1 所述的方法, 其特征在于, 应用于感兴趣的基因位点的检测, 其中步骤 (4) 包括 : 设计用于扩增感兴趣的基因位点的 PCR 扩增引物, 一条引物定位于胞嘧啶发生甲基化 的序列位置 ; 另一引物定位于未甲基化的胞嘧啶已转变为胸腺嘧啶的序列位置, 进行 PCR 扩增, 得到感兴趣的基因位点的序列并进行甲基化分析。 5. 如权利要求 1 所述的。

6、方法, 其特征在于, 步骤 (2) 中, 在进行补平之后, 还包括 : 在步 骤 (2) 的双链的两端加上测序接头, 从而应用于高通量测序。 6. 如权利要求 5 所述的方法, 其特征在于, 所述的测序接头如下连接 : 在双链的 3 末 端加上 1 个突出的 A, 应用带有 3 末端含有一个突出的 T 的测序接头与之连接。 7. 如权利要求 6 所述的方法, 其特征在于, 所述的测序接头是甲基接头, 后续采用高通 量测序方法测序。 8. 如权利要求 1 所述的方法, 其特征在于, 所述的胞嘧啶的甲基化修饰包括 : CpG 甲基 化, CHG 甲基化或 CHH 甲基化。 9. 如权利要求 1 所。

7、述的方法, 其特征在于, 所述的具有 3 5 方向切割功能的聚合酶 包括 : T4DNA 聚合酶, T7DNA 聚合酶, Klenow 酶 ; 所述的 3 5 核酸外切酶包括 : 核酸外切酶 III。 10. 如权利要求 9 所述的方法, 其特征在于, 当步骤 (1) 应用 3 5 核酸外切酶时, 步 骤 (2) 中还加入聚合酶。 11. 如权利要求 10 所述的方法, 其特征在于, 所述的聚合酶包括 : Taq 酶, Pfu, 逆转录 酶。 12.如权利要求1所述的方法, 其特征在于, 步骤(4)中, 与原核酸序列相同的序列为双 端测序中的一个 read, 或是单端测序中一个 read 的一。

8、部分。 13. 如权利要求 12 所述的方法, 其特征在于, 进行双端测序, 测序结果中, 一端核酸序 列中未甲基化的胞嘧啶已转变为胸腺嘧啶, 用于判断甲基化位点 ; 另一端序列因胞嘧啶发 生甲基化而与原核酸序列相同, 用于序列定位 ; 将双端序列进行比对, 从而得知核酸的甲基 权 利 要 求 书 CN 103555856 B 2 2/2 页 3 化状况。 14.如权利要求1所述的方法, 其特征在于, 步骤(4)中, 核酸序列的分析比对方法为双 端测序, 一端序列作初步定位, 另一端序列在其附近检索, 所述的方法包括 : (a) 将一端序列定位到基因组上, 允许每个序列定位到基因组的多个位置 。

9、; (b) 为已定位到基因组上的序列匹配另一端序列 ; (c) 根据在基因组中的初步定位, 在其附近寻找另一端的位置 ; (d) 若可获得多个比对位置, 选取最佳比对位置 ; (e) 去除 PCR 产生的扩增序列 ; (f) 分析基因组的甲基化水平, 统计甲基化率。 权 利 要 求 书 CN 103555856 B 3 1/8 页 4 一种全基因组 DNA 甲基化的导向测序技术 技术领域 0001 本发明属分子生物学-表观遗传学领域 ; 更具体地, 本发明涉及全基因组DNA甲基 化的导向测序技术。 背景技术 0002 DNA 甲基化是表观遗传学的重要组成部分, 其在维持正常细胞功能、 胚胎发育。

10、、 疾 病发生以及人类肿瘤中发挥着至关重要的作用。 DNA甲基化的水平, 尤其是基因启动子区甲 基化的水平直接影响着基因的转录活性, 控制着基因的表达, 在生命过程中 DNA 甲基化扮 演着重要的角色。因此 DNA 甲基化的研究在表观遗传学, 甚至在整个生命科学领域都是研 究的重中之重。 0003 DNA 甲基化的检测方法很多, 但根据其原理主要可以分为以下三类 : 0004 1. 基于甲基化敏感限制性内切酶的方法 0005 甲 基 化 敏 感 的 限 制 性 内 切 酶 (methylation-sensitive restriction endonucleases,MSREs)是一类对甲基。

11、化修饰敏感的内切酶。 此类酶在其切割位点中含有一 个甲基化碱基就可以阻断该内切酶对 DNA 的切割, 再通过 Southern Blot 或者 PCR 来检测。 这种方法中最常用的是 HpaII 和 MspI 这一对内切酶, HpaII 和 MspI 识别序列相同但 HpaII 对甲基化敏感而 MspI 对甲基化不敏感, 此法的优点是操作简单, 缺点是因为受到内切酶酶 切位点的限制, 对于可研究的甲基化区域受到很大的限制。 0006 2. 基于 DNA 甲基化抗体的方法 0007 基于抗体的 DNA 甲基化研究方法是应用甲基胞嘧啶抗体或是甲基化结合蛋白的 抗体来研究 DNA 甲基化。其原理和操。

12、作都类似于 ChIP, 即将抗体亲和的 DNA 片段进行芯片 杂交或者测序。优点是可以在全基因组范围内研究 DNA 甲基化的变化情况, 但此方法缺乏 精确性, 无法知道单个碱基的甲基化情况, 而且该方法容易受到基因组中不同区域 CG 含量 的影响, 从而对于基因组中低 CG 含量的区域缺乏敏感性。 0008 3. 基于亚硫酸氢钠的方法 0009 DNA 甲基化的检测方法中应用最广的是基于亚硫酸氢钠的方法。其优点在于可以 精确检测单碱基分辨率甲基化变化情况。这种方法的原理为 DNA 经过亚硫酸氢钠处理后未 被甲基化修饰的C(胞嘧啶)可转变为U(尿嘧啶), 然而有甲基化修饰的C则不会发生改变, 经。

13、过 PCR 扩增后测序, 再与原序列对比就可以得到基因组中某段区域的甲基化修饰情况。 0010 近年来随着人们对 DNA 甲基化研究的深入, 这些传统的方法已经远远不能满足 研究的需要。随着高通量测序技术的发展, DNA 甲基化检测也由单基因水平逐渐向整个 基因组水平发展。这样基于以上三种方法与高通量技术相结合又衍生出了很多方法 : 如 MeDIP, RRBS, HELP 等, 但其中应用最广, 覆盖基因组最多、 最精确的方法为 MethyIC-seq。 其原理为基因组 DNA 经过亚硫酸氢钠处理后直接进行高通量测序, 从理论上讲, 对测序结 果进行分析后就可以得到整个基因组单碱基分辨率的甲基。

14、化修饰情况。但是实际操作中 对 MethyIC-seq 的数据进行分析时却遇到了很大的问题 : 由于亚硫酸氢钠处理后基因组 说 明 书 CN 103555856 B 4 2/8 页 5 中大多数的胞嘧啶 (C) 都会转变为胸腺嘧啶 (T), 造成碱基不平衡, 测序得到的结果比对 (map) 到参考基因组上效率有限, 有的位置即使增大测序通量也无法得到 DNA 甲基化信息, 所以到目前为止全世界还没有绘制出任何一张细胞完整甲基化图谱。Felix Krueger 等人 在Nature Method(Nat Methods.2012Jan30 ; 9(2):145-51.)杂志上对于DNA甲基测序数。

15、据 分析中遇到的问题进行了详细的论述。 该检测方法的设计策略缺陷也使其存在很强的倾 向性, 容易检测出高甲基化区域, 对低甲基化、 CG 含量少以及一些重复序列缺乏敏感度。 0011 总体来说, 到目前为止MethyIC-seq是DNA甲基化研究比较好的方法, 但是其本身 的设计缺陷和检测偏好性以及生物信息学分析时遇到的问题却极大地阻碍了其应用。 而本 发明中所使用的定位理念可以彻底解决这些问题, 把人们对 DNA 甲基化的研究提高到了一 个新的高度。 发明内容 0012 本发明的目的在于提供一种全基因组 DNA 甲基化的导向测序技术。 0013 在本发明的第一方面, 提供一种核酸甲基化的测定。

16、方法, 所述的核酸是双链, 所述 方法包括 : 0014 (1) 针对核酸双链, 利用具有 3 5 方向切割功能的聚合酶或 3 5 核酸外切 酶处理, 使两条链分别在 3 端产生 80-200 个碱基 ( 较佳地 100-150 个碱基 ) 缺失 ; 0015 (2) 加入 dNTP, 其中的胞嘧啶 (C) 为甲基化修饰的胞嘧啶 (5mC), 使双链 3 端的缺 失被补平且其中的胞嘧啶为甲基化修饰的胞嘧啶 ; 0016 (3) 处理步骤 (2) 的双链, 使未被甲基化修饰的胞嘧啶转变为尿嘧啶 (U)、 甲基化 修饰的胞嘧啶则不变 ; 0017 (4)PCR 扩增 ( 该过程中尿嘧啶转换为胸腺嘧。

17、啶 (T), 进行甲基化测序, 其中一部 分序列中未甲基化的胞嘧啶 (C) 已转变为胸腺嘧啶 (T), 用于判断甲基化位点 ; 另一部分序 列因胞嘧啶发生甲基化而与原核酸序列相同, 用于数据分析时的序列定位 ; 将两部分序列 比对 ( 如果检测的物种序列已知则不需要拼接 ; 未知序列的物种可以将用于定位的那一端 进行拼接后再进行甲基化比对 ), 从而得知核酸的甲基化状况。 0018 在本发明的另一方面, 所述的核酸甲基化的测定方法同样可用于单个基因位点的 检测, 其中步骤 (4) 包括 : 设计用于扩增感兴趣的基因位点的 PCR 扩增引物, 一条引物定位 于胞嘧啶发生甲基化的序列位置 ; 另一。

18、引物定位于未甲基化的胞嘧啶已转变为胸腺嘧啶的 序列位置, 进行 PCR 扩增, 得到感兴趣的基因位点的序列并进行甲基化分析。 0019 在一个优选例中, 步骤(3)或步骤(b)中, 应用重硫酸盐、 重亚硫酸盐、 亚硫酸氢盐 或重亚硫酸氢盐处理步骤 (2) 的双链。 0020 在另一优选例中, 所述的核酸是长度大于2kb(如大于3kb、 5kb、 10kb)的核酸或是 全基因组, 在步骤 (1) 之前, 还包括 : 将核酸序列进行打断 ( 较佳地, 采用超声打断 ), 形成 长度为 200-1000bp( 较佳地 400-700bp ; 更佳地 500bp) 的双链片段。 0021 在另一优选例。

19、中, 步骤(2)中, 在进行补平之后, 还包括 : 在步骤(2)的双链的两端 加上测序接头, 从而应用于高通量测序。 0022 在另一优选例中, 所述的测序接头如下连接 : 在双链的3 末端加上1个突出的A), 应用带有 (3 末端含有一个突出的 T) 的测序接头与之连接 ; 较佳地, 所述的测序接头是甲 说 明 书 CN 103555856 B 5 3/8 页 6 基接头 (Methyl Adapter ; 如 Illumina Methyl Adapter), 后续采用高通量测序方法测序, 例如 Illumina high seq2000, Illumina high seq2500、 A。

20、BI solid、 Roche454。 0023 在另一优选例中, 所述的胞嘧啶的甲基化修饰包括 : CpG 甲基化, CHG 甲基化或 CHH 甲基化。 0024 在另一优选例中, 所述的具有 3 5 方向切割功能的聚合酶包括 ( 但不限于 ) : T4DNA 聚合酶, T7DNA 聚合酶, Klenow 酶 ; 0025 所述的 3 5 核酸外切酶包括 ( 但不限于 ) : 核酸外切酶 III ; 较佳地, 当步骤 (1) 应用 3 5 核酸外切酶时, 步骤 (2) 中还加入聚合酶 ; 较佳地, 所述的聚合酶包括 ( 但 不限于 ) : Taq 酶, Pfu, 逆转录酶。 0026 在另一。

21、优选例中, 所述的 T4DNA 聚合酶处理的时间为 60-140 分钟 ; 较佳地为 80-120 分钟。 0027 在另一优选例中, 所述的核酸是 DNA 或 RNA。 0028 在另一优选例中, 步骤(4)或步骤(c)中, 与原核酸序列相同的序列为双端测序中 的一个 read, 或是单端测序中一个 read 的一部分 ( 如单端测序为 100bp 时前 50bp 用于定 位, 后 50bp 用于甲基化检测 ) ; 较佳地, 进行双端测序, 测序结果中, 一端 (read1 或 read2) 核酸序列中未甲基化的胞嘧啶 (C) 已转变为胸腺嘧啶 (T), 用于判断甲基化位点 ; 另一端 (r。

22、ead2 或 read1) 序列因胞嘧啶发生甲基化而与原核酸序列相同, 用于序列定位 ; 将双端序 列进行比对, 从而得知核酸的甲基化状况。 0029 本发明的另一方面, 提供一种核酸序列的分析比对方法, 包括 : 序列为双端测序, 一端序列作初步定位, 另一端序列在其附近检索, 所述的方法包括 : 0030 (a) 将一端序列定位到基因组上, 允许每个序列定位到基因组的多个位置 ; 0031 (b) 为已定位到基因组上的序列匹配另一端序列 ; 0032 (c) 根据在基因组中的初步定位, 在其附近寻找另一端的位置 ; 0033 (d) 若可获得多个比对位置, 选取最佳比对位置 ; 0034 。

23、(e) 去除 PCR 产生的扩增序列 ; 0035 (f) 分析基因组的甲基化水平, 统计甲基化率。 0036 在另一优选例中, 所述的双端序列是指在核酸序列 5 端和 3 分别作一定长度的 测序, 如在 Illumina Hiseq200,Illumina Hiseq2500, 以及 Illumina Analyzer Genome IIx 上的 Pair-End 的测序 ; 0037 在另一优选例中, 所述的一端序列初步定位到基因组的多个位置是指定位到 20 个或 50 个以下的位置 ( 但不限于如此 )。 0038 在另一优选例中, 在初步定位的附近查找, 是指根据测序文库的大小的1至3。

24、倍作 为查找的范围 ; 查找的方法包括 ( 但不限于 ) : 字符比对, 正则表达式检索, 序列检索。 0039 在另一优选例中, 最佳比对位置的选取依据是 : 两端之间的总长度是否在文库的 范围之内 ; 错配数是否最低。 0040 本发明的其它方面由于本文的公开内容, 对本领域的技术人员而言是显而易见 的。 附图说明 说 明 书 CN 103555856 B 6 4/8 页 7 0041 图 1、 本发明实施方案中所描述的实验流程图。 0042 图 2、 本发明实施方案克隆测序的一个代表性 read(SEQ ID NO:1)。 0043 图 3、 本发明实施方案克隆测序结果在 UCSC ge。

25、nome browser 中比对的结果。 0044 图 4、 本发明实施例 1 中超声打断的基因组的电泳结果。 0045 图 5、 本发明实施例 5 中胶回收去除多余接头的结果。 0046 图 6、 本发明实施例 7 中 PCR 后的电泳结果, 图中显示的 DNA 片段为 400-700bp。 0047 图 7、 应用于单个基因位点的检测的实验流程图。 具体实施方式 0048 本发明人经过研究和探索, 提供了一种新的核酸 ( 包括 DNA 和 RNA) 甲基化的测 定方法。具体地说提供了一种核酸甲基化检测的 “定位” 理念, 即测序时部分序列用来定位 (与基因组序列相同), 另一部分序列用于甲。

26、基化的检测(经过亚硫酸盐处理后未甲基化的 胞嘧啶变为尿嘧啶), 从而彻底解决了甲基化检测生物信息学分析时遇到的定位问题。 在此 基础上完成了本发明。 0049 本发明是利用具有 3 5 方向切割功能的聚合酶或 3 5 核酸外切酶处理 核酸双链, 使双链产生 3 缺失, 然后加入的 dNTP( 其中胞嘧啶 (C) 为甲基化修饰的胞嘧 啶 (5mC), 以聚合酶会使双链上缺失部分产生 5 向 3 延伸, 使核酸链的 3 缺失补平并将 5mC 掺入到 3 端。这样经过亚硫酸氢盐 ( 或其类似物 ) 处理后进行双端测序, 测序的一端 (read1)C 就会变为 T, 而另一端 (read2) 由于 C。

27、 都为甲基化的 C 则保持原基因组序列不变, 这样 read1 可以对基因组的甲基化程度进行分析, 而 read2 就可以在基因组中进行 map, 这 样就彻底解决了甲基化测序中数据分析的问题。 0050 使双链产生 3 端缺失的酶可以是具有 3 5 方向切割功能的聚合酶或 3 5 核酸外切酶。其中, 所述的具有 3 5 方向切割功能的聚合酶包括但不限于 : T4DNA 聚合 酶, T7DNA 聚合酶, Klenow 酶。所述的 3 5 核酸外切酶包括但不限于 : 核酸外切酶 III。 0051 作为本发明的优选方式, 应用具有 3 5 方向切割功能的聚合酶, 这样, 在需要 使得双链产生 3。

28、 端缺失时, 其可发挥 3 5 方向切割功能 ; 当需要使得 3 端在加入 dNTP 后延伸时, 其可发挥聚合酶的作用。最优选地, 所述的具有 3 5 方向切割功能的聚合酶 是 T4DNA 聚合酶。 0052 当应用 3 5 核酸外切酶使得双链产生 3 端缺失时, 后续需要进一步加入聚合 酶来使得 3 端在含有 dNTP 的情况下延伸。 0053 亚硫酸氢盐处理后测序 (bisulfi te sequencing PCR, BSP) 方法是检测基因甲基 化的经典方法, 其原理为 : 用亚硫酸氢盐修饰处理基因组 DNA, 所有未发生甲基化的胞嘧啶 (C)被转化为尿嘧啶(U)而甲基化的胞嘧啶则不变。

29、。 因而, 经过亚硫酸氢盐或重亚硫酸氢盐 处理核酸后, 甲基化的位点产生类似于一个C/T的多核苷酸多态性(SNP)。 基因组DNA经亚 硫酸盐处理后, 扩增目的片段, 此时尿嘧啶(U)全部转化为胸腺嘧啶(T), 最后对PCR产物进 行测序就可以判断是否发生甲基化。 0054 本发明的方法适用于长度较长的核酸, 例如长度大于 10kb 的核酸或是全基因组。 本发明的方法也可以应用于短的核酸。 对于不同长度的核酸, 在核酸打断时需要控制长度, 例如可通过控制超声打断时的超声时间来控制长度。对于较长的核酸, 先进行核酸序列的 说 明 书 CN 103555856 B 7 5/8 页 8 打断, 以有。

30、利于后续的操作。 本发明对于将核酸打断的方法没有特别的限制, 可以应用本领 域已知的各种方法 ; 较佳地, 采用超声打断的方法。 超声的条件主要取决于所应用的超声设 备核酸的 G+C 含量和所需片段的大小等。本实验应用 BioRuptor 公司生产的非接触式超声 仪进行超声打断一般来说如果基因组 G+C 含量在 50% 左右, 最高功率超声 6 次, 每次 30 秒 间歇 30 秒, 可得到 400-700bp 左右的片段。应用不同的超声系统, 如要获得较佳的超声条 件, 可以根据电泳情况来获得超声打断后的序列片段的大小。 0055 作为本发明的优选方式, 将长的核酸或基因组序列打断, 以形成。

31、长度为 200-1000bp ; 较佳地 400-700bp ; 更佳地 500bp 的双链片段。 0056 当核酸序列较长时或针对全基因组序列进行测定时, 需要采用高通量测序技术。 此时, 在使双链 3 端的缺失被补平且其中的胞嘧啶为甲基化修饰的胞嘧啶后, 还包括 : 被 补平的双链的两端加上测序接头, 从而应用于高通量测序。 本发明中, 所述的测序接头是指 配合一些高通量测序技术而涉及的核酸接头, 本领域技术人员清楚针对具体的测序技术所 应用的测序接头, 例如, Illumina 公司的测序技术为广大用户提供了强大的高通量测序方 法, 其提供商品化的测序接头以便于待测序列与其测序仪器实现对。

32、接 ; Illumina 测序技术 以外的其它测序技术及其测序接头也是商品化的或是本领域技术人员所了解的。 0057 本发明的方法同样适用于起始于核酸单链的测序, 通过在合成第二链时掺入胞嘧 啶 (C) 发生甲基化修饰的 dNTP, 使得后续的亚硫酸氢盐处理后, 合成的核酸双链的两条链 中一条链后续碱基不转变, 而未甲基化修饰的链胞嘧啶发生转变。 因此, 测序时一条序列用 来定位, 另一条序列用于甲基化的检测。 0058 本发明的方法不但可以直接检测整个基因组甲基化的水平, 而且还可以与其他方 法联合使用, 如RRBS, 从而提高RRBS的map效率。 此外本方法还可以对未知物种进行测序, 利。

33、用read2进行序列的拼接, 而read1检测甲基化水平, 这样可以同时得到这个物种的基因 组序列和基因组甲基化水平。本发明的甲基化测序是指胞嘧啶上的甲基化, 包括 CpG 甲基 化, CHG 甲基化和 CHH 甲基化。 0059 本发明克服了现有甲基化检测技术的缺点, 以高通量高分辨率为目的, 可以真正 做到在全基因组范围内、 单碱基分辨率研究 DNA 甲基化的分布情况, 得到表观基因组的同 时也可得到基因组的信息。 0060 下面结合具体实施例, 进一步阐述本发明。 应理解, 这些实施例仅用于说明本发明 而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法, 通常按照常规条 件如。

34、 J. 萨姆布鲁克等编著, 分子克隆实验指南, 第三版, 科学出版社, 2002 中所述的条件, 或按照制造厂商所建议的条件。 0061 以下实施例主要为检测组织及细胞中全基因组 DNA 甲基化情况, 整个过程包括超 声打断 DNA, T4DNA 聚合酶处理, 末端加 “A” , 接头连接, 胶回收去接头, 重亚硫酸氢钠处理, PCR 扩增等步骤, 主要流程如图 1。 0062 实施例 1、 超声打断 DNA 0063 将提取好的人类细胞系 293T 基因组 DNA3ug 溶解于 250ul 超纯水中, 使用合适的 超声条件将 DNA 打断至 400-700bp 左右的片段, 使用 QIAGE。

35、N 公司 PCR 回收试剂盒回收超 声产物, 具体的操作步骤为在超声产物中加入 5 倍体积 (1ml) 缓冲液 PB, 轻弹充分混匀, 瞬 离, 转至柱子中, 13000rpm 离心 1min。去除洗脱液体。加入 750ul 缓冲液 PE( 已加乙醇 ), 说 明 书 CN 103555856 B 8 6/8 页 9 13000rpm 离心 1min, 同上去除液体。再加入 500ul bufferPE, 再次洗涤一次, 去除液体, 盖 上盖子, 空转 2min, 打开盖子, 静置, 晾干。加入 170ul 超纯水静置 1-2min, 13000rpm 离心 1min, 洗脱液备用。 0064。

36、 超声打断的基因组进行电泳, 结果如图4, 从图中可以看出超声3min时DNA已经超 声到 1000bp 到 200bp 之间, 且主要集中在 500bp 左右。 0065 实施例 2、 T4DNA 聚合酶处理 0066 在回收产物中依次加入下列试剂 : 0067 10NEB 缓冲液 2 20ul 0068 T4DNA 聚合酶 10ul 0069 轻弹充分混匀, 瞬离 (1000g 离心 30 秒时间 ), 12酶切 100min 约切除 3端 100-150 个碱基 ; 之后, 加入终浓度为 10mM 的 dNTP( 其中胞嘧啶为甲基化修饰胞嘧啶即 5mC), 轻弹充分混匀, 瞬离 (100。

37、0g 离心 30 秒 ), 37 15min。PCR 回收 ( 过程同上 ), 最终用 42ul 超纯水洗脱备用。 0070 实施例 3、 3 末端加 1 个 “A” 0071 在回收产物中依次加入下列试剂 : 0072 10NEB 缓冲液 2 5ul 0073 10mM dATP 1.5ul 0074 缺失了 3 到 5 外切酶活性的 Klenow 3ul 0075 轻弹充分混匀, 瞬离, 37, 1h, 使用 QIAGEN 公司 Mini Elute PCR 回收试剂盒回 收, 17.5ul 超纯水洗脱备用。 0076 实施例 4、 接头连接 0077 在回收产物中依次加入下列试剂 : 0。

38、078 10T4DNA 连接缓冲液 2.5ul 0079 Illumina 甲基接头 (Illumina Methyl Adapter) 5ul 0080 T4DNA 连接酶 1ul 0081 轻弹充分混匀, 瞬离, 16连接过夜。 其中, Illumina Methyl Adapter是illumina 公司生产的用于甲基化高通量测序的接头。 0082 实施例 5、 胶回收去除多余接头 0083 1. 配胶 0084 用 80-90ml TAE 配制 2%( 重量比 ) 的琼脂糖 (Invitrogen), 在微波炉中煮熟沸腾 2-3 次, 待瓶子不烫时, 加入 EB3ul, 充分混匀, 倒。

39、板。 0085 2. 电泳 0086 样品中加入 5ul10 上样缓冲液, 准备 100bp marker, 两边加 marker, 中间加样 品, 注意不同样品间隔一个孔, 防止污染。150V 电泳 40min。 0087 3. 割胶 0088 先用纸蘸取 TAE 清洗紫外凝胶成像载物台, 铺上保鲜膜。尽量减少胶在紫外下照 射的时间。15ml 离心管称重, 记录。割取 400-700bp 的凝胶片段, 记录胶在切割前后的照 片, 将胶放入管子中。称量, 记录。 0089 4. 胶回收 说 明 书 CN 103555856 B 9 7/8 页 10 0090 使 用 QIAGEN 公 司 Ge。

40、l Extractionmini elute kit 回 收 凝 胶 中 的 DNA, 100mg=100ul体积, 加入3倍体积Buffer QG, 4210min, 每隔2-3min混匀一次直至完全溶 解。瞬离, 加入一倍体积的异丙醇, 瞬离, 每次取 750ul 至 Elute 柱, 13000rpm 离心 1min, 加 入500ul BufferQG, 离心1min。 加入750uL BufferPE, 离心1min, 再一次加入500ul buffer PE 洗涤, 空转 2min, 打开盖子, 静置, 晾干, 加入 22ul 超纯水, 静置 1-2min, 13000rpm 离心。

41、 1min, 回收备用。 0091 胶回收去除多余接头的结果如图 5, 左图中 400bp 以上的大片段为超声后的基因 组 DNA, 200bp 左右的小片段为要去除的接头 DNA。右图中所示为切较后凝胶图片, 图中 400-700bp 大小的 DNA 已经切去并进行回收。 0092 实施例 6、 重亚硫酸氢钠处理 DNA 0093 使用 Zymo-Research 公司甲基化试剂盒处理上述回收产物, 将 20ul 回收产物加 入 130ul CT 转换试剂 (CT Conversion Reagent) 中, 将瞬离后的样品放入 PCR 仪, 设定反 应程序如下 : 98, 10min ; 。

42、64, 2.5h ; 4, ; 将Zymo柱(Zymo-Spin(TM)IC Column)放入 收集管 (Collection Tube) 中, 加入 600ul M- 结合液 (M-Binding Buffer), 然后加入反应 后的样品, 盖紧, 颠倒混匀 ; 12,000rpm(10,000g)离心30s ; 加入100ul M-清洗液(M-Wash Buffer), 12,000rpm 离心 30s ; 加入 200ul M- 脱磺化液 (M-Desulphonation Buffer), 室 温 (20 30 ) 静置 15 20min, 12,000rpm 离心 30s ; 加入。

43、 200ul M- 清洗液 (M-Wash Buffer), 12,000rpm 离心 30s, 去除收集管中的废液 ; 重复清洗一次 ; 将柱子移入干净的 1.5ml EP管中, 在柱子底部加入10ul M-溶解液(M-Elution Buffer), 12,000rpm离心30s, 洗脱液备用。 0094 实施例 7、 PCR 扩增 0095 由于亚硫酸氢钠处理后的DNA片段中C转变为U, 普通的高保真酶无法识别U从而 造成处理后的片段无法扩增, 本实验中使用KAPA公司生产的2xKAPA mix进行扩增, 可以克 服这一问题。 0096 在 PCR 管中加入下列试剂 : 0097 009。

44、8 反应条件 : 0099 说 明 书 CN 103555856 B 10 8/8 页 11 0100 PCR 产物经过电泳, 电泳结果如图 6, 图中显示的 DNA 片段为 400-700bp, 这与实施 例 5 胶回收的大小一致。 0101 电泳后, 进行胶回收, 定量后可进行高通量测序。 0102 图 2 显示了基因组高通量测序的一个 read。其中阴影区域为甲基化 C 掺入的区 域, 即数据分析中用来定位的区域, 结果可以看出在测序结果的 5 端阴影区域内 C 和 G 的 碱基都存在 ( 相当于高通量测序用于定位的那一端 ), 而在测序结果的 3 端则只有 C 存在 而没有 G 的存在。

45、 ( 相当于高通量测序用于甲基化检测的那一端 )( 由于克隆测序测的是反 链, 原结果应该是只有 G 而没有 C), 说明该方法已经达到了高通量测序的要求。 0103 图3显示了本发明实施方案克隆测序结果在UCSC genome browser中比对的代表 性结果, 图的上半部分显示测序的结果与原基因组相同 ( 即用于定位的部分 ), 图的下半部 分显示所有非 CG 的 G 都变为了 A( 即用于甲基化检测的部分 )。 0104 本发明的方法同样可应用于单个基因位点的检测, 其实验流程图如图7。 通过设计 用于扩增感兴趣的基因位点的 PCR 扩增引物, 一条引物定位于胞嘧啶发生甲基化的序列位 。

46、置 ; 另一引物定位于未甲基化的胞嘧啶已转变为胸腺嘧啶的序列位置, 进行 PCR 扩增, 得到 感兴趣的基因位点的序列并进行甲基化分析。 0105 在本发明提及的所有文献都在本申请中引用作为参考, 就如同每一篇文献被单独 引用作为参考那样。 此外应理解, 在阅读了本发明的上述讲授内容之后, 本领域技术人员可 以对本发明作各种改动或修改, 这些等价形式同样落于本申请所附权利要求书所限定的范 围。 说 明 书 CN 103555856 B 11 1/1 页 12 0001 序 列 表 CN 103555856 B 12 1/5 页 13 图 1 说 明 书 附 图 CN 103555856 B 13 2/5 页 14 图 2 图 3 说 明 书 附 图 CN 103555856 B 14 3/5 页 15 图 4 图 5 说 明 书 附 图 CN 103555856 B 15 4/5 页 16 图 6 说 明 书 附 图 CN 103555856 B 16 5/5 页 17 图 7 说 明 书 附 图 CN 103555856 B 17 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 化学;冶金 > 生物化学;啤酒;烈性酒;果汁酒;醋;微生物学;酶学;突变或遗传工程


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1