全基因组Alu元件检测技术.pdf

上传人:三** 文档编号:8585868 上传时间:2020-09-08 格式:PDF 页数:17 大小:1.63MB
返回 下载 相关 举报
摘要
申请专利号:

CN201410513148.5

申请日:

20140929

公开号:

CN105524982A

公开日:

20160427

当前法律状态:

有效性:

审查中

法律详情:

IPC分类号:

C12Q1/68,C12N15/11

主分类号:

C12Q1/68,C12N15/11

申请人:

深圳华大基因科技有限公司

发明人:

徐礼钦,李贵波,蒋润泽,何家伟

地址:

518083 广东省深圳市盐田区北山路146号北山工业区综合楼11F-3

优先权:

CN201410513148A

专利代理机构:

北京品源专利代理有限公司

代理人:

巩克栋;杨晞

PDF下载: PDF下载
内容摘要

本发明提供了一种新的方法,根据Alu绝大多数子家族(除了AluYd3、AluYd3a1、AluJo和AluJb这四个含量低于1%并且在基因组中不活跃的子家族之外,余下的Alu子家族,覆盖达99%以上)共有序列设计引物,利用半巢式PCR特异性地捕获到几乎全部Alu子家族的序列。

权利要求书

1.一种利用半巢式PCR特异性地捕获Alu子家族序列的方法,所述方法包括:利用第一至第四引物进行半巢式PCR扩增,其中第一轮PCR的引物是第一引物和第二引物,第二轮PCR的引物是第三引物和第四引物,所述第一至第四引物是,(1)第一引物,针对Alu共有序列的5’端基因组序列进行设计,其中所述共有序列在15bp以上,并且具有一定的碱基复杂度和40%-60%的GC含量;(2)第二引物,能退火结合到Alu共有序列的3’端基因组序列的随机碱基引物,该引物5’端含有测序平台的引物序列,而3’端含有5个锚定碱基并且紧邻着5-6个随机碱基;(3)第三引物,所述引物的3’端能退火到Alu共有序列上,并且靠近Alu共有序列的3’端序列,所述引物的5’端包含测序平台的引物序列;(4)第四引物,测序平台公用引物,所述引物连接有测序平台的接头序列。 2.如权利要求1所述的方法,所述测序平台为高通量测序平台。 3.如权利要求2所述的方法,所述高通量测序平台选自IlluminaHiSeq2000、HiSeq2500、MiSeq、MiSeqDx、NextSeq500、HiseqXten、LifeSOLiD、IonTorrentPGM、Proton、Roche454和单分子测序平台中的至少一种。 4.如权利要求1-3所述的任一种方法,所述第一引物是SEQIDNO.1,或与其有80%以上,优选90%以上,更优选95%以上的序列同一性的序列。 5.如权利要求1-4所述的任一种方法,所述第二引物选自SEQIDNO.2-9,或与其有80%以上,优选90%以上,更优选95%以上的序列同一性的序列。 6.如权利要求1-5所述的任一种方法,所述第三引物是SEQIDNO.10,或与其有80%以上,优选90%以上,更优选95%以上的序列同一性的序列。 7.如权利要求1-6所述的任一种方法,所述第四引物是SEQIDNO.11,或与其有80%以上,优选90%以上,更优选95%以上的序列同一性的序列。 8.用于特异性地捕获Alu子家族序列的半巢式PCR引物,所述引物包括:(1)第一引物,针对Alu共有序列的5’端基因组序列进行设计,其中所述共有序列优选在15bp以上,并且优选具有一定的碱基复杂度和40%-60%的GC含量;(2)第二引物,能退火结合到Alu共有序列的3’端基因组序列的随机碱基引物,优选该引物5’端含有测序平台的引物序列,而3’端含有5个锚定碱基并且紧邻着5-6个随机碱基;(3)第三引物,所述引物的3’端能退火到Alu共有序列上,并且靠近Alu共有序列的3’端序列,所述引物的5’端包含测序平台的引物序列;(4)第四引物,测序平台公用引物,所述引物连接有测序平台的接头序列;所述第一引物优选是SEQIDNO.1,或与其有80%以上,优选90%以上,更优选95%以上的序列同一性的序列;所述第二引物优选选自SEQIDNO.2-9,或与其有80%以上,优选90%以上,更优选95%以上的序列同一性的序列;所述第三引物优选是SEQIDNO.10,或与其有80%以上,优选90%以上,更优选95%以上的序列同一性的序列。所述第四引物优选是SEQIDNO.11,或与其有80%以上,优选90%以上,更优选95%以上的序列同一性的序列。 9.如权利要求8所述的半巢式PCR引物,所述测序平台为高通量测序平台。 10.如权利要求9所述的半巢式PCR引物,所述高通量测序平台选自IlluminaHiSeq2000、HiSeq2500、MiSeq、MiSeqDx、NextSeq500、HiseqXten、LifeSOLiD、IonTorrentPGM、Proton、Roche454和单分子测序平台中的至少一种。

说明书

技术领域

本发明涉及生物技术领域。更具体而言,本发明涉及基因组序列的检测。

背景技术

Alu元件(Aluelement)是基因组中散在的一类重复序列,属于非自主的逆转录转座子,每个拷贝的大小约300个碱基对。一般认为Alu元件是由逆转座酶连带一段序列插入到基因组内形成的。每个人的基因组中大约有一百万个Alu元件拷贝,平均每三千个碱基就有一个Alu插入,基因组异常的Alu插入和Alu的异常剪切重组会导致癌症的发生。目前,在dbRIP和RepBase数据库中收录了31个子家族的Alu。现在已知的Alu家族中最多的子家族包括AluY、AluYa5、AluYa8、AluYb8和AluYb9,其中AluYa5占Alu的50%以上。从目前的研究结果来看,AluYa5和AluYb8是在基因组中最活跃的子家族。现有方法MEI-seq利用AluYb8/9子家族特异性引物能够捕获到AluYb8/9,MEI-seq原理是先将基因组随机打断成小片段,之后将末端补平并且加“A”碱基后连接Illumina测序接头。完成接头连接后使用接头引物和带有生物素标记的AluYb8/9特异性引物序列进行扩增,得到的产物用带有链霉亲和素的磁珠捕获得到AluYb8/9。

该方法因为使用AluYb8/9特异引物扩增,所以只能捕获到大约1/3的Alu序列,而无法捕获到全部的Alu子家族。并且该方法步骤较多,操作繁琐,耗时较长。

因此,本领域需要一种能够捕获到全部Alu子家族的序列的方法。

发明内容

为了克服现有方法的缺陷,本发明提供了一种新的方法,根据Alu绝大多数子家族(除了AluYd3、AluYd3a1、AluJo和AluJb这四个含量低于1%并且在基因组中不活跃的子家族之外,余下的Alu子家族,覆盖达99%以上)共有序列设计引物,利用半巢式PCR特异性地捕获到几乎全部Alu子家族的序列。

本技术方案利用半巢式PCR和Alu所有家族(除了AluYd3、AluYd3a1、AluJo和AluJb这四个含量低于1%并且在基因组中不活跃的子家族)共有引物序列进行Alu扩增。原理如图1,图中黑色矩形方块代表插入到基因组的Alu元件,巢式PCR第一步用AluTC和Seedprimer对基因组进行扩增,第二轮PCR用第一轮扩增产物作为样品,用PrimerAluGA和PE1.0为引物进行扩增,最终得到Alu序列的3’端序列。选取合适的扩增产物片段回收后就可以直接测序了。

因此,本发明提供了用于半巢式PCR的引物,用于特异性地捕获Alu子家族的序列的,所述引物包括:

(1)第一引物,针对Alu共有序列的5’端基因组序列进行设计,其中所述共有序列在15bp以上,并且具有一定的碱基复杂度和40%-60%的GC含量;

(2)第二引物,能退火结合到Alu共有序列的3’端基因组序列的随机碱基引物(SeedPrimer),优选该引物5’端含有测序平台的引物序列,而3’端含有5个锚定碱基并且紧邻着5-6个随机碱基;

(3)第三引物,所述引物的3’端能退火到Alu共有序列上,并且靠近Alu共有序列的3’端序列,所述引物的5’端包含测序平台的引物序列;

(4)第四引物,测序平台公用引物,所述引物连接有测序平台的接头序列。

本发明提供了一种利用半巢式PCR特异性地捕获Alu子家族的序列的方法,所述方法包括:利用本发明的引物进行半巢式PCR扩增,其中第一轮PCR的引物是第一引物和第二引物,第二轮PCR的引物是第三引物和第四引物。

在一个具体实施方案中,所述测序平台为高通量测序平台。

在一个具体实施方案中,所述高通量测序平台选自IlluminaHiSeq2000、HiSeq2500、MiSeq、MiSeqDx、NextSeq500、HiseqXten、LifeSOLiD、IonTorrentPGM、Proton、Roche454和单分子测序平台中的至少一种。

在一个更具体实施方案中,所述第一引物是SEQIDNO.1,或与其有80%以上,优选90%以上,更优选95%以上的序列同一性的序列。

在一个更具体实施方案中,所述第二引物选自SEQIDNO.2-9,或与其有80%以上,优选90%以上,更优选95%以上的序列同一性的序列。

在一个更具体实施方案中,所述第三引物是SEQIDNO.10,或与其有80%以上,优选90%以上,更优选95%以上的序列同一性的序列。

在一个更具体实施方案中,所述第四引物是SEQIDNO.11,或与其有80%以上,优选90%以上,更优选95%以上的序列同一性的序列。

本发明的优点至少如下:

1.由于半巢式PCR使用的两条半特异性引物都是根据Alu所有子家族(除了AluYd3、AluYd3a1、AluJo和AluJb这四个含量低于1%并且在基因组中不活跃的子家族)共有的序列设计,因此该方法能够捕获到几乎所有子家族的Alu元件(99%以上Alu子家族)。

2.半巢式PCR需要经过两次针对目标序列不同区域进行扩增,增加了扩增特异性,获得可信度较高的Alu序列,在具体实例中发明人选择了7个克隆进行Sanger测序,其中6条均为Alu元件,结果也证明了该方法的特异性高。

附图说明

图1.本发明的一个具体实施方案的原理图:图中黑色矩形方块代表插入到基因组的Alu元件,巢式PCR第一步用AluTC和Seedprimer对基因组进行扩增,第二轮PCR用第一轮扩增产物作为样品,用PrimerAluGA和PE1.0为引物进行扩增,最终得到Alu序列。

图2.挑选出Alu共有序列的图示。图2A-2B的序列比对统计结果中的Alu序列来自数据库dbRIP和RepBase,星号表示共有序列,下划线标记为本发明设计的引物位置。

具体实施方式

下面详细描述本发明的实施例。下面描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。

巢式PCR(NestedPCR)是先用一对靶序列的外引物扩增以提高模板量,然后再用一对内引物扩增以得到特异的PCR带。而半巢式PCR(Semi-NestedPCR)则是巢式PCR的一种特殊类型,用于扩增比普通PCR小的片断。半巢式PCR使用一条外引物替代内引物。其中,在基因序列上的相近位点分别设计具有部分相同序列的外引物和内引物,进行扩增,可认为是广义的半巢式PCR。

本发明的引物符合基本的引物设计原则,例如GC含量,序列长度,TM值,引物与引物之间不能形成发夹结构等等。

在本发明中,锚定碱基目的是为了增加引物退火的特异性,根据5-mer碱基(5-mer指的是将一条基因序列,连续切割,挨个碱基划动得到的序列长度为5的核苷酸序列)在基因组上出现的频率统计出5-10条出现频率最高的序列命名为SeedP1至SeedP5-10。

在本发明中,“一定的碱基复杂度”是指一段DNA序列的4种碱基所占比例相当,例如任两种碱基的比例相差不超过5%,更优选任两种相差不超过2%,并且不含有简单重复序列,例如5个以上的AAAAA、CCCCC、GGGGG或TTTTT。

在一个具体实施方案中,本发明的技术方案可以描述如下:

首先,从数据库(如dbRIP和RepBase)中获取Alu所有家族(除了AluYd3、AluYd3a1、AluJo和AluJb这四个含量低于1%并且在基因组中不活跃的子家族)的序列,并从中挑选出Alu共有序列,该序列要求长度在15bp以上,并且具有一定的碱基复杂度和适当的GC含量(40%-60%)来保证引物设计。挑选出的Alu共有序列如图2所示。

其次,针对共有序列进行引物设计。引物设计具有一定复杂度。

(1)需要符合基本的引物设计原则,如GC含量、序列长度、TM值、引物与引物之间不能形成发夹结构等等。

(2)需要确定测序平台的接头序列,将该序列连接在引物的末端。其中半巢式PCR的第一轮两个PCR引物中的一条是Alu靠近5’端的共有序列(AluTC),另一条是能退火到Alu的3’端基因组序列的随机碱基引物(SeedPrimer),SeedPrimer的5’端含有测序平台的引物序列,而3’端含有5个锚定碱基并且紧邻着5个随机碱基(锚定碱基目的是为了增加引物退火的特异性,根据5mer碱基在基因组上出现的频率统计出8条出现频率最高的序列命名为SeedP1-8)。半巢式PCR第二轮用到的两个PCR引物中的一条是PrimerAluGA,如图1所示,PrimerAluGA的3’端能退火到Alu元件上,并且靠近Alu的3’端序列,PrimerAluGA的5’端包含测序平台的引物序列。第二轮PCR另一条引物PE1.0使用测序平台公用引物。

1.根据引物设计原则,以illumina测序平台为例,进行引物设计。引物序列如下(SEQIDNO.1-11):

下划线表示针对Illumina测序平台相关序列设计的引物序列;粗体表示针对Alu共有序列设计的引物序列;N表示随机碱基。

使用人淋巴细胞(炎黄1号)DNA样品作为实验材料,先用AluTC和8条带有5个随机碱基和5个碱基锚定序列的引物(Seed1-8)对DNA样品的基因组进行扩增。

按照如下体系配置8个相同的反应混合液。

PCR程序:

95℃2:30;

5个循环:

15个循环:

2.完成步骤1的PCR后用磁珠进行纯化

加入90ulAMPureXPbeads(BeckmanCoulter)至50ulPCR产物,混匀后加入到新的1.5ml离心管中,室温孵育5min。

离心管置于磁力架上,2min后弃上清,加入200ul80%乙醇(保持离心管在磁力架上)洗涤,30s后弃上清,重复该步骤一遍。室温放置干燥。

加入35ul洗脱缓冲液(Qiagen),室温孵育5min后用磁力架吸附磁珠2min,取上清置于新的离心管中。

3.纯化产物用PrimerAluGA和PE1.0公共引物进行扩增。

PCR程序:

95℃2min;

20个循环:

扩增产物进行4.2%琼脂糖凝胶电泳120V,50min,选取200-500bp片段切胶回收。使用QiagenGelExtractionkit纯化回收胶,纯化后做TA克隆。由于PCR反应使用的聚合酶具有末端转移的活性,会在3′端加上碱基“A”,把PCR片段与一个具有3’-T的载体DNA连接转化,便可获得单克隆。选取7个单克隆进行Sanger测序验证,即按照3730测序仪的操作说明进行测序,获得DNA序列。

结果:7个克隆进行Sanger测序后,其中有6个均含有Alu元件。

其中6个克隆(seq-1至seq-6)序列如下:

>seq-1(SEQIDNO.12)

CAAGCAGAAGACGGCATACGAGCTCTTCCGATCTGAGGCTGAGGCAGGAGAATGGCGTGAACCCGGGAGGCGGAGCTTGCAGTGAGCCGAGATCGCAGCACTGCACTGCAGCCTGGGGGACAGACTTAGACATCGCTAGGAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATT

>seq-2(SEQIDNO.13)

CAAGCAGAAGACGGCATACGAGCTCTTCCGATCTGAGGCTGAGGCAGGAGAATGGCATGAACCCAGTAGGTGGAGCTTGCAATGAGCTGAGACCGGAACATCGACAACAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATT

>seq-3(SEQIDNO.14)

AATGATACGGCGACACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTTGATTCGATGTTTTGACTGCACCTGCCACCATGCTCCTGAAATAAGAGGCAGTTGTTACAGTTGCAGTCATCCTGTAGCAATCGTGGTCTGCTGGTGATAACCAGCCGTGGTATATTTGGACAAGACCTCATTCTTTTTTTTTTTTTTTTTTTGAGACACAGTCTTGCTCTGTCGCCCAAGCTGGAGTGCAGTGGCGTGATCTTGGCTCACCTCAAGCTCCGCCTCCCAGGTTCATGCCATTCTCCTGCCTCAGCCTCAGATCGGAAGAGCTCGTATGCCCGTCTTCTGCTTG

>seq-4(SEQIDNO.15)

CAAGCAGAAGACGGCATACGAGCTCTTCCGATCTGAGGCTGAGGCAGGAGAATGGTGTGAACCCGGAGGGCGGAGCTTGCAGTGAGCCAAGATAGTACCACTGCATTCCAGCACTCCAGCCTGGATGACAGACCCTGACATCGTAAGCAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATT

>seq-5(SEQIDNO.16)

CAAGCAGAAGACGGCATACGAGCTCTTCCGATCTGAGGCTGAGGCAGGAGAATGGCGGAACCCGGAGGCGGAGCTTGCAGTGAGTCGAGATAGCGCCGCTCCACTCCAGCCTGGGCAACAGAACGCAACATCGAATGCAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATT

>seq-6(SEQIDNO.17)

CAAGCAGAAGACGGCATACGAGCTCTTCCGATCTGAGGCTGAGGCAGGAGAATGGCGTGAACCCGGCAGGTGGAGCTTGCAGTGAGCCGGGATTGCACTACTGCACTCCAGTCTGGGCAACAGAGCAAGACTGTGTCTCAAAAAAAAAAGAAGAAGTGTACACATCGGCTCAAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATT

去掉两端的引物序列后取中间的Alu序列比对到Alu的数据库dbRIP和RepBase,找到这些序列的子家族如下:

由TA克隆和Sanger测序结果证明,本发明的方法的确能够捕获到各个子家族的Alu元件,并且捕获到Alu的特异性非常高,随机选取7条序列其中6条序列均为Alu元件。

在本说明书的描述中,参考术语“一个实施例”、“一个具体实施方案”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型。

全基因组Alu元件检测技术.pdf_第1页
第1页 / 共17页
全基因组Alu元件检测技术.pdf_第2页
第2页 / 共17页
全基因组Alu元件检测技术.pdf_第3页
第3页 / 共17页
点击查看更多>>
资源描述

《全基因组Alu元件检测技术.pdf》由会员分享,可在线阅读,更多相关《全基因组Alu元件检测技术.pdf(17页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 (43)申请公布日 (21)申请号 201410513148.5 (22)申请日 2014.09.29 C12Q 1/68(2006.01) C12N 15/11(2006.01) (71)申请人 深圳华大基因科技有限公司 地址 518083 广东省深圳市盐田区北山路 146 号北山工业区综合楼 11F-3 (72)发明人 徐礼钦 李贵波 蒋润泽 何家伟 (74)专利代理机构 北京品源专利代理有限公司 11332 代理人 巩克栋 杨晞 (54) 发明名称 全基因组 Alu 元件检测技术 (57) 摘要 本发明提供了一种新的方法, 根据 Alu 绝大 多数子家族 ( 除了 A。

2、luYd3、 AluYd3a1、 AluJo 和 AluJb 这四个含量低于 1并且在基因组中不活 跃的子家族之外, 余下的Alu子家族, 覆盖达99 以上)共有序列设计引物, 利用半巢式PCR特异性 地捕获到几乎全部 Alu 子家族的序列。 (51)Int.Cl. (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书8页 序列表4页 附图2页 CN 105524982 A 2016.04.27 CN 105524982 A 1/2 页 2 1.一种利用半巢式 PCR 特异性地捕获 Alu 子家族序列的方法, 所述方法包括 : 利用第 一至第四引物进行半巢式PCR。

3、扩增, 其中第一轮PCR的引物是第一引物和第二引物, 第二轮 PCR 的引物是第三引物和第四引物, 所述第一至第四引物是, (1) 第一引物, 针对 Alu 共有序列的 5 端基因组序列进行设计, 其中所述共有序列在 15bp 以上, 并且具有一定的碱基复杂度和 40 -60的 GC 含量 ; (2)第二引物, 能退火结合到Alu共有序列的3 端基因组序列的随机碱基引物, 该引物 5 端含有测序平台的引物序列, 而 3 端含有 5 个锚定碱基并且紧邻着 5-6 个随机碱基 ; (3) 第三引物, 所述引物的 3 端能退火到 Alu 共有序列上, 并且靠近 Alu 共有序列的 3 端序列, 所述。

4、引物的 5 端包含测序平台的引物序列 ; (4) 第四引物, 测序平台公用引物, 所述引物连接有测序平台的接头序列。 2.如权利要求 1 所述的方法, 所述测序平台为高通量测序平台。 3.如权利要求 2 所述的方法, 所述高通量测序平台选自 Illumina HiSeq2000、 HiSeq2500、 MiSeq、 MiSeqDx、 NextSeq500、 Hiseq X ten、 Life SOLiD、 Ion Torrent PGM、 Proton、 Roche 454 和单分子测序平台中的至少一种。 4.如权利要求1-3所述的任一种方法, 所述第一引物是SEQ ID NO.1, 或与其有。

5、80以 上, 优选 90以上, 更优选 95以上的序列同一性的序列。 5.如权利要求 1-4 所述的任一种方法, 所述第二引物选自 SEQ ID NO.2-9, 或与其有 80以上, 优选 90以上, 更优选 95以上的序列同一性的序列。 6.如权利要求 1-5 所述的任一种方法, 所述第三引物是 SEQ ID NO.10, 或与其有 80 以上, 优选 90以上, 更优选 95以上的序列同一性的序列。 7.如权利要求 1-6 所述的任一种方法, 所述第四引物是 SEQ ID NO.11, 或与其有 80 以上, 优选 90以上, 更优选 95以上的序列同一性的序列。 8.用于特异性地捕获 A。

6、lu 子家族序列的半巢式 PCR 引物, 所述引物包括 : (1)第一引物, 针对Alu共有序列的5 端基因组序列进行设计, 其中所述共有序列优选 在 15bp 以上, 并且优选具有一定的碱基复杂度和 40 -60的 GC 含量 ; (2)第二引物, 能退火结合到Alu共有序列的3 端基因组序列的随机碱基引物, 优选该 引物 5 端含有测序平台的引物序列, 而 3 端含有 5 个锚定碱基并且紧邻着 5-6 个随机碱 基 ; (3) 第三引物, 所述引物的 3 端能退火到 Alu 共有序列上, 并且靠近 Alu 共有序列的 3 端序列, 所述引物的 5 端包含测序平台的引物序列 ; (4) 第四。

7、引物, 测序平台公用引物, 所述引物连接有测序平台的接头序列 ; 所述第一引物优选是SEQ ID NO.1, 或与其有80以上, 优选90以上, 更优选95以 上的序列同一性的序列 ; 所述第二引物优选选自 SEQ ID NO.2-9, 或与其有 80以上, 优选 90以上, 更优选 95以上的序列同一性的序列 ; 所述第三引物优选是 SEQ ID NO.10, 或与其有 80以上, 优选 90以上, 更优选 95 以上的序列同一性的序列。 所述第四引物优选是 SEQ ID NO.11, 或与其有 80以上, 优选 90以上, 更优选 95 以上的序列同一性的序列。 权 利 要 求 书 CN 。

8、105524982 A 2 2/2 页 3 9.如权利要求 8 所述的半巢式 PCR 引物, 所述测序平台为高通量测序平台。 10.如权利要求 9 所述的半巢式 PCR 引物, 所述高通量测序平台选自 Illumina HiSeq2000、 HiSeq2500、 MiSeq、 MiSeqDx、 NextSeq500、 Hiseq X ten、 Life SOLiD、 Ion Torrent PGM、 Proton、 Roche 454 和单分子测序平台中的至少一种。 权 利 要 求 书 CN 105524982 A 3 1/8 页 4 全基因组 Alu 元件检测技术 技术领域 0001 本发明。

9、涉及生物技术领域。更具体而言, 本发明涉及基因组序列的检测。 背景技术 0002 Alu 元件 (Aluelement) 是基因组中散在的一类重复序列, 属于非自主的逆转录转 座子, 每个拷贝的大小约300个碱基对。 一般认为Alu元件是由逆转座酶连带一段序列插入 到基因组内形成的。每个人的基因组中大约有一百万个 Alu 元件拷贝, 平均每三千个碱基 就有一个 Alu 插入, 基因组异常的 Alu 插入和 Alu 的异常剪切重组会导致癌症的发生。目 前, 在dbRIP和RepBase数据库中收录了31个子家族的Alu。 现在已知的Alu家族中最多的 子家族包括 AluY、 AluYa5、 Al。

10、uYa8、 AluYb8 和 AluYb9, 其中 AluYa5 占 Alu 的 50以上。从 目前的研究结果来看, AluYa5 和 AluYb8 是在基因组中最活跃的子家族。现有方法 MEI-seq 利用 AluYb8/9 子家族特异性引物能够捕获到 Alu Yb8/9, MEI-seq 原理是先将基因组随机 打断成小片段, 之后将末端补平并且加 “A” 碱基后连接 Illumina 测序接头。完成接头连接 后使用接头引物和带有生物素标记的 AluYb8/9 特异性引物序列进行扩增, 得到的产物用 带有链霉亲和素的磁珠捕获得到 AluYb8/9。 0003 该方法因为使用 AluYb8/9。

11、 特异引物扩增, 所以只能捕获到大约 1/3 的 Alu 序列, 而无法捕获到全部的 Alu 子家族。并且该方法步骤较多, 操作繁琐, 耗时较长。 0004 因此, 本领域需要一种能够捕获到全部 Alu 子家族的序列的方法。 发明内容 0005 为了克服现有方法的缺陷, 本发明提供了一种新的方法, 根据 Alu 绝大多数子家 族 ( 除了 AluYd3、 AluYd3a1、 AluJo 和 AluJb 这四个含量低于 1并且在基因组中不活跃的 子家族之外, 余下的 Alu 子家族, 覆盖达 99以上 ) 共有序列设计引物, 利用半巢式 PCR 特 异性地捕获到几乎全部 Alu 子家族的序列。 。

12、0006 本技术方案利用半巢式 PCR 和 Alu 所有家族 ( 除了 AluYd3、 AluYd3a1、 AluJo 和 AluJb 这四个含量低于 1并且在基因组中不活跃的子家族 ) 共有引物序列进行 Alu 扩增。 原理如图 1, 图中黑色矩形方块代表插入到基因组的 Alu 元件, 巢式 PCR 第一步用 AluTC 和 Seedprimer对基因组进行扩增, 第二轮PCR用第一轮扩增产物作为样品, 用PrimerAluGA和 PE1.0 为引物进行扩增, 最终得到 Alu 序列的 3 端序列。选取合适的扩增产物片段回收后 就可以直接测序了。 0007 因此, 本发明提供了用于半巢式PC。

13、R的引物, 用于特异性地捕获Alu子家族的序列 的, 所述引物包括 : 0008 (1)第一引物, 针对Alu共有序列的5 端基因组序列进行设计, 其中所述共有序列 在 15bp 以上, 并且具有一定的碱基复杂度和 40 -60的 GC 含量 ; 0009 (2) 第二引物, 能退火结合到 Alu 共有序列的 3 端基因组序列的随机碱基引物 (SeedPrimer), 优选该引物 5 端含有测序平台的引物序列, 而 3 端含有 5 个锚定碱基并且 说 明 书 CN 105524982 A 4 2/8 页 5 紧邻着 5-6 个随机碱基 ; 0010 (3) 第三引物, 所述引物的 3 端能退火。

14、到 Alu 共有序列上, 并且靠近 Alu 共有序列 的 3 端序列, 所述引物的 5 端包含测序平台的引物序列 ; 0011 (4) 第四引物, 测序平台公用引物, 所述引物连接有测序平台的接头序列。 0012 本发明提供了一种利用半巢式 PCR 特异性地捕获 Alu 子家族的序列的方法, 所述 方法包括 : 利用本发明的引物进行半巢式PCR扩增, 其中第一轮PCR的引物是第一引物和第 二引物, 第二轮 PCR 的引物是第三引物和第四引物。 0013 在一个具体实施方案中, 所述测序平台为高通量测序平台。 0014 在一个具体实施方案中, 所述高通量测序平台选自 Illumina HiSeq。

15、2000、 HiSeq2500、 MiSeq、 MiSeqDx、 NextSeq500、 Hiseq X ten、 Life SOLiD、 Ion TorrentPGM、 Proton、 Roche 454 和单分子测序平台中的至少一种。 0015 在一个更具体实施方案中, 所述第一引物是 SEQ ID NO.1, 或与其有 80以上, 优 选 90以上, 更优选 95以上的序列同一性的序列。 0016 在一个更具体实施方案中, 所述第二引物选自 SEQ ID NO.2-9, 或与其有 80以 上, 优选 90以上, 更优选 95以上的序列同一性的序列。 0017 在一个更具体实施方案中, 所。

16、述第三引物是SEQ ID NO.10, 或与其有80以上, 优 选 90以上, 更优选 95以上的序列同一性的序列。 0018 在一个更具体实施方案中, 所述第四引物是SEQ ID NO.11, 或与其有80以上, 优 选 90以上, 更优选 95以上的序列同一性的序列。 0019 本发明的优点至少如下 : 0020 1. 由于半巢式 PCR 使用的两条半特异性引物都是根据 Alu 所有子家族 ( 除了 AluYd3、 AluYd3a1、 AluJo 和 AluJb 这四个含量低于 1并且在基因组中不活跃的子家族 ) 共有的序列设计, 因此该方法能够捕获到几乎所有子家族的 Alu 元件 (99。

17、以上 Alu 子家 族 )。 0021 2. 半巢式 PCR 需要经过两次针对目标序列不同区域进行扩增, 增加了扩增特异 性, 获得可信度较高的 Alu 序列, 在具体实例中发明人选择了 7 个克隆进 行 Sanger 测序, 其中 6 条均为 Alu 元件, 结果也证明了该方法的特异性高。 附图说明 0022 图 1. 本发明的一个具体实施方案的原理图 : 图中黑色矩形方块代表插入到基因 组的 Alu 元件, 巢式 PCR 第一步用 AluTC 和 Seedprimer 对基因组进行扩增, 第二轮 PCR 用 第一轮扩增产物作为样品, 用 PrimerAluGA 和 PE1.0 为引物进行扩。

18、增, 最终得到 Alu 序列。 0023 图 2. 挑选出 Alu 共有序列的图示。图 2A-2B 的序列比对统计结果中的 Alu 序列 来自数据库 dbRIP 和 RepBase, 星号表示共有序列, 下划线标记为本发明设计的引物位置。 具体实施方式 0024 下面详细描述本发明的实施例。下面描述的实施例是示例性的, 仅用于解释本发 明, 而不能理解为对本发明的限制。 实施例中未注明具体技术或条件的, 按照本领域内的文 献所描述的技术或条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者, 均 说 明 书 CN 105524982 A 5 3/8 页 6 为可以通过市购获得的常规产品。。

19、 0025 巢式 PCR(Nested PCR) 是先用一对靶序列的外引物扩增以提高模板量, 然后再用 一对内引物扩增以得到特异的 PCR 带。而半巢式 PCR(Semi-NestedPCR) 则是巢式 PCR 的一 种特殊类型, 用于扩增比普通 PCR 小的片断。半巢式 PCR 使用一条外引物替代内引物。其 中, 在基因序列上的相近位点分别设计具有部分相同序列的外引物和内引物, 进行扩增, 可 认为是广义的半巢式 PCR。 0026 本发明的引物符合基本的引物设计原则, 例如 GC 含量, 序列长度, TM 值, 引物与 引物之间不能形成发夹结构等等。 0027 在本发明中, 锚定碱基目的是。

20、为了增加引物退火的特异性, 根据 5-mer 碱基 (5-mer 指的是将一条基因序列, 连续切割, 挨个碱基划动得到的序列长度为 5 的核苷 酸序列 ) 在基因组上出现的频率统计出 5-10 条出现频率最高的序列命名为 SeedP1 至 SeedP5-10。 0028 在本发明中,“一定的碱基复杂度” 是指一段 DNA 序列的 4 种碱基所占比例相当, 例 如任两种碱基的比例相差不超过 5, 更优选任两种相差不超过 2, 并且不含有简单重复 序列, 例如 5 个以上的 AAAAA、 CCCCC、 GGGGG 或 TTTTT。 0029 在一个具体实施方案中, 本发明的技术方案可以描述如下 :。

21、 0030 首先, 从数据库 ( 如 dbRIP 和 RepBase) 中获取 Alu 所有家族 ( 除了 AluYd3、 AluYd3a1、 AluJo 和 AluJb 这四个含量低于 1并且在基因组中不活跃的子家族 ) 的序列, 并从中挑选出 Alu 共有序列, 该序列要求长度在 15bp 以上, 并且具有一定的碱基复杂度和 适当的 GC 含量 (40 -60 ) 来保证引物设计。挑选出的 Alu 共有序列如图 2 所示。 0031 其次, 针对共有序列进行引物设计。引物设计具有一定复杂度。 0032 (1) 需要符合基本的引物设计原则, 如 GC 含量、 序列长度、 TM 值、 引物与引。

22、物之间 不能形成发夹结构等等。 0033 (2) 需要确定测序平台的接头序列, 将该序列连接在引物的末端。其中半巢式 PCR 的第一轮两个 PCR 引物中的一条是 Alu 靠近 5 端的共有序列 (AluTC), 另一条是能退 火到 Alu 的 3 端基因组序列的随机碱基引物 (SeedPrimer), SeedPrimer 的 5 端含有测 序平台的引物序列, 而 3 端含有 5 个锚定碱基并且紧邻着 5 个随机碱基 ( 锚定碱基目的 是为了增加引物退火的特异性, 根据 5mer 碱基 在基因组上出现的频率统计出 8 条出现 频率最高的序列命名为 SeedP1-8)。半巢式 PCR 第二轮用。

23、到的两个 PCR 引物中的一条是 PrimerAluGA, 如图 1 所示, PrimerAluGA 的 3 端能退火到 Alu 元件上, 并且靠近 Alu 的 3 端序列, PrimerAluGA 的 5 端包含测序平台的引物序列。第二轮 PCR 另一条引物 PE1.0 使 用测序平台公用引物。 0034 1. 根据引物设计原则, 以 illumina 测序平台为例, 进行引物设计。引物序列如下 (SEQ ID NO.1-11) : 0035 说 明 书 CN 105524982 A 6 4/8 页 7 0036 下划线表示针对 Illumina 测序平台相关序列设计的引物序列 ; 粗体表示。

24、针对 Alu 共有序列设计的引物序列 ; N 表示随机碱基。 0037 使用人淋巴细胞 ( 炎黄 1 号 )DNA 样品作为实验材料, 先用 AluTC 和 8 条带有 5 个 随机碱基和 5 个碱基锚定序列的引物 (Seed1-8) 对 DNA 样品的基因组进行扩增。 0038 按照如下体系配置 8 个相同的反应混合液。 0039 说 明 书 CN 105524982 A 7 5/8 页 8 0040 PCR 程序 : 0041 95 2:30 ; 0042 5 个循环 : 0043 0044 0045 15 个循环 : 0046 说 明 书 CN 105524982 A 8 6/8 页 9。

25、 0047 2. 完成步骤 1 的 PCR 后用磁珠进行纯化 0048 加入90ul AMPure XP beads(BeckmanCoulter)至50ulPCR产物, 混匀后加入到新 的 1.5ml 离心管中, 室温孵育 5min。 0049 离心管置于磁力架上, 2min 后弃上清, 加入 200ul 80乙醇 ( 保持离心管在磁力 架上 ) 洗涤, 30s 后弃上清, 重复该步骤一遍。室温放置干燥。 0050 加入 35ul 洗脱缓冲液 (Qiagen), 室温孵育 5min 后用磁力架吸附磁珠 2min, 取上 清置于新的离心管中。 0051 3. 纯化产物用 PrimerAluGA。

26、 和 PE1.0 公共引物进行扩增。 0052 0053 说 明 书 CN 105524982 A 9 7/8 页 10 0054 PCR 程序 : 0055 95 2min ; 0056 20 个循环 : 0057 0058 扩增产物进行4.2琼脂糖凝胶电泳120V, 50min, 选取200-500bp片段切胶回收。 使用 QiagenGelExtractionkit 纯化回收胶, 纯化后做 TA 克隆。由于 PCR 反应使用的聚合 酶具有末端转移的活性, 会在 3端加上碱基 “A” , 把 PCR 片段与一个具有 3 -T 的载体 DNA 连接转化, 便可获得单克隆。选取 7 个单克 隆。

27、进行 Sanger 测序验证, 即按照 3730 测序仪 的操作说明进行测序, 获得 DNA 序列。 0059 结果 : 7 个克隆进行 Sanger 测序后, 其中有 6 个均含有 Alu 元件。 0060 其中 6 个克隆 (seq-1 至 seq-6) 序列如下 : 0061 seq-1(SEQ ID NO.12) 0062 CAAGCAGAAGACGGCATACGAGCTCTTCCGATCTGAGGCTGAGGCAGGAGAATGGCGTGAACCCGGGAG GCGGAGCTTGCAGTGAGCCGAGATCGCAGCACTGCACTGCAGCCTGGGGGACAGACTTAGACA。

28、TCGCTAGGAGATCG GAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATT 0063 seq-2(SEQ ID NO.13) 0064 CAAGCAGAAGACGGCATACGAGCTCTTCCGATCTGAGGCTGAGGCAGGAGAATGGCATGAACCCAGT AGGTGGAGCTTGCAATGAGCTGAGACCGGAACATCGACAACAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTA GATCTCGGTGGTCGCCGTATCATT 0065 seq-3(SEQ ID NO.14) 0066 AAT。

29、GATACGGCGACACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTTGATTCGATGTT TTGACTGCACCTGCCACCATGCTCCTGAAATAAGAGGCAGTTGTTACAGTTGCAGTCATCCTGTAGCAATCGTGGTC TGCTGGTGATAACCAGCCGTGGTATATTTGGACAAGACCTCATTCTTTTTTTTTTTTTTTTTTTGAGACACAGTCTT GCTCTGTCGCCCAAGCTGGAGTGCAGTGGCGTGATCTTGGCTCACCTCAAGCTCCGCCTCCCAGGTTCATGCCATTC。

30、 TCCTGCCTCAGCCTCAGATCGGAAGAGCTCGTATGCCCGTCTTCTGCTTG 0067 seq-4(SEQ ID NO.15) 0068 CAAGCAGAAGACGGCATACGAGCTCTTCCGATCTGAGGCTGAGGCAGGAGAATGGTGTGAACCCGGAGG GCGGAGCTTGCAGTGAGCCAAGATAGTACCACTGCATTCCAGCACTCCAGCCTGGATGACAGACCCTGACATCGTAA GCAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCA TT 说 明 书 CN。

31、 105524982 A 10 8/8 页 11 0069 seq-5(SEQ ID NO.16) 0070 CAAGCAGAAGACGGCATACGAGCTCTTCCGATCTGAGGCTGAGGCAGGAGAATGGCGGAACCCGGAGGC GGAGCTTGCAGTGAGTCGAGATAGCGCCGCTCCACTCCAGCCTGGGCAACAGAACGCAACATCGAATGCAGATCGGA AGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATT 0071 seq-6(SEQ ID NO.17) 0072 CAAGCAGAAGACGGCA。

32、TACGAGCTCTTCCGATCTGAGGCTGAGGCAGGAGAATGGCGTGAACCCGGCAG GTGGAGCTTGCAGTGAGCCGGGATTGCACTACTGCACTCCAGTCTGGGCAACAGAGCAAGACTGTGTCTCAAAAAAA AAAGAAGAAGTGTACACATCGGCTCAAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCG TATCATT 0073 去掉两端的引物序列后取中间的Alu序列比对到Alu的数据库dbRIP和RepBase, 找到这些序列的子家族如下 : 0074 0075 由 TA 克隆和。

33、 Sanger 测序结果证明, 本发明的方法的确能够捕获到各个子家族的 Alu元件, 并且捕获到Alu的特异性非常高, 随机选取7条序列其中6 条序列均为Alu元件。 0076 在本说明书的描述中, 参考术语 “一个实施例” 、“一个具体实施方案” 、“示例” 、“具 体示例” 、 或 “一些示例” 等的描述意指结合该实施例或示例描述的具体特征、 结构、 材料或 者特点包含于本发明的至少一个实施例或示例中。在本说明书中, 对上述术语的示意性表 述不一定指的是相同的实施例或示例。而且, 描述的具体特征、 结构、 材料或者特点可以在 任何的一个或多个实施例或示例中以合适的方式结合。 0077 尽管。

34、已经示出和描述了本发明的实施例, 本领域的普通技术人员可以理解 : 在不 脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、 修改、 替换和变型。 说 明 书 CN 105524982 A 11 1/4 页 12 0001 0002 序 列 表 CN 105524982 A 12 2/4 页 13 0003 序 列 表 CN 105524982 A 13 3/4 页 14 0004 序 列 表 CN 105524982 A 14 4/4 页 15 序 列 表 CN 105524982 A 15 1/2 页 16 图 1 图 2A 说 明 书 附 图 CN 105524982 A 16 2/2 页 17 图 2B 说 明 书 附 图 CN 105524982 A 17 。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 >


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1