《一种基于ILLUMINA测序平台的大片段DNA文库的构建方法.pdf》由会员分享,可在线阅读,更多相关《一种基于ILLUMINA测序平台的大片段DNA文库的构建方法.pdf(18页珍藏版)》请在专利查询网上搜索。
1、10申请公布号CN104153003A43申请公布日20141119CN104153003A21申请号201410389835022申请日20140808C40B50/06200601C40B40/06200601C12Q1/6820060171申请人上海美吉生物医药科技有限公司地址201314上海市浦东新区康新公路3399弄3号72发明人王真艳陈昌岳林爱萍李静张祥林胡秋萍陶晔74专利代理机构上海晨皓知识产权代理事务所普通合伙31260代理人成丽杰54发明名称一种基于ILLUMINA测序平台的大片段DNA文库的构建方法57摘要本发明涉及高通量测序技术领域,公开了一种基于ILLUMINA测序平台。
2、的大片段DNA文库的构建方法,包含以下步骤1将基因组DNA随机打断;可交换先后顺序的2和32末端补平,两端加生物素标记的环化接头;3分离DNA片段;4环化,并除去未环化的DNA片段;5随机打断环化的DNA;6分离带有生物素标记的DNA片段;7将带有生物素标记的DNA片段进行末端补平;8末端加A碱基;9连上测序接头;10PCR扩增富集,形成测序文库。本发明采用CRE重组酶系统环化DNA片段,环化时间只需1小时,大大缩短了文库的构建时间,成功构建了大片段DNA文库,使得测序中基因组的拼接达到精细图或完成图的标准。51INTCL权利要求书1页说明书11页序列表3页附图2页19中华人民共和国国家知识产。
3、权局12发明专利申请权利要求书1页说明书11页序列表3页附图2页10申请公布号CN104153003ACN104153003A1/1页21一种基于ILLUMINA测序平台的大片段DNA文库的构建方法,其特征在于,包含下述步骤1将样本基因组DNA随机打断至325KB的DNA片段;可交换先后顺序的2和32将打断的DNA片段进行末端补平,在补平的DNA片段两端加上生物素标记的环化接头;3分离325KB的DNA片段;4将分离的DNA片段进行环化,得到环化的DNA,并除去未环化的DNA片段;5随机打断环化的DNA至200700BP的DNA片段;6从步骤5得到的DNA片段中分离带有生物素标记的DNA片段;。
4、7将带有生物素标记的DNA片段进行末端补平;8对末端补平后的带生物素标记的DNA片段末端加A碱基;9在步骤8得到的DNA片段两侧连上ILLUMINA测序接头;10将步骤9得到的DNA片段进行PCR扩增富集,形成测序文库。2根据权利要求1所述的大片段DNA文库的构建方法,其特征在于,步骤1中将样本基因组DNA打断至1020KB的DNA片段,步骤3中分离1020KB的DNA片段。3根据权利要求1所述的大片段DNA文库的构建方法,其特征在于,步骤2中,所述生物素标记的环化接头为生物素标记的LOXP序列接头。4根据权利要求1所述的大片段DNA文库的构建方法,其特征在于,步骤3中,所述分离的方法为凝胶电。
5、泳分离。5根据权利要求1所述的大片段DNA文库的构建方法,其特征在于,步骤4中,使用CRE重组酶使DNA片段进行环化。6根据权利要求1所述的大片段DNA文库的构建方法,其特征在于,步骤4中,使用不降解质粒的ATP依赖性DNA酶和核酸外切酶I除去未环化的DNA片段。7根据权利要求1所述的大片段DNA文库的构建方法,其特征在于,步骤5中,优选将环化的DNA随机打断至400BP的片段。8根据权利要求1所述的大片段DNA文库的构建方法,其特征在于,步骤6中,使用链霉亲和素偶联的磁珠分离带有生物素标记的DNA片段。9一种大片段DNA文库,根据权利要求1至8任一项所述的方法制得。10根据权利要求9所述的大。
6、片段DNA文库,其特征在于,所述大片段DNA文库应用于ILLUMINA平台测序。权利要求书CN104153003A1/11页3一种基于ILLUMINA测序平台的大片段DNA文库的构建方法技术领域0001本发明涉及高通量测序技术领域,特别涉及一种基于高通量测序平台的大片段DNA文库的构建方法。背景技术0002高通量测序HIGHTHROUGHPUTSEQUENCING又名下一代测序NEXTGENERATIONSEQUENCING,NGS,是相对于传统的桑格测序SANGERSEQUENCING而言的。目前高通量测序主要有三大平台ROCHE的454测序仪,ILLUMINA公司的HISEQ/MISEQ测。
7、序仪和ABI的SOLID测序仪,应用最广泛的是ILLUMINA测序平台。虽然高通量测序的数据量大,单位数据量的成本低,但其读长与桑格测序相比短。ILLUMINA目前提供的MISEQ和HISEQ最长读长分别是2X300BP和2X150BP。短读长使得从头测序DENOVOSEQUENCING的组装变得困难,特别是对于含有大量重复序列的复杂基因组。通过构建具有较大跨度的双末端配对文库和利用ILLUMINA平台的双端测序特点可以得到较大跨度片段两端的部分序列。因为较大跨度片段两端的序列及其间距已知,所以可将短片段文库拼接的CONTIGS组装成SCAFFOLDS。为了将不同距离的CONTIGS组装起来,。
8、得到更完整的组装信息,需要构建具有不同跨度的大片段文库MATEPAIRLIBRARY。0003ILLUMINA公司提供MATEPAIRLIBRARYV2KIT和NEXTERAMATEPAIRLIBRARYKIT两种大片段文库构建试剂盒,适用片段大小范围分别是210K和12K以下。复杂基因组的从头测序有时需要更大跨度的文库,如20K,40K。LUCIGEN公司提供NXSEQTM40KBMATEPAIRCLONINGKIT,构建40KB插入片段的FOSMID文库。另外,大片段文库的测序对于发现染色体结构变异,如插入,缺失,倒位也很重要。0004MATEPAIRLIBRARYV2KIT,先将基因组D。
9、NA机械打断到合适的大小,通过补平在大片段DNA末端加上生物素标记的DNTP,其次采用平末端自身连接环化,除去未环化的DNA片段,然后将环状DNA打断后分离出含有生物素标记的DNA片段,最后在这些片段两端加上ILLUMINA的测序接头。但MATEPAIRLIBRARYV2KIT对起始基因组DNA的质量要求很高,DNA少量的降解,损伤都会影响生物素标记的DNTP特异性的加到DNA片段的末端,从而导致后面文库的失败。该试剂盒所建文库,ILLUMINA推荐的测序长度只有2X36BP,如果测序太长,一端的读长READ可能会跨过环化点。0005NEXTERAMATEPAIRLIBRARYKIT,采用转座。
10、酶将其含有生物素标记的识别序列随机插入基因组DNA中,使DNA片段打断至合适大小,补平后同样采用平末端自身环化,环化后的步骤与MATEPAIRLIBRARYV2KIT类似。但NEXTERAMATEPAIRLIBRARYKIT中采用转座酶打断基因组DNA,其打断大小不好控制,且对一些纯度不高的基因组DNA打断效果很差。其平末端环化时间较长,需要过夜环化。0006NXSEQTM40KBMATEPAIRCLONINGKIT通过构建40K的FOSMID文库,再采用4BP的限制性内切酶切割插入片段后环化,最后测序得到其末端序列。但NXSEQTM40KBMATEPAIRCLONINGKIT需要构建FOSM。
11、ID文库,不仅成本高,周期长,且得到的克隆数有限,不利于大说明书CN104153003A2/11页4规模文库的构建和测序。发明内容0007本发明的一个目的在于提供一种大片段DNA文库的构建方法,能够有效增加SCAFFOLDN50的长度,使得基因组的拼接达到精细图或者完成图的标准,且大大缩短了文库的构建时间、提高了文库的成功率。0008本发明的另一个目的在于提供根据上述构建方法制备得到的一种大片段DNA文库。0009为解决上述技术问题,本发明的实施方式提供了一种基于ILLUMINA测序平台的大片段DNA文库的构建方法,包含以下步骤00101将样本基因组DNA随机打断至325KB的DNA片段;00。
12、11可交换先后顺序的2和300122将打断的DNA片段进行末端补平,在补平的DNA片段两端加上生物素标记的环化接头;00133分离325KB的DNA片段;00144将分离的DNA片段进行环化,得到环化的DNA,并除去未环化的DNA片段;00155随机打断环化的DNA至200700BP左右的DNA片段;00166从步骤5得到的DNA片段中分离带有生物素标记的DNA片段;00177将带有生物素标记的DNA片段进行末端补平;00188对末端补平后的带生物素标记的DNA片段末端加A碱基;00199在步骤8得到的DNA片段两侧连上ILLUMINA测序接头;002010将步骤9得到的DNA片段进行PCR扩。
13、增富集,形成测序文库。0021优选地,本发明的步骤1中,将样本基因组DNA打断至1020KB的DNA片段,步骤3中分离1020KB的DNA片段。0022本发明的步骤2中,生物素标记的环化接头为生物素标记的LOXP序列接头。0023本发明的步骤3中,所采用的分离方法为凝胶电泳分离。0024本发明的步骤4中,使用CRE重组酶使分离的DNA片段进行环化。0025本发明的步骤4中,使用不降解质粒的ATP依赖性DNA酶和核酸外切酶I除去未环化的DNA片段。0026本发明的步骤5中,优选将环化的DNA随机打断至400BP的片段。0027本发明的步骤6中,使用链霉亲和素偶联的磁珠分离带有生物素标记的DNA片。
14、段。0028上述大片段DNA文库的构建方法的流程可参考附图4。0029在本发明的具体实施过程中0030关于步骤1,将样本基因组DNA随机打断至325KB的DNA片段,优选地可以打断至1020KB的DNA片段。本发明的方法可以实现从3K到20K不等的DNA片段文库的构建。所构建文库的大小,主要取决于所测序物种的基因组大小和复杂度等。现有技术中的ILLUMINA测序只能实现10KB以下文库的测序,本发明的文库构建方法可实现10KB20KB文库的ILLUMINA测序。说明书CN104153003A3/11页50031本发明中的样本基因组DNA可以是任何物种的基因组DNA,例如大菱鲆、蝙蝠、芒草等,在。
15、本发明所列举的具体实施方案中,选用的是大菱鲆基因组DNA。对基因组DNA进行随机打断的方法可为本领域内常用的物理打断方法,例如在本发明所列举的具体实施方案中,采用的是HYDROSHEAR大刀头打断。0032关于由于经过物理打断的DNA片段,可能形成5或3端突出,因此需要进行末端补平,本发明中对打断的DNA片段进行末端补平的方式可为本领域内常规方法,例如采用KLENOW酶、T4DNA聚合酶和T4多聚核苷酸激酶以及DNTP补平末端。0033关于步骤2、步骤3和步骤4,涉及对分离出适宜长度的被打断的DNA,进而对其进行末端补平、加环化接头和环化的操作。其中,分离操作既可在末端补平和加环化接头操作之前。
16、;也可在末端补平和加环化接头操作之后,均可达到相同的效果。采用CRELOXP重组酶系统完成DNA片段的环化,为本发明的核心。首先在补平的DNA片段两端加上生物素标记的LOXP序列接头,然后再使用CRE重组酶使分离的DNA片段进行环化,环化时间只需1小时,大大缩短了文库的构建时间,提高了文库的成功率。0034CRE重组酶是细菌噬菌体P1的I型拓扑异构酶,能识别并催化LOXP位点间的DNA进行位点特异性重组。CRE酶介导的重组很快在底物与反应产物之间达到平衡。LOXP是由两个13BP反向重复序列和中间间隔的8BP序列共同组成,8BP的间隔序列同时也确定了LOXP的方向,环化接头具体序列如下所示。其。
17、中,单下划线部分为13BP的反向重复序列,双下划线部分为8BP的中间间隔序列,碱基T以生物素修饰。设计接头时在LOXP位点两侧有保护碱基,且两个接头一端设计成粘性末端,可以有效避免接头自连。只有当DNA片段的两端分别连上CRELOXPADAPTER1和CRELOXPADAPTER2时,才可能发生成环的重组。0035CRELOXPADAPTER100365PHOSCGATAACTTCGTATATATACGAAGTTATTACG300373CCAGCTATTGAAGCATATATATGCTTCAATAATGC50038CRELOXPADAPTER200395TCGTATAACTTCGTATATAT。
18、ACGAAGTTATGCACC300403AGCATATTGAAGCATATATATGCTTCAATACGPHOS50041如附图5所示,为本发明中CRE/LOXP位点特异性重组反应的示意图。重组产物根据LOXP位点的位置和相对方向而不同,两个反向LOXP位点间的DNA序列将被翻转,而两个正向重复LOXP位点间的DNA将以环状形式切割。本实验中用到的CRE重组酶属于图中第二种情况两个正向重复LOXP位点间的DNA将以环状形式切割。目前ILLUMINA提供的环化方法都是平末端自身环化,主要是针对10K以下的文库,对10K以上的文库,环化率较差。本实验中主要是采用CRE重组酶环化,将DNA片段的环。
19、化范围可以扩大至20K。0042值得说明的是,本发明的操作流程并不局限于具体实施方式所展示的步骤,操作过程中可采用其他的方式,整体作用和流程不变。将CRELOXP重组酶系统运用到ILLUMINA大片段DNA文库构建中的环化步骤,都应纳入本发明的保护范围内。0043在环化反应之后,本发明使用不降解质粒的ATP依赖性DNA酶和核酸外切酶I除去未环化的DNA片段,不降解质粒的ATP依赖性DNA酶和核酸外切酶I分别用来降解线性说明书CN104153003A4/11页6的双链DNA和单链DNA,两者同时使用可以更彻底地降解未成环的DNA。0044关于步骤5,由于环状的DNA不能直接用于测序,因此需要通过。
20、片段化恢复成线性的DNA,同时释放出末端序列。本发明中对于环状DNA的打断也可以采用现有技术中常用的方法,例如在本发明所列举的具体实施方案中,采用的是COVARIS超声波打断。本发明优选将环状的DNA打断至400BP片段,更适用于ILLUMINA测序。0045关于步骤6,从步骤5中得到的DNA片段中分离带有生物素标记的DNA片段,可使用链霉亲和素偶联的磁珠来实现,链霉亲和素磁珠可以快速和特异性地捕获含生物素标记的DNA片段,不含生物素结合的DNA片段被去除。0046关于步骤7,将被捕获到磁珠上的带有生物素标记的DNA片段进行末端补平,同样可采用本领域内常规方法,例如可采用KLENOW聚合酶、T。
21、4DNA多聚核苷酸激酶以及DNTP补平末端,以产生平端化的DNA,便于继续进行下一步的实验操作。0047关于步骤8、9和10,对末端补平后的带生物素标记的DNA片段,利用KLENOW35聚合酶和DATP,在DNA片段的3端加上了一个A碱基;然后再利用T4DNA连接酶将测序接头连接到DNA片段末端,利用接头末端的T碱基突出和DNA片段末端的A碱基突出互补配对实现连接。本发明中,可选择的接头优选为ILLUMINA测序接头,以适应ILLUMINA测序平台的应用;最后,本发明通过特异性引物PCR扩增富集配对末端片段,形成测序文库。0048进一步地,本发明还提供根据上述方法制得的大片段DNA文库,该大片。
22、段DNA文库可进一步用于进行ILLUMINA平台测序。0049相对于现有技术而言,本发明通过在打断的基因组DNA两端加上含有生物素标记的接头序列,避免采用生物素标记的DNTP可能掺入到DNA片段的中间。环化后中间会产生一段LINKER序列,在测序结果中很容易区分环化位置,测序的长度也可以提高到2X100BP。采用CRE重组酶系统环化DNA片段,环化时间只需1H,大大缩短了文库的构建时间,环化的片段大小范围可以高达100KB,有效的扩大了大片段文库的构建范围,提高了文库的成功率。此外,本发明通过构建20KB的大片段文库,测得其两端的部分序列,能够有效的增加SCAFFOLDN50的长度,使得基因组。
23、的拼接达到精细图或者完成图的标准。附图说明0050图1是实施例中大菱鲆基因组DNA打断为约20KB的电泳图各泳道上样如下泳道1QUICKLOAD1KBEXTENDDNALADDERNEB公司,货号N3239S;泳道2,3,4速度参数为15,循环数为20的打断效果;泳道5QUICKLOAD1KBEXTENDDNALADDER;0051图2是实施例中大菱鲆DNA加环化接头后分离回收约20KB片段的电泳图各泳道上样如下泳道1QUICKLOAD1KBEXTENDDNALADDER;泳道2加环化接头后进行电泳分离的DNA;泳道5QUICKLOAD1KBEXTENDDNALADDER;0052图3是实施例。
24、中大菱鲆20K大片段文库PCR富集后的电泳图各泳道上样如下泳道1DS2000东盛生物,货号M1101;泳道2PCR富集后的电泳图;泳道3MARKER1东盛生物,货号M1081;0053图4是本发明的大片段DNA文库的构建方法的流程图;0054图5是本发明中CRE/LOXP位点特异性重组反应的示意图。说明书CN104153003A5/11页7具体实施方式0055为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实。
25、施方式的种种变化和修改,也可以实现本申请各权利要求所要求保护的技术方案。0056实施例1大菱鲆基因组DNA20K大片段文库构建00571样品DNA打断0058先取样品DNA约1UG使用HYDROSHEAR大刀头打断速度参数设为15,05的琼脂糖胶检测片段大小是否在20K附近。如果片段大小不合适,则调节SPEEDCODE重新试验,直到选择到合适的打断条件。大菱鲆基因组DNA使用该打断条件,DNA片段集中在20K附近,满足实验要求,继续使用该条件打断20UGDNA样品。00592DNA末端补平00601在PCR管中配制如下混合液006100622轻轻混匀,20放置30MIN。00633将DNA转入。
26、15ML离心管,加200LAMPUREXPBEADS,轻轻混匀,室温放置15MIN。00644样品瞬时离心2S,置于磁力架上2MIN,弃上清。00655保持样品管在磁力架上,加入500L80乙醇,静置30S,弃上清。00666重复步骤5一次。00677样品瞬时离心2S,放置于磁力架上去掉残存的乙醇,室温晾干5MIN。00688加入90LNUCLEASEFREEWATER,混匀,磁力架上放置5MIN,取87L上清于新的PCR管中。00693环化接头的连接说明书CN104153003A6/11页800701在PCR管中配制如下混合液0071007200732轻轻混匀,25放置15MIN。00743。
27、加入40L6XLOADINGBUFFER和2L20SDS,混匀。0075465放置10MIN,然后置于冰上直至电泳上样。00765在1V/CM电压下,使用05的MEGABASE琼脂糖凝胶电泳18H。00776使用SYBRGREEN染料染色,在蓝光下切取2025KBDNA片段。00787使用ZYMOCLEANTMLARGEFRAGMENTDNARECOVERYKIT回收DNA片段,加40LNUCLEASEFREEWATER洗脱。0079上述进行环化接头连接的步骤1中,接头序列CRELOXPADAPTER1和CRELOXPADAPTER2是环化接头序列,且是通用的接头序列,不受不同物种来源的DNA。
28、限制。PHOS表示磷酸化修饰,BIODT表示在T碱基上加生物素修饰。CRELOXPADAPTER1TOP和CRELOXPADAPTER1BOT两条链退火形成环化接头CRELOXPADAPTER1。CRELOXPADAPTER2TOP和CRELOXPADAPTER2BOT两条链退火形成环化接头CRELOXPADAPTER2。两个接头序列如下0080CRELOXPADAPTER1TOPSEQIDNO100815PHOSCGATAACTTCGTATAATGTATGCTATACGAAGBIODTTATTACG30082CRELOXPADAPTER1BOTSEQIDNO200835CGTAATAACTT。
29、CGTATAGCATACATTATACGAAGTTATCGACC30084CRELOXPADAPTER2TOPSEQIDNO300855TCGTATAACTTCGTATAATGTATGCTATACGAAGTTATGCACC30086CRELOXPADAPTER2BOTSEQIDNO400875PHOSGCATAACTTCGTATAGCATACATTATACGAAGBIODTTATACGA300884DNA片段的环化00891在PCR管中配制如下混合液0090说明书CN104153003A7/11页900912轻轻混匀,瞬时离心,50放置15MIN。00923使用ZYMOGENOMICDNACL。
30、EANCONCENTRATORTMKITS纯化DNA片段,加83LNUCLEASEFREEWATER洗脱。00934使用QUANTITPICOGREENDSDNAASSAYKIT定量DNA样品浓度。00945在PCR管中配制如下混合液,做两份重复009500966轻轻混匀,瞬时离心,运行如下程序009737FOR50MIN009870FOR10MIN00994HOLDFOREVER01007向上述样品中加入11L100MMDTT,室温放置2MIN。01018向上述样品中继续加入如下试剂0102ATP100MM11L0103PLASMIDSAFEATPDEPENDENTDNASE10U/L5L0。
31、104EXONUCLEASEI20U/L3L01059轻轻混匀,瞬时离心,运行如下程序010637FOR30MINUTES010780FOR20MINUTES01084HOLDFOREVER01095环化DNA的打断01101将两份重复样品混合,使用COVARIS打断DNA至400BP左右。01112使用MINELUTEPCRPURICATIONKIT纯化DNA,52LELUTIONBUFFER10MMTRISHCL,PH75洗脱DNA。01126生物素标记DNA的分离说明书CN104153003A8/11页1001131取50L混匀的DYNALM270STREPTAVIDINBEADS于15。
32、ML离心管中,放置于磁力架上2MIN,弃上清。01142取出离心管,加入100L的BINDINGBUFFER10MMTRISHCL,PH75,1MMEDTA,2MNACL,混匀。01153将离心管放置于磁力架上2MIN,弃上清。01164重复步骤2和3两次。取出离心管,加入50LBINDINGBUFFER混匀。01175向上面的BEADS管中加入50L的DNA样品,混匀,室温放置20MIN。01186瞬时离心,将离心管置于磁力架上2MIN,弃上清。01197加入200LWASHBUFFER10MMTRISHCL,PH75,1MMEDTA,1MNACL,混匀,放置于磁力架上2MIN,弃上清。01。
33、208重复步骤7两次。01219加入200LELUTIONBUFFER,混匀。01227生物素标记DNA的补平01231向PCR管中加入如下试剂012401252将BEADS管置于磁力架上2MIN,弃上清。01263加100L的补平混合液于BEADS管中,混匀,20放置30MIN。01274将BEADS放置于磁力架上2MIN,弃上清。01285使用200LWASHBUFFER洗BEADS三次。01296加入200LELUTIONBUFFER,混匀。01308生物素标记DNA的末端加A碱基01311向PCR管中加入如下试剂01320133说明书CN104153003A109/11页1101342。
34、将BEADS管置于磁力架上2MIN,弃上清。01353加入50L的上述混合液于BEADS管中,混匀,37放置30MIN。01364将BEADS放置于磁力架上2MIN,弃上清。01375使用200LWASHBUFFER洗BEADS三次。01386加入200LELUTIONBUFFER,混匀。01399生物素标记DNA加接头01401向PCR管中加入如下试剂014101422将BEADS管置于磁力架上2MIN,弃上清。01433加入45L的上述混合液于BEADS管中,混匀,加入5LQUICKT4DNALIGASE,混匀,20放置15MIN。01444将BEADS放置于磁力架上2MIN,弃上清。01。
35、455使用200LWASHBUFFER洗BEADS三次。01466加入200LELUTIONBUFFER,混匀。014710PCR富集01481取200ULPCR管,冰上配置以下反应体系014901502将BEADS管置于磁力架上2MIN,弃上清。说明书CN104153003A1110/11页1201513加入100L的上述混合液于BEADS管中,用吸头轻轻吸打混匀后分别转入50L于两个02MLPCR管中。01524按照以下程序进行PCR反应0153A30SECONDSAT980154B18CYCLESOF015510SECONDSAT98015630SECONDSAT60015730SECO。
36、NDSAT720158C5MINUTESAT720159DHOLDAT401605将PCR管置于磁力架上1MIN,吸出上清到新的PCR管中。01616加20L的6XLOADINGBUFFER到样品中,混匀。01627运行2琼脂糖凝胶电泳,5V/CM,2H。01638EB染色后,在蓝光下切取400750BP大小的条带。01649使用QIAGENGELEXTRACTIONKIT回收文库DNA,使用30LQIAGENEB洗脱。0165上述PCR反应中,引物序列分别为0166PCRPRIMER1SEQIDNO501675AATGATACGGCGACCACCGA30168PCRPRIMER2SEQIDN。
37、O601695CAAGCAGAAGACGGCATACGA30170实施例2大菱鲆基因组DNA20K大片段文库的MP库评估0171对上述实施例1所构建的大菱鲆基因组DNA的20K大片段文库,进行MP文库评估。0172MP文库的评估主要有两个重要指标与建库期望相吻合的平均库长和INSERTSIZE在正常范围的READPAIRS所占的比例即环化率,这是确定实验成功的两个重要标准。0173MP库评估过程对测序READPAIRS去重复并质控,然后用软件BOWTIE2比对到组装的SCAFFOLD序列上,用自己写的脚本对比对结果进行数据统计,获得表1的各统计值0174表120KMP库评估结果0175说明书C。
38、N104153003A1211/11页1301760177注各READPAIRS的正确插入范围允许上下波动30,即期望库长30。0178从上表1的各统计值可以得出01791该MP文库的MAPRATE较高,为6806;01802该文库的插入片段平均长度,即距离跨度为192K,跟预期的很相近;01813插入片段符合预期范围的READPAIRS比例较高,占4631左右;其中,比对到相同SCAFFOLD的PAIRS数比例达3432,比对到不同SCAFFOLD的PAIRS数占1199,这是可参考的一个指标,说明组装还有提升的空间;而库长不在正常范围内的READPAIRS数只占了一个很小的比例076,说明。
39、该MP库建库效果很好。01824只有单端比对上的READS,即SINGLEMAPPEDREADS所占比例较大,达4197,这是大片段MP库会常看到的现象,是建库时环化接头偏离中间所致,对组装不会产生影响。0183总体来说,该20KMP建库较理想,后续用SOAPDENOVO软件加入该MP文库组装,对SCAFFOLD的提升效果较好。0184本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。说明书CN104153003A131/3页1400010002序列表CN104153003A142/3页150003序列表CN104153003A153/3页16序列表CN104153003A161/2页17图1图2图3说明书附图CN104153003A172/2页18图4图5说明书附图CN104153003A18。