《基因组鉴定系统.pdf》由会员分享,可在线阅读,更多相关《基因组鉴定系统.pdf(31页珍藏版)》请在专利查询网上搜索。
1、10申请公布号CN102007407A43申请公布日20110406CN102007407ACN102007407A21申请号200880124929822申请日2008112160/989,64120071121USG01N33/48200601G01N33/50200601G06F7/00200601G06F17/3020060171申请人考斯摩斯德公司地址美国马里兰72发明人RR科尔韦尔JP姚库普切克J春74专利代理机构永新专利商标代理有限公司72002代理人林晓红54发明名称基因组鉴定系统57摘要本发明属于基因组学与核酸测序领域。其涉及一种对生物材料进行测序以及对测序信息中短字符串进行。
2、实时概率匹配来鉴定所有出现在所述生物材料中的物种的新方法。其涉及测序信息的实时概率匹配,更特别涉及单一分子核酸的多个序列中短字符串的比较,所述核酸可是扩增的或者是未扩增的,可是化学合成或者是物理性探询的,随序列信息的产生随时进行,且与持续的序列信息产生与收集并行。30优先权数据85PCT申请进入国家阶段日2010071686PCT申请的申请数据PCT/US2008/0844032008112187PCT申请的公布数据WO2009/085473EN2009070951INTCL19中华人民共和国国家知识产权局12发明专利申请权利要求书4页说明书14页附图10页按照条约第19条的修改2页CN102。
3、007420A1/4页21一种鉴定样品中生物材料的方法,包括获得包含所述生物材料的样品,从所述样品中提取一或多种核酸分子,通过瞬时直接概率匹配INSTANTDIRECTPROBABILISTICMATCHING从所述核酸分子产生序列信息用于将所述序列信息与数据库中的核酸序列进行对比。2权利要求1的方法,其中所述一或多种核酸分子选自DNA或RNA。3权利要求1的方法,其中所述序列信息包含长度“N”的核苷酸片段。4权利要求3的方法,其中所述长度“N”的核苷酸片段与数据库中的核酸序列进行对比。5权利要求4的方法,其中所述长度“N”的核苷酸片段通过概率匹配与数据库中的核酸序列进行对比。6权利要求4的方。
4、法,其中所述长度“N”的核苷酸片段的对比实时进行,或者随所述片段或所述片段的序列信息产生随时进行。7权利要求4的方法,其中如果长度“N”的核苷酸片段的匹配概率低于靶匹配的阈值,那么从所述一或多种核酸分子产生长度“N1”,“N2”“NX”的核酸片段并与数据库中的核酸序列进行对比,其中“X”小于50。8权利要求4的方法,其中如果长度“N”的核苷酸片段的匹配概率低于靶匹配的阈值,那么从所述一或多种核酸分子产生长度“N1”,“N2”“NX”的核酸片段并与数据库中的核酸序列进行对比,其中“X”大于50。9权利要求1的方法,进一步包括在产生序列信息之前将所述一或多种核酸分子扩增以产生多个“I”的核酸分子。。
5、10权利要求8的方法,其中所述序列信息包含长度“N”的核苷酸片段。11权利要求9的方法,其中将所述多个“I”的长度“N”的核苷酸片段与数据库中的核酸序列进行对比。12权利要求11的方法,其中将所述多个IN的核苷酸片段通过概率匹配与数据库中的核酸序列进行对比。13权利要求11的方法,其中所述多个IN的核苷酸片段的对比是实时进行的,或者随所述片段产生随时进行。14权利要求11的方法,其中如果多个IN的核苷酸片段的匹配概率低于靶匹配的阈值,那么从所述一或多种核酸分子产生长度“IN1”,“IN2”“INX”的核酸片段并与数据库中的核酸序列进行对比,其中“X”小于50。15权利要求11的方法,其中如果多。
6、个IN的核苷酸片段的匹配概率低于靶匹配的阈值,那么从所述一或多种核酸分子产生长度“IN1”,“IN2”“INX”的核酸片段并与数据库中的核酸序列进行对比,其中“X”大于50。16权利要求512任一项的方法,其中所述概率匹配是通过使用贝叶斯方法来进行的。17权利要求512任一项的方法,其中所述概率匹配是通过使用递归贝叶斯方法来进行的。18权利要求512任一项的方法,其中所述概率匹配是通过使用朴素贝叶斯方法来进行的。权利要求书CN102007407ACN102007420A2/4页319权利要求512任一项的方法,其中所述概率匹配提供阶层统计框架以鉴定所述序列信息的物种。20权利要求1的方法,其中。
7、所述序列信息与数据库中核酸序列的对比是实时进行的,或者随序列信息产生随时进行,期间继续从所述一或多种核酸分子产生另外的序列信息。21权利要求20的方法,其中所述另外的序列信息包含长度变化的核苷酸。22权利要求1的方法,其中所述序列信息包含长度“N”的核苷酸片段,其与数据库中的核酸序列进行实时对比,或者随所述片段产生随时对比;期间继续从所述一或多种核酸分子产生长度“N1”,“N2”“NX”的核酸片段并与数据库中的核酸序列进行实时对比,或者随所述片段产生随时对比。23权利要求1的方法,其中在产生长度“N”的核苷酸片段的序列信息之前将所述一或多种核酸分子扩增来产生多个“I”的核酸分子;进一步包括将所。
8、述多个IN的核苷酸片段与数据库中的核酸序列进行实时对比,或者随所述片段产生随时对比;期间继续从所述一或多种核酸分子产生多个“IN1”,“IN2”“INX”的核酸片段并与数据库中的核酸序列进行实时对比,或者随所述片段产生随时对比。24一种检测生物材料的系统,包含F设置为接收包含生物材料的样品的样品接收单元;G与所述样品接收单元相通的提取单元,所述提取单元设置为从所述样品提取至少一个核酸分子;H与所述提取单元相通的测序盒,所述测序盒设置为从所述提取单元接收所述至少一个核酸分子并从所述至少一个核酸分子产生序列信息;I包含参考核酸序列的数据库;以及J与所述测序盒及所述数据库相通的处理单元,所述处理单元。
9、设置为从所述测序盒接收所述序列信息并将所述序列信息与所述参考核酸序列进行对比。25权利要求24的系统,包括便携式测序装置,其将数据电子传输到数据库用于生物体的鉴定,所述生物体的鉴定涉及确定所述核酸序列。26权利要求24的系统,进一步包括碱基判定单元,其设置为处理由所述测序盒所接收的序列。27权利要求26的系统,其中所述碱基判定单元与概率匹配处理器相连。28权利要求27的系统,其中所述概率匹配处理器设置为使用贝叶斯方法来接收结果序列并在考虑到由所述碱基判定单元产生的测序质量得分的情况下计算每次测序读数的概率。29权利要求27的系统,其中所述概率匹配处理器使用在用于鉴定病原体之前所产生与优化的数据。
10、库。30权利要求27的系统,其中所述概率匹配处理器使用根据序列内容而改变的加权得分。31权利要求24的系统,包括与所述处理单元相通的存储单元,其中所述处理单元设置为将所述序列信息传送至所述数据存储单元并继而从所述数据存储单元检索所述序列信息来进行处理。32权利要求24的系统,其中所述至少一个核酸分子选自由DNA和RNA组成的组。权利要求书CN102007407ACN102007420A3/4页433权利要求24的系统,其中所述序列信息包含长度“N”的核苷酸片段。34权利要求33的系统,其中所述提取单元设置为将所述长度“N”的核苷酸片段与所述参考核酸序列进行对比。35权利要求34的系统,其中所述。
11、提取单元设置为通过概率匹配将所述长度“N”的核苷酸片段与所述参考核酸序列进行对比。36权利要求34的系统,其中所述提取单元设置为将所述长度“N”的核苷酸片段与所述参考核酸序列进行实时对比,或者随所述长度“N”的片段产生随时对比。37权利要求34的系统,其中如果长度“N”的核苷酸片段的匹配概率低于靶匹配的阈值,那么将所述测序盒设置为从所述一或多种核酸分子产生长度“N1”,“N2”“NX”的核苷酸片段的序列信息并且将所述提取单元设置为将所述长度“N1”,“N2”“NX”的核苷酸片段与数据库中的核酸序列进行对比。38权利要求36的系统,其中将所述长度“N”的核苷酸片段与所述参考核酸序列进行实时对比,。
12、或者随所述长度“N”的片段产生随时对比,期间所述测序单元继续从所述一或多种核酸分子产生长度“N1”,“N2”“NX”的核苷酸片段的序列信息,并且所述处理单元将所述长度“N1”,“N2”“NX”的核苷酸片段的序列信息与数据库中的核酸序列进行实时对比,或者随所述片段产生随时对比。39一种鉴定样品中生物材料的方法,包含I获得包含所述生物材料的样品,II从所述样品提取一或多种核酸分子,III产生序列信息,包含来自所述一或多种核酸分子的核苷酸片段的序列,IV将核苷酸片段的所述序列与数据库中的核酸序列进行对比;并且如果核苷酸片段的所述序列的所述对比未导致鉴定出所述样品中生物材料的匹配,那么该方法进一步包括。
13、V从所述一或多种核酸分子产生另外的序列信息,其中所述另外的序列信息包含由一个另外的核苷酸组成的核苷酸片段的序列,VI紧随着所述另外的序列信息的产生,将所述另外的序列信息与数据库中的核酸序列进行对比,并重复步骤VVI直至匹配导致鉴定生物材料是所述样品。40一种鉴定样品中生物材料的方法,包括I获得包含所述生物材料的样品,II从所述样品提取一或多种核酸分子,III将所述一或多种核酸分子扩增产生多个一或多种核酸分子,IV产生多个序列信息,包含来自所述多个一或多种核酸分子的多个核苷酸片段序列。V将核苷酸片段的所述多个序列与数据库中的核酸序列进行对比;并且如果核苷酸片段所述多个序列的所述对比未导致鉴定出所。
14、述样品中生物材料的匹配,那么该方法进一步包括VI从所述一或多种核酸分子产生多个另外的序列信息,其中所述另外的序列信息包含由一个另外的核苷酸组成的核苷酸片段的序列,权利要求书CN102007407ACN102007420A4/4页5VII紧随着所述另外的序列信息的产生,将所述另外的序列信息与数据库中的核酸序列进行对比,并重复步骤VIVII直至匹配导致鉴定生物材料是所述样品。41权利要求39或40的方法,其中所述与数据库核酸序列的对比通过概率匹配随所述序列信息产生随时进行。权利要求书CN102007407ACN102007420A1/14页6基因组鉴定系统0001与相关申请交叉参考0002本申请要。
15、求2007年11月21日提出的美国临时申请号60/989,641的优先权,以其全文援引加入本文。发明领域0003本发明涉及鉴定生物体、更特别涉及在手持或者大型电子装置中通过概率数据匹配PROBABILISTICDATAMATCHING确定核酸以及其它多聚或者链型分子的序列的系统和方法。背景技术0004存在各种各样的威胁生命的情况,其中分析和测序DNA或RNA样品将有用,例如为了应对将致命病原物质释放到环境中的生物恐怖主义行为。过去,此类结果需要很多人的参与,需要太多时间。结果,快捷性和准确性受会到影响。0005在生物恐怖主义分子袭击或者紧急传染病事件中,对于最早的应对者即急诊室医师他们的选择或。
16、病床边治疗以及对于食品制造商、分销商、零售商和对于全国公共卫生人员能够迅速、准确并且可靠地鉴定出该病原物质以及其引起的疾病是重要的。病原物质可包含在样品来源如食物、空气、土壤、水、病原物质的组织以及临床呈递物CLINICALPRESENTATION。因为所述物质和/或潜在疾病可以是威胁生命并高度传染的,因而此鉴定方法应迅速完成。这是在现有国土安全生物恐怖主义应对中的一个明显弱点。0006需要系统和方法,其可基于样品中存在的核酸的基因组对比来鉴定不仅仅是单一生物体多重技术MULTIPLEXING并且指明一个物种是否存在。0007生物工程的快速进步已经引人注目地影响到了DNA测序工具的设计和性能,。
17、即高通量测序,其是确定DNA中碱基顺序的方法,产生遗传变异图谱,该图谱可为人类疾病的遗传基础提供线索。这种方法在使用任何数目的引物对许多不同的DNA模板进行测序时非常有用。尽管有这些生物工程中的重要进步,但在构建装置来快速鉴定所述序列信息并更高效和更有效传输数据方面却几乎没有进展。0008DNA测序传统上由双脱氧法来完成,通常称作SANGER法SANGERETAL,1977,其使用链终止抑制剂来使通过DNA合成的DNA链的延伸停止。0009用于DNA测序策略的新方法在持续发展中。比如DNA微列阵的出现使得可以构建序列阵列并在通称为杂交测序SEQUENCINGBYHYBRIDIZATION的方法。
18、中与互补序列杂交。另一种考虑了当今技术水平的技术利用引物延伸接着循环加入单个核苷酸,其中每个循环后接着对该掺入结果的检测。该技术通称为合成测序SEQUENCINGBYSYNTHESIS或者焦磷酸测序,包括荧光原位测序FISSEQ,在实践上是重复的并且在对靶核苷酸序列测序时包含引物延伸重复循环的一系列过程。0010因此,存在对快速基因组鉴定方法和系统的需求,包括对核酸序列数据、临床数据、治疗介入的多向电子通讯,和将治疗剂特制输送给适当群体从而使应对合理化,保持有说明书CN102007407ACN102007420A2/14页7价值的医材供应以及控制生物恐怖主义、疏忽造成的扩散及新出现的病原性流行。
19、病。0011本系统设计用于分析任何含有生物材料的样品以确定该样品中物种或基因组的存在。这是通过获取所述生物材料的序列信息并将该序列信息与数据库进行对比来实现的。匹配的序列信息将表明基因组或者物种的存在。概率匹配PROBABILISTICMATCHING将计算物种存在的可能性。所述方法可应用于大规模并行测序系统。0012发明概述0013本发明的一个方面是鉴定样品中生物材料的方法,包括获取包含所述生物材料的样品,从所述样品中提取一或多种核酸分子,从所述核酸分子产生序列信息以及基于概率将所述序列信息与数据库中的核酸序列进行对比。鉴定生物材料包括但不限于检测和/或确定样品中存在的基因组,所述样品中含有。
20、的核酸序列信息,确定生物材料中物种的能力,检测株系、突变体和工程化的生物体之间变化的能力以及鉴别未知生物体和多态性。生物材料包括但不限于生物体或病原体的DNA,RNA及相关遗传信息。0014在本发明的一个实施方案中,所述一或多种核酸分子可选自DNA或者RNA。0015在另一个实施方案中,本发明包括产生包含长度“N”的核苷酸片段的序列信息,以及进一步将所述长度“N”的片段与数据库中的核酸序列对比。0016在一个实施方案中,“N”代表对得自所述样品的核酸分子进行阳性鉴定所需的核苷酸片段的最小长度。0017在一个实施方案中,“N”的范围可以是从一个核苷酸到五个核苷酸。0018在本发明的另一个实施方案。
21、中,如果长度“N”的核苷酸片段的序列信息匹配概率低于靶匹配的阈值,则产生具有长度“N1”,“N2”“NX”的核苷酸片段。0019在又一个实施方案中,在产生序列信息前,本发明包括扩增所述一或多种核酸分子以产生多个“I”的一或多种核酸分子。扩增后产生的序列信息可包含长度“N”的核苷酸片段,从而多个“IN”数目的片段将与数据库的核酸序列对比。0020在本发明的另一个实施方案中,如果所述多个“IN”的序列信息匹配概率低于靶匹配的阈值,则产生多个“IN1”,“IN2”“INX”的序列信息。0021在本发明的一个实施方案中,所述核苷酸片段通过概率匹配与数据库中的核酸序列对比,包括但不限于贝叶斯方法BAYE。
22、SIANAPPROACH、递归贝叶斯方法RECURSIVEBAYESIANAPPROACH或者朴素贝叶斯方法BAYESIANAPPROACH。0022概率方法可使用贝叶斯可能性来考虑两个重要因素从而达到准确的结论IPTI/R是展现测试模式TESTPATTERNR的生物体属于分类单位TAXONTI的概率,和IIPR/TI是分类单位TI的成员展现测试模式R的概率。整合入工具的滑动窗口SLIDINGWINDOW中的最小模式MINIMALPATTERN可在生物体“是否”以及“如何”被遗传修饰方面辅助研究人员。0023在本发明的一个实施方案中,所述概率匹配提供了阶层统计框架HIERARCHICALSTA。
23、TISTICALFRAMEWORK来鉴定所述序列信息的种类。0024在本发明的另一个实施方案中,所述序列信息的对比实时进行,或者随着所述序列信息产生随时进行或者在产生之后立即进行。0025在本发明的另一个实施方案中,所述序列信息的对比实时进行,或者随着序列信息产生随时进行,此时另外的序列信息继续自所述一或多种核酸分子产生,其中所述另外说明书CN102007407ACN102007420A3/14页8的序列信息可包含变化长度的核苷酸,包括但不限于与此前产生的序列信息相比增加的、减少的或者相同长度的序列信息。0026在本发明的另一个实施方案中,所述方法包括获取包含所述生物材料的样品,从所述样品提取。
24、一或多种核酸分子,从所述核酸分子产生序列信息,其中所述序列信息包含长度“N”的核苷酸片段,并与数据库中的核酸序列进行实时对比或者随着该片段产生随时进行对比;此时长度“N1”、“N2”“NX”的核酸片段继续由所述一或多种核酸分子产生,并与数据库中的核酸序列实时对比或者随着序列产生随时对比。0027在本发明的另一个实施方案中,所述方法包括获取包含所述生物材料的样品,从所述样品提取一或多种核酸分子,在产生长度“N”的核苷酸片段的序列信息之前先扩增所述一或多种核酸分子来产生多个“I”核酸分子;进而包括将该多个“IN”的核苷酸片段与数据库中的核酸序列进行实时对比或者随着片段产生随时对比;此时多个“IN1。
25、”、“IN2”“INX”的核酸片段继续由所述一或多种核酸分子产生,并与数据库中的核酸序列进行实时对比或者随着序列产生随时对比。0028在本发明的一个实施方案中,序列信息包括但不限于层析谱,标记DNA或RNA片段的影像,对核酸分子的物理性探询PHYSICALINTERROGATION以确定核苷酸顺序,纳米孔分析NANOPOREANALYSES以及其他确定核酸链序列的本领域已知方法。0029在本发明的一个实施方案中,“X”可以选自110,1020,2030,3040,4050,5060,6070,7080,8090或者90100个核苷酸。在另一个实施方案中,“X”可以选自100200,200300。
26、,300400或者400500个核苷酸。0030在本发明的另一个实施方案中,如果长度“N”的核苷酸片段的序列信息匹配概率低于靶匹配的阈值,那么“NX”代表了对从所述样品获得的核酸分子进行阳性鉴定所需的核苷酸片段的最小长度。0031本发明的另一个实施方案是鉴定样品中生物材料的方法,包括I获取包含所述生物材料的样品,II从所述样品提取一或多种核酸分子,III产生序列信息,包含来自所述一或多种核酸分子的核苷酸片段的序列,IV将核苷酸片段的所述序列与数据库中的核酸序列对比;并且如果核苷酸片段所述序列的所述对比没有产生鉴定所述样品中存在生物材料的匹配,那么所述方法继续包括V从所述一或多种核酸分子产生另外。
27、的序列信息,其中所述另外的序列信息包括由一个另外的核苷酸组成的核苷酸片段的序列,VI产生所述另外的序列信息后立即将所述另外的序列信息与数据库中的核酸序列对比,并重复步骤VVI直到匹配导致鉴定所述生物材料是所述样品。0032本发明的另一个实施方案是鉴定样品中生物材料的方法,包括I获取包含所述生物材料的样品,II从所述样品提取一或多种核酸分子,III扩增所述一或多种核酸分子来产生多个一或多种核酸分子,III产生多个序列信息,包含来自所述多个一或多种核酸分子的核苷酸片段的多个序列,IV将核苷酸片段的所述多个序列与数据库的核酸序列对比,如果核苷酸片段的所述多个序列的所述对比没有产生鉴定样品中生物材料的。
28、匹配,那么所述方法继续包括V从所述一或多种核酸分子产生多个另外的序列信息,其中所述另外的序列信息包含由一个另外的核苷酸组成的核苷酸片段的序列,VI产生所述另外的序列信息后立即将所述另外的序列信息与数据库中的核酸序列对比,并重复步骤VVI直到匹配导致鉴定所述生物材料是所述样品。说明书CN102007407ACN102007420A4/14页90033本发明也涉及检测生物材料的系统,包含I设置为接收含生物材料样品的样品接收单元UNIT;II与所述样品接收单元相通的提取单元,所述提取单元设置为从所述样品提取至少一个核酸分子;III与所述提取单元相通的测序盒CASSETTE,所述测序盒设置为从所述提取。
29、单元接收所述至少一个核酸分子并从所述至少一个核酸分子产生序列信息;IV包含参考核酸序列的数据库;以及V与所述测序盒及所述数据库相通的处理单元,所述处理单元设置为从所述测序盒接收所述序列信息并将所述序列信息与所述参考核酸序列对比。0034在本发明的另一个实施方案中,所述提取单元被设置为将所述长度“N”的核苷酸片段与数据库对比。0035在本发明的另一个实施方案中,所述提取单元被设置为通过概率匹配将所述长度“N”的核苷酸片段与数据库对比。0036在本发明的另一个实施方案中,所述提取单元被设置为将所述长度“N”的核苷酸片段与数据库进行实时对比或者随着所述片段产生随时对比。0037在本发明的另一个实施方。
30、案中,如果长度“N”的核苷酸片段的匹配概率低于靶匹配的阈值,则所述测序盒将被设置为从所述一或多种核酸分子产生包含长度变化的核苷酸片段的序列信息例如与前面产生的序列信息相比长度增加、减少或者相同,并且所述提取单元被设置为将所述长度变化的核苷酸片段与数据库中的核酸序列对比。0038而本发明的另一个实施方案包含一个系统,其中将所述长度“N”的核苷酸片段与所述参考核酸序列进行实时对比或者随着所述长度“N”的片段产生随时对比,同时所述测序单元继续从所述一或多种核酸分子产生长度“N1”、“N2”“NX”的核苷酸片段的序列信息,并且所述处理单元将所述长度“N1”、“N2”“NX”的核苷酸片段的序列信息与数据。
31、库中的核酸序列进行实时对比或者随着该片段产生随时对比。0039该系统所涵盖的进一步变化将在以下本发明的相似说明书中描述。0040附图简述0041各种实施方案参考所附附图进行描述。在附图中,类似参考数字表示相同或者功能上相似的组件COMPONENT。0042图1是所公开的系统的示意图。0043图2是图1中系统的更详细的示意图。0044图3是图1中系统的一个实施方案中可更换的盒和其他组件之间的功能性相互作用的示意图。0045图4是手持电子测序装置的一个实施方案的正面透视图。0046图5是说明图1中系统的操作方法的流程图。0047图6是图1中系统与潜在地涉及该系统的各种实体之间相互作用的示意图。00。
32、48图7是手持电子测序装置与远程分析中心之间功能性相互作用的示意图。0049图8是概率软件模块的整体结构示意图。0050图9显示出作为所读序列长度函数的独特序列的百分比。0051图10是测序原理步骤的概要。0052发明详述0053本发明所描述的方法与系统使用最短的独特序列信息,其在未鉴别的样品中的核说明书CN102007407ACN102007420A5/14页10酸混合物中相对于所产生或收集的完整序列信息具有最小的独特长度N。除了独特长度序列外,非独特的也被对比。基因组鉴定的概率随着多个匹配而增加。有些基因组会比其他基因组具有更长的最小独特序列。短长度N序列的匹配方法在序列信息产生或者收集的。
33、同时也在继续。对比随着随后较长序列产生或者收集随时实时发生。这导致可观的判定空间DECISIONSPACE缩小,因为就序列产生/收集而言,计算是早期进行的。所述概率匹配可包括但不限于完全匹配PERFECTMATCHING,子序列独特性SUBSEQUENCEUNIQUENESS,模式匹配PATTERNMATCHING,多个子序列在长度N内匹配,不精确匹配INEXACTMATCHING,种子与延伸SEEDANDEXTEND,距离测量以及进化系统树作图。它提供了自动化途径将所述序列信息进行随其产生随时或者实时匹配。所述测序设备可在对比的同时继续收集更长和更多串STRING的序列信息。随后的序列信息也。
34、可进行对比并可提高对样品中基因组或物种的鉴定的可信性。该方法不需要等候短读数SHORTREAD的序列信息集结成较大的重叠群。0054本发明公开的系统与方法提供了核酸引入INTAKE、分离与分选SEPARATION,DNA测序,数据库网络,信息处理,数据储存,数据显示以及电子通讯来加快相关数据传送以使得可以诊断或鉴定对病原体爆发和适当应对有用途的生物体。所述系统包括便携式测序装置,其可将数据电子传输到数据库来对生物体进行鉴定,所述对生物体的鉴定涉及确定核酸和其它多聚或链型分子的序列以及概率数据匹配。0055图1和图2说明了包括便携式手持电子测序装置105的系统100的实施方案。所述便携式电子测序。
35、装置105本文称作“测序装置”被设置为可使用户U易于持握和使用,并且可以通过通讯网络110与许多其他潜在相关实体通讯。0056该装置被设置为可分别接收对象样品SS和环境样品ES。所述对象样品如血液、唾液等可包括该对象的DNA以及该对象中任何生物体病原或其他的DNA。所述环境样品ES可包括但不限于环境包括食物、空气、水、土壤、组织中处于其天然状态的生物体。两种样品SS,ES都可受生物恐怖主义行为或新出现的流行病的影响。两种样品SS,ES都同时通过管或药签收集并被接收到在膜或载玻片、平板、毛细管或沟槽CHANNEL上的溶液里或固体作为珠上。所述样品SS,ES接着被同时测序。特定环境的情形可能会需要。
36、分析由样品SS,ES的混合物组成的样品。一旦鉴定出概率匹配和/或在实时数据收集和数据解释期间,将联系最初的应对者。随着时间推进,渐渐增多百分比的序列可被鉴定出来。0057所述测序装置105可包括如图3所示的下列功能性组件,其使得装置105能分析对象样品SS和环境样品ES,将分析结果与通讯网络110沟通。0058样品接收器120和122与DNA提取和分离部件BLOCK130相连,其继而将样品通过流动系统传递到部件130。部件130从样品提取DNA并将其分离从而使其可被进一步处理和分析。这可通过使用试剂模板即作为用于合成互补核酸链模式的DNA链来完成,其可与样品120、122组合在一起通过已知流控。
37、转运技术而传递。在样品120、122中的所述核酸由提取和分离部件130分选,得到核苷酸片段或者未扩增的单个分子的流STREAM。一个实施方案可包括使用扩增方法。0059可更换的盒140可以以可移除方式与测序装置105和部件130相连。所述盒140可从部件130接收所述分子流并测序DNA及产生DNA序列数据。说明书CN102007407ACN102007420A6/14页110060所述可更换的盒140可以连接到并提供所述DNA序列数据给完成概率匹配的处理器160。一个实施方案可包括以1MB/SEC的速率传输16GB数据的性能。优选测序盒140来获得所述序列信息。代表不同测序方法的不同的盒可以互。
38、换。所述序列信息通过概率匹配进行对比。超快匹配算法以及预先产生的加权特征数据库WEIGHTEDSIGNATUREDATABASE将重新得到DENOVO的序列数据与储存的序列数据对比。0061所述处理器160可以是例如用途特异性集成电路,其被设计为用于完成一或多个特定功能或者使一或多种特定装置或应用成为可能。该处理器160可控制测序装置105的所有其他功能元件。例如,该处理器160可发送/接收所述DNA序列数据以存于数据存储器内存170。该数据存储器170也可包括任何适宜类型或形式的内存来用于将数据存储为可被处理器160读取的形式。0062所述测序装置105可进一步包括通讯组件180,处理器16。
39、0可将从数据存储器170读取的数据发送给所述组件180。该通讯组件180可包括任何适宜技术来用于与通讯网络110通讯,如有线、无线、卫星等。0063所述测序装置105可包括用户输入模块150,用户通过其可提供输入给装置105。这可包括任何适宜输入技术如按钮、触摸板等。最后,所述测序装置105可包括用户输出模块152,其可包括用于视频输出的显示器和/或音频输出装置。0064所述测序装置105也可包括全球定位系统GPS接收器102,其可接收定位数据并将该数据继续传给处理器160;以及电源104即电池,插入式适配器用于给输出负载或所述测序装置105的负载组提供电力或者其他类型能量。0065所述可更换。
40、的盒140在图3中有更详细的图示。该盒140可以以可移除方式与测序装置105以及部件130相连并包括一种最新测序方法即高通量测序。湿法化学WETCHEMISTRY或者基于固态的系统可通过盒可更换的“即插即用”方式构建在层面DECK上。所述盒140可从部件130接收所述分子流并通过测序方法测序DNA及产生DNA序列数据。实施方案包括基于但不限于以下的方法合成测序、连接测序SEQUENCINGBYLIGATION、单分子测序SINGLEMOLECULESEQUENCING以及焦磷酸测序。还有另外一个实施方案包括用作电场142的源SOURCE并且将该电场142应用于所述分子流来实现该流中DNA的电泳。
41、。所述盒包括光源144来用于发射穿过所述DNA流的荧光144。该盒进一步包括生物医学传感器探测器146用于探测所述荧光发射以及用于探测/确定该样品流的DNA序列。除荧光之外,该生物医学传感器也能够探测适用于测序的标记部分的所有波长的光。0066所述荧光探测包括测量标记部分的信号,该标记部分来自所述一或多种核苷酸或核苷酸类似物中的至少一种。使用荧光核苷酸的测序典型包括在探测所加入的核苷酸后将荧光标记光漂白。实施方案可包括基于珠的荧光、FRET、红外标记、焦磷酸酶、连接酶方法包括标记的核苷酸或聚合酶或使用循环可逆终止子CYCLICREVERSIBLETERMINATOR。实施方案可包括纳米孔或者包。
42、括固定的单分子或在溶液中的光学波导OPTICALWAVEGUIDE等直接方法。光漂白方法包括减弱的信号强度,其随着每一个荧光标记核苷酸加入到引物链而积累。通过减弱该信号强度,任选测序更长的DNA模板。0067光漂白包括将光脉冲应用于已掺入荧光核苷酸的核酸引物。所述光脉冲典型包含长等于感兴趣荧光核苷酸所吸收的光波长的波长。该脉冲被应用约50秒或更短,约20秒说明书CN102007407ACN102007420A7/14页12或更短,约10秒或更短,约5秒或更短,约2秒或更短,约1秒或更短,或者约0秒。该脉冲破坏所述荧光标记核苷酸和/或荧光标记引物或核酸的荧光,或者将该荧光减弱至可接受水平,比如背。
43、景水平,或者低至足以防止若干循环后的信号累积的水平。0068所述传感器探测器146任选监测至少一种来自核酸模板的信号。该传感器探测器146任选包含或者可操作性地连接于包括软件的电脑,所述软件用于将探测器信号信息转换成测序结果信息,比如核苷酸浓度、核苷酸种类、模板核苷酸序列等。另外,任选校准样品信号,例如通过监测来自已知来源信号来校准微流体系统MICROFLUIDICSYSTEM。0069如图2所示,所述测序装置105可通过通讯网络110与各种实体通讯,所述实体可与生物恐怖主义行为或流行病爆发事件中的通报相关。这些实体可包括最初应对者即实验室应对网络即参比实验室REFERENCELABS,SEM。
44、INALLABS,国家实验室,疾病控制中心CDC,医师,公共卫生人员,医疗记录,人口普查数据,执法,食品生产商,食品分销商和食品零售商。0070上面讨论的测序装置105的一个实例现参考阐述了该装置前视图的图4描述。该装置是便携式手持测序装置并以与硬币C大小对比阐述。该装置105大约长11英寸并易于运送。图4中,硬币用于显示比例。两个端口153、154位于该装置的一侧并代表样品接收器120、122。端口153用于接收要进行分析和测序的对象样品SS或环境样品ES。端口154用于测序对照SC。所述两个不同端口设计用于确定对象样品SS或环境样品ES是否含有导致测序失败的材料,如果测序失败,或者以CLI。
45、A容量运行。所述装置105包括用户输入模块150,使用户U可以对装置105提供输入。在这个特定实施方案中,用户输入模块150是触摸板形式,不过,任何适宜技术都可使用。所述触摸板包括按钮150A用于视频显示,150B、150C用于记录数据,150D用于实时数据传输和接收,以及150E用于电源控制来启动或停止该装置。或者,该键板可并入显示屏并且所有功能可由液晶界面控制。适宜技术在美国专利申请公开NO2007/0263163中描述,以其全文援引加入。这可以通过启用蓝牙装置配对或类似方法。该功能包括数字键,由字符表字母标记,如电话键盘常用位置,如删除键、空格键、退出键、打印键、回车键、上/下、左/右、。
46、额外字符以及其它任何用户所期望的。该装置进一步包括用户输出模块152,以视频显示形式来为用户U展示信息。如果需要,也可提供如157A和157B所示的音频输出装置。最后,所述测序装置105包括发光二极管155和156来指示数据的传输和接收。键/按钮的功能是控制样品测序、数据传输和概率匹配以及界面控制的所有方面,包括但不限于开启/关闭、发送、导航键、软键SOFTKEY、清除、以及具有算法计算出来的基因组排序的LCD显示功能和可视化工具用以列出匹配置信度。一个实施方案包括基于互联网的系统,其中多个用户可同时向/从分层网络搜苏引擎传输/接收数据。0071图5是上述系统100的一个实施方案中的系统100。
47、的操作过程流程图。如图5所示,该装置的操作过程包括在200,在样品接收器120、122接收收集的对象样品SS和环境样品ES。在202,该样品进入DNA提取和分离部件130,其中分析样品并从样品提取并分离DNA。在203,可更换的盒140从部件130接收所述分离的DNA并测序DNA。取决于所述的盒以及是否需要,140盒内的生物医学传感器146可通过用电场142和荧光144来探测/确定该样品流的DNA序列。在204,测序数据被处理和储存于数据存储器170。在205,通过概率匹配对比所述测序数据并完成基因组鉴定。这一过程在实质上不断反复。作为结果说明书CN102007407ACN102007420A。
48、8/14页13的信息可通过通讯网络110传输。GPS全球定位系统数据也可任选在步骤205中传输。在206,该装置从匹配中电子接收数据。在207,该装置通过用户输出模块152用视频显示从匹配中电子接收的数据。如果需要进一步分析,在208,所述测序的数据通过通讯网络被电子传输到数据解释实体即公共卫生人员,医疗记录等。0072多方法研究途径可增强对事件的快速反应并将最初的保健护理与生物体探测相整合。可以使用三角应对TRIANGULATERESPONSE,其涉及将来自DNA测序的定量仪器数据与定性病危护理CRITICALCARE汇集。在跨多地区区域收集的DNA测序数据的观察清单和审计的基础结构INFR。
49、ASTRUCTURE可用于对比生物体的出现,例如地点之间的生物威胁。对基因组数据的推理统计学分析可与医学观察结合来发展优先范畴CATEGORIESOFPRIORITIES。在不同医学中心和基因组中心数据库之间收集和共享的信息可使得对事件三角划分TRIANGULATION、事件量级MAGNITUDE以及在适当时间对受影响人做出正确介入成为可能。0073图6阐述了所述系统100与各种潜在资源实体之间的相互作用。所述装置105被设置为通过无线或有线通讯网络与这些资源实体相互作用。装置105可传输三角划分的表示为“样品数据”、“患者数据”和“治疗介入”的测序数据信息310。装置105可向和从与资源32。
50、0匹配的序列传输和接收DNA序列数据,所述资源320包括和包括前哨实验室SENTINELLABS、参比实验室和国家实验室在内的实验室应对网络。0074所述每个实验室都有具体作用。前哨实验室医院和其他社区临床实验室负责排除或者将其面临的危险物质上报给附近的LRN参比实验室。参比实验室遵守生物安全等级3BSL3实践的州或者地方公共卫生实验室进行证实检验排查RULEIN。国家实验室BSL4保持能够处理病毒物质如依波拉和大天花并进行确定性鉴别的能力。0075系统100可进一步向和从数据解释资源330传输和接收数据,所述资源330包括执法实体、公共卫生人员、医疗记录以及人口普查数据。最后,所述装置105。