通过MS使序列数据相关的计算机的方法和系统.pdf

上传人:Y94****206 文档编号:1617043 上传时间:2018-06-29 格式:PDF 页数:25 大小:1,013.37KB
返回 下载 相关 举报
摘要
申请专利号:

CN98807544.X

申请日:

1998.07.21

公开号:

CN1265157A

公开日:

2000.08.30

当前法律状态:

终止

有效性:

无权

法律详情:

未缴年费专利权终止IPC(主分类):C12Q 1/68申请日:19980721授权公告日:20060405|||授权|||实质审查的生效申请日:1998.7.21|||公开

IPC分类号:

C12Q1/68

主分类号:

C12Q1/68

申请人:

拉普吉恩公司;

发明人:

J·范尼斯; J·C·泰伯恩; J·豪伯特; J·T·马利甘

地址:

美国华盛顿

优先权:

1997.07.22 US 60/053,429

专利代理机构:

中国国际贸易促进委员会专利商标事务所

代理人:

周中琦

PDF下载: PDF下载
内容摘要

本发明提供一种使生物分子(例如DNA)特征(例如核苷酸类型)与具有与生物分子相关的独特分子量的分子标记相关的方法和系统。在一个实施方案中,标记分子应用于合成生物分子时所用的引物上。系统最初接收每个生物分子特征与相应分子标记分子量的对应关系。系统也接收在分析与分子标记结合的生物分子时测得的分子量信号。对于每个检测的分子量,系统根据接收的对应关系决定对应于所测分子量的特征。然后系统表明分析的生物分子具有测定的特征。

权利要求书

1.一种在计算机系统中使生物分子特征与具有与生物分子相关的
独特分子量的分子标记相关的方法,此方法包括:
接收生物分子的每个特征与和特征相关的分子标记的相应分子量之间
的对应关系;
接收在分析与分子标记结合的生物分子时测得的分子量信号;并且
对于每个检测的分子量,
根据接收的对应关系决定对应于所测分子量的生物分子特征;并且
表明生物分子具有测定的特征。
2.权利要求1所述的方法,其中在合成生物分子时将分子标记应
用于所用的引物上。
3.权利要求1所述的方法,其中表明是鉴定寡核苷酸的碱基序列。
4.权利要求1所述的方法,其中生物分子特征是鉴定碱基,其中
分子量以对应于生物分子碱基序列中的碱基位置的顺序加以测定,并
且其中表明是表明生物分子中的碱基序列。
5.权利要求4所述的方法,其中特征是进一步鉴定同时分析的多
个生物分子中的一个生物分子。
6.权利要求1所述的方法,其中表明是鉴定一个DNA片段是否与
另一个DNA片段不同。
7.权利要求1所述的方法,其中特征是鉴定已解链和重新退火的
测试和参照DNA片段,其中每一片段都具有碱基序列,并且其中在不
同时间检测到相同分子量时,确定由该相同分子量所识别的测试和参
照DNA片段的碱基序列是不同的。
8.权利要求1所述的方法,其中表明是鉴定两个mRNA群体之间的
差异。
9.权利要求1所述的方法,其中特征是鉴定用于合成cDNA群体的
引物并且其中在不同时间检测到的具有相同分子量的分子标记的数目
反映cDNA群体中的碱基序列。
10.权利要求9所述的方法,其中将具有相同分子量的分子标记的
数目与从用于合成另一cDNA群体的引物得到的具有相同分子量的分子标
记的数目比较以鉴定碱基序列中的差异。
11.一种在计算机系统中同时测定多个样品寡核苷酸(ODN)序列
的方法,其中每种序列含有四种碱基A、T、C和G,此方法包括:
对于多个样品ODN中的每个样品,接收与待用于样品ODN的分子标记
相关的四种分子量信号,四种分子量中的每一种对应于四种碱基中的一
种,每种分子量在待用于所有样品ODN的所有分子标记的所有分子量中
是独一无二的;并且
对于对应于序列长度的多个位置的每个位置,
接收与已用于样品ODN的分子标记相关的分子量信号,通过质谱
仪检测分子量,其中质谱仪检测每个位置分配给多个样品ODN中的每个
样品的四种分子量中的一种分子量;并且
对于多个样品ODN中每个样品,
用接收的样品ODN信号确定测得的分子量代表的碱基;并且
将处于样品ODN序列中位置的碱基定为测得的碱基。
12.权利要求11所述的方法,包括:
接收对样品ODN的选择;
对于四种碱基中的每种碱基,显示说明分配给所选样品ODN的该碱基
的分子量的检测的图谱;并且
显示样品ODN的序列。
13.权利要求12所述的方法,包括从用户接收对显示序列的改变。
14.一种在计算机系统中测定多对测试和参照DNA片段是否不同的方
法,此方法包括:
对于多对片段中的每对片段,接收具有与片段对相关的独特分子量的
分子标记信号;
对于不同时间,接收在同时分析已用不同引物合成的多对片段时测得
的具有每种分子量的分子标记数信号;并且
对于具有独特分子量的每种分子量,
测定对于该分子量测得的分子标记数中是否有一个以上峰;并且
当测定到对于该分子量测得的分子标记数中存在一个以上峰时,表
明DNA片段对是不同的。
15.一种在计算机系统中鉴定两个mRNA群体是否不同的方法,此方
法包括:
对于多种引物中的每种引物,接受具有与引物相关的独特分子量的分
子标记信号;
对于不同时间,接收在同时分析已用多个引物中的每个引物从mRNA
分别合成cDNA的结果时测得的具有每种分子量的分子标记数信号;并且
对于分子标记的分子量中的每种分子量,
测定接收的分子标记数是否与在各种时间对另一mRNA群体测得的分
子标记数大概相同;并且
当测定到测得的数目不同时,表明mRNA群体是不同的。
16.一种使样品生物分子特征与具有与样品生物分子相关的独特分子
量的分子标记相关的计算机系统,包括:
表明每种分子标记分子量的分子标记定义表;
用于产生每个样品生物分子与分子标记之间的对应关系的定义运行组
件;
用于接收在分析已与分子标记结合的样品生物分子时测得的分子量信
号的分子量收集组件;和
基于接收的对应关系测定对应于所测分子量的生物分子特征并且表明
生物分子具有测定的特征的相关组件。
17.权利要求16所述的计算机系统,其中表明是鉴定寡核苷酸的碱
基序列。
18.权利要求16所述的计算机系统,其中表明是鉴定一个DNA片段
是否与另一个DNA片段不同。
19.权利要求16所述的计算机系统,其中表明是鉴定两个mRNA群体
之间的差异。

说明书

通过MS使序列数据相关的计算机方法和系统

技术领域

本发明一般涉及使数据相关的计算机系统和方法,更具体地涉及对标
记的数据和与该标记数据有关的信息进行相关分析的计算机系统和方
法。

发明背景

构成寡核苷酸(ODN)的碱基序列的鉴定通常通过以在1976年引入测
序的Fred Sanger博士命名的Sanger测序法进行。正如目前所用的,Sanger
测序利用放射性标记的分子测定样品寡核苷酸的序列。放射性标记的分
子在放射性标记的寡核苷酸片段的酶合成中使用。为了测定样品寡核苷
酸的序列,用凝胶电泳分离通过Sanger测序产生的放射性标记片段。凝
胶电泳产生二维图谱,通过分析产生有关样品核苷酸碱基序列的信息。

虽然Sanger测序在全世界实验室中使用,但是它有显著缺点。一个
缺点是二维凝胶电泳图谱是通过分析片段的放射性来测定的。放射性物
质对许多在此领域工作的人产生健康问题。特别地,此方法很难获得提
供由约1,000个以上碱基构成的寡核苷酸的序列信息的单一图谱。另一
缺点是它很难自动分析二维凝胶电泳图谱。

目前部分克服这些缺点的方法是用荧光标记的分子而不是放射性标记
的分子来制备片段。正如通常所用的,使用对应于每种独特碱基(例如A、
T、C和G)的四种独特标记。荧光标记分子的使用允许使用柱层析而不
是凝胶电泳来分离标记的片段。柱层析通常是比凝胶电泳更有效的分离
片段技术并且比凝胶电泳更易于自动化。尽管避免了放射性并且可提高
分离效率,荧光标记分子与Sanger测序的结合使用并不广泛。用荧光标
记进行Sanger测序的主要问题是在一次分析中只能检测定少量荧光标记
(总是少于8,通常仅为4),这使DNA测序的处理量限制在每泳道或每
柱一个或两个样品。目前可以商业购买使用荧光标记的、可以自动对片
段测序的仪器。然而,这些仪器相当昂贵并且仍然有这个主要问题。

因此,本领域需要对基本Sanger测序改进的方法。优选地,改进的
方法将避免使用放射性标记的分子、易于自动化、利用在研究和开发实
验室中通常可得到的设备、对甚至长寡核苷酸序列也高度准确并且允许
有效地同时分析多个寡核苷酸样品。

发明概述

本发明提供一种使生物分子(例如DNA)特征(例如核苷酸类型)与
具有与生物分子相关的独特分子量的分子标记相关的方法和系统。在一
个实施方案中,标记分子应用于合成生物分子时所用的引物上。系统最
初接收每个生物分子特征与相应分子标记分子量的对应关系。系统也接
收在分析与分子标记结合的生物分子时测得的分子量信号。对于每个检
测的分子量,系统根据接收的对应关系决定对应于所测分子量的特征。
然后系统表明分析的生物分子具有测定的特征。

附图简述

图1是说明核苷酸测序系统组件的框图。

图2是说明BCID系统所用表格的图。

图3是说明质谱仪输出结果的图。

图4含有说明在不同时间间隔对于分子量110、120、130和140检
测的不同分子量的分子数的图谱。

图5是运行定义运行组件的例行程序(routine)流程图。

图6是运行产生ODN序列组件的例行程序流程图。

图7是运行显示ODN序列组件的例行程序流程图。

发明详述

本发明提供一种通过将分子标记应用于生物分子、测定分子标记的特
征并用这些特征鉴定生物分子本身的特征来分析生物分子的基于计算机
的方法和系统。本发明的生物分子特征鉴定(“BCID”)系统接收分子标
记特征与相应生物分子特征的对应关系。然后将分子标记应用于生物分
子。然后通过测定分子标记的特征来分析标记的生物分子。BCID系统使
用这些测得的特征和对应关系来鉴定生物分子的特征。

在一个实施方案中,分子标记的特征是分子量。每种分子标记具有独
特的分子量因此它可以得到唯一鉴定。标记的生物分子通过质谱仪加以
分析以鉴定应用于生物分子的生物标记的分子量。然后根据分子标记鉴
定生物分子的特征。标记的生物分子可以在分析前用质谱仪预处理使得
可以推导出标记生物分子的其它特征。例如,标记的生物分子可以通过
填充柱洗脱使得标记的生物分子以基于标记生物分子长度的顺序从填充
柱流出。也就是说,较短的生物分子先从填充柱流出。因此,质谱仪首
先分析较短的标记的生物分子。BCID系统使用分子量与特征的对应关系
以及从预处理得到的信息鉴定生物分子的特征。

BCID系统可用于在多个不同分析和方法中鉴定生物分子的特征。在下
文中,BCID系统得到描述,它用于鉴定寡核苷酸包括任何长度DNA片段
的碱基序列(核苷酸测序)、测定两种寡核苷酸序列是否不同(突变检测)
以及比较生物样品中表达的基因(差异展示)。
核苷酸测序

核苷酸测序是鉴定序列未知的寡核苷酸(“ODN”)中的碱基序列的过
程。核苷酸测序中的第一步是得到未知序列的ODN样品(“原始ODN”)。
例如,原始ODN可能具有目前未知的序列TAGCATTAGCTGCC。核苷酸测序
中的第二步是从原始ODN制备多个ODN(“互补ODN”)。虽然这些互补ODN
均具有相同(也是未知的)序列,但是这些序列与原始ODN序列反向互
补。例如,原始序列的互补序列是GGCAGCTAATGCTA。核苷酸测序中的第
三步是将这些互补ODN分成四部分,即每一部分对应于每种碱基(即A、
T、C和G)并将每部分置于各自的容器中。四个容器中各含有一套综合
的生物分子,当与互补ODN混合时,合成具有与互补ODN序列互补并由
此与原始ODN序列相同的序列的ODN。例如,合成的ODN具有与原始ODN
序列相同的序列TAGCATTAGCTGCC。这些综合的生物分子包括用于酶合成
的酶和四种合成单元(即dATP,dTTP,dCTP和dGTP)。酶使用“引物”
序列以起始合成单元向合成ODN的合成。

此时,四个容器都含有相同成分:互补ODN和综合的生物分子。然而,
核苷酸测序中的第四步是向每个容器加入独特的分子标记。向第一个容
器加入dATP的双脱氧类似物ddATP和带有具独特分子量(MW1)的分子标
记的引物。与dATP(“A”)掺入合成的ODN相竞争,酶将把ddATP(“A*”)掺
入合成的ODN中。然而,ddATP与dATP功能上的不同在于在ddATP掺入
合成的ODN中之后,酶不能再把其它碱基掺入此特定ODN中。例如,如
果完全合成的ODN具有序列TAGCATTAGCTGCC,那么酶通过从左到右向引
物添加(即开始添加T到引物上以提供引物T,然后添加A到引物T上以
提供引物TA,添加G到引物TA以提供引物TAG等等)来合成此序列。在
有些情况下酶将添加ddATP而不是dATP到引物T上从而提供引物TA*。
酶将不能够继续合成序列,因为A*有效地阻止酶添加下一个碱基。然而,
在其它情况下,酶将添加dATP(“A”)到引物T序列上以提供序列引物TA。
然后酶将继续添加G和C以提供引物TAGC。然而,此时,当酶将添加A
到引物TAGC上时,可能添加A或A*。如果添加A*,那么产生引物TAGCA*,
并且酶不能再添加任何其它碱基到此序列上。如果添加A,那么产生引物
TAGCA,并且酶可以继续添加碱基,直至产生引物TAGCATT。此时,又可
能添加A或A*。

酶具有足够时间在第一个容器中起作用之后,将合成四种特征为具有
以下序列的ODN:引物TAGCATTAGCTGCC、引物TAGCATTA*、引物TAGCA*
和引物TA*。因为所有ddATP分子都与带有具分子量MW1的分子标记的引
物结合,所以含有少于完整序列的14个碱基的每种合成ODN都将带有具
分子量MW1的分子标记。更具体地,具有分子量MW1的分子标记将存在于
2、5和8个碱基长(不计入具有恒定长度的引物序列)的合成ODN中。

向第二个容器添加dTTP的双脱氧类似物ddTTP。添加的ddTTP对于dTTP
的作用与ddATP对于dATP的作用方式类似。添加的ddTTP分子与带有具
独特分子量(MW2)的分子标记的引物结合。因此,在第二个容器中,将
合成以下序列:引物TAGCATTAGCTGCC、引物TAGCATTAGCT*、引物TAGCATT*、
引物TAGCAT*和引物T*。因此,具有分子量MW2的分子标记将存在于1、
6、7和11个碱基长的合成ODN中。

以类似的方式,向第三个容器添加dCTP的双脱氧类似物ddCTP。添加
的ddCTP分子与带有具独特分子量(MW3)的分子标记的引物结合。因此,
在第三个容器中,将合成以下序列:引物TAGCATTAGCTGCC*、引物
TAGCATTAGCTGC*、引物TAGCATTAGC*和引物TAGC*。具有分子量MW3的分
子标记将存在于4、10、13和14个碱基长的合成ODN中。向第四个容器
添加dGTP的双脱氧类似物ddGTP。添加的ddGTP分子与带有具独特分子
量(MW4)分子标记的引物结合。因此,在第四个容器中,将合成以下序
列:引物TAGCATTAGCTG*、引物TAGCATTAG*和引物TAG*。具有分子量MW4
的分子标记将存在于3、9和12个碱基长的合成ODN中。

核苷酸测序的第五步是合并四个容器的内容物并使用高压液相色谱
(HPLC)通过填充柱来洗脱合并的内容物。结果是合成的ODN基于大小
分离,其中较短的合成ODN先通过填充柱洗脱出来。因此,首先从填充
柱洗脱的合成ODN将是引物T*,接着将是引物TA*,然后是引物TAG*等。

核苷酸测序的第六步是用与质谱仪连接的标记切割单元处理填充柱的
输出物(即洗脱物)。因此,当引物T*从填充柱流出时,释放分子标记并
且质谱仪记录分子量MW2的存在,因为ddTTP(T*)与带有具分子量MW2的
分子标记的引物结合。同样,当引物TA*从填充柱流出时,质谱仪记录分
子量MW1的存在,因为ddATP与带有具分子量MW1的分子标记的引物结合。
因此,质谱仪将由此依次记录分子量MW2、MW1、MW4、MW3、MW1、MW2、MW2、
MW1、MW4、MW3、MW2、MW4、MW3和MW3。

然后BCID系统可利用以前定义的分子标记与碱基的对应关系鉴定原
始ODN的序列。BCID系统接收每种分子量并确定对应的碱基。因为合成
的ODN已通过填充柱预处理,所以记录到的分子量顺序与原始ODN中的
碱基顺序相对应。BCID系统输出测定的碱基序列作为原始ODN的核苷酸
序列。

使用具有独特分子量的分子标记的核苷酸测序可用于同时鉴定多个未
知序列样品ODN的序列。每个样品ODN有其自己的一套四个分开的容器。
对多样品ODN中的每个样品ODN进行与单一样品ODN头四步相同的步骤。
具体地,将每个样品ODN的互补ODN置于四个分开的容器中。每个容器
含有酶和合成单元。对于样品ODN,一套四个容器中的每个容器各含有四
种双脱氧类似物中的一种。然而,每种双脱氧类似物与带有分子标记的
引物结合,其中分子标记具有在所有样品ODN的所有容器中独一无二的
分子量。例如,第一个样品ODN的容器可能含有与带有具分子量MW1的分
子标记的引物结合的ddATP,而第二个样品的容器可能含有与带有具分子
量MW5的分子标记的引物结合的ddATP。在核苷酸测序的第五步中,不是
仅仅合并单一ODN四个容器的内容物,而是合并所有样品的所有容器的
内容物。然后通过填充柱洗脱合并的内容物。因为合并了多个样品的内
容物,所以对于每个样品ODN,将有具每种长度的一种序列。因为多个合
成的ODN具有相同的长度,所以合成的具相同长度的ODN将同时通过填
充柱洗脱出来并且同时进入质谱仪。例如,如果合成两个样品ODN并且
它们合并的内容物通过填充柱洗脱出来,那么合成的具长度1的ODN将
同时从填充柱流出。如果第一个样品ODN的第一个碱基的双脱氧类似物
带有具分子量MW2的分子标记而第二个样品ODN的第一个碱基的双脱氧类
似物带有具分子量MW5的分子标记,那么质谱仪将报告分子量MW2和分子
量MW5同时存在。

BCID系统含有具独特分子量的每种分子标记与样品ODN以及其代表的
碱基之间的对应关系。用此对应关系,BCID系统可以测定例如第一个样
品ODN序列中的第一个碱基是T而第二个样品ODN序列中的第一个碱基
是A。对于质谱仪测得的每种分子量,BCID重复此过程以同时鉴定每个
样品ODN的序列。

图1是说明核苷酸测序系统组件的框图。核苷酸测序系统包括容器
101、填充柱102、标记切割单元104、质谱仪105和BCID系统110。容
器101装有准备通过填充柱102洗脱的合成ODN。填充柱的输出物经分流
器103分流至标记切割单元104。然后将标记切割单元104的输出物输入
质谱仪105。然后将质谱仪的输出结果输入BCID系统110。标记切割单
元使分子标记与合成的ODN分离。然后将这些分子标记送入质谱仪以分
析其分子量。BCID系统110包括不同数据构件111-113和不同功能组件
114-117。标记套定义表111含有用于鉴定样品ODN碱基的每套四种分子
标记的分子量的标识。对于其合成的ODN被合并(汇集)并同时通过填
充柱洗脱出来的每个样品ODN定义一套分子标记。样品池定义表112识
别分配给样品池中每个样品ODN的标记套。运行定义表113含有准备连
续通过核苷酸测序系统运行的所有样品池的目录。定义运行组件114给
用户提供一个界面,通过它定义每个样品池和待用在样品池中的每个样
品ODN上的分子标记套。定义运行组件也允许用户鉴定计划连续通过核
苷酸测序系统运行的样品池。收集分子量(MW)数据组件115接收质谱
仪得到的数据并鉴定数据内的各个峰。这些峰表明在一定时间间隔中测
定的具有一定分子量的分子标记。产生ODN序列组件116使用表111-113
使由质谱仪测定的分子量与对应于这些分子量的序列匹配。显示ODN序
列组件117显示分子量和相应序列的图谱。显示ODN序列组件允许用户
对鉴定到的序列进行修饰以校正任何源于自动测序的错误。BCID系统表
的组件和数据构件可以永久地存贮于计算机可读介质如CD-ROM上,并且
可下载到计算机系统的存储器中以进行BCID系统的处理。

图2是说明BCID系统所用表格的图。标记套定义表201对于12个样
品的每一个含有一行,这些样品可合并到单一样品池中并同时由核苷酸
测序系统进行处理。标记套定义表优选地由BCID系统开发者预装。此表
以数套与核苷酸测序系统一起提供的分子标记的分子量预装。表的每行
定义一套分子标记。每套含有对四种碱基(即A、T、C和G)特有的分子
标记。标记套定义表201含有样品数据。标记套数据表的第一行对应于
第一套并表明该套中分子标记的分子量是分别对应于碱基A、T、C和G的
100、110、120和130。标记套定义表中每种分子量是独有的使得每个样
品的每个碱基可以得到唯一鉴定。样品池定义表202和203含有标记套
与准备合并到单一样品池中的每个样品ODN的样品ID(标识,
identification)之间的相关性。如表202中所示,将对应于John Smith
的样品ID分配给标记套号1,它们是具有分子量100、110、120和130
的分子标记。核苷酸测序系统的用户将信息输入BCID系统以表示哪些标
记套分给了哪几个样品ODN。BCID系统的用户可以定义各个样品池。每
个样品池有其自己的样品池定义表。运行定义表204列出了准备通过核
苷酸测序系统连续处理的各个样品池。运行定义表的每行含有样品池号
的标识和样品池定义表的索引。

图3是说明质谱仪输出结果的图。质谱仪周期性地测定标记切割单元
提供的样品的分子量。例如,质谱仪可以每分钟取样测定分子量100次。
质谱仪每次取样测定分子量时,将测得的每种分子量的分子数保存在分
子量表中。例如,如在时间间隔3中所示,质谱仪测得有50个分子具有
分子量110,没有分子具有分子量120或130,有200个分子具有分子量
520,并且有5个分子具有分子量530。

图4含有说明在不同时间间隔对于分子量110、120、130和140检测
的不同分子量的分子数的图谱。图中水平轴代表时间,垂直轴代表分子
数。图上的每个峰表示在该时间通过填充柱洗脱的具有特定长度的特定
合成ODN。例如,峰401表示质谱仪在时间4测定到的多个具有分子量100
的分子。收集分子量数据组件分析分子量表以鉴定不同的峰。对于给定
的具有各种分子量的标记套,在一个时间对一种分子量应该仅检测到一
个峰。不同的过滤技术可用于测定分子量表中的峰。一旦检测到峰,产
生ODN序列组件就可处理每标记套的分子量信息以确定序列。BCID系统
首先鉴定与样品ODN第一个峰有关的分子量。然后BCID系统从标记套定
义表检索与该分子量有关的特定碱基。BCID系统输出特定碱基作为样品
ODN序列中的第一个碱基。然后BCID系统鉴定与样品ODN第二个峰有关
的分子量。BCID系统测定与该分子量有关的碱基并且输出作为样品ODN
序列中的第二个碱基。BCID系统对所有峰和所有样品ODN重复此过程。
序列402说明从分析图4的图谱数据得到的碱基序列。图谱的左边是如
标记套定义表的标记套号1所示的与每种分子量有关的碱基。因为分子
量100的图谱具有对应于位置1、4和7的峰,所以存在于序列中的1、4
和7位的碱基均为A。然后显示ODN序列组件以类似于图4的方式显示信
息。然后给用户机会校正序列中可能不正确的任何碱基。尽管在图4的
实例中峰数据相当离散,但是在实际数据中峰可能不象那么容易识别。
结果,峰检测规则系统可能不确定地检测错误峰。图4的信息显示允许
用户图示观察峰信息和相应序列并按需要进行校正。

图5是运行定义运行组件的例行程序流程图。定义运行组件允许用户
指定哪几种标记套用于哪几个样品ODN,哪几个样品ODN合并到一起以及
哪几个样品ODN的样品池准备同时通过核苷酸测序系统运行。在步骤
501-504中,例行程序循环(loop)允许用户指定分配给分至每个样品池
中的每个样品ODN的分子标记套。在步骤501中,例行程序显示样品池
定义网。样品池定义网大约对应于图2中所示的样品池定义表的轮廓。
标记套的数目预先设定。用户在对应于分配给该样品ODN的分子标记套
的一行输入样品池中每个样品ODN的样品标识(人名)。在步骤502中,
例行程序接收样品标识。在步骤503中,例行程序以下一个样品池ID保
存样品池定义表。在步骤504中,如果用户指示样品池的定义完整,那
么例行程序继续到步骤506,否则例行程序转至步骤501以输入下一个样
品池定义。在步骤506中,例行程序显示运行定义网。在一个实施方案
中,运行定义网有对应于运行中每个可能样品池的行和含有样品池号的
一列以及定义该运行的样品池的样品池定义表的索引。在步骤507中,
例行程序接收来自用户的样品池指示以包括在运行中。在步骤508中,
例行程序将运行定义信息保存于运行定义表中并且完成程序。

图6是运行产生ODN序列组件的例行程序流程图。此例行程序处理通
过质谱仪得到的一个样品池的数据。此例行程序用于运行中处理的每个
样品池。在步骤601-608中,例行程序循环选择样品池中的每个样品并
鉴定该样品的每个序列。在步骤601中,例行程序从第一个样品开始在
当前样品池中选择下一个样品。在步骤602中,如果所有样品都已选择,
那么例行程序结束,否则例行程序继续到步骤603。在步骤603中,例行
程序从标记套定义表检索所选样品的分子量。在步骤604-608中,例行
程序对检索的分子量的每个测定的峰的循环进行一次重复。循环鉴定哪
一个检索的分子量有随后通过质谱仪测定的分子量峰。在步骤604中,
例行程序预置每一检索的分子量到分子量表中第一峰时间的索引iA、iT、
iC和iG。例如,对于标记套号1,分子量是100、110、120和130。因
此,参照图4的图谱,例行程序设置索引iA相当于2、索引iT相当于1、
索引iC相当于4而索引iG相当于3。这些索引用于追踪分子量表中的峰。
在步骤605中,例行程序从第一个时间开始选择下一个时间。在步骤606
中,如果所有检索的分子量的分子量数据都已选择,那么例行程序转回
步骤601以选择下一个样品,否则例行程序继续到步骤607。在步骤607
中,程序将序列中的下一个碱基设置为对应于具有最小值的指数的碱基。
例如,第一次通过循环时,例行程序检测到索引iT含有最小值1。然后
例行程序将序列中的第一个碱基设置为T。在步骤608中,例行程序预置
到对应于其下一个峰的时间的具有最小值的索引。例如,在第一次经过
此循环过程中,例行程序就预置到其时间6处的下一个峰的时间的索引
iT。然后例行程序转回步骤605以选择下一个峰。

图7是执行显示ODN序列组件的例行程序流程图。在步骤701中,程
序接收用户对样品ID的选择。在步骤702中,如果用户指示显示是完全
的,那么例行程序完成,否则例行程序继续到步骤703。在步骤703中,
例行程序检索含有对应于所选样品ID的信息的分子量表的一部分。例行
程序利用样品池定义表以确定分配给所选样品ID的分子标记套。然后例
行程序从标记套定义表检索该分子标记套的分子量。在步骤704中,程
序显示分配的检索的分子量数据的图谱。图4表示这样的图谱的显示。
在步骤705中,例行程序显示所选样品ID的ODN序列,其中碱基排列在
峰下面。在步骤706中,例行程序允许用户输入对显示序列中任一碱基
的校正。在步骤707中,用户改变了序列,然后例行程序修正ODN序列
并转回步骤701从而接收用户对样品ID的下一个选择。
突变检测

具有独特分子量的分子标记也可用于同时测定多对DNA(即测试DNA
和参照DNA)是否具有不同序列。每对DNA之间的差异可能由DNA突变引
起。因此,检测差异的系统称为突变检测系统。突变检测系统使用与图4
中所示的核苷酸测序系统相同的填充柱、标记切割单元和质谱仪配置。
BCID系统含有其它组件和表以测定多对测试和参照DNA中的每对中是否
发生了突变。

突变检测系统可同时处理48对DNA。突变检测的第一步是将每对待比
较的DNA样品置于一对容器中。因此将有48对容器,其中每对容器中的
一个容器含有测试DNA而另一个容器含有参照DNA。突变检测的第二步是
将两种引物加入每个容器中。一种引物将各与测试和参照DNA的一条链
结合,而另一种引物将各与测试和参照DNA的另一条链结合。每对容器
中的两种引物之一具有分子量标记,但对于每对容器分子量是不同的。
因此每对容器分配到具有独特分子量的分子标记。突变检测的第三步是
扩增DNA。扩增到的DNA片段通过两种引物结合位点定界。突变检测的第
四步是将每对容器的测试和参照DNA片段合并到单一容器中并且然后使
每对容器的内容物解链和重新退火。当解开的链重新退火时,存在产物
的独立分配,即测试DNA片链的一部分将与测试DNA片段的互补链退火,
参照DNA片段链的一部分将与参照DNA片段的互补链退火,并且测试DNA
片段链的一部分将与参照DNA片段的互补链退火以形成测试-参照DNA片
段。如果测试DNA片段具有不同于参照DNA片段的序列,那么将出现一
个或多个碱基的错配。例如,碱基T可能与碱基C或碱基G配对。由于
这种错配,测试-参照DNA片段具有不同于测试-测试DNA或参照-参照DNA
片段的构象。当然,如果测试和参照DNA片段相同,那么测试-参照DNA
的构象与测试-测试DNA或参照-参照DNA片段的构象相同。

突变检测的第五步是合并所有容器的内容物并通过填充柱洗脱合并的
内容物。各种DNA片段将以取决于其构象的不同速率流过填充柱。具体
地,如果存在错配,测试-参照DNA片段将在测试-测试DNA和参照-参照
DNA片段之后流出填充柱。突变检测的第六步是将填充柱的流出物送到标
记切割单元并将切割的分子标记送到质谱仪。质谱仪在不同时间间隔记
录分子量。

质谱仪的输出结果包括每个时间间隔对于每种分子量检测到的分子标
记数。如果在不同时间有相同分子量的两个峰,那么一个峰代表测试-参
照DNA片段而另一个峰代表测试-测试和参照-参照DNA片段。检测到两
个峰表明测试-参照DNA片段具有不同于测试-测试和参照-参照DNA片段
的构象。因此,测试DNA片段和参照DNA片段具有不同的序列并且表明
有突变。

用于突变检测的BCID系统包括与核苷酸测序和分析中所用的那些表
相类似的表。标记定义表含有对应于具有相应分子量信号的48个分子标
记中的每一个的一行。样品池定义表含有对应于48对测试和参照DNA片
段中的每一对的一行。每行含有各对的标识(例如John Smith)以及分
配给该对的分子标记的标识。BCID系统处理通过质谱仪得到的分子量表
以确定DNA对是否相同。然后BCID系统转回选择样品池定义表的其它行。
BCID系统测定与从标记定义表选出的行相关的分子量。然后BCID系统分
析该分子量的分子量表以确定该分子量是有一个还是两个峰。如果存在
两个峰,那么BCID系统表明测试片段的DNA序列不同于参照片段的DNA
序列,即在测试片段中存在突变。
差异展示

当多个引物应用于测试mRNA群体时,具有独特分子量的分子标记也
可用于同时测定测试mRNA群体的特征。然后可将这些特征与用相同引物
测得的参照mRNA群体的特征比较。可以观察到这些特征中的差异。用核
苷酸测序系统可鉴定导致差异的mRNA部分并且对其进行测序。鉴定差异
的方法称为差异展示分析。差异分析的目的是鉴定存在于一个mRNA群体
中的独特mRNA种类及其在其它地方的减少或缺乏。本发明的差异展示系
统使用与图4中所示的核苷酸测序系统相同的填充柱、标记切割单元和
质谱仪配置,并加入了分流器和馏分收集器。BCID系统含有其它组件和
表以鉴定测试mRNA群体与参照mRNA群体之间的差异。

差异展示系统同时处理将多个引物应用于测试mRNA群体的结果。差
异展示的第一步是制备对应于测试mRNA群体的测试cDNA。第二步是将
cDNA的一部分加入分开的容器中。差异展示的第三步是加入独特的引物
对,其中之一具有每个容器特有的分子标记。每个容器中的引物将与容
器中的cDNA的一部分结合。第四步是扩增每个容器的内容物。扩增到的
内容物将得到多个从引物结合位点起始合成的cDNA片段。因此,每个引
物对将产生一系列具有不同长度和不同序列的片段。此系列是原始样品
中cDNA群体的亚群。差异展示的第五步是合并所有容器的内容物并通过
填充柱洗脱合并的内容物。由于这些片段将具有不同长度,这些片段将
以不同速度从填充柱中洗脱。因此,每个容器的内容物将洗脱出一系列
峰,每个峰代表给定长度的片段。因为每个容器中的片段带有具独特分
子量的分子标记,所以每个容器的内容物可通过质谱仪得到唯一鉴定。
差异展示的第六步是将填充柱的流出物送到标记切割单元并将切割的分
子标记送到质谱仪。质谱仪在不同时间间隔记录分子量。质谱仪的输出
结果包括每个时间间隔对于每种分子量检测到的分子标记数。时间系列
中对应于单一标记的每个峰代表从原始cDNA群体扩增的片段。因此,特
定峰的存在与否与mRNA群体中独特mRNA的存在与否相关。

差异展示的BCID系统包括与核苷酸序列分析中所用的那些表相类似
的表。标记定义表含有对应于具有相应分子量信号的分子标记的一行。
样品池定义表含有对应于每个容器的一行以鉴定引物和鉴定应用于该引
物上的分子标记。BCID系统比较通过质谱仪得到的测试mRNA群体的分子
量表和以与测试mRNA相同的方式处理得到的参照mRNA群体的分子量表。
具体地,BCID系统选择分配给每种引物的分子量。BCID系统比较所选分
子量的测试mRNA与参照mRNA的分子量数据并记录任何显著差异。这些
差异表明测试mRNA片段与参照mRNA的相应片段不同。

BCID系统也允许对这些差异进行测序。BCID系统记录与任何观察到
的测试mRNA和参照mRNA之间的差异相关的时间。然后BCID系统要求用
户通过填充柱洗脱容器中用具有用于观察差异的分子量的分子标记扩增
的其它内容物。在记录时间,BCID系统在短时间内使填充柱底部的分流
器将填充柱的流出物导入收集容器而不是标记切割单元。因此,收集容
器的内容物是导致观察到的差异的片段。然后可用上述核苷酸测序系统
对这些片段进行测序或通过其它标准技术加以鉴定。

与根据本发明所述的具有独特分子量的标记有关的适当生物分子描述
于各于1997年1月22日提交的美国专利申请Nos.08/786,835;08/786,834
和08/787,521和各于1997年7月22日提交的具有申请号08/898,180;
08/898,564和08/898,501的三个美国部分继续专利申请以及PCT国际公
开Nos.WO 97/27331;WO 97/27325和97/27327中。这6个美国专利申
请和3个PCT国际公开在此分别充分引用其全文作为参考。

可用于本发明方法的生物分子阵列可以按照1997年7月22日提交的
题为“基于聚乙烯亚胺的生物分子阵列”和与其同时提交的同样题目的
美国非临时专利申请No.____中公开的以及1997年7月22日提交
的题为“将溶液排列到固体支持物上的装置和方法”的美国临时专利申
请No.60/053,435和与其同时提交的同样题目的美国非临时专利申请
No._____中所述的技术加以制备,在此引用所有这些公开文献的全
文作为参考。

本发明方法也可用于分析扩增和其它酶反应,如在1997年7月22日
提交的题为“在核酸阵列上进行的扩增和其它酶反应”的美国临时专利
申请No.60/053,428和与其同时提交的同样题目的美国非临时专利申请
No._____中所述,以及单元内含有一个以上寡核苷酸序列的阵列中。
在单元中含有一个以上寡核苷酸序列的生物分子阵列及其用途描述于
1997年7月22日提交的题为“阵列单元内的多功能性及其用途”的美国
临时专利申请No.60/053,436和与其同时提交的同样题目的美国非临时
专利申请No._____中。在此分别充分引用这些申请的全文作为参考。

虽然本发明已通过各种实施方案得到描述,但并不意味着本发明局限
于这些实施方案。在下面的权利要求定义本发明范围的基础上,在本发
明精神内的修饰对于本领域技术人员将是显而易见的。

通过MS使序列数据相关的计算机的方法和系统.pdf_第1页
第1页 / 共25页
通过MS使序列数据相关的计算机的方法和系统.pdf_第2页
第2页 / 共25页
通过MS使序列数据相关的计算机的方法和系统.pdf_第3页
第3页 / 共25页
点击查看更多>>
资源描述

《通过MS使序列数据相关的计算机的方法和系统.pdf》由会员分享,可在线阅读,更多相关《通过MS使序列数据相关的计算机的方法和系统.pdf(25页珍藏版)》请在专利查询网上搜索。

本发明提供一种使生物分子(例如DNA)特征(例如核苷酸类型)与具有与生物分子相关的独特分子量的分子标记相关的方法和系统。在一个实施方案中,标记分子应用于合成生物分子时所用的引物上。系统最初接收每个生物分子特征与相应分子标记分子量的对应关系。系统也接收在分析与分子标记结合的生物分子时测得的分子量信号。对于每个检测的分子量,系统根据接收的对应关系决定对应于所测分子量的特征。然后系统表明分析的生物分子具。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 化学;冶金 > 生物化学;啤酒;烈性酒;果汁酒;醋;微生物学;酶学;突变或遗传工程


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1