核酸碱基序列的测定方法.pdf

上传人:54 文档编号:1461440 上传时间:2018-06-17 格式:PDF 页数:8 大小:247.38KB
返回 下载 相关 举报
摘要
申请专利号:

CN01140309.8

申请日:

2001.12.05

公开号:

CN1363688A

公开日:

2002.08.14

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||公开|||实质审查的生效

IPC分类号:

C12Q1/68; G01N27/26

主分类号:

C12Q1/68; G01N27/26

申请人:

株式会社岛津制作所;

发明人:

狭间一

地址:

日本国京都府

优先权:

2001.01.05 JP 2001-000499

专利代理机构:

中科专利商标代理有限责任公司

代理人:

李悦

PDF下载: PDF下载
内容摘要

用已设好的峰间距参数,对位于已检测数据前部的N个点的数据通过傅立叶变换进行波形定型(S1,S2),对位于N个点数据前部的M个点(M

权利要求书

1.一种测定核酸碱基序列的方法,即对核酸片段样品进行电泳并基
于检测的数据进行碱基序列测定,包括下列步骤:
(A)用已设定的峰间距参数,从检测数据前部开始,对一定数目的
N个点的数据通过傅立叶变换进行波形定型;
(B)对位于N个点数据前部的P个点(P<N)数据的进行碱基序列
测定;
(C)从测序结果获得峰间距;
(D)用已获得的峰间距作为参数,以已测序的最后一个数据向前L
个点(L<M)的位置为起点,对其后N个点的数据通过傅立叶变换进
行波形定型;然后
(E)对于经历第二次或更后的波形定型的N个点数据,对位于其中
部M个点(M<N)的数据的碱基序列进行测定,这些数据与前一个步
骤中的测序数据相衔接,
其中步骤(E)→(C)→(D)重复进行直到数据消失或尽管存在数
据,但不需要进行分析为止。
2.按照权利要求1所述的测定核酸碱基序列的方法,其中FFT处理
是通过傅立叶变换来进行波形定型的。
3.按照权利要求2所述的测定核酸碱基序列的方法,假设N等于2n,
M等于2(n-1)以及L等于2(n-2)。

说明书

核酸碱基序列的测定方法

发明背景

发明领域

本发明涉及核酸,例如DNA(脱氧核糖核酸)的序列测定方法,更
具体地说,本发明所叙述的核酸序列测定方法在预处理上有独到之处,
该预处理在使用电泳获得的数据测定碱基序列之前用来去除噪音。

现有技术的描述

在对核酸片段样品进行电泳并以检测到的数据为基础测定核酸碱基序
列的方法中,电泳检测到的数据是与核酸片段样品相对应的峰信号。因
为峰信号包括噪音部分,因此波形定型是通过峰信号的预处理来完成的,
随后以该峰信号为基础来测定碱基序列。

对于通过电泳获得的全部检测数据一般都集中执行预处理,随后用处
理过的波形来进行序列测定(base calling)。

对波形定型的预处理包括通过以FFT(快速傅立叶变换)为代表的傅
立叶变换进行的波形定型。在此预处理中,当对电泳检测到的峰信号的
数据进行傅立叶变换时,执行过滤操作,随后通过反向傅立叶变换将数
据返给峰信号。在此过滤过程中所运用的过滤函数适于除去那些出现频
率短于DNA峰出现间隔的信号,主要为了除去高频组分的噪音。

①虽然FFT必须应用于2n个数目的数据,但数据的数目并不是恒定
的,随迁移时间或取样频率而改变。

②设置这个除去噪音的过滤函数主要是为了除去具有高频组分的噪
音,例如,那些出现频率短于DNA峰出现间隔的信号。因此,迁移速
率可作为过滤函数的一个重要参数。但是,迁移速率在迁移过程中是逐
渐改变的,因此在全部数据范围中噪音的过滤不能使用同一个参数完成。

发明概述

因此,本发明的目的在于获得一个基于傅立叶变换,从一个较长的、
迁移速率是变化的数据范围内除去噪音从而能够精确测序的方法。

与本发明相对应的测序方法参照图1描述如下。

本发明涉及核酸的序列测定,即对核酸片段样品进行电泳并基于检测
的数据测定碱基序列,包括以下步骤:

(A)步骤(S1,S2)是指利用已设定的峰间距参数,对可检测数据前
部特定的N个点的数据通过傅立叶变换来进行波形定型。

(B)步骤(S3)是指对位于此N个点数据前部的P个点(P<N)的
数据进行碱基序列测定。

(C)步骤(S4)是指从测序结果获得峰间距。

(D)步骤(S5,S6)是指以已测序的最后一个数据向前L(L<M)
个点的位置为起点,用已获得的峰间距参数对从该起点往后的N个点数
据通过傅立叶变换来进行波形定型。然后,

(E)步骤(S7)是指对于经历第二次或更后的波形定型的N个点数
据,取位于其中部M个点(M<N)的数据进行碱基序列测定,这些数
据与前一个步骤中的测序数据相衔接。

步骤(E)→(C)→(D)重复进行,直到数据消失,或者尽管由于
信号的衰减或数据的异常而有数据存在,但已不需要进行分析。

术语“点”代表在电泳的检测位置根据设置的时间间隔进行扫描所俘
获的数据,而点的数目与迁移时间相对应。

N个点宽度的傅立叶变换以及包括在此N个点内部的宽度为P或M
个点的序列测定,是应用峰间距(迁移速率)作为参数的完全独立的过
程,并不依赖于全部数据的数目。

在进行宽度为N个点的傅立叶变换之前所获得的峰间距(迁移速率)
是非常有用途的,可以为过滤函数和测序反应提供合适的参数,从而提
高测序的精度。

根据本发明,通过已获得的峰间距参数对特定点的检测数据应用傅立
叶变换进行波形定型,从而在已进行波形定型的数据的基础上测定碱基
序列,由于与先前进行的波形定型在范围上有部分重叠,从而改进了处
理过程。一般来说,测序后被分析的(定型的)波形对测序也是必要的。
而在本发明中基本上假定被分析的波形是不连续的,局部的点以重叠的
方式有规律地进行傅立叶变换,从而可简单地通过连接已测序的部分,
方便地获得被分析的波形。

当对全部数据均进行傅立叶变换时,由于气泡或污染的影响而出现的
不连续部分的数据,可能会对正常部分的数据造成不良影响。但根据本
发明,在到达不连续部分前不会造成影响。

另外,傅立叶变换的宽度和测序的宽度是固定的,互相独立的,但当
增加新的规则或处理时,可达到高的灵活性。

通过下面有关本发明的具体描述,结合附图图例,本发明前述的以及
其它的目标,特征,状况,优点将更加明显。

附图的简要描述

图1所示的是本发明的流程图。

图2所示的是本发明的一个实施例的处理过程。然后

图3所示的是实施例的处理过程以及电泳所显示的波形图表。

优选实施例的描述

通过傅立叶变换,FFT处理被用来进行波形定型。在此情况下,FFT
处理的宽度(数据数目)固定在2n个点上,用来对经过处理的、位于其
中央的2(n-1)个点进行测序,从测序结果获得峰间距(迁移速率),从后
半部分的2(n-1)个点的位置起始,再次在宽度为2n个点上进行FFT处理。
重复处理直到最后的数据。

参照图2和图3,本发明的一个实施例描述如下。

根据本实施例,FFT处理应用在N=2(n=8)=256个点上。

①获得峰间距的初值,该初值是预先设定的。

②从前部对N=256个点进行FFT处理。FFT处理是通过以下程序进
行的:傅立叶变换用步骤①中的峰间距参数进行过滤反向傅立叶变
换。

③用步骤①中的峰间距参数从前部对P=192个点进行测序。

④从测序结果获得峰间距。

⑤以已测序范围末端向前L(=2(n-2))=64个点的位置为起点,对
其后的N=256个点进行FFT处理。如果此时在该点处无法获得256个
点的数据,则停止处理。FFT处理是通过以下程序进行的:傅立叶变换
用步骤④中的峰间距参数进行过滤反向傅立叶变换。

⑥使用步骤④中的峰间距参数,从前部第L=64位的点起始,对向
后的M(=2(n-1))=128个点进行测序。

⑦返回步骤④。

在本实施例中,虽然由于FFT处理而使傅立叶变换的宽度(数据数
目)固定在2n个点上,但傅立叶变换的宽度N,测序的宽度P,M及返回
以进行下一次傅立叶变换的宽度L是不受数值2x所限的,可以选择那些
满足关系N>M>L和N>P>L的整数。

虽然已经详细地描述和图示了本发明,但应清楚理解:这仅仅是作为
图示和范例,而不是作为限制因素,本发明限定的要旨与范围仅如所附
的要求所述。

核酸碱基序列的测定方法.pdf_第1页
第1页 / 共8页
核酸碱基序列的测定方法.pdf_第2页
第2页 / 共8页
核酸碱基序列的测定方法.pdf_第3页
第3页 / 共8页
点击查看更多>>
资源描述

《核酸碱基序列的测定方法.pdf》由会员分享,可在线阅读,更多相关《核酸碱基序列的测定方法.pdf(8页珍藏版)》请在专利查询网上搜索。

用已设好的峰间距参数,对位于已检测数据前部的N个点的数据通过傅立叶变换进行波形定型(S1,S2),对位于N个点数据前部的M个点(MN)的数据进行碱基序列测定(S3),从测序结果获得峰间距(S4)。用已获得的峰间距作为参数,以已测序的M个点中最后一个数据向前L个点(LM)的位置为起点,对其后N个点的数据通过傅立叶变换进行波形定型,此后,序列测定,峰间距的计算和波形定型是同样重复进行的。这样,从一个迁。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 化学;冶金 > 生物化学;啤酒;烈性酒;果汁酒;醋;微生物学;酶学;突变或遗传工程


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1