检测染色体非整倍性的试剂盒和装置.pdf

上传人:大师****2 文档编号:39312 上传时间:2018-01-17 格式:PDF 页数:22 大小:1.37MB
返回 下载 相关 举报
摘要
申请专利号:

CN201510228241.6

申请日:

2015.05.06

公开号:

CN104789466A

公开日:

2015.07.22

当前法律状态:

实审

有效性:

审中

法律详情:

实质审查的生效IPC(主分类):C12M 1/34申请日:20150506|||公开

IPC分类号:

C12M1/34

主分类号:

C12M1/34

申请人:

安诺优达基因科技(北京)有限公司

发明人:

陈重建; 梁峻彬; 玄兆伶; 李大为

地址:

100176北京市大兴区经济技术开发科创六街88号院B2栋

优先权:

专利代理机构:

北京康信知识产权代理有限责任公司11240

代理人:

赵囡囡; 吴贵明

PDF下载: PDF下载
内容摘要

本发明公开了检测染色体非整倍性的试剂盒和装置。该装置包括测序数据检测模块以得到所有染色体的测序数据;第一覆盖度计算模块以得到各染色体的矫正前覆盖度;ZCNV值计算模块:用于计算各窗口的单一序列数量的ZCNV值;拷贝数异常片段查询模块以在测序数据中查询300Kb以上且其80%以上窗口的ZCNV值都≧4或≦-4的片段;拷贝数异常片段确定模块以确定待测孕妇的拷贝数异常片段;α第一计算模块用于按式(1)计算参数α;α第二计算模块用于按式(2)计算参数α;矫正模块以对矫正前覆盖度矫正得到矫正后覆盖度;第二覆盖度计算模块以计算各染色体的Zaneu值;Zaneu值判断模块以判断Zaneu值是否≧3;染色体非整倍性确认模块以确定染色体具有非整倍性。该检测更准确。

权利要求书

1.  一种检测染色体非整倍性的装置,其特征在于,所述装置包括以下模块:
测序数据检测模块:用于对待测孕妇的外周血游离DNA进行高通量测序,以得到包含所有染色体的测序数据;
第一覆盖度计算模块:用于对所述测序数据中的所有染色体以切分成的窗口形式计算覆盖度,以得到各所述染色体的矫正前覆盖度;
ZCNV值计算模块:用于对所述待测孕妇在各所述窗口中的单一序列的数量的ZCNV值进行计算;
拷贝数异常片段查询模块:用于在所述测序数据中查询300Kb以上的片段,且在所述300Kb以上的片段中,80%以上的窗口中染色体片段的ZCNV值都大于等于4或小于等于-4的片段;
拷贝数异常片段确定模块:用于将从所述测序数据中查询得到的所述300Kb以上的片段且在80%以上的窗口中染色体片段的ZCNV值都大于等于4或小于等于-4的片段确定为待测孕妇的拷贝数异常片段;
α第一计算模块:用于在胎儿遗传了母体的拷贝数异常片段的情况下,按照如式(1)所示的计算公式计算参数α,其中,所述参数α是指孕妇的拷贝数异常片段对各所述染色体的矫正前覆盖度的影响;m表示所述拷贝数异常片段所在染色体的有效长度,单位为Mb;n表示所述孕妇在所述拷贝数异常片段的长度,单位为Mb;cn表示所述孕妇的所述拷贝数异常片段出现的次数;
α=(m-n)·2+n·cnm·2...(1)]]>
α第二计算模块:用于在胎儿未遗传母体的拷贝数异常的染色体的情况下,按照如式(2)所示的计算公式所述参数α,m表示所述拷贝数异常片段所在染色体的有效长度,单位为Mb;n表示所述孕妇在所述拷贝数异常片段的长度,单位为Mb;cn表示所述孕妇的所述拷贝数异常片段出现的次数;f表示所述待测孕妇的外周血游离DNA中所含的胎儿游离DNA的浓度且假定所述胎儿游离DNA的浓度f小于50%;
α=(m-n)·2+f·n·2+(1-f)·n·cnm·2...(2)]]>
矫正模块:用于利用对各所述染色体的矫正前覆盖度进行矫正,得到各所述染色体的矫正后覆盖度;其中,代表各所述染色体的矫正前覆盖度,x'代表各所述染色体的矫正后染色体覆盖度;
第二覆盖度计算模块:用于利用各所述染色体的矫正后覆盖度来计算各染色体的Zaneu值;
Z’值判断模块:用于判断所述Zaneu值是否大于等于3;
染色体非整倍性确认模块:用于在所述Zaneu值大于等于3的情况下,确定所述染色体具有非整倍性。

2.
  根据权利要求1所述的装置,其特征在于,所述第一覆盖度计算模块包括:
染色体窗口切分子模块:用于对所述测序数据中的所有染色体以切分成相等大小的窗口;
第一覆盖度计算子模块:用于以所述相等大小的窗口的形式计算覆盖度,以得到各所述染色体的校正前覆盖度。

3.
  根据权利要求2所述的装置,其特征在于,所述染色体窗口切分子模块中,每个所述窗口的大小为100Kb,且相邻两个所述窗口之间的重叠度为50%。

4.
  根据权利要求1所述的装置,其特征在于,所述ZCNV计算模块包括:
单一序列统计单元:用于根据所述测序数据中各序列的测序深度,统计各所述窗口的单一序列的数量;
单一序列的覆盖度计算单元:用于根据各所述染色体的GC含量和比对率对各所述单一序列的数量进行计算,得到各所述单一序列的数量的矫正前覆盖度;
单一序列ZCNV值计算单元:用于对各所述单一序列的数量的矫正前覆盖度进行标准化处理,得到各所述单一序列的数量的ZCNV值。

5.
  根据权利要求1所述的装置,其特征在于,在所述第二覆盖度计算模块中,所述Zaneu值按照来计算,其中,是根据LOESS算法,通过已知阴性样本群体得到的矫正前覆盖度值,s表示阴性样本群体里的标准差。

6.
  一种检测染色体非整倍性的试剂盒,其特征在于,所述试剂盒包括:
检测试剂和检测器械:用于对待测孕妇的外周血游离DNA进行高通量测序,以得到包含所有染色体的测序数据;
第一覆盖度计算器械:用于对所述测序数据中的所有染色体以切分成的窗口形式计算覆盖度,以得到各所述染色体的矫正前覆盖度;
ZCNV值计算器械:用于对所述待测孕妇在各所述窗口中的单一序列的数量进行Z检 验,得到ZCNV值;
拷贝数异常片段查询器械:用于在所述测序数据中查询300Kb以上的片段,且在所述300Kb以上的片段中,80%以上的窗口中染色体片段的ZCNV值都大于等于4或小于等于-4的片段;
拷贝数异常片段确认器械:用于根据所述ZCNV值大小得到所述待测孕妇的拷贝数异常片段;
α第一计算器械:用于在胎儿遗传了母体的拷贝数异常片段的情况下,按照如式(1)所示的计算公式计算参数α,所述参数α为孕妇的拷贝数异常片段对各所述染色体的矫正前覆盖度的影响,
α=(m-n)·2+n·cnm·2...(1)]]>
m表示所述拷贝数异常片段所在染色体的有效长度,单位为Mb;n表示所述孕妇在所述拷贝数异常片段的长度,单位为Mb;cn表示所述孕妇的所述拷贝数异常片段出现的次数;
α第二计算器械:用于在胎儿未遗传母体的拷贝数异常的染色体的情况下,按照如式(2)所示的计算公式所述参数α:
α=(m-n)·2+f·n·2+(1-f)·n·cnm·2...(2)]]>
m表示所述拷贝数异常片段所在染色体的有效长度,单位为Mb;n表示所述孕妇在所述拷贝数异常片段的长度,单位为Mb;cn表示所述孕妇的所述拷贝数异常片段出现的次数;f表示所述待测孕妇的外周血游离DNA中所含的胎儿游离DNA的浓度且假定所述胎儿游离DNA的浓度f小于50%;
矫正器械:用于利用对各所述染色体的矫正前覆盖度进行矫正,得到各所述染色体的矫正后覆盖度;其中,代表各所述染色体的矫正前覆盖度,x'代表各所述染色体的矫正后染色体覆盖度;
第二覆盖度计算器械:用于利用各所述染色体的矫正后覆盖度来计算各染色体的Zaneu值;
Z’值判断器械:用于判断所述Zaneu值是否大于等于3;
染色体非整倍性确认器械:用于在所述Zaneu值大于等于3的情况下,确定所述染色 体具有非整倍性。

7.
  根据权利要求6所述的试剂盒,其特征在于,所述第一覆盖度计算器械包括:
染色体窗口切分部件:用于对所述测序数据中的所有染色体以切分成相等大小的窗口;
第一覆盖度计算部件:用于以所述相等大小的窗口的形式计算覆盖度,以得到各所述染色体的校正前覆盖度。

8.
  根据权利要求7所述的试剂盒,其特征在于,所述染色体窗口切分部件中,每个所述窗口的大小为100Kb,且相邻两个所述窗口之间的重叠度为50%。

9.
  根据权利要求6所述的试剂盒,其特征在于,所述ZCNV值计算器械包括:
单一序列统计部件:用于根据所述测序数据中各序列的测序深度,统计各所述窗口的单一序列的数量;
单一序列的覆盖度计算部件:用于根据各所述染色体的GC含量和比对率对各所述单一序列的数量进行计算,得到各所述单一序列的数量的矫正前覆盖度;
单一序列ZCNV值计算部件:用于对各所述单一序列的数量的矫正前覆盖度进行标准化处理,得到各所述单一序列的数量的ZCNV值。

10.
  根据权利要求6所述的试剂盒,其特征在于,在所述第二覆盖度计算器械中,所述Zaneu按照来计算,其中,是根据LOESS算法,通过已知阴性样本群体得到的矫正前覆盖度值,s表示阴性样本群体里的标准差。

说明书

检测染色体非整倍性的试剂盒和装置
技术领域
本发明涉及生物医药领域,具体而言,涉及一种检测染色体非整倍性的试剂盒和装置。
背景技术
胎儿游离DNA(cff-DNA)自从1997被Lo发现至今已经有将近20个年头,正是这项发现为许多无创的产前检测方法(NIPT)提供了可能。无创的产前检测方法主要有以下两方面优势:第一方面:NIPT无需承担任何流产风险,而临床上通过羊水穿刺和脐穿等有创方式进行的染色体核型分析则会带来约1/200的流产风险,也有研究表明过早的脐穿还可能造成胎儿位置倾斜;另一方面:NIPT可以最早于孕周8周时进行检测,更早地给出风险判断,减少引产给孕妇带来的风险。
正是这些优势使得无创产前相关的研究方法日新月异,应用范围越来越广,现有的方法比如NIPT胎儿染色体非整倍性检测,NIPT胎儿单基因病检测,NIPT胎儿拷贝数异常片段(Copy Number Variation,CNV)检测,NIPT胎儿全基因组检测,NIPT胎儿亲子鉴定等等。
目前,在所有NIPT的应用中,应用最广泛也相对最成熟的当属胎儿染色体非整倍性检测。在对胎儿染色体非整倍性检测的众多算法中,Chui于2008年发明的基于高通量测序(MPS)的方法被认为临床使用中合适的,已经展现了它的稳健性。对于唐氏综合征,假阳性率(FPR)可以达到0.443%,假阴性率(FNR)低至0.004%;对于爱德华综合症,FPR则为0.22%,FNR为0.025%。
虽然上述方法已经达到一个极低的错误率,但仍存在判断错误的风险。因此,仍需要对现有的检测装置和检测试剂进行改进,以尽可能降低检测的错误率。
发明内容
本发明的主要目的在于提供一种检测染色体非整倍性的试剂盒和装置,以降低检测的假阳性率。
为了实现上述目的,根据本发明的一个方面,提供了一种检测染色体非整倍性的装置,该装置包括以下模块:测序数据检测模块:用于对待测孕妇的外周血游离DNA进行高通量测序,以得到包含所有染色体的测序数据;第一覆盖度计算模块:用于对测序数据中的所有染色体以切分成的窗口形式计算覆盖度,以得到各染色体的矫正前覆盖度;单一序列计算模块:用于对待测孕妇在各窗口中的单一序列的数量的ZCNV值进行计算;拷贝数异常片段查询模块:用于在测序数据中查询300Kb以上的片段,且在300Kb以上的片段中,80%以上的窗口中染色体片段的ZCNV值都大于等于4或小于等于-4的片段;拷贝数异常片段确定模块:用于将从测序数据中查询得到的300Kb以上的片段且在80%以上的窗口中染色体片段的ZCNV值都大于 等于4或小于等于-4的片段确定为待测孕妇的拷贝数异常片段;α第一计算模块:用于在胎儿遗传了母体的拷贝数异常片段的情况下,按照如式(1)所示的计算公式计算参数α,
α=(m-n)·2+n·cnm·2...(1)]]>
其中,参数α是指孕妇的拷贝数异常片段对各染色体的矫正前覆盖度的影响;m表示拷贝数异常片段所在染色体的有效长度,单位为Mb;n表示孕妇在拷贝数异常片段的长度,单位为Mb;cn表示孕妇的拷贝数异常片段出现的次数;
α第二计算模块:用于在胎儿未遗传母体的拷贝数异常的染色体的情况下,按照如式(2)所示的计算公式参数α,
α=(m-n)·2+f·n·2+(1-f)·n·cnm·2...(2)]]>
m表示拷贝数异常片段所在染色体的有效长度,单位为Mb;n表示孕妇在拷贝数异常片段的长度,单位为Mb;cn表示孕妇的拷贝数异常片段出现的次数;f表示待测孕妇的外周血游离DNA中所含的胎儿游离DNA的浓度且假定胎儿游离DNA的浓度f小于50%;
矫正模块:用于利用对各染色体的矫正前覆盖度进行矫正,得到各染色体的矫正后覆盖度;其中,代表各染色体的矫正前覆盖度,x'代表各染色体的矫正后染色体覆盖度;第二覆盖度计算模块:用于利用各染色体的矫正后覆盖度来计算各染色体的Zaneu值;Zaneu值判断模块:用于判断Zaneu值是否大于等于3;染色体非整倍性确认模块:用于在Zaneu值大于等于3的情况下,确定染色体具有非整倍性。
进一步地,第一覆盖度计算模块包括:染色体窗口切分子模块:用于对测序数据中的所有染色体以切分成相等大小的窗口;第一覆盖度计算子模块:用于以相等大小的窗口的形式计算覆盖度,以得到各染色体的校正前覆盖度。
进一步地,染色体窗口切分子模块中,每个窗口的大小为100Kb,且相邻两个窗口之间的重叠度为50%。
进一步地,单一序列计算模块包括:单一序列统计单元:用于根据测序数据中各序列的测序深度,统计各窗口的单一序列的数量;单一序列的覆盖度计算单元:用于根据各染色体的GC含量和比对率对各单一序列的数量进行计算,得到各单一序列的数量的矫正前覆盖度;单一序列ZCNV值计算单元:用于对各单一序列的数量的矫正前覆盖度进行标准化处理,得到各单一序列的数量的ZCNV值。
进一步地,在第二覆盖度计算模块中,Zaneu按照来计算,其中,是根据LOESS算法,通过已知阴性样本群体得到的矫正前覆盖度值,s表示阴性样本群体里的标准差。
根据本发明的另一方面,提供了一种检测染色体非整倍性的试剂盒,该试剂盒包括:检测试剂和检测器械:用于对待测孕妇的外周血游离DNA进行高通量测序,以得到包含所有染色体的测序数据;第一覆盖度计算器械:用于对测序数据中的所有染色体以切分成的窗口形式计算覆盖度,以得到各染色体的矫正前覆盖度;单一序列ZCNV值计算器械:用于对待测孕妇在各窗口中的单一序列的数量进行ZCNV检验,得到ZCNV值;拷贝数异常片段查询器械:用于在测序数据中查询300Kb以上的片段,且在300Kb以上的片段中,80%以上的窗口中染色体片段的ZCNV值都大于等于4或小于等于-4的片段;拷贝数异常片段确认器械:用于根据ZCNV值大小得到待测孕妇的拷贝数异常片段;α第一计算器械:用于在胎儿遗传了母体的拷贝数异常片段的情况下,按照如式(1)所示的计算公式计算参数α,参数α为孕妇的拷贝数异常片段对各染色体的矫正前覆盖度的影响,
α=(m-n)·2+n·cnm·2...(1)]]>
m表示拷贝数异常片段所在染色体的有效长度,单位为Mb;n表示孕妇在拷贝数异常片段的长度,单位为Mb;cn表示孕妇的拷贝数异常片段出现的次数;
α第二计算器械:用于在胎儿未遗传母体的拷贝数异常的染色体的情况下,按照如式(2)所示的计算公式参数α:
α=(m-n)·2+f·n·2+(1-f)·n·cnm·2...(2)]]>
m表示拷贝数异常片段所在染色体的有效长度,单位为Mb;n表示孕妇在拷贝数异常片段的长度,单位为Mb;cn表示孕妇的拷贝数异常片段出现的次数;f表示待测孕妇的外周血游离DNA中所含的胎儿游离DNA的浓度且假定胎儿游离DNA的浓度f小于50%;矫正器械:用于利用对各染色体的矫正前覆盖度进行矫正,得到各染色体的矫正后覆盖度;其中,代表各染色体的矫正前覆盖度,x'代表各染色体的矫正后染色体覆盖度;第二覆盖度计算器械:用于利用各染色体的矫正后覆盖度来计算各染色体的Zaneu值;Zaneu值判断器械:用于判断Zaneu值是否大于等于3;染色体非整倍性确认器械:用于在Zaneu值大于等于3的情况下,确定染色体具有非整倍性。
进一步地,第一覆盖度计算器械包括:染色体窗口切分部件:用于对测序数据中的所有染色体以切分成相等大小的窗口;第一覆盖度计算部件:用于以相等大小的窗口的形式计算覆盖度,以得到各染色体的校正前覆盖度。
进一步地,染色体窗口切分部件中,每个窗口的大小为100Kb,且相邻两个窗口之间的重叠度为50%。
进一步地,单一序列ZCNV值计算器械包括:单一序列统计部件:用于根据测序数据中各序列的测序深度,统计各窗口的单一序列的数量;单一序列的覆盖度计算部件:用于根据各染色体的GC含量和比对率对各单一序列的数量进行计算,得到各单一序列的数量的矫正前覆盖度;单一序列ZCNV值计算部件:用于对各单一序列的数量的矫正前覆盖度进行标准化处理,得到各单一序列的数量的ZCNV值。
进一步地,在第二覆盖度计算器械中,Zaneu按照来计算,其中,是根据LOESS算法,通过已知阴性样本群体得到的矫正前覆盖度值,s表示阴性样本群体里的标准差。
应用本发明的技术方案,通过增加了拷贝数异常片段查询模块、拷贝数异常片段确认模块和矫正模块,本发明通过筛选母本染色体上存在的至少为300kb的区域且该区域中80%的窗口ZCNV值大于等于4或小于等于4的片段,使得本发明的上述装置能够检出可信的孕妇拷贝数异常片段,并利用这些拷贝数异常片段对其所在的染色体的ZCNV值进行修正,进而可以避免因孕妇拷贝数异常片段的检测结果错误而造成假阴性的判断。通过矫正模块将该拷贝数异常片段对计算各染色体的覆盖度的影响进行矫正,从而使得本发明的染色体非整倍性确认模块对染色体的非整倍性的确认结果更准确。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本发明一种典型的实施方式中检测染色体非整倍性的装置的结构示意图;
图2A、图2B和图2C分别示出了根据本发明的实施例1对13号染色体、18号染色体和21号染色体的非整倍性检测的矫正结果示意图;
图3示出了根据本发明的实施例2对样本EK01875和BD01462在21号染色体上的非整倍性的矫正结果示意图;
图4示出了根据本发明的实施例3对样本EK01875的21号染色体的非整倍性检测的矫正结果示意图;以及
图5示出了根据本发明的实施例4对样本BD01462的21号染色体的非整倍性检测的矫正结果。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
在本发明中,ZCNV或Zaneu指统计学中的Z检验的计算值,是用于大样本(即样本容量大于30)平均值差异性检验的方法。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。
比对率是指窗口内的测序序列比对到基因组参考序列上的比率。由于测序序列可能同时比对到基因组参考序列上的多个位置,可能并不是唯一的序列,所以窗口内的比对率是大于单一序列的比对率。
需要说明的是,本发明的发明人通过对现有方法进行大量分析,发现至少存在以下三种导致NIPT判断错误的可能性:
首先,Lo在1998年发现cff-DNA是来源于胎盘的,这意味着如果胎盘出现嵌合(CPM)时,我们将难以通过NIPT的结果准确地估计胎儿情况,结果容易失准;其次,如果孕妇自身存在一定的CNV的话,基于MPS统计覆盖度并转化为Z值的方法将失准。因为当孕妇存在重复片段时,比对到染色体上的相对的单一序列数将变多,而覆盖度的升高则会使Z变大,从而增加假阳性的风险。反之,如果孕妇存在片段缺失时,Z值将降低,增加假阴性的风险。而且在之前的一些研究中也表明,胎盘出现嵌合(CPM)和孕妇拷贝数片段异常(CNV)是造成假阳性判断的重要原因。最后,在计算染色体覆盖度或是利用GC含量矫正覆盖度的过程中可能出现的数据波动情况,从而产生误差。
为此,在对上述判断错误原因进行综合分析的基础上,在本发明的一种典型的实施方式中,提出了一种检测染色体非整倍性的装置,如图1所示,该装置包括以下模块:测序数据检测模块:用于对待测孕妇的外周血游离DNA进行高通量测序,以得到包含所有染色体的测序数据;第一覆盖度计算模块:用于对测序数据中的所有染色体以切分成的窗口形式计算覆盖度,以得到各染色体的矫正前覆盖度;ZCNV值计算模块:用于对待测孕妇在各窗口中的单一序列的数量的ZCNV值进行计算;拷贝数异常片段查询模块:用于在测序数据中查询300Kb以上的片段,且在300Kb以上的片段中,80%以上的窗口中染色体片段的ZCNV值都大于等于4或小于等于-4的片段;拷贝数异常片段确定模块:用于将从测序数据中查询得到的300Kb以上的片段且在80%以上的窗口中染色体片段的ZCNV值都大于等于4或小于等于-4的片段确定为待测孕妇的拷贝数异常片段;α第一计算模块:用于在胎儿遗传了母体的拷贝数异常片段的情况下,按照如式(1)所示的计算公式计算参数α,
α=(m-n)·2+n·cnm·2...(1)]]>
其中,参数α是指孕妇的拷贝数异常片段对各染色体的矫正前覆盖度的影响;m表示拷贝数异常片段所在染色体的有效长度,单位为Mb;n表示孕妇在拷贝数异常片段的长度,单位为Mb;cn表示孕妇的拷贝数异常片段出现的次数;
α第二计算模块:用于在胎儿未遗传母体的拷贝数异常的染色体的情况下,按照如式(2)所示的计算公式参数α,
α=(m-n)·2+f·n·2+(1-f)·n·cnm·2...(2)]]>
m表示拷贝数异常片段所在染色体的有效长度,单位为Mb;n表示孕妇在拷贝数异常片段的长度,单位为Mb;cn表示孕妇的拷贝数异常片段出现的次数;f表示待测孕妇的外周血游离DNA中所含的胎儿游离DNA的浓度且假定胎儿游离DNA的浓度f小于50%;
矫正模块:用于利用对各染色体的矫正前覆盖度进行矫正,得到各染色体的矫正后覆盖度;其中,代表各染色体的矫正前覆盖度,x'代表各染色体的矫正后染色体覆盖度;第二覆盖度计算模块:用于利用各染色体的矫正后覆盖度来计算各染色体的Zaneu值;Zaneu值判断模块:用于判断Zaneu值是否大于等于3;染色体非整倍性确认模块:用于在Zaneu值大于等于3的情况下,确定染色体具有非整倍性。
本发明的上述装置,通过增加了拷贝数异常片段查询模块、拷贝数异常片段确认模块和矫正模块,本发明通过筛选母本染色体上存在的至少为300kb的区域且该区域中80%的窗口ZCNV值大于等于4或小于等于4的片段,使得本发明的上述装置能够检出可信的孕妇拷贝数异常片段,并利用这些拷贝数异常片段对其所在的染色体的Z值进行修正,进而可以避免因孕妇拷贝数异常片段的检测结果错误而造成假阴性的判断。通过矫正模块将该拷贝数异常片段对计算各染色体的覆盖度的影响进行矫正,从而使得本发明的染色体非整倍性确认模块对染色体的非整倍性的确认结果更准确。本发明的上述装置的矫正模块中,参数α的计算公式中的胎儿浓度为本领域常规的计算方法,具体如前述,此处不再赘述。
需要说明的是,本发明的上述模块作为装置的一部分可以运行在一个计算终端中,可以利用该计算机终端所提供的处理器来执行上述测序数据检测模块、第一覆盖度计算模块、单一序列计算模块、拷贝数异常片段查询模块、拷贝数异常片段确认模块、α第一计算模块、α第二计算模块、矫正模块、第二覆盖度计算模块、染色体非整倍性第一确定模块以及染色体非整倍性第二确定模块所实现的技术方案,显而易见的是该计算机终端是硬件实现的设备,处理器也是用于执行程序的硬件装置。而且本发明所提供的上述各个功能子模块可以在移动终端、计算机终端或者类似的运算装置中运行,也可以作为存储介质的一部分进行存储。
在本发明的上述装置中,上述第一覆盖度计算模块可以在本领常规的计算模块基础上,根据测序数据的不同经过适当调整得到。在本发明一种优选的实施例中,上述第一覆盖度计算模块包括:染色体窗口切分子模块:用于对测序数据中的所有染色体以切分成相等大小的窗口;第一覆盖度计算子模块:用于以相等大小的窗口的形式计算覆盖度,以得到各染色体的校正前覆盖度。通过本发明的包含染色体窗口切分子模块和第一覆盖度计算子模块的第一覆盖度计算模块以切分成相等大小的窗口形式进行计算,利于得到相对稳健的覆盖度。
在本发明一种更优选的实施例中,上述染色体窗口切分子模块中,每个窗口的大小为100Kb,且相邻两个窗口之间的重叠度为50%。将每个窗口分成100Kb的大小的形式进行计算的计算模块一方面利于得到相对稳健的覆盖度,另一方面增加窗口之间的覆盖度可以提升检测拷贝数异常片段的精准度,进而提升孕妇拷贝数异常片段的检出效率。
在本发明的上述装置中,单一序列计算模块可以利用在常规的计算模块得到。在本发明一种优选的实施例中,上述单一序列计算模块还包括:单一序列统计单元:用于根据测序数据中各序列的测序深度,统计各窗口的单一序列的数量;单一序列的覆盖度计算单元:用于根据各染色体的GC含量和比对率对各单一序列的数量进行矫正,得到各单一序列的数量的矫正值;单一序列ZCNV值计算单元:用于对各单一序列的数量的矫正值进行标准化处理,得到各单一序列的数量的ZCNV值。
本发明的上述单一序列计算模块,通过首先运行单一序列统计单元,根据测序数据中各序列的测序深度,统计各窗口的单一序列的数量,然后执行单一序列覆盖度计算单元,根据各染色体的GC含量和比对率对各单一序列的数量进行计算,得到各单一序列的数量的矫正前覆盖度,接着执行单一序列ZCNV值计算子单元,对各单一序列的数量的矫正前覆盖度进行标准化处理,得到各单一序列的数量的ZCNV值。上述单元是在本领域常规的计算单元的基础上进行的适当调整,是拷贝数异常片段查询模块进行查询和拷贝数异常片段确认模块进行确认的根据和前提,为准确确定待测样本中母本DNA拷贝数异常片段的存在提供依据。
在本发明的上述装置中,在第二覆盖度计算模块中,Zaneu按照来计算,其中,是根据LOESS算法,通过已知阴性样本群体得到的矫正前覆盖度值,s表示阴性样本群体里的标准差。通过上述公式计算得到的矫正后的Zaneu值能更准确地反映染色体的非整倍性,使得检测结果更准确。
在本发明又一种典型的实施方式中,还提供了一种检测染色体非整倍性的试剂盒,试剂盒包括:测序数据检测器械:用于对待测孕妇的外周血游离DNA进行高通量测序,以得到包含所有染色体的测序数据;第一覆盖度计算器械:用于对测序数据中的所有染色体以切分成的窗口形式计算覆盖度,以得到各染色体的矫正前覆盖度;单一序列计算器械:用于对待测孕妇在各窗口中的单一序列的数量的ZCNV值进行计算;拷贝数异常片段查询器械:用于在测序数据中查询300Kb以上的片段,且在300Kb以上的片段中,80%以上的窗口中染色体片段的ZCNV值都大于等于4或小于等于-4的片段;拷贝数异常片段确定器械:用于将从测序数据 中查询得到的300Kb以上的片段且在80%以上的窗口中染色体片段的ZCNV值都大于等于4或小于等于-4的片段确定为待测孕妇的拷贝数异常片段;α第一计算器械:用于在胎儿遗传了母体的拷贝数异常片段的情况下,按照如式(1)所示的计算公式计算参数α,
α=(m-n)·2+n·cnm·2...(1)]]>
其中,参数α是指孕妇的拷贝数异常片段对各染色体的矫正前覆盖度的影响;m表示拷贝数异常片段所在染色体的有效长度,单位为Mb;n表示孕妇在拷贝数异常片段的长度,单位为Mb;cn表示孕妇的拷贝数异常片段出现的次数;
α第二计算器械:用于在胎儿未遗传母体的拷贝数异常的染色体的情况下,按照如式(2)所示的计算公式参数α,
α=(m-n)·2+f·n·2+(1-f)·n·cnm·2...(2)]]>
m表示拷贝数异常片段所在染色体的有效长度,单位为Mb;n表示孕妇在拷贝数异常片段的长度,单位为Mb;cn表示孕妇的拷贝数异常片段出现的次数;f表示待测孕妇的外周血游离DNA中所含的胎儿游离DNA的浓度且假定胎儿游离DNA的浓度f小于50%;
矫正器械:用于利用对各染色体的矫正前覆盖度进行矫正,得到各染色体的矫正后覆盖度;其中,代表各染色体的矫正前覆盖度,x'代表各染色体的矫正后染色体覆盖度;第二覆盖度计算器械:用于利用各染色体的矫正后覆盖度来计算各染色体的Zaneu值;Zaneu值判断器械:用于判断Zaneu值是否大于等于3;染色体非整倍性第一确认器械:用于在Zaneu值大于等于3的情况下,确定染色体具有非整倍性。
本发明的上述试剂盒,通过增加了拷贝数异常片段查询器械、拷贝数异常片段确认器械和矫正器械,本发明通过筛选母本染色体上存在的至少为300kb的区域且该区域中80%的窗口ZCNV值大于等于4或小于等于4的片段,使得本发明的上述试剂盒能够检出可信的孕妇拷贝数异常片段,并利用这些拷贝数异常片段对其所在的染色体的Z值进行修正,进而可以避免因孕妇拷贝数异常片段的检测结果错误而造成假阴性的判断。通过矫正器械将该拷贝数异常片段对计算各染色体的覆盖度的影响进行矫正,从而使得本发明的染色体非整倍性确认器械对染色体的非整倍性的确认结果更准确。本发明的上述试剂盒的矫正器械中,参数α的计算公式中的胎儿浓度为本领域常规的计算方法,具体如前述,此处不再赘述。
需要说明的是,本发明的上述部件、元件作为器械的一部分可以运行在一个计算终端中,可以利用该计算机终端所提供的处理器来执行上述测序数据检测器械、第一覆盖度计算器械、单一序列计算器械、拷贝数异常片段查询器械、拷贝数异常片段确认器械、α第一计算器械、α第二计算器械、矫正器械、第二覆盖度计算器械、染色体非整倍性第一确定器械以及染色 体非整倍性第二确定器械所实现的技术方案,显而易见的是该计算机终端是硬件实现的设备,处理器也是用于执行程序的硬件试剂盒。而且本发明所提供的上述各个功能子器械可以在移动终端、计算机终端或者类似的运算试剂盒中运行,也可以作为存储介质的一部分进行存储。
在本发明的上述试剂盒中,上述第一覆盖度计算器械可以在本领域常规的计算器械基础上,根据测序数据的不同经过适当调整得到。在本发明一种优选的实施例中,上述第一覆盖度计算器械包括:染色体窗口切分子器械:用于对测序数据中的所有染色体以切分成相等大小的窗口;第一覆盖度计算子器械:用于以相等大小的窗口的形式计算覆盖度,以得到各染色体的校正前覆盖度。通过本发明的包含染色体窗口切分子器械和第一覆盖度计算子器械的第一覆盖度计算器械以切分成相等大小的窗口形式进行计算,利于得到相对稳健的覆盖度。
在本发明一种更优选的实施例中,上述染色体窗口切分子器械中,每个窗口的大小为100Kb,且相邻两个窗口之间的重叠度为50%。将每个窗口分成100Kb的大小的形式进行计算的计算器械一方面利于得到相对稳健的覆盖度,另一方面增加窗口之间的覆盖度可以提升检测拷贝数异常片段的精准度,进而提升孕妇拷贝数异常片段的检出效率。
在本发明的上述试剂盒中,单一序列计算器械可以利用在常规的计算器械得到。在本发明一种优选的实施例中,上述单一序列计算器械还包括:单一序列统计单元:用于根据测序数据中各序列的测序深度,统计各窗口的单一序列的数量;单一序列的覆盖度计算单元:用于根据各染色体的GC含量和比对率对各单一序列的数量进行计算,得到各单一序列的数量的矫正前覆盖度;单一序列ZCNV值计算单元:用于对各单一序列的数量的矫正前覆盖度进行标准化处理,得到各单一序列的数量的ZCNV值。
本发明的上述单一序列计算器械,通过首先运行单一序列统计单元,根据测序数据中各序列的测序深度,统计各窗口的单一序列的数量,然后执行单一序列覆盖度计算单元,根据各染色体的GC含量和比对率对各单一序列的数量进行矫正,得到各单一序列的数量的矫正值,接着执行单一序列ZCNV值计算子单元,对各单一序列的数量的矫正值进行标准化处理,得到各单一序列的数量的ZCNV值。上述单元是在本领域常规的计算和矫正单元的基础上进行的适当调整,是拷贝数异常片段查询器械进行查询和拷贝数异常片段确认器械进行确认的根据和前提,为准确确定待测样本中母本DNA拷贝数异常片段的存在提供依据。
在本发明的上述试剂盒中,在第二覆盖度计算器械中,Zaneu按照来计算,其中,是根据LOESS算法,通过已知阴性样本群体得到的矫正前覆盖度值,s表示阴性样本群体里的标准差。通过上述公式计算得到的矫正后的Zaneu值能更准确地反映染色体的非整倍性,使得检测结果更准确。
下面将结合具体的实施例进一步说明本发明的有益效果。
实施例1
为了测试本发明的孕妇拷贝数异常片段矫正对染色体非整倍性检测的矫正效果,本实施例基于泊松分布生成了一组孕妇的模拟数据,在该模拟数据中,分别单独地对13、18和21号染色体加入了定量的拷贝数异常片段,拷贝数异常片段的大小从0.5Mb到5Mb,步长为0.25Mb。然后,在含有拷贝数异常片段的模拟数据中分别混入了3种不同浓度正常人DNA(5%,10%,15%)。整个过程是用来模拟在不同胎儿浓度下,不同拷贝数异常片段大小对13、18和21号染色体覆盖度的影响,并据此测试孕妇拷贝数异常片段对染色体非整倍性检测的矫正效果。所有的计算都是在胎儿没有遗传孕妇拷贝数异常片段的假设下进行的。
测试结果见附图2A、2B和2C,在上述三个图中,横坐标代表该样本所存在的孕妇拷贝数异常片段大小,纵坐标代表这个样本的染色体Z值。图中的实线表示的是修正之前的染色体Z值,虚线则表示经过孕妇拷贝数异常片段矫正后的染色体覆盖度计算出来的ZCNV值,即Zaneu值。方形、圆形和三角形则分别表示该样本的胎儿浓度为5%,10%和15%。
从附图2A、2B和2C中可以很明显地看出,当直接用染色体覆盖度去计算Z值的时候,随着孕妇拷贝数异常片段的增大,样本的Z值也越大。以21号染色体为例,在10%胎儿浓度下,如果此时孕妇存在3Mb的21号染色体上的重复,那么即使胎儿不是21三体综合症患儿,用之前的覆盖度计算出的Z值也会大于3,会被判断为阳性。而图中的虚线,即经过本发明的方法矫正后的覆盖度计算出的染色体Z值,即Zaneu值,均稳定于0基线附近,这表明,在各种情况下,本发明的通过利用孕妇拷贝数异常的片段进行矫正的染色体非整倍性的检测装置是极为有效的。
为了进一步验证根据本发明所提供的检测装置和试剂盒在检测实际病例样本中检测染色体非整倍性的效果,还利用了本发明的检测装置和试剂盒分别检测了以下病例样本,具体见实施例2和实施例3。
实施例2
利用本发明的检测染色体非整倍性的装置,对6615例待测孕妇中胎儿的非整倍性进行检测,该装置包括:
测序数据检测模块:用于对6615例待测孕妇的外周血游离DNA分别进行高通量测序,以得到包含各待测孕妇的所有染色体的测序数据;
第一覆盖度计算模块:用于对各待测孕妇的测序数据中的所有染色体以切分成的窗口形式计算覆盖度,以得到各待测孕妇的各染色体的矫正前覆盖度;
ZCNV值计算模块:用于对各待测孕妇在各窗口中的单一序列的数量的ZCNV值进行计算;
拷贝数异常片段查询模块:用于在各待测孕妇的测序数据中查询300Kb以上的片段,且在300Kb以上的片段中,80%以上的窗口中染色体片段的ZCNV值都大于等于4或小于等于-4的片段;
拷贝数异常片段确定模块:用于将从各待测孕妇的测序数据中查询得到的300Kb以上的片段且在80%以上的窗口中染色体片段的ZCNV值都大于等于4或小于等于-4的片段确定为待测孕妇的拷贝数异常片段;
α第一计算模块:用于在胎儿遗传了母体的拷贝数异常片段的情况下,按照如式(1)所示的计算公式计算参数α,
α第二计算模块:用于在胎儿未遗传母体的拷贝数异常的染色体的情况下,按照如式(2)所示的计算公式参数α,
矫正模块:用于利用对各待测孕妇的各染色体的矫正前覆盖度进行矫正,得到各待测孕妇的各染色体的矫正后覆盖度;
第二覆盖度计算模块:用于利用各待测孕妇的各染色体的矫正后覆盖度来计算其各染色体的Zaneu值;
Zaneu值判断模块:用于判断各待测孕妇的的各染色体的Zaneu值是否大于等于3;
染色体非整倍性确认模块:用于在Zaneu值大于等于3的情况下,确定染色体具有非整倍性。
通过本发明的上述检测装置发现样本EK01875和BD01462在21号染色体上存在孕妇拷贝数异常片段,并将这两个样本从之前的阳性结果矫正为阴性结果,具体结果见图3。
图3中的左图(参见彩图)为现有的检测方法检测得到的所有样本的21号染色体Z值统计图,可见阴性样本的Z值几乎均小于3,近正态分布。图中的圆形为样本EK01875,Z值为4.66。三角形为样本BD01462,Z值为3.87。
图3中的右图为本发明的检测方法检测得到的21号染色体ZCNV值统计图,此时样本EK01875的Z值修正为2.36,样本BD01462的Z值修正为1.83。
实施例3
利用本发明的检测染色体非整倍性的装置进行上述样本(样本EK01875,孕妇年龄29岁,孕周约18w)的检测,该装置包括:
测序数据检测模块:用于对待测孕妇的外周血游离DNA进行高通量测序,以得到包含所有染色体的测序数据;
第一覆盖度计算模块:用于对测序数据中的所有染色体以切分成的窗口形式计算覆盖度,以得到各染色体的矫正前覆盖度;
ZCNV值计算模块:用于对待测孕妇在各窗口中的单一序列的数量的ZCNV值进行计算;
拷贝数异常片段查询模块:用于在测序数据中查询300Kb以上的片段,且在300Kb以上的片段中,80%以上的窗口中染色体片段的ZCNV值都大于等于4或小于等于-4的片段;
拷贝数异常片段确定模块:用于将从测序数据中查询得到的300Kb以上的片段且在80%以上的窗口中染色体片段的ZCNV值都大于等于4或小于等于-4的片段确定为待测孕妇的拷贝数异常片段;
α第一计算模块:用于在胎儿遗传了母体的拷贝数异常片段的情况下,按照如式(1)所示的计算公式计算参数α,
α第二计算模块:用于在胎儿未遗传母体的拷贝数异常的染色体的情况下,按照如式(2)所示的计算公式参数α,
矫正模块:用于利用对各染色体的矫正前覆盖度进行矫正,得到各染色体的矫正后覆盖度;
第二覆盖度计算模块:用于利用各染色体的矫正后覆盖度来计算各染色体的Zaneu值;
Zaneu值判断模块:用于判断Zaneu值是否大于等于3;
染色体非整倍性确认模块:用于在Zaneu值大于等于3的情况下,确定染色体具有非整倍性。
利用本发明的上述检测染色体非整倍性的装置进行分析后,检测出孕妇在21号染色体上存在850kb的重复。如图4所示,拷贝数存在重复的区域分别为500kb的21q22.11(32361194bp~32861193bp)和350kb的21q22.12(37261194bp~37611193bp),拷贝数均为3。
之后,用现有技术中的Affymetrix CytoScan 750k SNP芯片对该孕妇染色体拷贝异常片段的结果进行验证,同样的,检出在21q22.11(32399114bp~32811202bp)区域和21q22.12(37292432bp~37602701bp),拷贝数为3。
可见,芯片检测结果的位置与本发明的装置检测出来的位置几乎百分百匹配。根据本发明的装置中,孕妇拷贝数异常片段对该染色体覆盖度计算的影响参数α值为1.012,将表征染色体是否为非整倍性的Z值从原先的4.66修正为2.36,判断结果因此改为阴性。
实施例4
利用本发明的检测染色体非整倍性的试剂盒进行上述样本(样本BD01462,孕妇年龄24岁,孕周约24w)的检测,该试剂盒包括:
测序数据检测试剂和器械:用于对待测孕妇的外周血游离DNA进行高通量测序,以得到包含所有染色体的测序数据;
第一覆盖度计算器械:用于对测序数据中的所有染色体以切分成的窗口形式计算覆盖度,以得到各染色体的矫正前覆盖度;
ZCNV值计算器械:用于对待测孕妇在各窗口中的单一序列的数量的ZCNV值进行计算;
拷贝数异常片段查询器械:用于在测序数据中查询300Kb以上的片段,且在300Kb以上的片段中,80%以上的窗口中染色体片段的ZCNV值都大于等于4或小于等于-4的片段;
拷贝数异常片段确定器械:用于将从测序数据中查询得到的300Kb以上的片段且在80%以上的窗口中染色体片段的ZCNV值都大于等于4或小于等于-4的片段确定为待测孕妇的拷贝数异常片段;
α第一计算器械:用于在胎儿遗传了母体的拷贝数异常片段的情况下,按照如式(1)所示的计算公式计算参数α,
α第二计算器械:用于在胎儿未遗传母体的拷贝数异常的染色体的情况下,按照如式(2)所示的计算公式参数α,
矫正器械:用于利用对各染色体的矫正前覆盖度进行矫正,得到各染色体的矫正后覆盖度;
第二覆盖度计算器械:用于利用各染色体的矫正后覆盖度来计算各染色体的Zaneu值;
Zaneu值判断器械:用于判断Zaneu值是否大于等于3;
染色体非整倍性确认器械:用于在Zaneu值大于等于3的情况下,确定染色体具有非整倍性。
通过利用本发明的上述检测试剂盒进行检测分析后,如图5所示,检测出孕妇在21号染色体上总共存在700kb的重复,区域为21q23.1(28911194bp~29611930),拷贝数为3。
同样的,利用Affymetrix CytoScan 750k SNP芯片验证结果显示,发现在21q21.3(28973792bp~29542400)出现重复。
尽管检测到的拷贝数为4,与本发明的检测结果稍有不同,该结果的位置与利用本发明的试剂盒检测出来的位置几乎百分百匹配,同样表明本发明的检测方法的精准性。根据本发明的试剂盒中孕妇拷贝数异常片段对该染色体覆盖度计算的影响参数α的值为1.009,将表征染色体是否为非整倍性的Z值从原先的3.87修正为1.83,判断结果因此改为阴性。
从以上的描述中可以看出,本发明上述的实施例实现了如下技术效果:本发明的检测装置和检测试剂盒,在考虑孕妇本身的拷贝数异常片段对计算染色体非整倍性的影响时,摒弃现有技术中通过将测序数据中母本有拷贝数异常的片段直接去除不予考虑的思想,创造性地从母本染色体上存在的特定大小的拷贝数异常片段对计算染色体非整倍性的影响用参数α来体现,并通过该参数α来对各染色体的覆盖度进行矫正,进而将该拷贝数异常片段对染色体 非整倍性的判断的影响降低,而不是无视该拷贝数异常片段的存在,从而使得本发明所检测得到的染色体非整倍性的结果更准确。
本发明的装置或试剂盒检测胎儿染色体非整倍性,几乎不受孕妇拷贝数异常片段的影响,提高了检测的精准度,适合大规模使用。
显然,本领域的技术人员应该明白,上述的本发明的一些模块、元件或一些步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

检测染色体非整倍性的试剂盒和装置.pdf_第1页
第1页 / 共22页
检测染色体非整倍性的试剂盒和装置.pdf_第2页
第2页 / 共22页
检测染色体非整倍性的试剂盒和装置.pdf_第3页
第3页 / 共22页
点击查看更多>>
资源描述

《检测染色体非整倍性的试剂盒和装置.pdf》由会员分享,可在线阅读,更多相关《检测染色体非整倍性的试剂盒和装置.pdf(22页珍藏版)》请在专利查询网上搜索。

本发明公开了检测染色体非整倍性的试剂盒和装置。该装置包括测序数据检测模块以得到所有染色体的测序数据;第一覆盖度计算模块以得到各染色体的矫正前覆盖度;ZCNV值计算模块:用于计算各窗口的单一序列数量的ZCNV值;拷贝数异常片段查询模块以在测序数据中查询300Kb以上且其80以上窗口的ZCNV值都4或-4的片段;拷贝数异常片段确定模块以确定待测孕妇的拷贝数异常片段;第一计算模块用于按式(1)计算参数;。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 化学;冶金 > 生物化学;啤酒;烈性酒;果汁酒;醋;微生物学;酶学;突变或遗传工程


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1