《检测血液中微生物的方法及装置.pdf》由会员分享,可在线阅读,更多相关《检测血液中微生物的方法及装置.pdf(16页珍藏版)》请在专利查询网上搜索。
1、(10)申请公布号 (43)申请公布日 (21)申请号 201410515877.4 (22)申请日 2014.09.29 C12Q 1/70(2006.01) C12Q 1/68(2006.01) C12Q 1/04(2006.01) C12M 1/00(2006.01) (71)申请人 天津华大基因科技有限公司 地址 300308 天津市滨海新区空港经济区环 河北路 80 号空港商务园东区 3 号楼 101、 201 室 申请人 深圳华大基因医学有限公司 (72)发明人 栗东芳 宫艳萍 张印新 路惠萍 韩秋莲 (74)专利代理机构 北京清亦华知识产权代理事 务所 ( 普通合伙 ) 1120。
2、1 代理人 李志东 (54) 发明名称 检测血液中微生物的方法及装置 (57) 摘要 本发明提供了一种检测血浆中微生物的方 法、 一种检测宿主感染的病原体的方法及其装 置。检测血浆中的微生物, 包括 : 提取宿主血浆样 本核酸, 对提取的核酸的至少一部分进行序列测 定, 获得测序数据 ; 去除测序数据中的宿主测序 数据 ; 将余下的测序数据比对到微生物参考数据 库, 获得比对结果, 所说的微生物参考数据库包括 多种细菌的参考序列和多种病毒的参考序列 ; 依 据比对结果, 确定血浆中微生物包含的物种及各 物种的丰度。本发明的方法或装置能够对血浆中 的微生物进行快速检测, 可用于辅助临床诊断。 (。
3、51)Int.Cl. (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书2页 说明书11页 附图2页 CN 105525033 A 2016.04.27 CN 105525033 A 1/2 页 2 1. 检测血液中微生物的方法, 所述微生物包括细菌、 真菌和病毒, 所述方法包括 : (1) 提取血液样本核酸, 对所述核酸的至少一部分进行序列测定, 获得测序数据 ; (2) 去除 (1) 中的测序数据中的宿主测序数据 ; (3) 将 (2) 中余下的测序数据比对到微生物参考数据库, 获得比对结果, 所述微生物参 考数据库包含多种细菌的参考序列和多种病毒的参考序列 ; (4)。
4、 依据 (3) 的比对结果, 确定所述微生物包含的物种以及各物种的丰度。 2. 权利要求 1 的方法, 其特征在于, 所述核酸为 DNA。 3. 权利要求 1 的方法, 其特征在于, (2) 包括将 (1) 的测序数据比对到宿主参考序列, 将比对上所述宿主参考序列的测序数据去除。 4.权利要求1的方法, 其特征在于, (3)中的病毒参考序列包括所述病毒的所有亚型的 参考基因组。 5. 权利要求 4 的方法, 其特征在于, 所述病毒的参考基因组大于 600bp。 6. 权利要求 1 的方法, 其特征在于, 确定 (4) 中物种丰度是通过以下进行的 : 公式 I : 丰度, 其中, i 表示物种 。
5、; 和 / 或, 公式 II : , 其中, , j 表示物种。 7. 确定宿主感染病原体的方法, 所述宿主不包括人, 所述病原体包括使宿主致病的细 菌、 和 / 或致病病毒、 和 / 或致病真菌, 所述方法包括 : (1) 提取宿主血液样本核酸, 对所述核酸的至少一部分进行序列测定, 获得测序数据 ; (2) 去除 (1) 中的测序数据中的宿主测序数据 ; (3) 将 (2) 中余下的测序数据比对到病原体参考数据库, 获得比对结果, 所述病原体参 考数据库包含多种致病细菌菌株的参考序列和多种致病病毒的参考序列 ; (4) 依据 (3) 的比对结果, 确定所述样本包含的致病物种及各致病物种的丰。
6、度 ; (5) 将 (4) 中致病物种的丰度与所述致病物种的不致病丰度进行比较, 两者有显著性 差异则确定宿主感染所述致病物种 ; 任选的, 所述核酸为 DNA ; 任选的, (2) 包括将 (1) 的测序数据比对到宿主参考序列, 将比对上所述宿主参考序列 的测序数据去除 ; 任选的, (3) 中的病原体参考数据库包含所有已知的致病细菌和致病病毒的参考序列 信息 ; 任选的, (3) 中的病原体参考数据库中的每个参考序列均大于 600bp。 8. 权利要求 7 的方法, 其特征在于, 所述病原体致使宿主不明原因发热。 9. 权利要求 7 的方法, 其特征在于, 确定 (4) 中致病物种丰度是通。
7、过以下进行的 : 公式 I : 丰度, 其中, i 表示物种 ; 和 / 或, 公式 II : , 其中, , j 表示物种。 10. 权利要求 9 的方法, 其特征在于, (5) 中的致病物种的不致病丰度的确定, 包括 : 预先或同时对多个正常宿主的血液样本进行 (1)-(4), 获得多个正常宿主样本包含的 多个致病物种的丰度, 获得每个致病物种的多个丰度 I 值和多个丰度 II 值 ; 针对一个致病物种, 集合来自所述多个正常宿主样本的多个丰度 I 值, 设定置信度, 获 得所述致病物种的不致病丰度 I 值范围, 以及, 集合来自所述多个正常宿主样本的多个丰 权 利 要 求 书 CN 10。
8、5525033 A 2 2/2 页 3 度 II 值, 获得所述致病物种的不致病丰度 II 值 ; 所述丰度 I 值是根据所述公式 I 计算获得 的, 所述丰度 II 值是根据所述公式 II 获得的。 11. 权利要求 10 的方法, 其特征在于, 所述置信度为 95、 99或者 99.9。 12. 权利要求 10 的方法, 其特征在于, (5) 包括 : 将 (4) 中致病物种的丰度 I 值和丰度 II 值分别与该致病物种的不致病丰度 I 值范围 和不致病丰度 II 值比较, 当该致病物种的丰度 I 值不在该致病物种的不致病丰度 I 值范围 内, 并且, 该致病物种的丰度 II 值大于该致病。
9、物种的不致病丰度 II 值时, 表明所述致病物种的丰度与其不致病丰度差异显著, 确定所述宿主感染所述致病物 种。 13. 确定宿主感染病原体的装置, 所述宿主包括人, 所述病原体包括致病细菌和 / 或致 病病毒, 和 / 或致病真菌, 所述装置包括 : A. 核酸提取单元, 用于提取宿主血液样本核酸, 对所述核酸的至少一部分进行序列测 定, 获得测序数据 ; B. 数据去除单元, 连接 A 单元, 用于接收 A 中的测序数据, 去除所述测序数据中的宿主 测序数据 ; C.比对单元, 连接B单元或者连接A和B单元, 用于将B中余下的测序数据比对到病原 体参考数据库, 获得比对结果, 所述病原体参。
10、考数据库包含多种致病细菌的参考序列和多 种致病病毒的参考序列 ; D. 丰度计算单元, 与 C 单元连接, 用于接收 C 中的比对结果, 确定所述样本中包含的致 病物种及各致病物种的丰度 ; E. 判定单元, 与 D 单元连接, 用于接收 D 中的各个致病物种的丰度, 将每个致病物种的 丰度分别与该致病物种的不致病丰度进行比较, 二者有显著性差异则确定宿主感染所述致 病物种。 权 利 要 求 书 CN 105525033 A 3 1/11 页 4 检测血液中微生物的方法及装置 技术领域 0001 本发明涉及微生物检测, 特别是血液中的微生物的检测方法、 宿主感染病原体的 检测方法及其装置。 背。
11、景技术 0002 基于宿主与微生物的关系, 宿主中的微生物可分为多种, 包括正常菌群、 与宿主共 生的包括寄生的微生物、 引起机体感染致病的微生物病原体等。宿主的血浆含有游离 DNA, 包括来源于宿主的和来源于微生物的游离 DNA 片段。 0003 不明原因发热 (fever of undetermined origin,fever of unknown origin,FUO), 是指反复发热超过 38.3, 病程持续 3 周以上, 并且经 1 周详细的检查仍无 法明确诊断的疾病。根据潜在病因将 FUO 分为 4 种亚型 - 经典型 (classic FUO)、 院内型 (nosocomial。
12、 FUO)、 免疫缺陷型(neutropenic FUO)和HIV相关型(HIV associated FUO)。 0004 据文献报道, 目前 FUO 大约占发热病例的 10, 其确诊率大约在 90左右。在已 确诊的病例中, 感染性疾病大约占到 50 -55, 其中细菌感染大约占感染性疾病 75, 占 诊断明确疾病 40左右 ; 病毒感染大约占感染性疾病 20, 占诊断明确疾病 10左右 ; 其 他感染约占感染性疾病 4, 占诊断明确疾病 2左右, 包括真菌感染、 支原体感染、 立克次 体感染、 及寄生虫感染。非感染性疾病占 45 -50, 其中自身免疫疾病约占非感染性疾病 50, 占诊断明。
13、确疾病 23左右 ; 肿瘤性疾病占非感染性疾病 49, 占诊断明确疾病 16。 0005 不明原因发热的诊断关键在找出病因, 临床上主要应鉴别 4 类疾病, 即感染性疾 病、 恶性肿瘤、 自身免疫性疾病及其他可引起发热的疾病。 目前针对不明原因发热病因诊断 展开了大量的研究, 研究证明感染仍是不明原因发热研究性报告中最为普遍的病因。 0006 目前, 不明原因发热明确诊断方法中以血清学和(或)细菌学为主, 其次为组织学 活检,再次为临床过程和(或)治疗反应、 影像学检查、 体液或骨髓检查、 手术探查。 这些技 术在临床诊断中已发挥了巨大的作用, 但仍存在一些不足之处, 例如培养技术繁琐而费时,。
14、 组织学活检及手术探查等可能会给病人带来痛苦及负担, 这些不足之处需要应用新的技术 去弥补。 发明内容 0007 本发明一方面提供一种检测血液中微生物的方法, 微生物包括细菌、 病毒和真菌, 包括 : (1) 提取血液样本核酸, 对核酸的至少一部分进行序列测定, 获得测序数据 ; (2) 去除 (1)中的测序数据中的宿主测序数据 ; (3)将(2)中余下的测序数据比对到微生物参考数据 库, 获得比对结果, 所说的微生物参考数据库包含多种细菌的参考序列和多种病毒的参考 基序列 ; (4) 依据 (3) 的比对结果, 确定微生物包含的物种及物种的丰度。 0008 本发明的另一方面提供一种确定宿主感。
15、染病原体的方法, 所说的宿主包括人和哺 乳动物, 所说的病原体包括致病细菌和 / 或致病病毒, 该方法包括 : (1) 提取宿主血液样本 核酸, 对核酸的至少一部分进行序列测定, 获得测序数据 ; (2) 去除 (1) 中的测序数据中的 说 明 书 CN 105525033 A 4 2/11 页 5 宿主测序数据 ; (3)将(2)中余下的测序数据比对到病原体参考数据库, 获得比对结果 ; (4) 依据 (3) 的比对结果, 确定样本包含的致病物种及其丰度 ; (5) 将 (4) 中致病物种的丰度与 所述致病物种的不致病丰度进行比较, 两者有显著性差异则确定该宿主感染这种病原体。 0009 本。
16、发明的再一方面提供一种确定宿主感染病原体的装置, 该装置包括 : A. 核酸提 取单元, 用于提取宿主血液 / 血浆 / 血清样本核酸, 对核酸的至少一部分进行序列测定, 获 得测序数据 ; B. 数据去除单元, 连接 A 单元, 用于接收 A 中的测序数据, 去除测序数据中的 宿主测序数据 ; C. 比对单元, 连接 B 单元或者连接 A 和 B 单元, 用于将 B 中余下的测序数据 比对到病原体参考数据库, 获得比对结果 ; D. 丰度计算单元, 与 C 单元连接, 用于接收 C 中 的比对结果, 确定样本包含的病原体种类及各种病原体的丰度 ; E. 判定单元, 与 D 单元连 接, 用于。
17、接收 D 中的致病物种的丰度, 将致病物种的丰度与该致病物种的不致病丰度进行 比较, 二者有显著性差异则确定宿主感染该致病物种。 0010 本发明提供的血液微生物的检测方法、 检测宿主感染病原体的方法和装置, 是基 于新一代的高通量测序技术来进行的, 本发明提供的方法只需要宿主的血液 / 血浆 / 血清 即可, 与组织学活检及手术探查等技术相比可以大大的减轻受检者的痛苦。 同时, 本发明的 方法仅需要 2-3 天左右的时间, 可以尽早的为受检者找到相关的微生物或病原体, 以便及 时的调整治疗方案以解除受检者或者患者的痛苦。此外, 本发明的方法或装置的成本也相 对较低, 通量高, 符合大多数受检。
18、者或患者的支付水平, 可以在临床中广泛推广, 快速检测 用于辅助临床诊断。还可用于血质的检测, 利于健康输血用血。 附图说明 0011 本发明的上述和 / 或附加的方面和优点从结合下面附图对实施方式的描述中将 变得明显和容易理解, 其中 : 0012 图 1 是本发明的一个具体实施方式中的四个血浆样本病原体细菌丰度 (abundance2) 表达值前 10 位的数据趋势图 ; 0013 图 2 是本发明的一个具体实施方式中的四个血浆样本病原体病毒丰度 (abundance2) 表达值前 10 位的数据趋势图 ; 0014 图 3 是本发明的一个具体实施方式中的不明原因发热病原体检测信息分析流程。
19、 示意图。 具体实施方式 0015 根据本发明的一个实施方式, 提供了一种检测血液中微生物的方法, 所说的微生 物包括细菌、 病毒和真菌, 该方法包括如下步骤 : 0016 步骤一 : 获得血液样本核酸测序数据 0017 所说的血液样本, 包括全血样本、 血浆样本和 / 或血清样本。获得宿主血液样本 后, 可处理血液样本获得血清或者血浆样本, 提取血清或血浆中的核酸, 对核酸的至少一部 分进行序列测定, 获得测序数据。血浆或血清中的核酸为游离核酸, 为来自宿主以及宿主 中的微生物的核酸混合物。这边的宿主可以是人也可以是其它哺乳动物, 这边核酸可以是 DNA, 也可以是 RNA, 测定 DNA 。
20、和 / 或 RNA 的序列, 可以依据所选用的测序方法进行相应的 文库制备, 可选用的测序方法根据来自的测序平台包括但不限于 BGISEQ1000、 BGISEQ100、 说 明 书 CN 105525033 A 5 3/11 页 6 Illumina/Solexa、 ABI/SOLiD 和 Roche 454, 依据所选测序平台进行相应的单端或双端测 序文库的制备。 根据本发明一种具体实施方式, 宿主是人, 提取的核酸是人血浆中游离DNA, 利用华大基因 (BGI) 的 BGISEQ100 平台及其 DNA 文库构建说明 DNA 测序, 获得测序数据, 测 序数据由多个测序序列(reads,。
21、 读段)组成。 在本发明的一个具体实施方式中, 获得测序数 据后, 还去除获自 BGISEQ100 平台的测序数据中小于 50bp 的读段, 因为获自 BGISEQ100 的 读段长度不一, 这样较严格的去掉较短的读段能提高整体读段的质量, 提高数据利用率, 利 于后续准确检测。 0018 步骤二 : 去除测序数据中的宿主测序数据 0019 将步骤一的测序数据比对到宿主人的参考序列上, 将比对上人参考序列的测序数 据去除。参考序列为已知序列, 他人公开或是自己测定。人的参考序列可以是已知的基因 组或是已知的基因组的一部分序列, 比如组装片段。序列比对可以利用已知软件比如 SOAP 或BWA来进。
22、行。 在本发明的一个具体实施方式中, 人参考基因组为HG19, 获自NCBI网站, 比 对是利用 Life Technologies 的 TMAP 软件进行的, 将比对上 HG19 的读段去除, 屏蔽掉比对 上的序列, 得到非人的测序数据。 去除大量的宿主源的数据, 减少对微生物源核酸数据的干 扰, 便于后续微生物检测鉴定。 0020 步骤三 : 获得余下的测序数据的比对结果 0021 将步骤二中余下的测序数据比对到微生物参考数据库, 获得比对结果, 所说的微 生物参考数据库包括多种细菌的参考基因序列和多种病毒的参考序列。 细菌或病毒的参考 序列可以是已知的该细菌或病毒的基因组或是基因组的一部。
23、分序列, 比如该细菌 / 病毒的 组装片段。细菌或病毒基因序列可以获自公开数据库, 比如 NCBI。在本发明的一个具体实 施方式中, 选择各种与人相关的细菌和病毒的参考基因组, 分别构成细菌参考数据库和病 毒参考数据库。针对细菌参考数据库中的每种细菌选择其一株菌株, 优先选择遗传信息数 据最多的菌株, 这样可以保证细菌参考数据库物种的唯一性和全面性, 以免受到物种内不 同菌株由于高度近缘, 序列高度相似而影响物种的定量分析 ; 病毒参考数据库包含所有与 宿主人相关的病毒全基因组序列, 由于病毒变异较大, 所以保留同种病毒不同亚型, 即某种 病毒的参考基因组包括该病毒的所有亚型的参考基因组, 且。
24、选择基因组大小为 600bp 以上 的病毒株的基因组作为参考序列。 0022 步骤四 : 确定检测到的微生物物种及各物种的丰度 0023 依据步骤三的比对结果, 确定样本中包含的微生物种类及各物种的丰度。在本 发明的一个具体实施方式中, 根据与细菌和 / 或病毒数据库的比对结果, 确定样本中细 菌或病毒源核酸表达丰度。各微生物物种的量化, 即表达丰度, 包括依据比对结果中比 对上该物种的测序数据计算得到的该物种的覆盖度和覆盖深度。在本发明的一个具体 实施方式中, 根据覆盖度和深度信息推演获得以下两组病原体量化公式 : 公式 I : 丰度 其中, i 表示物种 ; 和 / 或, 公式 II : 。
25、丰度 其中,j 表示与物种 i 同一参考数据库中物种, 比如物种 i 是细菌, j 即为细菌参考数据库中包含的物种。 0024 根据本发明的另一个实施方式, 提供了一种确定宿主感染病原体的方法, 宿主包 说 明 书 CN 105525033 A 6 4/11 页 7 括人、 其它哺乳动物以及非哺乳动物, 所说的病原体属于本发明上一方面方法中的微生物, 包括致病于宿主的细菌、 和/或致病病毒、 和/或致病真菌, 致病细菌、 致病病毒和致病真菌 分别属于本发明上一方面方法中的细菌、 病毒和真菌。 确定宿主感染病原体方法, 包括以下 步骤 : 0025 (1) 获得血液样本核酸测序数据 ; 0026。
26、 (2) 去除测序数据中的宿主测序数据 ; 0027 (3) 获得余下的测序数据的比对结果 ; 0028 (4) 检测样本包含的病原体种类及确定各种病原体的丰度 ; 0029 本发明这一实施方式提供的方法的步骤 (1)-(4), 与本发明前一个实施方式提供 的检测血液中微生物的方法所包含的步骤对应, 前面对本发明一个实施方式提供的检测血 液中微生物的方法以及其包含的各个步骤的描述、 特征说明和优点, 也适用于本发明这一 实施方式提供的确定宿主感染病原体的方法的步骤(1)-(4), 在此不再赘述。 在本发明的一 个具体实施方式中, 检测的样本来源于患不明原因发热的个体。 0030 (5) 判定宿。
27、主是否感染某个 ( 些 ) 病原体 0031 将 (4) 中获得的一个或多个致病物种的丰度与该致病物种的不致病丰度进行比 较, 两者有显著性差异则确定所述样本来源的宿主感染该致病物种。在本发明的一个具体 实施方式中, 致病物种的不致病丰度的确定, 包括 : 预先或同时对多个正常物种宿主血液 / 血浆 / 血清样本进行 (1)-(4), 获得多个正常宿主各自包含的一个或多个致病物种的丰 度, 获得所述一个或多个致病物种的多个丰度 I 值和多个丰度 II 值 ; 针对一个致病物种, 集合来自多个正常宿主样本的多个丰度 I 值, 设定置信度, 获得该致病物种的不致病丰度 I 值范围, 以及, 集合来。
28、自多个正常宿主的多个丰度 II 值, 获得所该病物种的不致病丰度 II 值 ; 丰度 I 值是根据所述公式 I 计算获得的, 丰度 II 值是根据所述公式 II 获得的, 其中, 公式 I : 丰度i 表示物种, 公式 II : 丰度 j 表示与物种 i 同一细菌或者病毒参考数据库中的物种。可 以依照常规统计检验取置信度的值, 比如将置信度设为 95、 99或者 99.9等。在本发 明的一个具体实施方式中, 该步骤 (5) 包括 : 将 (4) 中致病物种的丰度 I 值和丰度 II 值分 别与该致病物种的不致病丰度 I 值范围和不致病 II 值比较, 当该致病物种的丰度 I 值不在 该致病物种。
29、的不致病丰度 I 值范围内, 并且, 该致病物种的丰度 II 值大于该致病物种的不 致病丰度 II 值时, 表明所述致病物种的丰度与其不致病丰度差异显著, 则判定该宿主感染 该致病物种。 0032 根据本发明的再一个实施方式, 提供了能够分别执行上述本发明的两个实施方式 的方法的部分或全部步骤的装置。 比如, 提供了一种检测宿主是否感染病原体的装置, 所说 的宿主包括人, 病原体属于前述的微生物, 包括致病宿主的细菌、 和 / 或致病病毒和 / 或致 病真菌, 该装置包括 : A. 核酸提取单元, 用于提取宿主血液 / 血浆 / 血清样本核酸, 对所述 核酸的至少一部分进行序列测定, 获得测序。
30、数据 ; B. 数据去除单元, 连接 A 单元, 用于接收 A 中的测序数据, 去除所述测序数据中的宿主测序数据 ; C. 比对单元, 连接 B 单元或者连接 A 和 B 单元, 用于将 B 中余下的测序数据比对到病原体参考数据库, 获得比对结果, 所说的 说 明 书 CN 105525033 A 7 5/11 页 8 病原体参考数据库包括多种致病细菌的参考基因序列和多种致病病毒的参考序列 ; D. 丰 度计算单元, 与 C 单元连接, 用于接收 C 中的比对结果, 确定所述样本包含的病原体种类以 及各种致病物种的丰度 ; E. 判定单元, 与 D 单元连接, 用于接收 D 中的一个或多个致病。
31、物种 的丰度, 将一个或多个致病物种的丰度与各自对应致病物种的不致病丰度进行比较, 二者 有显著性差异则确定所述宿主感染该致病物种。 上述的对本发明的一方面的血液微生物检 测方法和 / 或检测宿主是否感染病原体的方法的优点和技术特征的描述, 同样适用于该装 置, 在此不再赘述。 0033 下面详细描述本发明的实施例, 所述实施例的示例在附图中示出, 其中自始至终 相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。 下面通过参考附 图描述的实施例是示例性的, 仅用于解释本发明, 而不能理解为对本发明的限制。 在本发明 的描述中, 除非另有说明,“多个” 的含义是两个或两个以上。 0。
32、034 除另有交待, 以下实施例中涉及的未特别交待的试剂、 序列 ( 接头、 标签和引物 )、 软件及仪器, 都是常规市售产品或者公开的, 比如购自华大基因的 BGISEQ100 测序平台建 库相关试剂盒或服务等。以下实施例检测不明原因发热病原体大致包括以下步骤 : (1) 血 浆样本核酸的提取 ; (2)DNA 文库构建 ; (3)Agilent 2100 及 QPCR 检测文库 ; (4)BGISEQ100 上机测序 ; (5) 数据预处理 ; (6) 病原数据库比对, 和 (7) 数据分析, 确定引起发热的病原 体。 0035 实施例一 血浆样本游离核酸序列测定 0036 不明原因发热患。
33、者的血液 / 血浆样本来自内蒙古妇幼保健院, 提取样本核酸后, 按照 BGI 的微芯片半导体测序平台 BGISEQ100 的建库和测序说明进行文库构建和测序。 0037 本项检测技术采用新一代高通量测序技术来检测不明原因发热患者血浆中的病 原体, 具体的实施步骤如下 : 0038 血浆样本核酸的提取 0039 使用天根的微量样品基因组提取试剂盒, 按照试剂盒中说明书的步骤提取血浆样 本的核酸。 0040 2.DNA 文库构建 0041 2.1 末端修复 0042 2.1.1 预先从 -20保存的试剂盒中取出 10Polynucleotide Kinase(PNK) buffer、 10mM d。
34、NTP Solution Set、 Klenow Fragment、 T4 Polynucleotide Kinase(T4 PNK) 将其置于冰上融解并充分混匀。 0043 2.1.2 配置末端修复反应体系 : 0044 试剂V/ 反应 (L) 10 x Polynucleotide Kinase buffer5 dNTP Solution Set(10mM)2 T4 DNA Polymerase(3U/L)1 说 明 书 CN 105525033 A 8 6/11 页 9 Klenow Fragment( 稀释 10 倍 )1 T4 Polynucleotide Kinase(T4 PNK。
35、)1 DNA40 Total volume50 0045 2.1.3 震荡混匀并离心后, 置于在 Thermomixer 中 20温浴 30min。 0046 2.1.4 使用 1.8 倍磁珠 (Agencourt AMPure XP) 进行末端修复产物纯化, 回收的 DNA 溶于 37L 的水中。 0047 2.2 Adapter 的连接 (Adapter Ligation) 0048 2.2.1 预 先 从 -20 保 存 的 试 剂 盒 中 取 出 10ligation buffer、 Adapter、 Barcode 和 T4 DNA Ligase 将其置于冰上融解并充分混匀。 004。
36、9 2.2.2 配置 Adapter 连接反应体系 : 0050 试剂V/ 反应 (L) 10ligation buffer5 PE Adapter(12.5pmol/L 稀释 4 倍 )1 T4 DNA Ligase(1U/L)3 ATP3.5 DNA 片段36.5 Barcode(12.5pmol/L 稀释 4 倍 )1 Total volume50 0051 2.2.3 震荡混匀并离心后, 置于在 Thermomixer 中 16, 过夜连接。 0052 2.2.4 使用 1.2 倍磁珠 (Agencourt AMPure XP) 进行加 “Adaptor” 产物纯化, 回收 的 DNA。
37、 溶于 35L 的超纯水中。 0053 2.3 PCR 0054 2.3.1 从 -20 保 存 的 试 剂 盒 中 取 出 10Pfx Amplifi cation Buffer、 MgSO4(50mM)、 dNTP Solution Set(10 mM)、 T_PCR_A、 Plamp 将其置于冰上融解并充分混匀。 0055 2.3.2 配置 PCR 反应体系 : 0056 反应个数1 个反应 (L) T_PCR_A(50pmol/L)1.25 说 明 书 CN 105525033 A 9 7/11 页 10 10Pfx Amplifi cation Buffer5 dNTP Soluti。
38、on Set(10mM)5 MgSO4(50mM)2 Plamp(50pmol/L)1.25 DNA 片段34.5 Pfx polymerase1 Total volume50 0057 0058 2.3.3 振荡混匀离心后, 将混合液置于 PCR 仪中按照下列程序反应。 0059 0060 2.3.4使用1倍磁珠(Agencourt AMPure XP)进行PCR产物纯化, 回收的DNA溶于 30L 的超纯水中。 0061 3. 文库检测 0062 使用 Agilent 2100 Bioanalyzer 检测 DNA 文库样本的片段大小范围, 使用 QPCR 检测 DNA 文库样本的浓度。文。
39、库大小及浓度符合上机要求。 0063 4.BGISEQ100 高通量测序, 获得下机数据。 0064 实施例二 微生物 / 病原体检测 0065 整体检测分析流程如图 3 所示。 0066 依照实施例一的方法步骤 1-4, 获取血浆样本核酸的序列测定数据, 测序数据由多 个长短不一的读段组成。 0067 5. 数据预处理 0068 5.1 过滤原始数据, 对于 BGISEQ100 测序数据, 去除小于 50bp 读段。 0069 5.2 过滤宿主人遗传物质。血浆样本中绝大部分是宿主人的游离 DNA, 数据显示高 达 95以上, 其余微生物含量在 1以下, 为避免检测病原微生物时宿主人遗传物质的。
40、影 响, 利用TMAP软件与人参考基因组reference序列进行比对, 屏蔽掉比对上的序列, 得到非 人的序列数据。 说 明 书 CN 105525033 A 10 8/11 页 11 0070 6. 病原数据库比对 0071 检测血浆病原微生物主要检测细菌和病毒及少部分真菌。 从已知的公开的细菌数 据库中每一个物种选择一株菌株, 择优选择遗传信息最多的菌株。目的是为了保证细菌数 据库物种的唯一性和全面性, 以免受到物种内不同菌株由于高度近缘, 序列高度相似而影 响物种的定量分析。对于病毒数据库我们选择与人相关的病毒全基因组序列, 由于病毒变 异较大, 所以保留同种病毒不同亚型, 且病毒株的。
41、基因组大小为 600bp 以上。利用 TMAP 或 者其它已知比对软件将经过预处理的测序数据分别与上述细菌库、 病毒库分别比对, 分别 得到细菌和病毒的比对结果数据, 在此保留全面比对结果, 即包含比对上细菌或病毒库多 处位置的测序序列(读段)。 在此, 经过过滤后得读段中只要有一条能够唯一比对到某种病 原体的参考基因组, 则认为该样本包含这种病原体。 0072 7. 数据分析, 确定引起不明原因发热的病原体 0073 7.1 确定待检样本病原体表达丰度图谱。 0074 利用软件 soap.coverage( 对细菌病毒比对结 果进行统计, 得到待检测样本中病原体的覆盖度和覆盖深度。根据覆盖度。
42、和深度信息推演 两组病原体量化公式 : I、 物种 A 的丰度, 丰度其中, A 表示物种 ; 公式 I 为双向标准化。对于一个样本中某一病原体的丰度, 每百万数据量中, 来 自于某物种每千 bp 长度的数据量多少 (bp), 在此消除了物种的长度和样本数据量的大小。 II、 物种 A 的丰度, 丰度其中,i表示同一细菌或病毒参 考数据库中的物种。 公式II为相对丰度, 能够1)估计每个病原体的拷贝数, 2)估计待检样 本病原体的相对丰度。 0075 7.2 阈值筛选设置 0076 通过上述公式 1 衡量病原体的丰度, 在丰度值小于一定值的情况下, 认为病原体 的拷贝数很低不足以引起宿主感染而。
43、引起发发热。确定引起不明原因发热的丰度阈值, 通 过以下模型给定阈值参考范围。 0077 在正常样本数据量积累到一定程度的时候, 比如 30 个以上的正常样本的数据量, 可以认为样本中病原体含量是服从正态分布的, 显著性水平0.05的情况下, 其接收域 1.96 其中, 为样本均值, 为样本方差。这些统计检验的参数的计算公式按照统 计书籍中的检验方法, 比如 z 检验进行。判定检测样本中病原体丰度与正常样本相比较是 否具有显著的差异性, 即待检样本病原体丰度值是否落在拒绝域中。如果落在拒绝域中统 计学上可认为待检样本感染该病原体。 0078 通过上述公式 II 衡量病原体相关性丰度, 在相关性。
44、丰度很低的情况下, 认为病 原体拷贝很低没有显著的优势, 这种情况也不足以引起宿主感染。相关性丰度阈值确定 可以根据经验值给定一个基线, 比如可以根据相对丰度最高的物种的不致病丰度 II 值给 出。四例血浆样本数据按照上述信息流程分析, 检测出样本 RTID2017 感染绿脓杆菌, 样本 TJHBVS0559 感染四型疱疹病毒, 这一检测结果与临床检测一致。四例实例样本检测数据统 计结果见表 1 ; 样本 RTID2017 的细菌丰度统计结果见表 2 ; 样本 TJHBVS0559 的病毒丰度检 测结果见表 3 ; 四例实例样本的物种丰度见表 4 和表 5 ; 4 例样本的检测结果如图 1 和。
45、图 2 说 明 书 CN 105525033 A 11 9/11 页 12 所示, 图 1 中横轴表示细菌表达值由高至底的序号, 纵轴表示为相对表达丰度, 直线基线为 相对丰度表达阈值 0.15, 如图 1 显示, 样本 RTID2017 感染了绿脓杆菌。图 2 横轴表示病毒 表达值由高至底的序号, 纵轴表示为相对表达丰度。 直线基线为相对丰度表达阈值0.15, 样 本 TJHBVS0559 感染了四型疱疹病毒。 0079 7.3 数据分析结果 0080 表 1 四例待检样本测序数据统计结果 0081 0082 注 : total 表示 Tmap 软件对于一条 reads 比对多个位置的结果全。
46、部输出。 0083 表 2 样本 RTID2017 细菌丰度统计 0084 0085 注 :abundance1 为利用公式 1 计算所得的丰度 ; abundance2 为利用公式 2 计算所 得的丰度。 0086 表 3 样本 TJHBVS559 病毒丰度统计 0087 0088 表 4 四例样本细菌相对丰度 (abundance2) 数据结果 0089 说 明 书 CN 105525033 A 12 10/11 页 13 0090 0091 表 5 四例样本病毒相对丰度 (abundance2) 结果数据 说 明 书 CN 105525033 A 13 11/11 页 14 0092 0093 说 明 书 CN 105525033 A 14 1/2 页 15 图 1 图 2 说 明 书 附 图 CN 105525033 A 15 2/2 页 16 图 3 说 明 书 附 图 CN 105525033 A 16 。