通过展开进行高通量核酸测序和相关方法.pdf

上传人:e2 文档编号:1255204 上传时间:2018-04-11 格式:PDF 页数:111 大小:2.09MB
返回 下载 相关 举报
摘要
申请专利号:

CN201080014202.1

申请日:

2010.01.29

公开号:

CN102365367A

公开日:

2012.02.29

当前法律状态:

撤回

有效性:

无权

法律详情:

发明专利申请公布后的视为撤回IPC(主分类):C12P 19/34申请公布日:20120229|||实质审查的生效IPC(主分类):C12P 19/34申请日:20100129|||公开

IPC分类号:

C12P19/34; G01N33/48

主分类号:

C12P19/34

申请人:

斯特拉托斯基因公司

发明人:

马克·斯达马蒂奥斯·可可里斯; 罗伯特·N·麦克卢尔

地址:

美国华盛顿州

优先权:

2009.01.29 US 61/148,334; 2009.01.29 US 61/148,327; 2009.01.29 US 61/148,332

专利代理机构:

北京英赛嘉华知识产权代理有限责任公司 11204

代理人:

王达佐;洪欣

PDF下载: PDF下载
内容摘要

公开了核酸测序的方法及相关产物和检测并呈递相关产物的方法。用于进行靶核酸测序的方法包括提供模板指导合成所产生的子链,该子链包含偶联于序列中的多个亚基,该序列对应于全部或部分靶序列的连续核苷酸序列。

权利要求书

1: 用于靶核酸测序的方法, 包括 : a) 提供通过模板指导合成所产生的 S-X 子链, 所述子链包含偶联于序列中的多个亚 基, 所述序列对应于全部或部分所述靶核酸的连续核苷酸序列, 其中个体亚基包含连接臂、 至少一个探针以及至少一个可选择性切割的键, 所述至少一个探针包含 X 个核碱基残基 (X 是大于 1 的正整数 ) 和编码所述探针的 Y 个核碱基残基的遗传信息的至少一个报道构建体 (Y 是小于 X 的正整数 ) ; b) 切割所述至少一个可选择性切割的键, 以产生长度比所述 S-X 子链的多个亚基长的 S-Xpandomer, 所述 S-Xpandomer 包含所述连接臂和用于确定每 X 个核碱基中的 Y 个核碱基 的报道元件 ; 以及 c) 检测所述至少一个报道构建体, 以使所述子链的每 X 个核碱基中的 Y 个核碱基的遗 传信息解码。
2: 如权利要求 1 所述的方法, 其中所述靶核酸通过模板指导滚环聚合方法产生。
3: 如权利要求 1 所述的方法, 其中所述模板指导合成包括连接反应。
4: 如权利要求 3 所述的方法, 其中所述连接反应是酶促连接反应。
5: 如权利要求 1 所述的方法, 其中所述至少一个报道构建体与以下相连 : 所述 S-Xpandomer 的连接臂 ; 在所述至少一个可选择性切割的键切割前的 S-X 子链 ; 或 在所述至少一个可选择性切割的键切割后的 S-Xpandomer。
6: 如权利要求 1 所述的方法, 其中所述至少一个报道构建体在所述 S-X 子链模板指导 合成后, 连接于所述 S-X 子链。
7: 如权利要求 1 所述的方法, 其中所述连接臂在所述 S-X 子链模板指导合成后, 连接于 所述 S-X 子链。
8: 如权利要求 1 所述的方法, 其中所述 S-Xpandomer 还包含所述至少一个探针的全部 或部分。
9: 如权利要求 8 所述的方法, 其中所述至少一个报道构建体是所述至少一个探针或与 所述至少一个探针相连。
10: 如权利要求 1 所述的方法, 其中所述至少一个可选择性切割的键是 : 共价键 ; 连接臂内的键 ; 所述 S-X 子链的探针或核碱基残基之间或之内的键 ; 或 所述 S-X 子链的探针或核碱基残基和靶模板之间的键。
11: 如权利要求 1 所述的方法, 其中所述 S-Xpandomer 包含下述结构 : 其中 T 表示所述连接臂 ; P1 表示第一探针部分 ; 2 P2 表示第二探针部分 ; κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 3 的整数 ; 以及 α 表示选自亚基基序文库的亚基基序的种类, 其中每个所述种类都包含部分所述靶核 酸的连续核苷酸序列的序列信息 ; 其中 T 表示所述连接臂 ; P1 表示第一探针部分 ; P2 表示第二探针部分 ; κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 3 的整数 ; α 表示选自亚基基序文库的亚基基序的种类, 其中每个所述种类都包含部分所述靶核 酸的连续核苷酸序列的序列信息 ; 以及 χ 表示与相邻亚基的连接臂连接的键 ; 其中 T 表示所述连接臂 ; P1 表示第一探针部分 ; P2 表示第二探针部分 ; κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 3 的整数 ; α 表示选自亚基基序文库的亚基基序的种类, 其中每个所述种类都包含部分所述靶核 酸的连续核苷酸序列的序列信息 ; 以及 χ 表示与相邻亚基的连接臂连接的键 ; 其中 T 表示所述连接臂 ; P1 表示第一探针部分 ; P2 表示第二探针部分 ; κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 3 的整数 ; α 表示选自亚基基序文库的亚基基序的种类, 其中每个所述种类都包含部分所述靶核 酸的连续核苷酸序列的序列信息 ; 以及 3 χ 表示与相邻亚基的连接臂连接的键 ; 其中 T 表示所述连接臂 ; κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 3 的整数 ; α 表示选自亚基基序文库的亚基基序的种类, 其中每个所述种类都包含部分所述靶核 酸的连续核苷酸序列的序列信息 ; 以及 χ 表示与相邻亚基的连接臂连接的键 ; 其中 T 表示所述连接臂 ; N 表示核碱基残基 ; κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 10 的整数 ; α 表示选自亚基基序文库的亚基基序的种类, 其中每个所述种类都包含部分所述靶核 酸的连续核苷酸序列的序列信息 ; 以及 χ 表示与相邻亚基的连接臂连接的键 ; 其中 T 表示所述连接臂 ; κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 10 的整数 ; α 表示选自亚基基序文库的亚基基序的种类, 其中每个所述种类都包含部分所述靶核 酸的连续核苷酸序列的序列信息 ; 以及 χ 表示与相邻亚基的连接臂连接的键 ; 其中 T 表示所述连接臂 ; N 表示核碱基残基 ; κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 10 的整数 ; 4 α 表示选自亚基基序文库的亚基基序的种类, 其中每个所述种类都包含部分所述靶核 酸的连续核苷酸序列的序列信息 ; 以及 χ 表示与相邻亚基的连接臂连接的键 ; 其中 T 表示所述连接臂 ; N 表示核碱基残基 ; κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 10 的整数 ; α 表示选自亚基基序文库的亚基基序的种类, 其中每个所述种类都包含部分所述靶核 酸的连续核苷酸序列的序列信息 ; 以及 1 χ 表示与相邻亚基的连接臂连接的键 ; 以及 2 χ 表示连接臂间的键 ; 或 其中 T 表示所述连接臂 ; n1 和 n2 分别表示核碱基残基的第一部分和第二部分 ; κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 10 的整数 ; 以及 α 表示选自亚基基序文库的亚基基序的种类, 其中每个所述种类都包含部分所述靶核 酸的连续核苷酸序列的序列信息。
12: 如权利要求 11 所述的方法, 其中所述 S-X 子链由多个具有下述结构的寡聚体底物 构建体形成 : 其中 T 表示所述连接臂 ; P1 表示第一探针部分 ; P2 表示第二探针部分 ; ~表示所述至少一个可选择性切割的键 ; 以及 1 2 R 和 R 表示用于所述子链的模板指导合成的相同或不同的末端基团 ; 5 其中 T 表示所述连接臂 ; P1 表示第一探针部分 ; P2 表示第二探针部分 ; R1 和 R2 表示用于所述子链的模板指导合成的相同或不同的末端基团 ; ε 表示第一连接基团 ; δ 表示第二连接基团 ; 以及 “----“表示可切割的连接臂内的交联 ; 其中 T 表示所述连接臂 ; P1 表示第一探针部分 ; P2 表示第二探针部分 ; R1 和 R2 表示用于所述子链的模板指导合成的相同或不同的末端基团 ; ε 表示第一连接基团 ; δ 表示第二连接基团 ; 以及 “----“表示可切割的连接臂内的交联 ; 其中 T 表示所述连接臂 ; P1 表示第一探针部分 ; P2 表示第二探针部分 ; ~表示所述至少一个可选择性切割的键 ; R1 和 R2 表示用于所述子链的模板指导合成的相同或不同的末端基团 ; ε 表示第一连接基团 ; 以及 δ 表示第二连接基团 ; 6 其中 T 表示所述连接臂 ; P1 表示第一探针部分 ; P2 表示第二探针部分 ; ~表示所述至少一个可选择性切割的键 ; R1 和 R2 表示用于所述子链的模板指导合成的相同或不同的末端基团 ; ε 表示第一连接基团 ; 以及 δ 表示第二连接基团 ; 其中 T 表示所述连接臂 ; N 表示核碱基残基 ; R1 和 R2 表示用于所述子链的模板指导合成的相同或不同的末端基团 ; ε 表示第一连接基团 ; δ 表示第二连接基团 ; 以及 “----“表示可切割的连接臂内的交联 ; 其中 T 表示所述连接臂 ; N 表示核碱基残基 ; R1 和 R2 表示用于所述子链的模板指导合成的相同或不同的末端基团 ; ~表示所述至少一个可选择性切割的键 ; ε 表示第一连接基团 ; δ 表示第二连接基团 ; 以及 “----“表示可切割的连接臂内的交联 ; 7 其中 T 表示所述连接臂 ; N 表示核碱基残基 ; R1 和 R2 表示用于所述子链的模板指导合成的相同或不同的末端基团 ; ε 表示第一连接基团 ; δ 表示第二连接基团 ; 以及 “----“表示可切割的连接臂内的交联 ; 其中 T 表示所述连接臂 ; N 表示核碱基残基 ; R1 和 R2 表示用于所述子链的模板指导合成的相同或不同的末端基团 ; ε1 和 ε2 表示相同或不同的第一连接基团 ; δ1 和 δ2 表示相同或不同的第二连接基团 ; 以及 “----“表示可切割的连接臂内的交联 ; 或 其中 T 表示所述连接臂 ; N 表示核碱基残基 ; V 表示所述核碱基残基的内部可切割位点 ; 以及 1 2 R 和 R 表示用于所述子链的模板指导合成的相同或不同的末端基团。
13: 如权利要求 12 所述的方法, 其中 R1 和 R2 选自羟基、 磷酸盐和三磷酸盐。
14: 如权利要求 1 所述的方法, 其中所述靶核酸通过滚环聚合方法产生。
15: 用于靶核酸测序的方法, 包括 a) 提供通过双向模板指导合成所产生的末端配对子链, 所述末端配对子链包含分别与 引物区的第一和第二末端连接的第一和第二序列区, 每个序列区独立地包含偶联于序列中 8 的至少 10 个核碱基残基, 所述序列对应于全部或部分所述靶核酸的连续核苷酸序列 ; b) 利用所述末端配对子链作为分析物输入, 对所述第一和第二探针区中每一个的至少 10 个核碱基残基进行测序, 以使所述靶核酸的遗传信息解码。
16: 如权利要求 15 所述的方法, 其中所述双向模板指导合成包括连接反应。
17: 如权利要求 16 所述的方法, 其中所述连接反应是酶促连接反应。
18: 如权利要求 15 所述的方法, 其中所述双向模板指导合成包括从所述引物区的 3’ 末 端开始的聚合酶反应。
19: 用于靶核酸测序的方法, 包括 a) 提供通过双向模板指导合成所产生的末端配对替代多聚体子链, 所述末端配对替代 多聚体子链具有分别与引物区的第一和第二末端连接的第一和第二探针区, 所述第一和第 二探针区包含偶联于序列中的多个替代多聚体底物, 所述序列对应于全部或部分所述靶核 酸的连续核苷酸序列, 其中, 个体替代多聚体底物包含连接臂、 至少一个探针以及至少一个 可选择性切割的键, 个体探针包含 X 个核碱基残基 (X 是大于 1 的正整数 ) 和编码 Y 个核碱 基残基 (Y 是至少为 1 且最大高达 X 的正整数 ) 的至少一个报道元件 ; b) 切割所述至少一个可选择性切割的键, 以产生长度比所述子链的多个替代多聚体底 物长的末端配对替代多聚体, 所述末端配对替代多聚体包含所述连接臂和用于确定每 X 个 核碱基中的 Y 个核碱基的报道元件 ; 以及 c) 检测所述报道元件, 以确定所述末端配对子链的每 X 个核碱基中的 Y 个核碱基。
20: 如权利要求 19 所述的方法, 其中所述双向模板指导合成包括连接反应。
21: 如权利要求 20 所述的方法, 其中所述连接反应是酶促连接反应。
22: 如权利要求 19 所述的方法, 其中所述双向模板指导合成包括从所述引物区的 3’ 末 端开始的聚合酶反应。
23: 用于产生末端配对核酸的方法, 所述末端配对核酸包含分别与引物区的第一和第 二末端连接的第一和第二区, 其中所述第一和第二区独立地包含至少 4 个寡核苷酸, 所述 方法包括 : a) 提供引物适配子, 其中所述引物适配子包含与引物互补或几乎互补的区域 ; b) 提供所述引物, 其中所述引物包含 5’ 磷酸盐末端和 3’ 羟基末端 ; c) 使所述引物与所述引物适配子双链体化 ; 以及 d) 从所述 5’ 末端和 3’ 末端两端延伸所述引物, 其中延伸包括将至少 4 个寡核苷酸连 接于所述引物的 5’ 末端。
24: 如权利要求 23 所述的方法, 其中所述末端配对核酸是末端配对替代多聚体子链, 且所述核苷酸或寡核苷酸包含 Xprobe 或 S-Xprobe。
25: 如权利要求 23 所述的方法, 其中所述引物适配子使靶核酸环化。
26: 如权利要求 23 所述的方法, 其中所述引物适配子还包含连接臂, 其中所述连接臂 任选地连接于固相基质。
27: 如权利要求 23 所述的方法, 其中连接包括酶促连接反应。
28: 如权利要求 23 所述的方法, 还包括从所述引物的 3’ 末端开始的连接。
29: 如权利要求 23 所述的方法, 还包括从所述引物的 3’ 末端延伸的聚合酶反应。
30: 末端配对替代多聚体, 包含第一探针区和第二探针区, 所述第一和第二探针区分别 9 与引物区的第一和第二末端连接, 所述第一和第二探针区包含偶联于序列中的多个亚基, 所述序列对应于全部或部分靶核酸的连续核苷酸序列。
31: 如权利要求 30 所述的末端配对替代多聚体, 其中所述末端配对替代多聚体通过权 利要求 23 所述的方法产生。
32: 如权利要求 30 所述的末端配对核酸, 其中所述第一和第二探针区独立地包含 4 个 或更多个探针。
33: 试剂盒, 包含多个构建体 ( 即具有合适的 R1/R2 末端基团的 Xmer 或 S-Xmer), 用于 通过模板指导合成形成替代多聚体子链, 其中所述试剂盒任选地包含利用所述试剂盒形成 替代多聚体子链的适当的说明书。
34: 如权利要求 33 所述的试剂盒, 其中所述试剂盒包含 10 至 65000 个独特的成员。
35: 读取替代多聚体的个体报道元件的方法, 包括 : a) 提供替代多聚体, 其中所述替代多聚体包含一个或多个个体报道元件 ; b) 提供检测器构造体 ; b) 向所述检测器构造体呈递所述替代多聚体 ; c) 顺序读取所述个体报道元件, 以确定所述报道元件的顺序 ; 以及 d) 利用因此确定的报道顺序使所述替代多聚体的遗传信息解码。
36: 如权利要求 35 所述的方法, 其中所述检测器构造体包含第一和第二贮存器, 所述 第一和第二贮存器分别包含第一和第二电极, 其中所述第一和第二贮存器通过位于所述第 一和第二贮存器之间的纳米孔基质而分离, 所述纳米孔基质包含至少一个纳米孔通道, 且 读取所述个体报道元件包括, 使所述替代多聚体从所述第一贮存器通过所述至少一个纳米 孔通道转移到所述第二贮存器。
37: 如权利要求 36 所述的方法, 其中读取所述个体报道元件还包括, 当所述替代多聚 体通过所述纳米孔通道转移时, 检测所述纳米孔通道中的电阻变化。
38: 如权利要求 36 所述的方法, 其中所述个体报道元件包含至少一种 FRET( 荧光共振 能量转移 ) 供体或受体荧光团, 且所述纳米孔通道包含至少一种 FRET 供体或受体荧光团, 只要当所述个体报道元件包含 FRET 供体时, 所述纳米孔通道包含 FRET 受体, 且当所述个体 报道元件包含 FRET 受体时, 所述纳米孔通道包含 FRET 供体, 且读取所述个体报道元件还包 括: a) 当所述替代多聚体通过所述纳米孔通道转移时, 用光源激发所述供体荧光团 ; 以及 b) 检测所述受体荧光团发射的荧光信号。
39: 如权利要求 38 所述的方法, 其中所述供体荧光团包含 1-4 个激发波长。
40: 如权利要求 35 所述的方法, 其中所述检测器构造体包括纳米梳检测器阵列, 所述 纳米梳检测器阵列在纳米梳槽中或末端具有至少一个检测器元件, 且读取所述个体报道元 件包括使所述替代多聚体穿过所述纳米梳槽的末端。
41: 如权利要求 40 所述的方法, 其中所述纳米梳检测器阵列还包括第一和第二电极, 且使所述替代多聚体在所述第一和第二电极间穿过。
42: 如权利要求 41 所述的方法, 其中当所述替代多聚体在所述第一和第二电极间穿过 时, 所述个体报道元件诱发电解液电流变化。
43: 如权利要求 41 所述的方法, 其中当所述替代多聚体在所述第一和第二电极间穿过 10 时, 所述个体报道元件在所述第一和第二电极间形成电流通路。
44: 如权利要求 35 所述的方法, 其中将所述替代多聚体作为线性化阵列呈递于所述检 测器构造体, 其中所述线性化阵列包含基质。
45: 如权利要求 44 所述的方法, 其中读取所述个体报道元件包括电子束显微镜检术, 其中所述电子束形成线。
46: 如权利要求 44 所述的方法, 其中所述个体报道元件包含硼或纳米金。
47: 如权利要求 44 所述的方法, 其中所述基质包含用于改善信噪比的反差包被。
48: 如权利要求 44 所述的方法, 其中所述检测器构造体包括至少一个刀刃式电极, 所 述个体报道元件包含导电聚合丝, 且读取所述个体报道元件包括 : a) 在所述至少一个刀刃式电极和所述基质间施加电势 ; 以及 b) 当所述替代多聚体在所述至少一个刀刃式电极下穿过时, 检测电流。
49: 如权利要求 48 所述的方法, 其中所述基质包含导电膜。
50: 如权利要求 48 所述的方法, 其中所述导电聚合丝包含选自聚乙炔、 聚苯胺或聚吡 咯的多聚体。
51: 如权利要求 44 所述的方法, 其中所述个体报道元件包含至少一种荧光团, 其中所 述至少一种荧光团包含至少一种光谱类型, 且读取所述个体报道元件包括 : a) 提供激发能量, 定位所述激发能量, 以便激发所述个体报道元件的至少一种荧光团 ; 以及 b) 检测所述至少一种荧光团所发射的荧光信号。
52: 如权利要求 51 所述的方法, 其中所述激发能量来自近场源, 所述近场源自切口出 现, 且读取所述个体报道元件还包括 : a) 平行于所述替代多聚体移动所述切口 ; 以及 b) 检测所述个体报道元件的至少一种荧光团的荧光信号。
53: 如权利要求 52 所述的方法, 其中在远场中检测所述荧光信号。
54: 检测分析物的方法, 包括 : a) 提供至少一种分析物 ; b) 提供至少一种指示剂部分, 其中所述指示剂部分不与所述分析物相连 ; c) 提供检测器构造体, 其中所述检测器构造体包含第一和第二贮存器, 所述第一和第 二贮存器分别包含第一和第二电极, 其中所述第一和第二贮存器通过位于所述第一和第二 贮存器之间的纳米孔基质而分离 ; d) 向所述第一和第二电极提供电势, 其中所述电势足以使所述至少一种分析物和所述 至少一种指示剂部分通过所述至少一个纳米孔通道转移 ; 以及 c) 当所述至少一种分析物通过所述至少一个纳米孔通道转移时, 在所述至少一个纳米 孔通道处或附近, 检测所述至少一种指示剂部分所发射的光信号的变化。
55: 如权利要求 54 所述的方法, 还包括提供激发波长, 其中所述激发波长足以从所述 至少一种指示剂部分诱发荧光信号。
56: 如权利要求 54 所述的方法, 其中所述至少一种分析物是核酸。
57: 如权利要求 54 所述的方法, 其中所述至少一种分析物是替代多聚体。
58: 如权利要求 54 所述的方法, 其中所述至少一种指示剂部分是荧光团, 所述第一贮 11 存器相对于所述第二贮存器包含高浓度的所述荧光团, 且检测光信号的变化还包括, 当所 述荧光团通过所述至少一个纳米孔通道转移时, 检测荧光信号的变化。
59: 如权利要求 58 所述的方法, 其中落射荧光显微镜检术用于检测所述荧光信号的变 化。
60: 如权利要求 58 所述的方法, 其中锥光法用于检测所述荧光信号的变化。
61: 如权利要求 58 所述的方法, 其中所述纳米孔基质包含封阻膜。
62: 如权利要求 58 所述的方法, 其中所述荧光团是荧光素。
63: 如权利要求 58 所述的方法, 其中所述第二贮存器包括荧光淬灭剂, 且检测光信号 的变化还包括, 当所述荧光团或淬灭剂通过所述至少一个纳米孔通道转移时, 检测荧光信 号的变化。
64: 如权利要求 63 所述的方法, 其中所述淬灭剂选自 QSY7、 QSY9 和自由基。
65: 如权利要求 54 所述的方法, 还包括提供两种指示剂部分, 其中第一指示剂部分选 自指示剂离子, 第二指示剂部分选自荧光指示剂, 所述第一贮存器包含指示剂离子, 所述第 二贮存器包含荧光指示剂, 且检测光信号的变化还包括, 检测当所述指示剂离子或指示剂 部分穿过所述至少一个纳米孔通道时所发射的荧光信号的变化。
66: 如权利要求 65 所述的方法, 其中所述第二贮存器还包含不发荧光的吸收剂。
67: 如权利要求 65 所述的方法, 其中掩蔽所述纳米孔通道以产生直径为约 1μm 的圆形 开口, 其中所述开口与所述纳米孔通道同轴。
68: 如权利要求 65 所述的方法, 其中所述指示剂离子选自钙离子、 单线态氢离子、 单线 态氧离子、 钾离子、 锌离子、 镁离子、 氯离子以及钠离子。
69: 如权利要求 65 所述的方法, 其中所述荧光指示剂选自 Fura-3、 Fluo-3、 Indo-1 以 及 Fura Red。
70: 如权利要求 65 所述的方法, 其中所述荧光指示剂是荧光淬灭剂。
71: 如权利要求 65 所述的方法, 其中所述第一贮存器包含碘化物离子, 且所述第二贮 存器包含荧光素。
72: 如权利要求 54 所述的方法, 还包括提供两种指示剂部分, 其中所述第一贮存器包 含第一指示剂部分, 而所述第二贮存器包含第二指示剂部分, 其中所述第一和第二指示剂 部分能结合以形成激发态的第三指示剂部分, 且检测光信号的变化还包括, 当所述第三指 示剂部分松弛回到基态时, 检测发射的光子。
73: 如权利要求 54 所述的方法, 其中所述至少一个纳米孔包括纳米孔阵列, 且所述纳 米孔阵列共享所述第一和第二贮存器。
74: 呈递至少一个替代多聚体用于检测的方法, 包括 : a) 提供检测器构造体, 其中所述检测器构造体包括至少一个检测器元件 ; b) 提供所述至少一个替代多聚体, 其中所述至少一个替代多聚体包含一个或多个个体 报道元件 ; 以及 c) 处理所述至少一个替代多聚体, 以获得所述一个或多个个体报道元件的统一的空间 和时间间隔。
75: 如权利要求 74 所述的方法, 其中所述检测器构造体包括至少一个纳米孔通道。
76: 如权利要求 75 所述的方法, 其中所述检测器构造体包括规则的纳米孔通道阵列。 12
77: 如权利要求 74 所述的方法, 其中处理所述至少一个替代多聚体包括, 将所述至少 一个替代多聚体的末端与具有至少一个结合位点的固相基质连接。
78: 如权利要求 74 所述的方法, 其中处理所述至少一个替代多聚体包括, 使所述至少 一个替代多聚体对齐排列在基质表面上。
79: 如权利要求 75 所述的方法, 其中处理所述至少一个替代多聚体包括, 将低分子量 的带电荷的线性多聚体连接于所述至少一个替代多聚体的末端。
80: 如权利要求 79 所述的方法, 其中所述带电荷的线性多聚体选自聚谷氨酸和聚磷酸 盐。
81: 如权利要求 75 所述的方法, 其中处理所述至少一个替代多聚体包括, 向所述至少 一个纳米孔通道施加电压, 其中所述电压高于期望的检测电压, 且当在所述纳米孔通道中 检测到替代多聚体时, 将所述电压降低至所述期望的检测电压。
82: 如权利要求 81 所述的方法, 其中操作所述电压, 使得一次仅有一个替代多聚体可 以占据所述至少一个纳米孔通道。
83: 如权利要求 75 所述的方法, 其中处理所述至少一个替代多聚体包括, 将障碍物连 接于所述至少一个替代多聚体的末端, 并在所述至少一个纳米孔通道中预装填所述至少一 个替代多聚体, 其中所述障碍物防止所述至少一个替代多聚体穿过所述至少一个纳米孔通 道, 并防止多个替代多聚体占据同一纳米孔通道。
84: 如权利要求 83 所述的方法, 其中所述障碍物选自大体积树枝状大分子和珠子。
85: 如权利要求 84 所述的方法, 其中所述珠子是磁珠。
86: 如权利要求 75 所述的方法, 其中处理所述至少一个替代多聚体包括, 将线性铁氧 体多聚体连接于所述至少一个替代多聚体的末端, 并操作磁场和电场, 以获得所述一个或 多个个体报道元件的统一的空间和时间间隔。
87: 如权利要求 86 所述的方法, 其中操作所述磁场和所述电场, 使得一次仅有一个替 代多聚体可以占据所述至少一个纳米孔通道。
88: 如权利要求 74 所述的方法, 其中处理所述至少一个替代多聚体包括, 控制所述至 少一个替代多聚体向所述检测器构造体的流动。
89: 如权利要求 88 所述的方法, 其中所述控制所述至少一个替代多聚体的流动包括, 将所述至少一个替代多聚体连接于基质, 其中所述连接包括可寻址的、 可切割的连接 ; 并选 择性切割所述连接, 以便每单位时间从所述基质释放一个替代多聚体。
90: 如权利要求 89 所述的方法, 其中选择性切割所述可切割的连接包括, 控制切割速 率, 使得一次仅有一个替代多聚体可以占据所述至少一个检测器元件。
91: 如权利要求 89 所述的方法, 其中所述连接选自光裂解连接、 热裂解连接和电化学 裂解连接。
92: 如权利要求 88 所述的方法, 其中控制所述至少一个替代多聚体的流动包括 : a) 提供至少一个门控构造体, 其中所述至少一个门控构造体包括第一、 第二和第三电 极; 以及 b) 操作独立施加于所述第一、 第二、 以及第三电极的电场, 以获得所述一个或多个个体 报道元件的统一的空间和时间间隔。
93: 如权利要求 92 所述的方法, 其中操作所述电场, 使得一次仅有一个替代多聚体可 13 以占据所述至少一个检测器元件。
94: 如权利要求 88 所述的方法, 其中控制所述至少一个替代多聚体的流动包括 : a) 提供至少一个门控构造体, 其中所述至少一个门控构造体包括第一和第二多孔电极 和门控元件, 其中将所述第一和第二多孔电极分别固定于所述门控元件的第一和第二侧 ; b) 向所述第一和第二电极施加电场 ; 以及 c) 通过所述门向所述至少一个检测器元件转运所述至少一个替代多聚体。
95: 如权利要求 94 所述的方法, 其中所述门控元件选自多孔膜和纳米孔。
96: 如权利要求 94 所述的方法, 其中操作所述电场, 以获得所述一个或多个个体报道 元件的统一的空间和时间间隔。
97: 如权利要求 94 所述的方法, 其中操作所述电场, 使得一次仅有一个替代多聚体可 以占据所述至少一个检测器元件。
98: 如权利要求 95 所述的方法, 其中所述门控元件是多孔膜。
99: 如权利要求 98 所述的方法, 其中所述多孔膜包含直径为约 20nm 到约 100nm 的孔。
100: 如权利要求 98 所述的方法, 其中所述多孔膜选自氧化铝和形成多聚体轨道的膜。
101: 如权利要求 94 所述的方法, 其中提供多元门控构造体 ( 即提供多于一个门控构造 体 )。
102: 如权利要求 88 所述的方法, 其中控制所述至少一个替代多聚体的流动包括, 提供 至少一个选自亲和凝胶或通道的门控构造体, 并且处理所述至少一个替代多聚体包括 : a) 将亲和拖拉标签连接于所述替代多聚体的末端 ; 以及 b) 施加足以通过所述门控构造体向所述至少一个检测器元件转移所述替代多聚体的 电场。
103: 如权利要求 102 所述的方法, 其中操作所述电场, 以获得所述一个或多个个体报 道元件的统一的空间和时间间隔。
104: 如权利要求 102 所述的方法, 其中操作所述电场, 使得一次仅有一个替代多聚体 可以占据所述至少一个检测器元件。
105: 如权利要求 102 所述的方法, 其中所述门控构造体是亲和凝胶。
106: 如权利要求 77 所述的方法, 其中所述固相基质具有均匀间隔的结合位点。
107: 如权利要求 106 所述的方法, 其中所述结合位点是大小为约 1μm 的斑点。
108: 如权利要求 106 所述的方法, 其中最多为一个替代多聚体与每个个体结合位点结 合。
109: 如权利要求 108 所述的方法, 其中所述替代多聚体还包含连接于所述替代多聚体 末端的树枝状大分子, 其中所述树枝状大分子在空间上阻止另一个替代多聚体与同一位点 的结合。
110: 如权利要求 106 所述的方法, 其中所述固相基质选自韧性聚对苯二甲酸乙二酯 (PET) 膜、 浮法玻璃、 硅晶片以及不锈钢。
111: 如权利要求 106 所述的方法, 其中所述至少一个结合位点包括所述固相基质上的 行列。
112: 如权利要求 111 所述的方法, 其中所述行列的宽度小于与其结合的替代多聚体之 间的距离。 14
113: 如权利要求 77 所述的方法, 其中所述基质具有至少一个与其结合的替代多聚体, 使所述基质从法线旋转 180 度, 到达施加的电场, 所述电场使所述至少一个替代多聚体以 顺直且伸展的方向平放在所述基质的表面上。
114: 如权利要求 113 所述的方法, 其中还将所述至少一个替代多聚体以平放、 顺直且 伸展的方向连接于所述基质表面。
115: 如权利要求 114 所述的方法, 其中通过所述基质表面的紫外线或化学激活, 将所 述至少一个替代多聚体连接于所述基质表面。
116: 如权利要求 113 所述的方法, 其中所述固相基质是韧性聚对苯二甲酸乙二酯 (PET) 膜。
117: 如权利要求 77 所述的方法, 其中所述基质具有至少一个与其结合的替代多聚体, 使所述基质穿过梳状构造体, 其中所述梳状构造体包括在输入侧的拉伸电场、 在输出侧的 固定电场, 以及在所述输入侧和输出侧之间的梳状元件, 且处理所述至少一个替代多聚体 还包括, 使所述基质在所述梳状物下穿过所述拉伸电场, 并穿过所述固定电场, 使得所述至 少一个替代多聚体以顺直且伸展的方向平放于所述基质表面上。
118: 如权利要求 117 所述的方法, 其中还将所述至少一个替代多聚体以平放、 顺直且 伸展的方向连接于所述基质表面。
119: 如权利要求 118 所述的方法, 其中通过施加电场或通过所述基质表面的紫外线或 化学激活, 将所述至少一个替代多聚体连接于所述基质表面。
120: 如权利要求 78 所述的方法, 其中所述基质具有至少一个与其结合的替代多聚体, 使所述基质在刷状构造体下穿过, 其中所述刷状构造体包括丝, 所述丝使所述至少一个替 代多聚体以顺直且伸展的方向平放于所述基质表面上。
121: 如权利要求 120 所述的方法, 其中还将所述至少一个替代多聚体以平放、 顺直且 伸展的方向连接于所述基质表面。
122: 如权利要求 121 所述的方法, 其中通过施加电场或通过所述基质表面的紫外线或 化学激活, 将所述至少一个替代多聚体连接于所述基质表面。
123: 如权利要求 120 所述的方法, 其中所述丝的直径为约 10nm。
124: 如权利要求 120 所述的方法, 其中所述丝包含多聚体。
125: 如权利要求 124 所述的方法, 其中所述丝选自紫外线固化或热固化的多聚体。
126: 如权利要求 77 所述的方法, 其中所述基质包含闭环韧性膜, 且处理所述至少一个 替代多聚体还包括连续过程, 所述过程包括 : a) 使所述基质旋转通过所述检测器构造体 ; b) 在穿过所述检测器元件后, 从所述基质表面除去所述至少一个替代多聚体 ; c) 再将另一个替代多聚体连接于所述基质表面 ; d) 以及重复步骤 a 和 b, 直到所有替代多聚体都得到分析。
127: 如权利要求 126 所述的方法, 其中所述基质是韧性聚对苯二甲酸乙二酯 (PET) 膜。
128: 如权利要求 74 所述的方法, 其中处理所述至少一个替代多聚体包括, 将所述至少 一个替代多聚体固定于包含纳米孔通道的固相基质上, 其中将所述至少一个替代多聚体固 定于所述固相基质上包括, 将障碍物连接于所述至少一个替代多聚体的末端, 并在所述至 少一个纳米孔通道中预装填所述至少一个替代多聚体, 其中所述障碍物防止所述至少一个 15 替代多聚体穿过所述至少一个纳米孔通道并防止多个替代多聚体占据同一纳米孔通道。
129: 如权利要求 128 所述的方法, 其中所述障碍物选自大体积树枝状大分子和珠子。
130: 如权利要求 129 所述的方法, 其中所述珠子是磁珠。

说明书


通过展开进行高通量核酸测序和相关方法

    引用的相关申请
     本申请依据 35U.S.C.§119(e) 要求 2009 年 1 月 29 日提交的美国临时专利申请 第 61/148,332 号、 2009 年 1 月 29 日提交的美国临时专利申请第 61/148,334 以及 2009 年 1 月 29 日提交的美国临时专利申请第 61/148,327 号的权益, 所有申请在此通过引用整体并 入。
     发明领域 本发明通常涉及核酸测序, 以及与之相关的方法和产物。
     发明背景
     核酸序列编码生物体发挥功能和繁殖所必需的信息, 且实质上是生命的基本信息 (blueprint)。 因此确定这些序列在对生物体如何存活以及在何处存活的纯理论研究中, 以 及在诸如药物研发的应用科学中, 都是有用的方法。 在医学中, 测序方法可用于诊断以及研 发多种疾病的治疗方法, 包括癌症、 心脏病、 自身免疫病症、 多发性硬化或肥胖症。在工业 中, 测序可用于设计改良的酶促方法或合成生物体。 在生物学中, 这类方法可以用于研究例 如生态系统的健康状态, 因此拥有广泛的应用。
     个体的独特 DNA 序列为他们对某些疾病的敏感性提供了有用的信息。序列可以为 患者提供机会来做早期检测的筛选以及获得预防性治疗。并且, 如果获得患者的个体基本 信息, 临床医生就可以实施个性化治疗来使药物效力最大化并使药物不良反应最小化。同 样, 确定病原生物体的基本信息能够为传染性疾病带来新的治疗方法以及更有力的病原体 监测。全基因组 DNA 测序将为现代医学提供基础。
     DNA 测序是确定给定 DNA 多聚体化学成分的顺序的方法。 这些化学成分, 称为核苷 酸, 以四种普遍的形式存在于 DNA 中 : 脱氧腺苷 (A)、 脱氧鸟苷 (G)、 脱氧胞苷 (C) 和脱氧胸 苷 (T)。二倍体人类基因组的测序需要确定大约 60 亿个核苷酸的连续顺序。
     目前, 大多数 DNA 测序是使用 Frederick Sanger 研发的链终止方法来进行的。这 种技术, 称为 Sanger 测序, 运用 DNA 合成的序列特异性终止和荧光修饰的核苷酸报道底物 来获得序列信息。这种方法通过用改良的聚合酶链式反应来确定长度高达 1000 个碱基的 靶核酸链的序列或读长。在这种改良的反应中, 测序在选择的碱基类型处 (A、 C、 G 或 T) 被 随机打断, 并且通过毛细管凝胶电泳确定该打断序列的长度。然后所得的长度可以确定哪 种类型的碱基位于那个长度上。 产生了很多重叠的读长, 并且使用数据处理将其序列重叠, 从而确定最可靠的数据配合。这种产生序列读长的方法是非常费力和昂贵的, 并且正在被 效率更高的新方法取代。
     Sanger 法曾用于提供人类基因组计划的大部分序列数据, 该计划产生人类基因组 的首次完整序列。完成这项计划花费了 10 年和将近 30 亿美元。考虑到这些巨大的通量和 成本限制, 显然, DNA 测序技术需要彻底的改善来达到科学界提出的规定的目标。为了达到 这一目标, 许多二代技术, 其远远超越 Sanger 测序法的通量和每碱基成本的局限性, 正占 有越来越多的测序市场份额。然而, 这些 “合成测序” 法仍然不能实现市场要求的通量、 成
     本和质量目标, 例如用于个性化医疗的全基因组测序。
     例如, 454 Life Sciences 公司正在生产可以在 7.5 个小时内以 200 个核苷酸的平 均读长处理 1 亿个碱基的仪器 ( 例如, 基因组测序仪 )。他们的方法是, 用改变的 PCR 在珠 子的表面产生均一的靶核酸的群体 (colony), 长度为数百个碱基。这一过程术语上称为乳 液 PCR。然后将成千上万的珠子排列于 “铬尖晶石平板 (picotiter plate)” 上。然后准备 该平板用于进一步的测序, 从而使每个核酸碱基类型从该平板上依次被洗涤下来。带有并 入碱基的靶标的珠子产生焦磷酸副产物, 该副产物可用于催化随后被成像系统检测的光产 生反应。
     Illumina 公司也有相似的方法, 该方法用可逆的终止核苷酸和荧光标记进行核酸 测序。Illumina 的 1G 分析仪的平均读长少于 40 个核苷酸。不同于用乳液 PCR 来扩增序列 靶标, Illumina 的方法是在阵列表面扩增 PCR 群体。454 和 Illumina 公司的方法都用复杂 化的聚合酶扩增来增强信号强度, 在有速度限制的序列延伸循环中进行碱基检测, 并且由 于并入错误降低了与读长成比例的测量信噪比从而限制了读长。
     Applied Biosystem 公司用可逆的终止连接而不是通过合成测序来读取 DNA。像 454 公司的基因组测序仪一样, 该技术用基于珠子的乳液 PCR 来扩增样品。由于大部分的 珠子不承载 PCR 产物, 于是研究人员接下来使用富集步骤选择包被有 DNA 的珠子。将生物 素包被的珠子涂布并固定于覆盖有链霉抗生物素的载玻片阵列上。 然后使固定的珠子经过 8mer( 单元单体 ) 探针杂交 ( 每个用 4 种不同的荧光染料标记 )、 连接和剪切 ( 在第 5 和第 6 个碱基之间剪切从而产生用于下一轮连接的位点 ) 的过程。每个探针在第 4 和第 5 个碱 基位置用双碱基编码系统检测两个碱基, 可由成像系统记录。与 Illumina 公司的方法相 似, Applied Biosystem 公司的 SOLID 平台的平均读长也少于 40 个核苷酸。
     通过直接检测 DNA 单个分子来消除聚合酶扩增步骤的时间和费用的其他方 法正在研发之中。因荧光标记的碱基通过将第二种荧光团加入到改造的 DNA 聚合酶 中 并 用 Foster 共 振 能 量 转 移 (FRET) 来 鉴 定 核 苷 酸 而 得 以 确 定 它 们 的 序 列, Visigen Biotechnologies 公司正在检测带荧光标记的碱基。 这种技术面临分辨碱基信号的难题, 将 这些碱基信号经由低于 1 纳米以及经由聚合酶并入作用分辨出来, 这会带来很大的统计学 偏差。
     LingVitae 正在研发的一种方法可以确定插入到固定的质粒载体中的 cDNA 的序 列。该方法使用 IIS 类限制酶切割靶核酸并将寡聚体连接到靶标上。通常, 由限制酶产生 的 5’ 或 3’ 末端突出端中的一个或两个核苷酸决定了在连接混合物中哪种寡聚体文库会被 加到靶标的粘性切割末端。每个寡聚体含有 “信号” 序列, 该序列特异性识别它所取代的核 苷酸。然后重复切割和连接过程。接下来用各种寡聚体的特异性标签, 对新的分子进行测 序。该方法的产物被称为 “设计多聚体” , 并且总是由比其所取代核酸更长的核酸组成 ( 例 如, 一个二核苷酸靶序列被一个 “放大” 的多达 100 个碱基对的多核苷酸序列所取代 )。该 方法的优势在于, 如果需要, 可以扩增双链产物链。缺点在于该方法必须是循环的, 并且如 果同时发生多个限制性切割, 那么模板的连续性将会丢失。
     Kless 的美国专利第 7,060,440 号描述了一种测序方法, 该方法包括用聚合酶的 聚合作用来并入寡聚体。改良的 Sanger 方法, 以末端终止的寡聚体为底物, 用于通过凝胶 电泳或毛细管层析法建立测序序列梯。虽然用末端连接使寡聚体偶联是众所周知的, 但是在模板指导过程中用聚合酶偶联寡聚体以新的优势被应用。
     期望聚合反应技术能大力发展, 因为改良的聚合酶 ( 和连接酶 ) 可以通过基因工 程和生物勘探获得, 并且通过聚合酶修饰去除外切核酸酶活性的方法也是已知的。例如, Williams 的已公开的美国专利申请 2007/0048748 描述了使用突变的聚合酶来并入染料标 记的和其他修饰的核苷酸。这些聚合酶的底物也包括 γ- 磷酸盐标记的核苷酸。发现用嵌 合的和突变的聚合酶可以提高并入速度并降低错误率。
     此外, 学术和工业团队都做了很大的努力来利用非合成方法确定天然 DNA 的序 列。例如, Agilent Technologies 公司与大学合作者正研发一种单分子检测方法, 该方法 使 DNA 通过一个纳米孔, 以便通过它穿过纳米孔时进行检测。跟 Visigen 和 LingVitae 一 样, 这种方法必须克服有效地和准确地从由亚纳米尺寸所分离的单个核碱基获得清晰信号 的问题, 以及研发相似大小的可再生孔径的问题。就这点而言, 在高通量过程中, 还仍然必 须实现通过检测 DNA 的组成部分对其直接测序, 这是因为链中核苷酸的小尺寸 ( 中心与中 心大约 4 埃 ) 以及其中相应的信噪比和信号分辨率的限制造成的。DNA 的固有的二级结构 使直接检测更加复杂, 它并不轻易地延伸成完美的线性多聚体。
     克服了高通量 DNA 测序空间分辨率问题的方法, 记载于已经公开的 PCT 申请 WO 2008/157696 和 WO 2009/055617 中。 WO 2008/157696 描述了通过展开进行测序的方法。 通 过模板指导合成, 产生包含核苷酸间连接臂、 报道基团以及可切割的核苷酸间键的子链。 随 后切割核苷酸间键, 从而产生长度大于靶核酸长度的寡聚体。较长的寡聚体能产生比较短 的靶核酸更好的检测分辨率。
     在相关方法中, WO 2009/055617 公开了这样一种方法, 在该方法中, 通过模板指导 合成, 产生包含报道基团的子链, 该报道基团编码小于靶核酸的全部基因组序列。 报道子含 量的减少, 导致比用更高的报道子含量的方法所获得的分辨率更好的分辨率。
     虽然 DNA 测序领域已取得重大进步, 但是该领域仍然需要新的改进的 DAN 测序方 法和 DNA 寡聚体的相关检测和呈递方法。本发明满足了这些需要并提供了其他相关优势。
     发明概述
     总的来说, 本发明公开了克服了现有高通量核酸测序技术表现出的空间分辨率、 呈递、 检测和相关难题的方法和相应的设备、 产物及试剂盒。在一实施方案中, 这是通过在 第一替代多聚体 ( 在本文称为 “Xpandomer” ) 上编码靶核酸的所有碱基序列信息或仅在 第二替代多聚体 ( 在本文中称为″ S-Xpandomer″ ) 上编码靶核酸的碱基序列信息的子集 来实现的。替代多聚体 ( 分别为 X 子链和 S-X 子链 ) 具有使得它们易于检测的延伸的长 度。通过 DNA 靶标的模板依赖性复制, 形成 Xpandomer 和 S-Xpandome, 在所述 Xpandomer 和 S-Xpandome 中, 顺序连接多个亚基 ( 在本文中分别称为 Xmer 和 S-Xmer)。这种合成保留了 靶核酸的原始遗传信息, 同时也提高了序列数据个体元件的线性分离。
     在一实施方案中, 公开了一种用于靶核酸测序的方法, 包括 a) 提供通过模板指 导合成所产生的 X 子链, 该子链包含偶联于序列中的多个亚基, 该序列对应于全部或部 分靶核酸的连续核苷酸序列, 其中个体亚基包含连接臂 (tether)、 至少一个探针或核碱 基 (nucleobase) 残基以及至少一个可选择性切割的键 b) 切割至少一个可选择性切割的 键, 产生长度比子链的多个亚基更长的 Xpandomer, 该 Xpandomer 包含连接臂和报道元件 (reporter element), 该报道元件用于解析序列中的遗传信息, 该序列对应于全部或部分靶核酸的连续核苷酸序列 ; c) 检测该 Xpandomer 的报道元件。
     制备和使用 Xpandomer 的具体实施方案和方法的实例较详细地披露于公开的 PCT WO2008/157696 中。
     在另一实施方案中, 提供了用于靶核酸测序的方法, 包括 :
     a) 提供通过模板指导合成所产生的 S-X 子链, 该子链包含偶联于序列中的多个亚 基, 该序列对应于全部或部分靶核酸的连续核苷酸序列, 其中个体亚基包含连接臂、 至少一 个探针和至少一个可选择性切割的键, 该至少一个探针包含 X 个核碱基残基 (X 是大于 1 的 正整数 ) 和至少一个报道构建体, 该报道构建体编码该探针的 Y 个核碱基残基的遗传信息 (Y 是小于 X 的正整数 ) ;
     b) 切 割 至 少 一 个 可 选 择 性 切 割 的 键, 产 生 长 度 比 S-X 子 链 的 多 个 亚 基 长 的 S-Xpandomer, 该 S-Xpandomer 包含连接臂和用于确定每 X 个核碱基中的 Y 个核碱基的报道 元件 ; 以及
     c) 检测至少一个报道构建体, 以使子链的每 X 个核碱基中的 Y 个核碱基的遗传信 息解码。
     因为 Y 小于 X, 因此仅检测靶核酸的一部分核苷酸碱基。例如, 且仅用于举例, 当X 是 4 且 Y 是 1 时, 检测报道构建体, 以确定子链的每 4 个核碱基中的 1 个核碱基。因为子链 包含偶联于序列中的多个亚基, 该序列对应于全部或部分靶核酸的连续核苷酸序列, 因此 确定了靶核酸的每 4 个核碱基中的 1 个核碱基。在许多情况下, 靶核酸的 “每 X 个核碱基中 的 Y 个核碱基” ( 例如, 每 4 个核碱基 (every 4 nucleobase) 或每 4 个核碱基 (every 4th nucleobase) 中的 1 个核碱基 ) 的检测, 对于测序目的而言, 是足够的。 可选地且如果需要, 可以使用利用多个探针构建体 ( 或探针构建体库 ) 的靶核酸的模板依赖性复制, 产生用于 检测的其他 S-Xpandomer, 从而以相似的方式鉴定剩余的交错靶核碱基。
     在上述方法的另一实施方案中, 通过模板指导滚环聚合方法, 产生靶核酸。
     在其他实施方案中, 模板指导合成包括连接反应。 例如, 连接反应可以包括酶促连 接反应。
     仍然在其他实施方案中, 至少一个报道构建体与以下相连 :
     S-Xpandomer 的连接臂 ;
     至少一可选择性切割的键切割前的 S-X 子链 ; 或
     至少一可选择性切割的键切割后的 S-Xpandomer。
     在其他实施方案中, 至少一个报道构建体在 S-X 子链模板指导合成后连接于所述 S-X 子链。
     在其他实施方案中, 连接臂在 S-X 子链模板指导合成后连接于所述 S-X 子链。
     在其他实施方案中, S-Xpandomer 还包含至少一个探针的全部或部分。例如, 在一 实施方案中, 至少一个报道构建体与至少一个探针相连。
     S-Xpandomer 包含偶联于序列的多个亚基, 该序列对应于全部或部分靶核酸的连 续核苷酸序列。因此, 在另一实施方案中, S-Xpandomer 包含以下结构 :
     其中
     T 表示连接臂 ;
     P1 表示第一探针部分 ;
     P2 表示第二探针部分 ;
     κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 3 的整数 ; 以及
     α 表示选自亚基基序文库的亚基基序的种类, 其中每个种类都包含部分靶核酸的 连续核苷酸序列的序列信息 ;
     其中
     T 表示连接臂 ;
     P1 表示第一探针部分 ;
     P2 表示第二探针部分 ;
     κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 3 的整数 ;
     α 表示选自亚基基序文库的亚基基序的种类, 其中每个种类都包含部分靶核酸的 连续核苷酸序列的序列信息 ; 以及
     χ 表示与相邻亚基的连接臂连接的键 ;
     其中
     T 表示连接臂 ;
     P1 表示第一探针部分 ;
     P2 表示第二探针部分 ;
     κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 3 的整数 ;
     α 表示选自亚基基序文库的亚基基序的种类, 其中每个种类都包含部分靶核酸的 连续核苷酸序列的序列信息 ; 以及
     χ 表示与相邻亚基的连接臂连接的键 ;
     其中 T 表示连接臂 ; P1 表示第一探针部分 ; P2 表示第二探针部分 ; κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 3 的整数 ;α 表示选自亚基基序文库的亚基基序的种类, 其中每个种类都包含部分靶核酸的 连续核苷酸序列的序列信息 ; 以及
     χ 表示与相邻亚基的连接臂连接的键 ;
     其中
     T 表示连接臂 ;
     κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 3 的整数 ;
     α 表示选自亚基基序文库的亚基基序的种类, 其中每个种类都包含部分靶核酸的 连续核苷酸序列的序列信息 ; 以及
     χ 表示与相邻亚基的连接臂连接的键 ;
     其中
     T 表示连接臂 ;
     N 表示核碱基残基 ;
     κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 10 的整数 ;
     α 表示选自亚基基序文库的亚基基序的种类, 其中每个种类都包含部分靶核酸的 连续核苷酸序列的序列信息 ; 以及
     χ 表示与相邻亚基的连接臂连接的键 ;
     其中
     T 表示连接臂 ;
     κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 10 的整数 ;
     α 表示选自亚基基序文库的亚基基序的种类, 其中每个种类都包含部分靶核酸的 连续核苷酸序列的序列信息 ; 以及
     χ 表示与相邻亚基的连接臂连接的键 ;
     其中 T 表示连接臂 ; N 表示核碱基残基 ;κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 10 的整数 ;
     α 表示选自亚基基序文库的亚基基序的种类, 其中每个种类都包含部分靶核酸的 连续核苷酸序列的序列信息 ; 以及
     χ 表示与相邻亚基的连接臂连接的键 ;
     其中
     T 表示连接臂 ;
     N 表示核碱基残基 ;
     κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 10 的整数 ;
     α 表示选自亚基基序文库的亚基基序的种类, 其中每个种类都包含部分靶核酸的 连续核苷酸序列的序列信息 ;
     χ1 表示与相邻亚基的连接臂连接的键 ; 以及 2
     χ 表示连接臂间的键 ; 或
     其中
     T 表示连接臂 ;
     n1 和 n2 分别表示核碱基残基的第一部分和第二部分 ;
     κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 10 的整数 ; 以及
     α 表示选自亚基基序文库的亚基基序的种类, 其中每个种类都包含部分靶核酸的 连续核苷酸序列的序列信息。
     在另一实施方案中, S-X 子链由多个具有以下结构的寡聚体底物构建体形成 :
     其中 T 表示连接臂 ; P1 表示第一探针部分 ; P2 表示第二探针部分 ; ~表示至少一个可选择性切割的键 ; 以及 1 2 R 和 R 表示用于子链模板指导合成的相同或不同的末端基团 ;
     其中 T 表示连接臂 ; P1 表示第一探针部分 ; P2 表示第二探针部分 ; R1 和 R2 表示用于子链模板指导合成的相同或不同的末端基团 ; ε 表示第一连接基团 ; δ 表示第二连接基团 ; 以及 ″……″表示可切割的连接臂内的交联 ;
     其中 T 表示连接臂 ; P1 表示第一探针部分 ; P2 表示第二探针部分 ; R1 和 R2 表示用于子链模板指导合成的相同或不同的末端基团 ; ε 表示第一连接基团 ; δ 表示第二连接基团 ; 以及 ″……″表示可切割的连接臂内的交联 ;
     其中 T 表示连接臂 ; P1 表示第一探针部分 ; P2 表示第二探针部分 ; ~表示至少一个可选择性切割的键 ; R1 和 R2 表示用于子链模板指导合成的相同或不同的末端基团 ; ε 表示第一连接基团 ; 以及 δ 表示第二连接基团 ;
     其中 T 表示连接臂 ; P1 表示第一探针部分 ; P2 表示第二探针部分 ; ~表示至少一个可选择性切割的键 ; R1 和 R2 表示用于子链模板指导合成的相同或不同的末端基团 ; ε 表示第一连接基团 ; 以及 δ 表示第二连接基团 ;
     其中 T 表示连接臂 ; N 表示核碱基残基 ; R1 和 R2 表示用于子链模板指导合成的相同或不同的末端基团 ; ε 表示第一连接基团 ; δ 表示第二连接基团 ; 以及 ″……″表示可切割的连接臂内的交联 ;
     其中 T 表示连接臂 ; N 表示核碱基残基 ; R1 和 R2 表示用于子链模板指导合成的相同或不同的末端基团 ; ~表示至少一个可选择性切割的键 ; ε 表示第一连接基团 ; δ 表示第二连接基团 ; 以及 ″……″表示可切割的连接臂内的交联 ;
     其中 T 表示连接臂 ; N 表示核碱基残基 ; R1 和 R2 表示用于子链模板指导合成的相同或不同的末端基团 ; ε 表示第一连接基团 ; δ 表示第二连接基团 ; 以及 ″……″表示可切割的连接臂内的交联 ;
     其中 T 表示连接臂 ; N 表示核碱基残基 ; R1 和 R2 表示用于子链模板指导合成的相同或不同的末端基团 ; ε1 和 ε2 表示相同或不同的第一连接基团 ; δ1 和 δ2 表示相同或不同的第二连接基团 ; 以及″……″表示可切割的连接臂内的交联 ; 或
     其中 T 表示连接臂 ; N 表示核碱基残基 ; V 表示核碱基残基的内部切割位点 ; 以及 1 2 R 和 R 表示用于子链模板指导合成的相同或不同的末端基团。 在某些其他实施方案中, R1 和 R2 选自羟基、 磷酸盐和三磷酸盐。 在其他另外的实施方案中, 靶核酸通过滚环聚合方法产生。 在另一实施方案中, 本公开的内容提供了用于靶核酸测序的方法, 所述方法包 a) 提供通过双向模板指导合成所产生的末端配对子链, 所述末端配对子链包含分26括:
     102365367 A CN 102365388说明书11/53 页别与引物区的第一和第二末端连接的第一和第二序列区, 每个序列区独立地包含偶联于序 列中的至少 10 个核碱基残基, 所述序列对应于全部或部分靶核酸的连续核苷酸序列 ;
     b) 利用末端配对子链作为分析物输入 (analyte input), 对第一和第二探针区中 每一个的至少 10 个核碱基残基进行测序, 以使靶核酸的遗传信息解码。
     在上述的其他实施方案中, 双向模板指导合成包括连接反应。 例如, 在一些实施方 案中, 连接反应是酶促连接反应。在其他实施方案中, 双向模板指导合成包括从引物区 3’ 末端开始的聚合酶反应。
     在其他实施方案中, 本公开的内容提供了用于靶核酸测序的方法, 所述方法包 括:
     a) 提供通过双向模板指导合成所产生的替代多聚体末端配对子链, 所述替代多聚 体末端配对子链具有分别与引物区的第一和第二末端连接的第一和第二探针区, 所述第一 和第二探针区包含偶联于序列中的多个替代多聚体底物, 所述序列对应于全部或部分靶核 酸的连续核苷酸序列, 其中, 个体替代多聚体底物包含连接臂、 至少一个探针以及至少一个 可选择性切割的键, 个体探针包含 X 个核碱基残基 (X 是大于 1 的正整数 ) 和编码 Y 个核碱 基残基 (Y 是至少为 1 且最大高达 X 的正整数 ) 的至少一个报道元件 ; b) 切割至少一个可选择性切割的键, 以产生长度比子链的多个替代多聚体底物长 的末端配对替代多聚体, 所述末端配对替代多聚体包含连接臂和用于确定每 X 个核碱基中 的 Y 个核碱基的报道元件 ; 以及
     c) 检测报道元件, 以确定末端配对子链的每 X 个核碱基中的 Y 个核碱基。
     在上述的其他实施方案中, 双向模板指导合成包括连接反应。 例如, 在一些实施方 案中, 连接反应是酶促连接反应。在其他实施方案中, 双向模板指导合成包括从引物区 3’ 末端开始的聚合酶反应。
     在其他实施方案中, 本公开的内容提供了产生末端配对核酸的方法, 所述末端配 对核酸包含分别与引物区的第一和第二末端连接的第一和第二区, 其中所述第一和第二区 独立地包含至少 4 个寡核苷酸, 所述方法包括 :
     a) 提供引物适配子, 其中所述引物适配子包含与引物互补或几乎互补的区域 ;
     b) 提供引物, 其中所述引物包含 5’ 磷酸盐末端和 3’ 羟基末端 ;
     c) 使引物与引物适配子双链体化 ; 以及
     d) 从 5’ 末端和 3’ 末端两端延伸引物, 其中延伸包括将至少 4 个寡核苷酸连接于 引物的 5’ 末端。
     在上述的其他实施方案中, 末端配对核酸是末端配对替代多聚体子链, 核苷酸或 寡核苷酸包含 Xprobe 或 S-Xprobe。在其他实施方案中, 引物适配子使靶核酸成圆形。仍然 在其他实施方案中, 引物适配子还包含连接臂, 其中所述连接臂任选地连接于固相基质。 仍 然在其他实施方案中, 连接包括酶促连接反应。 在其他实施方案中, 使引物延伸还包括从引 物的 3’ 末端开始的连接。仍然在其他实施方案中, 使引物延伸还包括从引物的 3’ 末端延 伸的聚合酶反应。
     在其他实施方案中, 本公开的内容提供了包含第一探针区和第二探针区的末端配 对替代多聚体, 所述第一和第二探针区分别与引物区的第一和第二末端连接, 所述第一和 第二探针区包含偶联于序列中的多个亚基, 所述序列对应于全部或部分靶核酸的连续核苷
     酸序列。在一些实施方案中, 末端配对替代多聚体通过上文所述的方法产生。在其他实施 方案中, 第一和第二探针区独立地包含 4 个或更多个探针。
     本公开的内容还提供了包含多个构建体 ( 即具有适当的 R1/R2 末端基团的 Xmer 或 S-Xmer) 的试剂盒, 用于通过模板指导合成形成替代多聚体子链, 其中所述试剂盒任选 地包含使用所述试剂盒形成替代多聚体子链的适当的说明书。在一些实施方案中, 所述试 剂盒包含 10 至 65000 个独特的成员。
     在其他实施方案中, 本公开的内容提供了读取替代多聚体的个体报道元件的方 法, 包括 :
     a) 提供替代多聚体, 其中所述替代多聚体包含一个或多个个体报道元件 ;
     b) 提供检测器构造体 (detector construct ; )
     b) 向检测器构造体呈递替代多聚体 ;
     c) 顺序读取个体报道元件, 以确定报道元件顺序 ; 以及
     d) 利用因此确定的报道顺序使替代多聚体的遗传信息解码。
     在上述的一些实施方案中, 检测器构造体包含第一和第二贮存器 (reservoir), 第 一和第二贮存器分别包含第一和第二电极, 其中所述第一和第二贮存器通过位于第一和第 二贮存器之间的纳米孔基质 (nanopore substrate) 而分离, 所述纳米孔基质包含至少一个 纳米孔通道 (nanopore channel), 并且读取个体报道元件包括使替代多聚体从第一贮存器 通过至少一个纳米孔通道转移到第二贮存器。 在其他实施方案中, 读取个体元件还包括, 当 替代多聚体通过纳米孔通道转移时, 检测纳米孔通道中的电阻变化。
     在其他实施方案中, 个体报道元件包含至少一种 FRET( 荧光共振能量转移 ) 供体 或受体, 且纳米孔通道包含至少一种 FRET 供体或受体荧光团, 只要当个体报道元件包含 FRET 供体时, 则纳米通道包含 FRET 受体, 并且当个体报道元件包含 FRET 受体时, 则纳米通 道包含 FRET 供体, 其读取个体报道元件还包括 :
     a) 当替代多聚体通过纳米孔通道转移时, 用光源激发供体荧光团 ; 以及
     b) 检测受体荧光团发射的荧光信号。
     在上述的其他实施方案中, 供体荧光团包含 1-4 个激发波长。
     在其他实施方案中, 检测器构造体包括位于纳米梳槽 (namocomb slot) 中或位于 其末端的具有至少一个检测器元件的纳米梳检测器阵列 (nanocomb detector array), 并 且读取个体报道元件包括, 使替代多聚体穿过纳米梳槽的末端。 在其他实施方案中, 纳米梳 检测器阵列还包括第一和第二电极, 且使替代多聚体在第一和第二电极间穿过。仍然在其 他实施方案中, 当替代多聚体在第一和第二电极间穿过时, 个体报道元件诱发电解液电流 变化。 仍然在其他实施方案中, 当替代多聚体在第一和第二电极间穿过时, 个体报道元件在 第一和第二电极间形成电流通路 (current path)。
     在其他另外的实施方案中, 将替代多聚体作为线性化阵列呈递于检测器构造体, , 其中线性化阵列包含基质 (substrate)。 在一些其他实施方案中, 读取个体报道元件包括电 子束显微镜检术, 其中电子束形成线。在其他实施方案中, 个体报道元件包含硼或纳米金。 在另一实施方案中, 基质包含用于改善信噪比的反差包被。
     在 上 述 的 其 他 另 外 的 实 施 方 案 中, 检测器构造体包括至少一个刀刃式电极 (knife-edge electrode), 个 体 报 道 元 件 包 含 导 电 聚 合 丝 (conductive polymericbristle), 且读取个体报道元件包括 :
     a) 在至少一个刀刃式电极和基质间施加电势 ; 以及
     b) 当替代多聚体在至少一个刀刃式电极下穿过时, 检测电流。
     在上述的一些其他实施方案中, 基质包含导电膜。 在一些实施方案中, 导电聚合丝 包含选自聚乙炔、 聚苯胺或聚吡咯的多聚体。
     在其他另外的实施方案中, 个体报道元件包含至少一种荧光团, 其中至少一种荧 光团包含至少一种光谱类型, 且读取个体报道元件包括 :
     a) 提供激发能量, 定位激发能量, 以便激发个体报道元件的至少一种荧光团 ; 以 及
     b) 检测至少一种荧光团所发射的荧光信号。
     在上述的一些实施方案中, 激发能量来自近场源, 所述近场源自切口 (slit) 出 现, 且读取个体报道元件进一步包括 :
     a) 平行于替代多聚体移动切口 ; 以及
     b) 检测个体报道元件中至少一种荧光团的荧光信号。
     例如, 在一些实施方案中, 在远场中检测荧光信号。
     在其他实施方案中, 本公开的内容提供了检测分析物的方法, 包括
     a) 提供至少一种分析物 ;
     b) 提供至少一种指示剂部分, 其中所述指示剂部分不与所述分析物相连 ;
     c) 提供检测器构造体, 其中所述检测器构造体包含第一和第二贮存器, 第一和第 二贮存器分别包含第一和第二电极, 其中所述第一和第二贮存器通过位于第一和第二贮存 器之间的纳米孔基质而分离 ;
     d) 向第一和第二电极提供电势, 其中电势足以使至少一种分析物和至少一种指示 剂部分通过至少一个纳米孔通道转移 ; 以及
     c) 当至少一种分析物通过至少一个纳米孔通道转移时, 检测至少一个纳米孔通道 处或附近的至少一种指示剂部分所发射的光信号变化。
     在一些实施方案中, 上述方法还包括提供激发波长, 其中所述激发波长足以从至 少一种指示剂部分诱发荧光信号。在其他实施方案中, 至少一种分析物是核酸。仍然在其 他实施方案中, 至少一种分析物是替代多聚体。 在有些其他实施方案中, 至少一个纳米孔包 括纳米孔阵列, 并且所述纳米孔阵列共享第一和第二贮存器。
     在其他实施方案中, 至少一种指示剂部分是荧光团, 第一贮存器相对于第二贮存 器包含高浓度的荧光团, 并且检测光信号变化还包括, 当荧光团通过至少一个纳米孔通道 转移时, 检测荧光信号的变化。 在一些实施方案中, 落射荧光显微镜检术用于检测荧光信号 的变化。在其他实施方案中, 锥光法 (conoscopy) 用于检测荧光信号的变化。在其他实施 方案中, 纳米孔基质包含封阻膜 (blocking film)。仍然在其他实施方案中, 荧光团是荧光 素。在一些其他实施方案中, 第二贮存器包含荧光淬灭剂, 并且检测光信号的变化还包括, 当荧光团或淬灭剂通过至少一个纳米孔通道转移时, 检测荧光信号的变化。 例如, 在一些实 施方案中, 淬灭剂选自 QSY7、 QSY9 以及自由基。
     在一些另外的实施方案中, 所述方法还包括提供两种指示剂部分, 其中, 第一指示 剂部分选自指示剂离子, 而第二指示剂部分选自荧光指示剂, 第一贮存器包含指示剂离子,第二贮存器包含荧光指示剂, 并且检测光信号的变化还包括, 检测当指示剂离子或指示剂 部分穿过至少一个纳米孔通道时所发射的荧光信号的变化。在一些其他实施方案中, 第二 贮存器还包含不发荧光的吸收剂。 仍然在其他实施方案中, 掩蔽纳米孔通道, 以产生直径为 约 1μm 的圆形开口, 其中所述开口与纳米孔通道同轴。在其他实施方案中, 指示剂离子选 自钙离子、 单线态氢离子 (singlet hydrogen ion)、 单线态氧离子 (singlet oxygen ion)、 钾离子、 锌离子、 镁离子、 氯离子以及钠离子。在一些实施方案中, 荧光指示剂选自 Fura-3、 Fluo-3、 Indo-1 以及 Fura Red。在其他实施方案中, 荧光指示剂是荧光淬灭剂。仍然在其 他实施方案中, 第一贮存器包含碘离子, 且第二贮存器包含荧光素。
     在一些另外的实施方案中, 所述方法还包括提供两种指示剂部分, 其中第一贮存 器包含第一指示剂部分, 且第二贮存器包含第二指示剂部分, 其中第一和第二指示剂部分 能结合, 以形成激发态的第三指示剂部分, 并且检测光信号的变化还包括, 当第三指示剂部 分松弛回到基态时, 检测发射的光子。
     在其他实施方案中, 提供了呈递至少一个替代多聚体用于检测的方法, 其中所述 方法包括
     a) 提供检测器构造体, 其中所述检测器构造体包括至少一个检测器元件 ;
     b) 提供至少一个替代多聚体, 其中所述至少一个替代多聚体包含一个或多个个体 报道元件 ; 以及
     c) 处理至少一个替代多聚体, 以获得所述一个或多个个体报道元件的统一的空间 和时间间隔。
     在其他实施方案中, 检测器构造体包括至少一个纳米孔通道。 例如, 在一些实施方 案中, 检测器构造体包括规则的纳米孔通道阵列。 在其他实施方案中, 处理至少一个替代多 聚体包括, 将至少一个替代多聚体的末端与具有至少一个结合位点的固相基质连接。仍然 在其他实施方案中, 处理至少一个替代多聚体包括, 使至少一个替代多聚体对齐排列在基 质表面上。
     在另一其他实施方案中, 处理至少一个替代多聚体包括, 将低分子量的带电荷的 线性多聚体连接于所述至少一个替代多聚体的末端。 例如, 在一实施方案中, 带电荷的线性 多聚体选自聚谷氨酸和聚磷酸盐。
     在另一其他实施方案中, 处理至少一个替代多聚体包括, 向至少一个纳米孔通道 施加电压, 其中所述电压高于期望的检测电压, 且当在纳米孔通道中检测到替代多聚体时, 将电压降低至期望的检测电压。 在上述的另一实施方案中, 操作电压, 使得一次仅有一个替 代多聚体可以占据至少一个纳米孔通道。
     仍然在另一其他实施方案中, 处理至少一个替代多聚体包括, 将障碍物 (stop) 连 接于至少一个替代多聚体的末端, 且在至少一个纳米孔通道中预装填至少一个替代多聚 体, 其中所述障碍物防止至少一个替代多聚体穿过至少一个纳米孔通道并防止多个替代多 聚体占据同一纳米孔通道。 在一些实施方案中, 障碍物选自大体积树枝状大分子和珠子, 例 如磁珠。
     在其他另外的实施方案中, 处理至少一个替代多聚体包括, 将线性铁氧体多聚体 连接于至少一个替代多聚体的末端, 并操作磁场和电场以获得一个或多个个体报道元件的 统一的空间和时间间隔。例如, 在一实施方案中, 操作磁场和电场, 使得一次仅有一个替代多聚体可以占据至少一个纳米孔通道。
     在另一其他实施方案中, 处理至少一个替代多聚体包括, 控制至少一个替代多聚 体向检测器构造体的流动。例如, 在一实施方案中, 控制至少一个替代多聚体的流动包括, 将替代多聚体连接于基质, 其中所述连接包括, 可寻址的可切割连接 ; 和选择性切割连接, 以便每单位时间从基质释放一个替代多聚体。在一实施方案中, 选择性切割可切割的连接 包括, 控制切割速率, 使得一次仅有一个替代多聚体可以占据至少一个检测器元件。 在一些 实施方案中, 连接选自光裂解连接、 热裂解连接、 电化学裂解连接。
     在其他实施方案中, 控制至少一个替代多聚体的流动包括 :
     a) 提供至少一个门控构造体, 其中至少一个门控构造体包括第一、 第二和第三电 极; 以及
     b) 操作独立施加于第一、 第二、 以及第三电极的电场, 以获得一个或多个个体报道 元件的统一的空间和时间间隔。
     在上述的其他实施方案中, 操作电场, 使得一次仅有一个替代多聚体可以占据至 少一个检测器元件。
     仍然在其他实施方案中, 控制至少一个替代多聚体的流动包括 :
     a) 提供至少一个门控构造体, 其中至少一个门控构造体包括第一和第二多孔电极 和门控元件, 其中所述第一和第二多孔电极分别固定于门控元件的第一和第二侧 ;
     b) 向所述第一和第二电极施加电场 ; 以及
     c) 通过门向至少一个检测器元件转运至少一个替代多聚体。
     在上述的其他实施方案中, 门控元件选自多孔膜和纳米孔。 在一些实施方案中, 操 作电场, 以获得一个或多个报道元件的统一的空间和时间间隔。在其他实施方案中, 操作 电场, 使得一次仅有一个替代多聚体可以占据至少一个检测器元件。在一些实施方案中, 门控元件是多孔膜。例如, 在一些实施方案中, 多孔膜包含直径为约 20nm 到约 100nm 的 孔。 在其他实施方案中, 多孔膜选自氧化铝和形成多聚体轨道的膜 (polymer track-formed membrane)。 在其他实施方案中, 提供了多元门控构造体 ( 即提供了多于一个门控构造体 )。
     在其他另外的实施方案中, 至少一个替代多聚体的流动包括, 提供至少一个选自 亲和凝胶或通道 ( 例如氧化铝 ) 的门控构造体, 且处理至少一个替代多聚体包括 :
     a) 将亲和拖拉标签 (drag tag) 连接于替代多聚体的末端 ; 以及
     b) 施加足以通过门控构造体向至少一个检测器元件转移替代多聚体的电场。
     在上述其他另外的实施方案中, 操作电场, 以获得一个或多个个体报道元件的统 一的空间和时间间隔。 仍然在其他实施方案中, 操作电场, 使得一次仅有一个替代多聚体可 以占据至少一个检测器元件。在一些实施方案中, 门控构造体是亲和凝胶。
     在其他另外的实施方案中, 固相基质具有均匀间隔的结合位点。在一些实施方案 中, 结合位点是大小为约 1μm 的斑点。在其他实施方案中, 最多为一个替代多聚体与每个 个体结合位点结合。在其他实施方案中, 替代多聚体还包含连接于替代多聚体末端的树枝 状大分子, 其中所述树枝状大分子在空间上阻止另一替代多聚体与同一结合位点的结合。 在其他实施方案中, 固相基质选自韧性聚对苯二甲酸乙二酯 (PET) 膜、 浮法玻璃 (float glass)、 硅晶片以及不锈钢。 还在其他实施方案中, 至少一个结合位点包括固相基质上的行 列 (line)。例如, 在一些实施方案中, 行列的宽度小于与其结合的替代多聚体之间的距离。在其他另外的实施方案中, 基质具有至少一个与其结合的替代多聚体, 使所述基 质从法线旋转 180 度, 到达施加的电场, 电场使至少一个替代多聚体以顺直且伸展的方向 平放在基质表面上。 在一些实施方案中, 还将至少一个替代多聚体以平放、 顺直且伸展的方 向连接于基质表面。 例如, 在一些实施方案中, 至少一个替代多聚体通过基质表面的紫外线 或化学激活连接于该基质表面。在其他实施方案中, 固相基质是韧性聚对苯二甲酸乙二酯 (PET) 膜。
     在其他实施方案中, 基质具有至少一个与其结合的替代多聚体, 使所述基质 穿过梳状构造体 (comb construct), 其中所述梳状构造体包括位于输入侧的拉伸电场 (stretching electric field)、 位于输出侧的固定电场 (pinning electric field) 以及 输入和输出侧之间的梳状元件 (comb element), 并且处理至少一个替代多聚体还包括使基 质在梳状物 (comb) 下穿过拉伸电场, 并穿过固定电场, 使得至少一个替代多聚体以顺直且 伸展的方向平放在基质表面上。 在一些实施方案中, 至少一个替代多聚体还以平放、 顺直且 伸展的方向连接于基质表面。 例如, 在一些实施方案中, 至少一个替代多聚体通过施加的电 场或通过基质表面的紫外线或化学激活而连接于该基质表面。
     在其他另外的实施方案中, 基质具有至少一个与其结合的替代多聚体, 使所述基 质在刷状构造体 (brush construct) 下穿过, 其中所述刷状构造体包括丝 (bristle), 所述 丝使得至少一个替代多聚体以顺直且伸展的方向平放在在基质表面上。在其他实施方案 中, 至少一个替代多聚体还以平放、 顺直且伸展的方向连接于基质表面。例如, 在一些实施 方案中, 至少一个替代多聚体通过施加的电场或通过基质表面的紫外线或化学激活而连接 于该基质表面。 在其他实施方案中, 丝的直径为约 10nm。 仍然在其他实施方案中, 丝包含多 聚体, 例如紫外线固化或热固化的多聚体 (thermal cured polymer)。
     在其他实施方案中, 基质包括闭环韧性膜, 并且处理至少一个替代多聚体还包括 连续过程, 所述过程包括 :
     a) 使基质旋转通过检测器构造体 ;
     b) 在穿过检测器元件后, 从基质表面除去至少一个替代多聚体 ;
     c) 再将另一个替代多聚体连接于基质表面 ;
     d) 和重复步骤 a 和 b, 直到所有替代多聚体都得到分析。
     在上述的另一实施方案中, 基质是韧性聚对苯二甲酸乙二酯 (PET) 膜。
     仍然在其他实施方案中, 处理至少一个替代多聚体包括将至少一个替代多聚体固 定于包含纳米孔通道的固相基质上, 其中将至少一个替代多聚体固定于固相基质包括, 将 障碍物连接于至少一个替代多聚体的末端, 且在至少一个纳米孔通道中预装填至少一个替 代多聚体, 其中障碍物防止至少一个替代多聚体穿过至少一个纳米孔通道并防止多个替代 多聚体占据同一纳米通道。 例如, 在一些实施方案中, 障碍物选自大体积树枝状大分子和珠 子。在其他实施方案中, 珠子是磁珠。
     本发明的这些和其他方面通过参考附图和下述详细描述, 会是显而易见的。 为此, 下文列出了各种参考文献, 其比较详细地描述了某些程序、 化合物和 / 或组合物, 并通过引 用在此整体并入。
     附图简要说明
     在附图中, 相同的附图标记表示相同的元件。在附图中不必按规定的比例绘制元件大小和相对位置, 并且为了使图易辨认, 这些元件中的一些元件是任意放大和定位的。 此 外, 所绘制的元件的具体形状并非意图反映该具体元件的实际形状的任何信息, 仅仅为在 图中易于识别而选择。
     图 1A 和 1B 表示核碱基间的有限分离, 必须解决这一问题, 以便确定核酸靶标中核 苷酸的顺序。
     图 2A 到 2D 示意性地说明可用于本发明中的底物的几个代表性结构。
     图 3A、 3B 与 3C 是表示由靶核酸合成 Xpandomer 的简化步骤的图表。
     图 4 表示滚环聚合。
     图 5A 和图 5B 分别表示制备末端配对替代多聚体的方法和制备用于准备末端配对 方法的靶寡聚体的方法。
     图 6 表示示例性的纳米孔检测技术。
     图 7 描述 4 个不同的报道子依次穿过纳米孔时的纳米孔反应。
     图 8 描绘纳米孔荧光检测技术。
     图 9 表示荧光素随时间扩散到无限大的反式贮存器中的模型数据。
     图 10 是表示示例性实施方案的图表, 其中随时间将荧光团转移限制为 5 级阻塞水 平。
     图 11 描绘离子指示剂检测方法。 图 12 表示淬火荧光检测方法。 图 13A 和 13B 表示纳米梳检测技术。 图 14A、 14B 和 14C 表示包括刀刃式电极和导电多聚体的检测方法。 图 15A、 15B 和 15C 表示呈递核酸多聚体用于检测的不同方法。 图 16 表示基质上的多孔阵列。 图 17A 和 17B 表示示例性呈递方法。 图 18A、 18B 和 18C 描绘示例性呈递方法。 图 19A、 19B 和 19C 描绘示例性呈递方法。 图 20A 到 20D 描绘示例性呈递方法。 图 21 描绘亲和拉伸呈递方法。 图 22A 到 22D 在基质表面对齐排列核酸多聚体的不同方法。图 22C 是梳状物的端视图。 图 23 表示典型的靶模板, 其与 16-mer HEX 修饰的引物双链体化, 并被设计成带有 20 个碱基的 5’ 悬突。
     图 24A 到 24D 是连接实验的凝胶。
     图 25 是连接实验的凝胶。
     发明的详细描述
     在以下描述中, 对某些具体细节进行了阐述, 以提供对各实施方案的深入理解。 然 而, 本领域技术人员应当理解, 本发明可以在没有这些细节的情况下实施。在其他情况中, 并未详细展示或详细描述已知的结构, 以避免对实施方案不必要的含糊的描述。除非本文 另作要求, 在整个说明书和下述权利要求书中, 词语 “包含 (comprise)” 及其变化, 例如, “包 含 (comprises)” 和 “包含 (comprising)” 以开放的、 包含在内的意义解释换句话说, 解释为
     “包括, 但不限于” 。此外, 本文所提供的标题只是为了方便表述而不是用于解释本发明要求 保护的范围或含义。
     整个说明书中提到 “一个实施方案” 或 “实施方案” 意指与所述实施方案相关的具 体特征、 结构或特性包括于至少一实施方案中。因此, 整个说明书在不同地方出现的短语 “在一实施方案中” 或 “在实施方案中” 并不一定都是指同一个实施方案。另外, 具体的特 征、 结构或特性可以在一个或更多实施方案中以任何适当的方式组合。 同样, 除非文中另有 明确说明, 如本说明书和附加的权利要求书中所用的, 单数形式 “一个 (a)” 、 “一个 (an)” 和 “这种 (the)” 包括复数个对象。同样需要注意的是, 除非文中另有明确说明, 术语 “或” 一 般以包括 “和 / 或” 的意思使用。
     定义
     除非文中另有明确说明, 本文所用的下列术语具有下文指定的意思。
     “SBX” 指通过展开测序。SBX 过程和方法在本文中有详细描述。
     “核碱基” 是杂环碱基, 例如腺嘌呤、 鸟嘌呤、 胞嘧啶、 胸腺嘧啶、 尿嘧啶、 次黄苷、 黄嘌呤、 次黄嘌呤, 或者它们的杂环衍生物、 类似物或互变异构体。核碱基可以是天然存在 的或合成的。核碱基的非限制性实例为腺嘌呤、 鸟嘌呤、 胸腺嘧啶、 胞嘧啶、 尿嘧啶、 黄嘌 呤、 次黄嘌呤、 8- 氮杂嘌呤 (8-azapurine)、 在第 8 位由甲基或溴取代的嘌呤、 9-O-N6- 甲 基腺嘌呤、 2- 氨基腺嘌呤、 7- 脱氮黄嘌呤、 7- 脱氮鸟嘌呤、 7- 脱氮腺嘌呤、 N4- 乙醇基胞 嘧啶、 2, 6- 二氨基嘌呤、 N6- 乙醇基 -2, 6- 二氨基嘌呤、 5- 甲基胞嘧啶、 5-(C3-C6)- 炔基 胞嘧啶、 5- 氟尿嘧啶、 5- 溴尿嘧啶、 硫尿嘧啶、 假异胞嘧啶、 2- 羟基 -5- 甲基 -4- 三唑吡 啶、 异胞嘧啶、 异鸟嘌呤、 次黄苷、 7, 8- 二甲基咯嗪、 6- 二氢胸腺嘧啶、 5, 6- 二氢尿嘧啶、 4- 甲基 - 吲哚、 亚乙烯基腺嘌呤, 以及美国专利第 5,432,272 号、 第 6,150,510 号和 PCT 申 请 WO 92/002258、 WO 93/10820、 WO 94/22892 和 WO 94/24144 以及 Fasman(“Practical Handbook of Biochemistry and Molecular Biology( 生物化学和分子生物学操作手 册 )” , pp.385-394, 1989, CRC Press, Boca Raton, LO) 中所述的非天然存在的核碱基, 在此 通过引用将其全部内容并入。
     “核碱基残基” 包括核苷酸、 核苷、 其片段, 以及具有结合互补核苷酸特性的相关分 子。脱氧核苷酸和核糖核苷酸, 以及它们的各种类似物, 也在本定义所考虑的范围内。核碱 基残基可以是寡聚体和探针的成员。除非文中另有说明, “核碱基” 和 “核碱基残基” 在本文 中可以交换使用, 并且通常是同义的。
     “多核苷酸” , 也称为核酸或核酸多聚体, 是核苷酸的共价连接系列。 DNA( 脱氧核糖 核酸 ) 和 RNA( 核糖核酸 ) 是生物学上存在的多核苷酸, 其中核苷酸残基通过磷酸二酯键连 接于具体的序列中。本文所用的术语 “多核苷酸” 或 “寡核苷酸” 包括任何具有核苷酸线性 主链的多聚体化合物, 包括本文所公开的替代多聚体。寡核苷酸, 也称为寡聚体, 通常是较 短的链式多核苷酸。
     正如本领域技术人员所理解的, “互补” 通常是指特定核苷酸双链体化形成标准的 Watson-Crick 碱基对。 然而, 本文所提到的互补也包括核苷酸类似物的碱基配对, 其包括但 不限于, 2’ - 脱氧次黄苷和 5- 硝基吲哚 -2’ - 脱氧核糖核苷, 它们能与 A、 T、 G 或 C 核苷酸 以及锁核酸进行广泛的碱基配对, 从而提高双链体的热稳定性。 本领域技术人员应当理解, 杂交严紧性是杂交所形成的双链配对或错配程度的决定因素。“核酸” 是多核苷酸或寡核苷酸。核酸分子可以是脱氧核糖核酸 (DNA)、 核糖核酸 (RNA) 或二者的结合。当作为测序靶标时, 核酸通常称为 “靶核酸” 或 “靶序列” 。核酸可以 是作为测序靶标的分子的混合物或库。
     “探针” 是短链核碱基残基, 一般指通常为单链且与核酸的靶序列互补的两个或多 个连续核碱基残基。如在 “底物成员” 和 “底物构建体 (susbstrate construct)” 中所示, 探针长度可达 20 个核碱基残基。探针可以包括任意结合的修饰的核碱基残基和修饰的核 碱基内键。探针主链可以通过多种类型的共价键连接在一起, 所述共价键包括但不限于, 酯键、 磷酸二酯键、 磷酰胺键、 磷酸酯键、 硫代磷酸酯键、 硫羟磷酸酯 (phosphorothiolate) 键、 氨键以及它们的任意组合。探针也可以具有 5’ 和 3’ 末端连接, 其包括但不限于以下部 分: 单磷酸盐、 三磷酸盐、 羟基、 氢、 酯、 醚、 乙二醇、 胺、 酰胺, 以及硫酯。
     “选择性杂交” 指特异性的互补结合。多核苷酸、 寡核苷酸、 探针、 核碱基残基及其 片段, 在使非特异性结合最小化的杂交和洗涤条件下, 与靶核酸链选择性杂交。 正如本领域 已知的, 高严紧条件可用于实现利于完美配对的选择性杂交条件。 可以改变杂交的条件, 如 盐浓度、 温度、 去垢剂、 PEG 以及诸如甜菜碱的 GC 中和剂, 来提高杂交的严紧性, 即对于 C 与 G 碱基对、 A 与 T 或 U 碱基对沿连续的双链核酸精确配对的需要。
     “模板指导合成” 、 “模板指导组装” 、 “模板指导杂交” 、 “模板指导结合” 和任何其他 模板指导方法, 是指核碱基残基或探针选择性结合于互补的靶核酸, 并且并入到新生的子 链中的方法。通过模板指导合成所产生的子链与作为其合成来源的单链靶标是互补的。应 当注意的是, 如果子链序列已知, 靶链的相应序列可以由它的子链序列推断。 “模板指导聚 合” 和 “模板指导连接” 是模板指导合成的特殊情况, 据此, 所得的子链分别是聚合的或连接 的。
     “子链” 表示由模板指导合成所产生的链, 该链与合成它的单链靶标互补。子链包 括本文所定义的 X 子链和 S-X 子链, 以及其他核酸的子链。
     “末端配对子链 “表示由双向合成所产生的子链。末端配对子链包含与引物的第 一和第二末端连接的第一和第二序列区。 第一和第二序列区独立地包含编码靶核酸的遗传 信息的核碱基残基。通常, 第一和第二序列区独立地包含 10 个或更多个可解码的核碱基残 基, 但是具有第一和第二区的末端配对子链也包括于 “末端配对子链” 的定义内, 所述第一 和第二区包含少于 10 个可解码的核碱基残基。末端配对子链包括本文所定义的末端配对 X 子链和末端配对 S-X 子链, 以及其他核酸的末端配对子链。
     “序列区” 表示包含偶联于序列中的核碱基残基的核酸 ( 替代多聚体或其他 ) 区 域, 所述序列对应于全部或部分靶核酸的连续核苷酸序列。
     在指示剂部分不与分析物相连的环境中, “不与……相连” 表示所述指示剂部分不 与分析物结合 ( 如共价键或氢键等 ) 或不以其他方式缀合。
     “指示剂部分” 表示例如化学分子的部分, 其可以在具体测定条件下得到检测。指 示剂部分的非限制实例包括 : 荧光团、 化学发光分子和能在另一分子中诱导荧光或化学发 光的任何分子。
     “分析核酸 (Analyte nucleic acid)” 为分析和 / 或检测目标的核酸。分析核酸 包括替代多聚体以及其他核酸。
     “引物” 表示用作子链的模板指导合成模板的核酸链。“引物适配子” 表示用作产生引物的模板的核酸链。
     “连续的” 表示序列连续而无中断或遗失的核碱基。认为模板链核苷酸的连续序列 与子链的连续序列互补。
     “底物” 或 “底物成员” 对靶模板具有结合特异性的寡聚体、 探针或核碱基残基。底 物通常与连接臂结合, 以形成底物构建体。 形成子链一级主链的底物构建体的底物, 也是子 链的底物或底物成员。
     “底物构建体” 是用于子链的模板指导合成的试剂, 并且通常以文库的形式提供。 底物构建体通常含有与靶模板和可以结合连接臂的连接臂成员或连接臂连接位点互补结 合的底物成员。底物构建体以适于本发明的各种形式提供。底物构建体包括 “寡聚底物构 建体” ( 也称为 “探针底物构建体” )和 “单体底物构建体” ( 也称为 “核碱基底物构建体” )。
     “亚基基序” 或 “基序” 指多聚体主链的重复亚基, 该亚基具有重复亚基的所有形式 的特性, 但也具有编码遗传信息的物种特异性元件。根据每个基序中基本互补序列结合核 碱基元件的可能组合的数量, 互补核碱基残基的基序在底物构建体文库中有所体现。如果 核碱基结合元件为四种 ( 例如 A、 C、 G 和 T), 则四种元件组合的可能基序的数量是 4x, 其中 x 是基序中核碱基残基的数量。然而, 基于简并配对碱基的其他基序, 经尿嘧啶取代核糖核 残基或其他核碱基残基组中的胸腺嘧啶, 可以导致荷载基序的底物构建体 (motif-bearing substrate constructs) 的更大文库 ( 或更小的文库 )。基序也可以由物种特异性报道构 建体代表, 例如构成报道连接臂的报道子。通常在识别具体底物种类的报道构建体基序和 基序的结合互补性和特异性之间存在一对一的相关性。
     “Xpandomer 中间体” 或 “S-Xpandomer 中间体” 是由底物构建体组装而来的中间产 物 ( 本文也分别称为 “X 子链” 或 S-X 子链 ), 是使用靶核酸模板通过底物构建体的模板指 导组装而形成的。 任选地, 相邻底物构建体之间可以形成其他连接, 其可以包括底物的聚合 或连接, 连接臂与连接臂的连接或连接臂与底物的连接。Xpandomer 中间体或 S-Xpandomer 中间体含有两种结构 ; 即, 受约束的 Xpandomer 或 S-Xpandomer 和一级主链。受约束的 Xpandomer 或 S-Xpandomer 包含子链中所有的连接臂, 但可以包含本方法所需的所有底物、 部分底物或没有底物。 一级主链包含所有的相邻底物。 在一级主链片段化或解离的工序中, 受约束的 Xpandomer 或 S-Xpandomer 不再被约束, 并且是由于连接臂的展开而得以延伸的 Xpandomer 或 S-Xpandomer 产物。 “双链子链 (duplex daughter strand)” 是指与靶模板杂 交或进行双链体化的 Xpandomer 中间体或 S-Xpandomer 中间体。
     “一级主链” 是指子链底物的连续主链或成段主链。通常遇到的一级主链是天然多 核苷酸的 5’ -3’ 磷酸二酯核糖主链。然而, 子链的一级主链可以含有核苷碱基类似物和寡 聚体的类似物, 它们不通过磷酸二酯键连接或者不通过磷酸二酯键与其他主链键的混合连 接, 其他主链键包括但不限于以下连接 : 硫代磷酸酯、 硫羟磷酸酯、 磷酸酯、 氨基磷酸酯和包 括膦酰 -PNA、 丝氨酸 -PNA、 羟脯氨酸 -PNA 的肽核酸 “PNA” 主链键, 以及它们的组合。当子 链采用双链体形式 ( 例如, 双链子链 ), 并且底物在亚基间不是共价连接时, 底物仍然是连 续的并且形成子链的一级主链。
     “受 约 束 的 Xpandomer”或 “受 约 束 的 S-Xpandomer”是 展 开 前 的 构 型 中 的 Xpandomer 或 S-Xpandomer。该受约束的 Xpandomer 或 S-Xpandomer 包含子链的所有连接 臂成员。它是通过每个连接于一级主链上的连接臂的至少一个键或连接而被限制展开。在展开过程中, 子链的一级主链成为片段化或解离, 将受约束的 Xpandomer 或 S-Xpandomer 分 别转化为 Xpandomer 或 S-Xpandomer。
     “受约束的 Xpandomer 主链” 或 “受约束的 S-Xpandomer 主链”分别指受约束的 Xpandomer 或受约束的 S-Xpandomer 的主链。它是在子链形成中与一级主链一起共组装的 合成的共价主链。在一些情况中, 两种主链可以不是离散的但是在它们组成中都可以具有 相同的底物或部分底物。受约束的 Xpandomer 或受约束的 S-Xpandomer 主链总是包含连接 臂, 而一级主链不包含连接臂成员。
     “Xpandomer” 或 “Xpandomer 产物” 是由受约束的 Xpandomer 展开而产生的合成 的分子构建体, 所述受约束的 Xpandomer 自身是由底物构建体的模板指导组装而合成的。 Xpandomer 相对于产生它的靶模板而延伸。它由串联的亚基组成, 每个亚基由基序组成, 每 个基序由文库成员组成, 包含序列信息、 连接臂和任选地部分或全部底物, 所有这些都来自 于形成的底物构建体。将 Xpandomer 设计成为展开至比靶模板更长, 从而沿着其长度降低 靶模板序列信息的线性密度。Xpandomer 包含报道构建体, 所述报道构建体包含 Xpandomer 的所有序列信息。此外, Xpandomer 任选地提供用于提高报道子的大小和丰度的平台, 该平 台可依次提高检测的信噪比。更低的线性信息密度和更强的信号可提高分辨率, 并降低检 测和解码模板链序列的灵敏度要求。
     “S-Xpandomer”或 “S-Xpandomer 产物”与上文所定义的 Xpandomer 相似, 除了 S-Xpanomer 或 S-Xpandomer 产物包含报道构建体, 所述报道构建体仅包含 S-Xpandomer 的 部分序列信息。报道子含量的减少, 允许降低分辨率要求。
     术语 “替代多聚体” 指 Xpandomer 和 S-Xpandomer 两者。
     术语 “替代多聚体子链” 或 “替代子链” 指 X 子链和 S-X 子链两者。
     “可选择性切割的键” 是指在受控条件下可以断裂的键, 所述受控条件诸如例如用 于选择性切割以下键的条件 : 硫羟磷酸酯键、 光裂解键 (photocleavable bond)、 磷酰胺键、 3’ -O-B-D- 呋喃核糖 -2’ 键、 硫醚键、 硒醚键 (selenoether bond)、 亚砜键、 二硫键、 脱氧核 糖 -5’ -3’ 磷酸二酯键或核糖 -5’ -3’ 磷酸二酯键, 以及本领域所知的其他可切割键。可选 择性切割的键可以是连接臂内的键或在探针或核碱基残基之间或之内的键, 或可以是探针 和模板链杂交所形成的键。 可选择性切割的键不限于共价键, 并且可以是非共价键或缔合, 例如那些基于氢键、 疏水键、 离子键、 π 键成环堆积相互作用、 范德华相互作用等的键。
     “部分 (moiety)” 是指某物所分成的二部分或更多部分中的一个, 例如, 连接臂、 分 子或探针的各部分。
     “连接臂” 或 “连接臂成员” 是指通常具有线性尺度并在两个相反末端中的每一末 端都带有末端部分的多聚体或分子构建体。连接臂通过与至少一个末端部分的连接, 连接 于底物上, 从而形成底物构建体。连接臂的末端部分可以连接到底物的可切割的连接或可 切割的连接臂内连接上, 该连接臂内连接用于将连接臂约束在 “受约束的构型” 中。子链合 成后, 每个末端部分都具有与其他连接臂直接或间接偶联的末端连接。偶联的连接臂包含 受约束的 Xpandomer 或 S-Xpandomer, 受约束的 Xpandomer 或 S-Xpandomer 还包含子链。连 接臂具有 “受约束的构型” 和 “展开的构型” 。受约束的构型存在于底物构建体和子链中。连 接臂的受约束的构型是展开的构型的前体, 与在 Xpandomer 产物和 S-Xpandomer 产物中发 现的一样。 从受约束的构型向展开的构型的转变, 导致切割可选择性切割的键, 该键可以在子链一级主链之内或为连接臂内连接。受约束的构型的连接臂也用于 “一级主链” 组装后 添加连接臂形成子链。 连接臂沿其长度可以任选地包含可以编码底物序列信息的一个或多 个报道元件或报道构建体。连接臂提供了展开 Xpandomer 或 S-Xpandomer 的长度并从而降 低序列信息线性密度的方法。
     “连接臂构建体” 是连接臂或连接臂前体, 由一个或多个连接臂片断或其他用于组 装连接臂的结构成分组成, 例如报道构建体, 或报道子前体, 包括多聚体、 嫁接共聚物、 嵌段 共聚物、 亲和配体、 寡聚体、 半抗原、 适配子、 树枝状大分子、 连接基团或亲和结合基团 ( 例 如, 生物素 )。
     “连接臂元件” 或 “连接臂片段” 是具有带两个末端的一般线性尺度的多聚体, 其中 所述末端形成连接连接臂元件的末端连接。连接臂元件可以是连接臂构建体的片段。此类 多聚体可以包括, 但不限于 : 聚乙二醇 (polyethylene glycol)、 聚乙二醇 (polyglycol)、 聚嘧啶、 聚异腈 (polyisocyanide)、 聚异氰酸酯、 聚 ( 三芳甲基 ) 甲基丙烯酸酯、 聚醛、 聚 吡咯啉酮 (polypyrrolinone)、 聚脲、 聚乙二醇磷酸二酯、 聚丙烯酸酯、 聚甲基丙烯酸酯、 聚 丙烯酰胺、 聚乙烯酯、 聚苯乙烯、 聚酰胺、 聚亚安酯、 聚碳酸酯、 聚丁酸酯、 聚丁二烯、 聚丁内 酯、 聚吡咯啉二酮 (polypyrrolidinone)、 聚乙烯磷酸酯、 聚乙酰胺、 多糖、 聚透明质酸酯、 聚 酰胺、 聚酰亚胺、 聚酯、 聚乙烯、 聚丙烯、 聚苯乙烯、 聚碳酸酯、 聚对苯二甲酸酯、 聚硅烷、 聚氨 酯、 聚醚、 聚氨基酸、 聚甘氨酸、 聚脯氨酸、 氮代聚赖氨酸、 多肽、 侧链氮代肽、 多氮代甘氨酸、 类肽 (peptoid)、 侧链羧代肽、 同源肽 (homopeptide)、 寡核苷酸、 核糖核酸寡核苷酸、 脱氧 核酸寡核苷酸、 经修饰而防止 Watson-Crick 碱基配对的寡核苷酸、 寡核苷酸类似物、 聚胞 嘧啶核苷酸、 聚腺苷酸、 聚尿苷酸、 聚胸苷、 聚磷酸盐、 多核苷酸、 多核糖核苷酸、 聚乙二醇磷 酸二酯、 肽多核苷酸类似物、 苏氨酰基 (threosyl)- 多核苷酸类似物、 乙二醇 - 多核苷酸类 似物、 吗啉代多核苷酸类似物、 锁核苷酸寡聚体类似物, 多肽类似物, 支化多聚体, 梳型多聚 体, 星形多聚体, 枝状多聚体、 随机的、 倾斜的和嵌段共聚物、 阴离子多聚体、 阳离子多聚体、 形成茎环、 刚性片段与柔性片段的多聚体。
     “肽核酸” 或 “PNA” 是指具有适合与核酸杂交的核碱基残基的核酸类似物, 但带有 包含氨基酸或其衍生物或类似物的主链。
     “膦酰肽核酸” 或 “pPNA” 是指主链包含氨基酸类似物的肽核酸, 例如 N-(2- 羟乙 基 ) 膦酰基甘氨酸或 N-(2- 氨乙基 ) 膦酰基甘氨酸, 并且核碱基单位之间是通过膦酰酯键 或膦酰氨键连接的。
     “丝氨酸核酸” 或 “SerNA” 是指主链包含丝氨酸残基的肽核酸。此类残基可以通过 酰胺键或酯键连接。
     “羟脯氨酸核酸” 或 “HypNA” 是指主链包含 4- 羟脯氨酸残基的肽核酸。此类残基 可以通过酰胺键或酯键连接。
     “报道元件” 是信号元件、 分子复合物、 化合物、 分子或原子, 其也由相关的 “报道 子检测特性” 构成。报道元件包括但不限于, FRET 共振供体或受体、 染料、 量子点、 珠子、 树枝状大分子、 上转换荧光团、 磁粒、 电子散射体 ( 例如, 硼 )、 大分子 (mass)、 金珠、 磁力共 振、 可离子化基团、 极性基团、 疏水基团。除此之外其他报道元件是荧光标签, 例如但不限 于, 溴化乙锭、 SYBR Green、 Texas Red、 吖啶橙、 芘、 4- 硝基 -1, 8- 萘二甲酰亚氨、 TOTO-1、 YOYO-1、 氰蓝 3(Cy3)、 氰蓝 5(Cy5)、 藻红素、 藻青素、 别藻蓝素、 FITC、 若丹明、 5(6)- 羧基荧光素、 荧光蛋白、 DOXYL(N- 烃氧基 -4, 4- 二甲基唑烷 )、 PROXYL(N- 烃氧基 -2, 2, 5, 5- 四甲 基吡咯烷 )、 TEMPO(N- 烃氧基 -2, 2, 6, 6- 四甲基哌啶 )、 二硝基苯基、 吖啶、 香豆素、 Cy3 和 Cy5(Biological Detection Systems, Inc.)、 erytrosine、 香豆酸、 伞形酮、 德克萨斯红若 丹明 (texas red rhodaine)、 四甲基若丹明、 Rox、 7- 硝基苯 -1- 乙二酸 -1- 二唑 (NBD)、 恶 33 3 14 35 125 32 131 唑、 噻唑、 芘、 荧光素或镧 ; 还有放射性同位素 ( 例如 P、 H、 C、 S、 I、 P 或 I)、 溴乙非 啶、 铕、 钌和钐或其他放射性同位素 ; 或大分子标签 (mass tag), 例如, C5 位修饰的嘧啶或 N7 位修饰的嘌呤, 其中大分子修饰基团可以是, 例如, 卤素、 醚或聚醚、 烷基、 酯或聚酯, 或一 般类型的 XR, 其中 X 是连接基团而 R 是大分子修饰基团、 化学发光标记物、 自旋标记物、 酶 ( 例如过氧化物酶、 碱性磷酸酶、 β- 半乳糖苷酶和氧化酶 )、 抗体片段和亲和配体 ( 例如寡 聚体、 半抗原和适配子 )。报道元件和连接臂的连接可以是共价的或非共价的, 直接的或间 接的。典型的共价连接包括有连接物或无连接物的键。包括与连接臂主链或连接臂成键元 件例如树枝状大分子或侧链的键。典型的非共价键包括氢键、 疏水键、 离子键、 π 键成环堆 积、 范德华相互作用等。 配体例如通过与报道元件上结合位点的特异性亲和结合而连接。 直 接的连接可以发生于连接臂合成时、 连接臂合成后以及 Xpandomer 合成之前或之后。
     “报道子” 或 “报道构建体” 由一个或多个报道元件构成。报道子包括称为 “标签” 或 “标记物” 的东西。Xpandomer 或 S-Xpandomer 的探针或核碱基残基可以认为是报道子。 报道子用于解析靶核酸的遗传信息。
     “报道构建体” 包含一个或多个能产生可检测信号的报道子, 其中可检测信号通常 含有序列信息。该信号信息被称为 “报道密码” , 并且随后被解码为遗传序列数据。报道构 建体也可以包含连接臂片段或其他结构成分, 包括多聚体、 嫁接共聚物、 嵌段共聚物、 亲和 配体、 寡聚体、 半抗原、 适配子、 树枝状大分子、 连接基团或亲和结合基团 ( 例如, 生物素 )。
     称为 “信号” 的 “报道子检测特性” 描述了所有可能的可测量或可检测的元件、 特 性或特征, 用于将报道子的遗传序列信息直接或间接传达给测量设备。 这些包括但不限于, 荧光、 多波长荧光、 发射光谱荧光猝灭、 FRET、 发射率、 吸光度、 反射系数、 染料发射、 量子粒 发射、 珠子成像、 分子复合物成像、 磁化率、 电子散射、 离子量、 磁性共振、 分子复合物尺寸、 分子复合物阻抗、 分子电荷、 感应偶极子、 阻抗、 分子量、 量子状态、 电荷容量、 磁自旋状态、 诱导极性、 核衰减、 共振或互补性。
     “报道密码” 是来自报道构建体的检测信号的遗传信息。将报道密码解码, 来提供 序列特异的遗传信息数据。
     “Xprobe” 或 S-Xprobe” 是可展开的寡聚底物构建体。每个 Xprobe 或 S-Xprobe 具有探针成员和连接臂成员。连接臂成员通常具有一个或多个报道构建体。带有 5’ -单 磷酸盐修饰的 Xprobe 或 S-Xprobe 适合通过基于酶促连接的方法, 分别用于 Xpandomer 或 S-Xpandomer 的合成。带有 5’ 和 3’ 连接物修饰的 Xprobe 或 S-Xprobe 适合通过基于化学 连接的方法, 分别用于 Xpandomer 或 S-Xpandomer 的合成。
     “Xmer” 或 “S-Xmer” 是可展开的寡聚底物构建体。每个 Xmer 或 S-Xmer 具有寡聚 底物成员和连接臂成员, 连接臂成员通常有一个或多个报道构建体。 Xmer 和 S-Xmer 可以是 5’ - 三磷酸盐, 适合通过基于聚合酶的方法用于分别合成 Xpandomer 和 S-Xpandomer。
     “RT-NTP” 是可展开的、 5’ - 三磷酸盐修饰的核苷酸底物构建体 (“单体底物” ), 其 与模板依赖性酶促聚合相适应。RT-NTP 具有修饰的脱氧核糖核酸三磷酸 (“DNTP” )、 核糖核酸三磷酸 (“RNTP” ) 或功能等同的底物类似物, 这些统称为三磷酸核苷底物 (“NTPS” )。 RT-NTP 具有两个独特的功能组分 ; 即, 核碱基 5’ - 三磷酸和连接臂或连接臂前体。子链形 成后, 连接臂在允许 RT 受控展开的位置连接于每个核苷酸之间。在 RT-NTP 的一种类型中 ( 例如, IX 类 ), 连接臂在 RT-NTP 聚合后连接。在一些情况中, RT-NTP 具有可逆的末端障碍 物和可选择性地直接交联到相邻连接臂上的连接臂。 每个连接臂可以由特异性识别核苷酸 的报道子来特异性编码, 该核苷酸被连接臂连接。
     “XNTP” 是适于模板依赖性酶促聚合的、 可展开的、 5’ - 三磷酸盐修饰的核苷酸底 物。XNTP 有两个独特的功能组分 ; 即, 核碱基 5’ - 三磷酸盐和连接臂或连接臂前体, 该连接 臂或连接臂前体在通过核苷酸内切割而允许 RT 受控展开的位置连接到每个核苷酸内。
     “进行性的 (processive)” 是指通常是连续的并且定向进行的底物偶联过程。尽 管不受理论的限制, 但例如, 如果将底物不间断的增量添加到新生子链中, 则连接酶和聚合 酶就都呈现进行性工作状态。如果纯粹的效果是新生子链进行性增长, 那么杂交和连接或 杂交和聚合的步骤都不视为独立的步骤。一些而不是所有的引物依赖性过程是进行性的。
     “混合的” 是指在模板的多个位点同时发生的、 不是引物依赖性的并且表示从多于 一个起点平行 ( 同时 ) 发生链的延伸的底物偶联过程。
     “单碱基延伸” 是指一个接一个地添加单体底物的循环逐步的过程。通常, 通过使 用可逆的封闭基团, 禁止偶联反应在任一步骤中进行除单底物延伸外的行动。
     “单探针延伸” 是指一个接一个地添加寡聚底物的循环逐步的过程。通常, 通过使 用可逆的封闭基团, 禁止偶联反应在任一步骤中进行除单底物延伸外的行动。
     本文所用的 “对应于” 或 “相应的” 涉及互补于并因而 “对应于” 全部或部分靶核酸 序列的探针、 寡核苷酸、 寡核苷酸类似物或子链的连续单链序列。 探针的互补序列可以说是 对应于其靶标。除非另有说明, 探针的互补序列和靶标的互补序列都分别是连续的序列。
     “核酸酶抗性” 指在 DNA 或 RNA 磷酸二酯键通常能被切割的条件下对核酸酶有抵抗 力的键。核酸酶包括但不限于, DNA 酶 I、 外切核酸酶 III、 绿豆核酸酶、 RNA 酶 I 和 RNA 酶 H。本领域技术人员可以很容易地评定给定键的相对核酸酶抗性。
     “连接酶” 是通常用于连接 3’ -OH、 5’ - 单磷酸核苷酸、 寡聚体及其类似物的酶。连 + 接酶包括但不限于, 包括 tRNA 连接酶在内的 NAD - 依赖性连接酶、 Taq DNA 连接酶、 丝状栖 热菌 (Thermus filiformis)DNA 连接酶、 大肠杆菌 (Escherichia coli)DNA 连接酶、 Tth DNA 连接酶、 水管致黑栖热菌 (Thermus scotoductus)DNA 连接酶、 热稳定连接酶、 Ampligase 热 稳定 DNA 连接酶、 VanC- 型连接酶、 9° N DNA 连接酶、 Tsp DNA 连接酶, 以及用生物勘测方法 所发现的新的连接酶。连接酶还包括但不限于, 包括 T4 RNA 连接酶在内的 ATP 依赖性连接 酶、 T4 DNA 连接酶、 T7 DNA 连接酶、 Pfu DNA 连接酶、 DNA 连接酶 I、 DNA 连接酶 III、 DNA 连 接酶 IV, 以及用生物勘测方法所发现的新的连接酶。 这些连接酶包括野生型、 突变同工型和 基因工程变体。
     “聚合酶” 是通常用于连接 3’ -OH、 5’ - 三磷酸核苷酸、 寡聚体以及其类似物的酶。 聚合酶包括但不限于, DNA 依赖性 DNA 聚合酶、 DNA 依赖性 RNA 聚合酶、 RNA 依赖性 DNA 聚 合酶、 RNA 依赖性 RNA 聚合酶、 T7 DNA 聚合酶、 T3 DNA 聚合酶、 T4 DNA 聚合酶、 T7 RNA 聚合 酶、 T3 RNA 聚合酶、 SP6 RNA 聚合酶、 DNA 聚合酶 I、 Klenow 片段、 水生栖热菌 (Thermophilus aquaticus)DNA 聚 合 酶、 Tth DNA 聚 合 酶、 VentR DNA 聚 合 酶 (New England Biolabs)、Deep VentRDNA 聚合酶 (New England Biolabs)、 Bst DNA 聚合酶大片段、 Stoeffel 片段、9° N DNA 聚合酶、 9° N DNA 聚合酶、 Pfu DNA 聚合酶、 Tfl DNA 聚合酶、 Tth DNA 聚合酶、 RepliPHI Phi29 聚合酶、 Tli DNA 聚合酶、 真核 DNA 聚合酶 β、 端粒酶、 TherminatorTM 聚合 酶 (New England Biolabs)、 KOD HiFiTM DNA 聚合酶 (Novagen)、 KOD1 DNA 聚合酶、 Q-β 复 制酶、 末端转移酶、 AMV 反转录酶、 M-MLV 反转录酶、 Phi6 反转录酶、 HIV-1 反转录酶、 用生物 勘测方法所发现的新的聚合酶, 以及 US 2007/0048748、 US 6,329,178、 US 6,602,695 和 US 6,395,524( 通过引用并入 ) 所列举的聚合酶。这些聚合酶包括野生型、 突变同工型和基因 工程变体。
     “编码” 或 “解析” 是指将一种形式转换成另一种形式的动词, 并指将靶模板碱基序 列的遗传信息转换成报道子的排列。
     “非遗传的” 是指在子链中的非一级主链部分的任何结构 ; 例如, 非遗传的报道子 不是位于一级主链中的核碱基本身。
     “异共聚物” 是将不同的单位 ( 例如, 单体亚基种类 ) 联合成 “共聚物” 的链而形成 的物质。异共聚物由离散的 “亚基” 构建体制备。 “亚基” 是由定义明确的基序组成的多聚体 的区域, 其中每个基序是一个种类并且携带遗传信息。本文也使用术语异共聚物描述所有 模块是由重复基序构建的模块的多聚体, 每个基序具有物种特异性元件。 子链和 Xpandomer 都是异共聚物, 据此, 每个亚基基序编码靶模板序列的一个或多个碱基并且整个靶序列通 过基序序列进一步限定。 “固相支持体” 或 “固相基质” 是具有用于附着分子、 化合物、 细胞或其他实体的表 面的固体物质。固相支持体的表面可以是平整的或不平整的。固相支持体可以是多孔的或 无孔的。固相支持体可以是包含表面的芯片或阵列, 且可以包含玻璃、 硅、 尼龙、 多聚体、 塑 胶、 陶瓷或金属。固相支持体也可以是膜或平板或器皿, 所述膜例如尼龙、 硝化纤维或高分 子膜, 并且可以由玻璃、 陶瓷、 金属或塑胶组成, 例如聚苯乙烯、 聚丙烯、 聚碳酸酯或异质同 晶聚合物。固相支持体也可以是任何形状的珠子、 树脂或颗粒。这些颗粒或珠子可以由任 何合适的物质例如玻璃或陶瓷, 和 / 或一种或多种多聚体组成, 该多聚体例如尼龙、 聚四氟 TM 乙烯、 TEFLON 、 聚苯乙烯、 聚丙烯酰胺、 琼脂糖凝胶 (sepaharose)、 琼脂糖、 纤维素、 纤维素 衍生物或葡聚糖, 和 / 或可以包含金属, 尤其是顺磁性金属例如铁。固相支持体可以是韧性 的, 例如聚对苯二甲酸乙二酯 (PET) 膜。
     “可逆性封闭” 或 “障碍物” 是指当其在一部分上结合于第二个化学基团时可防止 该第二个化学基团进入具体化学反应的化学基团。在合成有机和生物有机化学中各种保 护基团是已知的, 它们适用于特定的化学基团并且适合于特定的化学过程, 这意味着它们 会在那些过程中保护特定基团并且随后可以被移除或修饰 ( 参见, 例如, Metzker et al., Nucleic Acids Res., 22(20) : 4259, 1994)。
     “连接物” 是连接两个分子或两部分, 并且在这两个分子或两部分之间提供空间 使它们能够以它们既定的方式发挥功能的分子或部分。例如, 连接物可以包含二胺烃链, 该链通过一端的反应基团共价结合于寡核苷酸类似物分子上以及通过另一端的反应基团 共价结合于固相支持体上, 例如珠子表面。可以通过使用本领域已知的偶联剂将连接物 偶联于目的核苷酸和底物构建体上 ( 参见, 例如 Efimov et al., Nucleic Acids Res.27 : 4416-4426, 1999)。衍生和偶联有机分子的方法在有机化学和生物有机化学领域中是众所
     周知的。连接物也可以是可切割的或可逆的。
     “检测器构造体” 是用于检测替代多聚体的装置。检测器构造体包括检测替代多聚 体所需的任何元件, 通常包括至少一个检测器元件。检测器元件能检测替代多聚体的报道 元件。检测器元件的实例包括但不限于, 纳米孔通道、 荧光检测器、 UV 检测器、 化学和电化 学检测器、 光电检测器等。
     “门控构造体” 是用于控制替代多聚体流动的装置。门控构造体包括控制替代多聚 体流动所需的所有元件, 通常包括至少一个门控元件。门控元件的实例包括纳米孔和多孔 膜, 如氧化铝多孔膜。
     “末端配对替代多聚体” 或 “末端配对子链” 都指双向模板指导合成所产生的替代 多聚体或子链。滚环聚合过程是制备 “末端配对替代多聚体” 或 “末端配对子链” 的示例性 方法。
     术语 “读取” , 在读取报道元件或报道构建体的环境中, 表示鉴定报道元件或报道 构建体。随后可以用报道元件或报道构建体的特性解码靶核酸的遗传信息。
     “可寻址的可切割连接” 是位置已知且能被单独靶向切割的可切割的连接。
     “荧光团” 是荧光分子或者使分子发出荧光的该分子的成分。荧光黄是荧光团的非 限制性实例。
     整体概述
     总的来说, 描述了用于复制单分子靶核酸的方法与相应的设备及产物。这类方法 使用允许靶核酸的测序通量和精确度增高的 “Xpandomer” 和 “S-Xpandomer” ( 在本文均称 为 “替代多聚体” )。替代多聚体以线性展开形式编码 ( 解析 ) 靶核酸的核苷酸序列数据, 从而改善空间分辨率, 并任选地伴随着信号强度的放大。 本文将这些方法称为 “通过展开进 行测序” 或 “SBX” 。
     通过展开进行测序, 通过提供序列靶标, 能使低费用、 高通量检测方法成为可能, 所述序列靶标 : (a) 具有经改造用于检测方法的高信噪比的报道子 ; (b) 不需要与检测同 时发生化学反应 ; 和 / 或 (c) 根据仪器的分辨率要求而得到改造。这些替代物使> 100 个 碱基的高保真读长成为可能, 该读长减少处理后的费用。SBX 更详细地披露于公开的 PCT WO2008/157696 中, 其在此通过引用整体并入。
     更具体而言, SBX 可以是基于溶液的, 适合序列读数的替代物的每 1000 亿个碱基 的试剂费用低于 15 美元。其将长度> 100 个碱基的 DNA 片段转变为称为 Xpandomer 或 S-Xpandomer( 替代多聚体 ) 的更长的替代分子。从区分相距约 异到区分相距> 的大 的碱基间的小分子差 报道子的反应, 重新调节 DNA 碱基的有序测量。DNA 的 SBX制备降低了分辨率要求并且增加了直接测量 DNA 的任何检测方法的信噪比, 并为测序应用 提供了许多新的测量方法。
     合成替代多聚体的 SBX 过程, 较详细地公开于下文, 并且通常包括聚合酶和酶促 连接或化学连接以在替代多聚体形成时依次连接探针。为了举例, 本文所述过程是酶促连 接过程。然而, 应当理解到, 本文所公开的方法很容易地适合 WO2008/157696 所述的其他 SBX 过程所产生的 Xpandomer。
     测序方法
     如图 1A 所示, 天然双链核酸具有非常紧密的线性数据密度 ; 在双螺旋 (1) 的每条链的相继堆积的碱基 (2) 之间大约有中心对中心的分离, 因此要以任何精确度和速度直接成像或测序都是非常困难的。当双链形式变性形成单链多核苷酸 (3、 4) 时, 产生的 碱基与碱基分离距离是相似的, 但是由于二级结构的结构域使该问题变得复杂化。
     如图 1B 所示, 替代多聚体 (5), 在此作为由非遗传的连接臂 T(8、 9) 连接到一起的 串联的短的寡聚体 (6、 7) 进行示例, 是待测序的核酸靶标的合成代替物或 “替代物” 。将与 模板互补的碱基并入替代多聚体中, 而规律性间隔的连接臂可用于增加短的寡聚体 ( 在此 每个寡聚体以 4 个以圆圈图示的核碱基表示 ) 之间的距离。替代多聚体可由一种方法产 生, 在该方法中, 合成的中间体首先通过复制模板链而形成。子链是独特的, 因为它具有由 寡聚体形成的线性主链和由折叠的连接臂组成的受约束的替代多聚体主链。 然后将连接臂 打开或 “展开” , 使产物转化为延伸的连接臂链。 形象地说, 可以将子链看作是有两个重合的 主链 : 一个线性的 ( 一级主链 ) 和另一个带 “褶状” 的折叠 ( 受约束的替代多聚体 )。子链 中键的选择性切割使褶状折叠展开, 产生替代多聚体产物。这一过程在下文会有更详细的 解释, 但是应当注意的是, 如图 1B 所示的每个寡聚体的四个核碱基的选择和连接臂的细节 只是用于示例的目的, 而决不应理解为限制本发明。还应当注意的是, 仅出于示例的目的, 报道元件并未显示在图 1B 所描绘的替代多聚体中。 替代多聚体中相邻寡聚体之间的分离距离 “D” 是过程依赖性变量并且由连接臂的 长度 T 决定。如图所示, 将连接臂的长度 T 设计入底物构建体, 即作为替代多聚体产生来源 的构建模块 (building block)。分离距离 D 可以选择为例如大于 0.5nm, 或大于 2nm, 或大 于 5nm, 或大于 10nm, 或大于 50nm。分离距离越高, 识别或 “解析” 个体寡聚体的过程就变得 越简单。如果不是寡聚体, 而是另一个替代多聚体种类的个体核碱基在连接臂的链上串联 到一起, 这也将是确切的。
     再参见图 1A, 天然 DNA 通过半保留复制过程进行复制 ; 每个新的 DNA 分子是模板 链 (3) 和天然子链 (4) 的 “双链体” 。通过 “模板指导合成” 的过程将序列信息从模板传到 天然子链, 所述天然子链保留碱基对序列固有的遗传信息。天然子链转而成为下一代天然 子链的模板, 并以此类推。 替代多聚体可由与模板指导合成相似的过程形成, 该过程可以是 酶促或化学偶联过程。 然而, 不同于天然 DNA, 替代多聚体一旦形成, 就不能通过半保留复制 的生物学过程被复制, 并且不适于用诸如 PCR 的方法进行扩增。设计替代多聚体产物, 以限 制不需要的二级结构。
     图 2A-2D 显示有代表性的替代多聚体底物 (20、 21、 22、 23)。这些是合成替代多聚 体的构建模块。其他示例性替代多聚体底物在随后的部分中进行描述。在此所示的替代多 聚体底物构建体具有两个功能成分 ; 即, 探针成员 (10) 和处于环状构型中的 “连接臂” 成员 (11)。环形成终产物的延伸的连接臂 “T” 。仅为了便于解释, 再次以图 2B 中所示的四个核 碱基残基 (14、 15、 16、 17) 对探针成员进行描述。
     这些底物构建体可以用 R 基团进行末端修饰, 例如, 作为适于和连接酶一起使用 的 5’ - 单磷酸、 3’ -OH( 这里称为 “Xprobe” 或 “S-Xprobe” ) 或作为适于和聚合酶一起使用 的 5’ - 三磷酸、 3’ - 羟基 ( 本文称为 “Xmer” 或 “S-Xmer” )。其他 R 基团可以在各种方法中 使用。在图 3B 所示的第一个实例中, 我们展示了通过连接酶依赖性方法从靶核酸的模板链 合成替代多聚体。
     选择探针成员 (10) 的四个核碱基残基 (14、 15、 16、 17), 使其与模板的四个核苷酸的连续序列互补。从而将每个 “探针” 设计为与模板在四个核苷酸的互补序列处杂 交。通过提供多个此类探针序列的文库, 可以形成模板的连续的互补拷贝。这种子链称为 “Xpandomer 中间体” 或 “S-Xpandomer 中间体” 。中间体有双链或单链形式。
     将连接臂环在第二和第三核碱基残基 (15, 16) 处连接于探针成员 (10)。 第二和第 三核碱基残基 (15, 16) 也通过描述为 “V” 的 “可选择性切割的键” (25) 相互连接。这种可 切割键的切割能使连接臂环展开。线性化的连接臂可以认为是 “桥接” 子链一级多核苷酸 主链的可选择性切割的键位点。 切割这些键使一级主链分散并且形成了更长的 Xpandomer。
     可选择性切割的键 (25) 的选择性切割可以通过多种方式进行, 包括但不限于, 硫 羟磷酸酯键的化学切割、 核糖 5’ -3’ 磷酸二酯键的核糖核酸酶消化、 光裂解键的切割等, 如 下文更加详细地讨论。
     图 2A 到 2D 表示 S-Xpandomer 和 Xpandomer 的示例性实施方案。如上文所提到 的, Xpandomer 包含探针, 还包含用于解析探针的全部遗传密码的一个或多个报道元件, 而 S-Xpandomer 包含探针, 还包含用于解析小于探针全部遗传密码的一个或多个报道元件。 在 与 Xprobe、 Xmer、 S-Xprobe 或 Smer 连接的一个或多个报道元件或从它们衍生来的替代多聚 体的所有附图中, 任何描绘均是出于示例性目的, 并且, 除非文中另有明确指示, 否则, 并非 意图表示包含于探针或替代多聚体中的遗传信息的量 ( 即附图中所描绘的示例性替代多 聚体和其组分, 表示 S-Xpandomer 和 Xpandomer 以及它们各自的组分, 除非另有明确说明 )。
     图 2A 所示的底物构建体 (20) 有单个连接臂片段, 在此用椭圆形 (26) 表示, 用于 连接报道元件。该片段的侧翼是间隔子连接臂片段 (12、 13), 所有这些共同形成连接臂构 建体。 一至多个树枝状大分子、 多聚体、 支化多聚体或其组合可用于, 例如构建连接臂片段。 对于图 2B 的底物构建体 (21) 而言, 连接臂构建体由三个用于连接报道元件的连接臂片段 (27、 28、 29) 组成, 每个连接臂片段的侧翼是间隔子连接臂片段。报道元件的组合共同形成 “报道构建体” , 产生独特的数字报道密码 ( 用于探针序列识别 )。 这些报道元件包括但不限 于, 荧光团、 FRET 标签、 珠子、 配体、 适配子、 肽、 半抗原、 寡聚体、 多核苷酸、 树枝状大分子、 茎 环结构、 亲和标记、 大分子标签等。图 2C 中的底物构建体 (22) 的连接臂环 (11) 是 “裸露 的” 。这个构建体编码的遗产信息不是编码在连接臂上, 而是与探针 (10) 相关, 例如, 以一 个或多个标记的核苷酸的形式。图 2D 的底物构建体 (23) 说明一般性原则 : 如星号 (*) 所 示, 探针的序列信息以在测序方法中更容易被检测到的修饰形式在底物构建体中被编码或 “解析” 。因为序列数据在可选择性切割的键 (25) 切割形成线性延伸的替代多聚体后, 更易 以物理方式解析, 星号 (*) 代表编码的遗传信息的任何形式, 这对它而言是有利的。底物构 建体的一个或多个生物信息元件 (*), 无论是何种形式, 可以被直接检测到或可以是在组装 后的标记步骤中添加了可检测元件的前体。在一些实例中, 遗传信息编码于底物构建体自 身的分子特性中, 例如多状态大分子标签。在其他实例中, 遗传信息由以下编码 : 一种或多 种 FRET 供体 : 受体对的荧光团, 或纳米分子条形码, 或配体或配体的组合, 或本领域所描述 的某些其他标记技术形式。各实施方案将在下文进行更详细的讨论。
     连接臂通常提供多种功能 : (1) 直接或间接地依次连接于相邻的连接臂上从而形 成替代多聚体中间体 ; (2) 通过一级主链上或连接臂内的选择性键的切割, 伸展和展开形 成延伸的连接臂链 ( 见图 1B) ; 和 / 或 (3) 提供用于并入报道元件的分子构建体, 该分子构 建体也称为 “标签” 或 “标记物” , 其编码相关底物的核碱基残基的序列信息。可以通过调节其组成型报道元件的空间距离、 丰度、 信息密度和信号强度, 设计连接臂以优化编码功能。 各种报道子特性对于放大底物构建体内编码的遗传信息的信号强度是有用的。有关报道 子、 分子条形码、 亲和结合、 分子标记和其他报道元件的文献, 对于本领域技术人员而言是 公知的。
     可以看出, 如果底物构建体的每个底物都含有 x 个核碱基, 那么代表 x 个核碱基的 x 所有可能的依次组合的文库就会含有 4 个探针 ( 当从 A、 T、 C 或 G 中选择核碱基时 )。如果 使用其他碱基, 那么就可能需要更少的或更多的组合。设计这些底物文库使每个底物构建 体含有 (1) 与待测序核酸的任何一段可能的靶序列互补的探针 ( 或至少一个核碱基残基 ) 以及 (2) 编码与该具体探针 ( 或核碱基 ) 互补的靶序列的特性或部分特性的独特报道构建 体。 含有两个核碱基的探针文库会具有 16 种独特的成员 ; 含有三个核碱基的探针文库会具 有 64 种独特的成员, 以此类推。典型的文库会有四个个体核苷酸自身, 但是可以通过设定 使其适应连接方式。
     图 3A-3C 图解了 Xpandomer 的示例性合成。 在此描述的底物是 Xprobe, 并且该方法 可以描述为在自由溶液 (free solution) 中与引物依赖性进行性连接的杂交。 S-Xpandomer 可以以类似的方式合成。
     许多众所周知的分子生物学方法, 如用于片段化靶 DNA 和连接末端适配子的方 法, 可以适用于测序方法, 并且在此用于制备测序用靶 DNA(30)。在此我们以本领域技术人 员所熟悉的广义措辞描述了使片段末端平滑化并与适配子 (31, 32) 进行平末端连接的方 法, 所述适配子被设计成与测序引物一起使用。这些反应显示于图 3A 的步骤 I 中。在步骤 II 和 III 中, 使靶核酸变性并且与互补于该适配子的合适引物 (33) 退火。
     在图 3B 中, 将步骤 III 中引发的模板链与底物构建体文库 (36) 及连接酶 (L) 接 触, 而在步骤 IV 中, 调整条件从而促进杂交反应, 随后在引物 - 模板双链体的游离 3’ -OH 处进行连接。任选地在步骤 V 中, 连接酶解离, 以及在步骤 VI 和 VII 中, 可以识别杂交和连 接的过程, 从而通过将底物 (37, 38) 累积添加到引物末端而导致延伸。虽然引发可以从单 链模板两端的适配子开始发生, 但是仅仅为了简单起见, 在此展示新生 Xpandomer 子链的 生长由单个引物开始。子链的延伸描述于步骤 VI 和 VII 中, 这两个步骤是连续重复的 ( 递 增的, 不中断 )。这些反应发生在自由溶液中并且持续进行, 直至合成足量的产物。在步骤 VIII 中, 展示了完整的 Xpandomer 中间体 (39) 的形成。
     长度相对较长的连续核苷酸序列可以以这种方式进行有效地复制, 从而形成 Xpandomer 中间体 ( 以及类似的 S-Xpandomer 中间体 )。可以看出, 对应于长模板链片段的 连续读长 (“重叠群” ) 可以通过这种技术完成。对于本领域技术人员而言显然的是, 亿万 个这些单分子 SBX 反应可以在单管中以有效的批处理方式同时进行。随后, 可以对这些合 成的鸟枪法产物进行测序。
     在图 3C 中, 描述了 SBX 方法的随后步骤。步骤 IX 显示了双链 Xpandomer 中间 体的变性, 随后是主链中可选择性切割的键的切割, 可选择性切割的键被设计成使得 “打 开” 连接臂环, 形成线性延伸的 Xpandomer 产物 (34)。此类选择性切割可以通过本领域 技术人员所知的任何技术来完成, 包括但不限于, Mag 等 (“Synthesis and selective cleavage of an oligodeoxynucleotide containing a bridged internucleotide 5 ′ -phosphorothioate linkage” , Nucleic Acids Research 19(7) : 1437-1441, 1991)公 开 的 用 金 属 阳 离 子 进 行 硫 羟 磷 酸 酯 的 切 割, Mag 等 (“Synthesis and selective cleavage of oligodeoxyribonucleotides containing non-chiral internucleotide phosphoramidate linkages” , Nucleic Acids Research 17(15) : 5973-5988, 1989) 公开 的氨基磷酸酯的酸催化切割, Gut 等 (“A novel procedure for efficient genotyping of single nucleotide polymorphisms” , Nucleic Acids Research 28(5) : E13 , 2000) 和 Eckstein 等 (“Inhibition of restriction endonuclease hydrolysis by phosphorothioate-containing DNA” , Nucleic Acids Research , 25 ; 17(22) : 9495 , 1989) 分 别 公 开 的 磷 酸 二 酯 键 的 选 择 性 核 酸 酶 切 割, 以 及 Sauer 等 (“MALDI mass spectrometry analysis of single nucleotide polymorphisms by photocleavage and charge-tagging” , Nucleic Acids Research 31 , 11 e63 , 2003) 、 Vallone 等 ( “Genotyping SNPs using a UV-photocleavable oligonucleotide in MALDI-TOF MS” , Methods Mol.Bio.297 : 169-78, 2005) 和 Ordoukhanian 等 (“Design and synthesis of a versatile photocleavable DNA building block, application to phototriggered hybridization” , J.Am.Chem.Soc.117, 9570-9571, 1995) 公开的光裂解连接物修饰的磷酸 二酯主链的选择性切割。
     基本过程的改进, 例如洗涤步骤和严紧性条件的调整是有经验的分子生物学家所 熟练掌握的技术。在这个过程上的变量, 包括例如靶链的固定和解析、 伸展以及其他技术, 以减少二级结构。制备 Xpandomer 的方法较详细地描述于公开的 PCT WO 2008/157696 中, 其在此通过引用并入。本领域技术人员应当理解, 本文和公开的 PCT WO 2008/157696 所述 的用于制备 Xpandomer 的方法, 以相似的方式适用于制备 S-Xpandomer。
     替代多聚体包含多个偶联于序列中的亚基, 所述序列对应于全部或部分靶核酸的 连续核苷酸序列。在一实施方案中, 替代多聚体可以用下述结构表示 :
     其中
     T 表示连接臂 ;
     P1 表示第一探针部分 ;
     P2 表示第二探针部分 ;
     κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 3 的整数 ; 以及
     α 表示选自亚基基序文库的亚基基序的种类, 其中每个种类都包含部分靶核酸的 连续核苷酸序列的序列信息 ;
     其中T 表示连接臂 ;
     P1 表示第一探针部分 ;
     P2 表示第二探针部分 ;
     κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 3 的整数 ;
     α 表示选自亚基基序文库的亚基基序的种类, 其中每个种类都包含部分靶核酸的 连续核苷酸序列的序列信息 ; 以及
     χ 表示与相邻亚基的连接臂连接的键 ;
     其中
     T 表示连接臂 ;
     P1 表示第一探针部分 ;
     P2 表示第二探针部分 ;
     κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 3 的整数 ;
     α 表示选自亚基基序文库的亚基基序的种类, 其中每个种类都包含部分靶核酸的 连续核苷酸序列的序列信息 ; 以及
     χ 表示与相邻亚基的连接臂连接的键 ;
     其中
     T 表示连接臂 ;
     P1 表示第一探针部分 ;
     P2 表示第二探针部分 ;
     κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 3 的整数 ;
     α 表示选自亚基基序文库的亚基基序的种类, 其中每个种类都包含部分靶核酸的 连续核苷酸序列的序列信息 ; 以及
     χ 表示与相邻亚基的连接臂连接的键 ;
     其中 T 表示连接臂 ; κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 3 的整数 ; α 表示选自亚基基序文库的亚基基序的种类, 其中每个种类都包含部分靶核酸的连续核苷酸序列的序列信息 ; 以及
     χ 表示与相邻亚基的连接臂连接的键 ;
     其中
     T 表示连接臂 ;
     N 表示核碱基残基 ;
     κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 10 的整数 ;
     α 表示选自亚基基序文库的亚基基序的种类, 其中每个种类都包含部分靶核酸的 连续核苷酸序列的序列信息 ; 以及
     χ 表示与相邻亚基的连接臂连接的键 ;
     其中
     T 表示连接臂 ;
     κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 10 的整数 ;
     α 表示选自亚基基序文库的亚基基序的种类, 其中每个种类都包含部分靶核酸的 连续核苷酸序列的序列信息 ; 以及
     χ 表示与相邻亚基的连接臂连接的键 ;
     其中T 表示连接臂 ;
     N 表示核碱基残基 ;
     κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 10 的整数 ;
     α 表示选自亚基基序文库的亚基基序的种类, 其中每个种类都包含部分靶核酸的 连续核苷酸序列的序列信息 ; 以及
     χ 表示与相邻亚基的连接臂连接的键 ;
     其中
     T 表示连接臂 ;
     N 表示核碱基残基 ;
     κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 10 的整数 ;
     α 表示选自亚基基序文库的亚基基序的种类, 其中每个种类都包含部分靶核酸的 连续核苷酸序列的序列信息 ;
     χ1 表示与相邻亚基的连接臂连接的键 ; 以及 2
     χ 表示连接臂间的键 ; 或
     其中
     T 表示连接臂 ;
     n1 和 n2 分别表示核碱基残基的第一部分和第二部分 ;
     κ 表示 m 个亚基的链中的第 κ 个亚基, 其中 m 是大于 10 的整数 ; 以及
     α 表示选自亚基基序文库的亚基基序的种类, 其中每个种类都包含部分靶核酸的 连续核苷酸序列的序列信息。
     在一些实施方案中, 替代多聚体子链可以由具有以下结构的多个亚基通过模板指 导合成形成 :
     其中 T 表示连接臂 ; P1 表示第一探针部分 ; P2 表示第二探针部分 ; ~表示至少一个可选择性切割的键 ; 以及 1 2 R 和 R 表示用于子链模板指导合成的相同或不同的末端基团 ;其中 T 表示连接臂 ; P1 表示第一探针部分 ; P2 表示第二探针部分 ; R1 和 R2 表示用于子链模板指导合成的相同或不同的末端基团 ; ε 表示第一连接基团 ; δ 表示第二连接基团 ; 以及 “----“表示可切割的连接臂内的交联 ;
     其中 T 表示连接臂 ; P1 表示第一探针部分 ; P2 表示第二探针部分 ; R1 和 R2 表示用于子链模板指导合成的相同或不同的末端基团 ; ε 表示第一连接基团 ; δ 表示第二连接基团 ; 以及 “----“表示可切割的连接臂内的交联 ;
     其中 T 表示连接臂 ; P1 表示第一探针部分 ; P2 表示第二探针部分 ; ~表示至少一个可选择性切割的键 ; R1 和 R2 表示用于子链模板指导合成的相同或不同的末端基团 ; ε 表示第一连接基团 ; 以及 δ 表示第二连接基团 ;
     其中 T 表示连接臂 ; P1 表示第一探针部分 ; P2 表示第二探针部分 ; ~表示至少一个可选择性切割的键 ; R1 和 R2 表示用于子链模板指导合成的相同或不同的末端基团 ; ε 表示第一连接基团 ; 以及 δ 表示第二连接基团 ;
     其中 T 表示连接臂 ; N 表示核碱基残基 ; R1 和 R2 表示用于子链模板指导合成的相同或不同的末端基团 ; ε 表示第一连接基团 ; δ 表示第二连接基团 ; 以及 “----“表示可切割的连接臂内的交联 ;
     其中 T 表示连接臂 ; N 表示核碱基残基 ; R1 和 R2 表示用于子链模板指导合成的相同或不同的末端基团 ; ~表示至少一个可选择性切割的键 ; ε 表示第一连接基团 ; δ 表示第二连接基团 ; 以及 “----“表示可切割的连接臂内的交联 ;
     其中 T 表示连接臂 ; N 表示核碱基残基 ; R1 和 R2 表示用于子链模板指导合成的相同或不同的末端基团 ; ε 表示第一连接基团 ; δ 表示第二连接基团 ; 以及 “----“表示可切割的连接臂内的交联 ;
     其中 T 表示连接臂 ; N 表示核碱基残基 ; R1 和 R2 表示用于子链模板指导合成的相同或不同的末端基团 ; ε1 和 ε2 表示相同或不同的第一连接基团 ; δ1 和 δ2 表示相同或不同的第二连接基团 ; 以及 “----“表示可切割的连接臂内的交联 ; 或其中
     T 表示连接臂 ;
     N 表示核碱基残基 ;
     V 表示核碱基残基的内部切割位点 ; 以及 1 2
     R 和 R 表示用于子链模板指导合成的相同或不同的末端基团。
     R1 和 R2 是为适用于使用亚基的合成方法而设置的末端基团。例如, R1 = 5, - 磷酸 2 1 2 盐且 R = 3’ -OH, 可用于连接方法中, 而 R = 5’ - 三磷酸盐且 R = 3’ -OH, 可用于聚合酶 2 方法。任选地, R 可以设置成带有可逆性封闭基团, 用于单底物的循环添加。可选地, R1 和
     R2 可以设置成带有末端连接基团, 用于化学耦合, 或设置成不带有连接基团, 而用于仅杂交 1 2 的方法。R 和 R 可以是通常类型的 XR, 其中 X 是连接基团而 R 是功能基团。
     其他示例性的替代多聚体和替代多聚体子链较详细地披露于公开的 PCT WO 2008/157696 中。
     在一实施方案中, 报道构建体通过多聚体连接臂连接于探针或核碱基上。在其他 实施方案中, 连接臂可以不与报道构建体相连。 连接臂可以由一种或多种持久的、 水性可溶 的或溶剂可溶的多聚体构成, 包括但不限于以下一种或多种片段 : 聚乙二醇、 聚乙二醇、 聚 嘧啶、 聚异腈、 聚异氰酸酯、 聚 ( 三芳甲基 ) 甲基丙烯酸酯、 聚醛、 聚吡咯啉酮、 聚脲、 聚乙二 醇磷酸二酯、 聚丙烯酸酯、 聚甲基丙烯酸酯、 聚丙烯酰胺、 聚乙烯酯、 聚苯乙烯、 聚酰胺、 聚亚 安酯、 聚碳酸酯、 聚丁酸酯、 聚丁二烯、 聚丁内酯、 聚吡咯啉二酮、 聚乙烯磷酸酯、 聚乙酰胺、 多糖、 聚透明质酸酯、 聚酰胺、 聚酰亚胺、 聚酯、 聚乙烯、 聚丙烯、 聚苯乙烯、 聚碳酸酯、 聚对苯 二甲酸酯、 聚硅烷、 聚氨酯、 聚醚、 聚氨基酸、 聚甘氨酸、 聚脯氨酸、 氮代聚赖氨酸、 多肽、 侧链 氮代肽、 多氮代甘氨酸、 类肽、 侧链羧代肽、 同源肽, 寡核苷酸、 核糖核酸寡核苷酸、 脱氧核酸 寡核苷酸、 修饰后可阻止 Watson-Crick 碱基配对的寡核苷酸、 寡核苷酸类似物、 聚胞嘧啶 核苷酸、 聚腺苷酸、 聚尿苷酸、 聚胸苷、 聚磷酸盐、 多核苷酸、 多核糖核苷酸、 聚乙二醇磷酸二 酯、 肽多核苷酸类似物、 苏氨酰基多核苷酸类似物、 乙二醇 - 多核苷酸类似物、 吗啉代多核 苷酸类似物、 锁核苷酸寡聚体类似物、 多肽类似物、 支化多聚体、 梳型多聚体、 星形多聚体、 枝状多聚体、 随机的、 倾斜的和嵌段共聚物、 阴离子多聚体、 阳离子多聚体、 形成茎环、 刚性 片段与柔性片段的多聚体。这类多聚体可以在底物构建体的连接点上环化。
     连接臂通常是抗缠结的或是折叠的从而保持紧凑。聚乙二醇 (PEG)、 聚环氧乙烷 (PEO)、 甲氧基聚乙二醇 (mPEG) 和多种类似构建的 PEG 衍生物 (PEG) 是用于实施本发明的 广泛可用的多聚体。修饰的 PEG 可以通过多种双功能的和异双功能的末端交联剂获得, 并 且可以合成各种长度。PEG 通常可溶于水、 甲醇、 苯、 二氯甲和许多常见有机溶剂中。PEG 通 常是柔性的多聚体, 其通常不与生化试剂非特异性地相互作用。
     可以用作为连接臂并且为报道子提供 “支架” 的其他多聚体, 包括, 例如, 聚甘氨 酸、 聚脯氨酸、 聚羟脯氨酸、 聚半胱氨酸、 聚丝氨酸、 聚天冬氨酸、 聚谷氨酸等。 侧链的功能性 可以用于构建富含功能基团的支架而用于增加的信号容量或复杂性。
     减小底物构建体的大小和质量, 也可以通过使用未标记的连接臂来实现。通过去 除大体积报道子 ( 和诸如树枝状大分子的报道子支架, 对于一些编码实施方案而言, 其包 含了连接臂质量的 90%以上 ), 可以提高杂交和 / 或偶联动力学。 然后可以使用组装后的连 接臂标记。 使用空间的或组合的策略将报道子与一个或更多个沿连接臂构建体分布的连接 化学物质结合, 来编码碱基序列信息。组装后的连接臂标记, 由于它们的报道子含量减少, 而在 S-Xpandomer 环境中特别有利。
     如上文所述, S-Xpandomer 不同于 Xpandomer, 因为 S-Xpandomer 的报道构建体仅 编码探针序列信息的子集。 这在某些实施方案中是有利的, 因为其简化了探针, 并减少了其 动力学负荷。S-Xprobe 是编码的碱基序列信息小于其探针的所有碱基序列信息的 Xprobe。 例如, 在一实施方案中, S-Xprobe 可以具有 1 个 4- 态报道子, 其编码其 6 个碱基探针中的 一个碱基 ( 如 5’ 末端碱基 )。当组装成 S-Xpandomer 时, 对碱基信息取样, 作为沿着靶标 的离散间隔。结果, 需要相对于碱基位置移码的多个 S-Xpandomer 编码完整的靶核酸序列。滚环聚合是产生所有所需的 S-Xpandomer 序列的示例性方法。
     图 4 表示滚环聚合过程。 在步骤 I 中, 添加连接反应混合物 (L), 将靶 DNA 片段 ( 描 绘为较长的双链体 ) 连接于双链适配子寡聚体 ( 描绘为较短的双链体 ), 从而形成环化的 靶构建体。在步骤 II 中, 使靶标变性成单链靶标, 并且使通用发夹引物在单链环化靶标的 适配子部分内与其互补物杂交。发夹在其 5’ 末端是非磷酸化的, 并且会仅从其引物末端延 伸。在步骤 III 中, 添加聚合酶反应混合物 (P)。进行聚合酶延伸, 并且从通用引物的 3’ 末 端延伸。在步骤 IV 中, 可用的核酸单体的聚合已经在环化的模板周围延伸出新生的 3’ 末 端, 并置换发夹, 以便当其前进时, 继续在周围对链进行第二次置换。步骤 V 表示连续的滚 环复制。当产物具有足够的平均长度时, 终止反应。
     在变性和纯化后, 剩余的滚环产物具有一系列多于 R 个复制单元。复制单元是复 制一圈环化模板的滚环延伸产物部分。随后利用图 3B 和 3C 中所示的替代多聚体底物, 用 纯化的产物 ( 即引发的 DNA) 合成 S-Xpandomer。在这种情况中, S-Xprobe 由新生的 5’ 末 端并入。
     由编码单个碱基的 S-Xprobe 合成的 S-Xpandomer, 会编码环化模板的全部序列, 只要下列条件得到满足 : 对于复制单元的碱基长度 L, S-Xprobe 探针的碱基长度 S, 以及复 制单元的数量 R, L/S、 2L/S、… RL/S 的余数必须包括数字 0, 1, 2,…, S-1。通常, 当这得到 满足时, R 最小等于 S。对于第一个复制单元、 第二个复制单元……第 R 个复制单元, 每个余 数分别等于 S-Xprobe 位置发生于随后复制单元中的移码 ( 碱基数 )。 这还等于说, S-Xprobe 位置的移码在每个复制单元后发生, 且在 R 个复制单元后, 这些移码使 S-Xpandomer 中的 S-Xprobe 相对于复制单元参照具有每个位置。
     在示例性的实施方案中, 用 5 个碱基的 S-Xprobe 的探针产生约 1000 个碱基的 DNA 靶标的 S-Xpandomer。 不考虑其他错误来源, 对于具有均等分布的余数 0、 1、 2、 3 或 4 的靶长 度, 当除以 5(S = 5) 且如果 R 等于或大于 5, 则仅仅余数为 0 的情况不产生编码靶 DNA 全长 序列的 S-polymer。
     为了增加基因组冗余或低复杂性区域中序列读取的组装效率, 可以使用基于末端 配对的序列读取。末端配对读取具有取自长靶 DNA 相对末端的两个读取序列。通过利用 DNA 靶标的长度, 这两个序列可以彼此参照, 以帮助它们的组装定位。 末端配对核酸, 包括末 端配对替代多聚体, 可以通过从引物双向连接探针而产生。这个过程通过将靶 DNA 剪切和 过滤成长度为 1000 个碱基的狭窄长度范围起始, 例如, 如图 5A 所示, 10kb+/-0.5kb。
     图 5A 表示末端配对替代多聚体的双向合成。在步骤 I 中, DNA 靶标末端钝化, 连 接于引物适配子, 并环化。 引物适配子任选地包含连接臂, 该连接臂任选地与珠子或其他固 相基质连接。 对于这种连接, 连接臂可以使用共价键以及可切割的连接, 或可以使用寡聚体 通过杂交连接。在步骤 II 中, 使环化产物变性。随后使带有 5’ 磷酸盐和 3’ OH 的引物与适 配子双链体化, 以双向启动连接。在步骤 III 中, 进行 SBX 过程, 且 S-Xprobe 或 Xprobe 从 新生的 3’ 和 5’ 末端, 在两个方向上沿着环化靶标杂交并连接 ( 步骤 IV)。
     也可以以类似于 S-Xprobe 和 Xprobe 的方式设计引物, 使其在连接臂上携带有关 反应的信息, 如靶标长度范围 ( 如 10kb、 20kb、 30kb), 或如果存在靶标解析或靶标复用, 则 识别靶标自身, 或仅相对于每对末端识别引物。 末端配对核酸 ( 替代多聚体以及其他核酸 ) 的序列区可以含有任何数量的核碱基残基。例如序列区包含多于 10 个核碱基, 但带有较少碱基的序列区也是可能的。
     在步骤 V 中, 末端配对替代多聚体子链, 已在每个方向上延伸出充足数量的碱基。 洗涤产物并从靶标上变性。在步骤 VI 中, 过滤更高值和更长读取的产物, 并切割, 以打开连 接臂, 从而产生末端配对替代多聚体。所得的这种产物编码环化靶标的末端配对序列。
     图 5B 表示以与上文所述相似的方式产生末端配对 DNA 靶标, 除了使用寡聚探针替 代 s-Xprobe 或 Xprobe。这种情况下的产物可以用作替代多聚体 DNA 靶标, 用作其他测序 方法的 DNA 靶标, 或用作测序方法的分析物输入。参考图 5B, 在步骤 I 中, DNA 靶标末端钝 化, 连接于引物适配子, 并环化。引物适配子任选地包含连接臂, 该连接臂用于任选地与珠 子或其他固相底物连接。 对于这种连接, 连接臂可以使用共价键和可切割的连接, 或使用寡 聚体通过杂交连接。在步骤 II 中, 使环化产物变性。随后使带有 5’ 磷酸盐和 3’ OH 的引物 与适配子双链体化, 以双向启动连接。在步骤 III 中, 寡聚探针从新生的 3’ 和 5’ 末端, 在 两个方向上沿着环化靶标杂交并连接 ( 步骤 IV)。 在步骤 V 中, 子链在每个方向上已经延伸 出充足数量的碱基。洗涤产物并从靶标上变性。
     上述末端配对方法可用于替代多聚体方法以及使用其他核酸 ( 如 DNA 等 ) 的方 法。除了上述方法外, 其他变化也是可能的。例如, 双向合成可以从引物的 3’ 和 5’ 两个末 端经由连接反应进行。 在另一示例性方法中, 双向合成从引物的 5’ 末端经由连接反应进行, 且引物 3’ 末端的延伸经由聚合酶反应进行。本领域技术人员应当认识到, 上述方法的其他 组合也是可能的。
     公开的替代多聚体可以包含任何数量的亚基, 其可以是例如大于 10、 大于 100 或 1 2 3 4 5 6 大于 1000。此外, 尽管报道构建体 C 、 C、 C、 C、 C 和 C 在上文描述为通过键与探针 P1、 P2、 P3、 P4、 P5 和 P6 连接, 但报道构建体 ( 在本文中也称为报道元件 ) 可以连接于连接臂, 或可以 是探针或连接臂本身的成分, 并且报道构建体作为独立的连接部分的描述, 仅仅是出于举 例说明的目的。
     探针的核碱基残基可以是例如腺嘌呤 (A)、 鸟嘌呤 (G)、 胞嘧啶 (C) 或胸腺嘧啶 (T) 或如下文较详细讨论的其他杂环碱基部分, 包括通用碱基。子链的模板指导合成可以通过 任何数量的方法实现, 包括涉及一个或多个酶促连接、 聚合酶反应和 / 或化学连接的技术。 如上文所述, 子链包含多个亚基, 亚基的数量的变化很大, 例如为大于 30 或大于 1000。
     公开的替代多聚体的检测, 可以通过多种技术中的任何技术完成。例如, 报道构 建体可以通过以下方式检测 : 使替代多聚体穿过纳米孔, 用电子束询问、 扫描隧道显微术 (STM) 和 / 或透射电子显微术 (TEM)。其他示例性检测技术在下文进行描述。报道构建体 的属性会在很大程度上取决于所用的检测方法。 报道构建体可以通过共价键与探针的至少 一个核碱基残基连接。 可选地或另外, 报道构建体可以是探针至少一个核碱基残基的成分。 报道构建体也可以任选地与连接臂或连接臂的一部分相连。
     在更具体的实施方案中, 用于解析遗传信息的报道元件可以与替代多聚体的连接 臂相连、 在至少一个可选择性切割的键切割前与替代多聚体相连和 / 或在至少一个可选择 性切割的键切割后与替代多聚体相连。替代多聚体还可以包含至少一个探针或核碱基残 基的全部或部分, 并且用于解析遗传信息的报道元件可以与至少一个探针或核碱基残基相 连, 或者可以是探针或核碱基残基自身。另外, 可选择性切割的键可以是共价键、 连接臂内 的键、 子链的探针或核碱基残基之间或之内的键, 和 / 或子链的探针或核碱基残基和靶模板之间的键。
     范 围 宽 泛 的 商 业 上 可 获 得 的 合 适 的 化 学 物 质 (Pierce, Thermo Fisher Scientific, USA) 可适用于制备包含可选择性切割的连接键的探针。常见的连接化学物质 包括, 例如, 带胺的 NHS- 酯、 带巯基的马来酰亚胺、 带胺的亚氨酸酯、 用于与胺反应的带羧 基的 EDC、 带巯基的二硫吡啶等。其他实施方案包括使用如酰肼 (HZ) 和 4- 甲酰苯甲酸酯 (4FB) 的功能基团, 随后可使所述功能基团进一步反应而形成连接。更具体而言, 各种交联 剂 ( 异双功能的和同双功能的 ) 可广泛使用 (Pierce), 其包括但不限于, Sulfo-SMCC( 硫 代琥珀酰亚胺 4-[N- 马来酰亚胺甲基 ] 环己胺 -1- 羧酸盐 )、 SIA(N- 琥珀酰亚胺碘醋酸 )、 Sulfo-EMCS([N-e- 马 来 酰 亚 胺 癸 酰 基 ] 硫 代 琥 珀 酰 亚 胺 酯 )、 Sulfo-GMBS(N-[g- 马 来 酰亚胺丁酰基 ] 硫代琥珀酰亚胺酯 )、 AMAS N-(a- 马来酰亚胺乙酰基 ) 琥珀酰亚胺酯 )、 BMPS(N EMCA(N-e- 马来酰亚胺己酸 )-[β- 马来酰亚胺丙酰基 ] 琥珀酰亚胺酯 )、 EDC(1- 乙 基 -3-[3- 二甲基氨丙基 ] 碳酰二亚胺盐酸盐 )、 SANPAH(N- 琥珀酰亚胺 -6-[4’ - 叠氮 基 -2′ - 硝基苯氨基 ] 己酸 )、 SADP(N- 琥珀酰亚胺 (4- 叠氮苯 )-1, 3′ - 二硫代丙酸酯 )、 PMPI(N-[p- 琥珀酰亚胺苯 ] 异氰酸盐 )、 BMPH(N-[β- 马来酰亚胺丙酸 ] 酰肼, 三氟乙酸盐 ) 酸酯 )、 EMCH([N-e- 马来酰亚胺己酸 ] 酰肼, 三氟乙酸盐 )、 SANH( 琥珀酰亚胺 4- 烟酰肼丙 酮腙 )、 SHTH( 琥珀酰亚胺 4- 邻苯二甲酸肼盐酸盐 ), 以及 C6-SFB(C6- 琥珀酰亚胺 4- 甲 酸基苯甲酸酯 )。同样, Letsinger 等 (“Phosphorothioate oligonucleotides having modified internucleoside linkages( 具有修饰的核苷间连接的硫代磷酸酯寡核苷酸 )” , 美国专利第 6,242,589 号 ) 公开的方法也可适用于形成硫羟磷酸酯键。
     此外, 广为接受的保护 / 去保护的化学物质可以广泛地用于常见的连接部分 (Benoiton, “Chemistry of Peptide Synthesis( 肽合成化学 )” , CRC Press, 2005)。氨基 保护剂包括但不限于, 9- 芴甲氧羰酰胺 (Fmoc-NRR′ )、 t- 丁基氨基甲酸盐 (Boc-NRR′ )、 苯甲基氨基甲酸盐 (Z-NRR′, Cbz-NRR′ )、 三氟乙酰胺、 酞亚胺、 苄胺 (Bn-NRR′ )、 三苯基 甲胺 (Tr-NRR′ ) 和苯亚甲基胺 p- 甲苯磺胺 (Ts-NRR′ )。羧基保护剂包括但不限于, 甲 酯、 t- 丁酯、 苯甲酯、 S-t- 丁酯和 2- 烷基 -1, 3- 唑啉。羰基保护剂包括但不限于, 二甲基乙 缩醛 1, 3- 二氧杂环乙烷和 1, 3- 二噻烷 N, N- 二甲基腙。羟基保护剂包括但不限于, 甲氧甲 基醚 (MOM-OR)、 四氢吡喃醚 (THP-OR)、 t- 丁基醚、 烯丙醚、 苯甲基醚 (Bn-OR)、 t- 丁基二甲 基甲硅烷基醚 (TBDMS-OR)、 t- 丁基二苯基甲硅烷基醚 (TBDPS-OR)、 醋酸酯、 新戊酸酯, 以及 苯甲酸酯。
     虽然连接臂经常被描述为带三个报道基团的报道构建体, 但是各种报道子构型都 可以排列于连接臂上, 并且可以包含识别探针组分的单个报道子, 识别探针种类的单个报 道子, 识别探针种类的分子条形码, 或者连接臂可以是裸露的多聚体 ( 没有报道子 )。在裸 露的多聚体的情况下, 报道子可以是探针本身, 或可以位于与探针连接于的第二连接臂上。 在一些情况下, 将一个或多个报道子前体排列于连接臂上, 并且在 Xpandomer 产物组装之 后, 报道子是亲和结合的或共价结合的。
     在一些实施方案中, 每个报道子最少具有两种用于编码碱基序列信息的状态。奇 偶性或错误校正信息也可以编码于报道子中。例如, 9 个二元态报道子可能编码相关探针 的 4 碱基序列 (2 位 / 碱基 ), 并使用最后的报道子编码前 8 位的奇偶性。在另一实例中, 3 个 4 态报道子编码 3 碱基探针序列。仍然在其他实施方案中, 公开了包含与模板链双链体化的子链的模板 - 子链双链体, 以及由模板链和寡聚体或单体底物构建体形成模板 - 子链 双链体的方法。
     在一些实施方案中, 本公开提供了用于 SBX 方法的试剂盒。试剂盒可以包含多个 构建体 ( 即 Xprobe、 Xmer、 S-Xprobe 或具有合适的 R1/R2 末端基团的 S-Xmer), 用于通过模 板指导合成形成子链, 且可以任选地包含利用所述构建体形成子链的合适的说明书。试剂 盒中构建体的数量 ( 其也可以称为构建体 “文库” ) 会取决于核碱基残基 / 构建体的数量, 以及用作核碱基残基的通用碱基的数量。例如, 此类试剂盒或构建体文库可以含有例如编 号从 10-65000、 从 50-5000 或从 200-1200 的独特的成员。
     检测方法
     进行替代多聚体的合成, 以促进核酸的检测和测序, 而且该合成的替代多聚体可 适用于所有类型的核酸。该过程是用于 “展开” 或 “延伸” 编码序列信息或部分序列信息的 主链元件 ( 或亚基 ) 的长度 ( 相对于天然核酸的短的核苷酸与核苷酸距离的展开 ), 以及任 选地也可以用于增强信号强度 ( 相对于天然核苷酸中观察到的几乎不能辨别的低强度信 号 ) 的方法。同样地, 并入到替代多聚体的展开的合成主链中的报道元件, 可以利用多种检 测方法进行检测与处理, 所述方法包括本领域众所周知的检测方法 ( 例如, CCD 成像系统、 原子力显微镜或门控质谱仪 ), 以及通过诸如大规模平行纳米孔感受器阵列的方法或这些 方法的结合。基于最佳信噪比、 通量、 费用等因素, 选择检测技术。本文所述的检测方法可 以任选地使用下文所述的固定且线性化阵列呈递方法。 尽管出于示例目的经常在替代多聚 体的背景下进行描述, 但是本文所公开的检测方法通常同样适用于且可用于检测核酸。
     一示例性检测方法是图 6 所示的犁刀样纳米孔方法。 ( 必须指出, 这些图表并非是 按比例的, 因为预料报道子比碱基长> 50 倍 )。替代多聚体报告子相对于天然 DNA 碱基大 的多的尺寸使纳米孔的尺寸更大, 这样的纳米孔更易产生。如图 6 所描绘的, 纳米孔将 2 个 填充有水性电解液 ( 通常为 1 摩尔的 KCl) 的贮存器 (40, 41) 连接起来。在位于每个贮存 器中的电极间施加电势, 且电流流过纳米孔 (42)。 通常, 替代多聚体沿着其长度具有负电荷 密度, 且通过电泳力被牵引进纳米孔并被从中拉出 ( 移出 )。 纳米孔电流通过替代多聚体位 于纳米孔通道中的任何部分得以调节。在本实例中, 基于大小和 / 或电荷分布, 每个碱基类 型与具有独特分子结构的报道子类型相关。当每个报道子穿过纳米孔时, 其分子特征改变 电流的时间和振幅, 从而可以确定相关碱基的特性。 通过捕获该电流信号, 解码连续报道构 建体中所编码的序列信息。
     纳米孔技术具有用作高通量 DNA 测序的低成本方法的潜力。例如, 单分子检测降 低了试剂成本并使长读长成为可能, 且最小样品制备消除了精细模板处理和扩增的费用。 跨越检测器的快速 DNA 转移速率 ( > 1M 碱基 / 秒 ) 提供了非常高通量的潜力以及简单的 低成本单分子转运。 此外, 无化学要求与检测过程同时进行, 因此增加了检测效率并降低了 复杂性。 最后, 采用简单的操作, 其以大规模电极利用直接的电检测, 并且使用低成本仪器, 其利用固体集成电源进行 DNA 序列的转运和检测。
     鉴于 ds-DNA 的直径为约 2nm, 经设计分子横截面直径为 2、 2.8、 3.5 以及 4nm 的报 道子被认为在纳米孔中产生的反应与图 7 所示相似。更具体而言, 图 7 描述 4 种不同的报 道子 ( 即编码 A、 C、 T 和 G 的报道子 ) 依次穿过纳米孔时的纳米孔反应。( 注意, 这些图标 并非是按比例的, 因为预料报道子比碱基长> 50 倍。预料替代多聚体具有更高的质量和更低的平均负电荷, 因此会比 ds-DNA 运行的 慢。降低报道子转移速率的方法包括, 增加报道子长度、 增加报道子质量、 降低报道子电荷 密度、 增加试剂粘性和 / 或降低转移电势。在 10k-100k 报道子 / 秒的检测速率下, 大报道 子信号预期能提供对 2 级或更高的多级编码而言足够的信噪比。
     纳米孔检测的变型使用通过纳米孔转移的游离荧光离子的光检测。 纳米孔光检测 技术的优势, 对于大纳米孔阵列而言, 变得特别有意义。 利用犁刀计数 (Coulter counting) 的阵列需要每个纳米孔与下一纳米孔电分离。制备微小的分离的贮存器富有挑战性, 因为 流体是导体。本文所公开的光检测技术允许纳米孔阵列共享顺式和反式贮存器 ( 对于共同 的样品而言 ), 从而消除了小贮存器的需要和相关的流体学问题。此外, 光检测允许使用高 通量 CCD 或 CMOS 成像传感器测量全部纳米孔阵列。通常, 光检测方法可用于检测替代多聚 体和核酸两者。
     图 8 表示带有替代多聚体 (44) 的纳米孔 (43), 替代多聚体 (44) 正在穿过该纳米 孔 ( 转移 )。纳米孔的顺式侧具有高浓度的荧光团 (45), 如荧光素 ( > 10mM)。荧光素的直 径为约 1nm, 并且在弱碱性条件下电离, 电荷为约 -1 的基本电荷。以与犁刀计数相似的方 式, 在贮存器之间并跨越纳米孔施加的电压, 驱动受纳米孔阻力限制的离子电流。 对于荧光 素的实例而言, 其离子由通过纳米孔转移的部分阴离子电流组成。贮存器的相对电阻通过 添加诸如 KCl( 通常浓度为约 1mM) 的其他电解液而平衡, 以提供适当的电导率。这种电解 液也有助于离子电流并且如果其浓度过高, 会与荧光团电流竞争。
     该检测方法检测穿过纳米孔的荧光团的荧光而不是检测电流。 反式贮存器中的荧 光团从纳米孔开口快速扩散掉。 随着替代多聚体通过纳米孔转移, 其调节荧光团电流, 荧光 团电流依次调节反式侧荧光。
     荧光检测必须限制由于顺式侧荧光团 ( 其浓度相对较高 ) 导致的背景噪音。使用 落射荧光显微术检测的一种方法, 通过在纳米孔基质上应用封阻膜 (46) 限制背景噪音。示 例性的封阻膜是金膜。该膜自身不需要到达纳米孔的边缘, 但膜中的任何孔或缺口应当优 选为<< λ/2n, λ/2n 即试剂介质 ( 指数 n) 中激发光波长的一半。例如, 在使用 480nm 激 发的一实施方案中, n 为约 1.33( 水 ), 则缺口必须为<< 180nm。位于 10nm 纳米孔中心周 围的带有直径为 30nm 的孔的厚度为 50nm 的金膜, 满足这一标准, 并限制光在两个方向上跨 越膜并穿过缺口的传播。
     为 了 检 测 荧 光 调 节, 有 利 的 是, 荧 光 收 集 体 积 (fluorescence collection volume) 中荧光团的寿命小于调节率。这种有限的寿命可以利用几种不同的方法实现。已 经实施了荧光扩散的 3D 模型, 其表明荧光团以毫秒级别从约 1 微米的纳米孔扩散掉。
     图 9 图示荧光素以 20 个分子 /μs 通过纳米孔转移后, 随时间扩散到无限大的反 式贮存器中的模型数据。体积定义为以纳米孔出口为中心的半球。荧光团在每个连续更大 的体积中随着持续更长的时间接近稳态浓度。
     检测荧光的体积限制为以纳米孔为中心、 半径为约 1 微米或更小的半球。以每碱 基小于 1ms 的速率转移替代多聚体通过纳米孔, 以便信号水平接近稳态。在一些实施方案 中, 在荧光团进入反式贮存器后, 可以通过用添加剂 (48) 使荧光团淬灭 ( 在图 8 中以 (47) 表示 ) 来增加带宽性能 ( 以信号为代价 )。这类添加剂的实例是适合结合荧光团的淬灭剂 ( 如 QSY7 或 QSY9, 可从 Molecular Probes/Invitrogen, Carlsbad CA 获得 )。可选地, 能氧化荧光团的自由基可以用作荧光淬灭剂。诸如偶氮异丁腈 (AIBN) 的自由基发生器是自 由基的可能来源。通过控制这些添加剂的浓度, 可以缩短荧光团在反式贮存器中主动发出 荧光的时间, 并降低 “老” 荧光团 ( 即已经通过纳米孔转移的荧光团 ) 的背景。
     图 10 表示基于示例性实施方案的图表, 其中按时间, 将荧光团转移限制为 5 级阻 塞水平 (20、 17、 14、 11 以及 8 个荧光团 /us)。荧光团扩散掉, 但是以 600μs 的半衰期在贮 存器内被随机淬灭。这种淬灭作用为信号减少存在的荧光团的数量, 但是也限制了检测体 积, 并建立达到稳态的更快时间 ( 在每一水平 )。
     在另一实施方案中, 消除荧光背景的方法包括, 设计检测器, 以便仅在纳米孔出口 处观察有限的体积。锥光法是一类这样的示例性方法。光检测方法的优势在于, 荧光团电 流可以是高度放大的信号。例如, 与非光学方法相反, 纳米孔阵列的密度可以非常高, 因为 其不需要在纳米孔间分离贮存器。 此外, 检测非常适合简单的单色落射荧光显微镜, 并且利 用高速成像系统的进展。荧光背景可以通过使用包含封阻膜的纳米孔基质进一步降低。用 于这一目的的示例性封阻膜包括金膜。
     读取替代多聚体的报道构建体的另一示例性实施方案是离子指示剂检测。图 11 描绘了离子指示剂检测的实例。这是纳米孔变型, 其使用激发光 (50) 和离子选择性指示剂 分子 (54) 产生荧光信号 (55)。 信号振幅取决于通过纳米孔 (56) 转移的指示剂离子的数量。 在图 11 中, 指示剂离子 (49) 装载于顺式贮存器上, 且指示剂分子装载于反式贮存器上。指 示剂离子通过熵力和电场力通过纳米孔转移。它们转移的速率取决于纳米孔的阻塞状态。 设计替代多聚体报道子, 以提供不同的阻塞状态。 一旦指示剂离子已经转移 (52), 则指示剂 分子会与它们偶联 (53), 并改变它们的荧光发射特征 (55)。
     例如, 在一离子指示剂检测实施方案中, 指示剂离子 Ca+2, 会与指示剂 Fura-3( 可 从 Molecular Probes/Invitrogen, Carlsbad CA 获得 ) 偶联, 且在 UV 激发下, 在约 520nm +2 下的发射增加 40X。当替代多聚体通过纳米孔转移时, 每个报道子限制 Ca 离子转移的速 率, 并改变反式贮存器侧的离子分布。 位于反式贮存器中的指示剂与 Ca+2 离子偶联, 并增加 +2 +2 荧光。对于给定的 Ca 转移速率, 检测的荧光水平达到稳态, 因为新的发荧光的 Ca / 指示 剂化合物产生的速率, 等于它们解离的速率和 / 或扩散出检测体积的速率。与上文所述的 荧光电流方法不同, 顺式贮存器中不存在荧光团或吸收剂, 这表示纳米孔出口 ( 即反式贮 存器侧 ) 的体积, 可以从顺式侧照亮, 以激发荧光团。与上文的荧光电流方法一样, 离子 / 指示剂对从纳米孔扩散掉, 并在最少的时间内 ( < 1ms), 在接近纳米孔的小体积 ( < 1um) 内, 建立稳态。
     为了将检测体积限制为这一小体积, 可以使用两个示例性方法。反式贮存器中不 发荧光的吸收剂会随深度以指数方式将激发光吸收到贮存器中, 以限制检测深度。落射光 显微镜可以用于在空间上描绘体积的横向尺寸。
     在也使用落射光显微镜的可选实施方案中, 可以通过掩蔽以纳米孔为中心的小开 口 ( 直径< 1um), 描绘体积。这在纳米孔出口处将大多数荧光收集限制到小的无阴影的体 积。
     可用于本方法中的其他示例性指示剂包括 Fluo-3、 Indo-1 以及 Fura Red( 可从 Molecular Probes/Invitrogen, Carlsbad CA 获得 )。可以用于本方法中的其他示例性离 子指示剂包括但不限于单线态氢离子、 单线态氧、 钾、 锌、 镁、 氯和钠, 所有这些都具有商购可获得的荧光指示剂 ( 可从 Molecular Probes/Invitrogen, Carlsbad CA 获得 )。
     在另一实施方案中, 使用淬灭而不是增强。图 12 图解该淬灭荧光方法。如图 12 所示, 荧光团 (57) 存在于一个储存器中, 淬灭剂 (58) 存在于另一个储存器中。当淬灭剂 流过纳米孔时, 其在纳米孔处的浓度最高, 当其从纳米孔扩散掉时, 其浓度降低至较低的浓 度。激发光 (59) 使荧光团发荧光 (60), 但该荧光与淬灭剂浓度成比例地被淬灭 (61)。纳 米孔基质可以任选地包含封阻膜 (62)。封阻膜的非限制性实例是金膜。
     在上述示例性的实施方案中, 可以将荧光素以约 10mM 的浓度装载于反式贮存器 上, 且可以将碘化物离子以约 1M 的浓度装载于顺式贮存器上。 碘化物可以以约 nA 的水平通 过纳米孔转移, 从而导致纳米孔附近的碘化物的浓度可以充当激发的荧光素 ( 用 488nm 的 光激发 ) 的淬灭剂。通过从顺式贮存器侧利用落射光捕获荧光并在纳米孔周围进行掩蔽, 可以在反式贮存器中从小体积 ( < 1μm3) 收集荧光。纳米孔中的阻塞水平建立荧光淬灭 的水平, 并为解码序列信息提供信号。 在另一实施方案中, 转移阻塞水平可以利用化学发光 检测。该方法利用两个种类, 即 A 和 B, 其能结合形成激发态的化合物 C’ 。A 和 B 可以分别 装载到顺式和反式贮存器中, 如果一种通过纳米孔转移, 则反应并形成 C’ 。当 C’ 返回基态 时, 发射光子。光子发射的强度可以用作纳米孔阻塞的度量。可用于本方法的化学种类的 非限制性实例包括, 鲁米诺 / 过氧化物酶和萤光素 / 萤光素酶。
     在另一实施方案中, 可以使用荧光共振能量转移 (FRET) 检测。示例性 FRET 检测 的实施方案使用孔阵列 (PXp)。 在该实施方案中, 利用本文所述的方法组装替代多聚体。 替 代多聚体报道子加载有 1-4 个激发波长的 FRET 供体荧光团。FRET 受体荧光团连接于多孔 节点入口。 当替代多聚体转移通过多孔节点时, 用光源激发其供体荧光团, 并且当报道子穿 过, 接近纳米孔入口处的受体荧光团时, 受体被激发并发射它们的特征荧光。 将这些发射物 解码成相关的核苷酸序列。发射可通过波长、 波长比、 发射强度、 发射物长度或上述的组合 来调节。
     在另一实施方案中, 可以使用纳米梳检测器阵列。 如下文更详细的描述, 纳米梳通 过捕获带连接臂的替代多聚体并引导其进入其通道的底部来执行呈递功能, 但纳米梳还包 括检测替代多聚体的装置。图 13A 和 13B 描绘了示例性的实施方案。纳米梳包括一对侧电 极 (63)、 绝缘层 (64) 和隔离物 (66), 替代多聚体 (67) 在所述侧电极之间穿过。检测器位 于纳米梳槽中或在纳米梳槽的末端, 引导替代多聚体通过纳米梳槽 (65)。当替代多聚体被 牵引穿过时, 检测器读取报道元件。读取报道元件的模式包括但不限于 : 1) 通过替代多聚 体报道子阻塞电解液电流 ( 犁刀模式 (Coulter Mode)), 或 2) 报道子是导电的, 且在两个电 极间形成电流通路。在一些实施方案中, 使用具有不同密度的导电多聚体的报道子。报道 子在电极对的槽交叉处以不同电阻使两个电极短路, 所述电阻可以被解码成替代多聚体的 亲代 DNA 序列。
     纳米梳检测器和报道子的尺寸要求替代多聚体的位置紧密可控。因此, 纳米梳必 须以能实现期望控制的方式被制造。例如, 纳米梳的通道或槽是两个晶体平面交叉形成 的。通过使用各向异性硅蚀刻, 可以将纳米梳的槽的底部非常尖锐限定为半径< 10nm。纳 米梳检测器元件优选位于晶片表面和每个槽的连接处附近, 因此其可以通过使用薄膜和常 规晶片加工形成。产生两个电极的一示例性方法使用两层重叠的薄膜, 所述薄膜交叉的边 缘限定硅的非对称刻蚀掩模。用导电金属 ( 如 Au) 在这些薄膜上进行阴影包被 (Shadowcoating) 产生两个电极, 这两个电极被阴影和膜厚度隔开。 在一些实施方案中, 可以要求其 他掩蔽, 以进一步限定导电电极。
     在一些实施方案中, 线性化阵列中所呈递的 “读取” 替代多聚体的直接方式使用电 子束显微镜检术。 电子束显微镜检术 ( 如扫描电子显微镜检术 (SEM)) 能具有约 1nm 的分辨 率, 并且针对不同应用已经开发了大量不同的技术。在本实施方案中, 通量是非常重要的, 而分辨率可以妥协。 例如, 因为替代多聚体在线性化阵列中沿着单轴排列, 所以电子束不需 要垂直于替代多聚体主链的分辨率, 并且可以在该维度上将其变宽, 以形成线聚焦而非点 聚焦。
     电子束以线聚焦沿着替代多聚体主链轴扫描, 用于捕获数据。线状电子束的长度 受其产生的背景噪音的限制。该背景噪音使替代多聚体所发射的信号受损 ( 即降低信噪比 (SNR))。长的线状电子束的优势在于, 减少横向定位的需要。在一些实施方案中, 报道子中 诸如硼或纳米金的物质为电子束提供了大散射截面, 用于产生高反差信号。在一些实施方 案中, 可以优化 SEM 波束角, 以改善 SNR。
     在一些实施方案中, 常规的后处理, 例如, 通过向线性化阵列沉积高反差包被如金 膜, 可以提供增强的 SEM 反差。在电子束检测中, 可以使用其他薄膜技术在电子束检测中提 高替代多聚体的 SNR, 所述技术包括阴影沉积 (shadow deposition)、 电沉积、 真空沉积以及 蚀刻。
     在一些实施方案中, 刀刃式传导可用于检测替代多聚体。在这些实施方案中, 替 代多聚体包含一个或多个刷状多聚体报道子, 其中刷状多聚体报道子包含导电聚合丝。图 14A-C 举例说明示例性的多通道刀刃式检测器, 其沿着线性阵列基质 (68) 滑动。包含刷状 多聚体报道子 (70) 的替代多聚体 (69) 呈递于线性化阵列上, 所述阵列对齐并被检测通道 的间距所隔开。它们与线性化阵列基质的导电基础平面 ( 例如金膜 (71)) 电接触。与替代 多聚体主链轴垂直的刀刃式电极 (72), 以约 10nm 的间隙置于基质基础平面上, 该间隙由沿 其每一侧的摩擦隔离物 (73) 形成。 在刀刃式电极和线性化阵列基础平面间施加电势。 当检 测器沿着基质滑动时, 替代多聚体报道子在刀刃式电极下依次穿过。报道子的导电聚合丝 在电场桥的影响下发挥作用, 产生接触并在刀刃式电极和基础平面间完成电路。电流提供 检测信号。报道子经选择, 可以具有不同的电阻或不同长度, 从而产生可区别的电流特征, 用于解码替代多聚体信息。 区分不同电阻水平的示例性方法, 是使用不同的导电丝密度。 导 电多聚体的非限制性实例包括聚乙炔、 聚苯胺以及聚吡咯。
     在可选的实施方案中, 荧光显微镜检术可用于替代多聚体检测。替代多聚体标记 有一种、 两种或多种光谱类型的荧光团。 一实例是使用两种具有不同发射光谱的荧光团, 例 如红色和蓝色。四种核碱基中的每一种都可以利用 4 种发射状态唯一地识别 : (1) 仅红色, (2) 红色>绿色, (3) 绿色>红色, 以及 (4) 仅绿色。
     为了维持高信息密度而不是实际的荧光捕获, 替代多聚体可以以密集平行的堆积 排列被呈递, 间距为约 1 微米。具有 10 微米像素和 40× 物镜的传感器, 提供 250nm/ 像素 的分辨率 ( 或 4 像素替代多聚体间间隔 )。为了解析报道子, 它们的最小间隔为约 200nm。 这可以通过激发近场、 零模式 (zero mode)、 STORM 或 FRET/Quench 方法进一步减少, 用于更 局部化的检测。
     在另一实施方案中, 可以使用利用切口而不是毛细管的光学近场方法, 以沿着替代多聚体的轴将激发能局限于< 100nm。用从切口中产生的近场源激发替代多聚体报道子 的荧光团, 并在远场中检测荧光。当沿着线性化阵列并沿着替代多聚体的轴扫描切口阵列 时, 检测的荧光可以被展开, 以产生替代多聚体的序列信息。
     呈递方法
     SBX 方法产生替代多聚体的富集产物, 该产物随后被呈递于检测装置以 “读取” 报 道子序列。示例性的检测方法包括上文所讨论的那些方法, 以及本领域已知的其他检测方 法。为了改善检测器的性能, 可以进一步处理替代多聚体产物, 用于呈递至检测器。例如, 在一些实施方案中, 替代多聚体的电荷特征经改造, 可以相似于天然 DNA 多聚体。示例性 的呈递方法包括, 分子门控 (molecular gating)、 空间限制、 流动控制、 通道化、 基质粘合 (substrate bonding) 和薄膜处理增强。 出于示例目的, 举例说明并参考替代多聚体讨论了 本文所公开的方法, 然而, 通常, 所公开的呈递方法可等同用于核酸。
     用于测定和检测报道子的重要特征是, 报道子具有呈递于检测器的统一的空间和 时间间隔。为了实现这一点, 有利的是, 适当地延伸和定位替代多聚体。发夹折叠为检测器 同时区分标记链的两个部分带来沉重负担, 并导致检测效率降低。 在相关问题中, 替代多聚 体沿着其长度应当具有固有的硬度或张力, 以防止邻近的标记物聚束。该特性有助于维持 报道子与报道子的间隔, 并维持报道子分辨率。 在最后的相关特性中, 将替代多聚体呈递于 检测器的速度, 应当均匀且稳定。 呈递报道子时的时间变化降低了检测器效率, 因为其必须 以最快的暴露需求取样, 而通量仅取决于平均暴露需求。 本文所公开的实施方案, 详述了这 些需要并提供了其他优势。
     将替代多聚体呈递于检测器的方法的非限制性实例包括 : (1) 流入 (in-flow), (2) 连接于固相基质, 和 (3) 对齐排列在基质表面上。图 14 阐明了这一概念。图 15A 说明 以随机和有序 ( 例如门控 ) 模式流入呈递的替代多聚体。 箭头表示替代多聚体流动的方向。 图 15B 说明以随机和有序 ( 例如阵列 ) 模式、 以连接于固相基质而呈递的替代多聚体。最 后, 图 15C 说明以随机和有序 ( 例如阵列 ) 模式在基质表面对齐而呈递的替代多聚体。
     “流入” 呈递的实例是, 当替代多聚体流至并通过纳米孔检测器时。通过该检测技 术, 2 种至 4 种报道子类型可以提供相应数量的电流水平, 用该电流水平编码碱基序列信 息, 并以 10-1000k 报道子 / 秒的通量速率得以检测。对于测序通量为> 1G 碱基 / 小时, 需 要平行安放纳米孔。
     图 16 表示具有可用于流入呈递方法的孔阵列 ( 称为 PXp) 的基质。基质包含规则 的节点阵列, 每个节点具有一个或多个孔。 当阵列在每个节点处具有单个孔时, 其是纳米孔 阵列 (NXp)。如上文所讨论的, 纳米孔通道经设置可以包含检测器元件。因此, 图 16 所描绘 的阵列提供了并行检测替代多聚体的可能的方法。
     在示例性实施方案中, NXP 的每个纳米孔通道经设置允许检测替代多聚体。在该 实施方案中, 替代多聚体的浓度必须得到控制, 以便使纳米孔通道的效率最大化。 替代多聚 体及时随机到达检测器, 伴随 0、 1、 2 或更多个替代多聚体在任何设定的时间内到达。根据 泊松统计, 在给定的取样期内, 最大约 37%的该时期, 会具有单个替代多聚体到达。剩余时 期会具有 0、 2 或更多到达。当相邻替代多聚体的重叠得到解决时, 该每个通道的单个替代 多聚体的百分比进一步减少。 所有分子具有相等的长度和速度但是具有随机到达时间这一 情况的建模表明, 仅仅 18%的读取时间会产生完全非重叠的读取。 理想的模式是, 使单个分子头尾排成一行, 因而检测器不会遇到缺口, 并且总是会遇到单个分子的一部分。
     在上文的实施方案中, 一些替代多聚体可以处于使效率降低更多的折叠状态 ( 假 定检测器仅区分未折叠的替代多聚体 )。长替代多聚体的可溶性和迁移率的限制可以进一 步限制填充效率, 因为即使以最大可溶浓度, 替代多聚体仍不能足够快地填充纳米孔以达 到 18%的填充。因此, 本领域需要优化纳米孔阵列检测器的效率的流入呈递方法。本文所 公开的示例性实施方案克服了与纳米孔阵列检测有关的问题, 并提供了其他优势。
     在一实施方案中, 向替代多聚体的末端添加低分子量的带电荷的长线性多聚体, 可以有助于替代多聚体的进入, 这是因为相对于替代多聚体本身, 该多聚体的迁移率和电 荷密度更高。 例如, 具有线性电荷密度和 / 或与 DNA 具有相同电荷状态 ( 即带负电荷 ) 的多 聚体可以连接于替代多聚体的末端。如图 17A 和 B 所示, 此类多聚体 (74) 的末端可能会以 折叠或非折叠状态以高的多的效率被牵引到纳米孔 (75) 中, 从而在替代多聚体 (76) 的前 面转移, 并将其牵引到纳米孔中。 带有高负电荷的低线性密度多聚体的非限制性实例包括 : 聚谷氨酸和聚磷酸盐。为了进一步增加进入纳米孔的可能性, 一实施方案使用与替代多聚 体的一个或两个末端连接的多个多聚体。 优化多聚体的长度, 以便使进入的可能性最大化, 但是切不可显著干扰替代多聚体的检测。在一些实施方案中, 多聚体的长度可以为微米。
     增加跨越纳米孔的电势, 可以改善填充性能。因此, 在一实施方案中, 主动监控纳 米孔电流, 并增加电压 ( 由此, 增加纳米孔填充效率 ), 直到进入的替代多聚体得到检测, 并 随后降低至期望的检测电压, 直到替代多聚体检测完成。 随后再次增加电压, 直到随后的替 代多聚体进入。
     在一些实施方案中, 读取效率通过主动将检测器 ( 例如, 在犁刀样纳米孔的情况 下, 电流检测电子学 ) 转换到已填充有处于准备检测状态的替代多聚体的纳米孔阵列而增 加。当检测完成时, 将检测器转换到预填充替代多聚体的另一阵列。在一些实施方案中, 预 填充可以用足够的纳米孔阵列离线进行, 以完成全部测序工作。 在其他实施方案中, 预填充 是实时功能, 由此预填充发生于一个或多个阵列上, 同时测量在另一阵列上进行。
     图 18A 到 18C 阐述预填充概念。在所阐述的实施方案中, 替代多聚体 (77) 首先适 合具有一个障碍物 (78), 其防止替代多聚体穿过纳米孔但允许它们进入。障碍物的非限制 性实例包括珠子和大体积树枝状大分子。为了适应珠子障碍物, 使替代多聚体末端的连接 物与珠子表面上的合适的化学物质在低替代多聚体浓度和高珠子浓度下发生反应。 收集并 洗涤珠子, 以去除未反应的替代多聚体。 接下来, 在过滤出珠子连接的替代多聚体的电泳场 中去除未反应的珠子。 此时, 通过跨越孔施加电压 ( 在图 18A 中描绘为电场 E), 使连接有珠 子的替代多聚体进入纳米孔阵列。 在稀释条件下, 替代多聚体会各自穿过纳米孔, 直到障碍 物 ( 如珠子 )。 通过由于作用于带电荷的替代多聚体的电场而产生的转移力, 使障碍物被牵 引而紧靠纳米孔, 并密封纳米孔, 从而防止其他替代多聚体穿过同一纳米孔。其继续进行, 直到纳米孔各自都具有单个替代多聚体 ( 图 18B)。 现在可以通过使电压反转, 检测阵列, 从 而在反方向驱动替代多聚体并收集检测顺序 ( 如电流 )。
     在可选的实施方案中, 可以使用机械力进行转移。该实施方案在图 18C 中进行了 说明, 其中通过降低与替代多聚体末端连接的基质 (79), 而牵引替代多聚体通过纳米孔。
     在另一实施方案中, 磁珠障碍物提供其他功能。 如图 19A 所示, 替代多聚体 (80) 可 以包含与一末端连接的磁珠 (81)。 在磁场 B 中, 珠子被驱向纳米孔阵列表面, 这增加了浓度和进入的可能性。在替代多聚体进入纳米孔, 并通过施加的电场 E 而固定在纳米孔中之后, 通过在相反方向施加低磁场, 可以将未进入纳米孔的替代多聚体拉走, 如图 19B 所示。通过 进一步增加磁场 ( 并按需要调节所施加的电场 ), 替代多聚体可以伸展, 并会在任一方向上 通过纳米孔转移, 这取决于哪种力量占优势。 如果磁场力占优势, 则纳米孔转移具有由于布 朗运动而导致的速度不规律。 利用移动速度比磁珠慢的平台 (83), 如图 19C 所示, 转移速度 可以跨越纳米孔阵列受到统一的控制。
     在另一实施方案中, 线性铁氧体多聚体引导子可以适合替代多聚体的末端而不是 磁珠。线性铁氧体多聚体引导子可以用于移动 ( 或拉伸 ) 替代多聚体, 这非常像磁珠, 但是 仍然可以通过纳米孔转移。
     几种不同的门控技术在本文进行了描述, 并且通常共享共同的特征。在每一情况 中, 单个替代多聚体分子经释放定期流向检测器。 选择该时期, 使得当检测器完成一个替代 多聚体分子上报道子的顺序读取时, 另一分子进入检测器并由此使检测器的工作循环最大 化。
     在一实施方案中, 替代多聚体的门控通过从基质定时释放替代多聚体而实现。参 考图 20A, 替代多聚体 (84) 以它们的位置已知或可以确定的方式连接于基质 (85)。例如, 以每一格子 (grid) 空间一连接的分子填充规则的格子是一实施方案。另一实例是, 将它们 随机放置, 但是以合适的间隔并用荧光标记, 因此它们可以被定位。 连接臂经选择具有可寻 址的可切割偶联 (86), 以便替代多聚体可以按要求释放 (87)。可寻址的切割的示例性方法 包括 : (i) 利用诸如聚焦激光束的定向光源的光裂解连接 (88), (ii) 热释放连接, 其中局部 加热通过可寻址的电阻或激光实现, 和 / 或 (iii) 电化学连接, 其中可寻址的电极可以驱动 氧化还原反应。
     图 20B 说明称为电诱捕或电极门控的另一实施方案。 在该实施方案中, 将电场 ( 即 电极 89、 90 以及 91) 置于检测器 (92) 的前方, 以便当分子在检测器中并被 “读取” 时, 抵制 替代多聚体远离检测器区。当分子被读取 ( 或接近完成读取 ) 时, 将门控场反转, 并使检测 器前方溶液中的替代多聚体吸引至检测器。一旦一个替代多聚体进入检测器, 则再次将门 电场反转, 以抵制其他替代多聚体。维持门场 (gate field) 足够低是必要的, 以便检测器 中的替代多聚体不会因为排斥性门控力而缩回。
     图 20C 举例说明称为膜门控的另一门控实施方案。该实施方案共享以前实施方案 的特征, 但是还包括帮助展开替代多聚体和过滤打结或成簇的那些替代多聚体的特征。该 实施方案使用薄过滤膜 (93), 该过滤膜的孔为 20-100 纳米级别。 示例性膜包括氧化铝多孔 膜和形成多聚体轨道的膜。
     再参考图 20C, 多孔电极 (94, 95) 将膜夹在中间。当在电极间施加场时, 替代多聚 体通过电泳转运。当其进入膜时, 由于膜的孔狭窄其优选从一末端进入, 并被牵引通过。当 其从膜中露出时, 孔提供伸展替代多聚体的牵引力。替代多聚体向检测器 (96) 的流动, 通 过关闭场或施加高频交流电场而受到控制, 从而终止电泳转运力。 在后一实施方案中, 交流 电场可以辅助伸展替代多聚体而不转运它。为了利用该实施方案的门控功能, 使用与上文 所述相似的反馈机制。
     仍然在图 20D 所述的另一实施方案中, 使用两个或多个可寻址的门电极 (97, 98) 给检测器 (99)“供料” 。在该实施方案中, 打开每个门电极 ( 门开放 ), 直到替代多聚体得到检测, 并随后关闭 ( 门关闭 )。 “控制” 替代多聚体分子的门 (100), 定期打开, 以便非重叠 的头尾相连的替代多聚体的稳定流供进检测器。 门类型的非限制性实例包括多孔膜和纳米 孔, 所述多孔膜利用替代多聚体结合的荧光检测门中的所述替代多聚体, 所述纳米孔使用 电流确定替代多聚体的存在。
     在 呈 递 替 代 多 聚 体 的 流 动 方 法 中 有 一 些 包 括, 使 用 拖 拉 标 签、 水力矫直 (hydrodynamic straightening)、 电场梯度和磁场力。 在一实施方案中, 使用亲和拖拉标签 使替代多聚体顺直且伸展, 如图 21 所示。将弱亲和拖拉标签 (101) 连接于替代多聚体的末 端。随后以电泳方式牵引替代多聚体 (102) 通过适当的亲和凝胶或通道 (103)。弱亲和偶 联在替代多聚体末端产生摩擦, 该摩擦允许剩余的替代多聚体解开并在场中展开。
     一些检测方法最适合这样的替代多聚体 : 其在一末端连接于基质且通过相对于该 基质移动检测器阵列而得以读取。此类基质作为固定的替代多聚体阵列 ( 在本文中也称为 固定的阵列 ) 而著称。图 15B 表示, 替代多聚体可以是以空间随机连接的方式表面连接的, 或它们通过单个替代多聚体在每一阵列点连接于规则的阵列上。通过随机空间连接, 利用 二维泊松统计指导检测器的效率, 对于任何期望的合适的细胞大小, 最佳地在约 14%的细 胞内给出一个分子 / 细胞。通过比较, 连接有单个替代多聚体位点的完全装载的规则阵列 为 100%。这比以替代多聚体更多预处理为代价的检测效率增加 7 倍。
     具有中间效率的其他包装模式也是可能的。例如, 通过一维泊松统计管理带有点 连接位置的规则的固定阵列, 所述点连接位置可以偶联多个连接臂。这种策略最佳为 37% 的位点由单个替代多聚体占据。
     规则的固定阵列的一实施方案使用光滑的基质, 其具有置于规则格子上的大小 < 1 微米的小结合位点。替代多聚体可以适合结合这些位点。如果将它们随机连接, 则 37%的这些位点具有单个替代多聚体。示例性基质选择包括 : 诸如韧性聚对苯二甲酸乙二 酯 (PET) 膜的带状物 (tape)、 浮法玻璃、 硅晶片、 以及不锈钢片。 将阵列格子大小选择为, 对 应于待使用的检测方法。
     产生每一结合位点具有单个替代多聚体的固定阵列的示例性方法, 使用基质上的 一列非常小的斑点。这些斑点包含表面结合的反应性连接物。使替代多聚体的末端适合分 子复合体, 所述复合体具有很多反应性末端基团, 其中每个分子复合体具有足够的相对流 动性, 以便与所有斑点的连接基团反应。 因此, 每一个表面阵列斑点仅与单个替代多聚体连 接。示例性分子复合体包括 : 珠子、 树枝状大分子和具有侧链的线性多聚体。
     在稀释条件下使末端适合的替代多聚体反应, 以限制多个替代多聚体与单个斑点 反应。表面结合连接物可以从许多现有的广为接受的化学物质中选择, 例如生物素 / 链霉 抗生物素。在一实施方案中, 利用经修饰与基质相连的生物素化的 PEG( 例如对于金膜硫醇 化, 或对于 Si 或 SiO2 硅烷化 ), 可以将生物素连接于基质。以相似的方式, 可以将聚乙二 醇化的链霉抗生物素 (pegalated strepavidin) 与替代多聚体上的末端适合分子多聚体连 接。
     使连接斑点的直径最小化, 从而限制结合面积, 但是必须有效制备阵列, 因为每 2 7 9 个基因组制剂需要涵盖高达 100cm 或更多面积的 10 -10 个斑点。暴露每个斑点的电子 束光刻是时间密集且昂贵的。然而, 使用电子束光刻限定掩模是制备阵列的合理方法。 Molecular Imprints, Inc. 已经开发了压印技术 ( 利用电子束压印模型 ), 由此, 可以将< 20nm 的带有高突出浮雕 (aspect relief) 的特征限定在石英掩模中。这些可以用于限 定接触印刷压模 (contact printing stamp), 用于连接物 ( 例如生物素 ) 的直接压模。可 选地, 可以用金属掩模斑点阵列作为接触掩模, 用于生物素单层的 UV 消融。当单层靠着金 属时, 其受到防 UV 的保护作用, 而未掩蔽的区域被剥离。
     使用光刻胶剥离 (photoresist liftoff) 或受保护的蚀刻的光刻技术, 也可以用 于制备阵列。限定连接位点的行列而不是点是在点阵列的 2D 随机表面连接和一对一替代 多聚体连接之间的折中。在本实施方案中, 替代多聚体沿着行列随机连接, 只要行列宽度 比沿着行列的替代多聚体间的平均间隔窄的多, 连接的替代多聚体就会位于一维泊松分布 ( 即在最佳泊松统计中 37%的填充因子 (fill factor)) 中。该实施方案的优势在于, 光刻 是相对简单的技术, 并且替代多聚体仅需要适合具有单个反应性位点。
     将替代多聚体末端的附加化学物质设计为, 以防止或最小化每个结合位点多于一 个替代多聚体的方式连接于基质结合位点。 一实施方案使用连接于替代多聚体末端的树枝 状大分子, 用于将替代多聚体连接于基质。 将树枝状大分子设计为, 使结合位点上的所有偶 联能力饱和或将其封闭, 由此防止另一树枝状大分子 ( 另一替代多聚体上 ) 结合同一位点。
     在另一实施方案中, 预填充纳米孔阵列, 并用作固定阵列。在该实施方案中, 替代 多聚体适合在一个末端具有障碍物, 所述障碍物允许替代多聚体进入纳米孔, 但会阻止替 代多聚体的末端完全转移。另外, 障碍物发挥将纳米孔填充限制为每个纳米孔一个替代多 聚体的功能, 因为第二替代多聚体不能进入 “堵住的” 纳米孔中。在用替代多聚体填充阵列 后, 将障碍物固定于适当的位置, 以产生固定阵列。示例性障碍物包括珠子和树枝状大分 子。
     在另一实施方案中, 通过使替代多聚体在基质表面对齐进一步处理固定阵列, 以 产生图 15C 所示的线性化阵列。在该实施方案中, 格子长度必须足够长, 以允许替代多聚体 伸展平放且不被其他替代多聚体重叠。示例性的格子大小为约 10 微米 × 约 500 微米。
     在示例性的固定阵列实施方案中, 将替代多聚体完全固定于基质表面, 检测器通 过相对于基质表面横向移动依次读取替代多聚体报道子。 该方法需要在检测前另外预处理 替代多聚体, 但其为检测提供了新机会并且为重读和存档功能提供了更易存取的介质。
     对于表面对齐方法, 应当有效使用表面积, 用于进行有效检测但也用于限制基质 成本。因此, 替代多聚体必须以非常可控的方式偶联于基质。实现对齐的替代多聚体在基 质表面上的高密度规则阵列的一实施方案是, 首先产生如上文所述的可连接替代多聚体的 规则阵列 ( 即固定阵列 )。接下来的步骤是, 将替代多聚体平放于基质表面并使之与其结 合。
     基质表面上的替代多聚体密度取决于工艺限制和检测技术。在一些实施方案中, 替代多聚体密度在平行替代多聚体间为约 1-10μm, 并且比依次分隔的替代多聚体与替代 多聚体之间的间隔长约 10%到约 30%。 例如, 150μm 的替代多聚体可以沿其长度与下一个 替代多聚体分隔 30μm。为了防止替代多聚体过早地结合表面并且发生位移, 有利的是, 使 用当需要时可以应用的实时结合激活方法。例如, 表面的紫外线激活和化学激活是示例性 的结合激活方法。在基质表面平放替代多聚体的示例性方法, 在下文进行了描述。
     在一实施方案中, 在电场中拉伸替代多聚体, 且使所述电场从基质法线平稳地旋 转 180 度, 通过基质的切线 ( 处于 90 度 ) 并最终到达负法线位置。 对于替代多聚体而言, 这必须足够缓慢地进行, 以使其在电场中维持拉伸的位置。通过超过 90 度旋转, 替代多聚体 以延伸的伸展位置固定于基质上。当替代多聚体接触基质时, 其被结合在适当的位置。在 一些实施方案中, 可以使用小于 180 度的旋转, 只要替代多聚体能自由移动至伸展位置 ( 在 期望的方向上 ), 并且随后可以被固定于 ( 如通过电场力 ) 基质。
     示例性实施方案表示于图 22A 中。在该实施方案中, 连续处理韧性带状基质 (104), 例如 PET 膜。当带状物移动并进入旋转的辊子 (roller) 时, 带状物表面上的替代多 聚体保持垂直于带状物的方向 (105)。继续转动第一个 90 度, 它们与场 (108) 保持对齐并 被拉伸, 但相对于带状物表面旋转, 直到它们平放于带状物表面 (106)。当带状物围绕下一 个 90 度旋转移动时, 场此时将替代多聚体固定于带状物表面 (107)。如果适当激活表面和 / 或替代多聚体, 则替代多聚体可以结合于表面。 如果未被激活, 则其在随后的过程中结合, 或者可以维持固定力 (pinning force), 直到检测器读取了带状物。另一实施方案包括, 在 场中旋转固相基质。
     另一示例性实施方案图解于图 22B 中。在此, 利用梳状物 (109) 将替代多聚 体 (112) 向下引导至基质并将其横向引领到顺直通道 (110) 中, 使所述替代多聚体平放 于基质上。梳状物包括电极 (114a, 114b) 和基础平面 (115), 它们在输入侧产生拉伸场 (stretching field)(111), 并在其出口处产生固定场 (pinning field)(113)。当基质在 梳状物下穿过时, 连接的替代多聚体被 “捕获” 并被引领到基质连接位点附近的梳状物通道 中。通过进一步移动, 将被引领的替代多聚体牵引至基质表面。此时, 使场反转, 并且其将 替代多聚体固定于基质, 用于在需要时进行结合。
     制备梳状物的光刻方法, 使用 Si 晶片的各向异性蚀刻。在面上切割和抛光的晶体 Si 晶片, 相对于利用氢氧化钾蚀刻剂的面, 优选蚀刻。沿着规则锯齿模式的一侧, 以平行于 2 个交叉平面偏转 57 度的方向, 以光刻的方式掩蔽晶片。在蚀刻后, 垂直于表面并平行于 锯齿的边缘, 切割并抛光晶片, 以形成规则模式的缺刻 (notch), 所述缺刻形成梳状物。每 一缺刻具有 2 个在梳状物通道的槽处交叉的光滑的面。槽与晶片的顶部所形成的角度为约 55 度, 且与抛光的边缘所形成的角度为约 35 度。为了防止替代多聚体的剪切, 可以将小的 膜基流槽 (runner) 限定于基质或梳状物上。
     与上文所述的梳状物相似的另一实施方案是图 22C 所图示的刷状物。该刷状物包 括直径为约 10nm 的非常细的丝 (116)。与用上文所述的 Si 梳状物一样, 跨越固定阵列基 质 (117), 牵引刷状物。只要丝扫过表面, 则从基质与替代多聚体连接处开始, 替代多聚体 (118) 沿着刷状物移动的方向变成受到拖拽和拉伸。 通过使用场或其他捕获方式, 随后将替 代多聚体固定于基质表面。
     制备刷状物的示例性方法使用 Al2O3 多孔阵列作为模子, 以形成聚合丝的刷状 物。这些刷状物可以基于 UV 或热固化的多聚体。该方法的实例描述于 Lee et al.(H. S.Lee, D.S.Kim, and T.H.Kwon“ ,UV nano embossing for polymer nano structures with non-transparent mold insert, ” Microsystem Technologies, vol.13, 2007, pp.593-599) 中。
     在通过沿着基质表面对齐替代多聚体而处理所述基质后, 可以用于获得更强烈的 信号或简化检测的进一步处理是可能的。这些方法经常与检测方法紧密结合。用金包被线 性阵列以改善电子显微镜检术反差, 是这一方法的非限制性实例。 此外, 报道子上的反应性位点可以装载有标记化学物质或照影剂。
     带状物或膜基质为替代多聚体通过检测方法的连续 “网络 (web)” 处理提供了手 段。在一实施方案中, 这可能是一个循环, 其中带状物在检测后被清洗, 并被回送以再连接 用于读取的新的替代多聚体。适合该目的的带状物包括 PET。商业 PET 膜具有< 40nm 的表 面粗度, 其通过平面化处理, 可以降低至< 10nm。 实施例 实施例 1 : 通过模板指导连接制备替代多聚体
     已经以不同的探针类型证实了 SBX。合成每个修饰的探针, 且经证明, 利用模板指 导连接从引物延伸。已经在不同的修饰阶段, 研究了长度为 2、 3、 4 和 6 个核苷酸的探针的 连接。这些探针包括下列类型的探针 :
     (1) 简单的寡聚体探针 ;
     (2) 具有 2 个用脂族氨基连接物修饰的核苷酸的探针 ;
     (3) 具有与探针的氨基连接物缀合的 PEG3500 连接臂的探针 ; 以及
     (4) 具有核苷酸间可选择性切割的连接物的探针 ( 其还用脂族氨基连接物修饰 )。
     已经合成了修饰的探针类型 (1)、 (2)、 (3) 和 (4), 并且利用模板指导连接, 每个类 型都表现出引物启动的延伸。还验证了可选择性切割的连接物的选择性切割。下文所讨论 的凝胶数据通过这些修饰的探针的进行性连接证实延伸, 并证实选择性切割。
     图 23 表示与 16-mer 的 HEX 修饰的引物双链体化且被设计为带有 20 个碱基的 5’ 悬突的典型靶模板。 用不同长度的模板检测脱离引物延伸的修饰的探针的进行性模板指导 连接。 通过凝胶电泳将连接产物分成条带, 且利用 HEX 荧光鉴定条带。 用未修饰的探针 ( 探 针类型 1) 进行实验, 以证实进行性连接的引物延伸。当在错配的模板上进行探针连接, 通 过阴性结果证实模板依赖性连接。
     图 24A 表示长度高达约 100 个碱基的连接产物。这些凝胶结果证明二 ( 氨基修饰 的 ) 六核苷酸探针 ( 探针类型 (2)) 的多模板指导连接。对于本实施例, 将模板固定于磁珠 并与 HEX 标记的延伸引物双链体化。将序列 5’ ( 磷酸 )CA( 氨基 )C( 氨基 )ACA3’ 的六核苷 酸寡聚底物在 T4 DNA 连接酶存在下与一系列逐渐增长的互补模板杂交, 从而连接并从双链 体化的引物延伸。随后使连接产物从其模板变性, 并在 20%的丙烯酰胺凝胶上分离。泳道 1-4 中的连接产物在模板上产生, 超出引物 18、 36、 68 以及 100 个碱基。在 4 个泳道中每个 泳道的序列梯的上部梯级, 对应于连接添加的 3、 6、 12 以及 17 个六聚体。这些上部梯级是 相对强的条带, 且表明长得多的连接产物是可能的。
     作为参照点, 利用检测感光度作为参照, 据估计, 表示 100 个碱基延伸物的单个条 带为 0.1pm 的连接产物。这等于 6 万亿个碱基或 60 个基因组 @20X 盖度价值的 “读取” 材 料。 这证明为何处理成本低、 缩放简单, 以及大小富集的优势在于仅将最长和最高值的替代 多聚体发送到检测步骤。
     图 24B 所示的凝胶结果表示用 PEG3500 修饰的四核苷酸探针的多模板指导连接, 所述 PEG3500 与两个修饰的探针寡核苷酸的每个末端连接 ( 探针类型 (3))。 探针前体是二 2, 3( 氨基 ) 四核苷酸 5’ ( 磷酸 )C( 氨基 )A( 氨基 )CA3’ 。随后将脂族氨基改性物转化为 4- 甲酰基苯甲酸酯 (4FB), 并将二 ( 氨基 )PEG3500 转化为二 (HyNic)PEG3500( 从 Solulink,
     CA 购买的 HyNic 缀合试剂盒 )。在稀释条件下, 使双功能 PEG3500 与二 2, 3(4FB) 四核苷酸 反应, 以形成环化的 PEG 环。如在以前实例中一样, 将模板固定于磁珠, 并与 HEX 标记的延 伸引物双链体化。在该实施例中, 模板比引物多 20 个碱基。使 PEG 环化的四核苷酸探针与 互补模板杂交, 并在 T4DNA 连接酶存在下连接。 随后将连接产物与其模板分离, 并在 20%的 丙烯酰胺凝胶上分离。凝胶结果表示含有 4PEG 修饰探针的产物多聚体的连接。这表明, 装 载有 3500 道尔顿的高分子量的双重修饰的探针可以逐渐连接于模板。( 由于凝胶的限制, 难以解决这些连接有大分子量加载的探针比四探针并入的更长 )。
     图 24C 表示与氨基改性物连接的四核苷酸探针 ( 探针类型 (4)) 的凝胶结果, 所述 探针经进一步修饰具有可选择性切割的键 (cb)。该键是核苷酸间磷酸二酯的修饰物, 并且 会在酸性条件下切割。该探针是二 2, 3( 氨基 ) 四核苷酸, 5’ ( 磷酸 )A( 氨基 )C(cb)T( 氨 基 )C3’ 。 该模板比引物多 36 个碱基, 且凝胶序列梯表示连接通过最多添加 9 个四核苷酸完 成。对照是无连接酶的相同试剂混合物。
     图 24D 表示选择性切割检测的结果。 通过选择性切割第 17 和第 18 核苷酸间的键, 产生 26-mer。泳道 1 表示 26-mer 对照。泳道 2 表示, 在使 26-mer 经历酸后, 17-mer 的切 割产物。结果表示, 26-mer 以非常高的完成水平, 基本上完全切割为更短的片段。
     实施例 2 : 通过滚环聚合制备末端配对替代多聚体
     为了制备末端配对替代多聚体, 从引物的每一末端启动连接, 所述引物杂交于 ss-DNA 模板上, 其中模板的 36 个碱基延伸出引物的 3’ OH 和 5’ 磷酸化的末端。合成从引物 的任一末端延伸出具有 4-mer 探针的连接产物。图 25 表示与 2 个不同模板即 T-36 和 T+36 连接的四核苷酸探针 ( 探针类型 (4)) 二 2, 3( 氨基 ) 四核苷酸, 5’ ( 磷酸 )A( 氨基 )C(cb) T( 氨基 )C3’ 的凝胶结果。模板 T+36 在引物的 3’ OH 末端外具有 36 个碱基, 而 T+36 在引 物的 5’ 磷酸外具有 36 个碱基。在每一情况中, 都并入探针并连接。凝胶分别表示 T-36 和 T+36 模板中未延伸的模板 (119) 和最多 9(120) 和 8(121) 个四核苷酸的添加物。

通过展开进行高通量核酸测序和相关方法.pdf_第1页
第1页 / 共111页
通过展开进行高通量核酸测序和相关方法.pdf_第2页
第2页 / 共111页
通过展开进行高通量核酸测序和相关方法.pdf_第3页
第3页 / 共111页
点击查看更多>>
资源描述

《通过展开进行高通量核酸测序和相关方法.pdf》由会员分享,可在线阅读,更多相关《通过展开进行高通量核酸测序和相关方法.pdf(111页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN102365367A43申请公布日20120229CN102365367ACN102365367A21申请号201080014202122申请日2010012961/148,33420090129US61/148,32720090129US61/148,33220090129USC12P19/34200601G01N33/4820060171申请人斯特拉托斯基因公司地址美国华盛顿州72发明人马克斯达马蒂奥斯可可里斯罗伯特N麦克卢尔74专利代理机构北京英赛嘉华知识产权代理有限责任公司11204代理人王达佐洪欣54发明名称通过展开进行高通量核酸测序和相关方法57摘要公开了核酸测序。

2、的方法及相关产物和检测并呈递相关产物的方法。用于进行靶核酸测序的方法包括提供模板指导合成所产生的子链,该子链包含偶联于序列中的多个亚基,该序列对应于全部或部分靶序列的连续核苷酸序列。30优先权数据85PCT申请进入国家阶段日2011092886PCT申请的申请数据PCT/US2010/0226542010012987PCT申请的公布数据WO2010/088557EN2010080551INTCL19中华人民共和国国家知识产权局12发明专利申请权利要求书15页说明书53页附图27页按照条约第19条修改的权利要求书15页CN102365388A1/15页21用于靶核酸测序的方法,包括A提供通过模板。

3、指导合成所产生的SX子链,所述子链包含偶联于序列中的多个亚基,所述序列对应于全部或部分所述靶核酸的连续核苷酸序列,其中个体亚基包含连接臂、至少一个探针以及至少一个可选择性切割的键,所述至少一个探针包含X个核碱基残基X是大于1的正整数和编码所述探针的Y个核碱基残基的遗传信息的至少一个报道构建体Y是小于X的正整数;B切割所述至少一个可选择性切割的键,以产生长度比所述SX子链的多个亚基长的SXPANDOMER,所述SXPANDOMER包含所述连接臂和用于确定每X个核碱基中的Y个核碱基的报道元件;以及C检测所述至少一个报道构建体,以使所述子链的每X个核碱基中的Y个核碱基的遗传信息解码。2如权利要求1所。

4、述的方法,其中所述靶核酸通过模板指导滚环聚合方法产生。3如权利要求1所述的方法,其中所述模板指导合成包括连接反应。4如权利要求3所述的方法,其中所述连接反应是酶促连接反应。5如权利要求1所述的方法,其中所述至少一个报道构建体与以下相连所述SXPANDOMER的连接臂;在所述至少一个可选择性切割的键切割前的SX子链;或在所述至少一个可选择性切割的键切割后的SXPANDOMER。6如权利要求1所述的方法,其中所述至少一个报道构建体在所述SX子链模板指导合成后,连接于所述SX子链。7如权利要求1所述的方法,其中所述连接臂在所述SX子链模板指导合成后,连接于所述SX子链。8如权利要求1所述的方法,其中。

5、所述SXPANDOMER还包含所述至少一个探针的全部或部分。9如权利要求8所述的方法,其中所述至少一个报道构建体是所述至少一个探针或与所述至少一个探针相连。10如权利要求1所述的方法,其中所述至少一个可选择性切割的键是共价键;连接臂内的键;所述SX子链的探针或核碱基残基之间或之内的键;或所述SX子链的探针或核碱基残基和靶模板之间的键。11如权利要求1所述的方法,其中所述SXPANDOMER包含下述结构其中T表示所述连接臂;P1表示第一探针部分;权利要求书CN102365367ACN102365388A2/15页3P2表示第二探针部分;表示M个亚基的链中的第个亚基,其中M是大于3的整数;以及表示。

6、选自亚基基序文库的亚基基序的种类,其中每个所述种类都包含部分所述靶核酸的连续核苷酸序列的序列信息;其中T表示所述连接臂;P1表示第一探针部分;P2表示第二探针部分;表示M个亚基的链中的第个亚基,其中M是大于3的整数;表示选自亚基基序文库的亚基基序的种类,其中每个所述种类都包含部分所述靶核酸的连续核苷酸序列的序列信息;以及表示与相邻亚基的连接臂连接的键;其中T表示所述连接臂;P1表示第一探针部分;P2表示第二探针部分;表示M个亚基的链中的第个亚基,其中M是大于3的整数;表示选自亚基基序文库的亚基基序的种类,其中每个所述种类都包含部分所述靶核酸的连续核苷酸序列的序列信息;以及表示与相邻亚基的连接臂。

7、连接的键;其中T表示所述连接臂;P1表示第一探针部分;P2表示第二探针部分;表示M个亚基的链中的第个亚基,其中M是大于3的整数;表示选自亚基基序文库的亚基基序的种类,其中每个所述种类都包含部分所述靶核酸的连续核苷酸序列的序列信息;以及权利要求书CN102365367ACN102365388A3/15页4表示与相邻亚基的连接臂连接的键;其中T表示所述连接臂;表示M个亚基的链中的第个亚基,其中M是大于3的整数;表示选自亚基基序文库的亚基基序的种类,其中每个所述种类都包含部分所述靶核酸的连续核苷酸序列的序列信息;以及表示与相邻亚基的连接臂连接的键;其中T表示所述连接臂;N表示核碱基残基;表示M个亚基。

8、的链中的第个亚基,其中M是大于10的整数;表示选自亚基基序文库的亚基基序的种类,其中每个所述种类都包含部分所述靶核酸的连续核苷酸序列的序列信息;以及表示与相邻亚基的连接臂连接的键;其中T表示所述连接臂;表示M个亚基的链中的第个亚基,其中M是大于10的整数;表示选自亚基基序文库的亚基基序的种类,其中每个所述种类都包含部分所述靶核酸的连续核苷酸序列的序列信息;以及表示与相邻亚基的连接臂连接的键;其中T表示所述连接臂;N表示核碱基残基;表示M个亚基的链中的第个亚基,其中M是大于10的整数;权利要求书CN102365367ACN102365388A4/15页5表示选自亚基基序文库的亚基基序的种类,其中。

9、每个所述种类都包含部分所述靶核酸的连续核苷酸序列的序列信息;以及表示与相邻亚基的连接臂连接的键;其中T表示所述连接臂;N表示核碱基残基;表示M个亚基的链中的第个亚基,其中M是大于10的整数;表示选自亚基基序文库的亚基基序的种类,其中每个所述种类都包含部分所述靶核酸的连续核苷酸序列的序列信息;以及1表示与相邻亚基的连接臂连接的键;以及2表示连接臂间的键;或其中T表示所述连接臂;N1和N2分别表示核碱基残基的第一部分和第二部分;表示M个亚基的链中的第个亚基,其中M是大于10的整数;以及表示选自亚基基序文库的亚基基序的种类,其中每个所述种类都包含部分所述靶核酸的连续核苷酸序列的序列信息。12如权利要。

10、求11所述的方法,其中所述SX子链由多个具有下述结构的寡聚体底物构建体形成其中T表示所述连接臂;P1表示第一探针部分;P2表示第二探针部分;表示所述至少一个可选择性切割的键;以及R1和R2表示用于所述子链的模板指导合成的相同或不同的末端基团;权利要求书CN102365367ACN102365388A5/15页6其中T表示所述连接臂;P1表示第一探针部分;P2表示第二探针部分;R1和R2表示用于所述子链的模板指导合成的相同或不同的末端基团;表示第一连接基团;表示第二连接基团;以及“表示可切割的连接臂内的交联;其中T表示所述连接臂;P1表示第一探针部分;P2表示第二探针部分;R1和R2表示用于所述。

11、子链的模板指导合成的相同或不同的末端基团;表示第一连接基团;表示第二连接基团;以及“表示可切割的连接臂内的交联;其中T表示所述连接臂;P1表示第一探针部分;P2表示第二探针部分;表示所述至少一个可选择性切割的键;R1和R2表示用于所述子链的模板指导合成的相同或不同的末端基团;表示第一连接基团;以及表示第二连接基团;权利要求书CN102365367ACN102365388A6/15页7其中T表示所述连接臂;P1表示第一探针部分;P2表示第二探针部分;表示所述至少一个可选择性切割的键;R1和R2表示用于所述子链的模板指导合成的相同或不同的末端基团;表示第一连接基团;以及表示第二连接基团;其中T表示。

12、所述连接臂;N表示核碱基残基;R1和R2表示用于所述子链的模板指导合成的相同或不同的末端基团;表示第一连接基团;表示第二连接基团;以及“表示可切割的连接臂内的交联;其中T表示所述连接臂;N表示核碱基残基;R1和R2表示用于所述子链的模板指导合成的相同或不同的末端基团;表示所述至少一个可选择性切割的键;表示第一连接基团;表示第二连接基团;以及“表示可切割的连接臂内的交联;权利要求书CN102365367ACN102365388A7/15页8其中T表示所述连接臂;N表示核碱基残基;R1和R2表示用于所述子链的模板指导合成的相同或不同的末端基团;表示第一连接基团;表示第二连接基团;以及“表示可切割的。

13、连接臂内的交联;其中T表示所述连接臂;N表示核碱基残基;R1和R2表示用于所述子链的模板指导合成的相同或不同的末端基团;1和2表示相同或不同的第一连接基团;1和2表示相同或不同的第二连接基团;以及“表示可切割的连接臂内的交联;或其中T表示所述连接臂;N表示核碱基残基;V表示所述核碱基残基的内部可切割位点;以及R1和R2表示用于所述子链的模板指导合成的相同或不同的末端基团。13如权利要求12所述的方法,其中R1和R2选自羟基、磷酸盐和三磷酸盐。14如权利要求1所述的方法,其中所述靶核酸通过滚环聚合方法产生。15用于靶核酸测序的方法,包括A提供通过双向模板指导合成所产生的末端配对子链,所述末端配对。

14、子链包含分别与引物区的第一和第二末端连接的第一和第二序列区,每个序列区独立地包含偶联于序列中权利要求书CN102365367ACN102365388A8/15页9的至少10个核碱基残基,所述序列对应于全部或部分所述靶核酸的连续核苷酸序列;B利用所述末端配对子链作为分析物输入,对所述第一和第二探针区中每一个的至少10个核碱基残基进行测序,以使所述靶核酸的遗传信息解码。16如权利要求15所述的方法,其中所述双向模板指导合成包括连接反应。17如权利要求16所述的方法,其中所述连接反应是酶促连接反应。18如权利要求15所述的方法,其中所述双向模板指导合成包括从所述引物区的3末端开始的聚合酶反应。19用。

15、于靶核酸测序的方法,包括A提供通过双向模板指导合成所产生的末端配对替代多聚体子链,所述末端配对替代多聚体子链具有分别与引物区的第一和第二末端连接的第一和第二探针区,所述第一和第二探针区包含偶联于序列中的多个替代多聚体底物,所述序列对应于全部或部分所述靶核酸的连续核苷酸序列,其中,个体替代多聚体底物包含连接臂、至少一个探针以及至少一个可选择性切割的键,个体探针包含X个核碱基残基X是大于1的正整数和编码Y个核碱基残基Y是至少为1且最大高达X的正整数的至少一个报道元件;B切割所述至少一个可选择性切割的键,以产生长度比所述子链的多个替代多聚体底物长的末端配对替代多聚体,所述末端配对替代多聚体包含所述连。

16、接臂和用于确定每X个核碱基中的Y个核碱基的报道元件;以及C检测所述报道元件,以确定所述末端配对子链的每X个核碱基中的Y个核碱基。20如权利要求19所述的方法,其中所述双向模板指导合成包括连接反应。21如权利要求20所述的方法,其中所述连接反应是酶促连接反应。22如权利要求19所述的方法,其中所述双向模板指导合成包括从所述引物区的3末端开始的聚合酶反应。23用于产生末端配对核酸的方法,所述末端配对核酸包含分别与引物区的第一和第二末端连接的第一和第二区,其中所述第一和第二区独立地包含至少4个寡核苷酸,所述方法包括A提供引物适配子,其中所述引物适配子包含与引物互补或几乎互补的区域;B提供所述引物,其。

17、中所述引物包含5磷酸盐末端和3羟基末端;C使所述引物与所述引物适配子双链体化;以及D从所述5末端和3末端两端延伸所述引物,其中延伸包括将至少4个寡核苷酸连接于所述引物的5末端。24如权利要求23所述的方法,其中所述末端配对核酸是末端配对替代多聚体子链,且所述核苷酸或寡核苷酸包含XPROBE或SXPROBE。25如权利要求23所述的方法,其中所述引物适配子使靶核酸环化。26如权利要求23所述的方法,其中所述引物适配子还包含连接臂,其中所述连接臂任选地连接于固相基质。27如权利要求23所述的方法,其中连接包括酶促连接反应。28如权利要求23所述的方法,还包括从所述引物的3末端开始的连接。29如权利。

18、要求23所述的方法,还包括从所述引物的3末端延伸的聚合酶反应。30末端配对替代多聚体,包含第一探针区和第二探针区,所述第一和第二探针区分别权利要求书CN102365367ACN102365388A9/15页10与引物区的第一和第二末端连接,所述第一和第二探针区包含偶联于序列中的多个亚基,所述序列对应于全部或部分靶核酸的连续核苷酸序列。31如权利要求30所述的末端配对替代多聚体,其中所述末端配对替代多聚体通过权利要求23所述的方法产生。32如权利要求30所述的末端配对核酸,其中所述第一和第二探针区独立地包含4个或更多个探针。33试剂盒,包含多个构建体即具有合适的R1/R2末端基团的XMER或SX。

19、MER,用于通过模板指导合成形成替代多聚体子链,其中所述试剂盒任选地包含利用所述试剂盒形成替代多聚体子链的适当的说明书。34如权利要求33所述的试剂盒,其中所述试剂盒包含10至65000个独特的成员。35读取替代多聚体的个体报道元件的方法,包括A提供替代多聚体,其中所述替代多聚体包含一个或多个个体报道元件;B提供检测器构造体;B向所述检测器构造体呈递所述替代多聚体;C顺序读取所述个体报道元件,以确定所述报道元件的顺序;以及D利用因此确定的报道顺序使所述替代多聚体的遗传信息解码。36如权利要求35所述的方法,其中所述检测器构造体包含第一和第二贮存器,所述第一和第二贮存器分别包含第一和第二电极,其。

20、中所述第一和第二贮存器通过位于所述第一和第二贮存器之间的纳米孔基质而分离,所述纳米孔基质包含至少一个纳米孔通道,且读取所述个体报道元件包括,使所述替代多聚体从所述第一贮存器通过所述至少一个纳米孔通道转移到所述第二贮存器。37如权利要求36所述的方法,其中读取所述个体报道元件还包括,当所述替代多聚体通过所述纳米孔通道转移时,检测所述纳米孔通道中的电阻变化。38如权利要求36所述的方法,其中所述个体报道元件包含至少一种FRET荧光共振能量转移供体或受体荧光团,且所述纳米孔通道包含至少一种FRET供体或受体荧光团,只要当所述个体报道元件包含FRET供体时,所述纳米孔通道包含FRET受体,且当所述个体。

21、报道元件包含FRET受体时,所述纳米孔通道包含FRET供体,且读取所述个体报道元件还包括A当所述替代多聚体通过所述纳米孔通道转移时,用光源激发所述供体荧光团;以及B检测所述受体荧光团发射的荧光信号。39如权利要求38所述的方法,其中所述供体荧光团包含14个激发波长。40如权利要求35所述的方法,其中所述检测器构造体包括纳米梳检测器阵列,所述纳米梳检测器阵列在纳米梳槽中或末端具有至少一个检测器元件,且读取所述个体报道元件包括使所述替代多聚体穿过所述纳米梳槽的末端。41如权利要求40所述的方法,其中所述纳米梳检测器阵列还包括第一和第二电极,且使所述替代多聚体在所述第一和第二电极间穿过。42如权利要。

22、求41所述的方法,其中当所述替代多聚体在所述第一和第二电极间穿过时,所述个体报道元件诱发电解液电流变化。43如权利要求41所述的方法,其中当所述替代多聚体在所述第一和第二电极间穿过权利要求书CN102365367ACN102365388A10/15页11时,所述个体报道元件在所述第一和第二电极间形成电流通路。44如权利要求35所述的方法,其中将所述替代多聚体作为线性化阵列呈递于所述检测器构造体,其中所述线性化阵列包含基质。45如权利要求44所述的方法,其中读取所述个体报道元件包括电子束显微镜检术,其中所述电子束形成线。46如权利要求44所述的方法,其中所述个体报道元件包含硼或纳米金。47如权利。

23、要求44所述的方法,其中所述基质包含用于改善信噪比的反差包被。48如权利要求44所述的方法,其中所述检测器构造体包括至少一个刀刃式电极,所述个体报道元件包含导电聚合丝,且读取所述个体报道元件包括A在所述至少一个刀刃式电极和所述基质间施加电势;以及B当所述替代多聚体在所述至少一个刀刃式电极下穿过时,检测电流。49如权利要求48所述的方法,其中所述基质包含导电膜。50如权利要求48所述的方法,其中所述导电聚合丝包含选自聚乙炔、聚苯胺或聚吡咯的多聚体。51如权利要求44所述的方法,其中所述个体报道元件包含至少一种荧光团,其中所述至少一种荧光团包含至少一种光谱类型,且读取所述个体报道元件包括A提供激发。

24、能量,定位所述激发能量,以便激发所述个体报道元件的至少一种荧光团;以及B检测所述至少一种荧光团所发射的荧光信号。52如权利要求51所述的方法,其中所述激发能量来自近场源,所述近场源自切口出现,且读取所述个体报道元件还包括A平行于所述替代多聚体移动所述切口;以及B检测所述个体报道元件的至少一种荧光团的荧光信号。53如权利要求52所述的方法,其中在远场中检测所述荧光信号。54检测分析物的方法,包括A提供至少一种分析物;B提供至少一种指示剂部分,其中所述指示剂部分不与所述分析物相连;C提供检测器构造体,其中所述检测器构造体包含第一和第二贮存器,所述第一和第二贮存器分别包含第一和第二电极,其中所述第一。

25、和第二贮存器通过位于所述第一和第二贮存器之间的纳米孔基质而分离;D向所述第一和第二电极提供电势,其中所述电势足以使所述至少一种分析物和所述至少一种指示剂部分通过所述至少一个纳米孔通道转移;以及C当所述至少一种分析物通过所述至少一个纳米孔通道转移时,在所述至少一个纳米孔通道处或附近,检测所述至少一种指示剂部分所发射的光信号的变化。55如权利要求54所述的方法,还包括提供激发波长,其中所述激发波长足以从所述至少一种指示剂部分诱发荧光信号。56如权利要求54所述的方法,其中所述至少一种分析物是核酸。57如权利要求54所述的方法,其中所述至少一种分析物是替代多聚体。58如权利要求54所述的方法,其中所。

26、述至少一种指示剂部分是荧光团,所述第一贮权利要求书CN102365367ACN102365388A11/15页12存器相对于所述第二贮存器包含高浓度的所述荧光团,且检测光信号的变化还包括,当所述荧光团通过所述至少一个纳米孔通道转移时,检测荧光信号的变化。59如权利要求58所述的方法,其中落射荧光显微镜检术用于检测所述荧光信号的变化。60如权利要求58所述的方法,其中锥光法用于检测所述荧光信号的变化。61如权利要求58所述的方法,其中所述纳米孔基质包含封阻膜。62如权利要求58所述的方法,其中所述荧光团是荧光素。63如权利要求58所述的方法,其中所述第二贮存器包括荧光淬灭剂,且检测光信号的变化还。

27、包括,当所述荧光团或淬灭剂通过所述至少一个纳米孔通道转移时,检测荧光信号的变化。64如权利要求63所述的方法,其中所述淬灭剂选自QSY7、QSY9和自由基。65如权利要求54所述的方法,还包括提供两种指示剂部分,其中第一指示剂部分选自指示剂离子,第二指示剂部分选自荧光指示剂,所述第一贮存器包含指示剂离子,所述第二贮存器包含荧光指示剂,且检测光信号的变化还包括,检测当所述指示剂离子或指示剂部分穿过所述至少一个纳米孔通道时所发射的荧光信号的变化。66如权利要求65所述的方法,其中所述第二贮存器还包含不发荧光的吸收剂。67如权利要求65所述的方法,其中掩蔽所述纳米孔通道以产生直径为约1M的圆形开口,。

28、其中所述开口与所述纳米孔通道同轴。68如权利要求65所述的方法,其中所述指示剂离子选自钙离子、单线态氢离子、单线态氧离子、钾离子、锌离子、镁离子、氯离子以及钠离子。69如权利要求65所述的方法,其中所述荧光指示剂选自FURA3、FLUO3、INDO1以及FURARED。70如权利要求65所述的方法,其中所述荧光指示剂是荧光淬灭剂。71如权利要求65所述的方法,其中所述第一贮存器包含碘化物离子,且所述第二贮存器包含荧光素。72如权利要求54所述的方法,还包括提供两种指示剂部分,其中所述第一贮存器包含第一指示剂部分,而所述第二贮存器包含第二指示剂部分,其中所述第一和第二指示剂部分能结合以形成激发态。

29、的第三指示剂部分,且检测光信号的变化还包括,当所述第三指示剂部分松弛回到基态时,检测发射的光子。73如权利要求54所述的方法,其中所述至少一个纳米孔包括纳米孔阵列,且所述纳米孔阵列共享所述第一和第二贮存器。74呈递至少一个替代多聚体用于检测的方法,包括A提供检测器构造体,其中所述检测器构造体包括至少一个检测器元件;B提供所述至少一个替代多聚体,其中所述至少一个替代多聚体包含一个或多个个体报道元件;以及C处理所述至少一个替代多聚体,以获得所述一个或多个个体报道元件的统一的空间和时间间隔。75如权利要求74所述的方法,其中所述检测器构造体包括至少一个纳米孔通道。76如权利要求75所述的方法,其中所。

30、述检测器构造体包括规则的纳米孔通道阵列。权利要求书CN102365367ACN102365388A12/15页1377如权利要求74所述的方法,其中处理所述至少一个替代多聚体包括,将所述至少一个替代多聚体的末端与具有至少一个结合位点的固相基质连接。78如权利要求74所述的方法,其中处理所述至少一个替代多聚体包括,使所述至少一个替代多聚体对齐排列在基质表面上。79如权利要求75所述的方法,其中处理所述至少一个替代多聚体包括,将低分子量的带电荷的线性多聚体连接于所述至少一个替代多聚体的末端。80如权利要求79所述的方法,其中所述带电荷的线性多聚体选自聚谷氨酸和聚磷酸盐。81如权利要求75所述的方法。

31、,其中处理所述至少一个替代多聚体包括,向所述至少一个纳米孔通道施加电压,其中所述电压高于期望的检测电压,且当在所述纳米孔通道中检测到替代多聚体时,将所述电压降低至所述期望的检测电压。82如权利要求81所述的方法,其中操作所述电压,使得一次仅有一个替代多聚体可以占据所述至少一个纳米孔通道。83如权利要求75所述的方法,其中处理所述至少一个替代多聚体包括,将障碍物连接于所述至少一个替代多聚体的末端,并在所述至少一个纳米孔通道中预装填所述至少一个替代多聚体,其中所述障碍物防止所述至少一个替代多聚体穿过所述至少一个纳米孔通道,并防止多个替代多聚体占据同一纳米孔通道。84如权利要求83所述的方法,其中所。

32、述障碍物选自大体积树枝状大分子和珠子。85如权利要求84所述的方法,其中所述珠子是磁珠。86如权利要求75所述的方法,其中处理所述至少一个替代多聚体包括,将线性铁氧体多聚体连接于所述至少一个替代多聚体的末端,并操作磁场和电场,以获得所述一个或多个个体报道元件的统一的空间和时间间隔。87如权利要求86所述的方法,其中操作所述磁场和所述电场,使得一次仅有一个替代多聚体可以占据所述至少一个纳米孔通道。88如权利要求74所述的方法,其中处理所述至少一个替代多聚体包括,控制所述至少一个替代多聚体向所述检测器构造体的流动。89如权利要求88所述的方法,其中所述控制所述至少一个替代多聚体的流动包括,将所述至。

33、少一个替代多聚体连接于基质,其中所述连接包括可寻址的、可切割的连接;并选择性切割所述连接,以便每单位时间从所述基质释放一个替代多聚体。90如权利要求89所述的方法,其中选择性切割所述可切割的连接包括,控制切割速率,使得一次仅有一个替代多聚体可以占据所述至少一个检测器元件。91如权利要求89所述的方法,其中所述连接选自光裂解连接、热裂解连接和电化学裂解连接。92如权利要求88所述的方法,其中控制所述至少一个替代多聚体的流动包括A提供至少一个门控构造体,其中所述至少一个门控构造体包括第一、第二和第三电极;以及B操作独立施加于所述第一、第二、以及第三电极的电场,以获得所述一个或多个个体报道元件的统一。

34、的空间和时间间隔。93如权利要求92所述的方法,其中操作所述电场,使得一次仅有一个替代多聚体可权利要求书CN102365367ACN102365388A13/15页14以占据所述至少一个检测器元件。94如权利要求88所述的方法,其中控制所述至少一个替代多聚体的流动包括A提供至少一个门控构造体,其中所述至少一个门控构造体包括第一和第二多孔电极和门控元件,其中将所述第一和第二多孔电极分别固定于所述门控元件的第一和第二侧;B向所述第一和第二电极施加电场;以及C通过所述门向所述至少一个检测器元件转运所述至少一个替代多聚体。95如权利要求94所述的方法,其中所述门控元件选自多孔膜和纳米孔。96如权利要求。

35、94所述的方法,其中操作所述电场,以获得所述一个或多个个体报道元件的统一的空间和时间间隔。97如权利要求94所述的方法,其中操作所述电场,使得一次仅有一个替代多聚体可以占据所述至少一个检测器元件。98如权利要求95所述的方法,其中所述门控元件是多孔膜。99如权利要求98所述的方法,其中所述多孔膜包含直径为约20NM到约100NM的孔。100如权利要求98所述的方法,其中所述多孔膜选自氧化铝和形成多聚体轨道的膜。101如权利要求94所述的方法,其中提供多元门控构造体即提供多于一个门控构造体。102如权利要求88所述的方法,其中控制所述至少一个替代多聚体的流动包括,提供至少一个选自亲和凝胶或通道的。

36、门控构造体,并且处理所述至少一个替代多聚体包括A将亲和拖拉标签连接于所述替代多聚体的末端;以及B施加足以通过所述门控构造体向所述至少一个检测器元件转移所述替代多聚体的电场。103如权利要求102所述的方法,其中操作所述电场,以获得所述一个或多个个体报道元件的统一的空间和时间间隔。104如权利要求102所述的方法,其中操作所述电场,使得一次仅有一个替代多聚体可以占据所述至少一个检测器元件。105如权利要求102所述的方法,其中所述门控构造体是亲和凝胶。106如权利要求77所述的方法,其中所述固相基质具有均匀间隔的结合位点。107如权利要求106所述的方法,其中所述结合位点是大小为约1M的斑点。1。

37、08如权利要求106所述的方法,其中最多为一个替代多聚体与每个个体结合位点结合。109如权利要求108所述的方法,其中所述替代多聚体还包含连接于所述替代多聚体末端的树枝状大分子,其中所述树枝状大分子在空间上阻止另一个替代多聚体与同一位点的结合。110如权利要求106所述的方法,其中所述固相基质选自韧性聚对苯二甲酸乙二酯PET膜、浮法玻璃、硅晶片以及不锈钢。111如权利要求106所述的方法,其中所述至少一个结合位点包括所述固相基质上的行列。112如权利要求111所述的方法,其中所述行列的宽度小于与其结合的替代多聚体之间的距离。权利要求书CN102365367ACN102365388A14/15页。

38、15113如权利要求77所述的方法,其中所述基质具有至少一个与其结合的替代多聚体,使所述基质从法线旋转180度,到达施加的电场,所述电场使所述至少一个替代多聚体以顺直且伸展的方向平放在所述基质的表面上。114如权利要求113所述的方法,其中还将所述至少一个替代多聚体以平放、顺直且伸展的方向连接于所述基质表面。115如权利要求114所述的方法,其中通过所述基质表面的紫外线或化学激活,将所述至少一个替代多聚体连接于所述基质表面。116如权利要求113所述的方法,其中所述固相基质是韧性聚对苯二甲酸乙二酯PET膜。117如权利要求77所述的方法,其中所述基质具有至少一个与其结合的替代多聚体,使所述基质。

39、穿过梳状构造体,其中所述梳状构造体包括在输入侧的拉伸电场、在输出侧的固定电场,以及在所述输入侧和输出侧之间的梳状元件,且处理所述至少一个替代多聚体还包括,使所述基质在所述梳状物下穿过所述拉伸电场,并穿过所述固定电场,使得所述至少一个替代多聚体以顺直且伸展的方向平放于所述基质表面上。118如权利要求117所述的方法,其中还将所述至少一个替代多聚体以平放、顺直且伸展的方向连接于所述基质表面。119如权利要求118所述的方法,其中通过施加电场或通过所述基质表面的紫外线或化学激活,将所述至少一个替代多聚体连接于所述基质表面。120如权利要求78所述的方法,其中所述基质具有至少一个与其结合的替代多聚体,。

40、使所述基质在刷状构造体下穿过,其中所述刷状构造体包括丝,所述丝使所述至少一个替代多聚体以顺直且伸展的方向平放于所述基质表面上。121如权利要求120所述的方法,其中还将所述至少一个替代多聚体以平放、顺直且伸展的方向连接于所述基质表面。122如权利要求121所述的方法,其中通过施加电场或通过所述基质表面的紫外线或化学激活,将所述至少一个替代多聚体连接于所述基质表面。123如权利要求120所述的方法,其中所述丝的直径为约10NM。124如权利要求120所述的方法,其中所述丝包含多聚体。125如权利要求124所述的方法,其中所述丝选自紫外线固化或热固化的多聚体。126如权利要求77所述的方法,其中所。

41、述基质包含闭环韧性膜,且处理所述至少一个替代多聚体还包括连续过程,所述过程包括A使所述基质旋转通过所述检测器构造体;B在穿过所述检测器元件后,从所述基质表面除去所述至少一个替代多聚体;C再将另一个替代多聚体连接于所述基质表面;D以及重复步骤A和B,直到所有替代多聚体都得到分析。127如权利要求126所述的方法,其中所述基质是韧性聚对苯二甲酸乙二酯PET膜。128如权利要求74所述的方法,其中处理所述至少一个替代多聚体包括,将所述至少一个替代多聚体固定于包含纳米孔通道的固相基质上,其中将所述至少一个替代多聚体固定于所述固相基质上包括,将障碍物连接于所述至少一个替代多聚体的末端,并在所述至少一个纳。

42、米孔通道中预装填所述至少一个替代多聚体,其中所述障碍物防止所述至少一个权利要求书CN102365367ACN102365388A15/15页16替代多聚体穿过所述至少一个纳米孔通道并防止多个替代多聚体占据同一纳米孔通道。129如权利要求128所述的方法,其中所述障碍物选自大体积树枝状大分子和珠子。130如权利要求129所述的方法,其中所述珠子是磁珠。权利要求书CN102365367ACN102365388A1/53页17通过展开进行高通量核酸测序和相关方法0001引用的相关申请0002本申请依据35USC119E要求2009年1月29日提交的美国临时专利申请第61/148,332号、2009年。

43、1月29日提交的美国临时专利申请第61/148,334以及2009年1月29日提交的美国临时专利申请第61/148,327号的权益,所有申请在此通过引用整体并入。发明领域0003本发明通常涉及核酸测序,以及与之相关的方法和产物。0004发明背景0005核酸序列编码生物体发挥功能和繁殖所必需的信息,且实质上是生命的基本信息BLUEPRINT。因此确定这些序列在对生物体如何存活以及在何处存活的纯理论研究中,以及在诸如药物研发的应用科学中,都是有用的方法。在医学中,测序方法可用于诊断以及研发多种疾病的治疗方法,包括癌症、心脏病、自身免疫病症、多发性硬化或肥胖症。在工业中,测序可用于设计改良的酶促方法。

44、或合成生物体。在生物学中,这类方法可以用于研究例如生态系统的健康状态,因此拥有广泛的应用。0006个体的独特DNA序列为他们对某些疾病的敏感性提供了有用的信息。序列可以为患者提供机会来做早期检测的筛选以及获得预防性治疗。并且,如果获得患者的个体基本信息,临床医生就可以实施个性化治疗来使药物效力最大化并使药物不良反应最小化。同样,确定病原生物体的基本信息能够为传染性疾病带来新的治疗方法以及更有力的病原体监测。全基因组DNA测序将为现代医学提供基础。0007DNA测序是确定给定DNA多聚体化学成分的顺序的方法。这些化学成分,称为核苷酸,以四种普遍的形式存在于DNA中脱氧腺苷A、脱氧鸟苷G、脱氧胞苷。

45、C和脱氧胸苷T。二倍体人类基因组的测序需要确定大约60亿个核苷酸的连续顺序。0008目前,大多数DNA测序是使用FREDERICKSANGER研发的链终止方法来进行的。这种技术,称为SANGER测序,运用DNA合成的序列特异性终止和荧光修饰的核苷酸报道底物来获得序列信息。这种方法通过用改良的聚合酶链式反应来确定长度高达1000个碱基的靶核酸链的序列或读长。在这种改良的反应中,测序在选择的碱基类型处A、C、G或T被随机打断,并且通过毛细管凝胶电泳确定该打断序列的长度。然后所得的长度可以确定哪种类型的碱基位于那个长度上。产生了很多重叠的读长,并且使用数据处理将其序列重叠,从而确定最可靠的数据配合。。

46、这种产生序列读长的方法是非常费力和昂贵的,并且正在被效率更高的新方法取代。0009SANGER法曾用于提供人类基因组计划的大部分序列数据,该计划产生人类基因组的首次完整序列。完成这项计划花费了10年和将近30亿美元。考虑到这些巨大的通量和成本限制,显然,DNA测序技术需要彻底的改善来达到科学界提出的规定的目标。为了达到这一目标,许多二代技术,其远远超越SANGER测序法的通量和每碱基成本的局限性,正占有越来越多的测序市场份额。然而,这些“合成测序”法仍然不能实现市场要求的通量、成说明书CN102365367ACN102365388A2/53页18本和质量目标,例如用于个性化医疗的全基因组测序。。

47、0010例如,454LIFESCIENCES公司正在生产可以在75个小时内以200个核苷酸的平均读长处理1亿个碱基的仪器例如,基因组测序仪。他们的方法是,用改变的PCR在珠子的表面产生均一的靶核酸的群体COLONY,长度为数百个碱基。这一过程术语上称为乳液PCR。然后将成千上万的珠子排列于“铬尖晶石平板PICOTITERPLATE”上。然后准备该平板用于进一步的测序,从而使每个核酸碱基类型从该平板上依次被洗涤下来。带有并入碱基的靶标的珠子产生焦磷酸副产物,该副产物可用于催化随后被成像系统检测的光产生反应。0011ILLUMINA公司也有相似的方法,该方法用可逆的终止核苷酸和荧光标记进行核酸测序。

48、。ILLUMINA的1G分析仪的平均读长少于40个核苷酸。不同于用乳液PCR来扩增序列靶标,ILLUMINA的方法是在阵列表面扩增PCR群体。454和ILLUMINA公司的方法都用复杂化的聚合酶扩增来增强信号强度,在有速度限制的序列延伸循环中进行碱基检测,并且由于并入错误降低了与读长成比例的测量信噪比从而限制了读长。0012APPLIEDBIOSYSTEM公司用可逆的终止连接而不是通过合成测序来读取DNA。像454公司的基因组测序仪一样,该技术用基于珠子的乳液PCR来扩增样品。由于大部分的珠子不承载PCR产物,于是研究人员接下来使用富集步骤选择包被有DNA的珠子。将生物素包被的珠子涂布并固定于。

49、覆盖有链霉抗生物素的载玻片阵列上。然后使固定的珠子经过8MER单元单体探针杂交每个用4种不同的荧光染料标记、连接和剪切在第5和第6个碱基之间剪切从而产生用于下一轮连接的位点的过程。每个探针在第4和第5个碱基位置用双碱基编码系统检测两个碱基,可由成像系统记录。与ILLUMINA公司的方法相似,APPLIEDBIOSYSTEM公司的SOLID平台的平均读长也少于40个核苷酸。0013通过直接检测DNA单个分子来消除聚合酶扩增步骤的时间和费用的其他方法正在研发之中。因荧光标记的碱基通过将第二种荧光团加入到改造的DNA聚合酶中并用FOSTER共振能量转移FRET来鉴定核苷酸而得以确定它们的序列,VISIGENBIOTECHNOLOGIES公司正在检测带荧光标记的碱基。这种技术面临分辨碱基信号的难题,将这些碱基信号经由低于1纳米以及经由聚合酶并入作用分辨出来,这会带来很大的统计学偏差。0014LINGVITAE正在研发的一种方法可以确定插入到固定的质粒载体中的CDNA的序列。该方法使用IIS类限制酶切割靶核酸并将寡聚体连接到靶标上。通常,由限制酶产生的5或3末端突出端中的一个或两个核苷酸决定了在连接混合物中哪种寡聚体文库会被加到靶标。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 化学;冶金 > 生物化学;啤酒;烈性酒;果汁酒;醋;微生物学;酶学;突变或遗传工程


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1