用于定向核酸扩增和测序的组合物和方法.pdf

上传人:Y0****01 文档编号:76216 上传时间:2018-01-23 格式:PDF 页数:33 大小:1.61MB
返回 下载 相关 举报
摘要
申请专利号:

CN201280060825.1

申请日:

2012.10.19

公开号:

CN104080958A

公开日:

2014.10.01

当前法律状态:

撤回

有效性:

无权

法律详情:

发明专利申请公布后的视为撤回IPC(主分类):C40B 50/06申请公布日:20141001|||实质审查的生效IPC(主分类):C40B 50/06申请日:20121019|||公开

IPC分类号:

C40B50/06

主分类号:

C40B50/06

申请人:

纽亘技术公司

发明人:

克里斯·阿穆尔

地址:

美国加利福尼亚州

优先权:

2011.10.19 US 61/549,162

专利代理机构:

北京安信方达知识产权代理有限公司 11262

代理人:

王思琪;郑霞

PDF下载: PDF下载
内容摘要

本发明提供了用于定向核酸扩增和测序的方法和组合物。本发明进一步提供了用于构建定向cDNA文库的方法和组合物。该方法可包括:a)逆转录RNA样品以产生第一链cDNA;b)由第一链cDNA产生第二链cDNA,其中四种dNTP中的至少一种即dATP、dCTP、dGTP或dTTP在第二链合成过程中被修饰的dNTP替代,并掺入第二链中,从而产生双链cDNA;c)对该双链cDNA进行末端修复;d)将衔接子连接至该双链cDNA,其中仅有一种衔接子具有掺入该衔接子的连接链中的修饰的dNTP;e)进行缺口修复;和f)用合适的裂解剂选择性裂解该第二链和具有修饰的dNTP的该衔接子的连接链。

权利要求书

1.  一种用于构建定向cDNA文库的方法,其包括:
a.逆转录RNA样品以产生第一链cDNA;
b.由所述第一链cDNA产生第二链cDNA,其中四种dNTP中的至少一种即dATP、dCTP、dGTP或dTTP在第二链合成过程中被修饰的dNTP替代并掺入所述第二链中,从而产生双链cDNA;
c.对所述双链cDNA进行末端修复;
d.将衔接子连接至所述双链cDNA,其中所述衔接子中仅有一种具有掺入所述衔接子的连接链中的修饰的dNTP;
e.进行缺口修复;和
f.用合适的裂解剂选择性裂解所述第二链和所述具有修饰的dNTP的衔接子,从而产生包含所述第一链cDNA的定向cDNA文库。

2.
  如权利要求1所述的方法,其中所述修饰的dNTP包含dUTP。

3.
  如权利要求1所述的方法,其中所述方法任选地进一步包括在步骤(c)之前断裂所述双链cDNA。

4.
  如权利要求1所述的方法,其中步骤(f)包括裂解所述修饰的核苷酸的碱基部分,从而形成脱碱基位点。

5.
  如权利要求4所述的方法,进一步包括在所述脱碱基位点处裂解磷酸二酯骨架。

6.
  如权利要求4所述的方法,其中所述裂解所述修饰的核苷酸的碱基部分包括酶的使用。

7.
  如权利要求5所述的方法,其中所述在脱碱基位点处裂解磷酸二酯骨架包括酶、化学剂和/或热的使用。

8.
  如权利要求7所述的方法,其中所述酶是内切核酸酶。

9.
  如权利要求8所述的方法,其中所述内切核酸酶是脱嘌呤/脱嘧啶内切核酸酶(APE)。

10.
  如权利要求6所述的方法,其中所述酶包含糖基化酶。

11.
  如权利要求10所述的方法,其中所述糖基化酶为尿嘧啶-N-糖 基化酶(UNG)或尿嘧啶DNA糖基化酶(UDG)。

12.
  如权利要求7所述的方法,其中所述化学剂包含伯胺。

13.
  如权利要求7所述的方法,其中所述化学剂包含多胺。

14.
  如权利要求13所述的方法,其中所述多胺包含N,N-二甲基乙二胺(DMED)。

15.
  如权利要求1所述的方法,其中所述裂解剂包含糖基化酶和多胺。

16.
  如权利要求1所述的方法,其中所述裂解剂包含糖基化酶和APE。

17.
  如权利要求1所述的方法,进一步包括扩增所述定向cDNA文库,从而产生扩增的产物。

18.
  如权利要求17所述的方法,其中所述定向cDNA文库的扩增包括聚合酶链式反应(PCR)、链置换扩增(SDA)、多重置换扩增(MDA)、滚环扩增(RCA)、单引物等温扩增(SPIA)或连接酶链式反应(LCR)。

19.
  如权利要求18所述的方法,其中所述扩增包括PCR。

20.
  如权利要求18所述的方法,其中所述扩增包括SPIA。

21.
  如权利要求17所述的方法,进一步包括对扩增产物进行测序的附加步骤。

22.
  如权利要求21所述的方法,其中所述测序包括新一代测序。

23.
  如权利要求1所述的方法,进一步包括在逆转录后裂解所述RNA样品。

24.
  如权利要求23所述的方法,其中裂解所述RNA样品包括在逆转录后使所述RNA样品暴露于RNase。

25.
  如权利要求24所述的方法,其中所述RNase为RNase H。

26.
  如权利要求23所述的方法,其中裂解所述RNA样品包括使所述RNA样品暴露于热或化学处理或其组合。

27.
  如权利要求1所述的方法,进一步包括从所述定向cDNA文库中减少或耗尽非期望的核酸序列。

28.
  如权利要求27所述的方法,其中所述非期望的核酸为核糖体 RNA(rRNA)。

29.
  一种用于全转录组定向测序的方法,其包括:
a.逆转录RNA样品以产生第一链cDNA;
b.由所述第一链cDNA产生第二链cDNA,其中四种dNTP中的至少一种即dATP、dCTP、dGTP或dTTP在第二链合成过程中被修饰的dNTP替代并掺入所述第二链中,从而产生双链cDNA;
c.对所述双链cDNA进行末端修复;
d.将衔接子连接至所述双链cDNA,其中所述衔接子中仅有一种具有掺入所述衔接子的连接链中的修饰的dNTP;
e.进行缺口修复;
f.用合适的裂解剂选择性裂解所述第二链和具有所述修饰的dNTP的衔接子,从而产生包含所述第一链cDNA的定向cDNA文库;和
g.对所述定向cDNA文库进行扩增和/或测序。

30.
  如权利要求29所述的方法,其中所述修饰的dNTP包含dUTP。

31.
  如权利要求29所述的方法,其中所述方法任选地进一步包括在步骤(c)之前断裂所述双链cDNA。

32.
  如权利要求29所述的方法,其中步骤(f)包括裂解所述修饰的核苷酸的碱基部分,从而形成脱碱基位点。

33.
  如权利要求32所述的方法,进一步包括在所述脱碱基位点处裂解磷酸二酯骨架。

34.
  如权利要求32所述的方法,其中所述裂解所述修饰的核苷酸的碱基部分包括酶的使用。

35.
  如权利要求33所述的方法,其中所述在脱碱基位点处裂解磷酸二酯骨架包括酶、化学剂和/或热的使用。

36.
  如权利要求35所述的方法,其中所述酶是内切核酸酶。

37.
  如权利要求36所述的方法,其中所述内切核酸酶为脱嘌呤/脱嘧啶内切核酸酶(APE)。

38.
  如权利要求34所述的方法,其中所述酶包含糖基化酶。

39.
  如权利要求38所述的方法,其中所述糖基化酶是尿嘧啶-N-糖 基化酶(UNG)或尿嘧啶DNA糖基化酶(UDG)。

40.
  如权利要求35所述的方法,其中所述化学剂包含伯胺。

41.
  如权利要求35所述的方法,其中所述化学剂包含多胺。

42.
  如权利要求41所述的方法,其中所述多胺包含N,N-二甲基乙二胺(DMED)。

43.
  如权利要求29所述的方法,其中所述裂解剂包含糖基化酶和多胺。

44.
  如权利要求29所述的方法,其中所述裂解剂包含糖基化酶和APE。

45.
  如权利要求29所述的方法,其中对剩余的cDNA链的扩增包括聚合酶链式反应(PCR)、链置换扩增(SDA)、多重置换扩增(MDA)、滚环扩增(RCA)、单引物等温扩增(SPIA)或连接酶链式反应(LCR)。

46.
  如权利要求45所述的方法,其中所述扩增包括PCR。

47.
  如权利要求45所述的方法,其中所述扩增包括单引物等温扩增(SPIA)。

48.
  如权利要求29所述的方法,其中所述测序包括新一代测序。

49.
  如权利要求29所述的方法,进一步包括在逆转录后裂解所述RNA样品。

50.
  如权利要求49所述的方法,其中裂解所述RNA样品包括在逆转录后使所述RNA样品暴露于RNase。

51.
  如权利要求50所述的方法,其中所述RNase为RNase H。

52.
  如权利要求49所述的方法,其中裂解所述RNA样品包括使所述RNA样品暴露于热或化学处理或其组合。

53.
  如权利要求49所述的方法,进一步包括从所述定向cDNA文库中减少或耗尽非期望的核酸序列。

54.
  如权利要求53所述的方法,其中所述非期望的核酸是核糖体RNA(rRNA)。

55.
  一种试剂盒,其包含:
a.一种或多种引物;
b.逆转录酶;
c.糖基化酶;
d.一种或多种衔接子,其中所述衔接子之一在所述衔接子的连接链中包含至少一种修饰的核苷酸。

56.
  如权利要求55所述的试剂盒,进一步包含所述试剂盒的书面使用说明书。

57.
  如权利要求55所述的试剂盒,进一步包含至少一种修饰的核苷酸或dNTP。

58.
  如权利要求55所述的试剂盒,进一步包含用于扩增的试剂。

59.
  如权利要求55所述的试剂盒,进一步包含用于测序的试剂。

60.
  如权利要求55所述的试剂盒,进一步包含多胺、APE或其组合。

61.
  如权利要求55所述的试剂盒,其中所述修饰的核苷酸包含dUTP,并且其中所述糖基化酶包含UNG。

62.
  如权利要求57所述的试剂盒,其中所述修饰的核苷酸包含dUTP。

63.
  一种用于构建定向cDNA文库的方法,其包括:
a.由模板RNA合成第一和第二链cDNA,其中第一链cDNA或第二链cDNA的合成包括掺入修饰的dNTP,以产生双链cDNA;
b.对所述双链cDNA进行末端修复;
c.将衔接子连接至所述双链cDNA,其中所述衔接子中仅有一种具有掺入所述衔接子的连接链中的修饰的dNTP;
d.进行缺口修复;和
e.用合适的裂解剂选择性裂解所述第一或第二链cDNA和具有所述修饰的dNTP的衔接子,从而产生包含所述第一或第二链cDNA的定向cDNA文库。

说明书

用于定向核酸扩增和测序的组合物和方法
交叉引用
本申请要求2011年10月9日提交的美国临时申请号61/549,162的权益,该临时申请通过引用并入本文。
发明背景
高通量、新一代测序技术的最新进展已经使得全基因组测序和功能基因组学的新方法成为可能,包括对任意转录组的全面分析。这些新一代测序方法之一涉及对由信使和结构RNA产生的互补DNA(cDNA)的直接测序(RNA-Seq)。RNA-Seq提供了超越传统测序方法的几个关键优势。首先,其允许对所有表达的转录物进行高分辨率研究,从而注释出各转录物的5’和3’末端以及剪接点。其次,RNA-Seq允许对每个细胞中的转录物的相对数进行定量。第三,RNA-Seq提供了一种通过测量每种剪接变体的水平来测量和表征RNA剪接的途径。总之,这些进展已经提供了对个别细胞功能的新的了解。
进行标准RNA-Seq的一个缺点是缺乏有关转录方向的信息。为了RNA-Seq而构建的标准cDNA文库由随机引物双链cDNA组成。在测序之前含有通用引发位点的衔接子的非定向连接导致有关哪条链存在于原始RNA模板中的信息丢失。虽然在一些情况下可以通过后续分析,例如通过使用编码蛋白质的转录物中的开放阅读框(ORF)信息,或者通过评估真核基因组中的剪接位点信息来推测链信息,但是关于起源链的直接信息是非常符合期望的。例如,为了将有义链指定至非编码RNA,以及在解析重叠的转录物时,就需要有关在原始RNA样品中存在哪条链的直接信息。
最近已经针对链特异性RNA-Seq开发了几种方法。这些方法可分成两大类。第一类利用相对于RNA转录物的5’和3’末端处于已知方向 的不同衔接子。最终结果是cDNA文库,其中原始RNA的5’和3’末端的侧翼为两个不同的衔接子。该方法的缺点是只有克隆分子的末端保留了方向信息。对于长克隆的链特异性操作而言,这可能会存在问题,并且当存在断裂(fragmentation)时可能导致方向信息的丢失。
第二类链特异性RNA-Seq方法标记原始RNA(例如,通过亚硫酸氢盐处理)或转录的cDNA(例如,通过修饰的核苷酸的掺入)的一条链,随后使未标记的链降解。通过亚硫酸氢盐处理对RNA的链标记是劳动密集的,并且需要将测序读取值(reads)与参照基因组进行比对,所述参照基因组的两条链之一上的所有胞嘧啶碱基已经转换为胸腺嘧啶。由于亚硫酸氢盐处理过程中的碱基转换效率是不完美的,即小于100%,使得该分析更加复杂。
通过对cDNA的第二链进行修饰的链标记已经成为定向cDNA克隆和测序的优选方法(Levin等人,2010)。然而,cDNA第二链标记方法,如在WO2011/003630中所述的方法,当使用采用双链体衔接子的常规平端连接和cDNA文库构建策略(其中由两个单独的衔接子引入两个通用测序位点)时,不足以保留方向性信息。WO2011/000360中所述的标记方法采用由以下步骤组成的四步过程:1)可裂解核苷酸向cDNA插入物的一条链中的掺入,2)cDNA插入物的末端修复,3)含有通用测序位点的衔接子的非定向连接,和4)具有非期望的衔接子方向的文库片段的选择性水解。为了保留方向性信息,该方法需要对选择进行扩增的链的5’和3’末端进行区别标记,例如,这可以通过定向(即极性特异性的)衔接子的连接或通过使用特化的叉状衔接子来实现,在该叉状衔接子中,双链多核苷酸的每一条链共价连接至两个不同的通用测序位点,在该链的每一端具有一个测序位点。当使用常规双链体衔接子时,WO2011/000360所述方法的应用不产生定向测序文库,因为标记的链,即已掺入可裂解核苷酸的链,在其5’和3’末端没有被区别标记。
对于从利用常规双链体衔接子构建的cDNA文库进行定向cDNA测序的改进方法存在需求。本文所述的发明满足了这一需求。
发明内容
本发明提供了用于构建定向cDNA文库和进行定向cDNA测序的新方法、组合物和试剂盒。具体而言,本发明的一个重要方面是允许使用双链体衔接子和平端连接进行定向cDNA克隆和链保留,从而产生具有两个衔接子方向的连接产物的方法和组合物。在一个方面,本发明提供了一种克隆cDNA同时保留原始RNA样品的方向性和链信息的方法。在一些实施方案中,该方法包括:a)逆转录RNA样品以产生第一链cDNA;b)由第一链cDNA产生第二链cDNA,其中四种dNTP中的至少一种即dATP、dCTP、dGTP或dTTP在第二链合成过程中被修饰的dNTP替代并掺入第二链中,从而产生双链cDNA;c)对该双链cDNA进行末端修复;d)将衔接子连接至该双链cDNA,其中仅有一种衔接子具有掺入该衔接子的连接链中的修饰的dNTP;e)进行缺口修复;和f)用合适的裂解剂选择性裂解第二链和具有修饰的dNTP的衔接子的连接链,从而产生包含第一链cDNA的定向cDNA文库。在另一方面,该方法任选地包括在对双链cDNA进行末端修复之前断裂该双链cDNA。在一个特定的实施方案中,该方法进一步包括扩增剩余的cDNA链或不包含修饰的核苷酸的cDNA链,从而产生扩增的产物。在另一个特定的实施方案中,该方法进一步包括对剩余的cDNA链或扩增产物进行测序。
在另一方面,本发明提供了一种用于选择性去除处于非期望的方向的cDNA构建体的方法。
在又一方面,本发明提供了一种用于全转录组定向测序的方法,其包括:a)逆转录RNA样品以产生第一链cDNA;b)由第一链cDNA产生第二链cDNA,其中四种dNTP中的至少一种即dATP、dCTP、dGTP或dTTP在第二链合成过程中被修饰的dNTP替代并掺入第二链中,从而产生双链cDNA;c)对该双链cDNA进行末端修复;d)将衔接子连接至该双链cDNA,其中仅有一种衔接子具有掺入该衔接子的连接链中的修饰的dNTP;e)进行缺口修复;f)用合适的裂解剂选择性裂解第二链和具有修饰的dNTP的衔接子的连接链,从而产生包含第一链cDNA的定向cDNA文库;和h)对该定向cDNA文库进行扩增和/或测序。在 另一个方面,该方法任选地包括在对双链cDNA进行末端修复之前断裂该双链cDNA。
在任一前述方面的一个方面中,本发明提供了裂解所述修饰的核苷酸的碱基部分从而形成脱碱基位点。在一个优选的实施方案中,该修饰的核苷酸包含dUTP。在一些情况下,所述裂解剂包含糖基化酶。在一个优选的实施方案中,该糖基化酶包含UNG。在一些情况下,该裂解剂包含糖基化酶和内切核酸酶。在一些情况下,该内切核酸酶包含脱嘌呤/脱嘧啶内切核酸酶(APE)。在一些情况下,该裂解剂包含糖基化酶和APE。在一些情况下,该裂解剂包含UNG和APE。在一些情况下,该裂解剂包含糖基化酶和多胺。在一个优选的实施方案中,该多胺为N,N-二甲基乙二胺(DMED)。在一些情况下,该裂解剂包含糖基化酶和DMED。在一些情况下,该裂解剂包含UNG和DMED。
在任一前述方面的另一个方面中,该方法进一步包括在去除修饰的核苷酸的碱基部分后,利用酶、化学剂和/或热在脱碱基位点处在磷酸二酯骨架中产生切口。在一些情况下,在去除修饰的核苷酸的碱基部分后在脱碱基位点处裂解磷酸二酯骨架包括使用酶。在一个优选的实施方案中,该酶是内切核酸酶。在一些情况下,该内切核酸酶包含脱嘌呤/脱嘧啶内切核酸酶(APE)。在一些情况下,在去除修饰的核苷酸的碱基部分后在脱碱基位点处产生切口包括使用化学剂。在一些情况下,该化学剂包含伯胺或多胺。在一个优选的实施方案中,该多胺为N,N-二甲基乙二胺(DMED)。
在任一前述方面的另一个方面中,该方法进一步包括在RNA样品逆转录之后裂解该RNA样品。在一些情况下,裂解RNA样品包括使RNA样品暴露于RNase。在一个优选的实施方案中,该RNase为RNaseH。在一些情况下,裂解RNA样品包括使RNA样品暴露于热或化学处理或其组合。
在任一前述方面的另一个方面中,该方法进一步包括减少或耗尽非期望的核酸序列。在一些情况下,非期望的核酸为核糖体RNA(rRNA)。
在任一前述方面的另一个方面中,对剩余cDNA链的扩增包括聚 合酶链式反应(PCR)、链置换扩增(SDA)、多重置换扩增(MDA)、滚环扩增(RCA)、单引物等温扩增(SPIA)或连接酶链式反应(LCR)。在一些情况下,该扩增包括PCR。在一些情况下,该扩增包括SPIA。
在任一前述方面的另一个方面中,对剩余cDNA链或从剩余cDNA链扩增的产物的测序包括新一代测序。
用于执行本文所述的任意方法的试剂盒是本发明的另一特征。此类试剂盒可包括用于对核酸进行扩增、克隆和测序的试剂、酶和平台。在一个实施方案中,提供一种试剂盒,其包含:a)一种或多种引物;b)逆转录酶;c)糖基化酶;和d)一种衔接子或几种衔接子,其中该衔接子中的一种在所述衔接子的连接链中包含至少一种修饰的核苷酸。在另一个实施方案中,该试剂盒进一步包含用于扩增的试剂。在另一个实施方案中,该试剂盒进一步包含多胺、APE或其组合。在另一个实施方案中,该试剂盒进一步包含至少一种修饰的核苷酸或dNTP。在一些情况下,该修饰的核苷酸包含dUTP。在一些情况下,该糖基化酶包含UNG。在又一个实施方案中,该试剂盒进一步包含用于测序的试剂。试剂盒将优选地包括关于应用试剂盒组分以及使用不包括在该试剂盒中的任何其他试剂的说明。
援引并入
本说明书中所述的所有出版物、专利和专利申请均通过引用以相同的程度并入本文,犹如特别地和单独地指出每个单独的出版物、专利或专利申请均通过引用而并入。
附图说明
本发明的新颖特征在随附的权利要求中具体阐述。通过参考以下对利用到本发明原理的说明性实施方案加以阐述的描述和附图,将会获得对本发明的特征和优点的更好的理解,在附图中:
图1显示了使用常规双链体衔接子(即,其中连接产物具有两个衔接子方向)和链标记构建非定向cDNA文库。
图2显示了使用本发明的方法利用常规双链体衔接子构建定向(链特异性)cDNA文库。
图3显示了总结使用本发明的方法的链保留效率数据的表格。
图4显示了阐明使用本发明的方法产生定向cDNA文库的步骤的流程图。
具体实施方式
概述
现将详细参考本发明的示例性实施方案。虽然将结合这些示例性实施方案来描述这些公开的方法和组合物,但应当理解,这些示例性实施方案并非意在限制本发明。相反,本发明意在涵盖可包括在本发明精神和范围内的备选方案、修改方案和等效方案。
在一个实施方案中,本发明提供了用于构建定向cDNA文库的方法和组合物。本文所述的方法使用常规双链体衔接子和平端连接实现了定向cDNA克隆和链保留。该方法进一步能够产生可使用多种扩增方法进一步扩增的链特异性cDNA。在另一个实施方案中,本发明提供了用于全转录组定向测序的方法。在又一个实施方案中,本发明提供了用于产生定向的、rRNA耗尽的cDNA文库的方法和组合物。
一个方面涉及一种用于产生定向cDNA文库的方法。该方法的第一步需要使用RNA样品或RNA模板,通过逆转录可由该RNA样品或RNA模板产生第一链cDNA。该RNA样品可来自于众多的本领域已知的来源,包括但不限于纯化或未纯化形式的信使RNA(mRNA)或核糖体RNA(rRNA),并且可以使用众多本领域已知的RNA依赖性DNA聚合酶进行逆转录。在一个实施方案中,该RNA模板可来自于DNA,包括但不限于基因组DNA,其中使用本领域已知的方法(包括但不限于转录)将DNA转化为RNA。在一个优选的实施方案中,如图4中所例示的,该RNA可以是poly A+RNA。RNA样品的逆转录可使用包含与已知序列互补的序列或包含随机序列的引物进行。在一个实施方案中,在本文所述的方法中使用的引物可以是包含DNA和RNA两者的复合引物。在 一个优选的实施方案中,可使用随机六聚体引物对RNA样品进行逆转录。
本文所述的用于产生定向cDNA文库的方法的第二步需要由第一链cDNA产生第二链cDNA,以形成双链cDNA。第二链合成可在修饰的dNTP的存在下进行。在一个优选的实施方案中,第二链合成可在dATP、dCTP、dGTP和代替dTTP的dUTP的存在下进行。在dUTP的存在下的第二链合成导致在第二链cDNA的链中掺入至少一个dUTP。第二链cDNA中的dUTP用来标记该第二链,因为在这种背景下dUTP是修饰的或非规范的dNTP。第二链合成可使用众多本领域已知的第二链合成方案来进行,包括但不限于利用RNase H介导的切口平移结合DNA依赖性DNA聚合酶如DNA聚合酶I(非Klenow片段)的那些方案。第二链合成还可使用可购买到的试剂盒如New England Biolabs NEBNext第二链合成模块(Second Strand Synthesis Module)来进行。在第二链合成过程中产生的第二链cDNA产物也可被称为有义链产物,因为第二链cDNA的序列包含在模板RNA中发现的序列,而第一链cDNA也可被称为反义链产物。在另一个实施方案中,可在第一链合成后去除RNA模板之后进行第二链合成。RNA模板的去除可使用酶、热变性或化学变性来实现。酶介导的RNA模板的去除可利用RNase,优选RNase H,或酶的组合如RNase H和RNase1来进行。作为该实施方案的另一方面,可以使用包含与第一链产物中存在的序列互补的序列的引物,结合使用DNA依赖性DNA聚合酶来进行第二链合成。
在一个实施方案中,可在第二链合成后对第二链合成后产生的双链cDNA进行末端修复。末端修复可包括平端、非平端(即黏性或粘性末端)或单碱基突出端的产生,例如通过缺乏3′外切核酸酶活性的聚合酶向双链DNA产物的3′末端添加一个dA核苷酸。在一个优选的实施方案中,可对双链cDNA进行末端修复以产生平端,其中该双链cDNA包含5’磷酸和3’羟基。末端修复可使用众多本领域已知的酶和/或方法来进行,包括但不限于可购买到的试剂盒,如EncoreTM Ultra Low Input NGS Library System I。
在一个实施方案中,可在双链cDNA已断裂后进行末端修复。双链产物的断裂可通过本领域已知的方法来实现。可通过物理断裂方法和/或酶断裂方法实现断裂。物理断裂方法可包括喷雾、超声处理和/或流体动力剪切。在一个优选的实施方案中,双链cDNA的断裂通过超声处理来进行。用于进行酶断裂反应的试剂是可购买到的(例如,来自New England Biolabs)。
在双链cDNA的末端修复后,本文所述的用于产生定向cDNA文库的方法包括将衔接子连接至双链cDNA。该衔接子可以是本领域已知的任何类型的衔接子,包括但不限于常规的双链体或双链衔接子。在一个优选的实施方案中,该衔接子可以是双链DNA衔接子。在一个实施方案中,该衔接子可以是已知序列的寡核苷酸,因此允许产生和/或使用序列特异性引物来对附加或连接有该衔接子的任何多核苷酸进行扩增和/或测序。优选地,该衔接子可以是可通过本领域已知的方法进行标记和选择的任何衔接子。在一个优选的实施方案中,该衔接子可通过掺入至少一种修饰的dNTP来标记。在一个优选的实施方案中,一种且仅一种衔接子包含修饰的dNTP,而其他或任何其他衔接子不包含修饰的dNTP。在一个优选的实施方案中,一种且仅一种衔接子在所述衔接子的连接链中包含修饰的dNTP,而其他或任何其他衔接子在所述衔接子的连接链中不包含修饰的dNTP。在一个实施方案中,该修饰的dNTP为dUTP。在一个优选的实施方案中,衔接子可以多个方向附加至双链产物。在一个优选的实施方案中,本文所述的方法可涉及使用两种包含已知序列的双链DNA的常规双链体衔接子,这两种常规双链体衔接子为平端的并且能够以两个方向之一结合至双链产物,其中一种衔接子包含掺入连接链中的修饰的dNTP,而另一种衔接子在连接链中不包含修饰的dNTP。在一个优选的实施方案中,该修饰的dNTP为dUTP。
根据本文所述的方法,可通过平端连接将衔接子以两个方向中的任一方向连接至双链cDNA。衔接子之一包含掺入连接链中的修饰的dNTP(优选dUTP),而另一种衔接子不包含掺入连接链中的修饰的dNTP(优选dUTP)。在一个实施方案中,衔接子与双链cDNA的连接在任一种 衔接子的非连接链与双链cDNA的链之间产生缺口,从而各自衔接子的非连接链不与双链cDNA的链结合。对此,可使用众多本领域已知的方法进行缺口修复或补平反应,这些方法包括但不限于具有弱或无链置换活性的DNA依赖性DNA聚合酶的使用。
在衔接子连接以及任选的缺口修复后,产生双链cDNA/衔接子复合物。该复合物随后可经历链选择。链选择可能需要对掺入双链cDNA的第二链中和一种且仅一种连接至该双链cDNA的衔接子的连接链中的修饰的dNTP进行碱基切除。对修饰的dNTP的碱基切除可使用酶、化学剂和/或热进行,并且在修饰的dNTP掺入核苷酸序列中的任何位置产生脱碱基位点。除碱基切除之外,本发明的方法可能还需要在脱碱基位点处裂解磷酸二酯键。磷酸二酯键也可被称为磷酸二酯骨架或DNA骨架。可使用众多的作用物(agent)(包括酶、化学剂、热或其任意组合)来进行DNA骨架的裂解。
碱基切除和/或DNA骨架的裂解导致包含修饰的dNTP的标记的第二链以及包含修饰的dNTP的一种衔接子的连接链被裂解或去除,而未标记的链和不含修饰的dNTP的衔接子的连接链保持完整。在这种情况下,碱基切除和/或DNA骨架裂解后双链cDNA的剩余链为第一链cDNA或反义链产物。此外,碱基切除和/或DNA骨架裂解还裂解或去除了包含修饰的dNTP的一种衔接子的连接链,无论所述连接链连接至双链cDNA的哪条链。可优先使用其序列与不包含修饰的dNTP的衔接子的连接链互补的引物来扩增剩余链。使用其序列与包含修饰的dNTP的衔接子的连接链互补的引物进行的扩增不产生产物,因为该连接链已经在碱基切除和/或修饰的dNTP裂解之后被裂解和/或去除。对剩余链的扩增可使用众多本领域已知的扩增技术进行,这些扩增技术包括但不限于聚合酶链式反应(PCR)。在剩余链扩增之后,可使用与不包含修饰dNTP的衔接子的连接链中存在的序列互补的引物,对扩增的产物进行测序,这确保了仅对未标记的第一链cDNA或链选择后保留的反义链产物进行测序。测序可直接对剩余的cDNA和/或对由剩余链的扩增产生的产物进行。可使用任何本领域已知的测序方法进行测序,这些方法包括 但不限于新一代测序方法。如上所述的本发明的方法由于对有义链产物(第二链cDNA)的标记和裂解或去除,导致包含反义方向的cDNA或第一链cDNA的定向cDNA文库的产生。
在另一个实施方案中,可在对剩余链进行扩增和/或测序之前去除裂解的或降解的标记链。在一个优选的实施方案中,可在对剩余的第一链cDNA或反义产物进行扩增和/或测序之前去除裂解的第二链和包含修饰dNTP的一种衔接子的裂解的连接链。在又一个优选的实施方案中,剩余的第一链cDNA(反义产物)可在扩增和/或测序之前进行纯化。对剩余链的纯化可使用本领域已知的用于纯化cDNA的方法进行,如可从Qiagen和/或Roche购买到的试剂盒。
在一个备选的实施方案中,本文所述的方法可用于产生包含有义方向的cDNA或第二链cDNA的定向cDNA文库。在该实施方案中,本文所述的方法可如上所述进行,不同之处在于,与如上所述的第二链合成相反,从RNA模板进行的第一链合成可在修饰的dNTP的存在下进行,而第二链合成是在未修饰的dNTP或经典dNTP的存在下进行的。在该实施方案的一个方面,可在第二链合成之前将包括在第一链合成过程中使用的任何和所有修饰dNTP在内的dNTP去除、洗掉或用未修饰的dNTP替代。作为该实施方案的另一方面,在第二链合成过程中可以使用未修饰的dNTP。在一个优选的实施方案中,该修饰的dNTP包含dUTP。可以选择性裂解或去除用修饰dNTP标记的并且连接至在所述衔接子的连接链中包含修饰dNTP的一种且仅一种衔接子上的反义链产物(第一链cDNA)。因此,可用于下游扩增和/或测序的剩余链和连接的衔接子包含有义链产物,该有义链产物连接至在所述衔接子的连接链中不包含修饰dNTP的衔接子。
图2中示出了本文所述的用于产生定向链特异性cDNA文库并对其进行测序的方法的一个优选实施方案的示意图。总的来说,图2中所示的方法允许确定用来产生cDNA的模板RNA的链方向,相对于图1所示的常规方法具有提高的效率。在图1和图2中所示的方法均使用cDNA的链标记和常规双链体衔接子与由模板RNA产生的cDNA的平 端连接作为确定链方向的手段。在图1和图2中,该方法包括将双链双链体衔接子(图1和图2中的P1/P2)平端连接至由RNA样品形成的双链cDNA复合物,其中第二链产物——由于其互补于RNA模板并且与RNA模板具有相同的链方向而也被称为有义链产物,通过在第二链合成过程中掺入dUTP进行标记。在图1和图2所示的优选的实施方案中,双链体衔接子不含游离的5’磷酸基团。因此,两种衔接子(P1/P2)包含与双链cDNA上的游离5’磷酸连接的链(连接链)和不与双链cDNA连接的链(非连接链)。可通过使用本领域已知的酶(即T4DNA连接酶)和方法来促进连接,包括但不限于可购买到的试剂盒,如EncoreTM Ultra Low Input NGS Library System。在图2所示的本发明的一个优选实施方案中,一种且仅一种衔接子(P2)的连接链通过掺入dUTP进行标记。如图1和图2所示,双链体衔接子的连接可在两个方向之一上发生。在图1和图2左侧的示意图中,P2衔接子的连接链连接至标记的有义链(第二链产物)。在图2右侧的示意图中,P2衔接子的连接链连接至未标记的反义链(第一链产物)。
在图1和图2中所示的方法中,双链体衔接子为非磷酸化的并因此不含游离的5’磷酸基团。因此,两种衔接子(P1/P2)含有将与双链cDNA上的游离5’磷酸连接的链(连接链)和不与双链cDNA连接的链(非连接链),并因此留下缺口。这样,在任一方向上,含有连接的衔接子的双链cDNA经历缺口修复或补平修复(优选地利用DNA依赖性DNA聚合酶,如Taq DNA聚合酶),以便通过使用各自的连接链作为模板,对双链体衔接子的非连接链的序列进行DNA依赖性DNA聚合酶介导的合成,来补平该缺口。
在图1和图2中,缺口修复后通过用裂解剂(可以是酶)处理进行碱基切除。在图1和图2所示的一个实施方案中,可利用诸如UNG的酶进行碱基切除。在一个优选的实施方案中,碱基切除后可使用酶、化学剂和/或热在碱基裂解位点处裂解磷酸二酯或DNA骨架。在图1中,碱基切除导致标记的有义链产物的裂解,而两种衔接子保持完整。在图2中,碱基切除导致标记的有义链产物和在所述衔接子的连接链中已掺入 dUTP的一种衔接子被裂解,而在连接链中未掺入dUTP的衔接子保持完整。在图1和图2中,可将标记的有义链产物或第二链产物裂解,并因此仅有反义链产物或第一链产物在碱基切除后得以保留。
与其中两个衔接子方向在碱基切除后均保持完整的图1相比,图2左侧的示意图显示,标记的有义链产物可与连接至有义链产物的P2衔接子的标记连接链一起裂解。这样,只有反义链产物和连接至反义链的衔接子(图2中的P1)的连接链保持完整并可用于下游处理。在一个优选的实施方案中,下游处理需要对剩余的cDNA链或反义链产物进行扩增。与其中可使用与P1衔接子(P1amp)或P2衔接子(P2amp)的任一连接链中包含的序列互补的引物扩增反义链产物的图1相比,图2显示反义链产物的扩增仅能够使用与P1衔接子(P1amp)的连接链中包含的序列互补的引物进行。在一个优选的实施方案中,下游处理还可能需要对反义链产物(第一链产物)和/或扩增产物进行测序。在图1中,使用与P1衔接子的连接链中的序列互补的引物的下游测序将对相对于RNA模板的有义链或反义链进行测序。在图2中,使用与P1衔接子的连接链中的序列互补的引物的下游测序将仅对相对于RNA模板的反义链进行测序。
图4显示了一张流程图,描绘了用于产生定向链特异性cDNA文库的方法的一个实施方案。该方法包括以下步骤:通过对polyA+RNA进行随机引物逆转录而产生第一链cDNA;使用dATP、dCTP、dGTP和代替dTTP的dUTP,利用DNA依赖性DNA聚合酶产生第二链cDNA;使用超声处理将双链cDNA断裂;对纯化的断裂的双链cDNA进行末端修复以产生平端;连接双链体衔接子,其中一种双链体衔接子的一条连接链通过掺入dUTP进行标记;对连接产物进行切口修复以产生含有连接的衔接子的双链cDNA;使用酶和/或化学剂对纯化的含有连接的衔接子的双链cDNA进行链选择;使用PCR扩增剩余的cDNA链。
在任一上述实施方案的一个方面中,可耗尽通过本文所述的方法产生的定向cDNA文库中的非期望核酸序列。在一个实施方案中,非期望的核酸包含RNA。在一个优选的实施方案中,非期望的核酸包含核糖体或rRNA。从通过本发明的方法产生的定向cDNA文库中去除或耗尽 rRNA可通过本领域已知的任何方法进行,这些方法包括但不限于,从起始群体中去除rRNA,使用oligo dT引物的差别引发(即,仅引发聚腺苷酸化的转录物),和/或其中在引物池中特异性消除与rRNA序列互补的引物的差别引发(不太随机的或NSR引物方法)。
通常,本文所述的方法可用于产生核酸文库,该核酸文库优先群集相对于用来产生该文库的核酸模板处于特定链方向的核酸。通过本文所述的方法产生的核酸文库可用于确定核酸模板的方向性和链方向。在一个实施方案中,该核酸模板可以是RNA模板,并且该核酸文库可以是cDNA文库。在一个优选的实施方案中,该RNA模板可以是非rRNA。在又一个优选的实施方案中,该RNA模板可以是rRNA。在本文所述的方法的一个方面中,该cDNA文库可以是保留属于原始RNA模板或样品的方向性和链信息的定向cDNA文库,也就是说,本发明方法的定向文库代表了由第一链cDNA或模板RNA的逆转录或第二链cDNA(第一链cDNA的拷贝)产生的产物。本发明的方法提供了用于排他性地保留第一链cDNA产物或第二链cDNA产物的手段,因此能够指定从基因组DNA转录的方向性。转录的方向性由对在序列信息中呈现哪条cDNA链(第一或第二链)的了解来推断。RNA模板的方向性和链信息可指衍生出或转录出RNA模板的基因组DNA的链。作为本文所述的方法的另一方面,定向cDNA文库可用于通过将定向cDNA文库中cDNA的序列与RNA模板和/或基因组DNA进行比较来确定转录的方向性。比较核苷酸序列的方法是本领域已知的,并且可以包括公知的核苷酸序列比对程序或算法,如来自NCBI的BLAST算法。
基于本文所述的方法,可以确定RNA模板的方向性和链信息的保留具有大于50%的效率。使用本文所述方法导致的方向性和链方向的保留效率可以是>50%、>55%、>60%、>65%、>70%、>75%、>80%、>85%、>90%或>95%。方向性和链方向的保留效率可以是>99%。本文所述的方法可用于产生定向cDNA文库,其中该cDNA文库中超过50%的cDNA包含特定链方向。使用本文所述方法导致的特定链方向的保留可以>50%、>55%、>60%、>65%、>70%、>75%、>80%、>85%、>90% 或>95%。定向cDNA文库中cDNA的特定链方向的保留可以>99%。如图3所示,本发明的方法用于产生旨在保留反义链产物或第一链cDNA的定向cDNA文库。如图3所示,在定位至衍生出cDNA的人mRNA的编码外显子的序列读取值中,有>97%处于反义方向。
除非另有说明,本文所用的遗传、分子生物学、生物化学和核酸术语和符号采用该领域中的标准论著和教科书的术语和符号,例如Kornberg和Baker,DNA Replication,第二版(W.H.Freeman,New York,1992);Lehninger,Biochemistry,第二版(Worth Publishers,New York,1975);Strachan和Read,Human Molecular Genetics,第二版(Wiley-Liss,New York,1999);Eckstein,editor,Oligonucleotides and Analogs:A Practical Approach(Oxford University Press,New York,1991);Gait,编者,Oligonucleotide Synthesis:A Practical Approach(IRL Press,Oxford,1984)等等。
RNA样品
本发明的RNA样品可以是来自任何来源的双链、部分双链和单链核酸,这些来源包括但不限于,纯化或非纯化形式的合成或半合成核酸,其可以是DNA(dsDNA和ssDNA)或RNA,包括tRNA、mRNA、rRNA、线粒体DNA和RNA,叶绿体DNA和RNA,DNA-RNA杂合体,或其混合物,基因,染色体,质粒,诸如微生物(例如,细菌、酵母、病毒、类病毒、霉菌、真菌)、植物、动物、人等生物材料的基因组,及其片段。包含DNA(包括基因组DNA)的示例性起始材料可转录为RNA形式,这可使用在Kurn的美国专利号6,251,639中所公开的方法以及通过其他技术如表达系统来实现。基因组DNA的RNA拷贝通常将包括一般在mRNA中未见到的非转录的序列,如内含子、调节和控制元件等。示例性RNA样品可使用本领域中的标准技术来获得及纯化,并且包括纯化或未纯化形式的RNA,其包括但不限于mRNA、tRNA、snRNA、rRNA、逆转录病毒、小的非编码RNA、微小RNA、多核糖体RNA、前mRNA、基因内RNA、病毒RNA、无细胞RNA及其片段。在一个实施方案中,为本发明的方法提供的RNA样品包括整个转录组,其可以包括tRNA、 mRNA、rRNA和非编码RNA。非编码RNA,或称为ncRNA,可包括snoRNA、微小RNA、siRNA、piRNA和长nc RNA。在一个优选的实施方案中,RNA样品具有使用本领域中的标准技术降低或去除的rRNA含量。在一个最优选的实施方案中,该RNA样品为mRNA。
引物
本文所用的术语“引物”可指通常具有游离的3’羟基的核苷酸序列,其能够与模板(如一种或多种靶多核苷酸、一种或多种靶DNA、一种或多种靶RNA或引物延伸产物)杂交,并且也能够促进与模板互补的多核苷酸的聚合。引物可以是例如寡核苷酸。还可以是,例如,模板的序列(如引物延伸产物,或RNase[即RNase H]裂解模板-DNA复合物后产生的模板片段),该序列能够与模板本身中的序列杂交(例如,作为发夹环),并且能够促进核苷酸的聚合。因此,引物可以是外源性(例如,加入的)引物或内源性(例如,模板片段)引物。引物可含有构成引物尾部的非杂交序列。即使引物的序列不与靶标完全互补,其仍可以与靶标杂交。
本发明的引物通常是在沿着多核苷酸模板由聚合酶进行的延伸反应中,例如在PCR、SPIA或cDNA合成中采用的寡核苷酸。寡核苷酸引物可以是单链的合成多核苷酸,在其3′末端含有能够与靶多核苷酸序列杂交的序列。通常,与靶核酸杂交的引物的3′区域与序列或引物结合位点具有至少80%、优选90%、更优选95%、最优选100%的互补性。
本文所用的“互补的”可指与序列的全部或仅一部分的互补性。特定寡核苷酸引物的可杂交序列中的核苷酸数应该使得用于杂交寡核苷酸引物的严格性条件将阻止过多的随机非特异性杂交。通常,寡核苷酸引物的杂交部分中的核苷酸数将至少与寡核苷酸引物所杂交的靶多核苷酸上的限定序列一样大,即,至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少约20,并且通常约6至约10或6至约12或12至约200个核苷酸,通常约20至约50个核苷酸。一般来说,靶多核苷酸大于寡核苷酸引物或先前所述的引物。
在一些情况下,所研究的靶多核苷酸序列的身份是已知的,并且 可根据前述靶多核苷酸序列的反义序列来精确地合成可杂交的引物。在其他情况下,当靶多核苷酸序列未知时,寡核苷酸引物的可杂交序列为随机序列。包含随机序列的寡核苷酸引物可以被称为如本文所述的“随机引物”。在另外其他的情况下,寡核苷酸引物如第一引物或第二引物包含一组引物,例如一组第一引物或一组第二引物。在一些情况下,这组第一或第二引物可包含设计为与多种(例如2、3、4、约6、8、10、20、40、80、100、125、150、200、250、300、400、500、600、800、1000、1500、2000、2500、3000、4000、5000、6000、7000、8000、10,000、20,000、25,000种或更多种)靶序列杂交的引物的混合物。在一些情况下,所述多种靶序列可包含一组相关序列、随机序列、整个转录组或其一部分(例如,大部分),或任何组的序列如mRNA。
在本发明的某些实施方案中可以采用有尾引物。通常,有尾引物包含可与一种或多种靶多核苷酸(如RNA样品中的一种或多种靶RNA)杂交的3’部分和不可与一种或多种靶多核苷酸杂交的5’部分。通常,在有尾引物的可杂交的3’部分与一种或多种靶多核苷酸杂交的条件下,不可杂交的5’部分不与该一种或多种靶多核苷酸杂交。在一些实施方案中,不可杂交的5’部分包含启动子特异性序列。通常,启动子特异性序列包含单链DNA序列区域,该区域在双链形式下能够介导RNA转录。启动子特异性序列的实例是本领域已知的,并且包括但不限于T7、T3或SP6RNA聚合酶启动子序列。当利用DNA聚合酶延伸有尾引物时,可以产生具有包含限定序列的5'部分的引物延伸产物。该引物延伸产物然后可有第二引物与之退火,该第二引物可利用DNA聚合酶延伸以产生在一端包含限定序列的双链产物。在其中一种或多种有尾引物的不可杂交的5’部分包含启动子特异性序列的一些实施方案中,在一端包含限定序列的双链产物的构建产生能够介导RNA转录的双链启动子序列。在一些实施方案中,可通过使包含与启动子特异性序列互补的序列的寡核苷酸与启动子特异性序列杂交来产生双链启动子序列。在一些实施方案中,双链启动子的形成之后可接着通过对双链启动子的下游序列的RNA转录来产生单链RNA,通常在包含包括但不限于核糖核苷三磷酸(rNTP) 和DNA依赖性RNA聚合酶的所有必需组分的反应混合物中。有尾引物可包含DNA、RNA或DNA和RNA两者。在一些实施方案中,有尾引物由DNA组成。
在本发明的某些实施方案中可以采用复合引物。复合引物为由RNA和DNA部分组成的引物。在一些方面,复合引物可以是包含例如3'-DNA部分和5'-RNA部分的有尾复合引物。在该有尾复合引物中,其全部或一部分包含DNA的3'部分与多核苷酸互补;而其全部或一部分包含RNA的5'部分不与多核苷酸互补,并且在有尾复合引物的3'部分与多核苷酸靶标杂交的条件下不与该多核苷酸杂交。当用DNA聚合酶延伸有尾复合引物时,可以产生具有包含限定序列的5'-RNA部分的引物延伸产物。这种引物延伸产物然后可有第二引物与之退火,该第二引物可利用DNA聚合酶延伸以产生在一端具有包含限定序列的RNA/DNA异源双链体的双链产物。可从部分异源双链体上选择性裂解RNA部分以产生具有3'单链突出端的双链DNA,该3'单链突出端可用于本发明的各个方面,包括允许使用复合扩增引物进行等温扩增。
在其他方面,复合引物可以是扩增复合引物(可互换地称为复合扩增引物)。在该扩增复合引物中,RNA和DNA部分通常都与待拷贝或扩增的多核苷酸中的序列互补或杂交。在一些实施方案中,扩增复合引物的3'部分为DNA,而复合扩增引物的5'部分为RNA。设计复合扩增引物使得该引物从3'-DNA部分延伸以产生引物延伸产物。RNA/DNA异源双链体形式的这种引物延伸产物的5'-RNA部分经历RNase H裂解,从而释放多核苷酸的一部分以进行额外复合扩增引物的杂交。由具有链置换活性的DNA聚合酶进行的扩增复合引物的延伸从原始引物中释放引物延伸产物并产生多核苷酸序列的另一拷贝。反复多轮引物杂交、利用链置换DNA合成的引物延伸和RNA裂解产生多核苷酸序列的多个拷贝。下文更加详细地对复合引物进行了描述。
如本文所用的“随机引物”可以是通常包含这样一种序列的引物:该序列不一定基于样品中的特定或特异性序列而设计,而是基于随机引物的序列可与样品中的一种或多种序列(在给定的一组条件下)杂交的统 计期望(或经验观测值)进行设计。随机引物通常是包含随机序列的寡核苷酸或寡核苷酸群体,其中在寡核苷酸上的给定位置处的核苷酸可以是四种核苷酸中的任意核苷酸或四种核苷酸的任意选定组(例如四种核苷酸中的仅三种,或四种核苷酸中的仅两种)。在一些情况下,寡核苷酸或寡核苷酸群体的所有位置可以是任意两种或更多种核苷酸。在其他情况下,仅一部分寡核苷酸,例如特定区域,将包含可以是任意两种或更多种碱基的位置。在一些情况下,包含可以是任意两种或更多种碱基的位置的寡核苷酸部分的长度为约5、6、7、8、9、10、11、12、13、14或约15-20个核苷酸。在一些情况下,随机引物可以包含有尾引物,该有尾引物具有包含随机序列的3'区和作为包含特异性非随机序列的非杂交序列的5'区。3'区还可包含与包含poly-T序列的区域组合的随机序列。随机引物(或其互补体)的序列可以是或可以不是天然存在的,或者可以存在于或可以不存在于感兴趣的样品中的序列池中。对单一反应混合物中的多个RNA种类的扩增可以采用,但不一定采用多种、优选大量的随机引物。如本领域中所熟知的,“随机引物”还可指这样的引物:其为共同设计为与期望的和/或大量的靶序列杂交的引物群体(多种随机引物)的成员。随机引物可在核酸序列上的多个位点处杂交。随机引物的使用提供了一种用于产生与靶多核苷酸互补的引物延伸产物的方法,该方法不需要预先了解靶标的确切序列。在一些实施方案中,引物的一部分是随机的,而引物的另一部分包含限定的序列。例如,在一些实施方案中,引物的3'部分将包含随机序列,而引物的5'部分包含限定的序列。在一些实施方案中,引物的3'随机部分将包含DNA,而引物的5'限定部分将包含RNA,在其他实施方案中,3'和5'部分都将包含DNA。在一些实施方案中,5'部分将包含限定的序列,而3'部分将包含可与样品中的大量RNA(如所有mRNA)杂交的poly-dT序列。在一些实施方案中,“随机引物”或包含随机产生的序列的引物包含含有随机选自两种或更多种不同核苷酸的一种或多种核苷酸的引物集合,使得随机选择的核苷酸的所有可能的序列组合可在该集合中表现出来。在一些实施方案中,一种或多种随机引物的产生不包括从一种或多种随机引物的随机部分中的可能的 序列组合中排除或选择某些序列或核苷酸组合的步骤。
在一个实施方案中,本发明的引物可以是有尾引物。在该实施方案中,5’尾可包含RNA,并且不可与样品中的RNA杂交。第一引物的3’末端可与样品中的RNA杂交,包含DNA并且包含随机序列,从而使得能够在整个转录组上杂交。第一引物还可包含引物的混合物。除了在3’末端包含随机序列的第一引物以外,第一引物的混合物还可包括包含可与mRNA的3’-poly A尾杂交的3’-DNA序列的第一引物。
在本发明的某些实施方案中,用于聚合酶反应的多核苷酸模板可以是具有poly(A)尾的RNA分子。在此类情况下,优选的是这些引物为oligo(dT)、oligo(dU)或oligo(U)引物,或者备选地,在引物的3’末端具有oligo d(T)、oligo(dU)或oligo(U)区域的复合引物。
在本发明的另一个实施方案中,用于聚合酶反应的多核苷酸模板可以是无poly(A)尾的RNA分子。在此类情况下,优选的是这些引物为随机引物,或者备选地,在引物的3’末端上具有可与样品中的RNA杂交的随机序列的复合引物。
在本发明的某些其他实施方案中,用于聚合酶反应的多核苷酸模板可以是cDNA分子。在此类情况下,优选的是这些引物为随机引物,或者备选地,复合引物,如本文所述的在引物的3’末端上具有可与cDNA模板的一部分杂交的随机序列的扩增复合引物。在又一个实施方案中,用于聚合酶反应的多核苷酸模板为序列已知的cDNA分子。在此类情况下,优选的是这些引物包含与靶多核苷酸的所有或部分已知序列互补的序列,或者备选地,复合引物,如本文所述的在引物的3’末端上具有与序列已知的cDNA模板的一部分互补的序列的扩增复合引物。
RNA依赖性DNA聚合酶
在本发明的方法和组合物中使用的RNA依赖性DNA聚合酶能够根据本发明的方法实现引物的延伸。因此,优选的RNA依赖性DNA聚合酶可以是能够沿着至少主要由核糖核苷酸组成的核酸模板延伸核酸引物的聚合酶。在本发明的方法和组合物中使用的合适的RNA依赖性DNA聚合酶包括逆转录酶(RT)。RT在本领域是公知的。RT的实例包括 但不限于莫洛尼鼠白血病病毒(M-MLV)逆转录酶、人免疫缺陷病毒(HIV)逆转录酶、劳斯肉瘤病毒(RSV)逆转录酶、禽成髓细胞白血病病毒(AMV)逆转录酶、劳斯相关病毒(RAV)逆转录酶和成髓细胞白血病相关病毒(MAV)逆转录酶或其他禽类肉瘤-白血病病毒(ASLV)逆转录酶和由其衍生的修饰的RT。参见,例如US7056716。许多逆转录酶,如来自禽成髓细胞白血病病毒(AMV-RT)和莫洛尼鼠白血病病毒(MMLV-RT)的那些逆转录酶,包含超过一种活性(例如,聚合酶活性和核糖核酸酶活性),并且可以在双链cDNA分子的形成中发挥作用。然而,在一些情况下,优选地采用缺乏或具有大幅度降低的RNase H活性的RT。缺乏RNase H活性的RT是本领域已知的,包括那些包含野生型逆转录酶的突变的RT,其中该突变消除了RNase H活性。具有降低的RNase H活性的RT的实例在US20100203597中描述。在这些情况下,来自其他来源如从大肠杆菌中分离的RNase H的加入可用于降解起始RNA样品以及形成双链cDNA。还考虑到RT的组合,包括不同的非突变RT的组合、不同的突变RT的组合以及一种或多种非突变RT与一种或多种突变RT的组合。
DNA依赖性DNA聚合酶
用于本发明的方法和组合物中的DNA依赖性DNA聚合酶能够根据本发明的方法实现引物的延伸。因此,优选的DNA依赖性DNA聚合酶可以是在RNA模板的存在下或在选择性去除RNA模板后能够沿着第一链cDNA延伸核酸引物的聚合酶。适用于本发明的方法的示例性DNA依赖性DNA聚合酶包括但不限于Klenow聚合酶(具有或没有3'-外切核酸酶活性)、Bst DNA聚合酶、Bca聚合酶、φ29DNA聚合酶、Vent聚合酶、Deep Vent聚合酶、Taq聚合酶、T4聚合酶和大肠杆菌DNA聚合酶1、其衍生物或聚合酶的混合物。在一些情况下,聚合酶不包含5'-外切核酸酶活性。在其他情况下,聚合酶包含5'外切核酸酶活性。在一些情况下,本发明的引物延伸可使用包含强链置换活性的聚合酶例如Bst聚合酶进行。在其他情况下,本发明的引物延伸可使用包含弱或无链置换活性的聚合酶进行。本领域技术人员可以认识到在引物延伸步骤中使用链置换活性的优点和缺点,以及预计哪些聚合酶可提供链置换活性(参 见,例如,New England Biolabs聚合酶)。例如,链置换活性在随机引发和延伸步骤期间确保覆盖整个转录组方面可能是有用的。链置换活性进一步在引发和延伸步骤过程中产生双链扩增产物方面可能是有用的。或者,包含弱或无链置换活性的聚合酶在引物杂交和延伸过程中产生与模板核酸杂交的单链核酸产物方面可能是有用的。
在一个实施方案中,可对通过本发明的方法产生的双链产物进行末端修复以产生用于本发明的衔接子连接应用的平端。双链产物上平端的产生可通过使用单链特异性DNA外切核酸酶如外切核酸酶1、外切核酸酶7或其组合降解双链产物的突出单链末端而产生。或者,双链产物可以通过使用单链特异性DNA内切核酸酶(例如但不限于绿豆内切核酸酶或S1内切核酸酶)来产生平端。或者,双链产物可以通过使用包含单链外切核酸酶活性的聚合酶(如T4DNA聚合酶)、包含单链外切核酸酶活性的任何其他聚合酶或其组合降解双链产物的突出单链末端来产生平端。在一些情况下,包含单链外切核酸酶活性的聚合酶可在包含或不包含一种或多种dNTP的反应混合物中温育。在其他情况下,单链核酸特异性外切核酸酶与一种或多种聚合酶的组合可用于使引物延伸反应的双链产物产生平端。在另外其他的情况下,可通过补平双链产物的突出单链末端来将延伸反应的产物制成平端的。例如,可在一种或多种dNTP的存在下使这些片段与聚合酶如T4DNA聚合酶或Klenow聚合酶或其组合一起温育来补平双链产物的单链部分。或者,可以通过使用外切核酸酶和/或聚合酶的单链突出端降解反应以及在一种或多种dNTP的存在下使用一种或多种聚合酶的补平反应的组合来将双链产物制成平端的。
在另一个实施方案中,本发明的衔接子连接应用可在该衔接子的非连接链与本发明的双链产物的链之间留下缺口。在这些情况下,缺口修复或补平反应对于向双链产物上附加衔接子的非连接链的序列可能是必要的。缺口修复可利用众多本文所述的DNA依赖性DNA聚合酶进行。在一个实施方案中,缺口修复可利用具有链置换活性的DNA依赖性DNA聚合酶进行。在一个实施方案中,缺口修复可使用具有弱或无链置换活性的DNA依赖性DNA聚合酶进行。在一个实施方案中,衔接子的 连接链可作为缺口修复或补平反应的模板。在一个优选的实施方案中,缺口修复可使用TaqDNA聚合酶进行。
链特异性选择方法
本文提供的组合物和方法对于在双链DNA中保留方向信息是有用的。
本文所用的术语“链特异性的”或“定向的”可指在双链多核苷酸中区分原始模板链和与原始模板链互补的链的能力。
在一些实施方案中,本发明的方法可用于保留有关单链核酸分子的方向的信息,同时产生更适合于分子克隆应用的双链多核苷酸。可以合成双链多核苷酸的一条链,以使其具有沿着该链的整个长度掺入其中的至少一种修饰的核苷酸。在一些实施方案中,修饰的核苷酸的掺入标记了用于降解或去除的链。
术语“第一链合成”可指使用原始核酸(RNA或DNA)作为聚合酶反应的起始模板的第一链的合成。第一链的核苷酸序列对应于互补链的序列。
术语“第二链合成”可指使用第一链作为聚合酶反应的模板的第二链的合成。第二链的核苷酸序列对应于原始核酸模板的序列。
术语“未修饰的dNTP”或“经典dNTP”可指通常用作DNA合成中的结构单元的四种脱氧核糖核苷酸三磷酸:dATP(脱氧腺苷三磷酸)、dCTP(脱氧胞苷三磷酸)、dGTP(脱氧鸟苷三磷酸)和dTTP(脱氧胸苷三磷酸)。同样,术语“规范的dNTP”或“规范的核苷酸”可用于指通常见于DNA中的四种脱氧核糖核苷酸三磷酸:dATP、dCTP、dGTP和dTTP。
本文所用的术语“规范的”可指常见于DNA中的核酸碱基腺嘌呤、胞嘧啶、鸟嘌呤和胸腺嘧啶或它们的脱氧核糖核苷酸或脱氧核糖核苷类似物。术语“非规范的”可指除了DNA中的四种规范碱基之外的DNA中的核酸碱基或它们的脱氧核糖核苷酸或脱氧核糖核苷类似物。虽然尿嘧啶在RNA中是一种常见的核酸碱基,但是尿嘧啶在DNA中是一种非规范碱基。
本文所用的术语“修饰的核苷酸”或“修饰的dNTP”可指适合于替 代一种相应的未修饰的或经典的dNTP的任何分子。此类修饰的核苷酸必须能够经受与其所替代的经典的或未修饰的dNTP相同的或相似的碱基对匹配。修饰的核苷酸或dNTP必须适合于特异性降解或裂解,其中其被合适的降解剂或裂解剂选择性降解或裂解,从而使得含有至少一种修饰的和降解的或裂解的dNTP的DNA链基本上不适合于扩增、测序和/或杂交。或者,修饰的核苷酸必须标记含有能够用于选择性去除或裂解的修饰核苷酸的DNA链或促进多核苷酸链的分离。这样的去除或裂解或分离可通过与该修饰核苷酸选择性相互作用的分子、颗粒或酶来实现,从而选择性去除或为了去除而标记或裂解仅一条多核苷酸链。
如本申请中所用的,术语“链标记”可指用于区分双链多核苷酸的两条链的任何方法。术语“选择”可指在双链多核苷酸的两条链之间进行选择的任何方法。术语“选择性去除”或“为了去除而选择性标记”或“裂解”可指对多核苷酸链进行的、使得该多核苷酸链不适合于下游应用如扩增或杂交或测序的任何修饰。
在本发明中标记链的选择性去除或裂解可通过使用对标记链的酶处理来实现。可用于根据本发明的方法选择性去除或裂解标记链的酶可包括糖基化酶如尿嘧啶-N-糖基化酶(UNG),其从DNA骨架上选择性降解dUTP的碱基部分。可在本发明的方法中使用的另外的糖基化酶和它们的非规范的或修饰的核苷酸底物包括5-甲基胞嘧啶DNA糖基化酶(5-MCDG),其从DNA骨架上裂解5-甲基胞嘧啶(5-MeC)的碱基部分(Wolffe等人,Proc.Nat.Acad.Sci.USA96:5894-5896,1999);3-甲基腺苷-DNA糖基化酶I,其从DNA骨架上裂解3-甲基腺苷的碱基部分(参见,例如Hollis等人(2000)Mutation Res.460:201-210);和/或3-甲基腺苷DNA糖基化酶II,其从DNA骨架上裂解3-甲基腺苷、7-甲基鸟嘌呤、7-甲基腺苷和/3-甲基鸟嘌呤的碱基部分。参见McCarthy等人(1984)EMBO J.3:545-550。已描述了5-MCDG的多功能和单功能形式。参见Zhu等人,Proc.Natl.Acad.Sci.USA98:5031-6,2001;Zhu等人,Nuc.Acid Res.28:4157-4165,2000;和Neddermann等人,J.B.C.271:12767-74,1996(描述了双功能性的5-MCDG);Vairapandi和Duker,Oncogene 13:933-938,1996;Vairapandi等人,J.Cell.Biochem.79:249-260,2000(描述了包含5-MCDG活性的单功能酶)。在一些实施方案中,5-MCDG优先裂解完全甲基化的多核苷酸位点(例如,CpG二核苷酸),并且在其他实施方案中,5-MCDG优先裂解半甲基化的多核苷酸。例如,单功能性的人5-甲基胞嘧啶DNA糖基化酶在完全甲基化的CpG位点处特异性裂解DNA,并且对于半甲基化的DNA相对无活性(Vairapandi和Duker,同上;Vairapandi等人,同上)。相比之下,鸡胚5-甲基胞嘧啶-DN糖基化酶针对半甲基化的甲基化位点具有较高的活性。在一些实施方案中,5-MCDG的活性用辅助因子如重组的富含CpG的RNA、ATP、RNA解旋酶和增殖细胞核抗原(PCNA)来增强(提高或加强)。参见美国专利申请号20020197639A1。可以使用一种或多种作用物。在一些实施方案中,该一种或多种作用物裂解同一甲基化核苷酸的碱基部分。在其他实施方案中,该一种或多种作用物裂解不同甲基化核苷酸的碱基部分。用两种或更多种作用物进行的处理可以是相继的或同时的。
在本发明的一些实施方案中,在通过去除或裂解至少一种修饰的核苷酸(即dUTP)的碱基部分而在DNA骨架中产生脱碱基位点后,可以接着在该脱碱基位点处对骨架进行断裂或裂解。能够在脱碱基位点处裂解骨架的合适的作用物(例如,酶、化学物质和/或反应条件如热)包括:热处理和/或化学处理(包括碱性条件、酸性条件、烷基化条件或胺介导的脱碱基位点的裂解(参见,例如,McHugh和Knowland,Nucl.Acids Res.(1995)23(10):1664-1670;Bioorgan.Med.Chem.(1991)7:2351;Sugiyama,Chem.Res.Toxicol.(1994)7:673-83;Horn,Nucl.Acids.Res.,(1988)16:11559-71),和/或使用在钙离子的存在下催化在脱碱基位点处裂解多核苷酸的酶,例如AP内切核酸酶(也称为“脱嘌呤、脱嘧啶内切核酸酶”)(例如,可从Epicentre Tech.,Inc,Madison Wis.获得的大肠杆菌内切核酸酶IV)、大肠杆菌内切核酸酶III或内切核酸酶IV、大肠杆菌外切核酸酶III。参见,例如Lindahl,PNAS(1974)71(9):3649-3653;Jendrisak,美国专利号6,190,865B1;Shida,Nucleic Acids Res.(1996)24(22):4572-76;Srivastava,J.Biol.Chem.(1998)273(13):21203-209;Carey,Biochem. (1999)38:16553-60;Chem Res Toxicol(1994)7:673-683。如本文所用的“试剂”涵盖诸如热的反应条件。在一个实施方案中,AP内切核酸酶、大肠杆菌内切核酸酶IV用于在脱碱基位点处裂解磷酸二酯骨架或磷酸二酯键。在另一个实施方案中,利用胺如N,N'-二甲基乙二胺(DMED)进行裂解。参见,例如,McHugh和Knowland,同上。
在一些情况下,包含一个或多个脱碱基位点的核酸可用亲核物质或碱来处理。在一些情况下,该亲核物质是胺,如伯胺、仲胺或叔胺。例如,脱碱基位点可用哌啶、吗啉或其组合来处理。在一些情况下,可以使用热哌啶(例如,在90℃下1M)来裂解包含一个或多个脱碱基位点的核酸。在一些情况下,可以使用吗啉(例如,在37℃或65℃下3M)来裂解包含一个或多个脱碱基位点的核酸。或者,可以使用多胺来裂解包含一个或多个脱碱基位点的核酸。合适的多胺包括例如精胺、亚精胺、1,4-二氨基丁烷、赖氨酸、三肽K--W--K、DMED、哌嗪、1,2-乙二胺或其任意组合。在一些情况下,包含一个或多个脱碱基位点的核酸可用适合于进行β消除反应、δ消除反应或其组合的试剂进行处理。在一些情况下,本发明的方法提供了酶或酶和多胺如DMED的组合在温和条件下在单一反应混合物中的应用,该反应混合物不影响规范的或未修饰的核苷酸,并因此可维持该方法的产物的序列完整性。合适的温和条件可包括处于或接近中性pH的条件。其他合适的条件包括约4.5或更高、5或更高、5.5或更高、6或更高、6.5或更高、7或更高、7.5或更高、8或更高、8.5或更高、9或更高、9.5或更高、10或更高、或约10.5或更高的pH。另外其他合适的条件包括约4.5-10.5、约5-10.0、约5.5-9.5、约6-9、约6.5-8.5、约6.5-8.0或约7-8.0。合适的温和条件还可包括处于或接近室温的条件。其他合适的条件包括约10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃、20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、60℃、61℃、62℃、63℃、 64℃、65℃、66℃、67℃、68℃、69℃或70℃或更高的温度。另外其他合适的条件包括约10℃至约70℃、约15℃至约65℃、约20℃至约60℃、约20℃至约55℃、约20℃至约50℃、约20℃至约45℃、约20℃至约40℃、约20℃至约35℃或约20℃至约30℃。在一些情况下,温和的裂解条件的使用可提供对通过本发明的方法产生的引物延伸产物的较少损害。在一些情况下,受损的碱基越少,引物延伸产物就越适合用于下游分析如测序。在其他情况下,温和的裂解条件的使用可增加最终产物的产率,维持序列完整性,或使得本发明的方法更适合于自动化。
在涉及断裂的实施方案中,在脱碱基位点处裂解包含脱碱基位点的多核苷酸的骨架,从而产生该多核苷酸的两个或更多个片段。如本文所述,至少一个片段包含脱碱基位点。本文提供了在脱碱基位点处裂解多核苷酸的磷酸二酯骨架或磷酸二酯键的作用物。在一些实施方案中,该作用物为AP内切核酸酶如大肠杆菌AP内切核酸酶IV。在其他实施方案中,该作用物为DMED。在其他实施方案中,该作用物为热、碱性条件、酸性条件或烷基化剂。在另外其他的实施方案中,在脱碱基位点处裂解磷酸二酯骨架的作用物是与裂解核苷酸的碱基部分以形成脱碱基位点的作用物相同的作用物。例如,本发明的糖基化酶可包含糖基化酶和裂合酶活性,由此糖基化酶活性裂解核苷酸的碱基部分(例如,修饰的核苷酸)以形成脱碱基位点,并且裂合酶活性在所形成的脱碱基位点处裂解磷酸二酯骨架。在一些情况下,糖基化酶包含糖基化酶活性和AP内切核酸酶活性。
用于根据本发明的方法对非规范的或修饰的核苷酸的碱基部分进行裂解的适当的反应介质和条件为允许裂解非规范的或修饰的核苷酸的碱基部分的那些反应介质和条件。此类介质和条件对于本领域技术人员来说是已知的,并且在许多出版物如Lindahl,PNAS(1974)71(9):3649-3653;和Jendrisak,美国专利号6,190,865B1;美国专利号5,035,996和美国专利号5,418,149中有所描述。在一个实施方案中,将UDG(Epicentre Technologies,Madison Wis.)加至核酸合成反应混合物中, 并在37℃下温育20分钟。在一个实施方案中,对于包含非规范的或修饰的核苷酸的多核苷酸的合成以及非规范的或修饰的核苷酸的碱基部分的裂解而言,反应条件是相同的。在另一个实施方案中,针对这些反应使用不同的反应条件。在一些实施方案中,在UNG之前或与之同时加入螯合剂(例如EDTA)以便防止聚合酶延伸裂解产物的末端。
在一个实施方案中,通过将至少一种修饰的核苷酸掺入合成的多核苷酸的一条链中来进行选择,并且通过用针对至少一种修饰的核苷酸展现出特定活性的酶处理来进行选择性去除。在一个优选的实施方案中,掺入合成的多核苷酸的一条链中的修饰的核苷酸是脱氧尿苷三磷酸(dUTP),代替dNTP混合物中的dTTP,并且标记链从下游应用中的选择性去除通过UNG进行。UNG选择性降解dUTP,而其对于其他dNTP及它们的类似物是中性的。UNG处理导致N-糖苷键的裂解和dU残基的碱基部分的去除,从而形成脱碱基位点。在一个优选的实施方案中,在脱嘌呤/脱嘧啶内切核酸酶(APE)的存在下进行UNG处理以在脱碱基位点处产生切口。结果,用UNG/APE处理的、具有掺入的dUTP的多核苷酸链得到裂解并且不能经历聚合酶扩增。在另一个实施方案中,切口的产生和裂解是通过利用多胺如DMED处理或通过热处理来实现的。在一个优选的实施方案中,在含有32mM DMED的反应缓冲液中进行UNG处理。
如在本申请中所用的,术语“至少一种核苷酸”或“至少一种修饰的核苷酸”是指相同种类或类别的多种dNTP分子。因此,“一种修饰的核苷酸”的使用是指用相应的修饰的核苷酸物质代替dNTP混合物中的一种经典的dNTP,即dATP、dCTP、dGTP或dTTP。在一个优选的实施方案中,至少一种修饰的核苷酸为dUTP,代替dNTP混合物中的dTTP。在另一个实施方案中,至少一种修饰的核苷酸是生物素化的dNTP。在另一个实施方案中,至少一种修饰的核苷酸含有巯基(thio)。在另一个实施方案中,至少一种修饰的核苷酸为氨基烯丙基dNTP。在又一个实施方案中,至少一种修饰的核苷酸为肌苷,代替dNTP混合物中的dGTP。在一些实施方案中,本发明的方法用于构建定向cDNA文库。当使用并 非极性特异性的衔接子,即产生具有两个衔接子方向的连接产物的衔接子时,链标记是必要的,但对于定向cDNA文库的构建是不够的。根据本发明的方法构建定向cDNA文库需要对cDNA插入物和在衔接子的连接链处对两种衔接子之一进行链标记。本发明的有用特征是切换衔接子方向的能力。例如,在双链体衔接子系统中——其中P1/P2指定衔接子方向,从而导致有义链选择和(任选的)测序,并且其中P2衔接子具有沿着衔接子的连接链掺入的至少一种修饰的核苷酸,对方案进行修改以使得P1衔接子(与P2衔接子相反)具有至少一种沿着连接链掺入的修饰的核苷酸允许进行反义链选择和(任选的)测序。
在其中第二链和衔接子之一含有至少一种修饰的核苷酸的实施方案中,可合成该第二链和衔接子之一,以使得各自包含足够的和可预测密度的修饰的核苷酸,以提供足够的和可预测的断裂,并且当与一种或多种能够在修饰的核苷酸处裂解的作用物(例如,糖基化酶,糖基化酶和胺,糖基化酶和热,或糖基化酶和AP内切核酸酶)一起使用时,进一步产生期望的大小范围的片段。通常,可在得到的包含修饰的核苷酸的多核苷酸中以大约每5、10、15、20、25、30、40、50、65、75、85、100、123、150、175、200、225、250、300、350、400、450、500、550、600、650个或更多个核苷酸的间隔掺入修饰的碱基。在一个实施方案中,以大约每200个核苷酸、大约每100个核苷酸或大约每50、25、20、15、10、9、8、7、6、5个或更少的核苷酸掺入修饰的核苷酸。在另一个实施方案中,以大约每50个至约200个核苷酸掺入修饰的核苷酸。在一些实施方案中,可在反应混合物中使用1:1、1:2、1:3、1:4、1:5、1:6、1:10、1:15、1:20或更高的修饰的与未修饰的核苷酸的比值。在一些情况下,在反应混合物中使用1:1、1:2、1:3、1:4、1:5、1:6、1:10、1:15、1:20或更高的修饰的核苷酸dUTP与未修饰的核苷酸dTTP的比值。
如本文所用的术语“衔接子”是指已知序列的寡核苷酸,其与靶多核苷酸或目标靶多核苷酸链的连接使得能够产生靶多核苷酸或目标靶多核苷酸链的扩增就绪的产物。设想了多种衔接子设计。合适的衔接子分子包括单链或双链核酸(DNA或RNA)分子或其衍生物,茎-环核酸分子, 包含1、2、3、4、5、6、7、8、9、10个碱基或更长的一个或多个单链突出端的双链分子,蛋白质,肽,适体,有机分子,有机小分子,或本领域已知的可共价或非共价附着(例如通过连接)至双链DNA片段的任何衔接子分子。可将衔接子设计为包含可连接至双链DNA(或具有突出端的双链DNA)产物的双链部分。各种连接方法和试剂是本领域已知的,并且对于实施本发明的方法可能是有用的。例如,可以采用平端连接。类似地,单一dA核苷酸可通过缺乏3′-外切核酸酶活性的聚合酶添加至双链DNA产物的3′末端,并且可与包含dT突出端的衔接子退火(或相反)。这种设计允许随后连接杂交的组分(例如,通过T4DNA连接酶)。其他连接策略和相应的试剂是本领域已知的,并且用于进行有效连接反应的试剂盒和试剂是可购买到的(例如,来自New England Biolabs,Roche)。衔接子的双链DNA部分可进一步包含设计用于标记目标样品或序列的指标化的或条码化的序列。
在本发明中可采用利用常规双链体衔接子的平端连接,这意味着衔接子能够在靶多核苷酸链的任一末端连接,从而产生具有两个衔接子方向的连接产物。在一个优选的实施方案中,两种衔接子之一具有沿着该衔接子的连接链掺入的至少一种修饰的核苷酸。
扩增方法
本文所述的方法、组合物和试剂盒可用于产生用于下游应用如大规模平行测序(即新一代测序方法)或杂交平台的扩增就绪的产物。扩增方法是本领域公知的。合适的扩增反应可包括任何DNA扩增反应,包括但不限于聚合酶链式反应(PCR)、链置换扩增(SDA)、线性扩增、多重置换扩增(MDA)、滚环扩增(RCA)、单引物等温扩增(SPIA,参见,例如美国专利号6,251,639)、Ribo-SPIA或其组合。在一些情况下,用于提供模板核酸的扩增方法可在限制条件下进行,以使得仅进行少数几轮扩增(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30等),例如通常对于cDNA产生所进行的。扩增的轮数可以是约1-30、1-20、1-15、1-10、5-30、10-30、15-30、20-30、10-30、15-30、20-30或25-30轮。
PCR是一种体外扩增程序,其基于变性、寡核苷酸引物退火和通过嗜热模板依赖性多核苷酸聚合酶引起的引物延伸的重复循环,从而导致侧翼为引物的多核苷酸分析物的期望序列拷贝的指数增长。定位与DNA的相反链退火的两条不同的PCR引物,以使得一条引物的聚合酶催化的延伸产物可作为另一条的模板链,从而导致离散的双链片段的累积,该片段的长度由寡核苷酸引物的5'末端之间的距离来限定。
LCR使用连接酶来连接预形成的核酸探针对。这些探针与核酸分析物的每条互补链(如果存在的话)杂交,并且采用连接酶来将每对探针结合在一起,从而产生可用于下一个循环中的重复(reiterate)了特定核酸序列的两个模板。
SDA(Westin等人2000,Nature Biotechnology,18,199-202;Walker等人1992,Nucleic Acids Research,20,7,1691-1696)是一种等温扩增技术,其基于限制性内切核酸酶如HincII或BsoBI使其识别位点的半硫代磷酸形式的未修饰链产生切口的能力,以及外切核酸酶缺陷型DNA聚合酶如Klenow exo minus聚合酶或Bst聚合酶在切口处延伸3'末端并使下游DNA链位移的能力。指数式扩增是由结合有义和反义反应导致的,其中从有义反应位移的链作为反义反应的靶标,反之亦然。
本发明的一些方面利用核酸或多核苷酸的线性扩增。线性扩增通常是指这样一种方法,其包括形成核酸或多核苷酸分子(通常为核酸或多核苷酸分析物)的仅一条链的互补体的一个或多个拷贝。因此,线性扩增与指数式扩增之间的主要差别是:在后一方法中,产物作为用于形成更多产物的底物,而在前一方法中,起始序列是用于形成产物的底物,但是反应产物即起始模板的复制不是用于产生产物的底物。在线性扩增中,产物的形成量作为时间的线性函数而增加,不同于其中产物的形成量为时间的指数函数的指数式扩增。
在一些实施方案中,扩增是指数式的,例如在通过聚合酶链式反应(PCR)对DNA的特异性双链序列进行的酶促扩增中。在其他实施方案中,扩增方法是线性的。在其他实施方案中,扩增方法是等温的。
用于全转录组分析的下游应用
本发明的一个重要方面是,本文公开的方法和组合物可有效并成本有效地用于下游分析,如新一代测序或杂交平台,具有最少的目标生物材料的损失。特别是,本发明的方法可用于对cDNA文库或整个转录组进行测序,同时保留有关在原始RNA样品中存在哪条链的信息。在一个实施方案中,本发明提供了用于全转录组测序的方法,该方法包括提供RNA样品,提供已知或未知序列的一种或多种引物,将一种或多种引物与逆转录酶组合,逆转录该样品,由逆转录的RNA样品产生双链cDNA,其中四种dNTP中的至少一种即dATP、dCTP、dGTP或dTTP在第二链合成过程中被修饰的dNTP替代并掺入第二链中,对双链cDNA进行末端修复,将衔接子连接至双链cDNA,其中一种衔接子具有掺入该衔接子的连接链中的修饰的dNTP,进行缺口修复,用合适的降解剂选择性去除或为了去除而标记第二链,使用一种或多种引物扩增RNA样品以产生扩增的产物,并对该产物进行测序。在一些实施方案中,对通过本发明的方法产生的单链cDNA进行测序,而在选择性去除标记的第二链后不对RNA样品进行扩增。在一些实施方案中,RNA的起始量为0.01ng-100mg。用于逆转录和/或扩增的引物可以是有尾引物、嵌合引物或有尾的嵌合引物。
在一个实施方案中,提供了一些有尾引物和RT酶,其中RT与有尾引物组合使用以逆转录整个转录组。在一个实施方案中,提供了各自包含RNA和DNA的一些嵌合引物和RT酶,其中RT与嵌合引物组合使用以逆转录整个转录组。在一些实施方案中,得到的产物中的不超过5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、75%、80%为rRNA序列。
本发明的方法对于通过如在美国专利号5,750,341、6,306,597和5,969,119中所述的、由Illumina商业化的方法进行测序可能是有用的。使用本发明的方法制备定向(链特异性)cDNA文库,并通过例如PCR对选定的单链核酸进行扩增。然后将得到的核酸变性,并将单链扩增的多核苷酸随机地连接至流动池通道的内表面。加入未标记的核苷酸来启动 固相桥式扩增以产生双链DNA的密集簇。为了启动第一碱基测序循环,加入四种标记的可逆终止子、引物和DNA聚合酶。在激光激发之后,对来自流动池上的每个簇的荧光进行成像。然后记录每个簇的第一碱基的身份。进行测序循环以便每次一个碱基地确定该片段序列。
在一些实施方案中,本发明的方法可用于制备靶多核苷酸,以用于通过由Applied Biosystems商业化的连接测序方法(例如,SOLiD测序)进行测序。在其他实施方案中,这些方法可用于制备靶多核苷酸,以便使用由454/Roche Life Sciences商业化的方法进行合成测序,这些方法包括但不限于在Margulies等人,Nature(2005)437:376-380(2005)和美国专利号7,244,559、7,335,762、7,211,390、7,244,567、7,264,929及7,323,305中所述的方法和装置。在其他实施方案中,这些方法可用于制备靶多核苷酸,以便如美国申请序列号11/167,046和美国专利号7,501,245、7,491,498、7,276,720以及美国专利申请公开号US20090061439、US20080087826、US20060286566、US20060024711、US20060024678、US20080213770和US20080103058中所述的,通过由Helicos BioSciences Corporation(Cambridge,Mass.)商业化的方法进行测序。在其他实施方案中,这些方法可用于制备靶多核苷酸,以便如美国专利号7,462,452、7,476,504、7,405,281、7,170,050、7,462,468、7,476,503、7,315,019、7,302,146、7,313,308和美国申请公开号US20090029385、US20090068655、US20090024331和US20080206764中所述的,通过由Pacific Biosciences商业化的方法进行测序。
可在提供的本发明的方法中使用的测序技术的另一个实例是纳米孔测序(参见,例如Soni G V和Meller A.(2007)Clin Chem53:1996-2001)。纳米孔可以是直径1纳米等级的小孔。纳米孔在传导流体中的浸没以及跨纳米孔的电势的施加由于离子通过纳米孔的传导而可导致轻微的电流。流动的电流量对于纳米孔的大小是敏感的。随着DNA分子通过纳米孔,DNA分子上的每个核苷酸以不同的程度阻塞纳米孔。因此,当DNA分子通过纳米孔时通过纳米孔的电流的变化可代表对DNA序列的读取。
可在提供的本发明的方法中使用的测序技术的另一个实例是由 Ion Torrent提供的半导体测序(例如,使用Ion Personal Genome Machine(PGM))。Ion Torrent的技术可使用具有多个层(例如,具有微机械加工的孔的层、离子敏感性层和离子传感器层)的半导体芯片。可将核酸加入孔中,例如,可将单个核酸的克隆群体附着至单个珠,并且可将该珠引入孔中。为了启动在珠上的核酸的测序,可将一种类型的脱氧核糖核苷酸(例如,dATP、dCTP、dGTP或dTTP)引入孔中。当通过DNA聚合酶掺入一种或多种核苷酸时,在孔中释放出质子(氢离子),这可以通过离子传感器检测。然后可以洗涤半导体芯片,并且可利用不同的脱氧核糖核苷酸重复该过程。可在半导体芯片的孔中对多种核酸进行测序。半导体芯片可包含化学敏感性场效应晶体管(chemFET)阵列以对DNA进行测序(例如,如美国专利申请公开号20090026082中所述的)。一种或多种三磷酸在测序引物的3′末端处向新核酸链的掺入可通过用chemFET测量的电流的变化来检测。阵列可具有多个chemFET传感器。
试剂盒
本文所述的任何组合物均可包含在试剂盒内。在非限制性实例中,试剂盒在合适的容器中包含:一种或多种引物、逆转录酶和任选的用于扩增的试剂。
试剂盒的容器通常可包括至少一个小瓶、试管、烧瓶、瓶子、注射器或可将组分放置在和优选地适当等分于其内的其他容器。在试剂盒中存在多于一种组分时,该试剂盒通常还将含有第二、第三容器或可将额外的组分分别放置在其中的其他额外的容器。然而,在容器中可包含组分的各种组合。
当在一种或多种液体溶液中提供试剂盒的组分时,该液体溶液可以是水溶液。然而,试剂盒的组分可作为干燥粉末提供。当试剂和/或组分作为干粉末提供时,可通过加入合适的溶剂重建该粉末。
本发明提供了包含一种或多种本发明的组合物和适合于实施本发明方法的其他合适的试剂的试剂盒。本发明提供了,例如,用于临床或刑事实验室的诊断试剂盒或用于一般实验室用途的核酸扩增或分析试剂盒。本发明因此包括包含实施本发明的方法所必需的一些或所有试剂的 试剂盒,这些试剂为,例如,样品制备试剂、寡核苷酸、结合分子、储备溶液、核苷酸、聚合酶、酶、阳性和阴性对照寡核苷酸和靶序列、试管或板、断裂试剂、检测试剂、纯化基质和说明书。在一些实施方案中,本发明的试剂盒包含非规范的或修饰的核苷酸。合适的非规范的或修饰的核苷酸包括本文提供的任何核苷酸,包括但不限于dUTP或甲基化嘌呤。
在一些实施方案中,试剂盒可包含一种或多种反应混合物组分或反应混合物组分的一种或多种混合物。在一些情况下,反应混合物组分或其混合物可提供为浓缩的贮存物,如1.1x、1.5x、2x、2.5x、3x、4x、5x、6x、7x、10x、15x、20x、25x、33x、50x、75x、100x或更高的浓缩贮存物。反应混合物组分可包括本文提供的任何组分,包括但不限于缓冲液、盐、二价阳离子、共沸物、离液剂、dNTP、标记的核苷酸、非规范的或修饰的核苷酸、染料、荧光团、生物素、酶(如内切核酸酶、外切核酸酶、糖基化酶)或其任意组合。
在一些实施方案中,试剂盒可包含一种或多种寡核苷酸引物,如本文提供的寡核苷酸引物。例如,试剂盒可包含含有随机杂交部分的一种或多种寡核苷酸引物。或者,试剂盒可包含含有polyT杂交部分的寡核苷酸引物。在一些情况下,试剂盒可包含含有随机杂交部分的寡核苷酸引物和含有polyT杂交部分的引物。在其他情况下,试剂盒可包含已经预先选择用于与期望的核酸杂交而不与非期望的核酸杂交的“并非如此随机的”引物。在一些情况下,试剂盒可包含含有可与靶核酸杂交的3'部分和不可与靶核酸杂交的5'部分的有尾引物。在一些情况下,试剂盒可包含含有RNA部分和DNA部分的嵌合引物。在一些情况下,试剂盒可包含含有非规范的或修饰的核苷酸的引物。
在一些实施方案中,本发明的试剂盒可包含一种或多种聚合酶或其混合物。在一些情况下,该一种或多种聚合酶或其混合物可包含链置换活性。合适的聚合酶包括本文提供的任何聚合酶。试剂盒可进一步包含一种或多种聚合酶底物,例如dNTP、非规范的或修饰的核苷酸。
在一些实施方案中,本发明的试剂盒可包含一种或多种用于纯化 核酸产物、从期望的产物中去除断裂的产物或以上组合的工具。用于纯化核酸产物的合适的工具包括但不限于单链特异性外切核酸酶、亲和基质、核酸纯化柱、自旋柱、超滤或透析试剂或包括但不限于丙烯酰胺或琼脂糖的电泳试剂,或其任意组合。
在一些实施方案中,本发明的试剂盒可包含一种或多种能够裂解非规范核苷酸的碱基部分以产生脱碱基位点的试剂。在一些情况下,该试剂可包含一种或多种糖基化酶。合适的糖基化酶包括本文提供的任何糖基化酶,包括但不限于UDG或MPG。
在一些实施方案中,本发明的试剂盒可包含一种或多种能够在脱碱基位点处将磷酸二酯骨架断裂为片段(输入核酸模板)的试剂。在一些情况下,该试剂可包含一种或多种胺、伯胺、仲胺、多胺如DMED、哌啶、AP内切核酸酶或其任意组合。
在一些实施方案中,本发明的试剂盒可包含一种或多种用于从通过延伸反应产生的双链产物产生平端的试剂。例如,试剂盒可包含一种或多种单链DNA特异性外切核酸酶,包括但不限于外切核酸酶1或外切核酸酶7;单链DNA特异性内切核酸酶,如绿豆外切核酸酶或S1外切核酸酶;一种或多种聚合酶,例如T4DNA聚合酶或Klenow聚合酶;或其任何混合物。或者,试剂盒可包含一种或多种单链DNA特异性外切核酸酶、内切核酸酶和一种或多种聚合酶,其中这些试剂不以混合物提供。此外,用于产生平端的试剂可包含dNTP。
在一些实施方案中,本发明的试剂盒可包含一种或多种用于制备用于连接至衔接子分子的双链产物的试剂。例如,试剂盒可包含dATP、dCTP、dGTP、dTTP或其任何混合物。在一些情况下,试剂盒可包含多核苷酸激酶,例如T4多核苷酸激酶。此外,试剂盒可包含适合于由平端双链DNA片段产生3'延伸的聚合酶。包括合适的聚合酶,例如,外切Klenow聚合酶。
在一些实施方案中,本发明的试剂盒可包含一种或多种衔接子分子,如本文提供的任何衔接子分子。合适的衔接子分子包括单链或双链核酸(DNA或RNA)分子或其衍生物,茎-环核酸分子、包含1、2、3、4、 5、6、7、8、9、10个碱基或更长的一个或多个单链突出端的双链分子,蛋白质,肽,适体,有机分子,有机小分子,或本领域已知的可共价或非共价附着(例如通过连接)至双链DNA片段的任何衔接子分子。
在一些实施方案中,本发明的试剂盒可包含一种或多种用于对在本发明的衔接子和双链产物之间形成的连接复合物进行缺口修复或补平修复的试剂。试剂盒可包含适合于进行缺口修复的聚合酶。包括合适的聚合酶,例如,TaqDNA聚合酶。
试剂盒可进一步包含关于使用该试剂盒的说明。例如,试剂盒可包含关于产生可用于大规模分析的定向cDNA文库或代表全转录组的定向cDNA文库的说明,所述大规模分析包括但不限于,例如,焦磷酸测序、合成测序、杂交测序、单分子测序、纳米孔测序和连接测序、高密度PCR、数字PCR、大规模平行Q-PCR和表征通过本发明的方法产生的扩增的核酸产物,或其任意组合。在一些情况下,试剂盒可包含关于产生含有一种或多种修饰的核苷酸的第二链的说明。试剂盒可进一步包含关于混合一种或多种反应混合物组分以产生适用于本发明方法的一种或多种反应混合物的说明。试剂盒可进一步包含关于将一种或多种寡核苷酸引物与核酸模板杂交的说明。试剂盒可进一步包含关于利用例如聚合酶延伸一种或多种寡核苷酸引物的说明。试剂盒可进一步包含关于利用例如糖基化酶裂解修饰的核苷酸的碱基部分以产生脱碱基位点的说明。试剂盒可进一步包含关于利用例如本文提供的任何合适的试剂如多胺将磷酸二酯骨架在脱碱基位点处断裂为片段(输入核酸模板)的说明。试剂盒可进一步包含关于纯化通过本文提供的方法的任何步骤提供的任何产物的说明。试剂盒可进一步包含关于例如通过利用例如单链DNA特异性外切核酸酶、聚合酶或其任意组合去除单链突出端或补平单链突出端来产生平端片段的说明。试剂盒可进一步包含关于对通过本发明的方法产生的双链DNA片段的5'末端进行磷酸化的说明。试剂盒可进一步包含关于将一种或多种衔接子分子连接至本发明的双链DNA片段的说明。
试剂盒将优选地包括关于应用试剂盒组分以及使用未包括在该试剂盒中的任何其他试剂的说明。说明可包括可以实施的变化形式。
基于本发明方法的产物
基于本发明方法的产物可由申请人以商品名EncoreTM、Ultra-low EncoreTM或Encore Eukaryotic Stranded RNA-Seq商品化。Encore是NuGEN Technologies,Inc的商标。
实施例
实施例1–定向cDNA文库的产生。
本实施例描述了以修饰的双链体衔接子和50ng的poly(A)+选择的信使RNA作为起始材料,利用常规平端连接来产生定向cDNA文库。在图4中示出了产生该定向cDNA文库的端对端工作流程的概述。
第一链合成
使用随机六聚体引发来产生第一链cDNA。使用含有10μM随机六聚体、3.0mM MgCl2和1.0mM dNTP的Invitrogen SuperScript III逆转录酶试剂盒进行第一链合成反应。cDNA合成反应在10μL体积中进行,在40摄氏度温育60分钟并冷却至4摄氏度。
利用dUTP掺入的第二链合成
使用New England Biolabs NEBNext第二链合成模块进行第二链合成,其中第二链合成(无dNTP)反应缓冲液中补充有含有0.2mM dATP、dCTP和dGTP以及0.54mM dUTP的dNTP混合物。通过加入65μL的第二链合成主混合物并在16摄氏度下温育1小时来进行RNAse H介导的切口平移。通过加入45μL的25mM EDTA终止反应。
cDNA片段的断裂和纯化
使用Covaris S系列系统,根据生产商的说明使120μL第二链合成反应经历声波断裂,使用生产商推荐的设置来产生平均片段大小为150-200个碱基的断裂DNA。使用QIAquick PCR纯化试剂盒,根据生产商的说明浓缩断裂的DNA。对断裂且浓缩的DNA进行定量,并在Agilent Bioanalyzer DNA1000芯片上运行,以确保150-200bp长度的片段分布。
末端修复
对断裂的cDNA的末端进行修复以产生具有5’磷酸和3’羟基的平端。根据EncoreTM Ultra Low Input NGS Library System I用户指南(User Guide)说明,使用末端修复主混合物(End Repair Master Mix)对断裂的DNA进行末端修复。
利用dU标记的衔接子进行的连接
根据EncoreTM Ultra Low Input NGS Library System I用户指南说明,将双链体衔接子连接至平端cDNA片段,不同之处是连接衔接子混合物含有一种衔接子,其中该衔接子的连接链具有至少一个掺入其中的dU。
切口修复/衔接子补平
非磷酸化的衔接子的连接留下了单链缺口,该单链缺口必须在链选择和扩增之前进行修复。为了补平衔接子序列并产生全长双链DNA(dsDNA),在72摄氏度下加热反应混合物,从而导致通过Taq DNA聚合酶对cDNA插入物的3’末端的延伸(从而补平衔接子序列)和未连接的衔接子链的解链。然后使用Agencourt RNAClean XP珠,根据EncoreTM Ultra Low Input NGS Library System I用户指南说明来对具有连接的衔接子的修复的dsDNA片段进行纯化。
利用UDG/APE I处理进行的链选择
利用1单位UNG和1,000单位APE I在37℃下进行尿苷消化20分钟。dUTP向cDNA插入物的一条链和两种衔接子之一的连接链中的掺入允许选择性去除具有非期望的衔接子方向的产物。因此,用UNG/APE I处理的、具有掺入的dUTP的多核苷酸链不能进行聚合酶扩增。
文库扩增
为了产生最终的定向cDNA文库,根据Encore TM Ultra Low Input NGS Library System I用户指南中的文库扩增方案,通过PCR扩增经UNG选择的片段。
实施例2–RNA链保留效率。
在本实施例中,通过评估定位至人mRNA的编码外显子的序列读取值的链偏向性来对使用本发明方法的链保留效率进行实验确认。如本发明中所述的定向cDNA文库和非定向cDNA文库(对照)由从人全脑分离的poly(A)+RNA产生。使用Illumina基因组分析仪II产生单末端40个核苷酸的读取值。通过比较来自定向文库和非定向对照文库的序列读取值的链偏向性来测定链保留效率。结果示于图3中。在dUTP掺入和用UNG/APE I消化具有非期望P2/P1衔接子方向的链之后,来自定向cDNA文库的98%的读取值对准正确(反义)的链方向,与之相比,在非定向对照cDNA文库中为大约50%的读取值。
实施例3–RNA链保留效率。
在本实施例中,通过评估定位至人mRNA的5’UTR和3’UTR区域的序列读取值的链偏向性来对使用本发明方法的链保留效率进行实验确认。如实施例2所述测定链保留效率。在5’UTR和3’UTR区域中定向文库的相应链保留分别为95%和98%,而非定向文库为39%和50%。
实施例4–定向cDNA文库的产生。
本实施例描述了以修饰的双链体衔接子和50ng poly(A)+选择的信使RNA为起始材料,利用常规平端连接来产生定向cDNA文库。
利用dUTP掺入的第一链合成
使用随机六聚体引发来产生第一链cDNA。使用Invitrogen SuperScript III逆转录酶试剂盒进行第一链合成反应,该试剂盒含有10μM随机六聚体、3.0mM MgCl2并补充有含有dATP、dCTP、dGTP和代替dTTP的dUTP的dNTP混合物。cDNA合成反应在10μL体积中进行,在40摄氏度下温育60分钟并冷却至4摄氏度。在第一链合成后,在第二链合成之前除去未掺入的dNTP。
第二链合成
使用New England Biolabs NEBNext第二链合成模块进行第二链的 合成,其中第二链合成(无dNTP)反应缓冲液中补充有含有dATP、dCTP、dGTP和dTTP的dNTP混合物。通过加入65μL的第二链合成主混合物并在16摄氏度下温育1小时来进行RNAse H介导的切口平移。通过加入45μL的25mM EDTA终止反应。
cDNA片段的断裂和纯化
使用Covaris S系列系统,根据生产商的说明使120μL第二链合成反应经历声波断裂,使用生产商推荐的设置来产生平均片段大小为150-200个碱基的断裂DNA。使用QIAquick PCR纯化试剂盒,根据生产商的说明浓缩断裂的DNA。对断裂且浓缩的DNA进行定量,并在Agilent Bioanalyzer DNA1000芯片上运行,以确保150-200bp长度的片段分布。
末端修复
对断裂的cDNA的末端进行修复以产生具有5’磷酸和3’羟基的平端。根据EncoreTM Ultra Low Input NGS Library System I用户指南说明,使用末端修复主混合物对断裂的DNA进行末端修复。
利用dU标记的衔接子进行的连接
根据EncoreTM Ultra Low Input NGS Library System I用户指南说明,将双链体衔接子连接至平端cDNA片段,不同之处是连接衔接子混合物含有一种衔接子,其中该衔接子的连接链具有至少一个掺入其中的dU。
切口修复/衔接子补平
非磷酸化的衔接子的连接留下了单链缺口,该单链缺口必须在链选择和扩增之前进行修复。为了补平衔接子序列并产生全长双链DNA(dsDNA),在72摄氏度下加热反应混合物,从而导致通过Taq DNA聚合酶对cDNA插入物的3’末端的延伸(从而补平衔接子序列)和未连接的衔接子链的解链。然后使用Agencourt RNAClean XP珠,根据EncoreTM Ultra Low Input NGS Library System I用户指南说明来对具有连接的衔接子的修复的dsDNA片段进行纯化。
利用UDG/APE I处理进行的链选择
利用1单位UNG和1,000单位APE I在37℃下进行尿苷消化20 分钟。dUTP向cDNA插入物的一条链和两种衔接子之一的连接链中的掺入允许选择性去除具有非期望的衔接子方向的产物。因此,用UNG/APE I处理的、具有掺入的dUTP的多核苷酸链不能进行聚合酶扩增。
文库扩增
为了产生最终的定向cDNA文库,根据EncoreTM Ultra Low Input NGS Library System I用户指南中的文库扩增方案,通过PCR扩增经UNG选择的片段。

用于定向核酸扩增和测序的组合物和方法.pdf_第1页
第1页 / 共33页
用于定向核酸扩增和测序的组合物和方法.pdf_第2页
第2页 / 共33页
用于定向核酸扩增和测序的组合物和方法.pdf_第3页
第3页 / 共33页
点击查看更多>>
资源描述

《用于定向核酸扩增和测序的组合物和方法.pdf》由会员分享,可在线阅读,更多相关《用于定向核酸扩增和测序的组合物和方法.pdf(33页珍藏版)》请在专利查询网上搜索。

1、10申请公布号CN104080958A43申请公布日20141001CN104080958A21申请号201280060825122申请日2012101961/549,16220111019USC40B50/0620060171申请人纽亘技术公司地址美国加利福尼亚州72发明人克里斯阿穆尔74专利代理机构北京安信方达知识产权代理有限公司11262代理人王思琪郑霞54发明名称用于定向核酸扩增和测序的组合物和方法57摘要本发明提供了用于定向核酸扩增和测序的方法和组合物。本发明进一步提供了用于构建定向CDNA文库的方法和组合物。该方法可包括A逆转录RNA样品以产生第一链CDNA;B由第一链CDNA产生。

2、第二链CDNA,其中四种DNTP中的至少一种即DATP、DCTP、DGTP或DTTP在第二链合成过程中被修饰的DNTP替代,并掺入第二链中,从而产生双链CDNA;C对该双链CDNA进行末端修复;D将衔接子连接至该双链CDNA,其中仅有一种衔接子具有掺入该衔接子的连接链中的修饰的DNTP;E进行缺口修复;和F用合适的裂解剂选择性裂解该第二链和具有修饰的DNTP的该衔接子的连接链。30优先权数据85PCT国际申请进入国家阶段日2014061086PCT国际申请的申请数据PCT/US2012/0612182012101987PCT国际申请的公布数据WO2013/059746EN2013042551I。

3、NTCL权利要求书4页说明书25页附图3页19中华人民共和国国家知识产权局12发明专利申请权利要求书4页说明书25页附图3页10申请公布号CN104080958ACN104080958A1/4页21一种用于构建定向CDNA文库的方法,其包括A逆转录RNA样品以产生第一链CDNA;B由所述第一链CDNA产生第二链CDNA,其中四种DNTP中的至少一种即DATP、DCTP、DGTP或DTTP在第二链合成过程中被修饰的DNTP替代并掺入所述第二链中,从而产生双链CDNA;C对所述双链CDNA进行末端修复;D将衔接子连接至所述双链CDNA,其中所述衔接子中仅有一种具有掺入所述衔接子的连接链中的修饰的D。

4、NTP;E进行缺口修复;和F用合适的裂解剂选择性裂解所述第二链和所述具有修饰的DNTP的衔接子,从而产生包含所述第一链CDNA的定向CDNA文库。2如权利要求1所述的方法,其中所述修饰的DNTP包含DUTP。3如权利要求1所述的方法,其中所述方法任选地进一步包括在步骤C之前断裂所述双链CDNA。4如权利要求1所述的方法,其中步骤F包括裂解所述修饰的核苷酸的碱基部分,从而形成脱碱基位点。5如权利要求4所述的方法,进一步包括在所述脱碱基位点处裂解磷酸二酯骨架。6如权利要求4所述的方法,其中所述裂解所述修饰的核苷酸的碱基部分包括酶的使用。7如权利要求5所述的方法,其中所述在脱碱基位点处裂解磷酸二酯骨。

5、架包括酶、化学剂和/或热的使用。8如权利要求7所述的方法,其中所述酶是内切核酸酶。9如权利要求8所述的方法,其中所述内切核酸酶是脱嘌呤/脱嘧啶内切核酸酶APE。10如权利要求6所述的方法,其中所述酶包含糖基化酶。11如权利要求10所述的方法,其中所述糖基化酶为尿嘧啶N糖基化酶UNG或尿嘧啶DNA糖基化酶UDG。12如权利要求7所述的方法,其中所述化学剂包含伯胺。13如权利要求7所述的方法,其中所述化学剂包含多胺。14如权利要求13所述的方法,其中所述多胺包含N,N二甲基乙二胺DMED。15如权利要求1所述的方法,其中所述裂解剂包含糖基化酶和多胺。16如权利要求1所述的方法,其中所述裂解剂包含糖。

6、基化酶和APE。17如权利要求1所述的方法,进一步包括扩增所述定向CDNA文库,从而产生扩增的产物。18如权利要求17所述的方法,其中所述定向CDNA文库的扩增包括聚合酶链式反应PCR、链置换扩增SDA、多重置换扩增MDA、滚环扩增RCA、单引物等温扩增SPIA或连接酶链式反应LCR。19如权利要求18所述的方法,其中所述扩增包括PCR。20如权利要求18所述的方法,其中所述扩增包括SPIA。权利要求书CN104080958A2/4页321如权利要求17所述的方法,进一步包括对扩增产物进行测序的附加步骤。22如权利要求21所述的方法,其中所述测序包括新一代测序。23如权利要求1所述的方法,进一。

7、步包括在逆转录后裂解所述RNA样品。24如权利要求23所述的方法,其中裂解所述RNA样品包括在逆转录后使所述RNA样品暴露于RNASE。25如权利要求24所述的方法,其中所述RNASE为RNASEH。26如权利要求23所述的方法,其中裂解所述RNA样品包括使所述RNA样品暴露于热或化学处理或其组合。27如权利要求1所述的方法,进一步包括从所述定向CDNA文库中减少或耗尽非期望的核酸序列。28如权利要求27所述的方法,其中所述非期望的核酸为核糖体RNARRNA。29一种用于全转录组定向测序的方法,其包括A逆转录RNA样品以产生第一链CDNA;B由所述第一链CDNA产生第二链CDNA,其中四种DN。

8、TP中的至少一种即DATP、DCTP、DGTP或DTTP在第二链合成过程中被修饰的DNTP替代并掺入所述第二链中,从而产生双链CDNA;C对所述双链CDNA进行末端修复;D将衔接子连接至所述双链CDNA,其中所述衔接子中仅有一种具有掺入所述衔接子的连接链中的修饰的DNTP;E进行缺口修复;F用合适的裂解剂选择性裂解所述第二链和具有所述修饰的DNTP的衔接子,从而产生包含所述第一链CDNA的定向CDNA文库;和G对所述定向CDNA文库进行扩增和/或测序。30如权利要求29所述的方法,其中所述修饰的DNTP包含DUTP。31如权利要求29所述的方法,其中所述方法任选地进一步包括在步骤C之前断裂所述。

9、双链CDNA。32如权利要求29所述的方法,其中步骤F包括裂解所述修饰的核苷酸的碱基部分,从而形成脱碱基位点。33如权利要求32所述的方法,进一步包括在所述脱碱基位点处裂解磷酸二酯骨架。34如权利要求32所述的方法,其中所述裂解所述修饰的核苷酸的碱基部分包括酶的使用。35如权利要求33所述的方法,其中所述在脱碱基位点处裂解磷酸二酯骨架包括酶、化学剂和/或热的使用。36如权利要求35所述的方法,其中所述酶是内切核酸酶。37如权利要求36所述的方法,其中所述内切核酸酶为脱嘌呤/脱嘧啶内切核酸酶APE。38如权利要求34所述的方法,其中所述酶包含糖基化酶。39如权利要求38所述的方法,其中所述糖基化。

10、酶是尿嘧啶N糖基化酶UNG或尿嘧啶DNA糖基化酶UDG。权利要求书CN104080958A3/4页440如权利要求35所述的方法,其中所述化学剂包含伯胺。41如权利要求35所述的方法,其中所述化学剂包含多胺。42如权利要求41所述的方法,其中所述多胺包含N,N二甲基乙二胺DMED。43如权利要求29所述的方法,其中所述裂解剂包含糖基化酶和多胺。44如权利要求29所述的方法,其中所述裂解剂包含糖基化酶和APE。45如权利要求29所述的方法,其中对剩余的CDNA链的扩增包括聚合酶链式反应PCR、链置换扩增SDA、多重置换扩增MDA、滚环扩增RCA、单引物等温扩增SPIA或连接酶链式反应LCR。46。

11、如权利要求45所述的方法,其中所述扩增包括PCR。47如权利要求45所述的方法,其中所述扩增包括单引物等温扩增SPIA。48如权利要求29所述的方法,其中所述测序包括新一代测序。49如权利要求29所述的方法,进一步包括在逆转录后裂解所述RNA样品。50如权利要求49所述的方法,其中裂解所述RNA样品包括在逆转录后使所述RNA样品暴露于RNASE。51如权利要求50所述的方法,其中所述RNASE为RNASEH。52如权利要求49所述的方法,其中裂解所述RNA样品包括使所述RNA样品暴露于热或化学处理或其组合。53如权利要求49所述的方法,进一步包括从所述定向CDNA文库中减少或耗尽非期望的核酸序。

12、列。54如权利要求53所述的方法,其中所述非期望的核酸是核糖体RNARRNA。55一种试剂盒,其包含A一种或多种引物;B逆转录酶;C糖基化酶;D一种或多种衔接子,其中所述衔接子之一在所述衔接子的连接链中包含至少一种修饰的核苷酸。56如权利要求55所述的试剂盒,进一步包含所述试剂盒的书面使用说明书。57如权利要求55所述的试剂盒,进一步包含至少一种修饰的核苷酸或DNTP。58如权利要求55所述的试剂盒,进一步包含用于扩增的试剂。59如权利要求55所述的试剂盒,进一步包含用于测序的试剂。60如权利要求55所述的试剂盒,进一步包含多胺、APE或其组合。61如权利要求55所述的试剂盒,其中所述修饰的核。

13、苷酸包含DUTP,并且其中所述糖基化酶包含UNG。62如权利要求57所述的试剂盒,其中所述修饰的核苷酸包含DUTP。63一种用于构建定向CDNA文库的方法,其包括A由模板RNA合成第一和第二链CDNA,其中第一链CDNA或第二链CDNA的合成包括掺入修饰的DNTP,以产生双链CDNA;B对所述双链CDNA进行末端修复;C将衔接子连接至所述双链CDNA,其中所述衔接子中仅有一种具有掺入所述衔接子权利要求书CN104080958A4/4页5的连接链中的修饰的DNTP;D进行缺口修复;和E用合适的裂解剂选择性裂解所述第一或第二链CDNA和具有所述修饰的DNTP的衔接子,从而产生包含所述第一或第二链C。

14、DNA的定向CDNA文库。权利要求书CN104080958A1/25页6用于定向核酸扩增和测序的组合物和方法交叉引用0001本申请要求2011年10月9日提交的美国临时申请号61/549,162的权益,该临时申请通过引用并入本文。发明背景0002高通量、新一代测序技术的最新进展已经使得全基因组测序和功能基因组学的新方法成为可能,包括对任意转录组的全面分析。这些新一代测序方法之一涉及对由信使和结构RNA产生的互补DNACDNA的直接测序RNASEQ。RNASEQ提供了超越传统测序方法的几个关键优势。首先,其允许对所有表达的转录物进行高分辨率研究,从而注释出各转录物的5和3末端以及剪接点。其次,R。

15、NASEQ允许对每个细胞中的转录物的相对数进行定量。第三,RNASEQ提供了一种通过测量每种剪接变体的水平来测量和表征RNA剪接的途径。总之,这些进展已经提供了对个别细胞功能的新的了解。0003进行标准RNASEQ的一个缺点是缺乏有关转录方向的信息。为了RNASEQ而构建的标准CDNA文库由随机引物双链CDNA组成。在测序之前含有通用引发位点的衔接子的非定向连接导致有关哪条链存在于原始RNA模板中的信息丢失。虽然在一些情况下可以通过后续分析,例如通过使用编码蛋白质的转录物中的开放阅读框ORF信息,或者通过评估真核基因组中的剪接位点信息来推测链信息,但是关于起源链的直接信息是非常符合期望的。例如。

16、,为了将有义链指定至非编码RNA,以及在解析重叠的转录物时,就需要有关在原始RNA样品中存在哪条链的直接信息。0004最近已经针对链特异性RNASEQ开发了几种方法。这些方法可分成两大类。第一类利用相对于RNA转录物的5和3末端处于已知方向的不同衔接子。最终结果是CDNA文库,其中原始RNA的5和3末端的侧翼为两个不同的衔接子。该方法的缺点是只有克隆分子的末端保留了方向信息。对于长克隆的链特异性操作而言,这可能会存在问题,并且当存在断裂FRAGMENTATION时可能导致方向信息的丢失。0005第二类链特异性RNASEQ方法标记原始RNA例如,通过亚硫酸氢盐处理或转录的CDNA例如,通过修饰的。

17、核苷酸的掺入的一条链,随后使未标记的链降解。通过亚硫酸氢盐处理对RNA的链标记是劳动密集的,并且需要将测序读取值READS与参照基因组进行比对,所述参照基因组的两条链之一上的所有胞嘧啶碱基已经转换为胸腺嘧啶。由于亚硫酸氢盐处理过程中的碱基转换效率是不完美的,即小于100,使得该分析更加复杂。0006通过对CDNA的第二链进行修饰的链标记已经成为定向CDNA克隆和测序的优选方法LEVIN等人,2010。然而,CDNA第二链标记方法,如在WO2011/003630中所述的方法,当使用采用双链体衔接子的常规平端连接和CDNA文库构建策略其中由两个单独的衔接子引入两个通用测序位点时,不足以保留方向性信。

18、息。WO2011/000360中所述的标记方法采用由以下步骤组成的四步过程1可裂解核苷酸向CDNA插入物的一条链中的掺入,2CDNA插入物的末端修复,3含有通用测序位点的衔接子的非定向连接,和4具有非期望的衔接子方向的文库片段的选择性水解。为了保留方向性信息,该方法需要对选择进行扩增说明书CN104080958A2/25页7的链的5和3末端进行区别标记,例如,这可以通过定向即极性特异性的衔接子的连接或通过使用特化的叉状衔接子来实现,在该叉状衔接子中,双链多核苷酸的每一条链共价连接至两个不同的通用测序位点,在该链的每一端具有一个测序位点。当使用常规双链体衔接子时,WO2011/000360所述方。

19、法的应用不产生定向测序文库,因为标记的链,即已掺入可裂解核苷酸的链,在其5和3末端没有被区别标记。0007对于从利用常规双链体衔接子构建的CDNA文库进行定向CDNA测序的改进方法存在需求。本文所述的发明满足了这一需求。发明内容0008本发明提供了用于构建定向CDNA文库和进行定向CDNA测序的新方法、组合物和试剂盒。具体而言,本发明的一个重要方面是允许使用双链体衔接子和平端连接进行定向CDNA克隆和链保留,从而产生具有两个衔接子方向的连接产物的方法和组合物。在一个方面,本发明提供了一种克隆CDNA同时保留原始RNA样品的方向性和链信息的方法。在一些实施方案中,该方法包括A逆转录RNA样品以产。

20、生第一链CDNA;B由第一链CDNA产生第二链CDNA,其中四种DNTP中的至少一种即DATP、DCTP、DGTP或DTTP在第二链合成过程中被修饰的DNTP替代并掺入第二链中,从而产生双链CDNA;C对该双链CDNA进行末端修复;D将衔接子连接至该双链CDNA,其中仅有一种衔接子具有掺入该衔接子的连接链中的修饰的DNTP;E进行缺口修复;和F用合适的裂解剂选择性裂解第二链和具有修饰的DNTP的衔接子的连接链,从而产生包含第一链CDNA的定向CDNA文库。在另一方面,该方法任选地包括在对双链CDNA进行末端修复之前断裂该双链CDNA。在一个特定的实施方案中,该方法进一步包括扩增剩余的CDNA链。

21、或不包含修饰的核苷酸的CDNA链,从而产生扩增的产物。在另一个特定的实施方案中,该方法进一步包括对剩余的CDNA链或扩增产物进行测序。0009在另一方面,本发明提供了一种用于选择性去除处于非期望的方向的CDNA构建体的方法。0010在又一方面,本发明提供了一种用于全转录组定向测序的方法,其包括A逆转录RNA样品以产生第一链CDNA;B由第一链CDNA产生第二链CDNA,其中四种DNTP中的至少一种即DATP、DCTP、DGTP或DTTP在第二链合成过程中被修饰的DNTP替代并掺入第二链中,从而产生双链CDNA;C对该双链CDNA进行末端修复;D将衔接子连接至该双链CDNA,其中仅有一种衔接子具。

22、有掺入该衔接子的连接链中的修饰的DNTP;E进行缺口修复;F用合适的裂解剂选择性裂解第二链和具有修饰的DNTP的衔接子的连接链,从而产生包含第一链CDNA的定向CDNA文库;和H对该定向CDNA文库进行扩增和/或测序。在另一个方面,该方法任选地包括在对双链CDNA进行末端修复之前断裂该双链CDNA。0011在任一前述方面的一个方面中,本发明提供了裂解所述修饰的核苷酸的碱基部分从而形成脱碱基位点。在一个优选的实施方案中,该修饰的核苷酸包含DUTP。在一些情况下,所述裂解剂包含糖基化酶。在一个优选的实施方案中,该糖基化酶包含UNG。在一些情况下,该裂解剂包含糖基化酶和内切核酸酶。在一些情况下,该内。

23、切核酸酶包含脱嘌呤/脱嘧啶内切核酸酶APE。在一些情况下,该裂解剂包含糖基化酶和APE。在一些情况下,该裂解剂包含UNG和APE。在一些情况下,该裂解剂包含糖基化酶和多胺。在一个优选的实施方案中,该多胺为N,N二甲基乙二胺DMED。在一些情况下,该裂解剂包含糖基化酶和说明书CN104080958A3/25页8DMED。在一些情况下,该裂解剂包含UNG和DMED。0012在任一前述方面的另一个方面中,该方法进一步包括在去除修饰的核苷酸的碱基部分后,利用酶、化学剂和/或热在脱碱基位点处在磷酸二酯骨架中产生切口。在一些情况下,在去除修饰的核苷酸的碱基部分后在脱碱基位点处裂解磷酸二酯骨架包括使用酶。在。

24、一个优选的实施方案中,该酶是内切核酸酶。在一些情况下,该内切核酸酶包含脱嘌呤/脱嘧啶内切核酸酶APE。在一些情况下,在去除修饰的核苷酸的碱基部分后在脱碱基位点处产生切口包括使用化学剂。在一些情况下,该化学剂包含伯胺或多胺。在一个优选的实施方案中,该多胺为N,N二甲基乙二胺DMED。0013在任一前述方面的另一个方面中,该方法进一步包括在RNA样品逆转录之后裂解该RNA样品。在一些情况下,裂解RNA样品包括使RNA样品暴露于RNASE。在一个优选的实施方案中,该RNASE为RNASEH。在一些情况下,裂解RNA样品包括使RNA样品暴露于热或化学处理或其组合。0014在任一前述方面的另一个方面中,。

25、该方法进一步包括减少或耗尽非期望的核酸序列。在一些情况下,非期望的核酸为核糖体RNARRNA。0015在任一前述方面的另一个方面中,对剩余CDNA链的扩增包括聚合酶链式反应PCR、链置换扩增SDA、多重置换扩增MDA、滚环扩增RCA、单引物等温扩增SPIA或连接酶链式反应LCR。在一些情况下,该扩增包括PCR。在一些情况下,该扩增包括SPIA。0016在任一前述方面的另一个方面中,对剩余CDNA链或从剩余CDNA链扩增的产物的测序包括新一代测序。0017用于执行本文所述的任意方法的试剂盒是本发明的另一特征。此类试剂盒可包括用于对核酸进行扩增、克隆和测序的试剂、酶和平台。在一个实施方案中,提供一。

26、种试剂盒,其包含A一种或多种引物;B逆转录酶;C糖基化酶;和D一种衔接子或几种衔接子,其中该衔接子中的一种在所述衔接子的连接链中包含至少一种修饰的核苷酸。在另一个实施方案中,该试剂盒进一步包含用于扩增的试剂。在另一个实施方案中,该试剂盒进一步包含多胺、APE或其组合。在另一个实施方案中,该试剂盒进一步包含至少一种修饰的核苷酸或DNTP。在一些情况下,该修饰的核苷酸包含DUTP。在一些情况下,该糖基化酶包含UNG。在又一个实施方案中,该试剂盒进一步包含用于测序的试剂。试剂盒将优选地包括关于应用试剂盒组分以及使用不包括在该试剂盒中的任何其他试剂的说明。援引并入0018本说明书中所述的所有出版物、专。

27、利和专利申请均通过引用以相同的程度并入本文,犹如特别地和单独地指出每个单独的出版物、专利或专利申请均通过引用而并入。附图说明0019本发明的新颖特征在随附的权利要求中具体阐述。通过参考以下对利用到本发明原理的说明性实施方案加以阐述的描述和附图,将会获得对本发明的特征和优点的更好的理解,在附图中0020图1显示了使用常规双链体衔接子即,其中连接产物具有两个衔接子方向和链标记构建非定向CDNA文库。0021图2显示了使用本发明的方法利用常规双链体衔接子构建定向链特异性CDNA说明书CN104080958A4/25页9文库。0022图3显示了总结使用本发明的方法的链保留效率数据的表格。0023图4显。

28、示了阐明使用本发明的方法产生定向CDNA文库的步骤的流程图。具体实施方式概述0024现将详细参考本发明的示例性实施方案。虽然将结合这些示例性实施方案来描述这些公开的方法和组合物,但应当理解,这些示例性实施方案并非意在限制本发明。相反,本发明意在涵盖可包括在本发明精神和范围内的备选方案、修改方案和等效方案。0025在一个实施方案中,本发明提供了用于构建定向CDNA文库的方法和组合物。本文所述的方法使用常规双链体衔接子和平端连接实现了定向CDNA克隆和链保留。该方法进一步能够产生可使用多种扩增方法进一步扩增的链特异性CDNA。在另一个实施方案中,本发明提供了用于全转录组定向测序的方法。在又一个实施。

29、方案中,本发明提供了用于产生定向的、RRNA耗尽的CDNA文库的方法和组合物。0026一个方面涉及一种用于产生定向CDNA文库的方法。该方法的第一步需要使用RNA样品或RNA模板,通过逆转录可由该RNA样品或RNA模板产生第一链CDNA。该RNA样品可来自于众多的本领域已知的来源,包括但不限于纯化或未纯化形式的信使RNAMRNA或核糖体RNARRNA,并且可以使用众多本领域已知的RNA依赖性DNA聚合酶进行逆转录。在一个实施方案中,该RNA模板可来自于DNA,包括但不限于基因组DNA,其中使用本领域已知的方法包括但不限于转录将DNA转化为RNA。在一个优选的实施方案中,如图4中所例示的,该RN。

30、A可以是POLYARNA。RNA样品的逆转录可使用包含与已知序列互补的序列或包含随机序列的引物进行。在一个实施方案中,在本文所述的方法中使用的引物可以是包含DNA和RNA两者的复合引物。在一个优选的实施方案中,可使用随机六聚体引物对RNA样品进行逆转录。0027本文所述的用于产生定向CDNA文库的方法的第二步需要由第一链CDNA产生第二链CDNA,以形成双链CDNA。第二链合成可在修饰的DNTP的存在下进行。在一个优选的实施方案中,第二链合成可在DATP、DCTP、DGTP和代替DTTP的DUTP的存在下进行。在DUTP的存在下的第二链合成导致在第二链CDNA的链中掺入至少一个DUTP。第二链。

31、CDNA中的DUTP用来标记该第二链,因为在这种背景下DUTP是修饰的或非规范的DNTP。第二链合成可使用众多本领域已知的第二链合成方案来进行,包括但不限于利用RNASEH介导的切口平移结合DNA依赖性DNA聚合酶如DNA聚合酶I非KLENOW片段的那些方案。第二链合成还可使用可购买到的试剂盒如NEWENGLANDBIOLABSNEBNEXT第二链合成模块SECONDSTRANDSYNTHESISMODULE来进行。在第二链合成过程中产生的第二链CDNA产物也可被称为有义链产物,因为第二链CDNA的序列包含在模板RNA中发现的序列,而第一链CDNA也可被称为反义链产物。在另一个实施方案中,可在。

32、第一链合成后去除RNA模板之后进行第二链合成。RNA模板的去除可使用酶、热变性或化学变性来实现。酶介导的RNA模板的去除可利用RNASE,优选RNASEH,或酶的组合如RNASEH和RNASE1来进行。作为该实施方案的另一方面,可以使用包含与第一链产物中存在的序列互补的序列的引物,结合使用DNA依赖性DNA聚合酶来进行第二链合成。说明书CN104080958A5/25页100028在一个实施方案中,可在第二链合成后对第二链合成后产生的双链CDNA进行末端修复。末端修复可包括平端、非平端即黏性或粘性末端或单碱基突出端的产生,例如通过缺乏3外切核酸酶活性的聚合酶向双链DNA产物的3末端添加一个DA。

33、核苷酸。在一个优选的实施方案中,可对双链CDNA进行末端修复以产生平端,其中该双链CDNA包含5磷酸和3羟基。末端修复可使用众多本领域已知的酶和/或方法来进行,包括但不限于可购买到的试剂盒,如ENCORETMULTRALOWINPUTNGSLIBRARYSYSTEMI。0029在一个实施方案中,可在双链CDNA已断裂后进行末端修复。双链产物的断裂可通过本领域已知的方法来实现。可通过物理断裂方法和/或酶断裂方法实现断裂。物理断裂方法可包括喷雾、超声处理和/或流体动力剪切。在一个优选的实施方案中,双链CDNA的断裂通过超声处理来进行。用于进行酶断裂反应的试剂是可购买到的例如,来自NEWENGLAN。

34、DBIOLABS。0030在双链CDNA的末端修复后,本文所述的用于产生定向CDNA文库的方法包括将衔接子连接至双链CDNA。该衔接子可以是本领域已知的任何类型的衔接子,包括但不限于常规的双链体或双链衔接子。在一个优选的实施方案中,该衔接子可以是双链DNA衔接子。在一个实施方案中,该衔接子可以是已知序列的寡核苷酸,因此允许产生和/或使用序列特异性引物来对附加或连接有该衔接子的任何多核苷酸进行扩增和/或测序。优选地,该衔接子可以是可通过本领域已知的方法进行标记和选择的任何衔接子。在一个优选的实施方案中,该衔接子可通过掺入至少一种修饰的DNTP来标记。在一个优选的实施方案中,一种且仅一种衔接子包含。

35、修饰的DNTP,而其他或任何其他衔接子不包含修饰的DNTP。在一个优选的实施方案中,一种且仅一种衔接子在所述衔接子的连接链中包含修饰的DNTP,而其他或任何其他衔接子在所述衔接子的连接链中不包含修饰的DNTP。在一个实施方案中,该修饰的DNTP为DUTP。在一个优选的实施方案中,衔接子可以多个方向附加至双链产物。在一个优选的实施方案中,本文所述的方法可涉及使用两种包含已知序列的双链DNA的常规双链体衔接子,这两种常规双链体衔接子为平端的并且能够以两个方向之一结合至双链产物,其中一种衔接子包含掺入连接链中的修饰的DNTP,而另一种衔接子在连接链中不包含修饰的DNTP。在一个优选的实施方案中,该修。

36、饰的DNTP为DUTP。0031根据本文所述的方法,可通过平端连接将衔接子以两个方向中的任一方向连接至双链CDNA。衔接子之一包含掺入连接链中的修饰的DNTP优选DUTP,而另一种衔接子不包含掺入连接链中的修饰的DNTP优选DUTP。在一个实施方案中,衔接子与双链CDNA的连接在任一种衔接子的非连接链与双链CDNA的链之间产生缺口,从而各自衔接子的非连接链不与双链CDNA的链结合。对此,可使用众多本领域已知的方法进行缺口修复或补平反应,这些方法包括但不限于具有弱或无链置换活性的DNA依赖性DNA聚合酶的使用。0032在衔接子连接以及任选的缺口修复后,产生双链CDNA/衔接子复合物。该复合物随后。

37、可经历链选择。链选择可能需要对掺入双链CDNA的第二链中和一种且仅一种连接至该双链CDNA的衔接子的连接链中的修饰的DNTP进行碱基切除。对修饰的DNTP的碱基切除可使用酶、化学剂和/或热进行,并且在修饰的DNTP掺入核苷酸序列中的任何位置产生脱碱基位点。除碱基切除之外,本发明的方法可能还需要在脱碱基位点处裂解磷酸二酯键。磷酸二酯键也可被称为磷酸二酯骨架或DNA骨架。可使用众多的作用物AGENT包括酶、化学剂、热或其任意组合来进行DNA骨架的裂解。说明书CN104080958A106/25页110033碱基切除和/或DNA骨架的裂解导致包含修饰的DNTP的标记的第二链以及包含修饰的DNTP的一。

38、种衔接子的连接链被裂解或去除,而未标记的链和不含修饰的DNTP的衔接子的连接链保持完整。在这种情况下,碱基切除和/或DNA骨架裂解后双链CDNA的剩余链为第一链CDNA或反义链产物。此外,碱基切除和/或DNA骨架裂解还裂解或去除了包含修饰的DNTP的一种衔接子的连接链,无论所述连接链连接至双链CDNA的哪条链。可优先使用其序列与不包含修饰的DNTP的衔接子的连接链互补的引物来扩增剩余链。使用其序列与包含修饰的DNTP的衔接子的连接链互补的引物进行的扩增不产生产物,因为该连接链已经在碱基切除和/或修饰的DNTP裂解之后被裂解和/或去除。对剩余链的扩增可使用众多本领域已知的扩增技术进行,这些扩增技。

39、术包括但不限于聚合酶链式反应PCR。在剩余链扩增之后,可使用与不包含修饰DNTP的衔接子的连接链中存在的序列互补的引物,对扩增的产物进行测序,这确保了仅对未标记的第一链CDNA或链选择后保留的反义链产物进行测序。测序可直接对剩余的CDNA和/或对由剩余链的扩增产生的产物进行。可使用任何本领域已知的测序方法进行测序,这些方法包括但不限于新一代测序方法。如上所述的本发明的方法由于对有义链产物第二链CDNA的标记和裂解或去除,导致包含反义方向的CDNA或第一链CDNA的定向CDNA文库的产生。0034在另一个实施方案中,可在对剩余链进行扩增和/或测序之前去除裂解的或降解的标记链。在一个优选的实施方案。

40、中,可在对剩余的第一链CDNA或反义产物进行扩增和/或测序之前去除裂解的第二链和包含修饰DNTP的一种衔接子的裂解的连接链。在又一个优选的实施方案中,剩余的第一链CDNA反义产物可在扩增和/或测序之前进行纯化。对剩余链的纯化可使用本领域已知的用于纯化CDNA的方法进行,如可从QIAGEN和/或ROCHE购买到的试剂盒。0035在一个备选的实施方案中,本文所述的方法可用于产生包含有义方向的CDNA或第二链CDNA的定向CDNA文库。在该实施方案中,本文所述的方法可如上所述进行,不同之处在于,与如上所述的第二链合成相反,从RNA模板进行的第一链合成可在修饰的DNTP的存在下进行,而第二链合成是在未。

41、修饰的DNTP或经典DNTP的存在下进行的。在该实施方案的一个方面,可在第二链合成之前将包括在第一链合成过程中使用的任何和所有修饰DNTP在内的DNTP去除、洗掉或用未修饰的DNTP替代。作为该实施方案的另一方面,在第二链合成过程中可以使用未修饰的DNTP。在一个优选的实施方案中,该修饰的DNTP包含DUTP。可以选择性裂解或去除用修饰DNTP标记的并且连接至在所述衔接子的连接链中包含修饰DNTP的一种且仅一种衔接子上的反义链产物第一链CDNA。因此,可用于下游扩增和/或测序的剩余链和连接的衔接子包含有义链产物,该有义链产物连接至在所述衔接子的连接链中不包含修饰DNTP的衔接子。0036图2中。

42、示出了本文所述的用于产生定向链特异性CDNA文库并对其进行测序的方法的一个优选实施方案的示意图。总的来说,图2中所示的方法允许确定用来产生CDNA的模板RNA的链方向,相对于图1所示的常规方法具有提高的效率。在图1和图2中所示的方法均使用CDNA的链标记和常规双链体衔接子与由模板RNA产生的CDNA的平端连接作为确定链方向的手段。在图1和图2中,该方法包括将双链双链体衔接子图1和图2中的P1/P2平端连接至由RNA样品形成的双链CDNA复合物,其中第二链产物由于其互补于RNA模板并且与RNA模板具有相同的链方向而也被称为有义链产物,通过在第二链合成过程中说明书CN104080958A117/2。

43、5页12掺入DUTP进行标记。在图1和图2所示的优选的实施方案中,双链体衔接子不含游离的5磷酸基团。因此,两种衔接子P1/P2包含与双链CDNA上的游离5磷酸连接的链连接链和不与双链CDNA连接的链非连接链。可通过使用本领域已知的酶即T4DNA连接酶和方法来促进连接,包括但不限于可购买到的试剂盒,如ENCORETMULTRALOWINPUTNGSLIBRARYSYSTEM。在图2所示的本发明的一个优选实施方案中,一种且仅一种衔接子P2的连接链通过掺入DUTP进行标记。如图1和图2所示,双链体衔接子的连接可在两个方向之一上发生。在图1和图2左侧的示意图中,P2衔接子的连接链连接至标记的有义链第二。

44、链产物。在图2右侧的示意图中,P2衔接子的连接链连接至未标记的反义链第一链产物。0037在图1和图2中所示的方法中,双链体衔接子为非磷酸化的并因此不含游离的5磷酸基团。因此,两种衔接子P1/P2含有将与双链CDNA上的游离5磷酸连接的链连接链和不与双链CDNA连接的链非连接链,并因此留下缺口。这样,在任一方向上,含有连接的衔接子的双链CDNA经历缺口修复或补平修复优选地利用DNA依赖性DNA聚合酶,如TAQDNA聚合酶,以便通过使用各自的连接链作为模板,对双链体衔接子的非连接链的序列进行DNA依赖性DNA聚合酶介导的合成,来补平该缺口。0038在图1和图2中,缺口修复后通过用裂解剂可以是酶处理。

45、进行碱基切除。在图1和图2所示的一个实施方案中,可利用诸如UNG的酶进行碱基切除。在一个优选的实施方案中,碱基切除后可使用酶、化学剂和/或热在碱基裂解位点处裂解磷酸二酯或DNA骨架。在图1中,碱基切除导致标记的有义链产物的裂解,而两种衔接子保持完整。在图2中,碱基切除导致标记的有义链产物和在所述衔接子的连接链中已掺入DUTP的一种衔接子被裂解,而在连接链中未掺入DUTP的衔接子保持完整。在图1和图2中,可将标记的有义链产物或第二链产物裂解,并因此仅有反义链产物或第一链产物在碱基切除后得以保留。0039与其中两个衔接子方向在碱基切除后均保持完整的图1相比,图2左侧的示意图显示,标记的有义链产物可。

46、与连接至有义链产物的P2衔接子的标记连接链一起裂解。这样,只有反义链产物和连接至反义链的衔接子图2中的P1的连接链保持完整并可用于下游处理。在一个优选的实施方案中,下游处理需要对剩余的CDNA链或反义链产物进行扩增。与其中可使用与P1衔接子P1AMP或P2衔接子P2AMP的任一连接链中包含的序列互补的引物扩增反义链产物的图1相比,图2显示反义链产物的扩增仅能够使用与P1衔接子P1AMP的连接链中包含的序列互补的引物进行。在一个优选的实施方案中,下游处理还可能需要对反义链产物第一链产物和/或扩增产物进行测序。在图1中,使用与P1衔接子的连接链中的序列互补的引物的下游测序将对相对于RNA模板的有义。

47、链或反义链进行测序。在图2中,使用与P1衔接子的连接链中的序列互补的引物的下游测序将仅对相对于RNA模板的反义链进行测序。0040图4显示了一张流程图,描绘了用于产生定向链特异性CDNA文库的方法的一个实施方案。该方法包括以下步骤通过对POLYARNA进行随机引物逆转录而产生第一链CDNA;使用DATP、DCTP、DGTP和代替DTTP的DUTP,利用DNA依赖性DNA聚合酶产生第二链CDNA;使用超声处理将双链CDNA断裂;对纯化的断裂的双链CDNA进行末端修复以产生平端;连接双链体衔接子,其中一种双链体衔接子的一条连接链通过掺入DUTP进行标记;对连接产物进行切口修复以产生含有连接的衔接子。

48、的双链CDNA;使用酶和/或化学剂对纯化的含有说明书CN104080958A128/25页13连接的衔接子的双链CDNA进行链选择;使用PCR扩增剩余的CDNA链。0041在任一上述实施方案的一个方面中,可耗尽通过本文所述的方法产生的定向CDNA文库中的非期望核酸序列。在一个实施方案中,非期望的核酸包含RNA。在一个优选的实施方案中,非期望的核酸包含核糖体或RRNA。从通过本发明的方法产生的定向CDNA文库中去除或耗尽RRNA可通过本领域已知的任何方法进行,这些方法包括但不限于,从起始群体中去除RRNA,使用OLIGODT引物的差别引发即,仅引发聚腺苷酸化的转录物,和/或其中在引物池中特异性消。

49、除与RRNA序列互补的引物的差别引发不太随机的或NSR引物方法。0042通常,本文所述的方法可用于产生核酸文库,该核酸文库优先群集相对于用来产生该文库的核酸模板处于特定链方向的核酸。通过本文所述的方法产生的核酸文库可用于确定核酸模板的方向性和链方向。在一个实施方案中,该核酸模板可以是RNA模板,并且该核酸文库可以是CDNA文库。在一个优选的实施方案中,该RNA模板可以是非RRNA。在又一个优选的实施方案中,该RNA模板可以是RRNA。在本文所述的方法的一个方面中,该CDNA文库可以是保留属于原始RNA模板或样品的方向性和链信息的定向CDNA文库,也就是说,本发明方法的定向文库代表了由第一链CDNA或模板RNA的逆转录或第二链CDNA第一链CDNA的拷贝产生的产物。本发明的方法提供了用于排他性地保留第一链CDNA产物或第二链CDNA产物的手段,因此能够指定从基因组DNA转录的方向性。转录的方向性由对在序列信息中呈现哪条CDNA链第一或第二链的了解来推断。RNA模板的方向性和链信息可指衍生出或转录出RNA模板的基因组DNA的链。作为本文所述的方法的另一方面,定向CDNA文库可用于通过将定向CDNA文库中CDNA的序列与RNA模板和/或基因组DNA进行比较来确定转录的方向性。比较核苷酸序列的方法是本领域已知的,并且可以包括公知的核苷酸序列比对程序或算。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 化学;冶金 > 组合技术〔8〕


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1