一种内含子来源环形RNA分子及其成环关键核酸序列的应用.pdf

上传人:大师****2 文档编号:1889114 上传时间:2018-07-20 格式:PDF 页数:40 大小:10.76MB
返回 下载 相关 举报
摘要
申请专利号:

CN201310398809.X

申请日:

2013.09.05

公开号:

CN104419704A

公开日:

2015.03.18

当前法律状态:

授权

有效性:

有权

法律详情:

授权|||实质审查的生效IPC(主分类):C12N15/11申请日:20130905|||公开

IPC分类号:

C12N15/11; C12N15/10

主分类号:

C12N15/11

申请人:

中国科学院上海生命科学研究院

发明人:

陈玲玲; 杨力; 张杨; 张晓鸥

地址:

200031上海市徐汇区岳阳路320号

优先权:

专利代理机构:

上海光华专利事务所31219

代理人:

张艳

PDF下载: PDF下载
内容摘要

本发明涉及一类环形RNA分子及其成环关键核酸序列的应用。具体公开了一类环形RNA新分子的序列及基因组定位;公开了这类环形RNA新分子的成环关键核酸序列;还公开了一套包含上述成环关键核酸序列的质粒,可用于产生包含任意核酸序列的环形RNA分子。本发明首次揭示了一类内含子来源的环形RNA新分子及其成环关键核酸序列的应用,为产生包含任意核酸序列的环形RNA分子提供了全新的思路和方法。

权利要求书

权利要求书
1.  一种成环关键核酸序列元件,包括5’成环基序和3’成环基序,所述5’成环基序包含7个碱基组成的GU-rich元件;所述3’成环基序包含11个碱基组成的C-rich元件;所述5’成环基序的第一个碱基与所述3’成环基序的最后一个碱基通过2’-5’磷酸二酯键连接。

2.  如权利要求1所述的成环关键核酸序列元件,其特征在于,所述GU-rich元件中,鸟嘌呤和尿嘧啶总量占5’成环基序碱基总量的57%~100%;所述C-rich元件中,胞嘧啶总量占3’成环基序碱基总量的27%~64%;该百分比为数量百分比。

3.  如权利要求1所述的成环关键核酸序列元件,其特征在于,所述ANKRD52基因内含子来源的环形RNA ci-ankrd52中,所述5’成环基序如SEQ ID NO:71所示;所述3’成环基序如SEQ ID NO:72所示;所述内含子来源的环形RNA ci-ankrd52序列如SEQ ID NO:69所示。

4.  权利要求1-3任一权利要求所述成环关键核酸序列元件在诱导非环形结构RNA成环中的应用。

5.  一种内含子来源环形RNA,为环状的单链RNA结构,含有权利要求1-3任一权利要求所述成环关键核酸序列元件。

6.  如权利要求5所述内含子来源环形RNA,其特征在于,在所述内含子来源环形RNA尚未成环以前的线性内含子RNA中,所述5’成环基序位于该线性内含子RNA的5’端,并且所述5’成环基序的第一个碱基为线性内含子RNA的5’端的第一个碱基;在成环过程中,所述5’成环基序的第一个碱基通过2’-5’磷酸二酯键与所述3’成环基序中最后一个碱基连接;并且连接后,3’成环基序最后一个碱基后面的序列降解,从而获得所述内含子来源环形RNA。

7.  如权利要求5所述内含子来源环形RNA,其特征在于,该环形RNA的长度为200nt~3000nt。

8.  一种诱导线性RNA分子成环的方法,为将权利要求1-3任一权利要求所述成环关键核酸序列元件中的所述5’成环基序和3’成环基序分别替换到非环形结构RNA分子两端,即可诱导其成环。

9.  权利要求1-3任一权利要求所述成环关键核酸序列元件,权利要求5-7任一权利要求所述环形内含子RNA,及权利要求8所述诱导线性RNA分子成环的方法在核酸研究领域的应用。

10.  如权利要求9所述的应用,其特征在于,所述应用为在RNA分子的重构和/或RNA功能研究领域的应用。

说明书

说明书一种内含子来源环形RNA分子及其成环关键核酸序列的应用
技术领域
本发明涉及核酸研究领域,具体涉及一种环形内含子RNA及其应用。
背景技术
基因组测序计划的完成和新一代深度测序技术的应用,揭示哺乳动物细胞中95%以上的转录序列为非编码RNA(noncoding RNA,ncRNA)。这其中除了人们比较熟知的“管家”非编码RNA(如核糖体RNAs、转运RNAs和小核仁RNAs等)和小非编码RNA(如microRNA和piRNA等),更多是尚未深入研究的长非编码RNA(long noncoding RNAs,lncRNAs)。长非编码RNA是一类长度大于200个核苷酸,不具有编码蛋白质能力的RNA。
目前大多数长非编码RNA是通过oligo(dT)磁珠将poly(A)+组分富集进行深度测序所发现,因此这类长非编码RNA和mRNA一样以poly(A)尾结尾,包括天然反式转录本(nature antisense transcripts,NATs)和基因间非编码RNA(long intergenic noncoding RNAs,lincRNAs)等。然而,越来越多的研究证实除了以poly(A)结尾的lncRNAs外,还稳定存在着大量的3’末端不含有poly(A)尾巴的lncRNAs,同样广泛的参与到细胞的各项生命活动中。例如enhancer RNAs(eRNAs),转录来自基因的增强子区域,不具有poly(A)尾巴,虽然目前加工成熟机制仍不清楚,但其在增强基因转录方面的功能已得到验证。另外,不依赖于经典3’末端成熟模式的lncRNAs也逐渐被证实,包括MALAT1(又称NEAT2)和Menβ(又称NEAT1_2)这两个细胞核定位的长非编码RNA,它们的3’端加工成熟依赖RNase P(核糖核酸酶P)途径。RNase P可以特异性的识别tRNA的三叶草结构,参与tRNA5’端的加工成熟。MALAT1和Menβ转录本的3’端形成tRNA样结构,进而被RNase P识别,切割。成熟的MALAT1和Menβ3’端保守的A-rich基序和两个U-rich基序构成U-A·U的3螺旋结构,使其稳定存在。已知在基因剪接经典途径中,由内含子剪接形成的套索结构(lariat)在经过脱分支后,很快的被核酸外切酶降解,然而也有一些来源于内含子区域的非编码RNA被保留下来,稳定存在,例如小核仁RNA、microRNA等。近期研究表明,内含子区域同样也可以产生表达量很高的长非编码RNA。比如,在一个内含子区域同时含有两个snoRNA时,两snoRNA中间区域序列依赖于snoRNP的保护而没有被降解,从而形成了两端为 snoRNA的长非编码RNA,被称为sno-lncRNAs。PWS(Prader-Willi Syndrome,小胖威利综合征)区域的sno-lncRNAs与RNA剪接调控因子Fox蛋白结合,进而改变相关RNA的剪接,推断这种调控作用可能与PWS的疾病发生相关。
此外,体内还存在一类不含有5’帽子和3’poly(A)尾巴的长非编码RNA,即环形RNA(circular RNA)。环形RNA早在20世纪70年代就在RNA病毒中被发现,并且通过电镜观察呈“锅柄”(pan-handle)样。随后,DCC(肿瘤抑制基因)、c-ETS-1(circular ETS-1)、SRY(sex-determing region Y)、cANRIL(circular ANRIL)等环形RNA相继被发现。伴随着高通量测序的发展,人们在不同物种中(从古生菌到人类)都发现了大量环形RNA的存在,并且证实了部分环形RNA的功能。例如,在睾丸中高表达的SRY参与了小鼠中睾丸的发育;人类INK4/ARF区域与ASVD(atherosclerotic vascular disease)相关,这一区域编码三个肿瘤抑制基因和一条长非编码RNA,ANRIL(Antisense Noncoding RNA in the INK4Locus),ANRIL通过招募PcG复合物来抑制INK4/ARF区域基因的表达。同时,这一区域还产生一条环形RNA,cANRIL,并且表达水平与INK4/ARF区域基因的表达水平呈正相关,提示cANRIL参与了基因表达调控。另外,近期研究表明,环形RNA还可以作为“假基因”(peudogene)为microRNA提供靶位点,从而竞争性的抑制了microRNA对mRNA的降解作用。例如CDR1as(antisense to the cerebellar degeneration-related protein1transcript)在脑中高表达,其含有70多个microRNA miR-7的结合位点,因此CDR1as也称为ciRS-7(circular RNA sponge for miR-7)。这种环形RNA可以作为分子海绵吸附miR-7,进而抑制miR-7对其结合靶位点mRNA的调控作用。相应的,ciRS-7表达水平的下调会导致含有miR-7结合位点的mRNA含量降低。
以上所提到的环形RNA大多数是通过“外显子反向剪接(back-splicing)”形成的,位于细胞浆中。对于“back-splicing”的发生,目前有两种模型解释。一种模型认为“back-splicing”是一种特殊的外显子跳跃(exon skipping),即新形成的转录本折叠,使原本相隔的两个外显子在空间上接近,导致下游外显子的分支位点攻击了非临近上游外显子3’端的SD位点(splicing donor site),进一步上游外显子3’端游离的羟基攻击下游外显子5’端的SA位点(splicing acceptor site),使得非临近的外显子连接在一起,而中间被跨越的外显子成环,但机体是如何精确地选择特定的外显子发生这种成环反应的仍不是很清楚。另一种模型则认为在成环外显子的临近内含子中存在着反向的重复序列(inverted Alu),这些反向重复序列互补配对,使得非顺序排列的SA和SD位点中间发生转脂反应,进一步形成由外显子构成的环形RNA。
目前环形RNA的发现主要来源于反向剪接的外显子序列,然而本领域对于其它序列来源的环形RNA还没有报道,更为重要的是对环形RNA形成的关键核酸序列的发现及其成环功能作用还没有报道。
发明内容
本发明的目的在于提供一种内含子来源环形RNA(circular intronic RNA)。一方面,该环形内含子RNA中含有成环关键核酸元件,可抑制脱分支酶对其作用,从而使其以环形结构稳定存在;另一方面,该成环元件还可以替换到非环形结构的RNA分子两端,诱导非环形结构的RNA成环。
本发明首先公开了一种成环关键核酸序列元件,包括5’成环基序和3’成环基序,所述5’成环基序包含7个碱基组成的GU-rich元件;所述3’成环基序包含11个碱基组成的C-rich元件;所述5’成环基序的第一个碱基与所述3’成环基序的最后一个碱基通过2’-5’磷酸二酯键连接。
较优的,本发明所述成环关键核酸序列元件位于内含子来源环形RNA中,所述5’成环基序位于环形RNA成环以前的线性RNA的5’端,所述3’成环基序靠近环形RNA成环以前的线性RNA的3’端,并且所述3’成环基序的最后一个碱基位于该线性RNA的分支位点。
本发明所述5’成环基序的7个碱基的排序按照其在线性RNA中5’至3’的方向,依次为第一个碱基至第七个碱基。同理3’成环基序的11个碱基的排序按照其在线性RNA中5’至3’的方向,依次为第一个碱基至第十一个碱基。图5给出的-11~-1以及1~7的数字标号只是为了标明5’成环基序和3’成环基序在基因组中相邻的关系,与其碱基排序并不矛盾。
较优的,所述5’成环基序中,鸟嘌呤(G)和尿嘧啶(U)总量占5’成环基序碱基总量的57%~100%;所述3’成环基序中,胞嘧啶(C)总量占3’成环基序碱基总量的27%~64%;该百分比为数量百分比。
更优的,所述5’成环基序中,鸟嘌呤(G)和尿嘧啶(U)总量占5’成环基序碱基总量的71%~100%;所述3’成环基序中,胞嘧啶(C)总量占3’成环基序碱基总量的32%~64%;该百分比为数量百分比。
优选的,本发明实施例中所涉及的ANKRD52基因内含子来源的环形RNA:ci-ankrd52中,所述5’成环基序如SEQ ID NO:71所示;所述3’成环基序如SEQ ID NO:72所示。 ci-ankrd52的序列如SEQ ID NO:69所示。
本发明第二方面公开了一种内含子来源环形RNA,为环状的单链RNA结构,含有前述成环关键核酸序列元件。
本发明实施例中所涉及的ci-ankrd52,该内含子来源的环形RNA序列如SEQ ID NO:69所示。并且SEQ ID NO:69所示序列的第一个碱基与最后一个碱基通过2’-5’磷酸二酯键连接。
本发明所述内含子来源环形RNA的形成过程为:转录获得的线性内含子RNA剪接形成套索结构;然后该套索结构不经过脱分支作用,仅尾巴(分支位点后序列)被降解从而形成环形RNA。
较优的,所述内含子来源环形RNA的长度为200nt~3000nt。更优的,为400nt~1800nt。
本发明所述内含子来源环形RNA中含有5’成环基序和3’成环基序;在环形RNA尚未成环以前的线性内含子RNA中,所述5’成环基序位于该线性内含子RNA的5’端,并且所述5’成环基序的第一个碱基为线性内含子RNA的5’端的第一个碱基。在成环过程中,所述5’成环基序的第一个碱基通过2’-5’磷酸二酯键与所述3’成环基序中最后一个碱基(第十一个碱基)连接。本发明所述3’成环基序的最后一个碱基位于该线性内含子RNA的分支位点(branch point),当所述5’成环基序的第一个碱基与所述3’成环基序的最后一个碱基通过2’-5’磷酸二酯键连接后,3’成环基序最后一个碱基(位于分支位点的碱基)后的序列所形成的尾巴会在成环过程中降解,最终获得环形RNA。
所述RNA的分支位点(branch point)位于内含子3’末端前20到50个碱基。通常内含子区域起始于GU位点,结束于AG位点。所述的GU位点为5’端(供体端)剪接位点(splice donor,SD),AG位点为3’端(受体端)剪接位点(splice acceptor,SA),分支位点位于AG位点前20到50个碱基,保守序列为“CU(A/G)A(C/U)”,其中A在大多数情况下为分支位点。在分支位点到AG位点之间是一段多嘧啶区。
本发明第三方面公开了一种诱导线性RNA分子成环的方法,为将前述5’成环基序和3’成环基序分别替换到非环形结构RNA分子两端,从而诱导线性RNA分子成环。
优选的,将两端的5’成环基序和3’成环基序延长,可以得到更好的诱导效率。
优选的,本发明所述环形内含子RNA可以通过环形对扩引物(convergent primers)进行扩增,以进一步验证所诱导形成环状分子的特性。
所述成环基序的替换为将5’成环基序和3’成环基序替换到线性RNA分子的两端。更进一步的,诱导线性内含子RNA成环,5’成环基序的替换,为采用5’成环基序替换掉非 环形结构RNA5’端包括5’端剪接位点(splice donor,SD)在内的一段序列;所述3’成环基序的替换为采用3’成环基序替换掉非环形结构RNA3’端分支位点以前,包括分支位点在内的一段序列。
本发明第四方面公开了前述成环关键核酸序列元件在诱导非环形结构RNA成环中的应用。
在本发明具体实施例中,为SEQ ID NO:71和SEQ ID NO:72所示序列的5’成环基序和前述3’成环基序在诱导ANKRD52基因第五个内含子(intron5,hg19chr12:56648737-56649567)所编码的线性RNA成环中的应用。
本发明最后一方面公开了前述成环关键核酸序列元件,环形内含子RNA及诱导线性内含子RNA成环的方法在核酸研究领域的应用。
具体的,为在RNA分子的重构及其功能研究领域的应用。
本发明的有益效果:我们首次发现了一类新型的内含子来源环形RNA(ciRNAs),在结构和概念上都是一种新的长非编码RNA,不仅改变了人们对内含子不能稳定存在的想法,更丰富了人们对长非编码RNA的认识。同时,我们鉴定了ciRNAs的成环关键序列,并拓展了此保守序列的应用,可以将线性RNA分子诱导称为环形结构,为今后对于RNA分子的重构及其功能研究提供新的途径。
附图说明
图1:10条内含子来源RNA稳定性的Northern blot结果图
图2:内含子来源的长非编码RNA在RNase R处理组中富集的结果图
图3:ciRNAs的结构及其稳定性(A:变性TBE-PAGE结果图;B:半衰期RT-qPCR结果)
图4:ciRNAs的体外重建(左侧为载体构建示意图,右侧为电泳及RT-PCR结果图)
图5:成环关键RNA序列的结果图
图6:成环关键序列诱导线性RNA分子成环的结果图
具体实施方式
在进一步描述本发明具体实施方式之前,应理解,本发明的保护范围不局限于下述特 定的具体实施方案;还应当理解,本发明实施例中使用的术语是为了描述特定的具体实施方案,而不是为了限制本发明的保护范围。
实施例1内含子来源的环形RNA的发现与鉴定
1.实验材料
1)试剂
TRIzol,oligo(dT)磁珠,RiboMinus kit,CDP-STAR试剂购自Invitrogen公司;Dig wash and block buffer set,10×Dig RNA labeling mix,Anti-Digoxigenin,Fab Fragment购自Roche公司;AmpliScribeTM T7,T3,and SP6High Yield Transcription Kits,RNase R购自Epicentre公司;Illumina TruSeq Stranded Total RNA HT Sample Prep Kit购自Illumina公司;RNA反转试剂盒购自Takara公司;2×QPCR mix购自Toyobo公司;DNase Ⅰ购自Ambion公司;EcoR Ⅰ和Not Ⅰ购自NEB公司;α-amanitin购自Sigma公司。
2)细胞株和载体
干细胞H9培养在Martigel包被的培养皿上,采用CM(fibroblast-conditioned medium)培养基进行培养,该CM培养基为补加了4ng/mL的成纤维细胞生长因子(bFGF,Life Technologies)的MEF细胞培养基上清。
HeLa-J细胞在加入了10%胎牛血清(Gbico),1‰双抗的DMEM培养基(Gibco)中贴壁培养。
构建探针所用载体为带有T7和SP6启动子的pcDNA3载体。
2.实验方法
2.1RNA抽提
将3.5cm培养皿贴壁生长的H9和HeLa-J细胞用PBS洗两次后,加入1mL TRIzol试剂,反复吹打直至细胞全部裂解。之后加入0.2mL氯仿,离心后RNA处于上层水相,并将其转移到RNase-free的1.5mL EP管中,加入等体积的异丙醇混匀后离心,RNA将形成片状沉淀于管底。75%乙醇漂洗两次后,室温晾干,加入适量的RNase-free水溶解。
2.2H9总RNA poly(A)+/-的分离及Ribosomal RNA的去除,深度测序及分析。
首先利用oligo(dT)磁珠,将poly(A)+组分RNA和poly(A)-组分的RNA分离,进一步利用RiboMinus kit将poly(A)-组分中的核糖体RNA去除,获得poly(A)-/ribo-RNA。而后,利用Illumina TruSeq Stranded Total RNA HT Sample Prep Kit对poly(A)-/ribo-RNA建库,并使用Illumina HiSeq2000进行深度测序。通过对poly(A)-/ribo-RNA高通量测序分析 后,鉴定出450条来源于基因内含子区域,长度为200nt到3000nt不等的长非编码RNA(intronic RNAs)。其中有217条为新发现的,在RefSeq中没有注释。
2.3内含子来源长非编码RNA的验证
发明人在217条新发现的内含子来源的长非编码RNA中随机挑选10条(内含子来源的长非编码RNA的信息见表1),通过Northern Blot(NB)验证其细胞稳定性,具体方法如下:
表1非编码RNA

2.3.1长非编码RNA探针的制备
以人源胚胎干细胞H9基因组为模板,采用表2所示序列的引物,扩增intronic RNA的探针序列,并利用EcoR Ⅰ和Not Ⅰ双酶切后插入到pcDNA3载体中。
表2扩增探针区域引物


然后,以构建好的含有探针序列的线性化的pcDNA3载体为模板(当使用T7启动子的时候,用Not Ⅰ线性化载体为模板;当使用SP6启动子时,用EcoR Ⅰ线性化载体为模板)进行体外转录实验,分别获得地高辛(Dig)标记的识别与基因转录方向相同转录本的AS(antisense)RNA探针和识别与基因转录相反转录本的S(sense)RNA探针,转录体系如下:

37℃水浴3个小时,4M LiCl回收,分装后,-80℃冻存。
2.3.2Northern blot验证
制备浓度为1.5%的Agarose胶,10μg来源于H9和HeLa-J的total RNA用于检测。120V电泳2个小时后,使用Bio-Rad转膜装置,20V恒压电转过夜,将RNA转移到尼龙膜上,随后,1800J紫外交联,68℃预杂交2个小时后,加入相应的探针杂交过夜。杂交结束后,分别在室温使用2×SSC+0.1%SDS条件洗涤两次,每次5min,在68℃使用0.2×SSC+0.1%SDS条件洗涤两次,每次30min后,使用blocking buffer室温封闭30min,加入Anti-Digoxigenin,Fab Fragment室温孵育30min,随后用washing buffer洗两次,每次15min。最后与底物CDP-STAR孵育5min后,显影。结果如图1所示,10条内含子来源的长非编码RNA稳定存在于细胞中。
2.4大部分内含子来源的长非编码RNA在RNase R处理组中富集
为了探究这些内含子来源的lncRNAs如何维持其稳定性,我们进行了RNase R实验。RNase R可以特异性的降解线性或者Y-structure的RNA,而对环形RNA无效;RNase R实验的具体操作如下:
来源于H9细胞的20μg总RNA通过oligo(dT)磁珠将其分为poly(A)+和poly(A)-组分,进一步使用RiboMinus kit去除poly(A)-组分中的核糖体RNA。poly(A)-/ribo-组分RNA分为实验组和对照组,在实验组中加入5U的RNase R,对照组中加入相应缓冲液37℃孵育3小时后进行RNA抽提。取来自两组等量的poly(A)-/ribo-RNA用于建库,进行深度测序。ciRNAs(circular intronic RNAs)的评判标准是RPKMRNaseR/RPKMp(A)-/ribo-≥2。
实验结果如图2所示,该结果显示通过将RNase R处理组于对照组相比较,有103条intronic RNAs在RNase R处理组中有2倍以上的富集,即这些RNA分子在细胞中以环形结构存在,我们称其为ciRNAs(circular intronic RNAs),其中也包括了用NB验证过的10条内含子RNA。
2.5ciRNAs的进一步鉴定
已知环形分子在变性PAGE胶中的迁移速度较相同大小的线性分子慢,为了进一步验证ciRNAs的环形结构,发明人选取了一条丰度较高的ciRNA:ci-ankrd52进行细致的研究,方法如下:
2.5.1对照组线性RNA的合成
以人源胚胎干细胞H9基因组为模板,结合上游引物中带有T7启动子的引物(表3),扩增带有T7启动子的线性DNA模板。
使用T7启动子,转录体系如2.3.1所示,将其中的10×Dig RNA labeling mix替换为dATP,dCTP,dGTP,dUTP各1.5μl;转录获得linearized ci-ankrd52IVT产物(444nt)和full intron IVT产物(466nt)。
所述linearized ci-ankrd52IVT产物(444nt,如SEQ ID NO:69所示)与内源ci-ankrd52的大小和序列相同,但为线性,起到了对照的作用(因为环形分子在变性PAGE胶中的迁移速度较相同大小的线性分子慢);所述full intron IVT产物(466nt,如SEQ ID NO:70所示),为ci-ankrd52所在内含子区域完整的序列,即与linearized ci-ankrd52IVT产物相比多了分支位点后的22个碱基。
表3引物序列

2.5.2变性TBE-PAGE胶验证ciRNAs
配制5%8M尿素TBE-PAGE胶。上样顺序为10μg H9来源的total RNA和RNase R处理后的样品,及线性对照组样品:呈浓度梯度(0.2ng,0.5ng)上样的linearized ci-ankrd52IVT(444nt)和full intron IVT产物(466nt)。以100V恒压进行电泳,至二甲苯青指示剂到达胶的底部。使用Bio-Rad转膜装置100V电转1.5h,后续操作步骤如2.3.2所示,所使用探针为ci-ankrd52AS probe。
实验结果如图3A所示,linearized ci-ankrd52IVT产物(444nt)与full intron IVT产物(466nt)条带大小有明显差异,而ci-ankrd52与RNase R消化后的样品条带大小完全相同,为单一条带,并且两者在变性的TBE-PAGE胶中迁移速度较慢,进一步证明ci-ankrd52以环形结构存在于细胞中。
2.5.3ciRNAs具有更高的稳定性
对ciRNAs的半衰期进行验证,具体操作如下:
H9细胞在用Accutase(Innovative Cell Technologies)消化前用ROCK抑制剂Y-27632(Chemicon)处理一个小时。计数后,每个3.5cm培养皿铺2×105细胞,继续培养4天后,加入含有10μg/mlα-amanitin(Pol II(RNA polymeraseII)抑制剂)培养基,在指定时间点(0h,3h,6h,12h,16h)抽提细胞RNA。对于提取的total RNA,首先用DNase Ⅰ在37℃处理30min后,利用Takara反转试剂盒将其反转为cDNA。体系如下:

37℃,15min;85℃,5sec。
取0.5μl作为每孔的模板,使用如下引物(表4)进行RT-qPCR检测。其中ciRNAs使用的是只能扩增环形分子的对扩引物(convergent primers),以β-actin为内参,标准差来源于三个重复实验的结果。
表4PCR引物

在使用Pol II(RNA polymeraseII)抑制剂α-amanitin处理后,RT-qPCR检测ciRNAs与来源基因mRNA的稳定性,实验结果如图3B所示。与相同来源基因的mRNA相比,ciRNAs具有更长的半衰期,即稳定性更高,与其环形结构相符。
实施例2内含子来源环形RNA的成环关键核酸序列的发现与鉴定
1.试剂
RNA MarkerⅢ购自Roche公司;Nhe Ⅰ,BamH Ⅰ,HindⅢ购自NEB公司;琼脂糖凝胶回收试剂盒,普通DNA产物回收试剂盒购自天根公司。
2.细胞株和载体
PA-1细胞在加入了10%胎牛血清(Gbico),1%L-谷氨酰胺,1‰双抗的MEMα培养基(Gibco)中贴壁培养。构建质粒所用载体为pcDNA3和经改造过的pEGFP-C1质粒,即pZW1,将egfp分为两部分,中间设有剪接位点和酶切位点,这种载体只有发生正常的剪切后才有绿色荧光形成(Systematic Identification and Analysis of Exonic Splicing Silencers,Wang et al.,2004)。
3.实验方法
3.1ciRNAs的重构
3.1.1表达质粒的构建
为了进一步验证本发明所述ciRNAs是异常剪接的副产物还是存在着某些关键序列促进ciRNAs的加工成熟,本实施例对ciRNAs进行体外重建实验。具体操作如下:
1)重组质粒pcDNA3-ciRNA-wt
以H9基因组为模板,利用引物(SEQ ID NO:39~40)将ci-ankrd52所在的内含子区域(466bp)连同两端的外显子序列克隆,并通过EcoR Ⅰ和Not Ⅰ双酶切后插入到pcDNA3载体中,获得重组质粒pcDNA3-ciRNA-wt。引物序列如下:
ci-ankrd52wt F:
5’-CCCGAAGGCTACGTCCAGGTGAGTTGGGAGCAGGGA-3’(SEQ ID NO:39)
ci-ankrd52 wt R:
5’-GAAGAAGATGGTGCGCTCCTGGGAAGGCAAAAAAGA-3’ (SEQ ID NO:40)
2)重组质粒pZW1-ciRNA-wt
将ci-ankrd52所在的内含子区域(466bp)构建到两端为egfp的pZW1载体中,获得pZW1-ciRNA-wt质粒。由于内含子区域本身已经含有剪接位点,而载体中也含有一套剪接位点,为了避免两套剪接位点相互干扰,使用overlap PCR的方法将ci-ankrd52所在的内含子区域(466bp)替换掉两端egfp中间的序列,使质粒只使用插入内含子的剪接位点发生剪接。
Overlap PCR方法的原理是:不需要使用酶切位点,但需要两轮PCR将两个片段连接起来。第一次PCR产物的两个片段间有一定长度的重叠区域(大小视连接片段的大小而定,如果片段很大,可以适当延长overlap的区域)。第二次PCR,前5个循环不加入引物,只加入等摩尔数的第一次PCR产物,由于两片段间有重叠区域,因此它们可以互为模板和引物进行扩增,获得两个片段连接在一起的长片段模板,然后再加入外端引物,进一步扩大产物量。pZW1-ciRNA-wt质粒包括三个片段的overlap,即含有Nhe Ⅰ酶切位点并且和ci-ankrd52内含子上游有overlap的egfp左半边;含有BamH Ⅰ酶切位点并且和ci-ankrd52内含子下游有overlap的egfp右半边;与两端egfp有overlap的ci-ankrd52内含子区域,各片段所采用引物见表5:
表5pZW1-ciRNA-wt质粒构建引物

以pZW1为模板,SEQ ID NO:41~42所示序列的引物扩增出egfp左半边;以H9基因组为模板,SEQ ID NO:43~44所示序列的引物扩增ci-ankrd52所在内含子区域;以pZW1为模板,SEQ ID NO:45~46所示序列的引物扩增egfp右半边。
将以上三个片段PCR产物回收后,加入等摩尔数的三个片段(以ci-ankrd52100ng为基准),前五个循环不加引物,随后加入EGFP F(Nhe Ⅰ)(SEQ ID NO:41)和EGFP R(BamH Ⅰ)(SEQ ID NO:46)再扩增30个循环后回收产物,大小为1214bp,利用Nhe Ⅰ和BamH Ⅰ双酶切后插入到pZW1载体中,获得重组质粒pZW1-ciRNA-wt。
3)重组质粒pZW1-ciRNA-del
以H9基因组为模板,利用引物(SEQ ID NO:47~48)克隆ci-ankrd52所在的内含子区域5’端和3’端有缺失的序列片段(441bp),通过HindⅢ和EcoR Ⅰ双酶切后克隆到pZW1载体中,获得pZW1-ciRNA-del质粒。
引物序列如下:
ci-ankrd52del F:5’-CCCAAGCTTTGGGAGCAGGGAGGATGGCG-3’(SEQ ID NO:47)
ci-ankrd52del R:5’-CCGGAATTCCAGGGAGTATGGGCGCGGGG-3’(SEQ ID NO:48)
3.1.2实验方法
将2μg该质粒(pcDNA3-ciRNA-wt、pZW1-ciRNA-wt、pZW1-ciRNA-del)和对照空载质粒(pcDNA3组用的是pcDNA3质粒,pZW1组用的是pZW1质粒)利用核转的方式将其转入2×106PA-1细胞,使用的程序为B-016,在6cm培养皿中培养24h后,使用TRIzol抽提RNA,方法参考实施例1中2.1部分。进一步利用5%8M尿素TBE-PAGE胶检测产物,方法如2.5.2所示,上样量为4μg,所使用探针为ci-ankrd52AS probe(实施例1制备,方法参考实施例1中2.3.1部分)。实验结果如图4所示。
pcDNA3-ciRNA-wt可以表达产生ci-ankrd52,并且以RNA MarkerⅢ为参照,条带位于466nt以上,说明产物具有较慢的迁移速度,即以环形结构存在于细胞中。进一步,利用环形对扩引物(convergent primers,SEQ ID NO:49~50)进行RT-PCR验证,与NT(not transfected)和EV(empty vector)相比,WT组有能检测到扩增条带,结果如图4所示。
ci-ankrd52circular F:5’-TGCCTTTGACTCCCAATACC-3’(SEQ ID NO:49);
ci-ankrd52circular R:5’-TCCGGAGGTTGAGAAGAGAA-3’(SEQ ID NO:50)。
同样,将重组质粒pZW1-ciRNA-wt转入PA-1细胞中,变性PAGE胶检测有环形RNA分子形成,并且利用环形对扩引物(convergent primers,SEQ ID NO:49~50)也可以检测到扩增产物,结果如图4所示。
但是,如果将重组质粒pZW1-ciRNA-del转入PA-1细胞中,变性PAGE跑胶无法检测到ci-ankrd52的形成,结果如图4所示,提示在ciRNAs中确实存在某些关键序列,对于ciRNAs的加工成熟是必不可少的;并且这些关键序列的编码序列位于内含子区域5’端和3’端;内含子区域5’端和3’端之间的相互作用是影响ciRNAs成环的关键。
3.2ciRNAs成环关键RNA序列的鉴定
现有技术可知,内含子在经过剪接过程后,形成套索结构,套索结构进一步经脱分支酶作用开环,随后核酸外切酶将其降解。而本发明的ciRNAs依赖其关键RNA序列没有经历脱分支的过程,而得以以环状结构稳定存在。为了探究ciRNAs的关键RNA序列,在高通量测序结果中从没有匹配到基因组的序列(成环关键RNA序列位于分支位点两侧,因此含有这样关键RNA序列的测序结果无法与线性的基因组匹配)中筛选了大约50条满足RPKMp(A)-≥10和RPKMRNaseR/RPKMp(A)-≥2条件的高表达并且为环形结构可信性较高的序列,将其反转为RNA序列后,使用计算软件GLAM2进行分析,所使用参数为(-z2-a2-b50-w20-r10-n2000-D0.1-E2-I0.02-J1),鉴定出ciRNAs的关键RNA序列,由5’剪接位点的7个GU-rich的5’成环基序和3’分支位点处的11个C-rich的3’成环基序构成,结果如图5所示。其中,所述5’成环基序中,鸟嘌呤(G)和尿嘧啶(U)的含量占5’成环基序总量的32-64%;所述3’成环基序中,胞嘧啶(C)的含量占3’成环基序总量的71-100%。表6随机给出了来自8个基因的内含子来源环形RNA中,5’成环基序和3’成环基序的具体序列。
表6成环关键核苷酸元件


实施例3成环关键序列诱导线性RNA分子成环的新材料和新方法
1.试剂
Nhe Ⅰ,BamH Ⅰ,HindⅢ购自NEB公司;QuikChange Site-Directed Mutagenesis Kit购自Stratagene公司;琼脂糖凝胶回收试剂盒,普通DNA产物回收试剂盒购自天根公司;AmpliScribeTM T7,T3,and SP6High Yield Transcription Kits购自Epicentre公司。
2.细胞株和载体
PA-1细胞在加入了10%胎牛血清(Gbico),1%L-谷氨酰胺,1‰双抗的MEMα培养基(Gibco)中贴壁培养。载体为pcDNA3,改造后的pZW1。
3.实验方法
本实施例的目的在于探究ciRNAs的成环关键序列是否具有广泛的应用性,发明人选取了一个在天然情况下不能形成环形RNA的内含子,即ANKRD52基因的第五个内含子(intron5,hg19chr12:56648737-56649567),长度为831bp,进行研究。
3.1intron5探针的制备
以H9基因组为模板,利用引物SEQ ID NO:51~52所示引物扩增intron5探针区域,利用BamH Ⅰ,HindⅢ双酶切,将其克隆到pcDNA3载体中,进一步利用HindⅢ将其线性化后,使用SP6启动子进行体外转录获得地高辛标记的探针,操作和体系参考实施例1的2.3.1部分。
intron5probe F:CCCAAGCTTGTGAGGACTGTTCCCATCCAGG(SEQ ID NO:51)
intron5probe R:CGCGGATCCCTGCATCAGGATATGAAAGACA(SEQ ID NO:52)
3.2成环关键序列诱导线性RNA分子成环
3.2.1重组质粒pZW1-1
利用overlap PCR的方法,将此内含子区域克隆到pZW1载体中,所用引物如表7所示;所述构建方法为:以pZW1为模板,用SEQ ID NO:41和SEQ ID NO:53所示序列的引物 扩增含有Nhe Ⅰ酶切位点,并且与intron5上游有重叠的egfp左半边;以H9基因组为模板,用SEQ ID NO:54和SEQ ID NO:55所示序列的引物扩增两端与egfp左右半边有重叠的内含子区域;以pZW1为模板,采用SEQ ID NO:56和SEQ ID NO:46所示序列的引物扩增含有BamH Ⅰ 酶切位点,并且与intron5下游有重叠的egfp右半边。将上述三个片段重叠在一起后(方法参考实施例2,overlap引物如SEQ ID NO:41和46所示),利用Nhe Ⅰ和BamH Ⅰ双酶切插入到pZW1载体中,获得重组质粒pZW1-1(pZW1-intron5)。
表7pZW1-1质粒构建引物

将重组质粒pZW1-1转入PA-1细胞中后,Agarose胶Northern blot,并使用intron5SP6探针进行检测,其结果为不能产生稳定存在的环形RNA,结果如图6所示。3.2.2重组质粒pZW1-2mut
进一步的实验,将成环关键核酸序列,包括5’端7个GU-rich元件和3’端分支位点的11个C-rich元件利用突变PCR的方法替换到包含上述内含子的质粒中,所述5’端7个碱基的GU-rich元件具体为5’-gtgagtt-3’(SEQ ID NO:71);所述3’端分支位点的11个碱基的C-rich元件具体为5’-gcccatactcc-3’(SEQ ID NO:72)。具体操作如下:以pZW1-1为模板,利用两步突变PCR,将保守序列替换到载体中。首先,使用SEQ ID NO:57~58(表8)所示序列的引物,用含5’端7个GU-rich元件的序列替换掉intron5原5’端序列;然后以该质粒为模板,进行下一步突变PCR,使用SEQ ID NO:59~60所示序列的引物,用含3’端分支位点的11个C-rich元件的序列替换掉intron5的3’末端原分支位点前的序列,但分支位点后序列保持不变,获得pZW1-2mut质粒。将其转入PA-1细胞,Northern blot检测可以形成稳定的环形RNA。并且,利用环形对扩引物(SEQ ID NO:61-62所示)可以检测到扩增条带,结果如图6所示。
表8pZW1-2mut质粒构建引物及环形检测引物


该结果证明成环关键核酸序列,即5’端7个碱基的GU-rich基序和3’端分支位点(branch point)的11个C-rich基序可以诱导环形RNA的产生,见图6。
3.2.3重组质粒pZW1-3mut
进一步,将关键核酸序列延长,利用overlap PCR的方法,将3’端保守序列(SEQ ID NO:72所示)延长,该overlap PCR使用的引物如表9所示,构建方法如下:
表9pZW1-3mut质粒构建引物

以pZW1-2mut为模板,采用SEQ ID NO:41和63所示序列的引物扩增含有NheⅠ酶切位点,并且与50nt替换序列上游重叠的产物A;以H9基因组为模板,采用SEQ ID NO:64和65所示序列的引物扩增与片段A和C重叠的50nt序列B;以pZW1-2mut为模板,采用SEQ ID NO:66和46所示序列的引物扩增含有BamH Ⅰ的酶切位点,并且与50nt替换序列下游重叠的产物C。将上述三个片段A、B、C采用SEQ ID NO:41和46所示序列的引物通过overlap PCR连接在一起后,利用Nhe Ⅰ和BamH Ⅰ双酶切后,将其插入pZW1载体中,获得pZW1-3mut质粒。
与质粒pZW1-2mut相比,pZW1-3mut质粒通过SEQ ID NO:74所示序列的片段替换掉了pZW1-2mut质粒3’端SEQ ID NO:72所示3’成环基序。
3.2.4质粒pZW1-4mut的构建:
在pZW1-3mut质粒的基础上,通过突变PCR的方法将5’端保守序列延长,具体方法:为以pZW1-3mut质粒为模板,采用SEQ ID NO:67-68所示序列的引物进行突变PCR,获得pZW1-4mut质粒。
与质粒pZW1-3mut相比,pZW1-4mut质粒通过SEQ ID NO:73所示序列的片段替换掉了pZW1-3mut质粒5’端SEQ ID NO:71所示5’成环基序。
pZW1-4mut F:TCCAGGTGAGTTGGGAGCAGGGAGGAGCCCGGATGG(SEQ ID NO:67)
pZW1-4mut R:CCATCCGGGCTCCTCCCTGCTCCCAACTCACCTGGA(SEQ ID NO:68)
将上述两个质粒(pZW1-3mut质粒,pZW1-4mut质粒)利用核转的方式转入PA-1中,实验结果如图6所示。将天然情况下在剪接后被降解的ANKRD52第5个内含子区域克隆到pZW1载体中(pZW1-1),NB检测无稳定形式存在(lane1)。将成环保守序列5’剪接位点7个GU-rich元件和3’端分支位点的11个C-rich元件替换到第5个内含子中(pZW1-2mut质粒),可以将此内含子转变为环形RNA,稳定存在(lane2);进一步将两端保守序列延长(pZW1-3mut质粒,pZW1-4mut质粒),获得更高的诱导效率(lane3,4)。琼脂糖NB所使用探针与第5个内含子区域匹配,图6A示意图黑线标记。NT为未转染质粒空白对照组;EV为空质粒组(pZW1载体)。
Northern blot检测显示成环关键序列上下游的核酸序列可以促进环形RNA产生的效率,提示在延长部分中存在着某些顺式元件对于关键RNA序列诱导成环起到促进作用。

















一种内含子来源环形RNA分子及其成环关键核酸序列的应用.pdf_第1页
第1页 / 共40页
一种内含子来源环形RNA分子及其成环关键核酸序列的应用.pdf_第2页
第2页 / 共40页
一种内含子来源环形RNA分子及其成环关键核酸序列的应用.pdf_第3页
第3页 / 共40页
点击查看更多>>
资源描述

《一种内含子来源环形RNA分子及其成环关键核酸序列的应用.pdf》由会员分享,可在线阅读,更多相关《一种内含子来源环形RNA分子及其成环关键核酸序列的应用.pdf(40页珍藏版)》请在专利查询网上搜索。

1、(10)申请公布号 (43)申请公布日 (21)申请号 201310398809.X(22)申请日 2013.09.05C12N 15/11(2006.01)C12N 15/10(2006.01)(71)申请人中国科学院上海生命科学研究院地址 200031 上海市徐汇区岳阳路320号(72)发明人陈玲玲 杨力 张杨 张晓鸥(74)专利代理机构上海光华专利事务所 31219代理人张艳(54) 发明名称一种内含子来源环形RNA分子及其成环关键核酸序列的应用(57) 摘要本发明涉及一类环形RNA分子及其成环关键核酸序列的应用。具体公开了一类环形RNA新分子的序列及基因组定位;公开了这类环形RNA新分。

2、子的成环关键核酸序列;还公开了一套包含上述成环关键核酸序列的质粒,可用于产生包含任意核酸序列的环形RNA分子。本发明首次揭示了一类内含子来源的环形RNA新分子及其成环关键核酸序列的应用,为产生包含任意核酸序列的环形RNA分子提供了全新的思路和方法。(51)Int.Cl.(19)中华人民共和国国家知识产权局(12)发明专利申请权利要求书1页 说明书15页序列表18页 附图5页(10)申请公布号 CN 104419704 A(43)申请公布日 2015.03.18CN 104419704 A1/1页21.一种成环关键核酸序列元件,包括5成环基序和3成环基序,所述5成环基序包含7个碱基组成的GU-r。

3、ich元件;所述3成环基序包含11个碱基组成的C-rich元件;所述5成环基序的第一个碱基与所述3成环基序的最后一个碱基通过2-5磷酸二酯键连接。2.如权利要求1所述的成环关键核酸序列元件,其特征在于,所述GU-rich元件中,鸟嘌呤和尿嘧啶总量占5成环基序碱基总量的57%100%;所述C-rich元件中,胞嘧啶总量占3成环基序碱基总量的27%64%;该百分比为数量百分比。3.如权利要求1所述的成环关键核酸序列元件,其特征在于,所述ANKRD52基因内含子来源的环形RNA ci-ankrd52中,所述5成环基序如SEQ ID NO:71所示;所述3成环基序如SEQ ID NO:72所示;所述内。

4、含子来源的环形RNA ci-ankrd52序列如SEQ ID NO:69所示。4.权利要求1-3任一权利要求所述成环关键核酸序列元件在诱导非环形结构RNA成环中的应用。5.一种内含子来源环形RNA,为环状的单链RNA结构,含有权利要求1-3任一权利要求所述成环关键核酸序列元件。6.如权利要求5所述内含子来源环形RNA,其特征在于,在所述内含子来源环形RNA尚未成环以前的线性内含子RNA中,所述5成环基序位于该线性内含子RNA的5端,并且所述5成环基序的第一个碱基为线性内含子RNA的5端的第一个碱基;在成环过程中,所述5成环基序的第一个碱基通过2-5磷酸二酯键与所述3成环基序中最后一个碱基连接;。

5、并且连接后,3成环基序最后一个碱基后面的序列降解,从而获得所述内含子来源环形RNA。7.如权利要求5所述内含子来源环形RNA,其特征在于,该环形RNA的长度为200nt3000nt。8.一种诱导线性RNA分子成环的方法,为将权利要求1-3任一权利要求所述成环关键核酸序列元件中的所述5成环基序和3成环基序分别替换到非环形结构RNA分子两端,即可诱导其成环。9.权利要求1-3任一权利要求所述成环关键核酸序列元件,权利要求5-7任一权利要求所述环形内含子RNA,及权利要求8所述诱导线性RNA分子成环的方法在核酸研究领域的应用。10.如权利要求9所述的应用,其特征在于,所述应用为在RNA分子的重构和/。

6、或RNA功能研究领域的应用。权 利 要 求 书CN 104419704 A1/15页3一种内含子来源环形 RNA 分子及其成环关键核酸序列的应用技术领域0001 本发明涉及核酸研究领域,具体涉及一种环形内含子RNA及其应用。背景技术0002 基因组测序计划的完成和新一代深度测序技术的应用,揭示哺乳动物细胞中95%以上的转录序列为非编码RNA(noncoding RNA,ncRNA)。这其中除了人们比较熟知的“管家”非编码RNA(如核糖体RNAs、转运RNAs和小核仁RNAs等)和小非编码RNA(如microRNA和piRNA等),更多是尚未深入研究的长非编码RNA(long noncoding。

7、 RNAs,lncRNAs)。长非编码RNA是一类长度大于200个核苷酸,不具有编码蛋白质能力的RNA。0003 目前大多数长非编码RNA是通过oligo(dT)磁珠将poly(A)+组分富集进行深度测序所发现,因此这类长非编码RNA和mRNA一样以poly(A)尾结尾,包括天然反式转录本(nature antisense transcripts,NATs)和基因间非编码RNA(long intergenic noncoding RNAs,lincRNAs)等。然而,越来越多的研究证实除了以poly(A)结尾的lncRNAs外,还稳定存在着大量的3末端不含有poly(A)尾巴的lncRNAs,。

8、同样广泛的参与到细胞的各项生命活动中。例如enhancer RNAs(eRNAs),转录来自基因的增强子区域,不具有poly(A)尾巴,虽然目前加工成熟机制仍不清楚,但其在增强基因转录方面的功能已得到验证。另外,不依赖于经典3末端成熟模式的lncRNAs也逐渐被证实,包括MALAT1(又称NEAT2)和Men(又称NEAT1_2)这两个细胞核定位的长非编码RNA,它们的3端加工成熟依赖RNase P(核糖核酸酶P)途径。RNase P可以特异性的识别tRNA的三叶草结构,参与tRNA5端的加工成熟。MALAT1和Men转录本的3端形成tRNA样结构,进而被RNase P识别,切割。成熟的MAL。

9、AT1和Men3端保守的A-rich基序和两个U-rich基序构成U-AU的3螺旋结构,使其稳定存在。已知在基因剪接经典途径中,由内含子剪接形成的套索结构(lariat)在经过脱分支后,很快的被核酸外切酶降解,然而也有一些来源于内含子区域的非编码RNA被保留下来,稳定存在,例如小核仁RNA、microRNA等。近期研究表明,内含子区域同样也可以产生表达量很高的长非编码RNA。比如,在一个内含子区域同时含有两个snoRNA时,两snoRNA中间区域序列依赖于snoRNP的保护而没有被降解,从而形成了两端为snoRNA的长非编码RNA,被称为sno-lncRNAs。PWS(Prader-Willi。

10、 Syndrome,小胖威利综合征)区域的sno-lncRNAs与RNA剪接调控因子Fox蛋白结合,进而改变相关RNA的剪接,推断这种调控作用可能与PWS的疾病发生相关。0004 此外,体内还存在一类不含有5帽子和3poly(A)尾巴的长非编码RNA,即环形RNA(circular RNA)。环形RNA早在20世纪70年代就在RNA病毒中被发现,并且通过电镜观察呈“锅柄”(pan-handle)样。随后,DCC(肿瘤抑制基因)、c-ETS-1(circular ETS-1)、SRY(sex-determing region Y)、cANRIL(circular ANRIL)等环形RNA相继被发。

11、现。伴随着高通量测序的发展,人们在不同物种中(从古生菌到人类)都发现了大量环形RNA的存在,并且证实了部分环形RNA的功能。例如,在睾丸中高表达的SRY参与了小鼠中睾丸的发育;说 明 书CN 104419704 A2/15页4人类INK4/ARF区域与ASVD(atherosclerotic vascular disease)相关,这一区域编码三个肿瘤抑制基因和一条长非编码RNA,ANRIL(Antisense Noncoding RNA in the INK4Locus),ANRIL通过招募PcG复合物来抑制INK4/ARF区域基因的表达。同时,这一区域还产生一条环形RNA,cANRIL,并。

12、且表达水平与INK4/ARF区域基因的表达水平呈正相关,提示cANRIL参与了基因表达调控。另外,近期研究表明,环形RNA还可以作为“假基因”(peudogene)为microRNA提供靶位点,从而竞争性的抑制了microRNA对mRNA的降解作用。例如CDR1as(antisense to the cerebellar degeneration-related protein1transcript)在脑中高表达,其含有70多个microRNA miR-7的结合位点,因此CDR1as也称为ciRS-7(circular RNA sponge for miR-7)。这种环形RNA可以作为分子海绵。

13、吸附miR-7,进而抑制miR-7对其结合靶位点mRNA的调控作用。相应的,ciRS-7表达水平的下调会导致含有miR-7结合位点的mRNA含量降低。0005 以上所提到的环形RNA大多数是通过“外显子反向剪接(back-splicing)”形成的,位于细胞浆中。对于“back-splicing”的发生,目前有两种模型解释。一种模型认为“back-splicing”是一种特殊的外显子跳跃(exon skipping),即新形成的转录本折叠,使原本相隔的两个外显子在空间上接近,导致下游外显子的分支位点攻击了非临近上游外显子3端的SD位点(splicing donor site),进一步上游外显子。

14、3端游离的羟基攻击下游外显子5端的SA位点(splicing acceptor site),使得非临近的外显子连接在一起,而中间被跨越的外显子成环,但机体是如何精确地选择特定的外显子发生这种成环反应的仍不是很清楚。另一种模型则认为在成环外显子的临近内含子中存在着反向的重复序列(inverted Alu),这些反向重复序列互补配对,使得非顺序排列的SA和SD位点中间发生转脂反应,进一步形成由外显子构成的环形RNA。0006 目前环形RNA的发现主要来源于反向剪接的外显子序列,然而本领域对于其它序列来源的环形RNA还没有报道,更为重要的是对环形RNA形成的关键核酸序列的发现及其成环功能作用还没有报。

15、道。发明内容0007 本发明的目的在于提供一种内含子来源环形RNA(circular intronic RNA)。一方面,该环形内含子RNA中含有成环关键核酸元件,可抑制脱分支酶对其作用,从而使其以环形结构稳定存在;另一方面,该成环元件还可以替换到非环形结构的RNA分子两端,诱导非环形结构的RNA成环。0008 本发明首先公开了一种成环关键核酸序列元件,包括5成环基序和3成环基序,所述5成环基序包含7个碱基组成的GU-rich元件;所述3成环基序包含11个碱基组成的C-rich元件;所述5成环基序的第一个碱基与所述3成环基序的最后一个碱基通过2-5磷酸二酯键连接。0009 较优的,本发明所述成。

16、环关键核酸序列元件位于内含子来源环形RNA中,所述5成环基序位于环形RNA成环以前的线性RNA的5端,所述3成环基序靠近环形RNA成环以前的线性RNA的3端,并且所述3成环基序的最后一个碱基位于该线性RNA的分支位点。0010 本发明所述5成环基序的7个碱基的排序按照其在线性RNA中5至3的方向,说 明 书CN 104419704 A3/15页5依次为第一个碱基至第七个碱基。同理3成环基序的11个碱基的排序按照其在线性RNA中5至3的方向,依次为第一个碱基至第十一个碱基。图5给出的-11-1以及17的数字标号只是为了标明5成环基序和3成环基序在基因组中相邻的关系,与其碱基排序并不矛盾。0011。

17、 较优的,所述5成环基序中,鸟嘌呤(G)和尿嘧啶(U)总量占5成环基序碱基总量的57%100%;所述3成环基序中,胞嘧啶(C)总量占3成环基序碱基总量的27%64%;该百分比为数量百分比。0012 更优的,所述5成环基序中,鸟嘌呤(G)和尿嘧啶(U)总量占5成环基序碱基总量的71%100%;所述3成环基序中,胞嘧啶(C)总量占3成环基序碱基总量的32%64%;该百分比为数量百分比。0013 优选的,本发明实施例中所涉及的ANKRD52基因内含子来源的环形RNA:ci-ankrd52中,所述5成环基序如SEQ ID NO:71所示;所述3成环基序如SEQ ID NO:72所示。ci-ankrd5。

18、2的序列如SEQ ID NO:69所示。0014 本发明第二方面公开了一种内含子来源环形RNA,为环状的单链RNA结构,含有前述成环关键核酸序列元件。0015 本发明实施例中所涉及的ci-ankrd52,该内含子来源的环形RNA序列如SEQ ID NO:69所示。并且SEQ ID NO:69所示序列的第一个碱基与最后一个碱基通过2-5磷酸二酯键连接。0016 本发明所述内含子来源环形RNA的形成过程为:转录获得的线性内含子RNA剪接形成套索结构;然后该套索结构不经过脱分支作用,仅尾巴(分支位点后序列)被降解从而形成环形RNA。0017 较优的,所述内含子来源环形RNA的长度为200nt3000。

19、nt。更优的,为400nt1800nt。0018 本发明所述内含子来源环形RNA中含有5成环基序和3成环基序;在环形RNA尚未成环以前的线性内含子RNA中,所述5成环基序位于该线性内含子RNA的5端,并且所述5成环基序的第一个碱基为线性内含子RNA的5端的第一个碱基。在成环过程中,所述5成环基序的第一个碱基通过2-5磷酸二酯键与所述3成环基序中最后一个碱基(第十一个碱基)连接。本发明所述3成环基序的最后一个碱基位于该线性内含子RNA的分支位点(branch point),当所述5成环基序的第一个碱基与所述3成环基序的最后一个碱基通过2-5磷酸二酯键连接后,3成环基序最后一个碱基(位于分支位点的。

20、碱基)后的序列所形成的尾巴会在成环过程中降解,最终获得环形RNA。0019 所述RNA的分支位点(branch point)位于内含子3末端前20到50个碱基。通常内含子区域起始于GU位点,结束于AG位点。所述的GU位点为5端(供体端)剪接位点(splice donor,SD),AG位点为3端(受体端)剪接位点(splice acceptor,SA),分支位点位于AG位点前20到50个碱基,保守序列为“CU(A/G)A(C/U)”,其中A在大多数情况下为分支位点。在分支位点到AG位点之间是一段多嘧啶区。0020 本发明第三方面公开了一种诱导线性RNA分子成环的方法,为将前述5成环基序和3成环基。

21、序分别替换到非环形结构RNA分子两端,从而诱导线性RNA分子成环。0021 优选的,将两端的5成环基序和3成环基序延长,可以得到更好的诱导效率。说 明 书CN 104419704 A4/15页60022 优选的,本发明所述环形内含子RNA可以通过环形对扩引物(convergent primers)进行扩增,以进一步验证所诱导形成环状分子的特性。0023 所述成环基序的替换为将5成环基序和3成环基序替换到线性RNA分子的两端。更进一步的,诱导线性内含子RNA成环,5成环基序的替换,为采用5成环基序替换掉非环形结构RNA5端包括5端剪接位点(splice donor,SD)在内的一段序列;所述3成。

22、环基序的替换为采用3成环基序替换掉非环形结构RNA3端分支位点以前,包括分支位点在内的一段序列。0024 本发明第四方面公开了前述成环关键核酸序列元件在诱导非环形结构RNA成环中的应用。0025 在本发明具体实施例中,为SEQ ID NO:71和SEQ ID NO:72所示序列的5成环基序和前述3成环基序在诱导ANKRD52基因第五个内含子(intron5,hg19chr12:56648737-56649567)所编码的线性RNA成环中的应用。0026 本发明最后一方面公开了前述成环关键核酸序列元件,环形内含子RNA及诱导线性内含子RNA成环的方法在核酸研究领域的应用。0027 具体的,为在R。

23、NA分子的重构及其功能研究领域的应用。0028 本发明的有益效果:我们首次发现了一类新型的内含子来源环形RNA(ciRNAs),在结构和概念上都是一种新的长非编码RNA,不仅改变了人们对内含子不能稳定存在的想法,更丰富了人们对长非编码RNA的认识。同时,我们鉴定了ciRNAs的成环关键序列,并拓展了此保守序列的应用,可以将线性RNA分子诱导称为环形结构,为今后对于RNA分子的重构及其功能研究提供新的途径。附图说明0029 图1:10条内含子来源RNA稳定性的Northern blot结果图0030 图2:内含子来源的长非编码RNA在RNase R处理组中富集的结果图0031 图3:ciRNAs。

24、的结构及其稳定性(A:变性TBE-PAGE结果图;B:半衰期RT-qPCR结果)0032 图4:ciRNAs的体外重建(左侧为载体构建示意图,右侧为电泳及RT-PCR结果图)0033 图5:成环关键RNA序列的结果图0034 图6:成环关键序列诱导线性RNA分子成环的结果图具体实施方式0035 在进一步描述本发明具体实施方式之前,应理解,本发明的保护范围不局限于下述特定的具体实施方案;还应当理解,本发明实施例中使用的术语是为了描述特定的具体实施方案,而不是为了限制本发明的保护范围。0036 实施例1内含子来源的环形RNA的发现与鉴定0037 1.实验材料0038 1)试剂0039 TRIzol。

25、,oligo(dT)磁珠,RiboMinus kit,CDP-STAR试剂购自Invitrogen公司;Dig wash and block buffer set,10Dig RNA labeling mix,Anti-Digoxigenin,Fab 说 明 书CN 104419704 A5/15页7Fragment购自Roche公司;AmpliScribeTMT7,T3,and SP6High Yield Transcription Kits,RNase R购自Epicentre公司;Illumina TruSeq Stranded Total RNA HT Sample Prep Kit购。

26、自Illumina公司;RNA反转试剂盒购自Takara公司;2QPCR mix购自Toyobo公司;DNase 购自Ambion公司;EcoR 和Not 购自NEB公司;-amanitin购自Sigma公司。0040 2)细胞株和载体0041 干细胞H9培养在Martigel包被的培养皿上,采用CM(fibroblast-conditioned medium)培养基进行培养,该CM培养基为补加了4ng/mL的成纤维细胞生长因子(bFGF,Life Technologies)的MEF细胞培养基上清。0042 HeLa-J细胞在加入了10%胎牛血清(Gbico),1双抗的DMEM培养基(Gibc。

27、o)中贴壁培养。0043 构建探针所用载体为带有T7和SP6启动子的pcDNA3载体。0044 2.实验方法0045 2.1RNA抽提0046 将3.5cm培养皿贴壁生长的H9和HeLa-J细胞用PBS洗两次后,加入1mL TRIzol试剂,反复吹打直至细胞全部裂解。之后加入0.2mL氯仿,离心后RNA处于上层水相,并将其转移到RNase-free的1.5mL EP管中,加入等体积的异丙醇混匀后离心,RNA将形成片状沉淀于管底。75%乙醇漂洗两次后,室温晾干,加入适量的RNase-free水溶解。0047 2.2H9总RNA poly(A)+/-的分离及Ribosomal RNA的去除,深度测。

28、序及分析。0048 首先利用oligo(dT)磁珠,将poly(A)+组分RNA和poly(A)-组分的RNA分离,进一步利用RiboMinus kit将poly(A)-组分中的核糖体RNA去除,获得poly(A)-/ribo-RNA。而后,利用Illumina TruSeq Stranded Total RNA HT Sample Prep Kit对poly(A)-/ribo-RNA建库,并使用Illumina HiSeq2000进行深度测序。通过对poly(A)-/ribo-RNA高通量测序分析后,鉴定出450条来源于基因内含子区域,长度为200nt到3000nt不等的长非编码RNA(in。

29、tronic RNAs)。其中有217条为新发现的,在RefSeq中没有注释。0049 2.3内含子来源长非编码RNA的验证0050 发明人在217条新发现的内含子来源的长非编码RNA中随机挑选10条(内含子来源的长非编码RNA的信息见表1),通过Northern Blot(NB)验证其细胞稳定性,具体方法如下:0051 表1非编码RNA说 明 书CN 104419704 A6/15页80052 0053 2.3.1长非编码RNA探针的制备0054 以人源胚胎干细胞H9基因组为模板,采用表2所示序列的引物,扩增intronic RNA的探针序列,并利用EcoR 和Not 双酶切后插入到pcDN。

30、A3载体中。0055 表2扩增探针区域引物0056 0057 0058 然后,以构建好的含有探针序列的线性化的pcDNA3载体为模板(当使用T7启动子的时候,用Not 线性化载体为模板;当使用SP6启动子时,用EcoR 线性化载体为模板)进行体外转录实验,分别获得地高辛(Dig)标记的识别与基因转录方向相同转录本的AS(antisense)RNA探针和识别与基因转录相反转录本的S(sense)RNA探针,转录体系如下:说 明 书CN 104419704 A7/15页90059 0060 37水浴3个小时,4M LiCl回收,分装后,-80冻存。0061 2.3.2Northern blot验证。

31、0062 制备浓度为1.5%的Agarose胶,10g来源于H9和HeLa-J的total RNA用于检测。120V电泳2个小时后,使用Bio-Rad转膜装置,20V恒压电转过夜,将RNA转移到尼龙膜上,随后,1800J紫外交联,68预杂交2个小时后,加入相应的探针杂交过夜。杂交结束后,分别在室温使用2SSC+0.1%SDS条件洗涤两次,每次5min,在68使用0.2SSC+0.1%SDS条件洗涤两次,每次30min后,使用blocking buffer室温封闭30min,加入Anti-Digoxigenin,Fab Fragment室温孵育30min,随后用washing buffer洗两次。

32、,每次15min。最后与底物CDP-STAR孵育5min后,显影。结果如图1所示,10条内含子来源的长非编码RNA稳定存在于细胞中。0063 2.4大部分内含子来源的长非编码RNA在RNase R处理组中富集0064 为了探究这些内含子来源的lncRNAs如何维持其稳定性,我们进行了RNase R实验。RNase R可以特异性的降解线性或者Y-structure的RNA,而对环形RNA无效;RNase R实验的具体操作如下:0065 来源于H9细胞的20g总RNA通过oligo(dT)磁珠将其分为poly(A)+和poly(A)-组分,进一步使用RiboMinus kit去除poly(A)-组。

33、分中的核糖体RNA。poly(A)-/ribo-组分RNA分为实验组和对照组,在实验组中加入5U的RNase R,对照组中加入相应缓冲液37孵育3小时后进行RNA抽提。取来自两组等量的poly(A)-/ribo-RNA用于建库,进行深度测序。ciRNAs(circular intronic RNAs)的评判标准是RPKMRNaseR/RPKMp(A)-/ribo-2。0066 实验结果如图2所示,该结果显示通过将RNase R处理组于对照组相比较,有103条intronic RNAs在RNase R处理组中有2倍以上的富集,即这些RNA分子在细胞中以环形结构存在,我们称其为ciRNAs(cir。

34、cular intronic RNAs),其中也包括了用NB验证过的10条内含子RNA。0067 2.5ciRNAs的进一步鉴定0068 已知环形分子在变性PAGE胶中的迁移速度较相同大小的线性分子慢,为了进一步验证ciRNAs的环形结构,发明人选取了一条丰度较高的ciRNA:ci-ankrd52进行细致的研究,方法如下:0069 2.5.1对照组线性RNA的合成说 明 书CN 104419704 A8/15页100070 以人源胚胎干细胞H9基因组为模板,结合上游引物中带有T7启动子的引物(表3),扩增带有T7启动子的线性DNA模板。0071 使用T7启动子,转录体系如2.3.1所示,将其中。

35、的10Dig RNA labeling mix替换为dATP,dCTP,dGTP,dUTP各1.5l;转录获得linearized ci-ankrd52IVT产物(444nt)和full intron IVT产物(466nt)。0072 所述linearized ci-ankrd52IVT产物(444nt,如SEQ ID NO:69所示)与内源ci-ankrd52的大小和序列相同,但为线性,起到了对照的作用(因为环形分子在变性PAGE胶中的迁移速度较相同大小的线性分子慢);所述full intron IVT产物(466nt,如SEQ ID NO:70所示),为ci-ankrd52所在内含子区域。

36、完整的序列,即与linearized ci-ankrd52IVT产物相比多了分支位点后的22个碱基。0073 表3引物序列0074 0075 2.5.2变性TBE-PAGE胶验证ciRNAs0076 配制5%8M尿素TBE-PAGE胶。上样顺序为10g H9来源的total RNA和RNase R处理后的样品,及线性对照组样品:呈浓度梯度(0.2ng,0.5ng)上样的linearized ci-ankrd52IVT(444nt)和full intron IVT产物(466nt)。以100V恒压进行电泳,至二甲苯青指示剂到达胶的底部。使用Bio-Rad转膜装置100V电转1.5h,后续操作步骤。

37、如2.3.2所示,所使用探针为ci-ankrd52AS probe。0077 实验结果如图3A所示,linearized ci-ankrd52IVT产物(444nt)与full intron IVT产物(466nt)条带大小有明显差异,而ci-ankrd52与RNase R消化后的样品条带大小完全相同,为单一条带,并且两者在变性的TBE-PAGE胶中迁移速度较慢,进一步证明ci-ankrd52以环形结构存在于细胞中。0078 2.5.3ciRNAs具有更高的稳定性0079 对ciRNAs的半衰期进行验证,具体操作如下:0080 H9细胞在用Accutase(Innovative Cell Technologies)消化前用ROCK抑制剂Y-27632(Chemicon)处理一个小时。计数后,每个3.5cm培养皿铺2105细胞,继续培养4天后,加入含有10g/ml-amanitin(Pol II(RNA polymeraseII)抑制剂)培养基,在指定时间点(0h,3h,6h,12h,16h)抽提细胞RNA。对于提取的total RNA,首先用DNase 在37处理30min后,利用Takara反转试剂盒将其反转为cDNA。体系如下:0081 说 明 书CN 104419704 A10。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 化学;冶金 > 生物化学;啤酒;烈性酒;果汁酒;醋;微生物学;酶学;突变或遗传工程


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1