以era或gst为第一顺反子的原核双顺反子表达载体 本发明涉及在基因工程领域中以大肠杆菌为宿主菌的原核双顺反子表达载体的构建。
众所周知,利用基因工程方法来大量获取自然界中含量极微的蛋白质,是一条切实可行的途径。其中,在科研和生产中应用比较广泛的是大肠杆菌表达系统。虽然大肠杆菌表系统不能象真核系统一样进行翻译后加工,在一定程度上制约着其应用,但由于其遗传背景相对比较清楚,并且具有使用安全、操作简便、周期短、经济等特点,故而它仍然是目前使用最广泛的、也是不可替代的基本系统。
表达系统中起关键作用的是表达载体。对于大肠杆菌表达系统来说,表达载体理想的性能应包括以下几点:第一,表达量高;第二,适用范围广;第三,表达易于严格调控;第四,表达产物容易纯化;第五,表达产物活性高;第六,小规模、大规模均容易操作且经济;第七,稳定性好。到目前为止,还没有一个表达载体能完全满足上述要求。
大肠杆菌表达系统经过几十年的研究,在分子生物学基础研究和基因工程生产等方面都取得了令人瞩目的成就。目前已知地大肠杆菌表达载体有以下几种类型:非融合表达、融合表达、分泌表达、带纯化标签的表达、带伴同蛋白的表达、表面呈现表达等,各有其优缺点。其中融合表达虽然可以解决通用性的问题,但去除融合的肽段就非常困难;分泌表达产量低等等。尤其是目前所使用的表达载体大多都是单顺反子的,固定的SD-AUG间隔难以适用于所有基因的表达。
本发明的目的是,提供以era或gst基因为第一顺反子的原核双顺反子表达载体,为基因工程生产有活性的重组蛋白以及表达调控的研究提供前提条件。
本发明的目的是通过以下途径来实现的,此表达载体由以下关键四部分经各种组合而形成许多独立的表达载体。第一,采用了双顺反子形式,以高表达的era或gst基因合理的翻译起始区(TIR)作为第一顺反子,合理组织第一顺反子的终止码和第二顺反子的起始码的结构;第二,启动子为PL或Ptac;第三,“原核翻译增强子”序列;第四,cI857基因序列。
构建过程:
首先是启动子的选择,PL和Ptac具有启动能力强,可严格调控的特点,因此选用PL和Ptac作为启动子。
其次是选用强终止信号rrnBT1T2,以保证转录的效率,避免无效转录。它源于大肠杆菌5S RNA的转录终止序列。尽管它对于基因表达是非必需的,但是对于提高转录效率以及表达载体的稳定性却是非常有益的。
第三、选用pUC系统的复制起始位点(ori),以保证质粒的拷贝数较高,易于操作,易于提高产量。
第四、采用双顺反子方式构建表达载体,其第一顺反子是曾在大肠杆菌中高表达的era的部分序列、全长或截短的gst序列,从而保证RBS或TIR的组织的合理性,进而带动第二个顺反子即目的基因的表达。由于原核基因许多以多顺反子形式转录和翻译,核糖体与第一个顺反子mRNA 5′端形成翻译起始复合物,开始翻译,当遇到终止信号,而此时紧随其后又是第二个顺反子的起始码时,第一条多肽链合成虽已结束,但此时核糖体可发生通读,即不离开mRNA,而随之合成第二个顺反子的多肽链。实验中发现,尽管使用了强的启动子,但经常发现虽然基因已转录为mRNA,却无目的蛋白表达,所以翻译水平的表达调控对外源基因的表达至关重要。因此,可以采用双顺反子形式,由于第一个顺反子翻译起始区的合理组织有利于目的基因的表达,将待表达基因作为第二个顺反子,以求获得基因高表达。
第五、鉴于原核翻译增强子的发现及其对原核翻译水平的影响,本载体亦不失时机地将其引入,以期提高翻译效率、提高表达水平。近年来有关mRNA翻译起始区(TIR)对基因表达的影响越来越受到人们的重视。大量研究资料表明,位于mRNA 5′端的TIR范围内的碱基可形成各式各样的二级结构,一旦起始密码子AUG和SD序列位于二级结构的碱基配对区域,就会影响其翻译起始,只有AUG和SD序列呈单链结构时才会呈现高表达。而且SD-AUG间距离、SD-AUG间隔区组成以及AUG上下游各20bp对基因表达影响极大,因此设计表达载体时必须充分考虑到这些结构间的相互影响。
第六、本载体中亦包含质粒所必需的其它元件,如氨苄抗性基因、多克隆位点等。
第七、为了使载体易于操作,尽量将其缩小。为此,有的载体未将cI857基因引入,采用基因型中含cI857基因的大肠杆菌TAP106、TAP56、TAP130等为宿主菌。
第八、此表达载体具有如下特殊结构:
第九、此表达载体表达的是非融合蛋白,特别适合于作为工程菌进行生产。
构建中所使用的部分序列(有的仅使用其中部分序列):
PL启动子的序列AACCATCTGCGGTGATAAATTATCTCTGGCGGTGTTGACATAAATACCACTGGCCGTGATACTGAGCACATCAGCAGGACGCACTGACCACCATGAAGGTGACGCTCTTAAAAATTAAGCCCTGAAGAAGGGCAGCATTCAAAGCAGAAGGCTTTGGGGTGTGTGATACGAAACGAAGCATTGGCCGTAAGTGCGATTCCGGATTAGCTGCCAATGTGCCAATCGCGGGGGGTTTTCGTTCAGGACTACAACTGCCACACACCACCAAAGCTAACTGACAGGAGAATCCAGATGGATGCACAAACACGCCGCCGCGAACGTCGCGCAGAGAAACAGGCTCAATGGAAAGCAGCAAATCCCCTGTTGGTTGGGGTAAGCGCAAAACCAGTTCCGAAAGATTTTTTTAACTATAAACGCTGATGGAAGCGTTTATGCGGAAGAGGTAAAGCCCTTCCCGAGTAACAAAAAAACAACAGCATAAATAACCCCGCTCTTACACATCCCAGCCCTGAAAAAGGGCATCAAAATAAA
Ptac启动子的序列ACGTTATCGACTGCACGGTGCACCAATGCTTCTGGCGTCAGGCAGCCATCGGAAGCTGTGGTATGGCTGTGCAGGTCGTAAATCACTGCATAATTCGTGTCGCTCAAGGCGCACTCCCGTTCTGGATAATGTTTTTTGCGCCGACATCATAACGGTTCTGGCAAATATTCTGAAATGAGCTGTTGACAATTAATCATCGGCTCGTATAATGTGTGGAATTGTGAGCGGATAACAATTTCACACAGGAAACAGTATTC
gst基因序列ATGTCCCCTATACTAGGTTATTGGAAAATTAAGGGCCTTGTGCAACCCACTCGACTTCTTTTGGAATATCTTGAAGAAAAATATGAAGAGCATTTGTATGAGCGCGATGAAGGTGATAAATGGCGAAACAAAAAGTTTGAATTGGGTTTGGAGTTTCCCAATCTTCCTTATTATATTGATGGTGATGTTAAATTAACACAGTCTATGGCCATCATACGTTATATAGCTGACAAGCACAACATGTTGGGTGGTTGTCCAAAAGAGCGTGCAGAGATTTCAATGCTTGAAGGAGCGGTTTTGGATATTAGATACGGTGTTTCGAGAATTGCATATAGTAAAGACTTTGAAACTCTCAAAGTTGATTTTCTTAGCAAGCTACCTGAAATGCTGAAAATGTTCGAAGATCGTTTATGTCATAAAACATATTTAAATGGTGATCATGTAACCCATCCTGACTTCATGTTGTATGACGCTCTTGATGTTGTTTTATACATGGACCCAATGTGCCTGGATGCGTTCCCAAAATTAGTTTGTTTTAAAAAACGTATTGAAGCTATCCCACAAATTGATAAGTACTTGAAATCCAGCAAGTATATAGCATGGCCTTTGCAGGGCTGGCAAGCCACGTTTGGTGGTGGCGACCATCCTC
rrnBT1T2序列CTGTTTTGGCGGATGAGAGAAGATTTTCAGCCTGATACAGCTTAAATCAGAACGCAGAAGCGGTCTGATAAAACAGAATTTGCCTCCCGGCAGTAGCGCGGTGGTCCCACCTGACCCCATGCCGAACTCAGAAGTGAAACGCCGTAGCGCCGATGGTAGTGTGGGGTCTCCCCATGCGAGAGTAGCCAACTGCCAGGCATCAAATAAAACGAAAGGCTCAGTCGAAAGACTGGGCCTTTCGTTTTATCTGTTGTTTGTCGGTGAACGCTCTCCTGAGTAGGACAAATCCGCCGGGAGCGGATTTGAACGTTGCGAAGCAACGGCCCGGAGGGTGGCGGGCAGGACGCCCGCCATAAACTGCCAGGCATCAAATTAAGCAGAAGGCCATCCTGACGGATGGCCTTTTTGCGTTTCTACAAACTCTTT
era基因5’端序列ATGAGCATCGATAAAAGTTACTGCGGATTTATTGCCATCGTCGGACGTCCGAACGTTGGCAAATCCACATTGTTGAACAAACTGCTGGGGCAGAAAATCTCCATCACTTCCCGCAAGGCGCAGACAACTCGTCACCGCATTGTGGGGATCCATACTGAAGGCGCGTATCAGGCGATCTACGTCGATACACCGGGCCTGCATATGGAAGAAAAACGCGCCATTAACCGCCTGATGAACAAAGCGGCGAGCAGCTCTATTGGCGATGTTGAGCTGGTGATTTTTGTCGTTGAAGGCACCCGCTGGACGCCGGACGACGAAATGGTGCTCAACAAACTGCGCGAAGGCAAAGCGCCGGTAATCCTCGCGGTGAACAAAGTGGACAACGTGCAGGAGAAAGCCGATCTGCTGCCGCACCTGCAGTTCCTGGCAAGCCAGATGAACTTCCTCGATATCGTGCCAATCTCTGCCGAAACCGGGCTGAATGTTGACACTATTGCGGCAATCGTGCGTAAGCATCTACCTGAAGCGACTCATCACTTCCCGGAAGATTACATCACCGATCGCTCACAGCGTTTTATGGCGTCTGAAATCATCCGCGAAAAACTGATGCGTTTCCTCGGCGCTGAACTGCCGTACTCCGTGACCGTGGAGATCGAACGTTTCGTCTCTAACGAACGCGGTGGTTATGA
cI857互补序列GCCAAACGTCTCTTCAGGCCACTGACTAGCGATAACTTTCCCCACAACGGAACAACTCTCATTGCATGGGATCATTGGGTACTGTGGGTTTAGTGGTTGTAAAAACACCTGACCGCTATCCCTGATCAGTTTCTTGAAGGTAAACTCATCACCCCCAAGTCTGGCTATGCAGAAATCACCTGGCTCAACAGCCTGCTCAGGGTCAACGAGAATTAACATTCCGTCAGGAAAGCTTGGCTTGGAGCCTGTTGGTGCGGTCATGGAATTACCTTCAACCTCAAGCCAGAATGCAGAATCACTGGCTTTTTTGGTTGTGCTTACCCATCTCTCCGCATCACCTTTGGTAAAGGTTCTAAGCTTAGGTGAGAACATCCCTGCCTGAACATGAGAAAAAACAGGGTACTCATACTCACTTCTAAGTGACGGCTGCATACTAACCGCTTCATACATCTCGTAGATTTCTCTGGCGATTGAAGGGCTAAATTCTTCAACGCTAACTTTGAGAATTTTTGTAAGCAATGCGGCGTTATAAGCATTTAATGCATTGATGCCATTAAATAAAGCACCAACGCCTGACTGCCCCATCCCCATCTTGTCTGCGACAGATTCCTGGGATAAGCCAAGTTCATTTTTCTTTTTTTCATAAATTGCTTTAAGGCGACGTGCGTCCTCAAGCTGCTCTTGTGTTAATGGTTTCTTTTTTGTGCTCAT
原核翻译增强子部分序列
GACTCACTATAGGGAGACCACAACGGTTTCCCTCTAGAAATAATTTTGTTTAACTTTAAGAAGGAGATATATCCATGG
本发明的构建流程见附图。
本发明的主要优点:
1)此表达载体以大肠杆菌为宿主菌,因此具有操作简便、使用安全、成本低以及周期短等优点。
2)表达的是非融合蛋白,从而保证目的蛋白与天然蛋白在结构、免疫原性、理化性质等方面基本一致。表达载体特别适用于在大肠杆菌中表达真核或原核基因,不管基因是否带有起始码,均可通过不同的酶切位点克隆并表达非融合蛋白,因此有利于作为工程菌进行生产。
3)通用性好。由于此双顺反子表达载体的翻译起始区已经进行了充分合理的设计,因此利于第二顺反子即目的基因的表达。
4)表达量高。由于此双顺反子表达载体的翻译起始区设计合理,并引入了“原核翻译增强子”,因此非常有利于翻译的起始。
5)载体稳定。由于在表达载体中引入了强转录终止信号rrnBT1T2,以及载体比较小,因此其稳定性好,适用于作为工程菌。
6)调控严格。由于此载体采用可严格调控的PL、Ptac作为启动子,因此调控严格,有利于科研和生产的应用。
7)拷贝数高。此表达载体采用了pUC的复制起点,因此拷贝数高,易于操作,易于获得大量重组蛋白。
实施例
1 IFN-y的高表达
我们利用此表达载体中的pEC34(启动子是温敏型PL启动子,其第一顺反子是已高表达的era部分序列,不含PL启动子的阻遏物基因cI857,故其合适的宿主菌为基因型中含cI857的大肠杆菌,所以TAP106为本表达质粒宿主菌)来表达IFN-γ。首先将IFN-γcDNA基因以EcoR和Isa1 I双酶切,与用相同酶切的载体进行连接,转化大肠杆菌TAP106,经筛选鉴定得重组表达质粒pEC34-IFN。按常规方法培养,42℃诱导后行SDS-PAGE,与未诱导菌株对比,在15.5KD处有一条新的蛋白带,以鼠抗人γ-干扰素单克隆抗体作为一抗,进行Western blot分析,结果仅此蛋白与γ-干扰素单抗杂交信号阳性,未诱导的菌株、标准分子量蛋白及表达菌中其它条带无阳性反应,说明此表达带确为IFN-γ蛋白。
为确定此表达质粒的最佳诱导时间,诱导1-6小时后分别取出制备样品,进行电泳,结果表明:诱导1小时后即有蛋白大量表达,3小时时最高,此后又略有下降,6小时时其表达量仍高于50%。
表达的IFN-γ蛋白经确认存在于沉淀中,即以包涵体形式存在。包涵体经初步纯化复性,活性测定结果表明,其活性为104u/mg。虽然活性低,但由于我们的目的不是去研究纯化和复性,故只做了一次纯化测活,只要有活性就达到了我们检测表达载体的目的。
经岛津自动光密度扫描仪扫描,结果示表达量占菌体总蛋白的85.5%,远远高于目前已报道的各类基因的表达情况。
一个表达载体表达目的基因,作为工程菌,其稳定性是十分重要的。为此,我们进行了稳定性检验,结果在传代30次时仍有IFN的高表达,说明此表达载体是稳定的。
2.IL-3的高表达
IL-3以EcoRI部分酶切,再经BamHI完全酶切,将IL-3完整cDNA自pBV220-IL-3中切出,以EcoRI-BamHI克隆入经EcoRI-BamHI酶切的pEC34表达载体中得表达质粒pEC34-IL-3。
与重组表达质粒pEC34-IFN一样,重组表达质粒pEC34-IL-3的宿主菌也是TAP106.按上述方法进行诱导及电泳,与未诱导的培养物对比,诱导后在15.2KD处有一条新的蛋白带,经岛津自动光密度扫描仪扫描,结果示表达量占菌体总蛋白的23%。
3.入BMP-3的高表达
将人BMP-3 C端215氨基酸cDNA片段以Nco I-Hind III双酶切,分别与经过相同酶切的表达载体pGC34(pGC34启动子是Ptac,其第一顺反子是已高表达的gst基因部分序列,其合适的宿主菌为JM109)和pEC34相连接,构建得表达质粒pGC-BMP和pEC-BMP。前者以IPTG诱导3小时,后者42℃温度诱导5小时,行SDS-PAGE,与未诱导菌株对比,在25KD处有一条新的蛋白带,光密度扫描示蛋白带分别占菌体总蛋白的18.5%和35%。表达蛋白以包涵体形式存在。用我室摸索出的一套简便易行的包涵体纯化、变性、复性方法,将初步纯化的重组人BMP-3 C端肽植入小鼠肌肉中,结果发现具有很强的诱骨活性,其最小诱骨量为0.2mg。在大肠杆菌中表达具有诱骨活性的人BMP-3,这在世界上尚属首次。