一种应用同源重组法获得转基因柞蚕生产目的蛋白的方法 【技术领域】
本发明属于生物工程领域。涉及一种利用同源重组序列组建转基因柞蚕表达载体生产外源基因产物的方法,主要包括通过转基因昆虫技术对柞蚕进行改造,由此获得能够在体内生产外源基因产物的柞蚕。
背景技术
自1974年美国学者Jaenisch首次应用显微注射法获得转基因小鼠以来,转基因动物已广泛应用于基础研究、疾病动物模型的建立、药用蛋白质的生产、农业等各个领域。
转基因动物的研究建立在经典遗传学、分子遗传学、结构遗传学和DNA重组技术的基础之上。作为生物科学领域的高新技术,转基因动物的研究既具有深远的理论价值,又有重大的应用价值,因而近年来成为生物工程领域的研究热点之一。
转基因动物是指用实验导入的方法使外源基因在染色体基因组内稳定整合,并能遗传给后代的一类动物。
从1985年有人提出利用转基因动物乳腺生产重组蛋白质至今的数年间,这一近乎天方夜谭的神话已逐渐变成了现实。通过动物乳腺生物反应器生产人类药用蛋白的研究已取得了初步成功。利用转基因动物生产人类药用蛋白等非常规畜牧产品,是目前世界上转基因研究的热点之一。
1991年,英国科学家将人的α1-抗胰蛋白酶基因转入绵羊受精卵,成功地获得了5只转基因绵羊,其中4只母绵羊乳中都表达了人的α-1抗胰蛋白酶,而且从绵羊乳中纯化地α1-抗胰蛋白酶与人血浆中的α1-抗胰蛋白酶具有相同的生物学活性。我国科学家也成功培育了乳汁中含有活性人凝血因子IX的转基因绵羊。利用转基因动物生产人类药用蛋白的生物反应器研究还相继在猪、山羊等其它家畜上取得了成功,表明利用转基因动物生产人类药用蛋白等生物活性物质是可能和可行的。
现在,有些生物技术公司已经瞄准了转基因昆虫,利用昆虫作为一种生物反应器。研究认为,利用转基因昆虫生产药物,与转基因哺乳动物相比,具有不少特点和优点:如(1)转基因昆虫所产生的蛋白质的糖部分(糖蛋白)也能够被糖基化;(2)有些药物,如抗血栓形成药物和血液稀释剂用转基因昆虫来生产可能更好,因为没有生物交叉反应;(3)昆虫的世代时间短,约8-13周;(4)生产成本低,据分析,一个细胞培养系统每年可生产100公斤未纯化的单克隆抗体,其生产成本预计每克100美元,而用转基因昆虫生产每克需0.1-0.3美元。
日本科学家Masafumi Yamao等曾于1999年利用同源重组技术成功地在家蚕丝腺中表达出绿色荧光蛋白,获得了转基因家蚕。我国学者也先后将抗NPV-核酶和新霉素抗性基因转移到家蚕的染色体上。但是,家蚕的丝素基因是由两条多肽链,一条重链-H和一条轻链-L所组成。在进行转基因研究中,由于两条链的原因要想在丝腺中表达纯合的外源基因产物,纯化非常困难。
柞蚕是我国特产的一种经济饲养昆虫,它有一系列完整的生产体系。每年有成千上万吨的柞蚕可被利用,资源丰富、稳定。但是,目前传统蚕茧制品越来越不适应市场的需要,产品单一的问题越来越突出。柞蚕资源的利用还仅仅停留在农业的副业领域上。而对蚕蛹、蚕蛾、丝等进行的开发和利用,还仅仅停留在以柞蚕资源为原材料的产品深加工上,其产品附加值的含量不高。
【发明内容】
本发明的目的在于提供一种利用柞蚕体为活体宿主来大量表达外源基因产物的方法,提高柞蚕的经济价值。
为了充分利用我国丰富的柞蚕资源,提高柞蚕的经济价值,本发明首次采用基因工程技术,以柞蚕染色体上的线性DNA片段(包括各种基因的5’端与3’端调控及部分结构基因)为同源序列构建转移表达载体,经线性化及脂质体包埋后直接注射到柞蚕雌蛾的交配囊或雄蚕蛹的睾丸内,后代经过同源重组后繁育成转基因柞蚕,以此柞蚕幼虫活体或蛹体为宿主,建立柞蚕个体生物反应器,实现在柞蚕体内来表达生产外源基因产物的目的。
本发明的技术方案是:克隆柞蚕染色体上的线性DNA片段(包括各种基因的5’端与3’端调控及部分结构基因),以此线性DNA片段为同源序列,组建转基因柞蚕基因转移表达载体。将目的基因例如一些能够改变柞蚕丝性质的基因(如绿色荧光蛋白基因、蛛丝牵引丝蛋白基因),或另有其它目的及用途的基因插入到组建好的转移表达载体上。组建好的转移表达载体经线性化及脂质体包埋后直接注射到柞蚕雌蛾的交配囊或雄蚕蛹的睾丸内,交配产卵后外源基因经过同源重组被转移到柞蚕染色体上。筛选含有外源基因的转基因柞蚕,再经过近一步的繁育就可以柞蚕幼虫活体或蛹体为宿主,在个体内大量生产外源基因产物。
柞蚕属于一种变态昆虫,在不同的变态过程中体内的物质发生巨大的变化,其中包括蛋白质的降解与重新合成,如当由幼虫变为蛹的过程中,五龄幼虫在很短的时间内(5天左右)合成大量的丝素和丝胶蛋白(约为1-1.5克左右)。我们可以利用柞蚕的这种特性,以柞蚕染色体上的线性DNA片段为同源重组序列组建柞蚕基因转移表达载体,将外源基因克隆到该转移表达载体上培育出转基因柞蚕。利用柞蚕幼虫活体或蛹为宿主在体内大量生产外源基因产物。
本发明的优点和效果是:
1、柞蚕的世代周期时间短,约15-20周。
2、产物易于纯化,由于外源基因产物被直接分泌到丝腺或个体内,而柞蚕的体内尤其是丝腺内含有的蛋白种类比较少,所以当进行外源基因表达产物的纯化时,工艺简单。
3、与原核表达系统相比较,转基因昆虫所产生的蛋白质的糖部分(糖蛋白)也能够被糖基化;与转基因哺乳动物相比,由于与人类的亲缘关系较远,所以没有生物交叉反应,非常安全。
4、有些柞蚕基因的启动子功能非常强大,所以表达的外源基因产物成本比较低廉。以每头柞蚕幼虫分泌500mg外源基因产物来计算,约合人民币0.05-0.2元左右。
【具体实施方式】
下面详细说明本发明的具体实施方案。
柞蚕丝素基因表达载体的组建和绿色荧光蛋白在丝腺内的表达
1、柞蚕丝素基因的5’端与3’端及部分结构基因的克隆
1)柞蚕丝素基因的5’端及部分结构基因的克隆
柞蚕DNA的提取取柞蚕蛹脂肪组织0.5g,加液氮研磨成粉状,加入提取缓冲液2ml,再加入蛋白酶K 5μg/ml,65℃4h,用同体积酚抽提2次,上清用异丙醇沉淀,干燥后溶于400μl TE中,分别用酚、酚/氯仿、氯仿各抽提一次,乙醇沉淀干燥后溶于200μl TE中加入RNase 5μg/ml 37℃保温30min备用。
PCR引物的合成 参考天蚕和家蚕部分丝素基因序列,人工合成引物:
5’端引物(AF1):TCC AGC GTT ACC AAT GAG AGC GCT TCA
3’端引物(AF2):ATT GTC TAC GTA TTC GTC GTG GTG A
柞蚕丝素基因5’端片段的克隆以柞蚕DNA为模板,以AF1、AF2为引物采用两步法进行扩增。循环参数为94℃预变性1min后,98℃变性20s,68℃退火延伸3min,共35个循环,然后72℃延伸10min。PCR扩增产物经低熔点琼脂糖凝胶电泳法回收纯化后,在T4 DNA连接酶作用下与pDM18-T载体连接得到质粒pMDAfib5,转化DH5α感受态细胞。提取DNA进行酶切鉴定,并分析5’端片段序列如下:AAATTCTTTA CAACTTCATT AGAATACGTC GATTTTTCTC TACTTCATAT AAATATTCTA TAGATGTGTT TGCTATATAAATACTTTAAA AAAAATGTCT CAACGGTTGT GAAAACTGTC AAAATCTGTT GCGTAGTTCA GAAAAACTAA GGAAACACACAAACATACAG AAAATTTATT TTACAAAAGT ACGGAGATAT ATAAAAATAT TTCGATTACT TTAGAATTAC AATAAAACTATTTGACAATT TGATTGCAAA TATAGACCAT GACAACACCA CATCTTTGTT ATCTAAAACA CGTAGCGACA ACACTCCTTGAACGTTGTTC GAGGATTACT ACGATAGTTG GCGGTTTTTT TTCCGCACCG CAAGAAAAGA GTAGAAATGT ACCGTATTTAAATCCAGTGC GGAAATTTTC ACGCAGAATT CGTTTCCATA CAATTCTATA GGTTACATAT CTTGCGGAAA TAAATTCGTGCCAAAAAGCC GAAGTGCGGG GACTAATAAA GATTTTATTT GGCATTCCTT CTAACCTTTA GATATAAATT TCTGTACGCGCGTATGTCAC TGAACTCCCC CTAAACGGCT GGACTAATTT TGATGAAATT TTGTTTGTGT GTTCCAGTGG ATCCGAGAATAGTTCAGATT CACAAATGGA GCCGGTAGGT GACGCCGCGG TTGACTTTTA GATTTTTTTA AATTATCAAC AACAACGTCCGCCCGGCCCG CTAGTTATGT ATGTATTTGT AAATGTAATC TCAAACCGTT CCTGTTGGAT CGACATTTAA TATGTTTAAGTGAATTAATT AACGTATAAC AGTCATAAGA AAATATTGCA ATAAAATCCC ATCATTTATT CTTTAGAGAC AATATAACCAAACAACAATA AGAATCAGAA TGTAATTACT GTACATTGTT CATGATAGGG GTTTAACTAT GATATTGTTT TAATTCTATA
注:斜体字母ATG柞蚕丝素蛋白基因的起始密码子
根据与已知的天蚕丝素基因部分序列分析表明上面的柞蚕丝素基因5’端部分片段由CAAT box、TATA盒(Hogness box)、prim transcript、丝素蛋白的起始密码子ATG和部分结构基因及内含子所组成。通过比较发现,在124-506nt、796-1194nt和1216-1298nt处有高度同源性,同源率分别为91.6%、95%、95%。若转录起始点第一个核苷酸标为+1,则TATA盒位于-25处;CAAT盒位于-70处。
2)柞蚕丝素基因3’端序列的克隆
mRNA的分离纯化取柞蚕五龄幼虫第5天的后部丝腺,在液氮中碾成粉末,按照TRIzol提取试剂盒说明书提取总RNA。然后按照QuickPrep mRNAPurification Kit操作手册进行mRNA的分离纯化。产物溶于10μl经过DEPC处理的无RNase Free的dH2O中保存备用。
反转录反应 按照宝生物工程(大连)有限公司提供的3’-Full RACE CoreSet试剂盒的说明进行,反应物组成如下:
10xRNA PCR Buffer 21
MgCl2(25mM) 41
dNTP Mixture 21
AMV Reverse Transcriptase XL(5U/1) 11
RNase Inhibitor(40U/1) 0.51
OligodT-3sites Adaptor Primer(2.5M) 11
Total RNA 11
RNase Free dH2O 8.51
Total 201反应条件为:30℃10分钟,50℃30分钟,然后加热到95℃5分钟,最后冷却到5℃5分钟。
PCR扩增反应在上述反转录产物中加入10x Ex Taq Buffer(Mg2+ Plus)10μl,dNTP Mixture 8μl,TaKaRa Ex Taq酶0.5μl,上游特异引物Ps+(5’-G TCT AGA GGT ACC AGA CGA GCA GGC CAT GAA CGT GCT-3’,引物设计参考GeneBank公开的柞蚕部分丝素基因序列:Acces s ion No.D83241)1μl,3sitesAdaptor Primer 1μl,dH2O 59.5μl,总体积为100μl。94℃变性30秒,55℃退火30秒,72℃延伸2分钟,40个循环后72℃延伸10分钟。
PCR扩增产物经低熔点琼脂糖凝胶电泳法回收纯化后,在T4 DNA连接酶作用下与pDM18-T载体连接得到质粒pMDAfib3,转化DH5α感受态细胞。提取DNA进行酶切鉴定,并分析3’端序列分析如下:
注:黑框内的TAA柞蚕为丝素的终止密码子:黑体下划线部分为3’UTR的加尾信号
采用3’RACE方法从中国柞蚕品种741五龄幼虫后部丝腺的mRNA中克隆的柞蚕丝素基因3’端片段长1.4kb。经过序列分析及开放读码框分析证实,所克隆的基因片段与已知序列的同源性为85%,3’端在1311bp处为终止密码子,在它的第1372 bp处有一个3’UTR的加尾信号AATAAA,与3’末端的poly(A)尾相距25个核苷酸。
2、组建柞蚕丝素基因转移表达载体
采用PCR方法从质粒pMDAfib3上克隆到含有3’UTR及加尾信号AATAAA的DNA片段并克隆到pMDAfib3质粒上的柞蚕丝素基因3’端片段上游的XbaI位点,构成质粒pMDAFib33。再利用PCR方法从pMDAfib5上分别克隆到两个基因片段,其中一个去掉柞蚕丝素蛋白基因起始密码子ATG及后面的部分;另外一个保留信号肽及内含子序列,只去掉成熟丝素蛋白基因序列,克隆到pMDAFib33的XbaI位点,构成FG1和FG2两个转移表达载体。将绿色荧光蛋白基因克隆到两个载体的SmaI和XbaI位点上,获得两个含有绿色荧光蛋白基因的质粒FG1/GFP和FG2/GFP。
3、外源基因在昆虫细胞-柞蚕细胞系中的表达
在35mm的细胞培养板中,接种柞蚕细胞1×106,加入3ml含10%的FBS的TC-100细胞培养基后27C培养24小时。取15u1的Cellfectin试剂加入100毫升无血清培养基中,另取2ug重组DNA加入100毫升无血清培养基中。将两溶液混合后放置30分钟。同时用无血清培养基清洗细胞两次。加入800毫升无血清培养基及上述混合液。27C培养8小时后,移去培养基,换含10%的FBS的TC-100细胞培养基后继续培养24小时后开始在荧光显微镜下观察。
结果在步骤2中构建的两个含有绿色荧光蛋白基因的质粒FG1/GFP和FG2/GFP质粒转染柞蚕细胞后,发现有绿色荧光的细胞从转染后24小时开始出现,48小时细胞的荧光强度最大。本实验证明利用柞蚕丝素基因的5’端与3’端及部分结构基因构建的基因转移表达载体能够在昆虫细胞内表达外源基因,为下一步的工作提供依据。
4、外源基因导入柞蚕卵
方法一:柞蚕滞育蛹经过体表消毒后解剖,找到雄蚕睾丸,将经过脂质体处理的携带外源基因绿色荧光蛋白的FG1/GFP和FG2/GFP的质粒DNA(1ugDNA+30ul脂质体,混匀后室温放置30分钟)注射到睾丸内,每个睾丸注射2ul。点滴抗生素后用蜡将体表伤口密封,使其正常发育,采用常规方法与雌蛾交配制种。产卵后孵化养蚕。检测其所产卵孵化而成的后代个体是否携带外源基因。
方法二:将携带外源基因绿色荧光蛋白的FG1/GFP和FG2/GFP质粒经过脂质体处理(1ugDNA+30ul脂质体,混匀后室温放置30分钟)注射到处女蛾交配囊,然后让其与雄蛾交配,使其产卵孵化。检测其所产卵孵化而成的后代个体是否携带外源基因。
5、携带外源基因的后代个体检测及表达产物的检测
取柞蚕幼虫血淋巴20ul,加液氮研磨成粉状,加入提取缓冲液200ul,再加入蛋白酶K 5μg/ml,65℃4h,用同体积酚抽提2次,上清用异丙醇沉淀,干燥后溶于400μl TE中,分别用酚、酚/氯仿、氯仿各抽提一次,乙醇沉淀干燥后溶于20μl TE中加入RNase 5μg/ml 37℃保温30min备用。
根据后代个体所携带的外源基因序列(绿色荧光蛋白)合成特异性引物,进行PCR特异性扩增检测,所得结果通过与对照比较即可确定,同时也可对扩增产物进行序列测定分析进一步对转基因个体进行验证。
解剖摘取柞蚕五龄幼虫第5天的后部丝腺,在长波长紫外光下观察,发现有绿色荧光产生。将该丝腺在液氮中碾成粉末,按照TRIzol提取试剂盒说明书提取总RNA和蛋白质。然后通过Northern blot和Western blot对表达产物进行检测和确定。
在本发明的实施例中,柞蚕的丝素蛋白与家蚕不同,它的蛋白分子是由一条单链构成的。因此,本发明的实施例采用同源重组的技术将外源基因GFP导入的同时也就将柞蚕丝素基因敲除掉了。当外源基因GFP被表达时表达的是一个纯合的基因产物。同时,表达的绿色荧光蛋白经过修饰后能够分泌柞蚕的丝腺中,因此在长波长紫外光下观察,发现有绿色荧光产生。柞蚕的个体大,所以它的丝素基因的启动子非常强大,外源基因产物产量高。由于外源基因产物被直接分泌到柞蚕的丝腺内,所以表达产物的纯化非常简单。
核酸序列表.seq<110>大连理工大学<120>一种应用同源重组法获得转基因柞蚕生产目的蛋白的方法<140>02144699.7<141>2002-12-03<160>2<210>1<211>1303<212>DNA<213>柞蚕(Antheraea pernyi)<220><223>柞蚕丝素基因5’端片段序列<400>1aaattcttta caacttcatt agaatacgtc gatttttctc tacttcatat aaatattcta 60tagatgtgtt tgctatataa atactttaaa aaaaatgtct caacggttgt gaaaactgtc 120aaaatctgtt gcgtagttca gaaaaactaa ggaaacacac aaacatacag aaaatttatt 180ttacaaaagt acggagatat ataaaaatat ttcgattact ttagaattac aataaaacta 240tttgacaatt tgattgcaaa tatagaccat gacaacacca catctttgtt atctaaaaca 300cgtagcgaca acactccttg aacgttgttc gaggattact acgatagttg gcggtttttt 360ttccgcaccg caagaaaaga gtagaaatgt accgtattta aatccagtgc ggaaattttc 420acgcagaatt cgtttccata caattctata ggttacatat cttgcggaaa taaattcgtg 480ccaaaaagcc gaagtgcggg gactaataaa gattttattt ggcattcctt ctaaccttta 540gatataaatt tctgtacgcg cgtatgtcac tgaactcccc ctaaacggct ggactaattt 600tgatgaaatt ttgtttgtgt gttccagtgg atccgagaat agttcagatt cacaaatgga 660gccggtaggt gacgccgcgg ttgactttta gattttttta aattatcaac aacaacgtcc 720gcccggcccg ctagttatgt atgtatttgt aaatgtaatc tcaaaccgtt cctgttggat 780cgacatttaa tatgtttaag tgaattaatt aacgtataac agtcataaga aaatattgca 840ataaaatccc atcatttatt ctttagagac aatataacca aacaacaata agaatcagaa 900tgtaattact gtacattgtt catgataggg gtttaactat gatattgttt taattctata 960ggattcatta ctttatcatt ttatcaatat ttaaaattgt ttatttgaaa tagttaacga 1020cattacaaag ttttcgtata aaagggcgcc aaagtctggt ctcattatca gttcggttcc 1080agctctcata accatgagag taatagcctt cgtgatcttg tgctgcgctt tgcaggtgag 1140ttccaacatt tatttaaata ttttcataat atgcaaatgt tccacacgct tataatttta 1200aataattatt ttttaatggt gaaaataaag caatatagat ttcaattact tacagtatgc 1260aactgctaaa aatttacgtc accacgacga atacgtagac aat 1303<210>2<211>1390<212>DNA<213>柞蚕(Antheraea pernyi)<220><223>柞蚕丝素基因3’端片段序列<400>2gcaggaagtg cagcagcagc cgcagcagct gcagcagcag ccgcttcagg tgctggaaga 60tcaggcggta gttacggatg gggtgatggc ggttatggtt ctgactcagc ggcagcagca 120gcggcggcag cagcagcagc agccgcttca ggttctggag gatcaggtgg ttatggcggt 180tatggcggct acggttcaga ctcagcggca gcagcggcgg cagcagcagc agcagccgct 240tcaggtgctg gaggagcagg cggttatggc ggttatggcg gttatggcag ttatggttcg 300gactcagcgg cagcggcagc agcagcagca gcggcggcag gctcaggtgc tggaggagta 360ggtggtggct atggatgggg cgatggcggt tatggttctg actcagccgc agcagcagca 420gcggcggccg cagcagcggc cggctcgggt gctggaggac gacgtggtta tggcgcttac 480ggttcagact catcggcagc agctgcagca gcagcagcag ccgcttcagg tgcgggagga 540
核酸序列表.seqtcaggcggtg gttacggatg gggcgatggc ggttacggtt cagacccagc ggccgcggca 600gcagctgcgg cagcagcagc agcagcagcg ggctcaggtg ctggaggaat aggcggtggt 660ttcggacgag gtgacggtgg ttatggttca ggctcatcgg cagcagcagc agcggcggcg 720gcggcggcgg ctgcaagacg agcaggtcac ggacgttctg caggaagtgc agcagcagca 780gcagctgctg cagctgcagc ggctgcctca ggtgctggtg gatcaggcgg tagttatgga 840tgggactatg aaagttacgg ttctggctca gcggcagcag cagctggctc aggtgctgga 900ggatcaggcg gtggttatgg atggggtgac ggcggttatg gttcaggttc ttctgcggca 960gcagcagcag cagcggcggc ggcggcagga tcaagacgct cagggcatga tcgtgcatat 1020ggagcaggaa gtgctgcagc cgcagcagca gcagctgccg ctggcgcagg ggctagtcga 1080caagtcggaa tttatggaac agacgatggc ttcgtattag atggaggtta cgattcagag 1140ggatcagcgg cggcggcggc agcggcagca gcagctgcgg cgtcatcaag tggtagatct 1200actgaaggtc atccacttct ttcgatatgc tgcaggccgt gttctcacag tcatagctat 1260gaagcttcca gaatttccgt ccactaatta aatacgaatg tgatttcctc tatatttgac 1320cggatacctt ttattttatt tctttatcaa taaataacag catgtgatga gtgcacacaa 1380aaaaaaaaa 1390