一种编码蛛丝蛋白的基因及其应用 【技术领域】
本发明涉及基因工程领域中一种蛛丝蛋白基因及其编码的蛋白质与应用,特别涉及一种人工合成的蛛丝蛋白基因及其编码蛋白质与在制备转基因蛛丝棉中的应用。
背景技术
具有4亿年进化史的蜘蛛丝,其牵引丝的拉断强度和弹性强度分别是体重的6倍与2倍,也分别是蚕丝的3倍与2倍,是自然纤维材料中的精品,给人类以无限的启示,吸引着众多学者投身于蛛丝蛋白的研究。蜘蛛丝是以纤维状蛋白质为结构基础的微纤丝,其优越的机械特性是包括蚕丝在内的天然及合成纤维所不能比拟地,由于蛛丝的坚韧性超过钢丝,因此被人们誉为‘生物钢’。蜘蛛丝不仅比重小,非常适用于飞机、降落伞、跑车、防弹衣等航空航天、军工领域;而且还具有与人体互不排斥的优良特性,可用于人工肌腱、韧带等组织器官的修复材料,也可在眼科或神经外科手术中用作缝合线。在众多的蜘蛛丝中,蜘蛛的拖丝(spider dragline)尤其令人注目,它在强度(strength)、弹性(Elasticity)、断裂能(energy to break)等物理性能上均比尼龙-6、凯夫拉II(Kevlar II,用来制造防弹衣的材料)都要高出许多(Gosline JM et al.J.Exp.Biol.1999,202,3295-3303)。拖丝主要含有2种蛋白质组分,分别称为MaSP-1和MaSP-2,其主要基因序列已被鉴定。与许多纤维蛋白一样,MaSP-1和MaSP-2中都含有高度重复的结构单元,MaSP-1的重复单元含有2个β片层和1个α螺旋结构,而MaSP-2含有1个β片层和2个β转角结构(Xu M.and Lewis R.V.,Proc.Natl.Acad.Sci.U.S.A.1990,87,7120-7124;HinmanM.B.and Lewis R.V.,J.Biol.Chem.1992,267,19320-19324Lazaris A.et al.Science.2002,295,472-476)。利用克隆或合成的蛛丝蛋白基因已在大肠杆菌中表达成功,其丝蛋白的性质与天然丝蛋白不相上下(Fahnestock S.R.and Irwin S.L.,Appl.Microbiol.Biotechnol.1997,47,23-32;Fahnestock S.R.and Bedzyk L.A.,Appl.Microbiol.Biotechnol.1997,47,33-39;Arcidiacono C et al.Appl.Microbiol.Biotechnol.1998,49,31-38);最近自然杂志附刊生物技术发表了蛛丝蛋白基因在烟草和马铃薯种表达成功,表达量至少可达可容性蛋白的2%(SchellerJ et al.Nat.Biotechnol.2001,19,573-577);而且还有该基因在哺乳动物细胞中表达的报道(Lazaris A.et al.Science.2002,295,472-476)。尽管这些研究都是为了生产蛛丝蛋白,而不是为了改变转基因生物的特定性状,但这些研究为蛛丝蛋白在其它生物中的高效表达奠定了基础。
我国是个产棉大国,每年种植6000~8000万亩,产量450万吨左右,但目前棉花的纤维品质无论在强度、长度,还是在细度、均匀度方面都还有待改进,特别是随着纺织机械的更新,对棉纤维强度提出了更高要求。由于棉花品种内在本质对种植地域环境的要求,不能直接将国外的优良棉花品种拿来就用,必须经育种专家改造后方可推广应用。这个改造过程往往是漫长的,而且由于优良品质性状常常与不良性状连锁,极大地限制了常规育种技术有效快速地育出优良新品种的进程。随着分子生物技术的快速发展,基因工程技术可望打破优良品质性状与不良性状连锁,操作单个基因或几个基因,加速培育优良棉花新品种的进程(张天真.棉花纤维品质分子育种的现状和展望.棉花学报,2000,12,321-326;刘进元,赵广荣,李骥.棉花纤维品质改良的分子工程.植物学报,2000,42,951-955)。采用先进的基因工程技术,对棉花进行转基因育种已经取得成功,例如转基因抗虫棉、抗溴苯腈和抗草甘膦棉、彩色棉、转聚羟基丁酸(PHB)棉花等品种[Perlak,et al.Bio/Technology,1990,8,939-942;Mcbride SC et al.CN118952A(Patent,1998)]。国内外的研究结果表明,使外源基因在棉花中高效表达是可行的。
发明创造内容
本发明的目的是提供一种蛛丝蛋白基因及其编码蛋白质。
本发明所提供的蛛丝蛋白基因名称为GhSp2,是基本上由15-30个重复单元组成的核苷酸序列,所述重复单元是下列核苷酸序列之一:
(1)序列表中的SEQ ID №:1;
(2)编码序列表中SEQ ID №:2蛋白质序列的多核苷酸;
(3)与序列表中SEQ ID №:1限定的DNA序列具有90%以上同源性,且编码相同功能蛋白质的DNA序列。
所述重复单元优选的是序列表中的SEQ ID №:1。SEQ ID №:1是由105个核苷酸组成的寡核苷酸序列,编码SEQ ID №:2的短肽,SEQ ID №:2由35个氨基酸残基组成。
蛛丝蛋白基因GhSp2优选的是由20个重复单元组成的核苷酸序列,可以是下列核苷酸序列之一:
(1)序列表中的SEQ ID №:3;
(2)编码序列表中SEQ ID №:4蛋白质序列的多核苷酸;
(3)与序列表中SEQ ID №:3限定的DNA序列具有90%以上同源性,且编码相同功能蛋白质的DNA序列。
序列表中的SEQ ID №:3核苷酸序列由2112个碱基组成。
一种蛛丝蛋白,是下列氨基酸序列之一:
(1)序列表中SEQ ID №:4;
(2)序列表中SEQ ID №:4经过一个或几个氨基酸残基的取代、缺失或添加且编码相同功能蛋白质的氨基酸序列。
序列表中的SEQ ID №:4由703个氨基酸残基组成。
含有上述基因的细胞系和载体均属于本发明的保护范围。通过基因工程技术可以获得上述基因的表达载体和转化载体,例如转化载体pGBISP2G(棉花转化载体)。
上述蛛丝蛋白基因的表达盒也属于本发明的保护范围,如表达盒pUC-E6-SP2-Tnos和pUC-E6-FGP-Tnos。
利用转基因技术,将本发明构建的蛛丝蛋白基因的转化载体转入棉花植株,置于棉花纤维特异表达启动子的控制之下,可使其特异地在棉纤维细胞中高效表达来改善棉纤维的强度。将蛛丝蛋白卓越的物理性能用于棉纤维品质的改良,无疑是一件既具有重大经济效益,对研究棉纤维形态建成又具有重要理论意义的工作,可望解决我国原棉纤维品质不适应高支纱和现代纺织工业要求的问题。用本发明的方法培育出的将是一种新型的棉花纤维,不仅会为农民提供符合纺织要求的棉种,而且会为纺织工业提供符合要求的棉纤维,在棉花种子和棉纤维两个市场都会创造巨大的经济效益。获得的转基因棉所形成的新型棉花纤维,或者说是一种新的生物材料,具有巨大的潜在应用价值。
【附图说明】
图1是图解显示合成的蛛丝蛋白基因的单个重复单元的拼接、补平及克隆
图2是图解显示20个重复单元蛛丝蛋白基因的构建
图3为蛛丝蛋白基因表达盒的构建示意图
图4为GFP报告基因表达盒的构建示意图
图5图解显示GhSp2棉花转化载体pGBISP2G的构建
图6A为编码蛛丝蛋白基因的单个重复单元的电泳图谱
图6B为含GhSp2单拷贝重复单元的质粒双酶切的电泳鉴定图谱
图6C为含GhSp2双拷贝重复单元的质粒PCR鉴定的电泳图谱
图6D为含GhSp2 10个重复单元的质粒的PCR鉴定的电泳图谱
图7A为含GhSp2 20个重复单元的质粒单酶切(泳道1)、双酶切(泳道2)和PCR鉴定(泳道3)的电泳图谱
图7B为含GhSp2表达盒的质粒双酶切鉴定的电泳图谱(泳道4-6)
图7C为含有GhSp2和GFP两个基因表达盒的质粒双酶切鉴定的电泳图谱(泳道8-9)
图8显示棉花转化过程中的几个具体步骤
图9为抗卡那霉素植株(叶片正常,A)和不抗卡那霉素植株(叶片出现枯斑,B)
图10为卡那霉素抗性株的PCR检测电泳图谱
图11为转蛛丝蛋白基因棉花的点杂交电泳图谱
【具体实施方式】
实施例1、绿色荧光蛋白报告基因表达盒的构建
绿色荧光蛋白报告基因表达盒的构建过程如图4所示,具体分为以下几步:
1)绿色荧光蛋白基因(GFP)的克隆
绿色荧光蛋白最初是从多管水母(Aequorea victoria)中发现的一种蛋白质。本发明使用的是将正常GFP的第65位的Ser突变为Cys,从而使GFP在植物细胞中的荧光强度提高了十几倍的绿色荧光蛋白基因中的一个突变型(GFP-2)(Christoph Reichelet al.Proc.Natl.Acad.Sci.USA 1996.93,5888-5893)。根据该基因的序列,合成两条引物,即GFP-2-P1:5’-CAG GAT CCA TGA GTA AAG GAG AAG AAC-3’和GFP-2-P2:5’-GAG CTC GGT AACCTTA TTT GTA TAG TTC ATC C-3’,按常规方法从质粒扩增出绿色荧光蛋白基因,两端引入了BamHI和SacI酶切位点;然后将扩增产物按常规方法连接到pMD-18-T-vector(Takara公司产品)上,转化大肠杆菌菌株JM109感受态细胞,筛选获得的重组质粒记作pMD-GFP。
2)克隆E6启动子
E6基因是棉花在纤维伸长发育过程中高丰度表达的基因,根据已公开的专利(United States Patent,5495070,Feb.27,1996)中的序列设计了两条引物:E6-1:5’-AAG CTT AAA TTA TAG CAT ACC TCA CGA TGT-3’和E6-2:5’-GGA TCC CAT GGCTAT GGT TGC TAA TGC T-3’,按照常规PCR方法,从棉花品种中棉所12中扩增出E6基因的启动子序列约600bp,并在其两端引入了Hind III和BamH I酶切位点,连接到pGEM-T-vector(Promega公司)上,转化大肠杆菌菌株JM109感受态细胞,筛选获得的重组质粒记作pGEM-E6。序列分析结果显示,与上述美国专利所报道的序列相比,中棉所12棉花品种基因组中所携有的E6启动子序列的170和182位分别是G和A,而不是C和C。
3)来源于双元载体pBI121.1的Nos终止子的克隆
利用SacI和EcoRI两个限制酶从双元载体pBI121.1(物理图谱见图5)切下Nos终止子,并按照常规方法连接到pUC18上转化大肠杆菌菌株JM109感受态细胞,筛选获得的重组质粒记作pUC-Tnos。
4)GFP表达盒的构建
用HindIII和BamHI两个限制酶分别双酶切pGEM-E6和pUC18,将切下的E6启动子片段和切开的载体pUC18按照常规方法连接,并转化大肠杆菌菌株JM109感受态细胞,筛选获得的重组质粒记作pUC-E6。
然后利用BamHI和SacI两个限制酶分别双切pMD-GFP和pUC-E6,将切下的GFP片段和切开的pUC-E6质粒连接,并转化JM109感受态细胞,筛选获得的重组质粒记作pUC-E6-GFP。再利用SacI和EcoRI两个限制酶分别双切pUC-Tnos和pUC-E6-GFP,将切下的Nos终止子片段和切开的pUC-E6-GFP质粒连接,并转化JM109感受态细胞,经EcoRI和HindIII限制性内切酶的双酶切鉴定,筛选获得的含有GFP表达盒的重组质粒,定名为pUC-E6-GFP-Tnos。
实施例2、编码蛛丝蛋白基因的构建及其表达盒的构建
1、蛛丝蛋白基因的构建
蛛丝蛋白基因的构建过程,具体分为以下几步:
(1)根据发表的蛛丝蛋白基因的序列特征和棉花所偏爱的密码字,设计合成了两条寡核苷酸(由上海生物工程有限公司合成):(a)SP2-1,全长80nt,具有序列表中SEQ ID №:5的核苷酸序列;(b)SP2-2,全长59nt,具有序列表中SEQ ID №:6的核苷酸序列。
(2)如图1所示,上述两条寡核苷酸经72℃退火,rTaq酶(Takara)补平,其电泳检测结果如图6A(泳道1)所示,表明1SP2大小为111bp,在其两端引入了BglII(AGATCT)和BamHI(GGATCC)酶切位点。将该片段连接到pGEM-T-vector(Promega公司)多克隆位点的BglII和BamHI位点上,转化大肠杆菌JM109菌株,筛选获得的重组质粒含有蛛丝蛋白基因(GhSp2)的一个重复单位,记作pGEM-1SP2(图1)。如图1的pGEM-1SP2质粒图谱所示,在插入的单拷贝SP2片段的3’下游紧接着是一个SacI的克隆位点。利用BglII和BamHI双切pGEM-1SP2,获得105bp小片段(SP2单拷贝基因片段)和约3kb的pGEM-T-vector的大片段(如图6B所示,泳道2)。
(3)如图2所示,用BamHI和SacI双酶切pGEM-1SP2回收大片段,另一组用BglII和SacI双酶切pGEM-1SP2回收小片段,用DNA连接酶连接后,转化大肠杆菌JM109菌株,筛选获得蛛丝蛋白基因的双拷贝重复单位,该质粒记作pGEM-2SP2(图2)。双拷贝蛛丝蛋白基因重复单元的质粒pGEM-2SP2的PCR鉴定电泳结果如图6C(泳道3)所示,表明PCR产物约为260bp(双拷贝为210bp,再加上引物序列约为260bp)。本发明巧妙利用了BglII和BamHI是同尾酶的特性,将上述回收的大片段上的BamHI位点与小片段上的BglII位点准确对接,连接后此处的酶切位点消失。
(4)用BamHI和SacI限制性内切酶双切pGEM-2SP2,回收大片段(约3.1kb),再与(3)中回收小片段(1SP2片段)连接,转化大肠杆菌JM109菌株后,就可获得含有蛛丝蛋白基因的3个拷贝重复单位的重组质粒,记作pGEM-3SP2(如图2所示)。
(5)用BamHI和SacI限制性内切酶双切pGEM-2SP2,回收大片段(约3.2kb),另外用BglII和SacI双酶切pGEM-3SP2,回收小片段(3SP2片段),将获得的两种片段连接后,转化大肠杆菌JM109菌株,就可获得含有蛛丝蛋白基因的5个拷贝重复单位的重组质粒,记作pGEM-5SP2(如图2所示)。
(6)利用BamHI和SacI限制性内切酶双切pGEM-5SP2,回收大片段(约3.5kb),再用BglII和SacI限制性内切酶双酶切pGEM-5SP2,回收小片段(5SP2片段),将获得的两种片段连接,转化大肠杆菌JM109菌株,就可获得含有10个拷贝的蛛丝蛋白基因重复单位的重组质粒,记作pGEM-10SP2(如图2所示),其质粒PCR鉴定结果如图6D所示,泳道4单一条带的大小约为1.2Kb,表明结果正确。
(7)利用BamHI和SacI限制性内切酶双切pGEM-10SP2,回收大片段(约4.1kb),再用BglII和SacI限制性内切酶双酶切pGEM-10SP2,回收小片段(10SP2片段),将获得的两种片段连接,转化大肠杆菌JM109菌株,就可获得含有20个拷贝的蛛丝蛋白基因重复单位的重组质粒,记作pGEM-20SP2(如图2所示)。质粒鉴定结果如图7A所示,PCR扩增结果呈大小约为2.27kb单一条带(泳道3),同样用BamHI和SacI限制性内切酶双切pGEM-20SP2,获得约3.0kb和2.2bp两条带(泳道2),而用BamHI单酶切pGEM-20SP2,获得约5.2kb的条带(泳道1),表明结果正确。
2、蛛丝蛋白基因表达盒的构建
蛛丝蛋白基因表达盒的构建过程如图3所示,用BamHI和SacI两种限制性内切酶分别双切pGEM-20SP2和pUC-E6,切下约2.2kb蛛丝蛋白基因片段和切开的含E6启动子序列的pUC18载体,将二者连接后转化大肠杆菌JM109菌株,筛选获得了含有20个拷贝的蛛丝蛋白基因重复单位的表达盒,该重组质粒记作pUC-E6-20SP2。为了将Tnos终止子序列连接到20SP2的3’下游,采用SacI和EcoRI两种限制性内切酶酶切pGEM-20SP2回收大片段;同时用SacI和EcoRI两种限制性内切酶将pUC-Tnos的Tnos序列(如图3所示)切下,回收Tnos片段后与来自pUC-E6-20SP2的大片段连接,经筛选鉴定后获得如图3所示的蛛丝蛋白基因表达盒。含有蛛丝蛋白基因表达盒的重组质粒记作pUC-E6-SP2-Tnos。
实施例3、蛛丝蛋白基因转化载体pGBISPG的构建
转化载体的构建过程如图5所示,具体分为以下几步:
(1)为了获得所需的PstI位点,先用EcoRI酶切pUC-E6-SP2-Tnos,然后用T4 DNApolymerase补平;再用HindIII切下约3.0kb片段,该片段记作SP2-BOX;同时用HindIII和SmaI双酶切开pUC19,将SP2-BOX连接到pUC19,并转化大肠杆菌JM109菌株,获得的克隆含有蛛丝蛋白基因的表达盒,该质粒记作pUC-20SP2-BOX(图5)。
(2)采用HindIII酶切pUC-E6-GFP-Tnos,然后用T4 DNA polymerase补平,再用EcoRI切下约1.6kb片段,该片段记作GFP-BOX;同时用PstI切开pUC19-20SP2-BOX,用T4 DNA polymerase补平后,再用EcoRI切。然后将GFP-BOX与pUC-20SP2-BOX两片段上的EcoRI位点相连接,另一端则以平末端连接。转化大肠杆菌JM109菌株后,获得了含有蛛丝蛋白基因以及绿色荧光蛋白报告基因的两个表达盒的克隆,该重组质粒记作pUC-20SP2/GFP-BOX(图5)。含有蛛丝蛋白和GFP两个基因表达盒的质粒pUC-20SP2/GFP-BOX的双酶切(HindIII和EcoRI)鉴定结果如图7B所示,泳道4-6为3个阳性克隆质粒的双酶切琼脂糖凝胶电泳图谱,显示两条分别为2.7和4.6Kb的两条清晰带。
(3)利用HindIII和EcoRI两种限制酶分别双酶切pUC-20SP2/GFP-BOX和pBI121.1,将回收的含SP2/GFP表达盒的片段连接到切掉了GUS表达盒的pBI121.1大片段的HindIII和EcoRI位点上,并转化大肠杆菌JM109菌株。获得的目的克隆即含有所需要的棉花转化载体,该载体记作pGBISP2G,质粒结构如图5所示。含有蛛丝蛋白和GFP两个基因表达盒的质粒pGBISP2G的双酶切(HindIII和EcoRI)鉴定结果如图7C所示,泳道8和9均为2个阳性克隆质粒的双酶切琼脂糖凝胶电泳图谱,显示两条分别为4.6和11.7Kb的两条清晰带。泳道7用作对照,是pUC-20SP2/GFP-BOX双酶切(HindIII和EcoRI)结果,显示两条分别为2.7和4.6Kb的两条清晰带。
实施例4、蛛丝蛋白基因表达载体对棉花的遗传转化
1、蛛丝蛋白基因表达载体质粒DNA的分离纯化
质粒DNA的分离纯化用QIAGEN公司的Mega纯化试剂盒。具体实验方法如下:
(1)在新鲜平皿上挑取含蛛丝蛋白基因表达载体质粒的大肠杆菌单菌落,接种于5-10ml含100mg/L卡那霉素的LB液体培养基中,37℃,300rpm,培养约8小时。
(2)将上述培养的菌液按1/500-1/1000稀释后,37℃,300rpm,培养约12-16小时。
(3)将培养的2000ml新鲜菌液,6000rpm(JA-10,Beckman),4℃,离心15min收集菌体。
(4)用50ml P1 Buffer于500ml离心管中重悬菌体,充分裂解(涡旋或吹打)。
(5)加50ml P2 Buffer轻轻混匀,颠倒3-4次(但不要涡旋),室温放置5min(不要超过5min),且P2 Buffer加入后要立即盖紧离心管盖,防止空气中CO2进入使其酸化。
(6)加入预冷的P3 Buffer 50ml,立即混和,轻轻颠倒4-6次,冰浴30分钟。
(7)然后11500rpm(JA-14,Beckman),4℃离心30min,小心收取集上清。
(8)加35ml QBT Buffer平衡QIAGEN-tip 2500柱子。将(7)步的上清加入QIAGEN-tip 2500柱子,收集通过柱子的液体。注意(7)步的上清不能放置时间太长,否则上清混浊,需要重新离心。
(10)用200ml QC Buffer洗柱,收集洗柱液,若用大的培养液体积或含糖多的菌株需要二次洗柱。
(11)用35ml QF Buffer从柱上洗脱DNA,收集洗脱液。
(12)将收集的洗脱液转移到两个50ml离心管中加0.7体积的室温的异丙醇沉淀DNA,混和后立即12000rpm,4℃离心30min,小心弃上清,可看到较松的玻璃状沉淀。
(13)加入室温保持的70%乙醇,12000rpm,4℃离心30min,小心弃掉70%乙醇。
(14)室温干燥沉淀10-20min,用适当体积的灭菌纯水溶解DNA。
(15)分别用琼脂糖凝胶电泳和UV分光光度计对质粒DNA进行定性定量分析。在0.7%的琼脂糖凝胶电泳上观察到单一条带,表明质粒的纯度和质量都很好。用UV分光光度计质粒DNA的定量分析,结果每升培养液提取到约120μg-200μg的质粒(pGBISP2G)DNA。
2、质粒DNA导入棉花的遗传转化
编码蛛丝蛋白的合成基因在棉花纤维细胞中的高效表达是制作蛛丝棉的关键,而外源基因能否成功转化棉花是蛛丝棉制作过程中至关重要的环节。子房注射外源基因的转化方法,由于简单、快速、有效,且不受棉花基因型的限制,为本领域技术人员所熟知。本发明采用子房注射外源基因的转化方法,成功的将蛛丝蛋白基因转化棉花,获得了具有棉花纤维强度明显改善的棉花植株。
本发明用于转化的棉花品种为中国农科院棉花研究所培育的优良品种中棉所12。成熟的棉花植株,一般在早晨开花授粉,花粉萌发形成的花粉管通过珠孔和珠心孔道进入胚囊,释放精核完成双受精后,珠心孔道逐渐关闭。在受精后的一段时间内,受精卵细胞的质膜较松,初生细胞壁尚未健全,在形态上近似于裸露的原生质体,极易吸收外源DNA。为保持品种(系)的相对纯度,选择次日将要开花的花苞用线扣紧,致使花瓣不能展开,进行自花授粉,避免外源花粉的传粉异交。如图8中的A部分所示,棉花开花当天的花为白色,开花后次日的花为粉红色。选择开花后16~24小时的花冠呈粉红色的棉花自交花朵,将幼铃上的花瓣连同雄蕊一起剥去,再抹去顶端的花柱后,用微量注射器吸取预冷的目的基因溶液,沿纵轴向下插入至幼铃大小的约一半处(如图8的B部分所示),然后往上提升至约三分之一处,缓慢将注射器内浓度约为20μg/ml的蛛丝蛋白基因表达载体质粒DNA水溶液(约10μl)注入插入空隙内。注入之后,目的基因DNA分子将沿着珠孔和珠心孔道向受精胚囊内扩散,最终完成向棉花基因组的整合;另一方面将注射目的基因的幼铃所在枝条的顶端摘掉,保持幼铃的充分营养,以防止幼铃脱落,利于提高成铃率和种籽的发育。
实施例6、棉花转蛛丝蛋白基因植株的抗性筛选与PCR检测
本发明要求蛛丝蛋白基因在棉花纤维细胞中高效表达,所以选用了在棉花纤维细胞中特异表达的E6基因的启动子。注射后的一朵花可能会结出几十粒棉籽,但真正整合外源基因的种籽的概率一般小于1%,所以在棉花幼苗期要进行严格的初筛。为了在幼苗期能进行筛选,本发明利用了pBI121.1上的由35S启动子驱动的卡那霉素抗性基因(NPTII)。卡那霉素抗性基因表达盒位于蛛丝蛋白基因表达盒的5’上游(图5)。如图5所示,卡那霉素抗性基因表达盒、蛛丝蛋白基因表达盒和GFP表达盒从5’向3’方向依次排列,两端是T-DNA的右边区(RB)和左边区(LB)。一般情况下左右边区之间的DNA片段会一起整合到植物基因组上的某一位点。这样若在幼苗期检测到卡那霉素抗性,也检测到卡那霉素抗性基因,那么该植株就有可能也在同一位点整合有可在棉纤维形成期高效表达的蛛丝蛋白基因表达盒和GFP表达盒。所以本发明将转基因棉花种籽的T0代幼苗进行了卡那霉素抗性检测及卡那霉素抗性基因的PCR检测。
具体分为以下几步:
1、棉花转蛛丝蛋白基因植株的抗性筛选
用微量注射器将携带蛛丝蛋白基因的表达载体质粒DNA溶液注射自花受粉后的棉花子房,采收注射过蛛丝蛋白基因表达载体质粒DNA溶液的吐絮棉花。将收获的棉花单独扎花,扎花后的种子硫酸脱绒,再用水漂洗,直至无硫酸残留。然后摊开晾干。硫酸脱绒的种子重量为2900克,每100粒种子平均重10.7克,即注射过外源基因的种子约27100粒。密播播种后地膜覆盖,出苗后人工破膜,使棉苗及时露出地膜,以免棉苗被中午膜内气温过高伤害(如图8的C部分所示,为转化蛛丝蛋白基因棉花种子播种的棉花幼苗)。调查统计棉花成苗数,总计19605棵,成苗株约占播种棉花种子数的72.34%。
由于携带蛛丝蛋白基因的表达载体质粒也携带有NPT II基因,因此具有外源DNA转化的棉苗应具有卡那霉素抗性,而没有得到转化的棉苗就不具有对卡那霉素抗性。出苗后15天第一次用浓度为1000ppm的卡那霉素溶液于早晨或傍晚点滴于棉花幼苗生长点旁的幼叶(如图8的D部分所示)。几天后可观察到绝大部分幼苗的新生叶上出现对卡那霉素过敏反应的黄色斑块,并将这些幼苗拔除。而对没有出现黄色斑块的幼苗,则继续用浓度为1000ppm卡那霉素溶液进行第二次点滴,然后再拔除去那些出现对卡那霉素过敏反应黄色斑块的幼苗。对没有表现任何反应的幼苗继续再用浓度为1000ppm卡那霉素溶液进行第三次点滴,同样若幼苗新生叶上出现黄色斑块,则将其去除。每次点滴都用未经过基因注射的幼苗做对照。经过3次卡那霉素溶液点滴新生叶片,初步筛选出抗卡那霉素的植株。如图9所示,A为抗卡那霉素棉株,B为不抗卡那霉素棉株(显示点滴过的叶片上的枯斑)。结果有151株棉苗对卡那霉素呈抗性反应,表明这些棉花植株可能获得了卡那霉素抗性基因的转化。
2、棉花转蛛丝蛋白基因植株的PCR分子检测
对卡那霉素呈现抗性反应的阳性植株,选其幼嫩叶片,用CTAB方法提取基因组DNA后,用卡那霉素基因特异引物,进行PCR分子检测。
棉花基因组DNA的分离纯化步骤为:
(1)将约0.2g未展开的幼叶放入预冷的研钵中,加入液氮研磨成细粉后,转入预冷的2ml离心管中。
(2)加入1ml的提取缓冲液(0.35M Glucose,0.1M Tris-HCl,5mM EDTA,2%PVP-40,3%(V/V)β-Me),涡旋混匀,冰育10min。
(3)6000rpm,4℃离心5min,弃上清。重复(2)和(3)操作两次。
(4)于沉淀中加入0.8ml 65℃预热的裂解缓冲液(1.4M NaCl,0.1M Tris-HCl,20mM EDTA,2%CTAB,2%PVP-40,3%(V/V)β-Me),颠倒混匀,65℃温浴45min。
(5)加入0.8ml的氯仿∶异戊醇(24∶1),轻轻颠倒翻转混匀后,8000rpm,室温离心20min,将上清转入2ml的离心管中。重复(5)操作一次。
(6)加0.7体积的异丙醇,缓慢翻转混匀,静置10min。
(7)挑出絮状沉淀的DAN,用70%的乙醇洗涤浸泡。自然干燥后加0.5ml TE溶解沉淀。
(8)加1μl 1mg/ml RNase后,37℃温育1h。
(9)加等体积的酚∶氯仿(1∶1),缓慢翻转混匀,室温静置5分钟。
(10)10,000rpm,离心15min。上清液转入1.5ml离心管中。
(12)重复(9)和(10)操作一次。
(13)加等体积的氯仿∶异戊醇(24∶1),缓慢翻转混匀,室温静置5分钟后,10,000rpm离心15min。上清液转入1.5ml离心管中。
(14)加0.1体积的3M醋酸钠(pH5.2)和2体积的乙醇后,翻转混匀,放置30分钟。
(15)挑出絮状沉淀的DAN。用70%乙醇洗后,自然干燥DNA。加适量的TE缓冲液(pH8.0)溶解DNA。
(16)分别用UV分光光度计和琼脂糖电泳对DNA定量,4℃保存备用。
卡那霉素基因的PCR分子检测的方法为:
设计的卡那霉素基因的二条PCR引物分别为5’-GACTGGGCACAACAGACAAT-3’和5’-GATACCGTAAAGCACGAGGA-3’。PCR反应体系包含10×ExTag buffer 5μl,dNTP(2.5mM)4μl,引物(浓度5μM)分别为2μl,模板DNA 1μl(约5ng),Tag酶0.5μl,加ddH2O至总体积50μl(PCR试剂盒为TaKaRa公司产品)。反应程序为:94℃预变性5min后,94℃ 30s,60℃ 30s,72℃ 1min进行30个循环,72℃延伸10min。PCR产物用1%琼脂糖凝胶电泳,溴化乙锭染色后,凝胶成像系统观察拍照。
经抗性筛选出的151株卡那霉素抗性株,PCR检测结果表明其中141株扩增出预期的产物片段(约670bp),有10株没有扩增出目的带。部分结果如图10所示,图中,M为Marker,1-7依次表示卡那霉素抗性株K129-K137。从图中可以看出,从卡那霉素抗性株K131和K133基因组中没有能扩增出目的带。尽管进行了3次卡那霉素溶液的点滴检测,还是出现了一定的假阳性,但是卡那霉素溶液的点滴鉴定极大地方便了外源基因转化植株的早期筛选。
实施例7、转棉花植株的蛛丝蛋白基因的点杂交鉴定
本发明优选的蛛丝蛋白基因为20个重复单位,在实施对卡那霉素基因PCR检测初步确定的转基因植株的基础上,又用点杂交对初步认定的转基因植株中的蛛丝蛋白基因进行了分子鉴定。
1、棉花基因组DNA的分离纯化方法与实施例6中的方法相同
2、转蛛丝蛋白基因棉花植株目的基因的点杂交鉴定
对NPTII基因经PCR检测呈阳性的141植株,进行点杂交,以鉴定这些转基因植株基因组中是否整合了转入的蛛丝蛋白基因。
点杂交采用Northern2Southern试剂盒(Peirce,USA)进行。具体实验方法如下:
1)探针制备
(1)从中间载体(pGEM-1SP2)质粒DNA经BalII和BamHI酶切,琼脂糖凝胶电泳回收蛛丝蛋白基因单拷贝片段,配制成水溶液(10ng/μl),在沸水中煮沸10分钟后,立即冰上放置5分钟。
(2)取10μl目的基因变性的DNA溶液(10ng/μl,100ng)于另一离心管中,分别加10μl的HEP Label和10μl的Reaction Buffer,混合后50℃温育15分钟。
(3)加30μl的enzyme stabilizer轻轻混合,探针浓度为约1.6ng/μl,立即使用或冰冻存放。注意在加酶稳定剂之前,不要将混合物放置冰上。
2)点膜
(1)将基因组DNA溶液(1μg/μl)在沸水中煮沸10分钟后,立即冰上放置5分钟。
(2)将尼龙膜(Hybond-N+,Amershman,UK)于无菌水中浸湿,半干时点膜,每点点5μl(1μg/μl)。
(3)将点好的膜凉干后,在1×TE中漂洗。
(4)将膜80℃烘烤2小时,密封冷藏备用。
3)杂交
(1)分别将North2South试剂盒的杂交缓冲液Part1 5ml和Part2 5ml加入杂交管中,放入杂交炉待温度上升到55℃温育5min。
(2)将点好样的杂交膜在55℃的0.1%SDS中浸湿漂洗后,将杂交膜放入上述杂交缓冲液中,55℃预杂交15min以上。
(3)加60μl的HRP探针于杂交液中,55℃杂交1小时。
(4)用约50ml的2×SSC/0.1%SDS溶液在55℃洗膜3次,每次5min。
(5)2×SSC室温洗膜3次,每次5min。
4)底物显色
(1)将North2South试剂盒的Luminol和Peroxide等体积混合,配制成显色底物溶液。将杂交好的膜浸湿后放入培养皿中,用底物溶液覆盖,室温放置5min。
(2)将膜移至另一垫有滤纸的培养皿,凉干后用保鲜膜内包裹,再放入X光片盒中,压X光片,爆光5min(根据荧光强度灵活掌握爆光时间)。
(3)显影与定影。
部分点杂交结果参见图11。如图所示,供试的48份样品中,有14株出现杂交斑点,初步确定为携带有GhSp2基因的转基因植株,图中ck+表示阳性对照,ck-表示阴性对照植株,数字表示卡那霉素抗性植株。从141株卡那霉素抗性植株中,呈现点杂交阳性的有21株,表明这些卡那霉素抗性植株的基因组中成功整合了GhSp2基因。
序列表
<160>6
<210>1
<211>105
<212>DNA
<213>人工序列
<220>
<223>
<400>1
tctgctgcag ctgcagccgc tgcagctggt cctggaggttacggaccagg tcagcaagga 60
cctggtggat atggtccagg acagcaaggt ccttcaggtc ctgga 105
<210>2
<211>35
<212>PRT
<213>人工序列
<220>
<223>
<400>2
Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly Tyr Gly
1 5 10 15
Pro Gly Gln Gln Gly Pro Gly Gly Tyr Gly Pro Gly Gln Gln Gly
20 25 30
Pro Ser Gly Pro Gly
35
<210>3
<211>2112
<212>DNA
<213>人工序列
<220>
<223>
<400>3
atgggatctg ctgcagctgc agccgctgca gctggtcctg gaggttacgg accaggtcag 60
caaggacctg gtggatatgg tccaggacag caaggtcctt caggtcctgg atctgctgca 120
gctgcagccg ctgcagctgg tcctggaggt tacggaccag gtcagcaagg acctggtgga 180
tatggtccag gacagcaagg tccttcaggt cctggatctg ctgcagctgc agccgctgca 240
gctggtcctg gaggttacgg accaggtcag caaggacctg gtggatatgg tccaggacag 300
caaggtcctt caggtcctgg atctgctgca gctgcagccg ctgcagctgg tcctggaggt 360
tacggaccag gtcagcaagg acctggtgga tatggtccag gacagcaagg tccttcaggt 420
cctggatctg ctgcagctgc agccgctgca gctggtcctg gaggttacgg accaggtcag 480
caaggacctg gtggatatgg tccaggacag caaggtcctt caggtcctgg atctgctgca 540
gctgcagccg ctgcagctgg tcctggaggt tacggaccag gtcagcaagg acctggtgga 600
tatggtccag gacagcaagg tccttcaggt cctggatctg ctgcagctgc agccgctgca 660
gctggtcctg gaggttacgg accaggtcag caaggacctg gtggatatgg tccaggacag 720
caaggtcctt caggtcctgg atctgctgca gctgcagccg ctgcagctgg tcctggaggt 780
tacggaccag gtcagcaagg acctggtgga tatggtccag gacagcaagg tccttcaggt 840
cctggatctg ctgcagctgc agccgctgca gctggtcctg gaggttacgg accaggtcag 900
caaggacctg gtggatatgg tccaggacag caaggtcctt caggtcctgg atctgctgca 960
gctgcagccg ctgcagctgg tcctggaggt tacggaccag gtcagcaagg acctggtgga 1020
tatggtccag gacagcaagg tccttcaggt cctggatctg ctgcagctgc agccgctgca 1080
gctggtcctg gaggttacgg accaggtcag caaggacctg gtggatatgg tccaggacag 1140
caaggtcctt caggtcctgg atctgctgca gctgcagccg ctgcagctgg tcctggaggt 1200
tacggaccag gtcagcaagg acctggtgga tatggtccag gacagcaagg tccttcaggt 1260
cctggatctg ctgcagctgc agccgctgca gctggtcctg gaggttacgg accaggtcag 1320
caaggacctg gtggatatgg tccaggacag caaggtcctt caggtcctgg atctgctgca 1380
gctgcagccg ctgcagctgg tcctggaggt tacggaccag gtcagcaagg acctggtgga 1440
tatggtccag gacagcaagg tccttcaggt cctggatctg ctgcagctgc agccgctgca 1500
gctggtcctg gaggttacgg accaggtcag caaggacctg gtggatatgg tccaggacag 1560
caaggtcctt caggtcctgg atctgctgca gctgcagccg ctgcagctgg tcctggaggt 1620
tacggaccag gtcagcaagg acctggtgga tatggtccag gacagcaagg tccttcaggt 1680
cctggatctg ctgcagctgc agccgctgca gctggtcctg gaggttacgg accaggtcag 1740
caaggacctg gtggatatgg tccaggacag caaggtcctt caggtcctgg atctgctgca 1800
gctgcagccg ctgcagctgg tcctggaggt tacggaccag gtcagcaagg acctggtgga 1860
tatggtccag gacagcaagg tccttcaggt cctggatctg ctgcagctgc agccgctgca 1920
gctggtcctg gaggttacgg accaggtcag caaggacctg gtggatatgg tccaggacag 1980
caaggtcctt caggtcctgg atctgctgca gctgcagccg ctgcagctgg tcctggaggt 2040
tacggaccag gtcagcaagg acctggtgga tatggtccag gacagcaagg tccttcaggt 2100
cctggatcct ga 2112
<210>4
<211>703
<212>PRT
<213>人工序列
<220>
<223>
<400>4
Met Gly Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly
1 5 10 15
Tyr Gly Pro Gly Gln Gln Gly Pro Gly Gly Tyr Gly Pro Gly Gln
20 25 30
Gln Gly Pro Ser Gly Pro Gly Ser Ala Ala Ala Ala Ala Ala Ala
35 40 45
Ala Gly Pro Gly Gly Tyr Gly Pro Gly Gln Gln Gly Pro Gly Gly
50 55 60
Tyr Gly Pro Gly Gln Gln Gly Pro Ser Gly Pro Gly Ser Ala Ala
65 70 75
Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly Tyr Gly Pro Gly Gln
80 85 90
Gln Gly Pro Gly Gly Tyr Gly Pro Gly Gln Gln Gly Pro Ser Gly
95 100 105
Pro Gly Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly
110 115 120
Tyr Gly Pro Gly Gln Gln Gly Pro Gly Gly Tyr Gly Pro Gly Gln
125 130 135
Gln Gly Pro Ser Gly Pro Gly Ser Ala Ala Ala Ala Ala Ala Ala
140 145 150
Ala Gly Pro Gly Gly Tyr Gly Pro Gly Gln Gln Gly Pro Gly Gly
155 160 165
Tyr Gly Pro Gly Gln Gln Gly Pro Ser Gly Pro Gly Ser Ala Ala
170 175 180
Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly Tyr Gly Pro Gly Gln
185 190 195
Gln Gly Pro Gly Gly Tyr Gly Pro Gly Gln Gln Gly Pro Ser Gly
200 205 210
Pro Gly Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly
215 220 225
Tyr Gly Pro Gly Gln Gln Gly Pro Gly Gly Tyr Gly Pro Gly Gln
230 235 240
Gln Gly Pro Ser Gly Pro Gly Ser Ala Ala Ala Ala Ala Ala Ala
245 250 255
Ala Gly Pro Gly Gly Tyr Gly Pro Gly Gln Gln Gly Pro Gly Gly
260 265 270
Tyr Gly Pro Gly Gln Gln Gly Pro Ser Gly Pro Gly Ser Ala Ala
275 280 285
Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly Tyr Gly Pro Gly Gln
290 295 300
Gln Gly Pro Gly Gly Tyr Gly Pro Gly Gln Gln Gly Pro Ser Gly
305 310 315
Pro Gly Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly
320 325 330
Tyr Gly Pro Gly Gln Gln Gly Pro Gly Gly Tyr Gly Pro Gly Gln
335 340 345
Gln Gly Pro Ser Gly Pro Gly Ser Ala Ala Ala Ala Ala Ala Ala
350 355 360
Ala Gly Pro Gly Gly Tyr Gly Pro Gly Gln Gln Gly Pro Gly Gly
365 370 375
Tyr Gly Pro Gly Gln Gln Gly Pro Ser Gly Pro Gly Ser Ala Ala
380 385 390
Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly Tyr Gly Pro Gly Gln
395 400 405
Gln Gly Pro Gly Gly Tyr Gly Pro Gly Gln Gln Gly Pro Ser Gly
410 415 420
Pro Gly Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly
425 430 435
Tyr Gly Pro Gly Gln Gln Gly Pro Gly Gly Tyr Gly Pro Gly Gln
440 445 450
Gln Gly Pro Ser Gly Pro Gly Ser Ala Ala Ala Ala Ala Ala Ala
455 460 465
Ala Gly Pro Gly Gly Tyr Gly Pro Gly Gln Gln Gly Pro Gly Gly
470 475 480
Tyr Gly Pro Gly Gln Gln Gly Pro Ser Gly Pro Gly Ser Ala Ala
485 490 495
Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly Tyr Gly Pro Gly Gln
500 505 510
Gln Gly Pro Gly Gly Tyr Gly Pro Gly Gln Gln Gly Pro Ser Gly
515 520 525
Pro Gly Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly
530 535 540
Tyr Gly Pro Gly Gln Gln Gly Pro Gly Gly Tyr Gly Pro Gly Gln
545 550 555
Gln Gly Pro Ser Gly Pro Gly Ser Ala Ala Ala Ala Ala Ala Ala
560 565 570
Ala Gly Pro Gly Gly Tyr Gly Pro Gly Gln Gln Gly Pro Gly Gly
575 580 585
Tyr Gly Pro Gly Gln Gln Gly Pro Ser Gly Pro Gly Ser Ala Ala
590 595 600
Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly Tyr Gly Pro Gly Gln
605 610 615
Gln Gly Pro Gly Gly Tyr Gly Pro Gly Gln Gln Gly Pro Ser Gly
620 625 630
Pro Gly Ser Ala Ala Ala Ala Ala Ala Ala Ala Gly Pro Gly Gly
635 640 645
Tyr Gly Pro Gly Gln Gln Gly Pro Gly Gly Tyr Gly Pro Gly Gln
650 655 660
Gln Gly Pro Ser Gly Pro Gly Ser Ala Ala Ala Ala Ala Ala Ala
665 670 675
Ala Gly Pro Gly Gly Tyr Gly Pro Gly Gln Gln Gly Pro Gly Gly
680 685 690
Tyr Gly Pro Gly Gln Gln Gly Pro Ser Gly Pro Gly Ser
695 700 703
<210>5
<211>80
<212>DNA
<213>人工序列
<220>
<223>
<400>5
agatctgctg cagctgcagc cgctgcagct ggtcctggag gttacggacc aggtcagcaa 60ggacctggtg gatatggtcc 80
<210>6
<211>59
<212>DNA
<213>人工序列
<220>
<223>
<400>6
ggatccagga cctgaaggac cttgctgtcc tggaccatat ccaccaggtc cttgctgac 59