文殊兰凝集素蛋白编码序列及其应用 【技术领域】
本发明涉及分子生物学、酶学、生理学以及基因工程等领域。具体地,本发明涉及一种在文殊兰中表达的ca-Lectin蛋白(文殊兰凝集素蛋白,Crinumasiaticum agglutinin,CAA)及其核酸序列。本发明还涉及该蛋白和核酸序列的制备方法和用途。背景技术
近20年来凝集素在生物学方面的应用研究发展迅速,它最大的特点在于其能够识别糖和糖类,每一种凝集素具有对某一种特殊的碳水化合物有专一结合的能力(Ann Biochem,1981,50:207~231)。某些凝集素基因则具有较强的抗同翅目类昆虫包括蚜虫和飞虱功能(Entomol Exp Appl,1993,66:119~126;TransgenicRes,1995,4:18~25;Entomol Exp Appl,1995,75:51~59)。
本发明中,我们在石蒜科(Amaryllidaceae)植物文殊兰(Crinum asiaticum)中克隆到雪花莲g-Lectin凝集素(Galanthus nivalis Agglutinin,GNA)基因的同源基因ca-Lectin。
在本发明被公布之前,尚未有任何公开或报道过本专利申请中提及的文殊兰ca-Lectin蛋白序列及其核酸序列。发明内容
本发明的第一目的就是提供一种新的文殊兰基因ca-Lectin(caa),该基因是一个文殊兰ca-Lectin蛋白基因。
本发明的第二目的是提供一种新的文殊兰蛋白ca-Lectin。
本发明的第三目的是提供一种利用重组技术生产上述新的文殊兰ca-Lectin蛋白和核酸序列的方法。
本发明还提供了这种文殊兰ca-Lectin蛋白多肽和编码序列在利用转基因技术控制植物病虫害上的应用。
在本发明地一个方面,提供了一种分离出的DNA分子,该分子包括:编码具有文殊兰ca-Lectin蛋白质活性的多肽的核苷酸序列,所述的核苷酸序列与SEQ IDNO.3中从核苷酸第76-603位DNA分子的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.3中从核苷酸第76-603位的核苷酸序列杂交。较佳地,所述的序列编码具有SEQ ID NO.4所示的氨基酸序列的多肽。更佳地,所述的序列具有SEQ ID NO.3中从核苷酸第76-603位的核苷酸序列。
在本发明的另一方面,提供了一种分离出的文殊兰ea-Lectin蛋白质多肽,它包括:具有SEQ ID NO.4氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。较佳地,该多肽是具有SEQ ID NO.4序列的多肽。
在本发明的另一方面,还提供了一种载体,它包含上述的DNA分子。
在本发明的另一方面,还提供了一种用上述载体转化的宿主细胞。在实例中该宿主细胞是BL21和烟草。
在本发明的另一方面,还提供了一种产生具有文殊兰ca-Lectin蛋白质活性的多肽的方法,其步骤如下:
(1)将编码具有文殊兰ca-Lectin蛋白活性多肽的纯化的核苷酸序列可操作地连于表达调控序列,形成文殊兰ca-Lectin蛋白表达载体,所述的核苷酸序列与SEQ IDNO.3中从核苷酸第76-603位的核苷酸序列有至少70%的同源性;
(2)将步骤(1)中的表达载体转入原核宿主细胞,形成文殊兰ca-Lectin蛋白的重组细胞;
(3)在适合表达文殊兰ca-Lectin蛋白多肽的条件下,培养步骤(2)中的重组细胞;
(4)分离出具有文殊兰ca-Lectin蛋白活性的基本纯的多肽。
较佳地,在该方法中使用的核酸序列具有SEQ ID NO.3中第76-603位的序列。
在本发明的另一方面,还提供了一种利用转基因技术将编码具有文殊兰ca-Lcctin蛋白活性多肽的核苷酸序列转化入植物以提高植物对病虫害抗性的方法,其步骤如下:
(1)将编码具有文殊兰ca-Lectin蛋白活性的多肽的纯化的核苷酸序列可操作地连于植物表达调控序列,形成含文殊兰ca-Lectin蛋白基因的植物表达载体,所述的核苷酸序列与SEQ ID NO.3中从核苷酸第76-603位的核苷酸序列有至少70%的同源性;
(2)将步骤(1)中的表达载体转入农杆菌,将含表达载体的农杆菌同真核宿主细胞共培养,在22-28℃条件下,暗培养1-2天后,通过筛选如抗生素筛选,获得含有文殊兰ca-Lectin蛋白基因的转化细胞并最终再生转基因植株及其后代,包括植物种子及植物组织。含有文殊兰ca-Lectin蛋白基因的转基因植株对植物病虫害具有增强的抗性作用。
较佳地,在该方法中使用的核酸序列具有SEQ ID NO.3中第76-603位的序列。
本发明还提供了与ca-Lectin蛋白多肽特异性结合的抗体,它包括多克隆抗体和单克隆抗体。
在本发明中,“分离的”、“纯化的”或“基本纯的”DNA是指,该DNA或片段已从天然状态下位于其两侧的序列中分离出来,还指该DNA或片段已经与天然状态下伴随核酸的组份分开,而且已经与在细胞中伴随其的蛋白质分开。
在本发明中,术语“文殊兰ca-Lectin蛋白(或多肽)编码序列”指编码具有文殊兰ca-Lectin蛋白活性的多肽的核苷酸序列,如SEQ ID NO.3中第76-603位核苷酸序列及其简并序列。该简并序列是指,位于SEQ ID NO.3序列的编码框第76-603位核苷酸中,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQ ID NO.3中第76-603位核苷酸序列同源性低至约70%的简并序列也能编码出SEQ ID NO.4所述的序列。该术语还包括能在中度严紧条件下,更佳的在高度严紧条件下与SEQ ID NO.3中从核苷酸第76-603位的核苷酸序列杂交的核苷酸序列。该术语还包括与SEQ ID NO.3中从核苷酸第76-603位的核苷酸序列的同源性至少70%,较佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
该术语还包括能编码具有与天然的文殊兰ca-Lectin相同功能的蛋白的SEQID NO.3中开放阅读框序列的变异形式。这些变异形式包括(但并不限于):若干个(通常为1-90个,较佳地1-60个,更佳地1-20个,最佳地1-10个)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加数个(通常为60个以内,较佳地为30个以内,更佳地为10个以内,最佳地为5个以内)核苷酸。
在本发明中,“基本纯的”蛋白质或多肽是指其至少占样品总物质的至少20%,较佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或湿重计)。纯度可以用任何合适的方法进行测量,如用柱层析、PAGE或HPLC法测量多肽的纯度。基本纯的多肽基本上不含天然状态下的伴随其的组分。
在本发明中,术语“文殊兰ca-Leetin蛋白或多肽”指具有文殊兰ca-Lectin蛋白活性的SEQ ID NO.4序列的多肽。该术语还包括具有与天然文殊兰ca-Lectin相同功能的、SEQ ID NO.4序列的变异形式。这些变异形式包括(但并不限于):若干个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括文殊兰ca-Lectin蛋白的活性片段和活性衍生物。
本发明的文殊兰ca-Lectin多肽的变异形式包括:同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严紧条件下能与文殊兰ca-LectinDNA杂交的DNA所编码的蛋白、以及利用抗文殊兰ca-Lectin多肽的抗血清获得的多肽或蛋白。本发明还提供了其他多肽,如包含文殊兰ca-Lectin多肽或其片段的融合蛋白。除了几乎全长的多肽外,本发明还包括文殊兰ca-Lectin多肽的可溶性片段。通常,该片段具有文殊兰ca-Lectin多肽序列的至少约10个连续氨基酸,通常至少约30个连续氨基酸,较佳地至少约50个连续氨基酸,更佳地至少约80个连续氨基酸,最佳地至少约100个连续氨基酸。
在本发明中,“文殊兰ca-Lectin保守性变异多肽”指与SEQ ID NO.4的氨基酸序列相比,有至多10个,较佳地至多8个,更佳地至多5个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表1进行替换而产生。
表1最初的残基代表性的取代优选的取代Ala(A)Val;Leu;IleValArg(R)Lys;Gln;AsnLysAsn(N)Gln;His;Lys;ArgGlnAsp(D)GluGluCys(C)SerSerGln(Q)AsnAsnGlu(E)AspAspGly(G)Pro;AlaAlaHis(H)Asn;Gln;Lys;ArgArgIle(I)Leu;Val;Met;Ala;PheLeuLeu(L)Ile;Val;Met;Ala;PheIleLys(K)Arg;Gln;AsnArgMet(M)Leu;Phe;IleLeuPhe(F)Leu;Val;Ile;Ala;TyrLeuPro(P)AlaAlaSer(S)ThrThrThr(T)SerSerTrp(W)Tyr;PheTyrTyr(Y)Trp;Phe;Thr;SerPheVal(V)Ile;Leu;Met;Phe;AlaLeu
发明还包括文殊兰ca-Lectin蛋白或多肽的类似物。这些类似物与天然文殊兰ca-Lectin多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
修饰(通常不改变一级结构)形式包括:体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。
在本发明中,可选用本领域已知的各种载体,如市售的载体,包括质粒,粘粒等。在生产本发明的文殊兰ca-Lectin多肽时,可以将文殊兰ca-Lectin编码序列可操作地连于表达调控序列,从而形成文殊兰ca-Lectin蛋白表达载体。
如本文所用,“可操作地连于”指这样一种状况,即线性DNA序列的某些部分能够影响同一线性DNA序列其他部分的活性。例如,如果信号肽DNA作为前体表达并参与多肽的分泌,那么信号肽(分泌前导序列)DNA就是可操作地连于多肽DNA;如果启动子控制序列的转录,那么它是可操作地连于编码序列;如果核糖体结合位点被置于能使其翻译的位置时,那么它是可操作地连于编码序列。一般,“可操作地连于”意味着相邻,而对于分泌前导序列则意味着在阅读框中相邻。
在本发明中,术语“宿主细胞”为原核或真核细胞。常用的原核宿主细胞包括BL21,常用的真核宿主细胞包括酵母细胞、烟草细胞和其它植物细胞。
还可用Northern印迹法技术分析文殊兰ca-Lectin基因产物的表达,即分析文殊兰ca-Lectin的RNA转录物在细胞中的存在与否和数量。
文殊兰ca-Lectin RNA的Northern印迹分析和文殊兰ca-Lectin特异抗体的Western印迹分析可以联合使用,以证实文殊兰ca-Lectin在生物样本中的表达。
此外,本发明还提供了一种可用作探针的核酸分子,该分子通常具有文殊兰ca-Lectin核苷酸编码序列的8-100个连续核苷酸,较佳地具有15-50个连续核苷酸。该探针可用于检测样品中是否存在编码文殊兰ca-Lectin的核酸分子。
本发明还提供了检测样品中是否存在文殊兰ca-Lectin核苷酸序列的方法,它包括用上述的探针与样品进行杂交,然后检测探针是否发生了结合。较佳地,该样品是PCR扩增后的产物,其中PCR扩增引物对应于文殊兰ca-Lectin核苷酸编码序列,并可位于该编码序列的两侧或中间。引物长度一般为15-50个核苷酸。
此外,根据本发明的文殊兰ca-Lectin核苷酸序列和氨基酸序列,可以在核酸同源性或表达蛋白质的同源性基础上,筛选文殊兰ca-Lectin同源基因或同源蛋白。
为了得到与文殊兰ca-Lectin基因相关的文殊兰cDNAs的点阵,可以用DNA探针筛选文殊兰cDNA文库,这些探针是在低严紧条件下,用32p对文殊兰ca-Lectin的全部或部分做放射活性标记而得的。最适合于筛选的cDNA文库是来自文殊兰的文库。构建来自感兴趣的细胞或者组织的cDNA文库的方法是分子生物学领域众所周知的。另外,许多这样的cDNA文库也可以购买到,例如购自Clontech,Stratagene,Palo Alto,Cal.。这种筛选方法可以识别与文殊兰ca-Lectin相关的基因家族的核苷酸序列。
本发明的文殊兰ca-Lectin核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工化学合成的方法来合成有关序列。在本申请之前,现有技术已完全可以通过先合成多个多核苷酸小片段,然后再进行连接而获得编码本发明文殊兰ca-Lectin蛋白的核酸序列。然后,可将该核酸序列引入本领域中各种现有的DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
除了用重组法产生之外,本发明蛋白的片段还可用固相技术,通过直接合成肽而加以生产(Stewart等人,(1969)Solid-Phase Peptide Synthesis,WH Freeman Co.,San Francisco;Merrifield J.(1963)J.Am Chem.Soc 85:2149-2154)。在体外合成蛋白质可以用手工或自动进行。例如,可以用Applied Biosystems的431A型肽合成仪(Foster City,CA)来自动合成肽。可以分别化学合成本发明蛋白的各片段,然后用化学方法加以连接以产生全长的分子。
利用本发明的文殊兰ca-Lectin蛋白,通过各种常规筛选方法,可筛选出与文殊兰ca-Lectin发生相互作用的物质,或者受体、抑制剂或拮抗剂等。
表2为本发明的文殊兰凝集素(CAA)蛋白与石蒜科植物雪花莲g-Lectin凝集素(GNA)蛋白的核苷酸编码序列的同源比较(GAP)表。
表3为本发明的文殊兰ca-Lectin蛋白与石蒜科植物雪花莲g-Lectin凝集素(GNA)蛋白的氨基酸序列(GenPept Accession No.AAA33347.1)的同源比较(FASTA)表。其中,相同的氨基酸在两个序列之间用氨基酸单字符标出,相似的氨基酸用“+”标出。具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等分子克隆:实验室手册(New York:Cold SpringHarbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1
文殊兰ca-Lectin基因的克隆
1.组织分离(isolation)
文殊兰来源于上海中医药大学,采取文殊兰植物幼嫩叶片后,立即置于液氮中冷冻保存。
2.RNA的分离(RNA isolation)
取部分组织(幼嫩叶片),用研钵研碎,加入盛有裂解液的50mL管,充分振荡后,再移入玻璃匀浆器内。匀浆后移至50ml新管,抽提总RNA(TRIzol Reagents,Gibco,NY,USA)。用甲醛变性胶电泳鉴定总RNA质量。
3.基因的全长克隆(Cloning of Full-length cDNA)
根据雪花莲和其它石蒜科凝集素氨基酸保守序列,设计简并引物,利用同源性基因克隆原理,采用RACE方法(GibcoBRL试剂盒)
进行cDNA全长克隆,分三个阶段进行:
(1)3′-RACE
采用总RNA(2.5μg)进行反转录合成cDNA第一链,3′-RACE Adapter primer(AP)引导反转录,程序按试剂盒操作说明书进行。
PCR(AP+CAA001)得到2001CAA3’(570bp),回收,连接到T-Easy载体上,用SP6或T7作为通用引物,采用终止物荧光标记(Big-Dye,Perkin-Elmer,USA)的方法,在ABI377测序仪(Perkin-Elmer,USA)上进行测序。测序结果用GCG软件包(Wisconsin group,USA)中的BLAST和FASTA软件搜索已有的数据库(Genebank+EMBL),知其核酸序列及编码蛋白与已知石蒜科植物如雪花莲(Galanthus nivalis)和君子兰(Clivia miniata)的凝集素基因的同源性很高,故初步认为它是一个凝集素基因。
(2).5′-RACE
cDNA第一链合成及加尾 反转录、杂交链中mRNA的水解、cDNA过柱和加尾等程序均按说明书操作程序进行,反转录引物CAA5-1(GSP1)为:5′-ACT AATTAC CAC CTG CAG CCG TCG T-3′。
第一轮PCR(AAP+CAA5-2)设计一条5’第一扩增引物CAA5-2:5′-TTG CGGTAG TTT TGG CGG CAG CAG G-3′,利用AAP+CAA5-2进行第一轮扩增,反应程序为:94℃,3min→[94℃,1min→60℃,1min→72℃,1min]×34cycles→72℃,10min→4℃。第一轮扩增获得一条约600bp的特异条带,回收后用其作模板进入巢式扩增。
第二轮巢式PCR(AUAP+CAA5-3)设计一条5’巢式扩增引物CAA5-3:5′-TGA CGT TGG TGG GGC CAT GAG CGG C-3′,用上面第一轮扩增的回收产物作模板,用AUAP+CAA5-3进行巢式扩增,反应程序为:94℃,3min→[94℃,1min→62℃,1min→72℃,1min]×35cycles→72℃,10min→4℃。巢式扩增获得一条约580bp的特异条带,回收,连接到T-Easy载体上,用SP6和T7作为通用引物,采用终止物荧光标记(Big-Dye,Perkin-Elmer,USA)的方法,在ABI377测序仪(Perkin-Elmer,USA)上进行双向测序。5’测序结果与从前获得的3’端序列有322bp(214-535bp)的重叠区,二者在该重叠区的序列完全一样,说明5’RACE与3’RACE获得的是同一条基因的cDNA末端。根据获得的5’和3’序列拼接后得到一条821bp的cDNA序列,它有一个完整的528bp的开放阅读框(ORF,76-603bp)。根据该拼接序列设计全长cDNA扩增的引物。
(3).PCR扩增文殊兰凝集素基因全长cDNA
在拼接得到全长(至少包含完整的开放阅读框)的基础上,进一步设计引物,FCAA:5’-ACCACAAGCCACCATCCGCTGC-3’(SEQ ID NO.1)为正向引物,RCAA:5’-AATTCATTATTAATTTATTACTGCAAAATGC-3’(SEQ ID NO.2)为反向引物,以文殊兰总RNA为模板,进行RT-PCR扩增,扩增条件为94℃3min→[94℃,1min→60℃,1min→72℃,1min30sec]×35cycles→72℃10min→4℃。如期得到一条约821bp的目标特异条带,然后按常规方法对PCR扩增产物进行克隆、测序(测序结果与拼接结果完全吻合),获得SEQ ID NO.3所示的序列。
利用CAA的全长cDNA在NCBI进行BLAST的结果证明,从文殊兰中新得到的基因确为一个具甘露糖结合位点的植物凝集素基因。由于已知的同源凝集素如雪花莲凝集素(GNA)基因具有较强的抗同翅目类昆虫包括蚜虫和飞虱功能(Hilder等,1994;Powell等,1993,1995),因此推测编码文殊兰凝集素的基因(caa)也具有相同的功能。
实施例2
文殊兰ca-Lectin基因的序列信息与同源性分析
本发明新的文殊兰ca-Lectin全长cDNA的长度为821bp,详细序列见SEQ IDNO.3,其中开放读框位于76-603位核苷酸。根据全长cDNA推导出文殊兰ca-Lectin的氨基酸序列,共175个氨基酸残基,分子量为18157道尔顿,pI为9.30。详细序列见SEQ ID NO.4。
将ca-Lectin的全长eDNA序列及其编码蛋白质用BLAST程序在Non-redundant GenBank+EMBL+DDBJ+PDB和Non-redundant GenBank CDStranslations+PDB+SwissProt+Superdate+PIR数据库中进行核苷酸和蛋白质同源性检索,结果发现它与石蒜科植物雪花莲凝集素(GNA)基因存在一定的同源性。在核酸水平上,它与雪花莲凝集素g-Lectin蛋白(GNA)的核酸序列(M55557.1)具有63%的相同性(附表2);在氨基酸水平上,与雪花莲凝集素GNA(GenPeptAccession No.AAA33347.1)的第3-125位氨基酸残基有53%的相同性和67%的相似性(附表3),由此可以认为两者在功能上也有很高的相似性。
实施例3
文殊兰ca-Lectin蛋白的结构和功能研究
1.文殊兰凝集素蛋白的信号肽分析。通过对文殊兰凝集素蛋白同其它植物凝集素的核苷酸序列和氨基酸序列的比较分析,发现文殊兰凝集素蛋白基因编码一前体蛋白,并含有信号肽序列,按van Heijine(1986)等预测凝集素蛋白信号肽的规则和对文殊兰凝集素蛋白同其它植物凝集素如GNA蛋白的比较,鉴定出文殊兰凝集素蛋白的信号肽剪切位点在第22氨基酸(A)和第23氨基酸(A)之间,该位置也符合目前已知的大多数甘露糖专一结合的凝集素如雪花莲凝集素(GNA,VanDamme等,1991)、君子兰凝集素(Van Damme等,1994)等的凝集素蛋白的信号肽剪切位点。
2.文殊兰ca-Lectin蛋白的专一结合糖基化分析。通过对文殊兰ca-Lectin蛋白同其它植物凝集素蛋白如雪花莲凝集素(GNA)、君子兰凝集素、水仙凝集素等的专一结合糖基化分析,发现文殊兰ca-Lectin蛋白同大多数甘露糖专一结合的凝集素如雪花莲凝集素(GNA)、君子兰凝集素、水仙凝集素等一样,具有3个典型的甘露糖专一结合位点盒(QDNY),见下图(图中甘露糖专一结合位点盒QDNY用方框框住)。因此证明文殊兰ca-Lectin蛋白也同雪花莲凝集素(GNA)、君子兰凝集素等一样,为甘露糖专一结合的凝集素蛋白。
实施例4
文殊兰ca-Lectin多肽的制备和提纯
在该实施例中,将全长的文殊兰ca-Lectin编码序列或片段构建入商品化的蛋白质融合表达载体之中,以表达和提纯重组蛋白。
将文殊兰ca-Lectin多肽以融合蛋白的形式在大肠杆菌中进行原核表达。
原核表达载体的构建,以及转化大肠杆菌
根据文殊兰ca-Lectin的氨基酸序列,设计扩增出切除信号肽后的蛋白编码区的引物,并在正反引物上分别引入限制性内切酶位点(这根据选用的pET32a(+)载体而定),以便构建表达载体。以实施例1中获得的扩增产物为模板,经PCR扩增后,将文殊兰ca-Lectin基因在保证阅读框正确的前提下克隆至pET32a(+)载体(Novagen)。鉴定好的表达载体利用CaCl2方法转入大肠杆菌BL21,筛选鉴定得到含有pET32a(+)-ca-Lectin表达载体的工程菌BL21-pET32a(+)-ca-lectin。
表达Trx-ca-Lectin重组蛋白的工程菌的分离鉴定
挑取单菌落的BL21-pET32a(+)-ca-lectin工程菌于3ml含100μg/ml氨苄青霉素的LB培养基中振摇培养过夜,按1∶100的浓度吸取培养液于新的LB培养基(含100μg/ml氨苄青霉素)中培养约3小时,至OD600达0.5后,加入IPTG至终浓度1mmol/L继续于37℃分别培养0,1,2,3小时。取培养时间不同的1ml菌液离心,在细菌沉淀物中加入裂解液(2×SDS上样缓冲液50μl,蒸馏水45μl,二巯基乙醇5μl),混悬细菌沉淀,沸水浴中煮5分钟,10000rpm离心1分钟,上清加入12%SDS-PAGE胶中电泳。染色后观察预期分子量大小的蛋白量随IPTG诱导时间增加而增加的菌株即为表达Trx-ca-lectin融合蛋白的工程菌。
Trx-ca-Lectin融合蛋白的提取纯化
按上述方法诱导表达Trx-ca-lectin融合表达蛋白的工程菌BL21-pET32a(+)-ca-lectin,经离心沉淀收集菌体,并根据厂家(Novagen)的说明书以BugBuster试剂和Benzonase核酸酶来纯化包涵体。包涵体可用溶解缓冲液(50mM CAPS,pH11.0,0.3%N-lauroylsarcosine)来溶解,再用透析缓冲液(200mMTris-HCl,pH8.5)来透析。然后用组氨酸结合(His·Bind)树脂进行亲和层析,并经洗脱缓冲液(1M imidazole,500mM NaCl,20mM Tris-HCl pH7.9)洗脱来收集Trx-ca-Lectin融合蛋白。融合蛋白经肠激酶20℃酶切16小时后即可分离获的ca-lectin的表达蛋白。
实施例5
文殊兰ca-Lectin蛋白或多肽在烟草细胞中进行真核细胞表达及转基因植株的抗虫性鉴定
含目的基因(文殊兰ca-Lectin基因)表达载体的构建
根据文殊兰ca-Lectin的全长cDNA序列(SEQ ID NO.3),设计扩增出完整编码阅读框的引物,并在正反引物上分别引入限制性内切酶位点(这可视选用的载体而定),以便构建表达载体。以实施例1中获得的扩增产物为模板,经PCR扩增后,将文殊兰ca-Lectin cDNA克隆至中间载体(如pBluescript),进一步克隆到双元表达载体(如pBI121和pCAMBIA2200),在保证阅读框架的前提下鉴定好的表达载体,再将其转入农杆菌中,利用叶盘法技术转化模式植物烟草。
利用叶盘法转化烟草
1.用无菌牙签挑取YEB选择平板上的阳性菌落,接种于2ml YEB液体(Sm+,Kan+),28度,200rpm振荡培养24-36小时;
2.室温下4,000g离心10min;
3.弃上清,菌体用1/2MS液体培养基悬浮,稀释到原体积的5-20倍,使菌液的OD600=0.5左右;
4.取生长两周左右的烟草的无菌叶片,去掉其主叶脉,将其剪成约1平方厘米见方的小叶片;
5.将叶片放入制备好的菌液中,浸泡2-5min,在无菌滤纸上吸干菌液;
6.把经侵染的叶片放于MS培养基上,28℃暗培养48小时;
7.将叶片转到愈伤培养基(MS+6-BA 1.0mg/L+NAA 0.1mg/L+Kan 50mg/L+cb250mg/L)上,25-28℃光照下培养,7-15天可见愈伤组织的形成;
8.约20天后可见分化芽长出,待芽长大后,切下,置于生根培养基(1/2MS+NAA0.5mg/L+Kan 25mg/L)上进行生根培养,2-7天左右生根;
9.等根系发达后,将植株取出,用无菌水洗净附着的固体培养基,移入土壤中,刚开始用玻璃罩罩几天,待植株健壮后再取下玻璃罩,温室中培养。利用Western blot检测CAA蛋白在转基因烟草植株中的表达
1.蛋白的提取:a)取50mg叶片,加入100ul 1*PBS(KH2PO4 0.2g/l,Na2HPO4 1.15g/l,KCl 0.2g/l,NaCl 8g/l)于1.5ml Eppendorf管中研磨;b)13000rpm,4℃离心10分钟;c)取上清,备用。注:以上过程于冰上进行。
2.蛋白的定量:参考Bradford法(Bradford,1976)。取2ul蛋白样品,加入1mlBradford试剂,混匀后,分光光度计测OD595;蛋白含量计算:10D595=28.57μg。
3.SDS-PAGE分离蛋白:SDS-PAGE的制备参考《分子克隆》(Sambrook等,1989);a)加样前,将样品置于含50mmol/L DTT的加样缓冲液(2*加样缓冲液:甘油2.4g,1M Tris-HCl pH6.8 1ml;溴酚兰0.01%,H2O定容至20ml),煮沸10分钟;b)室温100V电压下聚丙烯酰胺凝胶电泳,直到指示剂(溴酚兰)前沿达到凝胶底部。
4.蛋白质向硝酸纤维膜上转移:a)转移之前,用转移缓冲液(39mmol甘氨酸,48mmol Tris Base,0.037%SDS,20%甲醇)平衡凝胶和硝酸纤维膜30分钟;b)室温下用半干式电转仪转移1h,凝胶两侧各垫3层Whatman滤纸;
5.膜上蛋白的检测:a)将硝酸纤维膜浸在封闭液中,37℃缓慢摇动、封闭60分钟(封闭液:取5g脱脂奶粉溶于100ml 1*PBS(含0.5g叠氮钠);b)再将滤膜浸泡在洗涤缓冲液中,37℃洗涤两次,每次15分钟;c)加入第一抗体(抗文殊兰ca-Lectin的抗体),37℃温育30分钟;同步骤b),洗涤三次;d)加入第二抗体(亲和素-碱性磷酸酶复合物),37℃温育30分钟;同步骤b),洗涤两次;e)加入底物显色观察蛋白条带。含文殊兰凝集素基因(caa)的转基因植株的抗虫性鉴定
鉴于编码甘露糖专一结合的植物凝集素如雪花莲凝集素(GNA)的基因已被证明对病虫害如刺吸式口器类昆虫如蚜虫(Hilder等,Transgenic Res,1995,4:18~25)、飞虱(Tang等,Plant Breeding,2002,121:93~95)及咀嚼式口器类昆虫如番茄蛾Lahanohia olerucea(Gatehouse等,Molecular Breeding,1997,3:49~63)都具有抗性,而文殊兰凝集素(CAA)也为甘露糖专一结合的凝集素且与雪花莲凝集素(GNA)具有较高的同源性,因此编码文殊兰凝集素的基因(caa)同雪花莲凝集素基因(gna)相似,也应具有抗虫功能。我们进一步对表达文殊兰凝集素基因(caa)的转基因植株进行抗虫性鉴定。按Hilder等(Transgenic Res,1995,4:18~25)的方法对表达文殊兰凝集素基因(caa)的转基因烟草植株(20-30厘米高)进行蚜虫(桃蚜)抗性鉴定,研究其对蚜虫存活率和发育进度的影响。对蚜虫存活率的研究中,在每株植株上接种10头蚜虫一龄若虫后每2天测定蚜虫存活数(共测定14天)。对蚜虫发育进度的研究中,在每株植株上接种5头蚜虫一龄若虫,13天后测定存活的蚜虫成虫数和若虫数。结果表明,在表达文殊兰凝集素基因(caa)的转基因烟草植株上存活的蚜虫数量同非转基因对照上的相比显著减少(P<0.05),同时,在表达文殊兰凝集素基因(caa)的转基因烟草植株上存活的蚜虫其发育进度同非转基因对照上的相比也被显著减缓(P<0.05),其13天后发育成成虫的数量也显著减少(P<0.05)。因此抗虫性结果证明,文殊兰凝集素基因(caa)对昆虫(如蚜虫)确有抗性,文殊兰凝集素基因(caa)可用于利用转基因技术控制植物虫害的研究和产业化中。表263%identity in 379nt overlapQuery:85 AATTACATTCTCCTACCGGCTGCGATCTTC---GGCCTCCTCCTGACGTCCTGCATGGCC 141
|||| | | ||| | ||| | |||||| || || || | || ||| ||Sbjct:5 AATT-C-TCCTCATTTTGGCCACCATCTTCCTTGGAGTCATCACACCATCTTGCCTGAGT 62Query:142 GCCAACGTGCTGTACTCGGGGCAGGCCCTCAGCACCGGAGCATCCCTCTCCT-TCGCCGC 200
| || || |||||||| || || | ||| || || | || ||||||| | || |Sbjct:63 GAAAATGTTCTGTACTCCGGTGAGACTCTCCCTACAGGGGGATTTCTCTCCTCTGGCAGT 122Query:201 CTACCAGTTCGTCATGCAGGCCGACTGCAACCTCGTGCTGTACGACAACGGCAACCCCGT 260
| || ||||||| | ||||||||||| || |||||| || || ||| ||| |Sbjct:123 TTTGTTTTTA-TCATGCAAGAGGACTGCAACCTGGTCCTGTACAACGTCGACAAGCCCAT 181Query:261 CTGGGCGTCCGGCACCAACGGCCGCGGGTCCGGCTGC-CAGTGCCGGATGCAGTACGACG 319
|||||| | ||| ||||| | | |||| | | | | |||||| ||| |Sbjct:182 CTGGGCAACTAACACAGGCGGCCTCTCCAGTGACTGCACCCT-CAGCATGCAGACCGATG 240Query:320 GCAACCTCGTCGTCTACACCAGCGGCAACCGGGCCG-TGTGGGCCAGCAACACCAACCGG 378
| |||||||| || |||||| | | | | ||| | ||||| |||||||| || |Sbjct:241 GGAACCTCGTAGTGTACACCC-CATCGAACAAACCGATTTGGGCAAGCAACACTGACAGC 299Query:379 G-GAACCGGGAGATACCAGTGCATCCTCCAGCGCGACCGGAACGTTGTGGTCTACGACCC 437
||| || | ||| ||||||||| || || |||||||||||| |||||| |Sbjct:300 CAGAATGGGCAT-TACGTGTGCATCCTTCAAAAGGATCGGAACGTTGTGATCTACGGAAC 358Query:438 TCAGGGCAGGCCTATCTGG 456
| | | || ||| | ||Sbjct:359 TGATCGTTGGGCTA-CAGG 376Query:文殊兰ca-Lectin蛋白的核酸序列Sbjct:雪花莲(Galanthus nivalis)凝集素g-Lectin蛋白的核酸序列(M55557.1)表353%identity in 126aa overlap,67%similarity in 126aa overlapQuery:6 ILLPAAIF-GLLLTSCMAANVLYSGQALSTGASLSFAAYQFVMQADCNLVLYDNGNPVWA 64
+L+ A IF G++ SC++ NVLYSG+ L TG LS ++ F+MQ DCNLVLY+ P+WASbjct:3 LLILATIFLGVITPSCLSENVLYSGETLPTGGFLSSGSFVFIMQEDCNLVLYNVDKPIWA 62Query:65 SGTNGRGSGCQCRMQYDGNLVVYTSGNRAVWASNTNRGTGRYQCILQRDRNVVVYDPQGR 124
+ T G S C MQ DGNLVVYT N+ +WASNT+ G Y CILQ+DRNVV+Y GSbjct:63 TNTGGLSSDCTLSMQTDGNLVVYTPSNKPIWASNTDSQNGHYVCILQKDRNVVIY---GT 119Query:125 PIWATG 130
WATGSbjct:120 DRWATG 125Query:文殊兰ca-Lectin蛋白氨基酸序列Sbjct:雪花莲(Galanthus nivalis)凝集素g-Lectin蛋白氨基酸序列(AAA33347.1)核苷酸或氨基酸序列表(1)SEQ ID NO.1的信息
(i)序列特征:
(A)长度:22bp
(B)类型:核苷酸
(C)链性:单链
(D)拓扑结构:线性
(ii).分子类型:寡核苷酸
(iii).序列描述:SEQ ID NO.1
ACCACAAGCCACCATCCGCTGC(2)SEQ ID NO.2的信息
(i)序列特征:
(A)长度:31bp
(B)类型:核苷酸
(C)链性:单链
(D)拓扑结构:线性
(ii).分子类型:寡核苷酸
(iii).序列描述:SEQ ID NO.2
AATTCATTATTAATTTATTACTGCAAAATGC(3)SEQ ID NO.3的信息
(i)序列特征:
(A)长度:821bp
(B)类型:核苷酸
(C)链性:单链
(D)拓扑结构:线性
(ii).分子类型:核苷酸
(iii).序列描述:SEQ ID NO.3 1 accacaagcc accatccgct gcagccactc gatcagaaga ggtacgtgca gccagtcatc 61 gtcaagctac aaggcatggc acgtaattac attctcctac cggctgcgat cttcggcctc121 ctcctgacgt cctgcatggc cgccaacgtg ctgtactcgg ggcaggccct cagcaccgga181 gcatccctct ccttcgccgc ctaccagttc gtcatgcagg ccgactgcaa cctcgtgctg241 tacgacaacg gcaaccccgt ctgggcgtcc ggcaccaacg gccgcgggtc cggctgccag301 tgccggatgc agtacgacgg caacctcgtc gtctacacca gcggcaaccg ggccgtgtgg361 gccagcaaca ccaaccgggg aaccgggaga taccagtgca tcctccagcg cgaccggaac421 gttgtggtct acgaccctca gggcaggcct atctgggcca ccgggacgaa cgtcgcagcc481 gcatccaacg tcacgctggc cgctgccgcc gccgctcatg gccccaccaa cgtcacggtg541 gccgctctga accctgctgc cgccaaaact accgcaaaaa cgacggctgc aggtggtaat601 tagttaaccc tgcctcaacc taagtataaa tctataatgc ataaataatt gggttgctat661 tcgataattg taccgtttgg aatagcagcc ttcgctcgtg gaatttatca ggtgttgcgt721 tgttaagcgg tttgcgtttg cggttgagct ggattaagca gctgcagtgt aattaatgaa781 ggtttgcaat gcattttgca gtaataaatt aataatgaat t(4)SEQ ID NO.4的信息
(i)序列特征:
(A)长度:175氨基酸
(B)类型:氨基酸
(C)链性:单链
(D)拓扑结构:线性
(ii).分子类型:多肽
(iii).序列描述:SEQ ID NO.4
1 MARNYILLPA AIFGLLLTSC MAANVLYSGQ ALSTGASLSF AAYQFVMQAD
51 CNLVLYDNGN PVWASGTNGR GSGCQCRMQY DGNLVVYTSG NRAVWASNTN
101 RGTGRYQCIL QRDRNVVVYD PQGRPIWATG TNVAAASNVT LAAAAAAHGP
151 TNVTVAALNp AAAKTTAKTT AAGGN