按植物偏爱密码子合成降钙素基因相关肽基因及其在植物中的应用 【技术领域】
本发明涉及分子生物学、酶学、生理学以及基因工程等领域。具体地,本发明涉及一种首次根据植物偏爱密码子设计人工合成的降钙素基因相关肽(Calcitoningene-related peptide,CGRP)的核酸序列。本发明还涉及降钙素基因相关肽在植物中的表达。技术背景
近20年来降钙素基因相关肽在治疗高血压、心衰、心绞痛、冠心病、心肌坏死和调节心率不齐等方面有重要的应用价值。它可以舒张血管、降低血压、增强心肌收缩力、提高血液输出量。
本发明中,我们用化学合成法,首次根据植物偏爱密码子设计了可以在植物中表达的具有生物活性的降钙素基因相关肽及其编码序列。
在本发明被公布之前,尚未有任何公开或报道过本专利申请中提及的在植物中表达的降钙素基因相关肽编码序列。发明内容
本发明的第一目地就是提供一种新的适合在植物中表达的降钙素基因相关肽基因。
本发明的第二目的是提供一种在植物中表达的降钙素基因相关肽。
本发明的第三目的是提供一种利用重组技术生产上述新的降钙素基因相关肽的蛋白及核酸序列的方法。
本发明还提供了这种新的降钙素基因相关肽和编码序列的应用。
在本发明的一个方面,提供了一种人工设计并合成的含有新的降钙素基因相关肽基因的克隆载体pGEM-5zf-cgrp,该载体包括:根据植物偏爱密码子设计的降钙素基因相关肽的核酸序列,所述的核酸序列与SEQ ID NO.5中从核苷酸第18-130位DNA分子的核苷酸序列有至少75%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.5中从核苷酸第18-130位的核苷酸序列杂交。较佳地,所述的序列编码具有SEQ ID NO.6所示的氨基酸序列的多肽。更佳地,所述的序列具有SEQID NO.5中从核苷酸第18-130位的核苷酸序列。
在本发明的另一方面,提供了一种在植物中表达的降钙素基因相关肽,它包括:具有SEQ ID NO.6氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。较佳地,该多肽是具有SEQ ID NO.6序列的多肽。
在本发明的另一方面,还提供了几种表达载体,它包含上述的DNA分子。
在本发明的另一方面,还提供了一种用上述载体转化的宿主细胞。在实例中该宿主细胞是烟草和番茄。
在本发明的另一方面,还提供了一种在植物中产生和表达具有活性的降钙素基因相关肽的方法,其步骤如下:
(1)将人工合成的编码具有降钙素基因相关肽活性多肽的核苷酸序列可操作地连于表达调控序列,形成降钙素基因相关肽蛋白表达载体,所述的核苷酸序列与SEQ IDNO.5中从核苷酸第18-130位的核苷酸序列有至少75%的同源性;
(2)将步骤(1)中的表达载体转入宿主细胞,形成降钙素基因相关肽的重组细胞;
(3)在适合表达降钙素基因相关肽的条件下,培养步骤(2)中的重组细胞;
(4)再生重组细胞,获得表达降钙素基因相关肽的转基因植物及其后代,包括植物种子及植物组织。
较佳地,在该方法中使用的核酸序列具有SEQ ID NO.5中第18-130位的序列。
在本发明中,术语“降钙素基因相关肽编码序列”指编码具有降钙素基因相关肽活性的多肽的核苷酸序列,如SEQ ID NO.5中第18-130位核苷酸序列及其简并序列。该简并序列是指,位于SEQ ID NO.5序列的编码框第18-130位核苷酸中,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQ ID NO.5中第18-130位核苷酸序列同源性低至约75%的简并序列也能编码出SEQ ID NO.6所述的序列。该术语还包括能在中度严紧条件下,更佳的在高度严紧条件下与SEQ ID NO.5中从核苷酸第18-130位的核苷酸序列杂交的核苷酸序列。该术语还包括与SEQ ID NO.5中从核苷酸第18-130位的核苷酸序列的同源性至少75%,较佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
该术语还包括能编码具有与天然的降钙素基因相关肽相同功能的蛋白的SEQ IDNO.5中开放阅读框序列的变异形式。这些变异形式包括(但并不限于):若干个(通常为1-90个,较佳地1-60个,更佳地1-20个,最佳地1-10个)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加数个(通常为60个以内,较佳地为30个以内,更佳地为10个以内,最佳地为5个以内)核苷酸。
在本发明中,术语“降钙素基因相关肽”指具有降钙素基因相关肽活性的SEQ IDNO.6序列的多肽。该术语还包括具有与降钙素基因相关肽在植物中表达相同功能的SEQ ID NO.6序列的变异形式。这些变异形式包括(但并不限于):若干个(通常为1-20个,较佳地1-15个,更佳地1-10个,最佳地1-5个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为15个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的在植物中偏爱的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个植物偏爱密码子所表达的氨基酸通常也不会改变蛋白质的功能。该术语还包括在植物中的表达的降钙素基因相关肽的活性片段和活性衍生物。
本发明的降钙素基因相关肽的变异形式包括:同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严紧条件下能与降钙素基因相关肽DNA杂交的DNA所编码的蛋白、以及利用抗降钙素基因相关肽的抗血清获得的多肽或蛋白。
在本发明中,“降钙素基因相关肽保守性变异多肽”是指与SEQ ID NO.6的氨基酸序列相比,有至多10个,较佳地至多8个,更佳地至多5个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表1进行替换而产生。
表1最初的残基代表性的取代优选的取代Ala(A)Val;Leu;IleValArg(R)Lys;Gln;AsnLysAsn(N)Gln;His;Lys;ArgGlnAsp(D)GluGluCys(C)SerSerGln(Q)AsnAsnGlu(E)AspAspGly(G)Pro;AlaAlaHis(H)Asn;Gln;Lys;ArgArgIle(I)Leu;Val;Met;Ala;PheLeuLeu(L)Ile;Val;Met;Ala;PheIleLys(K)Arg;Gln;AsnArgMet(M)Leu;Phe;IleLeuPhe(F)Leu;Val;Ile;Ala;TyrLeuPro(P)AlaAlaSer(S)ThrThrThr(T)SerSerTrp(W)Tyr;PheTyrTyr(Y)Trp;Phe;Thr;SerPheVal(V)Ile;Leu;Met;Phe;AlaLeu
发明还包括人工合成的在植物中表达的降钙素基因相关肽或多肽的类似物。这些类似物与降钙素基因相关肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
修饰(通常不改变一级结构)形式包括:体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。
在本发明中,可选用本领域已知的各种载体,如市售的载体,包括质粒,粘粒等。在生产本发明的在植物中表达的降钙素基因相关肽时,可以将降钙素基因相关肽编码序列可操作地连于表达调控序列,从而形成降钙素基因相关肽表达载体。
如本文所用,“可操作地连于”指这样一种状况,即线性DNA序列的某些部分能够影响同一线性DNA序列其他部分的活性。例如,如果信号肽DNA作为前体表达并参与多肽的分泌,那么信号肽(分泌前导序列)DNA就是可操作地连于多肽DNA;如果启动子控制序列的转录,那么它是可操作地连于编码序列;如果核糖体结合位点被置于能使其翻译的位置时,那么它是可操作地连于编码序列。一般,“可操作地连于”意味着相邻,而对于分泌前导序列则意味着在阅读框中相邻。
在本发明中,术语“宿主细胞”为真核细胞。常用的真核宿主细胞包括酵母细胞、烟草细胞、番茄细胞及其它植物细胞。
还可用Nothern印迹法技术分析降钙素基因相关肽基因产物的表达,即分析降钙素基因相关肽的RNA转录物在细胞中的存在与否和数量。
降钙素基因相关肽RNA的Nothern印迹分析和特异抗体的降钙素基因相关肽Western印迹分析可以联合使用,以证实在生物样本中降钙素基因相关肽的表达。
此外,本发明还提供了一种可用作探针的核酸分子,该分子通常具有降钙素基因相关肽核苷酸编码序列的8-50个连续核苷酸,较佳地具有15-50个连续核苷酸。该探针可用于检测样品中是否存在编码的核酸分子。
本发明还提供了检测样品中是否存在核苷酸序列的降钙素基因相关肽方法,它包括用上述的探针与样品进行杂交,然后检测探针是否发生了结合。较佳地,该样品是PCR扩增后的产物,其中PCR扩增引物对应于降钙素基因相关肽核苷酸编码序列,并可位于该编码序列的两侧或中间。引物长度一般为15-50个核苷酸。
本发明的降钙素基因相关肽核苷酸编码序列通常可以用人工合成的方法获得。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
表2为本发明的按植物偏爱密码子设计人工合成的降钙素基因相关肽与人类降钙素基因相关肽核苷酸序列(GenBank Accession No.AAA52011.1)的同源比较(GAP)表。相同的核苷酸在两个序列之间用竖线符标出。
表3为本发明的按植物偏爱密码子设计的降钙素基因相关肽与人类降钙素基因相关肽的氨基酸序列(GenPept Accession No.K03512.1)的同源比较(FASTA)表。其中,相同的氨基酸在两个序列之间用用竖线符标出。具体实施方式
下面结合具体实施例,进一步阐述本发明的具体实施方式。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1,降钙素基因相关肽基因的合成
1.基因合成(gene synthesis)
降钙素基因相关肽基因由本实验室根据植物偏爱密码子设计并委托上海生工生物工程服务有限公司合成之后连入pGEM-5zf载体。
2.酶切(restriction enzyme cutting)
将含合成基因的质粒载体用BamHI及SacI双酶切,切下合成的降钙素基因相关肽基因;
3.连接(ligation)
将切下的基因连入已经用BamHI及SacI切好的质粒pBI121和改造的pCAMBIA2301植物表达载体大片段中,用蓝白筛选检测转化的大肠杆菌阳性克隆。
4.基因的PCR检测
以以下序列为引物,用合成的基因为模板进行PCR检测
SEQ ID NO.1:GGA ATT CCG GAT CCA TGG GTT GCG
SEQ ID NO.2:CCC AAG GTT GCA GCT CGT TAT TAG AAAGCT
PCR条件为94℃5分钟,随之以94℃30秒、56℃30秒和72℃1分钟进行35个循环,最后以72℃延伸10分钟。电泳检测PCR扩增产物,获得扩增片段长度为151bp。
将基因转入表达载体后用以下引物对所含基因进行PCR检测
SEQ ID NO.3:ATG GCT TGC GAT ACT GCT ACC
SEQ ID NO.4:CAT CGC AAG ACC GGC AAC AG
PCR条件为94℃5分钟,随之以94℃30秒、60℃30秒和72℃1分钟进行35个循环,最后以72℃延伸10分钟。电泳检测PCR扩增产物,获得扩增片段长度为200bp。
实施例2,降钙素基因相关肽基因的序列信息与同源性分析
本发明的降钙素基因相关肽基因的全长为151bp(含接头),详细序列见SEQ IDNO.5,其中开放读框位于15-136位核苷酸。根据推导出的全长降钙素基因相关肽的氨基酸序列,共37个氨基酸残基,分子量为3792.3pI为9.50。详细序列见SEQID NO.6。
将按植物偏爱密码子设计合成的降钙素基因相关肽全长序列及其编码蛋白质用BLAST程序在Non-redundant GenBank+EMBL+DDBJ+PDB和Non-redundantGenBank CDS translations+PDB+SwissProt+Superdate+PIR数据库中进行核苷酸和蛋白质同源性检索,结果发现它与人类降钙素基因相关肽基因存在一定的同源性。在核苷酸水平上,它与人类降钙素基因相关肽基因的全编码序列(GenBank AccessionNo.K03512.1)有72%的相同性(见表2),在氨基酸水平上,它与人类降钙素基因相关肽(GenPept Accession No.AAA52011.1)的第36-72位氨基酸残基有100%的相似性(见表3)。由上可见,在植物中表达的降钙素基因相关肽与人类降钙素基因相关肽基因无论从核酸还是蛋白水平上都存在较高的同源性,可以认为两者在功能上也有很高相似性。
实施例3,降钙素基因相关肽在烟草和番茄细胞中进行真核细胞表达
含目的基因(降钙素基因相关肽基因)表达载体的构建
将含降钙素基因相关肽基因的中间载体PGEM-5zf进一步克隆到植物双元表达载体(如pBI121、pCAMBIA2301)中,在保证阅读框架正确的前提下鉴定好的表达载体,再将其转入农杆菌(如EHA105)中,利用叶盘法技术转化模式植物烟草和番茄。
利用叶盘法转化烟草:
1.用无菌牙签挑取YEB选择平板上的阳性菌落,接种于2mlYEB液体(Sm+,Kan+),28度,200rpm振荡培养24-36小时;
2.室温下4,000g离心10min;
3.弃上清,菌体用1/2MS液体培养基悬浮,稀释到原体积的5-20倍,使菌液的OD600=0.5左右;
4.取生长两周左右的烟草的无菌叶片,去掉其主叶脉,将其剪成约1平方厘米见方的小叶片;
5.将叶片放入制备好的菌液中,浸泡2-5min,在无菌滤纸上吸干菌液;
6.把经侵染的叶片放于MS培养基上,28℃暗培养48小时;
7.将叶片转到含卡那霉素(Kan)的筛选培养基(MS+6-BA1.0mg/L+NAA0.1mg/L+Kan 50mg/L+cb 250mg/L)上,25-28℃光照下培养,7-15天可见抗性愈伤组织的形成;
8.约20天后可见分化芽长出,待芽长大后,切下,置于生根培养基(1/2MS+NAA0.5mg/L+Kan 25mg/L)上进行生根培养,2-7天左右生根;
9.等根系发达后,将植株取出,用无菌水洗净附着的固体培养基,移入土壤中,刚开始用玻璃罩罩几天,待植株健壮后再取下玻璃罩,温室中培养。转化番茄:
1.将番茄种子灭菌后播于1/2MS培养基上,约10天左右长出子叶;
2.农杆菌培养过夜,OD为0.8-1.5,室温下4,000g离心10min;
3.弃上清,菌体用1/2MS液体培养基悬浮,加入子叶浸泡10分钟;
4.在无菌滤纸上吸干菌液;将子叶放在MS1培养基上,共培养两天;
5.将叶片转到含Kan的愈伤和分化培养基(MS+ZT1.0mg/L+IAA1.0mg/L+Kan50mg/L+cb250mg/L)上,25-28℃光照下培养,7-15天可见抗性愈伤组织的形成和植株再生;
6.待芽长大后约1-2厘米的时将幼芽移植在生根培养基中(1/2MS)上进行生根培养,2-7天左右生根;
7.根系发达后,将植株取出,用无菌水洗净附着的固体培养基,在珍珠岩中驯化一周,用1%的MS浇灌,移入土中。利用western blot检测降钙素基因相关肽在转基因烟草和番茄植株中的表达
1.蛋白的提取:a)取50mg叶片,加入100ul 1*PBS(KH2PO40.2g/l,Na2HPO41.15g/l,KCl0.2g/l,NaCl8g/l)于1.5ml离心管中研磨;b)13000,4℃离心10分钟;c)取上清,备用。注:以上过程于冰上进行。
2.蛋白的定量:参考Bradford法(Bradford,1976)。取2ul蛋白样品,加入1ml Bradford试剂,混匀后,分光光度计测OD595。
3.SDS-PAGE分离蛋白:SDS-PAGE的制备参考《分子克隆》(Sambrook等,1989);
a)加样前,将样品置于含50mmol/LDTT的加样缓冲液(2*加样缓冲液:甘油2.4g,1M Tris-HCl pH6.81ml;溴酚兰0.01%,H2O定容至20ml),煮沸10分钟;b)室温100V电压下聚丙烯酰胺凝胶电泳,直到指示剂(溴酚兰)前沿达到凝胶底部。
4.蛋白质向硝酸纤维膜上转移:a)转移之前,用转移缓冲液(39mmol甘氨酸,48mmol Tris Base,0.037%SDS,20%甲醇)平衡凝胶和硝酸纤维膜30分钟;b)室温下用半干式电转仪转移1h,凝胶两侧各垫3层Whatman滤纸;
5.膜上蛋白的检测:a)将硝酸纤维膜浸在封闭液中,37℃缓慢摇动、封闭60分钟(封闭液:取5g脱脂奶粉溶于100ml 1*PBS(含0.5g叠氮钠));b)再将滤膜浸泡在洗涤缓冲液中,37℃洗涤两次,每次15分钟;c)加入第一抗体(抗降钙素基因相关肽的抗体),37℃温育30分钟;同步骤b),洗涤三次;d)加入第二抗体(亲和素-碱性磷酸酶复合物),37℃温育30分钟;同步骤b),洗涤两次;e)加入底物显色观察蛋白条带。
本发明涉及的序列及记号分列如下:
(1)SEQ ID NO.1的信息
(i)序列特征:
(A)长度:24bp
(B)类型:核苷酸
(C)链性:单链
(D)拓扑结构:线性
(ii).分子类型:寡核苷酸
(iii).序列描述:SEQ ID NO.1
GGAATTCCGGATCCATGGGTTGCG(2)SEQIDNO.2的信息 (i)序列特征:
(A)长度:30bp
(B)类型:核苷酸
(C)链性:单链
(D)拓扑结构:线性 (ii).分子类型:寡核苷酸 (iii).序列描述:SEQ ID NO.2
CCCAAGGTTGCAGCTCGTTATTAGAAAGCT(3)SEQ ID NO.3的信息 (i)序列特征:
(A)长度:21bp
(B)类型:核苷酸
(C)链性:单链
(D)拓扑结构:线性 (ii).分子类型:寡核苷酸 (iii).序列描述:SEQ ID NO.3 ATGGCTTGCGATACTGCTACC(4)SEQ ID NO.4的信息 (i)序列特征:
(A)长度:20bp
(B)类型:核苷酸
(C)链性:单链
(D)拓扑结构:线性 (ii).分子类型:寡核苷酸 (iii).序列描述:SEQ ID NO.4
CATCGCAAGACCGGCAACAG(5)SEQ ID NO.5的信息 (i)序列特征:
(A)长度:151bp
(B)类型:核苷酸
(C)链性:单链
(D)拓扑结构:线性 (ii).分子类型:核苷酸 (iii).序列描述:SEQ ID NO.51 GGAATTCCGGATCCATGGCTTGCGATACTGCTACCTGCGTTACTCATAGG51 CTTGCTGGACTTCTTTCTAGGTCTGGAGGAGTTGTTAAGAACAACTTCGT100 TCCAACCAACGTTGGATCTAAGGCTTTCTAATAACGAGCTCCAAGCTTGG151 G(6)SEQ ID NO.6的信息 (i)序列特征:
(A)长度:37氨基酸
(B)类型:氨基酸
(C)链性:单链
(D)拓扑结构:线性(ii).分子类型:多肽(iii).序列描述:SEQ ID NO.6 1 ACDTATCVTHRLAGLLSRSGGVVKNNFVPTNVGSKAF 37
表2p: 18 gcttgcgatactgctacctgcgttactcataggcttgctggacttctttc
|| || || ||||| || || || |||||| |||| || || | ||h: 106 gcctgtgacactgccacttgtgtgactcatcggctggcaggcttgctgagp: 69 taggtctggaggagttgttaagaacaacttcgttccaaccaacgttggat
|| || || || || || ||||||||||| || || ||||| || || |h: 156 cagatcagggggtgtggtgaagaacaactttgtgcccaccaatgtgggttp: 119 ctaaggctttc
| || || ||h: 206 ccaaagcctttPercent Identity:72%in nt overlap上列:本发明的按植物偏爱密码子设计的降钙素基因相关肽的核酸序列下列:人类的降钙素基因相关肽的核酸序列(GenBank Accession No.K03512.1)
表3p: ACDTATCVTHRLAGLLSRSGGVVKNNFVPTNVGSKAF 37
|||||||||||||||||||||||||||||||||||||h: 36 ACDTATCVTHRLAGLLSRSGGVVKNNFVPTNVGSKAF 72plantcgrp:本发明的按植物偏爱密码子设计的降钙素基因相关肽氨基酸序列humcgrp:人类降钙素基因相关肽氨基酸序列(GenBankAccessionNo.AAA52011.1)