DNA片断和含有该DNA片断的重组载体以及应用其之后外源基因的表达方法。 技术领域
本发明是关于对基因的表达起促进作用的新DNA片断和含有DNA片断的重组载体,以及应用其后外源基因的表达方法的。
技术背景
促进外源基因表达的技术是将基因工程技术应用于植物时最必要的技术之一。其方法之一就是利用具有能促进基因表达的碱基序列的DNA。
促进外源基因表达的碱基序列,众所周知有蓖麻的过氧化氢酶的内含子等[特开平03-103 182;Tanaka et al.Nucleic Acids Res.18,6767-6770(1990)]。可是,所要的的植物种类繁多,也有必要促进生育阶段或组织器官中的外源基因地表达;因此,期待着开发可利用的能促进多种基因表达的DNA。
发明内容
因此,本发明的目的就提供一种可促进外源基因表达的新DNA,它与已知的能促进外源基因表达的DNA序列不同。
经本专利的发明者们的精心研究,完成了本发明,其发明点是通过比较稻子的磷脂酶D(以下称为“PLD”)的cDNA和稻子的染色体组DNA的碱基序列,发现了PLD的基因的内含子,而且发现了其中一个内含子对其下游基因的表达有明显促进作用。
也就是说,本发现提供了具有序列表中序列号1所示的碱基序列的分离的DNA片断以及在该碱基顺序中增加、插入、缺失或置换一个或数个核苷酸,并对其下游基因的表达有促进作用的分离的DNA片断。本发明还提供了含有上述本发明中的DNA片断和与其下游功能性连接的待表达的外源基因的重组载体。本发明还提供了外源基因的表达方法,即将本发明中上述重组载体导入宿主细胞以使上述外源基因表达出来。
通过下面的实验可以确认,本发明中的DNA片断大大促进了其下游基因的表达。因此,本发明在利用基因工程技术来使外源基因表达方面做出了很大贡献。
附图简述
图1示在本发明实施例中插入了本发明的DNA片断的pBI221的基因图的关键部位。
发明的最佳实施方案
如上所述,本发明的DNA片断具有序列表中序列号1的碱基序列。本发明的DNA片断象下述实施例中所讲的那样,通过比较稻子PLD基因的cDNA和与其相应的稻子的染色体组DNA的碱基序列来鉴定稻子PLD基因上游的(内含子区,用PCR制备含有173bp内含子序列的片断(该内含子位于上述内含子的5′端)与非编码区域相应的位置上),并组装到载体中报告基因的上游。通过比较该报告基因的表达活性,确认了对下游基因表达起了促进作用的片断。本发明的DNA片断的碱基序列相当于序列表中序列号3所表示的稻子基因组PLD基因碱基序列的第1661~1843碱基。
还将位于稻子PLD基因上游的上述173bp内含子区序列的碱基序列以序列表的序列号4表示。序列号4所表示的序列对下游基因的表达当然具有促进作用。序列号4所表示的碱基序列相当于序列表中序列号3所表示的稻子基因组PLD基因碱基序列的第1666~第1838碱基。
本发明的DNA片断是位于稻子PLD基因上游的内含子区,通过本发明明确了其碱基序列;所以,可以采用把稻子的染色体组DNA为模板的PCR法,很容易制备出本发明的DNA片断。PCR法是基因工程领域中经常采用的方法,采用此方法要用的成套仪器市场上均可买到;因此,专业人员很容易实施此方法。在下述实施例中,详细叙述一具体实施例。
一般在具有生理作用的DNA序列中,即使增加、插入、缺失或置换一个或数个核苷酸,也可以维持其生理活性的观点,在专业人员当中正在得到广泛的承认。本发明也进行了这种修饰,而且包含对下游基因的表达有促进作用的DNA片断。也就是说,在序列表中序列号1所示的碱基序列中,增加、缺失或置换一个或数个核苷酸,而且对其下游基因的表达有促进作用的DNA片断也包括在本发明的范围内。特别是序列号1所示的碱基序列中5′末端的5碱基及3′末端的6碱基是外显子部分,所以缺失这些序列的DNA片断对基因的发现也有促进作用,这些片断也包括在本发明的范围之内。
核苷酸的扩增、插入、缺失或置换可以采用众所周知的定点突变法(例如:核酸研究,Vol.10,No.20,P6487-6500,1982)技术就可以做到;本说明书中讲的“一个或数个核苷酸”的意思就是采用定点突变法,可以增加、插入、缺失或置换的核苷酸的数量。
除了所要求的变异不一致之外,可以按下述方法用互补合成的寡核苷酸引物对应接受变异的主链噬菌体DNA进行定点突变。即以上述合成的寡核苷酸为引物给噬菌体合成互补链,用所得到的双链DNA转化成含噬菌体的宿主细菌。将转化了的细菌培养物做成琼脂培养基,使其从含有噬菌体的单一细胞形成噬菌斑。这样,理论上讲50%的新集落含有单链变异的噬菌体,剩余的50%具有原来的序列。使所得到的噬菌斑与其具有上述所要求的变异的DNA完全相同的DNA形成混合物,在与具有原来链的不相同的DNA不形成混合物的温度下,使其与激子酶处理过的合成探针形成混合物。然后,挑选出与该探针形成混合物的噬菌斑,进行培养,回收DNA。
另外,在碱基序列中,做为对下游基因的表达不丧失促进作用的置换、缺失、扩增或插入一个或数个核苷酸的方法,除了上述定点突变之外,还有用变异原处理基因的方法以及选择性地分裂基因,然后把选择出来的核苷酸除去、增加、插入或置换,并进行连接的方法。
本发明中的DNA片断对其下游基因的表达有促进作用。因此,通过把本发明中的DNA片断插到的外源基因的转录部位的5′末端,就可以促进该外源基因的表达。外源基因的表达方法在基因工程领域中已被确立。这种方法是把所希望得到的外源基因插到表达载体的克隆部位,并将其导入宿主细胞,即可使外源基因表达。而且,本发明是按着这种常规方法来使外源基因表达的,方法是将上述本发明中的DNA片断,在与该外源基因功能性连接的状态下,插到该外源基因的上游,这样来使该外源基因表达。这里所谓的本发明的片断与其应找出的下游基因“功能性连接”的意思是指插入本发明的DNA片断,与不插入该DNA片断相比,上述外源基因的表达水平增加了,并可以检测出来。本发明中的DNA即可插到待促进表达的外源基因的紧上游,也可以在本发明中的DNA与该外源基因之间夹杂其它序列。此序列的长度没有特别限定,但通常为0~1000bp左右。本发明中的DNA片断的上游虽还有启动子序列,但本发明的DNA片断即可以插到启动子的紧下游,也可以在启动子和本发明的DNA之间夹杂其它序列。该序列的长度没有特别的限定,但通常为0~1000bp左右。关键是由于插入本发明的DNA片断与未插入该DNA片断相比,对于上述外来基因的表达水平增加了,并可以检测出来,其重组载体均包括在本发明的范围内。
因知道已有载体的克隆部位的碱基序列,所以使用适当的限制酶和连接程序(根据需要)即可很容易将本发明的DNA片断插到载体中。
众所周知,在该领域中有多种这种被发现的载体,而且在市场上有销售。这些被发现的载体至少要包含在宿主细胞内进行复制的复制起点、启动子、给出用于插入外源基因的限制性酶切位点的克隆部位以及抗药性基因等的选择标记,一般包含有稳定结束复制的终止子和SD序列(宿主为细菌时)。本发明方法采用这些众所周知的被发现的任何一种载体均可。实施例:
下面,用实施例对本发明的内容做进一步具体说明。当然,本发明不限于下述实施例。1.米糖PLD的纯化
纯化时,请参考米糠PLD的纯化的有关文献[高野等人,日本食品工业学会志34,8-13(198)]。酶活性是以磷脂酰胆碱为底物,用胆碱氧化酶法定量测定酶反应生成的胆碱。[Imamura er al.,J.Blochem.83,677-680(1978)],但是,PLD的酶反应是在95℃的条件下进行5分钟的热处理后停止。
也就是将1立升己烷加到100g“舆光” (コシヒカリ)稻(Oryza,SatiVa)的米糠中,搅拌一昼夜,脱脂后加入由10g波里古拉鲁AT(ボリヮラ-ル)(商品名:聚乙烯吡咯烷酮、GAF Chemical公司制)、500ml的1mM CaCl2、5mM 2-巯基乙醇组成的10mM Tris-HCl缓中液(pH 7),搅拌1小时,将酶提取出来。把提取液用8层纱布过滤,然后用15,000×g离心20分钟,将中层做为粗提取液。将粗提取液用硫铵处理(65%饱和)、用离心分离(15,000×g,20分钟)方法,收集生成的沉淀,将沉淀溶解后,透析到上述缓冲液中。透析后,离心,除去沉淀做为硫铵试样(画分)。
将此硫铵试样用缓冲液A(10mM Tris-HCl pH7,1mM CaCl2,1mM 2-巯基乙醇)注入老化过的DEAE-纤维素[瓦特曼(ヮシトマン)公司制]的色谱柱(2.0×10cm)中。用约100ml含有50mM NaCl的缓冲液A清洗,然后用120ml NaCl线性浓度梯度为50~350mM的缓冲液A洗脱。PLD用浓度约为0.2M的NaCl进行洗脱。回收代表PLD活性的级分,做为洗脱液(DEAE-纤维素)。
在洗脱液(DEAE-纤维素)中加入3M的硫铵,配成1M的硫铵溶液,用含有1M的硫铵的缓冲液A注入老化过的Phenyl sepharose色谱柱[法马西亚(フマルマシァ)公司制,2.6×10cm]中。用240ml硫铵浓度梯度为1.0~0M的缓冲液A抽提。PLD用浓度约为0.1M的硫铵抽提。回收代表活性的级分,透析到缓冲液A中,做为洗脱液(Phenylsepharose)。
将洗脱液(Phenyl sepharose)用缓冲液A注入老化过的Phenylsepharose色谱柱(法马西亚(フマルマシァ)公司制,2.6×10cm)中。用240ml硫铵浓度梯度为1.0~0M的缓冲液A抽提。PLD用浓度约为0.1的硫铵抽提。回收代表活性的级分,透析到缓冲液A中,做为洗脱液(Phenyl sepharose)。
将洗脱液(Phenyl sepharose)用缓冲液A注入老化过的Mono Q色谱柱(法马西亚(フマルマシァ)公司制的阴离子交换柱16×10cm),用150ml浓度梯度为50~35mM的NaCl缓冲液A洗脱。PLD用浓度为210mM~235mM的NaCl洗脱。回收代表PLD活性的级分(分画),将此溶液透析到缓冲液A上,做为洗脱液(Mono Q lse)。
将洗脱液(Mono Q lst)用离心超级过滤浓缩至0.5ml,用浓度为0.1M的NaCl缓冲液A注入老化过的Superose 6色谱柱[法马西亚(フマルマシァ)公司制1.0×30cm],用同样的缓冲液洗脱。推测PLD的分子量为78KDa。回收代表PLD活性的级分,做为洗脱液(Superose 6)。
洗脱液(Superose 6)中加入2.5ml 40%的两性载体(Pharmacia.pH4.0-6.0)和蒸馏水至50ml,用Rotofore[巴伊屋拉多(バィオラッド)公司制]做等电点电泳。在2℃、12W恒定功率的条件下,电泳4个小时。PLD活性约为pH4.9。回收代表PLD活性的级分,将此溶液透析到缓冲液A中,做为等电点电泳试样。
把等电点电泳试样用缓冲液A注入老化过的Mono Q色谱柱[法马西亚(フマルマシァ)公司制0.5×5cm],用线性浓度梯度为50~35mM的NaCl缓冲液A洗脱。PLD用浓度约为210mM和235mM的NaCl洗脱。回收代表PLD活性的2个级分,做为洗脱液(Mono Q 2nd-I、II)。
通过SDS-聚丙烯酰胺(用7.5%的丙烯酰胺制得的)电泳[laemmli(1970)]来检验洗脱液(Mono Q 2nd-I、II)的纯度。电泳后用染料考马斯亮兰R250将凝胶染色。发现洗脱液在任何情况下主带都在分子量为82KDa的位置上;洗脱液(Mono Q 2nd-II)是单一带。
通过以上纯化,洗脱液(Mono Q 2nd-I、II)的纯化倍率分别是粗洗脱液的380倍、760倍。
对2个级分进行酶的性状分析。其结果示于表1。用于测定最适宜pH值的缓冲液有醋酸钠(pH4-6),MES-NaOH(pH5.5-7.0),Tris-HCl(pH7-9),均为100mM。pH值的稳定性是在25℃,各种pH值的条件下,放置30分钟后,测定其残留活性,看不出活性下降。温度的稳定性,是在4℃、25℃、37℃及50℃的各种温度条件下,放置30分钟后,测定其残留活性。在底物浓度为5mM的条件下测定底物的特异性,以酶对磷脂酰胆碱的作用为100的相对活性表示。
表1 Nono Q 2nd- I Nono Q 2nd- IIKm值最适pHpH稳定性温度稳定性Ca2+依赖性底物特异性磷脂酰胆碱溶血磷脂酰胆碱鞘髓磷脂 0.29mM 6 7-8 4-37℃ ≥20mM 100 13 6 0.29mM 6 7-8 4-37℃ ≥20mM 100 12 42.证明纯化蛋白质是PLD
与检验纯度一样,分别用SDS-聚丙烯酰胺电泳来分离洗脱液
(Mono Q 2nd-I、II),转移到PVDF膜[Millipore公司制]上,然后染色。切下82Kda蛋白质带,用氨基酸序列分析仪(岛津制作所.PSQ-1)来测定N末端氨基酸序列。均可分析到10个残基,序列也相同。其序列如下所述。
Val Gly Lys Gly Ala Thr Lys Val Tyr Ser
在两个活性试样中看到的82KDa蛋白质的关系虽不明确,但至少氨基酸序列等级非常相似,在制备用来制作抗体的抗原时,使用两试样的混合液是没问题的。
用SDS-聚丙烯酰胺(用7.5%的丙烯酰胺制得的)电泳来分离洗脱液(Mono Q 2nd-I、II)的混合液,用考马斯亮兰染料将凝胶染色。切下82KDa的蛋白质带,用电洗脱(25mM Tris、192mM乙氨酸、0.025%SDS、100V、10小时)回收。再用电透析(15mM碳酸氢铵、200V、5小时)除去SDS后,冷冻干燥。电洗脱、电透析时使用BIOTRAP(Schleicher和Schuell公司制)。
把用上述方法高度纯化的82KDa蛋白质每隔7天,每次50μg给兔子进行免疫,用免疫前及免疫3次后的血清、进行免疫滴定实验。在8.6×10-3单位的PLD溶液中加入0~50μl的免疫前或免疫3次后的血清,50μl的250mM Tris-HCl(pH7.0),5μl的50mM CaCl2,50μl的0.2%Triton X-100(商品名)和水,总量为250μl,在室温下,放置2.5个小时。加入200μl的Protein A Sepharose(Pharmacia),在室温下缓慢振动2小时,然后离心(500×g、5分钟)测定上清液的酶活性。以不加血清时的酶活性为100%,加入20μl、50μl免疫前的血清,其酶活性分别为95%、88%、而加入20μl、50μl免疫3次后的血清,其酶活性分别为75%、30%。其结果证明了82KDa蛋白质为PLD。3.内部氨基酸序列的测定
PLD蛋白质的片断化采用了在凝胶中电泳分离的方法[Clevelandet al,J.Biol.Chem.,252,1102(1977)]。将含有PLD蛋白质(用与2同样的方法提出的)的凝胶插到用肽分离制备的1 5%丙烯酰胺凝胶的电泳槽中,将PLD蛋白质量的1/10的金黄色葡萄球菌V8蛋白酶(和光纯药公司制)混合后,开始电泳。溴酚蓝到达凝胶的中央时,暂停电泳,30分钟后再开始电泳。电泳完以后转移到PVDF膜上,染色。在分子量为20、14、13、11及10KDa的位置上可以看到清晰的带型。切除分子量为20、14及13KDa的肽片断的带,用氨基酸序列分析仪测定氨基酸的序列。其序列如下所示:20 Kda Asn Tyr Phe His GlV Ser Asp Val Asn ?Val
Leu ?Pro Arg Asn Pro Asp Asp(Asp)??
lle14 Kda Thr ?Asn Val Gln Leu Phe Arg Ser Ile Asp
Gly Gly Ala Ala Phe Gly Phe Pro Asp Thr
Pro Glu Glu Ala Ala Lys ? Gly Leu Val Ser
Gly13 Kda Ile Ala Met Gly Gly Tyr Gln Phe Tyr His Leu
Ala Thr Arg Gln Pro Ala Arg Gly Gln Ile His
Gly Phe Arg Met Ala Leu ? Tyr Glu His Leu
Gly Met Leu ? Asp Val Phe(其中:?-表示不能确定是氨基酸的残基()-表示很可能是其它的氨基酸的残基。)4.稻子未成熟的种子cDNA基因文库的制备
根据SDS苯酚法,从开花5天后的未成熟的种子中萃取出所有的RNA,并用氯化锂沉淀进行调制。Poly(A)+RNA的调制是用Oligotex-dT30(宝酒造公司制)按制造商的说明书来进行的。
把cDNA合成系统プラス[阿玛霞目(ァマシャム)公司制]、cDNA克隆系统λgt10[阿玛霞目(ァマシャム)公司制]用于cDNA克隆,但要把λZAPII载体[斯托拉塔金(ストラタジ-ン)公司制]做为克隆载体使用,把XLl-Blue做为宿主细胞使用。5.探针的制备
利用DNA合成装置[阿甫拉依多巴依奥(ァプラィドバィオシステムズ)系统公司制]合成与PLD的氨基酸序列相应的寡核苷酸。其序列和与这些序列相应的氨基酸序列如下所述。
20KF 5′AAYTAYTTYCAYGG 3′
20KR 1 5′RTCRTCRTCNGGRTT 3′
(其中:R表示嘌呤类A或G,Y表示嘧啶类T或C,N表示G、A、T及C中任何一种)
20KF是32种寡核苷酸的混合物,它包括了对在分子量为20KDa的肽中发现的氨基酸序列Asn Tyr Phe His Gly进行了编码的DNA碱基序列;
20KR1是128种寡核苷酸的混合物,它包括了对在分子量为20KDa的肽中发现的氨基酸序列Asn Pro Asp Asp(Asp)进行了编码的DNA碱基序列的互补链。
cDNA合成反应液总体积为10μl,参与反应的物质有10ng poly(A)+RNA,0.3μg的随机六聚体dN6、10U的RNA酶抑制剂[RNA Guard、法马西亚(Pharmacia)公司制]、1mM的dATP、dCTP、dGTP及dTTP、1×PCR缓冲液(宝酒造公司制)、50mM的氯化镁以及100U的逆转录酶(M-MuLV RTase,BRL公司制)。在37℃下反应30分钟,然后在95℃下进行5分钟热处理,保持在冰上。
进行聚合酶链式反应(PCR)时,以上述cDNA为模板,20KF和20KR1为引物。反应液的总容积为50μl,参与反应的物质有10μl cDNA合成反应液,50pmol各种引物的混合物,200μM的dATP、dCTP、dGTP及dTTP、1×PCR缓冲液(宝酒造公司制)及2.5U AmliTaq DNA聚合酶(宝酒造公司制)。按下述温度条件反应,反复进行30个循环;在DNA的PCR仪[拍金爱尔马·喜塔斯(パ一キンェルマ一シ一タス)公司制]中,94℃下,反应1分钟;40℃下,反应1分钟;72℃下,反应2分30秒钟。
在2%的琼脂凝胶上将PCR产物分离,用溴化乙锭染色法检测几个片断。其中一个的长度为94bp,与预想的大小相同。
从凝胶中提出PCR片断,在pUC19质粒中进行亚克隆。根据双脱氧法(该方法使用T7 sequencing成套仪器)来决定做了亚克隆的PCR片断的DNA序列。在二个引物之间发现了对预测到的氨基酸的碱基序列进行了编码的DNA碱基序列。引物之间的DNA碱基序列和其编了码的氨基酸如下所述。 C TCT GAC GTG AAC TGT GTT CTA TGC CCT CGC
Ser Asp Val Asn Cys Val Leu Cys Pro Arg
使用DNA5′末端标记的成套仪器MEGALABEL(宝酒造公司)让同位素32P[阿玛霞目(ァマシャム)公司制]掺入上述寡核苷酸,制成放射性寡核苷酸探针。6.含有PLD基因的克隆的筛选
以上述放射性寡核苷酸为探针来筛选cDNA基因文库。杂交溶液是0.5M的磷酸钠缓冲液(pH7.2),7%SDS,1mM EDTA,100μg/ml鲑鱼精子,将探针加到杂交溶液中,在45℃下,杂交16个小时。清洗液为0.3M NaCl、30mM柠檬酸钠,在45℃下,清洗2次,每次20分钟。分离阳性噬菌斑,按λZAPII克隆载体制造商给出的方法,在体外(in vivo)对pBluescript质粒[斯托拉塔金(ストラタジ一ン)公司制]进行克隆。用双脱氧法决定碱基序列的部位,存在有对3.中测定的内部氨基酸地碱基序列进行编码的区域。7.测定5′末端区域的碱基序列
6.中所写的方法不能分离包含全长的cDNA的克隆,所以用RACE法[Edwards et al,Nucleic Acids Res.,19,5227-5232(1991)]来制备含有5′末端区的DNA片断。按着所附的说明5′-Ampli FINDER RACE Kit[固伦铁固(クロ一ンテッケ)公司制],以按6.测定的cDNA的碱基序列为基础,合成低聚DNA,用4中所述的方法制成的mRNA为模板,进行PCR。将PCR产物克隆在PCRII载体[因毕特罗金(ィンビトロジェン)公司制]上,用双脱氧法测定碱基序列。将这样决定了稻子PLD的cDNA的碱基序列及碱基序列编码,由此推测出的氨基酸序列示于序列表的序列2。译码推测是从示于序列表2的第182号碱基开始。其根据是36碱基上游存在终止密码子。8.与PLD cDNA克隆相应的PLD染色体组克隆的分离及引物区域的鉴定
为了分离负责PLD基因的调节序列的染色体组DNA的克隆,要建立一个“舆光”稻的染色体文库;该PLD基因与在pBluescript质粒中进行克隆的按6.测定的PLD cDNA相对应。将“舆光”种子发芽长出来的叶DNA用MboI进行部分消化,通过蔗糖梯度离心分离,纯化出1 6~20kb的大的部分,使用λDASHII[斯托拉塔金(ストラタジ一ン)公司制]、Gigapack II Cold[斯托拉塔金(ストラタジ一ン)公司制]来建立基因文库。把PLD cDNA克隆做为探针来筛选染色体组文库。按6.所述内容进行筛选。但在65℃下,杂交16小时,用0.5×SSC、0.1%SDS的清洗液在65℃下清洗两次,每次20分钟。用双脱氧法测定杂交过的染色体组克隆的碱基序列,存在有与按6测定的cDNA序列相同的范围。
复制开始的部位用7.所述的方法测定。在复制开始的位点旁边发现了“TATA”共有序列序列框。ATG编码开始的部位通过测定DNA序列来判断,则定为克隆的译码阅读框内的最上游的ATG密码子,还有在稻子中合成的mRNA的起始存在ATG密码子。
杂交在cDNA克隆的染色体组克隆的部分DNA序列示于序列号3。在染色体组DNA中以ATG译码开始的密码子开始,鉴定了与其相应的cDNA序列重合的阅读框。启动子位于ATG编码开始密码子的上游,从紧靠其上游开始。
9.内含子的确定以及基因表达作用的分析
通过cDNA(序列号2)和染色体组(序列号3)的比较,明确了PLD的基因上有3个内含子。之后,调查了173bp内含子对发现植物细胞内的基因的影响。173bp内含子区(即序列号3中所示的碱基序列的第1666~第1838号碱基,将该序列示于序列号4)位于与mRNA的5′末端非编码区相应的位置上。合成每5个基数含有一个外显子部分的15聚体的引物(5′-ACCCGGTAAGCCCAG-3′,3′-CCCCCGCGTCCATCC-5′),以染色体克隆为模板,采用“5.探针的制作”中所述的方法来进行PCR。将PCR产物亚克隆到PCR II载体上,将从这里用EcoRI酶切提出来的片断做平末端处理;然后装到质粒pBI221(东洋纺公司制)的SmaI位点(参照图1)。下面,根据已经报导[Shimamoto et al.Nature,338,274-276(1989)]的方法,将上述重组质粒导入稻子的培养细胞[Babaet al.Plant Cell Physiol。27,463-471(1986)],测定β-葡萄糖苷酸酶(GUS)活性。如表2所示,发现由于内含子的导入,GUS活性增大了。如表3有所示,还发现了内含子反向进入时,GUS活性也增大。另外,利用内含子序列中的BgIII部位和pBI 221的BamHI部位,根据用双酶提出的片断的长度来决定内含子的方向。
表2 原生质体的GUS活性 质粒 GUS活性 pBI221 10.4 pBI221+内含子 105.7
(pmol MU/min./mg蛋白)
表3 原生质体的GUS活性 质粒 GUS活性 pBI 221 8.3 pBI 221+内含子 79.4 pBI 221+内含子(反向) 54.2(pmol MU/min/mg蛋白)
序列表序列号: 1序列长度:183序列类型:核酸序列种类:基因组DNA起源 生物名:稻 序列ACCCGGTAAG CCCAGTGTGC TTAGGCTAAG CGCACTAGAG CTTCTTGCTC GCTTGCTTCT 60TCTCCGCTCA GATCTGCTTG CTTGCTTGCT TCGCTAGAAC CCTACTCTGT GCTGCGAGTG 120TCGCTGCTTC GTCTTCCTTC CTCAAGTTCG ATCTGATTGT GTGTGTGGGG GGGCGCAGGT 180AGG 183序列号: 2序列长度:3040序列类型:核酸序列种类:cDNA到mRNA起源 生物名:稻序列AGTCTCTCTT CTCCCGCAAT TTTATAATCT CGATCGATCC AATCTGCTCC CCTTCTTCTT 60CTACTCTCCC CATCTCGGCT CTCGCCATCG CCATCCTCCT CTCCCTTCCC GGAGAAGACG 120CCTCCCTCCG CCGATCACCA CCCGGTAGGG CGAGGAGGGA GCCAAATCCA AATCAGCAGC 180C ATG GCG CAG ATG CTG CTC CAT GGG ACG CTG CAC GCC ACC ATC TTC GAG 229Met Ala Gln Met Leu Leu His Gly Thr Leu His Ala Thr Ile Phe Glu 1 5 10 15GCG GCG TCG CTC TCC AAC CCG CAC CGC GCC AGC GGA AGC GCC CCC AAG 277Ala Ala Ser Leu Ser Asn Pro His Arg Ala Ser Gly Ser Ala Pro Lys
20 25 30TTC ATC CGC AAG TTT GTG GAG GGG ATT GAG GAC ACT GTG GGT GTC GGC 325Phe Ile Arg Lys Phe Val Glu Gly Ile Glu Asp Thr Val Gly Val Gly
35 40 45AAA GGC GCC ACC AAG GTG TAT TCT ACC ATT GAT CTG GAG AAA GCT CGT 373Lys Gly Ala Thr Lys Val Tyr Ser Thr Ile Asp Leu Glu Lys Ala Arg
50 55 60GTA GGG CGA ACT AGG ATG ATA ACC AAT GAG CCC ATC AAC CCT CGC TGG 421Val Gly Arg Thr Arg Met Ile Thr Asn Glu Pro Ile Asn Pro Arg Trp 65 70 75 80TAT GAG TCG TTC CAC ATC TAT TGC GCT CAT ATG GCT TCC AAT GTG ATC 469Tyr Glu Ser Phe His Ile Tyr Cys Ala His Met Ala Ser Asn Val Ile
85 90 95TTC ACT GTC AAG ATT GAT AAC CCT ATT GGG GCA ACG AAT ATT GGG AGG 517Phe Thr Val Lys Ile Asp Asn Pro Ile Gly Ala Thr Asn Ile Gly Arg
100 105 110GCT TAC CTG GCT GTC CAA GAG CTT CTC AAT GGA GAG GAG ATT GAC AGA 565Ala Tyr Leu Pro Val Gln Glu Leu Leu Asn Gly Glu Glu Ile Asp Arg
115 120 125TGG CTC GAT ATC TGT GAT AAT AAC CGC GAG TCT GTT GGT GAG AGC AAG 613Trp Leu Asp Ile Cys Asp Asn Asn Arg Glu Ser Val Gly Glu Ser Lys
130 135 140ATC CAT GTG AAG CTT CAG TAC TTC GAT GTT TCC AAG GAT CGC AAT TGG 661Ile His Val Lys Leu Gln Tyr Phe Asp Val Ser Lys Asp Arg Asn Trp145 150 155 160GCG AGG GGT GTC CGC AGT ACC AAG TAT CCA GGT GTT CCT TAC ACC TTC 709Ala Arg Gly Val Arg Ser Thr Lys Tyr Pro Gly Val Pro Tyr Thr Phe
165 170 175TTC TCT CAG AGG CAA GGG TGC AAA GTT ACC TTG TAC CAA GAT GCT CAT 757Phe Ser Gln Arg Gln Gly Cys Lys Val Thr Leu Tyr Gln Asp Ala His
180 185 190GTC CCA GAC AAC TTC ATT CCA AAG ATT CCG CTT GCC GAT GGC AAG AAT 805Val Pro Asp Asn Phe Ile Pro Lys Ile Pro Leu Ala Asp Gly Lys Ash
195 200 205TAT GAA CCC CAC AGA TGC TGG GAG GAT ATC TTT GAT GCT ATA AGC AAT 853Tyr Glu Pro His Arg Cys Trp Glu Asp Ile Phe Asp Ala Ile Ser Asn
210 215 220GCT CAA CAT TTG ATT TAC ATC ACT GGC TGG TCT GTA TAC ACT GAG ATC 901Ala Gln His Leu Ile Tyr Ile Thr Gly Trp Ser Val Tyr Thr Glu lle225 230 235 240ACC TTG GTT AGG GAC TCC AAT CGT CCA AAA CCT GGA GGG GAT GTC ACC 949Thr Leu Val Arg Asp Ser Asn Arg Pro Lys Pro Gly Gly Asp Val Thr
245 250 255CTT GGG GAG TTG CTC AAG AAG AAG GCC AGT GAA GGT GTT CGG GTC CTC 997Leu Gly Glu Leu Leu Lys Lys Lys Ala Ser Glu Gly Val Arg Val Leu
260 265 270ATG CTT GTG TGG GAT GAC AGG ACT TCA GTT GGT TTG CTA AAG AGG GAT 1045Met Leu Val Trp Asp Asp Arg Thr Ser Val Gly Leu Leu Lys Arg Asp
275 280 285GGC TTG ATG GCA ACA CAT GAT GAG GAA ACT GAA AAT TAC TTC CAT GGC 1093Gly Leu Met Ala Thr His Asp Glu Glu Thr Glu Asn Tyr Phe His Gly
290 295 300TCT GAC GTG AAC TGT GTT CTA TGC CCT CGC AAC CCT GAT GAC TCA GGC 1141Ser Asp Val Asn Cys Val Leu Cys Pro Arg Asn Pro Asp Asp Ser Gly305 310 315 320AGC ATT GTT CAG GAT CTG TCG ATC TCA ACT ATG TTT ACA CAC CAT CAG 1189Ser Ile Val Gln Asp Leu Ser Ile Ser Thr Met Phe Thr His His Gln
325 330 335AAG ATA GTA GTT GTT GAC CAT GAG TTG CCA AAC CAG GGC TCC CAA CAA 1237Lys Ile Val Val Val Asp His Glu Leu Pro Asn Gln Gly Ser Gln Gln
340 345 350AGG AGG ATA GTC AGT TTC GTT GGT GGC CTT GAT CTC TGT GAT GGA AGG 1285Arg Arg Ile Val Ser Phe Val Gly Gly Leu Asp Leu Cys Asp Gly Arg
355 360 365TAT GAC ACT CAG TAC CAT TCT TTG TTT AGG ACA CTC GAC AGT ACC CAT 1333Tyr Asp Thr Gln Tyr His Ser Leu Phe Arg Thr Leu Asp Ser Thr His
370 375 380CAT GAT GAC TTC CAC CAG CCA AAC TTT GCC ACT GCA TCA ATC AAA AAG 1381His Asp Asp Phe His Gln Pro Asn Phe Ala Thr Ala Ser Ile Lys Lys385 390 395 400GGT GGA CCT AGA GAG CCA TGG CAT GAT ATT CAC TCA CGG CTG GAA GGG 1429Gly Gly Pro Arg Glu Pro Trp His Asp Ile His Ser Arg Leu Glu Gly
405 410 415CCA ATC GCA TGG GAT GTT CTT TAC AAT TTC GAG CAG AGA TGG AGA AAG 1477Pro Ile Ala Trp Asp Val Leu Tyr Asn Phe Glu Gln Arg Trp Arg Lys
420 425 430CAG GGT GGT AAG GAT CTC CTT CTG CAG CTC AGG GAT CTG TCT GAC ACT 1525Gln Gly Gly Lys Asp Leu Leu Leu Gln Leu Arg Asp Leu Ser Asp Thr
435 440 445ATT ATT CCA CCT TCT CCT GTT ATG TTT CCA GAG GAC AGA GAA ACA TGG 1573Ile Ile Pro Pro Ser Pro Val Met Phe Pro Glu Asp ArgGlu Thr Trp
450 455 460AAT GTT CAG CTA TTT AGA TCC ATT GAT GGT GGT GCT GCT TTT GGG TTC 1621Asn Val Gln Leu Phe Arg Ser Ile Asp Gly Gly Ala Ala Phe Gly Phe465 470 475 480CCT GAT ACC CCT GAG GAG GCT GCA AAA GCT GGG CTT GTA AGC GGA AAG 1669Pro Asp Thr Pro Glu Glu Ala Ala Lys Ala Gly Leu Val Ser Gly Lys
485 490 495GAT CAA ATC ATT GAC AGG AGC ATC CAG GAT GCA TAC ATA CAT GCC ATC 1717Asp Gln Ile Ile Asp Arg Ser Ile Gln Asp Ala Tyr Ile His Ala Ile
500 505 510CGG AGG GCA AAG AAC TTC ATC TAT ATA GAG AAC CAA TAC TTC CTT GGA 1765Arg Arg Ala Lys Asn Phe Ile Tyr Ile Glu Asn Gln Tyr Phe Leu Gly
515 520 525AGT TCC TAT GCC TGG AAA CCC GAG GGC ATC AAG CCT GAA GAC ATT GGT 1813Ser Ser Tyr Ala Trp Lys Pro Glu Gly Ile Lys Pro Glu Asp Ile Gly
530 535 540GCC CTG CAT TTG ATT CCT AAG GAG CTT GCA CTG AAA GTT GTC AGT AAG 1861Ala Leu His Leu Ile Pro Lys Glu Leu Ala Leu Lys Val Val Ser Lys545 550 555 560ATT GAA GCC GGG GAA CGG TTC ACT GTT TAT GTT GTG GTG CCA ATG TGG 1909Ile Glu Ala Gly Glu Arg Phe Thr Val Tyr Val Val Val Pro Met Trp
565 570 575CCT GAG GGT GTT CCA GAG AGT GGA TCT GTT CAG GCA ATC CTG GAC TGG 1957Pro Glu Gly Val Pro Glu Ser Gly Ser Val Gln Ala Ile Leu Asp Trp
580 585 590CAA AGG AGA ACA ATG GAG ATG ATG TAC ACT GAC ATT ACA GAG GCT CTC 2005Gln Arg Arg Thr Met Glu Met Met Tyr Thr Asp Ile Thr Glu Ala Leu
595 600 605CAA GCC AAG GGA ATT GAA GCG AAC CCC AAG GAC TAC CTC ACT TTC TTC 2053Gln Ala Lys Gly Ile Glu Ala Asn Pro Lys Asp Tyr Leu Thr Phe Phe
610 615 620TGC TTG GGT AAC CGT GAG GTG AAG CAG GCT GGG GAA TAT CAG CCT GAA 2101Cys Leu Gly Asn Arg Glu Val Lys Gln Ala Gly Glu Tyr Gln Pro Glu625 630 635 640GAA CAA CCA GAA GCT GAC ACT GAT TAC AGC CGA GCT CAG GAA GCT AGG 2149Glu Gln Pro Glu Ala Asp Thr Asp Tyr Ser Arg Ala Gln Glu Ala Arg
645 650 655AGG TTC ATG ATC TAT GTC CAC ACC AAA ATG ATG ATA GTT GAC GAT GAG 2197Arg Phe Met Ile Tyr Val His Thr Lys Met Met Ile Val Asp Asp Glu
660 665 670TAC ATC ATC ATC GGT TCT GCA AAC ATC AAC CAG AGG TCG ATG GAC GGC 2245Tyr Ile Ile Ile Gly Ser Ala Asn Ile Asn Gln Arg Ser Met Asp Gly
675 680 685GCT AGG GAC TCT GAG ATC GCC ATG GGC GGG TAC CAG CCA TAC CAT CTG 2293Ala Arg Asp Ser Glu Ile Ala Met Gly Gly Tyr Gln Pro Tyr His Leu
690 695 700GCG ACC AGG CAA CCA GCC CGT GGC CAG ATC CAT GGC TTC CGG ATG GCG 2341Ala Thr Arg Gln Pro Ala Arg Gly Gln Ile His Gly Phe Arg Met Ala705 710 715 720CTG TGG TAC GAG CAC CTG GGA ATG CTG GAT GAT GTG TTC CAG CGC CCC 2389Leu Trp Tyr Glu His Leu Gly Met Leu Asp Asp Val Phe Gln Arg Pro
725 730 735GAG AGC CTG GAG TGT GTG CAG AAG GTG AAC AGG ATC GCG GAG AAG TAC 2437Glu Ser Leu Glu Cys Val Gln Lys Val Asn Arg Ile Ala Glu Lys Tyr
740 745 750TGG GAC ATG TAC TCC AGC GAC GAC CTC CAG CAG GAC CTC CCT GGC CAC 2485Trp Asp Met Tyr Ser Ser Asp Asp Leu Gln Gln Asp Leu Pro Gly His
755 760 765CTC CTC AGC TAC CCC ATT GGC GTC GCC AGC GAT GGT GTG GTG ACT GAG 2533Leu Leu Ser Tyr Pro Ile Gly Val Ala Ser Asp Gly Val Val Thr Glu
770 775 780CTG CCC GGG ATG GAG TAC TTT CCT GAC ACA CGG GCC CGC GTC CTC GGC 2581Leu Pro Gly Met Glu Tyr Phe Pro Asp Thr Arg Ala Arg Val Leu Gly785 790 795 800GCC AAG TCG GAT TAC ATG CCC CCC ATC CTC ACC TCA TAGACGAGGA AGCACT 2633Ala Lys Ser Asp Tyr Met Pro Pro Ile Leu Thr Ser
805 810ACACTACAAT CTGCTGGCTT CTCCTGTCAG TCCTTCTGTA CTTCTTCAGT TTGGTGGCGA 2693GATGGTATGG CCGTTGTTCA GAATTTCTTC AGAATAGCAG TTGTTACAGT TGTGAATCAT 2753AAAGTAATAA GTGCAGTATC TGTGCATGGT TGAGTTGGGA AGAAGATCGG GGATGCAATG 2813ATGCTTGTGA AGTTGTGATG CCGTTTGTAA GATGGGAAGT TGGGAACTAC TAAGTAATTG 2873GCATGATTGT ACTTTGCACT ACTGTTTAGC GTTGTTGATA CTGGTTAACC GTGTGTTCAT 2933CTGAACTTGA TTCTTGATGC AGTTTGTGGC ATTACCAGTT TATCATCGTT CTTCAGGAAA 2993AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAA 3040序列号: 3序列长度:2799序列类型:核酸序列种类:基因组DNA起源 生物名:稻序列CAAGGGTGTA CATAGATTTG TCTCGTAAAA TAGTATTATA ATATTATAAA CTTATTACTC 60TATCCGTTCT AAAATATAAG AACCTTATGA CTGGATGGAA CATTTCCTAG TACTACGAAT 120CTGAACACAT GTCTAGATTC ATAGTACTAG GAAATGTCTC ATCGCGGTAC TAGGTTCTTA 180TATTTTAGGA TGGAGGGAGT TTAATATAAA ACTAATGGTT AGAACTTTGA AAGTTTGATT 240TTAAATGTCA AATATTTATG GCTGGAGGTA GTATAATATG TTTTTTTTGG GACGTAGACT 300AGGTAGTATA ATATGTTTGG TTGTGTTTAG ATCCAATATT TGGATCCAAA CTTCAGTCAT 360TTTCCATCAC ATCAACTTGT CATATACACA TAACTTTTCA GTCACATCAT CCCCAATTTC 420AACCAAAATC AAACTTTGCG CTGAACTAAA CACAACCTTT GGGCCCGTTT AGTTCCCCAA 480TTTTTTTCCC AAAAACATCA CATCGAATCT TTGGACACAT GCATGAAGCA TTAAATATAG 540ATAAAAAGAA AAACTAATTG CACAGTTATG GAGGAAATCG CGAGACGAAT CTTTTAAGCC 600TAATTAGTCC GTGATTAGCC ATAAGTGCTA CAGTAACCCA ATTGTGCTAA TGACGGCTTA 660ATTAGTCTCC ACAAGATTCG TCTCGCAGTT TCCAGGCGAG TTCTGAAATT AGTTTTTTCA 720 TTCGTGTCCG AAAACCCCTT CCGACATCCG GTCAAACGTT CGATATGACA CCCACAAATT 780TTCTTTTCCC CAACTAAACA CACCCTTTAT CTCTTACCCT CTGGCTCTTT CAGTAGGCAT 840ATCCAAGACA GCTGGTAATG CAGGCTCGGA CATAATTTGA CAGTTACGTT CATGTGACCG 900ACGGTTGATG CTAGTGCAAC TGCAACATAC TGTTCAGATG GATGTCCCAA CGAGCTCAAA 960ACAACTTAGG TGGCGCGTCG CGATTCATCA ATAACTCAAA TGGAAGCGCA AGTGCACGTA 1020CGAAAATGAC AGCGAGTGAG GTGGCGAGCC TCACCTTGGT GATCCCAACC GGATAAGCTA 1080TGCATCAGCC AGTTTCGTGG GGCTGCACAT TTCGTCGAAC ACCTGGAGTC CACGCCGCCG 1140GCGACGTCGG CACAGCGCGC CCGCCCACCG CCCACGCACG CGCTTGACTC CACCCATGTT 1200CTCCCTTCTC GACGCCCGCG AAGCCAGCGA ACCGATCCGA GGAAGTCAAG CCCCCACCGC 1260CACTTGGACC GACCTCGGGA CGACGACGCC CCCGCGCTCT TCTAGACGCG CGGACGACGC 1320GGGCGCTGGC TCCGCGACGC GACGTCGCGG TCATGGAGTA ACCGCGACGG ACAGATACTT 1380CTACCCGTTT TTAACCTCGC CTCCTCCTCC TCCCGGCTCG AGATCCGTGG CCACGACGCG 1440TGGTGGGAAA CCGGGAACGA CGTGCACGCA CGCACACAGG GCAAGTTTCA GTAGAAAAAT 1500CGCCGGCATC CAGATCGGGA CAGTCTCTCT TCTCCCGCAA TTTTATAATC TCGCTCGATC 1560CAATCTGCTC CCCTTCTTCT TCTACTCTCC CCATCTCGGC TCTCGCCATC GCCATCCTCC 1620TCTCCCTTCC CGGAGAAGAC GCCTCCCTCC GCCGATCACC ACCCGGTAAG CCCAGTGTGC 1680TTAGGCTAAG CGCACTAGAG CTTCTTGCTC GCTTGCTTCT TCTCCGCTCA GATCTGCTTG 1740CTTGCTTGCT TCGCTAGAAC CCTACTCTGT GCTGCGAGTG TCGCTGCTTC GTCTTCCTTC 1800CTCAAGTTCG ATCTGATTGT GTGTGTGGGG GGGCGCAGGT AGGGCGAGGA GGGAGCCAAA 1860TCCAAATCAG CAGCC ATG GCG CAG ATG CTG CTC CAT GGG ACG CTG CAC GCC 1911
Met Ala Gln Met Leu Leu His Gly Thr Leu His Ala
1 5 10ACC ATC TTC GAG GCG GCG TCG CTC TCC AAC CCG CAC CGC GCC AGC GGA 1959Thr Ile Phe Glu Ala Ala Ser Leu Ser Asn Pro His Arg Ala Ser Gly
15 20 25AGC GCC CCC AAG TTC ATC CGC AAG GTTCGGACCC TTCTCCTTAA TCTACTCGTC 2013Ser Ala Pro Lys Phe Ile Arg Lys
30 35TTTGCTCTTG CTCTTTTTCT TTTGTGTCCC TTTCTTGTGT GTGCGTTTGC ATGAGCCCGA 2073ATTTGATCTG CTAGTGCACA GTACAGTCAG ATACACTGAA ACGATCTGGA AATTCTGGAT 2133TATTAGGAAA AATAAAGAGG TAGTAGACAA GAATTGGAGA TACTTTCTAT CAAGATTGGT 2193CTATTATGCT TGGCCATTTC TTGTTTGACC CAAGTACTTC TTTGAATCTA GAGTTTGCTG 2253TGTGTGATGT GGTGTGTGTT TGTGTCACCA AAAATCTTCA TTAGCTAAAA CTGAAATTTT 2313ATTTATTAAC TGACCTACTA AAAATGTAGA GTTCTCTGTG TGTGATGTGT GCTTGTGTCA 2373CCAAAAATCT TGATTTGATA GAGTTTTTAT TTATTTATTA ACTGACCTAC TACAAATCTA 2433TTGCTGTATG CTATGTGTGT CTGTATCACC TGAAATGCAA TGTCTTCTTC TTTGTTGTTC 2493TTGATCTAAC ACGTGAGCTC ATGTCAACAG TTT GTG GAG GGG ATT GAG GAC ACT 2547
Phe Val Glu Gly Ile Glu Asp Thr
40GTG GGT GTC GGC AAA GGC GCC ACC AAG GTG TAT TCT ACC ATT GAT CTG 2595Val Gly Val Gly Lys Gly Ala Thr Lys Val Tyr Ser Thr Ile Asp Leu45 50 55 60GAG AAA GCT CGT GTA GGG CGA ACT AGG ATG ATA ACC AAT GAG CCC ATC 2643Glu Lys Ala Arg Val Gly Arg Thr Arg Met Ile Thr Asn Glu Pro Ile65 70 75AAC CCT CGC TGG TAT GAG TCG TTC CAC ATC TAT TGC GCT CAT ATG GCT 2691Asn Pro Arg Trp Tyr Glu Ser Phe His Ile Tyr Cys Ala His Met Ala80 85 90TCC AAT GTG ATC TTC ACT GTC AAG ATT GAT AAC CCT ATT GGG GCA ACG 2739Ser Asn Val Ile Phe Thr Val Lys Ile Asp Asn Pro Ile Gly Ala Thr95 100 105AAT ATT GGG AGG GCT TAC CTG CCT GTC CAA GAG CTT CTC AAT GGA GAG 2787Asn Ile Gly Arg Ala Tyr Leu Pro Val Gln Glu Leu Leu Asn Gly Glu110 115 120GAG ATT GAC AGA 2799Glu Ile Asp Arg125序列号: 4序列长度:173序列类型:核酸序列种类:基因组DNA起源 生物名:稻序列GTAAGCCCAG TGTGCTTAGG CTAAGCGCAC TAGAGCTTCT TGCTCGCTTG CTTCTTCTCC 60GCTCAGATCT GCTTGCTTGC TTGCTTCGCT AGAACCCTAC TCTGTGCTGC GAGTGTCGCT 120GCTTCGTCTT CCTTCCTCAA GTTCGATCTG ATTGTGTGTG TGGGGGGGCG CAG 173