一种锌指蛋白基因的新用途 【技术领域】
本发明涉及一种锌指蛋白基因的新用途。
背景技术
双生病毒(Geminivirus)是一类具有双生颗粒形态的植物单链环状DNA病毒。它在自然界中的宿主很广,包括许多重要的经济作物。双生病毒病对农业生产造成巨大损失。甜菜曲顶病毒(BSCTV,beet severe curly top virus)是双生病毒的一个种,也是少数能感染模式植物拟南芥的双生病毒之一。
双生病毒的扩增是通过滚环复制的方式在宿主植物的细胞核中进行的。由于双生病毒的基因组编码的蛋白种类很少,所以双生病毒的复制主要依赖宿主的因子。双生病毒侵染的细胞大多数都是分化的细胞,双生病毒的DNA在分化的细胞中很难复制,所以双生病毒必须诱导宿主细胞重新进入细胞周期,从而为病毒的复制创造良好的环境。
近期国际上的一些报道为研究双生病毒与宿主细胞周期的关系提供了一些线索:双链DNA形式的病毒在植物细胞S期的细胞核里大量积累;植物中的DNA复制相关蛋白PCNA的表达量受到双生病毒TGMV的诱导非常明显;某些双生病毒的Rep或RepA蛋白能够与植物细胞的G/S期转换激活子RBR相互作用,从而调控植物的细胞周期。
很多双生病毒的侵染都能诱导植物细胞分裂,从而使植物产生叶脉弯曲等症状。其中,一种双生病毒甜菜曲顶病毒编码的C4蛋白被认为是一个主要的病症决定因子。在烟草中表达甜菜曲顶病毒的C4导致烟草不正常的细胞分裂。另外,一些病毒种的C4蛋白可能参与病毒的移动和基因沉默抑制等过程。
在真核细胞中,细胞周期调控的机制是比较保守的。植物细胞周期主要由CDK/cyclin复合物调控。CDK/cyclin复合物的活性会被CDK的抑制子(CKI)所抑制。在拟南芥中有七个与哺乳动物CKIp27同源的蛋白,被称为KRP或者ICK蛋白。在植物中过表达KRP/ICK蛋白会使植物的细胞减少从而阻碍植物的生长。在哺乳动物中,CKIp27通过两条途径进行降解,一条是通过细胞核内的SCFskp2,另一条通过细胞质中的KPC途径,该途径包括两个蛋白KPC1和KPC2。最近,在植物中发现了一个相似的KRP/ICK蛋白降解的冗余调控机制。
【发明内容】
本发明的目的是提供一种锌指蛋白基因的新用途。
该新用途是编码锌指蛋白(序列表中序列1所示蛋白)基因(At2g22010)在培育抗双生病毒植物中的应用。
上述锌指蛋白来源于拟南芥。本发明的发明人发现其表达受甜菜曲顶病毒(BSCTV)的C4蛋白诱导,该基因与人类的KPC1同源,被命名为RKP(Related to KPC1)基因。其中,所述RKP基因的编码序列具体可是序列表中的序列2。所述RKP基因可用来培育抗双生病毒的转基因单子叶植物和双子叶植物。
所述双生病毒具体可为甜菜曲顶病毒。
本发明的另一个目的是提供一种培育抗双生病毒植物的方法。
本发明所提供的培育抗双生病毒植物的方法,是将植物中编码序列表中序列1所示蛋白的基因灭活,获得抗双生病毒植物。
其中,将植物中编码序列表中序列1所示蛋白地基因灭活可用本领域已知的各种方法,如用T-DNA插入灭活方法,定点突变、定点置换,同源重组等。所述基因的编码序列具体可是序列表中的序列2。所述双生病毒具体可为甜菜曲顶病毒。
实验证明,RKP(Related to KPC1)基因被灭活的拟南芥突变体,与野生型拟南芥相比,提高了对甜菜曲顶病毒的抗性。利用本发明的RKP基因培育抗双生病毒植物对农业生产具有重要的意义。
【附图说明】
图1为BSCTV的C4蛋白诱导拟南芥的不正常的细胞分裂
a为长时间的雌激素诱导条件下,诱导表达C4基因的拟南芥产生的愈伤组织;
b为组成型表达BSCTV的C4蛋白的拟南芥形成愈伤组织。
图2为C4蛋白和BSCTV的侵染诱导RKP基因的表达
a为RT-PCR分析RKP基因的表达;b为GUS活性的检测结果;c为BSCTV侵染后,拟南芥中RKP基因的表达。
图3为RKP基因缺失突变体的验证
a为PCR验证结果;
图中,P3+P4表示引物P3和P4的扩增结果,LB1+P4表示引物LB1和P4的扩增结果,p745+P3表示引物p745和P3的扩增结果,LBb1+P3表示引物LBb1和P3的扩增结果
b为RT-PCR验证结果。
P1+P1表示引物P1和P2的扩增结果
P3+P4表示引物P3和P4的扩增结果
图4为RKP基因突变体对BSCTV的敏感性
a为侵染后不同时间点出现病症植物的百分比;b为拟南芥(整体植物)中BSCTV核酸积累的相对水平;c为病症拟南芥莲座叶BSCTV核酸积累的相对水平;d为拟南芥原生质体中BSCTV核酸积累的相对水平。
【具体实施方式】
下述实施例中的实验方法,如无特殊说明,均为常规方法。
实施例1、RKP基因(At2g22010)在抗病毒侵染中的应用
一、RKP基因(At2g22010)突变体抗甜菜曲顶病毒的侵染
1)拟南芥中表达甜菜曲顶病毒(BSCTV)的C4蛋白影响植物的细胞分裂
通过PCR方法扩增全长264个碱基的C4基因(GeneID:1489875),然后C4基因克隆到pCAMBIA1300-221(CAMBIA,Canberra,Australia)上,构建重组表达载体pCAMBIA1300-221-C4。pCAMBIA1221-C4转化农杆菌EHA105,获得重组菌EHA105-C4,EHA105-C4转化拟南芥哥伦比亚生态型,获得组成型过表达C4基因的拟南芥。组成型过表达C4基因的拟南芥不能形成正常的植株,而是形成愈伤组织(图1b)。
通过PCR方法扩增全长264个碱基的C4基因(GeneID:1489875),然后C4基因克隆到C表达载体pER8中,构建重组表达载体pER8-C4。pER8-C4转化农杆菌EHA105,获得重组菌,然后用上述的方法转化哥伦比亚生态型拟南芥,获得诱导表达C4基因的拟南芥,诱导表达C4基因的拟南芥的种子在不受雌激素诱导时可以形成正常的植株;将萌发后的正常的植株转入含有2μM雌激素的培养基中,植株的生长将会受到抑制,叶子会发生卷曲,根的生长停止;转入含有2μM雌激素的培养基中40天之后,植株将会产生类似于组成型过表达C4基因的拟南芥形成的愈伤组织(图1a)。
2)RKP基因的表达可受BSCTV的C4蛋白和BSCTV侵染的诱导
提取用2μM雌激素处理了16小时的诱导表达C4基因的拟南芥和哥伦比亚生态型拟南芥的RNA,分别用ATH拟南芥全基因组芯片(Affymetrix公司)进行微阵列分析。
微阵列分析表明,与对照植物相比,很多基因的表达受到上调或者下调。其中,有一个基因的表达受到C4蛋白的明显诱导。该基因的基因号是At2g22010,与人类的一个细胞周期调控蛋白KPC1同源,命名为RKP基因。RT-PCR进一步检测At2g22010的表达水平,所用引物RT Fw和RT Rev的核苷酸序列如下:5’-TTCGTAGTTACACACTTCAAC-3’:5’-TCATGTGCTTCTTTTGTGACC-3’。以ACTIN1作为内参,检测结果如图2a所示,表明RKP基因的表达受到C4蛋白的明显诱导,图2中“+”代表2μM雌激素处理了16小时的诱导表达C4基因的拟南芥,“-”代表哥伦比亚生态型拟南芥。为了进一步确定C4蛋白对RKP基因表达的影响,PCR扩增RKP基因的启动子(ATG之前的2kb序列)克隆到pCAMBIA1300-221的PstI-XbaI位点间,启动GUS基因,形成PromoterRKP-GUS质粒。PromoterRKP-GUS质粒与pCAMBIA1300-221共转化哥伦比亚生态型拟南芥的原生质体,PromoterRKP-GUS质粒与pCAMBIA1300-221-C4共转化哥伦比亚生态型拟南芥的原生质体。16个小时之后,提取总蛋白,用GUS活性检测试剂盒(MGT-M0877;FLUOstar OPTIMA(BMG)检测GUS的活性。GUS活性检测结果如图2b所示,表明在原生质体中C4蛋白同样能够诱导RKP的表达。图2b中“CK”代表PromoterRKP-GUS质粒与pCAMBIA1300-221共转化哥伦比亚生态型拟南芥的原生质体,“C4”PromoterRKP-GUS质粒与pCAMBIA1300-221-C4共转化哥伦比亚生态型拟南芥的原生质体。
用农杆菌介导的BSCTV(Beet severe curly top virus)侵染哥伦比亚生态型拟南芥。农杆菌介导的病毒BSCTV拟南芥的方法如下:
BSCTV(ATCC PVMC-6),以前称为BCTV-CFH株。这个菌株将用EcoRI线性化的BSCTV的双链DNA保存在质粒pCFH上。为了将部分重复的BSCTV基因组DNA以头对尾的方式克隆到双元载体pCAMBIA1300(CAMBIA,Canberra,Australia),先用BamHI和EcoRI一起从pCFH上切下一个2.4kb(约为0.8个拷贝的基因组DNA)的片段,再将这个片段连接到由BamHI和EcoRI酶切的pCAMBIA1300载体中,构成中间质粒pCAMBIA1300-BSCTV0.8。再用EcoRI从pCFH上切下3.0kb的完整的BSCTV基因组DNA片段,进而将这个片段插入到经过EcoRI酶切的pCAMBIA1300-BSCTV0.8中,最终获得pCAMBIA1300-BSCTV。这个质粒上含有以头对尾的方式连在一起的1.8个拷贝的BSCTV基因组DNA。接着将pCAMBIA1300-BSCTV0.8转化进入农杆菌EHA105菌株,得到重组农杆菌EHA105-BSCTV。农杆菌EHA105-BSCTV悬浮在10mM MgCl2溶液中,使OD=0.02,放置3小时后,加入1%金刚砂,混匀后,用高压喷枪系统(Airbrush)以75psi的压力喷到刚要抽薹的拟南芥的叶片上。提取侵染不同天的拟南芥的RNA,以引物RT Fw和RT Rev进行RT-PCR分析RKP基因的表达。
RT-PCR分析结果如图2c所示,表明RKP的表达受BSCTV侵染的诱导。图2c中,“CK”代表野生型哥伦比亚生态型拟南芥,“BSCTV”代表BSCTV侵染的野生型哥伦比亚生态型拟南芥,图2c上方的数值为病毒BSCTV侵染后的天数。
3)用RKP基因培育抗双生病毒植物
哥伦比亚生态型的拟南芥突变体rkp-1(SAIL_3_E03),rkp-2(WiscDsLox466C1)和rkp-3(SALK_121005)从ABRC购买。rkp-1(SAIL_3_E03),rkp-2(WiscDsLox466C1)和rkp-3(SALK_121005)是通过T-DNA插入,敲除了野生型的哥伦比亚生态型的RKP基因(At2g22010)得到的。rkp-1(SAIL_3_E03)缺失RKP基因(At2g22010)自5’末端第2258-3843的核苷酸序列,rkp-2(WiscDsLox466C1)缺失RKP基因(At2g22010)自5’末端第3026-3843的核苷酸序列,rkp-3(SALK_121005)缺失RKP基因(At2g22010)自5’末端第3776-3843的核苷酸序列。拟南芥突变体rkp-1(SAIL_3_E03),rkp-2(WiscDsLox466C1)和rkp-3(SALK_121005)的基因组DNA的其他序列与野生型哥伦比亚生态型拟南芥(WT)相同。
为了进一步确证拟南芥突变体rkp-1(SAIL_3_E03),rkp-2(WiscDsLox466C1)和rkp-3(SALK_121005)为纯合缺失突变体,用T-DNA左边界引物LB1、p745、LBb1、RKP特异引物P3和P4进行PCR验证。同时以野生型哥伦比亚生态型拟南芥(WT)为对照。引物序列如下:
T-DNA左边界引物LB1:5’-GCCTTTTCAGAAATGGATAAATAGCCTTGCTTCC-3’;
p745:5’-AACGTCCGCAATGTGTTATTAAGTTGTC-3’;
LBb1:5’-GCGTGGACCGCTTGCTGCAACT-3’;
RKP特异引物P3:5’-CAAGTAATCAGTCTGACCCTG-3’;
P4:5’-TCATGTGCTTCTTTTGTGACC-3’。
根据TAIR网站预测,野生型中,P3与P4应该扩增出约2500个核苷酸长度的片段。在rkp-1中,LB1与P4应该扩增出约2600bp核苷酸长度的片段。在rkp-2中,p745与P3应该扩增出约1400bp核苷酸长度的片段。在rkp-3中,LBb1与P3应该扩增出约2500bp核苷酸长度的片段。其它的引物组合应该没有扩增产物。PCR的结果如图3a所示,与预测相符,证明所用的突变体都是对应的RKP基因插入缺失突变体。
同时,提取野生型哥伦比亚生态型拟南芥(WT)、拟南芥突变体rkp-1(SAIL_3_E03)、rkp-2(WiscDsLox466C1)和rkp-3(SALK_121005)的RNA进行RT-PCR,所用的引物为P1(5’-TGGCGCTGGCTTGTCATTTG-3’)和P2(5’-GACAAGAACCGAATTGCGTG-3’)以及P3、P4。同时以ACT1基因作为内参。
RT-PCR结果如图3b所示,P1与P2引物位置在这些T-DNA的插入点之前,无论野生型还是rkp突变体,P1与P2都可以扩增出对应的片段(403bp),证明RKP基因在T-DNA插入点之前的部分是可以转录的。P3与P4引物跨过这些T-DNA的插入点,可以看到,野生型中可以扩增出相应片段(1711bp),而3个突变体中,P3与P4引物组合不能扩增出相应片段。该结果进一步确证结果表明这三个突变体都是RKP基因缺失,不能表达出全长的RKP产物。
按照上述2)的方法,用农杆菌介导的病毒BSCTV来侵染野生型的哥伦比亚生态型拟南芥和拟南芥突变体rkp-1(SAIL_3_E03),rkp-2(WiscDsLox466C1)和rkp-3(SALK_121005)。统计不同的天数出现病症的植物的数目,计算病症植物的百分比。实验重复4次,每次每个处理统计35株植株。统计结果如图4a所示,表明与野生型植物相比,突变体植物出现症状的时间延后了,而且最后的感染率降低了。图4a中的纵坐标表示侵染后不同时间点出现病症的植物数量与总植物数量的百分比,横坐标为病毒BSCTV侵染后的天数。
同时,提取侵染后不同时间点的拟南芥整株植物的DNA(不只植物基因组DNA,还包括积累的病毒DNA),用BSCTV核酸(全长)作探针进行Southern Blot。SouthernBlot结果如图4b所示,表明在拟南芥突变体中病毒DNA的积累减少了。图4b中,“OC”代表开环双链DNA,“LIN”直线形双链DNA,“SC”超螺旋双链DNA,“SS”单链DNA,图4b下方的数值表示BSCTV病毒DNA积累的相对值(相对于野生型第15天的值)。图4b上方的数值为病毒BSCTV侵染后的天数。
同时,在不同时间点提取出现病症的拟南芥的莲座叶的DNA,用BSCTV核酸作探针进行Southern Blot。Southern Blot结果如图4c所示,表明在拟南芥突变体莲座叶中BSCTV病毒DNA的积累减少了。图4c中,“OC”代表开环双链DNA,“LIN”直线形双链DNA,“SC”超螺旋双链DNA,“SS”单链DNA,图4c下方的数值表示BSCTV病毒DNA积累的相对值(相对于野生型第16天的值)。图4c上方的数值为病毒BSCTV侵染后的天数。
BSCTV核酸转染哥伦比亚生态型拟南芥和拟南芥突变体rkp-1(SAIL_3_E03),提取不同转染时间的原生质体的基因组DNA进行Southern Blot。Southern Blot结果如图4d所示,拟南芥突变体rkp-1(SAIL_3_E03)原生质体中,病毒核酸的积累比野生型的哥伦比亚生态型拟南芥原生质体少。图4d中,“OC”代表开环双链DNA,“LIN”直线形双链DNA,“SC”超螺旋双链DNA,“SS”单链DNA,图4d下方的数值表示BSCTV病毒DNA积累的相对值(相对野生型第4天的值)。图4d上方的数值为病毒BSCTV侵染后的天数。
上述实验结果说明,RKP基因的突变使拟南芥抗BSCTV的能力增强。
【序列表】
<110>中国科学院遗传与发育生物学研究所
<120>一种锌指蛋白基因的新用途
<130>CGGNARW81796
<160>2
<210>1
<211>1280
<212>PRT
<213>拟南芥属拟南芥(Arabidopsis thaliana)
Met Ala Glu Asp Ser Leu Arg Val Gly Met Ile Ser Ser Gly Leu Ala
1 5 10 15
Val Leu Leu Asn Gly Glu Asp Ala Lys Glu Asn Ser Ser Lys Ala Arg
20 25 30
Ile Val Pro His Phe Asp Tyr Ser Gly His Arg Pro Leu Glu Arg Thr
35 40 45
Ile Glu Phe Ile Phe Gly Leu Ala Glu Lys Ser Val Gly Pro Leu Asp
50 55 60
Gly Gln Val Asp Ser Ser Leu Ile Arg Ala Val Ile Lys Asn Gln Phe
65 70 75 80
Ser Lys Leu His Gly Asp Leu Asp Val Ser Val Ser Gln Arg Glu Gly
85 90 95
Ile Ser Val Val His His Gly Val Gly Pro Pro Ile Val Gly Leu Glu
100 105 110
Glu Phe Ser Ile Cys Gly Asp Ile Arg Ile Val Lys Pro Pro Leu Val
115 120 125
Leu Glu Ser Leu Ala Leu Phe Ser Ser Ala Arg Ala Asn Ala Cys Ile
130 135 140
Trp Lys Gly Lys Trp Met Tyr Glu Val Ala Leu Glu Thr Ser Gly Ile
145 150 155 160
Gln Gln Leu Gly Trp Ala Thr Leu Ala Cys Pro Phe Thr Asp Gln Lys
165 170 175
Gly Val Gly Asp Ala Asp Asp Ser Tyr Ala Phe Asp Gly Arg Arg Val
180 185 190
Ser Lys Trp Asn Lys Glu Ala Glu Pro Tyr Gly Gln Ser Trp Val Ala
195 200 205
Gly Asp Val Ile Gly Cys Cys Ile Asp Leu Asn Cys Asp Glu Ile Tyr
210 215 220
Phe Tyr Arg Asn Gly Val Ser Leu Gly Ala Ala Phe Thr Gly Ile Arg
225 230 235 240
Lys Leu Gly Pro Gly Phe Gly Tyr Tyr Pro Ala Ile Ser Leu Ser Gln
245 250 255
Gly Glu Arg Cys Glu Leu Asn Phe Gly Ala Tyr Pro Phe Lys Tyr Pro
260 265 270
Val Asp Gly Phe Gln Pro Leu Gln Glu Ala Pro Thr Arg Phe Ser Phe
275 280 285
Ala Thr Glu Leu Leu Arg Cys Phe Ser Arg Leu Leu Asp Arg Pro Asp
290 295 300
Arg Ser Leu Ala Asp Thr Leu Ser Arg Leu Arg Arg Phe Ala Ser Val
305 310 315 320
Glu Glu Leu Phe Cys Pro Val Ser Ser Ala Ile Cys Asp Glu Phe Phe
325 330 335
Tyr Ile Leu Glu Gln Asp Pro Leu Leu Ala Glu Tyr Leu Gly Arg Gly
340 345 350
Ala Phe Leu Ser Phe Leu Leu Glu Thr Phe Arg Thr Gln Ala Pro His
355 360 365
Asp Ser Ser Ser Leu Asp Lys Val Leu Asp Val Phe Leu Glu Phe Pro
370 375 380
Gln Ser His Leu Ile Phe Glu His Val Val Asn Ala Leu Ala Cys Gly
385 390 395 400
Cys Lys Thr Ala Thr Leu Ile Leu Thr Glu Cys Pro Tyr Ser Gly Pro
405 410 415
Tyr Pro Tyr Leu Ala Leu Ala Cys His Leu Phe Lys Arg Glu Glu Leu
420 425 430
Met Val Gln Trp Trp Arg Ser Leu His Phe Glu Phe Leu Phe Glu Gly
435 440 445
Phe Leu Ser Cys Arg Ser Ser Asn Lys His Asp Leu Gln His Leu Met
450 455 460
Pro Val Val Trp Trp Pro Gly Ser Ser Glu Asp Ile Ser Tyr Glu Ser
465 470 475 480
Ser Met Gly Phe Thr Ile Ser Ala Leu Ser Glu Ala Ile Asn Lys Ile
485 490 495
Glu Glu Lys Gln Arg Asn Leu Cys Leu Leu Val Ile Gln Phe Ile Pro
500 505 510
Pro Val Ser Pro Pro Gln Leu Pro Gly Ser Ala Phe Arg Gly Phe Leu
515 520 525
Gln Asn Leu Leu Leu Lys Asn Arg Gly Ala Asp Arg Thr Leu Ala Pro
530 535 540
Ser Gly Val Thr Arg Asn Ser Val Leu Val Ser Leu Phe Ser Val Ile
545 550 555 560
Leu His Phe Leu Ser Glu Gly Phe Ala Met Leu Lys Ser Ser Glu Ala
565 570 575
Val His His Asn Val Gly Phe Leu His Arg Gly Gly Gln Gln Lys Phe
580 585 590
Pro Leu Ser Leu Phe Leu Lys Asn Asp Pro His Arg Ala Asp Ile Thr
595 600 605
Arg Leu Gly Gly Leu Phe Ser His Ile Ser Lys Ser Tyr Pro Thr Asp
610 615 620
Asp Gln Glu Glu Glu Ile Met Arg Trp Glu Glu Gly Cys Met Asp Asp
625 630 635 640
Glu Gln Asn Arg Val Thr His Ala Thr Glu Gln Lys Pro Cys Cys Cys
645 650 655
Leu Ala Tyr Asp Thr Asp Leu Thr Lys Ser Leu Lys Asp Arg Gly Lys
660 665 670
Asn Thr Ala Gln Ser Ser Arg Gly Arg Cys Ser Ser Ile Pro Glu Arg
675 680 685
Ser Ser His Val Ala Ala Glu Cys Ser Ala Gly Ser Phe Ser Glu Glu
690 695 700
Ile Asp Asp Lys Pro Ser Thr Ser Asn Gln Ser Asp Pro Asp Phe Gly
705 710 715 720
Tyr Arg Pro Val Arg Phe Met Arg Thr Ala Leu Gln Glu Ser Arg Ile
725 730 735
Ser Ser Ala Ile Leu Ser Glu Glu Glu Leu Leu Asp Ala Leu Leu Leu
740 745 750
Leu Tyr His Ile Ala Val Ala Pro Asn Phe Lys Gln Ala Ser Tyr Tyr
755 760 765
Met Ser His Gln Ser Gln SerIle Ser Leu Leu Glu Glu Thr Asp Lys
770 775 780
Gln Ile Arg Glu Arg Ala Ser Cys Asp Gln Ile Lys Arg Leu Lys Glu
785 790 795 800
Ala Arg Asn Asn Tyr Lys Glu Asp Val Met Asp Cys Val Arg His Ser
805 810 815
Ala Trp Phe Arg Ile Ser Leu Phe Ser Arg Trp Lys Gln Arg Gly Met
820 825 830
Tyr Ala Leu Cys Met Trp Val Val Gln Leu Leu Leu Val Leu Ser Lys
835 840 845
Met Asp Ser Val Phe Val Tyr Ile Pro Glu Phe Tyr Leu Glu Ser Leu
850 855 860
Val Asp Cys Phe His Val Leu Arg Lys Ser Asp Pro Pro Phe Val Pro
865 870 875 880
Ser Thr Thr Phe Ile Lys Gln Gly Leu Ser Ser Phe Ile Thr Phe Val
885 890 895
Val Thr His Phe Asn Asp Ser ArgIle Ser Asn Thr Asp Leu Lys Asp
900 905 910
Leu Leu Leu Gln SerIle Ser Val Leu Val Gln Tyr Lys Glu Tyr Leu
915 920 925
Glu Ala Phe Glu Asn Asn Glu Ala Ala Thr Arg His Met Pro Ala Ala
930 935 940
Leu Leu Ala Ala Phe Asp Asn Arg Ser Trp Ile Pro Val Thr Asn Ile
945 950 955 960
Phe Leu Arg Leu Cys Lys Gly Ser Gly Phe Ser Ser Leu Lys Asn Gly
965 970 975
Glu Ser Ser Phe Ser Ser Thr Val Phe Gln Ala Leu Leu Arg Asp Ala
980 985 990
CysIle Asn Asp Gly Glu Leu Leu Ser Thr Phe Leu Asn Arg Leu Phe
995 1000 1005
Asn Thr Leu Ser Trp Thr Ile Thr Glu Phe Ser Val Ser Val Arg
1010 1015 1020
Glu Met Gln Glu Lys Tyr Gln Val Met Glu Phe Gln Gln Arg Lys
1025 1030 1035
Cys Cys Val Ile Phe Glu Leu Ser Ser Asn Leu Ala Arg Val Leu
1040 1045 1050
Glu Phe Cys Thr Tyr Ala Met Pro Gln Ala Phe Leu Ala Gly Thr
1055 1060 1065
Asp Thr Asn Leu Arg Arg Leu Thr Glu Leu Ile Leu Phe Ile Leu
1070 1075 1080
Asn His Met Thr Ser Ala Val Asp Asp Glu Phe Phe Asp Leu Ser
1085 1090 1095
Leu Arg Arg Gln Gly Gln Pro Ser Glu Lys Val Ser Arg Gly Ile
1100 1105 1110
Leu Leu Ala Pro Leu Val Gly Ile Ile Leu Asn Leu Leu Glu Ala
1115 1120 1125
Ser Glu Asp Ser Lys Pro Lys Gln Gln His Asp Val Ile Gly Leu
1130 1135 1140
Phe Ala Ser Met Asp Cys Pro Asp Thr Val Tyr Tyr Gly Phe Gln
1145 1150 1155
Tyr Leu Leu Glu Tyr Asn Trp Asp Gly Cys Val Ser Gly Asp Asp
1160 1165 1170
Ala Tyr Val Lys Lys Leu Gly Gln Leu Glu Asn Phe Leu Ser His
1175 1180 1185
Leu Ile Asn Arg Ala Ser Ser Gln Glu Pro Glu Arg Lys Glu Glu
1190 1195 1200
Ser Phe Asn Lys Asp Thr Thr Asp Ile Glu Asp Asn Thr Cys Cys
1205 1210 1215
Ile Cys Tyr Ala Gly Glu Ala Asn Ala Met Ile Ala Pro Cys Ser
1220 1225 1230
His Arg Ser Cys Tyr Gly Cys Ile Thr Arg His Leu Leu Asn Cys
1235 1240 1245
Gln Arg Cys Phe Phe Cys Asn Ala Thr Val Ile Asp Val Ile Arg
1250 1255 1260
Asp Lys Glu Glu Glu Glu Glu Glu Asp Asp Asp Gly His Lys Arg
1265 1270 1275
Ser Thr
1280
<210>2
<211>3843
<212>DNA
<213>拟南芥属拟南芥(Arabidopsis thaliana)
<400>3
atggctgaag acagcctacg ggttggtatg atttcatctg gtttggctgt tttactgaat 60
ggtgaagatg ctaaagaaaa ttcctcgaaa gctcgtattg ttccacattt tgattattct 120
ggtcaccggc ctttagaacg gactatcgaa ttcatatttg gtttagcaga aaagtcggtt 180
ggtccattgg atggtcaagt agacagtagc ttgattagag ctgtgattaa gaatcagttc 240
tcgaagcttc atggtgattt ggatgtttca gttagtcaga gagaaggaat cagtgtagtt 300
catcatggtg ttggacctcc tattgttggc cttgaagagt ttagcatatg tggtgatatc 360
aggattgtga agccacctct tgtattggag agcttagcac ttttcagtag cgccagggct 420
aatgcttgta tttggaaagg aaaatggatg tatgaagtcg ctttagagac ctcgggaatt 480
caacaacttg gatgggcaac acttgcttgc cctttcactg accagaaagg tgtgggtgat 540
gctgatgatt catatgcttt tgatggtcga agggtaagca aatggaacaa ggaagctgaa 600
ccttatggtc aatcatgggt tgctggggat gtcatcggtt gctgcataga tttgaactgt 660
gatgagattt acttctacag gaatggtgtc tccctcgggg ctgcatttac tggtattaga 720
aaacttggac ctggatttgg gtattaccct gctatatctc tctcccaagg tgagagatgc 780
gagttaaatt tcggcgctta cccgtttaag taccctgttg acggtttcca acctcttcaa 840
gaagctccaa ctcgattttc atttgcaaca gagctactac gatgcttctc aagactgctg 900
gataggccag accgctcatt ggctgataca ttaagtcgac tgaggagatt tgcctcagtc 960
gaagaactct tttgccctgt ttcgtctgcc atatgtgatg agttctttta tatacttgag 1020
caagaccctt tgttggcgga gtacttagga cggggtgcat ttctgtcatt cctcttggag 1080
actttcagaa ctcaagcacc gcatgattcg tcaagtttag acaaagttct tgatgtgttt 1140
cttgagttcc cacaatctca tttgatcttt gagcatgtag taaacgctct ggcttgtggc 1200
tgcaaaacag cgacactgat tttaaccgag tgtccatact ccggacctta tccctatctg 1260
gcgctggctt gtcatttgtt taaacgggaa gaattgatgg tacaatggtg gagatctttg 1320
catttcgagt ttttgtttga aggtttcttg tcatgcagga gttccaacaa gcatgactta 1380
cagcacttaa tgcctgttgt ttggtggcct ggatcctctg aagatatatc ctacgagagt 1440
agcatgggat ttacgatctc cgctctctct gaagccatta acaagattga ggagaagcag 1500
aggaacctct gtctcttggt catacaattc ataccacctg tatcacctcc ccagcttcct 1560
ggttcagctt tcaggggatt cctacagaac cttttattga agaacagagg cgcagatagg 1620
actctggccc cttctggagt tacacgcaat tcggttcttg tctctttgtt ctcagttata 1680
ctccacttct tgtcagaagg ttttgcaatg ctgaagagta gtgaagccgt ccatcacaat 1740
gttggttttc ttcacagagg tggtcagcag aagtttccat tgagtttgtt tcttaaaaat 1800
gatccacatc gcgctgatat tactaggctt ggcgggctat ttagtcatat atcgaagtcc 1860
taccccacag atgatcaaga agaagaaata atgcggtggg aagaaggttg tatggatgat 1920
gaacagaata gagtaactca cgcgactgag caaaagccat gctgttgctt agcttatgat 1980
accgatctta ctaaatcctt gaaggatcga ggaaaaaata ctgctcaaag ttctcgtggt 2040
cgatgcagtt ccattcctga gagatcctct catgttgctg cagaatgtag tgctggaagt 2100
ttcagtgaag aaatagacga caaacctagc acaagtaatc agtctgaccc tgactttggt 2160
tatcgtccag taagatttat gcggactgca cttcaagaga gtagaatctc atctgctata 2220
ctaagcgaag aagaactatt ggatgctcta ttgctattat accatattgc tgttgctcca 2280
aattttaagc aggcatcata ttacatgtct caccaatcgc aatcaatatc acttcttgaa 2340
gaaactgata aacagataag agaacgggct tcttgtgacc aaataaagcg cttgaaggaa 2400
gctcgcaaca actacaaaga agacgtgatg gactgtgtta gacattccgc atggttccgc 2460
atctcattgt tctctcgatg gaagcaaagg ggaatgtatg cattgtgcat gtgggttgta 2520
cagctacttc tggttctcag caaaatggat tctgtgtttg tttatattcc agagttctac 2580
cttgaatctt tggtagactg tttccatgtg cttcgcaaga gcgatcctcc gtttgtccca 2640
tcaacaacat tcatcaaaca aggactttca tcatttatca ctttcgtagt tacacacttc 2700
aacgattcaa ggatatcgaa tacagatctt aaagatctac ttctccagtc aatatccgtc 2760
ctggtacagt acaaagagta cttggaagct ttcgagaaca atgaggcagc tactcgacac 2820
atgcctgcag cactactggc agcgtttgac aacagatctt ggatccctgt cacaaatata 2880
tttcttcgtc tttgcaaagg ttctgggttt agttctttaa agaacggaga gtcttcgttt 2940
tcgtctactg ttttccaggc gcttctacga gatgcttgta tcaatgatgg tgaattactt 3000
tctacttttc ttaaccgtct attcaacaca ctgagctgga ccatcactga attttctgtc 3060
tcggtgcgag aaatgcaaga aaagtatcag gtaatggagt ttcagcaaag gaaatgttgt 3120
gtgatatttg agctttcaag caatctcgca agggtcttag aattctgcac ttacgcaatg 3180
ccacaagcat ttcttgctgg gactgacacg aatcttcgta ggctcactga gttgattctt 3240
ttcatcttga atcacatgac ctcagcagta gatgacgagt tctttgatct gtcacttaga 3300
cggcagggac aaccttcaga gaaagttagc cgagggatct tattagctcc tttggttggt 3360
ataatcttga atctcttgga ggctagtgaa gactcaaaac caaagcaaca acatgatgta 3420
attggtcttt tcgcaagcat ggactgtccc gatacagtct attacgggtt tcagtatctc 3480
ttggaatata attgggacgg ttgtgtaagc ggggatgatg cctatgtaaa gaaacttgga 3540
cagcttgaga acttcttgag ccatctcata aaccgggctt catcgcaaga acccgaaaga 3600
aaagaagagt cattcaacaa agacacgaca gatatagaag acaacacttg ctgtatctgc 3660
tacgcggggg aggctaatgc aatgattgct ccgtgttcac atcgatcatg ttatggctgc 3720
ataactagac atcttctcaa ctgtcagaga tgttttttct gcaatgctac ggtgatagat 3780
gttataagag ataaagaaga agaagaagaa gaagacgatg atggtcacaa aagaagcaca 3840
tga 3843